KR20220018410A - Self-transcribing RNA/DNA system that provides Genome editing in the cytoplasm - Google Patents

Self-transcribing RNA/DNA system that provides Genome editing in the cytoplasm Download PDF

Info

Publication number
KR20220018410A
KR20220018410A KR1020210077561A KR20210077561A KR20220018410A KR 20220018410 A KR20220018410 A KR 20220018410A KR 1020210077561 A KR1020210077561 A KR 1020210077561A KR 20210077561 A KR20210077561 A KR 20210077561A KR 20220018410 A KR20220018410 A KR 20220018410A
Authority
KR
South Korea
Prior art keywords
rna
ddrp
dna
expression cassette
sequence
Prior art date
Application number
KR1020210077561A
Other languages
Korean (ko)
Inventor
김성천
Original Assignee
김성천
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 김성천 filed Critical 김성천
Publication of KR20220018410A publication Critical patent/KR20220018410A/en

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1247DNA-directed RNA polymerase (2.7.7.6)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/0008Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K9/00Medicinal preparations characterised by special physical form
    • A61K9/10Dispersions; Emulsions
    • A61K9/127Liposomes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/127RNA-directed RNA polymerase (2.7.7.48), i.e. RNA replicase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/07Nucleotidyltransferases (2.7.7)
    • C12Y207/07006DNA-directed RNA polymerase (2.7.7.6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/008Vector systems having a special element relevant for transcription cell type or tissue specific enhancer/promoter combination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/50Vector systems having a special element relevant for transcription regulating RNA stability, not being an intron, e.g. poly A signal
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2840/00Vectors comprising a special translation-regulating system
    • C12N2840/007Vectors comprising a special translation-regulating system cell or tissue specific

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Microbiology (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Epidemiology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Dispersion Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

The present invention provides a genome editing RNA/DNA system which comprises a DdRp RNA expression cassette and a genome editing tool DNA (DNAge) expression cassette that can be transcribed by DdRp, and has a genome editing tool capable of self-transcription with the genome editing RNA/DNA system constructed by operatively connecting the same, and a composition thereof.

Description

세포질에서 자가전사가 가능하고 유전체 편집을 제공하는 RNA/DNA 시스템{Self-transcribing RNA/DNA system that provides Genome editing in the cytoplasm}A RNA/DNA system capable of self-transcription in the cytoplasm and providing genome editing

본 발명은 세포 내 적어도 하나의 내인성 유전체 편집을 하고 자가전사가 가능한 구성성분이 있는 시스템으로서, 상기 시스템은 세포내 번역을 가능하게 하는 구조가 있는 DNA dependent RNA Polymerase(DdRp) mRNA를 포함하는 DdRp RNA 발현 카세트; 및 상기 DdRp에 의해 증폭되는 유전체 편집 도구를 코딩하는 DNAge 발현 카세트;를 포함하는 자가전사 RNA/DNA 시스템 또는 상기 자가전사 RNA/DNA 시스템에 추가적으로 상기 DdRp를 코딩하는 DNA를 포함하는 auto_DdRp 발현 카세트를 포함하는 자가전사 RNA/DNA 시스템으로 세포질에서 DdRp의 발현을 증가시켜 유전체 편집 도구를 장기간 지속적으로 발현시키는 것을 특징으로 하는 자가전사 RNA/DNA 시스템에 관한 기술이다.The present invention provides a system having at least one endogenous genome editing and self-transcriptional component in a cell, wherein the system comprises a DdRp RNA comprising DNA dependent RNA Polymerase (DdRp) mRNA having a structure that enables intracellular translation. expression cassette; and a DNAge expression cassette encoding a genome editing tool amplified by the DdRp; an auto_DdRp expression cassette containing a DNA encoding the DdRp in addition to the self-transcribed RNA/DNA system or the self-transcribed RNA/DNA system comprising a It is a self-transcription RNA/DNA system that increases the expression of DdRp in the cytoplasm to continuously express a genome editing tool for a long period of time.

유전체 편집은 살아있는 세포 또는 유기체의 특정 유전자좌에 표적화된 유전체 서열 변화를 도입함으로써 유전자 기능을 연구하고 질환을 퇴치하기 위한 강력한 수단 및 전례 없는 기회를 제공하였다. 아연 핑거 뉴클레아제(ZFN), 전사 활성화제-유사 이펙터 뉴클레아제(TALEN) 및 클러스터링된 일정 간격 분포의 짧은 팔린드롬 반복물(Clustered Regularly Interspaced Short Palindromic Repeats; CRISPR)-연합된(Cas) 뉴클레아제가 많은 실험실에 의해 효과적으로 사용되고 있다. Genome editing has provided a powerful means and unprecedented opportunity to study gene function and combat disease by introducing targeted genomic sequence changes at specific loci in living cells or organisms. Zinc finger nucleases (ZFNs), transcriptional activator-like effector nucleases (TALENs) and Clustered Regularly Interspaced Short Palindromic Repeats (CRISPR)-associated (Cas) nucleases. Clase is being used effectively by many laboratories.

유형 II Cas9 또는 유형 V Cas12a (Cpf1)와 같은 단일 성분 클래스 2 CRISPR 시스템 그리고 다중 단백질형 Cas3와 같은 다중 성분 클래스 1 CRISPR과 같은 RNA-가이드된(guided) 엔도뉴클레아제가 조작이 상대적으로 쉬워 보다 많은 관심을 끌고 있다. CRISPR은 타겟화된 유전자 절단 및 타겟화된 유전자 삽입을 위한 간단한 방법을 제공한다. Single-component class 2 CRISPR systems, such as type II Cas9 or type V Cas12a (Cpf1), and RNA-guided endonucleases, such as multicomponent class 1 CRISPR, such as multiprotein Cas3, are relatively easy to manipulate, resulting in more attracting attention CRISPR provides a simple method for targeted gene cleavage and targeted gene insertion.

유전자를 교정하는 주 인자는 뉴클레아제도메인을 함유하고 있는 Cas9 단백질과 타겟 RNA에 대한 서열 특이성을 제공하는 가이드 RNA (sgRNA)이다. sgRNA은 5'말단의 처음 뉴클레오티드 서열 20개는 타겟 서열과 상보적이며, CRISPR/Cas9 시스템에 특이성을 제공한다. sgRNA의 3' 영역은 Cas9 활성에 필수적인 2차 구조를 형성한다. sgRNA가 Cas9 뉴클레아제를 특정 타겟에 가져다 놓으면, Cas9이 PAM(protospacer-adjacent motif) 사이트에서 타겟 DNA의 이중 가닥을 절단한다. 이 절단된 이중 가닥의 비-상동적인 말단-연결 복구가 종종 타겟 유전자를 교란하는 결손 또는 소규모의 삽입 (indel)을 야기하게 된다.The main factors for gene editing are the Cas9 protein containing the nuclease domain and the guide RNA (sgRNA) that provides sequence specificity for the target RNA. The first 20 nucleotide sequences at the 5' end of sgRNA are complementary to the target sequence, providing specificity to the CRISPR/Cas9 system. The 3' region of the sgRNA forms the secondary structure essential for Cas9 activity. When sgRNA brings Cas9 nuclease to a specific target, Cas9 cleaves the double-stranded DNA of the target at a protospacer-adjacent motif (PAM) site. Non-homologous end-joint repair of this truncated double strand often results in deletions or small indels that perturb the target gene.

CRISPR-Cas9의 적용은 가이드-타겟 불일치에 대한 높은 내성, 비교적 분해하기 쉬운 RNA-지시된 2 차 구조 및 프로토 스페이서 인접 모티프(protospacer adjacent motif; PAM)의 요구로 인해 크게 제한되고 있다. The application of CRISPR-Cas9 is largely limited due to the high resistance to guide-target mismatch, the relatively easy to degrade RNA-directed secondary structure, and the requirement of a protospacer adjacent motif (PAM).

상기 Cas9 및 Cpf1과 유사하게, 알고너트는 외인성 핵산에 대한 유전자 발현 억압 및 호스트 방어에서 중요한 역할을 한다. Cas9 및 Cpf1는 단지 원핵생물에서만 천연적으로 발견되는 반면, 알고너트 슈퍼패밀리의 구성원들은 많은 종들(세균부터 포유동물까지)에 존재한다. 대부분의 알고너트는 단일가닥 RNA와 연합하고 RNA 침묵에서 중추적 역할을 하지만, 일부 알고너트는 ssDNA에 결합하고 표적 DNA를 절단한다. Similar to the above Cas9 and Cpf1, algonuts play an important role in host defense and gene expression repression against exogenous nucleic acids. Cas9 and Cpf1 are found naturally only in prokaryotes, whereas members of the algonut superfamily exist in many species (from bacteria to mammals). Although most algonautes associate with single-stranded RNA and play a pivotal role in RNA silencing, some algonuts bind to ssDNA and cleave target DNA.

최근에, 인간 세포에서 가이드 DNA 올리고와 함께 나트로노박테리움 그레고리 알고너트(Natronobacterium gregoryi Argonaute: NgAgo)를 사용함으로써 유전체 편집을 하였다. 알고너트(Argonaute)는 표적물을 절단하기 위한 가이드로서 5' 인산화된 짧은 단일-가닥 핵산을 사용하는 엔도뉴클레아제이다. DNA-가이드된 알고너트 결합은 서열 또는 이차 구조에 대해 특별한 요건을 갖지 않는 것으로 보인다. 알고너트 단백질이 핵산-유도된 뉴클레아제활성을 함유하고 있어, 강력한 유전체 편집 능력을 나타내는 특성화된 유전체 편집 시스템을 현재 개발하고 있는 실정이다.Recently, genome editing was performed in human cells by using Natronobacterium gregoryi Argonaute (NgAgo) together with guide DNA oligos. Argonaute is an endonuclease that uses a 5' phosphorylated short single-stranded nucleic acid as a guide to cleave a target. DNA-guided algonut binding does not appear to have special requirements for sequence or secondary structure. Since the algonut protein contains nucleic acid-induced nuclease activity, a specialized genome editing system that exhibits strong genome editing ability is currently being developed.

최근에 주형 RNA를 기존의 가이드 RNA의 3'말단에 연결해서 프라임 에디팅 가이드 RNA (prime editing guide RNA; pegRNA) 및 역전사효소를 단일 가닥만 절단할 수 있는 카스9 단백질(Cas9 nickase)에 연결한 융합단백질을 제조하여 Prime editing(프라임 에디팅) 교정기술을 완성하였다.Recently, a fusion linking a template RNA to the 3' end of an existing guide RNA and linking a prime editing guide RNA (pegRNA) and a reverse transcriptase to Cas9 nickase, which can cut only a single strand The protein was manufactured and the Prime editing correction technology was completed.

기존 유전체 편집 방법은 CRISPR plasmid 방법, Cas 단백질과 sgRNA를 코딩하는 mRNA 방법, 그리고 Cas 단백질과 sgRNA로 이루어진 ribonucleoprotein(RNP) 복합체 방법이 있다. Cas 단백질과 sgRNA를 코딩하는 DNA 절편을 포함하는 CRISPR/Cas9 plasmid 유전체 편집 방법에서 유전체 편집 도구를 코딩하는 CRISPR/Cas9 plasmid는 핵 의존성으로 핵에 있는 도구를 사용하여 전사를 하여 CRISPR/Cas9 plasmid는 핵까지 이동해야 한다. 그런데, 세포막을 통해 도입된 CRISPR/Cas9 plasmid의 1% 미만이 핵으로 이동하는 단점이 있어, 본 발명의 유전체 편집 RNA/DNA 시스템은 세포질에서 전사 도구를 구성하여 사용함으로써 이런 문제를 극복하고자한다.Existing genome editing methods include CRISPR plasmid method, mRNA method encoding Cas protein and sgRNA, and ribonucleoprotein (RNP) complex method consisting of Cas protein and sgRNA. CRISPR/Cas9 plasmid containing DNA fragment encoding Cas protein and sgRNA In the genome editing method, the CRISPR/Cas9 plasmid encoding the genome editing tool is nuclear-dependent and transcribed using a tool located in the nucleus. must move to However, since less than 1% of the CRISPR/Cas9 plasmid introduced through the cell membrane migrates to the nucleus, the genome editing RNA/DNA system of the present invention intends to overcome this problem by constructing and using a transcription tool in the cytoplasm.

본 발명의 유전체 편집 RNA/DNA 시스템을 구성하는 DdRp RNA 발현 카세트는 세포질에 있는 RNA에서 단백질 합성에 필요한 도구를 통해 DdRp를 합성한다. 합성된 DdRp가 본 발명의 DNAge 발현 카세트에 있는 프로모터에 결합하여 세포질에서 유전체 편집에 필요한 도구를 전사 및 합성한다. 핵 비의존성으로 합성된 유전체 편집 도구는 유전체 편집이 가능한 복합체를 형성하고 핵으로 이동하여 효율적으로 유전체 편집이 진행할 수 있다. 따라서, 본 발명의 유전체 편집 RNA/DNA 시스템에 의해 도입 대상세포 또는 대상 유기체에서 유전체 편집이 가능해진다.The DdRp RNA expression cassette constituting the genome editing RNA/DNA system of the present invention synthesizes DdRp through a tool necessary for protein synthesis from RNA in the cytoplasm. The synthesized DdRp binds to the promoter in the DNAge expression cassette of the present invention to transcribe and synthesize tools necessary for genome editing in the cytoplasm. The nuclear-independent synthesized genome editing tool forms a complex capable of genome editing and moves to the nucleus, enabling efficient genome editing. Accordingly, genome editing in a target cell or target organism is made possible by the genome editing RNA/DNA system of the present invention.

본 발명은 유전체 DNA를 정확하고 효율적으로 편집하기 위해 유전체 편집의 새로운 도구를 개발하기 위해서, DNA-dependent RNA polymerase(DdRp)을 발현시키기 위한 RNA 발현 카세트; 및 DdRp에 의해 전사될 수 있는 유전체 편집 도구를 코딩하는 DNAge 발현 카세트;를 포함하는 세포질내 자가전사가 가능한 유전체 편집 시스템에 적합한 신규의 기술을 제공하는 것이다.The present invention provides an RNA expression cassette for expressing DNA-dependent RNA polymerase (DdRp) in order to develop a new tool for genome editing in order to edit genomic DNA accurately and efficiently; and a DNAge expression cassette encoding a genome editing tool capable of being transcribed by DdRp; to provide a novel technology suitable for a genome editing system capable of intracytoplasmic self-transcription, including.

본 발명에 의해 해결하고자 하는 목적은 강력한 표적화 유전체 편집 능력을 나타내는 특성화된 유전체 편집 시스템을 제공하여, 살아있는 세포 또는 유기체의 특정 유전자좌에 표적화된 유전체 서열 변화를 도입함으로써 유전자 기능을 연구하고 질환을 퇴치하기 위한 강력한 수단을 구현하고자한다. An object to be solved by the present invention is to provide a characterized genome editing system that exhibits a strong targeted genome editing ability, to study gene function and combat disease by introducing a targeted genome sequence change into a specific locus of a living cell or organism. We want to implement a powerful means for

본 발명은 유전체 DNA를 정확하고 효율적으로 편집하기 위해 유전체 편집의 새로운 도구를 개발하기 위해서, 상기 시스템은 세포내 번역을 가능하게 하는 구조가 있는 화학적 변형된 뉴클레오타이드(CM)를 포함하는 DNA dependent RNA Polymerase(DdRp) mRNA를 포함하는 DdRp RNA 발현 카세트; 및 DdRp에 의해 전사될 수 있는 유전체 편집 도구를 코딩하는 DNAge 발현 카세트;를 포함하는 자가전사가 가능한 유전체 편집 RNA/DNA 시스템에 적합한 신규의 기술을 제공하는 것이다.In order to develop a new tool for genome editing to accurately and efficiently edit genomic DNA, the present invention provides a DNA dependent RNA Polymerase comprising a chemically modified nucleotide (CM) with a structure that enables intracellular translation. (DdRp) DdRp RNA expression cassette comprising mRNA; and a DNAge expression cassette encoding a genome editing tool capable of being transcribed by DdRp; to provide a novel technology suitable for a genome editing RNA/DNA system capable of self-transcription, including.

추가적으로, 본 발명은 본 발명의 auto_DdRp 발현카세트의 산물인 DdRp에 의해 생성되는 전시체의 안정성 및 번역의 효율을 위해 전사체의 5'말단에 5'Cap 구조를 제공하는 방법에 관한 것이다.Additionally, the present invention relates to a method of providing a 5'Cap structure at the 5' end of a transcript for stability of an entire transcriptome generated by DdRp, a product of the auto_DdRp expression cassette of the present invention, and for translation efficiency.

특히, 본 발명의 목적은 세포 또는 조직에 투여되는 자가전사 RNA/DNA 시스템에 의해서 DNAge 발현 카세트에 코딩된 유전체 편집 도구의 발현을 증가시키는 것이다.In particular, it is an object of the present invention to increase the expression of a genome editing tool encoded in a DNAge expression cassette by a self-transcribed RNA/DNA system administered to a cell or tissue.

본 발명의 근본적인 목적은 청구 대상에 의해 해결된다.The fundamental object of the invention is solved by the claimed subject matter.

본 발명은 유전체 DNA를 정확하게 편집하기 위해 유전체 편집의 새로운 도구를 개발할 수 있기 위해서, 세포내 번역을 가능하게 하는 가능한 구조가 있는 DNA dependent RNA Polymerase(DdRp) mRNA(캡된 CM_DdRp mRNA)를 포함하는 DdRp RNA 발현 카세트; 및 DdRp에 의해 전사될 수 있는 유전체 편집 도구를 코딩하는 DNAge 발현 카세트;를 포함하는 유전체 편집 시스템을 구성하는 자가전사 RNA/DNA 시스템에 적합한 신규의 기술을 제공하는 것이다.DdRp RNA comprising DNA dependent RNA Polymerase (DdRp) mRNA (capped CM_DdRp mRNA) with a possible structure that enables intracellular translation, in order to be able to develop new tools of genome editing to accurately edit genomic DNA. expression cassette; and a DNAge expression cassette encoding a genome editing tool capable of being transcribed by DdRp; to provide a novel technology suitable for a self-transcribed RNA/DNA system constituting a genome editing system comprising a.

본 발명은 본 발명의 auto_DdRp 발현 카세트의 산물인 DdRp에 의해 생성되는 전시체의 안정성 및 번역의 효율을 위해 전사체에 5'Cap 구조를 제공하는 방법을 제공한다.The present invention provides a method for providing a 5'Cap structure to a transcript for stability and translation efficiency of an entire transcript produced by DdRp, a product of the auto_DdRp expression cassette of the present invention.

본 발명은 의학적 용도를 위한, 적어도 하나의 유전체 편집 도구의 발현을 증가시키는 적어도 하나의 염기서열 변형(SM)을 포함하는 유전체 편집 도구를 코딩하는 DNAge("SM_DNAge") 및 이를 포함하는 DNAge 발현 카세트를 제공한다. The present invention relates to a DNAge ("SM_DNAge") encoding a genome editing tool comprising at least one sequence modification (SM) that increases the expression of at least one genome editing tool for medical use ("SM_DNAge") and a DNAge expression cassette comprising the same provides

본 발명의 RNA/DNA 시스템에서 상기 유전체 편집 도구를 코딩하는 SM_DNAge 절편을 포함하는 DNAge 발현 카세트의 약학적 조성물 및 부품 키트(kit of parts)를 제공하며, 바람직하게 유전자 치료 및/또는 유전적 백신 접종 분야에서 사용하기 위한 것이다. In the RNA/DNA system of the present invention, a pharmaceutical composition and kit of parts for a DNAge expression cassette comprising the SM_DNAge fragment encoding the genome editing tool are provided, preferably for gene therapy and/or genetic vaccination. for use in the field.

본 발명의 RNA/DNA 시스템은 캡된 CM_DdRp mRNA 또는 캡된 CM/SM_DdRp mRNA 발현 카세트와 유전체 편집 도구를 코딩하는 DNAge 절편을 포함하는 DNAge 발현 카세트로 유전체 편집 도구의 발현을 증가시키는 방법을 제공한다.The RNA/DNA system of the present invention provides a method of increasing the expression of a genome editing tool with a DNAge expression cassette comprising a capped CM_DdRp mRNA or a capped CM/SM_DdRp mRNA expression cassette and a DNAge fragment encoding a genome editing tool.

본 발명의 목적은 자가전사 RNA/DNA 시스템의 제공에 의해 해결되며, 여기서 표적 조직 또는 표적 세포에서 유전체 편집 도구의 발현은 추가적으로 증가될 수 있다.The object of the present invention is solved by the provision of a self-transcribed RNA/DNA system, wherein the expression of a genome editing tool in a target tissue or target cell can be further increased.

명확성 및 가독성을 위해 다음의 정의가 제공된다. 이들 정의에 대해 언급된 임의의 기술적 특징은 본 발명의 각각 및 모두에서 이해될 수 있다. 이들에서 추가의 정의 및 설명이 특히 제공될 수 있다. 본 발명에서 핵산 서열이 보고된 곳에서, 이들 서열은 일반적으로 특정 RNA 또는 DNA 서열뿐만 아니라 이의 상응하는 DNA 또는 RNA 대응물(counterpart) 각각 모두를 포함한다. 예를 들어, DNA 서열이 제공된 곳에서, 통상의 기술자는 상응하는 RNA 서열은 우라실 잔기에 의한 티민 교환에 의해 수득되고 반대로도 같은 것을 알고 있다.The following definitions are provided for clarity and readability. Any technical feature recited for these definitions may be understood in each and all of the present invention. Further definitions and explanations may be provided in particular in these. Where nucleic acid sequences are reported herein, these sequences generally include both a specific RNA or DNA sequence as well as its corresponding DNA or RNA counterpart, respectively. For example, where a DNA sequence is provided, the skilled person knows that the corresponding RNA sequence is obtained by thymine exchange with uracil residues and vice versa.

세포: 세포는 유전체 편집에 적합한 임의의 유기체에서 기원하는 세포를 포함한다. 예시적인 유기체로는, 비-제한적으로, 인간, 마우스, 랫, 원숭이, 개, 돼지, 양, 소, 고양이와 같은 포유류; 닭, 오리, 거위와 같은 가금류; 벼, 옥수수, 밀, 수수, 보리, 대두, 땅콩, 아라비돕시스 등과 같은 외떡잎 식물 및 쌍떡잎 식물 등의 식물이 있다. Cells : Cells include cells from any organism suitable for genome editing. Exemplary organisms include, but are not limited to, mammals such as humans, mice, rats, monkeys, dogs, pigs, sheep, cattle, cats; poultry such as chickens, ducks and geese; plants such as monocotyledonous plants and dicotyledonous plants such as rice, corn, wheat, sorghum, barley, soybean, peanut, Arabidopsis, and the like.

유전체: 유전체는 핵에 존재하는 유전체 DNA 뿐만 아니라 세포 하위 구성 성분 (예, 미토콘드리아, 색소체)에 존재하는 기관 DNA를 포괄한다. 세포의 유전체은 세포 또는 유기체의 유전자 물질을 지칭한다. 세포 또는 유기체의 유전자 물질은 종종 하나 이상의 유전자를 포함한다. 특정 실시양태에서, 유전자는 하나 이상의 핵산을 포함하거나 이로 구성된다. 유전자는 폴리펩티드 쇄를 생성하는데 수반되는 DNA의 절편을 의미하며, 코딩 영역(예: 엑손), 유전자 생성물의 전사/해독 및 전사/해독의 조절에 수반되는 코딩 영역 이전 및 이후의 영역(리더 및 트레일러) 및 개개의 코딩 절편(엑손) 사이의 개재 서열(인트론)을 포함할 수 있다. 유전자는 반드시 펩티드를 생성하는 것은 아닐 수 있거나 유전자 서열에서의 유전적 차이(예컨대, 유전자의 코딩 및 비-코딩 부분에서의 돌연변이)에 기인하여 절두되거나 비-기능적인 단백질을 생성할 수 있다. 예컨대, 비-기능적 유전자는 슈도유전자일 수 있다. 유전자는 기능적 또는 비-기능적이든 간에 종종 참조 유전체의 유전자에 대한 상동성에 의해 확인될 수 있다. 예컨대, 대상체의 임의의 특정 유전자(예: 관심 유전자, 상대 유전자, 슈도유전자 등)는 당업자에 의해 또 다른 대상체 유전체에서 또는 참조 유전체에서 확인될 수 있다. 이배체 대상체에서, 유전자는 종종 대립유전자의 쌍(예: 2개의 대립유전자)을 포함한다. 따라서, 본 발명에서의 방법, 시스템 또는 공정은 유전자의 하나 또는 둘 모두의 대립유전자에 적용될 수 있다. 일부 실시양태에서, 본 발명의 방법, 시스템 또는 공정은 유전자의 각각의 대립유전자에 적용된다. Genome : Genome encompasses genomic DNA present in the nucleus as well as organ DNA present in cell sub-components (eg mitochondria, plastids). The genome of a cell refers to the genetic material of a cell or organism. The genetic material of a cell or organism often includes one or more genes. In certain embodiments, a gene comprises or consists of one or more nucleic acids. A gene refers to a segment of DNA involved in generating a polypeptide chain, and includes a coding region (eg, an exon), the transcription/translation of a gene product, and the regions before and after the coding region (leaders and trailers) involved in the regulation of transcription/translation. ) and intervening sequences (introns) between individual coding segments (exons). A gene may not necessarily produce a peptide, or it may produce a truncated or non-functional protein due to genetic differences in the gene sequence (eg, mutations in the coding and non-coding portions of the gene). For example, the non-functional gene may be a pseudogene. A gene, whether functional or non-functional, can often be identified by homology to a gene in a reference genome. For example, any particular gene of a subject (eg, a gene of interest, counterpart gene, pseudogene, etc.) can be identified in another subject genome or in a reference genome by one of ordinary skill in the art. In diploid subjects, a gene often contains a pair of alleles (eg, two alleles). Accordingly, the methods, systems or processes in the present invention can be applied to alleles of one or both genes. In some embodiments, a method, system or process of the invention is applied to each allele of a gene.

유전자 치료: 유전자 치료는 일반적으로 펩타이드 또는 단백질을 코딩하는 핵산에 의한 환자의 신체 또는 환자의 신체의 분리된 요소(element), 예를 들어 분리된 조직/세포의 치료를 의미한다. 이는 일반적으로 a) 핵산, 바람직하게는 본원에 정의된 바와 같은 RNA 및 DNA 분자를 - 어떤 투여 경로에 의해 - 직접 환자에게 또는 생체 내(in vivo)/생체 외(ex vivo) 또는 시험관 내(in vitro) 환자의 세포의 형질전환을 초래하는 시험관 내에서(in vitro) 환자의 분리된 세포/조직에 투여; b) 도입된 핵산 분자의 전사 및/또는 번역; 그리고 선택적으로 c) 핵산이 직접 환자에게 투여되지 않았다면, 환자에게 분리된, 형질전환된 세포의 재투여의 단계 중 적어도 하나를 포함할 수 있다. Gene therapy : Gene therapy generally refers to the treatment of a patient's body or an isolated element of the patient's body, eg, isolated tissues/cells, by means of a nucleic acid encoding a peptide or protein. This generally involves a) administering nucleic acids, preferably RNA and DNA molecules as defined herein - by any route of administration - directly to the patient or in vivo/ex vivo or in vitro. administration to isolated cells/tissues of a patient in vitro that results in transformation of the patient's cells in vitro; b) transcription and/or translation of the introduced nucleic acid molecule; and optionally c) re-administration of the isolated, transformed cells to the patient if the nucleic acid was not directly administered to the patient.

발현 카세트(Expression Cassette): 발현 카세트는 재조합 벡터와 같이 유기체에서 대상 뉴클레오티드 서열을 발현시키기에 적합한 벡터를 의미하며 본 발명에서 편의상 "구조체"라고 할 수도 있다. 발현은 기능성 산물의 생성을 의미한다. 예를 들어, 뉴클레오티드 서열의 발현은 뉴클레오티드 서열의 전사 (예, 전사하여 mRNA 또는 기능성 RNA를 생성함) 및/또는 RNA를 단백질 전구체 또는 성숙한 단백질로 번역하는 것을 의미할 수 있다. 발현 카세트는 재조합 벡터와 같이 유기체에서 대상 뉴클레오티드 서열을 발현시키기에 적합한 벡터를 의미한다. "발현"은 기능성 산물의 생성을 의미한다. 예를 들어, 뉴클레오티드 서열의 발현은 뉴클레오티드 서열의 전사 (예, 전사하여 mRNA 또는 기능성 RNA를 생성함) 및/또는 RNA를 단백질 전구체 또는 성숙한 단백질로 번역하는 것을 의미할 수 있다. 발현 카세트는 선형의 핵산 단편, 환형의 플라스미드, 바이러스 벡터 또는 번역될 수 있는 RNA (예, mRNA) 및 리보 핵 단백질 (RNP) 복합체를 포함한 다양한 형태 또는 이들의 조합을 포함한다. 바이러스 벡터는 렌티 바이러스, 아데노 관련 바이러스 발현 등이 상업화되었다. 발현 카세트는 서로 다른 소스로부터 유래될 수 있는 대상 뉴클레오티드 서열 및 조절 서열, 또는 동일한 소스로부터 유래되지만 통상 천연적으로 발견되는 방식과는 다른 방식으로 정렬된 대상 뉴클레오티드 서열 및 조절 서열을 포함할 수 있다. Expression Cassette : Expression cassette refers to a vector suitable for expressing a target nucleotide sequence in an organism, such as a recombinant vector, and may be referred to as a "construct" for convenience in the present invention. Expression refers to the production of a functional product. For example, expression of a nucleotide sequence may refer to transcription (eg, transcription to produce mRNA or functional RNA) of the nucleotide sequence and/or translation of the RNA into a protein precursor or mature protein. Expression cassette refers to a vector suitable for expressing a nucleotide sequence of interest in an organism, such as a recombinant vector. "Expression" means the production of a functional product. For example, expression of a nucleotide sequence may refer to transcription (eg, transcription to produce mRNA or functional RNA) of the nucleotide sequence and/or translation of the RNA into a protein precursor or mature protein. Expression cassettes include a variety of forms or combinations thereof, including linear nucleic acid fragments, circular plasmids, viral vectors or translatable RNA (eg, mRNA) and ribonuclear protein (RNP) complexes. Viral vectors have been commercialized for expression of lentiviruses and adeno-associated viruses. An expression cassette may comprise a subject nucleotide sequence and a regulatory sequence, which may be derived from different sources, or a subject nucleotide sequence and a regulatory sequence, which are derived from the same source but aligned in a manner different from that normally found in nature.

상류: 상류는 핵산 분자의 제2 요소에 대한 핵산 분자의 제1 요소의 상대적인 위치를 나타내며, 여기서 두 핵산 분자는 동일한 핵산 분자에 포함되며, 제1 요소는 핵산 분자의 제2 요소보다 5' 말단에 위치한다. 그 후 제2 요소는 해당 핵산 분자의 제1 요소의 하류인 것으로 지칭한다. 제2 요소의 상류에 위치한 요소는 해당 제2 요소의 5'에 있는 것과 동의어라고 할 수 있다. 이중가닥 핵산 분자의 경우, 상류 및 하류와 같은 표시는 (+) 가닥에 대해 부여된다.Upstream: Upstream refers to the relative position of a first element of a nucleic acid molecule to a second element of the nucleic acid molecule, wherein the two nucleic acid molecules are comprised in the same nucleic acid molecule, wherein the first element is 5' more than the second element of the nucleic acid molecule is located in The second element is then referred to as being downstream of the first element of the nucleic acid molecule in question. An element located upstream of a second element may be synonymous with being 5' of the second element. For double-stranded nucleic acid molecules, indications such as upstream and downstream are given for the (+) strand.

조절서열: 조절 서열 또는 조절 인자는 상호 호환적으로 사용되며, 조합된 코딩 서열의 전사, RNA 가공 또는 안정성 또는 번역에 영향을 미치는, 코딩 서열의 상류 (5' 비-코딩 서열), 내부 또는 하류 (3' 비-코딩 서열)에 위치하는, 뉴클레오티드 서열을 지칭한다. 조절 서열은, 비-제한적으로, 프로모터, 번역 리더 서열, 인트론 및 폴리아데닐화 인지 서열을 포함할 수 있다.Regulatory sequences: Regulatory sequences or regulatory elements are used interchangeably and are upstream (5' non-coding sequences), within or downstream of a coding sequence, affecting the transcription, RNA processing or stability or translation of the combined coding sequence. (3' non-coding sequence) refers to a nucleotide sequence. Regulatory sequences may include, but are not limited to, promoters, translation leader sequences, introns, and polyadenylation recognition sequences.

프로모터: 프로모터는 다른 핵산 단편의 전사를 통제할 수 있는 핵산 단편을 지칭한다. 본 발명에서, 프로모터는 세포로부터 유래되거나 또는 유래되지 않던 간에 세포에서 유전자의 전사를 통제할 수 있는 프로모터이다. 프로모터는 구성적인 프로모터 (constitutive promoter) 또는 조직-특이적인 프로모터 또는 발생-조절성 프로모터 (developmentally-regulated promoter) 또는 유도성 프로모터일 수 있다. 코어 프로모터는 프로모터에 포함되는 핵산 서열을 의미한다. 코어 프로모터는 전형적으로 전사를 적절히 개시하는데 필요한 프로모터의 최소 부분이다. 코어 프로모터는 전형적으로 전사 개시 부위 및 RNA 중합효소에 대한 결합 부위를 포함한다.Promoter: A promoter refers to a nucleic acid fragment capable of controlling the transcription of other nucleic acid fragments. In the present invention, a promoter is a promoter capable of controlling the transcription of a gene in a cell, whether or not derived from the cell. The promoter may be a constitutive promoter or a tissue-specific promoter or a developmentally-regulated promoter or an inducible promoter. The core promoter refers to a nucleic acid sequence included in the promoter. A core promoter is typically the smallest portion of a promoter necessary to properly initiate transcription. A core promoter typically includes a transcription initiation site and a binding site for RNA polymerase.

중합효소; 일반적으로 중합효소는 단량체 빌딩 블록으로부터 중합체 분자의 합성을 촉매할 수 있는 분자 실체를 지칭한다. "RNA 중합효소"는 리보뉴클레오타이드 빌딩 블록으로부터 RNA 분자의 합성을 촉매할 수 있는 분자 실체이다. "DNA 중합효소"는 데옥시리보뉴클레오타이드 빌딩 블록으로부터 DNA 분자의 합성을 촉매할 수 있는 분자 실체이다. DNA 중합효소 및 RNA 중합효소의 경우, 분자 실체는 전형적으로 단백질 또는 복수의 단백질의 집합체 또는 복합체이다. 전형적으로, DNA 중합효소는 전형적으로 DNA 분자인 주형 핵산을 기반으로 DNA 분자를 합성한다. 전형적으로, RNA 중합효소는 주형 핵산을 기반으로 RNA 분자를 합성하고, 주형 핵산은 DNA 분자(RNA 중합효소가 DNA 의존성 RNA 중합효소, DdRP인 경우)이거나 RNA 분자이다(RNA 중합효소가 RNA 의존성 RNA 중합효소인 DdRp인 경우). polymerase; Polymerases generally refer to molecular entities capable of catalyzing the synthesis of polymer molecules from monomer building blocks. An “RNA polymerase” is a molecular entity capable of catalyzing the synthesis of an RNA molecule from ribonucleotide building blocks. A “DNA polymerase” is a molecular entity capable of catalyzing the synthesis of a DNA molecule from deoxyribonucleotide building blocks. In the case of DNA polymerases and RNA polymerases, the molecular entity is typically a protein or an aggregate or complex of a plurality of proteins. Typically, a DNA polymerase synthesizes a DNA molecule based on a template nucleic acid, typically a DNA molecule. Typically, RNA polymerase synthesizes an RNA molecule based on a template nucleic acid, the template nucleic acid being either a DNA molecule (where the RNA polymerase is a DNA-dependent RNA polymerase, DdRP) or an RNA molecule (where the RNA polymerase is an RNA-dependent RNA) for the polymerase DdRp).

DNA 의존성 RNA 중합효소(DNA dependent RNA Polymerase, DdRp): DdRp는 RNAP(RNA Polymerase, RNA 중합효소)의 동의어이고, 진핵생물의 핵에 있는 DdRp는 RNAP I, RNAP II 및 RNAP III이고 이들은 구조적으로 서로 매우 다르며 각각 다른 유전자 세트를 전사하다 (다른 중합효소는 미토콘드리아와 엽록체에 있다). 그러나 세 가지 모두 서로 관련된 두 개의 큰 서브유닛과 박테리아 RNAP의 가장 큰 두 개의 서브유닛을 가지고 있다. 또한, 이러한 세 가지 효소 모두에서 또는 RNAP I과 RNAP III 사이에서만 공통적으로 발견되는 여러 작은 서브유닛이 있다.DNA dependent RNA Polymerase (DdRp): DdRp is a synonym for RNA Polymerase (RNAP), and the DdRp in the nucleus of eukaryotes are RNAP I, RNAP II and RNAP III and they are structurally mutually exclusive. They are very different and each transcribe a different set of genes (different polymerases are present in mitochondria and chloroplasts). However, all three have two large subunits related to each other and the two largest subunits of bacterial RNAP. There are also several small subunits found in common in all three of these enzymes or only between RNAP I and RNAP III.

진핵 DdRp는 박테리아 RNAP와 마찬가지로 전사 개시에 필요한 특수 보조 인자가 필요하다. 그러나 박테리아의 경우와 달리 진핵 개시인자는 프로모터 요소를 중합효소 홀로엔자임의 일부가 아닌 독립적으로 인식한다. 특히 RNAP II에 의해 전사된 유전자에서 많은 다른 개시인자가 관련되며, 일부 개시인자는 그 자가로 매우 복잡한 단백질이다. 정제된 진핵 RNA 중합효소만으로는 프로모터에서 선택적으로 전사를 시작할 수 없다. '홀로엔자임'이라는 용어는 때때로 진핵 RNAP를 지칭하는 데 사용되지만, 이 경우에는 박테리아 '핵심' 효소와 비슷한 것을 의미하며 프로모터에서 전사할 수 없다. 그러나 박테리아 핵심 효소와 달리 진핵 세포 전체 효소는 RNA의 전사 또는 처리와 관련된 많은 다른 단백질을 포함할 수 있다.Eukaryotic DdRp, like bacterial RNAP, requires specialized cofactors for transcription initiation. However, unlike in the case of bacteria, eukaryotic initiators recognize promoter elements independently and not as part of the polymerase holoenzyme. Many different initiators are involved, particularly in genes transcribed by RNAP II, some of which are themselves very complex proteins. Purified eukaryotic RNA polymerase alone cannot initiate transcription selectively at the promoter. The term 'holoenzyme' is sometimes used to refer to eukaryotic RNAP, but in this case it refers to something similar to a bacterial 'core' enzyme and cannot be transcribed from a promoter. However, unlike bacterial core enzymes, eukaryotic whole enzymes can contain many other proteins involved in the transcription or processing of RNA.

RNAP I는 nucleolus(인, 핵소체)에서 발견되며 대부분의 세포 RNA가 합성되는 큰 리보솜 RNA를 코딩하는 유전자만을 전사하다. 효모에서 효소는 13 개의 서브유닛 (그리고 거의 600kDa의 질량)을 가지고 있다. 더 작은 서브유닛 중 5 개는 효모 RNAP II 및 III에서도 발견되고 나머지 2 개는 효모 RNAP III에서 발견된다.RNAP I is found in the nucleolus (phosphorus) and transcribes only the gene encoding the large ribosomal RNA from which most cellular RNA is synthesized. In yeast, the enzyme has 13 subunits (and a mass of nearly 600 kDa). Five of the smaller subunits are also found in yeast RNAP II and III and the remaining two in yeast RNAP III.

RNAP II는 세포에 있는 대부분의 유전자인 단백질을 코딩하는 유전자를 전사하다. 또한 대부분의 작은 핵 RNA (snRNA)를 코딩하는 유전자를 전사하다. 대부분의 유기체는 12-subunit RNAP II (질량 약 550kDa)를 가지고 있는 것으로 보이다. 그러나 완전한 활성을 위해서는 몇 가지 다른 단백질이 필요하며 RNAP 홀로엔자임은 4000 kDa의 질량을 가질 수 있다. RNAP II transcribes the gene that encodes a protein, most of the genes in the cell. It also transcribes the genes that code for most small nuclear RNAs (snRNAs). Most organisms appear to have a 12-subunit RNAP II (mass about 550 kDa). However, several other proteins are required for full activity, and RNAP holoenzymes can have a mass of 4000 kDa.

RNAP III는 주로 transfer RNA 및 5S RNA를 코딩하는 유전자를 전사하지만 다른 작은 RNA를 코딩하는 일부 유전자도 전사하다. RNAP III에는 거의 700 kDa의 질량을 가진 14 개 이상의 별개의 서브유닛이 있다. RNAP I 및 RNAP II에 대한 프로모터는 대부분 전사 시작 부위의 상류에 있지만 (원핵생물 프로모터의 경우처럼) RNAP III에 대한 일부 프로모터는 시작 부위의 하류에 있다.RNAP III mainly transcribes genes encoding transfer RNA and 5S RNA, but also transcribes some genes encoding other small RNAs. RNAP III has at least 14 distinct subunits with a mass of nearly 700 kDa. The promoters for RNAP I and RNAP II are mostly upstream of the transcription start site (as is the case with prokaryotic promoters), but some promoters for RNAP III are downstream of the start site.

이러한 효소에 의해 형성된 전체 신장 복합체는 박테리아 RNAP와 유사하다. 이러한 효소가 프로모터를 찾는 메커니즘은 박테리아가 사용하는 메커니즘과는 상당히 다르지만, 전사 개시의 전체 메커니즘은 매우 유사하다. 그러나 진핵 생물의 종결에 대해서는 잘 알려져 있지 않다.The entire kidney complex formed by these enzymes resembles bacterial RNAP. The mechanism by which these enzymes find a promoter is quite different from that used by bacteria, but the overall mechanism of transcription initiation is very similar. However, little is known about the termination of eukaryotes.

DdRp는 박테리오파지 (박테리아 바이러스)의 단일 서브유닛 중합효소에서 진핵생물의 12-15 개의 서브유닛 복합체에 이르기까지 서브유닛 복잡성 범위가 다양하다(표 1). DdRp range in subunit complexity from single subunit polymerases of bacteriophages (bacterial viruses) to complexes of 12-15 subunits in eukaryotes (Table 1).

많은 파지가 더 작은 단일 서브유닛 RNA 폴리머라제를 코딩하는 파지 (예 : T7)의 경우처럼 숙주 세포의 폴리머라제와 자가적으로 코딩된 RNA 폴리머라제를 활용한다. 이러한 중합효소 중 일부는 현재 박테리아 세포에서 대량 생산이 비교적 쉽고, 프로모터 영역을 인식하기 위해 추가 단백질 보조인자가 필요하지 않으며, 박테리아 숙주 RNA 중합효소보다 최소 2배 빠른 속도로 전사체를 합성하기 때문에 생명공학의 주요 시약으로 사용된다. 다중 서브유닛 진핵생물의 핵 중합효소는 전사를 위한 템플릿의 적절한 위치를 찾기 위해 매우 많은 보조 단백질 인자를 필요로 하는 반면, 흥미롭게도 단일 서브유닛 박테리오파지 RNA 중합효소 자가는 올바른 유전자를 인식하고 정제된 DNA의 올바른 위치에서 시작할 수 있다, Many phages utilize the host cell's polymerase and a self-encoding RNA polymerase, as is the case with phage encoding smaller single-subunit RNA polymerases (eg T7). Some of these polymerases are currently biotechnological because they are relatively easy to mass-produce in bacterial cells, do not require additional protein cofactors to recognize the promoter region, and synthesize transcripts at least twice as fast as bacterial host RNA polymerases. used as the main reagent for Interestingly, single-subunit bacteriophage RNA polymerase autologous recognizes the correct gene and purified DNA, whereas multi-subunit eukaryotic nuclear polymerase requires a very large number of helper protein factors to find the proper location of the template for transcription. You can start at the right place in

박테리아 RNA 중합효소는 효소의 촉매 코어에 있는 3 개의 비동일 단백질의 4 개의 서브유닛을 포함하며, 이 핵심 복합체는 전사를 촉진하는 특정 서열을 인식하고 비 프로모터 부위에 대한 결합을 감소시키는 하나의 추가 보조인자 (시그마라고 함)를 필요로 한다. 박테리아의 각 종에는 여러 가지 시그마 인자가 있다. Bacterial RNA polymerase contains four subunits of three non-identical proteins in the catalytic core of the enzyme, and this core complex recognizes specific sequences that promote transcription and adds one that reduces binding to non-promoter sites. It requires a cofactor (called sigma). Each species of bacteria has several sigma factors.

DNA-dependent RNA polymerase의 서브유닛Subunit of DNA-dependent RNA polymerase SourceSource Number of subunits in coreNumber of subunits in core Sizes (kDa)Sizes (kDa) Bacteriophage T3, T7, <SP6 a Bacteriophage T3, T7, <SP6 a 1One ~100~100 Bacteriophage N4 a,b Bacteriophage N4 a,b 1One 320320 33 40, 30, 1540, 30, 15 Eubacteria, for example, Escherichia coli Eubacteria, for example, Escherichia coli 44 150, 145, 45150, 145, 45 Archaebacteria, for example, Sulfolobus acidocaldarius Archaebacteria, for example, Sulfolobus acidocaldarius 1313 122, 101, 44, 30, 27, 13.8, 12, 11.8, 10, 9.7, 9.7, 7.5, 5.5122, 101, 44, 30, 27, 13.8, 12, 11.8, 10, 9.7, 9.7, 7.5, 5.5 Saccharomyces cerevisiae RNAP I Saccharomyces cerevisiae RNAP I 1414 190, 135, 49, 43, 40, 34.5, 27, 23, 19, 14.5, 14, 12.2, 10, 10190, 135, 49, 43, 40, 34.5, 27, 23, 19, 14.5, 14, 12.2, 10, 10 Saccharomyces cerevisiae RNAP II Saccharomyces cerevisiae RNAP II 1212 191, 140, 35, 25.4, 25, 19, 17.9, 16.5, 14.2, 13, 8.3, 7.7191, 140, 35, 25.4, 25, 19, 17.9, 16.5, 14.2, 13, 8.3, 7.7 Saccharomyces cerevisiae RNAP III Saccharomyces cerevisiae RNAP III 13-1713-17 160, 128, 82, 53, 40, 37, 34, 31, 27, 25, 23, 19, 17, 14.5, 11, 10, 10160, 128, 82, 53, 40, 37, 34, 31, 27, 25, 23, 19, 17, 14.5, 11, 10, 10 Human and yeast mitochondriaHuman and yeast mitochondria 1One 140140 Spinach and mustard chloroplast c Spinach and mustard chloroplast c 1One 110110 44 154, 120, 78, 38154, 120, 78, 38

Figure pat00001
13
Figure pat00001
13 141, 110, 36, 26, and others not yet fully characterized141, 110, 36, 26, and others not yet fully characterized Vaccinia virusVaccinia virus 88 147, 132, 35, 30, 22, 19, 18, 7147, 132, 35, 30, 22, 19, 18, 7 Baculovirus a Baculovirus a 44 98, 55, 53, 4698, 55, 53, 46

a, 바이러스는 전사의 시간적 조절을 위해 자가적으로 암호화된 RNA 중합 효소뿐만 아니라 숙주 RNA 중합 효소를 사용한다.a, Viruses use host RNA polymerase as well as self-encoding RNA polymerase for temporal regulation of transcription.

b, 바이러스는 하나 이상의 RNA 중합 효소를 암호화한다.b, The virus encodes one or more RNA polymerases.

c, 하나 이상의 RNA 중합 효소가 사용된다.c, One or more RNA polymerases are used.

Bacillus subtilis 파지 SP01 및 coliphage T4와 같은 일부 박테리오파지의 게놈은 바이러스 DNA 템플릿의 전사를 위해 박테리아 RNA 중합효소 촉매 코어를 리디렉션하는 자가로 시그마 인자를 코딩한다. 박테리아 효소의 촉매 코어는 이 모든 전사에 대해 동일하게 사용된다. 또한, 많은 박테리오파지는 프로모터 인식 후 전사 주기의 후속 단계를 수정하기 위해 다른 바이러스 코딩 및 숙주 코딩 조절 단백질을 활용하다.The genomes of some bacteriophages, such as Bacillus subtilis phage SP01 and coliphage T4, encode autologous sigma factors that redirect the bacterial RNA polymerase catalytic core for transcription of viral DNA templates. The catalytic core of bacterial enzymes is used equally for all these transcriptions. In addition, many bacteriophages utilize other viral-coding and host-coding regulatory proteins to modify subsequent steps of the transcription cycle after promoter recognition.

박테리오파지 N4는 숙주 중합효소와 자가 게놈에 의해 코딩된 다른 두 중합효소를 모두 사용하다(표 1). 바이러스 중합효소 중 하나는 매우 큰 단일 서브유닛 효소로, 더 작은 단일서브유닛 박테리오파지 코딩 중합효소와 달리 단일 가닥 DNA 결합 단백질인 숙주 보조인자 ssb가 필요하다. ssb 단백질은 이 320kDa 중합효소가 바이러스 DNA에서 특이한 헤어핀 구조를 인식하도록 한다. 이는 추가 바이러스 RNA의 합성을 허용하여 새로운 바이러스 입자의 복제및 조립을 가능하게 한다.Bacteriophage N4 uses both a host polymerase and the other two polymerases encoded by its own genome (Table 1). One of the viral polymerases is a very large single-subunit enzyme, which, unlike the smaller single-subunit bacteriophage-encoding polymerases, requires a single-stranded DNA binding protein, the host cofactor ssb. The ssb protein allows this 320 kDa polymerase to recognize a specific hairpin structure in viral DNA. This allows the synthesis of additional viral RNA, enabling the replication and assembly of new viral particles.

원핵 바이러스와 마찬가지로 진핵 바이러스는 자신의 중합효소 (예 : 우두, 바큘로 바이러스)를 코딩하는 것부터 숙주 세포기구를 사용하는 것까지 전사 전략의 전체 스펙트럼을 사용하다. 여러 진핵 바이러스는 RNA 의존성 RNA 중합효소(RdRp)도 코딩하다 (예: C 형 간염 바이러스, 소아마비 바이러스). 바이러스로 코딩된 단백질 인자는 또한 전사주기의 여러 위치에서 숙주 세포의 전사를 조절하다.Like prokaryotic viruses, eukaryotic viruses use a full spectrum of transcriptional strategies, from coding their own polymerases (eg, vaccinia, baculovirus) to using host cell machinery. Many eukaryotic viruses also encode RNA-dependent RNA polymerase (RdRp) (eg hepatitis C virus, polio virus). Virus-encoded protein factors also regulate host cell transcription at various locations in the transcriptional cycle.

진핵 DdRp는 핵과 세포 기관에서 발견될 수 있다. 미토콘드리아에서 발견되는 중합효소와 엽록체에서 발견되는 하나의 중합효소는 작은 단일 서브유닛 박테리오파지 RNA 중합효소와 유사하다. 엽록체에는 두 개의 다른 RNA 중합효소가 있으며, 그중 하나는 박테리아 효소와 매우 유사하다(표 1). 핵 RNA 중합효소는 생화학적으로 분리된 세 가지 별개의 복합체로 제공되며, 원래는 각각 전사하는 유전자의 종류에 따라 분류되었다. 최근에는 RNA 합성을 조절하기 위해 작용하는 서브유닛과 부속 단백질 인자에 의해 정의되었다. Termed RNA 중합효소 I, II 및 III (또는 각각 A, B 및 C)은 각각 12 개 이상의 서브유닛을 가지고 있다(표 1). RNA 중합효소 I은 리보솜의 서브유닛에 대한 구조적 RNA를 코딩하는 유전자를 전사하다. RNA 중합효소 II는 단백질과 작은 RNA의 하위 집합을 코딩하는 유전자를 전사하다. RNA 중합효소 III는 리보솜 5S RNA, tRNA 및 기타 작은 RNA의 하위 집합을 코딩하는 유전자를 전사한다.Eukaryotic DdRp can be found in the nucleus and organelles. A polymerase found in mitochondria and one polymerase found in chloroplasts resemble small single-subunit bacteriophage RNA polymerases. There are two other RNA polymerases in chloroplasts, one of which is very similar to bacterial enzymes (Table 1). Nuclear RNA polymerase is provided as three distinct biochemically isolated complexes, each originally classified according to the type of gene it transcribes. More recently, it has been defined by subunits and accessory protein factors that act to regulate RNA synthesis. Termed RNA polymerases I, II and III (or A, B and C, respectively) each have at least 12 subunits (Table 1). RNA polymerase I transcribes a gene encoding structural RNA for a subunit of the ribosome. RNA polymerase II transcribes genes encoding a subset of proteins and small RNAs. RNA polymerase III transcribes genes encoding a subset of ribosomal 5S RNA, tRNA, and other small RNAs.

DdRp에 의한 전사: 박테리오파지 T3, T7 또는 SP6의 DNA-의존성 RNA 중합효소는 상대적으로 작은 (~ 100 kDa) 단일 서브유닛 RNA 중합효소의 계열로, 전사의 모든 단계, 즉 시작, 신장 또는 종료에 대한 추가 단백질 인자를 필요로 하지 않는다. 이러한 중합효소는 대장균에서 쉽게 과발현된다. 그들은 매우 활동적이며 덜 자주 종결되며 (E. coli RNA 중합효소와 비교하여) 자신의 프로모터에서 매우 엄격하게 전사를 한다. 이러한 특성은 이러한 중합효소를 다양한 실험 전략을 사용하여 시험관 내 RNA 합성에 매우 편리한 도구로 만들었다. 박테리오파지 T7 (T7 RNAP)의 RNA 중합효소는 아마도 가장 일반적으로 사용되며 상업적으로 이용 가능하지만 대량의 RNA 합성을 위해 사내에서 정제하는 것이 더 경제적이다. Transcription by DdRp: DNA-dependent RNA polymerases of the bacteriophage T3, T7 or SP6 are a family of relatively small (~100 kDa) single-subunit RNA polymerases that are responsible for all stages of transcription, i.e. initiation, elongation or termination. No additional protein factors are required. These polymerases are easily overexpressed in E. coli. They are very active, terminate less frequently (compared to E. coli RNA polymerase) and transcribe very tightly in their promoters. These properties make these polymerases a very convenient tool for in vitro RNA synthesis using various experimental strategies. RNA polymerase from the bacteriophage T7 (T7 RNAP) is perhaps the most commonly used and commercially available, but more economical to purify in-house for large-scale RNA synthesis.

<도 1>에서처럼, 박테리오파지 RNAP는 특정 서열에서 RNA 전사를 시작하고 종료하다(특정 효율로). 그러나 시험관 내 준비 RNA 생산을 위한 가장 간단한 실험 설정은 RNA 합성이 특정 T7 프로모터에서 시작되고 RNAP가 DNA 템플릿의 물리적 끝에서 떨어질 때 끝나는 소위 유출 전사이다. 이 설정은 화학적으로 합성될 수 있는 DNA 프로모터 및 템플릿 서열의 편리한 준비를 할 수 있다. 더욱이, DNA 주형이 완전 염기쌍일 필요는 없다는 것이 밝혀졌다. 대부분 또는 전체 코딩 가닥은 단일 가닥으로 유지될 수 있다. -15에서 -3까지의 위치에 걸친 최소 염기쌍 영역 (+1은 전사 잔기의 시작을 나타냄)은 T7 RNAP를 사용한 완전 효율적인 전사에 여전히 충분하다. 이것은 프로모터 인식 과정의 일부로서 전사 기포를 형성한다는 개념과 일치하다. 개방 프로모터가 있는 T7 RNAP의 결정 구조에서 주형 및 비 주형 가닥은 위치 -4에서 시작하여 하류에서 풀린다. 이 특성은 모든 RNA 서열의 전사를 위한 단일 범용 DNA 상단 가닥을 준비 할 수 있게 한다. 매번 하단 코딩 DNA 가닥만 재설계하면 된다.As in <Figure 1>, bacteriophage RNAP initiates and terminates RNA transcription at a specific sequence (with a specific efficiency). However, the simplest experimental setup for the production of ready RNA in vitro is the so-called efflux transcription, where RNA synthesis begins at a specific T7 promoter and ends when RNAP detaches from the physical end of the DNA template. This setup allows for convenient preparation of chemically synthesized DNA promoter and template sequences. Moreover, it has been found that the DNA template need not be perfectly base paired. Most or all of the coding strand may remain single stranded. The minimum base pair region spanning positions -15 to -3 (+1 indicates the start of the transcription residue) is still sufficient for fully efficient transcription using T7 RNAP. This is consistent with the notion of forming a transcriptional bubble as part of the promoter recognition process. In the crystal structure of T7 RNAP with an open promoter, the template and non-template strands are unwound downstream starting at position -4. This property makes it possible to prepare a single universal DNA top strand for transcription of any RNA sequence. Only the bottom coding DNA strand needs to be redesigned each time.

<도 1>에서처럼, 천연 T7 RNAP 프로모터 서열은 위치 -17에서 위치 +6까지 강력하게 보존된다. 그럼에도 불구하고 RNA는 수율이 감소할 수 있지만 위치가 +1에서 +6으로 화학적 변형된 프로모터에서도 전사된다. 일반적으로 GG 또는 GA로 시작하는 RNA 서열에서 가장 효율적인 수율이 달성된다. 수율을 향상시키려면 전사 반응 조건을 각 RNA 서열에 최적화해야 한다. 여기에는 다양한 MgCl2 농도와 상대적인 양의 T7 RNAP, 주형 및 NTP가 포함된다. 올바른 RNA 단편과 여러 가지 더 짧은 중단 산물 외에도 시험관내 전사인 T7 RNAP는 종종 주 전사체의 3' 말단에 비주형 뉴클레오티드를 통합하여 소위 'n+1 생성물'을 생성한다. 그런 다음 원하는 RNA 산물을 잘못된 크기의 전사체와 DNA 템플릿, 사용하지 않은 NTP 및 RNAP에서 분리해야 한다. As in Figure 1, the native T7 RNAP promoter sequence is strongly conserved from position -17 to position +6. Nevertheless, RNA is transcribed even in promoters chemically modified at positions +1 to +6, although yields may be reduced. In general, the most efficient yields are achieved with RNA sequences beginning with GG or GA. To improve the yield, the transcription reaction conditions should be optimized for each RNA sequence. These include varying MgCl2 concentrations and relative amounts of T7 RNAP, template and NTP. In addition to the correct RNA fragment and several shorter stop products, in vitro transcription, T7 RNAP, often incorporates a non-template nucleotide at the 3' end of the main transcript to generate the so-called 'n+1 product'. The desired RNA product must then be isolated from mis-sized transcripts, DNA templates, and unused NTPs and RNAPs.

<도 1>에서처럼, T7 RNAP을 사용하는 시험관내 전사를 통해 거의 모든 길이와 서열을 가진 RNA를 제조할 수 있다. 그러나 더 큰 RNA의 경우, 올리고 뉴클레오티드 길이를 가진 주형의 수율이 기하급수적으로 감소하기 때문에 화학적으로 합성된 DNA 주형을 사용하는 것이 실용성이 떨어진다. 50-100 nt보다 큰 템플릿의 경우 대체 방법은 선형화된 high-copy DNA plasmid (예 : pUC18.31) 내에서 설계된 완전 이중 가닥 DNA 템플릿을 사용하는 것이다. 대형 RNA를 준비하는 또 다른 잠재적인 합병증은 RNA 변성이다. PAGE 정화중에 진행된다. RNA는 이러한 정제후에 본래의 형태로 다시 접혀 져야하며, 때때로 문제가 될 수 있다. As shown in <Fig. 1>, RNA of almost any length and sequence can be prepared through in vitro transcription using T7 RNAP. However, for larger RNAs, the use of chemically synthesized DNA templates is not practical because the yield of templates with oligonucleotide length decreases exponentially. For templates larger than 50-100 nt, an alternative approach is to use a fully double-stranded DNA template designed within a linearized high-copy DNA plasmid (eg pUC18.31). Another potential complication of preparing large RNAs is RNA denaturation. This is done during PAGE purification. RNA must be folded back into its original form after such purification, which can sometimes be problematic.

DdRp 프로모터: 박테리오파지 T7, T3 및 SP6에 의해 코딩된 DdRp는 중합효소-프로모터 상호 작용 연구에 특히 적합하다. 각 파지 효소는 추가 단백질 인자가 없는 상태에서 전사 과정의 모든 단계를 수행할 수 있는 = 100kDa의 단일 종의 단백질로 구성된다. 박테리오파지 T7은 각각 단일 서브유닛 DdRp를 코딩하는 박테리아 바이러스 그룹의 원형이다. 이 클래스의 다른 구성원으로는 coliphages 콜리 파지 T3 및 BA14, Salmonella phage 살모넬라 파지 SP6, Pseudomonasphage 슈도모나스 파지 gh-1 및 Klebsiella phage 파지 K11 등이 있다. 파지 DdRp는 대규모 RNA 합성, 핵산 증폭을 포함한 다양한 응용 분야에서 유용하며 원핵 및 진핵 세포 모두에서 효율적인 발현 시스템의 기초로 입증되었다. DdRp promoter: DdRp encoded by bacteriophages T7, T3 and SP6 is particularly suitable for polymerase-promoter interaction studies. Each phage enzyme consists of a single species of protein = 100 kDa capable of carrying out all steps of the transcription process in the absence of additional protein factors. Bacteriophage T7 is a prototype of a group of bacterial viruses, each encoding a single subunit DdRp. Other members of this class include coliphages coliphages T3 and BA14, Salmonella phage Salmonella phage SP6, Pseudomonasphage Pseudomonas phage gh-1 and Klebsiella phage phage K11. Phage DdRp is useful in a variety of applications, including large-scale RNA synthesis, nucleic acid amplification, and has proven to be the basis of efficient expression systems in both prokaryotic and eukaryotic cells.

<도 2>에서처럼, 높은 수준의 구조적 유사성에도 불구하고 (아미노산 서열의 보존으로 판단할 때) 파지 DdRp는 자신의 프로모터 서열에 대해 정교하게 특이적으로 작용한다. 각각의 파지 프로모터는 -17에서 +6까지 확장되는 공통 23 개- 염기 쌍 컨센서스 서열과 관련이 있다 (그림 1 참조). -7에서 +1까지 확장되는 핵심 뉴클레오티드 서열은 세 가지 프로모터 유형 전반에 걸쳐 매우 보존되어 있으며, 이는 이 영역이 중합효소의 공유된 특징과 공통적인 방식으로 상호 작용함을 의미한다. 프로모터 서열은 -8에서 -12까지 영역에서 크게 다르며, 이는 이 영역의 염기쌍이 특정 프로모터 인식에 중요하다는 것을 시사한다. 합성 파지 프로모터를 사용한 연구에 따르면 T3 및 T7 효소에 대한 프로모터 특이성의 주요 결정자는 위치 -10 및 -11의 염기 쌍을 포함한다. T7 프로모터 서열의 이 두 위치에서 T3 잔기의 치환은 T7 중합효소에 의한 인식을 방지하고 T3 RNA 중합효소에 의한 전사를 가능하게 한다. 이러한 결정 인자의 인식을 담당하는 T3 및 T7 RNA 중합효소의 도메인이 국소화되었으며, 예비 결정학적 데이터는 중합효소의 이 영역이 추정 DNA 결합 틈 내에 위치함을 의미한다.As in <Fig. 2>, despite the high level of structural similarity (judging by the conservation of amino acid sequence), phage DdRp acts precisely and specifically for its promoter sequence. Each phage promoter is associated with a consensus 23-base pair consensus sequence that extends from -17 to +6 (see Figure 1). The core nucleotide sequence, extending from -7 to +1, is highly conserved across the three promoter types, suggesting that these regions interact in a common manner with the shared features of polymerases. Promoter sequences differ significantly in the region from -8 to -12, suggesting that base pairing in this region is important for specific promoter recognition. Studies using synthetic phage promoters have shown that the key determinants of promoter specificity for T3 and T7 enzymes include the base pairs at positions -10 and -11. Substitution of the T3 residue at these two positions in the T7 promoter sequence prevents recognition by T7 polymerase and enables transcription by T3 RNA polymerase. The domains of the T3 and T7 RNA polymerases responsible for the recognition of these determinants were localized, and preliminary crystallographic data suggest that this region of the polymerase is located within the putative DNA binding cleft.

핵산 분자: 핵산 분자는 핵산 성분을 포함하는 분자이다. 핵산 분자는 DNA 또는 RNA를 나타낸다. "폴리뉴클레오타이드"와 동의어로 사용된다. 핵산 분자는 뉴클레오타이드 단량체를 포함하거나 이로 이루어진 폴리머이며, 당/포스페이트-백본의 포스포디에스테르 결합에 의해 서로 공유 결합으로 연결되어 있다. Nucleic Acid Molecules : A nucleic acid molecule is a molecule comprising a nucleic acid component. Nucleic acid molecule refers to DNA or RNA. Used synonymously with "polynucleotide". Nucleic acid molecules are polymers comprising or consisting of nucleotide monomers and are covalently linked to each other by phosphodiester bonds of sugar/phosphate-backbone.

핵산은 DNA(예: 상보성 DNA(cDNA), 유전체 DNA(gDNA) 등), RNA(예: 메시지 RNA(mRNA), 짧은 억제성 RNA(siRNA), 리보좀 RNA(rRNA), tRNA, microRNA, 및/또는 DNA 또는 RNA 유사체(예: 염기 유사체, 슈가 유사체 및/또는 비-천연 골격 등 함유), RNA/DNA 하이브리드 및 폴리아미드 핵산(PNA)으로부터의 임의의 조성물 중 하나 이상의 핵산(예: 핵산의 세트 또는 서브세트)를 지칭하며, 이들 모두는 단일- 또는 이중-가닥 형태일 수 있으며, 달리 제한이 없는 한 천연 발생 뉴클레오티드와 유사한 방식으로 기능할 수 있는 천연 뉴클레오티드의 공지된 유사체를 포함할 수 있다. Nucleic acids include DNA (eg, complementary DNA (cDNA), genomic DNA (gDNA), etc.), RNA (eg, message RNA (mRNA), short inhibitory RNA (siRNA), ribosomal RNA (rRNA), tRNA, microRNA, and/or or one or more nucleic acids of any composition from DNA or RNA analogues (eg containing base analogues, sugar analogues and/or non-natural backbones, etc.), RNA/DNA hybrids and polyamide nucleic acids (PNAs) (eg a set of nucleic acids) or a subset), all of which may be in single- or double-stranded form and, unless otherwise limited, may include known analogs of natural nucleotides that may function in a manner similar to naturally occurring nucleotides.

데옥시리보뉴클레오티드, 리보뉴클레오티드 및 천연 뉴클레오티드의 공지된 유사체를 포함하는 핵산을 포함한다. 핵산은 등가물로서 이의 유도체 또는 변이체, 뉴클레오티드 유사체로부터 합성된 RNA 또는 DNA의 적합한 유사체, 단일-가닥("센스" 또는 "안티센스", "플러스" 가닥 또는 "마이너스" 가닥, "전방" 판독 프레임 또는 "후방" 판독 프레임) 및 이중-가닥 폴리뉴클레오티드를 포함할 수 있다. 핵산은 단일 또는 이중 가닥일 수 있다. 핵산은 2개 이상, 3개 이상, 4개 이상 또는 5개 이상의 인접 뉴클레오티드의 임의의 길이의 것일 수 있다. 핵산은 서열(예컨대, 핵산 서열, 예컨대 서열)로서 당업계에 공지된 특정한 5'로부터 3' 순서의 뉴클레오티드를 포함할 수 있다.nucleic acids, including deoxyribonucleotides, ribonucleotides, and known analogues of natural nucleotides. Nucleic acids include derivatives or variants thereof, suitable analogs of RNA or DNA synthesized from nucleotide analogs as equivalents, single-stranded (“sense” or “antisense”, “plus” or “minus” strands, “forward” reading frame or “ back" reading frame) and double-stranded polynucleotides. Nucleic acids may be single or double stranded. Nucleic acids may be of any length of 2 or more, 3 or more, 4 or more, or 5 or more contiguous nucleotides. A nucleic acid may comprise a specific 5' to 3' order of nucleotides known in the art as a sequence (eg, a nucleic acid sequence, such as a sequence).

핵산은 천연 발생일 수 있고/있거나 합성 또는 변경될 수 있다. 예컨대, 핵산은 앰플리콘일 수 있다. 핵산은 핵산 라이브러리, 예컨대 gDNA, cDNA 또는 RNA 라이브러리로 부터의 것일 수 있다. 핵산은 합성(예컨대, 화학적으로 합성)되거나 (예컨대, 시험관내에서 폴리머라제연장에 의해, 예컨대 증폭에 의해, 예컨대 PCR에 의해) 생성될 수 있다. 핵산은 플라스미드, 파아지, 바이러스, 자가 복재 서열(ARS), 동원체, 인공 유전체, 유전체, 또는 시험관내에서 또는 호스트 세포, 세포, 세포 핵 또는 세포의 세포질에서 전사하거나 전사될 수 있는 다른 핵산이거나 이로부터의 것일 수 있다.Nucleic acids may be naturally occurring and/or may be synthetic or altered. For example, the nucleic acid may be an amplicon. The nucleic acid may be from a nucleic acid library, such as a gDNA, cDNA or RNA library. Nucleic acids can be synthesized (eg, chemically synthesized) or generated (eg, by polymerase extension in vitro, eg, by amplification, eg, by PCR). A nucleic acid is or is from a plasmid, phage, virus, self-replicating sequence (ARS), centromere, artificial genome, genome, or other nucleic acid capable of being transcribed in vitro or in a host cell, cell, cell nucleus, or cytoplasm of a cell. may be of

본 발명에서 기술되는 공정 또는 방법에 대해 제공되는 핵산은 1 내지 1000, 1 내지 500, 1 내지 200, 1 내지 100, 1 내지 50, 1 내지 20 또는 1 내지 10개 샘플로부터의 핵산을 포함할 수 있다. 올리고뉴클레오티드는 비교적 짧은 핵산이다. 올리고뉴클레오티드는 약 2 내지 150, 2 내지 100, 2 내지 50 또는 2 내지 약 35개 핵산 길이로부터의 것일 수 있다. 올리고뉴클레오티드는 18 내지 30, 20 내지 28 또는 21 내지 26개 뉴클레오티드 길이이다. 올리고뉴클레오티드는 단일 가닥이다. 올리고뉴클레오티드는 프라이머이다. 프라이머는 종종 선택된 상보적 핵산에 하이브리드화하도록 구성되며 하이브리드화후 폴리머라제에 의해 연장되도록 구성된다.Nucleic acids provided for a process or method described herein may comprise nucleic acids from 1 to 1000, 1 to 500, 1 to 200, 1 to 100, 1 to 50, 1 to 20, or 1 to 10 samples. have. Oligonucleotides are relatively short nucleic acids. Oligonucleotides may be from about 2-150, 2-100, 2-50, or 2 and about 35 nucleic acids in length. Oligonucleotides are 18 to 30, 20 to 28 or 21 to 26 nucleotides in length. Oligonucleotides are single-stranded. Oligonucleotides are primers. Primers are often configured to hybridize to a selected complementary nucleic acid and to be extended by a polymerase after hybridization.

DNA: DNA는 데옥시리보핵산에 대한 일반적인 약자이다. 이는 핵산 분자, 즉, 뉴클레오타이드로 이루어진 폴리머이다. 이러한 뉴클레오타이드는 보통 - 그들 스스로에 의해 - 당 성분(sugar moiety), 염기 성분 및 포스페이트 성분으로 구성된 데옥시아데노신-모노포스페이트, 데옥시티미딘-모노포스페이트, 데옥시구아노신-모노포스페이트 및 데옥시사이티딘-모노포스페이트 단량체이며, 특유의 백본 구조에 의해 중합된다. 백본구조는, 일반적으로, 단량체에 근접한 첫 번째 뉴클레오타이드의 당 성분 즉, 데옥시리보오스와 두 번째 포스페이트 성분 사이의 포스포디에스테르 결합에 의해 형성된다. 단량체의 특정 순서, 즉, 당/포스페이트-백본에 연결된 염기의 순서는 DNA-서열이라고 한다. DNA는 단일 가닥 또는 이중 가닥일 수 있다. 이중 가닥 형태(double stranded form)에서, 첫 번째 가닥의 뉴클레오타이드는 일반적으로 두 번째 가닥의 뉴클레오타이드와 예를 들어, A/T-염기쌍 및 G/C-염기쌍으로 혼성화(hybridize)된다.DNA: DNA is a generic abbreviation for deoxyribonucleic acid. It is a nucleic acid molecule, ie a polymer made up of nucleotides. These nucleotides usually consist of - by themselves - a sugar moiety, a base component and a phosphate component: deoxyadenosine-monophosphate, deoxythymidine-monophosphate, deoxyguanosine-monophosphate and between deoxy It is a tidine-monophosphate monomer and is polymerized by a unique backbone structure. The backbone structure is generally formed by a phosphodiester bond between the sugar moiety of the first nucleotide proximal to the monomer, i.e., deoxyribose and the second phosphate moiety. The specific order of the monomers, ie the order of the bases linked to the sugar/phosphate-backbone, is referred to as the DNA-sequence. DNA can be single-stranded or double-stranded. In the double stranded form, the nucleotides of the first strand generally hybridize with the nucleotides of the second strand, eg, A/T-base pairs and G/C-base pairs.

RNA, mRNA: RNA는 리보핵산에 대한 일반적인 약자이다. 이는 핵산 분자 즉, 뉴클레오타이드로 이루어진 폴리머이다. 이들 뉴클레오타이드는 보통 소위 백본을 따라 서로 연결된 아데노신-모노포스페이트, 우리딘-모노포스페이트, 구아노신-모노포스페이트 및 사이티딘-모노포스페이드 단량체이다. 백본은 단량체에 근접한 첫 번째 당, 즉 리보오스, 및 두 번째 포스페이트 성분 사이에서 포스포디에스테르 결합에 의해 형성된다. 단량체의 특정 연쇄는 RNA-서열이라고 한다. RNA, mRNA: RNA is a general abbreviation for ribonucleic acid. It is a nucleic acid molecule, that is, a polymer made up of nucleotides. These nucleotides are usually adenosine-monophosphate, uridine-monophosphate, guanosine-monophosphate and cytidine-monophosphate monomers linked together along the so-called backbone. The backbone is formed by a phosphodiester linkage between the first sugar proximal to the monomer, namely ribose, and the second phosphate component. A specific chain of monomers is called an RNA-sequence.

RNA는 리보뉴클레오타이드 잔기를 포함하는 분자에 관한 것이고, 완전히 또는 대체로 리보뉴클레오타이드 잔기로 이루어진 분자에 관한 것이다. 용어 "리보뉴클레오타이드"는 β-D-리보푸라노실기의 2'-위치에 수산기를 갖는 뉴클레오타이드에 관한 것이다. "RNA"는 이중가닥 RNA, 단일가닥 RNA, 분리된 RNA, 예컨대 부분적으로 또는 완전히 정제된 RNA, 본질적으로 순수한 RNA, 합성 RNA, 및 재조합적으로 발생된 RNA, 예컨대 하나 이상의 뉴클레오타이드의 부가, 결실, 치환 및/또는 변경에 의해 자연-발생 RNA와 상이한 변형된 RNA를 포함한다. 이러한 변경은 예를 들어, RNA의 하나 이상의 뉴클레오타이드에서, RNA의 말단(들)에 또는 내부적으로, 비-뉴클레오타이드 물질을 첨가하는 것을 포함할 수 있다. 또한, RNA 분자의 뉴클레오타이드는 비-표준 뉴클레오타이드, 예컨대 비-천연 발생 뉴클레오타이드 또는 화학적으로 합성된 뉴클레오타이드 또는 데옥시뉴클레오타이드도 포함할 수 있다. 이들 변경된 RNA는 유사체, 특히 자연성 발생 RNA의 유사체로 지칭할 수 있다.RNA relates to molecules comprising ribonucleotide residues, and to molecules consisting entirely or largely of ribonucleotide residues. The term "ribonucleotide" relates to a nucleotide having a hydroxyl group at the 2'-position of the β-D-ribofuranosyl group. "RNA" means double-stranded RNA, single-stranded RNA, isolated RNA, such as partially or fully purified RNA, essentially pure RNA, synthetic RNA, and recombinantly generated RNA, such as additions, deletions, modified RNA that differs from naturally-occurring RNA by substitution and/or alteration. Such alterations may include, for example, adding a non-nucleotide material, at one or more nucleotides of the RNA, at the end(s) of the RNA, or internally. Nucleotides of RNA molecules may also include non-standard nucleotides, such as non-naturally occurring nucleotides or chemically synthesized nucleotides or deoxynucleotides. These altered RNAs may be referred to as analogs, in particular analogs of naturally occurring RNA.

RNA는 단일가닥 또는 이중가닥일 수 있다. 본 발명에서는, 단일가닥 RNA가 바람직하다. 용어 "단일가닥 RNA"는 일반적으로 상보적인 핵산 가닥(전형적으로 상보적인 RNA 가닥; 즉 상보적인 RNA 분자가 없음)이 RNA 분자와 결합되어 있지 않은 실시형태를 지칭한다. RNA may be single-stranded or double-stranded. In the present invention, single-stranded RNA is preferred. The term "single-stranded RNA" generally refers to embodiments in which a complementary nucleic acid strand (typically a complementary RNA strand; ie, no complementary RNA molecule) is associated with an RNA molecule.

보통 RNA는 DNA-서열의 전사에 의해, 예를 들어, 세포 내부에서 합성 가능할 수 있다. 진행 세포에서, 전사는 일반적으로 핵 또는 미토콘드리아 내부에서 수행된다. 생체 내에서(In vivo), 보통 DNA의 전사는 보통 mRNA로 약칭하는 소위 전령-RNA로 가공되어야 하는 소위 미성숙 RNA(premature RNA)로 된다. 예를 들어, 진핵 유기체에서 미성숙 RNA의 가공은 스플라이싱(splicing), 5'캡핑(capping), 아데닐산중합반응(polyadenylation), 핵 또는 미토콘드리아로부터 유출(export) 등의 다양한 상이한 전사 후-변형을 포함한다. 이들 가공의 합(sum)은 RNA의 성숙이라고 한다. Ordinary RNA can be synthesized by transcription of a DNA-sequence, for example inside a cell. In an advancing cell, transcription is usually carried out inside the nucleus or mitochondria. In vivo, transcription of DNA usually results in so-called premature RNA, which must be processed into so-called messenger-RNA, usually abbreviated as mRNA. For example, processing of immature RNA in eukaryotic organisms involves a variety of different post-transcriptional modifications, including splicing, 5' capping, polyadenylation, and export from the nucleus or mitochondria. includes The sum of these processes is called the maturation of the RNA.

성숙 전령 RNA는 보통 특정 펩타이드 또는 단백질의 아미노산 서열로 번역될 수 있는 뉴클레오타이드 서열을 제공한다. 일반적으로, 성숙 mRNA(mature mRNA)는 5'캡(cap), 선택적으로 5'UTR, 오픈 리딩 프레임, 선택적으로 3'UTR 및 폴리(A) 서열을 포함한다. 전령 RNA 이외에, 여러 비-코딩 유형의 RNA가 존재하며, 이는 전사 및/또는 번역의 조절과 관련될 수 있다. Mature messenger RNA usually provides a nucleotide sequence that can be translated into the amino acid sequence of a specific peptide or protein. Generally, a mature mRNA comprises a 5' cap, optionally a 5'UTR, an open reading frame, optionally a 3'UTR and a poly(A) sequence. In addition to messenger RNA, several non-coding types of RNA exist, which may be involved in the regulation of transcription and/or translation.

핵산 및 아미노산 서열에 관한 "변이체"는 임의의 변이체, 특히 돌연변이체, 바이러스 균주, 스플라이스 변이체, 입체배좌체, 이소형체, 대립형질 변이체, 종 변이체 및 종 상동체, 특히 자연적으로 존재하는 것들을 포함한다. 대립형질 변이체는 유전자의 정상 서열에서의 변경에 관한 것이고, 그 중요성은 종종 불분명하다. 완전한 유전자 시퀀싱은 종종 주어진 유전자에 대한 수많은 대립형질 변이체를 동정한다. 핵산 분자와 관련하여, "변이체"는 축퇴성 핵산 서열을 포함하며, 여기서 본 발명에 따른 축퇴성 핵산은 유전 암호의 축퇴성 때문에 코돈 서열에서 기준 핵산과 상이한 핵산이다. 종 상동체는 주어진 핵산 또는 아미노산 서열과는 다른 종의 기원을 갖는 핵산 또는 아미노산 서열이다. 바이러스 상동체는 주어진 핵산 또는 아미노산 서열과는 다른 바이러스의 기원을 갖는 핵산 또는 아미노산 서열이다."Variant" with respect to nucleic acid and amino acid sequences includes any variant, in particular mutants, virus strains, splice variants, conformations, isoforms, allelic variants, species variants and species homologues, especially those naturally occurring do. Allelic variants relate to alterations in the normal sequence of a gene, the importance of which is often unclear. Complete gene sequencing often identifies numerous allelic variants for a given gene. In the context of a nucleic acid molecule, "variant" includes a degenerate nucleic acid sequence, wherein a degenerate nucleic acid according to the invention is a nucleic acid that differs in codon sequence from a reference nucleic acid because of the degeneracy of the genetic code. A species homologue is a nucleic acid or amino acid sequence that has a species origin that differs from a given nucleic acid or amino acid sequence. A viral homologue is a nucleic acid or amino acid sequence that has a viral origin that differs from a given nucleic acid or amino acid sequence.

핵산 변이체는 기준 핵산과 비교하여 단일 또는 다중 뉴클레오타이드 결실, 첨가, 돌연변이, 및/또는 삽입을 포함한다. 결실은 기준 핵산으로부터 하나 이상의 뉴클레오타이드를 제거하는 것을 포함한다.Nucleic acid variants include single or multiple nucleotide deletions, additions, mutations, and/or insertions compared to a reference nucleic acid. Deletion includes removing one or more nucleotides from a reference nucleic acid.

첨가 변이체는 하나 이상의 뉴클레오타이드, 예컨대 1, 2, 3, 5, 10, 20, 30, 50개 이상의 뉴클레오타이드의 5' 및/또는 3'말단 융합체를 포함한다. 돌연변이는 치환을 포함할 수 있으나, 이에 한정되는 것은 아니며, 여기서 서열 중 적어도 하나의 뉴클레오타이드가 제거되고 적어도 하나의 다른 뉴클레오타이드가 그 자리에 삽입된다(예컨대 전환 및 전이). 돌연변이는 일염기 부위, 가교 부위, 및 화학적으로 변경되거나 변형된 염기를 포함한다. 삽입은 기준 핵산 내에 하나 이상의 뉴클레오타이드를 첨가하는 것을 포함한다.Additional variants include 5' and/or 3' terminal fusions of one or more nucleotides, such as 1, 2, 3, 5, 10, 20, 30, 50 or more nucleotides. Mutations may include, but are not limited to substitutions, wherein at least one nucleotide in the sequence is removed and at least one other nucleotide is inserted in its place (eg, conversions and transitions). Mutations include monobasic sites, bridging sites, and chemically altered or modified bases. Insertion involves adding one or more nucleotides within a reference nucleic acid.

특정 핵산 서열의 변이체는 상기 특정 서열의 하나 이상의 기능적 특성을 가지며, 상기 특정 서열, 예를 들어 특정 핵산 서열과 동일한 또는 유사한 특성을 나타내는 핵산 서열과 기능적으로 동등하다.A variant of a particular nucleic acid sequence has one or more functional properties of the particular sequence and is functionally equivalent to a nucleic acid sequence that exhibits the same or similar properties as the particular sequence, eg, a particular nucleic acid sequence.

유도체(derivative)는 뉴클레오타이드 염기, 당 또는 포스페이트 상에서 핵산의 여하한 화학적 유도화를 포함한다. "유도체"는 또한 자연적으로 발생하지 않는 뉴클레오타이드들 및 뉴클레오타이드 유사체들을 함유하는 핵산도 포괄한다. 핵산의 유도체화는 바람직하게는 그의 안정성을 증가시킨다.Derivatives include any chemical derivatization of nucleic acids on nucleotide bases, sugars or phosphates. "Derivatives" also encompass nucleic acids containing non-naturally occurring nucleotides and nucleotide analogs. Derivatization of a nucleic acid preferably increases its stability.

핵산 서열로부터 유래된 핵산 서열은 그것이 유래된 핵산의 변이체인 핵산을 지칭한다. 바람직하게는 RNA 분자 내 특정 서열을 대체하는 경우, 특정 서열에 대한 변이체인 서열은 RNA 안정성 및/또는 번역 효율을 유지한다.A nucleic acid sequence derived from a nucleic acid sequence refers to a nucleic acid that is a variant of the nucleic acid from which it is derived. Preferably, when replacing a specific sequence in an RNA molecule, a sequence that is a variant for that specific sequence maintains RNA stability and/or translation efficiency.

"폴리뉴클레오티드", "핵산 서열", "뉴클레오티드 서열" 또는 "핵산 단편"은 상호 호환적으로 합성, 비-천연 또는 변형된 뉴클레오티드 염기를 선택적으로 포함하는, 단일 가닥 또는 이중 가닥의 RNA 또는 DNA로 된 폴리머를 지칭하기 위해 사용된다. 핵산 분자의 서열은 일반적으로 특정하고 개별적인 순서, 즉 이의 뉴클레오타이드의 연속인 것으로 이해된다. 단백질 또는 펩타이드의 서열은 일반적으로 순서, 즉, 이의 아미노산의 연쇄(succession)인 것으로 이해된다."Polynucleotide", "nucleic acid sequence", "nucleotide sequence" or "nucleic acid fragment" are interchangeably termed single- or double-stranded RNA or DNA, optionally comprising synthetic, non-natural or modified nucleotide bases. It is used to refer to a polymer that has been The sequence of a nucleic acid molecule is generally understood to be a specific and discrete order, ie, a sequence of nucleotides thereof. The sequence of a protein or peptide is generally understood to be a sequence, ie a sequence of its amino acids.

서열 상동성: 둘 이상의 서열은 만약 그들이 뉴클레오타이드 또는 아미노산의 동일한 길이 및 순서를 나타낸다면 동일하다(상동성이 있다). 상동성의 백분율은 일반적으로 두 서열이 동일한 정도(extent)를 설명하며, 즉, 이는 일반적으로 그들의 서열 위치가 참조 서열(reference sequence)의 뉴클레오타이드와 상응하는 뉴클레오타이드의 백분율을 설명한다. 동일의 정도를 결정하기 위하여, 비교되는 서열은 동일한 길이, 즉, 비교될 서열의 가장 긴 서열의 길이를 나타내는 것으로 간주된다. 이는 8개 뉴클레오타이드로 이루어진 첫 번째 서열은 첫 번째 서열을 포함하는 10개 뉴클레오타이드로 이루어진 두 번째 서열과 80% 동일한 것을 의미한다. 다시 말하면, 본 발명에서, 서열의 동일은 바람직하게는 동일한 길이를 가지는 둘 이상의 서열에서 동일한 위치를 가지는 서열의 뉴클레오타이드의 백분율과 관련된다. 갭(gap)은 보통 정렬에서 이들의 실제위치와 관계없이, 비-동일 위치로 간주된다.Sequence homology: Two or more sequences are identical (there are homology) if they exhibit the same length and order of nucleotides or amino acids. Percentage of homology generally describes the extent to which two sequences are identical, ie, it generally describes the percentage of nucleotides whose sequence positions correspond to nucleotides in a reference sequence. For purposes of determining the degree of identity, the sequences being compared are considered to represent the same length, ie, the length of the longest sequence of the sequences being compared. This means that the first sequence of 8 nucleotides is 80% identical to the second sequence of 10 nucleotides comprising the first sequence. In other words, in the present invention, the identity of a sequence preferably relates to the percentage of nucleotides of the sequence having the same position in two or more sequences having the same length. Gaps are usually considered non-co-located, regardless of their actual position in alignment.

안정화된 핵산 분자: 안정화된 핵산 분자는 핵산 분자이며, 바람직하게는, 변형이 없는 핵산 분자보다, 예를 들어, 환경적 인자 또는 엑소- 또는 엔도뉴클레아제와 같은 효소 분해(digest)에 의한 붕괴(disintegration) 또는 분해(degradation)에 더 안정한, 그렇게 화학적 변형된 DNA 또는 RNA 분자이다. 안정화된 핵산 분자는 원핵 또는 진핵 세포, 인간 세포와 같은 포유동물 세포와 같은 세포에서 안정화되는 것이다. 안정화 효과는 또한 세포의 외부, 예를 들어, 버퍼 용액 등에서, 예를 들어, 안정화된 핵산 분자를 포함하는 약학적 조성물을 제조하는 공정에서 발휘될 수 있다.Stabilized Nucleic Acid Molecules: A stabilized nucleic acid molecule is a nucleic acid molecule, preferably degraded by an enzymatic digest such as, for example, an environmental factor or an exo- or endonuclease, rather than an unmodified nucleic acid molecule. A DNA or RNA molecule that has been chemically modified so that it is more stable to disintegration or degradation. A stabilized nucleic acid molecule is one that is stabilized in cells such as prokaryotic or eukaryotic cells, mammalian cells such as human cells. The stabilizing effect can also be exerted outside the cell, for example, in a buffer solution and the like, for example, in a process for preparing a pharmaceutical composition comprising a stabilized nucleic acid molecule.

이종 서열(Heterologous sequence): 일반적으로 두 서열은, 그들이 동일한 유전자로부터 이끌어낼 수 있는 것이 아니라면, '이종(heterologous)'으로 이해된다. 즉, 이종 서열은 동일한 유기체(organism)로부터 이끌어낼 수 있을 수 있지만, 그들은 동일한 mRNA에서와 같이, 동일한 핵산에서 자연적으로(자연에서) 발생하지 않는다.Heterologous sequence: In general, two sequences are understood to be 'heterologous' unless they can be derived from the same gene. That is, heterologous sequences may be derived from the same organism, but they do not occur naturally (in nature) in the same nucleic acid as in the same mRNA.

발현: RNA의 생산 또는 RNA 및 단백질의 생산을 포함한다. 이것은 또한 핵산의 부분적 발현을 포함한다. 뿐만 아니라, 발현은 일시적이거나 안정한 것일 수 있다. RNA와 관련하여, "발현" 또는 "번역"이라는 용어는 세포의 리포좀 내에서 메신저 RNA의 한 가닥이 아미노산 서열의 어셈블리를 지시하여 펩티드 또는 단백질을 만드는 프로세스에 관한 것이다. 유전자는 하나 이상의 세포 생성물을 생산하고/하거나 하나 이상의 세포 간 또는 세포 내 기능을 달성하기 위한 특정 핵산 서열을 지칭한다. 보다 구체적으로, 상기 용어는 특정 단백질 또는 기능적 또는 구조적 RNA 분자를 코딩하는 핵산을 포함하는 핵산 섹션(전형적으로 DNA이지만, RNA 바이러스의 경우에는 RNA이다)에 관한 것이다. mRNA는 메신저-RNA를 의미하며 전형적으로 DNA 주형을 이용하여 생성되고 펩티드 또는 단백질을 코딩하는 전사체에 관한 것이다. 전형적으로, mRNA는 5'UTR, 단백질 코딩 영역, 3'UTR, 및 폴리(A) 서열을 포함한다. mRNA는 DNA 주형으로부터 시험관내 전사에 의해 생성될 수 있다. 시험관내 전사 방법론은 통상의 기술자에게 잘 알려져 있는 것이다. 예를 들어, 시험관내 전사 키트가 시중에 다양하게 판매되고 있다. 본 발명에 따르면, mRNA는 변형 및 캡핑을 안정화시킴으로서 변형시킬 수도 있다. Expression : includes the production of RNA or the production of RNA and proteins. This also includes partial expression of nucleic acids. In addition, expression may be transient or stable. In the context of RNA, the term "expression" or "translation" relates to the process by which one strand of messenger RNA directs the assembly of amino acid sequences within the liposome of a cell to make a peptide or protein. A gene refers to a specific nucleic acid sequence for producing one or more cellular products and/or for achieving one or more intercellular or intracellular functions. More specifically, the term relates to a nucleic acid section (typically DNA, but RNA in the case of RNA viruses) comprising a nucleic acid encoding a particular protein or functional or structural RNA molecule. mRNA refers to messenger-RNA and typically relates to a transcript produced using a DNA template and encoding a peptide or protein. Typically, an mRNA comprises a 5'UTR, a protein coding region, a 3'UTR, and a poly(A) sequence. mRNA can be produced by in vitro transcription from a DNA template. In vitro transcription methodologies are well known to those skilled in the art. For example, a variety of in vitro transcription kits are available on the market. According to the present invention, mRNA can also be modified by stabilizing modification and capping.

오픈 리딩 프레임(Open reading frame): 일반적으로 펩타이드 또는 단백질로 번역될 수 있는 여러 뉴클레오타이드 트리플렛(triplets)의 서열일 수 있다. 오픈 리딩 프레임은 이의 5'말단 및 보통 다중 3개 뉴클레오타이드 길이를 나타내는 후속 영역(subsequent region)에 바람직하게는 시작 코돈, 즉, 보통 아미노산 메티오닌을 코딩하는 이후의 세 뉴클레오타이드의 조합(ATG 또는 AUG)을 함유한다. ORF는 바람직하게는 정지-코돈(예를 들어, TAA, TAG, TGA)에 의하여 종결된다. 일반적으로, 이는 오직 오픈 리딩 프레임의 정지-코돈이다. 따라서, 본 발명에서 오픈 리딩 프레임은 바람직하게는 시작 코돈(예를 들어, ATG 또는 AUG)으로 시작하고 바람직하게는 정지 코돈(예를 들어, TAA, TGA, 또는 TAG 또는 UAA, UAG, UGA, 각각)으로 종결되는 3으로 나뉘어질 수 있는 다수의 뉴클레오타이드로 이루어지는 뉴클레오타이드 서열이다. 오픈 리딩 프레임은 분리될 수 있거나 더 긴 핵산 서열, 예를 들어 벡터 또는 mRNA에 포함될 수 있다. 오픈리딩 프레임은 또한 "단백질 코딩 영역"으로 불리울 수 있다.Open reading frame: may be a sequence of several nucleotide triplets that can generally be translated into peptides or proteins. The open reading frame is preferably a start codon, i.e. a combination of the following three nucleotides (ATG or AUG), usually encoding the amino acid methionine, at its 5' end and a subsequent region, usually multiple 3 nucleotides in length. contains The ORF is preferably terminated by a stop-codon (eg TAA, TAG, TGA). In general, this is only the stop-codon of the open reading frame. Accordingly, in the present invention the open reading frame preferably begins with a start codon (eg ATG or AUG) and preferably with a stop codon (eg TAA, TGA, or TAG or UAA, UAG, UGA, respectively) ) is a nucleotide sequence consisting of a number of nucleotides that can be divided by three. The open reading frame may be isolated or may be incorporated into a longer nucleic acid sequence, such as a vector or mRNA. The open reading frame may also be referred to as a “protein coding region”.

바이시스트로닉 RNA, 멀티시스트로닉 RNA(Bicistronic RNA, multicistronic RNA): 바이시스트로닉 또는 멀티시스트로닉 RNA는 일반적으로 두 개의(바이시스트로닉) 또는 그 이상의(멀티시스트로닉) 오픈 리딩 프레임(ORF)를 가질 수 있는 RNA, 바람직하게는 mRNA 이다. 오픈 리딩 프레임은 펩타이드 또는 단백질로 번역될 수 있는 코돈의 서열이다.Bicistronic RNA, multicistronic RNA: Bicistronic or multicistronic RNA typically has two (bicistronic) or more (multicistronic) open reading frames (ORFs). RNA, preferably mRNA. An open reading frame is a sequence of codons that can be translated into a peptide or protein.

용어 "폴리(A) 서열" 또는 "폴리(A) 꼬리"는 전형적으로 RNA 분자의 3'말단에 위치하는 연속되거나 중단된 아데닐레이트 잔기 서열을 지칭한다. 연속적인 서열은 연속적인 아데닐레이트 잔기를 특징으로 한다. 사실상, 연속적인 폴리(A) 서열이 전형적인 것이다. 폴리(A) 서열은 전사 후 주형-독립적 RNA 중합효소에 의해 RNA의 자유 3'말단에 세포 핵에서 진핵세포 전사 중에 부착되지만, 통상적으로 진핵세포 DNA에서 암호화되지 않은 반면, 본 발명은 DNA에 의해 코딩된 폴리(A) 서열을 포함한다.The term "poly(A) sequence" or "poly(A) tail" refers to a sequence of contiguous or interrupted adenylate residues, typically located at the 3' end of an RNA molecule. Contiguous sequences are characterized by consecutive adenylate residues. In fact, a contiguous poly(A) sequence is typical. The poly(A) sequence is attached during eukaryotic transcription in the cell nucleus to the free 3' end of the RNA by template-independent RNA polymerase after transcription, but is usually not encoded in eukaryotic DNA, whereas the present invention relates to DNA and the encoded poly(A) sequence.

RNA, 예를 들어 mRNA와 같은 핵산은 펩티드 또는 단백질을 코딩할 수 있다. 따라서, 전사 가능한 핵산 서열 또는 그의 전사체는 펩티드 또는 단백질을 코딩하는 오픈 리딩 프레임(ORF)을 포함할 수 있다.A nucleic acid such as RNA, for example mRNA, may encode a peptide or protein. Thus, a transcribable nucleic acid sequence or transcript thereof may comprise an open reading frame (ORF) encoding a peptide or protein.

G/C 화학적 변형: G/C-화학적 변형된 핵산은 야생형 서열과 비교하여 증가된 수의 구아노신 및/또는 사이토신 뉴클레오타이드를 포함하는 화학적 변형된 야생형 서열에 기반한, RNA 분자일 수 있다. 이러한 증가된 수는 구아노신 또는 사이토신 뉴클레오타이드를 함유하는 코돈에 의해 아데노신 또는 티미딘 뉴클레오타이드를 함유하는 코돈의 치환에 의해 생성될 수 있다. 풍부한 G/C 함량이 DNA 또는 RNA의 코딩 영역에 발생하면, 이는 유전적 코드의 퇴화(degeneracy)를 사용한다. 따라서, 코돈 치환은 바람직하게는 코딩된 아미노산 잔기를 변형하지 않지만, 오로지 핵산 분자의 G/C 함량을 증가시킨다.G/C Chemical Modification: A G/C-chemically modified nucleic acid may be an RNA molecule, based on a chemically modified wild-type sequence comprising an increased number of guanosine and/or cytosine nucleotides compared to the wild-type sequence. This increased number can be produced by substitution of codons containing adenosine or thymidine nucleotides with codons containing guanosine or cytosine nucleotides. When abundant G/C content occurs in the coding region of DNA or RNA, this exploits the degeneracy of the genetic code. Thus, codon substitutions preferably do not modify the encoded amino acid residues, but only increase the G/C content of the nucleic acid molecule.

참조 RNA(Unmodified reference RNA): 자연에 존재하는 것과 같은 야생형 RNA 서열에 상응하는 RNA. 예를 들어, 비화학적 변형된 참조 mRNA는 자연적으로 발생하는 뉴클레오타이드를 포함하는 mRNA 서열에 상응하며, 자연적으로 발생하는 변형, 및/또는 자연적으로 발생하는 비번역 영역을 포함하는 뉴클레오타이드를 포함하고, 예컨대, 자연적으로 발생하는 5'캡(CAP) 구조 m7GpppN, 만약 자연적으로 발생하는 mRNA 서열에 존재한다면, 선택적으로 자연적으로 발생하는 5'UTR을 포함하고, 만약 자연적으로 발생하는 mRNA 서열 및 대략 30개 아데노신을 갖는 폴리 A 서열에 존재한다면, 야생형 오픈 리딩 프레임은, 선택적으로 자연적으로 발생하는 3'UTR을 포함한다.Unmodified reference RNA: RNA that corresponds to a wild-type RNA sequence as it exists in nature. For example, a non-chemically modified reference mRNA corresponds to an mRNA sequence comprising naturally occurring nucleotides and comprises nucleotides comprising a naturally occurring modification, and/or a naturally occurring untranslated region, such as , a naturally occurring 5' cap (CAP) structure m7GpppN, optionally comprising a naturally occurring 5'UTR, if present in the naturally occurring mRNA sequence, and if present in the naturally occurring mRNA sequence and approximately 30 adenosine The wild-type open reading frame, if present in the poly A sequence with

키메라 효소: 키메라 효소는 자연에서 발견되는 천연 효소가 아닌 효소를 지칭한다. 따라서, 키메라 효소는, 자연에서 발견된 것과는 상이한 방식으로 배열된, 상이한 공급원(예: 상이한 효소)으로부터 유래된 촉매 도메인 또는 동일한 공급원(예: 동일한 효소)으로부터 유래된 촉매 도메인을 포함할 수 있다. 키메라 효소는 단량체성(즉, 단일 단위) 효소 뿐만 아니라 올리고머성(즉, 복수 단위) 효소, 특히 헤테로-올리고머성 효소를 포함한다. 단량체성 효소는 단지 하나의 폴리펩티드 쇄로 이루어진 단일-단위 효소와 관련된다. Chimeric Enzyme : Chimeric enzyme refers to an enzyme that is not a natural enzyme found in nature. Thus, a chimeric enzyme may comprise catalytic domains derived from different sources (eg, different enzymes) or catalytic domains derived from the same source (eg, the same enzyme), arranged in a manner different from that found in nature. Chimeric enzymes include monomeric (ie single unit) enzymes as well as oligomeric (ie multiple unit) enzymes, particularly hetero-oligomeric enzymes. Monomeric enzymes refer to single-unit enzymes consisting of only one polypeptide chain.

단백질: 일반적으로 단백질은 하나 이상의 펩타이드 또는 폴리펩타이드를 포함한다. 일반적으로 단백질은 생물학적 기능을 발휘하는 단백질을 위해 요구될 수 있는 3차원 형태로 접힌다. Protein: In general, a protein comprises one or more peptides or polypeptides. In general, proteins fold into three-dimensional shapes that may be required for proteins to exert biological functions.

"폴리펩타이드", "펩타이드", "아미노산 서열" 및 "단백질"은 본 발명에서 상호 호환적으로 아미노산 잔기들로 된 폴리머를 지칭하기 위해 사용된다. 이들 용어는 하나 이상의 아미노산 잔기가 대응되는 천연 아미노산의 인공적인 화학 유사체인 아미노산 폴리머 뿐만 아니라 천연 아미노산 폴리머에도 적용된다. 용어 "폴리펩타이드", "펩타이드", "아미노산 서열" 및 "단백질"은 또한 비-제한적인 예로, 당화, 지질 결합, 황산화, 글루탐산 잔기의 감마-카르복시화, 하이드록시화 및 ADP-화라이보실화 (ribosylation) 등의 변형을 포함한다."Polypeptide", "peptide", "amino acid sequence" and "protein" are used herein interchangeably to refer to a polymer of amino acid residues. These terms apply to natural amino acid polymers as well as amino acid polymers in which one or more amino acid residues are artificial chemical analogs of the corresponding natural amino acid. The terms “polypeptide”, “peptide”, “amino acid sequence” and “protein” also include, but are not limited to, glycosylation, lipid binding, sulfation, gamma-carboxylation of glutamic acid residues, hydroxylation, and ADP-sulfation. Modifications such as ribosylation are included.

펩타이드: 일반적으로 펩타이드 또는 폴리펩타이드는 펩타이드 결합에 의해 연결된 아미노산 단량체의 폴리머이다. 이는 일반적으로 50 단량체 단위 미만으로 함유한다. 그렇지만, 용어 펩타이드는 50 단량체 단위를 초과하여 갖는 분자를 위한 권리를 포기하는 것은 아니다. 긴 펩타이드는 폴리펩타이드라고도 불리우며, 일반적으로 50 내지 600 단량체 단위를 갖는다.Peptide: Generally, a peptide or polypeptide is a polymer of amino acid monomers linked by peptide bonds. It generally contains less than 50 monomer units. However, the term peptide is not a waiver for molecules having more than 50 monomer units. Long peptides, also called polypeptides, generally have 50 to 600 monomer units.

"분리된 분자"는 다른 분자, 예컨대 다른 세포 물질이 실질적으로 존재하지 않는 분자를 의미한 다. "분리된 핵산"이라는 용어는 핵산이 (i) 시험관내, 예를 들면 중합효소 연쇄 반응(PCR)에 의해 증폭되거나, (ii) 클로닝에 의해 재조합적으로 생산되거나, (iii) 예를 들면 절단 및 겔-전기천공 분획화에 의해 정제되거나, 또는 또는 (iv) 예를 들어 화학 합성법에 의해 합성된 핵산을 의미한다. 분리된 핵산은 재조합 기술에 의해 조작 가능한 핵산이다.By “isolated molecule” is meant a molecule that is substantially free of other molecules, such as other cellular material. The term "isolated nucleic acid" means that the nucleic acid is (i) amplified in vitro, e.g., by polymerase chain reaction (PCR), (ii) produced recombinantly by cloning, (iii) e.g. cleaved and nucleic acids purified by gel-electroporation fractionation, or (iv) synthesized, for example, by chemical synthesis. An isolated nucleic acid is a nucleic acid that can be manipulated by recombinant techniques.

"인델"은 핵산에서 이중 가닥 브레이크 (DSB) 부위에 삽입되거나 결실된 다수의 뉴클레오티드로 이루어진 삽입/결실 돌연변이를 지칭한다."Indel" refers to an insertion/deletion mutation consisting of a plurality of nucleotides inserted or deleted at a double strand break (DSB) site in a nucleic acid.

"녹다운(knockdown)"은 특정 유전자 생성물 (예컨대, 단백질, mRNA 또는 둘 다)의 발현 감소를 지칭한다. 단백질의 녹다운은 (예컨대, 혈청 또는 세포 배지에서) 조직 또는 세포 집단에 의해 분비된 단백질을 검출하거나 관심있는 조직 또는 세포 집단으로부터 단백질의 총 세포량을 검출함으로써 측정될 수 있다. mRNA의 녹다운을 측정하는 방법은 공지되어 있으며, 관심 조직 또는 세포 집단으로부터 단리된 mRNA의 시퀀싱(sequencing)을 포함한다. "녹다운"은 특정 유전자 생성물의 발현의 일부 손실, 예를 들어, 전사된 mRNA의 양의 감소 또는 세포 집단(조직에서 발견되는 것과 같은 생체 내 집단 포함)에 의해 발현되거나 분비된 단백질의 양의 감소를 지칭할 수 있다."Knockdown" refers to a decrease in expression of a particular gene product (eg, protein, mRNA, or both). Knockdown of a protein can be measured by detecting the protein secreted by the tissue or cell population (eg, in serum or cell medium) or by detecting the total cellular amount of the protein from the tissue or cell population of interest. Methods for measuring knockdown of mRNA are known and include sequencing of mRNA isolated from a tissue or cell population of interest. "Knockdown" is a loss of some expression of a particular gene product, e.g., a decrease in the amount of transcribed mRNA or a decrease in the amount of a protein expressed or secreted by a cell population (including an in vivo population such as that found in tissues). can refer to

녹아웃(knockout은 세포에서 특정 단백질의 발현 손실을 지칭한다. 녹아웃은 (예컨대, 혈청 또는 세포 배지에서) 조직 또는 세포 집단으로부터 단백질 분비량을 검출하거나 단백질 조직 또는 세포 집단의 총 세포량을 검출함으로써 측정될 수 있다. 본 개시내용의 방법은 (예컨대, 조직에서 발견되는 것과 같은 생체 내 집단을 포함하는 세포 집단에서) 표적 단백질 하나 이상의 세포를 "녹아웃"시킨다. 일부 실시양태에서, 녹아웃은 예를 들어, 인델에 의해 생성된 표적 단백질의 돌연변이체의 형성이 아니라, 세포에서 표적 단백질 발현의 완전한 손실이다.Knockout refers to loss of expression of a specific protein in a cell. Knockout can be measured by detecting the amount of protein secretion from a tissue or cell population (eg, in serum or cell medium) or by detecting the total cell mass of the protein tissue or cell population. The method of the present disclosure "knocks out" one or more cells of the target protein (e.g., in a cell population comprising an in vivo population such as found in a tissue). In some embodiments, the knockout is, for example, It is not the formation of a mutant of the target protein produced by the indel, but a complete loss of target protein expression in the cell.

형질전환(Transfection): 용어 "형질전환"은 핵산 분자, DNA 또는 RNA(예를 들어, mRNA) 분자의 세포, 바람직하게는 진핵 세포 내로의 도입을 말한다. 본 발명에서, 용어 "형질전환"은 세포, 바람직하게는 포유동물 세포(mammalian cell)와 같은 진핵 세포 내로 핵산 분자를 도입하는 통상의 기술자에게 알려진 임의의 방법을 포함한다. 이러한 방법은, 예를 들어, 전기천공법(electroporation), 예를 들어, 양이온성 지질 및/또는 리포좀(liposome)에 기반한 리포펙션(lipofection), 칼슘 포스페이트 침전(calcium phosphate precipitation), 나노입자 기반의 형질전환, 바이러스 기반의 형질전환, 또는 DEAE-덱스트란 또는 폴리에틸렌이민 등과 같은 양이온성 폴리머에 기반한 형질전환을 포함한다. 바람직하게, 도입은 비-바이러스성이다. Transformation: The term "transfection" refers to the introduction of a nucleic acid molecule, DNA or RNA (eg mRNA) molecule into a cell, preferably a eukaryotic cell. In the present invention, the term "transformation" includes any method known to a person skilled in the art for introducing a nucleic acid molecule into a cell, preferably a eukaryotic cell such as a mammalian cell. Such methods include, for example, electroporation, for example cationic lipid and/or liposome-based lipofection, calcium phosphate precipitation, nanoparticle-based transformations, virus-based transformations, or transformations based on cationic polymers such as DEAE-dextran or polyethyleneimine. Preferably, the introduction is non-viral.

벡터: 가장 일반적인 의미로 사용되며, 예를 들어 상기 핵산을 원핵 및/또는 진핵 대상세포내로 도입시킬 수 있고, 적절한 경우, 유전체 내로 일체화할 수 있는, 여하한 중간체 운반체이 이에 포괄된다. 이러한 벡터는 바람직하게는 세포 내에서 전사 및/또는 발현된다. 벡터는 플라스미드, 파지미드, 바이러스 유전체 및 이들의 분획을 포함한다. 핵산 분자 (예, 플라스미드, 선형의 핵산 단편, RNA 등) 또는 단백질을 유기체에 "도입"하는 것은, 핵산 또는 단백질을 사용해 핵산 또는 단백질이 세포에서 기능하도록 유기체의 세포를 형질전환하는 것을 의미한다. 본 발명에서, "형질전환"은 안정적인 형질전환 및 일시적인 형질전환을 모두 포함한다. "안정적인 형질전환"은 외인성 뉴클레오티드 서열을 유전체에 도입하여, 외래 유전자의 안정적인 유전을 달성하는 것을 의미한다. 안정적으로 형질전환되면, 외인성 핵산 서열이 유기체 및 이의 연속 후속 세대의 유전체에 안정적으로 삽입된다. "일시적인 형질전환"은 핵산 분자 또는 단백질이 세포에 도입되어, 외인성 유전자가 안정적으로 유전되지 않으면서 그 기능을 수행하는 것을 의미한다. 일시적인 형질전환의 경우, 외인성 핵산 서열이 유전체에 삽입되지 않는다.Vector: Used in its most general sense, it encompasses, for example, any intermediate carrier capable of introducing said nucleic acid into a prokaryotic and/or eukaryotic subject cell and, where appropriate, integrating it into the genome. Such vectors are preferably transcribed and/or expressed in cells. Vectors include plasmids, phagemids, viral genomes and fragments thereof. By “introducing” a nucleic acid molecule (eg, a plasmid, a linear nucleic acid fragment, RNA, etc.) or protein into an organism, it is meant using the nucleic acid or protein to transform the cells of the organism so that the nucleic acid or protein functions in the cell. In the present invention, "transformation" includes both stable transformation and transient transformation. "Stable transformation" means introducing an exogenous nucleotide sequence into a genome to achieve stable inheritance of a foreign gene. When stably transformed, the exogenous nucleic acid sequence is stably inserted into the genome of the organism and its successive generations. "Transient transformation" means that a nucleic acid molecule or protein is introduced into a cell so that an exogenous gene performs its function without being stably inherited. In the case of transient transformation, no exogenous nucleic acid sequence is inserted into the genome.

담체/폴리머 담체: 본 발명에서, 담체는 일반적으로 또 다른 화합물(화물(cargo))의 수송 또는 복합화를 용이하게 하는 화합물일 수 있다. 폴리머 담체는 일반적으로 폴리머를 형성하는 담체이다. 담체는 이의 화물과 공유 또는 비-공유 상호작용에 의하여 연관될 수 있다. 담체는 표적 세포 내로 핵산, 예를 들어, RNA 또는 DNA를 수송할 수 있다. 담체는 양이온성 성분일 수 있다.Carrier/Polymer Carrier: In the present invention, the carrier may generally be a compound that facilitates transport or complexation of another compound (cargo). A polymeric carrier is generally a carrier from which a polymer is formed. A carrier may be associated with its cargo by covalent or non-covalent interactions. A carrier is capable of transporting a nucleic acid, eg, RNA or DNA, into a target cell. The carrier may be a cationic component.

양이온성 성분: 용어 "양이온성 성분"은 일반적으로 전하를 띤(charged) 분자를 말하며, 이는 일반적으로 1 내지 9, 바람직하게는 9 미만(예를 들어 5 내지 9), 또는 8 미만(예를 들어 5 내지 8), 또는 7 미만(예를 들어, 5 내지 7)의, 가장 바람직하게는 예를 들어 7.3 내지 7.4의 생리학적 pH 값의 양전하를(양이온) 띤다. 따라서, 양이온성 성분은 임의의 양전하를 띤 화합물 또는 폴리머, 바람직하게는 생리학적 조건하에서, 특히 생체 내(in vivo) 생리학적 조건 하에서 양전하를 띤, 양이온성 펩타이드 또는 단백질일 수 있다. '양이온성 펩타이드 또는 단백질'은 적어도 하나의 양전하를 띤 아미노산 또는 하나 이상의 양전하를 띤 아미노산, 예를 들어 Arg, His, Lys 또는 Orn 로부터 선택된 것을 함유할 수 있다. 따라서, '다중양이온성' 화합물 또한 주어진 조건하에서 하나 이상의 양전하를 보이는 범위 내이다.Cationic component: The term “cationic component” refers to a molecule that is generally charged, which is generally 1 to 9, preferably less than 9 (eg 5 to 9), or less than 8 (eg for example 5 to 8), or less than 7 (eg 5 to 7), most preferably positively charged (cation) at a physiological pH value of eg 7.3 to 7.4. Thus, the cationic component may be any positively charged compound or polymer, preferably a cationic peptide or protein, which is positively charged under physiological conditions, in particular in vivo physiological conditions. A 'cationic peptide or protein' may contain at least one positively charged amino acid or one or more positively charged amino acids, for example selected from Arg, His, Lys or Orn. Thus, 'polycationic' compounds are also within the range that exhibit more than one positive charge under the given conditions.

비히클(Vehicle): 비히클은 일반적으로 약학적 활성 화합물(pharmaceutically active compound)과 같은 화합물을 저장, 운반, 및/또는 투여하기 위한 적절한 물질로 이해된다. 예를 들어, 이는 약학적 활성 화합물을 저장, 운반 및/또는 투여하기 위한 적절한 생리학적으로 허용가능한 지질일 수 있다.Vehicle: A vehicle is generally understood to be a material suitable for storing, transporting, and/or administering a compound, such as a pharmaceutically active compound. For example, it may be a physiologically acceptable lipid suitable for storage, transport and/or administration of a pharmaceutically active compound.

약학적 유효량(Pharmaceutically effective amount): 본 발명에서, 약학적 유효량은 일반적으로 발현된 펩타이드 또는 단백질의 병리학적 수준을 대체하는, 또는 결여 유전자 산물(lacking gene product)을 치환하는, 예를 들어, 병리학적 상황의 경우에 면역 반응과 같은 약학적 효과를 유도하기 위하여 충분한 양으로 이해된다. Pharmaceutically effective amount : In the present invention, a pharmaceutically effective amount is generally used to replace a pathological level of an expressed peptide or protein, or to replace a missing gene product, e.g., a pathology. It is understood as an amount sufficient to induce a pharmaceutical effect, such as an immune response, in the case of adverse circumstances.

본 발명에서 기술되는 유전체 편집 RNA/DNA 시스템의 전달체은 하나 이상의 폴리펩티드(예: 독소, 리간드, 수용체, 시토카인, 항체 등 또는 이의 조합)와 융합 또는 연합된다. 본 발명에서 기술되는 유전체 편집 시스템의 전달체는 당업계에 공지된 반감기 연장 비히클을 포함할 수도 있다. 이러한 비히클은, 이로 제한됨이 없이, 폴리에틸렌 글리콜, 글리코겐(예: 항원 결합 단백질의 당화) 및 덱스트란을 포함한다. The carrier of the genome editing RNA/DNA system described herein is fused or associated with one or more polypeptides (eg, toxins, ligands, receptors, cytokines, antibodies, etc. or combinations thereof). The delivery system of the genome editing system described herein may include a half-life extending vehicle known in the art. Such vehicles include, but are not limited to, polyethylene glycol, glycogen (eg, glycosylation of antigen binding proteins) and dextran.

본 발명의 유전체 편집 전략은 예를 들어 살아있는 세포 또는 유기체의 특정 유전자좌에 표적화된 유전체 서열 변화를 도입함으로써 유전자 기능을 연구하고 질환을 퇴치하기 위한 강력한 수단을 위한 유망한 방법이 있다. 현재 사용되는 유전체 편집은 아연 핑거 뉴클레아제(ZFN), 전사 활성화제-유사 이펙터 뉴클레아제(TALEN), 클러스터링된 일정 간격 분포의 짧은 팔린드롬 반복물(CRISPR)-연합된(Cas) 뉴클레아제, 알고너트 엔도뉴클레아제및 M-MLV 역전사 효소와 Cas9 H840A nickase의 융합 단백질을 이용한 방법들이 많은 실험실에 의해 효과적으로 사용되고 있다. The genome editing strategy of the present invention is a promising method for studying gene function and as a powerful means to combat disease, for example by introducing targeted genomic sequence changes to specific loci in living cells or organisms. Currently used genome editing includes zinc finger nucleases (ZFNs), transcriptional activator-like effector nucleases (TALENs), clustered, spaced-distributed short palindromic repeats (CRISPR)-associated (Cas) nucleases. First, methods using a fusion protein of algonut endonuclease and M-MLV reverse transcriptase and Cas9 H840A nickase have been effectively used by many laboratories.

본 발명의 유전체 편집 전략은 예를 들어 살아있는 세포 또는 유기체의 특정 유전자좌에 표적화된 유전체 서열 변화를 도입함으로써 유전자 기능을 연구하고 질환을 퇴치하기 위한 강력한 수단을 위한 유망한 방법이 있다. The genome editing strategy of the present invention is a promising method for studying gene function and as a powerful means to combat disease, for example by introducing targeted genomic sequence changes to specific loci in living cells or organisms.

유전체 편집 목적으로 하나 이상의 폴리펩티드를 코딩하는 유전체 편집 도구의 도입은 수년 동안 생물 의학 연구의 목표였다. 종래 기술에서는 표적 세포 또는 유기체로 유전체 편집 도구 전달에 대한 접근법을 개시하고 있지만, 핵산 분자 및/또는 전달 시스템의 유형이 다르다. 데옥시리보핵산(DNA) 분자의 사용과 관련된 안전 문제에 의해 영향을 받으면서, 최근 몇 년간 리보핵산(RNA) 분자가 주목을 받고 있다. 네이키드된 RNA의 형태로, 또는 복합체 또는 포장된 형태로, 예를 들면, 비바이러스성 또는 바이러스성 운반체에 단일가닥 RNA 또는 이중가닥 RNA의 투여를 포함하는 다양한 접근법이 제안되어왔다. The introduction of genome editing tools that encode one or more polypeptides for genome editing purposes has been a goal of biomedical research for many years. While the prior art discloses approaches to the delivery of genome editing tools to target cells or organisms, the types of nucleic acid molecules and/or delivery systems are different. Ribonucleic acid (RNA) molecules have received attention in recent years, influenced by the safety concerns associated with the use of deoxyribonucleic acid (DNA) molecules. Various approaches have been proposed, including administration of single-stranded RNA or double-stranded RNA in the form of naked RNA, or in complex or packaged form, for example, to a non-viral or viral carrier.

바이러스 및 바이러스성 전달 운반체에서, 유전체 편집 도구는 전형적으로 단백질 및/또는 지질 (바이러스 입자)에 의해 캡슐화된다. 예를 들어, RNA 바이러스 유래의 조작된 RNA 바이러스 입자는 유전체 편집을 하기 위한 전달 운반체로서 제안되어왔다.In viruses and viral delivery vehicles, genome editing tools are typically encapsulated by proteins and/or lipids (viral particles). For example, engineered RNA virus particles from RNA viruses have been proposed as delivery vehicles for genome editing.

본 발명의 유전자 편집 RNA/DNA 시스템의 다른 실시형태 및 장점이 이하에서 설명된다.Other embodiments and advantages of the gene editing RNA/DNA system of the present invention are described below.

본 발명의 유전체 편집 RNA/DNA 시스템은, 세포 내 적어도 하나의 내인성 유전체 편집을 하고 전사가 가능한 구성 성분이 있는 유전체 편집 RNA/DNA 시스템(도 3)으로서, The genome editing RNA/DNA system of the present invention is a genome editing RNA/DNA system (FIG. 3) having at least one endogenous genome editing and transcription-capable component in a cell,

세포내 번역이 가능한 구조를 갖추고 화학적 변형된 뉴클레오타이드(CM)를 포함하는 DNA dependent RNA Polymerase(DdRp) mRNA(캡된 CM_DdRp mRNA)를 포함하는 DdRp RNA 발현 카세트; 및 DdRp RNA expression cassette comprising DNA dependent RNA Polymerase (DdRp) mRNA (capped CM_DdRp mRNA) having a structure capable of intracellular translation and comprising chemically modified nucleotides (CM); and

DdRp에 의해 트랜스로 전사될 수 있는 유전체 편집 도구를 코딩하는 DNAge 발현 카세트;를 포함하는 RNA/DNA 시스템을 제공하고,It provides an RNA / DNA system comprising a; DNAge expression cassette encoding a genome editing tool that can be transcribed in trans by DdRp,

여기서, 상기 DdRp에 의해 전사될 수 있는 DNAge 발현 카세트는 유전체 편집을 수행하는 표적화 엔도뉴클레아제를 코딩하는 DNAen 발현 카세트 및 가이드 핵산를 코딩하는 DNAsg 발현 카세트로 구성될 수 있다.Here, the DNAge expression cassette capable of being transcribed by DdRp may be composed of a DNAen expression cassette encoding a targeting endonuclease that performs genome editing and a DNAsg expression cassette encoding a guide nucleic acid.

본 발명의 유전체 편집 RNA/DNA 시스템은 적어도 2개의 핵산 발현 카세트를 포함한다. 따라서, 2개 이상, 3개 이상, 4개 이상, 5개 이상, 6개 이상, 7개 이상, 8개 이상, 9개 이상 또는 10개 이상의 핵산 분자를 포함할 수 있다. The genome editing RNA/DNA system of the present invention comprises at least two nucleic acid expression cassettes. Thus, it may comprise 2 or more, 3 or more, 4 or more, 5 or more, 6 or more, 7 or more, 8 or more, 9 or more, or 10 or more nucleic acid molecules.

상기 표적을 달성하기 위한 본 발명의 다른 하나로, As another aspect of the present invention for achieving the above target,

상기 RNA/DNA 시스템은 추가적으로 상기 DdRp mRNA의 자가전사를 위해서 DdRp가 결합할 수 있는 프로모터와 DdRp를 코딩하는 DNA를 포함하는 auto_DdRp 발현 카세트;를 포함하고, 이들이 작동 가능하게 연결되어 구성되는 것을 특징으로 하는 RNA/DNA 시스템을 제공한다. The RNA / DNA system additionally comprises an auto_DdRp expression cassette comprising a promoter capable of binding to DdRp for self-transcription of the DdRp mRNA and DNA encoding DdRp; It provides an RNA/DNA system that does this.

상기 표적을 달성하기 위한 본 발명의 다른 하나로, As another aspect of the present invention for achieving the above target,

캡된 CM_DdRp mRNA를 포함하는 DdRp RNA 발현 카세트; 및 DdRp RNA expression cassette comprising capped CM_DdRp mRNA; and

DdRp mRNA의 자가전사를 위해서 DdRp가 결합할 수 있는 프로모터와 DdRp를 코딩하는 DNA를 포함하는 auto_DdRp 및 상기 DdRp에 의해 전사되는 유전체 편집 도구를 코딩하는 DNAge를 포함하는 auto_(DdRp+DNAge) 발현 카세트;를 포함하고, 이들이 작동 가능하게 연결되어 구성되는 것을 특징으로 하는 발현 RNA/DNA 시스템을 제공한다. For self-transcription of DdRp mRNA, auto_DdRp containing a promoter capable of binding to DdRp and DNA encoding DdRp, and an auto_(DdRp+DNAge) expression cassette containing a DNAge encoding a genome editing tool transcribed by the DdRp; It provides an expression RNA / DNA system comprising a, characterized in that they are configured to be operably linked.

여기서, 상기 캡된 CM_DdRp mRNA, auto_DdRp 발현 카세트, DNAge 발현 카세트 또는 auto_(DdRp+DNAge) 발현 카세트는 염기서열 변형(SM)을 적어도 하나를 포함할 수 있다.Here, the capped CM_DdRp mRNA, auto_DdRp expression cassette, DNAge expression cassette, or auto_(DdRp+DNAge) expression cassette may include at least one nucleotide sequence modification (SM).

본 발명의 목적을 발성하기 위해서, <표 1>의 DdRp에서 한 개의 서브유닛으로 구성되고 효소 활성에 다른 보조요소가 필요없는 박테리오파지 T7, T3 및 SP6에 의해 코딩된 DdRp를 선정하였다. In order to utter the object of the present invention, the DdRp encoded by the bacteriophages T7, T3 and SP6 that is composed of one subunit and does not require other auxiliary elements for enzymatic activity in DdRp of <Table 1> was selected.

본 발명의 auto_DdRp 발현카세트의 DdRp는 DdRp 그 자가, 또는 RNA 트리포스파타제(RNA triphosphatase)의 촉매 도메인, 구아닐릴트랜스퍼라제(guanylyltransferase)의 촉매 도메인, N7-구아닌 메틸트랜스퍼라제(N7-guanine methyltransferase) 및 DdRp(DNA-dependant RNA polymerase)의 촉매 도메인을 포함하는 키메라 효소일 수 있으며, 진핵세포 번역 장치에 의해 고도로 해독 가능한 5'말단 m7GpppN 캡을 갖는 RNA 분자를 합성하여 제공하는 방법을 제공할 수도 있다. DdRp of the auto_DdRp expression cassette of the present invention is DdRp itself, or the catalytic domain of RNA triphosphatase, the catalytic domain of guanylyltransferase, N7-guanine methyltransferase, and It may be a chimeric enzyme comprising a catalytic domain of DNA-dependent RNA polymerase (DdRp), and a method for synthesizing and providing an RNA molecule having a 5'-terminal m7GpppN cap highly translatable by a eukaryotic translation apparatus may be provided.

본 발명에서 T7 RNA 폴리머라제(polymerase)는 박테리오파지 T7 유래의 약 20 염기쌍으로 구성된 파지 고유의 프로모터 배열을 인식하는 RNA 중합효소로, 5'말단에서 3'말단 방향으로 DNA로부터 RNA의 합성을 촉매하는 효소이다. 구체적으로, 다양한 세포 내 보조인자(cofactor)들을 필요로 하는 진핵생물의 RNA 폴리머라제와는 다르게, T7 RNA 폴리머라제는 추가적인 세포 내 보조인자가 없이도 전사를 일으킬 수 있다는 장점이 있다. 또한, 진핵생물의 세포 내에는 T7 프로모터에 특이성을 가지는 다른 RNA 폴리머라제가 존재하지 않기 때문에 T7 프로모터/T7 RNA 폴리머라제를 이용하는 전사 시스템은 세포 내 다른 전사시스템의 간섭을 받지도 않을 뿐만 아니라, 다른 전사 시스템에 간섭을 일으키지도 않는다. 반면, T7 프로모터와 동일한 RNA 폴리머라제 III 타입에 속하는 다른 프로모터들, 예를 들면 U1 프로모터 혹은 H1 프로모터들은 세포 내에 이미 존재하고 있기 때문에 T7 프로모터가 갖는 이러한 간섭을 일으키지 않는 특성을 가지지 못하며, 본 발명 전사 시스템상 전사를 제어하기에 적당하지 못하다. 보다 구체적으로, 본 발명의 T7 RNA 폴리머라제 mRNA 단편은 서열번호 1의 염기서열로 구성되는 것일 수 있으나, 이에 제한되지 않는다.In the present invention, T7 RNA polymerase (polymerase) is an RNA polymerase that recognizes a phage-specific promoter sequence consisting of about 20 base pairs derived from bacteriophage T7, and catalyzes the synthesis of RNA from DNA in the 5' to 3' end direction. is an enzyme Specifically, unlike eukaryotic RNA polymerase, which requires various intracellular cofactors, T7 RNA polymerase has the advantage of being able to induce transcription without additional intracellular cofactors. In addition, since there is no other RNA polymerase specific for the T7 promoter in the cell of eukaryotes, the transcription system using the T7 promoter/T7 RNA polymerase does not receive interference from other transcription systems in the cell as well as other transcription systems. It does not interfere with the system. On the other hand, other promoters belonging to the same RNA polymerase III type as the T7 promoter, for example, the U1 promoter or the H1 promoter, do not have the property of not causing such interference of the T7 promoter because they already exist in the cell, and the transcription of the present invention The system is not suitable for controlling transcription. More specifically, the T7 RNA polymerase mRNA fragment of the present invention may be composed of the nucleotide sequence of SEQ ID NO: 1, but is not limited thereto.

또한, 본 발명의 T7 RNA 폴리머라제 mRNA를 포함하는 DdRp RNA 발현 카세트는 5'cap 구조를 추가로 포함하는 것일 수 있다. 상기 5'cap 구조는 대부분의 진핵세포와 바이러스의 mRNA의 5'말단에 존재하는 7-메틸구아노신(7-methylguanosine)을 의미하는 것으로, mRNA가 라이보핵산분해효소(ribonuclease, RNase)에 의해 분해되는 것을 막아주며, 세포질에서는 번역개시인자와 결합하여 리보솜 결합 위치로 작용할 수 있다. 일반적으로 세포질 내 전사체(cytoplasmic transcript)는 핵 전사체(nuclear transcript)가 필수적으로 가지는 5'cap 구조가 없기 때문에 리보솜에 의한 번역 효율이 떨어진다는 문제점을 가진다. 이에, 본 발명은 5'cap 구조를 갖는 T7 RNA 폴리머라제 mRNA 단편을 사용하여 세포내 안정성 및 세포질 내 번역 효율을 높일뿐 만 아니라, 기존에 핵-의존적 mRNA 발현을 위해 사용된 발현 카세트 DNA의 낮은 핵막 투과의 한계점을 극복하여, 세포질 내에 효과적으로 초기 T7 RNA 폴리머라제를 제공할 수 있는 것을 특징으로 한다.In addition, the DdRp RNA expression cassette containing the T7 RNA polymerase mRNA of the present invention may further include a 5'cap structure. The 5'cap structure refers to 7-methylguanosine present at the 5' end of mRNA of most eukaryotic cells and viruses, and mRNA is produced by ribonuclease (RNase). It prevents degradation, and in the cytoplasm, it can bind to a translation initiator and act as a ribosome binding site. In general, the cytoplasmic transcript has a problem in that the translation efficiency by the ribosome is lowered because there is no 5'cap structure essential to the nuclear transcript. Accordingly, the present invention uses a T7 RNA polymerase mRNA fragment having a 5'cap structure to not only increase intracellular stability and intracytoplasmic translation efficiency, but also lower the expression cassette DNA previously used for nuclear-dependent mRNA expression. It is characterized in that it can effectively provide early T7 RNA polymerase in the cytoplasm by overcoming the limitation of nuclear membrane permeation.

본 발명에서는, 5′-cap 구조 및 CM를 포함하는 T7 RNA 폴리머라제 mRNA 을 포함하는 DdRp RNA 발현 카세트를 합성하기 위해, 먼저 T7 프로모터-T7 폴리머라제 서열을 갖는 dsDNA 단편을 화학합성법에 의하여 합성하고(Bioneer), 이러한 T7 프로모터-T7 폴리머라제 DNA 단편에 대하여 5′cap 구조를 갖고 CM를 포함하는 T7 폴리머라제 mRNA를 시험관 내에서 합성하였다. 상기 5′cap 구조 및 CM를 포함하는 T7 폴리머라제 mRNA는 생체내 안정성을 확보하여 오랜 동안 존재할 수 있다.In the present invention, in order to synthesize a DdRp RNA expression cassette containing a T7 RNA polymerase mRNA containing a 5′-cap structure and a CM, a dsDNA fragment having a T7 promoter-T7 polymerase sequence is first synthesized by chemical synthesis. (Bioneer), T7 polymerase mRNA having a 5'cap structure and CM-containing T7 promoter-T7 polymerase DNA fragment was synthesized in vitro. T7 polymerase mRNA including the 5'cap structure and CM can exist for a long time by securing in vivo stability.

본 발명의 DdRp에 의해 전사되는 RNA를 코딩하는 DdRp RNA 발현 카세트는 T7프로모터, RNA를 코딩하는 DNA, 폴리 아데닌 꼬리(poly A tail) 및 T7 종결서열,을 포함하며, 이들이 작동 가능하게 연결되어 구성된 것일 수 있다.The DdRp RNA expression cassette encoding the RNA transcribed by DdRp of the present invention comprises a T7 promoter, a DNA encoding the RNA, a poly adenine tail (poly A tail) and a T7 termination sequence, and these are operably linked it could be

본 발명에서 상기 T7 RNA 폴리머라제 mRNA를 포함하는 RNA 발현카세트의 산물에 의해 상기 T7 프로모터가 있는 T7 RNA 폴리머라제 mRNA를 코딩하는 auto_DdRp DNA 발현카세트 또는 T7 프로모터가 있는 DNAge 발현카세트도 전사되어 증폭되는 것으로, 특정 RNA의 발현에 제한없이 포함될 수 있다. 본 발명에 있어서, T7 RNA 폴리머라제는 T7 프로모터에 대한 특이성이 매우 높으며, T7 프로모터 하류의 DNA만을 전사할 수 있다. In the present invention, by the product of the RNA expression cassette containing the T7 RNA polymerase mRNA, the auto_DdRp DNA expression cassette encoding the T7 RNA polymerase mRNA having the T7 promoter or the DNAge expression cassette having the T7 promoter are also transcribed and amplified. , may be included without limitation in the expression of a specific RNA. In the present invention, T7 RNA polymerase has very high specificity for the T7 promoter, and can transcribe only DNA downstream of the T7 promoter.

따라서, 본 발명에서 T7 RNA 폴리머라제를 사용함으로써 세포 내에 다른 프로모터와 반응하지 않고 오직 T7 프로모터를 갖는 mRNA를 코딩하는 DNA에 결합 및 전사를 수행하게 되고, 높은 효율로 RNA를 전사하여 증폭할 수 있다.Therefore, by using the T7 RNA polymerase in the present invention, it does not react with other promoters in the cell and binds and transcribes the DNA encoding the mRNA having only the T7 promoter, and RNA can be transcribed and amplified with high efficiency. .

기존 발현 카세트, plasmid 또는 바이러스 시스템은 핵 의존성으로 핵에 있는 도구를 사용하여 전사를 하여 기존 발현 카세트는 핵까지 이동해야 한다. 그런데, 세포막을 통해 도입된 발현 카세트의 1% 미만이 핵으로 이동하는 단점이 있다. Existing expression cassettes, plasmids, or viral systems are nuclear-dependent, requiring transcription using a tool located in the nucleus, so that the existing expression cassette must be transported to the nucleus. However, there is a disadvantage in that less than 1% of the expression cassette introduced through the cell membrane moves to the nucleus.

본 발명의 발현 발현 RNA/DNA 시스템은 <도 3>에서 제시하는 내용처럼 세포질에서 전사 도구를 구성하여 사용함으로써 핵으로 이동 효율의 단점을 극복하고자한다. The expression expression RNA/DNA system of the present invention seeks to overcome the disadvantage of efficiency of transfer to the nucleus by constructing and using a transcription tool in the cytoplasm as shown in <Fig. 3>.

<도 4>에서처럼, 본 발명의 유전체 편집 RNA/DNA 시스템은 다양한 구성성분을 조합하여 여러 형태의 발현 카세트를 설계, 제조할 수 있으며As shown in <Fig. 4>, the genome editing RNA / DNA system of the present invention can design and manufacture various types of expression cassettes by combining various components,

본 발명은 2개의 핵산 발현 카세트로, DdRp RNA 발현 카세트; 및 유전체 편집 도구를 코딩하는 DNAge 발현 카세트 중 어느 하나를 포함하는 시스템을 제공한다. The present invention provides two nucleic acid expression cassettes, a DdRp RNA expression cassette; and a DNAge expression cassette encoding a genome editing tool.

본 발명은 3개의 핵산 발현 카세트로, DdRp RNA 발현 카세트, 표적화 엔도뉴클레아제를 코딩하는 DNAen 발현 카세트 및 sgRNA를 코딩하는 DNAsg 발현 카세트를 각각 별도로 구성하는 DNAge 발현 카세트를 포함하는 시스템을 제공할 수도 있다.The present invention may also provide a system comprising a DNAge expression cassette comprising three nucleic acid expression cassettes, each separately comprising a DdRp RNA expression cassette, a DNAen expression cassette encoding a targeting endonuclease, and a DNAsg expression cassette encoding an sgRNA. have.

본 발명의 유전체 편집 RNA/DNA 시스템을 구성하는 DdRp RNA 발현 카세트는 세포질에 있는 RNA에서 단백질 합성에 필요한 도구를 통해 DdRp를 합성한다. 본 발명의 DNAge 발현 카세트에 있는 프로모터에 합성된 DdRp가 결합하여 세포질에서 유전체 편집에 필요한 도구를 전사 및 합성한다. 핵 비의존성으로 합성된 유전체 편집 도구는 유전체 편집이 가능한 복합체를 형성하고 핵으로 이동하여 효율적으로 유전체 편집이 진행할 수 있다. 따라서, 본 발명의 유전체 편집 RNA/DNA 시스템에 의해 도입 대상세포 또는 대상 유기체에서 유전체 편집이 가능해진다.The DdRp RNA expression cassette constituting the genome editing RNA/DNA system of the present invention synthesizes DdRp through a tool necessary for protein synthesis from RNA in the cytoplasm. The synthesized DdRp binds to the promoter in the DNAge expression cassette of the present invention to transcribe and synthesize tools necessary for genome editing in the cytoplasm. The nuclear-independent synthesized genome editing tool forms a complex capable of genome editing and moves to the nucleus, enabling efficient genome editing. Accordingly, genome editing in a target cell or target organism is made possible by the genome editing RNA/DNA system of the present invention.

기존 유전체 편집 방법은 CRISPR plasmid 방법, Cas 단백질과 sgRNA를 코딩하는 mRNA 방법, 그리고 Cas 단백질과 sgRNA로 이루어진 ribonucleoprotein(RNP) 복합체 방법이 있다. Cas 단백질과 sgRNA를 코딩하는 DNA 절편을 포함하는 CRISPR/Cas9 plasmid 유전체 편집 방법에서 유전체 편집 도구를 코딩하는 CRISPR/Cas9 plasmid는 핵 의존성으로 핵에 있는 도구를 사용하여 전사를 하여 CRISPR/Cas9 plasmid는 핵까지 이동해야 한다. 그런데, 세포막을 통해 도입된 CRISPR/Cas9 plasmid의 1% 미만이 핵으로 이동하는 단점이 있어, Existing genome editing methods include CRISPR plasmid method, mRNA method encoding Cas protein and sgRNA, and ribonucleoprotein (RNP) complex method consisting of Cas protein and sgRNA. CRISPR/Cas9 plasmid containing DNA fragment encoding Cas protein and sgRNA In the genome editing method, the CRISPR/Cas9 plasmid encoding the genome editing tool is nuclear-dependent and transcribed using a tool located in the nucleus. must move to However, there is a disadvantage that less than 1% of the CRISPR/Cas9 plasmid introduced through the cell membrane moves to the nucleus,

<도 5>에서처럼, 본 발명의 유전체 편집 RNA/DNA 시스템은 세포질에서 전사 도구를 구성하여 사용함으로써 이런 문제를 극복하고자한다.As shown in <Fig. 5>, the genome editing RNA/DNA system of the present invention attempts to overcome this problem by constructing and using a transcription tool in the cytoplasm.

본 발명은 본 발명에 따른 DdRp RNA 발현 카세트 및 DNAge 발현 카세트, 또는 이들 모두를 코딩하는 핵산 서열을 포함하는 DNA를 제공한다.The present invention provides a DNA comprising a nucleic acid sequence encoding a DdRp RNA expression cassette and a DNAge expression cassette, or both, according to the present invention.

여기서, 상기 DdRp RNA 발현 카세트는 RNA 가닥에 존재하며, DNAge 발현 카세트는 서로 다른 DNA 가닥에 존재하면서, 상기 DNAge 발현 카세트는 DdRp에 의한 트랜스(trans action)로 전사될 수 있다.Here, the DdRp RNA expression cassette is present in the RNA strand, and the DNAge expression cassette is present in different DNA strands, and the DNAge expression cassette may be transcribed in trans action by DdRp.

바람직하게, 상기 DdRp에 의해 전사될 수 있는 DNAge 발현 카세트는 표적화 엔도뉴클레아제를 코딩하는 DNAen 및 선택된 유전체의 특정 표적화 염기서열에 관련된 RNA를 코딩하는 DNAsg포함하는 군에서 선택되어진 1종 이상이다.Preferably, the DNAge expression cassette capable of being transcribed by the DdRp is at least one selected from the group comprising DNAen encoding a targeting endonuclease and DNAsg encoding RNA related to a specific targeting nucleotide sequence of a selected genome.

여기서, 상기 DNAge 발현 카세트에 상기 선택된 유전체의 특정 표적화 염기서열에 관련된 DNA와 함께, 추가적으로 외부에서 인공적으로 합성된 선택된 유전체의 특정 표적화 염기서열에 관련된 RNA를 세포내로 주입될 수도 있거나, 또는 대신에 외부에서 인공적으로 합성된 선택된 유전체의 특정 표적화 염기서열에 관련된 DNA를 세포내로 주입될 수도 있다.Here, in the DNAge expression cassette, together with the DNA related to the specific targeting sequence of the selected genome, RNA related to the specific targeting sequence of the selected genome artificially synthesized from the outside may also be injected into the cell, or instead externally DNA related to a specific targeting nucleotide sequence of a selected genome artificially synthesized in a cell may be injected into the cell.

본 발명은 본 발명에 따른 DdRp RNA 발현 카세트, 그리고 DNAge 발현 카세트를 포함하는 유전체 편집 RNA/DNA 시스템에 추가적으로 상기 DdRp에 의해 전사되는 DdRp를 코딩하는 DNA 절편이 포함된 auto-DdRp 발현 카세트를 제공할 수 있다. auto-DdRp 발현 카세트는 DdRp RNA 발현 카세트로부터 합성된 DdRp에 의해 상기 DdRp가 결합하는 프로모터 하류에 있는 DdRp DNA 절편이 반복적인 자가전사를 하는 DdRp 발현 루프(loop)를 실행할 수 있다.The present invention provides an auto-DdRp expression cassette comprising a DNA fragment encoding DdRp transcribed by the DdRp in addition to the genome editing RNA/DNA system comprising the DdRp RNA expression cassette and the DNAge expression cassette according to the present invention. can The auto-DdRp expression cassette is capable of executing a DdRp expression loop in which the DdRp DNA fragment downstream of the promoter to which the DdRp binds is repeatedly self-transcribed by DdRp synthesized from the DdRp RNA expression cassette.

본 발명은 본 발명에 따른 DdRp RNA 발현 카세트, auto-DdRp 발현 카세트 및 DNAge 발현 카세트, 또는 이들 모두를 코딩하는 핵산 서열을 포함하는 DNA를 제공한다. The present invention provides a DNA comprising a nucleic acid sequence encoding a DdRp RNA expression cassette, an auto-DdRp expression cassette and a DNAge expression cassette, or both, according to the present invention.

또한 auto-DdRp 발현 카세트에 포함되는 DdRp는 그 자체이거나 5*?**?*Cap 구조 형성을 촉매하는 기능을 보유한 DdRp 키메라효소일 수도 있다.In addition, the DdRp included in the auto-DdRp expression cassette may be itself or a DdRp chimerase having a function of catalyzing the formation of a 5*?**?*Cap structure.

하기에서 DdRp RNA 발현 카세트 및 DNAge 발현 카세트는 각각 별도 제작하여 공동 형질주입할 수 있으며, 이 때는 이를 auto_(DdRp+DNAge) 발현 카세트로 대신할 수도 있다.In the following, the DdRp RNA expression cassette and the DNAge expression cassette may be separately prepared and co-transfected, and in this case, the auto_(DdRp+DNAge) expression cassette may be used instead.

본 발명은 이하 단계를 포함하는 세포에서 자가전사 RNA/DNA 시스템에 의한 유전체 편집을 위한 방법을 제공한다.The present invention provides a method for genome editing by a self-transcribed RNA/DNA system in a cell comprising the following steps.

(a) DdRp RNA 발현 카세트를 수득하는 단계,(a) obtaining a DdRp RNA expression cassette;

(b) DdRp에 의해 트랜스로 전사될 수 있는 DNAge 발현 카세트를 수득하는 단계, 및(b) obtaining a DNAge expression cassette capable of being trans-transcribed by DdRp, and

(c) DdRp RNA 발현 카세트 및 DNAge 발현 카세트를 세포 내에 함께 접종하는 단계를 포함하고,(c) co-inoculating the DdRp RNA expression cassette and the DNAge expression cassette into the cell;

여기서 DdRp RNA 발현 카세트는 DdRp의 번역을 유도하기 위한 5'캡을 포함하고, 추가적으로 auto_DdRp 발현 카세트를 수득하는 단계를 실시하고 및 단계 (c)에서 함께 접종할 수 있다. Here, the DdRp RNA expression cassette includes a 5' cap for inducing translation of DdRp, and additionally, the step of obtaining an auto_DdRp expression cassette may be performed and inoculated together in step (c).

상기 방법에서, DdRp RNA 발현 카세트 및/또는 DNAge 발현 카세트는 본 발명의 자가전사 RNA/DNA 시스템에 대해 상기 정의된 바와 같다.In this method, the DdRp RNA expression cassette and/or the DNAge expression cassette are as defined above for the self-transcribed RNA/DNA system of the present invention.

본 발명은 본 발명의 자가전사 RNA/DNA 시스템을 포함하는 세포를 제공한다. 세포는 본 발명에 따른 방법에 따라 접종된다. 세포는 본 발명의 방법에 의해 수득 가능하다. 세포는 유기체의 일부일 수도 있다.The present invention provides a cell comprising the self-transcribed RNA/DNA system of the present invention. Cells are seeded according to the method according to the invention. Cells are obtainable by the method of the present invention. A cell may be part of an organism.

본 발명은 이하 단계를 포함하는 대상체에서 자가전사 RNA/DNA 시스템에 의한 유전체 편집을 위한 방법을 제공한다.The present invention provides a method for genome editing by a self-transcribed RNA/DNA system in a subject, comprising the following steps.

(a) DdRp RNA 발현 카세트를 수득하는 단계,(a) obtaining a DdRp RNA expression cassette;

(b) DdRp에 의해 트랜스로 전사될 수 있는 DNAge 발현 카세트를 수득하는 단계, 및(b) obtaining a DNAge expression cassette capable of being trans-transcribed by DdRp, and

(c) DdRp RNA 발현 카세트 및 DNAge 발현 카세트로 구성된 유전체 편집 RNA/DNA 시스템을 대상체에게 투여하는 단계를 포함하고,(c) administering to the subject a genome editing RNA/DNA system consisting of a DdRp RNA expression cassette and a DNAge expression cassette;

여기서 DdRp RNA 발현 카세트는 DdRp의 번역을 유도하기 위한 5'캡을 포함하고, 추가적으로 auto_DdRp 발현 카세트를 수득하는 단계를 실시하고 및 단계 (c)에서 함께 접종할 수 있다.Here, the DdRp RNA expression cassette includes a 5' cap for inducing translation of DdRp, and additionally, the step of obtaining an auto_DdRp expression cassette may be performed and inoculated together in step (c).

상기 방법에서, DdRp RNA 발현 카세트 및/또는 DNAge 발현 카세트는 본 발명의 유전체 편집 RNA/DNA 시스템에 대해 상기 정의된 바와 같다.In the method, the DdRp RNA expression cassette and/or the DNAge expression cassette are as defined above for the genome editing RNA/DNA system of the present invention.

Ⅰ. DdRp RNA 발현 카세트I. DdRp RNA Expression Cassette

본 발명의 자가전사 RNA/DNA 시스템은 DNA dependent RNA Polymerase(DdRp) mRNA를 포함하는 RNA 발현 카세트; 및 The self-transcribed RNA/DNA system of the present invention comprises an RNA expression cassette comprising DNA dependent RNA Polymerase (DdRp) mRNA; and

상기 DdRp에 의해 전사되는 유전체 편집 도구를 코딩하는 DNA 절편을 포함하는 DNAge 발현 카세트;를 포함하고, 이들이 작동 가능하게 연결되어 구성된 것이다.A DNAge expression cassette comprising a DNA fragment encoding a genome editing tool transcribed by the DdRp; includes, and is configured to be operably linked.

상기 DdRp RNA 발현 카세트는The DdRp RNA expression cassette is

(1) 5' UTR,(1) 5' UTR;

(2) DdRp를 코딩하는 오픈 리딩 프레임, 및(2) an open reading frame coding for DdRp, and

(3) 3'UTR을 포함한다.(3) contains 3'UTR.

상기 DdRp에 핵국지화신호(Nuclear localization signals, NLS)가 위치할 수도 있다. NLS가 없는 DdRp는 대부분 세포질에 남아있는 반면, NLS를 포함하는 단백질은 핵에 국한하여 분포한다. NLS가 없는 DdRp는 세포질 또는 NLS를 포함하는 하이브리드 DdRp는 핵에서 효소적으로 활성화되어 염색체 또는 플라스미드 DNA에 배치된 T7 프로모터에서 선택적으로 전사를 시작하고 특정 T7 종결서열에서 중지할 수 있다. Nuclear localization signals (NLS) may be located in the DdRp. DdRp without NLS mostly remains in the cytoplasm, whereas protein containing NLS is localized in the nucleus. DdRp without NLS can be cytoplasmic or hybrid DdRp with NLS can be enzymatically activated in the nucleus to selectively start transcription at the T7 promoter placed in chromosomal or plasmid DNA and stop at specific T7 terminator sequences.

세포 번역이 가능한 구조Structures that can be translated into cells

DdRp를 발현시키기 위한 DdRp RNA 발현 카세트는 5'캡을 포함한다. The DdRp RNA expression cassette for expressing DdRp comprises a 5' cap.

용어 "5'cap", "캡", "캡된" 및 ""5'cap 구조"는 일부 진핵세포의 1차 전사체, 예컨대 전구체 메신저 RNA의 5' 말단에서 발견되는 디뉴클레오타이드를 지칭하는 것으로 동의어로 사용된다. 5'cap은 5' 트리포스페이트 결합(또는 특정 캡 유사체의 경우 화학적 변형된 트리포스페이트 결합)에서 5'을 통해 mRNA 분자의 첫 번째 뉴클레오타이드에 (임의로 화학적 변형된) 구아노신이 결합된 구조이다. 용어는 종래의 cap 또는 cap 유사체를 지칭할 수 있다. The terms "5'cap", "cap", "capped" and ""5'cap structure" are synonymous to refer to a dinucleotide found at the 5' end of some eukaryotic primary transcripts, such as precursor messenger RNA. 5'cap is a structure in which (optionally chemically modified) guanosine is attached to the first nucleotide of an mRNA molecule through 5' in a 5' triphosphate bond (or a chemically modified triphosphate bond in the case of certain cap analogs) The term may refer to a conventional cap or cap analog.

예를 들어, RNA를 5'캡과 함께 제공하는 것은 상기 5'캡의 존재 하에 DNA 주형의 시험관내 전사에 의해 달성될 수 있으며, 여기서 상기 5'캡은 생성된 RNA 가닥에 공동-전사적으로 혼입되거나, RNA는 예를 들어 시험관내 전사에 의해 생성될 수 있으며, 5'cap은 캡핑효소, 예를 들어 종두증 바이러스의 캡핑효소를 사용하여 전사 후 RNA에 부착될 수 있다. 캡핑된 RNA에서, (캡핑된) RNA 분자의 제1 염기의 3' 위치는 인산디에스터 결합을 통해 RNA 분자의 후속 염기("제2 염기")의 5' 위치에서 연결된다. For example, providing RNA with a 5' cap can be accomplished by in vitro transcription of a DNA template in the presence of said 5' cap, wherein said 5' cap is co-transcriptionally incorporated into the resulting RNA strand. Alternatively, the RNA may be generated, for example, by in vitro transcription, and the 5'cap may be attached to the RNA after transcription using a capping enzyme, for example, a capping enzyme of a papillomavirus. In capped RNA, the 3' position of the first base of the (capped) RNA molecule is linked at the 5' position of the subsequent base ("second base") of the RNA molecule via a phosphate diester bond.

"종래의 5'캡"이란 용어는 자연성 발생적인 5'캡을 의미하고, 바람직하게는 7-메틸구아노신 캡을 의미한다. 7-메틸구아노신 캡에서, 캡의 구아노신은 화학적 변형된 구아노신이며, 여기서 변형은 7-위치에서의 메틸화로 이루어진다.The term "conventional 5' cap" means a naturally occurring 5' cap, preferably a 7-methylguanosine cap. In the 7-methylguanosine cap, the guanosine of the cap is a chemically modified guanosine, wherein the modification consists of methylation at the 7-position.

DdRp의 번역이 DdRp mRNA 상의 5'캡에 의해 유도된다. DdRp mRNA 상의 5'캡이 DdRp의 발현뿐만 아니라 시스템 전체의 성능에 매우 긍정적인 영향을 미친다. 트랜스로 코딩된 목적 RNA의 효율적인 생산을 달성할 수 있다. Translation of DdRp is driven by a 5' cap on DdRp mRNA. The 5' cap on DdRp mRNA has a very positive effect on the expression of DdRp as well as the overall performance of the system. Efficient production of trans-encoded target RNA can be achieved.

본 발명의 DdRp mRNA는 내부 리보솜 진입 부위 (IRES) 요소를 포함하지 않는다. 일반적으로, 내부 리보솜 진입 부위, 약칭 IRES는 DdRp mRNA 서열의 5' 말단과 다른 위치, 예컨대 DdRp mRNA 서열의 중앙에서의 위치로부터의 메신저 RNA (mRNA)로부터의 번역 개시를 가능하게 하는 뉴클레오타이드 서열로 mRNA 서열의 중간에 위치한다. The DdRp mRNA of the present invention does not contain an internal ribosome entry site (IRES) element. In general, the internal ribosome entry site, abbreviated IRES, is a nucleotide sequence that enables translation initiation from messenger RNA (mRNA) from a location different from the 5' end of the DdRp mRNA sequence, such as in the center of the DdRp mRNA sequence. located in the middle of the sequence.

본 발명에서 5'캡으로 IRES의 치환은 DdRp mRNA 분자에 의해 코딩되는 폴리펩티드의 서열에 영향을 미치지 않는 RNA 분자의 특정 변형이다(비-폴리펩티드-서열 개질성 변형). 예를 들어, 진핵세포 메신저 RNA의 경우, 비-폴리펩티드-서열 개질성 변형은 특정 비번역된 영역의 선택, 인트론의 도입, 예를 들어 토끼 베타-글로빈 인트론 II 서열), 또는 코딩 서열의 침묵 변형, 예를 들어 코딩된 폴리펩티드 서열의 변형없이(침묵 변형) 대상세포 또는 대상 유기체에서 우선 코돈 사용법에 적응하는 것에 의한 것을 포함한다. Substitution of the IRES with the 5' cap in the present invention is a specific modification of the RNA molecule that does not affect the sequence of the polypeptide encoded by the DdRp mRNA molecule (non-polypeptide-sequence modifying modification). For example, in the case of eukaryotic messenger RNA, non-polypeptide-sequence modifying modifications include selection of specific untranslated regions, introduction of introns (eg, rabbit beta-globin intron II sequence), or silent modifications of the coding sequence. , eg, by adaptation to preferential codon usage in a subject cell or subject organism without alteration (silent modification) of the encoded polypeptide sequence.

본 발명에 따른 에 의해 코딩되는 표적 단백질의 생산은 캡이 DdRp mRNA 상에 존재할 때 효율적이다.Production of the target protein encoded by according to the present invention is efficient when the cap is present on the DdRp mRNA.

진핵세포 mRNA에서 5'캡의 존재는 그 중에서도 특히 mRNA의 핵내 방출 조절과 가공, 특히 5′ 근위부 인트론 절제의 촉진에서 중요한 역할을 하는 것으로 여겨진다. 본 발명의 DdRp mRNA는 전형적으로 핵으로부터 배출되거나 가공될 필요가 없다. 그럼에도 불구하고, DdRp mRNA 상에 5'캡이 존재하는 것이 유리하다.The presence of a 5' cap in eukaryotic mRNA is thought to play an important role, inter alia, in regulating the intranuclear release of mRNA and facilitating processing, particularly 5' proximal intron excision. The DdRp mRNA of the present invention typically does not need to be exported or processed from the nucleus. Nevertheless, the presence of a 5' cap on the DdRp mRNA is advantageous.

진핵세포 mRNA의 경우, 5'캡은 또한 일반적으로 mRNA의 효율적인 번역에 관여한다고 일반적으로 기술되어 있다: 일반적으로 진핵세포에서 번역은 IRES가 없는 한 메신저 RNA (mRNA) 분자의 5' 말단에서만 개시된다. For eukaryotic mRNA, it is generally described that the 5' cap is also usually involved in efficient translation of the mRNA: in general, in eukaryotic cells, translation is initiated only at the 5' end of the messenger RNA (mRNA) molecule unless there is an IRES. .

진핵세포는 핵 내 전사 중에 5'캡을 갖는 RNA를 제공할 수 있다. 새로 합성된 mRNA는 통상적으로 전사체가 20 내지 30개의 뉴클레오타이드의 길이에 도달할 때 5'캡 구조로 변형된다. 먼저, 5'말단 뉴클레오타이드 pppN(ppp는 트리포스페이트를 나타내고, N은 임의의 뉴클레오사이드를 나타냄)은 RNA 5'트리포스파타아제및 구아닐릴 전이효소 활성을 갖는 캡핑효소에 의해 세포에서 5' GpppN으로 전환된다. 이어서, GpppN은 (구아닌-7)-메틸 전이효소 활성을 갖는 제2 효소에 의해 세포에서 메틸화되어 모노-메틸화된 m7GpppN 캡을 형성할 수 있다.Eukaryotic cells can present RNA with a 5' cap during intranuclear transcription. Newly synthesized mRNA is usually transformed into a 5' cap structure when the transcript reaches a length of 20 to 30 nucleotides. First, the 5'-terminal nucleotide pppN (ppp represents triphosphate, N represents any nucleoside) is 5' in the cell by a capping enzyme having RNA 5' triphosphatase and guanylyltransferase activity. converted to GpppN. GpppN can then be methylated in the cell by a second enzyme with (guanine-7)-methyltransferase activity to form a mono-methylated m7GpppN cap.

본 발명에서 사용된 5'캡은 자연성 5'캡이다.The 5' cap used in the present invention is a natural 5' cap.

본 발명에서, 자연성 5'캡 디뉴클레오타이드는 전형적으로 비-메틸화 캡 디뉴클레오타이드 (G(5')ppp(5')N; GpppN이라고도 함) 및 메틸화된 캡 디뉴클레오타이드 ((m7G(5')ppp(5')N; m7GpppN이라고도 함)로 이루어진 군으로부터 선택된다. In the present invention, natural 5' cap dinucleotides are typically non-methylated cap dinucleotides (G(5')ppp(5')N; also referred to as GpppN) and methylated cap dinucleotides ((m7G(5')ppp) (5')N; also called m7GpppN).

본 발명의 DdRp mRNA는 대상세포의 캡핑 장치에 의존하지 않는다. 대상세포 내로 형질주입되는 경우, 본 발명의 DdRp mRNA는 전형적으로 세포 핵, 즉 전형적인 진핵세포에서 캡핑이 일어나는 부위에 국한되지 않는 것으로 여겨진다.The DdRp mRNA of the present invention does not depend on the capping device of the target cell. When transfected into a subject cell, it is believed that the DdRp mRNA of the present invention is typically not limited to the cell nucleus, ie, the site where capping occurs in a typical eukaryotic cell.

종래 기술 에서 IRES와 유사하게, DdRp mRNA 상의 5'캡은 DdRp의 번역 개시를 유발하는데 유용하다. 진핵세포 번역 개시 인자 elF4E는 캡핑된 mRNA를 리보솜과 결합시키는 데 관여하는 것으로 생각될 수 있다. 5'캡의 존재가 성능을 상당히 증가시킨다. 따라서, 본 발명의 DdRp mRNA는 5'캡을 포함한다.Similar to the IRES in the prior art, the 5' cap on DdRp mRNA is useful for triggering translation initiation of DdRp. The eukaryotic translation initiation factor elF4E may be thought to be involved in the binding of capped mRNAs to ribosomes. The presence of the 5' cap significantly increases performance. Accordingly, the DdRp mRNA of the present invention includes a 5' cap.

5'캡의 존재는 또한 본 발명의 트랜스-복제시스템에서 예기치 않은 상승적인 효과를 제공한다. 캡핑된 DdRp mRNA가 RNA에 대해 트랜스로 제공될 때 캡핑된 DdRp mRNA가 목적 단백질의 생산을 유발하는 것이 보다 효율적이다. 따라서, 트랜스로 5'캡 및 복제의 상승 효과, 즉 시스로 복제하는 것보다 우수한 효과가 있다.The presence of the 5' cap also provides an unexpected synergistic effect in the trans-replication system of the present invention. When the capped DdRp mRNA is provided in trans to RNA, it is more efficient for the capped DdRp mRNA to trigger the production of the protein of interest. Therefore, there is a synergistic effect of 5' cap and replication in trans, that is, an effect superior to replication in cis.

본 발명의 캡핑된 RNA는 시험관내에서 제조될 수 있으므로 대상세포의 캡핑 장치에 의존하지 않는다. 시험관내에서 캡핑된 RNA를 형성하는데 가장 빈번하게 사용되는 방법은 모든 4개의 리보뉴클레오사이드 트리포스페이트 및 캡 디뉴클레오타이드 예컨대 m7G(5')ppp(5')G (m7GpppG라고도 함)의 존재 하에 박테리아 또는 박테리오파지 RNA 중합효소로 DNA 주형을 전사하는 것이다. Since the capped RNA of the present invention can be prepared in vitro, it does not depend on the capping device of the target cell. The most frequently used method for forming capped RNAs in vitro is bacteria in the presence of all four ribonucleoside triphosphates and cap dinucleotides such as m7G(5')ppp(5')G (also called m7GpppG). Or to transcribe the DNA template with bacteriophage RNA polymerase.

RNA 중합효소는 다음 주형 뉴클레오사이드 트리포스페이트 (pppN)의 α-포스페이트에서 m7GpppG의 구아노신 부분의 3'OH에 의한 친핵성 공격으로 전사를 개시하여 중간체 m7GpppGpN (여기서 N은 RNA 분자의 제2염기이다)를 형성한다. 경쟁하는 GTP-개시된 생성물 pppGpN의 형성은 시험관내 전사 동안 캡 대 GTP의 몰비가 5 내지 10으로 설정함으로써 억제된다.RNA polymerase then initiates transcription with a nucleophilic attack by the 3'OH of the guanosine moiety of m7GpppG in the α-phosphate of the template nucleoside triphosphate (pppN) to the intermediate m7GpppGpN (where N is the second base of the RNA molecule) is) is formed. Formation of the competing GTP-initiated product pppGpN is inhibited during in vitro transcription by setting the molar ratio of cap to GTP between 5 and 10.

5'캡은 5'캡 유사체이다. 이들 실시형태는 RNA가 시험관내 전사에 의해 수득되는 경우, 예를 들어 시험관내 전사된 RNA (IVT-RNA)인 경우에 특히 적합하다. 캡 유사체는 초기에 시험관내 전사에 의해 RNA 전사체의 대규모 합성을 용이하게 하기 위해 기술하였다.A 5' cap is a 5' cap analog. These embodiments are particularly suitable when the RNA is obtained by in vitro transcription, for example, in vitro transcribed RNA (IVT-RNA). Cap analogs were initially described to facilitate large-scale synthesis of RNA transcripts by in vitro transcription.

이전에 기재된 조작된 복제시스템과 대조적으로, 본 발명의 DdRp mRNA는 바람직하게는 캡 유사체를 포함한다. 따라서, 본 발명의 시스템의 DdRp의 번역은 바람직하게는 캡 유사체에 의해 유도된다. In contrast to the engineered replication system described previously, the DdRp mRNA of the present invention preferably comprises a cap analog. Therefore, the translation of DdRp in the system of the present invention is preferably induced by a cap analog.

이상적으로, 보다 높은 번역 효율 및/또는 생체내 분해에 대한 증가된 내성 및/또는 시험관내 분해에 대한 증가된 내성과 관련된 캡 유사체가 선택된다. 따라서, 본 발명은 임의의 변형을 함유하지 않고 천연 캡 [(m7G(5')ppp(5')G; m7GpppG라고도하며, 시판된 ScriptCap m7G 캡핑 시스템 (Epicentre Biotechnologies사에 의해 첨가할 수 있음)]을 포함하는 발현을 제시하고 있다.Ideally, cap analogs associated with higher translational efficiency and/or increased resistance to degradation in vivo and/or increased resistance to degradation in vitro are selected. Accordingly, the present invention does not contain any modifications and provides a natural cap [(m7G(5')ppp(5')G; also called m7GpppG, commercially available ScriptCap m7G capping system (which may be added by Epicentre Biotechnologies)] The expression containing the is presented.

UTRUTR

"Untranslated Region(비번역 영역)" 또는 "UTR"은 전사되지만 아미노산 서열로 번역되지 않는 영역에 관한 것이거나 또는 mRNA 분자와 같은 RNA 분자 내의 상응하는 영역에 관한 것이다. An “Untranslated Region” or “UTR” relates to a region that is transcribed but not translated into an amino acid sequence or to the corresponding region in an RNA molecule, such as an mRNA molecule.

본 발명의 DdRp RNA 발현 카세트에서, 용어 "3'UTR"은 DdRp에 대한 DdRp 코딩영역의 3'에 위치하는 영역에 관한 것이고, 용어 "5'UTR" 이는 DdRp 코딩영역의 5'에 위치하는 영역에 관한 것이다.In the DdRp RNA expression cassette of the present invention, the term "3'UTR" relates to a region located 3' of the DdRp coding region for DdRp, and the term "5'UTR" refers to a region located 5' of the DdRp coding region. is about

3'UTR은 존재하는 경우 단백질 코딩 영역의 종결 코돈의 하류에 유전자의 3'말단에 위치하지만, 용어 "3'UTR"은 바람직하게는 폴리(A) 꼬리를 포함하지 않는다. 따라서, 3'UTR은 폴리(A) 꼬리의 상류, 예를 들어 폴리(A) 꼬리에 직접 인접하여 있다(존재한다면).The 3'UTR, if present, is located at the 3'end of the gene, downstream of the stop codon of the protein coding region, although the term "3'UTR" preferably does not include the poly(A) tail. Thus, the 3'UTR is upstream of the poly(A) tail, eg directly adjacent to the poly(A) tail (if present).

5'UTR은 존재하는 경우 단백질 코딩 영역의 시작코돈의 상류에 유전자의 5' 말단에 위치한다. 5'UTR은 5'캡의 하류, 예를 들어 5'캡 바로 옆에 있다(존재한다면).The 5'UTR, if present, is located at the 5' end of the gene upstream of the start codon of the protein coding region. The 5'UTR is downstream of the 5' cap, eg immediately next to the 5' cap (if present).

5' 및/또는 3'UTR은 오픈 리딩 프레임과 기능적으로 연결될 수 있어서, 이들 영역이 오픈 리딩 프레임과 관련되어 안정성 및/또는 상기 오픈 리딩 프레임을 포함하는 RNA의 번역 효율이 증가된다.The 5' and/or 3'UTR may be functionally linked with the open reading frame, such that these regions are associated with the open reading frame to increase stability and/or translation efficiency of RNA comprising the open reading frame.

UTR은 RNA 기반 게놈 편집 도구의 운반을 이용한 효과적인 게놈 편집의 전제조건인 RNA의 안정성 및 번역 효율에 관여한다. 특정 5' 및/또는 3' 비번역 영역(UTR)을 선택함으로써, 5'캡 및/또는 3' 폴리(A)-꼬리에 관한 구조적 변형 이외에, 둘 모두 개선될 수 있다. UTRs are involved in RNA stability and translation efficiency, which are prerequisites for effective genome editing using delivery of RNA-based genome editing tools. By selecting specific 5' and/or 3' untranslated regions (UTRs), both can be improved, in addition to structural modifications regarding the 5' cap and/or 3' poly(A)-tail.

UTR 내의 서열 요소는 일반적으로 번역 효율 (주로 5'UTR) 및 RNA 안정성 (주로 3'UTR)에 영향을 미치는 것으로 이해된다. 핵산 서열의 번역 효율 및/또는 안정성을 증가시키기 위해 활성화한 5'UTR이 존재하는 것이 바람직하다. 독립적으로 또는 부가적으로, 핵산 서열의 번역 효율 및/또는 안정성을 증가시키기 위해 활성화한 3'UTR이 존재하는 것이 바람직하다.Sequence elements within the UTR are generally understood to affect translation efficiency (mainly 5'UTR) and RNA stability (mainly 3'UTR). It is preferred that an activated 5'UTR is present in order to increase the translation efficiency and/or stability of the nucleic acid sequence. Independently or additionally, it is preferred that an activated 3'UTR is present to increase the translation efficiency and/or stability of the nucleic acid sequence.

바람직하게는, DdRp mRNA는 DdRp가 유래된 에 대해 이종 또는 고유하지 않은 5'UTR 및/또는 3'UTR을 포함한다. 이것은 원하는 번역 효율 및 RNA 안정성에 따라 비번역 영역을 설계할 수 있게 한다.Preferably, the DdRp mRNA comprises a 5'UTR and/or a 3'UTR that is not heterologous or native to that from which the DdRp is derived. This allows the design of untranslated regions according to the desired translation efficiency and RNA stability.

본 발명의 3'UTR은 엑소리보뉴클레아제의 장벽으로 작용하거나 RNA 안정성을 증가시키는 것으로 알려진 단백질(예컨대 RNA-결합 단백질)과 상호작용하는 스템-루프 구조를 제공하기 위해 폴딩할 수 있는 하나 이상의 역반복을 포함할 수 있다.The 3'UTRs of the present invention have one or more foldables to provide a stem-loop structure that interacts with proteins (such as RNA-binding proteins) known to act as barriers for exoribonucleases or to increase RNA stability. Reverse iterations may be included.

인간 베타-글로빈 3'UTR, 특히 인간 베타-글로빈 3'UTR의 2개의 연속적인 동일한 사본은 높은 전사 안정성 및 번역 효율에 기여한다. Two consecutive identical copies of human beta-globin 3'UTR, in particular human beta-globin 3'UTR, contribute to high transcriptional stability and translational efficiency.

따라서, 본 발명의 DdRp mRNA는 인간 베타-글로빈 3'UTR의 2개의 연속적인 동일한 사본을 포함한다. 따라서, 그것은 5'→3' 방향으로 (a) 선택적으로 5'UTR; (b) DdRp를 코딩하는 오픈 리딩 프레임; (c) 3'UTR; 인간 베타-글로빈 3'UTR의 2개의 연속적인 동일한 사본, 이의 단편, 또는 인간 베타-글로빈 3'UTR의 변이체 또는 이의 단편을 포함하는 상기 3'UTR을 포함한다.Thus, the DdRp mRNA of the present invention comprises two consecutive identical copies of human beta-globin 3'UTR. Thus, in the 5'→3' direction (a) optionally 5'UTR; (b) an open reading frame encoding DdRp; (c) 3'UTR; 3'UTR comprising two consecutive identical copies of human beta-globin 3'UTR, a fragment thereof, or a variant or fragment thereof of human beta-globin 3'UTR.

본 발명의 DdRp mRNA는 의 번역 효율 및/또는 안정성을 증가시키기 위해 활성화하지만 인간 베타-글로빈 3'UTR, 이의 단편, 또는 인간 베타-글로빈 3'UTR의 변이체 또는 이의 단편이 아닌, 3'UTR을 포함한다.The DdRp mRNA of the present invention activates to increase the translation efficiency and/or stability of but not human beta-globin 3'UTR, a fragment thereof, or a variant of human beta-globin 3'UTR or a fragment thereof, 3'UTR include

본 발명의 DdRp mRNA는 의 번역 효율 및/또는 안정성을 증가시키기 위해 활성화한 5'UTR을 포함한다.The DdRp mRNA of the present invention includes an activated 5'UTR to increase translation efficiency and/or stability of .

본 발명에 따른 UTR-함유 RNA는 예를 들어, 시험관내 전사에 의해 제조될 수 있다. 이들은 5'UTR 및/또는 3'UTR을 갖는 RNA의 전사를 허용하는 방식으로 본 발명의 핵산 분자(예컨대 DNA)의 발현을 유전적으로 변형시킴으로써 달성될 수 있다.The UTR-containing RNA according to the invention can be prepared, for example, by in vitro transcription. These can be achieved by genetically modifying the expression of a nucleic acid molecule (eg DNA) of the invention in a manner that allows transcription of RNA with 5'UTR and/or 3'UTR.

3'UTR은 일반적으로 mRNA의 단백질 코딩 영역(즉, 오픈 리딩 프레임) 및 폴리(A) 서열 사이에 위치한 mRNA의 일부이다. mRNA의 3'UTR은 아미노산 서열내로 번역되지 않는다. 3'UTR은 일반적으로 유전자 발현 과정 중 각각의 mRNA 내로 전사되는 유전자에 의해 코딩된다. 게놈 서열은 먼저 선택적인 인트론을 포함하는 미성숙 mRNA로 전사된다. 그 이후, 미성숙 mRNA는 성숙 과정을 거쳐 성숙 mRNA로 되도록 추가로 처리된다. 이러한 성숙 과정은 5'캡핑(capping), 추가적인 인트로을 절단하기 위한 미성숙 mRNA 스플라이싱(splicing) 및 미성숙 mRNA 3'말단의 아데닐산중합반응 및 추가적인 엔도-(endo-) 또는 엑소(exo)뉴클레아제절단 등과 같은 3'말단의 변형을 포함한다. 본 발명에서, 3'UTR은 단백질 코딩 영역의 정지 코돈의 3'에, 바람직하게는 단백질 코딩 영역의 정지 코돈의 3' 바로 옆에 위치한 성숙 mRNA의 서열에 상응하며, 폴리(A) 서열의 5'측면, 바람직하게는 폴리(A) 서열의 5' 바로 옆 뉴클레오타이드까지 이어진다. 본 발명에서, 용어 "유전자의 3'UTR", 예컨대 "알파 또는 베타 글로빈의 3'UTR"은 이러한 유전자로부터 유래된 성숙 mRNA의 3'UTR에 상응하는 서열, 즉, 유전자의 전사 및 미성숙 mRNA의 성숙에 의해 수득된 mRNA에 상응하는 서열이다. 용어 "유전자의 3'UTR"은 3'UTR의 DNA 서열 및 RNA 서열을 포함한다.A 3'UTR is a portion of an mRNA that is usually located between the protein coding region (ie, open reading frame) of the mRNA and the poly(A) sequence. The 3'UTR of the mRNA is not translated into the amino acid sequence. The 3'UTR is usually encoded by a gene that is transcribed into the respective mRNA during the gene expression process. The genomic sequence is first transcribed into immature mRNA containing selective introns. Thereafter, the immature mRNA is further processed to undergo a maturation process to become a mature mRNA. This maturation process includes 5' capping, splicing of immature mRNA to cut additional intro, and polymerization of adenylate at the 3' end of immature mRNA and additional endo- or exo nucleases. Modifications at the 3' end, such as truncation, are included. In the present invention, the 3'UTR corresponds to the sequence of a mature mRNA located 3' to the stop codon of the protein coding region, preferably 3' immediately next to the stop codon of the protein coding region, and 5 of the poly(A) sequence 'to the nucleotide immediately adjacent to the 'flank, preferably 5' of the poly(A) sequence. In the present invention, the term "3'UTR of a gene", such as "3'UTR of alpha or beta globin", refers to a sequence corresponding to the 3'UTR of a mature mRNA derived from such a gene, i.e., the transcription of the gene and the expression of the immature mRNA. It is the sequence corresponding to the mRNA obtained by maturation. The term "3'UTR of a gene" includes DNA sequences and RNA sequences of 3'UTRs.

5'UTR은 일반적으로 전령 RNA(mRNA)의 특정 부분(section)으로 이해된다. 이는 mRNA의 오픈 리딩 프레임의 5'에 위치한다. 일반적으로, 5'UTR은 전사 시작부(transcriptional start site)와 함께 시작하고 오픈 리딩 프레임의 시작 코돈의 하나의 뉴클레오타이드 전에 종료된다. 5'UTR은 조절 요소라고도 불리우는 유전자 발현을 조절하기 위한 요소를 포함할 수 있다. 이와 같은 조절 요소는 리보솜 결합부 또는 5'말단 올리고피리미딘관(Oligopyrimidine Tract)일 수 있다. A 5'UTR is generally understood as a specific section of messenger RNA (mRNA). It is located 5' of the open reading frame of the mRNA. Generally, the 5'UTR starts with a transcriptional start site and ends one nucleotide before the start codon of the open reading frame. The 5'UTR may include elements for regulating gene expression, also called regulatory elements. Such a regulatory element may be a ribosome binding site or a 5'-terminal oligopyrimidine tube (Oligopyrimidine Tract).

5'UTR은 5'캡(cap)의 첨가에 의해 전사 후 변형될 수 있다. 본 발명에서, 5'UTR은 5'캡(cap) 및 시작 코돈 사이에 위치한 성숙 mRNA의 서열에 상응한다. 5'UTR은 5'캡(cap)의 3'에 위치한 뉴클레오타이드로부터, 5'캡(cap)의 3' 바로 옆에 위치한 뉴클레오타이드로부터, 단백질 코딩 영역의 시작 코돈의 5'에 위치한 뉴클레오타이드까지, 단백질 코딩 영역의 시작 코돈의 5' 바로 옆에 위치한 뉴클레오타이드까지 이어지는 서열에 상응한다. 성숙 mRNA의 5'캡(cap)의 3' 바로 옆에 위치한 뉴클레오타이드는 일반적으로 전사 시작부에 상응한다. 5'UTR 서열이 5'UTR 서열을 정의하기 위해 사용되는 mRNA 서열과 같은 RNA 서열 또는 이와 같은 RNA 서열에 상응하는 DNA 서열일 수 있다. 본 발명에서, 유전자의 5'UTR은 이러한 유전자로부터 유래된 성숙 mRNA의 5'UTR에 상응하는 서열, 즉, 유전자의 전사 및 미성숙 mRNA의 성숙에 의해 수득된 mRNA에 상응하는 서열이다. 유전자의 5'UTR은 5'UTR의 DNA 서열 및 RNA 서열을 포함한다. The 5'UTR can be modified post-transcriptionally by the addition of a 5' cap. In the present invention, the 5'UTR corresponds to the sequence of the mature mRNA located between the 5'cap and the start codon. 5'UTR is from the nucleotide located 3' of the 5' cap, from the nucleotide located immediately 3' to the 5' cap, to the nucleotide located 5' of the start codon of the protein coding region. Corresponds to a sequence extending up to the nucleotide located immediately 5' of the start codon of the region. The nucleotide located immediately 3' of the 5' cap of the mature mRNA generally corresponds to the start of transcription. The 5'UTR sequence may be an RNA sequence, such as an mRNA sequence used to define a 5'UTR sequence, or a DNA sequence corresponding to such an RNA sequence. In the present invention, the 5'UTR of a gene is a sequence corresponding to the 5'UTR of a mature mRNA derived from this gene, that is, a sequence corresponding to an mRNA obtained by transcription of the gene and maturation of an immature mRNA. The 5'UTR of a gene includes the DNA sequence and the RNA sequence of the 5'UTR.

5'말단 올리고피리미딘관(Oligopyrimidine Tract, TOP)은 일반적으로 핵산 분자의 5'말단 영역, 예컨대 특정 mRNA 분자의 5'말단 영역 또는 특정 유전자의 기능성 독립체 예를 들어, 전사영역의 5'말단 영역에 위치한 피리미딘 뉴클레오타이드의 스트레치(stretch)이다. 서열은 보통 전사 시작부에 상응하는 사이티딘과 함께 시작하고, 보통 약 3 내지 30개의 피리미딘 뉴클레오타이드의 스트레치가 이어진다. 피리미딘 스트레치 그리하여 5' TOP는 TOP의 다운스트림에 위치한 제1 퓨린 뉴클레오타이드의 5'의 하나의 뉴클레오타이드로 종료된다. 5'말단 올리고피리미딘관을 함유하는 전령 RNA는 종종 TOP mRNA로서 언급된다. 따라서, 이와 같은 전령 RNA를 제공하는 유전자는 TOP 유전자로서 언급된다. TOP 서열은 예를 들어, 유전자 및 펩타이드 신장 인자를 코딩하는 mRNA 및 리보솜 단백질에서 발견된다.The 5' terminal oligopyrimidine tube (Oligopyrimidine Tract, TOP) is generally a 5' terminal region of a nucleic acid molecule, such as a 5' terminal region of a specific mRNA molecule or a functional entity of a specific gene, for example, the 5' end of a transcription region. A stretch of pyrimidine nucleotides located in the region. The sequence usually begins with a cytidine corresponding to the beginning of transcription, usually followed by a stretch of about 3 to 30 pyrimidine nucleotides. Pyrimidine Stretch The 5' TOP is thus terminated with one nucleotide 5' of the first purine nucleotide located downstream of the TOP. A messenger RNA containing a 5'-terminal oligopyrimidine tube is often referred to as TOP mRNA. Thus, a gene providing such messenger RNA is referred to as a TOP gene. TOP sequences are found, for example, in mRNA and ribosomal proteins encoding genes and peptide elongation factors.

본 발명에서, TOP 모티프(motif)는 상기 정의된 바와 같은 5'TOP에 상응하는 핵산서열이다. 따라서, 본 발명에서, TOP 모티프는 바람직하게 3 내지 30개 뉴클레오타이드 길이를 갖는 피리미딘 뉴클레오타이드 스트레치이다. TOP-모티프는 적어도 3개 피리미딘 뉴클레오타이드, 적어도 4개 피리미딘 뉴클레오타이드, 적어도 5개 피리미딘 뉴클레오타이드, 적어도 6개 뉴클레오타이드, 적어도 7개 뉴클레오타이드, 적어도 8개 피리미딘 뉴클레오타이드로 이루어지고, 여기서 피리미딘 뉴클레오타이드의 스트레치는 사이토신 뉴클레오타이드와 함께 이의 5'말단에서 시작한다. In the present invention, the TOP motif is a nucleic acid sequence corresponding to the 5'TOP as defined above. Therefore, in the present invention, the TOP motif is preferably a stretch of pyrimidine nucleotides having a length of 3 to 30 nucleotides. The TOP-motif consists of at least 3 pyrimidine nucleotides, at least 4 pyrimidine nucleotides, at least 5 pyrimidine nucleotides, at least 6 nucleotides, at least 7 nucleotides, at least 8 pyrimidine nucleotides, wherein the The stretch begins at its 5' end with a cytosine nucleotide.

TOP 유전자 및 TOP mRNA에서, TOP-모티프는 바람직하게 전사 시작부와 함께 이의 5'말단에서 시작하고 상기 유전자 또는 mRNA에 제1 퓨린 잔기의 5'의 하나의 뉴클레오타이드로 종료된다. 본 발명의 의미에서 TOP 모티프는 5'UTR을 나타내는 서열의 5'말단에 위치하거나 5'UTR을 코딩하는 서열의 5'말단에 위치한다. 따라서, 만약 이러한 스트레치가 각각의 서열의 5'말단, 예컨대 본 발명에 따른 SM_mRNAi, 본 발명에 따른 SM_mRNAi의 5'UTR 요소, 또는 본원에 설명된 바와 같은 TOP 유전자의 5'UTR로부터 유래된 핵산 서열에 위치한다면 3개 이상의 피리미딘 뉴클레오타이드의 스트레치는 "TOP 모티프"이라 한다. 다시 말해서, 5'UTR 또는 5'UTR 요소의 5'말단에 위치하지 않고, 5'UTR 또는 5'UTR 요소 내 어디든 위치한 3개 이상의 피리미딘 뉴클레오타이드의 스트레치는 "TOP 모티프"로서 언급되지 않는다.In TOP genes and TOP mRNAs, the TOP-motif preferably starts at its 5' end with the start of transcription and ends with one nucleotide 5' of the first purine residue in said gene or mRNA. In the sense of the present invention, the TOP motif is located at the 5' end of the sequence representing the 5'UTR or at the 5' end of the sequence encoding the 5'UTR. Thus, if this stretch is at the 5' end of each sequence, such as a nucleic acid sequence derived from the SM_mRNAi according to the invention, the 5'UTR element of the SM_mRNAi according to the invention, or the 5'UTR of the TOP gene as described herein. A stretch of three or more pyrimidine nucleotides is referred to as a "TOP motif" if located in In other words, a stretch of 3 or more pyrimidine nucleotides located anywhere within a 5'UTR or 5'UTR element that is not located at the 5'end of the 5'UTR or 5'UTR element is not referred to as a "TOP motif".

TOP 유전자는 일반적으로 5' 말단 올리고피리미딘관의 존재를 특징으로 한다. 더욱이, 대부분의 TOP 유전자는 성장-연관 번역 조절을 특징으로 한다. 그러나, 조직 특이적 번역 조절을 갖는 TOP 유전자도 알려져 있다. 상기 정의된 바와 같이, TOP 유전자의 5'UTR은 TOP 유전자로부터 유래된 성숙 mRNA의 5'UTR의 서열에 상응하며, 바람직하게 5'캡(CAP)의 3'에 위치한 뉴클레오타이드로부터 시작 코돈의 5'에 위치한 뉴클레오타이드까지 이어진다. TOP 유전자의 5'UTR은 일반적으로 임의의 시작 코돈, 업스트림(upstream) AUGs(uAUGs) 또는 업스트림 오픈 리딩 프레임(uORFs)을 포함하지 않는다. 거기에서, 업스트림 AUGs 및 업스트림오픈 리딩 프레임은 일반적으로 번역되어야 할 오픈 리딩 프레임의 시작 코돈(AUG)의 5'에 나타나는 AUGs 및 오픈 리딩 프레임으로 이해된다. TOP genes are generally characterized by the presence of a 5' terminal oligopyrimidine tube. Moreover, most TOP genes are characterized by growth-associated translational regulation. However, TOP genes with tissue-specific translational regulation are also known. As defined above, the 5'UTR of the TOP gene corresponds to the sequence of the 5'UTR of the mature mRNA derived from the TOP gene, preferably 5' of the start codon from the nucleotide located 3' of the 5'cap (CAP). to the nucleotide located in The 5'UTR of a TOP gene generally does not contain any start codons, upstream AUGs (uAUGs) or upstream open reading frames (uORFs). Therein, upstream AUGs and upstream open reading frames are generally understood as AUGs and open reading frames that appear 5' of the start codon (AUG) of the open reading frame to be translated.

TOP 유전자의 5'UTR은 일반적으로 상대적으로 짧다. TOP 유전자의 5'UTR 길이는 20개 뉴클레오타이드 내지 500개 뉴클레오타이드까지 달라질 수 있으며, 일반적으로 약 200개 뉴클레오타이드 미만이고, 약 150개 뉴클레오타이드 미만이며, 약 100개 뉴클레오타이드 미만이다. 본 발명의 의미에서, TOP 유전자의 5'UTR 예시는 위치 5의 뉴클레오타이드로부터 시작 코돈(예를 들어, ATG)의 5' 바로 옆에 위치한 뉴클레오타이드까지 이어지는 핵산 서열이다. 특히 TOP 유전자의 5'UTR의 절편은 5'TOP 모티프가 결여된 TOP 유전자의 5'UTR이다. 'TOP 유전자의 5'UTR'은 자연적으로 발생하는 TOP 유전자의 5'UTR을 나타낸다.The 5'UTR of TOP genes is generally relatively short. The 5'UTR length of a TOP gene can vary from 20 nucleotides to 500 nucleotides, and is generally less than about 200 nucleotides, less than about 150 nucleotides, and less than about 100 nucleotides. In the sense of the present invention, an example of a 5'UTR of a TOP gene is a nucleic acid sequence extending from the nucleotide at position 5 to the nucleotide located immediately 5' of the start codon (eg, ATG). In particular, the 5'UTR fragment of the TOP gene is the 5'UTR of the TOP gene lacking the 5'TOP motif. The '5'UTR of the TOP gene' represents the 5'UTR of the naturally occurring TOP gene.

폴리(A) 서열poly(A) sequence

본 발명의 DdRp RNA 발현 카세트는 3' 폴리(A) 서열을 포함할 수 있다.The DdRp RNA expression cassette of the present invention may comprise a 3' poly(A) sequence.

폴리(A) 서열은 본질적으로 적어도 20개, 적어도 26, 적어도 40개, 적어도 80개, 적어도 100개이고, 500개 이하, 400개 이하, 바람직하게는 300개 이하, 200개 이하, 특히 150개 이하의 A 뉴클레오타이드이고, 특히 약 120개의 A 뉴클레오타이드로 구성되거나 포함한다. The poly(A) sequence is essentially at least 20, at least 26, at least 40, at least 80, at least 100, no more than 500, no more than 400, preferably no more than 300, no more than 200, in particular no more than 150 of A nucleotides, in particular consisting of or comprising about 120 A nucleotides.

폴리(A) 서열에서 뉴클레오타이드 수에 따라 전형적으로 적어도 50%, 적어도 75%의 폴리(A) 서열에서의 대부분의 뉴클레오타이드가 A 뉴클레오타이드이지만, 나머지 뉴클레오타이드는 A 뉴클레오타이드 이외의 뉴클레오타이드, 예컨대 U 뉴클레오타이드 (유리딜레이트), G 뉴클레오타이드 (구아닐레이트), C 뉴클레오타이드 (시티딜레이트)인 것을 허용한다. 폴리(A) 서열에서의 모든 뉴클레오타이드, 즉 폴리(A) 서열에서의 뉴클레오타이드의 수에 따라 100%가 A 뉴클레오타이드인 것을 의미한다. 용어 "A 뉴클레오타이드" 또는 "A"는 아데닐레이트를 지칭한다.Depending on the number of nucleotides in the poly(A) sequence, typically at least 50%, at least 75% of the majority of the nucleotides in the poly(A) sequence are A nucleotides, but the remaining nucleotides are nucleotides other than A nucleotides, such as U nucleotides (free delay). ), G nucleotides (guanylate), C nucleotides (cytidylates). All nucleotides in the poly(A) sequence, i.e. 100% according to the number of nucleotides in the poly(A) sequence, are A nucleotides. The term “A nucleotide” or “A” refers to adenylate.

본 발명의 유전체 편집 도구 DNA 발현 카세트, 및 auto_DdRp DNA 발현 카세트는 폴리(A) 서열을 코딩하는 DNA 서열(코딩 가닥)를 포함할 수 있다.The genome editing tool DNA expression cassette, and auto_DdRp DNA expression cassette of the present invention may include a DNA sequence (coding strand) encoding a poly(A) sequence.

본 발명은 코딩 가닥에 상보적인 가닥에서 반복된 dT 뉴클레오타이드 (데옥시티미딜레이트)를 포함하는 DNA 주형에 기반하여, RNA 전사 동안, 즉 시험관내 전사된 RNA의 제조 중에 부착되는 3' 폴리(A) 서열을 제공한다. 폴리(A) 서열을 코딩하는 DNA 서열(코딩 가닥)은 폴리(A) 카세트로 지칭된다.The present invention is based on a DNA template comprising repeated dT nucleotides (deoxythymidylate) in the strand complementary to the coding strand, a 3' poly(A) attached during RNA transcription, ie during the production of transcribed RNA in vitro. ) provides the sequence. The DNA sequence (coding strand) encoding the poly(A) sequence is referred to as the poly(A) cassette.

DNA의 코딩 가닥에 존재하는 3' 폴리(A) 카세트는 본질적으로 dA 뉴클레오타이드로 이루어지지만, 4개의 뉴클레오타이드(dA, dC, dG, dT)의 균등한 분포를 갖는 무작위 서열에 의해 중단된다. 이러한 무작위 서열은 길이가 5 내지 50개, 바람직하게는 10 내지 30개, 보다 바람직하게는 10 내지 20개일 수 있다. The 3' poly(A) cassette present in the coding strand of DNA consists essentially of dA nucleotides, but is interrupted by a random sequence with an even distribution of 4 nucleotides (dA, dC, dG, dT). Such random sequences may be 5 to 50, preferably 10 to 30, more preferably 10 to 20 in length.

본질적으로 dA 뉴클레오타이드로 이루어지지만, 4개의 뉴클레오타이드(dA, dC, dG, dT)의 균등한 분포를 갖고 길이가 예를 들어 예를 들어 5 내지 50개의 뉴클레오타이드인 무작위 서열에 의해 중단되는 폴리(A) 카세트는 DNA 수준에서 E.coli에서의 plasmid DNA의 일정한 증식을 나타내며, RNA 수준에서 RNA 안정성 및 번역 효율을 지지하는 것과 관련하여 유익한 특성과 여전히 연관되어 있다.Poly(A) consisting essentially of dA nucleotides, but having an even distribution of 4 nucleotides (dA, dC, dG, dT) and interrupted by a random sequence that is, for example, 5-50 nucleotides in length Cassettes exhibit constant proliferation of plasmid DNA in E. coli at the DNA level and are still associated with beneficial properties with respect to supporting RNA stability and translation efficiency at the RNA level.

결과적으로, 본원에 기술된 RNA 분자에 함유된 3' 폴리(A) 서열은 본질적으로 A 뉴클레오타이드로 구성되지만, 4개의 뉴클레오타이드(A, C, G, U)가 균등한 분포를 갖는 무작위 서열에 의해 중단된다. 이러한 무작위 서열은 길이가 5 내지 50개, 바람직하게는 10 내지 30개, 보다 바람직하게는 10 내지 20개일 수 있다.As a result, the 3' poly(A) sequence contained in the RNA molecules described herein consists essentially of A nucleotides, but by a random sequence with an even distribution of 4 nucleotides (A, C, G, U). is stopped Such random sequences may be 5 to 50, preferably 10 to 30, more preferably 10 to 20 in length.

아데닐산중합반응(polyadenylation)은 일반적으로 RNA 분자, 예를 들어, 미성숙 mRNA와 같은 핵산 분자에 폴리(A) 서열이 첨가되는 것으로 이해된다. 아데닐산중합반응은 소위 아데닐산중합반응 신호에 의해 유도될 수 있다. 이 신호는 아데닐산중합반응될, RNA 분자와 같은 핵산 분자의 3'말단의 뉴클레오타이드의 스트레치(stretch) 내에 위치한다. 아데닐산중합반응 신호는 일반적으로 아데닌 및 우라실/티민 뉴클레오타이드로 이루어진 헥사머(hexamer), 바람직하게는 헥사머 서열 AAUAAA 를 포함한다. 다른 서열, 헥사머 서열도 가능하다. 아데닐산중합반응은 일반적으로 프리-mRNA(미성숙-mRNA로도 불리우는)의 가공 중에 발생한다. 일반적으로, RNA 성숙(프리-mRNA로부터 성숙 mRNA 까지)은 아데닐산중합반응의 단계를 포함한다.Polyadenylation is generally understood as the addition of a poly(A) sequence to a nucleic acid molecule such as an RNA molecule, eg, immature mRNA. The adenylic acid polymerization reaction can be induced by a so-called adenylic acid polymerization reaction signal. This signal is located within a stretch of nucleotides at the 3' end of a nucleic acid molecule, such as an RNA molecule, to be subjected to adenylic acid polymerization. The adenylic acid polymerization signal generally comprises a hexamer consisting of adenine and uracil/thymine nucleotides, preferably the hexamer sequence AAUAAA. Other sequences, hexamer sequences, are possible. Adenylic acid polymerization usually occurs during processing of pre-mRNA (also called immature-mRNA). In general, RNA maturation (from pre-mRNA to mature mRNA) involves the step of adenylic acid polymerization.

코돈 사용법Codon usage

일반적으로 유전 암호의 축퇴는 동일한 코딩 능력을 유지하면서 다른 코돈 (염기 삼중항)에 의해 RNA 서열에 존재하는 특정 코돈(아미노산을 코딩하는 염기 삼중항)을 대체할 수 있게 한다(코돈을 대체하는 것은 대체된 코돈과 동일한 아미노산을 코딩한다). In general, the degeneracy of the genetic code makes it possible to replace certain codons (base triplets encoding amino acids) present in RNA sequences by other codons (base triplets) while maintaining the same coding capacity (replacement of a codon is encodes the same amino acid as the codon replaced).

본 발명에서, RNA 분자에 포함된 오픈 리딩 프레임의 적어도 하나의 코돈은 오픈 리딩 프레임이 유래한 종에서 각각의 오픈 리딩 프레임의 각각의 코돈과 상이하다. 오픈 리딩 프레임의 코딩 서열은 "개조된" 것으로 언급된다.In the present invention, at least one codon of the open reading frame included in the RNA molecule is different from each codon of each open reading frame in the species from which the open reading frame is derived. A coding sequence in an open reading frame is said to be "altered".

예를 들어, 오픈 리딩 프레임의 코딩 서열이 변형되는 경우, 빈번하게 사용되는 코돈이 선택될 수 있다. 더욱 빈번하게 사용되는 희귀 코돈의 치환을 포함하여, 핵산 분자의 코딩 서열의 변형을 한다. For example, when the coding sequence of the open reading frame is modified, frequently used codons may be selected. Modifications in the coding sequence of nucleic acid molecules, including substitution of more frequently used rare codons.

코돈 사용의 빈도는 대상세포 또는 대상 유기체에 따라 다르기 때문에, 그러한 유형의 변형은 특정 대상세포 또는 대상 유기체에서의 발현에 핵산 서열을 맞추는 것이 적합하다. 일반적으로 말하면, 보다 빈번하게 사용되는 코돈은 전형적으로 대상세포 또는 대상 유기체에서 보다 효율적으로 번역되지만, 오픈 리딩 프레임의 모든 코돈의 변형이 항상 필요한 것은 아니다.Because the frequency of codon usage varies depending on the subject cell or subject organism, this type of modification is appropriate to tailor the nucleic acid sequence to expression in a particular subject cell or subject organism. Generally speaking, more frequently used codons are typically translated more efficiently in a subject cell or subject organism, but modification of all codons in the open reading frame is not always necessary.

예를 들어, 오픈 리딩 프레임의 코딩 서열이 변형되는 경우, G (구아닐레이트) 잔기 및 C (시티딜레이트) 잔기의 함량은 각 아미노산에 대해 가장 풍부한 GC-함량을 갖는 코돈을 선택함으로써 변형될 수 있다. GC가 풍부한 오픈 리딩 프레임을 가진 RNA 분자는 면역 활성을 감소시키고 RNA의 번역 및 반감기를 향상시킬 가능성이 있다고 보고되어 있다.For example, if the coding sequence of the open reading frame is modified, the content of G (guanylate) residues and C (cytodylate) residues can be modified by selecting the codon with the most abundant GC-content for each amino acid. can It has been reported that RNA molecules with GC-rich open reading frames have the potential to decrease immune activity and enhance translation and half-life of RNA.

본 발명에 따른 DdRp를 코딩하는 오픈 리딩 프레임은 각각 개조될 수 있다.Each of the open reading frames coding for DdRp according to the present invention can be adapted.

II. DNA 발현카세트II. DNA expression cassette

본 발명의 유전체 편집 RNA/DNA 시스템은 DdRp RNA 발현 카세트에 더하여, 각각 바람직하게는 적어도 하나의 유전체 편집 도구를 코딩하는 DNAge 발현 카세트를 포함한다. The genome editing RNA/DNA system of the present invention comprises, in addition to the DdRp RNA expression cassette, a DNAge expression cassette each preferably encoding at least one genome editing tool.

본 발명의 유전체 편집 시스템은 폴리뉴클레오타이드의 단편, 플라스미드, 렌티 바이러스, 아데노 관련 바이러스 및 리보 핵 단백질 (RNP) 복합체를 포함한 다양한 형태 또는 이들의 조합으로 세포에 전달될 수 있다. The genome editing system of the present invention can be delivered to cells in various forms, including fragments of polynucleotides, plasmids, lentiviruses, adeno-associated viruses, and ribonucleoprotein (RNP) complexes, or combinations thereof.

대표적인 유전체 편집 CRISPR/Cas9 시스템은CRISPR/Cas9 리보 핵 단백질 (RNP) 시스템으로 Cas9 단백질과 단일 가이드 RNA (sgRNA) 또는 CRISPR RNA (crRNA) : trans-activating crRNA (tracrRNA) duplex로 구성된다.A representative genome editing CRISPR/Cas9 system is the CRISPR/Cas9 ribonucleoprotein (RNP) system, which consists of a Cas9 protein and a single guide RNA (sgRNA) or CRISPR RNA (crRNA):trans-activating crRNA (tracrRNA) duplex.

본 발명의 유전체 편집 RNA/DNA 시스템을 구성하는 상기 DdRp에 의해 전사될 수 있는 DNAge 발현 카세트는 표적화 엔도뉴클레아제(Cas9 단백질)를 코딩하는 DNAen 발현 카세트 및 선택된 유전체의 특정 표적화 염기서열에 관련된 단일 가이드 RNA (sgRNA) 또는 CRISPR RNA (crRNA) : trans-activating crRNA (tracrRNA) duplex를 코딩하는 DNAsg 발현 카세트를 포함할 수 있다.The DNAge expression cassette capable of being transcribed by the DdRp constituting the genome editing RNA/DNA system of the present invention is a DNAen expression cassette encoding a targeting endonuclease (Cas9 protein) and a single target sequence related to a specific targeting sequence of the selected genome. Guide RNA (sgRNA) or CRISPR RNA (crRNA): may include a DNAsg expression cassette encoding a trans-activating crRNA (tracrRNA) duplex.

상기 표적화 엔도뉴클레아제는 아연 핑거 뉴클레아제(ZFN), 전사 활성화제-유사 이펙터 뉴클레아제(TALEN), CRISPR-연합된 Cas 뉴클레아제, 알고너트 엔도뉴클레아제및 M-MLV 역전사 효소와 Cas9 H840A nickase의 융합 단백질을 포함하는 엔도뉴클레아제를 포함하는 군에서 선택되어지는 1종이다. The targeting endonuclease is zinc finger nuclease (ZFN), transcriptional activator-like effector nuclease (TALEN), CRISPR-associated Cas nuclease, algonut endonuclease and M-MLV reverse transcriptase. and Cas9 H840A nickase is one selected from the group consisting of endonuclease containing a fusion protein.

본 발명의 DNAen 발현 카세트는The DNAen expression cassette of the present invention is

(1) DdRp가 결합하는 프로모터;(1) a promoter to which DdRp binds;

(2) 5*?**?*UTR;(2) 5*?**?*UTR;

(3) DNAen를 코딩하는 DNA 절편; 및(3) a DNA fragment encoding DNAen; and

(4) 3'UTR을 포함할 수 있다.(4) 3'UTR may be included.

단일 가이드 RNA(sgRNA) 또는 CRISPR RNA(crRNA):trans-activating crRNA(tracrRNA) duplex의 구성은 다음과 같다. The composition of the single guide RNA (sgRNA) or CRISPR RNA (crRNA):trans-activating crRNA (tracrRNA) duplex is as follows.

crRNA는 유전체 표적에 대해 상보적으로 설계된 20개의 nt RNA 올리고 뉴클레오티드이다. crRNA 시퀀스 디자인은 표준 gRNA 디자인 원칙을 활용하며 gRNA 데이터베이스에서 쉽게 선택하거나 gRNA 디자인 도구를 사용하여 사용자 정의할 수 있다. tracrRNA는 crRNA 및 Cas9 뉴클레아제와 함께 활성화된 CRISPR/Cas9 RNP 복합체를 형성하는 67nt RNA 올리고뉴클레오타이드이다. crRNA is a 20 nt RNA oligonucleotide designed to be complementary to a genomic target. The crRNA sequence design utilizes standard gRNA design principles and can be easily selected from the gRNA database or customized using gRNA design tools. tracrRNA is a 67nt RNA oligonucleotide that forms an activated CRISPR/Cas9 RNP complex with crRNA and Cas9 nuclease.

sgRNA는 표적 게놈 서열을 식별할 수 있는 crRNA 서열과 Cas9 단백질과 복합체를 형성할 수 있는 tracrRNA 서열을 모두 포함하는 단일 RNA 올리고이다. sgRNA 또는 crRNA:tracrRNA 듀플렉스가 Cas9 단백질과 복합체를 형성 할 때, 이들은 함께 프로토스페이서 인접 모티프 (protospacer adjacent motif, PAM) 서열(5'NGG-3')로부터 3-4 bp 업스트림, 20 nt 가이드 RNA 서열에 상보적인 유전자좌에서 이중 가닥 파손을 생성할 수 있다.The sgRNA is a single RNA oligo containing both a crRNA sequence capable of identifying a target genomic sequence and a tracrRNA sequence capable of forming a complex with a Cas9 protein. When the sgRNA or crRNA:tracrRNA duplexes form a complex with the Cas9 protein, they together form a protospacer adjacent motif (PAM) sequence 3-4 bp upstream from the (5'NGG-3'), 20 nt guide RNA sequence can create a double-stranded break at a locus complementary to

본 발명의 DNAsg 발현 카세트는The DNAsg expression cassette of the present invention is

(1) DdRp가 결합하는 프로모터(또는 RNA 폴리머라제Ⅲ(Pol Ⅲ) 프로모터) ;(1) a promoter to which DdRp binds (or RNA polymerase III (Pol III) promoter);

(2) DNAsg를 코딩하는 DNA 절편; 및(2) a DNA fragment encoding DNAsg; and

(3) 3'UTR을 포함할 수 있다.(3) 3'UTR may be included.

본 발명에서 DdRp RNA 발현 카세트에서 합성되는 DdRp는 각각의 DNAge 발현 카세트에 작용하여 유전체 편집 도구의 전사 및 생산을 유도할 수 있다. 예를 들어, 각각의 DNAge 발현 카세트는 유전체 편집에 사용하는 표적화 엔도뉴클레아제또는 가이드 핵산을 코딩할 수 있다. 이는 대상체에 대해 여러 다른 유전자 좌의 유전체 편집이 필요한 경우에 유리하다.In the present invention, DdRp synthesized from the DdRp RNA expression cassette can act on each DNAge expression cassette to induce transcription and production of a genome editing tool. For example, each DNAge expression cassette may encode a targeting endonuclease or guide nucleic acid for use in genome editing. This is advantageous when genome editing of several different loci is required for the subject.

본 발명의 DNAge 발현 카세트의 유전체 편집 도구는 유전체 편집을 수행하는 표적화 엔도뉴클레아제를 포함할 수 있다(도 5). 특히, DNAge 발현 카세트가 표적화 엔도뉴클레아제를 사용하는 경우를 포함하여 이런 경우에는 유전체 편집 도구의 일부인 가이드 핵산은 외부로부터 전달 시스템을 통해 도입될 수 있다. 예외적으로 가이드 핵산은 RNA 또는 DNA일 수도 있다.The genome editing tool of the DNAge expression cassette of the present invention may include a targeting endonuclease that performs genome editing (FIG. 5). In particular, in such cases, including when the DNAge expression cassette uses a targeting endonuclease, a guide nucleic acid that is part of a genome editing tool can be introduced through a delivery system from the outside. Exceptionally, the guide nucleic acid may be RNA or DNA.

바람직하게, 상기 DNAge 발현 카세트를 구성하고 DdRp에 의해 전사될 수 있는 유전체 편집 도구는 유전체 편집에 사용하는 가이드 핵산을 포함할 수 있다(도 6). 예외적으로 이런 경우에는 유전체 편집 도구의 일부인 표적화 엔도뉴클레아제는 외부로부터 전달 시스템을 통해 도입될 수도 있다.Preferably, the genome editing tool constituting the DNAge expression cassette and capable of being transcribed by DdRp may include a guide nucleic acid used for genome editing (FIG. 6). Exceptionally in this case, the targeting endonuclease that is part of the genome editing tool may be introduced via a delivery system from the outside.

바람직하게, 상기 DNAge 발현 카세트를 구성하고 DdRp에 의해 전사될 수 있는 유전체 편집 도구는 유전체 편집에 사용하는 표적화 엔도뉴클레아제및 2종류의 가이드 핵산을 포함할 수 있다(도 7). 프라임 에이팅(prime editing)을 포함한 이런 경우에는 2 종류의 가이드 핵산은 하나 또는 두 개의 DNA에 있을 수도 있다.Preferably, the genome editing tool constituting the DNAge expression cassette and capable of being transcribed by DdRp may include a targeting endonuclease used for genome editing and two types of guide nucleic acids (FIG. 7). In these cases involving priming, the two types of guide nucleic acids may be in one or both DNAs.

본 발명의 증폭 유전체 편집 시스템은 기능적 요소에만 제한하는 것이 아니며 비제한적이다.The amplification genome editing system of the present invention is not limited to only functional elements, but is not limited thereto.

유전체 편집 도구를 코딩하는 DNAge 발현 카세트가 발현 제어 서열과 함께 존재한다. 유전체 편집 도구를 코딩하는 DNAge는 DdRp가 결합하는 프로모터의 제어 하에 있다. 유전체 편집 도구를 코딩하는 DNAge는 DdRp가 결합하는 프로모터의 하류에 위치한다. 유전체 편집 도구는 이종 핵산에 의해 코딩된다. DdRp가 결합하는 프로모터의 하류 위치는 유전체 편집 도구를 코딩하는 DNA 절편을 포함하도록 한다. A DNAge expression cassette encoding a genome editing tool is present along with expression control sequences. The DNAge encoding the genome editing tool is under the control of the promoter to which DdRp binds. The DNAge encoding the genome editing tool is located downstream of the promoter to which DdRp binds. The genome editing tool is encoded by a heterologous nucleic acid. The downstream position of the promoter to which DdRp binds contains a DNA fragment encoding a genome editing tool.

본 발명의 DNAge 발현 카세트를 구성하는 표적화 엔도뉴클레아제을 코딩하는 DNA(DNAen)는 표적화 엔도뉴클레아제를 전사하는 단위로, 시작코돈 (염기 삼중항)을 포함하고, 전형적으로는 AUG (RNA 분자에서) 또는 (각각의 DNA 분자에서) ATG를 포함하는 오픈 리딩 프레임을 포함한다.The DNA (DNAen) encoding the targeting endonuclease constituting the DNAge expression cassette of the present invention is a unit for transcription of the targeting endonuclease, and includes a start codon (base triplet), typically AUG (RNA molecule in) or (in each DNA molecule) an open reading frame containing ATG.

바람직하게는, 본 발명에 따른 DNAen 발현 카세트가 적어도 하나의 오픈 리딩 프레임 (단백질 코딩영역)을 포함하는 경우, 발현 카세트는 유전체 편집 도구 분자의 전사 단위이다.Preferably, when the DNAen expression cassette according to the present invention comprises at least one open reading frame (protein coding region), the expression cassette is a transcription unit of a genome editing tool molecule.

본 발명에 따른 DNAen 발현 카세트는 단일 표적화 엔도뉴클레아제또는 다중 표적화 엔도뉴클레아제를 코딩할 수 있다. 다중 표적화 엔도뉴클레아제는 단일 표적화 엔도뉴클레아제(융합 표적화 엔도뉴클레아제) 또는 별도의 표적화 엔도뉴클레아제로서 코딩될 수 있다. The DNAen expression cassette according to the present invention may encode a single targeting endonuclease or multiple targeting endonucleases. Multiple targeting endonucleases may be encoded as single targeting endonucleases (fusion targeting endonucleases) or as separate targeting endonucleases.

표적화 엔도뉴클레아제가 별도의 표적화 엔도뉴클레아제로 코딩되는 DNAen 발현 카세트, 이들 중 하나 이상에 상류 IRES 또는 추가적인 바이러스 프로모터 요소가 제공될 수 있다. 바람직하게, 본 발명에 따른 DNAen 발현 카세트는 둘 이상의 오픈 리딩 프레임을 포함할 수 있으며, 이들 각각은 DdRp가 결합하는 프로모터의 제어 하에 있을 수 있다. A DNAen expression cassette in which the targeting endonuclease is encoded as a separate targeting endonuclease, one or more of these may be provided with an upstream IRES or additional viral promoter elements. Preferably, the DNAen expression cassette according to the present invention may comprise two or more open reading frames, each of which may be under the control of a promoter to which DdRp binds.

따라서, 목적하는 폴리펩티드를 발현하도록 구성되는 DNAen 발현 카세트는 표적화 엔도뉴클레아제를 코딩하는 코딩 영역, 코딩 영역에 작동 가능하게 연결된 하나 이상의 적합한 프로모터, 해독 개시 서열, 개시 코돈, 정지 코돈, 폴리A 신호 서열, 리더 서열, NLS 등 중 하나 이상을 포함할 수 있다. Thus, a DNAen expression cassette configured to express a polypeptide of interest comprises a coding region encoding a targeting endonuclease, one or more suitable promoters operably linked to the coding region, a translation initiation sequence, a start codon, a stop codon, a polyA signal sequence, leader sequence, NLS, and the like.

DNAen 발현 카세트는 핵 위치화 서열(nuclear localization sequence, NLS)을 코딩하는 서열을 포함한다. 임의의 적합한 NLS 서열이 사용될 수 있다. DNAen 발현 카세트는 표적화 엔도뉴클레아제또는 이의 기능성 단편을 발현하도록 구성된다.The DNAen expression cassette contains a sequence encoding a nuclear localization sequence (NLS). Any suitable NLS sequence may be used. The DNAen expression cassette is configured to express a targeting endonuclease or functional fragment thereof.

바람직하게는, 유전체 편집 도구를 코딩하는 오픈 리딩 프레임은 DdRp를 유도하는 바이러스에 고유한 것이 아니다. DdRp가 결합하는 프로모터의 제어하에 있는 오픈 리딩 프레임은 임의의 바이러스 단백질을 코딩하지 않는다. DdRp가 결합하는 프로모터의 제어 하에 있는 오픈 리딩 프레임은 임의의 전장 바이러스 비구조성 단백질 또는 이의 단편을 코딩하지 않으며 및/또는 임의의 전장 바이러스 구조 단백질 또는 이의 단편을 코딩하지 않는다. Preferably, the open reading frame encoding the genome editing tool is not unique to the virus that induces DdRp. The open reading frame under the control of the promoter to which DdRp binds does not encode any viral proteins. The open reading frame under the control of the promoter to which DdRp binds does not encode any full-length viral non-structural proteins or fragments thereof and/or does not encode any full-length viral structural proteins or fragments thereof.

DdRp가 결합하는 프로모터는 DdRp의 존재 하에서 유전체 편집 도구를 코팅하는 DNAge 발현 카세트의 전사를 지시할 수 있다. 따라서, 유전자 편집 도구가 발현하기 위해서, DdRp RNA 발현 카세트는 DNAge 발현 카세트와 함께 존재하는 경우에, 이들 프로모터는 유전체 편집 도구를 코팅하는 DNA 발현 카세트의 전사를 지시한다.The promoter to which DdRp binds can direct transcription of the DNAge expression cassette coating the genome editing tool in the presence of DdRp. Thus, for a gene editing tool to express, when the DdRp RNA expression cassette is present together with a DNAge expression cassette, these promoters direct transcription of the DNA expression cassette coating the genome editing tool.

DdRp가 결합하는 프로모터는 DdRp를 유도하는 바이러스에 고유한 것이다.The promoter to which DdRp binds is unique to the virus that induces DdRp.

DNAge 발현 카세트는 이종 핵산을 포함한다.DNAge expression cassettes contain heterologous nucleic acids.

본 발명의 DNAge 발현 카세트를 구성하는 DNAen는 표적화 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임을 포함한다. 표적화 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임은 DdRp를 유도하는 바이러스에 고유한 것이 아니다. 표적화 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임은 바이러스 구조 단백질을 코딩하지 않는다. 상기 표적화 엔도뉴클레아제는 코딩하는 유전자는 DdRp가 결합하는 프로모터의 제어하에 있다. 이것은 표적화 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임의 발현이 DdRp가 결합하는 프로모터의 제어하에 있게 한다.The DNAen constituting the DNAge expression cassette of the present invention includes an open reading frame encoding a targeting endonuclease. The open reading frame encoding the targeting endonuclease is not unique to viruses that induce DdRp. The open reading frame encoding the targeting endonuclease does not encode a viral structural protein. The gene encoding the targeting endonuclease is under the control of a promoter to which DdRp binds. This allows expression of the open reading frame encoding the targeting endonuclease under the control of the promoter to which DdRp binds.

DNAen 발현 카세트의 전사체는 5'캡을 포함한다.The transcript of the DNAen expression cassette contains a 5' cap.

본 발명의 DNAen 발현 카세트는 5'UTR 및/또는 3'UTR이 존재할 수 있다. DNAen 발현 카세트의 3'UTR는 3' 폴리(A) 서열을 포함한다.5'UTR and/or 3'UTR may be present in the DNAen expression cassette of the present invention. The 3'UTR of the DNAen expression cassette contains the 3' poly(A) sequence.

본 발명의 DNAen 발현 카세트는 G/C 함량, 코돈 최적화(optimization), UTR 변형, 30개 초과의 아데노신 뉴클레오타이드를 갖는 폴리(A) 꼬리, 폴리(C) 서열, 및 히스톤-스템-루프 서열로 이루어진 염기서열 변형(SM)을 포함할 수 있다.The DNAen expression cassette of the present invention consists of a G/C content, codon optimization, UTR modification, a poly(A) tail with more than 30 adenosine nucleotides, a poly(C) sequence, and a histone-stem-loop sequence. It may include a base sequence modification (SM).

본 발명의 DNAsg 발현 카세트는 선택된 유전체의 특정 표적화 염기서열에 관련된 RNA, sgRNA를 포함할 수도 있다. 본 발명의 DNAsg 발현 카세트는 DdRp가 결합하는 프로모터를 포함하거나, DdRp가 결합하는 프로모터 대신에 RNA 폴리머라제Ⅲ(Pol Ⅲ) 프로모터를 사용할 수도 있다.The DNAsg expression cassette of the present invention may include RNA or sgRNA related to a specific targeting nucleotide sequence of a selected genome. The DNAsg expression cassette of the present invention may include a promoter to which DdRp binds, or an RNA polymerase III (Pol III) promoter may be used instead of a promoter to which DdRp binds.

DdRp가 결합하는 프로모터는 DdRp를 유도하는 바이러스에 고유한 것이다. DdRp가 결합하는 프로모터는 바이러스의 구조 단백질에 대한 프로모터이다. 이것은 DdRp가 결합하는 프로모터가 바이러스에 고유한 것이고 상기 바이러스에서 하나 이상의 구조 단백질의 유전자 전사를 제어하는 것임을 의미한다.The promoter to which DdRp binds is unique to the virus that induces DdRp. The promoter to which DdRp binds is a promoter for structural proteins of the virus. This means that the promoter to which DdRp binds is unique to the virus and controls gene transcription of one or more structural proteins in the virus.

본 발명의 유전체 편집 RNA/DNA 시스템은 DdRp RNA 발현 카세트, 유전체 편집 도구를 코딩하는 DNAge를 포함하는 DNAge 발현 카세트 및 DdRp를 코딩하는 DNA를 포함하는 auto_DdRp 발현 카세트를 포함할 수 있다.The genome editing RNA/DNA system of the present invention may include a DdRp RNA expression cassette, a DNAge expression cassette comprising a DNAge encoding a genome editing tool, and an auto_DdRp expression cassette comprising DNA encoding DdRp.

상기 DdRp 또는 유전체 편집 도구를 코딩하는 DNA 절편을 포함하는 발현 카세트는 각각의 상류 방향에 DdRp가 결합하는 프로모터가 있거나 또는 상류 방향에 하나의 DdRp가 결합하는 프로모터가 있을 수 있다.The expression cassette comprising the DNA fragment encoding the DdRp or genome editing tool may have a promoter to which DdRp binds in each upstream direction or a promoter to which one DdRp binds in an upstream direction.

본 발명의 DdRp는 한 개의 서브유닛으로 구성된 DdRp를 선택하였다.For DdRp of the present invention, DdRp composed of one subunit was selected.

본 발명의 상기 DdRp RNA 발현 카세트는 핵-비의존적으로 세포질 내에서 전사를 시킬 수 있는 T7 RNA 폴리머라제, T3 RNA 폴리머라제및 SP6 RNA 폴리머라제를 포함하는 군에서 선택되어진 어느 하나의 발현을 증가시켜 표적 RNA를 장기간 지속적으로 발현시킬 수 있다.The DdRp RNA expression cassette of the present invention increases the expression of any one selected from the group comprising T7 RNA polymerase, T3 RNA polymerase and SP6 RNA polymerase, which can be nuclear-independently transcribed in the cytoplasm. Target RNA can be expressed continuously for a long period of time.

본 발명에 있어서, T7 RNA 폴리머라제는 T7 프로모터에 대한 특이성이 매우 높으며, T7 프로모터 하류의 DNA만을 전사할 수 있다. 따라서, 본 발명에서 T7 RNA 폴리머라제를 사용함으로써 세포 내에 다른 프로모터와 반응하지 않고 오직 T7 프로모터를 갖는 RNA 발현 카세트 및 auto_DdRp 발현 카세트에 결합 및 전사를 수행하게 되고, 높은 효율로 T7 RNA 폴리머라제자신을 자가전사하고 RNA를 전사하여 증폭할 수 있다.In the present invention, T7 RNA polymerase has very high specificity for the T7 promoter, and can transcribe only DNA downstream of the T7 promoter. Therefore, by using T7 RNA polymerase in the present invention, binding and transcription to the RNA expression cassette and auto_DdRp expression cassette having only the T7 promoter without reacting with other promoters in the cell are performed, and T7 RNA polymerase itself is produced with high efficiency. It can be self-transcribed and amplified by transcription of RNA.

상기 auto_DdRp 발현 카세트는 T7 RNA 폴리머라제발현 루프(loop)의 반복에 의해 상기 T7 RNA 폴리머라제를 세포질 내에서 자가전사시키는 것을 특징으로 한다. The auto_DdRp expression cassette is characterized in that it self-transcribes the T7 RNA polymerase in the cytoplasm by repeating the T7 RNA polymerase expression loop.

구체적으로, 상기 auto_DdRp 발현 카세트는 T7 프로모터, IRES(Internal ribosome entry site) 영역, T7 RNA 폴리머라제를 코딩하는 DNA 절편, 폴리 아데닌 꼬리(poly A tail) 및 T7 종결서열(termination)을 포함할 수 있으며, 이들이 작동 가능하게 연결되어 구성된 것일 수 있다. 상기 auto_DdRp 발현 카세트 내부에 포함된 IRES 영역은 viral IRES일 수 있으며, IRES-융합된 T7 폴리머라제 전사체를 생성함으로써 DdRp mRNA의 전사 안정성을 높일 뿐만 아니라, 세포질 내에서 T7 폴리머라제의 높은 발현효율을 유지할 수 있다.Specifically, the auto_DdRp expression cassette may include a T7 promoter, an internal ribosome entry site (IRES) region, a DNA fragment encoding T7 RNA polymerase, a poly A tail, and a T7 termination sequence. , they may be operatively connected and configured. The IRES region included in the auto_DdRp expression cassette may be a viral IRES, and by generating an IRES-fused T7 polymerase transcript, not only increases the transcriptional stability of DdRp mRNA, but also increases the expression efficiency of T7 polymerase in the cytoplasm. can keep

상기 자가전사는 본 발명 조성물을 구성하는 DdRp RNA 발현 카세트에 의해 합성되는 DdRp의 자가전사를 위한 auto_DdRp 발현 카세트에 의한 DdRp 발현 루프에 의해 수행될 수 있다. The self-transcription may be performed by the DdRp expression loop by the auto_DdRp expression cassette for self-transcription of DdRp synthesized by the DdRp RNA expression cassette constituting the composition of the present invention.

구체적으로, 상기 DdRp mRNA 또는 캡된 CM/SM DdRp mRNA가 세포질 내에서 리보솜에 의해 번역되어 DdRp를 생성하고, 생성된 DdRp는 상기 auto_DdRp 발현 카세트에 존재하는 프로모터를 인식하여 DdRp의 전사를 수행한다. 이후 생성된 DdRp mRNA는 세포질 내에서 다시 리보솜에 의해 번역되어 DdRp를 생성하는 것을 반복함으로써, DdRp의 자가전사가 이루어진다. 따라서, 본 발명의 조성물은 DdRp 발현 루프에 의해 자가전사된 DdRp를 세포질 내에서 장기간 고농도로 유지시킬 수 있음을 특징으로 한다.Specifically, the DdRp mRNA or capped CM/SM DdRp mRNA is translated by ribosomes in the cytoplasm to generate DdRp, and the resulting DdRp recognizes a promoter present in the auto_DdRp expression cassette and performs transcription of DdRp. After that, the generated DdRp mRNA is translated by ribosomes in the cytoplasm again to repeat the production of DdRp, whereby DdRp self-transcription is made. Accordingly, the composition of the present invention is characterized in that it can maintain DdRp self-transcribed by the DdRp expression loop at a high concentration for a long period of time in the cytoplasm.

이에, 본 발명은 DdRp RNA 발현 카세트; 및 DdRp 자가전사를 위한 DdRp 을 코딩하는 DNA를 포함하는 auto_DdRp 발현 카세트에 의해 수행되는 DdRp 발현 루프를 통해 핵-비의존적으로 세포질 내에서 DdRp mRNA를 장기간 고농도로 유지하고, 이에 따라 또한 DdRp 장기간 지속적으로 발현시키는 것을 특징으로 한다.Accordingly, the present invention provides a DdRp RNA expression cassette; and a DdRp expression loop carried by an auto_DdRp expression cassette comprising DNA encoding DdRp for DdRp self-transcription to maintain high concentration of DdRp mRNA in the cytoplasm for a long period of time in a nuclear-independent manner, and thus also DdRp continuously for a long period of time. It is characterized by expression.

캡핑은 거의 모든 진핵세포 메신저 RNA의 5'말단에서 발견된 특수한 구조이다. 가장 단순한 캡 구조, cap0은 1차 RNA의 말단에 결합된 5'5' 트리포스페이트 말단의 감마 포스페이트에 의해 결합되는 N7에서 메틸화된 구아닌 뉴클레오사이드 부가의 결과이다(즉, m7GpppN, 여기서 N은 임의의 염기이고, p는 포스페이트를 나타내며, m은 메틸 그룹이다). cap0의 형성은 일련의 3가지 효소 반응을 수반한다: RNA 트리포스파타제(RTPase)는 디포스페이트에 대한 발생 프리-mRNA의 5' 트리포스페이트 말단의 감마 포스페이트 잔기를 제거하고, RNA 구아닐릴트랜스퍼라제(GTase)는 GMP를 GTP로부터 디포스페이트 발생 RNA 말단으로 전달하며, RNA N7-구아닌 메틸트랜스퍼라제(N7-MTase)는 GpppN 캡에 구아닌의 질소 7상의 메틸 잔기를 부가한다.Capping is a special structure found at the 5' end of almost all eukaryotic messenger RNAs. The simplest cap structure, cap0, is the result of guanine nucleoside addition methylated at N7 bound by a gamma phosphate at the 5'5' triphosphate end bound to the end of the primary RNA (i.e., m 7 GpppN, where N is any base, p represents phosphate and m is a methyl group). The formation of cap0 involves a series of three enzymatic reactions: RNA triphosphatase (RTPase) removes the gamma phosphate residue at the 5' triphosphate terminus of the resulting pre-mRNA for diphosphate, and RNA guanylyltransferase ( GTase) transfers GMP from GTP to the diphosphate-generating RNA terminus, and RNA N7-guanine methyltransferase (N7-MTase) adds a methyl residue on nitrogen 7 of guanine to the GpppN cap.

보다 고급 진핵세포 및 일부 바이러스에서, 1차(즉, cap1 구조체; m7GpppNm2'-opN) 및 2차(즉, cap2 구제초; m7GpppNm2'-opNm2'-o) 전사된 뉴클레오티드의 리보스의 2'-하이드록실 그룹은 각각 cap1- 및 cap2-특이적 MTase로서 명명된 2개의 별개의 리보스-2'-O MTase에 의해 메틸화될 수 있다. In more advanced eukaryotes and some viruses, primary (ie, cap1 construct; m 7 GpppNm 2'-o pN) and secondary (ie, cap2 externa; m 7 GpppNm 2'-o pNm 2'-o ) transcription The 2'-hydroxyl group of the ribose of a given nucleotide can be methylated by two distinct ribose-2'-O MTases, termed cap1- and cap2-specific MTases, respectively.

그러나, 오로지 핵에 존재하는 세포 N7-MTase 활성과 대조적으로, cap1 리보스-2'-O MTase 활성은 헬라 세포의 세포질 및 핵 둘 다에서 검출된 반면, cap2 MTase 활성은 이들의 세포질에서 유일하게 발견되었다.However, in contrast to cellular N7-MTase activity, which is only present in the nucleus, cap1 ribose-2'-O MTase activity was detected both in the cytoplasm and nucleus of HeLa cells, whereas cap2 MTase activity was found only in their cytoplasm. became

5'말단 m7GpppN 캡의 형성은 프리-mRNA 프로세싱의 제1 단계이다. m7GpppN cap는 mRNA 안정성 및 핵으로부터 세포질로의 이의 수송에 중요한 역할을 담당한다.Formation of the 5'-end m 7 GpppN cap is the first step in pre-mRNA processing. The m 7 GpppN cap plays an important role in mRNA stability and its transport from the nucleus to the cytoplasm.

또한, 5'말단 m7GpppN 캡은 진핵세포 번역 개시 인자 4F(eIF4F) 복합체를 고정함으로써 단백질로의 mRNA의 번역에 중요하며, 상기 복합체는 작은 리보솜 서브유닛의 16S 부분의 mRNA로의 보충을 매개한다. 따라서, 5'말단 m7GpppN 캡은 시험관내 및 생체내 둘 다에서 mRNA의 번역을 현저히 향상시킨다. Furthermore, the 5'-terminal m 7 GpppN cap is important for the translation of mRNA into protein by anchoring the eukaryotic translation initiation factor 4F (eIF4F) complex, which mediates the recruitment of the 16S portion of the small ribosomal subunit into mRNA. . Thus, the 5'-terminal m 7 GpppN cap significantly enhances the translation of mRNA both in vitro and in vivo.

본 발명의 auto_DdRp 발현카세트의 DdRp는 DdRp 그 자가, 또는 RNA 트리포스파타제(RNA triphosphatase)의 촉매 도메인, 구아닐릴트랜스퍼라제(guanylyltransferase)의 촉매 도메인, N7-구아닌 메틸트랜스퍼라제(N7-guanine methyltransferase) 및 DdRp(DNA-dependant RNA polymerase)의 촉매 도메인을 포함하는 키메라 효소가, 세포독성 및 아폽토시스의 유도 없이, 진핵세포 번역 장치에 의해 고도로 해독 가능한 5'말단 m7GpppN 캡을 갖는 RNA 분자를 합성한다는 보고(한국, 공개특허 10-2013-0069632)를 기반으로 하는 키메라 효소를 사용하여 제작하였다.DdRp of the auto_DdRp expression cassette of the present invention is DdRp itself, or the catalytic domain of RNA triphosphatase, the catalytic domain of guanylyltransferase, N7-guanine methyltransferase, and A report that a chimeric enzyme comprising a catalytic domain of DNA-dependent RNA polymerase (DdRp) synthesizes an RNA molecule with a 5'-terminal m7GpppN cap highly translatable by a eukaryotic translation apparatus without induction of cytotoxicity and apoptosis (Korea) , was prepared using a chimeric enzyme based on Patent Publication No. 10-2013-0069632).

본 발명은 적어도 하나의, 특히 RNA 트리포스파타제의 촉매 도메인, 적어도 하나의, 특히 구아닐릴트랜스퍼라제의 촉매 도메인, 적어도 하나의, 특히 N7-구아닌 메틸트랜스퍼라제의 촉매 도메인, 및 적어도 하나의, 특히 DdRp의 촉매 도메인을 포함하는 키메라 효소에 관한 것이다.The present invention relates to at least one, in particular catalytic domain of RNA triphosphatase, at least one, in particular catalytic domain of guanylyltransferase, at least one, in particular catalytic domain of N7-guanine methyltransferase, and at least one, in particular It relates to a chimeric enzyme comprising the catalytic domain of DdRp.

특히, 본 발명에 따르는 키메라 효소는 5'말단 m7 GpppN 캡을 갖는 RNA 분자를 합성할 수 있다.In particular, the chimeric enzyme according to the present invention is capable of synthesizing RNA molecules having a 5'-terminal m7 GpppN cap.

키메라 효소는 자연에서 발견되는 천연 효소가 아닌 효소를 지칭한다. 따라서, 키메라 효소는, 자연에서 발견된 것과는 상이한 방식으로 배열된, 상이한 공급원(예: 상이한 효소)으로부터 유래된 촉매 도메인 또는 동일한 공급원(예: 동일한 효소)으로부터 유래된 촉매 도메인을 포함할 수 있다. 키메라 효소는 단량체성(즉, 단일 단위) 효소 뿐만 아니라 올리고머성(즉, 복수 단위) 효소, 특히 헤테로-올리고머성 효소를 포함한다. 단량체성 효소는 단지 하나의 폴리펩티드 쇄로 이루어진 단일-단위 효소와 관련된다.A chimeric enzyme refers to an enzyme that is not a natural enzyme found in nature. Thus, a chimeric enzyme may comprise catalytic domains derived from different sources (eg, different enzymes) or catalytic domains derived from the same source (eg, the same enzyme), arranged in a manner different from that found in nature. Chimeric enzymes include monomeric (ie single unit) enzymes as well as oligomeric (ie multiple unit) enzymes, particularly hetero-oligomeric enzymes. Monomeric enzymes refer to single-unit enzymes consisting of only one polypeptide chain.

특히, RNA 트리포스파타제, 구아닐릴트랜스퍼라제, N7 -구아닌 메틸트랜스퍼라제및 DdRp의 상기 촉매 도메인들은 함께 공유 및/또는 비공유적으로 연결되어 있다.In particular, the catalytic domains of RNA triphosphatase, guanylyltransferase, N7-guanine methyltransferase and DdRp are covalently and/or non-covalently linked together.

특히, RNA 트리포스파타제, 구아닐릴트랜스퍼라제, N7 -구아닌 메틸트랜스퍼라제및 DdRp의 상기 촉매 도메인은 함께 작동적으로 연결되어, 5'말단 m7 GpppN 캡을 갖는 RNA 분자를 합성한다.In particular, the catalytic domains of RNA triphosphatase, guanylyltransferase, N7-guanine methyltransferase and DdRp are operatively linked together to synthesize an RNA molecule with a 5'-terminal m7 GpppN cap.

특히, 적어도 하나의, 특히 RNA 트리포스파타제의 촉매 도메인, 적어도 하나의, 특히 구아닐릴트랜스퍼라제의 촉매 도메인, 적어도 하나의, 특히 N7 -구아닌 메틸트랜스퍼라제의 촉매 도메인 및 적어도 하나의, 특히 DdRp의 촉매 도메인(여기서, 상기 촉매 도메인 중의 적어도 2개는 바람직하게는 이들의 말단(N 또는 C 말단)에서 함께 공유 또는 비공유적으로 연결되고, 보다 특히는 상기 적어도 하나의, 특히 RNA 트리포스파타제의 촉매 도메인, 상기 적어도 하나의, 특히 구아닐릴트랜스퍼라제의 촉매 도메인, 적어도 하나의, 특히 N7 -구아닌 메틸트랜스퍼라제의 촉매 도메인으로 이루어진 그룹으로부터 선택된 적어도 하나의 촉매 도메인은 바람직하게는 이의 말단(N 또는 C 말단)에서 공유 또는 비공유적으로 연결된다)을 포함하는 본 발명의 키메라 효소는 상기 적어도 하나의, 특히 DdRp의 촉매 도메인과 바람직하게는 이의 말단(N 또는 C 말단)에서 연결된다.In particular, at least one, in particular a catalytic domain of RNA triphosphatase, at least one, in particular catalytic domain of guanylyltransferase, at least one, in particular catalytic domain of N7-guanine methyltransferase and at least one, in particular DdRp catalytic domains, wherein at least two of said catalytic domains are linked together covalently or non-covalently, preferably at their termini (N or C terminus), more particularly said at least one, in particular catalytic domain of RNA triphosphatase , said at least one, in particular catalytic domain of guanylyltransferase, at least one, in particular at least one catalytic domain selected from the group consisting of catalytic domain of N7-guanine methyltransferase, preferably at its terminus (N or C The chimeric enzyme of the present invention comprising a covalently or non-covalently linked terminal) is linked with said at least one, in particular, the catalytic domain of DdRp, preferably at its terminus (N or C terminus).

특히, 본 발명은 적어도 하나의, 특히 RNA 트리포스파타제의 촉매 도메인, 적어도 하나의, 특히 구아닐릴트랜스퍼라제의 촉매 도메인, 적어도 하나의, 특히 N7 -구아닌 메틸트랜스퍼라제의 촉매 도메인 및 적어도 하나의, 특히 DdRp의 촉매적 도메인을 포함하는 본 발명의 키메라 효소에 관한 것이며, 단 RNA 트리포스파타제의 촉매 도메인, 구아닐릴트랜스퍼라제의 촉매 도메인, N7 -구아닌 메틸트랜스퍼라제의 촉매 도메인 및 핵 진핵세포 DdRpI, II 및/또는 III의 유일한 촉매 도메인; 및 보다 특히는, DdRpII의 유일한 촉매 도메인(들)을 포함하는 키메라 효소는 제외된다.In particular, the present invention relates to at least one, in particular a catalytic domain of RNA triphosphatase, at least one, in particular a catalytic domain of guanylyltransferase, at least one, in particular a catalytic domain of N7-guanine methyltransferase, and at least one, It relates in particular to the chimeric enzyme of the present invention comprising the catalytic domain of DdRp, provided that the catalytic domain of RNA triphosphatase, the catalytic domain of guanylyltransferase, the catalytic domain of N7-guanine methyltransferase and the nuclear eukaryotic DdRpI, only catalytic domains of II and/or III; and more particularly, chimeric enzymes comprising the only catalytic domain(s) of DdRpII.

특히, 본 발명은 적어도 하나의, 특히 RNA 트리포스파타제의 촉매 도메인, 적어도 하나의, 특히 구아닐릴트랜스퍼라제의 촉매 도메인, 적어도 하나의, 특히 N7 -구아닌 메틸트랜스퍼라제의 촉매 도메인 및 적어도 하나의, 특히 DdRp의 촉매적 도메인을 포함하는 본 발명의 키메라 효소에 관한 것이며, 단 RNA 트리포스파타제의 촉매 도메인, 구아닐릴트랜스퍼라제의 촉매 도메인, N7 -구아닌 메틸트랜스퍼라제의 촉매 도메인 및 핵 진핵세포 DdRpI, II 및/또는 III의 촉매 도메인; 및 보다 특히는, DdRpII의 적어도 하나의 촉매 도메인을 포함하는 키메라 효소는 제외된다.In particular, the present invention relates to at least one, in particular a catalytic domain of RNA triphosphatase, at least one, in particular a catalytic domain of guanylyltransferase, at least one, in particular a catalytic domain of N7-guanine methyltransferase, and at least one, It relates in particular to the chimeric enzyme of the present invention comprising the catalytic domain of DdRp, provided that the catalytic domain of RNA triphosphatase, the catalytic domain of guanylyltransferase, the catalytic domain of N7-guanine methyltransferase and the nuclear eukaryotic DdRpI, catalytic domains of II and/or III; and more particularly, chimeric enzymes comprising at least one catalytic domain of DdRpII.

특히, 진핵 숙주 세포에서 발현시키면, 본 발명에 따르는 상기 키메라 효소는, 바람직하게는 진핵세포 번역 장치에 의해 번역가능한, 5'말단 m7 GpppN 캡을 갖는 RNA 분자를 합성할 수 있다.In particular, when expressed in a eukaryotic host cell, the chimeric enzyme according to the present invention is capable of synthesizing an RNA molecule having a 5' terminal m7 GpppN cap, preferably translatable by a eukaryotic translation apparatus.

특히, 진핵 숙주 세포에서 발현시키면, RNA 트리포스파타제, 구아닐릴트랜스퍼라제및 N7 -구아닌 메틸트랜스퍼라제의 상기 촉매 도메인은 DdRp의 상기 촉매 도메인에 의해 합성된 RNA 분자의 5'말단에서 m7 GpppN 캡을 부가할 수 있고, 바람직하게는 5'말단 m7 GpppN 캡을 갖는 상기 RNA 분자는 진핵세포 번역 장치에 의해 번역할 수 있다.In particular, when expressed in eukaryotic host cells, the catalytic domains of RNA triphosphatase, guanylyltransferase and N7-guanine methyltransferase bind the m7 GpppN cap at the 5' end of the RNA molecule synthesized by the catalytic domain of DdRp. The RNA molecule, which can be added, preferably having a 5'-terminal m7 GpppN cap, can be translated by a eukaryotic translation apparatus.

특히, 진핵 숙주 세포에서 발현시키면, DdRp의 상기 촉매 도메인이 박테리오파지 DdRp의 촉매 도메인인 경우, RNA 트리포스파타제, 구아닐릴트랜스퍼라제및 N7-구아닌 메틸트랜스퍼라제의 상기 촉매 도메인은, 이들의 5' 말단에서 구아노신 리보뉴클레오티드를 갖는 RNA 분자의 5'말단에 m7GpppN 캡을 부가할 수 있다.In particular, when expressed in eukaryotic host cells, when the catalytic domain of DdRp is the catalytic domain of bacteriophage DdRp, the catalytic domains of RNA triphosphatase, guanylyltransferase and N7-guanine methyltransferase are at their 5' ends m7GpppN cap can be added to the 5' end of the RNA molecule having a guanosine ribonucleotide in

특히, 진핵 숙주 세포에서 발현시키면, DdRp의 상기 촉매 도메인이 박테리아 DNA-의존성RNA 폴리머라제의 촉매 도메인인 경우, RNA 트리포스파타제, 구아닐릴트랜스퍼라제및 N7-구아닌 메틸트랜스퍼라제의 상기 촉매 도메인은, 이들의 5'말단에서 구아노신 또는 아데노신 리보뉴클레오티드를 갖는 RNA 분자의 5'말단에서 m7GpppN 캡을 부가할 수 있다.In particular, when expressed in a eukaryotic host cell, when the catalytic domain of DdRp is the catalytic domain of a bacterial DNA-dependent RNA polymerase, the catalytic domain of RNA triphosphatase, guanylyltransferase and N7-guanine methyltransferase is An m7GpppN cap can be added at the 5' end of RNA molecules having guanosine or adenosine ribonucleotides at their 5' end.

특히, 진핵 숙주 세포에서 발현시키면, DdRp의 상기 촉매 도메인이 사람 또는 마우스 미토콘드리아 DdRp의 촉매 도메인인 경우, RNA 트리포스파타제, 구아닐릴트랜스퍼라제및 N7-구아닌 메틸트랜스퍼라제의 상기 촉매 도메인은, 이들의 5' 말단에서 아데노신 또는 티미딘 리보뉴클레오티드를 갖는 RNA 분자의 5'말단에서 m7GpppN 캡을 부가할 수 있다.In particular, when expressed in eukaryotic host cells, when the catalytic domain of DdRp is the catalytic domain of human or mouse mitochondrial DdRp, the catalytic domains of RNA triphosphatase, guanylyltransferase and N7-guanine methyltransferase are An m7GpppN cap can be added at the 5' end of the RNA molecule with adenosine or thymidine ribonucleotides at the 5' end.

효소의 촉매 도메인은, 특히 이의 3차원 구조에서, 효소 기능을 보장하기에 필요하고 충분한 도메인에 관한 것이다. 예를 들면, RNA 트리포스파타제의 촉매 도메인은 RNA 트리포스파타제기능을 보장하기에 필요하고 충분한 도메인이다. 용어 "촉매 도메인"은 야생형 또는 돌연변이체 효소의 촉매 도메인을 포함한다.The catalytic domain of an enzyme relates to a domain that is necessary and sufficient to ensure enzyme function, especially in its three-dimensional structure. For example, the catalytic domain of RNA triphosphatase is a necessary and sufficient domain to ensure RNA triphosphatase function. The term “catalytic domain” includes the catalytic domain of a wild-type or mutant enzyme.

본 발명의 키메라 효소는 적어도 상기 촉매 도메인을 포함하지만, 상기 촉매 도메인을 함유하는 효소 전체 또는 일부분을 추가로 포함할 수 있다. 실제로, 본 발명에 따르는 키메라 효소의 한 가지 양태에 따라, DdRp의 상기 촉매 도메인은 DdRp, 바람직하게는 단량체성 DdRp의 전부 또는 일부에 포함될 수 있다. RNA 트리포스파타제의 상기 촉매 도메인, 구아닐릴트랜스퍼라제의 상기 촉매 도메인 및 N7-구아닌 메틸트랜스퍼라제의 상기 촉매 도메인은 또한 캡핑 효소, 바람직하게는 단량체성 캡핑 효소의 전부 또는 일부에 포함될 수 있다.The chimeric enzyme of the present invention includes at least the catalytic domain, but may further include all or a part of the enzyme containing the catalytic domain. Indeed, according to one aspect of the chimeric enzyme according to the invention, said catalytic domain of DdRp may be comprised in all or part of a DdRp, preferably a monomeric DdRp. Said catalytic domain of RNA triphosphatase, said catalytic domain of guanylyltransferase and said catalytic domain of N7-guanine methyltransferase may also be included in all or part of a capping enzyme, preferably a monomeric capping enzyme.

본 발명의 키메라 효소는 핵 효소, 아세포 구획 효소(subcellular compartment enzyme) 또는 세포질 효소일 수 있다. 따라서, 본 발명에 따르는 키메라 효소는, 세포에서 효소의 전달을 유도하는, 당해 기술분야의 통상의 지식을 가진 자에게 공지된 시그날 펩티드 또는 마커-시그날을 포함할 수 있다. 예를 들면, 본 발명에 따르는 키메라 효소는 당해 효소를 핵으로 유도하는 핵국지화신호(NLS)을 포함할 수 있다. 이러한 NLS는 종종 5개의 기본적 양전하 아미노산으로 이루어진 단위이다. NLS는 펩티드 쇄 상의 어느 곳에도 위치할 수 있다.The chimeric enzyme of the present invention may be a nuclear enzyme, a subcellular compartment enzyme or a cytoplasmic enzyme. Thus, the chimeric enzyme according to the present invention may comprise a signal peptide or marker-signal known to one of ordinary skill in the art that induces delivery of the enzyme in a cell. For example, the chimeric enzyme according to the present invention may include a nuclear localization signal (NLS) that directs the enzyme to the nucleus. These NLSs are often units of five basic positively charged amino acids. The NLS can be located anywhere on the peptide chain.

키메라 효소는 세포질 키메라 효소일 경우, 세포질을 제외하고는, 당해 효소의 전달을 유도하는 시그날 펩티드 또는 마커-시그날을 포함하지 않는다.A chimeric enzyme does not contain a signal peptide or marker-signal that induces the transfer of the enzyme, except to the cytoplasm, when it is a cytoplasmic chimeric enzyme.

본 발명의 키메라 효소의 세포질 국지화는, 세포질로부터 진핵 세포의 핵으로의 거대 DNA 분자(즉, 도입유전자)의 활발한 이동 및 핵으로부터 세포질로의 RNA 분자의 이출을 피함으로써 도입유전자 발현 수준을 최적화시키는 잇점을 갖는다.Cytoplasmic localization of the chimeric enzyme of the present invention optimizes transgene expression levels by avoiding the vigorous movement of large DNA molecules (i.e., transgenes) from the cytoplasm to the nucleus of eukaryotic cells and export of RNA molecules from the nucleus to the cytoplasm. have an advantage

따라서, 본 발명의 이들 세포질 키메라 효소는, 현저히 높은 양의 형질감염된 DNA가 핵과 비교하여 통상 발견되는 세포질에서 작동할 수 있는, 숙주 독립적, 진핵세포 유전자 발현시스템을 생성하는데 유용할 수 있다.Accordingly, these cytoplasmic chimeric enzymes of the present invention may be useful for generating host-independent, eukaryotic gene expression systems capable of operating in the cytoplasm where significantly higher amounts of transfected DNA are normally found compared to the nucleus.

본 발명의 이들 세포질 키메라 효소는, 세포독성 및 아폽토시스 유도 없이, 진핵세포 세포질 번역 장치에 의해 고도로 번역가능한, 5'말단 m7GpppN 캡을 갖는 RNA 분자를 합성할 수 있다.These cytoplasmic chimeric enzymes of the present invention are capable of synthesizing RNA molecules with a 5'-terminal m7GpppN cap, highly translatable by the eukaryotic cytoplasmic translation apparatus, without cytotoxicity and induction of apoptosis.

내인성 유전자 전사가, 세포질에서 일어나는 도입유전자 전사와 대조적으로, 진핵 세포의 핵에서 일어나기 때문에, 내인성 유전자 잔사와 도입유전자 전사 사이에 경쟁이 없다.Since endogenous gene transcription occurs in the nucleus of eukaryotic cells, as opposed to transgene transcription that occurs in the cytoplasm, there is no competition between endogenous gene residues and transgene transcription.

따라서, 본 발명의 세포질 키메라 효소는 특히 대규모 분석 및 단백질 생산에 적절하다.Therefore, the cytoplasmic chimeric enzyme of the present invention is particularly suitable for large-scale analysis and protein production.

본 발명의 키메라 효소에서, RNA 트리포스파타제의 상기 촉매 도메인, 구아닐릴트랜스퍼라제의 상기 촉매 도메인 및 N7-구아닌 메틸트랜스퍼라제의 상기 촉매 도메인은 단량체, 즉 하나의 폴리펩티드에 포함된다. 예를 들면, 상기 단량체는 본 발명에 따르는 단량체성 캡핑 효소 또는 단량체성 키메라 효소일 수 있다.In the chimeric enzyme of the present invention, the catalytic domain of RNA triphosphatase, the catalytic domain of guanylyltransferase and the catalytic domain of N7-guanine methyltransferase are contained in a monomer, ie, one polypeptide. For example, the monomer may be a monomeric capping enzyme or a monomeric chimeric enzyme according to the present invention.

특히, RNA 트리포스파타제의 상기 촉매 도메인, 구아닐릴트랜스퍼라제의 상기 촉매 도메인 및 N7-구아닌 메틸트랜스퍼라제의 상기 촉매 도메인은 단량체성 캡핑 효소에 포함된다. 이 경우, 본 발명의 키메라 효소는 단량체성 캡핑 효소를 포함하고, 이 효소는 RNA 트리포스파타제의 상기 촉매 도메인, 구아닐릴트랜스퍼라제의 상기 촉매 도메인 및 N7-구아닌 메틸트랜스퍼라제의 상기 촉매 도메인을 포함한다. 상기 단량체성 캡핑 효소는, RNA 분자의 5'말단에서 m7GpppN 캡을 부가할 수 있는, 특히 야생형 청설병 바이러스 캡핑 효소, 야생형 대나무 모자이크 바이러스 캡핑 효소, 야생형 아프리카 돼지열 바이러스 캡핑 효소, 야생형 아칸트아메바 폴리파가 미미바이러스(acanthamoeba polyphaga mimivirus) 캡핑 효소 및 이의 돌연변이체 및 유도체로 이루어진 그룹으로 부터 선택된 단량체성 바이러스 캡핑 효소 및 보다 특히는 야생형 아프리카 돼지열 바이러스 캡핑 효소일 수 있다.In particular, the catalytic domain of RNA triphosphatase, the catalytic domain of guanylyltransferase and the catalytic domain of N7-guanine methyltransferase are comprised in a monomeric capping enzyme. In this case, the chimeric enzyme of the present invention comprises a monomeric capping enzyme, wherein the enzyme comprises the catalytic domain of RNA triphosphatase, the catalytic domain of guanylyltransferase and the catalytic domain of N7-guanine methyltransferase. do. The monomeric capping enzyme is capable of adding an m7GpppN cap at the 5' end of the RNA molecule, in particular a wild-type blue eye virus capping enzyme, a wild-type bamboo mosaic virus capping enzyme, a wild-type African swine fever virus capping enzyme, a wild-type Acanthamoeba poly a monomeric viral capping enzyme selected from the group consisting of an acanthamoeba polyphaga mimivirus capping enzyme and mutants and derivatives thereof, and more particularly a wild-type African swine fever virus capping enzyme.

특히, DdRp의 상기 촉매 도메인은 또한 단량체, 즉 하나의 폴리펩티드에 포함될 수 있다.In particular, said catalytic domain of DdRp may also be comprised in a monomer, ie in one polypeptide.

예를 들면, 상기 단량체는 본 발명에 따르는 단량체성 DdRp또는 단량체성 키메라 효소일 수 있다.For example, the monomer may be a monomeric DdRp or a monomeric chimeric enzyme according to the present invention.

특히, DdRp의 상기 촉매 도메인은 단량체성 DdRp에 포함된다. 이 경우, 본 발명의 키메라 효소는, DdRp의 상기 촉매 도메인을 포함하는, 단량체성 DdRp를 포함한다. 상기 단량체성 DdRp는 단량체성 파지 DdRp일 수 있고, 특히 5' → 3' 방향에서 이중가닥 주형 DNA에 서열 상보성이 있는 단일가닥 RNA를 합성할 수 있는, T7 RNA 폴리머라제, T3 RNA 폴리머라제및 SP6 RNA 폴리머라제및 이의 돌연변이체 또는 유도체로 이루어진 그룹에서 선택될 수 있고, 보다 특히, 5' → 3' 방향에서 이중가닥 주형 DNA에 서열 상보성이 있는 단일가닥 RNA를 합성할 수 있는 T7 RNA 폴리머라제및 이의 돌연변이체 또는 유도체로 이루어진 그룹에서 선택될 수 있다.In particular, said catalytic domain of DdRp is comprised in monomeric DdRp. In this case, the chimeric enzyme of the present invention contains a monomeric DdRp comprising the catalytic domain of DdRp. The monomeric DdRp may be a monomeric phage DdRp, in particular T7 RNA polymerase, T3 RNA polymerase and SP6, capable of synthesizing single-stranded RNA with sequence complementarity to double-stranded template DNA in the 5' to 3' direction. T7 RNA polymerase, which may be selected from the group consisting of RNA polymerase and mutants or derivatives thereof, and more particularly, capable of synthesizing single-stranded RNA having sequence complementarity to double-stranded template DNA in the 5' to 3' direction; and It may be selected from the group consisting of mutants or derivatives thereof.

DdRp의 상기 촉매 도메인 및 RNA 트리포스파타제의 상기 촉매 도메인 구아닐릴트랜스퍼라제의 상기 촉매 도메인 및 N7 -구아닌 메틸트랜스퍼라제의 상기 촉매 도메인으로 이루어진 그룹에서 선택된 적어도 2개 및 보다 바람직하게는 전체 촉매 도메인은 단량체에 포함될 수 있다.At least two selected from the group consisting of the catalytic domain of DdRp and the catalytic domain of RNA triphosphatase, the catalytic domain of guanylyltransferase and the catalytic domain of N7-guanine methyltransferase, and more preferably the entire catalytic domain is may be included in the monomer.

본 발명의 키메라 효소는 단량체성 또는 올리고머성일 수 있다. 실제로, RNA 트리포스파타제, 구아닐릴트랜스퍼라제, N7-구아닌 메틸트랜스퍼라제및 DdRp의 상기 촉매 도메인은 하나 또는 수개의 폴리펩티드에 포함될 수 있다.The chimeric enzymes of the present invention may be monomeric or oligomeric. Indeed, the catalytic domains of RNA triphosphatase, guanylyltransferase, N7-guanine methyltransferase and DdRp may be included in one or several polypeptides.

바람직하게는, 본 발명의 키메라 효소는 단량체성일 수 있다.Preferably, the chimeric enzyme of the present invention may be monomeric.

실제로, 본 발명은 RNA 트리포스파타제의 촉매 도메인, 구아닐릴트랜스퍼라제의 촉매 도메인, N7 -구아닌 메틸트랜스퍼라제의 촉매 도메인 및 DdRp의 촉매 도메인을 포함하는 단량체성 키메라 효소가, 세포독성 및 아폽토시스 유도 없이, 진핵 번역 장치에 의해 고도로 번역가능한, 5'말단 m7GpppN 캡을 갖는 RNA 분자를 합성할 수 다는 보고를 확인하였다.Indeed, the present invention relates to a monomeric chimeric enzyme comprising the catalytic domain of RNA triphosphatase, the catalytic domain of guanylyltransferase, the catalytic domain of N7-guanine methyltransferase and the catalytic domain of DdRp, without inducing cytotoxicity and apoptosis. , confirmed the report that it is possible to synthesize an RNA molecule with a 5'-terminal m7GpppN cap, which is highly translatable by a eukaryotic translation apparatus.

이들의 천연 구조로 유지되어야 하는, 입체 장애 및 성분 및 효소에 기인하여, 전사체의 캡핑이 단량체성 효소로 발생다는 것은 자명하지 않다. 실제로, T7 전사체의 캡핑은, 발생 RNA 분자의 5'말단에서 m7GpppN 캡을 유발하는 것으로 가정하더라도, 융합 효소 CTD-T7 RNA 폴리머라제에 의해 달성될 수 없다.Due to steric hindrances and components and enzymes, which must remain in their native structure, it is not self-evident that capping of transcripts occurs with monomeric enzymes. Indeed, capping of the T7 transcript cannot be achieved by the fusion enzyme CTD-T7 RNA polymerase, even assuming that it causes an m7GpppN cap at the 5' end of the developing RNA molecule.

본 발명의 단량체성 키메라 효소는, 특히 저렴하고 신속하며 실시가 용이하여 대규모 분석 및 단백질 생산에 상당히 적절하다는 잇점을 갖는다. 실제로, 단량체성 효소의 생산은 올리고머성 효소보다 더욱 용이하다. 또한, 단일-단위만이 존재하기 때문에, 단위 조립 문제가 없다. 단량체성 효소는 또한 다량체성 효소보다 조작이 보다 용이하다.The monomeric chimeric enzymes of the present invention have the advantage of being particularly inexpensive, rapid and easy to implement, making them highly suitable for large-scale assays and protein production. Indeed, the production of monomeric enzymes is easier than oligomeric enzymes. Also, since only single-units exist, there is no problem of unit assembly. Monomeric enzymes are also easier to manipulate than multimeric enzymes.

DdRp(RNAP)는 5'→3' 방향에서 이중가닥 주형 DNA에 서열 상보성이 있는 RNA를 합성하는 뉴클레오티딜 트랜스퍼라제에 관한 것이다.DdRp (RNAP) relates to a nucleotidyl transferase that synthesizes RNA with sequence complementarity to double-stranded template DNA in the 5'→3' direction.

바람직하게는, DdRp의 상기 촉매 도메인은 효소의 촉매 도메인이고, 이는 비교적 단순한 구조이고 보다 바람직하게는 게놈 효소 조절 요소(즉, 프로모터, 전사 종결 시그날 및 연쇄 접합)를 특성화한다. 따라서, 특히, DdRp의 상기 촉매 도메인은 박테리오파지 DdRp, 박테리아 DdRp또는 각종 진핵세포 세포기관(예: 미토콘드리아, 엽록체 및 전색소체)의 DdRp의 촉매 도메인일 수 있다.Preferably, said catalytic domain of DdRp is the catalytic domain of an enzyme, which has a relatively simple structure and more preferably characterizes genomic enzyme regulatory elements (ie promoter, transcription termination signal and chain splicing). Thus, in particular, the catalytic domain of DdRp may be the catalytic domain of a bacteriophage DdRp, a bacterial DdRp or a DdRp of various eukaryotic organelles (eg, mitochondria, chloroplasts and prochromosomes).

본 발명에서, DdRp의 상기 촉매 도메인은 박테리오파지 DdRp의 촉매 도메인이다. 박테리오파지 DdRp는 특히 진핵세포 RNA 폴리머라제보다 높은 처리능을 가짐으로써 도입 유전자 발현 수준을 최적화하는 잇점을 상당히 갖는다. 박테리오파지 DdRp는 또한, 다중 서브유닛(예: RNA 폴리머라제II)와 함께 복잡한 구조를 갖는 대부분 핵 진핵세포 폴리머라제보다 훨씬 단순한 구조를 갖는다. 지금까지 특성화된 대부분의 박테리오파지 DdRp는 단일-서브유닛 효소이고, 이는 전사의 개시, 신장 또는 종결을 위해 보조 단백질을 필요로 하지 않는다. 클로닝된 박테리오파지에 대해 명명화된 이들 효소 중의 몇가지는 또한 잘 특성화된 조절 게놈 요소(즉, 프로모터, 종결 시그날, 전사 정지 서열)을 갖고, 이들은 유전자도입에 중요하다.In the present invention, the catalytic domain of DdRp is the catalytic domain of bacteriophage DdRp. Bacteriophage DdRp has a significant advantage in optimizing transgene expression levels, especially by having a higher processing capacity than eukaryotic RNA polymerase. Bacteriophage DdRp also has a much simpler structure than most nuclear eukaryotic polymerases, which have a complex structure with multiple subunits (eg RNA polymerase II). Most bacteriophage DdRp characterized to date are single-subunit enzymes, which do not require helper proteins for initiation, elongation or termination of transcription. Several of these enzymes named for cloned bacteriophages also have well-characterized regulatory genomic elements (ie, promoters, termination signals, transcriptional stop sequences), which are important for transduction.

또한, 내인성 유전자 전사와 도입유전자 전사 사이에 경쟁이 없다. 박테리오파지 DNA 의존성 RNA-폴리머라제잔기를 포함하는 본 발명에 따르는 키메라 효소는, 임의의 진핵세포 종(예: 효모, 설치류 및 사람)에서 RNA 전사체의 생산을 가능하게 한다. 이들은 저렴하고 신속하며 실시가 용이하여 대규모 분석 및 단백질 생산에 적절하고, RNA 폴리머라제II 등의 진핵세포 RNA 폴리머라제와 대조적으로, 대부분의 박테리오파지 DdRp가 전사의 개시, 신장 또는 종결을 위해 관련 인자를 필요로 하지 않기 때문에, 임의의 생물학적 시스템(예: 세포 반응 혼합물, 배양된 세포 및 살아있는 생물체)에서 RNA 전사체의 생산을 가능하게 한다.Also, there is no competition between endogenous gene transcription and transgene transcription. The chimeric enzyme according to the invention comprising a bacteriophage DNA dependent RNA-polymerase residue enables the production of RNA transcripts in any eukaryotic species (eg yeast, rodent and human). They are inexpensive, rapid, and easy to perform, making them suitable for large-scale analysis and protein production, and in contrast to eukaryotic RNA polymerases such as RNA polymerase II, most bacteriophage DdRp do not contain relevant factors for initiation, elongation or termination of transcription. Because it is not required, it enables the production of RNA transcripts in any biological system (eg, cellular reaction mixtures, cultured cells and living organisms).

박테리오파지 DdRp의 상기 촉매 도메인은 박테리오파지 DdRp의 촉매 도메인, 특히 T7 RNA 폴리머라제의 야생형, T3 RNA 폴리머라제의 야생형(NCBI 게놈 서열 ID# NC_003298; GeneID# 927437; UniProtKB/Swiss-Prot ID# Q778M8), K11 RNA 폴리머라제의 야생형(NCBI 게놈 K11 RNAP 서열ID# NC_004665; GeneID# 1258850; UniProtKB/Swiss-Prot ID# Q859H5), ψA1122 RNA 폴리머라제의 야생형(NCBI 게놈 서열 ID# NC_004777; GeneID# 1733944; UniProtKB/Swiss-Prot 단백질 ID# Q858N4), ψYeo3-12 RNA 폴리머라제의 야생형(NCBI 게놈 서열 ID# NC_001271; GeneID# 1262422; UniProtKB/Swiss-Prot ID# Q9T145) 및 gh-1 RNA 폴리머라제의 야생형(NCBI 게놈 서열 ID# NC 004665; GeneID# 1258850; UniProtKB/Swiss-Prot 단백질 ID#Q859H5), K1-5 RNAP RNA 폴리머라제의 야생형(NCBI 게놈 서열 ID# NC_008125; GeneID# 5075932 UniProtKB/Swiss-Prot 단백질 ID# Q8SCG8) 및 SP6 RNA 폴리머라제의 야생형(NCBI 게놈 서열 ID# NC_004831; GeneID# 1481778; UniProtKB/Swiss-Prot 단백질 ID# Q7Y5R1) 및 이의 돌연변이체 또는 유도체로 이루어진 그룹에서 선택된 촉매 도메인일 수 있고, 이들은 5'→3' 방향에서 이중가닥 주형 DNA에 서열 상보성이 있는 단일가닥 RNA를 합성할 수 있고, 보다 특히는 T7 RNA 폴리머라제의 촉매 도메인일 수 있다.Said catalytic domain of bacteriophage DdRp is the catalytic domain of bacteriophage DdRp, in particular wild type of T7 RNA polymerase, wild type of T3 RNA polymerase (NCBI genomic sequence ID# NC_003298; GeneID# 927437; UniProtKB/Swiss-Prot ID# Q778M8), K11 Wild type of RNA polymerase (NCBI genomic K11 RNAP sequence ID# NC_004665; GeneID# 1258850; UniProtKB/Swiss-Prot ID# Q859H5), wild type of ψA1122 RNA polymerase (NCBI genome sequence ID# NC_004777; GeneID# 1733944; UniProtKB/Swiss) -Prot protein ID# Q858N4), wild-type of ψYeo3-12 RNA polymerase (NCBI genomic sequence ID# NC_001271; GeneID# 1262422; UniProtKB/Swiss-Prot ID# Q9T145) and wild-type of gh-1 RNA polymerase (NCBI genomic sequence) ID# NC 004665; GeneID# 1258850; UniProtKB/Swiss-Prot protein ID#Q859H5), wild type of K1-5 RNAP RNA polymerase (NCBI genome sequence ID# NC_008125; GeneID# 5075932 UniProtKB/Swiss-Prot protein ID# Q8SCG8) and wild-type SP6 RNA polymerase (NCBI genome sequence ID# NC_004831; GeneID# 1481778; UniProtKB/Swiss-Prot protein ID# Q7Y5R1) and mutants or derivatives thereof, which may be a catalytic domain selected from the group consisting of 5'→ Single-stranded RNA having sequence complementarity to the double-stranded template DNA in the 3' direction can be synthesized, and more particularly, it may be a catalytic domain of T7 RNA polymerase.

T7 RNA 폴리머라제는 박테리오파지 T7 DdRp에 관한 것이다. 바람직하게는, T7 RNA 폴리머라제는 서열번호 1의 아미노산 서열(NCBI 게놈 서열 ID# NC_001604; GeneID# 1261050; UniProtKB/Swiss-Prot ID# P00573)을 갖고, 98.8kDa의 분자량을 갖는 883개 아미노산 단백질이다.T7 RNA polymerase relates to the bacteriophage T7 DdRp. Preferably, the T7 RNA polymerase has the amino acid sequence of SEQ ID NO: 1 (NCBI genomic sequence ID# NC_001604; GeneID# 1261050; UniProtKB/Swiss-Prot ID# P00573) and is an 883 amino acid protein with a molecular weight of 98.8 kDa .

T7 RNA 폴리머라제는 특히, 시험관내에서 당해 효소가 매우 처리능이 있고, 5'→3' 방향에서 37℃에서 240 내지 250 개 뉴클레오티드/s를 신장시킨다. 더욱이, 진핵 세포에서 발현되는 경우, T7 RNA 폴리머라제는 대부분 세포질에서 유지되며[참조: Elroy-Stein and Moss 1990; Gao and Huang 1993; Brisson, He et al. 1999], 따라서 세포질로부터 진핵 세포 핵으로 거대 DNA 분자(즉, 도입유전자)의 활발한 이동 및 핵으로부터 세포질로 RNA 분자의 이출을 피함으로써 도입유전자 발현 수준을 최적화한다.T7 RNA polymerase is particularly capable of processing this enzyme in vitro, elongating from 240 to 250 nucleotides/s at 37° C. in the 5′→3′ direction. Moreover, when expressed in eukaryotic cells, T7 RNA polymerase is mostly retained in the cytoplasm [Elroy-Stein and Moss 1990; Gao and Huang 1993; Brisson, He et al. 1999], thus optimizing transgene expression levels by avoiding the vigorous migration of large DNA molecules (ie, transgenes) from the cytoplasm to the eukaryotic cell nucleus and export of RNA molecules from the nucleus to the cytoplasm.

DdRp의 촉매 도메인은 T7 RNA 폴리머라제의 야생형 뿐만 아니라 T7 RNA 폴리머라제의 돌연변이체 중의 하나일 수 있고, 이는 감소된 처리능에서도 5'→3' 방향에서 이중가닥 주형 DNA에 서열 상보성이 있는 단일가닥 RNA를 합성할 수 있다. 예를 들면, 상기 돌연변이체는 R551S, F644A, Q649S, G645A, R627S, I810S 및 D812E로 이루어진 그룹에서 선택될 수 있다.The catalytic domain of DdRp can be one of the wild-type T7 RNA polymerase as well as the mutant of T7 RNA polymerase, which is single-stranded with sequence complementarity to the double-stranded template DNA in the 5'→3' direction even at reduced throughput. RNA can be synthesized. For example, the mutant may be selected from the group consisting of R551S, F644A, Q649S, G645A, R627S, I810S and D812E.

본 발명의 키메라 효소에서, DdRp의 상기 촉매 도메인은 RNA 트리포스파타제의 상기 촉매 도메인, 구아닐릴트랜스퍼라제의 상기 촉매 도메인 및 N7-구아닌 메틸트랜스퍼라제의 상기 촉매 도메인에 대해 C-말단에 위치된다.In the chimeric enzyme of the present invention, the catalytic domain of DdRp is located C-terminal to the catalytic domain of RNA triphosphatase, the catalytic domain of guanylyltransferase and the catalytic domain of N7-guanine methyltransferase.

실제로, DdRp의 촉매 도메인이 박테리오파지 DdRp의 촉매 도메인, 특히 T7, T3 및 SP6-RNA 폴리머라제로 이루어진 그룹에서 선택된 박테리오파지 DdRp의 촉매 도메인인 경우, 상기 촉매 도메인은 바람직하게는 이의 천연 카복실 말단을 보존한다. 특히, DdRp의 상기 촉매 도메인, 특히 박테리오파지 DdRp의 상기 촉매 도메인의 C-말단은 상기 키메라 효소의 C-말단에 상응한다. 특히, 키메라 효소가 전체 박테리오파지 DdRp, 특히 T7, T3 및 SP6-RNA 폴리머라제로 이루어진 그룹에서 선택된 박테리오파지 DdRp인 경우, 상기 폴리머라제는 바람직하게는 이의 천연 카복실-말단을 보존한다. 특히, DdRp의 상기 촉매 도메인, 특히 박테리오파지 DdRp의 상기 촉매 도메인의 C-말단은 상기 키메라 효소의 C-말단에 상응한다. 특히, DdRp의 상기 촉매 도메인, 특히 T7, T3 및 SP6-RNA 폴리머라제로 이루어진 그룹에서 선택된 박테리오파지 DdRp의 상기 촉매 도메인은 박테리오파지 DdRp의 전체 또는 일부에 포함되고, 이때 상기 박테리오파지 DdRp의 C-말단은 상기 키메라 효소의 C-말단에 상응한다.Indeed, when the catalytic domain of DdRp is the catalytic domain of a bacteriophage DdRp, in particular that of a bacteriophage DdRp selected from the group consisting of T7, T3 and SP6-RNA polymerase, said catalytic domain preferably preserves its native carboxyl terminus . In particular, the C-terminus of said catalytic domain of DdRp, in particular of said catalytic domain of bacteriophage DdRp, corresponds to the C-terminus of said chimeric enzyme. In particular, when the chimeric enzyme is a whole bacteriophage DdRp, in particular a bacteriophage DdRp selected from the group consisting of T7, T3 and SP6-RNA polymerases, said polymerase preferably preserves its native carboxyl-terminus. In particular, the C-terminus of said catalytic domain of DdRp, in particular of said catalytic domain of bacteriophage DdRp, corresponds to the C-terminus of said chimeric enzyme. In particular, said catalytic domain of DdRp, in particular said catalytic domain of bacteriophage DdRp selected from the group consisting of T7, T3 and SP6-RNA polymerase, is included in all or part of bacteriophage DdRp, wherein the C-terminus of said bacteriophage DdRp is said Corresponds to the C-terminus of the chimeric enzyme.

본 발명의 키메라 효소에서, DdRp의 상기 촉매 도메인, 특히 박테리오파지 DdRp의 상기 촉매 도메인, 특히 T7, T3 및 SP6-RNA 폴리머라제로 이루어진 그룹에서 선택된 박테리오파지 DdRp의 상기 촉매 도메인은 RNA 트리포스파타제의 상기 촉매 도메인, 구아닐릴트랜스퍼라제의 상기 촉매 도메인 및 N7-구아닌 메틸트랜스퍼라제의 상기 촉매 도메인에 대하여 C-말단에 위치된다.In the chimeric enzyme of the present invention, said catalytic domain of DdRp, in particular said catalytic domain of bacteriophage DdRp, in particular said catalytic domain of bacteriophage DdRp selected from the group consisting of T7, T3 and SP6-RNA polymerase, is said catalytic domain of RNA triphosphatase , located C-terminal to the catalytic domain of guanylyltransferase and the catalytic domain of N7-guanine methyltransferase.

DdRp의 상기 촉매 도메인은 박테리아 DdRp의 촉매 도메인이다.The catalytic domain of DdRp is the catalytic domain of bacterial DdRp.

바람직하게는, 상기 박테리아 DdRp는 적당한 구조 복잡성을 갖는다.Preferably, the bacterial DdRp has a suitable structural complexity.

예를 들면, 상기 박테리아 DdRp는 대장균(E. coli) DdRp(K-12 기질 DH10B ID# NC_010473의 NCBI 게놈 서열)일 수 있고, 이는 4개의 상이한 서브유닛(α 서브유닛: rpoA GeneID# 6060938, UniProtKB/Swiss-Prot ID# B1X6E7; β 서브유닛: rpoB GeneID# 6058462, UniProtKB/Swiss-Prot ID# B1XBY9; β' 서브유닛: rpoC GeneID# 6058956, UniProtKB/Swiss-Prot ID# B1XBZ0; σ 서브유닛: rpoE GeneID# 6060683, UniProtKB/Swiss-Prot ID# B1XBQ0)으로 이루어져 있고, 5개의 ααββ'σ 서브유닛 복합체에서 조립된다. 이. 콜라이 RNA 폴리머라제프로모터, rho-의존성 및 -독립성 터미네이터 및 전사 중지 서열을 포함하는, 효소 활성의 조절에 수반된 게놈 요소는 잘 특성화되어 있다.For example, the bacterial DdRp may be E. coli DdRp (NCBI genomic sequence of K-12 substrate DH10B ID# NC_010473), which has four different subunits (α subunit: rpoA GeneID# 6060938, UniProtKB). /Swiss-Prot ID# B1X6E7;β subunit: rpoB GeneID#6058462, UniProtKB/Swiss-Prot ID#B1XBY9;β' subunit: rpoC GeneID#6058956, UniProtKB/Swiss-Prot ID#B1XBZ0;σ subunit: rpoE GeneID# 6060683, UniProtKB/Swiss-Prot ID# B1XBQ0), assembled in a complex of five ααββ′σ subunits. this. Genomic elements involved in the regulation of enzymatic activity, including E. coli RNA polymerase promoters, rho-dependent and -independent terminators and transcriptional stop sequences, have been well characterized.

DdRp의 상기 촉매 도메인은 미토콘드리아, 엽록체 및 전색소체와 같이 진핵세포 세포기의 DdRp의 촉매 도메인이다. 실제로, 이들 폴리머라제는 또한 비교적 단순한 구조를 가질 수 있다.The catalytic domain of DdRp is the catalytic domain of DdRp of eukaryotic cell phases, such as mitochondria, chloroplasts and proplasts. Indeed, these polymerases may also have a relatively simple structure.

DdRp의 상기 촉매 도메인은 포유동물 마우스 미토콘드리아 RNA 폴리머라제의 촉매 도메인일 수 있고, 이는 단일 단위 120 kDa 단백질(GeneID# 216151, UniProtKB/Swiss-Prot ID# Q8BKF1)이고 박테리오파지 RNA 폴리머라제와 상동성을 공유한다. 몇몇 전사 인자는 전사개시, 신장 또는 종결에 요구된다: 전사 종결을 위한 TFB1M (미토콘드리아 전사 인자 Bl; 마우스 GeneID#224481, UniProtKB/Swiss-Prot ID# Q8JZM0) 또는 TFB2M (미토콘드리아 전사 인자 B2; 마우스 GeneID# 15278, UniProtKB/Swiss-Prot ID# Q3TL26), TFAM (미토콘드리아 전사 인자 A; 마우스 GeneID# 21780, UniProtKB/Swiss-Prot ID# P40630), 및 mTERF (미토콘드리아 전사 종결 인자; 마우스 GeneID# 545725, UniProtKB/Swiss-Prot ID# Q8CHZ9). 전사 종결 시그날 뿐만 아니라 미토콘드리아 게놈의 경쇄 및 중쇄에서 2개의 프로모터를 포함하는, 미토콘드리아 RNA 폴리머라제의 효소 활성의 조절에 수반된 게놈 요소는 잘 특성화되어 있다.The catalytic domain of DdRp may be the catalytic domain of mammalian mouse mitochondrial RNA polymerase, which is a single unit 120 kDa protein (GeneID# 216151, UniProtKB/Swiss-Prot ID# Q8BKF1) and shares homology with bacteriophage RNA polymerase. do. Several transcription factors are required for transcription initiation, elongation or termination: TFB1M (mitochondrial transcription factor Bl; mouse GeneID#224481, UniProtKB/Swiss-Prot ID# Q8JZM0) or TFB2M (mitochondrial transcription factor B2; mouse GeneID#) for transcriptional termination. 15278, UniProtKB/Swiss-Prot ID# Q3TL26), TFAM (mitochondrial transcription factor A; mouse GeneID# 21780, UniProtKB/Swiss-Prot ID# P40630), and mTERF (mitochondrial transcription terminator; mouse GeneID# 545725, UniProtKB/Swiss) -Prot ID# Q8CHZ9). The genomic elements involved in the regulation of the enzymatic activity of mitochondrial RNA polymerase, including transcription termination signals as well as two promoters in the light and heavy chains of the mitochondrial genome, have been well characterized.

RNA 트리포스파타제(RTPase)는, 발생 프리-mRNA의 5' 트리포스페이트 말단의 감마 포스페이트 잔기를 제거하여 디포스페이트로 되게 하는 효소이다. RNA 구아닐릴트랜스퍼라제(GTase)는, GMP를 GTP로부터 디포스페이트 발생 RNA 말단으로 전달하는 효소를 지칭한다. N7-구아닌 메틸트랜스퍼라제(N7-MTase)는, 구아닌의 질소 7상의 메틸 잔기를 GpppN 캡에 부가하는 효소에 관한 것이다.RNA triphosphatase (RTPase) is an enzyme that removes the gamma phosphate residue at the 5' triphosphate terminus of the developing pre-mRNA to diphosphate. RNA guanylyltransferase (GTase) refers to an enzyme that transfers GMP from GTP to the diphosphate-generating RNA terminus. N7-guanine methyltransferase (N7-MTase) relates to an enzyme that adds a methyl residue on nitrogen 7 of guanine to the GpppN cap.

RNA 트리포스파타제, 구아닐릴트랜스퍼라제, N7-구아닌 메틸트랜스퍼라제의 상기 촉매 도메인은 동일하거나 상이한 캡핑 효소의 것일 수 있다. 상기 촉매 도메인이 동일한 효소의 것이면, DdRp의 상기 촉매 도메인은 상이한 효소의 것이다.The catalytic domains of RNA triphosphatase, guanylyltransferase, N7-guanine methyltransferase may be of the same or different capping enzymes. If the catalytic domains are from the same enzyme, then the catalytic domains of DdRp are from different enzymes.

바람직하게는, RNA 트리포스파타제, 구아닐릴트랜스퍼라제, N7-구아닌 메틸트랜스퍼라제의 상기 촉매 도메인은, 유리하게는 비교적 단순한 구조 및 잘 특성화된 효소 활성을 갖는 하나 또는 수개의 세포질 효소로부터 기원한다. 따라서, 특히, RNA 트리포스파타제, 구아닐릴트랜스퍼라제, N7-구아닌 메틸트랜스퍼라제의 상기 촉매 도메인은 하나 또는 수개의 바이러스 캡핑 효소, 또는 세포질 에피좀의 캡핑 효소의 촉매 도메인일 수 있다.Preferably, said catalytic domains of RNA triphosphatase, guanylyltransferase, N7-guanine methyltransferase originate from one or several cytoplasmic enzymes, which advantageously have a relatively simple structure and well-characterized enzymatic activity. Thus, in particular, the catalytic domain of RNA triphosphatase, guanylyltransferase, N7-guanine methyltransferase may be the catalytic domain of one or several viral capping enzymes, or capping enzymes of cytoplasmic episomes.

RNA 트리포스파타제, 구아닐릴트랜스퍼라제, N7-구아닌 메틸트랜스퍼라제의 상기 촉매 도메인은 하나 또는 수개의 바이러스 캡핑 효소, 특히 야생형 청설병 바이러스 캡핑 효소, 야생형 대나무 모자이크 바이러스 캡핑 효소, 야생형 아프리카 돼지열 바이러스 캡핑 효소, 야생형 아칸트아메바 폴리파가 미미바이러스캡핑 효소 및 이의 돌연변이체 또는 유도체로 이루어진 그룹에서 선택된 효소의 것이고, 이들은 각각 발생 프리-mRNA의 5' 트리포스페이트 말단의 감마 포스페이트 잔기를 제거하여 디포스페이트로 되게 하거나, GMP를 GTP로부터 디포스페이트 발생 RNA 말단으로 전달하거나, 구아닌의 질소 7 상의 메틸 잔기를 GpppN 캡에 부가할 수 있고, 보다 특히는 야생형 아프리카 돼지열 바이러스 캡핑 효소의 것일 수 있다.Said catalytic domains of RNA triphosphatase, guanylyltransferase, N7-guanine methyltransferase may comprise one or several virus capping enzymes, in particular wild-type blue snow virus capping enzyme, wild-type bamboo mosaic virus capping enzyme, wild-type African swine fever virus capping. The enzyme, wild-type Acanthamoeba polyphagase, is of an enzyme selected from the group consisting of a mimivirus capping enzyme and a mutant or derivative thereof, each of which is converted to diphosphate by removing the gamma phosphate residue at the 5' triphosphate terminus of the resulting pre-mRNA. or transfer of GMP from GTP to the diphosphate generating RNA terminus, or adding a methyl residue on nitrogen 7 of guanine to the GpppN cap, more particularly that of wild-type African swine fever virus capping enzyme.

청설병 바이러스 캡핑 효소는 청설병 바이러스(BTV)의 단일-단위 VP4 캡핑 효소에 관한 것이고, 이는 74 kDa 단백질이다(644개 아미노산; 서열의 경우, 예를 들면, NCBI BTV 혈청형 10 게놈 서열 ID# Y00421; GeneID# 2943157; UniProtKB/Swiss-Prot ID# P07132, D0UZ45, Q5J7C0, Q65751, Q8BA65, P33428, P33429, P33427, C3TUP7, Q8BAD5, C5IWW0, B4E551, Q3KVQ2, Q3KVQ1, Q65732, Q3 VP8, Q3KVP9, Q3KVQ0). 이러한 캡핑 효소는 이의 카복실 말단에 인접하여 위치된 류신 지퍼를 통해 호모이량체화할 수 있다. VP4는 mRNA m7GpppN 캡핑 합성에 요구된 모두 3개의 효소 단계를 촉매한다: RTPase, GTase 및 N7-MTase.The blue tongue virus capping enzyme relates to the single-unit VP4 capping enzyme of blue tongue virus (BTV), which is a 74 kDa protein (644 amino acids; for sequence, e.g., NCBI BTV serotype 10 genomic sequence ID# Y00421; GeneID# 2943157; UniProtKB/Swiss-Prot ID# P07132, D0UZ45, Q5J7C0, Q65751, Q8BA65, P33428, P33429, P33427, C3TUP7, Q8BAD5, C5IWW0, B4E551, Q3KVQ3) QK3KVQ3) Q6Q73 Q6VP2, Q3 Q3KVQ3) . This capping enzyme can homodimerize via a leucine zipper located adjacent to its carboxyl terminus. VP4 catalyzes all three enzymatic steps required for mRNA m7GpppN capping synthesis: RTPase, GTase and N7-MTase.

대나무 모자이크 바이러스 효소는 ORF1, 대나무 모자이크 바이러스(BMV) mRNA 캡핑 효소에 관한 것이고, 이는 단일-단위 155-kDa 단백질이다(1365-아미노산; NCBI BMV 분리물 BaMV-0 게놈 서열 ID# NC 001642; GeneID# 1497253; UniProtKB/Swiss-Prot ID# Q65005). ORF1 단백질은 m7GpppN mRNA 캡핑, 즉 RTPase , GTase 및 N7-MTase 을 생성하는데 필요한 모든 효소 활성을 갖는다. 또한, ORF1은 RNA-의존성 RNA-폴리머라제활성을 갖고, 이는 본 발명의 키메라 효소 활성에 지배되지 않으며, mRNA 캡핑 효소의 Asp1229 Asp1230 잔사의 결실에 의해 파괴될 수 있다. 본원에 사용된 바와 같이, 용어 "아프리카 돼지열 바이러스 캡핑 효소"는 NP868R 캡핑 효소(G4R), (ASFV)에 관한 것이며, 이는 단일-단위 100 kDa 단백질이다(868 아미노산; NCBI ASFV 게놈 서열 균주 BA71V ID# NC_001659; GeneID# 1488865; UniProtKB/Swiss-Prot ID# P32094).Bamboo mosaic virus enzyme relates to ORF1, bamboo mosaic virus (BMV) mRNA capping enzyme, which is a single-unit 155-kDa protein (1365-amino acid; NCBI BMV isolate BaMV-0 genome sequence ID# NC 001642; GeneID# 1497253; UniProtKB/Swiss-Prot ID# Q65005). ORF1 protein has all the enzymatic activities required to produce m7GpppN mRNA capping, ie RTPase, GTase and N7-MTase. Furthermore, ORF1 has RNA-dependent RNA-polymerase activity, which is not governed by the chimeric enzyme activity of the present invention, and can be disrupted by deletion of the Asp1229 Asp1230 residue of the mRNA capping enzyme. As used herein, the term "African swine fever virus capping enzyme" relates to NP868R capping enzyme (G4R), (ASFV), which is a single-unit 100 kDa protein (868 amino acids; NCBI ASFV genome sequence strain BA71V ID). # NC_001659; GeneID# 1488865; UniProtKB/Swiss-Prot ID# P32094).

아칸트아메바 폴리파가 미미바이러스 캡핑 효소는 또다른 단일 단위 136.5 kDa 단백질인 R382(APMV)에 관한 것이다(1170 아미노산; NCBI APMV 게놈 서열 ID# NC_006450; GeneID#3162607; UniProtKB/Swiss-Prot ID# Q5UQX1).The Acanthamoeba polyphaga mimivirus capping enzyme is directed to another single unit 136.5 kDa protein, R382 (APMV) (1170 amino acids; NCBI APMV genomic sequence ID# NC_006450; GeneID#3162607; UniProtKB/Swiss-Prot ID# Q5UQX1 ).

RNA 트리포스파타제, 구아닐릴트랜스퍼라제, N7 -구아닌 메틸트랜스퍼라제의 상기 촉매 도메인은 pGKL2와 같이 세포질 에피좀의 하나 또는 수개의 캡핑 효소의 것이다. 특히, RNA 트리포스파타제, 구아닐릴트랜스퍼라제, N7-구아닌 메틸트랜스퍼라제의 상기 촉매 도메인은 효모 선형 염색체외 에피좀 pGKL2의 캡핑 효소의 전부 또는 일부에 포함된다.The catalytic domains of RNA triphosphatase, guanylyltransferase, N7-guanine methyltransferase are of one or several capping enzymes of the cytoplasmic episome, such as pGKL2. In particular, the catalytic domains of RNA triphosphatase, guanylyltransferase and N7-guanine methyltransferase are included in all or part of the capping enzyme of the yeast linear extrachromosomal episomal pGKL2.

세포질 선형 에피좀은 이중가닥 DNA 구조이고, 이는 다양한 효모 균주의 세포질에서 안정하게 복제한다[참조: Cong, Yarrow et al. 1994]. 효모 선형 염색체외 에피좀의 한 가지 프로토타입, pgKL2(13,457 bp; 또한 pGK12로 명명됨)은 클루이베로마이세스 락티스(Kluyveromyces lactis) CB 2359 및 사카로마이세스 세레비지애(Saccharomyces cerevisiae) F102-2를 포함하는 다양한 효모 균주로부터 완전히 서열분석되었다[참조:Tommasino, Ricci et al. 1988]. 클루이베로마이세스 락티스 pGKL2의 ORF3 유전자에 의해 코딩된 캡핑 효소(NCBI 클루이베로마이세스 락티스 CB 2359 pGKL2 게놈 서열 ID# NC_010187; UniProtKB/Swiss-Prot ID# P05469)은 594 아미노산 단백질(70.6 kDa 단백질)이다.Cytoplasmic linear episomes are double-stranded DNA structures, which replicate stably in the cytoplasm of various yeast strains [Cong, Yarrow et al. 1994]. One prototype of a yeast linear extrachromosomal episome, pgKL2 (13,457 bp; also termed pGK12), is Kluyveromyces lactis CB 2359 and Saccharomyces cerevisiae F102- was completely sequenced from various yeast strains, including 2 [Tommasino, Ricci et al. 1988]. The capping enzyme encoded by the ORF3 gene of Kluyveromyces lactis pGKL2 (NCBI Kluyveromyces CB 2359 pGKL2 genomic sequence ID# NC_010187; UniProtKB/Swiss-Prot ID# P05469) is a 594 amino acid protein (70.6 kDa protein) )to be.

본 발명의 키메라 효소의 한 가지 양태에서, 적어도 2개, 특히 적어도 3개 및 보다 특히는 전체 촉매 도메인은 연결 펩티드에 의해 조립, 융합 또는 직접 또는 간접적으로 결합될 수 있다.In one embodiment of the chimeric enzyme of the invention, at least two, in particular at least three and more particularly the entire catalytic domain may be assembled, fused or linked directly or indirectly by a linking peptide.

특히, RNA 트리포스파타제의 촉매 도메인, 구아닐릴트랜스퍼라제의 촉매 도메인, N7 -구아닌 메틸트랜스퍼라제의 촉매 도메인 및 DdRp로 이루어진 그룹에서 선택된 적어도 2개, 특히 적어도 3개 및 보다 특히는 전체 촉매 도메인은 직접 또는 연결 펩티드에 의해 결합된다.In particular, at least two, in particular at least three and more particularly the entire catalytic domain selected from the group consisting of the catalytic domain of RNA triphosphatase, the catalytic domain of guanylyltransferase, the catalytic domain of N7-guanine methyltransferase and DdRp are linked directly or by a linking peptide.

연결 펩티드는, 입체 장애를 최소화하고 충분한 공간이 융합 단백질의 성분에 제공되어 이들의 천연 배좌를 유지하는 융합 단백질을 생성하는 잇점을 갖는다.Linking peptides have the advantage of minimizing steric hindrance and providing sufficient space for the components of the fusion protein to create a fusion protein that maintains their native conformation.

바람직하게는, DdRp의 적어도 상기 촉매 도메인은 RNA 트리포스파타제의 상기 촉매 도메인; 구아닐릴트랜스퍼라제의 상기 촉매 도메인; 및 N7 -구아닌 메틸트랜스퍼라제의 상기 촉매 도메인으로 이루어진 그룹에서 선택된 적어도 하나의 촉매 도메인에 연결 펩티드에 의해 결합된다.Preferably, at least said catalytic domain of DdRp comprises said catalytic domain of RNA triphosphatase; the catalytic domain of guanylyltransferase; and the catalytic domain of N7-guanine methyltransferase is bound by a linking peptide to at least one catalytic domain selected from the group consisting of.

특히, 연결 펩티드는 DdRp의 상기 촉매 도메인, 특히 T7, T3 및 SP6-RNA 폴리머라제로 이루어진 그룹에서 선택된 박테리오파지 DdRp의 상기 촉매 도메인에 대해 N-말단에 위치할 수 있고, RNA 트리포스파타제의 상기 촉매 도메인, 구아닐릴트랜스퍼라제의 상기 촉매 도메인 및 N7-구아닌 메틸트랜스퍼라제의 상기 촉매 도메인에 대해 C-말단에 위치할 수 있다.In particular, the linking peptide may be located N-terminal to said catalytic domain of DdRp, in particular said catalytic domain of bacteriophage DdRp selected from the group consisting of T7, T3 and SP6-RNA polymerase, said catalytic domain of RNA triphosphatase , C-terminal to the catalytic domain of guanylyltransferase and the catalytic domain of N7-guanine methyltransferase.

특히, DdRp의 상기 촉매 도메인, 특히 T7, T3 및 SP6-RNA 폴리머라제로 이루어진 그룹에서 선택된 박테리오파지 DdRp의 상기 촉매 도메인의 N-말단은, RNA 트리포스파타제의 상기 촉매 도메인,구아닐릴트랜스퍼라제의 상기 촉매 도메인 및 N7 -구아닌 메틸트랜스퍼라제의 상기 촉매 도메인으로 이루어진 그룹에서 선택된 하나의 촉매 도메인의 C-말단에 공유 결합, 특히 연결 펩티드에 의해 연결된다.In particular, the catalytic domain of DdRp, in particular the N-terminus of the catalytic domain of a bacteriophage DdRp selected from the group consisting of T7, T3 and SP6-RNA polymerase, comprises the catalytic domain of RNA triphosphatase, said catalytic domain of guanylyltransferase connected to the C-terminus of one catalytic domain selected from the group consisting of a catalytic domain and said catalytic domain of N7-guanine methyltransferase by a covalent bond, in particular a linking peptide.

상기 연결 펩티드는 화학식 (GlymSerp)n의 펩티드(여기서, m은 0~12의 정수, 특히 1~8의 정수 및 보다 특히는 3~6 및 보다 특히 4의 정수이고, p는 0~6의 정수, 특히 0~5의 정수, 보다 특히 0~3 및 특히 1의 정수이고, n은 0~30의 정수, 특히 0~12, 보다 특히 0~8 및 더욱 특히 1~6의 정수이다),The linking peptide is a peptide of the formula (GlymSerp)n, wherein m is an integer from 0 to 12, in particular an integer from 1 to 8 and more particularly an integer from 3 to 6 and more particularly 4, and p is an integer from 0 to 6 , in particular an integer from 0 to 5, more particularly an integer from 0 to 3 and especially 1, n is an integer from 0 to 30, especially an integer from 0 to 12, more particularly an integer from 0 to 8 and even more particularly an integer from 1 to 6),

서열번호 6, 서열번호 7, 서열번호 8, 서열번호 9, 서열번호 10, 서열번호 11, 서열번호 12, 서열번호 13, 서열번호 14, 서열번호 15, 서열번호 16, 서열번호 17, 서열번호 18, 서열번호 19, 서열번호 20, 서열번호 21 및 서열번호 22로 이루어진 그룹으로부터 선택된 아미노산 서열로 이루어진 펩티드로 이루어진 그룹으로부터 선택될 수 있다.SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19, SEQ ID NO: 20, SEQ ID NO: 21 and SEQ ID NO: 22 and a peptide consisting of an amino acid sequence selected from the group consisting of SEQ ID NO: 22.

화학식(GlymSerp)n의 가요성 링커 펩티드는, 글리신 잔기가 펩티드 가요성을 제공하고 세린이 일부 가용성을 제공하는 잇점을 갖는다. 추가로, 화학식 (GlymSerp)n 링커 서열 중의 키로트립신 I, 인자 Xa, 파파인, 플라스민, 트롬빈 및 트립신에 대한 감수성 부위의 부재는 생성 융합 단백질의 전체 안정성을 증가시키는 것으로 생각된다.The flexible linker peptide of formula (GlymSerp)n has the advantage that the glycine residue provides peptide flexibility and serine provides some solubility. Additionally, the absence of sensitive sites for kyrotrypsin I, factor Xa, papain, plasmin, thrombin and trypsin in the formula (GlymSerp)n linker sequence is thought to increase the overall stability of the resulting fusion protein.

가변 길이의 화학식 (GlymSerp)n 링커는 단일가닥 Fv 단편(sFv) 항체를 작제하기 위해 통상 사용된다. 또한, 화학식 (GlymSerp)n 링커는 각종 융합 단백질을 생성하기 위해 사용되었고, 이는 종종 이들의 성분 각각의 생물학적 활성을 보유한다.Variable length formula (GlymSerp)n linkers are commonly used to construct single-stranded Fv fragment (sFv) antibodies. In addition, formula (GlymSerp)n linkers have been used to generate a variety of fusion proteins, which often retain the biological activity of each of their components.

다른 형태의 펩티드 링커는 또한 본 발명에 따르는 키메라 효소, 예를 들면, GGGGIAPSMVGGGGS(서열번호 6), SPNGASNSGSAPDTSSAPGSQ(서열번호 7), EGKSSGSGSESKSTE(서열번호 8), EGKSSGSGSESKEF(서열번호 9), GGGSGGGSGGGTGGGSGGG(서열번호 10)], GSTSGSGKSSEGKG(서열번호 11), YPRSIYIRRRHPSPSLTT(서열번호 12), GSTSGSGKPGSGEGSTKG(서열번호 13), GSTSGSGKPGSGEGS(서열번호 14), SSADDAKKDAAKKDDAKKDDAKKDA(서열번호 l5), GSADDAXXDAAXKDDAKKDDAKKDGS(서열번호 16), LSADDAKKDAAKKDDAKKDDAKKDL(서열번호 17), AEAAAKEAAAKEAAAKA(서열번호 18), GSHSGSGKP(서열번호 19), GSTSGSGKPGSGEGSTGAGGAGSTSGSGKPSGEG(서열번호 20), LSLEVAEEIARLEAEV (서열번호 21), 및 GTPTPTPTPTGEF(서열번호 22)을 생성하는 것으로 고려될 수 있다.Other types of peptide linkers are also chimeric enzymes according to the present invention, for example GGGGIAPSMVGGGGS (SEQ ID NO: 6), SPNGASNSGSAPDTSSAPGSQ (SEQ ID NO: 7), EGKSSGSGSESKSTE (SEQ ID NO: 8), EGKSSGSGSESKEF (SEQ ID NO: 9), GGGSGGGSGGGTGGGSGGG (SEQ ID NO: 9) 10)], GSTSGSGKSSEGKG (SEQ ID NO: 11), YPRSIYIRRRHPSPSLTT (SEQ ID NO: 12), GSTSGSGKPGSGEGSTKG (SEQ ID NO: 13), GSTSGSGKPGSGEGS (SEQ ID NO: 14), SSADDAKKDAAKKDDAKKKDDAKKDAKKDDAKKKDDDALKDDAKKKGS SEQ ID NO: LSDADKKKDAAKKGS SEQ ID NO: l5), GSADDAKK SEQ ID NO: l5) 17), AEAAAKEAAAKEAAAKA (SEQ ID NO: 18), GSHSGSGKP (SEQ ID NO: 19), GSTSGSGKPGSGEGSTGAGGAGSTSGSGKPSGEG (SEQ ID NO: 20), LSLEVAEEIARLEAEV (SEQ ID NO: 21), and GTPTPTPTPTGEF (SEQ ID NO: 22).

다른 종류의 공유 결합은, 이로써 한정되는 것은 아니지만, 디설파이드 결합, 트랜스글루타민화 및 화학적 및/또는 물리적 제제에 의한 단백질 트랜스-결합, 예를 들면, 트리스(비피리딘)루테늄(II)-디클로라이드 및 자외선광 조사를 포함한다.Other types of covalent bonds include, but are not limited to, disulfide bonds, transglutamination and protein trans-binding by chemical and/or physical agents, such as tris(bipyridine)ruthenium(II)-dichloride and UV light irradiation.

RNA 트리포스파타제, 구아닐릴트랜스퍼라제, N7 -구아닌 메틸트랜스퍼라제및 DdRp의 상기 촉매 도메인은 또한 특정한 단백질 요소, 예를 들면, 류신 지퍼에 의해 조립될 수 있고, 예를 들면, 본 발명에 따르는 키메라 효소에서 비오티닐화 도메인을 촉매 도메인의 하나(예: Avi-tag II 또는 PFBtag) 및 비오틴 결합 도메인을 다른 촉매 도메인의 하나(예를 들면, 스트렙-tagII 또는 nono-tag)로 조립될 수 있다.Said catalytic domains of RNA triphosphatase, guanylyltransferase, N7-guanine methyltransferase and DdRp can also be assembled by specific protein elements, for example leucine zippers, for example chimeric according to the invention In enzymes, the biotinylation domain can be assembled into one of the catalytic domains (eg, Avi-tag II or PFBtag) and the biotin binding domain into one of the other catalytic domains (eg, strep-tagII or nono-tag).

본 발명에 따르는 키메라 효소의 한 가지 양태에서, 적어도 2개의 상기 촉매 도메인은 비공유 결합, 특히 류신 지퍼에 의해 조립될 수 있다.In one embodiment of the chimeric enzyme according to the invention, at least two of said catalytic domains may be assembled by non-covalent bonds, in particular by leucine zippers.

바람직하게는, DdRp의 적어도 상기 촉매 도메인은 비공유 결합, 특히 류신 지퍼에 의해 RNA 트리포스파타제의 상기 촉매 도메인, 구아닐릴트랜스퍼라제의 상기 촉매 도메인 및 N7 -구아닌 메틸트랜스퍼라제의 상기 촉매 도메인으로 이루어진 그룹에서 선택된 촉매 도메인의 적어도 하나로 조립될 수 있다.Preferably, at least said catalytic domain of DdRp is by a non-covalent bond, in particular a leucine zipper, the group consisting of said catalytic domain of RNA triphosphatase, said catalytic domain of guanylyltransferase and said catalytic domain of N7-guanine methyltransferase. It may be assembled into at least one of the catalytic domains selected from

서로 상호작용하는 2개의 양쪽성 α-헬릭스로 이루어진 이량체성 나선형-코일 단백질 구조인 류신 지퍼는 통상 단백질을 호모- 또는 헤테로-이량체화하는데 사용된다. 각각의 헬릭스는 7개의 아미노산의 반복체로 이루어져 있고, 여기서 제1 아미노산(잔기 a)는 소수성이며, 제4 아미노산(잔기 d)는 통상 류신이며, 다른 잔기는 극성이다. 평행한 헤테로 이량체성 2본쇄 나선형 코일 구조를 형성하는 류신 지퍼 VELCRO ACID-p1 및 BASE-p1은 평행 단백질 헤테로-이량체를 형성하는 높은 경향을 갖는다. 이들은 몇몇 가용성 단백질] 뿐만 아니라 구성원 단백질을 헤테로 이량체화하는데 사용되었다.Leucine zippers, a dimeric helical-coil protein structure composed of two amphoteric α-helices interacting with each other, are commonly used to homo- or hetero-dimerize proteins. Each helix consists of a repeat of 7 amino acids, wherein the first amino acid (residue a) is hydrophobic, the fourth amino acid (residue d) is usually leucine, and the other residues are polar. The leucine zippers VELCRO ACID-p1 and BASE-p1, which form parallel heterodimeric double-stranded helical coil structures, have a high tendency to form parallel protein hetero-dimers. They have been used to heterodimerize several soluble proteins] as well as member proteins.

다른 종류의 올리고머화 펩티드 도메인은 또한 본 발명에 따르는 키메라 효소를 생성하고 본 발명에 따르는 키메라 효소의 적어도 2개의 상기 도메인, 특히 항평행 헤테로 이량체성 구조를 형성하는 류신 지퍼, 예를 들면, ACID-al/BASE-al, ACID-Kg/BASE-Eg, NZ/CZ, ACID-pLL/ BASE-pLL 및 EE1234L 및 RR1234L 류신 지퍼를 조립하는 것으로 생각된다. 류신 지퍼의 디설파이드-연결된 버젼은 또한 본 발명에 따르는 디설파이드 나선형 코일-결합된 헤테로 이량체성 키메라 효소 뿐만 아니라 환원 조건하에 시스테인 잔기 사이의 쇄간 디설파이드 브릿지를 생성하기 위해 사용될 수 있다.Other types of oligomerized peptide domains also produce chimeric enzymes according to the invention and form at least two of said domains of the chimeric enzymes according to the invention, in particular antiparallel heterodimeric structures, such as leucine zippers, for example ACID- It is thought to assemble al/BASE-al, ACID-Kg/BASE-Eg, NZ/CZ, ACID-pLL/BASE-pLL and EE1234L and RR1234L leucine zippers. The disulfide-linked version of the leucine zipper can also be used to generate interchain disulfide bridges between cysteine residues under reducing conditions as well as in the disulfide helical coil-linked heterodimeric chimeric enzymes according to the present invention.

따라서, RNA 트리포스파타제, 구아닐릴트랜스퍼라제, N7-구아닌 메틸트랜스퍼라제및 DdRp의 적어도 2개의 상기 촉매 도메인은 류신지퍼, 특히 항평행 헤테로이량체성 구조를 형성하는 류신지퍼, 예를 들면, ACID-al/BASE-al, ACID-Kg/BASE-Eg, NZ/CZ 및 ACID-pLL/ BASE-pLL 류신지퍼, 디설파이드 나선형 코일-결합된 지퍼, 및 시스테인 잔기 사이의 디설파이드 브릿지에 의해 조립될 수 있다.Thus, at least two of the catalytic domains of RNA triphosphatase, guanylyltransferase, N7-guanine methyltransferase and DdRp are leucine zippers, in particular leucine zippers that form antiparallel heterodimeric structures, e.g. ACID- al/BASE-al, ACID-Kg/BASE-Eg, NZ/CZ and ACID-pLL/BASE-pLL leucine zippers, disulfide helical coil-bonded zippers, and disulfide bridges between cysteine residues.

본 발명의 키메라 효소는, 특히 링커 및 보다 특히는 화학식 (Gly3Ser)4 링커를 통해 5'→3' 방향에서 이중가닥 주형 DNA에 서열 상보성이 있는 단일가닥 RNA를 합성할 수 있는 야생형 T7 RNA 폴리머라제또는 이의 돌연변이체 또는 유도체의 아미노 말단, 특히 T7 RNA 폴리머라제의 야생형에 융합된, RNA 분자의 5'말단에서 m7GpppN 캡을 부가할 수 있는, 아프리카 돼지열 바이러스의 야생형 mRNA 캡핑 효소 또는 이의 돌연변이체 또는 유도체, 특히 야생형 아프리카 돼지열 바이러스 캡핑 효소를 포함한다.The chimeric enzyme of the present invention is, in particular, a wild-type T7 RNA polymerase capable of synthesizing single-stranded RNA having sequence complementarity to double-stranded template DNA in the 5'→3' direction via a linker and more particularly a linker of formula (Gly3Ser)4 or a wild-type mRNA capping enzyme of African swine fever virus or a mutant thereof, capable of adding an m7GpppN cap at the 5' end of the RNA molecule, fused to the amino terminus of a mutant or derivative thereof, in particular to the wild type of T7 RNA polymerase; or derivatives, particularly wild-type African swine fever virus capping enzymes.

본 발명의 키메라 효소는, 특히 링커 및 보다 특히는 화학식 (Gly3Ser)4 링커를 통해 5'→3' 방향에서 이중가닥 주형 DNA에 서열 상보성이 있는 단일가닥 RNA를 합성할 수 있는 야생형 T3 RNA 폴리머라제또는 이의 돌연변이체 또는 유도체의 아미노 말단, 특히 T3 RNA 폴리머라제의 야생형에 융합된, RNA 분자의 5'말단에서 m7GpppN 캡을 부가할 수 있는, 아프리카 돼지열 바이러스의 야생형 mRNA 캡핑 효소 또는 이의 돌연변이체 또는 유도체, 특히 야생형 아프리카 돼지열 바이러스 캡핑 효소를 포함한다.The chimeric enzyme of the present invention is a wild-type T3 RNA polymerase capable of synthesizing single-stranded RNA having sequence complementarity to double-stranded template DNA in the 5'→3' direction, particularly through a linker and more particularly through a linker of formula (Gly3Ser)4 or a wild-type mRNA capping enzyme of African swine fever virus or a mutant thereof, capable of adding an m7GpppN cap at the 5' end of the RNA molecule, fused to the amino terminus of a mutant or derivative thereof, in particular to the wild type of T3 RNA polymerase, or derivatives, particularly wild-type African swine fever virus capping enzymes.

본 발명의 키메라 효소는, 특히 링커 및 보다 특히는 화학식 (Gly3Ser)4 링커를 통해 5'→3' 방향에서 이중가닥 주형 DNA에 서열 상보성이 있는 단일가닥 RNA를 합성할 수 있는 야생형 SP6 RNA 폴리머라제또는 이의 돌연변이체 또는 유도체의 아미노 말단, 특히 SP6 RNA 폴리머라제의 야생형에 융합된, RNA 분자의 5'말단에서 m7GpppN 캡을 부가할 수 있는, 아프리카 돼지열 바이러스의 야생형 mRNA 캡핑 효소 또는 이의 돌연변이체 또는 유도체, 특히 야생형 아프리카 돼지열 바이러스 캡핑 효소를 포함한다.The chimeric enzyme of the present invention is, in particular, a wild-type SP6 RNA polymerase capable of synthesizing single-stranded RNA having sequence complementarity to double-stranded template DNA in the 5'→3' direction via a linker and more particularly a linker of formula (Gly3Ser)4 or a wild-type mRNA capping enzyme of African swine fever virus or a mutant thereof, capable of adding an m7GpppN cap at the 5' end of the RNA molecule, fused to the amino terminus of a mutant or derivative thereof, in particular to the wild type of SP6 RNA polymerase, or derivatives, particularly wild-type African swine fever virus capping enzymes.

본 발명의 키메라 효소는, 류신 지퍼에 의해 조립된, RNA 분자의 5'말단에서 m7GpppN 캡을 부가할 수 있는, 아프리카 돼지열 바이러스의 야생형 mRNA 캡핑 효소 또는 이의 돌연변이체 또는 유도체, 특히 야생형 아프리카 돼지열 바이러스 캡핑 효소 및 5'→3' 방향에서 이중가닥 주형 DNA에 서열 상보성이 있는 단일가닥 RNA를 합성할 수 있는, 야생형 T7 RNA 폴리머라제또는 이의 돌연변이체 또는 유도체의 아미노 말단, 특히 T7 RNA 폴리머라제의 야생형을 포함한다.The chimeric enzyme of the present invention is a wild-type mRNA capping enzyme of African swine fever virus or a mutant or derivative thereof, in particular wild-type African swine fever, capable of adding an m7GpppN cap at the 5' end of the RNA molecule, assembled by a leucine zipper. viral capping enzyme and amino terminus of wild-type T7 RNA polymerase or a mutant or derivative thereof, in particular T7 RNA polymerase, capable of synthesizing single-stranded RNA with sequence complementarity to double-stranded template DNA in the 5'→3' direction. Includes wild type.

본 발명에 키메라 효소는, 본 발명의 키메라 효소의 적어도 하나의 촉매 도메인, 특히 RNA 트리포스파타제의 촉매 도메인, 구아닐릴트랜스퍼라제의 촉매 도메인, N7-구아닌 메틸트랜스퍼라제의 촉매 도메인 및 DdRp의 촉매 도메인으로 이루어진 그룹에서 선택된 적어도 하나의 촉매 도메인의 활성을 증강시키는 도메인을 추가로 포함한다.The chimeric enzyme in the present invention comprises at least one catalytic domain of the chimeric enzyme of the present invention, in particular the catalytic domain of RNA triphosphatase, the catalytic domain of guanylyltransferase, the catalytic domain of N7-guanine methyltransferase and the catalytic domain of DdRp. It further comprises a domain enhancing the activity of at least one catalytic domain selected from the group consisting of.

예를 들면, 본 발명의 키메라 효소의 적어도 하나의 촉매 도메인의 활성을 증강시키는 상기 도메인은, 고유한 효소 활성은 없지만 백시니아 mRNA 캡핑 효소의 D1R 서브유닛의 RNA N7-구아닌 메틸트랜스퍼라제활성을 현저히 증강시키는, 백시니아 바이러스 D12L 유전자에 의해 코딩된 31-kDa 서브유닛일 수 있다(게놈 서열 ID#NC_006998.1; GeneID#3707515; UniProtKB/Swiss-Prot ID#YP_232999.1).For example, the domain that enhances the activity of at least one catalytic domain of the chimeric enzyme of the present invention has no intrinsic enzymatic activity, but significantly inhibits the RNA N7-guanine methyltransferase activity of the D1R subunit of the vaccinia mRNA capping enzyme. It may be a 31-kDa subunit encoded by the vaccinia virus D12L gene, which enhances (genomic sequence ID#NC_006998.1; GeneID#3707515; UniProtKB/Swiss-Prot ID#YP_232999.1).

본 발명의 키메라 효소는, 특히 링커 및 보다 특히는 화학식 (Gly3Ser)4 링커 및/또는 류신 지퍼에 의해 전체 또는 부분으로 조립된, RNA-트리포스파타제, RNA 구아닐릴트랜스퍼라제및 RNA-구아닌 메틸트랜스퍼라제효소 활성을 갖는, 백시니아 mRNA 캡핑 효소의 적어도 하나의 촉매 도메인, 특히 백시니아 바이러스 D1R 유전자에 의해 코딩된 95 kDa 서브유닛(genomic sequence ID# NC 006998.1; GeneID# 3707562; UniProtKB/Swiss-Prot ID# YP 232988.1); - DdRp, 특히 T7, T3 및 SP6-RNA 폴리머라제로 이루어진 그룹에서 선택된 폴리머라제및 보다 특히는 T7 RNA 폴리머라제의 적어도 하나의 촉매 도메인 및 백시니아 바이러스 D12L 유전자에 의해 코딩된 31-kDa를 포함한다.The chimeric enzymes of the present invention are, in particular, RNA-triphosphatase, RNA guanylyltransferase and RNA-guanine methyltransferase, assembled in whole or in part by a linker and more particularly by a linker of formula (Gly3Ser)4 and/or a leucine zipper. at least one catalytic domain of a vaccinia mRNA capping enzyme, having a enzyme activity, in particular a 95 kDa subunit encoded by the vaccinia virus D1R gene (genomic sequence ID# NC 006998.1; GeneID# 3707562; UniProtKB/Swiss-Prot ID # YP 232988.1); - comprises at least one catalytic domain of DdRp, in particular a polymerase selected from the group consisting of T7, T3 and SP6-RNA polymerase and more particularly of T7 RNA polymerase and a 31-kDa encoded by the vaccinia virus D12L gene .

본 발명은 또한 분리된 핵산 분자 또는 분리된 핵산 분자의 그룹에 관한 것이며, 상기 핵산 분자(들)는 본 발명에 따르는 키메라 효소를 코딩한다.The invention also relates to an isolated nucleic acid molecule or group of isolated nucleic acid molecules, said nucleic acid molecule(s) encoding a chimeric enzyme according to the invention.

본 발명의 키메라 효소를 코딩하는 분리된 핵산 분자의 상기 그룹은, 이들의 발현에 의해 본 발명에 따르는 키메라 효소를 수득하는데 필요하고 충분한 모든 핵산 분자를 포함하거나 이들로 이루어진다.This group of isolated nucleic acid molecules encoding a chimeric enzyme of the invention comprises or consists of all nucleic acid molecules necessary and sufficient to obtain, by their expression, a chimeric enzyme according to the invention.

본 발명의 키메라 효소를 코딩하는 분리된 핵산 분자의 상기 그룹은 RNA 트리포스파타제의 적어도 하나의 촉매 도메인, 구아닐릴트랜스퍼라제의 적어도 하나의 촉매 도메인 및 N7 -구아닌 메틸트랜스퍼라제의 적어도 하나의 촉매 도메인을 코딩하는 핵산 분자 및 DdRp의 적어도 하나의 촉매 도메인을 코딩하는 핵산 분자를 포함하거나 이들로 이루어진다.Said group of isolated nucleic acid molecules encoding a chimeric enzyme of the invention comprises at least one catalytic domain of RNA triphosphatase, at least one catalytic domain of guanylyltransferase and at least one catalytic domain of N7-guanine methyltransferase. It comprises or consists of a nucleic acid molecule encoding a nucleic acid molecule and a nucleic acid molecule encoding at least one catalytic domain of DdRp.

본 발명의 키메라 효소를 코딩하는 분리된 핵산 분자의 상기 그룹은 RNA 트리포스파타제의 적어도 하나의 촉매 도메인을 코딩하는 핵산 분자, 구아닐릴트랜스퍼라제의 적어도 하나의 촉매 도메인을 코딩하는 핵산 분자, N7 -구아닌 메틸트랜스퍼라제의 적어도 하나의 촉매 도메인을 코딩하는 핵산 분자 및 DdRp의 적어도 하나의 촉매 도메인을 코딩하는 핵산 분자를 포함하거나 이들로 이루어진다.Said group of isolated nucleic acid molecules encoding a chimeric enzyme of the invention comprises a nucleic acid molecule encoding at least one catalytic domain of RNA triphosphatase, a nucleic acid molecule encoding at least one catalytic domain of guanylyltransferase, N7- comprises or consists of a nucleic acid molecule encoding at least one catalytic domain of guanine methyltransferase and a nucleic acid molecule encoding at least one catalytic domain of DdRp.

본 발명의 핵산 분자는, 진핵세포 DdRp, 바람직하게는 RNA 폴리머라제II를 위한 프로모터 및 DdRp의 상기 촉매 도메인을 위한 프로모터로 이루어진 그룹으로부터 선택된 적어도 하나, 바람직하게는 전체 프로모터(들)에 기능적으로 연결될 수 있다.The nucleic acid molecule of the present invention may be functionally linked to at least one, preferably the entire promoter(s) selected from the group consisting of a promoter for eukaryotic DdRp, preferably RNA polymerase II, and a promoter for said catalytic domain of DdRp. can

진핵세포 DdRp, 바람직하게는 RNA 폴리머라제II를 위한 프로모터에 대한 핵산의 연결은 현저하게는, 본 발명의 키메라 효소가 진핵 숙주 세포에서 발현되는 경우, 당해 키메라 효소의 발현은 진핵 RNA 폴리머라제, 바람직하게는 RNA 폴리머라제II에 의해 유도된다는 잇점을 갖는다. 이들 키메라 효소는 또한 도입유전자의 전사를 개시할 수 있다. 조직 특이적 RNA 폴리머라제II 프로모터가 사용되는 경우, 본 발명의 키메라 효소는 표적 조직/세포에서 선택적으로 발현될 수 있다.The ligation of the nucleic acid to the promoter for eukaryotic DdRp, preferably RNA polymerase II, is remarkable, when the chimeric enzyme of the present invention is expressed in a eukaryotic host cell, the expression of the chimeric enzyme is eukaryotic RNA polymerase, preferably It has the advantage of being induced by RNA polymerase II. These chimeric enzymes can also initiate transcription of a transgene. When a tissue-specific RNA polymerase II promoter is used, the chimeric enzyme of the present invention can be selectively expressed in a target tissue/cell.

상기 프로모터는 당해 기술분야의 통상의 지식을 가진 자에게 공지된 구조 프로모터 또는 유도 프로모터일 수 있다. 당해 프로모터는 발달상 조절될 수 있고, 유도성 또는 조직 특이성일 수 있다.The promoter may be a constitutive promoter or an inducible promoter known to those of ordinary skill in the art. The promoter may be developmentally regulated and may be inducible or tissue specific.

본 발명은 또한 본 발명의 핵산 분자를 포함하는 벡터에 관한 것이다. 상기 벡터는 반-안정한 또는 안정한 발현에 적절할 수 있다.The present invention also relates to a vector comprising a nucleic acid molecule of the present invention. The vector may be suitable for semi-stable or stable expression.

본 발명은 또한 본 발명의 분리된 핵산 분자의 상기 그룹을 포함하는 벡터 그룹에 관한 것이다.The invention also relates to a group of vectors comprising said group of isolated nucleic acid molecules of the invention.

특히, 본 발명의 상기 벡터는 클로닝 또는 발현 벡터이다.In particular, the vector of the present invention is a cloning or expression vector.

당해 벡터는 박테리오파지 등의 바이러스 벡터 또는 플라스미드 벡터 등의 비바이러스성 벡터일 수 있다.The vector may be a viral vector such as a bacteriophage or a non-viral vector such as a plasmid vector.

본 발명의 상기 벡터는, 특히 본 본 발명의 핵산 분자, 및 DdRp의 상기 촉매 도메인 및/또는 목적하는 적어도 하나의 DNA 서열을 위한 프로모터를 포함하는 비시스트로닉 벡터(bicistronic vector)이고, 상기 DNA 서열은 DdRp의 상기 촉매 도메인을 위한 프로모터에 작동적으로 연결된다.Said vector of the invention is, in particular, a bicistronic vector comprising a nucleic acid molecule of the invention and said catalytic domain of DdRp and/or a promoter for at least one DNA sequence of interest, said DNA sequence is operably linked to the promoter for the catalytic domain of DdRp.

본 발명의 상기 벡터는 또한 DdRp의 상기 촉매 도메인을 위한 프로모터를 포함할 수 있다.The vector of the present invention may also include a promoter for the catalytic domain of DdRp.

본 발명은 또한 본 발명의 분리된 핵산 분자 또는 본 발명의 분리된 핵산 분자 그룹 또는 본 발명의 벡터 또는 본 발명의 벡터 그룹을 포함하는 숙주 세포에 관한 것이다.The present invention also relates to an isolated nucleic acid molecule of the invention or a group of isolated nucleic acid molecules of the invention or a vector of the invention or a host cell comprising the group of vectors of the invention.

본 발명의 숙주 세포는 대규모 단백질 생산에 유용할 수 있다.The host cells of the present invention may be useful for large-scale protein production.

바람직하게는, 본 발명의 DdRp 키메라 효소의 상기 촉매 도메인은 내인성 유전자 전사와 도입유전자 전사 사이의 경쟁을 방지하기 위해 숙주 세포의 것과는 상이한 효소의 것이다.Preferably, said catalytic domain of the DdRp chimeric enzyme of the invention is of an enzyme different from that of the host cell to prevent competition between endogenous gene transcription and transgene transcription.

본 발명은 또한, 본 발명의 키메라 효소를 발현하는 유전자 조작된 비사람 진핵 생물에 관한 것이다.The present invention also relates to genetically engineered non-human eukaryotes expressing the chimeric enzymes of the present invention.

상기 비사람 진핵 생물은 임의의 비사람 동물 및 식물일 수 있다.The non-human eukaryote may be any non-human animal and plant.

본 발명은 또한, 5'말단 m7 GpppN 캡을 갖는 RNA 분자를 생산하기 위한, 본 발명에 따르는 키메라 효소 또는 본 발명에 따르는 분리된 핵산 분자 또는 본 발명에 따르는 분리된 핵산 분자 그룹의 특히 시험관내 또는 생체외에서의 용도에 관한 것이다.The present invention also relates to a chimeric enzyme according to the invention or an isolated nucleic acid molecule according to the invention or a group of isolated nucleic acid molecules according to the invention, in particular in vitro or It relates to use ex vivo.

본 발명은 또한, 특히 진핵세포 시스템, 예를 들면, 시험관내 합성된 단백질 분석 또는 배양된 세포에서단백질, 특히 항체와 같은 치료학적 목적의 단백질을 생산하기 위한, 본 발명에 따르는 키메라 효소, 본 발명에 따르는 분리된 핵산 분자 또는 본 발명에 따르는 분리된 핵산 분자 그룹의 시험관내 또는 생체외 용도에 관한 것이다.The invention also relates to a chimeric enzyme according to the invention, in particular for the production of a protein for therapeutic purposes, such as a protein, in particular an antibody, in a eukaryotic system, for example in vitro synthesized protein assay or in cultured cells. to the in vitro or ex vivo use of an isolated nucleic acid molecule according to the present invention or a group of isolated nucleic acid molecules according to the present invention.

본 발명은 또한, DNA 서열에 의해 코딩된 5'말단 m7 GpppN 캡을 갖는 RNA 분자를 숙주 세포에서 생산하는 특히 시험관내 또는 생체외 방법으로서, 상기 방법은 숙주 세포에서 본 발명에 따르는 핵산 분자 또는 본 발명에 따르는 분리된 핵산 분자의 그룹을 발현시키는 단계를 포함하고, 상기 DNA 서열은 DdRp의 상기 촉매 도메인에 대한 프로모터에 작동적으로 연결되어 있고, 특히 상기 프로모터는 상기 숙주 세포에서 효과적인, 시험관내 또는 생체외 방법에 관한 것이다.The present invention also relates to a particularly in vitro or ex vivo method for producing in a host cell an RNA molecule having a 5' terminal m7 GpppN cap encoded by a DNA sequence, said method comprising in a host cell a nucleic acid molecule according to the invention or the present invention expressing a group of isolated nucleic acid molecules according to the invention, wherein said DNA sequence is operably linked to a promoter for said catalytic domain of DdRp, in particular said promoter is effective in said host cell, in vitro or It relates to an ex vivo method.

바람직하게는, 본 발명의 키메라 효소의 DNA-의존성 RNA-폴리머라제의 상기 촉매 도메인은 내인성 유전자 전사와 상기 DNA 서열 전사 사이의 경쟁을 방지하기 위해 숙주 세포의 것과는 상이한 효소의 것이다.Preferably, said catalytic domain of the DNA-dependent RNA-polymerase of the chimeric enzyme of the invention is of an enzyme different from that of the host cell to prevent competition between transcription of the endogenous gene and transcription of said DNA sequence.

Ⅲ. RNA/DNA 시스템의 변형Ⅲ. Modification of RNA/DNA systems

본 발명의 RNA/DNA 시스템을 구성하는 상기 DdRp RNA 발현 카세트는 화학적 변형(CM)을 적어도 하나를 포함할 수 있다. 또한, 본 발명의 DdRp RNA 발현 카세트, auto_DdRp 발현 카세트 또는 DNAge 발현 카세트는 염기서열 변형(SM)을 적어도 하나를 포함할 수 있다.The DdRp RNA expression cassette constituting the RNA/DNA system of the present invention may include at least one chemical modification (CM). In addition, the DdRp RNA expression cassette, auto_DdRp expression cassette or DNAge expression cassette of the present invention may include at least one nucleotide sequence modification (SM).

본 발명의 RNA/DNA 시스템은 RNA 및 DNA로 구성된다. 상기 DdRp RNA 발현 카세트는 DdRp 오픈 리딩 프레임(ORF), 5‘UTR 및 3'UTR를 포함하는 DdRp mRNA이고 5'cap 구조, 화학적 변형(CM) 및 염기서열 변형(SM)을 포함할 수 있으며, 이들 증 SM이 결여하면 캡된 CM_DdRp mRNA이라고 하고, 이들을 모두 포함하면 캡된 CM/SM_DdRp mRNA이라고 하였다. The RNA/DNA system of the present invention is composed of RNA and DNA. The DdRp RNA expression cassette is a DdRp mRNA comprising a DdRp open reading frame (ORF), 5'UTR and 3'UTR, and may include a 5'cap structure, chemical modification (CM) and sequence modification (SM), If these symptoms were lacking in SM, they were called capped CM_DdRp mRNA, and if they were all included, it was called capped CM/SM_DdRp mRNA.

본 발명의 "캡된 CM/SM_DdRp mRNA를 포함하는 RNA 발현 카세트"는 SM_DdRp mRNA에 화학적 변형된 뉴클레오타이드를 포함하여 CM/SM_DdRp mRNA를 제조하고 5'cap 구조를 추가한 발현 카세트로, 특정 시점에 측정된 상기 캡된 CM/SM_mRNA로부터 생산된 단백질 또는 펩타이드의 양은 캡된 CM/SM_mRNA이 CM이 결여된 SM_DdRp mRNA("캡된 SM_DdRp mRNA") 보다 안정성이 높아, 상대적으로 증가한다. The "RNA expression cassette comprising capped CM/SM_DdRp mRNA" of the present invention is an expression cassette in which CM/SM_DdRp mRNA is prepared by including chemically modified nucleotides in SM_DdRp mRNA and a 5'cap structure is added. The amount of protein or peptide produced from the capped CM/SM_mRNA is relatively increased, as capped CM/SM_mRNA has higher stability than SM_DdRp mRNA lacking CM (“capped SM_DdRp mRNA”).

본 발명에서 DdRp mRNA는 DdRp 발현을 증가시키는 CM 및 SM으로 이루어진 변형에서 적어도 하나의 변형을 포함한다. 상기 DdRp 발현은 CM와 SM이 포함된 CM/SM_DdRp mRNA의 투여에 의해 추가로 증가한다. 캡된 CM/SM_DdRp mRNA에서 CM/SM의 적어도 하나에 따른 단백질 생산의 증가는 본원에서 "캡된 CM/SM_DdRp mRNA-연관 단백질 발현"로서 언급된다. In the present invention, DdRp mRNA comprises at least one modification in the modification consisting of CM and SM that increase DdRp expression. The DdRp expression is further increased by administration of CM/SM_DdRp mRNA containing CM and SM. An increase in protein production along at least one of CM/SM in capped CM/SM_DdRp mRNA is referred to herein as “capped CM/SM_DdRp mRNA-associated protein expression”.

본 발명은 캡된 CM/SM_DdRp mRNA를 포함하는 RNA 발현 카세트는 상기 DdRp mRNA의 안정성, 복제, 전사 및 번역을 관리하는 요소들을 포함하는 을 제공한다. 만약 본 발명의 캡된 CM/SM_DdRp mRNA 방법과 기존의 핵-의존적 프로모터를 갖는 발현 카세트를 비교하면, 캡된 CM/SM_DdRp mRNA 방법의 단백질 생산의 증가는 본원에서 "캡된 CM/SM_DdRp mRNA-연관 증가"로서 언급할 수 있다.The present invention provides an RNA expression cassette comprising capped CM/SM_DdRp mRNA comprising elements managing stability, replication, transcription and translation of the DdRp mRNA. If the capped CM/SM_DdRp mRNA method of the present invention is compared with an expression cassette with a conventional nuclear-dependent promoter, the increase in protein production of the capped CM/SM_DdRp mRNA method is referred to herein as “capped CM/SM_DdRp mRNA-associated increase”. can be mentioned

본 발명의 "캡된 CM/SM_DdRp mRNA-연관 단백질 발현"는 특정 기간 동안 측정된 캡된 CM/SM_DdRp mRNA로부터 생산된 단백질이 CM/SM이 결여된 참조 DdRp mRNA로부터 생산된 단백질의 총량과 비교하여 증가되는 상황, 또는 특정 시점에 측정된 캡된 CM/SM_DdRp mRNA로부터 생산된 단백질 수준이 CM/SM이 결여된 참조 DdRp mRNA로부터 생산된 단백질 수준과 비교하여 증가되는 상황을 나타낸다."Capped CM/SM_DdRp mRNA-associated protein expression" of the present invention means that the protein produced from the capped CM/SM_DdRp mRNA measured for a specific period of time is increased compared to the total amount of protein produced from a reference DdRp mRNA lacking CM/SM. situation, or a situation in which the protein level produced from the capped CM/SM_DdRp mRNA measured at a specific time point is increased compared to the protein level produced from a reference DdRp mRNA lacking CM/SM.

본 발명에서 DNAge 발현 카세트는 적어도 하나의 표적화 엔도뉴클레아제코딩하는 DNA 절편, sgRNA를 코딩하는 DNA 절편, 5‘UTR 및 3'UTR를 포함할 수 있다. 상기 DNAge 발현 카세트는 염기서열 변형(SM)을 포함할 수 있으며, 이를 SM_DNAge이라고 하였다. 상기 DNAge 발현 카세트는 SM_DNAge를 포함할 수 있다. In the present invention, the DNAge expression cassette may include at least one targeting endonuclease-encoding DNA fragment, sgRNA-encoding DNA fragment, 5'UTR and 3'UTR. The DNAge expression cassette may include a nucleotide sequence modification (SM), which was referred to as SM_DNAge. The DNAge expression cassette may include SM_DNAge.

여기에 추가적으로 auto_DdRp DNA 발현 카세트의 DdRp DNA를 포함할 수 있으며, 또한 염기서열 변형(SM)을 포함할 수 있고 auto_SM DdRp DNA라고 하였다. In addition to this, the DdRp DNA of the auto_DdRp DNA expression cassette may be included, and a nucleotide sequence modification (SM) may be included, and was referred to as auto_SM DdRp DNA.

본 발명에서는 염기서열 변형(SM)이 있는 SM_DNAge 발현 카세트도 특정 시점에 측정된 상기 SM_DNAge 발현 카세트로부터 생산된 단백질 또는 RNA의 양이 SM이 결여된 DNAge 발현 카세트의 경우와 비교하여 증가한다. In the present invention, the amount of protein or RNA produced from the SM_DNAge expression cassette measured at a specific time point in the SM_DNAge expression cassette with a nucleotide sequence modification (SM) also increases compared to the case of the DNAge expression cassette lacking SM.

본 발명의 유전체 편집 RNA/DNA 시스템의 개념에서, 본 발명의 캡된 CM/SM_DdRp mRNA를 포함하는 DdRp RNA 발현 카세트와 더불어 SM_DNAge를 포함하는 DNAge 발현 카세트를 세포/조직에 주입한 경우, 상기 SM_DNAge 발현 카세트가 코딩하는 표적화 엔도뉴클레아제또는 sgRNA의 발현을 증가된다. 상기 SM_DNAge 발현 카세트는 적어도 하나의 SM을 포함한다. 상기 코딩된 표적화 엔도뉴클레아제또는 sgRNA의 발현은 SM_DNAge 발현 카세트의 투여에 의해 증가된다. DNA 발현 카세트의 SM에 따른 표적화 엔도뉴클레아제생산의 증가는 본원에서 "SM_DNA-연관 단백질 발현"로서 언급된다. In the concept of the genome editing RNA/DNA system of the present invention, when a DNAge expression cassette containing SM_DNAge in addition to a DdRp RNA expression cassette containing the capped CM/SM_DdRp mRNA of the present invention is injected into cells/tissues, the SM_DNAge expression cassette The expression of a targeting endonuclease that encodes or sgRNA is increased. The SM_DNAge expression cassette includes at least one SM. The expression of the encoded targeting endonuclease or sgRNA is increased by administration of the SM_DNAge expression cassette. The increase in targeted endonuclease production along the SM of a DNA expression cassette is referred to herein as "SM_DNA-associated protein expression".

따라서, 본 발명의 캡된 CM/SM_DdRp mRNA를 포함하는 RNA 발현 카세트와 더불어 SM_DNAge 또는 참조 DNAge를 포함하는 DNAge 발현 카세트를 표적 조직내로 주입되며, 예를 들어, 바람직하게는 피부 내로, 근육 내로 또는 피하로 주사된다. Accordingly, the RNA expression cassette comprising the capped CM/SM_DdRp mRNA of the present invention together with the DNAge expression cassette comprising SM_DNAge or reference DNAge is injected into the target tissue, for example, preferably into the skin, intramuscularly or subcutaneously. are injected

본 발명에 따르면, DNAge 발현 카세트는 코딩된 단백질의 발현을 향상하기 위해서 SM이 될 수 있다("SM_DNAge-연관 증가"). 거기서, SM은 코딩된 단백질의 발현만큼 임의의 특정 구조에 한정되지 않고 본원에 정의된 바와 같은 참조 DNAge 발현 카세트와 비교하여 증가된다. 여러 DNA 변형체는 당 업계에 알려져 있으며, 본 발명에서 주어진 DNAge로 적용할 수 있다.According to the present invention, the DNAge expression cassette can be SM to enhance the expression of the encoded protein (“SM_DNAge-associated increase”). Therein, SM is not limited to any particular structure as much as expression of the encoded protein and is increased compared to a reference DNAge expression cassette as defined herein. Several DNA variants are known in the art and can be applied with a given DNAge in the present invention.

기존의 핵-의존적 프로모터를 갖는 DNA plasmid를 이용한 핵에서의 mRNA 발현방법은 세포막 투과에 비해 그 효율이 1%에 불과한 핵막 투과에 의존하여 세포 내로 형질 도입된 DNA plasmid에서 전사되는 RNA의 발현효율이 매우 낮다. 또한, 핵에서 발현된 mRNA는 세포질로 배출되어야만 단백질의 합성이 가능하나, 이러한 세포질로의 분출에 관여하는 엑스포틴(exportin)-5 운반체가 고농도의 다른 RNA에 의하여 포화되는 문제로 인해 세포 내로 형질 도입된 RNA의 세포질 분출을 방해하는 문제가 발생하여 세포질로 이동되는 RNA는 극소량에 불과하다.The conventional mRNA expression method in the nucleus using a DNA plasmid having a nuclear-dependent promoter depends on nuclear membrane penetration, which has an efficiency of only 1% compared to cell membrane penetration. very low In addition, the mRNA expressed in the nucleus can be synthesized only when it is released into the cytoplasm, but the exportin-5 transporter, which is involved in the ejection into the cytoplasm, is transfected into the cell due to the problem of being saturated by other RNAs at high concentrations. There is a problem in interfering with the cytoplasmic ejection of the introduced RNA, so that only a very small amount of RNA is transferred to the cytoplasm.

본 발명의 지속적인 유전체 편집 도구 발현용 조성물인 RNA/DNA 시스템은 핵-비의존적으로 상기 캡된 CM/SM_DdRp mRNA를 포함하는 RNA 발현 카세트에서 세포질 내에서 합성된 선택된 DdRp, 예를 들어 T7 RNA 폴리머라제의 발현을 증가시켜 상기 DNAge 발현 카세트에 있는 DdRp 프로모터(T7 프로모터) 하류에 위치한 DNAge 발현을 장기간 지속적으로 발현시키는 것일 수 있다. 구체적으로, 상기 DNAge가 코딩하는 전사체의 지속적 발현은 상기 조성물로부터 세포질 내 장기간 지속적으로 DNAge를 생성할 수 있어, 기존의 핵-의존적 프로모터를 갖는 DNA plasmid를 이용한 핵에서의 mRNA 발현방법의 문제점을 극복할 수 있다.The RNA/DNA system, which is a composition for continuous genome editing tool expression of the present invention, is nuclear-independent of a selected DdRp synthesized in the cytoplasm from an RNA expression cassette comprising the capped CM/SM_DdRp mRNA, for example, T7 RNA polymerase. By increasing the expression, the expression of DNAge located downstream of the DdRp promoter (T7 promoter) in the DNAge expression cassette may be continuously expressed for a long period of time. Specifically, the continuous expression of the transcript encoded by the DNAge can continuously generate DNAge from the composition in the cytoplasm for a long period of time. can overcome

1. 변형 RNA의 5'말단(5' 캡)의 변형1. Modification of the 5' end (5' cap) of the modified RNA

본 발명의 DdRp RNA 발현 카세트, CM_DdRp mRNA, SM_DdRp mRNA 및 CM/SM_DdRp mRNA 발현 카세트는 소위 "5' 캡(CAP)" 구조의 첨가에 의해 변형될 수 있다.The DdRp RNA expression cassette, CM_DdRp mRNA, SM_DdRp mRNA and CM/SM_DdRp mRNA expression cassette of the present invention can be modified by the addition of a so-called "5' cap (CAP)" structure.

5'캡(cap)은 독립체, 일반적으로 성숙한 mRNA의 5'말단을 "덮는(caps)" 일반적으로 변형 독립체이다. 5'캡(cap)은 일반적으로 변형, 특히 구아닌 뉴클레오타이드의 유도체에 의해 형성될 수 있다. 바람직하게, 5'캡(cap)은 5'5'트리포스페이트 결합을 통해 5'말단에 연결된다. 5'캡(cap)은 메틸화될 수 있으며, 예를 들어, m7GpppN, 여기서 N은 5'캡(cap), 일반적으로 RNA의 5'말단을 운반하는 핵산의 말단 5' 뉴클레오타이드이다. m7GpppN은 폴리머라아제II에 의해 전사된 mRNA에서 자연적으로 발생하는 5'캡(CAP) 구조이고, 따라서, 본 발명에 따른 CM/SM_mRNA에 포함된 SM으로서 간주되지 않는다. 이는 본 발명에 따른 CM/SM_mRNA는 5'캡(CAP)으로서 m7GpppN을 포함할 수 있는 것을 의미하지만, 추가적으로 SM_mRNAi는 본 원에 정의된 바와 같은 적어도 하나의 추가의 SM을 포함한다.A 5' cap is usually a modifying entity that "caps" the 5' end of an entity, usually a mature mRNA. The 5' cap can be formed in general by modifications, in particular derivatives of guanine nucleotides. Preferably, the 5' cap is connected to the 5' end via a 5'5' triphosphate bond. The 5' cap may be methylated, for example, m7GpppN, where N is the 5' cap, usually the terminal 5' nucleotide of the nucleic acid carrying the 5' end of the RNA. m7GpppN is a naturally occurring 5' cap (CAP) structure in mRNA transcribed by polymerase II, and therefore is not considered as a SM included in CM/SM_mRNA according to the present invention. This means that the CM/SM_mRNA according to the present invention may comprise m7GpppN as the 5' cap (CAP), but additionally the SM_mRNAi comprises at least one additional SM as defined herein.

추가적인 5'캡(cap) 구조의 예로는 글리세릴, 역(inverted) 데옥시 무염기 잔기(성분), 4',5' 메틸렌 뉴클레오타이드, 1-(베타-D-에리스로퓨라노실)뉴클레오타이드, 4'-티오 뉴클레오타이드, 카보사이클릭 뉴클레오타이드, 1,5-안하이드로헥시톨 뉴클레오타이드, L-뉴클레오타이드, 알파-뉴클레오타이드, 화학적 변형된 염기 뉴클레오타이드, 트레오-펜토퓨라노실 뉴클레오타이드, 아사이클릭(acyclic) 3',4'-세코(seco) 뉴클레오타이드, 아사이클릭 3,4-디하이드록시부틸 뉴클레오타이드, 아사이클릭 3,5 디하이드록시펜틸 뉴클레오타이드, 3'3'역 뉴클레오타이드 성분, 3'3'역 무염기 성분, 3'2'-역 뉴클레오타이드 성분, 3'2'-역 무염기 성분, 1,4-부탄디올 포스페이트, 3'포스포라미데이트, 헥실포스페이트, 아미노헥실 포스페이트, 3'포스페이트, 3'포스포로티오에이트, 포스포로디티오에이트, 또는 가교(bridging) 또는 비-가교(non-bridging) 메틸포스포네이트 성분을 포함한다. 이들 화학적 변형된 5'캡(CAP) 구조는 본 발명에 따른 SM_mRNAi에 포함된 적어도 하나의 SM으로 여겨진다.Examples of additional 5' cap structures include glyceryl, inverted deoxy abasic residues (components), 4',5' methylene nucleotides, 1-(beta-D-erythrofuranosyl)nucleotides, 4 '-Thionucleotide, carbocyclic nucleotide, 1,5-anhydrohexitol nucleotide, L-nucleotide, alpha-nucleotide, chemically modified base nucleotide, threo-pentofuranosyl nucleotide, acyclic 3' ,4'-seco nucleotide, acyclic 3,4-dihydroxybutyl nucleotide, acyclic 3,5 dihydroxypentyl nucleotide, 3'3' inverted nucleotide component, 3'3' inverted free base component, 3'2'-reversed nucleotide component, 3'2'-reversed base free component, 1,4-butanediol phosphate, 3' phosphoramidate, hexylphosphate, aminohexyl phosphate, 3'phosphate, 3' phosphorothioate , phosphorodithioate, or a bridging or non-bridging methylphosphonate component. These chemically modified 5' cap (CAP) structures are considered to be at least one SM included in the SM_mRNAi according to the present invention.

특히 바람직한 화학적 변형된 5'캡(CAP) 구조는 CAP1(m7G 인접 뉴클레오타이드의 리보오스의 메틸화), CAP2(m7G의 제2 뉴클레오타이드 다운스트림의 리보오스의 메틸화), CAP3(m7G의 제3 뉴클레오타이드 다운스트림의 리보오스의 메틸화), CAP4(m7G의 제4 뉴클레오타이드 다운스트림의 리보오스의 메틸화), ARCA(항-역 캡(CAP) 유사체, 화학적 변형된 ARCA (e.g. phosphothioate modified ARCA), 이노신, N1-메틸-구아노신, 2'-플루오로-구아노신, 7-데아자-구아노신, 8-옥소-구아노신, 2-아미노-구아노신, LNA-구아노신, 및 2-아지도-구아노신이다.Particularly preferred chemically modified 5' cap (CAP) structures are CAP1 (methylation of ribose adjacent nucleotide of m7G), CAP2 (methylation of ribose of second nucleotide downstream of m7G), CAP3 (ribose of ribose 3 nucleotide downstream of m7G). methylation of ), CAP4 (methylation of ribose downstream of the fourth nucleotide of m7G), ARCA (anti-reverse cap (CAP) analog, chemically modified ARCA (eg phosphothioate modified ARCA), inosine, N1-methyl-guanosine, 2′-fluoro-guanosine, 7-deaza-guanosine, 8-oxo-guanosine, 2-amino-guanosine, LNA-guanosine, and 2-azido-guanosine.

2. 화학적 변형(CM): 화학적 변형체(Chemical modifications)2. Chemical modifications (CM): Chemical modifications

용어 "RNA 화학적 변형"은 당 변형 또는 염기 변형뿐만 아니라 백본 변형을 포함하는 화학적 변형을 나타낼 수 있다.The term “RNA chemical modification” may refer to chemical modifications including sugar modifications or base modifications as well as backbone modifications.

본 발명의 화학적 변형 RNA 발현 카세트는 뉴클레오타이드 유사체/변형체, 예를 들어, 백본 변형체, 당 변형체 또는 염기 변형체를 함유할 수 있다. 본 발명과 관련된 백본 변형은 본원에 정의된 바와 같은 핵산 분자에 함유된 뉴클레오타이드의 백본의 포스페이트가 화학적으로 변형된 변형이다. 본 발명과 관련된 당 변형은 본원에 정의된 바와 같은 핵산 분자의 뉴클레오타이드의 당의 변형이다. 더욱이, 본 발명과 관련된 염기 변형은 핵산 분자의 핵산 분자의 뉴클레오타이드 염기 성분의 변형이다. 뉴클레오타이드 유사체 또는 변형체는 바람직하게 전사 및/또는 번역에 적용할 수 있는 뉴클레오타이드 유사체로부터 선택된다.The chemically modified RNA expression cassettes of the present invention may contain nucleotide analogues/variants, such as backbone modifications, sugar modifications or base modifications. A backbone modification in the context of the present invention is a modification in which the phosphate of the backbone of a nucleotide contained in a nucleic acid molecule as defined herein is chemically modified. A sugar modification in the context of the present invention is a modification of a sugar of a nucleotide of a nucleic acid molecule as defined herein. Moreover, a base modification in the context of the present invention is a modification of the nucleotide base component of a nucleic acid molecule of a nucleic acid molecule. Nucleotide analogues or variants are preferably selected from nucleotide analogues applicable to transcription and/or translation.

당 변형체(Sugar Modifications):Sugar Modifications:

본 발명의 변형 RNA 내로 포함될 수 있는 화학적 변형된 뉴클레오사이드 및 뉴클레오타이드는 당 성분에서 화학적 변형될 수 있다. 예를 들어, 2' 하이드록실기(OH)는 상이한 수의 "옥시" 또는 "데옥시" 치환체와 함께 SM되거나 치환될 수 있다. "옥시" -2'하이드록실기 화학적 변형체의 예로는, 이에 한정되는 것은 아니지만, 알콕시 또는 아릴옥시(-OR, 예를 들어, R = H, 알킬, 사이클로알킬, 아릴, 아르알킬, 헤테로아릴 또는 당); 폴리에틸렌글리콜(PEG), -0(CH2CH2o)nCH2CH2OR; 2' 하이드록실이 예를 들어, 메틸렌 다리(methylene bridge)에 의해 동일한 리보오스 당의 4' 탄소에 연결된 "잠금(locked)" 핵산(LNA); 아미노기(-O-아미노, 여기서 아미노기 예를 들어, NRR은 알킬아미노, 디알킬아미노, 헤테로사이클릴, 아릴아미노, 디아릴 아미노, 헤테로아릴 아미노, 또는 디헤테로아릴 아미노, 에틸렌 디아민, 폴리아미노일 수 있다) 또는 아미노알콕시를 포함한다.Chemically modified nucleosides and nucleotides that may be incorporated into the modified RNA of the present invention may be chemically modified in the sugar component. For example, the 2' hydroxyl group (OH) may be SM or substituted with a different number of "oxy" or "deoxy" substituents. Examples of "oxy"-2'hydroxyl group chemical modifications include, but are not limited to, alkoxy or aryloxy (-OR, e.g., R = H, alkyl, cycloalkyl, aryl, aralkyl, heteroaryl or sugar); polyethylene glycol (PEG), -0(CH2CH2o)nCH2CH2OR; "locked" nucleic acids (LNAs) in which the 2' hydroxyl is linked to the 4' carbon of the same ribose sugar by, for example, a methylene bridge; An amino group (-O-amino, wherein the amino group, for example, NRR can be alkylamino, dialkylamino, heterocyclyl, arylamino, diaryl amino, heteroaryl amino, or diheteroaryl amino, ethylene diamine, polyamino ) or aminoalkoxy.

"데옥시" 변형체는 하이드로겐, 아미노(예를 들어, NH2; 알킬아미노, 디알킬아미노, 헤테로사이클릴, 아릴아미노, 디아릴 아미노, 헤테로아릴 아미노, 디헤테로아릴 아미노, 또는 아미노산); 또는 연결자(linker)를 통해 당에 부착될 수 있는, 여기서 상기 연결자는 원자, C, N 및 O 중 하나 이상의 원자를 포함하는 아미노기를 포함한다."Deoxy" variants include hydrogen, amino (eg, NH2; alkylamino, dialkylamino, heterocyclyl, arylamino, diaryl amino, heteroaryl amino, diheteroaryl amino, or amino acid); or may be attached to the sugar via a linker, wherein the linker comprises an amino group comprising an atom, one or more of C, N and O.

당기(sugar group)는 또한 리보오스 내 상응하는 탄소와 반대의 입체화학적 배열을 가지는 하나 이상의 탄소를 함유할 수 있다. 따라서, SM_mRNA는 예를 들어, 당으로서 아라비노스를 함유하는 뉴클레오타이드를 포함할 수 있다.A sugar group may also contain one or more carbons having the opposite stereochemical configuration to the corresponding carbon in ribose. Thus, SM_mRNA may comprise, for example, nucleotides containing arabinose as a sugar.

백본 변형체(Backbone Modifications):Backbone Modifications:

포스페이트 백본은 또한, 본원에 설명된 바와 같이, 변형 RNA 내로 포함될 수 있는 변형된 뉴클레오사이드 및 뉴클레오타이드로 변형될 수 있다. 백본의 포스페이트기는 상이한 치환체를 갖는 하나 이상의 산소 원자를 치환함으로써 변형될 수 있다. 또한, 변형된 뉴클레오사이드 및 뉴클레오타이드는 본원에 설명된 바와 같은 변형된 포스페이트를 갖는 비화학적 변형된 포스페이트 성분의 총 치환을 포함할 수 있다. 변형된 포스페이트기의 예로는, 이에 한정되는 것은 아니지만, 포스포로티오에이트, 포스포로셀레네이트, 보라노 포스페이트, 보라노 포스페이트 에스테르, 하이드로겐 포스포네이트, 포스포로아미데이트, 알킬 또는 아릴 포스포네이트 및 포스포트리에스테르를 포함한다. 포스포로티오에이트는 황(sulfur)으로 치환된 모두 비-연결된 산소를 갖는다. 포스페이트 연결자는 또한 연결된 산소가 질소(가교 포스포로아미데이트), 황(가교 포스포로티오에이트) 및 탄소(가교 메틸렌-포스포네이트)의 치환에 의해 SM될 수 있다.The phosphate backbone can also be modified with modified nucleosides and nucleotides that can be incorporated into modified RNA, as described herein. The phosphate group of the backbone can be modified by substituting one or more oxygen atoms with different substituents. In addition, modified nucleosides and nucleotides may include total substitution of a non-chemically modified phosphate moiety with a modified phosphate as described herein. Examples of modified phosphate groups include, but are not limited to, phosphorothioates, phosphoroselenates, borano phosphates, borano phosphate esters, hydrogen phosphonates, phosphoroamidates, alkyl or aryl phosphonates. and phosphotriesters. Phosphorothioates have all unlinked oxygens substituted with sulfur. Phosphate linkers can also be SMed by substitution of nitrogen (bridged phosphoroamidate), sulfur (bridged phosphorothioate) and carbon (bridged methylene-phosphonate) in the linked oxygen.

염기 변형체(base modifications):base modifications:

본원에 설명된 바와 같이, 변형 RNA 내로 포함될 수 있는 화학적 변형된 뉴클레오사이드 및 뉴클레오타이드는 핵염기 성분(moiety)에서 추가로 SM될 수 있다. RNA에서 발견되는 핵염기의 예로는, 이에 한정되는 것은 아니지만, 아데닌, 구아닌, 사이토신 및 우라실이 포함된다. 예를 들어, 본원에 설명된 바와 같은 뉴클레오사이드 및 뉴클레오타이드는 주홈면(major groove face)에서 화학적으로 SM될 수 있다. 화학적 변형체는 아미노기, 티올기, 알킬기, 또는 할로기를 포함할 수 있다.As described herein, chemically modified nucleosides and nucleotides that can be incorporated into a modified RNA can be further SMed at a nucleobase moiety. Examples of nucleobases found in RNA include, but are not limited to, adenine, guanine, cytosine, and uracil. For example, nucleosides and nucleotides as described herein can be chemically SM in the major groove face. The chemical modification may include an amino group, a thiol group, an alkyl group, or a halo group.

본 발명에서, 뉴클레오타이드 유사체/변형체는 염기 변형체로부터 선택되며, 이는 바람직하게 2-아미노-6-클로로퓨린리보사이드-5'트리포스페이트, 2-아미노퓨린-리보사이드-5'트리포스페이트; 2-아미노아데노신-5'트리포스페이트, 2'-아미노-2'-데옥시사이티딘-트리포스페이트, 2-티오사이티딘-5'트리포스페이트, 2-티오우리딘-5'트리포스페이트, 2'-플루오로티미딘-5'트리포스페이트, 2'-O-메틸 이노신-5'트리포스페이트 4-티오우리딘-5'트리포스페이트, 5-아미노알릴사이티딘-5'트리포스페이트, 5-아미노알릴우리딘-5'트리포스페이트, 5-브로모사이티딘-5'트리포스페이트, 5-브로모우리딘-5'트리포스페이트, 5-브로모-2'-데옥시사이티딘-5'트리포스페이트, 5-브로모-2'-데옥시우리딘-5'트리포스페이트, 5-요오도사이티딘-5'트리포스페이트, 5-요오도-2'-데옥시사이티딘-5'트리포스페이트, 5-요오도우리딘-5'트리포스페이트, 5-요오도-2'-데옥시우리딘-5'트리포스페이트, 5-메틸사이티딘-5'트리포스페이트, 5-메틸우리딘-5'트리포스페이트, 5-프로피닐-2'-데옥시사이티딘-5'트리포스페이트, 5-프로피닐-2'-데옥시우리딘-5'트리포스페이트, 6-아자사이티딘-5'트리포스페이트, 6-아자우리딘-5'트리포스페이트, 6-클로로퓨린리보사이드-5'트리포스페이트, 7-데아자아데노신-5'트리포스페이트, 7-데아자구아노신-5'트리포스페이트, 8-아자아데노신-5'트리포스페이트, 8-아지도아데노신-5'트리포스페이트, 벤지미다졸-리보사이드-5'트리포스페이트, N1-메틸아데노신-5'트리포스페이트, N1-메틸구아노신-5'트리포스페이트, N6-메틸아데노신-5'트리포스페이트, O6-메틸구아노신-5'트리포스페이트, 슈도우리딘-5'트리포스페이트, 또는 퓨로마이신-5'트리포스페이트, 잔토신-5'트리포스페이트로부터 선택된다. 5-메틸사이티딘-5'트리포스페이트, 7-데아자구아노신-5'트리포스페이트, 5-브로모사이티딘-5'트리포스페이트, 및 슈도우리딘-5'트리포스페이트로 이루어진 염기-CM의 군으로부터 선택된 염기 SM을 위한 뉴클레오타이드가 특히 바람직하다.In the present invention, the nucleotide analogs/variants are selected from base variants, which are preferably 2-amino-6-chloropurineriboside-5'triphosphate, 2-aminopurine-riboside-5'triphosphate; 2-Aminoadenosine-5'triphosphate, 2'-amino-2'-deoxycytidine-triphosphate, 2-thiocytidine-5'triphosphate, 2-thiouridine-5'triphosphate, 2' -Fluorothymidine-5'triphosphate, 2'-O-methyl inosine-5'triphosphate 4-thiouridine-5'triphosphate, 5-aminoallylcytidine-5'triphosphate, 5-aminoallyl Uridine-5'triphosphate, 5-bromocytidine-5'triphosphate, 5-bromouridine-5'triphosphate, 5-bromo-2'-deoxycytidine-5'triphosphate, 5-Bromo-2'-deoxyuridine-5'triphosphate, 5-iodocytidine-5'triphosphate, 5-iodo-2'-deoxycytidine-5'triphosphate, 5- iodouridine-5'triphosphate, 5-iodo-2'-deoxyuridine-5'triphosphate, 5-methylcytidine-5'triphosphate, 5-methyluridine-5'triphosphate, 5-propynyl-2'-deoxycytidine-5' triphosphate, 5-propynyl-2'-deoxyuridine-5' triphosphate, 6-azacytidine-5' triphosphate, 6-aza Uridine-5'triphosphate, 6-chloropurineriboside-5'triphosphate, 7-deazadenosine-5'triphosphate, 7-deazaguanosine-5'triphosphate, 8-azaadenosine-5' Triphosphate, 8-azidoadenosine-5'triphosphate, benzimidazole-riboside-5'triphosphate, N1-methyladenosine-5'triphosphate, N1-methylguanosine-5'triphosphate, N6-methyl adenosine-5'triphosphate, O6-methylguanosine-5'triphosphate, pseudouridine-5'triphosphate, or puromycin-5'triphosphate, xanthosine-5'triphosphate. of the base-CM consisting of 5-methylcytidine-5'triphosphate, 7-deazaguanosine-5'triphosphate, 5-bromocytidine-5'triphosphate, and pseudouridine-5'triphosphate Nucleotides for base SM selected from the group are particularly preferred.

변형된 뉴클레오사이드는 피리딘-4-온 리보뉴클레오사이드, 5-아자-우리딘, 2-티오-5-아자-우리딘, 2-티오우리딘, 4-티오-슈도우리딘, 2-티오-슈도우리딘, 5-하이드록시우리딘, 3-메틸우리딘, 5-카복시메틸-우리딘, 1-카복시메틸-슈도우리딘, 5-프로피닐-우리딘, 1-프로피닐-슈도우리딘, 5-타우리노메틸우리딘, 1-타우리노메틸-슈도우리딘, 5-타우리노메틸-2-티오-우리딘, l-타우리노메틸-4-티오-우리딘, 5-메틸-우리딘, 1-메틸-슈도우리딘, 4-티오-1-메틸-슈도우리딘, 2-티오-l-메틸-슈도우리딘, 1-메틸-1-데아자-슈도우리딘, 2-티오-1-메틸-1-데아자-슈도우리딘, 디하이드로우리딘, 디하이드로슈도우리딘, 2-티오-디하이드로우리딘, 2-티오-디하이드로슈도우리딘, 2-메톡시우리딘, 2-메톡시-4-티오-우리딘, 4-메톡시-슈도우리딘, 및 4-메톡시-2-티오-슈도우리딘을 포함한다.Modified nucleosides include pyridin-4-one ribonucleoside, 5-aza-uridine, 2-thio-5-aza-uridine, 2-thiouridine, 4-thio-pseudouridine, 2- Thio-pseudouridine, 5-hydroxyuridine, 3-methyluridine, 5-carboxymethyl-uridine, 1-carboxymethyl-pseudouridine, 5-propynyl-uridine, 1-propynyl-pseudo Uridine, 5-taurinomethyluridine, 1-taurinomethyl-pseudouridine, 5-taurinomethyl-2-thio-uridine, 1-taurinomethyl-4-thio-uridine, 5-methyl -uridine, 1-methyl-pseudouridine, 4-thio-1-methyl-pseudouridine, 2-thio-1-methyl-pseudouridine, 1-methyl-1-deaza-pseudouridine, 2 -Thio-1-methyl-1-deaza-pseudouridine, dihydrouridine, dihydropseudouridine, 2-thio-dihydrouridine, 2-thio-dihydropseudouridine, 2-methoxy uridine, 2-methoxy-4-thio-uridine, 4-methoxy-pseudouridine, and 4-methoxy-2-thio-pseudouridine.

변형된 뉴클레오사이드는 5-아자-사이티딘, 슈도이소사이티딘, 3-메틸-사이티딘, N4-아세틸사이티딘, 5-포밀사이티딘, N4-메틸사이티딘, 5-하이드록시메틸사이티딘, 1-메틸-슈도이소사이티딘, 피롤로-사이티딘, 피롤로-슈도이소사이티딘, 2-티오-사이티딘, 2-티오-5-메틸-사이티딘, 4-티오-슈도이소사이티딘, 4-티오-1-메틸-슈도이소사이티딘, 4-티오-1-메틸-1-데아자-슈도이소사이티딘, 1-메틸-1-데아자-슈도이소사이티딘, 제부라린, 5-아자-제부라린, 5-메틸-제부라린, 5-아자-2-티오-제부라린, 2-티오-제부라린, 2-메톡시-사이티딘, 2-메톡시-5-메틸-사이티딘, 4-메톡시-슈도이소사이티딘, 및 4-메톡시-l-메틸-슈도이소사이티딘을 포함한다.Modified nucleosides include 5-aza-cytidine, pseudoisocytidine, 3-methyl-cytidine, N4-acetylcytidine, 5-formylcytidine, N4-methylcytidine, 5-hydroxymethyl Tidine, 1-methyl-pseudoisocytidine, pyrrolo-cytidine, pyrrolo-pseudoisocytidine, 2-thio-cytidine, 2-thio-5-methyl-cytidine, 4-thio-pseudoisocytidine Dean, 4-thio-1-methyl-pseudoisocytidine, 4-thio-1-methyl-1-deaza-pseudoisocytidine, 1-methyl-1-deaza-pseudoisocytidine, zebrarin, 5-aza-zevurarin, 5-methyl-zeburarine, 5-aza-2-thio-zeburarine, 2-thio-zeburarine, 2-methoxy-cytidine, 2-methoxy-5-methyl-between tidine, 4-methoxy-pseudoisocytidine, and 4-methoxy-1-methyl-pseudoisocytidine.

변형된 뉴클레오사이드는 2-아미노퓨린, 2, 6-디아미노퓨린, 7-데아자-아데닌, 7-데아자-8-아자-아데닌, 7-데아자-2-아미노퓨린, 7-데아자-8-아자-2-아미노퓨린, 7-데아자-2,6-디아미노퓨린, 7-데아자-8-아자-2,6-디아미노퓨린, 1-메틸아데노신, N6-메틸아데노신, N6-이소펜테닐아데노신, N6-(시스-하이드록시이소펜테닐)아데노신, 2-메틸티오-N6-(시스-하이드록시이소펜테닐)아데노신, N6-글리시닐카바모일아데노신, N6-트레오닐카바모일아데노신, 2-메틸티오-N6-트레오닐카바모일아데노신, N6,N6-디메틸아데노신, 7-메틸아데닌, 2-메틸티오-아데닌, 및 2-메톡시-아데닌을 포함한다.The modified nucleosides are 2-aminopurine, 2,6-diaminopurine, 7-deaza-adenine, 7-deaza-8-aza-adenine, 7-deaza-2-aminopurine, 7-de Aza-8-aza-2-aminopurine, 7-deaza-2,6-diaminopurine, 7-deaza-8-aza-2,6-diaminopurine, 1-methyladenosine, N6-methyladenosine , N6-Isopentenyladenosine, N6-(cis-hydroxyisopentenyl)adenosine, 2-methylthio-N6-(cis-hydroxyisopentenyl)adenosine, N6-glycinylcarbamoyladenosine, N6- threonylcarbamoyladenosine, 2-methylthio-N6-threonylcarbamoyladenosine, N6,N6-dimethyladenosine, 7-methyladenine, 2-methylthio-adenine, and 2-methoxy-adenine.

변형된 뉴클레오사이드는 이노신, 1-메틸-이노신, 와이오신(wyosine), 와이부토신(wybutosine), 7-데아자-구아노신, 7-데아자-8-아자-구아노신, 6-티오-구아노신, 6-티오-7-데아자-구아노신, 6-티오-7-데아자-8-아자-구아노신, 7-메틸-구아노신, 6-티오-7-메틸-구아노신, 7-메틸이노신, 6-메톡시-구아노신, 1-메틸구아노신, N2-메틸구아노신, N2,N2-디메틸구아노신, 8-옥소-구아노신, 7-메틸-8-옥소-구아노신, l-메틸-6-티오-구아노신, N2-메틸-6-티오-구아노신, 및 N2,N2-디메틸-6-티오-구아노신을 포함한다.Modified nucleosides include inosine, 1-methyl-inosine, wyosine, wybutosine, 7-deaza-guanosine, 7-deaza-8-aza-guanosine, 6-thio -guanosine, 6-thio-7-deaza-guanosine, 6-thio-7-deaza-8-aza-guanosine, 7-methyl-guanosine, 6-thio-7-methyl-guanosine, 7-methylinosine, 6-methoxy-guanosine, 1-methylguanosine, N2-methylguanosine, N2,N2-dimethylguanosine, 8-oxo-guanosine, 7-methyl-8-oxo-guanosine , 1-methyl-6-thio-guanosine, N2-methyl-6-thio-guanosine, and N2,N2-dimethyl-6-thio-guanosine.

뉴클레오타이드는 SM될 수 있고 우라실의 C-5의 하이드로겐을 메틸기 또는 할로기로 교체하는 것을 포함할 수 있다.The nucleotide may be SM and may comprise replacing the hydrogen at C-5 of uracil with a methyl group or a halo group.

변형된 뉴클레오사이드는 5'0-(l-티오포스페이트)-아데노신, 5'0-(1-티오포스페이트)-사이티딘, 5'0-(1-티오포스페이트)-구아노신, 5'0-(1-티오포스페이트)-우리딘 또는 5'0-(l-티오포스페이트)-슈도우리딘이다.Modified nucleosides are 5'0-(l-thiophosphate)-adenosine, 5'0-(1-thiophosphate)-cytidine, 5'0-(1-thiophosphate)-guanosine, 5'0 -(1-thiophosphate)-uridine or 5'0-(1-thiophosphate)-pseudouridine.

SM_mRNAi는 6-아자-사이티딘, 2-티오-사이티딘, α-티오-사이티딘, 슈도-이소-사이티딘, 5-아미노알릴-우리딘, 5-요오도-우리딘, N1-메틸-슈도우리딘, 5,6-디하이드로우리딘, α-티오-우리딘, 4-티오-우리딘, 6-아자-우리딘, 5-하이드록시-우리딘, 데옥시-티미딘, 5-메틸-우리딘, 피롤로-사이티딘, 이노신, α-티오-구아노신, 6-메틸-구아노신, 5-메틸-사이티딘, 8-옥소-구아노신, 7-데아자-구아노신, N1-메틸-아데노신, 2-아미노-6-클로로-퓨린, N6-메틸-2-아미노-퓨린, 슈도-이소-사이티딘, 6-클로로-퓨린, N6-메틸-아데노신, α-티오-아데노신, 8-아지도-아데노신, 7-데아자-아데노신으로부터 선택된 뉴클레오사이드 화학적 변형체를 포함할 수 있다.SM_mRNAi is 6-aza-cytidine, 2-thio-cytidine, α-thio-cytidine, pseudo-iso-cytidine, 5-aminoallyl-uridine, 5-iodo-uridine, N1-methyl- Pseudouridine, 5,6-dihydrouridine, α-thio-uridine, 4-thio-uridine, 6-aza-uridine, 5-hydroxy-uridine, deoxy-thymidine, 5- Methyl-uridine, pyrrolo-cytidine, inosine, α-thio-guanosine, 6-methyl-guanosine, 5-methyl-cytidine, 8-oxo-guanosine, 7-deaza-guanosine, N1 -Methyl-adenosine, 2-amino-6-chloro-purine, N6-methyl-2-amino-purine, pseudo-iso-cytidine, 6-chloro-purine, N6-methyl-adenosine, α-thio-adenosine, 8-azido-adenosine, 7-deaza-adenosine, a nucleoside chemical modification selected from the group consisting of:

지질 변형체(Lipid modification):Lipid modification:

본 발명의 변형 RNA는 지질 변형을 함유할 수 있다. 이와 같은 지질-변형 RNA는 일반적으로 본원에 정의된 바와 같은 RNA를 포함한다. 본 발명의 지질-변형 RNA 분자는 일반적으로 RNA 분자와 공유결합된 적어도 하나의 연결자, 및 각각의 연결자와 공유결합된 적어도 하나의 지질을 추가적으로 포함한다. 대신에, 지질-변형 RNA 분자는 본원에 정의된 바와 같은 적어도 하나의 RNA 분자 및 RNA 분자와 (연결자 없이) 공유결합된 적어도 하나의 (2 기능성) 지질을 포함한다. 세 번째 대안에 따라서, 지질-화학적 변형 RNA 분자는 본원에 정의된 바와 같은 RNA 분자, RNA 분자와 공유결합된 적어도 하나의 연결자, 및 각각의 연결자와 공유결합된 적어도 하나의 지질, 및 또한 RNA 분자와 (연결자 없이) 공유결합된 적어도 하나의 (2 기능성) 지질을 포함한다. 지질 변형은 선형 RNA 서열의 말단 끝에 존재하는 것이 특히 바람직하다.The modified RNAs of the invention may contain lipid modifications. Such lipid-modified RNAs generally include RNAs as defined herein. Lipid-modified RNA molecules of the invention generally further comprise at least one linker covalently linked to the RNA molecule, and at least one lipid covalently linked to each linker. Instead, the lipid-modifying RNA molecule comprises at least one RNA molecule as defined herein and at least one (bifunctional) lipid covalently linked (without a linker) to the RNA molecule. According to a third alternative, the lipid-chemically modifying RNA molecule is an RNA molecule as defined herein, at least one linker covalently linked to the RNA molecule, and at least one lipid covalently linked to each linker, and also an RNA molecule and at least one (bifunctional) lipid covalently linked (without a linker). It is particularly preferred that the lipid modification is at the terminal end of the linear RNA sequence.

3. 염기서열의 변형(SM)3. Modification of the base sequence (SM)

오픈 리딩 프레임의 변형: G/C 함량의 변형:Variation of open reading frame: Variation of G/C content:

본 발명의 SM_mRNAi는 적어도 하나의 펩타이드 또는 단백질을 코딩하는, 코딩 영역의 G/C 함량은 변형되고, 이의 특정 야생형 코딩 영역, 즉, 비변형 코딩 영역의 G/C 함량과 비교하였을 때 특히 증가된다. 코딩 역역의 아미노산 서열은 특정 야생형 코딩 영역의 코딩된 아미노산 서열과 비교하였을 때 변형되지 않는 것이 바람직하다.SM_mRNAi of the present invention encodes at least one peptide or protein, wherein the G/C content of the coding region is modified and is particularly increased when compared to the G/C content of its specific wild-type coding region, i.e., the unmodified coding region. . Preferably, the amino acid sequence of the coding region is not modified as compared to the encoded amino acid sequence of the particular wild-type coding region.

본 발명에서 SM_mRNAi 코딩 영역의 G/C-함량의 변형은, 번역될 임의의 mRNA 영역의 서열이 mRNA의 효율적인 번역에 중요하다는 사실을 기초로 한다. 따라서, 다양한 뉴클레오타이드의 조성 및 서열은 중요하다. 특히 G(구아노신)/C(사이토신) 함량이 증가된 mRNA 서열은, A(아데노신)/U(우라실) 함량이 증가된 mRNA 서열보다 더욱 안정하다. 본 발명에 따르면, 지속적으로 아미노산 서열로 번역되고 있는 코딩 영역의 코돈은, 이 코돈 중 G/C 뉴클레오타이드의 양이 증가되었다는 점에서 이의 야생형 코딩 영역의 코돈과는 상이하다. 몇몇 코돈은 하나의 동일한 아미노산을 코딩한다는 사실(소위 유전적 암호의 축퇴성(degeneration))에 비추어, 안정성에 가장 유리한 코돈이 결정될 수 있다(소위 대안적 코돈 선호도(alternative codon usage)).The modification of the G/C-content of the SM_mRNAi coding region in the present invention is based on the fact that the sequence of any mRNA region to be translated is important for efficient translation of the mRNA. Thus, the composition and sequence of the various nucleotides is important. In particular, an mRNA sequence having an increased content of G (guanosine)/C (cytosine) is more stable than an mRNA sequence having an increased content of A (adenosine)/U (uracil). According to the present invention, the codon of the coding region that is continuously being translated into the amino acid sequence is different from the codon of its wild-type coding region in that the amount of G/C nucleotides in the codon is increased. In light of the fact that several codons encode one and the same amino acid (the so-called degeneration of the genetic code), the codon most favorable for stability can be determined (the so-called alternative codon usage).

본 발명에서 SM_mRNAi의 코딩 영역에 의해 코딩될 아미노산에 따라서, 이의 야생형 코딩 영역과 비교할 때 RNA 서열, 예를 들어, 코딩 영역의 변형에 대한 다양한 가능성이 존재한다. 오직 G 또는 C 뉴클레오타이드만을 함유하는 코돈에 의해 코딩된 아미노산의 경우, 코돈의 변형은 필요하지 않다. 따라서, A 또는 U가 존재하지 않기 때문에, Pro(CCC 또는 CCG), Arg(CGC 또는 CGG), Ala(GCC 또는 GCG) 그리고 Gly (GGC 또는 GGG)에 대한 코돈은 변형이 필요하지 않다.Depending on the amino acid to be encoded by the coding region of SM_mRNAi in the present invention, various possibilities exist for modification of the RNA sequence, eg, the coding region, when compared to its wild-type coding region. For amino acids encoded by codons containing only G or C nucleotides, no codon modifications are necessary. Therefore, since neither A nor U is present, the codons for Pro (CCC or CCG), Arg (CGC or CGG), Ala (GCC or GCG) and Gly (GGC or GGG) do not require modification.

대조적으로, A 및/또는 U 뉴클레오타이드를 함유하는 코돈은, 동일한 아미노산을 코딩하지만 A 및/또는 U를 함유하지 않는 다른 코돈의 치환에 의해 변형될 수 있으며, 이들의 예로는 다음과 같다: In contrast, codons containing A and/or U nucleotides may be modified by substitution of other codons encoding the same amino acid but not containing A and/or U, examples of which are:

Pro에 대한 코돈은 CCU 또는 CCA에서 CCC 또는 CCG로 변형될 수 있고; The codon for Pro may be modified from CCU or CCA to CCC or CCG;

Arg에 대한 코돈은 CGU 또는 CGA 또는 AGA 또는 AGG에서 CGC 또는 CGG로 변형될 수 있으며;The codon for Arg may be modified from CGU or CGA or AGA or AGG to CGC or CGG;

Ala에 대한 코돈은 GCU 또는 GCA에서 GCC 또는 GCG로 변형될 수 있고;The codon for Ala can be modified from GCU or GCA to GCC or GCG;

Gly에 대한 코돈은 GGU 또는 GGA에서 GGC 또는 GGG로 변형될 수 있다.The codon for Gly can be modified from GGU or GGA to GGC or GGG.

다른 경우에서, 비록 A 또는 U 뉴클레오타이드가 코돈으로부터 제거될 수 없다고 하더라도, 더욱 적은 함량의 A 및/또는 U 뉴클레오타이드를 함유하는 코돈을 사용함으로써 A 및 U 함량이 감소할 수 있다. 이들의 예로는 다음과 같은 경우가 있다:In other cases, although A or U nucleotides cannot be removed from the codon, the A and U content can be reduced by using codons containing lower amounts of A and/or U nucleotides. Examples of these are:

Phe에 대한 코돈은 UUU에서 UUC로 변형될 수 있고;The codon for Phe can be modified from UUU to UUC;

Leu에 대한 코돈은 UUA, UUG, CUU 또는 CUA에서 CUC 또는 CUG로 변형될 수 있으며;The codon for Leu may be modified from UUA, UUG, CUU or CUA to CUC or CUG;

Ser에 대한 코돈은 UCU 또는 UCA 또는 AGU에서 UCC, UCG 또는 AGC로 변형될 수 있고;The codon for Ser can be modified from UCU or UCA or AGU to UCC, UCG or AGC;

Tyr에 대한 코돈은 UAU에서 UAC로 변형될 수 있으며;The codon for Tyr can be modified from UAU to UAC;

Cys에 대한 코돈은 UGU에서 UGC로 변형될 수 있고;The codon for Cys can be modified from UGU to UGC;

His에 대한 코돈은 CAU에서 CAC로 변형될 수 있으며;The codon for His can be modified from CAU to CAC;

Gln에 대한 코돈은 CAA에서 CAG로 변형될 수 있고;The codon for Gln can be modified from CAA to CAG;

Ile에 대한 코돈은 AUU 또는 AUA에서 AUC로 변형될 수 있으며;The codon for Ile can be modified from AUU or AUA to AUC;

Thr에 대한 코돈은 ACU 또는 ACA에서 ACC 또는 ACG로 변형될 수 있고;The codon for Thr can be modified from ACU or ACA to ACC or ACG;

Asn에 대한 코돈은 AAU에서 AAC로 변형될 수 있으며;The codon for Asn can be modified from AAU to AAC;

Lys에 대한 코돈은 AAA에서 AAG로 변형될 수 있고;The codon for Lys can be modified from AAA to AAG;

Val에 대한 코돈은 GUU 또는 GUA에서 GUC 또는 GUG로 변형될 수 있으며;The codon for Val can be modified from GUU or GUA to GUC or GUG;

Asp에 대한 코돈은 GAU에서 GAC로 변형될 수 있고;The codon for Asp can be modified from GAU to GAC;

Glu에 대한 코돈은 GAA에서 GAG로 변형될 수 있으며;The codon for Glu can be modified from GAA to GAG;

종결 코돈 UAA는 UAG 또는 UGA로 변형될 수 있다.The stop codon UAA may be modified to UAG or UGA.

한편, Met(AUG) 및 Trp(UGG)에 대한 코돈의 경우, 서열 변형 가능성은 없다.On the other hand, in the case of codons for Met(AUG) and Trp(UGG), there is no possibility of sequence modification.

본 발명에서 SM_mRNAi의 코딩 영역의 G/C 함량을, 특정 야생형 코딩 영역(즉 원래의 서열)의 G/C 함량에 비해 증가시키기 위해서는, 상기 나열된 치환들은 개별적으로 적용될 수 있거나, 가능한 임의의 조합으로 적용될 수 있다. 따라서, 예를 들어 야생형 서열에서 발생하는 Thr에 대한 모든 코돈은 ACC(또는 ACG)로 변형될 수 있다.In order to increase the G/C content of the coding region of SM_mRNAi in the present invention compared to the G/C content of a specific wild-type coding region (ie the original sequence), the substitutions listed above can be applied individually or in any possible combination. can be applied. Thus, for example, all codons for Thr occurring in the wild-type sequence can be modified to ACC (or ACG).

바람직하게 본 발명에서 SM_mRNAi의 코딩 영역의 G/C 함량은, 야생형 코딩 영역의 G/C 함량에 비하여 7% 이상, 더욱 바람직하게 15% 이상, 특히 바람직하게 20% 이상 증가된다. 병원성 항체 또는 절편, 이의 변이체 또는 유도체를 포함하는 적어도 하나의 펩타이드 또는 단백질을 하나 이상을 코딩하는 코딩 영역에서 치환 가능한 코돈들 중 5%, 10%, 20%, 30%, 40%, 50%, 60% 이상, 더욱 바람직하게는 70% 이상, 더욱 더 바람직하게는 80% 이상, 그리고 가장 바람직하게는 90% 이상, 95% 이상 또는 심지어 100%가 치환되며, 이로써 상기 코딩 영역의 G/C 함량이 증가하게 된다.Preferably, in the present invention, the G/C content of the coding region of SM_mRNAi is increased by 7% or more, more preferably 15% or more, particularly preferably 20% or more, compared to the G/C content of the wild-type coding region. 5%, 10%, 20%, 30%, 40%, 50% of codons substitutable in the coding region encoding one or more peptides or proteins, including pathogenic antibodies or fragments, variants or derivatives thereof, 60% or more, more preferably 70% or more, even more preferably 80% or more, and most preferably 90% or more, 95% or more or even 100% are substituted, whereby the G/C content of said coding region is substituted. this will increase

특히 바람직하게, 본 발명에서 SM_mRNAi의 코딩 영역의 G/C 함량은, 야생형 코딩 영역의 G/C 함량에 비하여 최대값(즉, 치환 가능한 코돈의 100%)만큼 증가할 수 있다.Particularly preferably, in the present invention, the G/C content of the coding region of SM_mRNAi may increase by a maximum value (ie, 100% of substitutable codons) compared to the G/C content of the wild-type coding region.

코돈 최적화(Codon optimization):Codon optimization:

본 발명에서 SM_mRNAi의 적어도 하나의 펩타이드 또는 단백질을 코딩하는 코딩 영역의 추가적인 바람직한 변형은 번역 효율이 세포 내 tRNA의 출현의 상이한 빈도에 의해 또한 결정된다는 발견에 기초한다. 따라서, 만약, 소위 "희귀(rare) 코돈"이 야생형 RNA 서열의 코딩 영역에 증가된 정도로 존재하면, 상대적으로 "빈번한(frequent)" tRNA를 코딩하는 코돈이 존재하는 경우보다 현저히 낮은 정도로 번역된다.A further preferred modification of the coding region encoding at least one peptide or protein of SM_mRNAi in the present invention is based on the finding that translation efficiency is also determined by different frequencies of appearance of tRNA in cells. Thus, if so-called "rare codons" are present to an increased degree in the coding region of a wild-type RNA sequence, they are translated to a significantly lower degree than if codons encoding a relatively "frequent" tRNA are present.

SM_mRNAi의 코딩 영역은 바람직하게 상응하는 야생형 코딩 영역과 비교하여 변형되는 결과, 적어도 하나의 세포 내에서 상대적으로 희귀한 tRNA를 코딩하는 야생형 서열의 코돈은, 세포 내에서 상대적으로 빈번한 tRNA를 코딩하고 상대적으로 희귀한 tRNA로서 동일한 아미노산을 운반하는 코돈으로 치환된다. 이러한 변형에 의해, 본 발명의 SM_mRNAi의 코딩 영역은 변형되는 결과, 빈번하게 발생하는 tRNA를 이용하기 위한 코돈이 삽입된다. 다시 말해서, 본 발명에 따르면, 이러한 변형에 의해 세포 내에서 상대적으로 희귀한 tRNA를 코딩하는 야생형 코딩 영역의 모든 코돈은 각각의 경우에서 세포 내에서 상대적으로 빈번한 tRNA를 코딩하는 코돈으로 치환될 수 있고, 각각의 경우에서 상대적으로 희귀한 tRNA로서 아미노산을 운반할 수 있다.The coding region of the SM_mRNAi is preferably modified compared to the corresponding wild-type coding region so that the codons of the wild-type sequence encoding a tRNA, which are relatively rare in at least one cell, encode a tRNA that is relatively frequent in the cell and the relative is substituted with a codon carrying the same amino acid as the rare tRNA. By this modification, the coding region of the SM_mRNAi of the present invention is modified, and as a result, a codon for using a frequently occurring tRNA is inserted. In other words, according to the present invention, by this modification all codons of the wild-type coding region encoding tRNAs that are relatively rare in cells can in each case be replaced with codons encoding tRNAs that are relatively frequent in cells, and , which in each case may carry amino acids as relatively rare tRNAs.

어떤 tRNA가 세포 내에서 상대적으로 빈번하게 발생하는지, 그리고 이와는 대조적으로 어떤 tRNA가 상대적으로 희귀하게 발생하는지는 통상의 기술자에게 알려져있다. 특정 아미노산을 위해 사용하는 가장 빈번하게 발생하는 tRNA, 예를 들어, (인간) 세포내에서 가장 빈번하게 발생하는 tRNA를 사용하는 Gly 코돈이 특히 바람직하다.It is known to the person skilled in the art which tRNAs occur relatively frequently in cells and, in contrast, which tRNAs occur relatively rarely. Particular preference is given to the Gly codon using the most frequently occurring tRNA for a particular amino acid, for example the most frequently occurring tRNA in (human) cells.

본 발명의 SM_mRNAi의 코딩 영역 내에 특히 최대로 증가된 서열 G/C 함량을, RNA 서열의 코딩 영역에 의해 코딩된 펩타이드 또는 단백질의 아미노산 서열이 변형되지 않은 "빈번한" 코돈과 연관짓는 것이 특히 바람직하다. 특히 효율적으로 번역 및 안정화된(화학적 변형된) RNA 서열을 제공한다.It is particularly preferred to associate a maximally increased sequence G/C content in the coding region of the SM_mRNAi of the present invention with “frequent” codons in which the amino acid sequence of the peptide or protein encoded by the coding region of the RNA sequence is not modified. . Particularly efficiently translated and stabilized (chemically modified) RNA sequences are provided.

UTR의 변형:Variants of UTR:

바람직하게, 본 발명의 SM_mRNAi는 적어도 하나의 화학적 변형된 5' 및/또는 3' UTR 서열을 갖는다. 이들 5' 및/또는 3' UTR 내 변형은 세포 기질 내 RNA의 반감기를 증가시키는 효과를 가질 수 있거나 번역 효율을 증가시킬 수 있고 따라서 코딩된 단백질 또는 펩타이드의 발현을 향상시킬 수 있다. 이들 UTR 서열은 바이러스, 박테리아 및 진핵생물에서 발생한 자연적으로 발생하는 서열과 100% 서열 상동성을 가질 수 있으나, 부분적이거나 전체적으로도 합성될 수 있다. Preferably, the SM_mRNAi of the present invention has at least one chemically modified 5' and/or 3' UTR sequence. Modifications in these 5' and/or 3' UTRs may have the effect of increasing the half-life of the RNA in the cell matrix or may increase the translation efficiency and thus enhance the expression of the encoded protein or peptide. These UTR sequences may have 100% sequence homology to naturally occurring sequences occurring in viruses, bacteria and eukaryotes, but may also be partially or fully synthesized.

본 발명에 따른 SM_mRNAi는 바람직하게 5' 및/또는 3' UTR 요소, 특히 TOP 유전자의 5'UTR로부터 또는 이의 절편, 동족체 또는 변이체로부터 유래된 핵산을 포함하거나 이로 이루어진 5'UTR 요소, 또는 안정한 mRNA를 제공하는 유전자로부터, 또는 이의 동족체, 절편 또는 변이체로부터 유래할 수 있는 5' 및/또는 3'UTR 요소; 히스톤-스템-루프 구조, 바람직하게는 이의 3' 비번역 영역 내 히스톤-스템-루프; 5'캡(CAP) 구조; 폴리-A 꼬리; 또는 폴리(C) 서열을 포함하는 군에서 적어도 하나의 구조적 요소를 포함한다. The SM_mRNAi according to the present invention is preferably a 5' and/or 3' UTR element, in particular a 5'UTR element comprising or consisting of a nucleic acid derived from the 5'UTR of the TOP gene or from a fragment, homologue or variant thereof, or a stable mRNA 5' and/or 3'UTR elements, which may be derived from a gene providing a histone-stem-loop structure, preferably a histone-stem-loop in its 3' untranslated region; 5' cap (CAP) structure; poly-A tail; or at least one structural element from the group comprising a poly(C) sequence.

본 발명에 따른 SM_mRNAi는 적어도 하나의 5' 또는 3'UTR 요소를 포함한다. UTR 요소는 임의의 자연적으로 발생하는 5' 또는 3'UTR로부터 유래되거나, 유전자의 5' 또는 3'UTR의 절편, 동족체 또는 변이체로부터 유래된 핵산 서열을 포함하거나 이로 이루어진다. 바람직하게, 본 발명에 따라 사용된 5' 또는 3'UTR 요소는 본 발명에 따른 SM_mRNAi의 코딩 영역에 이종(heterologous)이다. 자연적으로 발생하는 유전자로부터 유래된 5' 또는 3'UTR 요소가 바람직하다 하더라도, 본 발명에서 합성적으로 조작된(engineered) UTR 요소도 사용될 수 있다.SM_mRNAi according to the present invention comprises at least one 5' or 3'UTR element. A UTR element comprises or consists of a nucleic acid sequence derived from any naturally occurring 5' or 3'UTR, or derived from a fragment, homologue or variant of a 5' or 3'UTR of a gene. Preferably, the 5' or 3'UTR element used according to the invention is heterologous to the coding region of the SM_mRNAi according to the invention. Although 5' or 3'UTR elements derived from naturally occurring genes are preferred, synthetically engineered UTR elements may also be used in the present invention.

본 발명에 따른 SM_mRNAi의 서열은 TOP 유전자의 5'UTR로부터 유래되거나 TOP 유전자의 5'UTR의 절편, 동족체 또는 변이체로부터 유래된 핵산 서열을 포함하거나 이로 이루어지는 적어도 하나의 5'비번역 영역 요소(5'UTR 요소)를 포함할 수 있다.The sequence of SM_mRNAi according to the present invention comprises or consists of at least one 5' untranslated region element (5 'UTR element).

TOP 유전자의 5'UTR로부터 유래된 5'UTR 요소의 핵산 서열은 유전자 또는 mRNA의 시작 코돈(예를 들어, A(U/T)G)의 업스트림 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10 자리에 위치한 뉴클레오타이드와 함께 이의 3'말단에서 종결된다. 따라서, 5'UTR 요소는 단백질 코딩 영역의 임의의 부분을 포함하지 않는다. 따라서, 바람직하게, 오직 본 발명에 따른 SM_mRNAi의 단백질 코딩 부분은 코딩 영역에 의해 제공된다.The nucleic acid sequence of the 5'UTR element derived from the 5'UTR of the TOP gene is 1, 2, 3, 4, 5, 6, upstream of the start codon (eg, A(U/T)G) of the gene or mRNA. It terminates at its 3' end with a nucleotide located at position 7, 8, 9 or 10. Thus, the 5'UTR element does not include any portion of the protein coding region. Thus, preferably, only the protein coding portion of the SM_mRNAi according to the present invention is provided by the coding region.

TOP 유전자의 5'UTR로부터 유래된 핵산 서열은 진핵생물 TOP 유전자로부터 유래되고, 바람직하게는 식물 또는 동물 TOP 유전자, 더욱 바람직하게는 척색동물 TOP 유전자, 더욱 더 바람직하게는 척추동물 TOP 유전자, 가장 바람직하게는 인간 TOP 유전자와 같은 포유동물 TOP 유전자로부터 유래된다.The nucleic acid sequence derived from the 5'UTR of the TOP gene is derived from a eukaryotic TOP gene, preferably a plant or animal TOP gene, more preferably a chordate TOP gene, even more preferably a vertebrate TOP gene, most preferably a It is preferably derived from a mammalian TOP gene, such as a human TOP gene.

본 발명에 따른 SM_mRNAi는 척색동물 유전자, 바람직하게는 척추동물 유전자, 더욱 바람직하게는 포유동물 유전자, 가장 바람직하게는 인간 유전자의 3'UTR로부터 유래되거나, 척색동물 유전자, 바람직하게는 척추동물 유전자, 더욱 바람직하게는 포유동물 유전자, 가장 바람직하게는 인간 유전자의 3'UTR의 변이체로부터 유래된 핵산 서열을 포함하거나 이로 이루어진 적어도 하나의 3'UTR 요소를 추가로 포함한다.SM_mRNAi according to the present invention is derived from the 3'UTR of a chordate gene, preferably a vertebrate gene, more preferably a mammalian gene, most preferably a human gene, or a chordate gene, preferably a vertebrate gene, More preferably it further comprises at least one 3'UTR element comprising or consisting of a nucleic acid sequence derived from a variant of the 3'UTR of a mammalian gene, most preferably a human gene.

용어 '3'UTR 요소'는 3'UTR로부터 유래되거나 3'UTR의 변이체로부터 유래된 핵산 서열을 포함하거나 이로 이루어진 핵산 서열을 나타낸다. 본 발명의 의미에서, 3'UTR 요소는 mRNA의 3'UTR을 대표할 수 있다. 따라서, 본 발명의 의미에서, 바람직하게, 3'UTR 요소는 mRNA, 바람직하게는 인공 mRNA의 3'UTR 일 수 있고, 또한 이는 mRNA의 3'UTR을 위한 전자 주형일 수 있다. 따라서, 3'UTR 요소는 바람직하게 mRNA의 3'UTR, 바람직하게는 인공 mRNA, 예컨대 유전적으로 조작된 벡터 plasmid의 전사에 의해 수득된 mRNA의 3'UTR에 상응하는 핵산 서열이다. 바람직하게, 3'UTR 요소는 3'UTR의 기능을 실현하거나 3'UTR의 기능을 실현하는 서열을 코딩한다.The term '3'UTR element' refers to a nucleic acid sequence comprising or consisting of a nucleic acid sequence derived from a 3'UTR or derived from a variant of the 3'UTR. In the sense of the present invention, a 3'UTR element may represent the 3'UTR of an mRNA. Thus, in the sense of the present invention, preferably, the 3'UTR element may be the 3'UTR of an mRNA, preferably of an artificial mRNA, which may also be an electron template for the 3'UTR of an mRNA. Thus, the 3'UTR element is preferably a nucleic acid sequence corresponding to the 3'UTR of an mRNA, preferably an artificial mRNA, such as a 3'UTR of an mRNA obtained by transcription of a genetically engineered vector plasmid. Preferably, the 3'UTR element realizes the function of the 3'UTR or encodes a sequence that realizes the function of the 3'UTR.

독창적인 mRNA는 (안정한 mRNA를 제공하는) 반감기가 향상된 mRNA와 관련된 유전자로부터 유래될 수 있는 3'UTR 요소를 포함하며, 예를 들어, 하기 정의 및 설명된 바와 같은 3'UTR 요소이다.A novel mRNA comprises a 3'UTR element that can be derived from a gene associated with an mRNA with improved half-life (providing a stable mRNA), for example a 3'UTR element as defined and described below.

3'UTR 요소는 알부민 유전자, α-글로빈 유전자, β-글로빈 유전자, 타이로신 하이드록실라아제유전자, 리폭시게나아제유전자, 및 콜라겐 알파 유전자, 예컨대 콜라겐 알파 1(I) 유전자로 이루어진 군으로부터 선택되는 유전자의 3'UTR로부터 유래되거나, 알부민 유전자, α-글로빈 유전자, β-글로빈 유전자, 타이로신 하이드록실라아제유전자, 리폭시게나아제유전자, 및 콜라겐 알파 유전자, 예컨대 콜라겐 알파 1(I) 유전자로 이루어진 군으로부터 선택되는 유전자의 3'UTR의 변이체로부터 유래된 핵산 서열을 포함하거나 이로 이루어진다. 3'UTR 요소는 알부민 유전자, 바람직하게는 척추동물 알부민 유전자, 더욱 바람직하게는 포유동물 알부민 유전자일 수 있다, The 3'UTR element is a gene selected from the group consisting of an albumin gene, an α-globin gene, a β-globin gene, a tyrosine hydroxylase gene, a lipoxygenase gene, and a collagen alpha gene, such as a collagen alpha 1(I) gene. from the 3'UTR of or from the group consisting of albumin gene, α-globin gene, β-globin gene, tyrosine hydroxylase gene, lipoxygenase gene, and collagen alpha gene, such as collagen alpha 1 (I) gene. It comprises or consists of a nucleic acid sequence derived from a variant of the 3'UTR of the gene of choice. The 3'UTR element may be an albumin gene, preferably a vertebrate albumin gene, more preferably a mammalian albumin gene,

가장 바람직하게는 인간 알부민 유전자의 3'UTR로부터 유래된 핵산 서열, 서열번호 6을 포함하거나 이로 이루어진다.Most preferably it comprises or consists of a nucleic acid sequence derived from the 3'UTR of the human albumin gene, SEQ ID NO:6.

인간 알부민 3'UTR: CATCACATTT AAAAGCATCT CAGCCTACCA TGAGAATAAG AGAAAGAAAA TGAAGATCAA AAGCTTATTC ATCTGTTTTT CTTTTTCGTT GGTGTAAAGC CAACACCCTG TCTAAAAAAC ATAAATTTCT TTAATCATTT TGCCTCTTTT CTCTGTGCTT CAATTAATAA AAAATGGAAA GAATCT (서열번호 6)Human Albumin 3'UTR: CATCACATTT AAAAGCATCT CAGCCTACCA TGAGAATAAG AGAAAGAAAA TGAAGATCAA AAGCTTATTC ATCTGTTTTT CTTTTTCGTT GGTGTAAAGC CAACACCCTG TCTAAAAAAC ATAAATTTCT TTAATCATTT TGCCTCTTTT CTCTGTGCTT SEQ ID NO: 6)

본 발명에 따른 SM_mRNAi는 다른 핵산으로부터 유래된 상응하는 RNA 또는 이의 절편, 동족체 또는 변이체를 포함하는 3'UTR 요소를 포함하는 것이 특히 바람직하다.It is particularly preferred that the SM_mRNAi according to the present invention comprises a 3'UTR element comprising a corresponding RNA derived from another nucleic acid or a fragment, homologue or variant thereof.

가장 바람직하게, 3'UTR 요소는 서열번호 6에 따른 인간 알부민 유전자의 절편으로부터 유래된 핵산 서열, 서열번호 7을 포함한다.Most preferably, the 3'UTR element comprises a nucleic acid sequence derived from a fragment of the human albumin gene according to SEQ ID NO:6, SEQ ID NO:7.

알부민 3'UTR: CATCACATTT AAAAGCATCT CAGCCTACC ATGAGAATAA GAGAAAGAAA ATGAAGATCA ATAGCTTATT CATCTCTTTT TCTTTTTCGT TGGTGTAAAG CCAACACCCT GTCTAAAAAA CATAAATTTC TTTAATCATT TTGCCTCTTT TCTCTGTGCT TCAATTAATA AAAAATGGAA AGAACCT (서열번호 7).Albumin 3'UTR: CATCACATTT AAAAGCATCT CAGCCTACC ATGAGAATAA GAGAAAGAAA ATGAAGATCA ATAGCTTATT CATCTCTTTT TCTTTTTCGT TGGTGTAAAG CCAACACCCT GTCTAAAAAA CATAAATTTC TTAA AGGTAATCATT TTGCCTCTTT GAACCT (SEQ ID NO: 7 TCTCTG TGCT TCAAT).

본 발명의 독창적인 mRNA의 3'UTR 요소는 서열번호 6에 따른 핵산 서열의 상응하는 RNA 서열을 포함하거나 이로 이루어지는 것이 XRMGL 바람직하다.XRMGL preferably, the 3'UTR element of the inventive mRNA comprises or consists of the corresponding RNA sequence of the nucleic acid sequence according to SEQ ID NO:6.

3'UTR 요소는 α-글로빈 유전자, 바람직하게는 척추동물 α- 또는 β-글로빈 유전자, 더욱 바람직하게는 포유동물 α- 또는 β-글로빈 유전자, 가장 바람직하게는 서열번호 6 내지 7에 따른 인간 α- 또는 β-글로빈 유전자의 3'UTR로부터 유래된 핵산 서열을 포함하거나 이로 이루어진다.The 3'UTR element is an α-globin gene, preferably a vertebrate α- or β-globin gene, more preferably a mammalian α- or β-globin gene, most preferably a human α according to SEQ ID NOs: 6 to 7 - or comprises or consists of a nucleic acid sequence derived from the 3'UTR of the β-globin gene.

3'UTR 요소는 호모 사피엔스 헤모글로빈, 알파 1(HBA1), 알파 2(HBA2) 및 베타(HBB) 유전자의 3'UTR로부터 유래된 핵산 서열 서열번호 8 내지 10을 포함하거나 이로 이루어진다.The 3'UTR element comprises or consists of nucleic acid sequences SEQ ID NOs:8-10 derived from the 3'UTR of the Homo sapiens hemoglobin, alpha 1 (HBA1), alpha 2 (HBA2) and beta (HBB) genes.

호모 사피엔스 헤모글로빈, 알파 1(HBA1)의 3'UTR: GCTGGAGCCT CGGTGGCCAT GCTTCTTGCC CCTTGGGCCT CCCCCCAGCC CCTCCTCCCC TTCCTGCACC CGTACCCCCG TGGTCTTTGA ATAAAGTCTG AGTGGGCGGC (서열번호 8)3'UTR of Homo sapiens hemoglobin, alpha 1 (HBA1): GCTGGAGCCT CGGTGGCCAT GCTTCTTGCC CCTTGGGCCT CCCCCCAGCC CCTCCTCCCC TTCCTGCACC CGTACCCCCG TGGTCTTTGA ATAAAGTCTG AGTGGGCGGC (SEQ ID NO: 8)

호모 사피엔스 헤모글로빈, 알파 2(HBA2)의 3'UTR: GCTGGAGCCT CGGTAGCCGT TCCTCCTGCC CGCTGGGCCT CCCAACGGGC CCTCCTCCCC TCCTTGCACC GGCCCTTCCT GGTCTTTGAA TAAAGTCTGA GTGGGCAG (서열번호 9)3'UTR of Homo sapiens hemoglobin, alpha 2 (HBA2): GCTGGAGCCT CGGTAGCCGT TCCTCCTGCC CGCTGGGCCT CCCAACGGGC CCTCCTCCCC TCCTTGCACC GGCCCTTCCT GGTCTTTGAA TAAAGTCTGA GTGGGCAG (SEQ ID NO: 9)

호모 사피엔스 헤모글로빈, 베타(HBB)의 3'UTR: GCTCGCTTTC TTGCTGTCCA ATTTCTATTA AAGGTTCCTT TGTTCCCTAA GTCCAACTAC TAAACTGGGG GATATTATGA AGGGCCTTGA GCATCTGGAT TCTGCCTAAT AAAAAACATT TATTTTCATT GC (서열번호 10)3'UTR of Homo sapiens hemoglobin, beta (HBB): GCTCGCTTTC TTGCTGTCCA ATTTCTATTA AAGGTTCCTT TGTTCCCTAA GTCCAACTAC TAAACTGGGG GATATTATGA AGGGCCTTGA GCATCTGGAT TCTGCCTAAT AAAAAACATT TATTTTCATT GC (SEQ ID NO:10)

예를 들어, 3'UTR 요소는 바람직하게는 서열번호 7에 따른 인간 α-글로빈 유전자와 같은 α-글로빈 유전자의 3'UTR의 중심, α-복합-결합 부분을 포함하거나 이로 이루어질 수 있다:For example, the 3'UTR element may preferably comprise or consist of a central, α-complex-binding portion of the 3'UTR of an α-globin gene, such as a human α-globin gene according to SEQ ID NO:7:

중심, α-글로빈 유전자의 3'UTR의 α-복합-결합 부분(또한 "muag"로서 본원에 명명됨); GCCCGATGGG CCTCCCAACG GGCCCTCCTC CCCTCCTTGC ACCG (서열번호 11).central, the α-complex-binding portion of the 3′UTR of the α-globin gene (also termed herein as “muag”); GCCCGATGGG CCTCCCAACG GGCCCTCCTC CCCTCCTTGC ACCG (SEQ ID NO: 11).

본 발명에 따른 SM_mRNAi의 3'UTR 요소는 서열번호 7에 따른 핵산 서열의 상응하는 RNA 서열 또는 이의 동족체, 절편 또는 변이체를 포함하거나 이로 이루어지는 것이 특히 바람직하다.It is particularly preferred that the 3'UTR element of SM_mRNAi according to the present invention comprises or consists of a corresponding RNA sequence of the nucleic acid sequence according to SEQ ID NO: 7 or a homologue, fragment or variant thereof.

바람직하게, 적어도 하나의 5'UTR 요소 및 적어도 하나의 3'UTR 요소는 상기 설명된 바와 같은 본 발명에 따른 SM_mRNAi 유래 단백질 생산을 증가시키는데 상승적인 역할을 한다. 더욱 바람직하게, 적어도 하나의 5'UTR 요소 및/또는 적어도 하나의 3'UTR 요소는 단백질 생산을 증가시키기 위해서 SM_mRNAi의 주입과 함께 상승적인 역할을 한다.Preferably, the at least one 5'UTR element and the at least one 3'UTR element play a synergistic role in increasing the production of the SM_mRNAi derived protein according to the invention as described above. More preferably, the at least one 5'UTR element and/or the at least one 3'UTR element plays a synergistic role with the injection of SM_mRNAi to increase protein production.

본 발명에 따른 SM_mRNAi는 - 적어도 하나의 변형을 첨가하여 - 내부 리보솜 유입점(internal ribosome entry site)(IRES) 서열 또는 IRES-모티프를 추가로 포함할 수 있고, 예를 들어, 만약 SM_mRNAi가 2 이상의 펩타이드 또는 단백질을 코딩하면 여러 오픈 리딩 프레임으로 분리될 수 있다. IRES-서열은 만약 mRNA가 바이- 또는 멀티시스트론 RNA라면 특히 도움이 될 수 있다.SM_mRNAi according to the present invention may further comprise - by adding at least one modification - an internal ribosome entry site (IRES) sequence or an IRES-motif, for example, if SM_mRNAi is two or more Encoding peptides or proteins can be separated into several open reading frames. The IRES-sequence can be particularly helpful if the mRNA is a bi- or multicistronic RNA.

본 발명에서 사용된 바와 같이, 용어 "RNA"는 한정되지 않고 임의의 리보 핵산을 나타낸다. 따라서, 용어 RNA는 예를 들어, 바이러스 RNA, (replicon) 또는 mRNA로서 코딩 RNA로서 기능하는 리보 핵산에, 또는 임의의 유형의 인공 RNA 발현 카세트에 동등하게 적용한다.As used herein, the term “RNA” is not limited and refers to any ribonucleic acid. Thus, the term RNA applies equally to ribonucleic acids that function as coding RNAs, for example as viral RNA, (replicon) or mRNA, or to artificial RNA expression cassettes of any type.

본 발명에 따르면, mRNAi는 RNA의 코딩 영역에 의해 코딩된 펩타이드 또는 단백질의 발현을 증가시키는 적어도 하나의 변형을 포함한다. 본 발명에 따른 mRNAi는 본원에 정의된 바와 같은 변형 중 적어도 하나의 유형을 포함한다. 대신에, 또는 다른 유형의 변형과 조합하여, 본원에 정의된 바와 같은 특정 변형, 예컨대 3'UTR, 히스톤 스템-루프 또는 폴리 C 서열은 또한 본 발명에 따른 SM_mRNAi에 하나 이상의 복제물(copy)로 존재할 수 있다. 이는 바이- 또는 멀티시스트론 RNA에 대해 특히 마찬가지이다. 본 발명에 따른 SM_mRNAi는 여러 별개의 변형의 조합을 포함할 수 있으며, 예컨대, 임의의, 예를 들어, 5'UTR, 폴리 C 서열, 폴리 A 서열, 3'UTR 또는 히스톤 스템-루프와 GC-풍부(GC-enrichment)를 조합한 변형, 여기서 각각 별개의 변형은 RNA 당 단일 복제물의 형태 또는 RNA 당 다수의 복제물 형태로 존재할 수 있다.According to the present invention, mRNAi comprises at least one modification that increases the expression of the peptide or protein encoded by the coding region of the RNA. The mRNAi according to the invention comprises at least one type of modification as defined herein. Instead, or in combination with other types of modifications, certain modifications as defined herein, such as 3'UTR, histone stem-loop or poly C sequence, may also be present in one or more copies in the SM_mRNAi according to the invention. can This is especially true for bi- or multicistronic RNAs. SM_mRNAi according to the present invention may comprise a combination of several distinct modifications, eg, any, eg 5'UTR, poly C sequence, poly A sequence, 3'UTR or histone stem-loop and GC- Modifications that combine GC-enrichment, wherein each distinct modification may exist in the form of a single copy per RNA or multiple copies per RNA.

RNA의 3'말단의 변형:Modification of the 3' end of RNA:

더욱이, 투여될 적어도 하나의 오픈 리딩 프레임을 포함하는 SM_mRNAi에 있어서, 코딩 영역의 3' 영역은 예를 들어, 아데닌 또는 사이토신 잔기의 다중 반복 스트레치의 삽입 또는 첨가에 의해 변형될 수 있다. RNA 분자의 3' 말단은 아데닌 뉴클레오타이드의 시리즈(series)("폴리(A) 꼬리")의 첨가에 의해 화학적 변형된다.Moreover, for SM_mRNAi comprising at least one open reading frame to be administered, the 3' region of the coding region may be modified, for example, by insertion or addition of multiple repeat stretches of adenine or cytosine residues. The 3' end of the RNA molecule is chemically modified by the addition of a series of adenine nucleotides ("poly(A) tail").

폴리(A) 꼬리의 길이는 plasmid를 구성하는 각각의 번역 효율에 주요한 영향을 갖는다. 효율적으로 번역되기 위해, 외생적으로(exogenously) 전달되는 mRNA의 폴리(A) 꼬리는 적어도 20개 A 잔기로 이루어져야 한다. 게다가, mRNA 발현은 폴리(A) 꼬리의 길이와 긍정적 상관관계가 있다고 설명되어 있다. 120개 뉴클레오타이들로 측정된 폴리(A) 꼬리가 더 짧은 것에 비해 mRNA 안정성 및 번역 효율이 향상되는 것을 보여준다. 본 발명의 SM_mRNAi는 폴리(A) 꼬리를 (선택적으로 다른 변형과 조합하여) 포함하고, 여기서 폴리(A) 꼬리는 적어도 30개, 바람직하게는 50개를 초과하는, 더욱 바람직하게는 100개를 초과하는, 더욱 더 바람직하게는 200개를 초과하는 아데노신 뉴클레오타이드를 포함한다. 가장 바람직하게는, RNA는 64개 아데노신 뉴클레오타이드로 이루어진 폴리(A) 꼬리를 포함한다.The length of the poly(A) tail has a major influence on the translation efficiency of each constituting the plasmid. To be efficiently translated, the poly(A) tail of an exogenously delivered mRNA must consist of at least 20 A residues. Furthermore, it has been demonstrated that mRNA expression positively correlates with the length of the poly(A) tail. It shows improved mRNA stability and translation efficiency compared to the shorter poly(A) tail measured with 120 nucleotides. The SM_mRNAi of the present invention comprise (optionally in combination with other modifications) a poly(A) tail, wherein the poly(A) tail has at least 30, preferably greater than 50, more preferably 100 poly(A) tails. more than, even more preferably more than 200 adenosine nucleotides. Most preferably, the RNA comprises a poly(A) tail consisting of 64 adenosine nucleotides.

폴리(A) 꼬리가 30개 아데노신보다 길다면, 바람직하게는 50개 아데노신보다 길다면, 더욱 바람직하게는 100개 아데노신보다 길다면, 그리고 더욱 더 바람직하게는 200개 아데노신보다 길다면, 폴리(A) 꼬리는 단지 본 발명에 따른 SM_mRNAi에 포함된 적어도 하나의 변형으로서 고려된다.If the poly(A) tail is longer than 30 adenosines, preferably longer than 50 adenosines, more preferably longer than 100 adenosines, and even more preferably longer than 200 adenosines, the poly(A) tail is only It is considered as at least one modification included in SM_mRNAi according to the present invention.

폴리(A) 꼬리의 변형은 본 발명에 따른 SM_mRNAi의 적어도 하나의 변형으로 간주되지 않는다. 이는 본 발명에 따른 SM_mRNAi는 상기 정의된 바와 같은 폴리(A) 꼬리를 포함할 수 있지만, 본 발명의 적어도 하나의 추가적인 변형을 포함할 수 있는 것을 의미한다.Modification of the poly(A) tail is not considered to be at least one modification of SM_mRNAi according to the present invention. This means that the SM_mRNAi according to the present invention may comprise a poly(A) tail as defined above, but may comprise at least one further modification of the present invention.

적어도 하나의 오픈 리딩 프레임을 포함하는 SM_mRNAi는 RNA의 코딩 영역의 영역 3'에 폴리(C) 서열을 (선택적으로 다른 변형과 조합하여) 포함한다. 폴리(C) 서열은 일반적으로 다수의 사이토신 뉴클레오타이드, 일반적으로 약 10 내지 약 200개 사이티딘 뉴클레오타이드, 바람직하게는 약 10 내지 약 100개 사이티딘 뉴클레오타이드, 더욱 바람직하게는 약 10 내지 약 70개 사이티딘 뉴클레오타이드 또는 더욱 더 바람직하게는 약 20 내지 약 50개 또는 심지어 약 20 내지 약 30개 사이티딘 뉴클레오타이드의 스트레치(stretch)이다. 폴리(C) 서열은 바람직하게는 핵산에 의해 코딩 영역의 3'에 위치할 수 있다. 본 발명의 폴리(C) 서열은 폴리(A) 서열의 3'에 위치한다.SM_mRNAi comprising at least one open reading frame comprises (optionally in combination with other modifications) a poly(C) sequence in region 3' of the coding region of the RNA. The poly(C) sequence generally comprises a plurality of cytosine nucleotides, generally between about 10 and about 200 cytidine nucleotides, preferably between about 10 and about 100 cytidine nucleotides, more preferably between about 10 and about 70 cytosine nucleotides. a stretch of tidine nucleotides or even more preferably from about 20 to about 50 or even from about 20 to about 30 cytidine nucleotides. The poly(C) sequence may preferably be located 3' of the coding region by the nucleic acid. The poly(C) sequence of the present invention is located 3' to the poly(A) sequence.

본 발명에 따른 SM_mRNAi는 적어도 하나의 변형으로서 이의 3' 말단에 히스톤 스템-루프를 포함하거나 코딩한다. SM_mRNAi according to the present invention comprises or encodes a histone stem-loop at its 3' end as at least one modification.

히스톤 스템-루프 서열을 위한 특히 바람직한 실시예는 서열번호 12 (CAAAGGCTCTTTTCAGAGCCACCA)에 따른 서열 또는 서열번호 13 (CAAAGGCUCUUUUCAGAGCCACCA)에 따른 상응하는 RNA 서열이다.A particularly preferred embodiment for a histone stem-loop sequence is the sequence according to SEQ ID NO: 12 (CAAAGGCTCTTTTCAGAGCCACCA) or the corresponding RNA sequence according to SEQ ID NO: 13 (CAAAGGCUCUUUUUCAGAGCCACCA).

이종 핵산 서열heterologous nucleic acid sequence

본 발명의 유전체 편집 RNA/DNA 시스템에 포함되는 발현 카세트는 추가로 바이러스 유래가 아닌 적어도 하나의 핵산 서열, 특히 바이러스가 아닌 핵산 서열을 포함한다. 바람직한 실시형태에서, 본 발명에 따른 발현 카세트는 이종 핵산 서열을 포함한다.The expression cassette comprised in the genome editing RNA/DNA system of the present invention further comprises at least one non-viral nucleic acid sequence, in particular a non-viral nucleic acid sequence. In a preferred embodiment, the expression cassette according to the invention comprises a heterologous nucleic acid sequence.

용어 "이종"은 핵산 서열이 바이러스 발현 제어 서열, 특히 바이러스 DdRp가 결합하는 프로모터와 같은 바이러스 핵산 서열에 천연 기능적으로 결합되지 않는 상황을 의미한다. 이종 핵산 서열은 레플리콘의 핵산 서열에 포함된다.The term “heterologous” refers to a situation in which the nucleic acid sequence is not natively functionally bound to a viral nucleic acid sequence, such as a promoter to which viral expression control sequences, in particular viral DdRp, bind. The heterologous nucleic acid sequence is comprised in the nucleic acid sequence of the replicon.

바람직하게는, 이종 핵산 서열은 DdRp가 결합하는 프로모터, 바람직하게는 바이러스 DdRp가 결합하는 프로모터의 제어 하에 있고, 보다 바람직하게는, 이종 핵산 서열은 DdRp가 결합하는 프로모터의 하류에 위치한다. 바이러스 DdRp가 결합하는 프로모터는 매우 효율적이어서 높은 수준의 이종 유전자 발현에 적합하다. 바람직하게는, DdRp가 결합하는 프로모터는 이종 핵산 서열 또는 그의 일부의 전사체를 포함하는 전사체의 생산을 제어한다.Preferably, the heterologous nucleic acid sequence is under the control of a promoter to which DdRp binds, preferably a promoter to which a viral DdRp binds, more preferably, the heterologous nucleic acid sequence is located downstream of the promoter to which DdRp binds. The promoter to which the viral DdRp binds is highly efficient, making it suitable for high-level expression of heterologous genes. Preferably, the promoter to which DdRp binds controls the production of a transcript comprising a heterologous nucleic acid sequence or a transcript of a portion thereof.

바람직하게는, DdRp가 결합하는 프로모터는 바이러스의 구조 단백질에 대한 프로모터이다. 이것은 DdRp가 결합하는 프로모터가 바이러스에 고유하고 상기 바이러스에서 하나 이상의 구조 단백질의 코딩 서열의 전사를 제어하는 프로모터라는 것을 의미한다. 본 발명에 따르면, 이종 핵산 서열은 바이러스 구조 단백질을 코딩하는 핵산 서열과 같은 바이러스 핵산 서열을 부분적으로 또는 완전히 대체할 수 있다. 바람직하게는, 이종 핵산 서열은 바이러스로부터 유래되지 않으며; 특히, 이종 핵산 서열은 DdRp가 결합하는 프로모터가 유래된 바이러스와 동일한 바이러스로부터 유래되지 않는 것이 바람직하다. Preferably, the promoter to which DdRp binds is a promoter for a structural protein of the virus. This means that the promoter to which DdRp binds is a promoter that is native to the virus and controls the transcription of the coding sequences of one or more structural proteins in the virus. According to the present invention, the heterologous nucleic acid sequence may partially or completely replace a viral nucleic acid sequence, such as a nucleic acid sequence encoding a viral structural protein. Preferably, the heterologous nucleic acid sequence is not derived from a virus; In particular, the heterologous nucleic acid sequence is preferably not derived from the same virus as the virus from which the promoter to which DdRp binds is derived.

Ⅳ. 유전체 편집 도구IV. Genome editing tools

본 발명에서 DNAge 발현 카세트는 유전체 편집 도구를 코딩하는 DNA 절편을 포함한다. 상기 유전체 편집 도구는 표적화 엔도뉴클레아제및 가이드 핵산이다. 본 발명의 DNAge 발현 카세트는 표적화 엔도뉴클레아제을 코딩하는 DNAen 발현 카세트 및 가이드 핵산을 코딩하는 DNAsg 발현 카세트를 적어도 하나 이상을 포함할 수 있다.In the present invention, the DNAge expression cassette includes a DNA fragment encoding a genome editing tool. The genome editing tools are a targeting endonuclease and a guide nucleic acid. The DNAge expression cassette of the present invention may include at least one of a DNAen expression cassette encoding a targeting endonuclease and a DNAsg expression cassette encoding a guide nucleic acid.

본 발명에서 유전체 편집 도구를 코딩하는 DNA는 동의어로 "DNAge"라고 한다. DNA는 바람직하게는 DdRp가 결합하는 프로모터의 제어 하에 본 발명에 따른 발현 카세트 상에 존재한다. In the present invention, the DNA encoding the genome editing tool is synonymously referred to as "DNAge". The DNA is preferably present on the expression cassette according to the invention under the control of a promoter to which DdRp binds.

기존 유전체 편집 CRISPR/Cas9 시스템은 플라스미드, 렌티 바이러스, 아데노 관련 바이러스 및 리보 핵 단백질(RNP) 복합체를 포함한 다양한 형태로 세포에 전달될 수 있다. CRISPR/Cas9 리보 핵 단백질 (RNP) 시스템은 Cas9 단백질과 단일 가이드 RNA (sgRNA) 또는 CRISPR RNA (crRNA) : trans-activating crRNA (tracrRNA) duplex로 구성된다.The existing genome editing CRISPR/Cas9 system can be delivered to cells in a variety of forms, including plasmids, lentiviruses, adeno-associated viruses, and ribonucleoprotein (RNP) complexes. The CRISPR/Cas9 ribonucleoprotein (RNP) system consists of a Cas9 protein and a single guide RNA (sgRNA) or CRISPR RNA (crRNA):trans-activating crRNA (tracrRNA) duplex.

crRNA는 게놈 표적에 대해 상보적으로 설계된 20개의 nt RNA 올리고 뉴클레오티드이다. crRNA 시퀀스 디자인은 표준 gRNA 디자인 원칙을 활용하며 gRNA 데이터베이스에서 쉽게 선택하거나 gRNA 디자인 도구를 사용하여 사용자 정의할 수 있다.crRNA is a 20 nt RNA oligonucleotide designed to be complementary to a genomic target. The crRNA sequence design utilizes standard gRNA design principles and can be easily selected from the gRNA database or customized using gRNA design tools.

tracrRNA는 crRNA 및 Cas9 뉴클레아제와 함께 활성화된 CRISPR/Cas9 RNP 복합체를 형성하는 67nt RNA 올리고뉴클레오타이드이다. sgRNA는 표적 게놈 서열을 식별할 수 있는 crRNA 서열과 Cas9 단백질과 복합체를 형성할 수 있는 tracrRNA 서열을 모두 포함하는 단일 RNA 올리고이다.tracrRNA is a 67nt RNA oligonucleotide that forms an activated CRISPR/Cas9 RNP complex with crRNA and Cas9 nuclease. The sgRNA is a single RNA oligo containing both a crRNA sequence capable of identifying a target genomic sequence and a tracrRNA sequence capable of forming a complex with a Cas9 protein.

sgRNA 또는 crRNA:tracrRNA 듀플렉스가 Cas9 단백질과 복합체를 형성 할 때, 이들은 함께 프로토스페이서 인접 모티프 (protospacer adjacent motif, PAM) 서열(5'NGG-3')로부터 3-4 bp 업스트림, 20 nt 가이드 RNA 서열에 상보적인 유전자좌에서 이중 가닥 파손을 생성할 수 있다.When the sgRNA or crRNA:tracrRNA duplexes form a complex with the Cas9 protein, they together form a protospacer adjacent motif (PAM) sequence 3-4 bp upstream from the (5'NGG-3'), 20 nt guide RNA sequence can create a double-stranded break at a locus complementary to

본 발명의 DNAge 발현 카세트를 구성하는 가이드 핵산을 코딩하는 DNA(DNAgn)는 가이드 핵산 분자를 전사하는 단위이다. 가이드 핵산, 에를 들면 gRNA를 포함한다. "가이드 RNA" 및 "gRNA"는 본 발명에서 상호 호환적으로 사용될 수 있으며, 전형적으로 일부 상보적인 부분을 통해 복합체를 형성하는 CRISPR RNA (crRNA)와 트랜스-코딩된 CRISPR RNA (tracrRNA, scaffold RNA)로 구성된 RNA 키메라 분자이며, crRNA는 혼성화하기 위한 타겟 서열에 충분히 상보적이며; CRISPR 복합체 (Cas9+crRNA+tracrRNA)가 타겟 서열에 특이적으로 결합하게 지시하는, 서열을 포함한다. 이 서열은 19-22개의 뉴클레오티드 길이이며, 예를 들어 타겟에 상보적인 20개의 연속 뉴클레오티드이며, 전형적으로 sgRNA 분자의 5' 말단에 위치한다. crRNA는 타겟 서열과 100% 상보적일 수 있지만, 본 발명에서는 타겟 서열과의 전체 상보성 적어도 80%, 85%, 90% 및 95%도 고려한다. tracrRNA는 100-300개의 뉴클레오티드 길이이며, 뉴클레아제에 대한 결합 부위로서, 예를 들어, Cas9 단백질은 CRISPR/Cas9 복합체를 형성하도록 한다. 바람직하게, tracrRNA는 Scaffold Template-specific sequence로 21개의 뉴클레오타이드 길이이며 Cas9과 복합체를 이루는 서열이다.DNA (DNAgn) encoding a guide nucleic acid constituting the DNAge expression cassette of the present invention is a unit for transcription of a guide nucleic acid molecule. guide nucleic acids, such as gRNA. "Guide RNA" and "gRNA" may be used interchangeably in the present invention, typically CRISPR RNA (crRNA) and trans-coding CRISPR RNA (tracrRNA, scaffold RNA) that form a complex via some complementary moiety. is an RNA chimeric molecule composed of, crRNA is sufficiently complementary to the target sequence for hybridization; contains a sequence that directs the CRISPR complex (Cas9+crRNA+tracrRNA) to specifically bind to a target sequence. This sequence is 19-22 nucleotides in length, eg 20 consecutive nucleotides complementary to the target, and is typically located at the 5' end of the sgRNA molecule. A crRNA may be 100% complementary to a target sequence, but the present invention also contemplates at least 80%, 85%, 90% and 95% total complementarity with the target sequence. The tracrRNA is 100-300 nucleotides in length, and as a binding site for a nuclease, for example, the Cas9 protein allows it to form a CRISPR/Cas9 complex. Preferably, the tracrRNA is a Scaffold Template-specific sequence that is 21 nucleotides in length and forms a complex with Cas9.

그러나, 당해 기술 분야에서는, crRNA 및 tracrRNA 특징 둘 다를 포함하는 싱글 가이드 RNA (sgRNA)가 설계될 수 있는 것으로 공지되어 있다.However, it is known in the art that a single guide RNA (sgRNA) comprising both crRNA and tracrRNA characteristics can be designed.

본 발명에 따른 DNAsg 발현 카세트는 단일 가이드 핵산 또는 다중 가이드 핵산를 코딩할 수 있다. 다중 가이드 핵산은 단일 가이드 핵산(융합 표가이드 핵산) 또는 별도의 가이드 핵산로서 코딩될 수 있다. DNAge 발현 카세트가 별도의 다중 가이드 핵산으로 코딩되는 경우, 이들 중 하나 이상에 Csy4 ribonuclease sequences 및 Cys4 ribonucleae 시스템 또는 추가적인 바이러스 프로모터 요소가 제공될 수 있다. The DNAsg expression cassette according to the present invention may encode a single guide nucleic acid or multiple guide nucleic acids. Multiple guide nucleic acids may be encoded as a single guide nucleic acid (fusion table guide nucleic acid) or as separate guide nucleic acids. Where the DNAge expression cassettes are encoded as separate multiple guide nucleic acids, one or more of them may be provided with Csy4 ribonuclease sequences and a Cys4 ribonucleae system or additional viral promoter elements.

본 발명에서 DNAsg 발현 카세트는 둘 이상의 가이드 핵산을 포함할 수 있으며, 이들 각각은 DdRp가 결합하는 프로모터의 제어 하에 있다. 이러한 다중 가이드 핵산 DNAsg 발현 카세트에서 다중 가이드 핵산 sgRNA가 제조될 것이고, 각각의 자가 DdRp가 결합하는 프로모터에 의해 개시되는 multiple gRNA 발현 카세트이 있다.. 또한, 하나의 자가 DdRp가 결합하는 프로모터에 의해 합성된 polycistronic tRNA-gRNA 발현 카세트가 있다.In the present invention, the DNAsg expression cassette may include two or more guide nucleic acids, each of which is under the control of a promoter to which DdRp binds. In this multiple guide nucleic acid DNAsg expression cassette, multiple guide nucleic acid sgRNAs will be produced, and there are multiple gRNA expression cassettes initiated by the promoter to which each autologous DdRp binds. There is a polycistronic tRNA-gRNA expression cassette.

본 발명의 시스템의 이점은 바이러스 구조 단백질을 코딩하는 헬퍼 바이러스의 존재 또는 투여를 필요로 하지 않는다는 것이다. An advantage of the system of the present invention is that it does not require the presence or administration of a helper virus encoding a viral structural protein.

상기 유전체 편집 도구는 메가뉴클레아제(meganuclease); 징크-핑거 뉴클레아제(zinc-finger nucleases, ZFNs) ; TAL-이펙터 뉴클레아제(TAL-effector nucleases, TALENs); RNA-guided 엔도뉴클레아제; DNA-guided 엔도뉴클레아제; 및 M-MLV 역전사 효소와 Cas9 H840A nickase의 융합 단백질;를 포함하며 이들 대한 구체적인 내용은 다음과 같다.The genome editing tool includes meganuclease; zinc-finger nucleases (ZFNs); TAL-effector nucleases (TALENs); RNA-guided endonuclease; DNA-guided endonuclease; and a fusion protein of M-MLV reverse transcriptase and Cas9 H840A nickase.

1. RNA-가이드된 엔도뉴클레아제1. RNA-guided endonuclease

본 발명에서 유전체 편집 도구가 RNA-guided 엔도뉴클레아제인 경우, 표적화 엔도뉴클레아제는 "Cas9 뉴클레아제" 및 "Cas9"이며, 본 발명에서 상호 호환적으로 사용되며, Cas 단백질 또는 이의 단편 (예, Cas9의 활성형의 DNA 절단 도메인 및/또는 Cas9의 gRNA 결합 도메인을 포함하는 단백질) 등의, RNA-가이드된 엔도뉴클레아제(RNA guided endonuclease)를 지칭한다. Cas9은 가이드 RNA의 안내 하에 DNA 타겟 서열을 타겟팅 및 절단하여 DNA 이중 가닥 절단 (DSB)을 형성하는, CRISPR/Cas (규칙적으로 반복되는 짧은 회문구조 반복체 클러스터 및 이의 부속 시스템) 유전체 편집 시스템의 구성 성분이다.When the genome editing tool in the present invention is an RNA-guided endonuclease, the targeting endonuclease is "Cas9 nuclease" and "Cas9", which are used interchangeably in the present invention, and include a Cas protein or a fragment thereof ( eg, a protein comprising the DNA cleavage domain of an active form of Cas9 and/or the gRNA binding domain of Cas9). Cas9 targets and cleaves a DNA target sequence under the guidance of a guide RNA to form a DNA double-stranded break (DSB), constituting the CRISPR/Cas (regularly repeating short palindromic repeat cluster and its subsystems) genome editing system is an ingredient

"가이드 RNA" 및 "gRNA"는 본 발명에서 상호 호환적으로 사용될 수 있으며, 전형적으로 일부 상보적인 부분을 통해 복합체를 형성하는 CRISPR RNA (crRNA)와 트랜스-코딩된 CRISPR RNA (tracrRNA)로 구성된 RNA 키메라 분자이며, crRNA는 혼성화하기 위한 타겟 서열에 충분히 상보적이며; CRISPR 복합체 (Cas9+crRNA+tracrRNA)가 타겟 서열에 특이적으로 결합하게 지시하는, 서열을 포함한다. 이 서열은 19-22개의 뉴클레오티드 길이이며, 예를 들어 타겟에 상보적인 20개의 연속 뉴클레오티드이며, 전형적으로 sgRNA 분자의 5' 말단에 위치한다. crRNA는 타겟 서열과 100% 상보적일 수 있지만, 본 발명에서는 타겟 서열과의 전체 상보성 적어도 80%, 85%, 90% 및 95%도 고려한다. tracrRNA는 100-300개의 뉴클레오티드 길이이며, 뉴클레아제에 대한 결합 부위로서, 예를 들어, Cas9 단백질은 CRISPR/Cas9 복합체를 형성한다.“Guide RNA” and “gRNA” may be used interchangeably in the present invention, and are typically composed of CRISPR RNA (crRNA) and trans-coded CRISPR RNA (tracrRNA) that form a complex through some complementary moiety. is a chimeric molecule, wherein the crRNA is sufficiently complementary to the target sequence for hybridization; contains a sequence that directs the CRISPR complex (Cas9+crRNA+tracrRNA) to specifically bind to a target sequence. This sequence is 19-22 nucleotides in length, eg 20 consecutive nucleotides complementary to the target, and is typically located at the 5' end of the sgRNA molecule. A crRNA may be 100% complementary to a target sequence, but the present invention also contemplates at least 80%, 85%, 90% and 95% total complementarity with the target sequence. The tracrRNA is 100-300 nucleotides in length, and as a binding site for a nuclease, for example, the Cas9 protein forms the CRISPR/Cas9 complex.

그러나, 당해 기술 분야에서는, crRNA 및 tracrRNA 특징 둘 다를 포함하는 싱글 가이드 RNA (sgRNA)가 설계될 수 있는 것으로 공지되어 있다.However, it is known in the art that a single guide RNA (sgRNA) comprising both crRNA and tracrRNA characteristics can be designed.

sgRNA를 암호화하는 DNA 서열은 다음과 같이 설계 될 수 있다(센스 가닥 표시) :The DNA sequence encoding the sgRNA can be designed as follows (sense strand marking):

5'GAAATTAATACGACTCACTATA GGN 18 GTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTT 3' (서열번호 14).5' GAAATTAATACGACTCACTATA GGN 18 GTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTT 3' (SEQ ID NO: 14).

초기 22 bp (이탤릭체로 표시됨)는 시험관내 전사에 사용된 T7 RNA 폴리머라제의 프로모터이다. 그 뒤에 GGN18 시퀀스 (밑줄이 쳐짐)가 나타나며, 대상 (스페이서) 시퀀스와 일치하는 20 bp를 나타낸다. 절단은 표적 DNA의 두 가닥 모두에서 이 서열의 3' 말단 내에서 3 개의 염기를 발생시킨다. 초기 GG 디뉴클레오티드는 절단을 달성하는 데 필요하지 않지만, T7 RNA 폴리머라제에 의한 시험관내 전사를 최적화하기 위해 포함된 것이다. 이들 처음 두 뉴클레오티드에서는 약간의 변이가 허용할 수 있어 전사 효율은 감소된다. The initial 22 bp (indicated in italics) is the promoter of T7 RNA polymerase used for in vitro transcription. This is followed by the GGN 18 sequence (underlined), representing 20 bp consistent with the target (spacer) sequence. Cleavage results in 3 bases within the 3' end of this sequence on both strands of the target DNA. The initial GG dinucleotide is not required to achieve cleavage, but is included to optimize in vitro transcription by T7 RNA polymerase. In these first two nucleotides, slight variations can be tolerated, reducing transcriptional efficiency.

sgRNA와 동일한 의미를 갖는 표적 DNA 가닥은 스페이서와 일치하는 20 bp의 3' 말단을 즉시 삼중 항 NGG로 운반해야 한다. NAG는 또한 S. 파이오게네스 Cas9에 의해 견딜 수 있지만 효율이 떨어진다. 따라서, 표적은 서열 GGN18NGG를 갖는다. 나머지 80 bp (굵은 체 유형)는 crRNA 및 tracrRNA의 키메라 융합을 코딩한다. 더 짧은 sgRNA 세그먼트는 시험관내 및 생체 내에서 효과가 있었지만, 덜 효율적인 것으로 보인다. 추가 테스트를 통해 효율성이 향상된 변형 버전을 확인할 수 있지만 이 세그먼트는 이미 잘 작동한다. The target DNA strand, which has the same semantics as the sgRNA, should immediately carry the 20 bp 3' end consistent with the spacer into the triplet NGG. NAG is also tolerated by S. pyogenes Cas9 but is less efficient. Thus, the target has the sequence GGN18NGG. The remaining 80 bp (bold type) encodes a chimeric fusion of crRNA and tracrRNA. Shorter sgRNA segments were effective in vitro and in vivo, but appear to be less efficient. Further testing will reveal a variant with improved efficiency, but this segment is already working well.

타겟 서열은 대상 유전체에 내인성이다. 즉, 타겟 서열은 야생형 유전체과 동일한 카피 수 및 유전체 위치로 존재한다. 또는 타겟 서열은 대상 유전체에 외인성이다. 또한, 본 발명에서는 이종으로도 언급된다. 이 경우, 이는 유전체에 존재하지만 다른 위치에 있는 유전자이거나 또는 완전히 외래의 유전자, 즉 타겟 서열을 포함하는 유전체에 존재하지 않는 유전자일 수 있다.The target sequence is endogenous to the target genome. That is, the target sequence exists with the same copy number and genomic location as the wild-type genome. or the target sequence is exogenous to the target genome. Also referred to herein as heterogeneous. In this case, it may be a gene present in the genome but at a different location, or it may be a completely foreign gene, that is, a gene that is not present in the genome containing the target sequence.

여러 가지 타겟 핵산 서열에 상보적인 복수의 gRNA가 식물 세포로 제공되며, 뉴클레아제, 예를 들어 Cas9 효소가 부위 특이적인 방식으로 여러 타겟 핵산 서열들을 절단한다. 복수의 gRNA들은 본 발명에 기술된 TRV 벡터 한종 또는 여러 종으로부터 코딩될 수 있다. 복수의 sgRNA의 사용은 멀티플렉싱 (multiplexing)을 가능하게 한다.A plurality of gRNAs complementary to various target nucleic acid sequences are provided to the plant cell, and a nuclease, such as a Cas9 enzyme, cleaves the various target nucleic acid sequences in a site-specific manner. A plurality of gRNAs may be encoded from one or several species of the TRV vectors described herein. The use of multiple sgRNAs enables multiplexing.

하나의 타겟 유전자 (예, 벡터 B2) 또는 복수의 타겟 유전자에 대한 복수의 sgRNA들이 발현 카세트에 존재한다. 이들 복수 (예, 2 이상, 3 이상, 4 이상, 5 이상, 6 이상, 예를 들어 2-5, 2-4, 2-3)의 sgRNA들은 하나의 프로모터 하에 위치된다. sgRNA들은 서로 스페이서에 의해 이격되거나 또는 이격되지 않을 수도 있다.A plurality of sgRNAs for one target gene (eg, vector B2) or a plurality of target genes are present in the expression cassette. A plurality of these (eg 2 or more, 3 or more, 4 or more, 5 or more, 6 or more, eg 2-5, 2-4, 2-3) sgRNAs are located under one promoter. The sgRNAs may or may not be spaced apart from each other by a spacer.

이러한 멀티플렉스 배치 (multiplex configuration), 즉 하나의 DdRp가 결합하는 프로모터 하의 멀티플렉스 배치는 CRISPR/Cas9 시스템을 이용하는 임의의 유전체 편집 방법에 적용될 수 있다. 이에, 하나의 프로모터 하에 2 이상의 sgRNA를 포함하는 핵산 발현 카세트를 제공한다.Such a multiplex configuration, that is, a multiplex configuration under a promoter to which one DdRp binds, can be applied to any genome editing method using the CRISPR/Cas9 system. Accordingly, a nucleic acid expression cassette comprising two or more sgRNAs under one promoter is provided.

이러한 핵산 발현 카세트는 원핵 또는 진핵 생물, 예컨대 포유류 (예, 사람), 식물, 곤충 및 효모에서의 임의 세포에 대한 것일 수 있다.Such nucleic acid expression cassettes can be for any cell in prokaryotic or eukaryotic organisms, such as mammals (eg, humans), plants, insects and yeast.

sgRNA를 코딩하는 핵산 서열은 양 쪽에 리보자임 서열들이 위치하여, 리보자임-sgRNA-리보자임 (RGR) 서열을 형성한다. RGR의 1차 전사체가 기가-촉매적으로 절단되고, sgRNA가 해리되는 것으로 제시된다. 또한, TRV DdRp가 결합하는 프로모터의 사용은, 심지어 측면에 리보자임 없이도 sgRNA의 전사를 효율적으로 수행하는 것으로 확인되었음에도 불구하고, RGR 배열이 sgRNA 전사에 사용될 수 있는 프로모터의 범위를 확장시키는 것으로 생각된다. RGR 전략은, 전체 바이러스 리플리콘이 완전히 전사된다면, 임의의 대상 발현 산물 (예, 리포터, 농업적으로 유용한 형질, 예를 들어, 스트레스 내성 등)이 접종된 조직에서 발현되고, 가이드 RNA 또한 동일 조직에서 형성됨을, 보장한다.The nucleic acid sequence encoding the sgRNA has ribozyme sequences located on both sides to form a ribozyme-sgRNA-ribozyme (RGR) sequence. It is shown that the primary transcript of RGR is gig-catalytically cleaved and the sgRNA is dissociated. In addition, the use of a promoter to which TRV DdRp binds is thought to expand the range of promoters that can be used for sgRNA transcription with the RGR arrangement, although it has been shown to efficiently perform transcription of sgRNA even without a flanking ribozyme. . The RGR strategy is that if the entire viral replicon is fully transcribed, any target expression product (eg, reporter, agriculturally useful trait, eg, stress tolerance, etc.) is expressed in the inoculated tissue, and the guide RNA is also in the same tissue. to ensure that it is formed in

가이드 RNA는 싱글 가이드 RNA (sgRNA)이다. 소정의 타겟 서열에 따라 적합한 sgRNA를 구축하는 방법들이 당해 기술 분야에 공지되어 있다. A guide RNA is a single guide RNA (sgRNA). Methods for constructing suitable sgRNAs according to a given target sequence are known in the art.

본 발명에서, 용어 "tRNA" 및 "transfer RNA"는 본 발명에서 상호 호환적으로 아미노산을 운반 및 수송하는 기능을 가진 소분자 RNA를 지칭하기 위해 사용된다. tRNA 분자는 일반적으로 클로버 형태로 접히는 뉴클레오티드 약 70-90개로 된 단쇄로 이루어져 있다. 진핵생물의 경우, 유전체의 tRNA 유전자는 tRNA 전구체로 전사된 다음 RNase P 및 RNase Z에 의해 5' 및 3'의 부가적인 서열이 절단되어 성숙한 tRNA로 가공된다. In the present invention, the terms "tRNA" and "transfer RNA" are used interchangeably in the present invention to refer to a small molecule RNA having a function of transporting and transporting amino acids. A tRNA molecule consists of a single chain of about 70-90 nucleotides that is usually folded into a clover shape. In the case of eukaryotes, the tRNA gene in the genome is transcribed into a tRNA precursor, and then additional sequences of 5' and 3' are cleaved by RNase P and RNase Z to be processed into mature tRNA.

본 발명에서, 용어 "리보자임"은 트랜스포스페이트 및 포스포다이에스테르 결합의 가수분해 반응을 촉매함으로써, RNA의 절단 및 가공에 관여하는 촉매 기능을 가진 RNA 분자를 지칭한다.In the present invention, the term "ribozyme" refers to an RNA molecule having a catalytic function involved in the cleavage and processing of RNA by catalyzing the hydrolysis reaction of transphosphate and phosphodiester bonds.

한국 공개특허 10-2019-0120287에서, Cas9 뉴클레아제변이체 eSpCas9 (1.0) (K810A/K1003A/R1060A), eSpCas9(1.1) (K848A/K1003A/R1060A), 및 Cas9 뉴클레아제변이체 SpCas9-HF1(N497A/R661A/Q695A/Q926A)은 유전체 편집시 오프-타겟 비율을 현저하게 낮출 수 있으며, 즉 특이성이 높은 것으로, 보고된 바 있다. In Korean Patent Publication No. 10-2019-0120287, Cas9 nuclease mutant eSpCas9 (1.0) (K810A / K1003A / R1060A), eSpCas9 (1.1) (K848A / K1003A / R1060A), and Cas9 nuclease mutant SpCas9-HF1 (N497A) /R661A/Q695A/Q926A) can significantly lower the off-target ratio during genome editing, that is, it has been reported to have high specificity.

그러나, 이들 3종의 Cas9 뉴클레아제변이체가, 높은 특이성을 가지면서도, 야생형 Cas9와 비교해 유전자 편집 효율이 훨씬 낮다. 가이드 RNA의 5' 말단에 tRNA를 융합함으로써, 높은 특이성을 유지하면서, 고-특이성 Cas9 뉴클레아제변이체의 편집 효율을 심지어 야생형 수준까지 높일 수 있다. However, these three Cas9 nuclease variants, while having high specificity, have much lower gene editing efficiency compared to wild-type Cas9. By fusing the tRNA to the 5' end of the guide RNA, the editing efficiency of the high-specificity Cas9 nuclease mutant can be increased even to the wild-type level while maintaining high specificity.

고 특이성 Cas9 뉴클레아제변이체의 낮은 편집 효율은 가이드 RNA의 전사가 정확하게 개시될 수 있는지의 여부와 관련이 있다. The low editing efficiency of the high-specificity Cas9 nuclease variant correlates with whether transcription of the guide RNA can be accurately initiated.

당해 기술 분야에서, 가이드 RNA를 생체내에서 생산하기 위해 통상적으로 사용되는 프로모터로는, 예를 들어, RNA 중합효소 III에 의해 전사가 구동되는 U6 또는 U3 snRNA 프로모터들이 있다. U6 프로모터는 G에서 전사를 개시하여야 하므로, 첫번째 뉴클레오티드가 A, C 또는 T인 타겟 서열의 경우, 전사되는 sgRNA의 5' 말단에 부가적인 G가 제공될 것이다. U3 프로모터는 A에서 전사를 개시하므로, 첫번째 뉴클레오티드가 G, C 또는 T인 타겟 서열의 경우, 부가적인 A가 전사되는 sgRNA의 5' 말단에 제공될 것이다. 고-특이성 Cas9 뉴클레아제변이체의 편집 효율이 sgRNA의 5' 말단에 부가적인 뉴클레오티드가 존재하는 경우에 감소된다. In the art, promoters commonly used to produce guide RNAs in vivo include, for example, U6 or U3 snRNA promoters whose transcription is driven by RNA polymerase III. The U6 promoter must initiate transcription at G, so for a target sequence where the first nucleotide is A, C or T, an additional G will be provided at the 5' end of the sgRNA to be transcribed. The U3 promoter initiates transcription at A, so for a target sequence where the first nucleotide is G, C or T, an additional A will be provided at the 5' end of the transcribed sgRNA. The editing efficiency of the high-specificity Cas9 nuclease variant is reduced when an additional nucleotide is present at the 5' end of the sgRNA.

본 발명에서 gRNA와 tRNA의 융합 전사함으로써, tRNA의 정확한 프로세싱 기전으로 인해 (tRNA 전구체의 5' 및 3'의 부가적인 서열을 정확하게 제거하여 성숙한 tRNA를 형성함), 5' 말단에 부가적인 뉴클레오티드가 없는 sgRNA를 심지어 SGP, U6 또는 U3 프로모터를 사용하여 쉽게 수득할 수 있으며, 타겟 서열의 첫번째 뉴클레오티드의 타입을 고려하지 않아도 된다.In the present invention, by fusion transcription of gRNA and tRNA, due to the precise processing mechanism of tRNA (additional sequences 5' and 3' of the tRNA precursor are accurately removed to form a mature tRNA), an additional nucleotide at the 5' end is An absent sgRNA can even be easily obtained using SGP, U6 or U3 promoters, without taking into account the type of the first nucleotide of the target sequence.

이로써, 고 특이성 Cas9 뉴클레아제변이체의 편집 효율을 개선할 수 있으며, 타겟 서열의 선택가능한 범위는 넓어질 수 있다. 또한, tRNA와 융합하여 sgRNA의 발현 수준을 높일 수 있으며, 이는 고-특이성 Cas9 뉴클레아제변이체의 편집 효율을 개선하는 데에도 기여할 수 있다.Thereby, the editing efficiency of the high specificity Cas9 nuclease mutant can be improved, and the selectable range of the target sequence can be broadened. In addition, it is possible to increase the expression level of sgRNA by fusion with tRNA, which may also contribute to improving the editing efficiency of high-specificity Cas9 nuclease variants.

tRNA와 변형시킬 세포는 동일 종으로부터 유래된다. tRNA는 다음과 같은 서열에 의해 코딩된다. 5'aacaaagcaccagtggtctagtggtagaatagtaccctgccacggtacagacccgggttcgattcccggctggtgca-3' (서열번호 15).The tRNA and the cell to be modified are from the same species. tRNA is encoded by the following sequence. 5'aacaaagcaccagtggtctagtggtagaatagtaccctgccacggtacagacccgggttcgattcccggctggtgca-3' (SEQ ID NO: 15).

tRNA-가이드 RNA 융합체의 설계는 당해 기술 분야의 당업자의 능력 내에서 이루어진다. The design of tRNA-guided RNA fusions is within the ability of one of ordinary skill in the art.

또한, 본 발명은 가이드 RNA 및 리보자임의 융합체를 고려한다. 본 발명에서 고-특이성 Cas9 뉴클레아제변이체의 편집 효율이 sgRNA의 정확한 전사 개시와 관련있다는 사실을 토대로, 특정 부위에서 RNA를 절단하는 리보자임의 능력을 이용함으로써, RNA와 리보자임의 융합체를 합리적으로 설계하여 5' 말단에 부가적인 뉴클레오티드 없이 sgRNA를 생산할 수 있으며, 그래서 고 특이성을 유지하면서도 편집 효율을 개선시킬 수 있다.The invention also contemplates fusions of a guide RNA and a ribozyme. In the present invention, based on the fact that the editing efficiency of the high-specificity Cas9 nuclease variant is related to the precise transcription initiation of sgRNA, by using the ability of the ribozyme to cleave RNA at a specific site, a fusion of RNA and ribozyme can be rationally used. sgRNA can be produced without additional nucleotides at the 5' end by designing as a

가이드 RNA의 3' 말단이 제2 리보자임의 5' 말단과 연결되고, 제2 리보자임이 융합체를 가이드 RNA의 3' 말단에서 절단하여, 3' 말단에 추가의 뉴클레오티드를 운반하지 않는 가이드 RNA가 형성된다.The 3' end of the guide RNA is joined with the 5' end of the second ribozyme, and the second ribozyme cleaves the fusion at the 3' end of the guide RNA, so that the guide RNA carrying no additional nucleotides at the 3' end is is formed

제1 리보자임 또는 제2 리보자임의 설계는 당해 기술 분야의 당업자의 능력 내에서 이루어진다. The design of the first ribozyme or the second ribozyme is within the ability of one of ordinary skill in the art.

제1 리보자임은 서열: 5'(N)6CTGATGAGTCCGTGAGGACGAAACGAGTAAGCTCGTC-3' (서열번호 16)에 의해 코딩되며, 여기서 N은 독립적으로 A, G, C 및 T로부터 선택되고, (N)6는 가이드 RNA의 5' 말단 위치에서 처음 뉴클레오티드 6개에 역순으로 상보적인 서열이다. The first ribozyme is encoded by the sequence: 5'(N)6CTGATGAGTCCGTGAGGACGAAACGAGTAAGCTCGTC-3' (SEQ ID NO: 16), wherein N is independently selected from A, G, C and T, and (N)6 is the It is a sequence complementary to the first 6 nucleotides at the 5' end position in reverse order.

제2 리보자임은 서열: 5'GGCCGGCATGGTCCCAGCCTCCTCGCTGGCGCCGGCTGGGCAACATGCTTCGGCATGGCGAATGGGAC-3' (서열번호 17)에 의해 코딩된다.The second ribozyme is encoded by the sequence: 5'GGCCGGCATGGTCCCAGCCTCCTCGCTGGCGCCGGCTGGGCAACATGCTTCGGCATGGCGAATGGGAC-3' (SEQ ID NO: 17).

본 발명에서 야생형 Cas9 뉴클레아제와 비교해 특이성이 더 높은 Cas9 뉴클레아제변이체는 다양한 종들의 Cas9으로부터, 예를 들어, 스트렙토코커스 피오게네스의 Cas9 (SpCas9, 서열번호 2의 뉴클레오티드 서열, 서열번호 으로 표시되는 아미노산 서열)로부터 유래될 수 있다.In the present invention, the Cas9 nuclease variant with higher specificity compared to the wild-type Cas9 nuclease can be obtained from Cas9 of various species, for example, from Cas9 of Streptococcus pyogenes (SpCas9, nucleotide sequence of SEQ ID NO: 2, SEQ ID NO: indicated amino acid sequence).

본 발명의 Cas9 뉴클레아제변이체는 핵 위치화 서열 (nuclear localization sequence, NLS)을 더 포함한다. 일반적으로, Cas9 뉴클레아제변이체의 경우, 하나 이승의 NLS는, Cas9 뉴클레아제변이체를 유전체 편집 기능을 위한 충분한 양으로 세포의 핵 내에 축적시킬 수 있을 만큼, 충분한 강도를 가져야 한다. 일반적으로, 핵 위치화 활성 강도는 NLS의 갯수 및 위치, Cas9 뉴클레아제변이체에 사용된 하나 이상의 구체적인 NLS 또는 이들의 조합에 의해 결정된다.The Cas9 nuclease variant of the present invention further comprises a nuclear localization sequence (NLS). In general, for Cas9 nuclease variants, one squared NLS should have sufficient strength to allow Cas9 nuclease variants to accumulate in the nucleus of the cell in sufficient quantities for genome editing functions. In general, the strength of nuclear localization activity is determined by the number and location of NLSs, one or more specific NLSs used in the Cas9 nuclease variant, or a combination thereof.

본 발명의 Cas9 뉴클레아제변이체에서 NLS는 N-말단 및/또는 C-말단에 위치할 수 있다. Cas9 뉴클레아제변이체는 NLS를 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 또는 그 이상으로 포함한다. Cas9 뉴클레아제변이체는 N-말단에 또는 근처에서 NLS를 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 또는 그 이상으로 포함한다. Cas9 뉴클레아제변이체는 C-말단에 또는 그 근처에서 NLS를 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 또는 그 이상으로 포함한다. In the Cas9 nuclease variant of the present invention, the NLS may be located at the N-terminus and/or at the C-terminus. Cas9 nuclease variants contain about 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 or more NLSs. Cas9 nuclease variants contain about 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 or more NLSs at or near the N-terminus. Cas9 nuclease variants contain about 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 or more NLSs at or near the C-terminus.

Cas9 뉴클레아제변이체는, N-말단에 하나 이상의 NLS 및 C-말단에 하나 이상의 NLS와 같이, 이들의 조합을 포함한다. NLS가 하나 보다 많이 존재하는 경우, 각각의 NLS는 다른 NLS와 독립적으로 선택될 수 있다. 바람직하게, Cas9 뉴클레아제변이체는 NLS를 2개 포함하며, 예를 들어, 2개의 NLS는 각각 N-말단과 C-말단에 위치한다.Cas9 nuclease variants include combinations thereof, such as one or more NLSs at the N-terminus and one or more NLSs at the C-terminus. If there is more than one NLS, each NLS can be selected independently of the other NLSs. Preferably, the Cas9 nuclease variant comprises two NLSs, eg, the two NLSs are located at the N-terminus and C-terminus respectively.

일반적으로, NLS는 단백질의 표면에 노출되는 양으로 하전된 라이신 또는 아르기닌으로 된 짧은 서열 하나 이상으로 구성되지만, 다른 타입의 NLS도 당해 기술 분야에 공지되어 있다. NLS에 대한 비-제한적인 예로는 KKRKV (서열번호 18), 5'AAGAAGAGAAAGGTC-3' (서열번호 19), PKKKRKV (서열번호 20), 5'CCCAAGAAGAAGAGGAAGGTG-3' (서열번호 21) 또는 CCAAAGAAGAAGAGGAAGGTT(서열번호 22),또는 SGGSPKKKRKV (서열번호 22), 5' TCGGGGGGGAGCCCAAAGAAGAAGCGGAAGGTG -3'(서열번호 23) 등이 있다.Generally, NLSs consist of one or more short sequences of positively charged lysine or arginine exposed on the surface of a protein, although other types of NLS are known in the art. Non-limiting examples for NLS include KKRKV (SEQ ID NO: 18), 5'AAGAAGAGAAAGGTC-3' (SEQ ID NO: 19), PKKKRKV (SEQ ID NO: 20), 5'CCCAAGAAGAAGAGGAAGGTG-3' (SEQ ID NO: 21) or CCAAAGAAGAAGAGGAAGGTT (SEQ ID NO: 21) No. 22), or SGGSPKKKRKV (SEQ ID NO: 22), 5' TCGGGGGGGAGCCCAAAGAAGAAGCGGAAGGTG -3' (SEQ ID NO: 23), and the like.

Cas9 뉴클레아제변이체의 N-말단은 PKKKRKV (서열번호 24)로 표시되는 아미노산 서열을 가진 NLS를 포함한다. Cas9 뉴클레아제변이체의 C-말단은 SGGSPKKKRKV (서열번호 25)로 표시되는 아미노산 서열을 가진 NLS를 포함한다.The N-terminus of the Cas9 nuclease variant contains an NLS having the amino acid sequence represented by PKKKRKV (SEQ ID NO: 24). The C-terminus of the Cas9 nuclease variant contains an NLS having an amino acid sequence represented by SGGSPKKKRKV (SEQ ID NO: 25).

아울러, 본 발명의 Cas9 뉴클레아제변이체는 또한 편집할 DNA의 위치에 따라 세포질 위치화 서열, 엽록체 위치화 서열, 미토콘드리아 위치화 서열 등과 같은 다른 위치화 서열을 포함할 수 있다.In addition, the Cas9 nuclease variants of the present invention may also contain other localization sequences such as cytoplasmic localization sequences, chloroplast localization sequences, mitochondrial localization sequences, etc. depending on the location of the DNA to be edited.

타겟 서열에서 효과적인 발현을 달성하기 위해, Cas9 뉴클레아제변이체를 코딩하는 뉴클레오티드 서열은 유전체-편집할 세포가 유래된 유기체에 대해 코돈-최적화된다.To achieve effective expression at the target sequence, the nucleotide sequence encoding the Cas9 nuclease variant is codon-optimized for the organism from which the cell to be genome-edited is derived.

코돈-최적화는 천연 서열의 코돈 하나 이상 (예, 코돈 약 1개 이상, 2개 이상, 3개 이상, 4개 이상, 5개 이상, 10개 이상, 15개 이상, 20개 이상, 25개 이상, 50개 이상)을, 대상 세포의 유전자에서 보다 빈번하게 또는 가장 빈번하게 사용되는 코돈으로 치환함으로써, 천연 아미노산 서열을 유지하면서도, 대상 대상 세포에서 발현을 강화하기 위해 핵산 서열을 변형하는 과정을 의미한다. 다양한 종들은 특정 아미노산의 일부 코돈들에 대해 특별한 편향성을 나타낸다. 코돈 편향성 (유기체들 간의 코돈 용법 차이)은 대개 메신저 RNA (mRNA)의 번역 효율과 관성이 있으며, 이는 특히 번역되는 코돈의 특성 및 특정 트랜스퍼 RNA (tRNA) 분자의 이용가능성에 의존하는 것으로 보인다. Codon-optimization is one or more codons of the native sequence (e.g., about 1 or more, 2 or more, 3 or more, 4 or more, 5 or more, 10 or more, 15 or more, 20 or more, 25 or more codons) . do. Different species exhibit particular biases for some codons of specific amino acids. Codon bias (differences in codon usage between organisms) is largely dependent on the translation efficiency and inertia of messenger RNA (mRNA), which appears to depend in particular on the nature of the codon being translated and the availability of specific transfer RNA (tRNA) molecules.

세포에서 선택된 tRNA의 선호성은 일반적으로 펩타이드 합성에서 가장 빈번하게 사용되는 코돈을 반영한다. 즉, 유전자는 코돈 최적화에 토대가 되는 소정의 유기체에서 유전자 발현을 최적화하기 위해 맞춤 정될 수 있다. 코돈 용법 표는, 예를 들어 www.kazusa.orjp/codon/에서 이용가능한 "코돈 용법 데이타베이스"에서 쉽게 이용가능하며, 이러한 표는 여러가지 방식으로 수정될 수 있다. The preference of the tRNA selected in the cell generally reflects the most frequently used codons in peptide synthesis. That is, genes can be tailored to optimize gene expression in a given organism that underlies codon optimization. Codon usage tables are readily available, for example, in the "Codon usage database" available at www.kazusa.orjp/codon/, and such tables can be modified in a number of ways.

Cas9 뉴클레아제변이체를 코딩하는 코돈-최적화된 뉴클레오티드 서열은 서열번호 7 (eSpCas9(1.0)), 서열번호 8 (eSpCas9(1.1)) 또는 서열번호 9 (SpCas9-HF1)로 표시된다.The codon-optimized nucleotide sequence encoding the Cas9 nuclease variant is represented by SEQ ID NO: 7 (eSpCas9(1.0)), SEQ ID NO: 8 (eSpCas9(1.1)) or SEQ ID NO: 9 (SpCas9-HF1).

Cas9 뉴클레아제변이체를 코딩하는 뉴클레오티드 서열 및/또는 가이드 RNA 융합체를 코딩하는 뉴클레오티드 서열은 프로모터와 같은 발현 조절 인자에 작동가능하게 연결된다.The nucleotide sequence encoding the Cas9 nuclease variant and/or the nucleotide sequence encoding the guide RNA fusion is operably linked to an expression control element such as a promoter.

Cas9 뉴클레아제은 기본적으로 가이드 RNA와 상보적인 표적 DNA를 찾아 인식하고, 결합하는 능력이 아주 우수하다. Cas9가 표적 DNA와 결합하게 되면, R-loop 형태를 만들어 지는데, 이 과정에서 DNA는 일시적으로 단일 가닥 상태로 머무르게 된다. 이에 착안하여, 각각 독립적으로 시토신 염기교정 유전자가위를 개발하였다. 염기교정 유전자 가위에는 DNA 이중나선절단이 일어나지 않도록 Cas9 단백질의 절단능력을 아예 없애거나(dCas9), 단일가닥만 절단할 수 있는 돌연변이(Cas9 nickase; nCas9)를 사용하였다. 그리고 여기에 단일가닥에 작동할 수 있는 사이티딘 탈아미노화 효소를 연결하여 타겟 염기인 시토신에 바로 탈아미노화를 유도할 수 있도록 하였다.Cas9 nuclease is basically excellent in the ability to find, recognize, and bind to a target DNA complementary to a guide RNA. When Cas9 binds to the target DNA, an R-loop form is formed. During this process, the DNA temporarily stays in a single-stranded state. Taking this into consideration, each independently developed cytosine base-correcting gene scissors. To prevent DNA double helix breakage from occurring, a mutation capable of cleaving only a single strand (Cas9 nickase; nCas9) or a mutant capable of cleaving only a single strand was used for base-correcting gene scissors. And by linking a cytidine deamination enzyme that can operate to a single strand here, deamination can be directly induced to the target base, cytosine.

시토신은 탈아미노화되면 유라실로 바뀌게 되는데, 유라실은 나중에 DNA 전사과정 등에서 티민으로 인식되어 전사가 된다. 결과적으로 시토신 염기교정 유전자 가위는 단일 염기인 시토신을 티민으로 치환할 수 있게 된다. 연구진들은 시토신 염기교정 효율을 극대화하기 위해서 2가지의 추가적인 작업을 진행하였다.When cytosine is deamination, it is changed to uracil, which is later recognized as thymine in the DNA transcription process and is transcribed. As a result, the cytosine base editing gene scissors can substitute thymine for cytosine, a single base. The researchers performed two additional tasks to maximize the efficiency of cytosine base correction.

중간에 생성된 유라실은 맞은편 DNA 염기와 일시적으로 미스매치를 형성하기 때문에 세포 내 염기절제수선(Base excision repair; BER) 기작이 작동하게 된다.Since uracil generated in the middle temporarily mismatches with the opposite DNA base, the intracellular base excision repair (BER) mechanism works.

이때 돌연변이 복구효소(uracil-DNA glycosylase; UNG)가 DNA 상에 있는 유라실을 제거하게 되는데, 이를 억제할 수 있도록 억제제인 UGI(uracil-DNA glycosylase inhibitor)를 추가로 연결하여 유라실 제거를 막아 티민으로의 치환을 극대화했다.At this time, a mutant repair enzyme (uracil-DNA glycosylase; UNG) removes uracil from DNA. to maximize substitution.

또한, 시토신 탈아미노화가 발생한 단일가닥의 맞은편 DNA 가닥에 틈(nick)을 유도해, 유라실이 제거되는 것을 최소화하도록 시토신 염기교정 유전자가위를 제작하였다.In addition, cytosine base-correcting gene scissors were produced to minimize removal of uracil by inducing a nick in the DNA strand opposite to the single strand where cytosine deamination occurred.

한편, 아데닌 염기교정 유전자가위는 리우 그룹에 의해 시토신 염기교정 유전자 가위와 비슷한 형태로 개발되었다. 즉, 이중나선절단능력을 잃은 카스9에 사이 티딘 탈아미노화 효소를 연결하는 대신, 아데노신 탈아미노화 효소를 부착하여 아데닌을 구아닌으로 치환할 수 있도록 구성하였다.On the other hand, the adenine base editing gene scissors was developed in a form similar to the cytosine base editing gene scissors by the Liu group. That is, instead of linking cytidine deamination enzyme to Cas9, which has lost the double helix cleavage ability, an adenosine deamination enzyme was attached to replace adenine with guanine.

당시, DNA에 작용하는 아데노신 탈아미노화 효소는 자연계에서 발견되지 않았기 때문에, 연구진들은 RNA에 작용하는 아데노신 탈아미노화 효소를 박테리아를 이용한 선택진화 방법으로 변형시켜 단일가닥 DNA에 작동하도록 구현하였다. 결과적으로, 아데노신의 경우 탈아미노화되면 이노신이 되는데, 이는 나중에 DNA 전사 과정 등을 통해 구아노신으로 치환된다.At that time, since an adenosine deamination enzyme acting on DNA was not found in nature, the researchers modified the adenosine deamination enzyme acting on RNA using a selective evolution method using bacteria and implemented it to work on single-stranded DNA. As a result, in the case of adenosine, deamination becomes inosine, which is later substituted with guanosine through DNA transcription or the like.

염기교정 유전자가위는 DNA 이중나선절단을 일으키지 않기 때문에 그로 인해 발생하는 문제들(유전체 구조 변이나 대량결실, p53으로 인한 DNA 손상 반응 등)을 기본적으로 피해갈 수 있다. 그러면서 동형방식수선 기작을 통한 유전자교정 방법과 달리, 동형유전자가 주형으로 필요하지도 않고, 효율도 보통 30~50% 정도로 높다고 보고되고 있다. 또한 거의 분열되지 않는 세포에도 적용 가능하다는 장점이 있어, 현재까지 인간 질병치료 뿐 아니라, 동물, 식물 등 많은 연구 분야와 다양한 생물 종에 사용되고 있다.Since base-correcting gene scissors do not cause DNA double helix breaks, the problems caused by them (genetic structural change, mass deletion, DNA damage reaction caused by p53, etc.) can be basically avoided. In the meantime, it is reported that, unlike the gene editing method through the homozygous repair mechanism, the homozygous gene is not required as a template, and the efficiency is usually high, about 30-50%. In addition, it has the advantage that it can be applied to cells that hardly divide, so it has been used not only for the treatment of human diseases, but also for many research fields such as animals and plants and various biological species.

그러나 염기교정 유전자가위 또한 분명한 한계점들을 가지고 있다. 기본적으로 탈아미노화 효소를 기반으로 작동하기 때문에, 염기를 추가하거나 제거하는 기능이 없고 치환만 가능하다. 또한 염기치환 중에서도 시토신을 아데닌으로 바꾸는 전좌(transversion, 고리 개수가 다른 염기로 치환되는 것)는 불가능하다. 그리고, 표적염기 외에 타겟 범위 안에 존재하는 주변의 사이토신이나 아데닌을 구분 없이 치환하는 문제(bystander mutation)도 잘 알려져 있다. 또한, 아데닌 염기교정 유전자가위의 경우, 타겟 목적으로 하는 아데닌 외에 TC모티프에 한해서 시토신도 치환시키는 문제가 있다. 이는 아데노신 탈아미노화 효소를 인공적으로 개량시키는 과정에서 습득된 문제로 추정된다.However, nucleotide-correction gene editing also has clear limitations. Because it basically works based on deamination enzymes, there is no function to add or remove bases, only substitutions are possible. Also, among the base substitutions, transversion (substitution with a base having a different number of rings) for changing cytosine to adenine is impossible. In addition, the problem of substituting cytosine or adenine in the vicinity in the target range other than the target base without distinction (bystander mutation) is also well known. In addition, in the case of adenine base-correcting gene scissors, there is a problem of substituting cytosine only for the TC motif in addition to the target adenine. This is presumed to be a problem acquired in the process of artificially improving the adenosine deamination enzyme.

또한, 탈아미노화 효소는 본래 세포 내의 DNA, RNA에서 작동하기 때문에, 염기 교정 유전자가위와 무관하게, 즉 가이드 RNA가 없는 경우에도, 무작위적인 변이를 유도할 가능성이 있다. 실제시토신 염기교정 유전자가위에 의해 유전체 전체에서 무작위적인 시토신 치환이 발생한다는 사실이 밝혀졌다. 또한 RNA 전사체에 대해서는 시토신 염기교정 유전자가위와 아데닌 염기교정 유전자가위가 각각 무작위적으로 시토신 또는 아데닌 염기를 치환시킨다는 것이 보고되었다.In addition, since deamination enzymes naturally operate on DNA and RNA in cells, there is a possibility of inducing random mutations regardless of base-correcting gene editing, that is, even in the absence of guide RNA. It has been found that random cytosine substitutions occur throughout the genome by actual cytosine base editing gene editing. Also, it has been reported that cytosine or adenine nucleotides are randomly substituted for cytosine or adenine nucleotides in RNA transcripts, respectively.

본 발명의 시스템에 의해 유전체 편집될 수 있는 세포가 유래되는 유기체로는, 인간, 마우스, 랫, 원숭이, 개, 돼지, 양, 소 및 고양이와 같은 포유류; 닭, 오리 및 거위와 같은 가금류; 외떡잎 식물 및 쌍떡잎 식물과 같은 식물, 예를 들어, 벼, 옥수수, 밀, 수수, 보리, 대두, 땅콩 및 아라비돕시스 탈리아나 등이 있으나, 이들로 제한되는 것은 아니다.Organisms from which cells that can be genome edited by the system of the present invention are derived include mammals such as humans, mice, rats, monkeys, dogs, pigs, sheep, cattle and cats; poultry such as chickens, ducks and geese; Plants such as monocotyledonous and dicotyledonous plants include, but are not limited to, rice, corn, wheat, sorghum, barley, soybean, peanut and Arabidopsis thaliana.

2. DNA-가이드된 엔도뉴클레아제2. DNA-guided endonuclease

본 발명에서 유전체 편집 도구가 DNA-guided 엔도뉴클레아제인 경우, 표적화 엔도뉴클레아제는 알고너트(Argonaute)이다. 알고너트(Argonaute) 폴리펩티드 패밀리는 RNA-유도 침묵 복합체 (RNA-induced silencing complex; RISC)의 필수 성분으로서, RNA 침묵 과정에서 중심적인 역할을 한다. RISC는 RNAi (RNA 간섭)로 알려진 유전자 침묵 현상을 담당한다. 알고너트 폴리펩티드는 마이크로 RNA (miRNA), 작은 간섭 RNA (siRNA) 및 피위-상호 작용 RNA (piRNA)를 포함하여 상이한 부류의 작은 비코딩 RNA에 결합한다. 작은 RNA는 서열 상보성 (염기 쌍 형성)을 통해 알고너트 폴리펩티드를 그들의 특정 표적으로 안내하여 mRNA 절단 또는 번역 억제를 초래한다.In the present invention, when the genome editing tool is a DNA-guided endonuclease, the targeting endonuclease is Argonaute. The Argonaute polypeptide family is an essential component of the RNA-induced silencing complex (RISC) and plays a central role in the RNA silencing process. RISC is responsible for a phenomenon of gene silencing known as RNAi (RNA interference). Algonut polypeptides bind to different classes of small non-coding RNAs, including micro RNAs (miRNAs), small interfering RNAs (siRNAs), and piwi-interacting RNAs (piRNAs). Small RNAs guide algonut polypeptides through sequence complementarity (base pairing) to their specific target, resulting in mRNA cleavage or translational inhibition.

Argonaute 폴리펩티드는 모든 생명체에 잘 보존되어 있다. Natronobacterium gregoryi Argonaute (NgAgo)는 Pasteurella multocida 및 대장균에서 유전자 삽입 또는 삭제를 80-100 %의 효율로 향상시킨다. 또한, 효과는 상동성 암(homologous arms) 의존적이지만 DNA-및 잠재적 효소 활성(guide DNA- and potential enzyme activity)-비 의존적 방식이다. 이러한 효과는 Thermus thermophilus Argonaute (TtAgo), Aquifex aeolicus Argonaute (AaAgo) 및 Pyrococcus furiosus Argonaute (PfAgo)를 포함하는 다른 pAgos 단편에서도 관찰되었다. Argonaute polypeptides are well conserved in all living things. Natronobacterium gregoryi Argonaute (NgAgo) enhances gene insertion or deletion in Pasteurella multocida and E. coli with an efficiency of 80-100%. In addition, the effect is homologous arms dependent but in a DNA- and potential enzyme activity-independent manner. This effect was also observed with other pAgos fragments including Thermus thermophilus Argonaute (TtAgo), Aquifex aeolicus Argonaute (AaAgo) and Pyrococcus furiosus Argonaute (PfAgo).

NgAgo 시스템의 기본 메커니즘은 recA-매개 DNA 가닥 교환(recA-mediated DNA strand exchange) 을 향상시키기 위해 재조합 효소 A (recA)와 상호 작용하는 PIWI- 유사 도메인을 통한 양성 선택 과정이다. The underlying mechanism of the NgAgo system is a positive selection process through a PIWI-like domain that interacts with recombinase A (recA) to enhance recA-mediated DNA strand exchange.

NgAgo는 단일 가닥 DNA (ssDNA)-guided Argonaute endonuclease로 Natronobacterium gregoryi Argonaute의 약자이다. NgAgo는 ~ 24 개의 뉴클레오티드 (gDNA)의 5 '인산화 ssDNA에 결합하여 표적 부위로 안내하고 gDNA 부위에서 DNA 이중 가닥 수선을 한다. CRISPR / Cas 시스템과 마찬가지로 NgAgo는 유전체 편집에 적합한 것으로 보고되었지만, 이는 전사되지 않았다. Cas9와 달리, NgAgo-gDNA 시스템은 protospacer adjacent motif(PAM)를 필요로 하지 않다.NgAgo is an abbreviation for Natronobacterium gregoryi Argonaute as a single-stranded DNA (ssDNA)-guided Argonaute endonuclease. NgAgo binds to the 5′ phosphorylated ssDNA of ~24 nucleotides (gDNA) and guides it to the target site and performs DNA double-strand repair at the gDNA site. Like the CRISPR/Cas system, NgAgo was reported to be suitable for genome editing, but it was not transcribed. Unlike Cas9, the NgAgo-gDNA system does not require a protospacer adjacent motif (PAM).

NgAgo는 시스템의 정확도와 효율성으로 인해 off-target 효과를 최소화하여 유전체 편집에 유용한 것으로 제안되었다. 절단 효율이 가이드와 표적 분자 사이의 단일 뉴클레오티드 불일치에 의해 손상되기 때문에 gDNA의 특이성은 매우 높다. 가이드 분자로 5' 인산화 ssDNA를 사용하면 NgAgo를 오도하는 세포 올리고 뉴클레오티드의 가능성이 감소한다. 가이드 분자는 단백질 발현 동안 NgAgo에만 부착될 수 있다. 일단 가이드가 로드되면 NgAgo는 gDNA를 위해 자유 부동 ssDNA를 교체할 수 없다. sgRNA를 사용하는 시스템에 비해 ssDNA의 농도를 설계, 합성 및 조정하는 것이 더 쉽다. ssDNA의 요구량은 sgRNA 발현 플라스미드의 것보다 적다.NgAgo has been proposed to be useful for genome editing by minimizing off-target effects due to the accuracy and efficiency of the system. The specificity of gDNA is very high because cleavage efficiency is compromised by single nucleotide mismatches between guide and target molecules. The use of 5' phosphorylated ssDNA as guide molecules reduces the likelihood of cellular oligonucleotides misleading NgAgo. Guide molecules can only be attached to NgAgo during protein expression. Once the guide is loaded, NgAgo cannot replace free floating ssDNA for gDNA. It is easier to design, synthesize and adjust the concentration of ssDNA compared to systems using sgRNA. The required amount of ssDNA is less than that of the sgRNA expression plasmid.

알고너트(Argonaute) 폴리펩티드는 표적물 특이적 방식으로 세포 또는 대상체 내에서(예컨대, 대상체의 유전체 내에서) 핵산을 편집할 수 있는 DNA-가이드된 엔도뉴클레아제이다. 알고너트 폴리펩티드 또는 이의 기능성 단편은 표적물 특이적 방식으로 세포(예: 대상체의 세포) 내에서 표적 핵산 서열(예: RNA, DNA, 유전자, 프로모터 등)을 편집하는 능력을 보유한다. 대상체의 유전체 내의 표적 서열을 편집하는 능력은 세포(예: 인간 세포)의 표적 서열 내의 하나 이상의 특정 뉴클레오티드를 삽입, 제거 및/또는 치환하는 능력을 지칭한다. Argonaute polypeptides are DNA-guided endonucleases capable of editing nucleic acids in a cell or subject (eg, within the subject's genome) in a target-specific manner. An algonut polypeptide or functional fragment thereof retains the ability to edit a target nucleic acid sequence (eg, RNA, DNA, gene, promoter, etc.) within a cell (eg, a cell of a subject) in a target-specific manner. The ability to edit a target sequence in a subject's genome refers to the ability to insert, remove, and/or replace one or more specific nucleotides within a target sequence of a cell (eg, a human cell).

알고너트 폴리펩티드 또는 이의 기능성 단편은 뉴클레오티드 서열의 일부에 의해 코딩되는 폴리펩티드를 포함하며, 여기서 코딩되는 폴리펩티드는 세포에서 발현되는 경우 세포 내에서 표적 핵산 서열을 편집하는 능력을 보유한다. Algonut polypeptides or functional fragments thereof include polypeptides encoded by a portion of a nucleotide sequence, wherein the encoded polypeptide retains the ability to edit a target nucleic acid sequence in a cell when expressed in the cell.

본 발명에서 기술되는 알고너트 핵산 또는 합성 핵산은 알고너트의 핵산 서열에 대해 80% 내지 100% 동일성을 갖는 100 내지 3000개 뉴클레오티드 길이의 핵산 서열을 포함한다. 본 발명에서 기술되는 핵산 또는 합성 핵산은 적어도 100, 적어도 500, 적어도 750, 적어도 1000, 적어도 1500, 적어도 1750 또는 적어도 2000개 뉴클레오티드 길이의 제1 핵산 서열을 포함하며, 여기서 제1 핵산은 서열번호 1의 핵산 서열에 대해 적어도 80%, 적어도 81%, 적어도 82%, 적어도 85%, 적어도 90% 또는 적어도 95% 동일성을 갖는다.The algonut nucleic acid or synthetic nucleic acid described herein comprises a nucleic acid sequence of 100 to 3000 nucleotides in length with 80% to 100% identity to the nucleic acid sequence of the algonut. A nucleic acid or synthetic nucleic acid described herein comprises a first nucleic acid sequence of at least 100, at least 500, at least 750, at least 1000, at least 1500, at least 1750 or at least 2000 nucleotides in length, wherein the first nucleic acid comprises SEQ ID NO: 1 at least 80%, at least 81%, at least 82%, at least 85%, at least 90% or at least 95% identity to the nucleic acid sequence of

알고너트 핵산은 포유동물 세포에서 폴리펩티드를 발현하도록 구성된다. 폴리펩티드(예: 알고너트 폴리펩티드)을 발현하도록 구성되는 핵산은 세포에서 폴리펩티드의 발현을 지시하는 하나 이상의 핵산 조절 서열을 포함한다. Algonut nucleic acids are configured to express polypeptides in mammalian cells. A nucleic acid configured to express a polypeptide (eg, an algonut polypeptide) includes one or more nucleic acid regulatory sequences that direct expression of the polypeptide in a cell.

따라서, 목적하는 폴리펩티드를 발현하도록 구성되는 핵산은 목적하는 단백질을 코딩하는 코딩 영역, 코딩 영역에 작동 가능하게 연결된 하나 이상의 적합한 프로모터, 해독 개시 서열, 개시 코돈, 정지 코돈, 폴리A 신호 서열, 리더 서열, NLS 등 중 하나 이상을 포함할 수 있다. 핵산은 핵 위치화 서열 (nuclear localization sequence, NLS)을 코딩하는 서열을 포함한다. 임의의 적합한 NLS 서열이 사용될 수 있다. 핵산은 알고너트 폴리펩티드 또는 이의 기능성 단편을 발현하도록 구성된다.Thus, a nucleic acid configured to express a polypeptide of interest comprises a coding region encoding a protein of interest, one or more suitable promoters operably linked to the coding region, a translation initiation sequence, an initiation codon, a stop codon, a polyA signal sequence, a leader sequence , NLS, and the like. Nucleic acids include sequences encoding nuclear localization sequences (NLSs). Any suitable NLS sequence may be used. The nucleic acid is configured to express an algonut polypeptide or a functional fragment thereof.

또한, 핵산은 가이드 올리고뉴클레오티드(올리고뉴클레오티드 가이드)이다. 가이드 올리고뉴클레오티드는 RNA를 포함하거나 DNA를 포함한다. 가이드 올리고뉴클레오티드는 때때로 18개 내지 30개 nt 길이인 핵산이다. 가이드 올리고뉴클레오티드는 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30개 뉴클레오티드 길이이다. Also, the nucleic acid is a guide oligonucleotide (oligonucleotide guide). The guide oligonucleotides comprise RNA or comprise DNA. Guide oligonucleotides are nucleic acids that are sometimes between 18 and 30 nt in length. Guide oligonucleotides are 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 or 30 nucleotides in length.

가이드 올리고뉴클레오티드는 종종 유기체 또는 세포의 유전체 내의 특정 위치에 위치한 표적 핵산 서열(표적 부위) 또는 이의 일부에 대해 80% 내지 100%. 85% 내지 100%, 90% 내지 100%, 95% 내지 100% 또는 100% 동일한 핵산 서열을 포함한다. Guide oligonucleotides often contain 80% to 100% of a target nucleic acid sequence (target site) or portion thereof located at a specific location within the genome of an organism or cell. 85% to 100%, 90% to 100%, 95% to 100% or 100% identical nucleic acid sequence.

가이드 올리고뉴클레오티드는 18 내지 30, 18 내지 28, 18 내지 25, 18 내지 26, 19 내지 26, 19 내지 25, 20 내지 30, 20 내지 25, 20 내지 24 또는 21 내지 24개 뉴클레오티드 길이인 표적 서열, 즉 유전자, 인트론 또는 엑손의 일부에 대해 100% 동일하다.The guide oligonucleotide comprises a target sequence that is 18 to 30, 18 to 28, 18 to 25, 18 to 26, 19 to 26, 19 to 25, 20 to 30, 20 to 25, 20 to 24 or 21 to 24 nucleotides in length; i.e. 100% identical to a part of a gene, intron or exon.

표적 서열은 본 발명에서 기술되는 조성물 또는 방법을 이용하여 변형시키고자 하는 유기체 또는 세포의 유전체 내의 특정 위치(특정 핵산 서열)을 지칭한다. 표적 서열은 세포 또는 유기체의 유전체 내에 위치한 핵산이다. 표적 서열은 RNA를 포함한다. 표적 서열은 DNA를 포함한다.A target sequence refers to a specific location (a specific nucleic acid sequence) in the genome of an organism or cell to be modified using the composition or method described herein. A target sequence is a nucleic acid located within the genome of a cell or organism. The target sequence includes RNA. The target sequence includes DNA.

표적 서열은 10 내지 100, 18 내지 50, 18 내지 30, 18 내지 28, 18 내지 25, 18 내지 26, 19 내지 26, 19 내지 25, 20 내지 30, 20 내지 25, 20 내지 24 또는 21 내지 24개 뉴클레오티드 길이이고, 유전자, 엑손, 인트론 또는 유전체의 임의의 적합한 부분 내에 위치할 수 있다. The target sequence may be 10 to 100, 18 to 50, 18 to 30, 18 to 28, 18 to 25, 18 to 26, 19 to 26, 19 to 25, 20 to 30, 20 to 25, 20 to 24 or 21 to 24. It is several nucleotides in length and can be located within a gene, exon, intron, or any suitable portion of the genome.

표적 서열 또는 표적 서열의 임의의 부분 내의 임의의 뉴클레오티드는 본 발명에서 기술되는 방법에 의해 변형될 수 있다. 표적 서열 내의 임의의 수의 뉴클레오티드가 결실되거나, 돌연변이되거나, 예컨대 목적하는 서열(예: 공여 서열의 삽입 서열)에 의해 치환될 수 있다. 하나 이상의 뉴클레오티드 또는 목적하는 서열은 본 발명에서 기술되는 방법에 의해 표적 서열로 삽입된다. Any nucleotide within the target sequence or any portion of the target sequence may be modified by the methods described herein. Any number of nucleotides in the target sequence may be deleted, mutated, or substituted, such as by a sequence of interest (eg, an insertion sequence of a donor sequence). One or more nucleotides or sequences of interest are inserted into the target sequence by the methods described herein.

표적 서열은 가이드 올리고뉴클레오티드에 대해 상보적이거나 동일한 핵산 서열 또는 이의 일부를 제공한다. The target sequence provides a nucleic acid sequence that is complementary to or identical to a guide oligonucleotide, or a portion thereof.

표적 서열은 공여 서열의 5' 및/또는 3' 플랭킹 영역에 대해 상보적이거나 동일한 핵산 서열을 제공한다. 예컨대, 18 내지 28개 뉴클레오티드 길이의 가이드 올리고뉴클레오티드가 표적 서열에 대해 85% 내지 100%, 90% 내지 100% 또는 95% 내지 100% 동일할 수 있다. 또는, 가이드 올리고뉴클레오티드는 유전체 내의 표적 서열에 대비하여 1 내지 2, 1 내지 3, 또는 1, 2, 3 또는 4개의 미스매치를 포함한다. 또는 가이드 올리고뉴클레오티드는 표적 서열에 대해 100% 동일하다. The target sequence provides a nucleic acid sequence that is complementary or identical to the 5' and/or 3' flanking regions of the donor sequence. For example, a guide oligonucleotide of 18 to 28 nucleotides in length may be 85% to 100%, 90% to 100%, or 95% to 100% identical to the target sequence. Alternatively, the guide oligonucleotide comprises 1 to 2, 1 to 3, or 1, 2, 3 or 4 mismatches with respect to the target sequence in the genome. or the guide oligonucleotide is 100% identical to the target sequence.

가이드 올리고뉴클레오티드는 유전체 내의 표적 부위(즉 표적 서열)에 대해 정확히 매치되는 서열을 포함하거나 이로 이루어진다. 가이드 올리고뉴클레오티드는 인산화된다. 가이드 올리고뉴클레오티드는 5' 인산화된다(즉, 5'히드록실 말단 상에서 인산화된다).A guide oligonucleotide comprises or consists of an exact match for a target site (ie, a target sequence) in the genome. Guide oligonucleotides are phosphorylated. Guide oligonucleotides are 5' phosphorylated (ie phosphorylated on the 5' hydroxyl terminus).

기능성 알고너트 폴리펩티드는 가이드 올리고뉴클레오티드의 서열에 의해 규정되는 특정 표적 서열에서 유기체 또는 세포의 유전체 DNA를 절단하기 위해 가이드 올리고뉴클레오티드를 사용한다. 알고너트 폴리펩티드는 가이드 올리고뉴클레오티드에 의해 규정되는 서열 내의 어느 곳에서나 표적 핵산 서열을 절단한다. A functional algonut polypeptide uses a guide oligonucleotide to cleave the genomic DNA of an organism or cell at a specific target sequence defined by the sequence of the guide oligonucleotide. Algonut polypeptides cleave the target nucleic acid sequence anywhere within the sequence defined by the guide oligonucleotide.

알고너트 폴리펩티드는 가이드 올리고뉴클레오티드의 초기 10개 뉴클레오티드(5'뉴클레오티드)의 임의의 것에 의해 규정되는 위치에서 표적 부위를 절단한다. Algonut polypeptides cleave the target site at a position defined by any of the first 10 nucleotides (5' nucleotides) of the guide oligonucleotide.

가이드 올리고뉴클레오티드 및 공여 핵산이 둘 다 존재하는 경우, 알고너트 폴리펩티드는 가이드 올리고뉴클레오티드에 의해 규정되는 표적 서열 부위에서 세포의 유전체으로 공여 핵산을 삽입 및 슬라이싱 하도록 진행될 것이다. When both a guide oligonucleotide and a donor nucleic acid are present, the algonut polypeptide will proceed to insert and slice the donor nucleic acid into the genome of the cell at the site of the target sequence defined by the guide oligonucleotide.

공여 서열이 존재하지 않는 경우, 가이드 올리고뉴클레오티드와 함께 로딩된 알고너트 폴리펩티드는 종종 가이드 올리고뉴클레오티드 서열에 의해 규정되는 표적 부위를 절단할 것이다. 이러한 공정은 종종 표적 부위에 도입된 하나 이상의 단일 뉴클레오티드 돌연변이 도입을 야기한다.In the absence of a donor sequence, an algonut polypeptide loaded with a guide oligonucleotide will often cleave the target site defined by the guide oligonucleotide sequence. Such processes often result in the introduction of one or more single nucleotide mutations introduced at the target site.

공여 서열(공여 단편)은 5' 플랭킹 서열, 목적하는 서열 및 3' 플랭킹 서열의 3개의 부분을 포함하는 핵산이다. 공여 서열은 RNA를 포함한다. 공여 서열은 DNA를 포함한다. 공여 서열은 단일 가닥이다. 일부 실시양태에서, 공여 서열은 이중 가닥이다.A donor sequence (donor fragment) is a nucleic acid comprising three portions: a 5' flanking sequence, a desired sequence and a 3' flanking sequence. Donor sequences include RNA. Donor sequences include DNA. The donor sequence is single-stranded. In some embodiments, the donor sequence is double stranded.

5'플랭킹 서열 및 3'플랭킹 서열은 동일한 서열이거나 상이한 서열일 수 있다. 5'플랭킹 서열 및 3'플랭킹 서열은 10% 초과의 동일성을 공유하지 않는 상이한 서열이다. 5'플랭킹 서열 및 3'플랭킹 서열은 목적하는 서열의 반대측에 위치한다. 공여 서열의 5'플랭킹 서열 및/또는 3'플랭킹 서열은 약 10 내지 100, 10 내지 50, 10 내지 75, 10 내지 25 또는 20 내지 25개 뉴클레오티드(nt) 또는 염기 쌍(bp) 길이이다.The 5' flanking sequence and the 3' flanking sequence may be the same sequence or different sequences. The 5' flanking sequence and the 3' flanking sequence are different sequences that do not share more than 10% identity. The 5' flanking sequence and the 3' flanking sequence are located on opposite sides of the desired sequence. The 5' flanking sequence and/or the 3' flanking sequence of the donor sequence is about 10-100, 10-50, 10-75, 10-25, or 20-25 nucleotides (nt) or base pairs (bp) in length .

목적하는 서열은 본 발명에서 기술되는 알고너트 폴리펩티드 및/또는 방법에 의해 표적 서열로 삽입시키고자 하는 핵산을 지칭한다. 용어 "목적하는 서열"은 용어 "목적하는 핵산" 및 "목적하는 핵산 서열"과 동의어로 사용된다. 명확성을 위해, "목적하는 서열"은 때때로 "삽입 서열"로 지칭될 수 있다. 목적하는 서열은 RNA를 포함한다. 목적하는 서열은 DNA를 포함한다. A desired sequence refers to an algonut polypeptide and/or a nucleic acid to be inserted into a target sequence by the method described in the present invention. The term “sequence of interest” is used synonymously with the terms “nucleic acid of interest” and “nucleic acid sequence of interest”. For clarity, a “sequence of interest” may sometimes be referred to as an “insertion sequence”. A sequence of interest includes RNA. A sequence of interest includes DNA.

목적하는 서열은 임의의 적합한 길이의 임의의 적합한 서열일 수 있다. 목적하는 서열은 1 내지 20,000, 1 내지 5,000, 1 내지 1000, 1 내지 500, 10 내지 5,000, 10 내지 1000 또는 10 내지 500개 뉴클레오티드 길이이다.The sequence of interest may be any suitable sequence of any suitable length. The sequence of interest is 1 to 20,000, 1 to 5,000, 1 to 1000, 1 to 500, 10 to 5,000, 10 to 1000 or 10 to 500 nucleotides in length.

공여 서열은 각각 독립적으로 표적 부위에 80% 내지 100% 동일한 5' 플랭킹 서열 및 3' 플랭킹 서열을 포함하며, 플랭킹 서열은 또한 가이드 올리고뉴클레오티드의 일부와 동일하거나 이에 상보적인 서열 영역을 포함한다. 공여 서열은 가이드 올리고뉴클레오티드에 대해 80% 내지 100% 동일하고/하거나 표적 부위에 대해 80% 내지 100% 동일한 서열을 포함한다. each donor sequence independently comprises a 5' flanking sequence and a 3' flanking sequence that are 80% to 100% identical to the target site, the flanking sequence also comprising a region of sequence identical to or complementary to a portion of the guide oligonucleotide do. The donor sequence comprises a sequence that is 80% to 100% identical to the guide oligonucleotide and/or 80% to 100% identical to the target site.

공여 서열은 가이드 올리고뉴클레오티드에 대해 동일하거나 가이드 올리고뉴클레오티드의 일부와 겹치는 플랭킹 서열을 포함할 수 있다. 공여 서열은 (i) 목적하는 서열, (ii) 가이드 올리고뉴클레오티드 또는 이의 일부에 대해 적어도 80% 내지 100% 동일하고/하거나 표적 부위에 대해 80% 내지 100% 동일한 5' 플랭킹 서열, 및 가이드 올리고뉴클레오티드 또는 이의 일부에 대해 적어도 80% 내지 100% 동일하고/하거나 표적 부위에 대해 80% 내지 100% 동일한 3' 플랭킹 서열을 포함한다. The donor sequence may comprise a flanking sequence that is identical to the guide oligonucleotide or overlaps a portion of the guide oligonucleotide. The donor sequence comprises (i) a sequence of interest, (ii) a 5' flanking sequence that is at least 80% to 100% identical to the guide oligonucleotide or portion thereof and/or 80% to 100% identical to the target site, and a guide oligo a 3' flanking sequence that is at least 80%-100% identical to the nucleotide or portion thereof and/or is 80%-100% identical to the target site.

가이드 올리고뉴클레오티드 및 기능성 알고너트 폴리펩티드는 유전체의 표적 부위로 목적하는 서열을 삽입하기에 충분하며, 여기서 공여 핵산(즉, 공여 서열, 공여 핵산 서열)은 가이드 올리고뉴클레오티드의 일부(예: 적어도 5 내지 10개 뉴클레오티드)와 동일한 서열에 의해 양측(5'측 및 3'측)에서 플랭킹된 목적하는 서열을 포함한다. The guide oligonucleotide and functional algonut polypeptide are sufficient to insert the desired sequence into a target site in the genome, wherein the donor nucleic acid (i.e., donor sequence, donor nucleic acid sequence) is a portion of the guide oligonucleotide (e.g., at least 5 to 10 canine nucleotides) and flanked on both sides (5' and 3') by the same sequence.

2개의 가이드 올리고뉴클레오티드가 유전체의 표적 부위로 목적하는 서열을 삽입하는 데 사용되며, 여기서 공여 핵산(공여 서열)은 일측에서는 제1 가이드 올리고뉴클레오티드의 서열 및 다른 측에서는 제2 가이드 올리고뉴클레오티드의 서열에 의해 플랭킹된 목적하는 서열을 포함한다.Two guide oligonucleotides are used to insert the desired sequence into a target site of the genome, wherein the donor nucleic acid (donor sequence) is a sequence of a first guide oligonucleotide on one side and a sequence of a second guide oligonucleotide on the other side. flanking sequences of interest.

따라서, 유기체 또는 세포의 유전체을 편집하는 방법이 본 발명에 제시된다. 유기체는 대상체이다. 대상체는 인간이다. 세포는 임의의 적합한 세포일 수 있으며, 이의 비-제한적 예는 원핵생물 세포, 식물 세포, 진핵생물 세포, 포유동물 세포 또는 인간 세포를 포함한다. 유전체을 편집하는 방법은 유전체으로부터 표적 서열의 제거, 유전체 내 표적 서열의 파괴 및/또는 유전체으로 목적하는 서열의 삽입을 포함한다. 목적하는 서열은 임의의 적합한 핵산 서열일 수 있으며, 이의 비-제한적 예는 이종 핵산(예컨대, 상이한 종으로부터의 것), 변형된 이종 핵산, 상동성 핵산(예컨대, 동일한 종으로부터의 것), 합성 핵산, 유전자 또는 이의 일부(예컨대, 인트론, 엑손, 조절 서열 등), 변형된 유전자, 마커, 독소, 단일 핵산, 2개 이상의 핵산 등 또는 이의 조합을 포함한다. 목적하는 핵산은 키메라 항원 수용체(CAR)을 코딩한다.Accordingly, provided herein is a method for editing the genome of an organism or cell. An organism is an object. The subject is a human. The cell can be any suitable cell, non-limiting examples of which include prokaryotic cells, plant cells, eukaryotic cells, mammalian cells or human cells. Methods of editing a genome include removal of a target sequence from the genome, disruption of the target sequence in the genome, and/or insertion of a desired sequence into the genome. The sequence of interest can be any suitable nucleic acid sequence, non-limiting examples of which include heterologous nucleic acids (eg, from different species), modified heterologous nucleic acids, homologous nucleic acids (eg, from the same species), synthetic nucleic acids, genes or portions thereof (eg, introns, exons, regulatory sequences, etc.), modified genes, markers, toxins, single nucleic acids, two or more nucleic acids, etc. or combinations thereof. The nucleic acid of interest encodes a chimeric antigen receptor (CAR).

목적하는 핵산(목적하는 서열) 또는 유전자는 임의의 적합한 포유동물 유전자, 이의 일부 또는 이의 변형된 형태일 수 있다.The desired nucleic acid (sequence of interest) or gene may be any suitable mammalian gene, a portion thereof, or a modified form thereof.

유기체 또는 세포의 유전체의 편집 방법은 하나 이상의 세포를 본 발명에서 기술되는 하나 이상의 핵산 또는 조성물과 접촉시키는 단계를 포함한다. 유기체 또는 세포의 유전체의 편집 방법은 세포, 유기체 또는 대상체의 유전체 내의 표적 서열을 변형시키는 방법이다. 유기체 또는 세포의 유전체의 편집 방법은 본 발명에서 기술되는 하나 이상의 핵산을 하나 이상의 세포 내로 도입하는 단계를 포함한다. 하나 이상의 핵산은 임의의 적합한 방법에 의해 하나 이상의 세포 내로 도입될 수 있다.A method of editing the genome of an organism or cell comprises contacting one or more cells with one or more nucleic acids or compositions described herein. A method of editing the genome of an organism or cell is a method of modifying a target sequence in the genome of a cell, organism or subject. A method of editing the genome of an organism or cell comprises introducing one or more nucleic acids described herein into one or more cells. The one or more nucleic acids may be introduced into one or more cells by any suitable method.

3. Prime editing3. Prime editing

본 발명에서 유전체 편집 도구가 Prime editing(프라임 편집)인 경우, Cas9 뉴클레아제는 표적 DNA에 결합하게 되면, 가이드 RNA와 표적 DNA 간에 DNA-RNA 혼성화(hybridization)되는 메카니즘을 가지고 있다. 이 부분에 착안하여 역전사 효소(reverse transcriptase)를 이용해 가이드 RNA를 주형으로 해서 새로운 단일가닥 DNA를 제작할 수 있다.When the genome editing tool in the present invention is Prime editing, Cas9 nuclease has a mechanism of DNA-RNA hybridization between the guide RNA and the target DNA when it binds to the target DNA. Focusing on this part, a new single-stranded DNA can be produced using the guide RNA as a template using reverse transcriptase.

표적 DNA는 이중나선 형태이기 때문에 한 가닥이 가이드 RNA와 결합하면, 다른 쪽 단일 가닥은 결합하지 않은 채 홀로 있게 된다. 만약, 어떤 주형 RNA가 추가로 홀로 남은 단일 가닥과 DNA-RNA 혼성화를 이루게 되면, 역전사 효소가 그 RNA를 주형으로 원하는 DNA 서열을 즉석에서 합성할 수 있다. 주형 RNA를 기존의 가이드 RNA의 3*?**?* 말단에 연결해서 프라임 에디팅 가이드 RNA (prime editing guide RNA; pegRNA)를 제조할 수 있다. Since the target DNA is in the form of a double helix, when one strand binds to the guide RNA, the other single strand remains unbound and alone. If a specific template RNA additionally undergoes DNA-RNA hybridization with the remaining single strand, the reverse transcriptase can use the RNA as a template to instantly synthesize a desired DNA sequence. Prime editing guide RNA (pegRNA) can be prepared by linking the template RNA to the 3*?**?* end of the existing guide RNA.

역전사효소를 단일 가닥만 절단할 수 있는 카스9 단백질(Cas9 nickase)에 연결하여 프라임 에디팅 유전자 교정기술을 완성했다.By linking the reverse transcriptase to Cas9 nickase, which can cut only single strands, the prime editing gene editing technology was completed.

Prime editing(프라임 편집)에는 세 가지 주요 구성 요소가 포함된다. Prime editing includes three main components:

(a) 편집될 표적 뉴클레오티드 서열을 식별하고, 표적화된 서열을 대체하는 새로운 유전자 정보를 암호화할 수 있는 프라임 편집 가이드 RNA (pegRNA) : pegRNA는 프라이머 결합 부위 (PBS) 및 역전사 효소 (RT) 주형 서열을 함유하는 연장된 단일 가이드 RNA (sgRNA)로 구성된다. 유전체 편집 동안, 프라이머 결합 부위는 닉 DNA 가닥의 3 '말단이 pegRNA에 혼성화될 수 있게 하는 반면, RT 주형은 편집 된 유전자 정보의 합성을 위한 주형으로서 기능한다. (a) a prime editing guide RNA (pegRNA) capable of identifying a target nucleotide sequence to be edited and encoding new genetic information replacing the targeted sequence: pegRNA contains a primer binding site (PBS) and a reverse transcriptase (RT) template sequence It consists of an extended single guide RNA (sgRNA) containing During genome editing, the primer binding site allows the 3' end of the nick DNA strand to hybridize to the pegRNA, whereas the RT template serves as a template for the synthesis of the edited genetic information.

(b) Moloney Murine Leukemia Virus (M-MLV) 역전사 효소에 융합된 Cas9 H840A nickase로 구성된 융합 단백질 : Cas9 H840A 닉카아제(nickase)는 Cas9 효소는 DNA 서열을 절단할 수 있는 2 개의 뉴클레아제도메인, 비-표적 가닥을 절단하는 RuvC 도메인 및 표적 가닥을 절단하는 HNH 도메인을 함유한다. 840번째 아미노산 히스티딘이 알라닌으로 대체되는 Cas9에서 H840A 치환의 도입은 HNH 도메인을 불활성화시킨다. RuvC 기능 도메인만으로, 촉매적으로 손상된 Cas9는 단일가닥 닉 (single strand nick)을 도입할 수 있다. M-MLV 역전사 효소는 단일 가닥 RNA 주형으로부터 DNA를 합성하는 효소이다.(b) a fusion protein consisting of Cas9 H840A nickase fused to Moloney Murine Leukemia Virus (M-MLV) reverse transcriptase: Cas9 H840A nickase is a Cas9 enzyme that can cleave a DNA sequence with two nuclease domains , contains a RuvC domain that cleaves the non-target strand and an HNH domain that cleaves the target strand. Introduction of the H840A substitution in Cas9 in which the histidine at amino acid position 840 is replaced with alanine inactivates the HNH domain. With only the RuvC functional domain, a catalytically damaged Cas9 can introduce a single strand nick. M-MLV reverse transcriptase is an enzyme that synthesizes DNA from a single-stranded RNA template.

(c) 융합 단백질의 Cas9 H840A 닉카아제부분을 비 편집된 DNA 가닥에 닉킹하도록 지시하는 단일 가이드 RNA (sgRNA). (c) A single guide RNA (sgRNA) directing the Cas9 H840A nickase portion of the fusion protein to nick to the unedited DNA strand.

프라임 에디팅 단백질과 pegRNA 복합체가 표적 DNA에 결합하고 나면, Cas9 nickase에 의해 맞은 편 단일 가닥을 먼저 절단한다. 절단된 DNA 가닥은 pegRNA 3*?**?*말단의 상보적인 부분과 결합할 수 있는데, 이 부분이 결합되면, 역전사 효소가 pegRNA를 주형(RT template 부분)으로 새로운 DNA 가닥을 만들어 낸다. 이후에 타겟 DNA는 다시 세포의 수선 기작에 의해 이중가닥 형태로 복구되는데, 이 과정에서 역전사된 염기서열을 기반으로 이중가닥이 만들어지면, 의도한 유전자 교정이 완성된다.After the prime editing protein and pegRNA complex bind to the target DNA, the opposite single strand is first cleaved by Cas9 nickase. The cleaved DNA strand can be combined with the complementary portion of the 3*?**?* end of the pegRNA, and when this portion is combined, the reverse transcriptase uses the pegRNA as a template (RT template portion) to create a new DNA strand. Afterwards, the target DNA is restored to a double-stranded form by the cell's repair mechanism.

처음 개발된 프라임 에디팅(PE1 버전)은 작동 여부는 확인이 되었지만, 효율이 매우 낮았다. 이를 극복하기 위해 열역학적 안정성, DNA-RNA 구조와의 결합성, RNA 분해 효소의 억제성 등을 고려해서 역전사 효소 부분을 인공적으로 개량하여 개선된 버전을 만들게 되었다 (PE2 버전). 하지만 이렇게 프라임 에디팅 자가를 개선하는 것만으로는 효율을 높이는데 한계가 있었다.The first developed prime editing (PE1 version) was confirmed to work, but the efficiency was very low. To overcome this, an improved version was created by artificially improving the reverse transcriptase part in consideration of thermodynamic stability, binding to DNA-RNA structure, and inhibition of RNA-degrading enzymes (PE2 version). However, there was a limit to increasing the efficiency just by improving the prime editing self like this.

왜냐하면, 프라임 에디팅 작동 후, DNA 수선 과정에서 pegRNA와 직접 붙는 DNA 가닥이 멀쩡하기 때문에, 이를 기반으로 복구될 가능성이 훨씬 높기 때문이다. 즉, 역전사 효소에 의해 새롭게 만들어진 DNA 가닥보다는 원래 있었던 DNA 가닥을 기반으로 복구될 가능성이 높아 결과적으로 원래 서열로 원상복구하게 된다. 만약 pegRNA가 직접 붙는 가닥에도 추가적으로 틈(nick)을 만들어 낸다면, 프라임 에디팅 작동 효율을 극대화시킬 수 있을 것이다. 에디팅 부위에서 조금 떨어진 위치에 또 다른 DNA 틈을 만들어 낼 수 있도록 sgRNA를 추가로 도입한 프라임 에디팅 버전 (PE3 버전)을 제작하였다. 그 결과, 예상한 바와 같이, 반대쪽 가닥을 추가로 자름으로써, 프라임 에디팅 교정 효율이 더욱 상승하게 되었다.This is because, after the prime editing operation, the DNA strand directly attached to the pegRNA is intact during the DNA repair process, so there is a much higher possibility of repair based on it. That is, it is more likely to be restored based on the original DNA strand rather than the newly created DNA strand by reverse transcriptase, and as a result, the original sequence is restored. If pegRNA creates an additional nick in the directly attached strand, the efficiency of the prime editing operation can be maximized. A prime editing version (PE3 version) that additionally introduced sgRNA to create another DNA break at a location a little far from the editing site was prepared. As a result, as expected, by further cutting the opposite strand, the efficiency of the prime editing correction was further increased.

유전체 편집은 pegRNA 및 융합 단백질을 세포로 도입함으로써 수행된다. 형질 도입은 종종 세포에 벡터를 도입하여 수행될 수 있다. 일단 내재화되면, 융합 단백질은 표적 DNA 서열을 절단하고, pegRNA의 RT 주형 부분의 역전사 (프라임)를 개시하는데 사용될 수 있는 3' 하이드록실기를 노출시킨다. 결과적으로 2 개의 DNA 플랩, 즉 새로 합성된 (편집된) 서열을 포함하는 3' 플랩과, 디스펜서 블, 편집되지 않은 DNA 서열을 포함하는 5' 플랩이 포함된 분지형 중간체가 생성된다. 그런 다음 5' 플랩은 구조별 엔도뉴클레아제또는 5' 엑소뉴클레아제로 절단된다. 이 과정은 3' 플랩 결찰을 허용하고 하나의 편집된 가닥과 하나의 편집되지 않은 가닥으로 구성된 DNA를 생성한다. 재어닐링된 이중 가닥 DNA는 편집이 일어난 위치에서 뉴클레오티드 불일치를 포함한다. 불일치를 정정하기 위해, 세포는 두 가지 가능한 결과로 본질적인 불일치 복구 메커니즘을 이용한다. (i) 편집된 가닥의 정보가 상보적 가닥으로 복사되어, 편집을 영구적으로 할 수 있으며; (ii) 원래의 뉴클레오티드는 편집을 제외하고 편집된 가닥으로 다시 통합된다. Genome editing is performed by introducing pegRNA and fusion proteins into cells. Transduction can often be accomplished by introducing a vector into a cell. Once internalized, the fusion protein cleaves the target DNA sequence and exposes a 3' hydroxyl group that can be used to initiate reverse transcription (prime) of the RT template portion of the pegRNA. The result is a branched intermediate comprising two DNA flaps, a 3' flap containing the newly synthesized (edited) sequence and a 5' flap containing a dispensable, unedited DNA sequence. The 5' flap is then cleaved with a structure-specific endonuclease or 5' exonuclease. This process allows for 3' flap ligation and produces DNA consisting of one edited strand and one unedited strand. The reannealed double-stranded DNA contains a nucleotide mismatch at the location where the edit occurred. To correct the discrepancy, the cell utilizes an intrinsic discrepancy repair mechanism with two possible outcomes. (i) information from the edited strand is copied to the complementary strand, making the edit permanent; (ii) the original nucleotide is re-integrated into the edited strand with the exception of the edit.

프라임 에디팅 유전자 교정기술은 염기교정 유전자가위와 마찬가지로 이중나선절단을 일으키지 않는다는 큰 장점을 가지고 있다. 그리고 모든 종류의 염기 치환 뿐 아니라, 삽입이나 결실을 유도할 수 있다는 점에서 기존의 염기교정 유전자가위 보다 더욱 확장성이 크다고 할 수 있다.Prime-editing gene editing technology has a great advantage in that it does not cause double helix breaks, like base-editing gene scissors. And in that it can induce insertions or deletions as well as all kinds of base substitutions, it can be said that it is more scalable than the existing base-correcting gene scissors.

하지만, 아직까지는 프라임 에디팅 가이드 RNA를 디자인 하는 과정이 최적화되지 않아, 최적의 RNA를 제작하기 위해서는 RNA가 절단된 가닥과 결합할 수 있는 PBS(primer binding site) 길이와 교정될 부분을 포함하고 있는 RT template 역전사 효소의 주형) 길이를 다양하게 시도해 보아야 한다. 그리고 염기 치환의 경우 기존의 염기교정 유전자가위에 비해 효율이 다소 떨어지고, 최종 버전(PE3)을 사용할 경우, 원치 않는 DNA 결실이나 삽입이 약간 발생한다는 점 등은 향후 추가로 개선되어야 할 것이다.However, the process of designing the prime editing guide RNA has not been optimized yet, so in order to produce an optimal RNA, the length of the PBS (primer binding site) that the RNA can bind to the cut strand and the RT including the part to be corrected You should try various lengths of the template (template of reverse transcriptase). And in the case of base substitution, the efficiency is somewhat lower than that of the existing base-editing gene scissors, and when the final version (PE3) is used, some unwanted DNA deletions or insertions occur, etc., should be further improved in the future.

이 기술을 개발하는 동안 구성 요소의 효과를 높이기 위해 구성 요소를 몇 가지 수정했다.During the development of this technology, we made some modifications to the components to make them more effective.

(a) 프라임 에디터 1(PE1) ; 첫 번째 시스템에서, 야생형 몰로니 백혈병 바이러스 (M-MLV) 역전사 효소는 Cas9 H840A 닉카아제C- 말단에 융합되었다. 검출 가능한 편집 효율이 관찰되었다.(a) Prime Editor 1 (PE1) ; In the first system, wild-type Moloney leukemia virus (M-MLV) reverse transcriptase was fused to the C-terminus of the Cas9 H840A nickase. A detectable editing efficiency was observed.

(b) 프라임 에디터 2(PE2) ; DNA-RNA 친화성, 효소 가공성 및 열 안정성을 향상시키기 위해, 5 개의 아미노산 치환을 M-MLV 역전사 효소에 포함시켰다. 이어서 돌연변이체 M-MLV RT를 PE1에 혼입하여 (Cas9 (H840A) -M-MLV RT (D200N / L603W / T330P / T306K / W313F))를 일으켰다. PE1에 비해 효율 개선이 관찰되었다.(b) Prime Editor 2 (PE2); To improve DNA-RNA affinity, enzymatic processability and thermal stability, five amino acid substitutions were included in M-MLV reverse transcriptase. Mutant M-MLV RT was then incorporated into PE1 to give rise to (Cas9(H840A)-M-MLV RT(D200N/L603W/T330P/T306K/W313F)). An improvement in efficiency compared to PE1 was observed.

(c) 프라임 에디터 3(PE3) : 증가된 효능에도 불구하고, PE2에 의해 삽입된 편집은 편집된 가닥의 DNA 불일치 복구로 인해 여전히 제거될 수 있다. DNA 이종 이중체 분해 동안이 문제를 피하기 위해, 추가적인 단일 가이드 RNA (sgRNA)가 도입할 수 있다. 이 sgRNA는 원래 대립 유전자가 아닌 pegRNA에 의해 도입된 편집된 서열과 일치하도록 설계되었다. 그것은 융합 단백질의 Cas9 닉카아제부분이 원래 닉과 반대되는 근처 위치에서 편집되지 않은 가닥을 닉킹하도록 지시한다. 편집되지 않은 가닥을 선택하면 셀의 자연 수리 시스템이 편집된 가닥의 정보를 보완 가닥에 복사하여 편집을 영구적으로 고정할 수 있다.(c) Prime Editor 3 (PE3): Despite the increased efficacy, edits inserted by PE2 can still be eliminated due to DNA mismatch repair of the edited strands. To avoid this problem during DNA heteroduplex digestion, an additional single guide RNA (sgRNA) can be introduced. This sgRNA was originally designed to match the edited sequence introduced by the pegRNA and not the allele. It directs the Cas9 nickase portion of the fusion protein to nick the unedited strand at a nearby position opposite to the original nick. Selecting the unedited strand allows the cell's natural repair system to copy information from the edited strand to the complementary strand, permanently fixing the edit.

프라임 편집 도구는 전통적인 유전자 편집 기술보다 더 많은 장점을 제공한다. CRISPR/Cas9 편집본은 NHEJ (Non-homoousous End Joining) 또는 HDR (homology-directed repair)을 사용하여 DNA 단절을 수정하는 반면 프라임 편집 시스템은 DNA 불일치 복구를 사용한다. Prime editing tools offer many advantages over traditional gene editing techniques. CRISPR/Cas9 edits use Non-homoousous End Joining (NHEJ) or homology-directed repair (HDR) to fix DNA breaks, whereas the prime editing system uses DNA mismatch repair.

NHEJ 및 HDR과 같은 DNA 복구 메커니즘은 올바른 편집을 수행하는 세포에서 원치 않는 랜덤 삽입 또는 결실(INDEL)부산물을 생성한다. DNA repair mechanisms such as NHEJ and HDR produce unwanted random insertion or deletion (INDEL) byproducts in cells performing correct editing.

프라임 시스템은 염기 편집기 base editors와 같은 다른 편집 도구에서 관찰되는 이중 가닥 DNA 절단 대신 단일 가닥 DNA 절단을 도입한다. 염기 편집 및 프라임 편집 base editing 및 prime editing은 종합적으로 목표 전이 돌연변이 targeted transition mutations를 만들기 위한 보완적인 강점과 약점을 제공한다. 원하는 편집이 전이점 돌연변이 targeted transition mutations이고 PAM 서열이 표적 부위로부터 대략 15 개의 염기가 존재하는 경우, 염기 편집기는 보다 높은 편집 효율 및 더 적은 INDEL 부산물을 제공한다. 그러나, 프라임 편집 기술은 뉴클레오타이드 서열을 표적화하기 위해 정확하게 위치된 PAM 서열을 필요로 하기 때문에, 더 많은 유연성 및 편집 정밀도를 제공한다. 놀랍게도 프라임 편집기를 사용하면 모든 유형의 대체, 전환 및 변환을 대상 시퀀스에 삽입할 수 있다.The Prime system introduces single-stranded DNA breaks instead of the double-stranded DNA breaks observed in other editing tools such as base editors and base editors. Base editing and prime editing Base editing and prime editing collectively provide complementary strengths and weaknesses to create targeted transition mutations. When the desired edits are transition point mutations targeted transition mutations and the PAM sequence is approximately 15 bases from the target site, the base editor provides higher editing efficiency and fewer INDEL by-products. However, since prime editing techniques require precisely positioned PAM sequences to target nucleotide sequences, they provide more flexibility and editing precision. Surprisingly, the Prime Editor allows you to insert all types of substitutions, transitions, and transformations into the target sequence.

프라임 시스템은 (i) 가이드 서열과 표적 DNA 사이, (ii) 프라이머 결합 부위와 표적 DNA, (iii) 닉킹된 DNA 가닥의 3 '말단 및 pegRNA 등 총 3번의 독립적인 DNA 결합이 있어 CRISPR / Cas9보다 바람직하지 않은 오프-타겟 효과가 적은 것으로 제안되었다.The prime system has a total of three independent DNA bonds: (i) between the guide sequence and the target DNA, (ii) between the primer binding site and the target DNA, (iii) the 3' end of the nicked DNA strand and pegRNA, so it is better than CRISPR / Cas9. It has been suggested that there are few undesirable off-target effects.

유전자 성분을 이용한 질병의 치료에 유전자 편집 방법을 적용하는 데 상당한 관심이 있다. 그러나 이 방법에는 여러 가지 문제가 있습니다. 효과적인 치료를 위해서는 많은 수의 표적 세포를 편집해야하는데 효과적인 전달 방법과 조직 특이성이 필요하다. There is considerable interest in applying gene editing methods to the treatment of diseases using genetic components. However, there are several problems with this method. Effective treatment requires editing of large numbers of target cells, which requires effective delivery methods and tissue specificity.

현재, 소수의 유전자 변형에 대해서는 프라임 편집이 유망해 보이지만, 표적 삽입 및 결실과 같은 더 큰 변화를 만드는 기술이 효율적인지 평가하기 위해 더 많은 연구가 필요하다. 더 큰 유전자 변경은 더 긴 RT 주형을 필요로 하며, 이는 pegRNA의 표적 세포로의 효율적인 전달을 방해할 수 있다. 또한, 긴 RT 주형을 함유하는 pegRNA는 세포 효소에 의해 야기되는 손상에 취약할 수 있다.Currently, while prime editing looks promising for a small number of genetic modifications, more studies are needed to evaluate whether techniques for making larger changes, such as targeted insertions and deletions, are efficient. Larger genetic alterations require longer RT templates, which may interfere with efficient delivery of pegRNAs to target cells. In addition, pegRNAs containing long RT templates may be susceptible to damage caused by cellular enzymes.

프라임 편집의 효율성을 개선하기 위해 추가 연구가 필요하지만 이 기술은 다른 유전자 편집 도구보다 유망한 과학적 개선을 제공한다. 프라임 편집 기술은 삽입, 결실 및 뉴클레오티드 치환을 복구할 수 있기때문에 유전병을 유발하는 대다수의 병원성 대립 유전자를 교정할 수 있는 잠재력을 가지고 있다. Although further research is needed to improve the efficiency of prime editing, this technique offers a promising scientific improvement over other gene editing tools. Prime editing technology has the potential to correct the majority of pathogenic alleles that cause genetic diseases because it can repair insertions, deletions and nucleotide substitutions.

인간 질병에서 병원성 대립 유전자를 교정하기 위해 프라임 편집을 사용하기 위해서는 많은 연구가 필요하다. Much research is needed to use prime editing to correct pathogenic alleles in human disease.

프라임 편집에 사용되는 염기 편집기는 단백질과 RNA 분자를 살아있는 세포로 전달해야 한다. 외인성 유전자 편집 기술을 살아있는 유기체에 도입하는 것은 중요한 과제이다. 동물과 식물에 염기 편집기를 도입할 수 있는 한 가지 방법은 염기 편집기를 바이러스성 캡시드에 포장하는 것이다. The base editor used for prime editing must deliver proteins and RNA molecules into living cells. Introduction of exogenous gene editing techniques into living organisms is a major challenge. One possible way to introduce a base editor in animals and plants is to wrap the base editor in a viral capsid.

그 후 표적 유기체는 바이러스에 의해 형질 도입되어 생체 내에서 염기 편집기를 합성할 수 있다. 렌티 바이러스와 같은 형질 도입의 일반적인 실험실 벡터는 인간에서 면역 반응을 유발하므로, 제안된 인간 요법은 종종 AAV 감염이 무증상이기 때문에 아데노 관련 바이러스 (AAV)를 중심으로 한다. 불행히도, AAV 벡터의 유효 패키징 용량은 작으며, 역 터미널 반복을 포함하지 않는 약 4.4kb입니다. SpCas9- 역전사 효소 융합 단백질은 6.3kb이며, 관심 부위를 표적화하고 프라이밍하는데 필요한 길어진 가이드 RNA를 설명하지도 않는다.The target organism can then be transduced by the virus to synthesize the base editor in vivo. As common laboratory vectors of transduction, such as lentiviruses, elicit an immune response in humans, proposed human therapies revolve around adeno-associated viruses (AAVs) because AAV infections are often asymptomatic. Unfortunately, the effective packaging capacity of AAV vectors is small, about 4.4 kb not including inverse terminal repeats. The SpCas9-reverse transcriptase fusion protein is 6.3 kb and does not account for the elongated guide RNA required to target and prime the site of interest.

Ⅴ. 본 발명의 시스템의 다능성Ⅴ. The versatility of the system of the present invention

본 발명의 시스템의 또 다른 이점은 핵 전사로부터의 독립성 및 전례없는 자유로운 설계를 제공하는 DdRp RNA 발현 카세트, auto-DdRp 발현 카세트 및 유전체 편집 도구를 코딩하는 DNA 발현 카세트의 존재를 포함한다. 서로 조합할 수 있는 다목적 요소를 고려하여, 본 발명은 DdRp RNA 발현 카세트 및 auto-DdRp 발현 카세트에서 원하는 수준의 DdRp 합성, 원하는 표적 유기체, 원하는 수준의 유전체 편집 도구 생산 등에 대한 DdRp 발현을 최적화할 수 있게 한다. DdRp에 의해 트랜스로 전사될 수 있는 발현 카세트는 독립적으로 설계될 수 있다.Another advantage of the system of the present invention includes the presence of a DNA expression cassette encoding a DdRp RNA expression cassette, an auto-DdRp expression cassette and a genome editing tool that provides independence from nuclear transcription and unprecedented design freedom. Considering the multi-purpose factors that can be combined with each other, the present invention can optimize DdRp expression for a desired level of DdRp synthesis, a desired target organism, a desired level of genome editing tool production, etc. in a DdRp RNA expression cassette and an auto-DdRp expression cassette. let there be Expression cassettes that can be trans-transcribed by DdRp can be designed independently.

본 발명은 최초 DdRp를 제공하는 DdRp RNA 발현 카세트를 포함하는 RNA 발현 카세트 및 발현 카세트가 DdRp에 대한 프로모터를 포함하는 한 auto-DdRp 발현 카세트 및 유전체 편집 도구를 코딩하는 DNA 발현 카세트를 포함하는 DNA 발현 카세트로 이루어진 유전체 편집 RNA/DNA 시스템으로 유전체 편집 도구중 가이드 RNA의 종류에 따라 다양한 기능이 있다.The present invention relates to an RNA expression cassette comprising a DdRp RNA expression cassette providing the original DdRp and a DNA expression comprising an auto-DdRp expression cassette and a DNA expression cassette encoding a genome editing tool as long as the expression cassette contains a promoter for DdRp It is a genome editing RNA/DNA system composed of cassettes and has various functions depending on the type of guide RNA among genome editing tools.

예를 들어, 하기 요소는 본 발명에 기초하여 개별적으로 선택, 설계 및/또는 개조될 수 있다. RNA 발현 카세트의 캡핑 (특히 특정 캡의 선택); RNA 발현 카세트에 화학적 변형 뉴클레오타이드; RNA 발현 카세트의 5'UTR; DdRp를 코딩하는 ORF의 코딩 서열(코돈-최적화); RNA 발현 카세트의 3'UTR; RNA 발현 카세트의 폴리(A) 꼬리; DNA 발현 카세트의 5'UTR; DNA 발현 카세트의 프로모터 서열; DNA 발현 카세트로부터 생성된 전사체의 5'UTR; DdRp 및 유전체 편집 도구를 코딩하는 ORF의 코딩 서열 (코돈-최적화); DNA 발현 카세트로부터 생성된 전사체의 3'UTR; DNA 발현 카세트의 폴리(A) 꼬리 및/또는 발현 카세트으로부터 생성된 전사체를 포함한다.For example, the following elements may be individually selected, designed and/or adapted based on the present invention. capping of RNA expression cassettes (especially selection of specific caps); chemically modified nucleotides in the RNA expression cassette; 5'UTR of the RNA expression cassette; the coding sequence of the ORF encoding DdRp (codon-optimized); 3'UTR of the RNA expression cassette; poly(A) tail of the RNA expression cassette; 5'UTR of the DNA expression cassette; the promoter sequence of the DNA expression cassette; 5'UTR of the transcript generated from the DNA expression cassette; the coding sequence of the ORF encoding DdRp and genome editing tools (codon-optimized); 3'UTR of the transcript generated from the DNA expression cassette; poly(A) tails of the DNA expression cassette and/or transcripts generated from the expression cassette.

또한, 본 발명은 시험관내 또는 생체내에서 휴지기 또는 세포주기인 임의의 주어진 세포 유형에 대해 유전체 편집 도구 DNA 발현 카세트, auto-DdRp 발현 카세트 및 DdRp RNA 발현 카세트의 최적량을 공동-형질주입시킬 수 있다.In addition, the present invention can co-transfect an optimal amount of a genome editing tool DNA expression cassette, auto-DdRp expression cassette and DdRp RNA expression cassette for any given cell type that is quiescent or cell cycle in vitro or in vivo. have.

DdRp를 발현시키기 위한 DdRp RNA 발현 카세트DdRp RNA Expression Cassette for Expression of DdRp

본 발명은 DdRp의 번역을 유도하기 위한 5'캡을 포함하는 DdRp를 발현시키기 위한 RNA 발현 카세트 (DdRp RNA 발현 카세트)를 제공한다. 본 발명에 있어서, 본 발명의 DdRp RNA 발현 카세트는 본원에 기재된 바와 같이 본 발명의 DNA 발현 카세트와는 독립적으로 제공될 수 있다. DdRp RNA 발현 카세트는 본 발명의 DdRp RNA 발현 카세트의 임의의 하나 이상의 특성에 의해 독립적으로 특징화될 수 있다. DdRp를 발현시키기 위한 RNA 발현 카세트는 분리된 핵산 분자이다. 이는 다른 핵산 분자로부터 분리된, 즉 본질적으로 없는 실시형태를 포함한다.The present invention provides an RNA expression cassette (DdRp RNA expression cassette) for expressing DdRp comprising a 5' cap for inducing translation of DdRp. In the present invention, the DdRp RNA expression cassette of the present invention may be provided independently of the DNA expression cassette of the present invention as described herein. A DdRp RNA expression cassette may be independently characterized by any one or more properties of a DdRp RNA expression cassette of the invention. The RNA expression cassette for expressing DdRp is an isolated nucleic acid molecule. This includes embodiments that are isolated, ie, essentially free, from other nucleic acid molecules.

본 발명에 따른 RNA 발현 카세트는 예를 들어 시스템 또는 키트의 형태로 적합한 DNA 발현 카세트와 조합하기에 적합하다.The RNA expression cassette according to the invention is suitable for combination with a suitable DNA expression cassette, for example in the form of a system or kit.

본 발명의 시스템의 부분일 수 있거나 또는 아닌, 본 발명에 따른 임의의 DdRp RNA 발현 카세트는 시험관내 전사에 의해 수득될 수 있다. 시험관내 전사된 DdRp RNA 발현 카세트(IVT-RNA)는 본 발명에서 특히 중요하다. IVT-RNA는 핵산 분자 (특히 DNA 분자)로부터의 전사에 의해 수득될 수 있다. 본 발명의 auto_DdRp 발현 카세트(들)는 이러한 목적에 적합한데, 특히 DdRp에 의해 인식될 수 있는 프로모터를 포함하는 경우에 적합하다.Any DdRp RNA expression cassette according to the present invention, which may or may not be part of the system of the present invention, may be obtained by in vitro transcription. The in vitro transcribed DdRp RNA expression cassette (IVT-RNA) is of particular interest in the present invention. IVT-RNA can be obtained by transcription from a nucleic acid molecule (especially a DNA molecule). The auto_DdRp expression cassette(s) of the present invention are suitable for this purpose, especially if they contain a promoter that can be recognized by DdRp.

본 발명에 따른 RNA는 시험관내에서 합성될 수 있다. 이것은 시험관내 전사 반응에 캡-유사체를 추가하도록 할 수 있다. 전형적으로, 폴리(A) 꼬리는 auto_DdRp 발현 카세트 주형상의 폴리-(dT) 서열에 의해 코딩된다. 대안적으로, 캡핑 및 폴리(A) 꼬리 첨가는 전사 후에 효소로 달성될 수 있다.The RNA according to the invention can be synthesized in vitro. This may allow the addition of cap-analogs to in vitro transcription reactions. Typically, the poly(A) tail is encoded by the poly-(dT) sequence on the auto_DdRp expression cassette template. Alternatively, capping and poly(A) tail addition can be accomplished enzymatically after transcription.

시험관내 전사 방법론은 당업자에게 공지되어 있는 것이다. 다양한 시험관내 전사 키트가 상업적으로 이용 가능하다.In vitro transcription methodologies are known to those skilled in the art. A variety of in vitro transcription kits are commercially available.

DNA 발현 카세트DNA expression cassette

본 발명은 본 발명에 따른 DdRp를 발현시키기 위한 RNA 발현 카세트(DdRp RNA 발현 카세트), 본 발명에 따른 RNA 발현 카세트, 또는 둘 모두를 코딩하는 핵산 서열을 포함하는 DNA 발현 카세트를 제공한다. The present invention provides a DNA expression cassette comprising a nucleic acid sequence encoding an RNA expression cassette (DdRp RNA expression cassette) for expressing DdRp according to the present invention, an RNA expression cassette according to the present invention, or both.

본 발명에 따른 DNA 발현 카세트는 본 발명에 따른 시스템의 유전체 편집 도구를 코딩한다. 상기 유전체 편집 도구 DNA(DNAge 발현 카세트는 표적화 엔도뉴클레아제를 코딩하는 DNAen 발현 카세트와 가이드 핵산, sgRNA를 코딩하는 DNAsg 발현 카세트로 구성되며 이들은 하나의 발현 카세트 또는 독립된 발현 카세트에 있을 수 있으며 본 발명은 이런 DNA 발현 카세트를 제공한다.The DNA expression cassette according to the present invention encodes the genome editing tool of the system according to the present invention. The genome editing tool DNA (DNAge expression cassette is composed of a DNAen expression cassette encoding a targeting endonuclease and a DNAsg expression cassette encoding a guide nucleic acid and sgRNA, which may be in one expression cassette or an independent expression cassette, and the present invention provides such a DNA expression cassette.

본 발명에 따른 DNA 발현 카세트는 본 발명에 따른 시스템의 DdRp RNA 발현 카세트를 코딩한다. auto_DdRp 발현 카세트는 본 발명에 따른 시스템의 하나의 RNA 요소(DdRp RNA 발현 카세트)를 코딩한다.The DNA expression cassette according to the invention encodes the DdRp RNA expression cassette of the system according to the invention. The auto_DdRp expression cassette encodes one RNA element (DdRp RNA expression cassette) of the system according to the invention.

바람직하게, 본 발명에 따른 DNA 발현 카세트는 플라스미드이다. 본원에 사용된 용어 "플라스미드"는 일반적으로 염색체 DNA와 독립적으로 전사할 수 있는 염색체외 유전 물질, 대체로 원형 DNA 듀플렉스의 발현 카세트에 관한 것이다.Preferably, the DNA expression cassette according to the present invention is a plasmid. As used herein, the term “plasmid” generally relates to an expression cassette of extrachromosomal genetic material, usually a circular DNA duplex, capable of transcription independently of chromosomal DNA.

본 발명의 auto_DdRp 발현 카세트는 DdRp에 의해 인식될 수 있는 프로모터를 포함할 수 있다. 이것은 생체내 또는 시험관내에서 코딩된 RNA, 예를 들어 본 발명의 RNA의 전사를 허용한다. IVT 벡터는 시험관내 전사를 위한 주형으로 표준화된 방식을 사용할 수 있다. 본 발명에 따라 바람직한 프로모터의 예로서는 SP6, T3 또는 T7 중합효소에 대한 프로모터이다.The auto_DdRp expression cassette of the present invention may include a promoter that can be recognized by DdRp. This allows for transcription of the encoded RNA, for example the RNA of the present invention, in vivo or in vitro. IVT vectors can use a standardized manner as a template for in vitro transcription. Examples of preferred promoters according to the invention are the promoters for SP6, T3 or T7 polymerase.

본 발명의 auto_DdRp 발현 카세트는 분리된 핵산 분자이다.The auto_DdRp expression cassette of the present invention is an isolated nucleic acid molecule.

본 발명은 또한 본 발명에 따른 유전체 편집 RNA/DNA 시스템 또는 본 발명에 따른 DdRp를 발현시키기 위한 RNA 발현 카세트를 포함하는 키트를 제공한다.The present invention also provides a kit comprising a genome editing RNA/DNA system according to the present invention or an RNA expression cassette for expressing DdRp according to the present invention.

키트의 구성은 별개의 실체로 존재한다. 예를 들어, 키트의 하나의 핵산 분자는 하나의 실체에 존재할 수 있고, 키트의 다른 핵산은 별도의 실체에 존재할 수 있다. 예를 들어, 개방형 용기 또는 밀폐형 용기가 적합한 실체이다. 밀폐된 용기가 바람직하다. 사용된 용기는 바람직하게는 RNase가 없거나 본질적으로 RNase가 없어야 한다.The components of the kit exist as separate entities. For example, one nucleic acid molecule in the kit may be in one entity, and the other nucleic acid molecule in the kit may be in a separate entity. For example, open containers or closed containers are suitable entities. A closed container is preferred. The container used should preferably be RNase-free or essentially RNase-free.

본 발명의 키트는 세포 접종용 및/또는 인간이나 동물 대상체에 투여용 유전체 편집 RNA/DNA 시스템을 포함한다.The kit of the present invention comprises a genome editing RNA/DNA system for inoculation of cells and/or administration to a human or animal subject.

본 발명에 따른 키트는 임의로 라벨 또는 다른 형태의 정보 요소, 예를 들면, 전자 데이터 이동 매체를 포함한다. 라벨 또는 정보 요소는 바람직하게는 취급설명서, 예를 들어, 인쇄된 서면 취급설명서 또는 임의로 인쇄 가능한 전자 양식으로 된 취급설명서를 포함한다. 취급설명서는 적합하고 가능한 적어도 하나의 키트 사용법을 지칭할 수 있다.The kit according to the invention optionally comprises a label or other form of information element, for example an electronic data carrier medium. The label or information element preferably contains instructions for use, for example printed written instructions or optionally in printable electronic form. Instructions for use may refer to at least one suitable and possible use of the kit.

Ⅵ. 발현카세트 및 전달체 Ⅵ. Expression cassettes and transporters

본 발명의 자가전사 RNA/DNA 시스템은 DdRp에 의해 발현하는 신규 발현카세트에 관한 내용을 포함함으로, 보다 상세하게는 개발된 선형 DdRp RNA 발현 카세트, auto_DdRp 발현 카세트, auto-loop로 발현되는 DdRp 발현 시스템, DdRp에 의해 전사되는 유전체편집 도구를 코딩하는 DNAge 발현 카세트, auto_(DdRp+DNAge) 발현 카세트,항생제 저항성 유전자, 복제원점(origin of replication) 및 상기 클로닝 부위 서열을 포함하는 재조합 발현카세트 및 상기 발현카세트로 형질전환된 세포 등에 관한 것이다. The self-transcription RNA/DNA system of the present invention includes the contents of the novel expression cassette expressed by DdRp, and in more detail, the developed linear DdRp RNA expression cassette, auto_DdRp expression cassette, DdRp expression system expressed by auto-loop , a DNAge expression cassette encoding a genome editing tool transcribed by DdRp, an auto_(DdRp+DNAge) expression cassette, an antibiotic resistance gene, an origin of replication and a recombinant expression cassette comprising the cloning site sequence and the expression It relates to a cell transformed with the cassette, and the like.

제한효소(Restriction endonuclease)는 거의 모든 세균에 존재하며 이는 DNA에 존재하는 특정한 염기서열을 인식하여 인식한 서열부위 또는 그 근처의 특정부위를 절단하는 효소이다. 이러한 제한효소는 원래 세균이 자신의 세포 내로 침입해 들어오는 바이러스와 같은 외부 DNA를 제거하기 위하여 방어기전으로 가지고 있는 것이며 자신의 DNA는 절단부위의 염기(아데닌 또는 사이토신)를 메틸화시켜서 제한효소로부터 보호하고 있다. 이런 제한효소의 성질을 이용하여, 벡터 내에 원하는 유전자를 삽입할 수 있다.Restriction endonuclease is present in almost all bacteria and is an enzyme that recognizes a specific nucleotide sequence present in DNA and cuts the recognized sequence site or a specific site near it. These restriction enzymes are originally possessed by bacteria as a defense mechanism to remove foreign DNA such as viruses that invade their cells. are doing By using the properties of these restriction enzymes, a desired gene can be inserted into the vector.

특히 발현카세트에는 다중클로닝부위(multicloning site, MCS)가 있는데, 이 부위는 인위적으로 여러 가지 제한효소의 인식부위를 모아놓은 것으로 cloning을 위한 insert DNA의 제한효소를 결정해 준다. 플라스미드 벡터는 제한효소 중에서 많이 쓰이는 것을 위주로 MCS를 구성해서 상용화되어 있다. 이러한 범용 제한효소를 활용한 MCS는 높은 빈도수로 인해서 전체 유전자의 클로닝이 어렵거나 불가능한 유전자들이 존재한다.In particular, there is a multicloning site (MCS) in the expression cassette, which artificially collects the recognition sites of various restriction enzymes and determines the restriction enzyme of the insert DNA for cloning. Plasmid vectors are commercially available by constructing MCS mainly from restriction enzymes commonly used. In MCS using such general-purpose restriction enzymes, there are genes in which it is difficult or impossible to clone all genes due to their high frequency.

본 발명의 재조합 발현카세트는 숙주세포에서 목적 단백질 또는 목적 RNA를 발현할 수 있는 카세트로서, 유전자 삽입물이 발현되도록 작동 가능하게 연결된 필수적인 조절요소를 포함하는 유전자 제작물을 말한다. 발현카세트는 발현조절 서열 및 필요에 따라 막표적화 또는 분비를 위한 시그널 서열 또는 리더 서열을 포함하며 목적에 따라 다양하게 제조될 수 있다. 발현 조절 서열(expression control sequence)이란 특정한 숙주 세포에서 작동 가능하게 연결된 폴리뉴클레오티드 서열의 발현을 조절하는 DNA 서열을 의미한다. 그러한 조절 서열은 전사를 실시하기 위한 프로모터, 전사를 조절하기 위한 임의의 오퍼레이터 서열, 5′Cap 구조, 적합한 mRNA 리보좀 결합 부위를 코딩하는 서열 및 전사 및 해독의 종결을 조절하는 서열을 포함한다. 또한 발현카세트는 카세트를 포함하는 숙주 세포를 선택하기 위한 선택 마커를 포함할 수 있으며, 복제가능한 발현카세트인 경우 복제기원을 포함할 수 있다.The recombinant expression cassette of the present invention is a cassette capable of expressing a target protein or target RNA in a host cell, and refers to a gene construct including essential regulatory elements operably linked to express a gene insert. The expression cassette includes an expression control sequence and, if necessary, a signal sequence or leader sequence for membrane targeting or secretion, and may be prepared in various ways depending on the purpose. The expression control sequence (expression control sequence) refers to a DNA sequence that controls the expression of an operably linked polynucleotide sequence in a specific host cell. Such regulatory sequences include promoters to effect transcription, optional operator sequences to control transcription, 5'Cap structures, sequences encoding suitable mRNA ribosome binding sites, and sequences controlling the termination of transcription and translation. In addition, the expression cassette may include a selection marker for selecting a host cell containing the cassette, and in the case of a replicable expression cassette, it may include an origin of replication.

본 발명의 재조합 발현카세트에는 알려진 다양한 단백질을 암호화하는 염기서열을 포함할 수 있으며, 이 목적 단백질을 암호화하는 염기서열은 프로모터와 작동 가능하게 연결된다. 작동 가능하게 연결(operably linked) 된다는 것은 하나의 핵산 단편이 다른 핵산 단편과 결합되어 그의 기능 또는 발현이 다른 핵산 단편에 의해 영향을 받는 것을 말한다.The recombinant expression cassette of the present invention may include a nucleotide sequence encoding a variety of known proteins, and the nucleotide sequence encoding the target protein is operably linked to a promoter. To be operably linked means that one nucleic acid fragment is associated with another nucleic acid fragment so that its function or expression is affected by the other nucleic acid fragment.

본 발명에 따른 발현카세트는 단백질 발현에 사용되는 기존의 카세트를 기본 골격으로 하여 본 발명의 MCS 폴리뉴클레오타이드를 각각 구조유전자가 선정된 DdRp가 결합하는 프로모터에 의해 작동가능하게 연결되도록 삽입됨으로써 제조할 수 있다. 바람직하게는 본 발명의 발현카세트는 복제원점, 프로모터, 형광 단백질 유전자, MCS 및 선별 마커를 포함할 수 있으며, 추가로 단백질 발현을 위한 폴리A 신호서열이 포함될 수 있다.The expression cassette according to the present invention can be prepared by inserting the MCS polynucleotide of the present invention as a basic backbone to an existing cassette used for protein expression so as to be operatively linked by a promoter to which a DdRp selected for a structural gene binds. have. Preferably, the expression cassette of the present invention may include an origin of replication, a promoter, a fluorescent protein gene, MCS, and a selection marker, and may further include a polyA signal sequence for protein expression.

본 발명에서 선별 마커(selective marker)는 항생제저항성 유전자일 수 있으며, 이러한 항생제저항성 유전자로 될 수 있는 유전자는 현재 다수가 공지되어 있다(예를 들어, 카나마이신, 네오마이신, 앰피실린, 테트라사이클린 등). 따라서, 당업자는 상기 공지된 항생제저항성 유전자들로부터 원하는 유전자를 취사선택하여 사용하는 것이 가능하며 이러한 유전자의 구체적인 종류는 본 발명의 본질을 구성하는 것은 아니다. 뿐만 아니라, 이러한 항생제저항성 유전자의 도입은 형질전환체를 선발하기 위한 것이므로, 선발에 사용될 수 있는 유전자라면 어떠한 것도 도입될 수 있다. 따라서, 항생제저항성 유전자에만 한정되는 것은 아니다. 바람직하게는 본 발명의 항생제저항성 유전자는 카나마이신 또는 네오마이신 저항성 유전자일 수 있다.In the present invention, the selectable marker (selective marker) may be an antibiotic resistance gene, and many genes that can be such an antibiotic resistance gene are currently known (eg, kanamycin, neomycin, ampicillin, tetracycline, etc.) . Accordingly, those skilled in the art can select and use desired genes from the known antibiotic resistance genes, and the specific types of these genes do not constitute the essence of the present invention. In addition, since the introduction of the antibiotic resistance gene is for selecting transformants, any gene that can be used for selection may be introduced. Therefore, it is not limited only to the antibiotic resistance gene. Preferably, the antibiotic resistance gene of the present invention may be a kanamycin or neomycin resistance gene.

본 발명의 발현카세트에는 본 발명의 발현카세트의 기본 구조가 동일 또는 유사하는 한 코돈 degeneracy 등 당업자에게 공지된 방식에 따른 염기서열이 다소간의 변화된 발현카세트도 포함한다. 아울러, 서열목록의 N-말단과 C-말단이 원형을 이루는 것은 당업자에게 자명하다.The expression cassette of the present invention includes expression cassettes in which the nucleotide sequence is slightly changed according to methods known to those skilled in the art, such as codon degeneracy, as long as the basic structure of the expression cassette of the present invention is the same or similar. In addition, it is apparent to those skilled in the art that the N-terminus and the C-terminus of the sequence listing form a circle.

한편, 본 발명은 본 발명의 재조합 카세트로 형질전환한 세포를 제공한다.On the other hand, the present invention provides a cell transformed with the recombinant cassette of the present invention.

본 발명의 재조합 발현카세트는 당 분야에 공지된 방법을 이용하여 숙주내로 도입할 수 있다. 그 예로는 이에 한정되지는 아니하나, 염화칼슘 및 열 쇼크법, 입자 총 충격법(particle gun bombardment), 실리콘 탄화물 위스커(Silicon carbide whiskers), 초음파 처리(sonication), 전기천공법(electroporaion), PEG-매게 융합법, 미세사출법, 미세주입법, 리포좀 매개법 및 진공침윤법 등을 사용할 수 있다.The recombinant expression cassette of the present invention can be introduced into a host using methods known in the art. Examples include, but are not limited to, calcium chloride and heat shock methods, particle gun bombardment, silicon carbide whiskers, sonication, electroporaion, PEG- Medium fusion method, microinjection method, microinjection method, liposome-mediated method, vacuum infiltration method, etc. can be used.

상기 숙주 세포로는 동물, 식물, 효모 및 박테리아의 세포일 수 있으며, 바람직하게는 박테리아 외의 경우 외부로부터 도입되는 벡터를 잘 받아들일 수 있고, 세포질과 핵 등의 세포내 소기관의 경계가 뚜렷하게 구별되는 세포가 바람직하다. 더 바람직하게는 CHO-k1(ATCC CCL-61, Cricetulus griseus, hamster, Chinese), HEK293(ATCC CRL-1573, Homo sapiens, human), HeLa(ATCC CCL-2, Homo sapiens, human), SH-SY5Y(ATCC CRL-2266, Homo sapiens, human), Swiss 3T3(ATCC CCL-92, Mus musculus, mouse), 3T3-L1(ATCC CL-173, Mus musculus, mouse), NIH/3T3(ATCC CRL-1658, Mus musculus, mouse), L-929(ATCC CCL-1, Mus musculus, mouse), Rat2(ATCC CRL-1764, Rattus norvegicus, rat), RBL-2H3(ATCC CRL-2256, Rattus norvegicus, rat), MDCK(ATCC CCL-34, Canis familiaris)일 수 있다. 또한 그 밖에 각종 줄기세포, 각종 조직에서 추출된 세포 및 인위적으로 만들어진 유사 세포막 구조물일 수 있다.The host cell may be cells of animals, plants, yeast and bacteria, preferably, in the case of other than bacteria, it can well accept a vector introduced from the outside, and the boundary between intracellular organelles such as the cytoplasm and the nucleus is clearly distinguished. Cells are preferred. More preferably, CHO-k1 (ATCC CCL-61, Cricetulus griseus, hamster, Chinese), HEK293 (ATCC CRL-1573, Homo sapiens, human), HeLa (ATCC CCL-2, Homo sapiens, human), SH-SY5Y (ATCC CRL-2266, Homo sapiens, human), Swiss 3T3 (ATCC CCL-92, Mus musculus, mouse), 3T3-L1 (ATCC CL-173, Mus musculus, mouse), NIH/3T3 (ATCC CRL-1658, Mus musculus, mouse), L-929 (ATCC CCL-1, Mus musculus, mouse), Rat2 (ATCC CRL-1764, Rattus norvegicus, rat), RBL-2H3 (ATCC CRL-2256, Rattus norvegicus, rat), MDCK (ATCC CCL-34, Canis familiaris). In addition, it may be various other stem cells, cells extracted from various tissues, and artificially made similar cell membrane structures.

한편, 본 발명에서 사용된 표준 재조합 DNA 및 분자 클로닝 기술은 당해 분야에 널리 공지되어 있고, 다음 문헌에 기재되어 있다(Sambrook, J., Fritsch, E. F. and Maniatis, T., Molecular Cloning: A Laboratory Manual, 2nd ed., Cold Spring Harbor Laboratory: Cold Spring Harbor, NY (1989); by Silhavy, T. J., Bennan, M. L. and Enquist, L. W., Experiments with Gene Fusions, Cold Spring Harbor Laboratory: Cold Spring Harbor, NY (1984); and by Ausubel, F. M. et al., Current Protocols in Molecular Biology, published by Greene Publishing Assoc. and Wiley-lnterscience (1987)).Meanwhile, standard recombinant DNA and molecular cloning techniques used in the present invention are well known in the art, and are described in the following literature (Sambrook, J., Fritsch, EF and Maniatis, T., Molecular Cloning: A Laboratory Manual) , 2nd ed., Cold Spring Harbor Laboratory: Cold Spring Harbor, NY (1989); by Silhavy, TJ, Bennan, ML and Enquist, LW, Experiments with Gene Fusions, Cold Spring Harbor Laboratory: Cold Spring Harbor, NY (1984) and by Ausubel, FM et al., Current Protocols in Molecular Biology, published by Greene Publishing Assoc. and Wiley-lnterscience (1987)).

본 발명은 상술한 핵-비의존적 세포질 내에서 DdRp에 의한 유전자 발현 조절서열을 포함하는 개선된 발현카세트를 제공한다.The present invention provides an improved expression cassette comprising the above-described nuclear-independent gene expression control sequence by DdRp in the cytoplasm.

본 발명에 있어서, 본 발명의 발현카세트는 대장균 유래 플라스미드, 바실러스 서브틸리스 유래 플라스미드, 효모 유래 플라스미드 및 Ti 플라스미드 등의 플라스미드 벡터, 코즈미드 벡터, 아데노바이러스(Lockett LJ, et al.,Clin. Cancer Res. 3:2075-2080(1997)), 아데노-관련바이러스(Adeno associated viruses: AAV)(Lashford LS., et al., Gene Therapy Technologies, Applications and Regulations Ed. A. Meager (1999)), 레트로바이러스 (Gunzburg WH, et al., Gene Therapy Technologies, Applications and Regulations Ed. A. Meager, (1999)), 렌티바이러스(Wang G. et al., J. Clin. Invest. 104(11):R55-62(1999)), 헤르페스심플렉스 바이러스(Chamber R., et al., Proc. Natl. Acad. Sci USA 92:1411-1415(1995)), 백시니아 바이러스 (Puhlmann M. et al., Human Gene Therapy 10:649-657(1999)), 리오바이러스, 폭스바이러스 (GCE, NJL, Krupa M, Esteban M., The poxvirus vectors MVA and NYVAC as gene delivery systems for vaccination against infectious diseases and cancer Curr Gene Ther 8(2):97-120(2008)), 셈리키 포리스터 바이러스, 폴리머 (Hwang et al., In vitro and In vivo Transfection Efficiency of Human Osteoprotegerin Gene using Non-Viral Polymer Carriers., Korean J. Bone Metab. 13(2):119-128(2006)), 리포좀 (Methods in Molecular Biology, Vol 199, S.C. Basu and M. Basu (Eds.), Human Press 2002), 나노물질 또는 니오좀에 적용될 수 있다. In the present invention, the expression cassette of the present invention is a plasmid vector such as E. coli-derived plasmid, Bacillus subtilis-derived plasmid, yeast-derived plasmid and Ti plasmid, cosmid vector, adenovirus (Lockett LJ, et al., Clin. Cancer Res. 3:2075-2080 (1997)), Adeno-associated viruses (AAV) (Lashford LS., et al., Gene Therapy Technologies, Applications and Regulations Ed. A. Meager (1999)), Retro Virus (Gunzburg WH, et al., Gene Therapy Technologies, Applications and Regulations Ed. A. Meager, (1999)), Lentivirus (Wang G. et al., J. Clin. Invest. 104(11):R55- 62 (1999)), herpes simplex virus (Chamber R., et al., Proc. Natl. Acad. Sci USA 92:1411-1415 (1995)), vaccinia virus (Puhlmann M. et al., Human Gene) Therapy 10:649-657 (1999)), reovirus, poxvirus (GCE, NJL, Krupa M, Esteban M., The poxvirus vectors MVA and NYVAC as gene delivery systems for vaccination against infectious diseases and cancer Curr Gene Ther 8 ( 2):97-120(2008)), Semliki Forester Virus, Polymer (Hwang et al., In vitro and In vivo Transfection Efficiency of Human Osteoprotegerin Gene using Non-Viral Polymer Carriers., Korean J. Bone Metab. 13 (2):119-128 (2006)), liposomes (Methods in Molecular Biology, Vol 199, S.C. Basu and M. Basu (Eds.), Human Press 2002), can be applied to nanomaterials or niosomes.

1. 플라스미드1. Plasmids

플라스미드는 세균 세포내에 독립적으로 존재하는 원형의 DNA분자이다. 플라스미드는 거의 항상 하나 이상의 유전자를 가지고 있으며 이들 유전자는 종종 숙주세균에 의해 나타나는 유용한 특징을 담당하고 있다. 예를 들어, 항생제의 정상적인 독성농도에서 생존하는 능력은 항생제 저항성 유전자를 가진 플라스미드가 세균내에 존재하기 때문이다. 실험실에서 이러한 항생제 저항성은 종종 선별 마커(selectable marker)로서 이용된다.Plasmids are circular DNA molecules that exist independently in bacterial cells. Plasmids almost always contain more than one gene, and these genes are often responsible for useful characteristics exhibited by the host bacteria. For example, the ability to survive at normal toxic concentrations of antibiotics is due to the presence of plasmids with antibiotic resistance genes in bacteria. In the laboratory, this antibiotic resistance is often used as a selectable marker.

모든 플라스미드는 복제원점(replication origin; 숙주 세포의 복제효소가 인식할 수 있는 부위를 말하며, 이 부위에서부터 복제가 시작된다.) 역할을 할 수 있는 DNA 서열을 적어도 하나 가지고 있으며, 따라서 주 세균 염색체(main bacterial chromosome)와는 독립적으로 세포내에서 복제할 수 있다. 어떤 유형의 플라스미드는 세균 염색체 안으로 자신을 삽입시킴으로써 복제할 수 있다. 이렇게 통합하는 플라스미드(episome이라 부름)들은 수많은 세포분열 동안 이 형태를 안정적으로 유지할 수 있다. 그러나 어떤 단계에서는 excision(통합되는 과정의 역과정)됨으로써 독립적인 요소로 존재한다.All plasmids have at least one DNA sequence that can serve as an origin of replication (a site recognizable by the replication enzyme of the host cell, from which replication begins), and thus the main bacterial chromosome ( It can replicate in cells independently of the main bacterial chromosome). Some types of plasmids can replicate by inserting themselves into the bacterial chromosome. These integrating plasmids (called episomes) are able to maintain their conformation stably during numerous cell divisions. However, at some stage, it exists as an independent element by excision (the reverse process of the process of being integrated).

Selectable marker란 벡터에 의해 운반된 유전자로서, 이 벡터 또는 재조합 DNA분자를 가진 세포의 특징이 인식될 수 있도록 해주는 유전자를 말한다.A selectable marker is a gene carried by a vector, and refers to a gene that enables recognition of the characteristics of a cell containing this vector or recombinant DNA molecule.

플라스미드의 크기의 범위는 가장 작은 것은 1.0 kb로부터 가장 큰 것은 250 kb 이상까지이다. Copy number란 하나의 세균 세포에서 정상적으로 발견되는 플라스미드의 수를 말한다. Copy number를 조절하는 인자는 잘 이해되지 않았지만, 각 플라스미드는 1~50개 이상의 특징적인 수를 가지고 있다.The size of the plasmid ranges from 1.0 kb for the smallest to more than 250 kb for the largest. Copy number refers to the number of plasmids normally found in one bacterial cell. The factors controlling the copy number are not well understood, but each plasmid has a characteristic number of 1 to 50 or more.

플라스미드가 세균에 널리 분포하고 있긴 하지만 다른 생물체에서도 그렇게 보편적인 것은 결코 아니다. 가장 많이 연구된 진핵세포성 플라스미드(eukaryotic plasmid)는 2㎛ circle로서 효모에 존재한다. 2㎛ 플라스미드의 발견은 이것이 숙주로서 매우 중요한 산업적 생물체의 유전자를 클로닝하기 위한 벡터의 제조를 가능하도록 했기 때문에 매우 운이 좋은 것이었다. 그러나 다른 진핵 생물에서는 플라스미드가 발견되지 않고 있다.Although plasmids are widely distributed in bacteria, they are by no means so common in other organisms. The most studied eukaryotic plasmid exists in yeast as a 2 μm circle. The discovery of the 2 μm plasmid was very fortunate as it made possible the preparation of vectors for cloning the genes of industrial organisms of great importance as hosts. However, no plasmid has been found in other eukaryotes.

2. 아데노바이러스2. Adenovirus

아데노바이러스는 중간 정도의 지놈 크기, 조작의 편의성, 높은 타이터, 광범위한 타깃세포 및 우수한 감염성 때문에 유전자 전달 벡터로서 많이 이용되고 있다. 지놈의 양 말단은 100-200 bp의 ITR (inverted terminal repeat)를 포함하며, 이는 DNA 복제및 패키징에 필수적인 시스 엘리먼트이다. 지놈의 E1 영역(E1A 및 E1B)은 전사 및 숙주 세포 유전자의 전사를 조절하는 단백질을 코딩한다. E2 영역(E2A 및 E2B)은 바이러스 DNA 복제에 관여하는 단백질을 코딩한다. 현재 개발된 아데노바이러스 벡터 중에서, E1 영역이 결여된 복제불능 아데노바이러스가 많이 이용되고 있다. 한편, E3 영역은 통상적인 아데노바이러스 벡터에서 제거되어 외래 유전자가 삽입되는 자리를 제공한다 (Thimmappaya, B. et al., Cell, 31:543-551(1982); 및 Riordan, J. R. et al.,Science, 245:1066-1073(1989)). 따라서, 본 발명의 유전자발현 조절서열은 E1A 유전자의 프로모터 서열 위치에 삽입되어 E1A 유전자의 발현을 조절할 수 있다. 또한, 본 발명의 유전자발현 조절서열-발현 유전자 카세트는 결실된 E1 영역(E1A 영역 및/또는 E1B 영역, 바람직하게는 E1B 영역) 또는 E3 영역에 삽입되는 것이 바람직하고, 보다 바람직하게는 결실된 E1 영역에 삽입된다. 또한, 본 발명의 유전자발현 조절서열-발현 유전자 카세트는 결실된 E4 영역에도 삽입될 수 있다. 본 명세서에서 바이러스 지놈 서열과 관련하여 사용되는 용어, "결실"은 해당 서열이 완전히 결실된 것뿐만 아니라, 부분적으로 결실된 것도 포함하는 의미를 가진다.Adenovirus has been widely used as a gene delivery vector because of its medium genome size, ease of manipulation, high titer, wide range of target cells, and excellent infectivity. Both ends of the genome contain 100-200 bp inverted terminal repeat (ITR), which is an essential cis element for DNA replication and packaging. The E1 regions of the genome (E1A and E1B) encode proteins that regulate transcription and transcription of host cell genes. The E2 region (E2A and E2B) encodes proteins involved in viral DNA replication. Among the currently developed adenovirus vectors, replication-deficient adenoviruses lacking the E1 region are widely used. On the other hand, the E3 region is removed from a conventional adenoviral vector to provide a site for insertion of a foreign gene (Thimmappaya, B. et al., Cell, 31:543-551 (1982); and Riordan, JR et al., Science, 245:1066-1073 (1989)). Therefore, the gene expression control sequence of the present invention can be inserted into the promoter sequence position of the E1A gene to regulate the expression of the E1A gene. In addition, the gene expression control sequence-expression gene cassette of the present invention is preferably inserted into the deleted E1 region (E1A region and/or E1B region, preferably E1B region) or E3 region, more preferably the deleted E1 region inserted into the area. In addition, the gene expression control sequence-expression gene cassette of the present invention can be inserted into the deleted E4 region. As used herein, the term "deletion" in relation to a viral genome sequence has a meaning including a partial deletion as well as a complete deletion of the corresponding sequence.

또한, 아데노바이러스는 야생형 지놈의 약 105%까지 패킹할 수 있기 때문에, 약 2 kb를 추가적으로 패키징할 수 있다(Ghosh-Choudhury et al., EMBO J., 6:1733-1739(1987)). 따라서, 아데노바이러스에 삽입되는 상술한 외래 서열은 아데노바이러스의 지놈에 추가적으로 결합시킬 수도 있다.In addition, since adenovirus can pack up to about 105% of the wild-type genome, it can additionally package about 2 kb (Ghosh-Choudhury et al., EMBO J., 6:1733-1739 (1987)). Accordingly, the above-described foreign sequence inserted into the adenovirus may additionally bind to the genome of the adenovirus.

아데노바이러스에 의해 운반되는 외래 유전자는 에피좀과 동일한 방식으로 복제되며, 이에 숙주세포에 대해 유전적 독성이 매우 낮다. 따라서, 본 발명의 아데노바이러스 유전자 전달 시스템을 이용한 유전자 치료가 매우 안전할 것으로 판단된다.The foreign gene carried by the adenovirus is replicated in the same manner as the episome, and thus has very low genetic toxicity to the host cell. Therefore, it is judged that gene therapy using the adenovirus gene delivery system of the present invention is very safe.

3. 레트로바이러스3. Retrovirus

레트로바이러스는 자신의 유전자를 숙주의 지놈으로 삽입시키고, 대량의 외래 유전 물질을 운반할 수 있으며, 감염시킬 수 있는 세포의 스펙트럼이 넓기 때문에 유전자 전달 벡터로서 많이 이용되고 있다.Retroviruses are widely used as gene delivery vectors because they insert their genes into the host genome, can transport a large amount of foreign genetic material, and have a wide spectrum of cells that can infect.

레트로바이러스 벡터를 구축하기 위하여, 운반하고자 하는 목적 뉴클레오타이드 서열은 레트로바이러스의 서열 대신에 레트로바이러스 지놈에 삽입되어 복제불능의 바이러스를 생산한다. 바이리온을 생산하기 위하여, gag, pol 및 env 유전자를 포함하지만 LTR(long terminal repeat)와 Ψ서열은 없는 패키징 세포주를 구축한다. 운반하고자 하는 목적 뉴클레오타이드 서열, LTR 및 Ψ서열을 포함하는 재조합 플라스미드를 상기 세포주에 이입하면, Ψ서열은 재조합 플라스미드의 RNA 전사체의 생산을 가능하게 하며, 이 전사체는 바이러스로 패키징되고, 바이러스는 배지로 배출된다. 재조합 레트로바이러스를 함유하는 배지를 수집하고 농축하여 유전자 전달 시스템으로 이용한다.In order to construct a retroviral vector, the target nucleotide sequence to be transported is inserted into the retrovirus genome instead of the retrovirus sequence to produce a replication-incompetent virus. To produce the virion, a packaging cell line containing the gag, pol and env genes but lacking the long terminal repeat (LTR) and Ψ sequences was constructed. When a recombinant plasmid containing the target nucleotide sequence to be transported, LTR and Ψ sequence is introduced into the cell line, the Ψ sequence enables production of an RNA transcript of the recombinant plasmid, which is packaged into a virus, and the virus is discharged into the medium. The medium containing the recombinant retrovirus is collected, concentrated and used as a gene delivery system.

2세대 레트로바이러스 벡터를 이용한 유전자 전달이 발표되었다. 몰로니 뮤라인 류케미아 바이러스의 변이체를 제조하였고, 여기에서 EPO(erythropoietin) 서열을 엔벨로프 부위에 삽입하여 새로운 결합 특성을 갖는 키메릭 단백질을 생산하였다. 본 발명의 유전자 전달 시스템도 이와 같은 2세대 레트로바이러스 벡터의 구축 전략에 따라 제조할 수 있다.Gene transfer using a second-generation retroviral vector has been published. A mutant of Moloney murine leukemia virus was prepared, and an EPO (erythropoietin) sequence was inserted into the envelope region to produce a chimeric protein having novel binding properties. The gene delivery system of the present invention can also be prepared according to the construction strategy of the second-generation retroviral vector.

4. AAV 벡터4. AAV Vectors

아데노-관련 바이러스 (AAV)는 비분열 세포을 감염시킬 수 있고, 다양한 종류의 세포에 감염할 수 있는 능력을 갖고 있기 때문에 본 발명의 유전자 전달 시스템으로 적합하다. AAV 벡터의 제조 및 용도에 대한 상세한 설명은 미국 특허 제5,139,941 호 및 제4,797,368 호에 상세하게 개시되어 있다. 유전자 전달 시스템으로서의 AAV에 대한 연구는 LaFace et al, Viology, 162:483486(1988), Zhou et al., Exp. Hematol. (NY), 21:928-933(1993), Walsh et al, J. Clin. Invest., 94:1440-1448(1994) 및 Flotte et al., Gene Therapy, 2:29-37(1995)에 개시되어 있다. 최근에, AAV 벡터는 낭포성 섬유증의 치료제로서 임상 I을 실시하고 있다.Adeno-associated virus (AAV) is suitable as the gene delivery system of the present invention because it can infect non-dividing cells and has the ability to infect various types of cells. Detailed descriptions of the preparation and use of AAV vectors are disclosed in detail in US Pat. Nos. 5,139,941 and 4,797,368. A study of AAV as a gene delivery system is described in LaFace et al, Viology, 162:483486 (1988), Zhou et al., Exp. Hematol. (NY), 21:928-933 (1993), Walsh et al, J. Clin. Invest., 94:1440-1448 (1994) and Flotte et al., Gene Therapy, 2:29-37 (1995). Recently, AAV vectors are being conducted clinically I as a therapeutic agent for cystic fibrosis.

전형적으로, AAV 바이러스는 두 개의 AAV 말단 리피트가 옆에 위치되어 있는 목적의 유전자 서열(릴랙신 유전자 및 운반하고자 하는 목적 뉴클레오타이드 서열을 포함하는 플라스미드 (McLaughlin et al., J. Virol., 62:1963-1973(1988); 및 Samulski et al., J. Virol., 63:3822-3828(1989)) 및 말단 리피트가 없는 야생형 AAV 코딩 서열을 포함하는 발현 플라스미드(McCarty et al., J. Virol., 65:2936-2945( 1991))를 동시 형질주입시켜 제조된다.Typically, the AAV virus is a plasmid (McLaughlin et al., J. Virol., 62:1963) containing the target gene sequence (relaxin gene and the target nucleotide sequence to be transported) flanked by two AAV terminal repeats. 1973 (1988); and Samulski et al., J. Virol., 63:3822-3828 (1989)) and an expression plasmid (McCarty et al., J. Virol. , 65:2936-2945 (1991)).

5. 다른 바이러스 벡터5. Other Virus Vectors

다른 바이러스 벡터들도 본 발명의 유전자 전달 시스템으로 이용할 수 있다. 배시니아 바이러스, 렌티바이러스 또는 헤르페스 심플렉스 바이러스, 리오바이러스, 폭스바이러스, 셈리키 포리스터 바이러스로부터 유래된 벡터들도, 목적 뉴클레오타이드 서열을 세포내로 운반할 수 있는 운반 시스템으로 이용할 수 있다.Other viral vectors can also be used in the gene delivery system of the present invention. Vectors derived from basinia virus, lentivirus or herpes simplex virus, reovirus, poxvirus, and Semliki forester virus can also be used as a delivery system capable of delivering a target nucleotide sequence into a cell.

6. 폴리머6. Polymer

비바이러스성 유전자 전달체로서 폭넓게 사용되는 폴리머계 전달체로는 젤라틴, 키토산, PLL(poly-LLysine) 및 PEI(polyethyleneamine) 등이 이용되고 있다. 폴리머계 유전자 전달체들의 장점은 면역반응과 급성독성의 발현율이 낮고 제조법이 간단하며 대량생산이 가능하다는 점이다.As non-viral gene delivery systems, polymer-based delivery systems widely used include gelatin, chitosan, poly-LLysine (PLL) and polyethyleneamine (PEI). The advantages of polymer-based gene carriers are that the expression rate of immune response and acute toxicity is low, the preparation method is simple, and mass production is possible.

7. 리포좀 및 니오좀7. Liposomes and niosomes

리포좀은 수상에 분산된 인지질에 의해 자동적으로 형성된다. 외래 DNA 분자를 리포좀으로 성공적으로 세포 내로 운반한 예는 Nicolau 및 Sene, Biochim. Biophys. Acta, 721:185-190(1982) 및 Nicolau et al., Methods Enzymol., 149:157-176(1987)에 개시되어 있다. 한편, 리포좀을 이용한 동물세포의 형질주입에 가장 많이 이용되는 시약으로는 Lipofectamine(Gibco BRL)이 있다. 운반하고자 하는 목적 뉴클레오타이드 서열을 내포한 리포좀은 엔도사이토시스, 세포 표면에로의 흡착 또는 플라즈마 세포막과의 융합 등의 기전을 통해 세포와 상호 작용하여 세포내로 운반하고자 하는 목적 뉴클레오타이드 서열을 운반한다.Liposomes are automatically formed by phospholipids dispersed in an aqueous phase. Examples of successful intracellular delivery of foreign DNA molecules as liposomes are described by Nicolau and Sene, Biochim. Biophys. Acta, 721:185-190 (1982) and Nicolau et al., Methods Enzymol., 149:157-176 (1987). Meanwhile, Lipofectamine (Gibco BRL) is the most widely used reagent for transfection of animal cells using liposomes. Liposomes containing the target nucleotide sequence to be transported interact with cells through mechanisms such as endocytosis, adsorption to the cell surface, or fusion with plasma cell membranes to deliver the target nucleotide sequence to be transported into the cell.

리포좀이 인지질을 이용하여 만들어지는 것에 반하여 니오좀(niosome)은 사용하고 비-이온성 계면활성제(nonionic surfactant) 및 콜레스테롤(cholesterol)의 혼합으로 구성된 이중막 수송체로 극성 및 비극성 물질을 봉입할 수 있고, 삼투압적으로 활성이 있으며, 인지질 등에 의한 지질미립자의 운반체인 리포좀에 비하여 안정하고, 또한 제조시 사용되는 계면활성제가 보관 및 취급 시에 특별한 조건이 필요하지 않다는 장점을 가진다.While liposomes are made using phospholipids, niosomes are used and polar and non-polar substances can be encapsulated with a double membrane transporter composed of a mixture of nonionic surfactant and cholesterol. , osmotically active, more stable than liposomes, which are carriers of lipid particles by phospholipids, etc., and also have the advantage that the surfactant used in the preparation does not require special conditions for storage and handling.

8. 나노물질8. Nanomaterials

본 명세서 상의 용어 나노물질은 수 내지 수백 나노미터의 크기를 갖는 생체 적합성 고분자 물질을 의미하는 것으로서, 예를 들면, 폴리에틸렌글리콜(polyetheleneglycol, PEG), 폴리락타이드(poly-lactide, PLA), 폴리글리콜리드(polyglycolide, PGA), 폴리락티드코글리콜리드(poly-lactide-co-glycolide, PLGA), 폴리카프로락톤(poly-ε-carprolactone, PCL), 히알루론산(hyaluronic acid, HA), 키토산(chitosan), 또는 혈청 알부민이 이에 해당할 수 있다.As used herein, the term nanomaterial refers to a biocompatible polymer material having a size of several to hundreds of nanometers, for example, polyethylene glycol (polyetheleneglycol, PEG), polylactide (PLA), polyglycol Lead (polyglycolide, PGA), polylactide-co-glycolide (PLGA), polycaprolactone (poly-ε-carprolactone, PCL), hyaluronic acid (HA), chitosan (chitosan) ), or serum albumin.

한편, 상술한 본 발명의 유전자 전달 시스템을 세포내로 도입하는 방법은 당업계에 공지된 다양한 방법을 통해 실시될 수 있다.Meanwhile, the method of introducing the gene delivery system of the present invention into a cell as described above can be carried out through various methods known in the art.

본 발명에서, 유전자 전달 시스템이 바이러스 벡터에 기초하여 제작된 경우에는, 당업계에 공지된 바이러스 감염 방법에 따라 실시된다. 바이러스 벡터를 이용한 숙주 세포의 감염은 상술한 인용문헌에 기재되어 있다.In the present invention, when the gene delivery system is constructed based on a viral vector, it is carried out according to a viral infection method known in the art. Infection of host cells with viral vectors is described in the references cited above.

본 발명에서 유전자 전달 시스템이 내이키드 (naked) 재조합 DNA 분자 또는 플라스미드인 경우에는, 미세 전환법 (Capecchi, M.R., Cell, 22:479(1980); 및 Harland와 Weintraub, J. Cell Biol. 101:1094-1099(1985)), 칼슘 포스페이트 침전법 (Graham, F.L. et al., Virology, 52:456(1973); 및 Chen과 Okayama, Mol. Cell. Biol. 7:2745-2752(1987)), 전기 천공법 (Neumann, E. et al., EMBO J., 1:841(1982); 및 Tur-Kaspa et al., Mol. Cell Biol., 6:716-718(1986)), 리포좀-매개 형질주입법 (Wong, T.K. et al., Gene, 10:87(1980); Nicolau 및 Sene, Biochim. Biophys. Acta, 721:185-190(1982); 및 Nicolau et al., Methods Enzymol., 149:157-176(1987)), DEAE-덱스트란 처리법 (Gopal, Mol. Cell Biol., 5:1188-1190(1985)), 및 유전자 밤바드먼트(Yang et al., Proc. Natl. Acad. Sci., 87:9568-9572(1990)) 방법에 의해 유전자를 세포내로 이입시킬 수 있다.When the gene delivery system in the present invention is a naked recombinant DNA molecule or plasmid, the microtransformation method (Capecchi, MR, Cell, 22:479 (1980); and Harland and Weintraub, J. Cell Biol. 101: 1094-1099 (1985)), calcium phosphate precipitation (Graham, FL et al., Virology, 52:456 (1973); and Chen and Okayama, Mol. Cell. Biol. 7:2745-2752 (1987)), Electroporation (Neumann, E. et al., EMBO J., 1:841 (1982); and Tur-Kaspa et al., Mol. Cell Biol., 6:716-718 (1986)), liposome-mediated Transfection (Wong, TK et al., Gene, 10:87 (1980); Nicolau and Sene, Biochim. Biophys. Acta, 721:185-190 (1982); and Nicolau et al., Methods Enzymol., 149: 157-176 (1987)), DEAE-dextran treatment (Gopal, Mol. Cell Biol., 5:1188-1190 (1985)), and gene bambadment (Yang et al., Proc. Natl. Acad. Sci) ., 87:9568-9572 (1990)), the gene can be transfected into cells.

Ⅶ. 약학 조성물VII. pharmaceutical composition

본원에 기재된 유전체 편집 RNA/DNA 시스템은 약학 조성물의 형태로 존재할 수 있다. 본 발명에 따른 약학 조성물은 본 발명에 따른 하나 이상의 핵산 분자, 바람직하게는 유전체 편집 RNA/DNA 시스템을 포함할 수 있다. The genome editing RNA/DNA systems described herein may be in the form of a pharmaceutical composition. The pharmaceutical composition according to the present invention may comprise one or more nucleic acid molecules according to the present invention, preferably a genome editing RNA/DNA system.

본 발명에 따른 약학 조성물은 제약상 허용 가능한 희석제및/또는 제약상 허용 가능한 부형제및/또는 제약상 허용 가능한 담체 및/또는 제약상 허용 가능한 운반체를 포함한다. 제약상 허용 가능한 담체, 운반체, 부형제또는 희석제의 선택은 특별히 제한되지 않는다. 당업계에 공지된 임의의 적합한 제약상 허용 가능한 담체, 운반체, 부형제또는 희석제가 사용될 수 있다.A pharmaceutical composition according to the present invention comprises a pharmaceutically acceptable diluent and/or a pharmaceutically acceptable excipient and/or a pharmaceutically acceptable carrier and/or a pharmaceutically acceptable carrier. The choice of a pharmaceutically acceptable carrier, carrier, excipient or diluent is not particularly limited. Any suitable pharmaceutically acceptable carrier, vehicle, excipient or diluent known in the art may be used.

본 발명에서, 약학 조성물은 용매, 예컨대 수성 용매 또는 RNA의 무결성을 보존할 수 있게 하는 임의의 용매를 추가로 포함할 수 있다. 바람직한 일 실시형태에서, 약학 조성물은 RNA를 포함하는 수용액이다.In the present invention, the pharmaceutical composition may further comprise a solvent such as an aqueous solvent or any solvent that makes it possible to preserve the integrity of the RNA. In one preferred embodiment, the pharmaceutical composition is an aqueous solution comprising RNA.

수용액은 선택적으로 용질, 예를 들면, 생리식염수를 포함할 수 있다.The aqueous solution may optionally contain a solute, for example, physiological saline.

본 발명에서, 약학 조성물은 동결 건조된 조성물의 형태이다. 동결 건조된 조성물은 각각의 수성 조성물을 동결 건조시킴으로써 얻을 수 있다.In the present invention, the pharmaceutical composition is in the form of a freeze-dried composition. A freeze-dried composition can be obtained by freeze-drying each aqueous composition.

약학 조성물은 적어도 하나의 양이온성 실체를 포함한다. 일반적으로, 양이온성 지질, 양이온성 중합체 및 양전하를 갖는 다른 물질은 음으로 하전된 핵산과 복합체를 형성할 수 있다. 양이온성 화합물, 바람직하게는 양이온성 또는 폴리양이온성 펩티드 또는 단백질과 같은 폴리양이온성 화합물과의 복합체화에 의해 본 발명에 따른 RNA를 안정화시키는 것이 가능하다. 일 실시형태에서, 본 발명에 따른 약학 조성물은 프로타민, 폴리에틸렌 이민, 폴리-L-리신, 폴리-L-아르기닌, 히스톤 또는 양이온성 지질로 이루어진 군으로부터 선택된 적어도 하나의 양이온성 분자를 포함한다.The pharmaceutical composition comprises at least one cationic entity. In general, cationic lipids, cationic polymers, and other substances having a positive charge can form complexes with negatively charged nucleic acids. It is possible to stabilize the RNA according to the invention by complexation with a cationic compound, preferably a polycationic compound such as a cationic or polycationic peptide or protein. In one embodiment, the pharmaceutical composition according to the present invention comprises at least one cationic molecule selected from the group consisting of protamine, polyethylene imine, poly-L-lysine, poly-L-arginine, histones or cationic lipids.

본 발명에 따르면, 양이온성 지질은 양이온성 양친매성 분자, 예를 들어 하나 이상의 친수성 및 친유성 잔기를 포함하는 분자이다. 양이온성 지질은 모노양이온성 또는 폴리양이온성일 수 있다. 양이온성 지질은 전형적으로 스테롤, 아실 또는 디아실 사슬과 같은 친유성 잔기를 가지며, 전반적인 순 양전하를 갖는다. 지질의 헤드기는 일반적으로 양전하를 띠고 있다. 양이온성 지질은 바람직하게는 1 내지 10가의 양전하, 보다 바람직하게는 1 내지 3 가의 양전하, 및 더욱 바람직하게는 1가의 양전하를 갖는다. 양이온성 지질의 예로는 1,2-디-O-옥타데세닐-3-트리메틸암모늄 프로판 (DOTMA); 디메틸디옥타데실암모늄 (DDAB); 1,2-디올레오일-3-트리메틸암모늄-프로판(DOTAP); 1,2-디올레오일-3-디메틸암모늄-프로판 (DODAP); 1,2-디아실옥시-3-디메틸암모늄 프로판s; 1,2-디알킬옥시-3-디메틸암모늄 프로판; 디옥타데실디메틸 암모늄 클로라이드 (DODAC), 1,2-디미리스토일옥시프로필-1,3-디메틸하이드록시에틸 암모늄 (DMRIE), 및 2,3-디올레오일옥시-N-[2(스페르민 카복사미드)에틸]-N,N-디메틸-1-프로파나뮴 트리플루오로아세테이트 (DOSPA)를 포함하지만, 이에 한정되는 것은 아니다. 양이온성 지질은 또한 1,2-디리놀레일옥시-N,N-디메틸-3-아미노프로판 (DLinDMA)을 포함하는 삼차 아민기를 갖는 지질을 포함한다.According to the present invention, cationic lipids are cationic amphiphilic molecules, for example molecules comprising one or more hydrophilic and lipophilic moieties. Cationic lipids may be monocationic or polycationic. Cationic lipids typically have lipophilic moieties such as sterol, acyl or diacyl chains and have an overall net positive charge. The head group of a lipid is usually positively charged. The cationic lipid preferably has a positive charge of 1 to 10 valences, more preferably 1 to 3 valences, and even more preferably monovalent positive charges. Examples of cationic lipids include 1,2-di-O-octadecenyl-3-trimethylammonium propane (DOTMA); dimethyldioctadecylammonium (DDAB); 1,2-Dioleoyl-3-trimethylammonium-propane (DOTAP); 1,2-Dioleoyl-3-dimethylammonium-propane (DODAP); 1,2-Diacyloxy-3-dimethylammonium propanes; 1,2-dialkyloxy-3-dimethylammonium propane; Dioctadecyldimethyl ammonium chloride (DODAC), 1,2-dimyristoyloxypropyl-1,3-dimethylhydroxyethyl ammonium (DMRIE), and 2,3-dioleoyloxy-N-[2(s) Fermine carboxamide)ethyl]-N,N-dimethyl-1-propanamium trifluoroacetate (DOSPA). Cationic lipids also include lipids having tertiary amine groups, including 1,2-dilinoleyloxy-N,N-dimethyl-3-aminopropane (DLinDMA).

양이온성 지질은 본원에 기재된 바와 같이, 리포좀, 에멀젼 및 리포플렉스와 같은 지질 제형에서 RNA를 제형화하는데 적합하다. 전형적으로 양전하는 적어도 하나의 양이온성 지질에 의해 기여되고 음전하는 RNA에 의해 기여된다. 일 실시형태에서, 약학 조성물은 양이온성 지질 이외에 적어도 하나의 헬퍼 지질을 포함한다. 헬퍼 지질은 중성 또는 음이온성 지질일 수 있다. 헬퍼 지질은 자연성 지질, 예컨대 인지질, 또는 자연성 지질의 유사체, 또는 자연성 지질과 유사하지 않은 완전 합성 지질, 또는 지질 유사 분자일 수 있다. 약학 조성물이 양이온성 지질 및 헬퍼 지질을 모두 포함하는 경우, 양이온성 지질 대 중성 지질의 몰비는 제형의 안정성 등의 관점에서 적절하게 결정될 수 있다.Cationic lipids are suitable for formulating RNA in lipid formulations such as liposomes, emulsions and lipoplexes, as described herein. Typically the positive charge is contributed by the at least one cationic lipid and the negative charge is contributed by the RNA. In one embodiment, the pharmaceutical composition comprises at least one helper lipid in addition to the cationic lipid. Helper lipids may be neutral or anionic lipids. A helper lipid may be a natural lipid, such as a phospholipid, or an analog of a natural lipid, or a fully synthetic lipid that does not resemble a natural lipid, or a lipid-like molecule. When the pharmaceutical composition includes both a cationic lipid and a helper lipid, the molar ratio of the cationic lipid to the neutral lipid may be appropriately determined from the viewpoint of stability of the formulation and the like.

본 발명에 따른 약학 조성물은 프로타민을 포함한다. 본 발명에 따르면, 프로타민은 양이온 담체 제제로서 유용하다. 용어 "프로타민"은 아르기닌이 풍부하고 어류와 같은 동물의 정자 세포에서 체세포 히스톤 대신 DNA와 특히 관련이 있다고 발혀진 비교적 저분자량의 다양한 강염기성 단백질을 지칭한다. 특히, "프로타민"이라는 용어는 어류 정자에서 발견되는 단백질로, 강염기성이며 물에 용해되고 열로 응고되지 않으며 다수의 아르기닌 단량체를 포함하는 단백질을 지칭한다. 본 발명에 따르면, 본원에서 사용되는 "프로타민"이라는 용어는 자연성 또는 생물학적 원천으로부터 수득되거나 유도된 임의의 프로타민 아미노산 서열을 포함하는 것으로, 상기 아미노산 서열 또는 이의 단편의 다합체 형태 및 이의 단편을 포함하는 것을 의미한다. 또한, 이 용어는 인공적이고 특정 목적을 위해 특별히 설계된 것으로, 자연성 또는 생물학적 원천으부터 분리될 수 없는 (합성된) 폴리펩티드를 포함한다.The pharmaceutical composition according to the present invention comprises protamine. According to the present invention, protamine is useful as a cationic carrier agent. The term “protamine” refers to a variety of relatively low molecular weight strongly basic proteins that are rich in arginine and have been found to be particularly related to DNA instead of somatic histones in sperm cells of animals such as fish. In particular, the term "protamine" refers to a protein found in fish sperm, which is strongly basic, soluble in water, not thermally coagulated, and comprising a number of arginine monomers. According to the present invention, the term "protamine" as used herein includes any protamine amino acid sequence obtained or derived from a natural or biological source, including multimeric forms of said amino acid sequence or fragments thereof and fragments thereof. means that The term also includes (synthetic) polypeptides that are artificial and specially designed for a particular purpose and cannot be isolated from natural or biological sources.

본 발명의 조성물은 하나 이상의 보조제를 포함할 수 있다.The compositions of the present invention may include one or more adjuvants.

본 발명에 따른 약학 조성물은 완충될 수 있다(예를 들어, 아세트산염 완충액, 구연산염 완충액, 숙신산염 완충액, 트리스 완충액, 인산염 완충액으로 완충한다).The pharmaceutical composition according to the present invention may be buffered (eg buffered with acetate buffer, citrate buffer, succinate buffer, Tris buffer, phosphate buffer).

유전체 편집 RNA/DNA 시스템-함유 입자Genome Editing RNA/DNA System-Containing Particles

본 발명의 유전체 편집 RNA/DNA 시스템은 RNA와 DNA로 구성되며, 전자는 단일가닥 RNA 절편이며 후자는 환형인 플라스미드이다. 비보호된 RNA의 불안정성 때문에, 본 발명의 유전체 편집 RNA/DNA 시스템을 복합체 형태 또는 캡슐화된 형태로 제공하는 것이 유리하다. 각각의 약학 조성물이 본 발명에 제공된다. The genome editing RNA/DNA system of the present invention is composed of RNA and DNA, wherein the former is a single-stranded RNA fragment and the latter is a circular plasmid. Because of the instability of unprotected RNA, it is advantageous to provide the genome editing RNA/DNA system of the present invention in complex or encapsulated form. Each pharmaceutical composition is provided herein.

특히, 본 발명의 약학 조성물은 핵산-함유 입자, 바람직하게는 유전체 편집 RNA/DNA 시스템-함유 입자를 포함한다. 각각의 약학 조성물은 미립자 제형으로 지칭된다. 본 발명에 따른 미립자 제형에서, 입자는 본 발명에 따른 핵산 및 핵산 전달에 적합한 제약상 허용 가능한 담체 또는 제약상 허용 가능한 운반체를 포함한다. In particular, the pharmaceutical composition of the present invention comprises a nucleic acid-containing particle, preferably a genome editing RNA/DNA system-containing particle. Each pharmaceutical composition is referred to as a particulate formulation. In the particulate formulation according to the invention, the particles comprise a nucleic acid according to the invention and a pharmaceutically acceptable carrier or a pharmaceutically acceptable carrier suitable for delivery of the nucleic acid.

본 발명의 유전체 편집 RNA/DNA 시스템-함유 입자는 예를 들어 단백성 입자 형태 또는 지질-함유 입자 형태일 수 있다. 적합한 단백질 또는 지질은 입자 형성 제제로 지칭된다. The genome editing RNA/DNA system-containing particles of the present invention may be, for example, in the form of protein particles or in the form of lipid-containing particles. Suitable proteins or lipids are referred to as particle forming agents.

본 발명에 따른 RNA/DNA 시스템이 미립자 제형으로 제형화되는 경우, 각 RNA 종(DdRp RNA 발현 카세트, 및 유전체 편집에 적합한 단백질을 코딩하는 RNA와 같은 임의의 부가적인 RNA 종) 및 DNA 종(auto-DdRp 발현구조체 및 유전체 편집 도구 DNA 발현 카세트와 같은 임의의 부가적인 DNA 종)을 미립자 제형으로서 제형화할 수 있다. RNA 종 및 DNA종을 각각의 개별 미립자 제형로 제형화할 수도 있고, 유전체 편집 RNA/DNA 시스템을 하나의 미립자 제형으로 할 수도 있다. When the RNA/DNA system according to the present invention is formulated in a particulate formulation, each RNA species (DdRp RNA expression cassette, and any additional RNA species such as RNA encoding a protein suitable for genome editing) and DNA species (auto -DdRp expression constructs and any additional DNA species such as genome editing tools DNA expression cassettes) can be formulated as particulate formulations. The RNA species and DNA species may be formulated in their respective individual particulate formulations, or the genome editing RNA/DNA system may be formulated in one particulate formulation.

개별 미립자 제형은 별개의 실체로서, 예를 들어 별도의 용기에서 존재할 수 있다. 이러한 제형은 각각의 핵산을 개별적으로 (전형적으로 각각 유전체 편집 RNA/DNA 시스템 함유 용액의 형태로) 입자 형성 제제와 함께 제공하여, 입자의 형성을 가능하게 함으로써 수득할 수 있다. 각각의 입자는 입자가 형성될 때 제공되는 특정 핵산을 독점적으로 함유할 것이다 (개별 미립자 제형).The individual particulate formulations may exist as separate entities, for example in separate containers. Such formulations can be obtained by providing each nucleic acid individually (typically in the form of a solution containing each genome editing RNA/DNA system) with a particle forming agent, thereby allowing the formation of particles. Each particle will exclusively contain the particular nucleic acid provided when the particle is formed (individual particulate formulation).

본 발명에 따른 약학 조성물은 둘 이상의 개별적인 입자 제형을 포함한다. 각각의 약학 조성물은 혼합된 미립자 제형으로 지칭된다. 본 발명에 따른 혼합된 미립자 제형은 개별적인 미립자 제형을 혼합한 후에 상기한 바와 같이 개별 미립자 제형을 따로 따로 형성하여 얻을 수 있다. A pharmaceutical composition according to the present invention comprises two or more individual particle formulations. Each pharmaceutical composition is referred to as a mixed particulate formulation. The mixed particulate formulation according to the present invention can be obtained by mixing the individual particulate formulations and then separately forming the individual particulate formulations as described above.

혼합 단계에 의해, 유전체 편집 RNA/DNA 시스템-함유 입자가 혼합된 집단을 포함하는 하나의 제형이 수득 가능하다 (예컨대 입자의 제1 집단은 본 발명에 따른 DNA 발현 카세트를 함유할 수 있고, 입자의 제2 제형은 본 발명에 따른 RNA 발현 카세트를 함유할 수 있다). 미립자 집단은 개별 미립자 제형의 혼합된 집단을 포함한 하나의 용기 내에 함께 있을 수 있다.By the mixing step, one formulation comprising a mixed population of genome editing RNA/DNA system-containing particles is obtainable (eg a first population of particles may contain a DNA expression cassette according to the present invention, the particles The second formulation of may contain an RNA expression cassette according to the present invention). A population of particulates may be brought together in a container containing a mixed population of individual particulate formulations.

대안적으로, 약학 조성물의 모든 유전체 편집 RNA/DNA 시스템이 조합된 미립자 제형으로서 함께 제형화될 수 있다. 이러한 제형은 모든 유전체 편집 RNA/DNA 시스템의 조합된 제형 (전형적으로 조합된 용액)를 입자-형성 제제와 함께 제공하여, 입자의 형성을 가능하게 함으로써 수득할 수 있다. Alternatively, all genome editing RNA/DNA systems of a pharmaceutical composition may be formulated together as a combined particulate formulation. Such formulations can be obtained by providing a combined formulation (typically a combined solution) of all genome editing RNA/DNA systems together with a particle-forming agent to allow for the formation of particles.

혼합된 미립자 제형과는 대조적으로, 조합된 미립자 제형은 전형적으로 유전체 편집 RNA/DNA 시스템을 포함하는 입자를 포함할 것이다. 조합된 미립자 조성물에서, 유전체 편집 RNA/DNA 시스템이 전형적으로 단일 입자 내에 함께 존재한다.In contrast to mixed particulate formulations, combined particulate formulations will typically include particles comprising a genome editing RNA/DNA system. In a combined particulate composition, the genome editing RNA/DNA system is typically present together in a single particle.

본 발명의 미립자 제형은 나노미립자 제형이다. 이 실시형태에서, 본 발명에 따른 조성물은 나노입자의 형태로 본 발명에 따른 핵산을 포함한다. 나노미립자 제형은 다양한 프로토콜과 다양한 복합 화합물로 얻을 수 있다. 지질, 중합체, 올리고머 또는 양친매체는 나노미립자 제형의 전형적인 성분이다.The particulate formulation of the present invention is a nanoparticulate formulation. In this embodiment, the composition according to the invention comprises a nucleic acid according to the invention in the form of nanoparticles. Nanoparticulate formulations can be obtained with a variety of protocols and with a variety of complex compounds. Lipids, polymers, oligomers or amphiphiles are typical components of nanoparticulate formulations.

용어 "나노입자"는 일반적으로 직경이 1000 나노미터(nm) 이하인 핵산의 전신투여, 특히 비경구 투여에 적합한 입자를 형성하는 직경을 갖는 임의의 입자를 지칭한다. 일 실시형태에서, 나노입자는 평균 직경이 약 50 nm 내지 약 1000 nm, 바람직하게는 약 50 nm 내지 약 400 nm, 바람직하게는 약 100 nm 내지 약 300 nm, 예컨대 약 150 nm 내지 약 200 nm의 범위를 갖는다. 일 실시형태에서, 나노입자는 직경이 약 200 내지 약 700 nm, 약 200 내지 약 600 nm, 바람직하게는 약 250 내지 약 550 nm, 특히 약 300 내지 약 500 nm 또는 약 200 내지 약 400 nm의 범위를 갖는다.The term “nanoparticle” refers to any particle having a diameter that forms a particle suitable for systemic administration, particularly parenteral administration, of a nucleic acid, generally having a diameter of 1000 nanometers (nm) or less. In one embodiment, the nanoparticles have an average diameter of from about 50 nm to about 1000 nm, preferably from about 50 nm to about 400 nm, preferably from about 100 nm to about 300 nm, such as from about 150 nm to about 200 nm. have a range In one embodiment, the nanoparticles have a diameter in the range of from about 200 to about 700 nm, from about 200 to about 600 nm, preferably from about 250 to about 550 nm, in particular from about 300 to about 500 nm or from about 200 to about 400 nm. has

동적 광산란에 의해 측정된 바와 같이, 본원에 기재된 나노입자의 다분산지수(PI)는 0.5이하, 바람직하게는 0.4 이하 또는 더더욱 바람직하게는 0.3 이하이다. "다분산지수"(PI)는 입자 혼합물에서 개별 입자 (예컨대 리포좀)의 균질 또는 불균질적 크기 분포를 측정한 것으로, 혼합물 내의 입자 분포의 폭을 나타낸다. PI는 예를 들어 WO 2013/143555 A1에 기술된 바와 같이 결정될 수 있다.The polydispersity index (PI) of the nanoparticles described herein, as measured by dynamic light scattering, is 0.5 or less, preferably 0.4 or less or even more preferably 0.3 or less. "Polydispersity Index" (PI) is a measure of the homogeneous or heterogeneous size distribution of individual particles (eg, liposomes) in a particle mixture and represents the breadth of the particle distribution within the mixture. The PI can be determined, for example, as described in WO 2013/143555 A1.

"나노미립자 제형" 또는 유사한 용어는 적어도 하나의 나노입자를 함유하는 임의의 미립자 제형를 지칭한다. 나노미립자 조성물은 나노입자의 균일한 집합체이다. 나노미립자 조성물은 리포좀 제형과 같은 지질-함유 약학 제형 또는 에멀젼이다.A “nanoparticulate formulation” or similar term refers to any particulate formulation containing at least one nanoparticle. A nanoparticulate composition is a uniform aggregate of nanoparticles. Nanoparticulate compositions are lipid-containing pharmaceutical formulations or emulsions, such as liposome formulations.

지질-함유 약학 조성물Lipid-Containing Pharmaceutical Compositions

본 발명의 약학 조성물은 적어도 하나의 지질을 포함한다. 바람직하게는, 적어도 하나의 지질은 양이온성 지질이다. 상기 지질-함유 약학 조성물은 본 발명에 따른 핵산을 포함한다. 본 발명에 따른 약학 조성물은 소포, 예를 들어 리포좀에 캡슐화된 유전체 편집 RNA/DNA 시스템을 포함한다. 본 발명에 따른 약학 조성물은 에멀젼의 형태로 유전체 편집 RNA/DNA 시스템을 포함한다. 본 발명에 따른 약학 조성물은 양이온성 화합물과의 복합체 중에 RNA를 포함함으로써, 예를 들어, 소위 리포플렉스 또는 폴리플렉스를 형성한다. 리포좀과 같은 소포 내 유전체 편집 RNA/DNA 시스템의 캡슐화는 예를 들어 지질/유전체 편집 RNA/DNA 시스템 복합체와는 다르다. 예를 들어, 지질/유전체 편집 RNA/DNA 시스템 복합체는 유전체 편집 RNA/DNA 시스템이 예를 들어 미리 형성된 리포좀과 혼합된 경우에 수득된다.The pharmaceutical composition of the present invention comprises at least one lipid. Preferably, the at least one lipid is a cationic lipid. The lipid-containing pharmaceutical composition comprises a nucleic acid according to the present invention. The pharmaceutical composition according to the present invention comprises a genome editing RNA/DNA system encapsulated in a vesicle, for example a liposome. The pharmaceutical composition according to the present invention comprises a genome editing RNA/DNA system in the form of an emulsion. The pharmaceutical composition according to the present invention comprises RNA in a complex with a cationic compound, thereby forming, for example, a so-called lipoplex or polyplex. Encapsulation of genome editing RNA/DNA systems in vesicles such as liposomes differs from, for example, lipid/genome editing RNA/DNA system complexes. For example, a lipid/genome editing RNA/DNA system complex is obtained when the genome editing RNA/DNA system is mixed with, for example, preformed liposomes.

본 발명에 따른 약학 조성물은 소포에 캡슐화된 유전체 편집 RNA/DNA 시스템를 포함한다. 이러한 제형은 본 발명에 따른 특정 미립자 제형이다. 소포는 구형의 껍데기로 감싸진 지질 이중층으로, 작은 공간을 둘러싸고 그 공간을 소포 외부의 공간과 분리한다. 전형적으로, 소포 내의 공간은 수성 공간, 즉 물을 포함한다. The pharmaceutical composition according to the present invention comprises a genome editing RNA/DNA system encapsulated in a vesicle. Such formulations are specific particulate formulations according to the invention. Vesicles are lipid bilayers surrounded by a spherical shell, enclosing a small space and separating it from the space outside the vesicle. Typically, the space within the vesicle contains the aqueous space, ie, water.

전형적으로, 소포외부의 공간은 수성 공간, 즉 물을 포함한다. 지질 이중층은 하나 이상의 지질(소포-형성 지질)에 의해 형성된다. 소포를 둘러싸고 있는 막은 원형질막과 유사한 라멜라 형상이다. Typically, the space outside the vesicle contains the aqueous space, ie, water. The lipid bilayer is formed by one or more lipids (vesicle-forming lipids). The membrane surrounding the vesicle has a lamellar shape similar to the plasma membrane.

본 발명에 따른 소포는 다중 라멜라 소포, 단일 라멜라 소포 또는 이들의 혼합물일 수 있다. 소포 내에 캡슐화될 때, 유전체 편집 RNA/DNA 시스템은 전형적으로 임의의 외부 매질로부터 분리된다. 따라서 그것은 자연성 바이러스의 보호된 형태와 기능적으로 동등한 보호된 형태로 존재한다. 적합한 소포는 본원에 기재된 바와 같은 입자, 특히 나노입자이다.Vesicles according to the invention may be multilamellar vesicles, unilamellar vesicles or mixtures thereof. When encapsulated within a vesicle, the genome editing RNA/DNA system is typically isolated from any external medium. Thus, it exists in a protected form that is functionally equivalent to the protected form of the native virus. Suitable vesicles are particles as described herein, in particular nanoparticles.

예를 들어, 유전체 편집 RNA/DNA 시스템은 리포좀에 캡슐화될 수 있다. 이 실시형태에서, 약학 조성물은 리포좀 제형이거나 이를 포함한다. 리포좀 내의 캡슐화는 전형적으로 RNase 분해로부터 유전체 편집 RNA/DNA 시스템을 보호할 것이다. 리포좀은 일부 외부 유전체 편집 RNA/DNA 시스템을 포함할 수 있지만, 유전체 편집 RNA/DNA 시스템의 적어도 절반(이상적으로는 모두)은 리포좀의 코어 내에 캡슐화된다.For example, a genome editing RNA/DNA system can be encapsulated in liposomes. In this embodiment, the pharmaceutical composition is or comprises a liposomal formulation. Encapsulation in liposomes will typically protect the genome editing RNA/DNA system from RNase degradation. A liposome may contain some exogenous genome editing RNA/DNA system, but at least half (ideally all) of the genome editing RNA/DNA system is encapsulated within the core of the liposome.

리포좀은 종종 인지질과 같은 소포-형성 지질의 하나 이상의 이중층을 가진 미세한 지질 소포이고 약물, 예를 들어 유전체 편집 RNA/DNA 시스템을 캡슐화할 수 있다. 다중 라멜라 소포 (MLV), 소형 단일 라멜라 소포(SUV), 대형 단일 라멜라 소포 (LUV), 입체적으로 안정화된 리포좀 (SSL), 다포체 소포 (MV) 및 대형 다포체 소포 (LMV)뿐만 아니라 당업계에 공지된 다른 이중층 형태를 포함하는 리포좀의 다른 유형을 채용할 수 있으나, 이에 한정되는 것은 아니다. 리포좀의 크기 및 층상도는 제조 방법에 따라 달라질 것이다. 지질이 라멜라 형상, 육방정 및 역상 육방정 형상, 입방 형상, 미셀, 단층으로 구성된 역 미셀을 포함하는, 수성 매질에서 존재할 수 있는 다른 여러 형태의 초분자성 구성이 있다. 또한, 이들 형상들은 DNA 또는 RNA와의 조합으로 수득될 수 있으며, RNA 및 DNA와의 상호작용은 실질적으로 형상 상태에 영향을 줄 수 있다. 이러한 형상은 본 발명의 나노미립자 유전체 편집 RNA/DNA 시스템 제형에 존재할 수 있다.Liposomes are often microscopic lipid vesicles with one or more bilayers of vesicle-forming lipids such as phospholipids and may encapsulate drugs, such as genome editing RNA/DNA systems. multilamellar vesicles (MLV), small unilamellar vesicles (SUV), large unilamellar vesicles (LUV), sterically stabilized liposomes (SSL), polyvesicular vesicles (MV) and large polyvesicular vesicles (LMV) as well as those in the art Other types of liposomes, including other bilayer morphologies known in , may be employed, but are not limited thereto. The size and layering of the liposome will vary depending on the method of preparation. There are several other forms of supramolecular configuration in which lipids can exist in an aqueous medium, including lamellar shapes, hexagonal and inverted hexagonal shapes, cubic shapes, micelles, and inverted micelles composed of monolayers. In addition, these shapes can be obtained in combination with DNA or RNA, and the interaction of RNA and DNA can substantially affect the shape state. Such a shape may be present in the formulation of the nanoparticulate genome editing RNA/DNA system of the present invention.

리포좀은 공지된 표준 방법을 사용하여 형성할 수 있다. 각각의 방법은 역 증발 방법, 에탄올 주입 방법, 탈수-재수화 방법, 초음파 처리 또는 다른 적절한 방법을 포함한다. 리포좀 형성 후, 실질적으로 균질한 크기 범위를 갖는 리포좀 집단을 얻도록 리포좀의 크기를 바꿀 수 있다.Liposomes can be formed using standard known methods. Each method includes a reverse evaporation method, an ethanol injection method, a dehydration-rehydration method, sonication or other suitable method. After liposome formation, the size of the liposomes can be altered to obtain a population of liposomes having a substantially homogeneous size range.

유전체 편집 RNA/DNA 시스템은 적어도 하나의 양이온성 지질을 포함하는 리포좀에 존재한다. 각각의 리포좀은 적어도 하나의 양이온성 지질이 사용하는 경우, 단일 지질 또는 지질의 혼합물로부터 형성될 수 있다. 바람직한 양이온성 지질은 양성자화될 수 있는 질소 원자를 가지며; 바람직하게는, 이러한 양이온성 지질은 삼차 아민기를 갖는 지질이다. 삼차 아민기를 갖는 특히 적합한 지질은 1,2-디리놀레일옥시-N,N-디메틸-3-아미노프로판 (DLinDMA)이다. 일 실시형태에서, 본 발명에 따른 RNA는 리포좀 제형으로 존재한다: RNA를 포함하는 수성 코어를 캡슐화하는 지질 이중층을 갖는 리포좀으로서, 지질 이중층은 pKa가 5.0 내지 7.6의 범위인 바람직하게는 삼차 아민기를 갖는 지질을 포함한다. 삼차 아민기를 갖는 바람직한 양이온성 지질은 DLinDMA (pKa 5.8)를 포함한다. The genome editing RNA/DNA system is present in liposomes comprising at least one cationic lipid. Each liposome may be formed from a single lipid or a mixture of lipids, when at least one cationic lipid is employed. Preferred cationic lipids have a nitrogen atom capable of being protonated; Preferably, such cationic lipids are lipids having tertiary amine groups. A particularly suitable lipid having a tertiary amine group is 1,2-dilinoleyloxy-N,N-dimethyl-3-aminopropane (DLinDMA). In one embodiment, the RNA according to the invention is in a liposomal formulation: a liposome having a lipid bilayer encapsulating an aqueous core comprising RNA, wherein the lipid bilayer has a pKa in the range of 5.0 to 7.6, preferably tertiary amine groups. lipids with A preferred cationic lipid having a tertiary amine group includes DLinDMA (pKa 5.8).

각각의 화합물을 포함하는 리포좀은 특히 유전체 편집 RNA/DNA 시스템의 캡슐화에 적합하여 유전체 편집 RNA/DNA 시스템의 리포좀 전달에 적합하다. 본 발명에 따른 유전체 편집 RNA/DNA 시스템은 리포좀 제형 내에 존재하며, 여기서 리포좀은 적어도 하나의 양이온성 지질을 포함하며, 그 헤드기는 양성자화될 수 있는 적어도 하나의 질소원자(N)를 포함하며, 리포좀 및 RNA는 N:P 비율이 1:1 내지 20:1이다. 본 발명에 따르면, "N:P 비율"은 지질-함유 입자 (예컨대 리포좀)에 포함된 유전체 편집 RNA/DNA 시스템에서의 인원자(P)에 대한 양이온성 지질 중의 질소원자(N)의 몰비를 지칭한다. 1:1과 20:1 사이의 N:P 비율은 리포좀의 순 전하와 척추 세포로의 유전체 편집 RNA/DNA 시스템 전달 효율에 연관됨을 시사하는 것이다.Liposomes comprising each compound are particularly suitable for encapsulation of genome editing RNA/DNA systems, and thus are suitable for liposome delivery of genome editing RNA/DNA systems. The genome editing RNA/DNA system according to the present invention is present in a liposome formulation, wherein the liposome comprises at least one cationic lipid, and the head group comprises at least one protonatable nitrogen atom (N), Liposomes and RNA have an N:P ratio of 1:1 to 20:1. According to the present invention, "N:P ratio" refers to the molar ratio of a nitrogen atom (N) in a cationic lipid to a phosphorus atom (P) in a genome editing RNA/DNA system contained in a lipid-containing particle (eg, a liposome). refers to The N:P ratio between 1:1 and 20:1 suggests that the net charge of liposomes is related to the efficiency of genome editing RNA/DNA system delivery into vertebrate cells.

본 발명에 따른 유전체 편집 RNA/DNA 시스템은 폴리에틸렌 글리콜 (PEG) 부분을 포함하는 적어도 하나의 지질을 포함하는 리포좀 제형에 존재하며, 여기서 유전체 편집 RNA/DNA 시스템가 PEG화된 리포좀 내에 캡슐화되어 PEG 부분이 리포좀의 외부에 존재한다.A genome editing RNA/DNA system according to the present invention is present in a liposome formulation comprising at least one lipid comprising a polyethylene glycol (PEG) moiety, wherein the genome editing RNA/DNA system is encapsulated in a PEGylated liposome such that the PEG moiety is liposome exists outside of

본 발명에 따른 유전체 편집 RNA/DNA 시스템은 리포좀 제형 내에 존재하고,리포좀은 직경이 60-180 nm 범위를 갖는다.The genome editing RNA/DNA system according to the present invention is present in a liposome formulation, and the liposome has a diameter in the range of 60-180 nm.

본 발명에 따른 유전체 편집 RNA/DNA 시스템은 리포좀 제형 내에 존재하고, 유전체 편집 RNA/DNA 시스템-함유 리포좀이 0 또는 음성에 가까운 순 전하를 갖는다.The genome editing RNA/DNA system according to the present invention is present in a liposome formulation, and the genome editing RNA/DNA system-containing liposome has a net charge of zero or close to negative.

본 발명에 따른 유전체 편집 RNA/DNA 시스템은 에멀젼의 형태로 존재한다. 에멀젼은 종래에 RNA 분자와 같은 핵산 분자를 세포에 전달하는 데 사용되는 것으로 기재되어 있다. 본 발명에서 바람직한 것은 수중유형 에멀젼이다. 각각의 에멀젼 입자는 오일 코어 및 양이온성 지질을 포함한다. 보다 바람직한 것은 본 발명에 따른 유전체 편집 RNA/DNA 시스템이 에멀젼 입자와 복합체화된 양이온성 수중유형 에멀젼이다. 에멀젼 입자는 오일 코어 및 양이온성 지질을 포함한다.The genome editing RNA/DNA system according to the present invention is in the form of an emulsion. Emulsions have conventionally been described as being used to deliver nucleic acid molecules, such as RNA molecules, to cells. Preferred in the present invention are oil-in-water emulsions. Each emulsion particle comprises an oil core and a cationic lipid. More preferred is a cationic oil-in-water emulsion in which the genome editing RNA/DNA system according to the present invention is complexed with emulsion particles. The emulsion particles comprise an oil core and a cationic lipid.

양이온성 지질은 음으로 하전된 유전체 편집 RNA/DNA 시스템과 상호작용하여 에멀젼 입자에 유전체 편집 RNA/DNA 시스템을 고정시킨다. 수중유형 에멀젼에서, 에멀젼 입자는 수성 연속 상에 분산된다. 예를 들어, 에멀젼 입자의 평균 직경은 전형적으로 약 80 nm 내지 180nm일 수 있다. The cationic lipid interacts with the negatively charged genome editing RNA/DNA system to immobilize the genome editing RNA/DNA system in the emulsion particles. In oil-in-water emulsions, the emulsion particles are dispersed in an aqueous continuous phase. For example, the average diameter of the emulsion particles may typically be between about 80 nm and 180 nm.

본 발명의 약학 조성물은 양이온성 수중유형 에멀젼이고, 여기서 에멀젼 입자는 오일 코어 및 양이온성 지질을 포함한다. 본 발명에 따른 유전체 편집 RNA/DNA 시스템은 양이온성 지질을 포함하는 에멀젼의 형태로 존재할 수 있고, 에멀젼의 N:P 비율이 적어도 4:1이다. The pharmaceutical composition of the present invention is a cationic oil-in-water emulsion, wherein the emulsion particles comprise an oil core and a cationic lipid. The genome editing RNA/DNA system according to the present invention may be in the form of an emulsion comprising a cationic lipid, wherein the emulsion has an N:P ratio of at least 4:1.

본 발명에 따른 유전체 편집 RNA/DNA 시스템은 양이온성 지질 에멀젼의 형태로 존재할 수 있다. 특히, 조성물은 양이온성 수중유형 에멀젼의 입자와 복합체화된 유전체 편집 RNA/DNA 시스템을 포함할 수 있으며, 여기서 오일/지질의 비율은 적어도 약 8:1 (몰:몰)이다.The genome editing RNA/DNA system according to the present invention may be in the form of a cationic lipid emulsion. In particular, the composition may comprise a genome editing RNA/DNA system complexed with particles of a cationic oil-in-water emulsion, wherein the oil/lipid ratio is at least about 8:1 (mol:mol).

본 발명에 따른 약학 조성물은 리포플렉스의 형태로 유전체 편집 RNA/DNA 시스템을 포함한다. "리포플렉스" 또는 "유전체 편집 RNA/DNA 시스템 리포플렉스"라는 용어는 지질 및 유전체 편집 RNA/DNA 시스템과 같은 핵산의 복합체를 지칭한다. 리포플렉스는 양이온성 (양성 하전된) 리포좀과 음이온성 (음성 하전된) 핵산으로 형성될 수 있다. 양이온성 리포좀은 또한 중성 "헬퍼" 지질을 포함할 수 있다. 가장 간단한 경우에, 리포플렉스는 핵산을 특정 혼합 프로토콜로 리포좀과 혼합함으로써 자발적으로 형성되지만, 다양한 다른 프로토콜이 적용될 수 있다. 양성 하전된 리포좀과 음성 하전된 핵산 사이의The pharmaceutical composition according to the present invention includes a genome editing RNA/DNA system in the form of a lipoplex. The term “lipoplex” or “genomic editing RNA/DNA system lipoplex” refers to a complex of nucleic acids, such as lipids and genome editing RNA/DNA systems. Lipoplexes can be formed of cationic (positively charged) liposomes and anionic (negatively charged) nucleic acids. Cationic liposomes may also contain neutral “helper” lipids. In the simplest case, lipoplexes are formed spontaneously by mixing nucleic acids with liposomes in a specific mixing protocol, although a variety of other protocols can be applied. between positively charged liposomes and negatively charged nucleic acids

정전기적 상호작용이 리포플렉스 형성의 원동력임을 이해할 수 있다. 본 발명에서, 유전체 편집 RNA/DNA 시스템리포플렉스 입자의 순 전하는 0에 가깝거나 음성이다. 유전체 편집 RNA/DNA 시스템 및 리포좀의 전기적-중성 또는 음성 하전된 리포플렉스는 전신 투여 후 세포에서 실질적인 유전체 편집 RNA/DNA 시스템 발현을 유도할 수 있다.It can be understood that the electrostatic interaction is the driving force for lipoplex formation. In the present invention, the net charge of the genome editing RNA/DNA system lipoplex particle is close to zero or negative. Electrically-neutral or negatively charged lipoplexes of genome editing RNA/DNA systems and liposomes can induce substantial genome editing RNA/DNA system expression in cells after systemic administration.

따라서, 본 발명에서, 본 발명에 따른 약학 조성물은 나노입자, 바람직하게는 리포플렉스 나노입자의 형태로 유전체 편집 RNA/DNA 시스템을 포함하며, 여기서 (i) 나노입자 내의 양전하의 수가 나노입자 내의 음전하의 수를 초과하지 않고 및/또는 (ii) 나노입자가 중성 또는 순 음전하를 띠며, 및/또는 (iii) 나노입자에서 음전하에 대한 양전하의 전하 비율이 1.4:1 이하이며, 및/또는 (iv) 나노입자의 제타전위는 0 이하이다. Accordingly, in the present invention, the pharmaceutical composition according to the present invention comprises a genome editing RNA/DNA system in the form of nanoparticles, preferably lipoplex nanoparticles, wherein (i) the number of positive charges in the nanoparticles is the number of negative charges in the nanoparticles. and/or (ii) the nanoparticles are neutral or net negatively charged, and/or (iii) the charge ratio of positive to negative charges in the nanoparticles is 1.4:1 or less, and/or (iv) ) The zeta potential of nanoparticles is 0 or less.

제타전위는 콜로이드성 시스템에서 전기역학적 전위에 대한 과학 용어이다. 본 발명에서, (a) 제타전위 및 (b) 나노입자 내의 유전체 편집 RNA/DNA 시스템에 대한 양이온성 지질의 전하 비율은 계산될 수 있다. 요약하면, 입자의 순 전하가 0 또는 음에 가깝거나 음성인, 정의된 입자 크기를 갖는 나노미립자 리포플렉스 제형인 약학 조성물은 본 발명과 관련하여 바람직한 약학 조성물이다.Zeta potential is the scientific term for the electrodynamic potential in colloidal systems. In the present invention, (a) the zeta potential and (b) the charge ratio of cationic lipids to genome editing RNA/DNA systems in nanoparticles can be calculated. In summary, pharmaceutical compositions that are nanoparticulate lipoplex formulations having a defined particle size in which the net charge of the particles is zero or near negative or negative are preferred pharmaceutical compositions in the context of the present invention.

본 발명에서 해결하고자 하는 목적은 강력한 유전체 편집 능력을 나타내는 특성화된 자가전사 RNA/DNA 시스템을 제공하는 것이며, 본 발명의 자가전사 및/또는 5'캡구조 부가하는 RNA/DNA 시스템은 살아있는 세포 또는 유기체의 특정 유전자좌에 표적화된 유전체 서열 변화를 도입함으로써 유전자 기능을 연구하고 질환을 퇴치하기 위한 강력한 수단이 될 것이다. An object to be solved in the present invention is to provide a characterized self-transcribed RNA/DNA system that exhibits strong genome editing ability, and the RNA/DNA system adding self-transcription and/or 5' cap structure of the present invention is a living cell or organism By introducing targeted genomic sequence changes at specific loci in

도 1은 도 1은 T7 RNAP를 사용한 시험관 내 전사를 위한 프로모터 및 템플릿 DNA 서열의 설계로 프로모터의 이중 가닥 부분은 전사 시작 부위 (+1)에 대해 번호가 매겨지고,
도 2는 박테리오파지 T7, T3, SP6 및 K11에 의해 코딩된 DdRp가 결합하는 프로모터 염기서열 비교한 도면이고,
도 3은 유전체 편집 RNA/DNA 시스템의 기본단위이고,
도 4는 유전체 편집 RNA/DNA 시스템의 기본단위에 의한 구성되는 다양한 시스템의 유형이며
도 5는 핵-비의존성 세포질 내 자가전사를 하는 유전체 편집 RNA/DNA 시스템을 설명하는 도면이고,
도 6은 10,000개 이상의 인간 mRNA의 개시 코돈 주변에서 가장 보존된 염기를 보여주는 서열 로고로 큰 글자는 더 높은 빈도를 나타내며, 8 위치 (-3, Kozak 위치)에서 A와 G의 더 큰 크기와 Kozak 시퀀스의 (+4) 위치에 해당하는 14 위치에서 G가 있으며,
도 7은 <T7 promoter - 5'UTR - T7Pol - muag - A64 - C30 - 히스톤-SL>인 PCR 산물을 pUC19 벡터에 클로닝한 후, 선정된 균주에서 플라스미드를 분리하여 EcoRI/BamHI 제한효소를 처리하여 전기영동한 결과이고,
도 8은 T7 promoter-T7 polymerase 서열을 가지는 상기 제조한 SM_DdRp pUC19 벡터를 주형으로 PCR한 산물을 주형으로 체외전사한 결과이고,
도 9는 제조한 캡된 SM_T7pol mRNA(Native RNA), 캡된 CM/SM_T7pol mRNA(modified RNA) 및 3'말단에 choliterol이 부가된 캡된 CM/SM_T7pol mRNA(modified RNA-choliterol)을 세포배양액에 제조한 RNA를 다양한 시간 동안 처리한 후 RT-PCR하여 in vitro 안정성을 확인한 결과이고,
도 10은 T7 RANP를 포함하는 SM_DdRp DNA 절편를 포함하는 PCR 산물을 pCI-neo 벡터에 클로닝한 후 선정된 균주에서 플라스미드를 분리하여 BglII/HpaI 제한효소를 처리한 후 전기영동한 결과이고,
도 11은 NP868R-T7RNAP를 포함하는 SM_DdRp DNA 절편를 포함하는 PCR 산물을 pCI-neo 벡터에 클로닝한 후 선정된 균주에서 플라스미드를 분리하여 BglII/HpaI 제한효소를 처리한 후 전기영동한 결과이고,
도 12은 관심이 있는 유전체 편집 도구를 코딩하는 DNAge절편을 pCI-neo 벡터에 클로닝한 후 선정된 균주에서 분리된 재조합 pCI-neo 벡터 BglII/HpaI으로 절단하고 겔 전기영동한 이미지로 DNAge 발현 카세트 클론을 선정한 결과이고,
도 13은 DNAge의 표적 유전자의의 표적서열에 대한 DNAsg 구성이고,
도 14는 CRISPR 복합체를 이용하여 여러 개의 포획 대상 핵산 서열을 절단하는데 사용한 각각의 모든 RNA는 포획하고자 하는 영역의 염기 PAM 서열 앞의 18bp를 인식하도록 설계할 수 있으며, 이들을 multiple gRNA 발현 카세트(a), polycistronic tRNA-gRNA DNA 절편(b)으로 제조할 수 있으며,
도 15은 auto_DdRp 및 DNAge 절편의 PCR 증폭 산물을 pShuttle 벡터를 클로닝한 후, 선정된 클론에서 플라스미드를 XhoI/SalI로 절단하고 겔 전기영동을 수행한 이미지이고 auto_DdRp 또는 DNAge 발현 카세트 클론을 선정한 결과이고,
도 16는 선형화 재조합 auto_DdRp 또는 DNAge 발현 카세트를 슈퍼 코일 바이러스 DNA 플라스미드인 pAdEasy-1과 함께 BJ5183 박테리아로 공동 형질 전환하고 선정된 균주에서 재조합 플라스미드를 분리하여 Pac I로 처리하여 전기영동한 결과이고,
도 17는 auto_DdRp 및 DNAge 절편의 PCR 증폭 산물을 pSMPUW 벡터를 클로닝한 후, 선정된 클론에서 플라스미드를 XhoI/SalI로 절단하고 겔 전기영동을 수행한 이미지이고 auto_DdRp 또는 DNAge 발현 카세트 클론을 선정한 결과이고,
도 18은 감자 ALS 유전자의 정확한 수정을 위한 프라임 편집 전략으로 StALS1 및 StALS2 유전자의 변형에 사용되는 PE3 전략의 개략도이고 PAM은 녹색으로, 표적 Proline은 빨간색으로, 표적 염기는 각각 검은 색 별표로 식별되며 pegRNA-StALS 및 sgRNA StALS의 절단 부위는 각각 파란색 또는 자주색 번개로 표시되었다. PBS : 프라이머 결합부위 RT : 역전사 효소.이며,
도 19는 auto_(DdRp+DNAge)절편을 Binary vector(Ti plAsmid)에 클로닝한 후, 선정된 균주에서 재조합 플라스미드를 분리하여 EcoRI/SalI로 절단하고 겔 전기영동한 이미지이고, auto_(DdRp+DNAge) Ti 발현 카세트 클론을 선정한 결과이고,
도 20은 대조군으로 pCI neo 벡터에 관심있는 DNAge를 클로닝한 후, 선정된 균주에서 플라스미드를 분리하여 제한 효소로 절단하고 전기영동한 이미지이고,
도 21은 auto_DdRp의 DdRp가 T7RNAP를 사용한 형질전환 세포에서 T7 polymerase mRNA의 발현을 분석한 결과로, 대조군 pCI-neo_RSV-F@LS에서는 T7 polymerase mRNA의 발현이 없으며, DdRp RNA/RSV-F DNAi@LS 형질전환 세포에서는 형질주입된 5'Cap 구조가 있고 안정화된 DdRp RNA가 세포내에서 천천히 분해되는 것을 확인할 수 있었다, DdRp RNA/auto_DdRp/RSV-F DNAi@LS DdRp RNA/auto_(DdRp/RSV-F DNAi)@LS; auto_(DdRp/RSV-F DNAi) 아데노 발현시스템 또는 auto_(DdRp/RSV-F DNAi) 렌티 발현시스템을 포함하는 auto(+) DdRp 발현시스템이 형질전환된 세포에서는 DdRp RNA 발현 카세트에서 합성되는 최초의 T7 polymerase가 auto_DdRp 발현 카세트의 T7 프로모터에 결합하여 하류지역에 있는 DdRp를 합성하는 자가전사 루프가 작용하여 안정적으로 DdRp를 합성함을 확인할 수 있었으며,
도 22는, auto_DdRp의 DdRp가 T7RNAP를 사용한 형질전환 세포에서 T7 polymerase의 발현을 분석한 결과로 결론적으로, DdRp RNA/RSV-F DNAi@LS인 auto(-) DdRp 발현시스템 그리고 DdRp RNA/auto_DdRp/RSV-F DNAi@LS DdRp RNA/auto_(DdRp/RSV-F DNAi)@LS; auto_(DdRp/RSV-F DNAi) 아데노 발현시스템 또는 auto_(DdRp/RSV-F DNAi) 렌티 발현시스템을 포함하는 auto(+) DdRp 발현시스템이 형질전환된 세포에서 합성되는 T7 polymerase은 세포질 내에서 적어도 72시간 이상 고농도로 유지되는 것이며,
도 23은 본 발명의 유전체 편집 RNA/DNA 시스템을 도입한 세포의 유전체에 대해 T7E1 분석 결과로 (a) RNA-guided 엔도뉴클레아제유전체 편집, (b) DNA-guided 엔도뉴클레아제유전체 편집 (c), M-MLV 역전사 효소와 Cas9 H840A nickase의 융합 단백질예 의한 유전체 편집에 대한 내용이다.
1 shows the design of a promoter and template DNA sequence for in vitro transcription using T7 RNAP, wherein the double-stranded portion of the promoter is numbered relative to the transcription start site (+1);
Figure 2 is a diagram comparing the promoter nucleotide sequence to which DdRp encoded by the bacteriophage T7, T3, SP6 and K11 binds,
3 is a basic unit of a genome editing RNA / DNA system,
4 is a type of various systems constituted by the basic unit of a genome editing RNA/DNA system.
5 is a diagram illustrating a genome editing RNA/DNA system that performs nuclear-independent self-transcription in the cytoplasm;
6 is a sequence logo showing the most conserved bases around the start codon of more than 10,000 human mRNAs. Large letters indicate higher frequencies, and larger sizes of A and G at position 8 (-3, Kozak position) and Kozak There is a G at the 14th position corresponding to the (+4) position of the sequence,
7 shows the <T7 promoter - 5'UTR - T7Pol - muag - A64 - C30 - histone-SL> PCR product was cloned into the pUC19 vector, and then the plasmid was separated from the selected strain and treated with EcoRI / BamHI restriction enzyme. As a result of electrophoresis,
8 is a result of in vitro transcription of the PCR product of the prepared SM_DdRp pUC19 vector having a T7 promoter-T7 polymerase sequence as a template as a template;
9 shows the prepared capped SM_T7pol mRNA (Native RNA), the capped CM/SM_T7pol mRNA (modified RNA), and the capped CM/SM_T7pol mRNA (modified RNA-choliterol) with choliterol added to the 3' end of the prepared RNA in a cell culture medium. It is the result of confirming in vitro stability by RT-PCR after treatment for various times,
Figure 10 is the result of electrophoresis after cloning the PCR product containing the SM_DdRp DNA fragment containing T7 RANP into the pCI-neo vector, separating the plasmid from the selected strain and treating with BglII / HpaI restriction enzyme;
Figure 11 is the result of electrophoresis after cloning the PCR product containing the SM_DdRp DNA fragment containing NP868R-T7RNAP into the pCI-neo vector, and then separating the plasmid from the selected strain and treating with BglII / HpaI restriction enzyme;
12 is a DNAge expression cassette clone as an image obtained by cloning a DNAge fragment encoding a genome editing tool of interest into a pCI-neo vector, digesting it with a recombinant pCI-neo vector BglII/HpaI isolated from a selected strain, and gel electrophoresis. is the result of selecting
13 is a DNAsg configuration for the target sequence of the target gene of the DNAge,
14 shows that each and every RNA used to cut several capture target nucleic acid sequences using the CRISPR complex can be designed to recognize 18 bp in front of the base PAM sequence of the region to be captured, and these are multiple gRNA expression cassettes (a) , can be prepared as a polycistronic tRNA-gRNA DNA fragment (b),
15 is an image obtained by cloning the PCR amplification product of auto_DdRp and DNAge fragment into pShuttle vector, cutting the plasmid in the selected clone with XhoI/SalI, and performing gel electrophoresis.
Figure 16 is the result of co-transformation of the linearized recombinant auto_DdRp or DNAge expression cassette with pAdEasy-1, a supercoil virus DNA plasmid, into BJ5183 bacteria, isolating the recombinant plasmid from the selected strain, treating it with Pac I, and electrophoresis;
17 is an image obtained by cloning the PCR amplification product of auto_DdRp and DNAge fragment into pSMPUW vector, cutting the plasmid with XhoI/SalI in the selected clone and performing gel electrophoresis, and is the result of selecting auto_DdRp or DNAge expression cassette clone;
18 is a schematic diagram of the PE3 strategy used for modification of the StALS1 and StALS2 genes as a prime editing strategy for correct modification of the potato ALS gene, with PAM in green, target Proline in red, and target bases identified by black asterisks, respectively. The cleavage sites of pegRNA-StALS and sgRNA StALS were marked with blue or purple lightning, respectively. PBS: primer binding site RT: reverse transcriptase,
Figure 19 is an image of auto_(DdRp + DNAge) fragment cloned into a binary vector (Ti plAsmid), separated from the selected strain, cut with EcoRI / SalI, and gel electrophoresed, auto_ (DdRp + DNAge) It is the result of selecting the Ti expression cassette clone,
Figure 20 is an image obtained by cloning the DNAge of interest into the pCI neo vector as a control, separating the plasmid from the selected strain, cutting with a restriction enzyme, and electrophoresis;
Figure 21 is the result of analyzing the expression of T7 polymerase mRNA in DdRp of auto_DdRp transformed cells using T7RNAP, there is no expression of T7 polymerase mRNA in the control pCI-neo_RSV-F@LS, DdRp RNA/RSV-F DNAi@ In LS transformed cells, it was confirmed that the transfected 5'Cap structure and the stabilized DdRp RNA were slowly degraded in the cell, DdRp RNA/auto_DdRp/RSV-F DNAi@LS DdRp RNA/auto_(DdRp/RSV- F DNAi)@LS; In cells transformed with the auto(+) DdRp expression system including the auto_(DdRp/RSV-F DNAi) adeno expression system or the auto_(DdRp/RSV-F DNAi) lenti expression system, the first It was confirmed that T7 polymerase binds to the T7 promoter of the auto_DdRp expression cassette and stably synthesizes DdRp through the action of the self-transcription loop synthesizing DdRp in the downstream region.
22 is a result of analyzing the expression of T7 polymerase in DdRp of auto_DdRp transformed cells using T7RNAP. As a result, DdRp RNA/RSV-F DNAi@LS auto(-) DdRp expression system and DdRp RNA/auto_DdRp/ RSV-F DNAi@LS DdRp RNA/auto_(DdRp/RSV-F DNAi)@LS; T7 polymerase synthesized in cells transformed with an auto_(DdRp/RSV-F DNAi) adeno expression system or an auto(+) DdRp expression system including an auto_(DdRp/RSV-F DNAi) lenti expression system is at least in the cytoplasm. It is maintained at a high concentration for more than 72 hours,
23 shows the results of T7E1 analysis of the genome of a cell into which the genome editing RNA/DNA system of the present invention is introduced, (a) RNA-guided endonuclease genome editing, (b) DNA-guided endonuclease genome editing ( c), The contents of genome editing by fusion protein example of M-MLV reverse transcriptase and Cas9 H840A nickase.

이하, 본 발명을 하기 실시예를 통하여 보다 상세하게 설명한다. 그러나 이들 실시예는 본 발명을 예시적으로 설명하기 위한 것으로 본 발명의 범위가 이들 실시예만으로 한정되는 것은 아니다.Hereinafter, the present invention will be described in more detail through the following examples. However, these examples are for illustrative purposes only, and the scope of the present invention is not limited to these examples only.

실시예 1. 자가전사 RNA/DNA 시스템 설계 및 제조Example 1. Design and manufacture of self-transcribed RNA/DNA system

본 발명에서 제안하는 유전체 편집 시스템을 제조하기 위해서, <도 3>에 제시한 내용처럼, 코딩하는 RNA 발현 카세트 및 상기 DdRp에 의해 전사되고 유전체 편집 도구를 코딩하는 DNAge 발현 카세트를 제조하였다. 상기 DNAge 발현 카세트는 표적화 엔도뉴클레아제를 코딩하는 DNAen 발현 카세트와 가이드 핵산, sgRNA를 코딩하는 DNAsg 발현 카세트로 구성되며 이들은 단일 플라스미드에 있거나 각각 독립적인 플라스미드에 존재할 수 있다.In order to prepare the genome editing system proposed in the present invention, as shown in <FIG. 3>, a coding RNA expression cassette and a DNAge expression cassette transcribed by the DdRp and encoding a genome editing tool were prepared. The DNAge expression cassette is composed of a DNAen expression cassette encoding a targeting endonuclease and a DNAsg expression cassette encoding a guide nucleic acid and sgRNA, which may be present on a single plasmid or on separate plasmids.

또한 여기서 pT7/T7 polymerase system에 의해 DdRP가 전사되는 auto_DdRp 발현 카세트를 추가하였다. In addition, an auto_DdRp expression cassette into which DdRP is transcribed by the pT7/T7 polymerase system was added here.

본 발명의 유전체 편집 RNA/DNA 시스템은 <표 1>에 있는 DdRp에서 단일 서브유닛으로 구성된 DdRp인 T7 RNA 폴리머라제(Gene ID: 1261050), T3 RNA 폴리머라제(Gene ID: 14675519) 및 SP6 RNA 폴리머라제(Gene ID: 19685893)를 이용하여 핵-비의존 지속적 유전체 편집 도구 세포질 발현이 가능한 RNA/DNA 시스템을 다음과 같이 제조하였다. 이들에 상응하는 프로모터 염기서열은 <도 2>와 같다.The genome editing RNA/DNA system of the present invention is a DdRp composed of a single subunit in the DdRp shown in <Table 1>, T7 RNA polymerase (Gene ID: 1261050), T3 RNA polymerase (Gene ID: 14675519) and SP6 RNA polymer An RNA/DNA system capable of nuclear-independent continuous genome editing tool cytoplasmic expression using Rase (Gene ID: 19685893) was prepared as follows. The promoter sequences corresponding to them are shown in <Fig. 2>.

<도 4>에서처럼, 본 발명에서 캡된 DdRp RNA 발현 카세트 및 DNAge 발현 카세트로 구성된 유전체 편집 RNA/DNA 시스템 1; 캡된 DdRp RNA 발현 카세트, auto_DdRp 발현 카세트 및 DNAge 발현 카세트로 구성된 유전체 편집 RNA/DNA 시스템 2; 및 캡된 DdRp RNA 발현 카세트 및 auto_DdRp+DNAge 발현 카세트로 구성된 유전체 편집 RNA/DNA 시스템 3이 있으며, 전자 1개와 리포좀 전달체를 auto(-)_mRNAi@LS, 후자 2개와 리포좀 전달체를 auto_mRNAi@LSdl라고 하였다.As in <Fig. 4>, genome editing RNA/DNA system 1 composed of a DdRp RNA expression cassette and a DNAge expression cassette capped in the present invention; genome editing RNA/DNA system 2 consisting of a capped DdRp RNA expression cassette, an auto_DdRp expression cassette and a DNAge expression cassette; and a genome editing RNA/DNA system 3 consisting of a capped DdRp RNA expression cassette and an auto_DdRp+DNAge expression cassette.

본 발명의 RNA/DNA 시스템 1과 리포좀의 복합체인 auto(-)_DNAge@LS는 안정화된 캡된 DdRp mRNA를 포함하는 DdRp RNA 발현 카세트에서 반복적으로 합성되는 T7 폴리머라제가 세포질 내에서 장기간 고농도로 유지되고 반복적으로 DdRp RNA 발현 카세트의 T7 promoter에 결합함으로써 유전체 편집 도구의 발현이 장기간 지속적으로 유지할 수 있다. Auto(-)_DNAge@LS, a complex of RNA/DNA system 1 and liposomes of the present invention, is a T7 polymerase repeatedly synthesized from a DdRp RNA expression cassette containing a stabilized capped DdRp mRNA, and is maintained at a high concentration for a long time in the cytoplasm. By repeatedly binding to the T7 promoter of the DdRp RNA expression cassette, the expression of the genome editing tool can be maintained continuously for a long period of time.

본 발명의 상기 RNA/DNA 시스템 2 및 상기 RNA/DNA 시스템 3로 구성된 DdRp 자가전사 루프 시스템을 "pT7/T7 polymerase system"이라고 하였다.The DdRp self-transcription loop system composed of the RNA/DNA system 2 and the RNA/DNA system 3 of the present invention was referred to as "pT7/T7 polymerase system".

<도 5에서처럼, 본 발명의 RNA/DNA 시스템 2 또는 RNA/DNA 시스템 3과 리포좀의 복합체인 auto_DNAge@LS는 초기에 안정화된 캡된 DdRp mRNA를 포함하는 DdRp RNA 발현 카세트에서 합성되는 T7 폴리머라제에 의한 auto_DdRp 발현 카세트 또는 auto_(DdRp+DNAge) 발현 카세트의 T7 promoter에 결합함으로써 T7 polymerase는 자가전사 결과로 세포질 내에서 장기간 고농도로 유지되며 상기 T7 polymerase는 반복적으로 DNAge 발현 카세트의 T7 promoter에 결합함으로써 유전체 편집 도구 발현이 장기간 지속적으로 유지할 수 있다. <As shown in FIG. 5, auto_DNAge@LS, a complex of RNA/DNA system 2 or RNA/DNA system 3 of the present invention and a liposome, was initially synthesized from a DdRp RNA expression cassette containing a capped DdRp mRNA stabilized by T7 polymerase. By binding to the T7 promoter of the auto_DdRp expression cassette or the auto_(DdRp+DNAge) expression cassette, T7 polymerase is maintained at a high concentration in the cytoplasm for a long time as a result of autotranscription, and the T7 polymerase repeatedly binds to the T7 promoter of the DNAge expression cassette for genome editing. Tool expression can be maintained continuously for a long time.

본 발명의 자가전사 RNA/DNA 시스템에서 DNA 발현 카세트를 바이러스 시스템을 사용하는 경우는 DdRp 결합 프로모터와 발현 RNA를 코딩하는 바이러스 발현 카세트와 DdRp RNA 발현 카세트를 나누어 제작할 수 있으며 독립적으로 형질주입할 수도 있다. 먼저 상기 렌티바이러스 발현 카세트를 주입하고 안정된 형질전환 세포를 선정하고 DdRp RNA 발현 카세트를 형질주입할 수 있다. 또는 상기 아데노바이러스 발현 카세트를 주입하고 DdRp RNA 발현 카세트를 형질주입할 수 있다.In the case of using a viral system for the DNA expression cassette in the self-transcription RNA/DNA system of the present invention, the viral expression cassette encoding the DdRp-binding promoter and the expression RNA and the DdRp RNA expression cassette can be divided and produced, and can be independently transfected. . First, the lentivirus expression cassette is injected, stable transformed cells can be selected, and the DdRp RNA expression cassette can be transfected. Alternatively, the adenovirus expression cassette may be injected and the DdRp RNA expression cassette may be transfected.

본 발명의 자가전사 RNA/DNA 시스템이 바이러스 발현 카세트를 사용하는 경우에도 초기에 안정화된 캡된 DdRp mRNA를 포함하는 DdRp RNA 발현 카세트에서 합성되는 최초의 T7 폴리머라제에 의한 auto_DdRp 발현 카세트 또는 auto_(DdRp+DNAge) 발현 카세트의 T7 promoter에 결합함으로써 T7 polymerase는 자가전사 결과로 세포질 내에서 장기간 고농도로 유지되며 상기 T7 polymerase는 반복적으로 DNAge 발현 카세트의 T7 promoter에 결합함으로써 표적 mRNA 발현이 장기간 안정적으로 유지할 수 있다. Even when the self-transcribed RNA/DNA system of the present invention uses a viral expression cassette, the first T7 polymerase synthesized auto_DdRp expression cassette or auto_(DdRp+ By binding to the T7 promoter of the DNAge) expression cassette, T7 polymerase is maintained at a high concentration for a long time in the cytoplasm as a result of autotranscription, and the T7 polymerase repeatedly binds to the T7 promoter of the DNAge expression cassette, thereby maintaining stable target mRNA expression for a long time. .

1-1. DdRp RNA 발현 카세트의 제조 1-1. Preparation of DdRp RNA Expression Cassettes

본 발명의 DdRp RNA 발현 카세트를 제조하기 위해, T7 polymerase ORF를 제조할 수 있는 T7 프로모터가 있는 DdRp DNA를 설계하고 제작하여 pUC19 클로닝 벡터에 재조합하고, 재조합 pUC19 벡터에서 얻은 T7 프로모터가 있는 DdRp DNA를 주형으로 체외전사한 후, 5′Cap 구조를 부가하였다.In order to prepare the DdRp RNA expression cassette of the present invention, a DdRp DNA having a T7 promoter capable of producing a T7 polymerase ORF was designed and manufactured, and the DdRp DNA having a T7 promoter obtained from the recombinant pUC19 vector was recombined into a pUC19 cloning vector. After in vitro transcription with a template, a 5'Cap structure was added.

<DdRp DNA 설계 및 제조><DdRp DNA Design and Manufacturing>

본 발명의 DdRp DNA는 DdRp mRNA를 효율적으로 합성할 수 있는 DNA 절편으로 <T7 프로모터 다음에 5'UTR, DdRp를 코딩하는 DNA 절편, 3'UTR>로 구성된 DNA 절편을 설계하였다.The DdRp DNA of the present invention is a DNA fragment capable of efficiently synthesizing DdRp mRNA, and a DNA fragment consisting of <T7 promoter followed by 5'UTR, DdRp-encoding DNA fragment, 3'UTR> was designed.

본 발명의 SM_DdRp DNA에서 T7 polymerase 유전자는 pUC19 벡터에서 T7 promoter와 5'UTR의 하류에 위치하면서, 동시에 muag (mutated alpha-globin-3′UTR), A64 폴리(A) 서열, 폴리(C) 서열(C30) 및 히스톤 스템-루프 서열(히스톤-SL)서열의 상류에 위치하게 하였다. SM_DdRp DNA 구조는 <T7 promoter - 5'UTR - T7Pol - muag - A64 - C30 - 히스톤-SL>일 수도 있다. In the SM_DdRp DNA of the present invention, the T7 polymerase gene is located downstream of the T7 promoter and 5'UTR in the pUC19 vector, and at the same time muag (mutated alpha-globin-3'UTR), A64 poly(A) sequence, poly(C) sequence (C30) and histone stem-loop sequence (histone-SL) upstream of the sequence. The SM_DdRp DNA structure may be <T7 promoter - 5'UTR - T7Pol - muag - A64 - C30 - histone-SL>.

바람직하게, 상기 DdRp에 핵국지화신호(Nuclear localization signals, NLS)가 위치할 수도 있다. NLS가 없는 DdRp는 대부분 세포질에 남아있는 반면, NLS를 포함하는 단백질은 핵에 국한하여 분포한다. NLS가 없는 DdRp는 세포질 또는 NLS를 포함하는 하이브리드 DdRp는 핵에서 효소적으로 활성화되어 염색체 또는 플라스미드 DNA에 배치된 T7 프로모터에서 선택적으로 전사를 시작하고 특정 3'UTR에서 중지할 수 있다. Preferably, nuclear localization signals (NLS) may be located in the DdRp. DdRp without NLS mostly remains in the cytoplasm, whereas protein containing NLS is localized in the nucleus. DdRp without NLS can be activated enzymatically in the cytoplasm or hybrid DdRp with NLS in the nucleus to selectively start transcription at the T7 promoter placed in chromosomal or plasmid DNA and stop at a specific 3'UTR.

상기 SM_DdRp DNA 절편의 구성하는 단위 요소들의 염기서열은 다음과 같다. The base sequence of the unit elements constituting the SM_DdRp DNA fragment is as follows.

상기 5*?**?*UTR는 Kozak 컨센서스를 포함한다.The 5*?**?*UTR includes the Kozak consensus.

Kozak 컨센서스 서열 ACCAUGG (서열번호 31). Kozak consensus sequence ACCAUGG (SEQ ID NO: 31).

<도 6>는 그림은 10,000 개 이상의 인간 mRNA의 개시 코돈 주변에서 가장 보존된 염기를 보여주는 서열 로고이다. 큰 글자는 더 높은 빈도를 나타내며, 8 위치 (-3, Kozak 위치)에서 A와 G의 더 큰 크기와 Kozak 시퀀스의 (+4) 위치에 해당하는 14 위치에서 G가 있다.Figure 6 is a sequence logo showing the most conserved bases around the start codon of more than 10,000 human mRNAs. Large letters indicate a higher frequency, with a larger size of A and G at position 8 (-3, Kozak position) and a G at position 14 corresponding to the (+4) position of the Kozak sequence.

본 발명의 목적에 따라 NLS(SV40 NLS, PKKKRKVEDPYC)을 Bacteriophage T7 RNA Polymerase(T7Pol)의 N 및 C-말단에 부가할 수도 있다. N-말단 부가는 시작코돈 AUG에 다음에 NLS 염기서열을 위치하도록 하며, C-말단 부가는 종결코돈 UAA 앞에 NLS 염기서열을 위치하도록 하였다.For the purposes of the present invention, NLS (SV40 NLS, PKKKRKVEDPYC) may be added to the N and C-terminus of Bacteriophage T7 RNA Polymerase (T7Pol). The N-terminal addition placed the NLS sequence after the start codon AUG, and the C-terminal addition placed the NLS sequence before the stop codon UAA.

SV40 NLS sequence: 5′-CCG AAG AAG AAG CGA AAG GTC-3′ (서열번호 32),SV40 NLS sequence: 5′-CCG AAG AAG AAG CGA AAG GTC-3′ (SEQ ID NO: 32),

본 발명에서 선택된 DdRP의 일종, Bacteriophage T7 RNA Polymerase(T7Pol)의 ORF의 염기서열은 서열번호 33과 같다.The nucleotide sequence of the ORF of Bacteriophage T7 RNA Polymerase (T7Pol), a type of DdRP selected in the present invention, is as shown in SEQ ID NO: 33.

Bacteriophage T7 RNA Polymerase(T7Pol): Bacteriophage T7 RNA Polymerase (T7Pol):

ATGAACACGA TTAACATCGC TAAGAACGAC TTCTCTGACA TCGAACTGGC TGCTATCCCG 60 ATGAACACGA TTAACATCGC TAAGAACGAC TTCTCTGACA TCGAACTGGC TGCTATCCCG 60

TTCAACACTC TGGCTGACCA TTACGGTGAG CGTTTAGCTC GCGAACAGTT GGCCCTTGAG 120 TTCAACACTC TGGCTGACCA TTACGGTGAG CGTTTAGCTC GCGAACAGTT GGCCCTTGAG 120

CATGAGTCTT ACGAGATGGG TGAAGCACGC TTCCGCAAGA TGTTTGAGCG TCAACTTAAA 180 CATGAGTCTT ACGAGATGGG TGAAGCACGC TTCCGCAAGA TGTTTGAGCG TCAACTTAAA 180

GCTGGTGAGG TTGCGGATAA CGCTGCCGCC AAGCCTCTCA TCACTACCCT ACTCCCTAAG 240 GCTGGTGAGG TTGCGGATAA CGCTGCCGCC AAGCCTCTCA TCACTACCCT ACTCCCTAAG 240

ATGATTGCAC GCATCAACGA CTGGTTTGAG GAAGTGAAAG CTAAGCGCGG CAAGCGCCCGA 300 ATGATTGCAC GCATCAACGA CTGGTTTGAG GAAGTGAAAG CTAAGCGCGG CAAGCGCCCGA 300

CAGCCTTCCA GTTCCTGCAA GAAATCAAGC CGGAAGCCGT AGCGTACAT CACCATTAAG 360 CAGCCTTCCA GTTCCTGCAA GAAATCAAGC CGGAAGCCGT AGCGTACAT CACCATTAAG 360

ACCACTCTGG CTTGCCTAAC CAGTGCTGAC AATACAACCG TTCAGGCTGT AGCAAGCGCA 420 ACCACTCTGG CTTGCCTAAC CAGTGCTGAC AATACAACCG TTCAGGCTGT AGCAAGCGCA 420

ATCGGTCGGG CCATTGAGGA CGAGGCTCGC TTCGGTCGTA TCCGTGACCT TGAAGCTAAG 480 ATCGGTCGGG CCATTGAGGA CGAGGCTCGC TTCGGTCGTA TCCGTGACCT TGAAGCTAAG 480

CACTTCAAGA AAAACGTTGA GGAACAACTC AACAAGCGCG TAGGGCACGT CTACAAGAAA 540 CACTTCAAGA AAAACGTTGA GGAACAACTC AACAAGCGCG TAGGGCACGT CTACAAGAAA 540

AAGTTGTCGA GGCTGACATG CTCTCTAAGG GTCTACTCGG TGGCGAGGCG TGGCGAGGCG 600 AAGTTGTCGA GGCTGACATG CTCTCTAAGG GTCTACTCGG TGGCGAGGCG TGGCGAGGCG 600

TGGTCTTCGT GGCATAAGGA AGACTCTATT CATGTAGGAG TACGCTGCAT CGAGATGCTC 660 TGGTCTTCGT GGCATAAGGA AGACTCTATT CATGTAGGAG TACGCTGCAT CGAGATGCTC 660

ATTGAGTCAA CCGGAATGGT TAGCTTACAC CGCCAAAATG CTGGCGTAGT AGGTCAAGAC 720 ATTGAGTCAA CCGGAATGGT TAGCTTACAC CGCCAAAATG CTGGCGTAGT AGGTCAAGAC 720

TCTGAGACTA TCGAACTCGC ACCTGATACG CTGAGGCTA TCGCAACCCG TGCAGGTGCG 780 TCTGAGACTA TCGAACTCGC ACCTGATACG CTGAGGCTA TCGCAACCCG TGCAGGTGCG 780

CTGGCTGGCA TCTCTCCGAT GTTCCAACCT TGCGTAGTTC CTCCTAAGCC GTGGACTGGC 840 CTGGCTGGCA TCTCTCCGAT GTTCCAACCT TGCGTAGTTC CTCCTAAGCC GTGGACTGGC 840

ATTACTGGTG GTGGCTATTG GGCTAACGGT CGTCGTCCTC TGGCGCTGGT GCGTACTCAC 900 ATTACTGGTG GTGGCTATTG GGCTAACGGT CGTCGTCCTC TGGCGCTGGT GCGTACTCAC 900

AGTAAGAAAG CACTGATGCG CTACGAGACG TTTACATGC CTGAGGTGTA CAAAGCGATT 960 AGTAAGAAAG CACTGATGCG CTACGAGACG TTTACATGC CTGAGGTGTA CAAAGCGATT 960

AACATTGCGC AAAACACCGC ATGGAAAATC AACAAGAAAG TCCTAGCGGT CGCCAACGTA 1020 AACATTGCGC AAAACACCGC ATGGAAAATC AACAAGAAAG TCCTAGCGGT CGCCAACGTA 1020

ATCACCAAGT GGAAGCATTG TCCGGTCGAG GACATCCCTG CGATTGAGCG TGAAGAACTC 1080 ATCACCAAGT GGAAGCATTG TCCGGTCGAG GACATCCCTG CGATTGAGCG TGAAGAACTC 1080

CCGATGAAAC CGGAAGACAT CGACATGAAT CCTGAGGCTC TCACCGCGTG GAAACGTGCT 1140 CCGATGAAAC CGGAAGACAT CGACATGAAT CCTGAGGCTC TCACCGCGTG GAAACGTGCT 1140

GCCGCTGCTG TGTACCGCAA GGACAAGGCT CGCAAGTCTC GCCGTATCAG CCTTGAGTTC 1200 GCCGCTGCTG TGTACCGCAA GGACAAGGCT CGCAAGTCTC GCCGTATCAG CCTTGAGTTC 1200

ATGCTTGAGC AAGCCAATAA GTTTGCTAAC CATAAGGCCA TCTGGTTCCC TTACAACATG 1260 ATGCTTGAGC AAGCCAATAA GTTTGCTAAC CATAAGGCCA TCTGGTTCCC TTACAACATG 1260

GACTGGCGCG GTCGTGTTTA CGCTGTGTCA ATGTTCAACC CGCAAGGTAA CGATATGACC 1320 GACTGGCGCG GTCGTGTTTA CGCTGTGTCA ATGTTCAACC CGCAAGGTAA CGATATGACC 1320

AAAGGACTGC TTACGCTGGC GAAAGGTAAA CCAATCGGTA AGGAAGGTTA CTACTGGCTG 1380 AAAGGACTGC TTACGCTGGC GAAAGGTAAA CCAATCGGTA AGGAAGGTTA CTACTGGCTG 1380

AAAATCCACG GTGCAAACTG TGCGGGTGTC GATAAGGTTC CGTTCCCTGA GCGCATCAAG 1420 AAAATCCACG GTGCAAACTG TGCGGGTGTC GATAAGGTTC CGTTCCCTGA GCGCATCAAG 1420

TTCATTGAGG AAAACCACGA GAACATCATG GCTTGCGCTA AGTCTCCACT GGAGAACACT 1480 TTCATTGAGG AAAACCACGA GAACATCATG GCTTGCGCTA AGTCTCCACT GGAGAACACT 1480

TGGTGGGCTG AGCAAGATTC TCCGTTCTGC TTCCTTGCGT TCTGCTTTGA GTACGCTGGG 1540 TGGTGGGCTG AGCAAGATTC TCCGTTCTGC TTCCTTGCGT TCTGCTTTGA GTACGCTGGG 1540

GTACAGCACC ACGGCCTGAG CTATAACTGC TCCCTTCCGC TGGCGTTTGA CGGGTCTTGC 1620 GTACAGCACC ACGGCCTGAG CTATAACTGC TCCCTTCCGC TGGCGTTTGA CGGGTCTTGC 1620

TCTGGCATCC AGCACTTCTC CGCGATGCTC CGAGATGAGG TAGGTGGTCG CGCGGTTAAC 1680 TCTGGCATCC AGCACTTCTC CGCGATGCTC CGAGATGAGG TAGGTGGTCG CGCGGTTAAC 1680

TTGCTTCCTA GTGAAACCGT TCAGGACATC TACGGGATTG TTGCTAAGAA AGTCAACGAG 1740 TTGCTTCCTA GTGAAACCGT TCAGGACATC TACGGGATTG TTGCTAAGAA AGTCAACGAG 1740

ATTCTACAAG CAGACGCAAT CAATGGGACC GATAACGAAG TAGTTACCGT GACCGATGAG 1820 ATTCTACAAG CAGACGCAAT CAATGGGACC GATAACGAAG TAGTTACCGT GACCGATGAG 1820

AACACTGGTG AAATCTCTGA GAAAGTCAAG CTGGGCACTA AGGCACTGGC TGGTCAATGG 1880 AACACTGGTG AAATCTCTGA GAAAGTCAAG CTGGGCACTA AGGCACTGGC TGGTCAATGG 1880

CTGGCTTACG GTGTTACTCG CAGTGTGACT AAGCGTTCAG TCATGACGCT GGCTTACGGG 1940 CTGGCTTACG GTGTTACTCG CAGTGTGACT AAGCGTTCAG TCATGACGCT GGCTTACGGG 1940

TCCAAAGAGT TCGGCTTCCG TCAACAAGTG CTGGAAGATA CCATTCAGCC AGCTATTGAT 2000 TCCAAAGAGT TCGGCTTCCG TCAACAAGTG CTGGAAGATA CCATTCAGCC AGCTATTGAT 2000

TCCGGCAAGG GTCTGATGTT CACTCAGCCG AATCAGGCTG CTGGATACAT GGCTAAGCTG 2060 TCCGGCAAGG GTCTGATGTT CACTCAGCCG AATCAGGCTG CTGGATACAT GGCTAAGCTG 2060

ATTTGGGAAT CTGTGAGCGT GACGGTGGTA GCTGCGGTTG AAGCAATGAA CTGGCTTAAG 2120 ATTTGGGAAT CTGTGAGCGT GACGGTGGTA GCTGCGGTTG AAGCAATGAA CTGGCTTAAG 2120

TCTGCTGCTA AGCTGCTGGC TGCTGAGGTC AAAGATAAGA AGACTGGAGA GATTCTTCGC 2180 TCTGCTGCTA AGCTGCTGGC TGCTGAGGTC AAAGATAAGA AGACTGGAGA GATTCTTCGC 2180

AAGCGTTGCG CTGTGCATTG GGTAACTCCT GATGGTTTCC CTGTGTGGCA GGAATACAAG 2240 AACGGTTGCG CTGTGCATTG GGTAACTCCT GATGGTTTCC CTGTGTGGCA GGAATACAAG 2240

AAGCCTATTC AGACGCGCTT GAACCTGATG TTCCTCGGTC AGTTCCGCTT ACAGCCTACC 2300 AAGCCTATTC AGACGCGCTT GAACCTGATG TTCCTCGGTC AGTTCCGCTT ACAGCCTACC 2300

ATTAACACCA ACAAAGATAG CGAGATTGAT GCACACAAAC AGGAGTCTGG TATCGCTCCT 2360 ATTAACACCA ACAAAGATAG CGAGATTGAT GCACACAAAC AGGAGTCTGG TATCGCTCCT 2360

AACTTTGTAC ACAGCCAAGA CGGTAGCCAC CTTCGTAAGA CTGTAGTGTG GGCACACGAG 2420 AACTTTGTAC ACAGCCAAGA CGGTAGCCAC CTTCGTAAGA CTGTAGTGTG GGCACACGAG 2420

AAGTACGGAA TCGAATCTTT TGCACTGATT CACGACTCCT TCGGTACCAT TCCGGCTGAC 2480 AAGTACGGAA TCGAATCTTT TGCACTGATT CACGACTCCT TCGGTACCAT TCCGGCTGAC 2480

GCTGCGAACC TGTTCAAAGC AGTGCGCGAA ACTATGGTTG ACACATATGA GTCTTGTGAT 2540 GCTGCGAACC TGTTCAAAGC AGTGCGCGAA ACTATGGTTG ACACATATGA GTCTTGTGAT 2540

GTACTGGCTG ATTTCTACGA CCAGTTCGCT GACCAGTTGC ACGAGTCTCA ATTGGACAAA 2600 GTACTGGCTG ATTTCTACGA CCAGTTCGCT GACCAGTTGC ACGAGTCTCA ATTGGACAAA 2600

ATGCCAGCAC TTCCGGCTAA AGGTAACTTG AACCTCCGTG ACATCTTAGA GTCGGACTTC 2660 GCGTTCGCGT AATAA 2675 (서열번호 33)ATGCCAGCAC TTCCGGCTAA AGGTAACTTG AACCTCCGTG ACATCTTAGA GTCGGACTTC 2660 GCGTTCGCGT AATAA 2675 (SEQ ID NO:33)

여기에서 3'UTR은 서열 5'-GCCCGaTGGG CCTCCCAACG GGCCCTCCTC CCCTCCTTGC ACCG-3'(서열번호 34; muag; 밑줄 친 뉴클레오타이드는 야생형 서열과 비교하여 돌연변이임)를 포함하는 (알파-)글로빈의 돌연변이된 UTR이고, 폴리(A) 꼬리는 64개의 아데닌 뉴클레오타이드로 이루어지며, 폴리(C) 서열은 30개의 사이토신 뉴클레오타이드로 이루어지고 히스톤 스템-루프는 (5'-CAAAGGCUCU UUUCAGAGCC ACCA-3' 서열번호 35)에 따른 RNA 서열이다. wherein the 3'UTR is a mutated (alpha-)globin comprising the sequence 5'-GCCCG a TGGG CCTCCCAACG GGCCCTCCTC CCCTCCTTGC ACCG-3' (SEQ ID NO: 34; muag; the underlined nucleotides are mutated compared to the wild-type sequence) UTR, poly(A) tail consists of 64 adenine nucleotides, poly(C) sequence consists of 30 cytosine nucleotides and histone stem-loop is (5'-CAAAGGCUCU UUUCAGAGCC ACCA-3' SEQ ID NO: 35) according to the RNA sequence.

muag - A64 - C30 - 히스톤SL: GCCCGATGGG CCTCCCAACG GGCCCTCCTC CCCTCCTTGC ACCGAGATTA ATAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAATGCA TCCCCCCCCC CCCCCCCCCC CCCCCCCCCC CCAAAGGCTC TTTTCAGAGC CACCA (서열번호 36): muag - A64 - C30 - histone SL: GCCCGATGGG CCTCCCAACG GGCCCTCCTC CCCTCCTTGC ACCG AGATTA ATAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AATTAATGCA TCCCACCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCC

A64: GGACTAGTAG ATCTAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAA (서열번호 37) A64: GGACTAGTAG ATCTAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAA (SEQ ID NO: 37)

C30: TGCATCCCCC CCCCCCCCCC CCCCCCCCCC CCCCCTCTA G (서열번호 38) C30: TGCATCCCCC CCCCCCCCCC CCCCCCCCCC CCCCCTCTA G (SEQ ID NO: 38)

본 발명에서 SM_DdRp DNA 절편은 <T7 promoter - 5'UTR - T7Pol - muag - A64 - C30 - 히스톤-SL>으로 합성하였으며(Biosynthesis, 미국), 이를 주형으로 정방향 플라이머 5'-GAATTC TAAT ACGACTCACT ATAGGGGAGA CCACAACGGT TTCCCTCTAG AAAGAACCAT GAACACGATT AACA-3' (서열번호 39) 및 역방향 프라이머 5'-GGATCCTGGTG GCTCTAAAA GAGCCTTTGG-3' (서열번호 40)을 사용하여 증폭하였다. 여기서 T7pol의 표적 서열에 밑줄이 그어져 있다. 사용된 프라이머의 양 말단은 EcoRI/BamHI 인식서열이 포함되어 있다. In the present invention, the SM_DdRp DNA fragment was synthesized with <T7 promoter - 5'UTR - T7Pol - muag - A64 - C30 - histone-SL> (Biosynthesis, USA), and the forward primer 5'- GAATTC TAAT ACGACTCACT ATAG GGGAGA was used as a template. It was amplified using CCACAACGGT TTCCCTCTAG AAAGAACC AT GAACACGATT AACA -3' (SEQ ID NO: 39) and reverse primer 5'- GGATCC TGGTG GCTCTAAAA GAGCCTTTGG-3' (SEQ ID NO: 40). Here the target sequence of T7pol is underlined. Both ends of the primers used include EcoRI/BamHI recognition sequences.

증폭된 PCR 산물을 EcoRI/BamHI 효소를 사용하여 절단한 다음, EcoRI/BamHI 효소로 선형화된 pUC19 벡터와 T4 DNA ligase를 이용하여 클로닝 반응을 하였다. 상기 반응용액을 대장균에 형질주입하고 선정된 균주에서 플라스미드를 분리하여 EcoRI/BamHI 제한효소를 처리한 후 전기영동을 하였다(도 7).The amplified PCR product was digested using EcoRI/BamHI enzymes, and then cloning reaction was performed using the pUC19 vector linearized with EcoRI/BamHI enzymes and T4 DNA ligase. The reaction solution was transfected into E. coli, and the plasmid was isolated from the selected strain, treated with EcoRI/BamHI restriction enzymes, and then electrophoresed (FIG. 7).

상기 제조된 재조합 pUC19는 원핵생물에서 DdRp RNA 발현 카세트에서 합성된 DdRp에 의해 RNA를 합성하고 단백질 합성도구에 의해 DdRp를 합성할 수 있어 DdRp 발현 카세트로 사용할 수도 있다. 그러나, 본 발명에서 진핵세포에서는 진핵세포의 복제원점(origin of replication)이 없어 잠깐 동안만 발현벡터로 역할을 한다.The recombinant pUC19 prepared above can synthesize RNA by DdRp synthesized from a DdRp RNA expression cassette in prokaryotes and can synthesize DdRp by a protein synthesis tool, so it can be used as a DdRp expression cassette. However, in the present invention, in eukaryotic cells, there is no origin of replication in eukaryotic cells, and thus serves as an expression vector for a short time.

<DdRp RNA 발현 카세트의 제조> <Preparation of DdRp RNA expression cassette>

본 발명의 RNA/DNA 시스템에서 T7 polymerase의 자가전사를 시작하기 위해서, 최초 T7 polymerase 공급이 필요한데, 본 발명에서는 낮은 핵막 투과 문제를 해결하기 위하여 캡된 화학적 변형이 있는 뉴클레오타이드(CM)를 포함하는 T7pol mRNA를 포함하는 DdRp RNA 발현 카세트를 제작하였다. In order to start self-transcription of T7 polymerase in the RNA/DNA system of the present invention, the first T7 polymerase supply is required. In the present invention, T7pol mRNA containing nucleotides (CM) with capped chemical modifications to solve the problem of low nuclear membrane permeation A DdRp RNA expression cassette comprising a was prepared.

캡된 CM_T7pol mRNA을 합성하기 위하여, 먼저 T7 promoter-T7 polymerase 서열을 가지는 상기 제조한 SM_DdRp pUC19 벡터를 주형으로 정방향 프라이머 (서열번호 39) 및 역방향 프라이머 서열번호 40을 사용하여 증폭하였다. 여기서 T7pol의 표적 서열에 밑줄이 그어져 있다. PCR 산물을 주형으로 체외전사하였다(도 8).In order to synthesize capped CM_T7pol mRNA, first, the prepared SM_DdRp pUC19 vector having a T7 promoter-T7 polymerase sequence was amplified using a forward primer (SEQ ID NO: 39) and a reverse primer SEQ ID NO: 40 as a template. Here the target sequence of T7pol is underlined. The PCR product was transcribed in vitro as a template (FIG. 8).

이러한 T7 promoter-T7 polymerase DNA 주형으로 상기에서 제조한 T7프로모터가 있는 SM_DdRp PCR 산물을 주형으로여 HighYield T7 ARCA mRNA Synthiis Kit (m5CTP/Ψ-UTP) (Jena BioScience, 미국)를 이용하여 캡된 CM/SM_T7pol mRNA를 포함하는 DdRp RNA 발현 카세트를 시험관 내에서 합성하였다. 구체적으로 살펴보면, anti-reverse cap analog [(ARCA) (3′-O-Me-7mG(5′)ppp(5′)G cap analog라고도 부름)] 및 화학적 변형된 뉴클레오타이드 포함하는 반응용액 (6 mM ARCA, 1.5 mM GTP, 7.5 mM 5-Methyl-CTP, 7.5 mM Pseudo-UTP, 7.5 mM ATP)에서 체외전사를 실시하였다. dsDNA 주형을를 제거하기 위해서 DNA nuclease를 첨가하였고, 남아있는 캡된 CM/SM_T7pol mRNA는 LiCl 추출법과 에탄올 침전법을 이용하여 정제하였다. CM/SM_T7pol capped using the HighYield T7 ARCA mRNA Synthiis Kit (m5CTP/Ψ-UTP) (Jena BioScience, USA) using the SM_DdRp PCR product with the T7 promoter prepared above as a T7 promoter-T7 polymerase DNA template as a template A DdRp RNA expression cassette containing mRNA was synthesized in vitro. Specifically, a reaction solution containing anti-reverse cap analog [(ARCA) (3′-O-Me-7mG(5′)ppp(5′)G cap analog)] and chemically modified nucleotides (6 mM In vitro transcription was performed in ARCA, 1.5 mM GTP, 7.5 mM 5-Methyl-CTP, 7.5 mM Pseudo-UTP, 7.5 mM ATP). DNA nuclease was added to remove the dsDNA template, and the remaining capped CM/SM_T7pol mRNA was purified by LiCl extraction and ethanol precipitation.

대조군으로 SM_DdRp 벡터에서 Native RNA 전사체에 5′cap 구조를 부가한 캡된 T7pol mRNA 합성은 HiScribe T7 ARCA mRNA Kit(NEB, 미국)를 이용하여 실시하였다. As a control, the synthesis of capped T7pol mRNA in which a 5'cap structure was added to the native RNA transcript in the SM_DdRp vector was performed using the HiScribe T7 ARCA mRNA Kit (NEB, USA).

<도 9>에서 제시한 결과처럼, 상기 제조한 캡된 SM_T7pol mRNA(Native RNA), 캡된 CM_T7pol mRNA(modified RNA) 및 3'말단에 choliterol이 부가된 캡된 CM_T7pol mRNA(modified RNA-choliterol)을 세포배양액에 제조한 RNA를 다양한 시간 동안 처리한 후 RT-PCR하여 in vitro 안정성을 확인하였다. 상기 제조한 캡된 CM_T7pol mRNA는 캡된 T7pol mRNA보다 in vitro 안전성이 매우 우수하였으며, 3'말단에 cholesterol이 부가된 캡된 CM_T7pol mRNA(modified RNA-choliterol)가 가장 안정성이 높았다. As shown in <Fig. 9>, the prepared capped SM_T7pol mRNA (Native RNA), the capped CM_T7pol mRNA (modified RNA), and the capped CM_T7pol mRNA (modified RNA-choliterol) with choliterol added to the 3' end were added to the cell culture medium. In vitro stability was confirmed by RT-PCR after processing the prepared RNA for various times. The prepared capped CM_T7pol mRNA had very superior in vitro safety than the capped T7pol mRNA, and the capped CM_T7pol mRNA (modified RNA-choliterol) with cholesterol added to the 3' end had the highest stability.

캡된 CM_T7pol mRNA는 IVT 산물을 ScriptCap m7G 캡핑 시스템 (Epicentre Biotechnologii사, 미국)으로 천연 캡(m7G(5')ppp(5')G; m7GpppG)을 부가할 수도 있다.Capped CM_T7pol mRNA can also be added with a native cap (m7G(5')ppp(5')G; m7GpppG) to the IVT product with the ScriptCap m7G capping system (Epicentre Biotechnologii, USA).

1-2. auto_DdRp 및 auto_키메라 DdRp 발현 카세트의 제조 1-2. Preparation of auto_DdRp and auto_chimeric DdRp expression cassettes

일반적으로 원핵생물과 진행생물은 발현 카세트에 사용하는 프로모터를 달리하고 있다. 본 발명의 자가전사 RNA/DNA 시스템에서 사용하는 발현 카세트는 원핵생물이나 진행생물 특히 포유동물, 식물 등에 공통적으로 선정된 DdRp에 상응하는 프로모터를 사용할 수 있다. 예를 들어 DdRp가 T7 Polymerase인 경우는 T7 프로모터를 이용하여 제작할 수 있다. In general, prokaryotes and prokaryotes use different promoters for expression cassettes. For the expression cassette used in the self-transcribed RNA/DNA system of the present invention, a promoter corresponding to DdRp commonly selected for prokaryotes or progenitors, particularly mammals, plants, and the like may be used. For example, when DdRp is T7 Polymerase, it can be prepared using the T7 promoter.

본 발명의 auto_DdRp DNA 발현 카세트 및 auto_(DdRp+DNAge) 발현 카세트는 플라스미드 혹은 바이러스 벡터를 사용하여 제작할 수 있다. 상기auto_DdRp DNA 발현 카세트 및 auto_(DdRp+DNAge) 발현 카세트는 플라스미드 혹은 바이러스 벡터에 auto_DdRp DNA 절편(T7 promoter - 5'UTR - DdRp DNA(또는 키메라 NP868R-T7RNAP DNA) - muag - A64 - C30 - 히스톤-SL> 을 삽입하여 제조하였다. 하기에서처럼 합성된 DdRp 및 키메라 DdRp DNA 절편을 주형으로 PCR하여 증폭하여 클로닝이 용이한 DdRp 및 키메라 DdRp DNA 절편을 대량으로 얻었다. 특정 제한효소를 처리하여 선형화 발현벡터에 재조합하였다.The auto_DdRp DNA expression cassette and the auto_(DdRp+DNAge) expression cassette of the present invention can be prepared using a plasmid or a viral vector. The auto_DdRp DNA expression cassette and the auto_(DdRp+DNAge) expression cassette are stored in a plasmid or viral vector with an auto_DdRp DNA fragment (T7 promoter - 5'UTR - DdRp DNA (or chimeric NP868R-T7RNAP DNA) - muag - A64 - C30 - histone- SL> was inserted.As shown below, the synthesized DdRp and chimeric DdRp DNA fragments were PCR amplified as a template to obtain a large amount of DdRp and chimeric DdRp DNA fragments that are easy to clone. recombined.

본 실시에서 사용된 발현벡터는 포유류 발현 플라스미드 벡터 pCI-neo 벡터(Promega 사, 미국), AdEasy Adenoviral Vector System(Agilent Technologii, 미국)에 있는 pShuttle, ViraSafe™ Lentiviral Exprision System(Cell Biolabs, 미국)에 있는 pSMPUW-IRES-Blasticidin Lentiviral Exprision Vector, 셔틀 벡터 pSMPUW 및 식물발현용 binary vector(Ti plasmid) 등 이며 이에 쩨한 하는 것은 아니다. 본 실시례에서는 플라스미드 벡터만 제한하여 기술하였으며, 바이러스성 벡터는 하기 실시례 1-4항을 참조하여 충분히 제조할 수 있다.The expression vectors used in this example were mammalian expression plasmid vector pCI-neo vector (Promega, USA), pShuttle in AdEasy Adenoviral Vector System (Agilent Technologii, USA), ViraSafe™ Lentiviral Exprision System (Cell Biolabs, USA). pSMPUW-IRES-Blasticidin Lentiviral Exprision Vector, shuttle vector pSMPUW, binary vector for plant expression (Ti plasmid), etc., but not limited thereto. In this example, only the plasmid vector was described by limiting it, and the viral vector can be sufficiently prepared with reference to Examples 1-4 below.

<auto_DdRp 발현 카세트><auto_DdRp expression cassette>

일반적으로 원핵생물과 진행생물은 발현 카세트에 사용하는 프로모터를 달리하고 있다. 본 발명의 자가전사 RNA/DNA 시스템에서 사용하는 발현 카세트는 원핵생물이나 진행생물 특히 포유동물, 식물 등에 공통적으로 선정된 DdRp에 상응하는 프로모터를 사용할 수 있다. 예를 들어 DdRp가 T7 Polymerase인 경우는 T7 프로모터를 이용하여 제작할 수 있다. In general, prokaryotes and prokaryotes use different promoters for expression cassettes. For the expression cassette used in the self-transcribed RNA/DNA system of the present invention, a promoter corresponding to DdRp commonly selected for prokaryotes or progenitors, particularly mammals, plants, and the like may be used. For example, when DdRp is T7 Polymerase, it can be prepared using the T7 promoter.

본 실시례에서는 플라스미드를 사용하여 DdRp를 제공하는 DNA 절편을 포함하는 auto_SM_DdRp 발현 카세트를 설계하였다. 포유류 발현 벡터로 안정화 세포주를 구축할 수 있는 pCI-neo 벡터(Promega 사, 미국)를 BglII/HpaI 제한효소 처리로 절단하고 <T7 프로모터 다음에 5'UTR, DdRp를 코딩하는 DNA 절편, muag, A64 폴리(A) 서열, 폴리(C) 서열(C30) 및 히스톤 스템-루프 서열(히스톤-SL)서열>로 구성된 SM_DdRp DNA 절편을 삽입하여 상기 auto_SM_DdRp 발현 카세트를 제조하였다. In this example, an auto_SM_DdRp expression cassette including a DNA fragment providing DdRp was designed using a plasmid. The pCI-neo vector (Promega, USA) capable of constructing a stable cell line with a mammalian expression vector was digested with BglII/HpaI restriction enzyme treatment and <T7 promoter followed by 5'UTR, DdRp-encoding DNA fragment, muag, A64 The auto_SM_DdRp expression cassette was prepared by inserting an SM_DdRp DNA fragment consisting of a poly(A) sequence, a poly(C) sequence (C30), and a histone stem-loop sequence (histone-SL) sequence>.

상기 DdRp에 핵국지화신호(Nuclear localization signals, NLS)이 위치할 수도 있다. NLS가 없는 DdRp는 대부분 세포질에 남아있는 반면, NLS를 포함하는 단백질은 핵에 국한하여 분포한다. NLS가 없는 DdRp는 세포질 또는 NLS를 포함하는 하이브리드 DdRp는 핵에서 효소적으로 활성화되어 염색체 또는 플라스미드 DNA에 배치된 T7 프로모터에서 선택적으로 전사를 시작하고 특정 3*?**?*UTR에서 중지할 수 있다. Nuclear localization signals (NLS) may be located in the DdRp. DdRp without NLS mostly remains in the cytoplasm, whereas protein containing NLS is localized in the nucleus. DdRp without NLS can be cytoplasmic or hybrid DdRp with NLS can be enzymatically activated in the nucleus to selectively start transcription at the T7 promoter placed on chromosomal or plasmid DNA and stop at a specific 3*?**?*UTR. have.

상기 SM_DdRp DNA 절편의 구성하는 단위 요소들의 염기서열은 다음과 같다. The base sequence of the unit elements constituting the SM_DdRp DNA fragment is as follows.

본 실시례 1-1에서 합성한 SM_DdRp DNA 절편을 정방향 플라이머 5'-AGATCTTTAA TACGACTCAC TATAGGGGAG ACCACAACGG TTTCCCTCTA GAAAGAACCA TGAACACGAT TAACA-3'(서열번호 43) 및 역방향 프라이머 5'-GTTAACTGGT GCTCTAAAA GAGCCTTTGG-3' (서열번호 44)을 사용하여 증폭하였다. 여기서 T7pol의 표적 서열에 밑줄이 그어져 있다. 사용된 프라이머의 양 말단은 BglII/HpaI 인식서열이 포함되어 있다. The SM_DdRp DNA fragment synthesized in Example 1-1 was forward primer 5'- AGATCT TTAA TACGACTCAC TATAGGGGAG ACCACAACGG TTTCCCTCTA GAAAGAACC A TGAACACGAT TAACA -3' (SEQ ID NO: 43) and reverse primer 5'- GTTAAC TGGT GCTCTAAAA (SEQ ID NO: 44) was used to amplify. Here the target sequence of T7pol is underlined. Both ends of the primers used include BglII/HpaI recognition sequences.

증폭된 SM_DdRp DNA 절편를 포함하는 PCR 산물은 는 BglII/HpaI 효소를 사용하여 절단한 다음, BglII/HpaI 효소로 선형화된 pCI-neo 벡터와 T4 DNA ligase를 이용하여 클로닝 반응을 하였다. 상기 반응용액을 대장균에 형질주입하고 선정된 균주에서 플라스미드를 분리하여 BglII/HpaI 제한효소를 처리한 후 전기영동을 하였다(도 10).The PCR product containing the amplified SM_DdRp DNA fragment was digested using BglII/HpaI enzymes, and then subjected to cloning reaction using a pCI-neo vector linearized with BglII/HpaI enzymes and T4 DNA ligase. The reaction solution was transfected into E. coli, and the plasmid was isolated from the selected strain, treated with BglII/HpaI restriction enzymes, and then electrophoresed (FIG. 10).

상기에서 <T7 프로모터 다음에 5'UTR, DdRp를 코딩하는 DNA 절편, muag, A64 폴리(A) 서열, 폴리(C) 서열(C30) 및 히스톤 스템-루프 서열(히스톤-SL)서열>로 구성된 SM_DdRp DNA 절편로 제작된 재조합 pCI-neo 벡터를 auto_DdRp 발현 카세트라고 지칭하였다.In the above <T7 promoter followed by 5'UTR, DNA fragment encoding DdRp, muag, A64 poly(A) sequence, poly(C) sequence (C30) and histone stem-loop sequence (histone-SL) sequence> The recombinant pCI-neo vector constructed from the SM_DdRp DNA fragment was referred to as an auto_DdRp expression cassette.

<auto_키메라 DdRp 발현 카세트><auto_chimeric DdRp expression cassette>

일반적으로 원핵생물과 진행생물은 발현 카세트에 사용하는 프로모터를 달리하고 있다. 본 발명의 자가전사 RNA/DNA 시스템에서 사용하는 발현 카세트는 원핵생물이나 진행생물 특히 포유동물, 식물 등에 공통적으로 선정된 DdRp에 상응하는 프로모터를 사용할 수 있다. 예를 들어 DdRp가 T7 Polymerase인 경우는 T7 프로모터를 이용하여 제작할 수 있다. In general, prokaryotes and prokaryotes use different promoters for expression cassettes. For the expression cassette used in the self-transcribed RNA/DNA system of the present invention, a promoter corresponding to DdRp commonly selected for prokaryotes or progenitors, particularly mammals, plants, and the like may be used. For example, when DdRp is T7 Polymerase, it can be prepared using the T7 promoter.

본 발명의 auto_키메라 DdRp 발현 카세트는 플라스미드 혹은 바이러스 벡터를 사용할 수 있다. 본 실시례에서는 플라스미드를 사용하여 DdRp를 제공하는 DNA 절편을 포함하는 auto_키메라DdRp 발현 카세트를 설계하였다. The auto_chimeric DdRp expression cassette of the present invention may use a plasmid or a viral vector. In this Example, an auto_chimeric DdRp expression cassette including a DNA fragment providing DdRp was designed using a plasmid.

포유류 발현 벡터로 안정화 세포주를 구축할 수 있는 pCI-neo 벡터(Promega 사, 미국)를 BglII/HpaI 제한효소 처리로 절단하고 <T7 프로모터 다음에 5'UTR, 키메라 DdRp를 코딩하는 DNA 절편, muag, A64 폴리(A) 서열, 폴리(C) 서열(C30) 및 히스톤 스템-루프 서열(히스톤-SL)서열>로 구성된 SM_DdRp DNA 절편을 삽입하여 상기 auto_키메라 DdRp 발현 카세트를 제조하였다. A pCI-neo vector (Promega, USA) capable of constructing a stable cell line as a mammalian expression vector was digested with BglII/HpaI restriction enzyme treatment and <T7 promoter followed by 5'UTR, a DNA fragment encoding chimeric DdRp, muag; The auto_chimeric DdRp expression cassette was prepared by inserting an SM_DdRp DNA fragment consisting of A64 poly(A) sequence, poly(C) sequence (C30) and histone stem-loop sequence (histone-SL) sequence>.

본 발명의 키메라 DdRp를 코딩하는 DNA 절편은 NP868R-T7RNAP(서열번호 21)의 ORF이다. NP868R, 아프리카 돼지열 바이러스의 mRNA 캡핑 효소, 및 박테리오파지 T7의 야생형 파지 DdRp 사이의 융합을 코딩하는 하나의 플라스미드를 합성했다. 당해 캡핑 효소는 (Gly3Ser)4 링커에 의해 T7 RNA 폴리머라제의 아미노 말단에 융합시켰다. The DNA fragment encoding the chimeric DdRp of the present invention is the ORF of NP868R-T7RNAP (SEQ ID NO: 21). One plasmid encoding a fusion between NP868R, the mRNA capping enzyme of African swine fever virus, and the wild-type phage DdRp of bacteriophage T7 was synthesized. This capping enzyme was fused to the amino terminus of T7 RNA polymerase by a (Gly3Ser)4 linker.

NP868R-T7RNAP의 ORF에 대한 염기서열은 아래 서열번호 21과 같다. The nucleotide sequence for the ORF of NP868R-T7RNAP is shown in SEQ ID NO: 21 below.

NP868R-T7RNAP:NP868R-T7RNAP:

ATGGAATTCG CCAGCCTGGA CAACCTGGTG GCCAGATACC AGCGGTGCTT CAACGACCAG 60ATGGAATTCG CCAGCCTGGA CAACCTGGTG GCCAGATAACC AGCGGTGCTT CAACGACCAG 60

AGCCTGAAGA ACAGCACCAT CGAGCTGGAA ATCCGGTTCC AGCAGATCAA CTTCCTGCTG 120AGCCTGAAGA ACAGCACCAT CGAGCTGGAA ATCCGGTTCC AGCAGATCAA CTTCCTGCTG 120

TTCAAGACCG TGTACGAGGC CCTGGTCGCC CAGGAAATCC CCAGCACCAT CAGCCACAGC 180TTCAAGACCG TGTACGAGGC CCTGGTCGCC CAGGAAATCC CCAGCACCAT CAGCCACAGC 180

ATCCGGTGCA TCAAGAAGGT GCACCACGAG AACCACTGCC GGGAGAAGAT CCTGCCCAGC 240ATCCGGTGCA TCAAGAAGGT GCACCACGAG AACCACTGCC GGGAGAAGAT CCTGCCCAGC 240

GAGAACCTGT ACTTCAAGAA ACAGCCCCTG ATGTTCTTCA AGTTCAGCGA GCCCGCCAGC 300GAGAACCTGT ACTTCAAGAA ACAGCCCCTG ATGTTCTTCA AGTTCAGCGA GCCCGCCAGC 300

CTGGGCTGTA AAGTGTCCCT GGCCATCGAG CAGCCCATCC GGAAGTTCAT CCTGGACAGC 360CTGGGCTGTA AAGTGTCCCT GGCCATCGAG CAGCCCATCC GGAAGTTCAT CCTGGACAGC 360

AGCGTGCTGG TCCGGCTGAA GAACCGGACC ACCTTCCGGG TGTCCGAGCT GTGGAAGATC 420AGCGTGCTGG TCCGGCTGAA GAACCGGACC ACCTTCCGGG TGTCCGAGCT GTGGAAGATC 420

GAGCTGACCA TCGTGAAGCA GCTGATGGGC AGCGAGGTGT CAGCCAAGCT GGCCGCCTTC 480GAGCTGACCA TCGTGAAGCA GCTGATGGGC AGCGAGGTGT CAGCCAAGCT GGCCGCCTTC 480

AAGACCCTGC TGTTCGACAC CCCCGAGCAG CAGACCACCA AGAACATGAT GACCCTGATC 540AAGACCCTGC TGTTCGACAC CCCCGAGCAG CAGACCACCA AGAACATGAT GACCCTGATC 540

AACCCCGACG ACGAGTACCT GTACGAGATC GAGATCGAGT ACACCGGCAA GCCTGAGAGC 600AACCCCGACG ACGAGTACCT GTACGAGATC GAGATCGAGT ACACCGGCAA GCCTGAGAGC 600

CTGACAGCCG CCGACGTGAT CAAGATCAAG AACACCGTGC TGACACTGAT CAGCCCCAAC 660CTGACAGCCG CCGACGTGAT CAAGATCAAG AACACCGTGC TGACACTGAT CAGCCCCAAC 660

CACCTGATGC TGACCGCCTA CCACCAGGCC ATCGAGTTTA TCGCCAGCCA CATCCTGAGC 720CACCTGATGC TGACCGCCTA CCACCAGGCC ATCGAGTTTA TCGCCAGCCA CATCCTGAGC 720

AGCGAGATCC TGCTGGCCCG GATCAAGAGC GGCAAGTGGG GCCTGAAGAG ACTGCTGCCC 780AGCGAGATCC TGCTGGCCCG GATCAAGAGC GGCAAGTGGG GCCTGAAGAG ACTGCTGCCC 780

CAGGTCAAGT CCATGACCAA GGCCGACTAC ATGAAGTTCT ACCCCCCCGT GGGCTACTAC 840CAGGTCAAGT CCATGACCAA GGCCGACTAC ATGAAGTTCT ACCCCCCCGT GGGCTACTAC 840

GTGACCGACA AGGCCGACGG CATCCGGGGC ATTGCCGTGA TCCAGGACAC CCAGATCTAC 900GTGACCGACA AGGCCGACGG CATCCGGGGC ATTGCCGTGA TCCAGGACAC CCAGATCTAC 900

GTGGTGGCCG ACCAGCTGTA CAGCCTGGGC ACCACCGGCA TCGAGCCCCT GAAGCCCACC 960GTGGTGGCCG ACCAGCTGTA CAGCCTGGGC ACCACCGGCA TCGAGCCCCT GAAGCCCACC 960

ATCCTGGACG GCGAGTTCAT GCCCGAGAAG AAAGAGTTCT ACGGCTTTGA CGTGATCATG 1020ATCCTGGACG GCGAGTTCAT GCCCGAGAAG AAAGAGTTCT ACGGCTTTGA CGTGATCATG 1020

TACGAGGGCA ACCTGCTGAC CCAGCAGGGC TTCGAGACAC GGATCGAGAG CCTGAGCAAG 1080TACGAGGGCA ACCTGCTGAC CCAGCAGGGC TTCGAGACAC GGATCGAGAG CCTGAGCAAG 1080

GGCATCAAGG TGCTGCAGGC CTTCAACATC AAGGCCGAGA TGAAGCCCTT CATCAGCCTG 1140GGCATCAAGG TGCTGCAGGC CTTCAACATC AAGGCCGAGA TGAAGCCCTT CATCAGCCTG 1140

ACCTCCGCCG ACCCCAACGT GCTGCTGAAG AATTTCGAGA GCATCTTCAA GAAGAAAACC 1200ACCTCCGCCG ACCCCAACGT GCTGCTGAAG AATTTCGAGA GCATCTTCAA GAAGAAAACC 1200

CGGCCCTACA GCATCGACGG CATCATCCTG GTGGAGCCCG GCAACAGCTA CCTGAACACC 1260CGGCCCTACA GCATCGACGG CATCATCCTG GTGGAGCCCG GCAACAGCTA CCTGAACACC 1260

AACACCTTCA AGTGGAAGCC CACCTGGGAC AACACCCTGG ACTTTCTGGT CCGGAAGTGC 1320AACACCTTCA AGTGGAAGCC CACCTGGGAC AACACCCTGG ACTTTCTGGT CCGGAAGTGC 1320

CCCGAGTCCC TGAACGTGCC CGAGTACGCC CCCAAGAAGG GCTTCAGCCT GCATCTGCTG 1380CCCGAGTCCC TGAACGTGCC CGAGTACGCC CCCAAGAAGG GCTTCAGCCT GCATCTGCTG 1380

TTCGTGGGCA TCAGCGGCGA GCTGTTTAAG AAGCTGGCCC TGAACTGGTG CCCCGGCTAC 1440TTCGTGGGCA TCAGCGGCGA GCTGTTTAAG AAGCTGGCCC TGAACTGGTG CCCCGGCTAC 1440

ACCAAGCTGT TCCCCGTGAC CCAGCGGAAC CAGAACTACT TCCCCGTGCA GTTCCAGCCC 1500ACCAAGCTGT TCCCCGTGAC CCAGCGGAAC CAGAACTACT TCCCCGTGCA GTTCCAGCCC 1500

AGCGACTTCC CCCTGGCCTT CCTGTACTAC CACCCCGACA CCAGCAGCTT CAGCAACATC 1560AGCGACTTCC CCCTGGCCTT CCTGTACTAC CACCCCGACA CCAGCAGCTT CAGCAACATC 1560

GATGGCAAGG TGCTGGAAAT GCGGTGCCTG AAGCGGGAGA TCAACTACGT GCGCTGGGAG 1620GATGGCAAGG TGCTGGAAAT GCGGTGCCTG AAGCGGGAGA TCAACTACGT GCGCTGGGAG 1620

ATCGTGAAGA TCCGGGAGGA CCGGCAGCAG GATCTGAAAA CCGGCGGCTA CTTCGGCAAC 1680ATCGTGAAGA TCCGGGAGGA CCGGCAGCAG GATCTGAAAA CCGGCGGCTA CTTCGGCAAC 1680

GACTTCAAGA CCGCCGAGCT GACCTGGCTG AACTACATGG ACCCCTTCAG CTTCGAGGAA 1740GACTTCAAGA CCGCCGAGCT GACCTGGCTG AACTACATGG ACCCCTTCAG CTTCGAGGAA 1740

CTGGCCAAGG GACCCAGCGG CATGTACTTC GCTGGCGCCA AGACCGGCAT CTACAGAGCC 1800CTGGCCAAGG GACCCAGCGG CATGTACTTC GCTGGCGCCA AGACCGGCAT CTACAGAGCC 1800

CAGACCGCCC TGATCAGCTT CATCAAGCAG GAAATCATCC AGAAGATCAG CCACCAGAGC 1860CAGACCGCCC TGATCAGCTT CATCAAGCAG GAAATCATCC AGAAGATCAG CCACCAGAGC 1860

TGGGTGATCG ACCTGGGCAT CGGCAAGGGC CAGGACCTGG GCAGATACCT GGACGCCGGC 1920TGGGTGATCG ACCTGGGCAT CGGCAAGGGC CAGGACCTGG GCAGATACCT GGACGCCGGC 1920

GTGAGACACC TGGTCGGCAT CGATAAGGAC CAGACAGCCC TGGCCGAGCT GGTGTACCGG 1980GTGAGACACC TGGTCGGCAT CGATAAGGAC CAGACAGCCC TGGCCGAGCT GGTGTACCGG 1980

AAGTTCTCCC ACGCCACCAC CAGACAGCAC AAGCACGCCA CCAACATCTA CGTGCTGCAC 2040AAGTTCTCCC ACGCCACCAC CAGACAGCAC AAGCACGCCA CCAACATCTA CGTGCTGCAC 2040

CAGGATCTGG CCGAGCCTGC CAAAGAAATC AGCGAGAAAG TGCACCAGAT CTATGGCTTC 2100CAGGATCTGG CCGAGCCTGC CAAAGAAATC AGCGAGAAAG TGCACCAGAT CTATGGCTTC 2100

CCCAAAGAGG GCGCCAGCAG CATCGTGTCC AACCTGTTCA TCCACTACCT GATGAAGAAC 2160CCCAAAGAGG GCGCCAGCAG CATCGTGTCC AACCTGTTCA TCCACTACCT GATGAAGAAC 2160

ACCCAGCAGG TCGAGAACCT GGCTGTGCTG TGCCACAAGC TGCTGCAGCC TGGCGGCATG 2220ACCCAGCAGG TCGAGAACCT GGCTGTGCTG TGCCACAAGC TGCTGCAGCC TGGCGGCATG 2220

GTCTGGTTCA CCACCATGCT GGGCGAACAG GTGCTGGAAC TGCTGCACGA GAACCGGATC 2280GTCTGGTTCA CCACCATGCT GGGCGAACAG GTGCTGGAAC TGCTGCACGA GAACCGGATC 2280

GAACTGAACG AAGTGTGGGA GGCCCGGGAG AACGAGGTGG TCAAGTTCGC CATCAAGCGG 2340GAACTGAACG AAGTGTGGGA GGCCCGGGAG AACGAGGTGG TCAAGTTCGC CATCAAGCGG 2340

CTGTTCAAAG AGGACATCCT GCAGGAAACC GGCCAGGAAA TCGGCGTCCT GCTGCCCTTC 2400CTGTTCAAAG AGGACATCCT GCAGGAAACC GGCCAGGAAA TCGGCGTCCT GCTGCCCTTC 2400

AGCAACGGCG ACTTCTACAA TGAGTACCTG GTCAACACCG CCTTTCTGAT CAAGATTTTC 2460AGCAACGGCG ACTTCTACAA TGAGTACCTG GTCAACACCG CCTTTCTGAT CAAGATTTTC 2460

AAGCACCATG GCTTTAGCCT CGTGCAGAAG CAGAGCTTCA AGGACTGGAT CCCCGAGTTC 2520AAGCACCATG GCTTTAGCCT CGTGCAGAAG CAGAGCTTCA AGGACTGGAT CCCCGAGTTC 2520

CAGAACTTCA GCAAGAGCCT GTACAAGATC CTGACCGAGG CCGACAAGAC CTGGACCAGC 2580CAGAACTTCA GCAAGAGCCT GTACAAGATC CTGACCGAGG CCGACAAGAC CTGGACCAGC 2580

CTGTTCGGCT TCATCTGCCT GCGGAAGAAC GGGCCCGGCG GAGGCGGAAG TGGAGGCGGA 2640CTGTTCGGCT TCATCTGCCT GCGGAAGAAC GGGCCCGGCG GAGGCGGAAG TGGAGGCGGA 2640

GGAAGCGGAG GGGGAGGATC TGGCGGCGGA GGCAGCCTCG AGAACACCAT CAATATCGCC 2700GGAAGCGGAG GGGGAGGATC TGGCGGCGGA GGCAGCCTCG AGAACACCAT CAATATCGCC 2700

AAGAACGACT TCAGCGACAT CGAGCTGGCC GCCATCCCTT TCAACACCCT GGCCGACCAC 2760AAGAACGACT TCAGCGACAT CGAGCTGGCC GCCATCCCTT TCAACACCCT GGCCGACCAC 2760

TATGGCGAGC GGCTGGCCAG AGAACAGCTG GCCCTGGAAC ACGAGAGCTA CGAAATGGGC 2820TATGGCGAGC GGCTGGCCAG AGAACAGCTG GCCCTGGAAC ACGAGAGCTA CGAAATGGGC 2820

GAGGCCCGGT TCCGGAAGAT GTTCGAGAGA CAGCTGAAGG CCGGCGAGGT GGCCGATAAT 2880GAGGCCCGGT TCCGGAAGAT GTTCGAGAGA CAGCTGAAGG CCGGCGAGGT GGCCGATAAT 2880

GCCGCCGCTA AGCCCCTGAT CACCACCCTG CTGCCCAAGA TGATCGCCCG GATCAACGAT 2940GCCGCCGCTA AGCCCCTGAT CACCACCCTG CTGCCCAAGA TGATCGCCCG GATCAACGAT 2940

TGGTTCGAGG AAGTGAAGGC CAAGCGGGGC AAGAGGCCCA CCGCCTTCCA GTTTCTGCAG 3000TGGTTCGAGG AAGTGAAGGC CAAGCGGGGC AAGAGGCCCA CCGCCTTCCA GTTTCTGCAG 3000

GAAATCAAGC CCGAGGCCGT GGCCTACATC ACCATCAAGA CCACCCTGGC CTGCCTGACC 3060GAAATCAAGC CCGAGGCCGT GGCCTACATC ACCATCAAGA CCACCCTGGC CTGCCTGACC 3060

AGCGCCGACA ATACCACCGT GCAGGCTGTC GCTTCTGCCA TCGGCAGAGC CATCGAGGAC 3120AGCGCCGACA ATACCACCGT GCAGGCTGTC GCTTCTGCCA TCGGCAGAGC CATCGAGGAC 3120

GAGGCCAGAT TCGGCAGAAT CCGGGACCTG GAAGCCAAGC ACTTCAAGAA AAACGTGGAG 3180GAGGCCAGAT TCGGCAGAAT CCGGGACCTG GAAGCCAAGC ACTTCAAGAA AAACGTGGAG 3180

GAACAGCTGA ACAAGCGCGT GGGCCACGTG TACAAGAAAG CCTTCATGCA GGTGGTGGAG 3240GAACAGCTGA ACAAGCGCGT GGGCCACGTG TACAAGAAAG CCTTCATGCA GGTGGTGGAG 3240

GCCGACATGC TGAGCAAGGG CCTGCTGGGC GGAGAAGCCT GGTCCAGCTG GCACAAAGAG 3300GCCGACATGC TGAGCAAGGG CCTGCTGGGC GGAGAAGCCT GGTCCAGCTG GCACAAAGAG 3300

GACAGCATCC ACGTCGGCGT GCGGTGCATC GAGATGCTGA TCGAGTCGAC CGGCATGGTG 3360GACAGCATCC ACGTCGGCGT GCGGTGCATC GAGATGCTGA TCGAGTCGAC CGGCATGGTG 3360

TCCCTGCACA GGCAGAATGC CGGCGTGGTG GGCCAGGACA GCGAGACAAT CGAACTGGCC 3420TCCCTGCACA GGCAGAATGC CGGCGTGGTG GGCCAGGACA GCGAGACAAT CGAACTGGCC 3420

CCCGAGTATG CCGAGGCCAT TGCCACAAGA GCCGGCGCTC TGGCCGGCAT CAGCCCCATG 3480CCCGAGTATG CCGAGGCCAT TGCCACAAGA GCCGGCGCTC TGGCCGGCAT CAGCCCCATG 3480

TTCCAGCCCT GCGTGGTGCC TCCTAAGCCC TGGACAGGCA TCACAGGCGG CGGATACTGG 3540TTCCAGCCCT GCGTGGTGCC TCCTAAGCCC TGGACAGGCA TCACAGGCGG CGGATACTGG 3540

GCCAACGGCA GACGCCCTCT GGCTCTGGTG CGGACCCACA GCAAGAAAGC CCTGATGCGC 3600GCCAACGGCA GACGCCCTCT GGCTCTGGTG CGGACCCACA GCAAGAAAGC CCTGATGCGC 3600

TACGAGGACG TGTACATGCC CGAGGTGTAC AAGGCCATCA ACATTGCCCA GAACACCGCC 3660TACGAGGACG TGTACATGCC CGAGGTGTAC AAGGCCATCA ACATTGCCCA GAACACCGCC 3660

TGGAAGATCA ACAAGAAAGT GCTGGCCGTG GCCAATGTGA TCACCAAGTG GAAGCACTGC 3720TGGAAGATCA ACAAGAAAGT GCTGGCCGTG GCCAATGTGA TCACCAAGTG GAAGCACTGC 3720

CCCGTGGAGG ACATCCCCGC CATCGAGCGG GAGGAACTGC CCATGAAGCC CGAGGACATC 3780CCCGTGGAGG ACATCCCCGC CATCGAGCGG GAGGAACTGC CCATGAAGCC CGAGGACATC 3780

GACATGAACC CCGAGGCCCT GACAGCCTGG AAAAGGGCCG CTGCCGCCGT GTACCGGAAG 3840GACATGAACC CCGAGGCCCT GACAGCCTGG AAAAGGGCCG CTGCCGCCGT GTACCGGAAG 3840

GACAAGGCCC GGAAGTCCCG GCGGATCAGC CTGGAGTTCA TGCTGGAACA GGCCAACAAG 3900GACAAGGCCC GGAAGTCCCG GCGGATCAGC CTGGAGTTCA TGCTGGAACA GGCCAACAAG 3900

TTCGCCAACC ACAAGGCCAT TTGGTTCCCT TACAACATGG ACTGGCGGGG CAGAGTGTAC 3960TTCGCCAACC ACAAGGCCAT TTGGTTCCCT TACAACATGG ACTGGCGGGG CAGAGTGTAC 3960

GCCGTGAGCA TGTTCAATCC ACAAGGCAAC GACATGACCA AGGGGCTGCT GACCCTGGCC 4020GCCGTGAGCA TGTTCAATCC ACAAGGCAAC GACATGACCA AGGGGCTGCT GACCCTGGCC 4020

AAGGGCAAGC CCATCGGCAA AGAGGGCTAC TACTGGCTGA AGATCCACGG CGCCAACTGC 4080AAGGGCAAGC CCATCGGCAA AGAGGGCTAC TACTGGCTGA AGATCCACGG CGCCAACTGC 4080

GCTGGCGTGG ACAAGGTGCC CTTCCCAGAG CGGATCAAGT TCATCGAGGA AAACCACGAG 4140GCTGGCGTGG ACAAGGTGCC CTTCCCAGAG CGGATCAAGT TCATCGAGGA AAACCACGAG 4140

AACATCATGG CCTGCGCCAA GAGCCCTCTA GAAAACACTT GGTGGGCCGA GCAGGACAGC 4200AACATCATGG CCTGCGCCAA GAGCCCTCTA GAAAACACTT GGTGGGCCGA GCAGGACAGC 4200

CCCTTCTGCT TCCTGGCCTT CTGCTTTGAG TACGCCGGAG TGCAGCACCA CGGCCTGAGC 4260CCCTTCTGCT TCCTGGCCTT CTGCTTTGAG TACGCCGGAG TGCAGCACCA CGGCCTGAGC 4260

TACAACTGCA GCCTGCCCCT GGCCTTCGAT GGCAGCTGCA GCGGCATCCA GCACTTCAGC 4320TACAACTGCA GCCTGCCCCT GGCCTTCGAT GGCAGCTGCA GCGGCATCCA GCACTTCAGC 4320

GCCATGCTGA GGGACGAAGT GGGCGGCAGA GCCGTGAATC TGCTGCCAAG CGAGACAGTG 4380GCCATGCTGA GGGACGAAGT GGGCGGCAGA GCCGTGAATC TGCTGCCAAG CGAGACAGTG 4380

CAGGACATCT ACGGGATCGT GGCCAAGAAA GTGAACGAGA TCCTGCAGGC CGACGCCATC 4440CAGGACATCT ACGGGATCGT GGCCAAGAAA GTGAACGAGA TCCTGCAGGC CGACGCCATC 4440

AACGGCACCG ACAACGAGGT GGTGACCGTG ACCGATGAGA ACACCGGCGA GATCAGCGAG 4500AACGGCACCG ACAACGAGGT GGTGACCGTG ACCGATGAGA ACACCGGCGA GATCAGCGAG 4500

AAAGTGAAGC TCGGCACCAA GGCCCTGGCT GGCCAGTGGC TGGCCTACGG CGTGACCAGA 4560AAAGTGAAGC TCGGCACCAA GGCCCTGGCT GGCCAGTGGC TGGCCTACGG CGTGACCAGA 4560

TCCGTGACCA AGCGGAGCGT GATGACACTG GCCTATGGCA GCAAAGAGTT CGGCTTCCGG 4620TCCGTGACCA AGCGGAGCGT GATGACACTG GCCTATGGCA GCAAAGAGTT CGGCTTCCGG 4620

CAGCAGGTGC TGGAAGATAC CATCCAGCCT GCCATCGACA GCGGCAAGGG GCTGATGTTC 4680CAGCAGGTGC TGGAAGATAC CATCCAGCCT GCCATCGACA GCGGCAAGGG GCTGATGTTC 4680

ACCCAGCCCA ACCAGGCCGC TGGCTACATG GCCAAGCTCA TATGGGAGAG CGTGTCCGTG 4740ACCCAGCCCA ACCAGGCCGC TGGCTACATG GCCAAGCTCA TATGGGAGAG CGTGTCCGTG 4740

ACAGTGGTGG CCGCCGTGGA GGCCATGAAT TGGCTGAAGT CCGCCGCCAA ACTGCTGGCC 4800ACAGTGGTGG CCGCCGTGGA GGCCATGAAT TGGCTGAAGT CCGCCGCCAA ACTGCTGGCC 4800

GCTGAAGTGA AGGACAAAAA GACCGGCGAA ATCCTGCGGA AGAGATGCGC CGTGCACTGG 4860GCTGAAGTGA AGGACAAAAA GACCGGCGAA ATCCTGCGGA AGAGATGCGC CGTGCACTGG 4860

GTGACCCCCG ATGGCTTCCC CGTGTGGCAG GAGTACAAGA AGCCCATCCA GACCCGGCTG 4920GTGACCCCCG ATGGCTTCCC CGTGTGGCAG GAGTACAAGA AGCCCATCCA GACCCGGCTG 4920

AACCTGATGT TCCTGGGCCA GTTCAGACTG CAGCCCACCA TCAACACCAA CAAGGACTCC 4980AACCTGATGT TCCTGGGCCA GTTCAGACTG CAGCCCACCA TCAACACCAA CAAGGACTCC 4980

GAGATCGACG CCCACAAGCA GGAAAGCGGC ATTGCCCCCA ACTTCGTGCA CAGCCAGGAC 5040GAGATCGACG CCCACAAGCA GGAAAGCGGC ATTGCCCCCA ACTTCGTGCA CAGCCAGGAC 5040

GGCAGCCACC TGAGAAAGAC CGTGGTGTGG GCTCACGAGA AGTACGGCAT CGAGAGCTTC 5100GGCAGCCACC TGAGAAAGAC CGTGGTGTGG GCTCACGAGA AGTACGGCAT CGAGAGCTTC 5100

GCCCTGATCC ACGACAGCTT CGGCACCATT CCCGCCGACG CCGCCAACCT GTTCAAGGCC 5160GCCCTGATCC ACGACAGCTT CGGCACCATT CCCGCCGACG CCGCCAACCT GTTCAAGGCC 5160

GTGCGGGAGA CAATGGTGGA CACCTACGAG AGCTGCGACG TGCTGGCCGA CTTCTACGAC 5220GTGCGGGAGA CAATGGTGGA CACCTACGAG AGCTGCGACG TGCTGGCCGA CTTCTACGAC 5220

CAGTTCGCCG ACCAGCTGCA CGAGAGCCAG CTGGACAAGA TGCCCGCCCT GCCCGCCAAG 5280CAGTTCGCCG ACCAGCTGCA CGAGAGCCAG CTGGACAAGA TGCCCGCCCT GCCCGCCAAG 5280

GGGAACCTGA ACCTGCGGGA CATCCTGGAA AGCGACTTCG CCTTCGCCTG A 5331 (서열번호 45)GGGAACCTGA ACCTGCGGGA CATCCTGGAA AGCGACTTCG CCTTCGCCTG A 5331 (SEQ ID NO: 45)

상기 키메라 DdRp에 핵국지화신호(Nuclear localization signals, NLS)이 위치할 수도 있다. NLS가 없는 키메라 DdRp는 대부분 세포질에 남아있는 반면, NLS를 포함하는 단백질은 핵에 국한하여 분포한다. NLS가 없는 키메라 DdRp는 세포질 또는 NLS를 포함하는 키메라 DdRp는 핵에서 효소적으로 활성화되어 염색체 또는 플라스미드 DNA에 배치된 T7 프로모터에서 선택적으로 전사를 시작하고 특정 T7 종결서열에서 중지할 수 있다. Nuclear localization signals (NLS) may be located in the chimeric DdRp. The chimeric DdRp without NLS mostly remains in the cytoplasm, whereas the protein containing NLS is confined to the nucleus. Chimeric DdRp without NLS can be activated enzymatically in the nucleus, either in the cytoplasm or chimeric DdRp with NLS to selectively start transcription at the T7 promoter placed in chromosomal or plasmid DNA and stop at specific T7 terminator sequences.

상기 SM_키메라 DdRp DNA 절편의 구성하는 단위 요소들의 염기서열은 다음과 같다. The base sequence of the unit elements constituting the SM_chimeric DdRp DNA fragment is as follows.

본 발명에서 <T7 promoter - 5'UTR - NP868R-T7RNAP - muag - A64 - C30 - 히스톤-SL>로 구성된 SM_DdRp DNA 절편을 합성하였으며(Biosynthiis,미국), 이를 주형으로 정방향 프라이머 5'-AGATCTTAAT ACGACTCACT ATAG GAGACC ACAACGGTTTC CCTCTAGAAA GAACC ATGGAATTC GCCAGCCTGG A-3'(서열번호 43) 및 역방향 프라이머 5'-GTTAACTGGT GGCTCTAAAA GAGCCTTTGG-3' (서열번호 44)을 사용하여 증폭하였다. 여기서 T7pol의 표적 서열에 밑줄이 그어져 있다. 사용된 프라이머의 양 말단은 BglII/HpaI 인식서열이 포함되어 있다. In the present invention, a SM_DdRp DNA fragment consisting of <T7 promoter - 5'UTR - NP868R-T7RNAP - muag - A64 - C30 - histone-SL> was synthesized (Biosynthiis, USA), and the forward primer 5'-AGATCT TAAT ACGACTCACT was used as a template. Amplification was performed using ATAG GAGACC ACAACGGTTTC CCTCTAGAAA GAACC ATGGAATTC GCCAGCCTGG A -3' (SEQ ID NO: 43) and reverse primer 5'-GTTAAC TGGT GGCTCTAAAA GAGCCTTTGG -3' (SEQ ID NO: 44). Here the target sequence of T7pol is underlined. Both ends of the primers used include BglII/HpaI recognition sequences.

상기 DdRp가 NP868R-T7RNAP를 사용한 SM_DdRp DNA 절편를 포함하는 PCR 산물은 BglII/HpaI 효소를 사용하여 절단한 다음, BglII/HpaI 효소로 선형화된 pCI-neo 벡터와 T4 DNA ligase를 이용하여 클로닝 반응을 하였다. 상기 반응용액을 대장균에 형질주입하고 선정된 균주에서 플라스미드를 분리하여 BglII/HpaI 제한효소를 처리한 후 전기영동을 하였다(도 11).The PCR product containing the SM_DdRp DNA fragment in which DdRp is NP868R-T7RNAP was digested using BglII/HpaI enzymes, and then a cloning reaction was performed using a pCI-neo vector linearized with BglII/HpaI enzymes and T4 DNA ligase. The reaction solution was transfected into E. coli, and the plasmid was isolated from the selected strain, treated with BglII/HpaI restriction enzymes, and then electrophoresed (FIG. 11).

상기에서 <T7 프로모터 다음에 5'UTR, NP868R-T7RNAP를 코딩하는 DNA 절편, 3'UTR, A64 폴리(A) 서열, 폴리(C) 서열(C30) 및 히스톤 스템-루프 서열(히스톤-SL)서열>로 구성된 SM_DdRp DNA 절편로 제작된 재조합 pCI-neo 벡터를 auto_SM_키메라 DdRp 발현 카세라고 지칭하였다.In the above <T7 promoter followed by 5'UTR, DNA fragment encoding NP868R-T7RNAP, 3'UTR, A64 poly(A) sequence, poly(C) sequence (C30) and histone stem-loop sequence (histone-SL) The recombinant pCI-neo vector constructed with the SM_DdRp DNA fragment consisting of sequence> was referred to as auto_SM_chimeric DdRp expression case.

1-3. 유전체 편집 도구 DNA(DNAge) 발현 카세트1-3. Genome editing tool DNA (DNAge) expression cassette

일반적으로 원핵생물과 진행생물은 발현 카세트에 사용하는 프로모터를 달리하고 있다. 본 발명의 자가전사 RNA/DNA 시스템에서 사용하는 발현 카세트는 원핵생물이나 진행생물 특히 포유동물, 식물 등에 공통적으로 선정된 DdRp에 상응하는 프로모터를 사용할 수 있다. 예를 들어 DdRp가 T7 Polymerase인 경우는 T7 프로모터를 이용하여 제작할 수 있다. In general, prokaryotes and prokaryotes use different promoters for expression cassettes. For the expression cassette used in the self-transcribed RNA/DNA system of the present invention, a promoter corresponding to DdRp commonly selected for prokaryotes or progenitors, particularly mammals, plants, and the like may be used. For example, when DdRp is T7 Polymerase, it can be prepared using the T7 promoter.

본 발명에서 유전체 편집 도구를 코딩하는 DNAge 발현 카세트는 상기 DdRp RNA 발현 카세트 또는 auto_DdRp 발현 카세트에서 합성되는 DdRp 또는 NP868R-T7RNAP에 의해 전사될 수 있는 표적화 엔도뉴클레아제를 코딩하는 DNAen 절편 및 가이드 핵산을 코딩하는 DNAsg 절편으로 구성될 수 있다. <도 3 및 5>에 제시한 내용처럼 본 발명의 DNAen 절편 및 DNAsg 절편은 각각 독립적인 발현 카세트에 제작되거나, 하나의 발현 카세트에 제작될 수도 있다.In the present invention, the DNAge expression cassette encoding the genome editing tool comprises a DNAen fragment encoding a targeting endonuclease that can be transcribed by DdRp or NP868R-T7RNAP synthesized in the DdRp RNA expression cassette or the auto_DdRp expression cassette and a guide nucleic acid. It may consist of an encoding DNAsg fragment. As shown in <Figs. 3 and 5>, the DNAen fragment and DNAsg fragment of the present invention may be produced in independent expression cassettes, or may be produced in one expression cassette.

하나의 발현 카세트에 제작하는 DNAge 절편은 <DNAen+DNAsg> 형태로 (T7 프로모터 - 5'UTR - <NLS+표적화 엔도뉴클레아제+NLS> - muag - A64 - C30 - 히스톤SL)로 구성된 DNA 절편과 (T7 프로모터 - sgRNA와 T7 전사종결서열)을 코딩하는 DNA 절편으로 구성할 수 있다. The DNAge fragment produced in one expression cassette is in the form of <DNAen + DNAsg> (T7 promoter - 5'UTR - <NLS + targeting endonuclease + NLS> - muag - A64 - C30 - histone SL) and It can be composed of a DNA fragment encoding (T7 promoter - sgRNA and T7 transcription termination sequence).

상기 표적화 엔도뉴클레아제는 RNA-guided 엔도뉴클레아제, DNA-guided 엔도뉴클레아제 및 M-MLV 역전사 효소와 Cas9 H840A nickase의 융합 단백질 등이 있을 수 있다. 가이드 핵산은 sgRNA 유형, tRNA-sgRNA 유형, 인산화된 단일가닥 DNA 유형 및 pegRNA 유형 등이 있을 수 있다.The targeting endonuclease may include RNA-guided endonuclease, DNA-guided endonuclease, and a fusion protein of M-MLV reverse transcriptase and Cas9 H840A nickase. The guide nucleic acid may be of an sgRNA type, a tRNA-sgRNA type, a phosphorylated single-stranded DNA type, and a pegRNA type.

하나의 발현 카세트에 제작하는 DNAge 절편은 <DNAen+DNAsg> 형태로 먼저, DNAen은 (T7 프로모터 - 5'UTR - <NLS+표적화 엔도뉴클레아제+NLS> - muag - A64 - C30 - 히스톤SL)로 구성된 DNA 절편은 (T7 프로모터 - 5'UTR), (muag - A64 - C30 - 히스톤SL)와 <NLS+표적화 엔도뉴클레아제+NLS>로 나누어 제조하였다. BglII 인식시얼-(T7 프로모터 - 5'UTR)-BamHI 인식서열, SalI 인식서열-(muag - A64 - C30 - 히스톤SL)-EcoRI 인식서열을 유기합성으로 제조하였다(Biosynthesis, 미국), 그리고 BamHI 인식서열-<NLS+표적화 엔도뉴클레아제+NLS>-SalI 인식서열은 상업용 플라스미드를 주형으로 하기에 기술한 PCR 방법으로 제조하였다. The DNAge fragment produced in one expression cassette is first in the form of <DNAen+DNAsg>, and the DNAen is (T7 promoter - 5'UTR - <NLS + targeting endonuclease + NLS> - muag - A64 - C30 - histone SL). The constructed DNA fragment was prepared by dividing it into (T7 promoter - 5'UTR), (muag - A64 - C30 - histone SL) and <NLS + targeting endonuclease + NLS>. BglII recognition sequence-(T7 promoter - 5'UTR)-BamHI recognition sequence, SalI recognition sequence-(muag-A64-C30-histone SL)-EcoRI recognition sequence was prepared by organic synthesis (Biosynthesis, USA), and BamHI Recognition sequence-<NLS+targeting endonuclease+NLS>-SalI recognition sequence was prepared by the PCR method described below using a commercial plasmid as a template.

세 개의 DNA 절편을 제한효소 및 ligase로 재조합하여 얻은 DNAen을 PCR로 증폭하였다. 이때 정방향 프라이머 (5'-AGATCTTAAT ACGACTCACT ATAGGGAGACCAC AACGGUUUCC CUCU-3', 서열번호 43), 역방향 프라이머(5'-GAATTCGGT GGCTCTAAAA GAGCCTTTGG-3', 서열번호 51)를 사용하여 양 말단에 BglII/EcoRI 인식서열이 있는 PCR 산물을 대량으로 확보하였다. DNAen obtained by recombination of three DNA fragments with restriction enzymes and ligases was amplified by PCR. At this time, BglII/EcoRI at both ends using a forward primer (5'- AGATCT TAAT ACGACTCACT ATAG GGAGACCAC AACGGUUUCC CUCU -3', SEQ ID NO: 43), and a reverse primer (5'- GAATTC GGT GGCTCTAAAA GAGCCTTTGG-3', SEQ ID NO: 51) PCR products with recognition sequences were obtained in large quantities.

또한, DNAsg는 (T7 프로모터 + 가이드 핵산 + T7 전사종결서열)을 코딩하는 DNA 절편이며, 이를 유기합성하여 PCR방법으로 대량 증폭하였다. 이때 정방향 프라이머 (5'-GAATTCTAAT ACGACTCACT ATAG-3', 서열번호 74) 및 역방향 프라이머 (5'-GTTAACGGT GGCTCTAAAA GAGCCTTTGG-3', 서열번호 44)를 사용하여 PCR 산물의 양 말단에 EcoRI/HpaI 인식서열을 부여하였다. In addition, DNAsg is a DNA fragment encoding (T7 promoter + guide nucleic acid + T7 transcription termination sequence), which was organically synthesized and mass amplified by PCR. At this time, EcoRI / HpaI at both ends of the PCR product using a forward primer (5'- GAATTC TAAT ACGACTCACT ATAG-3', SEQ ID NO: 74) and a reverse primer (5'- GTTAAC GGT GGCTCTAAAA GAGCCTTTGG-3', SEQ ID NO: 44) A recognition sequence was assigned.

상기 증폭된 PCR 산물들을 EcoRI 제한효소 처리한 후 T4 DNA ligase를 두 DNA 절편을 결합시켰다.After treating the amplified PCR products with EcoRI restriction enzyme, T4 DNA ligase was used to bind the two DNA fragments.

결합된 DNA 절편을 다시 증폭하여 얻은 산물을 BglII과 HpaI을 처리하여 5'말단에 BglII 인식서열, 3'말단에 HpaI 인식서열이 있는 auto_(DdRp+DNAge) DNA 절편를 제조하여 BglII/HpaI 제한효소로 선형화된 pCI-neo 벡터에 <표 2>와 같이 ligation 반응하여 준비된 DNA 절편을 클로닝였다.The product obtained by re-amplifying the bound DNA fragment was treated with BglII and HpaI to prepare an auto_(DdRp+DNAge) DNA fragment having a BglII recognition sequence at the 5' end and an HpaI recognition sequence at the 3' end, followed by BglII/HpaI restriction enzymes. The DNA fragment prepared by ligation reaction to the linearized pCI-neo vector as shown in <Table 2> was cloned.

재조합된 발현벡터, pCI-neo 벡터에 있는 DNAge DNA 절편의 구성은 <T7 promoter - 5'UTR - DNAen - muag - A64 - C30 - 히스톤-SL- T7 promoter - DNAsg - T7 전사종결서열>이다. The composition of the DNAge DNA fragment in the recombinant expression vector, pCI-neo vector is <T7 promoter - 5'UTR - DNAen - muag - A64 - C30 - histone-SL- T7 promoter - DNAsg - T7 transcription termination sequence>.

Ligation 반응의 조성Composition of Ligation Reaction 성분 ingredient 부피 volume DNA fragment (0.5~50 μmol/L) DNA fragment (0.5-50 μmol/L) 2 μl2 μl CI-neo (~100 ng/μl)CI-neo (~100 ng/μl) 2 μl2 μl 10× T4 DNA Ligase Buffer (NEB) 10× T4 DNA Ligase Buffer (NEB) 1.5 μl1.5 μl 10× BSA 10x BSA 1.5 μl1.5 μl T4 DNA Ligase (HC, NEB) T4 DNA Ligase (HC, NEB) 1 μl1 μl ddH2O ddHO 7 μl7 μl Total volume Total volume 15 μl15 μl

5μl의 반응 혼합물로 대장균을 형질 전환하고 엠피실린 LB 한천 플레이트에서 클론을 선정하였다(도 12).E. coli was transformed with 5 μl of the reaction mixture, and clones were selected on the ampicillin LB agar plate (FIG. 12).

상기 제조된 DNAge DNA 절편을 포유류 발현 벡터로 안정화 세포주를 구축할 수 있는 pCI-neo 벡터(Promega 사, 미국) 뿐만이 아니라, AdEasy Adenoviral Vector System(Agilent Technology, 미국) 및 ViraSafe™ Lentiviral Exprision System(Cell Biolabs, 미국)에 삽입하여 DNAge 발현 카세트를 제조할 수 있다.In addition to the pCI-neo vector (Promega, USA) that can construct a stable cell line using the prepared DNAge DNA fragment as a mammalian expression vector, AdEasy Adenoviral Vector System (Agilent Technology, USA) and ViraSafe™ Lentiviral Exprision System (Cell Biolabs) , USA) to prepare a DNAge expression cassette.

<도 13>에 제시한 내용처럼, 본 발명에서 상기 DNAge의 표적 유전자는 VEGF, PD-L1 및 HEK3 유전자를 포함하며 이들의 표적서열에 대한 DNAsg를 제조하였다. 이들에 국한된 것은 아니다.As shown in <Fig. 13>, the target genes of the DNAge in the present invention include VEGF, PD-L1 and HEK3 genes, and DNAsg for their target sequences was prepared. It is not limited to these.

(a) 표적화 엔도뉴클레아제를 코딩하는 DNA(DNAen) 절편(a) DNA (DNAen) fragment encoding the targeting endonuclease

본 발명의 DNAen 절편을 제조하기 위해서 (T7 프로모터 + 5'UTR - <NLS+표적화 엔도뉴클레아제+NLS> - muag - A64 - C30 - 히스톤SL)를 포함하는 DNAen 절편은 유기합성으로 제조되었다(Biosynthesis, 미국). NLS는 <표 3>의 염기서열을 사용하였다.To prepare the DNAen fragment of the present invention (T7 promoter + 5'UTR - <NLS + targeting endonuclease + NLS> - muag - A64 - C30 - histone SL), a DNAen fragment including histone SL was prepared by organic synthesis (Biosynthesis) , United States of America). For NLS, the nucleotide sequence of <Table 3> was used.

NLS 서열NLS sequence 종류Kinds 염기서열base sequence 서열번호SEQ ID NO: NLSNLS PKKKRKV
(N-말단)
PKKKRKV
(N-terminal)
CCCAAGAAGA AGAGGAAGGT G (서열번호 35)CCCAAGAAGA AGAGGAAGGT G (SEQ ID NO: 35) 2121
CCAAAGAAGA AGAGGAAGGT T (서열번호 36)CCAAAGAAGA AGAGGAAGGT T (SEQ ID NO: 36) 2121 SGGSPKKKRKV
(C-말단)
SGGSPKKKRKV
(C-terminal)
TCGGGGGGGA GCCCAAAGAA GAAGCGGAAG GTG (서열번호 37)TCGGGGGGGA GCCCAAAGAA GAAGCGGAAG GTG (SEQ ID NO: 37) 3333

이를 주형으로 PCR 방법으로 증폭하였다. 이때 PCR 프라이머를 사용하여 양 말단에 BglII/HpaI 인식서열을 부여하였다. 증폭된 DNA 절편을 BglII/HpaI처리하여 5'말단에 BglII 절단지점 및 3'말단에 HpaI 절단지점을 제조하였다. pCI-neo 벡터(Promega 사, 미국)를 BglII/HpaI 제한효소 처리를 한 후 T4 DNA ligase를 이용하여 <표 2>와 같이 ligation 반응하여 준비된 DNA 절편을 클로닝하였다. This was amplified by PCR as a template. At this time, BglII/HpaI recognition sequences were given to both ends using PCR primers. The amplified DNA fragment was treated with BglII/HpaI to prepare a BglII cleavage site at the 5' end and an HpaI cleavage site at the 3' end. After pCI-neo vector (Promega, USA) was treated with BglII/HpaI restriction enzymes, the prepared DNA fragment was cloned by ligation reaction as shown in <Table 2> using T4 DNA ligase.

본 발명의 DNAen 절편에 있는 <NLS+표적화 엔도뉴클레아제+NLS>의 엔도뉴클레아제를 구체적으로 살펴보면,Looking specifically at the endonuclease of <NLS + targeting endonuclease + NLS> in the DNAen fragment of the present invention,

① RNA-guided 엔도뉴클레아제: 한국 공개특허 10-2019-0120287에서, Cas9 뉴클레아제변이체 eSpCas9 (1.0) (K810A/K1003A/R1060A), eSpCas9(1.1) (K848A/K1003A/R1060A) 및 Cas9 뉴클레아제변이체 SpCas9-HF1(N497A/R661A/Q695A/Q926A)은 유전체 편집시 오프-타겟 비율을 현저하게 낮출 수 있으며, 즉 특이성이 높은 것으로, 보고된 바 있다. ① RNA-guided endonuclease: In Korean Patent Publication No. 10-2019-0120287, Cas9 nuclease variant eSpCas9 (1.0) (K810A / K1003A / R1060A), eSpCas9 (1.1) (K848A / K1003A / R1060A) and Cas9 nuclease It has been reported that the clease mutant SpCas9-HF1 (N497A/R661A/Q695A/Q926A) can significantly lower the off-target ratio during genome editing, that is, it has high specificity.

본 발명에서 사용하는 SpCas9-HF1(N497A/R661A/Q695A/Q926A) DNA는 유전체 편집시 오프-타겟 비율을 현저하게 낮출 수 있으며, 즉 특이성이 높은 Cas9 뉴클레아제변이체로, Addgene(미국)에서 구입한 pJSC111(Addgene #101209)에서 상응하는 염기서열을 증폭하여 제조하였다. The SpCas9-HF1 (N497A/R661A/Q695A/Q926A) DNA used in the present invention can significantly lower the off-target ratio during genome editing, that is, a Cas9 nuclease variant with high specificity, purchased from Addgene (USA). It was prepared by amplifying the corresponding nucleotide sequence in one pJSC111 (Addgene #101209).

② DNA-guided 엔도뉴클레아제: 본 발명에서는 한국 공개특허 10-2019-0102070에서 본 발명에 사용한 알고너트(Argonaute)인 HuAgo염기서열을 확인하였다. NgAgo의 유전자 서열은 변형되었으며, 이 변형으로 포유동물 세포에서 알고너트 폴리펩티드의 발현 및/또는 활성이 향상되었다. 이를 'HuAgo'라고 지칭하였으며 포유동물 세포에서 DNA 가이드된 유전자 편집 뉴클레아제로 작용한다. ② DNA-guided endonuclease: In the present invention, the HuAgo nucleotide sequence of Argonaute used in the present invention was confirmed in Korean Patent Application Laid-Open No. 10-2019-0102070. The gene sequence of NgAgo was modified, and this modification improved the expression and/or activity of the algonut polypeptide in mammalian cells. It was referred to as 'HuAgo' and acts as a DNA-guided gene-editing nuclease in mammalian cells.

HuAgo DNA는 Addgene에서 구입한 NLS-NgAgo-GK(Addgene #78253)에서 <NLS-NgAgo-NLS> 염기서열을 증폭하여 제조하였다. HuAgo DNA was prepared by amplifying the <NLS-NgAgo-NLS> sequence from NLS-NgAgo-GK (Addgene #78253) purchased from Addgene.

③ M-MLV 역전사 효소와 Cas9 H840A nickase의 융합 단백질: 최근에는 이중 가닥 파손이나 donor DNA repair templates 없이 표적 삽입, 결실 및 점 돌연변이(point mutations)를 가능하게 하는 프라임 편집 시스템(prime editing system)이 포유류 세포에서 효율적으로 기능하는 것이 확인되었다(Anzalone, A. V. et al. Nature 576, 149--157 (2019)). 이 보고서에서 3 세대 프라임 편집기(third generation of prime editor, PE3)는 돌연변이된 M-MLV-RT (Moloney murine leukemia virus reverse transcriptase)를 촉매 장애가 있는 Cas9 (H840A) (Cas9 nickase, nCas9)의 C 말단에 융합하여 설계되었다. Cas9 효소는 한 가닥의 DNA만 절단하도록 변형되었고 하나의 역전사효소(reverse transcriptase)는 하나의 RNA 주형을 복사함으로써 새로운 DNA를 생성하는 역할을 한다. 가공된 pegRNA(prime editing guide RNA)가 편집기를 표적부위로 이동시키면, Cas9이 한 가닥의 DNA를 절단한다. 특정 부위를 표적으로 하는 단일 키메라 가이드 RNA (sgRNA), 프라이머 결합 부위 (PBS) 및 원하는 편집을 코딩하는 역전사 (RT) 템플릿으로 구성된 프라임 편집 가이드 RNA (pegRNA)로 프로그래밍된다. ③ Fusion protein of M-MLV reverse transcriptase and Cas9 H840A nickase: Recently, a prime editing system that enables target insertion, deletion and point mutations without double-strand breaks or donor DNA repair templates has been developed in mammals. It has been shown to function efficiently in cells (Anzalone, AV et al. Nature 576, 149--157 (2019)). In this report, a third generation of prime editor (PE3) inserted a mutated M-MLV-RT (Moloney murine leukemia virus reverse transcriptase) into the C terminus of a catalytically impaired Cas9 (H840A) (Cas9 nickase, nCas9). designed by fusion. Cas9 enzyme is modified to cut only one strand of DNA, and one reverse transcriptase plays a role in creating new DNA by copying one RNA template. When the processed pegRNA (prime editing guide RNA) moves the editor to the target site, Cas9 cuts one strand of DNA. It is programmed with a prime editing guide RNA (pegRNA) consisting of a single chimeric guide RNA (sgRNA) targeting a specific site, a primer binding site (PBS) and a reverse transcription (RT) template encoding the desired editing.

상기 PE3의 작용기전을 살펴보면, pegRNA에 있는 '편집할 서열'을 표적 DNA에 전달하기 위해, 역전사 효소는 RNA를 읽은 다음 상응하는 DNA 문자를 절단된 DNA의 말단에 부착한다. 세포 속에 있는 엔도뉴클레아제(endonuclease)가 원래 DNA 서열을 절단하고, 유전체를 새로운 뉴클레오타이드로 교정한다. 이제 표적부위에는 하나의 편집된 가닥과 하나의 미편집된 가닥이 남는다. 이러한 불일치를 해소하고, 편집된 DNA를 영구적으로 장착하기 위해, 또 하나의 가이드 RNA가 프라임 편집기를 안내하여 미편집된 DNA 가닥을 절단한다. 이러한 절단은 세포로 하여금 절단된 가닥을 복구하도록 촉진하고, 세포는 편집된 가닥을 주형으로 이용하여 편집을 완료한다.Looking at the mechanism of action of PE3, in order to transfer the 'sequence to be edited' in the pegRNA to the target DNA, the reverse transcriptase reads the RNA and attaches the corresponding DNA letter to the end of the cut DNA. An endonuclease in the cell cuts the original DNA sequence and corrects the genome with new nucleotides. Now, one edited strand and one unedited strand remain at the target site. To resolve this discrepancy and permanently mount the edited DNA, another guide RNA guides the prime editor to cut the unedited DNA strand. This cleavage prompts the cell to repair the cleaved strand, and the cell uses the edited strand as a template to complete the editing.

M-MLV 역전사 효소와 Cas9 H840A nickase의 융합 단백질 DNA는 문헌 Anzalone, A. V. et al. Nature 576, 149--157 (2019)를 참조하여 얻은 염기서열을 사용하였다. The fusion protein DNA of M-MLV reverse transcriptase and Cas9 H840A nickase is described in Anzalone, A. V. et al. The nucleotide sequence obtained by referring to Nature 576, 149--157 (2019) was used.

NLS-SpCas9H840A-linker-M_MLV_RT-NLS NLS - SpCas9H840A -linker-M_MLV_RT- NLS

atgaagaggacagccgatggcagcgagttcgagagccctaagaagaagaggaaggtggacaagaagtactcgatcggcctcgatattgggactaactctgttggctgggccgtgatcaccgacgagtacaaggtgccctcaaagaagttcaaggtcctgggcaacaccgatcggcattccatcaagaagaatctcattggcgctctcctgttcgacagcggcgagacggctgaggctacgcggctcaagcgcaccgcccgcaggcggtacacgcgcaggaagaatcgcatctgctacctgcaggagattttctccaacgagatggcgaaggttgacgattctttcttccacaggctggaggagtcattcctcgtggaggaggataagaagcacgagcggcatccaatcttcggcaacattgtcgacgaggttgcctaccacgagaagtaccctacgatctaccatctgcggaagaagctcgtggactccacagataaggcggacctccgcctgatctacctcgctctggcccacatgattaagttcaggggccatttcctgatcgagggggatctcaacccggacaatagcgatgttgacaagctgttcatccagctcgtgcagacgtacaaccagctcttcgaggagaaccccattaatgcgtcaggcgtcgacgcgaaggctatcctgtccgctaggctctcgaagtctcggcgcctcgagaacctgatcgcccagctgccgggcgagaagaagaacggcctgttcgggaatctcattgcgctcagcctggggctcacgcccaacttcaagtcgaatttcgatctcgctgaggacgccaagctgcagctctccaaggacacatacgacgatgacctggataacctcctggcccagatcggcgatcagtacgcggacctgttcctcgctgccaagaatctgtcggacgccatcctcctgtctgatattctcagggtgaacaccgagattacgaaggctccgctctcagcctccatgatcaagcgctacgacgagcaccatcaggatctgaccctcctgaaggcgctggtcaggcagcagctccccgagaagtacaaggagatcttcttcgatcagtcgaagaacggctacgctgggtacattgacggcggggcctctcaggaggagttctacaagttcatcaagccgattctggagaagatggacggcacggaggagctgctggtgaagctcaatcgcgaggacctcctgaggaagcagcggacattcgataacggcagcatcccacaccagattcatctcggggagctgcacgctatcctgaggaggcaggaggacttctaccctttcctcaaggataaccgcgagaagatcgagaagattctgactttcaggatcccgtactacgtcggcccactcgctaggggcaactcccgcttcgcttggatgacccgcaagtcagaggagacgatcacgccgtggaacttcgaggaggtggtcgacaagggcgctagcgctcagtcgttcatcgagaggatgacgaatttcgacaagaacctgccaaatgagaaggtgctccctaagcactcgctcctgtacgagtacttcacagtctacaacgagctgactaaggtgaagtatgtgaccgagggcatgaggaagccggctttcctgtctggggagcagaagaaggccatcgtggacctcctgttcaagaccaaccggaaggtcacggttaagcagctcaaggaggactacttcaagaagattgagtgcttcgattcggtcgagatctctggcgttgaggaccgcttcaacgcctccctggggacctaccacgatctcctgaagatcattaaggataaggacttcctggacaacgaggagaatgaggatatcctcgaggacattgtgctgacactcactctgttcgaggaccgggagatgatcgaggagcgcctgaagacttacgcccatctcttcgatgacaaggtcatgaagcagctcaagaggaggaggtacaccggctgggggaggctgagcaggaagctcatcaacggcattcgggacaagcagtccgggaagacgatcctcgacttcctgaagagcgatggcttcgcgaaccgcaatttcatgcagctgattcacgatgacagcctcacattcaaggaggatatccagaaggctcaggtgagcggccagggggactcgctgcacgagcatatcgcgaacctcgctggctcgccagctatcaagaaggggattctgcagaccgtgaaggttgtggacgagctggtgaaggtcatgggcaggcacaagcctgagaacatcgtcattgagatggcccgggagaatcagaccacgcagaagggccagaagaactcacgcgagaggatgaagaggatcgaggagggcattaaggagctggggtcccagatcctcaaggagcacccggtggagaacacgcagctgcagaatgagaagctctacctgtactacctccagaatggccgcgatatgtatgtggaccaggagctggatattaacaggctcagcgattacgacgtcgatgccatcgttccacagtcattcctgaaggatgactccattgacaacaaggtcctcaccaggtcggacaagaaccggggcaagtctgataatgttccttcagaggaggtcgttaagaagatgaagaactactggcgccagctcctgaatgccaagctgatcacgcagcggaagttcgataacctcacaaaggctgagaggggcgggctctctgagctggacaaggcgggcttcatcaagaggcagctggtcgagacacggcagatcactaagcacgttgcgcagattctcgactcacggatgaacactaagtacgatgagaatgacaagctgatccgcgaggtgaaggtcatcaccctgaagtcaaagctcgtctccgacttcaggaaggatttccagttctacaaggttcgggagatcaacaattaccaccatgcccatgacgcgtacctgaacgcggtggtcggcacagctctgatcaagaagtacccaaagctcgagagcgagttcgtgtacggggactacaaggtttacgatgtgaggaagatgatcgccaagtcggagcaggagattggcaaggctaccgccaagtacttcttctactctaacattatgaatttcttcaagacagagatcactctggccaatggcgagatccggaagcgccccctcatcgagacgaacggcgagacgggggagatcgtgtgggacaagggcagggatttcgcgaccgtcaggaaggttctctccatgccacaagtgaatatcgtcaagaagacagaggtccagactggcgggttctctaaggagtcaattctgcctaagcggaacagcgacaagctcatcgcccgcaagaaggactgggatccgaagaagtacggcgggttcgacagccccactgtggcctactcggtcctggttgtggcgaaggttgagaagggcaagtccaagaagctcaagagcgtgaaggagctgctggggatcacgattatggagcgctccagcttcgagaagaacccgatcgatttcctggaggcgaagggctacaaggaggtgaagaaggacctgatcattaagctccccaagtactcactcttcgagctggagaacggcaggaagcggatgctggcttccgctggcgagctgcagaaggggaacgagctggctctgccgtccaagtatgtgaacttcctctacctggcctcccactacgagaagctcaagggcagccccgaggacaacgagcagaagcagctgttcgtcgagcagcacaagcattacctcgacgagatcattgagcagatttccgagttctccaagcgcgtgatcctggccgacgcgaatctggataaggtcctctccgcgtacaacaagcaccgcgacaagccaatcagggagcaggctgagaatatcattcatctcttcaccctgacgaacctcggcgcccctgctgctttcaagtacttcgacacaactatcgatcgcaagaggtacacaagcactaaggaggtcctggacgcgaccctcatccaccagtcgattaccggcctctacgagacgcgcatcgacctgtctcagctcgggggcgactcaggcggctcatcgggcgggtcaagcgggtcggagacaccgggcacatcagagagcgctacccctgagtcatcaggcggctcttcaggcggcagctcaaccctgaacattgaggacgagtaccggctgcacgagacgagcaaggagccagacgtttcgctcggcagcacttggctctctgacttcccacaggcttgggccgagactggcggcatgggcctggccgtgcgccaggctccactgatcatccctctgaaggcgacctccaccccggtttctattaagcagtacccgatgagccaggaggccaggctggggatcaagccacacattcagcggctgctggaccagggcatcctggtgccatgccagtccccgtggaatactccgctcctgccggtgaagaagcctgggacaaacgactacaggccggttcaggatctcagggaggtgaacaagcgcgtggaggacatccatccgacagtgccgaacccgtacaatctgctgtcgggcctgcctccgagccaccagtggtacaccgtcctggacctcaaggacgctttcttctgcctgcggctgcacccgacgtctcagccgctgttcgcgttcgagtggcgcgacccagagatgggcatttccggccagctgacctggacacgcctaccccagggcttcaagaactccccgactctcttcaacgaggctctccaccgggatctcgcggacttcaggattcagcatcccgatctgatcctgctccagtatgttgacgacctcctcctggccgcgacgtcggagctggactgccagcagggcacccgggcgctgctgcagacactgggcaatctggggtaccgcgcctctgcgaagaaggcgcagatctgccagaagcaagtgaagtacctgggctacctcctgaaggagggccagcgctggctcactgaggcgaggaaggagactgttatgggccagcccactccaaagactccgaggcagctcagggagttcctcggcaaggctgggttctgccgcctgttcatccctgggttcgctgagatggctgcgccgctctacccgctgactaagccggggacactgttcaactgggggccagaccagcagaaggcgtaccaggagattaagcaggcgctgctgacggccccagcgctcggcctaccagacctgacgaagccgttcgagctgttcgttgacgagaagcaggggtacgcgaagggcgtgctgacacagaagctggggccttggcgccgcccggtcgcgtacctgtcgaagaagctggacccagtcgctgctgggtggcctccatgcctccggatggtcgctgctattgcggttctgaccaaggatgcggggaagctcacaatggggcagcctctcgtgatcctggctccacatgcggtggaggcgctggtgaagcagccaccggaccggtggctgtcgaacgctcggatgacacactaccaggcgctcctcctcgatacagaccgggttcagttcgggcctgtggttgctctgaacccagccacactgctgccactccctgaggagggcctccagcacaattgcctcgacatcctggctgaggcgcacggcacccgccctgatctcaccgaccagcctctgccagatgctgaccacacctggtacacggatgggtcctcgctgctgcaggagggccagaggaaggcgggcgccgccgtcaccacagagacagaggttatttgggccaaggccctaccggctggcaccagcgcccagcgcgctgagctgatcgcgctgactcaggcgctgaagatggccgaggggaagaagctcaatgtttacaccgactcgcggtacgcgttcgctacagctcacattcatggggagatctaccgccggcgcgggtggctgacttcggagggcaaggagattaagaataaggacgagatcctggccctgctcaaggcgctgttcctgccgaagcgcctctcaatcattcactgcccgggccaccagaagggccattcggccgaggctaggggcaatcggatggctgaccaggcggcgcggaaggcggctatcaccgagactcccgatacatctaccctcctgatcgagaactcgagcccaagcggcgggagcaagcggactgcggatgggtctgagttcgagccaaagaagaagaggaaggtgtga atgaagaggacagccgatggcagcgagttcgagagccctaagaagaagaggaaggtg agcggcgggag caagcggactgcggatgggtctgagttcgagccaaaagaagaagaggaaggtga

M-MLV 역전사 효소와 Cas9 H840A nickase의 융합 단백질은 Cas9 H840A 닉카아제(nickase)는 Cas9 효소는 DNA 서열을 절단할 수 있는 2 개의 뉴클레아제도메인, 비-표적 가닥을 절단하는 RuvC 도메인 및 표적 가닥을 절단하는 HNH 도메인을 함유한다. 840번째 아미노산 히스티딘이 알라닌으로 대체되는 Cas9에서 H840A 치환의 도입은 HNH 도메인을 불활성화시킨다. RuvC 기능 도메인만으로, 촉매적으로 손상된 Cas9는 단일가닥 닉 (single strand nick)을 도입할 수 있다. M-MLV 역전사 효소는 단일 가닥 RNA 주형으로부터 DNA를 합성하는 효소이다.The fusion protein of M-MLV reverse transcriptase and Cas9 H840A nickase is Cas9 H840A nickase Cas9 enzyme has two nuclease domains capable of cleaving a DNA sequence, a RuvC domain cleaving a non-target strand and a target Contains HNH domains that cleave strands. Introduction of the H840A substitution in Cas9 in which the histidine at amino acid position 840 is replaced with alanine inactivates the HNH domain. With only the RuvC functional domain, a catalytically damaged Cas9 can introduce a single strand nick. M-MLV reverse transcriptase is an enzyme that synthesizes DNA from a single-stranded RNA template.

pCMV-PE2 plasmid (Addgene #132775, Addgene, 미국)에서 <NLS+Cas9(H840A)-M-MLVrt(D200N, T306K, W313F, T330P, L603W)+NLS> 염기서열을 PCR로 증폭하여 M-MLV 역전사 효소와 Cas9 H840A nickase의 융합 단백질을 포함하는 BamHI 인식서열-DNA 절편-SalI 인식서열을 얻었다. M-MLV reverse transcription by amplifying the <NLS+Cas9(H840A)-M-MLVrt(D200N, T306K, W313F, T330P, L603W)+NLS> sequence from the pCMV-PE2 plasmid (Addgene #132775, Addgene, USA) by PCR A BamHI recognition sequence-DNA fragment-SalI recognition sequence including a fusion protein of the enzyme and Cas9 H840A nickase was obtained.

(b) 가이드 핵산을 코딩하는 DNA(DNAsg) 발현 카세트(b) a DNA (DNAsg) expression cassette encoding a guide nucleic acid

본 발명의 DNAsg 절편은 T7 프로모터, 가이드 핵산과 T7 전사종결서열으로 구성하고 유기합성법으로 제조하였으며(Biosynthesis, 미국), 이를 주형으로 PCR 방법으로 증폭하였다. 이때 PCR 프라이머를 사용하여 양 말단에 BglII/HpaII 인식서열을 부여하였다. 증폭된 DNA 절편을 BglII/HpaI 제한 효소를 처리하여 5'말단에 BglII 절단지점 및 3'말단에 HpaI 절단지점을 제조하였다. pCI-neo 벡터(Promega 사, 미국)를 BglII/HpaI 제한효소 처리를 한 후 T4 DNA ligase를 이용하여 <표 5>와 같이 ligation 반응하여 준비된 DNA 절편을 클로닝하였다. The DNAsg fragment of the present invention was composed of a T7 promoter, guide nucleic acid and T7 transcription termination sequence, and was prepared by organic synthesis (Biosynthesis, USA), which was amplified by PCR as a template. At this time, BglII/HpaII recognition sequences were given to both ends using PCR primers. The amplified DNA fragment was treated with BglII/HpaI restriction enzymes to prepare a BglII cleavage site at the 5' end and an HpaI cleavage site at the 3' end. After pCI-neo vector (Promega, USA) was treated with BglII/HpaI restriction enzymes, the prepared DNA fragment was cloned by ligation reaction as shown in <Table 5> using T4 DNA ligase.

하기에 DNAsg 절편에 코딩되는 가이드 핵산의 유형을 구체적으로 살펴보면,The type of guide nucleic acid encoded in the DNAsg fragment will be described in detail below.

① 본 발명의 Cas9의 유전체 편집에서 사용되는 가이드 핵산 DNAsg 절편은 sgRNA 유형을 코딩하는 DNA 절편을 포함할 수 있다. 본 실시례에서 사용하는 sgRNA는 유전체 편집에 사용하는 게놈 DNA의 엑손 내에서 23 bp 표적 염기서열(5'N20NGG-3')은 관심있는 유전자의 염기서열을 분석하는 잠재적 오프 타겟 파인더의 웹 사이뜨 (http://www.rgenome.net/cas offinder / offinder /)에서 표적 특이성을 평가하여 선정할 수 있다. 식물에서 CRISPR / Cas9 표적 부위의 게놈 전체 예측 웹 사이트의 표적 부위는 http://www.genome.arizona.edu/crispr/CRISPRsearch.html에서 검색할 수 있다.① The guide nucleic acid DNAsg fragment used in Cas9 genome editing of the present invention may include a DNA fragment encoding an sgRNA type. The sgRNA used in this example is a 23 bp target nucleotide sequence (5'N 20 NGG-3') within the exon of genomic DNA used for genome editing. Target specificity can be evaluated and selected on the site (http://www.rgenome.net/cas offinder/offinder/). The target sites of the genome-wide prediction website of CRISPR/Cas9 target sites in plants can be retrieved at http://www.genome.arizona.edu/crispr/CRISPRsearch.html.

본 발명에서 CRISPR 복합체를 이용하여 포획 대상 핵산 서열을 절단하는데 사용한 모든 RNA는 포획하고자 하는 영역의 염기 PAM 서열 앞의 18bp를 인식하도록 설계되어 있다. 본 실시예에서는 PAM 서열로서 'NGG' (N = A, T, C, G 중 한 개)가 사용되었으며, 이 NGG 서열은 streptococcus pyogenes가 특이적으로 인식하는 PAM 서열로 GG 염기 앞에 A, T, C, G 중 임의의 염기 한 개가 있다.In the present invention, all RNAs used to cut the target nucleic acid sequence using the CRISPR complex are designed to recognize 18bp of the base PAM sequence of the region to be captured. In this example, 'NGG' (one of N = A, T, C, G) was used as the PAM sequence, and this NGG sequence is a PAM sequence specifically recognized by streptococcus pyogenes, A, T, There is any one base of C or G.

본 발명에서 제조하는 유전체 편집 RNA/DNA 시스템에 의해 제공되는 DdRp에 의해 도입된 세포의 세포질에서 전사시켜서 가이드 핵산을 획득하기 위해서, <도 13>에서 제시한 내용으로, 결합부분이 상기에서처럼 설계된 sgRNA를 코딩하는 주형 DNA에는 T7 RNA polymerase와 결합하여 전사를 시작할 수 있는 T7 프로모터를 결합시켜서 준비하였다. In order to obtain a guide nucleic acid by transcription in the cytoplasm of a cell introduced by DdRp provided by the genome editing RNA/DNA system prepared in the present invention, as shown in <Fig. 13>, sgRNA in which the binding portion is designed as above It was prepared by binding the T7 promoter capable of initiating transcription by binding with T7 RNA polymerase to the encoding template DNA.

이 때 사용한 T7 프로모터는 'GGATTCTAATACGACTCACTATAGG' (서열번호 1)이고, sgRNA 주형 서열 중 포획 대상 핵산과 결합하는 18bp의 서열을 제외한 나머지 sgRNA scaffold는 다음과 같은 서열을 가진다: 5'-GTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT-3'(서열번호 38)The T7 promoter used at this time is 'GGATTCTAATACGACTCACTATAGG' (SEQ ID NO: 1), and the rest of the sgRNA scaffold except for the 18bp sequence that binds to the target nucleic acid in the sgRNA template sequence has the following sequence: 5'-GTTTTAGAGCTAGAAATAGGTGAAGTTTTAAAAGGCTAGTCGTGTTATCAACTTGAATCAGTGTTATCAACTTGAAAAAGTG SEQ ID NO: 38)

서열번호 1의 T7 프로모터 서열과 서열번호 38의 sgRNA scaffold 사이에는 'NNNNNNNNNNNNNNNNNN'(N = A, T, C, G 중 한 개, 서열번호 39) 에 해당하는 18bp의 타겟서열이 위치한다. 이러한 타겟서열은 절단하고자 하는 염기서열의 위치에 따라 달라진다.Between the T7 promoter sequence of SEQ ID NO: 1 and the sgRNA scaffold of SEQ ID NO: 38, an 18bp target sequence corresponding to 'NNNNNNNNNNNNNNNNNNNN' (N = one of A, T, C, G, SEQ ID NO: 39) is located. Such a target sequence varies depending on the position of the nucleotide sequence to be cut.

결과적으로, 합성되는 주형 DNA의 서열은 T7 프로모터와 타겟서열 및 sgRNA 주형 서열이 순차적으로 결합된 서열번호 40와 같다.As a result, the sequence of the synthesized template DNA is the same as SEQ ID NO: 40 in which the T7 promoter, the target sequence, and the sgRNA template sequence are sequentially combined.

5'-GGATTCTAAT ACGACTCACT ATAGGNNNNN NNNNNNNNNN NNNGTTTTAG AGCTAGAAAT AGCAAGTTAA AATAAGGCTA GTCCGTTATC AACTTGAAAA AGTGGCACCG AGTCGGTGCT TTTTTT-3'(서열번호 40)5'-GGATTCTAAT ACGACTCACT ATAGGNNNNN NNNNNNNNNN NNNGTTTTAG AGCTAGAAAT AGCAAGTTAA AATAAGGCTA GTCCGTTATC AACTTGAAAA AGTGGCACCG AGTCGGTGCT TTTTTT-3' (SEQ ID NO: 40)

전사종결서열 : 5'-TTTTTT-3' (서열번호 41)Transcription termination sequence: 5'-TTTTTT-3' (SEQ ID NO: 41)

다른 실시례에서 T7 프로모터를 대신하여 RNA Poly III 유형인 인간 U6 및 H1 프로모터를 사용할 수도 있다. In another embodiment, the RNA Poly III type human U6 and H1 promoters may be used in place of the T7 promoter.

U6 promoter(249개 뉴클레오타이드) : 5'-GAGGGCCTAT TTCCCATGAT TCCTTCATAT TTGCATATAC GATACAAGGC TGTTAGAGAG ATAATTGGAA TTAATTTGAC TGTAAACACA AAGATATTAG TACAAAATAC GTGACGTAGA AAGTAATAAT TTCTTGGGTA GTTTGCAGTT TTAAAATTAT GTTTTAAAAT GGACTATCAT ATGCTTACCG TAACTTGAAA GTATTTCGAT TTCTTGGCTT TATATATCTT GTGGAAAGGA CGAAACACC-3' (서열번호 42)U6 promoter (249 nucleotides): 5'-GAGGGCCTAT TTCCCATGAT TCCTTCATAT TTGCATATAC GATACAAGGC TGTTAGAGAG ATAATTGGAA TTAATTTGAC TGTAAACACA AAGATATTAG TACAAAATAC GTGACGTAGA AAGTAATAAT TTCTTGGGTA GTTTGCAGTT TTAAAATTAT GTTTTAAAAT GGACTATCAT ATGCTTACCG TAACTTGAAA GTATTTCGAT TTCTTGGCTT TATATATCTT GTGGAAAGGA CGAAACACC-3 '(SEQ ID NO: 42)

위와 같은 과정을 거쳐 T7 프로모터, sgRNA와 T7 전사종결서열을 코딩하는DNA 절편을 포함하는 DNAsg 절편은 유기합성으로 합성되었다(Biosynthesis, 미국). Through the above process, a DNAsg fragment including a DNA fragment encoding the T7 promoter, sgRNA and T7 transcription termination sequence was synthesized by organic synthesis (Biosynthesis, USA).

② 본 발명의 Cas9의 유전체 편집에 사용하는 DNAsg는 tRNA-sgRNA 유형을 코딩하는 DNA 절편을 포함할 수 있으며, tRNA 및 sgRNA의 염기서열은 아래와 같다.② DNAsg used for Cas9 genome editing of the present invention may include a DNA fragment encoding a tRNA-sgRNA type, and the nucleotide sequences of tRNA and sgRNA are as follows.

본 발명에서 CRISPR 복합체를 이용하여 여러 개의 포획 대상 핵산 서열을 절단하는데 사용한 각각의 모든 RNA는 포획하고자 하는 영역의 염기 PAM 서열 앞의 18bp를 인식하도록 설계할 수 있으며, 이들을 <도 14>에서처럼 multiple gRNA 발현 카세트(a), polycistronic tRNA-gRNA DNA 절편(b)으로 제조할 수 있다.In the present invention, each and all RNA used to cut several target nucleic acid sequences to be captured using the CRISPR complex can be designed to recognize 18bp of the base PAM sequence in the region to be captured, and these are multiple gRNAs as shown in FIG. 14 . Expression cassettes (a) and polycistronic tRNA-gRNA DNA fragments (b) can be prepared.

본 발명의 Polycistronic tRNA-gRNA DNA 절편을 구성하는 DNA 절편의 염기서열은 다음과 같다.The nucleotide sequence of the DNA fragment constituting the polycistronic tRNA-gRNA DNA fragment of the present invention is as follows.

본 발명에 사용한 tRNA를 코딩하는 DNA 절편의 염기서열 : 5'-AACAAAGCAC CAGTGGTCTA GTGGTAGAAT AGTACCCTGC CACGGTACAG ACCCGGGTTC GATTCCCGGC TGGTGCA-3' (서열번호 43).Base sequence of the DNA fragment encoding the tRNA used in the present invention: 5'-AACAAAGCAC CAGTGGTCTA GTGGTAGAAT AGTACCCTGC CACGGTACAG ACCCGGGTTC GATTCCCGGC TGGTGCA-3' (SEQ ID NO: 43).

sgRNA를 코딩하는 DNA절편의 염기서열: 5'-GAAATTAATA CGACTCACTA TA GGN 18 GTTTT AGAGCTAGAA ATAGCAAGTT AAAATAAGGC TAGTCCGTTA TCAACTTGAA AAAGTGGCAC CGAGTCGGTG CTTTT-3' (서열번호 44).Base sequence of DNA fragment encoding sgRNA: 5'- GAAATTAATA CGACTCACTA TA GGN 18 GTTTT AGAGCTAGAA ATAGCAAGTT AAAATAAGGC TAGTCCGTTA TCAACTTGAA AAAGTGGCAC CGAGTCGGTG CTTTT- 3' (SEQ ID NO: 44).

초기 22bp (이탤릭체로 표시됨)는 시험관내 전사에 사용된 T7 RNA 폴리머라제의 프로모터이다. 그 뒤에 GGN18 시퀀스 (밑줄이 쳐짐)가 나타나며, 표적 (스페이서) 염기서열과 일치하는 20bp를 나타낸다. 나머지 80bp (굵은체 유형)는 crRNA 및 tracrRNA의 키메라 융합을 코딩한다.The initial 22 bp (indicated in italics) is the promoter of T7 RNA polymerase used for in vitro transcription. This is followed by the GGN 18 sequence (underlined), representing 20 bp consistent with the target (spacer) sequence. The remaining 80 bp (type in bold) encodes a chimeric fusion of crRNA and tracrRNA.

표적 염기서열은 인간 VEGFA 유전자 내 타겟 서열 5'-GGTGAGTGAG TGTGTGCGTG TGG-3' (서열번호 45)에 대해 sgRNA를 설계하였다. As the target sequence, sgRNA was designed for the target sequence 5'-GGTGAGTGAG TGTGTGCGTG TGG - 3' (SEQ ID NO: 45) in the human VEGFA gene.

원래 혈관 투과성 인자 (VPF)로 알려진 혈관 내피 성장 인자 (VEGF)는 혈관 형성을 자극하는 세포에 의해 생성된 신호 단백질이다. VEGF는 시스틴 매듭 성장 인자의 혈소판 유래 성장 인자 패밀리인 성장 인자의 서브 패밀리이다. 이들은 혈관 생성(배아 순환계의 새로운 형성) 및 혈관 신생(기존 혈관계로부터 혈관의 성장)에 관여하는 중요한 신호전달 단백질이다.Vascular endothelial growth factor (VEGF), originally known as vascular permeability factor (VPF), is a signaling protein produced by cells that stimulates blood vessel formation. VEGF is a subfamily of growth factors, the platelet-derived growth factor family of cystine knot growth factors. They are important signaling proteins involved in angiogenesis (new formation of the embryonic circulation) and angiogenesis (growth of blood vessels from the existing vasculature).

VEGFA 유전자의 8번 엑손로부터의 mRNA의 alternative splicing으로부터 VEGF-A의 다수의 이소형이 존재한다. 인간에서 VEGF121, VEGF121b, VEGF145, VEGF165, VEGF165b, VEGF189 및 VEGF206 등이 있다.Multiple isoforms of VEGF-A exist from alternative splicing of mRNA from exon 8 of the VEGFA gene. In humans, there are VEGF121, VEGF121b, VEGF145, VEGF165, VEGF165b, VEGF189 and VEGF206.

VEGF의 정상적인 기능은 배아 발달 동안 새로운 혈관, 부상 후 새로운 혈관, 운동 후 근육, 막힌 혈관을 우회하기 위한 새로운 혈관 (부류 순환)을 만드는 것이다. 고형암은 적절한 혈액 공급이 없으면 제한된 크기 이상으로 성장할 수 없다. VEGF를 발현할 수 있는 암은 성장하고 전이될 수 있다. VEGF의 과발현은 눈의 망막 및 신체의 다른 부분에서 혈관 질환을 유발할 수 있다. The normal function of VEGF is to create new blood vessels during embryonic development, new blood vessels after injury, muscles after exercise, and new blood vessels to bypass clogged blood vessels (class circulation). Solid cancers cannot grow beyond their limited size without an adequate blood supply. Cancers capable of expressing VEGF can grow and metastasize. Overexpression of VEGF can lead to vascular disease in the retina of the eye and other parts of the body.

본 실시례의 Cas9의 유전체 편집의 DNAsg는 T7 프로모터, tRNA-sgRNA를 코딩하는 DNA, T7 전사종결서열을 순서대로 DNA 절편을 제조하였다.For DNAsg of Cas9 genome editing of this example, DNA fragments were prepared in this order by the T7 promoter, the tRNA-sgRNA encoding DNA, and the T7 transcription termination sequence.

③ DNA-guided 엔도뉴클레아제, HuAgo를 사용한 유전체 편집의 경우, DNAge 발현 카세트에 DNAsg 대신에 인산화된 단일가닥 DNA 유형을 사용하며, 이를 유기합성하였다(바이오니아, 한국). ③ For genome editing using DNA-guided endonuclease, HuAgo, phosphorylated single-stranded DNA type was used in the DNAge expression cassette instead of DNAsg, and it was organically synthesized (Bioneer, Korea).

DNA-guided 엔도뉴클레아제, HuAgo는 인산화 ssDNA에 결합하여 표적 부위로 안내하고 gDNA 부위에서 DNA 이중가닥 수선을 할 수 있다. 또한, 인산화 ssDNA 가이드 핵산은 대상 유전체의 특정 표적 24개의 염기서열이고 5*?**?* 말단에 인산화된 ssDNA를 합성하였다.A DNA-guided endonuclease, HuAgo, can bind to phosphorylated ssDNA and guide it to a target site and perform DNA double-strand repair at gDNA sites. In addition, phosphorylated ssDNA guide nucleic acid was a sequence of 24 specific targets of the target genome, and phosphorylated ssDNA was synthesized at the 5*?**?* ends.

PD-L1은 암세포의 표면이나 조혈세포에 있는 단백질이다. CD274, B7-H1라고도 부른다. 암세포의 표면에 있는 단백질인 PD-L1, PD-L2가 T세포의 표면에 있는 단백질인 PD-1과 결합하면, T세포는 암세포를 공격하지 못한다. 면역항암제는 T 세포의 PD-1 수용체에 달라붙어 암세포의 회피 기능을 억제한다. MSD의 키트루다와 옵디보가 작용하는 원리다.PD-L1 is a protein located on the surface of cancer cells or in hematopoietic cells. Also called CD274, B7-H1. When PD-L1 and PD-L2, which are proteins on the surface of cancer cells, bind to PD-1, which is a protein on the surface of T cells, T cells cannot attack cancer cells. Immunotherapy inhibits the evasion function of cancer cells by binding to the PD-1 receptor on T cells. This is how MSD's Keytruda and Opdivo work.

HuAgo가 암 요법의 잠재적 적용을 위해 CD274 또는 PDL-1와 같은 내인성 인간 유전자를 변형시키는 데 사용될 수 있는지를 시험하기 위해, CD274 유전자의 엑손 3의 영역에 상보적인 가이드 DNA 올리고 GD5(5'-pGCGAATTACT GTGAAAGTCA ATGG-3') (서열번호 46)를 사용하였다. To test whether HuAgo can be used to modify endogenous human genes such as CD274 or PDL-1 for potential applications in cancer therapy, the guide DNA oligo GD5 (5'-pGCGAATTACT) complementary to the region of exon 3 of the CD274 gene GTGAAAGTCA ATGG-3') (SEQ ID NO: 46) was used.

가이드 DNA 올리고의 5'인산화를 T4 폴리뉴클레오티드 키나제(New England BioLab)를 사용하여 수행하여 가이드 핵산을 제조하였다.5' phosphorylation of the guide DNA oligo was performed using T4 polynucleotide kinase (New England BioLab) to prepare guide nucleic acids.

④ Prime editing의 가이드 핵산 DNAsg는 편집될 표적 서열을 식별하고, 표적 서열을 대체하는 새로운 유전자 정보를 암호화할 수 있는 서열과 융합 단백질의 Cas9 H840A 닉카아제 부분을 비 편집된 DNA 가닥에 닉킹하도록 지시하는 단일 가이드 RNA(sgRNA)로 구성된 프라임 편집 가이드 RNA(prime editing guide RNA, pegRNA)를 코딩하는 DNA 절편을 포함하며 추가적으로 제2 sgRNA(PE3 2° nicking sgRNA)를 코딩하는 DNA 절편을 포함할 수도 있다.④ Prime editing guide nucleic acid DNAsg identifies the target sequence to be edited and instructs to nick the Cas9 H840A nickase portion of the fusion protein with a sequence that can encode new genetic information replacing the target sequence to the unedited DNA strand contains a DNA fragment encoding a prime editing guide RNA (pegRNA) composed of a single guide RNA (sgRNA) that .

상기 프라임 편집 접근 방식에는 역전사 효소(reverse transcriptase)와 촉매 장애가 있는 Cas9 닉카제(Cas9 nickase)가 융합된 단백질 PE 복합체와 표적 부위를 지정하고 추가로 역전사(RT)의 주형 역할을 하는 다기능 프라임 편집 가이드 RNA (multifunctional prime editing guide, pegRNA)의 두 가지 주요 구성 요소가가 포함된다. pegRNA는 표준 단일 가이드 RNA (single-guide RNA, sgRNA)와 유사하지만 추가로 3' 말단 확장 서열(3'end extension)이 있다. 3' 말단 확장 서열은 원하는 편집을 코딩하는 RT 템플릿과 RT 반응을 프라이밍하기 위해 표적 게놈 부위에 어닐링하는 프라이머 결합 부위 (PBS)로 구성된다. 이러한 추가 구성 요소는 표준 sgRNA과 비교하여 pegRNA 디자인의 복잡성을 상당히 증가시킨다. In the prime editing approach, reverse transcriptase and catalytically impaired Cas9 nickase are fused to a protein PE complex and a target site, and a multifunctional prime editing guide that additionally serves as a template for reverse transcription (RT) Two major components of the multifunctional prime editing guide (pegRNA) are involved. The pegRNA is similar to a standard single-guide RNA (sgRNA), but has an additional 3' end extension sequence. The 3' end extension sequence consists of an RT template encoding the desired edit and a primer binding site (PBS) that anneals to the target genomic site to prime the RT reaction. These additional components significantly increase the complexity of pegRNA design compared to standard sgRNA.

본 실시례에서 후보 pegRNA를 신속하게 설계하는 간소화된 웹 도구인 pegFinder(http://pegfinder.sidichenlab.org)를 사용할 수 있다.In this example, pegFinder (http://pegfinder.sidichenlab.org), a simplified web tool for rapidly designing candidate pegRNAs, can be used.

상기 pegRNA는 프라이머 결합 부위(PBS) 및 역전사 효소 (RT) 주형 서열을 함유하는 연장된 단일 가이드 RNA(sgRNA)로 구성되었다. 유전체 편집 동안, 프라이머 결합 부위는 닉 DNA 가닥의 3' 말단이 pegRNA에 혼성화될 수 있게 하는 반면, RT 주형은 편집된 유전자 정보의 합성을 위한 주형으로서 기능한다. The pegRNA consisted of an extended single guide RNA (sgRNA) containing a primer binding site (PBS) and a reverse transcriptase (RT) template sequence. During genome editing, the primer binding site allows the 3' end of the nick DNA strand to hybridize to the pegRNA, whereas the RT template serves as a template for the synthesis of the edited genetic information.

본 실시례에서 편집될 표적 뉴클레오티드 서열을 갖고 있는 HEK3 유전자는 단백질-티로신 키나제패밀리 protein-tyrosine kinase family의 에프린 수용체 서브패밀리 ephrin receptor subfamily의 구성원을 암호화한다. EPH 및 EPH 관련 수용체는 발달 계통, 특히 신경계에서 매개된다. 이 유전자에 의해 코딩된 단백질은 에프린 A2, A3 및 A5에 대한 수용체로서 기능하고 포유 동물 신경계의 발달 동안 단거리 접촉-매개 된 축삭 안내에 역할을 한다.In this example, the HEK3 gene having the target nucleotide sequence to be edited encodes a member of the ephrin receptor subfamily of the protein-tyrosine kinase family. EPH and EPH-related receptors are mediated throughout the developmental system, particularly in the nervous system. The protein encoded by this gene functions as a receptor for ephrins A2, A3 and A5 and plays a role in short-range contact-mediated axon guidance during development of the mammalian nervous system.

본 실시례의 pegRNA는 sgRNA 표적서열-sgRNA scaffold-3'end extension (RT-PBS)으로 구성된다. 본 실시례의 가이드 핵산, pegRNA의 염기서열의 구성요소는 <표 4>에 있으며, 그 염기서열은 아래와 같다.The pegRNA of this example is composed of sgRNA target sequence-sgRNA scaffold-3'end extension (RT-PBS). The components of the nucleotide sequence of the guide nucleic acid and pegRNA of this embodiment are in <Table 4>, and the nucleotide sequence is as follows.

사용하는 pegRNA의 구성성분Components of the pegRNA used 이름name 염기서열base sequence sgRNA(20 nt)sgRNA (20 nt) GGCCCAGACT GAGCACGTGA (서열번호 48)GGCCCAGACT GAGCACGTGA (SEQ ID NO: 48) RT template (13 nt): RT template (13 nt): TCTGCCATCA AAG (서열번호 49) TCTGCCATCA AAG (SEQ ID NO: 49) PBS(primer binding sequence, 13 nt): PBS (primer binding sequence, 13 nt): CGTGCTCAGT CTG (서열번호 50)CGTGCTCAGT CTG (SEQ ID NO: 50) 3' end extension(26 nt)3' end extension (26 nt) TCTGCCATCA AAGCGTGCTC AGTCTG (서열번호 51) TCTGCCATCA AAG CGTGCTC AGTCTG (SEQ ID NO: 51)

pegRNA의 염기서열: 5'-GGCCCAGACT GAGCACGTGA GTTTTAGAGC TAGAAATAGC AAGTTAAAAT AAGGCTAGTC CGTTATCAAC TTGAAAAAGT GGCACCGAGT CGGTGC TCTG CCATCAAAG C GTGCTCAGTC TG-3' (서열번호 47)Base sequence of pegRNA: 5'-GGCCCAGACT GAGCACGTGA GTTTTAGAGC TAGAAATAGC AAGTTAAAAT AAGGCTAGTC CGTTATCAAC TTGAAAAAGT GGCACCGAGT CGGTGC TCTG CCATCAAAG C GTGCTCAGTC TG -3' (SEQ ID NO: 47)

PE3 2° nicking sgRNA의 표적서열: TGGGCCCCAA GGATTGACCCTarget sequence of PE3 2° nicking sgRNA: TGGGCCCCAA GGATTGACCC

PE3 2° nicking sgRNA는 서열번호 1의 T7 프로모터 서열과 서열번호 38의 sgRNA scaffold 사이에는 20bp의 타겟서열이 위치한다. 이러한 타겟서열은 절단하고자 하는 염기서열의 위치에 따라 달라진다.PE3 2° nicking sgRNA has a target sequence of 20 bp between the T7 promoter sequence of SEQ ID NO: 1 and the sgRNA scaffold of SEQ ID NO: 38. Such a target sequence varies depending on the position of the nucleotide sequence to be cut.

결과적으로, 합성되는 주형 DNA의 서열은 T7 프로모터-타겟서열-sgRNA scaffold 서열이 순차적으로 결합된 서열번호 40와 같다.As a result, the sequence of the synthesized template DNA is the same as SEQ ID NO: 40 in which the T7 promoter-target sequence-sgRNA scaffold sequence is sequentially combined.

PE3 2° nicking sgRNA: 5'-TAATACGACT CACTATAGGT GGGCCCCAAG GATTGACCCG TTTTAGAGCT AGAAATAGCA AGTTAAAATA AGGCTAGTCC GTTATCAACT TGAAAAAGTG GCACCGAGTC GGTGCTTTTT TT-3'(서열번호 40)PE3 2° nicking sgRNA: 5'-TAATACGACT CACTATAGGT GGGCCCCAAG GATTGACCCG TTTTAGAGCT AGAAATAGCA AGTTAAAATA AGGCTAGTCC GTTATCAACT TGAAAAAGTG GCACCGAGTC GGTGCTTTTT TT-3' (SEQ ID NO: 40)

전사종결서열 : 5'-TTTTTT-3' (서열번호 41)Transcription termination sequence: 5'-TTTTTT-3' (SEQ ID NO: 41)

The pegRNA and sgRNA cassettes. The pegRNA and sgRNA cassettes.

T7 promoter-sgRNA 표적서열-sgRNA scaffold-3'end extension-T7 terminator-T7 promoter-sgRNA 표적서열-sgRNA scaffold-T7 terminator T7 promoter-sgRNA target sequence-sgRNA scaffold-3'end extension-T7 terminator-T7 promoter-sgRNA target sequence-sgRNA scaffold-T7 terminator

TAATACGACT CACTATAGGN NNNNNNNNNN NNNNNNNNGT TTTAGAGCTA GAAATAGCAA GTTAAAATAA GGCTAGTCCG TTATCAACTT GAAAAAGTGG CACCGAGTCG GTGCNNNNNN NNNNNNNNNN NNNNNNNNNN NNNTTTTTTA ATACGACTCA CTATAGGNNN NNNNNNNNNN NNNNNNGTTT TAGAGCTAGA AATAGCAAGT TAAAATAAGG CTAGTCCGTT ATCAACTTGA AAAAGTGGCA CCGAGTCGGT GCTTTTTTTAATACGACT CACTATAGGN NNNNNNNNNN NNNNNNNNGT TTTAGAGCTA GAAATAGCAA GTTAAAATAA GGCTAGTCCG TTATCAACTT GAAAAAGTGG CACCGAGTCG GTGCNNNNNN NNNNNNNNNN NNNNNNNNNN NNNTTTTTTA ATACGACTCA CTATAGGNNN NNNNNNNNNN NNNNNNGTTT TAGAGCTAGA AATAGCAAGT TAAAATAAGG CTAGTCCGTT ATCAACTTGA AAAAGTGGCA CCGAGTCGGT GCTTTTTT

Prime editing의 가이드 핵산, DNAsg 절편을 제조하였는데, <T7 프로모터, pegRNA를 코딩하는 DNA, T7 전사종결서열>과 <T7 프로모터, PE3 2° nicking sgRNA를 코딩하는 DNA, T7 전사종결서열>를 순서대로 구성된 <pegRNA+sgRNA> 유형을 코딩하는 DNA 절편을 합성하였다(Biosynthesis, 미국). Prime editing guide nucleic acid, DNAsg fragment was prepared. <T7 promoter, DNA encoding pegRNA, T7 transcription termination sequence> and <T7 promoter, DNA encoding PE3 2° nicking sgRNA, T7 transcription termination sequence> in order A DNA fragment encoding the constructed <pegRNA+sgRNA> type was synthesized (Biosynthesis, USA).

HEK3 유전자에 대한 Prime editing의 가이드 핵산을 코딩하는 DNA 절편:DNA fragment encoding the guide nucleic acid of Prime editing for HEK3 gene:

TAATACGACT CACTATAGGG CCCAGACTGA GCACGTGAGT TTTAGAGCTA GAAATAGCAA GTTAAAATAA GGCTAGTCCG TTATCAACTT GAAAAAGTGG CACCGAGTCG GTGCTCTGCC ATCAAAGCGT GCTCAGTCTG TTTTTTAATA CGACTCACTA TAGGTGGGCC CCAAGGATTG ACCCGTTTTA GAGCTAGAAA TAGCAAGTTA AAATAAGGCT AGTCCGTTAT CAACTTGAAA AAGTGGCACC GAGTCGGTGC TTTTTTTAATACGACT CACTATAGGG CCCAGACTGA GCACGTGAGT TTTAGAGCTA GAAATAGCAA GTTAAAATAA GGCTAGTCCG TTATCAACTT GAAAAAGTGG CACCGAGTCG GTGC TCTGCC ATCAAAG CGT GCTCAGTCTG TTTTTTAATA CGACTCACTA TAGGTGGGCC CCAAGGATTG ACCCGTTTTA GAGCTAGAAA TAGCAAGTTA AAATAAGGCT AGTCCGTTAT CAACTTGAAA AAGTGGCACC GAGTCGGTGC TTTTTT

1-4. auto_DdRp 또는 DNAge 바이러스 발현 카세트의 제조 1-4. Preparation of auto_DdRp or DNAge virus expression cassettes

본 발명의 auto_DdRp DNA 발현 카세트 또는 DNAge 발현 카세트는 플라스미드 혹은 바이러스 벡터를 사용하여 제작할 수 있다. 본 실시례에서는 auto_DdRp와 DNAge 바이러스 발현 카세트를 바이러스 벡터를 사용하여 제작하였다. auto DdRp DNA 절편은 [T7 promoter - 5'UTR - DdRp DNA(또는 키메라 NP868R-T7RNAP DNA) - muag - A64 - C30 - 히스톤-SL]이고, DNAge는 <DNAge+DNAsg> 절편으로<T7 promoter - 5'UTR - DNAen - muag - A64 - C30 - 히스톤-SL - T7 promoter - DNAsg - T7 전사종결서열>이다. The auto_DdRp DNA expression cassette or DNAge expression cassette of the present invention can be prepared using a plasmid or a viral vector. In this example, auto_DdRp and DNAge virus expression cassettes were prepared using viral vectors. Auto DdRp DNA fragment is [T7 promoter - 5'UTR - DdRp DNA (or chimeric NP868R-T7RNAP DNA) - muag - A64 - C30 - histone-SL], DNAge is <DNAge+DNAsg> fragment and <T7 promoter - 5 'UTR - DNAen - muag - A64 - C30 - histone-SL - T7 promoter - DNAsg - T7 transcription termination sequence>.

상기 제조된 auto_DdRp와 DNAge DNA 절편을 포유류 발현 벡터로 안정화 세포주를 구축할 수 있는 AdEasy Adenoviral Vector System(Agilent Technologii, 미국) 및 ViraSafe™ Lentiviral Exprision System(Cell Biolabs, 미국)에 삽입하여 auto_DdRp와 DNAge 바이러스 발현 카세트를 제조할 수 있다. Auto_DdRp and DNAge virus expression by inserting the prepared auto_DdRp and DNAge DNA fragment into the AdEasy Adenoviral Vector System (Agilent Technologii, USA) and ViraSafe™ Lentiviral Exprision System (Cell Biolabs, USA) that can construct a stable cell line as a mammalian expression vector Cassettes can be prepared.

본 발명의 DNAen은 NLS-SpCas9-HF1(N497A/R661A/Q695A/Q926A)-NLS, NLS-NgAgo-NLS 및 NLS-SpCas9H840A-linker-M_MLV_RT-NLS를 포함할 수 있다. The DNAen of the present invention may include NLS-SpCas9-HF1(N497A/R661A/Q695A/Q926A)-NLS, NLS-NgAgo-NLS and NLS-SpCas9H840A-linker-M_MLV_RT-NLS.

본 실시례에서 NLS-SpCas9H840A-linker-M_MLV_RT-NLS을 사용하였다.In this example, NLS-SpCas9H840A-linker-M_MLV_RT-NLS was used.

본 발명에서 상기 DNAge의 표적 유전자는 VEGF, PD-L1 및 HEK3 유전자를 포함하며, 이들에 국한된 것은 아니다. 선정된 표적 엔도뉴클레아제에 따라 가이드핵산의 유형도 결정된다. 선정된 표적 엔도뉴클레아제가 NLS-SpCas9-HF1(N497A/R661A/Q695A/Q926A)-NLS이면 sgRNA 유형, NLS-NgAgo-NLS이면 인산화 ssDNA 유형, 그리고 NLS-SpCas9H840A-linker-M_MLV_RT-NLS이면 <pegRNA+sgRNA> 유형일 수 있다.In the present invention, the target gene of the DNAge includes, but is not limited to, VEGF, PD-L1 and HEK3 genes. The type of guide nucleic acid is also determined according to the selected target endonuclease. sgRNA type if the selected target endonuclease is NLS-SpCas9-HF1(N497A/R661A/Q695A/Q926A)-NLS, phosphorylated ssDNA type if NLS-NgAgo-NLS, and <pegRNA type if NLS-SpCas9H840A-linker-M_MLV_RT-NLS +sgRNA> type.

<아데노바이러스 시스템><Adenovirus system>

일반적으로 원핵생물과 진행생물은 발현 카세트에 사용하는 프로모터를 달리하고 있다. 본 발명의 자가전사 RNA/DNA 시스템에서 사용하는 발현 카세트는 원핵생물이나 진행생물 특히 포유동물, 식물 등에 공통으로 선정된 DdRp에 상응하는 프로모터를 사용할 수 있다. 예를 들어 DdRp가 T7 Polymerase인 경우는 T7 프로모터를 이용하여 제작할 수 있다. In general, prokaryotes and prokaryotes use different promoters for expression cassettes. The expression cassette used in the self-transcribed RNA/DNA system of the present invention may use a promoter corresponding to DdRp commonly selected for prokaryotes and prokaryotes, particularly mammals, plants, and the like. For example, when DdRp is T7 Polymerase, it can be prepared using the T7 promoter.

본 실시례에서 아데노바이러스 시스템의 pShuttle에 auto_DdRp DNA 또는 DNAge 절편을 재조합하여 이를 "auto_DdRp 또는 DNAge아데노 발현 카세트"라고 하였으며. 캡된 SM DdRp RNA@LS와 auto_DdRp DNA 또는 DNAge 아데노 발현 카세트를 이용한 형질주입 시스템을 auto_DdRp DNA 또는 DNAge 아데노 발현시스템이라고 하였다. 또한, 아데노바이러스 시스템에 auto_DdRp DNA 절편을 재조합하여 이를 "auto_DdRp 아데노 발현 카세트"라고 하였으며. 캡된 SM DdRp RNA@LS와 auto_DdRp 아데노 발현 카세트를 이용한 형질주입 시스템을 auto_DdRp 아데노 발현시스템이라고 하였다. In this example, the auto_DdRp DNA or DNAge fragment was recombined in the pShuttle of the adenovirus system, and this was called "auto_DdRp or DNAge adeno expression cassette". The transfection system using capped SM DdRp RNA@LS and auto_DdRp DNA or DNAge adeno expression cassette was called auto_DdRp DNA or DNAge adeno expression system. In addition, the auto_DdRp DNA fragment was recombined in the adenovirus system and this was called "auto_DdRp adeno expression cassette". The transfection system using the capped SM DdRp RNA@LS and the auto_DdRp adeno expression cassette was called the auto_DdRp adeno expression system.

본 실시례에서 AdEasy Adenoviral Vector System(Agilent Technologii, 미국)에 있는 pShuttle 벡터를 사용하였다.In this example, the pShuttle vector in the AdEasy Adenoviral Vector System (Agilent Technologii, USA) was used.

auto_DdRp DNA 또는 DNAge 아데노 발현 카세트를 제조하기 위해서, auto_DdRp 또는 DNAge 발현 카세트를 주형으로 PCR하여 auto_DdRp DNA 절편는 T7 promoter - 5'UTR - DdRp DNA(또는 키메라 DdRp DNA) - muag - A64 - C30 - 히스톤-SL) 또는 DNAge 절편은<DNAen+DNAsg> 형태를 대량으로 제조하였다. To prepare the auto_DdRp DNA or DNAge adeno expression cassette, PCR with the auto_DdRp or DNAge expression cassette as a template to convert the auto_DdRp DNA fragment to T7 promoter - 5'UTR - DdRp DNA (or chimeric DdRp DNA) - muag - A64 - C30 - histone-SL ) or DNAge fragments were prepared in the form of <DNAen+DNAsg> in large quantities.

먼저, 실시례 1-2에서 제조된 auto_DdRp 발현 카세트를 주형으로 <T7 promoter - 5'UTR - DdRp DNA(또는 키메라 NP868R-T7RNAP DNA) - muag - A64 - C30 - 히스톤-SL> 부위를 증폭하였다. 이때 정방향 프라이머 (5'-CTCGAGTAAT ACGACTCACT ATAGGGAGACCAC AACGGUUUCC CUCU-3', 서열번호 43), 역방향 프라이머(5'-GTCGACGGT GGCTCTAAAA GAGCCTTTGG-3', 서열번호 51)를 사용하여 PCR 산물의의 양 말단에 XhoI/SalI 인식서열을 부여하였다. First, the <T7 promoter - 5'UTR - DdRp DNA (or chimeric NP868R-T7RNAP DNA) - muag - A64 - C30 - histone-SL> region was amplified using the auto_DdRp expression cassette prepared in Example 1-2 as a template. At this time, both ends of the PCR product using a forward primer (5'- CTCGAG TAAT ACGACTCACT ATAG GGAGACCAC AACGGUUUCC CUCU -3', SEQ ID NO: 43) and a reverse primer (5'- GTCGAC GGT GGCTCTAAAA GAGCCTTTGG-3', SEQ ID NO: 51) XhoI/SalI recognition sequence was given.

및 상기 DNAge의 표적 유전자는 VEGF, PD-L1 및 HEK3 유전자를 포함하고 있으며, 본 실시례에서는 HEK3를 대상으로 하는 DNAge 절편을 PCR 방법으로 제조하였다. And the DNAge target gene includes VEGF, PD-L1 and HEK3 genes, and in this example, a DNAge fragment targeting HEK3 was prepared by PCR.

본 발명의 DNAge 절편은 <DNAen+DNAsg> 형태로 실시례 1-3을 참조하여 (T7 프로모터 - 5'UTR - <NLS-SpCas9H840A-linker-M_MLV_RT-NLS> - muag - A64 - C30 - 히스톤SL)를 코딩하는 DNA 절편과 (T7 프로모터 - pegRNA-sgRNA - T7 전사종결서열)을 코딩하는 DNA 절편으로 구성된 하나의 DNA 절편을 유기합성하여 하였다(Bioynthesis, 미국). 이를 주형으로 PCR 방법으로 증폭하였다. 이때 정방향 프라이머 (5'-CTCGAGTAAT ACGACTCACT ATAG-3', 서열번호 74) 및 역방향 프라이머 (5'-GTCGACAAAAAA GCACCGACTCGGTGCCACTTTTTCAAGTTG-3', 서열번호 44)를 사용하여 양 말단에 XhoI/SalI 인식서열이 있는 PCR 산물을 확보하였다. The DNAge fragment of the present invention is in the form of <DNAen+DNAsg> with reference to Example 1-3 (T7 promoter - 5'UTR - <NLS-SpCas9H840A-linker-M_MLV_RT-NLS> - muag - A64 - C30 - histone SL) One DNA fragment consisting of a DNA fragment encoding (T7 promoter - pegRNA-sgRNA - T7 transcription termination sequence) and a DNA fragment encoding This was amplified by PCR as a template. At this time, using a forward primer (5'- CTCGAG TAAT ACGACTCACT ATAG-3', SEQ ID NO: 74) and a reverse primer (5'- GTCGAC AAAAAA GCACCGACTCGGTGCCACTTTTTCAAGTTG-3', SEQ ID NO: 44) at both ends using XhoI / SalI A PCR product having a recognition sequence was obtained.

상기 증폭된 PCR 산물들을 XhoI/SalI 제한효소 처리하여 절단하여 5'말단에 XhoI 인식서열, 3'말단에 SalI 인식서열이 있는 auto_DdRp 또는 DNAge DNA 절편을 제조하였다. 절단된 auto_DdRp DNA 또는 DNAge 절편을 XhoI/SalI제한효소로 선형화된 pShuttle 벡터에 T4 DNA ligase를 이용하여 삽입하였다. 2~3 μl 상기 pShuttle 벡터 재조합 용액을 대장균에 형질도입하여 앰피실린 선택 플레이트에 플레이트하여 37℃에서 밤새 배양하였다. 6~12개의 콜로니를 골라 각각 50μg/ml의 암피실린이 있는 LB 성장 배지 3ml에 접종한다. 37℃에서 셰이커에서 밤새 배양한다. 표준 절차 또는 상용 Qiaprep Miniprep 키트 (Qiagen, 미국)를 사용하여 auto_DdRp DNA와 DNAge 절편이 재조합 pShuttle 벡터를 분리하였다. 재조합 플라스미드를 XhoI/SalI 제한효소로 절단하고 겔 전기영동을 수행하여 auto_DdRp DNA와 DNAge 발현 카세트를 포함하는 클론을 확인하였다(도 15).The amplified PCR products were treated with XhoI/SalI restriction enzymes and cut to prepare an auto_DdRp or DNAge DNA fragment having an XhoI recognition sequence at the 5' end and a SalI recognition sequence at the 3' end. The digested auto_DdRp DNA or DNAge fragment was inserted into the pShuttle vector linearized with XhoI/SalI restriction enzymes using T4 DNA ligase. 2-3 μl of the pShuttle vector recombinant solution was transduced into E. coli, plated on an ampicillin selection plate, and incubated at 37° C. overnight. Pick 6 to 12 colonies and inoculate them in 3 ml of LB growth medium containing 50 μg/ml of ampicillin, respectively. Incubate overnight on a shaker at 37°C. Recombinant pShuttle vectors were isolated from auto_DdRp DNA and DNAge fragments using standard procedures or a commercial Qiaprep Miniprep kit (Qiagen, USA). The recombinant plasmid was digested with XhoI/SalI restriction enzymes and gel electrophoresis was performed to confirm clones containing auto_DdRp DNA and a DNAge expression cassette (FIG. 15).

제조된 auto_DdRp DNA 또는 DNAge 절편 pShuttle 벡터에 위치하게 되며, auto DdRp DNA와 DNAge 절편의 구성은 <T7 promoter - 5'UTR - DdRp DNA(또는 키메라 NP868R-T7RNAP DNA) - muag - A64 - C30 - 히스톤-SL>과 <T7 promoter - 5'UTR - DNAen - muag - A64 - C30 - 히스톤-SL- T7 promoter - DNAsg - T7 전사종결서열>이다. The prepared auto_DdRp DNA or DNAge fragment is placed in the pShuttle vector, and the composition of auto DdRp DNA and DNAge fragment is <T7 promoter - 5'UTR - DdRp DNA (or chimeric NP868R-T7RNAP DNA) - muag - A64 - C30 - histone- SL> and <T7 promoter - 5'UTR - DNAen - muag - A64 - C30 - histone-SL- T7 promoter - DNAsg - T7 transcription termination sequence>.

본 발명의 재조합 auto_DdRp 또는 DNAge 아데노바이러스의 생산은 AdEasy Adenoviral Vector System(Agilent Technologii, 미국)의 지침서에 따라 수행하였다. 먼저, 재조합 auto_DdRp 또는 DNAi 발현 카세트를 Pme I로 선형화하였다. 선형화된 auto_DdRp 또는 DNAi 발현 카세트를 슈퍼 코일 바이러스 DNA 플라스미드인 pAdEasy-1과 함께 BJ5183 박테리아로 공동 형질 전환하였다. 형질주입체는 카나마이신 내성을 위해 선택한다. 재조합은 제한효소를 이용한 방법으로 확인하였다(도 16). Pac I로 재조합 Ad 플라스미드 DNA를 제한하면 ~ 30kb의 큰 단편과 3.0kb (왼쪽 팔 사이에서 재조합이 발생한 경우) 또는 4.5kb (재조합이 원래 복제 위치에서 발생한 경우)의 작은 단편이 생성하였다. Production of the recombinant auto_DdRp or DNAge adenovirus of the present invention was performed according to the instructions of the AdEasy Adenoviral Vector System (Agilent Technologii, USA). First, the recombinant auto_DdRp or DNAi expression cassettes were linearized with Pme I. Linearized auto_DdRp or DNAi expression cassettes were co-transformed into BJ5183 bacteria with pAdEasy-1, a supercoil viral DNA plasmid. Transformants are selected for kanamycin resistance. Recombination was confirmed by the method using a restriction enzyme (FIG. 16). Restriction of recombinant Ad plasmid DNA with Pac I resulted in large fragments of ~30 kb and small fragments of 3.0 kb (if recombination occurred between the left arm) or 4.5 kb (if recombination occurred at the original replication site).

재조합이 확인되면 재조합 능력이 없는 XL10-Gold 균주를 사용하여 대량으로 생산하고 Pac I로 분해하였다. 정제된 재조합 Ad 플라스미드 DNA를 Pac I로 분해하여 역 말단 반복(ITR)을 노출된 DNA가 들어 있는 튜브에 ViraPack Transfection Kit의 Solution I 25 ㎕와 Solution II 250 ㎕를 첨가하여 실온에서 10분 동안 배양하였다. 인큐베이터에서 MBS 함유 배지에 AD-293 세포가 들어있는 플레이트를 준비하였다. DNA 침전물을 재현탁하기 위해 위아래로 피이펫팅하여 DNA 현탁액을 부드럽게 혼합한 다음 DNA 현탁액을 한 방울 씩 플레이트에 추가하여 AD-293 (또는 HEK293) 세포에 처리하였다.When recombination was confirmed, it was mass-produced using the XL10-Gold strain without recombination ability and digested with Pac I. Purified recombinant Ad plasmid DNA was digested with Pac I and inverted terminal repeat (ITR) was exposed. To the tube containing the DNA, 25 μl of ViraPack Transfection Kit's Solution I and 250 μl of Solution II were added and incubated at room temperature for 10 minutes. . Plates containing AD-293 cells in MBS-containing medium were prepared in an incubator. The DNA suspension was gently mixed by pipetting up and down to resuspend the DNA precipitate, then the DNA suspension was added dropwise to the plate to treat AD-293 (or HEK293) cells.

조직 배양 플레이트를 37℃ 인큐베이터에서 3 시간 동안 배양한 후, 플레이트에서 배지를 제거하고 25μM 클로로퀸이 보충된 4ml의 성장 배지로 교체하였다 (배지 및 시약 준비 참조). 플레이트를 37℃ 인큐베이터에서 추가 6 시간 동안 배양 한 후 25μM 클로로퀸이 포함 된 성장 배지를 제거하고 4ml 성장 배지 (클로로퀸)로 교체한다.After the tissue culture plates were incubated in an incubator at 37° C. for 3 hours, the medium was removed from the plates and replaced with 4 ml of growth medium supplemented with 25 μM chloroquine (see medium and reagent preparation). After the plate is incubated for an additional 6 h in a 37 °C incubator, the growth medium containing 25 μM chloroquine is removed and replaced with 4 ml growth medium (chloroquine).

배양 플레이트를 37℃에서 7~10일 동안 배양하고 필요할 때 성장 배지를 보충하였다(배지 색상 기준). 세포가 플레이트에 잘 부착된 것처럼 보이면 배지를 4ml의 신선한 배지로 교체하였다. 또는 성장 배지에서 분리된 세포가 관찰되는 경우 기존 배지에 동일한 부피의 신선한 배지를 추가하여 배양하였다. 이 세포 배양용액으로부터 1차 바이러스 스톡을 획득하였다. Culture plates were incubated at 37° C. for 7-10 days and growth medium was replenished as needed (based on media color). When the cells appeared to adhere well to the plate, the medium was replaced with 4 ml of fresh medium. Alternatively, when cells isolated from the growth medium were observed, the same volume of fresh medium was added to the existing medium and cultured. A primary virus stock was obtained from this cell culture solution.

아데노바이러스를 생산하는 AD-293 플레이트에서 성장 배지를 조심스럽게 제거하고 PBS로 세포를 한 번 세척하였다. 수확할 세포의 각 플레이트에 PBS 0.5ml를 추가하였다. 플레이트를 비스듬히 잡고 세포 리프터로 PBS의 풀에 세포를 긁어 세포를 수집하였다. 세포 현탁액을 1.7ml 스크류 캡 미세 원심 분리 튜브로 옮겼다. 드라이 아이스-메탄올 욕조와 37℃ 수조 사이의 튜브를 번갈아 가며 각 해동 후 잠시 볼텍싱하여 세포 현탁액을 4 회 동결/해동하였다. 실온에서 10분 동안 12,000 × g에서 미세 원심 분리하여 세포 파편을 수집하였다. 상층액(1 차 바이러스 스톡)을 신선한 스크류 캡 마이크로 원심 분리기 튜브로 옮겼다. 이 1 차 바이러스 스톡는 -80℃에서 1 년 이상 보관할 수 있다. The growth medium was carefully removed from the adenovirus producing AD-293 plates and the cells were washed once with PBS. 0.5 ml of PBS was added to each plate of cells to be harvested. Cells were collected by holding the plate at an angle and scraping the cells into a pool of PBS with a cell lifter. The cell suspension was transferred to a 1.7 ml screw cap microcentrifuge tube. The cell suspension was frozen/thawed 4 times by alternating the tubes between the dry ice-methanol bath and the 37°C water bath and vortexing briefly after each thawing. Cell debris was collected by microcentrifugation at 12,000 × g for 10 min at room temperature. The supernatant (primary virus stock) was transferred to a fresh screw cap microcentrifuge tube. This primary virus stock can be stored at -80°C for over 1 year.

제조된 1 차 바이러스 스톡의 titer는 아데노바이러스 유래 벡터 유전자 치료제의 분석시험 1(대한민국 식약처)의 방법으로 결정하였으며 107-08 pfu/ml를 유지하였다.The titer of the prepared primary virus stock was determined by the method of assay 1 (Korea Food and Drug Administration) of adenovirus-derived vector gene therapy, and was maintained at 10 7 -0 8 pfu/ml.

<레티바이러스 시스템><Retivirus system>

본 실시례에서 레티바이러스 시스템의 셔틀 벡터에 상기 <플라스미드 발현 카세트>에서 제조한 auto_DdRp 또는 DNAge 발현 카세트를 주형으로 PCR한 auto_DdRp DNA 또는 DNAge 절편을 재조합하여 이를 "auto_DdRp 또는 DNAge 렌티 발현 카세트"라고 하였으며. 캡된 SM DdRp RNA@LS와 auto_DdRp 또는 DNAge 렌티 발현 카세트를 이용한 형질주입 시스템을 auto_DdRp 또는 DNAge 렌티 발현시스템이라고 하였다. 또한 레티바이러스 시스템에 auto_DdRp DNA 절편을 재조합하여 이를 "auto_DdRp 렌티 발현 카세트"라고 하였으며. 캡된 SM DdRp RNA@LS와 auto_DdRp 렌티 발현 카세트를 이용한 형질주입 시스템을 auto_DdRp 렌티 발현시스템이라고 하였다. In this example, the auto_DdRp DNA or DNAge fragment obtained by PCR using the auto_DdRp or DNAge expression cassette prepared in the <Plasmid expression cassette> above was recombined in the shuttle vector of the retivirus system in this example, and this was called "auto_DdRp or DNAge lenti expression cassette". A transfection system using capped SM DdRp RNA@LS and an auto_DdRp or DNAge lenti expression cassette was referred to as an auto_DdRp or DNAge lenti expression system. In addition, the auto_DdRp DNA fragment was recombined in the retivirus system and this was called "auto_DdRp lenti expression cassette". The transfection system using the capped SM DdRp RNA@LS and the auto_DdRp lenti expression cassette was called the auto_DdRp lenti expression system.

본 실시레에서 ViraSafe Lentiviral Exprision System(Cell Biolabs, 미국)에 있는 pSMPUW-IRES-Blasticidin Lentiviral Exprision Vector, 셔틀 벡터 pSMPUW를 사용하엿다.In this example, the pSMPUW-IRES-Blasticidin Lentiviral Exprision Vector, the shuttle vector pSMPUW, from the ViraSafe Lentiviral Exprision System (Cell Biolabs, USA) was used.

본 실시례에서 AdEasy Adenoviral Vector System(Agilent Technologii, 미국)에 있는 pShuttle 벡터를 사용하였다.In this example, the pShuttle vector in the AdEasy Adenoviral Vector System (Agilent Technologii, USA) was used.

auto_DdRp DNA 또는 DNAge 렌티 발현 카세트를 제조하기 위해서, 상기 auto_DdRp DNA 절편 및 상기 DNAge의 표적 유전자는 VEGF, PD-L1 및 HEK3 유전자를 포함하고 있으며, 본 실시례에서는 HEK3를 대상으로 하는 DNAge 절편을 PCR 방법으로 제조하였다. In order to prepare an auto_DdRp DNA or DNAge lenti expression cassette, the auto_DdRp DNA fragment and the target gene of the DNAge include VEGF, PD-L1 and HEK3 genes, and in this embodiment, the DNAge fragment targeting HEK3 is PCR method was prepared with

본 발명의 DNAge 절편은 <DNAen+DNAsg> 형태로 먼저, 실시례 1-2에서 제조된 auto_DdRp 발현 카세트를 주형으로 <T7 promoter - 5'UTR - DdRp DNA(또는 키메라 NP868R-T7RNAP DNA) - muag - A64 - C30 - 히스톤-SL> 부위를 증폭하였다. 이때 정방향 프라이머 (5'-GGATCCTAAT ACGACTCACT ATAGGGAGACCAC AACGGUUUCC CUCU-3', 서열번호 43), 역방향 프라이머(5'-GTCGACGGT GGCTCTAAAA GAGCCTTTGG-3', 서열번호 51)를 사용하여 PCR 산물의의 양 말단에 BamHI/BglI 인식서열을 부여하였다. The DNAge fragment of the present invention is in the form of <DNAen+DNAsg>, first, using the auto_DdRp expression cassette prepared in Example 1-2 as a template <T7 promoter - 5'UTR - DdRp DNA (or chimeric NP868R-T7RNAP DNA) - muag - A64-C30-histone-SL> sites were amplified. At this time, both ends of the PCR product using a forward primer (5'- GGATCC TAAT ACGACTCACT ATAG GGAGACCAC AACGGUUUCC CUCU -3', SEQ ID NO: 43), and a reverse primer (5'- GTCGAC GGT GGCTCTAAAA GAGCCTTTGG-3', SEQ ID NO: 51) BamHI / BglI recognition sequence was given.

실시례 1-3을 참조하여 (T7 프로모터 - 5'UTR - <NLS-SpCas9H840A-linker-M_MLV_RT-NLS> - muag - A64 - C30 - 히스톤SL)를 코딩하는 DNA 절편과 (T7 프로모터 - pegRNA-sgRNA - T7 전사종결서열)을 코딩하는 DNA 절편으로 구성된 하나의 DNA 절편을 유기합성하여 하였다(Biosnthesis, 미국). 이를 주형으로 PCR 방법으로 증폭하였다. 이때 정방향 프라이머 (5'-GGATCCTAAT ACGACTCACT ATAG-3', 서열번호 74) 및 역방향 프라이머 (5'-GTCGACAAAAAA GCACCGACTCGGTGCCACTTTTTCAAGTTG-3', 서열번호 44)를 사용하여 양 말단에 BamHI/BglI 인식서열이 있는 PCR 산물을 확보하였다. With reference to Example 1-3 (T7 promoter - 5'UTR - <NLS-SpCas9H840A-linker-M_MLV_RT-NLS> - muag - A64 - C30 - histone SL) and (T7 promoter - pegRNA-sgRNA) - One DNA fragment consisting of a DNA fragment encoding T7 transcription termination sequence) was synthesized organically (Biosnthesis, USA). This was amplified by PCR as a template. At this time, BamHI / BglI at both ends using a forward primer (5'- GGATCC TAAT ACGACTCACT ATAG-3', SEQ ID NO: 74) and a reverse primer (5'- GTCGAC AAAAAA GCACCGACTCGGTGCCACTTTTTCAAGTTG-3', SEQ ID NO: 44) A PCR product having a recognition sequence was obtained.

상기 증폭된 PCR 산물들을 BamHI/BglII 제한효소 처리하여 절단하여 5'말단에 BamHI 인식서열, 3'말단에 BglII인식서열이 있는 auto_DdRp 또는 DNAge DNA 절편을 제조하였다. 절단된 auto_DdRp DNA와 DNAge 절편을 BamHI/SalI 제한효소로 선형화된 pSMPUW 벡터에 T4 DNA ligase를 이용하여 삽입하였다. 2~3 μl 상기 pSMPUW 벡터 재조합 용액을 대장균에 형질도입하여 앰피실린 선택 플레이트에 플레이트하여 37℃에서 밤새 배양하였다. 6~12개의 콜로니를 골라 각각 50μg/ml의 암피실린이 있는 LB 성장 배지 3ml에 접종한다. 37℃에서 셰이커에서 밤새 배양한다. 표준 절차 또는 상용 Qiaprep Miniprep 키트 (Qiagen, 미국)를 사용하여 auto_DdRp DNA와 DNAge 절편이 재조합 pShuttle 벡터를 분리하였다. 재조합 플라스미드를 BglII/HpaI 제한효소로 절단하고 겔 전기영동을 수행하여 auto_DdRp DNA와 DNAge 발현 카세트를 포함하는 클론을 확인하였다(도 17).The amplified PCR products were treated with BamHI/BglII restriction enzymes and cut to prepare an auto_DdRp or DNAge DNA fragment having a BamHI recognition sequence at the 5' end and a BglII recognition sequence at the 3' end. The digested auto_DdRp DNA and DNAge fragments were inserted into the pSMPUW vector linearized with BamHI/SalI restriction enzymes using T4 DNA ligase. 2-3 μl of the pSMPUW vector recombinant solution was transduced into E. coli, plated on an ampicillin selection plate, and incubated overnight at 37°C. Pick 6 to 12 colonies and inoculate them into 3 ml of LB growth medium containing 50 μg/ml of ampicillin, respectively. Incubate overnight on a shaker at 37°C. Recombinant pShuttle vectors were isolated from auto_DdRp DNA and DNAge fragments using standard procedures or a commercial Qiaprep Miniprep kit (Qiagen, USA). The recombinant plasmid was digested with BglII/HpaI restriction enzymes and gel electrophoresis was performed to confirm clones containing auto_DdRp DNA and a DNAge expression cassette (FIG. 17).

본 발명의 재조합 auto_DdRp와 DNAge Lenti 발현 카세트 바이러스 생산은 pSMPUW Universal Lentiviral Exprision Vector(Cell Biolabs, 미국) 및 Lipofectamine  LTX Reagent (ThermoFisher, 미국)의 지침서에 따라 다음과 같이 수행하였다. Recombinant auto_DdRp and DNAge Lenti expression cassette virus production of the present invention was performed according to the instructions of pSMPUW Universal Lentiviral Exprision Vector (Cell Biolabs, USA) and Lipofectamine LTX Reagent (ThermoFisher, USA) as follows.

형질주입 하루 전에 충분한 293T 세포 또는 293LTV 세포(Cat. # LTV-100)를 플레이트하여 형질주입 당일에 배양용기의 70-80 % 덮을 정도 배양한다. 운반(Transfer) 플라스미드로 본 발명에 제조한 pSMPUW, 외피(envelope) 및 패키징(packaging) 플라스미드를 Lipofectamine Plus(Invitrogen)로 즉, pSMPUW : pCMV-VSV-G : pRSV-REV : pCgpV 벡터의 몰비는 3:1:1:1로 혼합하여 세포를 형질주입시킨다.One day before transfection, plate enough 293T cells or 293LTV cells (Cat. # LTV-100) and incubate to cover 70-80% of the culture vessel on the day of transfection. The molar ratio of pSMPUW, envelope and packaging plasmids prepared in the present invention as a transfer plasmid to Lipofectamine Plus (Invitrogen), that is, pSMPUW: pCMV-VSV-G: pRSV-REV: pCgpV vector Cells are transfected by mixing 3:1:1:1.

형질주입 후 36~72시간에 렌티 바이러스 상층액을 수확한다. 상층액은 12시간마다 2~3회 수확할 수 있다. 수집기간 동안 4℃에서 보관한다. 수집된 상층액을 수집하여 1500rpm에서 5분 동안 원심 분리하여 세포 파편을 제거하고 0.22 μm에서 여과한다. 상층액은 직접 사용하거나 필요한 경우 정제/농축할 수 있다. 장기 보관을 위해 상층액을 분주하여 -80℃에서 보관한다. Harvest the lentiviral supernatant 36-72 hours after transfection. The supernatant can be harvested 2-3 times every 12 hours. Store at 4°C during the collection period. Collect the collected supernatant and centrifuge at 1500 rpm for 5 min to remove cell debris and filter at 0.22 µm. The supernatant can be used directly or purified/concentrated if necessary. For long-term storage, aliquot the supernatant and store at -80°C.

상기 수확하여 보관하는 렌티 바이러스 용액은 숙주세포에 형질주입시키기 전에 ViraBind Lentivirus 농축 및 정제 키트(카탈로그 번호 VPK-090, Cell Biolabs, 미국)를 사용하여 바이러스를 고도로 농축시켰다. 본 발명의 auto_(DdRp+DNAge) 렌티 바이러스에 대한 숙주세포로의 일관된 바이러스 형질 도입을 보장하기 위해 p24 ELISA, QuickTiter Lentivirus Titer Kit(카탈로그 번호 VPK-107, Cell Biolabs, 미국)를 사용하여 렌티 바이러스 역가를 측정하였으며 정제 및 농축된 바이러스 스톡의 titer는 106-07 pfu/ml를 유지하였다.The harvested and stored lentivirus solution was highly concentrated in virus using the ViraBind Lentivirus Concentration and Purification Kit (Cat. No. VPK-090, Cell Biolabs, USA) before transfection into host cells. To ensure consistent viral transduction into host cells for the auto_(DdRp+DNAge) lentivirus of the present invention, lentivirus using p24 ELISA, QuickTiter Lentivirus Titer Kit (Cat. No. VPK-107, Cell Biolabs, USA) The titer was measured and the titer of the purified and concentrated virus stock was maintained at 10 6 -0 7 pfu/ml.

목표 세포가 본 발명의 auto_DdRp와 DNAge 렌티 바이러스로 감염되기 어려우며 보조 시약 없이는 형질 도입 효율이 낮을 수 있어. ViraDuctin Lentivirus Transduction Kit (카탈로그 번호 LTV-200, Cell Biolabs, 미국)을 사용하여 바이러스와 세포 상호작용을 촉진하여 형질 도입 효율성을 높일 수 있다.It is difficult for target cells to be infected with the auto_DdRp and DNAge lentivirus of the present invention, and transduction efficiency may be low without auxiliary reagents. ViraDuctin Lentivirus Transduction Kit (catalog number LTV-200, Cell Biolabs, USA) can be used to promote virus and cell interaction to increase transduction efficiency.

<식물형질주입용 Binary vector><Binary vector for plant transfection>

본 실시례에서 식물 형질주입용 Binary vector(Ti plasmid)에 auto_(DdRp+DNAge) DNA 절편을 재조합하여 이를 "auto_(DdRp+DNAge) Ti 발현 카세트"라고 하였으며. 캡된 DdRp RNA@LS와 auto_(DdRp+DNAge) Ti 발현 카세트를 이용한 형질주입 시스템을 auto_(DdRp+DNAge) Ti 발현시스템이라고 하였다. In this example, the auto_(DdRp+DNAge) DNA fragment was recombined in a binary vector (Ti plasmid) for plant transfection, and this was called “auto_(DdRp+DNAge) Ti expression cassette”. The transfection system using the capped DdRp RNA@LS and auto_(DdRp+DNAge) Ti expression cassette was called the auto_(DdRp+DNAge) Ti expression system.

분지 사슬 아미노산의 생합성 경로에서 핵심 효소를 암호화하는 아세토락테이트 신타제(acetolactate synthase, ALS) 유전자의 점 돌연변이는 클로르설푸론(chlorsulfuron)과 같은 ALS 억제제에 대한 내성을 부여할 수 있다(https://doi.org/10.1101/2020.06.18.159111). Point mutations in the acetolactate synthase (ALS) gene, which encodes a key enzyme in the biosynthetic pathway of branched-chain amino acids, may confer resistance to ALS inhibitors such as chlorsulfuron . /doi.org/10.1101/2020.06.18.159111 ).

본 실시례에서 본 발명의 CRISPR 매개 식물 프라임 편집(PPE) RNA/DNA 시스템으로 특정 유전자에 동시 전환 및 전이 돌연변이의 도입하기 위해 감자 StALS 유전자를 표적으로 하여 auto_(DdRp+DNAge) Ti 발현시스템을 제조하였다. In this example, an auto_(DdRp+DNAge) Ti expression system was prepared by targeting the potato StALS gene in order to introduce simultaneous conversion and transfer mutations in specific genes with the CRISPR-mediated plant prime editing (PPE) RNA/DNA system of the present invention did

상기 auto_DdRp 발현 카세트 및 감자 StALS 유전자를 표적하는 DNAge 절편을 포함하는 auto_(DdRp+DNAge) Ti 발현 카세트를 제조하기 위해서, 아래와 같이 진행하였다.To prepare the auto_DdRp expression cassette and the auto_(DdRp+DNAge) Ti expression cassette including the DNAge fragment targeting the potato StALS gene, the following procedure was performed.

먼저, 본 실시레에서 DNAge 절편은 <T7 promoter - 5'UTR - NLS-SpCas9H840A-linker-M_MLV_RT-NLS - Nos-종결서열-T7 promoter-T1-sgR-rtT-PBS-T7 terminator-T7 promoter-T2-sgR-T7 terminator >구조로 유기합성하였다(Biosynthesis, 미국). First, the DNAge fragment in this example is <T7 promoter - 5'UTR - NLS-SpCas9H840A-linker-M_MLV_RT-NLS - Nos-terminator-T7 promoter-T1-sgR-rtT-PBS-T7 terminator-T7 promoter- T2 - sgR-T7 terminator > structure was organically synthesized (Biosynthesis, USA).

Nos- 종결서열:Nos- Termination sequence:

GATCGTTCAA ACATTTGGCA ATAAAGTTTC TTAAGATTGA ATCCTGTTGC CGGTCTTGCG 60GATCGTTCAA ACATTTGGCA ATAAAGTTTC TTAAGATTGA ATCCTGTTGC CGGTCTTGCG 60

ATGATTATCA TATAATTTCT GTTGAATTAC GTTAAGCATG TAATAATTAA CATGTAATGC 120ATGATTATCA TATAATTTCT GTTGAATTAC GTTAAGCATG TAATAATTAA CATGTAATGC 120

ATGACGTTAT TTATGAGATG GGTTTTTATG ATTAGAGTCC CGCAATTATA CATTTAATAC 180ATGACGTTAT TTATGAGATG GGTTTTTATG ATTAGAGTCC CGCAATTATA CATTTAATAC 180

GCGATAGAAA ACAAAATATA GCGCGCAAAC TAGGATAAAT TATCGCGCGC GGTGTCATCT 240GCGATAGAAA ACAAAATATA GCGCGCAAAC TAGGATAAAT TATCGCGCGC GGTGTCATCT 240

ATGTTACTAG ATC 253ATGTTACTAG ATC 253

<도 18>은 감자 ALS 유전자의 정확한 수정을 위한 프라임 편집 전략으로, PE3 pegRNA의 구성을 살펴보면 다음과 같다.<FIG. 18> is a prime editing strategy for correct modification of the potato ALS gene, and the configuration of PE3 pegRNA is as follows.

pegRNA와 sgRNA를 코딩하는DNA 절편;DNA fragments encoding pegRNA and sgRNA;

T7 promoter - T1-sgR-rtT-PBS-T7 terminator-T7 promoter-T2-sgR-T7 terminator T7 promoter - T1-sgR-rtT-PBS-T7 terminator-T7 promoter- T2- sgR-T7 terminator

TAATACGACT CACTATAG GNNNNNNNNNNNNNNNNNNNNGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCNNNNNNNNNNNNNNNNNNNNNNNNNNNN TTTTT TAAT ACGACTCACT ATAG GNNNNNNNNNNNNNNNNNNNGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGC TTTTTTTAATACGACT CACTATAG GNNNNNNNNNNNNNNNNNNNNNNGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN TTTTTTT TAAT ACGACTCACT ATAG GNNGTNNNNTTAGATAGCTAGAAGATTAGCTTAGACTCGAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAGA

PE3 감자 ALS pegRNA를 코딩하는 DNA 절편:DNA fragment encoding PE3 potato ALS pegRNA:

TAAT ACGACTCACT ATAG GCTATTACGGGTCAAGTGCCGGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCAATCATCCTTCTGGACACTTGACCCGTA TTTTT TAAT ACGACTCACT ATAG GTAACAACGAUAAUGCCCAGUGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGC TTTTTTTAAT ACGACTCACT ATAG GCTATTACGGGTCAAGTGCCGGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCAATCATCCTTCTGGACACTTGACCCGTA TTTACTTT TAAT ACGACTCACT ATAG GTAAGTCACGTAACCAGCTAGAGTAGTCGATTAGAGCTAAGAGTAGTTAGTTAGAGCTAAGCAGTT

상기 양쪽 말단에 EcoRI/XhoI 부위가 있는 <T7 promoter - 5'UTR - NLS-SpCas9H840A-linker-M_MLV_RT-NLS - Nos-종결서열-T7 promoter-T1-sgR-rtT-PBS-T7 terminator-T7 promoter-T2-sgR-T7 terminator>구조의 제조를 위해, 먼저 합성한 DNA 절편을 주형으로 PCR을 하여 증폭하였다. 이때 정방향 프라이머 (5'-GAATTCTAAT ACGACTCACT ATAG-3',, 서열번호 72), 역방향 프라이머(5'-CTCGAGAAAAAA GCACCGACTCGGTGCCACTTTTTCAAGTTG-3', 서열번호 73)를 사용하여 양 말단에 EcoRI/XhoI 인식서열이 있는 PCR 산물을 확보하였다. <T7 promoter - 5'UTR - NLS-SpCas9H840A-linker-M_MLV_RT-NLS - Nos-terminator-T7 promoter-T1-sgR-rtT-PBS-T7 terminator-T7 promoter- For the preparation of the T2 -sgR-T7 terminator>structure, the DNA fragment synthesized earlier was amplified by PCR as a template. At this time, EcoRI / XhoI recognition sequences at both ends using a forward primer (5'- GAATTC TAAT ACGACTCACT ATAG-3', SEQ ID NO: 72), a reverse primer (5'- CTCGAG AAAAAA GCACCGACTCGGTGCCACTTTTTCAAGTTG-3', SEQ ID NO: 73) PCR products were obtained.

실시례 1-2 항을 참조하여 쪽 말단에 XhoI/SalI 부위가 있는 auto_DdRp DNA 절편(T7 promoter - 5'UTR - DdRp DNA(또는 키메라 NP868R-T7RNAP DNA) - Nos 종결서열)를 제조하여, PCR 방법으로 증폭하였다. DdRp DNA 서열 대신에 NP868R-T7RNAP DNA를 삽입할 수도 있다. 이때 정방향 프라이머 (5'-CTCGAGTAAT ACGACTCACT ATAG-3',, 서열번호 72), 역방향 프라이머(5'-GTCGACGAT CAGTAACAT AGATG-3', 서열번호 73)를 사용하여 양 말단에 XhoI/SalI 인식서열이 있는 PCR 산물을 확보하였다. With reference to Example 1-2, an auto_DdRp DNA fragment (T7 promoter - 5'UTR - DdRp DNA (or chimeric NP868R-T7RNAP DNA) - Nos termination sequence) having an XhoI / SalI site at the end was prepared, and PCR method was amplified to It is also possible to insert NP868R-T7RNAP DNA in place of the DdRp DNA sequence. At this time, a forward primer (5'- CTCGAG TAAT ACGACTCACT ATAG-3', SEQ ID NO: 72) and a reverse primer (5'- GTCGAC GAT CAGTAACAT AGATG-3', SEQ ID NO: 73) were used at both ends of the XhoI / SalI recognition sequence A PCR product with this was obtained.

상기 제조한 DNAge 절편 및 auto_DdRp DNA 절편을 XhoII 제한효소로 절단하고 ligase로 연결하여 양쪽 말단에 EcoRI/SalI 부위가 있는 auto_(DdRp+DNAge) 절편(T7 promoter - 5'UTR - DdRp DNA(또는 키메라 NP868R-T7RNAP DNA) - Nos 종결서열 - T7 promoter - 5'UTR - NLS-SpCas9H840A-linker-M_MLV_RT-NLS - Nos-종결서열-T7 promoter-T1-sgR-rtT-PBS-T7 terminator-T7 promoter-T2-sgR-T7 terminator)을 제조하였다.The prepared DNAge fragment and auto_DdRp DNA fragment were digested with XhoII restriction enzyme and ligated with ligase to auto_(DdRp+DNAge) fragment (T7 promoter - 5'UTR - DdRp DNA (or chimeric NP868R) with EcoRI/SalI sites at both ends. -T7RNAP DNA) - Nos terminator - T7 promoter - 5'UTR - NLS-SpCas9H840A-linker-M_MLV_RT-NLS - Nos-terminator-T7 promoter-T1-sgR-rtT-PBS-T7 terminator-T7 promoter- T2- sgR-T7 terminator) was prepared.

이를 pCAMBIA1305.1 (AbcAm, 미국)에 있는 EcoRI/SalI 부위에 클로닝하여 auto_(DdRp+DNAge) Ti 발현 카세트이라고 지칭하였다. 또한, auto_DdRp DNA 절편을 포함하는 Binary vector(Ti plAsmid)을 auto_DdRp Ti 발현 카세트라고 하였다.This was cloned into the EcoRI/SalI site in pCAMBIA1305.1 (AbcAm, USA) and designated as the auto_(DdRp+DNAge) Ti expression cassette. In addition, a binary vector (Ti plAsmid) containing an auto_DdRp DNA fragment was referred to as an auto_DdRp Ti expression cassette.

2~3 μl 상기 재조합된 벡터 클로닝 반응용액을 대장균에 형질도입하여 선택 플레이트에 플레이트하여 37℃에서 밤새 배양하였다. 2-3 μl of the recombinant vector cloning reaction solution was transduced into E. coli, plated on a selection plate, and incubated overnight at 37°C.

6~12 개의 콜로니를 골라 각각 50μg/ml의 LB 선택 배지 3ml에 접종한다. 37℃에서 셰이커에서 밤새 배양한다. 표준 절차 또는 상용 Qiaprep Miniprep 키트 (Qiagen)를 사용하여 플라스미드 DNA를 분리하였다. 재조합 Binary vector(Ti plAsmid)를 EcoRI/SalI로 절단하고 겔 전기영동을 수행하여 auto_(DdRp+DNAge) Ti 발현 카세트 클론을 스크리닝하였다(도 19). Pick 6 to 12 colonies and inoculate them into 3 ml of LB selection medium at 50 μg/ml each. Incubate overnight on a shaker at 37°C. Plasmid DNA was isolated using standard procedures or a commercial Qiaprep Miniprep kit (Qiagen). Recombinant binary vector (Ti plAsmid) was digested with EcoRI/SalI and gel electrophoresis was performed to screen auto_(DdRp+DNAge) Ti expression cassette clones (FIG. 19).

이렇게 얻어진 auto_(DdRp+DNAge) Ti 발현 카세트를 E. coli DH5α로 옮겨 증폭시켰다. auto_(DdRp+DNAge) Ti 발현 카세트는 이후 동결-해동 방법을 사용하여 AGrobActerium tumefAciens LBA4404에 도입하여 auto_(DdRp+DNAge) Ti 발현시스템을 제조하였다.The auto_(DdRp+DNAge) Ti expression cassette thus obtained was transferred to E. coli DH5α and amplified. The auto_(DdRp+DNAge) Ti expression cassette was then introduced into AGrobActerium tumefAciens LBA4404 using a freeze-thaw method to prepare an auto_(DdRp+DNAge) Ti expression system.

본 발명의 auto_(DdRp+DNAge) Ti 발현 카세트는 A. tumefAciens LBA4404 매개 방법을 통해 토마토 식물의 자가 계통으로 형질 전환할 수 있다. The auto_(DdRp+DNAge) Ti expression cassette of the present invention can be transformed into an autologous lineage of tomato plants through the A. tumefAciens LBA4404 mediated method.

1-5. CMV promoter 기반 핵-의존적 mRNA 발현용 벡터 제조1-5. Preparation of vector for nuclear-dependent mRNA expression based on CMV promoter

pCI-neo Mammalian Exprision Vector(Promega, 미국)를 이용하여 핵에서 CMV immediAte-early enhAncer/promoter reGion 및 β-Globin/IGG chimeric intron에 의하여 DNAge를 발현할 수 있는 pCI_DNAge를 제조하였다. Using the pCI-neo Mammalian Exprision Vector (Promega, USA), pCI_DNAge capable of expressing DNAge was prepared in the nucleus by CMV immediAte-early enhAncer/promoter reGion and β-Globin/IGG chimeric intron.

사용한 유전체 편집은 SpCas9-HF1, NLS-NgAgo-NLS와 M-MLV 역전사 효소와Cas9 H840A nickase을 포함하는 표적 엔도뉴클레아제와 이들에 사응하는 가이드 핵산을 이용하였다.For genome editing, target endonucleases including SpCas9-HF1, NLS-NgAgo-NLS, M-MLV reverse transcriptase and Cas9 H840A nickase, and guide nucleic acids corresponding thereto were used.

실시례 1-3을 참조하여 (T7 프로모터 - 5'UTR - <NLS-SpCas9H840A-linker-M_MLV_RT-NLS> - muag - A64 - C30 - 히스톤SL)를 코딩하는 DNA 절편과 (T7 프로모터 - pegRNA-sgRNA - T7 전사종결서열)을 코딩하는 DNA 절편으로 구성된 하나의 DNA 절편을 주형으로 PCR 방법으로 증폭하였다. 이때 정방향 프라이머 (5'-CTGGACTAAT ACGACTCACT ATAG-3', 서열번호 74) 및 역방향 프라이머 (5'-TCTAGAAAAAAA GCACCGACTCGGTGCCACTTTTTCAAGTTG-3', 서열번호 44)를 사용하여 양 말단에 XhoI/XbaI 인식서열이 있는 PCR 산물을 확보하였다. With reference to Example 1-3 (T7 promoter - 5'UTR - <NLS-SpCas9H840A-linker-M_MLV_RT-NLS> - muag - A64 - C30 - histone SL) and (T7 promoter - pegRNA-sgRNA) - One DNA fragment consisting of a DNA fragment encoding T7 transcription termination sequence) was amplified by PCR as a template. At this time, using a forward primer (5'- CTGGAC TAAT ACGACTCACT ATAG-3', SEQ ID NO: 74) and a reverse primer (5'- TCTAGA AAAAAA GCACCGACTCGGTGCCACTTTTTCAAGTTG-3', SEQ ID NO: 44) at both ends using XhoI/XbaI A PCR product having a recognition sequence was obtained.

상기 증폭된 PCR 산물들을 XhoI/XbaI 제한효소 처리하여 절단하여 5'말단에 XhoI 인식서열, 3'말단에 XbaI 인식서열이 있는 DNAge DNA 절편을 제조하였다. 절단된 DNAge 절편을 XhoI/XbaI 제한효소로 선형화된 pCI-neo 벡터에 T4 DNA ligase를 이용하여 삽입하였다. 2~3 μl 상기 pSMPUW 벡터 재조합 용액을 대장균에 형질도입하여 앰피실린 선택 플레이트에 플레이트하여 37℃에서 밤새 배양하였다. 6~12개의 콜로니를 골라 각각 50μg/ml의 암피실린이 있는 LB 성장 배지 3ml에 접종한다. 37℃에서 셰이커에서 밤새 배양한다. 표준 절차 또는 상용 Qiaprep Miniprep 키트 (Qiagen, 미국)를 사용하여 DNAge 절편이 재조합 pCI-neo 벡터를 분리하였다. 재조합 플라스미드를 XhoI/XbaI 제한효소로 절단하고 겔 전기영동을 수행하여 auto_DdRp DNA와 DNAge 발현 카세트를 포함하는 클론을 확인하였다(도 20).The amplified PCR products were treated with XhoI/XbaI restriction enzymes and cut to prepare a DNAge DNA fragment having an XhoI recognition sequence at the 5' end and an XbaI recognition sequence at the 3' end. The cut DNAge fragment was inserted into the pCI-neo vector linearized with XhoI/XbaI restriction enzymes using T4 DNA ligase. 2-3 μl of the pSMPUW vector recombinant solution was transduced into E. coli, plated on an ampicillin selection plate, and incubated at 37° C. overnight. Pick 6 to 12 colonies and inoculate them in 3 ml of LB growth medium containing 50 μg/ml of ampicillin, respectively. Incubate overnight on a shaker at 37°C. Recombinant pCI-neo vectors with DNAge fragments were isolated using standard procedures or a commercial Qiaprep Miniprep kit (Qiagen, USA). The recombinant plasmid was digested with XhoI/XbaI restriction enzymes and gel electrophoresis was performed to confirm clones containing auto_DdRp DNA and a DNAge expression cassette (FIG. 20).

실시례 2. 리포좀 전달체 제조Example 2. Preparation of liposome delivery system

본 발명에서 제조된 선형 DdRp RNA 발현 카세트, 여러 종류의 환형의 플라스미드 발현 카세트 및 이들의 조합을 Lipofectamine  2000 Transfection Reagent(ThermoFisher, 미국)로 리포좀 전달체를 제조하였다.A liposome delivery system was prepared by using the linear DdRp RNA expression cassette prepared in the present invention, various types of circular plasmid expression cassettes, and combinations thereof with Lipofectamine 2000 Transfection Reagent (ThermoFisher, USA).

상기 제조된 DdRp RNA 발현 카세트, 플라스미드 발현 카세트 및 이들의 조합(같은 몰비)의 혼합물 1 ㎍과 Opti-MEM 100 ㎕를 1.5 ㎖ 튜브에 넣어 섞고, Lipofectamin2000 5㎕와 무혈청 배지 100 ㎕를 다른 1.5 ㎖ 튜브에 넣어 혼합한 후 5분 동안 상온에 방치하였다. 이후 상기 두 튜브의 내용물을 혼합하고, 리포좀(liposome) 형태의 복합체를 이룰 수 있도록 20분 동안 상온에서 보관하였다. 20분 후 튜브를 10초 동안 원심 분리한 후 각각의 세포 위에 처리하여 형질주입(transfection)하고, 4시간 후 새로운 배지로 갈아주었다. 1 μg of the mixture of the prepared DdRp RNA expression cassette, plasmid expression cassette, and a combination thereof (same molar ratio) and 100 μl of Opti-MEM were mixed in a 1.5 ml tube, and 5 μl of Lipofectamin2000 and 100 μl of serum-free medium were mixed with another 1.5 ml After mixing in a tube, it was left at room temperature for 5 minutes. Thereafter, the contents of the two tubes were mixed and stored at room temperature for 20 minutes to form a liposome-type complex. After 20 minutes, the tube was centrifuged for 10 seconds, treated and transfected on each cell, and replaced with a new medium after 4 hours.

상기 DdRp RNA/DNAge 시스템과 리포좀의 복합체인 auto(-)_DNAge@LS로 DdRp RNA 발현 카세트, DNAge 발현 카세트와 리포좀의 복합체인 "DdRp RNA/DNAge@LS"이라고 하였다. 안정화된 캡된 CM_DdRp mRNA에서 반복적으로 합성되는 T7 폴리머라제가 세포질에서 장기간 고농도로 유지할 수 있다. Auto(-)_DNAge@LS, a complex of the DdRp RNA/DNAge system and liposome, was referred to as “DdRp RNA/DNAge@LS”, a complex of the DdRp RNA expression cassette and DNAge expression cassette and liposome. T7 polymerase repeatedly synthesized from the stabilized capped CM_DdRp mRNA can be maintained at high concentrations in the cytoplasm for a long time.

또한, 상기 DdRp RNA/auto_DdRp+DNAge 시스템 또는 DdRp RNA/auto_(DdRp+DNAge) 시스템과 리포좀의 복합체인 auto_DNAge@LS로 DdRp RNA 발현 카세트, auto_DdRp 발현 카세트, DNAge 발현 카세트와 리포좀의 복합체인 "DdRp RNA/auto_DdRp+DNAge@LS 또는 DdRp RNA 발현 카세트, auto_(DdRp+DNAge) 발현 카세트와 리포좀의 복합체인 DdRp RNA/auto_(DdRp+DNAge)@LS"이라고 하였다. 초기에 안정화된 캡된 CM DdRp mRNA에서 합성되는 T7 폴리머라제에 의한 auto_DdRp 발현 카세트 또는 auto_(DdRp+DNAge) 발현 카세트의 T7 promoter에 결합함으로써 T7 polymerase는 자가전사 결과로 세포질에서 장기간 고농도로 유지할 수 있다. In addition, the DdRp RNA/auto_DdRp+DNAge system or the DdRp RNA/auto_(DdRp+DNAge) system and auto_DNAge@LS, which is a complex of the system, is a DdRp RNA expression cassette, auto_DdRp expression cassette, and “DdRp RNA, a complex of a DNAge expression cassette and liposome” /auto_DdRp+DNAge@LS or DdRp RNA expression cassette, DdRp RNA/auto_(DdRp+DNAge)@LS, a complex of auto_(DdRp+DNAge) expression cassette and liposome. By binding to the T7 promoter of the auto_DdRp expression cassette by T7 polymerase or auto_(DdRp+DNAge) expression cassette by T7 polymerase synthesized from initially stabilized capped CM DdRp mRNA, T7 polymerase can be maintained at a high concentration in the cytoplasm for a long time as a result of autotranscription.

대조군으로 pCI-neo_DNAge를 탑재한 DOPC 리포좀 나조입자를 제조하였으며 pCI-neo_DNAge와 리포좀의 복합체인 pCI-neo_DNAge@LS라고 하였다. As a control, DOPC liposome nazoparticles loaded with pCI-neo_DNAge were prepared, and were called pCI-neo_DNAge@LS, a complex of pCI-neo_DNAge and liposomes.

실시례 3. 발현억제 RNA/DNA 시스템의 형질주입Example 3. Transfection of expression-repressed RNA/DNA system

본 발명의 자가전사 RNA/DNA 시스템은 RNA 성분과 DNA 성분으로 구성되며, 이들의 운반체는 선형의 핵산절편, 환형의 플라스미드 및 바이러스 등 다양하게 할 수 있으며, 이들의 조합일 수도 있다. 제작된 자가전사 RNA/DNA 시스템의 전달체는 비바이러스성인 경우 다양한 방법을 선택할 수 있다. 본 실시례에서는 리포좀 유형을 선택하였으나, 이에 제한하는 것은 아니다. The self-transcribed RNA/DNA system of the present invention is composed of an RNA component and a DNA component, and the carrier thereof can be variously used, such as a linear nucleic acid fragment, a circular plasmid, and a virus, or a combination thereof. Various methods can be selected when the carrier of the prepared self-transcribed RNA/DNA system is non-viral. In this example, the liposome type was selected, but the present invention is not limited thereto.

본 발명의 발현억제 RNA/DNA 시스템의 표적 세포에 형질주입은 안정화된 형질전환 세포를 원활하게 얻기 위해 2차로 나누어 아래와 같이 진행하였다. 물론 동일에 형질전환을 할 수 있다. Transfection of the target cells of the expression-suppressing RNA/DNA system of the present invention was performed as follows in order to smoothly obtain stabilized transformed cells. Of course, transformation can be performed on the same.

1차 형질주입은 관심 mRNA를 코딩하는 DNAge를 포함하는 발현 카세트를 형질주입하고 선택배지를 이용하여 형질전환 세포를 선정하는 단계이며, 2차 형질주입은 1차 형질주입으로 선택배지에서 안정화된 세포를 대상으로 DdRp RNA 발현 카세트를 도입하여 형질전환 세포에서 합성된 DdRp에 의해 관심 mRNA 및 이들이 코딩하는 단백질을 발현하도록 하는 단계이다.The first transfection is a step in which an expression cassette containing a DNAge encoding the mRNA of interest is transfected and transformed cells are selected using a selective medium, and the second transfection is the cell stabilized in the selective medium by the first transfection. In this step, a DdRp RNA expression cassette is introduced into the target to express the mRNA of interest and the protein they encode by the DdRp synthesized in the transformed cell.

<1차 형질주입><1st transfection>

- 플라스미드 전달체 - Plasmid carrier

상기 플라스미드 전달체의 경우, pCI-neo Mammalian Exprision Vector (Promega 사, 미국) 및 Lipofectamine  2000 Transfection Reagent(ThermoFisher, 미국)의 지침서에 따라서, 표적 세포를 준비하여 1x105개의 세포를 96-웰에 분주하였다. 다음날 실시례 2에서 준비한 리포좀 유전자 전달체를 세포 배양 배지로 총 부피 100㎕로 만든 후 각 웰에 처리하였다. 37℃, 5% CO2 인큐베이터에서 24시간 동안 배양한 후 1X PBS로 세포를 세척하고, 트립신(trypsin)을 처리하여 세포를 떼어낸 후 100mm 배양 접시로 옮겨 배양하였다. In the case of the plasmid delivery system, according to the instructions of pCI-neo Mammalian Exprision Vector (Promega, USA) and Lipofectamine 2000 Transfection Reagent (ThermoFisher, USA), target cells were prepared and 1x10 5 cells were seeded into 96-wells. The next day, the liposome gene delivery system prepared in Example 2 was prepared in a total volume of 100 μl with a cell culture medium, and then treated in each well. 37 ℃, 5% CO 2 After culturing for 24 hours in an incubator, the cells were washed with 1X PBS, treated with trypsin to remove the cells, and then transferred to a 100 mm culture dish and incubated.

플라스미드 전달체의 형질주입은 RNA/DNA 시스템을 함께 리포좀 전달체로 제작하여 형질주입을 할 수도 있으며 이들을 나누어 각각 리포좀을 제작하여 각각 형질주입할 수도 있다.For transfection of the plasmid delivery system, transfection can be carried out by making the RNA/DNA system together as a liposome delivery system, or by dividing them, each liposome can be produced and each transfected.

리포좀 전달체에 의한 안정적 형질전환 세포의 선정을 위해, 형질주입 후, 형질주입된 세포는 항생제 G-418로 선택하였다. 형질주입 후 낮은 세포 밀도로 세포를 접종하고 선택을 위해 G-418 항생제를 400~600μg/ml의 G-418 농도로 넣었고 안정적인 형질전환체의 유지를 위해 200~400μg/ml의 G-418 농도로 처리하였다.For the selection of stable transformed cells by the liposome delivery system, after transfection, the transfected cells were selected with antibiotic G-418. After transfection, cells were inoculated at a low cell density, and G-418 antibiotics were added at a concentration of 400 to 600 μg/ml for selection, and at a G-418 concentration of 200 to 400 μg/ml to maintain stable transformants. processed.

- 바이러스 전달체- virus carrier

상기 바이러스 전달체의 경우, AdEasy Adenoviral Vector System(Agilent Technologii, 미국), pSMPUW Universal Lentiviral Exprision Vector(Cell Biolabs, 미국) 및 Lipofectamine  2000 Transfection Reagent(ThermoFisher, 미국)의 지침서에 따라서, 표적 세포를 준비하여 1x105개의 세포를 96-웰에 분주하였다. 다음날 세포에 처리할 감염 다중도(Multiplicity of Infection, MOI)에 따라 바이러스 유전자 전달체를 세포 배양 배지로 총 부피 100㎕로 만든 후 각 웰에 처리하였다. 바이러스 유전자 전달체 처리 후, 37℃, 5% CO2 인큐베이터에서 24시간 동안 배양한 후 1X PBS로 세포를 세척하고, 트립신(trypsin)을 처리하여 세포를 떼어낸 후 100mm 배양 접시로 옮겨 배양하였다. In the case of the viral carrier, 1x10 5 target cells were prepared according to the instructions of AdEasy Adenoviral Vector System (Agilent Technologii, USA), pSMPUW Universal Lentiviral Exprision Vector (Cell Biolabs, USA) and Lipofectamine 2000 Transfection Reagent (ThermoFisher, USA). Dog cells were seeded into 96-wells. According to the multiplicity of infection (MOI) to be treated in the cells the next day, the viral gene carrier was made into a cell culture medium in a total volume of 100 μl, and then treated in each well. After treatment with the viral gene carrier, after culturing for 24 hours at 37° C., 5% CO 2 in an incubator, the cells were washed with 1X PBS, and the cells were removed by treatment with trypsin and then transferred to a 100 mm culture dish and cultured.

렌티바이러스 경우는 2일 내지 3일에 한 번씩 항생제인 블라스티시딘(blasticidin)을 5㎍/㎖의 농도로 포함하는 배지로 갈아주었다.In the case of lentivirus, the medium containing the antibiotic blasticidin at a concentration of 5 μg/ml was changed once every 2 to 3 days.

<2차 형질주입><Secondary transfection>

2차 형질주입은 1차 형질주입된 세포를 대상으로 실시례 2에서 제조된 DdRp RNA@LS을 형질주입하는 단계로 T7 프로모터에 작용하는 최초의 T7 Polymerase를 제공하기 위한 것이다. 상기 1차 형질주입의 상기 플라스미드와 렌티바이러스 전달체를 처리하고 선정된 안정화된 세포, 그리고 아데노바이러스 유전자 전달체는 접종한 직후 세포를 대상으로 DdRp RNA@LS의 형질주입을 수행하였다.The second transfection is a step of transfecting the first transfected cells with the DdRp RNA@LS prepared in Example 2 to provide the first T7 Polymerase acting on the T7 promoter. DdRp RNA@LS transfection was performed on the cells immediately after inoculation of the selected stabilized cells and adenovirus gene carrier after treatment with the plasmid and the lentiviral carrier of the first transfection.

실시례 4. T7 polymerase 발현 지속성 실험Example 4. T7 polymerase expression persistence experiment

본 발명의 대조군 5 pmol pCI-neo_RSV-F@LS, 5 pmol DdRp RNA/RSV-F DNAi@LS, 5 pmol DdRp RNA/auto_DdRp/RSV-F DNAi@LS, 5 pmol DdRp RNA/auto_(DdRp/RSV-F DNAi)@LS, 3x104 MOI auto_(DdRp/RSV-F DNAi) 아데노 발현시스템[DdRp RNA@LS와 auto_(DdRp/RSV-F DNAi) 아데노 발현 카세트로 구성된 시스템] 또는 104 MOI auto_(DdRp/RSV-F DNAi) 렌티 발현시스템[DdRp RNA@LS와 auto_(DdRp/RSV-F DNAi) 렌티 발현 카세트로 구성된 시스템]를 실시례 3의 방법으로 각각 293T 세포에 형질주입 후, 0, 24, 48 및 72시간에서 293T 세포 내 T7 polymerase mRNA 및 단백질을 분석하였다. 본 실시례에서는 auto_DdRp의 DdRp는 T7RNAP 또는 NP868R-T7RNAP가 있는 자가전사 RNA/DNA 시스템을 사용하였다.Controls of the present invention 5 pmol pCI-neo_RSV-F@LS, 5 pmol DdRp RNA/RSV-F DNAi@LS, 5 pmol DdRp RNA/auto_DdRp/RSV-F DNAi@LS, 5 pmol DdRp RNA/auto_(DdRp/RSV) -F DNAi)@LS, 3x10 4 MOI auto_(DdRp/RSV-F DNAi) adeno expression system [system consisting of DdRp RNA@LS and auto_(DdRp/RSV-F DNAi) adeno expression cassette] or 10 4 MOI auto_( DdRp/RSV-F DNAi) lenti expression system [system consisting of DdRp RNA@LS and auto_(DdRp/RSV-F DNAi) lenti expression cassette] was transfected into 293T cells by the method of Example 3, respectively, 0, 24 , T7 polymerase mRNA and protein in 293T cells were analyzed at 48 and 72 hours. In this example, auto_DdRp of DdRp was used as a self-transcribed RNA/DNA system with T7RNAP or NP868R-T7RNAP.

- T7 polymerase mRNA 분석- T7 polymerase mRNA analysis

상기 형질전환 293T 세포의 T7 polymerase mRNA 분석은 2차 형질주입한 후, 0, 24, 48 및 72시간에서 293T 세포에서 총 RNA를 분리하여 quantitative PCR (qPCR) with SYBR Green로 분석하였다. For T7 polymerase mRNA analysis of the transgenic 293T cells, total RNA was isolated from 293T cells at 0, 24, 48 and 72 hours after the second transfection and analyzed by quantitative PCR (qPCR) with SYBR Green.

구체적으로, 형질주입된 293T 세포에서 RNeAsy 미니 키트 (Qiagen)를 사용하여 총 RNA를 추출했다. 총 150ng의 총 RNA를 cDNA 로 역전사하고(SuperScript II Reverse Transcriptase, Invitrogen), 상기 cDNA를 이용하여 KAPA SYBR  FAST qPCR Kits(Sigma aldrich, 미국)를 사용하여 분석하였다.Specifically, total RNA was extracted from the transfected 293T cells using the RNeAsy mini kit (Qiagen). A total of 150 ng of total RNA was reverse transcribed into cDNA (SuperScript II Reverse Transcriptase, Invitrogen), and the cDNA was used for analysis using KAPA SYBR FAST qPCR Kits (Sigma aldrich, USA).

qPCR 반응을 준비하기 전에 KAPA PROBE FAST Bio-Rad iCycler ™ qPCR 마스터 믹스 (2X), 템플릿 DNA, 프라이머 및 프로브를 <표 3>에 제시 내용으로 철저히 혼합하였다.Before preparing the qPCR reaction, KAPA PROBE FAST Bio-Rad iCycler ™ qPCR Master Mix (2X), template DNA, primers and probes were thoroughly mixed as presented in Table 3.

qPCR의 구성 시약qPCR constitutive reagents Final ConcentrationFinal Concentration 20 μl rxn20 μl rxn PCR grade water up to 20 μlPCR grade water up to 20 μl 7.2 μl7.2 μl qPCR Master Mix (2X)qPCR Master Mix (2X) 1X1X 10 μl10 μl Forward Primer (10 μM)Forward Primer (10 μM) 200 nM200 nM 0.4 μl0.4 μl Reverse Primer (10 μM)Reverse Primer (10 μM) 200 nM200 nM 0.4 μl0.4 μl Template DNA(10 ng/1 μl)Template DNA (10 ng/1 μl) 1 ng/μl1 ng/μl 2.0 μl2.0 μl

정방향 프라이머 5'-TCACGACTCC TTCGGTACCA T-3' (서열번호 90), 역방향 프라이머 5'-CATAGTTTCG CGCACTGCTT T-3' (서열번호 91)를 사용하였다.Forward primer 5'-TCACGACTCC TTCGGTACCA T-3' (SEQ ID NO: 90) and reverse primer 5'-CATAGTTTCG CGCACTGCTT T-3' (SEQ ID NO: 91) were used.

qPCR 프로토콜은 1단계는 3분 동안 95℃에서 효소 활성화 (1주기), 2단계로40 사이클 (변성: 95℃, 15초, 어닐링/연장: 60℃, 1분)은 Bio-Rad iCycler(Bio-Rad, 미국)를 사용하여 수행하여 사용하는 장비의 제조사의 지침에 따라 데이터를 분석하였다. 본 실시례에서 최고 발현치, DdRp RNA/auto_DdRp/RSV-F DNAi@LS의 72시간에서 얻은 값을 100%으로 하여 그에 비례하여 그 수치를 백분율로 표시한 결과는 <도 17>와 같다. 5회 실험하여 평균값을 표기하였다.The qPCR protocol is a Bio-Rad iCycler (Bio -Rad, USA) and analyzed the data according to the manufacturer's instructions of the equipment used. In this example, the highest expression value, the value obtained at 72 hours of DdRp RNA/auto_DdRp/RSV-F DNAi@LS, was 100%, and the result of expressing the value as a percentage in proportion to it is shown in <Fig. 17>. The experiment was performed 5 times and the average value was indicated.

<도 21>에서처럼, auto_DdRp의 DdRp가 T7RNAP를 사용한 형질전환 세포를 분석한 결과로 대조군 pCI-neo_RSV-F@LS에서는 T7 polymerase mRNA의 발현이 없으며, DdRp RNA/RSV-F DNAi@LS 형질전환 세포에서는 형질주입된 5'Cap 구조가 있고 안정화된 DdRp RNA가 세포내에서 천천히 분해되는 것을 확인할 수 있었다, DdRp RNA/auto_DdRp/RSV-F DNAi@LS; DdRp RNA/auto_(DdRp/RSV-F DNAi)@LS; auto_(DdRp/RSV-F DNAi) 아데노 발현시스템 또는 auto_(DdRp/RSV-F DNAi) 렌티 발현시스템을 포함하는 auto(+) DdRp 발현시스템이 형질전환된 세포에서는 DdRp RNA 발현 카세트에서 합성되는 최초의 T7 polymerase가 auto_DdRp 발현 카세트의 T7 프로모터에 결합하여 하류지역에 있는 DdRp를 합성하는 자가전사 루프가 작용하여 안정적으로 DdRp를 합성함을 확인할 수 있었다. As in <Fig. 21>, as a result of analyzing the auto_DdRp DdRp transformed cells using T7RNAP, there was no expression of T7 polymerase mRNA in the control pCI-neo_RSV-F@LS, and DdRp RNA/RSV-F DNAi@LS transformed cells It was confirmed that the transfected 5'Cap structure and the stabilized DdRp RNA were slowly degraded in the cell, DdRp RNA/auto_DdRp/RSV-F DNAi@LS; DdRp RNA/auto_(DdRp/RSV-F DNAi)@LS; In cells transformed with the auto(+) DdRp expression system including the auto_(DdRp/RSV-F DNAi) adeno expression system or the auto_(DdRp/RSV-F DNAi) lenti expression system, the first It was confirmed that the T7 polymerase binds to the T7 promoter of the auto_DdRp expression cassette, and the self-transcription loop that synthesizes DdRp in the downstream region acts to stably synthesize DdRp.

auto_DdRp의 DdRp가 T7RNAP 또는 NP868R-T7RNAP를 갖는 형질전환체 세포를 비교한 결과는 경우 T7RNAP보다 NP868R-T7RNAP 형질전환 세포가 평균적으로 5~6배정도 T7 polymerase mRNA의 발현량이 높았으며 NP868R의 효과로 생각이 되었다(자료 미제시).As a result of comparing transformant cells with auto_DdRp DdRp of T7RNAP or NP868R-T7RNAP, NP868R-T7RNAP transfected cells had on average 5 to 6 times higher T7 polymerase mRNA expression than T7RNAP. became (data not shown).

- T7 polymerase 분석- T7 polymerase assay

상기 형질주입 293T 세포를 0, 24, 48 및 72시간에 채집하여 cocktail protease inhibitor가 포함된 RIPA 버퍼로 lysis한 뒤 원심분리를 이용하여 단백질 시료들을 준비하였다. 이러한 시료들을 ELISA Plate에 4℃에서 12시간 동안 코팅하고 비특이적 염색을 예방하기 위해 0.2% Tween-20 및 5% dry milk에서 blocking을 한 후, Anti-T7 RNA Polymerase antibody (CABT-B8990, Creative diagnostic, 영국)로 1차 염색, HRP가 결합된 2차 항체로 2차 염색을 하고 Promega™ Microplate Reader(Promega, 미국) 분석하였다. 5회 실험하여 평균값을 표기하였다.The transfected 293T cells were collected at 0, 24, 48 and 72 hours, lysed with RIPA buffer containing cocktail protease inhibitor, and then protein samples were prepared by centrifugation. After coating these samples on an ELISA plate at 4°C for 12 hours and blocking in 0.2% Tween-20 and 5% dry milk to prevent non-specific staining, Anti-T7 RNA Polymerase antibody (CABT-B8990, Creative diagnostic, UK), secondary staining with HRP-conjugated secondary antibody, and analysis with Promega™ Microplate Reader (Promega, USA). The experiment was performed 5 times and the average value was indicated.

<도 22>에서처럼, auto_DdRp의 DdRp가 T7RNAP를 사용한 형질전환 세포를 분석한 결과로 결론적으로, DdRp RNA/RSV-F DNAi@LS인 auto(-) DdRp 발현시스템 그리고 DdRp RNA/auto_DdRp/RSV-F DNAi@LS; DdRp RNA/auto_(DdRp/RSV-F DNAi)@LS; auto_(DdRp/RSV-F DNAi) 아데노 발현시스템 또는 auto_(DdRp/RSV-F DNAi) 렌티 발현시스템을 포함하는 auto(+) DdRp 발현시스템이 형질전환된 세포에서 합성되는 T7 polymerase은 세포질 내에서 적어도 72시간 이상 고농도로 유지되는 것이다.As in <Fig. 22>, as a result of analyzing the DdRp of auto_DdRp transformed cells using T7RNAP, in conclusion, the auto(-) DdRp expression system and DdRp RNA/auto_DdRp/RSV-F, which are DdRp RNA/RSV-F DNAi@LS DNAi@LS; DdRp RNA/auto_(DdRp/RSV-F DNAi)@LS; T7 polymerase synthesized in cells transformed with an auto_(DdRp/RSV-F DNAi) adeno expression system or an auto(+) DdRp expression system including an auto_(DdRp/RSV-F DNAi) lenti expression system is at least in the cytoplasm. It is maintained at a high concentration for more than 72 hours.

auto_DdRp의 DdRp가 T7RNAP 또는 NP868R-T7RNAP를 갖는 형질전환체 세포를 비교한 결과는 경우 T7RNAP보다 NP868R-T7RNAP 형질전환 세포가 평균적으로 10~15배정도 T7 polymerase의 발현량이 높았으며 NP868R의 효과로 생각이 되었다(자료 미제시).As a result of comparing the auto_DdRp DdRp transformant cells with T7RNAP or NP868R-T7RNAP, NP868R-T7RNAP transformed cells had on average 10 to 15 times higher T7 polymerase expression than T7RNAP, which was thought to be the effect of NP868R. (data not shown).

실시례 4. 유전체 편집 시스템의 세포 도입 및 T7E1 분석 Example 4. Cell introduction and T7E1 analysis of genome editing system

실시례 3의 방법으로 제조한 유전체 편집 시스템을 제조하여 이를 유전체 편집 발현 시스템이라고 지칭하였다. 상기 제조된 유전체 편집 발현시스템은 RNase가 없는 Eppendof 튜브에서 혼합하고 형질주입 사용될 때까지 얼음에 보관하였다.A genome editing system prepared by the method of Example 3 was prepared, and this was referred to as a genome editing expression system. The prepared genome editing expression system was mixed in an RNase-free Eppendof tube and stored on ice until used for transfection.

상기 제조된 유전체 편집 발현 시스템의 1차 형질 주입을 실시례 3의 방법으로 HEK293T(ATCC CRL-3216) 세포를 약 20,000 세포/cm2 로 접종하였다. HEK293T(ATCC CRL-3216) 세포를 10% 우태 혈청, 2mM GlutaMax, 1X 비-필수 아미노산 및 100 U/ml 페니실린 및 100 ug/ml 스트렙토마이신으로 보충된 DMEM 고 글루코스 배지에서 배양하였다. 형질주입 1일 전 세포를 12-웰 플레이트에 시딩하였다. 세포가 약 60% 컨플루언스할 때 상기 제조된 DdRp RNA 리포솜을 형질주입하였다. HEK293T (ATCC CRL-3216) cells were inoculated at about 20,000 cells/cm 2 by the method of Example 3 for primary transfection of the prepared genome editing expression system. HEK293T (ATCC CRL-3216) cells were cultured in DMEM high glucose medium supplemented with 10% fetal calf serum, 2 mM GlutaMax, 1X non-essential amino acids and 100 U/ml penicillin and 100 ug/ml streptomycin. One day prior to transfection, cells were seeded in 12-well plates. The prepared DdRp RNA liposome was transfected when the cells were about 60% confluent.

형질주입 3일 후 세포를 수확하고 유전체 DNA (gDNA)를 QIAamp DNA 혈액 미니 키트(Qiagen, 미국)로 정제하였다. 이어서, 200 ng 입력 gDNA를 사용하여 가이드 핵산 표적 부위를 둘러싼 유전체 영역을 상응하는 프라이머로 PCR에 의해 증폭하였다. Cells were harvested 3 days after transfection and genomic DNA (gDNA) was purified with QIAamp DNA Blood Mini Kit (Qiagen, USA). Then, using 200 ng input gDNA, the genomic region surrounding the guide nucleic acid target site was amplified by PCR with the corresponding primers.

PCR 산물을 T7E1 분석으로 유전체 편집 정도를 확인하였다.The degree of genome editing was confirmed by T7E1 analysis of the PCR product.

T7E1 분석(불일치 감지 분석)은, 상기 수확한 세포를 65℃에서 15분 동안 가열하고 500 μL 추출 부퍼 (10mM 트리스, pH 8; 2mM EDTA; 0.2 % 트리톤 X-100; 200㎍/mL 프로테이나제K)로 추출한 다음, 분리한 유전체 DNA를 대상으로 PCR하여 얻은 PCR 산물에서 실시하였다. The T7E1 assay (mismatch detection assay) was performed by heating the harvested cells at 65° C. for 15 min and in 500 μL extraction buffer (10 mM Tris, pH 8; 2 mM EDTA; 0.2% Triton X-100; 200 μg/mL protein After extraction with K), it was carried out on the PCR product obtained by PCR on the isolated genomic DNA.

제조업자 프로토콜에 따라, EconoTaq PLUS GREEN 2X Master Mix (Lucigen, 미국) 또는 AccuPrime Taq DNA Polymerase, High Fidelity (TermoFisher, 미국)로 표적 영역을 PCR로 증폭하였다. The target region was amplified by PCR with EconoTaq PLUS GREEN 2X Master Mix (Lucigen, USA) or AccuPrime Taq DNA Polymerase, High Fidelity (TermoFisher, USA) according to the manufacturer's protocol.

PCR 산물을 95℃에서 10분 동안 변성시키고, 초당 -2℃씩 낮추어 85℃까지 어닐링한 다음, 초당 -1℃씩 낮추고 25℃까지 다시, 어닐링하였다. The PCR product was denatured at 95° C. for 10 minutes, annealed at -2° C. per second down to 85° C., and then annealed again at -1° C. per second and down to 25° C. again.

형성된 이종 복합체 PCR 생성물 (5μL)을 37℃에서 20분 동안 5U T7E1 효소 (New England Bio Labs, 미국)와 함께 반응시켰다. 불일치 검정으로부터의 생성물을 Novex 10 % TBE 겔(Invitrogen, 미국)에서 전기영동하였다. The formed heterogeneous complex PCR product (5 μL) was reacted with 5U T7E1 enzyme (New England Bio Labs, USA) at 37° C. for 20 minutes. Products from the mismatch assay were electrophoresed on Novex 10 % TBE gels (Invitrogen, USA).

① RNA-guided 엔도뉴클레아제① RNA-guided endonuclease

상기 유전체 편집 리포좀으로 HEK293 세포에서 인간 VEGF 유전자를 표적화 유전체 편집을 실시하였으며, 상기 DdRp RNA 발현 카세트 그리고 Cas9 변이체 SpCas9-HF1를 코딩하는 발현 카세트와 tRNA-sgRNA(VEGF를 표적화하는 sgRNA) 발현 카세트를 포함하는 유전체 편집 리포좀의 성능을 평가하였다. 대조군은 DdRp RNA 발현 카세트가 없이 Cas9 변이체 SpCas9-HF1를 코딩하는 발현 카세트와 tRNA-sgRNA(VEGF를 표적화하는 sgRNA) 발현 카세트를 사용하였다. The genome editing liposome was used for genome editing targeting human VEGF gene in HEK293 cells, including the DdRp RNA expression cassette, an expression cassette encoding Cas9 mutant SpCas9-HF1, and a tRNA-sgRNA (sgRNA targeting VEGF) expression cassette The performance of genome editing liposomes was evaluated. As a control group, an expression cassette encoding a Cas9 mutant SpCas9-HF1 without a DdRp RNA expression cassette and a tRNA-sgRNA (sgRNA targeting VEGF) expression cassette were used.

형질주입 3일 후 세포를 수확하고 유전체 DNA(gDNA)를 QIAamp DNA 혈액 미니 키트 (Qiagen, 미국)로 정제하였다. 이어서, pegRNA 표적 부위를 둘러싼 유전체 영역을 200 ng 입력 gDNA를 사용하여 하기 프라이머로 PCR에 의해 증폭하였다.Cells were harvested 3 days after transfection and genomic DNA (gDNA) was purified with QIAamp DNA Blood Mini Kit (Qiagen, USA). Then, the genomic region surrounding the pegRNA target site was amplified by PCR with the following primers using 200 ng input gDNA.

Forward Primer, 5'TCCAGATGGCACATTGTCAG-3' (서열번호 55)Forward Primer, 5'TCCAGATGGCACATTGTCAG-3' (SEQ ID NO: 55)

Reverse Primer, 5'AGGGAGCAGGAAAGTGAGGT-3' (서열번호 56)Reverse Primer, 5'AGGGAGCAGGAAAGTGAGGT-3' (SEQ ID NO: 56)

<도 23의 a>의 T7E1 분석 결과는 RNA-guided 엔도뉴클레아제에 의한 유전체 편집에서, 비처리구(첫번째 레인) 및 DdRp RNA 발현 카세트가 없는 리포좀을 처리한 대조군(두번째 레인)의 결과는 T7E1 효소에 의한 반응 산물이 없어 유전체 편집 현상이 일어나지 않음을 확인할 수 있었다. 실험군(세번째 레인)에서는 상기 처리한 Cas9 변이체 SpCas9-HF1를 코딩하는 발현 카세트와 tRNA-sgRNA(VEGF를 표적화하는 sgRNA) 발현 카세트를 포함하는 전사 표적화 유전체 편집 시스템에 의해 유전체 편집이 있어 상기 표적서열을 포함하는 PCR 산물을 혼성화하면 이종 복합체 이중 DNA를 형성하여 결과적으로, T7E1 효소에 의해 절단 현상이 발생함을 확인할 수 있었으며 그 정도는 매우 높은 수준으로 확인하였다.The results of T7E1 analysis in <FIG. 23 a> are the results of T7E1 in genome editing by RNA-guided endonuclease, untreated group (first lane) and control group (second lane) treated with liposomes without DdRp RNA expression cassette It was confirmed that genome editing did not occur because there was no reaction product by the enzyme. In the experimental group (third lane), there is genome editing by a transcription-targeting genome editing system comprising an expression cassette encoding the treated Cas9 mutant SpCas9-HF1 and a tRNA-sgRNA (sgRNA targeting VEGF) expression cassette. When the PCR product containing the hybridization was performed, a heterogeneous complex double DNA was formed, and as a result, it was confirmed that cleavage occurred by the T7E1 enzyme, and the degree was confirmed to be very high.

② DNA-guided 엔도뉴클레아제② DNA-guided endonuclease

상기 유전체 편집은 HEK293 세포에서 인간 CD 274 유전자를 대상으로 실시하였으며, 상기 DdRp RNA 발현 카세트 그리고 HuAgo를 코딩하는 RNA 발현 카세트과 가이드 핵산 GD54를 포함하는 유전체 편집 리포좀의 성능을 평가하였다. 대조군은 DdRp RNA 발현 카세트가 없이 HuAgo를 코딩하는 RNA 발현 카세트과 가이드 핵산 GD5를 사용하였다. The genome editing was performed on the human CD274 gene in HEK293 cells, and the performance of the genome editing liposome containing the DdRp RNA expression cassette, the HuAgo-encoding RNA expression cassette and the guide nucleic acid GD54 was evaluated. As a control group, an RNA expression cassette encoding HuAgo and a guide nucleic acid GD5 without a DdRp RNA expression cassette were used.

형질주입 3일 후 세포를 수확하고 유전체 DNA(gDNA)를 QIAamp DNA 혈액 미니 키트 (Qiagen, 미국)로 정제하였다. 이어서, pegRNA 표적 부위를 둘러싼 유전체 영역을 200 ng 입력 gDNA를 사용하여 하기 프라이머로 PCR에 의해 증폭하였다.Cells were harvested 3 days after transfection and genomic DNA (gDNA) was purified with QIAamp DNA Blood Mini Kit (Qiagen, USA). Then, the genomic region surrounding the pegRNA target site was amplified by PCR with the following primers using 200 ng input gDNA.

Forward Primer, 5'CCTGGCTGCACTAATTGTCTAT-3' (서열번호 57); Forward Primer, 5'CCTGGCTGCACTAATTGTCTAT-3' (SEQ ID NO: 57);

Reverse Primer, 5'CTGTGTTGTTTGTTCTGGATTTC-3' (서열번호 58)Reverse Primer, 5'CTGTGTTGTTTGTTCTGGATTTC-3' (SEQ ID NO: 58)

을 사용하여 PCR로 생성하였다. was generated by PCR.

<도 23의 b>의 T7E1 분석 결과는 DNA-guided 엔도뉴클레아제에 의한 유전체 편집 현상은 대조군(첫번째 레인)에서는 일어나지 않았으며 실험군(두번째 레인)에서는 매우 높은 수준으로 발생함을 확인하였다.The T7E1 analysis result of <FIG. 23b> confirmed that genome editing by DNA-guided endonuclease did not occur in the control group (first lane) but occurred at a very high level in the experimental group (second lane).

③ M-MLV 역전사 효소와 Cas9 H840A nickase의 융합 단백질③ Fusion protein of M-MLV reverse transcriptase and Cas9 H840A nickase

상기 유전체 편집은 인간 HEK3 유전자에서 인간 HEK3 유전자를 표적화 유전체 편집을 실시하였으며, 상기 auto_DdRp DNA 발현 카세트 그리고 M-MLV 역전사 효소와 Cas9 H840A nickase의 융합 단백질을 코딩하는 DNAen 발현 카세트, pegRNA-sgRNA(HEK3을 표적화하는 peg RNA 및 sgRNA)를 코딩하는 DNAsg 발현 카세트를 포함하는 유전체 편집 시스템을 형질주입하여 안정화 세포주를 선별하였다. 선별된 안정 세포주에 DdRp RNA 발현 카세트를 형질주입하여 유전체 편집을 유도하고 평가하였다.The genome editing was performed by targeting the human HEK3 gene from the human HEK3 gene, and the auto_DdRp DNA expression cassette and a DNAen expression cassette encoding a fusion protein of M-MLV reverse transcriptase and Cas9 H840A nickase, pegRNA-sgRNA (HEK3 Stable cell lines were selected by transfection with a genome editing system comprising a DNAsg expression cassette encoding targeting peg RNA and sgRNA). Selected stable cell lines were transfected with a DdRp RNA expression cassette to induce and evaluate genome editing.

대조군은 DdRp RNA 발현 카세트가 없이 M-MLV 역전사 효소와 Cas9 H840A nickase의 융합 단백질 mRNA 그리고 pegRNA-sgRNA(HEK3을 표적화하는 peg RNA 및 sgRNA) RNA 발현 카세트를 사용하였다. As a control group, a fusion protein mRNA of M-MLV reverse transcriptase and Cas9 H840A nickase without a DdRp RNA expression cassette and a pegRNA-sgRNA (peg RNA and sgRNA targeting HEK3) RNA expression cassette were used.

형질주입 3일 후 세포를 수확하고 유전체 DNA(gDNA)를 QIAamp DNA 혈액 미니 키트 (Qiagen, 미국)로 정제하였다. 이어서, pegRNA 표적 부위를 둘러싼 유전체 영역을 200 ng의 gDNA를 사용하여 하기 프라이머로 PCR에 의해 증폭하였다.Cells were harvested 3 days after transfection and genomic DNA (gDNA) was purified with QIAamp DNA Blood Mini Kit (Qiagen, USA). Then, the genomic region surrounding the pegRNA target site was amplified by PCR with the following primers using 200 ng of gDNA.

Forward Primer, 5'-AGGGAAACGCCCATGCAATTAGTCT-3' (서열번호 59)Forward Primer, 5'-AGGGAAACGCCCATGCAATTAGTCT-3' (SEQ ID NO: 59)

Reverse Primer, 5'-CTAGCCCCTGTCTAGGAAAAGCTGTC-3' (서열번호 60)Reverse Primer, 5'-CTAGCCCCTGTCTAGGAAAAGCTGTC-3' (SEQ ID NO: 60)

<도 23의 c>의 T7E1 분석 결과는 M-MLV 역전사 효소와 Cas9 H840A nickase의 융합 단백질에 의한 유전체 편집 현상은 대조군(첫번째 레인)에서는 일어나지 않았으며 실험군(두번째 레인)에서는 매우 높은 수준으로 발생함을 확인하였다.The T7E1 analysis result of <Fig. 23c> showed that genome editing by the fusion protein of M-MLV reverse transcriptase and Cas9 H840A nickase did not occur in the control group (first lane), but occurred at a very high level in the experimental group (second lane). was confirmed.

Claims (32)

세포 내 적어도 하나의 내인성 유전체 편집을 하고 전사가 가능한 구성성분이 있는 시스템으로서, 상기 시스템은
세포내 번역을 가능하게 하는 구조가 있는 DNA dependent RNA Polymerase(DdRp) mRNA를 포함하는 RNA(DdRp RNA) 발현 카세트; 및
상기 DdRp에 의해 전사될 수 있는 유전체 편집 도구를 코딩하는 DNA(DNAge) 발현 카세트;를 포함하는 것을 특징으로 하는 유전체 편집 RNA/DNA 시스템.
A system having at least one endogenous genome editing and transcribeable component in a cell, the system comprising:
RNA (DdRp RNA) expression cassette comprising DNA dependent RNA Polymerase (DdRp) mRNA with a structure that enables intracellular translation; and
A genome editing RNA/DNA system comprising a; DNA (DNAge) expression cassette encoding a genome editing tool that can be transcribed by the DdRp.
제1항에 있어서, 상기 세포내 번역을 가능하게 하는 구조는
5'Cap 구조 또는 IRES(internal ribosome entry site) 서열을 포함하는 것을 특징으로 하는 특징으로 하는 유전체 편집 RNA/DNA 시스템.
The structure of claim 1 , wherein the structure enabling intracellular translation is
5'Cap structure or IRES (internal ribosome entry site) sequence, characterized in that it comprises a genome editing RNA / DNA system.
제1항 내지 제2항에 있어서, 상기 세포는 원핵생물 세포, 식물 세포, 진핵생물 세포, 포유동물 세포 및 인간 세포를 포함하는 군에서 선택되어지는 어느 1종을 특징으로 하는 유전체 편집 RNA/DNA 시스템.The genome editing RNA/DNA according to claim 1 or 2, wherein the cell is any one selected from the group consisting of prokaryotic cells, plant cells, eukaryotic cells, mammalian cells and human cells. system. 제1항 내지 제3항에 있어서, 상기 DdRp RNA 발현 카세트는
(1) 5'UTR;
(2) 상기 DdRp를 코딩하는 RNA; 및
(3) 3'UTR;를 포함하는 RNA를 특징으로 하는 유전체 편집 RNA/DNA 시스템.
The method according to claim 1 to 3, wherein the DdRp RNA expression cassette is
(1) 5'UTR;
(2) RNA encoding the DdRp; and
(3) 3'UTR; genome editing RNA/DNA system characterized in that it comprises an RNA.
제1항 내지 제4항에 있어서, 상기 DdRp RNA 발현 카세트는
화학적 변형된 뉴클레오타이드(CM)를 포함하는 것을 특징으로 하는 유전체 편집 RNA/DNA 시스템.
5. The method of claim 1 to 4, wherein the DdRp RNA expression cassette is
A genome editing RNA/DNA system comprising chemically modified nucleotides (CM).
제5항에 있어서, 상기 화학적 변형된 뉴클레오타이드(CM)는
당 변형, 염기 변형, 백본 변형 및 지질 변형을 포함하는 군에서 선택되어진 어느 하나 이상을 포함하는 것을 특징으로 하는 발현 RNA/DNA 시스템.
According to claim 5, wherein the chemically modified nucleotide (CM) is
An expression RNA/DNA system comprising any one or more selected from the group comprising sugar modifications, base modifications, backbone modifications, and lipid modifications.
제1항 내지 제6항에 있어서, 상기 RNA/DNA 시스템은 상기 DdRp mRNA의 자가전사를 위해서,
추가적으로 DdRp가 결합하는 프로모터와 DdRp를 코딩하는 DNA를 포함하는 auto_DdRp 발현 카세트;를 포함하고, 이들이 작동 가능하게 연결되어 구성되는 것을 특징으로 하는 유전체 편집 RNA/DNA 시스템.
According to claim 1 to 6, wherein the RNA / DNA system for self-transcription of the DdRp mRNA,
In addition, a promoter to which DdRp binds and an auto_DdRp expression cassette comprising a DNA encoding DdRp; and a genome editing RNA/DNA system, characterized in that it is configured to be operably linked.
제6항에 있어서, 상기 auto_DdRp 발현 카세트는
(1) DdRp가 결합하는 프로모터;
(2) 5' UTR;
(3) 상기 DdRp를 코딩하는 DNA 절편; 및
(4) 3'UTR;를 포함하는 DNA를 특징으로 하는 유전체 편집 RNA/DNA 시스템.
The method of claim 6, wherein the auto_DdRp expression cassette is
(1) a promoter to which DdRp binds;
(2) 5'UTRs;
(3) a DNA fragment encoding the DdRp; and
(4) 3'UTR; genome editing RNA/DNA system comprising DNA.
제1항에 있어서, 상기 DNAge 발현 카세트는
표적화 엔도뉴클레아제를 코딩하는 DNA를 포함하는 DNAen 발현 카세트; 및
선택된 유전체의 특정 표적화 염기서열에 관련된 RNA, sgRNA를 코딩하는 DNA를 포함하는 DNAsg 발현 카세트;를 포함하는 것을 특징으로 하는 유전체 편집 RNA/DNA 시스템.
The method of claim 1, wherein the DNAge expression cassette is
a DNAen expression cassette comprising DNA encoding a targeting endonuclease; and
A genome editing RNA/DNA system comprising a; RNA related to a specific targeting nucleotide sequence of a selected genome, and a DNAsg expression cassette comprising DNA encoding sgRNA.
제9항에 있어서, 상기 DNAen 발현 카세트는
(1) DdRp가 결합하는 프로모터;
(2) 5'UTR;
(3) 표적화 엔도뉴클레아제를 코딩하는 DNA; 및
(4) 3'UTR;를 포함하는 DNA를 특징으로 하는 유전체 편집 RNA/DNA 시스템.
10. The method of claim 9, wherein the DNAen expression cassette is
(1) a promoter to which DdRp binds;
(2) 5'UTR;
(3) DNA encoding the targeting endonuclease; and
(4) 3'UTR; genome editing RNA/DNA system comprising DNA.
제9항 내지 제10항에 있어서, 상기 표적화 엔도뉴클레아제는
메가뉴클레아제(meganuclease);
징크-핑거 뉴클레아제(zinc-finger nucleases, ZFNs) ;
TAL-이펙터 뉴클레아제(TAL-effector nucleases, TALENs);
RNA-guided 엔도뉴클레아제;
DNA-guided 엔도뉴클레아제; 및
Moloney Murine Leukemia Virus (M-MLV) 역전사 효소 및 Cas9 H840A nickase의 융합 단백질;를 포함하는 군에서 선택되어진 1종 이상을 특징으로 하는 유전체 편집 RNA/DNA 시스템.
11. The method of claim 9 to 10, wherein the targeting endonuclease is
meganuclease;
zinc-finger nucleases (ZFNs);
TAL-effector nucleases (TALENs);
RNA-guided endonuclease;
DNA-guided endonuclease; and
Moloney Murine Leukemia Virus (M-MLV) a fusion protein of reverse transcriptase and Cas9 H840A nickase; a genome editing RNA/DNA system characterized by at least one selected from the group comprising.
제11항에 있어서, 상기 RNA-guided 엔도뉴클레아제는
유형 II Cas9 또는 유형 V Cas12a (Cpf1)와 같은 단일 성분 클래스 2 CRISPR 시스템; 및
다중 단백질형 Cas3와 같은 다중 성분 클래스 1 CRISPR 시스템;을 포함하는 군에서 선택되어진 어느 1종을 특징으로 하는 유전체 편집 RNA/DNA 시스템.
12. The method of claim 11, wherein the RNA-guided endonuclease is
single component class 2 CRISPR systems such as type II Cas9 or type V Cas12a (Cpf1); and
A genome editing RNA/DNA system characterized by any one selected from the group comprising; a multi-component class 1 CRISPR system such as a multiprotein type Cas3.
제11항에 있어서, 상기 DNA-guided 엔도뉴클레아제는
알고너트(Argonaute)를 포함하는 것을 특징으로 하는 유전체 편집 시스템.
12. The method of claim 11, wherein the DNA-guided endonuclease is
A genome editing system comprising an Argonaute.
제9항에 있어서, 상기 DNAsg 발현 카세트는
(1) DdRp가 결합하는 프로모터 및 RNA Polymerase III가 결합하는 프로모터로 이루어진 군에서 선택되어진 어느 하나;
(2) 가이드 핵산을 코딩하는 DNA 절편; 및
(4) 3'UTR;을 포함하는 DNA를 특징으로 하는 유전체 편집 RNA/DNA 시스템.
10. The method of claim 9, wherein the DNAsg expression cassette is
(1) any one selected from the group consisting of a promoter to which DdRp binds and a promoter to which RNA Polymerase III binds;
(2) a DNA fragment encoding a guide nucleic acid; and
(4) 3'UTR; A genome editing RNA/DNA system comprising a DNA comprising:
제14항에 있어서, 상기 RNA Polymerase III(pol III)가 결합하는 프로모터(RNA polymerase III promoters)는
U6 프로모터, tRNA 프로모터 및 H1 프로모터로 이루어진 군에서 선택되어진 어느 하나를 특징으로 하는 유전체 편집 RNA/DNA 시스템 .
15. The method of claim 14, wherein the RNA Polymerase III (pol III) is bound promoter (RNA polymerase III promoters)
A genome editing RNA/DNA system characterized by any one selected from the group consisting of U6 promoter, tRNA promoter and H1 promoter.
제14항에 있어서, 상기 가이드 핵산을 코딩하는 DNA 절편은
하나 이상의 가이드 핵산을 포함하는 것을 특징으로 하는 유전체 편집 RNA/DNA 시스템.
15. The method of claim 14, wherein the DNA fragment encoding the guide nucleic acid is
A genome editing RNA/DNA system comprising one or more guide nucleic acids.
제1항 내지 제16항에 있어서, 상기 DNAen 발현 카세트 및 DNAsg 발현 카세트는
한 개의 플라스미드 이상에 있는 것을 특징으로 하는 유전체 편집 RNA/DNA 시스템.
17. The method of claim 1 to 16, wherein the DNAen expression cassette and the DNAsg expression cassette are
A genome editing RNA/DNA system, characterized in that it resides on more than one plasmid.
제1항 내지 제17항에 있어서, 상기 DNAge 발현 카세트에
선택된 유전체의 특정 표적화 염기서열에 관련된 가이드핵산이 없는 경우, 외부에서 인공적으로 합성된 선택된 유전체의 특정 표적화 염기서열에 관련된 가이드 핵산을 세포내로 주입될 수 있거나,
또는 외부에서 인공적으로 합성된 선택된 유전체의 특정 표적화 염기서열에 관련된 DNAge를 세포내로 주입하는 것을 특징으로 하는 유전체 편집 RNA/DNA 시스템.
18. The method of claim 1 to 17, wherein the DNAge expression cassette
If there is no guide nucleic acid related to the specific targeting nucleotide sequence of the selected genome, the guide nucleic acid related to the specific targeting nucleotide sequence of the selected genome artificially synthesized from the outside may be injected into the cell, or
Or a genome editing RNA/DNA system characterized in that the DNAge related to the specific targeting nucleotide sequence of the selected genome artificially synthesized from the outside is injected into the cell.
제1항에 있어서, 세포 내 적어도 하나의 내인성 유전체 서열을 편집하는 시스템으로서, 상기 시스템은
anti-CRISPR 단백질 및 화합물에 의해 조절하는 것을 특징으로 하는 유전체 편집 RNA/DNA 시스템.
The system of claim 1 , wherein the system edits at least one endogenous genomic sequence in a cell, the system comprising:
A genome editing RNA/DNA system, characterized in that it is regulated by anti-CRISPR proteins and compounds.
제19항에 있어서, 상기 anti-CRISPR 단백질은
AcrIF1, AcrIIA4, AcrIE1 및 AcrIIC1를 포함하는 군에서 선택되어진 어느 1종 이상을 특징으로 하는 유전체 편집 RNA/DNA 시스템.
20. The method of claim 19, wherein the anti-CRISPR protein is
A genome editing RNA/DNA system characterized by any one or more selected from the group comprising AcrIF1, AcrIIA4, AcrIE1 and AcrIIC1.
제1항 내지 제20항에 있어서, 상기 DNAen 발현 카세트 및 상기 DNAsg 발현 카세트 및 상기 auto_DdRp 발현 카세트는
동일한 한 개의 플라스미드 이상에 있는 것을 특징으로 하는 유전체 편집 RNA/DNA 시스템 및 이의 조성물.
21. The method of claim 1 to 20, wherein the DNAen expression cassette and the DNAsg expression cassette and the auto_DdRp expression cassette are
A genome editing RNA/DNA system and a composition thereof, characterized in that it is on the same one or more plasmids.
제1항 내지 제21항에 있어서, 상기 DdRp RNA 발현 카세트, 상기 auto_DdRp 발현 카세트, 상기 DNAen 발현 카세트 및 상기 DNAsg 발현 카세트는
전자는 폴리(A) 꼬리 또는 폴리(T) 꼬리를 포함하는 것을 특징으로 하는 유전체 편집 RNA/DNA 시스템.
22. The method according to claim 1 to 21, wherein the DdRp RNA expression cassette, the auto_DdRp expression cassette, the DNAen expression cassette and the DNAsg expression cassette are
The former comprises a poly(A) tail or a poly(T) tail.
제1항 내지 제22항에 있어서, 상기 DdRp RNA 발현 카세트, 상기 auto_DdRp 발현 카세트, 상기 DNAen 발현 카세트 및 상기 DNAsg 발현 카세트는
G/C 함량, 코돈 최적화(optimization), UTR 변형, 30개 초과의 아데노신 뉴클레오타이드를 갖는 폴리(A) 꼬리, 폴리(C) 서열, m7GpppN을 제외한 5'캡(CAP) 구조 및 히스톤-스템-루프 서열로 이루어진 염기서열 변형(SM)으로부터 선택된 적어도 하나 이상을 포함하는 것을 특징으로 하는 유전체 편집 RNA/DNA 시스템.
23. The method of claim 1-22, wherein the DdRp RNA expression cassette, the auto_DdRp expression cassette, the DNAen expression cassette and the DNAsg expression cassette are
G/C content, codon optimization, UTR modification, poly(A) tail with more than 30 adenosine nucleotides, poly(C) sequence, 5' cap (CAP) structure except m7GpppN and histone-stem-loop A genome editing RNA/DNA system comprising at least one selected from nucleotide sequence modification (SM) consisting of a sequence.
제1항 내지 제23항에 있어서, 상기 DdRp RNA 발현 카세트, 상기 auto_DdRp 발현 카세트, 상기 DNAen 발현 카세트 및 상기 DNAsg 발현 카세트는
선형의 핵산 단편, 환형의 플라스미드, 렌티 바이러스, 아데노 관련 바이러스 및 리보 핵 단백질 (RNP) 복합체를 포함한 다양한 형태 또는 이들의 조합을 포함하는 군에서 선택되어진 어느 하나를 특징으로 하는 유전체 편집 RNA/DNA 시스템.
24. The method according to claim 1 to 23, wherein the DdRp RNA expression cassette, the auto_DdRp expression cassette, the DNAen expression cassette and the DNAsg expression cassette are
A genome editing RNA/DNA system characterized by any one selected from the group comprising various types or combinations thereof, including linear nucleic acid fragments, circular plasmids, lentiviruses, adeno-associated viruses and ribonucleoprotein (RNP) complexes .
제1항 내지 제24항에 있어서,
상기 RNA/DNA 시스템을 전달하여 세포질에서 상기 유전체 편집 도구가 장기간 지속적으로 발현하는 것을 특징으로 하는 유전체 편집 RNA/DNA 시스템.
25. The method of any one of claims 1-24,
A genome editing RNA/DNA system, characterized in that by delivering the RNA/DNA system, the genome editing tool continuously expresses for a long time in the cytoplasm.
(a) 상기 DdRp RNA 발현 카세트를 제조하는 단계;
(b) 상기 DNAge 발현 카세트 또는 auto_(DdRp/DNAge) 발현 카세트를 제조하는 단계; 및
(c) 상기 제조된 DdRp RNA 발현 카세트 및 DNAge 발현 카세트 또는 auto_(DdRp/DNAge) 발현 카세트를 포함하는 RNA/DNA 시스템을 형질주입하는 단계;를 포함하며,
여기서 추가적으로 auto_DdRp 발현 카세트를 제조하고 공동으로 형질주입하는 것을 특징으로 하는 유전체 편집 RNA/DNA 시스템.
(a) preparing the DdRp RNA expression cassette;
(b) preparing the DNAge expression cassette or auto_(DdRp/DNAge) expression cassette; and
(c) transfecting the RNA/DNA system comprising the prepared DdRp RNA expression cassette and DNAge expression cassette or auto_(DdRp/DNAge) expression cassette;
Here, the genome editing RNA/DNA system, characterized in that the auto_DdRp expression cassette is additionally prepared and co-transfected.
제1항 내지 제26항에 있어서, 자가전사할 수 있는 유전체 편집 RNA/DNA 시스템은
상기 DdRp RNA 발현 카세트 및 DNAge 발현 카세트를 포함하는 발현 시스템;
상기 DdRp RNA 발현 카세트, auto_DdRp 발현 카세트및 DNAge 발현 카세트를 포함하는 발현시스템; 그리고
상기 DdRp RNA 발현 카세트 및 auto_(DdRp/DNAge) 발현 카세트를 포함하는 발현 시스템;을 포함하는 군에서 선택되어진 어느 하나를 포함하는 유전체 편집 RNA/DNA 시스템 키트
27. The genome editing RNA/DNA system of any one of claims 1-26, wherein the self-transcribeable genome editing RNA/DNA system is
an expression system comprising the DdRp RNA expression cassette and a DNAge expression cassette;
an expression system comprising the DdRp RNA expression cassette, an auto_DdRp expression cassette, and a DNAge expression cassette; and
A genome editing RNA/DNA system kit comprising any one selected from the group comprising; an expression system comprising the DdRp RNA expression cassette and an auto_(DdRp/DNAge) expression cassette
제1항 내지 제27항에 있어서, 자가전사할 수 있는 유전체 편집 RNA/DNA 시스템이 형질도입된 세포, 조직 또는 개체. 28. The cell, tissue or subject according to any one of claims 1 to 27 transduced with a genome editing RNA/DNA system capable of self-transcription. 제1항 내지 제28항에 있어서, 상기 DdRp는
T7 RNA 폴리머라제(polymerase), T3 RNA 폴리머라제 및 SP6 폴리머라제를 포함하는 군에서 선택되어진 어느 하나; 또는
적어도 하나의 DdRp의 촉매 도메인을 포함하는 키메라 효소를 포함하는 것을 특징으로 하는 자가전사 RNA/DNA 시스템.
29. The method of any one of claims 1-28, wherein DdRp is
any one selected from the group comprising T7 RNA polymerase, T3 RNA polymerase and SP6 polymerase; or
A self-transcribed RNA/DNA system comprising a chimeric enzyme comprising at least one catalytic domain of DdRp.
제29항에 있어서, 상기 키메라 효소는
적어도 하나의 RNA 트리포스파타제의 촉매 도메인,
적어도 하나의 구아닐릴트랜스퍼라제의 촉매 도메인,
적어도 하나의 N7-구아닌 메틸트랜스퍼라제의 촉매 도메인 및
적어도 하나의 DdRp의 촉매 도메인을 포함하는 키메라 효소를 특징으로 하는 자가전사 RNA/DNA 시스템.
30. The method of claim 29, wherein the chimeric enzyme is
at least one catalytic domain of RNA triphosphatase,
at least one catalytic domain of guanylyltransferase,
at least one N 7 -guanine methyltransferase catalytic domain and
A self-transcripting RNA/DNA system comprising a chimeric enzyme comprising at least one catalytic domain of a DdRp.
제29항 내지 제30항에 있어서, 상기 키메라 효소는
RNA 트리포스파타제의 촉매 도메인, 구아닐릴트랜스퍼라제의 촉매도메인, N7-구아닌 메틸트랜스퍼라제의 촉매 도메인 및 DdRp의 촉매 도메인으로 이루어진 그룹으로부터 선택된 적어도 2개의 상기 촉매 도메인이 연결 펩티드에 의해 결합되어 있는 것을 특징으로 하는 자가전사 RNA/DNA 시스템.
31. The method of claim 29-30, wherein the chimeric enzyme is
At least two catalytic domains selected from the group consisting of the catalytic domain of RNA triphosphatase, the catalytic domain of guanylyltransferase, the catalytic domain of N 7 -guanine methyltransferase and the catalytic domain of DdRp are linked by a linking peptide. Self-transcription RNA / DNA system, characterized in that.
제1항 내지 제31항에 있어서, 상기 DNAi 발현 카세트는 상기 DNAi 발현 카세트의 DNA 일부를 전사체로 하여 합성되는 mRNA에 5’Cap 구조를 부가할 수 있는 효소 또는 촉매 도메인을 지시하는 DNA를 포함하는 것을 특징으로 하는 자가전사 RNA/DNA 시스템.

32. The method according to claim 1 to 31, wherein the DNAi expression cassette comprises a DNA indicative of an enzyme or catalytic domain capable of adding a 5'Cap structure to mRNA synthesized using a portion of the DNA of the DNAi expression cassette as a transcript. Self-transcription RNA / DNA system, characterized in that.

KR1020210077561A 2020-08-06 2021-06-15 Self-transcribing RNA/DNA system that provides Genome editing in the cytoplasm KR20220018410A (en)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
KR20200098264 2020-08-06
KR1020200098264 2020-08-06
KR20200139009 2020-10-26
KR1020200139009 2020-10-26
KR20200169225 2020-12-07
KR1020200169225 2020-12-07

Publications (1)

Publication Number Publication Date
KR20220018410A true KR20220018410A (en) 2022-02-15

Family

ID=80325479

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210077561A KR20220018410A (en) 2020-08-06 2021-06-15 Self-transcribing RNA/DNA system that provides Genome editing in the cytoplasm

Country Status (1)

Country Link
KR (1) KR20220018410A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114592042A (en) * 2022-04-21 2022-06-07 之江实验室 Micro RNA detection method and kit

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114592042A (en) * 2022-04-21 2022-06-07 之江实验室 Micro RNA detection method and kit

Similar Documents

Publication Publication Date Title
US10927383B2 (en) Cas9 mRNAs
KR102587132B1 (en) Crispr-cpf1-related methods, compositions and components for cancer immunotherapy
AU2022271376A1 (en) CRISPR/CAS-related methods and compositions for treating herpes simplex virus
CN112399860A (en) Circular RNA for translation in eukaryotic cells
EP3443088A1 (en) Grna fusion molecules, gene editing systems, and methods of use thereof
CN113939591A (en) Methods and compositions for editing RNA
GB2617658A (en) Class II, type V CRISPR systems
EP3126495A1 (en) Crispr/cas-related methods and compositions for treating primary open angle glaucoma
CN113661242A (en) Compositions comprising modified cyclic polyribonucleotides and uses thereof
KR20220123398A (en) Synthetic guide RNA, composition, method and use thereof
KR20210096088A (en) Composition and method for transgene delivery
JP2022513376A (en) Genome editing by directional non-homologous DNA insertion using retrovirus integrase-Cas9 fusion protein
US20230279373A1 (en) Novel crispr enzymes, methods, systems and uses thereof
KR20220018410A (en) Self-transcribing RNA/DNA system that provides Genome editing in the cytoplasm
US20240167008A1 (en) Novel crispr enzymes, methods, systems and uses thereof
CA3219187A1 (en) Class ii, type v crispr systems
KR20220067468A (en) Self-transcribing RNA/DNA system that provides expression-repressing RNA in the cytoplasm
KR20230127070A (en) Self-transcribing RNA/DNA system that provides expression-repressing RNA in the cytoplasm
US20230405116A1 (en) Vectors, systems and methods for eukaryotic gene editing
EP4219723A1 (en) Circular rna platforms, uses thereof, and their manufacturing processes from engineered dna
KR20220055399A (en) Self-transcribing RNA/DNA system that provides mRNAs in the cytoplasm
KR20230127069A (en) Self-transcribing RNA/DNA system that provides mRNAs in the cytoplasm
KR20230016751A (en) Nucleobase editor and its use
KR20230028860A (en) Self-transcribing RNA/DNA system that provides cDdRp mRNAs in the cytoplasm
JP2024515715A (en) Methods for genome editing and therapy by directed heterologous DNA insertion using retroviral integrase-Cas fusion proteins

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E601 Decision to refuse application