KR20200135225A - 단일염기 치환 단백질 및 이를 포함하는 조성물 - Google Patents

단일염기 치환 단백질 및 이를 포함하는 조성물 Download PDF

Info

Publication number
KR20200135225A
KR20200135225A KR1020200061678A KR20200061678A KR20200135225A KR 20200135225 A KR20200135225 A KR 20200135225A KR 1020200061678 A KR1020200061678 A KR 1020200061678A KR 20200061678 A KR20200061678 A KR 20200061678A KR 20200135225 A KR20200135225 A KR 20200135225A
Authority
KR
South Korea
Prior art keywords
nucleic acid
single base
protein
substitution
dna
Prior art date
Application number
KR1020200061678A
Other languages
English (en)
Inventor
배승민
김영훈
이정준
Original Assignee
주식회사 툴젠
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 툴젠 filed Critical 주식회사 툴젠
Publication of KR20200135225A publication Critical patent/KR20200135225A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4702Regulators; Modulating activity
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4702Regulators; Modulating activity
    • C07K14/4705Regulators; Modulating activity stimulating, promoting or activating activity
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/71Receptors; Cell surface antigens; Cell surface determinants for growth factors; for growth regulators
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2497Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing N- glycosyl compounds (3.2.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/02Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2) hydrolysing N-glycosyl compounds (3.2.2)
    • C12Y302/0202DNA-3-methyladenine glycosylase I (3.2.2.20), i.e. adenine DNA glycosylase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/02Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2) hydrolysing N-glycosyl compounds (3.2.2)
    • C12Y302/02027Uracil-DNA glycosylase (3.2.2.27)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04004Adenosine deaminase (3.5.4.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04005Cytidine deaminase (3.5.4.5)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/60Immunoglobulins specific features characterized by non-natural combinations of immunoglobulin fragments
    • C07K2317/62Immunoglobulins specific features characterized by non-natural combinations of immunoglobulin fragments comprising only variable region components
    • C07K2317/622Single chain antibody (scFv)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/09Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/30Non-immunoglobulin-derived peptide or protein having an immunoglobulin constant or Fc region, or a fragment thereof, attached thereto
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/60Fusion polypeptide containing spectroscopic/fluorescent detection, e.g. green fluorescent protein [GFP]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Plant Pathology (AREA)
  • Immunology (AREA)
  • Cell Biology (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Analytical Chemistry (AREA)
  • Mycology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Seasonings (AREA)
  • General Preparation And Processing Of Foods (AREA)

Abstract

본 출원은 단일염기 치환 단백질을 이용하여 타겟 영역내 염기를 임의의 염기로 치환하는 기술 및 이의 이용에 대한 것이다.

Description

단일염기 치환 단백질 및 이를 포함하는 조성물{SINGLE BASE EDITING PROTEINS AND COMPOSITION COMPRISING THE SAME}
본 출원은 CRISPR 효소, 디아미네이즈 및 DNA 글리코실레이즈를 이용한 단일염기 치환 단백질을 이용하여 시토신(C)이나 아데닌(A)을 임의의 염기로 치환하는 기술에 대한 것이다.
CRISPR 효소가 연결된 디아미나아제(CRISPR enzyme-linked deaminase)는 점 돌연변이가 일어난 유전자 부위를 교정하여 유전적 장애를 치료하거나, 인간 또는 진핵 세포의 유전자 내 목적하는 단일 뉴클레오타이드 변이(SNP)를 유도하는데 이용되어왔다.
현재 보고된 CRISPR 효소가 연결된 디아미나아제는
1) (i) S. pyogenes에서 유래된 촉매적으로 결핍된 Cas9 (catalytically-deficient Cas9; dCas9) 또는 D10A Cas9니케이즈 (nCas9)와, (ii) 래트의 시티딘 디아미나아제인 rAPOBEC1를 포함하는 베이스 에디터 (Base Editors; BEs);
2) (i) dCas9 또는 nCas9와 (ii) 바다칠성장어(sea lamprey)의 activation-induced cytidine deaminase (AID) ortholog인 PmCDA1 또는 인간 AID를 포함하는 Target-AID;
3) MS2-결합 단백질에 융합된 과활성화된 AID 변이체를 모집하기 위해 MS2 RNA 헤어핀에 연결된 sgRNAs와 dCas9를 포함하는 CRISPR-X; 및
4) 징크-핑거 단백질 또는 transcription activator-like effectors (TALEs)가 시티딘 디아미나제에 융합된 것이 있다.
종래의 DNA 글리코실레이즈와 함께 이용된 CRISPR 효소가 연결된 디아미나아제는 뉴클레오타이드 내 시토신(C)을 티민(T)로만, 또는 아데닌(A)을 구아닌(G)으로만 치환시킬 수 있다. 일 예로, Cas9, 시티딘 디아미네이즈, 및 우라실 DNA 글리코실레이즈 억제제(Uracil DNA glycosylase inhibitor(UGI))가 융합된 물질은, 시토신(C)을 티민(T)으로 치환하는데 이용된다. 이는 우라실(U)이 DNA 글리코실레이즈에 의해 우라실이 제거되지 못하도록 유도하는 기작을 이용하여 티민(T)으로 치환되도록 한다. 이와 같은 궤에서, 최근 시티딘 디아니메이즈 대신 아데노신 디아미네이즈(또는 아데노신 디아미네이즈)를 이용하면 아데닌(A)를 구아닌(G)으로만 치환시킬 수 있음이 보고되었다.
이에 본 출원의 발명자는 CRISPR 효소, 디아미네이즈 및 DNA 글리코실레이즈를 이용한 단일염기 치환 단백질을 개발하여 시토신(C)이나 아데닌(A)을 임의의 염기로 치환하고자 한다. 이러한 기술의 개발은 돌연변이에 의한 유전자 질병 규명, SNP에 의한 질병 감수성에 영향을 주거나, 약물에 대한 내성을 가지는 핵산서열을 분석하여 약물 개발 및 치료제 등에 이용될 수 있으며, 이는 향후 약물 개발 및 치료 효과를 향상시키는데 더욱 유용할 것이다.
종래의 CRISPR 효소가 연결된 디아미네이즈는 시토신(C)이나 아데닌(A)을 특정 염기(A 또는 G)로만 변경 가능하다는 한계를 가지고 있다. 이러한 한계로 인하여 돌연변이에 의한 유전자 질병 규명, SNP에 의한 질병 감수성, 관련 치료제 개발 등의 연구 범위가 제한된다.
따라서, 시토신(C)이나 아데닌(A)을 특정한 염기가 아닌, 임의의 염기(A, T, C, G, U)로 치환할 수있는 수단의 개발이 절실히 요구된다.
본 출원을 통하여 단일염기 치환 단백질 또는 단일염기 치환 복합체, 또는 이를 포함하는 단일염기 치환 조성물 및 이의 용도를 제공하고자 한다.
본 출원을 통하여 상기 단일염기 치환 단백질을 암호화하는 핵산 서열 또는 이를 포함하는 벡터를 제공하고자 한다.
본 출원을 통하여 단일염기 치환 방법을 제공하고자 한다.
본 출원을 통하여 상기 단일염기 치환 단백질 또는 상기 단일염기 치환 복합체, 또는 이를 포함하는 단일염기 치환 조성물의 다양한 용도를 제공하고자 한다.
본 출원을 통하여 단일염기 치환 융합단백질 또는 이를 암호화하는 핵산을 제공한다.
본 출원을 통하여 단일염기 치환 융합단백질을 암호화하는 핵산을 포함하는 벡터를 제공한다.
본 출원을 통하여 단일염기 치환 복합체를 제공한다.
본 출원을 통하여 단일염기 치환 조성물을 제공한다.
본 출원을 통하여 단일염기 치환 방법을 제공한다.
본 출원에서 제공하는 단일염기 치환 융합단백질, 단일염기 치환 복합체, 또는 단일염기 치환 조성물을 이용하여 에피토프 스크리닝, 약물 내성 유전자 또는 단백질 스크리닝, 약물감작 스크리닝, 또는 바이러스 내성 유전자 또는 단백질 스크리닝 용도를 제공한다.
본 출원을 통하여 단일염기 치환 융합단백질 또는 이를 암호화하는 핵산으로서, (a) CRISPR 효소 또는 이의 변이체, (b) 디아미네이즈(deaminase), 및 (c) DNA 글리코실레이즈(DNA glycosylase) 또는 이의 변이체를 포함하고, 이 때, 상기 단일염기 치환 융합단백질은 타겟 핵산서열 내 하나 이상의 뉴클레오타이드에 포함된 시토신 또는 아데닌을 임의의 염기로의 치환을 유도하는, 단일염기 치환 융합단백질 또는 이를 암호화하는 핵산을 제공한다.
본 출원을 통하여 (i) N말단-[CRISPR 효소]-[디아미네이즈]-[DNA 글리코실레이즈]-C말단; (ii) N말단-[CRISPR 효소]-[DNA 글리코실레이즈]-[디아미네이즈]-C말단; (iii) N말단-[디아미네이즈]-[CRISPR 효소]-[DNA 글리코실레이즈]-C말단; (iv) N말단-[디아미네이즈]-[DNA 글리코실레이즈]-[CRISPR 효소]-C말단; (v) N말단-[DNA 글리코실레이즈]-[CRISPR 효소]-[디아미네이즈]-C말단; 및 (vi) N말단-[DNA 글리코실레이즈]-[디아미네이즈]-[CRISPR 효소]-C말단 중 어느 하나의 구성을 가지는 것을 특징으로 하는, 단일염기 치환 융합단백질 또는 이를 암호화하는 핵산을 제공한다.
본 출원을 통하여 단일염기 치환 복합체로서, (a) CRISPR 효소 또는 이의 변이체; (b) 디아미네이즈(deaminase); (c) DNA 글리코실레이즈(DNA glycosylase); 및 (d) 2 이상의 결합도메인을 포함하고, 이 때, 상기 단일염기 치환 융합단백질은 타겟 핵산서열 내 하나 이상의 뉴클레오타이드에 포함된 시토신 또는 아데닌을 임의의 염기로의 치환을 유도하는, 단일염기 치환 복합체를 제공한다.
본 출원을 통하여 상기 CRISPR 효소, 상기 디아미네이즈, 및 상기 DNA 글리코실레이즈는 각각 하나 이상의 결합도메인에 연결되고, 이 때, 상기 CRISPR 효소, 디아미네이즈, 및 상기 DNA 글리코실레이즈는 상기 결합도메인들 간의 상호작용을 통해서 복합체를 형성함을 특징으로 하는, 단일염기 치환 복합체를 제공한다.
본 출원을 통하여 상기 CRISPR 효소, 상기 디아미네이즈, 및 상기 DNA 글리코실레이즈 중 어느 하나(one)는 제1 결합도메인 및 제2 결합도메인에 연결되고, 이 때, 상기 제1 결합도메인 및 다른 구성(another)의 결합도메인은 상호작용을 하는 페어이고, 및 상기 제2 결합도메인 및 나머지 구성(the other)의 결합도메인은 상호작용을 하는 페어이며, 이 때, 상기 페어들에 의하여 복합체를 형성함을 특징으로 하는, 단일염기 치환 복합체를 제공한다.
본 출원을 통하여 (i) 상기 CRISPR 효소, 상기 디아미네이즈, 및 상기 DNA 글리코실레이즈 중 선택된 두 개의 구성과 제1 결합도메인을 포함하는 제1 융합단백질, 및 (ii) 상기 선택되지 않은 나머지 하나의 구성과 제2 결합도메인을 포함하는 제2 융합단백질을 포함하고, 이 때, 제1 결합도메인 및 제2 결합도메인은 상호작용하는 페어이며, 이 때, 상기 페어에 의하여 복합체를 형성함,을 특징으로 하는, 단일염기 치환 복합체를 제공한다.
본 출원을 통하여 (i) 상기 디아미네이즈, 상기 DNA 글리코실레이즈 및 제1 결합도메인을 포함하는 제1 융합단백질, 및 (ii) CRISPR 효소 및 제2 결합도메인을 포함하는 제2 융합단백질을 포함함을 특징으로 하는, 단일염기 치환 복합체를 제공한다.
이 때, 상기 제1 결합도메인은 single chain variable fragment (scFv)이고, 상기 제2 융합단백질은 적어도 하나 이상의 결합도메인을 더 포함하고, 이 때, 상기 더 포함되는 결합도메인은 GCN4 peptide임 -; 이 때, 2개 이상의 제1 융합단백질은 상기 GCN4 peptide 중 어느 하나와 각각 상호작용을 통해서 복합체를 형성함을 특징으로 하는, 단일염기 치환 복합체를 제공할 수 있다.
본 출원을 통하여 단일염기 치환 조성물로서, (a) 가이드 RNA 또는 이를 암호화하는 핵산, 및 (b) i) 제1 항의 단일염기 치환 융합단백질 또는 이를 암호화하는 핵산, 또는 ii) 제13 항의 단일염기 치환 복합체, - 이 때, 상기 가이드 RNA는 타겟 핵산서열 과 상보적으로 결합하고, 이 때, 상기 가이드 RNA와 결합되는 타겟 핵산서열은 15 내지 25bp이고, 이 때, 상기 단일염기 치환 융합단백질 또는 상기 단일염기 치환 복합체는 상기 타겟 핵산서열을 포함하는 타겟 영역(region) 내에 존재하는 하나 이상의 시토신 또는 아데닌의 임의의 염기로의 치환을 유도함 -;을 포함하는, 단일염기 치환 조성물을 제공할 수 있다.
본 출원을 통하여 1 이상의 벡터를 포함하는 것을 특징으로 하는 단일염기 치환 조성물을 제공할 수 있다.
본 출원을 통하여 단일염기 치환 방법으로서, in vitro 또는 ex vivo 상에서 타겟 핵산서열을 포함하는 타겟 영역(region)에 (i) 및 (ii)를 접촉함, (i) 가이드 RNA, 및 (ii) 상기 제1 항 단일염기 치환 융합단백질, 또는 상기 제12 항의 단일염기 치환 복합체, -이 때, 상기 가이드 RNA는 타겟 핵산서열에 상보적으로 결합하고, 이 때, 상기 가이드 RNA와 결합되는 타겟 핵산서열은 15 내지 25bp이고, 이 때, 상기 단일염기 치환 융합단백질 또는 상기 단일염기 치환 복합체는 상기 타겟 핵산서열을 포함하는 타겟 영역(region) 내에 존재하는 하나 이상의 시토신 또는 아데닌의 임의의 염기로의 치환을 유도함 -; 을 포함하는, 단일염기 치환 방법을 제공할 수 있다.
이 때, 상기 디아미네이즈는 시티딘 디아미네이즈(cytidine deaminase)이고, 및 상기 DNA 글리코실레이즈는 우라실-DNA 글리코실레이즈(Uracil-DNA glycosylase) 또는 이의 변이체이고, 이 때, 상기 단일염기 치환 융합단백질은 타겟 핵산서열 내 하나 이상의 뉴클레오타이드에 포함된 시토신을 임의의 염기로의 치환을 유도하는, 단일염기 치환 융합단백질 또는 이를 암호화하는 핵산을 제공할 수 있다.
이 때, 상기 시티딘 디아미네이즈는 APOBEC, AID(activation-induced cytidine deaminase) 또는 이의 변이체인 것을 특징으로 하는, 단일염기 치환 융합단백질 또는 이를 암호화하는 핵산을 제공할 수 있다.
이 때, 상기 디아미네이즈는 아데노신 디아미네이즈(adenosine deaminase)이고, 및 상기 DNA 글리코실레이즈는 알킬아데닌-DNA 글리코실레이즈(Alkyladenine DNA glycosylase) 또는 이의 변이체이고, 이 때, 상기 단일염기 치환 융합단백질은 타겟 핵산서열 내 하나 이상의 뉴클레오타이드에 포함된 아데닌을 임의의 염기로의 치환을 유도하는, 단일염기 치환 융합단백질 또는 이를 암호화하는 핵산을 제공할 수 있다.
이 때, 상기 아데노신 디아미네이즈는 TadA, Tad2p, ADA, ADA1, ADA2, ADAR2, ADAT2, ADAT3 또는 이의 변이체인 것을 특징으로 하는, 단일염기 치환 융합단백질 또는 이를 암호화하는 핵산을 제공할 수 있다.
이 때, 상기 결합도메인은 FRB domain, FKBP dimerization domain, 인테인(intein), ERT domains, VPR domain, GCN4 peptide, single chain variable fragment (scFv) 중 어느 하나, 또는 이량이질체(heterodimer)를 형성하는 도메인 중 어느 하나인 것을 특징으로 하는 것을 제공할 수 있다.
이 때, 상기 페어는 다음 (i) 내지 (vi) 중 선택되는 어느 하나인 것을 특징으로 하는 단일염기 치환 복합체 를 제공할 수 있다: (i) FRB 및 FKBP dimerization domains; (ii) 제1 인테인(intein) 및 제2 인테인; (iii) ERT 및 VPR domains; (iv)GCN4 peptide 및 single chain variable fragment (scFv); 또는 (v) 이량이질체(heterodimer)를 형성하는 제1 도메인 및 제2 도메인
본 출원은 단일염기 치환 단백질 및/또는 이를 암호화하는 핵산을 제공한다.
본 출원은 단일염기 치환형 단백질 및/또는 이를 암호화하는 핵산을 포함하는 단일염기 치환 조성물을 제공한다.
본 출원은 단일염기 치환 단백질 또는 이를 포함하는 단일염기 치환용 조성물의 다양한 용도를 제공한다.
도 1은 단일염기 치환 단백질에 의하여 타겟 핵산영역 내 C(시토신)이 N(A, T, G)로 치환되는 과정을 도식화하여 나타낸 그림이다.
도 2는 단일염기 치환 단백질에 의하여 타겟 핵산영역 내 A(아데닌)이 N(C, T, G)로 치환되는 과정을 도식화하여 나타낸 그림이다.
도 3은 시토신을 임의의 염기로의 치환을 유도하는 단일염기 치환 융합단백질의 다양한 설계 구조 예시를 보여주는 그림이다.
도 4는 아데닌을 임의의 염기로의 치환을 유도하는 단일염기 치환 융합단백질의 다양한 설계 구조 예시를 보여주는 그림이다.
도 5(a)는 카복신 말단에 10개의 동일한 GCN4 펩타이드를 융합시킨 nCas9을, 도 5(b) 및 도 5(c)는 각각 single chain variable fragement(scFv)가 Apobec와 UNG에 융합이 된 복합체 (scFv-Apobec-UNG, scfv-UNG-Apobec)의 다양한 설계 구조를 보여주는 그림이다.
도 6(a)는 N말단 및 C말단에 각각 5개의 동일한 GCN4 펩타이드를 융합시킨 nCas9, 하나의 scFv가 APOBEC에 융합되고, 다른 하나의 scFv가 UNG에 융합된 복합체 설계 구조를 보여주는 그림이다. 도 6(b)는 C말단에 각각 5개의 동일한 GCN4 펩타이드를 융합시킨 nCas9, 하나의 scFv가 APOBEC에 융합되고, 다른 하나의 scFv가 UNG에 융합된 복합체 설계 구조를 보여주는 그림이다.
도 7(a)는 BE3 WT 및 bpNLS BE3의 설계 구조를 나타낸 것이고, 도 7(b)는 HEK cell에서 BE3 WT 와 bpNLS BE3을 이용한 단일 염기 치환 효율을 보여주는 그래프이다.
도 8는 hela cell에서 BE3 WT, ncas-delta UGI, UNG-ncas 및 ncas-UNG을 이용한 C to G, C to T 또는 C to A 치환율(substitution rate)을 보여주는 그래프이다. ncas-delta UGI는 BE3 WT에서 UGI(uracil DNA-glycosylase inhibitor)을 제거한 단백질이다.
도 9은 타겟 영역 내 염기 치환이 유도되는 핵산서열(서열번호 1)을 나타낸 것이다. 그리고 hela cell 내에서 BE3 WT, bpNLS BE3, ncas-delta UGI, UNG-ncas 및 ncas-UNG를 이용한 상기 핵산서열(서열번호 1) 내 15번째에 위치한 시토신 및 16번째에 위치한 시토신의 염기 치환율(substitution rate)을 보여주는 그래프이다.
도 10은 HEK cell에서 GX20 sgRNA에 표적되는 hEMX1 타겟 핵산서열 내 치환이 일어나는 시토신을 확인한 그래프이다.
도 11은 HEK cell에서 UNG-ncas 및 ncas-UNG을 이용한 단일 염기 치환 효율을 보여주는 그래프이다. 좌측 도면은 GX20 sgRNA에 표적되는 hEMX1 타겟 핵산서열 내 C to N 치환율을 보여주는 그래프이다. 우측 도면은 GX20 sgRNA에 표적되는 hEMX1 타겟 핵산서열 내 13C, 15C, 16C, 17C에서의 C to G 또는 C to A 치환율(substitution rate)을 보여주는 그래프이다.
도 12는 Nureki nCas9이 HEK cell의 NG PAM에서 C to N 염기 치환이 일어나는지 여부를 확인한 그래프이다.
도 13은 도 5의 단일염기 치환 복합체를 이용하여 C to N 염기 치환이 일어나는지 여부를 확인한 그래프이다.
도 14는 도 5의 단일염기 치환 복합체를 이용하여 PC9 세포에서 hEMX1 GX19 sgRNA에 표적되는 핵산서열 내 치환이 일어나는 시토신을 확인한 그래프이다.
도 15는 도 5의 단일염기 치환 복합체를 이용하여 PC9 세포에서 hEMX1 sgRNA에 표적되는 서열 내 16C에서의 C to G, C to T 또는 C to A 치환율(substitution rate)을 보여주는 그래프이다.
도 16은 nCas9을 이용한 단일염기 치환 단백질을 암호화하는 플라스미드 설계 구조를 보여주는 그림이다. 상기 암호화되는 단일염기 치환 단백질은 도 3(a)의 1)에 도식화하였다.
도 17은 Nureki nCas9을 이용한 단일 염기 치환 CRISPR 단백질의 플라스미드 설계 구조를 보여주는 그림이다. 상기 암호화되는 단일염기 치환 단백질은 도 3(c)의 2)에 도식화하였다.
도 18은 nCas9을 이용한 단일염기 치환 단백질을 암호화하는 플라스미드 설계 구조를 보여주는 그림이다. 상기 암호화되는 단일염기 치환 단백질은 도 3(a)의 3)에 도식화하였다.
도 19는 도 4(a)에 도식화된 단일염기 치환 단백질을 암호화하는 플라스미드 설계 구조를 보여주는 그림이다.
도 20은 도 4(b)에 도식화된 단일염기 치환 단백질을 암호화하는 플라스미드 설계 구조를 보여주는 그림이다.
도 21은 single chain variable fragment (scFv)을 포함하는 융합 염기 치환 도메인의 구조를 도식화하여 나타낸 그림이다.
도 22 내지 도 24는 HEK cell에서 단일염기 치환 복합체를 이용한 단일 염기 치환 효율을 보여주는 그래프로, 도 22는 GX20 sgRNA에 표적되는 hEMX1 타겟 핵산서열(서열번호 1) 내 11C, 도23은 GX20 sgRNA에 표적되는 hEMX1 타겟 핵산서열(서열번호 1) 내 15C, 도 24는 GX20 sgRNA에 표적되는 hEMX1 타겟 핵산서열(서열번호 1) 내 16C에서의 C to G, C to A 또는 C to G 치환율(substitution rate)을 보여주는 그래프이다.
도 25는 과학 전문지 '네이처'에 게재된 “base editing of A?T to G?C in genomic DNA without DNA cleavage”논문에서 Extended Data Figure 2에 명시된 sgRNA(서열번호 2 내지 20) 들 중 3개(서열번호 2, 3 및 19)를 선정하였다.
도 26은 도 25에서 선정된 sgRNA1(서열번호 2)를 이용하여 HEK293T cell에서 A to N 염기 치환율(substitution rate)를 보여주는 그래프이다.
도 27은 도 25에서 선정된 sgRNA2(서열번호 3)를 이용하여 HEK293T cell에서 A to N 염기 치환율(substitution rate)를 보여주는 그래프이다.
도 28은 도 25에서 선정된 sgRNA3(서열번호 19)를 이용하여 HEK293T cell에서 A to N 염기 치환율(substitution rate)를 보여주는 그래프이다.
도 29는 EGFR 유전자의 일 영역과 상보적으로 결합할 수 있는 sgRNA1(서열번호 21) 및 sgRNA2(서열번호 22) 이용하여 PC9 cell에서 C to N 염기 치환율을 보여주는 그래프이다.
도 30은 EGFR 유전자의 일 영역과 상보적으로 결합할 수 있는 sgRNA1(서열번호 21) 및 sgRNA2(서열번호 22을 이용하여 PC9 cell에서 C to A, C to T 또는 C to G 염기 치환율을 보여주는 그래프이다.
도 31은 Cytosine을 무작위적으로 염기 치환 시킨 후 Osimertinib이 첨가된 배지에서 배양시켜 살아남은 세포를 분석한 결과이다.
달리 정의되지 않는 한, 본 명세서에서 사용되는 모든 기술적 및 과학적 용어는 본 발명이 속하는 기술분야의 당업자에 의해 통상적으로 이해되는 것과 동일한 의미를 가진다. 본 명세서에 기재된 것과 유사 또는 동일한 방법 및 물질이 본 발명의 실행 또는 시험에서 사용될 수 있지만, 적합한 방법 및 물질이 이하에 기재된다. 본 명세서에 언급된 모든 간행물, 특허 출원, 특허 및 기타 다른 참고문헌은 전체가 참조고로 포함된다. 추가로, 물질, 방법 및 실시예는 단지 예시적이며, 제한하는 것으로 의도되지 않는다.
본 출원은 (a) CRISPR 효소 또는 이의 변이체, (b) 디아미네이즈(deaminase), 및 (c) DNA 글리코실레이즈(DNA glycosylase) 또는 이의 변이체를 포함하는 단일염기 치환 단백질을 제공한다.
본 출원은 상기 단일염기 치환 단백질 및 (d) 가이드 RNA를 포함하는 단일염기 치환 조성물을 제공한다.
이 때, 상기 단일염기 치환 단백질은 가이드 RNA와 동시에 작용하여 타겟 핵산서열 내 하나 이상의 뉴클레오타이드에 포함된 시토신 또는 아데닌을 임의의 질소성 염기 로의 치환을 유도하는 것을 특징으로 할 수 있다.
본 출원에 의해 제공되는 상기 단일염기 치환 단백질의 (a) CRISPR 효소 및 상기 (d) 가이드 RNA의 조합은 타겟 핵산서열을 포함하는 타겟영역에 단일염기 치환 단백질을 특이적으로 인도(directing to)할 수 있다.
이 때, 상기 단일염기 치환 단백질의 (b) 디아미네이즈 및 (c) DNA 글리코실레이즈의 조합은 타겟 영역 내 하나 이상의 뉴클레오타이드의 염기를 다른 임의의 염기로의 치환을 유도할 수 있다.
질소성 염기(nitrogenous base)
본 출원에서 질소성 염기란 뉴클레오타이드의 일 구성요소인 퓨린(purine) 또는 (pyrimidine) 계열의 염기, 또는 핵염기(nucleobase)를 의미한다.
본 출원에서 질소성염기는 염기로 약칭될 수 있으며, 염기란 아데닌(Adenine, A), 티민(thymine, T), 우라실(Uracil, U), 하이포잔틴(hypozanthine, H), 구아닌(Guanine, G) 또는 시토신(Cytosine, C)을 의미할 수 있다.
본 출원에서 상기 염기의 약칭인 A, T, C, G, U 또는 H는 염기치환에 대한 내용에 대한 것일 때는 상기 질소성 염기를 의미하고, 그 외에 일반적인 핵산 또는 뉴클레오타이드 서열에 대한 내용이거나, 명세서에서 별도로 설정한 서열번호(Seq ID NO.:)에 대한 것일 때는 당업계에서 관용되는 핵산(nucleic acid) 또는 뉴클레오타이드(nucleotide)에 대한 표현으로 사용된다.
일 예로, “아데닌(A)이 구아닌(G)으로 치환된다”는 것은 핵산서열 상 동일한 위치 또는 동일한 종류의 뉴클레오타이드 내 질소성 염기가 A에서 G로 치환되는 것을 의미할 수 있다.
일 예로, “아데닌(A)이 티민(T)으로 치환된다”는 것은 핵산서열 상 동일한 위치 또는 동일한 종류의 뉴클레오타이드 내 질소성 염기가 A에서 T로 치환되는 것을 의미할 수 있다.
일 예로, “아데닌(A)이 시토신(C)으로 치환된다”는 것은 핵산서열 상 동일한 위치 또는 동일한 종류의 뉴클레오타이드 내 질소성 염기가 A에서 C로 치환되는 것을 의미할 수 있다.
일 예로, “시토신(C)이 구아닌(G)으로 치환된다”는 것은 핵산서열 상 동일한 위치 또는 동일한 종류의 뉴클레오타이드 내 질소성 염기가 C에서 G로 치환되는 것을 의미할 수 있다.
일 예로, “시토신(C)이 티민(T)으로 치환된다”는 것은 핵산서열 상 동일한 위치 또는 동일한 종류의 뉴클레오타이드 내 질소성 염기가 C에서 T로 치환되는 것을 의미할 수 있다.
일 예로, “시토신(C)이 아데닌(A)으로 치환된다”는 것은 핵산서열 상 동일한 위치 또는 동일한 종류의 뉴클레오타이드 내 질소성 염기가 C에서 A로 치환되는 것을 의미할 수 있다.
일 예로, “3'-ATGCAAA-5'”은 질소성 염기 그 자체를 의미하는 것이 아니라, 당업계에서 관용되는 핵산서열 또는 뉴클레오타이드 서열을 표시한 것이다.
염기 치환(Base substitution) 또는 염기 변형(Base modification)
출원에서 “염기 치환(base substitution)”은 타겟 유전자 내 뉴클레오타이드의 염기가 다른 임의의 염기로 치환되는 것이다. 보다 구체적으로 타겟 영역 내 뉴클레오타이드의 염기가 다른 임의의 염기로 치환되는 것이다.
일 예로, 염기 치환은 아데닌(adenine, A), 구아닌(guanine, G), 시토신(cytosine, C), 티민(thymine, T), 하이포잔틴(Hypozanthine) 또는 우라실(uracil, U)이 다른 임의의 염기로 변경되는 것을 의미할 수 있다.
일 구체예로, 아데닌이 시토신, 티민, 우라실, 하이포잔틴, 또는 구아닌으로 치환되는 것을 의미할 수 있다.
일 구체예로, 시토신이, 아데닌, 티민, 우라실, 하이포잔틴, 또는 구아닌으로 치환되는 것을 의미할 수 있다.
일 구체예로, 구아닌이 시토신, 티민, 우라실, 하이포잔틴 또는 아데닌으로 치환되는 것을 의미할 수 있다.
일 구체예로, 티민이 아데닌, 시토신, 우라실, 하이포잔틴, 또는 구아닌으로 치환되는 것을 의미할 수 있다.
일 구체예로, 우라실이, 시토신, 티민, 아데닌, 하이포잔틴, 또는 구아닌으로 치환되는 것을 의미할 수 있다.
일 구체예로, 하이포잔틴이, 아데닌, 티민, 우라실, 시토신, 또는 구아닌으로 치환되는 것을 의미할 수 있다.
다만 이에 제한되지 않는다.
본 출원에서 “염기 치환”이란 “염기 변형(Base modification)”을 포함하는 개념일 수 있다. 이 때, 변형은 염기의 구조가 변형됨으로써 다른 염기로 변경되는 것을, 염기 치환은 염기의 종류가 변경되는 것을 의미할 수 있다.
일 예로, 염기 변형은 아데닌(adenine, A), 구아닌(guanine, G), 시토신(cytosine, C), 티민(thymine, T), 하이포잔틴(Hypozanthine) 또는 우라실(uracil, U)의 화학구조가 변형되는 것이다.
일 구체예로, 아데닌이 탈아민화되어 하이포잔틴으로 변형되는 것일 수 있다.
일 구체예로, 하이포잔틴이 구아닌으로 변형되는 것일 수 있다.
일 구체예로, 시토신이 탈아민화되어 우라실로 변형되는 것일 수 있다.
일 구체예로, 우라실이 티민으로 변형되는 것일 수 있다.
다만 이에 제한되지 않는다.
타겟 핵산서열 - 가이드 RNA와 상보적으로 결합하는 핵산서열
타겟 핵산서열은 단일염기 치환 조성물의 일 구성요소인 가이드 RNA와 상보적으로 결합하거나 할 수 있는 뉴클레오타이드 서열을 의미한다.
일 예로, 세포 내 이중가닥 DNA를 단일염기 치환의 대상으로 할 때 상기 세포 내 이중가닥 DNA는 제1 DNA 가닥 및 제2 DNA 가닥으로 구성되어 있다. 이 때, 상기 이중가닥 DNA의 제1 DNA 가닥 및 상기 제1 DNA 가닥과 상보적인 제2 DNA 가닥 중 어느 하나는 타겟 핵산서열을 포함할 수 있다. 상기 타겟 핵산서열을 포함하는 제1 또는 제2 DNA 가닥은 상기 가이드 RNA와 결합할 수 있다. 이 때 상기 가이드 RNA와 결합한 제1 또는 제2 DNA 가닥 내 핵산 서열이 타겟 핵산서열에 해당한다.
일 예로, 세포 내 이중가닥 RNA를 단일염기 치환의 대상으로 할 때 상기 세포 내 이중가닥 RNA는 제1 RNA 가닥 및 제2 RNA 가닥으로 구성되어 있다., 상기 이중가닥 RNA의 제1 RNA 가닥 및 상기 제1 RNA 가닥과 상보적인 제2 RNA 가닥 중 어느 하나는 타겟 핵산서열을 포함할 수 있다. 상기 타겟 핵산서열을 포함하는 제1 또는 제2 RNA 가닥은 상기 가이드 RNA와 결합할 수 있다. 이 때 상기 가이드 RNA와 결합한 제1 또는 제2 RNA 가닥 내 핵산 서열이 타겟 핵산서열에 해당한다.
일 예로, 세포 내 단일가닥 DNA 또는 RNA를 단일염기 치환의 대상으로 할 때, 상기 단일가닥 DNA 또는 RNA는 타겟 핵산서열을 포함할 수 있다. 즉 상기 단일가닥 DNA 또는 RNA는 가이드 RNA와 결합할 수 있고, 이 때, 상기 가이드 RNA와 결합한 핵산 서열이 타겟 핵산서열에 해당한다.
일 예로, 타겟 핵산서열은 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30 bp 이상의 뉴클레오타이드 서열일 수 있다.
타겟 영역(target region) - 염기치환되는 뉴클레오타이드를 포함하는 영역
타겟영역은 단일염기 치환 단백질에 의하여 염기치환이 유도되는 뉴클레오타이드를 포함하는 영역이다.
타겟영역은 가이드 RNA가 결합하는 타겟 핵산서열을 포함하는 영역이다. 이 때, 상기 타겟 핵산서열은 단일염기 치환 단백질에 의하여 염기치환이 유도되는 뉴클레오타이드를 포함할 수 있다.
타겟영역은 가이드 RNA와 상보적으로 결합하는 제1 DNA 가닥 내 타겟 핵산서열과 상보적으로 결합하는 제2 DNA 가닥 내 핵산서열을 포함할 수 있다. 이 때, 상기 제2 DNA 가닥 내 핵산서열은 단일염기 치환 단백질에 의하여 염기치환이 유도되는 뉴클레오타이드를 포함할 수 있다.
일 예로, 이중가닥 DNA 또는 RNA 중 상기 타겟 핵산서열을 포함하는 가닥을 제1 가닥으로, 상기 핵산서열을 포함하지 않는 가닥을 제2 가닥으로 칭할 수 있다. 이 때, 타겟영역은 상기 제1 가닥 내 가이드 RNA와 상보적으로 결합하는 타겟 핵산서열 및 상기 타겟 핵산서열과 상보적으로 결합하는 상기 제2 가닥 내 핵산서열을 포함할 수 있다.
일 예로, 이중가닥 DNA 또는 RNA 중 상기 타겟 핵산서열을 포함하는 가닥을 제2 가닥으로, 상기 핵산서열을 포함하지 않는 가닥을 제1 가닥으로 칭할 수 있다. 이 때, 타겟영역은 상기 제2 가닥 내 가이드 RNA와 상보적으로 결합하는 타겟 핵산서열 및 상기 타겟 핵산서열과 상보적으로 결합하는 상기 제1 가닥 내 핵산서열을 포함할 수 있다.
단일염기 치환 단백질은 상기 타겟영역 내 하나 이상의 뉴클레오타이드의 염기치환을 유도할 수 있다.
일 예로, 가이드 RNA가 이중가닥 DNA의 제1 DNA 가닥에 포함된 타겟 핵산서열과 상보적으로 결합되면, 단일염기 치환 단백질은 (i) 상기 타겟 핵산서열 내의 하나 이상의 뉴클레오타이드의 염기를 치환하거나, (ii) 상기 이중가닥 DNA의 제2 가닥 내 상기 타겟 핵산서열과 상보적인으로 결합하는 핵산서열 내의 하나 이상의 뉴클레오타이드의 염기를 치환할 수 있다.
일 예로, 가이드 RNA가 이중가닥 RNA의 제1 RNA 가닥에 포함된 타겟 핵산서열과 상보적으로 결합되면, 단일염기 치환 단백질은 (i) 상기 타겟 핵산서열 내의 하나 이상의 뉴클레오타이드의 염기를 치환하거나, (ii) 상기 이중가닥 RNA의 제2 가닥 내 상기 타겟 핵산서열과 상보적인으로 결합하는 핵산서열 내의 하나 이상의 뉴클레오타이드의 염기를 치환할 수 있다.
일 구체예로, 상기 타겟 핵산영역 내 하나 이상의 뉴클레오타이드의 시토신을 구아닌, 티민, 우라실, 하이포잔틴 또는 아데닌으로 치환할 수 있다.
일 구체예로, 상기 타겟 핵산서열 내 하나 이상의 뉴클레오타이드의 아데닌을 구아닌, 티민, 우라실, 하이포잔틴 또는 시토신으로 치환할 수 있다.
본 명세서에서 타겟 유전자란 타겟 영역 및 타겟 핵산서열을 포함하는 유전자를 의미한다. 또한, 본 명세서에서 타겟 유전자란 단일염기 치환 단백질에 의하여 타겟 영역 내 하나 이상의 뉴클레오타이드의 시토신 염기가 임의의 염기로 치환되는 유전자를 의미한다.
기술적 특징 - 임의의 염기로의 치환
본 출원에서 제공되는 단일염기 치환 단백질은 (i) 디아미네이즈 및 (ii) DNA 글리코실레이즈를 필수 구성요소로 포함한다.
단일염기 치환 단백질의 제1 구성인 디아미네이즈, 및 제2 구성인 DNA 글리코실레이즈의 조합은 핵산서열 내 뉴클레오타이드의 염기를 임의의 염기로의 치환을 유도할 수 있다.
이 때, 상기 디아미네이즈 및 상기 DNA 글리코실레이즈에 의한 염기치환은 다음의 두 단계, (i) 염기의 탈아민화(Deamination), 및/또는 (iii) DNA 글리코실레이즈에 의한 절단 또는 수선 공정이 순차적으로 또는 동시에 진행된 결과일 수 있다.
제1 공정: 염기의 탈아민화(Deamination)
탈아민화란 아미노기의 절단을 수반하는 생화학반응을 의미한다. 일 예로, DNA의 경우, 뉴클레오타이드의 일 구성요소인 염기의 아미노기를 히드록시기 또는 케톤기로 바꾸는 것을 의미할 수 있다.
일 구체예로, 디아미네이즈는 시티딘 디아미네이즈(cytidine deaminase)일 수 있다. 상기 시티딘 디아미네이즈는 시토신을 탈아민화하여 우라실을 제공할 수 있다. 상기 시티딘 디아미네이즈는 시토신을 변형시켜 우라실을 제공할 수 있다.
Figure pat00001
일 구체예로, 단일염기 치환 단백질의 디아미네이즈는 아데노신 디아미네이즈(adenosine deaminase)일 수 있다. 상기 아데노신 디아미네이즈는 아데닌을 탈아민화하여 하이포잔틴(hypozanthine)을 제공할 수 있다. 상기 아데노신 디아미네이즈는 아데닌을 변형시켜 하이포잔틴을 제공할 수 있다.
Figure pat00002
일 구체예로, 디아미네이즈는 구아닌 디아미네이즈(guanine deaminase)일 수 있다. 상기 구아닌 디아미네이즈는 구아닌을 탈아민화하여 잔틴(xantine)을 제공할 수 있다. 상기 구아닌 디아미네이즈는 구아닌을 변형시켜 잔틴을 제공할 수 있다.
Figure pat00003
제2 공정: DNA의 글리코실레이션
DNA 글리코실레이즈는 염기절제회복(Base Excision Repair, BER)에 관여하는 효소이고, BER은 DNA의 손상된 염기를 제거하고 교체하는 메커니즘이다. DNA 글리코실레이즈는 DNA내 염기와 디옥시리보오스(deoxyribose) 사이의 N-글리코시드결합(N-glycoside linkage)을 가수분해하여 상기 메커니즘의 첫 단계를 촉매한다. DNA 글리코실레이즈는 sugar-phosphate 백본(backbone)을 그대로 남겨둔 채 손상된 질소성 염기(nitrogenous base)를 제거한다. 그 결과 AP 부착자리(AP site), 구체적으로 무퓨린 부위(apurinic site) 또는 무피리미디닉 부위(apyrimidinic site)가 만들어진다. 그 후, AP 엔도뉴클레이즈(AP endonuclease), 말단 처리 효소(Endprocessing enzymes), DNA 중합효소(DNA polymerase), 플랩 엔도뉴클레이즈(Flap endonuclease), 및/또는 DNA 리게이스(DNA ligase)에 의하여 임의의 염기로 치환될 수 있다.
일 구체예로, DNA 글리코실레이즈는 우라실 DNA 글리코실레이즈(Uracil DNA glycosylase)일 수 있다. 상기 우라실 DNA 글리코실레이즈는 DNA 내 우라실과 디옥시리보오스 사이의 N-글리코시드결합(N-glycoside linkage)을 가수분해한다. 우라실 DNA 글리코실레이즈는 우라실을 포함하는 뉴클레오타이드 내 우라실과 디옥시리보오스 사이의 N-글리코시드 결합을 가수분해한다. 이 때, 상기 우라실을 포함하는 뉴클레오타이드는 시토신을 포함하는 뉴클레오타이드에 시티딘 디아미네이즈가 작동하여 탈아민화되어 제공된 것일 수 있다.
일 구체예로, DNA 글리코실레이즈는 알킬아데닌 DNA 글리코실레이즈(Alkyladenine DNA glycosylase)일 수 있다. 상기 알킬아데닌 DNA 글리코실레이즈는 DNA 내 하이포잔틴과 디옥시리보오스 사이의 N-글리코시드결합(N-glycoside linkage)을 가수분해한다. 알킬아데닌 DNA 글리코실레이즈는 하이포잔틴을 포함하는 뉴클레오타이드 내 하이포잔틴과 디옥시리보오스 사이의 N-글리코시드 결합을 가수분해한다. 이 때, 상기 하이포잔틴을 포함하는 뉴클레오타이드는 아데닌을 포함하는 뉴클레오타이드에 아데노신 디아미네이즈가 작동하여 탈아민화되어 제공된 것일 수 있다.
상기 제1 및 제2 공정의 결과
본 출원에서 제공되는 단일염기 치환 단백질을 이용하여 타겟영역 내 하나 이상의 아데닌 또는 시토신을 임의의 염기로 치환할 수 있다.
일 예로, 단일염기 치환 단백질의 디아미네이즈는 아데노신 디아미네이즈(adenosine deaminase)이고, DNA 글리코실레이즈는 알킬아데닌-DNA 글리코실레이즈(alkyladenine-DNA glycosylase) 또는 이의 변이체일 수 있다. 이 때, 상기 단일염기 치환 융합단백질은 타겟 핵산서열 내 하나 이상의 뉴클레오타이드의 아데닌을 임의의 염기(구아닌, 티민, 시토신)로의 치환을 유도할 수 있다.
일 구체예로, 타겟영역 내 하나 이상의 뉴클레오타이드 내 아데닌은 (a) CRISPR 효소 또는 이의 변이체; (b) 아데노신 디아미네이즈; 및 (c) 알킬아데닌 DNA 글리코실레이즈를 포함하는 단일염기 치환 단백질에 의하여 시토신으로의 치환이 유도될 수 있다.
Figure pat00004
일 구체예로, 타겟영역 내 하나 이상의 뉴클레오타이드 내 아데닌은 (a) CRISPR 효소 또는 이의 변이체; (b) 아데노신 디아미네이즈; 및 (c) 알킬아데닌 DNA 글리코실레이즈를 포함하는 단일염기 치환 단백질에 의하여 티민으로의 치환이 유도될 수 있다.
Figure pat00005
일 구체예로, 타겟영역 내 하나 이상의 뉴클레오타이드 내 아데닌은 (a) CRISPR 효소 또는 이의 변이체; (b) 아데노신 디아미네이즈; 및 (c) 알킬아데닌 DNA 글리코실레이즈를 포함하는 단일염기 치환 단백질에 의하여 구아닌으로의 치환이 유도될 수 있다.
Figure pat00006
일 예로, 단일염기 치환 단백질의 디아미네이즈는 시티딘 디아미네이즈(cytidine deaminase)이고, DNA 글리코실레이즈는 우라실-DNA 글리코실레이즈(Uracil-DNA glycosylase) 또는 이의 변이체일 수 있다. 이 때, 상기 단일염기 치환 융합단백질은 타겟 핵산서열 내 하나 이상의 뉴클레오타이드의 시토신을 임의의 염기로의 치환을 유도할 수 있다.
일 구체예로, 타겟영역 내 하나 이상의 뉴클레오타이드 내 시토신은 (a) CRISPR 효소 또는 이의 변이체; (b) 시티딘 디아미네이즈; 및 (c) 우라실 DNA 글리코실레이즈를 포함하는 단일염기 치환 단백질에 의하여 아데닌으로의 치환이 유도될 수 있다.
Figure pat00007
일 구체예로, 타겟영역 내 하나 이상의 뉴클레오타이드 내 시토신은 (a) CRISPR 효소 또는 이의 변이체; (b) 시티딘 디아미네이즈; 및 (c) 우라실 DNA 글리코실레이즈를 포함하는 단일염기 치환 단백질에 의하여 티민으로의 치환이 유도될 수 있다.
Figure pat00008
일 구체예로, 타겟영역 내 하나 이상의 뉴클레오타이드 내 시토신은 (a) CRISPR 효소 또는 이의 변이체; (b) 시티딘 디아미네이즈; 및 (c) 우라실 DNA 글리코실레이즈를 포함하는 단일염기 치환 단백질에 의하여 구아닌으로의 치환이 유도될 수 있다.
Figure pat00009
이하 상세히 설명한다.
본 명세서에 의해 개시되는 발명의 일 태양은 단일염기 치환 단백질이다.
단일염기 치환 단백질은 단일염기 치환을 유도 또는 발생시킬 수 있는 단백질, 폴리펩타이드, 또는 펩타이드이다.
종래 베이스 에디터의 한계
종래의 베이스에디터(Base Editor)는 디아미네이즈(deaminase), CRISPR 효소, DNA 글리코실레이즈 억제제(DNA glycosylase inhibitor)가 융합, 연결 또는 결합된 형태로 사용되었다. 대표적인 일 예로, 래트의 시티딘 디아미네이즈인 rAPOBEC과, nCas9, 및 우라실 DNA 글리코실레이즈를 결합한 베이스 에디터를 이용하여, 시토신 염기를 티민으로 치환하였다. 또한, 시티딘 디아니메이즈 대신 아데노신 디아미네이즈를 이용하여 아데닌(A)를 구아닌(G)으로 치환하였다.
종래의 베이스 에디터는 점 돌연변이로 인하여 발생하는 질병을 치료하는데 사용될 수 있는, 예를 들면 유전자 내의 점돌연변이 발생 부위를 교정하여 유전적 장애를 치료하는데 사용되는 등 유의미한 점이 있다. 다만, 종래의 베이스 에디터는 DNA 글리코실레이즈 억제제를 이용함으로써 아미노기(-NH2)를 제거하거나 아미노기를 케토기로 치환시킴으로써, 시토신(C)을 특정염기 티민(T)으로만 또는 아데노신(A)을 특정염기 구아닌(G)으로만 변경가능하다는 한계를 가지고 있다.
단일염기 치환 단백질의 유용성
종래의 베이스 에디터는 이를 이용하여 치환된 염기로부터 발현되는 아미노산의 종류가 달라질 가능성이 낮다는 한계가 있다. 대부분의 질환 또는 질병은 점돌연변이로 인한 것이 아니라, 뉴클레오타이드 레벨을 넘어 펩타이드, 폴리펩타이드, 또는 단백질의 레벨에서 구조나 기능에 이상이 생김으로써 발생하는 경우가 많다. 결국 종래의 베이스 에디터는 아데닌 및 시토신을 특정 염기로 밖에 변경될 수 없으므로, 펩타이드, 폴리펩타이드, 또는 단백질의 구조가 달라질 가능성이 현저하게 떨어진다.
종래 기술의 한계는 본 명세서에 의해 제공되는 단일염기 치환 단백질을 이용하여 극복할 수 있다. 본 출원에서 제공되는 단일염기 치환 단백질은 (a) 에디터 단백질, (b) 디아미네이즈(deaminase), 및 (c) DNA 글리코실레이즈(DNA glycosylase)으로 구성된 신규한 조합을 가진다. 즉, 본 출원에서 제공하는 단일염기 치환 단백질은 아데닌(A), 구아닌(G), 티민(T), 또는 시토신(C)을 임의의 염기(A, T, C, G, U, H)로 치환할 수 있다는 장점을 가지고 있다.
또한, 상기 신규한 구성요소 및 신규한 조합의 단일염기 치환 단백질은 타겟 핵산서열 내에 존재하는 하나 이상의 염기를 동시에 치환할 수 있다는 장점을 가지고 있다.
결국, 본 출원에서 제공하는 단일염기 치환 단백질은 다양한 염기가 무작위로 치환된 “돌연변이”를 제공할 수 있다. 상기 돌연변이된 유전자로부터 다양한 구조를 가지는 펩타이드, 폴리펩타이드, 또는 단백질이 발현될 수 있다.
상기 기술적 효과로 인하여, 본 출원에서 제공하는 단일염기 치환 단백질은 에피토프 스크리닝, 약물내성 유전자 또는 단백질 스크리닝, 약물 감작 스크리닝, 및/또는 바이러스 내성 유전자 또는 단백질 스크리닝 용도로 이용할 수 있다.
본 출원에서 제공하는 단일염기 치환 단백질은 가이드 RNA와 함께 사용함으로써 타겟 유전자의 타겟영역 내 염기를 임의의 염기로의 치환을 유도할 수 있다.
[단일염기 치환 단백질의 제1 구성 - 디아미네이즈]
디아미네이즈는 탈아미노 효소를 의미하고, 화합물의 아미노기를 히드록시기 또는 케톤기로 바꾸는 효소를 총칭한다. 시토신, 아데닌, 구아닌, 아데노신, 시티딘, AMP, ADP 등에 결합하는 아미노기를 각각 가수분해하는 효소가 존재하며, 이러한 효소는 일반적으로 동물조직에 포함되어 있다.
본 출원의 명세서에서 디아미네이즈는 염기치환 도메인으로 칭해질 수도 있다. 이 때, 염기 치환 도메인은 타겟 유전자 내 하나 이상의 뉴클레오타이드의 염기를 다른 임의의 염기로 치환하는데 관여하는 펩타이드, 폴리펩타이드, 도메인, 단백질을 의미한다.
본 출원의 디아미네이즈는 시티딘 디아미네이즈일 수 있다
이때, 상기 시티딘 디아미네이즈는 시토신(cytosine), 시티딘(cytidine) 또는 데옥시시티딘(deoxycytidine)의 아미노(-NH2)기를 제거하는 활성을 가지는 모든 효소를 의미한다. 본 명세서에서 상기 시티딘 디아미네이즈는 시토신 디아미네이즈를 포함하는 개념으로 사용된다. 본 명세서에서 상기 시티딘 디아미네이즈는 상기 시토신 디아미네이즈와 혼용되어 사용될 수 있다. .
상기 시티딘 디아미네이즈는 시토신을 우라실(uracil)로 변형시킬 수 있다.
상기 시티딘 디아미네이즈는 시티딘을 우리딘(uridine)으로 변형시킬 수 있다.
상기 시티딘 디아미네이즈는 데옥시시티딘을 디옥시우리딘(deoxyuridine)으로 변형시킬 수 있다.
시티딘 디아미나제는 뉴클레오타이드에 존재하는 염기인 시토신 (예컨대, 2중 가닥 DNA 또는 RNA에 존재하는 시토신)을 우라실로 변환 (C-to-U conversion or C-to-U editing)시키는 활성을 갖는 모든 효소를 의미하는 것으로, 표적 부위의 서열 (표적 핵산서열)의 PAM 서열이 존재하는 가닥에 위치하는 시토신을 우라실로 변환시킨다.
일 예로, 시티딘 디아미네이즈는 Escherichia coli 등의 원핵 생물; 또는 인간, 원숭이 등의 영장류, 래트, 마우스 등의 설치류 등과 같은 포유류로부터 유래된 것일 수 있으나, 이에 제한된 것은 아니다. 예컨데, 상기 시티딘 디아미네이즈는 APOBEC ("apolipoprotein B mRNA editing enzyme, catalytic polypeptide-like") 또는 활성-유도 시티딘 디아미네이즈(activation-induced cytidine deaminase, AID) 패밀리에 속하는 효소들 중에서 선택된 하나 이상일 수 있다.
상기 시티딘 디아미네이즈는 APOBEC1, APOBEC2, APOBEC3B, APOBEC3C, APOBEC3D, APOBEC3F, APOBEC3G, APOBEC3H, APOBEC4, AID 또는 CDA일 수 있으나, 이에 제한된 것을 아니다.
예를 들어, 상기 시티딘 디아미네이즈는 인간 APOBEC1, 예컨대, NCBI Accession No. NM_005889, NM_001304566, NM_001644 등으로 표현되는 유전자 또는 mRNA에 의해 발현되는 단백질 또는 폴리펩타이드일 수 있다. 또는, 상기 시티딘 디아미네이즈는 인간 APOBEC1, 예컨대, NCBI Accession No. NP_001291495, NP_001635, NP_005880 등으로 표현되는 단백질 또는 폴리펩타이드일 수 있다.
예를 들어, 상기 시티딘 디아미네이즈는 마우스 APOBEC1, 예컨대, NCBI Accession No. NM_001127863, NM_112436 등으로 표현되는 유전자 또는 mRNA에 의해 발현되는 단백질 또는 폴리펩타이드일 수 있다. 또는, 상기 시티딘 디아미네이즈는 마우스 APOBEC1, 예컨대, NCBI Accession No. NP_001127863, NP_112436 등으로 표현되는 단백질 또는 폴리펩타이드일 수 있다.
예를 들어, 상기 시티딘 디아미네이즈는 인간 AID, 예컨대, NCBI Accession No. NM_020661, NM_001330343 등으로 표현되는 유전자 또는 mRNA에 의해 발현되는 단백질 또는 폴리펩타이드일 수 있다. 또는, 상기 시티딘 디아미네이즈는 인간 AID, 예컨대, NCBI Accession No. NP_001317272, NP_065712 등으로 표현되는 단백질 또는 폴리펩타이드일 수 있다.
이하, 시티딘 디아미네이즈의 일 예들을 나열한다:
APOBEC1: 인간 APOBEC1 (e.g., NCBI Accession No. NP_001291495, NP_001635, NP_005880)를 암호화하는 유전자, 예컨대, NCBI Accession No. NM_005889, NM_001304566, NM_001644로 표현되는 APOBEC1 유전자, 또는 마우스 APOBEC1(e.g., NCBI Accession No. NP_001127863, NP_112436)를 암호화하는 유전자, 예컨대, NCBI Accession No. NM_001127863, NM_112436로 표현되는 APOBEC1 유전자.
APOBEC2: 인간 APOBEC2 (e.g., NCBI Accession No. NP_006780)를 암호화하는 유전자, 예컨대, NCBI Accession No. NM_006789로 표현되는 APOBEC2유전자, 또는 마우스 APOBEC2(e.g., NCBI Accession No. NP_033824)를 암호화하는 유전자, 예컨대, NCBI Accession No. NM_009694로 표현되는 APOBEC2유전자.
APOBEC3B: 인간 APOBEC3B(e.g., NCBI Accession No. NP_001257340, NP_004891)를 암호화하는 유전자, 예컨대, NCBI Accession No. NM_004900, NM_001270411로 표현되는 APOBEC3B유전자, 또는 마우스 APOBEC3B(e.g., NCBI Accession No. NP_001153887, NP_001333970, NP_084531)를 암호화하는 유전자, 예컨대, NCBI Accession No. NM_001160415, NM_030255, NM_001347041로 표현되는 APOBEC3B유전자.
APOBE3C: 인간 APOBEC3C (e.g., NCBI Accession No. NP_055323)를 암호화하는 유전자, 예컨대, NCBI Accession No. NM_014508로 표현되는 APOBEC3C 유전자.
APOBEC3D: 인간 APOBEC3D (e.g., NCBI Accession No. NP_689639, NP_0013570710)를 암호화하는 유전자, 예컨대, NCBI Accession No. NM_152426, NM_001363781로 표현되는 APOBEC3D 유전자.
APOBEC3F: 인간 APOBEC3F (e.g., NCBI Accession No. NP_001006667, NP_660341)를 암호화하는 유전자, 예컨대, NCBI Accession No. NM_001006666, NM_145298로 표현되는 APOBEC3F 유전자.
APOBEC3G: 인간 APOBEC3G (e.g., NCBI Accession No. NP_068594, NP_001336365, NP_001336366, NP_001336367)를 암호화하는 유전자, 예컨대, NCBI Accession No. NM_021822로 표현되는 APOBEC3G 유전자.
APOBEC3H: 인간 APOBEC3H (e.g., NCBI Accession No. NP_001159474, NP_001159475, NP_001159476, NP_861438)를 암호화하는 유전자, 예컨대, NCBI Accession No. NM_001166002, NM_001166003, NM_001166004, NM_181773로 표현되는 APOBEC3H 유전자.
APOBEC4: 인간 APOBEC4(e.g., NCBI Accession No. NP_982279)를 암호화하는 유전자, 예컨대, NCBI Accession No. NM_203454로 표현되는 APOBEC4유전자, 또는 마우스 APOBEC4를 암호화하는 유전자, 예컨대, NCBI Accession No. NM_001081197로 표현되는 APOBEC4 유전자.
상기 시티딘 디아미네이즈는 활성-유도 시티딘 디아미네이즈(activation-induced cytidine deaminase, AID) 유전자로부터 발현될 수 있다. 예를 들어, AID 유전자는 다음으로 이루어진 군에서 선택될 수 있으나, 이에 제한되는 것은 아니다: 인간 AID 유전자(e.g., NP_001317272, NP_065712)를 암호화하는 유전자, 예컨대, NCBI Accession No. NM_020661, NM_001330343으로 표현되는 AID 유전자, 또는 마우스 AID 유전자(e.g., NP_03377512)를 암호화하는 유전자, 예컨대, NCBI Accession No. NM_009645로 표현되는 AID 유전자.
상기 시티딘 디아미네이즈는 CDA 유전자로부터 암호화될 수 있다. 예를 들어, CDA 유전자는 다음으로 이루어진 군에서 선택될 수 있으나, 이에 제한되는 것은 아니다: 인간 CDA(e.g., NCBI Accession No. NP_001776)를 암호화하는 유전자, 예컨대, NCBI Accession No. NM_001785로 표현되는 CDA 유전자, 또는 마우스 CDA (e.g., NCBI Accession No. NP_082452)를 암호화하는 유전자, 예컨대, NCBI Accession No. NM_028176으로 표현되는 CDA 유전자.
상기 시티딘 디아미네이즈는 시티딘 디아미네이즈 변이체일 수 있다.
상기 시티딘 디아미네이즈 변이체는 야생형 시티딘 디아미네이즈보다 시티딘 디아미네이즈 활성(cytidine deaminase activity)이 증가된 효소일 수 있다. 시티딘 디아미네이즈 활성은 시토신 또는 그의 유사체들 중의 하나의 탈아미노산 반응을 포함하는 것으로 이해된다.
예를 들어, 시티딘 디아미네이즈 변이체는 상기 시티딘 디아미네이즈 내 하나 이상의 아미노산 서열이 변형된 효소일 수 있다.
이때, 아미노산 서열의 변형은 아미노산의 치환, 결실 및 삽입 중에서 선택된 어느 하나일 수 있다.
본 출원의 디아미네이즈는 아데노신 디아미네이즈일 수 있다.
아데노신 디아미네이즈는 아데닌(adenine), 아데노신(adenosine) 또는 데옥시아데노신(deoxyadenosine)의 아미노(-NH2)기의 제거 또는 케토(=O)기로 치환하는 활성을 가지는 모든 효소를 의미한다. 본 명세서에서 상기 아데노신 디아미네이즈는 아데닌 디아미네이즈를 포함하는 개념으로 사용된다. 본 명세서에서 상기 아데노신 디아미네이즈는 상기 아데닌 디아미네이즈를 포함하는 개념으로 사용된다.
상기 아데노신 디아미네이즈는 아데닌을 하이포잔틴 (hypoxanthine)으로 변형시킬 수 있다.
상기 아데노신 디아미네이즈는 아데노신닌을 이노신(inosine)으로 변형시킬 수 있다.
상기 아데노신 디아미네이즈는 데옥시아데노신을 데옥시이노신(deoxyinosine)으로 변형시킬 수 있다.
아데노신 디아미네이즈는 Escherichia coli 등의 원핵 생물, 또는 인간, 원숭이 등의 영장류, 래트, 마우스 등의 설치류 등과 같은 포유류로부터 유래된 것일 수 있으나, 이에 제한된 것은 아니다. 예컨데, 상기 아노신 디아미네이즈는 TadA(tRNA-specific adenosine deaminase) 또는 ADA(adenosine deaminase) 패밀리에 속하는 효소들 중에서 선택된 하나 이상일 수 있다.
상기 아데노신 디아미네이즈는 TadA, Tad2p, ADA, ADA1, ADA2, ADAR2, ADAT2 또는 ADAT3일 수 있으나, 이에 제한된 것을 아니다.
예를 들어, 상기 아데노신 디아미네이즈는 Escherichia coli TadA, 예컨대, NCBI Accession No. NC_000913.3 등으로 표현되는 유전자 또는 mRNA에 의해 발현되는 단백질 또는 폴리펩타이드일 수 있다. 또는, 상기 아데노신 디아미네이즈는 Escherichia coli TadA, 예컨대, NCBI Accession No. NP_417054.2 등으로 표현되는 단백질 또는 폴리펩타이드일 수 있다.
예를 들어, 상기 아데노신 디아미네이즈는 인간 ADA, 예컨대, NCBI Accession No. NM_000022, NM_001322050, NM_001322051 등으로 표현되는 유전자 또는 mRNA에 의해 발현되는 단백질 또는 폴리펩타이드일 수 있다. 또는, 상기 아데노신 디아미네이즈는 인간 ADA, 예컨대, NCBI Accession No. NP_000013, NP_001308979, NP_001308980 등으로 표현되는 단백질 또는 폴리펩타이드일 수 있다.
예를 들어, 상기 아데노신 디아미네이즈는 마우스 ADA, 예컨대, NCBI Accession No. NM_001272052, NM_007398 등으로 표현되는 유전자 또는 mRNA에 의해 발현되는 단백질 또는 폴리펩타이드일 수 있다. 또는, 상기 아데노신 디아미네이즈는 마우스 ADA, 예컨대, NCBI Accession No. NP_001258981, NP_031424 등으로 표현되는 단백질 또는 폴리펩타이드일 수 있다.
예를 들어, 상기 아데노신 디아미네이즈는 인간 ADAR2, 예컨대, NCBI Accession No. NM_001033049, NM_001112, NM_001160230, NM_015833, NM_015834 등으로 표현되는 유전자 또는 mRNA에 의해 발현되는 단백질 또는 폴리펩타이드일 수 있다. 또는, 상기 아데노신 디아미네이즈는 인간 ADAR2, 예컨대, NCBI Accession No. NP_001103, NP_001153702, NP_001333616, NP_001333617, NP_056648 등으로 표현되는 단백질 또는 폴리펩타이드일 수 있다.
예를 들어, 상기 아데노신 디아미네이즈는 마우스 ADAR2, 예컨대, NCBI Accession No. NM_001024837, NM_001024838, NM_001024839, NM_001024840, NM_130895 등으로 표현되는 유전자 또는 mRNA에 의해 발현되는 단백질 또는 폴리펩타이드일 수 있다. 또는, 상기 아데노신 디아미네이즈는 마우스 ADAR2, 예컨대, NCBI Accession No. NP_001020008, NP_570965, NP_001020009 등으로 표현되는 단백질 또는 폴리펩타이드일 수 있다.
예를 들어, 상기 아데노신 디아미네이즈는 인간 ADAT2, 예컨대, NCBI Accession No. NM_182503.3, NM_001286259.1 등으로 표현되는 유전자 또는 mRNA에 의해 발현되는 단백질 또는 폴리펩타이드일 수 있다. 또는, 상기 아데노신 디아미네이즈는 인간 ADAT2, 예컨대, NCBI Accession No. NP_001273188.1, NP_872309.2 등으로 표현되는 단백질 또는 폴리펩타이드일 수 있다.
상기 아데노신 디아미네이즈는 adA variants, ADAR2 variants 및 ADAT2 variants 중 어느 하나일 수 있으나, 이에 제한되는 것은 아니다.
예를 들어, ADAR2 variants는 다음으로 이루어진 군에서 선택된 하나 이상일 수 있으나, 이에 제한되는 것은 아니다. 인간 ADAR2를 암호화하는 유전자, 예컨대, NCBI Accession No. NM_001282225, NM_001282226, NM_001282227, NM_001282228, NM_001282229, NM_017424, NM_177405등으로 표현되는 CDA 유전자일 수 있다.
상기 아데노신 디아미네이즈는 아데노신 디아미네이즈 변이체일 수 있다.
상기 아데노신 디아미네이즈 변이체는 야생형 아데노신 디아미네이즈보다 아데노신 디아미네이즈 활성(adenine deaminase activity)이 증가된 효소일 수 있다.
예를 들어, 아데노신 디아미네이즈 변이체는 상기 아데노신 디아미네이즈 내 하나 이상의 아미노산 서열이 변형된 효소일 수 있다.
상기 아데노신 디아미네이즈는 아데노신 디아미네이즈 변이체일 수 있다.
상기 아데노신 디아미네이즈 변이체는 아생형 아데노신 디아미네이즈보다 아데노신 디아미네이즈 활성(adenosine deaminase activity)가 증가된 효소일 수 있다. 이때, 상기 아데노신 디아미네이즈 활성은 아데닌(adenine), 아데노신(adenosine), 데옥시아데노신(deoxyadenosine) 또는 이의 유사체의 아미노(-NH2)기의 제거 또는 케토(=O)기로 치환 반응을 포함하는 것일 수 있으나, 이에 제한되지 않는다.
상기 아데노신 디아미네이즈 변이체는 아생형 아데노신 디아미네이즈을 구성하는 아미노산 서열 중 선택된 하나 이상의 아미노산 서열이 변형된 효소일 수 있다.
이때, 아미노산 서열의 변형은 하나 이상의 아미노산의 치환, 결실 및 삽입 중에서 선택된 어느 하나일 수 있다.
상기 아데노신 디아미네이즈 변이체는 TadA 변이체, Tad2p 변이체, ADA 변이체, ADA1 변이체, ADA2 변이체, ADAR2 변이체, ADAT2 변이체 또는 ADAT3 변이체일 수 있으나, 이에 제한된 것은 아니다.
예를 들어, 상기 아데노신 디아미네이즈는 TadA 변이체일 수 있다. 일 예로, 상기 TadA 변이체는 ABE0.1, ABE1.1, ABE1.2, ABE2.1, ABE2.9, ABE2.10, ABE3.1, ABE4.3, ABE5.1, ABE5.3, ABE6.3, ABE6.4, ABE7.4, ABE7.8, ABE7.9 또는 ABE7.10일 수 있으며, 상기 TadA 변이체에 대한 구체적인 내용은 논문 “base editing of A*?*T to G?C in genomic DNA without DNA cleavage”(Nicole M. Gaudelli et al., (2017) Nature, 551, 464-471)에 자세히 기재되어 있으므로, 해당 문헌을 참고할 수 있다.
상기 아데노신 디아미네이즈는 융합 아데노신 디아미네이즈일 수 있다.
본 출원에서 제공되는 디아미네이즈, 예를 들어, 시티딘 디아미네이즈 또는 아데노신 디아미네이즈는 하나 이상의 기능적 도메인이 연결되어 융합된 형태로 제공될 수 있다.
이때, 상기 디아미네이즈 및 상기 기능적 도메인은 각각의 기능이 발현되도록 연결 또는 융합된 것일 수 있다.
아데노신 디아아데노신 디아아데노신 디아상기 기능적 도메인은 메틸라아제(methylase) 활성, 디메틸라아제(demethylase) 활성, 전사촉진(transcription activation) 활성, 전사 저해(transcription repression) 활성, 전사 방출 인자(transcription release factor) 활성, 히스톤 변형(histone modification) 활성, RNA 절단(cleavage) 활성 또는 핵산 결합(nucleic acid binding) 활성을 가지는 도메인일 수 있으며, 또는 단백질(펩타이드 포함)의 분리정제를 위한 태그(tag) 또는 리포터 유전자일 수 있으나, 이에 제한되지 않는다.
상기 기능적 도메인은 단백질(펩타이드 포함)의 분리정제를 위한 태그(tag) 또는 리포터 유전자일 수 있다.
이 때, 상기 태그는 히스티딘(His) 태그, V5 태그, FLAG 태그, 인플루엔자 헤마글루티닌(HA) 태그, Myc 태그, VSV-G 태그 및 티오레독신(Trx) 태그 중 어느 하나를 포함할 수 있다. 이 때, 상기 리포터 유전자는 자가형광 단백질, 예를 들면 글루타티온-S-트랜스 퍼라제(GST), 호스래디시(horseradish) 과산화효소(HRP), 클로람페니콜 아세틸트랜스퍼라제(CAT) 베타-갈락토시다제, 베타-글루쿠로니다제, 루시퍼라제, 녹색 형광 단백질(GFP), HcRed, DsRed, 청록색 형광 단백질(CFP), 황색 형광 단백질(YFP) 및 청색 형광 단백질(BFP) 중 어느 하나를 포함할 수 있다. 다만, 이들에 한정되지 않는다.
상기 기능적 도메인은 NLS(nuclear localization sequence or signal) 또는 NES(nuclear export sequence or signal)일 수 있다.
이때, 상기 NLS는 CRISPR 효소의 아미노 말단 또는 그 근처; 카르복시 말단 또는 그 근처; 또는 이들의 조합에 하나 이상의 NLS를 포함할 수 있다. 상기 NLS는 하기로부터 유래된 NLS 서열일 수 있으나, 이에 제한되지 않는다: 아미노산 서열 PKKKRKV(서열번호 23)를 갖는 SV40 바이러스 대형 T-항원의 NLS; 뉴클레오플라스민(nucleoplasmin)으로부터의 NLS(예를 들어, 서열 KRPAATKKAGQAKKKK(서열번호 24)를 갖는 뉴클레오플라스민 이분(bipartite) NLS); 아미노산 서열 PAAKRVKLD(서열번호 25) 또는 RQRRNELKRSP(서열번호 26)를 갖는 c-myc NLS; 서열 NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(서열번호 27)를 갖는 hRNPA1 M9 NLS; 임포틴-알파로부터의 IBB 도메인의 서열 RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(서열번호 28); 마이오마(myoma) T 단백질의 서열 VSRKRPRP(서열번호 29) 및 PPKKARED(서열번호 30); 인간 p53의 서열 POPKKKPL(서열번호 31); 마우스 c-abl IV의 서열 SALIKKKKKMAP(서열번호 32); 인플루엔자 바이러스 NS1의 서열 DRLRR(서열번호 33) 및 PKQKKRK(서열번호 34); 간염 바이러스 델타 항원의 서열 RKLKKKIKKL(서열번호 35); 마우스 Mx1 단백질의 서열 REKKKFLKRR(서열번호 36); 인간 폴리(ADP-리보스) 중합효소의 서열 KRKGDEVDGVDEVAKKKSKK(서열번호 37); 및 스테로이드 호르몬 수용체(인간) 글루코코르티코이드의 서열 RKCLQAGMNLEARKTKK(서열번호 38) 중 선택된 어느 하나 이상일 수 있다.
상기 기능적 도메인은 다른 도메인, 펩타이드, 폴리펩타이드 또는 단백질과 복합체를 형성할 수 있도록 하는 결합 도메인 일 수 있다.
상기 결합 도메인은 FRB 및 FKBP dimerization domains 중 하나; 인테인(intein); ERT 및 VPR domains 중 하나; GCN4 peptide 및 single chain variable fragment (scFv) 중 하나 또는 이량이질체(heterodimer)를 형성하는 도메인일 수 있다.
상기 결합 도메인은 scFv 일 수 있다. 이 때, 상기 scFv는 GCN4 pepetide과 페어이며, 상기 GCN4과 특이적으로 결합 또는 연결될 수 있다.
일 예로, 상기 아데노신 디아미네이즈에 scFv 기능적 도메인이 연결된 제1 융합단백질은 GCN4 peptide를 포함하는 펩타이드, 폴리펩타이드, 단백질 또는 제2 융합단백질과 서로 결합될 수 있다,
[단일염기 치환 단백질의 제2 구성 - DNA 글리코실레이즈]
DNA 글리코실레이즈는 염기절제회복(Base Excision Repair, BER)에 관여하는 효소이고, BER은 DNA의 손상된 염기를 제거하고 교체하는 메커니즘이다. DNA 글리코실레이즈는 DNA내 염기와 디옥시리보오스(deoxyribose) 사이의 N-글리코시드결합(N-glycoside linkage)을 가수분해하여 상기 메커니즘의 첫 단계를 촉매한다. DNA 글리코실레이즈는 sugar-phosphate 백본(backbone)을 그대로 남겨둔 채 손상된 질소성 염기(nitrogenous base)를 제거한다.
본 출원의 글리코실레이즈는 우라실-DNA 글리코실레이즈일 수 있다.
우라실 DNA 글리코실레이즈는 DNA에 존재하는 우라실(U)를 제거하여 DNA의 돌연변이를 방지하는 작용을 하는 효소로서, 우라실의 N-glycosylic bond를 절단함으로서 base-excision repair(BER) pathway를 개시하도록 하는 역할을 하는 모든 효소들 중에서 1종 이상 선택될 수 있다.
상기 글리코실가수분해효소는 Uracil-DNA glycosylase(UDG or UNG)일 수 있다. 상기 Uracil-DNA glycosylase(UNG)은 다음으로 이루어진 군에서 선택될 수 있으나, 이에 제한되는 것은 아니다: 인간 UNG(e.g., NCBI Accession No. NP_003353, NP_550433)를 암호화하는 유전자, 예컨대, NCBI Accession No. NM_080911, NM_003362로 표현되는 UNG 유전자, 또는 마우스 UNG 유전자 (e.g., NCBI Accession No. NP_001035781, NP_035807)를 암호화하는 유전자, 예컨대, NCBI Accession No. NM_001040691, NM_011677으로 표현되는 UNG 유전자 또는 Escherichia coli UNG (e.g., NCBI Accession No. ADX49788.1, ACT28166.1, EFN36865.1, BAA10923.1, ACA76764.1, ACX38762.1, EFU59768.A, EFU53885.A, EFJ57281.1, EFU47398.1, EFK71412.1, EFJ92376.1, EFJ79936.1, EFO59084.1, EFK47562.1, KXH01728.1, ESE25979.1, ESD99489.1, ESD73882.1, ESD69341.1)을 암호화하는 유전자.
상기 DNA 글리코실레이즈는 우라실 DNA 글리코실레이즈 변이체일 수 있다. 상기 우라실 DNA 글리코실레이즈 변이체는 야생형 우라실 DNA 글리코실레이즈보다 DNA 글리코실레이즈 활성(DNA glycosylase activity)이 증가된 효소일 수 있다.
예를 들어, 우라실 DNA 글리코실레이즈 변이체는 야생형 우라실 DNA 글리코실레이즈의 하나 이상의 아미노산 서열이 변형된 효소일 수 있다. 이때, 아미노산 서열의 변형은 적어도 하나 이상의 아미노산의 치환, 결실, 삽입 또는 이의 조합일 수 있다.
상기 글리코실레이즈는 융합 우라실-DNA 글리코실레이즈 일 수 있다.
본 출원의 글리코실레이즈는 알킬아데닌 DNA 글리코실레이즈(alkyladenine DNA glycosylase, AAG)일 수 있다.
알킬아데닌 DNA 글리코실레이즈는 DNA에 존재하는 알킬화되거나 탈아미노화된 염기를 제거하여 DNA의 돌연변이를 방지하는 작용을 하는 효소로서, 알킬화되거나 탈아미노화된 염기의 N-glycosidic bond의 가수분해(hydrolysis)를 촉매함으로서 base-excision repair(BER) pathway를 개시하도록 하는 역할을 하는 모든 효소들 중에서 1종 이상 선택될 수 있다.
상기 DNA 글리코실레이즈는 알킬아데닌 DNA 글리코실레이즈(Alkyladenine DNA glycosylase(AAG)) 또는 이의 변이체일 수 있다.
예를 들어, 상기 알킬아데닌 DNA 글리코실레이즈(AAG)는 인간 AAG, 예컨대, NCBI Accession No. NM_002434, NM_001015052, NM_001015054 등으로 표현되는 유전자 또는 mRNA에 의해 발현되는 단백질 또는 폴리펩타이드일 수 있다. 또는, 상기 알킬아데닌 DNA 글리코실레이즈(AAG)는 인간 AAG, 예컨대, NCBI Accession No. NP_001015052, NP_001015054, NP_002425 등으로 표현되는 단백질 또는 폴리펩타이드일 수 있다.
예를 들어, 상기 알킬아데닌 DNA 글리코실레이즈(AAG)는 마우스 AAG, 예컨대, NCBI Accession No. NM_010822 등으로 표현되는 유전자 또는 mRNA에 의해 발현되는 단백질 또는 폴리펩타이드일 수 있다. 또는, 상기 알킬아데닌 DNA 글리코실레이즈 (AAG)는 인간 AAG, 예컨대, NCBI Accession No. NP_034952 등으로 표현되는 단백질 또는 폴리펩타이드일 수 있다.
상기 DNA 글리코실레이즈는 알킬아데닌 DNA 글리코실레이즈 변이체일 수 있다. 상기 알킬아데닌 DNA 글리코실레이즈 변이체는 야생형 알킬아데닌 DNA 글리코실레이즈보다 DNA 글리코실레이즈 활성(DNA glycosylase activity)이 증가된 효소일 수 있다.
예를 들어, 알킬아데닌 DNA 글리코실레이즈 변이체는 야생형 알킬아데닌 DNA 글리코실레이즈의 하나 이상의 아미노산 서열이 변형된 효소일 수 있다. 이때, 아미노산 서열의 변형은 적어도 하나 이상의 아미노산의 치환, 결실, 삽입 또는 이의 조합일 수 있다.
상기 글리코실레이즈는 융합 알킬아데닌 DNA 글리코실레이즈 일 수 있다.
본 출원은 우라실 DNA 글리코실레이즈 또는 알킬아데닌 DNA 글리코실레이즈에 하나 이상의 기능적 도메인이 연결된 융합 우라실 DNA 글리코실레이즈 또는 융합 알킬아데닌 DNA 글리코실레이즈를 제공할 수 있다. 이때, 상기 우라실 DNA 글리코실레이즈 또는 상기 알킬아데닌 DNA 글리코실레이즈 및 상기 기능적 도메인의 각각의 기능이 발현되도록 연결 또는 융합된 것일 수 있다.
상기 기능적 도메인은 메틸라아제(methylase) 활성, 디메틸라아제(demethylase) 활성, 전사촉진(transcription activation) 활성, 전사 저해(transcription repression) 활성, 전사 방출 인자(transcription release factor) 활성, 히스톤 변형(histone modification) 활성, RNA 절단(cleavage) 활성 또는 핵산 결합(nucleic acid binding) 활성을 가지는 도메인일 수 있으며, 또는 단백질(펩타이드 포함)의 분리정제를 위한 태그(tag) 또는 리포터 유전자일 수 있으나, 이에 제한되지 않는다.
이 때, 상기 기능적 도메인은 단백질(펩타이드 포함)의 분리정제를 위한 태그(tag) 또는 리포터 유전자일 수 있다.
이 때, 상기 태그는 히스티딘(His) 태그, V5 태그, FLAG 태그, 인플루엔자 헤마글루티닌(HA) 태그, Myc 태그, VSV-G 태그 및 티오레독신(Trx) 태그 중 어느 하나를 포함할 수 있다. 이 때, 상기 리포터 유전자는 자가형광 단백질, 예를 들면 글루타티온-S-트랜스 퍼라제(GST), 호스래디시(horseradish) 과산화효소(HRP), 클로람페니콜 아세틸트랜스퍼라제(CAT) 베타-갈락토시다제, 베타-글루쿠로니다제, 루시퍼라제, 녹색 형광 단백질(GFP), HcRed, DsRed, 청록색 형광 단백질(CFP), 황색 형광 단백질(YFP) 및 청색 형광 단백질(BFP) 중 어느 하나를 포함할 수 있다. 다만, 이들에 한정되지 않는다.
상기 기능적 도메인은 NLS(nuclear localization sequence or signal) 또는 NES(nuclear export sequence or signal)일 수 있다.
이때, 상기 NLS는 CRISPR 효소의 아미노 말단 또는 그 근처; 카르복시 말단 또는 그 근처; 또는 이들의 조합에 하나 이상의 NLS를 포함할 수 있다. 상기 NLS는 하기로부터 유래된 NLS 서열일 수 있으나, 이에 제한되지 않는다: 아미노산 서열 PKKKRKV(서열번호 23)를 갖는 SV40 바이러스 대형 T-항원의 NLS; 뉴클레오플라스민(nucleoplasmin)으로부터의 NLS(예를 들어, 서열 KRPAATKKAGQAKKKK(서열번호 24)를 갖는 뉴클레오플라스민 이분(bipartite) NLS); 아미노산 서열 PAAKRVKLD(서열번호 25) 또는 RQRRNELKRSP(서열번호 26)를 갖는 c-myc NLS; 서열 NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(서열번호 27)를 갖는 hRNPA1 M9 NLS; 임포틴-알파로부터의 IBB 도메인의 서열 RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(서열번호 28); 마이오마(myoma) T 단백질의 서열 VSRKRPRP(서열번호 29) 및 PPKKARED(서열번호 30); 인간 p53의 서열 POPKKKPL(서열번호 31); 마우스 c-abl IV의 서열 SALIKKKKKMAP(서열번호 32); 인플루엔자 바이러스 NS1의 서열 DRLRR(서열번호 33) 및 PKQKKRK(서열번호 34); 간염 바이러스 델타 항원의 서열 RKLKKKIKKL(서열번호 35); 마우스 Mx1 단백질의 서열 REKKKFLKRR(서열번호 36); 인간 폴리(ADP-리보스) 중합효소의 서열 KRKGDEVDGVDEVAKKKSKK(서열번호 37); 및 스테로이드 호르몬 수용체(인간) 글루코코르티코이드의 서열 RKCLQAGMNLEARKTKK(서열번호 38) 중 선택된 어느 하나 이상일 수 있다.
상기 기능적 도메인은 다른 도메인, 펩타이드, 폴리펩타이드 또는 단백질과 복합체를 형성할 수 있도록 하는 결합 도메인 일 수 있다.
상기 결합 도메인은 FRB 및 FKBP dimerization domains 중 하나; 인테인(intein); ERT 및 VPR domains 중 하나; GCN4 peptide 및 single chain variable fragment (scFv) 중 하나 또는 이량이질체(heterodimer)를 형성하는 도메인일 수 있다.
상기 결합 도메인은 scFv 일 수 있다. 이 때, 상기 scFv는 GCN4 pepetide과 페어이며, 상기 GCN4과 특이적으로 결합 또는 연결될 수 있다.
일 예로, 상기 우라실 DNA 글리코실레이즈 또는 상기 알킬아데닌 DNA 글리코실레이즈에 scFv 기능적 도메인이 연결된 제1 융합단백질은 GCN4 peptide를 포함하는 펩타이드, 폴리펩타이드, 단백질 또는 제2 융합단백질과 서로 결합될 수 있다,
[단일염기 치환 단백질의 제3 구성 - CRISPR 효소]
본 출원에서 제공하는 단일염기 치환 단백질은 CRISPR 효소 또는 이를 포함하는 CRISPR 시스템을 포함한다. 본 명세서에서 CRISPR 효소는 CRISPR 단백질로 칭해질 수 있다.
CRISPR 시스템은 게놈 DNA 상에서 PAM(proto-spaceradjacent Motif)서열 주변의 표적 핵산서열을 표적하여 인위적인 돌연변이를 도입할 수 있는 시스템이다. 구체적으로, 상기 가이드 RNA과 Cas단백질은 서로 결합하여(또는 상호작용하여) 가이드 RNA-Cas단백질 복합체를 형성하고, 목적하는 DNA 서열을 절단함으로써, 게놈 DNA 상에 돌연변이 인델(indel)을 유도할 수 있다.
상기 가이드 RNA, Cas단백질, 가이드 RNA-Cas단백질 복합체에 대한 보다 구체적인 설명은 한국 공개특허 제10-2017-0126636호를 참조할 수 있다.
Cas 단백질은 천연형 단백질 외에도 가이드 RNA와 협동하여 활성화된 엔도뉴클레아제 또는 니케이즈(Nickase)로 작용할 수 있는 변이체를 모두 포함하는 개념으로 본 명세서에서 사용된다. 활성화된 엔도뉴클레아제 또는 니케이즈인 경우, 표적 핵산서열을 절단할 수 있고, 이를 이용하여 핵산서열을 조작 또는 변형시킬 수 있다. 또한, 불활성화된 변이체인 경우, 이를 이용하여 전사를 조절하거나 목적하는 DNA를 분리할 수 있다.
본 출원에서 CRISPR 단백질은 스트렙토코커스 피오게네스(Streptococcus pyogenes), 스트렙토코커스 써모필러스(Streptococcus thermophilus), 스트렙토코커스 속(Streptococcus sp.), 스타필로코커스 아우레스(Staphylococcus aureus), 캄필로박터 제주니 (Campylobacter jejuni), 노카르디옵시스 다손빌레이(Nocardiopsis dassonvillei), 스트렙토마이세스 프리스티네스피랄리스(Streptomyces pristinaespiralis), 스트렙토마이세스 비리도크로모게네스(Streptomyces viridochromogenes), 스트렙토마이세스 비리도크로모게네스(Streptomyces viridochromogenes), 스트렙토스포랑기움 로세움(Streptosporangium roseum), 스트렙토스포랑기움 로세움(Streptosporangium roseum), 알리사이클로바클루스 아시도칼다리우스(AlicyclobacHlus acidocaldarius), 바실러스 슈도마이코이데스(Bacillus pseudomycoides), 바실러스 셀레니티레두센스(Bacillus selenitireducens), 엑시구오박테리움 시비리쿰(Exiguobacterium sibiricum), 락토바실러스 델브루에키이(Lactobacillus delbrueckii), 락토바실러스 살리바리우스(Lactobacillus salivarius), 미크로스 킬라 마리나(Microscilla marina), 부르크홀데리아레스 박테리움(Burkholderiales bacterium), 폴라로모나스 나프탈레니보란스(Polaromonas naphthalenivorans), 폴라로모나스 속(Polaromonas sp.), 크로코스파에라 와트소니이(Crocosphaera watsonii), 시아노테세 속(Cyanothece sp.), 마이크로시스티스 아에루기노사(Microcystis aeruginosa), 시네코코커스 속(Synechococcus sp.), 아세토할로비움 아라바티쿰(Acetohalobium arabaticum), 암모니펙스 데겐시이(Ammonifex degensii), 칼디셀룰로시럽토 베시이(Caldicelulosiruptor bescii), 칸디다투스 데술포루디스(Candidatus Desulforudis), 클로스트리듐 보툴리눔(Clostridium botulinum), 클로스트리듐 디피실레(Clostridium difficile), 피네골디아 마그나(Finegoldia magna), 나트라나에로비우스 써모필러스 (Natranaerobius thermophilus), 펠로토마쿨럼 써모프로피오니쿰(Pelotomaculum thermopropionicum), 아시디티오바실러스 칼두스(Acidithiobacillus caldus), 아시디티오바실러스 페로옥시단스(Acidithiobacillus ferrooxidans), 알로크로마티움 비노숨(Allochromatium vinosum), 마리노박터 속(Marinobacter sp.), 니트로소코커스 할로필러스(Nitrosococcus halophilus), 니트로소코커스 와트소니(Nitrosococcus watsoni), 슈도알테로 모나스 할로플란크티스(Pseudoalteromonas haloplanktis), 크테도노박테르 라세미페르(Ktedonobacter racemifer), 메타노할로비움 에베스티가툼(Methanohalobium evestigatum), 아나베나 바리아빌리스(Anabaena variabilis), 노둘라리아 스푸미게나(Nodularia spumigena), 노스톡 속(Nostoc sp.), 아르트로스피라 맥시마(Arthrospira maxima), 아르트로스피라 플라텐시스(Arthrospira platensis), 아르트로스피라 속(Arthrospira sp.), 링비아속(Lyngbya sp.), 마이크로콜레우스 크토노플라스테스(Microcoleus chthonoplastes), 오실라토리아 속(Oscillatoria sp.), 페트로토가 모빌리스(Petrotoga mobilis), 써모시포 아프리카누스(Thermosipho africanus) 또는 아카리오클로리스 마리나(Acaryochloris marina) 등 다양한 미생물 유래의 Cas9 또는 Cpf1 일 수 있다.
상기 CRISPR 효소는 완전 활성을 가지는 CRISPR 효소일 수 있다.
일 실시예에서, 상기 완전활성을 가지는 CRISPR 효소 변이체는 SpCas9 스트렙토코커스 피요젠스(streptococcus pyogenes)유래의 Cas9단백질의 변이체일 수 있다. 이하, 변이의 예들을 나열한다:
E108G, E217A, A262T, R324L, S409I, E480K, E543D, M694I, E1219V, E480K, E543D, E1219V, A262T, S409I, E480K, E543D, E1219V, A262T, S409I, E480K, E543D, M694I, E1219V, E108G, E217A, A262T, S409I, E480K, E543D, M694I, E1219V, A262T, R324L, S409I, E480K, E543D, M694I, E1219V, L111R, D1135V, G1218R, E1219F, A1322R, R1335V 및 T1337R 중 하나 이상의 아미노산이 치환된 효소일 수 있다. 이때, 상기 CRISPR 효소 변이체는 상이한 PAM 서열을 인식할 수 있으며, 이러한 CRISPR 효소 변이체는 CRISPR 효소가 인식할 수 있는 PAM 서열의 시퀀스의 길이를 줄임으로써 게놈 내 타겟 핵산서열을 확장할 수 있고, 핵산 근접 능력을 향상시킬 수 있다.
구체 예로, SpCas9의 경우, SpCas9를 L111R, D1135V, G1218R, E1219F, A1322R, R1335V 및 T1337R와 같이 변이(mutation)시키면, 상기 SpCas9변이체는 기존의 인식하던 PAM 서열'NGG'에서 PAM 서열 'NG'만 인식하여 작동할 수 있다(N은 A, T, C, G 중 하나임).
이 때, 상기 SpCas9(L111R, D1135V, G1218R, E1219F, A1322R, R1335V 및 T1337R) 변이체는 'Nureki Cas9'와 혼용하여 사용될 수 있다(“CRISPR-Cas9 nuclease with expanded targeting space”masu et al., (2018) Science 361, 1259-1262).
상기 CRISPR 효소는 니케이즈(nickase)일 수 있다.
예를 들어, 상기 Type II CRISPR 효소가 야생형 SpCas9의 경우, 상기 니케이즈는 야생형 SpCas9의 아미노산 서열 840번 히스티딘을 알라닌으로 변이(mutation)시켜 HNH 도메인의 뉴클레아제 활성이 불활성화된 SpCas9 변이체일 수 있다. 이때 생성된 니케이즈, 즉, SpCas9 변이체는 RuvC 도메인에 의한 뉴클레아제 활성을 가지므로, 타겟 유전자 또는 핵산의 비상보성 가닥, 즉, gRNA와 상보적인 결합을 하지 않는 가닥을 절단할 수 있다.
또 다른 예를 들어, 상기 Type II CRISPR 효소가 야생형 CjCas9의 경우, 상기 니케이즈는 야생형 CjCas9의 아미노산 서열 559번 히스티딘을 알라닌으로 변이(mutation)시켜 HNH 도메인의 뉴클레아제 활성이 불활성화된 CjCas9 변이체일 수 있다. 이때 생성된 니케이즈, 즉, CjCas9 변이체는 RuvC 도메인에 의한 뉴클레아제 활성을 가지므로, 타겟 유전자 또는 핵산의 비상보성 가닥, 즉, gRNA와 상보적인 결합을 하지 않는 가닥을 절단할 수 있다.
또한, 상기 니케이즈는 CRISPR 효소의 HNH 도메인에 의한 뉴클레아제 활성을 가질 수 있다. 즉, 상기 니케이즈는 CRISPR 효소의 RuvC 도메인에 의한 뉴클레아제 활성을 포함하지 않을 수 있으며, 이를 위해 RuvC 도메인은 조작 또는 변경될 수 있다.
일 예로, 상기 CRISPR 효소가 Type II CRISPR 효소일 때, 상기 니케이즈는 변형된 RuvC 도메인을 포함하는 Type II CRISPR 효소일 수 있다.
예를 들어, 상기 Type II CRISPR 효소가 야생형 SpCas9의 경우, 상기 니케이즈는 야생형 SpCas9의 아미노산 서열 10번 아스파르트산을 알라닌으로 변이(mutation)시켜 RuvC 도메인의 뉴클레아제 활성이 불활성화된 SpCas9 변이체일 수 있다. 이때 생성된 니케이즈, 즉, SpCas9 변이체는 HNH 도메인에 의한 뉴클레아제 활성을 가지므로, 타겟 유전자 또는 핵산의 상보성 가닥, 즉, gRNA와 상보적인 결합을 하는 가닥을 절단할 수 있다.
또 다른 예를 들어, 상기 Type II CRISPR 효소가 야생형 CjCas9의 경우, 상기 니케이즈는 야생형 CjCas9의 아미노산 서열 8번 아스파르트산을 알라닌으로 변이(mutation)시켜 RuvC 도메인의 뉴클레아제 활성이 불활성화된 CjCas9 변이체일 수 있다. 이때 생성된 니케이즈, 즉, CjCas9 변이체는 HNH 도메인에 의한 뉴클레아제 활성을 가지므로, 타겟 유전자 또는 핵산의 상보성 가닥, 즉, gRNA와 상보적인 결합을 하는 가닥을 절단할 수 있다.
일 실시예에서, 상기 니케이즈는 Nureki Cas9의 아미노산 서열 10번 아스파르트산을 알라닌으로 변이(mutation)시켜 RuvC 도메인의 뉴클레아제 활성이 불활성화된 Nureki Cas9 변이체, 즉, Nureki Cas9 니케이즈(Nureki nCas9)일 수 있다. 이때 생성된 Nureki nCas9은 HNH 도메인에 의한 뉴클레아제 활성을 가지므로, 타겟 유전자 또는 핵산의 상보성 가닥, 즉, gRNA와 상보적인 결합을 하는 가닥을 절단할 수 있다.
다른 일 실시예에서, 상기 니케이즈는 Nureki Cas9의 아미노산 서열 840번 히스티딘을 알라닌으로 변이(mutation)시켜 HNH 도메인의 뉴클레아제 활성이 불활성화된 Nureki Cas9 변이체, 즉, Nureki Cas9 니케이즈(Nureki nCas9)일 수 있다. 이때 생성된 Nureki nCas9은 RuvC 도메인에 의한 뉴클레아제 활성을 가지므로, 타겟 유전자 또는 핵산의 비상보성 가닥, 즉, gRNA와 상보적인 결합을 하지 않는 가닥을 절단할 수 있다.
상기 CRISPR 효소는 불활성 CRISPR 효소일 수 있다.
“불활성”은 야생형 CRISPR 효소의 기능, 즉, DNA의 이중 가닥 중 제1 가닥을 절단하는 제1 기능 및 DNA의 이중 가닥 중 제2 가닥을 절단하는 제2 기능이 모두 상실된 상태를 의미한다. 이러한 상태의 CRISPR 효소는 불활성 CRISPR 효소로 명칭한다.
상기 불활성 CRISPR 효소는 야생형 CRISPR 효소의 뉴클레아제 활성을 가지는 도메인에 변이로 인한 뉴클레아제 불활성을 가질 수 있다.
상기 불활성 CRISPR 효소는 RuvC 도메인 및 HNH 도메인에 변이로 인한 뉴클레아제 불활성을 가질 수 있다. 즉, 상기 불활성 CRISPR 효소는 CRISPR 효소의 RuvC 도메인 및 HNH 도메인에 의한 뉴클레아제 활성을 포함하지 않을 수 있으며, 이를 위해 RuvC 도메인 및 HNH 도메인은 조작 또는 변경될 수 있다.
일 예로, 상기 CRISPR 효소가 Type II CRISPR 효소일 때, 상기 불활성 CRISPR 효소는 변형된 RuvC 도메인 및 HNH 도메인을 포함하는 Type II CRISPR 효소일 수 있다.
예를 들어, 상기 Type II CRISPR 효소가 야생형 SpCas9의 경우, 상기 불활성 CRISPR 효소는 야생형 SpCas9의 아미노산 서열 10번 아스파르트산과 840번 히스티딘을 모두 알라닌으로 변이(mutation)시켜 RuvC 도메인 및 HNH 도메인의 뉴클레아제 활성이 불활성화된 SpCas9 변이체일 수 있다. 이때 생성된 불활성 CRISPR 효소, 즉, SpCas9 변이체는 RuvC 도메인 및 HNH 도메인의 뉴클레아제 활성이 불활성 되므로, 타겟 유전자 또는 핵산의 이중가닥을 모두 절단할 수 없다.
또 다른 예를 들어, 상기 Type II CRISPR 효소가 야생형 CjCas9의 경우, 상기 불활성 CRISPR 효소는 야생형 CjCas9의 아미노산 서열 8번 아스파르트산과 559번 히스티딘을 모두 알라닌으로 변이(mutation)시켜 RuvC 도메인 및 HNH 도메인의 뉴클레아제 활성이 불활성화된 CjCas9 변이체일 수 있다. 이때 생성된 불활성 CRISPR 효소, 즉, CjCas9 변이체는 RuvC 도메인 및 HNH 도메인의 뉴클레아제 활성이 불활성 되므로, 타겟 유전자 또는 핵산의 이중가닥을 모두 절단할 수 없다.
또한, 본 출원은 기능적 도메인에 연결된 CRISPR 효소를 제공할 수 있다. 이때, 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 원래 기능 이외에 부가적인 기능을 가질 수 있다.
상기 기능적 도메인은 메틸라아제(methylase) 활성, 디메틸라아제(demethylase) 활성, 전사촉진(transcription activation) 활성, 전사 저해(transcription repression) 활성, 전사 방출 인자(transcription release factor) 활성, 히스톤 변형(histone modification) 활성, RNA 절단(cleavage) 활성 또는 핵산 결합(nucleic acid binding) 활성을 가지는 도메인일 수 있으며, 또는 단백질(펩타이드 포함)의 분리정제를 위한 태그(tag) 또는 리포터 유전자일 수 있으나, 이에 제한되지 않는다.
상기 기능적 도메인은 단백질(펩타이드 포함)의 분리정제를 위한 태그(tag) 또는 리포터 유전자일 수 있다.
이 때, 상기 태그는 히스티딘(His) 태그, V5 태그, FLAG 태그, 인플루엔자 헤마글루티닌(HA) 태그, Myc 태그, VSV-G 태그 및 티오레독신(Trx) 태그 중 어느 하나를 포함할 수 있다. 이 때, 상기 리포터 유전자는 자가형광 단백질, 예를 들면 글루타티온-S-트랜스 퍼라제(GST), 호스래디시(horseradish) 과산화효소(HRP), 클로람페니콜 아세틸트랜스퍼라제(CAT) 베타-갈락토시다제, 베타-글루쿠로니다제, 루시퍼라제, 녹색 형광 단백질(GFP), HcRed, DsRed, 청록색 형광 단백질(CFP), 황색 형광 단백질(YFP) 및 청색 형광 단백질(BFP) 중 어느 하나를 포함할 수 있다. 다만, 이들에 한정되지 않는다.
상기 기능적 도메인은 NLS(nuclear localization sequence or signal) 또는 NES(nuclear export sequence or signal)일 수 있다.
이때, 상기 NLS는 CRISPR 효소의 아미노 말단 또는 그 근처; 카르복시 말단 또는 그 근처; 또는 이들의 조합에 하나 이상의 NLS를 포함할 수 있다. 상기 NLS는 하기로부터 유래된 NLS 서열일 수 있으나, 이에 제한되지 않는다: 아미노산 서열 PKKKRKV(서열번호 23)를 갖는 SV40 바이러스 대형 T-항원의 NLS; 뉴클레오플라스민(nucleoplasmin)으로부터의 NLS(예를 들어, 서열 KRPAATKKAGQAKKKK(서열번호 24)를 갖는 뉴클레오플라스민 이분(bipartite) NLS); 아미노산 서열 PAAKRVKLD(서열번호 25) 또는 RQRRNELKRSP(서열번호 26)를 갖는 c-myc NLS; 서열 NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(서열번호 27)를 갖는 hRNPA1 M9 NLS; 임포틴-알파로부터의 IBB 도메인의 서열 RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(서열번호 28); 마이오마(myoma) T 단백질의 서열 VSRKRPRP(서열번호 29) 및 PPKKARED(서열번호 30); 인간 p53의 서열 POPKKKPL(서열번호 31); 마우스 c-abl IV의 서열 SALIKKKKKMAP(서열번호 32); 인플루엔자 바이러스 NS1의 서열 DRLRR(서열번호 33) 및 PKQKKRK(서열번호 34); 간염 바이러스 델타 항원의 서열 RKLKKKIKKL(서열번호 35); 마우스 Mx1 단백질의 서열 REKKKFLKRR(서열번호 36); 인간 폴리(ADP-리보스) 중합효소의 서열 KRKGDEVDGVDEVAKKKSKK(서열번호 37); 및 스테로이드 호르몬 수용체(인간) 글루코코르티코이드의 서열 RKCLQAGMNLEARKTKK(서열번호 38) 중 선택된 어느 하나 이상일 수 있다.
상기 기능적 도메인은 다른 도메인, 펩타이드, 폴리펩타이드 또는 단백질과 복합체를 형성할 수 있도록 하는 결합 도메인 일 수 있다.
상기 결합 도메인은 FRB 및 FKBP dimerization domains 중 하나; 인테인(intein); ERT 및 VPR domains 중 하나; GCN4 peptide 및 single chain variable fragment (scFv) 중 하나 또는 이량이질체(heterodimer)를 형성하는 도메인일 수 있다.
상기 결합 도메인은 GCN4 peptide 일 수 있다. 이 때, 상기 GCN4 pepetide는 scFv와 페어이며, 상기 scFv와 특이적으로 결합 또는 연결될 수 있다.
일 예로, 상기 CRISPR 효소에 GCN4 peptide 기능적 도메인이 연결된 제1 융합단백질은 scFv를 포함하는 펩타이드, 폴리펩타이드, 단백질 또는 제2 융합단백질과 서로 결합될 수 있다,
[단일염기 치환 단백질의 제1 태양 - 단일염기 치환 융합단백질 또는 이를 암호화하는 핵산]
본 명세서에 의해 개시되는 단일염기 치환 단백질의 일 태양은 단일염기 치환 융합단백질이다.
일 예로, 단일염기 치환 융합단백질 또는 이를 암호화하는 핵산으로서,
(a) CRISPR 효소 또는 이의 변이체;
(b) 디아미네이즈(deaminase); 및
(c) DNA 글리코실레이즈(DNA glycosylase) 또는 이의 변이체를 포함하고,
이 때, 상기 아데닌 치환 융합단백질은 타겟 핵산서열 내 하나 이상의 뉴클레오타이드에 포함된 시토신 또는 아데닌을 임의의 염기로의 치환을 유도하는 단일염기 치환 융합단백질 또는 이를 암호화하는 핵산일 수 있다.
일 구체예로, 상기 단일염기 치환 융합단백질은 각 구성요소 (a), (b) 및 (c)의 사이에 연결 모이어티 (linking moiety)를 포함하는 것을 특징으로 하는 단일염기 치환 융합단백질 또는 이를 암호화하는 핵산일 수 있다.
일 구체예로, 상기 단일염기 치환 융합단백질은
(i) N말단-[CRISPR 효소]-[디아미네이즈]-[DNA 글리코실레이즈]-C말단;
(ii) N말단-[CRISPR 효소]-[DNA 글리코실레이즈]-[디아미네이즈]-C말단;
(iii) N말단-[디아미네이즈]-[CRISPR 효소]-[DNA 글리코실레이즈]-C말단;
(iv) N말단-[디아미네이즈]-[DNA 글리코실레이즈]-[CRISPR 효소]-C말단;
(v) N말단-[DNA 글리코실레이즈]-[CRISPR 효소]-[디아미네이즈]-C말단; 및
(vi) N말단-[DNA 글리코실레이즈]-[디아미네이즈]-[CRISPR 효소]-C말단 중 어느 하나의 구성을 가지는 것을 특징으로 하는 단일염기 치환 융합단백질 또는 이를 암호화하는 핵산일 수 있다.
일 구체예로, 상기 CRISPR 효소 또는 이의 변이체는 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophilus) 유래의 Cas9 단백질, 스트렙토코커스아우레우스 (Streptococcus aureus) 유래의 Cas9 단백질, 네이세리아 메닝기디티스 (Neisseria meningitidis) 유래의 Cas9 단백질, 및 Cpf1 단백질로 이루어진 군에서 선택된 어느 하나 이상을 포함하는 단일염기 치환 융합단백질 또는 이를 암호화하는 핵산일 수 있다.
일 구체예로, 상기 CRISPR 효소 변이체는 RuvC 도메인 또는 HNH 도메인 중 어느 하나 이상이 불활성화된 것을 특징으로 하는,
단일염기 치환 융합단백질 또는 이를 암호화하는 핵산일 수 있다.
일 구체예로, 상기 CRISPR 효소 변이체는 니케이즈(nickase)인 것을 특징으로 하는,
단일염기 치환 융합단백질 또는 이를 암호화하는 핵산일 수 있다.
일 구현예로 아데닌 치환 융합단백질이 제공될 수 있다.
아데닌 치환 융합단백질 또는 이를 암호화하는 핵산으로서,
(a) CRISPR 효소 또는 이의 변이체;
(b) 아데노신 디아미네이즈(adenine deaminase); 및
(c) 알킬아데닌 DNA 글리코실레이즈 또는 이의 변이체를 포함하고,
이 때, 상기 아데닌 치환 융합단백질은 타겟 핵산서열 내 하나 이상의 뉴클레오타이드에 포함된 아데닌을 임의의 염기로의 치환을 유도하는 아데닌 치환 융합단백질 또는 이를 암호화하는 핵산일 수 있다.
상기 아데닌 염기 치환 단백질은 N말단-[CRISPR 효소]-[아데노신 디아미네이즈]-[알킬아데닌알킬아데닌 DNA 글리코실레이즈]-C말단 순으로 구성될 수 있다.
상기 아데닌 염기 치환 단백질은 N말단-[알킬아데닌 DNA 글리코실레이즈]-[CRISPR 효소]-[아데노신 디아미네이즈]-C말단 순으로 구성될 수 있다.
상기 아데닌 염기 치환 단백질은 N말단-[알킬아데닌 DNA 글리코실레이즈]-[아데노신 디아미네이즈]-[CRISPR 효소]-C말단 순으로 구성될 수 있다.
상기 아데닌 염기 치환 단백질은 N말단-[아데노신 디아미네이즈]-[CRISPR 효소]-[알킬아데닌 DNA 글리코실레이즈]-C말단 순으로 구성될 수 있다.
상기 아데닌 염기 치환 단백질은 N말단-[CRISPR 효소]-[알킬아데닌 DNA 글리코실레이즈]-[아데노신 디아미네이즈]-C말단 순으로 구성될 수 있다.
상기 아데닌 염기 치환 단백질은 N말단-[아데노신 디아미네이즈]-[알킬아데닌 DNA 글리코실레이즈]-[CRISPR 효소]-C말단 순으로 구성될 수 있다.
상기 아데닌 염기 치환 단백질은 추가로 연결 도메인을 더 포함할 수 있다.
일 예로, 상기 연결 도메인은 CRISPR 효소 및 아데노신 디아미네이즈, 아데노신 디아미네이즈 및 알킬아데닌 DNA 글리코실레이즈, 및/또는 CRISPR 효소 및 알킬아데닌 DNA 글리코실레이즈를 작동 가능하게 연결하는 도메인으로, CRISPR 효소, 아데노신 디아미네이즈 및 알킬아데닌 DNA 글리코실레이즈가 각자의 기능이 활성되도록 연결시켜주는 도메인일 수 있다.
일 예로, 상기 연결 도메인은 CRISPR 효소, 아데노신 디아미네이즈 및 알킬아데닌 DNA 글리코실레이즈의 기능 활성 및/또는 구조에 어떠한 영향을 미치지 않는 아미노산, 펩타이드 또는 폴리펩타이드일 수 있다.
일 예로, 상기 아데닌 염기 치환 도메인은 N말단-[CRISPR 효소]-[연결 도메인]-[아데노신 디아미네이즈]-[알킬아데닌 DNA 글리코실레이즈]-C말단; N말단-[CRISPR 효소]-[아데노신 디아미네이즈]-[연결 도메인]-[알킬아데닌 DNA 글리코실레이즈]-C말단; 또는 N말단-[CRISPR 효소]-[연결 도메인]-[아데노신 디아미네이즈]-[연결 도메인]-[알킬아데닌 DNA 글리코실레이즈]-C말단 순으로 구성될 수 있다.
일 예로, 상기 아데닌 염기 치환 단백질은 N말단-[알킬아데닌 DNA 글리코실레이즈]-[연결 도메인]-[CRISPR 효소]-[아데노신 디아미네이즈]-C말단; N말단-[알킬아데닌 DNA 글리코실레이즈]-[CRISPR 효소]-[연결 도메인]-[아데노신 디아미네이즈]-C말단; 또는 N말단-[알킬아데닌 DNA 글리코실레이즈]-[연결 도메인]-[CRISPR 효소]-[연결 도메인]-[아데노신 디아미네이즈]-C말단 순으로 구성될 수 있다.
일 예로, 상기 아데닌 염기 치환 단백질은 N말단-[알킬아데닌 DNA 글리코실레이즈]-[연결 도메인]-[아데노신 디아미네이즈]-[CRISPR 효소]-C말단; N말단-[알킬아데닌 DNA 글리코실레이즈]-[아데노신 디아미네이즈]-[연결 도메인]-[CRISPR 효소]-C말단; 또는 N말단-[알킬아데닌 DNA 글리코실레이즈]-[연결 도메인]-[아데노신 디아미네이즈]-[연결 도메인]-[CRISPR 효소]-C말단 순으로 구성될 수 있다.
일 예로, 상기 아데닌 염기 치환 단백질은 N말단-[아데노신 디아미네이즈]-[연결 도메인]-[CRISPR 효소]-[알킬아데닌 DNA 글리코실레이즈]-C말단; N말단-[아데노신 디아미네이즈]-[CRISPR 효소]-[연결 도메인]-[알킬아데닌 DNA 글리코실레이즈]-C말단; 또는 N말단-[아데노신 디아미네이즈]-[연결 도메인]-[CRISPR 효소]-[연결 도메인]-[알킬아데닌 DNA 글리코실레이즈]-C말단 순으로 구성될 수 있다.
일 예로,상기 아데닌 염기 치환 단백질은 N말단-[CRISPR 효소]-[연결 도메인]-[알킬아데닌 DNA 글리코실레이즈]-[아데노신 디아미네이즈]-C말단; N말단-[CRISPR 효소]-[알킬아데닌 DNA 글리코실레이즈]-[연결 도메인]-[아데노신 디아미네이즈]-C말단; 또는 N말단-[CRISPR 효소]-[연결 도메인]-[알킬아데닌 DNA 글리코실레이즈]-[연결 도메인]-[아데노신 디아미네이즈]-C말단 순으로 구성될 수 있다.
일 예로,상기 아데닌 염기 변형 단백질은 N말단-[아데노신 디아미네이즈]-[연결 도메인]-[알킬아데닌 DNA 글리코실레이즈]-[CRISPR 효소]-C말단; N말단-[아데노신 디아미네이즈]-[알킬아데닌 DNA 글리코실레이즈]-[연결 도메인]-[CRISPR 효소]-C말단; 또는 N말단-[아데노신 디아미네이즈]-[연결 도메인]-[알킬아데닌 DNA 글리코실레이즈]-[연결 도메인]-[CRISPR 효소]-C말단 순으로 구성될 수 있다.
일 구현예로 시토신 치환 융합단백질이 제공될 수 있다.
시토신 치환 융합단백질 또는 이를 암호화하는 핵산으로서,
(a) CRISPR 효소 또는 이의 변이체;
(b) 시티딘 디아미네이즈(cytidine deaminase); 및
(c) 우라실 DNA 글리코실레이즈(Uracil DNA glycosylase) 또는 이의 변이체를 포함하고,
이 때, 상기 단일염기 치환 융합단백질은 타겟 핵산서열 내 하나 이상의 뉴클레오타이드에 포함된 시토신을 임의의 염기로의 치환을 유도하는 시토신 치환 융합단백질 또는 이를 암호화하는 핵산일 수 있다.
상기 시토신 염기 치환 단백질은 N말단-[CRISPR 효소]-[시티딘 디아미네이즈]-[우라실 DNA 글리코실레이즈]-C말단 순으로 구성될 수 있다.
상기 시토신 염기 치환 단백질은 N말단-[우라실 DNA 글리코실레이즈]-[CRISPR 효소]-[시티딘 디아미네이즈]-C말단 순으로 구성될 수 있다.
상기 시토신 염기 치환 단백질은 N말단-[우라실 DNA 글리코실레이즈]-[시티딘 디아미네이즈]-[CRISPR 효소]-C말단 순으로 구성될 수 있다.
상기 시토신 염기 치환 단백질은 N말단-[시티딘 디아미네이즈]-[CRISPR 효소]-[우라실 DNA 글리코실레이즈]-C말단 순으로 구성될 수 있다.
상기 시토신 염기 치환 단백질은 N말단-[CRISPR 효소]-[우라실 DNA 글리코실레이즈]-[시티딘 디아미네이즈]-C말단 순으로 구성될 수 있다.
상기 시토신 염기 치환 단백질은 N말단-[시티딘 디아미네이즈]-[우라실 DNA 글리코실레이즈]-[CRISPR 효소]-C말단 순으로 구성될 수 있다.
상기 시토신 염기 치환 단백질은 추가로 연결 도메인을 더 포함할 수 있다.
일 예로, 상기 연결 도메인은 CRISPR 효소 및 시티딘 디아미네이즈; 시티딘 디아미네이즈 및 우라실 DNA 글리코실레이즈; 및/또는 CRISPR 효소 및 우라실 DNA 글리코실레이즈를 작동 가능하게 연결하는 도메인으로, CRISPR 효소, 시티딘 디아미네이즈 및 우라실 DNA 글리코실레이즈가 각자의 기능이 활성되도록 연결시켜주는 도메인일 수 있다.
일 예로, 상기 연결 도메인은 CRISPR 효소, 시티딘 디아미네이즈 및 우라실 DNA 글리코실레이즈의 기능 활성 및/또는 구조에 어떠한 영향을 미치지 않는 아미노산, 펩타이드 또는 폴리펩타이드일 수 있다.
일 예로, 상기 시토신 염기 치환 도메인은 N말단-[CRISPR 효소]-[연결 도메인]-[시티딘 디아미네이즈]-[우라실 DNA 글리코실레이즈]-C말단; N말단-[CRISPR 효소]-[시티딘 디아미네이즈]-[연결 도메인]-[우라실 DNA 글리코실레이즈]-C말단; 또는 N말단-[CRISPR 효소]-[연결 도메인]-[시티딘 디아미네이즈]-[연결 도메인]-[우라실 DNA 글리코실레이즈]-C말단 순으로 구성될 수 있다.
일 예로, 상기 시토신 염기 치환 단백질은 N말단-[우라실 DNA 글리코실레이즈]-[연결 도메인]-[CRISPR 효소]-[시티딘 디아미네이즈]-C말단; N말단-[우라실 DNA 글리코실레이즈]-[CRISPR 효소]-[연결 도메인]-[시티딘 디아미네이즈]-C말단; 또는 N말단-[우라실 DNA 글리코실레이즈]-[연결 도메인]-[CRISPR 효소]-[연결 도메인]-[시티딘 디아미네이즈]-C말단 순으로 구성될 수 있다.
상기 시토신 염기 치환 단백질은 N말단-[우라실 DNA 글리코실레이즈]-[연결 도메인]-[시티딘 디아미네이즈]-[CRISPR 효소]-C말단; N말단-[우라실 DNA 글리코실레이즈]-[시티딘 디아미네이즈]-[연결 도메인]-[CRISPR 효소]-C말단; 또는 N말단-[우라실 DNA 글리코실레이즈]-[연결 도메인]-[시티딘 디아미네이즈]-[연결 도메인]-[CRISPR 효소]-C말단 순으로 구성될 수 있다.
상기 시토신 염기 치환 단백질은 N말단-[시티딘 디아미네이즈]-[연결 도메인]-[CRISPR 효소]-[우라실 DNA 글리코실레이즈]-C말단; N말단-[시티딘 디아미네이즈]-[CRISPR 효소]-[연결 도메인]-[우라실 DNA 글리코실레이즈]-C말단; 또는 N말단-[시티딘 디아미네이즈]-[연결 도메인]-[CRISPR 효소]-[연결 도메인]-[우라실 DNA 글리코실레이즈]-C말단 순으로 구성될 수 있다.
상기 시토신 염기 치환 단백질은 N말단-[CRISPR 효소]-[연결 도메인]-[우라실 DNA 글리코실레이즈]-[시티딘 디아미네이즈]-C말단; N말단-[CRISPR 효소]-[우라실 DNA 글리코실레이즈]-[연결 도메인]-[시티딘 디아미네이즈]-C말단; 또는 N말단-[CRISPR 효소]-[연결 도메인]-[우라실 DNA 글리코실레이즈]-[연결 도메인]-[시티딘 디아미네이즈]-C말단 순으로 구성될 수 있다.
상기 시토신 염기 변형 단백질은 N말단-[시티딘 디아미네이즈]-[연결 도메인]-[우라실 DNA 글리코실레이즈]-[CRISPR 효소]-C말단; N말단-[시티딘 디아미네이즈]-[우라실 DNA 글리코실레이즈]-[연결 도메인]-[CRISPR 효소]-C말단; 또는 N말단-[시티딘 디아미네이즈]-[연결 도메인]-[우라실 DNA 글리코실레이즈]-[연결 도메인]-[CRISPR 효소]-C말단 순으로 구성될 수 있다.
[단일염기 치환 단백질의 제2 태양 - 단일염기 치환 복합체]
본 명세서에 의해 개시되는 단일염기 치환 단백질의 일 태양은 단일염기 치환 복합체이다.
일 예로, 단일염기 치환 복합체로서,
(a) CRISPR 효소 또는 이의 변이체;
(b) 디아미네이즈(deaminase);
(c) DNA 글리코실레이즈(DNA glycosylase); 및
(d) 2 이상의 결합도메인을 포함하고,
이 때, 상기 단일염기 치환 융합단백질은 타겟 핵산서열 내 하나 이상의 뉴클레오타이드에 포함된 시토신 또는 아데닌을 임의의 염기로의 치환을 유도하는 단일염기 치환 복합체일 수 있다.
일 예로, 상기 단일염기 치환 복합체는 상기 CRISPR 효소가 2 이상의 결합도메인과 연결된 것을 특징으로 할 수 있다.
이 때, 상기 CRISPR 효소에 연결된 상기 2 이상의 결합도메인 중 어느 하나는 상기 (b) 디아미네이즈에 연결된 결합도메인과 페어이고 다른 하나는 상기 (c) DNA 글리코실레이즈에 연결된 결합도메인과 페어일 수 있다. 이 때, 상기 페어 사이의 결합으로 인하여 상기 구성요소 (a) CRISPR 효소, (b) 디아미네이즈 및 (c) DNA 글리코실레이즈가 복합체를 형성하여 단일염기 치환 복합체가 제공될 수 있다.
일 구체예로, 상기 2 이상의 결합도메인과 연결된 CRISPR 효소는, [결합 도메인(functional domain)]n-CRISPR 효소의 구성을 가질 수 있다(n은 2 이상의 정수일 수 있다.).
예를 들어,
Figure pat00010
일 수 있다.
이 때, 상기 GCN4는 CRISPR 효소와 연결된 결합도메인의 일 예시이고, 다른 종류의 결합도메인이 연결될 수 있다. 이에 한정되지 않는다.
이 때, 상기 CRISPR 효소는 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 10개 이상의 결합도메인과 연결될 수 있다.
다른 예로,
Figure pat00011
일 수 있다.
이 때, 상기 GCN4는 CRISPR 효소와 연결된 결합도메인의 일 예시이고, 다른 종류의 결합도메인이 연결될 수 있다. 이에 한정되지 않는다.
이 때, 상기 CRISPR 효소는 양 C말단 및 N 말단에 각각 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 10개 이상의 결합도메인과 연결될 수 있다.
본 출원에서 제공되는 단일염기 치환 복합체는,일 구체예로,
하기의 (a), (b) 및 (c) 구성 내 결합도메인간 특이적으로 결합하여 제공될 수 있다.
(a)
Figure pat00012
(b)
Figure pat00013
(c)
Figure pat00014
이 때, 상기 (a)의 결합도메인 GCN4, 상기 (b)의 결합도메인 scFv, 및 상기 (c)의 결합도메인 scFv는 하나의 예시이며 이에 제한되지 않는다. 상기 APOBEC 대신 아데노신 디아미네이즈로 대체될 수 있고, 상기 UNG 대신 알킬아데닌 DNA 글리코실레이즈로 대체될 수 있다.
이 때, 상기 하나의 (a)에 복수 개의 상기 (b) 및/또는 복수 개의 상기 (c)가 결합될 수 있다.
이 때, 상기 복수란 2, 3, 4, 5, 6, 7, 8, 9 또는 10 이상의 정수를 의미한다.
본 출원에서 제공되는 단일염기 치환 복합체는,
일 구체예로,
하기의 (a), (b) 및 (c) 구성 내 결합도메인간 특이적으로 결합하여 제공될 수 있다.
(a)
Figure pat00015
(b)
Figure pat00016
(c)
Figure pat00017
이 때, 상기 (a)의 결합도메인 GCN4, 상기 (b)의 결합도메인 scFv, 및 상기 (c)의 결합도메인 scFv는 하나의 예시이며 이에 제한되지 않는다. 상기 APOBEC 대신 아데노신 디아미네이즈로 대체될 수 있고, 상기 UNG 대신 알킬아데닌 DNA 글리코실레이즈로 대체될 수 있다.
이 때, 상기 하나의 (a)에 복수 개의 상기 (b) 및/또는 복수 개의 상기 (c)가 결합될 수 있다.
이 때, 상기 복수란 2, 3, 4, 5, 6, 7, 8, 9 또는 10 이상의 정수를 의미한다.
일 예로, 상기 단일염기 치환 복합체는 상기 디아미네이즈가 2 이상의 결합도메인과 연결된 것을 특징으로 할 수 있다. 이 때, 상기 디아미네이즈에 연결된 상기 2 이상의 결합도메인 각각은 상기 (a) CRISPR 효소에 연결된 결합도메인 및 상기 (c) DNA 글리코실레이즈에 연결된 결합도메인과 페어이다. 이 때, 상기 페어 사이의 결합으로 인하여 상기 구성요소 (a) CRISPR 효소, (b) 디아미네이즈 및 (c) DNA 글리코실레이즈가 복합체를 형성하여 단일염기 치환 복합체가 제공될 수 있다.
일 예로, 상기 단일염기 치환 복합체는 상기 DNA 글리코실레이즈가 2 이상의 결합도메인과 연결된 것을 특징으로 할 수 있다. 이 때, 상기 DNA 글리코실레이즈에 연결된 상기 2 이상의 결합도메인 각각은 상기 (a) CRISPR 효소에 연결된 결합도메인 및 상기 (b) 디아미네이즈에 연결된 결합도메인과 페어이다. 이 때, 상기 페어 사이의 결합으로 인하여 상기 구성요소 (a) CRISPR 효소, (b) 디아미네이즈 및 (c) DNA 글리코실레이즈가 복합체를 형성하여 단일염기 치환 복합체가 제공될 수 있다.
일 예로, 상기 단일염기 치환 복합체는 상기 CRISPR 효소가 2 이상의 결합도메인과 연결되고, 상기 디아미네이즈 및 상기 DNA 글리코실레이즈가 연결된 융합단백질 형태로 존재하는 것을 특징으로 할 수 있다. 이 때, 상기 융합단백질은 1 이상의 결합도메인을 포함한다. 일 구체예로, 상기 CRISPR 효소에 연결된 어느 결합도메인은 상기 융합단백질의 결합도메인과 페어이다. 이 때, 상기 페어 사이의 결합으로 인하여 상기 구성요소 (a) CRISPR 효소, (b) 디아미네이즈 및 (c) DNA 글리코실레이즈가 복합체를 형성하여 단일염기 치환 복합체가 제공될 수 있다.
본 출원에서 제공되는 단일염기 치환 복합체는,
일 구체예로,
하기 (a)의 결합도메인 및 하기 (b)의 결합도메인간 특이적으로 결합하여 복합체를 형성한 것일 수 있다.
(a)
Figure pat00018
Figure pat00019
이 때, 상기 (a)의 결합도메인 GCN4 및 상기 (b)의 결합도메인 scFv는 하나의 예시이며 이에 제한되지 않는다. 상기 APOBEC 대신 아데노신 디아미네이즈 또는 다른 종류의 시티딘 디아미네이즈로 대체될 수 있고, 상기 UNG 대신 알킬아데닌 DNA 글리코실레이즈로 대체될 수 있다.
이 때, 상기 하나의 (a)에 복수 개의 상기 (b)가 결합될 수 있다.
이 때, 상기 복수란 2, 3, 4, 5, 6, 7, 8, 9 또는 10 이상의 정수를 의미한다.
본 출원에서 제공되는 단일염기 치환 복합체는,
일 구체예로,
하기 (a)의 결합도메인 및 하기 (c)의 결합도메인간 특이적으로 결합하여 복합체를 형성한 것일 수 있다.
(a)
Figure pat00020
Figure pat00021
이 때, 상기 (a)의 결합도메인 GCN4 및 상기 (c)의 결합도메인 scFv는 하나의 예시이며 이에 제한되지 않는다. 상기 APOBEC 대신 아데노신 디아미네이즈 또는 다른 종류의 시티딘 디아미네이즈로 대체될 수 있고, 상기 UNG 대신 알킬아데닌 DNA 글리코실레이즈로 대체될 수 있다.
이 때, 상기 하나의 (a)에 복수 개의 상기 (b)가 결합될 수 있다.
이 때, 상기 복수란 2, 3, 4, 5, 6, 7, 8, 9 또는 10 이상의 정수를 의미한다.
본 출원에서 제공되는 단일염기 치환 복합체는,
일 구체예로,
하기 (a)의 결합도메인 및 하기 (b)의 결합도메인간 특이적으로 결합하여 복합체를 형성한 것일 수 있다.
(a)
Figure pat00022
Figure pat00023
이 때, 상기 (a)의 결합도메인 GCN4 및 상기 (b)의 결합도메인 scFv는 하나의 예시이며 이에 제한되지 않는다. 상기 APOBEC 대신 아데노신 디아미네이즈 또는 다른 종류의 시티딘 디아미네이즈로 대체될 수 있고, 상기 UNG 대신 알킬아데닌 DNA 글리코실레이즈로 대체될 수 있다.
이 때, 상기 하나의 (a)에 복수 개의 상기 (b)가 결합될 수 있다.
이 때, 상기 복수란 2, 3, 4, 5, 6, 7, 8, 9 또는 10 이상의 정수를 의미한다.
본 출원에서 제공되는 단일염기 치환 복합체는,
일 구체예로,
하기 (a)의 결합도메인 및 하기 (c)의 결합도메인간 특이적으로 결합하여 복합체를 형성한 것일 수 있다.
(a)
Figure pat00024
Figure pat00025
이 때, 상기 (a)의 결합도메인 GCN4 및 상기 (b)의 결합도메인 scFv는 하나의 예시이며 이에 제한되지 않는다. 상기 APOBEC 대신 아데노신 디아미네이즈 또는 다른 종류의 시티딘 디아미네이즈로 대체될 수 있고, 상기 UNG 대신 알킬아데닌 DNA 글리코실레이즈로 대체될 수 있다.
이 때, 상기 하나의 (a)에 복수 개의 상기 (b)가 결합될 수 있다.
이 때, 상기 복수란 2, 3, 4, 5, 6, 7, 8, 9 또는 10 이상의 정수를 의미한다.
일 예로, 상기 단일염기 치환 복합체는 상기 디아미네이즈 가 2 이상의 결합도메인과 연결되고, 상기 CRISPR 효소 및 상기 DNA 글리코실레이즈가 연결된 융합단백질 형태로 존재하는 것을 특징으로 할 수 있다. 이 때, 상기 융합단백질은 1 이상의 결합도메인을 포함한다. 일 구체예로, 상기 디아미네이즈에 연결된 어느 결합도메인은 상기 융합단백질의 결합도메인과 페어이다. 이 때, 상기 페어 사이의 결합으로 인하여 상기 구성요소 (a) CRISPR 효소, (b) 디아미네이즈 및 (c) DNA 글리코실레이즈가 복합체를 형성하여 단일염기 치환 복합체가 제공될 수 있다.
일 예로, 상기 단일염기 치환 복합체는 상기 DNA 글리코실레이즈가 2 이상의 결합도메인과 연결되고, 상기 디아미네이즈 및 상기 CRISPR 효소가 연결된 융합단백질 형태로 존재하는 것을 특징으로 할 수 있다. 이 때, 상기 융합단백질은 1 이상의 결합도메인을 포함한다. 일 구체예로, 상기 DNA 글리코실레이즈에 연결된 어느 결합도메인은 상기 융합단백질의 결합도메인과 페어이다. 이 때, 상기 페어 사이의 결합으로 인하여 상기 구성요소 (a) CRISPR 효소, (b) 디아미네이즈 및 (c) DNA 글리코실레이즈가 복합체를 형성하여 단일염기 치환 복합체가 제공될 수 있다.
일 예로, 단일염기 치환 복합체는 (i) 상기 CRISPR 효소, 상기 디아미네이즈, 및 상기 DNA 글리코실레이즈 중 선택된 두 개의 구성과 제1 결합도메인을 포함하는 제1 융합단백질, 및 (ii) 상기 선택되지 않은 나머지 하나의 구성과 제2 결합도메인을 포함하는 제2 융합단백질을 포함하고, 이 때, 제1 결합도메인 및 제2 결합도메인은 상호작용하는 페어이며, 이 때, 상기 페어에 의하여 복합체를 형성함을 특징으로 하는 단일염기 치환 복합체일 수 있다. 이 때, 상기 제2 융합단백질은 제2 결합도메인 외에 복수의 결합도메인을 더 포함하는 것일 수 있다.
일 구체예로, 상기 단일염기 치환 복합체는 (i) 상기 디아미네이즈, 상기 DNA 글리코실레이즈 및 제1 결합도메인을 포함하는 제1 융합단백질, 및 (ii) CRISPR 효소 및 제2 결합도메인을 포함하는 제2 융합단백질을 포함함을 특징으로 하는 단일염기 치환 복합체일 수 있다. 이 때, 상기 제2 융합단백질은 제2 결합도메인 외에 복수의 결합도메인을 더 포함하는 것일 수 있다. 이 때, 상기 제1 결합도메인은 single chain variable fragment (scFv)이고, 상기 제2 융합단백질은 GCN4 peptide일 수 있다. 이 때, 상기 scFv는 상기 GCN4 peptide와의 상호작용을 통해서 단일염기 치환 복합체를 제공할 수 있다.
일 구체예로, 상기 단일염기 치환 복합체는 (i) 상기 디아미네이즈, CRISPR 효소 및 제1 결합도메인을 포함하는 제1 융합단백질, 및 (ii) DNA 글리코실레이즈 및 제2 결합도메인을 포함하는 제2 융합단백질을 포함함을 특징으로 하는 단일염기 치환 복합체일 수 있다. 이 때, 상기 제2 융합단백질은 제2 결합도메인 외에 복수의 결합도메인을 더 포함하는 것일 수 있다. 이 때, 상기 제1 결합도메인은 single chain variable fragment (scFv)이고, 상기 제2 융합단백질은 GCN4 peptide일 수 있다. 이 때, 상기 scFv는 상기 GCN4 peptide와의 상호작용을 통해서 단일염기 치환 복합체를 제공할 수 있다.
일 구체예로, 상기 단일염기 치환 복합체는 (i) 상기 CRISPR 효소, 상기 DNA 글리코실레이즈 및 제1 결합도메인을 포함하는 제1 융합단백질, 및 (ii) 상기 디아미네이즈 및 제2 결합도메인을 포함하는 제2 융합단백질을 포함함을 특징으로 하는 단일염기 치환 복합체일 수 있다. 이 때, 상기 제2 융합단백질은 제2 결합도메인 외에 복수의 결합도메인을 더 포함하는 것일 수 있다. 이 때, 상기 제1 결합도메인은 single chain variable fragment (scFv)이고, 상기 제2 융합단백질은 GCN4 peptide일 수 있다. 이 때, 상기 scFv는 상기 GCN4 peptide와의 상호작용을 통해서 단일염기 치환 복합체를 제공할 수 있다.
일 예로, CRISPR 효소, 상기 디아미네이즈, 및 상기 DNA 글리코실레이즈 중 어느 하나(one)는 제1 결합도메인 및 제2 결합도메인에 연결되고, 이 때, 상기 제1 결합도메인은 다른 구성(another)의 결합도메인과 상호작용하는 페어이고, 이 때, 상기 제2 결합도메인은 나머지 구성(the other)의 결합도메인과 상호작용하는 페어이며, 이 때, 상기 페어들에 의하여 단일염기 치환 복합체를 제공할 수 있다.
일 구현예로, CRISPR 효소는 제1 결합도메인 및 제2 결합도메인에 연결되고, 이 때, 상기 제1 결합도메인은 상기 디아미네이즈의 결합도메인과 상호작용을 하는 페어이고, 상기 제2 결합도메인은 DNA 글리코실레이즈의 결합도메인과 상호작용을 하는 페어이며, 이 때, 상기 페어들에 의하여 단일염기 치환 복합체를 제공할 수 있다.
일 구현예로, 디아미네이즈는 제1 결합도메인 및 제2 결합도메인에 연결되고, 이 때, 상기 제1 결합도메인은 상기 CRISPR 효소의 결합도메인과 상호작용을 하는 페어이고, 상기 제2 결합도메인은 DNA 글리코실레이즈의 결합도메인과 상호작용을 하는 페어이며, 이 때, 상기 페어들에 의하여 단일염기 치환 복합체를 제공할 수 있다.
일 구현예로, DNA 글리코실레이즈 는 제1 결합도메인 및 제2 결합도메인에 연결되고, 이 때, 상기 제1 결합도메인은 상기 디아미네이즈의 결합도메인과 상호작용을 하는 페어이고, 상기 제2 결합도메인은 CRISPR 효소의 결합도메인과 상호작용을 하는 페어이며, 이 때, 상기 페어들에 의하여 단일염기 치환 복합체를 제공할 수 있다.
이 때, 결합 도메인은 FRB 및 FKBP dimerization domains 중 하나; 인테인(intein); ERT 및 VPR domains 중 하나; GCN4 peptide 및 single chain variable fragment (scFv) 중 하나 또는 이량이질체(heterodimer)를 형성하는 도메인일 수 있다.
이 때, 상기 페어는 다음 중 어느 하나의 세트일 수 있다:
FRB 및 FKBP dimerization domains;
제1 인테인(intein) 및 제2 인테인;
ERT 및 VPR domains;
GCN4 peptide 및 single chain variable fragment (scFv);
이량이질체(heterodimer)를 형성하는 제1 도메인 및 제2 도메인.
본 출원은 시토신 치환 복합체가 제공될 수 있다.
일 예로, 상기 디아미네이즈는 시티딘 디아미네이즈(cytidine deaminase)이고, 및 상기 DNA 글리코실레이즈는 우라실-DNA 글리코실레이즈(Uracil-DNA glycosylase) 또는 이의 변이체이고, 이 때, 상기 단일염기 치환 융합단백질은 타겟 핵산서열 내 하나 이상의 뉴클레오타이드에 포함된 시토신을 임의의 염기로의 치환을 유도하는 단일염기 치환 복합체일 수 있다.
일 예로, 상기 시티딘 디아미네이즈는 APOBEC, AID(activation-induced cytidine deaminase) 또는 이의 변이체인 것을 특징으로 하는 단일염기 치환 복합체일 수 있다.
일 예로, CRISPR 효소, 시티딘 디아미네이즈, 및 우라실 DNA 글리코실레이즈 중 어느 하나(one)는 제1 결합도메인 및 제2 결합도메인에 연결되고, 이 때, 상기 제1 결합도메인은 다른 구성(another)의 결합도메인과 상호작용하는 페어이고, 이 때, 상기 제2 결합도메인은 나머지 구성(the other)의 결합도메인과 상호작용하는 페어이며, 이 때, 상기 페어들에 의하여 단일염기 치환 복합체를 제공할 수 있다.
일 구현예로, CRISPR 효소는 제1 결합도메인 및 제2 결합도메인에 연결되고, 이 때, 상기 제1 결합도메인은 상기 디아미네이즈의 결합도메인과 상호작용을 하는 페어이고, 상기 제2 결합도메인은 DNA 글리코실레이즈의 결합도메인과 상호작용을 하는 페어이며, 이 때, 상기 페어들에 의하여 단일염기 치환 복합체를 제공할 수 있다.
일 예로, 단일염기 치환 복합체는 (i) CRISPR 효소, 시티딘 디아미네이즈, 및 우라실 DNA 글리코실레이즈 중 선택된 두 개의 구성과 제1 결합도메인을 포함하는 제1 융합단백질, 및 (ii) 상기 선택되지 않은 나머지 하나의 구성과 제2 결합도메인을 포함하는 제2 융합단백질을 포함하고, 이 때, 제1 결합도메인 및 제2 결합도메인은 상호작용하는 페어이며, 이 때, 상기 페어에 의하여 복합체를 형성함을 특징으로 하는 단일염기 치환 복합체일 수 있다. 이 때, 상기 제2 융합단백질은 제2 결합도메인 외에 복수의 결합도메인을 더 포함하는 것일 수 있다.
이 때, 상기 페어는 다음 중 어느 하나의 세트일 수 있다:
FRB 및 FKBP dimerization domains;
제1 인테인(intein) 및 제2 인테인;
ERT 및 VPR domains;
GCN4 peptide 및 single chain variable fragment (scFv);
이량이질체(heterodimer)를 형성하는 제1 도메인 및 제2 도메인.
본 출원은 아데닌 치환 복합체가 제공될 수 있다.
일 예로, 상기 디아미네이즈는 아데노신 디아미네이즈이고, 및 상기 DNA 글리코실레이즈는 알킬아데닌-DNA 글리코실레이즈 또는 이의 변이체이고, 이 때, 상기 단일염기 치환 융합단백질은 타겟 핵산서열 내 하나 이상의 뉴클레오타이드에 포함된 아데닌을 임의의 염기로의 치환을 유도하는 단일염기 치환 복합체일 수 있다.
일 예로, 상기 아데닌시티딘 디아미네이즈는 TadA, Tad2p, ADA, ADA1, ADA2, ADAR2, ADAT2, ADAT3 또는 이의 변이체인 것을 특징으로 하는 단일염기 치환 복합체일 수 있다.
일 예로, CRISPR 효소, 아데노신 디아미네이즈, 및 알킬아데닌 DNA 글리코실레이즈 중 어느 하나(one)는 제1 결합도메인 및 제2 결합도메인에 연결되고, 이 때, 상기 제1 결합도메인은 다른 구성(another)의 결합도메인과 상호작용하는 페어이고, 이 때, 상기 제2 결합도메인은 나머지 구성(the other)의 결합도메인과 상호작용하는 페어이며, 이 때, 상기 페어들에 의하여 단일염기 치환 복합체를 제공할 수 있다.
일 구현예로, CRISPR 효소는 제1 결합도메인 및 제2 결합도메인에 연결되고, 이 때, 상기 제1 결합도메인은 상기 디아미네이즈의 결합도메인과 상호작용을 하는 페어이고, 상기 제2 결합도메인은 DNA 글리코실레이즈의 결합도메인과 상호작용을 하는 페어이며, 이 때, 상기 페어들에 의하여 단일염기 치환 복합체를 제공할 수 있다.
일 예로, 단일염기 치환 복합체는 (i) CRISPR 효소, 아데노신 디아미네이즈, 및 알킬아데닌 DNA 글리코실레이즈 중 선택된 두 개의 구성과 제1 결합도메인을 포함하는 제1 융합단백질, 및 (ii) 상기 선택되지 않은 나머지 하나의 구성과 제2 결합도메인을 포함하는 제2 융합단백질을 포함하고, 이 때, 제1 결합도메인 및 제2 결합도메인은 상호작용하는 페어이며, 이 때, 상기 페어에 의하여 복합체를 형성함을 특징으로 하는 단일염기 치환 복합체일 수 있다. 이 때, 상기 제2 융합단백질은 제2 결합도메인 외에 복수의 결합도메인을 더 포함하는 것일 수 있다.
이 때, 상기 페어는 다음 중 어느 하나의 세트일 수 있다:
FRB 및 FKBP dimerization domains;
제1 인테인(intein) 및 제2 인테인;
ERT 및 VPR domains;
GCN4 peptide 및 single chain variable fragment (scFv);
이량이질체(heterodimer)를 형성하는 제1 도메인 및 제2 도메인.
본 명세서에 의해 개시되는 발명의 일 태양은 염기 치환용 조성물 및 이를 이용하는 방법이다.
단일염기 치환 조성물은 유전자 내에 하나 이상의 뉴클레오타이드의 염기를 인위적으로 변형시키는데 이용될 수 있다.
“인위적으로 변형된(artificially modified or artificially engineered)”이라는 용어는 자연상태에서 일어나는 존재 그대로의 상태가 아닌, 인위적으로 변형을 가한 상태를 의미한다. 예를 들어, 인위적으로 변형을 가한 상태는 야생형 유전자에 돌연변이를 인위적으로 발생시키도록 하는 변형일 수 있다. 이하에서 비자연적인 인위적으로 변형된 다형현상 의존 유전자는 인위적인 다형현상 의존 유전자라는 용어와 혼용되어 사용될 수 있다.
상기 염기 변형용 조성물은 추가로 가이드 RNA 또는 이를 암호화하는 핵산을 더 포함할 수 있다.
일 예로 (a) 가이드 RNA 또는 이를 암호화하는 핵산, 및 (b) 단일염기 치환 융합단백질 또는 이를 암호화하는 핵산, 또는 단일염기 치환 복합체, 이 때, 상기 가이드 RNA는 타겟 핵산서열 과 상보적으로 결합하고, 이 때, 상기 가이드 RNA와 결합되는 타겟 핵산서열은 15 내지 25bp이고, 이 때, 상기 단일염기 치환 융합단백질 또는 상기 단일염기 치환 복합체는 상기 타겟 핵산서열을 포함하는 타겟 영역(region) 내에 존재하는 하나 이상의 시토신 또는 아데닌의 임의의 염기로의 치환을 유도함을 포함하는 단일염기 치환 조성물을 제공한다.
[염기 치환 조성물의 제1 구성 - 가이드 RNA]
염기 치환 조성물은 가이드 RNA 또는 이를 암호화하는 핵산을 포함할 수 있다.
가이드 RNA(gRNA)는 타겟 유전자 또는 핵산에 대한 gRNA-CRISPR 효소 복합체, 즉, CRISPR 복합체를 특이적으로 표적시킬 수 있는 RNA를 지칭한다. 또한, 상기 gRNA는 타겟 유전자 또는 핵산 특이적 RNA를 의미하며, CRISPR 효소과 결합하여 CRISPR 효소를 타겟 유전자 또는 핵산으로 인도할 수 있다.
가이드 RNA는 타겟 유전자 또는 핵산의 이중 가닥 중 어느 하나 가닥의 일부 서열에 상보적인 결합을 할 수 있다. 상기 일부 서열은 타겟 핵산서열을 지칭할 수 있다.
가이드 RNA는 타겟 유전자 또는 핵산의 특정 뉴클레오타이드서열을 가지는 위치로 가이드 RNA-CRISPR 효소 복합체를 유도하는 기능을 수행할 수 있다.
가이드 RNA는 타겟 유전자, 타겟 영역 또는 타겟 핵산서열에 대한 gRNA-CRISPR 효소 복합체, 즉, CRISPR 복합체를 특이적으로 표적시킬 수 있는 RNA를 지칭한다. 또한, 상기 gRNA는 타겟 유전자 또는 핵산 특이적 RNA를 의미하며, CRISPR 효소과 결합하여 CRISPR 효소를 타겟 유전자, 타겟 영역 또는 타겟 핵산서열으로 인도할 수 있다.
가이드 RNA는 단일가닥 가이드 RNA(단일 RNA 분자; single gRNA; sgRNA); 또는 이중가닥 가이드 RNA (하나 초과의 통상적으로 2개의 별개의 RNA 분자를 포함함)로서 지칭될 수 있다.
가이드 RNA는 상기 대상서열과 상보적으로 결합하는 부위(이하 가이드 부위로 칭함)와 Cas단백질과 복합체를 형성하는데 관여하는 부위(이하, 복합체 형성 부위로 칭함)를 포함한다.
일 예에서, 상기 가이드 RNA는 SpCas9 단백질과 상호작용하며, SEQ ID NO.48 내지 81 중 선택되는 어느 하나일 수 있다.
다른 예에서, 상기 가이드 RNA는 CjCas9 단백질과 상호작용하며, SEQ ID NO.82 내지 92중 선택되는 어느 하나를 포함할 수 있다.
NO. Name sequence (5'→3')
SEQ ID NO. 48 Sp20-viHBV-B-#10G GUAACACGAGCAGGGGUCCU
SEQ ID NO. 49 Sp20-viHBV-B-#11G CCCCGCCUGUAACACGAGCA
SEQ ID NO. 50 Sp20-viHBV-B-#12G ACCCCGCCUGUAACACGAGC
SEQ ID NO. 51 Sp20-viHBV-B-#13G AGGACCCCUGCUCGUGUUAC
SEQ ID NO. 52 Sp20-viHBV-B-#14G ACCCCUGCUCGUGUUACAGG
SEQ ID NO. 53 Sp20-viHBV-B-#17G CACCACGAGUCUAGACUCUG
SEQ ID NO. 54 Sp20-viHBV-B-#20G GGACUUCUCUCAAUUUUCUA
SEQ ID NO. 55 Sp20-viHBV-B-#52G CCUACGAACCACUGAACAAA
SEQ ID NO. 56 Sp20-viHBV-B-#53G CCAUUUGUUCAGUGGUUCGU
SEQ ID NO. 57 Sp20-viHBV-B-#54G CAUUUGUUCAGUGGUUCGUA
SEQ ID NO. 58 Sp20-viHBV-B-#89G GGGUUGCGUCAGCAAACACU
SEQ ID NO. 59 Sp20-viHBV-B-#90G UUUGCUGACGCAACCCCCAC
SEQ ID NO. 60 Sp20-viHBV-B-#101G UCCGCAGUAUGGAUCGGCAG
SEQ ID NO. 61 Sp20-viHBV-B-#102G AGGAGUUCCGCAGUAUGGAU
SEQ ID NO. 62 Sp20-viHBV-B-#103G UCCUCUGCCGAUCCAUACUG
SEQ ID NO. 63 Sp20-viHBV-B-#113G CGUCCCGCGCAGGAUCCAGU
SEQ ID NO. 64 Sp20-viHBV-B-#117G CCGCGGGAUUCAGCGCCGAC
SEQ ID NO. 65 Sp20-viHBV-B-#118G UCCGCGGGAUUCAGCGCCGA
SEQ ID NO. 66 Sp20-viHBV-B-#119G CCCGUCGGCGCUGAAUCCCG
SEQ ID NO. 67 Sp20-viHBV-B-#138G GUAAAGAGAGGUGCGCCCCG
SEQ ID NO. 68 Sp20-viHBV-B-#140G GGGGCGCACCUCUCUUUACG
SEQ ID NO. 69 Sp20-viHBV-B-#142G GAAGCGAAGUGCACACGGUC
SEQ ID NO. 70 Sp20-viHBV-B-#143G GGUCUCCAUGCGACGUGCAG
SEQ ID NO. 71 Sp20-viHBV-B-#154G AAUGUCAACGACCGACCUUG
SEQ ID NO. 72 Sp20-viHBV-B-#159G AGGAGGCUGUAGGCAUAAAU
SEQ ID NO. 73 Sp20-viHBV-B-#186G CGGAAGUGUUGAUAAGAUAG
SEQ ID NO. 74 Sp20-viHBV-B-#187G CCGGAAGUGUUGAUAAGAUA
SEQ ID NO. 75 Sp20-viHBV-B-#193G GCGAGGGAGUUCUUCUUCUA
SEQ ID NO. 76 Sp20-viHBV-B-#194G GACCUUCGUCUGCGAGGCGA
SEQ ID NO. 77 Sp20-viHBV-B-#196G GAUUGAGACCUUCGUCUGCG
SEQ ID NO. 78 Sp20-viHBV-B-#197G CUCCCUCGCCUCGCAGACGA
SEQ ID NO. 79 Sp20-viHBV-B-#198G GAUUGAGAUCUUCUGCGACG
SEQ ID NO. 80 Sp20-viHBV-B-#199G GUCGCAGAAGAUCUCAAUCU
SEQ ID NO. 81 Sp20-viHBV-B-#200G UCGCAGAAGAUCUCAAUCUC
SEQ ID NO. 82 Cj22-viHBV-B-#06G UGUCAACAAGAAAAACCCCGCC
SEQ ID NO. 83 Cj22-viHBV-B-#20G AAGCCCUACGAACCACUGAACA
SEQ ID NO. 84 Cj22-viHBV-B-#23G UUACCAAUUUUCUUUUGUCUUU
SEQ ID NO. 85 Cj22-viHBV-B-#40G ACGUCCCGCGCAGGAUCCAGUU
SEQ ID NO. 86 Cj22-viHBV-B-#44G GUGCACACGGUCCGGCAGAUGA
SEQ ID NO. 87 Cj22-viHBV-B-#45G GUGCCUUCUCAUCUGCCGGACC
SEQ ID NO. 88 Cj22-viHBV-B-#46G CGACGUGCAGAGGUGAAGCGAA
SEQ ID NO. 89 Cj22-viHBV-B-#47G UGCGACGUGCAGAGGUGAAGCG
SEQ ID NO. 90 Cj22-viHBV-B-#48G GACCGUGUGCACUUCGCUUCAC
SEQ ID NO. 91 Cj22-viHBV-B-#57G AUGUCCAUGCCCCAAAGCCACC
SEQ ID NO. 92 Cj22-viHBV-B-#67G GACCACCAAAUGCCCCUAUCUU
이 때, 상기 복합체 형성 부위는 Cas9 단백질 유래 미생물의 종류에 따라 결정될 수 있다. 예를 들어, SpCas9단백질과 상호작용하는 가이드 RNA일 경우, 상기 복합체 형성부위는 5'-GUUUUAGUCCCUGAAAAGGGACUAAAAUAAAGAGUUUGCGGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'(서열번호 45)를 포함할 수 있고, CjCas9단백질과 상호작용하는 가이드 RNA일 경우, 5'-GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'(서열번호 46)를 포함할 수 있다.
상기 PAM(proto-spacer-adjacent Motif)서열로서, spCas9 단백질을 사용하는 경우 NGG(N은 A, T, C 또는 G임)가 고려되고, cjCas9 단백질을 사용하는 경우 NNNNRYAC(서열번호 47)(N은 각각 독립적으로 A, T, C 또는 G이고, R은 A또는 G이고, Y는 C 또는 T임)가 고려된다.
상기 조성물은 가이드 RNA를 1개 또는 복수개 포함할 수 있다.
[염기 치환 조성물의 제2 구성 - 단일염기 치환 단백질]
염기 치환 조성물은 단일염기 치환 단백질 또는 이를 암호화하는 핵산을 포함할 수 있다.
단일염기 치환 단백질은 전술한 바와 동일하다.
[염기 치환 조성물의 제3 구성 - 벡터]
상기 염기 변형용 조성물은 벡터 형태일 수 있다.
”벡터”는 세포에 유전자 서열을 전달할 수 있다. 전형적으로 “벡터 구조체”, “발현 벡터”, 및 “유전자 전달 벡터”는 관심의 유전자의 발현을 지시할 수 있고, 표적 세포에 유전자 서열을 전달할 수 있는 임의의 핵산 구조체를 의미한다. 따라서, 상기 용어는 클로닝, 및 발현 비히클뿐만 아니라 벡터를 통합하는 것을 포함한다.
이때, 상기 벡터는 바이러스 또는 비바이러스 벡터(예를 들어, 플라스미드)일 수 있다.
이때, 상기 벡터는 하나 이상의 조절/제어 구성요소를 포함할 수 있다.
이때, 상기 조절/제어 구성요소는 포로모터, 인핸서, 인트론, 폴리아데닐화 신호, 코작 공통(Kozak consensus) 서열, 내부 리보솜 유입 부위(internal ribosome entry site, IRES), 스플라이스 억셉터 및/또는 2A 서열을 포함할 수 있다.
상기 프로모터는 RNA 중합효소 II에 의해 인식되는 프로모터일 수 있다.
상기 프로모터는 RNA 중합효소 III에 의해 인식되는 프로모터일 수 있다.
상기 프로모터는 유도성 프로모터일 수 있다.
상기 프로모터는 대상 특이적 프로모터일 수 있다.
상기 프로모터는 바이러스 또는 비바이러스 프로모터일 수 있다.
상기 프로모터는 제어 영역(즉, 가이드 RNA 또는 CRISPR 효소를 암호화하는 핵산서열)에 따라 적합한 프로모터를 이용할 수 있다.
예를 들어, 가이드 RNA를 위해 유용한 프로모터는 H1, EF-1a, tRNA 또는 U6 프로모터일 수 있다. 예를 들어, CRISPR 효소를 위해 유용한 프로모터는 CMV, EF-1a, EFS, MSCV, PGK 또는 CAG 프로모터일 수 있다.
벡터는 바이러스 벡터 또는 재조합 바이러스 벡터일 수 있다.
상기 바이러스는 DNA 바이러스 또는 RNA 바이러스일 수 있다.
이때, 상기 DNA 바이러스는 이중가닥 DNA(dsDNA) 바이러스 또는 단일가닥 DNA(ssDNA) 바이러스 일 수 있다.
이때, 상기 RNA 바이러스는 단일가닥 RNA(ssRNA) 바이러스일 수 있다.
상기 바이러스는 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스(AAV), 백시니아바이러스, 폭스바이러스 또는 단순포진 바이러스일 수 있으나, 이에 제한되지 않는다.
일반적으로 바이러스는 숙주(예를 들면, 세포)를 감염시켜, 숙주 내에 바이러스의 유전정보를 암호화하는 핵산을 도입시키거나 숙주의 게놈 내로 유전정보를 암호화하는 핵산을 삽입시킬 수 있다. 이러한 특징을 가지는 바이러스를 이용하여 대상 내로 가이드 RNA 및/또는 CRISPR 효소를 도입시킬 수 있다. 바이러스를 이용하여 도입된 가이드 RNA 및/또는 CRISPR 효소는 대상(예를 들면, 세포)에서 일시적으로 발현될 수 있다. 또는 바이러스를 이용하여 도입된 가이드 RNA 및/또는 CRISPR 효소는 대상(예를 들면, 세포)에서 장기간(예를 들면, 1주, 2주, 3주, 1개월, 2개월, 3개월, 6개월, 9개월, 1년, 2년 또는 영구적) 지속적으로 발현될 수 있다.
바이러스의 패키징 능력은 적어도 2kb 내지 50kb로 바이러스 종류에 따라 다를 수 있다. 이러한 패키징 능력에 따라 가이드 RNA 또는 CRISPR 효소를 단독으로 포함하는 바이러스 벡터를 설계하거나 가이드 RNA 및 CRISPR 효소를 모두 포함하는 바이러스 벡터를 설계할 수 있다. 또는 가이드 RNA, CRISPR 효소 및 추가 구성요소를 포함하는 바이러스 벡터를 설계할 수 있다.
예를 들어, 레트로바이러스 벡터는 최대 6 내지 10kb의 외래 서열에 대한 패키징 능력을 가지며, 시스(cis)-작용 긴말단반복순서(long terminal repet:LTR)로 구성된다. 레트로바이러스 벡터는 세포 내 치료 유전자를 삽입시키며 영구적인 이식유전자의 발현을 제공한다.
다른 예로, 아데노연관 바이러스 벡터는 세포분열 여부에 상관없이 다양한 세포(근육, 뇌, 간, 폐, 망막, 귀, 심장, 혈관)에 형질도입 효율이 매우 높고, 병원성이 없으며 바이러스 게놈 대부분이 치료유전자에 의해서 대치될 수 있어 면역반응을 유도하지 않아 반복투여가 가능하다. 또한 AAV는 대상세포의 염색체 내로 삽입됨으로써 치료단백질이 장기간 안정적으로 발현된다. 예를 들어 핵산 및 펩타이드의 시험관 내 생성하여 생체내 및 생체외에서 세포의 표적핵산으로 형질 도입하는데 사용하기 유용하다. 다만 AAV는 크기가 작아 4.5kb이하의 패키징 능력을 가진다.
이때, 염기 변형용 조성물은 가이드 RNA를 암호화하는 핵산을 포함하는 벡터; 및 아데닌 염기 치환 단백질을 포함할 수 있다.
이때, 염기 변형용 조성물은 가이드 RNA; 및 아데닌 염기 치환 단백질을 암호화하는 핵산을 포함하는 벡터를 포함할 수 있다.
이때, 염기 변형용 조성물은 가이드 RNA를 암호화하는 핵산을 포함하는 벡터; 및 아데닌 염기 치환 단백질을 암호화하는 핵산을 포함하는 벡터를 포함할 수 있다.
이때, 염기 변형용 조성물은 가이드 RNA를 암호화하는 핵산 및 아데닌 염기 치환 단백질을 암호화하는 핵산을 포함하는 벡터를 포함할 수 있다.
다른 일 예로, 염기 변형용 조성물은
(a) 제1 결합 도메인을 포함하는 CRISPR 효소 또는 이를 암호화하는 핵산; 및
(b) 제2 결합 도메인을 포함하는 아데노신 디아미네이즈 또는 이를 암호화하는 핵산
을 포함할 수 있다.
이때, CRIPSR 효소는 야생형 CRIPSR 효소 또는 CRIPSR 효소 변이체일 수 있다.
이때, 상기 CRIPSR 효소 변이체는 니케이즈(nickase)일 수 있다.
상기 아데노신 디아미네이즈는 TadA, Tad2p, ADA, ADA1, ADA2, ADAR2, ADAT2, ADAT3 또는이의 변이체일 수 있다.
상기 제1 결합 도메인은 제2 결합 도메인과 비공유 결합을 형성할 수 있다.
이때, 상기 제1 결합 도메인은 FRB 및 FKBP dimerization domains 중 하나; 인테인(intein); ERT 및 VPR domains 중 하나; GCN4 peptide 및 single chain variable fragment (scFv) 중 하나 또는 이량이질체(heterodimer)를 형성하는 도메인일 수 있다.
이때, 상기 제2 결합 도메인은 FRB 및 FKBP dimerization domains 중 하나; 인테인(intein); ERT 및 VPR domains 중 하나; GCN4 peptide 및 single chain variable fragment (scFv) 중 하나 또는 이량이질체(heterodimer)를 형성하는 도메인일 수 있다.
상기 염기 변형용 조성물은 하나 이상의 가이드 RNA 또는 이를 암호화하는 핵산을 추가로 더 포함할 수 있다.
이때, 염기 변형용 조성물은 가이드 RNA-제1 결합 도메인을 포함하는 CRISPR 효소-제2 결합 도메인을 포함하는 아데노신 디아미네이즈 복합체, 즉, ribonucleoprotien(RNP) 형태일 수 있다.
이때, 염기 변형용 조성물은 가이드 RNA를 암호화하는 핵산을 포함하는 벡터; 제1 결합 도메인을 포함하는 CRISPR 효소를 암호화하는 핵산을 포함하는 벡터; 및 제2 결합 도메인을 포함하는 아데노신 디아미네이즈를 암호화하는 핵산을 포함하는 벡터를 포함할 수 있다.
이때, 염기 변형용 조성물은 가이드 RNA를 암호화하는 핵산을 포함하는 벡터; 및 제1 결합 도메인을 포함하는 CRISPR 효소-제2 결합 도메인을 포함하는 아데노신 디아미네이즈 복합체를 포함할 수 있다.
이때, 염기 변형용 조성물은 가이드 RNA를 암호화하는 핵산을 포함하는 벡터; 및 제1 결합 도메인을 포함하는 CRISPR 효소를 암호화하는 핵산 및 제2 결합 도메인을 포함하는 아데노신 디아미네이즈를 암호화하는 핵산을 포함하는 벡터를 포함할 수 있다.
이때, 염기 변형용 조성물은 가이드 RNA를 암호화하는 핵산 및 제1 결합 도메인을 포함하는 CRISPR 효소를 암호화하는 핵산을 포함하는 벡터; 및 제2 결합 도메인을 포함하는 아데노신 디아미네이즈를 암호화하는 핵산을 포함하는 벡터를 포함할 수 있다.
이때, 염기 변형용 조성물은 제1 결합 도메인을 포함하는 CRISPR 효소를 암호화하는 핵산을 포함하는 벡터; 가이드 RNA를 암호화하는 핵산 및 제2 결합 도메인을 포함하는 아데노신 디아미네이즈를 암호화하는 핵산을 포함하는 벡터를 포함할 수 있다.
이때, 염기 변형용 조성물은 가이드 RNA를 암호화하는 핵산을 포함하는 벡터; 제1 결합 도메인을 포함하는 CRISPR 효소; 및 제2 결합 도메인을 포함하는 아데노신 디아미네이즈를 암호화하는 핵산을 포함하는 벡터를 포함할 수 있다.
이때, 염기 변형용 조성물은 가이드 RNA를 암호화하는 핵산을 포함하는 벡터; 제1 결합 도메인을 포함하는 CRISPR 효소를 암호화하는 핵산을 포함하는 벡터; 및 제2 결합 도메인을 포함하는 아데노신 디아미네이즈를 포함할 수 있다.
이때, 염기 변형용 조성물은 가이드 RNA를 암호화하는 핵산 및 제1 결합 도메인을 포함하는 CRISPR 효소를 암호화하는 핵산을 포함하는 벡터; 및 제2 결합 도메인을 포함하는 아데노신 디아미네이즈를 포함할 수 있다.
이때, 염기 변형용 조성물은 제1 결합 도메인을 포함하는 CRISPR 효소; 가이드 RNA를 암호화하는 핵산 및 제2 결합 도메인을 포함하는 아데노신 디아미네이즈를 암호화하는 핵산을 포함하는 벡터를 포함할 수 있다.`
[염기 치환 조성물의 제4 구성 - 가이드 RNA - 단일염기 치환 단백질 복합체]
상기 염기 변형용 조성물은 핵산-단백질 복합체 형태일 수 있다. 이 때, 상기 핵산-단백질 복합체는 가이드 RNA-아데닌 염기 치환 단백질 복합체일 수 있다. 이 때, 상기 핵산-단백질 복합체는 가이드 RNA-시토신 염기 치환 단백질 복합체일 수 있다.
이때, 상기 가이드 RNA-아데닌 염기 치환 단백질 복합체는 가이드 RNA과 아데닌 염기 치환 단백질 간에 비공유 결합에 의해서 형성된 것일 수 있다.
이때, 상기 가이드 RNA-시토신 염기 치환 단백질 복합체는 가이드 RNA과 시토신 염기 치환 단백질 간에 비공유 결합에 의해서 형성된 것일 수 있다.
상기 염기 변형용 조성물은 비벡터 형태일 수 있다.
이때, 상기 비벡터는 네이키드 DNA, DNA 복합체 또는 mRNA일 수 있다.
상기 염기 변형용 조성물은 벡터 형태일 수 있다.
상기 벡터 관련 설명은 상기 기술한 바와 같다.
일 예로, 염기 변형용 조성물은 CRISPR 효소 및 아데노신 디아미네이즈를 포함하는 아데닌 염기 치환 단백질 또는 이를 암호화하는 핵산을 포함할 수 있다.
이때, CRIPSR 효소는 야생형 CRIPSR 효소 또는 CRIPSR 효소 변이체일 수 있다.
이때, 상기 CRIPSR 효소 변이체는 니케이즈(nickase)일 수 있다.
상기 아데노신 디아미네이즈는 TadA, Tad2p, ADA, ADA1, ADA2, ADAR2, ADAT2, ADAT3 또는이의 변이체일 수 있다.
상기 아데닌 염기 치환 단백질은 N말단-[CRISPR 효소]-[아데노신 디아미네이즈]-C말단 순으로 구성될 수 있다.
상기 아데닌 염기 치환 단백질은 N말단-[아데노신 디아미네이즈]-[CRISPR 효소]-C말단 순으로 구성될 수 있다.
이때, 상기 아데닌 염기 치환 단백질은 추가로 연결 도메인을 더 포함할 수 있다.
상기 염기 변형용 조성물은 하나 이상의 가이드 RNA 또는 이를 암호화하는 핵산을 추가로 더 포함할 수 있다.
이때, 염기 변형용 조성물은 가이드 RNA-아데닌 염기 치환 단백질 복합체, 즉, ribonucleoprotien(RNP) 형태일 수 있다.
본 명세서에 의해 개시되는 발명의 일 태양은 단일염기 치환 단백질 또는 이를 포함하는 단일염기 치환 조성물의 용도이다.
본 출원에서 제공하는 단일염기 치환 단백질을 통하여 다음의 용도를 제공할 수 있다.
염기 변형용 조성물은 타겟 유전자 내에 하나 이상의 뉴클레오타이드의 염기를 인위적으로 변형시키는데 이용될 수 있다.
(i) 특정 유전자의 목적하는 영역(region)의 하나 이상의 뉴클레오타이드의 염기를 인위적으로 변형함으로써, 그 변형된 핵산서열로부터 발현된 물질을 식별하지 못하도록 돌연변이 된 부분, 즉 항체 내성을 가지는 에피토프에 대한 정보를 얻는데 이용될 수 있다.
(ii) 특정 유전자의 목적하는 영역(region)의 하나 이상의 뉴클레오타이드의 염기를 인위적으로 변형함으로써, 그 변형된 핵산서열로부터 발현된 물질의 특정 약물에 대한 민감도 감소 또는 상실되는지 여부에 대한 정보를 얻는데 이용될 수 있다. 즉 특정 약물에 영향을 주는 타겟 유전자 또는 타겟 유전자가 암호화하는 단백질(이하, 표적 단백질로 기재)의 일 영역을 찾거나 확인하는데 이용될 수 있다.
(iii) 특정 유전자의 목적하는 영역(region)의 하나 이상의 뉴클레오타이드의 염기를 인위적으로 변형함으로써, 그 변형된 핵산서열로부터 발현된 물질이 특정 약물에 대한 민감도가 증가하는지 여부에 대한 정보를 얻는데 이용될 수 있다. 즉 특정 약물에 민감도 증가에 영향을 주는 타겟 유전자 또는 타겟 유전자가 암호화하는 단백질(이하, 표적 단백질로 기재)의 일 영역을 찾거나 확인하는데 이용될 수 있다.
(iv) 특정 유전자의 목적하는 영역(region)의 하나 이상의 뉴클레오타이드의 염기를 인위적으로 변형함으로써, 그 변형된 핵산서열로부터 발현된 물질이 바이러스에 내성을 갖는지 여부에 대한 정보를 얻는데 이용될 수 있다. 즉 바이러스 내성 유전자 또는 바이러스 내성 단백질 스크리닝에 이용될 수 있다.
[제1 용도 - 에피토프(epitope) 스크리닝]
일 구현예로서, 단일염기 치환 단백질 또는 이를 포함하는 염기 치환용 조성물은 에피토프(epitope) 스크리닝에 이용될 수 있다.
“에피토프(epitope)”는 항체, B 세포, T 세포 등 면역계가 항원을 식별하게 해주는 항원의 특정한 부분을 의미하며, 항원결정기(antigenic determinant)로도 불린다. 단백질의 에피토프는 크게 모양과 에피토프를 식별하는 항체의 특정부분인 항원결합부위와의 작용방식에 따라 입체구조 에피토프(conformational epitopes)와 선형 에피토프(linear epitopes)로 나뉜다. 입체구조 에피토프는 항원, 즉, 단백질의 불연속적인 아미노산 배열로 구성된다. 입체구조 에피토프는 항체의 항원결합부위의 3차원적 구조와 반응한다. 대부분의 에피토프는 입체구조 에피토프이다. 이와 반대로, 선형 에피토프는 항체의 항원결합부위의 1차원적인 구조와 반응하며, 항원의 선형 에피토프를 구성하는 아미노산은 연속적인 아미노산 배열로 구성된다.
“에피토프 스크리닝”은 항체, B 세포, T 세포 등 면역계가 항원을 식별하게 해주는 항원의 특정한 부분을 찾거나 확인하는 것이며, 또한, 항체, B 세포, T 세포 등 면역계가 항원을 식별하지 못하도록 돌연변이된 항원의 특정한 부분을 찾거나 확인하는 방법, 조성물, 키트 등을 의미한다. 이때, 상기 항체, B 세포, T 세포 등 면역계가 항원을 식별하지 못하도록 돌연변이된 항원의 특정한 부분은 항체 내성을 가지는 에피토프일 수 있다.
단일염기 치환 단백질 또는 이를 포함하는 염기 치환용 조성물은 단일 염기 다형성(SNP)을 인위적으로 생성하여, 생체 내 변화, 즉 특정 인자의 발현의 생성, 억제, 증가 또는 저하, 특정 기능의 생성 또는 소실, 또는 질병 유무 여부 또는 외부 약물 또는 화합물 등의 반응성 차이 예를 들어, 에피토프로 이용가능 서열 및 약물의 내성 유발 여부에 관여하는 단일염기 다형성의 위치를 제공할 수 있다.
상기 단일염기 치환 단백질 및 염기 치환용 조성물 관련 설명은 상기 기술한 바와 같다.
상기 에피토프 스크리닝을 위해, 단일염기 치환 단백질은 게놈 내 인위적인 단일 염기 다형성을 유발시키는데 이용될 수 있다.
이때, 상기 인위적인 단일 염기 다형성은 점 돌연변이를 유발할 수 있다.
점 돌연변이는 하나의 뉴클레오타이드가 변형되어 나타나는 돌연여변이를 말한다. 점 돌연변이에는 미스센스(missense)돌연변이, 넌센스(nonsense) 돌연변이, 침묵(silence) 돌연변이가 있다.
미스센스 돌연변이는 하나 이상의 변형된 뉴클레오타이드로 인해 변이된 코돈이 다른 아미노산을 암호화하게 되는 경우를 말한다. 넌센스 돌연변이는 하나 이상의 변형된 뉴클레오타이드로 인해 변이된 코돈이 종결 코돈인 경우를 말한다. 침묵 돌연변이는 하나 이상의 변형된 뉴클레오타이드에 의해 변이된 코돈이 변이가 일어나지 않은 코돈과 동일한 아미노산을 암호화하는 경우를 말한다.
일 예로, 염기 서열 A가 C, T, G등의 다른 염기 서열로 치환됨으로써, 다른 아미노산을 암호화하는 코돈으로 변경될 수 있다. 즉, 미스센스 돌연변이가 유발될 수 있다. 예를 들어, A가 C로 치환될 경우, 류신은 글라이신으로 바뀔 수 있다.
다른 예로, 염기 서열 A가 C, T, G등의 다른 염기 서열로 치환됨으로써, 동일한 아미노산을 암호화하는 코돈으로 변경될 수 있다. 즉 침묵 돌연변이가 유발될 수 있다. 예를 들어, A가 C로 치환될 경우, 동일한 프롤린을 암호화하는 코돈을 가질 수 있다.
또 다른 예로, A가 C, T, G등의 다른 염기 서열로 치환되어 TAG, TGC 및 TAA 중 어느 하나가 생성될 경우, UAA, UAG 및 UGA 중 어느 하나의 종결 코돈을 가질 수 있다. 즉 넌센스 돌연변이가 유발될 수 있다.
상기 단일염기 치환 단백질은 유전자 내에 하나 이상의 뉴클레오타이드의 염기에 인위적인 치환을 유도 또는 발생시킴으로 점 돌연변이를 유발시킬 수 있다.
상기 염기 치환용 조성물은 유전자 내에 하나 이상의 뉴클레오타이드의 염기에 인위적인 치환을 유도 또는 발생시킴으로 점 돌연변이를 유발시킬 수 있다.
상기 단일염기의 인위적인 치환유도는 상기 기술한 바와 같다.
단일염기 치환 단백질 또는 이를 포함하는 염기 치환용 조성물로 인해 생성된 점 돌연변이에 의해 암호화되는 단백질은 적어도 하나 이상의 아미노산 서열이 변경된 단백질 변이체일 수 있다.
예를 들어, EGFR을 암호화하는 유전자를 단일염기 치환 단백질 또는 이를 포함하는 염기 치환용 조성물로 점 돌연변이를 유발시킨 경우, 생성된 점 돌연변이에 의해 암호화되는 단백질은 야생형 EGFR과 적어도 하나 이상의 아미노산 서열이 변경된 EGFR 변이체일 수 있다.
변경된 하나 이상의 아미노산은 비슷한 성질을 가진 아미노산으로 변경될 수 있다.
상기 소수성 아미노산은 다른 소수성 아미노산으로 변경될 수 있다. 소수성 아미노산은 글리신, 알라닌, 발린, 이소류신, 류신, 메티오닌, 페닐알라닌, 티로신 또는 트립토판 중 하나이다.
상기 염기성 아미노산은 다른 염기성 아미노산으로 변경될 수 있다. 염기성 아미노산은 아르기닌 또는 히스티딘 중 하나이다.
상기 산성 아미노산은 다른 산성 아미노산으로 변경될 수 있다. 산성 아미노산은 글루탐산 또는 아스파르트산 중 하나이다.
상기 극성 아미노산은 다른 극성 아미노산으로 변경될 수 있다. 극성 아미노산은 세린, 트레오닌, 아스파라긴 또는 글루타민 중 하나이다.
변경된 하나 이상의 아미노산은 상이한 성질을 가진 아미노산으로 변경될 수 있다.
일 예로, 상기 아미노산은 소수성 아미노산이 극성 아미노산으로 변경될 수 있다.
다른 예로, 상기 아미노산은 소수성 아미노산이 산성 아미노산으로 변경될 수 있다.
일 예로, 상기 아미노산은 소수성 아미노산이 염기성 아미노산으로 변경될 수 있다.
다른 예로, 상기 극성 아미노산은 소수성 아미노산으로 변경될 수 있다.
일 예로, 상기 산성 아미노산은 염기성 아미노산으로 변경될 수 있다.
다른 예로, 상기 염기성 아미노산은 삼성 아미노산으로 변경될 수 있다.
상기 적어도 하나 이상의 아미노산 서열이 변경된 단백질 변이체는 3차원 단백질 구조가 변형될 수 있다. 이는 아미노산 서열 내 어느 하나 이상의 아미노산이 다른 성질의 아미노산 서열로 변경되는 경우, 아미노산 서열간의 결합력이 달라지면서, 3차원적 구조가 변경될 수 있다. 3차원적 구조가 변경된 경우, 입체구조 에피토프가 변형될 수 있다. 상기 변형은 본 출원에서 제공하는 단일염기 치환 단백질 또는 이를 포함하는 조성물을 이용하여 유도할 수 있다.
예를 들어, ATM을 암호화하는 유전자를 단일 염기 치환 단백질 또는 이를 포함하는 염기 변형용 조성물로 점 돌연변이를 유발시킨 경우, 생성된 점 돌연변이에 의해 암호화되는 ATM 변이체는 3차원적 구조가 일부 변경될 수 있고, 그로 인해 입체구조 에피토프가 변형될 수 있다. 상기 변형은 본 출원에서 제공하는 단일염기 치환 단백질 또는 이를 포함하는 조성물을 이용하여 유도할 수 있다.
인위적인 단일 염기 다형성을 포함하는 유전자는 합성되는 단백질의 양을 조절할 수 있다.
일 예로, 상기 인위적인 단일 염기 다형성을 포함하는 유전자는 mRNA 전사되는 양이 증가 또는 감소될 수 있다. 이는 단백질 합성 양이 증가 또는 감소될 수 있다.
다른 예로, 상기 유전자 내 조절 영역의 하나 이상의 인위적인 단일 염기 다형성을 포함하는 유전자의 경우, 상기 단일염기 다형성을 포함하는 유전자로부터 합성되는 단백질의 양이 증가 또는 감소될 수 있다.
유전자 내에 존재하는 인위적인 단일 염기 다형성은 단백질의 활성을 조절할 수 있다.
일 예로, 상기 하나 이상의 인위적인 단일 염기 다형성은 단백질의 활성이 촉진 및/또는 저하될 수 있다.
예를 들어, 핵막 수용체를 암호화하는 유전자 내에 인위적인 단일 염기 다형성이 포함되는 경우, 리간드를 인지 및 리간드와 결합하여 신호전달하는 과정에 관여하는 모든 인자 또는 메커니즘(인산화, 아세틸화 등)을 활성화시키거나 저하시킬 수 있다.
예를 들어, 특정 효소를 암호화하는 유전자 내에 인위적인 단일 염기 다형성이 포함되는 경우, 효소의 기능 예를 들어 아세틸레이즈의 경우 표적 인자의 아세틸화시키는 정도를 촉진시키거나 또는 저하시킬 수 있다.
유전자 내에 존재하는 인위적인 단일 염기 다형성은 단백질의 기능이 변경될 수 있다.
일 예로, 하나 이상의 인위적인 단일 염기 다형성에 의해 단백질의 본래 기능이 추가 및/또는 억제될 수 있다.
예를 들어, 핵막 수용체를 암호화하는 유전자 내에 인위적인 단일 염기 다형성이 포함되는 경우, 리간드를 인지 및/또는 결합하는 능력이 억제될 수 있다
또는, 예를 들어, 핵막 수용체를 암호화하는 유전자 내에 인위적인 단일 염기 다형성이 포함되는 경우, 리간드와 결합하여 하류 인자(downstream factor)에 신호전달하는 기능 중 일부가 억제될 수 있다.
일 구체예로서, 에피토프 스크리닝 방법은,
a) 타겟 유전자 내 존재하는 타겟 핵산서열에 상보적으로 결합할 수 있는 하나 이상의 가이드 RNA 라이브러리 중 어느 하나 이상의 가이드 RNA를 발현할 수 있는 세포를 준비함,
-이 때, 상기 세포는 타겟 핵산서열을 포함함 -;
b) 상기 세포에 단일염기 치환 단백질 또는 이를 암호화하는 핵산을 도입함;
c) 상기 b)의 세포에 약물 또는 치료제를 처리함;
d) 생존한 세포 분리함; 및
e) 분리한 세포에서 타겟 유전자의 핵산서열을 분석함;
을 포함하는 방법일 수 있다.
일 구현예로, 에피토프 스크리닝 방법은,
a) 타겟 유전자 내 존재하는 타겟 핵산서열에 상보적으로 결합할 수 있는 하나 이상의 가이드 RNA 라이브러리 중 어느 하나 이상의 가이드 RNA를 발현할 수 있는 세포를 준비함,
-이 때, 상기 세포는 타겟 핵산서열을 포함함 -;
b) 상기 세포에 단일염기 치환 단백질 또는 이를 암호화하는 핵산을 도입함;
c) 상기 b)의 세포에 약물 또는 치료제를 처리함;
d) 생존한 세포 분리함; 및
e) 분리한 세포에서 목적하는 SNP에 대한 정보를 얻음;
을 포함하는 방법일 수 있다.
이 때, 상기 목적하는 SNP는 상기 타겟 유전자로부터 발현되는 단백질의 구조 또는 기능과 관련된 것일 수 있다.
일 구현예로, 에피토프 스크리닝 방법은,
a) 타겟 핵산서열을 포함하는 세포에 단일염기 치환 단백질 또는 이를 암호화하는 핵산, 및 가이드 RNA 라이브러리 중 어느 하나 이상의 가이드 RNA 또는 이를 암호화하는 핵산을 도입함;
b) 상기 a)의 세포에 약물 또는 치료제를 처리함;
c) 생존한 세포를 분리함; 및
d) 분리한 세포에서 목적하는 SNP에 대한 정보를 얻음;
을 포함하는 방법일 수 있다.
이 때, 상기 목적하는 SNP는 상기 타겟 유전자로부터 발현되는 단백질의 구조 또는 기능과 관련된 것일 수 있다.
다른 일 구체예로서, 에피토프 스크리닝 방법은,
a) 염기 치환용 조성물을 타겟 핵산서열을 포함하는 세포에 도입함;
b) 상기 a)의 세포에 약물 또는 치료제를 처리힘;
c) 생존한 세포를 분리힘; 및
d) 분리한 세포에서 타겟 유전자의 핵산서열을 분석함;
을 포함하는 방법일 수 있다.
다른 일 구체예로서, 에피토프 스크리닝 방법은,
a) 염기 치환용 조성물을 타겟 핵산서열을 포함하는 세포에 도입함;
b) 상기 a)의 세포에 약물 또는 치료제를 처리힘;
c) 생존한 세포를 분리힘; 및
d) 분리한 세포에서 목적하는 SNP에 대한 정보를 얻음;
을 포함하는 방법일 수 있다.
이 때, 상기 목적하는 SNP는 상기 타겟 유전자로부터 발현되는 단백질의 구조 또는 기능과 관련된 것일 수 있다.
상기 가이드 RNA 라이브러리는 타겟 서열의 일부 핵산서열과 상보적으로 결합할 수 있는 하나 이상의 가이드 RNA 집합일 수 있다. 동일한 가이드 RNA 라이브러리를 암호화하는 핵산이 각 세포에 도입되더라도 각 세포는 서로 다른 가이드 RNA를 포함할 수 있다. 동일한 가이드 RNA 라이브러리를 암호화하는 핵산이 각 세포에 도입된 결과, 각 세포는 서로 동일한 가이드 RNA를 포함할 수 있다.
상기 가이드 RNA 관련 설명은 상기 기술한 바와 같다.
상기 단일염기 치환 단백질은 아데닌 치환 단백질 또는 시토신 치환 단백질일 수 있다.
상기 단일염기 치환 단백질, 아데닌 치환 단백질 및 시토신 치환 단백질 관련 설명은 상기 기술한 바와 같다.
상기 도입은 전기천공법(electroporation), 리포좀, 플라스미드, 바이러스 벡터, 나노파티클(nanoparticles) 및 PTD(protein translocation domain)융합 단백질 방법 중 선택되는 1 이상의 방법으로 수행될 수 있다.
상기에서 처리하는 항체는 타겟 유전자가 암호화하는 단백질(이하, 표적 단백질로 기재)을 식별하는 항체일 수 있으며, 상기 표적 단백질의 에피토프와 반응할 수 있는 항체일 수 있다.
상기에서 생존한 세포는 상기에서 처리한 항체와 반응하지 않는 세포일 수 있다.
상기에서 분리한 세포는 타겟 유전자에 적어도 하나 이상의 뉴클레오타이드의 변형을 포함하는 세포일 수 있다.
이 때, 상기 하나 이상의 뉴클레오타이드의 변형은 타겟 유전자 내에 발생한 하나 이상의 인위적인 단일 염기 다형성(SNP)일 수 있다.
이 때, 상기 하나 이상의 인위적인 단일 염기 다형성(SNP)은 점 돌연변이를 유발시킬 수 있다.
상기에서 타겟 유전자에 존재하는 적어도 하나 이상의 뉴클레오타이드의 변형, 즉, 하나 이상의 인위적인 단일 염기 다형성을 확인할 수 있다. 이를 통하여 목적하는 정보를 얻을 수 있다.
이때, 확인된 적어도 하나 이상의 뉴클레오타이드의 변형, 즉, 하나 이상의 인위적인 단일 염기 다형성을 포함하는 핵산 서열은 에피토프를 암호화하는 핵산 서열일 수 있다.
[제2 용도 - 약물 내성 유전자 또는 약물 내성 단백질 스크리닝]
다른 일 구현예로서, 단일염기 치환 단백질 또는 이를 포함하는 염기 치환용 조성물은 약물 내성 유전자 또는 약물 내성 단백질 스크리닝에 이용될 수 있다.
약물 내성 스크리닝은 특정 약물에 대한 민감도의 감소 또는 상실에 영향을 주는 타겟 유전자 또는 타겟 유전자가 암호화하는 단백질(이하, 표적 단백질로 기재)의 일 영역에 대한 정보를 제공할 수 있다. 본 출원에서 제공하는 단일염기 치환 단백질 또는 이를 포함하는 조성물을 이용하여 상기 일 영역을 찾거나 확인할 수 있다.
본 출원은 약물 내성 유전자 또는 약물 내성 단백질의 스크리닝 방법을 제공한다. 이하, 상기 스크리닝 방법의 일 예로서, 구체적인 각 단계에 대하여 설명한다.
sgRNA 라이브러리의 준비
타겟 유전자의 일 영역과 상보적으로 결합할 수 있는 가이드 RNA를 준비한다. 일 구체예에서,타겟 유전자 내 엑손(exon) 일 영역과 상보적으로 결합할 수 있는 가이드 RNA를 준비한다. 이 때, 상기 준비되는 가이드 RNA는 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 20개, 30개, 40개, 50개, 60개, 70개, 80개, 90개, 100개, 200개, 500개, 1000개, 2000개 또는 3000개 이상일 수 있다. 이 때, 상기 준비되는 복수개의 가이드 RNA는 타겟 유전자 내 엑손 일 영역과 상보적으로 결합할 수 있다.
일 예로, 상기 가이드 RNA는 타겟 유전자 내 엑손 영역의 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개, 26개, 27개, 28개, 29개 또는 30개 이상의 영역에 상응하는 뉴클레오타이드 서열과 상보적으로 결합할 수 있는 부위를 포함한다.
가이드 RNA 발현 가능한 형질전환 세포 준비
타겟 유전자 내 엑손 일 영역과 상보적으로 결합할 수 있는 가이드 RNA를 제조할 수 있는 세포를 준비한다. 상기 세포는 상기 준비된 sgRNA 라이브러리를 암호화하는 벡터에 의하여 형질감염된 것일 수 있다. 이 때, 상기 세포는 sgRNA 라이브러리에 암호화된 하나 이상의 가이드 RNA를 발현할 수 있다.
단일염기 치환 단백질의 상기 형질전환 세포 내의 도입
sgRNA 라이브러리에 암호화된 하나 이상의 가이드 RNA를 발현할 수 있는 형질전환 세포 내에 단일염기 치환 단백질 또는 이를 암호화하는 핵산을 도입한다. 상기 단일염기 치환 단백질은 타겟 영역 내 적어도 하나 이상의 염기의 임의의 염기로의 치환을 유도할 수 있다.
상기 단일염기 치환 단백질은 타겟 유전자 내 적어도 하나 이상의 SNP의 발생을 유도할 수 있다.
상기 단일염기 치환 단백질은 타겟 영역 내 적어도 하나 이상의 SNP의 발생을 유도할 수 있다.
일 예로, 상기 도입된 단일염기 치환 단백질이 시티딘 치환 단백질일 때, 타겟 영역 내 적어도 하나 이상의 시토신은 임의의 염기로 치환될 수 있다.
일 예로, 상기 도입된 단일염기 치환 단백질이 아데닌 치환 단백질일 때, 타겟 영역 내 적어도 하나 이상의 아데닌은 임의의 염기로 치환될 수 있다.
형질전환 세포 준비
상기 가이드 RNA 발현 가능한 형질전환 세포 준비 및 단일염기 치환 단백질의 상기 형질전환 세포 내의 도입 단계 대신, 하기와 같은 단계로도 본 출원의 방법을 수행할 수 있다.
타겟 유전자를 포함하는 세포를 준비한다.
상기 세포에 상기 단일염기 치환 단백질 및 상기 가이드 RNA를 도입한다. 이 때, 상기 단일염기 치환 단백질 및 가이드 RNA는 RNP 복합체(ribonucleoprotein complex) 형태로 도입하거나, 이들을 각각 코딩하는 핵산의 형태로 도입할 수 있다.
상기 형질전환 세포에 약물 또는 치료제의 처리
상기 형질전환 세포에 항생제, 항암제 또는 항체 등 약물(drug) 또는 치료제(therapeutic agent)로 사용될 수 있는 물질을 처리한다. 이 때, 상기 처리되는 약물 또는 치료제는 상기 타겟 유전자로부터 발현되는 펩타이드, 폴리펩타이드 또는 단백질과 특이적으로 결합하거나 반응할 수 있다. 또는 상기 처리되는 약물 또는 치료제는 상기 타겟유전자로부터 발현되는 펩타이드, 폴리펩타이드 또는 단백질의 활성 또는 기능을 저하 또는 상실시킬 수 있다. 또는 상기 처리되는 약물 또는 치료제는 상기 타겟유전자로부터 발현되는 펩타이드, 폴리펩타이드 또는 단백질의 활성 또는 기능을 향상 또는 상승시킬 수 있다.
상기 형질전환 세포는 상기 약물 또는 치료제에 의하여 사멸할 수 있다.
상기 형질전환 세포는 상기 약물 또는 치료제의 처리에도 불구하고 생존할 수 있다.
세포의 선별
상기 약물 또는 치료제의 처리에도 불구하고, 생존한 세포를 분리, 선별 또는 수득할 수 있다.
상기 생존한 세포는 적어도 하나 이상의 가이드 RNA 및 단일염기 치환 단백질에 의하여 타겟 유전자의 타겟 영역 내 적어도 하나 이상의 염기가 임의의 염기로 치환된 것일 수 있다. 상기 단이염기 치환 단백질에 의하여 타겟 유전자 내 염기가 임의의 염기로 치환된 세포는 상기 처리된 약물 또는 치료제에 내성을 가질 수 있다.
이 때, 상기 생존한 세포의 타겟 유전자로부터 발현되는 펩타이드, 폴리펩타이드 또는 단백질은 상기 약물 또는 치료제에 내성을 가질 수 있다.
정보의 수득(obtaining the information)
상기 생존한 세포의 게놈 또는 타겟 유전자의 핵산서열을 분석하여 상기 처리된 약물 또는 치료제에 내성을 가지는 부위에 대한 정보를 얻을 수 있다.
상기 생존한 세포의 게놈 또는 타겟 유전자의 핵산서열을 분석하여 상기 타겟 유전자로부터 발현되는 펩타이드, 폴리펩타이드 또는 단백질의 구조 또는 기능의 변경여부에 대한 정보를 얻을 수 있다. 상기 변경되는 구조 또는 기능은 약물에 내성을 가지는지 여부에 결정적인 역할을 할 수 있다.
일 구현예로, 약물 내성 유전자 또는 약물 내성 단백질 스크리닝 방법은,
a) 타겟 유전자를 포함하는 세포를 준비함;
b) 상기 세포에,
타겟 핵산서열에 상보적으로 결합할 수 있는 하나 이상의 가이드 RNA 라이브러리 중 어느 하나 이상의 가이드 RNA 또는 이를 코딩하는 핵산; 및 단일염기 치환 단백질 또는 이를 암호화하는 핵산을 도입함;
c) 상기 b)의 세포에 약물 또는 치료제를 처리함;
d) 생존한 세포 분리함; 및
e) 분리한 세포에서 타겟 유전자의 핵산서열을 분석함;
을 포함하는 방법일 수 있다.
일 구현예로, 약물 내성 유전자 또는 약물 내성 단백질 스크리닝 방법은,
a) 타겟 유전자 내 존재하는 타겟 핵산서열에 상보적으로 결합할 수 있는 하나 이상의 가이드 RNA 라이브러리 중 어느 하나 이상의 가이드 RNA를 발현할 수 있는 세포를 준비함,
b) 상기 세포에 단일염기 치환 단백질 또는 이를 암호화하는 핵산을 도입함;
c) 상기 b)의 세포에 약물 또는 치료제를 처리함;
d) 생존한 세포 분리함; 및
e) 분리한 세포에서 타겟 유전자의 핵산서열을 분석함;
을 포함하는 방법일 수 있다.
일 구현예로, 약물 내성 유전자 또는 약물 내성 단백질 스크리닝 방법은,
a) 타겟 유전자 내 존재하는 타겟 핵산서열에 상보적으로 결합할 수 있는 하나 이상의 가이드 RNA 라이브러리 중 어느 하나 이상의 가이드 RNA를 발현할 수 있는 세포를 준비함,
b) 상기 세포에 단일염기 치환 단백질 또는 이를 암호화하는 핵산을 도입함;
c) 상기 b)의 세포에 약물 또는 치료제를 처리함;
d) 생존한 세포 분리함; 및
e) 분리한 세포에서 목적하는 SNP에 대한 정보를 얻음;
을 포함하는 방법일 수 있다.
이 때, 상기 목적하는 SNP는 상기 타겟 유전자로부터 발현되는 단백질의 구조 또는 기능과 관련된 것일 수 있다.
일 구현예로, 약물 내성 유전자 또는 약물 내성 단백질 스크리닝 방법은,
a) 세포에 단일염기 치환 단백질 또는 이를 암호화하는 핵산, 및 가이드 RNA 라이브러리 중 어느 하나 이상의 가이드 RNA 또는 이를 암호화하는 핵산을 도입함;
b) 상기 a)의 세포에 약물 또는 치료제를 처리함;
c) 생존한 세포를 분리함; 및
d) 분리한 세포에서 목적하는 SNP에 대한 정보를 얻음;
을 포함하는 방법일 수 있다.
이 때, 상기 목적하는 SNP는 상기 타겟 유전자로부터 발현되는 단백질의 구조 또는 기능과 관련된 것일 수 있다.
다른 일 구체예로서, 약물 내성 유전자 또는 약물 내성 단백질 스크리닝 방법은,
a) 염기 치환용 조성물을 타겟 핵산서열을 포함하는 세포에 도입함;
b) 상기 a)의 세포에 약물 또는 치료제를 처리힘;
c) 생존한 세포를 분리힘; 및
d) 분리한 세포에서 타겟 유전자의 핵산서열을 분석함;
을 포함하는 방법일 수 있다.
다른 일 구체예로서, 약물 내성 유전자 또는 약물 내성 단백질 스크리닝 방법은,
a) 염기 치환용 조성물을 타겟 핵산서열을 포함하는 세포에 도입함;
b) 상기 a)의 세포에 약물 또는 치료제를 처리힘;
c) 생존한 세포를 분리힘; 및
d) 분리한 세포에서 목적하는 SNP에 대한 정보를 얻음;
을 포함하는 방법일 수 있다.
이 때, 상기 목적하는 SNP는 상기 타겟 유전자로부터 발현되는 단백질의 구조 또는 기능과 관련된 것일 수 있다.
상기 가이드 RNA 라이브러리는 타겟 서열의 일부 핵산서열과 상보적으로 결합할 수 있는 하나 이상의 가이드 RNA 집합일 수 있다. 동일한 가이드 RNA 라이브러리를 암호화하는 핵산이 각 세포에 도입되더라도 각 세포는 서로 다른 가이드 RNA를 포함할 수 있다. 동일한 가이드 RNA 라이브러리를 암호화하는 핵산이 각 세포에 도입된 결과, 각 세포는 서로 동일한 가이드 RNA를 포함할 수 있다.
상기 가이드 RNA 관련 설명은 상기 기술한 바와 같다.
상기 단일염기 치환 단백질은 아데닌 치환 단백질 또는 시토신 치환 단백질일 수 있다.
상기 단일염기 치환 단백질, 아데닌 치환 단백질 및 시토신 치환 단백질 관련 설명은 상기 기술한 바와 같다.
상기 도입은 전기천공법(electroporation), 리포좀, 플라스미드, 바이러스 벡터, 나노파티클(nanoparticles) 및 PTD(protein translocation domain)융합 단백질 방법 중 선택되는 1 이상의 방법으로 수행될 수 있다.
상기에서 처리하는 약물은 타겟 유전자가 암호화하는 단백질(이하, 표적 단백질로 기재)의 활성, 기능을 저해 또는 억제하는 물질일 수 있다. 이때, 상기 물질은 생물학적 물질(RNA, DNA, 단백질, 펩타이드, 항체 등) 또는 비생물학적 물질(화합물 등)일 수 있다.
상기에서 처리하는 약물은 타겟 유전자가 암호화하는 단백질(이하, 표적 단백질로 기재)의 활성, 기능을 촉진 또는 증가시키는 물질일 수 있다. 이때, 상기 물질은 생물학적 물질(RNA, DNA, 단백질, 펩타이드, 항체 등) 또는 비생물학적 물질(화합물 등)일 수 있다.
상기에서 생존한 세포는 상기에서 처리한 약물에 의해 표적 단백질의 활성, 기능이 변하지 않는, 즉, 약물 내성을 가지는 세포일 수 있다.
상기에서 분리한 세포는 타겟 유전자에 적어도 하나 이상의 뉴클레오타이드의 변형을 포함하는 세포일 수 있다.
이 때, 상기 하나 이상의 뉴클레오타이드의 변형은 타겟 유전자 내에 발생한 하나 이상의 인위적인 단일 염기 다형성(SNP)일 수 있다.
이 때, 상기 하나 이상의 인위적인 단일 염기 다형성(SNP)은 점 돌연변이를 유발시킬 수 있다.
상기에서 타겟 유전자에 존재하는 적어도 하나 이상의 뉴클레오타이드의 변형, 즉, 하나 이상의 인위적인 단일 염기 다형성을 확인할 수 있다. 이를 통하여 목적하는 정보를 얻을 수 있다.
이 때, 확인된 적어도 하나 이상의 뉴클레오타이드의 변형, 즉, 하나 이상의 인위적인 단일 염기 다형성을 포함하는 핵산 서열은 약물 내성에 영향을 주는 단백질의 일 영역을 암호화하는 핵산 서열일 수 있다.
상기에서 처리하는 약물은 항암제일 수 있다. 다만, 항암제에 제한되지 않으며 공지된 모든 질병또는 질환을 치료하기 위해 사용되는 물질 또는 치료제도 포함한다.
일 예로, 상기 약물은 표피성장인자수용체(epidermal growth factor receptor, EGFR)를 억제하여 암세포가 성장을 방해하거나, 혈관내피성장인자 (vascular endothelial growth factor, VEGF) 를 차단하여 암세포로 가는 혈관신생을 저해하거나, 역형성 림프종 인산화효소(Anaplastic lymphoma kinase)를 저해하는 등의 기작을 이용할 수 있다.
일 구체예로, 약물 내성 돌연변이 스크리닝 방법으로서, 타겟 유전자를 포함하는 세포에 상기 단일염기 치환 조성물을 도입하여 상기 타겟 유전자 상에서 인위적으로 SNP를 유도함(inducing), 상기 세포에 특정 약물을 처리함(treating), 목적하는 SNP을 포함하는 생존한 세포를 선별함(selecting), 상기 선별된 세포를 분석함으로써 목적하는 SNP에 대한 정보(information)를 얻음(obtaining)을 포함하고, 이 때, 상기 목적하는 SNP는 상기 타겟 유전자로부터 발현되는 단백질의 구조 또는 기능과 관련된 것임을 포함하는 약물 내성 돌연변이 스크리닝 방법일 수 있다.
일 구체예로, 상기 타겟 유전자는 EGFR 유전자, VEGF 유전자, 또는 역형성 림프종 인산화효소 유전자일 수 있다. 다만, 이에 제한되지 않는다.
일 구체예로, 상기 처리하는 약물은 시스플라틴(cisplatin), 카보플라팀(carboplatin), 비노렐빈(vinorelbine), 파클리탁셀(paclitaxel), 도세탁셀(docetaxel, 젬시타빈(gemcitabine), 페메트렉세드(pemetrexed), 이레사(iressa), 타세바(tarceva), 지오트립(giotrif), 타그리소(tagrisso), 잘코리(Xalkori), 자카디아(zykadia), 알레센자(alectinib), 알룬부릭(brigatinib), 아바스틴(bevacizumab), 아바스틴(bevacizumab), 키트루다(pembrolizumab), 옵디보(nivolumab), 티센트릭(atezolizumab), 임핀지(durvalumab) 또는 Osimertinib 일 수 있다. 다만, 이에 제한되지 않는다.
구체예로서, Osimertinib에 내성을 가지는 EGFR 돌연변이 유전자를 스크리닝 방법은 다음과 같이 수행될 수 있다.
일 구체예로, 약물 내성 돌연변이 스크리닝 방법으로서, EGFR 유전자를 포함하는 세포에 단일염기 치환 조성물을 도입하여 상기 EGFR 유전자 상에서 인위적으로 SNP를 유도함(inducing), 상기 세포에 약물을 처리함(treating), 목적하는 SNP을 포함하는 생존한 세포를 선별함(selecting), 상기 선별된 세포를 분석함으로써 목적하는 SNP에 대한 정보(information)를 얻음(obtaining)을 포함하고, 이 때, 상기 목적하는 SNP는 상기 EGFR의 구조 또는 기능과 관련된 것임을 포함하는 약물 내성 돌연변이 스크리닝 방법일 수 있다.
이 때, 상기 처리되는 약물은 Osimertinib일 수 있다. 다만, 이에 제한되지 않고 EGFR의 기능을저해하거나 상실시키는 어느 물질일 수 있다.
일 실시예로, 약물 내성 돌연변이 스크리닝 방법으로서, EGFR 유전자를 포함하는 세포에 이 때, 상기 단일염기 치환 조성물은 C797S sgRNA1 및/또는 C797S sgRNA2를 포함하는 단일염기 치환 조성물을 도입하여 상기 EGFR 유전자 상에서 인위적으로 SNP를 유도함(inducing), 상기 세포에 약물을 처리함(treating), 목적하는 SNP을 포함하는 생존한 세포를 선별함(selecting), 상기 선별된 세포를 분석함으로써 목적하는 SNP에 대한 정보(information)를 얻음(obtaining)을 포함하고, 이 때, 상기 목적하는 SNP는 상기 EGFR의 구조 또는 기능과 관련된 것임을 포함하는 약물 내성 돌연변이 스크리닝 방법일 수 있다.
이 때, 상기 처리되는 약물은 Osimertinib일 수 있다. 다만, 이에 제한되지 않고 EGFR의 기능을저해하거나 상실시키는 어느 물질일 수 있다.
상기 일 실시예를 통하여, Osimertinib에 내성을 가지는 EGFR 부위를 확인하였다. 상기 Osimertinib에 내성을 가지는 EGFR 부위는 상기 도입된 단일염기 치환 조성물 또는 단일염기 치환 단백질에 의하여 SNP가 유도되었음을 확인하였다.
즉 본 출원에서 제공하는 단일염기 치환 단백질을 이용하여 세포 내 EGFR 유전자 내 존재하는 시토신을 임의의 염기로 치환함으로써 상기 Osimertinib에 저항을 보일 수 있는 다양한 위치 등에 대한 정보를 알아낼 수 있다.
일 실시예로서, 본 출원은 EGFR 내성 SNP 정보를 수득하는 방법을 제공할 수 있다:
a) 세포에 단일염기 치환 단백질 또는 이를 암호화하는 핵산, 및 가이드 RNA 라이브러리 중 어느 하나 이상의 가이드 RNA 또는 이를 암호화하는 핵산을 도입함;
b) 상기 a)의 세포에 약물 또는 치료제를 처리함;
c) 생존한 세포를 분리함; 및
d) 분리한 세포에서 목적하는 SNP에 대한 정보를 얻음;
을 포함하는 방법일 수 있다.
이 때, 상기 목적하는 SNP는 상기 타겟 유전자로부터 발현되는 단백질의 구조 또는 기능과 관련된 것일 수 있다.
[제3 용도 - 약물 감작(sensitization) 스크리닝]
일 구현예로서, 단일 염기 치환 단백질 또는 이를 포함하는 염기 변형용 조성물은 약물 감작(sensitization) 스크리닝에 이용될 수 있다.
“약물 감작 또는 약물 민감화”는 특정 약물에 과민해지는 상태로 만드는 것으로, 특정 약물에 대한 민감도가 증가된 상태를 의미한다. 이와 반대로, “탈감작”은 특정 약물에 대한 민감도가 상실된 상태를 의미하며, 탈감작은 특정 약물에 내성이 생긴 상태를 포함한다.
약물 감작 스크리닝은 특정 약물에 민감도 증가에 영향을 주는 타겟 유전자 또는 타겟 유전자가 암호화하는 단백질(이하, 표적 단백질로 기재)의 일 영역을 찾거나 확인하는 방법, 조성물, 키트 등을 의미한다.
일 구체예로서, 약물 감작(sensitization) 스크리닝 방법은,
a) 타겟 유전자 내 존재하는 타겟 핵산서열에 상보적으로 결합할 수 있는 하나 이상의 가이드 RNA 라이브러리 중 어느 하나 이상의 가이드 RNA를 발현할 수 있는 세포를 준비함,
b) 상기 세포에 단일염기 치환 단백질 또는 이를 암호화하는 핵산을 도입함;
c) 상기 b)의 세포에 약물 또는 치료제를 처리함;
d) 생존한 세포 분리함; 및
e) 분리한 세포에서 타겟 유전자의 핵산서열을 분석함;
을 포함하는 방법일 수 있다.
일 구현예로, 약물 감작(sensitization) 스크리닝 방법은,
a) 타겟 유전자 내 존재하는 타겟 핵산서열에 상보적으로 결합할 수 있는 하나 이상의 가이드 RNA 라이브러리 중 어느 하나 이상의 가이드 RNA를 발현할 수 있는 세포를 준비함,
- 이 때, 상기 세포는 타겟 핵산서열을 포함함 -;
b) 상기 세포에 단일염기 치환 단백질 또는 이를 암호화하는 핵산을 도입함;
c) 상기 b)의 세포에 약물 또는 치료제를 처리함;
d) 생존한 세포 분리함; 및
e) 분리한 세포에서 목적하는 SNP에 대한 정보를 얻음;
을 포함하는 방법일 수 있다.
이 때, 상기 목적하는 SNP는 상기 타겟 유전자로부터 발현되는 단백질의 구조 또는 기능과 관련된 것일 수 있다.
일 구현예로, 약물 감작(sensitization) 스크리닝 방법은,
a) 타겟 핵산서열을 포함하는 세포에 단일염기 치환 단백질 또는 이를 암호화하는 핵산, 및 가이드 RNA 라이브러리 중 어느 하나 이상의 가이드 RNA 또는 이를 암호화하는 핵산을 도입함;
b) 상기 a)의 세포에 약물 또는 치료제를 처리함;
c) 생존한 세포를 분리함; 및
d) 분리한 세포에서 목적하는 SNP에 대한 정보를 얻음;
을 포함하는 방법일 수 있다.
이 때, 상기 목적하는 SNP는 상기 타겟 유전자로부터 발현되는 단백질의 구조 또는 기능과 관련된 것일 수 있다.
다른 일 구체예로서, 약물 감작(sensitization) 스크리닝 방법은,
a) 염기 치환용 조성물을 타겟 핵산서열을 포함하는 세포에 도입함;
b) 상기 a)의 세포에 약물 또는 치료제를 처리힘;
c) 생존한 세포를 분리힘; 및
d) 분리한 세포에서 타겟 유전자의 핵산서열을 분석함;
을 포함하는 방법일 수 있다.
다른 일 구체예로서, 약물 감작(sensitization) 스크리닝 방법은,
a) 염기 치환용 조성물을 타겟 핵산서열을 포함하는 세포에 도입함;
b) 상기 a)의 세포에 약물 또는 치료제를 처리힘;
c) 생존한 세포를 분리힘; 및
d) 분리한 세포에서 목적하는 SNP에 대한 정보를 얻음;
을 포함하는 방법일 수 있다.
이 때, 상기 목적하는 SNP는 상기 타겟 유전자로부터 발현되는 단백질의 구조 또는 기능과 관련된 것일 수 있다.
상기 가이드 RNA 라이브러리는 타겟 서열의 일부 핵산서열과 상보적으로 결합할 수 있는 하나 이상의 가이드 RNA 집합일 수 있다. 동일한 가이드 RNA 라이브러리를 암호화하는 핵산이 각 세포에 도입되더라도 각 세포는 서로 다른 가이드 RNA를 포함할 수 있다. 동일한 가이드 RNA 라이브러리를 암호화하는 핵산이 각 세포에 도입된 결과, 각 세포는 서로 동일한 가이드 RNA를 포함할 수 있다.
상기 가이드 RNA 관련 설명은 상기 기술한 바와 같다.
상기 단일염기 치환 단백질은 아데닌 치환 단백질 또는 시토신 치환 단백질일 수 있다.
상기 단일염기 치환 단백질, 아데닌 치환 단백질 및 시토신 치환 단백질 관련 설명은 상기 기술한 바와 같다.
상기 도입은 전기천공법(electroporation), 리포좀, 플라스미드, 바이러스 벡터, 나노파티클(nanoparticles) 및 PTD(protein translocation domain)융합 단백질 방법 중 선택되는 1 이상의 방법으로 수행될 수 있다.
상기에서 처리하는 약물은 타겟 유전자가 암호화하는 단백질(이하, 표적 단백질로 기재)의 활성, 기능을 저해 또는 억제하는 물질일 수 있다. 이때, 상기 물질은 생물학적 물질(RNA, DNA, 단백질, 펩타이드, 항체 등) 또는 비생물학적 물질(화합물 등)일 수 있다.
상기에서 처리하는 약물은 표적 단백질의 활성, 기능을 촉진 또는 증가시키는 물질일 수 있다. 이때, 상기 물질은 생물학적 물질(RNA, DNA, 단백질, 펩타이드, 항체 등) 또는 비생물학적 물질(화합물 등)일 수 있다.
상기에서 분리한 세포는 상기 c)에서 처리한 약물에 의해 표적 단백질의 활성, 기능이 현저하게 변한, 즉, 약물 민감감도가 증가한 세포일 수 있다.
이때, 상기 약물 민감도가 증가한 세포는 약물 처리 후 생존한 세포일 수 있다.
상기에서 분리한 세포는 타겟 유전자에 적어도 하나 이상의 뉴클레오타이드의 변형을 포함하는 세포일 수 있다.
이 때, 상기 하나 이상의 뉴클레오타이드의 변형은 타겟 유전자 내에 발생한 하나 이상의 인위적인 단일 염기 다형성(SNP)일 수 있다.
이 때, 상기 하나 이상의 인위적인 단일 염기 다형성(SNP)은 점 돌연변이를 유발시킬 수 있다.
상기에서 타겟 유전자에 존재하는 적어도 하나 이상의 뉴클레오타이드의 변형, 즉, 하나 이상의 인위적인 단일 염기 다형성을 확인할 수 있다. 이를 통하여 목적하는 정보를 얻을 수 있다.
이때, 확인된 적어도 하나 이상의 뉴클레오타이드의 변형, 즉, 하나 이상의 인위적인 단일 염기 다형성을 포함하는 핵산 서열은 약물 민감도 증가에 영향을 주는 단백질의 일 영역을 암호화하는 핵산 서열일 수 있다.
[제4 용도 - 바이러스 내성 유전자 또는 바이러스 내성 단백질 스크리닝]
다른 일 구현예로서, 단일 염기 치환 단백질 또는 이를 포함하는 염기 변형용 조성물은 바이러스 내성 유전자 또는 바이러스 내성 단백질 스크리닝에 이용될 수 있다.
일 구체예로서, 바이러스 내성 유전자 또는 바이러스 내성 단백질 스크리닝 방법은,
a) 타겟 유전자 내 존재하는 타겟 핵산서열에 상보적으로 결합할 수 있는 하나 이상의 가이드 RNA 라이브러리 중 어느 하나 이상의 가이드 RNA를 발현할 수 있는 세포를 준비함,
b) 상기 세포에 단일염기 치환 단백질 또는 이를 암호화하는 핵산을 도입함;
c) 상기 b)의 세포에 약물 또는 치료제를 처리함;
d) 생존한 세포 분리함; 및
e) 분리한 세포에서 타겟 유전자의 핵산서열을 분석함;
을 포함하는 방법일 수 있다.
일 구현예로, 바이러스 내성 유전자 또는 바이러스 내성 단백질 스크리닝 방법은,
a) 타겟 유전자 내 존재하는 타겟 핵산서열에 상보적으로 결합할 수 있는 하나 이상의 가이드 RNA 라이브러리 중 어느 하나 이상의 가이드 RNA를 발현할 수 있는 세포를 준비함,
- 이 때, 상기 세포는 타겟 핵산서열을 포함함 -;
b) 상기 세포에 단일염기 치환 단백질 또는 이를 암호화하는 핵산을 도입함;
c) 상기 b)의 세포에 약물 또는 치료제를 처리함;
d) 생존한 세포 분리함; 및
e) 분리한 세포에서 목적하는 SNP에 대한 정보를 얻음;
을 포함하는 방법일 수 있다.
이 때, 상기 목적하는 SNP는 상기 타겟 유전자로부터 발현되는 단백질의 구조 또는 기능과 관련된 것일 수 있다.
일 구현예로, 바이러스 내성 유전자 또는 바이러스 내성 단백질 스크리닝 방법은,
a) 타겟 핵산서열을 포함하는 세포에 단일염기 치환 단백질 또는 이를 암호화하는 핵산, 및 가이드 RNA 라이브러리 중 어느 하나 이상의 가이드 RNA 또는 이를 암호화하는 핵산을 도입함;
b) 상기 a)의 세포에 약물 또는 치료제를 처리함;
c) 생존한 세포를 분리함; 및
d) 분리한 세포에서 목적하는 SNP에 대한 정보를 얻음;
을 포함하는 방법일 수 있다.
이 때, 상기 목적하는 SNP는 상기 타겟 유전자로부터 발현되는 단백질의 구조 또는 기능과 관련된 것일 수 있다.
다른 일 구체예로서, 바이러스 내성 유전자 또는 바이러스 내성 단백질 스크리닝 방법은,
a) 염기 치환용 조성물을 타겟 핵산서열을 포함하는 세포에 도입함;
b) 상기 a)의 세포에 약물 또는 치료제를 처리힘;
c) 생존한 세포를 분리힘; 및
d) 분리한 세포에서 타겟 유전자의 핵산서열을 분석함;
을 포함하는 방법일 수 있다.
다른 일 구체예로서, 바이러스 내성 유전자 또는 바이러스 내성 단백질 스크리닝 방법은,
a) 염기 치환용 조성물을 타겟 핵산서열을 포함하는 세포에 도입함;
b) 상기 a)의 세포에 약물 또는 치료제를 처리힘;
c) 생존한 세포를 분리힘; 및
d) 분리한 세포에서 목적하는 SNP에 대한 정보를 얻음;
을 포함하는 방법일 수 있다.
이 때, 상기 목적하는 SNP는 상기 타겟 유전자로부터 발현되는 단백질의 구조 또는 기능과 관련된 것일 수 있다.
상기 가이드 RNA 라이브러리는 타겟 서열의 일부 핵산서열과 상보적으로 결합할 수 있는 하나 이상의 가이드 RNA 집합일 수 있다. 동일한 가이드 RNA 라이브러리를 암호화하는 핵산이 각 세포에 도입되더라도 각 세포는 서로 다른 가이드 RNA를 포함할 수 있다. 동일한 가이드 RNA 라이브러리를 암호화하는 핵산이 각 세포에 도입된 결과, 각 세포는 서로 동일한 가이드 RNA를 포함할 수 있다.
상기 가이드 RNA 관련 설명은 상기 기술한 바와 같다.
상기 단일염기 치환 단백질은 아데닌 치환 단백질 또는 시토신 치환 단백질일 수 있다.
상기 단일염기 치환 단백질, 아데닌 치환 단백질 및 시토신 치환 단백질 관련 설명은 상기 기술한 바와 같다.
상기 도입은 전기천공법(electroporation), 리포좀, 플라스미드, 바이러스 벡터, 나노파티클(nanoparticles) 및 PTD(protein translocation domain)융합 단백질 방법 중 선택되는 1 이상의 방법으로 수행될 수 있다.
상기에서 처리하는 바이러스는 타겟 유전자가 암호화하는 단백질(이하, 표적 단백질로 기재)과상호작용하여 세포 내로 도입될 수 있다.
상기에서 생존한 세포는 상기 c)에서 처리한 바이러스와 상호작용하지 않는, 즉, 바이러스 내성을 가지는 세포일 수 있다.
상기에서 분리한 세포는 타겟 유전자에 적어도 하나 이상의 뉴클레오타이드의 변형을 포함하는 세포일 수 있다.
상기에서 분리한 세포는 타겟 유전자에 적어도 하나 이상의 뉴클레오타이드의 변형을 포함하는 세포일 수 있다.
이 때, 상기 하나 이상의 뉴클레오타이드의 변형은 타겟 유전자 내에 발생한 하나 이상의 인위적인 단일 염기 다형성(SNP)일 수 있다.
이 때, 상기 하나 이상의 인위적인 단일 염기 다형성(SNP)은 점 돌연변이를 유발시킬 수 있다.
상기에서 타겟 유전자에 존재하는 적어도 하나 이상의 뉴클레오타이드의 변형, 즉, 하나 이상의 인위적인 단일 염기 다형성을 확인할 수 있다. 이를 통하여 목적하는 정보를 얻을 수 있다.
이때, 확인된 적어도 하나 이상의 뉴클레오타이드의 변형, 즉, 하나 이상의 인위적인 단일 염기 다형성을 포함하는 핵산 서열은 바이러스와 상호작용에 중요한 단백질의 일 영역을 암호화하는 핵산 서열일 수 있다.
본 명세서에 의해 개시되는 발명의 일 태양은 단일염기 치환방법이다.
상기 염기 치환용 조성물은 유전자 내에 하나 이상의 뉴클레오타이드의 염기에 인위적인 변형을유도 또는 발생시킬 수 있다.
상기 인위적인 변형 또는 치환은 가이드 RNA-단일 염기 치환 단백질 복합체에 의해 유도 또는 발생될 수 있다.
이때, 상기 가이드 RNA-단일 염기 치환 단백질 복합체는 i) 타겟 핵산서열 타겟팅, ii) 타겟 핵산서열 절단, iii) 타겟 핵산서열 내에 하나 이상의 뉴클레오타이드의 탈아미노화, iv) 탈아미노화 된 염기 제거, 및 v) 염기가 제거된 타겟 핵산서열의 수선 또는 수복하는 단계 중 하나 이상의 단계에서 작용할 수 있다. 이때, 상기 단계는 순차적 또는 동시에 발생할 수 있으며, 또한, 상기 단계의 순서는 변경될 수 있다.
i) 타겟 핵산서열 표적화
“타겟 핵산서열”은 타겟 유전자 또는 핵산 내에 존재하는 뉴클레오타이드 서열로, 구체적으로는 타겟 유전자 또는 핵산 내에 타겟 영역의 일부 뉴클레오타이드 서열이며, 이때 “타겟 영역”은 타겟 유전자 또는 핵산 내에 가이드 RNA-단일 염기 치환 단백질 복합체에 의해 변형될 수 있는 부위이다.
이하에서, 타겟 서열이라 함은 두 가지의 뉴클레오타이드서열 정보 모두를 의미하는 용어로 사용될 수 있다. 예를 들어, 타겟 유전자의 경우, 타겟 핵산서열은 타겟 유전자 DNA의 transcribed strand의 서열 정보를 의미하는 것일 수도 있고, 또는 non-transcribed strand의 뉴클레오타이드서열 정보를 의미하는 것일 수도 있다.
예를 들어, 타겟 핵산서열은 타겟 유전자 A의 타겟 영역 중 일부 뉴클레오타이드서열(transcribed strand)인 5'-ATCATTGGCAGACTAGTTCG-3'(SEQ ID NO: 17)을 의미할 수도 있으며, 이에 상보적인 뉴클레오타이드 서열(non-transcribed strand)인 5'-CGAACTAGTCTGCCAATGAT-3'(SEQ ID NO: 18)을 의미할 수도 있다.
타겟 핵산서열은 5 내지 50개의 뉴클레오타이드서열일 수 있다.
일 구체예로서 상기 타겟 핵산서열은 16개의 뉴클레오타이드 서열, 17개의 뉴클레오타이드 서열, 18개의 뉴클레오타이드 서열, 19개의 뉴클레오타이드 서열, 20개의 뉴클레오타이드 서열, 21개의 뉴클레오타이드 서열, 22개의 뉴클레오타이드 서열, 23개의 뉴클레오타이드 서열, 24개의 뉴클레오타이드 서열 또는 25개의 뉴클레오타이드 서열일 수 있다.
타겟 핵산서열은 가이드 RNA 결합 서열 혹은 가이드 RNA 비결합 서열을 포함한다.
“가이드 RNA 결합 서열(guide nucleic acid-binding sequence)”은 가이드 RNA의 가이드 도메인에 포함되는 가이드 서열과 일부 또는 완전한 상보성을 가지는 뉴클레오타이드 서열로, 가이드 RNA의 가이드 도메인에 포함되는 가이드 서열과 상보적인 결합을 할 수 있다. 타겟 핵산서열 및 가이드 RNA 결합 서열은 타겟 유전자 또는 핵산에 따라, 즉 유전자 조작 또는 변형하고자 하는 대상에 따라 달라질 수 있는 뉴클레오타이드 서열로, 타겟 유전자 또는 핵산에 따라 다양하게 설계될 수 있다.
“가이드 RNA 비결합 서열(guide nucleic acid-non-binding sequence)”은 가이드 RNA의 가이드 도메인에 포함되는 가이드 서열과 일부 또는 완전한 상동성을 가지는 뉴클레오타이드 서열로, 가이드 RNA의 가이드 도메인에 포함되는 가이드 서열과 상보적인 결합을 할 수 없다. 또한, 가이드 RNA 비결합 서열은 가이드 RNA 결합 서열과 상보성을 가지는 뉴클레오타이드 서열로, 가이드 RNA 결합 서열과 상보적인 결합을 할 수 있다.
가이드 RNA 결합 서열은 타겟 핵산서열 중 일부 뉴클레오타이드 서열로, 타겟 핵산서열의 두 가지 서로 다른 서열순서를 가지는 뉴클레오타이드 서열, 즉, 서로 상보적인 결합을 할 수 있는 두 가지의 뉴클레오타이드 서열 중 한 가지 뉴클레오타이드 서열일 수 있다. 이때, 가이드 RNA 비결합 서열은 타겟 핵산서열 중 가이드 RNA 결합 서열을 제외한 나머지 뉴클레오타이드 서열일 수 있다.
예를 들면, 타겟 유전자 A의 타겟 영역 중 일부 뉴클레오타이드 서열인 5'-ATCATTGGCAGACTAGTTCG-3'(SEQ ID NO: 17)과 이에 상보적인 뉴클레오타이드 서열인 5'-CGAACTAGTCTGCCAATGAT-3'(SEQ ID NO: 18)을 타겟 핵산서열로 할 때, 가이드 RNA 결합 서열은 두 개의 타겟 핵산서열 중 하나, 즉, 5'-ATCATTGGCAGACTAGTTCG-3'(SEQ ID NO: 17) 또는 5'-CGAACTAGTCTGCCAATGAT-3'(SEQ ID NO: 18)일 수 있다. 이때, 가이드 RNA 비결합 서열은, 가이드 RNA 결합 서열이 5'-ATCATTGGCAGACTAGTTCG-3'(SEQ ID NO: 17)인 경우, 5'-CGAACTAGTCTGCCAATGAT-3'(SEQ ID NO: 18)일 수 있고, 또는 가이드 RNA 결합 서열이 5'-CGAACTAGTCTGCCAATGAT-3'(SEQ ID NO: 18)인 경우 가이드 RNA 비결합 서열은 5'-ATCATTGGCAGACTAGTTCG-3'(SEQ ID NO: 17)일 수 있다.
가이드 RNA 결합 서열은 타겟 핵산서열, 즉, transcribed strand와 동일한 뉴클레오타이드 서열 및 non-transcribed strand와 동일한 뉴클레오타이드 서열 중 선택된 하나의 뉴클레오타이드 서열일 수 있다. 이때, 가이드 RNA 비결합 서열은 타겟 핵산서열 중 가이드 RNA 결합 서열, 즉, transcribed strand와 동일한 뉴클레오타이드 서열 및 non-transcribed strand와 동일한 뉴클레오타이드서열 중 선택된 하나의 뉴클레오타이드 서열을 제외한 나머지 뉴클레오타이드 서열일 수 있다.
가이드 RNA 결합 서열은 타겟 핵산서열의 길이와 동일할 수 있다.
가이드 RNA 비결합 서열은 타겟 핵산서열 또는 가이드 RNA 결합 서열의 길이와 동일할 수 있다.
가이드 RNA 결합 서열은 5 내지 50개의 뉴클레오타이드 서열일 수 있다.
일 구체예로서 상기 가이드 RNA 결합 서열은 16개의 뉴클레오타이드 서열, 17개의 뉴클레오타이드서열, 18개의 뉴클레오타이드 서열, 19개의 뉴클레오타이드 서열, 20개의 뉴클레오타이드서열, 21개의 뉴클레오타이드 서열, 22개의 뉴클레오타이드 서열, 23개의 뉴클레오타이드 서열, 24개의 뉴클레오타이드 서열 또는 25개의 뉴클레오타이드 서열일 수 있다.
가이드 RNA 비결합 서열은 5 내지 50개의 뉴클레오타이드 서열일 수 있다.
일 구체예로서 상기 가이드 RNA 비결합 서열은 16개의 뉴클레오타이드 서열, 17개의 뉴클레오타이드서열, 18개의 뉴클레오타이드 서열, 19개의 뉴클레오타이드 서열, 20개의 뉴클레오타이드 서열, 21개의 뉴클레오타이드 서열, 22개의 뉴클레오타이드 서열, 23개의 뉴클레오타이드 서열, 24개의 뉴클레오타이드 서열 또는 25개의 뉴클레오타이드 서열일 수 있다.
가이드 RNA 결합 서열은 가이드 RNA의 가이드 도메인에 포함된 가이드 서열과 일부 또는 완전한상보적인 결합을 할 수 있으며, 상기 가이드 RNA 결합 서열의 길이는 가이드 서열의 길이와 동일할 수 있다.
상기 가이드 RNA 결합 서열은 가이드 RNA의 가이드 도메인에 포함된 가이드 서열에 상보적인 뉴클레오타이드 서열일 수 있으며, 예를 들어 최소한 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상보적이거나 또는 완전하게 상보적인 뉴클레오타이드 서열일 수 있다.
일 예로, 상기 가이드 RNA 결합 서열은 가이드 RNA의 가이드 도메인에 포함된 가이드 서열에 상보적이지 않은 1 내지 8개의 뉴클레오타이드 서열을 가지거나 또는 포함할 수 있다.
가이드 RNA 비결합 서열은 가이드 RNA의 가이드 도메인에 포함된 가이드 서열과 일부 또는 완전한 상동성을 가질 수 있으며, 상기 가이드 RNA 비결합 서열의 길이는 가이드 서열의 길이와 동일할 수 있다.
상기 가이드 RNA 비결합 서열은 가이드 RNA의 가이드 도메인에 포함된 가이드 서열에 상동성을 가진 뉴클레오타이드 서열일 수 있으며, 예를 들어 최소한 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상동성이거나 또는 완전하게 상동성인 뉴클레오타이드 서열일 수 있다.
일 예로, 상기 가이드 RNA 비결합 서열은 가이드 RNA의 가이드 도메인에 포함된 가이드 서열에 상동적이 않은 1 내지 8개의 뉴클레오타이드 서열을 가지거나 포함할 수 있다.
가이드 RNA 비결합 서열은 가이드 RNA 결합 서열과 상보적 결합을 할 수 있으며, 상기 가이드 RNA 비결합 서열은 가이드 RNA 결합 서열의 길이와 동일할 수 있다.
상기 가이드 RNA 비결합 서열은 가이드 RNA 결합서열에 상보적인 뉴클레오타이드 서열일 수 있으며, 예를 들어 최소한 90% 또는 95% 이상의 상보적이거나 또는 완전하게 상보적인 뉴클레오타이드 서열일 수 있다.
일 예로, 상기 가이드 RNA 비결합 서열은 가이드 RNA 결합 서열에 상보적이지 않은 1 내지 2개의 뉴클레오타이드 서열을 가지거나 포함할 수 있다.
또한, 상기 가이드 RNA 결합 서열은 CRISPR 효소가 인식할 수 있는 뉴클레오타이드 서열에 근접한 위치에 위치한 뉴클레오타이드 서열일 수 있다.
일 예로, 상기 가이드 RNA 결합 서열은 CRISPR 효소가 인식할 수 있는 뉴클레오타이드 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 5 내지 50개의 뉴클레오타이드 서열일 수 있다.
또한, 상기 가이드 RNA 비결합 서열은 CRISPR 효소가 인식할 수 있는 뉴클레오타이드 서열에 근접한 위치에 뉴클레오타이드 서열일 수 있다.
일 예로, 상기 가이드 RNA 비결합 서열은 CRISPR 효소가 인식할 수 있는 뉴클레오타이드 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 5 내지 50개의 뉴클레오타이드 서열일 수 있다.
“표적화(targeting)”는 타겟 유전자 또는 핵산 내에 존재하는 타겟 핵산서열 중 가이드 RNA 결합 서열과 상보적 결합을 하는 것을 의미한다. 이때, 상기 상보적 결합은 100%의 완전한 상보적 결합일 수 있고, 또는 70% 이상 100% 미만의 불완전한 상보적 결합일 수 있다. 따라서, “표적화하는 gRNA”는 타겟 유전자 또는 핵산 내에 존재하는 타겟 핵산서열 중 가이드 RNA 결합 서열과 상보적 결합을 하는 gRNA를 의미한다.
상기 가이드 RNA-단일 염기 치환 단백질 복합체는 타겟 핵산서열을 표적화할 수 있다.
ii) 타겟 핵산서열 절단
상기 가이드 RNA-단일 염기 치환 단백질 복합체는 타겟 핵산서열을 절단할 수 있다.
이때, 상기 타겟 핵산서열이 이중 가닥의 핵산인 경우, 상기 절단은 이중 가닥을 모두 절단하는 것일 수 있다. 또는 상기 절단은 이중 가닥 중 하나의 가닥만 절단하는 것일 수 있다.
이때, 상기 타겟 핵산서열이 단일 가닥의 핵산의 경우, 상기 절단은 단일 가닥을 절단하는 것일 수 있다.
또는, 타겟 핵산서열 절단은 가이드 RNA-단일 염기 치환 단백질 복합체를 구성하는 CRISPR 효소의 종류에 따라 절단 형태가 달라질 수 있다.
예를 들어, 상기 가이드 RNA-단일 염기 치환 단백질 복합체를 구성하는 CRISPR 효소가 야생행 CRISPR 효소(예컨대, SpCas9)인 경우, 상기 타겟 핵산서열 절단은 타겟 핵산서열의 이중 가닥을 모두 절단하는 것일 수 있다.
다른 예를 들서, 상기 상기 가이드 RNA-단일 염기 치환 단백질 복합체를 구성하는 CRISPR 효소가 CRISPR 효소 변이체인 니케이즈(예컨대, Nureki nCas9)인 경우, 상기 타겟 핵산서열 절단은 타겟 핵산서열의 이중 가닥 중 하나의 가닥을 절단하는 것일 수 있다.
iii) 타겟 핵산서열 내에 하나 이상의 뉴클레오타이드의 탈아미노화
상기 가이드 RNA-단일 염기 치환 단백질 복합체는 타겟 핵산서열 내에 하나 이상의 뉴클레오타이드가 가지는 염기의 아미노(-NH2)기를 탈아미노화할 수 있다.
이때, 상기 탈아미노화는 시토신 또는 아데닌 염기에서 발생할 수 있다.
예를 들어, 타겟 핵산서열 내에 아데닌을 가지는 뉴클레오타이드가 5개(이때, 5개의 뉴클레오타이드는연속되거나 연속되지 않을 수 있다.)인 경우, 상기 가이드 RNA-단일 염기 치환 단백질 복합체는 아데닌을 가지는 뉴클레오타이드 5개의 아데닌의 아미노(-NH2)기를 모두 탈아미노화할 수 있다.
다른 예를 들어, 타겟 핵산서열 내에 시토신을 가지는 뉴클레오타이드가 8개(이때, 5개의 뉴클레오타이드는연속되거나 연속되지 않을 수 있다.)인 경우, 상기 가이드 RNA-단일 염기 치환 단백질 복합체는 시토신을 가지는 뉴클레오타이드 8개 중 3개의 뉴클레오타이드가 가지는 시토신의 아미노(-NH2)기를 탈아미노화할 수 있다.
탈아미노화가 발생하는 염기는 가이드 RNA-단일 염기 치환 단백질 복합체를 구성하는 디아미네이즈의 종류에 따라 달라질 수 있다.
예를 들어, 상기 가이드 RNA-단일 염기 치환 단백질 복합체를 구성하는 디아미네이즈가 아데노신 디아미네이즈(예컨대, TadA 또는 TadA 변이체)인 경우, 상기 탈아미노화는 아데닌에서 발생할 수 있다. 이때, 아데닌의 아미노(-NH2)기가 탈아미노화되면서 케토(=O)기가 형성될 수 있다. 상기 아데닌의 탈아미노화에 의해 히포그산틴이 생성될 수 있다.
다른 예를 들어, 상기 가이드 RNA-단일 염기 치환 단백질 복합체를 구성하는 디아미네이즈가 시티딘 디아미네이즈(예컨대, APOBEC1 또는 APOBEC1 변이체)인 경우, 상기 탈아미노화는 시토신에서 발생할 수 있다. 이때, 시토신의 아미노(-NH2)기가 탈아미노화되면서 케토(=O)기가 형성될 수 있다. 상기 시토신의 탈아미노화에 의해 우라실이 생성될 수 있다.
iv) 탈아미노화 된 염기 제거
상기 가이드 RNA-단일 염기 치환 단백질 복합체는 iii) 단계에 의해 생성된 탈아미노화 된 염기를 제거할 수 있다. 이때, 탈아미노화 된 염기 제거는 iii) 단계에 의해 생성된 탈아미노화 된 염기를 전부 또는 일부를 제거하는 것일 수 있다.
이때, 상기 탈아미노화된 염기는 탈아미노화된 시토신 또는 탈아미노화된 아데닌일 수 있다.
이때, 상기 탈아미노화된 염기는 우라실 또는 히포그산틴일 수 있다.
탈아미노화 된 염기의 제거는 가이드 RNA-단일 염기 치환 단백질 복합체를 구성하는 DNA 글리코실레이즈의 종류에 따라 달라질 수 있다.
예를 들어, 상기 가이드 RNA-단일 염기 치환 단백질 복합체를 구성하는 DNA 글리코실레이즈가 Alkyladenine DNA glycosylase(AAG) 또는 AAG 변이체인 경우, 뉴클레오타이드를 구성하는 디옥시리보스 또는 리보스와 염기(탈아미노화 된 아데닌 또는 히포그산틴)를 연결하는 N-글리코시드 결합(N-glycoside linkage)을 가수분해시킬 수 있다. 또한, AP 부착자리(AP site, apurinic/apyrimidinic site)를 형성할 수 있다. 상기 AP 부착자리는 자발적 또는 DNA(또는 RNA) 손상으로 인해 퓨린 또는 피리미딘 염기가 없는 DNA(또는 RNA)의 위치일 수 있다.
다른 예를 들어, 상기 가이드 RNA-단일 염기 치환 단백질 복합체를 구성하는 DNA 글리코실레이즈가 Uracil-DNA glycosylase(UDG or UNG) 또는 UDG 변이체인 경우, 뉴클레오타이드를 구성하는 디옥시리보스 또는 리보스와 염기(탈아미노화 된 시토신 또는 유라실)를 연결하는 N-글리코시드 결합(N-glycoside linkage)을 가수분해시킬 수 있다. 또한, AP 부착자리(AP site, apurinic/apyrimidinic site)를 형성할 수 있다.
v) 염기가 제거된 타겟 핵산서열의 수선 또는 수복
염기가 제거된 타겟 핵산서열의 수선 또는 수복은 타겟 핵산서열의 절단에 따른 수선 또는 수복을 포함한다.
상기 염기가 제거된 타겟 핵산서열은 절단된 타겟 핵산서열일 수 있다.
이때, 상기 절단된 타겟 핵산서열은 이중 가닥이 모두 절단된 타겟 핵산서열일 수 있다.
이때, 상기 절단된 타겟 핵산서열은 이중 가닥 중 하나의 가닥이 절단된 타겟 핵산서열일 수 있다. 이때, 절단된 하나의 가닥은 염기가 제거된 가닥일 수 있다. 또는, 절단된 하나의 가닥은 염기가 제거되지 않은 가닥일 수 있다.
염기가 제거된 타겟 핵산서열의 수선 또는 수복은 타겟 핵산서열 내에 하나 이상의 염기가 제거된 뉴클레오타이드의 AP 부착자리에 임의의 염기, 즉, 아데닌, 시토신, 구아닌, 티민 또는 우라실로 수선 또는 수복되는 것일 수 있다.
예를 들어, 타겟 핵산서열 내에 하나 이상의 탈아미노화 된 아데닌이 제거된 뉴클레오타이드의 AP 부착자리가 구아닌으로 수복되는 것일 수 있다. 또는, 타겟 핵산서열 내에 하나 이상의 탈아미노화 된 아데닌이 제거된 뉴클레오타이드의 AP 부착자리가 시토신으로 수복되는 것일 수 있다. 타겟 핵산서열 내에 하나 이상의 탈아미노화 된 아데닌이 제거된 뉴클레오타이드의 AP 부착자리가 티민으로 수복되는 것일 수 있다. 타겟 핵산서열 내에 하나 이상의 탈아미노화 된 아데닌이 제거된 뉴클레오타이드의 AP 부착자리가 우라실으로 수복되는 것일 수 있다. 타겟 핵산서열 내에 하나 이상의 탈아미노화 된 아데닌이 제거된 뉴클레오타이드의 AP 부착자리가 아데닌으로 수복되는 것일 수 있다.
다른 예를 들어, 타겟 핵산서열 내에 하나 이상의 탈아미노화 된 시토신이 제거된 뉴클레오타이드의 AP 부착자리가 아데닌으로 수복되는 것일 수 있다. 또는, 타겟 핵산서열 내에 하나 이상의 탈아미노화 된 시토신이 제거된 뉴클레오타이드의 AP 부착자리가 구아닌으로 수복되는 것일 수 있다. 또는, 타겟 핵산서열 내에 하나 이상의 탈아미노화 된 시토신이 제거된 뉴클레오타이드의 AP 부착자리가 티민으로 수복되는 것일 수 있다. 또는, 타겟 핵산서열 내에 하나 이상의 탈아미노화 된 시토신이 제거된 뉴클레오타이드의 AP 부착자리가 우라실으로 수복되는 것일 수 있다. 또는, 타겟 핵산서열 내에 하나 이상의 탈아미노화 된 시토신이 제거된 뉴클레오타이드의 AP 부착자리가 시토신으로 수복되는 것일 수 있다.
상기 인위적인 변형은 유전자의 엑손, 인트론, splicing site, 조절 영역(인핸서, 억제자영역), 5'말단 또는 그의 인접한 부위, 3'말단 또는 그의 인접한 부위 등에서 발생할 수 있다.
예를 들어, 상기 인위적인 변형은 엑손 영역에 하나 이상의 염기서열이 치환된 것일 수 있다. 예를 들어, 유전자 내 엑손 영역에 하나 이상의 A 및/또는 C가 다른 임의의 염기서열(A, C, T, G, U)로 치환된 것일 수 있다.
다른 예를 들어, 상기 인위적인 변형은 인트론 영역에 하나 이상의 염기서열이 치환된 것일 수 있다. 예를 들어, 유전자 내 인트론 영역에 하나 이상의 A 및/또는 C가 다른 임의의 염기서열(A, C, T, G, U)로 치환된 것일 수 있다.
예를 들어, 상기 인위적인 변형은 splicing site에 하나 이상의 염기서열이 치환된 것일 수 있다. 예를 들어, 유전자 내 splicing site에 하나 이상의 A 및/또는 C가 다른 임의의 염기서열(A, C, T, G, U)로 치환된 것일 수 있다.
다른 예를 들어, 상기 인위적인 변형은 조절 영역(인핸서, 억제자영역)에 하나 이상의 염기서열이 치환된 것일 수 있다. 예를 들어, 유전자 내 조절 영역(인핸서, 억제자영역)에 하나 이상의 A 및/또는 C가 다른 임의의 염기서열(A, C, T, G, U)로 치환된 것일 수 있다.
상기 인위적인 변형은 단백질을 암호화하는 유전자의 코돈 서열이 변형된 것일 수 있다.
“코돈”은 유전자로부터 아미노산을 부호화(encoding)되어 있는 유전 부호 중 하나를 말한다. DNA가 전령RNA로 전사될 때, 이러한 전령RNA의 염기서열은 세개씩 코돈을 형성한다. 코돈은 한 종류의 아미노산을 암호화할 수 있고, 또는 아미노산 합성을 종결시키는 종결 코돈일 수 있다.
상기 인위적인 변형은 하나 이상의 단일 염기 서열 변형에 의해 단백질을 암호화하는 코돈 서열이 변형된 것일 수 있고, 변형된 코돈 서열은 동일한 아미노산 또는 다른 아미노산을 암호화할 수 있다.
예를 들어, 하나 이상의 핵산 서열이 C에서 T로 변경되는 경우 프롤린을 암호화하는 CCC는 류신(Leucine)을 암호화하는 CUU 또는 CUC, 세린(serine)을 암호화하는 UCC 또는 UCU, 또는 페닐알라닌(phenyl-alanine)을 암호화하는 UUC 또는 UUU 등으로 코돈이 변형될 수 있다.
예를 들어, 하나 이상의 핵산 서열이 A에서 C로 변경되는 경우, 트레오닌(Threonine)을 암호화하는 ACC 또는 ACA는 프롤린을 암호화하는 CCC 또는 CCA 등으로 코돈이 변형될 수 있다.
예를 들어, 하나 이상의 핵산 서열이 A에서 G로 변경되는 경우, 리신을 암호화하는 AAA는 글루타민산을 암호화하는 GAA 또는 GAG, 글리신(Glycine)을 암호화하는 GGA 또는 GGG, 또는 아르기닌(Arginine)을 암호화하는 AGA 또는 AGG 등으로 코돈이 변형될 수 있다.
[발명의 실시를 위한 형태]
이하, 실시예를 통하여 본 발명을 더욱 상세히 설명하고자 한다.
이들 실시예는 오로지 본 발명을 보다 구체적으로 설명하기 위한 것으로서, 본 발명의 범위가 이들 실시예에 의해 제한되지 않는다는 것은 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 있어 자명할 것이다.
실험 방법
[제1 실시예]
실시예 1-1: 플라스미드 구축 (Plasmid construction)
플라스미드는 Gibson Assembly (NEB Builder HiFi DNA Assembly kit, NEB)를 이용하여 구축하였다. 도 3 (a), 도 7 (a) 및 도 21의 각각 단편을 PCR을 이용하여 증폭시킨 후, Gibson Assembly Master mix에 PCR로 증폭한 DNA 단편을 추가한 뒤, 50℃ 60분 동안 인큐베이트(incubate)하였다. 모든 플라스미드는 CMV 프로모터, p15A 복제개시점 및 암피실린(ambicillin) 항생제 저항 유전자를 선택마커를 포함한다. 일부 플라스미드는 인간 코돈-최적화된 WT-Cas9(P3s-Cas9HC; Addgene plasmid #43945) 또는 이의 변이체를 포함한다.
실시예 1-2: 세포 배양 및 형질 도입 (Cell culture and transfection)
(1) HEK293T 세포: 단일 염기 치환 CRISPR 단백질 형질 도입
HEK293T 세포는 5% CO2 하에서 37℃에서 10% FBS와 1% 항생제가 첨가된 Dulbeccco's Modified Eagle's 배지 (DMEM, Welgene)에서 배양하였다. 형질 감염 전 HEK293T 세포를 6-well 플레이트에 well 당 2x105의 밀도로 분주하였다. 그 후 1ug BE3 (WT, bpNLS, xCas-UNG, UNG-xCas, scFv-APO-UNG 또는 scFv-UNG-APO) 및 1ug sgRNA-발현 플라스미드(hEMX1 GX19 or GX20)을 200ul Opti-MEM 배지에서 4uL 리포펙타민(lipofectamine)TM2000(thermo Fisher Scientific, 11668019)을 이용하여 형질감염 시켰다.
(2) Hela 세포: 단일 염기 치환 CRISPR 단백질 형질 도입
Hela 세포는 5% CO2하에서 37℃에서 10% FBS와 1% 항생제가 첨가된 Dulbecco's Modified Eagle's Medium(DMEM, Welgene)에서 배양하였다. 형질 감염 전 Hela 세포를 6-well 플레이트에 well 당 2x105의 밀도로 분주하였다. 그 후 1ug 염기 치환 플라스미드(BE3 WT, bpNLS BE3, ung-ncas, ncas-ung 또는 ncas-delta UNG) 및 1ug sgRNA-발현 플라스미드를 200ul Opti-MEM 배지에서 4uL 리포펙타민(lipofectamine)TM2000(thermo Fisher Scientific, 11668019)을 이용하여 형질감염 시켰다.
(3) HEK293T 세포: 단일 염기 치환 CRISPR 단백질 형질 도입
HEK293T 세포는 5% CO2 하에서 37℃에서 10% FBS와 1% 항생제가 첨가된 Dulbeccco's Modified Eagle's 배지 (DMEM, Welgene)에서 배양하였다. 형질 감염 전 HEK293T 세포를 12-well 플레이트에 well 당 2x105의 밀도로 분주하였다. 그 후 500ng 염기 치환 플라스미드(bpNLS-UNG-APOBEC-Nureki nCas9-bpNLS), 500ng sgRNA-발현 플라스미드(hEMX1 GX19 or GX20)를 200ul Opti-MEM 배지에서 2uL 리포펙타민(lipofectamine)TM2000(thermo Fisher Scientific, 11668019)을 이용하여 형질감염 시켰다.
실시예 1-3: hEMX1 GX19 sgRNA, hEMX1 GX20 sgRNA 설계 및 합성
(1) sgRNA 설계 및 합성
CRISPR RGEN Tools((http://www.rgenome.net; Park et al, Bioinformatics 31:4014-4016, 2015)을 이용하여, hEMX 유전자의 “NGG PAM” 또는 “NG”PAM을 고려한 guide RNA를 디자인하였다. 디자인한 guide RNA는 On-target 부위를 제외하고 1 base 또는 2 base mismatch가 없는 것을 고려하였다.
sgRNA발현 플라스미드를 생성하는데 사용된 올리고(표 1참고)를 어닐링 및 연장시킨 후, pRG2 플라스미드의 Bsa1 부위에 클로닝 시켰다.
sgRNA name sequence
GX19 GAGTCCGAGCAGAAGAAGAA (서열번호 39)
GX20 TGCCCCTCCCTCCCTGGCCC (서열번호 40)
Nureki sgRNA 1 GAGGACAAAGTACAAACGGC (서열번호 41)
Nureki sgRNA 2 GGGCTCCCATCACATCAACC (서열번호 42)
Nureki sgRNA3 GGCCCCAGTGGCTGCTCTGG (서열번호 43)
Nureki sgRNA 4 GCTTTACCCAGTTCTCTGGG (서열번호 44)
(2) Deep sequencing
Hipi Plus DNA polymerase (Elpis-bio)를 사용하여 온-타겟(ontarget) 및 오프-타겟(off-target) 부위를 200~300bp 크기로 PCR 증폭시켰다. 상기의 방법으로 얻어진 PCR 산물을 Mi-seq. (Illumina)장비를 이용하여 sequencing 하여 CRISPR RGEN tool(www.rgenome.net)의 Cas Analyzer를 통해 분석하였다. CRISPR/Cas9 절단 부위로부터 5bp 이내에서의 치환을 단일 염기 치환 CRISPR 단백질로부터 유도된 변이로 간주하였다.
실시예 1-4: 실험 결과
본 실시예에서 단일 염기 치환 CRISPR 단백질을 이용하여 시토신(C)이 아데닌(A), 티민(T) 또는 구아닌(G)으로 치환 효과를 확인하였다.
(1) bpNLS 검증
HEK cell에서 BE3 WT 및 bpNLS BE3 WT를 이용하여 bpNLS BE3 WT가 BE3 WT보다 C to T 치환율(substitution rate)가 증가하였음을 확인하였다(도 7 (b)참고).
(2) 단일 염기 치환 CRISPR 단백질의 염기 치환 효율 확인
1) Hela cell에서 C to N(A, T, G) 효율 확인
Hela cell에서 단일 염기 치환 CRISPR 단백질을 이용하여 hEMX1 GX19 sgRNA target에서 C to N으로의 치환율을 확인하였다.
실험 결과, UGI 를 제거한 ncas-delta UGI는 BE3 WT과 C to G 또는 C to A의 치환율 차이가 거의 없음을 확인하였다. 반면에 UNG을 융합시킨 UNG-ncas, ncas-UNG은 BE3 WT와 비교하여 C to G 또는 C to A의 치환율이 증가하였음을 확인하였다(도 8 참고). 이러한 결과를 통해, BE3 WT에 UGI를 UNG으로 치환할 경우 C to G 또는 C to A로 염기 치환될 확률이 증가함을 확인하였다.
또한, hEMX1 GX19 sgRNA 시퀀스에서 15C, 16C의 염기 치환율을 확인하였다. 실험 결과 15C, 16C에서 BE3 WT, bpNLS BE3 보다 UNG-ncas, ncas-UNG에서 C to G 또는 C to A로 염기 치환될 확률이 증가함을 확인하였다(도 9 참고).
hEMX1 GX19 sgRNA 시퀀스에서 16C보다 15C에서 에서 C to G 또는 C to A로 염기 치환이 더 잘 일어났으며, UNG-ncas구조를 가진 단일 염기 치환 CRISPR 단백질에서 C to G 또는 C to A 염기 치환 확률이 가장 높음을 확인하였다(도 9 참고).
2) HEK cell에서 C to N(A, T, G) 효율 확인
HEK cell에서 hEMX1 GX20 sgRNA target으로 단일 염기 치환 CRISPR 단백질의 C to N으로의 치환율을 확인하였다.
실험 결과, hEMX1 GX19 sgRNA 시퀀스에서 13C, 15C, 16C 17C에서 염기 치환이 일어남을 확인하였다(도 10 참고).
또한, HEK cell에서는 ncas-UNG이 UNG-ncas보다 C to N으로 염기 치환율이 높음을 확인하였다 (도 11 참고). 특히 15C, 16C, 17C에서는 UNG-ncas 가 ncas-UNG보다 C to G 또는 C to A로 염기 치환이 더 잘 일어남을 확인하였다(도 11 참고).
또한, 단일 염기 치환 CRISPR 단백질 복합체, 즉, single chain variable fragment (scFv)을 포함하는 융합 염기 치환 도메인(scFv-APO-UNG 또는 scFv-UNG-APO)을 이용하여 hEMX1 타겟 핵산서열 내 단일 염기 치환 효율을 확인한 결과, 11C에서는 C to A로, 15C와 16C에서는 C to G로 염기 치환이 더 잘 일어남을 확인하였다(도 22 내지 24 참고).
(3) Nureki nCas9 검증
단일 염기 치환 CRISPR 단백질을 이용하여 랜덤 에러(random error)를 줄 수 있는 타겟 사이트를 확장하고자 NG PAM 서열을 가진 Nureki nCas9을 이용하여 실험을 진행하였다.
hEMX1 GX17 sgRNA, hEMX1 GX20 sgRNA를 이용하여 실험을 진행한 결과, HEK cell에서 잘 작동함을 확인하였다. 특히 NG PAM에서 C to N으로 치환이 일어남을 확인하였다(도 12 참고).
[제2 실시예]
실시예 2-1: 플라스미드 구축 (Plasmid construction)
플라스미드는 Gibson Assembly (NEB Builder HiFi DNA Assembly kit, NEB)를 이용하여 구축하였다. 도 4의 각각 단편을 PCR을 이용하여 증폭시킨 후, Gibson Assembly Master mix에 PCR로 증폭한 DNA 단편을 추가한 뒤, 50℃60분 동안 인큐베이트(incubate)하였다. 모든 플라스미드는 인간 코돈-최적화된 WT-Cas9(P3s-Cas9HC; Addgene plasmid #43945), CMV 프로모터, p15A 복제개시점 및 암피실린(ambicillin) 항생제 저항 유전자를 선택마커를 포함한다 (도 19 및 20 참고).
실시예 2-2: sgRNA 설계 및 합성
(1) sgRNA 설계
과학 전문지 '네이처'에 게재된 “base editing of A?T to G?C in genomic DNA without DNA cleavage”논문에서 Extended Data Figure 2에 명시된 sgRNA들 중 3개를 선정하였다 (도 25 참고).
(2) sgRNA 합성
2개의 상보적 올리고뉴클레오타이드를 어닐링 및 연장시켜 sgRNA 합성을 위한 주형들을 PCR-증폭시켰다.
상기 주형 DNA(타겟 서열에서 3'말단의 'NGG' 제외)에 대하여 T7 RNA polymerase (New England Biolabs)를 이용하여 in vitro transcription)을 수행하였고, 제조자 사용 설명서에 따라서 RNA를 합성한 후 Turbo DNAse(Ambion)를 사용하여 주형 DNA를 제거하였다. Expin Combo kit(GeneAll)과 이소프로판올 침전을 통하여 전사된 RNA를 정제하였다.
본 실시예에서, 상기 chemically synthesized sgRNA는 2'OMe 및 phosphorothioate로 변형된 것을 사용하였다.
실시예 2-3: 세포 배양 및 형질 도입 (cell culture and transfection)
(1) HEK293T 세포: 단일 염기 치환 CRISPR 단백질 형질 도입
HEK293T 세포는 5% CO2 하에서 37℃에서 10% FBS와 1% 항생제가 첨가된 Dulbeccco's Modified Eagle's 배지 (DMEM, Welgene)에서 배양하였다. 형질 감염 전 HEK293T 세포를 24-well 플레이트에 well 당 5x104의 밀도로 분주하였다. 그 후 서로 다른 세개의 1ug sgRNA 발현 플라스미드에 각각 3ug ABE (WT, N-AAG, C-AAG)을 200ul Opti-MEM 배지에서 12uL Fugene®HD transfection regaten(Cat no. E231A, promega)을 이용하여 형질감염 시켰다.
(2) Deep sequencing
Hipi Plus DNA polymerase (Elpis-bio)를 사용하여 온-타겟(ontarget) 및 오프-타겟(off-target) 부위를 200~300bp 크기로 PCR 증폭시켰다. 상기의 방법으로 얻어진 PCR 산물을 Mi-seq. (Illumina)장비를 이용하여 sequencing 하여 CRISPR RGEN tool(www.rgenome.net)의 Cas Analyzer를 통해 분석하였다. CRISPR/Cas9 절단 부위로부터 5bp 이내에서의 치환을 단일 염기 치환 CRISPR 단백질로부터 유도된 변이로 간주하였다.
실시예 2-4: 실험 결과
ABE (Adenine Base Editor)는 아데닌 염기 교정 유전자가위로, 아데닌(A) 염기를 구아닌(G) 염기로 치환시키는 기술이다. Alkyladenine DNA glycosylase (AAG)는 DNA에서 이노신(Inosine) 염기를 제거하는 효소이다(도 2). 본 연구진은 아데닌 (adenine, A)염기의 무작위적 돌연변이를 유도하기 위하여 ABE WT 플라스미드의 N-말단과 C-말단 각각에 AAG (Alkyladenine DNA glycosylase;AAG) 유전자를 삽입하여 변형시켜 아데닌 염기 치환 단백질을 개발하였다. Cas9 니케이즈, 아데노신 디아미네이즈 및 DNA 글리코실레이즈를 다양한 순서로 구성하여 융합 단백질을 생성하였다(도 4).
아데닌(A) 염기의 무작위적 돌연변이를 확인하기 위하여 세 개의 sgRNA (sgRNA1, sgRNA2, sgRNA3)를 HEK 293T 세포에 염기 치환 단백질을 암호화하는 핵산을 포함하는 플라스미드(즉, 변형시킨 ABE 플라스미드)와 함께 형질 감염시켰다. 실험 결과, ABE WT와 비교했을 때 변형시킨 ABE 플라스미드 (N-AAG, C-AAG)를 형질 감염시킨 HEK293T 세포에서 sgRNA 1의 염기서열 중 14번째 아데닌 (A) 염기가 다른 염기 (티민;T, 사이토신;C, 구아닌;G)로 무작위적 치환이 일어난 것을 확인하였다. sgRNA 1 염기서열에서는 19번??와 13번?? 아데닌(A) 염기가 다른 염기로 치환된 것을 확인하였다(도 27), sgRNA 1에서는 N-말단에 AAG를 삽입한 플라스미드에서만 16번째와 12번째 아데닌이 치환된 것을 확인하였다(도 28). 따라서 ABE에 AAG를 삽입함으로써 아데닌(A) 염기가 다른 염기로 무작위적 치환이 유도되는 것을 확인하였다. 더불어, Cas9 니케이즈, 아데노신 디아미네이즈 및 DNA 글리코실레이즈의 순서에 상관없이 아데닌 염기 치환 단백질을 이용하는 경우, 아데닌(A) 염기가 다른 염기로 무작위적 치환이 유도되는 것을 확인하였다(도 26 내지 28 참고).
[제3 실시예]
suntag 시스템을 이용한 단일 염기 치환
실시예 3-1: 플라스미드 제작 (Plasmid construction)
플라스미드는 Gibson Assembly (NEB Builder HiFi DNA Assembly kit, NEB)를 이용하여 구축하였다. 도 5의 (a),(b),(c) 각각 단편을 PCR을 이용하여 증폭시킨 후, Gibson Assembly Master mix에 PCR로 증폭한 DNA 단편을 추가한 뒤, 50℃15-60분 동안 인큐베이트(incubate)하였다. 모든 플라스미드는 인간 코돈-최적화된 WT-Cas9(P3s-Cas9HC; Addgene plasmid #43945), CMV 프로모터, p15A 복제개시점 및 암피실린(ambicillin) 항생제 저항 유전자를 선택마커를 포함한다.
실시예 3-2: 세포 배양 및 형질 도입 (Cell culture and transfection)
PC9 세포는 5% CO2 하에서 37℃에서 10% FBS와 1% 항생제가 첨가된 Rosewell Park Memorial Institute 1640 (RPMI 1640, Welgene)에서 배양하였다. 형질 감염 전 PC9 세포를 24-well 플레이트에 well 당 2x105의 밀도로 분주하였다. 그 후 1500ng 염기 치환 플라스미드(Apobec-nCas9-UGI, Apobec-nureki nCas9-UNG)와 500ng sgRNA-발현 플라스미드(hEMX1 GX19)를 그리고 1000ng suntag 플라스미드(GCN4-nCas9)와 1000ng ScFv 플라스미드(ScFv-Apobec-UNG, ScFv-UNG-Apobec)와 500g sgRNA-발현 플라스미드(hEMX1 GX19)를 200ul Opti-MEM 배지에서 4uL 리포펙타민(lipofectamine)TM2000(thermo Fisher Scientific, 11668019)을 이용하여 형질감염 시켰다.
실시예 3-3: Deep sequencing
Hipi Plus DNA polymerase (Elpis-bio)를 사용하여 온-타겟(ontarget) 및 오프-타겟(off-target) 부위를 200~300bp 크기로 PCR 증폭시켰다. 상기의 방법으로 얻어진 PCR 산물을 Mi-seq. (Illumina)장비를 이용하여 sequencing 한 후 CRISPR RGEN tool(www.rgenome.net)의 BE Analyzer를 통해 분석하였다. sgRNA sequence 부위로부터 10bp 이내에서의 치환을 단일 염기 치환 CRISPR 단백질로부터 유도된 변이로 간주하였다.
실시예 3-4: 실험결과
PC9 cell에서 단일 염기 치환 단백질을 이용하여 C to N으로의 치환율을 확인하였다.
SunTag 시스템을 이용하여 한 개의 nCas9으로도 UNG의 효과를 극대화함으로써 무작위적인 돌연변이 유도를 증가시키고자 하였다. 그 결과, ScFv-UNG-Apobec의 경우 WT와 비슷한 단일 염기 치환 효율을 가지면서 무작위적인 염기 치환 (C to T or A or G)을 유도하는 것을 확인할 수 있었다(도 13 참고).
[제4 실시예]
단일 염기 치환 CRISPR 단백질을 이용한 EGFR C797S 돌연변이 유도 및 Osimertinib 내성 확인
실시예 4-1: PC9 세포: 단일 염기 치환 CRISPR 단백질 형질 도입 및 약물 배양
PC9 세포는 5% CO2 하에서 37℃에서 10% FBS와 1% 항생제가 첨가된 Rosewell Park Memorial Institute 1640 (RPMI 1640, Welgene)에서 배양하였다. 형질 감염 전 PC9 세포를 15cm2 dish에 3x106의 밀도로 분주하였다. 그 후 서로 다른 두개의 5ug sgRNA 발현 플라스미드에 각각 15ug N-UNG을 3mL Opti-MEM 배지에서 40uL 리포펙타민(lipofectamine)TM2000(thermo Fisher Scientific, 11668019)을 이용하여 형질감염 시켰다. 형질 감염시킨 날로부터 3일 뒤 blasticidin 4ug/mL의 농도로 항생제를 처리하여 7일 동안 배양하였다. 충분한 항생제 배양을 통한 안정화된 세포주가 확보된 다음, 비소세포성폐암 표적치료제인 Osimertinib (selleckchem, S5078) 100nM의 농도로 20일 동안 세포를 배양하였다. Osimertinib에 저항을 보인다고 알려진 C797S 변이를 생성할 수 있는 sgRNA(C797S sgRNA 1(서열번호 21) 및 C797S sgRNA 2(서열번호 22)를 사용하여 positive control실험을 진행하였다. 스크리닝 시스템을 이용하여 C797S 변이가 enrich 됨을 확인하였다.
실시예 4-2: Deep sequencing
Hipi Plus DNA polymerase (Elpis-bio)를 사용하여 온-타겟(ontarget) 및 오프-타겟(off-target) 부위를 200~300bp 크기로 PCR 증폭시켰다. 상기의 방법으로 얻어진 PCR 산물을 Mi-seq. (Illumina)장비를 이용하여 sequencing 한 후 CRISPR RGEN tool(www.rgenome.net)의 BE Analyzer를 통해 분석하였다. sgRNA sequence 부위로부터 10bp 이내에서의 치환을 단일 염기 치환 CRISPR 단백질로부터 유도된 변이로 간주하였다.
실시예 4-3: 실험 결과
3세대 EGFR 티로신 키나아제 억제제 (TKI)인 Osimertinib은 2세대 약물에 내성이 있는 EGFR T790M-양성 비소세포폐암 환자의 치료제로 사용되고 있다. N-UNG에 의한 target sgRNA sequence 내의 cytosine의 무작위적 염기치환을 유도함으로써 특정 약물에 대한 내성 돌연변이를 스크리닝하였다.
osimertinib약물의 알려진 내성 돌연변이인 C797S를 positive control로 사용하여 해당 tool이 작동하는지 확인하였다. C797S sgRNA1 내 15번째 위치한 C가 G로 또는 C797S sgRNA2 내 13번째 C가 G로 염기치환 될 경우 EGFR의 797번째 아미노산인 cysteine이 Serine으로 바뀌게된다. 실험 결과, 블라스티딘(Blastidine)만 처리한 군에서는 C797S sgRNA1와 2가 N-UNG에 의해 15C와 13C가 10%만 G로 치환되어있지만, Osimertinib을 처리한 군에서는 C to G로 바뀐 부분이 각각 50%와 80%로 늘어난 것을 확인하였다(도 30 참고)
.
[제5 실시예]
EGFR sgRNA 라이브러리 도입으로 형질전환 (Transformation) 세포 제조 및 약물 내성 돌연변이 스크리닝
실시예 5-1: EGFR sgRNA 라이브러리 디자인 및 합성
CRISPR RGEN tool(www.rgenome.net)을 이용하여 Epidermal Growth Factor Receptor (EGFR) 유전자의 exon 27개에서 총 1803개의 sgRNA를 디자인하였다. 디자인된 1803개의 sgRNA oligo pool들의 순방향 올리고 서열에는 5'말단에 CACCG을 추가하고, 역방향 올리고 서열에는 각각 5'말단에 AAAC를 3'말단에는 C를 추가하여 Twist Bioscience에 합성을 의뢰하였다.
실시예 5-2: EGFR sgRNA 라이브러리 플라스미드 제조
합성된 EGFR sgRNA oligo pool들은 95℃에서 5분 반응시킨 뒤 25℃까지 단계적으로 온도를 낮춰 결합(annealing)시켰다. 그 후로 EGFR sgRNA oligo pool들과 Bsa1 제한효소로 절단된 피기백 전위 (Piggybac transposon) 백본 벡터(backbone vector)은 T4 ligase에 의해 ligation하였다. Ligation된 반응액은 EnduraTM DUOs Electrocompetent cell (lucigen, Cat no. 60242-2)에 전기천공법(electroporation)을 이용하여 삽입하였다. 이렇게 형질 전환된 대장균은 Ampicillin 항생제가 첨가된 LB 배지에 고루 바르고 37℃에서 하루 동안 방치하여 배양하였다. NuceloBond Xtra Midi EF (Macherey-Nagel, cat No.740420.50)를 사용하여 대장균 군집(colony)들로부터 EGFR sgRNA 라이브러리 플라스미드를 확보하였다.
실시예 5-3: 세포 배양
PC9 세포는 5% CO2 하에서 37℃에서 10% FBS와 1% 항생제가 첨가된 Rosewell Park Memorial Institute 1640 (RPMI 1640, Welgene)에서 배양하였다.
실시예 5-4: 피기백 전위 (piggybac transposon)를 이용한 형질전환 세포 제조
PC9 세포에 유전자 전달 시스템인 피기백 전위(piggybac transposon)를 적용하여 EGFR sgRNA 발현이 가능한 세포를 제조하였다. 형질 전환 전 PC9 세포를 T175 flask에 4x106의 밀도로 분주하였다. 그 후 piggybac transposon vector 와 transposase expression vector을 1:5의 비율로 3mL Opti-MEM 배지에서 40uL 리포펙타민(lipofectamine)TM2000(thermo Fisher Scientific, 11668019)을 이용하여 형질감염 시켰다. 다음날 puromycin 2ug/mL의 농도로 항생제를 처리하여 7일 동안 배양하였다. 충분한 항생제 계대배양을 통해 안정화된 세포주를 확보하였다.
실시예 5-5: 단일 염기 치환 CRISPR 단백질 형질 도입 및 약물 내성 돌연변이 스크리닝
리포펙타민(lipofectamine)TM2000(thermo Fisher Scientific, 11668019)을 이용하여 형질감염을 하기 약 18~24시간 전에 형질 전환된 PC9 세포를 T175 flask에 4x106의 밀도로 분주하였다. 그 후 20ug N-UNG를 형질감염 시켰다. 형질 감염시킨 날로부터 3일 뒤 blasticidin 4ug/mL의 농도로 항생제를 처리하여 7일 동안 배양하였다. 충분한 항생제 배양을 통해 안정화된 세포가 확보되면 T175 flask에 4x106의 밀도로 분주하였다. 그 후, 비소세포성폐암 표적치료제인 Osimertinib (selleckchem, S5078) 100nM의 농도로 20일 동안 세포를 배양하여 내성 돌연변이 세포를 확보하였다.
실시예 5-6: Deep sequencing
Hipi Plus DNA polymerase (Elpis-bio)를 사용하여 온-타겟(ontarget) 및 오프-타겟(off-target) 부위를 200~300bp 크기로 PCR 증폭시켰다. 상기의 방법으로 얻어진 PCR 산물을 Mi-seq. (Illumina)장비를 이용하여 sequencing 한 후, 결과를 1803개의 EGFR sgRNA sequence로 분석을 의뢰하였다.
실시예 5-7: 실험결과
EGFR sgRNA가 발현하는 PC9세포에 N-UNG로 sgRNA내 Cytosine을 무작위적으로 염기 치환 시킨 후 Osimertinib이 첨가된 배지에서 배양시켜 살아남은 세포를 분석한 결과를 확보하였다(도 29 및 도 30 참고). 도 31은 EGFR sgRNA를 발현할 수 있는 PC9세포에 N-UNG로 sgRNA내 Cytosine을 무작위적으로 염기 치환 시킨 후 Osimertinib이 첨가된 배지에서 배양시켜 살아남은 세포를 분석한 결과이다.
<110> TOOLGEN INCORPORATED <120> SINGLE BASE EDITING PROTEINS AND A COMPOSITION COMPRISING THE SAME <130> CP20-108 <150> US 62/851,372 <151> 2019-05-22 <150> US 62/898,094 <151> 2019-09-10 <160> 92 <170> KoPatentIn 3.0 <210> 1 <211> 20 <212> DNA <213> homo sapiens <400> 1 aagaagaaga cgagcctgag 20 <210> 2 <211> 23 <212> DNA <213> homo sapiens <400> 2 gaacacaaag catagactgc ggg 23 <210> 3 <211> 23 <212> DNA <213> homo sapiens <400> 3 gagtatgagg catagactgc agg 23 <210> 4 <211> 23 <212> DNA <213> homo sapiens <400> 4 gtcaagaaag cagagactgc cgg 23 <210> 5 <211> 23 <212> DNA <213> homo sapiens <400> 5 gagcaaagac aatagactgt agg 23 <210> 6 <211> 23 <212> DNA <213> homo sapiens <400> 6 gatgagataa tgatgagtca ggg 23 <210> 7 <211> 23 <212> DNA <213> homo sapiens <400> 7 ggattgaccc aggccagggc tgg 23 <210> 8 <211> 23 <212> DNA <213> homo sapiens <400> 8 gaatactaag catagactcc agg 23 <210> 9 <211> 23 <212> DNA <213> homo sapiens <400> 9 gtaaacaaag catagactga ggg 23 <210> 10 <211> 23 <212> DNA <213> homo sapiens <400> 10 gaagaccaag gatagactgc tgg 23 <210> 11 <211> 23 <212> DNA <213> homo sapiens <400> 11 gaacataaag aatagaatga tgg 23 <210> 12 <211> 23 <212> DNA <213> homo sapiens <400> 12 ggacaggcag catagactgt ggg 23 <210> 13 <211> 23 <212> DNA <213> homo sapiens <400> 13 gtagaaaaag tatagactgc agg 23 <210> 14 <211> 23 <212> DNA <213> homo sapiens <400> 14 gaagatagag aatagactgc tgg 23 <210> 15 <211> 23 <212> DNA <213> homo sapiens <400> 15 ggctaaagac catagactgt ggg 23 <210> 16 <211> 23 <212> DNA <213> homo sapiens <400> 16 gggaataaat catagaatcc tgg 23 <210> 17 <211> 14 <212> DNA <213> homo sapiens <400> 17 kraatkkaga kkkk 14 <210> 18 <211> 23 <212> DNA <213> homo sapiens <400> 18 gacaaagagg aagagagacg ggg 23 <210> 19 <211> 23 <212> DNA <213> homo sapiens <400> 19 acacacacac ttagaatctg tgg 23 <210> 20 <211> 23 <212> DNA <213> homo sapiens <400> 20 cacacacact tagaatctgt ggg 23 <210> 21 <211> 19 <212> DNA <213> homo sapiens <400> 21 gtacgggaag ccgacggag 19 <210> 22 <211> 19 <212> DNA <213> homo sapiens <400> 22 acgggaagcc gacggagga 19 <210> 23 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> NLS sequence derived from SV40 virus <400> 23 Pro Lys Lys Lys Arg Lys Val 1 5 <210> 24 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> NLS sequence derived from nucleoplasmin <400> 24 Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys 1 5 10 15 <210> 25 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> bipartite NLS sequence derived from c-myc <400> 25 Pro Ala Ala Lys Arg Val Lys Leu Asp 1 5 <210> 26 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> bipartite NLS of nucleoplasmin <400> 26 Arg Gln Arg Arg Asn Glu Leu Lys Arg Ser Pro 1 5 10 <210> 27 <211> 38 <212> PRT <213> Artificial Sequence <220> <223> hRNPA1 M9 NLS <400> 27 Asn Gln Ser Ser Asn Phe Gly Pro Met Lys Gly Gly Asn Phe Gly Gly 1 5 10 15 Arg Ser Ser Gly Pro Tyr Gly Gly Gly Gly Gln Tyr Phe Ala Lys Pro 20 25 30 Arg Asn Gln Gly Gly Tyr 35 <210> 28 <211> 42 <212> PRT <213> Artificial Sequence <220> <223> importin alpha IBB domain sequence <400> 28 Arg Met Arg Ile Glx Phe Lys Asn Lys Gly Lys Asp Thr Ala Glu Leu 1 5 10 15 Arg Arg Arg Arg Val Glu Val Ser Val Glu Leu Arg Lys Ala Lys Lys 20 25 30 Asp Glu Gln Ile Leu Lys Arg Arg Asn Val 35 40 <210> 29 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> myoma T protein sequence <400> 29 Val Ser Arg Lys Arg Pro Arg Pro 1 5 <210> 30 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> myoma T protein sequence <400> 30 Pro Pro Lys Lys Ala Arg Glu Asp 1 5 <210> 31 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> p53 sequence of human <400> 31 Pro Pro Lys Lys Lys Pro Leu 1 5 <210> 32 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> c-abl IV sequence of mouse <400> 32 Ser Ala Leu Ile Lys Lys Lys Lys Lys Met Ala Pro 1 5 10 <210> 33 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> NS1 sequence of influenza virus <400> 33 Asp Arg Leu Arg Arg 1 5 <210> 34 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> NS1 sequence of influenza virus <400> 34 Pro Lys Gln Lys Lys Arg Lys 1 5 <210> 35 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> hepatitis virus <400> 35 Arg Lys Leu Lys Lys Lys Ile Lys Lys Leu 1 5 10 <210> 36 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> sequence of Mx1 protein of mouse <400> 36 Arg Glu Lys Lys Lys Phe Leu Lys Arg Arg 1 5 10 <210> 37 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> ADP-ribose of human <400> 37 Lys Arg Lys Gly Asp Glu Val Asp Gly Val Asp Glu Val Ala Lys Lys 1 5 10 15 Lys Ser Lys Lys 20 <210> 38 <211> 17 <212> PRT <213> homo sapiens <400> 38 Arg Lys Cys Leu Gln Ala Gly Met Asn Leu Glu Ala Arg Lys Thr Lys 1 5 10 15 Lys <210> 39 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> GX19 <400> 39 gagtccgagc agaagaagaa 20 <210> 40 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> GX20 <400> 40 tgcccctccc tccctggccc 20 <210> 41 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Nureki sgRNA 1 <400> 41 gaggacaaag tacaaacggc 20 <210> 42 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Nureki sgRNA 2 <400> 42 gggctcccat cacatcaacc 20 <210> 43 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Nureki sgRNA 3 <400> 43 ggccccagtg gctgctctgg 20 <210> 44 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Nureki sgRNA 4 <400> 44 gctttaccca gttctctggg 20 <210> 45 <211> 77 <212> RNA <213> Artificial Sequence <220> <223> sequence for forming a complex with spCas9 protein <400> 45 guuuuagucc cugaaaaggg acuaaaauaa agaguuugcg ggacucugcg ggguuacaau 60 ccccuaaaac cgcuuuu 77 <210> 46 <211> 76 <212> RNA <213> Artificial Sequence <220> <223> sequence for forming a complex with cjCas9 protein <400> 46 guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu 60 ggcaccgagu cggugc 76 <210> 47 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> PAM of cjCas9 protein <400> 47 Asn Asn Asn Asn Arg Tyr Ala Cys 1 5 <210> 48 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Sp20-viHBV-B <400> 48 guaacacgag cagggguccu 20 <210> 49 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Sp20-viHBV-B <400> 49 ccccgccugu aacacgagca 20 <210> 50 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Sp20-viHBV-B <400> 50 accccgccug uaacacgagc 20 <210> 51 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Sp20-viHBV-B <400> 51 aggaccccug cucguguuac 20 <210> 52 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Sp20-viHBV-B <400> 52 accccugcuc guguuacagg 20 <210> 53 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Sp20-viHBV-B <400> 53 caccacgagu cuagacucug 20 <210> 54 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Sp20-viHBV-B <400> 54 ggacuucucu caauuuucua 20 <210> 55 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Sp20-viHBV-B <400> 55 ccuacgaacc acugaacaaa 20 <210> 56 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Sp20-viHBV-B <400> 56 ccauuuguuc agugguucgu 20 <210> 57 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Sp20-viHBV-B <400> 57 cauuuguuca gugguucgua 20 <210> 58 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Sp20-viHBV-B <400> 58 ggguugcguc agcaaacacu 20 <210> 59 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Sp20-viHBV-B <400> 59 uuugcugacg caacccccac 20 <210> 60 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Sp20-viHBV-B <400> 60 uccgcaguau ggaucggcag 20 <210> 61 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Sp20-viHBV-B <400> 61 aggaguuccg caguauggau 20 <210> 62 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Sp20-viHBV-B <400> 62 uccucugccg auccauacug 20 <210> 63 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Sp20-viHBV-B <400> 63 cgucccgcgc aggauccagu 20 <210> 64 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Sp20-viHBV-B <400> 64 ccgcgggauu cagcgccgac 20 <210> 65 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Sp20-viHBV-B <400> 65 uccgcgggau ucagcgccga 20 <210> 66 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Sp20-viHBV-B <400> 66 cccgucggcg cugaaucccg 20 <210> 67 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Sp20-viHBV-B <400> 67 guaaagagag gugcgccccg 20 <210> 68 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Sp20-viHBV-B <400> 68 ggggcgcacc ucucuuuacg 20 <210> 69 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Sp20-viHBV-B <400> 69 gaagcgaagu gcacacgguc 20 <210> 70 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Sp20-viHBV-B <400> 70 ggucuccaug cgacgugcag 20 <210> 71 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Sp20-viHBV-B <400> 71 aaugucaacg accgaccuug 20 <210> 72 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Sp20-viHBV-B <400> 72 aggaggcugu aggcauaaau 20 <210> 73 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Sp20-viHBV-B <400> 73 cggaaguguu gauaagauag 20 <210> 74 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Sp20-viHBV-B <400> 74 ccggaagugu ugauaagaua 20 <210> 75 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Sp20-viHBV-B <400> 75 gcgagggagu ucuucuucua 20 <210> 76 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Sp20-viHBV-B <400> 76 gaccuucguc ugcgaggcga 20 <210> 77 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Sp20-viHBV-B <400> 77 gauugagacc uucgucugcg 20 <210> 78 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Sp20-viHBV-B <400> 78 cucccucgcc ucgcagacga 20 <210> 79 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Sp20-viHBV-B <400> 79 gauugagauc uucugcgacg 20 <210> 80 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Sp20-viHBV-B <400> 80 gucgcagaag aucucaaucu 20 <210> 81 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Sp20-viHBV-B <400> 81 ucgcagaaga ucucaaucuc 20 <210> 82 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Sp20-viHBV-B <400> 82 ugucaacaag aaaaaccccg cc 22 <210> 83 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Sp20-viHBV-B <400> 83 aagcccuacg aaccacugaa ca 22 <210> 84 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Sp20-viHBV-B <400> 84 uuaccaauuu ucuuuugucu uu 22 <210> 85 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Sp20-viHBV-B <400> 85 acgucccgcg caggauccag uu 22 <210> 86 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Sp20-viHBV-B <400> 86 gugcacacgg uccggcagau ga 22 <210> 87 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Sp20-viHBV-B <400> 87 gugccuucuc aucugccgga cc 22 <210> 88 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Sp20-viHBV-B <400> 88 cgacgugcag aggugaagcg aa 22 <210> 89 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Sp20-viHBV-B <400> 89 ugcgacgugc agaggugaag cg 22 <210> 90 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Sp20-viHBV-B <400> 90 gaccgugugc acuucgcuuc ac 22 <210> 91 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Sp20-viHBV-B <400> 91 auguccaugc cccaaagcca cc 22 <210> 92 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Sp20-viHBV-B <400> 92 gaccaccaaa ugccccuauc uu 22

Claims (33)

  1. 단일염기 치환 융합단백질 또는 이를 암호화하는 핵산으로서,
    (a) CRISPR 효소 또는 이의 변이체;
    (b) 디아미네이즈(deaminase); 및
    (c) DNA 글리코실레이즈(DNA glycosylase) 또는 이의 변이체를 포함하고,
    이 때, 상기 단일염기 치환 융합단백질은 타겟 핵산서열 내 하나 이상의 뉴클레오타이드에 포함된 시토신 또는 아데닌을 임의의 염기로의 치환을 유도하는,
    단일염기 치환 융합단백질 또는 이를 암호화하는 핵산.
  2. 제1 항에 있어서,
    상기 단일염기 치환 융합단백질은
    (i) N말단-[CRISPR 효소]-[디아미네이즈]-[DNA 글리코실레이즈]-C말단;
    (ii) N말단-[CRISPR 효소]-[DNA 글리코실레이즈]-[디아미네이즈]-C말단;
    (iii) N말단-[디아미네이즈]-[CRISPR 효소]-[DNA 글리코실레이즈]-C말단;
    (iv) N말단-[디아미네이즈]-[DNA 글리코실레이즈]-[CRISPR 효소]-C말단;
    (v) N말단-[DNA 글리코실레이즈]-[CRISPR 효소]-[디아미네이즈]-C말단; 및
    (vi) N말단-[DNA 글리코실레이즈]-[디아미네이즈]-[CRISPR 효소]-C말단 중 어느 하나의 구성을 가지는 것을 특징으로 하는,
    단일염기 치환 융합단백질 또는 이를 암호화하는 핵산.
  3. 제1 항에 있어서,
    상기 디아미네이즈는 시티딘 디아미네이즈(cytidine deaminase)이고, 및
    상기 DNA 글리코실레이즈는 우라실-DNA 글리코실레이즈(Uracil-DNA glycosylase) 또는 이의 변이체이고,
    이 때, 상기 단일염기 치환 융합단백질은 타겟 핵산서열 내 하나 이상의 뉴클레오타이드에 포함된 시토신을 임의의 염기로의 치환을 유도하는,
    단일염기 치환 융합단백질 또는 이를 암호화하는 핵산.
  4. 제3 항에 있어서,
    상기 시티딘 디아미네이즈는 APOBEC, AID(activation-induced cytidine deaminase) 또는 이의 변이체인 것을 특징으로 하는,
    단일염기 치환 융합단백질 또는 이를 암호화하는 핵산.
  5. 제1 항에 있어서,
    상기 디아미네이즈는 아데노신 디아미네이즈(adenosine deaminase)이고, 및
    상기 DNA 글리코실레이즈는 알킬아데닌-DNA 글리코실레이즈(Alkyladenine DNA glycosylase) 또는 이의 변이체이고,
    이 때, 상기 단일염기 치환 융합단백질은 타겟 핵산서열 내 하나 이상의 뉴클레오타이드에 포함된 아데닌을 임의의 염기로의 치환을 유도하는,
    단일염기 치환 융합단백질 또는 이를 암호화하는 핵산.
  6. 제5 항에 있어서,
    상기 아데노신 디아미네이즈는 TadA, Tad2p, ADA, ADA1, ADA2, ADAR2, ADAT2, ADAT3 또는 이의 변이체인 것을 특징으로 하는,
    단일염기 치환 융합단백질 또는 이를 암호화하는 핵산.
  7. 제1 항에 있어서,
    상기 단일염기 치환 융합단백질은 하나 이상의 NLS(nuclear localization sequence)를 더 포함하는 것을 특징으로 하는,
    단일염기 치환 융합단백질 또는 이를 암호화하는 핵산.
  8. 제1 항에 있어서,
    상기 CRISPR 효소 또는 이의 변이체는 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophilus) 유래의 Cas9 단백질, 스트렙토코커스아우레우스 (Streptococcus aureus) 유래의 Cas9 단백질, 네이세리아 메닝기디티스 (Neisseria meningitidis) 유래의 Cas9 단백질, 및 Cpf1 단백질로 이루어진 군에서 선택된 어느 하나 이상을 포함하는,
    단일염기 치환 융합단백질 또는 이를 암호화하는 핵산.
  9. 제8 항에 있어서,
    상기 CRISPR 효소 변이체는 RuvC 도메인 또는 HNH 도메인 중 어느 하나 이상이 불활성화된 것을 특징으로 하는,
    단일염기 치환 융합단백질 또는 이를 암호화하는 핵산.
  10. 제9 항에 있어서,
    상기 CRISPR 효소 변이체는 니케이즈(nickase)인 것을 특징으로 하는,
    단일염기 치환 융합단백질 또는 이를 암호화하는 핵산.
  11. 제1 항에 있어서,
    상기 단일염기 치환 융합단백질은 각 구성요소 (a), (b) 및 (c)의 사이에 연결 모이어티 (linking moiety)를 포함하는 것을 특징으로 하는,
    단일염기 치환 융합단백질 또는 이를 암호화하는 핵산.
  12. 제1항 내지 제11항 중 어느 한 항의 단일염기 치환 융합단백질을 암호화하는 핵산을 포함하는, 벡터.
  13. 단일염기 치환 복합체로서,
    (a) CRISPR 효소 또는 이의 변이체;
    (b) 디아미네이즈(deaminase);
    (c) DNA 글리코실레이즈(DNA glycosylase); 및
    (d) 2 이상의 결합도메인을 포함하고,
    이 때, 상기 단일염기 치환 융합단백질은 타겟 핵산서열 내 하나 이상의 뉴클레오타이드에 포함된 시토신 또는 아데닌을 임의의 염기로의 치환을 유도하는,
    단일염기 치환 복합체.
  14. 제13 항에 있어서,
    상기 CRISPR 효소, 상기 디아미네이즈, 및 상기 DNA 글리코실레이즈는 각각 하나 이상의 결합도메인에 연결되고,
    이 때, 상기 CRISPR 효소, 디아미네이즈, 및 상기 DNA 글리코실레이즈는 상기 결합도메인들 간의 상호작용을 통해서 복합체를 형성함,
    을 특징으로 하는,
    단일염기 치환 복합체.
  15. 제14 항에 있어서,
    상기 CRISPR 효소, 상기 디아미네이즈, 및 상기 DNA 글리코실레이즈 중 어느 하나(one)는 제1 결합도메인 및 제2 결합도메인에 연결되고,
    이 때, 상기 제1 결합도메인 및 다른 구성(another)의 결합도메인은 상호작용을 하는 페어이고, 및 상기 제2 결합도메인 및 나머지 구성(the other)의 결합도메인은 상호작용을 하는 페어이며,
    이 때, 상기 페어들에 의하여 복합체를 형성함,
    을 특징으로 하는,
    단일염기 치환 복합체.
  16. 제13 항에 있어서,
    상기 디아미네이즈는 시티딘 디아미네이즈(cytidine deaminase)이고, 및
    상기 DNA 글리코실레이즈는 우라실-DNA 글리코실레이즈(Uracil-DNA glycosylase) 또는 이의 변이체이고,
    이 때, 상기 단일염기 치환 융합단백질은 타겟 핵산서열 내 하나 이상의 뉴클레오타이드에 포함된 시토신을 임의의 염기로의 치환을 유도하는,
    단일염기 치환 복합체.
  17. 제16 항에 있어서,
    상기 시티딘 디아미네이즈는 APOBEC, AID(activation-induced cytidine deaminase) 또는 이의 변이체인 것을 특징으로 하는,
    단일염기 치환 복합체.
  18. 제13 항에 있어서,
    상기 디아미네이즈는 아데노신 디아미네이즈(adenosine deaminase)이고, 및
    상기 DNA 글리코실레이즈는 알킬아데닌-DNA 글리코실레이즈(Alkyladenine DNA glycosylase) 또는 이의 변이체이고,
    이 때, 상기 단일염기 치환 융합단백질은 타겟 핵산서열 내 하나 이상의 뉴클레오타이드에 포함된 아데닌을 임의의 염기로의 치환을 유도하는,
    단일염기 치환 복합체.
  19. 제18 항에 있어서,
    상기 아데노신 디아미네이즈는 TadA, Tad2p, ADA, ADA1, ADA2, ADAR2, ADAT2, ADAT3 또는 이의 변이체인 것을 특징으로 하는,
    단일염기 치환 복합체.
  20. 제13 항에 있어서,
    상기 단일염기 치환 복합체는
    (i) 상기 CRISPR 효소, 상기 디아미네이즈, 및 상기 DNA 글리코실레이즈 중 선택된 두 개의 구성과 제1 결합도메인을 포함하는 제1 융합단백질, 및
    (ii) 상기 선택되지 않은 나머지 하나의 구성과 제2 결합도메인을 포함하는 제2 융합단백질을 포함하고,
    이 때, 제1 결합도메인 및 제2 결합도메인은 상호작용하는 페어이며,
    이 때, 상기 페어에 의하여 복합체를 형성함,
    을 특징으로 하는,
    단일염기 치환 복합체.
  21. 제20 항에 있어서,
    상기 단일염기 치환 복합체는
    (i) 상기 디아미네이즈, 상기 DNA 글리코실레이즈 및 제1 결합도메인을 포함하는 제1 융합단백질, 및
    (ii) CRISPR 효소 및 제2 결합도메인을 포함하는 제2 융합단백질을 포함함,
    을 특징으로 하는,
    단일염기 치환 복합체.
  22. 제14 항에 있어서,
    상기 결합도메인은 FRB domain, FKBP dimerization domain, 인테인(intein), ERT domains, VPR domain, GCN4 peptide, single chain variable fragment (scFv) 중 어느 하나, 또는 이량이질체(heterodimer)를 형성하는 도메인 중 어느 하나인 것을 특징으로 하는,
    단일염기 치환 복합체.
  23. 제15 또는 제20 항에 있어서,
    상기 페어는 다음 중 선택되는 어느 하나인 것을 특징으로 하는 단일염기 치환 복합체:
    (i) FRB 및 FKBP dimerization domains;
    (ii) 제1 인테인(intein) 및 제2 인테인;
    (iii) ERT 및 VPR domains;
    (iv)GCN4 peptide 및 single chain variable fragment (scFv); 또는
    (v) 이량이질체(heterodimer)를 형성하는 제1 도메인 및 제2 도메인.
  24. 제23 항에 있어서,
    상기 페어는 GCN4 peptide 및 single chain variable fragment (scFv)임,
    을 특징으로 하는,
    단일염기 치환 복합체.
  25. 제21 항에 있어서,
    상기 제1 결합도메인은 single chain variable fragment (scFv)이고, 상기 제2 융합단백질은 적어도 하나 이상의 결합도메인을 더 포함하고,
    이 때, 상기 더 포함되는 결합도메인은 GCN4 peptide임 -;
    이 때, 2개 이상의 제1 융합단백질은 상기 GCN4 peptide 중 어느 하나와 각각 상호작용을 통해서 복합체를 형성함,
    을 특징으로 하는,
    단일염기 치환 복합체.
  26. 단일염기 치환 조성물로서,
    (a) 가이드 RNA 또는 이를 암호화하는 핵산, 및
    (b) i) 제1 항의 단일염기 치환 융합단백질 또는 이를 암호화하는 핵산, 또는 ii) 제13 항의 단일염기 치환 복합체,
    - 이 때, 상기 가이드 RNA는 타겟 핵산서열 과 상보적으로 결합하고,
    이 때, 상기 가이드 RNA와 결합되는 타겟 핵산서열은 15 내지 25bp이고,
    이 때, 상기 단일염기 치환 융합단백질 또는 상기 단일염기 치환 복합체는 상기 타겟 핵산서열을 포함하는 타겟 영역(region) 내에 존재하는 하나 이상의 시토신 또는 아데닌의 임의의 염기로의 치환을 유도함 -;
    을 포함하는,
    단일염기 치환 조성물.
  27. 제26 항에 있어서,
    상기 단일염기 치환 조성물은 1 이상의 벡터를 포함하는 것을 특징으로 하는,
    단일염기 치환 조성물.
  28. 단일염기 치환 방법으로서,
    in vitro 또는 ex vivo 상에서 타겟 핵산서열을 포함하는 타겟 영역(region)에 (i) 및 (ii)를 접촉함,
    (i) 가이드 RNA, 및
    (ii) 상기 제1 항 단일염기 치환 융합단백질, 또는 상기 제12 항의 단일염기 치환 복합체,
    -이 때, 상기 가이드 RNA는 타겟 핵산서열에 상보적으로 결합하고,
    이 때, 상기 가이드 RNA와 결합되는 타겟 핵산서열은 15 내지 25bp이고,
    이 때, 상기 단일염기 치환 융합단백질 또는 상기 단일염기 치환 복합체는 상기 타겟 핵산서열을 포함하는 타겟 영역(region) 내에 존재하는 하나 이상의 시토신 또는 아데닌의 임의의 염기로의 치환을 유도함 -;
    을 포함하는,
    단일염기 치환 방법.
  29. 타겟 유전자의 SNP 스크리닝 방법으로서,
    상기 타겟 유전자를 포함하는 세포에 상기 제26 항의 단일염기 치환 조성물을 도입하여 상기 타겟 유전자 상에서 인위적으로 SNP를 유도함(inducing);
    목적하는 SNP을 포함하는 세포를 선별함(selecting); 및
    상기 선별된 세포를 분석함으로써 목적하는 SNP에 대한 정보(information)를 얻음(obtaining),
    - 이 때, 상기 목적하는 SNP는 상기 타겟 유전자로부터 발현되는 단백질의 구조 또는 기능과 관련된 것임 -;
    을 포함하는,
    타겟 유전자의 SNP 스크리닝 방법.

  30. 제29 항에 있어서,
    상기 단일염기 치환 조성물은
    전기천공법(electroporation), 리포좀, 플라스미드, 바이러스 벡터, 나노파티클(nanoparticles) 및 PTD(protein translocation domain) 융합 단백질 방법 중 선택되는 1이상의 방법으로 도입됨을 특징으로 하는,
    타겟 유전자의 SNP 스크리닝 방법.
  31. 약물 내성 돌연변이 스크리닝 방법으로서,
    타겟 유전자를 포함하는, 적어도 하나 이상의 세포에 상기 제26 항의 단일염기 치환 조성물을 도입하여 상기 타겟 유전자 상에서 인위적으로 SNP를 유도함(inducing);
    상기 세포에 특정 약물을 처리함(treating);
    생존한 세포를 선별함(selecting);
    상기 선별된 세포를 분석함으로써 목적하는 SNP에 대한 정보(information)를 얻음(obtaining),
    - 이 때, 상기 목적하는 SNP는 상기 타겟 유전자로부터 발현되는 단백질의 구조 또는 기능과 관련된 것임 -;
    을 포함하는,
    약물 내성 돌연변이 스크리닝 방법.

  32. 오시머티닙(Osimertinib) 내성 SNP 정보를 수득하는 방법으로서,
    a) 타겟 핵산서열을 포함하는 세포에 단일염기 치환 단백질 또는 이를 암호화하는 핵산, 및 가이드 RNA 라이브러리 중 어느 하나 이상의 가이드 RNA 또는 이를 암호화하는 핵산을 도입함;
    b) 상기 a)의 세포에 상기 오시머티닙을 처리함;
    c) 생존한 세포를 분리함; 및
    d) 분리한 세포에서 목적하는 SNP에 대한 정보를 얻음,
    - 이 때, 상기 목적하는 SNP는 상기 타겟 핵산서열을 포함하는 EGFR 유전자로부터 발현되는 EGFR의 구조 또는 기능과 관련된 것임 -;
    을 포함하는,
    오시머티닙(Osimertinib) 내성 SNP 정보를 수득하는 방법.
  33. 제31 항에 있어서,
    상기 단일염기 치환 조성물은
    전기천공법(electroporation), 리포좀, 플라스미드, 바이러스 벡터, 나노파티클(nanoparticles) 및 PTD(protein translocation domain) 융합 단백질 방법 중 선택되는 1이상의 방법으로 도입됨을 특징으로 하는,
    타겟 유전자의 SNP 스크리닝 방법.

KR1020200061678A 2019-05-22 2020-05-22 단일염기 치환 단백질 및 이를 포함하는 조성물 KR20200135225A (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201962851372P 2019-05-22 2019-05-22
US62/851,372 2019-05-22
US201962898094P 2019-09-10 2019-09-10
US62/898,094 2019-09-10

Publications (1)

Publication Number Publication Date
KR20200135225A true KR20200135225A (ko) 2020-12-02

Family

ID=73458158

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200061678A KR20200135225A (ko) 2019-05-22 2020-05-22 단일염기 치환 단백질 및 이를 포함하는 조성물

Country Status (7)

Country Link
US (1) US20220228133A1 (ko)
EP (1) EP3974525A4 (ko)
JP (1) JP2022533842A (ko)
KR (1) KR20200135225A (ko)
CN (1) CN114144519A (ko)
AU (1) AU2020278864A1 (ko)
WO (1) WO2020235974A2 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115772523A (zh) * 2021-08-10 2023-03-10 珠海舒桐医疗科技有限公司 一种碱基编辑工具
CN115725650A (zh) * 2021-08-26 2023-03-03 华东师范大学 实现a到c和/或a到t碱基突变的碱基编辑系统及其应用

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PL3207130T3 (pl) * 2014-10-14 2020-02-28 Halozyme, Inc. Kompozycje deaminazy adenozyny 2 (ada2), jej warianty i sposoby ich zastosowania
KR20170126636A (ko) 2016-05-10 2017-11-20 주식회사 코맥스 디지털 도어락 시스템 및 이의 동작방법
AU2017306676B2 (en) * 2016-08-03 2024-02-22 President And Fellows Of Harvard College Adenosine nucleobase editors and uses thereof
US11920151B2 (en) * 2016-09-13 2024-03-05 Toolgen Incorporated Method for identifying DNA base editing by means of cytosine deaminase
US20180258418A1 (en) * 2017-01-17 2018-09-13 Institute For Basic Science Method of identifying genome-wide off-target sites of base editors by detecting single strand breaks in genomic dna
US11542496B2 (en) * 2017-03-10 2023-01-03 President And Fellows Of Harvard College Cytosine to guanine base editor
KR20190044157A (ko) * 2017-10-20 2019-04-30 경상대학교산학협력단 아데닌 또는 아데노신 탈아미노효소를 유효성분으로 포함하는 단일 염기 편집용 조성물 및 이의 용도

Also Published As

Publication number Publication date
EP3974525A4 (en) 2023-07-05
JP2022533842A (ja) 2022-07-26
CN114144519A (zh) 2022-03-04
WO2020235974A9 (ko) 2021-06-03
US20220228133A1 (en) 2022-07-21
WO2020235974A2 (ko) 2020-11-26
WO2020235974A3 (ko) 2021-04-22
EP3974525A2 (en) 2022-03-30
AU2020278864A1 (en) 2021-12-23

Similar Documents

Publication Publication Date Title
CN113631708B (zh) 编辑rna的方法和组合物
US20230135673A1 (en) Systems, methods, and compositions for site-specific genetic engineering using programmable addition via site-specific targeting elements (paste)
WO2017090724A1 (ja) Dnaメチル化編集用キットおよびdnaメチル化編集方法
JP2020508685A (ja) サプレッサーtRNA及びデアミナーゼによる変異のRNAターゲティング
CN113939591A (zh) 编辑rna的方法和组合物
KR20210077732A (ko) Nme2cas9-데아미나아제 융합 단백질에 의한 프로그램 가능한 dna 염기 편집
US20230357735A1 (en) Programmable nucleases and methods of use
CA3151279A1 (en) Highly efficient dna base editors mediated by rna-aptamer recruitment for targeted genome modification and uses thereof
US20230203481A1 (en) Effector proteins and methods of use
KR20200135225A (ko) 단일염기 치환 단백질 및 이를 포함하는 조성물
US20210355475A1 (en) Optimized base editors enable efficient editing in cells, organoids and mice
US20190024090A1 (en) Construct for epigenetic modification and its use in the silencing of genes
JP7109009B2 (ja) 遺伝子ノックアウト方法
CA3234217A1 (en) Base editing enzymes
US20190024072A1 (en) Construct for epigenetic modification and its use in the silencing of genes
US20230045095A1 (en) Compositions, Methods and Systems for the Delivery of Gene Editing Material to Cells
US20230374476A1 (en) Prime editor system for in vivo genome editing
US20240141382A1 (en) Gene editing components, systems, and methods of use
US20240158793A1 (en) Repressor proteins for gene regulation and crispr interference
US20160138047A1 (en) Improved polynucleotide sequences encoding tale repeats
WO2022241032A1 (en) Enhanced guide nucleic acids and methods of use
WO2022221581A1 (en) Programmable nucleases and methods of use
WO2023220570A2 (en) Engineered cas-phi proteins and uses thereof
WO2023250148A1 (en) Compositions and methods for epigenetic editing
EP4355869A1 (en) Systems, methods, and compositions comprising miniature crispr nucleases for gene editing and programmable gene activation and inhibition