KR20190058358A - CRISPR/Cpf1 시스템을 이용한 유전체 편집용 조성물 및 이의 용도 - Google Patents

CRISPR/Cpf1 시스템을 이용한 유전체 편집용 조성물 및 이의 용도 Download PDF

Info

Publication number
KR20190058358A
KR20190058358A KR1020180144185A KR20180144185A KR20190058358A KR 20190058358 A KR20190058358 A KR 20190058358A KR 1020180144185 A KR1020180144185 A KR 1020180144185A KR 20180144185 A KR20180144185 A KR 20180144185A KR 20190058358 A KR20190058358 A KR 20190058358A
Authority
KR
South Korea
Prior art keywords
crrna
sequence
target
cpf1
uridine
Prior art date
Application number
KR1020180144185A
Other languages
English (en)
Other versions
KR102168489B1 (ko
Inventor
김용삼
고정헌
이정미
문수빈
Original Assignee
한국생명공학연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국생명공학연구원 filed Critical 한국생명공학연구원
Publication of KR20190058358A publication Critical patent/KR20190058358A/ko
Application granted granted Critical
Publication of KR102168489B1 publication Critical patent/KR102168489B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/8509Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/96Stabilising an enzyme by forming an adduct or a composition; Forming enzyme conjugates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/35Nature of the modification
    • C12N2310/351Conjugate
    • C12N2310/3519Fusion with another nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/50Methods for regulating/modulating their activity
    • C12N2320/52Methods for regulating/modulating their activity modulating the physical stability, e.g. GC-content
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/50Methods for regulating/modulating their activity
    • C12N2320/53Methods for regulating/modulating their activity reducing unwanted side-effects

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Cell Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Mycology (AREA)
  • Veterinary Medicine (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)

Abstract

본 발명은 CRISPR/Cpf1 시스템을 이용한 유전체 편집용 조성물 및 이의 용도에 관한 것으로서, 보다 상세하게 본 발명은 표적 뉴클레오티드(target nucleotide) 서열과 혼성화 가능한 가이드 서열(guide sequence) 및 상기 가이드 서열의 3'-말단에 연결된 유리딘(U, uridine) 반복 서열을 포함하는 crRNA(CRISPR RNA) 또는 이를 암호화하는 DNA; 및 Cpf1 단백질 또는 이를 암호화하는 DNA을 포함하는 유전체 편집용 조성물, 이를 이용한 유전체 편집 방법, 형질 전환체 제조 방법 및 형질 전환체에 관한 것이다. 본 발명은 CRISPR/Cpf1 시스템을 이용하여 진핵 세포의 유전제 교정을 수행함에 있어서 인델 효율을 높이고 오프-타겟 활성을 줄일 수 있고, 원하는 유전자가 삽입(knock-in) 또는 결실(knock-out)된 형질 전환 세포, 형질 전환 동물 또는 형질 전환 식물을 용이하게 제조할 수 있다.

Description

CRISPR/Cpf1 시스템을 이용한 유전체 편집용 조성물 및 이의 용도{Composition for genome editing using CRISPR/Cpf1 and use thereof}
본 발명은 CRISPR/Cpf1 시스템을 이용한 유전체 편집용 조성물 및 이의 용도에 관한 것으로서, 보다 상세하게 본 발명은 표적 뉴클레오티드(target nucleotide) 서열과 혼성화 가능한 가이드 서열(guide sequence) 및 상기 가이드 서열의 3'-말단에 연결된 유리딘(U, uridine) 반복 서열을 포함하는 crRNA(CRISPR RNA) 또는 이를 암호화하는 DNA; 및 Cpf1 단백질 또는 이를 암호화하는 DNA을 포함하는 유전체 편집용 조성물, 이를 이용한 유전체 편집 방법, 형질 전환체 제조 방법 및 형질 전환체에 관한 것이다.
유전체 편집(genome editing)이란 생명체의 유전정보를 자유롭게 교정하여목적하는 유전 형질을 나타내도록 하는 것으로서, CRISPR/Cas(CRISPR-associated protein) 시스템의 개발을 통해 유전자의 기능에 대한 연구부터 질병 치료에 이르기까지 다양한 분야에 활용되면서 놀랍게 발전하고 있다.
CRISPR(Clustered Regularly Interspaced Short Palindromic Repeats)는 유전자 서열이 밝혀진 박테리아 및 고세균의 유전체에서 발견되는 여러 짧은 직접 반복 서열을 포함하는 좌위로서, 바이러스, 파지와 같은 외인성 유전적 요소에 저항성을 부여하는 후천적 원핵 면역 시스템으로서 기능한다. 프로토스페이서(Protospacer)라고 불리는 외인성 DNA의 짧은 부분은 CRISPR 반복 사이의 게놈에 편입되고, 과거의 외부인자에 대한 노출을 기억하는 역할을 한다. 이렇게 편입된 부분인 스페이서(spacer)는 가이드 RNA를 생산하는 템플레이트로 사용되며 외부 침입 유전물질을 절단하는 역할을 한다.
CRISPR기반 유전자 편집 기술의 핵심은 생명체 내에서 RNA를 매개체로 하는 특정 염기서열을 인식하고, Cas9과 같은 이펙터 단백질(effector protein)에 의해 해당 유전자 부위에 DSB(double strand breakage)를 유도한 후 이를 복구하는 과정에 있다. 진핵 세포 내에서 CRISPR/Cas 시스템에 의해 발생한 DSB를 복구하는 과정에는 잘려진 염기서열 내의 무작위적인 삽입 또는 제거(indel; insertion and deletion)가 발생하는 NHEJ(Non-homologous end joining)와, 절단된 DNA 부근과 동일한 염기서열을 가지는 DNA 가닥을 주형으로 하여 절단부위를 복구하는 HDR(Homology directed repair)이 있다. 각각의 유전자 복구 방법은 유전자 염기서열의 인델(indel)에 의한 특정 유전자의 프레임 시프트(frame shift)를 유도하는 녹아웃(knock-out)과 원하는 유전자에 특정 염기서열의 의도된 삽입 또는 치환을 유도하는 녹인(knock-in)을 가능하게 한다. 따라서 정확한 위치의 녹아웃 또는 녹인 효율을 증대시키기 위해서는 DSB 빈도수의 증가 및 정확도가 요구되며, 이를 위한 기존의 CRISPR/Cas 시스템의 변형 방법 또는 새로운 CRISPR/Cas 시스템을 찾고자 하는 연구가 계속되고 있다.
최근에는 Cas9과 같이 Cpf1(CRISPR from Prevotella and Francisella 1이라고 불리는 Type V Cas system)이 여러 종류의 박테리아에서 발견되었다. Cpf1은 Cas9과 동일하게 하나의 단백질을 이펙터 단백질(effector protein)로 갖는 Class 2에 속하며, crRNA(CRISPR RNA)의 가이드 하에 이펙터 단백질이 특정 PAM(protospacer-adjacent motif) 서열을 인지하여 DNA에 DSB를 일으킨다.
그러나, Cas9은 특정 염기서열 인식 및 절단에 crRNA와 tracrRNA(trans-activating crRNA)를 필요로 하지만, Cpf1은 crRNA만을 필요로 한다는 차이점이 있다. 또한 이펙터 단백질 및 crRNA 복합체가 특정 DNA 염기서열을 인식하는 PAM 서열에 있어서, Cas9은 G-rich 서열을 필요로 하는 반면에 Cpf1은 T-rich 서열을 인식한다는 차이가 있다. 이 때 생기는 DSB의 형태에 있어서도 Cas9은 PAM과 가까운 부분에 뭉툭한 형태(blunt end)로 절단되는 반면, Cpf1은 PAM으로부터 18 - 23 nt(nucleotide) 떨어진 곳에 어긋난 형태(staggered end)로 절단된다. 또한, Cpf1은 Cas9보다 유전자 크기가 작아서 임상적 목적으로 더 유용할 것으로 기대된다.
Cpf1의 상기와 같은 특징은 유전자 치료에 있어 유리한 점으로 작용할 수 있다. 특히, AAV(adeno-associated virus) 등의 바이러스를 사용하여 인체 내부로 유전자 편집에 사용되는 유전 물질을 전달할 경우 전달 가능한 유전 물질의 크기가 한정되어 있다는 점에서, Cas9에 비해 상대적으로 작은 크기의 단백질 및 crRNA를 필요로 하는 Cpf1의 특징은 매우 큰 장점이 될 수 있다. 또한 Cas9과 비교하여 Cpf1의 오프-타겟(off-target) 결과가 낮다는 점은 유전자 치료의 안정성 측면에서도 중요한 장점이다. 그러나 아직까지 Cpf1의 인델 효율이 Cas9보다 상대적으로 떨어지거나, 표적으로 하는 유전자에 따라 큰 편차를 보이는 것으로 나타나 Cas9을 대체하는데 어려움이 있다. 따라서 Cpf1의 장점을 극대화하면서 Cas9을 대체 또는 능가하기 위해서는 Cpf1의 인델 효율 증가 방법의 개발이 필수적이다.
CRISPR/Cas 시스템에서 이펙터 엔도뉴클레아제(effector endonuclease) 또는 가이드 RNA(guide RNA)를 조작함으로써 목적 유전자의 인델 효율 또는 정확도를 높일 수 있으며, Cas9의 경우 이러한 연구가 활발하게 진행된 것에 반해 Cpf1 시스템에서는 미흡한 실정이다.
대한민국 특허등록 제10-1656236호
이에 본 발명자들은 CRISPR/Cas9 시스템의 단점을 극복할 수 있는CRISPR/Cpf1 시스템을 개발하고자 예의 노력한 결과, CRISPR/Cpf1 시스템에 사용되는 crRNA의 3'-말단 서열에 유리딘 반복 서열을 추가함으로써 종래 Cpf1 시스템의 crRNA 및 Cas9 시스템에 비해 인델 효율을 향상된다는 점을 확인하고 본 발명을 완성하였다.
본 발명의 목적은 CRISPR/Cpf1 시스템에 있어서, 표적 뉴클레오티드(target nucleotide) 서열과 혼성화 가능한 가이드 서열(guide sequence)의 3'-말단에 연결된 유리딘(U, uridine) 반복 뉴클레오티드 서열로 이루어진 폴리뉴클레오티드를 제공하는 것이다.
본 발명의 다른 목적은 표적 뉴클레오티드(target nucleotide) 서열과 혼성화 가능한 가이드 서열(guide sequence) 및 상기 가이드 서열의 3'-말단에 연결된 유리딘(U, uridine) 반복 서열을 포함하는 crRNA(CRISPR RNA) 또는 이를 암호화하는 DNA 및 Cpf1 단백질 또는 이를 암호화하는 DNA을 포함하는 유전체 편집용 조성물을 제공하는 것이다.
본 발명의 또 다른 목적은 상기 유전체 편집용 조성물을 분리된 세포 또는 유기체에 도입하는 단계를 포함하는 유전체 편집 방법을 제공하는 것이다.
본 발명의 또 다른 목적은 상기 유전체 편집용 조성물을 분리된 세포 또는 유기체에 도입하는 단계를 포함하는 형질 전환체 제조 방법을 제공하는 것이다.
본 발명의 또 다른 목적은 상기 방법에 의해 제조된 형질 전환체를 제공하는 것이다.
본 발명은 상술한 문제점을 해결하기 위한 것으로, CRISPR/Cpf1 시스템에 있어서, 표적 뉴클레오티드(target nucleotide) 서열과 혼성화 가능한 가이드 서열(guide sequence)의 3'-말단에 연결된 유리딘(U, uridine) 반복 뉴클레오티드 서열로 이루어진 폴리뉴클레오티드를 제공한다. 또한, 표적 뉴클레오티드(target nucleotide) 서열과 혼성화 가능한 가이드 서열(guide sequence) 및 상기 가이드 서열의 3'-말단에 연결된 유리딘(U, uridine) 반복 서열을 포함하는 crRNA(CRISPR RNA) 또는 이를 암호화하는 DNA 및 Cpf1 단백질 또는 이를 암호화하는 DNA을 포함하는 유전체 편집용 조성물을 제공한다.
본 명세서에서, 용어 '유전체 편집(genome editing)'이란, 특별한 언급이 없는 한, 표적 유전자의 표적 부위에서의 절단에 의한 하나 이상의 핵산 분자(예컨대, 1 - 100,000 bp, 1 - 10,000 bp, 1 - 1,000 bp, 1 - 100 bp, 1 - 70 bp, 1 - 50 bp, 1 - 30 bp, 1 - 20 bp, 또는 1 - 10 bp)의 결실, 삽입, 치환 등에 의하여 유전자 기능을 상실, 변경, 및/또는 회복(수정)시키는 것을 의미하는 것이다. 일 구현예에 따르면, Cpf1 단백질을 이용한 type V CRISPR/Cpf1 시스템으로 표적 DNA의 원하는 위치에서의 절단이 가능하며, 다른 구현예에 따르면, Cpf1 단백질을 이용한 type V CRISPR/Cpf1 시스템으로 세포 내 특정 유전자의 교정이 가능하다.
또한, CRISPR/Cpf1 리보핵산단백질(ribonucleoprotein; RNP) 또는 이를 암호화하는 DNA를 세포에 전달하는 기술에 있어서, 기존의 마이크로주입법(microinjection)의 단점을 극복하기 위한 방안이 제공된다. 그 일 예로서, 전기천공법(electroporation), 리포펙션법(lipofection) 등으로 한 번에 많은 수의 세포에 리보핵산단백질 또는 이를 암호화하는 DNA를 플라스미드에 포함시켜 전달하여 유전체를 편집하는 기술이 제공되지만, 상기 Cpf1 시스템을 이용한 유전체 편집 기술이 이에 제한되는 것은 아니다.
CRISPR/Cpf1 유전자 편집 조성물은 Cpf1을 코딩하는 DNA를 포함하는 재조합 벡터 및 crRNA를 코딩하는 DNA를 포함하는 재조합 벡터의 형태로 세포 또는 유기체에 도입되거나, Cpf1 단백질 및 crRNA를 포함하는 혼합물 또는 이들이 복합체를 이루는 리보핵산단백질 형태로 세포 또는 유기체에 도입될 수 있다.
일 예는 표적 뉴클레오티드(target nucleotide) 서열과 혼성화 가능한 가이드 서열(guide sequence) 또는 이를 암호화하는 DNA 및 Cpf1 단백질 또는 이를 암호화하는 DNA, 또는 crRNA와 Cpf1 단백질의 복합체인 리보핵산단백질을 포함하는 유전체 편집용 조성물을 제공한다.
다른 예는 가이드 RNA(crRNA) 및 Cpf1 단백질을 포함하는 리보핵산단백질을 유기체에 전달하는 단계를 포함하는, 유기체의 유전체 편집 방법을 제공한다.
상기 유전체 편집용 조성물 또는 유전체 편집 방법에 포함되거나 사용되는 Cpf1 단백질 또는 이를 암호화하는 DNA, 및 가이드 RNA 또는 이를 암호화하는 DNA는, Cpf1 단백질 및 가이드 RNA 를 포함하는 혼합물 또는 이들이 복합체를 이루는 리보핵산 단백질(ribonucleioprotein; RNA) 형태로 사용되거나, Cpf1 단백질을 암호화하는 DNA, 및 가이드 RNA를 암호화하는 DNA를 별도의 벡터에 각각 포함하거나 또는 하나의 벡터에 함께 포함되어 사용될 수 있다.
상기 조성물 및 방법은 진핵 유기체에 적용되는 것일 수 있다. 상기 진핵 유기체는 진핵 세포(예: 효모 등의 균류, 진핵 동물 및/또는 진핵 식물 유래 세포 (예: 배아세포, 줄기세포, 체세포, 생식세포 등) 등), 진핵 동물(예: 척추동물 또는 무척추동물, 보다 구체적으로, 인간, 원숭이 등의 영장류, 개, 돼지, 소, 양, 염소, 마우스, 래트 등을 포함하는 포유류 등), 및 진핵 식물(예: 녹조류 등의 조류, 옥수수, 콩, 밀, 벼 등의 단자엽 또는 쌍자엽 식물 등)로 이루어진 군에서 선택된 것일 수 있다.
다른 예는 Cpf1 단백질을 이용한 유전체 편집에 의한 형질 전환 유기체의 제조 방법을 제공한다. 보다 구체적으로, 상기 형질 전환 유기체의 제조 방법은 Cpf1 단백질 또는 이를 암호화하는 DNA 및 가이드 RNA(CRISPR RNA; crRNA) 또는 이를 암호화하는 DNA를 진핵 세포에 전달하는 단계를 포함할 수 있다. 상기 형질 전환 유기체가 형질전환 진핵 동물 또는 형질전환 진핵 식물인 경우, 상기 제조 방법은 상기 전달하는 단계와 동시 또는 그 이후에 상기 진핵 세포의 배양 및/또는 분화 단계를 추가로 포함할 수 있다.
다른 예는 상기 형질 전환 유기체 제조 방법에 의하여 제조된 형질 전환 유기체를 제공한다.
상기 형질 전환 유기체는 모든 진핵 세포(예: 효모 등의 균류, 진핵 동물 및/또는 진핵 식물 유래 세포(예: 배아세포, 줄기세포, 체세포, 생식세포 등) 등), 진핵 동물(예: 척추동물 또는 무척추동물, 보다 구체적으로, 인간, 원숭이 등의 영장류, 개, 돼지, 소, 양, 염소, 마우스, 래트 등을 포함하는 포유류 등), 및 진핵 식물(예: 녹조류 등의 조류, 옥수수, 콩, 밀, 벼 등의 단자엽 또는 쌍자엽 식물 등)로 이루어진 군에서 선택된 것일 수 있다.
본 명세서에서 제공되는 유전체 편집 방법 및 형질 전환 유기체 제조 방법 있어서, 상기 진핵 동물은 인간을 제외한 것일 수 있으며, 상기 진핵 세포는 인간을 포함한 진핵 동물에서 분리된 세포를 포함할 수 있다.
본 명세서에서 사용된 용어 "리보핵산단백질"은 RNA 가이드 엔도뉴클레아제인 Cpf1 단백질과 가이드 RNA(crRNA)를 포함하는 단백질-리보핵산 복합체를 의미한다.
Cpf1 단백질은 상기 CRISPR/Cas9 시스템과는 구별되는 새로운 CRISPR 시스템의 엔도뉴클레아제로서, Cas9에 비해 상대적으로 크기가 작고, tracrRNA가 필요 없으며, 단일 가이드 crRNA에 의해 작용할 수 있다. 또한, Cpf1 단백질은, PAM (protospacer-adjacent motif) 서열로서, 5' -말단에 위치하는, 5'-TTN-3' 또는 5'-TTTN-3' (N은 임의의 뉴클레오타이드로서, A, T, G, 또는 C의 염기를 갖는 뉴클레오타이드임)와 같은 티민 (thymine)이 풍부한 DNA 서열을 인식하고 DNA의 이중 사슬을 잘라 점착종단(cohesive end; cohesive double-strand break)을 생성한다. 이와 같이 생성된 점착 종단은 표적 위치 (또는 절단 위치)에서의 NHEJ-mediated transgene knock-in을 용이하게 할 수 있다.
본 발명의 상기 Cpf1 단백질은 캔디다투스(Candidatus) 속, 라치노스피라(Lachnospira) 속, 뷰티리비브리오(Butyrivibrio) 속, 페레그리니박테리아(Peregrinibacteria), 액시도미노코쿠스(Acidominococcus) 속, 포르파이로모나스(Porphyromonas) 속, 프레보텔라(Prevotella) 속, 프란시셀라(Francisella) 속, 캔디다투스 메타노플라스마(Candidatus Methanoplasma), 또는 유박테리움(Eubacterium) 속 유래의 것일 수 있고, 예컨대, Parcubacteria bacterium (GWC2011_GWC2_44_17), Lachnospiraceae bacterium (MC2017), Butyrivibrio proteoclasiicus, Peregrinibacteria bacterium (GW2011_GWA_33_10), Acidaminococcus sp. (BV3L6), Porphyromonas macacae, Lachnospiraceae bacterium (ND2006), Porphyromonas crevioricanis, Prevotella disiens, Moraxella bovoculi (237), Smiihella sp. (SC_KO8D17), Leptospira inadai, Lachnospiraceae bacterium (MA2020), Francisella novicida (U112), Candidatus Methanoplasma termitum, Candidatus Paceibacter, Eubacterium eligens 등의 미생물 유래의 것일 수 있으나, 이에 제한되는 것은 아니다. 일 예에서, 상기 Cpf1 단백질은 Parcubacteria bacterium (GWC2011_GWC2_44_17), Peregrinibacteria bacterium (GW2011_GWA_33_10), Acidaminococcus sp. (BV3L6), Porphyromonas macacae, Lachnospiraceae bacterium (ND2006), Porphyromonas crevioricanis, Prevotella disiens, Moraxella bovoculi (237), Leptospira inadai, Lachnospiraceae bacterium (MA2020), Francisella novicida (U112), Candidatus Methanoplasma termitum, 또는 Eubacterium eligens 유래의 것일 수 있으나, 이에 제한되는 것은 아니다.
상기 Cpf1 단백질은 미생물에서 분리된 것 또는 재조합적 방법 또는 합성적 방법으로 비자연적 생산된 것(nonnaturally occurring)일 수 있다. 상기 Cpf1 단백질은 진핵세포의 핵 내 전달을 위하여 통상적으로 사용되는 요소(예: 핵위치신호 (nuclear localization signal; NLS) 등)를 추가로 포함하는 것일 수 있으나, 이에 제한되는 것은 아니다. 상기 Cpf1 단백질은 정제된 단백질 형태로 사용되거나, 이를 암호화하는 DNA, 또는 상기 DNA를 포함하는 재조합 벡터의 형태로 사용될 수 있다.
본 발명의 Cpf1 시스템에 사용되는 crRNA는 타겟 유전자와 혼성화되는 가이드 RNA 서열의 3'-말단에 유리딘 반복 서열이 연결되어 있는 것을 특징으로 한다.
본 발명의 일실시예에서 상기 유리딘 반복 서열은 유리딘이 2 내지 20개 반복되는 뉴클레오티드 서열일 수 있다. 바람직하게 본 발명의 crRNA는 6 내지 10개의 반복되는 유리딘 서열을 포함할 수 있고, 보다 바람직하게 8개 유리딘 반복 서열을 포함할 수 있다.
본 발명의 또 다른 일실시예에서 상기 유리딘 반복 서열은 (UaV)nUb로 표시되는 뉴클레오티드 서열일 수 있다. 이때 상기 a, b는 2 내지 20 사이의 정수이며, n은 1 내지 5 사이의 정수이고, 상기 V는 A(adenine), C(cytosine) 또는 G(guanine)이다.
본 발명의 바람직한 일실시예에서 상기 V는 A로서 (UaA)nUb 로 표시되는 뉴클레오티드 서열일 수 있다.
본 발명의 바람직한 일실시예에서 상기 n은 1로서 UaVUb로 표시되는 뉴클레오티드 서열일 수 있다.
본 발명의 바람직한 일실시예에서 상기 유리딘 반복 서열은 U4AU6 로 표시되는 뉴클레오티드 서열일 수 있다.
본 발명에서 표적 뉴클레오티드 서열과 혼성화 가능한 가이드 서열은 유전자 표적 부위의 뉴클레오티드 서열(표적 서열)과 50% 이상, 60% 이상, 70% 이상, 80% 이상, 90% 이상, 95% 이상, 99% 이상, 또는 100%의 서열 상보성을 갖는 뉴클레오티드 서열을 의미한다(이하, 특별한 언급이 없는 한 동일한 의미로 사용되며, 상기 서열 상동성은 통상적인 서열 비교 수단(예컨대 BLAST)을 사용하여 확인될 수 있다). 예컨대, 상기 표적 서열과 혼성화 가능한 crRNA는 상기 표적 서열(PAM 서열이 위치하는 가닥과 동일한 가닥에 위치)이 위치하는 핵산 가닥(즉 PAM 서열이 위치하는 가닥)의 반대 가닥에 위치하는 대응 서열과 상보적 서열을 갖는 것일 수 있으며, 이를 다르게 설명하면, crRNA은 DNA 서열로 표시된 표적 서열에서 T를 U로 치환한 서열을 타겟팅 서열 부위로 포함하는 것일 수 있다.
본 명세서에서, crRNA를 표적 서열로 표현할 수 있으며, 이 경우 별도의 언급이 없어도, crRNA 서열은 표적 서열에서 T를 U로 치환한 서열인 것으로 해석될 수 있다.
상기 유전자 표적 부위의 뉴클레오타이드 서열(표적 서열)은 5' -말단에 TTTN 또는 TTN (N은 A, T, C, 또는 G), 또는 이들과 50% 이상, 66% 이상, 또는 75% 이상의 서열 상동성을 갖는 PAM(protospacer-adjacent motif)와 연결(예컨대, 표적서열의 5' -말단과 PAM 서열이 직접 연결되거나 (0 nt 거리), 1 내지 10 nt 거리를 두고 연결)되어 있거나, 상기 5' 말단 PAM 서열에 더하여, 3' -말단에 상기 PAM 서열과 역방향으로 상보적인 서열 (NAAA 또는 NAA, 또는 이들과 50% 이상, 66% 이상, 또는 75% 이상의 서열 상동성을 갖는 서열; N은 A, T, C, 또는 G; 3'-말단의 inverted PAM 서열)과 연결(예컨대, 표적서열의 3' -말단과 inverted PAM 서열이 직접 연결되거나 (0 nt거리), 1 내지 10 nt 거리를 두고 연결될 수 있음)된 것일 수 있다.
본 발명의 일실시예에 있어서, 상기 crRNA에 포함된 가이드 서열은 18 - 23 nt일 수 있으나 이에 한정되지 않는다.
본 발명의 일실시예에 있어서, 상기 crRNA는 이를 암호화하는 DNA를 포함하는 PCR 앰플리콘(amplicon) 형태 또는 재조합 벡터에 포함된 형태로 제공될 수 있다. 일례로 본 발명은 crRNA를 암호화하는 DNA를 포함하는 PCR 앰플리콘(amplicon) 및 상기 Cpf1 단백질을 암호화하는 DNA를 포함하는 재조합 벡터를 포함하는 유전체 편집용 조성물을 제공할 수 있다. 또 다른 일실시예로 본 발명은 crRNA를 암호화하는 DNA를 포함하는 재조합 벡터 및 상기 Cpf1 단백질을 암호화하는 DNA를 포함하는 재조합 벡터를 포함하는 유전체 편집용 조성물을 제공할 수 있다. 이때 상기 재조합 벡터는 crRNA 코딩 DNA 및/또는 이와 작동 가능하게 연결된 프로모터 등의 전사조절 서열을 포합하는 crRNA 발현 카세트를 포함할 수 있다.
본 발명의 상기 crRNA를 암호화하는 DNA 및 crRNA를 암호화하는 DNA는 하나의 재조합 벡터에 함께 포함되거나 별개의 벡터에 각각 포함될 수 있다.
다른 예는 RNA 가이드 엔도뉴클레아제(RNA-guided endonuclease; RGEN)와 가이드 RNA를 포함하는 혼합물 또는 리보핵산단백질(ribonucleoprotein; RNP), 이들을 암호화하는 DNA, 또는 상기 DNA를 포함하는 재조합 벡터를 세포 또는 유기체에 전달하는 것은 국소주입법, 마이크로주입법(microinjection), 전기천공법(electroporation), 리포펙션 등에 의한 것일 수 있다.
상기 기재된 방법에 있어서, 상기 Cpf1(엔도뉴클레아제) 또는 이를 암호화하는 DNA 및 crRNA 또는 이를 암호화하는 DNA를 포함하는 혼합물 또는 리보핵산단백질, 또는 이를 암호화하는 DNA의 전달은 생체 외(in vitro)에서 발현된(정제된) Cpf1 및 crRNA의 혼합물 또는 이들이 접합된 리보핵산단백질을 마이크로주입법, 전기천공법, 리포펙션 등의 방식으로 진핵 세포 및/또는 진핵 유기체에 전달함으로써 수행할 수 있다. 다른 예에서, 상기 Cpf1 또는 이를 암호화하는 DNA 및 crRNA 또는 이를 암호화하는 DNA를 포함하는 혼합물 또는 리보핵산단백질의 전달은 Cpf1을 암호화하는 DNA을 포함하는 발현 카세트 및 crRNA를 암호화하는 DNA를 포함하는 발현 카세트를 별도의 벡터에 각각 포함하거나 하나의 벡터에 함께 포함하는 재조합 벡터를 국소주입법, 마이크로주입법, 전기천공법, 리포펙션 등의 방식으로 진핵 세포 및/또는 진핵 유기체에 전달함으로써 수행할 수 있다.
상기 발현 카세트는, 엔도뉴클레아제 코딩 DNA 또는 crRNA 코딩 DNA에 더하여, 통상적인 유전자 발현 조절 서열을 상기 엔도뉴클레아제 코딩 DNA 또는 crRNA 코딩 DNA과 작동 가능하게 연결된 형태로 포함하는 것일 수 있다.
상기 용어 "작동 가능하게 연결된(operatively linked)"은 유전자 발현 조절 서열과 다른 뉴클레오타이드 서열 사이의 기능적인 결합을 의미한다.
상기 유전자 발현 조절 서열은 복제원점(replication origin), 프로모터, 전사 종결 서열(terminator) 등으로 이루어진 군에서 선택된 1종 이상일 수 있다.
본 명세서에 시재된 프로모터는 특정 유전자의 전사 개시를 조절하는 전사 조절 서열 중 하나로, 통상적으로 약100 내지 약 2500 bp 길이의 폴리뉴클레오타이드 단편이다. 일 구체예에서, 상기 프로모터는 세포, 예컨대, 진핵 세포에서 전사 개시를 조절할 수 있으면, 제한 없이 사용 가능하다. 예컨대, 상기 프로모터는 CMV 프로모터(cytomegalovirus promoter; 예컨대, 인간 또는 마우스 CMV immediate-early 프로모터), U6 프로모터, EF1-alpha(elongation factor 1-a) 프로모터, EF1-alpha short(EFS) 프로모터, SV40 프로모터, 아데노바이러스 프로모터(major late promoter), pLλ 프로모터, trp 프로모터, lac 프로모터, tac 프로모터, T7 프로모터, 백시니아 바이러스 7.5K 프로모터, HSV의 tk 프로모터, SV40E1 프로모터, 호흡기 세포융합 바이러스(Respiratory syncytial virus; RSV) 프로모터, 메탈로티오닌 프로모터(metallothionin promoter), β-액틴 프로모터, 유비퀴틴 C 프로모터, 인간 IL-2(human interleukin-2) 유전자 프로모터, 인간 림포톡신(human lymphotoxin) 유전자 프로모터, 인간GM-CSF(human granulocyte-macrophage colony stimulating factor) 유전자 프로모터 등으로 이루어진 군에서 선택된 1종 이상일 수 있으나, 이에 제한되는 것은 아니다.
상기 전사 종결 서열은 폴리아데닐화 서열(pA) 등일 수 있다. 상기 복제 원점은 f1 복제원점, SV40 복제원점, pMB1 복제원점, 아데노 복제원점, AAV 복제원점, BBV 복제원점 등일 수 있다.
본 명세서에 기재된 벡터는 플라스미드 벡터, 코즈미드 벡터 및 박테리오파아지 벡터, 아데노바이러스 벡터, 레트로바이러스 벡터 및 아데노-연관 바이러스 벡터와 같은 바이러스 벡터로 이루어진 군에서 선택된 것일 수 있다. 상기 재조합 벡터로 사용될 수 있는 벡터는 당업계에서 사용되는 플라스미드(예를 들면, pcDNA 시리즈, pSC101, pGV1106, pACYC177, ColE1, pKT230, pME290, pBR322, pUC8/9, pUC6, pBD9, pHC79, pIJ61, pLAFR1, pHV14, pGEX 시리즈, pET 시리즈, pUC19 등), 파지 (예를 들면, λgt4λB, λ-Charon, λΔz1, M13 등) 또는 바이러스 벡터(예를 들면, 아데노-연관 바이러스 (AAV) 벡터 등) 등을 기본으로 하여 제작될 수 있으나, 이에 제한되는 것은 아니다.
본 발명은 CRISPR/Cpf1 시스템을 이용하여 진핵 세포의 유전자 교정을 수행함에 있어서 인델 효율을 높이고 오프-타겟 활성을 줄일 수 있고, 원하는 유전자가 삽입(knock-in) 또는 결실(knock-out)된 형질 전환 세포, 형질 전환 동물 또는 형질 전환 식물을 용이하게 제조할 수 있다.
도 1은 3'-말단에 U-반복 서열이 있는 crRNA(U-rich crRNA)가 Cpf1의 dsDNA 절단 효율을 상승시킨다는 점을 확인한 인 비트로(in vitro) 실험 결과이다:
도 1a는 crRNA의 3'-말단의 3개 염기서열 변이에 따라 AsCpf1의 인델 효율의 차이를 in vivo에서 확인한 결과이다.
도 1b는 타겟(DNMT1, LGALS3BP, VEGFA)에 따라 U3 말단이 인델 효율에 미치는 효과를 확인한 결과이다.
도 1c는 3'-말단에 U-rich crRNA에 의한 AsCpf1의 dsDNA 절단 효율 증가를 반응 시간 및 조건에 따라 확인한 결과이다.
도 1d는 암피실린 저항성 유전자 표적 서열 및 crRNA 라이브러리 서열을 나타낸 그림이다.
도 1e는 SLIC(sequence- and ligation- independent cloning) 방법(Li & Elledge, Methods Mol Biol, 2012)을 사용하여 올리고뉴클레오티드 라이브러리가 클로닝된 pET21 플라스미드 벡터로 형질전환된 BL21(DE3) E. coli의 CFU(colony forming unit)에 따른 콜로니를 나타낸 사진이다.
도 1f는 최적 crRNA 배열을 찾기 위한 비편향적 생체 외 실험(Unbiased in vitro experiment) 방법의 모식도를 나타낸 그림이다.
도 1g는 A, T, G 및 C가 각 위치에서 거의 동일한 몰비를 차지하도록 crRNA-코딩 플라스미드 DNA 라이브러리가 제조되었음을 확인한 딥 시퀀싱 데이터 분석 결과이다.
도 1h는 최적의 crRNA의 배열을 나타내는 각 위치에서의 뉴클레오티드 비율의 역전된 값(inverted value)으로부터 확률값(probability value)을 계산하여 나타낸 결과이다.
도 1i는 crRNA의 3'-말단 유리딘 서열의 길이에 따라 AsCpf1의 활성의 변화를 확인한 결과이다.
도 1j는 dsDNA 절단 활성을 분석하기 위한 인 비트로 실험 방법을 나타낸 모식도이다.
도 1k는 crRNA에서 U-rich 3'-오버행에 의해 AsCpf1의 활성이 증진되는 것을 검증한 결과이다(평균±표준편차, *;p < 0.05, **;p < 0.01, U8인 경우(n=3) 대비).
도 1l은 crRNA의 최적 배열을 확인하기 위한 실험 설계를 나타낸 모식도이다.
도 1m은 리드 넘버(The number of read)와 crRNA의 효율은 반비례함을 나타낸 결과이다.
도 1n은 리드의 표준화를 통하여, U8 3'-오버행을 갖는 crRNA가 최적의 AsCpf1 활성을 나타냄을 확인한 결과이다.
도 2는 인 비보(in vivo)에서 유전체 효율을 높이기 위한 최적의 crRNA 구조를 확인한 실험 결과이다:
도 2a는 본 발명에 따른 crRNA 최적 구조를 결정하기 위한 인 비보 분석 방법을 간략하게 나타낸 개념도이다.
도 2b는 본 발명에 따른 U-rich 3'-오버행 서열로 인해 향상된 인델 효율을 확인한 결과이다(평균±표준편차; 각각 3회 반복 실험 후 대표적인 결과를 나타냄).
도 2c는 3'-말단 U-rich 가이드 RNA에 의한 인델 효율의 향상이 Cas9과 달리 Cpf1에서 특이적으로 나타난다는 점을 확인한 결과이다(평균±표준편차; 각각 3회 반복 실험 후 대표적인 결과를 나타냄).
도 2d는 유리딘 길이의 증가에 따른 AsCpf1의 인델 효율 변화를 확인한 결과이다.
도 2e는 crRNA의 3'-말단 서열에 따른 인델 효율의 차이를 확인한 결과이다(*;p > 0.05, **;p < 0.05, ***;p < 0.01, n=3)
도 2f는 U-rich crRNA에 대한 유리딘 최적 타겟 길이를 확인한 결과이다.
도 2g는 CRISPR/Cpf1 시스템에서 유전체 효율을 향상시키기 위한 최적crRNA 구조를 검증한 결과이다(평균±표준편차; 각각 3회 반복 실험 후 대표적인 결과를 나타냄).
도 3은 U-rich 3'-오버행을 포함하는 crRNA에 의해 녹인(knock-in) 효율이 향상되는 것을 확인한 결과이다:
도 3a는 crRNA 및 donor DNA의 존재 하에서 DNMT1 위치의 dsDNA 절단이 나타나는 것을 간략히 나타낸 것이다.
도 3b는 CRIAPR/Cpf1 시스템에 의해 인델 돌연변이를 일으킨 후 타겟 부위의 인델 및 녹인 효율을 확인한 결과이다.
도 3c는 AsCpf1 및 SpCas9으로 같은 부위를 타게팅한 결과이다.
도 4는 CRISPR/AsCpf1과 CRISPR/SpCas9의 유전체 편집 효율을 대규모 수준에서 비교한 결과이다:
도 4a는 HEK-293T 세포에서 동일한 타겟 유전자에 대해 확인한 AsCpf1 및 SpCas9의 인델 효율을 나타낸 결과를 dot plot으로 나타낸 것이고, 도 4b는 Box-Whisker plot으로 나타낸 것이다.
도 5는 본 발명에 따른 U-rich crRNA가 오프-타겟 효과에는 영향을 미치지 않는다는 것을 확인한 실험 결과이다:
도 5a는 잠재적 오프-타겟 부위에서 종래의 crRNA서열과 U-rich crRNA 서열의 오프-타겟 활성을 비교한 deep-sequencing 결과이다.
도 5b는 온-타겟 서열에 대해 틀린(mismatch) 염기가 하나 있는 종래 crRNA와 U-rich crRNA의 오프-타겟 활성을 비교한 결과이다.
도 5c는 게놈 DNA의 98% 이상이 AsCpf1-U-rich crRNA뿐만 아니라 AsCpf1-표준 crRNA 리보뉴클레오단백질 복합체에 의해 분해되었음을 확인한 결과이다.
도 5d는 통합 게놈 뷰어(Integrative genomic viewer: IGV)를 통하여, 비표적 가닥의 18-20 위치 및 표적 가닥의 22 위치의 전형적인 절단 패턴을 확인한 결과이다.
도 5e는 Con-crRNA 및 U-rich-crRNA의 DNA 절단 스코어가 2.5 이상이고 불일치가 6 이하인 것으로 확인되는 오프-타겟 사이트를 전체 게놈 Circos plot에 나타낸 결과이다.
도 5f는 표준 및 U-rich crRNA에 대해 각각 확인된 오프-타겟 사이트의 개수 및 공통된 오프-타겟 사이트의 개수를 다이어그램으로 나타낸 것이다.
도 5g는 표준 및 U-rich crRNA에서, 전체 게놈 Circos plot의 동일한 오프-타겟 패턴을 나타낸 그림이다.
도 6은 본 발명에 따른 U-rich crRNA를 다중 유전체 편집 및 PAM-변이에 적용한 것이다:
도 6a는 다수의 U-rich crRNA에 의해 다중 타겟의 인델 효율이 동시에 상승하는 것을 확인한 결과이다.
도 6b 및 6c는 AsCpf1 PAM 변이체에 U-rich crRNA를 적용한 것이다(*;p > 0.001, **;p < 0.01, n=3).
도 7은 AsCpf1-U-rich crRNA 복합체의 향상된 결합 친화도를 확인한 것이다.
도 7a는 증가된 Cpf1 활성이 향상된 crRNA의 안정성 때문인지 또는 Cpf1의 직접적인 조절로 인한 것인지를 확인하기 위하여, 노던 블롯 분석을 수행하여 crRNA 수준을 나타낸 결과이다.
도 7b는 화학적으로 변형된 U-rich crRNA는 화학적으로 변형된 표준 crRNA 대비 훨씬 더 높은 Cpf1 활성을 나타내나, Cas9에 대한 화학적으로 변형된 가이드 RNA에 대해서는 유의적인 차이가 없음을 나타낸 결과이다.
도 7c는 63-nt 길이가 tracrRNA의 활성감소를 보이지 않는 최소한의 길이이며, 이 길이에서 U4AU4의 존재가 증가된 Cas9 활성을 유도하지 않는 결과를 나타낸 것이다.
도 7d는 U-rich crRNA는 표준 crRNA와 비교하여 AsCpf1에 대한 결합 친화력을 상당히 증가시키나, U-rich sgRNA는 SpCas9 복합체와의 결합력에 유의한 차이를 발생시키지 않음을 확인한 결과이다.
도 7e는 U-rich 및 표준 crRNA에 대해 각각 등온 적정 열량측정법(isothermal titration calorimetry: ITC) 분석을 수행한 결과를 나타낸 것이다.
이하, 실시예를 통하여 본 발명을 더욱 상세하게 설명하고자 한다. 이들 실시예는 오로지 본 발명을 예시하기 위한 것으로서, 본 발명의 범위가 이들 실시예에 의해 제한되는 것으로 해석되지 않는 것은 당업계에서 통상의 지식을 가진 자에게 있어서 자명할 것이다.
<실험 방법>
1. 세포 배양 및 형질주입(transfection)
HEK-293T 세포(293T/17, ATCC)는 고농도의 포도당 DMEM 배지에 열에 비활성화되는 10% FBS(Corning), 1 mM 페니실린/스트렙토마이신을 첨가하고 37℃, 5% CO2. 조건에서 배양하였다.
세포 형질도입은 전기천공법(electroporation) 또는 리포펙션(lipofection) 방법으로 수행하였다. 구체적으로 전기천공법의 경우, Neon electroporator (Invitrogen)를 사용하여 2 - 5 μg AsCpf1, LbCpf1, 또는 SpCas9가 인코딩된 플라스미드 벡터(Addgene)를 1 - 3 μg crRNA 또는 sgRNA가 인코딩된 PCR 앰플리콘과 함께 5 X 105 - 1 X 106 HEK-293T 세포에 형질도입시켰다. 필요에 따라 PCR 앰플리콘 대신 화학적으로 합성된 crRNA(Bioneer)가 사용되었다.
리포펙션 방법의 경우, 3 - 15 μL FuGene 시약(Promega)을 1 - 5 μg AsCpf1, LbCpf1, 또는 SpCas9가 인코딩된 플라스미드 벡터 및 3 - 15 μg PCR 앰플리콘과 15분 간 혼합하였다. 1 ml DMEM 배지에 형질도입 하루 전에 5 X 105 세포를 도말한 후, 상기 혼합물(300 μL)을 배지에 첨가하여 48시간 동안 배양하였다.
배양 후, 세포를 수확하고 PureHelixTM genomic DNA preparation kit(NanoHelix) 또는 MaxwellTM RSC nucleic acid isolation workstation(Promega)을 이용하여 유전체 DNA를 준비하였다.
pSpCas9(BB)-2A-GFP (PX458), pY010(pcDNA3.1-hAsCpf1), 및 pY016 (pcDNA3.1-hLbCpf1)는 Feng Zhang(Addgene plasmid #48138, #69982, #69988, respectively)으로부터 얻었다. 본 발명의 실시예에서 사용된 타겟의 정보는 하기 [표 1] 및 [표 2]에 나타내었다.
No. Gene name Chromosome Target Sequence Location 서열번호
1 DNMT1 19 [TTTC]CTGATGGTCCATGTCTGTTACTC 1013370 1
2 DNMT1 19 [TTTG]CTACACACTGGGCATCGGTGGGGG 10207808 2
3 VEGFA 6 [TTTC]TCCGCTCTGAGCAAGGCCCACAG 43781959 3
4 TP53 17 [TTTC]GACATAGTGTGGTGGTGCCCTAT 7674841 4
5 LGALS3BP 17 [TTTG]TGACAGACAGTTCCTGGAGTGCA 78972059 5
6 INIP 9 [TTTA]AGAGCAGCGATTGTAAGGAGAGG 112718012 6
7 LOC105370393 14 [TTTA]AAGAAAGCTACAGGAAAGCAGGG 19916499 7
8 KLHL29 2 [TTTA]GAGAGACCGCTCAGGCTGGAGGG 23847019 8
9 KLHL29 2 [TTTA]GGGAGACAGGGAGAAGTGAGAGG 23847166 9
10 KIF26B 1 [TTTA]CCCCTGCATTGCCATGAGCCCCC 245687161 10
11 KIF26B 1 [TTCC]GGGGGCTCATGGCAATGCAGGGG 245687161 11
12 CAV1 7 [TTTA]CCCGAGTCCTGGGGACAGTCCCC 116525483 12
13 CAV1 7 [TCCC]GGGGACTGTCCCCAGGACTCGGG 116525483 13
14 ITGB5 3 [TTCC]CCGCAGTGACACTCGCCATGGCC 124773887 14
15 ITGB5 3 [TTTA]GGCCATGGCGAGTGTCACTGCGG 124773887 15
16 COL8A1 3 [TTTA]GATTCATTCTCAGTGCCATGGGG 99413340 16
17 COL8A1 3 [TTTA]AGGCAATTGCAACCACTGAAGGG 99413482 17
(* 상기 타겟 서열의 [ ] 안의 4개 서열은 PAM 서열을 의미함)
No. Gene name Strand Type Primer(5'-3') 서열번호
1 DNMT1 negative intron forward CTGGGACTCAGGCGGGTCAC 18
reverse CCTCACACAACAGCTTCATGTCAGC 19
2 DNMT1 negative intron forward AAGCAAATCCACCTGCCTCG 20
reverse CCTCCCCTAGCCCTTTCAGG 21
3 VEGFA negative exon forward CTAGCCAGTGCTGCCTCTTT 22
reverse CGCTCGCTCACTCTCTTTCT 23
4 TP53 positive exon forward CAGATAGCGATGGTGAGCAG 24
reverse GGGAGGTCAAATAAGCAGCAGG 25
5 LGALS3BP positive exon forward ACTGAAGGCCGTGGACACCT 26
reverse CTTGTCCTGGAAGAGGAAGC 27
6 INIP negative exon forward ACAGGGCCATCTTGTGACAG 28
reverse CCGCTAAAGTGCGAATCACG 29
7 LOC105370393 positive intron forward GCCAGCCCCTGATTCTTCAG 30
reverse AGTGAATTATGTTGGCTTGGCA 31
8 KLHL29 negative intron forward AAGCCGAAAGCCTACACCTC 32
reverse GGACATTCGAAGCCCGTGTA 33
9 KLHL29 negative intron forward AAGCCGAAAGCCTACACCTC 34
reverse GGACATTCGAAGCCCGTGTA 35
10 KIF26B positive exon forward CTTTCAACAAAGCAGCCCCC 36
reverse TGCTCTGGTCTCAGCATTCG 37
11 KIF26B negative exon forward CTTTCAACAAAGCAGCCCCC 38
reverse TGCTCTGGTCTCAGCATTCG 39
12 CAV1 positive intron forward TGAGATTGGGTCTGTTGGGC 40
reverse TGAGATTGGGTCTGTTGGGC 41
13 CAV1 negative intron forward TGAGATTGGGTCTGTTGGGC 42
reverse TGAGATTGGGTCTGTTGGGC 43
14 ITGB5 positive exon forward TTGGTAAGAATGCGGCTCCC 44
reverse CATAACCATCTGGTGCCCCA 45
15 ITGB5 negative exon forward TTGGTAAGAATGCGGCTCCC 46
reverse CATAACCATCTGGTGCCCCA 47
16 COL8A1 positive intron forward GTGGCCAGGGTGGAGGATAAG 48
reverse CTCTGGCTCCTTTGATACCTCCG 49
17 COL8A1 positive intron forward GTGGCCAGGGTGGAGGATAAG 50
reverse CTCTGGCTCCTTTGATACCTCCG 51
2. AsCpf1 PAM 변이체
주형(template)이자 돌연변이를 발생시키는 프라이머(mutagenic primers)로서 pY010 플라스미드 벡터를 사용하여 Veriti thermal cycler(Life Technologies)에서 부위 특이적 돌연변이(site-directed mutagenesis)를 일으켰다.
S542R 돌연변이는 돌연변이 발생 프라이머 쌍(서열번호 52 및 53)을 이용하여 만들었다. K607R 및 K548V/N552R 돌연변이는 추가적인 돌연변이 발생 프라이머(서열번호 54 내지 57)를 이용하여 만들었다. 본 실시예에 사용된 프라이머 서열은 하기 [표 3]에 나타내었다.
서열번호 프라이머 서열(5'-3')
52 S542R mutagenic F primer 5'-TACACTGGCCAGAGGCTGGGACG-3'
53 S542R mutagenic R primer 5'-CGTCCCAGCCTCTGGCCAGTGTA-3'
54 K607R mutagenic F primer 5'-GATGATCCCAAGGTGCAGCACCC-3'
55 K607R mutagenic R primer 5'-GGGTGCTGCACCTTGGGATCATC-3'
56 K548V/N552R mutagenic F primer 5'-GTGGAGAAGAACAGAGGCGCCATCCTGTTT-3'
57 K548V/N552R mutagenic R primer 5'TCTGTTCTTCTCCACATTCACGTCCCAGCC-3'
간단히, 50 μl Toyobo KOD mixture(Takara)에 플라스미드 주형 100 ng 및 각 돌연변이 발생 프라이머 15 pmol를 넣고 초기 변성 단계(3 분, 94℃), 변성 단계(20초, 95℃) 25사이클, 어닐링 단계(40초, 62℃), 및 중합 단계(10분, 72℃)을 수행하였다. 10 μl PCR 산물을 2 μl DpnI(New England Biolabs)와 37℃에서 2시간 동안 반응시켰다. 이 반응 혼합물(5 μl)을 62℃에서 20분 간 열변성시킨 후 BL21(DE3) E. coli 세포에 형질전환하는데 사용하였다. 돌연변이 발생은 Sanger 서열분석기를 통해 확인하였다.
3. 재조합 AsCpf1의 정제
Acidaminococcus sp.에서 얻은 코돈-인간화(codon-humanized) Cpf1 유전자를 pET-28a(+) 플라스미드 벡터(Invitrogen)에 클로닝하고, 상기 벡터 구조는 BL21(DE3) E. coli 세포로 형질전환 되었다.
E. coli 형질전환체(transformant) 콜로니를 37℃ LB 배지(LB broth)에서 광학 밀도(ca)가 0.7에 이르기까지 성장시킨 다음, 재조합 단백질의 생산을 유도하기 위해 0.1 mM IPTG(isopropylthio-β-D-galactoside) 존재 하에서 세포를 30℃에서 하룻밤 동안 배양시켰다. 다음으로 3,500 g에서 30분 간 원심분리하여 세포를 수득하고, 초음파로 파쇄하였다. 세포 용출물은 15,000 g에서 30분 간 원심분리하여 정제하고, 0.45 μm 짜리 시린지 필터(Millipore)를 사용하여 여과하였다. 이렇게 정제한 용출물은 FPLC purification system(AKTA Purifier, GE Healthcare)을 사용하여 Ni2+-친화성 컬럼에 로딩하였다.
또는, 재조합 AsCpf1은 1 μg 유전자 컨스트럭트를 인 비트로(in vitro) 전사 혼합물에 첨가함으로써 자동화 단백질 생산 시스템(ExiProgen, Bioneer)에서 정제하였다. 생산된 단백질의 농도는 BSA(bovine serum albumin)을 기준으로 사용하여 쿠마시 블루로 염색된 SDS-PAGE로 확인하였다.
4. AsCpf1 인 비트로(i n vitro ) DNA 절단
TTTC PAM 다음에 5'-CTGATGGTCCATGTCTGTTACTC-3'(서열번호 58)의 DNA 서열을 갖는 PCR 앰플리콘을 T-Blunt 벡터(Solgent)에 클로닝 하였다. 상기 벡터 컨스트럭트를 DH5α E. coli 세포에서 증폭시키고, HiGeneTM DNA purification kit(Biofact)를 이용하여 정제하였다. 타겟 벡터(20 ng/μL)를 정제된 재조합 AsCpf1 단백질(50 ng/μL) 및 화학적으로 합성된 crRNAs(10 ng/μL)와 함께 37℃에서 30 - 60분 동안 반응시켰다. 상기 반응시킨 혼합물은 절단된 생성물의 정량을 위해 10% SDS-PAGE 겔에 용해시키거나, 42℃에서 2분 간 열충격을 가함으로써 DH5α E. coli 수용성 세포(competent cells)를 형질전환하는 데 이용되었다. 상기 형질전환된 세포를 암피실린(50 ng/μL)이 포함된 LB 아가 플레이트에 도포하고, 37℃에서 배양하였다. AsCpf1의 crRNA-의존성 DNA 절단을 유도하기 위해 형성된 콜로니의 수를 계수하였다.
5. 인델(indel) 정량
HEK-293T 세포의 타겟 부위(targeted loci)에서 AsCpf1, LbCpf1, 또는 SpCas9에 의한 인델 효율을 평가하기 위해 T7 엔도뉴클레아제I(T7E1) 어세이를 수행하였다. SolgTM Pfu-based PCR amplification kit(SolGent)를 사용하여 타겟 부위의 PCR 앰플리콘에 의해 PCR 산물을 얻었다. 다음으로 PCR 산물(100 - 300 μg)을 25 μ반응 혼합물에서 10 유닛(units)의 T7E1효소(New England Biolabs)와 함께 37℃에서 1시간 동안 반응시켰다. 20 μL 반응 혼합물을 10% SDS-PAGE 겔에 직접 로딩시키고, 절단된 PCR 산물을 TBE 버퍼 시스템에서 작동시켰다. 겔 이미지를 브롬화에티듐(ethidium bromide) 용액으로 염색시킨 후, Printgraph 2M gel imaging system(Atto)에서 디지털화하였다. 인델 효율 계산을 위해 Image J software를 이용하여 디지털화된 이미지를 분석하였다.
6. 오프-타겟(off-target) 활성 평가
Cas-OFFinder [21; http://www.rgenome.net/casoffinder; 표 4 내지 표 9]를 사용하여 돌출부(bulges) 및 잘못 짝지어진 부분(mismatches)이 2개 이하인 잠재적 오프-타겟 부위를 선별하였다. AsCpf1 벡터 컨스트럭트 및 crRNA-인코딩 PCR 앰플리콘으로 형질도입시킨 후 HEK-293T 세포를 DMEM에서 2일 간 배양하였다.

Target

Reference (Ref) sequence *

Location **

Gene name

서열번호

Ontarget

[TTTC]TTTCCTGTTTGTCTTGTGTC

63529049

PTK6

59

Offtarget_1

[TTTG]TTTtCTGTTTGTCTTGTAGTC

92840367

GRID2

60

Offtarget_2

[TTTG]TTTCCTGTTTGTCTTGT-aC

124222832

CNTNAP5

61

Offtarget_3

[TTTC]TTTCCTGTTT--CTTtTGTC

19610119

SLC24A3

62

Offtarget_4

[TTTC]TTTCCTGTTTGTCTTGCATcTC

79439750

NRXN3

63

Offtarget_5

[TTTG]TTTCCTGTTTGTtTTGTGTt

31598764

SRD5A2

64

Offtarget_6

[TTTA]TTTCtTGTTTGTCTTG-Gta

72315368

[Intergene]

65

Offtarget_7

[TTTG]TTTtCTGgTTGTCTTGTTGTC

81529011

GBE1

66

Offtarget_8

[TTTG]TTT--TGTTTGTCTTGTtTt

21505926

[Intergene]

67

Offtarget_9

[TTTG]TTTCCTGTTTcTCT--TtTC

141212565

TMEM178B

68
(* 상기 타겟 서열의 [ ] 안의 4개 서열은 PAM 서열을 의미함. 소문자는 불일치(mismatch) 서열, - 표시는 돌출부(bulge)를 의미함; ** 타겟 서열의 위치(location)는 Genome Reference Consortium Human Build 38 patch release 11 (GRCh38.p11)을 따름.)

Target

Ontarget

Offtarget_1

crRNA used

None

Con-crRNA

U-rich crRNA

None

Con-crRNA

U-rich crRNA

# of
Totalreads

32,198

60,926

72,353

26,146

42,698

36,134

# of Trimmed reads

30,593

57,674

71,154

25,671

41,974

35,638

# of reads
withRefsequence

29,639

55,050

63,763

25,009

40,983

34,747

% of
Refsequence

96.88

95.45

89.61

97.42

97.64

97.50

# of reads
withSNP ***

954

1,540

3,898

662

991

891

# of reads
withindel

0

1,084

3,493

0

0

0

% of
indelmutations

0.00

1.88

4.91

0.00

0.00

0.00

Sample ID

crRNA_On_N

crRNA_On_C

crRNA_On_U

crRNA_OF_1_N

crRNA_OF_1_C

crRNA_OF_1_U

Target

Offtarget_2

Offtarget_3

crRNA used

None

Con-crRNA

U-rich crRNA

None

Con-crRNA

U-rich crRNA

# of
Totalreads

50,910

65,262

47,616

18,932

36,988

37,582

# of Trimmed reads

46,579

60,213

43,916

18,373

36,500

37,031

# of reads
withRefsequence

45,174

58,667

42,540

18,021

36,160

36,638

% of
Refsequence

96.98

97.43

96.87

98.08

99.07

98.94

# of reads
withSNP ***

1,405

1,546

1,376

352

340

393

# of reads
withindel

0

0

0

0

0

0

% of
indelmutations

0.00

0.00

0.00

0.00

0.00

0.00

Sample ID

crRNA_OF_2_N

crRNA_OF_2_C

crRNA_OF_2_U

crRNA_OF_3_N

crRNA_OF_3_C

crRNA_OF_3_U

Target

Offtarget_4

Offtarget_5

crRNA used

None

Con-crRNA

U-rich crRNA

None

Con-crRNA

U-rich crRNA

# of
Totalreads

43,440

74,232

47,392

44,078

32,546

50,086

# of Trimmed reads

42,908

73,219

46,684

43,476

32,189

49,461

# of reads
withRefsequence

41,998

71,805

45,756

41,933

31,299

48,032

% of
Refsequence

97.88

98.07

98.01

96.45

97.24

97.11

# of reads
withSNP ***

910

1,414

928

1,543

890

1,429

# of reads
withindel

0

0

0

0

0

0

% of
indelmutations

0.00

0.00

0.00

0.00

0.00

0.00

Sample ID

crRNA_OF_4_N

crRNA_OF_4_C

crRNA_OF_4_U

crRNA_OF_5_N

crRNA_OF_5_C

crRNA_OF_5_U

Target

Offtarget_6

Offtarget_7

crRNA used

None

Con-crRNA

U-rich crRNA

None

Con-crRNA

U-rich crRNA

# of
Totalreads

38,444

22,976

53,748

37,844

32,386

72,972

# of Trimmed reads

37,670

22,558

52,520

37,202

31,899

71,896

# of reads
withRefsequence

37,188

22,206

51,728

36,723

31,482

70,963

% of
Refsequence

98.72

98.44

98.49

98.71

98.69

98.70

# of reads
withSNP ***

482

352

792

479

417

933

# of reads
withindel

0

0

0

0

0

0

% of
indelmutations

0.00

0.00

0.00

0.00

0.00

0.00

Sample ID

crRNA_OF_6_N

crRNA_OF_6_C

crRNA_OF_6_U

crRNA_OF_7_N

crRNA_OF_7_C

crRNA_OF_7_U

Target

Offtarget_8

Offtarget_9

crRNA used

None

Con-crRNA

U-rich crRNA

None

Con-crRNA

U-rich crRNA

# of
Totalreads

48,632

34,676

61,954

51,196

33,514

48,680

# of Trimmed reads

47,419

33,957

60,478

50,220

32,951

47,851

# of reads
withRefsequence

46,440

33,308

59,435

49,682

32,571

47,308

% of
Refsequence

97.94

98.09

98.28

98.93

98.85

98.87

# of reads
withSNP ***

979

649

1,043

538

380

543

# of reads
withindel

0

0

0

0

0

0

% of
indelmutations

0.00

0.00

0.00

0.00

0.00

0.00

Sample ID

crRNA_OF_8_N

crRNA_OF_8_C

crRNA_OF_8_U

crRNA_OF_9_N

crRNA_OF_9_C

crRNA_OF_9_U
(*** The occurrence of SNP was monitored in the investigated alleles by comparing with the sequences of non-treated alleles. These single-nucleotide variations identically observed between Cpf1-treated and non-treated alleles were deemed to be SNP. Those SNPs were taken into account and excluded when calculating off-target frequencies)
온-타겟(on-target) 및 잠재적 오프-타겟 부위를 nested PCR 을 이용하여 증폭시키고 라이브러리 구축에 사용하였다. 각각의 라이브러리는 Agencourt AMPure XP(Beckman Coulter)를 이용하여 정제하고, Quanti-iT PicoGreen dsDNA Assay Kit(Invitrogen)를 이용하여 Picogreen 방법으로 정량하였다.
Agilent 2100 Bioanalyzer System(Agilent technologies)를 이용하여 라이브러리의 크기를 확인한 후, Illumina에서 제시한 바에 따라 투입량과 적절한 클러스터가 잘 맞는지 qPCR 분석을 수행하였다. 다음으로, MiSeq Reagent Kit V3(Life Sciences)를 이용하여 Illumina MiSeq sequence platform 에 따라 페어-엔드 서열분석(paired-end sequencing)을 수행하였다. Cutadapt tool (version 1.14)를 이용하여 각각의 원자료(raw data)로부터 프라이머 서열을 제거하였다. 다듬어진 서열을 묶고 서열 비교(sequence comparisons)를 수행하였다. 23-nt짜리 타겟 서열 안에서 관찰되는 인델 돌연변이는 오프-타겟 활성에 의한 유전적 교정으로 보았다.
또는, HEK-293T 세포주의 DNMT1 타겟 부위는 PCR로 증폭된 다음 5 μg AsCpf1 벡터 컨스트럭트 및 3 μg crRNAs를 온-타겟 또는 하나의 염기만 미스매치되는 서열과 함께 2 X 106 HEK-293T 세포에 전기천공법으로 형질도입함으로써 인델 돌연변이를 유도하였다. 상기 인델 효율은 T7E1 digestion assay를 통해 SDS-PAGE 겔로 측정하였다.
7. 비편향적 생체 외 실험(Unbiased in vitro experiment)
3'-말단에서 무작위의 11-nt 서열을 갖는 crRNA 라이브러리 올리고뉴클레오티드를 합성하고 각 crRNA가 같은 몰비를 갖도록 하였다(Integrated DNA Technologies). 서열- 및 라이게이션-독립적 클로닝(sequence- and ligation-independent cloning: SLIC) 방법을 사용하여 올리고뉴클레오티드 라이브러리를 pET21 플라스미드 벡터 내로 클로닝하였다. 클로닝된 플라스미드를 사용하여 BL21 (DE3) E. coli 세포를 형질전환시키고, 108 CFU/mL 이상의 콜로니 형성 단위(colony forming unit)를 확보하였다. CFU 값은 암피실린 (+) 플레이트상에서 계열희석된(serially diluted) 형질전환 세포의 콜로니를 계수함으로써 계산하였다. 형질전환된 세포를 광학 밀도가 0.6에 도달할 때까지 50ng/mL 암피실린이 보충된 LB 배지에서 성장시켰다. 수용성 세포(2x1010cells/mL)는 Gene Pulser Xcell electroporator (BioRad)를 사용하여 dCpf1 또는 Cpf1-carrying pET-28a(+) 플라스미드 벡터(50-200ng)로 형질전환시켰다. 형질전환된 세포를 0.1M IPTG를 추가한 암피실린 및 카나마이신이 보충된 아가(agar) 플레이트 상에 도말하였다. 각 플레이트 상에 형성된 콜로니를 모아 플라스미드 벡터를 정제하였다. Illumina HiSeq X Ten Sequencer(Macrogen, South Korea)를 사용하여, crRNA의 각 위치에서 A/T/G/C 빈도를 계산하기 위해 플라스미드 벡터에 대한 딥시퀀싱 분석을 수행하였다.
8. 결합 실험(Binding experiment)
등온 적정 열량측정법(isothermal titration calorimetry: ITC) 및 미소규모 온도요법(microscale thermophoresis: MST)을 사용하여 결합 실험을 수행하였다.
Auto-iTC200 Microcalorimeter(GE Healthcare)에서 ITC를 수행하였다. 구체적으로, 화학적으로 합성된 표준 또는 U-rich crRNA(50μM)를 25℃의 PBS 버퍼(pH 7.4)에서 정제된 재조합 AsCpf1 단백질 5μM을 함유하는 적정 세포(titration cell)에 주입 당 2 μL씩 적정하였다. 데이터 분석은 MicroCal OriginTM 소프트웨어(GE Healthcare)를 사용하여 수행되었다. 계산된 값은 세 번의 독립적인 실험의 평균값이다. Monolith NT. 115(NanoTemper Technologies GmbH)를 사용하여 가이드 RNA와 이펙터 단백질(SpCas9 및 AsCpf1)의 결합 친화력을 측정하였다. 화학적으로 합성된 crRNA(IDT Technologies)를 Cy5 형광염료로 표지하였다. 다양한 농도(0.25nM-50μM)의 정제된 재조합 AsCpf1을 0.05% Tween-20 및 0.05% BSA를 함유하는 PBS 버퍼에서 8nM의 표지된 RNA와 혼합하였다. 24℃에서 5% LED 파워 및 20% MST 파워를 사용하여 분석을 수행하였다.
한편, Cas9 MST 실험에서, Cy5로 표지된 crRNA를 동일 분자비로 tracrRNA와 하이브리드화시켰다. 구체적으로, Nuclease-Free Duplex Buffer (IDT Technologies)에 재현탁된 2 개의 RNA 올리고를 95℃에서 5 분간 가열한 후 실온에서 냉각시켰다. 정제된 다양한 농도(0.1nM-15μM)의 SpCas9 단백질을 150mM KCl, 0.05% Tween-20 및 0.05% BSA가 함유된 20mM HEPES 버퍼(pH 7.4)에서 8nM의 표지된 RNA와 혼합하였다. 20% LED 파워 및 20% MST 파워를 사용하여 24℃에서 분석을 수행하였다. 모든 샘플을 NanoTemper 표준 모세관에 넣고 각 측정을 최소 3회 반복하였다. NanoTemper 분석 소프트웨어를 사용하여 결합 친화력 데이터를 분석하였다.
9. 노던 블롯 분석(Northern blot analysis)
총 RNA는 Maxwell RSC miRNA Tissue Kit(Promega)를 사용하여 HEK-293T 세포에서 제조사의 지시에 따라 추출하였다. 각각의 샘플에 대해, 65℃의 RNA 변성 버퍼(20% 포름알데히드, 50% 포름아마이드, 50mM MOPS, pH7.0)에서 15분 동안 변성시킨 후, 1% 아가로오스/16% 포름알데히드 겔에서, 0.3-0.5μg의 단리된 RNA를 분리하였다. 그 후, RNA를 10X SSC에서 모세관 이동에 의해 양으로 하전된 나일론 멤브레인에 밤새 트렌스퍼(transfer)하였다. RNA를 20-50ng/ml PCR DIG 프로브와 함께 50℃로 예열된 DIG Easy Hyb rnight에서 30분 동안 예비 하이브리드시키고, PCR DIG Labeling Mix(Roche)와 반응시킨 다음, 96℃에서 5분 동안 변성시켰다. 블롯을 세척하고 Anti-Degoxigenin-AP Fab 단편(Roche)으로 면역검출하였다. 표적 RNA-DNA 프로브 혼성체를 CDP-Star 기질(Roche)을 사용하여 화학발광(chemiluminescent) 분석법으로 시각화하였다. 프로브 서열(서열번호 69 및 70)은 하기 표 10과 같다.
서열번호 프로브 타겟 서열(5'-3')
69 DNMT1 target3 on-target 5'-AATTTCTACTCTTGTAGATCTGATGGTCCATGTCTGTTACTC-3'
70 DNMT1 target3 U-rich 5'-AATTTCTACTCTTGTAGATCTGATGGTCCATGTCTGTTATTTTATTTTTT-3'
10. 통계 분석
인델 효율의 통계 분석은 스튜던트 t-검정(two-tailed Student's t-test)을 사용하여 Sigma Plot에서 수행하였다. 통계 분석 결과에서 P-values < 0.05는 유의미한 것으로 보았다.
실시예 1. U-반복 서열을 포함하는 crRNA(U-rich crRNA)가 Ascpf1의 dsDNA 절단 효율을 향상시키는 효과 확인
Cpf1이 crRNA의 가이드를 받아 PAM의 T-반복 서열을 갖는 타겟에서 어떻게 DNA 이중나선을 절단하는지 확인하기 위해 crRNA-Cpf1 복합체 및 타겟 DNA의 구조 분석을 수행한 선행문헌(Dong et al. Nature 532, 522-538 (2016)., Yamano et al. Cell 165, 949-962 (2016))에 따르면 crRNA의 3-4개 뉴클레오티드 잔기와 타겟 DNA가 높은 유연성 때문에 미확인 상태로 남아 있다고 알려져 있다. 이는 특정 타겟을 인식하고 결합하는데 필요한 crRNA의 중요한 뉴클레오티드 길이가 CRISPR/Cas9 시스템에서와 같이 20-nt 정도일 것을 암시한다.
본 발명자들은 crRNA에서 3'-말단의 3-4개 뉴클레오티드가 단순이 불필요한 부분인지, 타겟 인식 이외에 다른 부차적인 역할을 할 수 있는지 확인하기 위해, 플라스미드 벡터를 코돈-인간화된(codon-humanized) AsCpf1 유전자 및 crRNA를 발현시키는 PCR 앰플리콘과 함께 HEK-293T 세포에 형질주입시켰다. crRNA는 DNMT1 유전자에 대한 20-nt짜리 표적 서열과 이에 이어진 3개짜리 가변 서열을 포함하도록 디자인되었다.
기초적인 확인을 위해 4가지 서로 다른 crRNA를 테스트했으며, 각각 가변 서열로 AAA(A3), UUU(U3), GGG(G3), 또는 CCC(C3)의 3'-오버행을 포함하고 있었다. T7E1 digestion 분석으로 확인한 결과, U3 3'-오버행을 가지고 있는 crRNA에서 가장 높은 인델 효율을 보였다(도 1a). 또한, U3 3'-오버행을 가지고 있는 crRNA는 23-nt짜리 타겟-상보적인 서열을 갖는 crRNA와 비교하여 향상된 인델 효율을 나타내었다. 3개의 추가적인 타겟 유전자를 대상으로 한 실험에서도 동일한 결과를 나타내었다(도 1b). 인 비트로(in vitro) DNA 분해 분석 결과, U3 3'-오버행을 갖는 crRNA는 구아니딘이 풍부한(G-rich) 경우에 비해 dsDNA 절단이 현저히 증가되었다(도 1c).
또한, 3'-오버행 라이브러리를 갖는 crRNA를 암호화하는 플라스미드 DNA 라이브러리를 준비하였다. 구체적으로, 11-nt 3'-말단 서열 라이브러리(411)를 갖는 crRNA 라이브러리 올리고뉴클레오티드를 합성하고, 각 crRNA가 같은 몰비를 갖도록 하였다. 각 crRNA는 온-타겟 서열에 대한 17-nt 및 11-nt(N11) 무작위 뉴클레오티드 서열을 갖도록 설계되었다(도 1d 내지 도 1f). 이러한 디자인을 통하여, 필수적인 온-타겟 길이 및 추가적인 조절 서열을 분명히 확인하고자 하였다. 효율적인 crRNA를 지닌 E. coli 세포는 암피실린이 보충된 아가 플레이트에서 생존력이 낮아지므로, crRNA의 최적 배열을 추적하기 위하여 네거티브 선별 방법(negative selection method)을 적용하였다. 그 후, 생존된 E. coli 세포를 수집하여 crRNA-코딩 플라스미드 DNA를 추출하고, 딥 시퀀싱 분석을 수행하여 표적 부위의 각 위치에서 뉴클레오티드의 수를 계산하였다(도 1g). 딥 시퀀싱 데이터 분석 결과, dCpf1 처리에 의해 평가된 바와 같이, A, T, G 및 C가 각 위치에서 거의 동일한 몰비를 차지하도록 crRNA-코딩 플라스미드 DNA 라이브러리가 제조되었음을 확인하였다. 미미한 차이(Marginal variation)는 dCpf1 처리에 의해 얻은 값으로 표준화하였다. 대조적으로, AsCpf1을 처리하였을 경우, 위치 의존적인 방식으로 각 뉴클레오티드의 빈도에 상당한 차이가 있음을 확인하였다. 최적의 crRNA의 배열을 나타내는 각 위치에서의 뉴클레오티드 비율의 역전된 값(inverted value)으로부터 확률값(probability value)을 구하였다(도 1h). 그 결과, 20-nt의 온-타겟 서열이 중요하나, 21의 위치에서, 온-타겟 서열과는 독립적으로 U-rich 3'-tail이 뒤따름을 확인하였다.
다음으로, 3'-말단의 유리딘(uridinylate) 길이가 다른 crRNA를 화학적으로 합성하고 AsCpf1/crRNA 리보핵산단백질(ribonucleoproteins)의 in vitro에서 dsDNA 절단 효율을 시험하였다. 그 결과, U8 오버행을 갖는 crRNA에서 DNA 절단 효율이 가장 좋은 것을 알 수 있었다(도 1i).
유리딘 길이가 추가적으로 증가된 것은 dsDNA 절단에 유의미한 영향을 미치지 않았다. 이로부터, 20-nt 표적-상보적 서열에 8 개의 유리딘(uridinylate)을 첨가하면 in vitro에서 최적의 dsDNA 절단 효율을 나타낸다는 것을 알 수 있었다.
다음으로, crRNA의 U-rich 3'- 오버행에 의해 AsCpf1의 dsDNA 절단 효율이 증가되는지 확인하기 위해, DNMT1에 대한 23-nt 표적 서열을 갖는 pUC19 플라스미드 벡터를 같은 몰비(equimolar ratio)의 AsCpf1/crRNA 리보핵산단백질과 함께 배양하는 in vitro 실험을 설계하였다. 구체적으로 1 시간 동안 부분 분해시킨 후, 분해된 플라스미드 벡터를 사용하여 E. coli DH-5α를 형질전환시켰다. E. coli 세포를 암피실린이 포함된 LB아가 배지에 도말한 후, 형성된 콜로니 수를 세었다(도 1j). 반복 실험을 통해 AsCpf1 활성의 효율을 높이는데 8 개의 유리딘(uridinylate)을 첨가하는 것이 중요하다는 것을 알 수 있었다(도 1k). 임의의 위치에서 유리딘을 임의의 다른 뉴클레오티드로 치환하면 AsCpf1의 dsDNA 절단 활성이 감소되는 것을 확인하였다.
마지막으로, crRNA의 최적 배열을 확인하기 위해 변형과 함께 견고한 검정(robust assay)을 수행하여, U-rich crRNA의 유효성을 확인하였다(도 1l). 구체적으로, BL21(DE3) E. coli 세포를 다양한 8-nt 3'-tail을 갖는 crRNA를 운반하는 pET21 벡터로 형질전환시켰다. crRNA는 플라스미드에서 암피실린 내성 유전자의 5'-근접 영역을 표적하도록 설계되었다. 독특한 crRNA 서열을 가진 콜로니를 선별하여 일렉트로-수용성(electro competent) 세포로 만들었다. 각 수용성 세포를 동일한 개수로 모아서 crRNA 라이브러리 세포를 만들었다. 그 후, 수용성 세포를 AsCpf1 유전자가 있거나 또는 없는 pET-28a(+) 플라스미드 벡터로 형질전환시켰다. 형질전환된 세포를 암피실린, 카나마이신 및 0.1mM IPTG가 보충된 아가 플레이트 상에 도말하였다. 각 플레이트 상에 형성된 콜로니를 모아 플라스미드 벡터를 정제 하고, 딥 시퀀싱 분석을 통해 각 crRNA의 점유율(occupancy)을 측정하였다. 그 결과, 리드 넘버(the number of read)는 crRNA의 효율에 반비례함을 확인하였다(도 1m). AsCpf1의 부재하에 얻어진 각각의 리드는 수용성 세포 내에서 다수의 crRNA 주형의 변형을 표준화하는데 사용되었다. 또한, 리드의 표준화를 통하여, U8 3'-오버행을 갖는 crRNA가 최적의 AsCpf1 활성을 나타냄을 확인하였다(도 1n)(비-U8 오버행과 비교하여, p < 0.01, n = 3).
상기 결과를 통하여, crRNA의 3'-말단 U-rich-tail이 AsCpf1에 의한 고효율 dsDNA 절단에 대한 결정적인 구조 결정 인자임을 확인하였다.
실시예 2. U 4 AU 4 3’-오버행 서열을 갖는 crRNA에 의한 Cpf1의 유전체 편집 효율 증진 효과 확인( in vivo )
crRNA의 U-반복 서열 구조가 직접적으로 인 비보(in vivo)에서 유전체 편집 효율 증진과 관련이 있는지 확인하기 위하여, 코돈-인간화 AsCpf1 유전자를 갖는 벡터 컨스트럭트를 U6 프로모터와 20-nt의 타겟 상보적 서열 및 3'-말단의 변이 서열을 포함하는 crRNA-인코딩 PCR 앰플리콘과 함께 형질주입시킨 HEK-293T 세포에서 인델 효율을 평가하였다(도 2a).
20-nt의 타겟 상보적 서열에 4-nt의 3'-말단 변이 서열(A4, G4, T4, C4 또는 타겟에 상보적인 4개의 뉴클레오티드)이 추가된 crRNA-인코딩 PCR 앰플리콘과 함께 DNMT1 유전자를 타겟하였다. 그 결과 인 비트로 결과(도 1)에서와 동일하게 인 비보에서도 3'-말단에 U-rich crRNA(20tT4)를 사용하였을 때 다른 crRNA(20tA4, 20tG4, 20tC4, 24t)에 비해 인델 효율이 현저히 상승하는 것을 확인할 수 있었다(도 2b).
이로부터 반복되는 유리딘 잔기가 세포 내에서 crRNA에 안정성을 부여하고, crRNA의 안정성 때문에 AsCpf1의 인델 효율이 상승할 것으로 생각되었다.
그러나, 단일-가이드 RNA(single-guide RNA, sgRNA)를 인코딩하는 PCR 앰플리콘의 3'-말단에 있는 T6 서열은 AsCpf1에서와 달리 CRISPR/Cas9 시스템의 인델 효율에는 영향을 미치지 못했다(도 2c). 또한, U-rich 3'-오버행이 인 비트로 시스템에서 효과적이라는 점을 확인했기 때문에, U-rich crRNA가 Cpf1에 결합할 때 Cpf1의 활성을 조절할 것이라는 점을 알 수 있었다.
다음으로, crRNA에서 3'-말단 유리딘의 길이에 따른 AsCpf1의 인델 효율 변화를 확인하였다. 상기 실시예 1에서 유리딘의 길이가 8-mer로 증가할 때까지는 Cpf1 활성이 길이에 비례하여 증가한다는 것을 인 비트로 실험에서 확인하였다(도 1c). 그러나 인 비트로 실험 결과와 반대로, crRNA-인코딩 PCR 앰플리콘에서 T의 길이가 4개가 될 때 인델 효율은 거의 포화되었고, 그 이상 증가하여도 인델 효율에 영향을 미치지 않음을 확인하였다(도 2d).
이 결과는 RNA 중합효소 Ⅲ가 U6-촉진 유전자 전사(U6-promoted gene transcription)를 조절한다는 사실로 설명할 수 있다. 이 과정에서, 주형 DNA의 연속적인 T-반복 서열(T5 또는 T6)이 종결 신호로서 작용하고, 결과적으로 3'-말단에 4 개의 유리딘(U4)이 생성된다. 따라서 주형에서 티미딘(thymidine) 염기 서열의 길이가 증가해도 crRNA에서 유리딘 길이의 증가를 수반하지 않는다. 그러나, 화학적으로 합성된 crRNA를 사용하는 경우, 최대 8-mer까지 유리딘의 길이를 증가시킬 때, 인 비트로 실험에서 관찰된 바와 같이 길이에 비례하여 Cpf1 활성이 증진된다는 것을 확인하였다(도 2d).
crRNA에서 3'-말단의 반복 유리딘이 인델 효율 증가에 결정적이라는 점을 고려하여 4 개의 데옥시티미디닐산(deoxythymidinylates)(T4)이 1개의 T가 아닌 염기(non-T base) 및 T6와 이어지도록 crRNA-인코딩 주형 DNA를 설계하였고, 결과적으로 U4VU를3'-꼬리 서열을 포함하는 crRNA를 생성하였다(여기서 V는 A, C 또는 G이다). U4 꼬리는 실제로 주형의 T-반복 말단 서열(T5 또는 T6)의 전사물에서 만들어진다. T 반복 서열에 A를 결합하였을 때가 G 또는 C를 결합하였을 때에 비해 인델 효율이 증가하였다(도 2e). 한편, U4A 단위를 추가함으로써 U의 개수를 증가시키더라도 추가적으로 인델 효율이 증가되지는 않았다. 이로부터 타겟-상보적 서열 위에 적어도 8개의 유리딘(U8)이 추가된 합성 crRNA가 유전체 편집 효율을 향상시키는 데 중요하다는 점을 알 수 있었다. crRNA가 DNA 주형으로부터 전사되어 만들어질 때, 주형 서열은 반드시 표적에 일치되는 서열 뒤에 'TTTTATTTTTT'서열을 지니고 있어야 한다. 이러한 구조는 crRNA에서 U4AU4 3'-오버행을 생성하고, 이는 합성 U8-crRNA와 거의 유사한 인델 효율을 나타낼 수 있다.
이때 타겟의 길이에 따른 인델 효율을 살펴본 결과, 가장 효율적인 타겟 길이는 20 (±1) nt로 타겟에 따라 다르다는 것을 알 수 있었다(도 2f).
이 최적화된 crRNA 구조는 Lachnospiraceae bacterium 에서 유래한 Cpf1(LbCpf1)에 동일하게 적용하였으며, 이는 AsCpf1과 함께 진핵 세포에 적용 가능한 이펙터 단백질(effector proterin)로 알려져 있다(도 2g).
U-rich crRNA에 의해 향상된 Cpf1 활성이 중요하다는 것은 '녹-인(knock-in)' 실험에서 명확하게 확인할 수 있었다. CRISPR/Cpf1 시스템의 전반적인 녹-인 효율은 CRISPR/Cas9에 비해 낮고, 이는 단일-가닥 올리고뉴클레오티드(ssODN, single-stranded oligonucleotide)를 도너(donor)로 사용했을 때도 마찬가지다. U-rich crRNA만이 AsCpf1에 의한 ssODN-기반 녹-인 레벨을 검출할 수 있었다(도 3a 내지 3c).
실시예 3. U-반복 서열을 포함하는 crRNA(U-rich crRNA)에 의한 AsCpf1의 유전체 편집 효율의 대규모 검증
U-rich crRNA에 의해 향상된 인델 효율은 서열 의존적이며, U-rich crRNA가 광범위한 표적에도 적용 가능한지 확인하기 위해, 대규모로 AsCpf1의 인델 효율을 조사하고 SpCas9에서 얻은 결과와 비교하였다.
먼저, 타겟 의존적인 인델 효율로 인한 차이를 배제하기 위해 Cpf1 및 Cas9에 공통적인 타겟 유전자를 검색하였다. AsCpf1 및 SpCas9에 대한 PAM 서열을 포함하며, 20-nt 표적 서열을 공유하는 5'-TTTV(N)20NGG-3' 서열을 타겟으로 구체적인 표적을 찾았다. 그 결과 49개의 엑손, 32개의 인트론, 34개의 유전자(intergenes)를 포함하는 HEK-293T 세포에서 PCR 검증된 115 개의 타겟을 발굴하였다(타겟 정보는 하기 표 11 및 표 12에 나타내었다). 단일-가이드 RNA(sgRNA, single-guide RNAs) 및 crRNA는 U6 프로모터 및 각각의 타겟 서열을 갖는 sgRNA 또는 crRNA 서열을 포함하는 PCR 앰플리콘으로부터 전사되도록 설계되었다.
Target No. Chromosome Location Gene name Target sequence (23nt) 서열번호
1 22 16994935 GAB4 CCTGGTGGCTGAGACCAGGGAGG 71
2 21 25603838 MRPL39 ATTTCACAGGACTTTGTTAAAGG 72
3 14 28794781 LINC01551 ATTTTGAAGTGACCGTACGAGGG 73
4 14 28794751 LINC01551 ATAATACACTCTTTACACTGAGG 74
5 15 24987466 PWAR5 AACAAATCACTGACTAACCAAGG 75
6 15 24987493 PWAR5 GTGTGGATAAGAATCACCTGAGG 76
7 3 131069719 NUDT16 GGGGTAGAGGTACTCTACAGGGG 77
8 3 131069756 NUDT16 GGGGTAGAGGTAGTCTACAGGGG 78
9 11 3087968 OSBPL5 GCATTAAGGCCAGCGCTGGGCGG 79
10 17 3669779 P2RX5-TAX1BP3 CACATAGGCCATTCAGAAACGGG 80
11 17 3670244 P2RX5-TAX1BP3 ATTTTAGCAATAACCTTACAGGG 81
12 20 499271 CSNK2A1 CGTGTTCAAAAACCAAGGCGGGG 82
13 14 20117733 OR4K17 ACAAGTTCAGAATCACCTTAGGG 83
14 17 943127 LOC100130876 AAATAACCGTCGGTTTCTTAAGG 84
15 7 72574897 TYW1B GATCCGATGCAATTTTGGGAAGG 85
16 13 19073987 LOC107984132 GGAAAGCGCAGAAAAGTAAAAGG 86
17 19 58005513 LOC100128398 AAGAGTTATTGTCAATAGAAAGG 87
18 19 58005993 LOC100128398 CAAAGAAATGTACTGCCTTACGG 88
19 7 2434356 CHST12 CCTCTGACTTGACTTCAAACAGG 89
20 16 31193648 FUS GTGGGTAGGTCCAGTTTGGGGGG 90
21 16 31193383 FUS ACAAAGAAACCAGCAGTGGCAGG 91
22 7 1233674 UNCX CCTGAACTCGGGACTCGACCAGG 92
23 7 1596749 LOC105375122 CCAACCAGGTACCCTGTGCCAGG 93
24 12 908894 WNK1 ACTGGTTATTTCTTGCCAGAGGG 94
25 12 909294 WNK1 GAACCCAGTGAAAAATACCAGGG 95
26 1 25281171 CLIC4 CCCTGGCTACCTCCCCTACCCGG 96
27 1 25281244 CLIC4 GAGGTAGCTTGCCATCTCTCAGG 97
28 13 19131269 CENPIP1 CTATTCACTTGTGTTACAGGAGG 98
29 13 20002951 ZMYM2 GTAGGCTGCTGTTGGACAGACGG 99
30 5 202864 CCDC127 GGCAAGGGTCTTGATGCATCAGG 100
31 5 202926 CCDC127 CCGAAAAAATGACTTTTTAGGGG 101
32 12 884137 WNK1 ACTCAAGTTGTTCATTCTGCGGG 102
33 12 674075 LOC105369597 GCCATGGTGAAGGTGAAATCAGG 103
34 13 18178734 LOC107687186 CTGAATTACAACAAATTGCAAGG 104
35 14 20457546 APEX1 AAGAAGGAATGGTAGTTGAGGGG 105
36 14 20457653 APEX1 AGCCCAAGATTTTTTATTTGAGG 106
37 1 25684228 RSRP1 ATATAGGATTTAGAAACCAAGGG 107
38 8 3000119 CSMD1 ACATTTTTAGCTGGCCACTGCGG 108
39 8 3087237 CSMD1 GAATACCCCCATTCTTCAGGGGG 109
40 9 112718012 INIP AGAGCAGCGATTGTAAGGAGAGG 110
41 9 14020 DDX11L5 AAAAGATCCCCATGGCCACAGGG 111
42 3 173963325 NLGN1 AACGAATATTCTCAGACCACAGG 112
43 1 61097979 LOC105378763 GGGAGGAGAACAGGAAATAAGGG 113
44 1 61097826 LOC105378763 ATTGAAACATATACGTGGTAAGG 114
45 3 173963498 NLGN1 GTCTAATAGAAATATAGTACAGG 115
46 1 25684090 RSRP1 GCTCTAATGTAAGTATATCCAGG 116
47 11 3042164 CARS CAACAGCCTCACCAGGAACAAGG 117
48 9 14020 DDX11L5 AAAAGATCCCCATGGCCACAGGG 118
49 12 32393 LOC107987170 GGGTTGCCAGATTAAAAGACAGG 119
50 2 32383384 NLRC4 GAGGGAGACACAAGTTGATAGGG 120
51 20 964362 RSPO4 ACTCATACATCACCTCCTCCAGG 121
52 5 359923 AHRR CCTTAATAAAGTATAACTTCAGG 122
53 19 627446 POLRMT GAAACTGCCCCAAAACCGGCCGG 123
54 19 627491 POLRMT AGGACTATGTGTGGCCAGTGAGG 124
55 17 292463 RPH3AL ATTTTCAAAACAGCCCTATGGGG 125
56 17 292509 RPH3AL CACAAGGGATCTGAGACTTGAGG 126
57 4 888480 GAK ACTCAAGGACTGGCTCAGTGAGG 127
58 4 888530 GAK CAGAGTCCCGGGAACAAGCCAGG 128
59 8 2204833 LOC105377782 TTTACAGCTCTGAGAACTAAACG 129
60 3 27160152 NEK10 AGACAAGCTGTCTTCCTTCAGGG 130
61 3 27160372 NEK10 ATCTGAAGATCATTGAAACAGGG 131
62 20 964345 RSPO4 AAGGAAAGGCTTCCTGGAGGAGG 132
63 2 32383454 NLRC4 GTCTCAGTCTTCCTTGTGGGAGG 133
64 4 42789361 LOC105374431 AGATAAGCGATAGTACATGAGGG 134
65 14 19916429 LOC105370393 GCAGTACACCTGAGGGAACAGGG 135
66 14 19916499 LOC105370393 AAGAAAGCTACAGGAAAGCAGGG 136
67 22 17678603 BCL2L13 ATTTCCAAGTCAACCTTATGAGG 137
68 22 17678663 BCL2L13 CAAAGTACCTGTTACTTAACAGG 138
69 12 133140444 ZNF10 AATAAGTCTTACCACGTGTCAGG 139
70 12 133140502 ZNF10 ATTCCCACAATAACCCTATGAGG 140
71 12 97515285 RMST ATAATGCCTTTTAGGTGATAAGG 141
72 12 97515361 RMST GAGAATAGAAATAAGAAAAAAGG 142
73 3 114911114 LOC101926886 CAAACAAAATAATTGGCTCAGGG 143
74 3 114911188 LOC101926886 CAATCATAGCAGAAGGTGAAGGG 144
75 4 42789433 LOC105374431 CTTTAAAATGAGGTACTAGGGGG 145
76 3 36995716 MLH1 AGGGAATGAAAGTGAAGATGGGG 146
77 2 23847019 KLHL29 GAGAGACCGCTCAGGCTGGAGGG 147
78 3 36995868 MLH1 GATCAATTTACATCAAACTAGGG 148
79 4 3343318 RGS12 ATCCCCACAAATACTCTACGAGG 149
80 3 99413340 COL8A1 GATTCATTCTCAGTGCCATGGGG 150
81 3 99413482 COL8A1 AGGCAATTGCAACCACTGAAGGG 151
82 5 102556075 - GAAATATGACTGGAAGTAAAGGG 152
83 5 102556078 - CTTCCAGTCATATTTCTAAAGGG 153
84 5 152068990 - CCCTTATTACAATCCTGTGGGGG 154
85 5 152068994 - CCCCCACAGGATTGTAATAAGGG 155
86 1 88052746 - ATCTCCATAACAATCTTTGGGGG 156
87 1 88052777 - CTATCCCCATTTTACAGATGAGG 157
88 3 157350012 - CTGAGATTTGCGAAGAGTTAGGG 158
89 3 157350043 - ATTAAATAGAGTCTTTTGAAGGG 159
90 3 128213929 - ATATTAATTGCAAGTTTGGGGGG 160
91 3 128213984 - GGCCAAGTGCGAAGTCAGAGGGG 161
92 4 3634902 - GGGGTGAACACCCAAGATCCCGG 162
93 4 3634954 - GGGTGGGCTCCTGGCAGGGCAGG 163
94 14 19023974 - AAAAGGGGAAAGAGAGAAAGAGG 164
95 6 254091 - AGAAGCATGCAAAACCGGCAAGG 165
96 6 254343 - AAGAGGGGAGGTTGACTTTGGGG 166
97 5 97245414 - GTCAAATAAAGAAATACACGGGG 167
98 5 97245470 - GTCAAATAAAGAAAAATACGGGG 168
99 20 156154 - ATGCATCTCAGTGGTTAACAGGG 169
100 8 296459 - ACCTCAGGCCTGATCATCAGGGG 170
101 4 54520460 - CATACAGGGCTCTGTACCCAGGG 171
102 4 54520536 - CAAAGACACTCACCCTGTTGGGG 172
103 5 170399606 - AGAACACATACCCCTGGGCCGGG 173
104 5 170399701 - ATAATAAAAGTATTTCCTCAGGG 174
105 17 1919439 - AGCCGTGGTCAGTGAGAGGCAGG 175
106 17 1919532 - GAGCTCATTAGCTTGGGGAGGGG 176
107 4 96592551 - GGAAAAGTCATCTGCTACTAGGG 177
108 9 7742784 - GAAAATAACTAAACTTCCCAGGG 178
109 15 25637364 - AATTCTTTAAGTAATTTAAGAGG 179
110 4 96592739 - ATTGTATTGTCATAAATTTGGGG 180
111 9 7742966 - CTTAGTAGTCTCAGAACCAAGGG 181
112 15 25637516 - AAAGGAGCACAAGTACAAACAGG 182
113 18 561716 - AATGATGCAGTAATCGTGTAGGG 183
114 5 136515115 - ACTTGACATAGTAAGAAACAGGG 184
115 5 136515295 - ATAAAAGGAACTATTTACAAGGG 185
No. Strand Type primer F(5'-3') 서열번호 primer R(5'-3') 서열번호

1

negative

exon
GTGCTCCCATACCTGTGCTT 186
CTCACCCAACCTCCTGCTCT
187

2

positive

exon

GGCAGGCTGGGAACAGATTAT
188
GCAGAATCTTGCCTTTCCATTGT
189

3

negative

exon

TGCTGTGTACCCCCATTTGA
190
CTTCACCCAACTTGCACTGG
191

4

negative

exon

5

negative

exon

GTCAGCTACCTTTCCCATGTT
192
TGAAGTGTTTACGTCCTCCCAT
193

6

positive

exon

7

positive

exon

AAAAGATGCTGGACCTTGGC
194
CAGGATGAGCAGCACTTTGG
195

8

positive

exon

9

positive

exon

CGGGGCTCCTCCAAACCTG
196
CTCCATGGAGGCAGAGAGGC
197

10

positive

exon

CTGTAACGCTTAGGCTGCCA
198
CTGGCCTGTGAAAGGTACAC
199

11

positive

exon

12

positive

exon

TCAAGATGCAGAAAGTGGGC
200
CCTAGAGCCTGGTGAGACTT
201

13

negative

exon

ACAGGTCATCCAAGAGCGAG
202
AGGAGACCCAAGAGCCATGA
203

14

positive

exon

CAAGGCTGGGCAGAGTAACTT
204
TCCCTGGATTTACAGTGGGGTG
205

15

positive

exon

GTCGTGATATGAGAGGCCCG
206
TCACCTGGCCCTTGGATTTC
207

16

negative

exon

CACTGTCGGAGCTCACATCG
208
GCCTCCTTCCAGGGTTGATG
209

17

negative

exon

GCAGAAGCTGGACTTGCCTC
210
AACCCCCGAGATAGGAAGGG
211

18

negative

exon

19

negative

exon

CCGCACCTGTCTGTTTTTGG
212
GCTAGAGTGCAATGTCGCGA
213

20

positive

exon

CAACAGTAGGCGGAGAGTGG
214
GAGGCCAGTTCAAGACCAGC
215

21

negative

exon

22

negative

exon

GCCCTTCAAGCTGTCAGGTA
216
TCTCGCCACCTGGAACAAAG
217

23

positive

exon

GGGCTCTAATGGCTGTGTGT
218
CTTTTCCCTCGACCTCCACC
219

24

positive

exon

GGGAACTGCCTCCTTGCAGAA
220
TGGCAAAGTTACATGTCCGC
221

25

positive

exon

26

positive

exon

CGCTTTTCCTAACAGGCTACTCC
222
GCATTATGCACCAGTTTGGGG
223

27

positive

exon

28

positive

exon

ACGCCCTAATGAAATTCTAGCCC
224
GCTGTGCCGGACGATCAAAA
225

29

negative

exon

CCTCTCTGCTATGTTGCTGTTCC
226
GCCACCTGGACTTGATAGGG
227

30

positive

exon

AGCACACTGGACATTAGAAACAGG
228
GATTACAGGCGTGCGCTACC
229

31

positive

exon

32

positive

exon

CCAATTCCTGCGTCTTCCATGCC
230
CAACATAGCAGAGGCACTGTAG
231

33

positive

exon

GAACCCTTATGGTGGGCTGTGG
232
GGGATGTCAGTGCTGTTGTGCAG
233

34

positive

exon

GTCTTTTTCCAGCCTGAGCCAGG
234
GTCTGCCAAGCTAAGGCTCTCAC
235

35

negative

exon

GCTTCCCCAGTCTTGCCAGTTGT
236
CCACTGTACCCTTCCTTGTCCGA
237

36

positive

exon

37

negative

exon

TGTCAGTAGGCCCCCAACTA
238
GCCTAACTGGCAAATGCCTTA
239

38

negative

exon

TGAACATGGCACCTCTCCTG
240
TGTTGCGCCTTCAATACTGT
241

39

positive

exon

GTTTGCATGGCCACTAGAAGG
242
CTCTCACAAAGGCAATGGCAC
243

40

negative

exon

ACAGGGCCATCTTGTGACAG
244
CCGCTAAAGTGCGAATCACG
245

41

positive

exon

GACGGAGCAGACCCATCTGC
246
GAGCCTAATGGCCCTTGGCAC
247

42

positive

exon

GCCCCCGTATTACCACTCTG
248
CCAGTGACATGGCCAAGATG
249

43

positive

exon

ACCCCTTCCAATACCATTTGAGA
250
TGCATAACTCGACAGATACACA
251

44

negative

exon

45

negative

exon

GCCCCCGTATTACCACTCTG
252
CCAGTGACATGGCCAAGATG
253

46

negative

exon

TGTCAGTAGGCCCCCAACTA
254
GCCTAACTGGCAAATGCCTTA
255

47

negative

exon

GTCCGAGAGACAAGCCAGGG
256
GATCCTGCTCTCTCTGCCTCC
257

48

positive

exon

GACGGAGCAGACCCATCTGC
258
GAGCCTAATGGCCCTTGGCAC
259

49

positive

exon

CAGTCAAGTCCAGCAGTTGTCCC
260
GAGTAGGGTGGCCAGAGGCAG
261

50

negative

intron

CCCACTCCACTTTGTTCCCAG
262
TCCTGGGCCCAATCATTCTG
263

51

negative

intron

AGGGTTTGAGGGGTTCAGTC
264
ACTTGACTCCCAACTCAGGC
265

52

negative

intron

TAGGTGGGCAAGAACAGAGG
266
TTCAGCACAGAGAGGGACAG
267

53

negative

intron

CTCCCAGGTTCACTCCATCC
268
GGCCACGTATTCTAACCAGC
269

54

negative

intron

55

positive

intron

TTGGAGAAGCATCACCTGCC
270
CGGGCTGTGTCCTAACGAAT
271

56

positive

intron

57

positive

intron

ACATTCCCAGTGTTCCGTGAG
272
CATCCAGTCCGTCGCTAAGT
273

58

positive

intron

59

negative

intron

CACCCCAACAACTTCTGGGG
274
AGCATGGTGCAGAATAGTGTGT
275

60

negative

intron

GGATTACCTGGGAGGGAGTCA
276
GGTTGATGTCCACCCCTTCA
277

61

negative

intron

62

positive

intron

AGGGTTTGAGGGGTTCAGTC
278
ACTTGACTCCCAACTCAGGC
279

63

negative

intron

CCCACTCCACTTTGTTCCCAG
280
TCCTGGGCCCAATCATTCTG
281

64

negative

intron

AGTTAATGGGTGCAGCACAC
282
TCCCAGCAAGTATTCAGCAACA
283

65

positive

intron

GCCAGCCCCTGATTCTTCAG
284
AGTGAATTATGTTGGCTTGGCA
285

66

positive

intron

67

negative

intron

AGATGACGAGAGCACAGCCT
286
GGGCCACTAAGTTGCAGGTC
287

68

negative

intron

69

positive

intron

GCAGTGGCTCACACCTGTAGTTC
288
CAGATCTCCAGAATTCTCCTGCTG
289

70

positive

intron

71

negative

intron

TAAGAAGCCTATGGGGAGCAG
290
GGCAAGGTCCCTGAACAGACATG
291

72

positive

intron

73

positive

intron

CCTCCCAGCCATGCTTCCTGTTA
292
AGTTTGGATGCTTGCTCCCTCC
293

74

positive

intron

75

negative

intron

AGTTAATGGGTGCAGCACAC
294
TCCCAGCAAGTATTCAGCAACA
295

76

positive

intron

TGGAGGTTCCAAGGGACCAG
296
AAGACTCCAGGAGGCCATGG
297

77

negative

intron

AAGCCGAAAGCCTACACCTC
298
GGACATTCGAAGCCCGTGTA
299

78

positive

intron

TGGAGGTTCCAAGGGACCAG
300
AAGACTCCAGGAGGCCATGG
301

79

positive

intron

CAGCGTCCCATGCACATTTGGG
302
GAGAGGACAGCACGGGCAGG
303

80

positive

intron

GTGGCCAGGGTGGAGGATAAG
304
CTCTGGCTCCTTTGATACCTCCG
305

81

positive

intron

82

negative

intergenic

CCATGACCCACAGAAACTAGAA
306
TCACCACCATCTCACCTTTG
307

83

positive

intergenic

84

positive

intergenic

GGAGGCATTTACAGTGCAGG
308
AATGCAGGTGAGGCCATTGT
309

85

negative

intergenic

86

positive

intergenic

GGGGACACATTCAGACCCTA
310
CTCAGTGTGAACGCGATTGG
311

87

positive

intergenic

88

negative

intergenic

GCTCCCTGTTTTGCTCCTTC
312
CCAACTCCAAGCCAAGCATT
313

89

negative

intergenic

90

negative

intergenic

GCTGTGAGGAGAAAAGAGAGCA
314
GTGGTGAAAGGCCATGAGGG
315

91

negative

intergenic

92

negative

intergenic

AGGGGACCCCCTGTAGAAC
316
GGGCCTCAAGTTTGTTTTGC
317

93

negative

intergenic

94

negative

intergenic

ATGGCTTTTTCAGGATTCCAAACT
318
GCAGCCCCTACAGAAATGAGT
319

95

positive

intergenic

GCAGGCTGGTAACTGTGACT
320
ACCTGCTGCAGAACTGAAGC
321

96

positive

intergenic

97

positive

intergenic

CCAATGGTGATGAGACAGCGT
322
GTGGAGGGTGTCCTGGTTCT
323

98

positive

intergenic

99

positive

intergenic

CTGCCCTCCAGTTGTGACTT
324
TGCCACAAGGAATCGATGTT
325

100

negative

intergenic

TGTCTAAGGCCACGACCACAAGC
326
CCTTCTTGGCACTTCTCGGTGGT
327

101

negative

intergenic

GGCCCAGAACCTTGCTCTTTGAG
328
AAGGAGCTGTGCTGTGCAGGTA
329

102

positive

intergenic

103

negative

intergenic

CTGCACCACCACACCTGGCTAAT
330
AGAACAGAGCAGTGGGCAACAGG
331

104

negative

intergenic

105

positive

intergenic

AGAGGGGCACTCGGGAAGAGATA
332
GGAGGACTTCTTCCCTGTTGGTC
333

106

positive

intergenic

107

positive

intergenic

TAAACAGGGAAGCGTGGAAGA
334
TGATGCTTCACCTCAGTGTCT
335

108

negative

intergenic

ATGATTGGGTTCTGCTGAGGG
336
AGACCACCTAAAACATTGGCT
337

109

negative

intergenic

GGCCTGACCCTCCAGATCTT
338
GCACTATGCGATCTCCTGGC
339

110

positive

intergenic

TAAACAGGGAAGCGTGGAAGA
340
TGATGCTTCACCTCAGTGTCT
341

111

positive

intergenic

ATGATTGGGTTCTGCTGAGGG
342
AGACCACCTAAAACATTGGCT
343

112

positive

intergenic

GGCCTGACCCTCCAGATCTT
344
GCACTATGCGATCTCCTGGC
345

113

positive

intergenic

ACAAATCCCCTCATCCCAACG
346
AAGCTCACTCACCCACCACT
347

114

positive

intergenic

GCAACAATCGCCATTCCTCACCC
348
GTGGCCCTCTTATAGCTCTAGG
349

115

positive

intergenic
도 4a 및 도 4b에 조사된 타겟에서의 인델 효율을 각각 점과 박스 위스커 플롯(box-and-whisker plots)으로 나타내었다. 각 타겟에 대해, SpCas9, 표준 crRNA(canonical crRNA)를 갖는 AsCpf1(Con-AsCpf1), 및 U-반복 서열을 포함하는 crRNA를 갖는 AsCpf1(U_rich-AsCpf1)의 인델 효율을 조사하였다. 115 개의 타겟 중 2개는 유전자 편집 시스템에 의해 인델 돌연변이를 나타내지 않았지만, 나머지 113 개의 표적은 실험한 시스템 중 적어도 하나(98.2 % 적용 범위)에서 검출 가능한 수준의 인델 돌연변이를 나타내었다.
본 발명의 실시예를 통해 처음으로 통계적으로 충분한 크기의 표본에 대하여 Cas9와 Cpf1의 인델 효율을 비교하였다. 이러한 대규모 데이터에 대한 통계 분석 결과 다음과 같은 결론을 얻었다:
1) Cpf1의 효율이 SpCas9의 효율과 비슷하다고 알려진 바와 달리, 표준 crRNA에 의해 유도된 AsCpf1의 전체적인 효율은 SpCas9의 효율보다 낮았다(p = 0.003).
2) U-rich crRNA는 AsCpf1의 인델 효율을 유의하게 향상시켰고(p = 0.00003), U-rich crRNA에 의해 향상된 AsCpf1 효율은 SpCas9 효율과 거의 유사 하였다(p = 0.29).
3) 표준 crRNA에 의한 인델 돌연변이가 검출되지 않는 표적의 경우, U-rich crRNA을 사용했을 때도 효율 개선에 아무런 영향을 미치지 않았다. 그러나 검출 가능한 돌연변이가 있는 표적의 경우, 90.3%(94/104)의 표적이 U-rich crRNA에 의한 증가된 효율을 나타내었고, 증감 범위는 1.07 - 12.98 배, 평균 증가율은 2.31이었다.
4) Cpf1과 Cas9는 유전체 편집 도구로서 상호보완적이다. U-rich crRNA에 의해 유도된 AsCpf1은 SpCas9에 의해 돌연변이가 유도되지 않거나 낮은 인델 효율을 갖는 타겟에 대해 효율적으로 돌연변이를 일으켰으며, 그 반대의 경우도 마찬가지였다.
이러한 결과로부터 U-rich crRNA를 매우 효율적이고 예측 가능한 방법으로 사용하는 CRISPR/Cpf1 시스템을 CRISPR/Cas9 시스템을 보완하는 유전체 편집 도구로 사용할 수 있음을 알 수 있었다.
실시예 4. U-rich crRNA에 의한 오프-타겟(off-target) 효과
Cpf1의 높은 목표 특이성과 낮은 오프-타겟 활성은 여러 연구 결과를 통해 알려져 있었고, 특히 AsCpf 및 LbCpf1이 모두 인간 세포에서의 유전체 편집에 매우 특이적이고 SpCas9보다 오프-타겟 활성이 더 낮다고 알려졌다. U-rich crRNA가 온-타겟(on-target) 편집에 있어서 현저한 활성 증가를 나타내지만, 짧아진 표적 길이(23 - 20nt)가 Cpf1의 표적 특이성을 향상시키는 반면, 오프-타겟 활성을 증가시킬 수 있다는 우려가 있다. 이 문제를 해결하기 위해 본 발명자들은 U-rich crRNA에 의해 유도된 AsCpf1의 오프-타겟 활성을 표준 23-nt 타겟-상보적인 crRNA에 의해 유도된 것과 편향된 방식으로 비교 하였다. Cpf1의 전체 유전체(genome-wide) 표적 특이성을 광범위하게 조사하였기 때문에, 오프-타겟 활성의 편향된 분석은 U-rich crRNA에 의해 야기 될 수 있는 잠재적 특이성 문제를 충분히 평가할 수 있다.
Cas-OFFinder를 사용하여, 가장 작은 돌출부(bulge) 및 포스포-티로신 키나아제 6(PTK6, phospho-tyrosine kinase 6)의 표적 서열과 불일치하는 서열이 있는 9 개의 잠재적인 오프-타겟 부위를 선택하였다. 다음으로, HEK-293T 세포에서 AsCpf1에 의한 돌연변이 발생률을 조사하였고, 표준 23-nt crRNA(con-crRNA)와 U-rich crRNA간의 인델 효율 차이를 비교하였다. 심층 서열 분석(deep sequencing analysis) 결과, 도 2 및 도 3에 나타낸 결과와 마찬가지로, 본 발명의 U-rich crRNA에 의한 온-타겟 인델 효율이 2.61배 증가하는 것을 알 수 있었다(도 5a).
그러나, 모든 잠재적인 오프-타겟에 대한 타겟 서열 내에서 인델 돌연변이를 관찰하지 않았다. 단일염기다형성(SNP, single nucleotide polymorphism)이 AsCpf1 비-처리 세포에서 동일하거나 비슷한 수준으로 나타났기 때문에, 참조 서열에 대한 차이는 단일염기다형성 때문일 가능성이 있다(표 4 내지 9 참조). 이 결과로부터 U-rich crRNA의 사용이 AsCpf1의 오프-타겟 활성에 영향을 미치지 않는다는 것을 알 수 있었다.
다음으로, 본 발명자들은 표적 부위 서열(protospacer sequence)과 맞지 않는 단일 염기를 갖는 crRNA를 사용함으로써 DNMT1 부위에 오프-타겟 수준이 변화하는지 알아보았다. crRNA의 3'-말단과 중간 부위(positions 8-10)에서 불일치에 대해 유의미하고 상당한 수준의 내성(tolerance)이 관찰되었다.
상기한 부위에서 더 높은 수준의 오프-타겟이 나타났음에도 불구하고, 반복적인 실험을 통해 타겟 위치 타겟 부위 전체적으로 오프-타겟 인델 돌연변이가 널리 발생한다는 것을 확인하였다(도 5b). 흥미롭게도, U-rich crRNA을 사용함으로써 3'- 말단 영역(18-20 positions)을 제외하고 대부분의 표적 위치에 대한 단일 염기 불일치에 대한 내성이 감소하였다. 이 결과는 절단된 가이드 RNA가 SpCas9의 표적 특이성을 향상시킨다는 종래 연구결과와 일치한다. 본 발명자들은 종래 보고된 바와 같이 18-20 위치에서 상당히 높은 수준의 오프-타겟 활성을 관찰하였고, U-rich crRNA는 이 영역에서 오프-타겟 활성을 약간 악화시킨다는 것을 확인하였다. 그럼에도 불구하고 오프-타겟과 타겟 돌연변이 수준의 비율이 실제로 중요하다는 것을 고려할 때, U-rich crRNA를 사용하더라도 Cpf1 특이성의 내재적 수준을 크게 손상시키지 않는다는 것을 알 수 있었다.
마지막으로, crRNA 구조에 따른 오프-타겟 활성의 변화를 모니터하기 위하여, 절단게놈 시퀀싱 기법(Digenome-seq) 분석을 통해 Cpf1 특이성에 대한 비편향성 전체 게놈 분석을 수행하였다. HEK-293T 세포로부터 분리된 Cell-free 게놈 DNA를 AsCpf1-crRNA 리보뉴클레오단백질(ribonucleoprotein) 복합체에 의한 시험 관내 절단에 제공하였다. 정량적 실시간 PCR 분석 결과, 게놈 DNA의 98% 이상이 AsCpf1-U-rich crRNA뿐만 아니라 AsCpf1-표준 crRNA 리보뉴클레오단백질 복합체에 의해 분해되었음을 확인하였다(도 5c 및 도 5d).
이어서, 절단된 생성물을 전체 게놈 시퀀싱에 적용하고, 서열 데이터를 인간 참조 게놈 데이터베이스에 대해 정렬시켰다(GRCh38.p11). 통합 게놈 뷰어(Integrative genomic viewer: IGV)를 통하여, 비표적 가닥의 18-20 위치 및 표적 가닥의 22 위치에서 전형적인 절단 패턴을 확인하였다. DNA 절단 스코어가 2.5 이상이고 불일치가 6 이하인 것으로 확인되는 오프-타겟 사이트를 찾기 위해 Digenome-seq 프로그램을 사용하여 컴퓨터 분석을 수행하였다. 확인된 사이트는 표 13(Con-crRNA) 및 표 14(U-rich- crRNA)에 나열되어 있으며, 오프-타겟 사이트는 전체 게놈 Circos plot에 나타내었다(도 5e).
Chromosome Location DNA Cleavage score Target sequence 서열목록
Chr19 43767815 15.8 TTTACTGATGGTCCAaacaTcTaA 350
Chr1 10179491 10.4 TTTACTGATGGTCCATccCTtTTA 351
Chr19 43263943 9.1 TTTACTGATGGTCCAaacaTcTaA 352
Chr1 177026436 8.4 TTTGCTGATGGTCgATtTaTacTg 353
Chr19 10244444 8.2 TTTCCTGATGGTCCATGTCTGTTA 354
Chr6 16517291 7.7 ATTCCTGATGaTCCATGcCTGcat 355
Chr19 43416520 6.9 TTTACTGATGGTCCAaacaTcTaA 356
Chr5 39969437 6.7 TCTCCTGATGGTCCATacCTGTTA 357
Chr2 233034313 6.2 TTTAgTGATaGTCCATGTCTGcag 358
Chr19 43353967 6 TTTACTGATGGTCCAaacaTcTgA 359
Chr6 141623485 5.7 TTTGCTGATGGTCtATagCTaTcA 360
Chr13 70187460 5.6 TTTCCTGATGGTCCAcactTGTTg 361
Chr21 44021964 5.6 TTTCCTGATGGTCtAcacCTGTTg 362
Chr5 163936302 5.6 TTTCCTGATGGTCtATtTtTccTt 363
Chr19 43377706 5.5 TTTACTGATGGTCCAaacaTcTaA 364
ChrX 81346070 5.4 TTTCCTGATGGTCCAcacCTaTTg 365
ChrX 115862098 5.1 TTTCaTGATGGTCCATacCTGTTA 366
Chr1 213377379 5.1 TTTCCTGATGGTCCATGTCTGaat 367
Chr4 151678397 4.7 TTTGCTGATGGTCtcTtTaacTTA 368
Chr1 89819958 4.5 TTTCCTGATGGcCCATacCTGTTA 369
Chr1 242619943 4.3 TTTGgTGATGGTCtATaTCaGagA 370
Chr2 89591302 4.2 TTTCCTGATGGTCCAcacCTtTTg 371
Chr13 81006434 4 TTTCCTGATGGTCCAcactTGTgg 372
ChrX 97546178 3.9 TTTCCTGATGGTCCAcGcCTGTTA 373
Chr22 27745385 3.8 TTTCCTGATGGTCCAcactTaTTA 374
Chr3 96050499 3.8 TTTCCTGATGGTCCATactTGTTg 375
Chr1 238343056 3.4 TTTCCTGATGGTCCAcacCTaTTg 376
Chr3 195961223 3.4 TTACCTGATGtTCCATGTCcagTg 377
Chr13 82088076 3.4 TTTCCcGATGGTCCAcaTCTGTTA 378
Chr17 53836590 3.2 TTTACTGATGGTCCATacCTcgTA 379
Chr1 146123498 3.2 TTTCCTGATGGTCCAcacCTGTTg 380
Chr2 4463241 3.2 TTTAgTGATGGTCCcTaTtTcTTc 381
Chr3 142979810 3.1 TCTCCTGATGGTCCAcGcCTGTTA 382
Chr4 125429316 3 TTTCCTGATGGTCCAcacCTaTTg 383
Chr7 68777908 3 TTTCCTGcTGGTCCATGTCTaaTA 384
Chr1 236623993 3 TTTACTGATGaTCCATGTCTaaac 385
ChrX 92676365 3 TTTCCTGATGGTCCATacCTGTTA 386
Chr11 26124230 2.9 TTTCCTGATGGTCCAcaTCTGTTA 387
Chr4 84421821 2.8 TTTCCTGATGGTCCAcacCTtTTg 388
Chr6 138526961 2.6 TTTCCTGATGGTCtgTtTtTGTag 389
Chr5 35891132 2.6 TTTCCTGATGGTCtAcacCTGTTg 390
Chromosome Location DNA Cleavage score Target sequence 서열번호
Chr19 43767815 11.3 TTTACTGATGGTCCAaacaTcTaA 391
Chr6 141623485 10.2 TTTGCTGATGGTCtATagCTaTcA 392
Chr6 138526960 8.7 TTTCCTGATGGTCtgTtTtTGTag 393
Chr19 10244444 7.8 TTTCCTGATGGTCCATGTCTGTTA 394
Chr19 43263943 7.7 TTTACTGATGGTCCAaacaTcTaA 395
Chr5 163936302 7.3 TTTCCTGATGGTCtATtTtTccTt 396
ChrX 92673750 7.3 TTTCCTGATGGTCCAcagaTacTA 397
Chr21 44021964 6.9 TTTCCTGATGGTCtAcacCTGTTg 398
Chr19 43435385 6.9 TTTACTGATGGTCCAaacaTcTaA 399
Chr1 10179491 6.7 TTTACTGATGGTCCATccCTtTTA 400
Chr19 43377706 6.6 TTTACTGATGGTCCAaacaTcTaA 401
Chr3 122020326 6.5 TTTACTGATGaTCtATaTtTacTA 402
Chr19 43416520 6.4 TTTACTGATGGTCCAaacaTcTaA 403
Chr1 177026436 6.3 TTTGCTGATGGTCgATtTaTacTg 404
Chr1 186592956 5.8 TTTCCTcATGGTCCATGTCaGgac 405
Chr16 75745894 5.7 TTTTCTGATGGTCCATacCTGTTA 406
Chr6 16517291 5.7 ATTCCTGATGaTCCATGcCTGcat 407
Chr19 43353967 5.6 TTTACTGATGGTCCAaacaTcTgA 408
ChrX 115862098 5.6 TTTCaTGATGGTCCATacCTGTTA 409
Chr1 236623991 4.9 TTTACTGATGaTCCATGTCTaaac 410
Chr13 70187460 4.9 TTTCCTGATGGTCCAcactTGTTg 411
Chr1 213377380 4.9 TTTCCTGATGGTCCATGTCTGaat 412
Chr1 238343056 4.7 TTTCCTGATGGTCCAcacCTaTTg 413
Chr5 35891131 4.5 TTTCCTGATGGTCtAcacCTGTTg 414
ChrX 97546178 4.2 TTTCCTGATGGTCCAcGcCTGTTA 415
Chr17 53836590 4.1 TTTACTGATGGTCCATacCTcgTA 416
ChrX 94580341 4.1 TTTCCTGATGGTCCAcactTGTTg 417
Chr2 89591301 4 TTTCCTGATGGTCCAcacCTtTTg 418
Chr12 58560889 3.8 TTTCCTGATGGTCtAcacCTGTTg 419
Chr13 81006434 3.8 TTTCCTGATGGTCCAcactTGTgg 420
Chr6 154888710 3.7 TTTACTaATGGTCCAaaTCctTcA 421
Chr4 151678397 3.6 TTTGCTGATGGTCtcTtTaacTTA 422
Chr7 112920853 3.4 TTTGCTGATGGTCtgTaTCTGTgA 423
Chr8 34932811 3.3 TCTACTGATGGTCCtTaTtTGTTg 424
Chr4 31284788 3.2 TTTCCTGATGaTCtATcTaTagTA 425
Chr3 135976149 3.1 TTTGCTGATGGTCCcctTCTcccA 426
ChrX 130910822 3.1 TCTCCTGATGaTCCAcaTCTGTTA 427
Chr3 96050498 3 TTTCCTGATGGTCCATactTGTTg 428
Chr7 68777909 2.9 TTTCCTGcTGGTCCATGTCTaaTA 429
Chr4 84421821 2.9 TTTCCTGATGGTCCAcacCTtTTg 430
ChrX 92676365 2.8 TTTCCTGATGGTCCATacCTGTTA 431
Chr5 178329 2.7 TTTCCTGATGGTCCAcacCTGcTg 432
Chr11 26124230 2.7 TTTCCTGATGGTCCAcaTCTGTTA 433
Chr6 147610255 2.7 TTTCCTGATGGTCCAcacCTGcTg 434
Chr1 89819958 2.6 TTTCCTGATGGcCCATacCTGTTA 435
Chr9 35488299 2.5 TTTCCTGATGGTCCAcacaTGTTA 436
표준 및 U-rich crRNA에 대한 오프-타겟 사이트의 수는 현저한 차이를 보이지 않았다. 표준 및 U-rich crRNA에 대해 각각 41 및 46 오프-타겟 사이트가 확인되었고, 이들 중 30개가 공통적으로 확인되었다 (도 5f).
crRNA가 없을 경우, 유의한 DNA 절단 스코어(> 2.5)를 갖는 어떠한 절단 부위도 생성되지 않았다는 점에서, crRNA 의존성 DNA 절단을 확인하였다. 또한, 전체 게놈 Circos plot의 전체 오프-타겟 패턴은 두 crRNA 모두 거의 동일하였다. 서열 로고 분석을 통하여, PAM 근접(PAM-proximal) 서열이 동일하게 보존되었고, 두 crRNA 모두 PAM-원위(PAM-distal) 서열에서 내성이 더 높다는 동일한 패턴을 확인하였다(도 5g).
이와 같은 결과를 통하여, AsCpf1의 높은 특이성이 U-rich 3'-오버행에 의해 손상되지 않았음을 확인하였다.
실시예 5. Cpf1의 다중 유전체 편집 및 PAM-변이에 대한 U-rich crRNA의 적용
본 발명자들은 U-rich crRNA가 최근 보고된 포유동물에서의 다중 유전체 편집에 적용할 수 있을 지 확인하기 위해, 23-nt의 표적 상보적 서열을 갖는 crRNA 서열을 eGFP 유전자의 3'-UTR 영역에 삽입시켰다. 비교예로, T-rich 서열을 20-염기의 표적과 인접한 crRNA의 구조(scaffold) 사이에 삽입하였다(도 6a).
상기 실시예 3의 대규모 검증 연구에 포함된 타겟 중 3가지를 조사한 결과, 이 3개의 타겟은 개별적으로 조사된 것과 비슷한 수준의 인델 효율을 나타냈고, U-rich 서열을 삽입함으로써 개별적인 실험 결과에 나타난 것과 유사한 수준으로 인델 효율이 향상된 것을 알 수 있었다.
S542R/K607R(RR 변이) 및 S542R/K548V/N552R(RVR 변이) 돌연변이를 지닌 2 개의 AsCpf1 PAM 변이체를 만들었던 그룹에서 추가적인 연구 결과를 발표했다(Gao, L. et al. Engineered Cpf1 variants with altered PAM specificities. Nat. Biotechnol. 35, 789-792 (2017)). 상기 두 가지 변이체는 각각 PAM 서열 TYCV 및 TATV에 의존하기 때문에, 본질적으로 Cpf1의 표적 범위가 제한적이라는 장벽을 현저하게 낮춘다. 본 발명자들은 U-rich crRNA가 야생형 AsCpf1에서 볼 수 있는 두 가지 AsCpf1 변이형에 대해서도 인델 효율을 향상시킬 수 있는지 여부를 확인하였다.
먼저, WT AsCpf1및 RR 변이에 대한 공통적인 타겟으로서 세 가지 부위를 선택하였는데, 이 타겟은 한 가닥에 TTTA PAM 서열을 갖고 다른 가닥에 TYCC(two TTCC and one TCCC) 서열을 갖는다(도 6b). 실험 결과, 타겟에 따라 효율 상승 정도에 차이가 있었지만 세 가지 모두에서 U-rich crRNA가 AsCpf1의 인델 효율을 증진시킨다는 것을 알 수 있었다. 타겟 1 및 타겟 2에서, RR 변이체는 표준 crRNA에 의해 가이드될 때 WT AsCpf1보다 더 높은 인델 효율을 나타냈고, U-rich crRNA에 의해 가이드될 때는 효율 증진이 조금 떨어졌다. 그러나 표적 3에서는 U-rich crRNA가 RR 변이체보다 현저히 인델 효율을 향상시켰다.
다음으로, RVR AsCpf1 변이체를 WT AsCpf1와 비교하였다. RVR 변이체는 TTTV PAM을 인식하는 특성을 가지고 있기 때문에 WT 및 RVR 변이체가 TTTA PAM을 갖는 단일 타겟을 공유한다(도 6c). 예상한 바와 같이, U-rich crRNA는 WT와 RVR 변이체에서 모두 인델 효율을 향상시켰다. 이 경우 타겟들마다 효율 향상 백분율을 다르지만, U-rich crRNA가 인델 효율을 증진시키는 것은 타겟 및 AsCpf1 형태와 상관 없이 공통적으로 관찰되었다.
이로부터 U-rich crRNA는 복수의 표적에 대한 유전체 편집 및 포유류 세포에서 Cpf1 변이체를 사용하는 데 다양하게 이용될 수 있고, 따라서 CRISPR/Cpf1 시스템을 보다 폭넓게 적용할 수 있는 새로운 유전체 편집 도구로 만들 수 있다는 것을 알 수 있었다.
실시예 6. AsCpf1-U-rich crRNA 복합체의 향상된 결합 친화도 확인
만약 crRNA의 안정성이 주로 Cpf1의 활성을 증가시킨다면, PCR 증폭물의 형질주입에 따른 crRNA의 내인성 수준(endogenous level)이나 패턴에 차이가 있을 것이다. 증가된 Cpf1 활성이 향상된 crRNA의 안정성 때문인지 또는 Cpf1의 직접적인 조절로 인한 것인지를 확인하기 위하여 노던 블롯 분석을 수행하여(도 7a) crRNA 수준을 추적하였다.
그 결과, U-rich 3'-오버행에 의한 내인성 crRNA 수준의 유의한 증가는 관찰되지 않았다.
또한, 3'-오버행에 따른 crRNA의 차별적인 분해 및 리보핵산가수분해효소(ribonuclease)의 관련을 배제하기 위하여, Cas9 및 Cpf1 모두에 대해, 3'-말단의 4개 뉴클레오타이드가 포스포로티오에이트(phosphorothioate) 그룹과 공유 결합되도록 화학적으로 변형된 가이드 RNA를 사용하였다. 이와 같은 처리를 통하여, 리보핵산외부가수분해효소(riboexonuclease)에 의한 가이드 RNA의 분해를 방지함으로써, 핵산분해효소 내성(nuclease tolerance) 문제를 배제할 수 있으므로, U-rich 3'-오버행의 효과를 조사할 수 있다.
그 결과, 화학적으로 변형된 U-rich crRNA는 화학적으로 변형된 표준 crRNA와 비교하여 훨씬 더 높은 Cpf1 활성을 나타냄을 확인하였다. 반면, Cas9에 대한 화학적으로 변형된 가이드 RNA에 대해서는 유의적인 차이가 없었다(도 7b). 324 ddition에서, Karvelis et al.은 전체 SpCas9 활성에 대한 tracrRNA의 최소 길이는 약 63nt이고 더 짧은 길이(예 : 58nt)는 완화된 활성을 나타낸다고 보고했다. 폴리-유리딘이 세포에서 가이드 RNA의 안정성에 영향을 주면, 짧은 tracrRNA에서 U가 풍부한 3'-오버행은 SpCas9 활성을 향상시킬 것이다. 그러나, 짧은 tracrRNA에서의 U4AU4의 존재는 증가된 Cas9 활성을 유도하지 않았다. 오히려, 폴리-유리딘은 63-nt tracrRNA에 대한 SpCas9 활성을 하향 조정하였다(도 7c). 이와 같은 결과를 통하여, U-rich 3'-오버행에 의한 향상된 활성의 주된 이유는 안정성 효과에 의한 것이 아님을 확인하였다.
또한, 두 가지 독립적인 방법론적 접근법을 적용함으로써, U-rich 3'-오버행이 cpf1 분자에 대한 crRNA의 유리한 결합에 기여하는지 여부를 분석하였다.
먼저, 이펙터 단백질(SpCas9 및 AsCpf1)과 그들의 가이드 RNA의 결합 특성을 평가하기 위해 MST 기술을 적용하였다. MST는 "열이동(thermophoresis)"이라고 불리는 효과인 온도 구배(temperature gradient)에 따른 분자의 방향성 이동에 기반한다. 단백질의 열이동 거동은 크기, 전하 및 용매화 에너지에서 결합-유도된 변화에 기인하는 단백질-리간드 복합체의 열이동과는 전형적으로 다르다. 결합 이펙터 단백질에 대해 적정된 리간드(Cy5 표지된 가이드 RNA)의 표준화된 형광(Fnorm)의 변화를 측정함으로써, 적정 농도에 대한 Fnorm의 플로팅에 의하여 해리상수 Kd를 유도할 수 있다. 하기에 나타낸 바와 같이, U-rich 3'-오버행은 표준 crRNA와 비교하여 AsCpf1에 대한 결합 친화력이 상당히 증가되었다. 그러나, U-rich 3'-오버행은 sgRNA-SpCas9 복합체에 대한 결합 특성에서는 검출 가능한 차이를 유도하지 않았다(도 7d).
보다 정량적인 결과를 얻기 위해, ITC 분석을 수행하였고(도 7e), AsCpf1의 존재하에 crRNA를 적정하였다. 그 결과, U-rich crRNA에 의해 더 급격한 열 변화가 관찰되었으며, 결합 상수가 16.2배 증가하였음을 확인하였다[Ka=(1.90±0.87)×108 M-1 for the U-rich crRNA versus (1.15±0.54)×107 M-1 for the canonical crRNA]. ΔH는 U-rich 및 표준 crRNA에 대해 각각 -31.92 ± 1.79 및 -22.86 ± 1.86 kcal mol-1이고, ΔS는 U-rich 및 표준 crRNA에 대해 각각 -69.2 및 -44.4 cal-1mol-1deg-1임을 확인하였다.
이와 같은 결과를 통하여 U-rich 3'-오버행이 보다 안정한 crRNA-AsCpf1 복합체의 형성에 기여함을 확인하였으며, U-rich 3'-오버행이 crRNA와 Cpf1 사이의 보다 유리한 결합을 유도함으로써 Cpf1 활성을 향상시킴을 확인하였다.
이제까지 본 발명에 대하여 그 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
SEQUENCE LISTING <110> Korea Research Institute of Bioscience and Biotechnology <120> Composition for genome editing using CRISPR/Cpf1 and use thereof <130> PN180267-P1 <150> 10-2017-0155927 <151> 2017-11-21 <160> 436 <170> PatentIn version 3.2 <210> 1 <211> 27 <212> DNA <213> Acidaminococcus sp. <400> 1 tttcctgatg gtccatgtct gttactc 27 <210> 2 <211> 28 <212> DNA <213> Acidaminococcus sp. <400> 2 tttgctacac actgggcatc ggtggggg 28 <210> 3 <211> 27 <212> DNA <213> Acidaminococcus sp. <400> 3 tttctccgct ctgagcaagg cccacag 27 <210> 4 <211> 27 <212> DNA <213> Acidaminococcus sp. <400> 4 tttcgacata gtgtggtggt gccctat 27 <210> 5 <211> 27 <212> DNA <213> Acidaminococcus sp. <400> 5 tttgtgacag acagttcctg gagtgca 27 <210> 6 <211> 27 <212> DNA <213> Acidaminococcus sp. <400> 6 tttaagagca gcgattgtaa ggagagg 27 <210> 7 <211> 27 <212> DNA <213> Acidaminococcus sp. <400> 7 tttaaagaaa gctacaggaa agcaggg 27 <210> 8 <211> 27 <212> DNA <213> Acidaminococcus sp. <400> 8 tttagagaga ccgctcaggc tggaggg 27 <210> 9 <211> 27 <212> DNA <213> Acidaminococcus sp. <400> 9 tttagggaga cagggagaag tgagagg 27 <210> 10 <211> 27 <212> DNA <213> Acidaminococcus sp. <400> 10 tttacccctg cattgccatg agccccc 27 <210> 11 <211> 27 <212> DNA <213> Acidaminococcus sp. <400> 11 ttccgggggc tcatggcaat gcagggg 27 <210> 12 <211> 27 <212> DNA <213> Acidaminococcus sp. <400> 12 tttacccgag tcctggggac agtcccc 27 <210> 13 <211> 27 <212> DNA <213> Acidaminococcus sp. <400> 13 tcccggggac tgtccccagg actcggg 27 <210> 14 <211> 27 <212> DNA <213> Acidaminococcus sp. <400> 14 ttccccgcag tgacactcgc catggcc 27 <210> 15 <211> 27 <212> DNA <213> Acidaminococcus sp. <400> 15 tttaggccat ggcgagtgtc actgcgg 27 <210> 16 <211> 27 <212> DNA <213> Acidaminococcus sp. <400> 16 tttagattca ttctcagtgc catgggg 27 <210> 17 <211> 27 <212> DNA <213> Acidaminococcus sp. <400> 17 tttaaggcaa ttgcaaccac tgaaggg 27 <210> 18 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 18 ctgggactca ggcgggtcac 20 <210> 19 <211> 25 <212> DNA <213> Acidaminococcus sp. <400> 19 cctcacacaa cagcttcatg tcagc 25 <210> 20 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 20 aagcaaatcc acctgcctcg 20 <210> 21 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 21 cctcccctag ccctttcagg 20 <210> 22 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 22 ctagccagtg ctgcctcttt 20 <210> 23 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 23 cgctcgctca ctctctttct 20 <210> 24 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 24 cagatagcga tggtgagcag 20 <210> 25 <211> 22 <212> DNA <213> Acidaminococcus sp. <400> 25 gggaggtcaa ataagcagca gg 22 <210> 26 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 26 actgaaggcc gtggacacct 20 <210> 27 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 27 cttgtcctgg aagaggaagc 20 <210> 28 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 28 acagggccat cttgtgacag 20 <210> 29 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 29 ccgctaaagt gcgaatcacg 20 <210> 30 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 30 gccagcccct gattcttcag 20 <210> 31 <211> 22 <212> DNA <213> Acidaminococcus sp. <400> 31 agtgaattat gttggcttgg ca 22 <210> 32 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 32 aagccgaaag cctacacctc 20 <210> 33 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 33 ggacattcga agcccgtgta 20 <210> 34 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 34 aagccgaaag cctacacctc 20 <210> 35 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 35 ggacattcga agcccgtgta 20 <210> 36 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 36 ctttcaacaa agcagccccc 20 <210> 37 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 37 tgctctggtc tcagcattcg 20 <210> 38 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 38 ctttcaacaa agcagccccc 20 <210> 39 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 39 tgctctggtc tcagcattcg 20 <210> 40 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 40 tgagattggg tctgttgggc 20 <210> 41 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 41 tgagattggg tctgttgggc 20 <210> 42 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 42 tgagattggg tctgttgggc 20 <210> 43 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 43 tgagattggg tctgttgggc 20 <210> 44 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 44 ttggtaagaa tgcggctccc 20 <210> 45 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 45 cataaccatc tggtgcccca 20 <210> 46 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 46 ttggtaagaa tgcggctccc 20 <210> 47 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 47 cataaccatc tggtgcccca 20 <210> 48 <211> 21 <212> DNA <213> Acidaminococcus sp. <400> 48 gtggccaggg tggaggataa g 21 <210> 49 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 49 ctctggctcc tttgatacct ccg 23 <210> 50 <211> 21 <212> DNA <213> Acidaminococcus sp. <400> 50 gtggccaggg tggaggataa g 21 <210> 51 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 51 ctctggctcc tttgatacct ccg 23 <210> 52 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 52 tacactggcc agaggctggg acg 23 <210> 53 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 53 cgtcccagcc tctggccagt gta 23 <210> 54 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 54 gatgatccca aggtgcagca ccc 23 <210> 55 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 55 gggtgctgca ccttgggatc atc 23 <210> 56 <211> 30 <212> DNA <213> Acidaminococcus sp. <400> 56 gtggagaaga acagaggcgc catcctgttt 30 <210> 57 <211> 30 <212> DNA <213> Acidaminococcus sp. <400> 57 tctgttcttc tccacattca cgtcccagcc 30 <210> 58 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 58 ctgatggtcc atgtctgtta ctc 23 <210> 59 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 59 tttctttcct gtttgtcttg tgtc 24 <210> 60 <211> 25 <212> DNA <213> Acidaminococcus sp. <400> 60 tttgttttct gtttgtcttg tagtc 25 <210> 61 <211> 21 <212> DNA <213> Acidaminococcus sp. <400> 61 tttgtttcct gtttgtcttg t 21 <210> 62 <211> 22 <212> DNA <213> Acidaminococcus sp. <400> 62 tttctttcct gtttcttttg tc 22 <210> 63 <211> 26 <212> DNA <213> Acidaminococcus sp. <400> 63 tttctttcct gtttgtcttg catctc 26 <210> 64 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 64 tttgtttcct gtttgttttg tgtt 24 <210> 65 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 65 tttatttctt gtttgtcttg gta 23 <210> 66 <211> 25 <212> DNA <213> Acidaminococcus sp. <400> 66 tttgttttct ggttgtcttg ttgtc 25 <210> 67 <211> 22 <212> DNA <213> Acidaminococcus sp. <400> 67 tttgttttgt ttgtcttgtt tt 22 <210> 68 <211> 22 <212> DNA <213> Acidaminococcus sp. <400> 68 tttgtttcct gtttctcttt tc 22 <210> 69 <211> 42 <212> DNA <213> Acidaminococcus sp. <400> 69 aatttctact cttgtagatc tgatggtcca tgtctgttac tc 42 <210> 70 <211> 50 <212> DNA <213> Acidaminococcus sp. <400> 70 aatttctact cttgtagatc tgatggtcca tgtctgttat tttatttttt 50 <210> 71 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 71 cctggtggct gagaccaggg agg 23 <210> 72 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 72 atttcacagg actttgttaa agg 23 <210> 73 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 73 attttgaagt gaccgtacga ggg 23 <210> 74 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 74 ataatacact ctttacactg agg 23 <210> 75 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 75 aacaaatcac tgactaacca agg 23 <210> 76 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 76 gtgtggataa gaatcacctg agg 23 <210> 77 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 77 ggggtagagg tactctacag ggg 23 <210> 78 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 78 ggggtagagg tagtctacag ggg 23 <210> 79 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 79 gcattaaggc cagcgctggg cgg 23 <210> 80 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 80 cacataggcc attcagaaac ggg 23 <210> 81 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 81 attttagcaa taaccttaca ggg 23 <210> 82 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 82 cgtgttcaaa aaccaaggcg ggg 23 <210> 83 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 83 acaagttcag aatcacctta ggg 23 <210> 84 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 84 aaataaccgt cggtttctta agg 23 <210> 85 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 85 gatccgatgc aattttggga agg 23 <210> 86 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 86 ggaaagcgca gaaaagtaaa agg 23 <210> 87 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 87 aagagttatt gtcaatagaa agg 23 <210> 88 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 88 caaagaaatg tactgcctta cgg 23 <210> 89 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 89 cctctgactt gacttcaaac agg 23 <210> 90 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 90 gtgggtaggt ccagtttggg ggg 23 <210> 91 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 91 acaaagaaac cagcagtggc agg 23 <210> 92 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 92 cctgaactcg ggactcgacc agg 23 <210> 93 <211> 22 <212> DNA <213> Acidaminococcus sp. <400> 93 ccaaccaggt accctgtgcc ag 22 <210> 94 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 94 actggttatt tcttgccaga ggg 23 <210> 95 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 95 gaacccagtg aaaaatacca ggg 23 <210> 96 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 96 ccctggctac ctcccctacc cgg 23 <210> 97 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 97 gaggtagctt gccatctctc agg 23 <210> 98 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 98 ctattcactt gtgttacagg agg 23 <210> 99 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 99 gtaggctgct gttggacaga cgg 23 <210> 100 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 100 ggcaagggtc ttgatgcatc agg 23 <210> 101 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 101 ccgaaaaaat gactttttag ggg 23 <210> 102 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 102 actcaagttg ttcattctgc ggg 23 <210> 103 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 103 gccatggtga aggtgaaatc agg 23 <210> 104 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 104 ctgaattaca acaaattgca agg 23 <210> 105 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 105 aagaaggaat ggtagttgag ggg 23 <210> 106 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 106 agcccaagat tttttatttg agg 23 <210> 107 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 107 atataggatt tagaaaccaa ggg 23 <210> 108 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 108 acatttttag ctggccactg cgg 23 <210> 109 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 109 gaataccccc attcttcagg ggg 23 <210> 110 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 110 agagcagcga ttgtaaggag agg 23 <210> 111 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 111 aaaagatccc catggccaca ggg 23 <210> 112 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 112 aacgaatatt ctcagaccac agg 23 <210> 113 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 113 gggaggagaa caggaaataa ggg 23 <210> 114 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 114 attgaaacat atacgtggta agg 23 <210> 115 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 115 gtctaataga aatatagtac agg 23 <210> 116 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 116 gctctaatgt aagtatatcc agg 23 <210> 117 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 117 caacagcctc accaggaaca agg 23 <210> 118 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 118 aaaagatccc catggccaca ggg 23 <210> 119 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 119 gggttgccag attaaaagac agg 23 <210> 120 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 120 gagggagaca caagttgata ggg 23 <210> 121 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 121 actcatacat cacctcctcc agg 23 <210> 122 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 122 ccttaataaa gtataacttc agg 23 <210> 123 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 123 gaaactgccc caaaaccggc cgg 23 <210> 124 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 124 aggactatgt gtggccagtg agg 23 <210> 125 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 125 attttcaaaa cagccctatg ggg 23 <210> 126 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 126 cacaagggat ctgagacttg agg 23 <210> 127 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 127 actcaaggac tggctcagtg agg 23 <210> 128 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 128 cagagtcccg ggaacaagcc agg 23 <210> 129 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 129 tttacagctc tgagaactaa acg 23 <210> 130 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 130 agacaagctg tcttccttca ggg 23 <210> 131 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 131 atctgaagat cattgaaaca ggg 23 <210> 132 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 132 aaggaaaggc ttcctggagg agg 23 <210> 133 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 133 gtctcagtct tccttgtggg agg 23 <210> 134 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 134 agataagcga tagtacatga ggg 23 <210> 135 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 135 gcagtacacc tgagggaaca ggg 23 <210> 136 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 136 aagaaagcta caggaaagca ggg 23 <210> 137 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 137 atttccaagt caaccttatg agg 23 <210> 138 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 138 caaagtacct gttacttaac agg 23 <210> 139 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 139 aataagtctt accacgtgtc agg 23 <210> 140 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 140 attcccacaa taaccctatg agg 23 <210> 141 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 141 ataatgcctt ttaggtgata agg 23 <210> 142 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 142 gagaatagaa ataagaaaaa agg 23 <210> 143 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 143 caaacaaaat aattggctca ggg 23 <210> 144 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 144 caatcatagc agaaggtgaa ggg 23 <210> 145 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 145 ctttaaaatg aggtactagg ggg 23 <210> 146 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 146 agggaatgaa agtgaagatg ggg 23 <210> 147 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 147 gagagaccgc tcaggctgga ggg 23 <210> 148 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 148 gatcaattta catcaaacta ggg 23 <210> 149 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 149 atccccacaa atactctacg agg 23 <210> 150 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 150 gattcattct cagtgccatg ggg 23 <210> 151 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 151 aggcaattgc aaccactgaa ggg 23 <210> 152 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 152 gaaatatgac tggaagtaaa ggg 23 <210> 153 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 153 cttccagtca tatttctaaa ggg 23 <210> 154 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 154 cccttattac aatcctgtgg ggg 23 <210> 155 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 155 cccccacagg attgtaataa ggg 23 <210> 156 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 156 atctccataa caatctttgg ggg 23 <210> 157 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 157 ctatccccat tttacagatg agg 23 <210> 158 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 158 ctgagatttg cgaagagtta ggg 23 <210> 159 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 159 attaaataga gtcttttgaa ggg 23 <210> 160 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 160 atattaattg caagtttggg ggg 23 <210> 161 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 161 ggccaagtgc gaagtcagag ggg 23 <210> 162 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 162 ggggtgaaca cccaagatcc cgg 23 <210> 163 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 163 gggtgggctc ctggcagggc agg 23 <210> 164 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 164 aaaaggggaa agagagaaag agg 23 <210> 165 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 165 agaagcatgc aaaaccggca agg 23 <210> 166 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 166 aagaggggag gttgactttg ggg 23 <210> 167 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 167 gtcaaataaa gaaatacacg ggg 23 <210> 168 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 168 gtcaaataaa gaaaaatacg ggg 23 <210> 169 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 169 atgcatctca gtggttaaca ggg 23 <210> 170 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 170 acctcaggcc tgatcatcag ggg 23 <210> 171 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 171 catacagggc tctgtaccca ggg 23 <210> 172 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 172 caaagacact caccctgttg ggg 23 <210> 173 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 173 agaacacata cccctgggcc ggg 23 <210> 174 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 174 ataataaaag tatttcctca ggg 23 <210> 175 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 175 agccgtggtc agtgagaggc agg 23 <210> 176 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 176 gagctcatta gcttggggag ggg 23 <210> 177 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 177 ggaaaagtca tctgctacta ggg 23 <210> 178 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 178 gaaaataact aaacttccca ggg 23 <210> 179 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 179 aattctttaa gtaatttaag agg 23 <210> 180 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 180 attgtattgt cataaatttg ggg 23 <210> 181 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 181 cttagtagtc tcagaaccaa ggg 23 <210> 182 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 182 aaaggagcac aagtacaaac agg 23 <210> 183 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 183 aatgatgcag taatcgtgta ggg 23 <210> 184 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 184 acttgacata gtaagaaaca ggg 23 <210> 185 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 185 ataaaaggaa ctatttacaa ggg 23 <210> 186 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 186 gtgctcccat acctgtgctt 20 <210> 187 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 187 ctcacccaac ctcctgctct 20 <210> 188 <211> 21 <212> DNA <213> Acidaminococcus sp. <400> 188 ggcaggctgg gaacagatta t 21 <210> 189 <211> 21 <212> DNA <213> Acidaminococcus sp. <400> 189 ggcaggctgg gaacagatta t 21 <210> 190 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 190 tgctgtgtac ccccatttga 20 <210> 191 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 191 cttcacccaa cttgcactgg 20 <210> 192 <211> 21 <212> DNA <213> Acidaminococcus sp. <400> 192 gtcagctacc tttcccatgt t 21 <210> 193 <211> 22 <212> DNA <213> Acidaminococcus sp. <400> 193 tgaagtgttt acgtcctccc at 22 <210> 194 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 194 aaaagatgct ggaccttggc 20 <210> 195 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 195 caggatgagc agcactttgg 20 <210> 196 <211> 19 <212> DNA <213> Acidaminococcus sp. <400> 196 cggggctcct ccaaacctg 19 <210> 197 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 197 ctccatggag gcagagaggc 20 <210> 198 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 198 ctgtaacgct taggctgcca 20 <210> 199 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 199 ctggcctgtg aaaggtacac 20 <210> 200 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 200 tcaagatgca gaaagtgggc 20 <210> 201 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 201 cctagagcct ggtgagactt 20 <210> 202 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 202 acaggtcatc caagagcgag 20 <210> 203 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 203 aggagaccca agagccatga 20 <210> 204 <211> 21 <212> DNA <213> Acidaminococcus sp. <400> 204 caaggctggg cagagtaact t 21 <210> 205 <211> 22 <212> DNA <213> Acidaminococcus sp. <400> 205 tccctggatt tacagtgggg tg 22 <210> 206 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 206 gtcgtgatat gagaggcccg 20 <210> 207 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 207 tcacctggcc cttggatttc 20 <210> 208 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 208 cactgtcgga gctcacatcg 20 <210> 209 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 209 gcctccttcc agggttgatg 20 <210> 210 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 210 gcagaagctg gacttgcctc 20 <210> 211 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 211 aacccccgag ataggaaggg 20 <210> 212 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 212 ccgcacctgt ctgtttttgg 20 <210> 213 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 213 gctagagtgc aatgtcgcga 20 <210> 214 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 214 caacagtagg cggagagtgg 20 <210> 215 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 215 gaggccagtt caagaccagc 20 <210> 216 <211> 19 <212> DNA <213> Acidaminococcus sp. <400> 216 gcccttcaag ctgtcaggt 19 <210> 217 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 217 tctcgccacc tggaacaaag 20 <210> 218 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 218 gggctctaat ggctgtgtgt 20 <210> 219 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 219 cttttccctc gacctccacc 20 <210> 220 <211> 21 <212> DNA <213> Acidaminococcus sp. <400> 220 gggaactgcc tccttgcaga a 21 <210> 221 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 221 tggcaaagtt acatgtccgc 20 <210> 222 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 222 cgcttttcct aacaggctac tcc 23 <210> 223 <211> 21 <212> DNA <213> Acidaminococcus sp. <400> 223 gcattatgca ccagtttggg g 21 <210> 224 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 224 acgccctaat gaaattctag ccc 23 <210> 225 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 225 gctgtgccgg acgatcaaaa 20 <210> 226 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 226 cctctctgct atgttgctgt tcc 23 <210> 227 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 227 gccacctgga cttgataggg 20 <210> 228 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 228 agcacactgg acattagaaa cagg 24 <210> 229 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 229 gattacaggc gtgcgctacc 20 <210> 230 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 230 ccaattcctg cgtcttccat gcc 23 <210> 231 <211> 22 <212> DNA <213> Acidaminococcus sp. <400> 231 caacatagca gaggcactgt ag 22 <210> 232 <211> 22 <212> DNA <213> Acidaminococcus sp. <400> 232 gaacccttat ggtgggctgt gg 22 <210> 233 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 233 gggatgtcag tgctgttgtg cag 23 <210> 234 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 234 gtctttttcc agcctgagcc agg 23 <210> 235 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 235 gtctgccaag ctaaggctct cac 23 <210> 236 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 236 gcttccccag tcttgccagt tgt 23 <210> 237 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 237 ccactgtacc cttccttgtc cga 23 <210> 238 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 238 tgtcagtagg cccccaacta 20 <210> 239 <211> 21 <212> DNA <213> Acidaminococcus sp. <400> 239 gcctaactgg caaatgcctt a 21 <210> 240 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 240 tgaacatggc acctctcctg 20 <210> 241 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 241 tgttgcgcct tcaatactgt 20 <210> 242 <211> 21 <212> DNA <213> Acidaminococcus sp. <400> 242 gtttgcatgg ccactagaag g 21 <210> 243 <211> 21 <212> DNA <213> Acidaminococcus sp. <400> 243 ctctcacaaa ggcaatggca c 21 <210> 244 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 244 acagggccat cttgtgacag 20 <210> 245 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 245 ccgctaaagt gcgaatcacg 20 <210> 246 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 246 gacggagcag acccatctgc 20 <210> 247 <211> 21 <212> DNA <213> Acidaminococcus sp. <400> 247 gagcctaatg gcccttggca c 21 <210> 248 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 248 gcccccgtat taccactctg 20 <210> 249 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 249 ccagtgacat ggccaagatg 20 <210> 250 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 250 accccttcca ataccatttg aga 23 <210> 251 <211> 22 <212> DNA <213> Acidaminococcus sp. <400> 251 tgcataactc gacagataca ca 22 <210> 252 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 252 gcccccgtat taccactctg 20 <210> 253 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 253 ccagtgacat ggccaagatg 20 <210> 254 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 254 tgtcagtagg cccccaacta 20 <210> 255 <211> 21 <212> DNA <213> Acidaminococcus sp. <400> 255 gcctaactgg caaatgcctt a 21 <210> 256 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 256 gtccgagaga caagccaggg 20 <210> 257 <211> 21 <212> DNA <213> Acidaminococcus sp. <400> 257 gatcctgctc tctctgcctc c 21 <210> 258 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 258 gacggagcag acccatctgc 20 <210> 259 <211> 21 <212> DNA <213> Acidaminococcus sp. <400> 259 gagcctaatg gcccttggca c 21 <210> 260 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 260 cagtcaagtc cagcagttgt ccc 23 <210> 261 <211> 21 <212> DNA <213> Acidaminococcus sp. <400> 261 gagtagggtg gccagaggca g 21 <210> 262 <211> 21 <212> DNA <213> Acidaminococcus sp. <400> 262 cccactccac tttgttccca g 21 <210> 263 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 263 tcctgggccc aatcattctg 20 <210> 264 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 264 agggtttgag gggttcagtc 20 <210> 265 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 265 acttgactcc caactcaggc 20 <210> 266 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 266 taggtgggca agaacagagg 20 <210> 267 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 267 ttcagcacag agagggacag 20 <210> 268 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 268 ctcccaggtt cactccatcc 20 <210> 269 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 269 ggccacgtat tctaaccagc 20 <210> 270 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 270 ttggagaagc atcacctgcc 20 <210> 271 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 271 cgggctgtgt cctaacgaat 20 <210> 272 <211> 21 <212> DNA <213> Acidaminococcus sp. <400> 272 acattcccag tgttccgtga g 21 <210> 273 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 273 catccagtcc gtcgctaagt 20 <210> 274 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 274 caccccaaca acttctgggg 20 <210> 275 <211> 22 <212> DNA <213> Acidaminococcus sp. <400> 275 agcatggtgc agaatagtgt gt 22 <210> 276 <211> 21 <212> DNA <213> Acidaminococcus sp. <400> 276 ggattacctg ggagggagtc a 21 <210> 277 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 277 ggttgatgtc caccccttca 20 <210> 278 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 278 agggtttgag gggttcagtc 20 <210> 279 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 279 acttgactcc caactcaggc 20 <210> 280 <211> 21 <212> DNA <213> Acidaminococcus sp. <400> 280 cccactccac tttgttccca g 21 <210> 281 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 281 tcctgggccc aatcattctg 20 <210> 282 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 282 agttaatggg tgcagcacac 20 <210> 283 <211> 22 <212> DNA <213> Acidaminococcus sp. <400> 283 tcccagcaag tattcagcaa ca 22 <210> 284 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 284 gccagcccct gattcttcag 20 <210> 285 <211> 22 <212> DNA <213> Acidaminococcus sp. <400> 285 agtgaattat gttggcttgg ca 22 <210> 286 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 286 agatgacgag agcacagcct 20 <210> 287 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 287 gggccactaa gttgcaggtc 20 <210> 288 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 288 gcagtggctc acacctgtag ttc 23 <210> 289 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 289 cagatctcca gaattctcct gctg 24 <210> 290 <211> 21 <212> DNA <213> Acidaminococcus sp. <400> 290 taagaagcct atggggagca g 21 <210> 291 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 291 ggcaaggtcc ctgaacagac atg 23 <210> 292 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 292 cctcccagcc atgcttcctg tta 23 <210> 293 <211> 22 <212> DNA <213> Acidaminococcus sp. <400> 293 agtttggatg cttgctccct cc 22 <210> 294 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 294 agttaatggg tgcagcacac 20 <210> 295 <211> 22 <212> DNA <213> Acidaminococcus sp. <400> 295 tcccagcaag tattcagcaa ca 22 <210> 296 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 296 tggaggttcc aagggaccag 20 <210> 297 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 297 aagactccag gaggccatgg 20 <210> 298 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 298 aagccgaaag cctacacctc 20 <210> 299 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 299 ggacattcga agcccgtgta 20 <210> 300 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 300 tggaggttcc aagggaccag 20 <210> 301 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 301 aagactccag gaggccatgg 20 <210> 302 <211> 22 <212> DNA <213> Acidaminococcus sp. <400> 302 cagcgtccca tgcacatttg gg 22 <210> 303 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 303 gagaggacag cacgggcagg 20 <210> 304 <211> 21 <212> DNA <213> Acidaminococcus sp. <400> 304 gtggccaggg tggaggataa g 21 <210> 305 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 305 ctctggctcc tttgatacct ccg 23 <210> 306 <211> 22 <212> DNA <213> Acidaminococcus sp. <400> 306 ccatgaccca cagaaactag aa 22 <210> 307 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 307 tcaccaccat ctcacctttg 20 <210> 308 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 308 ggaggcattt acagtgcagg 20 <210> 309 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 309 aatgcaggtg aggccattgt 20 <210> 310 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 310 ggggacacat tcagacccta 20 <210> 311 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 311 ctcagtgtga acgcgattgg 20 <210> 312 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 312 gctccctgtt ttgctccttc 20 <210> 313 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 313 ccaactccaa gccaagcatt 20 <210> 314 <211> 22 <212> DNA <213> Acidaminococcus sp. <400> 314 gctgtgagga gaaaagagag ca 22 <210> 315 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 315 gtggtgaaag gccatgaggg 20 <210> 316 <211> 19 <212> DNA <213> Acidaminococcus sp. <400> 316 aggggacccc ctgtagaac 19 <210> 317 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 317 gggcctcaag tttgttttgc 20 <210> 318 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 318 atggcttttt caggattcca aact 24 <210> 319 <211> 21 <212> DNA <213> Acidaminococcus sp. <400> 319 gcagccccta cagaaatgag t 21 <210> 320 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 320 gcaggctggt aactgtgact 20 <210> 321 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 321 acctgctgca gaactgaagc 20 <210> 322 <211> 21 <212> DNA <213> Acidaminococcus sp. <400> 322 ccaatggtga tgagacagcg t 21 <210> 323 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 323 gtggagggtg tcctggttct 20 <210> 324 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 324 ctgccctcca gttgtgactt 20 <210> 325 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 325 tgccacaagg aatcgatgtt 20 <210> 326 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 326 tgtctaaggc cacgaccaca agc 23 <210> 327 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 327 ccttcttggc acttctcggt ggt 23 <210> 328 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 328 ggcccagaac cttgctcttt gag 23 <210> 329 <211> 22 <212> DNA <213> Acidaminococcus sp. <400> 329 aaggagctgt gctgtgcagg ta 22 <210> 330 <211> 22 <212> DNA <213> Acidaminococcus sp. <400> 330 ctgcaccacc acacctggct aa 22 <210> 331 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 331 agaacagagc agtgggcaac agg 23 <210> 332 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 332 agaggggcac tcgggaagag ata 23 <210> 333 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 333 ggaggacttc ttccctgttg gtc 23 <210> 334 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 334 aaacagggaa gcgtggaaga 20 <210> 335 <211> 21 <212> DNA <213> Acidaminococcus sp. <400> 335 tgatgcttca cctcagtgtc t 21 <210> 336 <211> 21 <212> DNA <213> Acidaminococcus sp. <400> 336 atgattgggt tctgctgagg g 21 <210> 337 <211> 21 <212> DNA <213> Acidaminococcus sp. <400> 337 agaccaccta aaacattggc t 21 <210> 338 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 338 ggcctgaccc tccagatctt 20 <210> 339 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 339 gcactatgcg atctcctggc 20 <210> 340 <211> 21 <212> DNA <213> Acidaminococcus sp. <400> 340 taaacaggga agcgtggaag a 21 <210> 341 <211> 21 <212> DNA <213> Acidaminococcus sp. <400> 341 tgatgcttca cctcagtgtc t 21 <210> 342 <211> 21 <212> DNA <213> Acidaminococcus sp. <400> 342 atgattgggt tctgctgagg g 21 <210> 343 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 343 gaccacctaa aacattggct 20 <210> 344 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 344 ggcctgaccc tccagatctt 20 <210> 345 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 345 gcactatgcg atctcctggc 20 <210> 346 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 346 acaaatcccc tcatcccaac 20 <210> 347 <211> 20 <212> DNA <213> Acidaminococcus sp. <400> 347 aagctcactc acccaccact 20 <210> 348 <211> 23 <212> DNA <213> Acidaminococcus sp. <400> 348 gcaacaatcg ccattcctca ccc 23 <210> 349 <211> 21 <212> DNA <213> Acidaminococcus sp. <400> 349 tggccctctt atagctctag g 21 <210> 350 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 350 tttactgatg gtccaaacat ctaa 24 <210> 351 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 351 tttactgatg gtccatccct ttta 24 <210> 352 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 352 tttactgatg gtccaaacat ctaa 24 <210> 353 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 353 tttgctgatg gtcgatttat actg 24 <210> 354 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 354 tttcctgatg gtccatgtct gtta 24 <210> 355 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 355 attcctgatg atccatgcct gcat 24 <210> 356 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 356 tttactgatg gtccaaacat ctaa 24 <210> 357 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 357 tctcctgatg gtccatacct gtta 24 <210> 358 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 358 tttagtgata gtccatgtct gcag 24 <210> 359 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 359 tttactgatg gtccaaacat ctga 24 <210> 360 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 360 tttgctgatg gtctatagct atca 24 <210> 361 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 361 tttcctgatg gtccacactt gttg 24 <210> 362 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 362 tttcctgatg gtctacacct gttg 24 <210> 363 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 363 tttcctgatg gtctattttt cctt 24 <210> 364 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 364 tttactgatg gtccaaacat ctaa 24 <210> 365 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 365 tttcctgatg gtccacacct attg 24 <210> 366 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 366 tttcatgatg gtccatacct gtta 24 <210> 367 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 367 tttcctgatg gtccatgtct gaat 24 <210> 368 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 368 tttgctgatg gtctctttaa ctta 24 <210> 369 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 369 tttcctgatg gcccatacct gtta 24 <210> 370 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 370 tttggtgatg gtctatatca gaga 24 <210> 371 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 371 tttcctgatg gtccacacct tttg 24 <210> 372 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 372 tttcctgatg gtccacactt gtgg 24 <210> 373 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 373 tttcctgatg gtccacgcct gtta 24 <210> 374 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 374 tttcctgatg gtccacactt atta 24 <210> 375 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 375 tttcctgatg gtccatactt gttg 24 <210> 376 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 376 tttcctgatg gtccacacct attg 24 <210> 377 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 377 ttacctgatg ttccatgtcc agtg 24 <210> 378 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 378 tttcccgatg gtccacatct gtta 24 <210> 379 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 379 tttactgatg gtccatacct cgta 24 <210> 380 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 380 tttcctgatg gtccacacct gttg 24 <210> 381 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 381 tttagtgatg gtccctattt cttc 24 <210> 382 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 382 tctcctgatg gtccacgcct gtta 24 <210> 383 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 383 tttcctgatg gtccacacct attg 24 <210> 384 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 384 tttcctgctg gtccatgtct aata 24 <210> 385 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 385 tttactgatg atccatgtct aaac 24 <210> 386 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 386 tttcctgatg gtccatacct gtta 24 <210> 387 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 387 tttcctgatg gtccacatct gtta 24 <210> 388 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 388 tttcctgatg gtccacacct tttg 24 <210> 389 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 389 tttcctgatg gtctgttttt gtag 24 <210> 390 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 390 tttcctgatg gtctacacct gttg 24 <210> 391 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 391 tttactgatg gtccaaacat ctaa 24 <210> 392 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 392 tttgctgatg gtctatagct atca 24 <210> 393 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 393 tttcctgatg gtctgttttt gtag 24 <210> 394 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 394 tttcctgatg gtccatgtct gtta 24 <210> 395 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 395 tttactgatg gtccaaacat ctaa 24 <210> 396 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 396 tttcctgatg gtctattttt cctt 24 <210> 397 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 397 tttcctgatg gtccacagat acta 24 <210> 398 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 398 tttcctgatg gtctacacct gttg 24 <210> 399 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 399 tttactgatg gtccaaacat ctaa 24 <210> 400 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 400 tttactgatg gtccatccct ttta 24 <210> 401 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 401 tttactgatg gtccaaacat ctaa 24 <210> 402 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 402 tttactgatg gtccaaacat ctaa 24 <210> 403 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 403 tttactgatg gtccaaacat ctaa 24 <210> 404 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 404 tttgctgatg gtcgatttat actg 24 <210> 405 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 405 tttcctcatg gtccatgtca ggac 24 <210> 406 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 406 ttttctgatg gtccatacct gtta 24 <210> 407 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 407 attcctgatg atccatgcct gcat 24 <210> 408 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 408 tttactgatg gtccaaacat ctga 24 <210> 409 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 409 tttcatgatg gtccatacct gtta 24 <210> 410 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 410 tttactgatg atccatgtct aaac 24 <210> 411 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 411 tttcctgatg gtccacactt gttg 24 <210> 412 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 412 tttcctgatg gtccatgtct gaat 24 <210> 413 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 413 tttcctgatg gtccacacct attg 24 <210> 414 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 414 tttcctgatg gtctacacct gttg 24 <210> 415 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 415 tttcctgatg gtccacgcct gtta 24 <210> 416 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 416 tttactgatg gtccatacct cgta 24 <210> 417 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 417 tttcctgatg gtccacactt gttg 24 <210> 418 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 418 tttcctgatg gtccacacct tttg 24 <210> 419 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 419 tttcctgatg gtctacacct gttg 24 <210> 420 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 420 tttcctgatg gtccacactt gtgg 24 <210> 421 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 421 tttactaatg gtccaaatcc ttca 24 <210> 422 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 422 tttgctgatg gtctctttaa ctta 24 <210> 423 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 423 tttgctgatg gtctgtatct gtga 24 <210> 424 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 424 tctactgatg gtccttattt gttg 24 <210> 425 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 425 tttcctgatg atctatctat agta 24 <210> 426 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 426 tttgctgatg gtccccttct ccca 24 <210> 427 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 427 tctcctgatg atccacatct gtta 24 <210> 428 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 428 tttcctgatg gtccatactt gttg 24 <210> 429 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 429 tttcctgctg gtccatgtct aata 24 <210> 430 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 430 tttcctgatg gtccacacct tttg 24 <210> 431 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 431 tttcctgatg gtccatacct gtta 24 <210> 432 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 432 tttcctgatg gtccacacct gctg 24 <210> 433 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 433 tttcctgatg gtccacatct gtta 24 <210> 434 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 434 tttcctgatg gtccacacct gctg 24 <210> 435 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 435 tttcctgatg gcccatacct gtta 24 <210> 436 <211> 24 <212> DNA <213> Acidaminococcus sp. <400> 436 tttcctgatg gtccacacat gtta 24

Claims (24)

  1. CRISPR/Cpf1 시스템에 있어서,
    표적 뉴클레오티드(target nucleotide) 서열과 혼성화 가능한 가이드 서열(guide sequence)의 3'-말단에 연결된 유리딘(U, uridine) 반복 뉴클레오티드 서열로 이루어진 폴리뉴클레오티드.
  2. 제1항에 있어서,
    상기 유리딘 반복 뉴클레오티드 서열은 (UaV)nUb로 표시되는 뉴클레오티드 서열인 것인 폴리뉴클레오티드:
    상기 a, b는 2 내지 20 사이의 정수이며, n은 1 내지 5 사이의 정수이고, 상기 V는 A(adenine), C(cytosine) 또는 G(guanine)이다.
  3. 제2항에 있어서,
    상기 (UaV)nUb는 U4AU6 인 것인 폴리뉴클레오티드.
  4. 표적 뉴클레오티드(target nucleotide) 서열과 혼성화 가능한 가이드 서열(guide sequence) 및 상기 가이드 서열의 3'-말단에 연결된 유리딘(U, uridine) 반복 서열을 포함하는 crRNA(CRISPR RNA) 또는 이를 암호화하는 DNA; 및
    Cpf1 단백질 또는 이를 암호화하는 DNA을 포함하는 유전체 편집용 조성물.
  5. 제4항에 있어서,
    상기 유리딘 반복 서열은 유리딘이 2 내지 20개 반복되는 뉴클레오티드 서열인 것인 유전체 편집용 조성물.
  6. 제4항에 있어서,
    상기 유리딘 반복 서열은 유리딘이 6 내지 10개 반복되는 뉴클레오티드 서열인 것인 유전체 편집용 조성물.
  7. 제4항에 있어서,
    상기 유리딘 반복 서열은 유리딘이 8개 반복되는 뉴클레오티드 서열인 것인 유전체 편집용 조성물.
  8. 제4항에 있어서,
    상기 유리딘 반복 서열은 (UaV)nUb로 표시되는 뉴클레오티드 서열인 것인 유전체 편집용 조성물:
    상기 a, b는 2 내지 20 사이의 정수이며, n은 1 내지 5 사이의 정수이고, 상기 V는 A(adenine), C(cytosine) 또는 G(guanine)이다.
  9. 제8항에 있어서,
    상기 V는 A인 것인 유전체 편집용 조성물.
  10. 제8항에 있어서,
    상기 n은 1인 것인 유전체 편집용 조성물.
  11. 제8항에 있어서,
    상기 (UaV)nUb는 U4AU6 인 것인 유전체 편집용 조성물.
  12. 제4항에 있어서,
    상기 가이드 서열은 18 - 23 nt인 것인 유전체 편집용 조성물.
  13. 제4항에 있어서,
    상기 Cpf1 단백질은 캔디다투스(Candidatus) 속, 라치노스피라(Lachnospira) 속, 뷰티리비브리오(Butyrivibrio) 속, 페레그리니박테리아(Peregrinibacteria), 액시도미노코쿠스(Acidominococcus) 속, 포르파이로모나스(Porphyromonas) 속, 프레보텔라(Prevotella) 속, 프란시셀라(Francisella) 속, 캔디다투스 메타노플라스마(Candidatus Methanoplasma), 및 유박테리움(Eubacterium) 속 미생물로 이루어진 군에서 선택되는 하나 이상의 미생물 유래의 것인 유전체 편집용 조성물.
  14. 제4항 내지 제13항 중 어느 한 항에 있어서,
    상기 crRNA를 암호화하는 DNA를 포함하는 PCR 앰플리콘(amplicon) 및 상기 Cpf1 단백질을 암호화하는 DNA를 포함하는 재조합 벡터를 포함하는 유전체 편집용 조성물.
  15. 제4항 내지 제13항 중 어느 한 항에 있어서,
    상기 crRNA를 암호화하는 DNA를 포함하는 재조합 벡터 및 상기 Cpf1 단백질을 암호화하는 DNA를 포함하는 재조합 벡터를 포함하는 유전체 편집용 조성물.
  16. 제15항에 있어서,
    상기 crRNA를 암호화하는 DNA 및 상기 Cpf1 단백질을 암호화하는 DNA는 하나의 재조합 벡터에 함께 포함되거나 별개의 벡터에 각각 포함되는 것인 유전체 편집용 조성물.
  17. 제4항 내지 제13항 중 어느 한 항에 있어서,
    상기 조성물은 진핵 세포 또는 진핵 유기체의 유전체 편집에 적용하기 위한 것인 유전체 편집용 조성물.
  18. 제17항에 있어서,
    상기 진핵 유기체는 진핵 동물 또는 진핵 식물인 유전체 편집용 조성물.
  19. 제4항 내지 제13항 중 어느 한 항의 유전자 편집용 조성물을 분리된 세포 또는 유기체에 도입하는 단계를 포함하는 유전체 편집 방법.
  20. 제19항에 있어서,
    상기 유전체 편집용 조성물을 도입하는 단계는 국소 주입법, 마이크로주입법(microinjection), 전기천공법(electroporation) 또는 리포펙션(lipofection) 방법에 의하여 수행되는 것인 유전체 편집 방법.
  21. 제19항에 있어서,
    상기 세포 또는 유기체는 분리된 진핵 세포 또는 인간을 제외한 진핵 유기체인 것인 유전체 편집 방법.
  22. 제21항에 있어서,
    상기 진핵 세포는 진핵 동물 또는 진핵 식물로부터 분리된 세포인 것인 유전체 편집 방법.
  23. 제4항 내지 제13항 중 어느 한 항의 유전자 편집용 조성물을 분리된 세포 또는 인간을 제외한 유기체에 도입하는 단계를 포함하는 형질 전환체의 제조 방법.
  24. 제23항의 방법으로 제조된 형질 전환체.
KR1020180144185A 2017-11-21 2018-11-21 CRISPR/Cpf1 시스템을 이용한 유전체 편집용 조성물 및 이의 용도 KR102168489B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20170155927 2017-11-21
KR1020170155927 2017-11-21

Publications (2)

Publication Number Publication Date
KR20190058358A true KR20190058358A (ko) 2019-05-29
KR102168489B1 KR102168489B1 (ko) 2020-10-22

Family

ID=66630759

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180144185A KR102168489B1 (ko) 2017-11-21 2018-11-21 CRISPR/Cpf1 시스템을 이용한 유전체 편집용 조성물 및 이의 용도

Country Status (6)

Country Link
US (1) US11667917B2 (ko)
EP (1) EP3715461A4 (ko)
KR (1) KR102168489B1 (ko)
CN (1) CN111836894B (ko)
AU (1) AU2018370588B2 (ko)
WO (1) WO2019103442A2 (ko)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111235130A (zh) * 2019-11-15 2020-06-05 武汉大学 II类V型CRISPR蛋白CeCas12a及其在基因编辑的应用
KR20210053228A (ko) * 2019-10-29 2021-05-11 주식회사 진코어 CRISPR/Cas12f1 시스템 효율화를 위한 엔지니어링 된 가이드 RNA 및 그 용도
KR20210078430A (ko) * 2019-12-18 2021-06-28 한국생명공학연구원 Cpf1 및 키메릭 DNA-RNA 가이드를 포함하는 유전체 교정 또는 발현 억제용 조성물
KR20210137928A (ko) 2020-05-11 2021-11-18 중앙대학교 산학협력단 CRISPR/Cpf1 시스템을 기반으로 한 유전체 단일 염기 편집 방법 및 이의 용도
KR20220047493A (ko) * 2020-10-08 2022-04-18 주식회사 진코어 CRISPR/Cas12a 시스템을 위한 엔지니어링 된 crRNA
WO2022220503A1 (ko) * 2021-04-16 2022-10-20 주식회사 진코어 Crispr 시스템을 이용한 유전자 발현 조절 시스템
WO2022240262A1 (ko) * 2021-05-14 2022-11-17 주식회사 진코어 Rna-guided nuclease를 이용한 lca10 치료용 조성물 및 치료방법
WO2023172115A1 (ko) * 2022-03-10 2023-09-14 주식회사 진코어 Nhej 복구 경로 조절을 통해 핵산 세그먼트의 결실 효율을 증가시키기 위한 조성물 및 방법
WO2023191570A1 (ko) * 2022-03-30 2023-10-05 주식회사 진코어 어셔 증후군 치료를 위한 유전자 편집 시스템
WO2023153845A3 (ko) * 2022-02-09 2024-04-11 주식회사 진코어 상동지정복구를 위한 target 시스템 및 이를 이용한 유전자 편집 방법

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3652312A1 (en) 2017-07-14 2020-05-20 Editas Medicine, Inc. Systems and methods for targeted integration and genome editing and detection thereof using integrated priming sites
US20220380835A1 (en) * 2019-11-08 2022-12-01 University Of Florida Research Foundation, Inc. Crispr complex-based detection system and method
CN113355362B (zh) * 2021-06-16 2022-06-07 北京大学 化学修饰CRISPR/Cpf1复合物的用途
CN116751763B (zh) * 2023-05-08 2024-02-13 珠海舒桐医疗科技有限公司 一种Cpf1蛋白、V型基因编辑系统及应用

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101656236B1 (ko) 2012-10-23 2016-09-12 주식회사 툴젠 표적 DNA에 특이적인 가이드 RNA 및 Cas 단백질을 암호화하는 핵산 또는 Cas 단백질을 포함하는, 표적 DNA를 절단하기 위한 조성물 및 이의 용도
KR20170063399A (ko) * 2015-11-30 2017-06-08 기초과학연구원 F. novicida 유래 Cas9을 포함하는 유전체 교정용 조성물
KR20170068400A (ko) * 2015-12-08 2017-06-19 기초과학연구원 Cpf1을 포함하는 유전체 교정용 조성물 및 그 용도

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106244591A (zh) * 2016-08-23 2016-12-21 苏州吉玛基因股份有限公司 修饰crRNA在CRISPR/Cpf1基因编辑系统中的应用
WO2018099475A1 (zh) * 2016-12-01 2018-06-07 中国科学院上海生命科学研究院 基于Cpf1的植物基因组定点编辑方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101656236B1 (ko) 2012-10-23 2016-09-12 주식회사 툴젠 표적 DNA에 특이적인 가이드 RNA 및 Cas 단백질을 암호화하는 핵산 또는 Cas 단백질을 포함하는, 표적 DNA를 절단하기 위한 조성물 및 이의 용도
KR20170063399A (ko) * 2015-11-30 2017-06-08 기초과학연구원 F. novicida 유래 Cas9을 포함하는 유전체 교정용 조성물
KR20170068400A (ko) * 2015-12-08 2017-06-19 기초과학연구원 Cpf1을 포함하는 유전체 교정용 조성물 및 그 용도

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Li B, Zhao W, Luo X, et al. Engineering CRISPR-Cpf1 crRNAs and mRNAs to maximize genome editing efficiency. Nat Biomed Eng. 2017;1(5):0066. doi:10.1038/s41551-017-0066 *
Mol. Cell. Biol. Vol.20(3):883-891(2000) *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210053228A (ko) * 2019-10-29 2021-05-11 주식회사 진코어 CRISPR/Cas12f1 시스템 효율화를 위한 엔지니어링 된 가이드 RNA 및 그 용도
WO2021086083A3 (ko) * 2019-10-29 2021-06-24 주식회사 진코어 CRISPR/Cas12f1 시스템 효율화를 위한 엔지니어링 된 가이드 RNA 및 그 용도
CN111235130A (zh) * 2019-11-15 2020-06-05 武汉大学 II类V型CRISPR蛋白CeCas12a及其在基因编辑的应用
KR20210078430A (ko) * 2019-12-18 2021-06-28 한국생명공학연구원 Cpf1 및 키메릭 DNA-RNA 가이드를 포함하는 유전체 교정 또는 발현 억제용 조성물
KR20210137928A (ko) 2020-05-11 2021-11-18 중앙대학교 산학협력단 CRISPR/Cpf1 시스템을 기반으로 한 유전체 단일 염기 편집 방법 및 이의 용도
KR20220047493A (ko) * 2020-10-08 2022-04-18 주식회사 진코어 CRISPR/Cas12a 시스템을 위한 엔지니어링 된 crRNA
WO2022220503A1 (ko) * 2021-04-16 2022-10-20 주식회사 진코어 Crispr 시스템을 이용한 유전자 발현 조절 시스템
WO2022240262A1 (ko) * 2021-05-14 2022-11-17 주식회사 진코어 Rna-guided nuclease를 이용한 lca10 치료용 조성물 및 치료방법
WO2023153845A3 (ko) * 2022-02-09 2024-04-11 주식회사 진코어 상동지정복구를 위한 target 시스템 및 이를 이용한 유전자 편집 방법
WO2023172115A1 (ko) * 2022-03-10 2023-09-14 주식회사 진코어 Nhej 복구 경로 조절을 통해 핵산 세그먼트의 결실 효율을 증가시키기 위한 조성물 및 방법
WO2023191570A1 (ko) * 2022-03-30 2023-10-05 주식회사 진코어 어셔 증후군 치료를 위한 유전자 편집 시스템

Also Published As

Publication number Publication date
US11667917B2 (en) 2023-06-06
CN111836894B (zh) 2023-11-10
EP3715461A2 (en) 2020-09-30
WO2019103442A3 (ko) 2019-07-18
AU2018370588A1 (en) 2020-07-09
WO2019103442A2 (ko) 2019-05-31
EP3715461A4 (en) 2021-09-08
KR102168489B1 (ko) 2020-10-22
US20200308583A1 (en) 2020-10-01
AU2018370588B2 (en) 2022-09-08
CN111836894A (zh) 2020-10-27

Similar Documents

Publication Publication Date Title
KR102168489B1 (ko) CRISPR/Cpf1 시스템을 이용한 유전체 편집용 조성물 및 이의 용도
US11718846B2 (en) Genomic sequence modification method for specifically converting nucleic acid bases of targeted DNA sequence, and molecular complex for use in same
US20210171935A1 (en) Method for modifying genome sequence to introduce specific mutation to targeted dna sequence by base-removal reaction, and molecular complex used therein
US10526590B2 (en) Compounds and methods for CRISPR/Cas-based genome editing by homologous recombination
KR102254602B1 (ko) Cas9 변이체 및 그의 용도
AU2022203146A1 (en) Engineered CRISPR-Cas9 nucleases
US10913941B2 (en) Enzymes with RuvC domains
US20170152508A1 (en) Using Truncated Guide RNAs (tru-gRNAs) to Increase Specificity for RNA-Guided Genome Editing
WO2017208247A1 (en) Assay for the removal of methyl-cytosine residues from dna
KR20180069898A (ko) 핵염기 편집제 및 그의 용도
JP7138712B2 (ja) ゲノム編集のためのシステム及び方法
KR20010071226A (ko) 이형이중나선 돌연변이성 벡터 및 박테리아에 이를이용하는 방법
JP2020503899A (ja) 遺伝子編集技術を用いたインビトロ部位特異的変異導入のための方法
KR102210700B1 (ko) 아데노신 디아미나아제를 이용한 염기 교정 확인 방법
WO2023193536A1 (zh) 一种腺苷脱氨酶、碱基编辑器及应用
WO2020087631A1 (zh) 基于C2c1核酸酶的基因组编辑系统和方法
KR102551876B1 (ko) Cpf1 및 키메릭 DNA-RNA 가이드를 포함하는 유전체 교정 또는 발현 억제용 조성물
US20220220460A1 (en) Enzymes with ruvc domains
US20190218533A1 (en) Genome-Scale Engineering of Cells with Single Nucleotide Precision
WO2023029492A1 (zh) 一种外源基因定点整合的系统及方法
WO2022050413A1 (ja) 小型化シチジンデアミナーゼを含む二本鎖dnaの改変用複合体
WO2024044329A1 (en) Crispr base editor
CN118146390A (zh) 一种包含np220的融合蛋白、包含该融合蛋白的基因表达沉默工具及其应用
WO2023183627A1 (en) Production of reverse transcribed dna (rt-dna) using a retron reverse transcriptase from exogenous rna

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant