KR20220150329A - 클래스 ii, 타입 v crispr 시스템 - Google Patents

클래스 ii, 타입 v crispr 시스템 Download PDF

Info

Publication number
KR20220150329A
KR20220150329A KR1020227033789A KR20227033789A KR20220150329A KR 20220150329 A KR20220150329 A KR 20220150329A KR 1020227033789 A KR1020227033789 A KR 1020227033789A KR 20227033789 A KR20227033789 A KR 20227033789A KR 20220150329 A KR20220150329 A KR 20220150329A
Authority
KR
South Korea
Prior art keywords
sequence
engineered
guide rna
endonuclease
seq
Prior art date
Application number
KR1020227033789A
Other languages
English (en)
Other versions
KR102647766B1 (ko
Inventor
브라이언 토마스
크리스토퍼 브라운
아우드라 디보토
크리스티나 버터필드
리사 알렉산더
다니엘라 에스 에이 골츠맨
저스틴 알버즈
알렌 브룩스
그레그 코스트
모라이마 테모체-디아즈
신디 캐스텔
레베카 라모쓰
Original Assignee
메타지노미, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 메타지노미, 인크. filed Critical 메타지노미, 인크.
Priority to KR1020247008129A priority Critical patent/KR20240036729A/ko
Publication of KR20220150329A publication Critical patent/KR20220150329A/ko
Application granted granted Critical
Publication of KR102647766B1 publication Critical patent/KR102647766B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1068Template (nucleic acid) mediated chemical library synthesis, e.g. chemical and enzymatical DNA-templated organic molecule synthesis, libraries prepared by non ribosomal polypeptide synthesis [NRPS], DNA/RNA-polymerase mediated polypeptide synthesis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/09Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/31Chemical structure of the backbone
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/32Chemical structure of the sugar
    • C12N2310/3212'-O-R Modification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Mycology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Cell Biology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Amplifiers (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Saccharide Compounds (AREA)

Abstract

유전자 편집에 유용한 비배양 미생물로부터 유래된 방법, 조성물, 및 시스템이 본원에 기재된다.

Description

클래스 II, 타입 V CRISPR 시스템
상호 참조
본 출원은 2020년 3월 6일에 출원되고 발명의 명칭이 "CLASS II, TYPE V CRISPR SYSTEMS"인 미국 가출원 제62/986,477호, 2020년 5월 8일에 출원되고 발명의 명칭이 "CLASS II, TYPE V CRISPR SYSTEMS"인 미국 가출원 제63/022,276호, 2020년 6월 29일에 출원되고 발명의 명칭이 "CLASS II, TYPE V CRISPR SYSTEMS"인 미국 가출원 제63/045,815호, 2020년 8월 20일에 출원되고 발명의 명칭이 "CLASS II, TYPE V CRISPR SYSTEMS"인 미국 가출원 제63/068,316호, 2020년 8월 24일에 출원되고 발명의 명칭이 "CLASS II, TYPE V CRISPR SYSTEMS"인 미국 가출원 제63/069,699호, 2020년 11월 19일에 출원되고 발명의 명칭이 "CLASS II, TYPE V CRISPR SYSTEMS"인 미국 가출원 제63/116,157호의 이익을 주장하고, 이들 각각은 그 전체가 본원에 참조로 포함된다.
Cas 효소와 연관된 일정한 간격을 두고 주기적으로 분포하는 짧은 회문 반복 서열(Clustered Regularly Interspaced Short Palindromic Repeat; CRISPR) 가이드 리보핵산(RNA)과 함께 Cas 효소는 원핵생물 면역계의 만연한(박테리아의 약 45%, 고세균의 약 84%) 성분으로 보이며, CRISPR-RNA 가이드 핵산 절단에 의해 감염성 바이러스 및 플라스미드와 같은 비-자기 핵산으로부터 상기 미생물을 보호하는 역할을 한다. CRISPR RNA 요소를 코딩하는 데옥시리보핵산(DNA) 요소는 구조 및 길이가 상대적으로 보존될 수 있지만, 이의 CRISPR-연관(Cas) 단백질은 매우 다양하며, 광범위하게 다양한 핵산-상호작용 도메인을 포함한다. CRISPR DNA 요소는 1987년도에 일찍 관찰되었지만, CRISPR/Cas 복합체의 프로그래밍 가능한 엔도뉴클레아제 절단 능력은 비교적 최근에야 인식되어, 다양한 DNA 조작 및 유전자 편집 응용 분야에서 재조합 CRISPR/Cas 시스템을 사용하게 되었다.
서열 목록
본 출원은 ASCII 형식으로 전자 제출되고 그 전체가 본원에 참조로 포함되는 서열 목록을 포함한다. 2021년 3월 5일에 생성된 상기 ASCII 사본은 명칭이 55921-710_601_SL.txt이고, 크기가 2,617 KB이다.
발명의 개요
일부 측면에서, 본 개시내용은 (a) RuvC 도메인을 포함하는 엔도뉴클레아제로서, 엔도뉴클레아제는 비배양 미생물로부터 유래되고, 엔도뉴클레아제는 Cas12a 엔도뉴클레아제인, 엔도뉴클레아제; 및 (b) 조작된 가이드 RNA로서, 조작된 가이드 RNA는 엔도뉴클레아제와 복합체를 형성하도록 구성되고, 조작된 가이드 RNA는 표적 핵산 서열에 혼성화하도록 구성된 스페이서 서열을 포함하는, 조작된 가이드 RNA를 포함하는, 조작된 뉴클레아제 시스템을 제공한다. 일부 실시양태에서, Cas12a 엔도뉴클레아제는 서열 GWxxxK를 포함한다. 일부 실시양태에서, 조작된 가이드 RNA는 UCUAC[N3-5]GUAGAU(N4)를 포함한다. 일부 실시양태에서, 조작된 가이드 RNA는 CCUGC[N4]GCAGG(N3-4)를 포함한다. 일부 측면에서, 본 개시내용은 (a) 서열 번호(SEQ ID NO:) 1-3470 중 어느 하나 또는 이의 변이체에 대해 적어도 75%의 서열 동일성을 갖는 엔도뉴클레아제; 및 (b) 조작된 가이드 RNA로서, 조작된 가이드 RNA는 엔도뉴클레아제와 복합체를 형성하도록 구성되고, 조작된 가이드 RNA는 표적 핵산 서열에 혼성화하도록 구성된 스페이서 서열을 포함하는, 조작된 가이드 RNA를 포함하는, 조작된 뉴클레아제 시스템을 제공한다. 일부 실시양태에서, 엔도뉴클레아제는 RuvCI, II, 또는 III 도메인을 포함한다. 일부 실시양태에서, 엔도뉴클레아제는 서열 번호 1-3470 중 어느 하나 또는 이의 변이체의 RuvCI, II, 또는 III 도메인에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%의 동일성을 갖는다. 일부 실시양태에서, RuvCI 도메인은 D 촉매 잔기를 포함한다. 일부 실시양태에서, RuvCII 도메인은 E 촉매 잔기를 포함한다. 일부 실시양태에서, RuvCIII 도메인은 D 촉매 잔기를 포함한다. 일부 실시양태에서, 상기 RuvC 도메인은 뉴클레아제 활성을 갖지 않는다. 일부 실시양태에서, 상기 엔도뉴클레아제는 서열 번호 1-3470 중 어느 하나 또는 이의 변이체의 WED II 도메인에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%의 동일성을 갖는 WED II 도메인을 추가로 포함한다. 일부 측면에서, 본 개시내용은 (a) 서열 번호 3862-3913 중 어느 하나를 포함하는 프로토스페이서 인접 모티프(protospacer adjacent motif; PAM) 서열에 결합하도록 구성된 엔도뉴클레아제로서, 엔도뉴클레아제는 클래스 2, 타입 V Cas 엔도뉴클레아제인, 엔도뉴클레아제; 및 (b) 조작된 가이드 RNA로서, 조작된 가이드 RNA는 엔도뉴클레아제와 복합체를 형성하도록 구성되고, 조작된 가이드 RNA는 표적 핵산 서열에 혼성화하도록 구성된 스페이서 서열을 포함하는, 조작된 가이드 RNA를 포함하는, 조작된 뉴클레아제 시스템을 제공한다. 일부 실시양태에서, 엔도뉴클레아제는 징크 핑거-유사 도메인을 추가로 포함한다. 일부 실시양태에서, 가이드 RNA는 서열 번호 3471, 3551-3559, 3608-3609, 3612, 3636-3637, 3640-3641, 3644-3645, 3648-3649, 3652-3653, 3656-3657, 3660-3661, 3664-3667, 3671-3672, -3678, 3695-3696, 3729-3730, 3734-3735, 및 3851-3857 중 어느 하나의 비-축퇴성 뉴클레오타이드에 대해 적어도 80%의 서열 동일성을 갖는 서열을 포함한다. 일부 측면에서, 본 개시내용은 (a) 서열 번호 3471, 3539, 3551-3559, 3608-3609, 3612, 3636-3637, 3640-3641, 3644-3645, 3648-3649, 3652-3653, 3656-3657, 3660-3661, 3664-3667, 3671-3672, 3677-3678, 3695-3696, 3729-3730, 3734-3735, 또는 3851-3857 중 어느 하나의 비-축퇴성 뉴클레오타이드에 대해 적어도 80%의 서열 동일성을 갖는 서열을 포함하는 조작된 가이드 RNA, 및 (b) 조작된 가이드 RNA에 결합하도록 구성된 클래스 2, 타입 V Cas 엔도뉴클레아제를 포함하는, 조작된 뉴클레아제 시스템을 제공한다. 일부 실시양태에서, 엔도뉴클레아제는 서열 번호 3863-3913 중 어느 하나를 포함하는 프로토스페이서 인접 모티프(PAM) 서열에 결합하도록 구성된다. 일부 실시양태에서, 가이드 RNA는 진핵생물, 진균, 식물, 포유동물, 또는 인간 게놈 폴리뉴클레오타이드 서열에 상보성인 서열을 포함한다. 일부 실시양태에서, 가이드 RNA는 30-250 개 뉴클레오타이드 길이이다. 일부 실시양태에서, 엔도뉴클레아제는 엔도뉴클레아제의 N-말단 또는 C-말단에 근접한 하나 이상의 핵 국소화 서열(nuclear localization sequence; NLS)을 포함한다. 일부 실시양태에서, NLS는 서열 번호 3938-3953으로 이루어진 군으로부터의 서열에 대해 적어도 80% 동일한 서열을 포함한다. 일부 실시양태에서, 엔도뉴클레아제는 엔도뉴클레아제의 서열이 서열 번호 215에 최적으로 정렬될 때 돌연변이 S168R, E172R, N577R, 또는 Y170R 중 적어도 하나를 포함한다. 일부 실시양태에서, 엔도뉴클레아제는 엔도뉴클레아제의 서열이 서열 번호 215에 최적으로 정렬될 때 돌연변이 S168R 및 E172R을 포함한다. 일부 실시양태에서, 엔도뉴클레아제는 엔도뉴클레아제의 서열이 서열 번호 215에 최적으로 정렬될 때 돌연변이 N577R 또는 Y170R을 포함한다. 일부 실시양태에서, 엔도뉴클레아제는 엔도뉴클레아제의 서열이 서열 번호 215에 최적으로 정렬될 때 돌연변이 S168R을 포함한다. 일부 실시양태에서, 엔도뉴클레아제는 E172, N577, 또는 Y170의 돌연변이를 포함하지 않는다. 일부 실시양태에서, 조작된 뉴클레아제 시스템은 5'에서 3'으로 표적 데옥시리보핵산 서열의 5'에 적어도 20 개의 뉴클레오타이드의 서열을 포함하는 제1 상동성 아암(arm), 적어도 10 개의 뉴클레오타이드의 합성 DNA 서열, 및 표적 서열의 3'에 적어도 20 개의 뉴클레오타이드의 서열을 포함하는 제2 상동성 아암을 포함하는 단일-가닥 또는 이중-가닥 DNA 복구 주형을 추가로 포함한다. 일부 실시양태에서, 제1 또는 제2 상동성 아암은 적어도 40 개, 80 개, 120 개, 150 개, 200 개, 300 개, 500 개, 또는 1,000 개의 뉴클레오타이드의 서열을 포함한다. 일부 실시양태에서, 제1 및 제2 상동성 아암은 원핵생물, 박테리아, 진균, 또는 진핵생물의 게놈 서열에 상동성이다. 일부 실시양태에서, 단일-가닥 또는 이중-가닥 DNA 복구 주형은 트랜스진 공여체를 포함한다. 일부 실시양태에서, 조작된 뉴클레아제 시스템은 1 개 또는 2 개의 단일-가닥 DNA 세그먼트가 측접된 이중-가닥 DNA 세그먼트를 포함하는 DNA 복구 주형을 추가로 포함한다. 일부 실시양태에서, 단일-가닥 DNA 세그먼트는 이중-가닥 DNA 세그먼트의 5' 말단에 접합된다. 일부 실시양태에서, 단일-가닥 DNA 세그먼트는 이중-가닥 DNA 세그먼트의 3' 말단에 접합된다. 일부 실시양태에서, 단일-가닥 DNA 세그먼트는 4 개 내지 10 개의 뉴클레오타이드 염기의 길이를 갖는다. 일부 실시양태에서, 단일-가닥 DNA 세그먼트는 스페이서 서열 내의 서열에 상보성인 뉴클레오타이드 서열을 갖는다. 일부 실시양태에서, 이중-가닥 DNA 서열은 바코드, 개방형 해독틀, 인핸서, 프로모터, 단백질-코딩 서열, miRNA 코딩 서열, RNA 코딩 서열, 또는 트랜스진을 포함한다. 일부 실시양태에서, 이중-가닥 DNA 서열에는 뉴클레아제 절단 부위가 측접된다. 일부 실시양태에서, 뉴클레아제 절단 부위는 스페이서 및 PAM 서열을 포함한다. 일부 실시양태에서, 시스템은 Mg2+의 공급원을 추가로 포함한다. 일부 실시양태에서, 가이드 RNA는 적어도 8 개, 적어도 10 개, 또는 적어도 12 개의 염기쌍 리보뉴클레오타이드를 포함하는 헤어핀을 포함한다. 일부 실시양태에서, 헤어핀은 10 개의 염기쌍 리보뉴클레오타이드를 포함한다. 일부 실시양태에서, (a) 엔도뉴클레아제는 서열 번호 141, 215, 229, 261, 또는 1711-1721 중 어느 하나 또는 이의 변이체에 대해 적어도 75%, 80%, 또는 90% 동일한 서열을 포함하고; (b) 가이드 RNA 구조는 서열 번호 3608-3609, 3853, 또는 3851-3857 중 어느 하나의 비-축퇴성 뉴클레오타이드에 대해 적어도 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시양태에서, 엔도뉴클레아제는 서열 번호 3863-3913 중 어느 하나를 포함하는 PAM에 결합하도록 구성된다. 일부 실시양태에서, 엔도뉴클레아제는 서열 번호 3871을 포함하는 PAM에 결합하도록 구성된다. 일부 실시양태에서, 서열 동일성은 BLASTP, CLUSTALW, MUSCLE, MAFFT 알고리즘, 또는 스미쓰-워터맨(Smith-Waterman) 상동성 검색 알고리즘 매개변수를 갖는 CLUSTALW 알고리즘에 의해 결정된다. 일부 실시양태에서, 서열 동일성은 단어 길이(W) 3, 기대값(E) 10, 및 기존 11, 연장 1에서의 BLOSUM62 스코어링 매트릭스 설정 갭 코스트의 매개변수를 사용하고, 조건부 조성 점수 매트릭스 조정을 사용하여 BLASTP 상동성 검색 알고리즘에 의해 결정될 수 있다.
일부 측면에서, 본 개시내용은 (a) 표적 DNA 분자에서 표적 서열에 상보성인 뉴클레오타이드 서열을 포함하는 DNA-표적화 세그먼트; 및 (b) 혼성화되어 이중-가닥 RNA(dsRNA) 이중체를 형성하는 뉴클레오타이드의 2 개의 상보성인 스트레치를 포함하는 단백질-결합 세그먼트를 포함하는, 조작된 가이드 RNA로서, 뉴클레오타이드의 2 개의 상보성인 스트레치는 개재 뉴클레오타이드로 서로 공유 연결되고, 조작된 가이드 리보핵산 폴리뉴클레오타이드는 서열 번호 1-3470 중 어느 하나에 대해 적어도 75%의 서열 동일성을 갖는 엔도뉴클레아제와 복합체를 형성하고 복합체를 표적 DNA 분자의 표적 서열에 표적화할 수 있는, 조작된 가이드 RNA를 제공한다. 일부 실시양태에서, DNA-표적화 세그먼트는 뉴클레오타이드의 2 개의 상보성 스트레치 둘 모두의 3'에 위치한다. 일부 실시양태에서, 단백질 결합 세그먼트는 서열 번호 3608-3609의 비-축퇴성 뉴클레오타이드에 대해 적어도 70%, 적어도 80%, 또는 적어도 90%의 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 이중-가닥 RNA(dsRNA) 이중체는 적어도 5 개, 적어도 8 개, 적어도 10 개, 또는 적어도 12 개의 리보뉴클레오타이드를 포함한다.
일부 측면에서, 본 개시내용은 본원에 기재된 조작된 가이드 리보핵산 폴리뉴클레오타이드를 코딩하는 데옥시리보핵산 폴리뉴클레오타이드를 제공한다.
일부 측면에서, 본 개시내용은 유기체에서의 발현에 최적화된 조작된 핵산 서열을 포함하는 핵산으로서, 핵산은 클래스 2, 타입 V Cas 엔도뉴클레아제를 코딩하고, 엔도뉴클레아제는 비배양 미생물로부터 유래되고, 유기체는 비배양 유기체가 아닌, 핵산을 제공한다. 일부 실시양태에서, 엔도뉴클레아제는 서열 번호 1-3470 중 어느 하나에 대해 적어도 70% 또는 적어도 80%의 서열 동일성을 갖는 변이체를 포함한다. 일부 실시양태에서, 엔도뉴클레아제는 엔도뉴클레아제의 N-말단 또는 C-말단에 근접한 하나 이상의 핵 국소화 서열(NLS)을 코딩하는 서열을 포함한다. 일부 실시양태에서, NLS는 서열 번호 3938-3953으로부터 선택된 서열을 포함한다. 일부 실시양태에서, NLS는 서열 번호 3939를 포함한다. 일부 실시양태에서, NLS는 엔도뉴클레아제의 N-말단에 근접하다. 일부 실시양태에서, NLS는 서열 번호 3938를 포함한다. 일부 실시양태에서, NLS는 엔도뉴클레아제의 C-말단에 근접하다. 일부 실시양태에서, 유기체는 원핵생물, 박테리아, 진핵생물, 진균, 식물, 포유동물, 설치류, 또는 인간이다.
일부 측면에서, 본 개시내용은 클래스 2, 타입 V Cas 엔도뉴클레아제 또는 Cas12a 엔도뉴클레아제를 코딩하는 핵산 서열을 포함하는 조작된 벡터로서, 엔도뉴클레아제는 비배양 미생물로부터 유래되는, 조작된 벡터를 제공한다.
일부 측면에서, 본 개시내용은 본원에 기재된 핵산을 포함하는 조작된 벡터를 제공한다.
일부 측면에서, 본 개시내용은 본원에 기재된 데옥시리보핵산 폴리뉴클레오타이드를 포함하는 조작된 벡터를 제공한다. 일부 실시양태에서, 벡터는 플라스미드, 미니서클, CELiD, 아데노-관련 바이러스(AAV) 유래된 비리온, 렌티바이러스, 또는 아데노바이러스이다.
일부 측면에서, 본 개시내용은 본원에 기재된 벡터를 포함하는 세포를 제공한다.
일부 측면에서, 본 개시내용은 본원에 기재된 임의의 숙주 세포를 배양하는 것을 포함하는, 엔도뉴클레아제를 제조하는 방법을 제공한다.
일부 측면에서, 본 개시내용은 이중-가닥 데옥시리보핵산 폴리뉴클레오타이드를 결합, 절단, 마킹 또는 변형시키는 방법으로서, (a) 엔도뉴클레아제 및 이중-가닥 데옥시리보핵산 폴리뉴클레오타이드에 결합하도록 구성된 조작된 가이드 RNA와의 복합체에서 클래스 2, 타입 V Cas 엔도뉴클레아제와 이중-가닥 데옥시리보핵산 폴리뉴클레오타이드를 접촉시키는 것을 포함하고; (b) 이중-가닥 데옥시리보핵산 폴리뉴클레오타이드는 프로토스페이서 인접 모티프(PAM)를 포함하고; (c) PAM은 서열 번호 3863-3913 중 어느 하나를 포함하는 서열을 포함하는법을 제공한다. 일부 실시양태에서, 이중-가닥 데옥시리보핵산 폴리뉴클레오타이드는 조작된 가이드 RNA의 서열에 상보성인 서열을 포함하는 제1 가닥 및 PAM을 포함하는 제2 가닥을 포함한다. 일부 실시양태에서, PAM은 조작된 가이드 RNA의 서열에 상보성인 서열의 5' 말단에 바로 인접한다. 일부 실시양태에서, PAM은 서열 번호 3871를 포함한다. 일부 실시양태에서, 클래스 2, 타입 V Cas 엔도뉴클레아제는 비배양 미생물로부터 유래된다. 일부 실시양태에서, 이중-가닥 데옥시리보핵산 폴리뉴클레오타이드는 진핵생물, 식물, 진균, 포유동물, 설치류, 또는 인간 이중-가닥 데옥시리보핵산 폴리뉴클레오타이드이다. 일부 실시양태에서, 방법은 표적 핵산 유전자좌에 청구항 [0004]-0 중 어느 하나의 조작된 뉴클레아제 시스템을 전달하는 것을 포함하고, 여기서 엔도뉴클레아제는 조작된 가이드 리보핵산 구조와 복합체를 형성하도록 구성되고, 복합체는 표적 핵산 유전자좌에 대한 복합체의 결합 시 복합체가 표적 핵산 유전자좌를 변형시키도록 구성된다. 일부 실시양태에서, 표적 핵산 유전자좌를 변형시키는 것은 표적 핵산 유전자좌를 결합, 니킹(nicking), 절단, 또는 마킹하는 것을 포함한다. 일부 실시양태에, 표적 핵산 유전자좌는 데옥시리보핵산(DNA) 또는 리보핵산(RNA)을 포함한다. 일부 실시양태에서, 표적 핵산 유전자좌는 게놈 DNA, 바이러스 DNA, 바이러스 RNA, 또는 박테리아 DNA를 포함한다. 일부 실시양태에서, 표적 핵산 유전자좌는 시험관 내에 있다. 일부 실시양태에서, 표적 핵산 유전자좌는 세포 내에 있다. 일부 실시양태에서, 세포는 원핵 세포, 박테리아 세포, 진핵 세포, 진균 세포, 식물 세포, 동물 세포, 포유동물 세포, 설치류 세포, 영장류 세포, 인간 세포, 또는 일차 세포이다. 일부 실시양태에서, 세포는 일차 세포이다. 일부 실시양태에서, 일차 세포는 T 세포이다. 일부 실시양태에서, 일차 세포는 조혈 줄기 세포(HSC)이다. 일부 실시양태에서, 조작된 뉴클레아제 시스템을 표적 핵산 유전자좌로 전달하는 것은 임의의 청구항 [0007] 내지 [0008]의 핵산 또는 임의의 청구항 [0008] 내지 [0011]의 벡터를 전달하는 것을 포함한다. 일부 실시양태에서, 조작된 뉴클레아제 시스템을 표적 핵산 유전자좌로 전달하는 것은 엔도뉴클레아제를 코딩하는 개방형 해독틀을 포함하는 핵산을 전달하는 것을 포함한다. 일부 실시양태에서, 핵산은 엔도뉴클레아제를 코딩하는 개방형 해독틀이 작동 가능하게 연결되는 프로모터를 포함한다. 일부 실시양태에서, 조작된 뉴클레아제 시스템을 표적 핵산 유전자좌로 전달하는 것은 엔도뉴클레아제를 코딩하는 개방형 해독틀을 포함하는 캡핑된 mRNA를 전달하는 것을 포함한다. 일부 실시양태에서, 조작된 뉴클레아제 시스템을 표적 핵산 유전자좌로 전달하는 것은 번역된 폴리펩타이드를 전달하는 것을 포함한다. 일부 실시양태에서, 조작된 뉴클레아제 시스템을 표적 핵산 유전자좌에 전달하는 것은 리보핵산(RNA) pol III 프로모터에 작동 가능하게 연결된 조작된 가이드 RNA를 코딩하는 데옥시리보핵산(DNA)을 전달하는 것을 포함한다. 일부 실시양태에서, 엔도뉴클레아제는 표적 유전자좌에서 또는 표적 유전자좌에 근접하여 단일-가닥 파손 또는 이중-가닥 파손을 유도한다. 일부 실시양태에서, 엔도뉴클레아제는 표적 유전자좌 내에 또는 3'에 엇갈린 단일-가닥 파손을 유도한다.
일부 측면에서, 본 개시내용은 세포에서 TRAC 유전자좌를 편집하는 방법으로서, 세포에 (a) RNA-가이드 엔도뉴클레아제; 및 (b) 조작된 가이드 RNA를 접촉시키는 것을 포함하고, 조작된 가이드 RNA는 엔도뉴클레아제와 복합체를 형성하도록 구성되고, 조작된 가이드 RNA는 TRAC 유전자좌의 영역에 혼성화하도록 구성된 스페이서 서열을 포함하고, 조작된 가이드 RNA는 서열 번호 4316-4369 중 어느 하나의 적어도 18 개의 연속 뉴클레오타이드에 대해 적어도 85%의 동일성을 갖는 표적화 서열을 포함하는, 방법을 제공한다. 일부 실시양태에서, RNA-가이드 뉴클레아제는 Cas 엔도뉴클레아제이다. 일부 실시양태에서, Cas 엔도뉴클레아제는 클래스 2, 타입 V Cas 엔도뉴클레아제이다. 일부 실시양태에서, 클래스 2, 타입 V Cas 엔도뉴클레아제는 RuvCI 서브도메인, RuvCII 서브도메인, 및 RuvCIII 서브도메인을 포함하는 RuvC 도메인을 포함한다. 일부 실시양태에서, 클래스 2, 타입 V Cas 엔도뉴클레아제는 서열 번호 1-3470 중 어느 하나 또는 이의 변이체에 대해 적어도 75%의 서열 동일성을 갖는 엔도뉴클레아제를 포함한다. 일부 실시양태에서, 조작된 가이드 RNA는 서열 번호 3471, 3539, 3551-3559, 3608-3609, 3612, 3636-3637, 3640-3641, 3644-3645, 3648-3649, 3652-3653, 3656-3657, 3660-3661, 3664-3667, 3671-3672, 3677-3678, 3695-3696, 3729-3730, 3734-3735, 및 3851-3857 중 어느 하나의 비-축퇴성 뉴클레오타이드 중 적어도 19 개에 대해 적어도 80%의 서열 동일성을 갖는 서열을 추가로 포함한다. 일부 실시양태에서, 엔도뉴클레아제는 서열 번호 141, 215, 229, 261, 또는 1711-1721 중 어느 하나 또는 이의 변이체에 대해 적어도 75%, 80%, 또는 90% 동일한 서열을 포함한다. 일부 실시양태에서, 가이드 RNA 구조는 서열 번호 3608-3609, 3853, 또는 3851-3857 중 어느 하나의 비-축퇴성 뉴클레오타이드 중 적어도 19 개에 대해 적어도 80%, 또는 적어도 90% 동일한 서열을 포함한다. 일부 실시양태에서, 상기 방법은 서열 번호 4424 또는 4425 중 어느 하나에 대해 적어도 80%의 동일성을 갖는 서열에 의해 3' 말단 또는 5' 말단에서 측접된 카고 서열을 포함하는 공여체 핵산을 세포에 접촉시키거나 세포에 도입하는 것을 추가로 포함한다. 일부 실시양태에서, 세포는 말초 혈액 단핵 세포(PBMC)이다. 일부 실시양태에서, 세포는 T-세포 또는 이의 전구체 또는 조혈 줄기 세포(HSC)이다. 일부 실시양태에서, 카고 서열은 T-세포 수용체 폴리펩타이드, CAR-T 폴리펩타이드, 또는 이의 단편 또는 유도체를 코딩하는 서열을 포함한다. 일부 실시양태에서, 조작된 가이드 RNA는 서열 번호 4370-4423 중 어느 하나에 대해 적어도 80%의 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 조작된 가이드 RNA는 표 5A에 열거된 상응하는 화학 변형을 포함하는 표 5A로부터의 sgRNA 1-54의 뉴클레오타이드 서열을 포함한다. 일부 실시양태에서, 조작된 가이드 RNA는 서열 번호 4334, 4350, 또는 4324 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 표적화 서열을 포함한다. 일부 실시양태에서, 조작된 가이드 RNA는 서열 번호 4388, 4404, 또는 4378 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 조작된 가이드 RNA는 표 5A로부터의 sgRNA 9, 35, 또는 19의 뉴클레오타이드 서열을 포함한다.
일부 측면에서, 본 개시내용은 (a) RNA-가이드 엔도뉴클레아제; 및 (b) 조작된 가이드 RNA로서, 조작된 가이드 RNA는 엔도뉴클레아제와 복합체를 형성하도록 구성되고, 조작된 가이드 RNA는 표적 핵산 서열에 혼성화되도록 구성된 스페이서 서열을 포함하고, 조작된 가이드 RNA는 다음 변형 (i) 조작된 가이드 RNA의 5' 말단의 처음 4 개 염기 또는 조작된 가이드 RNA의 3' 말단의 마지막 4 개 염기 내에서 적어도 하나의 뉴클레오타이드의 2'-O 메틸 또는 2'-플루오로 염기 변형; (ii) 조작된 가이드 RNA의 5' 말단의 처음 5 개 염기 중 적어도 2 개 사이의 티오포스페이트(PS) 연결 또는 조작된 가이드 RNA의 3' 말단의 마지막 5 개 염기 중 적어도 2 개 사이의 티오포스페이트 연결; (iii) 조작된 가이드 RNA의 3' 줄기 또는 5' 줄기 내의 티오포스페이트 연결; (iv) 조작된 가이드 RNA의 3' 줄기 또는 5' 줄기 내의 2'-O 메틸 또는 2'염기 변형; (v) 조작된 가이드 RNA의 스페이스 영역의 적어도 7 개 염기의 2'-플루오로 염기 변형; 및 (vi) 조작된 가이드 RNA의 루프 영역 내의 티오포스페이트 연결 중 적어도 하나를 포함하는, 조작된 가이드 RNA를 포함하는, 조작된 뉴클레아제 시스템을 제공한다. 일부 실시양태에서, 조작된 가이드 RNA는 조작된 가이드 RNA의 5' 말단의 처음 5 개 염기 또는 조작된 가이드 RNA의 3' 말단의 마지막 5 개 염기 내에 적어도 하나의 뉴클레오타이드의 2'-O 메틸 또는 2'-플루오로 염기 변형을 포함한다. 일부 실시양태에서, 조작된 가이드 RNA는 조작된 가이드 RNA의 5' 말단 또는 조작된 가이드 RNA의 3' 말단에서 2'-O 메틸 또는 2'-플루오로 염기 변형을 포함한다. 일부 실시양태에서, 조작된 가이드 RNA는 조작된 가이드 RNA의 5' 말단의 처음 5 개 염기 중 적어도 2 개 사이에 티오포스페이트(PS) 연결, 또는 조작된 가이드 RNA의 3' 말단의 마지막 5 개 염기 중 적어도 2 개 사이에 티오포스페이트 연결을 포함한다. 일부 실시양태에서, 조작된 가이드 RNA는 조작된 가이드 RNA의 3' 줄기 또는 5' 줄기 내에 티오포스페이트 연결을 포함한다. 일부 실시양태에서, 조작된 가이드 RNA는 조작된 가이드 RNA의 3' 줄기 또는 5' 줄기 내에 2'-O 메틸 염기 변형을 포함한다. 일부 실시양태에서, 조작된 가이드 RNA는 조작된 가이드 RNA의 스페이서 영역의 적어도 7 개 염기의 2'-플루오로 염기 변형을 포함한다. 일부 실시양태에서, 조작된 가이드 RNA는 조작된 가이드 RNA의 루프 영역 내에 티오포스페이트 연결을 포함한다. 일부 실시양태에서, 조작된 가이드 RNA는 조작된 가이드 RNA의 5' 말단에 적어도 3 개의 2'-O 메틸 또는 2'-플루오로 염기, 조작된 가이드 RNA의 5' 말단의 처음 3 개 염기 사이에 2 개의 티오포스페이트 연결, 조작된 가이드 RNA의 4' 말단에 적어도 4 개의 2'-O 메틸 또는 2'-플루오로 염기, 및 조작된 가이드 RNA의 3' 말단의 마지막 3 개 염기 사이에 3 개의 티오포스페이트 연결을 포함한다. 일부 실시양태에서, 조작된 가이드 RNA는 조작된 가이드 RNA의 5' 말단에 적어도 2 개의 2'-O-메틸 염기 및 적어도 2 개의 티오포스페이트 연결 및 조작된 가이드 RNA의 3' 말단에 적어도 1 개의 2'-O-메틸 염기 및 적어도 하나의 티오포스페이트 연결을 포함한다. 일부 실시양태에서, 조작된 가이드 RNA는 조작된 가이드 RNA의 3' 줄기 또는 5' 줄기 영역 둘 모두에 적어도 1 개의 2'-O-메틸 염기를 포함한다. 일부 실시양태에서, 조작된 가이드 RNA는 조작된 가이드 RNA의 시드 영역을 제외한 스페이서 영역에 적어도 1 개 내지 적어도 14 개의 2'-플루오로 염기를 포함한다. 일부 실시양태에서, 조작된 가이드 RNA는 조작된 가이드 RNA의 5' 줄기 영역에 적어도 1 개의 2'-O-메틸 염기 및 가이드 RNA의 시드 영역을 제외한 스페이서 영역에 적어도 1 개 내지 적어도 14 개의 2'-플루오로 염기를 포함한다. 일부 실시양태에서, 가이드 RNA는 VEGF-A 유전자를 표적화하는 스페이서 서열을 포함한다. 일부 실시양태에서, 가이드 RNA는 서열 번호 3985에 대해 적어도 80%의 동일성을 갖는 스페이서 서열을 포함한다. 일부 실시양태에서, 가이드 RNA는 표 7에 열거된 화학 변형을 포함하는 표 7로부터의 가이드 RNA 1-7의 뉴클레오타이드를 포함한다. 일부 실시양태에서, RNA-가이드 뉴클레아제는 Cas 엔도뉴클레아제이다. 일부 실시양태에서, Cas 엔도뉴클레아제는 클래스 2, 타입 V Cas 엔도뉴클레아제이다. 일부 실시양태에서, 클래스 2, 타입 V Cas 엔도뉴클레아제는 RuvCI 서브도메인, RuvCII 서브도메인, 및 RuvCIII 서브도메인을 포함하는 RuvC 도메인을 포함한다. 일부 실시양태에서, 클래스 2, 타입 V Cas 엔도뉴클레아제는 서열 번호 1-3470 중 어느 하나 또는 이의 변이체에 대해 적어도 75%의 서열 동일성을 갖는 엔도뉴클레아제를 포함한다. 일부 실시양태에서, 클래스 2, 타입 V Cas 엔도뉴클레아제는 서열 번호 141, 215, 229, 261, 또는 1711-1721 중 어느 하나 또는 이의 변이체에 대해 적어도 75%의 서열 동일성을 갖는 엔도뉴클레아제를 포함한다. 일부 실시양태에서, 조작된 가이드 RNA는 서열 번호 3471, 3539, 3551-3559, 3608-3609, 3612, 3636-3637, 3640-3641, 3644-3645, 3648-3649, 3652-3653, 3656-3657, 3660-3661, 3664-3667, 3671-3672, 3677-3678, 3695-3696, 3729-3730, 3734-3735, 및 3851-3857 중 어느 하나의 비-축퇴성 뉴클레오타이드에 대해 적어도 80%의 서열 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 조작된 가이드 RNA는 서열 번호 3608-3609, 3853, 또는 3851-3857 중 어느 하나의 비-축퇴성 뉴클레오타이드에 대해 적어도 80%의 서열 동일성을 갖는 서열을 포함한다.
일부 측면에서, 본 개시내용은 서열 번호 1-3470 중 어느 하나 또는 이의 변이체에 대해 적어도 75%의 서열 동일성을 갖는 이종성 엔도뉴클레아제를 코딩하는 개방형 해독틀을 포함하는 숙주 세포를 제공한다. 일부 실시양태에서, 엔도뉴클레아제는 서열 번호 141, 215, 229, 261, 또는 1711-1721 중 어느 하나 또는 이의 변이체에 대해 적어도 75%의 서열 동일성을 갖는다. 일부 실시양태에서, 숙주 세포는 이. 콜라이 세포 또는 포유동물 세포이다. 일부 실시양태에서, 숙주 세포는 이. 콜라이 세포이고, 이. 콜라이 세포는 λDE3 리소겐이거나 이. 콜라이 세포는 BL21(DE3) 균주이다. 일부 실시양태에서, 이. 콜라이 세포는 ompT lon 유전자형을 갖는다. 일부 실시양태에서, 개방형 해독틀은 T7 프로모터 서열, T7-lac 프로모터 서열, lac 프로모터 서열, tac 프로모터 서열, trc 프로모터 서열, ParaBAD 프로모터 서열, PrhaBAD 프로모터 서열, T5 프로모터 서열, cspA 프로모터 서열, araPBAD 프로모터, 파지 람다로부터의 강한 좌측 프로모터(pL 프로모터), 또는 이들의 임의의 조합에 작동 가능하게 연결된다. 일부 실시양태에서, 개방형 해독틀은 엔도뉴클레아제를 코딩하는 서열에 프레임내 연결된 친화성 태그를 코딩하는 서열을 포함한다. 일부 실시양태에서, 친화성 태그는 고정된 금속 친화성 크로마토그래피(IMAC) 태그이다. 일부 실시양태에서, IMAC 태그는 폴리히스티딘 태그이다. 일부 실시양태에서, 친화성 태그는 myc 태그, 인간 인플루엔자 헤마글루티닌(HA) 태그, 말토스 결합 단백질(MBP) 태그, 글루타티온 S-트랜스퍼라제(GST) 태그, 스트렙타비딘 태그, FLAG 태그, 또는 이들의 임의의 조합이다. 일부 실시양태에서, 친화성 태그는 프로테아제 절단 부위를 코딩하는 링커 서열을 통해 엔도뉴클레아제를 코딩하는 서열에 프레임내 연결된다. 일부 실시양태에서, 프로테아제 절단 부위는 담배 식각 바이러스(TEV) 프로테아제 절단 부위, PreScission® 프로테아제 절단 부위, 트롬빈 절단 부위, 인자 Xa 절단 부위, 엔테로키나제 절단 부위, 또는 이들의 임의의 조합이다. 일부 실시양태에서, 개방형 해독틀은 숙주 세포에서의 발현을 위해 코돈-최적화된다. 일부 실시양태에서, 개방형 해독틀은 벡터 상에 제공된다. 일부 실시양태에서, 개방형 해독틀은 숙주 세포의 게놈에 통합된다.
일부 측면에서, 본 개시내용은 상용성 액체 배지에 본원에 기재된 임의의 숙주 세포를 포함하는 배양물을 제공한다.
일부 측면에서, 본 개시내용은 상용성 성장 배지에서 본원에 기재된 임의의 숙주 세포를 배양하는 것을 포함하는, 엔도뉴클레아제를 제조하는 방법을 제공한다. 일부 실시양태에서, 방법은 엔도뉴클레아제의 발현을 유도하는 것을 추가로 포함한다. 일부 실시양태에서, 뉴클레아제의 발현 유도는 추가의 화학 제제 또는 증가된 양의 영양소의 첨가에 의해, 또는 온도 증가 또는 감소에 의해 이루어진다. 일부 실시양태에서, 추가의 화학 제제 또는 증가된 양의 영양소는 이소프로필 β-D-1-티오갈락토피라노시드(IPTG) 또는 추가량의 락토스를 포함한다. 일부 실시양태에서, 방법은 배양 후 숙주 세포를 단리하고 숙주 세포를 용해시켜 단백질 추출물을 제조하는 것을 추가로 포함한다. 일부 실시양태에서, 방법은 엔도뉴클레아제를 단리하는 것을 추가로 포함한다. 일부 실시양태에서, 단리는 단백질 추출물을 IMAC, 이온-교환 크로마토그래피, 음이온 교환 크로마토그래피, 또는 양이온 교환 크로마토그래피에 적용하는 것을 포함한다. 일부 실시양태에서, 개방형 해독틀은 엔도뉴클레아제를 코딩하는 서열에 프레임내 연결된 친화성 태그를 코딩하는 서열을 포함한다. 일부 실시양태에서, 친화성 태그는 프로테아제 절단 부위를 코딩하는 링커 서열을 통해 엔도뉴클레아제를 코딩하는 서열에 프레임내 연결된다. 일부 실시양태에서, 프로테아제 절단 부위는 담배 식각 바이러스(TEV) 프로테아제 절단 부위, PreScission® 프로테아제 절단 부위, 트롬빈 절단 부위, 인자 Xa 절단 부위, 엔테로키나제 절단 부위, 또는 이들의 임의의 조합을 포함한다. 일부 실시양태에서, 방법은 프로테아제 절단 부위에 상응하는 프로테아제를 엔도뉴클레아제에 접촉시킴으로써 친화성 태그를 절단하는 것을 추가로 포함한다. 일부 실시양태에서, 친화성 태그는 IMAC 친화성 태그이다. 일부 실시양태에서, 방법은 엔도뉴클레아제를 포함하는 조성물로부터 친화성 태그를 제거하기 위해 감산 IMAC 친화성 크로마토그래피를 수행하는 것을 추가로 포함한다.
일부 측면에서, 본 개시내용은 (a) 3- 또는 4-뉴클레오타이드 PAM 서열에 결합하도록 구성된 클래스 2, 타입 V-A Cas 엔도뉴클레아제로서, 엔도뉴클레아제는 sMbCas12a에 비해 증가된 절단 활성을 갖는, 엔도뉴클레아제; 및 (b) 조작된 가이드 RNA로서, 조작된 가이드 RNA는 클래스 2, 타입 V-A Cas 엔도뉴클레아제와 복합체를 형성하도록 구성되고, 조작된 가이드 RNA는 표적 핵산 서열을 포함하는 표적 핵산에 혼성화하도록 구성된 스페이서 서열을 포함하는, 조작된 가이드 RNA를 포함하는, 시스템을 제공한다. 일부 실시양태에서, 절단 활성은 표적 핵산을 포함하는 세포에 상용성 가이드 RNA와 함께 엔도뉴클레아제를 도입하고 세포에서 표적 핵산 서열의 절단을 검출함으로써 시험관 내에서 측정된다. 일부 실시양태에서, 클래스 2, 타입 V-A Cas 엔도뉴클레아제는 서열 번호 215-225 중 어느 하나 또는 이의 변이체에 대해 적어도 75%의 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 조작된 가이드 RNA는 서열 번호 3609의 비-축퇴성 뉴클레오타이드에 대해 적어도 80%의 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 표적 핵산은 표적 핵산 서열에 근접한 YYN PAM 서열을 추가로 포함한다. 일부 실시양태에서, 클래스 2, 타입 V-A Cas 엔도뉴클레아제는 sMbCas12a에 비해 적어도 약 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 또는 200% 또는 그를 초과하여 증가된 활성을 갖는다.
일부 측면에서, 본 개시내용은 (a) 클래스 2, 타입 V-A' Cas 엔도뉴클레아제; 및 (b) 조작된 가이드 RNA로서, 조작된 가이드 RNA는 클래스 2, 타입 V Cas 엔도뉴클레아제의 천연 이펙터 반복부 서열의 약 19 개 내지 약 25 개 또는 약 19 내지 약 31 개의 연속 뉴클레오타이드에 대해 적어도 80%의 동일성을 갖는 서열을 포함하는, 조작된 가이드 RNA를 포함하는, 시스템을 제공한다. 일부 실시양태에서, 천연 이펙터 반복부 서열은 서열 번호 3560-3572 중 어느 하나이다. 일부 실시양태에서, 클래스 2, 타입 V-A' Cas 엔도뉴클레아제는 서열 번호 126에 대해 적어도 75%의 동일성을 갖는다.
일부 측면에서, 본 개시내용은 (a) 클래스 2, 타입 V-L 엔도뉴클레아제; 및 (b) 조작된 가이드 RNA로서, 조작된 가이드 RNA는 클래스 2, 타입 V Cas 엔도뉴클레아제의 천연 이펙터 반복부 서열의 약 19 개 내지 약 25 개 또는 약 19 개 내지 약 31 개의 연속 뉴클레오타이드에 대해 적어도 80%의 동일성을 갖는 서열을 포함하는, 조작된 가이드 RNA를 포함하는, 시스템을 제공한다. 일부 실시양태에서, 클래스 2, 타입 V-L 엔도뉴클레아제는 서열 번호 793-1163 중 어느 하나에 대해 적어도 75%의 서열 동일성을 갖는다.
일부 측면에서, 본 개시내용은 (a) 클래스 2, 타입 V Cas 엔도뉴클레아제; 및 (b) 조작된 가이드 RNA로서, 조작된 가이드 RNA는 엔도뉴클레아제와 복합체를 형성하도록 구성되고, 조작된 가이드 RNA는 VEGF-A 유전자좌의 영역에 혼성화하도록 구성된 스페이서 서열을 포함하고, 조작된 가이드 RNA는 서열 번호 3985에 대해 적어도 80%의 동일성을 갖는 표적화 서열을 포함하거나, 조작된 가이드 RNA는 표 7로부터의 가이드 RNA 1-7 중 어느 하나의 뉴클레오타이드 서열을 포함하는, 조작된 가이드 RNA를 세포에 도입하는 것을 포함하는, 세포에서 VEGF-A 유전자좌를 파괴하는 방법을 제공한다. 일부 실시양태에서, 클래스 2, 타입 V Cas 엔도뉴클레아제는 서열 번호 1-3470 중 어느 하나 또는 이의 변이체에 대해 적어도 75%의 서열 동일성을 갖는 엔도뉴클레아제를 포함한다. 일부 실시양태에서, 클래스 2, 타입 V Cas 엔도뉴클레아제는 서열 번호 141, 215, 229, 261, 또는 1711-1721 중 어느 하나 또는 이의 변이체에 대해 적어도 75%의 서열 동일성을 갖는 엔도뉴클레아제를 포함한다. 일부 실시양태에서, 조작된 가이드 RNA는 서열 번호 3471, 3539, 3551-3559, 3608-3609, 3612, 3636-3637, 3640-3641, 3644-3645, 3648-3649, 3652-3653, 3656-3657, 3660-3661, 3664-3667, 3671-3672, 3677-3678, 3695-3696, 3729-3730, 3734-3735, 및 3851-3857 중 어느 하나의 비-축퇴성 뉴클레오타이드에 대해 적어도 80%의 서열 동일성을 갖는 서열을 포함한다. 일부 실시양태에서, 조작된 가이드 RNA는 서열 번호 3608-3609, 3853, 또는 3851-3857 중 어느 하나의 비-축퇴성 뉴클레오타이드에 대해 적어도 80%의 서열 동일성을 갖는 서열을 포함한다.
일부 측면에서, 본 개시내용은 (a) 서열 번호 215-225 중 어느 하나 또는 이의 변이체에 대해 적어도 75%의 동일성을 갖는 클래스 2, 타입 V Cas 엔도뉴클레아제; 및 (b) 조작된 가이드 RNA로서, 조작된 가이드 RNA는 엔도뉴클레아제와 복합체를 형성하도록 구성되고, 조작된 가이드 RNA는 유전자좌의 영역에 혼성화하도록 구성된 스페이서 서열을 포함하는, 조작된 가이드 RNA를 포함하는 조성물을 세포에 접촉시키는 것을 포함하는, 세포에서 유전자좌를 파괴하는 방법으로서, 클래스 2, 타입 V Cas 엔도뉴클레아제는 세포에서 spCas9에 대해 적어도 동등한 절단 활성을 갖는, 방법을 제공한다. 일부 실시양태에서, 절단 활성은 표적 핵산을 포함하는 세포에 상용성 가이드 RNA와 함께 엔도뉴클레아제를 도입하고 세포에서 표적 핵산 서열의 절단을 검출함으로써 시험관 내에서 측정된다. 일부 실시양태에서, 조성물은 20 pmol 이하의 클래스 2, 타입 V Cas 엔도뉴클레아제를 포함한다. 일부 실시양태에서, 조성물은 1 pmol 이하의 클래스 2, 타입 V Cas 엔도뉴클레아제를 포함한다.
본 개시내용의 추가의 측면 및 이점은 본 개시내용의 예시적인 실시양태만이 제시되고 설명되는 다음의 상세한 설명으로부터 관련 기술 분야의 통상의 기술자에게 용이하게 명백해질 것이다. 알 수 있는 바와 같이, 본 개시내용은 다른 및 상이한 실시양태가 가능하고, 이의 여러 세부사항은 모두 개시내용으로부터 벗어나지 않으면서 다양한 명백한 측면에서 변형될 수 있다. 따라서, 도면 및 설명은 본질적으로 예시적인 것으로 간주되어야 하며, 제한적인 것으로 간주되지 않아야 한다.
참조에 의한 포함
본 명세서에 언급된 모든 간행물, 특허 및 특허 출원은 마치 각각의 개별 간행물, 특허 또는 특허 출원이 참조로 포함된다고 구체적이고 개별적으로 표시된 것과 동일한 정도로 본원에 참조로 포함된다.
본 발명의 신규한 특징은 특히 첨부된 청구범위에서 제시된다. 본 발명의 특징 및 이점에 대한 더 나은 이해는 본 발명의 원리가 활용되는 예시적인 실시양태를 제시하는 다음의 상세한 설명, 및 첨부 도면을 참조하여 얻어질 것이다.
도 1은 본 개시내용 전에 이전에 기재된 상이한 클래스 및 타입의 CRISPR/Cas 유전자좌의 전형적인 조직을 도시한 것이다.
도 2는 본원에 기재된 MG 뉴클레아제의 환경 분포를 도시한 것이다. MG29 단백질 패밀리의 대표에 대한 단백질 길이가 나타나 있다. 원의 음영은 각 단백질이 확인된 환경 또는 환경 유형을 나타낸다(진회색 원은 고온 환경 공급원을 나타내고; 연회색 원은 비-고온 환경 공급원을 나타낸다). N/A는 샘플이 수집된 환경의 유형을 알 수 없음을 나타낸다.
도 3은 본원에 기재된 샘플 유형(예를 들어, 도 2)으로부터 검출된 MG 뉴클레아제에 존재하는 예측 촉매 잔기의 수를 도시한 것이다. MG29 단백질 패밀리의 대표에 대한 단백질 길이가 나타나 있다. 각 단백질에 대해 예측된 촉매 잔기의 수는 도면 범례에 나타나 있다(3.0 개 잔기). 제1, 제2 및 제3 촉매 잔기는 각각 RuvCI 도메인, RuvCII 도메인 및 RuvCIII 도메인에 위치한다.
도 4는 CRISPR 타입 V-A 이펙터의 다양성을 보여준다. 도 4a는 신규한 타입 V-A 이펙터를 코딩하는 콘티그의 생물분류학적 분류의 패밀리당 분포를 도시한 것이다. 도 4b는 119 개의 신규 및 89 개의 참조 타입 V 이펙터 서열의 정렬로부터 추론된 유전자 계통수를 도시한 것이다. MG 패밀리는 괄호로 표시된다. 활성 뉴클레아제에 대한 PAM 요건은 패밀리와 관련된 박스에 요약되어 있다. 비-타입 V-A 참조 서열을 사용하여 계통수를 조사하였다(*MG61 패밀리는 대안적인 줄기-루프 서열을 갖는 crRNA를 필요로 함).
도 5는 본원에 기재된 뉴클레아제에 대한 다양한 특징적인 정보를 제공한다. 도 5a는 이펙터 단백질 길이 및 샘플 유형의 패밀리당 분포를 도시한 것이고; 도 5b는 RuvC 촉매 잔기의 존재를 보여주는 것이다. 도 5c는 다양한 반복부 모티프를 갖는 CRISPR 어레이의 수를 보여주는 것이다. 도 5d는 반복부 모티프의 패밀리당 분포를 도시한 것이다.
도 6은 타입 V-A 서열에서 촉매 및 PAM 상호작용 영역의 다중 서열 정렬을 도시한 것이다. 프란시셀라 노비시다(Francisella novicida) Cas12a(FnCas12)는 참조 서열이다. 다른 참조 서열은 아시다미노코쿠스(Acidaminococcus) 종(AsCas12a), 모락셀라 보보쿨리(Moraxella bovoculi)(MbCas12a), 및 라크노스피라세아이 박테리움(Lachnospiraceae bacterium) ND2006(LbCas12a)이다. 도 6a는 RuvC-I(좌측), RuvC-II(중간), 및 RuvC-III(우측) 영역에서 DED 촉매 잔기 주위의 보존 블록을 보여주는 것이다. 도 6b는 PAM 인식 및 상호작용에 관여하는 잔기를 함유하는 WED-II 및 PAM 상호작용 영역을 보여주는 것이다. FnCas12a 서열 아래의 회색 박스는 도메인을 식별한다. 정렬에서 박스가 어두울수록 증가된 서열 동일성을 나타낸다. FnCas12a 서열 상의 검정색 박스는 참조 서열의 촉매 잔기(및 위치)를 나타낸다. 회색 박스는 정렬의 상단에서 참조 서열의 도메인(FnCas12a)을 나타낸다. 검정색 박스는 참조 서열의 촉매 잔기(및 위치)를 나타낸다.
도 7은 타입 V-A 및 관련 V-A' 이펙터를 도시한 것이다. 도 7a는 전사 방향을 가리키는 화살표로 표시된 타입 V-A(MG26-1) 및 V-A'(MG26-2)를 보여주는 것이다. CRISPR 어레이는 회색 막대로 표시된다. 콘티그의 각 단백질에 대한 예측된 도메인은 박스로 표시된다. 도 7b는 타입 V-A' MG26-2 및 AsCas12a 참조 서열의 서열 정렬을 보여주는 것이다. 상단: RuvC-I 도메인. 중간: RuvC-I 및 RuvC-II 촉매 잔기를 함유하는 영역. 하단: RuvC-III 촉매 잔기를 함유하는 영역. 촉매 잔기는 사각형으로 표시된다.
도 8은 AacC2C1과의 삼원 복합체에서 sgRNA 및 표적 DNA의 구조의 개략도를 도시한 것이다(그 전체가 본원에 참조로 포함되는 문헌[Yang, Hui, Pu Gao, Kanagalaghatta R. Rajashankar, and Dinshaw J. Patel. 2016. "PAM-Dependent Target DNA Recognition and Cleavage by C2c1 CRISPR-Cas Endonuclease." Cell 167 (7): 1814-28.e12] 참조).
도 9는 선형 플라스미드 DNA의 AacC2c1-매개 절단에 대한 sgRNA; WT, 야생형 sgRNA의 R-AR 도메인에서의 돌연변이 또는 절단의 효과를 도시한 것이다. sgRNA(레인 1-5) 내의 돌연변이체 뉴클레오타이드는 좌측 패널에 강조되어 있다. Δ15: 15 nt가 sgRNA R-AR 1 영역으로부터 결실. Δ12: 12 nt가 sgRNA J2/4 R-AR 1 영역으로부터 제거(그 전체가 본원에 참조로 포함되는 문헌[Liu, Liang, Peng Chen, Min Wang, Xueyan Li, Jiuyu Wang, Maolu Yin, and Yanli Wang. 2017. "C2c1-sgRNA Complex Structure Reveals RNA-Guided DNA Cleavage Mechanism." Molecular Cell 65 (2): 310-22] 참조).
도 10은 타입 V-A 시스템 중에서 보존되는 CRISPR RNA(crRNA) 구조를 도시한 것이다. 도 10a는 LbCpf1 시스템에서 참조 crRNA 서열의 폴드 구조를 보여주는 것이다. 도 10b는 신규한 타입 V-A 시스템과 관련된 CRISPR 반복부의 다중 서열 정렬을 보여주는 것이다. LbCpf1 가공 부위는 검정색 막대로 표시된다. 도 10c는 대안적인 줄기-루프 모티프 CCUGC[N3-4]GCAGG를 갖는 MG61-2 추정 crRNA의 폴드 구조를 보여주는 것이다. 도 10d는 대안적인 반복부 모티프 서열을 갖는 CRISPR 반복부의 다중 서열 정렬을 보여주는 것이다. 가공 부위 및 루프가 표시된다.
도 11은 본원에서 사용된 가이드 RNA(서열 번호 3608)의 예측 구조를 도시한 것이다.
도 12는 본원에 기재된 MG 효소의 상응하는 sgRNA의 예측 구조를 도시한 것이다(시계 방향, 서열 번호 3636, 3637, 3641, 3640).
도 13은 본원에 기재된 MG 효소의 상응하는 sgRNA의 예측 구조를 도시한 것이다(시계 방향, 서열 번호 3644, 3645, 3649, 3648).
도 14는 본원에 기재된 MG 효소의 상응하는 sgRNA의 예측 구조를 도시한 것이다(시계 방향, 서열 번호 3652, 3653, 3657, 3656).
도 15는 본원에 기재된 MG 효소의 상응하는 sgRNA의 예측 구조를 도시한 것이다(시계 방향, 서열 번호 3660, 3661, 3665, 3664).
도 16은 본원에 기재된 MG 효소의 상응하는 sgRNA의 예측 구조를 도시한 것이다(시계 방향, 서열 번호 3666, 3667, 3672, 3671).
도 17은 다양한 MG 패밀리 뉴클레아제 및 이들의 상응하는 tracrRNA 또는 sgRNA(실시예 12에 기재된 바와 같음)를 함유하는 TXTL 추출물의 존재 하에 PAM 벡터 라이브러리 절단의 결과를 보여주는 아가로스 겔을 도시한 것이다.
도 17a는 레인 1: 래더를 보여준다. 밴드는, 위에서 아래로, 766, 500, 350, 300, 350, 200, 150, 100, 75, 50; 레인 2: 28-1 +MGcrRNA 스페이서1(서열 번호 141 + 3860); 레인 3: 29-1 +MGcrRNA 스페이서1(서열 번호 215 + 3860); 레인 4: 30-1 +MGcrRNA 스페이서1(서열 번호 226 + 3860); 레인 5: 31-1 +MGcrRNA 스페이서1(서열 번호 229 + 3860); 레인 6: 32-1 +MGcrRNA 스페이서1(서열 번호 261 + 3860); 레인 7: 래더이다. 도 17b는 레인 1: 래더; 레인 2: LbaCas12a + LbaCas12a crRNA 스페이서2; 레인 3: LbaCas12a + MGcrRNA 스페이서2; 레인 4: Apo 13-1; 레인 5: 28-1 +MGcrRNA 스페이서2 (서열 번호 141 + 3861); 레인 6: 29-1 + MGcrRNA 스페이서2 (서열 번호 215 + 3861); 레인 7: 30-1 + MGcrRNA 스페이서2 (서열 번호 226 + 3861); 레인 8: 31-1 + MGcrRNA 스페이서2 (서열 번호 229 + 3861); 레인 9: 32-1 + MGcrRNA 스페이서2 (서열 번호 261 +3861)를 보여준다.
도 18은 본원에 기재된 타입 V-A 이펙터가 활성 뉴클레아제임을 보여준다.
도 17a는 레인 1: 래더를 보여준다. 밴드는, 위에서 아래로, 766, 500, 350, 300, 350, 200, 150, 100, 75, 50; 레인 2: 28-1 +MGcrRNA 스페이서1(서열 번호 141 + 3860); 레인 3: 29-1 +MGcrRNA 스페이서1(서열 번호 215 + 3860); 레인 4: 30-1 +MGcrRNA 스페이서1(서열 번호 226 + 3860); 레인 5: 31-1 +MGcrRNA 스페이서1(서열 번호 229 + 3860); 레인 6: 32-1 +MGcrRNA 스페이서1(서열 번호 261 + 3860); 레인 7: 래더이다. 도 17b는 레인 1: 래더; 레인 2: LbaCas12a + LbaCas12a crRNA 스페이서2; 레인 3: LbaCas12a + MGcrRNA 스페이서2; 레인 4: Apo 13-1; 레인 5: 28-1 +MGcrRNA 스페이서2 (서열 번호 141 + 3861); 레인 6: 29-1 + MGcrRNA 스페이서2 (서열 번호 215 + 3861); 레인 7: 30-1 + MGcrRNA 스페이서2 (서열 번호 226 + 3861); 레인 8: 31-1 + MGcrRNA 스페이서2 (서열 번호 229 + 3861); 레인 9: 32-1 + MGcrRNA 스페이서2 (서열 번호 261 +3861)를 보여준다.
도 18a는 본원에 기재된 6 개의 뉴클레아제에 대해 결정된 PAM 서열의 seqLogo 도식을 나타낸 것이다.
도 17a는 레인 1: 래더를 보여준다. 밴드는, 위에서 아래로, 766, 500, 350, 300, 350, 200, 150, 100, 75, 50; 레인 2: 28-1 +MGcrRNA 스페이서1(서열 번호 141 + 3860); 레인 3: 29-1 +MGcrRNA 스페이서1(서열 번호 215 + 3860); 레인 4: 30-1 +MGcrRNA 스페이서1(서열 번호 226 + 3860); 레인 5: 31-1 +MGcrRNA 스페이서1(서열 번호 229 + 3860); 레인 6: 32-1 +MGcrRNA 스페이서1(서열 번호 261 + 3860); 레인 7: 래더이다. 도 17b는 레인 1: 래더; 레인 2: LbaCas12a + LbaCas12a crRNA 스페이서2; 레인 3: LbaCas12a + MGcrRNA 스페이서2; 레인 4: Apo 13-1; 레인 5: 28-1 +MGcrRNA 스페이서2 (서열 번호 141 + 3861); 레인 6: 29-1 + MGcrRNA 스페이서2 (서열 번호 215 + 3861); 레인 7: 30-1 + MGcrRNA 스페이서2 (서열 번호 226 + 3861); 레인 8: 31-1 + MGcrRNA 스페이서2 (서열 번호 229 + 3861); 레인 9: 32-1 + MGcrRNA 스페이서2 (서열 번호 261 +3861)를 보여준다.
도 18b는 활성 뉴클레아제에 대한 인델 편집의 빈도로부터 추론된 플라스미드 형질감염 활성 검정의 박스플롯을 보여주는 것이다. 박스플롯의 경계는 제1 및 제3 사분위수 값을 나타낸다. 평균은 "x"로 표시되고 중앙값은 각 박스 내의 중간선으로 표현된다. 도 18c는 MG29-1 및 AsCas12a에 대한 4 개의 표적 부위에서 플라스미드 형질감염 편집 빈도를 보여주는 것이다. AsCas12a로의 하나의 병행 실험이 수행되었다. 도 18d는 TTN 또는 CCN PAM을 갖는 14 개의 표적 유전자좌에서 뉴클레아제 MG29-1에 대한 플라스미드 및 RNP 편집 활성을 보여주는 것이다. 도 18e는 RNP 형질감염 검정으로부터의 뉴클레아제 MG29-1의 편집 프로파일을 보여주는 것이다. AsCas12a로의 하나의 병행 실험이 수행되었다. MG29-1에 대한 편집 빈도 및 프로파일 실험을 이중으로 수행하였다. 막대 플롯 도 18c 및 도 18d는 하나의 표준 편차 오차 막대를 갖는 평균 편집 빈도를 보여주는 것이다.
도 19는 인간 게놈에서 다양한 위치를 표적화하는 다양한 상이한 표적화 서열을 함유하는 이들의 상응하는 sgRNA와 함께 실시예 12에 기재된 MG29-1 작제물로의 HEK 세포 형질감염에 의해 생성된 세포 인델 형성을 도시한 것이다.
도 20은 본원에 기재된 바와 같은(실시예 13에 기재된 바와 같은) NGS를 통해 유래된 특정 MG 패밀리 효소의 PAM 서열의 seqLogo 도식을 나타낸 것이다.
도 21은 본원에 기재된 바와 같은 NGS를 통해 유래된 특정 MG 패밀리 효소의 PAM 서열의 seqLogo 도식을 나타낸 것이다(위에서 아래로, 서열 번호 3865, 3867, 3872).
도 22는 본원에 기재된 바와 같은 NGS를 통해 유래된 PAM 서열의 seqLogo 도식을 나타낸 것이다(위에서 아래로, 서열 번호 3879, 3880, 3881).
도 23은 본원에 기재된 바와 같은 NGS를 통해 유래된 PAM 서열의 seqLogo 도식을 나타낸 것이다(위에서 아래로, 서열 번호 3883, 3884, 3885).
도 24는 본원에 기재된 바와 같은 NGS를 통해 유래된 PAM 서열의 seqLogo 도식을 나타낸 것이다(서열 번호 3882).
도 25는 인간 게놈에서 다양한 위치를 표적화하는 다양한 상이한 표적화 서열을 함유하는 이들의 상응하는 sgRNA와 함께 실시예 14에 기재된 MG31-1 작제물로의 HEK 세포 형질감염에 의해 생성된 세포 인델 형성을 도시한 것이다.
도 26은 타입 V-A 뉴클레아제의 생화학적 특성화를 보여주는 것이다. 도 26a는 어댑터가 말단에 라이게이션된 절단 산물의 PCR이 범용 crRNA에 결합될 때 본원에 기재된 뉴클레아제 및 Cpf1(양성 대조)의 활성을 나타내는 것을 보여주는 것이다. 예상 절단 산물 밴드는 화살표로 표시되었다. 도 26b는 어댑터가 말단에 라이게이션된 절단 산물의 PCR이 이들의 천연 crRNA에 결합될 때 본원에 기재된 뉴클레아제의 활성을 나타내는 것을 보여주는 것이다. 절단 산물 밴드는 화살표로 표시되었다. 도 26c는 NGS 절단 부위의 분석이 위치 22에서 표적 가닥 상의 절단을 나타내며, 때때로 21 nt 또는 23 nt 후에 덜 빈번한 절단을 나타낸다는 것을 보여준다.
도 27은 (A) 타입 V-L 뉴클레아제에 대한 예시적인 유전자좌 조직화, 및 (B) 다중 서열 정렬을 보여주는 본원에 기재된 타입 V-L 뉴클레아제의 다중 서열 정렬을 도시한 것이다. 추정 RuvC-III 도메인을 함유하는 영역은 연회색 직사각형으로 도시되어 있다. 추정 RuvC 촉매 잔기는 각 서열 위에 작은 진회색 직사각형으로 도시되어 있다. 추정 단일-가이드 RNA 결합 서열은 작은 백색 직사각형이고, 추정 분열형 포스페이트 결합 부위는 서열 위의 검정색 직사각형으로 표시되고, 표적 서열의 분리형 포스페이트 부근에서 염기 스태킹을 방해할 것으로 예측되는 잔기는 서열 위의 작은 중간-회색 직사각형으로 표시된다.
도 28은 이펙터 반복부 구조와 함께 예시적인 유전자좌 조직화로서 MG60으로 표지된 타입 V-L 후보 및 타입 V 패밀리에서 효소의 위치를 보여주는 계통수를 보여주는 것이다.
도 29는 더 작은 타입 V 이펙터의 예를 보여주는 것이고, 이 중 하나는 MG70으로 표지될 수 있다.
도 30은 본원에 기재된 바와 같은 MG70의 특징적인 정보를 보여주는 것이다. 타입 V 패밀리에서 이러한 효소의 위치를 예시하는 계통수와 함께 예시적인 유전자좌 조직화가 도시되어 있다.
도 31은 본원에 기재된 바와 같은 소형 타입 V 이펙터 MG81의 또 다른 예를 보여주는 것이다. 타입 V 패밀리에서 이러한 효소의 위치를 예시하는 계통수와 함께 예시적인 유전자좌 조직화가 도시되어 있다.
도 32는 본원에서 확인된 타입 V 이펙터 패밀리(예를 들어, MG20, MG60, MG70 등)의 개별 효소의 활성이 다양한 상이한 효소 길이(예를 들어, 400-1200 AA)에 걸쳐 유지된다는 것을 보여준다. 연한 점(참)은 활성 효소를 나타내는 반면, 진한 점(미지)은 시험되지 않은 효소를 나타낸다.
도 33은 본원에 기재된 MG 뉴클레아제의 서열 보존을 도시한 것이다. 검정색 막대는 추정 RuvC 촉매 잔기를 나타낸다.
도 34 및 도 35는 추정 RuvC 촉매 잔기(진회색 직사각형), 분리형 포스페이트-결합 잔기(검정색 직사각형), 및 분리형 포스페이트에 인접한 염기 스태킹을 방해할 것으로 예상되는 잔기(연회색 직사각형)를 함유하는 본원에 기재된 MG 뉴클레아제의 영역의 도 33에서의 다중 서열 정렬의 확장 버전을 도시한 것이다.
도 36은 추정 RuvC-III 도메인 및 촉매 잔기를 함유하는 본원에 기재된 MG 뉴클레아제의 영역을 도시한 것이다.
도 37은 추정 단일-가이드 RNA-결합 잔기를 함유하는 MG 뉴클레아제의 영역(서열 위의 백색 직사각형)을 도시한 것이다.
도 38은 여러 MG 타입 V 패밀리로부터의 대표의 다중 단백질 서열 정렬을 도시한 것이다. 뉴클레아제 활성에 관여하는 것으로 예측되는 RuvC 도메인의 일부를 함유하는 보존된 영역이 도시되어 있다. 예측 촉매 잔기가 강조되어 있다.
도 39는 MG29-1 유전자 편집을 위한 TRAC 유전자좌의 스크린을 보여주는 것이다. 막대 그래프는 일차 인간 T 세포에서 TRAC 유전자좌를 표적화하는 54 개의 별도의 가이드 RNA로의 MG29-1 형질감염으로 인해 야기된 인델 생성을 보여준다. 도면에 도시되어 있는 상응하는 가이드 RNA는 서열 번호 4316-4423에서 확인된다.
도 40은 TRAC에서 MG29-1 편집의 최적화를 도시한 것이다. 막대 그래프는 도 39(9, 19, 25, 및 35)로부터의 4 개의 최상의 22 nt 가이드 RNA로 MG29-1(표시된 농도에서)의 형질감염으로 인해 야기된 인델 생성을 보여준다. 범례: MG29-1 9는 MG29-1 이펙터(서열 번호 215) 및 가이드 9(서열 번호 4378)이고, MG29-1 19는 MG29-1 이펙터(서열 번호 215) 및 가이드 19(서열 번호 4388)이고, MG29-1 25는 MG29-1 이펙터(서열 번호 215) 및 가이드 25(서열 번호 4394)이고, MG29-1 35는 MG29-1 이펙터(서열 번호 215) 및 가이드 35(서열 번호 4404)이다.
도 41은 TRAC에서 MG29-1 편집을 위한 용량 및 가이드 길이의 최적화를 도시한 것이다. 선 그래프는 MG29-1 및 가이드 RNA #19(서열 번호 4388) 또는 가이드 RNA #35(서열 번호 4404)의 형질감염으로 인해 야기된 인델 생성을 보여준다. 3 개의 상이한 용량의 뉴클레아제/가이드 RNA를 사용하였다. 각각의 용량에 대해, 서열 번호 4388 및 4404의 연속적인 1-뉴클레오타이드 3' 절개인 6 개의 상이한 가이드 길이를 시험하였다. 도 39 및 도 40에 사용된 가이드는 이러한 경우에 22 nt-길이 스페이서-함유 가이드이다.
도 42는 실시예 22의 실험에서 TRAC에서의 인델 생성과 T 세포 수용체 발현의 손실의 상관관계를 보여준다.
도 43은 MG29-1 절단에 의해 자극된 TRAC에서의 표적화된 트랜스진 통합을 도시한 것이다. AAV 감염에 의해 트랜스진 공여체만을 수용한 세포는 TCR 발현을 보유하고 CAR 발현이 결여되고; MG29-1 RNP로 형질감염되고 100,000 vg(벡터 게놈)의 CAR 트랜스진 공여체로 감염된 세포는 TCR 발현을 상실하고 CAR 발현을 얻는다. CAR-T-함유 공여체 서열을 함유하는 단독의 AAV("AAV"); MG29-1 효소 및 sgRNA 19와 CAR-T-함유 공여체 서열을 함유하는 AAV(서열 번호 4388)(22 개의 뉴클레오타이드 스페이서를 포함하는 "AAV+MG29-1-19-22"), 또는 MG29-1 효소 및 sgRNA 35와 CAR-T-함유 공여체 서열을 포함하는 AAV(서열 번호 4404)(22 개의 뉴클레오타이드 스페이서를 포함하는 "AAV+MG29-1-35-22")로 형질감염된 세포에 대한 CAR 항원 결합 대 TCR 발현의 FACS 플롯이 나타나 있다.
도 44는 조혈 줄기 세포에서 TRAC에서의 MG29-1 유전자 편집을 보여주는 것이다. 막대 그래프는 모의-형질감염된 세포와 비교하여 MG29-1-9-22("MG29-1 9"; MG29-1 + 가이드 RNA #19) 및 MG29-1-35-22("MG29-1 35"; MG29-1 + 가이드 RNA #35)로의 형질감염 후 TRAC에서의 인델 생성의 정도를 보여준다.
도 45는 세포에서 유전자 편집 결과의 분석에 기반한 MG29-1 PAM의 정제를 보여주는 것이다. 5'-NTTN-3' PAM 서열을 사용하여 가이드 RNA를 설계한 다음, 관찰된 유전자 편집 활성에 따라 분류하였다. 밑줄 친 염기(5'-근위 N)의 동일성이 각 빈에 대해 나타나 있다. 10% 초과의 활성을 갖는 모든 가이드는 게놈 DNA에서 이 위치에서 T를 가졌는데, 이는 MG29-1 PAM이 5'-TTTN-3'으로 가장 잘 나타날 수 있다는 것을 지시한다. 이 위치에서 T의 과잉-표시의 통계적 유의성이 각 빈에 대해 나타나 있다.
도 46은 MG29-1 스페이서 서열의 염기 조성 대비 유전자 편집 활성의 분석을 도시한 것이다. 막대 그래프는 GC 함량(%)과 인델 빈도 사이의 관계를 예시하는 실험 데이터를 보여준다("높음"은 >50%의 인델(N = 4)를 의미하고; "중간"은 10-50%의 인델(N = 15)를 의미하고; "> 1%"는 1-5%의 인델(N = 12)을 의미하고; "<1%"는 1% 미만의 인델(N = 82)을 의미한다).
도 47은 MG29-1 가이드 RNA 화학 변형을 도시한 것이다. 막대 그래프는 비변형 가이드 RNA(샘플 #1)에 대한 VEGF-A 편집 활성에 대한 표 7의 변형 결과를 보여준다.
도 48은 다양하게 화학적으로 변형된 MG29-1 RNA의 용량 적정을 도시한 것이다. 막대 그래프는 변형 패턴 1, 4, 5, 7, 및 8을 사용한 가이드로 RNP의 형질감염 후 인델 생성을 보여준다. RNP 용량은 126 pmol의 MG29-1 및 160 pmol의 가이드 RNA 또는 표시된 바와 같았다. 전체 용량(A), 1/4(B), 1/8(C), 1/16(D), 및 1/32(E).
도 49는 pMG450(lac 유도성 tac 프로모터 이. 콜라이 BL21 발현 벡터에서 MG29-1 뉴클레아제 단백질)의 플라스미드 맵을 도시한 것이다.
도 50은 마우스 알부민 인트론 1을 표적화하는 가이드를 갖는 spCas9와 비교한 스페이서 mALb29-1-8을 갖는 MG29-1(서열 번호 3999)의 인델 프로파일을 도시한 것이다.
도 51은 실시예 29에서와 같이 차세대 시퀀싱(대략 15,000 개의 총 판독 분석)에 의해 결정된 마우스 알부민 인트론 1을 표적화하는 가이드를 갖는 MG29-1의 대표적인 인델 프로파일이다.
도 52는 실시예 29에서와 같이 RNP로 뉴클레오펙션된 마우스 간 세포주 Hepa1-6에서 spCas9와 비교한 MG29-1의 편집 효율을 보여준다.
도 53은 야생형 MG29-1과 비교하여 단일 및 이중 아미노산 치환을 갖는 MG29-1 변이체의 포유동물 세포에서의 편집 효율을 보여준다. 도 53a는 MG29-1 WT 또는 돌연변이체 버전을 코딩하는 플라스미드로 형질감염된 Hepa 1-6 세포에서의 편집 효율을 도시한 것이다. 도 53b는 다양한 농도에서 WT 또는 S168R을 코딩하는 mRNA로 형질감염된 Hepa 1-6 세포에서의 편집 효율을 도시한다. 도 53c는 단일 또는 이중 아미노산 치환을 갖는 MG29-1의 버전을 코딩하는 mRNA로 형질감염된 Hepa 1-6 세포에서의 편집 효율을 도시한 것이다. 도 53d는 13 개 가이드와 조합하여 MG29-1 WT 대 S168R로 형질감염된 Hepa 1-6 및 HEK293T 세포에서의 편집 효율을 도시한 것이다. 12 개의 가이드는 표 7의 가이드에 상응한다. 가이드 "35(TRAC)"는 인간 유전자좌 TRAC를 표적화하는 가이드이다.
도 54는 MG29-1 가이드 mAlb29-1-8의 예측 이차 구조를 보여준다.
도 55는 포유동물 세포의 전체 세포 추출물에서 sgRNA의 안정성에 대한 MG29-1 sgRNA 서열의 화학 변형의 영향을 보여준다.
도 56은 MG29-1 단백질, 가이드 RNA 및 적절한 주형으로 수행된 시험관 내 반응에서 표적 가닥 상의 절단 부위를 확인하기 위한 시퀀싱의 사용을 보여준다. 도 56a는 차세대 시퀀싱에 의해 결정된 바와 같은 뉴클레오타이드에서 PAM으로부터의 절단 위치의 거리를 보여준다. 도 56b는 표적 가닥에서 MG29-1 절단 부위를 규정하는 Sanger 시퀀싱의 사용을 보여주는 것이다. 도 56c는 비-표적 가닥에서 MG29-1 절단 부위를 규정하는 Sanger 시퀀싱의 사용을 보여주는 것이다. MG29-1, 가이드 및 둘 모두의 가닥의 절단을 평가하기 위한 적절한 주형을 함유하는 시험관 내 반응에 대해 런 오프 Sanger 시퀀싱을 수행하였다. 표적 가닥 상의 절단 부위는 21-23 개 염기에서 절단을 나타내는 도 56a의 NGS 데이터와 일치하는 위치 23이다. 서열의 말단에서 "A" 피크는 폴리머라제 런 오프로 인한 것이며 이와 같이 예상된다. 비-표적 가닥 상의 절단 부위는 예상되는 종결 염기가 "T"인 역 판독에서 볼 수 있다. 표시된 점(선)은 PAM으로부터의 위치 17 및 이후 말단 T에서의 절단을 나타낸다. 그러나, PAM으로부터의 위치 18, 19, 및 20에 혼합된 T 신호가 존재하여, 위치 17, 18, 및 19에서 이러한 가닥 상의 가변 절단을 시사한다.
서열 목록의 간략한 설명
본 출원과 함께 제출된 서열 목록은 본 개시내용에 따른 방법, 조성물 및 시스템에서 사용하기 위한 예시적인 폴리뉴클레오타이드 및 폴리펩타이드 서열을 제공한다. 하기는 이 중의 서열의 예시적인 설명이다.
MG11
서열 번호 1-37은 MG11 뉴클레아제의 전장 펩타이드 서열을 나타낸다.
서열 번호 3471은 MG11 뉴클레아제와 함께 기능하도록 설계된 crRNA 5' 직접 반복부를 나타낸다.
서열 번호 3472-3538은 MG11 뉴클레아제의 이펙터 반복부 모티프를 나타낸다.
서열 번호 38-118은 MG13 뉴클레아제의 전장 펩타이드 서열을 나타낸다.
서열 번호 3540-3550은 MG13 뉴클레아제의 이펙터 반복부 모티프를 나타낸다.
MG19
서열 번호 119-124는 MG19 뉴클레아제의 전장 펩타이드 서열을 나타낸다.
서열 번호 3551-3558은 MG19 뉴클레아제와 함께 기능하도록 조작된 sgRNA의 뉴클레오타이드 서열을 나타낸다.
서열 번호 3863-3866은 MG19 뉴클레아제와 상용성인 PAM 서열을 나타낸다.
MG20
서열 번호 125는 MG20 뉴클레아제의 전장 펩타이드 서열을 나타낸다.
서열 번호 3559는 MG20 뉴클레아제와 함께 기능하도록 조작된 sgRNA의 뉴클레오타이드 서열을 나타낸다.
서열 번호 3867은 MG20 뉴클레아제와 상용성인 PAM 서열을 나타낸다.
MG26
서열 번호 126-140은 MG26 뉴클레아제의 전장 펩타이드 서열을 나타낸다.
서열 번호 3560-3572는 MG26 뉴클레아제의 이펙터 반복부 모티프를 나타낸다.
MG28
서열 번호 141-214는 MG28 뉴클레아제의 전장 펩타이드 서열을 나타낸다.
서열 번호 3573-3607은 MG28 뉴클레아제의 이펙터 반복부 모티프를 나타낸다.
서열 번호 3608-3609는 MG28 뉴클레아제와 함께 기능하도록 설계된 crRNA 5' 직접 반복부를 나타낸다.
서열 번호 3868-3869는 MG28 뉴클레아제와 상용성인 PAM 서열을 나타낸다.
MG29
서열 번호 215-225은 MG29 뉴클레아제의 전장 펩타이드 서열을 나타낸다.
서열 번호 3610-3611은 MG29 뉴클레아제의 이펙터 반복부 모티프를 나타낸다.
서열 번호 3612는 MG29 뉴클레아제와 함께 기능하도록 조작된 sgRNA의 뉴클레오타이드 서열을 나타낸다.
서열 번호 3870-3872는 MG29 뉴클레아제와 상용성인 PAM 서열을 나타낸다.
MG30
서열 번호 226-228은 MG30 뉴클레아제의 전장 펩타이드 서열을 나타낸다.
서열 번호 3613-3615은 MG30 뉴클레아제의 이펙터 반복부 모티프를 나타낸다.
서열 번호 3873은 MG30 뉴클레아제와 상용성인 PAM 서열을 나타낸다.
MG31
서열 번호 229-260은 MG31 뉴클레아제의 전장 펩타이드 서열을 나타낸다.
서열 번호 3616-3632는 MG31 뉴클레아제의 이펙터 반복부 모티프를 나타낸다.
서열 번호 3874-3876는 MG31 뉴클레아제와 상용성인 PAM 서열을 나타낸다.
MG32
서열 번호 261는 MG32 뉴클레아제의 전장 펩타이드 서열을 나타낸다.
서열 번호 3633-3634는 MG32 뉴클레아제의 이펙터 반복부 모티프를 나타낸다.
서열 번호 3876은 MG32 뉴클레아제와 상용성인 PAM 서열을 나타낸다.
MG37
서열 번호 262-426은 MG37 뉴클레아제의 전장 펩타이드 서열을 나타낸다.
서열 번호 3635은 MG37 뉴클레아제의 이펙터 반복부 모티프를 나타낸다.
서열 번호 3636-3637, 3640-3641, 3644-3645, 3648-3649, 3652-3653, 3656-3657, 및 3660-3661은 MG37 뉴클레아제와 기능하도록 조작된 sgRNA의 뉴클레오타이드 서열을 나타낸다.
서열 번호 3638, 3642, 3646, 3650, 3654, 3658, 및 3662는 상기 MG37 뉴클레아제와 동일한 유전자좌로부터 유래된 MG37 tracrRNA의 뉴클레오타이드 서열을 나타낸다.
서열 번호 3639, 3643, 3647, 3651, 3655, 및 3659는 5'에서 3'로의 표적화 또는 스페이서 서열에 배치될 때 crRNA로서 작용하는 천연 MG37 유전자좌로부터 유래된 5' 직접 반복부 서열을 나타낸다.
MG53
서열 번호 427-428은 MG53 뉴클레아제의 전장 펩타이드 서열을 나타낸다.
서열 번호 3663은 5'에서 3'로의 표적화 또는 스페이서 서열에 대해 배치될 때 crRNA로서 작용하는 천연 MG53 유전자좌로부터 유래된 5' 직접 반복부 서열을 나타낸다.
서열 번호 3664-3667은 MG53 뉴클레아제와 함께 기능하도록 조작된 sgRNA의 뉴클레오타이드 서열을 나타낸다.
서열 번호 3668-3669는 상기 MG53 뉴클레아제와 동일한 유전자좌로부터 유래된 MG53 tracrRNA의 뉴클레오타이드 서열을 나타낸다.
MG54
서열 번호 429-430은 MG54 뉴클레아제의 전장 펩타이드 서열을 나타낸다.
서열 번호 3670은 5'에서 3'로의 표적화 또는 스페이서 서열에 대해 배치될 때 crRNA로서 작용하는 천연 MG54 유전자좌로부터 유래된 5' 직접 반복부 서열을 나타낸다.
서열 번호 3671-3672는 MG54 뉴클레아제와 함께 기능하도록 조작된 sgRNA의 뉴클레오타이드 서열을 나타낸다.
서열 번호 3673-3676은 상기 MG54 뉴클레아제와 동일한 유전자좌로부터 유래된 MG54 tracrRNA의 뉴클레오타이드 서열을 나타낸다.
MG55
서열 번호 431-688은 MG55 뉴클레아제의 전장 펩타이드 서열을 나타낸다.
MG56
서열 번호 689-690은 MG56 뉴클레아제의 전장 펩타이드 서열을 나타낸다.
서열 번호 3678은 MG56 뉴클레아제와 함께 기능하도록 설계된 crRNA 5' 직접 반복부를 나타낸다.
서열 번호 3679-3680은 MG56 뉴클레아제의 이펙터 반복부 모티프를 나타낸다.
MG57
서열 번호 691-721은 MG57 뉴클레아제의 전장 펩타이드 서열을 나타낸다.
서열 번호 3681-3694는 MG57 뉴클레아제의 이펙터 반복부 모티프를 나타낸다.
서열 번호 3695-3696은 MG57 뉴클레아제와 함께 기능하도록 조작된 sgRNA의 뉴클레오타이드 서열을 나타낸다.
서열 번호 3879-3880은 MG57 뉴클레아제와 상용성인 PAM 서열을 나타낸다.
MG58
서열 번호 722-779는 MG58 뉴클레아제의 전장 펩타이드 서열을 나타낸다.
서열 번호 3697-3711은 MG58 뉴클레아제의 이펙터 반복부 모티프를 나타낸다.
MG59
서열 번호 780-792는 MG59 뉴클레아제의 전장 펩타이드 서열을 나타낸다.
서열 번호 3712-3728은 MG59 뉴클레아제의 이펙터 반복부 모티프를 나타낸다.
서열 번호 3729-3730은 MG59 뉴클레아제와 함께 기능하도록 조작된 sgRNA의 뉴클레오타이드 서열을 나타낸다.
서열 번호 3881-3882는 MG59 뉴클레아제와 상용성인 PAM 서열을 나타낸다.
MG60
서열 번호 793-1163은 MG60 뉴클레아제의 전장 펩타이드 서열을 나타낸다.
서열 번호 3731-3733은 MG60 뉴클레아제의 이펙터 반복부 모티프를 나타낸다.
MG61
서열 번호 1164-1469는 MG61 뉴클레아제의 전장 펩타이드 서열을 나타낸다.
서열 번호 3734-3735는 MG61 뉴클레아제와 함께 기능하도록 설계된 crRNA 5' 직접 반복부를 나타낸다.
서열 번호 3736-3847은 MG61 뉴클레아제의 이펙터 반복부 모티프를 나타낸다.
MG62
서열 번호 1470-1472는 MG62 뉴클레아제의 전장 펩타이드 서열을 나타낸다.
서열 번호 3848-3850은 MG62 뉴클레아제의 이펙터 반복부 모티프를 나타낸다.
MG70
서열 번호 1473-1514는 MG70 뉴클레아제의 전장 펩타이드 서열을 나타낸다.
MG75
서열 번호 1515-1710은 MG75 뉴클레아제의 전장 펩타이드 서열을 나타낸다.
MG77
서열 번호 1711-1712는 MG77 뉴클레아제의 전장 펩타이드 서열을 나타낸다.
서열 번호 3851-3852는 MG77 뉴클레아제와 함께 기능하도록 조작된 sgRNA의 뉴클레오타이드 서열을 나타낸다.
서열 번호 3883-3884는 MG77 뉴클레아제와 상용성인 PAM 서열을 나타낸다.
MG78
서열 번호 1713-1717은 MG78 뉴클레아제의 전장 펩타이드 서열을 나타낸다.
서열 번호 3853은 MG78 뉴클레아제와 함께 기능하도록 조작된 sgRNA의 뉴클레오타이드 서열을 나타낸다.
서열 번호 3885은 MG78 뉴클레아제와 상용성인 PAM 서열을 나타낸다.
MG79
서열 번호 1718-1722는 MG79 뉴클레아제의 전장 펩타이드 서열을 나타낸다.
서열 번호 3854-3857은 MG79 뉴클레아제와 함께 기능하도록 조작된 sgRNA의 뉴클레오타이드 서열을 나타낸다.
서열 번호 3886-3889는 MG79 뉴클레아제와 상용성인 PAM 서열을 나타낸다.
MG80
서열 번호 1723은 MG80 뉴클레아제의 전장 펩타이드 서열을 나타낸다.
MG81
서열 번호 1724-2654는 MG81 뉴클레아제의 전장 펩타이드 서열을 나타낸다.
MG82
서열 번호 2655-2657은 MG82 뉴클레아제의 전장 펩타이드 서열을 나타낸다.
MG83
서열 번호 2658-2659는 MG83 뉴클레아제의 전장 펩타이드 서열을 나타낸다.
MG84
서열 번호 2660-2677은 MG84 뉴클레아제의 전장 펩타이드 서열을 나타낸다.
MG85
서열 번호 2678-2680은 MG85 뉴클레아제의 전장 펩타이드 서열을 나타낸다.
MG90
서열 번호 2681-2809는 MG90 뉴클레아제의 전장 펩타이드 서열을 나타낸다.
MG91
서열 번호 2810-3470은 MG91 뉴클레아제의 전장 펩타이드 서열을 나타낸다.
스페이서 세그먼트
서열 번호 3858-3861은 스페이서 세그먼트의 뉴클레오타이드 서열을 나타낸다.
NLS
서열 번호 3938-3953은 본 개시내용에 따라 뉴클레아제에 부착될 수 있는 예시적인 핵 국소화 서열(NLS)의 서열을 나타낸다.
발명의 상세한 설명
본 발명의 다양한 실시양태가 본원에서 제시되고 설명되었지만, 이러한 실시양태는 단지 예로서 제공된다는 것이 관련 기술 분야의 통상의 기술자에게 명백할 것이다. 본 발명을 벗어나지 않으면서 수많은 변형, 변경 및 대체가 관련 기술 분야의 통상의 기술자에 의해 이루어질 수 있다. 본원에 기재된 본 발명의 실시양태에 대한 다양한 대안이 사용될 수 있음을 이해해야 한다.
본원에 개시된 일부 방법의 실행은 달리 명시되지 않는 한, 면역학, 생화학, 화학, 분자 생물학, 미생물학, 세포 생물학, 유전체학 및 재조합 DNA의 기술을 사용한다. 예를 들어, 문헌[Sambrook and Green, Molecular Cloning: A Laboratory Manual, 4th Edition (2012); the series Current Protocols in Molecular Biology (F. M. Ausubel, et al. eds.); the series Methods In Enzymology (Academic Press, Inc.), PCR 2: A Practical Approach (M.J. MacPherson, B.D. Hames and G.R. Taylor eds. (1995)), Harlow and Lane, eds. (1988) Antibodies, A Laboratory Manual, and Culture of Animal Cells: A Manual of Basic Technique and Specialized Applications, 6th Edition (R.I. Freshney, ed. (2010))](전체가 본원에 참조로 포함됨)을 참조한다.
본 명세서에 사용되는 바와 같이, 단수형인 부정관사 및 정관사는 문맥이 명백하게 달리 나타내지 않는 한 복수형도 포함하도록 의도된다. 또한, "포함하는", "포함하다", "갖는", "갖다", "~와 함께" 또는 이들의 변형 용어가 상세한 설명 및/또는 청구범위에서 사용되는 한, 이들 용어는 "망라하는"이라는 용어와 유사한 방식으로 포괄적인 것으로 의도된다.
용어 "약" 또는 "대략"은 관련 기술 분야의 통상의 기술자에 의해 결정된 특정 값에 대해 허용 가능한 오차 범위 내를 의미하며, 이는 값이 어떻게 측정 또는 결정되는지에 따라, 즉, 측정 시스템의 한계에 따라 부분적으로 좌우될 것이다. 예를 들어, "약"은 관련 기술 분야의의 관행에 따라 1 또는 1 초과의 표준 편차 이내를 의미할 수 있다. 대안적으로, "약"은 주어진 값의 20% 이하, 15% 이하, 10% 이하, 5% 이하, 또는 1% 이하의 범위를 의미할 수 있다.
본원에서 사용되는 바와 같이, "세포"는 일반적으로 생물학적 세포를 지칭한다. 세포는 살아있는 유기체의 기본적인 구조적, 기능적 및/또는 생물학적 단위일 수 있다. 세포는 하나 이상의 세포를 갖는 유기체로부터 유래할 수 있다. 일부 비제한적인 예는 다음을 포함한다: 원핵 세포, 진핵 세포, 박테리아 세포, 고세균 세포, 단세포 진핵 유기체의 세포, 원생동물 세포, 식물 세포(예를 들어, 식물 작물, 과일, 채소, 곡물, 대두, 옥수수, 메이즈, 밀, 씨앗, 토마토, 쌀, 카사바, 사탕수수, 호박, 건초, 감자, 면, 대마, 담배, 현화 식물, 침엽수, 겉씨 식물, 양치류, 석송, 붕어마름(hornwort), 우산이끼, 이끼로부터의 세포), 조류 세포(예를 들어, 보트리코쿠스 브라우니이(Botryococcus braunii), 클라미도모나스 레인하르드티이(Chlamydomonas reinhardtii), 나노클로롭시스 가디타나(Nannochloropsis gaditana), 클로렐아 피레노이도사(Chlorella pyrenoidosa), 사르가숨 파텐스 씨. 아가르드(Sargassum patens C. Agardh) 등), 해조류(예를 들어, 다시마), 진균 세포(예를 들어, 효모 세포, 버섯으로부터의 세포), 동물 세포, 무척추 동물(예를 들어, 초파리, 자포동물, 극피동물, 선충류 등)로부터의 세포, 척추동물(예를 들어, 어류, 양서류, 파충류, 조류, 포유류)로부터의 세포, 포유동물(예를 들어, 돼지, 소, 염소, 양, 설치류, 래트, 마우스, 인간이 아닌 영장류, 인간 등)의 세포 등. 때때로, 세포는 천연 유기체로부터 유래하지 않는다(예를 들어, 세포는 합성으로 제조될 수 있다(때로는 인공 세포로 언급됨)).
본원에서 사용되는 바와 같이, 용어 "뉴클레오타이드"는 일반적으로 염기-당-포스페이트 조합물을 지칭한다. 뉴클레오타이드는 합성 뉴클레오타이드를 포함할 수 있다. 뉴클레오타이드는 합성 뉴클레오타이드 유사체를 포함할 수 있다. 뉴클레오타이드는 핵산 서열의 단량체 단위(예를 들어, 데옥시리보핵산(DNA) 및 리보핵산(RNA))일 수 있다. 뉴클레오타이드라는 용어는 리보뉴클레오사이드 트리포스페이트 아데노신 트리포스페이트(ATP), 우리딘 트리포스페이트(UTP), 시토신 트리포스페이트(CTP), 구아노신 트리포스페이트(GTP) 및 데옥시리보뉴클레오사이드 트리포스페이트, 예컨대, dATP, dCTP, dITP, dUTP, dGTP, dTTP 또는 이들의 유도체를 포함할 수 있다. 이러한 유도체는 예를 들어 [αS]dATP, 7-데아자-dGTP 및 7-데아자-dATP, 및 이들을 함유하는 핵산 분자에 뉴클레아제 내성을 부여하는 뉴클레오타이드 유도체를 포함할 수 있다. 본원에서 사용되는 바와 같이, 용어 뉴클레오타이드는 디데옥시리보뉴클레오사이드 트리포스페이트(ddNTP) 및 이들의 유도체를 지칭할 수 있다. 디데옥시리보뉴클레오사이드 트리포스페이트의 예시적인 예는 ddATP, ddCTP, ddGTP, ddITP 및 ddTTP를 포함할 수 있지만, 이에 제한되지는 않는다. 뉴클레오타이드는 표지되지 않거나, 광학적으로 검출 가능한 모이어티(예를 들어, 형광단)을 포함하는 모이어티를 사용하는 것과 같이 검출 가능하게 표지될 수 있다. 표지화는 양자점으로 수행할 수도 있다. 검출 가능한 표지는 예를 들어 방사성 동위원소, 형광 표지, 화학발광 표지, 생물발광 표지 및 효소 표지를 포함할 수 있다. 뉴클레오타이드의 형광 표지는 플루오레세인, 5-카르복시플루오레세인(FAM), 2'7'-디메톡시-4'5-디클로로-6-카르복시플루오레세인(JOE), 로다민, 6-카르복시로다민(R6G), N,N,N',N'-테트라메틸-6-카르복시로다민(TAMRA), 6-카르복시-X-로다민(ROX), 4-(4'디메틸아미노페닐아조)벤조산(DABCYL), 캐스케이드 블루, 오레곤 그린, 텍사스 레드, 시아닌 및 5-(2'-아미노에틸)아미노나프탈렌-1-설폰산(EDANS)을 포함할 수 있지만, 이에 제한되지는 않는다. 형광 표지된 뉴클레오타이드의 구체적인 예는 [R6G]dUTP, [TAMRA]dUTP, [R110]dCTP, [R6G]dCTP, [TAMRA]dCTP, [JOE]ddATP, [R6G]ddATP, [FAM]ddCTP, [R110]ddCTP, [TAMRA]ddGTP, [ROX]ddTTP, [dR6G]ddATP, [dR110]ddCTP, [dTAMRA]ddGTP, 및 [dROX]ddTTP(미국 캘리포니아주 포스터 시티 소재의 Perkin Elmer로부터 입수 가능); 플루오로링크(FluoroLink) 데옥시뉴클레오타이드, 플루오로링크 Cy3-dCTP, 플루오로링크 Cy5-dCTP, 플루오로링크 플루오르(Fluor) X-dCTP, 플루오로링크 Cy3-dUTP, 및 플루오로링크 Cy5-dUTP(미국 일리노이주 알링턴 하이츠 소재의 Amersham으로부터 입수 가능); 플루오레세인-15-dATP, 플루오레세인-12-dUTP, 테트라메틸-로다민-6-dUTP, IR770-9-dATP, 플루오레세인-12-ddUTP, 플루오레세인-12-UTP, 및 플루오레세인-15-2'-dATP(미국 인디애나주 인디애나폴리스 소재의 Boehringer Mannheim으로부터 입수 가능); 및 염색체 표지 뉴클레오타이드, BODIPY-FL-14-UTP, BODIPY-FL-4-UTP, BODIPY-TMR-14-UTP, BODIPY-TMR-14-dUTP, BODIPY-TR-14-UTP, BODIPY-TR-14-dUTP, 캐스케이드 블루-7-UTP, 캐스케이드 블루-7-dUTP, 플루오레세인-12-UTP, 플루오레세인-12-dUTP, 오레곤 그린 488-5-dUTP, 로다민 그린-5-UTP, 로다민 그린-5-dUTP, 테트라메틸로다민-6-UTP, 테트라메틸로다민-6-dUTP, 텍사스 레드-5-UTP, 텍사스 레드-5-dUTP 및 텍사스 레드-12-dUTP(미국 오레곤주 유진 소재의 Molecular Probes로부터 입수 가능)를 포함할 수 있다. 뉴클레오타이드는 또한 화학 변형에 의해 표지되거나 표시될 수 있다. 화학적으로 변형된 단일 뉴클레오타이드는 비오틴-dNTP일 수 있다. 비오티닐화된 dNTP의 일부 비제한적 예는 비오틴-dATP(예를 들어, 비오-N6-ddATP, 비오틴-14-dATP), 비오틴-dCTP(예를 들어, 비오틴-11-dCTP, 비오틴-14-dCTP), 및 비오틴-dUTP(예를 들어, 비오틴-11-dUTP, 비오틴-16-dUTP, 비오틴-20-dUTP)를 포함할 수 있다.
"폴리뉴클레오타이드", "올리고뉴클레오타이드" 및 "핵산"이라는 용어는 일반적으로 단일-가닥, 이중-가닥 또는 다중 가닥 형태의 데옥시리보뉴클레오타이드 또는 리보뉴클레오타이드 또는 이들의 유사체인 임의의 길이의 뉴클레오타이드의 중합체 형태를 지칭하기 위해 상호 교환 가능하게 사용된다. 폴리뉴클레오타이드는 세포에 대해 외인성 또는 내인성일 수 있다. 폴리뉴클레오타이드는 무세포 환경에 존재할 수 있다. 폴리뉴클레오타이드는 유전자 또는 그의 단편일 수 있다. 폴리뉴클레오타이드는 DNA일 수 있다. 폴리뉴클레오타이드는 RNA일 수 있다. 폴리뉴클레오타이드는 임의의 3차원 구조를 가질 수 있고, 임의의 기능을 수행할 수 있다. 폴리뉴클레오타이드는 하나 이상의 유사체(예를 들어, 변경된 골격, 당 또는 핵염기)를 포함할 수 있다. 존재하는 경우, 뉴클레오타이드 구조에 대한 변형은 중합체의 조립 전 또는 후에 부여될 수 있다. 유사체의 일부 비제한적 예에는 다음이 포함되다: 5-브로모우라실, 펩타이드 핵산, 제노 핵산, 모르폴리노, 잠금 핵산, 글리콜 핵산, 트레오스 핵산, 디데옥시뉴클레오타이드, 코르디세핀, 7-데아자-GTP, 형광단(예를 들어, 당에 연결된 로다민 또는 플루오레세인), 티올-함유 뉴클레오타이드, 비오틴-연결된 뉴클레오타이드, 형광 염기 유사체, CpG 섬, 메틸-7-구아노신, 메틸화된 뉴클레오타이드, 이노신, 티오우리딘, 슈도우리딘, 디히드로우리딘, 쿠에오신 및 와이오신. 폴리뉴클레오타이드의 비제한적인 예는 유전자 또는 유전자 단편의 코딩 또는 비코딩 영역, 연관 분석으로부터 정의된 유전자좌들(유전자좌), 엑손, 인트론, 메신저 RNA(mRNA), 전달 RNA(tRNA), 리보솜 RNA(rRNA), 짧은 간섭 RNA(siRNA), 짧은 헤어핀 RNA(shRNA), 마이크로 RNA(miRNA), 리보자임, cDNA, 재조합 폴리뉴클레오타이드, 분지형 폴리뉴클레오타이드, 플라스미드, 벡터, 임의의 서열의 단리된 DNA, 임의의 서열의 단리된 RNA, 무세포 DNA(cfDNA) 및 무세포 RNA(cfRNA)를 포함하는 무세포 폴리뉴클레오타이드, 핵산 프로브 및 프라이머를 포함한다. 뉴클레오타이드의 서열은 비뉴클레오타이드 성분에 의해 중단될 수 있다.
용어 "형질감염" 또는 "형질감염된"은 일반적으로 비-바이러스 또는 바이러스-기반 방법에 의해 핵산의 세포 내로의 도입을 지칭한다. 핵산 분자는 완전한 단백질 또는 그의 기능적 부분을 코딩하는 유전자 서열일 수 있다. 예를 들어, 문헌 [Sambrook et al., 1989, Molecular Cloning: A Laboratory Manual, 18.1-18.88](본원에 전체가 참조로 포함됨)을 참조한다.
용어 "펩타이드", "폴리펩타이드" 및 "단백질"은 일반적으로 펩타이드 결합(들)에 의해 연결된 적어도 2 개의 아미노산 잔기의 중합체를 지칭하기 위해 본원에서 상호 교환 가능하게 사용된다. 이 용어는 특정 길이의 중합체를 의미하지 않으며, 펩타이드가 재조합 기술, 화학적 또는 효소적 합성을 사용하여 생산되는지 또는 자연적으로 발생하지를 암시하거나 구별하려는 의도도 아니다. 상기 용어는 천연 발생 아미노산 중합체 뿐만 아니라, 적어도 하나의 변형된 아미노산을 포함하는 아미노산 중합체에도 적용된다. 일부 경우에, 중합체는 비아미노산에 의해 중단될 수 있다. 상기 용어는 전장 단백질, 및 2차 및/또는 3차 구조(예를 들어, 도메인)를 갖거나 갖지 않는 단백질을 포함하는 임의의 길이의 아미노산 사슬을 포함한다. 이 용어는 또한 예를 들어 디설파이드 결합 형성, 글리코실화, 지질화, 아세틸화, 인산화, 산화 및 표지 성분과의 접합과 같은 임의의 기타 조작에 의해 변형된 아미노산 중합체를 포함한다. 본원에서 사용되는 바와 같이, 용어 "아미노산" 및 "아미노산들"은 일반적으로 변형된 아미노산 및 아미노산 유사체를 포함하지만 이에 제한되지 않는 천연 및 비-천연 아미노산을 지칭한다. 변형된 아미노산은 천연 아미노산 및 비-천연 아미노산을 포함할 수 있으며, 이는 아미노산 상에 자연적으로 존재하지 않는 기 또는 화학적 모이어티를 포함하도록 화학적으로 변형된 것이다. 아미노산 유사체는 아미노산 유도체를 지칭할 수 있다. 용어 "아미노산"은 D-아미노산과 L-아미노산 둘 모두를 포함한다.
본원에서 사용되는 바와 같이, "비-천연"은 일반적으로 천연 핵산 또는 단백질에서 발견되지 않는 핵산 또는 폴리펩타이드 서열을 지칭할 수 있다. 비-천연은 친화도 태그를 지칭할 수 있다. 비-천연은 융합을 지칭할 수 있다. 비-천연은 돌연변이, 삽입 및/또는 결실을 포함하는 천연 발생 핵산 또는 폴리펩타이드 서열을 지칭할 수 있다. 비-천연 서열은 비-천연 서열이 융합되는 핵산 및/또는 폴리펩타이드 서열에 의해서도 나타날 수 있는 활성(예를 들어, 효소 활성, 메틸트랜스퍼라제 활성, 아세틸트랜스퍼라제 활성, 키나제 활성, 유비퀴틴화 활성 등)을 나타내거나 이를 코딩할 수 있다. 비-천연 핵산 또는 폴리뉴클레오타이드 서열은 키메라 핵산 및/또는 폴리펩타이드를 코딩하는 키메라 핵산 및/또는 폴리펩타이드 서열을 생성하기 위해 유전적 조작에 의해 자연 발생 핵산 또는 폴리펩타이드 서열(또는 이의 변이체)에 연결될 수 있다.
본원에서 사용되는 바와 같이, 용어 "프로모터"는 일반적으로 유전자의 전사 또는 발현을 제어하고 RNA 전사가 개시되는 뉴클레오타이드 또는 뉴클레오타이드의 영역에 인접하거나 중첩하여 위치될 수 있는 조절 DNA 영역을 지칭한다. 프로모터는 종종 전사 인자라고 지칭되는 단백질 인자에 결합하는 특정 DNA 서열을 포함할 수 있으며, 이는 RNA 폴리머라제가 DNA에 결합하여 유전자 전사를 용이하게 한다. '코어 프로모터'로도 지칭되는 '기본 프로모터'는 일반적으로 작동 가능하게 연결된 폴리뉴클레오타이드의 전사 발현을 촉진하기 위해 필요한 모든 기본 요소를 함유하는 프로모터를 지칭할 수 있다. 일반적으로 진핵생물의 기본 프로모터는 반드시 그런 것은 아니지만, TATA 박스 및/또는 CAAT 박스를 포함한다.
본원에서 사용되는 바와 같이, 용어 "발현"은 일반적으로 핵산 서열 또는 폴리뉴클레오타이드가 DNA 주형으로부터 전사되는 과정(예를 들어, mRNA 또는 다른 RNA 전사체로) 및/또는 전사된 mRNA가 이후에 펩타이드, 폴리펩타이드 또는 단백질로 번역되는 과정을 지칭한다. 전사체 및 코딩된 폴리펩타이드는 집합적으로 "유전자 산물"로 지칭될 수 있다. 폴리뉴클레오타이드가 게놈 DNA로부터 유래된 경우, 발현은 진핵 세포에서 mRNA의 스플라이싱을 포함할 수 있다.
본원에서 사용되는 바와 같이, "작동 가능하게 연결된", "작동 가능한 연결", "작동하게 연결된" 또는 이의 문법적 등가물은 일반적으로 유전 요소, 예를 들어 프로모터, 인핸서, 폴리아데닐화 서열 등의 병치를 지칭하며, 여기서 요소는 예상된 방식으로 작동하도록 허용하는 관계에 있다. 예를 들어, 프로모터 및/또는 인핸서 서열을 포함할 수 있는 조절 요소는 조절 요소가 코딩 서열의 전사 개시를 돕는 경우 코딩 영역에 작동 가능하게 연결된 것이다. 이 기능적 관계가 유지되는 한, 조절 요소와 코딩 영역 사이에 개재하는 잔기가 있을 수 있다.
본원에서 사용되는 바와 같이, "벡터"는 일반적으로 폴리뉴클레오타이드를 포함하거나 이와 회합하고 폴리뉴클레오타이드를 세포로 전달하는 것을 매개하는 데 사용될 수 있는 거대분자 또는 거대분자의 회합체를 지칭한다. 벡터의 예는 플라스미드, 바이러스 벡터, 리포솜 및 기타 유전자 전달 비히클을 포함한다. 벡터는 일반적으로 표적에서 유전자의 발현을 촉진하기 위해 유전자에 작동 가능하게 연결된 유전 요소, 예를 들어 조절 요소를 포함한다.
본원에서 사용되는 바와 같이, "발현 카세트" 및 "핵산 카세트"는 일반적으로 함께 발현되거나 발현을 위해 작동 가능하게 연결된 핵산 서열 또는 요소의 조합물을 지칭하기 위해 상호 교환 가능하게 사용된다. 일부 경우에, 발현 카세트는 조절 요소 및 발현을 위해 작동 가능하게 연결된 유전자 또는 유전자들의 조합물을 지칭한다.
DNA 또는 단백질 서열의 "기능적 단편"은 일반적으로 전장 DNA 또는 단백질 서열의 생물학적 활성과 실질적으로 유사한 생물학적 활성(기능적 또는 구조적)을 보유하는 단편을 지칭한다. DNA 서열의 생물학적 활성은 전장 서열에 기인하는 것으로 알려진 방식으로 발현에 영향을 미치는 능력일 수 있다.
본원에서 사용되는 바와 같이, "조작된" 대상은 일반적으로 대상이 인간의 개입에 의해 변형되었음을 나타낸다. 비제한적 예에 따르면, 핵산은 자연에서 발생하지 않는 서열로 그의 서열을 변경함으로써 변형될 수 있으며; 핵산은 라이게이션된 산물이 원래 핵산에 존재하지 않는 기능을 갖도록 자연적으로 결합되지 않는 핵산에 핵산을 라이게이션시킴으로써 변형될 수 있고; 조작된 핵산은 자연에 존재하지 않는 서열로 시험관 내에서 합성될 수 있고; 단백질은 그의 아미노산 서열을 자연에 존재하지 않는 서열로 변경함으로써 변형될 수 있고; 조작된 단백질은 새로운 기능 또는 특성을 획득할 수 있다. "조작된" 시스템은 적어도 하나의 조작된 구성요소를 포함한다.
본원에서 사용되는 바와 같이, "합성" 및 "인공"은 일반적으로 자연 발생 인간 단백질에 대한 낮은 서열 동일성(예를 들어, 50% 미만의 서열 동일성, 25% 미만의 서열 동일성, 10% 미만의 서열 동일성, 5% 미만의 서열 동일성, 1% 미만의 서열 동일성)을 갖는 단백질 또는 그의 도메인을 지칭하기 위해 상호 교환 가능하게 사용될 수 있다. 예를 들어, VPR 및 VP64 도메인은 합성 전이 활성화(transactivation) 도메인이다.
본원에서 사용되는 바와 같이, 용어 "Cas12a"는 일반적으로 클래스 2, 타입 V-A Cas 엔도뉴클레아제이고 (a) CRISPR 어레이로부터의 전사 후 뉴클레오타이드 자체에 의해 가공되는 비교적 작은 가이드 RNA(약 42-44 개 뉴클레오타이드)를 사용하고, (b) 엇갈린 절단 부위를 남기도록 DNA를 절단하는 Cas 엔도뉴클레아제의 패밀리를 지칭한다. 이러한 효소 패밀리의 추가 특징은, 예를 들어, 본원에 참조로 포함되는 문헌[Zetsche B, Heidenreich M, Mohanraju P, et al. Nat Biotechnol 2017;35:31-34, 및 Zetsche B, Gootenberg JS, Abudayyeh OO, et al. Cell 2015;163:759-771]에서 찾아볼 수 있다.
본원에서 사용되는 바와 같이, "가이드 핵산"은 일반적으로 또 다른 핵산에 혼성화할 수 있는 핵산을 지칭할 수 있다. 가이드 핵산은 RNA일 수 있다. 가이드 핵산은 DNA일 수 있다. 가이드 핵산은 핵산 서열에 부위-특이적으로 결합하도록 프로그래밍될 수 있다. 표적화될 핵산, 또는 표적 핵산은 뉴클레오타이드를 포함할 수 있다. 가이드 핵산은 뉴클레오타이드를 포함할 수 있다. 표적 핵산의 일부는 가이드 핵산의 일부에 상보성일 수 있다. 가이드 핵산에 상보성이고 혼성화하는 이중-가닥 표적 폴리뉴클레오타이드의 가닥은 상보성 가닥이라 불릴 수 있다. 상보성 가닥에 상보성이고, 따라서 가이드 핵산에 상보성이지 않을 수 있는 이중-가닥 표적 폴리뉴클레오타이드의 가닥은 비-상보성 가닥이라 불릴 수 있다. 가이드 핵산은 폴리뉴클레오타이드 사슬을 포함할 수 있으며, "단일 가이드 핵산"이라 불릴 수 있다. 가이드 핵산은 2 개의 폴리뉴클레오타이드 사슬을 포함할 수 있으며, "이중 가이드 핵산"으로 불릴 수 있다. 달리 명시되지 않은 경우, "가이드 핵산"이라는 용어는 단일 가이드 핵산과 이중 가이드 핵산 둘 모두를 지칭하는 포괄적인 의미일 수 있다. 가이드 핵산은 "핵산-표적화 세그먼트" 또는 "핵산-표적화 서열" 또는 "스페이서 서열"로 지칭될 수 있는 세그먼트를 포함할 수 있다. 핵산-표적화 세그먼트는 "단백질 결합 세그먼트" 또는 "단백질 결합 서열" 또는 "Cas 단백질 결합 세그먼트"로 지칭될 수 있는 하위 세그먼트를 포함할 수 있다.
2 개 이상의 핵산 또는 폴리펩타이드 서열의 맥락에서 "서열 동일성" 또는 "동일성 퍼센트"라는 용어는 일반적으로 서열 비교 알고리즘을 사용하여 측정할 때 국소적 또는 전체적 비교 범위에 걸쳐 최대 일치를 위해 비교되고 정렬될 때 동일한, 또는 동일한 아미노산 잔기 또는 뉴클레오타이드의 지정된 백분율을 갖는 2 개(예를 들어, 쌍 정렬) 이상(예를 들어, 다중 서열 정렬)의 서열을 지칭한다. 폴리펩타이드 서열에 대한 적합한 서열 비교 알고리즘은, 예를 들어, 단어 길이(W) 3, 기대값(E) 10, 및 존재 11, 연장 1에서의 BLOSUM62 스코어링 매트릭스 설정 갭 코스트의 매개변수를 사용하고 30 개 잔기보다 긴 폴리펩타이드 서열에 대한 조건부 조성 점수 매트릭스 조정을 사용하는 BLASTP; 단어 길이(W) 2, 기대값(E) 1000000, 및 30 개 미만의 잔기의 서열에 대한 오픈 갭 9 및 연장 갭 1의 PAM30 스코어링 매트릭스 설정 갭 코스트의 매개변수를 사용하는 BLASTP(이들은 https://blast.ncbi.nlm.nih.gov에서 이용 가능한 BLAST 스위트의 BLASTP에 대한 디폴트 매개변수임); 일치 2, 불일치 -1 및 갭 -1인 스미쓰-워터맨 상동성 검색 알고리즘 매개변수를 갖는 CLUSTALW; 디폴트 매개변수를 갖는 MUSCLE; retree가 2 및 최대 반복이 1000의 매개변수를 갖는 MAFFT; 디폴트 매개변수를 갖는 Novafold; 디폴트 매개변수를 갖는 HMMER hmmalign을 포함한다.
2 개 이상의 핵산 또는 폴리펩타이드 서열의 맥락에서 용어 "최적으로 정렬된"은 일반적으로, 예를 들어, 가장 높은 또는 "최적화된" 동일성 퍼센트 점수를 생성하는 정렬에 의해 결정하는 경우 아미노산 잔기 또는 뉴클레오타이드의 최대 일치성으로 정렬된 2 개(예를 들어, 쌍별 정렬) 이상(예를 들어, 다중 서열 정렬)의 서열을 지칭한다.
본 개시내용에는 하나 이상의 보존적 아미노산 치환을 갖는 본원에 기재된 임의의 효소의 변이체가 포함된다. 이러한 보존적 치환은 폴리펩타이드의 3차원 구조 또는 기능을 방해하지 않으면서 폴리펩타이드의 아미노산 서열에서 이루어질 수 있다. 보존적 치환은 서로에 대해 유사한 소수성, 극성, 및 R 사슬 길이를 갖는 아미노산을 서로 치환함으로써 달성될 수 있다. 추가로, 또는 대안적으로, 상이한 종으로부터의 상동성 단백질의 정렬된 서열을 비교함으로써, 코딩된 단백질의 기본 기능을 변경하지 않으면서 종 사이에서 돌연변이된 아미노산 잔기(예를 들어, 비-보존된 잔기)를 위치시킴으로써 보존적 치환을 확인할 수 있다. 이러한 보존적으로 치환된 변이체는 본원에 기재된 엔도뉴클레아제 단백질 서열(예를 들어, 본원에 기재된 MG11, MG13, MG26, MG28, MG29, MG30, MG31, MG32, MG37, MG53, MG54, MG55, MG56, MG57, MG58, MG59, MG60, MG61, MG62, MG70, MG82, MG83, MG84 또는 MG85 패밀리 엔도뉴클레아제, 또는 본원에 기재된 임의의 다른 패밀리 뉴클레아제) 중 어느 하나에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%의 동일성을 갖는 변이체를 포함할 수 있다. 일부 실시양태에서, 이러한 보존적으로 치환된 변이체는 기능적 변이체이다. 이러한 기능적 변이체는 엔도뉴클레아제의 하나 이상의 중요한 활성 부위 잔기 또는 가이드 RNA 결합 잔기의 활성이 파괴되지 않도록 치환이 있는 서열을 포함할 수 있다. 일부 실시양태에서, 본원에 기재된 임의의 단백질의 기능적 변이체는 도 17, 18, 10, 20, 또는 25에 언급된 보존된 또는 기능적 잔기 또는 표 1B에 기재된 잔기 중 적어도 하나의 치환이 결여된다. 일부 실시양태에서, 본원에 기재된 임의의 단백질의 기능적 변이체는 도 17, 18, 10, 20, 또는 25에 언급된 보존된 또는 기능적 잔기 또는 표 1B에 기재된 잔기 모두의 치환이 결여된다.
또한, 본 개시내용에는 효소의 활성을 감소시키거나 제거하기 위한 하나 이상의 촉매 잔기의 치환을 갖는 본원에 기재된 임의의 효소의 변이체(예를 들어, 감소된-활성 변이체)가 포함된다. 일부 실시양태에서, 본원에 기재된 단백질과 같은 감소된 활성 변이체는 표 1B에서 확인된 적어도 1 개, 적어도 2 개, 또는 3 개 모두의 촉매 잔기의 파괴 치환을 포함한다.
기능적으로 유사한 아미노산을 제공하는 보존적 치환 표는 다양한 참고문헌으로부터 이용 가능하다(예를 들어, 문헌[Creighton, Proteins: Structures and Molecular Properties (W H Freeman & Co.; 2nd edition (December 1993)] 참조). 하기 8 개의 그룹은 각각 서로에 대해 보존적 치환인 아미노산을 함유한다:
1) 알라닌(A), 글리신(G);
2) 아스파르트산(D), 글루탐산(E);
3) 아스파라긴(N), 글루타민(Q);
4) 아르기닌(R), 리신(K);
5) 이소류신(I), 류신(L), 메티오닌(M), 발린(V);
6) 페닐알라닌(F), 티로신(Y), 트립토판(W);
7) 세린(S), 트레오닌(T); 및
8) 시스테인(C), 메티오닌(M)
개요
고유한 기능 및 구조를 갖는 새로운 Cas 효소의 발견은 데옥시리보핵산(DNA) 편집 기술을 추가로 변경하여 속도, 특이성, 기능 및 사용 용이성을 개선할 잠재력을 제공할 수 있다. 미생물에서 일정한 간격을 두고 주기적으로 분포하는 짧은 회문 반복 서열(CRISPR) 시스템의 예측된 유병률 및 미생물 종의 완전한 다양성에 비해, 기능적으로 특성화된 CRISPR/Cas 효소는 문헌에 상대적으로 거의 없다. 이것은 부분적으로 엄청난 수의 미생물 종들이 실험실 조건에서 쉽게 배양되지 않을 수 있기 때문이다. 매우 많은 수의 미생물 종을 함유하는 자연 환경적 지위(environmental niche)로부터 메타게놈 시퀀싱(metagenomic sequencing)은 알려진 새로운 CRISPR/Cas 시스템의 수를 크게 증가시키고, 새로운 올리고뉴클레오타이드 편집 기능의 발견을 가속화할 잠재력을 제공할 수 있다. 이러한 접근 방식의 결실에 대한 최근의 예는 2016년에 천연 미생물 군집의 메타게놈 분석으로부터 CasX/CasY CRISPR 시스템의 발견으로 입증되었다.
CRISPR/Cas 시스템은 미생물에서 적응 면역 시스템으로서 기능하는 것으로 기술된 RNA-유도 뉴클레아제 복합체이다. 이들의 자연적 맥락에서, CRISPR/Cas 시스템은 CRISPR(일정한 간격을 두고 주기적으로 분포하는 짧은 회문 반복 서열) 오페론 또는 유전자좌에서 발생하며, 일반적으로 다음과 같은 2 개의 부분을 포함한다: (i) RNA-기반 표적화 요소를 코딩하는 동등하게 짧은 스페이서 서열에 의해 분리된 짧은 반복 서열(30-40 bp)의 어레이, 및 (ii) 부속 단백질/효소와 함께 RNA-기반 표적화 요소에 의해 유도되는 뉴클레아제 폴리펩타이드를 코딩하는 Cas를 코딩하는 ORF. 특정 표적 핵산 서열의 효율적인 뉴클레아제 표적화는 일반적으로 (i) 표적의 처음 6-8 개의 핵산(표적 시드)과 crRNA 가이드 사이의 상보성 혼성화; 및 (ii) 표적 시드의 정의된 부근 내에 프로토스페이서 인접 모티프(PAM) 서열의 존재(PAM은 일반적으로 숙주 게놈 내에서 일반적으로 나타내지 않는 서열임) 둘 모두를 필요로 한다. 시스템의 정확한 기능 및 조직화에 따라, CRISPR-Cas 시스템은 공통된 기능적 특성 및 진화적 유사성을 기반으로 하여 일반적으로 2가지 클래스, 5가지 타입 및 16가지 하위 타입으로 조직화된다(도 1 참조).
클래스 I CRISPR-Cas 시스템은 큰 다중-서브유닛 이펙터 복합체를 가지며, 타입 I, III 및 IV를 포함한다. 클래스 II CRISPR-Cas 시스템은 일반적으로 단일-폴리펩타이드 다중도메인 뉴클레아제 이펙터를 가지며, 타입 II, V 및 VI을 포함한다.
타입 II CRISPR-Cas 시스템은 구성요소 측면에서 가장 단순한 것으로 간주된다. 타입 II CRISPR-Cas 시스템에서, CRISPR 어레이를 성숙 crRNA로 처리하는 것은 특별한 엔도뉴클레아제 서브유닛의 존재를 필요로 하지 않지만, 어레이 반복부 서열에 상보성인 영역이 있는 작은 트랜스 코딩되는 crRNA(tracrRNA)를 필요로 하고; tracrRNA는 그의 상응하는 이펙터 뉴클레아제(예를 들어, Cas9) 및 반복부 서열 둘 모두와 상호작용하여 전구체 dsRNA 구조를 형성하고, 이는 내인성 RNAse III에 의해 절단되어 tracrRNA와 crRNA 둘 모두가 로딩된 성숙한 이펙터 효소를 생성한다. Cas II 뉴클레아제는 DNA 뉴클레아제로 알려져 있다. 타입 2 이펙터는 일반적으로 RuvC-유사 뉴클레아제 도메인의 폴드 내에 삽입된 관련 없는 HNH 뉴클레아제 도메인과 함께 RNase H 폴드를 채택하는 RuvC-유사 엔도뉴클레아제 도메인으로 이루어진 구조를 나타낸다. RuvC-유사 도메인은 표적(예를 들어, crRNA 상보성) DNA 가닥의 절단을 담당하는 반면, HNH 도메인은 치환된 DNA 가닥의 절단을 담당한다.
타입 V CRISPR-Cas 시스템은 RuvC-유사 도메인을 포함하는 타입 II 이펙터의 구조와 유사한 뉴클레아제 이펙터(예를 들어, Cas12) 구조를 특징으로 한다. 타입 II와 유사하게, 타입 V CRISPR 시스템의 대부분(전부는 아님)은 tracrRNA를 사용하여 프리-crRNA를 성숙 crRNA로 가공하지만; 프리-crRNA를 여러 crRNA로 절단하기 위해 RNAse III를 필요로 하는 타입 II 시스템과는 달리 타입 V 시스템은 이펙터 뉴클레아제 자체를 사용하여 프리-crRNA를 절단할 수 있다. 타입-II CRISPR-Cas 시스템과 마찬가지로, 타입 V CRISPR-Cas 시스템은 다시 DNA 뉴클레아제로 알려져 있다. 타입 II CRISPR-Cas 시스템과 달리, 일부 타입 V 효소(예를 들어, Cas12a)는 이중-가닥 표적 서열의 첫 번째 crRNA 유도 절단에 의해 활성화되는 강력한 단일-가닥 비특이적 데옥시리보뉴클레아제 활성을 갖는 것으로 보인다.
CRISPR-Cas 시스템은 이들의 표적화 가능성 및 사용 용이성으로 인해 최근 몇 년 동안 선택되는 유전자 편집 기술로 등장하였다. 가장 일반적으로 사용되는 시스템은 클래스 2 타입 II SpCas9 및 클래스 2 타입 V-A Cas12a(이전에는 Cpf1)이다. 특히, 타입 V-A 시스템은 표적-외 효과가 적거나 없으면서 세포에서 이들의 보고된 특이성이 다른 뉴클레아제보다 높기 때문에 더 널리 사용되고 있다. V-A 시스템은 또한 가이드 RNA가 작고(SpCas9의 경우 약 100 nt와 비교하여 42-44 개의 뉴클레오타이드) CRISPR 어레이로부터의 전사 후 뉴클레아제 자체에 의해 가공되어, 다중 유전자 편집으로 다중화된 적용을 단순화한다는 점에서 유리하다. 또한, V-A 시스템은 엇갈린 절단 부위를 가지는데, 이는 미세상동-의존적 표적화된 통합(MITI)과 같은 지시된 복구 경로를 용이하게 할 수 있다.
가장 일반적으로 사용되는 타입 V-A 효소는 선택된 표적 부위 옆에 5' 프로토스페이서 인접 모티프(PAM)를 필요로 한다: 라크노스피라세아이 박테리움 ND2006 LbCas12a 및 애시드아미노코쿠스 종 AsCas12a의 경우 5'-TTTV-3'; 및 프란시셀라 노비시다 FnCas12a의 경우 5'-TTV-3'. 오솔로그의 최근 탐색은 포유동물 세포 배양물, 예를 들어, YTV, YYN 또는 TTN에서도 활성인 덜 제한적인 PAM 서열을 갖는 단백질을 밝혀냈다. 그러나, 이러한 효소는 V-A 생물다양성 및 표적화 가능성을 완전히 포함하지 않으며, 모든 가능한 활성 및 PAM 서열 요건을 나타내지 않을 수 있다. 여기서, 수천 개의 게놈 단편이 타입 V-A 뉴클레아제에 대한 수많은 메타게놈으로부터 마이닝되었다. V-A 효소의 공지된 다양성은 확장될 수 있고, 신규한 시스템은 고도로 표적화 가능하고, 콤팩트하고, 정밀한 유전자 편집 제제로 개발될 수 있다.
MG 효소
타입 V-A CRISPR 시스템은 다양한 게놈 편집 적용에 사용하기 위해 신속히 채택되고 있다. 이러한 프로그래밍 가능한 뉴클레아제는 적응성 미생물 면역계의 일부이며, 이의 자연적 다양성은 크게 탐구되지 않았다. 타입 V-A CRISPR 효소의 신규한 패밀리는 다양한 복합적인 환경으로부터 수집된 메타게놈의 대규모 분석을 통해 확인되었고, 이러한 시스템의 대표를 유전자-편집 플랫폼으로 개발하였다. 뉴클레아제는 계통발생적으로 다양하고(도 4a 참조) 특정 모티프를 갖는 단일 가이드 RNA를 인식한다. 이러한 시스템의 대부분은 비배양 유기체로부터 유래하며, 이들 중 일부는 동일한 CRISPR 오페론 내에서 분기형 V 이펙터를 코딩한다. 생화학적 분석에 의해 예상치 못한 PAM 다양성이 밝혀졌는데(도 4b 참조), 이는 이러한 시스템이 다양한 게놈 조작 적용을 용이하게 할 것임을 지시한다. 인간 세포주에서 가이드 서열 및 활성의 단순성은 유전자 및 세포 요법에서의 유용성을 시사한다.
일부 측면에서, 본 개시내용은 신규한 타입 V-L 후보를 제공한다(도 27 참조). 타입 V-L은 신규한 서브타입일 수 있고 일부 서브패밀리가 확인되었을 수 있다. 이러한 뉴클레아제는 약 1000 - 1100 개의 아미노산 길이이다. 타입 V-L은 타입 V-A 이펙터와 동일한 CRISPR 유전자좌에서 발견될 수 있다. RuvC 촉매 잔기는 타입 V-L 후보에 대해 확인되었을 수 있고, 이러한 타입 V-L 후보는 tracrRNA를 필요로 하지 않을 수 있다. 타입 V-L의 한 가지 예는 본원에 기재된 MG60 뉴클레아제이다(도 28 및 도 32 참조).
일부 측면에서, 본 개시내용은 더 소형의 타입 V 이펙터를 제공한다(도 30 참조). 이러한 이펙터는 소형 추정 이펙터일 수 있다. 이러한 이펙터는 전달을 단순화할 수 있고 치료 적용을 확장할 수 있다.
일부 측면에서, 본 개시내용은 신규한 타입 V 이펙터를 제공한다. 이러한 이펙터는 본원에 기재된 바와 같은 MG70일 수 있다(도 29 참조). MG70은 약 373 개 아미노산 길이의 초소형 효소일 수 있다. MG70은 N-말단에 단일 트랜스포사제 도메인을 가질 수 있고, 예측된 tracrRNA를 가질 수 있다(도 30 및 도 32 참조).
일부 측면에서, 본 개시내용은 더 소형의 타입 V 이펙터를 제공한다(도 31 참조). 이러한 이펙터는 본원에 기재된 MG81일 수 있다. MG81은 약 500-700 개 아미노산 길이일 수 있고, RuvC, 및 HTH DNA 결합 도메인을 함유할 수 있다.
일 측면에서, 본 개시내용은 메타게놈 시퀀싱을 통해 발견된 조작된 뉴클레아제 시스템을 제공한다. 일부 경우에, 메타게놈 시퀀싱은 샘플에 대해 수행된다. 일부 경우에, 샘플은 다양한 환경에서 수집될 수 있다. 이러한 환경은 인간 마이크로바이옴, 동물 마이크로바이옴, 고온 환경, 저온 환경일 수 있다. 이러한 환경은 퇴적물을 포함할 수 있다. 본원에 기재된 조작된 뉴클레아제 시스템의 이러한 환경의 유형의 예는 도 2에서 찾아볼 수 있다.
일 측면에서, 본 개시내용은 (a) 엔도뉴클레아제를 포함하는 조작된 뉴클레아제 시스템을 제공한다. 일부 경우에, 엔도뉴클레아제는 Cas 엔도뉴클레아제이다. 일부 경우에, 엔도뉴클레아제는 클래스 2, 타입 V Cas 엔도뉴클레아제이다. 일부 경우에, 엔도뉴클레아제는 클래스 2, 타입 V-A Cas 엔도뉴클레아제이다. 일부 경우에, 엔도뉴클레아제는 비배양 미생물로부터 유래된다. 엔도뉴클레아제는 RuvC 도메인을 포함할 수 있다. 일부 경우에, 조작된 뉴클레아제 시스템은 (b) 조작된 가이드 RNA를 포함한다. 일부 경우에, 조작된 가이드 RNA는 엔도뉴클레아제와 복합체를 형성하도록 구성된다. 일부 경우에, 조작된 가이드 RNA는 스페이서 서열을 포함한다. 일부 경우에, 스페이서 서열은 표적 핵산 서열에 혼성화하도록 구성된다.
일 측면에서, 본 개시내용은 (a) 엔도뉴클레아제를 포함하는 조작된 뉴클레아제 시스템을 제공한다. 일부 경우에서, 엔도뉴클레아제는 서열 번호 1-3470 중 어느 하나에 대해 적어도 약 70%의 서열 동일성을 갖는다. 일부 경우에, 엔도뉴클레아제는 서열 번호 1-3470 중 어느 하나에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99%의 동일성을 갖는다.
일부 경우에, 엔도뉴클레아제는 서열 번호 1-3470 중 어느 하나에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99%의 동일성을 갖는 변이체를 포함한다. 일부 경우에, 엔도뉴클레아제는 서열 번호 1-3470 중 어느 하나에 대해 실질적으로 동일할 수 있다.
일부 경우에, 조작된 뉴클레아제 시스템은 조작된 가이드 RNA를 포함한다. 일부 경우에, 조작된 가이드 RNA는 엔도뉴클레아제와 복합체를 형성하도록 구성된다. 일부 경우에, 조작된 가이드 RNA는 스페이서 서열을 포함한다. 일부 경우에, 스페이서 서열은 표적 핵산 서열에 혼성화하도록 구성된다.
일 측면에서, 본 개시내용은 (a) 엔도뉴클레아제를 포함하는 조작된 뉴클레아제 시스템을 제공한다. 일부 경우에, 엔도뉴클레아제는 프로토스페이서 인접 모티프(PAM) 서열에 결합하도록 구성된다. 일부 경우에, PAM 서열은 서열 번호 3863-3913 중 어느 하나에 대해 실질적으로 동일하다. 일부 경우에, PAM 서열 서열 번호 3863-3913 중 어느 하나. 일부 경우에, 엔도뉴클레아제는 Cas 엔도뉴클레아제이다. 일부 경우에, 엔도뉴클레아제는 클래스 2 Cas 엔도뉴클레아제이다. 일부 경우에, 엔도뉴클레아제는 클래스 2, 타입 V Cas 엔도뉴클레아제이다. 일부 경우에, 엔도뉴클레아제는 클래스 2, 타입 V-A Cas 엔도뉴클레아제이다. 일부 경우에, 조작된 뉴클레아제 시스템은 (b) 조작된 가이드 RNA를 포함한다. 일부 경우에, 조작된 가이드 RNA는 엔도뉴클레아제와 복합체를 형성하도록 구성된다. 일부 경우에, 조작된 가이드 RNA는 스페이서 서열을 포함한다. 일부 경우에, 스페이서 서열은 표적 핵산 서열에 혼성화하도록 구성된다.
일부 경우에, 엔도뉴클레아제는 Cpf1 또는 Cms1 엔도뉴클레아제가 아니다. 일부 경우에, 엔도뉴클레아제는 징크 핑거-유사 도메인을 추가로 포함한다.
일부 경우에, 가이드 RNA는 서열 번호 3471, 3539, 3551-3559, 3608-3609, 3612, 3636-3637, 3640-3641, 3644-3645, 3648-3649, 3652-3653, 3656-3657, 3660-3661, 3664-3667, 3671-3672, 3677-3678, 3695-3696, 3729-3730, 3734-3735, 또는 3851-3857의 처음 19 개 뉴클레오타이드 또는 비-축퇴성 뉴클레오타이드에 대해 적어도 80%의 서열 동일성을 갖는 서열을 포함한다. 일부 경우에, 가이드 RNA는 서열 번호 3471, 3539, 3551-3559, 3608-3609, 3612, 3636-3637, 3640-3641, 3644-3645, 3648-3649, 3652-3653, 3656-3657, 3660-3661, 3664-3667, 3671-3672, 3677-3678, 3695-3696, 3729-3730, 3734-3735, 또는 3851-3857의 처음 19 개 뉴클레오타이드 또는 비-축퇴성 뉴클레오타이드에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99%의 동일성을 갖는 서열을 포함한다. 일부 경우에, 가이드 RNA는 서열 번호 3471, 3539, 3551-3559, 3608-3609, 3612, 3636-3637, 3640-3641, 3644-3645, 3648-3649, 3652-3653, 3656-3657, 3660-3661, 3664-3667, 3671-3672, 3677-3678, 3695-3696, 3729-3730, 3734-3735, 또는 3851-3857의 처음 19 개 뉴클레오타이드 또는 비-축퇴성 뉴클레오타이드에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99%의 동일성을 갖는 변이체를 포함한다. 일부 경우에, 가이드 RNA는 서열 번호 3471, 3539, 3551-3559, 3608-3609, 3612, 3636-3637, 3640-3641, 3644-3645, 3648-3649, 3652-3653, 3656-3657, 3660-3661, 3664-3667, 3671-3672, 3677-3678, 3695-3696, 3729-3730, 3734-3735, 또는 3851-3857의 처음 19 개 뉴클레오타이드 또는 비-축퇴성 뉴클레오타이드에 대해 실질적으로 동일한 서열을 포함한다.
일부 경우에, 가이드 RNA는 서열 번호 3471, 3539, 3551-3559, 3608-3609, 3612, 3636-3637, 3640-3641, 3644-3645, 3648-3649, 3652-3653, 3656-3657, 3660-3661, 3664-3667, 3671-3672, 3677-3678, 3695-3696, 3729-3730, 3734-3735, 또는 3851-3857의 처음 19 개 뉴클레오타이드 또는 비-축퇴성 뉴클레오타이드에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99%의 동일성을 갖는 서열을 포함한다. 일부 경우에, 엔도뉴클레아제는 조작된 가이드 RNA에 결합하도록 구성된다. 일부 경우에, Cas 엔도뉴클레아제는 조작된 가이드 RNA에 결합하도록 구성된다. 일부 경우에, 클래스 2 Cas 엔도뉴클레아제는 조작된 가이드 RNA에 결합하도록 구성된다. 일부 경우에, 클래스 2, 타입 V Cas 엔도뉴클레아제는 조작된 가이드 RNA에 결합하도록 구성된다. 일부 경우에, 클래스 2, 타입 V-A Cas 엔도뉴클레아제는 조작된 가이드 RNA에 결합하도록 구성된다.
일부 경우에, 엔도뉴클레아제는 서열 번호 3863-3913 중 어느 하나를 포함하는 프로토스페이서 인접 모티프(PAM) 서열에 결합하도록 구성된다.
일부 경우에, 가이드 RNA는 진핵생물, 진균, 식물, 포유동물, 또는 인간 게놈 폴리뉴클레오타이드 서열에 상보성인 서열을 포함한다. 일부 경우에, 가이드 RNA는 진핵생물 게놈 폴리뉴클레오타이드 서열에 상보성인 서열을 포함한다. 일부 경우에, 가이드 RNA는 진균 게놈 폴리뉴클레오타이드 서열에 상보성인 서열을 포함한다. 일부 경우에, 가이드 RNA는 식물 게놈 폴리뉴클레오타이드 서열에 상보성인 서열을 포함한다. 일부 경우에, 가이드 RNA는 포유동물 게놈 폴리뉴클레오타이드 서열에 상보성인 서열을 포함한다. 일부 경우에, 가이드 RNA는 인간 게놈 폴리뉴클레오타이드 서열에 상보성인 서열을 포함한다.
일부 경우에, 가이드 RNA는 30-250 개 뉴클레오타이드 길이이다. 일부 경우에, 가이드 RNA는 42-44 개 뉴클레오타이드 길이이다. 일부 경우에, 가이드 RNA는 42 개 뉴클레오타이드 길이이다. 일부 경우에, 가이드 RNA는 43 개 뉴클레오타이드 길이이다. 일부 경우에, 가이드 RNA는 44 개 뉴클레오타이드 길이이다. 일부 경우에, 가이드 RNA는 85-245 개 뉴클레오타이드 길이이다. 일부 경우에, 가이드 RNA는 90 개 초과의 뉴클레오타이드 길이이다. 일부 경우에, 가이드 RNA는 245 개 미만의 뉴클레오타이드 길이이다.
일부 경우에, 엔도뉴클레아제는 하나 이상의 핵 국소화 서열(NLS)을 갖는 변이체를 포함할 수 있다. NLS는 엔도뉴클레아제의 N-말단 또는 C-말단에 근접할 수 있다. 일부 경우에, NLS는 N-말단 또는 C-말단으로 서열 번호 3938-3953 중 어느 하나에 대해 또는 서열 번호 3938-3953 중 어느 하나에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99%의 동일성을 갖는 변이체에 부착될 수 있다. 일부 경우에, NLS는 서열 번호 3938-3953 중 어느 하나에 대해 실질적으로 동일한 서열을 포함할 수 있다.
[표 1] 본 개시내용에 따라 Cas 이펙터와 함께 사용될 수 있는 예시적인 NLS 서열
Figure pct00001
일부 경우에, 조작된 뉴클레아제 시스템은 단일-가닥 또는 이중-가닥 DNA 복구 주형을 추가로 포함한다. 일부 경우에, 조작된 뉴클레아제 시스템은 단일-가닥 DNA 복구 주형을 추가로 포함한다. 일부 경우에, 조작된 뉴클레아제 시스템은 이중-가닥 DNA 복구 주형을 추가로 포함한다. 일부 경우에서, 단일-가닥 또는 이중-가닥 DNA 복구 주형은 5'에서 3'으로 상기 표적 데옥시리보핵산 서열의 5'에 적어도 20 개의 뉴클레오타이드의 서열을 포함하는 제1 상동성 아암(arm), 적어도 10 개의 뉴클레오타이드의 합성 DNA 서열, 및 상기 표적 서열의 3'에 적어도 20 개의 뉴클레오타이드의 서열을 포함하는 제2 상동성 아암을 포함할 수 있다.
일부 경우에, 제1 상동성 아암은 적어도 40 개, 적어도 50 개, 적어도 60 개, 적어도 70 개, 적어도 80 개, 적어도 90 개, 적어도 100 개, 적어도 110 개, 적어도 120 개, 적어도 130 개, 적어도 140 개, 적어도 150 개, 적어도 175 개, 적어도 200 개, 적어도 250 개, 적어도 300 개, 적어도 400 개, 적어도 500 개, 적어도 750 개, 또는 적어도 1000 개 뉴클레오타이드의 서열을 포함한다. 일부 경우에, 제2 상동성 아암은 적어도 40 개, 적어도 50 개, 적어도 60 개, 적어도 70 개, 적어도 80 개, 적어도 90 개, 적어도 100 개, 적어도 110 개, 적어도 120 개, 적어도 130 개, 적어도 140 개, 적어도 150 개, 적어도 175 개, 적어도 200 개, 적어도 250 개, 적어도 300 개, 적어도 400 개, 적어도 500 개, 적어도 750 개, 또는 적어도 1000 개 뉴클레오타이드의 서열을 포함한다.
일부 경우에, 제1 및 제2 상동성 아암은 원핵생물의 게놈 서열에 상동성이다. 일부 경우에, 제1 및 제2 상동성 아암은 박테리아의 게놈 서열에 상동성이다. 일부 경우에, 제1 및 제2 상동성 아암은 진균의 게놈 서열에 상동성이다. 일부 경우에, 제1 및 제2 상동성 아암은 진핵생물의 게놈 서열에 상동성이다.
일부 경우에, 조작된 뉴클레아제 시스템은 DNA 복구 주형을 추가로 포함한다. DNA 복구 주형은 이중-가닥 DNA 세그먼트를 포함할 수 있다. 이중-가닥 DNA 세그먼트에는 하나의 단일-가닥 DNA 세그먼트가 측접될 수 있다. 이중-가닥 DNA 세그먼트에는 2 개의 단일-가닥 DNA 세그먼트가 측접될 수 있다. 일부 경우에, 단일-가닥 DNA 세그먼트는 이중-가닥 DNA 세그먼트의 5' 말단에 접합된다. 일부 경우에, 단일-가닥 DNA 세그먼트는 이중-가닥 DNA 세그먼트의 3' 말단에 접합된다.
일부 경우에, 단일-가닥 DNA 세그먼트는 1 개 내지 15 개의 뉴클레오타이드 염기의 길이를 갖는다. 일부 경우에, 단일-가닥 DNA 세그먼트는 4 개 내지 10 개의 뉴클레오타이드 염기의 길이를 갖는다. 일부 경우에, 단일-가닥 DNA 세그먼트는 4 개의 뉴클레오타이드 염기의 길이를 갖는다. 일부 경우에, 단일-가닥 DNA 세그먼트는 5 개의 뉴클레오타이드 염기의 길이를 갖는다. 일부 경우에, 단일-가닥 DNA 세그먼트는 6 개의 뉴클레오타이드 염기의 길이를 갖는다. 일부 경우에, 단일-가닥 DNA 세그먼트는 7 개의 뉴클레오타이드 염기의 길이를 갖는다. 일부 경우에, 단일-가닥 DNA 세그먼트는 8 개의 뉴클레오타이드 염기의 길이를 갖는다. 일부 경우에, 단일-가닥 DNA 세그먼트는 9 개의 뉴클레오타이드 염기의 길이를 갖는다. 일부 경우에, 단일-가닥 DNA 세그먼트는 10 개의 뉴클레오타이드 염기의 길이를 갖는다.
일부 경우에, 단일-가닥 DNA 세그먼트는 스페이서 서열 내의 서열에 상보성인 뉴클레오타이드 서열을 갖는다. 일부 경우에, 이중-가닥 DNA 서열은 바코드, 개방형 해독틀, 인핸서, 프로모터, 단백질-코딩 서열, miRNA 코딩 서열, RNA 코딩 서열, 또는 트랜스진을 포함한다.
일부 경우에, 조작된 뉴클레아제 시스템은 Mg2+의 공급원을 추가로 포함한다.
일부 경우에, 가이드 RNA는 적어도 8 개의 염기쌍을 이루는 리보뉴클레오타이드를 포함하는 헤어핀을 포함한다. 일부 경우에, 가이드 RNA는 적어도 9 개의 염기쌍을 이루는 리보뉴클레오타이드를 포함하는 헤어핀을 포함한다. 일부 경우에, 가이드 RNA는 적어도 10 개의 염기쌍을 이루는 리보뉴클레오타이드를 포함하는 헤어핀을 포함한다. 일부 경우에, 가이드 RNA는 적어도 11 개의 염기쌍을 이루는 리보뉴클레오타이드를 포함하는 헤어핀을 포함한다. 일부 경우에, 가이드 RNA는 적어도 12 개의 염기쌍을 이루는 리보뉴클레오타이드를 포함하는 헤어핀을 포함한다.
일부 경우에, 엔도뉴클레아제는 서열 번호 141, 215, 229, 261, 또는 1711-1721 중 어느 하나 또는 이의 변이체에 대해 적어도 70% 동일한 서열을 포함한다. 일부 경우에, 엔도뉴클레아제는 서열 번호 141, 215, 229, 261, 또는 1711-1721 중 어느 하나 또는 이의 변이체에 대해 적어도 75% 동일한 서열을 포함한다. 일부 경우에, 엔도뉴클레아제는 서열 번호 141, 215, 229, 261, 또는 1711-1721 중 어느 하나 또는 이의 변이체에 대해 적어도 80% 동일한 서열을 포함한다. 일부 경우에, 엔도뉴클레아제는 서열 번호 141, 215, 229, 261, 또는 1711-1721 중 어느 하나 또는 이의 변이체에 대해 적어도 85% 동일한 서열을 포함한다. 일부 경우에, 엔도뉴클레아제는 서열 번호 141, 215, 229, 261, 또는 1711-1721 중 어느 하나 또는 이의 변이체에 대해 적어도 90% 동일한 서열을 포함한다. 일부 경우에, 엔도뉴클레아제는 서열 번호 141, 215, 229, 261, 또는 1711-1721 중 어느 하나 또는 이의 변이체에 대해 적어도 95% 동일한 서열을 포함한다.
일부 경우에, 가이드 RNA 구조는 서열 번호 3608의 처음 19 개 뉴클레오타이드 또는 비-축퇴성 뉴클레오타이드에 대해 적어도 70% 동일한 서열을 포함한다. 일부 경우에, 가이드 RNA 구조는 서열 번호 3608의 처음 19 개 뉴클레오타이드 또는 비-축퇴성 뉴클레오타이드에 대해 적어도 75% 동일한 서열을 포함한다. 일부 경우에, 가이드 RNA 구조는 서열 번호 3608의 처음 19 개 뉴클레오타이드 또는 비-축퇴성 뉴클레오타이드에 대해 적어도 80% 동일한 서열을 포함한다. 일부 경우에, 가이드 RNA 구조는 서열 번호 3608의 처음 19 개 뉴클레오타이드 또는 비-축퇴성 뉴클레오타이드에 대해 적어도 85% 동일한 서열을 포함한다. 일부 경우에, 가이드 RNA 구조는 서열 번호 3608의 처음 19 개 뉴클레오타이드 또는 비-축퇴성 뉴클레오타이드에 대해 적어도 90% 동일한 서열을 포함한다. 일부 경우에, 가이드 RNA 구조는 서열 번호 3608의 처음 19 개 뉴클레오타이드 또는 비-축퇴성 뉴클레오타이드에 대해 적어도 95% 동일한 서열을 포함한다. 일부 경우에, 엔도뉴클레아제는 서열 번호 3863-3913 중 어느 하나를 포함하는 PAM에 결합하도록 구성된다.
일부 경우에, 서열은 BLASTP, CLUSTALW, MUSCLE, 또는 MAFFT 알고리즘, 또는 스미쓰-워터맨 상동성 검색 알고리즘 매개변수를 갖는 CLUSTALW 알고리즘에 의해 결정될 수 있다. 서열 동일성은 단어 길이(W) 3, 기대값(E) 10, 및 기존 11, 연장 1에서의 BLOSUM62 스코어링 매트릭스 설정 갭 코스트의 매개변수를 사용하고, 조건부 조성 점수 매트릭스 조정을 사용하여 상기 BLASTP 상동성 검색 알고리즘에 의해 결정될 수 있다.
일 측면에서, 본 개시내용은 (a) DNA-표적화 세그먼트를 포함하는 조작된 가이드 RNA를 제공한다. 일부 경우에, DNA-표적화 세그먼트는 표적 서열에 상보성인 뉴클레오타이드 서열을 포함한다. 일부 경우에, 표적 서열은 표적 DNA 분자에 있다. 일부 경우에, 조작된 가이드 RNA는 (b) 단백질-결합 세그먼트를 포함한다. 일부 경우에, 단백질-결합 세그먼트는 뉴클레오타이드의 2 개의 상보성 스트레치를 포함한다. 일부 경우에, 뉴클레오타이드의 2 개의 상보성 스트레치는 혼성화되어 이중-가닥 RNA(dsRNA) 이중체를 형성한다. 일부 경우에, 뉴클레오타이드의 2 개의 상보성 스트레치는 개재 뉴클레오타이드로 서로 공유 연결된다. 일부 경우에, 조작된 가이드 리보핵산 폴리뉴클레오타이드는 엔도뉴클레아제와 복합체를 형성할 수 있다. 일부 경우에, 엔도뉴클레아제는 서열 번호 1-3470 중 어느 하나에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99%의 동일성을 갖는다. 일부 경우에, 복합체는 표적 DNA 분자의 표적 서열을 표적화한다.
일부 경우에, DNA-표적화 세그먼트는 뉴클레오타이드의 2 개의 상보성 스트레치 둘 모두의 3'에 위치한다. 일부 경우에, 단백질 결합 세그먼트는 서열 번호 3608의 처음 19 개 뉴클레오타이드 또는 비-축퇴성 뉴클레오타이드에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99%의 동일성을 갖는 서열을 포함한다.
일부 경우에, 이중-가닥 RNA(dsRNA) 이중체는 적어도 8 개의 리보뉴클레오타이드를 포함한다. 일부 경우에, 이중-가닥 RNA(dsRNA) 이중체는 적어도 9 개의 리보뉴클레오타이드를 포함한다. 일부 경우에, 이중-가닥 RNA(dsRNA) 이중체는 적어도 10 개의 리보뉴클레오타이드를 포함한다. 일부 경우에, 이중-가닥 RNA(dsRNA) 이중체는 적어도 11 개의 리보뉴클레오타이드를 포함한다. 일부 경우에, 이중-가닥 RNA(dsRNA) 이중체는 적어도 12 개의 리보뉴클레오타이드를 포함한다.
일부 경우에, 데옥시리보핵산 폴리뉴클레오타이드는 조작된 가이드 리보핵산 폴리뉴클레오타이드를 코딩한다.
일 측면에서, 본 개시내용은 조작된 핵산 서열을 포함하는 핵산을 제공한다. 일부 경우에, 조작된 핵산 서열은 유기체에서의 발현을 위해 최적화된다. 일부 경우에, 핵산은 엔도뉴클레아제를 코딩한다. 일부 경우에, 엔도뉴클레아제는 Cas 엔도뉴클레아제이다. 일부 경우에, 엔도뉴클레아제는 클래스 2 엔도뉴클레아제이다. 일부 경우에, 엔도뉴클레아제는 클래스 2, 타입 V Cas 엔도뉴클레아제이다. 일부 경우에, 엔도뉴클레아제는 클래스 2, 타입 V-A Cas 엔도뉴클레아제이다. 일부 경우에, 엔도뉴클레아제는 비배양 미생물로부터 유래된다. 일부 경우에, 유기체는 비배양 유기체가 아니다.
일부 경우에, 엔도뉴클레아제는 서열 번호 1-3470 중 어느 하나에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 변이체를 포함한다.
일부 경우에, 엔도뉴클레아제는 하나 이상의 핵 국소화 서열(NLS)을 갖는 변이체를 포함할 수 있다. NLS는 엔도뉴클레아제의 N-말단 또는 C-말단에 근접할 수 있다. NLS는 N-말단 또는 C-말단으로 서열 번호 3938-3953의 어느 하나에 대해 또는 서열 번호 3938-3953 중 어느 하나에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 변이체에 부착될 수 있다.
일부 경우에, 유기체는 원핵생물이다. 일부 경우에, 유기체는 박테리아이다. 일부 경우에, 유기체는 진핵생물이다. 일부 경우에, 유기체는 진균이다. 일부 경우에, 유기체는 식물이다. 일부 경우에, 유기체는 포유동물이다. 일부 경우에, 유기체는 설치류이다. 일부 경우에, 유기체는 인간이다.
일 측면에서, 본 개시내용은 조작된 벡터를 제공한다. 일부 경우에, 조작된 벡터는 엔도뉴클레아제를 코딩하는 핵산 서열을 포함한다. 일부 경우에, 엔도뉴클레아제는 Cas 엔도뉴클레아제이다. 일부 경우에, 엔도뉴클레아제는 클래스 2 Cas 엔도뉴클레아제이다. 일부 경우에, 엔도뉴클레아제는 클래스 2, 타입 V Cas 엔도뉴클레아제이다. 일부 경우에, 엔도뉴클레아제는 클래스 2, 타입 V-A Cas 엔도뉴클레아제이다. 일부 경우에, 엔도뉴클레아제는 비배양 미생물로부터 유래된다.
일부 경우에, 조작된 벡터는 본원에 기재된 핵산을 포함한다. 일부 경우에, 본원에 기재된 핵산은 본원에 기재된 데옥시리보핵산 폴리뉴클레오타이드이다. 일부 경우에, 벡터는 플라스미드, 미니서클, CELiD, 아데노-관련 바이러스(AAV) 유래된 비리온, 또는 렌티바이러스이다.
일 측면에서, 본 개시내용은 본원에 기재된 벡터를 포함하는 세포를 제공한다.
일 측면에서, 본 개시내용은 엔도뉴클레아제를 제조하는 방법을 제공한다. 일부 경우에, 방법은 세포를 배양하는 것을 포함한다.
일 측면에서, 본 개시내용은 이중-가닥 데옥시리보핵산 폴리뉴클레오타이드를 결합, 절단, 마킹, 또는 변형시키는 방법을 제공한다. 상기 방법은 이중-가닥 데옥시리보핵산 폴리뉴클레오타이드를 엔도뉴클레아제와 접촉시키는 것을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 Cas 엔도뉴클레아제이다. 일부 경우에, 엔도뉴클레아제는 클래스 2 Cas 엔도뉴클레아제이다. 일부 경우에, 엔도뉴클레아제는 클래스 2, 타입 V Cas 엔도뉴클레아제이다. 일부 경우에, 엔도뉴클레아제는 클래스 2, 타입 V-A Cas 엔도뉴클레아제이다. 일부 경우에, 엔도뉴클레아제는 조작된 가이드 RNA와 복합체를 형성한다. 일부 경우에, 조작된 가이드 RNA는 엔도뉴클레아제에 결합하도록 구성된다. 일부 경우에, 조작된 가이드 RNA는 이중-가닥 데옥시리보핵산 폴리뉴클레오타이드에 결합하도록 구성된다. 일부 경우에, 조작된 가이드 RNA는 엔도뉴클레아제에 및 이중-가닥 데옥시리보핵산 폴리뉴클레오타이드에 결합하도록 구성된다. 일부 경우에, 이중-가닥 데옥시리보핵산 폴리뉴클레오타이드는 프로토스페이서 인접 모티프(PAM)를 포함한다. 일부 경우에, PAM 서열은 서열 번호 3863-3913 중 어느 하나를 포함하는 서열을 포함한다.
일부 경우에, 이중-가닥 데옥시리보핵산 폴리뉴클레오타이드는 조작된 가이드 RNA의 서열에 상보성인 서열을 포함하는 제1 가닥 및 PAM을 포함하는 제2 가닥을 포함한다. 일부 경우에, PAM은 조작된 가이드 RNA의 서열에 상보성인 서열의 5' 말단에 바로 인접한다. 일부 경우에, 엔도뉴클레아제는 Cpf1 엔도뉴클레아제 또는 Cms1 엔도뉴클레아제가 아니다. 일부 경우에, 엔도뉴클레아제는 비배양 미생물로부터 유래된다. 일부 경우에, 이중-가닥 데옥시리보핵산 폴리뉴클레오타이드는 진핵생물, 식물, 진균, 포유동물, 설치류, 또는 인간 이중-가닥 데옥시리보핵산 폴리뉴클레오타이드이다. 일부 경우에, PAM은 서열 번호 3863-3913 중 어느 하나를 포함한다.
일 측면에서, 본 개시내용은 표적 핵산 유전자좌를 변형시키는 방법을 제공한다. 상기 방법은 본원에 기재된 조작된 뉴클레아제 시스템을 표적 핵산 유전자좌에 전달하는 것을 포함할 수 있다. 일부 경우에, 엔도뉴클레아제는 조작된 가이드 리보핵산 구조와 복합체를 형성하도록 구성된다. 일부 경우에, 복합체는 표적 핵산 유전자좌에 대한 복합체의 결합 시 복합체가 표적 핵산 유전자좌를 변형시키도록 구성된다.
일부 경우에, 표적 핵산 유전자좌를 변형시키는 것은 상기 표적 핵산 유전자좌를 결합, 니킹, 절단, 또는 마킹하는 것을 포함한다. 일부 경우에, 표적 핵산 유전자좌는 데옥시리보핵산(DNA) 또는 리보핵산(RNA)을 포함한다. 일부 경우에, 표적 핵산 유전자좌는 게놈 DNA, 바이러스 DNA, 바이러스 RNA, 또는 박테리아 DNA를 포함한다. 일부 경우에, 표적 핵산 유전자좌는 시험관 내에 있다. 일부 경우에, 표적 핵산 유전자좌는 세포 내에 있다. 일부 경우에, 세포는 원핵 세포, 박테리아 세포, 진핵 세포, 진균 세포, 식물 세포, 동물 세포, 포유동물 세포, 설치류 세포, 영장류 세포, 또는 인간 세포이다.
일부 경우에, 표적 핵산 유전자좌로의 조작된 뉴클레아제 시스템의 전달은 본원에 기재된 핵산 또는 본원에 기재된 벡터를 전달하는 것을 포함한다. 일부 경우에, 조작된 뉴클레아제 시스템을 표적 핵산 유전자좌로 전달하는 것은 엔도뉴클레아제를 코딩하는 개방형 해독틀을 포함하는 핵산을 전달하는 것을 포함한다. 일부 경우에, 핵산은 프로모터를 포함한다. 일부 경우에, 엔도뉴클레아제를 코딩하는 개방형 해독틀은 프로모터에 작동 가능하게 연결된다.
일부 경우에, 조작된 뉴클레아제 시스템을 표적 핵산 유전자좌로 전달하는 것은 엔도뉴클레아제를 코딩하는 개방형 해독틀을 함유하는 캡핑된 mRNA를 전달하는 것을 포함한다. 일부 경우에, 조작된 뉴클레아제 시스템을 표적 핵산 유전자좌로 전달하는 것은 번역된 폴리펩타이드를 전달하는 것을 포함한다. 일부 경우에, 조작된 뉴클레아제 시스템을 표적 핵산 유전자좌에 전달하는 것은 리보핵산(RNA) pol III 프로모터에 작동 가능하게 연결된 조작된 가이드 RNA를 코딩하는 데옥시리보핵산(DNA)을 전달하는 것을 포함한다.
일부 경우에, 엔도뉴클레아제는 표적 유전자좌에서 또는 표적 유전자좌에 근접하여 단일-가닥 파손 또는 이중-가닥 파손을 유도한다. 일부 경우에, 엔도뉴클레아제는 상기 표적 유전자좌 내에 또는 3'에 엇갈린 단일-가닥 파손을 유도한다.
일부 경우에, 이펙터 반복부 모티프는 MG 뉴클레아제의 가이드 설계를 알리는 데 사용된다. 예를 들어, 타입 V-A 시스템에서 가공된 gRNA는 CRISPR 반복부의 마지막 20-22 개의 뉴클레오타이드로 이루어진다. 이러한 서열은 (스페이서와 함께) crRNA로 합성되고, 합성된 뉴클레아제와 함께, 가능한 표적의 라이브러리에서의 절단에 대해 시험관 내에서 시험될 수 있다. 이러한 방법을 이용하여, PAM이 결정될 수 있다. 일부 경우에, 타입 V-A 효소는 "범용" gRNA를 사용할 수 있다. 일부 경우에, 타입 V 효소는 고유의 gRNA를 필요로 할 수 있다.
본 개시내용의 시스템은 예를 들어 핵산 편집(예를 들어, 유전자 편집), 핵산 분자에 대한 결합(예를 들어, 서열-특이적 결합)과 같은 다양한 적용을 위해 사용될 수 있다. 이러한 시스템은, 예를 들어, 대상체에서 질병을 유발할 수 있는 유전적으로 유전된 돌연변이를 처리(예를 들어, 제거 또는 대체)하여 유전자를 불활성화시킴으로써 세포에서 그의 기능을 확인하기 위해, 질병-유발 유전 요소를 검출하기 위한 진단 도구로서(예를 들어, 역전사된 바이러스 RNA 또는 질병-유발 돌연변이를 코딩하는 증폭된 DNA 서열의 절단을 통해), 특정 뉴클레오타이드 서열(예를 들어, 박테리아에서 항생제 내성을 코딩하는 서열)을 표적화하고 검출하기 위한 프로브와 조합된 불활성화된 효소로서, 바이러스를 불활성화하거나 바이러스 게놈을 표적으로 하여 숙주 세포를 감염시킬 수 없도록 하기 위해, 가치있는 소분자, 거대분자 또는 2차 대사산물을 생성하기 위해 유기체를 조작하도록 유전자를 추가하거나 대사 경로를 수정하기 위해, 진화적 선택을 위한 유전자 구동 요소를 확립하기 위해, 바이오센서로서 외래 소분자 및 뉴클레오타이드에 의한 세포 변화를 검출하기 위해 사용될 수 있다.
실시예
실시예 1 - 새로운 단백질에 대한 메타게놈 분석의 방법
퇴적물, 토양 및 동물로부터 메타게놈 샘플을 수집하였다. 데옥시리보핵산(DNA)을 Zymobiomics DNA 미니-프렙 키트로 추출하고, Illumina HiSeq® 2500에서 시퀀싱하였다. 샘플을 소유자의 동의 하에 수집하였다. 클래스 II 타입 V Cas 이펙터 단백질을 포함하는 공지된 Cas 단백질 서열을 기반으로 하여 생성된 히든 마르코프(Hidden Markov) 모델을 사용하여 메타게놈 서열 데이터를 검색하여 새로운 Cas 이펙터를 확인하였다(고온 샘플과 같은 샘플 유형으로부터 확인된 하나의 패밀리인 MG29에서 검출된 단백질의 분포를 보여주는, 도 2 참조). 검색에 의해 확인된 새로운 이펙터 단백질을 잠재적 활성 부위를 확인하기 위해 공지된 단백질에 정렬하였다(예를 들어, 다양한 샘플로부터 확인된 모든 MG29 패밀리 이펙터가 RuvCI, RuvCII, 및 RuvCIII 촉매 도메인으로부터의 3 개의 촉매 잔기를 갖고 활성인 것으로 예측됨을 보여주는, 도 3 참조). 상기 메타게놈 워크플로우는 본원에 기재된 MG11, MG13, MG19, MG20, MG26, MG28, MG29, MG30, MG31, MG32, MG37, MG53, MG54, MG55, MG56, MG57, MG58, MG59, MG60, MG61, MG62, MG70, MG75, MG77, MG78, MG79, MG80, MG81, MG82, MG83, MG84, MG85, MG90, 및 MG91 패밀리의 설명을 제시하였다. 추정 스페이서 서열을 이펙터 단백질을 코딩하는 게놈 유전자좌에 인접한 이들의 위치에 의해 확인하였다.
실시예 2 - 새로운 단백질에 대한 메타게놈 분석의 방법
13 개의 동물 마이크로바이옴, 고온 생물막 및 퇴적물 샘플을 수집하고 수집 후 얼음 또는 Zymo DNA/RNA Shield에 저장하였다. Qiagen DNeasy PowerSoil 키트 또는 ZymoBIOMICS DNA 미니프렙 키트를 사용하여 샘플로부터 DNA를 추출하였다. DNA 시퀀싱 라이브러리를 400-800 bp 표적 삽입체 크기로 쌍형성된 150 bp 판독으로(10 GB의 시퀀싱은 샘플당 표적화됨) Illumina HiSeq 4000 또는 UC Berkeley의 Vincent J. Coates Genomics Sequencing Laboratory의 Novaseq 기계에서 작제하고 시퀀싱하였다. 공개적으로 이용 가능한 메타게놈 시퀀싱 데이터는 NCBI SRA로부터 다운로드하였다. 시퀀싱 판독을 BBMap(Bushnell B., sourceforge.net/projects/bbmap/)을 사용하여 트리밍하고 Megahit 11로 조립하였다. 개방형 해독틀 및 단백질 서열을 Prodigal로 예측하였다. 공지된 타입 V-A CRISPR 뉴클레아제의 HMM 프로파일을 구축하고, 잠재적인 이펙터를 확인하기 위해 HMMER3(hmmer.org)을 사용하여 모든 예측된 단백질에 대해 검색하였다. 조립된 콘티그 상의 CRISPR 어레이는 Minced(https://github.com/ctSkennerton/minced)로 예측하였다. 분류법을 Kaiju로 단백질에 할당하고, 모든 코딩된 단백질의 컨센서스를 찾아 콘티그 분류법을 결정하였다.
예측 및 참조(예를 들어, LbCas12a, AsCas12a, FnCas12a) 타입 V 이펙터 단백질을 MAFFT로 정렬하고, FasTree2를 사용하여 계통수를 추론하였다. 본 연구로부터 회수된 서열로 구성된 계통군을 확인함으로써 신규한 패밀리를 기술하였다. 패밀리 내에서, 후보는 가능한 많은 계통발생적 다양성을 샘플링하는 방식으로 실험실 분석에 필요한 성분을 함유하는 경우(즉, CRISPR 어레이로 잘 조립되고 주석이 달린 콘티그에서 발견된 경우) 선택하였다. 다양한 패밀리(즉, 더 넓은 범위의 단백질 서열을 공유하는 대표를 갖는 패밀리)의 소형 이펙터에 우선순위가 주어졌다. 선택된 대표 및 참조 서열을 MUSCLE 및 Clustal W를 사용함으로써 정렬하여 촉매 및 PAM 상호작용 잔기를 확인하였다. CRISPR 어레이 반복부를 타입 V-A 시스템, TCTAC-N-GTAGA(1 개 내지 8 개의 N 잔기 함유)와 관련된 모티프에 대해 검색하였다. 이러한 분석으로부터, 대표 CRISPR 어레이가 이러한 모티프 서열 중 하나를 함유하는 경우 패밀리를 추정상 V-A로 분류하였다. 이러한 데이터세트는 V-A 패밀리와 관련된 HMM 프로파일을 확인하는 데 사용되었는데, 이는 차례로 추가 패밀리를 분류하는 데 사용되었다(도 33 내지 도 37 참조). 신규한 Cas12 뉴클레아제를 코딩하는 유기체에 기초하여 신규한 Cas12 뉴클레아제를 명명하는 것이 관례이지만, 본원에 기재된 뉴클레아제에 대해서는 그렇게 하는 것이 불가능하다. 따라서, 관례를 가장 잘 준수하기 위해, 본원에 기재된 시스템은 이들이 조립된 메타게놈 단편으로부터 유래된 것을 나타내기 위해 접두사 MG로 명명된다.
140,867 Mbp의 조립된 메타게놈 시퀀싱 데이터는 다양한 환경(토양, 호열성, 퇴적물, 인간 및 비-인간 마이크로바이옴)로부터 마이닝되었다. 전체적으로, 119 개의 게놈 단편이 CRISPR 어레이 옆에 있는 타입 V-A 뉴클레아제와 먼 관계에 있는 CRISPR 이펙터를 코딩하였다(도 4b 참조). 타입 V-A 이펙터는 서로에 대해 및 참조 서열(예를 들어, LbCas12a, AsCas12a, FnCas12a)과 30% 미만의 평균 쌍별 아미노산 동일성을 공유하는 14 개의 신규 패밀리로 분류되었다. 일부 이펙터는 RuvC 및 알파-나선 인식 도메인, 뿐만 아니라 RuvCI/CII/CIII 도메인으로부터 보존된 DED 뉴클레아제 촉매 잔기(다중 서열 정렬로 확인됨, 예를 들어, 하기 표 1A 참조)를 함유하였는데, 이는 이러한 이펙터가 활성 뉴클레아제임을 시사한다(도 5 내지 도 7). 신규한 타입 V-A 뉴클레아제는 <800 개 내지 1,400 개 아미노산 길이의 크기 범위이고(도 5a 참조), 이들의 분류학적 분류는 가능한 수평 전이를 시사하는 다양한 어레이의 문(도 4a 참조)에 걸쳐 있었다.
타입 V-A CRISPR 시스템을 보유하는 일부 게놈 단편이 또한 본원에서 타입 V-A 프라임(V-A', 도 7a)으로 지칭되는 제2 이펙터를 코딩하였다. 예를 들어, 타입 V-A MG26-1과 단지 16.6%의 아미노산 동일성을 공유한 타입 V-A' MG26-2는 동일한 CRISPR Cas 오페론에서 코딩되었고, MG26-1과 동일한 crRNA를 공유할 수 있다(도 7b). 뉴클레아제 도메인은 예측되지 않았지만, MG26-2는 다중 서열 정렬로부터 확인된 3 개의 RuvC 촉매 잔기를 함유하였다(도 7b).
[표 1A] 정렬에 의해 확인된 본원에 기재된 효소의 촉매 잔기
Figure pct00002
Figure pct00003
실시예 3 - (일반 프로토콜) PAM 서열 확인/입증
CRISPR 이펙터에 의해 시험관 내에서 절단될 수 있는 PAM 서열을, 이펙터를 crRNA 및 crRNA의 스페이서에 상보성인 서열의 5' 말단에 인접하게 위치한 8 개의 무작위화된 뉴클레오타이드를 갖는 플라스미드 라이브러리와 함께 인큐베이션함으로써 확인하였다. 8 개의 무작위화된 뉴클레오타이드가 기능성 PAM 서열을 형성한 경우, 플라스미드는 절단되었을 것이다. 이어서, 절단된 플라스미드의 말단에 어댑터를 라이게이션한 다음, 어댑터를 포함하는 DNA 단편을 시퀀싱함으로써 기능성 PAM 서열을 확인하였다. 추정 엔도뉴클레아제를 이. 콜라이 용해물-기반 발현 시스템(myTXTL, Arbor Biosciences)에서 발현시켰다. 추정 뉴클레아제를 코딩하는 이. 콜라이 코돈 최적화된 뉴클레오타이드 서열은 T7 프로모터의 제어 하에 PCR 단편으로부터 시험관 내에서 전사 및 번역되었다. T7 프로모터에 이어 반복부-스페이서-반복부 서열로 구성된 최소 CRISPR 어레이를 갖는 두 번째 PCR 단편이 동일한 반응에서 전사되었다. 엔도뉴클레아제 및 반복부-스페이서-반복부 서열의 성공적인 발현, 및 이어서 CRISPR 어레이 처리는 시험관 내 CRISPR 뉴클레아제 복합체에 활성을 제공하였다.
최소 어레이 내의 스페이서 서열과 일치하는 스페이서 서열, 이어서 8N(축퇴성) 염기(잠재적 PAM 서열)을 함유하는 표적 플라스미드의 라이브러리를 TXTL 반응의 생성물과 함께 인큐베이션하였다. 1-3시간 후, 반응을 중단하고, DNA 클린업 키트, 예를 들어, Zymo DCC, AMPure XP 비드, QiaQuick 등을 통해 DNA를 회수하였다. 어댑터 서열은 엔도뉴클레아제에 의해 절단된 활성 PAM 서열을 포함하는 DNA 단편에 블런트 말단(blunt-end) 라이게이션된 반면, 절단되지 않은 DNA는 라이게이션을 위해 접근할 수 없었다. 그런 다음, 활성 PAM 서열을 포함하는 DNA 세그먼트를 라이브러리 및 어댑터 서열에 특이적인 프라이머를 사용하여 PCR에 의해 증폭시켰다. PCR 증폭 산물은 절단 사건에 상응하는 앰플리콘을 확인하기 위해 겔 상에서 분리되었다. 절단 반응의 증폭된 세그먼트는 또한 NGS 라이브러리의 제조를 위한 주형 또는 Sanger 시퀀싱을 위한 기질로서 사용되었다. 시작 8N 라이브러리의 서브세트인 상기 생성된 라이브러리의 시퀀싱을 통해, CRISPR 복합체와 상용성인 PAM 활성을 갖는 서열이 밝혀졌다. 가공된 RNA 작제물을 사용한 PAM 시험의 경우, 시험관 내에서 전사된 RNA가 플라스미드 라이브러리와 함께 추가되고 최소 CRISPR 어레이 주형이 생략되었다는 점을 제외하고는 동일한 절차를 반복하였다. 다음 서열을 이들 검정에서 표적으로서 사용하였다:
CGTGAGCCACCACGTCGCAAGCCT (서열 번호 3860);
GTCGAGGCTTGCGACGTGGTGGCT (서열 번호 3861);
GTCGAGGCTTGCGACGTGGTGGCT (서열 번호 3858); 및
TGGAGATATCTTGAACCTTGCATC (서열 번호 3859).
실시예 4 - 본원에 기재된 엔도뉴클레아제에 대한 PAM 서열 확인/입증
PAM 요건을 변형이 있는 이. 콜라이 용해물-기반 발현 시스템(myTXTL, Arbor Biosciences)을 통해 결정하였다. 간략히, 이. 콜라이 코돈 최적화된 이펙터 단백질 서열을 T7 프로모터의 제어 하에 29℃에서 16 시간 동안 발현시켰다. 이후, 이러한 미정제 단백질 스톡을 최종 반응 부피의 20% 농도로 시험관 내 소화 반응에 사용하였다. 반응물을 8N 혼합 염기가 선행되는 불변 표적 서열로 이루어진 5 nM의 플라스미드 라이브러리, 및 NEB 완충제 2.1(New England Biolabs; NEB 완충제 2.1은 상업적으로 입수 가능한 단백질을 갖는 후보와 비교하기 위해 선택되었음)에서 표적 서열에 상보성인 서열에 연결된 이펙터로서 동일한 CRISPR 유전자좌로부터 유래된 50 nM의 시험관 내 전사된 crRNA와 함께 37℃에서 3 시간 동안 인큐베이션하였다. 단백질 농도는 PAM 발견 검정에서 표준화되지 않았다(PCR 증폭 신호는 낮은 발현 또는 활성에 대해 높은 감도를 제공한다). TXTL 반응으로부터의 절단 산물을 AMPure SPRI 비드(Beckman Coulter)로의 세정을 통해 회수하였다. DNA를 Klenow 단편 및 dNTP(New England Biolabs)의 첨가를 통해 평활화시켰다. 블런트-말단 산물을 100배 과량의 이중-가닥 어댑터 서열과 라이게이션하고, NGS 라이브러리의 제조를 위한 주형으로 사용하였고, 이로부터 PAM 요건을 서열 분석으로부터 결정하였다.
원시 NGS 판독을 > 20의 Phred 품질 점수로 필터링하였다. PAM에 인접한 골격으로부터의 공지된 DNA 서열을 나타내는 28 bp를 PAM-근위 영역을 찾기 위한 참조로 사용하고, 인접한 8 bp를 추정 PAM으로 확인하였다. PAM과 라이게이션된 어댑터 사이의 거리를 또한 각각의 판독에 대해 측정하였다. 참조 서열 또는 어댑터 서열과 정확히 일치하지 않은 판독은 배제되었다. 가장 빈번한 절단 부위 ±2 bp를 갖는 PAM만이 분석에 포함되도록 PAM 서열을 절단 부위 빈도에 의해 필터링하였다. 이러한 보정은 미가공 이. 콜라이 용해물의 사용으로 인해 무작위 위치에서 발생할 수 있는 낮은 수준의 배경 절단을 제거하였다. 이러한 필터링 단계는 후보 단백질의 신호 대 잡음비에 따라 판독의 2% 내지 40%를 제거할 수 있으며, 여기서 단백질의 활성이 낮을수록 더 많은 배경 신호를 갖는다. 참조 MG29-1의 경우, 이 단계에서 판독의 2%가 필터링되었다. 필터링된 PAM 목록을 사용하여 Logomaker를 사용하는 서열 로고를 생성하였다. PAM의 이러한 서열 로고 도식은 도 20 내지 도 24에 나타나 있다.
실시예 5 - tracrRNA 예측 및 가이드 설계
sgRNA 및 표적 DNA에 결합된 AacC2c1(Cas12b)의 삼원 복합체의 결정 구조는 R-AR 이중체 1 및 R-AR 이중체 2로 표시되는 결합된 sgRNA에서 2 개의 개별적인 반복-비반복부(R-AR) 모티프를 나타낸다(본원의 도 8 및 도 9 및 각각 그 전체가 본원에 참조로 포함되는 문헌[Yang, Hui, Pu Gao, Kanagalaghatta R. Rajashankar, and Dinshaw J. Patel. 2016. "PAM-Dependent Target DNA Recognition and Cleavage by C2c1 CRISPR-Cas Endonuclease." Cell 167 (7): 1814-28.e12 and Liu, Liang, Peng Chen, Min Wang, Xueyan Li, Jiuyu Wang, Maolu Yin, and Yanli Wang. 2017. "C2c1-sgRNA Complex Structure Reveals RNA-Guided DNA Cleavage Mechanism." Molecular Cell 65 (2): 310-22] 참조). 본원에 개시된 CRISPR 이펙터에 대한 추정 tracrRNA 서열은 천연 CRISPR 어레이의 주변 게놈 맥락에서 비반복부 서열을 검색함으로써 확인되었고, 여기서 R-AR 이중체 2 비반복부 서열은 R-AR 이중체 1 비반복부 서열 상류의 약 20 개 내지 90 개의 뉴클레오타이드에서(tracrRNA의 5' 말단에 더 가까움) 발생한다. tracrRNA 서열 확인 후, 각 효소에 대해 2 개의 가이드 서열을 설계하였다. 첫 번째는 R-AR 이중체 1 & 2 둘 모두를 포함하였고(예를 들어, 서열 번호 3636, 3640, 3644, 3648, 3652, 3656, 3660, 3671, 및 3672 참조), 이러한 영역은 절단에 필수적이지 않을 수 있으므로, 두 번째는 R-AR 이중체 1 영역이 결실된 더 짧은 가이드 서열이었다(예를 들어, 서열 번호 3637, 3641, 3645, 3649, 3653, 3657, 및 3661 참조).
실시예 6 - 예측된 RNA 폴딩을 위한 프로토콜
37℃에서 RNA 서열의 예측된 RNA 폴딩은 Andronescu 2007(이는 전체가 본원에 참조로 포함됨)의 방법을 사용하여 산출되었다.
실시예 7 - RNA 가이드 확인
타입 V-A 이펙터 및 CRISPR 어레이를 코딩한 콘티그의 경우, 반복부의 이차 구조 폴딩은 신규한 타입 V-A 시스템이 단일 가이드 crRNA를 필요로 한다는 것을 지시하였다(sgRNA, 도 10). tracrRNA 서열은 신뢰성 있게 예측될 수 없었다. sgRNA는 CRISPR 반복부의 3' 말단으로부터 약 19-22 nt를 함유하였다. 시험관 내 활성에 대해 시험된 6 개의 타입 V-A 후보로부터의 CRISPR 반복부의 다중 서열 정렬은 sgRNA의 줄기-루프 구조를 형성한 반복부의 3' 말단에서 고도로 보존된 모티프를 나타냈다(도 10c). 모티프 UCUAC[N3-5]GUAGAU는 3 개 내지 5 개의 뉴클레오타이드(루프)에 의해 분리된 짧은 회문 반복부(줄기)로 이루어졌다.
sgRNA 모티프의 보존을 이용하여 분류된 타입 V-A 뉴클레아제와 유사성을 나타내지 않을 수 있는 신규한 이펙터를 밝혀냈다. 69,117 개의 CRISPR 어레이로부터의 반복부에서 모티프가 검색되었다. 가장 흔한 모티프는 4-뉴클레오타이드 루프를 함유한 반면, 3- 및 5-뉴클레오타이드 루프는 덜 일반적이었다(도 12, 도 13, 도 14, 도 15, 및 도 16 참조). 반복부 모티프를 함유하는 CRISPR 어레이를 둘러싼 게놈 맥락의 검사는 다양한 길이의 수많은 이펙터를 밝혀냈다. 예를 들어, 패밀리 MG57의 이펙터는 확인된 타입 V-A 뉴클레아제 중 가장 켰고(평균 약 1400 aa), 4-bp 루프를 갖는 반복부를 코딩하였다. HMM 분석으로부터 확인된 또 다른 패밀리는 상이한 반복부 모티프인 CCUGC[N3-4]GCAGG를 함유하였다(도 5c, 도 5d 참조). 서열은 다르지만, 구조는 매우 유사한 줄기-루프 구조로 폴딩될 것으로 예측되었다.
실시예 8 - MG CRISPR 복합체의 시험관 내 절단 효율
엔도뉴클레아제는 프로테아제 결핍 이. 콜라이 B 균주에서 유도성 T7 프로모터로부터 His-태깅된 융합 단백질로서 발현된다. His-태깅된 단백질을 발현하는 세포를 초음파 처리에 의해 용해시키고, His-태깅된 단백질을 AKTA Avant FPLC(GE Lifescience) 상의 HisTrap FF 컬럼(GE Lifescience)에서 Ni-NTA 친화성 크로마토그래피에 의해 정제하였다. 용리액을 아크릴아미드 겔(Bio-Rad) 상에서 SDS-PAGE에 의해 분해하고, InstantBlue Ultrafast 쿠마시(Sigma-Aldrich)로 염색하였다. ImageLab 소프트웨어(Bio-Rad)로 단백질 밴드의 밀도계를 사용하여 순도를 결정하였다. 정제된 엔도뉴클레아제를 50 mM Tris-HCl, 300 mM NaCl, 1 mM TCEP, 5% 글리세롤(pH 7.5)로 구성된 저장 완충제에 투석하고, -80℃에서 저장하였다. 스페이서 서열 및 PAM 서열(예를 들어, 실시예 3 또는 실시예 4에서와 같이 결정됨)을 함유하는 표적 DNA를 DNA 합성에 의해 작제하였다. PAM이 축퇴성 염기를 가질 때 시험을 위해 단일의 대표 PAM을 선택하였다. 표적 DNA는 한쪽 말단으로부터 700 bp에 위치한 스페이서 및 PAM을 사용한 PCR 증폭을 통해 플라스미드로부터 유래된 2200 bp의 선형 DNA로 구성되었다. 성공적인 절단은 700 bp 및 1500 bp의 단편을 생성하였다. 표적 DNA, 시험관 내 전사된 단일 RNA, 및 정제된 재조합 단백질을 과량의 단백질 및 RNA와 함께 절단 완충제(10 mM Tris, 100 mM NaCl, 10 mM MgCl2)에서 조합하고, 5 분 내지 3 시간, 일반적으로 1 hr 동안 인큐베이션하였다. 반응을 RNAse A의 첨가 및 60 분에 인큐베이션을 통해 정지시켰다. 이어서, 반응물을 1.2% TAE 아가로스 겔에서 분해하고, 절단된 표적 DNA의 분획을 ImageLab 소프트웨어에서 정량화하였다.
실시예 9 - 이. 콜라이 에서 MG CRISPR 복합체의 게놈 절단 활성의 시험
이. 콜라이는 이중-가닥 DNA 파손을 효율적으로 복구하는 능력이 부족하다. 따라서, 게놈 DNA의 절단은 치명적인 사건일 수 있다. 이러한 현상을 이용하여, 엔도뉴클레아제 활성을 스페이서/표적을 갖는 표적 균주에서 엔도뉴클레아제 및 가이드 RNA(예를 들어, 실시예 6에서와 같이 결정됨)를 재조합으로 발현시킴으로써 이. 콜라이에서 시험하고, 이의 게놈 DNA(예를 들어, 실시예 4에서와 같이 결정됨)에 통합된 PAM 서열을 엔도뉴클레아제를 코딩하는 DNA로 형질전환시켰다. 이어서, 형질전환체는 화학적격이 되고, 표적 서열에 특이적인("표적 내") 또는 표적에 비-특이적인("비표적") 50 ng의 가이드 RNA(예를 들어, crRNA)로 형질전환되었다. 열 충격 후, 형질전환은 37℃에서 2 시간 동안 SOC에서 회수되었다. 뉴클레아제 효율을 이후 유도 배지에서 성장된 5-배 희석 시리즈에 의해 결정하였다. 콜로니를 희석 시리즈로부터 3회 정량화하였다. 표적 외 가이드 RNA로 형질전환된 콜로니의 수와 비교하여 표적 내 가이드 RNA로 형질전환된 콜로니 수의 감소는 엔도뉴클레아제에 의한 특이적 게놈 절단을 나타낸다.
실시예 10 - 일반 절차: 포유동물 세포에서 MG CRISPR 복합체의 게놈 절단 활성의 시험
2가지 유형의 포유동물 발현 벡터를 사용하여 포유동물 세포에서 표적화 및 절단 활성을 검출하였다. 첫 번째로, MG Cas 이펙터를 C-말단 SV40 NLS 및 GFP 태그(단백질의 발현을 모니터링하기 위한 2A-GFP 태그)에 연결된 바이러스 2A 컨센서스 절단성 펩타이드 서열에 융합하였다. 두 번째로, MG Cas 이펙터를 2 개의 SV40 NLS 서열에 하나는 N-말단으로 그리고 다른 하나는 C-말단으로 융합시켰다. NLS 서열은 본원에 기재된 임의의 NLS 서열(예를 들어, 서열 번호 3938-3953)을 포함한다. 일부 예에서, 엔도뉴클레아제를 코딩하는 뉴클레오타이드 서열은 포유동물 세포에서의 발현을 위해 코돈-최적화된다.
포유동물 표적 DNA에 상보성인 서열에 융합된 crRNA 서열을 갖는 단일 가이드 RNA를 제2 포유동물 발현 벡터로 클로닝하였다. 2 개의 플라스미드를 HEK293T 세포에 공동-형질감염시켰다. 공동-형질감염 72 시간 후에, DNA를 형질전환된 HEK293T 세포로부터 추출하고, NGS-라이브러리의 제조에 사용하였다. 포유동물 세포에서 효소의 표적화 효율을 입증하기 위해 표적 부위에서 인델을 정량함으로써 퍼센트 NHEJ를 측정하였다. 적어도 10 개의 상이한 표적 부위를 선택하여 각 단백질의 활성을 시험하였다.
실시예 11 - 포유동물 세포에서 MG CRISPR 복합체의 게놈 절단 활성의 시험
포유동물 세포에서 표적화 및 절단 활성을 알아보기 위해, MG Cas 이펙터 단백질 서열을 His 태그 후 C 말단에서(골격 1) 측접한 N-말단 및 C-말단 SV40 NLS 서열, C-말단 His 태그, 및 2A-GFP(예를 들어, GFP에 연결된 바이러스 2A 컨센서스 절단성 펩타이드 서열) 태그를 갖는 포유동물 발현 벡터에 클로닝하였다. 일부 예에서, 엔도뉴클레아제를 코딩하는 뉴클레오타이드 서열은 이. 콜라이 세포에서의 발현을 위해 코돈-최적화되거나 포유동물 세포에서의 발현을 위해 코돈-최적화된 천연 서열이었다.
관심 유전자 표적을 갖는 단일 가이드 RNA 서열(sgRNA)을 또한 포유동물 발현 벡터에 클로닝하였다. 2 개의 플라스미드를 HEK293T 세포에 공동-형질감염시켰다. 발현 플라스미드 및 sgRNA 표적화 플라스미드를 HEK293T 세포로 공동-형질감염시킨지 72 시간 후에, DNA를 추출하고 NGS-라이브러리의 제조에 사용하였다. 포유동물 세포에서 효소의 표적화 효율을 입증하기 위해 표적 부위의 시퀀싱에서 인델을 통해 퍼센트 NHEJ를 측정하였다. 각 단백질의 활성을 시험하기 위해 7-12 개의 상이한 표적 부위를 선택하였다. 5% 인델의 임의 임계값을 사용하여 활성 후보를 확인하였다. 인간 세포에서 게놈 편집 효율은 매개변수를 사용하여 CRISPResso로 NGS 판독으로부터 평가하였다: 절단 오프셋 = -4 및 윈도우 = 10. CRISPResso 결과로부터 모든 후속 절단 사건은 ±1 bp 인델/돌연변이, 및 ≥2 bp 결실, 삽입, 및 돌연변이에 대해 합산하였다. 모든 결과는 예상 앰플리콘에 정렬된 총 서열에 대해 표준화하였다(도 18 참조).
실시예 12 - MG29 패밀리의 특성화
PAM 특이성, tracrRNA/sgRNA 검증
MG29 패밀리 엔도뉴클레아제 시스템의 표적화된 엔도뉴클레아제 활성을 실시예 3 및 실시예 8에 기재된 myTXTL 시스템을 사용하여 확인하였다. 이 검정에서, 절단된 표적 플라스미드의 PCR 증폭은 도 17에 도시된 바와 같이 겔에서 대략 170 bp로 이동하는 산물을 생성하였다. 증폭 산물은 서열 번호 3609에 상응하는 crRNA를 갖는 MG29-1에 대해 관찰되었다(도 17a, 레인 7 참조). PCR 산물을 시퀀싱함으로써 하기 표 2에 나타낸 바와 같이 이들 효소에 대한 활성 PAM 서열이 밝혀졌다.
[표 2] 다양한 표적 부위에서 MG29-1의 활성
Figure pct00004
포유동물 세포에서 표적화된 엔도뉴클레아제 활성
MG29-1 표적 유전자좌를 선택하여 PAM YYn(서열 번호 3871)을 갖는 게놈에서의 위치를 시험하였다. 선택된 표적 부위에 상응하는 스페이서를 실시예 9에 기재된 포유동물 벡터 시스템 골격 1에서 sgRNA 스캐폴드 내로 클로닝하였다. 이러한 부위는 하기 표 3에 열거되어 있다. 다양한 표적 부위에서 MG29-1의 활성은 표 2 및 도 19에 나타나 있다.
[표 3] 본원에 기재된 효소에 대한 5' PAM 서열 및 crRNA
Figure pct00005
실시예 13 - NGS를 통한 고-복제 PAM 결정
타입 V 엔도뉴클레아제(예를 들어, MG28, MG29, MG30, MG31 엔도뉴클레아제)를 실시예 3 및 실시예 8에 기재된 바와 같이 myTXTL 키트에서 이 콜라이 용해물-기반 발현을 이용하여 절단 활성에 대해 시험하였다. crRNA 및 이후 8 개의 축퇴성("N") 염기와 일치하는 스페이서 시퀀싱을 함유하는 플라스미드 라이브러리(5' PAM 라이브러리) 및 crRNA와 함께 인큐베이션 시, 기능성 PAM을 갖는 플라스미드 라이브러리의 서브세트가 절단되었다. 이러한 절단 부위에 대한 라이게이션 및 PCR 증폭은 170 bp에서 겔에서 관찰된 밴드에 의해 입증된 활성의 증거를 제공하였다(도 17b). 겔 1(상단 패널, A) 레인은 다음과 같다: 1(래더; 가장 어두운 밴드는 200 bp에 해당함); 2: 양성 대조(이전에 검증된 라이브러리); 3 (n/a); 4 (n/a); 5 (MG28-1); 6 (MG29-1); 7 (MG30-1); 8 (MG31-1); 9 (MG32-1); 및 10 (래더). 겔 2(하단 패널, B) 레인은 다음과 같다: 1(래더; 가장 어두운 밴드는 200 bp에 해당함); 2 (LbCpf1 양성 대조); 3 (LbCpf1 양성 대조); 4 (음성 대조); 5 (n/a); 6 (n/a); 7 (MG28-1); 8 (MG29-1); 9 (MG30-1); 10 (MG31-1); 11 (MG32-1).
PCR 산물을 추가로 NGS 시퀀싱으로 처리하고, PAM을 seqLogo 도식(예를 들어, 문헌[Huber et al. Nat Methods. 2015 Feb;12(2):115-21] 참조)에 대조하였다(도 20). seqLogo 도식은 위치 0 내지 7로 표지된 스페이서의 상류(5')에서 8 bp를 나타낸다. 도 20에 도시된 바와 같이, PAM은 피리미딘 부유(C 및 T)이고, 대부분의 서열 요건은 스페이서의 상류에서 2-4 bp이다(SeqLogo에서 위치 4-6).
MG 후보에 대한 PAM은 하기 표 4에 나타나 있다.
[표 4] 본원에 기재된 효소에 대한 5' PAM 서열 및 crRNA
Figure pct00006
일부 경우에, 스페이서에 바로 인접한 위치는 더 약한 선호도를 가질 수 있는데, 예를 들어, "n" 대신에 "m" 또는 "v"일 수 있다.
실시예 14 - MG31 뉴클레아제를 갖는 포유동물 세포에서의 표적화된 엔도뉴클레아제 활성
포유동물 세포에서 표적화된 엔도뉴클레아제 활성
MG31-1 표적 유전자좌를 선택하여 PAM TTTR(서열 번호 3875)을 갖는 게놈에서의 위치를 시험하였다. 선택된 표적 부위에 상응하는 스페이서를 실시예 11에 기재된 포유동물 벡터 시스템 골격 1에서 sgRNA 스캐폴드 내로 클로닝하였다. 이러한 부위는 하기 표 5에 열거되어 있다. 다양한 표적 부위에서 MG31-1의 활성은 표 5 및 도 25에 나타나 있다.
[표 5] 다양한 표적 부위에서 MG31-1의 활성
Figure pct00007
실시예 15 - 시험관 내 활성
생물정보학 분석 및 예비 스크린으로부터의 유망한 후보를 본 실시예에 기재된 바와 같이 추가 생화학적 분석을 위해 선택하였다. 보존된 3' sgRNA 구조를 사용하여, 3' 20 nt의 CRISPR 반복부 및 24 nt의 스페이서를 포함하는 "범용" sgRNA를 설계하였다(도 10). 7 개의 시험된 후보 중, 6 개는 8N PAM 라이브러리에 대해 시험관 내 활성을 나타냈다(도 26a). 나머지 불활성 후보(30-1)는 이의 예측된 내인성 트리밍된 CRISPR 반복부로 시험될 때 활성을 나타냈지만(서열 번호 3608, 도 26b 참조), NGS 라이브러리 검정에는 포함되지 않았다(도 26c).
확인된 PAM의 대부분은 2-3 개 염기의 티민-부유 서열이었다(도 18a). 그러나, 2 개의 효소 MG26-1(PAM YYn) 및 MG29-1(PAM YYn)은 피리미딘 염기, 티민 또는 시토신에 대한 PAM 특이성을 가져서 더 넓은 서열 표적화를 가능하게 하였다. 추정 PAM-상호작용 잔기의 분석은 활성 타입 V-A 뉴클레아제가 보존된 리신 및 GWxxxK 모티프를 함유하는 것을 지시하였는데, 이는 FnCas12a에서 상이한 PAM의 인지 및 상호작용에 중요한 것으로 나타났다.
본원의 PAM 검출 검정은 PAM 부유 전에 블런트-말단 단편을 생성하기 위해 라이게이션을 필요로 하였으므로, 이는 이들 효소가 이전에 보고된 타입 V-A 뉴클레아제와 유사하게 엇갈린 이중-가닥 DNA 파손을 생성하였다는 것을 시사하였다. 표적 가닥 상의 절단 부위는 인델 검출에 사용된 NGS 판독의 분석에 의해 확인될 수 있고(도 18b), 22번째 PAM-원위 염기 후에 절단을 나타냈다.
MG29-1에 의한 시험관 내 절단을 절단 산물을 시퀀싱함으로써 추가로 조사하였다. 표적 가닥 상의 절단 위치는 대부분의 서열에서 PAM으로부터 22 개 뉴클레오타이드, 및 덜 빈번하게는 21 개 또는 23 개 뉴클레오타이드 떨어져 있었다(도 56). 비-표적 가닥 상의 절단 위치는 PAM으로부터 17 개 내지 19 개의 뉴클레오타이드였다. 조합해 볼 때, 이러한 결과는 3-5 bp 오버행을 지시한다.
실시예 16 - 게놈 편집
PAM의 확인 후, 본원에 기재된 신규한 단백질을 유전자 표적화 활성에 대해 HEK293T 세포에서 시험하였다. 모든 후보는 10 개의 시험된 표적 유전자좌 중 적어도 하나에서 5% 초과의 NHEJ(배경 보정됨)의 활성을 나타냈다. MG29-1은 NHEJ 변형 결과에서 가장 높은 전체 활성을 나타냈고(도 18b), 가장 많은 수의 표적에서 활성이었다. 따라서, 이러한 뉴클레아제는 HEK293 세포에서 정제된 리보핵단백질 복합체(RNP) 시험을 위해 선택되었다. MG29-1 홀로엔자임의 RNP 형질감염은 9 개 표적 중 4 개에서 플라스미드-기반 형질감염보다 RNP로 더 높은 편집 수준을 나타냈고, 일부 경우에 80% 초과의 편집 효율을 나타냈다(도 18c). MG29-1에 대한 편집 프로파일의 분석은 이러한 뉴클레아제가 이들의 표적 부위에서 다른 유형의 편집보다 더 빈번하게 2 bp 초과의 결실을 생성한다는 것을 지시하였다(도 18d). 일부 표적(5 및 8)에서 MG29-1에 대한 인델 빈도는 AsCpf1의 2배였다(도 18e).
실시예 17 - 고찰
타입 V-A CRISPR는 다양한 복합적인 환경으로부터 수집된 메타게놈으로부터 확인되고, 패밀리로 배열되었다. 이러한 신규한 타입 V-A 뉴클레아제는 패밀리 내에서 및 패밀리에 걸쳐 다양한 서열 및 계통발생적 기원을 갖고 다양한 PAM 부위를 갖는 절단된 표적을 가졌다. 다른 타입 V-A 뉴클레아제(예를 들어, LbCas12a, AsCas12a, 및 FnCas12a)와 유사하게, 본원에 기재된 이펙터는 DNA의 엇갈린 이중-가닥 절단을 표적화하기 위해 단일 가이드 CRISPR RNA(sgRNA)를 이용하여 가이드 설계 및 합성을 단순화시켰는데, 이는 다중화된 편집을 용이하게 할 것이다. crRNA의 줄기-루프 구조를 형성한 CRISPR 반복부 모티프의 분석은 본원에 기재된 타입 V-A 이펙터가 더 짧거나 더 긴 루프보다 더 빈번하게 4-nt 루프 가이드를 갖는다는 것을 시사하였다. LbCpf1의 sgRNA 모티프는 덜 흔한 5-nt를 가졌지만, 4-nt 루프가 또한 16 Cpf1 오솔로그에 대해 이전에 관찰되었다. 비범용 줄기-루프 CRISPR 반복부 모티프 서열, CCUGC[N3-4]GCAGG가 타입 V-A형 이펙터의 MG61 패밀리에 대해 확인되었다. 타입 V-A에서 가변 루프 길이를 갖는 sgRNA의 높은 정도의 보존은 본원에 기재된 단백질에 대해 나타낸 바와 같이 가요성 수준의 활성을 제공할 수 있다. 종합하면, 이러한 이펙터는 이전에 연구된 효소와 가까운 상동체가 아니며, 타입 V-A-유사 sgRNA 뉴클레아제의 다양성을 크게 확장시킨다.
본원에 기재된 추가적인 타입 V 이펙터는 Cas12a 뉴클레아제 옆에 코딩될 수 있는 타입 V-A 프라임 이펙터(V-A')로 본원에서 지칭되는 타입 V-A-유사 뉴클레아제의 복제로부터 진화되었을 수 있다. 타입 V-A 시스템과 이러한 타입 V-A' 시스템 둘 모두는 CRISPR sgRNA를 공유할 수 있지만, 타입 V-A' 시스템은 Cas12a로부터 분기된다(도 4). 이러한 프라임 이펙터와 관련된 CRISPR 반복부는 또한 UCUAC[N3-5]GUAGAU 모티프를 갖는 단일 가이드 crRNA로 폴딩되었다. 한 보고에서 타입 V-A 뉴클레아제 옆에 코딩된 타입 V cms1 이펙터가 확인되었는데, 이는 식물 세포에서 절단 활성을 위해 단일 가이드 crRNA를 필요로 하였다. 상이한 CRISPR 어레이가 각각의 이펙터에 대해 보고되었지만, 본원에 기재된 타입 V-A' 시스템은 타입 V-A와 V-A' 둘 모두가 DNA 표적화 및 절단을 위해 동일한 crRNA를 필요로 할 수 있다는 것을 시사하였다. 최근 Roizmanbacterial genomes(예를 들어, 문헌[Chen et al. Front Microbiol. 2019 May 3;10:928] 참조)에 기재된 바와 같이, 타입 V-A 이펙터와 V-A' 이펙터 둘 모두는 서열 상동성 및 계통발생 분석에 기초할 때 먼 관련성이 있다. 따라서, 프라임 이펙터는 타입 V-A 분류에 속하지 않으며, 별도의 타입 V 하위-분류를 보증한다.
활성 타입 V-A 뉴클레아제에 대해 결정된 PAM은 일반적으로 다른 타입 V-A 뉴클레아제에 대해 기재된 이전에 기재된 PAM과 유사하게 티민-부유였다. 대조적으로, MG29-1은 더 짧은 YYN PAM 서열을 필요로 하는데, 이는 LbCpf1의 4 개 뉴클레오타이드 TTTV PAM과 비교하여 표적 유연성을 증가시킨다. 또한, MG29-1을 함유하는 RNP는 3-뉴클레오타이드 PAM을 갖는 sMbCas12a와 비교하여 HEK293 세포에서 더 높은 활성을 가졌다.
시험관 내 편집 활성에 대해 신규한 뉴클레아제를 시험할 때, MG29-1은 그러한 클래스의 다른 보고된 효소와 비슷하거나 더 나은 활성을 나타냈다. Cas12a 오솔로그를 사용한 포유동물 세포에서 플라스미드 형질감염 편집 효율의 보고는 T-부유 PAM을 갖는 가이드에 대해 21% 내지 26%의 인델 빈도를 지시하고, CCN PAM을 갖는 18 개 가이드 중 1 개가 Mb3Cas12a(모락셀라 보보쿨리 AAX11_00205 Cas12a, 예를 들어, 문헌[Wang et al. Journal of Cell Science 2020 133: jcs240705] 참조)에서 약 10% 활성을 나타냈다. 특히, 플라스미드 형질감염에서의 MG29-1 활성은 TTN 및 CCN PAM을 갖는 표적에 대하여 Mb3Cas12a에 대해 보고된 것보다 더 크게 나타났다(예를 들어, 도 18 참조). 플라스미드 형질감염을 위한 표적 부위는 모든 실험에서 동일한 TTG PAM을 갖기 때문에, 편집 효율의 차이는 상이한 표적 유전자에서의 게놈 접근성 차이에 기인할 수 있다. RNP로서 MG29-1 편집은 플라스미드를 통한 것보다 훨씬 더 효율적이고 7 개의 표적 유전자좌 중 2 개에서 AsCas12a보다 더 효율적이었다. 따라서, MG29-1은 고도로 활성이고 효율적인 유전자 편집 뉴클레아제일 수 있다. 이러한 발견은 단일 가이드 타입 V-A CRISPR 뉴클레아제의 공지된 다양성을 증가시키고, 비배양 미생물로부터의 신규한 효소의 게놈 편집 잠재력을 나타낸다. 7 개의 신규한 뉴클레아제는 다양한 PAM 요건으로 시험관 내 활성을 나타냈고, RNP 데이터는 인간 세포주에서 치료적으로 관련된 표적에 대해 80%가 넘는 편집 효율을 나타냈다. 이러한 신규한 뉴클레아제는 CRISPR-관련 효소의 툴키트를 확장하고 다양한 게놈 조작 적용을 가능하게 한다.
실시예 18 - T-세포에서 TRAC 유전자좌의 MG29-1 유도된 편집
T 세포 수용체 알파 사슬 불변 영역(TRACA)의 3 개의 엑손을 MG29-1의 초기 예측된 5'-TTN-3' PAM 선호도와 일치하는 서열에 대해 스캐닝하고, 전매 Alt-R 변형을 갖는 단일-가이드 RNA를 IDT로부터 입수하였다. 모든 가이드 스페이서 서열은 22 nt 길이였다. 가이드(80 pmol)를 정제된 MG29-1 단백질(63 pmol)과 혼합하고, 실온에서 15 분 동안 인큐베이션하였다. T 세포를 (Stemcell Technologies 인간 T 세포 단리 키트 #17951)를 사용한 음성 선택에 의해 PBMC로부터 정제하고, CD2/3/28 비드(Miltenyi T 세포 활성화/확장 키트 #130-091-441)에 의해 활성화시켰다. 4일간의 세포 성장 후, 각각의 MG29-1/가이드 RNA 혼합물을 프로그램 EO-115 및 P3 완충제를 사용하여 Lonza 4-D 뉴클레오펙터로 200,000 T 세포에 전기천공하였다. 형질감염 72 시간 후에 세포를 수확하고, 게놈 DNA를 단리하고, TRACA 유전자좌를 표적화하는 프라이머를 사용하여 고처리량 DNA 시퀀싱을 사용하여 분석을 위해 PCR 증폭시켰다. NHEJ-기반 유전자 편집에 전형적인 삽입 및 결실의 생성을 전매 Python 스크립트를 사용하여 정량화하였다(도 39 참조).
[표 5A] 실시예 18에서 사용된 가이드 서열
Figure pct00008
Figure pct00009
Figure pct00010
Figure pct00011
Figure pct00012
Figure pct00013
실시예 19 - MG29-1의 리드 가이드의 재시험
MG29-1에 대한 리드 가이드를 재시험하는 실험을 수행하였다. T 세포 수용체 알파 사슬 불변 영역의 3 개의 엑손을 5'-TTN-3'과 일치하는 서열 및 Alt-R 변형을 사용하는 IDT로부터 입수한 단일-가이드 RNA에 대해 스캐닝하였다. 모든 가이드 스페이서 서열은 22 nt 길이였다. 가이드를 정제된 MG29-1 단백질(80 pmol gRNA + 63 pmol MG29-1; 또는 160 pmol gRNA와 126 pmol MG29-1)과 혼합하고, 실온에서 15 분 동안 인큐베이션하였다. T 세포를 (Stemcell Technologies 인간 T 세포 단리 키트 #17951)를 사용한 음성 선택에 의해 PBMC로부터 정제하고, CD2/3/28 비드(Miltenyi T 세포 활성화/확장 키트 #130-091-441)에 의해 활성화시켰다. 4일간의 세포 성장 후, 각각의 MG29-1/가이드 RNA 혼합물을 프로그램 EO-115 및 P3 완충제를 사용하여 Lonza 4-D 뉴클레오펙터로 200,000 T 세포에 전기천공하였다. 형질감염 72 시간 후에, 게놈 DNA를 수확하고, 고처리량 DNA 시퀀싱을 사용하여 분석을 위해 PCR 증폭시켰다. NHEJ-기반 유전자 편집에 전형적인 삽입 및 결실의 생성을 전매 Python 스크립트를 사용하여 정량화되었다(도 40 참조).
실시예 20 - MG29-1에 대한 가이드 스페이서의 길이 시험
최적의 가이드 스페이서 길이를 확인하기 위해 실험을 수행하였다. T 세포 수용체 알파 사슬 불변 영역의 3 개의 엑손을 5'-TTN-3'과 일치하는 서열 및 Alt-R 변형을 사용하는 IDT로부터 입수한 단일-가이드 RNA에 대해 스캐닝하였다. 가이드를 정제된 MG29-1 단백질(80 pmol gRNA + 60 pmol 이펙터; 160 pmol gRNA + 120 pmol 이펙터; 또는 320 pmol gRNA + 240 pmol 이펙터)과 혼합하고, 실온에서 15 분 동안 인큐베이션하였다. T 세포를 (Stemcell Technologies 인간 T 세포 단리 키트 #17951)를 사용한 음성 선택에 의해 PBMC로부터 정제하고, CD2/3/28 비드(Miltenyi T 세포 활성화/확장 키트 #130-091-441)에 의해 활성화시켰다. 4일간의 세포 성장 후, 각각의 MG29-1/가이드 RNA 혼합물을 프로그램 EO-115 및 P3 완충제를 사용하여 Lonza 4-D 뉴클레오펙터로 200,000 T 세포에 전기천공하였다. 형질감염 72 시간 후에, 게놈 DNA를 수확하고, 고처리량 DNA 시퀀싱을 사용하여 분석을 위해 PCR 증폭시켰다. NHEJ-기반 유전자 편집에 전형적인 삽입 및 결실의 생성을 전매 Python 스크립트를 사용하여 정량화되었다. 결과는 도 41에 나타나 있으며, 이는 20-24 nt의 가이드 스페이서 길이가 잘 작동하고, 19 nt에서 드롭오프가 있음을 입증한다.
실시예 21 - TCR 발현에 대한 MG29-1 인델 생성의 확인
도 41로부터의 세포를 APC-표지된 항-인간 TCRα/β Ab(Biolegend #306718, 클론 IP26) 및 Attune NxT 유세포 분석기(Thermo Fisher)를 사용하여 유세포 분석에 의해 TCR 발현에 대해 분석하였다. 인델 데이터는 도 41에서 얻어진다.
실시예 22 - MG29-1과의 표적화된 CAR 통합
T 세포 수용체 알파 사슬 불변 영역의 3 개의 엑손을 5'-TTN-3'과 일치하는 서열 및 IDT의 전매 Alt-R 변형을 사용하는 IDT로부터 입수한 단일-가이드 RNA에 대해 스캐닝하였다. 가이드(80 pmol)를 정제된 MG29-1 단백질(63 pmol)과 혼합하고, 실온에서 15 분 동안 인큐베이션하였다. T 세포를 (Stemcell Technologies 인간 T 세포 단리 키트 #17951)를 사용한 음성 선택에 의해 PBMC로부터 정제하고, CD2/3/28 비드(Miltenyi T 세포 활성화/확장 키트 #130-091-441)에 의해 활성화시켰다. 4일간의 세포 성장 후, 각각의 MG29-1/가이드 RNA 혼합물을 프로그램 EO-115 및 P3 완충제를 사용하여 Lonza 4-D 뉴클레오펙터로 200,000 T 세포에 전기천공하였다. TRAC 유전자를 표적화하는 5' 및 3' 상동성 아암(5' 아암 서열 번호 4424는 약 500 nt 길이이고 3' 아암 서열 번호 4425는 약 500 nt 길이임)가 측접된 맞춤형 키메라 항원 수용체에 대해 코딩 서열을 함유하는 혈청형 6 아데노-관련 바이러스(AAV-6)의 100,000 개 벡터 게놈을 형질감염 직후에 세포에 첨가하였다. TRAC 인델에 대한 TCR 발현에 대하여 복제물을 분석하였는데(도 42), 이는 TRAC 유전자의 인델이 TCR의 발현 손실과 상관관계가 있었음을 보여주었다. 세포를 또한 실시예 21에서와 같이 TCR 발현(도 42), 및 CAR에 대한 표적 항원의 결합(도 43, 여기서 플롯은 단일의 살아있는 세포에 대해 게이팅됨)에 대하여 유세포 분석에 의해 동시에 분석하였다. 도 43의 유세포 분석의 결과는 가이드 RNA 단독이 TCR 발현을 제거하는 데 효과적이었지만("RNP 단독"), 가이드 RNA + AAV의 첨가가 CAR 항원에 결합하는 새로운 세포 집단(플롯 "AAV+MG29-1-19-22" 및 "AAV+MG29-1-35-22"의 좌측 상단)을 생성하였다는 것을 나타냈다. sgRNA 35(서열 번호 4404)는 sgRNA 19(서열 번호 4388)보다 CAR의 통합을 유도하는 데 다소 더 효과적이었다. 차이에 대한 한 가지 가능한 설명은 Guide 19에 대한 예측된 뉴클레아제 절단 부위가 우측 상동성 아암의 말단으로부터 약 160 bp 떨어져 있다는 것이다.
[표 5B] 실시예 22에서 사용된 가이드 RNA
Figure pct00014
실시예 23 - HSC에서 MG29-1 TRAC 편집
조혈 줄기 세포를 Allcells로부터 구입하고, 공급업체의 지시에 따라 해동시키고, DMEM + 10% FBS에서 세척하고, CC110 사이토카인을 첨가한 Stemspan II 배지에 재현탁시켰다. 100만 개의 세포를 6-웰 디쉬에서 4 mL의 배지 중에 72 시간 동안 배양하였다. EO-100 뉴클레오펙션 프로그램의 사용을 제외하고는 실시예 18에서와 같이 MG29-1 RNP를 제조하고, 형질감염시키고, 유전자 편집 분석하였다. 결과는 하기 표 5B의 #19(서열 번호4388) 및 #35(서열 번호 4404) sgRNA를 사용한 조혈 줄기 세포에서 TRAC에서의 유전자 편집을 보여주는 도 56에 나타나 있다. 결과는 다시 #35 sgRNA가 TRAC 유전자좌를 표적화하는 데 매우 효과적이라는 것을 지시한다.
[표 5C] 실시예 23에서 사용된 가이드 RNA
Figure pct00015
실시예 24 - MG29-1과 관련된 PAM 특이성의 추가 분석
MG29-1의 PAM 특이성을 보다 정확하게 확인하기 위해 추가 분석을 수행하였다. 5'-NTTN-3' PAM 서열을 사용하여 가이드 RNA를 설계한 다음, 관찰된 유전자 편집 활성에 따라 분류하였다(도 45, 여기서 밑줄친 염기--5'-근위 N의 동일성이 각 빈에 대해 도시됨). 10% 초과의 활성을 갖는 모든 가이드는 게놈 DNA의 이 위치에서 T를 가졌는데, 이는 MG29-1 PAM이 5'-TTTN-3'으로 더 우수하게 나타날 수 있다는 것을 지시한다. 이 위치에서 T의 과잉-표시의 통계적 유의성이 각 빈에 대해 나타나 있다. 도 45에서, 다양한 빈(높음, 중간, 낮음, >1%, <1%)이 의미하는 것은 하기와 같다:
■ 높음: >50% 인델(N = 4)
■ 중간: 10-50% 인델(N = 15)
■ 낮음: 5-10% 인델(N = 5)
■ >1%: 1-5% 인델 (N = 12)
■ <1% (N = 82)
[표 6] 실시예 24에서 뉴클레오타이드 특이성 분석에 대한 p-값
Figure pct00016
실시예 25 - 스페이서 염기 조성에 대한 MG29-1 인델 유도 능력의 확인
MG29-1 스페이서 서열의 염기 조성에 대한 유전자 편집 활성의 추가 분석을 수행하였다. 상관 관계는 미미했지만(R^2 = 0.23), GC 함량이 높아짐에 따라 활성이 더 우수해지는 경향이 있었다(스페이서 서열의 GC 함량에 대한 배양된 세포에서 유도된 인델 사이의 상관 관계가 점 플롯으로 나타나 있는, 도 46 참조).
실시예 26 - MG29-1 가이드 화학 변형
MG29-1을 사용하여 VEGF-A 유전자좌의 표적화를 위해 화학 변형을 최적화하기 위한 실험을 실시예 18의 절차를 이용하되, VEGF-A를 표적화하는 지시된 가이드 RNA로 수행하였다(하기 표 7 참조). 실험에는 126 pmol의 MG29-1 및 160 pmol의 가이드 RNA가 사용되었다. 결과는 표 47에 나타나 있다. 가이드 #4, 5, 6, 7, 및 8은 비변형 가이드 #1에 비해 개선된 활성을 나타냈는데, 이는 이들 서열에서 상응하는 변형이 비변형 RNA 서열에 비해 이러한 가이드 RNA의 활성을 개선하였다는 것을 지시한다.
[표 7] MG29-1 가이드 변형
Figure pct00017
실시예 27 - 실시예 26으로부터의 변형 MG29-1 가이드의 적정
가능한 용량-의존성 독성 효과를 확인하기 위해 실시예 26에서 사용된 변형 가이드의 활성의 용량 의존성을 알아내는 추가 실험을 수행하였다. 출발 용량(A, 126 pmol의 MG29-1 및 160 pmol의 가이드 RNA)의 1/4(B), 1/8(C), 1/16(D), 및 1/32(E)로 실시예 26에서와 같이 실험을 수행하였다. 결과는 도 48에 나타나 있다.
실시예 28 - 본원에 기재된 뉴클레아제의 대규모 합성
프로젝트 개요
메타게놈의 타입 V-A CRISPR 뉴클레아제인 MG29-1의 생산은 10L의 초기 배양 부피까지 확장된다. 발현 스크리닝, 확장된 발현, 다운스트림 진행, 제형화 연구, 및 SDS-PAGE에 의한 >=90%의 정제된 단백질의 전달이 수행된다.
발현 및 정제 스크린
도 49에 도시된 pMG450 벡터로부터의 MG29-1의 발현을 다음 조건을 변화시키면서 시험하였다: 숙주 균주, 발현 배지, 유도제, 유도 시간, 및 온도. 이. 콜라이 세포 페이스트로부터 추출된 총 가용성 단백질을 모든 조건에 대해 SDS-PAGE로 분석하였다. 고정된 금속 친화성 크로마토그래피(IMAC) 풀-다운 및 이어서 SDS-PAGE를 상위 3 개의 발현 조건에서 수행하여 수율 및 순도를 추정하고 최적의 발현 조건을 확인하였다. 용해를 위해 스케일-업(scaled-up) 방법이 진행되었다. IMAC 및 감산 IMAC(담배 식각 바이러스 프로테아제(TEV) 절단 포함)에 의한 정제를 위해 중요한 매개변수를 확인하였다. 컬럼 분획을 SDS-PAGE를 사용하여 시험하였다. 용리 풀을 SDS-PAGE 및 280 nm에서의 광도 흡광도(A280)를 사용하여 시험하였다. 접선 유동 여과(TFF)에 의한 완충제 교환 및 농축 방법이 진행되었다.
필요한 경우, ≥90% 순도를 달성하기 위해 추가 크로마토그래피 단계를 진행하였다. 하나의 크로마토그래피 모드를 시험하였다(예를 들어, 세라믹 하이드록시아파타이트 크로마토그래피). 최대 8 개의 고유의 조건을 시험하였다(예를 들어, 각각 2-3 개의 완충 시스템으로 2-6 개의 수지). 컬럼 분획을 SDS-PAGE를 사용하여 시험하였다. 용리 풀을 SDS-PAGE 및 A280을 사용하여 시험하였다. 하나의 조건을 선택하고, 3-조건 로드 연구를 수행하였다. 컬럼 분획 및 용리 풀을 상기 기재된 바와 같이 분석하였다. 완충제 교환을 위한 방법이 진행될 수 있고 TFF에 의해 농축이 수행될 수 있다.
이. 콜라이를 형질전환시키고, 진탕 플라스크에서 배양물을 제조하고, 발현 스크린 동안 확인된 최적 발현 조건에 따라 재료 및 방법을 이용하여 유도하였다. 세포 페이스트를 수확하고 SDS-PAGE로 발현을 확인하였다. 결과를 보고하고, 정제를 위한 출발 물질로서 세포 페이스트를 사용하였다. 세포 배양 부피는 20L로 제한되었다. 다운스트림 방법 진행 중에 진행된 방법을 이용하여 최대 1 그램의 단백질을 정제하였다. 최종 저장 완충제로 제형화하고, 다음 QC 시험을 수행하였다: A280에 의해 수율 및 농도 및 SDS-PAGE에 의해 순도.
제형화 연구
정제된 단백질을 사용하여, 정제된 단백질에 대한 최적의 저장 조건을 알아내기 위해 제형화 연구를 수행하였다. 연구는 농도, 저장 완충제, 저장 온도, 최대 동결/해동 주기, 저장 시간, 또는 다른 조건을 탐구할 수 있다.
실시예 29 - 배양된 마우스 간 세포에서 인트론 영역을 편집하는 본원에 기재된 뉴클레아제의 능력의 입증
발현된 유전자의 인트론 영역은 질병을 치료하거나 치유하기 위해 해당 단백질을 발현시키는 것을 목표로 관심 치료용 단백질의 코딩 서열을 통합하기 위한 매력적인 게놈 표적이다. 단백질 코딩 서열의 통합은 외인성 공급 공여체 주형의 존재 하에 서열 특이적 뉴클레아제를 사용하여 인트론 내에 이중-가닥 파손을 생성함으로써 달성될 수 있다. 공여체 주형은 상동성 지정 복구(HDR) 및 비-상동성 말단 연결(NHEJ)로 불리는 2 개의 주요 세포 복구 경로 중 하나를 통해 이중-가닥 파손으로 통합되어 공여체 주형의 표적화된 통합을 초래할 수 있다. NHEJ 경로는 비-분열 세포에서 우세한 반면, HDR 경로는 주로 분열 세포에서만 활성이다. 간은 생체 내 전달 시스템의 이용률 및 높은 효율로 단백질을 발현 및 분비하는 간의 능력으로 인해 단백질 코딩 서열의 표적화된 통합에 특히 매력적인 조직이다.
인트론 영역에서 이중-가닥 파손을 생성하는 MG29-1의 잠재력을 평가하기 위해, 혈청 알부민의 인트론 1을 표적 유전자좌로 선택하였다. Geneious Prime 핵산 분석 소프트웨어(https://www.geneious.com/prime/)에서 가이드 검색 알고리즘을 사용하여 마우스 알부민 인트론 1로 표적화된 22 nt의 스페이서 길이를 갖는 단일 가이드 RNA(sgRNA)를 확인하였다. 스페이서의 5'에 위치한 KTTG의 PAM(서열 번호 3870)을 사용하여, 마우스 알부민 인트론 1 내에서 총 112 개의 잠재적인 sgRNA가 확인되었다. 인트론/엑손 경계에 걸쳐 있는 가이드는 배제하였다. Geneious Prime을 사용하여 이러한 112 개의 가이드의 스페이서 서열을 마우스 게놈에 대해 검색하고, 게놈의 추가 부위에 대한 정렬에 기반하여 소프트웨어에 의해 특이성 점수를 할당하였다. 동일한 염기의 4 개 이상의 연속 염기를 갖는 스페이서 서열은 특이성에 대한 우려로 인해 배제하였다. 가장 높은 특이성 점수를 갖는 총 12 개의 스페이서를 시험을 위해 선택하였다. sgRNA를 생성하기 위해 "TAATTTCTACTGTTGTAGAT"의 골격 서열을 스페이서 서열의 3' 말단에 부가하였다. sgRNA는 cpf1 가이드에 대한 sgRNA의 성능을 개선하는 것으로 알려진 화학적으로 변형된 염기(Integrated DNA Technologies로부터 입수 가능한 AltR1/AltR2 화학)를 혼입하여 화학적으로 합성되었다. 이러한 가이드의 스페이서 서열은 하기 표 8에 열거되어 있다.
[표 8] Messenger Max를 사용하여 MG29-1/sgRNA RNP로 뉴클레오펙션되거나 MG29-1 mRNA 및 sgRNA로 형질감염된 Hepa1-6 세포에서 마우스 알부민 인트론 1을 표적화하는 MG29-1 sgRNA의 활성
Figure pct00018
Figure pct00019
형질전환된 마우스 간 세포주인 Hepa1-6 세포를 표준 조건(5% CO2 인큐베이터에서 10% FBS를 갖는 DMEM 배지) 하에 배양하고 PBS 완충제에서 sgRNA와 정제된 MG29-1 단백질을 혼합함으로써 형성된 리보핵 단백질로 뉴클레오펙션시켰다. 완전한 SF 뉴클레오펙션 시약(Lonza)에서 현탁된 Hepa1-6 세포(1x105 개)를 50 pmol의 MG29-1 단백질과 100 pmol의 sgRNA를 혼합하여 형성된 RNP로 4D 뉴클레오펙션 디바이스(Lonza)를 사용하여 뉴클레오펙션시켰다. 뉴클레오펙션 후 세포를 DMEM + 10% FBS 중 24 웰 플레이트에 플레이팅하고, 5% CO2 인큐베이터에서 48 h 내지 72 h 동안 인큐베이션하였다. 이후, 게놈 DNA를 컬럼-기반 정제 키트(Purelink 게놈 DNA 미니 키트, ThermoFisher Scientific)를 사용하여 세포로부터 추출하고, 260 nm에서의 흡광도에 의해 정량화하였다. 알부민 인트론 1 영역을 0.5 마이크로몰의 각각의 프라이머 mAlb90F (CTCCTCTTCGTCTCCGGC) (서열 번호 4031) 및 mAlb1073R (CTGCCACATTGCTCAGCAC) (서열 번호 4032) 및 1 x Pfusion Flash PCR Master Mix를 함유하는 반응에서 50 ng의 게놈 DNA로부터 PCR 증폭시켰다.
마우스 알부민의 전체 인트론 1에 걸쳐 있는 생성된 984 bp PCR 산물을 컬럼-기반 정제 키트(DNA Clean and Concentrator, Zymo Research)를 사용하여 정제하고, 각각의 sgRNA에 대해 150 bp 내지 350 bp의 예측된 표적 부위 내에 위치한 프라이머를 사용하여 시퀀싱하였다. 형질감염되지 않은 Hepa1-6 세포로부터의 프라이머 mAlb90F(서열 번호 4031) 및 mAlb1073R(서열 번호 4032)을 사용하여 생성된 PCR 산물을 대조로서 병행하여 시퀀싱하였다. Sanger 시퀀싱 크로마토그램은 인델의 빈도 뿐만 아니라 인델 프로파일을 결정하는 CRISPR 편집 추론(ICE)를 사용하여 분석되었다(Hsiau et. al, BioArxiv. 2018. Sanger Trace Data로부터의 CRISPR 편집 추론. https://www. biorxiv.org/content/early/2018/01/20/251082).
뉴클레아제가 살아있는 세포 내부의 DNA에 이중-가닥 파손(DSB)을 생성할 때, DSB는 세포 DNA 복구 기구에 의해 복구된다. 배양 중인 형질전환된 포유동물 세포와 같이 활발히 분열하는 세포에서, 및 복구 주형의 부재 하에, 이러한 복구는 NHEJ 경로에 의해 발생한다. NHEJ 경로는 이중-가닥 파손 부위에서 염기의 삽입 또는 결실을 도입하는 오류 유발 과정이다(Lieber, M.R, Annu Rev Biochem. 2010; 79: 181-211). 따라서, 이러한 삽입 및 결실은 발생하고 후속하여 복구된 이중-가닥 파손의 특징이며, 이는 뉴클레아제의 편집 또는 절단 효율의 판독으로서 널리 사용된다. 삽입 및 결실의 프로파일은 이중-가닥 파손을 생성한 뉴클레아제의 특징 뿐만 아니라 절단 부위에서의 서열 맥락에 의존한다. 시험관 내 검정에 기초하여, MG29-1 뉴클레아제는 PAM의 3'에 위치한 엇갈린 절단을 생성한다. 엇갈린 절단은 종종 말단-결합 전에 단일-가닥 말단의 트리밍으로 인해 더 큰 결실을 초래할 것이다. 표 8은 Hepa1-6 세포에서 시험된 마우스 알부민 인트론 1을 표적화하는 19 개의 sgRNA 각각에 의해 생성된 총 인델 빈도를 열거한 것이다. 18 개의 sgRNA 중 11 개는 표적 부위에서 검출 가능한 인델을 생성시켰는데, 5 개의 sgRNA는 50% 초과의 인델 빈도를 생성시키고 4 개의 sgRNA는 75% 초과의 인델 빈도를 생성시켰다. 이러한 데이터는 MG29-1 뉴클레아제가 75% 초과의 효율로 sgRNA에 대한 예측된 표적 부위에서 배양된 마우스 간 세포의 게놈을 편집할 수 있다는 것을 입증한다.
동일한 세트의 sgRNA의 편집 효율을 상업적 지질-기반 형질감염 시약(Lipofectamine MessengerMAX, Invitrogen)을 사용하여 MG29-1 뉴클레아제를 코딩하는 sgRNA 및 mRNA의 공동-형질감염에 의해 평가하였다. MG29-1을 코딩하는 mRNA는 MG29-1의 코딩 서열이 클로닝된 플라스미드로부터의 T7 폴리머라제를 사용하여 시험관 내 전사에 의해 생성되었다. MG29-1 코딩 서열은 인간 코돈 사용 표를 사용하여 코돈 최적화되었고, N-말단에서 SV40으로부터 및 C-말단에서 뉴클레오플라스민으로부터 유래된 핵 국소화 신호가 측접되었다. 또한, 번역을 개선하기 위해 UTR을 코딩 서열의 3' 말단에 포함시켰다. 생체 내에서 mRNA 안정성을 개선하기 위해 3' UTR에 이어서 대략 90 개 내지 110 개의 뉴클레오타이드 폴리 A 트랙트를 코딩 서열의 3' 말단에 포함시켰다(예를 들어, 야생형 MG29-1의 경우 서열 번호 4426 및 S168R 변이체의 경우 서열 번호 3327 참조). 시험관 내 전사 반응에 Clean Cap® 캡핑 시약(Trilink BioTechnologies)을 포함시켰고, 생성된 RNA를 MEGAClear™ 전사 클린-업 키트(Invitrogen)를 사용하여 정제하고, TapeStation(Agilent)을 사용하여 순도를 평가하였고, >90% 전장 RNA로 구성되는 것으로 밝혀졌다. 표 1에서 보이는 바와 같이, Hepa1-6 세포의 mRNA/sgRNA 지질 형질감염 후 편집 효율은 RNP의 뉴클레오펙션에서 보이는 것들과 유사하지만 동일하지는 않아서, MG29-1 뉴클레아제가 mRNA의 형태로 전달될 때 배양된 간 세포에서 활성임을 확인시켜 주었다.
Figure pct00020
Figure pct00021
Figure pct00022
Figure pct00023
도 50은 가이드로서 mALb29-1-8을 사용하여 ICE 분석에 의해 결정된 바와 같은 MG29-1의 인델 프로파일의 대표적인 예(서열 번호 3999)이며, 4 개 염기의 결실이 가장 빈번한 사건(총 서열의 25%)이고, 1 개, 5 개, 6 개, 또는 7 개 염기의 결실이 각각 서열의 약 10% 내지 15%를 차지하였다는 것을 나타냈다. 최대 13 개 염기의 더 긴 결실도 검출되었지만, 삽입은 검출되지 않았다. 대조적으로, 마우스 알부민 인트론 1을 표적화하는 가이드를 갖는 spCas9는 주로 1 개의 염기 삽입 또는 결실을 발생시켰다.
도 51은 마우스 알부민 인트론 1 영역의 PCR 산물의 차세대 시퀀싱(NGS)에 의해 결정된 바와 같은 MG29-1 및 sgRNA mAlb29-1-8의 인델 프로파일의 대표적인 예이다. 총 대략 15,000 개의 서열 판독이 수득되었다. NGS에 의하면 4 개 염기의 결실이 가장 빈번한 인델(전체의 약 20%)이었고, 각각 1 개, 5 개, 6 개 및 7 개 염기의 결실이 인델의 약 10%를 차지하였다. 최대 19 bp의 더 큰 결실이 또한 검출되었다. NGS 분석에 의해 관찰된 프로파일은 ICE에 의해 측정된 프로파일과 밀접하게 일치하였다. 이러한 결과는 MG29-1이 시험관 내에서 관찰된 엇갈린 절단과 일치하는 표적 부위에서 큰 결실을 생성한다는 것을 입증한다.
실시예 30 - 배양된 인간 간 세포(HepG2)에서 인트론 영역을 표적화하는 본원에 기재된 뉴클레아제의 능력의 입증
인간 세포의 인트론 영역에서 이중-가닥 파손을 생성하는 MG29-1의 잠재력을 평가하기 위해, 인간 혈청 알부민의 인트론 1을 표적 유전자좌로 선택하였다. Geneious Prime 핵산 분석 소프트웨어(https://www.geneious.com/prime/)에서 가이드 검색 알고리즘을 사용하여 인간 알부민 인트론 1로 표적화된 22 nt의 스페이서 길이를 갖는 단일 가이드 RNA(sgRNA)를 확인하였다. 스페이서의 5'에 위치한 KTTG의 PAM(서열 번호 3870)을 사용하여, 인간 알부민 인트론 1 내에서 총 90 개의 잠재적인 sgRNA가 확인되었다. 인트론/엑손 경계에 걸쳐 있는 가이드는 배제하였다. Geneious Prime을 사용하여 이러한 가이드의 스페이서 서열을 마우스 게놈에 대해 검색하고, 게놈의 추가 부위에 대한 정렬에 기반하여 소프트웨어에 의해 특이성 점수를 할당하였다. 동일한 염기의 4 개 이상의 연속 염기를 갖는 스페이서 서열은 특이성에 대한 우려로 인해 배제하였다. 가장 높은 특이성 점수를 갖는 총 23 개의 스페이서를 시험을 위해 선택하였다. sgRNA를 생성하기 위해 "TAATTTCTACTGTTGTAGAT"의 골격 서열을 스페이서 서열의 3' 말단에 부가하였다. sgRNA는 cpf1 가이드에 대한 sgRNA의 성능을 개선하는 것으로 알려진 화학적으로 변형된 염기(Integrated DNA Technologies로부터 입수 가능한 AltR1/AltR2 화학)를 혼입하여 화학적으로 합성되었다. 이러한 가이드의 스페이서 서열은 표 9에 열거되어 있다.
[표 9] 인간 알부민 인트론 1을 표적화하는 MG29-1 sgRNA의 스페이서 서열 및 MG29-1/sgRNA RNP로 뉴클레오펙션된 HepG2 세포에서의 활성
Figure pct00024
형질전환된 인간 간 세포주인 HepG2 세포를 표준 조건(5% CO2 인큐베이터에서 10% FBS를 갖는 MEM 배지) 하에 배양하고 PBS 완충제에서 sgRNA와 정제된 MG29-1 단백질을 혼합함으로써 형성된 리보핵 단백질로 뉴클레오펙션시켰다. 완전한 SF 뉴클레오펙션 시약(Lonza)에서 현탁된 총 1 e5의 HepG2 세포를 80 pmol의 MG29-1 단백질과 160 pmol의 sgRNA를 혼합하여 형성된 RNP로 4D 뉴클레오펙션 디바이스(Lonza)를 사용하여 뉴클레오펙션시켰다. 뉴클레오펙션 후 세포를 DMEM + 10% FBS 중 24 웰 플레이트에 플레이팅하고, 5% CO2 인큐베이터에서 48 h 내지 72 h 동안 인큐베이션하였다. 이후, 게놈 DNA를 컬럼-기반 정제 키트(Purelink 게놈 DNA 미니 키트, ThermoFisher Scientific)를 사용하여 세포로부터 추출하고, 260 nm에서의 흡광도에 의해 정량화하였다. 알부민 인트론 1 영역을 0.5 마이크로몰의 각각의 프라이머 hAlb 11F (TCTTCTGTCAACCCCACACGCC) (서열 번호 4079) 및 hAlb834R (CTTGTCTGGGCAAGGGAAGA) (서열 번호 4080) 및 1 x Pfusion Flash PCR Master Mix를 함유하는 반응에서 50 ng의 게놈 DNA로부터 PCR 증폭시켰다. 마우스 알부민의 전체 인트론 1에 걸쳐 있는 생성된 826 bp PCR 산물을 컬럼-기반 정제 키트(DNA Clean and Concentrator, Zymo Research)를 사용하여 정제하고, sgRNA에 대해 150 bp 내지 350 bp의 예측된 표적 부위 내에 위치한 프라이머를 사용하여 시퀀싱하였다.
형질감염되지 않은 HepG2 세포로부터 프라이머 hAlb 11F (TCTTCTGTCAACCCCACACGCC) (서열 번호 4079) 및 hAlb834R (CTTGTCTGGGCAAGGGAAGA) (서열 번호 4080)을 사용하여 생성된 PCR 산물을 대조로서 병행하여 시퀀싱하였다. Sanger 시퀀싱 크로마토그램은 인델의 빈도 뿐만 아니라 인델 프로파일을 결정하는 CRISPR 편집 추론(ICE)를 사용하여 분석되었다. 뉴클레아제가 살아있는 세포 내부의 DNA에 이중-가닥 파손(DSB)을 생성할 때, DSB는 세포 DNA 복구 기구에 의해 복구된다. 배양 중인 형질전환된 포유동물 세포와 같이 활발히 분열하는 세포에서, 및 복구 주형의 부재 하에, 이러한 복구는 NHEJ 경로에 의해 발생한다. NHEJ 경로는 이중-가닥 파손 부위에서 염기의 삽입 또는 결실을 도입하는 오류 유발 과정이다(Lieber, M.R, Annu Rev Biochem. 2010; 79: 181-211).
따라서, 이러한 삽입 및 결실은 발생하고 후속하여 복구된 이중-가닥 파손의 특징이며, 이는 뉴클레아제의 편집 또는 절단 효율의 판독으로서 널리 사용된다. 삽입 및 결실의 프로파일은 이중-가닥 파손을 생성한 뉴클레아제의 특징 뿐만 아니라 절단 부위에서의 서열 맥락에 의존한다. 시험관 내 검정에 기초하여, MG29-1 뉴클레아제는 PAM으로부터 22 개 뉴클레오타이드에서(덜 빈번하게 PAM으로부터 21 개 뉴클레오타이드에서) 표적 가닥을 절단하였고, 이에 따라 PAM으로부터의 18 개 뉴클레오타이드에서 비-표적 가닥을 절단하여 PAM의 3'에 위치한 4 개의 뉴클레오타이드 엇갈린 말단을 생성하였다. 엇갈린 절단은 종종 말단-결합 전에 단일-가닥 말단의 트리밍으로 인해 더 큰 결실을 초래할 것이다.
표 9는 HepG2 세포에서 시험된 인간 알부민 인트론 1을 표적화하는 23 개의 sgRNA 각각에 의해 생성된 총 인델 빈도를 열거한 것이다. 23 개의 sgRNA 중 16 개는 표적 부위에서 검출 가능한 인델을 생성시켰는데, 8 개의 sgRNA는 50% 초과의 인델을 생성시키고 5 개의 sgRNA는 90% 초과의 인델 빈도를 생성시켰다. 이러한 데이터는 MG29-1 뉴클레아제가 90% 초과의 효율로 sgRNA에 대한 예측된 표적 부위에서 배양된 인간 간 세포주의 게놈을 편집할 수 있다는 것을 입증한다.
실시예 31 - 배양된 마우스 간 세포에서 엑손 영역을 편집하는 본원에 기재된 뉴클레아제의 능력의 입증
서열 특이적 뉴클레아제는 유전자의 코딩 서열을 파괴하고 이에 의해 관심 단백질의 기능적 녹아웃을 생성하는 데 사용될 수 있다. 이는 특정 단백질의 녹다운이 특정 질병에 유익한 효과를 가질 때 치료적 용도로 사용될 수 있다. 유전자의 코딩 서열을 파괴하는 한 가지 방법은 서열 특이적 뉴클레아제를 사용하여 유전자의 엑손 영역 내에서 이중-가닥 파손을 만드는 것이다. 이러한 이중-가닥 파손은 오류 유발 복구 경로를 통해 복구되어 단백질의 기능을 방해하는 아미노산 서열의 변화 또는 프레임시프트 돌연변이를 초래할 수 있는 삽입 또는 결실을 생성할 것이다.
간 세포에서 발현된 유전자의 엑손 영역에서 이중-가닥 파손을 생성하는 MG29-1의 잠재력을 평가하기 위해, 글리콜레이트 옥시다제(hao-1)를 코딩하는 유전자를 표적 유전자좌로 선택하였다. Geneious Prime 핵산 분석 소프트웨어(https://www.geneious.com/prime/)에서 가이드 검색 알고리즘을 사용하여 마우스 hao-1의 엑손 1 내지 4로 표적화된 22 nt의 스페이서 길이를 갖는 단일 가이드 RNA(sgRNA)를 확인하였다. hao-1 유전자의 처음 4 개의 엑손은 hao-1 코딩 서열의 대략 N-말단 50%를 포함한다. 유전자의 코딩 서열의 N-말단을 향해 생성된 인델이 단백질의 활성을 방해하는 프레임시프트 또는 미스센스 돌연변이를 생성할 가능성이 더 높기 때문에 처음 4 개의 엑손이 선택되었다. 스페이서의 5'에 위치한 KTTG의 PAM(서열 번호 3870)을 사용하여, 마우스 hao-1 엑손 1 내지 4 내에서 총 45 개의 잠재적인 sgRNA가 확인되었다. 인트론/엑손 경계에 걸쳐 있는 가이드는 이러한 가이드가 스플라이싱을 방해하는 인델을 생성할 수 있기 때문에 포함되었다. Geneious Prime을 사용하여 이러한 45 개 가이드의 스페이서 서열을 마우스 게놈에 대해 검색하고, 마우스 게놈의 추가 부위에 대한 정렬에 기반하여 소프트웨어에 의해 특이성 점수를 할당하였다. 동일한 염기의 4 개 이상의 연속 염기를 갖는 스페이서 서열은 특이성에 대한 우려로 인해 배제하였다. 가장 높은 특이성 점수를 갖는 총 45 개의 스페이서를 시험을 위해 선택하였다.
sgRNA를 생성하기 위해 "TAATTTCTACTGTTGTAGAT"의 골격 서열을 스페이서 서열의 3' 말단에 부가하였다. sgRNA는 cpf1 가이드에 대한 sgRNA의 성능을 개선하는 것으로 알려진 화학적으로 변형된 염기(Integrated DNA Technologies로부터 입수 가능한 AltR1/AltR2 화학)를 혼입하여 화학적으로 합성되었다. 이러한 가이드의 스페이서 서열은 표 10에 열거되어 있다.
[표 10] 마우스 hao-1 엑손 1 내지 4를 표적화하는 MG29-1 sgRNA의 스페이서 서열 및 MG29-1/sgRNA RNP로 뉴클레오펙션된 Hep1-6 세포에서의 활성
Figure pct00025
Figure pct00026
형질전환된 마우스 간 세포주인 Hepa1-6 세포를 표준 조건(5% CO2 인큐베이터에서 10% FBS를 갖는 DMEM 배지) 하에 배양하고 PBS 완충제에서 sgRNA와 정제된 MG29-1 단백질을 혼합함으로써 형성된 리보핵 단백질로 뉴클레오펙션시켰다. 완전한 SF 뉴클레오펙션 시약(Lonza)에서 현탁된 총 1 e5의 Hepa1-6 세포를 50 pmol의 MG29-1 단백질과 100 pmol의 sgRNA를 혼합하여 형성된 RNP로 4D 뉴클레오펙션 디바이스(Lonza)를 사용하여 뉴클레오펙션시켰다. 뉴클레오펙션 후 세포를 DMEM + 10% FBS 중 24 웰 플레이트에 플레이팅하고, 5% CO2 인큐베이터에서 48 h 내지 72 h 동안 인큐베이션하였다. 이후, 게놈 DNA를 컬럼-기반 정제 키트(Purelink 게놈 DNA 미니 키트, ThermoFisher Scientific)를 사용하여 세포로부터 추출하고, 260 nm에서의 흡광도에 의해 정량화하였다. 마우스 hao-1 유전자 1의 엑손 1 내지 4를 각 엑손에 특이적인 0.5 마이크로몰 쌍의 프라이머를 함유하는 반응에서 40 ng의 게놈 DNA로부터 PCR 증폭시켰다. 엑손 1에 사용된 PCR 프라이머는 PCR_mHE1_F_+233 (GTGACCAACCCTACCCGTTT) (서열 번호 4171), PCR_mHE1_R_-553 (GCAAGCACCTACTGTCTCGT) (서열 번호 4172)였다. 엑손 2에 사용된 PCR 프라이머는 HAO1_E2_F5721 (CAACGAAGGTTCCCTCCAGG) (서열 번호 4173), HAO1_E2_R6271 (GGAAGGGTGTTCGAGAAGGA) (서열 번호 4174)였다. 엑손 3에 사용된 PCR 프라이머는 HAO1_E3_F23198 (TGCCCTAGACAAGCTGACAC) (서열 번호 4175), HAO1_E3_R23879 (CAGATTCTGGAAGTGGCCCA) (서열 번호 4176)이었다. 엑손 4에 사용된 PCR 프라이머는 HAO1_E4_F31087 (CCTGTAGGTGGCTGAGTACG) (서열 번호 4177), HAO1_E4_R31650 (AGGTTTGGTTCCCCTCACCT) (서열 번호 4178)이었다.
프라이머 및 게놈 DNA 이외에, PCR 반응은 1 x Pfusion Flash PCR Master Mix(Thermo Fisher)를 함유하였다. 생성된 PCR 산물은 아가로스 겔 상에서 분석될 때 단일 밴드를 포함하여 PCR 반응이 특이적이었음을 입증하였고, 컬럼-기반 정제 키트(DNA Clean and Concentrator, Zymo Research)를 사용하여 정제하였다. 시퀀싱을 위해, 각 절단 부위로부터 적어도 100 nt의 서열에 상보성인 프라이머를 사용하였다. 엑손 1을 시퀀싱하기 위한 프라이머는 Seq_mHE1_F_+139 (GTCTAGGCATACAATGTTTGCTCA) (서열 번호 4179)였다. 엑손 2를 시퀀싱하기 위한 프라이머는 5938F Seq_HAO1_E2 (CTATGCAAGGAAAAGATTTGGCC) (서열 번호 4180)였다. 엑손 3을 시퀀싱하는 프라이머는 HAO1_E3_F23476 (TCTTCCCCCTTGAATGAAACACT) (서열 번호 4181) 및 역 PCR 프라이머, HAO1_E3_R23879 (CAGATTCTGGAAGTGGCCCA) (서열 번호 4182)였다. 엑손 4를 시퀀싱하기 위한 프라이머는 역 PCR 프라이머, HAO1_E4_R31650 (AGGTTTGGTTCCCCTCACCT) (서열 번호 4183)이었다.
PCR 산물의 시퀀싱은 이들이 hao-1 엑손의 예측 서열을 함유하였음을 보여주었다. 상이한 RNP 또는 비처리 대조로 뉴클레오펙션된 Hepa-16 세포로부터 유래된 PCR 산물을 각각의 sgRNA에 대하여 예측된 표적 부위의 100 bp 내지 350 bp 내에 위치한 프라이머를 사용하여 시퀀싱하였다. Sanger 시퀀싱 크로마토그램은 인델의 빈도 뿐만 아니라 인델 프로파일을 결정하는 CRISPR 편집 추론(ICE)(Hsiau et. al, BioArxiv. 2018, Sanger Trace Data로부터의 CRISPR 편집 추론. https://www.biorxiv.org/content/early/2018/01/20/251082)를 사용하여 분석되었다. 뉴클레아제가 살아있는 세포 내부의 DNA에 이중-가닥 파손(DSB)을 생성할 때, DSB는 세포 DNA 복구 기구에 의해 복구된다. 배양 중인 형질전환된 포유동물 세포와 같이 활발히 분열하는 세포에서, 및 복구 주형의 부재 하에, 이러한 복구는 NHEJ 경로에 의해 발생한다. NHEJ 경로는 이중-가닥 파손 부위에서 염기의 삽입 또는 결실을 도입하는 오류 유발 과정이다(Lieber, M.R, Annu Rev Biochem. 2010; 79: 181-211). 따라서, 이러한 삽입 및 결실은 발생하고 후속하여 복구된 이중-가닥 파손의 특징이며, 이는 뉴클레아제의 편집 또는 절단 효율의 판독으로서 당분야에 널리 사용된다. 표 10에 제시된 바와 같이, 14 개의 가이드는 이들의 예측 표적 부위에서 검출가능한 편집을 입증하였다. 4 개의 가이드는 90% 초과의 편집 활성을 나타냈다. 14 개 모두의 활성 가이드는 TTTN의 PAM 서열을 가져서, 이러한 PAM이 생체 내에서 바람직하다는 것을 입증하였다. 그러나, TTTN PAM을 이용하는 모든 가이드가 활성인 것은 아니었다. 이러한 데이터는 MG29-1 뉴클레아제가 배양된 간 세포의 엑손 영역에서 RNA 가이드 서열 특이적 이중-가닥 파손을 고효율로 생성할 수 있다는 것을 입증한다.
실시예 32 - Hao-1 유전자의 파괴를 위한 추가 sgRNA의 설계
추가의 sgRNA는 hao-1 유전자의 엑손 부분을 표적화하도록 설계되었다. 이들은 처음 4 개의 엑손을 표적화하도록 설계되었는데, 그 이유는 이들이 코딩 서열의 약 50%를 구성하고 유전자의 코딩 서열의 N-말단을 향해 생성된 인델이 단백질의 활성을 방해하는 프레임시프트 또는 미스센스 돌연변이를 생성할 가능성이 더 높기 때문이다. 실시예 31에서 포유동물 세포에서 더 활성인 것으로 나타난 KTTG의 보다 제한적인 PAM(서열 번호 3870)을 사용하여, 인간 hao-1 엑손 1 내지 4 내에서 총 42 개의 잠재적인 sgRNA가 확인되었다(표 11).
[표 11] 인간 hao-1 유전자의 엑손 1 내지 4에서 확인된 MG29-1에 대한 스페이서 서열
Figure pct00027
인트론/엑손 경계에 걸쳐 있는 가이드는 이러한 가이드가 스플라이싱을 방해하는 인델을 생성할 수 있기 때문에 포함되었다. Geneious Prime을 사용하여 이러한 42 개 가이드의 스페이서 서열을 인간 게놈에 대해 검색하고, 인간 게놈에 대한 정렬에 기반하여 소프트웨어에 의해 특이성 점수를 할당하였다. 더 높은 특이성 점수는 스페이서가 설계된 부위 이외의 인간 게놈에서 가이드가 1 개 이상의 서열을 인식할 가능성이 더 낮다는 것을 지시한다. 특이성 점수는 10% 내지 100%의 범위였는데, 25 개의 가이드는 90% 초과의 특이성 점수를 갖고 33 개의 가이드는 80% 초과의 특이성 점수를 가졌다. 이러한 분석은 높은 특이성 점수를 갖는 인간 유전자의 엑손 영역을 표적화하는 가이드가 용이하게 확인될 수 있다는 것을 입증하며, 다수의 매우 활성인 가이드가 확인될 것으로 예상된다.
실시예 33 - 마우스 간 세포에서 본원에 기재된 뉴클레아제의 편집 역가와 spCas9의 편집 역가의 비교
박테리아 종 스트렙토코쿠스 피오게네스(spCas9)로부터의 CRISPR Cas9 뉴클레아제는 게놈 편집에 널리 사용되며 확인된 가장 활성인 RNA 가이드 뉴클레아제 중 하나이다. SpCas9와 비교하여 MG29-1의 상대 역가를 마우스 간 세포주 Hepa1-6에서 상이한 용량의 RNP의 뉴클레오펙션에 의해 평가하였다. 마우스 알부민의 인트론 1을 표적화하는 sgRNA를 둘 모두의 뉴클레아제에 사용하였다. MG29-1의 경우, 실시예 29에서 확인된 sgRNA mAlb29-1-8이 선택되었다. 가이드 mAlb29-1-8(실시예 29 참조)은 MG29-1과 유사한 sgRNA 구조를 갖는 타입 V 뉴클레아제 cpf1에 대한 가이드의 역가를 개선하도록 설계된 AltR1/AltR2(Integrated DNA Technologies)로 불리는 화학 변형을 혼입하여 화학적으로 합성되었다. spCas9의 경우, 마우스 알부민 인트론 1을 효율적으로 편집한 sgRNA는 인-실리코 스크린으로부터 선택된 3 개의 가이드를 시험함으로써 확인되었다. 이들 연구에 사용된 spCas9 단백질은 상업적 공급업체(Integrated DNA technologies AltR-sPCas9)로부터 입수하였다.
sgRNA mAlbR1(스페이서 서열 TTAGTATAGCATGGTCGAGC)을 화학적으로 합성하고, 세포에서 역가를 개선하는 가이드의 양 말단에서 3 개 염기 상의 포스포로티오에이트(PS) 연결 및 2' O 메틸 염기를 포함하는 화학 변형을 혼입시켰다. MAlbR1 sgRNA는 20 pmol의 spCas9 단백질/50 pmol의 가이드를 포함하는 RNP가 Hepa1-6 세포에 뉴클레오펙션될 때 90%의 빈도로 인델을 생성하여, 이것이 고도로 활성인 가이드임을 지시하였다. 20 pmol 내지 1 pmol의 범위의 뉴클레아제 단백질 및 1:2.5의 단백질 대 sgRNA의 일정한 비율로 형성된 RNP를 Hepa1-6 세포로 뉴클레오펙션시켰다. 마우스 알부민 인트론 1의 표적 부위에서의 인델을 PCR 증폭된 게놈 DNA의 Sanger 시퀀싱 및 ICE 분석을 이용하여 정량화하였다. 도 52에 나타낸 결과는 편집이 포화되지 않을 때 MG29-1이 더 낮은 RNP 용량에서 spCas9보다 높은 백분율의 인델을 생성했다는 것을 입증한다. 이러한 데이터는 MG29-1이 간-유래 포유동물 세포에서 적어도 spCas9만큼 활성이고 spCas9보다 잠재적으로 더 활성이라는 것을 지시한다.
실시예 34 - 본원에 기재된 뉴클레아제의 조작 서열 변이체 및 마우스 간 세포에서의 평가
MG29-1의 편집 효율을 개선하기 위해, 1 개 또는 2 개의 아미노산을 치환하는 돌연변이 세트를 MG29-1 코딩 영역에 도입하였다. 아미노산 치환의 세트를 악시다미코쿠스 종 Cas12a(AsCas12a)에 정렬에 의해 확인하였다. 구조화된-가이드 조작(Kleinstiver, et al, Nat Biotechnol. 2019, 37 276-282)은 PAM 결합을 변경 또는 개선할 목적으로 AsCas12a에서 상이한 아미노산을 치환하였다. AsCas12a에서 4 개의 아미노산 치환인 S170R, E174R, N577R 및 K583R은 표준 및 비-표준 PAM으로 더 높은 편집 효율을 나타냈다. 이러한 치환과 일치하는 부위는 다중 정렬에 의해 MG29-1에서 확인되었고, MG29-1에서 S168R, E172R, N577R 및 K583R에 상응한다.
단일 아미노산 치환을 시험하기 위해 2-플라스미드 전달 시스템을 사용하였다. 표준 분자 클로닝 기법을 이용하여 단일 아미노산 치환으로 MG29-1을 코딩하는 발현 플라스미드를 작제하였다. 하나의 플라스미드는 CMV 프로모터 하에 MG29-1에 대해 코딩되었고, 또 다른 플라스미드는 Hepa 1-6 세포에서 높은 편집 효율을 갖는 mAlb29-1-8 sgRNA를 함유하였다(표 8 참조). 가이드의 전사는 인간 U6 프로모터에 의해 구동되었다. 2-플라스미드 시스템을 사용한 단일 아미노산 치환으로부터의 초기 결과의 확인 및 이중 아미노산 치환의 시험을 MG29-1을 코딩하는 시험관 내 전사된(IVT) mRNA(IVT mRNA가 어떻게 만들어졌는지에 대한 세부사항은 실시예 33 참조) 및 Cpf1에 대해 Integrated DNA Technologies에 의해 최적화된 AltR1/AltR2 화학 변형을 혼입하는 화학적으로 합성된 가이드(Integrated DNA technologies에서 합성됨)를 사용하여 수행하였다. 2-플라스미드 시스템의 전달을 위해, MG29-1을 코딩하는 100 ng의 플라스미드 및 가이드를 코딩하는 400 ng의 플라스미드를 리포펙타민 3000과 혼합하고, Hepa1-6 세포에 첨가하고, 게놈 DNA 단리 전에 3일 동안 인큐베이션하였다.
IVT mRNA 및 합성 가이드의 전달을 위해, 300 ng의 mRNA 및 120 ng의 합성 가이드를 Lipofectamine Messenger Max와 혼합하고, 세포에 첨가하고, 게놈 DNA 단리 전에 2일 동안 인큐베이션하였다. IVT mRNA를 사용하여 스크리닝된 합성 가이드는 표 8에 상세히 기재된 가이드에 상응하지만, 단순화를 위해 도 53의 가이드의 명칭은 가이드 "mAlb29-1-1"이 g1-1로서 표현되고, "mAlb29-1-8"이 g1-8로 표현되고, 그 외에도 이와 같도록 단축되었다. 인간 T 세포 수용체 유전자좌(TRAC)를 표적화하는 하나의 가이드를 또한 시험하였다(도 53d에서 35 TRAC). 가이드 35 TRAC 스페이서는 TTTG PAM을 갖는 GAGTCTCTCAGCTGGTACACGG (서열 번호 4268)이다. Guide 35 TRAC는 상기 언급된 것과 동일한 변형으로 입수되었다. 마우스 알부민 인트론 1의 MG29-1 편집에 대해 이전 실시예에 기재된 바와 같이 게놈 DNA 및 PCR 증폭을 수행하였다. 가이드 35 TRAC의 경우, 인간 TRAC 유전자좌를 프라이머 F: TGCTTTGCTGGGCCTTTTTC(서열 번호 4269), 프라이머 R: ACAGTCTGAGCAAAGGCAGG(서열 번호 4270)로 증폭시켰다. 생성된 957 bp의 PCR 산물을 전술한 바와 같이 정제하였다. 프라이머 ATCACGAGCAGCTGGTTTCT (서열 번호 4271)를 사용하여 Sanger 시퀀싱에 의해 편집을 평가하였다.
마우스 알부민 인트론 1 및 인간 TRAC 유전자좌에 대한 편집 효율을 PCR 산물의 Sanger 시퀀싱 및 이후 CRISPR 편집 추론(ICE)을 사용하여 정량화하였다. 최대 4 개의 생물학적 복제물을 나타내는 데이터가 도 53에 플롯팅되어 있다. 단일 아미노산 치환 S168R은 2-플라스미드 시스템에서 가이드 mAlb29-1-8을 사용할 때 개선된 편집 효율을 입증하였다(도 53a). 돌연변이 E172R은 가이드 mAlb29-1-8로 주요 개선을 제공하지 않은 반면, 돌연변이 K583R은 mAlb29-1-8 가이드로 편집을 완전히 방지하였다. MG29-1 mRNA 및 합성 가이드 mAlb29-1-8로의 형질감염에 의해 플라스미드 형질감염으로부터의 결과를 확인하였다(도 53b). 단일 아미노산 치환 S168R은 가이드 mAlb29-1-8로 시험된 상이한 농도의 mRNA에 걸쳐 더 높은 편집 효율을 부여하였다(도 53b). E172R(도 53a에서 보이는 바와 같이 단독으로 활성을 손상시키지 않은 치환), 또는 N577R(MG29-1 플라스미드 형질감염에서 시험되지 않았지만 cpf1의 더 높은 편집 효율을 부여한 치환) 및 Y170R(이는 예측 MG29-1 단백질 구조에 기반하여 편집 효율을 개선할 수 있는 것으로 가정됨)로의 S168R의 이중 아미노산 치환을 시험하고, 단일 S168R 돌연변이체와 비교하였다.
이중 돌연변이 중 어느 것도 시험된 조건 하에서 개선된 편집 효율을 부여하지 않았다(도 53c). MG29-1 및 MG29-1 WT의 S168R 변이체의 편집 효율을 마우스 알부민 인트론 1을 표적화하는 12 개의 가이드 및 인간 T 세포 수용체 유전자좌(TRAC)를 표적화하는 1 개의 가이드와 병행하여 비교하였다. MG29-1의 S168R 변이체는 13 개 가이드 모두에서 개선된 편집 효율을 나타냈고, 일부 가이드는 다른 가이드보다 더 많은 이익을 얻었다(도 4d). 중요하게는, S168R은 시험된 임의의 가이드에 대해 포유동물 편집 효율을 손상시키지 않았다. 이러한 결과는 MG29-1의 S168R(아미노산 위치 168의 세린이 아르기닌으로 변경됨) 변이체가 개선된 편집 활성을 가지며 치료 용도를 위한 고활성 가이드를 확인하는 데 유리하다는 것을 입증한다.
실시예 35 - 포유동물 세포에서 가이드 안정성을 개선하고 편집 효율을 개선하는 본원에 기재된 뉴클레아제의 sgRNA의 화학 변형의 확인
RNA 분자는 뉴클레아제에 의한 절단에 대한 이들의 민감성으로 인해 생물학적 시스템에서 본질적으로 불안정하다. RNA의 천연 화학 구조의 변형은 치료 약물 개발의 맥락에서 RNA 간섭(RNAi)에 사용되는 안정성 RNA 분자를 개선하기 위해 널리 사용되고 있다(Corey, J Clin Invest. 2007 Dec 3; 117(12): 3615-3622, J.B. Bramsen, J. Kjems Frontiers in Genetics, 3 (2012), p. 154). RNA의 핵염기 또는 포스포디에스테르 골격에 대한 화학 변형의 도입은 생체 내에서 짧은 RNA 분자의 안정성 및 이에 따른 역가를 개선하는 데 중추적이었다. 뉴클레아제에 대한 안정성 및 상보성 DNA 또는 RNA에 대한 친화성의 측면에서 상이한 성질을 갖는 광범위한 화학 변형이 개발되었다.
유사한 화학 변형이 CRISPR Cas9 뉴클레아제에 대한 가이드 RNA에 적용되었다(각각 그 전체가 본원에 참조로 포함되는 문헌[Hendel et al, Nat Biotechnol. 2015 Sep; 33(9): 985-989, Ryan et al Nucleic Acids Res 2018 Jan 25;46(2):792-803., Mir et al Nature Communications volume 9, Article number: 2641 (2018), O' Reilly et al Nucleic Acids Res 2019 47, 546-558, Yin et al Nature Biotechnology volume 35, pages 1179-1187(2017)]).
MG29-1 뉴클레아제는 cpf1과 같은 공지된 타입 V CRISPR 효소와 제한된 아미노산 서열 유사성을 갖는 신규한 뉴클레아제이다. MG29-1에 대해 확인된 가이드 RNA의 구조적(골격) 성분의 서열은 cpf1의 서열과 유사하지만, MG29-1 가이드에 대한 어떤 화학 변형이 활성을 보유하면서 개선된 안정성을 가능하게 할지는 알려진 바 없다. MG29-1 sgRNA의 일련의 화학 변형이 포유동물 세포에서 sgRNA 활성 및 포유동물 세포 단백질 추출물의 존재 하에서의 안정성에 대한 이들의 영향을 평가하기 위해 설계되었다.
cpf1에 대한 가이드 RNA의 활성을 개선하도록 설계된 AltR1/AltR2로 공지된 IDT에 의해 개발되고 상업적으로 입수 가능한(IDT) 전매 화학 변형 세트를 가이드가 함유할 때 마우스 간 세포주 Hepa1-6에서 매우 활성인 sgRNA mAlb29-1-8이 선택되었다. 핵염기의 2가지 화학 변형을 시험하기 위해 다음을 선택하였다: 2' 하이드록실 기가 메틸 기로 대체된 2'-O-메틸, 및 2' 하이드록실 기가 불소로 대체된 2'-플루오로. 2'-O-메틸과 2'-플루오로 변형 둘 모두는 뉴클레아제에 대한 내성을 개선한다. 2'-O-메틸 변형은 RNA의 자연 발생적 전사후 변형이며, RNA:RNA 이중체의 결합 친화성을 개선하지만 RNA:DNA 안정성에는 거의 영향을 미치지 않는다. 2'-플루오로 변형된 염기는 면역자극 효과를 감소시키고 RNA:RNA와 RNA:DNA 혼성체 둘 모두의 결합 친화성을 증가시킨다(Pallan et al Nucleic Acids Res 2011 Apr;39(8):3482-95, Chen et al Scientific Reports volume 9, Article number: 6078 (2019), Kawasaki, A. M. et al. J Med Chem 36, 831-841 (1993)).
염기 사이의 포스포디에스테르 연결 대신에 포스포로티오에이트(PS) 연결의 포함을 또한 평가하였다. PS 연결은 뉴클레아제에 대한 내성을 개선한다(Monia et al Nucleic Acids, Protein Synthesis, and Molecular Genetics| Volume 271, ISSUE 24, P14533-14540, June 14, 1996).
마우스 알부민 인트론 1(mAlb29-1-8)을 표적화하는 스페이서를 갖는 MG29-1 sgRNA의 예측된 이차 구조는 도 54에 나타나 있다. 가이드의 골격 부분의 줄기-루프는 다른 CRISPR-cas 시스템에 대해 알려진 것에 기초하여 MG29-1 단백질과의 상호작용에 중요한 것으로 추정되었다. 이차 구조에 기초하여, 가이드의 상이한 구조적 및 기능적 영역에서 일련의 화학 변형이 설계되었다. 가이드의 구조적 및 기능적 영역이 활성의 현저한 손실 없이 상이한 화학 변형을 허용할 수 있는지를 알려주는 더 적은 화학 변형으로 가이드의 초기 시험을 가능하게 하는 모듈식 접근법을 수행하였다. 구조적 및 기능적 영역은 다음과 같이 정의되었다. 가이드의 3' 말단 및 5' 말단은 엑소뉴클레아제에 대한 표적이고, spCas9에 대한 가이드의 안정성을 개선하기 위해 사용된 접근법인 2'-O-메틸 및 PS 연결을 포함하는 다양한 화학 변형에 의해 보호될 수 있다(Hendel et al, Nat Biotechnol. 2015 Sep; 33(9): 985-989).
가이드의 골격 영역에서 줄기와 루프의 절반 둘 모두를 포함하는 서열을 변형을 위해 선택하였다. 스페이서를 시드 영역(PAM에 가장 가까운 처음 6 개 뉴클레오타이드) 및 스페이서의 나머지 16 개 뉴클레오타이드(비-시드 영역으로 지칭됨)로 나누었다. 총 43 개의 가이드를 설계하고 39 개를 합성하였다. 43 개 가이드 모두는 동일한 뉴클레오타이드 서열을 함유하지만 상이한 화학 변형을 가졌다. 39 개의 가이드의 편집 활성을 RNP의 뉴클레오펙션에 의해 또는 MG29-1 및 가이드를 코딩하는 mRNA의 공동-형질감염에 의해 또는 이 둘 모두의 방법에 의해 Hepa1-6 세포에서 평가하였다. 이러한 두 가지 형질감염 방법은 세포로의 전달의 차이로 인해 가이드의 관찰된 활성에 영향을 미칠 수 있다.
RNP의 뉴클레오펙션이 사용될 때, 가이드 및 MG29-1 단백질은 튜브에서 사전-복합체화된 다음, RNP의 존재 하에 전류가 세포의 현탁액에 가해지는 뉴클레오펙션을 사용하여 세포에 전달된다. 전류는 RNP 상의 전하에 의해 구동되는 RNP의 세포 진입을 가능하게 하는 세포막(및 가능하게는 또한 핵막)에서 기공을 일시적으로 개방한다. RNP가 전류에 의해 생성된 공극을 통해 또는 RNP의 단백질 성분에서 조작된 핵 국소화 신호, 또는 이 둘의 조합을 통해 핵에 진입하는지 여부는 불분명하다.
Messenger MAX와 같은 지질 형질감염 시약으로 mRNA와 가이드의 공동-형질감염이 사용될 때, 2 개의 RNA의 혼합물은 양으로 하전된 지질과 복합체를 형성하고 복합체는 세포내이입을 통해 세포에 진입하여 결국 세포질에 도달한다. 세포질에서 mRNA는 단백질로 번역된다. MG29-1과 같은 RNA 가이드 뉴클레아제의 경우, 생성된 MG29-1 단백질은 추정상 MG29-1 단백질로 조작된 핵 국소화 신호에 의해 매개되는 과정에서 핵에 진입하기 전에 세포질에서 가이드 RNA와 복합체를 형성할 것이다.
mRNA의 충분한 양의 MG29-1 단백질로의 번역 및 이어서 가이드 RNA에 대한 MG29-1 단백질의 결합은 한정된 시간이 소요되기 때문에, 가이드 RNA는 미리 형성된 RNP가 뉴클레오펙션에 의해 전달되는 경우보다 더 길게 세포질에서 온전한 상태로 유지될 필요가 있을 수 있다. 따라서, 지질-기반 mRNA/sgRNA 공동-형질감염은 RNP 뉴클레오펙션에 대한 경우보다 더 안정적인 가이드를 필요로 할 수 있는데, 이는 일부 가이드 화학이 RNP로서 활성이지만 양이온성 지질 시약을 사용하여 mRNA로 공동 형질감염될 때 불활성이 되게 할 수 있다.
가이드 mAlb298-1 내지 mAlb298-5는 2'-O-메틸 및 2' 플루오로 염기와 PS 연결의 혼합물을 사용하여 서열의 5' 및 3' 말단에서만 화학 변형을 함유하였다. 화학 변형이 없는 sgRNA와 비교하여, 이러한 가이드는 RNP를 통해 전달될 때 7배 내지 11배 더 활성이었는데, 이는 가이드에 대한 말단 변형이, 추정상 엑소뉴클레아제에 대한 개선된 내성을 통해, 가이드 활성을 개선하였다는 것을 입증한다. sgRNA mAlb298-1 내지 mAlb298-5는 상업적 화학 변형(AltR1/AltR2)을 함유하는 가이드의 편집 활성의 64% 내지 114%를 나타냈다. 가장 많은 수의 화학 변형을 함유하는 가이드 4는 말단 변형된 가이드 중에서 최소 활성이었으나, 비변형 가이드보다 여전히 7배 더 활성이었다. 가이드 mALB298-30은 5' 말단에 3 개의 2'-O 메틸 염기 및 2 개의 PS 연결 및 5' 말단에 4 개의 2'-O 메틸 염기 및 3 개의 PS 연결을 함유하고, 또한 비변형된 가이드보다 약 10배 더 높거나 mAlb298-1에 비해 RNA 공동-형질감염의 경우에 유사하거나 약간 개선된 활성을 나타냈다. 이러한 데이터는 MG29-1 가이드의 양 말단에서 PS 연결과 조합된 2'O-메틸이 비변형 가이드와 비교하여 가이드 활성을 유의하게 향상시켰다는 것을 입증한다.
2'-플루오로 염기와 PS 연결의 조합은 또한 가이드의 3' 말단에서 허용되었다. 가이드 mALb298-28은 5' 말단에 3 개의 2'-플루오로 염기 및 2 개의 PS 연결 및 3' 말단에 4 개의 2'-플루오로 염기 및 3 개의 PS 연결을 함유하였다. 이러한 말단 변형된 가이드는 양 말단에 2'-O 메틸 및 PS 변형을 갖는 가이드와 유사한 우수한 편집 활성을 보유하였는데, 이는 2'-플루오로가 가이드 안정성을 개선하고 편집 활성을 보유하기 위해 2'-O 메틸 대신에 사용될 수 있다는 것을 입증한다.
sgRNA mALb298-6, mALb298-7, 및 mALb298-8은 mALb298-1에 존재하는 5' 말단과 3' 말단 둘 모두에 동일한 최소 화학 변형과 함께 줄기의 상이한 영역에서 PS 연결을 함유하였다. 3' 줄기(mALb298-6) 및 5' 줄기(mALb298-7)에서 PS 연결은 RNP 뉴클레오펙션 검정에서 mAlb298-1과 비교하여 활성을 약 30%만큼 감소시켰는데, 이는 이러한 변형이 허용될 수 있다는 것을 지시한다. 지질-기반 형질감염에 의해 더 큰 활성 감소가 관찰되었다.
3' 줄기와 5' 줄기 둘 모두에서 PS 연결의 도입(mALb298-8)은 RNP 뉴클레오펙션 검정에서 mAlb298-1과 비교하여 약 80% 및 지질 형질감염 검정에서 95% 초과로 활성을 감소시켰는데, 이는 2 개의 PS 연결 변형의 조합이 가이드의 기능을 유의하게 손상시켰다는 것을 지시한다.
sgRNA mAlb298-9는 mAlb298-1에 존재하는 5' 말단과 3' 말단 둘 모두에 동일한 최소 화학 변형과 루프의 PS 연결을 함유하고 mAlb298-1과 유사한 활성을 나타냈는데, 이는 루프의 PS 연결이 잘 허용되었다는 것을 지시한다.
sgRNAs mAlb298-10, mAlb298-11, 및 mAlb298-12는 mAlb298-1에 존재하는 5' 말단과 3' 말단 둘 모두에 동일한 최소 화학 변형과 함께 줄기의 상이한 영역에서 2'-O 메틸 염기를 함유하였다. 3' 줄기(mAlb298-11) 또는 5' 줄기(mAlb298-12) 또는 줄기 둘 모두의 절반(mAlb298-10)에 2'-O 메틸 염기를 포함하는 것은 일반적으로 mAlb298-1에 비해 활성의 단지 적은 감소만으로 잘 허용되었고, 가이드 mAlb298-12(5' 줄기 변형)가 가장 활성이었다.
가이드 mAlb298-14는 mAlb298-1에 존재하는 5' 말단과 3' 말단 둘 모두에 동일한 최소 화학 변형과 함께 줄기 둘 모두의 절반에 2'-O-메틸 염기 및 PS 연결의 조합을 함유하고, RNP 뉴클레오펙션에 의해 또는 지질-기반 RNA 공동-형질감염에 의해 편집 활성을 갖지 않았다. 이는 둘 모두의 줄기에 PS 연결만을 함유한 mAlb298-8이 낮은 수준의 활성을 보유한 결과를 확인하고 확장시켜 주며, 줄기 둘 모두의 절반의 광범위한 화학 변형이 가이드를 불활성으로 만든다는 것을 보여준다.
sgRNA mAlb298-13은 mAlb298-1에 존재하는 5' 말단과 3' 말단 둘 모두에 동일한 최소 화학 변형과 함께 스페이서의 시드 영역을 제외한 스페이서 및 골격의 나머지 전체에 걸쳐 다른 모든 염기로 이격된 PS 연결을 함유하였다. 이러한 변형은 배경 수준에 가깝게 편집 활성의 극적인 손실을 초래하였다. 이러한 가이드의 순도는 대부분의 가이드의 경우 >75%에 비해 단지 약 50%에 불과했지만, 이것만으로는 편집 활성의 완전한 손실을 야기할 수 없었다. 따라서, 가이드 전체에 걸쳐 본질적으로 무작위 방식으로 PS 연결을 분배하는 것은 편집 활성을 보유하면서 가이드 안정성을 개선하기 위한 효과적인 접근법이 아니다.
가이드 mALb298-15 및 mALb298-16은 mAlb298-1에 존재하는 5' 말단과 3' 말단 둘 모두에 동일한 최소 화학 변형과 함께 골격에서 광범위한 PS 연결을 함유하였다. 둘 모두의 가이드는 RNP 뉴클레오펙션에 의해 mAlb298-1의 활성의 약 35%를 보유했지만 지질-기반 RNA 공동-형질감염에 의해 mAlb298-1의 활성의 단지 3%를 보유하였는데, 이는 골격의 광범위한 PS 변형이 편집 활성을 유의하게 감소시켰다는 것을 지시한다. mAlb298-17 및 mAlb298-18에서와 같이 골격의 PS 연결을 스페이서 영역의 PS 연결과 조합하면, PS 연결의 무작위 포함이 MG29-1에 의한 편집을 지시하는 가이드의 능력을 차단한다는 관찰과 일치하는 추가의 활성 손실을 초래하였다.
가이드 mAlb298-19는 스페이서에서 mALb298-1과 동일한 화학 변형을 함유하지만, 골격 영역에서 5' 말단이 추가 4 개의 2'-O-메틸 염기 및 추가 14 개의 PS 연결을 가졌다. mAlb298-19의 활성은 RNP 뉴클레오펙션에 의한 mAlb298-1의 활성의 약 40%였으나 RNA 공동-형질감염에 의한 활성이 단지 22%였는데, 이는 가이드의 골격 영역에서 광범위한 화학 변형이 잘 허용되지 않는다는 것을 다시 입증한다.
가이드 mAlb298-20, mAlb298-21, mAlb298-22, 및 mAlb298-23은 mAlb298-1에서와 동일한 5' 말단 변형인 5' 말단에서 단일 2'-O 메틸 및 2 개의 PS 연결을 포함한 골격 영역에서 동일한 화학 변형을 가졌다. 가이드 mAlb298-20, mAlb298-21, mAlb298-22, 및 mAlb298-23의 스페이서 영역은 2'-O-메틸과 2'-플루오로 염기의 조합뿐만 아니라 PS 연결을 함유하였다. 이러한 4 개의 가이드 중 가장 큰 활성은 mAlb298-2였는데, mAlb298-2에서 PAM(시드 영역)에 가장 가까운 7 개의 염기 및 2'-O-메틸 및 2 개의 PS 연결로 변형된 3' 말단에서의 마지막 염기를 제외하고 스페이서에서 모든 염기에 대해 2'-플루오로 변형이 이루어졌다. 이는 시드 영역을 제외한 대부분의 스페이서에 2'-플루오로 변형을 포함하는 것이 활성을 유의하게 감소시키지 않았으며, 따라서 가이드 안정성을 향상시키기 위한 우수한 전략을 나타낸다는 것을 입증한다.
가이드 mAlb298-24, mAlb298-25, mAlb298-26, 및 mAlb298-8은 골격에서 동일한 화학 변형을 가졌다. 줄기에서 둘 모두의 절반에 PS 연결을 갖는 mAlb298-8은 가이드 mAlb298-1의 단지 24% 및 2%로 편집 활성을 유의하게 감소시켰는데, 이는 이러한 PS 연결이 활성을 손상시켰다는 것을 입증한다. 흥미롭게도, mALb298-24 및 mALb298-25가 또한 낮은 편집 활성을 가졌지만 mALb298-26의 활성은 mAlb298-8과 비교하여 개선되었는데, 이는 스페이서(시드 영역 제외)에서 14 개 염기에서 2'-플루오로 염기를 포함하는 mALb298-26에서의 추가 변형이 줄기에서 PS 연결에 의해 야기된 감소된 편집 활성을 구제할 수 있다는 것을 지시한다. 이는 편집 활성에 대한 스페이서에서 2'-플루오로 염기의 유리한 영향의 추가 증거를 제공한다.
가이드 mAlb298-27 및 mAlb298-29는 골격 전체에 걸쳐 광범위한 염기 및 PS 변형을 함유하고 스페이서 영역은 활성을 갖지 않았는데, 이는 다시 가이드의 모든 화학 변형이 편집 활성을 보유하지 않는다는 것을 지시한다.
가이드 mALb298-1 내지 mALb298-30의 분석으로부터 얻어진 구조 활성 관계에 기초하여, 7 개의 가이드의 추가 세트를 설계하고 Hepa1-6 세포의 RNP 뉴클레오펙션 및 지질-기반 RNA 공동-형질감염에 의해 시험하였다. 이러한 가이드는 가이드 mALb298-1 내지 mALb298-30에서 우수한 편집 활성을 보유하는 것으로 관찰된 화학 변형을 조합하였다. 가이드 mALb298-31 내지 mALb298-37은 모두 5' 말단에서 적어도 1 개의 2'-O 메틸 및 2 개의 PS 연결 및 5' 말단에서 1 개의 2'-O 메틸 및 1 개의 PS 연결을 포함하는 말단 변형을 함유하였다. 말단 변형에 더하여, mAlb298-31에서와 같이 줄기 둘 모두의 절반에서 2'-O 메틸 염기를 스페이서(시드 영역 제외)의 14 개 염기에서 2'-플루오로 염기와 조합하면 편집 활성이 말단 변형 단독에 비해 약간 개선되거나 유사하고 비변형 가이드와 비교하여 10배 개선되었다. mALb298-32에서와 같이 단지 5' 줄기의 2'-O 메틸 염기와 스페이서의 14 개 염기(시드 영역 제외)의 2' 플루오로 염기를 조합하면 시험된 가장 활성인 가이드가 생성되었다.
유사하게, mALb298-33에서와 같이 단지 루프의 PS 연결을 스페이서(시드 영역 제외)의 14 개 염기에서 2'플루오로 염기와 조합하면 비변형된 가이드보다 최대 15배 더 높은 강력한 활성이 생성되었다. 가이드 mAlb298-37은 5' 줄기에서 2'-O 메틸 염기, 루프에서 PS 연결 및 스페이서(시드 영역 제외)에서 14 개의 2' 플루오로 염기 및 3 개의 PS 연결을 갖는 보다 광범위한 3' 말단 변형을 조합하였고, AltR1/R2 변형과 유사한 편집 활성을 여전히 보유하고 비변형 가이드와 비교하여 유의하게 개선되었다. 따라서 mALb298-37은 포유동물 세포에서 강력한 편집 활성을 보유하는 크게 변형된 MG29-1 가이드를 나타낸다. 가이드 mALb298-38은 RNP로서 전달될 때 강력한 편집 활성을 나타냈지만 지질-기반 RNA 공동-형질감염에 의해 세포에 전달될 때 완전히 불활성이었는데, 이는 따라서 가이드가 뉴클레아제에 대해 일부 예상치 못한 민감성을 가질 수 있다는 것을 시사한다. 스페이서에서 11 개 미만의 2'-플루오로 염기 및 1 개 미만의 PS 연결을 갖는 것을 제외하고는 가이드 mAlb298-37과 동일한 가이드 mALb298-39는 RNP와 mRNA 형질감염 방법 둘 모두를 고려할 때 가장 높은 편집 활성을 갖지만 다른 가이드 설계의 일부보다 더 적은 화학 변형을 가졌는데, 이는 생체 내 성능의 측면에서 해로울 수 있다.
화학 변형의 추가 조합을 보다 광범위한 화학 변형을 가지면서 우수한 편집 활성을 또한 보유할 수 있는 mAlb298-40 내지 mALb298-43을 생성하도록 설계하였다. 예를 들어, 또한 일부 DNA 염기를 포함하는 mAlb298-41에서, 단지 6 개의 염기만이 비변형 리보뉴클레오타이드였다. 유사하게, mAlb298-42는 전체 스페이서에 걸쳐 2'-플루오로기를 함유하고 5 개의 비변형 리보뉴클레오타이드를 가졌다. 이들 및 다른 가이드 화학 변형의 시험이 하나 이상의 최적화된 설계로 이어질 것으로 예상된다. 그럼에도 불구하고, 가이드 mALb298-1 내지 mALb298-39의 세트 내에서, 특히 가이드 mALb298-31 내지 mALb298-39의 세트 중에서, 비변형 가이드 또는 단지 말단 변형으로의 가이드의 편집 활성과 유사하거나 우수한 편집 활성을 보유하는 광범위한 화학 변형을 갖는 가이드가 확인되었다.
화학 변형이 없는 가이드(천연 RNA)와 비교하여 화학적으로 변형된 가이드의 안정성을 시험하기 위해, 세포 미가공 추출물을 사용한 안정성 검정을 이용하였다. 포유동물 세포로부터의 미가공 세포 추출물은 시험관 내 또는 생체 내에서 포유동물 세포에 전달될 때 가이드 RNA가 노출될 뉴클레아제의 혼합물을 함유해야 하기 때문에 선택되었다. 전면생장 세포의 15 cm 디쉬당 3 ml의 차가운 PBS를 첨가하고 세포 스크레이퍼를 사용하여 디쉬의 표면으로부터 세포를 방출시킴으로써 Hepa 1-6 세포를 수집하였다. 세포를 200 g에서 10 min 동안 펠렛화하고, 추후 사용을 위해 -80℃에서 동결시켰다. 안정성 검정을 위해, 세포를 4 부피의 차가운 PBS에 재현탁시켰다(예를 들어, 100 mg 펠렛의 경우 세포를 400 μl의 차가운 PBS에 재현탁시켰다). Triton X-100을 0.2%(v/v)의 최종 농도까지 첨가하고, 세포를 10 초 동안 볼텍싱하고, 10 분 동안 얼음 위에 놓고, 10 초 동안 다시 볼텍싱하였다. Triton X-100은 세포막을 파괴하지만 사용된 농도에서 단백질을 불활성화시키거나 변성시키지 않는 약한 비이온성 세제이다.
안정성 반응은 얼음 상에서 설정되었고 100 fmol의 각 가이드를 갖는 20 μl의 세포 미가공 추출물로 이루어졌다(1 μl의 100 nM 스톡). 투입, 15 min, 30 min, 60 min, 240 min 및 540 min(각 샘플이 인큐베이션된 시간의 길이를 나타내는 분 단위의 시간)으로 이루어진 가이드당 6 개의 반응을 설정하였다. 샘플을 37℃에서 15 분에서 최대 540 분까지 인큐베이션하면서 투입 대조를 5 분 동안 얼음 위에 정치시켰다. 각 인큐베이션 기간 후, 모든 단백질을 즉시 변성시키고 리보뉴클레아제를 효율적으로 억제하고 RNA의 후속 회수를 용이하게 하는 300 μl의 페놀 및 구아니딘 티오시아네이트(Tri 시약, Zymo Research) 혼합물을 첨가함으로써 반응을 중단시켰다. Tri 시약을 첨가한 후, 샘플을 15 초 동안 볼텍싱하고 -20℃에서 저장하였다. RNA를 다이렉트-졸 RNA 미니프렙 키트(Zymo Research)를 사용하여 샘플로부터 추출하고, 100 μl의 뉴클레아제-비함유 물에서 용리시켰다. Taqman miRNA 검정 기법을 이용하는 Taqman RT - qPCR(Thermo Fisher) 및 모든 가이드에 대해 동일한 mAlb298 sgRNA에서 서열을 특이적으로 검출하도록 설계된 프라이머 및 프로브를 사용하여 변형된 가이드의 검출을 수행하였다. 데이터는 투입 샘플과 관련하여 남아 있는 sgRNA의 비율의 함수로서 플롯팅하였다. 화학 변형이 없는 가이드는 세포 추출물과 함께 인큐베이션될 때 가장 빠르게 제거되었는데(도 55), 가이드의 90% 초과가 30 분 이내에 분해되었다. AltR1/AltR2(도 55에서 AltR) 화학 변형을 갖는 가이드는 가이드의 약 80%가 30 분 이내에 분해되어 비변형 가이드보다 세포 추출물의 존재 하에 약간 더 안정했다. 양 말단에서 화학 변형뿐만 아니라 두 줄기 모두에서 2' O-메틸 염기 및 시드 영역을 제외한 스페이서의 모든 위치에서 2'-플루오로 염기를 함유하는 가이드 mALb298-31은 비변형 가이드 또는 AltR 가이드보다 유의하게 더 안정했다.
가이드 mAlb298-34는 가이드 mALb298-31에 비해 개선된 안정성을 나타냈다. 가이드 mALb298-34는 스페이서 내의 화학 변형에서만 가이드 mALb298-31과 상이했다. mALb298-34는 mALb298-31보다 스페이서에서 9 개 더 적은 2'-플루오로 염기를 가졌지만, mALb298-31에서 2 개의 PS 연결과 비교하여 스페이서에서 4 개의 PS 연결을 함유하였다. 2'-플루오로 염기는 RNA의 안정성을 개선하기 때문에, 이는 스페이서에서 추가적인 PS 연결이 mALb298-31과 비교하여 mALb298-34의 개선된 안정성에 기여하였다는 것을 시사한다.
가이드 mALb298-37은 시험된 모든 가이드 중에서 가장 안정하였고, mALb298-34의 경우 30%와 비교하여 240 min(4 h) 후에 가이드의 80%가 남아 있어 mALb298-34보다 유의하게 더 안정했다. mALb298-37의 화학 변형은 스페이서 영역과 골격 영역 둘 모두에서 가이드 mALb298-34와 상이했다. mALb298-37은 5' 말단에 추가 2 개의 2'-O-메틸 기 및 2 개의 추가 PS 연결을 가졌다. 또한, mALb298-37의 루프 영역은 PS 연결을 함유하고, mALb298-34에서 줄기의 또 다른 절반에 존재하는 2'-O-메틸 기를 함유하지 않았다. 또한, mALb298-37의 스페이서는 9 개 초과의 2'-플루오로 염기를 함유하지만, 상이한 위치에 있더라도 mALb298-34와 동일한 수의 PS 연결을 함유하였다.
전반적으로, 이러한 데이터는 스페이서의 5' 말단 및 골격 영역의 루프에서 추가 PS 연결이 가이드 RNA의 안정성을 유의하게 개선한다는 것을 시사한다. 시험된 가이드 중에서 세포 추출물에 가장 큰 안정성을 나타낸 가이드 mALb298-37은 또한 AltR1/Altr2 변형과 비교하여 유사하거나 개선된, 및 5' 말단 및 3' 말단 단독의 화학 변형에 비해 개선된 Hepa1-6 세포에서의 강력한 편집 활성을 나타냈다.
[표 12] 포유동물 세포에서 편집 활성에 대한 MG29-1 sgRNA 서열의 화학 변형의 영향
Figure pct00028
Figure pct00029
Figure pct00030
Figure pct00031
실시예 36 - 본원에 기재된 뉴클레아제를 사용한 마우스에서의 치료 유전자 편집
본원에 기재된 유전자 편집 플랫폼은 생체 내에서 회복적 변경을 수행할 잠재력을 갖는다. 간 조직은 생체 내 유전자 편집을 위해, 예를 들어, 유해한 유전자의 발현을 녹다운시키는 기능을 하고/하거나 결함이 있는 유전자를 대체하는 데 사용되는 인델의 도입에 의해, 본원에 기재된 유전자 편집 조성물 및 시스템을 사용하여 유리하게 표적화될 수 있는 조직의 예이다. 예를 들어, 여러 유전적 질환은 주로 간에서 발현되는 단백질의 결함으로부터 발생하며, 간으로의 생체 내 전달은 아데노-관련 바이러스(AAV) 벡터의 임상 시험에서 안전하고 효과적인 것으로 입증되었다. 지질 나노입자는 또한 핵산 및 RNAi 전략에 대해 승인된 약물을 전달하는 것으로 밝혀졌다. 간 조직은 또한 전신 순환으로의 단백질의 효율적인 분비를 위한 적절한 세포 기구를 포함한다.
표 13 또는 표 14의 병태를 갖는 대상체가 유전자 편집 요법을 위해 선택된다. 예를 들어, 혈우병 A를 갖는 인간 또는 마우스 모델 대상체가 유전자 편집 플랫폼을 사용하여 유전자 대체 요법으로 치료하기 위해 식별된다.
[표 13] 치료용 유전자 대체에서 대상체 선택을 위한 일부 적응증
Figure pct00032
[표 14] 치료용 유전자 녹다운에서 대상체 선택을 위한 일부 적응증
Figure pct00033
본원에 기재된 MG 뉴클레아제를 코딩하는 sgRNA 및 mRNA를 캡슐화하는 지질 나노입자(LNP) 및 치료 유전자를 코딩하는 공여체 주형 핵산을 포함하는 AAV(예를 들어, AAV 혈청형 8)를 포함하는 유전자 편집 플랫폼을 대상체의 간에 정맥내로 도입하였다. LNP는 LNP의 표면 기능화를 통해 간세포로 표적화된다.
예를 들어, 혈우병 A를 갖는 대상체는 본원에 기재된 MG29-1 뉴클레아제(서열 번호 214)를 코딩하는 mRNA를 함유하는 LNP를 포함하는 유전자 대체 플랫폼으로 치료된다. LNP는 또한 간에서 고도로 발현되는 알부민 I에 특이적인 sgRNA를 함유한다(예를 들어, 알부민은 간에서 약 5 g/dL로 발현될 수 있는 반면, 인자 VIII는 간에서 약 10 μg/dL로 발현될 수 있거나, 알부민보다 100만 배 적게 발현됨). LNP에 더하여, 대체 인자 VIII 뉴클레오타이드 서열을 코딩하는 대체 주형 DNA를 코딩하는 플라스미드를 포함하는 AAV8(AAV 혈청형 8) 바이러스 입자가 마찬가지로 대상체에게 전달된다. 일단 세포 내부에서, mRNA, sgRNA, 및 주형 DNA는 일시적으로 발현된다. MG29-1 뉴클레아제는 sgRNA를 사용하여 숙주 간세포 DNA의 표적 유전자좌를 표적화한 다음 숙주 DNA를 절단한다. AAV8에서 숙주 간세포로 전달된 플라스미드로부터 전사된 공여체 주형 DNA는 세포로 스플라이싱되고 알부민 I 유전자의 표적 부위에서 숙주 DNA에 안정적으로 통합되고, 삽입된 인자 VIII DNA는 알부민 프로모터 하에 발현된다.
유전자 편집 플랫폼은 또한 유전자 녹다운 요법을 위해 선택된 대상체에서 사용된다. 예를 들어, 가족성 ATTR 아밀로이드증을 나타낸 대상체는 본원에 기재된 MG29-1 뉴클레아제(서열 번호 214)를 코딩하는 mRNA 및 트랜스티레틴 유전자의 표적 부위에 특이적인 sgRNA를 함유하는 LNP로 치료된다. MG29-1 뉴클레아제 및 sgRNA는 대상체의 간세포에 전달되고 이들에서 발현된다. 일부 실시양태에서, sgRNA는 트랜스티레틴 유전자의 정지 코돈으로 표적화되고, MG29-1 뉴클레아제의 활성은 내인성 정지 코돈을 제거하여, 유전자의 발현을 효과적으로 녹다운시킨다. 일부 실시양태에서, 유전자 녹다운 플랫폼은 정지 코돈을 포함하는 폴리뉴클레오타이드를 코딩하는 플라스미드를 함유하는 AAV8을 포함한다. AAV8이 뉴클레아제 및 sgRNA를 발현하는 동일한 세포에 전달될 때, 외인성 정지 코돈이 트란티레틴 유전자에 스플라이싱되어, 편집된 DNA로부터 생산된 RNA로부터의 번역된 단백질의 조기 절단의 결과로서 유전자 발현의 녹다운으로 이어진다.
본 발명의 바람직한 실시양태가 본원에서 제시되고 설명되었지만, 이러한 실시양태는 단지 예로서 제공된다는 것이 관련 기술 분야의 통상의 기술자에게 명백할 것이다. 본 발명은 본 명세서 내에 제공되는 특정 예에 의해 제한되는 것으로 의도되지 않는다. 본 발명은 상기 언급된 명세서를 참조하여 설명되었지만, 본원에서 설명 및 실시양태의 예시는 제한적인 의미로 해석되는 것을 의미하지 않는다. 수많은 변형, 변경 및 대체가 이제 본 발명을 벗어나지 않으면서 관련 기술 분야의 통상의 기술자에 의해 이루어질 것이다. 또한, 본 발명의 모든 측면은 다양한 조건 및 변수에 좌우되는, 본원에서 설명되는 특정 묘사, 구성 또는 상대적인 비율로 제한되지 않는다는 것을 이해하여야 한다. 본원에 기재된 본 발명의 실시양태에 대한 다양한 대안이 본 발명을 실시하는 데 이용될 수 있음을 이해하여야 한다. 따라서, 본 발명은 또한 임의의 그러한 대안, 수정, 변형 또는 균등물도 포함하는 것으로 고려된다. 하기 청구범위는 본 발명의 범위를 규정하고 이들 청구범위 및 이들의 균등물의 범위 내의 방법 및 구조는 청구범위에 의해 포함되는 것으로 의도된다.

Claims (164)

  1. (a) RuvC 도메인을 포함하는 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 비배양 미생물로부터 유래되고, 상기 엔도뉴클레아제는 Cas12a 엔도뉴클레아제인, 엔도뉴클레아제; 및
    (b) 조작된 가이드 RNA로서, 상기 조작된 가이드 RNA는 상기 엔도뉴클레아제와 복합체를 형성하도록 구성되고, 상기 조작된 가이드 RNA는 표적 핵산 서열에 혼성화하도록 구성된 스페이서 서열을 포함하는, 조작된 가이드 RNA
    를 포함하는, 조작된 뉴클레아제 시스템.
  2. (a) 서열 번호 1-3470 중 어느 하나 또는 이의 변이체에 대해 적어도 75%의 서열 동일성을 갖는 엔도뉴클레아제; 및
    (b) 조작된 가이드 RNA로서, 상기 조작된 가이드 RNA는 상기 엔도뉴클레아제와 복합체를 형성하도록 구성되고, 상기 조작된 가이드 RNA는 표적 핵산 서열에 혼성화하도록 구성된 스페이서 서열을 포함하는, 조작된 가이드 RNA
    를 포함하는, 조작된 뉴클레아제 시스템.
  3. (a) 서열 번호 3862-3913 중 어느 하나를 포함하는 프로토스페이서 인접 모티프(protospacer adjacent motif; PAM) 서열에 결합하도록 구성된 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 클래스 2, 타입 V Cas 엔도뉴클레아제인, 엔도뉴클레아제; 및
    (b) 조작된 가이드 RNA로서, 상기 조작된 가이드 RNA는 상기 엔도뉴클레아제와 복합체를 형성하도록 구성되고, 상기 조작된 가이드 RNA는 표적 핵산 서열에 혼성화하도록 구성된 스페이서 서열을 포함하는, 조작된 가이드 RNA
    를 포함하는, 조작된 뉴클레아제 시스템.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 엔도뉴클레아제는 징크 핑거-유사 도메인(zinc finger-like domain)을 추가로 포함하는, 조작된 뉴클레아제 시스템.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 가이드 RNA는 서열 번호 3471, 3551-3559, 3608-3609, 3612, 3636-3637, 3640-3641, 3644-3645, 3648-3649, 3652-3653, 3656-3657, 3660-3661, 3664-3667, 3671-3672, -3678, 3695-3696, 3729-3730, 3734-3735, 및 3851-3857 중 어느 하나의 비-축퇴성(non-degenerate) 뉴클레오타이드에 대해 적어도 80%의 서열 동일성을 갖는 서열을 포함하는, 조작된 뉴클레아제 시스템.
  6. (a) 서열 번호 3471, 3539, 3551-3559, 3608-3609, 3612, 3636-3637, 3640-3641, 3644-3645, 3648-3649, 3652-3653, 3656-3657, 3660-3661, 3664-3667, 3671-3672, 3677-3678, 3695-3696, 3729-3730, 3734-3735, 및 3851-3857 중 어느 하나의 비-축퇴성 뉴클레오타이드에 대해 적어도 80%의 서열 동일성을 갖는 서열을 포함하는, 조작된 가이드 RNA, 및
    (b) 상기 조작된 가이드 RNA에 결합하도록 구성된 클래스 2, 타입 V Cas 엔도뉴클레아제
    를 포함하는, 조작된 뉴클레아제 시스템.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 엔도뉴클레아제는 서열 번호 3863-3913 중 어느 하나를 포함하는 프로토스페이서 인접 모티프(PAM) 서열에 결합하도록 구성되는, 조작된 뉴클레아제 시스템.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, 상기 가이드 RNA는 진핵생물, 진균, 식물, 포유동물, 또는 인간 게놈 폴리뉴클레오타이드 서열에 상보성인 서열을 포함하는, 조작된 뉴클레아제 시스템.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서, 상기 가이드 RNA는 30 개 내지 250 개 뉴클레오타이드 길이인, 조작된 뉴클레아제 시스템.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서, 상기 엔도뉴클레아제는 상기 엔도뉴클레아제의 N-말단 또는 C-말단에 근접한 하나 이상의 핵 국소화 서열(nuclear localization sequence; NLS)을 포함하는, 조작된 뉴클레아제 시스템.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서, 상기 NLS는 서열 번호 3938-3953으로 이루어진 군으로부터의 서열에 대해 적어도 80% 동일한 서열을 포함하는, 조작된 뉴클레아제 시스템.
  12. 제1항 내지 제10항 중 어느 한 항에 있어서, 상기 엔도뉴클레아제는 상기 엔도뉴클레아제의 서열이 서열 번호 215에 최적으로 정렬될 때 돌연변이 S168R, E172R, N577R, 또는 Y170R 중 적어도 하나를 포함하는, 조작된 뉴클레아제 시스템.
  13. 제1항 내지 제10항 중 어느 한 항에 있어서, 상기 엔도뉴클레아제는 상기 엔도뉴클레아제의 서열이 서열 번호 215에 최적으로 정렬될 때 돌연변이 S168R 및 E172R을 포함하는, 조작된 뉴클레아제 시스템.
  14. 제1항 내지 제10항 중 어느 한 항에 있어서, 상기 엔도뉴클레아제는 상기 엔도뉴클레아제의 서열이 서열 번호 215에 최적으로 정렬될 때 돌연변이 N577R 또는 Y170R을 포함하는, 조작된 뉴클레아제 시스템.
  15. 제1항 내지 제10항 중 어느 한 항에 있어서, 상기 엔도뉴클레아제는 상기 엔도뉴클레아제의 서열이 서열 번호 215에 최적으로 정렬될 때 돌연변이 S168R을 포함하는, 조작된 뉴클레아제 시스템.
  16. 제15항에 있어서, 상기 엔도뉴클레아제는 E172, N577, 또는 Y170의 돌연변이를 포함하지 않는, 조작된 뉴클레아제 시스템.
  17. 제1항 내지 제16항 중 어느 한 항에 있어서, 5'에서 3'으로, 상기 표적 데옥시리보핵산 서열의 5'에 적어도 20 개의 뉴클레오타이드의 서열을 포함하는 제1 상동성 아암(arm), 적어도 10 개의 뉴클레오타이드의 합성 DNA 서열, 및 상기 표적 서열의 3'에 적어도 20 개의 뉴클레오타이드의 서열을 포함하는 제2 상동성 아암을 포함하는 단일-가닥 또는 이중-가닥 DNA 복구 주형을 추가로 포함하는, 조작된 뉴클레아제 시스템.
  18. 제17항에 있어서, 상기 제1 또는 제2 상동성 아암은 적어도 40 개, 80 개, 120 개, 150 개, 200 개, 300 개, 500 개, 또는 1,000 개의 뉴클레오타이드의 서열을 포함하는, 조작된 뉴클레아제 시스템.
  19. 제12항 내지 제18항 중 어느 한 항에 있어서, 상기 제1 및 제2 상동성 아암은 원핵생물, 박테리아, 진균, 또는 진핵생물의 게놈 서열에 상동성인, 조작된 뉴클레아제 시스템.
  20. 제12항 내지 제19항 중 어느 한 항에 있어서, 상기 단일-가닥 또는 이중-가닥 DNA 복구 주형은 트랜스진 공여체를 포함하는, 조작된 뉴클레아제 시스템.
  21. 제1항 내지 제20항 중 어느 한 항에 있어서, 1 개 또는 2 개의 단일-가닥 DNA 세그먼트가 측접된(flanked) 이중-가닥 DNA 세그먼트를 포함하는 DNA 복구 주형을 추가로 포함하는, 조작된 뉴클레아제 시스템.
  22. 제21항에 있어서, 단일-가닥 DNA 세그먼트는 상기 이중-가닥 DNA 세그먼트의 5' 말단에 접합되는, 조작된 뉴클레아제 시스템.
  23. 제21항에 있어서, 상기 단일-가닥 DNA 세그먼트는 상기 이중-가닥 DNA 세그먼트의 3' 말단에 접합되는, 조작된 뉴클레아제 시스템.
  24. 제21항 내지 제23항 중 어느 한 항에 있어서, 상기 단일-가닥 DNA 세그먼트는 4 개 내지 10 개의 뉴클레오타이드 염기의 길이를 갖는, 조작된 뉴클레아제 시스템.
  25. 제21항 내지 제24항 중 어느 한 항에 있어서, 상기 단일-가닥 DNA 세그먼트는 상기 스페이서 서열 내의 서열에 상보성인 뉴클레오타이드 서열을 갖는, 조작된 뉴클레아제 시스템.
  26. 제21항 내지 제25항 중 어느 한 항에 있어서, 상기 이중-가닥 DNA 서열은 바코드, 개방형 해독틀(open reading frame), 인핸서, 프로모터, 단백질-코딩 서열, miRNA 코딩 서열, RNA 코딩 서열, 또는 트랜스진을 포함하는, 조작된 뉴클레아제 시스템.
  27. 제21항 내지 제25항 중 어느 한 항에 있어서, 상기 이중-가닥 DNA 서열에는 뉴클레아제 절단 부위가 측접되는, 조작된 뉴클레아제 시스템.
  28. 제27항에 있어서, 상기 뉴클레아제 절단 부위는 스페이서 및 PAM 서열을 포함하는, 조작된 뉴클레아제 시스템.
  29. 제1항 내지 제28항 중 어느 한 항에 있어서, 상기 시스템은 Mg2+의 공급원을 추가로 포함하는, 조작된 뉴클레아제 시스템.
  30. 제1항 내지 제29항 중 어느 한 항에 있어서, 상기 가이드 RNA는 적어도 8 개, 적어도 10 개, 또는 적어도 12 개의 염기쌍 리보뉴클레오타이드를 포함하는 헤어핀(hairpin)을 포함하는, 조작된 뉴클레아제 시스템.
  31. 제30항에 있어서, 상기 헤어핀은 10 개의 염기쌍 리보뉴클레오타이드를 포함하는, 조작된 뉴클레아제 시스템.
  32. 제1항 내지 제31항 중 어느 한 항에 있어서,
    a) 상기 엔도뉴클레아제는 서열 번호 141, 215, 229, 261, 또는 1711-1721 중 어느 하나 또는 이의 변이체에 대해 적어도 75%, 80%, 또는 90% 동일한 서열을 포함하고;
    b) 상기 가이드 RNA 구조는 서열 번호 3608-3609, 3853, 또는 3851-3857 중 어느 하나의 비-축퇴성 뉴클레오타이드에 대해 적어도 80%, 또는 90% 동일한 서열을 포함하는, 조작된 뉴클레아제 시스템.
  33. 제1항 내지 제32항 중 어느 한 항에 있어서, 상기 엔도뉴클레아제는 서열 번호 3863-3913 중 어느 하나를 포함하는 PAM에 결합하도록 구성되는, 조작된 뉴클레아제 시스템.
  34. 제1항 내지 제32항 중 어느 한 항에 있어서, 상기 엔도뉴클레아제는 서열 번호 3871을 포함하는 PAM에 결합하도록 구성되는, 조작된 뉴클레아제 시스템.
  35. 제5항 내지 제34항 중 어느 한 항에 있어서, 상기 서열 동일성은 BLASTP, CLUSTALW, MUSCLE, MAFFT 알고리즘, 또는 스미쓰-워터맨(Smith-Waterman) 상동성 검색 알고리즘 매개변수를 갖는 CLUSTALW 알고리즘에 의해 결정되는, 조작된 뉴클레아제 시스템.
  36. 제35항에 있어서, 상기 서열 동일성은 단어 길이(W) 3, 기대값(E) 10, 및 기존 11, 연장 1에서의 BLOSUM62 스코어링 매트릭스 설정 갭 코스트의 매개변수를 사용하고, 조건부 조성 점수 매트릭스 조정을 사용하여 상기 BLASTP 상동성 검색 알고리즘에 의해 결정되는, 조작된 뉴클레아제 시스템.
  37. a) 표적 DNA 분자에서 표적 서열에 상보성인 뉴클레오타이드 서열을 포함하는 DNA-표적화 세그먼트; 및
    b) 혼성화되어 이중-가닥 RNA(dsRNA) 이중체를 형성하는 뉴클레오타이드의 2 개의 상보성 스트레치(stretch)를 포함하는 단백질-결합 세그먼트
    를 포함하는, 조작된 가이드 RNA로서,
    뉴클레오타이드의 상기 2 개의 상보성 스트레치는 개재 뉴클레오타이드로 서로 공유 연결되고,
    상기 조작된 가이드 리보핵산 폴리뉴클레오타이드는 서열 번호 1-3470 중 어느 하나에 대해 적어도 75%의 서열 동일성을 갖는 엔도뉴클레아제와 복합체를 형성하고 상기 복합체를 상기 표적 DNA 분자의 상기 표적 서열에 표적화할 수 있는, 조작된 가이드 RNA.
  38. 제37항에 있어서, 상기 DNA-표적화 세그먼트는 뉴클레오타이드의 상기 2 개의 상보성 스트레치 둘 모두의 3'에 위치하는, 조작된 가이드 리보핵산 폴리뉴클레오타이드.
  39. 제37항 또는 제38항에 있어서, 상기 단백질 결합 세그먼트는 서열 번호 3608-3609의 비-축퇴성 뉴클레오타이드에 대해 적어도 70%, 적어도 80%, 또는 적어도 90%의 동일성을 갖는 서열을 포함하는, 조작된 가이드 리보핵산 폴리뉴클레오타이드.
  40. 제37항 내지 제39항 중 어느 한 항에 있어서, 상기 이중-가닥 RNA(dsRNA) 이중체는 적어도 5 개, 적어도 8 개, 적어도 10 개, 또는 적어도 12 개의 리보뉴클레오타이드를 포함하는, 조작된 가이드 리보핵산 폴리뉴클레오타이드.
  41. 제1항 내지 제40항 중 어느 한 항의 조작된 가이드 리보핵산 폴리뉴클레오타이드를 코딩하는, 데옥시리보핵산 폴리뉴클레오타이드.
  42. 유기체에서의 발현에 최적화된 조작된 핵산 서열을 포함하는 핵산으로서, 상기 핵산은 클래스 2, 타입 V Cas 엔도뉴클레아제를 코딩하고, 상기 엔도뉴클레아제는 비배양 미생물로부터 유래되고, 유기체는 상기 비배양 유기체가 아닌, 핵산.
  43. 제42항에 있어서, 상기 엔도뉴클레아제는 서열 번호 1-3470 중 어느 하나에 대해 적어도 70% 또는 적어도 80%의 서열 동일성을 갖는 변이체를 포함하는, 핵산.
  44. 제42항 또는 제43항에 있어서, 상기 엔도뉴클레아제는 상기 엔도뉴클레아제의 N-말단 또는 C-말단에 근접한 하나 이상의 핵 국소화 서열(NLS)을 코딩하는 서열을 포함하는, 핵산.
  45. 제44항에 있어서, 상기 NLS는 서열 번호 3938-3953으로부터 선택된 서열을 포함하는, 핵산.
  46. 제44항 또는 제45항에 있어서, 상기 NLS는 서열 번호 3939를 포함하는, 핵산.
  47. 제46항에 있어서, 상기 NLS는 상기 엔도뉴클레아제의 상기 N-말단에 근접한, 핵산.
  48. 제44항 또는 제45항에 있어서, 상기 NLS는 서열 번호 3938을 포함하는, 핵산.
  49. 제48항에 있어서, 상기 NLS는 상기 엔도뉴클레아제의 상기 C-말단에 근접한, 핵산.
  50. 제42항 내지 제49항 중 어느 한 항에 있어서, 상기 유기체는 원핵생물, 박테리아, 진핵생물, 진균, 식물, 포유동물, 설치류, 또는 인간인, 핵산.
  51. 클래스 2, 타입 V Cas 엔도뉴클레아제를 코딩하는 핵산 서열을 포함하는 조작된 벡터로서, 상기 엔도뉴클레아제는 비배양 미생물로부터 유래되는, 조작된 벡터.
  52. 제42항 내지 제46항 중 어느 한 항의 핵산을 포함하는, 조작된 벡터.
  53. 제41항의 데옥시리보핵산 폴리뉴클레오타이드를 포함하는, 조작된 벡터.
  54. 제51항 내지 제53항 중 어느 한 항에 있어서, 벡터는 플라스미드, 미니서클, CELiD, 아데노-관련 바이러스(AAV) 유래된 비리온, 렌티바이러스, 또는 아데노바이러스인, 조작된 벡터.
  55. 제51항 내지 제54항 중 어느 한 항의 벡터를 포함하는, 세포.
  56. 제55항의 상기 세포를 배양하는 것을 포함하는, 엔도뉴클레아제를 제조하는 방법.
  57. 이중-가닥 데옥시리보핵산 폴리뉴클레오타이드를 결합, 절단, 마킹, 또는 변형시키는 방법으로서,
    (a) 상기 엔도뉴클레아제 및 상기 이중-가닥 데옥시리보핵산 폴리뉴클레오타이드에 결합하도록 구성된 조작된 가이드 RNA와의 복합체에서 클래스 2, 타입 V Cas 엔도뉴클레아제와 상기 이중-가닥 데옥시리보핵산 폴리뉴클레오타이드를 접촉시키는 것
    을 포함하고;
    상기 이중-가닥 데옥시리보핵산 폴리뉴클레오타이드는 프로토스페이서 인접 모티프(PAM)를 포함하고;
    상기 PAM은 서열 번호 3863-3913 중 어느 하나를 포함하는 서열을 포함하는, 결합, 절단, 마킹, 또는 변형 방법.
  58. 제57항에 있어서, 상기 이중-가닥 데옥시리보핵산 폴리뉴클레오타이드는 상기 조작된 가이드 RNA의 서열에 상보성인 서열을 포함하는 제1 가닥 및 상기 PAM을 포함하는 제2 가닥을 포함하는, 결합, 절단, 마킹, 또는 변형 방법.
  59. 제58항에 있어서, 상기 PAM은 상기 조작된 가이드 RNA의 상기 서열에 상보성인 상기 서열의 5' 말단에 바로 인접한, 결합, 절단, 마킹, 또는 변형 방법.
  60. 제57항 내지 제59항 중 어느 한 항에 있어서, 상기 PAM은 서열 번호 3871을 포함하는, 결합, 절단, 마킹, 또는 변형 방법.
  61. 제57항 내지 제60항 중 어느 한 항에 있어서, 상기 클래스 2, 타입 V Cas 엔도뉴클레아제는 비배양 미생물로부터 유래되는, 결합, 절단, 마킹, 또는 변형 방법.
  62. 제57항 내지 제61항 중 어느 한 항에 있어서, 상기 이중-가닥 데옥시리보핵산 폴리뉴클레오타이드는 진핵생물, 식물, 진균, 포유동물, 설치류, 또는 인간 이중-가닥 데옥시리보핵산 폴리뉴클레오타이드인, 결합, 절단, 마킹, 또는 변형 방법.
  63. 표적 핵산 유전자좌를 변형시키는 방법으로서, 상기 방법은 상기 표적 핵산 유전자좌에 제1항 내지 제36항 중 어느 한 항의 상기 조작된 뉴클레아제 시스템을 전달하는 것을 포함하고, 상기 엔도뉴클레아제는 상기 조작된 가이드 리보핵산 구조와 복합체를 형성하도록 구성되고, 상기 복합체는 상기 표적 핵산 유전자좌에 대한 상기 복합체의 결합 시 상기 복합체가 상기 표적 핵산 유전자좌를 변형시키도록 구성되는, 변형 방법.
  64. 제63항에 있어서, 상기 표적 핵산 유전자좌를 변형시키는 것은 상기 표적 핵산 유전자좌를 결합, 니킹(nicking), 절단, 또는 마킹하는 것을 포함하는, 변형 방법.
  65. 제63항 또는 제64항에 있어서, 상기 표적 핵산 유전자좌는 데옥시리보핵산(DNA) 또는 리보핵산(RNA)을 포함하는, 변형 방법.
  66. 제63항에 있어서, 상기 표적 핵산은 게놈 DNA, 바이러스 DNA, 바이러스 RNA, 또는 박테리아 DNA를 포함하는, 변형 방법.
  67. 제63항 내지 제66항 중 어느 한 항에 있어서, 상기 표적 핵산 유전자좌는 시험관 내에 있는, 변형 방법.
  68. 제63항 내지 제66항 중 어느 한 항에 있어서, 상기 표적 핵산 유전자좌는 세포 내에 있는, 변형 방법.
  69. 제68항에 있어서, 상기 세포는 원핵 세포, 박테리아 세포, 진핵 세포, 진균 세포, 식물 세포, 동물 세포, 포유동물 세포, 설치류 세포, 영장류 세포, 인간 세포, 또는 일차 세포인, 변형 방법.
  70. 제68항 또는 제69항에 있어서, 상기 세포는 일차 세포인, 변형 방법.
  71. 제70항에 있어서, 상기 일차 세포는 T 세포인, 변형 방법.
  72. 제70항에 있어서, 상기 일차 세포는 조혈 줄기 세포(HSC)인, 변형 방법.
  73. 제63항 내지 제72항 중 어느 한 항에 있어서, 상기 조작된 뉴클레아제 시스템을 상기 표적 핵산 유전자좌로 전달하는 것은 제42항 내지 제46항 중 어느 한 항의 핵산 또는 제51항 내지 제54항 중 어느 한 항의 벡터를 전달하는 것을 포함하는, 변형 방법.
  74. 제63항 내지 제73항 중 어느 한 항에 있어서, 상기 조작된 뉴클레아제 시스템을 상기 표적 핵산 유전자좌로 전달하는 것은 상기 엔도뉴클레아제를 코딩하는 개방형 해독틀을 포함하는 핵산을 전달하는 것을 포함하는, 변형 방법.
  75. 제74항에 있어서, 상기 핵산은 상기 엔도뉴클레아제를 코딩하는 상기 개방형 해독틀이 작동 가능하게 연결되는 프로모터를 포함하는, 변형 방법.
  76. 제63항 내지 제75항 중 어느 한 항에 있어서, 상기 조작된 뉴클레아제 시스템을 상기 표적 핵산 유전자좌로 전달하는 것은 상기 엔도뉴클레아제를 코딩하는 상기 개방형 해독틀을 함유하는 캡핑된 mRNA를 전달하는 것을 포함하는, 변형 방법.
  77. 제63항 내지 제76항 중 어느 한 항에 있어서, 상기 조작된 뉴클레아제 시스템을 상기 표적 핵산 유전자좌로 전달하는 것은 번역된 폴리펩타이드를 전달하는 것을 포함하는, 변형 방법.
  78. 제63항 내지 제76항 중 어느 한 항에 있어서, 상기 조작된 뉴클레아제 시스템을 상기 표적 핵산 유전자좌에 전달하는 것은 리보핵산(RNA) pol III 프로모터에 작동 가능하게 연결된 상기 조작된 가이드 RNA를 코딩하는 데옥시리보핵산(DNA)을 전달하는 것을 포함하는, 변형 방법.
  79. 제63항 내지 제78항 중 어느 한 항에 있어서, 상기 엔도뉴클레아제는 상기 표적 유전자좌에서 또는 상기 표적 유전자좌에 근접하여 단일-가닥 파손 또는 이중-가닥 파손을 유도하는, 변형 방법.
  80. 제79항에 있어서, 상기 엔도뉴클레아제는 상기 표적 유전자좌 내에 또는 3'에 엇갈린 단일-가닥 파손을 유도하는, 변형 방법.
  81. 세포에서 TRAC 유전자좌를 편집(editing)하는 방법으로서, 상기 세포에
    (a) RNA-가이드 엔도뉴클레아제; 및
    (b) 조작된 가이드 RNA로서, 상기 조작된 가이드 RNA는 상기 엔도뉴클레아제와 복합체를 형성하도록 구성되고, 상기 조작된 가이드 RNA는 상기 TRAC 유전자좌의 영역에 혼성화하도록 구성된 스페이서 서열을 포함하는, 조작된 가이드 RNA
    를 접촉시키는 것을 포함하고,
    상기 조작된 가이드 RNA는 서열 번호 4316-4369 중 어느 하나의 적어도 18 개의 연속 뉴클레오타이드에 대해 적어도 85%의 동일성을 갖는 표적화 서열을 포함하는, 편집 방법.
  82. 제81항에 있어서, 상기 RNA-가이드 뉴클레아제는 Cas 엔도뉴클레아제인, 편집 방법.
  83. 제82항에 있어서, 상기 Cas 엔도뉴클레아제는 클래스 2, 타입 V Cas 엔도뉴클레아제인, 편집 방법.
  84. 제83항에 있어서, 상기 클래스 2, 타입 V Cas 엔도뉴클레아제는 RuvCI 서브도메인, RuvCII 서브도메인, 및 RuvCIII 서브도메인을 포함하는 RuvC 도메인을 포함하는, 편집 방법.
  85. 제83항 또는 제84항에 있어서, 상기 클래스 2, 타입 V Cas 엔도뉴클레아제는 서열 번호 1-3470 중 어느 하나 또는 이의 변이체에 대해 적어도 75%의 서열 동일성을 갖는 엔도뉴클레아제를 포함하는, 편집 방법.
  86. 제81항 내지 제85항 중 어느 한 항에 있어서, 상기 조작된 가이드 RNA는 서열 번호 3471, 3539, 3551-3559, 3608-3609, 3612, 3636-3637, 3640-3641, 3644-3645, 3648-3649, 3652-3653, 3656-3657, 3660-3661, 3664-3667, 3671-3672, 3677-3678, 3695-3696, 3729-3730, 3734-3735, 및 3851-3857 중 어느 하나의 비-축퇴성 뉴클레오타이드 중 적어도 19 개에 대해 적어도 80%의 서열 동일성을 갖는 서열을 추가로 포함하는, 편집 방법.
  87. 제81항 내지 제85항 중 어느 한 항에 있어서, 상기 엔도뉴클레아제는 서열 번호 141, 215, 229, 261, 또는 1711-1721 중 어느 하나 또는 이의 변이체에 대해 적어도 75%, 80%, 또는 90% 동일한 서열을 포함하는, 편집 방법.
  88. 제87항에 있어서, 상기 가이드 RNA 구조는 서열 번호 3608-3609, 3853, 또는 3851-3857 중 어느 하나의 비-축퇴성 뉴클레오타이드 중 적어도 19 개에 대해 적어도 80%, 또는 적어도 90% 동일한 서열을 포함하는, 편집 방법.
  89. 제81항 내지 제88항 중 어느 한 항에 있어서, 상기 방법은 서열 번호 4424 또는 4425 중 어느 하나에 대해 적어도 80%의 동일성을 갖는 서열에 의해 3' 말단 또는 5' 말단에서 측접된 카고 서열을 포함하는 공여체 핵산을 상기 세포에 접촉시키거나 상기 세포에 도입하는 것을 추가로 포함하는, 편집 방법.
  90. 제81항 내지 제89항 중 어느 한 항에 있어서, 상기 세포는 말초 혈액 단핵 세포(PBMC)인, 편집 방법.
  91. 제81항 내지 제89항 중 어느 한 항에 있어서, 상기 세포는 T-세포 또는 이의 전구체 또는 조혈 줄기 세포(HSC)인, 편집 방법.
  92. 제89항 내지 제91항 중 어느 한 항에 있어서, 상기 카고 서열은 T-세포 수용체 폴리펩타이드, CAR-T 폴리펩타이드, 또는 이의 단편 또는 유도체를 코딩하는 서열을 포함하는, 편집 방법.
  93. 제81항 내지 제92항 중 어느 한 항에 있어서, 상기 조작된 가이드 RNA는 서열 번호 4370-4423 중 어느 하나에 대해 적어도 80%의 동일성을 갖는 서열을 포함하는, 편집 방법.
  94. 제93항에 있어서, 상기 조작된 가이드 RNA는 표 5A에 열거된 상응하는 화학 변형을 포함하는 표 5A로부터의 sgRNA 1-54의 뉴클레오타이드 서열을 포함하는, 편집 방법.
  95. 제81항 내지 제93항 중 어느 한 항에 있어서, 상기 조작된 가이드 RNA는 서열 번호 4334, 4350, 또는 4324 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 표적화 서열을 포함하는, 편집 방법.
  96. 제81항 내지 제93항 중 어느 한 항에 있어서, 상기 조작된 가이드 RNA는 서열 번호 4388, 4404, 또는 4378 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열을 포함하는, 편집 방법.
  97. 제96항에 있어서, 상기 조작된 가이드 RNA는 표 5A로부터의 sgRNA 9, 35, 또는 19의 뉴클레오타이드 서열을 포함하는, 편집 방법.
  98. (a) RNA-가이드 엔도뉴클레아제; 및
    (b) 조작된 가이드 RNA로서, 상기 조작된 가이드 RNA는 상기 엔도뉴클레아제와 복합체를 형성하도록 구성되고, 상기 조작된 가이드 RNA는 표적 핵산 서열에 혼성화하도록 구성된 스페이서 서열을 포함하는, 조작된 가이드 RNA
    를 포함하는, 조작된 뉴클레아제 시스템으로서,
    상기 조작된 가이드 RNA는 하기 변형
    (i) 상기 조작된 가이드 RNA의 5' 말단의 처음 4 개 염기 또는 상기 조작된 가이드 RNA의 3' 말단의 마지막 4 개 염기 내에 적어도 하나의 뉴클레오타이드의 2'-O 메틸 또는 2'-플루오로 염기 변형;
    (ii) 상기 조작된 가이드 RNA의 5' 말단의 처음 5 개 염기 중 적어도 2 개 사이에 티오포스페이트(PS) 연결, 또는 상기 조작된 가이드 RNA의 3' 말단의 마지막 5 개 염기 중 적어도 2 개 사이에 티오포스페이트 연결;
    (iii) 상기 조작된 가이드 RNA의 3' 줄기 또는 5' 줄기 내에 티오포스페이트 연결;
    (iv) 상기 조작된 가이드 RNA의 3' 줄기 또는 5' 줄기 내에 2'-O 메틸 또는 2' 염기 변형;
    (v) 상기 조작된 가이드 RNA의 스페이서 영역의 적어도 7 개 염기의 2'-플루오로 염기 변형; 및
    (vi) 상기 조작된 가이드 RNA의 루프 영역 내에 티오포스페이트 연결
    중 적어도 하나를 포함하는, 조작된 뉴클레아제 시스템.
  99. 제98항에 있어서, 상기 조작된 가이드 RNA는 상기 조작된 가이드 RNA의 5' 말단의 처음 5 개 염기 또는 상기 조작된 가이드 RNA의 3' 말단의 마지막 5 개 염기 내에 적어도 하나의 뉴클레오타이드의 2'-O 메틸 또는 2'-플루오로 염기 변형을 포함하는, 조작된 뉴클레아제 시스템.
  100. 제98항에 있어서, 상기 조작된 가이드 RNA는 상기 조작된 가이드 RNA의 5' 말단 또는 상기 조작된 가이드 RNA의 3' 말단에서 2'-O 메틸 또는 2'-플루오로 염기 변형을 포함하는, 조작된 뉴클레아제 시스템.
  101. 제98항 내지 제100항 중 어느 한 항에 있어서, 상기 조작된 가이드 RNA는 상기 조작된 가이드 RNA의 5' 말단의 처음 5 개 염기 중 적어도 2 개 사이에 티오포스페이트(PS) 연결, 또는 상기 조작된 가이드 RNA의 3' 말단의 마지막 5 개 염기 중 적어도 2 개 사이에 티오포스페이트 연결을 포함하는, 조작된 뉴클레아제 시스템.
  102. 제98항 내지 제101항 중 어느 한 항에 있어서, 상기 조작된 가이드 RNA는 상기 조작된 가이드 RNA의 3' 줄기 또는 5' 줄기 내에 티오포스페이트 연결을 포함하는, 조작된 뉴클레아제 시스템.
  103. 제98항 내지 제102항 중 어느 한 항에 있어서, 상기 조작된 가이드 RNA는 상기 조작된 가이드 RNA의 3' 줄기 또는 5' 줄기 내에 2'-O 메틸 염기 변형을 포함하는, 조작된 뉴클레아제 시스템.
  104. 제98항 내지 제103항 중 어느 한 항에 있어서, 상기 조작된 가이드 RNA는 상기 조작된 가이드 RNA의 스페이서 영역의 적어도 7 개 염기의 2'-플루오로 염기 변형을 포함하는, 조작된 뉴클레아제 시스템.
  105. 제98항 내지 제104항 중 어느 한 항에 있어서, 상기 조작된 가이드 RNA는 상기 조작된 가이드 RNA의 루프 영역 내에 티오포스페이트 연결을 포함하는, 조작된 뉴클레아제 시스템.
  106. 제98항 내지 제105항 중 어느 한 항에 있어서, 상기 조작된 가이드 RNA는 상기 조작된 가이드 RNA의 상기 5' 말단에 적어도 3 개의 2'-O 메틸 또는 2'-플루오로 염기, 상기 조작된 가이드 RNA의 상기 5' 말단의 처음 3 개 염기 사이에 2 개의 티오포스페이트 연결, 상기 조작된 가이드 RNA의 상기 4' 말단에 적어도 4 개의 2'-O 메틸 또는 2'-플루오로 염기, 및 상기 조작된 가이드 RNA의 상기 3' 말단의 마지막 3 개 염기 사이에 3 개의 티오포스페이트 연결을 포함하는, 조작된 뉴클레아제 시스템.
  107. 제98항에 있어서, 상기 조작된 가이드 RNA는 상기 조작된 가이드 RNA의 5' 말단에 적어도 2 개의 2'-O-메틸 염기 및 적어도 2 개의 티오포스페이트 연결 및 상기 조작된 가이드 RNA의 3' 말단에 적어도 1 개의 2'-O-메틸 염기 및 적어도 하나의 티오포스페이트 연결을 포함하는, 조작된 뉴클레아제 시스템.
  108. 제107항에 있어서, 상기 조작된 가이드 RNA는 상기 조작된 가이드 RNA의 상기 3' 줄기 또는 상기 5' 줄기 영역 둘 모두에 적어도 1 개의 2'-O-메틸 염기를 포함하는, 조작된 뉴클레아제 시스템.
  109. 제107항 또는 제108항에 있어서, 상기 조작된 가이드 RNA는 상기 조작된 가이드 RNA의 시드 영역을 제외한 상기 스페이서 영역에 적어도 1 개 내지 적어도 14 개의 2'-플루오로 염기를 포함하는, 조작된 뉴클레아제 시스템.
  110. 제107항에 있어서, 상기 조작된 가이드 RNA는 상기 조작된 가이드 RNA의 상기 5' 줄기 영역에 적어도 1 개의 2'-O-메틸 염기 및 상기 가이드 RNA의 시드 영역을 제외한 상기 스페이서 영역에 적어도 1 개 내지 적어도 14 개의 2'-플루오로 염기를 포함하는, 조작된 뉴클레아제 시스템.
  111. 제98항 내지 제110항 중 어느 한 항에 있어서, 상기 가이드 RNA는 VEGF-A 유전자를 표적화하는 스페이서 서열을 포함하는, 조작된 뉴클레아제 시스템.
  112. 제111항에 있어서, 상기 가이드 RNA는 서열 번호 3985에 대해 적어도 80%의 동일성을 갖는 스페이서 서열을 포함하는, 조작된 뉴클레아제 시스템.
  113. 제111항에 있어서, 상기 가이드 RNA는 표 7에 열거된 화학 변형을 포함하는 표 7로부터의 가이드 RNA 1-7의 뉴클레오타이드를 포함하는, 조작된 뉴클레아제 시스템.
  114. 제98항 내지 제113항 중 어느 한 항에 있어서, 상기 RNA-가이드 뉴클레아제는 Cas 엔도뉴클레아제인, 방법.
  115. 제114항에 있어서, 상기 Cas 엔도뉴클레아제는 클래스 2, 타입 V Cas 엔도뉴클레아제인, 방법.
  116. 제115항에 있어서, 상기 클래스 2, 타입 V Cas 엔도뉴클레아제는 RuvCI 서브도메인, RuvCII 서브도메인, 및 RuvCIII 서브도메인을 포함하는 RuvC 도메인을 포함하는, 방법.
  117. 제115항 또는 제116항에 있어서, 상기 클래스 2, 타입 V Cas 엔도뉴클레아제는 서열 번호 1-3470 중 어느 하나 또는 이의 변이체에 대해 적어도 75%의 서열 동일성을 갖는 엔도뉴클레아제를 포함하는, 조작된 뉴클레아제 시스템.
  118. 제115항 또는 제116항에 있어서, 상기 클래스 2, 타입 V Cas 엔도뉴클레아제는 서열 번호 141, 215, 229, 261, 또는 1711-1721 중 어느 하나 또는 이의 변이체에 대해 적어도 75%의 서열 동일성을 갖는 엔도뉴클레아제를 포함하는, 조작된 뉴클레아제 시스템.
  119. 제114항 내지 제118항 중 어느 한 항에 있어서, 상기 조작된 가이드 RNA는 서열 번호 3471, 3539, 3551-3559, 3608-3609, 3612, 3636-3637, 3640-3641, 3644-3645, 3648-3649, 3652-3653, 3656-3657, 3660-3661, 3664-3667, 3671-3672, 3677-3678, 3695-3696, 3729-3730, 3734-3735, 및 3851-3857 중 어느 하나의 비-축퇴성 뉴클레오타이드에 대해 적어도 80%의 서열 동일성을 갖는 서열을 포함하는, 조작된 뉴클레아제 시스템.
  120. 제111항 내지 제118중 어느 한 항에 있어서, 상기 조작된 가이드 RNA는 서열 번호 3608-3609, 3853, 또는 3851-3857 중 어느 하나의 비-축퇴성 뉴클레오타이드에 대해 적어도 80%의 서열 동일성을 갖는 서열을 포함하는, 조작된 뉴클레아제 시스템.
  121. 서열 번호 1-3470 중 어느 하나 또는 이의 변이체에 대해 적어도 75%의 서열 동일성을 갖는 이종성 엔도뉴클레아제를 코딩하는 개방형 해독틀을 포함하는, 숙주 세포.
  122. 제121항에 있어서, 상기 엔도뉴클레아제는 서열 번호 141, 215, 229, 261, 또는 1711-1721 중 어느 하나 또는 이의 변이체에 대해 적어도 75%의 서열 동일성을 갖는, 숙주 세포.
  123. 제121항 또는 제122항에 있어서, 상기 숙주 세포는 이. 콜라이 세포인, 숙주 세포.
  124. 제123항에 있어서, 상기 이. 콜라이 세포는 λDE3 리소겐이거나 상기 이. 콜라이 세포는 BL21(DE3) 균주인, 숙주 세포.
  125. 제109항 또는 제110항에 있어서, 상기 이. 콜라이 세포는 ompT lon 유전자형을 갖는, 숙주 세포.
  126. 제121항 내지 제125항 중 어느 한 항에 있어서, 상기 개방형 해독틀은 T7 프로모터 서열, T7-lac 프로모터 서열, lac 프로모터 서열, tac 프로모터 서열, trc 프로모터 서열, ParaBAD 프로모터 서열, PrhaBAD 프로모터 서열, T5 프로모터 서열, cspA 프로모터 서열, araP BAD 프로모터, 파지 람다로부터의 강한 좌측 프로모터(pL 프로모터), 또는 이들의 임의의 조합에 작동 가능하게 연결되는, 숙주 세포.
  127. 제121항 내지 제126항 중 어느 한 항에 있어서, 상기 개방형 해독틀은 상기 엔도뉴클레아제를 코딩하는 서열에 프레임내 연결된 친화성 태그를 코딩하는 서열을 포함하는, 숙주 세포.
  128. 제127항에 있어서, 상기 친화성 태그는 고정된 금속 친화성 크로마토그래피(IMAC) 태그인, 방법.
  129. 제128항에 있어서, 상기 IMAC 태그는 폴리히스티딘 태그인, 방법.
  130. 제127항에 있어서, 상기 친화성 태그는 myc 태그, 인간 인플루엔자 헤마글루티닌(HA) 태그, 말토스 결합 단백질(MBP) 태그, 글루타티온 S-트랜스퍼라제(GST) 태그, 스트렙타비딘 태그, FLAG 태그, 또는 이들의 임의의 조합인, 방법.
  131. 제127항 내지 제130항 중 어느 한 항에 있어서, 상기 친화성 태그는 프로테아제 절단 부위를 코딩하는 링커 서열을 통해 상기 엔도뉴클레아제를 코딩하는 상기 서열에 프레임내 연결되는, 숙주 세포.
  132. 제131항에 있어서, 상기 프로테아제 절단 부위는 담배 식각 바이러스(TEV) 프로테아제 절단 부위, PreScission® 프로테아제 절단 부위, 트롬빈 절단 부위, 인자 Xa 절단 부위, 엔테로키나제 절단 부위, 또는 이들의 임의의 조합인, 숙주 세포.
  133. 제121항 내지 제132항 중 어느 한 항에 있어서, 상기 개방형 해독틀은 상기 숙주 세포에서의 발현을 위해 코돈-최적화되는, 숙주 세포.
  134. 제121항 내지 제133항 중 어느 한 항에 있어서, 상기 개방형 해독틀은 벡터 상에 제공되는, 숙주 세포.
  135. 제121항 내지 제133항 중 어느 한 항에 있어서, 상기 개방형 해독틀은 상기 숙주 세포의 게놈에 통합되는, 숙주 세포.
  136. 상용성 액체 배지에 제121항 내지 제135항 중 어느 한 항의 숙주 세포를 포함하는, 배양물.
  137. 상용성 성장 배지에서 제121항 내지 제135항 중 어느 한 항의 숙주 세포를 배양하는 것을 포함하는, 엔도뉴클레아제를 제조하는 방법.
  138. 제137항에 있어서, 추가의 화학 제제 또는 증가된 양의 영양소의 첨가에 의해 상기 엔도뉴클레아제의 발현을 유도하는 것을 추가로 포함하는, 제조 방법.
  139. 제138항에 있어서, 추가의 화학 제제 또는 증가된 양의 영양소는 이소프로필 β-D-1-티오갈락토피라노시드(IPTG) 또는 추가량의 락토스를 포함하는, 제조 방법.
  140. 제137항 내지 제139항 중 어느 한 항에 있어서, 상기 배양 후 상기 숙주 세포를 단리하고 상기 숙주 세포를 용해시켜 단백질 추출물을 생산하는 것을 추가로 포함하는, 제조 방법.
  141. 제140항에 있어서, 상기 단백질 추출물을 IMAC, 또는 이온-친화성 크로마토그래피에 적용하는 것을 추가로 포함하는, 제조 방법.
  142. 제141항에 있어서, 상기 개방형 해독틀은 상기 엔도뉴클레아제를 코딩하는 서열에 프레임내 연결된 IMAC 친화성 태그를 코딩하는 서열을 포함하는, 제조 방법.
  143. 제142항에 있어서, 상기 IMAC 친화성 태그는 프로테아제 절단 부위를 코딩하는 링커 서열을 통해 상기 엔도뉴클레아제를 코딩하는 상기 서열에 프레임내 연결되는, 제조 방법.
  144. 제143항에 있어서, 상기 프로테아제 절단 부위는 담배 식각 바이러스(TEV) 프로테아제 절단 부위, PreScission® 프로테아제 절단 부위, 트롬빈 절단 부위, 인자 Xa 절단 부위, 엔테로키나제 절단 부위, 또는 이들의 임의의 조합을 포함하는, 제조 방법.
  145. 제143항 또는 제144항에 있어서, 상기 프로테아제 절단 부위에 상응하는 프로테아제를 상기 엔도뉴클레아제에 접촉시킴으로써 상기 IMAC 친화성 태그를 절단하는 것을 추가로 포함하는, 제조 방법.
  146. 제145항에 있어서, 상기 엔도뉴클레아제를 포함하는 조성물로부터 상기 친화성 태그를 제거하기 위해 감산 IMAC 친화성 크로마토그래피를 수행하는 것을 추가로 포함하는, 제조 방법.
  147. (a) 3- 또는 4-뉴클레오타이드 PAM 서열에 결합하도록 구성된 클래스 2, 타입 V-A Cas 엔도뉴클레아제로서, 상기 엔도뉴클레아제는 sMbCas12a에 비해 증가된 절단 활성을 갖는, 클래스 2, 타입 V-A Cas 엔도뉴클레아제; 및
    (b) 조작된 가이드 RNA로서, 상기 조작된 가이드 RNA는 상기 클래스 2, 타입 V-A Cas 엔도뉴클레아제와 복합체를 형성하도록 구성되고, 상기 조작된 가이드 RNA는 표적 핵산 서열을 포함하는 표적 핵산에 혼성화하도록 구성된 스페이서 서열을 포함하는, 조작된 가이드 RNA
    를 포함하는, 조작된 뉴클레아제 시스템.
  148. 제147항에 있어서, 상기 절단 활성은 상기 표적 핵산을 포함하는 세포에 상용성 가이드 RNA와 함께 상기 엔도뉴클레아제를 도입하고 상기 세포에서 상기 표적 핵산 서열의 절단을 검출함으로써 시험관 내에서 측정되는, 조작된 뉴클레아제 시스템.
  149. 제147항 또는 제148항에 있어서, 상기 클래스 2, 타입 V-A Cas 엔도뉴클레아제는 서열 번호 215-225 중 어느 하나 또는 이의 변이체에 대해 적어도 75%의 동일성을 갖는 서열을 포함하는, 조작된 뉴클레아제 시스템.
  150. 제149항에 있어서, 상기 조작된 가이드 RNA는 서열 번호 3609의 비-축퇴성 뉴클레오타이드에 대해 적어도 80%의 동일성을 갖는 서열을 포함하는, 조작된 뉴클레아제 시스템.
  151. 제149항 또는 제150항에 있어서, 상기 표적 핵산은 상기 표적 핵산 서열에 근접한 YYN PAM 서열을 추가로 포함하는, 조작된 뉴클레아제 시스템.
  152. 제147항 내지 제151항 중 어느 한 항에 있어서, 상기 클래스 2, 타입 V-A Cas 엔도뉴클레아제는 sMbCas12a에 비해 적어도 약 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 또는 200% 또는 그를 초과하여 증가된 활성을 갖는, 조작된 뉴클레아제 시스템.
  153. (a) 클래스 2, 타입 V-A' Cas 엔도뉴클레아제; 및
    (b) 조작된 가이드 RNA로서, 상기 조작된 가이드 RNA는 클래스 2, 타입 V Cas 엔도뉴클레아제의 천연 이펙터 반복부 서열의 약 19 개 내지 약 25 개 또는 약 19 개 내지 약 31 개의 연속 뉴클레오타이드에 대해 적어도 80%의 동일성을 갖는 서열을 포함하는, 조작된 가이드 RNA
    를 포함하는, 시스템.
  154. 제153항에 있어서, 상기 천연 이펙터 반복부 서열은 서열 번호 3560-3572 중 어느 하나인, 시스템.
  155. 제153항 또는 제154항에 있어서, 상기 클래스 2, 타입 V-A' Cas 엔도뉴클레아제는 서열 번호 126에 대해 적어도 75%의 동일성을 갖는, 시스템.
  156. 세포에서 VEGF-A 유전자좌를 파괴하는 방법으로서, 상기 세포에
    (b) 클래스 2, 타입 V Cas 엔도뉴클레아제; 및
    (b) 조작된 가이드 RNA로서, 상기 조작된 가이드 RNA는 상기 엔도뉴클레아제와 복합체를 형성하도록 구성되고, 상기 조작된 가이드 RNA는 상기 VEGF-A 유전자좌의 영역에 혼성화하도록 구성된 스페이서 서열을 포함하고,
    상기 조작된 가이드 RNA는 서열 번호 3985에 대해 적어도 80%의 동일성을 갖는 표적화 서열을 포함하거나,
    상기 조작된 가이드 RNA는 표 7로부터의 가이드 RNA 1-7 중 어느 하나의 뉴클레오타이드 서열을 포함하는, 조작된 가이드 RNA
    를 도입하는 것을 포함하는, 파괴 방법.
  157. 제156항에 있어서, 상기 클래스 2, 타입 V Cas 엔도뉴클레아제는 서열 번호 1-3470 중 어느 하나 또는 이의 변이체에 대해 적어도 75%의 서열 동일성을 갖는 엔도뉴클레아제를 포함하는, 시스템.
  158. 제156항 또는 제157항에 있어서, 상기 클래스 2, 타입 V Cas 엔도뉴클레아제는 서열 번호 141, 215, 229, 261, 또는 1711-1721 중 어느 하나 또는 이의 변이체에 대해 적어도 75%의 서열 동일성을 갖는 엔도뉴클레아제를 포함하는, 시스템.
  159. 제156항 내지 제158항 중 어느 한 항에 있어서, 상기 조작된 가이드 RNA는 서열 번호 3471, 3539, 3551-3559, 3608-3609, 3612, 3636-3637, 3640-3641, 3644-3645, 3648-3649, 3652-3653, 3656-3657, 3660-3661, 3664-3667, 3671-3672, 3677-3678, 3695-3696, 3729-3730, 3734-3735, 및 3851-3857 중 어느 하나의 비-축퇴성 뉴클레오타이드에 대해 적어도 80%의 서열 동일성을 갖는 서열을 포함하는, 시스템.
  160. 제156항 내지 제158중 어느 한 항에 있어서, 상기 조작된 가이드 RNA는 서열 번호 3608-3609, 3853, 또는 3851-3857 중 어느 하나의 비-축퇴성 뉴클레오타이드에 대해 적어도 80%의 서열 동일성을 갖는 서열을 포함하는, 시스템.
  161. 세포에서 유전자좌를 파괴하는 방법으로서, 상기 세포에
    (a) 서열 번호 215-225 중 어느 하나 또는 이의 변이체에 대해 적어도 75%의 동일성을 갖는 클래스 2, 타입 V Cas 엔도뉴클레아제; 및
    (b) 조작된 가이드 RNA로서, 상기 조작된 가이드 RNA는 상기 엔도뉴클레아제와 복합체를 형성하도록 구성되고, 상기 조작된 가이드 RNA는 상기 유전자좌의 영역에 혼성화하도록 구성된 스페이서 서열을 포함하는, 조작된 가이드 RNA
    를 포함하는 조성물을 접촉시키는 것을 포함하고,
    상기 클래스 2, 타입 V Cas 엔도뉴클레아제는 상기 세포에서 spCas9에 대해 적어도 동등한 절단 활성을 갖는, 파괴 방법.
  162. 제161항에 있어서, 상기 절단 활성은 상기 표적 핵산을 포함하는 세포에 상용성 가이드 RNA와 함께 상기 엔도뉴클레아제를 도입하고 상기 세포에서 상기 표적 핵산 서열의 절단을 검출함으로써 시험관 내에서 측정되는, 파괴 방법.
  163. 제161항 또는 제162항에 있어서, 상기 조성물은 20 pmol 이하의 상기 클래스 2, 타입 V Cas 엔도뉴클레아제를 포함하는, 파괴 방법.
  164. 제163항에 있어서, 상기 조성물은 1 pmol 이하의 상기 클래스 2, 타입 V Cas 엔도뉴클레아제를 포함하는, 파괴 방법.
KR1020227033789A 2020-03-06 2021-03-06 클래스 ii, 타입 v crispr 시스템 KR102647766B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020247008129A KR20240036729A (ko) 2020-03-06 2021-03-06 클래스 ii, 타입 v crispr 시스템

Applications Claiming Priority (13)

Application Number Priority Date Filing Date Title
US202062986477P 2020-03-06 2020-03-06
US62/986,477 2020-03-06
US202063022276P 2020-05-08 2020-05-08
US63/022,276 2020-05-08
US202063045815P 2020-06-29 2020-06-29
US63/045,815 2020-06-29
US202063068316P 2020-08-20 2020-08-20
US63/068,316 2020-08-20
US202063069699P 2020-08-24 2020-08-24
US63/069,699 2020-08-24
US202063116157P 2020-11-19 2020-11-19
US63/116,157 2020-11-19
PCT/US2021/021259 WO2021178933A2 (en) 2020-03-06 2021-03-06 Class ii, type v crispr systems

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020247008129A Division KR20240036729A (ko) 2020-03-06 2021-03-06 클래스 ii, 타입 v crispr 시스템

Publications (2)

Publication Number Publication Date
KR20220150329A true KR20220150329A (ko) 2022-11-10
KR102647766B1 KR102647766B1 (ko) 2024-03-13

Family

ID=77612848

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020247008129A KR20240036729A (ko) 2020-03-06 2021-03-06 클래스 ii, 타입 v crispr 시스템
KR1020227033789A KR102647766B1 (ko) 2020-03-06 2021-03-06 클래스 ii, 타입 v crispr 시스템

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020247008129A KR20240036729A (ko) 2020-03-06 2021-03-06 클래스 ii, 타입 v crispr 시스템

Country Status (10)

Country Link
US (3) US11713471B2 (ko)
EP (1) EP4114932A4 (ko)
JP (1) JP2023517041A (ko)
KR (2) KR20240036729A (ko)
CN (1) CN116096876A (ko)
AU (2) AU2021231074C1 (ko)
CA (1) CA3174557A1 (ko)
GB (2) GB2603704B (ko)
MX (1) MX2022011039A (ko)
WO (1) WO2021178933A2 (ko)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3830301B1 (en) 2018-08-01 2024-05-22 Mammoth Biosciences, Inc. Programmable nuclease compositions and methods of use thereof
GB2603704B (en) 2020-03-06 2023-02-15 Metagenomi Inc Class II, type V Crispr systems
JP2023548588A (ja) * 2020-10-30 2023-11-17 アーバー バイオテクノロジーズ, インコーポレイテッド Tracを標的とするrnaガイドを含む組成物及びその使用
US11332742B1 (en) * 2021-01-07 2022-05-17 Inscripta, Inc. Mad nucleases
CA3219187A1 (en) * 2021-06-02 2022-12-08 Metagenomi, Inc. Class ii, type v crispr systems
WO2023056291A1 (en) * 2021-09-28 2023-04-06 Acrigen Biosciences Compositions and methods for nucleic acid modifications
WO2023092132A1 (en) * 2021-11-22 2023-05-25 Mammoth Biosciences, Inc. Effector proteins and uses thereof
WO2023141590A2 (en) * 2022-01-21 2023-07-27 Mammoth Biosciences, Inc. Effector proteins and methods of use
WO2023230579A2 (en) * 2022-05-25 2023-11-30 Metagenomi, Inc. Supplementation of liver enzyme expression
WO2024020346A2 (en) * 2022-07-18 2024-01-25 Renagade Therapeutics Management Inc. Gene editing components, systems, and methods of use
WO2024042168A1 (en) * 2022-08-26 2024-02-29 UCB Biopharma SRL Novel rna-guided nucleases and nucleic acid targeting systems comprising such rna-guided nucleases

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190264186A1 (en) * 2016-01-22 2019-08-29 The Broad Institute Inc. Crystal structure of crispr cpf1
EP3617311A1 (en) * 2017-03-30 2020-03-04 Kyoto University Method for inducing exon skipping by genome editing

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9790490B2 (en) * 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
AU2017257274B2 (en) * 2016-04-19 2023-07-13 Massachusetts Institute Of Technology Novel CRISPR enzymes and systems
WO2018195545A2 (en) * 2017-04-21 2018-10-25 The General Hospital Corporation Variants of cpf1 (cas12a) with altered pam specificity
CA3102054A1 (en) * 2017-06-05 2018-12-13 Fred Hutchinson Cancer Research Center Genomic safe harbors for genetic therapies in human stem cells and engineered nanoparticles to provide targeted genetic therapies
US9982279B1 (en) * 2017-06-23 2018-05-29 Inscripta, Inc. Nucleic acid-guided nucleases
JP2020536502A (ja) 2017-09-07 2020-12-17 ザ ボード オブ トラスティーズ オブ ザ レランド スタンフォード ジュニア ユニバーシティー 遺伝子操作のためのヌクレアーゼシステム
US20220080055A9 (en) 2017-10-17 2022-03-17 Crispr Therapeutics Ag Compositions and methods for gene editing for hemophilia a
US10253365B1 (en) 2017-11-22 2019-04-09 The Regents Of The University Of California Type V CRISPR/Cas effector proteins for cleaving ssDNAs and detecting target DNAs
US20210024959A1 (en) 2018-03-29 2021-01-28 Fate Therapeutics, Inc. Engineered immune effector cells and use thereof
CN113227367B (zh) 2018-08-09 2023-05-12 G+Flas生命科学公司 用cas12a蛋白进行基因组工程的组合物和方法
CA3117228A1 (en) 2018-12-14 2020-06-18 Pioneer Hi-Bred International, Inc. Novel crispr-cas systems for genome editing
EP3931313A2 (en) * 2019-01-04 2022-01-05 Mammoth Biosciences, Inc. Programmable nuclease improvements and compositions and methods for nucleic acid amplification and detection
JP2022520428A (ja) 2019-02-14 2022-03-30 メタゲノミ アイピー テクノロジーズ,エルエルシー Ruvcドメインを有する酵素
US10982200B2 (en) 2019-02-14 2021-04-20 Metagenomi Ip Technologies, Llc Enzymes with RuvC domains
CN110684823A (zh) 2019-10-23 2020-01-14 海南大学 一种基于试纸条的Cas12a酶的微生物快速诊断技术
CN110904239B (zh) 2019-12-25 2020-11-10 武汉博杰生物医学科技有限公司 肺癌相关分子标志物基因突变的检测试剂盒与检测方法
GB2603704B (en) 2020-03-06 2023-02-15 Metagenomi Inc Class II, type V Crispr systems
WO2021178934A1 (en) 2020-03-06 2021-09-10 Metagenomi Ip Technologies, Llc Class ii, type v crispr systems
CA3177828A1 (en) 2020-05-08 2021-11-11 Brian Thomas Enzymes with ruvc domains
GB2605340A (en) 2020-09-11 2022-09-28 Metagenomi Inc Base editing enzymes
WO2022159742A1 (en) 2021-01-22 2022-07-28 Metagenomi, Inc Novel engineered and chimeric nucleases
CA3205865A1 (en) 2021-01-22 2022-07-28 Brian C. Thomas Novel engineered and chimeric nucleases
CA3204810A1 (en) 2021-01-25 2022-07-28 Feng Zhang Reprogrammable tnpb polypeptides and use thereof
JP2024515936A (ja) 2021-03-19 2024-04-11 メタゲノミ,インク. Cas酵素を用いたマルチプレックス編集
CA3219187A1 (en) 2021-06-02 2022-12-08 Metagenomi, Inc. Class ii, type v crispr systems

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190264186A1 (en) * 2016-01-22 2019-08-29 The Broad Institute Inc. Crystal structure of crispr cpf1
EP3617311A1 (en) * 2017-03-30 2020-03-04 Kyoto University Method for inducing exon skipping by genome editing

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Cell & Bioscience, 2018, vol. 8, article number 59, pages 1-13 *
Experimental & Molecular Medicine, Epub. 05 November 2019, vol. 51, article number 130, pp. 1-11 *

Also Published As

Publication number Publication date
GB202205584D0 (en) 2022-06-01
EP4114932A4 (en) 2024-03-13
GB2603704A (en) 2022-08-10
JP2023517041A (ja) 2023-04-21
KR20240036729A (ko) 2024-03-20
AU2021231074B2 (en) 2023-11-02
AU2021231074A1 (en) 2022-09-29
AU2021231074C1 (en) 2024-05-02
US20240093239A1 (en) 2024-03-21
MX2022011039A (es) 2022-12-13
WO2021178933A2 (en) 2021-09-10
GB202219438D0 (en) 2023-02-01
US20220290187A1 (en) 2022-09-15
GB2617658A (en) 2023-10-18
CN116096876A (zh) 2023-05-09
GB2617658B (en) 2024-04-17
US20230227857A1 (en) 2023-07-20
KR102647766B1 (ko) 2024-03-13
CA3174557A1 (en) 2021-09-10
US11713471B2 (en) 2023-08-01
AU2024200614A1 (en) 2024-04-11
WO2021178933A3 (en) 2021-12-23
EP4114932A2 (en) 2023-01-11
GB2603704B (en) 2023-02-15

Similar Documents

Publication Publication Date Title
KR102647766B1 (ko) 클래스 ii, 타입 v crispr 시스템
EP3526324B1 (en) Crispr-associated (cas) protein
KR102623312B1 (ko) Ruvc 도메인이 존재하는 효소
KR20230021657A (ko) Ruvc 도메인을 포함하는 효소
US20230416710A1 (en) Engineered and chimeric nucleases
WO2021178934A1 (en) Class ii, type v crispr systems
JP2023519953A (ja) クラス2のii型crisprシステム
KR20240055073A (ko) 클래스 ii, v형 crispr 시스템
CA3234233A1 (en) Endonuclease systems
EP4127155A1 (en) Class ii, type ii crispr systems
AU2022284808A1 (en) Class ii, type v crispr systems
CN113728097A (zh) 具有ruvc结构域的酶
KR20240049306A (ko) Ruvc 도메인을 갖는 효소
JP2024501892A (ja) 新規の核酸誘導型ヌクレアーゼ
CN117693585A (zh) Ii类v型crispr系统
WO2024026499A2 (en) Class ii, type v crispr systems
WO2022056301A1 (en) Base editing enzymes
CN116867897A (zh) 碱基编辑酶

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
A107 Divisional application of patent
GRNT Written decision to grant