JP2023517041A - クラスiiのv型crispr系 - Google Patents

クラスiiのv型crispr系 Download PDF

Info

Publication number
JP2023517041A
JP2023517041A JP2022553203A JP2022553203A JP2023517041A JP 2023517041 A JP2023517041 A JP 2023517041A JP 2022553203 A JP2022553203 A JP 2022553203A JP 2022553203 A JP2022553203 A JP 2022553203A JP 2023517041 A JP2023517041 A JP 2023517041A
Authority
JP
Japan
Prior art keywords
sequence
guide rna
endonuclease
engineered
seq
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022553203A
Other languages
English (en)
Other versions
JPWO2021178933A5 (ja
Inventor
トーマス,ブライアン
ブラウン,クリストファー
デヴォート,オードラ
バターフィールド,クリスティーナ
アレクサンダー,リサ
エス.エー. ゴルツマン,ダニエラ
アルバース,ジャスティン
ブルックス,アラン
コスト,グレッグ
テモーチェ-ディアス,モライマ
カステル,シンディ
ラモット,レベッカ
Original Assignee
メタゲノミ,インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by メタゲノミ,インコーポレイテッド filed Critical メタゲノミ,インコーポレイテッド
Publication of JP2023517041A publication Critical patent/JP2023517041A/ja
Publication of JPWO2021178933A5 publication Critical patent/JPWO2021178933A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1068Template (nucleic acid) mediated chemical library synthesis, e.g. chemical and enzymatical DNA-templated organic molecule synthesis, libraries prepared by non ribosomal polypeptide synthesis [NRPS], DNA/RNA-polymerase mediated polypeptide synthesis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/09Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/31Chemical structure of the backbone
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/32Chemical structure of the sugar
    • C12N2310/3212'-O-R Modification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Mycology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Cell Biology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Amplifiers (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Saccharide Compounds (AREA)

Abstract

【解決手段】本明細書には、遺伝子編集に有用な、未培養の微生物に由来する方法、組成物および系が説明されている。【選択図】図4B

Description

相互参照
本願は、2020年3月6日に出願された「クラスIIのV型CRISPR系」と題する米国仮出願第62/986,477号、2020年5月8日に出願された「クラスIIのV型CRISPR系」と題する米国仮出願第63/022,276号、2020年6月29日に出願された「クラスIIのV型CRISPR系」と題する米国仮出願第63/045,815号、2020年8月20日に出願された「クラスIIのV型CRISPR系」と題する米国仮出願第63/068,316号、2020年8月24日に出願された「クラスIIのV型CRISPR系」と題する米国仮出願第63/069,699号、2020年11月19日に出願された「クラスIIのV型CRISPR系」と題する米国仮出願第63/116,157号の恩典を主張するものであり、それらのそれぞれは、全体として参照により本明細書に組み込まれる。
クラスター化され規則的に間隔があいた、関連する短い回文構造の繰り返し(CRISPR)ガイドリボ核酸(RNA)に加えてCas酵素は、広く普及している原核生物免疫系の成分(約45%が細菌、約84%が古細菌)であり、CRISPR-RNAによりガイドされた核酸切断によって、例えば感染性ウイルスおよびプラスミドといった非自己核酸からかかる微生物を保護するように機能していることが明らかになっている。CRISPR RNA要素をコードするデオキシリボ核酸(DNA)要素は、構造および長さに関しては比較的保存されるものの、そのCRISPR関連(Cas)タンパク質は非常に多様なものであり、広範な核酸相互作用ドメインを含有している。CRISPR DNA要素は1987年と早期に観察されていたものの、CRISPR/Cas複合体のプログラム可能なエンドヌクレアーゼ切断能は比較的最近になってやっと認識された。このことが多様なDNA操作および遺伝子編集用途における組換えCRISPR/Cas系の使用につながった。
配列表
本出願は、ASCIIフォーマットで電子的に提出された配列表を含有しており、これは参照としてその全体が本明細書に組み込まれている。2021年3月5日に作成された当該ASCIIコピーの名称は55921-710_601_SL.txtであり、サイズは2,617KBである。
いくつかの態様では、本開示は遺伝子操作されたヌクレアーゼ系を提供し、このヌクレアーゼ系は、(a)RuvCドメインを含むエンドヌクレアーゼであって、該エンドヌクレアーゼが未培養の微生物に由来しており、かつCas12aエンドヌクレアーゼであるRuvCドメインを含むエンドヌクレアーゼと、(b)遺伝子操作されたガイドRNAであって、該エンドヌクレアーゼと複合体を形成するように構成され、標的核酸配列にハイブリダイズするように構成されたスペーサー配列を含む遺伝子操作されたガイドRNAと、を含む。いくつかの実施形態では、Cas12aエンドヌクレアーゼは、配列GWxxxKを含む。いくつかの実施形態では、遺伝子操作されたガイドRNAは、UCUAC[N3-5]GUAGAU(N)を含む。いくつかの実施形態では、遺伝子操作されたガイドRNAは、CCUGC[N]GCAGG(N3-4)を含む。いくつかの態様では、本開示は遺伝子操作されたヌクレアーゼ系を提供し、このヌクレアーゼ系は、(a)配列番号1~3470のうちいずれか1つに対して少なくとも75%の配列同一性を有するエンドヌクレアーゼまたはそのバリアントと、(b)遺伝子操作されたガイドRNAであって、該エンドヌクレアーゼと複合体を形成するように構成され、標的核酸配列にハイブリダイズするように構成されたスペーサー配列を含む遺伝子操作されたガイドRNAと、を含む。いくつかの実施形態では、エンドヌクレアーゼはRuvCI、II、またはIIIドメインを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号1~3470のうちいずれか1つのRuvCI、IIまたはIIIドメインまたはそのバリアントに対して少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。いくつかの実施形態では、RuvCIドメインはD触媒残基を含む。いくつかの実施形態では、RuvCIIドメインはE触媒残基を含む。いくつかの実施形態では、RuvCIIIドメインはD触媒残基を含む。いくつかの実施形態では、当該RuvCドメインはヌクレアーゼ活性を有しない。いくつかの実施形態では、当該エンドヌクレアーゼは、配列番号1~3470のうちいずれか1つのWEDIIドメインまたはそのバリアントに対して少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の配列同一性を有するWEDIIドメインをさらに含む。いくつかの態様では、本開示は遺伝子操作されたヌクレアーゼ系を提供し、このヌクレアーゼ系は、(a)配列番号3862~3913ののうちいずれか1つを含むプロトスペーサー隣接モチーフ(protospacer adjacent motif、PAM)配列に結合するように構成されたエンドヌクレアーゼであって、クラス2のV型Casエンドヌクレアーゼであるエンドヌクレアーゼと、(b)遺伝子操作されたガイドRNAであって、該エンドヌクレアーゼと複合体を形成するように構成され、標的核酸配列にハイブリダイズするように構成されたスペーサー配列を含む遺伝子操作されたガイドRNAと、を含む。いくつかの実施形態では、エンドヌクレアーゼはジンクフィンガー様ドメインをさらに含む。いくつかの実施形態では、ガイドRNAは、配列番号3471、3551~3559、3608~3609、3612、3636~3637、3640~3641、3644~3645、3648~3649、3652~3653、3656~3657、3660~3661、3664~3667、3671~3672、~3678、3695~3696、3729~3730、3734~3735および3851~3857のうちいずれか1つの非縮重ヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含む。いくつかの態様では、本開示は遺伝子操作されたヌクレアーゼ系を提供し、このヌクレアーゼ系は、(a)配列番号3471、3539、3551~3559、3608~3609、3612、3636~3637、3640~3641、3644~3645、3648~3649、3652~3653、3656~3657、3660~3661、3664~3667、3671~3672、3677~3678、3695~3696、3729~3730、3734~3735、または3851~3857のうちいずれか1つの非縮重ヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含む遺伝子操作されたガイドRNAと、(b)該遺伝子操作されたガイドRNAに結合するように構成されたクラス2のV型Casエンドヌクレアーゼと、を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号3863~3913のうちいずれか1つを含むプロトスペーサー隣接モチーフ(PAM)配列に結合するように構成されている。いくつかの実施形態では、ガイドRNAは、真核生物、真菌、植物、哺乳動物またはヒトゲノムのポリヌクレオチド配列に相補的な配列を含む。いくつかの実施形態では、ガイドRNAは30~250ヌクレオチド長である。いくつかの実施形態では、エンドヌクレアーゼは、該エンドヌクレアーゼのN末端またはC末端近位に1つ以上の核局在化配列(nuclear localization sequence、NLS)を含む。いくつかの実施形態では、NLSは配列番号3938~3953からなる群からの配列に対して少なくとも80%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼの配列が配列番号215に対して最適にアラインメントされている場合には、エンドヌクレアーゼは以下の変異:S168R、E172R、N577R、またはY170Rのうち少なくとも1つを含む。いくつかの実施形態では、エンドヌクレアーゼの配列が配列番号215に対して最適にアラインメントされている場合には、エンドヌクレアーゼは変異S168RおよびE172Rを含む。いくつかの実施形態では、エンドヌクレアーゼの配列が配列番号215に対して最適にアラインメントされている場合には、エンドヌクレアーゼは変異N577RまたはY170Rを含む。いくつかの実施形態では、エンドヌクレアーゼの配列が配列番号215に対して最適にアラインメントされている場合には、エンドヌクレアーゼは変異S168Rを含む。いくつかの実施形態では、エンドヌクレアーゼはE172、N577またはY170の変異を含まない。いくつかの実施形態では、遺伝子操作されたヌクレアーゼ系は、
一本鎖または二本鎖DNA修復テンプレートであって、5’~3’で、すなわち標的デオキシリボ核酸配列に対して5’で少なくとも20ヌクレオチドの配列を含む第1のホモロジーアームと、少なくとも10ヌクレオチドの合成DNA配列と、標的配列に対して3’で少なくとも20ヌクレオチドの配列を含む第2のホモロジーアームと、を含む。いくつかの実施形態では、第1のホモロジーアームまたは第2のホモロジーアームは、少なくとも40、80、120、150、200、300、500、または1,000ヌクレオチドの配列を含む。いくつかの実施形態では、第1のホモロジーアームまたは第2のホモロジーアームは、原核生物、細菌、真菌または真核生物のゲノム配列に相同である。いくつかの実施形態では、一本鎖または二本鎖DNA修復テンプレートは導入遺伝子のドナーを含む。いくつかの実施形態では、遺伝子操作されたヌクレアーゼ系は、1つまたは2つの一本鎖DNAセグメントと隣接している二本鎖DNAセグメントを含むDNA修復テンプレートをさらに含む。いくつかの実施形態では、一本鎖DNAセグメントは二本鎖DNAセグメントの5’末端にコンジュゲートされている。いくつかの実施形態では、一本鎖DNAセグメントは二本鎖DNAセグメントの3’末端にコンジュゲートされている。いくつかの実施形態では、一本鎖DNAセグメントは4~10ヌクレオチド塩基の長さを有する。いくつかの実施形態では、一本鎖DNAセグメントはスペーサー配列内の配列に相補的なヌクレオチド配列を有する。いくつかの実施形態では、二本鎖DNA配列は、バーコード、オープンリーディングフレーム、エンハンサー、プロモーター、タンパク質コード配列、miRNAコード配列、RNAコード配列、または導入遺伝子を含む。いくつかの実施形態では、二本鎖DNA配列はヌクレアーゼ切断部位と隣接している。いくつかの実施形態では、ヌクレアーゼ切断部位はスペーサーおよびPAM配列を含む。いくつかの実施形態では、系はMg2+源をさらに含む。いくつかの実施形態では、ガイドRNAは少なくとも8、少なくとも10、または少なくとも12塩基対のリボヌクレオチドを含むヘアピンを含む。いくつかの実施形態では、ヘアピンは10塩基対のリボヌクレオチドを含む。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号141、215、229、261もしくは1711~1721のうちいずれか1つに対して少なくとも75%、80%もしくは90%同一の配列、またはそのバリアントを含み、(b)ガイドRNA構造は、配列番号3608~3609、3853、または3851~3857のうちいずれか1つの非縮重ヌクレオチドと少なくとも80%または90%同一の配列を含む。いくつかの実施形態では、エンドヌクレアーゼは配列番号3863~3913のうちいずれか1つを含むPAMに結合するように構成されている。いくつかの実施形態では、エンドヌクレアーゼは配列番号3871を含むPAMに結合するように構成されている。いくつかの実施形態では、配列同一性は、Smith-Watermanホモロジー検索アルゴリズムパラメータを用いるBLASTP、CLUSTALW、MUSCLE、MAFFTアルゴリズム、またはCLUSTALWアルゴリズムによって決定される。いくつかの実施形態では、配列同一性は、3のワード長(W)、10の期待値(E)のパラメータ、および11の存在、1の伸長でのギャップコストを設定しているBLOSUM62スコア行列を使用する、ならびに条件付き組合せスコア行列の調整を使用する、BLASTPホモロジー検索アルゴリズムによって決定される。
いくつかの態様では、本開示は遺伝子操作されたガイドRNAを提供し、(a)標的DNA分子中の標的配列に相補的であるヌクレオチド配列を含むDNA標的セグメントと、(b)二本鎖RNA(dsRNA)二重鎖を形成するようにハイブリダイズするヌクレオチドの2つの相補的な並びを含むタンパク質結合セグメントと、を含み、ヌクレオチドの2つの相補的な並びが、介在性ヌクレオチドと互いに共有結合され、遺伝子操作されたガイドリボ核酸ポリヌクレオチドは、配列番号1~3470のうちいずれか1つに対して少なくとも75%の配列同一性を有するエンドヌクレアーゼとの複合体の形成、および標的DNA分子の標的配列への複合体の標的化、が可能である。いくつかの実施形態では、DNA標的セグメントは、ヌクレオチドの2つの相補的な並びの両方の3’に位置づけられている。いくつかの実施形態では、タンパク質結合セグメントは、配列番号3608~3609の非縮重ヌクレオチドに対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含む。いくつかの実施形態では、二本鎖RNA(dsRNA)二重鎖は、少なくとも5、少なくとも8、少なくとも10、または少なくとも12リボヌクレオチドを含む。
いくつかの態様では、本開示は、本明細書に説明されている遺伝子操作されたガイドリボ核酸ポリヌクレオチドをコードするデオキシリボ核酸ポリヌクレオチドを提供する。
いくつかの態様では、本開示は、生物での発現に最適化された遺伝子操作された核酸配列を含む核酸を提供する。この核酸は、クラス2のV型Casエンドヌクレアーゼをコードしており、未培養の微生物に由来し、該生物は未培養の生物ではない。いくつかの実施形態では、エンドヌクレアーゼは、配列番号1~3470のうちいずれか1つに対して少なくとも70%、または少なくとも80%の配列同一性を有するバリアントを含む。いくつかの実施形態では、エンドヌクレアーゼは、該エンドヌクレアーゼのN末端またはC末端近位に1つ以上の核局在化配列(NLS)をコードする配列を含む。いくつかの実施形態では、NLSは配列番号3938~3953から選択された配列を含む。いくつかの実施形態では、NLSは配列番号3939を含む。いくつかの実施形態では、NLSはエンドヌクレアーゼのN末端近位に存在する。いくつかの実施形態では、NLSは配列番号3938を含む。いくつかの実施形態では、NLSはエンドヌクレアーゼのC末端近位に存在する。いくつかの実施形態では、生物は原核生物、細菌、真核生物、真菌、植物、哺乳動物、げっ歯類、またはヒトである。
いくつかの態様では、本開示は、クラス2のV型CasエンドヌクレアーゼまたはCas12aエンドヌクレアーゼをコードする核酸配列を含む遺伝子操作されたベクターを提供する。該エンドヌクレアーゼは、未培養の微生物に由来する。
いくつかの態様では、本開示は、本明細書に説明されている核酸を含む遺伝子操作されたベクターを提供する。
いくつかの態様では、本開示は、本明細書に説明されているデオキシリボ核酸ポリヌクレオチドを含む遺伝子操作されたベクターを提供する。いくつかの実施形態では、ベクターはプラスミド、ミニサークル、CELiD、アデノ随伴ウイルス(AAV)由来のウイルス粒子、レンチウイルス、またはアデノウイルスである。
いくつかの態様では、本開示は本明細書に説明されているベクターを含む細胞を提供する。
いくつかの態様では、本開示は本明細書に説明されている宿主細胞のうちいずれかを培養することを含む、エンドヌクレアーゼを製造する方法を提供する。
いくつかの態様では、本開示は、二本鎖デオキシリボ核酸ポリヌクレオチドを結合、切断、マーキングまたは修飾するための方法であって、(a)エンドヌクレアーゼおよび二本鎖デオキシリボ核酸ポリヌクレオチドに結合するように構成された遺伝子操作されたガイドRNAを含む複合体中で、二本鎖デオキシリボ核酸ポリヌクレオチドとクラス2のV型Casエンドヌクレアーゼとを接触させることを含み、(b)該二本鎖デオキシリボ核酸ポリヌクレオチドがプロトスペーサー隣接モチーフ(PAM)を含み、(c)該PAMが配列番号3863~3913のうちいずれか1つを含む配列を含む。いくつかの実施形態では、二本鎖デオキシリボ核酸ポリヌクレオチドは、遺伝子操作されたガイドRNAの配列に相補的な配列を含む第1の鎖と、PAMを含む第2の鎖と、を含む。いくつかの実施形態では、PAMは、遺伝子操作されたガイドRNAの配列に相補的な配列の5’末端に直接隣接している。いくつかの実施形態では、PAMは配列番号3871を含む。いくつかの実施形態では、クラス2のV型Casエンドヌクレアーゼは未培養の微生物に由来する。いくつかの実施形態では、二本鎖デオキシリボ核酸ポリヌクレオチドは、真核生物、植物、真菌、哺乳動物、げっ歯類、またはヒトの二本鎖デオキシリボ核酸ポリヌクレオチドである。いくつかの実施形態では、方法は、請求項[0004]~0のうちいずれか一項に記載の遺伝子操作されたヌクレアーゼ系を標的核酸遺伝子座に送達することを含み、該エンドヌクレアーゼが遺伝子操作されたガイドリボ核酸構造と複合体を形成するように構成され、該複合体を標的核酸遺伝子座に結合する際に、複合体が標的核酸遺伝子座を修飾するように、複合体が構成されている。いくつかの実施形態では、標的核酸遺伝子座を修飾することは、標的核酸遺伝子座を結合、標的核酸遺伝子座に切れ目をいれる、標的核酸遺伝子座を切断、または標的核酸遺伝子座をマーキングすることを含む。いくつかの実施形態では、標的核酸遺伝子座はデオキシリボ核酸(DNA)またはリボ核酸(RNA)を含む。いくつかの実施形態では、標的核酸はゲノムDNA、ウイルスDNA、ウイルスRNA、または細菌性DNAを含む。いくつかの実施形態では、標的核酸遺伝子座はインビトロである。いくつかの実施形態では、標的核酸遺伝子座は細胞内である。いくつかの実施形態では、細胞は原核生物細胞、細菌細胞、真核生物細胞、真菌細胞、植物細胞、動物細胞、哺乳動物細胞、げっ歯類細胞、霊長類細胞、ヒト細胞、または初代細胞である。いくつかの実施形態では、細胞は初代細胞である。いくつかの実施形態では、初代細胞はT細胞である。いくつかの実施形態では、初代細胞は造血幹細胞(hematopoietic stem cell、HSC)である。いくつかの実施形態では、遺伝子操作されたヌクレアーゼ系を標的核酸遺伝子座に送達することは、請求項[0007]~[0008]のうちいずれか一項に記載の核酸、または請求項[0008]~[0011]のうちいずれか一項に記載のベクターを送達することを含む。いくつかの実施形態では、遺伝子操作されたヌクレアーゼ系を標的核酸遺伝子座に送達することは、エンドヌクレアーゼをコードするオープンリーディングフレームを含む核酸を送達することを含む。いくつかの実施形態では、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されているプロモーターを含む。いくつかの実施形態では、遺伝子操作されたヌクレアーゼ系を標的核酸遺伝子座に送達することは、エンドヌクレアーゼをコードするオープンリーディングフレームを含有するキャップされたmRNAを送達することを含む。いくつかの実施形態では、遺伝子操作されたヌクレアーゼ系を標的核酸遺伝子座に送達することは、翻訳されたポリペプチドを送達することを含む。いくつかの実施形態では、遺伝子操作されたヌクレアーゼ系を標的核酸遺伝子座に送達することは、リボ核酸(RNA)pol IIIプロモーターに動作可能に連結された遺伝子操作されたガイドRNAをコードするデオキシリボ核酸(DNA)を送達することを含む。いくつかの実施形態では、エンドヌクレアーゼは、標的遺伝子座でまたは標的遺伝子座近傍で一本鎖切断または二本鎖切断を誘導する。いくつかの実施形態では、エンドヌクレアーゼは標的遺伝子座内で、または標的遺伝子座に対して3’でねじれ形の一本鎖切断を誘導する。
いくつかの態様では、本開示は、細胞のTRAC遺伝子座を編集する方法を提供する。この方法は、(a)RNAガイドエンドヌクレアーゼ、および(b)遺伝子操作されたガイドRNAであって、遺伝子操作されたガイドRNAが該エンドヌクレアーゼと複合体を形成するように構成され、遺伝子操作されたガイドRNAが、TRAC遺伝子座の領域にハイブリダイズするように構成されたスペーサー配列を含む遺伝子操作されたガイドRNA、を細胞に接触させることを含み、遺伝子操作されたガイドRNAが、配列番号4316~4369のうちいずれか1つの少なくとも18連続するヌクレオチドと少なくとも85%の同一性を有する標的化配列を含む。いくつかの実施形態では、RNAガイドヌクレアーゼはCasエンドヌクレアーゼである。いくつかの実施形態では、Casエンドヌクレアーゼはクラス2のV型Casエンドヌクレアーゼである。いくつかの実施形態では、クラス2のV型Casエンドヌクレアーゼは、RuvCIサブドメイン、RuvCIIサブドメイン、およびRuvCIIIサブドメインを含むRuvCドメインを含む。いくつかの実施形態では、クラス2のV型Casエンドヌクレアーゼは、配列番号1~3470のうちいずれか1つに対して少なくとも75%の配列同一性を有するエンドヌクレアーゼまたはそのバリアントを含む。いくつかの実施形態では、遺伝子操作されたガイドRNAは、配列番号3471、3539、3551~3559、3608~3609、3612、3636~3637、3640~3641、3644~3645、3648~3649、3652~3653、3656~3657、3660~3661、3664~3667、3671~3672、3677~3678、3695~3696、3729~3730、3734~3735および3851~3857のうちいずれか1つの非縮重ヌクレオチドのうち少なくとも19個に対して少なくとも80%の配列同一性を有する配列をさらに含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号141、215、229、261または1711~1721のうちいずれか1つに対して少なくとも75%、80%または90%同一である配列、またはそのバリアントを含む。いくつかの実施形態では、ガイドRNA構造は、配列番号3608~3609、3853、または3851~3857のうちいずれか1つの非縮重ヌクレオチドのうち少なくとも19個に対して少なくとも80%、または少なくとも90%同一である配列を含む。いくつかの実施形態では、方法は、3’または5’末端上で、配列番号4424または4425のうちいずれか1つに対して少なくとも80%の同一性を有する配列に隣接するカーゴ配列を含むドナー核酸を、細胞に接触させること、または細胞に導入することをさらに含む。いくつかの実施形態では、細胞は末梢血単核球(peripheral blood mononuclear cell、PBMC)である。いくつかの実施形態では、細胞はT細胞、またはその前駆体、または造血幹細胞(HSC)である。いくつかの実施形態では、カーゴ配列は、T細胞受容体ポリペプチド、CAR-Tポリペプチド、またはそれらのフラグメントもしくはそれらの誘導体をコードする配列を含む。いくつかの実施形態では、遺伝子操作されたガイドRNAは、配列番号4370~4423のうちいずれか1つに対して少なくとも80%の同一性を有する配列を含む。いくつかの実施形態では、遺伝子操作されたガイドRNAは、表5Aに列挙された対応する化学修飾を含む、表5AからのsgRNA1~54のヌクレオチド配列を含む。いくつかの実施形態では、遺伝子操作されたガイドRNAは、配列番号4334、4350、または4324のうちいずれか1つに対して少なくとも80%の配列同一性を有する標的化配列を含む。いくつかの実施形態では、遺伝子操作されたガイドRNAは、配列番号4388、4404、または4378のうちいずれか1つに対して少なくとも80%の配列同一性を有する配列を含む。いくつかの実施形態では、遺伝子操作されたガイドRNAは、表5AからのsgRNA9、35、または19のヌクレオチド配列を含む。
いくつかの態様では、本開示は遺伝子操作されたヌクレアーゼ系を提供し、この系は、(a)RNAガイドエンドヌクレアーゼと、(b)遺伝子操作されたガイドRNAであって、遺伝子操作されたガイドRNAは、エンドヌクレアーゼと複合体を形成するように構成され、標的核酸配列にハイブリダイズするように構成されたスペーサー配列を含む、遺伝子操作されたガイドRNAと、を含み、以下の修飾:(i)遺伝子操作されたガイドRNAの5’末端の最初の4塩基または遺伝子操作されたガイドRNAの3’末端の最後の4塩基内の少なくとも1つのヌクレオチドの2’-Oメチルまたは2’-フルオロ塩基修飾、(ii)遺伝子操作されたガイドRNAの5’末端の最初の5塩基のうち少なくとも2つの間のチオリン酸(PS)結合、または遺伝子操作されたガイドRNAの3’末端の最後の5塩基のうち少なくとも2つの間のチオリン酸結合、(iii)遺伝子操作されたガイドRNAの3’ステムまたは5’ステム内のチオリン酸結合、(iv)遺伝子操作されたガイドRNAの3’ステムまたは5’ステム内の2’-Oメチルまたは2’-フルオロ塩基修飾、(v)遺伝子操作されたガイドRNAのスペーサー領域の少なくとも7塩基の2’-フルオロ塩基修飾、および(vi)遺伝子操作されたガイドRNAのループ領域内のチオリン酸結合、のうち少なくとも1つを含む。いくつかの実施形態では、遺伝子操作されたガイドRNAは、遺伝子操作されたガイドRNAの5’末端の最初の5塩基、または遺伝子操作されたガイドRNAの3’末端の最後の5塩基内の少なくとも1つのヌクレオチドの2’-Oメチルまたは2’-フルオロ塩基修飾を含む。いくつかの実施形態では、遺伝子操作されたガイドRNAは、遺伝子操作されたガイドRNAの5’末端、または遺伝子操作されたガイドRNAの3’末端に、2’-Oメチルまたは2’-フルオロ塩基修飾を含む。いくつかの実施形態では、遺伝子操作されたガイドRNAは、遺伝子操作されたガイドRNAの5’末端の最初の5塩基のうち少なくとも2つの間にチオリン酸(PS)結合、または遺伝子操作されたガイドRNAの3’末端の最後の5塩基のうち少なくとも2つの間にチオリン酸結合を含む。いくつかの実施形態では、遺伝子操作されたガイドRNAは、遺伝子操作されたガイドRNAの3’ステムまたは5’ステム内にチオリン酸結合を含む。いくつかの実施形態では、遺伝子操作されたガイドRNAは、遺伝子操作されたガイドRNAの3’ステムまたは5’ステム内に2’-Oメチル塩基修飾を含む。いくつかの実施形態では、遺伝子操作されたガイドRNAは、遺伝子操作されたガイドRNAのスペーサー領域の少なくとも7塩基の2’-フルオロ塩基修飾を含む。いくつかの実施形態では、遺伝子操作されたガイドRNAは、遺伝子操作されたガイドRNAのループ領域内にチオリン酸結合を含む。いくつかの実施形態では、遺伝子操作されたガイドRNAは、遺伝子操作されたガイドRNAの5’末端に少なくとも3つの2’-Oメチルまたは2’-フルオロ塩基、遺伝子操作されたガイドRNAの5’末端の最初の3塩基の間に2つのチオリン酸結合、遺伝子操作されたガイドRNAの4’末端に少なくとも4つの2’-Oメチルまたは2’-フルオロ塩基、および遺伝子操作されたガイドRNAの3’末端の最後の3塩基の間に3つのチオリン酸結合を含む。いくつかの実施形態では、遺伝子操作されたガイドRNAは、遺伝子操作されたガイドRNAの5’末端に少なくとも2つの2’-O-メチル塩基および少なくとも2つのチオリン酸結合、ならびに遺伝子操作されたガイドRNAの3’末端に少なくとも1つの2’-O-メチル塩基および少なくとも1つのチオリン酸結合を含む。いくつかの実施形態では、遺伝子操作されたガイドRNAは、遺伝子操作されたガイドRNAの3’ステムまたは5’ステム領域の両方に少なくとも1つの2’-O-メチル塩基を含む。いくつかの実施形態では、遺伝子操作されたガイドRNAは、遺伝子操作されたガイドRNAのシード領域を除くスペーサー領域に、少なくとも1個~少なくとも14個の2’-フルオロ塩基を含む。いくつかの実施形態では、遺伝子操作されたガイドRNAは、遺伝子操作されたガイドRNAの5’ステム領域に少なくとも1つの2’-O-メチル塩基、およびガイドRNAのシード領域を除くスペーサー領域に、少なくとも1個~少なくとも14個の2’-フルオロ塩基を含む。いくつかの実施形態では、ガイドRNAは、VEGF-A遺伝子を標的化するスペーサー配列を含む。いくつかの実施形態では、ガイドRNAは、配列番号3985に対して少なくとも80%の同一性を有するスペーサー配列を含む。いくつかの実施形態では、ガイドRNAは、表7に列挙された化学修飾を含む、表7からのガイドRNA1~7のヌクレオチドを含む。いくつかの実施形態では、RNAガイドヌクレアーゼはCasエンドヌクレアーゼである。いくつかの実施形態では、Casエンドヌクレアーゼはクラス2のV型Casエンドヌクレアーゼである。いくつかの実施形態では、クラス2のV型Casエンドヌクレアーゼは、RuvCIサブドメイン、RuvCIIサブドメイン、およびRuvCIIIサブドメインを含むRuvCドメインを含む。いくつかの実施形態では、クラス2のV型Casエンドヌクレアーゼは、配列番号1~3470のうちいずれか1つに対して少なくとも75%の配列同一性を有するエンドヌクレアーゼまたはそのバリアントを含む。いくつかの実施形態では、クラス2のV型Casエンドヌクレアーゼは、配列番号141、215、229、261または1711~1721のうちいずれか1つに対して少なくとも75%の配列同一性を有するエンドヌクレアーゼ、またはそのバリアントを含む。いくつかの実施形態では、遺伝子操作されたガイドRNAは、配列番号3471、3539、3551~3559、3608~3609、3612、3636~3637、3640~3641、3644~3645、3648~3649、3652~3653、3656~3657、3660~3661、3664~3667、3671~3672、3677~3678、3695~3696、3729~3730、3734~3735および3851~3857のうちいずれか1つの非縮重ヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含む。いくつかの実施形態では、遺伝子操作されたガイドRNAは、配列番号3608~3609、3853、または3851~3857のうちいずれか1つの非縮重ヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含む。
いくつかの態様では、本開示は、配列番号1~3470のうちいずれか1つに対して少なくとも75%の配列同一性を有する異種エンドヌクレアーゼ、またはそのバリアントをコードするオープンリーディングフレームを含む宿主細胞を提供する。いくつかの実施形態では、該エンドヌクレアーゼは、配列番号141、215、229、261または1711~1721のうちいずれか1つ、またはそのバリアントに対して少なくとも75%の配列同一性を有する。いくつかの実施形態では、宿主細胞は、大腸菌細胞または哺乳動物細胞である。いくつかの実施形態では、宿主細胞は大腸菌細胞であり、大腸菌細胞はλDE3溶原菌である、または大腸菌細胞はBL21(DE3)株である。いくつかの実施形態では、大腸菌細胞はompT lon遺伝子型を有する。いくつかの実施形態では、オープンリーディングフレームは、T7プロモーター配列、T7-lacプロモーター配列、lacプロモーター配列、tacプロモーター配列、trcプロモーター配列、ParaBADプロモーター配列、PrhaBADプロモーター配列、T5プロモーター配列、cspAプロモーター配列、araPBADプロモーター、ラムダファージ由来の強力な左方向プロモーター(pLプロモーター)、またはそれらの任意の組合せに動作可能に連結される。いくつかの実施形態では、オープンリーディングフレームは、エンドヌクレアーゼをコードする配列に対してインフレームで連結されたアフィニティータグをコードする配列を含む。いくつかの実施形態では、アフィニティータグは固定化金属アフィニティークロマトグラフィー(immobilized metal affinity chromatography、IMAC)タグである。いくつかの実施形態では、IMACタグはポリヒスチジンタグである。いくつかの実施形態では、アフィニティータグはmycタグ、ヒトインフルエンザ赤血球凝集素(HA)タグ、マルトース結合タンパク質(maltose binding protein、MBP)タグ、グルタチオンS-転移酵素(glutathione S-transferase、GST)タグ、ストレプトアビジンタグ、FLAGタグ、またはそれらの任意の組合せである。いくつかの実施形態では、アフィニティータグは、プロテアーゼ切断部位をコードするリンカー配列を介してエンドヌクレアーゼをコードする配列にインフレームで連結されている。いくつかの実施形態では、プロテアーゼ切断部位は、タバコエッチウイルス(tobacco etch virus、TEV)プロテアーゼ切断部位、PreScission(登録商標)プロテアーゼ切断部位、トロンビン切断部位、血液凝固因子Xa切断部位、エンテロキナーゼ切断部位、またはそれらの任意の組合せである。いくつかの実施形態では、オープンリーディングフレームは、宿主細胞での発現にコドン最適化されている。いくつかの実施形態では、オープンリーディングフレームはベクター上に設けられている。いくつかの実施形態では、オープンリーディングフレームは宿主細胞のゲノムに組み込まれている。
いくつかの態様では、本開示は、適合性のある液体培地中に本明細書に説明されている宿主細胞のうちいずれかを含む培養物を提供する。
いくつかの態様では、本開示は、適合性のある増殖培地中で本明細書に説明されている宿主細胞のうちいずれかを培養することを含む、エンドヌクレアーゼを産生する方法を提供する。いくつかの実施形態では、方法はエンドヌクレアーゼの発現を誘導することをさらに含む。いくつかの実施形態では、ヌクレアーゼの発現の誘導は、さらなる化学薬剤もしくは増量した栄養物を加えることによるもの、または温度上昇もしくは温度低下によるものである。いくつかの実施形態では、さらなる化学薬剤または増量した栄養物は、イソプロピルβ-D-1-チオガラクトピラノシド(IPTG)または追加量のラクトースを含む。いくつかの実施形態では、方法は、培養後に宿主細胞を単離し、該宿主細胞を溶解してタンパク質抽出物を製造することをさらに含む。いくつかの実施形態では、方法はエンドヌクレアーゼを単離することをさらに含む。いくつかの実施形態では、該単離は、タンパク質抽出物をIMAC、イオン交換クロマトグラフィー、陰イオン交換クロマトグラフィー、または陽イオン交換クロマトグラフィーに供することを含む。いくつかの実施形態では、オープンリーディングフレームは、エンドヌクレアーゼをコードする配列に対してインフレームで連結されたアフィニティータグをコードする配列を含む。いくつかの実施形態では、アフィニティータグは、プロテアーゼ切断部位をコードするリンカー配列を介してエンドヌクレアーゼをコードする配列にインフレームで連結されている。いくつかの実施形態では、プロテアーゼ切断部位は、タバコエッチウイルス(tobacco etch virus、TEV)プロテアーゼ切断部位、PreScission(登録商標)プロテアーゼ切断部位、トロンビン切断部位、血液凝固因子Xa切断部位、エンテロキナーゼ切断部位、またはそれらの任意の組合せを含む。いくつかの実施形態では、方法は、プロテアーゼ切断部位に対応するプロテアーゼをエンドヌクレアーゼに接触させることで、アフィニティータグを切断することをさらに含む。いくつかの実施形態では、アフィニティータグはIMACアフィニティータグである。いくつかの実施形態では、方法は、サブトラクティブIMACアフィニティークロマトグラフィーを実施し、エンドヌクレアーゼを含む組成物からアフィニティータグを除去することをさらに含む。
いくつかの態様では、本開示は、(a)3-ヌクレオチドPAM配列または4-ヌクレオチドPAM配列を結合するように構成されたクラス2のV-A型Casエンドヌクレアーゼであって、該エンドヌクレアーゼはsMbCas12aに対する切断活性を増加している、クラス2のV-A型Casエンドヌクレアーゼと、(b)遺伝子操作されたガイドRNAであって、クラス2のV-A型Casエンドヌクレアーゼを含む複合体を形成するように構成され、標的核酸配列を含む標的核酸にハイブリダイズするように構成されたスペーサー配列を含む、遺伝子操作されたガイドRNAと、を含む、系を提供する。いくつかの実施形態では、切断活性は、適合するガイドRNAを加えたエンドヌクレアーゼを、標的核酸を含む細胞に導入することで、かつ細胞の標的核酸配列の切断を検出することで、インビトロで測定される。いくつかの実施形態では、クラス2のV-A型Casエンドヌクレアーゼは、215~225のうちいずれか1つに対して少なくとも75%の配列同一性を有する配列、またはそのバリアントを含む。いくつかの実施形態では、遺伝子操作されたガイドRNAは、配列番号3609の非縮重ヌクレオチドに対して少なくとも80%の同一性を有する配列を含む。いくつかの実施形態では、標的核酸は、標的核酸配列近位のYYN PAM配列をさらに含む。いくつかの実施形態では、クラス2のV-A型Casエンドヌクレアーゼは、sMbCas12aに対して少なくとも約5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、または200%、またはそれ以上増加した活性を有する。
いくつかの態様では、本開示は系を提供し、この系は、(a)クラス2のV-A’型Casエンドヌクレアーゼと、(b)遺伝子操作されたガイドRNAであって、クラス2のV型Casエンドヌクレアーゼの天然エフェクターリピート配列の約19~約25、または約19~約31の連続ヌクレオチドに対して少なくとも80%の同一性を有する配列を含む、遺伝子操作されたガイドRNAを含む。いくつかの実施形態では、天然エフェクターリピート配列は配列番号3560~3572のうちいずれか1つである。いくつかの実施形態では、クラス2のV-A’型Casエンドヌクレアーゼは、配列番号126に対して少なくとも75%の同一性を有する。
いくつかの態様では、本開示は系を提供し、この系は、(a)クラス2のV-L型エンドヌクレアーゼと、(b)遺伝子操作されたガイドRNAであって、クラス2のV型Casエンドヌクレアーゼの天然エフェクターリピート配列の約19~約25、または約19~約31の連続ヌクレオチドに対して少なくとも80%の同一性を有する配列を含む、遺伝子操作されたガイドRNAを含む。いくつかの実施形態では、該クラス2のV-L型エンドヌクレアーゼは、配列番号793~1163のうちいずれか1つに対して少なくとも75%の配列同一性を有する。
いくつかの態様では、本開示は、細胞のVEGF-A遺伝子座を破壊する方法を提供し、この方法は、(a)クラス2のV型Casエンドヌクレアーゼと、(b)遺伝子操作されたガイドRNAであって、エンドヌクレアーゼと複合体を形成するように構成され、かつVEGF-A遺伝子座の領域にハイブリダイズするように構成されたスペーサー配列を含み、遺伝子操作されたガイドRNAが配列番号3985に対して少なくとも80%の同一性を有する標的化配列を含み、または遺伝子操作されたガイドRNAが表7からのガイドRNA1~7のうちいずれか1つのヌクレオチド配列を含む、遺伝子操作されたガイドRNAと、を細胞に導入することを含む。いくつかの実施形態では、クラス2のV型Casエンドヌクレアーゼは、配列番号1~3470のうちいずれか1つに対して少なくとも75%の配列同一性を有するエンドヌクレアーゼまたはそのバリアントを含む。いくつかの実施形態では、クラス2のV型Casエンドヌクレアーゼは、配列番号141、215、229、261または1711~1721のうちいずれか1つに対して少なくとも75%の配列同一性を有するエンドヌクレアーゼ、またはそのバリアントを含む。いくつかの実施形態では、遺伝子操作されたガイドRNAは、配列番号3471、3539、3551~3559、3608~3609、3612、3636~3637、3640~3641、3644~3645、3648~3649、3652~3653、3656~3657、3660~3661、3664~3667、3671~3672、3677~3678、3695~3696、3729~3730、3734~3735および3851~3857のうちいずれか1つの非縮重ヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含む。いくつかの実施形態では、遺伝子操作されたガイドRNAは、配列番号3608~3609、3853、または3851~3857のうちいずれか1つの非縮重ヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含む。
いくつかの態様では、本開示は細胞の遺伝子座を破壊する方法を提供し、この方法は、(a)配列番号215~225のうちいずれか1つに対して少なくとも75%の同一性を有するクラス2のV型Casエンドヌクレアーゼ、またはそのバリアントと、(b)遺伝子操作されたガイドRNAであって、エンドヌクレアーゼと複合体を形成するように構成され、該遺伝子座の領域にハイブリダイズするように構成されたスペーサー配列を含む、遺伝子操作されたガイドRNAと、を含む組成物を細胞に接触させることを含み、クラス2のV型Casエンドヌクレアーゼは、細胞のspCas9に対して少なくとも同等の切断活性を有する。いくつかの実施形態では、切断活性は、適合するガイドRNAを加えたエンドヌクレアーゼを、標的核酸を含む細胞に導入することで、かつ細胞の標的核酸配列の切断を検出することで、インビトロで測定される。いくつかの実施形態では、該組成物は、20pmol以下のクラス2のV型Casエンドヌクレアーゼを含む。いくつかの実施形態では、該組成物は、1pmol以下のクラス2のV型Casエンドヌクレアーゼを含む。
本開示のさらなる態様および利点は、本開示の例示的な実施形態のみが示され、かつ説明されている以下の詳細な説明から、当業者には容易に明らかになるであろう。理解されるであろう通り、本開示は他の実施形態および異なる実施形態が可能であり、そのいくつかの詳細部分は、本開示から全て逸脱することなく、明白となっている様々な点での修飾が可能である。したがって、図面および説明は、本質的には例示であると見なされるべきであり、制限であると見なされるべきではない。
援用記載
本明細書で言及されている全ての刊行物、特許および特許出願は、それぞれ個別の刊行物、特許または特許出願が本明細書の一部として援用されると具体的かつ個別に示されていると仮定した上で、同程度で本明細書の一部として援用される。
本発明の新規特徴は、添付の特許請求の範囲に詳細に記載されている。本発明の特徴および利点の良好な理解は、本発明の原理が利用される例示的な実施形態を記載している以下の詳細な説明、および添付の図面を参照することによって得られるであろう。
本開示前に事前に説明された異なるクラスおよび型のCRISPR/Cas遺伝子座の典型的な構成を示す。 本明細書に説明されているMGヌクレアーゼの環境分布を示す。タンパク質長は、MG29タンパク質ファミリーの代表例について示されている。影のある円は、各タンパク質を識別する環境または環境タイプを示す(深い灰色の円は高温の環境源を示し、明るい灰色の円は非高温の環境源を示す)。N/Aは、試料が収集された環境の種類が未知であることを示している。 本明細書に説明されている試料タイプから検出されたMGヌクレアーゼに存在する予想の触媒残基の数を表す(例えば、図2)。タンパク質長は、MG29タンパク質ファミリーの代表例について示されている。各タンパク質に関して予想された触媒残基の数は、図表の説明に示されている(3.0残基)。第1の残基、第2の残基および第3の触媒残基は、それぞれRuvCIドメイン、RuvCIIドメインおよびRuvCIIIドメイン中に配置されている。 図4Aは、CRISPR V-A型エフェクターの多様性を示す。図4Aは、新規V-A型エフェクターをコードするコンティグの分類学的分類のファミリーあたりの分布を表す。 図4Bは、CRISPR V-A型エフェクターの多様性を示す。図4Bは、119個の新規および89個の参照V型エフェクター配列のアラインメントから推測された系統学的遺伝子系譜を表す。MGファミリーを括弧内に表す。活性ヌクレアーゼ向けのPAM要件は、ファミリーに関連するボックスで強調されている。非V-A型参照配列は、木を根付かせるために使用された(*MG61ファミリーは、代替的なステムループ配列を有するcrRNAを必要とする)。 図5Aは、本明細書に説明されているヌクレアーゼに関する様々な特性情報を提供する。図5Aは、エフェクタータンパク質長および試料型のファミリーあたりの分布を表す。 図5Bは、本明細書に説明されているヌクレアーゼに関する様々な特性情報を提供する。図5Bは、RuvC触媒残基の存在を示す。 図5Cは、本明細書に説明されているヌクレアーゼに関する様々な特性情報を提供する。図5Cは、様々なリピートモチーフを有するCRISPRアレイの数を示す。 図5Dは、本明細書に説明されているヌクレアーゼに関する様々な特性情報を提供する。図5Dは、リピートモチーフのファミリーあたりの分布を表す。 図6Aは、V-A型配列における触媒およびPAM相互作用領域の複数の配列アラインメントを表す。フランシセラ・ノビシダ Cas12a(FnCas12)は参照配列である。他の参照配列は、アシダミノコッカス種(AsCas12a)、モラクセラ・ボーボクリ(MbCas12a)、およびラクノスピラ・バクテリウム ND2006(LbCas12a)である。図6Aは、RuvC-I(左)、RuvC-II(中間)およびRuvC-III(右)領域におけるDED触媒残基周辺の保存のブロックを示す。 図6Bは、V-A型配列における触媒およびPAM相互作用領域の複数の配列アラインメントを表す。フランシセラ・ノビシダ Cas12a(FnCas12)は参照配列である。他の参照配列は、アシダミノコッカス種(AsCas12a)、モラクセラ・ボーボクリ(MbCas12a)、およびラクノスピラ・バクテリウム ND2006(LbCas12a)である。図6Bは、PAM認識および相互作用に関与する残基を含有するWED-IIおよびPAM相互作用領域を示す。FnCas12a配列のすぐ下の灰色のボックスは、ドメインを同定している。アラインメント中のより色の濃いボックスは、配列同一性の増加を示す。FnCas12a配列上の黒いボックスは、参照配列の触媒残基(および位置)を示す。灰色のボックスは、アラインメント(FnCas12a)の最上部の参照配列におけるドメインを示す。黒いボックスは、参照配列の触媒残基(および位置)を示す。 図7Aは、V-A型およびこれに関連するV-A’エフェクターを表す。図7Aは、転写の方向を指し示す矢印により示されたV-A型(MG26-1)およびV-A’(MG26-2)を示す。CRISPRアレイは、灰色の線で示されている。コンティグ中の各タンパク質の予測ドメインはボックスにより示されている。 図7Bは、V-A型およびこれに関連するV-A’エフェクターを表す。図7Bは、V-A’型MG26-2およびAsCas12a参照配列の配列アラインメントを示す。最上部:RuvC-Iドメイン。中央:RuvC-IおよびRuvC-II触媒残基を含有する領域。最下部:RuvC-III触媒残基を含有する領域。触媒残基は四角で示されている。 AacC2C1を有する三元複合体中のsgRNAおよび標的DNAの構造の概略図を表す(Yang,Hui,Pu Gao,Kanagalaghatta R.Rajashankar,and Dinshaw J.Patel.2016.’’PAM-Dependent Target DNA Recognition and Cleavage by C2c1 CRISPR-Cas Endonuclease.’’Cell 167(7):1814-28.e12を参照されたい。これは、その全体が参照により本明細書に組み込まれている)。 直線状プラスミドDNA、WT、野生型sgRNAのAacC2c1-介在性切断におけるsgRNAのR-ARドメインの変異または短縮化の効果を表す。sgRNA内の変異体ヌクレオチド(レーン1~5)は、左パネル中で強調されている。Δ15:15ntは、sgRNAのR-AR 1領域から欠失した。Δ12:12ntは、sgRNA J2/4 R-AR 1領域から除去されている(Liu,Liang,Peng Chen,Min Wang,Xueyan Li,Jiuyu Wang,Maolu Yin,and Yanli Wang.2017.’’C2c1-sgRNA Complex Structure Reveals RNA-Guided DNA Cleavage Mechanism.’’ Molecular Cell 65(2):310-22を参照されたい。これは、その全体が参照により本明細書に組み込まれている)。 図10Aは、CRISPR RNA(crRNA)構造がV-A型系間で保存されていることを表す。図10Aは、LbCpf1系における参照crRNA配列の折り畳み構造を示す。 図10Bは、CRISPR RNA(crRNA)構造がV-A型系間で保存されていることを表す。図10Bは、新規V-A型系に関連するCRISPRリピートの複数の配列アラインメントを示す。LbCpf1プロセシング部位は、黒色の線で示されている。 図10Cは、CRISPR RNA(crRNA)構造がV-A型系間で保存されていることを表す。図10Cは、代替的なステムループモチーフCCUGC[N3-4]GCAGGを有するMG61-2推定crRNAの折り畳み構造を示す。 図10Dは、CRISPR RNA(crRNA)構造がV-A型系間で保存されていることを表す。図10Dは、代替的なリピートモチーフ配列を有するCRISPRリピートの複数の配列アラインメントを示す。プロセシング部位およびループが示されている。 本明細書で使用されているガイドRNA(配列番号3608)の予測構造を表す。 本明細書に説明されているMG酵素の対応するsgRNA(時計回りに、配列番号3636、3637、3641、3640)の予測構造を表す。 本明細書に説明されているMG酵素の対応するsgRNA(時計回りに、配列番号3636、3637、3641、3640)の予測構造を表す。 本明細書に説明されているMG酵素の対応するsgRNA(時計回りに、配列番号3644、3645、3649、3648)の予測構造を表す。 本明細書に説明されているMG酵素の対応するsgRNA(時計回りに、配列番号3644、3645、3649、3648)の予測構造を表す。 本明細書に説明されているMG酵素の対応するsgRNA(時計回りに、配列番号3652、3653、3657、3656)の予測構造を表す。 本明細書に説明されているMG酵素の対応するsgRNA(時計回りに、配列番号3652、3653、3657、3656)の予測構造を表す。 本明細書に説明されているMG酵素の対応するsgRNA(時計回りに、配列番号3660、3661、3665、3664)の予測構造を表す。 本明細書に説明されているMG酵素の対応するsgRNA(時計回りに、配列番号3660、3661、3665、3664)の予測構造を表す。 本明細書に説明されているMG酵素の対応するsgRNA(時計回りに、配列番号3666、3667、3672、3671)の予測構造を表す。 本明細書に説明されているMG酵素の対応するsgRNA(時計回りに、配列番号3666、3667、3672、3671)の予測構造を表す。 図17Aは、様々なMGファミリーヌクレアーゼおよびそれらの対応するtracrRNAまたはsgRNA(実施例12で説明される)を含有するTXTL抽出物が存在した状態での、PAMベクターライブラリー切断の結果を示すアガロースゲルを表す。図17Aは、レーン1:ラダーを示す。バンドは、頂部から底部にかけて766、500、350、300、350、200、150、100、75、50であり、レーン2:28-1+MGcrRNAスペーサー1(配列番号141+3860)、レーン3:29-1+MGcrRNAスペーサー1(配列番号215+3860)、レーン4:30-1+MGcrRNAスペーサー1(配列番号226+3860)、レーン5:31-1+MGcrRNAスペーサー1(配列番号229+3860)、レーン6:32-1+MGcrRNAスペーサー1(配列番号261+3860)、レーン7:ラダーである。 図17Bは、様々なMGファミリーヌクレアーゼおよびそれらの対応するtracrRN図AまたはsgRNA(実施例12で説明される)を含有するTXTL抽出物が存在した状態での、PAMベクターライブラリー切断の結果を示すアガロースゲルを表す。図17Bは、レーン1:ラダー、レーン2:LbaCas12a+LbaCas12a crRNAスペーサー2、レーン3:LbaCas12a+MGcrRNAスペーサー2、レーン4:Apo 13-1、レーン5:28-1+MGcrRNAスペーサー2(配列番号141+3861)、レーン6:29-1+MGcrRNAスペーサー2(配列番号215+3861)、レーン7:30-1+MGcrRNAスペーサー2(配列番号226+3861)、レーン8:31-1+MGcrRNAスペーサー2(配列番号229+3861)、レーン9:32-1+MGcrRNAスペーサー2(配列番号261+3861)を示す。 図18A1は、本明細書に説明されているV-A型エフェクターが活性ヌクレアーゼであることを示している。図18A1は、本明細書に説明されている6ヌクレアーゼに関して決定されたPAM配列のseqLogoを表示する。 図18A2は、本明細書に説明されているV-A型エフェクターが活性ヌクレアーゼであることを示している。図18A2は、本明細書に説明されている6ヌクレアーゼに関して決定されたPAM配列のseqLogoを表示する。 図18Bは、本明細書に説明されているV-A型エフェクターが活性ヌクレアーゼであることを示している。図18Bは、活性ヌクレアーゼに関する挿入欠失編集の頻度から推測されたプラスミドトランスフェクション活性アッセイの箱ひげ図を表す。箱ひげ図の境界は、第1の四分位値および第3の四分位値を示す。平均値は「x」で示され、中央値は各箱内の中間線で表されている。 図18Cは、本明細書に説明されているV-A型エフェクターが活性ヌクレアーゼであることを示している。図18Cは、MG29-1およびAsCas12aの4個の標的部位でのプラスミドトランスフェクション編集頻度を示す。AsCas12aを用いて比較実験を1つ行った。 図18Dは、本明細書に説明されているV-A型エフェクターが活性ヌクレアーゼであることを示している。図18Dは、TTNまたはCCN PAMのうちいずれかを用いて14個の標的遺伝子座でのヌクレアーゼMG29-1に関するプラスミドおよびRNP編集活性を示す。 図18Eは、本明細書に説明されているV-A型エフェクターが活性ヌクレアーゼであることを示している。図18Eは、RNPトランスフェクションアッセイからのヌクレアーゼMG29-1の編集プロファイルを示す。AsCas12aを用いて比較実験を1つ行った。MG29-1に関する編集頻度およびプロファイル実験を2回反復して行った。線プロット(図18Cおよび図18D)は、標準偏差誤差線を1箇所有する平均編集頻度を示す。 ヒトゲノムの様々な位置を標的化する様々な異なる標的化配列を含有する対応するsgRNAとともに、実施例12で説明されているMG29-1コンストラクトを用いたHEK細胞のトランスフェクションにより生じた細胞における挿入欠失形成について表す。 本明細書に説明されている(実施例13に説明されている)NGSによって誘導された特異的なMGファミリー酵素のPAM配列のseqLogoを表示する。 本明細書に説明されているNGSによって誘導された特異的なMGファミリー酵素のPAM配列のseqLogoを表示する(頂部~底部、配列番号3865、3867、3872)。 本明細書に説明されているNGSによって誘導されたPAM配列のseqLogoを表示する(頂部~底部、配列番号3878、3879、3880、3881)。 本明細書に説明されているNGSによって誘導されたPAM配列のseqLogoを表示する(頂部~底部、配列番号3883、3884、3885)。 本明細書に説明されているNGSによって誘導されたPAM配列のseqLogoを表示する(配列番号3882)。 ヒトゲノムの様々な位置を標的化する様々な異なる標的化配列を含有する対応するsgRNAとともに、実施例14で説明されているMG31-1コンストラクトを用いたHEK細胞のトランスフェクションにより生じた細胞における挿入欠失形成を表す。 図26AはV-A型ヌクレアーゼの生化学的特徴を示す。図26Aは、ユニバーサルcrRNAに結合した場合、切断産物末端に結合されたアダプタを有する切断産物のPCRが、本明細書に説明されているヌクレアーゼとCpf1(ポジティブコントロール)の活性を示していることを示す。予測された切断産物バンドは矢印で標識した。 図26Bは、V-A型ヌクレアーゼの生化学的特徴を示す。図26Bは、天然crRNAに結合した場合、本明細書に説明されているヌクレアーゼの活性を示している、切断産物の末端に結合されたアダプタを有する切断産物のPCRを示す。切断産物バンドは矢印で示した。 図26Cは、V-A型ヌクレアーゼの生化学的特徴を示す。図26Cは、21または23nt後では切断の頻度がそれほど高くない、位置22の標的鎖における切断を示しているNGS切断部位の解析を示す。 図27Aは、本明細書に説明されているV-L型ヌクレアーゼの複数の配列アラインメントを表し、図27Aは、V-L型ヌクレアーゼに関する例示的な位置構成を示す。推定RuvC-IIIドメインを含有する領域は、薄灰色の長方形として示されている。推定RuvC触媒残基は、各配列上に小さな濃灰色の長方形として示されている。推定シングルガイドRNA結合配列は小さな白色長方形であり、切断可能な推定リン酸結合部位は、配列上の黒色長方形で示されており、標的配列中の切断可能なリン酸近傍の塩基スタッキングを破壊すると予想されている残基は、配列上の小さな中程度の灰色長方形で示されている。 図27Bは、本明細書に説明されているV-L型ヌクレアーゼの複数の配列アラインメントを表す。図27Bは、複数の配列アラインメントを示す。推定RuvC-IIIドメインを含有する領域は、薄灰色の長方形として示されている。推定RuvC触媒残基は、各配列上に小さな濃灰色の長方形として示されている。推定シングルガイドRNA結合配列は小さな白色長方形であり、切断可能な推定リン酸結合部位は、配列上の黒色長方形で示されており、標的配列中の切断可能なリン酸近傍の塩基スタッキングを破壊すると予想されている残基は、配列上の小さな中程度の灰色長方形で示されている。 エフェクターリピート構造とともに例示的な位置構成としてMG60を標識しているV-L型候補と、V型ファミリー中の酵素の位置を示している系統学的系譜を示す。 MG70と標識され得る、より小さなV型エフェクターの例を示す。 本明細書に説明されているMG70の特性情報を示す。V型ファミリーの酵素の位置を示す系統学的系譜とともに例示的な位置構成を表す。 本明細書に説明されているMG70の特性情報を示す。V型ファミリーの酵素の位置を示す系統学的系譜とともに例示的な位置構成を表す。 本明細書に説明されている小さなV型エフェクターMG81の別の例を示す。V型ファミリーの酵素の位置を示す系統学的系譜とともに例示的な位置構成を表す。 本明細書に説明されている小さなV型エフェクターMG81の別の例を示す。V型ファミリーの酵素の位置を示す系統学的系譜とともに例示的な位置構成を表す。 本明細書に同定されているV型エフェクターファミリー(例えば、MG20、MG60、MG70、その他)の個々の酵素の活性は、様々な異なる酵素長(例えば、400~1200AA)にわたり維持されている。薄色のドット(典型的)は活性酵素を示しているが、濃い色のドット(未知)は未試験酵素を示している。 本明細書に説明されているMGヌクレアーゼの配列保存を表す。黒線は、推定RuvC触媒残基を示している。 推定RuvC触媒残基(濃灰色の長方形)、切断可能なリン酸結合残基(黒色の長方形)、および切断可能なリン酸に隣接する塩基スタッキングを破壊すると予想されている残基(薄灰色の長方形)を含有する、本明細書に説明されているMGヌクレアーゼの領域の図33における複数の配列アラインメントの拡大版を表す。 推定RuvC触媒残基(濃灰色の長方形)、切断可能なリン酸結合残基(黒色の長方形)、および切断可能なリン酸に隣接する塩基スタッキングを破壊すると予測されている残基(薄灰色の長方形)を含有する、本明細書に説明されているMGヌクレアーゼの領域の図33における複数の配列アラインメントの拡大版を表す。 推定RuvC-IIIドメインおよび触媒残基を含有する、本明細書に説明されているMGヌクレアーゼの領域を表す。 推定シングルガイドRNA結合残基(配列上の白色の長方形)を含油するMGヌクレアーゼの領域を表す。 いくつかのMGV型ファミリーからの代表物の複数のタンパク質配列アラインメントを表す。ヌクレアーゼ活性に関与すると予想されるRuvCドメイン部分を含有する保存領域を示す。予想される触媒残基を強調している。 MG29-1遺伝子編集についてTRAC遺伝子座の検査を示す。棒グラフは、初代ヒトT細胞のTRAC遺伝子座を標的化する54個の別個のガイドRNAを用いてMG29-1をトランスフェクションすることで得られる挿入欠失の作成を示す。図中に表されている対応するガイドRNAは、配列番号4316~4423で同定されている。 TRACでのMG29-1編集の最適化を表す。棒グラフは、図39からの4つの最良な22ntのガイドRNA(9、19、25および35)でMG29-1を(示された濃度で)トランスフェクションすることで得られた挿入欠失の作成を示す。説明文:MG29-1 9はMG29-1エフェクター(配列番号215)およびガイド9(配列番号4378)であり、MG29-1 19はMG29-1エフェクター(配列番号215)およびガイド19(配列番号4388)であり、MG29-1 25はMG29-1エフェクター(配列番号215)およびガイド25(配列番号4394)であり、MG29-1 35はMG29-1エフェクター(配列番号215)およびガイド35(配列番号4404)である。 TRACでのMG29-1編集のための用量およびガイド長の最適化を表す。線グラフは、MG29-1およびガイドRNA#19(配列番号4388)またはガイドRNA#35(配列番号4404)のいずれかのトランスフェクションから得られた挿入欠失の作成を示す。3つの異なる用量のヌクレアーゼ/ガイドRNAが使用された。各用量に関して、6つの異なるガイド長、配列番号4388および4404の連続する1-ヌクレオチド3’短縮化を試験した。図39および図40で使用されたガイドは、この場合、22ntの長さのスペーサーを含有するガイドである。 TRACでの挿入欠失の生成と実施例22の実験におけるT細胞受容体発現の損失の相関関係を示す。 MG29-1切断により刺激されたTRACでの標的化された導入遺伝子の組込みを表す。AAV感染により導入遺伝子のドナーのみを受容した細胞は、TCR発現は維持したがCAR発現は欠損する。MG29-1 RNPでトランスフェクトされ、100,000vg(ベクターゲノム)のCAR導入遺伝子のドナーで感染した細胞は、TCR発現を失ったがCAR発現を得る。CAR-T含有ドナー配列(「AAV」)を含有するAAVのみ、MG29-1酵素およびsgRNA19を有するCAR-T含有ドナー配列(配列番号4388)を含有するAAV(22ヌクレオチドのスペーサーを含む「AAV+MG29-1-19-22」)、またはMG29-1酵素およびsgRNA35を有するCAR-T含有ドナー配列(配列番号4404)を含有するAAV(22ヌクレオチドのスペーサーを含む「AAV+MG29-1-35-22」)を用いてトランスフェクトされた細胞についてのCAR抗原結合対TCR発現のFACSプロットを示す。 造血幹細胞におけるTRACでのMG29-1遺伝子編集を示す。棒グラフは、モックトランスフェクトされた細胞と比較した、MG29-1-9-22(「MG29-1 9」、MG29-1+ガイドRNA#19)およびMG29-1-35-22(「MG29-1 35」、MG29-1+ガイドRNA#35)を用いたトランスフェクション後のTRACでの挿入欠失の作成の程度を示す。 細胞における遺伝子編集結果の解析に基づくMG29-1 PAMの改良を示す。5’-NTTN-3’ PAM配列を使用してガイドRNAを設計し、続いて得られた遺伝子編集活性に従って分類した。下線を引いた塩基(5’-近位N)の同一性を各区間に関して示す。10%を超える活性を有する全てのガイドはゲノムDNAのこの位置にTを有した。このことは、MG29-1 PAMが5’-TTTN-3’として最良に説明され得ることを示している。各区間に関して、この位置でのTの過剰な表面の統計学的有意性を示す。 MG29-1スペーサー配列の塩基組成に対する遺伝子編集活性の解析を表す。棒グラフは、GC含有量(%)と挿入欠失頻度との関係性を示す実験データを示す(「高」は50%超の挿入欠失(N=4)を意味し、「中間」は10~50%の挿入欠失(N=15)を意味し、「1%超」は1~5%の挿入欠失(N=12)を意味し、「1%未満」は1%未満の挿入欠失(N=82)を意味する)。 MG29-1スペーサー配列の塩基組成に対する遺伝子編集活性の解析を表す。棒グラフは、GC含有量(%)と挿入欠失頻度との関係性を示す実験データを示す(「高」は50%超の挿入欠失(N=4)を意味し、「中間」は10~50%の挿入欠失(N=15)を意味し、「1%超」は1~5%の挿入欠失(N=12)を意味し、「1%未満」は1%未満の挿入欠失(N=82)を意味する)。 MG29-1ガイドRNAの化学修飾を表す。棒グラフは、非修飾ガイドRNA(試料#1)に対するVEGF-A編集活性に関する、表7からの修飾の結果を示す。 様々に化学修飾したMG29-1 RNAの用量滴定を表す。棒グラフは、修飾パターン1、4、5、7および8を使用したガイドでRNPをトランスフェクションした後の挿入欠失の生成を示す。RNP用量は、126pmolのMG29-1および160pmolのガイドRNAまたは示した通りであった。総用量(A)、1/4(B)、1/8(C)、1/16(D)および1/32(E)。 様々に化学修飾したMG29-1 RNAの用量滴定を表す。棒グラフは、修飾パターン1、4、5、7および8を使用したガイドでRNPをトランスフェクションした後の挿入欠失の生成を示す。RNP用量は、126pmolのMG29-1および160pmolのガイドRNAまたは示した通りであった。総用量(A)、1/4(B)、1/8(C)、1/16(D)および1/32(E)。 pMG450のプラスミドマップ(lac誘導性tacプロモーター大腸菌 BL21発現ベクターにおけるMG29-1ヌクレアーゼタンパク質)を表す。 マウスのアルブミンイントロン1を標的化するガイドを有するspCas9と比較した場合の、スペーサーmAlb29-1-8(配列番号3999)を有するMG29-1の挿入欠失プロファイルを表す。 実施例29にあるように、次世代シーケンシング(解析されたおよそ15,000の総リード)により決定されたマウスのアルブミンイントロン1を標的化するガイドを有するMG29-1の代表的な挿入欠失プロファイルである。 実施例29にあるように、次世代シーケンシング(解析されたおよそ15,000の総リード)により決定されたマウスのアルブミンイントロン1を標的化するガイドを有するMG29-1の代表的な挿入欠失プロファイルである。 実施例29にあるように、RNPで核内遺伝子導入されたマウス肝細胞株Hepa1~6中のspCas9と比較した場合の、MG29-1の編集効率を示す。 図53Aは、野生型MG29-1と比較した場合、単一アミノ酸置換および二重アミノ酸置換を有するMG29-1バリアントの哺乳動物細胞における編集効率を示す。図53Aは、MG29-1 WTまたは変異体バージョンについて分類しているプラスミドでトランスフェクトされたHepa1~6細胞における編集効率を表す。 図53Bは、野生型MG29-1と比較した場合、単一アミノ酸置換および二重アミノ酸置換を有するMG29-1バリアントの哺乳動物細胞における編集効率を示す。図53Bは、様々な濃度でWTまたはS168RをコードするmRNAでトランスフェクトされたHepa1~6細胞における編集効率を表す。 図53Cは、野生型MG29-1と比較した場合、単一アミノ酸置換および二重アミノ酸置換を有するMG29-1バリアントの哺乳動物細胞における編集効率を示す。図53Cは、単一アミノ酸置換または二重アミノ酸置換を有するMG29-1のmRNA分類バージョンでトランスフェクトされたHepa1~6細胞における編集効率を表す。 図53Dは、野生型MG29-1と比較した場合、単一アミノ酸置換および二重アミノ酸置換を有するMG29-1バリアントの哺乳動物細胞における編集効率を示す。図53Dは、13個のガイドと組み合わせたS168Rに対し、MG29-1 WTでトランスフェクトされたHepa1~6細胞およびHEK293T細胞における編集効率を表す。12個のガイドは、表7のガイドに対応している。ガイド「35(TRAC)」は、ヒトTRAC遺伝子座を標的化するガイドである。 MG29-1ガイドmAlb29-1-8の予想された二次構造を示す。 哺乳動物細胞の細胞抽出物全体中のsgRNAの安定性に関するMG29-1 sgRNA配列の化学修飾の影響を示す。 図56Aは、MG29-1タンパク質、ガイドRNAおよび適切なテンプレートで実施されたインビトロ反応における、標的鎖上の切断部位を同定するシーケンシングの使用を示す。図56Aは、次世代シーケンシングで決定されるヌクレオチド中のPAMから切断位置の距離を示す。 図56Bは、MG29-1タンパク質、ガイドRNAおよび適切なテンプレートで実施されたインビトロ反応における、標的鎖上の切断部位を同定するシーケンシングの使用を示す。図56Bは、標的鎖上のMG29-1切断部位を定義するためのサンガー法シーケンシングの使用を示す。 図56Cは、MG29-1タンパク質、ガイドRNAおよび適切なテンプレートで実施されたインビトロ反応における、標的鎖上の切断部位を同定するシーケンシングの使用を示す。図56Cは、非ターゲット鎖上のMG29-1切断部位を定義するためのサンガー法シーケンシングの使用を示す。両方の鎖の切断を評価するため、MG29-1、ガイドおよび適切なテンプレートを含有するインビトロ反応に転写産物サンガー法シーケンシングを実施した。標的鎖上の切断部位は位置23であり、21~23塩基での切断を示している図56AのNGSデータと一致している。配列末端における「A」ピークは、ポリメラーゼ転写産物によるものであり、予想されたものである。非ターゲット鎖上の切断部位を、予想されている終結塩基が「T」である逆方向リードにて見ることができる。印をつけたスポット(線)は、PAMからの位置17、続いて末端Tでの切断を示す。ただし、PAMからの位置18、19および20での混合Tシグナルが存在しており、これは位置17、18および19でのこの鎖上の様々な切断を示唆している。
配列表の簡単な説明
本明細書とともに提出される配列表は、本開示による方法、組成物および系で使用するための例示的なポリヌクレオチドおよびポリペプチド配列を提供する。以下は、本明細書中の配列の例示的な説明である。
MG11
配列番号1~37は、MG11ヌクレアーゼの全長ペプチド配列を示す。
配列番号3471は、MG11ヌクレアーゼによって機能するように設計されたcrRNAの5’直接リピートを示す。
配列番号3472~3538は、MG11ヌクレアーゼのエフェクターリピートモチーフを示す。
配列番号38~118は、MG13ヌクレアーゼの全長ペプチド配列を示す。
配列番号3540~3550は、MG13ヌクレアーゼのエフェクターリピートモチーフを示す。
MG19
配列番号119~124は、MG19ヌクレアーゼの全長ペプチド配列を示す。
配列番号3551~3558は、MG19ヌクレアーゼによって機能するように遺伝子操作されたsgRNAのヌクレオチド配列を示す。
配列番号3863~3866は、MG19ヌクレアーゼと適合するPAM配列を示す。
MG20
配列番号125は、MG20ヌクレアーゼの全長ペプチド配列を示す。
配列番号3559は、MG20ヌクレアーゼによって機能するように遺伝子操作されたsgRNAのヌクレオチド配列を示す。
配列番号3867は、MG20ヌクレアーゼと適合するPAM配列を示す。
MG26
配列番号126~140は、MG26ヌクレアーゼの全長ペプチド配列を示す。
配列番号3560~3572は、MG26ヌクレアーゼのエフェクターリピートモチーフを示す。
MG28
配列番号141~214は、MG28ヌクレアーゼの全長ペプチド配列を示す。
配列番号3573~3607は、MG28ヌクレアーゼのエフェクターリピートモチーフを示す。
配列番号3608~3609は、MG28ヌクレアーゼによって機能するように設計されたcrRNAの5’直接リピートを示す。
配列番号3868~3869は、MG28ヌクレアーゼと適合するPAM配列を示す。
MG29
配列番号215~225は、MG29ヌクレアーゼの全長ペプチド配列を示す。
配列番号3610~3611は、MG29ヌクレアーゼのエフェクターリピートモチーフを示す。
配列番号3612は、MG29ヌクレアーゼによって機能するように遺伝子操作されたsgRNAのヌクレオチド配列を示す。
配列番号3870~3872は、MG29ヌクレアーゼと適合するPAM配列を示す。
MG30
配列番号226~228は、MG30ヌクレアーゼの全長ペプチド配列を示す。
配列番号3613~3615は、MG30ヌクレアーゼのエフェクターリピートモチーフを示す。
配列番号3873は、MG30ヌクレアーゼと適合するPAM配列を示す。
MG31
配列番号229~260は、MG31ヌクレアーゼの全長ペプチド配列を示す。
配列番号3616~3632は、MG31ヌクレアーゼのエフェクターリピートモチーフを示す。
配列番号3874~3876は、MG31ヌクレアーゼと適合するPAM配列を示す。
MG32
配列番号261は、MG32ヌクレアーゼの全長ペプチド配列を示す。
配列番号3633~3634は、MG32ヌクレアーゼのエフェクターリピートモチーフを示す。
配列番号3876は、MG32ヌクレアーゼと適合するPAM配列を示す。
MG37
配列番号262~426は、MG37ヌクレアーゼの全長ペプチド配列を示す。
配列番号3635は、MG37ヌクレアーゼのエフェクターリピートモチーフを示す。
配列番号3636~3637、3640~3641、3644~3645、3648~3649、3652~3653、3656~3657、および3660~3661は、MG37ヌクレアーゼによって機能するように遺伝子操作されたsgRNAのヌクレオチド配列を示す。
配列番号3638、3642、3646、3650、3654、3658および3662は、上記MG37ヌクレアーゼと同一の遺伝子座から誘導されたMG37tracrRNAのヌクレオチド配列を示す。
配列番号3639、3643、3647、3651、3655および3659は、3’標的化配列またはスペーサー配列に5’を配置した場合、crRNAとして機能する天然MG37遺伝子座から誘導された5’直接リピート配列を示す。
MG53
配列番号427~428は、MG53ヌクレアーゼの全長ペプチド配列を示す。
配列番号3663は、3’標的化配列またはスペーサー配列に5’を配置した場合、crRNAとして機能する天然MG53遺伝子座から誘導された5’直接リピート配列を示す。
配列番号3664~3667は、MG53ヌクレアーゼによって機能するように遺伝子操作されたsgRNAのヌクレオチド配列を示す。
配列番号3668~3669は、上記MG53ヌクレアーゼと同一の遺伝子座から誘導されたMG53のtracrRNAのヌクレオチド配列を示す。
MG54
配列番号429~430は、MG54ヌクレアーゼの全長ペプチド配列を示す。
配列番号3670は、3’標的化配列またはスペーサー配列に5’を配置した場合にcrRNAとして機能する天然MG54遺伝子座から誘導された5’直接リピート配列を示す。
配列番号3671~3672は、MG54ヌクレアーゼによって機能するように遺伝子操作されたsgRNAのヌクレオチド配列を示す。
配列番号3673~3676は、上記MG54ヌクレアーゼと同一の遺伝子座から誘導されたMG54のtracrRNAのヌクレオチド配列を示す。
MG55
配列番号431~688は、MG55ヌクレアーゼの全長ペプチド配列を示す。
MG56
配列番号689~690は、MG56ヌクレアーゼの全長ペプチド配列を示す。
配列番号3678は、MG56ヌクレアーゼによって機能するように設計されたcrRNAの5’直接リピートを示す。
配列番号3679~3680は、MG56ヌクレアーゼのエフェクターリピートモチーフを示す。
MG57
配列番号691~721は、MG57ヌクレアーゼの全長ペプチド配列を示す。
配列番号3681~3694は、MG57ヌクレアーゼのエフェクターリピートモチーフを示す。
配列番号3695~3696は、MG57ヌクレアーゼによって機能するように遺伝子操作されたsgRNAのヌクレオチド配列を示す。
配列番号3879~3880は、MG57ヌクレアーゼと適合するPAM配列を示す。
MG58
配列番号722~779は、MG58ヌクレアーゼの全長ペプチド配列を示す。
配列番号3697~3711は、MG58ヌクレアーゼのエフェクターリピートモチーフを示す。
MG59
配列番号780~792は、MG59ヌクレアーゼの全長ペプチド配列を示す。
配列番号3712~3728は、MG59ヌクレアーゼのエフェクターリピートモチーフを示す。
配列番号3729~3730は、MG59ヌクレアーゼによって機能するように遺伝子操作されたsgRNAのヌクレオチド配列を示す。
配列番号3881~3882は、MG59ヌクレアーゼと適合するPAM配列を示す。
MG60
配列番号793~1163は、MG60ヌクレアーゼの全長ペプチド配列を示す。
配列番号3731~3733は、MG60ヌクレアーゼのエフェクターリピートモチーフを示す。
MG61
配列番号1164~1469は、MG61ヌクレアーゼの全長ペプチド配列を示す。
配列番号3734~3735は、MG61ヌクレアーゼによって機能するように設計されたcrRNAの5’直接リピートを示す。
配列番号3736~3847は、MG61ヌクレアーゼのエフェクターリピートモチーフを示す。
MG62
配列番号1470~1472は、MG62ヌクレアーゼの全長ペプチド配列を示す。
配列番号3848~3850は、MG62ヌクレアーゼのエフェクターリピートモチーフを示す。
MG70
配列番号1473~1514は、MG70ヌクレアーゼの全長ペプチド配列を示す。
MG75
配列番号1515~1710は、MG75ヌクレアーゼの全長ペプチド配列を示す。
MG77
配列番号1711~1712は、MG77ヌクレアーゼの全長ペプチド配列を示す。
配列番号3851~3852は、MG77ヌクレアーゼによって機能するように遺伝子操作されたsgRNAのヌクレオチド配列を示す。
配列番号3883~3884は、MG77ヌクレアーゼと適合するPAM配列を示す。
MG78
配列番号1713~1717は、MG78ヌクレアーゼの全長ペプチド配列を示す。
配列番号3853は、MG78ヌクレアーゼによって機能するように遺伝子操作されたsgRNAのヌクレオチド配列を示す。
配列番号3885は、MG78ヌクレアーゼと適合するPAM配列を示す。
MG79
配列番号1718~1722は、MG79ヌクレアーゼの全長ペプチド配列を示す。
配列番号3854~3857は、MG79ヌクレアーゼによって機能するように遺伝子操作されたsgRNAのヌクレオチド配列を示す。
配列番号3886~3889は、MG79ヌクレアーゼと適合するPAM配列を示す。
MG80
配列番号1723は、MG80ヌクレアーゼの全長ペプチド配列を示す。
MG81
配列番号1724~2654は、MG81ヌクレアーゼの全長ペプチド配列を示す。
MG82
配列番号2655~2657は、MG82ヌクレアーゼの全長ペプチド配列を示す。
MG83
配列番号2658~2659は、MG83ヌクレアーゼの全長ペプチド配列を示す。
MG84
配列番号2660~2677は、MG84ヌクレアーゼの全長ペプチド配列を示す。
MG85
配列番号2678~2680は、MG85ヌクレアーゼの全長ペプチド配列を示す。
MG90
配列番号2681~2809は、MG90ヌクレアーゼの全長ペプチド配列を示す。
MG91
配列番号2810~3470は、MG91ヌクレアーゼの全長ペプチド配列を示す。
スペーサーセグメント
配列番号3858~3861は、スペーサーセグメントのヌクレオチド配列を示す。
NLS
配列番号3938~3953は、本開示によるヌクレアーゼに付加され得る例示的な核局在化配列(NLS)の配列を示す。
本明細書には本発明の様々な実施形態が示され、説明されているが、かかる実施形態は例としてのみ提供されることは当業者には明らかとなるであろう。当業者にとっては、多数の変形、変更および置換が本明細書から逸脱することがない限りで行われる。本明細書に説明されている本発明の実施形態に対する様々な代替形態が利用され得ることを理解されたい。
本明細書に開示されているいくつかの方法の実践には、特段示さない限り、免疫学、生化学、化学、分子生物学、微生物学、細胞生物学、ゲノミクスおよび組換えDNAの技法を使用する。例えば、Sambrook and Green,Molecular Cloning:A Laboratory Manual,4th Edition(2012);the series Current Protocols in Molecular Biology(F.M.Ausubel,et al.eds.)、シリーズMethods In Enzymology(Academic Press,Inc.)、PCR 2:A Practical Approach(M.J.MacPherson,B.D.Hames and G.R.Taylor eds.(1995)),Harlow and Lane,eds.(1988)Antibodies,A Laboratory Manual,and Culture of Animal Cells:A Manual of Basic Technique and Specialized Applications,6th Edition(R.I.Freshney,ed.(2010))の例を参照されたい(これは、その全体が参照により本明細書に組み込まれている)。
本明細書で使用される場合、単数形「1つの(a)」、「1つの(an)」および「その(the)」は、特段明確に文脈で指示しない限り、複数形を含むことが意図されている。さらには、用語「含む(including)」、「含む(includes)」、「有する(having)」、「有する(has)」、「伴う(with)」またはその変形が詳細な説明および/または特許請求の範囲のいずれかで使用される限り、かかる用語は、用語「含む(comprising)」に類似の様式で包括的であることが意図されている。
用語「約(about)」または「およそ(approximately)」は、当業者によって決定される特定の値にとって許容される誤差範囲内を意味しており、どのように値が測定または決定されるか、すなわち測定系の制限に部分的に依存している。例えば当該技術分野での関連によれば、「約」は、1つまたは2つ以上の標準偏差内を意味し得る。代替的には、「約」は、所与の値の最大20%、最大15%、最大10%、最大5%、または最大1%の範囲を意味し得る。
本明細書で使用される場合、「細胞」は、生物学的細胞を一般に指す。細胞は、生物の基本的な構造的単位、機能的単位、および/または生物学的単位であってもよい。細胞は、1つ以上の細胞を有するいずれかの生物に由来し得る。いくつかの非限定的な例としては、原核生物細胞、真核生物細胞、細菌細胞、古細菌細胞、単細胞真核生物の細胞、原生生物細胞、植物(例えば、作物、果物、野菜、穀物、ダイズ、トウモロコシ(corn)、トウモロコシ(maize)、コムギ、種子、トマト、イネ、キャッサバ、サトウキビ、カボチャ、乾草、ジャガイモ、ワタ、カンナビス、タバコ、顕花植物、針葉樹、裸子植物、シダ、ヒカゲノカズラ、ツノゴケ、ゼニゴケ、コケ類)由来の細胞、藻類細胞(例えば、ボツリオコッカス・ブラウニー、クラミドモナス・レインハルディ、ナノクロロプシスガジタナ、クロレラ・ピレノイドサ、サルガッサム・パテンス・C.アガルドなど)、海藻(例えば、ケルプ)、真菌細胞(例えば、酵母細胞、キノコ由来の細胞)、動物細胞、無脊椎動物(例えば、ミバエ、刺胞動物、棘皮動物、線形動物など)由来の細胞、脊椎動物(例えば、魚類、両生類、爬虫類、鳥類、哺乳動物)由来の細胞、哺乳動物(例えば、ブタ、ウシ、ヤギ、ヒツジ、げっ歯類、ラット、マウス、非ヒト霊長類、ヒトなど)由来の細胞などが挙げられる。細胞は、天然の生物由来ではないことがある(例えば、細胞は合成的に作製され得るが、これは人工細胞と呼ばれることがある)。
本明細書で使用される場合、用語「ヌクレオチド」は、塩基-糖-リン酸の組合せを一般には指す。ヌクレオチドは、合成ヌクレオチドを含んでもよい。ヌクレオチドは、合成ヌクレオチド類似体を含んでもよい。ヌクレオチドは、核酸配列(例えば、デオキシリボ核酸(DNA)およびリボ核酸(RNA)の単量体単位であってもよい。用語ヌクレオチドは、リボヌクレオシド三リン酸、アデノシン三リン酸(adenosine triphosphate、ATP)、ウリジン三リン酸(uridine triphosphate、UTP)、シトシン三リン酸(cytosine triphosphate、CTP)、グアノシン三リン酸(guanosine triphosphate、GTP)およびdATP、dCTP、dITP、dUTP、dGTP、dTTPといったデオキシリボヌクレオシド三リン酸、またはこれらの誘導体を含んでもよい。かかる誘導体は、例えば[αS]dATP、7-デアザ-dGTPおよび7-デアザ-dATP、ならびにこうした誘導体を含有する核酸分子へのヌクレアーゼ耐性を与えるヌクレオチド誘導体を含んでもよい。本明細書で使用される場合、用語ヌクレオチドは、ジデオキシリボヌクレオシド三リン酸(dideoxyribonucleoside triphosphate、ddNTP)およびその誘導体を指すことがある。ジデオキシリボヌクレオシド三リン酸の実例としては、ddATP、ddCTP、ddGTP、ddITPおよびddTTPが挙げられるがこれらに限定されない。ヌクレオチドは、光学的に検出可能な部分(例えば、フルオロフォア)を含む部分を使用するなどして標識されなくてもよく、検出可能に標識されてもよい。標識はまた、量子ドットを用いて行われてもよい。検出可能な標識は例えば、放射性アイソトープ、蛍光標識、化学発光標識、生物発光標識、および酵素標識を含んでもよい。ヌクレオチドの蛍光標識としては、フルオレセイン、5-カルボキシフルオレセイン(FAM)、2’7’-ジメトキシ-4’5-ジクロロ-6-カルボキシフルオレセイン(JOE)、ローダミン、6-カルボキシローダミン(R6G)、N,N,N’、N’-テトラメチル-6-カルボキシローダミン(TAMRA)、6-カルボキシ-X-ローダミン(ROX)、4-(4’ジメチルアミノフェニルアゾ)安息香酸(DABCYL)、カスケードブルー、オレゴングリーン、テキサスレッド、シアニンおよび5-(2’-アミノエチル)アミノナフタレン-1-スルホン酸(EDANS)が挙げられてもよいが、これらに限定されない。蛍光標識されたヌクレオチドの特定例としては、Perkin Elmer(Foster City,Calif)から入手可能である[R6G]dUTP、[TAMRA]dUTP、[R110]dCTP、[R6G]dCTP、[TAMRA]dCTP、[JOE]ddATP、[R6G]ddATP、[FAM]ddCTP、[R110]ddCTP、[TAMRA]ddGTP、[ROX]ddTTP、[dR6G]ddATP、[dR110]ddCTP、[dTAMRA]ddGTP、および[dROX]ddTTP;Amersham(Arlington Heights,Il.)から入手可能であるFluoroLink DeoxyNucleotides、FluoroLink Cy3-dCTP、FluoroLink Cy5-dCTP、FluoroLink Fluor X-dCTP、FluoroLink Cy3-dUTPおよびFluoroLink Cy5-dUTP;Boehringer Mannheim(Indianapolis,Ind.)から入手可能であるFluorescein-15-dATP、Fluorescein-12-dUTP、Tetramethyl-rodamine-6-dUTP、IR770-9-dATP、Fluorescein-12-ddUTP、Fluorescein-12-UTP、およびFluorescein-15-2’-dATP;ならびにMolecular Probes(Eugene,Oreg)から入手可能である染色体標識ヌクレオチド、BODIPY-FL-14-UTP、BODIPY-FL-4-UTP、BODIPY-TMR-14-UTP、BODIPY-TMR-14-dUTP、BODIPY-TR-14-UTP、BODIPY-TR-14-dUTP、カスケードブルー-7-UTP、カスケードブルー-7-dUTP、フルオレセイン-12-UTP、フルオレセイン-12-dUTP、オレゴングリーン488-5-dUTP、ローダミングリーン-5-UTP、テトラメチルローダミン-5-dUTP、テトラメチルローダミン-6-UTP、テトラメチルローダミン-6-dUTP、テキサスレッド-5-UTP、テキサスレッド-5-dUTP、およびテキサスレッド-12-dUTPが挙げられ得る。ヌクレオチドはまた、化学修飾により標識またはマーキングされ得る。化学修飾された単一ヌクレオチドは、ビオチン-dNTPであり得る。ビオチン標識されたdNTPのいくつかの非限定的な例としては、ビオチン-dATP(例えば、ビオ-N6-ddATP、ビオチン-14-dATP)、ビオチン-dCTP(例えば、ビオチン-11-dCTP、ビオチン-14-dCTP)およびビオチン-dUTP(例えば、ビオチン-11-dUTP、ビオチン-16-dUTP、ビオチン-20-dUTP)が挙げられ得る。
用語「ポリヌクレオチド」、「オリゴヌクレオチド」、および「核酸」は、一本鎖形態、二本鎖形態、または多本鎖形態のいずれかで、任意の長さのヌクレオチド、デオキシリボヌクオチドもしくはリボヌクレオチドのいずれか、またはそれらの類似体の重合体形態を一般に指すために互換的に使用される。ポリヌクレオチドは、細胞に対して外因性または内因性であってもよい。ポリヌクレオチドは、セルフリー環境で存在してもよい。ポリヌクレオチドは、遺伝子またはそのフラグメントであってもよい。ポリヌクレオチドはDNAであってもよい。ポリヌクレオチドはRNAであってもよい。ポリヌクレオチドは任意の三次元構造を有してもよく、任意の機能を遂行してもよい。ポリヌクレオチドは、1つ以上の類似体(例えば、変性された主鎖、糖、またはヌクレオベース)を含んでもよい。存在する場合には、ヌクレオチド構造に対する修飾は、重合体の構築前後に付与されてもよい。類似体のいくつかの非限定的な例としては、5-ブロモウラシル、ペプチド核酸、異物核酸、モルフォリノ、ロックされた核酸、グリコール核酸、トレオース核酸、ジデオキシヌクレオチド、コーディセピン、7-デアザ-GTP、フルオロフォア(例えば、糖に結合されたローダミンまたはフルオレセイン)、チオール含有ヌクレオチド、ビオチン結合ヌクレオチド、蛍光塩基類似体、CpGアイランド、メチル-7-グアノシン、メチル化ヌクレオチド、イノシン、チオウリジン、プソイドウリジン、ジヒドロウリジン、キューオシン、およびワイオシンが挙げられる。ポリヌクレオチドの非限定的な例としては、遺伝子または遺伝子フラグメントのコード領域または非コード領域、連鎖解析により定義された遺伝子座(loci)(遺伝子座(locus))、エクソン、イントロン、メッセンジャーRNA(mRNA)、トランスファーRNA(tRNA)、リボソームRNA(rRNA)、短干渉RNA(siRNA)、小ヘアピンRNA(shRNA)、マイクロRNA(miRNA)、リボザイム、cDNA、組換えポリヌクレオチド、分枝ポリヌクレオチド、プラスミド、ベクター、任意の配列の単離されたDNA、任意の配列の単離されたRNA、セルフリーDNA(cfDNA)およびセルフリーRNA(cfRNA)を含むセルフリーポリヌクレオチド、核酸プローブ、ならびにプライマーが挙げられる。ヌクレオチドの配列は、非ヌクレオチド構成成分により中断されてもよい。
用語「トランスフェクション」または「トランスフェクトされた」は、非ウイルスまたはウイルスに基づいた方法による核酸の細胞への導入を一般には指す。核酸分子は、完全なタンパク質またはその機能部分をコードする遺伝子配列であってもよい。例えば、Sambrook et al.,1989,Molecular Cloning:A Laboratory Manual,18.1-18.88(これは、その全体が参照により本明細書に組み込まれている)を参照されたい。
用語「ペプチド」、「ポリペプチド」、および「タンパク質」は、本明細書では互換的に使用され、1つ以上のペプチド結合によって連結された少なくとも2つのアミノ酸残基の重合体を一般には指す。この用語は、重合体の特定の長さを暗示するものではなく、組換え技法、化学合成または酵素合成を使用してペプチドが産生されるかどうか、または天然に存在するかどうかを意味または区別しようと意図するものでもない。用語は、天然に存在するアミノ酸重合体、および少なくとも1つの修飾アミノ酸を含むアミノ酸重合体に適用する。いくつかの場合では、重合体は非アミノ酸により中断されてもよい。用語は、全長タンパク質、二次構造および/または三次構造(例えば、ドメイン)を有するタンパク質またはこれを有さないタンパク質を含む、任意の長さのアミノ酸鎖を含む。用語はまた、例えばジスルフィド結合の形成、グリコシル化、脂質修飾、アセチル化、リン酸化、酸化、および標識成分とのコンジュゲーションといった任意の他の操作により修飾されたアミノ酸重合体を包含する。本明細書で使用される場合、用語「アミノ酸」は、修飾アミノ酸およびアミノ酸類似体を含むがこれらに限定されない、天然アミノ酸および非天然アミノ酸を一般には指す。修飾アミノ酸は、アミノ酸に天然には存在しない基または化学部分を含むように化学修飾されている天然アミノ酸および非天然アミノ酸を含んでもよい。アミノ酸類似体は、アミノ酸誘導体を指してもよい。用語「アミノ酸」は、D-アミノ酸とL-アミノ酸の両方を含む。
本明細書で使用される場合、「非天然」は、天然の核酸またはタンパク質では見られない核酸またはポリペプチド配列を一般には指し得る。非天然は、アフィニティータグを指してもよい。非天然は、融合物を指してもよい。非天然は、変異、挿入、および/または欠失を含む天然に存在する核酸またはポリペプチド配列を指してもよい。非天然配列は、非天然配列が融合される核酸および/またはポリペプチド配列によっても示され得る活性(例えば、酵素活性、メチルトランスフェラーゼ活性、アセチルトランスフェラーゼ活性、キナーゼ活性、ユビキチン化活性など)を示し得る、および/またはこれをコードし得る。非天然核酸配列またはポリペプチド配列は、遺伝子操作により天然に存在する核酸配列またはポリペプチド配列(またはそのバリアント)に連結され、キメラ核酸配列、ならびに/またはキメラ核酸および/もしくはポリペプチドをコードするポリペプチド配列を生成してもよい。
本明細書で使用される場合、用語「プロモーター」は、遺伝子の転写または発現を制御し、かつRNA転写が開始するヌクレオチドまたはヌクレオチドの領域に隣接して配置され得る、またはこれらに重複し得る、調節DNA領域を一般には指す。プロモーターは、遺伝子転写につながるDNAへのRNAポリメラーゼの結合を推進させるタンパク質因子(多くの場合、転写因子と呼ばれる)に結合する特異的なDNA配列を含有し得る。「基本プロモーター」(「コアプロモーター」とも呼ばれる)は、動作可能に連結されたポリヌクレオチドの転写発現を促進するために基本的に必要な要素全てを含有するプロモーターを一般には指し得る。真核生物の基本プロモーターは、典型的には必ずしもそうとは限らないが、TATAボックスおよび/またはCAATボックスを含有する。
本明細書で使用される場合、用語「発現」は、核酸配列またはポリヌクレオチドがDNAテンプレート(例えば、mRNAまたは他のmRNA転写物など)から転写されるプロセス、および/または転写されたRNAがペプチド、ポリペプチド、またはタンパク質に続いて翻訳されるプロセスを一般には指す。転写物およびコードされたポリペプチドは、まとめて「遺伝子産物」と呼ばれてもよい。ポリヌクレオチドがゲノムDNAに由来する場合には、発現は真核生物細胞でのmRNAのスプライシングを含んでもよい。
本明細書で使用される場合、「動作可能に連結された」、「動作可能な結合」、「動作的に連結された」、または文法的なそれらの同等物は、例えばプロモーター、エンハンサー、ポリアデニル化配列などの遺伝要素の並置を一般には指す。この要素は、それらが予想される様式で動作するのを可能にする関係にある。例えば、プロモーターおよび/またはエンハンサー配列を含み得る調節要素は、これがコード配列の転写を開始するのを支援する場合には、コード領域に動作的に連結されている。この機能的関係が維持される限りは、調節要素とコード領域との間に介在残基が存在され得る。
本明細書で使用される場合、「ベクター」は、ポリヌクレオチドを含む、またはポリヌクレオチドと会合し、ポリヌクレオチドの細胞への送達を媒介するために使用され得る高分子、または高分子の会合を一般には指す。ベクターの例としては、プラスミド、ウイルスベクター、リポソーム、および遺伝子送達ビヒクルが挙げられる。ベクターは、標的中での遺伝子発現を推進するために遺伝子に動作的に連結された、例えば調節要素といった遺伝要素を一般には含む。
本明細書で使用される場合、「発現カセット」および「核酸カセット」は、ともに発現される核酸配列もしくは要素、または発現のために動作可能に連結された核酸配列もしくは要素の組合せを指すため、互換的に一般には使用される。いくつかの場合では、発現カセットは、調節要素と発現のために動作可能に連結されている1つ以上の遺伝子との組合せを指す。
DNA配列またはタンパク質配列の「機能フラグメント」は、全長DNAまたはタンパク質配列の生物学的活性と実質的に同様の生物学的活性(機能的または構造的のいずれか)を保持するフラグメントを一般には指す。DNA配列の生物学的活性は、全長配列に起因することで知られている様式で発現に影響する能力であり得る。
本明細書で使用される場合、「遺伝子操作された」対象は、この対象がヒト介入によって修飾されたことを一般には示している。非限定的な例によれば、核酸はその配列を天然に存在しない配列に変化させることで修飾されてもよく、核酸は、結合産物が起源とする核酸中に存在しない機能を保持するように、これを天然では会合しない核酸に結合することで修飾されてもよく、遺伝子操作された核酸は、天然では存在しない配列とインビトロで合成してもよく、タンパク質はそのアミノ酸配列を天然には存在しない配列に変化させることで修飾されてもよく、遺伝子操作されたタンパク質が新規機能または特性を獲得してもよい。「遺伝子操作された」系は、少なくとも1つの遺伝子操作された構成成分を含む。
本明細書で使用される場合、「合成」および「人工」は、天然に存在するヒトタンパク質に対して低い配列同一性(例えば、50%未満の配列同一性、25%未満の配列同一性、10%未満の配列同一性、5%未満の配列同一性、1%未満の配列同一性)を有するそのタンパク質またはドメインを指すために互換的に一般には使用され得る。例えば、VPRおよびVP64ドメインは、合成トランス活性化ドメインである。
本明細書で使用される場合、用語「Cas12a」は、クラス2のV-A型Casエンドヌクレアーゼであり、(a)CRISPRアレイから転写後にヌクレアーゼ自体によってプロセシングされる比較的小さなガイドRNA(約42~44ヌクレオチド)を使用し、(b)DNAを切断し、ねじれ形の切断部位を残す、Casエンドヌクレアーゼのファミリーを一般には指す。酵素のこのファミリーのさらなる特徴は、例えばZetsche B,Heidenreich M,Mohanraju P,et al.Nat Biotechnol 2017;35:31-34,and Zetsche B,Gootenberg JS,Abudayyeh OO,et al.Cell 2015;163:759-771に見出すことができ、これは本明細書に参照により組み込まれている。
本明細書で使用される場合、「ガイド核酸」は、別の核酸にハイブリダイズし得る核酸を一般には指し得る。ガイド核酸はRNAであってもよい。ガイド核酸はDNAであってもよい。ガイド核酸は、部位特異的に核酸の配列に結合するようにプログラムされていてもよい。標的される核酸、または標的核酸はヌクレオチドを含んでもよい。ガイド核酸はヌクレオチドを含んでもよい。標的核酸の一部は、ガイド核酸の一部に相補的であってもよい。ガイド核酸に相補的であり、これとハイブリダイズする二本鎖標的ポリヌクレオチド鎖は相補鎖と呼ばれてもよい。相補鎖に相補的であり、それによりガイド核酸に相補的でない可能性がある二本鎖標的ポリヌクレオチド鎖は、非相補鎖と呼ばれてもよい。ガイド核酸はポリヌクレオチド鎖を含んでもよく、「単一ガイド核酸」と呼ばれ得る。ガイド核酸は2本のポリヌクレオチド鎖を含んでもよく、「二重ガイド核酸」と呼ばれてもよい。特段明記しない限り、用語「ガイド核酸」は包括的な用語であり得、単一ガイド核酸と二重ガイド核酸の両方を指す。ガイド核酸は、「核酸標的セグメント」または「核酸標的化配列」もしくは「スペーサー配列」と呼ばれ得るセグメントを含んでもよい。核酸標的セグメントは、「タンパク質結合セグメント」または「タンパク質結合配列」または「Casタンパク質結合セグメント」と呼ばれ得るサブセグメントを含んでもよい。
2つ以上の核酸またはポリペプチド配列に関する用語「配列同一性」または「パーセント同一性」は、配列比較アルゴリズムを使用して測定する際、部分的な比較ウィンドウまたは全体的な比較ウィンドウにわたって最大一致させるために比較およびアラインメントさせた場合に、同一である、または特定の割合の同一であるアミノ酸残基もしくはヌクレオチドを有する2つ(例えば、ペアワイズアラインメントで)または複数(例えば、多重整列)の配列を一般には指す。ポリペプチド配列に好適な配列比較アルゴリズムとしては、例えば3のワード長(W)、10の期待値(E)のパラメータ、および11の存在、1の伸長でのギャップコストを設定しているBLOSUM62スコア行列を使用し、30残基より長いポリペプチド配列のための条件付き組合せスコア行列の調整を使用するBLASTP;2のワード長(W)、1000000の期待値(E)のパラメータ、および30残基未満の配列についてはギャップを開くためには9、ギャップを拡張するためには1のギャップコストを設定しているPAM30スコア行列(これらは、https://blast.ncbi.nlm.nih.govで入手可能であるBLASTスイートのBLASTP向けのデフォルトパラメータである)を使用するBLASTP;2の一致、-1の不一致、および-1のギャップを有するSmith-Watermanホモロジー検索アルゴリズムを有するCLUSTALW;デフォルトパラメータを用いるMUSCLE;2のretreeおよび1000の最大反復のパラメータを用いるMAFFT;デフォルトパラメータを用いるNovafold;デフォルトパラメータを用いるHMMERhmmアラインが挙げられる。
2つ以上の核酸またはポリペプチド配列に関する用語「最適にアラインメントされた」は、例えば最大または「最適化された」パーセント同一性スコアを生成するアラインメントにより決定される際には、アミノ酸残基またはヌクレオチドの最大一致にアラインメントされた2つ(例えば、ペアワイズアラインメントで)または複数(例えば、多重整列)の配列を一般には指す。
本開示には、1つ以上の保存的アミノ酸置換を有する本明細書に説明されている酵素のうちいずれかのバリアントが含まれる。かかる保存的置換基は、三次元構造またはポリペプチドの機能を破壊することなく、ポリペプチドのアミノ酸配列中で作製され得る。保存的置換基は、互いに同様の疎水性、極性およびR鎖長を有するアミノ酸を置換することで達成され得る。加えて、または代替的には、異なる種に由来する相同タンパク質のアラインメントされた配列を比較することで、コードされたタンパク質の基本機能を変性させることなく、種間で変異したアミノ酸残基(例えば、非保存残基)を配置することで保存置換基を同定することができる。こうした保存的に置換されたバリアントとしては、本明細書に説明されたエンドヌクレアーゼタンパク質配列のうちいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するバリアント(例えば、本明細書に説明されているMG11、MG13、MG26、MG28、MG29、MG30、MG31、MG32、MG37、MG53、MG54、MG55、MG56、MG57、MG58、MG59、MG60、MG61、MG62、MG70、MG82、MG83、MG84、またはMG85のファミリーエンドヌクレアーゼ、または本明細書に説明されている任意の他のファミリーヌクレアーゼ)が挙げられてもよい。いくつかの実施形態では、かかる保存的に置換されたバリアントは機能的バリアントである。かかる機能的バリアントは、エンドヌクレアーゼの1つ以上の重要な活性部位残基またはガイドRNA結合残基の活性が破壊されないような置換を有する配列を包含し得る。いくつかの実施形態では、本明細書に説明されているタンパク質のいずれかの機能的バリアントは、図17、図18、図10、図20、もしくは図25にコールアウトされた少なくとも1つの保存残基または機能残基、または表1Bに説明されている残基の置換を欠失している。いくつかの実施形態では、本明細書に説明されているタンパク質のいずれかの機能的バリアントは、図17、図18、図10、図20、もしくは図25にコールアウトされた全ての保存残基または機能残基、または表1Bに説明されている残基の置換を欠失している。
本開示にはまた、酵素の活性を減少または除去する1つ以上の触媒残基の置換を有する、本明細書に説明されている酵素のうちいずれかのバリアント(例えば、活性減少バリアント)が含まれる。いくつかの実施形態では、本明細書に説明されているタンパク質のような活性が減少したバリアントは、表1Bで同定された少なくとも1つ、少なくとも2つ、または3つ全ての触媒残基の破壊置換を含む。
機能的に類似するアミノ酸を提供する保存的置換基の表は、様々な参考文献から入手可能である(例えば、Creighton,Proteins:Structures and Molecular Properties(W H Freeman&Co.;2nd edition(December 1993)を参照されたい)。以下の8個の基はそれぞれ、互いに保存的置換基であるアミノ酸を含有する:
1)アラニン(A)、グリシン(G);
2)アスパラギン酸(D)、グルタミン酸(E);
3)アスパラギン(N)、グルタミン(Q);
4)アルギニン(R)、リジン(K);
5)イソロイシン(I)、ロイシン(L)、メチオニン(M)、バリン(V);
6)フェニルアラニン(F)、チロシン(Y)、トリプトファン(W);
7)セリン(S)、トレオニン(T);および
8)システイン(C)、メチオニン(M)
概要
類のない機能性および構造を有する新規Cas酵素の発見は、デオキシリボ核酸(DNA)編集技術をさらに破壊する潜在能力を提供し、速度、特異性、機能性および使いやすさを向上し得る。微生物のクラスター化され規則的に間隔があいた短い回文構造の繰り返し(CRISPR)系の予想有病率、および多種多様な微生物種に関しては、比較的機能的に特徴付けられているCRISPR/Cas酵素は文献中にはほぼ存在しない。膨大な数の微生物種は実験室の条件では容易に培養できない可能性があることが、部分的ではあるがこの理由である。多数の微生物種を含有する天然環境適所からのメタゲノムシーケンシングは、既知の新規CRISPR/Cas系の数を劇的に増加させ、新規オリゴヌクレオチド編集機能性の発見を加速度的に進行させる潜在能力を提供し得る。こうしたアプローチの有益性の最近の例は、2016年に発見された天然微生物の群集のメタゲノム解析からのCasX/CasY CRISPR系により実証されている。
CRISPR/Cas系は、微生物の適応免疫系として機能すると説明されているRNA依存性ヌクレアーゼ複合体である。通常、CRISPR/Cas系は、CRISPR(クラスター化され規則的に間隔があいた短い回文構造の繰り返し)オペロンまたは遺伝子座に生じる。これは2つの部分:(i)RNAベースの標的要素をコードする、等しく短いスペーサー配列で分離された短い反復配列のアレイ(30~40bp)と、(ii)アクセサリータンパク質/酵素に加えてRNAベースの標的要素によって向けられたヌクレアーゼポリペプチドをコードするCasをコードするORFと、を一般に含む。特定の標的核酸配列を標的化する有効なヌクレアーゼは、(i)第1の6~8核酸の標的(標的シード)とcrRNAガイド間の相補的なハイブリダイゼーションと、(ii)定義された標的シード近傍内でのプロトスペーサー隣接モチーフ(PAM)配列の存在と、の両方を一般には必要とする(PAMは通常、宿主ゲノム内では一般には表れない)。系の正確な機能および構成に応じて、CRISPR-Cas系は、共通する機能特性および進化的類似性に基づいて2つのクラス、5つの型、および16のサブタイプに一般には構成される(図1を参照されたい)。
クラスIのCRISPR-Cas系は大きなマルチサブユニットのエフェクター複合体を有し、I型、III型およびIV型を含む。クラスIIのCRISPR-Cas系は、単一ポリペプチドマルチドメインヌクレアーゼエフェクターを一般に有し、II型、V型およびVI型を含む。
II型のCRISPR-Cas系は、構成成分に関しては最も単純であると考えられる。II型のCRISPR-Cas系では、CRISPRアレイの成熟crRNAのプロセシングは、特別なエンドヌクレアーゼサブユニットの存在を必要としないが、むしろアレイリピート配列に相補的な領域を有する小さなトランスコードcrRNA(tracrRNA)を必要とする。このtracrRNAは、対応するエフェクターヌクレアーゼ(例えば、Cas9)とリピート配列の両方と相互作用して前駆体dsRNA構造を形成する。この構造は、内在性リボヌクレアーゼIIIで切断されて、tracrRNAとcrRNAの両方が添加された成熟エフェクター酵素を生成する。CasIIヌクレアーゼはDNAヌクレアーゼとして知られている。II型エフェクターは、RuvC様ヌクレアーゼドメインのフォールド内に挿入された無関係のHNHヌクレアーゼドメインを有するリボヌクレアーゼ Hフォールドを取り入れたRuvC様エンドヌクレアーゼドメインからなる構造を一般に示す。RuvC様ドメインは、標的(例えばcrRNAに相補的)DNA鎖の切断の原因となるが、HNHドメインは置換されたDNA鎖の切断の原因となる。
V型CRISPR-Cas系は、RuvC様ドメインを含む、II型エフェクターに類似するヌクレアーゼエフェクター(例えば、Cas12)構造により特徴付けられる。II型と同様に、大部分(ただし全てではない)のV型CRISPR系は、pre-crRNAを成熟crRNAにプロセシングするためにtracrRNAを使用する。ただし、このpre-crRNAを複数のcrRNAに切断するためにリボヌクレアーゼIIIを必要とするII型系とは異なり、V型系はpre-crRNAを切断するためにエフェクターヌクレアーゼ自体を使用することが可能である。II型のCRISPR-Cas系と同様に、V型CRISPR-Cas系はさらにDNAヌクレアーゼとして知られている。II型のCRISPR-Cas系とは異なり、いくつかのV型酵素(例えば、Cas12a)は、二本鎖標的配列の第1のcrRNA特異性切断により活性化される強力な一本鎖非特異的デオキシリボヌクレアーゼ活性を有することが明らかとなっている。
CRISPR-Cas系は、その標的能力および使いやすさから選択される遺伝子編集技術として、近年台頭してきた。最も一般的に使用される系は、クラス2のII型SpCas9およびクラス2のV-A型Cas12a(以前はCpf1)である。細胞における報告された特異性が他のヌクレアーゼよりも高く、オフターゲット作用がより少ないまたは全くないことから、特にV-A型系はさらに広く使用されるようになっている。V-A系はまた、ガイドRNAが小さく(SpCas9がおよそ100ntであるのと比較すると42~44ヌクレオチド)、CRISPRアレイによる転写後にヌクレアーゼ自体によってプロセシングされ、複数の遺伝子編集を伴う複合的な用途が単純化される。さらには、V-A系はねじれ形の切断部位を有する。これは、マイクロホモロジー依存性標的組込み(MITI)といった依存性修復経路を推進する。
最も一般的に使用されているV-A型酵素は、選択された標的部位である5’-TTTV-3’(ラクノスピラ・バクテリウム ND2006(LbCas12a)およびアシダミノコッカス種(AsCas12a)について)ならびに5’-TTV-3’(フランシセラ・ノビシダ(FnCas12a))に隣接する5’プロトスペーサー隣接モチーフ(PAM)を必要とする。相同分子種の近年の調査により、哺乳動物細胞の培養物(例えば、YTV、YYNまたはTTN)でも活性である、制限が少ないPAM配列を有するタンパク質が明らかとなった。ただし、これらの酵素はV-A生物多様性および標的能力を完全に包含するわけではなく、全ての可能な能力およびPAM配列の要件を表さない可能性がある。ここでは、V-A型ヌクレアーゼの多数のメタゲノムから数千のゲノムフラグメントを取り出した。V-A酵素の既知の多様性は拡張されている可能性があり、新規系は高度な標的化が可能であり、コンパクトかつ正確な遺伝子編集薬に発展している可能性がある。
MG酵素
V-A型CRISPR系は、様々なゲノム編集用途における使用に急速に採用されている。これらのプログラム可能なヌクレアーゼは、微生物の適応免疫系の一部であり、その天然での多様性は未だほぼ調査されていない。V-A型CRISPR酵素の新規ファミリーは、様々な複合環境から収集されたメタゲノムの大規模解析により同定され、これらの系の代表物が遺伝子編集プラットフォームに発展した。ヌクレアーゼは系統学的に多様であり(図4Aを参照されたい)、特定のモチーフを有するシングルガイドRNAを認識する。こうした系の大部分は未培養の生物に由来しており、そのいくつかは同一のCRISPRオペロン内に異なるV型エフェクターをコードする。生化学解析により、予想されていなかったPAM多様性が明らかとなった(図4Bを参照されたい)。これは、これらの系が様々なゲノム編集用途を推進させるであろうことを示している。ガイド配列の単純さおよびヒト細胞株における活性は、遺伝子治療および細胞治療における有用性を示唆している。
いくつかの態様では、本開示は新規V-L型候補を提供する(図27を参照されたい)。V-L型は新規サブタイプであり得、いくつかのサブタイプは同定され得る。これらのヌクレアーゼは、約1000~1100アミノ酸長である。V-L型は、V-A型エフェクターとして同一のCRISPR遺伝子座に見出すことができる。V-L候補について、RuvC触媒残基が同定され得、これらのV-L型候補はtracrRNAを必要としない可能性がある。V-L型の一例は、本明細書に説明されているMG60ヌクレアーゼである(図28および図32を参照されたい)。
いくつかの態様では、本開示はより小さなV型エフェクターを提供する(図30を参照されたい)。かかるエフェクターは小さな推定エフェクターであり得る。これらのエフェクターは送達を単純化し、治療用途を拡大し得る。
いくつかの態様では、本開示は新規V型エフェクターを提供する。こうしたエフェクターは、本明細書に説明されているMG70であり得る(図29を参照されたい)。MG70は約373アミノ酸長の超小型酵素であり得る。MG70は、N末端に単一のトランスポザーゼドメインを有し得、予想されるtracrRNAを有し得る(図30および図32を参照されたい)。
いくつかの態様では、本開示はより小さなV型エフェクターを提供する(図31を参照されたい)。こうしたエフェクターは、本明細書に説明されているMG81であり得る。MG81は約500~700アミノ酸長であり得、RuvC、およびHTH DNA結合ドメインを含有し得る。
一態様では、本開示は、メタゲノムシーケンシングにより発見された遺伝子操作されたヌクレアーゼ系を提供する。いくつかの場合では、メタゲノムシーケンシングは試料上で行われる。いくつかの場合では、試料は様々な環境から収集され得る。こうした環境はヒトマイクロバイオーム、動物のマイクロバイオーム、高温の環境、低温の環境であり得る。こうした環境は沈降物を含み得る。本明細書に説明されている遺伝子操作されたヌクレアーゼ系のこうした環境の種類の例は図2に見出すことができる。
一態様では、本開示は、(a)エンドヌクレアーゼを含む遺伝子操作されたヌクレアーゼ系を提供する。いくつかの場合では、エンドヌクレアーゼはCasエンドヌクレアーゼである。いくつかの場合では、エンドヌクレアーゼはクラス2のV型Casエンドヌクレアーゼである。いくつかの場合では、エンドヌクレアーゼはクラス2のV-A型Casエンドヌクレアーゼである。いくつかの場合では、エンドヌクレアーゼは未培養の微生物に由来する。エンドヌクレアーゼはRuvCドメインを含み得る。いくつかの場合では、遺伝子操作されたヌクレアーゼ系は(b)遺伝子操作されたガイドRNAを含む。いくつかの場合では、遺伝子操作されたガイドRNAはエンドヌクレアーゼと複合体を形成するように構成されている。いくつかの場合では、遺伝子操作されたガイドRNAはスペーサー配列を含む。いくつかの場合では、スペーサー配列は標的核酸配列にハイブリダイズするように構成されている。
一態様では、本開示は、(a)エンドヌクレアーゼを含む遺伝子操作されたヌクレアーゼ系を提供する。いくつかの場合では、エンドヌクレアーゼは配列番号1~3470のうちいずれか1つに対して少なくとも約70%の配列同一性を有する。いくつかの場合では、エンドヌクレアーゼは、配列番号1~3470のうちいずれか1つに対して少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する。
いくつかの場合では、エンドヌクレアーゼは、配列番号1~3470のうちいずれか1つに対して少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するバリアントを含む。いくつかの場合では、エンドヌクレアーゼは配列番号1~3470のうちいずれか1つに対して実質的に同一であり得る。
いくつかの場合では、遺伝子操作されたヌクレアーゼ系は遺伝子操作されたガイドRNAを含む。いくつかの場合では、遺伝子操作されたガイドRNAはエンドヌクレアーゼと複合体を形成するように構成されている。いくつかの場合では、遺伝子操作されたガイドRNAはスペーサー配列を含む。いくつかの場合では、スペーサー配列は標的核酸配列にハイブリダイズするように構成されている。
一態様では、本開示は(a)エンドヌクレアーゼを含む遺伝子操作されたヌクレアーゼ系を提供する。いくつかの場合では、エンドヌクレアーゼはプロトスペーサー隣接モチーフ(PAM)配列に結合するように構成されている。いくつかの場合では、PAM配列は配列番号3863~3913のうちいずれか1つに対して実質的に同一である。いくつかの場合では、PAM配列は配列番号3863~3913のうちいずれか1つである。いくつかの場合では、エンドヌクレアーゼはCasエンドヌクレアーゼである。いくつかの場合では、エンドヌクレアーゼはクラス2のCasエンドヌクレアーゼである。いくつかの場合では、エンドヌクレアーゼはクラス2のV型Casエンドヌクレアーゼである。いくつかの場合では、エンドヌクレアーゼはクラス2のV-A型Casエンドヌクレアーゼである。いくつかの場合では、遺伝子操作されたヌクレアーゼ系は(b)遺伝子操作されたガイドRNAを含む。いくつかの場合では、遺伝子操作されたガイドRNAはエンドヌクレアーゼと複合体を形成するように構成されている。いくつかの場合では、遺伝子操作されたガイドRNAはスペーサー配列を含む。いくつかの場合では、スペーサー配列は標的核酸配列にハイブリダイズするように構成されている。
いくつかの場合では、エンドヌクレアーゼはCpf1またはCms1エンドヌクレアーゼではない。いくつかの場合では、エンドヌクレアーゼはジンクフィンガー様ドメインをさらに含む。
いくつかの場合では、ガイドRNAは、配列番号3471、3539、3551~3559、3608~3609、3612、3636~3637、3640~3641、3644~3645、3648~3649、3652~3653、3656~3657、3660~3661、3664~3667、3671~3672、3677~3678、3695~3696、3729~3730、3734~3735または3851~3857の最初の19ヌクレオチドまたは非縮重ヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含む。いくつかの場合では、ガイドRNAは、配列番号3471、3539、3551~3559、3608~3609、3612、3636~3637、3640~3641、3644~3645、3648~3649、3652~3653、3656~3657、3660~3661、3664~3667、3671~3672、3677~3678、3695~3696、3729~3730、3734~3735、または3851~3857の最初の19ヌクレオチドまたは非縮重ヌクレオチドに対して少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含む。いくつかの場合では、ガイドRNAは、配列番号3471、3539、3551~3559、3608~3609、3612、3636~3637、3640~3641、3644~3645、3648~3649、3652~3653、3656~3657、3660~3661、3664~3667、3671~3672、3677~3678、3695~3696、3729~3730、3734~3735、または3851~3857の最初の19ヌクレオチドまたは非縮重ヌクレオチドに対して少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するバリアントを含む。いくつかの場合では、ガイドRNAは、配列番号3471、3539、3551~3559、3608~3609、3612、3636~3637、3640~3641、3644~3645、3648~3649、3652~3653、3656~3657、3660~3661、3664~3667、3671~3672、3677~3678、3695~3696、3729~3730、3734~3735、または3851~3857の最初の19ヌクレオチドまたは非縮重ヌクレオチドに対して実質的に同一である配列を含む。
いくつかの場合では、ガイドRNAは、配列番号3471、3539、3551~3559、3608~3609、3612、3636~3637、3640~3641、3644~3645、3648~3649、3652~3653、3656~3657、3660~3661、3664~3667、3671~3672、3677~3678、3695~3696、3729~3730、3734~3735、または3851~3857の最初の19ヌクレオチドまたは非縮重ヌクレオチドに対して少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含む。いくつかの場合では、エンドヌクレアーゼは遺伝子操作されたガイドRNAに結合するように構成されている。いくつかの場合では、Casエンドヌクレアーゼは遺伝子操作されたガイドRNAに結合するように構成されている。いくつかの場合では、クラス2のCasエンドヌクレアーゼは遺伝子操作されたガイドRNAに結合するように構成されている。いくつかの場合では、クラス2のV型Casエンドヌクレアーゼは遺伝子操作されたガイドRNAに結合するように構成されている。いくつかの場合では、クラス2のV-A型Casエンドヌクレアーゼは遺伝子操作されたガイドRNAに結合するように構成されている。
いくつかの場合では、エンドヌクレアーゼは、配列番号3863~3913のうちいずれか1つを含むプロトスペーサー隣接モチーフ(PAM)配列に結合するように構成されている。
いくつかの場合では、ガイドRNAは、真核生物、真菌、植物、哺乳動物またはヒトゲノムのポリヌクレオチド配列に相補的な配列を含む。いくつかの場合では、ガイドRNAは、真核生物ゲノムのポリヌクレオチド配列に相補的な配列を含む。いくつかの場合では、ガイドRNAは、真菌ゲノムのポリヌクレオチド配列に相補的な配列を含む。いくつかの場合では、ガイドRNAは、植物ゲノムのポリヌクレオチド配列に相補的な配列を含む。いくつかの場合では、ガイドRNAは、哺乳動物ゲノムのポリヌクレオチド配列に相補的な配列を含む。いくつかの場合では、ガイドRNAは、ヒトゲノムのポリヌクレオチド配列に相補的な配列を含む。
いくつかの場合では、ガイドRNAは30~250ヌクレオチド長である。いくつかの場合では、ガイドRNAは42~44ヌクレオチド長である。いくつかの場合では、ガイドRNAは42ヌクレオチド長である。いくつかの場合では、ガイドRNAは43ヌクレオチド長である。いくつかの場合では、ガイドRNAは44ヌクレオチド長である。いくつかの場合では、ガイドRNAは85~245ヌクレオチド長である。いくつかの場合では、ガイドRNAは90ヌクレオチド長超である。いくつかの場合では、ガイドRNAは245ヌクレオチド長未満である。
いくつかの場合では、エンドヌクレアーゼは1つ以上の核局在化配列(NLS)を有するバリアントを含み得る。NLSは、エンドヌクレアーゼのN末端またはC末端近傍であり得る。NLSは、配列番号3938~3953のうちいずれか1つの、または配列番号3938~3953のうちいずれか1つに対して少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の同一性を有するバリアントのN末端またはC末端に付加され得る。いくつかの場合では、NLSは、配列番号3938~3953のうちいずれか1つに対して実質的に同一の配列を含み得る。
Figure 2023517041000002
いくつかの場合では、遺伝子操作されたヌクレアーゼ系は一本鎖または二本鎖DNA修復テンプレートをさらに含む。いくつかの場合では、遺伝子操作されたヌクレアーゼ系は一本鎖DNA修復テンプレートをさらに含む。いくつかの場合では、遺伝子操作されたヌクレアーゼ系は二本鎖DNA修復テンプレートをさらに含む。いくつかの場合では、一本鎖または二本鎖DNA修復テンプレートは、5’~3’で、すなわち当該標的デオキシリボ核酸配列に対して5’で少なくとも20ヌクレオチドの配列を含む第1のホモロジーアームと、少なくとも10ヌクレオチドの合成DNA配列と、当該標的配列に対して3’で少なくとも20ヌクレオチドの配列を含む第2のホモロジーアームと、をさらに含み得る。
いくつかの場合では、第1のホモロジーアームは、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも110、少なくとも120、少なくとも130、少なくとも140、少なくとも150、少なくとも175、少なくとも200、少なくとも250、少なくとも300、少なくとも400、少なくとも500、少なくとも750、または少なくとも1000ヌクレオチドの配列を含む。いくつかの場合では、第2のホモロジーアームは、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも110、少なくとも120、少なくとも130、少なくとも140、少なくとも150、少なくとも175、少なくとも200、少なくとも250、少なくとも300、少なくとも400、少なくとも500、少なくとも750、または少なくとも1000ヌクレオチドの配列を含む。
いくつかの場合では、第1のホモロジーアームまたは第2のホモロジーアームは、原核生物のゲノム配列に相同である。いくつかの場合では、第1のホモロジーアームまたは第2のホモロジーアームは、細菌のゲノム配列に相同である。いくつかの場合では、第1のホモロジーアームまたは第2のホモロジーアームは、真菌のゲノム配列に相同である。いくつかの場合では、第1のホモロジーアームまたは第2のホモロジーアームは、真核生物のゲノム配列に相同である。
いくつかの場合では、遺伝子操作されたヌクレアーゼ系はDNA修復テンプレートをさらに含む。DNA修復テンプレートは、二本鎖DNAセグメントを含み得る。二本鎖DNAセグメントは、1つの一本鎖DNAセグメントと隣接し得る。二本鎖DNAセグメントは、2つの一本鎖DNAセグメントと隣接し得る。いくつかの場合では、一本鎖DNAセグメントは二本鎖DNAセグメントの5’末端にコンジュゲートされている。いくつかの場合では、一本鎖DNAセグメントは二本鎖DNAセグメントの3’末端にコンジュゲートされている。
いくつかの場合では、一本鎖DNAセグメントは1~15ヌクレオチド塩基の長さを有する。いくつかの場合では、一本鎖DNAセグメントは4~10ヌクレオチド塩基の長さを有する。いくつかの場合では、一本鎖DNAセグメントは4ヌクレオチド塩基の長さを有する。いくつかの場合では、一本鎖DNAセグメントは5ヌクレオチド塩基の長さを有する。いくつかの場合では、一本鎖DNAセグメントは6ヌクレオチド塩基の長さを有する。いくつかの場合では、一本鎖DNAセグメントは7ヌクレオチド塩基の長さを有する。いくつかの場合では、一本鎖DNAセグメントは8ヌクレオチド塩基の長さを有する。いくつかの場合では、一本鎖DNAセグメントは9ヌクレオチド塩基の長さを有する。いくつかの場合では、一本鎖DNAセグメントは10ヌクレオチド塩基の長さを有する。
いくつかの場合では、一本鎖DNAセグメントはスペーサー配列内の配列に相補的なヌクレオチド配列を有する。いくつかの場合では、二本鎖DNA配列は、バーコード、オープンリーディングフレーム、エンハンサー、プロモーター、タンパク質コード配列、miRNAコード配列、RNAコード配列、または導入遺伝子を含む。
いくつかの場合では、遺伝子操作されたヌクレアーゼ系はMg2+の源をさらに含む。
いくつかの場合では、ガイドRNAは少なくとも8塩基対のリボヌクレオチドを含むヘアピンを含む。いくつかの場合では、ガイドRNAは少なくとも9塩基対のリボヌクレオチドを含むヘアピンを含む。いくつかの場合では、ガイドRNAは少なくとも10塩基対のリボヌクレオチドを含むヘアピンを含む。いくつかの場合では、ガイドRNAは少なくとも11塩基対のリボヌクレオチドを含むヘアピンを含む。いくつかの場合では、ガイドRNAは少なくとも12塩基対のリボヌクレオチドを含むヘアピンを含む。
いくつかの場合では、エンドヌクレアーゼは、配列番号141、215、229、261もしくは1711~1721のうちいずれか1つのバリアント、141、215、229、261もしくは1711~1721のバリアントに対して少なくとも70%同一の配列、またはそのバリアントを含む。いくつかの場合では、エンドヌクレアーゼは、配列番号141、215、229、261、もしくは1711~1721のうちいずれか1つのバリアントに対して少なくとも75%同一の配列、またはそのバリアントを含む。いくつかの場合では、エンドヌクレアーゼは、配列番号141、215、229、261、もしくは1711~1721のうちいずれか1つのバリアントに対して少なくとも80%同一の配列、またはそのバリアントを含む。いくつかの場合では、エンドヌクレアーゼは、配列番号141、215、229、261、もしくは1711~1721のうちいずれか1つのバリアントに対して少なくとも85%同一の配列、またはそのバリアントを含む。いくつかの場合では、エンドヌクレアーゼは、配列番号141、215、229、261、もしくは1711~1721のうちいずれか1つのバリアントに対して少なくとも90%同一の配列、またはそのバリアントを含む。いくつかの場合では、エンドヌクレアーゼは、配列番号141、215、229、261、もしくは1711~1721のうちいずれか1つのバリアントに対して少なくとも95%同一の配列、またはそのバリアントを含む。
いくつかの場合では、ガイドRNA構造は、配列番号3608の最初の19ヌクレオチドまたは非縮重ヌクレオチドに対して少なくとも70%同一の配列を含む。いくつかの場合では、ガイドRNA構造は、配列番号3608の最初の19ヌクレオチドまたは非縮重ヌクレオチドに対して少なくとも75%同一の配列を含む。いくつかの場合では、ガイドRNA構造は、配列番号3608の最初の19ヌクレオチドまたは非縮重ヌクレオチドに対して少なくとも80%同一の配列を含む。いくつかの場合では、ガイドRNA構造は、配列番号3608の最初の19ヌクレオチドまたは非縮重ヌクレオチドに対して少なくとも85%同一の配列を含む。いくつかの場合では、ガイドRNA構造は、配列番号3608の最初の19ヌクレオチドまたは非縮重ヌクレオチドに対して少なくとも90%同一の配列を含む。いくつかの場合では、ガイドRNA構造は、配列番号3608の最初の19ヌクレオチドまたは非縮重ヌクレオチドに対して少なくとも95%同一の配列を含む。いくつかの場合では、エンドヌクレアーゼは配列番号3863~3913のうちいずれか1つを含むPAMに結合するように構成されている。
いくつかの場合では、配列は、Smith-Watermanホモロジー検索アルゴリズムパラメータを用いるBLASTP、CLUSTALW、MUSCLE、もしくはMAFFTアルゴリズム、またはCLUSTALWアルゴリズムによって決定され得る。配列同一性は、3のワード長(W)、10の期待値(E)のパラメータ、および11の存在、1の伸長でのギャップコストを設定しているBLOSUM62スコア行列を使用する、ならびに条件付き組合せスコア行列の調整を使用する、当該BLASTPホモロジー検索アルゴリズムによって決定されてもよい。
一態様では、本開示は(a)DNA標的セグメントを含む遺伝子操作されたガイドRNAを提供する。いくつかの場合では、DNA標的セグメントは、標的配列に相補的であるヌクレオチド配列を含む。いくつかの場合では、標的配列は標的DNA分子中にある。いくつかの場合では、遺伝子操作されたガイドRNAは(b)タンパク質結合セグメントを含む。いくつかの場合では、タンパク質結合セグメントは、ヌクレオチドの2つの相補的な並びを含む。いくつかの場合では、ヌクレオチドの2つの相補的な並びはハイブリダイズして二本鎖RNA(dsRNA)二重鎖を形成する。いくつかの場合では、ヌクレオチドの2つの相補的な並びは、介在性ヌクレオチドを用いて互いに共有結合されている。いくつかの場合では、遺伝子操作されたガイドリボ核酸ポリヌクレオチドは、エンドヌクレアーゼと複合体を形成することができる。いくつかの場合では、エンドヌクレアーゼは、配列番号1~3470のうちいずれか1つに対して少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する。いくつかの場合では、複合体は標的DNA分子の標的配列を標的化する。
いくつかの場合では、DNA標的セグメントは、ヌクレオチドの2つの相補的な並びの両方の3’に位置づけられている。いくつかの場合では、タンパク質結合セグメントは、配列番号3608の最初の19ヌクレオチドまたは非縮重ヌクレオチドに対して少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含む。
いくつかの場合では、二本鎖RNA(dsRNA)二重鎖は、少なくとも8リボヌクレオチドを含む。いくつかの場合では、二本鎖RNA(dsRNA)二重鎖は、少なくとも9リボヌクレオチドを含む。いくつかの場合では、二本鎖RNA(dsRNA)二重鎖は、少なくとも10リボヌクレオチドを含む。いくつかの場合では、二本鎖RNA(dsRNA)二重鎖は、少なくとも11リボヌクレオチドを含む。いくつかの場合では、二本鎖RNA(dsRNA)二重鎖は、少なくとも12リボヌクレオチドを含む。
いくつかの場合では、デオキシリボ核酸ポリヌクレオチドは遺伝子操作されたガイドリボ核酸ポリヌクレオチドをコードする。
一態様では、本開示は遺伝子操作された核酸配列を含む核酸を提供する。いくつかの場合では、遺伝子操作された核酸配列は生物での発現に最適化されている。いくつかの場合では、核酸はエンドヌクレアーゼをコードする。いくつかの場合では、エンドヌクレアーゼはCasエンドヌクレアーゼである。いくつかの場合では、エンドヌクレアーゼはクラス2のエンドヌクレアーゼである。いくつかの場合では、エンドヌクレアーゼはクラス2のV型Casエンドヌクレアーゼである。いくつかの場合では、エンドヌクレアーゼはクラス2のV-A型Casエンドヌクレアーゼである。いくつかの場合では、エンドヌクレアーゼは未培養の微生物に由来する。いくつかの場合では、生物は未培養の生物ではない。
いくつかの場合では、エンドヌクレアーゼは、配列番号1~3470のうちいずれか1つに対して少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の配列同一性を有するバリアントを含む。
いくつかの場合では、エンドヌクレアーゼは1つ以上の核局在化配列(NLS)を有するバリアントを含み得る。NLSは、エンドヌクレアーゼのN末端またはC末端近傍であり得る。NLSは、配列番号3938~3953のうちいずれか1つの、または配列番号3938~3953のうちいずれか1つに対して少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有するバリアントのN末端またはC末端に付加され得る。
いくつかの場合では、生物は原核生物である。いくつかの場合では、生物は細菌である。いくつかの場合では、生物は真核生物である。いくつかの場合では、生物は真菌である。いくつかの場合では、生物は植物である。いくつかの場合では、生物は哺乳動物である。いくつかの場合では、生物はげっ歯類である。いくつかの場合では、生物はヒトである。
一態様では、本開示は遺伝子操作されたベクターを提供する。いくつかの場合では、遺伝子操作されたベクターはエンドヌクレアーゼをコードする核酸配列を含む。いくつかの場合では、エンドヌクレアーゼはCasエンドヌクレアーゼである。いくつかの場合では、エンドヌクレアーゼはクラス2のCasエンドヌクレアーゼである。いくつかの場合では、エンドヌクレアーゼはクラス2のV型Casエンドヌクレアーゼである。いくつかの場合では、エンドヌクレアーゼはクラス2のV-A型Casエンドヌクレアーゼである。いくつかの場合では、エンドヌクレアーゼは未培養の微生物に由来する。
いくつかの場合では、遺伝子操作されたベクターは本明細書に説明されている核酸を含む。いくつかの場合では、本明細書に説明されている核酸は、本明細書に説明されているデオキシリボ核酸ポリヌクレオチドである。いくつかの場合では、ベクターはプラスミド、ミニサークル、CELiD、アデノ随伴ウイルス(AAV)由来のウイルス粒子、またはレンチウイルスである。
一態様では、本開示は本明細書に説明されているベクターを含む細胞を提供する。
一態様では、本開示はエンドヌクレアーゼを製造する方法を提供する。いくつかの場合では、方法は細胞を培養することを含む。
一態様では、本開示は、二本鎖デオキシリボ核酸ポリヌクレオチドを結合、切断、マーキングまたは修飾するための方法を提供する。この方法は、二本鎖デオキシリボ核酸ポリヌクレオチドをエンドヌクレアーゼと接触させることを含み得る。いくつかの場合では、エンドヌクレアーゼはCasエンドヌクレアーゼである。いくつかの場合では、エンドヌクレアーゼはクラス2のCasエンドヌクレアーゼである。いくつかの場合では、エンドヌクレアーゼはクラス2のV型Casエンドヌクレアーゼである。いくつかの場合では、エンドヌクレアーゼはクラス2のV-A型Casエンドヌクレアーゼである。いくつかの場合では、エンドヌクレアーゼは遺伝子操作されたガイドRNAを含む複合体中にある。いくつかの場合では、遺伝子操作されたガイドRNAはエンドヌクレアーゼに結合するように構成されている。いくつかの場合では、遺伝子操作されたガイドRNAは、二本鎖デオキシリボ核酸ポリヌクレオチドに結合するように構成されている。いくつかの場合では、遺伝子操作されたガイドRNAは、エンドヌクレアーゼおよび二本鎖デオキシリボ核酸ポリヌクレオチドに結合するように構成されている。いくつかの場合では、二本鎖デオキシリボ核酸ポリヌクレオチドはプロトスペーサー隣接モチーフ(PAM)を含む。いくつかの場合では、PAMは配列番号3863~3913のうちいずれか1つを含む配列を含む。
いくつかの場合では、二本鎖デオキシリボ核酸ポリヌクレオチドは、遺伝子操作されたガイドRNAの配列に相補的な配列を含む第1の鎖と、PAMを含む第2の鎖と、を含む。いくつかの場合では、PAMは、遺伝子操作されたガイドRNAの配列に相補的な配列の5’末端に直接隣接している。いくつかの場合では、エンドヌクレアーゼはCpf1エンドヌクレアーゼまたはCms1エンドヌクレアーゼではない。いくつかの場合では、エンドヌクレアーゼは未培養の微生物に由来する。いくつかの場合では、二本鎖デオキシリボ核酸ポリヌクレオチドは、真核生物、植物、真菌、哺乳動物、げっ歯類、またはヒトの二本鎖デオキシリボ核酸ポリヌクレオチドである。いくつかの場合では、PAM配列は配列番号3863~3913のうちいずれか1つを含む。
一態様では、本開示は標的核酸遺伝子座を修飾する方法を提供する。この方法は、本明細書に説明されている遺伝子操作されたヌクレアーゼ系を標的核酸遺伝子座に送達することを含み得る。いくつかの場合では、エンドヌクレアーゼは遺伝子操作されたガイドリボ核酸構造と複合体を形成するように構成されている。いくつかの場合では、標的核酸遺伝子座に複合体を結合する際に複合体が標的核酸遺伝子座を修飾するように複合体は構成されている。
いくつかの場合では、標的核酸遺伝子座を修飾することは、当該標的核酸遺伝子座を結合、標的核酸遺伝子座に切れ目をいれる、標的核酸遺伝子座を切断、または標的核酸遺伝子座をマーキングすることを含む。いくつかの場合では、標的核酸遺伝子座はデオキシリボ核酸(DNA)またはリボ核酸(RNA)を含む。いくつかの場合では、標的核酸はゲノムDNA、ウイルスDNA、ウイルスRNA、または細菌性DNAを含む。いくつかの場合では、標的核酸遺伝子座はインビトロである。いくつかの場合では、標的核酸遺伝子座は細胞内である。いくつかの場合では、細胞は原核生物細胞、細菌細胞、真核生物細胞、真菌細胞、植物細胞、動物細胞、哺乳動物細胞、げっ歯類細胞、霊長類細胞、またはヒト細胞である。
いくつかの場合では、遺伝子操作されたヌクレアーゼ系の標的核酸遺伝子座への送達は、本明細書に説明されている核酸または本明細書に説明されているベクターを送達することを含む。いくつかの場合では、遺伝子操作されたヌクレアーゼ系の標的核酸遺伝子座への送達は、エンドヌクレアーゼをコードするオープンリーディングフレームを含む核酸を送達することを含む。いくつかの場合では、核酸はプロモーターを含む。いくつかの場合では、エンドヌクレアーゼをコードするオープンリーディングフレームはプロモーターに動作可能に連結する。
いくつかの場合では、遺伝子操作されたヌクレアーゼ系の標的核酸遺伝子座への送達は、エンドヌクレアーゼをコードするオープンリーディングフレームを含有するキャップされたmRNAを送達することを含む。いくつかの場合では、遺伝子操作されたヌクレアーゼ系の標的核酸遺伝子座への送達は、翻訳されたポリペプチドを送達することを含む。いくつかの場合では、遺伝子操作されたヌクレアーゼ系の標的核酸遺伝子座への送達は、リボ核酸(RNA)pol IIIプロモーターに動作可能に連結された遺伝子操作されたガイドRNAをコードするデオキシリボ核酸(DNA)を送達することを含む。
いくつかの場合では、エンドヌクレアーゼは、標的遺伝子座でまたは標的遺伝子座近傍で一本鎖切断または二本鎖切断を誘導する。いくつかの場合では、エンドヌクレアーゼは当該標的遺伝子座内で、または当該標的遺伝子座に対して3’でねじれ形の一本鎖切断を誘導する。
いくつかの場合では、エフェクターリピートモチーフを使用し、MGヌクレアーゼのガイド設計を周知する。例えば、V-A型系のプロセシングされたgRNAは、CRISPRリピートの最終20~22ヌクレオチドからなる。この配列は、(スペーサーとともに)crRNAに合成されてもよく、考えられる標的のライブラリー上で切断するために、合成されたヌクレアーゼとともにインビトロで試験されてもよい。この方法を使用し、PAMが決定され得る。いくつかの場合では、V-A型酵素は「ユニバーサル」gRNAを使用し得る。いくつかの場合では、V型酵素は類のないgRNAを必要とし得る。
本開示の系は、例えば核酸の編集(例えば、遺伝子編集)、核酸分子への結合(例えば、配列特異的結合)などの様々な用途のために使用され得る。こうした系は例えば、対象に疾患を引き起こす可能性がある遺伝的に受け継がれた変異に対処(例えば、除去または置換)し、細胞におけるその機能を確認する目的で遺伝子を失活させるために使用され得る。また、疾患により引き起こされる遺伝要素を検出する診断ツール(例えば、逆転写ウイルスRNAまたは疾患により引き起こされる変異をコードする増幅DNA配列の切断による)として、特異的なヌクレオチド配列(例えば、細菌へと微生物耐性をコードする配列)を標的化および検出するため、プローブと組み合わせた不活化酵素としても使用され得る。さらには、ウイルスゲノムを標的化することでウイルスを不活性化する、またはウイルスの宿主細胞への感染を不可能なものとするために、遺伝子の追加または代謝経路の修正を行い、生物を遺伝子操作して有用な小分子、高分子または二次代謝産物を産生するために、進化的選択のために遺伝子ドライブ要素を確立するために、バイオセンサとして外来の小分子およびヌクレオチドにより細胞の摂動を検出するためにも使用され得る。
実施例1 新規タンパク質のためのメタゲノム解析の方法
沈降物、土壌および動物からメタゲノム試料を収集した。Zymobiomics DNAミニプレップキットを用いてデオキシリボ核酸(DNA)を抽出し、Illumina HiSeq(登録商標)2500上で配列決定した。土地所有者の同意の下に試料を収集した。クラスIIのV型Casエフェクタータンパク質を含む既知のCasタンパク質配列に基づいて生成された隠れマルコフモデルを使用し、メタゲノム配列データを検索し、新規Casエフェクターを同定した(図2を参照されたい。これは、高熱試料などの試料型から同定された1ファミリーであるMG29で検出されたタンパク質の分布を示している)。この検索により同定された新規エフェクタータンパク質を既知のタンパク質にアラインメントし、可能性のある活性部位を同定した(図3を参照されたい。これは、様々な試料から同定された全てのMG29ファミリーエフェクターは、RuvCI、RuvCII、およびRuvCIII触媒ドメインに由来する3つの触媒残基を有し、活性であると予想されることを示している)。このメタゲノムワークフローは、本明細書に説明されているMG11、MG13、MG19、MG20、MG26、MG28、MG29、MG30、MG31、MG32、MG37、MG53、MG54、MG55、MG56、MG57、MG58、MG59、MG60、MG61、MG62、MG70、MG75、MG77、MG78、MG79、MG80、MG81、MG82、MG83、MG84、MG85、MG90、およびMG91ファミリーの図をもたらした。エフェクタータンパク質をコードするゲノム遺伝子座に隣接するそれらの位置によって推定スペーサー配列を同定した。
実施例2 新規タンパク質のためのメタゲノム解析の方法
13個の動物のマイクロバイオーム、高温のバイオフィルムおよび沈降物試料を収集し、収集後に氷上またはZymo DNA/RNA Shield中に保存した。Qiagen DNeasy PowerSoilキットまたはZymoBIOMICS DNAミニプレップキットのいずれかを使用し、DNAを試料から抽出した。DNAシーケンシングライブラリーを構築し、400~800bpの標的挿入サイズの対の150bpリードを用いて(試料につき10GBのシーケンシングを標的化する)、UC BerkeleyのVincent J.Coates Genomics Sequencing LaboratoryにてIllumina HiSeq 4000またはNovaseq装置で配列決定を行った。NCBI SRAから、公的に利用可能であるメタゲノムシーケンシングデータをダウンロードした。BBMap(Bushnell B.,sourceforge.net/projects/bbmap/)を使用してシーケンシングリードを整え、Megahit 11を用いて組み立てた。Prodigalを用いてオープンリーディングフレームおよびタンパク質配列を予想した。既知のV-A型CRISPRヌクレアーゼのHMMプロファイルを作り、HMMER3(hmmer.org)を使用し、予想される全てのタンパク質に対してこれを検索し、考えられるエフェクターを同定した。組み立てられたコンティグ上のCRISPRアレイをMinced(https://github.com/ctSkennerton/minced)を用いて予想した。Kaijuを用いてタンパク質を分類に割り当て、全てのコードしたタンパク質が一致していることを見出すことでコンティグ分類を決定した。
MAFFTを用いて予想されるV型エフェクタータンパク質および参照(例えば、LbCas12a、AsCas12a、FnCas12a)エフェクタータンパク質をアラインメントし、FasTree2を使用して系統学的系譜を推測した。この試験から回収された配列から構成される系統群を同定することで、新規ファミリーを表した。ファミリー内から、可能な限り多くの系統学的多様性をサンプリングする様式では、実験室での解析(すなわち、CRISPRアレイを用いて良好に組み立てられ、注釈を付けたコンティグでこれらを見出した)に必要な構成成分を含有する場合には、候補を選択した。多様なファミリーに由来する小さなエフェクターに優先順位を付けた(すなわち、広範囲のタンパク質配列を共有する代表物を有するファミリー)。触媒残基およびPAM相互作用残基を同定するため、MUSCLEおよびClustal Wを使用し、選択された代表物および参照配列をアラインメントした。V-A型系であるTCTAC-N-GTAGA(1個~8個のN残基を含有する)に関連するモチーフについて、CRISPRアレイリピートを検索した。この解析から、代表的なCRISPRアレイがこれらのモチーフ配列のうち1つを含有する場合には、ファミリーをV-Aとして推定的に分類した。このデータセットを使用し、次にさらにファミリーを分類するために使用されるV-Aファミリーに関連するHMMプロファイルを同定した(図33~図37を参照されたい)。慣例ではコードする生物に基づいて新規Cas12ヌクレアーゼを命名するが、本明細書に説明されているヌクレアーゼに関してはこの命名を行うことが不可能である。したがって、慣例に最良の形で従うことを目的として、この系が組み立てたメタゲノムフラグメントに由来することを示すために接頭辞MGを用いて本明細書に説明されている系を命名する。
多様な環境(土壌性マイクロバイオーム、好熱性マイクロバイオーム、沈降物マイクロバイオーム、ヒトマイクロバイオームおよび非ヒトマイクロバイオーム)から、140,867Mbpの組み立てたメタゲノムシーケンシングデータを取り出した。全体では、119個のゲノムフラグメントは、CRISPRアレイに隣接するV-A型ヌクレアーゼと遠い関係にあるCRISPRエフェクターをコードした(図4Bを参照したい)。V-A型エフェクターを、互いに30%未満の平均ペアワイズアミノ酸同一性を参照する、および参照配列(例えば、LbCas12a、AsCas12a、FnCas12a)を有する14個の新規ファミリーに分類した。いくつかのエフェクターは、RuvCドメインおよびαヘリカル認識ドメイン、ならびにRuvCI/CII/CIIIドメインに由来する保存されたDEDヌクレアーゼ触媒残基(複数の配列アラインメント中で同定される、例えば以下の表1Aを参照されたい)を含有したが、これはこうしたエフェクターが活性ヌクレアーゼであることを示唆していた(図5~図7)。新規V-A型ヌクレアーゼは、サイズにして800未満から1,400アミノ酸長の範囲であり(図5Aを参照されたい)、それらの分類は、多様な門のアレイに及んでいた(図4Aを参照されたい)。これは、考えられる水平伝播を示唆している。
V-A型CRISPR系を保有するいくつかのゲノムフラグメントはまた、ここではV-A型プライム(V-A’、図7A)とも呼ばれる第2のエフェクターをコードしていた。例えば、V-A’型MG26-2は、V-A型MG26-1と16.6%のみのアミノ酸同一性を共有しているが、同一のCRISPR Casオペロンにこれをコードしており、MG26-1と同一のcrRNAを共有し得る(図7B)。ヌクレアーゼドメインは何ら予想されていないが、MG26-2は、複数の配列アラインメントにより同定された3つのRuvC触媒残基を含有した(図7B)。
Figure 2023517041000003
Figure 2023517041000004
実施例3 (一般プロトコール)PAM配列の同定/確認
crRNAおよびcrRNAのスペーサーに相補的な配列の5’末端に隣接して配置された8個のランダム化ヌクレオチドを有するプラスミドライブラリーを用いてインキュベートすることで、CRISPRエフェクターによりインビトロで切断され得るPAM配列を同定した。この8個のランダム化ヌクレオチドが機能的PAM配列を形成した場合、プラスミドを切断する。続いて、切断されたプラスミドの末端にアダプタを結合させることで機能的PAM配列を同定し、続いてアダプタを含むDNAフラグメントを配列決定した。大腸菌ライセートベースの発現系(myTXTL、Arbor Biosciences)で推定エンドヌクレアーゼを発現させた。T7プロモーターの制御下で、推定ヌクレアーゼをコードする大腸菌コドン最適化ヌクレオチド配列を転写し、PCRフラグメントからこれをインビトロで翻訳した。T7プロモーター、続いてリピート-スペーサー-リピート配列から構成された最小CRISPRアレイを有する第2のPCRフラグメントを同一の反応にて転写した。エンドヌクレアーゼおよびリピート-スペーサー-リピート配列を首尾よく発現させ、続いてCRISPRアレイプロセシングを行うことで、インビトロで活性であるCRISPRヌクレアーゼ複合体を提供した。
TXTL反応結果を用いて、8N(縮重)塩基(考えられるPAM配列)が先行する最小アレイ中のプラスミドとマッチングするスペーサー配列を含有する、標的プラスミドのライブラリーをインキュベートした。1~3時間後、この反応を停止し、DNAクリーンアップキット(例えば、Zymo DCC、AMPure XPビーズ、QiaQuickなど)によりDNAを回収した。エンドヌクレアーゼで切断された活性PAM配列を用いて、アダプタ配列を平滑断端でDNAフラグメントに結合した。一方、切断されなかったDNAは結合に関してはアクセス不可能であった。つづいで、ライブラリーおよびアダプタ配列に特異的なプライマーを用いて、PCRにより、活性PAM配列を含むDNAセグメントを増幅させた。PCR増幅産物をゲルに溶解し、切断現象に対応するアンプリコンを同定した。切断反応の増幅セグメントを、NGSライブラリーの調製用のテンプレートとして、またはサンガー法シーケンシング用の基質としても使用した。こうして得られた、出発8Nのライブラリーのサブセットであるライブラリーを配列決定することで、CRISPR複合体と適合するPAM活性を有する配列を明らかにした。プロセシングされたRNAコンストラクトを用いたPAM試験のため、プラスミドライブラリーとともにインビトロで転写されたRNAを添加し、最小CRISPRアレイテンプレートを省略したことを除き、同一の手順を繰り返した。こうしたアッセイで標的として以下の配列を使用した:CGTGAGCCACCACGTCGCAAGCCT(配列番号3860);GTCGAGGCTTGCGACGTGGTGGCT(配列番号3861);
GTCGAGGCTTGCGACGTGGTGGCT(配列番号3858);および
TGGAGATATCTTGAACCTTGCATC(配列番号3859)。
実施例4 本明細書に説明されているエンドヌクレアーゼ用のPAM配列の同定/確認
改良を加えた大腸菌ライセートベースの発現系(myTXTL、Arbor Biosciences)により、PAM要件を決定した。簡潔に言えば、29℃、16時間にわたってT7プロモーターの制御下で、大腸菌コドン最適化エフェクタータンパク質配列を発現させた。続いてこの粗タンパク質貯蔵物を、最終反応体積の20%の濃度にてインビトロでの消化反応に使用した。8N混合塩基が先行する定常標的配列からなる5nMのプラスミドライブラリー、およびNEB緩衝液2.1(New England Biolab;候補と市販のタンパク質とを比較するためにNEB緩衝液2.1を選択した)中で標的配列に相補的な配列に連結したエフェクターと同一のCRISPR遺伝子座から誘導された50nMのインビトロで転写されたcrRNAを用いて、37℃で3時間にわたってこの反応をインキュベートした。PAM発見アッセイではタンパク質濃度を正規化しなかった(PCR増幅シグナルは、低い発現または活性に対して高い感受性を提供する)。AMPure SPRIビーズ(Beckman Coulter)を用いてクリーンアップすることで、TXTL反応による切断産物を回収した。KlenowフラグメントおよびdNTP(New England Biolab)を加えることでDNAを平滑末端化した。100倍過剰な二本鎖アダプタ配列を用いて平滑断端産物を結合し、NGSライブラリーの調製用のテンプレートとして使用し、このライブラリーの配列解析からPAM要件を決定した。
20超のPhredクオリティスコアで生NGSリードをフィルタリングした。PAM近傍領域を発見するため、参照としてPAMに隣接する主鎖に由来する既知のDNA配列を表す28bpを使用し、8bp隣接部分を推定PAMとして同定した。各リードについて、PAMと結合アダプタとの間の距離もまた測定した。参照配列またはアダプタ配列に対し、完全な一致部分を有さないリードを除外した。最も頻度が高い切断部位±2bpを有するPAMのみが解析に含まれるように、切断部位頻度によりPAM配列をフィルタリングした。この補正により、粗大腸菌ライセートの使用により、ランダムな位置で生じる可能性がある低レベルのバックグラウンド切断を除去した。このフィルタリング工程は、候補タンパク質のシグナル対ノイズ比に応じて2%~40%のリードを除去することができる。この場合、活性が少ないタンパク質はバックグラウンドの多いシグナルを有する。参照であるMG29-1に関して、この工程では2%のリードをフィルタリングした。PAMのフィルタリングリストを使用し、Logomakerを使用して配列露後を生成した。これらのPAMの配列ロゴ表を図20~図24に示す。
実施例5 tracrRNA予想およびガイド設計
sgRNAおよび標的DNAに結合されたAacC2c1(Cas12b)の三元複合体の結晶構造により、R-AR二重鎖1とR-AR二重鎖2と表示される、結合されたsgRNAの2つの別個のリピート-アンチ-リピート(R-AR)が明らかになる(本明細書の図8および図9、ならびにYang,Hui,Pu Gao,Kanagalaghatta R.Rajashankar,and Dinshaw J.Patel.2016.’’PAM-Dependent Target DNA Recognition and Cleavage by C2c1 CRISPR-Cas Endonuclease.’’ Cell 167(7):1814-28.e12 and Liu,Liang,Peng Chen,Min Wang,Xueyan Li,Jiuyu Wang,Maolu Yin,and Yanli Wang.2017.’’C2c1-sgRNA Complex Structure Reveals RNA-Guided DNA Cleavage Mechanism.’’ Molecular Cell 65(2):310-22、そのそれぞれの全体が、参照により本明細書に組み込まれている)。天然CRISPRアレイの周囲のゲノム前後関係におけるアンチリピート配列を検索することで、本明細書に開示されているCRISPRエフェクターについての推定tracrRNA配列を同定した。この場合、R-AR二重鎖2アンチリピート配列は、R-AR二重鎖1アンチリピート配列(よりもtracrRNAの5’末端に近い)の約20~90ヌクレオチド上流に存在する。tracrRNA配列の同定後、各酵素について2つのガイド配列を設計した。第1のガイド配列は、R-AR二重鎖1および2(例えば、配列番号3636、3640、3644、3648、3652、3656、3660、3671および3672を参照されたい)の両方を含み、第2のガイド配列は、この領域が切断に必須ではない可能性があることから、R-AR二重鎖1領域が欠失した短いガイド配列(例えば、配列番号3637、3641、3645、3649、3653、3657、および3661)であった。
実施例6 予想されるRNAフォールディングのためのプロトコール
Andronescu 2007(これは、参照により本明細書に完全に組み込まれる)の方法を使用し、37℃でのRNA配列の予想されるRNAフォールディングを計算した。
実施例7 RNAガイドの同定
V-A型エフェクターおよびCRISPRアレイをコードしたコンティグについて、リピートの二次構造フォールディングは、新規V-A型系がシングルガイドcrRNA(sgRNA、図10)を必要とすることを示した。tracrRNA配列を確実に予想することはできなかった。sgRNAは、CRISPRリピートの3’末端からの約19~22ntを含有した。インビトロ活性について試験された6個のV-A型の候補からのCRISPRリピートの複数配列のアラインメントは、sgRNAのステムループ構造を形成するリピートの3’末端に高度に保存されたモチーフを示している(図10C)。このモチーフ(UCUAC[N3-5]GUAGAU)は、3~5個のヌクレオチド(ループ)により分離された短いパリンドロームリピート(ステム)からなる。
sgRNAモチーフの保存を使用し、分類されたV-A型ヌクレアーゼに対する類似性を示さない可能性がある新規エフェクターを明らかにした。69,117個のCRISPRアレイからのリピートでモチーフを検索した。最も一般的なモチーフは4-ヌクレオチドループを含有するが、3-ヌクレオチドループおよび5-ヌクレオチドループはそこまで一般的ではなかった(図12、図13、図14、図15および図16を参照されたい)。リピートモチーフを含有するCRISPRアレイを取り囲むゲノム前後関係の検査により、様々な長さのエフェクターが多数明らかになった。例えば、ファミリーMG57のエフェクターは、同定されたV-A型ヌクレアーゼのうち最大のもの(平均で約1400aa)であり、4bpのループを有するリピートをコードしていた。HMM解析から同定された別のファミリーは、異なるリピートモチーフ(CCUGC[N3-4]GCAGGを含有していた(図5C、5Dを参照されたい)。配列は異なるものの、構造は高度に類似するステムループ構造へと折り畳まれることが予想された。
実施例8 MG CRISPR複合体のインビトロ切断効率
プロテアーゼ欠損大腸菌B株における誘導性T7プロモーターからのHisタグ融合タンパク質として、エンドヌクレアーゼが発現される。超音波処理によってHisタグタンパク質を発現している細胞を溶解し、AKTA Avant FPLC(GE Lifescience)上でHisトラップFFカラム(GE Lifescience)でのNi-NTAアフィニティークロマトグラフィーによりHisタグタンパク質を精製した。アクリルアミドゲル(Bio-Rad)上でのSDS-PAGEにより溶出液を溶解し、InstantBlue Ultrafastクーマシー(Sigma-Aldrich)で染色する。ImageLabソフトウェア(Bio-Rad)を用いてタンパク質バンドのデンシトメトリーを使用し、純度を決定する。50mM トリス-HCl、300mM NaCl、1mM TCEP、5%のグリセロールから構成された精製されたエンドヌクレアーゼを保存緩衝液(pH7.5)中に透析し、-80℃で保存する。DNA合成により、スペーサー配列およびPAM配列(例えば、実施例3または実施例4のいずれかにあるように決定される)を含有する標的DNAを構築する。PAMが縮重塩基を有する場合、試験のため、単一の代表的なPAMが選択される。標的DNAは、PAMおよび一方の端から700bpに配置されたスペーサーを用いたPCR増幅により、プラスミドに由来する2200bpの直線状DNAから構成される。切断が成功すると、700bpおよび1500bpのフラグメントが生じる。標的DNA、インビトロで転写されたシングルRNA、および精製された組換えタンパク質を切断緩衝液(10mM トリス、100mM NaCl、10mM MgCl)中で過剰な量のタンパク質およびRNAと組み合わせ、5分~3時間(通常、1時間)にわたってインキュベートした。リボヌクレアーゼAを加え、60分間インキュベートすることで反応を停止する。続いて反応物を1.2%のTAEアガロースゲル上に溶解し、切断された標的DNAの画分をImageLabソフトウェアで定量する。
実施例9 大腸菌中でのMG CRISPR複合体のゲノム切断活性試験
大腸菌は、二本鎖DNA切断を効果的に修復する能力に欠いている。これにより、ゲノムDNAの切断は致命的な事象となる可能性がある。この現象を活用し、スペーサー/標的を有する標的株においてエンドヌクレアーゼおよびガイドRNA(例えば、実施例6にあるように決定される)を組換え発現させることで、大腸菌におけるエンドヌクレアーゼ活性を試験し、ゲノムDNAへと組み込まれたそのゲノムDNA(例えば、実施例4にあるように決定される)へと組み込まれたPAM配列を、エンドヌクレアーゼをコードするDNAを用いて形質転換させる。続いて形質転換体を化学的に形質転換受容性がある状態とし、標的配列に特異的な(「オンターゲット」)、または標的に非特異的である(「非ターゲット」)のいずれかである50ngのガイドRNA(例えば、crRNA)を用いてこれを形質転換する。ヒートショック後、37℃で2時間、SOC中で形質転換を回復させた。続いて、誘導媒体上で増殖させた5倍希釈系によりヌクレアーゼ効率を決定する。3回反復してコロニーを希釈系から定量した。オフターゲットガイドRNAを用いて形質転換されたコロニー数と比較してオンターゲットガイドRNAで形質転換されたコロニー数の減少は、エンドヌクレアーゼによる特異的なゲノム切断を示す。
実施例10 一般的手順:哺乳動物細胞におけるMG CRISPR複合体のゲノム切断活性の試験
2種類の哺乳動物発現ベクターを使用し、哺乳動物細胞における標的活性および切断活性を検出する。最初に、MG Casエフェクターを、C末端のSV40 NLSとGFPタグ(タンパク質の発現をモニタリングするための2A-GFPタグ)に連結されたウイルス性2A一致切断可能ペプチド配列に融合させる。次に、MG Casエフェクターを2つのSV40 NLS配列(一方はN末端、もう一方はC末端)に融合させる。NLS配列は、本明細書に説明されているNLS配列(例えば、配列番号3938~3953)のうちいずれかを含む。いくつかの例では、エンドヌクレアーゼをコードするヌクレオチド配列は、哺乳動物細胞での発現にコドン最適化されている。
哺乳動物の標的DNAに相補的な配列に融合されたcrRNA配列を有するシングルガイドRNAを、第2の哺乳動物の発現ベクターにクローニングする。2つのプラスミドは、HEK293T細胞へと同時トランスフェクトする。同時トランスフェクトの72時間後、形質転換HEK293T細胞からDNAを抽出し、NGSライブラリーの調製用にこれを使用する。哺乳動物細胞における酵素の標的効率を実証するため、標的部位における挿入欠失を定量することで、NHEJパーセントを測定する。少なくとも10個の異なる標的部位を選択し、各タンパク質の活性を試験する。
実施例11 哺乳動物細胞におけるMG CRISPR複合体のゲノム切断活性の試験
哺乳動物細胞における標的活性および切断活性を示すため、MG Casエフェクタータンパク質配列を、隣接するN末端およびC末端のSV40 NLS配列、C末端Hisタグ、およびHisタグ後のC末端における2A-GFP(例えば、GFPに連結されたウイルス性2A一致切断可能ペプチド配列)タグを有する哺乳動物発現ベクターにクローニングした(主鎖1)。いくつかの例では、エンドヌクレアーゼをコードするヌクレオチド配列は、大腸菌細胞での発現にコドン最適化されている、または哺乳動物細胞での発現にコドン最適化されている天然配列であった。
目的の遺伝子標的を有するシングルガイドRNA配列(sgRNA)もまた、哺乳動物の発現ベクターにクローニングした。2つのプラスミドは、HEK293T細胞へと同時トランスフェクトする。HEK293T細胞に発現プラスミドおよびsgRNA標的プラスミドを同時トランスフェクトした72時間後、DNAを抽出し、NGSライブラリーの調製用にこれを使用した。哺乳動物細胞における酵素の標的効率を実証するため、標的部位のシーケンシングにおける挿入欠失により、NHEJパーセントを測定する。各タンパク質の活性を試験するため、7~12個の異なる標的部位を選択した。5%の挿入欠失の任意の閾値を使用し、活性候補を同定した。パラメータ:切断オフセット=-4およびウィンドウ=10を使用し、CRISPRessoを用いたNGSリードから、ヒト細胞におけるゲノム編集効率を評価した。±1bp挿入欠失/変異、および2以上のbp欠失、挿入、および変異について、CRISPResso結果からの全ての切断後現象を合計した。予想されるアンプリコンにアラインメントされた全配列に対し、全ての結果を正規化した(図18を参照されたい)。
実施例12 MG29ファミリーの特性評価
PAM特異性、tracrRNA/sgRNA検証
実施例3および実施例8に説明されているmyTXTL系を使用し、MG29ファミリーのエンドヌクレアーゼ系の標的化されたエンドヌクレアーゼ活性を確認した。このアッセイでは、図17に示されるように、切断された標的プラスミドのPCR増幅により、ゲル中およそ170bpで移動する産物を得る。配列番号3609に対応するcrRNAを有するMG29-1に関して、増幅産物を観察した(図17A、レーン7を参照されたい)。PCR産物の配列決定により、以下の表2に示されるように、これらの酵素に関する活性PAM配列を明らかにした。
Figure 2023517041000005
Figure 2023517041000006
哺乳動物細胞における標的化されたエンドヌクレアーゼ活性
PAM YYn(配列番号3871)を有するゲノムにおける配置を試験するため、MG29-1標的遺伝子座を選択した。選択された標的部位に対応するスペーサーを、実施例9に説明されている哺乳動物ベクター系の主鎖1におけるsgRNA足場にクローニングした。
この部位は、以下の表3に列挙されている。様々な標的部位におけるMG29-1の活性を、表2および図19に示す。
Figure 2023517041000007
実施例13 NGSによる高複製PAM決定
実施例3および実施例8に説明されているように、myTXTLキットにおける大腸菌ライセートに基づく発現を使用し、V型エンドヌクレアーゼ(例えば、MG28、MG29、MG30、MG31エンドヌクレアーゼ)を切断活性について試験した。crRNA、および8個の縮重(「N」)塩基が先行するcrRNAとマッチングするスペーサーシーケンシングを含有するプラスミドライブラリー(5’PAMライブラリー)を用いてインキュベートする際には、機能的PAMを有するプラスミドライブラリーのサブセットを切断した。この切断部位への結合およびPCR増幅は、170bpでゲル中にて観察されたバンドにより実証された活性の証拠を提供した(図17B)。ゲル1(上部パネル、A)レーンは以下の通りである:1(ラダー、最も濃いバンドは200bpに対応する);2:ポジティブコントロール(予め検証されたライブラリー);3(n/a);4(n/a);5(MG28-1);6(MG29-1);7(MG30-1);8(MG31-1);9(MG32-1);および10(ラダー)。ゲル2(下部パネル、B)レーンは以下の通りである:1(ラダー、最も濃いバンドは200bpに対応する);2:(LbCpf1 ポジティブコントロール);3(LbCpf1 ポジティブコントロール);4(ネガティブコントロール);5(n/a);6(n/a);7(MG28-1);8(MG29-1);9(MG30-1);および10(MG31-1);11(MG32-1)。
PCR産物をさらにNGSシーケンシングに供し、PAMをseqLogo(例えば、Huber et al.Nat Methods.2015 Feb;12(2):115-21)表示に照らし合わせた(図20)。seqLogo表示は、位置0~7として標識されたスペーサーの上流(5’)である8bpを示している。図20に示されるように、PAMはピリミジンリッチであり(CおよびT)、大部分の配列要件はスペーサーの2~4bp上流である(SeqLogoでは位置4~6)。
MG候補のPAMを以下の表4に示す。
Figure 2023517041000008
いくつかの場合では、スペーサーに直接隣接する位置の優先度は弱い可能性がある(例えば、「n」の代わりには「m」または「v」)。
実施例14 MG31ヌクレアーゼを用いた哺乳動物細胞における標的化エンドヌクレアーゼ活性
哺乳動物細胞における標的化されたエンドヌクレアーゼ活性
PAM TTTR(配列番号3875)を有するゲノムにおける配置を試験するため、MG31-1標的遺伝子座を選択した。選択された標的部位に対応するスペーサーを、実施例11に説明されている哺乳動物ベクター系の主鎖1におけるsgRNA足場にクローニングした。
この部位は、以下の表5に列挙されている。様々な標的部位におけるMG31-1の活性を、表5および図25に示す。
Figure 2023517041000009
実施例15 インビトロ活性
この実施例に説明されているさらなる生化学解析のため、バイオインフォマティクス解析および予備のスクリーニングから有望な候補を選択した。保存された3’sgRNA構造を使用し、3’の20ntのCRISPRリピートおよび24ntスペーサーを含む「ユニバーサル」sgRNAを設計した(図10)。7個の試験された候補のうち、6個は8N PAMライブラリーに対してインビトロで活性を示した(図26A)。残りの不活性候補(30-1)は、予想される内在性の整えられたCRISPRリピート(配列番号3608、図26Bを参照されたい)を用いて試験した場合、活性を示したが、この候補はNGSライブラリーアッセイには含まれていない。(図26C)
同定されたPAMの大部分は、2~3塩基のチミンリッチ配列である(図18A)。ただし、MG26-1(PAM YYn)およびMG29-1(PAM YYn)といった2つの酵素は、ピリミジン塩基、チミンまたはシトシンのいずれかに対するPAM特異性を有しており、これらによってさらに広範な配列標的化が可能となった。推定PAM相互作用残基の解析は、活性のあるV-A型ヌクレアーゼが保存されたリジンおよびGWxxxKモチーフを含有することを示しており、FnCas12aにおいて異なるPAMの認識および異なるPAMとの相互作用では重要であることを示している。
発明者らによるPAM検出アッセイはPAM濃縮前に平滑断端フラグメントを生成するために結合を必要としていたが、このことは、これらの酵素が既に報告したV-A型ヌクレアーゼに類似しているねじれ形の二本鎖DNA切断を生成することを示唆していた。挿入欠失を検出するために使用されるNGSリードを解析することで標的鎖上の切断部位を同定することができ(図18B)、第22のPAM遠位塩基後の切断を示した。
切断産物を配列決定することで、MG29-1によるインビトロ切断をさらに調査した。標的鎖上の切断位置は、大部分の配列ではPAMから22ヌクレオチド離れており、21ヌクレオチドまたは23ヌクレオチドではそれほど頻度は高くなかった(図56)。非ターゲット鎖上における切断位置は、PAMから17~19ヌクレオチドである。組み合わせることで、これらの結果は3~5bpのオーバーハングを示す。
実施例16 ゲノム編集
PAMの確認後、遺伝子標的活性についてHEK293T細胞において、本明細書に説明されている新規タンパク質を試験した。10個の試験された標的遺伝子座のうち少なくとも1個において、全ての候補は5%を超えるNHEJの活性(バックグラウンド補正)を示した。MG29-1は、NHEJ修飾結果においては最も高い全体活性を示し、最大数の標的に関しては活性である(図18B)。ここから、このヌクレアーゼを、HEK293細胞での精製リボヌクレオタンパク質複合体(ribonucleoprotein、RNP)試験のために選択した。MG29-1ホロ酵素のRNPトランスフェクションは、9個の標的のうち4個の標的ではプラスミドベースのトランスフェクションよりも高い編集レベルを示し、いくつかの場合ではこの編集効率は80%を超えた(図18C)。MG29-1の編集プロファイルの解析は、このヌクレアーゼが、標的部位における他の種類の編集よりもさらに多い3以上のbpの欠失を生成することを示している(図18D)。いくつかの標的(5個~8個)では、MG29-1の挿入欠失頻度はAsCpf1の挿入欠失頻度の2倍である(図18E)。
実施例17 考察
様々な複合体環境から収集され、ファミリーに整理されたメタゲノムからV-A型CRISPRを同定した。これらの新規V-A型ヌクレアーゼは多様な配列とファミリー内およびファミリー全体の系統学的起源を有し、多様なPAM部位を有する標的を切断した。他のV-A型ヌクレアーゼ(例えば、LbCas12a、AsCas12a、FnCas12a)と同様に、本明細書に説明されているエフェクターは、シングルガイドCRISPR RNA(sgRNA)を利用してねじれ形のDNAの二本鎖切断を標的化し、ガイドの設計と合成を簡略化して多重編集を推進させる。crRNAのステムループ構造を形成するCRISPRリピートモチーフの解析は、本明細書に説明されているV-A型エフェクターが、より短いまたはより長いループよりもさらに多い4ntのループガイドを有することを示唆していた。16Cpf1の相同分子種について4ntのループも予め観察したが、LbCpf1のsgRNAモチーフは、あまり一般的ではない5ntを有する。V-A型エフェクターのMG61ファミリーについては、異常なステムループのCRISPRリピートリピートモチーフ配列であるCCUGC[N3-4]GCAGGを同定した。V-A型において様々なループ長を有するsgRNAの高度の保存は、本明細書に説明されているタンパク質について示されているように、柔軟なレベルの活性を提供し得る。まとめると、これらのエフェクターは既に研究された酵素に近い相同体ではなく、V-A型様sgRNAヌクレアーゼの多様性を大幅に拡大する。
本明細書に説明されているさらなるV型エフェクターは、Cas12aヌクレアーゼに隣接してコードされ得るV-A型プライムエフェクター(V-A’)とここでは呼ばれるV-A型様ヌクレアーゼの重複から創出され得る。V-A型系とこれらのV-A’型系の両方は、CRISPR sgRNAを共有している可能性があるが、V-A’型系はCas12aとは互いに異なっている(図4)。これらのプライムエフェクターに関連するCRISPRリピートはまた、UCUAC[N3-5]GUAGAUモチーフを有するシングルガイドcrRNAへと折り畳んだ。ある1つの報告ではV-A型ヌクレアーゼに隣接してコードされたV型cms1エフェクターを同定しているが、これは植物細胞における切断活性のためにシングルガイドcrRNAを必要とした。各エフェクターについて異なるCRISPRアレイを報告したが、本明細書に説明されているV-A’型系は、V-A型とV-A’型の両方がDNA標的化と切断のために同一のcrRNAを必要とし得ることを示唆した。Roizmanの細菌ゲノムに近年説明されているように(例えば、Chen et al.Front Microbiol.2019 May 3;10:928)、V-A型とV-A’型エフェクターの両方は、配列相同性解析および系統学解析に基づくと遠い関係にある。したがって、プライムエフェクターはV-A型分類内には属しておらず、別個のV型サブ分類であることが認められている。
活性V-A型ヌクレアーゼについて決定されたPAMは一般にチミンリッチであり、それ以外のV-A型ヌクレアーゼについて説明されている既に説明されたPAMに類似している。対照的に、MG29-1はさらに短いYYN PAM配列を必要としており、LbCpf1の4つのヌクレオチドTTTV PAMと比較すると、標的の柔軟性を増加させる。加えて、MG29-1を含有するRNPは、3ヌクレオチドPAMを有するsMbCas12aと比較すると、HEK293細胞においてさらに高い活性を有した。
インビトロ編集活性について新規ヌクレアーゼを試験する場合、MG29-1は、報告されているこのクラスの他の酵素に適合性またはさらに良好な活性を示した。Cas12a相同分子種を使用した、哺乳動物細胞におけるプラスミドのトランスフェクション編集効率についての報告は、TリッチPAMを有するガイドについては21%~26%の挿入欠失頻度を示し、CCN PAMを有する18ガイドのうち1つは、Mb3Cas12aにおいては約10%の活性を示した(モラクセラ・ボーボクリ AAX11_00205 Cas12a、例えばWang et al.Journal of Cell Science 2020 133:jcs240705を参照されたい)。特に、プラスミドのトランスフェクションにおけるMG29-1活性は、TTNおよびCCN PAMを有する標的のMb3Cas12aについて報告された活性よりも大きいことが明らかである(例えば、図18を参照されたい)。プラスミドトランスフェクションのための標的部位は全ての実験において同一のTTG PAMを有するため、編集効率の差は、異なる標的遺伝子でのゲノム利用性の差に起因し得る。RNPとしてのMG29-1編集は、プラスミドによるものよりもはるかに効率的であり、7つの標的遺伝子座のうち2つのAsCas12aよりも効率的である。したがって、MG29-1は高度に活性があり、かつ効率的な遺伝子編集ヌクレアーゼであり得る。これらの発見は、シングルガイドV-A型CRISPRヌクレアーゼの既知の多様性を増加させ、未培養の微生物からの新規酵素のゲノム編集における潜在能力を実証する。7個の新規ヌクレアーゼは、多様なPAM要件を伴うインビトロ活性を示し、RNPデータは、ヒト細胞株における治療に関連する標的については80%以上の編集効率を示した。これらの新規ヌクレアーゼによってCRISPR関連酵素のツールキットが拡大し、多様なゲノム編集の適用が可能となる。
実施例18 T細胞のTRAC遺伝子座のMG29-1の誘導による編集
当初予想されたMG29-1の5’-TTN-3’PAM優先度にマッチングする配列についてT細胞受容体α鎖定常領域(T cell receptor alpha chain constant region、TRACA)の3つのエクソンを走査し、固有のAlt-R修飾を有するシングルガイドRNAをIDTから注文した。全てのガイドスペーサー配列は22ntの長さであった。ガイド(80pmol)を精製MG29-1タンパク質(63pmol)と混合し、室温で15分間インキュベートした。ネガティブ選択を使用することで(Stemcell Technologies ヒトT細胞単離キット#17951)PBMCからT細胞を精製し、CD2/3/28ビーズ(Miltenyi T細胞活性化/増殖キット#130-091-441)により活性化させた。細胞増殖させた4日後、プログラムEO-115およびP3緩衝液を使用するLonza 4-D Nucleofectorを用いてMG29-1/ガイドRNA混合物のそれぞれを200,000個のT細胞中に電気穿孔した。トランスフェクションの72時間後に細胞を回収し、ゲノムDNAを単離した。TRACA遺伝子座を標的化するプライマーを使用し、ハイスループットDNAシーケンシングを使用する解析のためにPCR増幅した。NHEJベースの遺伝子編集に典型的な挿入および欠失の生成は、固有のPythonスクリプトを使用して定量した(図39を参照されたい)。
Figure 2023517041000010
Figure 2023517041000011
Figure 2023517041000012
Figure 2023517041000013
Figure 2023517041000014
Figure 2023517041000015
Figure 2023517041000016
Figure 2023517041000017
Figure 2023517041000018
Figure 2023517041000019
実施例19 MG29-1のリードガイドの再試験
MG29-1のためのリードガイドを再試験する実験を行った。5’-TTN-3’にマッチングする配列についてT細胞受容体α鎖定常領域の3つのエクソンを走査し、Alt-R修飾を使用するシングルガイドRNAをIDTから注文した。全てのガイドスペーサー配列は22ntの長さであった。ガイドを精製MG29-1タンパク質(80pmolのgRNA+63pmolのMG29-1;または160pmolのgRNA+126pmolのMG29-1)と混合し、室温で15分間インキュベートした。ネガティブ選択を使用することで(Stemcell Technologies ヒトT細胞単離キット#17951)PBMCからT細胞を精製し、CD2/3/28ビーズ(Miltenyi T細胞活性化/増殖キット#130-091-441)により活性化させた。細胞増殖させた4日後、プログラムEO-115およびP3緩衝液を使用するLonza 4-D Nucleofectorを用いてMG29-1/ガイドRNA混合物のそれぞれを200,000個のT細胞中に電気穿孔した。トランスフェクションの72時間後にゲノムDNAを回収し、ハイスループットDNAシーケンシングを使用する解析のためにPCR増幅した。NHEJベースの遺伝子編集に典型的な挿入および欠失の生成は、固有のPythonスクリプトを使用して定量した(図40を参照されたい)。
実施例20 MG29-1のガイドスペーサー長の試験
最適なガイドスペーサー長を決定するために実験を行った。5’-TTN-3’にマッチングする配列についてT細胞受容体α鎖定常領域の3つのエクソンを走査し、Alt-R修飾を使用するシングルガイドRNAをIDTから注文した。ガイドを精製MG29-1タンパク質(80pmolのgRNA+60pmolのエフェクター;160pmolのgRNA+120pmolのエフェクター;または320pmolのgRNA+240pmolのエフェクター)と混合し、室温で15分間インキュベートした。ネガティブ選択を使用することで(Stemcell Technologies ヒトT細胞単離キット#17951)PBMCからT細胞を精製し、CD2/3/28ビーズ(Miltenyi T細胞活性化/増殖キット#130-091-441)により活性化させた。細胞増殖させた4日後、プログラムEO-115およびP3緩衝液を使用するLonza 4-D Nucleofectorを用いてMG29-1/ガイドRNA混合物のそれぞれを200,000個のT細胞中に電気穿孔した。トランスフェクションの72時間後にゲノムDNAを回収し、ハイスループットDNAシーケンシングを使用する解析のためにPCR増幅した。NHEJベースの遺伝子編集に典型的な挿入および欠失の生成は、固有のPythonスクリプトを使用して定量した。結果を図41に示すが、これは20~24ntのガイドスペーサー長が良好に機能し、19ntではドロップオフが存在することを実証している。
実施例21 TCR発現に対するMG29-1挿入欠失の生成の決定
APC標識した抗ヒトTCRα/β Ab(Biolegend #306718,クローンIP26)およびAttune NxTフローサイトメーター(Thermo Fisher)を使用したフローサイトメトリーにより、TCRの発現について、図41の細胞を解析した。挿入欠失データを図41より取得する。
実施例22 MG29-1を用いた標的化されたCARの組込み
5’-TTN-3’にマッチングする配列についてT細胞受容体α鎖定常領域の3つのエクソンを走査し、IDT固有のAlt-R修飾を使用するシングルガイドRNAをIDTから注文した。ガイド(80pmol)を精製MG29-1タンパク質(63pmol)と混合し、室温で15分間インキュベートした。ネガティブ選択を使用することで(Stemcell Technologies ヒトT細胞単離キット#17951)PBMCからT細胞を精製し、CD2/3/28ビーズ(Miltenyi T細胞活性化/増殖キット#130-091-441)により活性化させた。細胞増殖させた4日後、プログラムEO-115およびP3緩衝液を使用するLonza 4-D Nucleofectorを用いてMG29-1/ガイドRNA混合物のそれぞれを200,000個のT細胞中に電気穿孔した。TRAC遺伝子を標的化する5’および3’ホモロジーアーム(配列番号4424の5’アームは約500ntの長さであり、配列番号4425の3’アームは約500ntの長さである)と隣接している、カスタマイズされたキメラ抗原受容体のコード配列を含有するセロタイプ6アデノ随伴ウイルス(AAV-6)の100,000ベクターゲノムを、トランスフェクション後の細胞に直ちに加えた。TRAC挿入欠失に対するTCRの発現について複写物を解析し(図42)、TRAC遺伝子の挿入欠失がTCRの発現の損失に相関することを示した。実施例21にあるようなTCRの発現(図42)について、および標的抗原のCARへの結合(図43、プロットは単一の生細胞に関してゲート制御される)について、細胞もまたフローサイトメトリーで同時に解析した。図43のフロー解析結果は、ガイドRNAは単独でTCRの発現除去に有効であったが(「RNPのみ」)、AAVをガイドRNAに加えることでCAR抗原に結合する細胞の新規集団が生じることを示した(プロットの上部左の「AAV+MG29-1-19-22」および「AAV+MG29-1-35-22」)。sgRNA35(配列番号4404)は、CARの組込みの誘導においてはsgRNA19(配列番号4388)よりも少量ではあるが有効であった。この差に関する考えられる説明の1つは、ガイド19について予想されるヌクレアーゼ切断部位が右のホモロジーアームの末端から約160bp離れているという点である。
Figure 2023517041000020
実施例23 HSCにおけるMG29-1 TRAC編集
Allcellから造血幹細胞を購入し、供給業者の指示に従い解凍し、DMEM+10%FBSで洗浄した。CC110サイトカインを加えたStemspan II培地に再懸濁した。4mLの培地、6ウェルのディッシュで100万個の細胞を72時間培養した。MG29-1 RNPを作製してトランスフェクトし、EO-100ヌクレオフェクションプログラムの使用を除き実施例18のように遺伝子編集を解析した。結果を図56に示すが、これは、以下の表5Bの#19(配列番号4388)および#35(配列番号4404)sgRNAを使用した、造血幹細胞のTRACでの遺伝子編集を示す。この結果は、#35sgRNAがTRAC遺伝子座の標的化に非常に有効であることもまた示している。
Figure 2023517041000021
実施例24 MG29-1に関連するPAM特異性のさらなる解析
MG29-1のPAM特異性をさらに正確に決定するため、さらなる解析を行った。5’-NTTN-3’ PAM配列を使用してガイドRNAを設計し、続いて観察された遺伝子編集活性に従って選別した(図45、下線を引いた塩基(5’-近位N)の同一性を各区間について示している)。10%を超える活性を有し、ゲノムDNAにおいてこの位置でTを有するガイド全ては、MG29-1 PAMが5’-TTTN-3’としてよりよく説明され得ることを示している。各区間に関して、この位置でのTの過剰な表面の統計学的有意性を示す。図45では、様々な区間(高、中、低、1%超、1%未満)は、
■高:50%超の挿入欠失(N=4)
■中:10~50%の挿入欠失(N=15)
■低:5~10%の挿入欠失(N=5)
■1%超:1~5%の挿入欠失(N=12)
■1%未満(N=82)
Figure 2023517041000022
実施例25 スペーサー塩基組成に対するMG29-1挿入欠失誘導の決定
MG29-1スペーサー配列の塩基組成に対する遺伝子編集活性のさらなる解析を行った。この相関関係は中程度(R^2=0.23)であったが、GC含有量がさらに高い場合には活性がより良好なものに向かう傾向がある(図46を参照されたい、スペーサー配列のGC含有量に対し、培養された細胞に誘導された挿入欠失間の相関関係はドット状のプロットとして示されている)。
実施例26 MG29-1ガイドの化学修飾
実施例18の手順を使用するが、VEGF-Aを標的化する示されたガイドRNAを用いて、MG29-1を使用するVEGF-A遺伝子座の標的化について化学修飾を最適化する実験を行った(以下の表7を参照されたい)。実験は126pmolのMG29-1および160pmolのガイドRNAを使用した。結果を図47に示す。ガイド#4、#5、#6、#7および#8は、非修飾ガイド#1に対して向上した活性を示した。これは、これらの配列の対応する修飾が非修飾RNA配列に対するこれらのガイドRNAの活性を向上させたことを示している。
Figure 2023517041000023
実施例27 実施例26から修飾されたMG29-1ガイドの滴定
実施例26で使用される修飾されたガイドの活性の用量依存性を決定するためにさらなる実験を行い、考えられる用量依存性毒性効果を同定した。出発用量(A、126pmolのMG29-1および160pmolのガイドRNA)の1/4(B)、1/8(C)、1/16(D)および1/32(E)であることを除き、実施例26にあるように実験を行った。結果を図48に示す。
実施例28 本明細書に説明されているヌクレアーゼの大規模合成
プロジェクト概要
MetagenomiのV-A型CRISPRヌクレアーゼ、MG29-1の産生を、10Lの初期培養体積にスケールアップする。発現スクリーニング、スケールアップ発現、下流の開発、製剤研究、およびSDS-PAGEによって精製されたタンパク質の90%以上の送達を行う。
発現および精製スクリーニング
宿主株、発現培地、誘導物質、誘導時間および温度といった条件を変更しつつ、図49に示されているpMG450ベクターからのMG29-1の発現を試験した。全ての条件についてSDS-PAGEにより、大腸菌細胞ペーストから抽出された全ての可溶性タンパク質を解析する。収率および純度を推定し、最適な発現条件を同定するため、上位3つの発現条件で固定化金属アフィニティークロマトグラフィー(IMAC)プルダウン、続いてSDS-PAGEを実施する。溶解のためのスケールアップ方法が開発されている。IMACおよびサブトラクティブIMACによる精製(タバコエッチウイルスプロテアーゼ(TEV)切断)のため、重要なパラメータを同定する。SDS-PAGEを使用し、カラム画分を試験する。SDS-PAGEおよび280nm(A280)での測光吸光度を使用し、溶出プールを試験する。タンジェンシャルフローろ過(tangential flow filtration、TFF)による緩衝液交換および濃縮のための方法を開発する。
必要に応じて、90%以上の純度を達成するためにさらなるクロマトグラフィー工程を開発する。1つのクロマトグラフィーモードを試験する(例えば、セラミックハイドロキシアパタイトクロマトグラフィー)。最大8個の特有の条件を試験する(例えば、2~3個の緩衝系をそれぞれ有する2~6個の樹脂)。SDS-PAGEを使用し、カラム画分を試験する。SDS-PAGEおよびA280を使用し、溶出プールを試験する。1つの条件を選択し、3つの条件の負荷試験を実施する。上記のようにカラム画分および溶出プールを解析する。TFFによる緩衝液交換および濃縮のための方法が開発され得る。
大腸菌の形質転換、振盪フラスコ中での培養物の調製、および発現スクリーニング中に同定された最適な発現条件による材料および方法を使用した誘導を行う。細胞ペーストを回収し、SDS-PAGEにより発現を検証する。結果を報告し、精製のため出発材料として細胞ペーストを使用する。細胞培養物の体積を20Lに制限する。下流方法の開発中に開発された方法を使用し、最大1グラムのタンパク質を精製する。最終保存緩衝液へと製剤化し、A280により収率および濃度を、SDS-PAGEにより純度のQC試験を行う。
製剤試験
精製されたタンパク質を使用し、精製されたタンパク質の最適な保存条件を決定するために製剤試験を行う。研究により、濃度、保存緩衝液、保存温度、最大凍結/解凍サイクル、保存時間、またはその他の条件を調査することができる。
実施例29 培養されたマウスの肝細胞におけるイントロン領域を編集する、本明細書に説明されているヌクレアーゼの能力の実証
発現された遺伝子のイントロン領域は、疾患を処置または治療する治療用タンパク質を発現するという目的に関して、対象の治療用タンパク質のコード配列を組み込むための魅力的なゲノム標的である。外因的に供給されたドナーテンプレートの存在下で配列特異的ヌクレアーゼを使用し、イントロン内部で二本鎖切断を生成することによって、タンパク質コード配列の組込みを達成することができる。ドナーテンプレートの標的化された組込みを生じさせる、相同組換え修復(homology directed repair、HDR)および非相同末端結合(non-homologous end joining、NHEJ)と呼ばれる2つの主要な細胞修復経路のうち1つによって、ドナープレートを二本鎖切断へと組み込むことができる。NHEJ経路は非分裂細胞では主要であるが、HDR経路は主に分裂細胞でのみ活性である。肝臓は、タンパク質コード配列の標的化された組込みには特に魅力的な組織である。これは、インビボ送達系の有効性および高い効率でタンパク質を発現および分泌する肝臓の能力に起因する。
イントロン領域で二本鎖切断を生成するMG29-1の潜在能力を評価するため、血清アルブミンのイントロン1を標的遺伝子座として選択した。Geneious Prime核酸解析ソフトウェアのガイド発見アルゴリズムを使用し、マウスのアルブミンイントロン1に標的された22ntのスペーサー長を有するシングルガイドRNA(sgRNA)を同定した(https://www.geneious.com/prime/)。スペーサーに対して5’に配置されているKTTG(配列番号3870)のPAMを使用し、マウスのアルブミンイントロン1内部の合計112の考えられるsgRNAを同定した。イントロン/エクソン境界に及ぶガイドを除外した。Geneious Primeを使用してマウスのゲノムに対するこれらの112ガイドのスペーサー配列を検索し、ゲノムの追加部位へのアラインメントに基づき、ソフトウェアによって特異性スコアを割り当てた。特異性について懸念があることから、4個以上の近接する塩基を有する、同一塩基のスペーサー配列を除外した。試験のため、最も高い特異性スコアを有する合計12個のスペーサーを選択した。sgRNAを生成するため、「TAATTTCTACTGTTGTAGAT」の主鎖配列をスペーサー配列の3’末端に加えた。cpf1ガイドに関するsgRNAの性能を向上させることで知られている化学修飾塩基を組み入れることで、sgRNAを化学合成した(Integrated DNA Technologiesから入手可能なAltR1/AltR2化学物質)。これらのガイドのスペーサー配列を以下の表8に列挙する。
Figure 2023517041000024
Figure 2023517041000025
標準条件(5%のCO2インキュベータ中に10%のFBSを含むDMEM培地)下で形質転換されたマウス肝細胞株であるHepa1~6細胞を培養し、PBS緩衝液中でsgRNAと精製MG29-1タンパク質とを混合することで形成されたリボ核タンパク質を用いて核内遺伝子導入した。4Dヌクレオフェクション装置(Lonza)を使用し、50pmolのMG29-1タンパク質と100pmolのsgRNAとを混合することで形成されたRNPを用いて、完全SFヌクレオフェクション試薬(Lonza)中に懸濁されたHepa1~6細胞(1×10)を核内遺伝子編集した。ヌクレオフェクション後、24ウェルプレートへ10%のFBSを加えたDMEM中に細胞を播種し、48~72時間にわたって5%のCO2インキュベータ中でインキュベートした。続いてカラムベースの精製キット(PurelinkゲノムDNAミニキット、ThermoFisher Scientific)を使用して細胞からゲノムDNAを抽出し、260nmでの吸光度で定量した。それぞれ0.5マイクロモルのプライマーであるmAlb90F(CTCCTCTTCGTCTCCGGC)(配列番号4031)およびmAlb1073R(CTGCCACATTGCTCAGCAC)(配列番号4032)、および1倍のPfusion Flash PCR Master Mixを含有する反応物で、50ngのゲノムDNAからアルブミンイントロン1領域をPCR増幅した。
カラムベースの精製キット(DNA精製・抽出キット、Zymo Research)を使用して、得られたマウスのアルブミンの全イントロン1に及ぶ984bpのPCR産物を精製し、各sgRNAについて予想される標的部位の150~350bp内に配置されているプライマーを使用して配列決定した。トランスフェクトされていないHepa1~6細胞由来のプライマーであるmAlb90F(配列番号4031)およびmAlb1073R(配列番号4032)を使用して生成したPCR産物を、コントロールとして並行して配列決定した。挿入欠失の頻度および挿入欠失プロファイルを決定するInference of CRISPR Edits(ICE)を使用し、サンガー法シーケンシングクロマトグラムを解析した(Hsiau et.al,Inference of CRISPR Edits from Sanger Trace Data.BioArxiv.2018 https://www.biorxiv.org/content/early/2018/01/20/251082)。
ヌクレアーゼが生細胞内部でDNAの二本鎖切断(DSB)を精製する場合、DSBは細胞DNA修復機構により修復される。培養物中で形質転換された哺乳動物細胞などの活発に分裂している細胞では、かつ修復テンプレートが存在しない条件下では、この修復はNHEJ経路で発生する。このNHEJ経路は、二本鎖切断部位で塩基の挿入または欠失を導入するエラープローンプロセスである(Lieber,M.R,Annu Rev Biochem.2010;79:181-211)。したがって、発生し続いて修復されるこれらの挿入および欠失は二本鎖切断の特徴であり、ヌクレアーゼの編集効率または切断効率の情報として広く利用されている。挿入および欠失のプロファイルは、二本鎖切断を作製したヌクレアーゼの特性に依存しているが、切断部位の配列状況にも依存する。インビトロアッセイに基づき、MG29-1ヌクレアーゼはPAMの3’に配置されたねじれ形の切断を生成する。ねじれ形に切断することで、多くの場合では、末端結合前の一本鎖のトリミングによってさらに大きな欠失がもたらされる。表8は、Hepa1~6細胞で試験されたマウスのアルブミンイントロン1を標的化しているそれぞれの19個のsgRNAにより生成された全体の挿入欠失頻度を列挙している。18個のsgRNAのうち11個では標的部位の検出可能な挿入欠失が生じ、5個のsgRNAでは50%を超える挿入欠失頻度が生じ、4個のsgRNAでは75%を超える挿入欠失頻度が生じる。これらのデータは、MG29-1ヌクレアーゼが、75%を超える効率を有するsgRNAに関しては、予想される標的部位で培養されたマウスの生細胞のゲノムを編集することができることを実証している。
市販の脂質ベースのトランスフェクション試薬(リポフェクタミンMessengerMAX,Invitrogen)を使用し、sgRNAとMG29-1ヌクレアーゼをコードするmRNAを同時トランスフェクトすることで、同一セットのsgRNAの編集効率を評価した。MG29-1のコード配列をクローニングしたプラスミド由来のT7ポリメラーゼを使用し、インビトロ転写によってMG29-1をコードするmRNAを生成した。ヒトのコドン利用表を使用してMG29-1コード配列をコドン最適化し、N末端ではSV40に、C末端ではヌクレオチドプラスミンに由来する核局在化シグナルに隣接させた。さらに、翻訳を向上させるため、コード配列の3’末端でUTRをインキュベートした。インビボでのmRNA安定性を向上させるため、コード配列の3’末端で3’のUTR、続いておよそ90~110ヌクレオチドのポリAトラクトをインキュベートした(例えば、野生型MG29-1については配列番号4426、S168Rバリアントについては配列番号3327)。インビトロ転写反応は、Clean Cap(登録商標)キャッピング試薬(Trilink BioTechnologies)を含み、MEGAClear(商標)転写クリーンアップキット(Invitrogen)を使用して得られたRNAを精製し、TapeStation(Agilent)を使用して純度を評価し、これが90%を超える全長のRNAから構成されていることを見出した。
表1で確認されるように、Hepa1~6細胞のmRNA/sgRNA脂質トランスフェクション後の編集効率は、RNPのヌクレオフェクションで見られるものと類似しているが同一ではなかった。ただし、MG29-1ヌクレアーゼは、mRNAの形態で送達される場合には、培養された肝細胞では活性であることを確認した。
Figure 2023517041000026
Figure 2023517041000027
Figure 2023517041000028
Figure 2023517041000029
Figure 2023517041000030
Figure 2023517041000031
図50は、ガイドとしてmAlb29-1-8(配列番号3999)を使用するICE解析により決定されるMG29-1の挿入欠失プロファイルの代表例であり、4塩基の欠失が最も頻繁な現象であり(全配列の25%)、1、5、6または7塩基の欠失は、配列の約10~15%をそれぞれ占めていることを実証している代表例である。最大13塩基の長い欠失もまた検出されたが、挿入は検出不可能であった。対照的に、マウスのアルブミンイントロン1を標的化するガイドを有するspCas9は、1塩基の挿入または欠失を主に生成した。
図51は、マウスのアルブミンイントロン1領域のPCR産物の次世代シーケンシング(NGS)により決定される、MG29-1の挿入欠失プロファイルおよびsgRNAであるmAlb29-1-8の代表例である。合計で、およそ15,000個の配列リードを得た。NGSにより、4塩基の欠失は最も頻繁な挿入欠失であり(全体の20%)、1、5、6および7塩基の欠失は、挿入欠失の約10%をそれぞれ占めていた。最大19bpのより大きな欠失も検出された。NGS解析により観察されたプロファイルは、ICEにより測定されたプロファイルと厳密には一致している。これらの結果は、MG29-1が、インビトロで観察されたねじれ形の切断と一致する標的部位にて、大きな欠失を生成することを実証する。
実施例30 培養されたヒトの肝細胞(HepG2)におけるイントロン領域を標的化する、本明細書に説明されているヌクレアーゼの能力の実証
ヒト細胞のイントロン領域で二本鎖切断を生成するMG29-1の潜在能力を評価するため、ヒト血清アルブミンのイントロン1を標的遺伝子座として選択した。Geneious Prime核酸解析ソフトウェアのガイド発見アルゴリズムを使用し、ヒトのアルブミンイントロン1に標的された22ntのスペーサー長を有するシングルガイドRNA(sgRNA)を同定した(https://www.geneious.com/prime/)。スペーサーに対して5’に配置されているKTTG(配列番号3870)のPAMを使用し、ヒトのアルブミンイントロン1内部の合計90の考えられるsgRNAを同定した。イントロン/エクソン境界に及ぶガイドを除外した。Geneious Primeを使用してマウスのゲノムに対するこれらのガイドのスペーサー配列を検索し、ゲノムの追加部位へのアラインメントに基づき、ソフトウェアによって特異性スコアを割り当てた。特異性について懸念があることから、4個以上の近接する塩基を有する、同一塩基のスペーサー配列を除外した。試験のため、最も高い特異性スコアを有する合計23個のスペーサーを選択した。sgRNAを生成するため、「TAATTTCTACTGTTGTAGAT」の主鎖配列をスペーサー配列の3’末端に加えた。cpf1ガイドに関するsgRNAの性能を向上させることで知られている化学修飾塩基を組み入れることで、sgRNAを化学合成した(Integrated DNA Technologiesから入手可能なAltR1/AltR2化学物質)。これらのガイドのスペーサー配列を以下の表9に列挙する。
Figure 2023517041000032
Figure 2023517041000033
標準条件(5%のCO2インキュベータ中に10%のFBSを含むMEM培地)下で形質転換されたヒト肝細胞株であるHepG2細胞を培養し、PBS緩衝液中でsgRNAと精製MG29-1タンパク質とを混合することで形成されたリボ核タンパク質を用いて核内遺伝子導入した。4Dヌクレオフェクション装置(Lonza)を使用し、80pmolのMG29-1タンパク質と160pmolのsgRNAとを混合することで形成されたRNPを用いて、完全SFヌクレオフェクション試薬(Lonza)中に懸濁された合計1e5のHepG2細胞を核内遺伝子編集した。ヌクレオフェクション後、24ウェルプレートへ10%のFBSを加えたDMEM中に細胞を播種し、48~72時間にわたって5%のCOインキュベータ中でインキュベートした。続いてカラムベースの精製キット(PurelinkゲノムDNAミニキット、ThermoFisher Scientific)を使用して細胞からゲノムDNAを抽出し、260nmでの吸光度で定量した。それぞれ0.5マイクロモルのプライマーであるhAlb11F(TCTTCTGTCAACCCCACACGCC)(配列番号4079)およびhAlb834R(CTTGTCTGGGCAAGGGAAGA)(配列番号4080)、および1倍のPfusion Flash PCR Master Mixを含有する反応物中、50ngのゲノムDNAから、アルブミンイントロン1領域をPCR増幅した。カラムベースの精製キット(DNA精製・抽出キット、Zymo Research)を使用して、得られたマウスのアルブミンの全イントロン1に及ぶ826bpのPCR産物を精製し、sgRNAについて予想される標的部位の150~350bp内に配置されているプライマーを使用して配列決定した。
トランスフェクトされていないHepG2細胞由来のプライマーであるhAlb11F(TCTTCTGTCAACCCCACACGCC)(配列番号4079)およびhAlb834R(CTTGTCTGGGCAAGGGAAGA)(配列番号4080)を使用して生成されたPCR産物を、コントロールとして並行して配列決定した。挿入欠失の頻度および挿入欠失プロファイルを決定するInference of CRISPR Edits(ICE)を使用し、サンガー法シーケンシングクロマトグラムを解析した。ヌクレアーゼが生細胞内部でDNAの二本鎖切断(DSB)を精製する場合、DSBは細胞DNA修復機構により修復される。培養物中で形質転換された哺乳動物細胞などの活発に分裂している細胞では、かつ修復テンプレートが存在しない条件下では、この修復はNHEJ経路で発生する。このNHEJ経路は、二本鎖切断部位で塩基の挿入または欠失を導入するエラープローンプロセスである(Lieber,M.R,Annu Rev Biochem.2010;79:181-211)。
したがって、発生し続いて修復されるこれらの挿入および欠失は二本鎖切断の特徴であり、ヌクレアーゼの編集効率または切断効率の情報として広く利用されている。挿入および欠失のプロファイルは、二本鎖切断を作製したヌクレアーゼの特性に依存しているが、切断部位の配列状況にも依存する。インビトロアッセイに基づき、MG29-1ヌクレアーゼは、PAMから22ヌクレオチド(PAMから21ヌクレオチドではそれほど頻度は高くない)の標的鎖を切断し、PAMから18ヌクレオチドの非ターゲット鎖を切断した。こうすることでPAMの3’に配置された4ヌクレオチドのねじれ形末端を形成する。ねじれ形に切断することで、多くの場合では、末端結合前の一本鎖のトリミングによってさらに大きな欠失がもたらされる。
表9は、HepG2細胞で試験されたヒトのアルブミンイントロン1を標的化しているそれぞれの23個のsgRNAにより生成された全体の挿入欠失頻度を列挙している。23個のsgRNAのうち16個では標的部位の検出可能な挿入欠失が生じ、8個のsgRNAでは50%を超える挿入欠失が生じ、5個のsgRNAでは90%を超える挿入欠失頻度が生じる。これらのデータは、MG29-1ヌクレアーゼが、90%を超える効率を有するsgRNAに関しては、予想される標的部位で培養されたヒトの生細胞株のゲノムを編集することができることを実証している。
実施例31 培養されたマウスの肝細胞におけるエクソン領域を編集する、本明細書に説明されているヌクレアーゼの能力の実証
配列特異的ヌクレアーゼを使用し、遺伝子のコード配列を破壊し、それによって目的のタンパク質の機能的ノックアウトを作成することができる。これは、特異的タンパク質のノックダウンが特定の疾患に有益な効果を有する場合には治療用途のものであり得る。遺伝子のコード配列を破壊する方法の1つとしては、配列特異的ヌクレアーゼを使用し、遺伝子のエクソン領域内に二本鎖切断を作製することである。エラープローン修復経路によってこれらの二本鎖切断を修復し、フレームシフト変異またはタンパク質の機能を破壊するアミノ酸配列に対する変化のいずれかをもたらし得る挿入または欠失を生成する。
肝細胞で発現される遺伝子のエクソン領域で二本鎖切断を生成するMG29-1の潜在能力を評価するため、グリコール酸オキシダーゼ(hao-1)をコードする遺伝子を標的遺伝子座として選択した。Geneious Prime核酸解析ソフトウェアのガイド発見アルゴリズムを使用し、マウスのhao-1のエクソン1~4に標的された22ntのスペーサー長を有するシングルガイドRNA(sgRNA)を同定した(https://www.geneious.com/prime/)。hao-1遺伝子の最初の4エクソンは、hao-1コード配列のN末端のおよそ50%を含む。遺伝子のコード配列のN末端に向かって作成された挿入欠失は、タンパク質の活性を破壊するフレームシフトまたはミスセンス変異を作成する可能性が高いことから、最初の4エクソンを選択した。スペーサーに対して5’に配置されているKTTG(配列番号3870)のPAMを使用し、マウスのhao-1エクソン1~4内部の合計45の考えられるsgRNAを同定した。イントロン/エクソン境界に及ぶガイドを含むが、これはこうしたガイドがスプライシングに干渉する挿入欠失を作成することができることが理由である。Geneious Primeを使用してマウスのゲノムに対するこれらの45ガイドのスペーサー配列を検索し、マウスのゲノムの追加部位へのアラインメントに基づき、ソフトウェアによって特異性スコアを割り当てた。特異性について懸念があることから、4個以上の近接する塩基を有する、同一塩基のスペーサー配列を除外した。試験のため、最も高い特異性スコアを有する合計45個のスペーサーを選択した。
sgRNAを生成するため、「TAATTTCTACTGTTGTAGAT」の主鎖配列をスペーサー配列の3’末端に加えた。cpf1ガイドに関するsgRNAの性能を向上させることで知られている化学修飾塩基を組み入れることで、sgRNAを化学合成した(Integrated DNA Technologiesから入手可能なAltR1/AltR2化学物質)。これらのガイドのスペーサー配列を表10に列挙する。
表10:マウスのhao-1エクソン1~4を標的化するMG29-1 sgRNAのスペーサー配列およびMG29-1/sgRNA RNPを用いて核内遺伝子導入されたHepa1~6細胞における活性
Figure 2023517041000034
Figure 2023517041000035
Figure 2023517041000036
標準条件(5%のCOインキュベータ中に10%のFBSを含むDMEM培地)下で形質転換されたマウス肝細胞株であるHepa1~6細胞を培養し、PBS緩衝液中でsgRNAと精製MG29-1タンパク質とを混合することで形成されたリボ核タンパク質を用いて核内遺伝子導入した。4Dヌクレオフェクション装置(Lonza)を使用し、50pmolのMG29-1タンパク質と100pmolのsgRNAとを混合することで形成されたRNPを用いて、完全SFヌクレオフェクション試薬(Lonza)中に懸濁された合計1eのHepa1~6細胞を核内遺伝子編集した。ヌクレオフェクション後、24ウェルプレートへ10%のFBSを加えたDMEM中に細胞を播種し、48~72時間にわたって5%のCO2インキュベータ中でインキュベートした。続いてカラムベースの精製キット(PurelinkゲノムDNAミニキット、ThermoFisher Scientific)を使用して細胞からゲノムDNAを抽出し、260nmでの吸光度で定量した。各エクソンに特異的である、0.5マイクロモルの対のプライマーを含有する反応物における40ngのゲノムDNAから、マウスのhao-1遺伝子1のエクソン1~4をPCR増幅した。エクソン1に使用されたPCRプライマーは、PCR_mHE1_F_+233(GTGACCAACCCTACCCGTTT)(配列番号4171)、PCR_mHE1_R_-553(GCAAGCACCTACTGTCTCGT)(配列番号4172)であった。エクソン2に使用されたPCRプライマーは、HAO1_E2_F5721(CAACGAAGGTTCCCTCCAGG)(配列番号4173)、HAO1_E2_R6271(GGAAGGGTGTTCGAGAAGGA)(配列番号4174)であった。エクソン3に使用されたPCRプライマーは、HAO1_E3_F23198(TGCCCTAGACAAGCTGACAC)(配列番号4175)、HAO1_E3_R23879(CAGATTCTGGAAGTGGCCCA)(配列番号4176)であった。エクソン4に使用されたPCRプライマーは、HAO1_E4_F31087(CCTGTAGGTGGCTGAGTACG)(配列番号4177)、HAO1_E4_R31650(AGGTTTGGTTCCCCTCACCT)(配列番号4178)であった。
プライマーおよびゲノムDNAに加えて、PCR反応物は1倍のPfusion Flash PCR Master Mix(Thermo Fisher)を含有した。得られたPCR産物は、アガロースゲル上で解析した場合には単一のバンドを含むがこれはPCR反応が特異的であることを実証しており、カラムベースの精製キット(DNA精製・抽出キット、Zymo Research)を使用して精製した。配列決定するため、各切断部位から少なくとも100ntの配列に相補的であるプライマーを使用した。配列エクソン1に対するプライマーは、Seq_mHE1_F_+139(GTCTAGGCATACAATGTTTGCTCA)(配列番号4179)であった。配列エクソン2に対するプライマーは、5938F Seq_HAO1_E2(CTATGCAAGGAAAAGATTTGGCC)(配列番号4180)であった。配列エクソン3に対するプライマーは、HAO1_E3_F23476(TCTTCCCCCTTGAATGAAACACT)(配列番号4181)であり、逆PCRプライマーはHAO1_E3_R23879(CAGATTCTGGAAGTGGCCCA)(配列番号4182)であった。配列エクソン4に対するプライマーは、逆PCRプライマーであるHAO1_E4_R31650(AGGTTTGGTTCCCCTCACCT)(配列番号4183)であった。
PCR産物のシーケンシングは、これらの産物がhao-1エクソンの予測配列を含有することを示した。各sgRNAについて予想される100~350bpの標的部位内に配置されたプライマーを使用し、異なるRNPを用いて核内遺伝子導入されたHepa16細胞に由来するPCR産物、または未処理のコントロールを配列決定した。挿入欠失の頻度および挿入欠失プロファイルを決定するInference of CRISPR Edits(ICE)を使用し、サンガー法シーケンシングクロマトグラムを解析した(Hsiau et.al,Inference of CRISPR Edits from Sanger Trace Data.BioArxiv.2018 https://www.biorxiv.org/content/early/2018/01/20/251082)。ヌクレアーゼが生細胞内部でDNAの二本鎖切断(DSB)を精製する場合、DSBは細胞DNA修復機構により修復される。培養物中で形質転換された哺乳動物細胞などの活発に分裂している細胞では、かつ修復テンプレートが存在しない条件下では、この修復はNHEJ経路で発生する。このNHEJ経路は、二本鎖切断部位で塩基の挿入または欠失を導入するエラープローンプロセスである(Lieber,M.R,Annu Rev Biochem.2010;79:181-211)。したがって、発生し続いて修復されるこれらの挿入および欠失は二本鎖切断の特徴であり、ヌクレアーゼの編集効率または切断効率の情報として、当該技術分野で広く利用されている。表10に示すように、14個のガイドはそれらの予想される標的部位における検出可能な編集を実証した。4個のガイドは、90%を超える編集活性を示した。14個の活性ガイド全てがTTTNのPAM配列を有するが、このPAMはインビボで好ましいことを実証している。ただし、TTTN PAMを利用するガイド全てが活性であるわけではなかった。これらのデータは、MG29-1ヌクレアーゼが、高い効率を伴い、培養された肝細胞におけるエクソン領域に、RNAガイドされ、配列特異性のある二本鎖切断を生成可能であることを実証している。
実施例32 Hao-1遺伝子を破壊するためにさらなるsgRNAの設計
hao-1遺伝子のエクソン部分を標的化するため、さらなるsgRNAを設計した。これらはおよそ50%のコード配列を含み、遺伝子のコード配列のN末端に向かって生成された挿入欠失が、タンパク質の活性を破壊するフレームシフトまたはミスセンス変異を作成する可能性が高いことから、これらは最初の4エクソンを標的化するために設定されている。哺乳動物細胞でさらに活性であると実施例31に示されている、より制限的なKTTGのPAM(配列番号3870)を使用し、ヒトhao-1エクソン1~4内部に全体で42個の考えられるsgRNAを同定した(表11)。
Figure 2023517041000037
Figure 2023517041000038
Figure 2023517041000039
イントロン/エクソン境界に及ぶガイドを含むが、これはこうしたガイドがスプライシングに干渉する挿入欠失を作成することができることが理由である。Geneious Primeを使用してヒトゲノムに対するこれらの42ガイドのスペーサー配列を検索し、ヒトゲノムへのアラインメントに基づき、ソフトウェアによって特異性スコアを割り当てた。より高い特異性スコアは、スペーサーが設計された部位以外のヒトゲノムにおける1つ以上の配列を認識するこうしたガイドの可能性が低いことを示す。特異性スコアは10%~100%の範囲であり、25個のガイドは90%を超える特異性スコアを有し、33個のガイドは80%を超える特異性スコアを有する。この解析は、高い特異性スコアを有するヒト遺伝子のエクソン領域を標的化するガイドを容易に同定可能であると実証しており、多数の高活性ガイドが同定されるであろうことが予測される。
実施例33 本明細書に説明されているヌクレアーゼの編集能力とマウスの肝細胞におけるspCas9の編集能力との比較
細菌種であるストレプトコッカス・ピオゲネスに由来するCRISPR Cas9ヌクレアーゼ(spCas9)は、ゲノム編集に広く使用されており、同定されている最も活性のあるRNAガイドヌクレアーゼの1つである。マウス肝細胞株であるHepa1~6における異なる用量のRNPのヌクレオフェクションにより、spCas9と比較したMG29-1の相対的能力を評価した。マウスアルブミンのsgRNA標的イントロン1を両方のヌクレアーゼに使用した。MG29-1については、実施例29に同定されたsgRNAであるmAlb29-1-8を選択した。MG29-1と類似のsgRNA構造を有するV型ヌクレアーゼcpf1のガイドの能力を向上させるように設計された、AltR1/AltR2(Integrated DNA Technologies)と呼ばれる化学修飾を組み入れることで、ガイドであるmAlb29-1-8(実施例29を参照されたい)を化学合成した。spCas9について、インシリコスクリーニングから選択された3個のガイドを試験することで、マウスのアルブミンイントロン1を効率的に編集したsgRNAを同定した。これらの研究で使用されたspCas9タンパク質は、商用供給業者(Integrated DNA TechnologiesのAltR-sPCas9)から取得した。
sgRNAであるmAlbR1(スペーサー配列、TTAGTATAGCATGGTCGAGC)を化学合成し、細胞の能力を向上させるガイドの両端の3塩基上の2’ Oメチル塩基とチオリン酸(PS)結合から構成される化学修飾を組み込んだ。sgRNAであるmAlbR1は、20pmolのspCas9タンパク質/50pmolのガイドから構成されたRNPをHepa1~6細胞へと核内遺伝子導入した場合に、90%の頻度で挿入欠失を生成した。これは高度に活性のあるガイドであることを示している。20pmol~1pmolの範囲のヌクレアーゼタンパク質で形成されたRNPおよび1:2.5の一定比のタンパク質:sgRNAを、Hepa1~6細胞へと核内遺伝子導入した。PCR増幅されたゲノムDNAのサンガー法シーケンシングおよびICE解析を使用し、マウスのアルブミンイントロン1における標的部位の挿入欠失を定量した。図52に示された結果は、編集が飽和していない場合には、MG29-1はRNPが低用量のspCas9よりも高いパーセンテージの挿入欠失を生成したことを実証している。これらのデータは、MG29-1が少なくとも同程度に活性であり、肝臓由来の哺乳動物細胞においては、spCas9よりも潜在的にはさらに活性があることを示している。
実施例34 本明細書に説明されているヌクレアーゼの配列バリアントの編集およびマウスの肝細胞における評価
MG29-1の編集効率を向上させるため、MG29-1コード領域の1つまたは2つのアミノ酸を置換している変異のセットを導入した。アシダミノコッカス種(AsCas12a)へのアラインメントにより、アミノ酸置換基のセットを決定した。構造化ガイド編集(Kleinstiver,et al,Nat Biotechnol.2019,37 276-282)により、PAM結合を変性または向上させるという目的でAsCas12a中の異なるアミノ酸を置換した。AsCas12aにおける4個のアミノ酸置換:S170R、E174R、N577RおよびK583Rは、基準となるPAMおよび基準とならないPAMによる高い編集効率を示した。複数のアラインメントにより、これらの置換にマッチングするMG29-1の部位を同定した。これらの部位は、MG29-1におけるS168R、E172R、N577RおよびK583Rに対応する。
単一アミノ酸置換を試験するため、2-プラスミド送達系を使用した。標準的な分子クローニング技術を使用し、単一アミノ酸置換を有するMG29-1をコードする発現プラスミドを構築した。プラスミドの1つは、CMVプロモーターの下でMG29-1をコードし、第2のプラスミドはmAlb29-1-8であるsgRNAを含有するが(表8を参照されたい)、Hepa1~6細胞において高い編集効率を有する。ヒトU6プロモーターによりガイドの転写を駆動した。MG29-1をコードするインビトロで転写された(IVT)mRNA(どのようにしてIVT mRNAを作製したかの詳細については実施例33を参照されたい)およびIntegrated DNA TechnologiesによりCpf1に最適化された(Integrated DNA Technologiesで合成された)AltR1/AltR2化学修飾を組み入れている化学合成されたガイドを使用して、2-プラスミド系を使用する単一アミノ酸置換による最初の結果と二重アミノ酸置換の試験との確認を行った。2-プラスミド系を送達するため、MG29-1をコードする100ngのプラスミドとガイドをコードする400ngのプラスミドとをリポフェクタミン3000と混合し、これをHepa1~6細胞に加えて3日間インキュベートした後、ゲノムDNA単離を行った。
IVT mRNAおよび合成ガイドを送達するため、300ngのmRNAと120ngの合成ガイドとをリポフェクタミンMessenger MAXと混合し、これを細胞に加えて2日間インキュベートした後、ゲノムDNA単離を行った。IVT mRNAを使用してスクリーニングされた合成ガイドは、表8にその詳細が述べられているガイドに対応しているが、簡潔さのため、ガイド「mAlb29-1-1」をg1-1として、「mAlb29-1-8」をg1-8として表しているように、図53のガイド名を短縮化した。ヒトのT細胞受容体遺伝子座(TRAC)を標的化するガイドの1つもまた試験した(図53Dにおける35TRAC)。ガイド35 TRACスペーサーは、TTTG PAMを有するGAGTCTCTCAGCTGGTACACGG(配列番号4268)である。既に言及したのと同一の修飾を用いたガイド35 TRACを注文した。マウスのアルブミンイントロン1のMG29-1編集に関する先行例に説明されている通りにゲノムDNAおよびPCR増幅を実施した。ガイド35 TRACについて、プライマーF:TGCTTTGCTGGGCCTTTTTC(配列番号4269)、プライマーR:ACAGTCTGAGCAAAGGCAGG(配列番号4270)を用いて、ヒトTRAC遺伝子座を増幅した。既に説明されている通りに、得られた957bpのPCR産物を精製した。プライマーATCACGAGCAGCTGGTTTCT(配列番号4271)を使用し、サンガー法シーケンシングにより編集を評価した。
PCR産物のサンガー法シーケンシング、続いてInference of CRISPR Edits(ICE)を使用し、マウスのアルブミンイントロン1およびヒトTRAC遺伝子座についての編集効率を定量した。最大で4つの生物学的複写物を表すデータを、図53にプロットした。単一アミノ酸置換S168Rは、2-プラスミド系のガイドであるmAlb29-1-8を使用した場合に、編集効率が向上したことを実証した(図53A)。変異E172Rは、ガイドであるmAlb29-1-8については大きな向上をもたらさなかったが、変異K583RはmAlb29-1-8ガイドを用いて編集を完全に妨げた。MG29-1 mRNAを用いたトランスフェクションおよび合成ガイドであるmAlb29-1-8は、プラスミドトランスフェクションから結果を確認した(図53B)。単一アミノ酸置換S168Rは、ガイドであるmAlb29-1-8を用いて試験された異なる濃度のmRNA全体にさらに高い編集効率を与えた(図53B)。E172R(図53Aに見られるように単独で活性を損なわなかった置換)、またはN577R(MG29-1プラスミドトランスフェクションでは試験されていないが、高い編集効率のcpf1を与える置換)およびY170R(予想されるMG29-1タンパク質に基づいて編集効率を向上させる可能性があると仮定されたもの)を用いたS168Rの二重アミノ酸置換を試験し、単一のS168R変異体と比較した。
試験された条件下では、二重変異はどれも編集効率を向上させることはなかった(図53C)。MG29-1 WTおよびMG29-1のS168Rバリアントの編集効率を、マウスのアルブミンイントロン1を標的化する12個のガイドおよびヒトT細胞受容体遺伝子座(TRAC)を標的化する1個のガイドと並行して比較した。MG29-1のS168Rバリアントは13個のガイド全てについて向上した編集効率を示し、ガイドの一部は他のものよりも有益であった(図4D)。重要な点としては、S168Rは試験されたガイドのいずれかについては哺乳動物の編集効率を損なわなかった。これらの結果は、MG29-1のS168R(アルギニンに変化したアミノ酸位置168のセリン)バリアントは編集活性を向上させることを実証しており、これは治療用途のための高度に活性があるガイドを同定する点で有利である。
実施例35 哺乳動物細胞におけるガイド安定性を向上させ、かつ編集効率を向上させる、本明細書に説明されているヌクレアーゼのsgRNAの化学修飾の同定
RNA分子は、ヌクレアーゼによる切断に対する感受性を理由として、生物系では本質的に不安定である。RNAの天然の化学構造の修飾は、治療薬開発に関してはRNA干渉(RNAi)に使用される安定性RNA分子を向上させるために広く使用されている(Corey,J Clin Invest.2007 Dec 3;117(12):3615-3622,J.B.Bramsen,J.Kjems Frontiers in Genetics,3(2012),p.154)。安定性を向上させ、それによるインビボでの短いRNA分子の能力を向上させるという点で、RNAのヌクレオベースまたはホスホジエステル主鎖に対する化学修飾の導入は重要であった。ヌクレアーゼに対する安定性および相補的なDNAまたはRNAへの親和性といった点で異なる特性を有する広範の化学修飾を開発した。
類似の化学修飾は、CRISPR Cas9ヌクレアーゼのためのガイドRNAに適用されている(Hendel et al,Nat Biotechnol.2015 Sep;33(9):985-989,Ryan et al Nucleic Acids Res 2018 Jan 25;46(2):792-803.,Mir et al Nature Communications volume 9,Article number:2641(2018),O’ Reilly et al Nucleic Acids Res 2019 47,546-558,Yin et al Nature Biotechnology volume 35,pages 1179-1187(2017)、そのそれぞれの全体が、参照により本明細書に組み込まれている)。
MG29-1ヌクレアーゼは、cpf1などの既知のV型CRISPR酵素に類似する限定されたアミノ酸配列を有する新規ヌクレアーゼである。MG29-1について同定されたガイドRNAの構造的(主鎖)成分の配列はcpf1の配列に類似しているものの、MG29-1ガイドに対してどの化学修飾が活性を保持しつつも安定性を向上させることが可能かについては知られていなかった。哺乳動物細胞におけるsgRNA活性および哺乳動物細胞のタンパク質抽出物が存在する場合の安定性に対するそれらの影響を評価するため、一連のMG29-1 sgRNAの化学修飾を設計した。
本発明者らは、sgRNA mAlb29-1-8を選択した。これは、ガイドがcpf1のガイドRNAの活性を向上させるように設計されているAltR1/AltR2として知られているIDTが開発した固有の化学修飾のセットを含有する場合に、マウス肝細胞株であるHepa1~6で高度に活性があるものであり、市販されている(IDT)。本発明者らは、ヌクレオベースの2つの化学修飾である、2’ヒドロキシル基をメチル基に置換した2’-O-メチルと、2’ヒドロキシル基をフッ素に置換した2’-フルオロとを試験するために選択した。2’-O-メチルと2’-フルオロ修飾の両方は、ヌクレアーゼに対する耐性を向上させる。2’-O-メチル修飾は、RNAの転写修飾後に天然に存在し、RNA:RNA二重鎖の結合親和性を向上させるが、RNA:DNA安定性における影響はほとんどない。2’-フルオロ修飾塩基は免疫活性化作用を低減し、RNA:RNAとRNA:DNAハイブリッドの両方の結合親和性を増加させる(Pallan et al Nucleic Acids Res 2011 Apr;39(8):3482-95,Chen et al Scientific Reports volume 9,Article number:6078(2019),Kawasaki,A.M.et al J Med Chem 36,831-841(1993))。
塩基間のホスホジエステル結合の代わりにチオリン酸(PS)結合を含むこともまた評価した。PS結合はヌクレアーゼに対する耐性を向上させる(Monia et al Nucleic Acids,Protein Synthesis,and Molecular Genetics|Volume 271,ISSUE 24,P14533-14540,June 14,1996)。
マウスのアルブミンイントロン1を標的化するスペーサー(mAlb29-1-8)を有するMG29-1 sgRNAの予想される二次構造を、図54に示す。他のCRISPR-Cas系について知られていることに基づき、ガイドの主鎖部分のステムループがMG29-1タンパク質との相互作用にとって重要であると推定した。二次構造に基づき、ガイドの異なる構造領域および機能領域における一連の化学修飾を設計した。ガイドのどの構造領域および機能領域が、活性を著しく損なうことなく異なる化学修飾を許容することができるのかを知らせる、化学修飾がより少ないガイドの初期試験を可能とするモジュラーアプローチを採用した。構造領域および機能領域を以下のように定義した。ガイドの3’末端および5’末端はエキソヌクレアーゼの標的であり、2’-O-メチルおよびPS結合を含む様々な化学修飾、spCas9のガイドの安定性を向上させるために使用されるアプローチにより保護され得る(Hendel et al,Nat Biotechnol.2015 Sep;33(9):985-989)。
修飾のため、ガイドの主鎖領域のステムとループの半数の両方を含む配列を選択した。スペーサーを、シード領域(PAMに最接近している最初の6ヌクレオチド)およびスペーサーの残り16ヌクレオチド(非シード領域と呼ばれる)に分けた。全体で43個のガイドを設計し、39個を合成した。43個のガイド全ては同一のヌクレオチド配列を含有するが、化学修飾が異なっている。RNPのヌクレオフェクションによって、またはMG29-1およびガイドをコードするmRNAの同時トランスフェクションによって、またはこれら両方の方法によって、Hepa1~6細胞における39個のガイドの編集活性を評価した。これら2つのトランスフェクション方法は、細胞への送達における差のため、ガイドの観察された活性に影響を与え得る。
RNPのヌクレオフェクションを使用する場合、ガイドおよびMG29-1タンパク質を試験管内で予め組み合わせ、続いてヌクレオフェクションを使用して細胞にこれらを送達する。このヌクレオフェクションでは、RNPの存在下で細胞懸濁液に電流を印加する。電流は細胞膜(および場合によっては核膜も該当)に一時的に細孔を開け、RNPにおける電荷により駆動されるRNPの細胞侵入を可能にする。電流により生成された細孔を介して、またはRNPのタンパク質成分中の遺伝子操作された核局在化シグナルを介して、またはこの2つの組合せを介してRNPが核に入るかどうかは明確にはなっていない。
Messenger MAXといった脂質トランスフェクション試薬とともにmRNAとガイドとの同時トランスフェクトを使用する場合、2つのRNAの混合物は正に帯電した脂質を有する複合体を形成する。この複合体はエンドサイトーシスにより細胞に侵入し、最終的には細胞質に到達する。細胞質では、mRNAはタンパク質に翻訳される。MG29-1などのRNAガイドヌクレアーゼの場合には、得られたMG29-1タンパク質は、MG29-1タンパク質に遺伝子操作された核局在化シグナルにより媒介されるプロセスで核に侵入する前に、細胞質にてガイドRNAと複合体を形成すると推定される。
mRNAを十分な量のMG29-1タンパク質に翻訳し、続いてMG29-1タンパク質をガイドRNAに結合するにはある一定の量の時間がかかることから、ガイドRNAは、ヌクレオフェクションにより予め形成されたRNPを送達する場合よりも長く、細胞質中に完全な状態で存在する必要があり得る。したがって、脂質ベースのmRNA/sgRNAの同時トランスフェクションは、RNPのように活性であるガイド化学物質を一部もたらすRNPヌクレオフェクションの場合よりも安定したガイドを必要とするが、カチオン性脂質試薬を使用してmRNAと同時トランスフェクトする場合には不活性であり得る。
ガイドmAlb298-1~mAlb298-5は、2’-O-メチルと2’フルオロ塩基の混合物+PS結合を使用した、配列の5’末端および3’末端のみの化学修飾を含有する。化学修飾なしのsgRNAと比較すると、これらのガイドは、RNPを介して送達される場合に7倍~11倍活性であり、ガイドに対する末端修飾はガイド活性を向上させることを実証したが、これはエキソヌクレアーゼに対する耐性を向上させたことによると推定される。sgRNAであるmAlb298-1~mAlb298-5は、市販の化学修飾(AltR1/AltR2)を含有する64~114%のガイドの編集活性を示した。ガイド4は、最大数の化学修飾を含有するが、末端修飾されたガイドの活性は最小であった。ただし、非修飾ガイドよりも依然として7倍多い活性を有していた。ガイドmAlb298-30は、5’末端に3個の2’-Oメチル塩基と2個のPS結合を、5’末端に4個の2’-Oメチル塩基と3個のPS結合を含有し、非修飾ガイドよりも約10倍高い活性も示し、mAlb298-1と比較してRNA同時トランスフェクションする場合には、ほぼ同じまたはわずかに向上したことを示した。これらのデータは、MG29-1ガイドの両末端のPS結合と組み合わせられた2’O-メチルが非修飾ガイドと比較してガイド活性が著しく増強されたことを実証する。
2’-フルオロ塩基とPS結合との組合せもまた、ガイドの3’末端で許容された。ガイドmAlb298-28は、5’末端に3個の2’-フルオロ塩基と2個のPS結合を、3’末端に4個の2’-フルオロ塩基と3個のPS結合を含有する。この末端修飾されたガイドは、両末端に2’-OメチルとPS修飾を有するガイドに類似する良好な編集活性を保持しており、ガイド安定性を向上し、編集活性を保持するために2’-フルオロが2’-Oメチルの代わりに使用されることを実証していた。
sgRNAであるmAlb298-6、mAlb298-7、およびmAlb298-8は、ステムの異なる領域にmAlb298-1+PS結合が存在する、同一の最小の化学修飾を5’末端と3’末端の両方に含有する。3’ステム(mAlb298-6)および5’ステム(mAlb298-7)のPS結合は、RNPヌクレオフェクションアッセイのmAlb298-1と比較して約30%活性を減少させた。これは、これらの修飾が許容され得ることを示した。脂質ベースのトランスフェクションにより、活性の大幅な低減が観察された。
3’ステムおよび5’ステム(mAlb298-8)の両方のPS結合を導入することで、RNPヌクレオフェクションアッセイのmAlb298-1と比較して約80%活性を減少させ、脂質トランスフェクションアッセイでは95%超減少させた。これは、2つのPS結合修飾の組合せは、ガイドの機能を著しく損なったことを示した。
sgRNAであるmAlb298-9は、mAlb298-1+ループのPS結合に存在する、同一の最小の化学修飾を5’末端と3’末端の両方に含有し、mAlb298-1と類似する活性を示した。これは、ループのPS結合が良好に許容されていることを示す。
sgRNAであるmAlb298-10、mAlb298-11、およびmAlb298-12は、ステムの異なる領域にmAlb298-1+2’-Oメチル塩基が存在する、同一の最小の化学修飾を5’末端と3’末端の両方に含有する。3’ステム(mAlb298-11)もしくは5’ステム(mAlb298-12)のいずれか、またはステム(mAlb298-10)の半数の両方に2’-Oメチル塩基を含むことで、最も活性のあるガイドであるmAlb298-12(5’ステム修飾)とmAlb298-1とを比較すると、一般には活性がわずかに低減された状態で良好に許容された。
ガイドであるmAlb298-14は、mAlb298-1+ステムの半数の両方の2’-O-メチル塩基とPS結合との組合せに存在する、同一の最小の化学修飾を5’末端と3’末端の両方に含有する。これは、RNPヌクレオフェクションまたは脂質ベースのRNA同時トランスフェクションでは編集活性を有さなかった。これは、両ステムにPS結合のみを含有するmAlb298-8が低レベルの活性を保持していたという結果を確認かつ評価しており、ステムの半数の両方の大量の化学修飾によりガイドが不活性となることを示している。
sgRNAであるmAlb298-13は、mAlb298-1+主鎖の残り部分およびスペーサーのシード領域を除くスペーサー全体にわたり、他の塩基ごとに間隔を開けているPS結合に存在する、同一の最小の化学修飾を5’末端と3’末端の両方に含有する。これらの修飾により、バックグラウンドレベルに近い編集活性の劇的な損失がもたらされた。大部分のガイドについては純度が75%を超えることと比較すると、このガイドの純度はわずかに約50%であるが、編集活性の完全な損失を引き起こすことはできなかった。これにより、ガイド全体に本質的にランダムな方式でPS結合を分布させることは、編集活性を保持しながらもガイド安定性を向上させるには有効なアプローチではない。
ガイドmAlb298-15およびmAlb298-16は、主鎖にmAlb298-1+大量のPS結合が存在する、同一の最小化学修飾を5’末端と3’末端の両方に含有する。両方のガイドは、RNPヌクレオフェクションによっては約35%のmAlb298-1の活性を保持した一方、脂質ベースのRNA同時トランスフェクションによってはわずか3%のmAlb298-1の活性を保持した。これは、主鎖の大量のPS修飾が編集活性を著しく低減させたことを示している。mAlb298-17およびmAlb298-18のように、主鎖のPS結合とスペーサー領域のPS結合とを組み合わせることで、PS結合をランダムに含むことがMG29-1による直接編集に対するガイドの能力を妨げるという観察結果に一致する、活性のさらなる損失がもたらされた。
ガイドであるmAlb298-19は、スペーサーにmAlb298-1と同一の化学修飾を含有するが、主鎖領域では、5’端部はさらに4個の2’O-メチル塩基とさらに14個のPS結合を有する。mAlb298-19の活性は、RNPヌクレオフェクションにより約40%のmAlb298-1の活性であったが、RNA同時トランスフェクションではわずか22%であった。これは、ガイドの主鎖領域の大量の化学修飾が良好に許容されていないことをさらに実証している。
ガイドであるmAlb298-20、mAlb298-21、mAlb298-22、およびmAlb298-23は、5’末端に単一の2’-Oメチルと、mAlb298-1と同じ5’末端修飾である2個のPS結合から構成された主鎖領域に、同一の化学修飾を有する。ガイドであるmAlb298-20、mAlb298-21、mAlb298-22、およびmAlb298-23のスペーサー領域は、2’-O-メチルと2’-フルオロ塩基との組合せ、ならびにPS結合を含有する。これらの4ガイドのうち最も活性があるものはmAlb298-2である。この中の2’-フルオロ修飾は、PAM(シード領域)に最も近い7塩基および2’-O-メチルと2個のPS結合で修飾された3’末端の最終塩基を除き、スペーサーの全ての塩基に作製された。これは、シード領域を除き、スペーサーの大部分に2’-フルオロ修飾を含むということは活性を著しく低減させず、それによってガイド安定性を増強させる良好な戦略を表すということを実証している。
ガイドであるmAlb298-24、mAlb298-25、mAlb298-26、およびmAlb298-8は、主鎖に同一の化学修飾を有する。ステムの半数の両方にPS結合を有するmAlb298-8は、編集活性がわずか24%(ガイドであるmAlb298-1の2%)に著しく低減し、これらのPS結合が活性を損なったことを実証している。興味深いことには、mAlb298-24およびmAlb298-25の編集活性も低かったものの、mAlb298-26の活性はmAlb298-8と比較すると向上していた。これは、スペーサー(シード領域を除く)中の14個の塩基に2’-フルオロ塩基を含むmAlb298-26のさらなる修飾が、ステム中のPS結合により引き起こされた編集活性の低減を救済可能であることを示している。これは、編集活性時にスペーサー中の2’-フルオロ塩基が有益に影響するというさらなる証拠を提供する。
ガイドであるmAlb298-27およびmAlb298-29は、主鎖および活性のないスペーサー領域の全体にわたって大量の塩基およびPS修飾を含有する。これは、ガイドの化学修飾全てが編集活性を保持するわけではないということをさらに示している。
mAlb298-1~mAlb298-30のガイドの解析から得られた構造活性の関係に基づき、7個のガイドのさらなるセットを設計し、Hepa1~6細胞のRNPヌクレオフェクションおよび脂質ベースのRNA同時トランスフェクションによって設計した。これらのガイドは、mAlb298-1~mAlb298-30のガイドで良好な編集活性を保持すると観察されている化学修飾を組み合わせた。ガイドであるmAlb298-31~mAlb298-37は全て、5’末端の少なくとも1個の2’-Oメチルおよび2個のPS結合と、5’末端の1個の2’-Oメチルおよび1個のPS結合とから構成される末端修飾を含有する。末端修飾に加え、mAlb298-31のようにステムの半数の両方の2’-Oメチル塩基とスペーサー(シード領域を除く)の14個の塩基の2’-フルオロ塩基とを組み合わせることで、非修飾ガイドと比較してわずかに向上した、または単独で末端修飾に類似しており10倍向上した編集活性がもたらされた。mAlb298-32のように適当な5’ステムの2’-Oメチル塩基と、スペーサー(シード領域を除く)の14個の塩基の2’-フルオロ塩基とを組み合わせることで、試験した中で最も活性であるガイドがもたらされた。
同様に、mAlb298-33のように、適当なループのPS結合とスペーサー(シード領域を除く)の14個の塩基の2’-フルオロ塩基とを組み合わせることで、非修飾ガイドよりも最大で15倍高い強力な活性がもたらされた。ガイドであるmAlb298-37は、さらに大量の3’末端修飾と、5’ステムの2’-Oメチル塩基、ループ中のPS結合および14個の2’フルオロ塩基、ならびにスペーサー(シード領域を除く)中の3個のPS結合とを組み合わせる。このガイドは、AltR1/R2修飾の編集活性に類似する編集活性を依然として保持しており、非修飾ガイドと比較すると著しく向上していた。したがって、mAlb298-37は、哺乳動物細胞において強力な編集活性を保持している重度に修飾されたMG29-1ガイドを表している。ガイドであるmAlb298-38は、RNPとして送達された場合には強力な編集活性を示したが、脂質ベースのRNA同時トランスフェクションにより細胞に送達される場合には完全に不活性であった。これは、このようなガイドはヌクレアーゼに対して予想されていなかった感受性をいくらか有する可能性があることを示唆している。スペーサーにおいて11個のより少ない2’-フルオロ塩基と1個少ないPS結合を有すること以外はガイドであるmAlb298-37と同一のガイドであるmAlb298-39は、RNPとmRNAの両方のトランスフェクション法を考慮すると最も高い編集活性を有したが、インビボでの性能という点では有害である可能性があるいくつかの他のガイド設計よりも化学修飾が少ない。
より大量の化学修飾を有するものの、良好な編集活性もまた保持し得るmAlb298-40~mAlb298-43を作成するため、さらなる組合せの化学修飾を設計した。例えば、一部のDNA塩基もまた組み入れるmAlb298-41では、わずか6個の塩基のみが非修飾リボヌクレオチドである。同様に、mAlb298-42は全スペーサーにわたり2’-フルオロ基を含有し、5個の非修飾リボヌクレオチドを有する。本発明者らは、これらの試験および他のガイド化学修飾により、1つ以上の最適化された設計がもたらされることを予想している。それにもかかわらず、ガイドであるmAlb298-1~mAlb298-39のセット、とりわけmAlb298-31~mAlb298-39のセット内では、本発明者らは、非修飾ガイドまたは適当な末端修飾を有するガイドの編集活性と同様またはこれに優る編集活性を保持する大量の化学修飾を有するガイドを同定する。
化学修飾を有さないガイド(天然RNA)と比較して化学修飾ガイドの安定性を試験するため、細胞の粗抽出物を使用する安定性アッセイを使用した。インビトロまたはインビボで哺乳動物細胞に送達される場合、ガイドRNAが曝されるヌクレアーゼ混合物を含有しなければならないことから、哺乳動物細胞に由来する細胞の粗抽出物を選択した。コンフルエントな細胞の15cmのディッシュにつき3mlの冷PBSを加え、セルスクレーパーを使用してディッシュ表面から細胞を放出することで、Hepa1~6細胞を収集した。細胞を200gで10分間ペレット化し、将来的に使用するために-80℃で凍結した。安定性アッセイのため、4体積の冷PBS中に細胞を再懸濁させた(例えば、100mgのペレットについては、400μLの冷PBS中に細胞を再懸濁させた)。0.2%の最終濃度(v/v)までTriton X-100を加え、細胞を10秒間ボルテックスし、10分間にわたって氷上に配置し、再度10秒間ボルテックスした。Triton X-100は、細胞膜を破壊するが使用される濃度ではタンパク質を不活化または変性させることがない、反応が穏やかな非イオン性界面活性剤である。
氷上にて安定性反応を構成した。これは、100fmolの各ガイドを含む20μLの細胞の粗抽出物からなった(1μLの100nM ストック)。投入時、15分、30分、60分、240分および540分(分で表しているこの時間は、各試料をインキュベートした時間の長さを指す)からなる6つの反応をガイドごとに構成した。試料を37℃で15分~最大540分インキュベートし、投入時のコントロールを氷上に5分間静置した。各インキュベーション期間後、全てのタンパク質を直ちに変性し、リボヌクレアーゼを効率的に阻害し、RNAのその後の回収を推進する、300μLのフェノールとグアニジンチオシアン酸塩の混合物(Tri reagent,Zymo Research)を加えることで反応を停止させた。Tri reagentを加えた後、試料を15秒間ボルテックスし、-20℃で保存した。Direct-zol RNAミニプレップキット(Zymo Research)を使用して試料からRNAを抽出し、100μLのヌクレアーゼフリー水に溶出させた。Taqman miRNAアッセイ技術(Thermo Fisher)を使用するTaqman RT-qPCR、ならびにガイドの全てについて同一であるmAlb298 sgRNAの配列を特異的に検出するために設計されたプライマーおよびプローブを使用し、修飾されたガイドの検出を行った。投入した試料と比較して残留するsgRNAのパーセンテージの関数としてデータをプロットした。細胞抽出物(図55)でインキュベートした場合に化学修飾を有さないガイドは最も迅速に除去され、90%超のガイドは30分以内に分解された。AltR1/AltR2(図55のAltR)化学修飾を有するガイドは、細胞抽出物の存在下では非修飾ガイドよりもわずかに安定性があり、約80%のガイドは30分で分解された。両端に化学修飾、ならびに両方のステムに2’O-メチル塩基およびシード領域を除くスペーサーの全ての位置に2’-フルオロ塩基を含有する、ガイドであるmAlb298-31は、非修飾ガイドまたはAltRガイドのいずれかよりも著しく安定していた。
ガイドであるmAlb298-34は、ガイドであるmAlb298-31と比較して向上した安定性を示した。ガイドであるmAlb298-34は、スペーサー内部の化学修飾においてのみガイドであるmAlb298-31とは異なっている。mAlb298-34はスペーサーにmAlb298-31よりも9個少ない2’-フルオロ塩基を有するが、mAlb298-31の2個のPS結合と比較すると、スペーサーに4個のPS結合を含有する。2’-フルオロ塩基はRNAの安定性を向上させることから、このことは、スペーサーの追加のPS結合が、mAlb298-31と比較してmAlb298-34の安定性を向上させる原因であることを示唆している。
ガイドであるmAlb298-37は試験されたガイド全ての中で最も安定しており、240分(4時間)後に80%のガイドが残留しているという点で、30%残留していたmAlb298-34と比較するとこれよりも著しく安定していた。mAlb298-37の化学修飾は、スペーサーと主鎖領域の両方においてガイドであるmAlb298-34とは異なっている。mAlb298-37は、5’末端にさらに2個の2’-O-メチル基とさらに2個のPS結合を有する。さらに、mAlb298-37のループ領域はPS結合を含有し、mAlb298-34のステム後半に存在する2’-O-メチル基を含有しない。さらに、mAlb298-37のスペーサーは9個多い2’-フルオロ塩基を含有するが、異なる配置とはいえmAlb298-34と同数のPS結合を含有する。
全体的には、これらのデータはスペーサーの5’末端および主鎖領域のループのさらなるPS結合がガイドRNAの安定性を著しく向上させることを示唆している。試験されたガイドの中で、細胞抽出物中で最大の安定性を示すガイドであるmAlb298-37は、AltR1/Altr2修飾と比較して類似または向上している、5’末端および3’末端のみの化学修飾と比較して向上している、Hepa1~6細胞における強力な編集活性も示した。
Figure 2023517041000040
Figure 2023517041000041
Figure 2023517041000042
Figure 2023517041000043
Figure 2023517041000044
Figure 2023517041000045
Figure 2023517041000046
Figure 2023517041000047
実施例36 本明細書に説明されているヌクレアーゼを使用した、マウスの治療的な遺伝子編集
本明細書に説明されている遺伝子編集プラットフォームは、インビボでの修復変性に影響する可能性がある。肝組織は組織の一例であるが、これは、例えば有害遺伝子の発現をノックダウンするように機能し、かつ/または欠陥遺伝子を置換するために使用される挿入欠失の導入による、本明細書に説明されているインビボでの遺伝子編集のための遺伝子編集組成物および系を使用して有利に標的化されることができる。例えば、いくつかの遺伝性疾患は主に肝臓で発現するタンパク質の欠陥から生じ、肝臓へのインビボ送達はアデノ随伴ウイルス(AAV)ベクターによる臨床試験では安全かつ有効であることが照明されている。核酸およびRNAi戦略向けの承認済薬物を送達するための脂質ナノ粒子もまた示している。肝組織はまた、全身循環にタンパク質を有効に分泌するための適切な細胞機構を含む。
遺伝子編集治療のため、表13または表14の症状を有する対象を選択する。例えば、遺伝子編集プラットフォームを使用し、遺伝子補充治療による処置を行うため、血友病Aに罹患しているヒトまたはマウスのモデル対象を識別した。
Figure 2023517041000048
Figure 2023517041000049
本明細書に説明されているMGヌクレアーゼをコードするsgRNAおよびmRNAをカプセル化している脂質ナノ粒子(LNP)を含む遺伝子編集プラットフォーム、ならびに治療用遺伝子をコードするドナーテンプレート核酸を含むAAV(例えば、AAVセロタイプ8)を、対象の肝臓へ静脈内導入する。LNPの表面機能化により、LNPを肝細胞に標的化する。
例えば、血友病Aに罹患している対象は、本明細書に説明されているMG29-1ヌクレアーゼをコードするmRNA(配列番号214)を含有するLNPを含む、遺伝子補充プラットフォームを用いて処置される。LNPはまた、肝臓内部で高度に発現されるアルブミンIに特異的なsgRNAを含有する(例えば、アルブミンは肝臓内では約5g/dLで発現可能であるが、第VIII因子は肝臓内では約10μg/dLで発現可能である。これはすなわち、アルブミンよりも100万倍少ない)。LNPに加え、第VIII因子補充ヌクレオチド配列をコードする補充テンプレートDNAをコードするプラスミドを含むAAV8(AAVセロタイプ8)ウイルス粒子を、同様に対象に送達する。一旦、細胞内部に入ると、mRNA、sgRNA、およびテンプレートDNAが一時的に発現する。MG29-1ヌクレアーゼは、sgRNAを使用して宿主肝細胞DNAの標的遺伝子座を標的化し、宿主DNAを切断する。AAV8内の宿主肝細胞に送達されるプラスミドから転写されたドナーテンプレートDNAを細胞にスプライシングし、アルブミンI遺伝子の標的部位で宿主DNAへと安定して組み込む。挿入された第VIII因子のDNAをアルブミンプロモーターの下で発現させる。
遺伝子ノックダウン治療のために選択された対象にて、遺伝子編集プラットフォームも使用する。例えば、本明細書に説明されているMG29-1ヌクレアーゼをコードするmRNA(配列番号214)およびトランスサイレチン遺伝子の標的部位に特異的なsgRNAを含有するLNPを用いて、遺伝性ATTRアミロイドーシスを呈している対象を処置する。MG29-1ヌクレアーゼおよびsgRNAを送達し、対象の肝細胞中で発現する。いくつかの実施形態では、sgRNAをトランスサイレチン遺伝子の終止コドンに標的化し、MG29-1ヌクレアーゼの活性を内因性終止コドンから除去し、遺伝子の発現を効果的にノックダウンする。いくつかの実施形態では、遺伝子ノックダウンプラットフォームは、終止コドンを含むポリヌクレオチドをコードするプラスミドを含有するAAV8を含む。ヌクレアーゼおよびsgRNAを発現している同一の細胞にAAV8を送達する場合、外因性終止コドンをトランスサイレチン遺伝子にスプライシングする。こうすることで、編集したDNAから産生されたRNAから翻訳されているタンパク質の成熟前短縮化の結果として、遺伝子の発現のノックダウンが生じる。
本明細書には本発明の好ましい実施形態が示され、説明されているが、かかる実施形態は例としてのみ提供されることは当業者には明らかとなるであろう。本発明は、明細書内に提供されている特定の実施例により限定されることを意図していない。本発明は、前述の明細書を参照して説明されてきたが、本明細書の実施形態の説明および例示は、限定的な意味で解釈されることを意味していない。当業者にとっては、多数の変形、変更および置換が本明細書から逸脱することがない限り、ここで行われる。さらに、本発明の全ての態様は、様々な条件および変数に依存する、本明細書に記載の特定の描写、構成または相対的割合に限定されないということを理解されたい。本発明の実践時に、本明細書に説明されている本発明の実施形態に対する様々な代替形態が利用され得ることを理解されたい。したがって、本発明はこうした代替、修正、変更または同等物のいずれかもまた包含することを企図している。以下の特許請求の範囲は発明の範囲を定義するものであり、これらの特許請求の範囲内の方法および構造ならびにこれらの同等物をこれによって包含することを意図している。

Claims (164)

  1. 遺伝子操作されたヌクレアーゼ系であって、
    (a)RuvCドメインを含むエンドヌクレアーゼであって、前記エンドヌクレアーゼが未培養の微生物に由来しており、かつCas12aエンドヌクレアーゼである、RuvCドメインを含むエンドヌクレアーゼと、
    (b)遺伝子操作されたガイドRNAであって、前記遺伝子操作されたガイドRNAが前記エンドヌクレアーゼと複合体を形成するように構成され、標的核酸配列にハイブリダイズするように構成されたスペーサー配列を含む、遺伝子操作されたガイドRNAと、を含む、遺伝子操作されたヌクレアーゼ系。
  2. 遺伝子操作されたヌクレアーゼ系であって、
    (a)配列番号1~3470のうちいずれか1つに対して少なくとも75%の配列同一性を有するエンドヌクレアーゼまたはそのバリアントと、
    (b)遺伝子操作されたガイドRNAであって、前記遺伝子操作されたガイドRNAが前記エンドヌクレアーゼと複合体を形成するように構成され、標的核酸配列にハイブリダイズするように構成されたスペーサー配列を含む、遺伝子操作されたガイドRNAと、を含む、遺伝子操作されたヌクレアーゼ系。
  3. 遺伝子操作されたヌクレアーゼ系であって、
    (a)配列番号3862~3913のうちいずれか1つを含むプロトスペーサー隣接モチーフ(PAM)配列に結合するように構成されたエンドヌクレアーゼであって、クラス2のV型Casエンドヌクレアーゼである、エンドヌクレアーゼと、
    (b)遺伝子操作されたガイドRNAであって、前記遺伝子操作されたガイドRNAが前記エンドヌクレアーゼと複合体を形成するように構成され、標的核酸配列にハイブリダイズするように構成されたスペーサー配列を含む、遺伝子操作されたガイドRNAと、を含む、遺伝子操作されたヌクレアーゼ系。
  4. 前記エンドヌクレアーゼが、ジンクフィンガー様ドメインをさらに含む、請求項1~3のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
  5. 前記ガイドRNAが、配列番号3471、3551~3559、3608~3609、3612、3636~3637、3640~3641、3644~3645、3648~3649、3652~3653、3656~3657、3660~3661、3664~3667、3671~3672、~3678、3695~3696、3729~3730、3734~3735、および3851~3857のうちいずれか1つの非縮重ヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含む、請求項1~4のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
  6. 遺伝子操作されたヌクレアーゼ系であって、
    (a)配列番号3471、3539、3551~3559、3608~3609、3612、3636~3637、3640~3641、3644~3645、3648~3649、3652~3653、3656~3657、3660~3661、3664~3667、3671~3672、3677~3678、3695~3696、3729~3730、3734~3735、および3851~3857のうちいずれか1つの非縮重ヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含む遺伝子操作されたガイドRNAと、
    (b)前記遺伝子操作されたガイドRNAに結合するように構成されたクラス2のV型Casエンドヌクレアーゼと、を含む、遺伝子操作されたヌクレアーゼ系。
  7. 前記エンドヌクレアーゼが、配列番号3863~3913のいずれか1つを含むプロトスペーサー隣接モチーフ(PAM)配列に結合するように構成されている、請求項1~6のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
  8. 前記ガイドRNAが、真核生物、真菌、植物、哺乳動物、またはヒトゲノムのポリヌクレオチド配列に相補的な配列を含む、請求項1~7のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
  9. 前記ガイドRNAが30~250ヌクレオチド長である、請求項1~8のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
  10. 前記エンドヌクレアーゼが、前記エンドヌクレアーゼのN末端またはC末端近位に1つ以上の核局在化配列(NLS)を含む、請求項1~9のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
  11. 前記NLSが、配列番号3938~3953からなる群の配列に対して少なくとも80%同一である配列を含む、請求項1~10のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
  12. 前記エンドヌクレアーゼの配列が配列番号215に対して最適にアラインメントされている場合には、前記エンドヌクレアーゼが以下の変異:S168R、E172R、N577R、またはY170Rのうち少なくとも1つを含む、請求項1~10のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
  13. 前記エンドヌクレアーゼの配列が配列番号215に対して最適にアラインメントされている場合には、前記エンドヌクレアーゼが変異S168RおよびE172Rを含む、請求項1~10のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
  14. 前記エンドヌクレアーゼの配列が配列番号215に対して最適にアラインメントされている場合には、前記エンドヌクレアーゼが変異N577RまたはY170Rを含む、請求項1~10のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
  15. 前記エンドヌクレアーゼの配列が配列番号215に対して最適にアラインメントされている場合には、前記エンドヌクレアーゼが変異S168Rを含む、請求項1~10のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
  16. 前記エンドヌクレアーゼがE172、N577、またはY170の変異を含まない、請求項15に記載の遺伝子操作されたヌクレアーゼ系。
  17. 一本鎖または二本鎖DNA修復テンプレートであって、5’~3’で、すなわち前記標的デオキシリボ核酸配列に対して5’で少なくとも20ヌクレオチドの配列を含む第1のホモロジーアームと、少なくとも10ヌクレオチドの合成DNA配列と、前記標的配列に対して3’で少なくとも20ヌクレオチドの配列を含む第2のホモロジーアームと、を含む一本鎖または二本鎖DNA修復テンプレート、
    をさらに含む、請求項1~16のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
  18. 前記第1のホモロジーアームまたは前記第2のホモロジーアームが、少なくとも40、80、120、150、200、300、500、または1,000ヌクレオチドの配列を含む、請求項17に記載の遺伝子操作されたヌクレアーゼ系。
  19. 前記第1のホモロジーアームおよび前記第2のホモロジーアームが、原核生物、細菌、真菌、または真核生物のゲノム配列に相同である、請求項12~18のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
  20. 前記一本鎖または前記二本鎖DNA修復テンプレートが導入遺伝子のドナーを含む、請求項12~19のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
  21. 1つまたは2つの一本鎖DNAセグメントと隣接している二本鎖DNAセグメントを含むDNA修復テンプレートをさらに含む、請求項1~20のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
  22. 一本鎖DNAセグメントが、前記二本鎖DNAセグメントの5’末端にコンジュゲートされている、請求項21に記載の遺伝子操作されたヌクレアーゼ系。
  23. 前記一本鎖DNAセグメントが、前記二本鎖DNAセグメントの3’末端にコンジュゲートされている、請求項21に記載の遺伝子操作されたヌクレアーゼ系。
  24. 前記一本鎖DNAセグメントが、4~10ヌクレオチド塩基の長さを有する、請求項21~23のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
  25. 前記一本鎖DNAセグメントが、前記スペーサー配列内の配列に相補的なヌクレオチド配列を有する、請求項21~24のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
  26. 前記二本鎖DNA配列が、バーコード、オープンリーディングフレーム、エンハンサー、プロモーター、タンパク質コード配列、miRNAコード配列、RNAコード配列、または導入遺伝子を含む、請求項21~25のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
  27. 前記二本鎖DNA配列がヌクレアーゼ切断部位と隣接している、請求項21~25のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
  28. 前記ヌクレアーゼ切断部位がスペーサー配列およびPAM配列を含む、請求項27に記載の遺伝子操作されたヌクレアーゼ系。
  29. 前記ヌクレアーゼ系がMg2+源をさらに含む、請求項1~28のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
  30. 前記ガイドRNAが、少なくとも8、少なくとも10、または少なくとも12塩基対のリボヌクレオチドを含むヘアピンを含む、請求項1~29のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
  31. 前記ヘアピンが10塩基対のリボヌクレオチドを含む、請求項30に記載の遺伝子操作されたヌクレアーゼ系。
  32. a)前記エンドヌクレアーゼが、配列番号141、215、229、261、もしくは1711~1721のうちいずれか1つに対して少なくとも75%、80%、もしくは90%同一の配列、またはそのバリアントを含み、
    b)前記ガイドRNA構造が、配列番号3608~3609、3853、または3851~3857のうちいずれか1つの非縮重ヌクレオチドに対して少なくとも80%、または90%同一の配列を含む、
    請求項1~31のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
  33. 前記エンドヌクレアーゼが、配列番号3863~3913のうちいずれか1つを含むPAMに結合するように構成されている、請求項1~32のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
  34. 前記エンドヌクレアーゼが配列番号3871を含むPAMに結合するように構成されている、請求項1~32のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
  35. 前記配列同一性が、Smith-Watermanホモロジー検索アルゴリズムパラメータでBLASTP、CLUSTALW、MUSCLE、MAFFTアルゴリズム、またはCLUSTALWアルゴリズムによって決定される、請求項5~34のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
  36. 前記配列同一性が、3のワード長(W)、10の期待値(E)のパラメータ、および11の存在、1の伸長でのギャップコストを設定しているBLOSUM62スコア行列を使用する、ならびに条件付き組合せスコア行列の調整を使用する、前記BLASTPホモロジー検索アルゴリズムによって決定される、請求項35に記載の遺伝子操作されたヌクレアーゼ系。
  37. 遺伝子操作されたガイドRNAであって、
    a)標的DNA分子中の標的配列に相補的であるヌクレオチド配列を含むDNA標的セグメントと、
    b)二本鎖RNA(dsRNA)二重鎖を形成するようにハイブリダイズするヌクレオチドの2つの相補的な並びを含むタンパク質結合セグメントと、を含み、
    前記ヌクレオチドの2つの相補的な並びが、介在性ヌクレオチドと互いに共有結合され、
    前記遺伝子操作されたガイドリボ核酸ポリヌクレオチドが、配列番号1~3470のうちいずれか1つに対して少なくとも75%の配列同一性を有するエンドヌクレアーゼとの複合体の形成、および前記標的DNA分子の前記標的配列への前記複合体の標的化、が可能である、遺伝子操作されたガイドRNA。
  38. 前記DNA標的セグメントが、前記ヌクレオチドの2つの相補的な並びの両方の3’に位置づけられている、請求項37に記載の遺伝子操作されたガイドリボ核酸ポリヌクレオチド。
  39. 前記タンパク質結合セグメントが、配列番号3608~3609の非縮重ヌクレオチドに対して少なくとも70%、少なくとも80%、または少なくとも90%の同一性を有する配列を含む、請求項37~38に記載の遺伝子操作されたガイドリボ核酸ポリヌクレオチド。
  40. 前記二本鎖RNA(dsRNA)二重鎖が、少なくとも5、少なくとも8、少なくとも10、または少なくとも12リボヌクレオチドを含む、請求項37~39のいずれか一項に記載の遺伝子操作されたガイドリボ核酸ポリヌクレオチド。
  41. 請求項1~40のいずれか一項に記載の遺伝子操作されたガイドリボ核酸ポリヌクレオチドをコードするデオキシリボ核酸ポリヌクレオチド。
  42. 生物での発現に最適化された遺伝子操作された核酸配列を含む核酸であって、前記核酸がクラス2のV型Casエンドヌクレアーゼをコードしており、前記エンドヌクレアーゼが未培養の微生物に由来し、前記生物が前記未培養の生物ではない、核酸。
  43. 前記エンドヌクレアーゼが、配列番号1~3470のうちいずれか1つに対して少なくとも70%、または少なくとも80%の配列同一性を有するバリアントを含む、請求項42に記載の核酸。
  44. 前記エンドヌクレアーゼが、前記エンドヌクレアーゼのN末端またはC末端近位に1つ以上の核局在化配列(NLS)をコードする配列を含む、請求項42または43に記載の核酸。
  45. 前記NLSが配列番号3938~3953から選択された配列を含む、請求項44に記載の核酸。
  46. 前記NLSが配列番号3939を含む、請求項44または45に記載の核酸。
  47. 前記NLSが前記エンドヌクレアーゼの前記N末端近位にある、請求項46に記載の核酸。
  48. 前記NLSが配列番号3938を含む、請求項44または45に記載の核酸。
  49. 前記NLSが前記エンドヌクレアーゼの前記C末端近位にある、請求項48に記載の核酸。
  50. 前記生物が、原核生物、細菌、真核生物、真菌、植物、哺乳動物、げっ歯類、またはヒトである、請求項42~49のいずれか一項に記載の核酸。
  51. クラス2のV型Casエンドヌクレアーゼをコードする核酸配列を含む遺伝子操作されたベクターであって、前記エンドヌクレアーゼが未培養の微生物に由来する、遺伝子操作されたベクター。
  52. 請求項42~46のいずれか一項に記載の核酸を含む遺伝子操作されたベクター。
  53. 請求項41に記載のデオキシリボ核酸ポリヌクレオチドを含む遺伝子操作されたベクター。
  54. 前記ベクターがプラスミド、ミニサークル、CELiD、アデノ随伴ウイルス(AAV)由来のウイルス粒子、レンチウイルス、またはアデノウイルスである、請求項51~53のいずれか一項に記載の遺伝子操作されたベクター。
  55. 請求項51~54のいずれか一項に記載のベクターを含む細胞。
  56. エンドヌクレアーゼを製造する方法であって、請求項55に記載の細胞を培養することを含む、方法。
  57. 二本鎖デオキシリボ核酸ポリヌクレオチドを結合、切断、マーキング、または修飾するための方法であって、
    (a)前記エンドヌクレアーゼおよび前記二本鎖デオキシリボ核酸ポリヌクレオチドに結合するように構成された遺伝子操作されたガイドRNAを含む複合体中で、前記二本鎖デオキシリボ核酸ポリヌクレオチドとクラス2のV型Casエンドヌクレアーゼとを接触させること、を含み、
    前記二本鎖デオキシリボ核酸ポリヌクレオチドがプロトスペーサー隣接モチーフ(PAM)を含み、
    前記PAMが配列番号3863~3913のうちいずれか1つを含む配列を含む、方法。
  58. 前記二本鎖デオキシリボ核酸ポリヌクレオチドが、前記遺伝子操作されたガイドRNAの配列に相補的な配列を含む第1の鎖と、前記PAMを含む第2の鎖と、を含む、請求項57に記載の方法。
  59. 前記PAMが、前記遺伝子操作されたガイドRNAの前記配列に相補的な前記配列の5’末端に直接隣接している、請求項58に記載の方法。
  60. 前記PAMが配列番号3871を含む、請求項57~59のいずれか一項に記載の方法。
  61. 前記クラス2のV型Casエンドヌクレアーゼが未培養の微生物に由来する、請求項57~60のいずれか一項に記載の方法。
  62. 前記二本鎖デオキシリボ核酸ポリヌクレオチドが、真核生物、植物、真菌、哺乳動物、げっ歯類、またはヒト二本鎖デオキシリボ核酸ポリヌクレオチドである、請求項57~61のいずれか一項に記載の方法。
  63. 標的核酸遺伝子座を修飾する方法であって、前記方法が、請求項1~36のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系を前記標的核酸遺伝子座に送達することを含み、前記エンドヌクレアーゼが前記遺伝子操作されたガイドリボ核酸構造と複合体を形成するように構成され、前記複合体を前記標的核酸遺伝子座に結合する際に前記複合体が前記標的核酸遺伝子座を修飾するように、前記複合体が構成されている、方法。
  64. 前記標的核酸遺伝子座を修飾することが、前記標的核酸遺伝子座を結合、前記標的核酸遺伝子座に切れ目をいれる、前記標的核酸遺伝子座を切断、または前記標的核酸遺伝子座をマーキングすることを含む、請求項63に記載の方法。
  65. 前記標的核酸遺伝子座がデオキシリボ核酸(DNA)またはリボ核酸(RNA)を含む、請求項63または64に記載の方法。
  66. 前記標的核酸がゲノムDNA、ウイルスDNA、ウイルスRNA、または細菌DNAを含む、請求項63に記載の方法。
  67. 前記標的核酸遺伝子座がインビトロである、請求項63~66のいずれか一項に記載の方法。
  68. 前記標的核酸遺伝子座が細胞内にある、請求項63~66のいずれか一項に記載の方法。
  69. 前記細胞が原核生物細胞、細菌細胞、真核生物細胞、真菌細胞、植物細胞、動物細胞、哺乳動物細胞、げっ歯類細胞、霊長類細胞、ヒト細胞、または初代細胞である、請求項68に記載の方法。
  70. 前記細胞が初代細胞である、請求項68または69に記載の方法。
  71. 前記初代細胞がT細胞である、請求項70に記載の方法。
  72. 前記初代細胞が造血幹細胞(HSC)である、請求項70に記載の方法。
  73. 前記遺伝子操作されたヌクレアーゼ系を前記標的核酸遺伝子座に送達することが、請求項42~46のいずれか一項に記載の核酸、または請求項51~54のいずれか一項に記載のベクターを送達することを含む、請求項63~72のいずれか一項に記載の方法。
  74. 前記遺伝子操作されたヌクレアーゼ系を前記標的核酸遺伝子座に送達することが、前記エンドヌクレアーゼをコードするオープンリーディングフレームを含む核酸を送達することを含む、請求項63~73のいずれか一項に記載の方法。
  75. 前記核酸が、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームが動作可能に連結されているプロモーターを含む、請求項74に記載の方法。
  76. 前記遺伝子操作されたヌクレアーゼ系を前記標的核酸遺伝子座に送達することが、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームを含有するキャップされたmRNAを送達することを含む、請求項63~75のいずれか一項に記載の方法。
  77. 前記遺伝子操作されたヌクレアーゼ系を前記標的核酸遺伝子座に送達することが、翻訳されたポリペプチドを送達することを含む、請求項63~76のいずれか一項に記載の方法。
  78. 前記遺伝子操作されたヌクレアーゼ系を前記標的核酸遺伝子座に送達することが、リボ核酸(RNA)pol IIIプロモーターに動作可能に連結された前記遺伝子操作されたガイドRNAをコードするデオキシリボ核酸(DNA)を送達することを含む、請求項63~76のいずれか一項に記載の方法。
  79. 前記エンドヌクレアーゼが、前記標的遺伝子座でまたは前記標的遺伝子座近傍で、一本鎖切断または二本鎖切断を誘導する、請求項63~78のいずれか一項に記載の方法。
  80. 前記エンドヌクレアーゼが、前記標的遺伝子座内で、または前記標的遺伝子座に対して3’でねじれ形の一本鎖切断を誘導する、請求項79に記載の方法。
  81. 細胞のTRAC遺伝子座を編集する方法であって、
    (a)RNAガイドエンドヌクレアーゼ、および
    (b)遺伝子操作されたガイドRNAであって、前記遺伝子操作されたガイドRNAが前記エンドヌクレアーゼと複合体を形成するように構成され、前記遺伝子操作されたガイドRNAが、前記TRAC遺伝子座の領域にハイブリダイズするように構成されたスペーサー配列を含む、遺伝子操作されたガイドRNA、を前記細胞に接触させることを含み、
    前記遺伝子操作されたガイドRNAが、配列番号4316~4369のうちいずれか1つの少なくとも18連続ヌクレオチドに対して少なくとも85%の同一性を有する標的化配列を含む、方法。
  82. 前記RNAガイドヌクレアーゼがCasエンドヌクレアーゼである、請求項81に記載の方法。
  83. 前記Casエンドヌクレアーゼがクラス2のV型Casエンドヌクレアーゼである、請求項82に記載の方法。
  84. 前記クラス2のV型Casエンドヌクレアーゼが、RuvCIサブドメイン、RuvCIIサブドメイン、およびRuvCIIIサブドメインを含むRuvCドメインを含む、請求項83に記載の方法。
  85. 前記クラス2のV型Casエンドヌクレアーゼが、配列番号1~3470のうちいずれか1つに対して少なくとも75%の配列同一性を有するエンドヌクレアーゼ、またはそのバリアントを含む、請求項83または84に記載の方法。
  86. 前記遺伝子操作されたガイドRNAが、配列番号3471、3539、3551~3559、3608~3609、3612、3636~3637、3640~3641、3644~3645、3648~3649、3652~3653、3656~3657、3660~3661、3664~3667、3671~3672、3677~3678、3695~3696、3729~3730、3734~3735、および3851~3857のうちいずれか1つの非縮重ヌクレオチドの少なくとも19個に対して少なくとも80%の配列同一性を有する配列をさらに含む、請求項81~85のいずれか一項に記載の方法。
  87. 前記エンドヌクレアーゼが、配列番号141、215、229、261、もしくは1711~1721のうちいずれか1つに対して少なくとも75%、少なくとも80%、もしくは少なくとも90%同一である配列、またはそのバリアントを含む、請求項81~85のいずれか一項に記載の方法。
  88. 前記ガイドRNA構造が、配列番号3608~3609、3853、または3851~3857のうちいずれか1つの非縮重ヌクレオチドの少なくとも19個に対して少なくとも80%、または少なくとも90%同一である配列を含む、請求項87に記載の方法。
  89. 前記方法が、3’または5’末端上で、配列番号4424または4425のうちいずれか1つに対して少なくとも80%の同一性を有する配列に隣接するカーゴ配列を含むドナー核酸を、前記細胞に接触させること、または前記細胞に導入することをさらに含む、請求項81~88のいずれか一項に記載の方法。
  90. 前記細胞が末梢血単核球(PBMC)である、請求項81~89のいずれか一項に記載の方法。
  91. 前記細胞がT細胞、またはその前駆体、または造血幹細胞(HSC)である、請求項81~89のいずれか一項に記載の方法。
  92. 前記カーゴ配列が、T細胞受容体ポリペプチド、CAR-Tポリペプチド、またはそれらのフラグメントもしくはそれらの誘導体をコードする配列を含む、請求項89~91のいずれか一項に記載の方法。
  93. 前記遺伝子操作されたガイドRNAが、配列番号4370~4423のうちいずれか1つに対して少なくとも80%の同一性を有する配列を含む、請求項81~92のいずれか一項に記載の方法。
  94. 前記遺伝子操作されたガイドRNAが、表5Aに列挙された対応する化学修飾を含む、表5AからのsgRNA1~54のヌクレオチド配列を含む、請求項93に記載の方法。
  95. 前記遺伝子操作されたガイドRNAが、配列番号4334、4350、または4324のうちいずれか1つに対して少なくとも80%の配列同一性を有する標的化配列を含む、請求項81~93のいずれか一項に記載の方法。
  96. 前記遺伝子操作されたガイドRNAが、配列番号4388、4404、または4378のうちいずれか1つに対して少なくとも80%の配列同一性を有する配列を含む、請求項81~93のいずれか一項に記載の方法。
  97. 前記遺伝子操作されたガイドRNAが、表5AからのsgRNA9、35、または19のヌクレオチド配列を含む、請求項96に記載の方法。
  98. 遺伝子操作されたヌクレアーゼ系であって、
    (a)RNAガイドエンドヌクレアーゼと、
    (b)遺伝子操作されたガイドRNAであって、前記遺伝子操作されたガイドRNAが前記エンドヌクレアーゼと複合体を形成するように構成され、前記遺伝子操作されたガイドRNAが標的核酸配列にハイブリダイズするように構成されたスペーサー配列を含む、遺伝子操作されたガイドRNAと、を含み、
    前記遺伝子操作されたガイドRNAが、以下の修飾:
    (i)前記遺伝子操作されたガイドRNAの5’末端の最初の4塩基、または前記遺伝子操作されたガイドRNAの3’末端の最後の4塩基内の少なくとも1ヌクレオチドの2’-Oメチル、または2’-フルオロ塩基修飾、
    (ii)前記遺伝子操作されたガイドRNAの5’末端の最初の5塩基のうち少なくとも2つの間のチオリン酸(PS)結合、または前記遺伝子操作されたガイドRNAの3’末端の最後の5塩基のうち少なくとも2つの間のチオリン酸結合、
    (iii)前記遺伝子操作されたガイドRNAの3’ステムまたは5’ステム内のチオリン酸結合、
    (iv)前記遺伝子操作されたガイドRNAの3’ステムまたは5’ステム内の2’-Oメチル、または2’-塩基修飾、
    (v)前記遺伝子操作されたガイドRNAのスペーサー領域の少なくとも7塩基の2’-フルオロ塩基修飾、および
    (vi)前記遺伝子操作されたガイドRNAのループ領域内のチオリン酸結合、
    のうち少なくとも1つを含む、遺伝子操作されたヌクレアーゼ系。
  99. 前記遺伝子操作されたガイドRNAが、前記遺伝子操作されたガイドRNAの5’末端の最初の5塩基、または前記遺伝子操作されたガイドRNAの3’末端の最後の5塩基内の少なくとも1ヌクレオチドの2’-Oメチル、または2’-フルオロ塩基修飾を含む、請求項98に記載の遺伝子操作されたヌクレアーゼ系。
  100. 前記遺伝子操作されたガイドRNAが、前記遺伝子操作されたガイドRNAの5’末端、または前記遺伝子操作されたガイドRNAの3’末端で2’-Oメチル、または2’-フルオロ塩基修飾を含む、請求項98に記載の遺伝子操作されたヌクレアーゼ系。
  101. 前記遺伝子操作されたガイドRNAが、前記遺伝子操作されたガイドRNAの5’末端の最初の5塩基のうち少なくとも2つの間のチオリン酸(PS)結合、または前記遺伝子操作されたガイドRNAの3’末端の最後の5塩基のうち少なくとも2つの間のチオリン酸結合、を含む、請求項98~100のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
  102. 前記遺伝子操作されたガイドRNAが、前記遺伝子操作されたガイドRNAの3’ステムまたは5’ステム内にチオリン酸結合を含む、請求項98~101のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
  103. 前記遺伝子操作されたガイドRNAが、前記遺伝子操作されたガイドRNAの3’ステムまたは5’ステム内に2’-Oメチル塩基修飾を含む、請求項98~102のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
  104. 前記遺伝子操作されたガイドRNAが、前記遺伝子操作されたガイドRNAのスペーサー領域の少なくとも7塩基の2’-フルオロ塩基修飾を含む、請求項98~103のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
  105. 前記遺伝子操作されたガイドRNAが、前記遺伝子操作されたガイドRNAのループ領域内にチオリン酸結合を含む、請求項98~104のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
  106. 前記遺伝子操作されたガイドRNAが、前記遺伝子操作されたガイドRNAの前記5’末端で少なくとも3つの2’-Oメチルまたは2’-フルオロ塩基、前記遺伝子操作されたガイドRNAの前記5’末端の最初の3塩基間の2つのチオリン酸結合、前記遺伝子操作されたガイドRNAの前記4’末端での少なくとも4つの2’-Oメチルまたは2’-フルオロ塩基、および前記遺伝子操作されたガイドRNAの前記3’末端の最後の3塩基間の3つのチオリン酸結合、を含む、請求項98~105のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
  107. 前記遺伝子操作されたガイドRNAが、前記遺伝子操作されたガイドRNAの5’末端に少なくとも2つの2’-O-メチル塩基および少なくとも2つのチオリン酸結合、ならびに前記遺伝子操作されたガイドRNAの3’末端に少なくとも1つの2’-O-メチル塩基および少なくとも1つのチオリン酸結合を含む、請求項98に記載の遺伝子操作されたヌクレアーゼ系。
  108. 前記遺伝子操作されたガイドRNAが、前記遺伝子操作されたガイドRNAの前記3’ステムまたは前記5’ステム領域の両方に、少なくとも1つの2’-O-メチル塩基を含む、請求項107に記載の遺伝子操作されたヌクレアーゼ系。
  109. 前記遺伝子操作されたガイドRNAが、前記遺伝子操作されたガイドRNAのシード領域を除く前記スペーサー領域に少なくとも1個~少なくとも14個の2’-フルオロ塩基を含む、請求項107または108に記載の遺伝子操作されたヌクレアーゼ系。
  110. 前記遺伝子操作されたガイドRNAが、前記遺伝子操作されたガイドRNAの前記5’ステム領域に少なくとも1つの2’-O-メチル塩基、および前記ガイドRNAのシード領域を除く前記スペーサー領域に少なくとも1個~少なくとも14個の2’-フルオロ塩基を含む、請求項107に記載の遺伝子操作されたヌクレアーゼ系。
  111. 前記ガイドRNAが、VEGF-A遺伝子を標的化するスペーサー配列を含む、請求項98~110のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
  112. 前記ガイドRNAが、配列番号3985に対して少なくとも80%の同一性を有するスペーサー配列を含む、請求項111に記載の遺伝子操作されたヌクレアーゼ系。
  113. 前記ガイドRNAが、表7に列挙された化学修飾を含む表7からのガイドRNA1~7のヌクレオチドを含む、請求項111に記載の遺伝子操作されたヌクレアーゼ系。
  114. 前記RNAガイドヌクレアーゼがCasエンドヌクレアーゼである、請求項98~113のいずれか一項に記載の方法。
  115. 前記Casエンドヌクレアーゼがクラス2のV型Casエンドヌクレアーゼである、請求項114に記載の方法。
  116. 前記クラス2のV型Casエンドヌクレアーゼが、RuvCIサブドメイン、RuvCIIサブドメイン、およびRuvCIIIサブドメインを含むRuvCドメインを含む、請求項115に記載の方法。
  117. 前記クラス2のV型Casエンドヌクレアーゼが、配列番号1~3470のうちいずれか1つに対して少なくとも75%の配列同一性を有するエンドヌクレアーゼ、またはそのバリアントを含む、請求項115~116のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
  118. 前記クラス2のV型Casエンドヌクレアーゼが、配列番号141、215、229、261、もしくは1711~1721のうちいずれか1つに対して少なくとも75%の配列同一性を有するエンドヌクレアーゼ、またはそのバリアントを含む、請求項115~116のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
  119. 前記遺伝子操作されたガイドRNAが、配列番号3471、3539、3551~3559、3608~3609、3612、3636~3637、3640~3641、3644~3645、3648~3649、3652~3653、3656~3657、3660~3661、3664~3667、3671~3672、3677~3678、3695~3696、3729~3730、3734~3735、および3851~3857のうちいずれか1つの非縮重ヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含む、請求項114~118のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
  120. 前記遺伝子操作されたガイドRNAが、配列番号3608~3609、3853、または3851~3857のうちいずれか1つの非縮重ヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含む、請求項111~118のいずれか一項に記載の遺伝子操作されたヌクレアーゼ系。
  121. 配列番号1~3470のうちいずれか1つに対して少なくとも75%の配列同一性を有する異種エンドヌクレアーゼ、またはそのバリアントをコードするオープンリーディングフレームを含む、宿主細胞。
  122. 前記エンドヌクレアーゼが、配列番号141、215、229、261、もしくは1711~1721のうちいずれか1つ、またはそのバリアントに対して少なくとも75%の配列同一性を有する、請求項121に記載の宿主細胞。
  123. 前記宿主細胞が大腸菌細胞である、請求項121~122のいずれか一項に記載の宿主細胞。
  124. 前記大腸菌細胞がλDE3溶原菌である、または前記大腸菌細胞がBL21(DE3)株である、請求項123に記載の宿主細胞。
  125. 前記大腸菌細胞がompT lon遺伝子型を有する、請求項109~110のいずれか一項に記載の宿主細胞。
  126. 前記オープンリーディングフレームが、T7プロモーター配列、T7-lacプロモーター配列、lacプロモーター配列、tacプロモーター配列、trcプロモーター配列、ParaBADプロモーター配列、PrhaBADプロモーター配列、T5プロモーター配列、cspAプロモーター配列、araPBADプロモーター、ラムダファージ由来の強力な左方向プロモーター(pLプロモーター)、またはそれらの任意の組合せに動作可能に連結される、請求項121~125のいずれか一項に記載の宿主細胞。
  127. 前記オープンリーディングフレームが、前記エンドヌクレアーゼをコードする配列にインフレームで連結されたアフィニティータグをコードする配列を含む、請求項121~126のいずれか一項に記載の宿主細胞。
  128. 前記アフィニティータグが、固定化金属アフィニティークロマトグラフィー(IMAC)タグである、請求項127に記載の方法。
  129. 前記IMACタグがポリヒスチジンタグである、請求項128に記載の方法。
  130. 前記アフィニティータグがmycタグ、ヒトインフルエンザ赤血球凝集素(HA)タグ、マルトース結合タンパク質(MBP)タグ、グルタチオンS-転移酵素(GST)タグ、ストレプトアビジンタグ、FLAGタグ、またはそれらの任意の組合せである、請求項127に記載の方法。
  131. 前記アフィニティータグが、プロテアーゼ切断部位をコードするリンカー配列を介して前記エンドヌクレアーゼをコードする前記配列にインフレームで連結されている、請求項127~130のいずれか一項に記載の宿主細胞。
  132. 前記プロテアーゼ切断部位が、タバコエッチウイルス(TEV)プロテアーゼ切断部位、PreScission(登録商標)プロテアーゼ切断部位、トロンビン切断部位、血液凝固因子Xa切断部位、エンテロキナーゼ切断部位、またはそれらの任意の組合せである、請求項131に記載の宿主細胞。
  133. 前記オープンリーディングフレームが、前記宿主細胞での発現にコドン最適化されている、請求項121~132のいずれか一項に記載の宿主細胞。
  134. 前記オープンリーディングフレームがベクター上に設けられている、請求項121~133のいずれか一項に記載の宿主細胞。
  135. 前記オープンリーディングフレームが前記宿主細胞のゲノムに組み込まれている、請求項121~133のいずれか一項に記載の宿主細胞。
  136. 適合性のある液体培地中で、請求項121~135のいずれか一項に記載の宿主細胞を含む培養物。
  137. 適合性のある増殖培地中で、請求項121~135のいずれか一項に記載の宿主細胞を培養することを含む、エンドヌクレアーゼを産生する方法。
  138. さらなる化学薬剤、または増量した栄養物を追加することで、前記エンドヌクレアーゼの発現を誘導することをさらに含む、請求項137に記載の方法。
  139. さらなる化学薬剤または増量した栄養物がイソプロピルβ-D-1-チオガラクトピラノシド(IPTG)または追加量のラクトースを含む、請求項138に記載の方法。
  140. 前記培養後に前記宿主細胞を単離し、前記宿主細胞を溶解してタンパク質抽出物を製造することをさらに含む、請求項137~139のいずれか一項に記載の方法。
  141. 前記タンパク質抽出物をIMAC、またはイオンアフィニティークロマトグラフィーに供することをさらに含む、請求項140に記載の方法。
  142. 前記オープンリーディングフレームが、前記エンドヌクレアーゼをコードする配列にインフレームで連結されたIMACアフィニティータグをコードする配列を含む、請求項141に記載の方法。
  143. 前記IMACアフィニティータグが、プロテアーゼ切断部位をコードするリンカー配列を介して前記エンドヌクレアーゼをコードする前記配列にインフレームで連結されている、請求項142に記載の方法。
  144. 前記プロテアーゼ切断部位が、タバコエッチウイルス(TEV)プロテアーゼ切断部位、PreScission(登録商標)プロテアーゼ切断部位、トロンビン切断部位、血液凝固因子Xa切断部位、エンテロキナーゼ切断部位、またはそれらの任意の組合せを含む、請求項143に記載の方法。
  145. 前記プロテアーゼ切断部位に対応するプロテアーゼを前記エンドヌクレアーゼに接触させることで、前記IMACアフィニティータグを切断することをさらに含む、請求項143~144のいずれか一項に記載の方法。
  146. サブトラクティブIMACアフィニティークロマトグラフィーを実施し、前記エンドヌクレアーゼを含む組成物から前記アフィニティータグを除去することをさらに含む、請求項145に記載の方法。
  147. 系であって、
    (a)3-または4-ヌクレオチドPAM配列を結合するように構成されたクラス2のV-A型Casエンドヌクレアーゼであって、前記エンドヌクレアーゼがsMbCas12aに対して切断活性を増加している、クラス2のV-A型Casエンドヌクレアーゼと、
    (b)前記遺伝子操作されたガイドRNAであって、前記遺伝子操作されたガイドRNAが前記クラス2のV-A型Casエンドヌクレアーゼと複合体を形成するように構成され、前記遺伝子操作されたガイドRNAが、標的核酸配列を含む標的核酸にハイブリダイズするように構成されたスペーサー配列を含む、遺伝子操作されたガイドRNAと、を含む、系。
  148. 前記切断活性が、適合するガイドRNAに加えて前記エンドヌクレアーゼを、前記標的核酸を含む細胞に導入することで、かつ前記細胞の前記標的核酸配列の切断を検出することで、インビトロで測定される、請求項147に記載の系。
  149. 前記クラス2のV-A型Casエンドヌクレアーゼが、215~225のうちいずれか1つに対して少なくとも75%の同一性を有する配列、またはそのバリアントを含む、請求項147~148のいずれか一項に記載の系。
  150. 前記遺伝子操作されたガイドRNAが、配列番号3609の非縮重ヌクレオチドに対して少なくとも80%の同一性を有する配列を含む、請求項149に記載の系。
  151. 前記標的核酸が、前記標的核酸配列近位のYYN PAM配列をさらに含む、請求項149~150のいずれか一項に記載の系。
  152. 前記クラス2のV-A型Casエンドヌクレアーゼが、sMbCas12aに対して少なくとも約5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、または200%、またはそれ以上増加した活性を有する、請求項147~151のいずれか一項に記載の系。
  153. 系であって、
    (a)クラス2のV-A’型Casエンドヌクレアーゼと、
    (b)遺伝子操作されたガイドRNAであって、前記遺伝子操作されたガイドRNAが、クラス2のV型Casエンドヌクレアーゼの天然エフェクターリピート配列の約19~約25、または約19~約31の連続ヌクレオチドに対して少なくとも80%の同一性を有する配列を含む、遺伝子操作されたガイドRNAと、を含む、系。
  154. 前記天然エフェクターリピート配列が配列番号3560~3572のうちいずれか1つである、請求項153に記載の系。
  155. 前記クラス2のV-A’型Casエンドヌクレアーゼが配列番号126に対して少なくとも75%の同一性を有する、請求項153~154のいずれか一項に記載の系。
  156. 細胞のVEGF-A遺伝子座を破壊する方法であって、
    (b)クラス2のV型Casエンドヌクレアーゼと、
    (b)遺伝子操作されたガイドRNAであって、前記遺伝子操作されたガイドRNAが前記エンドヌクレアーゼと複合体を形成するように構成され、前記遺伝子操作されたガイドRNAが前記VEGF-A遺伝子座の領域にハイブリダイズするように構成されたスペーサー配列を含む、遺伝子操作されたガイドRNAと、
    を前記細胞に導入することを含み、
    前記遺伝子操作されたガイドRNAが配列番号3985に対して少なくとも80%の同一性を有する標的化配列を含み、または
    前記遺伝子操作されたガイドRNAが、表7からのガイドRNA1~7のうちいずれか1つのヌクレオチド配列を含む、方法。
  157. 前記クラス2のV型Casエンドヌクレアーゼが、配列番号1~3470のうちいずれか1つに対して少なくとも75%の配列同一性を有するエンドヌクレアーゼ、またはそのバリアントを含む、請求項156に記載の系。
  158. 前記クラス2のV型Casエンドヌクレアーゼが、配列番号141、215、229、261、もしくは1711~1721のうちいずれか1つに対して少なくとも75%の配列同一性を有するエンドヌクレアーゼ、またはそのバリアントを含む、請求項156~157のいずれか一項に記載の系。
  159. 前記遺伝子操作されたガイドRNAが、配列番号3471、3539、3551~3559、3608~3609、3612、3636~3637、3640~3641、3644~3645、3648~3649、3652~3653,3656~3657、3660~3661、3664~3667、3671~3672、3677~3678、3695~3696、3729~3730、3734~3735、および3851~3857のうちいずれか1つの非縮重ヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含む、請求項156~158のいずれか一項に記載の系。
  160. 前記遺伝子操作されたガイドRNAが、配列番号3608~3609、3853、または3851~3857のうちいずれか1つの非縮重ヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含む、請求項156~158のいずれか一項に記載の系。
  161. 細胞の遺伝子座を破壊する方法であって、
    (a)配列番号215~225のうちいずれか1つに対して少なくとも75%の同一性を有するクラス2のV型Casエンドヌクレアーゼ、またはそのバリアントと、
    (b)遺伝子操作されたガイドRNAであって、前記遺伝子操作されたガイドRNAが前記エンドヌクレアーゼと複合体を形成するように構成され、前記遺伝子操作されたガイドRNAが前記遺伝子座の領域にハイブリダイズするように構成されたスペーサー配列を含む、遺伝子操作されたガイドRNAと、
    を含む組成物を前記細胞に接触させることを含み、
    前記クラス2のV型Casエンドヌクレアーゼが、前記細胞のspCas9に対して少なくとも同等の切断活性を有する、方法。
  162. 前記切断活性が、適合するガイドRNAに加えて前記エンドヌクレアーゼを、前記標的核酸を含む細胞に導入することで、かつ前記細胞の前記標的核酸配列の切断を検出することで、インビトロで測定される、請求項161に記載の方法。
  163. 前記組成物が、20pmol以下の前記クラス2のV型Casエンドヌクレアーゼを含む、請求項161~162のいずれか一項に記載の方法。
  164. 前記組成物が1pmol以下の前記クラス2のV型Casエンドヌクレアーゼを含む、請求項163に記載の方法。
JP2022553203A 2020-03-06 2021-03-06 クラスiiのv型crispr系 Pending JP2023517041A (ja)

Applications Claiming Priority (13)

Application Number Priority Date Filing Date Title
US202062986477P 2020-03-06 2020-03-06
US62/986,477 2020-03-06
US202063022276P 2020-05-08 2020-05-08
US63/022,276 2020-05-08
US202063045815P 2020-06-29 2020-06-29
US63/045,815 2020-06-29
US202063068316P 2020-08-20 2020-08-20
US63/068,316 2020-08-20
US202063069699P 2020-08-24 2020-08-24
US63/069,699 2020-08-24
US202063116157P 2020-11-19 2020-11-19
US63/116,157 2020-11-19
PCT/US2021/021259 WO2021178933A2 (en) 2020-03-06 2021-03-06 Class ii, type v crispr systems

Publications (2)

Publication Number Publication Date
JP2023517041A true JP2023517041A (ja) 2023-04-21
JPWO2021178933A5 JPWO2021178933A5 (ja) 2024-07-24

Family

ID=77612848

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022553203A Pending JP2023517041A (ja) 2020-03-06 2021-03-06 クラスiiのv型crispr系

Country Status (10)

Country Link
US (2) US11713471B2 (ja)
EP (1) EP4114932A4 (ja)
JP (1) JP2023517041A (ja)
KR (2) KR20240036729A (ja)
CN (1) CN116096876A (ja)
AU (2) AU2021231074C1 (ja)
CA (1) CA3174557A1 (ja)
GB (2) GB2617658B (ja)
MX (1) MX2022011039A (ja)
WO (1) WO2021178933A2 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4442836A2 (en) 2018-08-01 2024-10-09 Mammoth Biosciences, Inc. Programmable nuclease compositions and methods of use thereof
CA3174557A1 (en) 2020-03-06 2021-09-10 Metagenomi, Inc. Class ii, type v crispr systems
KR20230117116A (ko) * 2020-10-30 2023-08-07 아버 바이오테크놀로지스, 인크. Trac를 표적화하는 rna 가이드를 포함하는 조성물 및 이의 용도
US11332742B1 (en) * 2021-01-07 2022-05-17 Inscripta, Inc. Mad nucleases
KR20240017367A (ko) * 2021-06-02 2024-02-07 메타지노미, 인크. 클래스 ii, v형 crispr 시스템
EP4408995A1 (en) * 2021-09-28 2024-08-07 Acrigen Biosciences Compositions and methods for nucleic acid modifications
CN117050973B (zh) * 2021-10-29 2024-07-19 山东舜丰生物科技有限公司 新型Cas酶和系统以及应用
WO2023092132A1 (en) * 2021-11-22 2023-05-25 Mammoth Biosciences, Inc. Effector proteins and uses thereof
AU2023209457A1 (en) * 2022-01-21 2024-08-08 Mammoth Biosciences, Inc. Effector proteins and methods of use
WO2023230579A2 (en) * 2022-05-25 2023-11-30 Metagenomi, Inc. Supplementation of liver enzyme expression
WO2024020346A2 (en) * 2022-07-18 2024-01-25 Renagade Therapeutics Management Inc. Gene editing components, systems, and methods of use
WO2024042168A1 (en) * 2022-08-26 2024-02-29 UCB Biopharma SRL Novel rna-guided nucleases and nucleic acid targeting systems comprising such rna-guided nucleases
WO2024107665A1 (en) * 2022-11-14 2024-05-23 Mammoth Biosciences, Inc. Effector proteins, compositions, systems and methods of use thereof

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9790490B2 (en) * 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
US20190264186A1 (en) * 2016-01-22 2019-08-29 The Broad Institute Inc. Crystal structure of crispr cpf1
CA3026110A1 (en) * 2016-04-19 2017-11-02 The Broad Institute, Inc. Novel crispr enzymes and systems
EP3617311A4 (en) * 2017-03-30 2021-04-21 Kyoto University METHOD FOR THE INDUCTION OF EXON SKIPPING BY GENOME EDITIING
WO2018195545A2 (en) * 2017-04-21 2018-10-25 The General Hospital Corporation Variants of cpf1 (cas12a) with altered pam specificity
EP3635113A4 (en) * 2017-06-05 2021-03-17 Fred Hutchinson Cancer Research Center GENOMIC SAFE HARBORS FOR GENETIC THERAPIES IN HUMAN STEM CELLS AND MANIPULATED NANOPARTICLES TO DELIVER TARGETED GENETIC THERAPIES
US9982279B1 (en) * 2017-06-23 2018-05-29 Inscripta, Inc. Nucleic acid-guided nucleases
WO2019051278A1 (en) 2017-09-07 2019-03-14 The Board Of Trustees Of The Leland Stanford Junior University NUCLEASE SYSTEMS FOR GENETIC ENGINEERING
CA3079172A1 (en) 2017-10-17 2019-04-25 Crispr Therapeutics Ag Compositions and methods for gene editing for hemophilia a
US10253365B1 (en) 2017-11-22 2019-04-09 The Regents Of The University Of California Type V CRISPR/Cas effector proteins for cleaving ssDNAs and detecting target DNAs
AU2019243315A1 (en) 2018-03-29 2020-09-24 Fate Therapeutics, Inc. Engineered immune effector cells and use thereof
CA3109083A1 (en) 2018-08-09 2020-02-13 G+Flas Life Sciences Compositions and methods for genome engineering with cas12a proteins
CN113166744A (zh) 2018-12-14 2021-07-23 先锋国际良种公司 用于基因组编辑的新颖crispr-cas系统
EP3931313A2 (en) * 2019-01-04 2022-01-05 Mammoth Biosciences, Inc. Programmable nuclease improvements and compositions and methods for nucleic acid amplification and detection
KR20240007322A (ko) 2019-02-14 2024-01-16 메타지노미, 인크. Ruvc 도메인이 존재하는 효소
US10982200B2 (en) 2019-02-14 2021-04-20 Metagenomi Ip Technologies, Llc Enzymes with RuvC domains
CN110684823A (zh) 2019-10-23 2020-01-14 海南大学 一种基于试纸条的Cas12a酶的微生物快速诊断技术
CN110904239B (zh) 2019-12-25 2020-11-10 武汉博杰生物医学科技有限公司 肺癌相关分子标志物基因突变的检测试剂盒与检测方法
CA3174557A1 (en) 2020-03-06 2021-09-10 Metagenomi, Inc. Class ii, type v crispr systems
WO2021178934A1 (en) 2020-03-06 2021-09-10 Metagenomi Ip Technologies, Llc Class ii, type v crispr systems
AU2021267379A1 (en) 2020-05-08 2022-12-08 Metagenomi, Inc. Enzymes with RuvC domains
WO2022056324A1 (en) 2020-09-11 2022-03-17 Metagenomi Ip Technologies, Llc Base editing enzymes
AU2022210762A1 (en) 2021-01-22 2023-08-24 Metagenomi, Inc. Novel engineered and chimeric nucleases
WO2022159742A1 (en) 2021-01-22 2022-07-28 Metagenomi, Inc Novel engineered and chimeric nucleases
AU2022209849A1 (en) 2021-01-25 2023-07-27 Massachusetts Institute Of Technology Reprogrammable tnpb polypeptides and use thereof
BR112023018948A2 (pt) 2021-03-19 2023-10-17 Metagenomi Inc Edição multiplex com enzimas cas
KR20240017367A (ko) 2021-06-02 2024-02-07 메타지노미, 인크. 클래스 ii, v형 crispr 시스템

Also Published As

Publication number Publication date
KR20240036729A (ko) 2024-03-20
US20240093239A1 (en) 2024-03-21
GB2603704B (en) 2023-02-15
CN116096876A (zh) 2023-05-09
GB202219438D0 (en) 2023-02-01
WO2021178933A3 (en) 2021-12-23
GB2603704A (en) 2022-08-10
AU2021231074C1 (en) 2024-06-27
US11713471B2 (en) 2023-08-01
KR102647766B1 (ko) 2024-03-13
MX2022011039A (es) 2022-12-13
GB202205584D0 (en) 2022-06-01
US20220290187A1 (en) 2022-09-15
AU2021231074B2 (en) 2023-11-02
EP4114932A4 (en) 2024-03-13
WO2021178933A2 (en) 2021-09-10
AU2024200614A1 (en) 2024-04-11
GB2617658B (en) 2024-04-17
EP4114932A2 (en) 2023-01-11
AU2021231074A1 (en) 2022-09-29
CA3174557A1 (en) 2021-09-10
US20230227857A1 (en) 2023-07-20
GB2617658A (en) 2023-10-18
KR20220150329A (ko) 2022-11-10

Similar Documents

Publication Publication Date Title
KR102647766B1 (ko) 클래스 ii, 타입 v crispr 시스템
JP2023179468A (ja) Ruvcドメインを有する酵素
JP2023519953A (ja) クラス2のii型crisprシステム
US20230416710A1 (en) Engineered and chimeric nucleases
US20240336905A1 (en) Class ii, type v crispr systems
WO2021178934A1 (en) Class ii, type v crispr systems
US20240218339A1 (en) Class ii, type v crispr systems
WO2022066335A1 (en) Systems and methods for transposing cargo nucleotide sequences
JP2024533940A (ja) Ruvcドメインを有する酵素
JP2024501892A (ja) 新規の核酸誘導型ヌクレアーゼ
US12123014B2 (en) Class II, type V CRISPR systems
KR20240145522A (ko) 융합 단백질
CN117693585A (zh) Ii类v型crispr系统
KR20240145512A (ko) 융합 단백질
KR20240150801A (ko) 카고 뉴클레오티드 서열을 전이시키기 위한 시스템 및 방법
WO2024026499A2 (en) Class ii, type v crispr systems
WO2023164590A2 (en) Fusion proteins
CN116867897A (zh) 碱基编辑酶
WO2023164592A2 (en) Fusion proteins

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221018

RD12 Notification of acceptance of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7432

Effective date: 20221128

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20221128

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240306

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20240306

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240705

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20240708

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240724