JP2023539569A - ヌクレアーゼを含む組成物及びその使用 - Google Patents

ヌクレアーゼを含む組成物及びその使用 Download PDF

Info

Publication number
JP2023539569A
JP2023539569A JP2023511933A JP2023511933A JP2023539569A JP 2023539569 A JP2023539569 A JP 2023539569A JP 2023511933 A JP2023511933 A JP 2023511933A JP 2023511933 A JP2023511933 A JP 2023511933A JP 2023539569 A JP2023539569 A JP 2023539569A
Authority
JP
Japan
Prior art keywords
seq
sequence
nuclease
cell
nucleic acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023511933A
Other languages
English (en)
Inventor
デイビッド エー. スコット,
デイビッド アール. チェン,
ウィンストン エックス. ヤン,
ティア エム. ディトマソ,
Original Assignee
アーバー バイオテクノロジーズ, インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アーバー バイオテクノロジーズ, インコーポレイテッド filed Critical アーバー バイオテクノロジーズ, インコーポレイテッド
Publication of JP2023539569A publication Critical patent/JP2023539569A/ja
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Virology (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Detergent Compositions (AREA)

Abstract

本発明は、ヌクレアーゼ、ヌクレアーゼの特性を決定するためのプロセス、ヌクレアーゼを含む組成物、及びヌクレアーゼを使用するための方法に関する。

Description

関連出願の相互参照
本出願は、2020年8月17日に提出された米国仮特許出願第63/066669号明細書の利益を主張する。上述の出願の内容は、これによって、その全体が参照によって援用される。
配列表
本出願は、ASCII形式で電子的に提出され、これによってその全体が参照によって援用される配列表を含有する。2021年8月16日に作成された前記ASCIIのコピーは、A2186-7039WO_SL.txtというファイル名で、サイズが275,996バイトである。
クラスター化され、規則的に間隔が空いた短い回文構造のリピート(Clustered Regularly Interspaced Short Palindromic Repeats)(CRISPR)及びCRISPR関連(Cas)遺伝子は、CRISPR-Cas又はCRISPR/Casシステムと総称されており、個々の種を外来遺伝因子から防御する、古細菌及び細菌における適応免疫システムである。
上記の背景技術を踏まえて、本発明は、先行技術に勝る、確かな利益及び進歩を提供する。
本明細書において開示される本発明は、特定の利益又は有用性に限定されないが、本発明は、(a)ヌクレアーゼ又はヌクレアーゼをコードする核酸であって、ヌクレアーゼは、配列番号1~37及び配列番号221~224のいずれか1つに対して少なくとも80%の同一性を有するアミノ酸配列を含む、核酸;並びに(b)RNAガイド又はRNAガイドをコードする核酸であって、RNAガイドは、ダイレクトリピート配列及びスペーサー配列を含む、核酸を含む組成物を提供し、ヌクレアーゼは、RNAガイドに結合し、スペーサー配列は、標的核酸に結合する。
多様な態様において、ヌクレアーゼは、RuvCドメイン又は分断RuvCドメインを含む。
いくつかの態様において、ヌクレアーゼは、触媒残基(例えばアスパラギン酸又はグルタミン酸)を含む。
いくつかの態様において、ヌクレアーゼは、以下の配列の一つ以上を含む:(a)XGX(配列番号233)(式中、XはV又はA又はCであり、XはY又はFであり、XはK又はQであり、XはY又はFであり、XはL又はA又はM又はC又はTであり、XはI又はV又はLである);(b)LXNXLV(配列番号234)(式中、XはW又はK又はRであり、XはN又はT又はK又はS又はD又はQである);(c)FDXG(配列番号235)(式中、XはG又はYであり、XはT又はS又はMである);(d)XHRXP(配列番号236)(式中、XはI又はL又はVであり、XはY又はL又はM又はFであり、XはP又はH又はD又はEであり、XはL又はI又はV又はMである);(e)GXDXGXR(配列番号237)(式中、XはI又はL又はVであり、XはI又はV又はLであり、XはF又はYである);(f)RXYR(配列番号238)(式中、XはK又はQ又はEであり、XはH又はD又はEであり、XはF又はV又はL又はIである);及び(g)XDXDXNAAXN(配列番号239)(式中、XはH又はYであり、XはR又はQ又はVであり、XはE又はT又はI又はH又はK又はQ又はDであり、XはN又はR又はI又はV又はKである)。
いくつかの態様において、ヌクレアーゼは、配列番号1~37及び配列番号221~224のいずれか1つに対して少なくとも95%の同一性を有するアミノ酸配列を含む。
いくつかの態様において、ヌクレアーゼは、配列番号1~37及び配列番号221~224のいずれか1つにおいて記載されるアミノ酸配列を含む。
いくつかの態様において、組成物は、tracrRNAを含まない。
いくつかの態様において、ダイレクトリピート配列は、以下の配列の一つ以上を含む:(a)XCCCTX(配列番号240)(式中、XはG又はAであり、XはA又はCであり、XはG又はAである);及び(b)XGGGXA(配列番号241)(式中、XはT又はGであり、XはT又はGであり、XはT又はGであり、XはA又はGであり、XはT又はAであり、XはA又はG又はCである)。
いくつかの態様において、ダイレクトリピート配列は、配列番号38~126又は配列番号243~250のいずれか1つに対して少なくとも95%の配列同一性を有するヌクレオチド配列を含む。
いくつかの態様において、ダイレクトリピート配列は、配列番号38~126又は配列番号243~250のいずれか1つにおいて記載されるヌクレオチド配列を含む。
いくつかの態様において、ヌクレアーゼは、配列番号2に対して少なくとも95%の同一性を有するアミノ酸配列を含む。いくつかの態様において、ヌクレアーゼは、配列番号2において記載されるアミノ酸配列を含む。いくつかの態様において、ダイレクトリピート配列は、配列番号40又は配列番号41に対して少なくとも95%の配列同一性を有するヌクレオチド配列を含む。いくつかの態様において、ダイレクトリピート配列は、配列番号40又は配列番号41において記載されるヌクレオチド配列を含む。いくつかの態様において、ダイレクトリピート配列は、配列番号111又は配列番号243に対して少なくとも95%の配列同一性を有するヌクレオチド配列を含む。
いくつかの態様において、スペーサー配列は、長さが15~24の間のヌクレオチドを含む。いくつかの態様において、スペーサー配列は、長さが約19又は20のヌクレオチドを含む。
いくつかの態様において、標的核酸は、スペーサー配列中のヌクレオチド配列に対して相補的な配列を含む。
いくつかの態様において、標的核酸は、プロトスペーサー隣接モチーフ(PAM)配列に隣接しており、ここで、PAM配列は、5’-CN-3’、5’-CCN-3’、5’-NCN-3’、5’-NCCN-3’、又は5’-NNCN-3’として記載されるヌクレオチド配列を含み、式中、「N」は任意の核酸塩基である。いくつかの態様において、PAM配列は、5’-ACCN-3’、5’-DCCN-3’、5’-DTTN-3’、5’-DYYN-3’、5’-GCCN-3’、5’-GTTN-3’、5’-GYYN-3’、5’-HCN-3’、5’-HNCN-3’、5’-HNCR-3’、5’-HNCV-3’、5’-RCCN-3’、5’-RCCR-3’、5’-RYCN-3’、5’-TNCN-3’として記載されるヌクレオチド配列を含み、式中、「D」はA又はG又はTであり、「H」はA又はC又はTであり、「N」は任意の核酸塩基であり、「R」はA又はGであり、「V」はA又はC又はGであり、「Y」はC又はTである。いくつかの態様において、PAM配列は、5’-CCA-3’、5’-CCC-3’、5’-CCT-3’、5’-CCG-3’、5’-ACCG-3’、5’-CCCA-3’、5’-CCCG-3’、5’-TCCA-3’、又は5’-TCCT-3’として記載されるヌクレオチド配列を含む。
いくつかの態様において、ヌクレアーゼは、標的核酸を切断する。
いくつかの態様において、標的核酸は、一本鎖DNA又は二本鎖DNAである。
いくつかの態様において、組成物は、基準組成物よりも少なくとも10%大きな酵素活性、例えば、基準組成物のヌクレアーゼ活性よりも少なくとも10%大きなヌクレアーゼ活性を含む。
いくつかの態様において、ヌクレアーゼは、ペプチドタグ、蛍光タンパク質、塩基編集ドメイン、DNAメチル化ドメイン、ヒストン残基修飾ドメイン、局在化因子、転写修飾因子、光作動性制御因子、化学的誘導性因子、又はクロマチン可視化因子をさらに含む。
いくつかの態様において、ヌクレアーゼをコードする核酸は、細胞における発現のためにコドン最適化される。
いくつかの態様において、ヌクレアーゼをコードする核酸は、プロモーターに作動可能に連結される。
いくつかの態様において、ヌクレアーゼをコードする核酸は、ベクター中にある。いくつかの態様において、ベクターは、レトロウイルスベクター、レンチウイルスベクター、ファージベクター、アデノウイルスベクター、アデノ随伴ベクター、又は単純ヘルペスベクターを含む。
いくつかの態様において、組成物は、ナノ粒子、リポソーム、エキソソーム、微小胞、又は遺伝子銃を含む送達媒体中に存在する。
本発明は、本発明の組成物を含む細胞をさらに提供する。
多様な態様において、細胞は、真核細胞又は原核細胞である。いくつかの態様において、細胞は、哺乳類細胞又は植物細胞である。いくつかの態様において、細胞は、ヒト細胞である。
本発明は、本発明の組成物を、細胞中の標的核酸に結合させるための方法であって、(a)組成物を提供すること及び(b)組成物を細胞に送達することを含み、細胞は、標的核酸を含み、ヌクレアーゼは、RNAガイドに結合する、及びスペーサー配列は、標的核酸に結合する、方法をさらに提供する。
いくつかの実施形態において、ヌクレアーゼは、RuvCドメイン又は分断RuvCドメインを含む。
ある実施形態において、ヌクレアーゼは、触媒残基(例えばアスパラギン酸又はグルタミン酸)を含む。
いくつかの実施形態において、ヌクレアーゼは、以下の配列の一つ以上を含む:
(a)XGX(配列番号233)(式中、XはV又はA又はCであり、XはY又はFであり、XはK又はQであり、XはY又はFであり、XはL又はA又はM又はC又はTであり、XはI又はV又はLである);
(b)LXNXLV(配列番号234)(式中、XはW又はK又はRであり、XはN又はT又はK又はS又はD又はQである);
(c)FDXG(配列番号235)(式中、XはG又はYであり、XはT又はS又はMである);
(d)XHRXP(配列番号236)(式中、XはI又はL又はVであり、XはY又はL又はM又はFであり、XはP又はH又はD又はEであり、XはL又はI又はV又はMである);
(e)GXDXGXR(配列番号237)(式中、XはI又はL又はVであり、XはI又はV又はLであり、XはF又はYである);
(f)RXYR(配列番号238)(式中、XはK又はQ又はEであり、XはH又はD又はEであり、XはF又はV又はL又はIである);及び
(g)XDXDXNAAXN(配列番号239)(式中、XはH又はYであり、XはR又はQ又はVであり、XはE又はT又はI又はH又はK又はQ又はDであり、XはN又はR又はI又はV又はKである)。
ある実施形態において、ヌクレアーゼは、配列番号2に対して少なくとも95%の同一性を有するアミノ酸配列を含む。
いくつかの実施形態において、ヌクレアーゼは、配列番号2において記載されるアミノ酸配列を含む。
ある実施形態において、組成物は、tracrRNAを含まない。
いくつかの実施形態において、ダイレクトリピート配列は、以下の配列の一つ以上を含む:
(a)XCCCTX(配列番号240)(式中、XはG又はAであり、XはA又はCであり、XはG又はAである);及び
(b)XGGGXA(配列番号241)(式中、XはT又はGであり、XはT又はGであり、XはT又はGであり、XはA又はGであり、XはT又はAであり、XはA又はG又はCである)。
ある実施形態において、ダイレクトリピート配列は、配列番号40又は配列番号41に対して少なくとも95%の配列同一性を有するヌクレオチド配列を含む。ある実施形態において、ダイレクトリピート配列は、配列番号40又は配列番号41において記載されるヌクレオチド配列を含む。いくつかの実施形態において、ダイレクトリピート配列は、配列番号111又は配列番号243に対して少なくとも95%の配列同一性を有するヌクレオチド配列を含む。いくつかの実施形態において、ダイレクトリピート配列は、配列番号111又は243において記載されるヌクレオチド配列を含む。
ある実施形態において、スペーサー配列は、長さが15~24の間のヌクレオチドを含む。いくつかの実施形態において、スペーサー配列は、長さが約19又は20のヌクレオチドを含む。
いくつかの実施形態において、標的核酸は、スペーサー配列中のヌクレオチド配列に対して相補的な配列を含む。
ある実施形態において、標的核酸は、PAM配列に隣接しており、ここで、PAM配列は、5’-CN-3’、5’-CCN-3’、5’-NCN-3’、5’-NCCN-3’、又は5’-NNCN-3’として記載されるヌクレオチド配列を含み、式中、「N」は任意の核酸塩基である。いくつかの実施形態において、PAM配列は、5’-ACCN-3’、5’-DCCN-3’、5’-DTTN-3’、5’-DYYN-3’、5’-GCCN-3’、5’-GTTN-3’、5’-GYYN-3’、5’-HCN-3’、5’-HNCN-3’、5’-HNCR-3’、5’-HNCV-3’、5’-RCCN-3’、5’-RCCR-3’、5’-RYCN-3’、5’-TNCN-3’として記載されるヌクレオチド配列を含み、式中、「D」はA又はG又はTであり、「H」はA又はC又はTであり、「N」は任意の核酸塩基であり、「R」はA又はGであり、「V」はA又はC又はGであり、「Y」はC又はTである。ある実施形態において、PAM配列は、5’-CCA-3’、5’-CCC-3’、5’-CCT-3’、5’-CCG-3’、5’-ACCG-3’、5’-CCCA-3’、5’-CCCG-3’、5’-TCCA-3’、又は5’-TCCT-3’として記載されるヌクレオチド配列を含む。
いくつかの実施形態において、ヌクレアーゼは、標的核酸を切断する。
ある実施形態において、標的核酸は、一本鎖DNA又は二本鎖DNAである。
いくつかの実施形態において、組成物は、基準組成物よりも少なくとも10%大きな酵素活性、例えば、基準組成物のヌクレアーゼ活性よりも少なくとも10%大きなヌクレアーゼ活性を含む。
ある実施形態において、ヌクレアーゼは、ペプチドタグ、蛍光タンパク質、塩基編集ドメイン、DNAメチル化ドメイン、ヒストン残基修飾ドメイン、局在化因子、転写修飾因子、光作動性制御因子、化学的誘導性因子、又はクロマチン可視化因子をさらに含む。
いくつかの実施形態において、ヌクレアーゼをコードする核酸は、細胞における発現のためにコドン最適化される。
いくつかの実施形態において、ヌクレアーゼをコードする核酸は、プロモーターに作動可能に連結される。
ある実施形態において、ヌクレアーゼをコードする核酸は、ベクター中にある。ある実施形態において、ベクターは、レトロウイルスベクター、レンチウイルスベクター、ファージベクター、アデノウイルスベクター、アデノ随伴ベクター、又は単純ヘルペスベクターを含む。
いくつかの実施形態において、組成物は、ナノ粒子、リポソーム、エキソソーム、微小胞、又は遺伝子銃を含む送達媒体中に存在する。
一態様において、本開示は、本明細書において記載される態様又は実施形態のいずれかの組成物を含む細胞を提供する。いくつかの実施形態において、細胞は、真核細胞又は原核細胞である。ある実施形態において、細胞は、哺乳類細胞又は植物細胞である。いくつかの実施形態において、細胞は、ヒト細胞である。
別の態様において、本開示は、本明細書において記載される態様又は実施形態のいずれか1つの組成物を細胞内の標的核酸に結合させる方法であって、
(a)組成物を提供すること及び
(b)組成物を細胞に送達すること
を含み、細胞は、標的核酸を含み、ヌクレアーゼは、RNAガイドに結合し、及びスペーサー配列は、標的核酸に結合する、方法を提供する。
定義
本発明は、特定の実施形態に関して、ある特定の図を参照して記載されるが、本発明は、それらに限定されず、請求項によってのみ限定される。以下に記載される用語は、概して、特に明記しない限り、それらの一般的な意味で理解される。
本明細書において使用されるように、用語「触媒残基」は、触媒作用を活性化するアミノ酸を指す。触媒残基は、触媒作用に関与する(例えば直接関与する)アミノ酸である。
本明細書において使用されるように、用語「ドメイン」及び「タンパク質ドメイン」は、ポリペプチドの明確な機能的及び/又は構造的単位を指す。いくつかの実施形態において、ドメインは、保存アミノ酸配列を含んでいてもよい。本明細書において使用されるように、用語「RuvCドメイン」は、ヌクレアーゼ(例えばエンドヌクレアーゼ)活性を有するアミノ酸の保存ドメイン又はモチーフを指す。本明細書において使用されるように、分断RuvCドメインを有するタンパク質は、配列内で配列として離れた部位にあり、三次構造において相互作用し、RuvCドメインを形成する、二つ以上のRuvCモチーフを有するタンパク質を指す。
本明細書において使用されるように、用語「エフェクター活性」は、生物学的活性を指す。いくつかの実施形態において、エフェクター活性は、酵素活性、例えば、エフェクターの触媒能力を含む。例えば、エフェクター活性は、ヌクレアーゼ活性を含むことができる。
本明細書において使用されるように、用語「ヌクレアーゼ」は、ホスホジエステル結合を切断することが可能な酵素を指す。ヌクレアーゼは、核酸骨格中のホスホジエステル結合を加水分解する。本明細書において使用されるように、用語「エンドヌクレアーゼ」は、ヌクレオチド間のホスホジエステル結合を切断することが可能な酵素を指す。
本明細書において使用されるように、用語「親」、「親ポリペプチド」、及び「親配列」は、本発明の変異ポリペプチドを産生するために改変がなされる元のポリペプチド(例えば、開始ポリペプチド)を指す。いくつかの実施形態において、親は、一つ以上の指定される位置に、変異体と同一のアミノ酸配列を有するエフェクターである。親は、天然に存在する(野生型)ポリペプチドであってもよい。特定の実施形態において、親は、配列番号1~37及び配列番号221~224のいずれか1つのポリペプチドに対して少なくとも60%、少なくとも61%、少なくとも62%、少なくとも63%、少なくとも64%、少なくとも65%、少なくとも70%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、又は100%の同一性を有するエフェクターである。
本明細書において使用されるように、用語「プロトスペーサー隣接モチーフ」又は「PAM」は、エフェクター及びRNAガイドを含む複合体が結合する標的配列に隣接するDNA配列を指す。いくつかの実施形態において、酵素活性にはPAMが必要である。本明細書において使用されるように、用語「隣接」は、複合体のRNAガイドが、PAMに直接隣接する標的配列と特異的に結合、相互作用、又は会合する場合を含む。そのような場合、標的配列とPAMの間にヌクレオチドはない。用語「隣接する」はまた、ターゲティング成分が結合する標的配列とPAMとの間に少数(例えば、1、2、3、4、又は5個)のヌクレオチドが存在する場合も含む。
本明細書において使用されるように、用語「基準組成物」、「基準配列」、及び「基準」は、ネガティブコントロールなどのコントロール又は親(例えば親配列、親タンパク質、野生型タンパク質、若しくは親配列を含む複合体)を指す。
本明細書において使用されるように、用語「RNAガイド」又は「RNAガイド配列」は、本明細書において記載されるポリペプチドの標的核酸へのターゲティングを容易にする任意のRNA分子を指す。例えば、RNAガイドは、標的核酸を認識する(例えば、それに結合する)分子とすることができる。RNAガイドは、特異的な核酸配列に対して相補的となるように設計されてもよい。RNAガイドは、DNAターゲティング配列及びダイレクトリピート(DR)配列を含む。用語CRISPRRNA(crRNA)、pre-crRNA、成熟crRNA、及びgRNAもまた、RNAガイドを指すために本明細書において使用される。本明細書において使用されるように、用語「pre-crRNA」は、DR-スペーサー-DR配列を含むプロセシングされていないRNA分子を指す。本明細書において使用されるように、用語「成熟crRNA」は、プロセシングされた形態のpre-crRNAを指し;成熟crRNAは、DRスペーサー配列を含んでもよく、ここで、DRは、pre-crRNAのDRの切断型であり、且つ/又はスペーサーは、pre-crRNAのスペーサーの切断型である。
本明細書において使用されるように、用語「ターゲティング成分」は、別の分子又は構成要素の標的核酸へのターゲティングを容易にする分子又は構成要素(例えば、核酸及び/又はRNAガイド)を指す。いくつかの実施形態において、ターゲティング成分は、標的核酸と特異的に相互作用又は会合する。
本明細書において使用されるように、用語「実質的に同一の」は、基準配列に対して一定の程度の同一性を有する配列、ポリヌクレオチド、又はポリペプチドを指す。
本明細書において使用されるように、用語「標的核酸」及び「標的配列」は、ターゲティング成分(例えば、RNAガイド)が特異的に結合する核酸配列を指す。いくつかの実施形態において、RNAガイドのDNAターゲティング配列は、標的核酸に結合する。
本明細書において使用されるように、用語「トランス活性化crRNA」及び「tracrRNA」は、ターゲティング成分(例えば、RNAガイド)の標的核酸への結合に関与する又は必要とされるRNA分子を指す。
本明細書において使用されるように、用語「バリアントポリペプチド」は、親ポリペプチドと比較して、1つ以上の残基位置に、改変、例えば置換、挿入、欠失及び/又は融合を含むポリペプチドを指す。
図1A、図1B、図1C、図1D、図1E、図1F、図1G、図1H、図1I、図1J、図1K、及び図1Lは、配列番号1~37及び配列番号221~224のエフェクターのアラインメントを集合的に示す。コンセンサス配列は、アラインメントの上に示される。 同上。 同上。 同上。 同上。 同上。 同上。 同上。 同上。 同上。 同上。 同上。 図2は、出現順に、それぞれ、配列番号243、243~245、243、246~248、243、249、249、249、247、243~244、及び250のダイレクトリピート配列のアラインメントを示す。コンセンサス配列は、アラインメントの上に示される。配列のDNAバージョンが示され、対応するRNAバージョンは典型的にTsの代わりにUsを含むであろうことが理解される。対応するRNAバージョンは、本明細書において配列番号111~126として提供される。 図3Aは、実施例4のdsDNA標的切断実験のための標識dsDNA基質の生成を示す概略図を示す図である。 図3Bは、配列番号2のエフェクター及び配列番号202の成熟crRNAを含むリボ核タンパク質(RNP)によって誘導される標的A(配列番号201)のスペーサー相補鎖の切断を示すTBE-尿素変性ゲルである。 図3Cは、配列番号2のエフェクター及び配列番号202の成熟crRNAを含むRNPによって誘導される標的A(配列番号201)の非スペーサー相補鎖の切断を示すTBE-尿素変性ゲルである。 図3Dは、標的Aに対し相補性を有するように設計された、配列番号2のエフェクター及び成熟crRNAを含むRNPを使用して、非標的B(配列番号204)のトップ鎖において切断が観察されないことを示すコントロールTBE-尿素変性ゲルである。 図3Eは、標的Aに対し相補性を有するように設計された、配列番号2のエフェクター及び成熟crRNAを含むRNPを使用して、非標的B(配列番号204)のボトム鎖において切断が観察されないことを示すコントロールTBE-尿素変性ゲルである。 図4Aは、実施例5のssDNA標的切断実験のための標識ssDNA基質の生成を示す概略図を示す図である。 図4Bは、配列番号2のエフェクター及び配列番号202の成熟crRNAを含むRNPによる一本鎖標的A(配列番号201)の切断を示すTBE-尿素変性ゲルである。 図4Cは、標的Aに対し相補性を有するように設計された、配列番号2のエフェクター及び成熟crRNAを含むRNPを使用して、一本鎖の非標的B(配列番号204)において切断が観察されないことを示すコントロールTBE-尿素変性ゲルである。 図5Aは、配列番号2のエフェクターの活性を測定するための、実施例6において記載される蛍光枯渇アッセイの概略図である。 図5Bは、標的1(配列番号208)、標的2(配列番号210)、標的3(配列番号212)、標的4(配列番号214)、及び標的5(配列番号216)に対する配列番号2のエフェクターのGFP枯渇比(非標的/標的)のプロットを示す。図5Bにおける枯渇率の値は、12時間にわたって得られた測定値から計算された。 図6は、HEK293細胞におけるAAVS1標的遺伝子座(配列番号218)で配列番号2のエフェクターによって誘導されたインデルを示す。
本開示は、新規なヌクレアーゼ及びその使用のための方法に関する。いくつかの態様において、一つ以上の特性を有する本発明のヌクレアーゼを含む組成物が、本明細書において記載される。いくつかの態様において、本発明のヌクレアーゼを産生するための方法が、記載される。いくつかの態様において、本発明のヌクレアーゼを含む組成物を送達するための方法が、記載される。
組成物
いくつかの態様において、本明細書において記載される本発明は、ヌクレアーゼを含む組成物を含む。いくつかの実施形態において、本発明の組成物は、ヌクレアーゼを含み、組成物は、ヌクレアーゼ活性を有する。いくつかの態様において、本明細書において記載される本発明は、ヌクレアーゼ及びターゲティング成分を含む組成物を含む。いくつかの実施形態において、本発明の組成物は、ヌクレアーゼ及びRNAガイド配列を含み、RNAガイド配列は、ヌクレアーゼ活性を部位特異的な標的に導く。いくつかの実施形態において、本発明の組成物のヌクレアーゼは、組換えヌクレアーゼである。
いくつかの実施形態において、本明細書において記載される組成物は、RNA誘導型ヌクレアーゼを含む(例えば、複数の構成要素を含むヌクレアーゼ)。いくつかの実施形態において、本発明のヌクレアーゼは、酵素活性を含む(例えば、タンパク質は、RuvCドメイン又は分断RuvCドメインを含む)。いくつかの実施形態において、組成物は、ターゲティング成分(例えばRNAガイド)を含む。いくつかの実施形態において、組成物は、ヌクレアーゼ及びターゲティング成分(例えばRNAガイド)を含むリボ核タンパク質(RNP)を含む。
ヌクレアーゼ
いくつかの実施形態において、本発明の組成物は、本明細書において記載されるエフェクター(例えばヌクレアーゼ)を含む。
本明細書において記載されるヌクレアーゼをコードする核酸配列は、ヌクレアーゼをコードする核酸が、基準核酸配列に対して、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、又は少なくとも約99.5%の配列同一性を有する配列を含む場合、基準核酸配列と実質的に同一であってもよい。このような2つの核酸の間の同一性パーセントは、2つの最適にアラインメントされた核酸配列の目視検査によって手作業で又は標準的なパラメーターを使用するソフトウェアプログラム若しくはアルゴリズム(例えばBLAST、ALIGN、CLUSTAL)を使用することによって決定することができる。2つの核酸配列が実質的に同一であるという1つの目安は、2つの核酸分子がストリンジェントな(例えば、中~高ストリンジェンシーの範囲内の)条件下で互いにハイブリダイズするといったものである。
いくつかの実施形態において、本明細書において記載されるヌクレアーゼは、基準核酸配列に対して、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、又は少なくとも約99.5%の配列同一性を有する核酸配列によってコードされる。
本明細書において記載されるヌクレアーゼは、ヌクレアーゼが、基準ポリペプチドのアミノ酸配列に対して、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、又は少なくとも約99.5%の配列同一性を有するアミノ酸配列を含む場合、基準ポリペプチドと実質的に同一であってもよい。このような2つのポリペプチドの間の同一性パーセントは、2つの最適にアラインメントされたポリペプチド配列の目視検査によって手作業で又は標準的なパラメーターを使用するソフトウェアプログラム若しくはアルゴリズム(例えばBLAST、ALIGN、CLUSTAL)を使用することによって決定することができる。2つのポリペプチドが実質的に同一であるという1つの目安は、第1のポリペプチドが第2のポリペプチドと免疫学的に交差反応性であるといったものである。典型的に、保存的アミノ酸の置換によって異なるポリペプチドは、免疫学的に交差反応性である。ゆえに、例えば、2つのペプチドが、保存的アミノ酸の置換又は一つ以上の保存的アミノ酸の置換によってのみ異なる場合、ポリペプチドは、第2のポリペプチドと実質的に同一である。
いくつかの実施形態において、本発明のヌクレアーゼは、配列番号1~37及び配列番号221~224のいずれか1つに対して50、60、65、70、75、80、85、90、91、92、93、94、95、96、97、98、99、又は100%の同一性を有するポリペプチド配列を含む。いくつかの実施形態において、本発明のヌクレアーゼは、配列番号1~37及び配列番号221~224のいずれか1つに対して50、60、65、70、75、80、85、90、91、92、93、94、95、96、97、98、99を超える、又は100%の同一性を有するポリペプチド配列を含む。配列番号1~37及び配列番号221~224に対応するアミノ酸配列を表1に示す。図1A~1Lのアラインメントにおいて示されるように、本明細書において記載されるヌクレアーゼのファミリーは、配列類似性を有する領域を含む。
いくつかの実施形態において、本発明のヌクレアーゼは、一つ以上の基準ポリペプチドに対して、指定される程度のアミノ酸配列同一性、例えば、配列番号1~37及び配列番号221~224のいずれか1つのアミノ酸配列に対して、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、又はさらに少なくとも99%の配列同一性を有するヌクレアーゼである。相同性又は同一性は、例えば、本明細書において記載されるように、BLAST、ALIGN、又はCLUSTALなどのプログラムを使用して、アミノ酸配列アラインメントによって決定することができる。いくつかの実施形態において、1つ以上の基準ポリペプチドに対して、指定される程度のアミノ酸配列同一性を有するヌクレアーゼは、1つ以上の基準ポリペプチドとして、1つ以上の特徴、例えば、ヌクレアーゼ活性を保持する。
いくつかの実施形態において、本発明のヌクレアーゼは、基準アミノ酸配列に対して、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、又は少なくとも約99.5%の配列同一性を有するアミノ酸配列を有するタンパク質を含む。いくつかの実施形態において、1つ以上の基準ポリペプチドに対して、指定される程度のアミノ酸配列同一性を有するヌクレアーゼは、基準アミノ酸配列として、1つ以上の特徴、例えば、ヌクレアーゼ活性を保持する。
酵素活性、例えばヌクレアーゼ活性を有し且つ前に記載されたアラインメント方法のいずれかを使用してアラインメントされた場合に、50以下、40以下、35以下、30以下、25以下、20以下、19以下、18以下、17以下、16以下、15以下、14以下、13以下、12以下、11以下、10以下、9以下、8以下、7以下、6以下、5以下、4以下、3以下、2以下、又は1以下のアミノ酸残基が、配列番号1~37及び配列番号221~224のいずれか1つのいずれか1つのアミノ酸配列と異なるアミノ酸配列を含む本発明のヌクレアーゼもまた、提供される。
いくつかの実施形態において、本発明のヌクレアーゼは、RuvCドメインを含む。いくつかの実施形態において、本発明のヌクレアーゼは、分断RuvCドメイン又は二つ以上の部分的なRuvCドメインを含む。例えば、ヌクレアーゼは、ヌクレアーゼの一次アミノ酸配列に関して連続していないが、一度タンパク質がフォールドするとRuvCドメインを形成するRuvCモチーフを含む。いくつかの実施形態において、RuvCモチーフの触媒残基は、グルタミン酸残基及び/又はアスパラギン酸残基である。例えば、配列番号2のヌクレアーゼは、次の触媒残基を含む:D280、E439、D560。例えば、実施例1を参照されたい。
いくつかの実施形態において、本発明は、RuvCドメインを含む単離、組換え、実質的に純粋な、又は天然に存在しないヌクレアーゼを含み、ここで、ヌクレアーゼは、酵素活性、例えばヌクレアーゼ活性を有し、ヌクレアーゼは、配列番号1~37及び配列番号221~224のいずれか1つに対して、少なくとも約60%、65%、70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、又は100%の配列同一性を有するアミノ酸配列を含む。
いくつかの実施形態において、本明細書において記載されるヌクレアーゼは、図1A~1Lに示されるコンセンサス配列を含む。いくつかの実施形態において、本明細書において記載されるヌクレアーゼは、図1A~1Lにおいて示されるコンセンサス配列の一部、例えば、図1A~1Lのいずれか1つの保存配列を含む。例えば、いくつかの実施形態において、ヌクレアーゼは、XGX(配列番号233)として記載される配列を含み、式中、XはV又はA又はCであり、XはY又はFであり、XはK又はQであり、XはY又はFであり、XはL又はA又はM又はC又はTであり、XはI又はV又はLである。いくつかの実施形態において、配列番号233において記載される配列は、N末端配列である。いくつかの実施形態において、ヌクレアーゼは、LXNXLV(配列番号234)として記載される配列を含み、式中、XはW又はK又はRであり、XはN又はT又はK又はS又はD又はQである。いくつかの実施形態において、配列番号234として記載される配列は、N末端配列である。いくつかの実施形態において、ヌクレアーゼは、FDXG(配列番号235)として記載される配列を含み、式中、XはG又はYであり、XはT又はS又はMである。いくつかの実施形態において、配列番号235として記載される配列は、N末端配列である。いくつかの実施形態において、ヌクレアーゼは、XHRXP(配列番号236)として記載される配列を含み、式中、XはI又はL又はVであり、XはY又はL又はM又はFであり、XはP又はH又はD又はEであり、XはL又はI又はV又はMである。いくつかの実施形態において、ヌクレアーゼは、GXDXGXR(配列番号237)として記載される配列を含み、式中、XはI又はL又はVであり、XはI又はV又はLであり、XはF又はYである。いくつかの実施形態において、ヌクレアーゼは、RXYR(配列番号238)として記載される配列を含み、式中、XはK又はQ又はEであり、XはH又はD又はEであり、XはF又はV又はL又はIである。いくつかの実施形態において、配列番号238として記載される配列は、C末端配列である。いくつかの実施形態において、ヌクレアーゼは、XDXDXNAAXN(配列番号239)として記載される配列を含み、式中、XはH又はYであり、XはR又はQ又はVであり、XはE又はT又はI又はH又はK又はQ又はDであり、XはN又はR又はI又はV又はKである。いくつかの実施形態において、配列番号239として記載される配列は、C末端配列である。
いくつかの実施形態において、本明細書において記載されるヌクレアーゼは、配列番号1~37及び配列番号221~224のいずれか1つの配列に対する挿入を含む。いくつかの実施形態において、挿入は、1残基~約10残基の長さ(例えば、1、2、3、4、5、6、7、8、9、又は10残基)を含む。いくつかの実施形態において、挿入は、グリシン、セリン、アスパラギン酸、又はアスパラギン残基の一つ以上を含む。いくつかの実施形態において、挿入は、1残基挿入(例えば、1つのグリシン、1つのセリン、1つのアスパラギン酸塩、又は1つのアスパラギン)を含む。いくつかの実施形態において、挿入は、2残基挿入(例えば、2つのグリシン、2つのセリン、2つのアスパラギン酸塩、又は2つのアスパラギン)を含む。いくつかの実施形態において、挿入は、少なくとも1つのグリシンを含む2残基挿入を含む。いくつかの実施形態において、挿入は、3残基挿入(例えば、3つのグリシン、3つのセリン、3つのアスパラギン酸塩、又は3つのアスパラギン)を含む。いくつかの実施形態において、挿入は、少なくとも1つのグリシンを含む3残基挿入を含む。いくつかの実施形態において、挿入は、4残基挿入(例えば、4つのグリシン、4つのセリン、4つのアスパラギン酸塩、又は4つのアスパラギン)を含む。いくつかの実施形態において、挿入は、少なくとも1つのグリシンを含む4残基挿入を含む。いくつかの実施形態において、挿入は、5残基挿入(例えば、5つのグリシン、5つのセリン、5つのアスパラギン酸塩、又は5つのアスパラギン)を含む。いくつかの実施形態において、挿入は、少なくとも1つのグリシンを含む5残基挿入を含む。いくつかの実施形態において、本明細書において記載されるヌクレアーゼは、配列番号1~37及び配列番号221~224のいずれか1つの配列に対する、グリシン-グリシン、セリン-セリン、アスパラギン酸-アスパラギン酸、アスパラギン-アスパラギン、グリシン-セリン、グリシン-アスパラギン酸、グリシン-アスパラギン、セリン-グリシン、アスパラギン酸-グリシン、又はアスパラギン-グリシン挿入を含む。
生化学的特性
いくつかの実施形態において、本明細書において記載されるヌクレアーゼの生化学的特徴は、一つ以上のアッセイを使用して分析される。いくつかの実施形態において、本発明のヌクレアーゼの生化学的特徴は、実施例4及び5において記載されるように、RNAガイド(例えば、成熟crRNA)と共にインキュベートされた精製ヌクレアーゼ及び標的DNA分子を使用してインビトロにおいて分析される。いくつかの実施形態において、本発明のヌクレアーゼの生化学的特徴は、実施例6において記載されるように、蛍光枯渇アッセイを使用してインビトロで分析される。いくつかの実施形態において、本発明のヌクレアーゼの生化学的特徴は、実施例7において記載されるように、哺乳類細胞において分析される。
本発明のヌクレアーゼに関する組成物及び方法が、本明細書において記載される。組成物及び方法は、本発明のクローニングし、発現させたエフェクターが、ヌクレアーゼ活性を有するといった観察に部分的に基づく。
いくつかの実施形態において、本明細書において記載されるヌクレアーゼ及びRNAガイドは、複合体(例えばRNP)を形成する。いくつかの実施形態において、複合体は、他の構成要素を含む。いくつかの実施形態において、複合体は、RNAガイドにおけるスペーサー配列に相補性を有する核酸基質(例えば標的核酸)への結合に際して活性化される。いくつかの実施形態において、標的核酸は、二本鎖DNA(dsDNA)である。いくつかの実施形態において、標的核酸は、一本鎖DNA(ssDNA)である。いくつかの実施形態において、標的核酸は、一本鎖RNA(ssRNA)である。いくつかの実施形態において、標的核酸は、二本鎖RNA(dsRNA)である。いくつかの実施形態において、配列特異性は、標的基質に対するRNAガイドにおけるスペーサー配列の完全なマッチを必要とする。他の実施形態において、配列特異性は、標的基質に対するRNAガイドにおけるスペーサー配列の部分的な(連続した又は非連続の)マッチを必要とする。
いくつかの実施形態において、複合体は、標的基質への結合に際して活性化される。いくつかの実施形態において、活性化複合体は、「マルチプルターンオーバー」活性を呈し、それによって、標的核酸に対する作用(例えば切断)に際して、活性化複合体は、活性化状態のまま残る。いくつかの実施形態において、活性化複合体は、「シングルターンオーバー」活性を呈し、それによって、標的核酸に対する作用に際して、複合体は、不活性状態に戻る。
いくつかの実施形態において、本明細書において記載されるヌクレアーゼは、RNAガイドと標的核酸との間の相補性の領域によって定められる配列で、標的核酸に結合する。いくつかの実施形態において、本明細書において記載されるヌクレアーゼのPAM配列は、標的核酸の標的配列のすぐ上流に(例えば、標的配列のすぐ5’側に)位置する。いくつかの実施形態において、本明細書において記載されるヌクレアーゼのPAM配列は、標的核酸の非相補鎖(例えば非標的鎖)のすぐ5’側に位置する。本明細書において使用されるように、「相補鎖」は、RNAガイドにハイブリダイズする。本明細書において使用されるように、「非相補鎖」は、RNAに直接ハイブリダイズしない。
いくつかの実施形態において、本発明のヌクレアーゼは、PAMに隣接する配列を標的とし、ここで、PAMは、5’-CN-3’、5’-CCN-3’、5’-NCN-3’、5’-NCCN-3’、又は5’-NNCN-3’として記載されるヌクレオチド配列を含み、式中、「N」は、任意の核酸塩基である。例えば、いくつかの実施形態において、配列番号2のヌクレアーゼは、5’-CCN-3’(例えば、5’-CCA-3’)又は5’-NCCN-3’のPAM配列を認識する。いくつかの実施形態において、本発明のヌクレアーゼは、PAMに隣接する配列を標的とし、ここで、PAMは、表2において記載されるヌクレオチド配列を含み、式中、「D」はA又はG又はTであり、「H」はA又はC又はTであり、「N」は任意の核酸塩基であり、「R」はA又はGであり、「V」はA又はC又はGであり、「Y」はC又はTである。いくつかの実施形態において、本発明のヌクレアーゼ(例えば、配列番号2のヌクレアーゼ)は、PAM配列に隣接する配列を標的とし、ここで、PAMは、5’-CCA-3’、5’-CCC-3’、5’-CCT-3’、5’-CCG-3’、5’-ACCG-3’、5’-CCCA-3’、5’-CCCG-3’、5’-TCCA-3’、又は5’-TCCT-3’として記載されるヌクレオチド配列を含む。
いくつかの実施形態において、本明細書において記載されるヌクレアーゼは、ssDNAを切断する。いくつかの実施形態において、本明細書において記載されるヌクレアーゼは、dsDNAを切断する。いくつかの実施形態において、本明細書において記載されるヌクレアーゼは、ニッカーゼである(例えば、ヌクレアーゼは、二本鎖の標的核酸の一方の鎖を切断する)。
いくつかの実施形態において、本発明のヌクレアーゼは、広範囲のpH条件にわたって、酵素活性、例えばヌクレアーゼ活性を有する。いくつかの実施形態において、ヌクレアーゼは、約3.0~約12.0のpHで、酵素活性、例えばヌクレアーゼ活性を有する。いくつかの実施形態において、ヌクレアーゼは、約4.0~約10.5のpHで、酵素活性を有する。いくつかの実施形態において、ヌクレアーゼは、約5.5~約8.5のpHで、酵素活性を有する。いくつかの実施形態において、ヌクレアーゼは、約6.0~約8.0のpHで、酵素活性を有する。いくつかの実施形態において、ヌクレアーゼは、約7.0のpHで、酵素活性を有する。
いくつかの実施形態において、本発明のヌクレアーゼは、約10℃~約100℃の温度範囲で、酵素活性、例えばヌクレアーゼ活性を有する。いくつかの実施形態において、本発明のヌクレアーゼは、約20℃~約90℃の温度範囲で、酵素活性を有する。いくつかの実施形態において、本発明のヌクレアーゼは、約20℃~約25℃の温度で又は約37℃の温度で、酵素活性を有する。
本発明のヌクレアーゼが標的核酸(例えば、ゲノムDNA)において二本鎖切断又は一本鎖切断を誘導するいくつかの実施形態において、二本鎖切断は、相同性指向組換え(HDR)、非相同末端結合(NHEJ)、又は代替非相同末端結合(A-NHEJ)を含む、細胞内因性DNA修復経路を刺激することができる。NHEJは、相同な鋳型を必要とせずに、切断された標的核酸を修復できる。これは、標的遺伝子座における1つ以上のヌクレオチドの欠失又は挿入をもたらすことができる。HDRは、ドナーDNAなどの相同な鋳型で発生することができる。相同な鋳型は、標的核酸切断部位に隣接する配列に相同な配列を含むことができる。いくつかの場合において、HDRは、外因性ポリヌクレオチド配列を切断標的遺伝子座に挿入することができる。NHEJ及び/又はHDRによる標的DNAの修飾は、例えば、突然変異、欠失、改変、統合、遺伝子修正、遺伝子置換、遺伝子タグ付け、導入遺伝子ノックイン、遺伝子破壊、及び/又は遺伝子ノックアウトをもたらすことができる。
いくつかの実施形態において、細胞内の標的遺伝子座へのヌクレアーゼ/RNAガイド複合体の結合は、DNA修復経路以外の1つ以上の内因性細胞分子又は経路を動員して、標的核酸を修飾する。いくつかの実施形態において、ヌクレアーゼ/RNAガイド複合体の結合は、標的核酸への1つ以上の内因性細胞分子又は経路のアクセスをブロックし、それによって、標的核酸を修飾する。例えば、ヌクレアーゼ/RNAガイド複合体の結合は、標的核酸の発現を減少させるために、内因性の転写又は翻訳機構をブロックしてもよい。
変異体
いくつかの実施形態において、本発明は、本明細書において記載されるヌクレアーゼの変異体を含む。いくつかの実施形態において、本明細書において記載されるヌクレアーゼは、一つ以上の機能的活性を修飾するために、一つ以上のアミノ酸残基で突然変異させることができる。例えば、いくつかの実施形態において、本発明のヌクレアーゼは、そのヌクレアーゼ活性(例えば切断活性)を修飾するために、一つ以上のアミノ酸残基で突然変異させる。例えば、いくつかの実施形態において、ヌクレアーゼは、ヌクレアーゼが標的核酸を切断する能力を増加させる一つ以上の突然変異を含んでいてもよい。いくつかの実施形態において、ヌクレアーゼは、RNAガイドと機能的に結びつくその能力を修飾するために、一つ以上のアミノ酸残基で突然変異させる。いくつかの実施形態において、ヌクレアーゼは、標的核酸と機能的に結びつくその能力を修飾するために、一つ以上のアミノ酸残基で突然変異させる。
いくつかの実施形態において、変異ヌクレアーゼは、保存的又は非保存的アミノ酸の置換、欠失、又は追加を有する。いくつかの実施形態において、変異ヌクレアーゼは、サイレント置換、欠失、若しくは追加又は保存的置換を有し、これらのどれも、本発明のポリペプチド活性を改変しない。保存的置換の典型的な例は、脂肪族アミノ酸Ala、Val、Leu、及びIleの中での交換、ヒドロキシル残基SerとThrとの間での交換、酸性残基AspとGluとの間での交換、アミド残基AsnとGlnとの間での置換、塩基性残基LysとArgとの間での交換、及び芳香族残基PheとTyrとの間での置換など、あるアミノ酸が、別のものに交換される置換を含む。いくつかの実施形態において、本明細書において開示されるヌクレアーゼの一つ以上の残基は、Arg残基に突然変異させる。いくつかの実施形態において、本明細書において開示されるヌクレアーゼの一つ以上の残基は、Gly残基に突然変異させる。
本発明の変異ヌクレアーゼをコードする修飾ポリヌクレオチドを生成するのに適している種々の方法が、当技術分野において知られており、例えば、部位飽和突然変異誘発(site-saturation mutagenesis)、系統的突然変異誘発(scanning mutagenesis)、挿入突然変異誘発、欠失突然変異誘発、ランダム突然変異誘発、部位特異的突然変異誘発、及び指向性進化法並びに多様な他のリコンビナトリアル(recombinatorial)アプローチを含むが、これらに限定されない。修飾ポリヌクレオチド及びタンパク質(例えばヌクレアーゼ)を作製するための方法は、DNAシャフリング法、ITCHY(Ostermeier et al.,7:2139-44[1999]を参照されたい)、SCRACHY(Lutz et al.98:11248-53[2001]を参照されたい)、SHIPREC(Sieber et al.,19:456-60[2001]を参照されたい)、及びNRR(Bittker et al.,20:1024-9[2001];Bittker et al.,101:7011-6[2004]を参照されたい)などの遺伝子の非相同組換えに基づく方法、並びにランダム及び標的突然変異、欠失、及び/又は挿入を挿入するためにオリゴヌクレオチドの使用に依存する方法(Ness et al.,20:1251-5[2002];Coco et al.,20:1246-50[2002];Zha et al.,4:34-9[2003];Glaser et al.,149:3903-13[1992]を参照されたい)を含む。
いくつかの実施形態において、本発明のヌクレアーゼは、ヌクレアーゼにおける一つ以上の(例えば数個の)アミノ酸での改変を含み、少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、162、164、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、193、194、195、196、197、198、199、200、又はそれ以上である。
本明細書において使用されるように、「生物学的活性部分」は、ヌクレアーゼの機能を維持する(例えば、完全に、部分的に、最小限に)部分である(例えば、「最小限の」又は「コア」ドメイン)。いくつかの実施形態において、ヌクレアーゼ融合タンパク質は、本明細書において記載される方法において有用である。したがって、いくつかの実施形態において、融合ヌクレアーゼをコードする核酸は、本明細書において記載される。いくつかの実施形態において、ヌクレアーゼ融合タンパク質の一つ以上の構成要素のすべて又は一部は、単一の核酸配列においてコードされる。
本明細書において記載される変化が、一つ以上のアミノ酸の変化であってもよいが、ヌクレアーゼに対する変化はまた、アミノ末端及び/又はカルボキシ末端延長としてのポリペプチドの融合などの独立した存在の性質のものであってもよい。例えば、ヌクレアーゼは、追加のペプチド、例えば、一つ以上のペプチドを含有してもよい。追加のペプチドの例は、ポリヒスチジンタグ(His-タグ)、Myc、及びFLAGなどの標識のためのエピトープペプチドを含んでいてもよい。いくつかの実施形態において、本明細書において記載されるヌクレアーゼは、蛍光タンパク質(例えば、緑色蛍光タンパク質(GFP)又は黄色蛍光タンパク質(YFP))などの、検出可能な成分に融合することができる。
本明細書において記載されるヌクレアーゼは、減弱したヌクレアーゼ活性、例えば、基準ヌクレアーゼと比較して、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも97%、又は100%のヌクレアーゼ不活性化を有するように修飾することができる。ヌクレアーゼ活性は、当技術分野において知られている数個の方法、例えば、突然変異をRuvCドメイン(例えば、RuvCドメインの一つ以上の触媒残基)に導入することによって減弱させることができる。非限定的な例において、残基D280、残基E439、及び/又は残基D560における突然変異を含む配列番号2の変異体は、減弱したヌクレアーゼ活性を示すか、又はヌクレアーゼ活性を示さない。
いくつかの実施形態において、本明細書において記載されるヌクレアーゼは、自己不活性化することができる。その全体が参照によって援用されるEpstein et al.,“Engineering a Self-Inactivating CRISPR System for AAV Vectors,”Mol.Ther.,24(2016):S50を参照されたい。
本明細書において記載されるヌクレアーゼをコードする核酸分子は、さらにコドン最適化することができる。核酸は、細菌細胞又は哺乳類細胞などの特定の宿主細胞において使用するためにコドン最適化することができる。
ターゲティング成分
いくつかの実施形態において、本明細書において記載される組成物は、ターゲティング成分を含む。
ターゲティング成分は、ターゲティング成分が、基準核酸配列に対して、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、又は少なくとも約99.5%の配列同一性を有する配列を含む場合、基準核酸配列と実質的に同一であってもよい。このような2つの核酸の間の同一性パーセントは、2つの最適にアラインメントされた核酸配列の目視検査によって手作業で又は標準的なパラメーターを使用するソフトウェアプログラム若しくはアルゴリズム(例えばBLAST、ALIGN、CLUSTAL)を使用することによって決定することができる。2つの核酸配列が実質的に同一であるという1つの目安は、2つの核酸分子がストリンジェントな(例えば、中~高ストリンジェンシーの範囲内の)条件下で互いにハイブリダイズするといったものである。
いくつかの実施形態において、ターゲティング成分は、基準核酸配列に対して、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、又は少なくとも約99.5%の配列同一性を有する。
RNAガイド配列
いくつかの実施形態において、ターゲティング成分は、RNAガイド配列を含む又はRNAガイド配列である。いくつかの実施形態において、RNAガイド配列は、本明細書において記載されるヌクレアーゼを特定の核酸配列に導く。特定の種類のRNAガイド配列についての下記の実施例を読む当業者らは、いくつかの実施形態において、RNAガイド配列が、部位特異的であることを理解するであろう。すなわち、いくつかの実施形態において、RNAガイド配列は、非標的核酸配列(例えば、非特異的なDNA又はランダム配列)にではなく、一つ以上の標的核酸配列(例えば、特異的なDNA又はゲノムDNA配列)と特異的に結びつく。
いくつかの実施形態において、本明細書において記載される組成物は、本明細書において記載されるヌクレアーゼと結びつき、ヌクレアーゼを標的核酸配列(例えばDNA)に導くRNAガイド配列を含む。RNAガイド配列は、核酸配列と結びつき、ヌクレアーゼの機能性を改変してもよい(例えば、分子に対するヌクレアーゼの親和性を、例えば、少なくとも10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、又はそれ以上、改変する)。
RNAガイド配列は、配列、例えば、部位特異的配列又は部位特異的標的の一つ以上のヌクレオチドを標的にしてもよい(例えば、結びついてもよい、導かれてもよい、接触してもよい、又は結合してもよい)。いくつかの実施形態において、ヌクレアーゼ(例えば、ヌクレアーゼとRNAガイド)は、RNAガイドにおけるスペーサー配列に相補的である核酸基質(例えば、配列特異的基質又は標的核酸)への結合に際して、活性化される。
いくつかの実施形態において、RNAガイド配列は、スペーサー配列を含む。いくつかの実施形態において、RNAガイド配列のスペーサー配列は、概して、16~24の間のヌクレオチド長(例えば、18、19、20、又は21ヌクレオチド)を有し且つ特異的な核酸配列に相補的となるように、設計されてもよい。いくつかの実施形態において、スペーサーの長さは、表3に示される長さである。いくつかの特定の実施形態において、RNAガイド配列は、例えばゲノム遺伝子座の特異的なDNA鎖に相補的となるように、設計されていてもよい。いくつかの実施形態において、スペーサー配列は、例えばゲノム遺伝子座の特異的なDNA鎖に相補的となるように設計される。
ある実施形態において、RNAガイド配列は、配列又はスペーサー配列に連結されたダイレクトリピート配列を含む(include)、それから本質的になる、又はそれを含む(comprise)。いくつかの実施形態において、RNAガイド配列は、ダイレクトリピート配列及びスペーサー配列又はダイレクトリピート-スペーサー-ダイレクトリピート配列を含む。いくつかの実施形態において、RNAガイド配列は、切断されたダイレクトリピート配列及びスペーサー配列を含み、これは、プロセシングされた又は成熟crRNAの典型である。いくつかの実施形態において、ヌクレアーゼは、RNAガイド配列と複合体を形成し、RNAガイド配列は、少なくとも一部のRNAガイド配列に相補的である部位特異的標的核酸と結びつくように、複合体を導く。
いくつかの実施形態において、RNAガイド配列は、標的核酸配列に対して、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%相補的な配列、例えばRNA配列を含む。いくつかの実施形態において、RNAガイド配列は、DNA配列に対して、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%相補的な配列を含む。いくつかの実施形態において、RNAガイド配列は、標的核酸配列に対して、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%相補的な配列を含む。いくつかの実施形態において、RNAガイド配列は、ゲノム配列に対して、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%相補的な配列を含む。いくつかの実施形態において、RNAガイド配列は、ゲノム配列に対して相補的な配列又は少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%のゲノム配列に対する相補性を含む配列を含む。
いくつかの実施形態において、本明細書において記載されるヌクレアーゼは、一つ以上の(例えば、2、3、4、5、6、7、8、又はそれ以上の)RNAガイド配列、例えばRNAガイドを含む。
いくつかの実施形態において、RNAガイドは、例えば国際公開第2014/093622号パンフレット及び国際公開第2015/070083号パンフレットと同様の構成を有し、これらのそれぞれの全内容は、参照によって本明細書に援用される。
いくつかの実施形態において、本発明のRNAガイド配列は、表4のダイレクトリピート配列に対して、80、85、90、91、92、93、94、95、96、97、98、99、又は100%の同一性を有するダイレクトリピート配列を含む。いくつかの実施形態において、本発明のRNAガイドは、表4のダイレクトリピート配列に対して、80、85、90、91、92、93、94、95、96、97、98、99を超える、又は100%の同一性を有するダイレクトリピート配列を含む。
いくつかの実施形態において、CRISPR関連タンパク質及びRNAガイド(例えば、ダイレクトリピート及びスペーサーを含むRNAガイド)は、複合体を形成する。いくつかの実施形態において、CRISPR関連タンパク質及びRNAガイド(例えば、ダイレクトリピート-スペーサー-ダイレクトリピート配列又はpre-crRNAを含むRNAガイド)は、複合体を形成する。いくつかの実施形態において、複合体は、標的核酸に結合する。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号1のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号38又は配列番号39のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号2のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号40又は配列番号41のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号3のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号42又は配列番号43のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号4のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号44又は配列番号45のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号4のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号44又は配列番号45のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号5のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号46又は配列番号47のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号6のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号48又は配列番号49のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号7のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号50又は配列番号51のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号8のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号52又は配列番号53のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号9のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号54又は配列番号55のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号10のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号56又は配列番号57のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号11のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号58又は配列番号59のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号12のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号60又は配列番号61のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号13のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号62又は配列番号63のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号14のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号64又は配列番号65のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号15のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号66又は配列番号220のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号16のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、

90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号67又は配列番号68のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号17のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号69又は配列番号70のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号18のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号71又は配列番号72のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号19のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号73又は配列番号74のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号20のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号75又は配列番号76のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号22のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号79又は配列番号80のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号23のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号81又は配列番号82のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号24のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号83又は配列番号84のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号25のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号85又は配列番号86のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号26のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号87又は配列番号88のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号27のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号89又は配列番号90のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号28のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号91又は配列番号92のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号29のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号93又は配列番号94のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号30のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号95又は配列番号96のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号31のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号97又は配列番号98のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号32のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号99又は配列番号100のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号33のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号101又は配列番号102のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号34のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、

86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号103又は配列番号104のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号35のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号105又は配列番号106のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号36のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号107又は配列番号108のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号37のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号109又は配列番号110のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。
いくつかの実施形態において、CRISPR関連タンパク質及びRNAガイド(例えば、ダイレクトリピート及びスペーサーを含むRNAガイド)は、複合体を形成する。いくつかの実施形態において、CRISPR関連タンパク質及びRNAガイド(例えば、ダイレクトリピート-スペーサー-ダイレクトリピート配列又はpre-crRNAを含むRNAガイド)は、複合体を形成する。いくつかの実施形態において、複合体は、標的核酸に結合する。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号2のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号40のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号5のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号46のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号6のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号48のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号7のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号50のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号10のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号56のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号11のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号58のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号13のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号62のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号15のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号66のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号16のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号67のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号17のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号69のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号18のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号71のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号19のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号73のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号20のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号75のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号23のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号81のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号27のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号89のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号31のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号97のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号34のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号103のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%

、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号35のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号105のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号36のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号107のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号37のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号109のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、複合体は、標的核酸に結合する。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号221のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号225又は配列番号226のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、複合体は、標的核酸に結合する。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号222のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号227又は配列番号228のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、複合体は、標的核酸に結合する。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号223のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号229又は配列番号230のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、複合体は、標的核酸に結合する。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号224のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号231又は配列番号232のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。
いくつかの実施形態において、本発明のRNAガイド配列は、表5のダイレクトリピート配列に対して、80、85、90、91、92、93、94、95、96、97、98、99、又は100%の同一性を有するダイレクトリピート配列を含む。いくつかの実施形態において、本発明のRNAガイドは、表5のダイレクトリピート配列に対して、80、85、90、91、92、93、94、95、96、97、98、99を超える、又は100%の同一性を有するダイレクトリピート配列を含む。
いくつかの実施形態において、CRISPR関連タンパク質及びRNAガイド(例えば、ダイレクトリピート及びスペーサーを含むRNAガイド)は、複合体を形成する。いくつかの実施形態において、CRISPR関連タンパク質及びRNAガイド(例えば、ダイレクトリピート-スペーサー又は成熟crRNAを含むRNAガイド)は、複合体を形成する。いくつかの実施形態において、複合体は、標的核酸に結合する。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号2のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号111のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号5のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号112のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号7のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号113のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号13のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号114のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号14のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号115のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号16のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号116のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号18のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号117のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号19のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号118のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号21のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号119のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号27のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号120又は配列番号121のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号28のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号122のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号31のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号123のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号35のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号124のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。いくつかの実施形態において、CRISPR関連タンパク質は、配列番号37のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるアミノ酸配列を含み、ダイレクトリピート配列は、配列番号125又は配列番号126のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一であるヌクレオチド配列を含む。
いくつかの実施形態において、RNAガイドは、図2において記載されるダイレクトリピート配列を含む。例えば、いくつかの実施形態において、RNAガイドは、図2において示されるコンセンサス配列のダイレクトリピート又は図2において示されるコンセンサス配列の一部を含む。例えば、いくつかの実施形態において、RNAガイドは、XCCCTXとして記載される配列を有するダイレクトリピートを含み、式中、XはG又はAであり、XはA又はCであり、XはG又はAである。いくつかの実施形態において、RNAガイドは、XGGGXAとして記載される配列を有するダイレクトリピートを含み、式中、XはT又はGであり、XはT又はGであり、XはT又はGであり、XはA又はGであり、XはT又はAであり、XはA又はG又はCである(配列番号242)。
いくつかの実施形態において、本明細書において記載されるRNAガイドは、ウラシル(U)を含む。いくつかの実施形態において、本明細書において記載されるRNAガイドは、チミン(T)を含む。いくつかの実施形態において、本明細書において記載されるRNAガイドのダイレクトリピート配列は、ウラシル(U)を含む。いくつかの実施形態において、本明細書において記載されるRNAガイドのダイレクトリピート配列は、チミン(T)を含む。いくつかの実施形態において、表4又は表5によるダイレクトリピート配列は、表4又は表5の対応する配列においてチミンとして示される1つ以上の場所に、ウラシルを含む配列を含む。
いくつかの実施形態において、本発明のRNAガイドは、任意選択で、表6のtracrRNAに対して、80、85、90、91、92、93、94、95、96、97、98、99、又は100%の同一性を有するtracrRNA配列を含む。いくつかの実施形態において、本発明のターゲティング成分は、表6のtracrRNAに対して、80、85、90、91、92、93、94、95、96、97、98、99を超える、又は100%の同一性を有するダイレクトリピート配列を含む。いくつかの実施形態において、本発明のRNAガイドは、tracrRNA配列、例えば、表6のtracrRNAを含まない。いくつかの実施形態において、本発明のヌクレアーゼ、例えば、配列番号1~37又は配列番号221~224のいずれか1つのヌクレアーゼは、活性(例えば、ヌクレアーゼ活性)を有するのにtracrRNA配列、例えば、表6のtracrRNA配列を必要としない。
特に断りのない限り、本明細書において提供されるすべての組成物及びヌクレアーゼは、その組成物又はヌクレアーゼの活性レベルを基準にして作製され、市販されている原料中に存在する可能性がある不純物、例えば残留溶媒又は副産物を除いてある。ヌクレアーゼ構成要素の重量は、総活性タンパク質に基づく。パーセンテージ及び比はすべて、特に明記されない限り、重量で計算される。パーセンテージ及び比はすべて、特に明記されない限り、全組成物に基づいて計算される。例示される組成物において、ヌクレアーゼレベルは、全組成物のうちの純粋な酵素によって重量で表現され、特に指定のない限り、内容物は、全組成物のうちの重量によって表現される。
修飾
RNAガイド配列又はヌクレアーゼをコードする核酸配列のいずれも、基準配列、特に親ポリリボヌクレオチドに関して、一つ以上の共有結合性修飾を含んでいてもよく、これらは、本発明の範囲内に含まれる。
例示的な修飾は、糖、核酸塩基、ヌクレオシド間の連結(例えば、連結しているリン酸への/ホスホジエステル結合への/ホスホジエステル骨格への)、及びその任意の組み合わせへの任意の修飾を含むことができる。本明細書において提供される例示的な修飾のいくつかは、以下に詳細に記載される。
RNAガイド配列又はヌクレアーゼの構成要素をコードする核酸配列のいずれも、糖、核酸塩基、又はヌクレオシド間の連結(例えば、連結しているリン酸への/ホスホジエステル結合への/ホスホジエステル骨格への)など、任意の有用な修飾を含んでいてもよい。ピリミジン核酸塩基の一つ以上の原子は、任意選択で置換されたアミノ、任意選択で置換されたチオール、任意選択で置換されたアルキル(例えば、メチル若しくはエチル)、又はハロ(例えば、クロロ若しくはフルオロ)と置き換えられてもよい又は置換されてもよい。ある実施形態において、修飾(例えば、一つ以上の修飾)は、糖及びヌクレオシド間の連結のそれぞれにおいて存在する。修飾は、リボ核酸(RNA)の、デオキシリボ核酸(DNA)、トレオース核酸(TNA)、グリコール核酸(GNA)、ペプチド核酸(PNA)、ロックド核酸(LNA)、又はそのハイブリッド)への修飾であってもよい。追加の修飾は、本明細書において記載される。
いくつかの実施形態において、修飾は、化学的又は細胞誘発性の修飾を含んでいてもよい。例えば、細胞内RNA修飾のいくつかの非限定的な例は、Lewis and Pan in“RNA modifications and structures cooperate to guide RNA-protein interactions”from Nat Reviews Mol Cell Biol,2017,18:202-210によって記載される。
様々な糖修飾、ヌクレオチド修飾、及び/又はヌクレオシド間の連結(例えば骨格構造)が、配列中の多様な位置に存在してもよい。当業者は、ヌクレオチド類似体又は他の修飾が、配列の機能が実質的に減少しないような、配列の任意の位置に位置してもよいことをよく理解するであろう。配列は、約1%~約100%(全体的なヌクレオチド含有量に関して又はヌクレオチドの一つ以上のタイプ、すなわち、任意の一つ以上のA、G、U、若しくはCに関して)或いは任意の間のパーセンテージ(例えば、1%~20%>、1%~25%、1%~50%、1%~60%、1%~70%、1%~80%、1%~90%、1%~95%、10%~20%、10%~25%、10%~50%、10%~60%、10%~70%、10%~80%、10%~90%、10%~95%、10%~100%、20%~25%、20%~50%、20%~60%、20%~70%、20%~80%、20%~90%、20%~95%、20%~100%、50%~60%、50%~70%、50%~80%、50%~90%、50%~95%、50%~100%、70%~80%、70%~90%、70%~95%、70%~100%、80%~90%、80%~95%、80%~100%、90%~95%、90%~100%、及び95%~100%)の修飾ヌクレオチドを含んでいてもよい。
いくつかの実施形態において、配列の一つ以上のリボヌクレオチドの糖修飾(例えば、2’位若しくは4’位で)又は糖の置き換え及び骨格修飾は、ホスホジエステル結合の修飾又は置き換えを含んでいてもよい。配列の特定の例は、修飾された骨格を含む又はホスホジエステル結合の修飾若しくは置き換えを含む、ヌクレオシド間の修飾などの天然のヌクレオシド間の連結を含まない配列を含むが、これらに限定されない。修飾された骨格を有する配列は、とりわけ、骨格中にリン原子を有していない配列を含む。本出願の目的のために、また、時に当技術分野において言及されるように、それらのヌクレオシド間の骨格中にリン原子を有していない修飾RNAはまた、オリゴヌクレオシドとみなすこともできる。特定の実施形態において、配列は、そのヌクレオシド間の骨格中にリン原子を有するリボヌクレオチドを含む。
修飾された配列骨格は、例えば、ホスホロチオエート、キラルホスホロチオエート、ホスホロジチオエート、リン酸トリエステル、アミノアルキルリン酸トリエステル、3’-アルキレンホスホネート及びキラルホスホネートなどのメチル及び他のアルキルホスホネート、ホスフィネート、3’-アミノホスホロアミデート及びアミノアルキルホスホロアミデートなどのホスホロアミデート、チオノホスホロアミデート、チオノアルキルホスホネート、チオノアルキルリン酸トリエステル、並びに通常の3’-5’連結を有するボラノリン酸、これらの2’-5’連結アナログ、及びヌクレオシド単位の隣接する対が、3’-5’~5’-3’又は2’-5’~5’-2’に連結される、逆の極性を有するものを含んでいてもよい。多様な塩、混合塩、及び遊離酸形態もまた、含まれる。いくつかの実施形態において、配列は、負に又は正に荷電していてもよい。
配列に組み込まれてもよい修飾ヌクレオチドは、ヌクレオシド間の連結(例えばリン酸骨格)に対して修飾することができる。本明細書において、ポリヌクレオチド骨格に関して、語句「リン酸」及び「ホスホジエステル」は、区別なく使用される。骨格リン酸基は、一つ以上の酸素原子を異なる置換基と置き換えることによって修飾することができる。さらに、修飾ヌクレオシド及びヌクレオチドは、無修飾リン酸成分の、本明細書において記載される別のヌクレオシド間の連結との全面的な置き換えを含むことができる。修飾リン酸基の例は、ホスホロチオエート、ホスホロセレナート(phosphoroselenate)、ボラノリン酸、ボラノリン酸エステル、水素ホスホネート(hydrogen phosphonate)、ホスホロアミデート、ホスホロジアミデート、アルキル又はアリールホスホネート、及びリン酸トリエステルを含むが、これらに限定されない。ジチオリン酸は、両方の非連結酸素が硫黄によって置き換えられている。リン酸リンカーはまた、連結酸素の、窒素(架橋ホスホロアミデート)、硫黄(架橋ホスホロチオエート)、及び炭素(架橋メチレンホスホネート)との置き換えによって修飾することもできる。
α-チオ置換リン酸成分は、非天然ホスホロチオエート骨格連結を通してRNA及びDNAポリマーに安定性を与えるために提供される。ホスホロチオエートDNA及びRNAは、ヌクレアーゼ抵抗性が増加しており、続いて、細胞環境においてより長い半減期を有する。
特定の実施形態において、修飾ヌクレオシドは、アルファ-チオ-ヌクレオシド(例えば5’-O-(1-チオホスフェート)-アデノシン、5’-O-(1-チオホスフェート)-シチジン(a-チオ-シチジン)、5’-O-(1-チオホスフェート)-グアノシン、5’-O-(1-チオホスフェート)-ウリジン、又は5’-O-(1-チオホスフェート)プソイドウリジン)を含む。
リン原子を含有しないヌクレオシド間の連結を含む、本発明に従って用いられてもよい他のヌクレオシド間の連結は、本明細書において記載される。
いくつかの実施形態において、配列は、一つ以上の細胞毒性ヌクレオシドを含んでいてもよい。例えば、細胞毒性ヌクレオシドは、二官能性修飾などのように、配列に組み込まれてもよい。細胞毒性ヌクレオシドは、アデノシンアラビノシド、5-アザシチジン、4’-チオ-アラシチジン、シクロペンテニルシトシン、クラドリビン、クロファラビン、シタラビン、シトシンアラビノシド、1-(2-C-シアノ-2-デオキシ-ベータ-D-アラビノ-ペントフラノシル)-シトシン、デシタビン、5-フルオロウラシル、フルダラビン、フロクシウリジン、ゲムシタビン、テガフール及びウラシルの組み合わせ、テガフール((RS)-5-フルオロ-1-(テトラヒドロフラン-2-イル)ピリミジン-2,4(1H,3H)-ジオン)、トロキサシタビン、テザシタビン、2’-デオキシ-2’-メチリデンシチジン(DMDC)、並びに6-メルカプトプリンを含んでいてもよいが、これらに限定されない。追加の例は、フルダラビンホスフェート、N4-ベヘノイル-1-ベータ-D-アラビノフラノシルシトシン、N4-オクタデシル-1-ベータ-D-アラビノフラノシルシトシン、N4-パルミトイル-1-(2-C-シアノ-2-デオキシ-ベータ-D-アラビノ-ペントフラノシル)シトシン、及びP-4055(シタラビン5’-エライジン酸エステル)を含む。
いくつかの実施形態において、配列は、一つ以上の転写後修飾を含む(例えばキャッピング、切断、ポリアデニル化、スプライシング、ポリA配列、メチル化、アシル化、リン酸化、リシン残基及びアルギニン残基のメチル化、アセチル化、並びにチオール基及びチロシン残基のニトロシル化等)。一つ以上の転写後修飾は、RNAにおいて確認された100を超える様々なヌクレオシド修飾のいずれかなどの、任意の転写後修飾とすることができる(Rozenski,J,Crain,P,and McCloskey,J.(1999).The RNA Modification Database:1999 update.Nucl Acids Res 27:196-197)いくつかの実施形態において、第1の単離核酸は、メッセンジャーRNA(mRNA)を含む。いくつかの実施形態において、mRNAは、ピリジン-4-オンリボヌクレオシド、5-アザ-ウリジン、2-チオ-5-アザ-ウリジン、2-チオウリジン、4-チオ-プソイドウリジン、2-チオ-プソイドウリジン、5-ヒドロキシウリジン、3-メチルウリジン、5-カルボキシメチル-ウリジン、1-カルボキシメチル-プソイドウリジン、5-プロピニル-ウリジン、1-プロピニル-プソイドウリジン、5-タウリノメチルウリジン、1-タウリノメチル-プソイドウリジン、5-タウリノメチル-2-チオ-ウリジン、1-タウリノメチル-4-チオ-ウリジン、5-メチル-ウリジン、1-メチル-プソイドウリジン、4-チオ-1-メチル-プソイドウリジン、2-チオ-1-メチル-プソイドウリジン、1-メチル-1-デアザ-プソイドウリジン、2-チオ-1-メチル-1-デアザ-プソイドウリジン、ジヒドロウリジン、ジヒドロプソイドウリジン、2-チオ-ジヒドロウリジン、2-チオ-ジヒドロプソイドウリジン、2-メトキシウリジン、2-メトキシ-4-チオ-ウリジン、4-メトキシ-プソイドウリジン、及び4-メトキシ-2-チオ-プソイドウリジンからなる群から選択される少なくとも1つのヌクレオシドを含む。いくつかの実施形態において、mRNAは、5-アザ-シチジン、プソイドイソシチジン、3-メチル-シチジン、N4-アセチルシチジン、5-ホルミルシチジン、N4-メチルシチジン、5-ヒドロキシメチルシチジン、1-メチル-プソイドイソシチジン、ピロロ-シチジン、ピロロ-プソイドイソシチジン、2-チオ-シチジン、2-チオ-5-メチル-シチジン、4-チオ-プソイドイソシチジン、4-チオ-1-メチル-プソイドイソシチジン、4-チオ-1-メチル-1-デアザ-プソイドイソシチジン、1-メチル-1-デアザ-プソイドイソシチジン、ゼブラリン、5-アザ-ゼブラリン、5-メチル-ゼブラリン、5-アザ-2-チオ-ゼブラリン、2-チオ-ゼブラリン、2-メトキシ-シチジン、2-メトキシ-5-メチル-シチジン、4-メトキシ-プソイドイソシチジン、及び4-メトキシ-1-メチル-プソイドイソシチジンからなる群から選択される少なくとも1つのヌクレオシドを含む。いくつかの実施形態において、mRNAは、2-アミノプリン、2,6-ジアミノプリン、7-デアザ-アデニン、7-デアザ-8-アザアデニン、7-デアザ-2-アミノプリン、7-デアザ-8-アザ-2-アミノプリン、7-デアザ-2,6-ジアミノプリン、7-デアザ-8-アザ-2,6-ジアミノプリン、1-メチルアデノシン、N6-メチルアデノシン、N6-イソペンテニルアデノシン、N6-(シス-ヒドロキシイソペンテニル)アデノシン、2-メチルチオ-N6-(シス-ヒドロキシイソペンテニル)アデノシン、N6-グリシニルカルバモイルアデノシン、N6-スレオニルカルバモイルアデノシン、2-メチルチオ-N6-スレオニルカルバモイルアデノシン、N6,N6-ジメチルアデノシン、7-メチルアデニン、2-メチルチオ-アデニン、及び2-メトキシ-アデニンからなる群から選択される少なくとも1つのヌクレオシドを含む。いくつかの実施形態において、mRNAは、イノシン、1-メチル-イノシン、ワイオシン、ワイブトシン、7-デアザ-グアノシン、7-デアザ-8-アザ-グアノシン、6-チオ-グアノシン、6-チオ-7-デアザグアノシン、6-チオ-7-デアザ-8-アザ-グアノシン、7-メチル-グアノシン、6-チオ-7-メチルグアノシン、7-メチルイノシン、6-メトキシ-グアノシン、1-メチルグアノシン、N2-メチルグアノシン、N2,N2-ジメチルグアノシン、8-オキソ-グアノシン、7-メチル-8-オキソ-グアノシン、1-メチル-6-チオ-グアノシン、N2-メチル-6-チオ-グアノシン、及びN2,N2-ジメチル-6-チオ-グアノシンからなる群から選択される少なくとも1つのヌクレオシドを含む。
配列は、分子の全長に沿って、均一に修飾されてもよい又は修飾されなくてもよい。例えば、一つ以上の又はすべてのタイプのヌクレオチド(例えば、天然に存在するヌクレオチド、プリン、若しくはピリミジン又は任意の一つ以上の若しくはすべてのA、G、U、C、I、pU)は、配列において又はその所定の、あらかじめ決められた配列領域において、均一に修飾されてもよい又は修飾されなくてもよい。いくつかの実施形態において、配列は、プソイドウリジンを含む。いくつかの実施形態において、配列は、イノシンを含み、これは、内在性RNA対ウイルスRNAとして配列の特性を決定する免疫システムを助けてもよい。イノシンの組み込みはまた、RNA安定性の改善/分解の低下を実現してもよい。例えば、その全体が参照によって援用されるYu,Z.et al.(2015)RNA editing by ADAR1 marks dsRNA as“self”.Cell Res.25,1283-1284を参照されたい。
ベクター
本発明は、本明細書において記載されるヌクレアーゼを発現するためのベクターを提供する又は本明細書において記載されるヌクレアーゼをコードする核酸は、ベクターに組み込まれてもよい。いくつかの実施形態において、本発明のベクターは、本明細書において記載されるヌクレアーゼをコードするヌクレオチド配列を含む。いくつかの実施形態において、本発明のベクターは、本明細書において記載されるヌクレアーゼをコードするヌクレオチド配列を含む。
本発明はまた、本明細書において記載されるヌクレアーゼ又は本明細書において記載されるヌクレアーゼを含む組成物の調製のために使用されてもよいベクターをも提供する。いくつかの実施形態において、本発明は、細胞中に、本明細書において記載される組成物又はベクターを含む。いくつかの実施形態において、本発明は、細胞において、本発明のヌクレアーゼ又はヌクレアーゼをコードするベクター若しくは核酸を含む組成物を発現させるための方法を含む。方法は、組成物、例えば、ベクター又は核酸を提供するステップ及び組成物を細胞に送達するステップを含んでいてもよい。
天然又は合成ポリヌクレオチドの発現は、関連する遺伝子をコードするポリヌクレオチド、例えば、本発明のヌクレアーゼをコードするヌクレオチド配列を、プロモーターに作動可能に連結し、構築物を発現ベクターに組み込むことによって、典型的に達成される。発現ベクターは、本発明のヌクレアーゼをコードするポリヌクレオチドを含み且つ真核細胞における複製及び統合に適し得る限り、特に制限されない。
典型的な発現ベクターは、所望されるポリヌクレオチドの発現に有用な転写及び翻訳ターミネーター、開始配列、並びにプロモーターを含む。例えば、RNAポリメラーゼに対する認識配列を運搬するプラスミドベクター(pSP64、pBluescript等)が、使用されてもよい。レンチウイルスなどのレトロウイルスに由来するベクターを含むベクターは、導入遺伝子の長期的で、安定した統合及び娘細胞におけるその増殖を可能にするので、長期的遺伝子移入を達成するための適したツールとなる。ベクターの例は、発現ベクター、複製ベクター、プローブ生成ベクター(probe generation vector)、及びシークエンシングベクターを含む。発現ベクターは、ウイルスベクターの形態で細胞に提供されてもよい。
ウイルスベクター技術は、当技術分野においてよく知られており、種々のウイルス学及び分子生物学のマニュアルにおいて記載される。ベクターとして有用であるウイルスは、ファージウイルス、レトロウイルス、アデノウイルス、アデノ随伴ウイルス、ヘルペスウイルス、及びレンチウイルスを含むが、これらに限定されない。一般に、適したベクターは、少なくとも1つの生物において機能的な複製開始点、プロモーター配列、便利な制限エンドヌクレアーゼ部位、及び一つ以上の選択可能なマーカーを含有する。
ベクターの種類は、特に制限されず、宿主細胞において発現することができるベクターは、適切に選択することができる。具体的には、宿主細胞の種類に依存して、ポリヌクレオチドからの本発明のヌクレアーゼの発現を確実にするためのプロモーター配列は、適切に選択され、このプロモーター配列及びポリヌクレオチドは、発現ベクターの調製のために、多様なプラスミドのいずれかに挿入される等する。
追加のプロモーターエレメント、例えば増強配列は、転写開始の頻度を調節する。典型的に、これらは、スタート部位から30~110bp上流の領域に位置するが、多くのプロモーターが、スタート部位の下流にも機能的なエレメントを含有することが最近示された。プロモーターに依存して、個々のエレメントは、転写を活性化するために協力して又は独立して機能することができるように思われる。
さらに、本開示は、恒常的プロモーターの使用に制限されるべきではない。誘導性プロモーターもまた、本開示の一部として想定される。誘導性プロモーターの使用は、このような発現が所望される場合に、誘導性プロモーターに有効に連結されているポリヌクレオチド配列の発現をオンにする又は発現が所望されない場合に、発現をオフにすることが可能な分子スイッチを提供する。誘導性プロモーターの例は、メタロチオニン(metallothionine)プロモーター、グルココルチコイドプロモーター、プロゲステロンプロモーター、及びテトラサイクリンプロモーターを含むが、これらに限定されない。
導入される発現ベクターはまた、ウイルスベクターを通してトランスフェクトしようと又は感染させようと試みた細胞の集団からの発現細胞の確認及び選択を容易にするために、選択可能なマーカー遺伝子若しくはリポーター遺伝子又はその両方を含有することもできる。他の態様において、選択可能なマーカーは、DNAの別々のピースで運搬されてもよく、同時トランスフェクション手順において使用されてもよい。選択可能なマーカー及びリポーター遺伝子の両方は、宿主細胞における発現を可能にするために、適切な転写コントロール配列が側面に位置してもよい。このようなマーカーの例は、真核細胞培養のためのジヒドロ葉酸還元酵素遺伝子及びネオマイシン耐性遺伝子;並びに大腸菌(E.coli)及び他の細菌の培養のためのテトラサイクリン耐性遺伝子及びアンピシリン耐性遺伝子を含む。このような選択マーカーの使用によって、本発明のヌクレアーゼをコードするポリヌクレオチドが宿主細胞に移入され、次いで、確実に発現されたかどうかを確かめることができる。
組換え発現ベクターのための調製方法は、特に制限されず、その例は、プラスミド、ファージ、又はコスミドを使用する方法を含む。
細胞
本明細書において記載されるヌクレアーゼは、多様な細胞に導入することができる。いくつかの実施形態において、細胞は、単離細胞である。いくつかの実施形態において、細胞は、細胞培養物中にある。いくつかの実施形態において、細胞は、エクスビボである。いくつかの実施形態において、細胞は、生物から得られ、細胞培養物中に維持される。いくつかの実施形態において、細胞は、単細胞生物である。
いくつかの実施形態において、細胞は、原核細胞である。いくつかの実施形態において、細胞は、細菌細胞であるか、又は細菌細胞に由来する。いくつかの実施形態において、細胞は、古細菌細胞であるか、又は古細菌細胞に由来する。
いくつかの実施形態において、細胞は、真核細胞である。いくつかの実施形態において、細胞は、植物細胞であるか、又は植物細胞に由来する。いくつかの実施形態において、細胞は、真菌細胞であるか、又は真菌細胞に由来する。いくつかの実施形態において、細胞は、動物細胞であるか、又は動物細胞に由来する。いくつかの実施形態において、細胞は、無脊椎動物細胞であるか、又は無脊椎動物細胞に由来する。いくつかの実施形態において、細胞は、脊椎動物細胞であるか、又は脊椎動物細胞に由来する。いくつかの実施形態において、細胞は、哺乳類細胞であるか、又は哺乳類細胞に由来する。いくつかの実施形態において、細胞は、ヒト細胞である。いくつかの実施形態において、細胞は、ゼブラフィッシュ細胞である。いくつかの実施形態において、細胞は、げっ歯類細胞である。いくつかの実施形態において、細胞は、合成的に作製され、人工細胞と呼ばれることもある。
いくつかの実施形態において、細胞は、細胞株に由来する。組織培養のための多種多様な細胞株が当技術分野で知られている。細胞株の例は、293T、MF7、K562、HeLa、及びそれらのトランスジェニック変種を含むが、これらに限定されない。細胞株は、当業者に知られている多様な供給源から入手可能である(例えば、American Type Culture Collection(ATCC)(Manassas,Va.を参照されたい))。いくつかの実施形態において、1つ以上のベクター由来配列を含む新しい細胞株を確立して、標的核酸又は標的遺伝子座に対する修飾を含む新しい細胞株を確立するために、1つ以上の核酸(ベクター及びRNAガイドをコードするヌクレアーゼポリペプチドなど)でトランスフェクトされた細胞が使用される。いくつかの実施形態において、細胞は、不死細胞又は不死化細胞である。
いくつかの実施形態において、細胞は、初代細胞である。いくつかの実施形態において、細胞は、全能性(totipotent)幹細胞(例えば、全能性(omnipotent))、多能性(pluripotent)幹細胞、多能性(multipotent)幹細胞、少能性幹細胞、又は単能性幹細胞などの幹細胞である。いくつかの実施形態において、細胞は、人工多能性幹細胞(iPSC)であるか、又はiPSCに由来する。いくつかの実施形態において、細胞は、分化細胞である。例えば、いくつかの実施形態において、分化細胞は、筋肉細胞(例えば、筋細胞)、脂肪細胞(fat cell)(例えば、脂肪細胞(adipocyte))、骨細胞(bone cell)(例えば、骨芽細胞、骨細胞(osteocyte)、破骨細胞)、血液細胞(例えば、単球、リンパ球、好中球、好酸球、好塩基球、マクロファージ、赤血球、又は血小板)、神経細胞(例えば、ニューロン)、上皮細胞、免疫細胞(例えば、リンパ球、好中球、単球、又はマクロファージ)、肝臓細胞(例えば、肝細胞)、線維芽細胞、又は性細胞である。いくつかの実施形態において、細胞は、最終分化細胞である。例えば、いくつかの実施形態において、最終分化細胞は、神経細胞、脂肪細胞、心筋細胞、骨格筋細胞、表皮細胞、又は腸細胞である。いくつかの実施形態において、細胞は、哺乳類細胞、例えば、ヒト細胞又はマウス細胞である。いくつかの実施形態において、マウス細胞は、野生型マウス、免疫抑制マウス、又は疾患特異的マウスモデルに由来する。
産生
いくつかの実施形態において、本発明のヌクレアーゼは、(I)本発明のヌクレアーゼを産生する細菌を培養すること、ヌクレアーゼを単離すること、及び任意選択で、ヌクレアーゼを精製することによって、調製することができる。ヌクレアーゼはまた、(II)既知の遺伝子操作技術、詳細には、本発明のヌクレアーゼをコードする遺伝子を細菌から単離すること、組換え発現ベクターを構築すること、及び次いで、組換えタンパク質の発現のために適切な宿主細胞にベクターを移入することによって、調製することもできる。その代わりに、ヌクレアーゼは、(III)インビトロ共役転写-翻訳システムによって調製することができる。本発明のヌクレアーゼの調製のために使用することができる細菌は、本発明のヌクレアーゼを産生することができる限り、特に制限されない。細菌のいくつかの非限定的な例は、本明細書において記載される大腸菌(E.coli)細胞を含む。
発現の方法
本発明は、タンパク質発現のための方法であって、本明細書において記載されるヌクレアーゼを翻訳することを含む方法を含む。
いくつかの実施形態において、本明細書において記載される宿主細胞は、ヌクレアーゼを発現させるために使用される。宿主細胞は、特に制限されず、多様な既知の細胞を、好ましくは、使用することができる。宿主細胞の特定の例は、大腸菌(E.coli)などの細菌、酵母(出芽酵母、サッカロマイセス・セレビシエ(Saccharomyces cerevisiae)及び分裂酵母、シゾサッカロミセス・ポンベ(Schizosaccharomyces pombe))、線形動物(線虫(Caenorhabditis elegans))、アフリカツメガエル(Xenopus laevis)卵母細胞、並びに動物細胞(例えば、CHO細胞、COS細胞、及びHEK293細胞)を含む。上記の発現ベクターを宿主細胞に移入するための方法、すなわち、形質転換方法は、特に制限されず、エレクトロポレーション、リン酸カルシウム法、リポソーム法、及びDEAEデキストラン法などの既知の方法を、使用することができる。
宿主を発現ベクターにより形質転換した後、宿主細胞は、ヌクレアーゼの産生のために、培養されてもよい、発育させてもよい、育てられてもよい。ヌクレアーゼの発現の後、宿主細胞を、収集し、ヌクレアーゼを、従来の方法(例えば、ろ過、遠心分離、細胞破壊、ゲルろ過クロマトグラフィー、イオン交換クロマトグラフィー等)に従って、培養物等から精製することができる。
いくつかの実施形態において、ヌクレアーゼ発現のための方法は、少なくとも5アミノ酸、少なくとも10アミノ酸、少なくとも15アミノ酸、少なくとも20アミノ酸、少なくとも50アミノ酸、少なくとも100アミノ酸、少なくとも150アミノ酸、少なくとも200アミノ酸、少なくとも250アミノ酸、少なくとも300アミノ酸、少なくとも400アミノ酸、少なくとも500アミノ酸、少なくとも600アミノ酸、少なくとも700アミノ酸、少なくとも800アミノ酸、少なくとも900アミノ酸、又は少なくとも1000アミノ酸のヌクレアーゼの翻訳を含む。いくつかの実施形態において、タンパク質発現のための方法は、約5アミノ酸、約10アミノ酸、約15アミノ酸、約20アミノ酸、約50アミノ酸、約100アミノ酸、約150アミノ酸、約200アミノ酸、約250アミノ酸、約300アミノ酸、約400アミノ酸、約500アミノ酸、約600アミノ酸、約700アミノ酸、約800アミノ酸、約900アミノ酸、約1000アミノ酸、又はそれ以上のヌクレアーゼの翻訳を含む。
種々の方法は、宿主細胞における成熟ヌクレアーゼの産生のレベルを決定するために使用することができる。このような方法は、例えば、ヌクレアーゼに特異的なポリクローナル抗体又はモノクローナル抗体を利用する方法を含むが、これらに限定されない。例示的な方法は、酵素結合免疫吸着アッセイ(ELISA)、ラジオイムノアッセイ(MA)、蛍光イムノアッセイ(FIA)、及び蛍光活性化細胞選別(FACS)を含むが、これらに限定されない。これらの及び他のアッセイは、当技術分野においてよく知られている(例えばMaddox et al.,J.Exp.Med.158:1211[1983]を参照されたい)。
本開示は、細胞におけるヌクレアーゼのインビボ発現の方法であって、ヌクレアーゼをコードするポリリボヌクレオチドを宿主細胞に提供すること、ここで、ポリリボヌクレオチドは、ヌクレアーゼをコードする、細胞においてヌクレアーゼを発現させること、及び細胞からヌクレアーゼを得ることを含む方法を提供する。
送達
本明細書において記載される組成物は、製剤され、例えば、キャリア及び/又はポリマーのキャリア、例えばリポソームなどのキャリアを含み、既知の方法によって、細胞(例えば、原核、真核、植物、哺乳類等)に送達されてもよい。このような方法は、トランスフェクション(例えば、脂質媒介性、カチオンポリマー、リン酸カルシウム、デンドリマー);エレクトロポレーション又は膜破壊の他の方法(例えばnucleofection)、ウイルス送達(例えば、レンチウイルス、レトロウイルス、アデノウイルス、AAV)、マイクロインジェクション、微粒子銃(「遺伝子銃」)、fugene、直接音波負荷(direct sonic loading)、細胞スクイージング(cell squeezing)、光学的トランスフェクション、プロトプラスト融合、インペイルフェクション(impalefection)、マグネトフェクション(magnetofection)、エキソソーム媒介性の移入、脂質ナノ粒子媒介性の移入、及びその任意の組み合わせを含むが、これらに限定されない。別の態様において、本開示は、本明細書において記載されるAAVベクターを含むAAV粒子を部分的に対象とする。いくつかの実施形態において、AAV粒子は、AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、又はAAV11粒子(例えば、AAV8、AAV3、又はAAV2粒子)である。いくつかの実施形態において、AAV粒子はAAVカプシドを含む。いくつかの実施形態において、AAVカプシドは、1つ以上のAAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、又はAAV11タンパク質を含む。いくつかの実施形態において、AAVカプシドのすべてのタンパク質構成要素は、同じAAV血清型のタンパク質(例えば、すべてのAAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、又はAAV11タンパク質)である。
いくつかの実施形態において、方法は、1つ以上の核酸(例えば、ヌクレアーゼ、RNAガイド、ドナーDNAなどをコードする核酸)、1つ以上のその転写物、及び/又は予め形成されたヌクレアーゼ/RNAガイド複合体を細胞に送達することを含む。例示的な細胞内送達方法は、ウイルス又はウイルス様物質;リン酸カルシウム、デンドリマー、リポソーム、又はカチオン性ポリマー(例えば、DEAE-デキストラン又はポリエチレンイミン)を使用するものなどの、化学ベースのトランスフェクション方法;マイクロインジェクション、エレクトロポレーション、細胞スクイージング(cell squeezing)、ソノポレーション、光学的トランスフェクション、インペイルフェクション、プロトプラスト融合、細菌接合、プラスミド又はトランスポゾンの送達などの非化学的方法;遺伝子銃、マグネクトフェクション又は磁性補助トランスフェクション、粒子衝撃を使用するなどの粒子ベースの方法;及びヌクレオフェクションなどのハイブリッド法を含むが、これらに限定されない。いくつかの実施形態において、本願は、そのような方法によって産生された細胞、及びそのような細胞を含むか、又はそのような細胞から産生された生物(動物、植物、又は真菌など)をさらに提供する。
本明細書において引用されるすべての参考文献及び刊行物は、参照によってこれによって援用される。
以下の例は、本発明のいくつかの実施形態をさらに例証するために提供され、本発明の範囲を限定することを意図するものではない;それらの例示的な内容によって、当業者らに知られている他の手順、方法論、又は技術が、代わりに使用されてもよいことが理解されるであろう。
実施例1-エフェクター配列の分析
本実施例において、配列番号1~37及び配列番号221~224の配列のアミノ酸配列を、可能性として考えられる機能的タンパク質ドメインを同定するために分析した。アミノ酸配列は、C末端RuvCドメインと思われるドメインを含むことが決定された。触媒残基は、RuvCドメインの保存配列モチーフ(I、II、及びIII)中に存在することもまた決定された。3つの代表的なエフェクターの予測される触媒残基及びRuvCドメイン範囲を表7に示す。
図1A~1Lにおいて示されるように、配列番号1~37及び配列番号221~224のアミノ酸配列をさらにアラインメントして、配列類似性を有する領域を同定した。コンセンサス配列は、図1A~1Lの上に記載される。コンセンサス配列の下にある棒グラフは、配列類似性を示し、最も高い棒は最も高い配列類似性を有する残基を示す。配列類似性の非限定的領域を表8に示す。
本実施例は、配列番号1~37及び配列番号221~224のエフェクターが、ヌクレアーゼを代表する保存C末端RuvCドメインを有するファミリーとして分類されたことを示す。
実施例2-大腸菌(E.coli)におけるエフェクターの発現
本実施例において、配列番号2、5~7、10、11、13~21、23、27、28、31、及び34~37のいずれか1つのエフェクターを個別に含むシステムを操作し、大腸菌(E.coli)に導入した。
各エフェクターについて、エフェクターをコードするポリヌクレオチドを、大腸菌(E.coli)についてコドン最適化し、合成し(Genscript)、pET-28a(+)に由来する特注の発現系(EMD-Millipore)に、個別にクローニングした。ベクターは、lacプロモーターのコントロール下の各エフェクターをコードするポリヌクレオチド及び大腸菌(E.coli)リボソーム結合配列を含んだ。ベクターは、エフェクターのオープンリーディングフレームに続くJ23119プロモーターによって駆動されるpre-crRNA(ダイレクトリピート-スペーサー-ダイレクトリピート)の部位も含んだ。各エフェクターについて、テストしたダイレクトリピート配列が表4に記載される。スペーサーは、pACYC184プラスミド及び大腸菌(E.coli)の必須遺伝子の配列を標的とするように設計された。
エフェクター/pre-crRNAプラスミドを、E.Cloni大腸菌(E.coli)エレクトロコンピテント(Lucigen)にエレクトロポレーションした。エフェクター/pre-crRNAプラスミドを、精製pACYC184プラスミドで同時形質転換するか、又はpACYC184含有E.Cloni大腸菌(E.coli)エレクトロコンピテント(Lucigen)に直接形質転換し、適切な抗生物質を含有する寒天上で平板培養し、37℃で10~12時間インキュベートした。
大腸菌(E.coli)における操作されたエフェクター/pre-crRNAシステムの活性の代用となるものについて調査し、ここで、細菌細胞死は、システム活性の代用となるものとして使用した。pre-crRNAと関連する活性エフェクターは、スペーサー配列標的、例えば、pACYC184プラスミド配列又は大腸菌(E.coli)必須遺伝子の発現を破壊し、細胞死をもたらし得る。この代用となるものを使用して、本明細書において開示されるエフェクターが、大腸菌(E.coli)において活性を有することが決定された。
ゆえに、本実施例は、配列番号2、5~7、10、11、13~21、23、27、28、31、及び34~37のエフェクターが細菌細胞において発現され得ることを示唆する。pre-crRNA(ダイレクトリピート-スペーサー-ダイレクトリピート)では、配列番号2、5~7、10、11、13-21、23、27、28、31、及び34~37のエフェクターが細菌細胞において活性を有することが示された。
実施例3-配列番号2のエフェクターの精製
本実施例は、配列番号2のエフェクターの発現及び精製を記載する。
NEB NiCo21(DE3)細胞を、配列番号2のエフェクターのHisタグバージョンをコードするポリヌクレオチドを含む発現プラスミドで形質転換した。OD600が0.6~1.0に達するまで、細胞を37℃で成長させた。培養物にIPTGを最終濃度0.2mMで追加し、16℃で12~16時間、細胞成長を継続した。次いで、細胞をペレット化し、100mLのバッファーA(50mM HEPES KOH pH7.8、500mM NaCl、10mM MgCl、20mMイミダゾール、14mM β-メルカプトエタノール、及び5%グリセロール)に再懸濁した。再懸濁した細胞を4℃で30~45分間混合し、続いて、高圧細胞破砕器を使用して溶解した。溶解した細胞を45,000×g、4℃で30分間遠心分離し、上清を新しいチューブに移し、45,000×g、4℃で30分間遠心分離した。
次に、上清をHisTrap Nickel 5mLカラムに注ぎ、溶出したタンパク質画分をSDS-PAGEで分析した。次いで、精製エフェクタータンパク質を含む画分を合わせ、10kDa MWCOを使用して透析し、濃縮した。ブラッドフォードアッセイを用いて最終タンパク質濃度を測定した。
ゆえに、本実施例は、配列番号2のエフェクターを発現させ、ヌクレアーゼ活性アッセイのために精製することができたことを説明し、これは次の実施例において記載される。
実施例4-配列番号2のエフェクターによる二本鎖DNA切断
本実施例は、配列番号2のエフェクターによる二本鎖DNA(dsDNA)切断について説明する。
配列番号2のエフェクターのRNAガイドは、インビトロ転写(IVT)を使用して調製した。配列番号203において記載される配列番号202のRNAガイドのスペーサー配列は、標的A(配列番号201)に相補的であるように設計された。標的B(配列番号204)は、スペーサー配列(配列番号203)に対して相補性を有しておらず、ゆえに、非標的コントロールとして使用した。表9における標的A(配列番号201)の太字部分は、配列番号202の成熟crRNAが結合する配列に対応する。IVT反応用のdsDNA鋳型は、第二鎖補充法を使用して調製した。T7プロモーター配列を含有するオリゴ鋳型は市販用に合成され(IDT)、リバースプライマーにアニーリングされた後、第2鎖を補充するために伸長された(クレノウポリメラーゼ、大断片、NEB)。IVTは、dsDNA鋳型を、T7 RNAポリメラーゼ(HiScribe T7 Quick High Yield RNA synthesis kit NEB)と共にインキュベートすることによって実行し、その後、DNA鋳型を除去するために、DNase(Thermo Fisher Scientific)により処理した。IVT産物を、RNA調製キット(Zymo Research)を使用してクリーニングした。
IR800標識フォワードプライマー(IDT)及びIR700標識リバースプライマー(IDT)を使用して、二重標識dsDNA標的(標的A)及び非標的(標的B)基質を、PCRを介して生成した。得られたPCR産物は、図3Aにおいて示されるように、非スペーサー相補(NSC)鎖上のIR700標識及びスペーサー相補鎖上のIR800標識を含んだ。これらの基質はSPRIビーズ(Agilent)を使用して精製され、濃度はnanodrop(Thermo Fisher Scientific)を使用して測定された。IR700及びIR800標識は、クロスオーバーなく別々の蛍光チャネルにおいて視覚化でき、ゆえに、標的の両方の鎖の切断を視覚化できた。
dsDNA標的切断アッセイは、反応バッファー(1X NEBuffer2、NEB)において調整した。複合RNP(エフェクターとRNAガイド)は、精製されたエフェクターをRNAガイドと1:2の比率でインキュベートすることによって形成した。複合体を形成したRNPを、次いで、40nM dsDNA基質に追加し、インキュベートした。エフェクターなしの又はRNAガイドなしのネガティブコントロールもまた、テストした。反応物をRNaseカクテルで処理し、インキュベートした後、プロテイナーゼKで処理し、インキュベートした。
dsDNA切断を検出するために、反応由来のDNA産物を、15%TBE-尿素ゲルで分析した。ゲルは、IR800及びIR700の両方の蛍光について、蛍光デジタル画像処理システム(LI-COR Biosciences)で画像処理した。
図3B及び図3Cにおいて示されるように、配列番号2のエフェクター及び配列番号202のRNAガイドを含むRNPを使用して、標的特異的な二本鎖切断が観察された。図3Bは、dsDNA標的のスペーサー相補鎖の切断を示し(IR800画像)、図3Cは、dsDNA標的の非スペーサー相補鎖の切断を示す(IR700画像)。図3Bのレーン6~9及び図3Cのレーン6~9において示されるように、切断は、エフェクター濃度と正の相関があった。図3Bのレーン2~5及び図3Cのレーン2~5にそれぞれ示されるように、RNAガイドの非存在下及び/又はエフェクターの非存在下において、検出可能な切断活性は観察されなかった。さらに、検出可能な切断活性は、図3D及び図3Eにおいて示されるように、非ターゲティングRNAガイドと複合体を形成した配列番号2のエフェクターについて観察されなかった。例えば、標的Aのために設計されたRNAガイドを使用した場合、標的Bスペーサー相補鎖(図3D)又は標的B非スペーサー相補鎖(図3E)について、検出可能な切断は観察されなかった。
ゆえに、本実施例は、配列番号2のエフェクターがヌクレアーゼ活性を有し、標的特異的dsDNA切断を触媒することを示す。
実施例5-配列番号2のエフェクターによる一本鎖DNA切断
本実施例は、配列番号2のエフェクターによる一本鎖DNA(ssDNA)切断について説明する。
図4Aにおいて示されるように標識ssDNA標的を生成するために、メーカーのプロトコールに従って、5’標識キット(Vector Labs)を使用して、IDTのssDNAオリゴを近赤外蛍光色素(IR-800)で標識した。ssDNA標的切断アッセイは、実施例4において記載されるように、反応バッファー(NEBuffer2)において調整した。エフェクターなしの又は非標的ssDNAによるネガティブコントロールもまた、テストした。
RNP複合体は、実施例4の(及び図4Aにおいて示される)標的Aの近赤外蛍光色素標識ssDNA(配列番号201)を追加し、インキュベートする前に、配列番号2のエフェクターを、RNAガイド(配列番号202)と共に、アッセイバッファー中、1:2の比率でインキュベートすることにより、生成した。ネガティブコントロール非標的ssDNA(配列番号204)を、同様に、配列番号2のエフェクター及び配列番号202のRNAガイドを含むRNPと共にインキュベートした。実施例4において記載されるように、反応物を最初にRNaseカクテル及びプロテイナーゼKで処理した。ssDNA切断産物を検出するために、実施例4において記載されるように、反応を、15%TBE-尿素ゲルで分析し、画像処理した。
図4Bのレーン6~9において示されるように、全長のバンドが存在しないことによって証明される、標的特異的ssDNA切断が観察された。図4Cのレーン6~9において示されるように、非標的ssDNAについて有意な切断は観察できない。配列番号2のエフェクターは、テストした最も低いRNP濃度でも完全な切断が観察されるように、ssDNA標的に対する効率的な切断活性を示した(125nM-レーン6、図4B)。レーン2に示されるように、テストした最高のRNP濃度(1μM)でも、非標的ssDNAについて検出可能な切断産物は観察されなかった。
ゆえに、本実施例は、配列番号2のエフェクターがヌクレアーゼ活性を有し、標的特異的ssDNA切断を触媒することを示す。
実施例6-配列番号2のエフェクターによるGFPのインビトロターゲティング
本実施例は、配列番号2のエフェクターの活性を測定するための蛍光枯渇アッセイ(FDA)の使用について記載する。
このアッセイでは、GFPを標的とするように設計された活性なCRISPRシステムが、GFPをコードする二本鎖DNA領域に結合し、切断し、GFP蛍光の枯渇をもたらす。FDAアッセイは、インビトロ転写及び翻訳を含み、これにより、ダイレクトリピート(DR)-スペーサー-ダイレクトリピート(DR)(スペーサーはGFPを標的とする)を有するT7プロモーター下で、CLUST.200916エフェクターをコードするDNA鋳型、及びpre-crRNA配列を含むDNA鋳型から、RNPの産生が可能となる。同じワンポット反応において、GFP及びRFPも、標的及び蛍光レポーターの両方として産生された(図5A)。標的GFPプラスミド配列は、配列番号205において記載され、蛍光レポーターRFPプラスミド配列は、配列番号206において記載される。GFP及びRFP蛍光値は、TECAN Infinite F Plexプレートリーダーを使用して、37℃で12時間、20分ごとに測定した。RFPは標的とされていないため、その蛍光は影響を受けず、したがって、内部シグナルコントロールとして使用された。
配列番号205:
配列番号206:
配列番号2のエフェクターをスクリーニングするために、5つのGFP標的(+1つの非標的)を設計した。FDAアッセイに使用されるRNAガイド配列、標的配列、及び非標的コントロール配列を表10において列挙する。表10において示されるpre-crRNA配列は、インビトロ転写及び翻訳混合物中に存在するヌクレアーゼによってRNAが分解されないようにするため、5’末端のT7プロモーター、及びRNAの3’末端をキャップするヘアピンモチーフをさらに含む。
GFPシグナルをRFPシグナルに対して標準化した後、各時点で3つの技術的複製の平均蛍光を取得した。GFP蛍光枯渇は、非GFPターゲティングRNAガイド(代わりにカナマイシン耐性遺伝子を標的とする)とインキュベートしたエフェクターのGFPシグナルを、GFPターゲティングRNAガイドとインキュベートしたエフェクターのGFPシグナルで割ることによって計算された。結果として得られる値は、図5Bにおいて「枯渇」と呼ばれる。
1又はおよそ1の枯渇は、非GFPターゲティングpre-crRNA及びGFPターゲティングpre-crRNAに関してGFP枯渇に違いがほとんどない~全くないことを示した(例えば、10RFU/10RFU=1)。1を超える枯渇は、非GFPターゲティングpre-crRNA及びGFPターゲティングpre-crRNAに関してGFP枯渇に違いがあることを示した(例えば、10RFU/5RFU=2)。GFPシグナルの枯渇は、エフェクターが機能的なRNPを形成し、GFPコード領域内に二本鎖DNA切断を導入することによってGFPの生成を妨害したことを示した。GFP枯渇の程度は、配列番号2のエフェクターの特異的な活性と大きく相関していた。
図5Bは、各GFP標的について20分ごとに測定される値を使用して、配列番号2のエフェクターによって形成されるRNPについての枯渇曲線を示す。各標的において、配列番号2のエフェクターで形成されたRNPの枯渇値は1を超えるものであった。
これは、配列番号2のエフェクターが、GFPの産生を妨害できる機能的RNPを形成することを示した。
実施例7-配列番号2のエフェクターによる哺乳類遺伝子のターゲティング
本実施例は、一時的なトランスフェクションによって哺乳類細胞に導入した配列番号2のエフェクターによる哺乳類AAVS1標的についてのインデルについての判定を記載する。
配列番号2のエフェクターをpcda3.1骨格(Invitrogen)にクローニングした。プラスミドを、次いで、マキシプレップし、1μg/μLまで希釈した。RNAガイドの調製のために、RNAガイドをコードするdsDNA断片を、標的配列骨格を含有するultramer及びU6プロモーターから得た。Ultramerを、7.5のpHの10mM Tris・HCl中で100μMの最終原液濃度まで再懸濁した。標準原液(working stock)を、続いて、ここでも10mM Tris・HClを使用して10μMまで希釈し、PCR反応の鋳型として取り扱った。RNAガイドの増幅は、以下の構成要素を有する50μL反応液中で行った:0.02μlの上述の鋳型、2.5μlフォワードプライマー、2.5μlリバースプライマー、25μL NEB HiFi Polymerase、及び20μl水。サイクリング条件は、以下の通りとした:1×(98℃で30秒)、30×(98℃で10秒、67℃で15秒)、1×(72℃で2分)。PCR産物は、1.8X SPRI処理によりクリーニングし、25ng/μLに標準化した。テストしたAAVS1標的遺伝子座の配列は、GCGAGTGAAGACGGCATGG(配列番号218)であり、対応するcrRNA配列は、AUAACGACCCUGCGAAGUGGGGUGUAACUUCGACGCGAGUGAAGACGGCAUGG(配列番号219)であった。
トランスフェクションのおよそ16時間前に、DMEM/10%FBS+Pen/Strep中25,000HEK293T細胞の100μlを、96ウェルプレートの各ウェルで平板培養した。トランスフェクションの日に、細胞は、70~90%コンフルエントとした。トランスフェクトする各ウェルについて、0.5μlのLipofectamine2000及び9.5μlのOpti-MEMの混合物を、調製し、次いで、5~20分間、室温でインキュベートした(溶液1)。インキュベーション後、lipofectamine:OptiMEM混合物を、182ngのエフェクタープラスミド及び14ngのcrRNA及び10μL以下の水を含有する別々の混合物に追加した(溶液2)。ネガティブコントロールの場合、crRNAを、溶液2に含めなかった。溶液1及び溶液2の混合物を、上下にピペットすることによって混合し、次いで、25分間、室温でインキュベートした。インキュベーション後に、20μLの溶液1及び溶液2の混合物を、細胞を含有する96ウェルプレートの各ウェルに滴下した。トランスフェクションの72時間後、細胞は、各ウェルの中心に10μLのTrypLEを追加することによって、トリプシン処理し、およそ5分間インキュベートする。100μLのD10培地を、次いで、各ウェルに追加し、細胞を再懸濁するために混合した。細胞を、次いで、10分間、500gで遠心沈殿し、上清を、廃棄した。QuickExtractバッファーを、元々の細胞懸濁液の体積の量の1/5まで追加した。細胞を、15分間65℃、15分間68℃、及び10分間98℃でインキュベートした。
次世代シークエンシングのためのサンプルを、2回のPCRによって調製した。第1回(PCR1)は、標的に依存する特異的なゲノム領域を増幅するために使用した。PCR1産物は、カラム精製によって精製した。2回目のPCR(PCR2)は、Illuminaアダプター及びインデックスを追加するために行った。反応を、次いで、プールし、カラム精製によって精製した。シークエンシングの実行は、150 cycle NextSeq v2.5 mid又はhigh output kitにより行った。
図6は、配列番号2のエフェクターによるトランスフェクション後のHEK293T細胞におけるAAVS1標的遺伝子座におけるインデルパーセントを示す。丸は2つの生物学的反復において測定されたインデルパーセントを反映し、バーは2つの生物学的反復において測定されたインデル平均パーセントを反映する。黒丸は配列番号2のエフェクターによって誘導されたインデルを表し、白丸はネガティブコントロールサンプルにおいて測定されたインデルを表す。配列番号2のエフェクターについて、インデルパーセントはネガティブコントロールのインデルパーセントよりも高かった。
本実施例は、配列番号2のエフェクターが哺乳動物細胞においてヌクレアーゼ活性を有することを示唆する。

Claims (61)

  1. (a)ヌクレアーゼ又は前記ヌクレアーゼをコードする核酸であって、前記ヌクレアーゼは、配列番号1~37及び配列番号221~224のいずれか1つに対して少なくとも80%の同一性を有するアミノ酸配列を含む、核酸;並びに
    (b)RNAガイド又は前記RNAガイドをコードする核酸であって、前記RNAガイドは、ダイレクトリピート配列及びスペーサー配列を含む、核酸
    を含む組成物であって、
    前記ヌクレアーゼは、前記RNAガイドに結合し、前記スペーサー配列は、標的核酸に結合する、組成物。
  2. 前記ヌクレアーゼは、RuvCドメイン又は分断RuvCドメインを含む、請求項1に記載の組成物。
  3. 前記ヌクレアーゼは、触媒残基(例えば、アスパラギン酸又はグルタミン酸)を含む、請求項1又は2に記載の組成物。
  4. 前記ヌクレアーゼが、以下の配列:
    (a)XGX(配列番号233)(式中、XはV又はA又はCであり、XはY又はFであり、XはK又はQであり、XはY又はFであり、XはL又はA又はM又はC又はTであり、XはI又はV又はLである);
    (b)LXNXLV(配列番号234)(式中、XはW又はK又はRであり、XはN又はT又はK又はS又はD又はQである);
    (c)FDXG(配列番号235)(式中、XはG又はYであり、XはT又はS又はMである);
    (d)XHRXP(配列番号236)(式中、XはI又はL又はVであり、XはY又はL又はM又はFであり、XはP又はH又はD又はEであり、XはL又はI又はV又はMである);
    (e)GXDXGXR(配列番号237)(式中、XはI又はL又はVであり、XはI又はV又はLであり、XはF又はYである);
    (f)RXYR(配列番号238)(式中、XはK又はQ又はEであり、XはH又はD又はEであり、XはF又はV又はL又はIである);及び
    (g)XDXDXNAAXN(配列番号239)(式中、XはH又はYであり、XはR又はQ又はVであり、XはE又はT又はI又はH又はK又はQ又はDであり、XはN又はR又はI又はV又はKである)
    の一つ以上を含む、請求項1~3のいずれか一項に記載の組成物。
  5. 前記ヌクレアーゼが、配列番号1~37及び配列番号221~224のいずれか1つに対して少なくとも95%の同一性を有するアミノ酸配列を含む、請求項1~4のいずれか一項に記載の組成物。
  6. 前記ヌクレアーゼが、配列番号1~37及び配列番号221~224のいずれか1つにおいて記載されるアミノ酸配列を含む、請求項1~5のいずれか一項に記載の組成物。
  7. 前記組成物が、tracrRNAを含まない、請求項1~6のいずれか一項に記載の組成物。
  8. 前記ダイレクトリピート配列が、以下の配列:
    (a)XCCCTX(配列番号240)(式中、XはG又はAであり、XはA又はCであり、XはG又はAである);及び
    (b)XGGGXA(配列番号241)(式中、XはT又はGであり、XはT又はGであり、XはT又はGであり、XはA又はGであり、XはT又はAであり、XはA又はG又はCである)
    の一つ以上を含む、請求項1~7のいずれか一項に記載の組成物。
  9. 前記ダイレクトリピート配列が、配列番号38~126のいずれか1つに対して少なくとも95%の配列同一性を有するヌクレオチド配列を含む、請求項1~8のいずれか一項に記載の組成物。
  10. 前記ダイレクトリピート配列は、配列番号38~126のいずれか1つにおいて記載されるヌクレオチド配列を含む、請求項1~9のいずれか一項に記載の組成物。
  11. 前記スペーサー配列は、長さが15~24の間のヌクレオチドを含む、請求項1~10のいずれか一項に記載の組成物。
  12. 前記標的核酸は、前記スペーサー配列中のヌクレオチド配列に対して相補的な配列を含む、請求項1~11のいずれか一項に記載の組成物。
  13. 前記標的核酸が、プロトスペーサー隣接モチーフ(PAM)配列に隣接しており、前記PAM配列が、5’-CN-3’、5’-CCN-3’、5’-NCN-3’、5’-NCCN-3’、又は5’-NNCN-3’として記載されるヌクレオチド配列を含み、式中、「N」は任意の核酸塩基である、請求項1~12のいずれか一項に記載の組成物。
  14. 前記PAM配列が、5’-ACCN-3’、5’-DCCN-3’、5’-DTTN-3’、5’-DYYN-3’、5’-GCCN-3’、5’-GTTN-3’、5’-GYYN-3’、5’-HCN-3’、5’-HNCN-3’、5’-HNCR-3’、5’-HNCV-3’、5’-RCCN-3’、5’-RCCR-3’、5’-RYCN-3’、5’-TNCN-3’として記載されるヌクレオチド配列を含み、式中、「D」はA又はG又はTであり、「H」はA又はC又はTであり、「N」は任意の核酸塩基であり、「R」はA又はGであり、「V」はA又はC又はGであり、「Y」はC又はTである、請求項13に記載の組成物。
  15. 前記PAM配列が、5’-CCA-3’、5’-CCC-3’、5’-CCT-3’、5’-CCG-3’、5’-ACCG-3’、5’-CCCA-3’、5’-CCCG-3’、5’-TCCA-3’、又は5’-TCCT-3’として記載されるヌクレオチド配列を含む、請求項13に記載の組成物。
  16. 前記ヌクレアーゼは、前記標的核酸を切断する、請求項1~15のいずれか一項に記載の組成物。
  17. 前記標的核酸は、一本鎖DNA又は二本鎖DNAである、請求項1~16のいずれか一項に記載の組成物。
  18. 前記組成物は、基準組成物よりも少なくとも10%大きな酵素活性、例えば、基準組成物のヌクレアーゼ活性よりも少なくとも10%大きなヌクレアーゼ活性を含む、請求項1~17のいずれか一項に記載の組成物。
  19. 前記ヌクレアーゼが、ペプチドタグ、蛍光タンパク質、塩基編集ドメイン、DNAメチル化ドメイン、ヒストン残基修飾ドメイン、局在化因子、転写修飾因子、光作動性制御因子、化学的誘導性因子、又はクロマチン可視化因子をさらに含む、請求項1~18のいずれか一項に記載の組成物。
  20. 前記ヌクレアーゼをコードする前記核酸が、細胞における発現のためにコドン最適化される、請求項1~19のいずれか一項に記載の組成物。
  21. 前記ヌクレアーゼをコードする前記核酸が、プロモーターに作動可能に連結される、請求項1~20のいずれか一項に記載の組成物。
  22. 前記ヌクレアーゼをコードする前記核酸が、ベクター中にある、請求項1~21のいずれか一項に記載の組成物。
  23. 前記ベクターが、レトロウイルスベクター、レンチウイルスベクター、ファージベクター、アデノウイルスベクター、アデノ随伴ベクター、又は単純ヘルペスベクターを含む、請求項22に記載の組成物。
  24. 前記組成物が、ナノ粒子、リポソーム、エキソソーム、微小胞、又は遺伝子銃を含む送達媒体中に存在する、請求項1~23のいずれか一項に記載の組成物。
  25. 請求項1~24のいずれか一項に記載の組成物を含む、細胞。
  26. 前記細胞が、真核細胞又は原核細胞である、請求項25に記載の細胞。
  27. 前記細胞が、哺乳類細胞又は植物細胞である、請求項25に記載の細胞。
  28. 前記細胞が、ヒト細胞である、請求項25に記載の細胞。
  29. 請求項1~28のいずれか一項に記載の組成物を細胞中の前記標的核酸に結合させるための方法であって、
    (a)前記組成物を提供すること;及び
    (b)前記組成物を前記細胞に送達すること
    を含み、前記細胞が、前記標的核酸を含み、前記ヌクレアーゼが、前記RNAガイドに結合し、前記スペーサー配列が、前記標的核酸に結合する、方法。
  30. (a)ヌクレアーゼ又は前記ヌクレアーゼをコードする核酸であって、前記ヌクレアーゼが、配列番号2と少なくとも80%の同一性を有するアミノ酸配列を含む、核酸;及び
    (b)RNAガイド又は前記RNAガイドをコードする核酸であって、前記RNAガイドが、ダイレクトリピート配列及びスペーサー配列を含む、核酸
    を含む組成物であって、前記ヌクレアーゼが、前記RNAガイドに結合し、前記スペーサー配列が、標的核酸に結合する、組成物。
  31. 前記ヌクレアーゼが、RuvCドメイン又は分断RuvCドメインを含む、請求項30に記載の組成物。
  32. 前記ヌクレアーゼが、触媒残基(例えば、アスパラギン酸又はグルタミン酸)を含む、請求項30又は31に記載の組成物。
  33. 前記ヌクレアーゼが、以下の配列:
    (a)XGX(配列番号233)(式中、XはV又はA又はCであり、XはY又はFであり、XはK又はQであり、XはY又はFであり、XはL又はA又はM又はC又はTであり、XはI又はV又はLである);
    (b)LXNXLV(配列番号234)(式中、XはW又はK又はRであり、XはN又はT又はK又はS又はD又はQである);
    (c)FDXG(配列番号235)(式中、XはG又はYであり、XはT又はS又はMである);
    (d)XHRXP(配列番号236)(式中、XはI又はL又はVであり、XはY又はL又はM又はFであり、XはP又はH又はD又はEであり、XはL又はI又はV又はMである);
    (e)GXDXGXR(配列番号237)(式中、XはI又はL又はVであり、XはI又はV又はLであり、XはF又はYである);
    (f)RXYR(配列番号238)(式中、XはK又はQ又はEであり、XはH又はD又はEであり、XはF又はV又はL又はIである);及び
    (g)XDXDXNAAXN(配列番号239)(式中、XはH又はYであり、XはR又はQ又はVであり、XはE又はT又はI又はH又はK又はQ又はDであり、XはN又はR又はI又はV又はKである)
    の一つ以上を含む、請求項30~32のいずれか一項に記載の組成物。
  34. 前記ヌクレアーゼが、配列番号2に対して少なくとも95%の同一性を有するアミノ酸配列を含む、請求項30~33のいずれか一項に記載の組成物。
  35. 前記ヌクレアーゼが、配列番号2において記載される前記アミノ酸配列を含む、請求項30~34のいずれか一項に記載の組成物。
  36. 前記組成物が、tracrRNAを含まない、請求項30~35のいずれか一項に記載の組成物。
  37. 前記ダイレクトリピート配列が、以下の配列:
    (a)XCCCTX(配列番号240)(式中、XはG又はAであり、XはA又はCであり、XはG又はAである);及び
    (b)XGGGXA(配列番号241)(式中、XはT又はGであり、XはT又はGであり、XはT又はGであり、XはA又はGであり、XはT又はAであり、XはA又はG又はCである)
    の一つ以上を含む、請求項30~36のいずれか一項に記載の組成物。
  38. 前記ダイレクトリピート配列が、配列番号40又は配列番号41に対して少なくとも95%の配列同一性を有するヌクレオチド配列を含む、請求項30~37のいずれか一項に記載の組成物。
  39. 前記ダイレクトリピート配列が、配列番号40又は配列番号41において記載されるヌクレオチド配列を含む、請求項30~38のいずれか一項に記載の組成物。
  40. 前記ダイレクトリピート配列が、配列番号111に対して少なくとも95%の配列同一性を有するヌクレオチド配列を含む、請求項30~37のいずれか一項に記載の組成物。
  41. 前記ダイレクトリピート配列が、配列番号111において記載される前記ヌクレオチド配列を含む、請求項30~37又は40のいずれか一項に記載の組成物。
  42. 前記スペーサー配列が、長さが15~24の間のヌクレオチドを含む、請求項30~41のいずれか一項に記載の組成物。
  43. 前記スペーサー配列が、長さが約19又は20のヌクレオチドを含む、請求項30~42のいずれか一項に記載の組成物。
  44. 前記標的核酸が、前記スペーサー配列中のヌクレオチド配列に対して相補的な配列を含む、請求項30~43のいずれか一項に記載の組成物。
  45. 前記標的核酸が、PAM配列に隣接しており、前記PAM配列が、5’-CN-3’、5’-CCN-3’、5’-NCN-3’、5’-NCCN-3’、又は5’-NNCN-3’として記載されるヌクレオチド配列を含み、式中、「N」は任意の核酸塩基である、請求項30~44のいずれか一項に記載の組成物。
  46. 前記PAM配列が、5’-ACCN-3’、5’-DCCN-3’、5’-DTTN-3’、5’-DYYN-3’、5’-GCCN-3’、5’-GTTN-3’、5’-GYYN-3’、5’-HCN-3’、5’-HNCN-3’、5’-HNCR-3’、5’-HNCV-3’、5’-RCCN-3’、5’-RCCR-3’、5’-RYCN-3’、5’-TNCN-3’として記載されるヌクレオチド配列を含み、式中、「D」はA又はG又はTであり、「H」はA又はC又はTであり、「N」は任意の核酸塩基であり、「R」はA又はGであり、「V」はA又はC又はGであり、「Y」はC又はTである、請求項45に記載の組成物。
  47. 前記PAM配列が、5’-CCA-3’、5’-CCC-3’、5’-CCT-3’、5’-CCG-3’、5’-ACCG-3’、5’-CCCA-3’、5’-CCCG-3’、5’-TCCA-3’、又は5’-TCCT-3’として記載されるヌクレオチド配列を含む、請求項45に記載の組成物。
  48. 前記ヌクレアーゼが、前記標的核酸を切断する、請求項30~47のいずれか一項に記載の組成物。
  49. 前記標的核酸が、一本鎖DNA又は二本鎖DNAである、請求項30~48のいずれか一項に記載の組成物。
  50. 前記組成物が、基準組成物よりも少なくとも10%大きな酵素活性、例えば、基準組成物のヌクレアーゼ活性よりも少なくとも10%大きなヌクレアーゼ活性を含む、請求項30~49のいずれか一項に記載の組成物。
  51. 前記ヌクレアーゼが、ペプチドタグ、蛍光タンパク質、塩基編集ドメイン、DNAメチル化ドメイン、ヒストン残基修飾ドメイン、局在化因子、転写修飾因子、光作動性制御因子、化学的誘導性因子、又はクロマチン可視化因子をさらに含む、請求項30~50のいずれか一項に記載の組成物。
  52. 前記ヌクレアーゼをコードする前記核酸は、細胞における発現のためにコドン最適化される、請求項30~51のいずれか一項に記載の組成物。
  53. 前記ヌクレアーゼをコードする前記核酸は、プロモーターに作動可能に連結される、請求項30~52のいずれか一項に記載の組成物。
  54. 前記ヌクレアーゼをコードする前記核酸は、ベクター中にある、請求項30~53のいずれか一項に記載の組成物。
  55. 前記ベクターは、レトロウイルスベクター、レンチウイルスベクター、ファージベクター、アデノウイルスベクター、アデノ随伴ベクター、又は単純ヘルペスベクターを含む、請求項54に記載の組成物。
  56. 前記組成物は、ナノ粒子、リポソーム、エキソソーム、微小胞、又は遺伝子銃を含む送達媒体中に存在する、請求項30~55のいずれか一項に記載の組成物。
  57. 請求項30~56のいずれか一項に記載の組成物を含む細胞。
  58. 前記細胞が、真核細胞又は原核細胞である、請求項57に記載の細胞。
  59. 前記細胞が、哺乳類細胞又は植物細胞である、請求項57に記載の細胞。
  60. 前記細胞が、ヒト細胞である、請求項57に記載の細胞。
  61. 請求項30~60のいずれか一項に記載の組成物を細胞中の前記標的核酸に結合させるための方法であって、
    (a)前記組成物を提供すること;及び
    (b)前記組成物を前記細胞に送達すること
    を含み、前記細胞が、前記標的核酸を含み、前記ヌクレアーゼが、前記RNAガイドに結合し、前記スペーサー配列が、前記標的核酸に結合する、方法。
JP2023511933A 2020-08-17 2021-08-17 ヌクレアーゼを含む組成物及びその使用 Pending JP2023539569A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063066669P 2020-08-17 2020-08-17
US63/066,669 2020-08-17
PCT/US2021/046360 WO2022040224A1 (en) 2020-08-17 2021-08-17 Compositions comprising a nuclease and uses thereof

Publications (1)

Publication Number Publication Date
JP2023539569A true JP2023539569A (ja) 2023-09-15

Family

ID=80323121

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023511933A Pending JP2023539569A (ja) 2020-08-17 2021-08-17 ヌクレアーゼを含む組成物及びその使用

Country Status (6)

Country Link
US (1) US20240011031A1 (ja)
EP (1) EP4196576A1 (ja)
JP (1) JP2023539569A (ja)
AU (1) AU2021329314A1 (ja)
CA (1) CA3189662A1 (ja)
WO (1) WO2022040224A1 (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109415756B (zh) * 2016-04-28 2022-08-09 延世大学校产学协力团 用于以高通量方式体内评估rna引导的核酸酶的活性的方法
WO2018035250A1 (en) * 2016-08-17 2018-02-22 The Broad Institute, Inc. Methods for identifying class 2 crispr-cas systems
WO2020018142A1 (en) * 2018-07-16 2020-01-23 Arbor Biotechnologies, Inc. Novel crispr dna targeting enzymes and systems
WO2020180699A1 (en) * 2019-03-01 2020-09-10 Arbor Biotechnologies, Inc. Novel crispr dna targeting enzymes and systems

Also Published As

Publication number Publication date
CA3189662A1 (en) 2022-02-24
EP4196576A1 (en) 2023-06-21
US20240011031A1 (en) 2024-01-11
WO2022040224A1 (en) 2022-02-24
AU2021329314A1 (en) 2023-03-16

Similar Documents

Publication Publication Date Title
CN115698278A (zh) 包含Cas12i2变体多肽的组合物及其用途
US20240093228A1 (en) Compositions comprising a nuclease and uses thereof
KR20240052763A (ko) 스타스민 2 (stmn2)를 표적화하는 rna 가이드를 포함하는 유전자 편집 시스템 및 이의 용도
US20230045187A1 (en) Compositions comprising a nuclease and uses thereof
US20240011004A1 (en) Compositions comprising a variant crispr nuclease polypeptide and uses thereof
US20240035010A1 (en) Compositions comprising a variant polypeptide and uses thereof
US11866746B2 (en) Compositions comprising a variant Cas12i4 polypeptide and uses thereof
US11946045B2 (en) Compositions comprising a variant polypeptide and uses thereof
US20230059141A1 (en) Gene editing systems comprising a nuclease and uses thereof
WO2023086938A2 (en) Type v nucleases
JP2024531607A (ja) Crisprヌクレアーゼを含む組成物及びその使用
US20240011031A1 (en) Compositions comprising a nuclease and uses thereof
JP2023549084A (ja) Pdcd1を標的とするrnaガイドを含む組成物及びその使用
US20240301446A1 (en) Cas12i2 fusion molecules and uses thereof
US20230193243A1 (en) Compositions comprising a cas12i2 polypeptide and uses thereof
WO2023086973A1 (en) Type ii nucleases
WO2023086965A2 (en) Type vii nucleases
JP2023548386A (ja) B2mを標的とするrnaガイドを含む組成物及びその使用
JP2023548588A (ja) Tracを標的とするrnaガイドを含む組成物及びその使用
WO2023019243A1 (en) Compositions comprising a variant cas12i3 polypeptide and uses thereof
CN118019846A (zh) 包含crispr核酸酶的组合物及其用途
CN117136233A (zh) 包含变体Cas12i4多肽的组合物及其用途