JP2022538789A - 新規crispr dnaターゲティング酵素及びシステム - Google Patents

新規crispr dnaターゲティング酵素及びシステム Download PDF

Info

Publication number
JP2022538789A
JP2022538789A JP2021573843A JP2021573843A JP2022538789A JP 2022538789 A JP2022538789 A JP 2022538789A JP 2021573843 A JP2021573843 A JP 2021573843A JP 2021573843 A JP2021573843 A JP 2021573843A JP 2022538789 A JP2022538789 A JP 2022538789A
Authority
JP
Japan
Prior art keywords
crispr
nucleic acid
rna
sequence
target nucleic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021573843A
Other languages
English (en)
Other versions
JPWO2020252378A5 (ja
Inventor
デイビッド エー. スコット,
デイビッド アール. チェン,
ウィンストン エックス. ヤン,
Original Assignee
アーバー バイオテクノロジーズ, インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アーバー バイオテクノロジーズ, インコーポレイテッド filed Critical アーバー バイオテクノロジーズ, インコーポレイテッド
Publication of JP2022538789A publication Critical patent/JP2022538789A/ja
Publication of JPWO2020252378A5 publication Critical patent/JPWO2020252378A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • C40B40/08Libraries containing RNA or DNA which encodes proteins, e.g. gene libraries

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本開示は、標的化した形で核酸を操作するための新規システム、方法、及び組成物について記載する。本開示は、DNAなどの核酸を標的化して修飾するための、天然に存在しないエンジニアリングされたCRISPRシステム、成分、及び方法について記載する。各システムが、一体となって核酸を標的化する1つ以上のタンパク質成分と1つ以上の核酸成分とを含む。本開示は、新規シングルエフェクタークラス2 CRISPR-Casシステムの天然に存在しないエンジニアリングされたシステム及び組成物を、ゲノムデータベースからの計算的同定、天然遺伝子座からエンジニアリングされたシステムへの開発、並びに実験的検証及び適用移行の方法と共に提供する。

Description

関連出願
本願は、2019年6月14日に出願された米国仮特許出願第62/861,582号、2019年7月9日に出願された米国仮特許出願第62/872,157号、2019年7月12日に出願された米国仮特許出願第62/873,606号、及び2019年7月12日に出願された米国仮特許出願第62/873,602号の優先権の利益を主張し、これらの各々の全内容は、本明細書によって参照により援用される。
配列表
本出願は、ASCII形式で電子的に提出され、全体として参照により本明細書で援用される配列表を含む。2020年6月12日に作成された前記ASCIIコピーは、A2186-7021WO_SL.txtというファイル名で、サイズは901,689バイトである。
本開示は、クラスター化して規則的な配置の短い回文配列リピート(Clustered Regularly Interspaced Short Palindromic Repeats:CRISPR)及びその成分に関連するベクターシステムを使用するものである、配列ターゲティング及び核酸編集を伴う遺伝子発現制御に用いられるシステム、方法、及び組成物に関する。
近年、ゲノムシーケンシング技術及び解析の進歩が適用されることにより、原核生物の生合成経路からヒト病理に及ぶまでの多種多様な自然領域における生物学的活性の遺伝的基礎に関して重要な洞察が得られている。遺伝子シーケンシング技術が生み出す大量の情報を完全に理解し、評価するためには、対応したゲノム及びエピゲノム操作技術の規模、有効性、及び容易さの向上が必要となる。このような新規ゲノム及びエピゲノムエンジニアリング技術は、バイオテクノロジー、農業、及びヒト治療薬を含めた数多くの領域における新規適用の開発を加速させることになる。
クラスター化して規則的な配置の短い回文配列リピート(Clustered Regularly Interspaced Short Palindromic Repeats:CRISPR)及びCRISPR関連(Cas)遺伝子は、まとめてCRISPR-Cas又はCRISPR/Casシステムとして知られ、現在のところ、細菌及び古細菌にファージ感染に対する免疫を付与するものと理解されている。原核生物適応免疫のCRISPR-Casシステムは極めて多様な一群のタンパク質エフェクター、非コードエレメント、並びに遺伝子座構成であり、その幾つかの例がエンジニアリングされ、適合されることにより、重要なバイオテクノロジーが生み出されている。
宿主防御に関与するこのシステムの成分には、DNA又はRNAを修飾する能力を有する1つ以上のエフェクタータンパク質と、これらのタンパク質活性をファージDNA又はRNA上の特異的配列に標的化することを担うRNAガイドエレメントとが含まれる。RNAガイドはCRISPR RNA(crRNA)で構成され、1つ又は複数のエフェクタータンパク質による標的核酸の操作を実現するために追加的なトランス活性化型RNA(tracrRNA)を必要とすることもある。crRNAは、crRNAへのタンパク質結合を担うダイレクトリピートと、所望の核酸標的配列に相補的なスペーサー配列とからなる。CRISPRシステムは、crRNAのスペーサー配列を修飾することにより、別のDNA又はRNA標的を標的化するよう再プログラム化し得る。
CRISPR-Casシステムは、大きく2つのクラスに分けることができる:クラス1システムは、一緒になってcrRNAの周りに複合体を形成する複数のエフェクタータンパク質で構成され、クラス2システムは、crRNAと複合体化してDNA又はRNA基質を標的化する単一のエフェクタータンパク質からなる。クラス2システムのシングルサブユニットのエフェクター組成は、エンジニアリング及び適用移行に一層簡便な成分セットを提供し、従ってこれまでプログラム可能なエフェクターの重要な供給源となっている。従って、新規クラス2システムの発見、エンジニアリング、及び最適化が、ゲノムエンジニアリング及びその他に向けた広範且つ強力なプログラム可能技術につながり得る。
本願中のいかなる文献の引用又は識別情報も、かかる文献が本発明の先行技術として利用可能であることを認めるものではない。
CRISPR-Casシステムは、古細菌及び細菌において外来性の遺伝エレメントから種を防御する適応免疫系である。CRISPR-Cas9によって例示されるクラス2 CRISPR-Casシステムの特徴付け及びエンジニアリングにより、ゲノム編集及びその他における多様な一連のバイオテクノロジー適用への道が開かれてきた。それにも関わらず、核酸及びポリヌクレオチド(即ち、DNA、RNA、又は任意のハイブリッド、誘導体、又は修飾体)を修飾するための、その独自の特性によって新規適用を実現する現在のCRISPR-Casシステムを越える更なるプログラム可能なエフェクター及びシステムが依然として必要とされている。
本開示は、新規シングルエフェクタークラス2 CRISPR-Casシステムの天然に存在しないエンジニアリングされたシステム及び組成物を、ゲノムデータベースからの計算的同定、天然遺伝子座からエンジニアリングされたシステムへの開発、並びに実験的検証及び適用移行の方法と共に提供する。この新規エフェクターは既存のクラス2 CRISPRエフェクターのオルソログ及びホモログと配列が異なり、またユニークなドメイン構成も有する。これは、限定はされないが、1)新規DNA/RNA編集特性及び制御機構、2)送達戦略におけるより高い汎用性に比したより小さいサイズ、3)遺伝子型によって惹起される細胞死などの細胞過程、及び4)プログラム可能なRNA誘導型DNA挿入、切出し、及び動員を含めた更なる特徴を提供する。
本明細書に記載される新規DNAターゲティングシステムがゲノム及びエピゲノム操作技法のツールボックスに加わることにより、特異的でプログラムされた摂動への幅広い適用が実現する。
本開示は、非天然環境、例えばそのシステムが当初発見された細菌以外の細菌で使用することのできる最小のシステムを作り出すために使用される新規に発見された酵素及び他の成分を含む新規CRISPR-Casシステムに関する。
一態様において、本開示は、ダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイド、又はRNAガイドをコードする核酸;及びCRISPR関連タンパク質又はCRISPR関連タンパク質をコードする核酸を含む、CLUST.121143のエンジニアリングされた天然に存在しないクラスター化して規則的な配置の短い回文配列リピート(CRISPR)-Casシステムを提供し、ここで、CRISPR関連タンパク質は、表2に提供されるアミノ酸配列(例えば、配列番号1~17)と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み;CRISPR関連タンパク質はRNAガイドに結合し、スペーサー配列に相補的な標的核酸配列を標的化することができる。一部の実施形態において、CRISPR関連タンパク質は、少なくとも1つ(例えば、1つ、2つ、又は3つ)のRuvCドメインを有する。
本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質は、CLUST.121143 3300014839エフェクタータンパク質である。一部の実施形態において、CRISPR関連タンパク質はプロトスペーサー隣接モチーフ(PAM)の認識能を有し、標的核酸は、核酸配列5’-TTG-3’を含むPAMを含む。
本明細書に記載されるシステムのいずれかの一部の実施形態において、ダイレクトリピート配列は、表3に提供されるヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。本明細書に記載されるシステムのいずれかの一部の実施形態において、ダイレクトリピート配列は、表3に提供されるヌクレオチド配列を含む。本明細書に記載されるシステムのいずれかの一部の実施形態において、RNAガイドのスペーサー配列は約22~約40ヌクレオチド(例えば、26~35ヌクレオチド)を含む。
本明細書に提供されるシステムのいずれかの特定の実施形態において、標的核酸はDNAである。本明細書に記載されるシステムのいずれかの一部の実施形態において、標的核酸はプロトスペーサー隣接モチーフ(PAM)を含む。
本明細書に提供されるシステムのいずれかの特定の実施形態において、CRISPR関連タンパク質及びRNAガイドによる標的核酸のターゲティングにより、標的核酸に修飾(例えば、一本鎖又は二本鎖切断イベント)が生じる。一部の実施形態において、修飾により欠失イベントが生じる。一部の実施形態において、修飾により挿入イベントが生じる。一部の実施形態において、修飾により細胞毒性が生じる。
一部の実施形態において、CRISPR関連タンパク質は非特異的な(即ち、「コラテラルな」)ヌクレアーゼ(例えば、DNAse又はDNAse)活性を有する。本明細書に提供されるシステムのいずれかの特定の実施形態において、本システムはドナー鋳型核酸(例えば、DNA又はRNA)を更に含む。
一部の実施形態において、本明細書に提供されるシステムのいずれかの細胞(例えば、真核細胞(例えば哺乳類細胞)又は原核細胞(例えば細菌細胞))内にある。
本明細書に提供されるシステムのいずれかの一部の実施形態において、RNAガイドは、tracrRNA、モジュレーターRNA、又はその両方を含む。本明細書に提供されるシステムのいずれかの一部の実施形態において、システムはtracrRNAを含む。本明細書に提供されるシステムのいずれかの一部の実施形態において、システムはモジュレーターRNAを含む。本明細書に提供されるシステムのいずれかの一部の実施形態において、システムはtracrRNAを含まない。
本明細書に提供されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質は、分割されたRuvCドメインを含む。一部の実施形態において、CRISPR関連タンパク質は触媒残基(例えば、アスパラギン酸又はグルタミン酸)を含む。一部の実施形態において、CRISPR関連タンパク質は標的核酸を切断する。一部の実施形態において、CRISPR関連タンパク質は、ペプチドタグ、蛍光タンパク質、塩基編集ドメイン、DNAメチル化ドメイン、ヒストン残基修飾ドメイン、局在化因子、転写修飾因子、光ゲート制御因子、化学誘導性因子、又はクロマチン可視化因子を更に含む。一部の実施形態において、CRISPR関連タンパク質をコードする核酸は、細胞での発現にコドン最適化される。一部の実施形態において、CRISPR関連タンパク質をコードする核酸は、プロモーターに作動可能に連結されている。一部の実施形態において、CRISPR関連タンパク質をコードする核酸は、ベクター内にある。一部の実施形態において、ベクターは、レトロウイルスベクター、レンチウイルスベクター、ファージベクター、アデノウイルスベクター、アデノ随伴ベクター、又は単純ヘルペスベクターを含む。一部の実施形態において、システムは、ナノ粒子、リポソーム、エキソソーム、微小胞、又は遺伝子銃を含む送達組成物中に存在する。
別の態様において、本開示は、本明細書に記載されるシステムを細胞内の標的核酸に結合する方法を提供し、この方法は、(a)システムを提供すること;及び(b)システムを細胞に送達することを含み、ここで、細胞は標的核酸を含み、CRISPR関連タンパク質はRNAガイドに結合し、スペーサー配列は標的核酸に結合する。
別の態様において、本開示は、本明細書に記載されるシステムのいずれかを標的核酸に接触させることを含む、標的核酸のターゲティング及び編集方法を提供する。別の態様において、本開示は、本明細書に記載されるシステムのいずれかを標的核酸に接触させることを含む、標的核酸の編集方法を提供する。
一態様において、本開示は、ダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイド、又はRNAガイドをコードする核酸;及びCRISPR関連タンパク質又はCRISPR関連タンパク質をコードする核酸を含む、CLUST.196682のエンジニアリングされた天然に存在しないクラスター化して規則的な配置の短い回文配列リピート(CRISPR)-Casシステムを提供し、ここで、CRISPR関連タンパク質は、表8に提供されるアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み;CRISPR関連タンパク質はRNAガイドに結合し、スペーサー配列に相補的な標的核酸配列を標的化することができる。
本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質は、少なくとも1つ(例えば、1つ、2つ、又は3つ)のRuvCドメインを含む。
本明細書に記載されるシステムのいずれかの一部の実施形態において、ダイレクトリピート配列は、表9に提供されるヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。本明細書に記載されるシステムのいずれかの一部の実施形態において、ダイレクトリピート配列は、表9に提供されるヌクレオチド配列を含む。
本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質は、CLUST.196682 3300025638エフェクタータンパク質である。本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質はプロトスペーサー隣接モチーフ(PAM)の認識能を有し、及び標的核酸は、核酸配列5’-CG-3’を含むPAMを含む。
本明細書に記載されるシステムのいずれかの一部の実施形態において、RNAガイドのスペーサー配列は約17ヌクレオチド~約44ヌクレオチドを含む。本明細書に記載されるシステムのいずれかの一部の実施形態において、RNAガイドのスペーサー配列は26~38ヌクレオチドを含む。
本明細書に記載されるシステムのいずれかの一部の実施形態において、標的核酸はDNAである。本明細書に記載されるシステムのいずれかの一部の実施形態において、標的核酸はPAMを含む。本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質は、非特異的ヌクレアーゼ活性を有する。
本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質及びRNAガイドによる標的核酸のターゲティングにより、標的核酸に修飾が生じる。本明細書に記載されるシステムのいずれかの一部の実施形態において、標的核酸の修飾は、二本鎖切断イベント又は一本鎖切断イベントである。本明細書に記載されるシステムのいずれかの一部の実施形態において、標的核酸の修飾により、挿入イベント又は欠失イベントが生じる。本明細書に記載されるシステムのいずれかの一部の実施形態において、改変により細胞毒性又は細胞死が生じる。
本明細書に記載されるシステムのいずれかの一部の実施形態において、システムはドナー鋳型核酸を更に含む。本明細書に記載されるシステムのいずれかの一部の実施形態において、ドナー鋳型核酸はDNA又はRNAである。
本明細書に記載されるシステムのいずれかの一部の実施形態において、RNAガイドは、tracrRNA、モジュレーターRNA、又はその両方を含む。本明細書に記載されるシステムのいずれかの一部の実施形態において、システムはtracrRNA及び/又はモジュレーターRNAを更に含む。本明細書に提供されるシステムのいずれかの一部の実施形態において、システムはtracrRNAを含まない。
本明細書に記載されるシステムのいずれかの一部の実施形態において、システムは細胞内にある。本明細書に記載されるシステムのいずれかの一部の実施形態において、システムは、真核細胞又は原核細胞内にある。
本明細書に提供されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質は、分割されたRuvCドメインを含む。一部の実施形態において、CRISPR関連タンパク質は触媒残基(例えば、アスパラギン酸又はグルタミン酸)を含む。一部の実施形態において、CRISPR関連タンパク質は標的核酸を切断する。一部の実施形態において、CRISPR関連タンパク質は、ペプチドタグ、蛍光タンパク質、塩基編集ドメイン、DNAメチル化ドメイン、ヒストン残基修飾ドメイン、局在化因子、転写修飾因子、光ゲート制御因子、化学誘導性因子、又はクロマチン可視化因子を更に含む。一部の実施形態において、CRISPR関連タンパク質をコードする核酸は、細胞での発現にコドン最適化される。一部の実施形態において、CRISPR関連タンパク質をコードする核酸は、プロモーターに作動可能に連結されている。一部の実施形態において、CRISPR関連タンパク質をコードする核酸は、ベクター内にある。一部の実施形態において、ベクターは、レトロウイルスベクター、レンチウイルスベクター、ファージベクター、アデノウイルスベクター、アデノ随伴ベクター、又は単純ヘルペスベクターを含む。一部の実施形態において、システムは、ナノ粒子、リポソーム、エキソソーム、微小胞、又は遺伝子銃を含む送達組成物中に存在する。
別の態様において、本開示は、本明細書に記載されるシステムを細胞内の標的核酸に結合する方法を提供し、この方法は、(a)システムを提供すること;及び(b)システムを細胞に送達することを含み、ここで、細胞は標的核酸を含み、CRISPR関連タンパク質はRNAガイドに結合し、スペーサー配列は標的核酸に結合する。
一態様において、本開示は、標的核酸のターゲティング及び編集方法であって、本明細書に記載されるシステムのいずれかを標的核酸に接触させることを含む、方法を提供する。一態様において、本開示は、標的核酸の編集方法であって、本明細書に記載されるシステムのいずれかを標的核酸に接触させることを含む、方法を提供する。
一態様において、本開示は、標的核酸のある部位におけるペイロード核酸の挿入を標的化する方法であって、本明細書に記載されるシステムを標的核酸に接触させることを含む、方法を提供する。
一態様において、本開示は、ダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイド、又はRNAガイドをコードする核酸;及びCRISPR関連タンパク質又はCRISPR関連タンパク質をコードする核酸を含む、CLUST.089537のエンジニアリングされた天然に存在しないクラスター化して規則的な配置の短い回文配列リピート(CRISPR)-Casシステムを提供し、ここで、CRISPR関連タンパク質は、表12に提供されるアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み;CRISPR関連タンパク質はRNAガイドに結合し、スペーサー配列に相補的な標的核酸配列を標的化することができる。
CLUST.089537及びCLUST.085589は同義的に使用できる。
本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質は、少なくとも1つ(例えば、1つ、2つ、又は3つ)のRuvCドメインを含む。
本明細書に記載されるシステムのいずれかの一部の実施形態において、ダイレクトリピート配列は、表13に提供されるヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。本明細書に記載されるシステムのいずれかの一部の実施形態において、ダイレクトリピート配列は、表13に提供されるヌクレオチド配列を含む。
本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質は、CLUST.089537 CAAACX010000652エフェクタータンパク質である。本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質はプロトスペーサー隣接モチーフ(PAM)の認識能を有し、及び標的核酸は、核酸配列5’-TTC-3’を含むPAMを含む。
本明細書に記載されるシステムのいずれかの一部の実施形態において、RNAガイドのスペーサー配列は約20ヌクレオチド~約40ヌクレオチドを含む。本明細書に記載されるシステムのいずれかの一部の実施形態において、RNAガイドのスペーサー配列は25~37ヌクレオチドを含む。
本明細書に記載されるシステムのいずれかの一部の実施形態において、標的核酸はDNAである。本明細書に記載されるシステムのいずれかの一部の実施形態において、標的核酸はPAMを含む。本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質は、非特異的ヌクレアーゼ活性を有する。
本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質及びRNAガイドによる標的核酸のターゲティングにより、標的核酸に修飾が生じる。例えば、本明細書に記載されるシステムのいずれかにおいて、標的核酸の修飾は、二本鎖切断イベントである。本明細書に記載されるシステムのいずれかの他の実施形態において、標的核酸の修飾は、一本鎖切断イベント、挿入イベント、又は欠失イベントである。本明細書に記載されるシステムのいずれかの一部の実施形態において、改変により細胞毒性又は細胞死が生じる。
本明細書に記載されるシステムのいずれかの一部の実施形態において、システムはドナー鋳型核酸を更に含む。例えば、ドナー鋳型核酸は、DNA又はRNAであってもよい。
本明細書に記載されるシステムのいずれかの一部の実施形態において、RNAガイドは、tracrRNA、モジュレーターRNA、又はその両方を含む。本明細書に記載されるシステムのいずれかの一部の実施形態において、システムはtracrRNA及び/又はモジュレーターRNAを更に含む。本明細書に提供されるシステムのいずれかの一部の実施形態において、システムはtracrRNAを含まない。
本明細書に記載されるシステムのいずれかの一部の実施形態において、システムは、細胞内、例えば、真核細胞又は原核細胞内にある。
本明細書に提供されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質は、分割されたRuvCドメインを含む。一部の実施形態において、CRISPR関連タンパク質は触媒残基(例えば、アスパラギン酸又はグルタミン酸)を含む。一部の実施形態において、CRISPR関連タンパク質は標的核酸を切断する。一部の実施形態において、CRISPR関連タンパク質は、ペプチドタグ、蛍光タンパク質、塩基編集ドメイン、DNAメチル化ドメイン、ヒストン残基修飾ドメイン、局在化因子、転写修飾因子、光ゲート制御因子、化学誘導性因子、又はクロマチン可視化因子を更に含む。一部の実施形態において、CRISPR関連タンパク質をコードする核酸は、細胞での発現にコドン最適化される。一部の実施形態において、CRISPR関連タンパク質をコードする核酸は、プロモーターに作動可能に連結されている。一部の実施形態において、CRISPR関連タンパク質をコードする核酸は、ベクター内にある。一部の実施形態において、ベクターは、レトロウイルスベクター、レンチウイルスベクター、ファージベクター、アデノウイルスベクター、アデノ随伴ベクター、又は単純ヘルペスベクターを含む。一部の実施形態において、システムは、ナノ粒子、リポソーム、エキソソーム、微小胞、又は遺伝子銃を含む送達組成物中に存在する。
別の態様において、本開示は、本明細書に記載されるシステムを細胞内の標的核酸に結合する方法を提供し、この方法は、(a)システムを提供すること;及び(b)システムを細胞に送達することを含み、ここで、細胞は標的核酸を含み、CRISPR関連タンパク質はRNAガイドに結合し、スペーサー配列は標的核酸に結合する。
一態様において、本開示は、標的核酸のターゲティング及び編集方法であって、本明細書に記載されるシステムのいずれかを標的核酸に接触させることを含む、方法を提供する。一態様において、本開示は、標的核酸の編集方法であって、本明細書に記載されるシステムのいずれかを標的核酸に接触させることを含む、方法を提供する。
本明細書に提供されるシステムのいずれかの一部の実施形態において、接触は、直接接触又は間接接触を含む。本明細書に提供されるシステムのいずれかの一部の実施形態において、間接的に接触することは、RNAガイド及び/又はCRISPR関連タンパク質の産生を可能にする条件下で、本明細書に記載されるRNAガイド又はCRISPR関連タンパク質をコードする1つ以上の核酸を投与することを含む。本明細書に提供されるシステムのいずれかの一部の実施形態において、接触は、インビボでの接触又はインビトロでの接触を含む。本明細書に提供されるシステムのいずれかの一部の実施形態において、標的核酸をシステムと接触させることは、CRISPR関連タンパク質及びガイドRNAが標的核酸に到達することを可能にする条件下で、核酸を含む細胞をシステムと接触させることを含む。本明細書に提供されるシステムのいずれかの一部の実施形態において、インビボで細胞をシステムと接触させることは、CRISPR関連タンパク質及びガイドRNAが細胞に到達するか又は細胞内で産生されることを可能にする条件下で、細胞を含む対象にシステムを投与することを含む。
これらの図は、様々なタンパク質クラスターの遺伝子座解析の結果を表す一連の概略図並びに核酸及びアミノ酸配列である。
図1は、代表的なCLUST.121143遺伝子座の保存されたエフェクター(e_A)及びCRISPRアレイエレメントを示す概略配列表現である。 図1は、代表的なCLUST.121143遺伝子座の保存されたエフェクター(e_A)及びCRISPRアレイエレメントを示す概略配列表現である。 CLUST.121143のCRISPRダイレクトリピートエレメントの例の複数の配列アラインメントを示す一連の配列である。図2は、出現順に、それぞれ配列番号825、101、101、101、101、101、101、106、106、106、106、102、103、103、104、104、104、107、107、107、107、107、107、108、108、108、108、108、108、108、110、109及び105を開示する。 CLUST.121143エフェクタータンパク質の系統樹の概略表現である。 CLUST.121143エフェクタータンパク質の多重配列アラインメントの概略表現であり、RuvCドメインの保存されている触媒残基の位置を図示し、ジンクフィンガードメインの保存された触媒残基を図示する。 pACYC184及びダイレクトリピート転写方向を標的とするスペーサーについてのエンジニアリングされた組成物の枯渇活性の程度を示すグラフである。枯渇を定量化するために、エンリッチメントを、各ダイレクトリピート及びスペーサーのR処理/R入力として計算した。規格化された入力リード数は、次のように計算される。R入力=DRとスペーサーを含むリード数/総リード数ここで、リード数は、形質転換前にCLUST.121143エフェクター及び関連crRNAを発現するプラスミドDNAライブラリの次世代シーケンシングから取得される。規格化された処理リード数は、次のように計算される:R処理=(1+DRとスペーサーを含むリード数)/総リード数ここで、リード数は、抗生物質スクリーニング後にCLUST.121143エフェクター及び関連crRNAを発現する生存細胞から抽出されたプラスミドDNAの次世代シーケンシングから取得される。強力に枯渇した標的のエンリッチメントは1/10未満である。「順」方向のダイレクトリピート(5’-CTTT…AGAG-[スペーサー]-3’)及び「逆」方向のダイレクトリピート(5’-CTCT…AAAG-[スペーサー]-3’)を有するCLUST.121143 3300014839の枯渇の程度が図に示される。 陰性対照の枯渇活性の程度を示すグラフであり、エフェクタープラスミドから欠失したCLUST.121143エフェクターをコードする配列でスクリーンが繰り返されている。 図7Aおよび7Bは、pACYC184プラスミド及び大腸菌(E.coli)株E.Cloni上の位置による、CLUST.121143 3300014839の枯渇及び非枯渇標的の密度を示すグラフ表現である。トップ鎖上及びボトム鎖上の標的を別々に、アノテートされた遺伝子の向きに関して示す。図7A及び図7Bは、どちらも配列番号826を開示する。 図7Aおよび7Bは、pACYC184プラスミド及び大腸菌(E.coli)株E.Cloni上の位置による、CLUST.121143 3300014839の枯渇及び非枯渇標的の密度を示すグラフ表現である。トップ鎖上及びボトム鎖上の標的を別々に、アノテートされた遺伝子の向きに関して示す。図7A及び図7Bは、どちらも配列番号826を開示する。 CLUST.1211433300014839の枯渇した標的に隣接する配列のweblogoである。図8は、配列番号826を開示する。 図9は、代表的なCLUST.196682遺伝子座の保存されたエフェクター(e_A)及びCRISPRアレイエレメントを示す概略配列表現である。 図9は、代表的なCLUST.196682遺伝子座の保存されたエフェクター(e_A)及びCRISPRアレイエレメントを示す概略配列表現である。 CLUST.196682のCRISPRダイレクトリピートエレメントの例の複数の配列アラインメントを示す一連の配列である。図10は、出現順に、それぞれ配列番号827、714、714、714、733、701、704、705、705、703、734、706、743、720、720、740、740、731、731、742、742、828、732、730、730及び741を開示する。 CLUST.196682エフェクタータンパク質の系統樹の概略表現である。 CLUST.196682エフェクタータンパク質の多重配列アラインメントの概略表現であり、RuvCドメインの保存されている触媒残基の位置を図示し、ジンクフィンガードメインの保存された触媒残基を図示する。 図13Aおよび13Bは、pACYC184プラスミド及び大腸菌(E.coli)株E.Cloni上の位置による、CLUST.196682 3300025638の枯渇及び非枯渇標的の密度を示すグラフ表現である。トップ鎖上及びボトム鎖上の標的を別々に、アノテートされた遺伝子の向きに関して示す。図13A及び図13Bは、どちらも配列番号829を開示している。 図13Aおよび13Bは、pACYC184プラスミド及び大腸菌(E.coli)株E.Cloni上の位置による、CLUST.196682 3300025638の枯渇及び非枯渇標的の密度を示すグラフ表現である。トップ鎖上及びボトム鎖上の標的を別々に、アノテートされた遺伝子の向きに関して示す。図13A及び図13Bは、どちらも配列番号829を開示している。 CLUST.196682 3300025638の枯渇した標的に隣接する配列のweblogoである。図14は、配列番号829を開示する。 図15は、代表的なCLUST.089537遺伝子座の保存されたエフェクター(e_A)及びCRISPRアレイエレメントを示す概略配列表現である。 図15は、代表的なCLUST.089537遺伝子座の保存されたエフェクター(e_A)及びCRISPRアレイエレメントを示す概略配列表現である。 CLUST.089537のCRISPRダイレクトリピートエレメントの例の複数の配列アラインメントを示す一連の配列である。図16は、出現順に、それぞれ配列番号830、402、429、403、419、431、436、432、441、404、455、446、447、411、414、415、440、437、438、430、412、425、448、452、406、407、422、442、443、424、409、413、420、418、426、444、416、445、434、401、410、449、454、417、427、423、450、428、439、435、453、421、408、405、433及び451を開示する。 図17は、CLUST.089537エフェクタータンパク質の系統樹の概略表現である。 図17は、CLUST.089537エフェクタータンパク質の系統樹の概略表現である。 CLUST.089537エフェクタータンパク質の多重配列アラインメントの概略表現であり、RuvCドメインの保存されている触媒残基の位置を図示し、ジンクフィンガードメインの保存された触媒残基を図示する。 pACYC184及びダイレクトリピート転写方向を標的とするスペーサーについてのエンジニアリングされた組成物の枯渇活性の程度を示すグラフである。枯渇を定量化するために、エンリッチメントを、各ダイレクトリピート及びスペーサーのR処理/R入力として計算した。規格化された入力リード数は、次のように計算される。R入力=DRとスペーサーを含むリード数/総リード数ここで、リード数は、形質転換前にCLUST.089537エフェクター及び関連crRNAを発現するプラスミドDNAライブラリの次世代シーケンシングから取得される。規格化された処理リード数は、次のように計算される:R処理=(1+DRとスペーサーを含むリード数)/総リード数ここで、リード数は、抗生物質スクリーニング後にCLUST.089537エフェクター及び関連crRNAを発現する生存細胞から抽出されたプラスミドDNAの次世代シーケンシングから取得される。強力に枯渇した標的のエンリッチメントは1/10未満である。「順」方向のダイレクトリピート(5’-GTGC…ACAG-[スペーサー]-3’)及び「逆」方向のダイレクトリピート(5’-CTGT…GCAC-[スペーサー]-3’)を有するCLUST.089537 CAAACX010000652の枯渇の程度が図に示される。 図20Aおよび20Bは、pACYC184プラスミド及び大腸菌(E.coli)株E.Cloni上の位置による、CLUST.089537 CAAACX010000652の枯渇及び非枯渇標的の密度を示すグラフ表現である。トップ鎖上及びボトム鎖上の標的を別々に、アノテートされた遺伝子の向きに関して示す。図20A及び20Bは、どちらも配列番号831を開示する。 図20Aおよび20Bは、pACYC184プラスミド及び大腸菌(E.coli)株E.Cloni上の位置による、CLUST.089537 CAAACX010000652の枯渇及び非枯渇標的の密度を示すグラフ表現である。トップ鎖上及びボトム鎖上の標的を別々に、アノテートされた遺伝子の向きに関して示す。図20A及び20Bは、どちらも配列番号831を開示する。 CLUST.089537 CAAACX010000652の枯渇した標的に隣接する配列のweblogoである。図21は、配列番号831を開示する。
CRISPR-Cas防御システムの幅広い天然の多様性には、プログラム可能なバイオテクノロジーに生かすことのできる様々な活性機構及び機能要素が含まれている。天然のシステムでは、これらの機構及びパラメータが外来DNA及びウイルスに対する効率的な防御を実現する一方で、自己と非自己の判別を提供して自己標的化を回避している。エンジニアリングされたシステムでは、同じ機構及びパラメータがまた、分子技術の多様なツールボックスを提供し、ターゲティング空間の境界を画定する。例えば、システムCa9及びCa13aはカノニカルなDNA及びRNAエンドヌクレアーゼ活性を有し、そのターゲティング空間は、それぞれ、標的となるDNA上のプロトスペーサー隣接モチーフ(PAM)及び標的となるRNA上のプロトスペーサー隣接部位(PFS)によって画定される。
本明細書に記載される方法を用いて、シングルサブユニットのクラス2エフェクターシステム内に、RNAによるプログラムが可能な核酸操作の能力を拡張することのできる更なる機構及びパラメータが発見された。
一態様において、本開示は、天然に存在するゲノム配列内の特定の他の特徴との強力な共出現パターンを呈する新規タンパク質ファミリーを探索及び同定するための計算的方法及びアルゴリズムの使用に関する。特定の実施形態において、これらの計算的方法は、CRISPRアレイにごく近接して共出現するタンパク質ファミリーを同定することに関する。しかしながら、本明細書に開示される方法は、非コード及びタンパク質コードの両方の(例えば、細菌遺伝子座の非コード範囲にあるファージ配列の断片;又はCRISPR Cas1タンパク質)、他の特徴にごく近接した範囲内に天然に出現するタンパク質の同定において有用である。本明細書に記載される方法及び計算は1つ以上の計算装置で実施されてもよいことが理解される。
一部の実施形態において、ゲノム又はメタゲノムデータベースから一組のゲノム配列が入手される。データベースは、ショートリード、又はコンティグレベルデータ、又はアセンブルされたスキャフォールド、又は生物の完全ゲノム配列を含む。同様に、データベースは、原核生物、若しくは真核生物からのゲノム配列データを含んでもよく、又はメタゲノム環境試料からのデータを含んでもよい。データベースリポジトリの例としては、国立バイオテクノロジー情報センター(National Center for Biotechnology Information:NCBI)のRefSeq、NCBIのGenBank、NCBIの全ゲノムショットガン(Whole Genome Shotgun:WGS)、及びジョイントゲノム研究所(Joint Genome Institute:JGI)の統合微生物ゲノム(Integrated Microbial Genomes:IMG)が挙げられる。
一部の実施形態において、指定される最小長さのゲノム配列データの選択には、最小サイズ要件が課される。特定の例示的実施形態において、最小コンティグ長さは、100ヌクレオチド、500nt、1kb、1.5kb、2kb、3kb、4kb、5kb、10kb、20kb、40kb、又は50kbであってもよい。
一部の実施形態において、公知の又は予測されるタンパク質は、完全な又は選択された一組のゲノム配列データから抽出される。一部の実施形態において、公知の又は予測されるタンパク質は、ソースデータベースによって提供されるコード配列(CDS)アノテーションを抽出することから取られる。一部の実施形態において、予測タンパク質は、計算的方法を適用してヌクレオチド配列からタンパク質を同定することにより決定される。一部の実施形態では、GeneMarkスイートを使用してゲノム配列からタンパク質が予測される。一部の実施形態では、Prodigalを使用してゲノム配列からタンパク質が予測される。一部の実施形態では、同じ一組の配列データに対して複数のタンパク質予測アルゴリズムが用いられ、得られる一組のタンパク質から重複が排除されてもよい。
一部の実施形態において、CRISPRアレイはゲノム配列データから同定される。一部の実施形態では、PILER-CRを使用してCRISPRアレイが同定される。一部の実施形態では、CRISPR認識ツール(CRISPR Recognition Tool:CRT)を使用してCRISPRアレイが同定される。一部の実施形態において、CRISPRアレイは、最小限の回数(例えば2、3、又は4回)繰り返されるヌクレオチドモチーフを同定する発見的手法によって同定され、ここで繰り返されるモチーフの連続する出現間の間隔は、指定される長さ(例えば、50、100、又は150ヌクレオチド)を超えない。一部の実施形態では、同じ一組の配列データに対して複数のCRISPRアレイ同定ツールが用いられ、得られる一組のCRISPRアレイから重複が排除されてもよい。
一部の実施形態において、CRISPRアレイにごく近接しているタンパク質が同定される。一部の実施形態において、近接性はヌクレオチド距離として定義され、20kb、15kb、又は5kb以内であってもよい。一部の実施形態において、近接性は、タンパク質とCRISPRアレイとの間にあるオープンリーディングフレーム(ORF)の数として定義され、特定の例示的距離は、10、5、4、3、2、1、又は0個のORFであり得る。CRISPRアレイとごく近接した範囲内にあると同定されたタンパク質は、次に相同タンパク質クラスターにまとめられる。一部の実施形態では、blastclustを使用してタンパク質クラスターが形成される。特定の他の実施形態では、mmseqs2を使用してタンパク質クラスターが形成される。
タンパク質クラスターのメンバー間にCRISPRアレイとの強力な共出現パターンを確立するため、予め編成された完全な一組の公知の及び予測されるタンパク質に対してタンパク質ファミリーの各メンバーのBLAST検索が実施されてもよい。一部の実施形態では、UBLAST又はmmseqs2を使用して類似のタンパク質が検索されてもよい。一部の実施形態では、ファミリー内のタンパク質の代表的なサブセットについてのみ検索が実施されてもよい。
一部の実施形態では、CRISPRアレイとごく近接した範囲内にあるタンパク質のクラスターがメトリックによって順位付けされるか又はフィルタリングされることにより共出現が決定される。1つの例示的メトリックは、特定のE値閾値に至るまでのBLASTマッチの数に対するタンパク質クラスター内の要素の数の比である。一部の実施形態では、一定のE値閾値が使用されてもよい。他の実施形態では、E値閾値は、タンパク質クラスターの最も離れたメンバーによって決定されてもよい。一部の実施形態において、大域的な一組のタンパク質がクラスター化され、共出現メトリックは、含まれる1つ又は複数の大域的クラスターの要素の数に対するCRISPR関連クラスターの要素の数の比である。
一部の実施形態において、手動でのレビュープロセスを用いることにより、クラスター中のタンパク質の天然に存在する遺伝子座構造に基づいてエンジニアリングされるシステムの潜在的機能性及び最小限の一組の成分が評価される。一部の実施形態において、手動でのレビューにはタンパク質クラスターの図解表現が役立ち得るとともに、これは、ペアワイズでの配列類似性、系統樹、供給源生物/環境、予測される機能性ドメイン、及び遺伝子座構造の図解描写を含む情報を含み得る。一部の実施形態において、遺伝子座構造の図解描写は、高い代表性を有する近隣タンパク質ファミリーをフィルタリングし得る。一部の実施形態において、代表性は、含んでいる1つ又は複数の大域的クラスターの1つ又は複数のサイズに対する関連する近隣タンパク質の数の比によって計算されてもよい。特定の例示的実施形態において、タンパク質クラスターの図解表現は、天然に存在する遺伝子座のCRISPRアレイ構造の描写を含み得る。一部の実施形態において、タンパク質クラスターの図解表現は、推定CRISPRアレイの長さに対する保存されたダイレクトリピートの数、又は推定CRISPRアレイの長さに対するユニークなスペーサー配列の数の描写を含み得る。一部の実施形態において、タンパク質クラスターの図解表現は、CRISPRアレイとの推定エフェクターの様々な共出現メトリックの描写を含み、新規CRISPR-Casシステムを予測し、及びその成分を同定し得る。
一部の実施形態において、本明細書に記載されるRNAガイドとCRISPR関連タンパク質の間の複合体は、標的核酸に結合したか又は標的核酸を修飾した活性化CRISPR複合体である。
定義
用語「切断イベント」は、本明細書で使用されるとき、本明細書に記載されるCRISPRシステムのヌクレアーゼによって作り出される標的核酸におけるDNA切断を指す。一部の実施形態において、切断イベントは二本鎖DNA切断である。一部の実施形態において、切断イベントは一本鎖DNA切断である。
用語「CRISPR-Casシステム」は、本明細書で使用されるとき、CRISPR-Casエフェクターをコードする配列、RNAガイド、並びに他の配列及びCRISPR遺伝子座からの転写物を含む、CRISPR-Casエフェクターの発現に関与する、又はその活性を導く核酸及び/又はタンパク質を指す。
用語「CRISPRアレイ」は、本明細書で使用されるとき、最初のCRISPRリピートの最初のヌクレオチドから始まって最後の(末端)CRISPRリピートの最後のヌクレオチドで終わる、CRISPRリピートとスペーサーとを含む核酸(例えば、DNA)セグメントを指す。典型的には、CRISPRアレイ中の各スペーサーは2つのリピート間に位置する。用語「CRISPRリピート」、又は「CRISPRダイレクトリピート」、又は「ダイレクトリピート」は、本明細書で使用されるとき、複数の短い定方向に反復する配列を指し、これはCRISPRアレイ内で配列変異をごく僅かしか又は全く示さない。
用語「CRISPR RNA」又は「crRNA」は、本明細書で使用されるとき、CRISPRエフェクターによって核酸配列を特異的にターゲティングするために使用されるガイド配列を含むRNA分子を指す。典型的には、crRNAは、標的認識を媒介する配列と、tracrRNAと二重鎖を形成する配列とを含む。crRNA:tracrRNA二重鎖は、CRISPRエフェクターに結合する。用語「ドナー鋳型核酸」は、本明細書で使用されるとき、本明細書に記載されるCRISPR酵素が標的核酸を改変した後に1つ以上の細胞タンパク質によって標的核酸の構造を改変するために使用され得る核酸分子を指す。一部の実施形態において、ドナー鋳型核酸は二本鎖核酸である。一部の実施形態において、ドナー鋳型核酸は一本鎖核酸である。一部の実施形態において、ドナー鋳型核酸は線状である。一部の実施形態において、ドナー鋳型核酸は環状(例えば、プラスミド)である。一部の実施形態において、ドナー鋳型核酸は外因性核酸分子である。一部の実施形態において、ドナー鋳型核酸は内因性核酸分子(例えば、染色体)である。
用語「CRISPR-Casエフェクター」、「CRISPRエフェクター」、「エフェクター」、「CRISPR関連タンパク質」、又は「CRISPR酵素」は、本明細書で使用されるとき、酵素活性を実行するタンパク質又はRNAガイドによって指定される核酸上の標的部位に結合するタンパク質を指す。一部の実施形態において、CRISPRエフェクターは、エンドヌクレアーゼ活性、ニッカーゼ活性、エキソヌクレアーゼ活性、トランスポサーゼ活性、及び/又は切出し活性を有する。
用語「ガイドRNA」又は「gRNA」は、本明細書で使用されるとき、ヌクレアーゼ活性を有するCRISPRエフェクターを特定の標的核酸を標的化及び切断するように導くことができるRNA分子を指す。
用語「RNAガイド」は、本明細書で使用されるとき、本明細書に記載されるタンパク質の標的核酸へのターゲティングを促進する任意のRNA分子を指す。例示的な「RNAガイド」としては、限定はされないが、crRNA、並びにtracrRNA及び/又はモジュレーターRNAのいずれかと融合したcrRNAが挙げられる。一部の実施形態において、RNAガイドは、crRNA及びtracrRNAの両方を含む。一部の実施形態において、RNAガイドは、crRNA及びモジュレーターRNAを含む。一部の実施形態において、RNAガイドは、crRNA、tracrRNA、及びモジュレーターRNAを含む。
用語「モジュレーターRNA」は、本明細書に記載されるとき、CRISPR-Casエフェクター又はCRISPR-Casエフェクターを含む核タンパク質複合体の活性を調節する(例えば、増加又は減少させる)任意のRNA分子を指す。一部の実施形態において、モジュレーターRNAは、CRISPR-Casエフェクター又はCRISPR-Casエフェクターを含む核タンパク質複合体のヌクレアーゼ活性を調節する。
本明細書で使用されるとき、「標的核酸」という用語は、本明細書に記載されるCRISPRシステムによって修飾される特定の核酸配列を指す。一部の実施形態において、標的核酸は遺伝子を含む。一部の実施形態において、標的核酸は非コード領域(例えば、プロモーター)を含む。一部の実施形態において、標的核酸は一本鎖である。一部の実施形態において、標的核酸は二本鎖である。
用語「トランス活性化crRNA」又は「tracrRNA」は、本明細書で使用されるとき、CRISPRエフェクターが特定の標的核酸に結合するために必要な構造を形成する配列を含むRNAを指す。
「転写活性部位」は、本明細書で使用されるとき、転写が開始され活発に起こるプロモーター領域を含む核酸配列中の部位を指す。
CRISPR酵素に関して本明細書で使用される「コラテラルRNAse活性」という用語は、酵素が特異的に標的化された核酸を修飾した後のCRISPR酵素の非特異的RNAse活性を指す。
特に定義しない限り、本明細書で使用される全ての科学技術用語は、本発明が属する技術分野の当業者が一般的に理解するのと同じ意味を有する。本発明の実施又は試験においては、本明細書に記載されるものと同様の又は等価な方法及び材料を使用し得るが、好適な方法及び材料を以下に記載する。本明細書において言及される刊行物、特許出願、特許、及び他の参考文献は全て、全体として参照により援用される。矛盾が生じる場合、定義を含め、本明細書が優先するものとする。加えて、材料、方法、及び例は例示に過ぎず、限定することを意図するものではない。
本発明の他の特徴及び利点は、以下の詳細な説明から、及び特許請求の範囲から明らかであろう。
プール型スクリーニング
エンジニアリングされた新規CRISPR-Casシステムの活性を効率的に検証し、同時に種々の活性機構及び機能パラメータを偏りのない方法及び大腸菌(E.coli)において新規プール型スクリーニング手法で評価する。第一に、新規CRISPR-Casシステムの保存タンパク質及び非コードエレメントの計算的同定から、DNA合成及び分子クローニングを用いて個別の成分を単一の人工発現ベクター(一実施形態ではpET-28a+骨格をベースとする)にアセンブルする。第2の実施形態では、エフェクター及び非コードエレメントを単一のmRNA転写物に転写し、異なるリボソーム結合部位を用いて個々のエフェクターを翻訳する。
第二に、天然のcrRNA及びターゲティングスペーサーを、第2のプラスミドpACYC184を標的化する非天然スペーサーを含むプロセシングされていないcrRNAのライブラリに置き換える。このcrRNAライブラリをタンパク質エフェクター及び非コードエレメントを含むベクター骨格(例えばpET-28a+)にクローニングし、その後、続いてこのライブラリをpACYC184プラスミド標的と共に大腸菌(E.coli)に形質転換する。結果的に、得られる各大腸菌(E.coli)細胞は、ただ1つのターゲティングスペーサーを含む。代替的実施形態では、非天然スペーサーを含むプロセシングされていないcrRNAのライブラリが、Baba et al.(2006)Mol.Syst.Biol.2:2006.0008;及びGerdes et al.(2003)J.Bacteriol.185(19):5673-84(これらの各々の内容全体は参照により本明細書に援用される)に記載されるものなどの資料から引用される大腸菌(E.coli)必須遺伝子を更に標的化する。この実施形態において、必須遺伝子機能を破壊する新規CRISPR-Casシステムの正の標的化された活性は、細胞死又は成長停止を生じさせる。一部の実施形態において、必須遺伝子ターゲティングスペーサーをpACYC184標的と組み合わせて、アッセイに別の次元を加えることができる。
第三に、抗生物質選択下で大腸菌(E.coli)を成長させる。一実施形態において、三重抗生物質選択:エンジニアリングされたCRISPR-Casエフェクターシステムを含むpET-28a+ベクターの形質転換の成功を確認するためのカナマイシン、並びにpACYC184標的ベクターの同時形質転換の成功を確認するためのクロラムフェニコール及びテトラサイクリンが用いられる。pACYC184は通常、クロラムフェニコール及びテトラサイクリンに対する耐性を付与するため、抗生物質選択下では、このプラスミドを標的化する新規CRISPR-Casシステムの正の活性により、エフェクター、非コードエレメント、及びcrRNAライブラリの特異的活性エレメントを活性に発現する細胞が排除されることになる。早い時点と比較した後の時点における生存細胞集団を調べると、典型的には不活性crRNAと比較してシグナルの枯渇が生じる。一部の実施形態において、二重抗生物質選択が用いられる。例えば、クロラムフェニコール又はテトラサイクリンのいずれかを抜き取って選択圧を除去すると、ターゲティング基質、配列特異性、及び効力に関する新規情報を得ることができる。一部の実施形態では、カナマイシンのみを使用して、エンジニアリングされたCRISPR-Casエフェクターシステムを含むpET-28a+ベクターの形質転換の成功が確認される。この実施形態は、成長の変化を観察するためにカナマイシン以外の更なる選択が必要ないため、大腸菌(E.coli)必須遺伝子を標的化するスペーサーを含むライブラリに好適である。この実施形態では、クロラムフェニコール及びテトラサイクリン依存性が取り除かれ、ライブラリ中のそれらの標的(存在する場合)が、ターゲティング基質、配列特異性、及び効力に関するネガティブ又はポジティブの更なる情報源を提供する。
pACYC184プラスミドは、CRISPR-Casシステムの活性に影響を及ぼし得る多様な一組の特徴及び配列を含むため、プール型スクリーンからの活性crRNAをpACYC184にマッピングすることにより、種々の活性機構及び機能パラメータを示唆するものであり得る活性パターンが仮説にとらわれず幅広く提供される。このようにして、異種原核生物種における新規CRISPR-Casシステムの再構成に必要な特徴をより包括的に試験し、研究することができる。
本明細書に記載されるインビボプール型スクリーンの重要な利点としては、以下が挙げられる:
(1)汎用性-プラスミド設計により、複数のエフェクター及び/又は非コードエレメントを発現させることが可能になる;ライブラリクローニング戦略により、計算的に予測されたcrRNAの両方の転写方向の発現が実現する;
(2)活性機構及び機能パラメータの包括的試験により、DNA又はRNA切断を含めた多様な干渉機構を評価し;転写、プラスミドDNA複製などの特徴の共出現;及びcrRNAライブラリについてのフランキング配列を調べて、4Nの複雑さ等価のPAMを確実に決定することができる;
(3)感度-pACYC184は低コピープラスミドであり、僅かな干渉率であっても、プラスミドによってコードされる抗生物質耐性を除去することができるため、CRISPR-Cas活性について高感度を実現する;及び
(4)効率-RNAシーケンシングについてより高い速度及びスループットを実現する最適化された分子生物学ステップは、タンパク質発現試料をスクリーンにおける生存細胞から直接採取することができる。
このインビボプール型スクリーンを用いてその作動可能なエレメント、機構及びパラメータ、並びにその天然細胞環境の外部でエンジニアリングされたシステムにおいて活性であり再プログラム化されるその能力を評価することにより、本明細書に記載される新規CRISPR-Casファミリーを評価した。
RuvCドメインを有するクラス2 CRISPR-Casエフェクター
一態様において、本開示は、本明細書においてCLUST.121143と称されるクラス2 CRISPR-Casシステムを提供する。このクラス2 CRISPR-Casシステムは、RuvCドメインを有する単離されたCRISPR関連タンパク質を含む。
一態様において、本開示は、本明細書においてCLUST.196682と称されるクラス2 CRISPR-Casシステムを提供する。このクラス2 CRISPR-Casシステムは、RuvCドメインを有する単離されたCRISPR関連タンパク質を含む。
一態様において、本開示は、本明細書においてCLUST.089537と称されるクラス2 CRISPR-Casシステムを提供する。このクラス2 CRISPR-Casシステムは、RuvCドメインを有する単離されたCRISPR関連タンパク質を含む。
一部の実施形態において、CRISPR関連タンパク質及びRNAガイドは、他の成分を含み得る二元複合体を形成する。二元複合体は、RNAガイド中のスペーサー配列に相補的な核酸基質(即ち、配列特異的基質又は標的核酸)への結合時に活性化される。一部の実施形態において、配列特異的基質は二本鎖DNAである。一部の実施形態において、配列特異的基質は一本鎖DNAである。一部の実施形態において、配列特異的基質は一本鎖RNAである。一部の実施形態において、配列特異的基質は二本鎖RNAである。一部の実施形態において、配列特異性は、RNAガイド(例えば、crRNA)中のスペーサー配列と標的基質の完全な一致を必要とする。他の実施形態において、配列特異性は、RNAガイド(例えば、crRNA)中のスペーサー配列と標的基質の部分的な(連続的又は非連続的な)一致を必要とする。
一部の実施形態において、二元複合体は標的基質への結合時に活性化した状態になる。一部の実施形態において、活性化した複合体は、「複数回の代謝回転」活性を呈し、従って標的基質への作用時(例えば、それの切断時)、活性化した複合体は活性化した状態のままである。一部の実施形態において、活性化した二元複合体は「単回の代謝回転」活性を呈し、従って標的基質への作用時、二元複合体は不活性状態に戻る。一部の実施形態において、活性化した二元複合体は非特異的な(即ち、「コラテラル」)切断活性を呈し、従って複合体は非標的核酸を切断する。一部の実施形態において、非標的核酸は、DNA(例えば、一本鎖又は二本鎖DNA)である。一部の実施形態において、非標的核酸は、RNA(例えば、一本鎖又は二本鎖RNA)である。
CRISPR酵素修飾
非活性化/不活性化CRISPR酵素
本明細書に記載されるCRISPR酵素がヌクレアーゼ活性を有する場合、減少したヌクレアーゼ活性、例えば、野生型CRISPR酵素と比較したとき少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも97%、又は100%のヌクレアーゼ不活性化となるようにCRISPR酵素を修飾することができる。ヌクレアーゼ活性は、当技術分野で周知の幾つかの方法、例えば、タンパク質のヌクレアーゼドメインへの突然変異の導入によって減少させることができる。一部の実施形態において、ヌクレアーゼ活性の触媒残基が同定され、それらのアミノ酸残基を異なるアミノ酸残基(例えば、グリシン又はアラニン)に置換することによりヌクレアーゼ活性を減少させてもよい。
不活性化されたCRISPR酵素は、1つ以上の機能的ドメインを含むか、又はそれと関連づけられ得る(例えば、融合タンパク質、リンカーペプチド、「GS」リンカーなどを介して)。こうした機能性ドメインは様々な活性、例えば、メチラーゼ活性、デメチラーゼ活性、転写活性化活性、転写抑制活性、転写放出因子活性、ヒストン修飾活性、RNA切断活性、DNA切断活性、核酸結合活性、及びスイッチ活性(例えば、光誘導性)を有することができる。一部の実施形態において、機能性ドメインは、クルッペル関連ボックス(KRAB)、VP64、VP16、Fok1、P65、HSF1、MyoD1、及びビオチン-APEXである。
不活性化されたCRISPR酵素上に1つ以上の機能性ドメインを位置させることは、その機能性ドメインが帰属する機能的効果による影響を標的に及ぼすのに正しい空間上の向きとなることを可能にする。例えば、機能性ドメインが転写活性化因子(例えば、VP16、VP64、又はp65)である場合、その転写活性化因子は、それが標的の転写に影響を及ぼすことが可能になる空間上の向きに置かれる。同様に、転写リプレッサーが標的の転写に影響を及ぼすように位置し、及びヌクレアーゼ(例えば、Fok1)が標的を切断又は部分的に切断するように位置する。一部の実施形態において、機能性ドメインはCRISPR酵素のN末端に位置する。一部の実施形態において、機能性ドメインはCRISPR酵素のC末端に位置する。一部の実施形態において、不活性化されたCRISPR酵素は、N末端に第1の機能性ドメイン及びC末端に第2の機能性ドメインを含むように修飾される。
スプリット酵素
本開示はまた、本明細書に記載されるCRISPR酵素のスプリットバージョンも提供する。スプリットバージョンのCRISPR酵素は送達に有利であり得る。一部の実施形態において、CRISPR酵素は酵素の2つの部分に分割され、それらが一緒になって実質的に機能性のCRISPR酵素を含む。
分割は、1つ又は複数の触媒ドメインが影響を受けないような方法で行われ得る。CRISPR酵素はヌクレアーゼとして機能してもよく、又は本質的に(例えば、その触媒ドメインにある1つ又は複数の突然変異に起因して)触媒活性がごく僅かしかない又は全くないRNA結合タンパク質である不活性化された酵素であってもよい。
一部の実施形態では、ヌクレアーゼローブ及びα-ヘリックスローブが別個のポリペプチドとして発現する。これらのローブはそれ自体には相互作用を及ぼさないが、ガイドRNAがそれらを複合体へと動員し、その複合体が完全長CRISPR酵素の活性を再現し、部位特異的DNA切断を触媒する。修飾されたガイドRNAを使用すると、二量化が妨げられることによりスプリット酵素活性が無効になり、誘導性の二量化システムの開発が可能となる。スプリット酵素については、例えば、Wright,Addison V.,et al.“Rational design of a split-Cas9 enzyme complex,”Proc.Nat’l.Acad.Sci.,112.10(2015):2984-2989(全体として参照により本明細書に援用される)に記載されている。
一部の実施形態において、スプリット酵素は、例えばラパマイシン感受性二量化ドメインを利用することにより、二量化パートナーに融合されてもよい。これにより、CRISPR酵素活性を時間的に制御するための化学誘導性CRISPR酵素の作成が可能になる。このようにして2つの断片に分割されていることによりCRISPR酵素を化学誘導性にすることができ、CRISPR酵素の制御された再アセンブルにはラパマイシン感受性二量化ドメインを使用することができる。
分割点は、典型的にはインシリコで設計され、コンストラクトにクローニングされる。この過程でスプリット酵素に突然変異が導入されてもよく、非機能性ドメインが除去されてもよい。一部の実施形態において、スプリットCRISPR酵素の2つの部分又は断片(即ち、N末端及びC末端断片)は、例えば野生型CRISPR酵素の配列の少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%、又は少なくとも99%を含む完全なCRISPR酵素を形成することができる。
自己活性化型又は不活性化型酵素
本明細書に記載されるCRISPR酵素は、自己活性化型又は自己不活性化型であるように設計されてもよい。一部の実施形態において、CRISPR酵素は自己不活性化型である。例えば、CRISPR酵素をコードするコンストラクトに標的配列を導入することができる。従ってCRISPR酵素が標的配列を切断するとともに、それによって酵素をコードするコンストラクトがその発現を自己不活性化し得る。自己不活性化CRISPRシステムの構築方法については、例えば、Epstein,Benjamin E.,and David V.Schaffer.“Engineering a Self-Inactivating CRISPR System for AAV Vectors,”Mol.Ther.,24(2016):S50(全体として参照により本明細書に援用される)に記載されている。
一部の他の実施形態では、弱いプロモーター(例えば、7SKプロモーター)の制御下で発現する更なるガイドRNAが、CRISPR酵素をコードする核酸配列を標的化して、その発現を(例えば、核酸の転写及び/又は翻訳を妨げることにより)妨げ及び/又は阻止することができる。CRISPR酵素と、ガイドRNAと、CRISPR酵素をコードする核酸を標的化するガイドRNAとを発現するベクターを細胞にトランスフェクトすると、CRISPR酵素をコードする核酸の効率的な破壊につながり、CRISPR酵素レベルを低下させることができ、従ってゲノム編集活性を制限することができる。
一部の実施形態において、CRISPR酵素のゲノム編集活性は、哺乳類細胞における内因性RNAシグネチャ(例えば、miRNA)を通じて調節することができる。CRISPR酵素をコードするmRNAの5’-UTRにmiRNA相補配列を用いることにより、CRISPR酵素スイッチを作ることができる。このスイッチは、標的細胞中のmiRNAに選択的且つ効率的に応答する。従って、このスイッチは、異種細胞集団内で内因性miRNA活性を感知することによりゲノム編集を差次的に制御し得る。従って、このスイッチシステムは、細胞内miRNA情報に基づく細胞型選択的なゲノム編集及び細胞エンジニアリングのフレームワークを提供し得る(Hirosawa,Moe et al.“Cell-type-specific genome editing with a microRNA-responsive CRISPR-Cas9 switch,”Nucl.Acids Res.,2017 Jul 27;45(13):e118)。
誘導性CRISPR酵素
CRISPR酵素は、誘導性、例えば、光誘導性又は化学誘導性であってもよい。この機構により、CRISPR酵素中の機能性ドメインを活性化させることが可能になる。光誘導能は、当該技術分野において公知の様々な方法により、例えば、スプリットCRISPR酵素においてCRY2PHR/CIBN対が用いられる融合複合体を設計することにより実現し得る(例えば、Konermann et al.“Optical control of mammalian endogenous transcription and epigenetic states,”Nature,500.7463(2013):472を参照のこと)。化学誘導能は、例えば、スプリットCRISPR酵素においてFKBP/FRB(FK506結合タンパク質/FKBPラパマイシン結合ドメイン)対が用いられる融合複合体を設計することにより実現し得る。ラパマイシンは融合複合体の形成に必要であり、従ってCRISPR酵素を活性化する(例えば、Zetsche,Volz,and Zhang,“A split-Cas9 architecture for inducible genome editing and transcription modulation,”Nature Biotech.,33.2(2015):139-142を参照のこと)。
更に、CRISPR酵素の発現は、誘導性プロモーター、例えば、テトラサイクリン又はドキシサイクリン制御下での転写活性化(Tet-On及びTet-Off発現システム)、ホルモン誘導性遺伝子発現システム(例えば、エクジソン誘導性遺伝子発現システム)、及びアラビノース誘導性遺伝子発現システムによって調節することができる。RNAとして送達される場合、RNAターゲティングエフェクタータンパク質の発現は、小分子様テトラサイクリンを感知することのできるリボスイッチによって調節されてもよい(例えば、Goldfless,Stephen J.et al.“Direct and specific chemical control of eukaryotic translation with a synthetic RNA-protein interaction,”Nucl.Acids Res.,40.9(2012):e64-e64を参照のこと)。
誘導性CRISPR酵素及び誘導性CRISPRシステムの様々な実施形態が、例えば、米国特許第8871445号明細書、米国特許出願公開第20160208243号明細書、及び国際公開第2016205764号パンフレット(これらの各々は、本明細書において全体として参照により援用される)に記載されている。
機能性突然変異
本明細書に記載されるとおりのCRISPR酵素に様々な突然変異又は修飾を導入して特異性及び/又はロバスト性を改善することができる。一部の実施形態において、プロトスペーサー隣接モチーフ(PAM)を認識するアミノ酸残基が同定される。本明細書に記載されるCRISPR酵素は、例えば、PAMを認識するアミノ酸残基を他のアミノ酸残基に置換することにより、異なるPAMを認識するように更に修飾されてもよい。一部の実施形態において、CRISPR酵素は、例えば、5’-NGG-3’、5’-YG-3’、5’-TTTN-3’、又は5’-YTN-3’PAMを認識することができ、ここで、「Y」はピリミジンであり、「N」は任意の核酸塩基である。
一部の実施形態において、少なくとも1つの核局在化シグナル(NLS)が、CRISPR酵素をコードする核酸配列に取り付けられている。一部の実施形態において、少なくとも1つの核外輸送シグナル(NES)が、CRISPR酵素をコードする核酸配列に取り付けられている。一部の実施形態において、C末端及び/又はN末端NLS又はNESは、真核細胞、例えばヒト細胞における最適な発現及び核ターゲティングのために取り付けられる。
一部の実施形態において、本明細書に記載されるCRISPR酵素は、1つ以上のアミノ酸残基を突然変異させることにより、1つ以上の機能活性が改変される。例えば、一部の実施形態において、CRISPR酵素は、1つ以上のアミノ酸残基を突然変異させることにより、そのヘリカーゼ活性が改変される。一部の実施形態において、CRISPR酵素は、1つ以上のアミノ酸残基を突然変異させることにより、そのヌクレアーゼ活性(例えば、エンドヌクレアーゼ活性又はエキソヌクレアーゼ活性)が改変される。一部の実施形態において、CRISPR酵素は、1つ以上のアミノ酸残基を突然変異させることにより、ガイドRNAと機能的に関連するその能力が改変される。一部の実施形態において、CRISPR酵素は、1つ以上のアミノ酸残基を突然変異させることにより、標的核酸と機能的に関連するその能力が改変される。
一部の実施形態において、本明細書に記載されるCRISPR酵素は標的核酸分子の切断能を有する。一部の実施形態において、CRISPR酵素は標的核酸分子の両方の鎖を切断する。しかしながら、一部の実施形態において、CRISPR酵素は、1つ以上のアミノ酸残基を突然変異させることにより、その切断活性が改変される。例えば、一部の実施形態において、CRISPR酵素は、この酵素が標的核酸の切断能を有しないものとなる1つ以上の突然変異を含んでもよい。他の実施形態において、CRISPR酵素は、この酵素が標的核酸の一本鎖の切断能(即ち、ニッカーゼ活性)を有するものとなる1つ以上の突然変異を含んでもよい。一部の実施形態において、CRISPR酵素は、ガイドRNAがハイブリダイズする鎖に相補的な標的核酸の鎖を切断する能力を有する。一部の実施形態において、CRISPR酵素は、ガイドRNAがハイブリダイズする標的核酸の鎖を切断する能力を有する。
一部の実施形態において、本明細書に記載されるCRISPR酵素は、1つ以上の所望の機能活性(例えば、ヌクレアーゼ活性及び機能的にガイドRNAと相互作用する能力)を保持しつつ酵素のサイズを縮小させるため、1つ以上のアミノ酸残基に欠失を含むようにエンジニアリングされてもよい。このトランケート型CRISPR酵素は有利には、負荷に制限のある送達システムとの組み合わせで用いられてもよい。
一態様において、本開示は、本明細書に記載される核酸配列(nucleic sequences)と少なくとも10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、又は99%同一の核酸配列を提供する。別の態様において、本開示はまた、本明細書に記載されるアミノ酸配列と少なくとも10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、又は99%同一のアミノ酸配列も提供する。
一部の実施形態において、核酸配列は、本明細書に記載される配列と同じである一部分(例えば、少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、30、40、50、60、70、80、90、又は100ヌクレオチド、例えば、連続又は非連続ヌクレオチド)を少なくとも有する。一部の実施形態において、核酸配列は、本明細書に記載される配列と異なる一部分(例えば、少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、30、40、50、60、70、80、90、又は100ヌクレオチド、例えば、連続又は非連続ヌクレオチド)を少なくとも有する。
一部の実施形態において、アミノ酸配列は、本明細書に記載される配列と同じである一部分(例えば、少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、30、40、50、60、70、80、90、又は100アミノ酸残基、例えば、連続又は非連続アミノ酸残基)を少なくとも有する。一部の実施形態において、アミノ酸配列は、本明細書に記載される配列と異なる一部分(例えば、少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、30、40、50、60、70、80、90、又は100アミノ酸残基、例えば、連続又は非連続アミノ酸残基)を少なくとも有する。
2つのアミノ酸配列、又は2つの核酸配列のパーセント同一性を決定するには、それらの配列が最適な比較を目的としてアラインメントされる(例えば、最適なアラインメントとなるように第1及び第2のアミノ酸又は核酸配列の一方又は両方にギャップが導入されてもよく、及び比較を目的として非相同配列が無視されてもよい)。一般に、比較を目的としてアラインメントされる参照配列の長さは、参照配列の長さの少なくとも80%でなければならず、及び一部の実施形態では、参照配列の長さの少なくとも90%、95%、又は100%である。次に、対応するアミノ酸位置又はヌクレオチド位置にあるアミノ酸残基又はヌクレオチドが比較される。第1の配列におけるある位置が第2の配列における対応する位置と同じアミノ酸残基又はヌクレオチドによって占有されているとき、次にはそれらの分子は当該の位置において同一である。2つの配列間のパーセント同一性は、2つの配列を最適にアラインメントするために導入する必要があるギャップの数、及び各ギャップの長さを考慮に入れた、それらの配列によって共有される同一の位置の数の関数である。本開示の目的上、配列の比較及び2つの配列間におけるパーセント同一性の決定は、ギャップペナルティーを12、ギャップ伸長ペナルティーを4、及sびフレームシフトギャップペナルティーを5としたBlossum 62スコアリング行列を用いて達成することができる。
ガイドRNA修飾
一部の実施形態において、本明細書に記載されるRNAガイドは、ウラシル(U)を含む。一部の実施形態において、本明細書に記載されるRNAガイドは、チミン(T)を含む。一部の実施形態において、本明細書に記載されるRNAガイドのダイレクトリピート配列は、ウラシル(U)を含む。一部の実施形態において、本明細書に記載されるRNAガイドのダイレクトリピート配列は、チミン(T)を含む。一部の実施形態において、表3、9、又は13のいずれかによるダイレクトリピート配列は、表3、9、又は13のいずれかの対応する配列においてチミンとして示される1つ以上の場所に、ウラシルを含む配列を含む。
一部の実施形態において、ダイレクトリピートは、内因性CRISPRアレイにおいて繰り返される配列の1つのコピーのみを含む。一部の実施形態において、ダイレクトリピートは、内因性CRISPRアレイに見られる1つ以上のスペーサー配列に隣接する(例えば、フランキング)完全長配列である。一部の実施形態において、ダイレクトリピートは、内因性CRISPRアレイに見られる1つ以上のスペーサー配列に隣接する(例えば、フランキング)完全長配列の一部(例えば、プロセシングされた部分)である。
スペーサー長さ
一部の実施形態において、CRISPR-Casシステムは、CLUST.121143のCRISPR-Casシステムである。ガイドRNAのスペーサー長さは約15~50ヌクレオチドの範囲であってもよい。一部の実施形態において、ガイドRNAのスペーサー長さは、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、少なくとも22ヌクレオチド、少なくとも23ヌクレオチド、少なくとも24ヌクレオチド、少なくとも25ヌクレオチド、少なくとも26ヌクレオチド、又は少なくとも27ヌクレオチドである。一部の実施形態において、スペーサー長さは、15~17ヌクレオチド、15~23ヌクレオチド、16~22ヌクレオチド、17~20ヌクレオチド、20~24ヌクレオチド(例えば、20、21、22、23、又は24ヌクレオチド)、23~25ヌクレオチド(例えば、23、24、又は25ヌクレオチド)、24~27ヌクレオチド、27~30ヌクレオチド、30~33ヌクレオチド(例えば、30、31、32、又は33ヌクレオチド)、33~36ヌクレオチド(例えば、33、34、35、又は36ヌクレオチド)、36~40ヌクレオチド(例えば、36、37、38、39、又は40ヌクレオチド)、40~45ヌクレオチド(例えば、40、41、42、43、44、又は45ヌクレオチド)、30又は35~40ヌクレオチド、41~45ヌクレオチド、45~50ヌクレオチド、又はそれ以上である。一部の実施形態において、スペーサー長さは、22~40ヌクレオチド、又は26~35ヌクレオチドである。一部の実施形態において、ガイドRNAのダイレクトリピート長さは少なくとも16ヌクレオチドであり、又は16~20ヌクレオチド(例えば、16、17、18、19、又は20ヌクレオチド)である。一部の実施形態において、ガイドRNAのダイレクトリピート長さは19ヌクレオチドである。
一部の実施形態において、CRISPR-Casシステムは、CLUST.196682のCRISPR-Casシステムである。
一部の実施形態において、CRISPR-Casシステムは、CLUST.089537のCRISPR-Casシステムである。ガイドRNAのスペーサー長さは約15~50ヌクレオチドの範囲であってもよい。一部の実施形態において、ガイドRNAのスペーサー長さは、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、又は少なくとも22ヌクレオチドである。一部の実施形態において、スペーサー長さは、15~17ヌクレオチド、15~23ヌクレオチド、16~22ヌクレオチド、17~20ヌクレオチド、20~24ヌクレオチド(例えば、20、21、22、23、又は24ヌクレオチド)、23~25ヌクレオチド(例えば、23、24、又は25ヌクレオチド)、24~27ヌクレオチド、27~30ヌクレオチド、30~45ヌクレオチド(例えば、30、31、32、33、34、35、40、又は45ヌクレオチド)、30又は35~40ヌクレオチド、41~45ヌクレオチド、45~50ヌクレオチド、又はそれ以上である。一部の実施形態において、ガイドRNAのダイレクトリピート長さは少なくとも16ヌクレオチドであり、又は16~20ヌクレオチド(例えば、16、17、18、19、又は20ヌクレオチド)である。一部の実施形態において、ガイドRNAのダイレクトリピート長さは19ヌクレオチドである。
一部の実施形態において、ダイレクトリピートは、内因性CRISPRアレイにおいて繰り返される配列の1つのコピーのみを含む。一部の実施形態において、ダイレクトリピートは、内因性CRISPRアレイに見られる1つ以上のスペーサー配列に隣接する(例えば、フランキング)完全長配列である。一部の実施形態において、ダイレクトリピートは、内因性CRISPRアレイに見られる1つ以上のスペーサー配列に隣接する(例えば、フランキング)完全長配列の一部(例えば、プロセシングされた部分)である。
ガイドRNA配列は、CRISPR複合体の形成及び標的への結合の成功は許容するが、同時にヌクレアーゼ活性の成功は許容しない(即ち、ヌクレアーゼ活性のない/インデルを生じさせない)ような方法で修飾されてもよい。こうした修飾ガイド配列は、「デッドガイド」又は「デッドガイド配列」と称される。こうしたデッドガイド又はデッドガイド配列はヌクレアーゼ活性の点で触媒的に不活性又はコンホメーション的に不活性であってもよい。デッドガイド配列は、典型的には、活性なRNA切断を生じるそれぞれのガイド配列よりも短い。一部の実施形態において、デッドガイドは、ヌクレアーゼ活性を有するそれぞれのガイドRNAと比べて5%、10%、20%、30%、40%、又は50%短い。ガイドRNAのデッドガイド配列は、13~15ヌクレオチド長(例えば、13、14、又は15ヌクレオチド長)、15~19ヌクレオチド長、又は17~18ヌクレオチド長(例えば、17ヌクレオチド長)であってもよい。
従って、一態様において、本開示は、本明細書に記載されるとおりの機能性CRISPR酵素と、ガイドRNA(gRNA)とを含む天然に存在しない又はエンジニアリングされたCRISPRシステムを提供し、ここでgRNAはデッドガイド配列を含み、従ってgRNAは、検出可能な切断活性なしにCRISPRシステムが細胞の目的のゲノム遺伝子座に向けられるような標的配列へのハイブリダイズ能を有する。
デッドガイドの詳細な説明は、例えば、国際公開第2016094872号パンフレット(全体として参照により本明細書に援用される)に記載される。
誘導性ガイド
ガイドRNAは、誘導性システムの成分として作成することができる。このシステムの誘導可能な性質により、遺伝子編集又は遺伝子発現の時空間的制御が可能となる。一部の実施形態において、誘導性システムの刺激としては、例えば、電磁放射線、音響エネルギー、化学エネルギー、及び/又は熱エネルギーが挙げられる。
一部の実施形態において、ガイドRNAの転写は、誘導性プロモーター、例えば、テトラサイクリン又はドキシサイクリン制御下での転写活性化(Tet-On及びTet-Off発現システム)、ホルモン誘導性遺伝子発現システム(例えば、エクジソン誘導性遺伝子発現システム)、及びアラビノース誘導性遺伝子発現システムによって調節することができる。誘導性システムの他の例としては、例えば、小分子2ハイブリッド転写活性化システム(FKBP、ABA等)、光誘導性システム(フィトクロム、LOVドメイン、又はクリプトクロム)、又は光誘導性転写エフェクター(LITE)が挙げられる。これらの誘導性システムは、例えば、国際公開第2016205764号パンフレット及び米国特許第8795965号明細書(これらは両方ともに全体として参照により本明細書に援用される)に記載されている。
化学修飾
ガイドRNAのリン酸骨格、糖、及び/又は塩基に化学修飾を適用することができる。ホスホロチオエートなどの骨格修飾はリン酸骨格上の電荷を修飾し、オリゴヌクレオチドの送達及びヌクレアーゼ耐性に役立つ(例えば、Eckstein,“Phosphorothioates,essential components of therapeutic oligonucleotides,”Nucl.Acid Ther.,24(2014),pp.374-387を参照のこと);2’-O-メチル(2’-OMe)、2’-F、及びロックド核酸(LNA)などの糖修飾は、塩基対合及びヌクレアーゼ耐性の両方を亢進させる(例えば、Allerson et al.“Fully 2‘-modified oligonucleotide duplexes with improved in vitro potency and stability compared to unmodified small interfering RNA,”J.Med.Chem.,48.4(2005):901-904を参照のこと)。化学修飾塩基、とりわけ2-チオウリジン又はN6-メチルアデノシンなどは、より強い塩基対合又はより弱い塩基対合のいずれも可能にすることができる(例えば、Bramsen et al.,“Development of therapeutic-grade small interfering RNAs by chemical engineering”Front.Genet.,2012 Aug 20;3:154を参照のこと)。加えて、RNAは、蛍光色素、ポリエチレングリコール、又はタンパク質を含めた種々の機能性部分との5’末端及び3’末端の両方のコンジュゲーションに適している。
化学的に合成されるガイドRNA分子には、幅広い種類の修飾を適用することができる。例えば、オリゴヌクレオチドを2’-OMeで修飾してヌクレアーゼ耐性を改善すると、ワトソン・クリック塩基対合の結合エネルギーを変化させることができる。更には、2’-OMe修飾は、オリゴヌクレオチドがトランスフェクション試薬、タンパク質又は細胞中の任意の他の分子とどのように相互作用するかに影響を及ぼし得る。これらの修飾の効果は経験的試験によって決定することができる。
一部の実施形態において、ガイドRNAは1つ以上のホスホロチオエート修飾を含む。一部の実施形態において、ガイドRNAは、塩基対合を亢進させること及び/又はヌクレアーゼ耐性を増加させることを目的として1つ以上のロックド核酸を含む。
これらの化学修飾の概要については、例えば、Kelley et al.,“Versatility of chemically synthesized guide RNAs for CRISPR-Cas9 genome editing,”J.Biotechnol.2016 Sep 10;233:74-83;国際公開第2016205764号パンフレット;及び米国特許第8795965 B2号明細書(この各々が全体として参照により援用される)を参照することができる。
配列修飾
本明細書に記載されるガイドRNA、tracrRNA及びcrRNAの配列及び長さは最適化することができる。一部の実施形態において、ガイドRNAの最適化された長さは、プロセシングされた形態のtracrRNA及び/若しくはcrRNAを同定することによるか、又はcrRNAのRNAガイドについての経験的な長さ研究によって決定されてもよい。
ガイドRNAはまた、1つ以上のアプタマー配列も含むことができる。アプタマーは、特異的な標的分子に結合することのできるオリゴヌクレオチド又はペプチド分子である。アプタマーは、遺伝子エフェクター、遺伝子アクチベーター、又は遺伝子リプレッサーに特異的であってもよい。一部の実施形態において、アプタマーはタンパク質に特異的であり、次にはそのタンパク質が特異的遺伝子エフェクター、遺伝子アクチベーター、又は遺伝子リプレッサーに特異的であって、それを動員し/それに結合するものであってもよい。エフェクター、アクチベーター、又はリプレッサーは融合タンパク質の形態で存在することができる。一部の実施形態において、ガイドRNAは、同じアダプタータンパク質に特異的な2つ以上のアプタマー配列を有する。一部の実施形態において、2つ以上のアプタマー配列は異なるアダプタータンパク質に特異的である。アダプタータンパク質としては、例えば、MS2、PP7、Qβ、F2、GA、fr、JP501、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、φCb5、φCb8r、φCb12r、φCb23r、7s、及びPRR1を挙げることができる。従って、一部の実施形態において、アプタマーは、本明細書に記載されるとおりのアダプタータンパク質のうちのいずれか1つに特異的に結合する結合タンパク質から選択される。一部の実施形態において、アプタマー配列はMS2ループである。アプタマーの詳細な説明については、例えば、Nowak et al.,“Guide RNA engineering for versatile Cas9 functionality,”Nucl.Acid.Res.,2016 Nov 16;44(20):9555-9564;及び国際公開第2016205764号パンフレット(これらは全体として参照により本明細書に援用される)を参照することができる。
ガイド:標的配列一致要件
古典的CRISPRシステムでは、ガイド配列とその対応する標的配列との間の相補性の程度は、約50%、60%、75%、80%、85%、90%、95%、97.5%、99%、又は100%であってもよい。一部の実施形態において、相補性の程度は100%である。ガイドRNAは、約5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75ヌクレオチド長、又はそれ以上であってもよい。
オフターゲット相互作用を減少させるため、例えば、相補性が低い標的配列と相互作用するガイドを減少させるため、CRISPRシステムに突然変異を導入して、CRISPRシステムが標的配列と、80%、85%、90%、又は95%より高い相補性を有するオフターゲット配列との間を区別できるようにしてもよい。一部の実施形態において、相補性の程度は、80%~95%、例えば、約83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、又は95%である(例えば、18ヌクレオチドを有する標的と、1、2、又は3個のミスマッチを有する18ヌクレオチドのオフターゲットとの間を区別する)。従って、一部の実施形態において、ガイド配列とその対応する標的配列との間の相補性の程度は、94.5%、95%、95.5%、96%、96.5%、97%、97.5%、98%、98.5%、99%、99.5%、又は99.9%より高い。一部の実施形態において、相補性の程度は100%である。
当該分野では、機能性となるのに十分な相補性があるならば、完全な相補性は要件とならないことが公知である。スペーサー/標的に沿ったミスマッチの位置を含め、スペーサー配列と標的配列との間へのミスマッチ、例えば1個以上のミスマッチ、例えば1又は2個のミスマッチの導入により、切断効率の調節を生かすことができる。典型的には、ミスマッチ、例えば二重ミスマッチが中心寄りに位置するほど(即ち、3’末端又は5’末端にあるのでない);切断効率がより大きい影響を受ける。従って、スペーサー配列に沿ったミスマッチ位置の選択により、切断効率を調節することができる。例えば、標的の100%未満の切断が(例えば、細胞集団中で)所望される場合、スペーサー配列にスペーサーと標的配列との間の1又は2個のミスマッチを導入してもよい。
CRISPRシステムの使用方法
本明細書に記載されるCRISPRシステムには、非常に多数の細胞型における標的ポリヌクレオチドの修飾(例えば、欠失、挿入、転位、不活性化、又は活性化)を含め、多種多様な有用性がある。このCRISPRシステムは、例えば、DNA/RNA検出(例えば、特異的高感度酵素レポーターアンロッキング(specific high sensitivity enzymatic reporter unlocking:SHERLOCK))、核酸の追跡及び標識、エンリッチメントアッセイ(バックグラウンドからの所望の配列の抽出)、循環腫瘍DNAの検出、次世代ライブラリの調製、薬物スクリーニング、疾患診断及び予後判定、及び様々な遺伝的障害の治療において、幅広い範囲にわたる適用を有する。
別の態様において、本開示は、標的核酸のある部位におけるペイロード核酸の挿入又は切出しを標的化する方法を提供し、ここでこの方法は、本明細書に記載されるシステムのいずれかを標的核酸に接触させることを含む。
別の態様において、本開示は、DNA標的核酸の認識時に一本鎖DNAを非特異的に分解する方法を提供し、この方法は、本明細書に記載されるシステムのいずれかを標的核酸に接触させることを含む。
別の態様において、本開示は、試料中における標的核酸(例えば、DNA又はRNA)の検出方法を提供し、この方法は、本明細書に記載されるいずれかのシステム及び標識されたレポーター核酸を試料に接触させることであって、crRNAが標的核酸にハイブリダイズすると、標識されたレポーター核酸の切断が起こること、並びに標識されたレポーター核酸の切断によって生成される検出可能シグナルを測定することを含み、それにより試料中における標的核酸の存在を検出する。
更に別の態様において、本開示は、それを必要としている対象における病態又は疾患の治療方法を提供し、この方法は、本明細書に記載されるシステムのいずれかを対象に投与することを含み、ここでスペーサー配列は、病態又は疾患に関連する標的核酸の22~40ヌクレオチドと相補的であり;ここでCRISPR関連タンパク質はRNAガイドと会合して複合体を形成し;ここで複合体は、スペーサー配列のヌクレオチドと相補的な標的核酸配列に結合し;及びここで複合体が標的核酸配列に結合したことに応じて、CRISPR関連タンパク質が標的核酸を切断し、それにより対象の病態又は疾患を治療する。
一態様において、本開示は、それを必要としている対象における病態又は疾患の治療方法を提供し、この方法は、本明細書に記載されるシステムのいずれかを対象に投与することを含み、ここでスペーサー配列は、病態又は疾患に関連する標的核酸の17~44ヌクレオチドと相補的であり;ここでCRISPR関連タンパク質はRNAガイドと会合して複合体を形成し;ここで複合体は、スペーサー配列のヌクレオチドと相補的な標的核酸配列に結合し;及びここで複合体が標的核酸配列に結合したことに応じて、CRISPR関連タンパク質が標的核酸を切断し、それにより対象の病態又は疾患を治療する。
一態様において、本開示は、それを必要としている対象における病態又は疾患の治療方法を提供し、この方法は、本明細書に記載されるシステムのいずれかを対象に投与することを含み、ここでスペーサー配列は、病態又は疾患に関連する標的核酸の20~40ヌクレオチドと相補的であり;ここでCRISPR関連タンパク質はRNAガイドと会合して複合体を形成し;ここで複合体は、スペーサー配列のヌクレオチドと相補的な標的核酸配列に結合し;及びここで複合体が標的核酸配列に結合したことに応じて、CRISPR関連タンパク質が標的核酸を切断し、それにより対象の病態又は疾患を治療する。
別の態様において、本開示は、本明細書に開示されるシステムのいずれかを薬剤として使用するための方法を提供する(例えば、病態又は疾患の治療又は予防における使用のための)。
一部の実施形態において、病態又は疾患は、感染性疾患又は癌(例えば、ウィルムス腫瘍、ユーイング肉腫、神経内分泌腫瘍、膠芽腫、神経芽細胞腫、黒色腫、皮膚癌、乳癌、結腸癌、直腸癌、前立腺癌、肝癌、腎癌、膵癌、肺癌、胆道癌、子宮頸癌、子宮内膜癌、食道癌、胃癌、頭頸部癌、甲状腺髄様癌、卵巣癌、神経膠腫、リンパ腫、白血病、骨髄腫、急性リンパ芽球性白血病、急性骨髄性白血病、慢性リンパ球性白血病、慢性骨髄球性白血病、ホジキンリンパ腫、非ホジキンリンパ腫、又は膀胱癌)である。
更に別の態様において、本開示は、標的核酸を編集する方法(例えば、インビトロ又はエクスビボの方法)、例えば、標的核酸のターゲティング及び編集方法;DNA標的核酸の認識に応じた一本鎖DNAの非特異的分解方法;二本鎖標的DNAのスペーサー相補鎖の認識に応じた前記二本鎖標的DNAの非スペーサー相補鎖のターゲティング及びニッキング方法;二本鎖標的DNAのターゲティング及び切断方法;試料中の標的核酸の検出方法;二本鎖核酸の特異的編集方法;二本鎖核酸の塩基編集方法;細胞における遺伝子型特異的又は転写状態特異的細胞死又は休眠の誘導方法;二本鎖標的DNAにおけるインデルの作成方法;二本鎖標的DNAへの配列の挿入方法、又は二本鎖標的DNAにおける配列の欠失又は逆位形成方法において、本明細書に開示されるシステムのいずれかを使用するための方法を提供する。
DNA/RNA検出
一態様において、本明細書に記載されるCRISPRシステムは、DNA/RNA検出において使用することができる。シングルエフェクターRNA誘導型DNアーゼをCRISPR RNA(crRNA)で再プログラム化することにより、特異的一本鎖DNA(ssDNA)センシング用のプラットフォームがもたらされ得る。そのDNA標的の認識時、活性化したV型単一エフェクターDNAガイドDNaseは、近隣非標的ssDNAの「コラテラル」切断に関与する。このcrRNAによってプログラム化されるコラテラル切断活性により、CRISPRシステムが特異的DNAの存在を標識ssDNAの非特異的分解によって検出することが可能となる。
DNA検出適用においては、コラテラルssDNA活性をレポーターと組み合わせることができ、例えば、DNAエンドヌクレアーゼ標的化CRISPRトランスレポーター(DNA Endonuclease-Targeted CRISPR trans reporter:DETECTR)法と呼ばれる方法などであり、これは、アトモル濃度のDNA検出感度を実現する(例えば、Chen et al.,Science,360(6387):436-439,2018を参照のこと)(これは全体として参照により本明細書に援用される)。本明細書に記載される酵素を使用する一つの適用は、インビトロ環境における非特異的ssDNAの分解である。フルオロフォア及び消光剤に連結した「レポーター」ssDNA分子もまた、未知のDNA試料(一本鎖又は二本鎖のいずれか)と共にこのインビトロシステムに加えることができる。未知のDNA片中に標的配列を認識すると、このエフェクター複合体がレポーターssDNAを切断し、蛍光リードアウトが生じる。
他の実施形態において、SHERLOCK法(特異的高感度酵素レポーターアンロッキング(Specific High Sensitivity Enzymatic Reporter UnLOCKing))もまた、核酸増幅及びレポーターssDNAのコラテラル切断に基づいたアトモル濃度(又は単一分子)感度のインビトロ核酸検出プラットフォームを提供し、標的のリアルタイム検出を可能にする。SHERLOCKにおけるCRISPRの使用方法については、例えば、Gootenberg,et al.“Nucleic acid detection with CRISPR-Cas13a/C2c2,”Science,356(6336):438-442(2017)(これは全体として参照により本明細書に援用される)に詳細に記載される。
一部の実施形態において、本明細書に記載されるCRISPRシステムは、マルチプレックス化したエラーロバストな蛍光インサイチュハイブリダイゼーション(multiplexed error-robust fluorescence in situ hybridization:MERFISH)において使用することができる。こうした方法については、例えば、Chen et al.,“Spatially resolved,highly multiplexed RNA profiling in single cells,”Science,2015 Apr 24;348(6233):aaa6090(これは全体として参照により本明細書に援用される)に記載されている。
核酸の追跡及び標識
細胞過程は、タンパク質、RNA、及びDNAの間での分子相互作用網に依存する。タンパク質-DNA及びタンパク質-RNA相互作用の正確な検出は、かかる過程を理解する鍵である。インビトロ近接性標識技法は、レポーター基、例えば光活性化可能な基と組み合わせたアフィニティータグを用いることにより、インビトロで目的のタンパク質又はRNAの近くにあるポリペプチド及びRNAを標識する。紫外線照射後、光活性化可能な基がタグ付加分子にごく近接したタンパク質及び他の分子と反応し、それによってそれらを標識する。標識された相互作用分子は、続いて回収し、同定することができる。このRNAターゲティングエフェクタータンパク質を使用して、例えば、プローブを選択のRNA配列に標的化することができる。こうした適用はまた、動物モデルにおいても疾患又は培養が困難な細胞型のインビボイメージングに適用することができる。核酸の追跡及び標識方法については、例えば、米国特許第8795965号明細書;国際公開第2016205764号パンフレット;及び国際公開第2017070605号パンフレット(これらの各々は、本明細書において全体として参照により援用される)に記載されている。
ハイスループットスクリーニング
本明細書に記載されるCRISPRシステムは、次世代シーケンシング(NGS)ライブラリの調製に使用することができる。例えば、費用対効果の高いNGSライブラリを作成するため、CRISPRシステムを使用して標的遺伝子のコード配列を破壊することができ、同時に次世代シーケンシングによって(例えば、Ion Torrent PGMシステムで)、CRISPR酵素がトランスフェクトされたクローンをスクリーニングすることができる。NGSライブラリの調製方法に関する詳細な説明については、例えば、Bell et al.,“A high-throughput screening strategy for detecting CRISPR-Cas9 induced mutations using next-generation sequencing,”BMC Genomics,15.1(2014):1002(これは全体として参照により本明細書に援用される)を参照することができる。
エンジニアリングされた微生物
微生物(例えば、大腸菌(E.coli)、酵母、及び微細藻類)は、合成生物学に広く用いられている。合成生物学の発展には、様々な臨床応用を含め、幅広い有用性がある。例えば、プログラム可能なCRISPRシステムを使用して、例えば癌関連RNAを標的転写物として用いる標的化した細胞死のため、毒性ドメインのタンパク質を分割することができる。更に、例えばキナーゼ又は酵素などの適切なエフェクターとの融合複合体により、合成生物系においてタンパク質間相互作用が関わる経路に影響を及ぼすことができる。
一部の実施形態において、ファージ配列を標的化するガイドRNA配列を微生物に導入することができる。従って、本開示はまた、微生物(例えば産生菌株)にファージ感染に対するワクチンを接種する方法も提供する。
一部の実施形態において、本明細書に提供されるCRISPRシステムを使用して微生物をエンジニアリングすることにより、例えば、収率を改善し又は発酵効率を改善することができる。例えば、本明細書に記載されるCRISPRシステムを使用して酵母などの微生物をエンジニアリングすることにより、発酵性糖からバイオ燃料若しくはバイオポリマーを生成し、又は発酵性糖源としての農業廃棄物に由来する植物由来のリグノセルロースを分解することができる。より詳細には、本明細書に記載される方法を使用して、バイオ燃料生産に必要な内因性遺伝子の発現を修飾し、及び/又はバイオ燃料合成を妨げ得る内因性遺伝子を修飾することができる。これらの微生物エンジニアリング方法については、例えば、Verwaal et al.,“CRISPR/Cpf1 enables fast and simple genome editing of Saccharomyces cerevisiae,”Yeast,2017 Sep 8.doi:10.1002/yea.3278;及びHlavova et al.,“Improving microalgae for biotechnology-from genetics to synthetic biology,”Biotechnol.Adv.,2015 Nov 1;33:1194-203(これらは両方ともに全体として参照により本明細書に援用される)に記載されている。
植物における適用
本明細書に記載されるCRISPRシステムは、植物において幅広い種類の有用性がある。一部の実施形態において、CRISPRシステムを使用して植物のゲノムをエンジニアリングすることができる(例えば、生産を向上させる、所望の翻訳後修飾を有する生産品にする、又は工業製品を生産するための遺伝子を導入する)。一部の実施形態において、CRISPRシステムを使用して、植物に所望の形質を(例えば、ゲノムに対する遺伝性修飾を伴い又は伴わず)導入し、又は植物細胞若しくは全植物における内因性遺伝子の発現を調節することができる。
一部の実施形態において、本CRISPRシステムを使用して、特異的タンパク質、例えば、アレルゲンタンパク質(例えば、ピーナッツ、ダイズ、レンズマメ、エンドウマメ、サヤマメ、及びヤエナリ中のアレルゲンタンパク質)をコードする遺伝子を同定、編集、及び/又はサイレンシングすることができる。タンパク質をコードする遺伝子を同定、編集、及び/又はサイレンシングする方法に関する詳細な説明については、例えば、Nicolaou et al.,“Molecular diagnosis of peanut and legume allergy,”Curr.Opin.Allergy Clin.Immunol.,11(3):222-8(2011)、及び国際公開第2016205764 A1号パンフレット(これらは両方ともに全体として参照により本明細書に援用される)に記載されている。
遺伝子ドライブ
遺伝子ドライブは、特定の遺伝子又は遺伝子群の遺伝形質に有利な偏りが出る現象である。本明細書に記載されるCRISPRシステムを使用して遺伝子ドライブを構築することができる。例えば、遺伝子の特定のアレルを標的化して破壊することにより、細胞に第2のアレルをコピーさせて配列を固定するようにCRISPRシステムを設計することができる。このコピーのため、第1のアレルが第2のアレルに変換されることになり、子孫に第2のアレルが遺伝する可能性が高くなる。どのように本明細書に記載されるCRISPRシステムを使用して遺伝子ドライブを構築するかに関する詳細な方法については、例えば、Hammond et al.,“A CRISPR-Cas9 gene drive system targeting female reproduction in the malaria mosquito vector Anopheles gambiae,”Nat.Biotechnol.,2016 Jan;34(1):78-83(これは全体として参照により本明細書に援用される)に記載されている。
プール型スクリーニング
本明細書に記載されるとおり、プール型CRISPRスクリーニングは、細胞増殖、薬剤耐性、及びウイルス感染などの生物学的機構に関与する遺伝子を同定するための強力なツールである。細胞がバルクで本明細書に記載されるガイドRNA(gRNA)コードベクターのライブラリによって形質導入され、選択的チャレンジの適用前及び適用後にgRNAの分布が測定される。プール型CRISPRスクリーンは、細胞生存及び増殖に影響を及ぼす機構に対して良好に機能し、個々の遺伝子の活性の測定にまで(例えば、エンジニアリングされたレポーター細胞株を使用することにより)拡張することができる。一度に1つの遺伝子のみが標的化されるアレイ化されたCRISPRスクリーンでは、RNA-seqをリードアウトとして使用することが可能になる。一部の実施形態において、本明細書に記載されるとおりのCRISPRシステムは単一細胞CRISPRスクリーンに使用することができる。プール型CRISPRスクリーニングに関する詳細な説明については、例えば、Datlinger et al.,“Pooled CRISPR screening with single-cell transcriptome read-out,”Nat.Methods.,2017 Mar;14(3):297-301(これは全体として参照により本明細書に援用される)を参照することができる。
飽和突然変異誘発(「バッシング(bashing)」)
本明細書に記載されるCRISPRシステムはインサイチュー飽和突然変異誘発に使用することができる。一部の実施形態では、プール型ガイドRNAライブラリを使用して、特定の遺伝子又は調節エレメントに関するインサイチュー飽和突然変異誘発を実施することができる。かかる方法では、決定的な最小の特徴及びそれらの遺伝子又は調節エレメント(例えば、エンハンサー)の個別的な脆弱性を明らかにすることができる。これらの方法については、例えば、Canver et al.,“BCL11A enhancer dissection by Cas9-mediated in situ saturating mutagenesis,”Nature,2015 Nov 12;527(7577):192-7(これは全体として参照により本明細書に援用される)に記載されている。
治療上の適用
本明細書に記載されるCRISPRシステムは、様々な治療上の適用を有し得る。一部の実施形態において、新規CRISPRシステムは、様々な疾患及び障害、例えば、遺伝性障害(例えば、単一遺伝子疾患)、ヌクレアーゼ活性によって治療することができる疾患(例えば、Pcsk9ターゲティング、デュシェンヌ型筋ジストロフィー(DMD)、BCL11aターゲティング)を治療するために使用することができる。
一部の実施形態において、本明細書に記載される方法は、対象、例えば、ヒト患者などの哺乳類の治療に用いられる。哺乳類対象はまた、イヌ、ネコ、ウマ、サル、ウサギ、ラット、マウス、雌ウシ、ヤギ、又はヒツジなど、家畜化された哺乳類であってもよい。
本明細書に記載される治療法の一部において、病態又は疾患は、嚢胞性線維症、デュシェンヌ型筋ジストロフィー、ベッカー型筋ジストロフィー、α1-アンチトリプシン欠乏症、ポンペ病、筋強直性ジストロフィー、ハンチントン病、脆弱X症候群、フリードライヒ失調症、筋萎縮性側索硬化症、前頭側頭型認知症、遺伝性慢性腎疾患、高脂血症、高コレステロール血症、レーベル先天黒内障、鎌状赤血球症、及びβサラセミアからなる群から選択される。
本明細書に記載される方法(及びかかる方法における使用のための組成物)の一部の実施形態において、病態又は疾患は癌又は感染性疾患である。
一部の実施形態において、病態又は疾患は癌であり、ここで癌は、ウィルムス腫瘍、ユーイング肉腫、神経内分泌腫瘍、膠芽腫、神経芽細胞腫、黒色腫、皮膚癌、乳癌、結腸癌、直腸癌、前立腺癌、肝癌、腎癌、膵癌、肺癌、胆道癌、子宮頸癌、子宮内膜癌、食道癌、胃癌、頭頸部癌、甲状腺髄様癌、卵巣癌、神経膠腫、リンパ腫、白血病、骨髄腫、急性リンパ芽球性白血病、急性骨髄性白血病、慢性リンパ球性白血病、慢性骨髄球性白血病、ホジキンリンパ腫、非ホジキンリンパ腫、及び膀胱癌からなる群から選択される。
別の態様において、本開示は、RNA配列特異的干渉;RNA配列特異的遺伝子調節;RNA、RNA産物、lncRNA、非コードRNA、核RNA、又はmRNAのスクリーニング;突然変異誘発;RNAスプライシングの阻害;蛍光インサイチュハイブリダイゼーション;育種;細胞休眠の誘導;細胞周期停止の誘導;細胞成長及び/又は細胞増殖の減少;細胞アネルギーの誘導;細胞アポトーシスの誘導;細胞壊死の誘導;細胞死の誘導;又はプログラムされた細胞死の誘導からなる群から選択される方法における本明細書に記載されるシステムの使用を提供する。
この方法は、病態又は疾患が感染性であることを含んでもよく、ここで感染性病原体は、ヒト免疫不全ウイルス(HIV)、単純ヘルペスウイルス1型(HSV1)、及び単純ヘルペスウイルス2型(HSV2)からなる群から選択される。
一部の実施形態において、本明細書に記載されるCRISPRシステムを使用して、標的核酸を編集して、標的核酸を修飾することができる(例えば、1つ以上のアミノ酸残基を挿入、欠失、又は変異させることによって)。例えば、一部の実施形態において、本明細書に記載されるCRISPRシステムは、望ましい核酸配列を含む外因性ドナー鋳型核酸(例えば、DNA分子又はRNA分子)を含む。本明細書に記載されるCRISPRシステムで誘導される切断イベントの分解時に、細胞の分子機構は、切断イベントを修復及び/又は分解する際に、外因性ドナー鋳型核酸を利用するであろう。或いは、細胞の分子機構は、切断イベントを修復及び/又は分解する際に、内因性鋳型を利用することができる。一部の実施形態において、本明細書に記載されるCRISPRシステムは、挿入、欠失、及び/又は点突然変異を生じる標的核酸を改変するために使用され得る。一部の実施形態において、挿入は、傷のない挿入である(すなわち、標的核酸への意図された核酸配列の挿入は、切断イベントの分解時に追加の意図されない核酸配列を生じない)。ドナー鋳型核酸は、二本鎖又は一本鎖核酸分子(例えば、DNA又はRNA)であってもよい。外因性ドナー鋳型核酸の設計方法については、例えば、国際公開第2016094874 A1号パンフレット(この内容全体が参照により本明細書に明示的に援用される)に記載されている。
一態様において、本明細書に記載されるCRISPRシステムは、RNA、毒性RNA、及び/又は変異RNA(例えば、スプライシング欠陥又はトランケーション)の過剰発現によって引き起こされる疾患を治療するために使用することができる。例えば、有毒なRNAの発現は、核封入体の形成及び脳、心臓、又は骨格筋の遅発性変性変化に関連し得る。一部の実施形態において、障害は筋強直性ジストロフィーである。筋緊張性ジストロフィーにおいて、有毒なRNAの主な病原性効果は、結合タンパク質を隔離し、選択的スプライシングの調節を損なうことである(例えば、Osborne et al.,“RNA-dominant diseases,” Hum.Mol.Genet.,2009 Apr 15;18(8):1471-81を参照)。筋強直性ジストロフィー(dystrophia myotonica(DM))は、極めて広範囲の臨床的特徴を生じるため、遺伝学者にとって特に興味深いものである。現在DM1型(DM1)と呼ばれている古典的な形態のDMは、細胞質ゾルプロテインキナーゼをコードする遺伝子であるDMPKの3’非翻訳領域(UTR)におけるCTGリピートの拡大によって引き起こされる。本明細書に記載されるCRISPRシステムは、過剰発現されたRNA又は毒性RNA、例えば、DMPK遺伝子、又はDM1骨格筋、心臓、又は脳において誤調節された選択的スプライシングのいずれかを標的とすることができる。
本明細書に記載されるCRISPRシステムは、プラダー・ウィリ症候群、脊髄性筋萎縮症(SMA)、先天性角化異常症などの様々な疾患を引き起こすRNA依存性機能に影響を与えるトランス作用性変異を標的とすることもできる。本明細書に記載されるCRISPRシステムを使用して治療できる疾患のリストは、Cooper et al.,“RNA and disease,” Cell,136.4(2009):777-793及び国際公開第2016205764 A1号パンフレットに要約される(これらは両方ともに全体として参照により本明細書に援用される)。当業者であれば、これらの疾患を治療するために新規CRISPRシステムを使用する方法を理解するであろう。
本明細書に記載されるCRISPRシステムは、例えば、原発性加齢性タウオパチー(PART)/神経原線維変化(NFT)優勢老人性認知症(アルツハイマー病(AD)で見られるものと同様のNFTを伴うが、プラークを伴わない)、ボクシング認知症(慢性外傷性脳症)、及び進行性核上性麻痺などの原発性及び続発性タウオパチーを含む、様々なタウオパチーの治療にも使用できる。タウオパチー及びこれらの疾患を治療する方法の有用なリストは、例えば、国際公開第2016205764号パンフレット(本明細書において全体として参照により援用される)に記載されている。
本明細書に記載されるCRISPRシステムは、スプライシングの欠陥及び疾患を引き起こし得るシス作用性スプライシングコードを破壊する変異を標的化するためにも使用できる。これらの疾患としては、例えば、SMN1遺伝子の欠失に起因する運動ニューロン変性疾患(例えば、脊髄性筋萎縮症)、デュシェンヌ型筋ジストロフィー(DMD)、前頭側頭型認知症、及び第17染色体に関連するパーキンソニズム(FTDP-17)、及び嚢胞性線維症が挙げられる。
本明細書に記載されるCRISPRシステムは、特にRNAウイルスに対する抗ウイルス活性のために更に使用することができる。エフェクタータンパク質は、ウイルスRNA配列を標的化するために選択された適切なガイドRNAを使用してウイルスRNAを標的化することができる。
更に、インビトロRNAセンシングアッセイを使用して特定のRNA基質を検出することができる。RNAターゲティングエフェクタータンパク質は、生細胞でのRNAベースのセンシングに使用できる。適用例は、例えば、疾患特異的RNAのセンシングによる診断である。
本明細書に記載されるCRISPRシステムの治療用途の詳細な説明は、例えば、米国特許第8795965号明細書、欧州特許第3009511号明細書、国際公開第2016205764号パンフレット、及び国際公開第2017070605号パンフレット(これらの各々は、本明細書において全体として参照により援用される)に見出すことができる。
CRISPRシステムの送達
本開示及び当技術分野の知識を通じて、本明細書に記載されるCRISPRシステム、又はその成分、その核酸分子、又はその成分をコードする若しくは提供する核酸分子は、ベクター、例えば、プラスミド、ウイルス送達ベクターなどの様々な送達システムによって送達することができる。新規CRISPR酵素及び/又はいずれかのRNA(例えば、ガイドRNA)は、適切なベクター、例えば、プラスミド、又はアデノ随伴ウイルス(AAV)、レンチウイルス、アデノウイルス、及び他のウイルスベクターなどのウイルスベクター、又はそれらの組み合わせを使用して送達することができる。タンパク質及び1つ以上のガイドRNAは、1つ以上のベクター、例えばプラスミド又はウイルスベクターにパッケージングすることができる。
一部の実施形態において、ベクター、例えばプラスミド又はウイルスベクターは、例えば、筋肉内注射、静脈内投与、経皮投与、鼻腔内投与、経口投与、又は粘膜投与によって目的の組織に送達される。かかる送達は、単回用量又は複数回用量のいずれによるものであってもよい。当業者は、本明細書において実際に送達される投薬量が、ベクターの選択、標的細胞、生物、組織、治療対象の全般的な状態、求められる形質転換/修飾の程度、投与経路、投与様式、求められる形質転換/修飾の種類など、種々の要因に応じて大きく異なり得ることを理解する。
特定の実施形態において、送達は、アデノウイルスによるものであり、これは少なくとも1×10粒子(粒子単位、puとも称される)のアデノウイルスを含有する単回用量におけるものであることができる。一部の実施形態において、好ましくは用量は少なくとも約1×10粒子、少なくとも約1×10粒子、少なくとも約1×10粒子、及び少なくとも約1×10粒子のアデノウイルスである。送達方法及び用量については、例えば、国際公開第2016205764A1号パンフレット及び米国特許第8,454,972B2号明細書(これらは両方ともに全体として参照により本明細書に援用される)に記載されている。
一部の実施形態において、送達はプラスミドによるものである。投薬量は、応答を引き出すのに十分な数のプラスミドであり得る。ある場合には、プラスミド組成物中のプラスミドDNAの好適な分量は、約0.1~約2mgであってもよい。プラスミドは概して、(i)プロモーター;(ii)プロモーターに作動可能に連結された、核酸ターゲティングCRISPR酵素をコードする配列;(iii)選択可能マーカー;(iv)複製起点;及び(v)(ii)の下流にある且つそれに作動可能に連結された転写ターミネーターを含むことになる。プラスミドはまた、CRISPR複合体のRNA成分もコードすることができるが、代わりに、これらのうちの1つ以上が異なるベクターにコードされてもよい。投与頻度は、医学又は獣医学の実践者(例えば、医師、獣医師)、又は当業者の範囲内にある。
別の実施形態において、送達はリポソーム又はリポフェクチン製剤などによるものであり、当業者に公知の方法によって調製することができる。かかる方法については、例えば、国際公開第2016205764号パンフレット及び米国特許第5,593,972号明細書;同第5,589,466号明細書;及び同第5,580,859号明細書(これらの各々は、本明細書において全体として参照により援用される)に記載されている。
一部の実施形態において、送達はナノ粒子又はエキソソームによるものである。例えば、エキソソームはRNA送達に特に有用であることが示されている。
この新規CRISPRシステムの1つ以上の成分を細胞に導入する更なる手段は、細胞透過性ペプチド(CPP)の使用によるものである。一部の実施形態では、細胞透過性ペプチドがCRISPR酵素に連結される。一部の実施形態では、CRISPR酵素及び/又はガイドRNAが1つ以上のCPPとカップリングされ、それらを細胞内部へと有効に輸送する(例えば、植物プロトプラスト)。一部の実施形態では、CRISPR酵素及び/又は1つ又は複数のガイドRNAが、細胞送達のため1つ以上のCPPにカップリングされている1つ以上の環状又は非環状DNA分子によってコードされる。
CPPは、生体分子を受容体非依存的に細胞膜を越えて輸送する能力を有するタンパク質又はキメラ配列のいずれかに由来する35アミノ酸未満の短鎖ペプチドである。CPPは、カチオン性ペプチド、疎水性配列を有するペプチド、両親媒性ペプチド、プロリンリッチな抗微生物配列を有するペプチド、及びキメラ又は双節型ペプチドであってもよい。CPPの例としては、例えば、Tat(これはHIV 1型によるウイルス複製に必要な核転写活性化因子タンパク質である)、ペネトラチン、カポジ線維芽細胞成長因子(FGF)シグナルペプチド配列、インテグリンβ3シグナルペプチド配列、ポリアルギニンペプチドArg配列、グアニンリッチ分子輸送体、及びスイートアローペプチドが挙げられる。CPP及びその使用方法については、例えば、Haellbrink et al.,“Prediction of cell-penetrating peptides,”Methods Mol.Biol.,2015;1324:39-58;Ramakrishna et al.,“Gene disruption by cell-penetrating peptide-mediated delivery of Cas9 protein and guide RNA,”Genome Res.,2014 Jun;24(6):1020-7;及び国際公開第2016205764 A1号パンフレット(これらの各々は、本明細書において全体として参照により援用される)に記載されている。
本明細書に記載されるCRISPRシステムのための様々な送達方法はまた、例えば、米国特許第8795965号明細書、欧州特許第3009511号明細書、国際公開第2016205764号パンフレット、及び国際公開第2017070605号パンフレット(これらの各々は、本明細書において全体として参照により援用される)にも記載されている。
以下の例に本発明を更に記載するが、これらの例は、特許請求の範囲に記載される本発明の範囲を限定するものではない。
実施例1:CLUST.121143CRISPR-Casシステムの最小成分の同定(図1~図4)
このタンパク質ファミリーは、淡水環境から採取された無培養のメタゲノム配列に見られるCRISPRシステムに関連する大型のシングルエフェクターを表す(図3)。CLUST.121143エフェクターには、下記表1及び表2に詳説するタンパク質の例が含まれる。これらのシステムのダイレクトリピート配列の例を表3に示す。
このエフェクター複合体を含む天然に存在する遺伝子座の例が図1に示され、CLUST.121143遺伝子座の場合、エフェクタータンパク質がCRISPRアレイと共出現することを示す。
エフェクタータンパク質又はCRISPRアレイと共出現する双方向の15kbウィンドウ内で、他の大きなタンパク質ファミリーは同定されなかった。
CLUST.121143のダイレクトリピート配列は、3’末端の近位にある5’-TGCAAAAG-3’又は5’-TTTCAAAG-4 ’の保存されたモチーフを呈する(図2)。
図3は、CLUST.121143エフェクターの系統樹の概略表現であり、ファミリーが配列多様性を呈することを示す。
図4は、CLUST.121143エフェクタータンパク質の多重配列アラインメントの概略表現であり、RuvCドメインの保存されている触媒残基の位置を明らかにし、マゼンタ、ブルー、及びレッドの色で図示される。
・任意選択で、本明細書に記載されるCLUST.121143 CRISPRシステムは、表4に詳述されるDR相同性を有するトランス活性化RNA(tracrRNA)及び表5に詳述されるDR相同性遺伝子座に含まれる完全なtracrRNAを含む。任意選択で、システムは、表6に掲載される非コード配列のサブセットであるtracrRNAを含む。
・任意選択で、本明細書に記載されるCLUST.121143 CRISPRシステムは、表6に掲載される非コード配列(又はその断片)によってコードされるRNAモジュレーターを含む。
Figure 2022538789000002
Figure 2022538789000003
Figure 2022538789000004
Figure 2022538789000005
Figure 2022538789000006
Figure 2022538789000007
Figure 2022538789000008
Figure 2022538789000009
Figure 2022538789000010
Figure 2022538789000011
Figure 2022538789000012
Figure 2022538789000013
Figure 2022538789000014
Figure 2022538789000015
Figure 2022538789000016
Figure 2022538789000017
Figure 2022538789000018
Figure 2022538789000019
Figure 2022538789000020
Figure 2022538789000021
実施例2-トランス活性化RNAエレメントの同定
エフェクタータンパク質及びcrRNAに加えて、本明細書に記載されるいくつかのCRISPRシステムはまた、トランス活性化RNA(tracrRNA)と呼ばれるロバストな酵素活性を活性化する更なるスモールRNAを含み得る。このようなtracrRNAには、典型的には、crRNAにハイブリダイズする相補的な領域が含まれる。crRNA-tracrRNAハイブリッドは、エフェクターと複合体を形成し、プログラム可能な酵素活性の活性化を生じる。
TracrRNA配列は、CRISPRアレイに隣接するゲノム配列で、crRNAのダイレクトリピート部分に相同な短い配列モチーフを検索するにより同定できる。検索方法は、完全なダイレクトリピート(DR)又はDR部分配列の正確な又は縮重した配列一致を含む。例えば、長さnヌクレオチドのDRは、オーバーラップする6~10ntのkmerのセットに分解できる。これらのkmerは、CRISPR遺伝子座に隣接する配列にアラインメントでき、1つ以上のkmerアラインメントを有する相同領域は、tracrRNAとしての実験的検証のためのDR相同領域として同定できる。或いは、RNAコフォールドの自由エネルギーは、CRISPRシステムのエレメントに隣接するゲノム配列からの完全なDR又はDR部分配列及び短いkmer配列について計算することができる。低い最小自由エネルギー構造を有する隣接配列エレメントは、tracrRNAとしての実験的検証のためのDR相同性領域として同定できる。
tracrRNAエレメントは、CRISPR関連遺伝子又はCRISPRアレイにごく近接した範囲内で頻繁に発生する。DR相同性領域を検索してtracrRNAエレメントを同定することの代替として、CRISPR関連タンパク質又はCRISPRアレイに隣接する非コード配列を、tracrRNAの直接実験的検証のためのクローニング又は遺伝子合成によって単離することができる。
tracrRNAエレメントの実験的検証は、CRISPRシステムの宿主生物のスモールRNA配列、又は非天然種で異種発現された合成配列を使用して実施できる。元のゲノム遺伝子座からのスモールRNA配列をアラインメントすることで、完全なtracrRNAエレメントに典型的なDR相同領域及びステロタイプ(sterotyped)プロセシングを含む発現RNA産物を同定できる。
RNAシーケンシングによって同定される完全なtracrRNA候補は、tracrRNA候補を伴い又は伴わずcrRNA及びエフェクターを発現し、エフェクター酵素活性の活性化をモニタリングすることにより、インビトロ又はインビボで検証できる。
エンジニアリングされた構築物において、tracrRNAの発現は、哺乳動物細胞での発現のためのU6、U1、及びH1プロモーター又は細菌での発現のためのJ23119プロモーターを含むがこれらに限定されないプロモーターによってドライブされる。
一部の例では、tracrRNAをcrRNAと融合させ、単一のガイドRNAとして発現させることができる。
実施例3-酵素活性の新規RNAモジュレーターの同定
エフェクタータンパク質及びcrRNAに加えて、本明細書に記載されるいくつかのCRISPRシステムはまた、本明細書においてRNAモジュレーターと呼ばれる、エフェクター活性を活性化又は調節するための更なるスモールRNAを含み得る。
RNAモジュレーターは、CRISPR関連遺伝子又はCRISPRアレイにごく近接した範囲内で発生すると予想される。RNAモジュレーターを同定及び検証するために、CRISPR関連タンパク質又はCRISPRアレイに隣接する非コード配列を、直接実験的検証のためのクローニング又は遺伝子合成によって単離することができる。
RNAモジュレーターの実験的検証は、CRISPRシステムの宿主生物のスモールRNA配列、又は非天然種で異種発現された合成配列を使用して実施できる。スモールRNA配列を元のゲノム遺伝子座にアラインメントすることで、DR相同領域及びステロタイプ(sterotyped)プロセシングを含む発現RNA産物を同定できる。
RNAシーケンシングによって同定されるRNAモジュレーター候補は、RNAモジュレーター候補を伴い又は伴わずcrRNA及びエフェクターを発現し、エフェクター酵素活性の変化をモニタリングすることにより、インビトロ又はインビボで検証できる。
エンジニアリングされた構築物において、RNAモジュレーターは、哺乳動物細胞での発現のためのU6、U1、及びH1プロモーター又は細菌での発現のためのJ23119プロモーターを含むプロモーターによってドライブされる。
一部の例では、RNAモジュレーターをcrRNA、tracrRNA、又はその両方と人工的に融合させ、単一のRNAエレメントとして発現させることができる。
実施例4-エンジニアリングされたCLUST.121143 CRISPR-Casシステムの機能検証(図5~図8)
本発明者らは、CLUST.121143 CRISPR-Casシステムの最小成分を特定した後、3300014839と称されるメタゲノムソースから機能検証用に1つの遺伝子座を選択した。
DNA合成及びエフェクターライブラリクローニング
本発明者らは、例示的なCLUST.121143 CRISPR-Casシステムの活性を試験するために、pET28a(+)ベクターを含むシステムを設計及び合成した。簡潔に言えば、CLUST.121143 3300014839エフェクターをコードする大腸菌(E.coli)コドン最適化核酸配列(表2に提供されるアミノ酸配列)を合成し(Genscript)、pET-28a(+)(EMD-Millipore)に由来するカスタム発現システムにクローニングした。ベクターは、lacプロモーター及び大腸菌(E.coli)リボソーム結合配列の制御下にあるCLUST.121143 3300014839エフェクタータンパク質をコードする核酸を含んでいた。ベクターはまた、CLUST.121143 3300014839エフェクターのオープンリーディングフレームに続くJ23119プロモーターによってドライブされるCRISPRアレイライブラリのアクセプター部位も含んでいた。
本発明者らは、「リピート-スペーサー-リピート」配列を含むオリゴヌクレオチドライブラリ合成(OLS)プールを計算的に設計した。ここで、「リピート」は、エフェクターに関連するCRISPRアレイに見られるコンセンサスダイレクトリピート配列に相当し、「スペーサー」は、pACYC184プラスミド及び大腸菌(E.coli)必須遺伝子をタイリング(tiling)する配列に相当する。スペーサー長さは、内因性CRISPRアレイに見られるスペーサー長さの最頻値によって決定した。リピート-スペーサー-リピート配列には、前述のCRISPRアレイライブラリアクセプター部位、及びより大規模なプールからの特異的リピート-スペーサー-リピートライブラリの特定の増幅を実現するユニークなPCRプライミング部位への断片の双方向クローニングを実現する、制限部位が付加された。
次に、Golden Gateアセンブリ法を使用して、リピート-スペーサー-リピートライブラリをプラスミドにクローニングした。簡潔に言えば、本発明者らは初めに、ユニークなPCRプライマーを使用してOLSプール(Agilent Genomics)から各リピート-スペーサー-リピートを増幅し、BsaIを使用してプラスミド骨格を事前に線形化して、潜在的バックグラウンドを低減した両方のDNA断片は、Golden Gateアセンブリマスターミックス(New England Biolabs)に添加する前に、Ampure XP(Beckman Coulter)で精製し、製造者の指示に従ってインキュベートした。本発明者らは、Golden Gate反応物を更に精製及び濃縮して、細菌スクリーニングの後続のステップで最大の形質転換効率を実現した。
異なるリピート-スペーサー-リピートエレメントとCasタンパク質とを含むプラスミドライブラリを、Lucigenが推奨するプロトコルに従ってGene Pulser Xcell(登録商標)(Bio-rad)を使用してE.CloniエレクトロコンピテントなE.coli(Lucigen)に電気穿孔した。ライブラリを、精製pACYC184プラスミドで共形質転換するか、又はpACYC184を含むE.Cloniエレクトロコンピテントな大腸菌(E.coli)(Lucigen)に直接形質転換し、BioAssay(登録商標)ディッシュ(Thermo Fisher)のクロラムフェニコール(Fisher)、テトラサイクリン(Alfa Aesar)、カナマイシン(Alfa Aesar)を含む寒天培地に播種し、37℃で10~12時間インキュベートした。近似コロニー数を推定して細菌プレート上に十分なライブラリ提示を確保した後、細菌を回収し、QIAprep Spin Miniprep(登録商標)キット(Qiagen)を使用してプラスミドDNAを抽出し、「出力ライブラリ」を作成した。Illuminaシーケンシングケミストリーに適合性のあるバーコード及び部位を含むカスタムプライマーを使用してPCRを実行することにより、本発明者らは、形質変換前の「入力ライブラリ」及び回収後の「出力ライブラリ」の両方からバーコード付きの次世代シーケンシングライブラリを生成し、これをプールし、Nextseq550(Illumina)にロードして、エフェクターを評価した。一貫性を確保するために、各スクリーンに対して少なくとも2つの独立したバイオロジカルレプリケートが実施された。
細菌スクリーンシーケンシング解析
Illumina bcl2fastqを使用してスクリーン入力及び出力ライブラリの次世代シーケンシングデータをデマルチプレックス化した。各試料について得られたfastqファイル中のリードが、スクリーニングプラスミドライブラリ用のCRISPRアレイエレメントを含んだ。CRISPRアレイのダイレクトリピート配列を用いてアレイの向きを決定し、スペーサー配列をソース(pACYC184又はE.Cloni)又は陰性対照配列(GFP)にマッピングすることにより対応する標的を決定した。各試料について、所与のプラスミドライブラリ中の各ユニークなアレイエレメントのリード総数(r)をカウントし、以下のとおり規格化した:(r+1)/全てのライブラリアレイエレメントの総リード数。所与のアレイエレメントに関する規格化出力リード数を規格化入力リード数で除すことにより、枯渇スコアを計算した。
酵素活性及び細菌細胞死を生じさせる特異的パラメータを同定するため、本発明者らは次世代シーケンシング(NGS)を用いて入力及び出力プラスミドライブラリのPCR産物中における個々のCRISPRアレイ(即ち、リピート-スペーサー-リピート)の表現を定量化し、比較した。本発明者らは、アレイの枯渇率を、規格化された出力リード数を規格化された入力リード数で割ったものとして定義した。枯渇率が0.1未満(10倍を超える枯渇)の場合、アレイは「強力に枯渇した」と見なした。バイオロジカルレプリケートにわたるアレイ枯渇率を計算する際には、本発明者らは全実験にわたる所与のCRISPRアレイについての最大枯渇率の値をとった(即ち、強力に枯渇したアレイは、全てのバイオロジカルレプリケートで強力に枯渇していなければならない)。本発明者らは、各スペーサー標的について、アレイ枯渇率及び以下の特徴:標的鎖、転写物ターゲティング、ORIターゲティング、標的配列モチーフ、フランキング配列モチーフ、及び標的二次構造を含む行列を作成した。本発明者らは、この行列中の異なる特徴がCLUST.121143システムについての標的枯渇を説明する程度を調べ、それにより単一のスクリーン内で機能パラメータの広範な調査を得た。
図5は、所与の標的について、スクリーン出力対スクリーン入力におけるシーケンシングリードの規格化された比率をプロットすることによる、エンジニアリングされた組成物の干渉活性の程度を示す。結果は各DR転写方向につきプロットされる。各組成物の機能的スクリーニングにおいて、活性RNAガイドと複合体を形成した活性エフェクターは、クロラムフェニコール及びテトラサイクリンに対する大腸菌(E.coli)耐性を付与するpACYC184の能力に干渉し、細胞死及びプール内のスペーサーエレメントの枯渇をもたらす。初期DNAライブラリ(画面入力)と生存形質転換大腸菌(画面出力)のディープシーケンスの結果を比較すると、活性でプログラム可能なCRISPRシステムを可能にする特定の標的配列及びDR転写方向が示唆される。スクリーンはまた、エフェクター複合体がDRの1つの方向でのみ活性であることも示す。
図6は、陰性対照の干渉活性の欠如を示し、ここで、CLUST.121143エフェクタータンパク質のコード領域は、大腸菌(E.coli)へのエレクトロポレーションの前にpET-28a(+)由来のプラスミドから欠失している。
図7A~図7Bは、pACYC184及び大腸菌(E.coli)E.Cloni必須遺伝子を標的化するCLUST.121143 3300014839エフェクターについての強力に枯渇した標的の位置を示す。注目すべきことに、強力に枯渇した標的の位置は、潜在的標的空間全体にわたって分散しているように見える。
図8は、枯渇した標的に隣接する配列のweblogoを示し、TTGの突出した5’PAMを示す。
実施例5-CLUST.196682 CRISPR-Casシステムの最小成分の同定(図9~図12)
このタンパク質ファミリーは、Fervidibacteria、ハロアーキュラ(Haloarcula)、ハロハスタ(Halohasta)、ハロルブルム(Halorubrum)、ナトロノッカス(Natronoccus)種、及び淡水、温泉、塩湖、堆積物、土壌、廃水環境から採取された無培養のメタゲノム配列に見られるCRISPRシステムに関連する大型のシングルエフェクターを表す(表7)。CLUST.196682エフェクターは、以下の表7及び表8に詳述されるタンパク質の例を含む。これらのシステムのダイレクトリピート配列の例を表9に示す。
・このエフェクター複合体を含む天然に存在する遺伝子座の例が図9に示され、CLUST.196682遺伝子座の場合、エフェクタータンパク質がCRISPRアレイと共出現することを示す。エフェクタータンパク質又はCRISPRアレイと共出現する双方向の15kbウィンドウ内で、他の大きなタンパク質ファミリーは同定されなかった。
・CLUST.196682のダイレクトリピート配列は、5’末端の近位にある5’-GYYYGNKRKNNAC-3’(配列番号832)、又は中心部にある5’-YCCRCGCGCGCGNGGG-3’(配列番号833)を含む複数の保存されたモチーフを呈し、式中、YはC又はT又はUを指し、KはG又はT又はUを指し、RはA又はGを指し、Nは任意の核酸塩基を指す(図10)。
・図11は、CLUST.196682エフェクター例の系統樹の概略表現であり、ファミリーが配列多様性を呈することを示す。
・図12は、CLUST.196682エフェクタータンパク質の多重配列アラインメントの概略表現であり、RuvCドメインの保存されている触媒残基の位置を明らかにし、マゼンタ、ブルー、及びレッドの色で図示される。
・任意選択で、システムは、表10に掲載される非コード配列のサブセットであるtracrRNAを含む。
Figure 2022538789000022
Figure 2022538789000023
Figure 2022538789000024
Figure 2022538789000025
Figure 2022538789000026
Figure 2022538789000027
Figure 2022538789000028
Figure 2022538789000029
Figure 2022538789000030
Figure 2022538789000031
Figure 2022538789000032
Figure 2022538789000033
Figure 2022538789000034
Figure 2022538789000035
Figure 2022538789000036
Figure 2022538789000037
Figure 2022538789000038
Figure 2022538789000039
Figure 2022538789000040
Figure 2022538789000041
Figure 2022538789000042
Figure 2022538789000043
Figure 2022538789000044
Figure 2022538789000045
Figure 2022538789000046
Figure 2022538789000047
Figure 2022538789000048
Figure 2022538789000049
Figure 2022538789000050
Figure 2022538789000051
実施例6-エンジニアリングされたCLUST.196682 CRISPR-Casシステムの機能検証(図13A、13B、及び14)
CLUST.196682 CRISPR-Casシステムの最小成分を特定した後、3300025638と称されるメタゲノムソースから機能検証用に1つの遺伝子座を選択した。
DNA合成及びエフェクターライブラリクローニング
本発明者らは、例示的なCLUST.196682 CRISPR-Casシステムの活性を試験するために、pET28a(+)ベクターを含むシステムを設計及び合成した。簡潔に言えば、CLUST.196682 3300025638エフェクターをコードする大腸菌(E.coli)コドン最適化核酸配列(表8に配列番号601として提供されるアミノ酸配列)を合成し(Genscript)、pET-28a(+)(EMD-Millipore)に由来するカスタム発現システムにクローニングした。ベクターは、lacプロモーター及び大腸菌(E.coli)リボソーム結合配列の制御下にあるCLUST.196682 3300025638エフェクタータンパク質をコードする核酸を含んでいた。ベクターはまた、CLUST.196682 3300025638エフェクターのオープンリーディングフレームに続くJ23119プロモーターによってドライブされるCRISPRアレイライブラリのアクセプター部位も含んでいた。
本発明者らは、「リピート-スペーサー-リピート」配列を含むオリゴヌクレオチドライブラリ合成(OLS)プールを計算的に設計した。ここで、「リピート」は、エフェクターに関連するCRISPRアレイに見られるコンセンサスダイレクトリピート配列に相当し、「スペーサー」は、pACYC184プラスミド及び大腸菌(E.coli)必須遺伝子をタイリング(tiling)する配列に相当する。スペーサー長さは、内因性CRISPRアレイに見られるスペーサー長さの最頻値によって決定した。リピート-スペーサー-リピート配列には、前述のCRISPRアレイライブラリアクセプター部位、及びより大規模なプールからの特異的リピート-スペーサー-リピートライブラリの特定の増幅を実現するユニークなPCRプライミング部位への断片の双方向クローニングを実現する、制限部位が付加された。
次に、Golden Gateアセンブリ法を使用して、リピート-スペーサー-リピートライブラリをプラスミドにクローニングした。簡潔に言えば、本発明者らは初めに、ユニークなPCRプライマーを使用してOLSプール(Agilent Genomics)から各リピート-スペーサー-リピートを増幅し、BsaIを使用してプラスミド骨格を事前に線形化して、潜在的バックグラウンドを低減した両方のDNA断片は、Golden Gateアセンブリマスターミックス(New England Biolabs)に添加する前に、Ampure XP(Beckman Coulter)で精製し、製造者の指示に従ってインキュベートした。本発明者らは、Golden Gate反応物を更に精製及び濃縮して、細菌スクリーニングの後続のステップで最大の形質転換効率を実現した。
異なるリピート-スペーサー-リピートエレメントとCasタンパク質とを含むプラスミドライブラリを、Lucigenが推奨するプロトコルに従ってGene Pulser Xcell(登録商標)(Bio-rad)を使用してE.CloniエレクトロコンピテントなE.coli(Lucigen)に電気穿孔した。ライブラリを、精製pACYC184プラスミドで共形質転換するか、又はpACYC184を含むE.Cloniエレクトロコンピテントな大腸菌(E.coli)(Lucigen)に直接形質転換し、BioAssay(登録商標)ディッシュ(Thermo Fisher)のクロラムフェニコール(Fisher)、テトラサイクリン(Alfa Aesar)、カナマイシン(Alfa Aesar)を含む寒天培地に播種し、37℃で10~12時間インキュベートした。近似コロニー数を推定して細菌プレート上に十分なライブラリ提示を確保した後、細菌を回収し、QIAprep Spin Miniprep(登録商標)キット(Qiagen)を使用してプラスミドDNAを抽出し、「出力ライブラリ」を作成した。Illuminaシーケンシングケミストリーに適合性のあるバーコード及び部位を含むカスタムプライマーを使用してPCRを実行することにより、本発明者らは、形質変換前の「入力ライブラリ」及び回収後の「出力ライブラリ」の両方からバーコード付きの次世代シーケンシングライブラリを生成し、これをプールし、Nextseq550(Illumina)にロードして、エフェクターを評価した。一貫性を確保するために、各スクリーンに対して少なくとも2つの独立したバイオロジカルレプリケートが実施された。
細菌スクリーンシーケンシング解析
Illumina bcl2fastqを使用してスクリーン入力及び出力ライブラリの次世代シーケンシングデータをデマルチプレックス化した。各試料について得られたfastqファイル中のリードが、スクリーニングプラスミドライブラリ用のCRISPRアレイエレメントを含んだ。CRISPRアレイのダイレクトリピート配列を用いてアレイの向きを決定し、スペーサー配列をソース(pACYC184又はE.Cloni)又は陰性対照配列(GFP)にマッピングすることにより対応する標的を決定した。各試料について、所与のプラスミドライブラリ中の各ユニークなアレイエレメントのリード総数(r)をカウントし、以下のとおり規格化した:(r+1)/全てのライブラリアレイエレメントの総リード数。所与のアレイエレメントに関する規格化出力リード数を規格化入力リード数で除すことにより、枯渇スコアを計算した。
酵素活性及び細菌細胞死を生じさせる特異的パラメータを同定するため、本発明者らは次世代シーケンシング(NGS)を用いて入力及び出力プラスミドライブラリのPCR産物中における個々のCRISPRアレイ(即ち、リピート-スペーサー-リピート)の表現を定量化し、比較した。本発明者らは、アレイ枯渇率を、規格化出力リード数を規格化入力リード数で除したものとして定義した。アレイは、枯渇率が0.1未満(10倍を超える枯渇倍数)の場合に「強力に枯渇した」と見なした。バイオロジカルレプリケートにわたるアレイ枯渇率を計算する際には、本発明者らは全実験にわたる所与のCRISPRアレイについての最大枯渇率をとった(即ち、強力に枯渇したアレイは、全てのバイオロジカルレプリケートで強力に枯渇していなければならない)。本発明者らは、各スペーサー標的について、アレイ枯渇率及び以下の特徴:標的鎖、転写物ターゲティング、ORIターゲティング、標的配列モチーフ、フランキング配列モチーフ、及び標的二次構造を含む行列を作成した。本発明者らは、この行列中の異なる特徴がCLUST.196682システムについての標的枯渇を説明する程度を調べ、それにより単一のスクリーン内で機能パラメータの広範な調査を得た。
図13A~図13Bは、pACYC184及び大腸菌(E.coli)E.Cloni必須遺伝子を標的化するCLUST.196682 3300025638エフェクターについての強力に枯渇した標的の位置を示す。注目すべきことに、強力に枯渇した標的の位置は、E.Cloni必須遺伝子の潜在的標的空間全体にわたって分散しているように見える。
図14は、枯渇した標的に隣接する配列のweblogoを示し、CGの突出した5’PAMを示す。
実施例7-CLUST.089537 CRISPR-Casシステムの最小成分の同定(図15~図18)
このタンパク質ファミリーは、ピキスパエラ目(Phycisphaerales)及びプランクトミケス門(Planctomycetes)生物、及び淡水、永久凍土、堆積物、土壌、嫌気性、及び温泉環境から採取された無培養のメタゲノム配列に見られるCRISPRシステムに関連する大型のシングルエフェクターを表す(表11)。CLUST.089537エフェクターは、以下の表11及び表12に詳述されるタンパク質の例を含む。これらのシステムのダイレクトリピート配列の例を表13に示す。
・このエフェクター複合体を含む天然に存在する遺伝子座の例が図15に示され、CLUST.089537遺伝子座の場合、エフェクタータンパク質がCRISPRアレイと共出現することを示す。エフェクタータンパク質又はCRISPRアレイと共出現する双方向の15kbウィンドウ内で、他の大きなタンパク質ファミリーは同定されなかった。
・CLUST.089537のダイレクトリピート配列は、3’末端の近位にある5’-RBBNRBKGACAS-3’(配列番号834)を含む複数の保存されたモチーフを呈し(図16)、式中、RはA又はGを刺し、BはC又はG又はT又はUを指し、KはG又はT又はUを指し、SはC又はGを指し、Nは任意の核酸塩基を指す。
・図17は、CLUST.089537エフェクターの系統樹の概略表現であり、ファミリーが配列多様性を呈することを示す。
・図18は、CLUST.089537エフェクタータンパク質の多重配列アラインメントの概略表現であり、RuvCドメインの保存されている触媒残基の位置を明らかにし、マゼンタ、ブルー、及びレッドの色で図示される。
・任意選択で、システムは、表14に掲載される非コード配列のサブセットであるtracrRNAを含む。
Figure 2022538789000052
Figure 2022538789000053
Figure 2022538789000054
Figure 2022538789000055
Figure 2022538789000056
Figure 2022538789000057
Figure 2022538789000058
Figure 2022538789000059
Figure 2022538789000060
Figure 2022538789000061
Figure 2022538789000062
Figure 2022538789000063
Figure 2022538789000064
Figure 2022538789000065
Figure 2022538789000066
Figure 2022538789000067
Figure 2022538789000068
Figure 2022538789000069
Figure 2022538789000070
Figure 2022538789000071
Figure 2022538789000072
Figure 2022538789000073
Figure 2022538789000074
Figure 2022538789000075
Figure 2022538789000076
Figure 2022538789000077
Figure 2022538789000078
Figure 2022538789000079
Figure 2022538789000080
Figure 2022538789000081
Figure 2022538789000082
Figure 2022538789000083
Figure 2022538789000084
Figure 2022538789000085
実施例8-エンジニアリングされたCLUST.089537 CRISPR-Casシステムの機能検証(図19~図21)
CLUST.089537 CRISPR-Casシステムの最小成分を特定した後、CAAACX010000652と称されるメタゲノムソースから機能検証用に1つの遺伝子座を選択した。
DNA合成及びエフェクターライブラリクローニング
本発明者らは、例示的なCLUST.089537 CRISPR-Casシステムの活性を試験するために、pET28a(+)ベクターを含むシステムを設計及び合成した。簡潔に言えば、CLUST.089537 CAAACX010000652エフェクターをコードする大腸菌(E.coli)コドン最適化核酸配列(表12に提供されるアミノ酸配列)を合成し(Genscript)、pET-28a(+)(EMD-Millipore)に由来するカスタム発現システムにクローニングした。ベクターは、lacプロモーター及び大腸菌(E.coli)リボソーム結合配列の制御下にあるCLUST.089537 CAAACX010000652エフェクタータンパク質をコードする核酸を含んでいた。ベクターはまた、CLUST.089537 CAAACX010000652エフェクターのオープンリーディングフレームに続くJ23119プロモーターによってドライブされるCRISPRアレイライブラリのアクセプター部位も含んでいた。
本発明者らは、「リピート-スペーサー-リピート」配列を含むオリゴヌクレオチドライブラリ合成(OLS)プールを計算的に設計した。ここで、「リピート」は、エフェクターに関連するCRISPRアレイに見られるコンセンサスダイレクトリピート配列に相当し、「スペーサー」は、pACYC184プラスミド及び大腸菌(E.coli)必須遺伝子をタイリング(tiling)する配列に相当する。スペーサー長さは、内因性CRISPRアレイに見られるスペーサー長さの最頻値によって決定した。リピート-スペーサー-リピート配列には、前述のCRISPRアレイライブラリアクセプター部位、及びより大規模なプールからの特異的リピート-スペーサー-リピートライブラリの特定の増幅を実現するユニークなPCRプライミング部位への断片の双方向クローニングを実現する、制限部位が付加された。
次に、Golden Gateアセンブリ法を使用して、リピート-スペーサー-リピートライブラリをプラスミドにクローニングした。簡潔に言えば、本発明者らは初めに、ユニークなPCRプライマーを使用してOLSプール(Agilent Genomics)から各リピート-スペーサー-リピートを増幅し、BsaIを使用してプラスミド骨格を事前に線形化して、潜在的バックグラウンドを低減した両方のDNA断片は、Golden Gateアセンブリマスターミックス(New England Biolabs)に添加する前に、Ampure XP(Beckman Coulter)で精製し、製造者の指示に従ってインキュベートした。本発明者らは、Golden Gate反応物を更に精製及び濃縮して、細菌スクリーニングの後続のステップで最大の形質転換効率を実現した。
異なるリピート-スペーサー-リピートエレメントとCasタンパク質とを含むプラスミドライブラリを、Lucigenが推奨するプロトコルに従ってGene Pulser Xcell(登録商標)(Bio-rad)を使用してE.CloniエレクトロコンピテントなE.coli(Lucigen)に電気穿孔した。ライブラリを、精製pACYC184プラスミドで共形質転換するか、又はpACYC184を含むE.Cloniエレクトロコンピテントな大腸菌(E.coli)(Lucigen)に直接形質転換し、BioAssay(登録商標)ディッシュ(Thermo Fisher)のクロラムフェニコール(Fisher)、テトラサイクリン(Alfa Aesar)、カナマイシン(Alfa Aesar)を含む寒天培地に播種し、37℃で10~12時間インキュベートした。近似コロニー数を推定して細菌プレート上に十分なライブラリ提示を確保した後、細菌を回収し、QIAprep Spin Miniprep(登録商標)キット(Qiagen)を使用してプラスミドDNAを抽出し、「出力ライブラリ」を作成した。Illuminaシーケンシングケミストリーに適合性のあるバーコード及び部位を含むカスタムプライマーを使用してPCRを実行することにより、本発明者らは、形質変換前の「入力ライブラリ」及び回収後の「出力ライブラリ」の両方からバーコード付きの次世代シーケンシングライブラリを生成し、これをプールし、Nextseq550(Illumina)にロードして、エフェクターを評価した。一貫性を確保するために、各スクリーンに対して少なくとも2つの独立したバイオロジカルレプリケートが実施された。
細菌スクリーンシーケンシング解析
Illumina bcl2fastqを使用してスクリーン入力及び出力ライブラリの次世代シーケンシングデータをデマルチプレックス化した。各試料について得られたfastqファイル中のリードが、スクリーニングプラスミドライブラリ用のCRISPRアレイエレメントを含んだ。CRISPRアレイのダイレクトリピート配列を用いてアレイの向きを決定し、スペーサー配列をソース(pACYC184又はE.Cloni)又は陰性対照配列(GFP)にマッピングすることにより対応する標的を決定した。各試料について、所与のプラスミドライブラリ中の各ユニークなアレイエレメントのリード総数(r)をカウントし、以下のとおり規格化した:(r+1)/全てのライブラリアレイエレメントの総リード数。所与のアレイエレメントに関する規格化出力リード数を規格化入力リード数で除すことにより、枯渇スコアを計算した。
酵素活性及び細菌細胞死を生じさせる特異的パラメータを同定するため、本発明者らは次世代シーケンシング(NGS)を用いて入力及び出力プラスミドライブラリのPCR産物中における個々のCRISPRアレイ(即ち、リピート-スペーサー-リピート)の表現を定量化し、比較した。本発明者らは、アレイの枯渇率を、規格化された出力リード数を規格化された入力リード数で割ったものとして定義した。枯渇率が0.1未満(10倍を超える枯渇)の場合、アレイは「強力に枯渇した」と見なした。バイオロジカルレプリケートにわたるアレイ枯渇率を計算する際には、本発明者らは全実験にわたる所与のCRISPRアレイについての最大枯渇率の値をとった(即ち、強力に枯渇したアレイは、全てのバイオロジカルレプリケートで強力に枯渇していなければならない)。本発明者らは、各スペーサー標的について、アレイ枯渇率及び以下の特徴:標的鎖、転写物ターゲティング、ORIターゲティング、標的配列モチーフ、フランキング配列モチーフ、及び標的二次構造を含む行列を作成した。本発明者らは、この行列中の異なる特徴がCLUST.089537システムについての標的枯渇を説明する程度を調べ、それにより単一のスクリーン内で機能パラメータの広範な調査を得た。
図19は、所与の標的について、スクリーン出力対スクリーン入力におけるシーケンシングリードの規格化された比率をプロットすることによる、エンジニアリングされた組成物の干渉活性の程度を示す。結果は各DR転写方向につきプロットされる。各組成物の機能的スクリーニングにおいて、活性RNAガイドと複合体を形成した活性エフェクターは、クロラムフェニコール及びテトラサイクリンに対する大腸菌(E.coli)耐性を付与するpACYC184の能力に干渉し、細胞死及びプール内のスペーサーエレメントの枯渇をもたらす。初期DNAライブラリ(画面入力)と生存形質転換大腸菌(画面出力)のディープシーケンスの結果を比較すると、活性でプログラム可能なCRISPRシステムを可能にする特定の標的配列及びDR転写方向が示唆される。スクリーンはまた、エフェクター複合体がDRの1つの方向でのみ活性であることも示す。
図20A~図20Bは、pACYC184及び大腸菌(E.coli)E.Cloni必須遺伝子を標的化するCLUST.089537 CAAACX010000652エフェクターについての強力に枯渇した標的の位置を示す。
図21は、枯渇した標的に隣接する配列のweblogoを示し、TTCの5’PAMを示す。
他の実施形態
本発明はその詳細な説明を伴い説明されているが、前述の説明は例示であり、添付の特許請求の範囲によって定義される本発明の範囲を限定する意図はないことが理解されるべきである。他の態様、利点、及び変形例が、以下の特許請求の範囲内にある。

Claims (49)

  1. CLUST.121143、CLUST.196682、又はCLUST.089537のエンジニアリングされた天然に存在しないクラスター化して規則的な配置の短い回文配列リピート(CRISPR)-Casシステムであって、
    ダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイド;及び
    CRISPR関連タンパク質又は前記CRISPR関連タンパク質をコードする核酸
    を含み、
    前記CRISPR関連タンパク質が、表2、表8、又は表12に提供されるアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み;
    前記CRISPR関連タンパク質が、前記RNAガイドに結合し、前記スペーサー配列に相補的な前記標的核酸配列を標的化することができる、CRISPR-Casシステム。
  2. 前記システムが、CLUST.121143のCRISPR-Casシステムであり、前記CRISPR関連タンパク質が、表2に提供されるアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、請求項1に記載のシステム。
  3. 前記CRISPR関連タンパク質が、CLUST.121143 3300014839エフェクタータンパク質である、請求項2に記載のシステム。
  4. 前記CRISPR関連タンパク質が、プロトスペーサー隣接モチーフ(PAM)の認識能を有し、前記標的核酸は、核酸配列5’-TTG-3’を含むPAMを含む、請求項2又は3に記載のシステム。
  5. 前記ダイレクトリピート配列が、表3に提供されるヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項2~4のいずれか一項に記載のシステム。
  6. 前記RNAガイドの前記スペーサー配列が、約22ヌクレオチド~約40ヌクレオチドを含む、請求項2~5のいずれか一項に記載のシステム。
  7. 前記RNAガイドの前記スペーサー配列が、約26ヌクレオチド~約35ヌクレオチドを含む、請求項2~6のいずれか一項に記載のシステム。
  8. 前記システムが、CLUST.196682のCRISPR-Casシステムであり、前記CRISPR関連タンパク質が、表8に提供されるアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、請求項1に記載のシステム。
  9. 前記CRISPR関連タンパク質が、CLUST.196682 3300025638エフェクタータンパク質である、請求項8に記載のシステム。
  10. 前記CRISPR関連タンパク質が、プロトスペーサー隣接モチーフ(PAM)の認識能を有し、前記標的核酸は、核酸配列5’-CG-3’を含むPAMを含む、請求項8又は9に記載のシステム。
  11. 前記ダイレクトリピート配列が、表9に提供されるヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項8~10のいずれか一項に記載のシステム。
  12. 前記RNAガイドの前記スペーサー配列が、約17ヌクレオチド~約44ヌクレオチドを含む、請求項8~11のいずれか一項に記載のシステム。
  13. 前記RNAガイドの前記スペーサー配列が、26~38ヌクレオチドを含む、請求項8~12のいずれか一項に記載のシステム。
  14. 前記システムが、CLUST.089537のCRISPR-Casシステムであり、前記CRISPR関連タンパク質が、表12に提供されるアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、請求項1に記載のシステム。
  15. 前記CRISPR関連タンパク質が、CLUST.089537 CAAACX010000652エフェクタータンパク質である、請求項14に記載のシステム。
  16. 前記CRISPR関連タンパク質が、プロトスペーサー隣接モチーフ(PAM)の認識能を有し、前記標的核酸は、核酸配列5’-TTC-3’を含むPAMを含む、請求項14又は15に記載のシステム。
  17. 前記ダイレクトリピート配列が、表13に提供されるヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項14~16のいずれか一項に記載のシステム。
  18. 前記RNAガイドの前記スペーサー配列が、約20ヌクレオチド~約40ヌクレオチドを含む、請求項14~17のいずれか一項に記載のシステム。
  19. 前記RNAガイドの前記スペーサー配列が、25~37ヌクレオチドを含む、請求項14~18のいずれか一項に記載のシステム。
  20. 前記CRISPR関連タンパク質が、少なくとも1つ(例えば、1つ、2つ、又は3つ)のRuvCドメインを含む、請求項1~19のいずれか一項に記載のシステム。
  21. 前記CRISPR関連タンパク質が、分割されたRuvCドメインを含む、請求項1~20のいずれか一項に記載のシステム。
  22. 前記CRISPR関連タンパク質が、触媒残基(例えば、アスパラギン酸又はグルタミン酸)を含む、請求項1~21のいずれか一項に記載のシステム。
  23. 前記CRISPR関連タンパク質が、前記標的核酸を切断する、請求項1~22のいずれか一項に記載のシステム。
  24. 前記CRISPR関連タンパク質が、ペプチドタグ、蛍光タンパク質、塩基編集ドメイン、DNAメチル化ドメイン、ヒストン残基修飾ドメイン、局在化因子、転写修飾因子、光ゲート制御因子、化学誘導性因子、又はクロマチン可視化因子を更に含む、請求項1~23のいずれか一項に記載のシステム。
  25. 前記CRISPR関連タンパク質をコードする前記核酸が、細胞での発現にコドン最適化される、請求項1~24のいずれか一項に記載のシステム。
  26. 前記CRISPR関連タンパク質をコードする前記核酸が、プロモーターに作動可能に連結されている、請求項1~25のいずれか一項に記載のシステム。
  27. 前記CRISPR関連タンパク質をコードする前記核酸が、ベクター内にある、請求項1~26のいずれか一項に記載のシステム。
  28. 前記ベクターが、レトロウイルスベクター、レンチウイルスベクター、ファージベクター、アデノウイルスベクター、アデノ随伴ベクター、又は単純ヘルペスベクターを含む、請求項27に記載のシステム。
  29. 前記標的核酸がDNAである、請求項1~28のいずれか一項に記載のシステム。
  30. 前記標的核酸が、PAMを含む、請求項1~29のいずれか一項に記載のシステム。
  31. 前記CRISPR関連タンパク質が、非特異的ヌクレアーゼ活性を有する、請求項1~30のいずれか一項に記載のシステム。
  32. 前記CRISPR関連タンパク質及びRNAガイドによる前記標的核酸のターゲティングにより、前記標的核酸に修飾が生じる、請求項1~31のいずれか一項に記載のシステム。
  33. 前記標的核酸の前記修飾が、二本鎖切断イベントである、請求項32に記載のシステム。
  34. 前記標的核酸の前記修飾が、一本鎖切断イベントである、請求項32に記載のシステム。
  35. 前記標的核酸の前記修飾により、挿入イベントが生じる、請求項32に記載のシステム。
  36. 前記標的核酸の前記修飾により、欠失イベントが生じる、請求項32に記載のシステム。
  37. 前記修飾により細胞毒性又は細胞死が生じる、請求項32~36のいずれか一項に記載のシステム。
  38. ドナー鋳型核酸を更に含む、請求項1~37のいずれか一項に記載のシステム。
  39. 前記ドナー鋳型核酸がDNAである、請求項38に記載のシステム。
  40. 前記ドナー鋳型核酸がRNAである、請求項38に記載のシステム。
  41. 前記RNAガイドが、tracrRNA、モジュレーターRNA、又はその両方を含む、請求項1~40のいずれか一項に記載のシステム。
  42. 前記システムがtracrRNAを更に含む、請求項1~41のいずれか一項に記載のシステム。
  43. 前記システムがモジュレーターRNAを更に含む、請求項1~42のいずれか一項に記載のシステム。
  44. 前記システムが、ナノ粒子、リポソーム、エキソソーム、微小胞、又は遺伝子銃を含む送達組成物中に存在する、請求項1~43のいずれか一項に記載のシステム。
  45. 細胞内にある、請求項1~43のいずれか一項に記載のシステム。
  46. 前記細胞が真核細胞である、請求項45に記載のシステム。
  47. 前記細胞が原核細胞である、請求項45に記載のシステム。
  48. 請求項1~47のいずれか一項に記載のシステムを、細胞内の標的核酸に結合させる方法であって、
    (a)前記システムを提供すること;及び
    (b)前記システムを前記細胞に送達すること
    を含み、前記細胞が前記標的核酸を含み、前記CRISPR関連タンパク質が前記RNAガイドに結合し、前記スペーサー配列が前記標的核酸に結合する、方法。
  49. 標的核酸の編集方法であって、請求項1~47のいずれか一項に記載のシステムを前記標的核酸に接触させることを含む、方法。
JP2021573843A 2019-06-14 2020-06-12 新規crispr dnaターゲティング酵素及びシステム Pending JP2022538789A (ja)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US201962861582P 2019-06-14 2019-06-14
US62/861,582 2019-06-14
US201962872157P 2019-07-09 2019-07-09
US62/872,157 2019-07-09
US201962873606P 2019-07-12 2019-07-12
US201962873602P 2019-07-12 2019-07-12
US62/873,606 2019-07-12
US62/873,602 2019-07-12
PCT/US2020/037585 WO2020252378A1 (en) 2019-06-14 2020-06-12 Novel crispr dna targeting enzymes and systems

Publications (2)

Publication Number Publication Date
JP2022538789A true JP2022538789A (ja) 2022-09-06
JPWO2020252378A5 JPWO2020252378A5 (ja) 2023-06-19

Family

ID=73781310

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021573843A Pending JP2022538789A (ja) 2019-06-14 2020-06-12 新規crispr dnaターゲティング酵素及びシステム

Country Status (7)

Country Link
US (1) US20220315913A1 (ja)
EP (1) EP3983536A4 (ja)
JP (1) JP2022538789A (ja)
CN (1) CN114269912A (ja)
AU (1) AU2020291467A1 (ja)
CA (1) CA3142019A1 (ja)
WO (1) WO2020252378A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220282283A1 (en) * 2019-09-05 2022-09-08 Arbor Biotechnologies, Inc. Novel crispr dna targeting enzymes and systems
US20240093228A1 (en) * 2021-01-22 2024-03-21 Arbor Biotechnologies, Inc. Compositions comprising a nuclease and uses thereof
US20240102007A1 (en) 2021-06-01 2024-03-28 Arbor Biotechnologies, Inc. Gene editing systems comprising a crispr nuclease and uses thereof

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9074199B1 (en) * 2013-11-19 2015-07-07 President And Fellows Of Harvard College Mutant Cas9 proteins
WO2017044776A1 (en) * 2015-09-10 2017-03-16 Texas Tech University System Single-guide rna (sgrna) with improved knockout efficiency
LT3474669T (lt) * 2016-06-24 2022-06-10 The Regents Of The University Of Colorado, A Body Corporate Barkodu pažymėtų kombinatorinių bibliotekų generavimo būdai
US20190382751A1 (en) * 2016-12-28 2019-12-19 Ionis Pharmaceuticals, Inc. Modified crispr rna and uses thereof
US9982279B1 (en) * 2017-06-23 2018-05-29 Inscripta, Inc. Nucleic acid-guided nucleases
WO2019051419A1 (en) * 2017-09-08 2019-03-14 University Of North Texas Health Science Center MODIFIED CASE VARIANTS9
AU2018360068A1 (en) * 2017-11-02 2020-05-14 Arbor Biotechnologies, Inc. Novel CRISPR-associated transposon systems and components

Also Published As

Publication number Publication date
WO2020252378A1 (en) 2020-12-17
EP3983536A1 (en) 2022-04-20
US20220315913A1 (en) 2022-10-06
CN114269912A (zh) 2022-04-01
AU2020291467A1 (en) 2021-12-23
EP3983536A4 (en) 2023-11-29
CA3142019A1 (en) 2020-12-17

Similar Documents

Publication Publication Date Title
JP7457653B2 (ja) 新規crispr dnaターゲティング酵素及びシステム
US10392616B2 (en) CRISPR RNA targeting enzymes and systems and uses thereof
EP3765616B1 (en) Novel crispr dna and rna targeting enzymes and systems
US11667904B2 (en) CRISPR-associated systems and components
JP2022547524A (ja) 新規crispr dnaターゲティング酵素及びシステム
US11643654B2 (en) Crispr DNA targeting enzymes and systems
JP2022538789A (ja) 新規crispr dnaターゲティング酵素及びシステム
US20220372456A1 (en) Novel crispr dna targeting enzymes and systems
CA3093580A1 (en) Novel crispr dna and rna targeting enzymes and systems
US20220282283A1 (en) Novel crispr dna targeting enzymes and systems
JP2022546701A (ja) 新規crispr dnaターゲティング酵素及びシステム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230609

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230609