JP2022546594A - 新規crispr dnaターゲティング酵素及びシステム - Google Patents
新規crispr dnaターゲティング酵素及びシステム Download PDFInfo
- Publication number
- JP2022546594A JP2022546594A JP2022514704A JP2022514704A JP2022546594A JP 2022546594 A JP2022546594 A JP 2022546594A JP 2022514704 A JP2022514704 A JP 2022514704A JP 2022514704 A JP2022514704 A JP 2022514704A JP 2022546594 A JP2022546594 A JP 2022546594A
- Authority
- JP
- Japan
- Prior art keywords
- nucleic acid
- crispr
- seq
- sequence
- target nucleic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
- C12N15/1024—In vivo mutagenesis using high mutation rate "mutator" host strains by inserting genetic material, e.g. encoding an error prone polymerase, disrupting a gene for mismatch repair
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Mycology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Gastroenterology & Hepatology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Virology (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本開示は、標的化した形で核酸を操作するための新規システム、方法、及び組成物について記載する。本開示は、核酸を標的化して修飾するための、天然に存在しないエンジニアリングされたCRISPRシステム、成分、及び方法について記載する。各システムが、一体となって核酸を標的化する1つ以上のタンパク質成分と1つ以上の核酸成分とを含む。
Description
関連出願
本願は、2019年9月5日に出願された米国仮特許出願第62/896,308号の優先権の利益を主張し、この全内容は、本明細書によって参照により援用される。
本願は、2019年9月5日に出願された米国仮特許出願第62/896,308号の優先権の利益を主張し、この全内容は、本明細書によって参照により援用される。
配列表
本出願は、ASCII形式で電子的に提出され、全体として参照により本明細書で援用される配列表を含む。2020年9月3日に作成された前記ASCIIコピーは、A2186-7027WO_SL.txtというファイル名で、サイズは190,015バイトである。
本出願は、ASCII形式で電子的に提出され、全体として参照により本明細書で援用される配列表を含む。2020年9月3日に作成された前記ASCIIコピーは、A2186-7027WO_SL.txtというファイル名で、サイズは190,015バイトである。
本開示は、新規のクラスター化して規則的な配置の短い回文配列リピート(Clustered Regularly Interspaced Short Palindromic Repeats:CRISPR)及びCRISPR関連(Cas)遺伝子を使用する遺伝子発現のゲノム編集及び調節のためのシステム及び方法に関する。
近年、ゲノムシーケンシング技術及び解析の進歩により、原核生物の生合成経路からヒト病理に及ぶまでの多種多様な自然領域における生物学的活性の遺伝的基礎に関して重要な洞察が得られている。得られた大量の情報を完全に理解し、評価するためには、対応したゲノム及びエピゲノム操作のシーケンス技術の規模、有効性、及び容易さの向上が必要となる。このような新規技術は、バイオテクノロジー、農業、及びヒト治療薬を含めた数多くの領域における新規適用の開発を加速させることになる。
クラスター化して規則的な配置の短い回文配列リピート(CRISPR)及びCRISPR関連(Cas)遺伝子は、まとめてCRISPR-Cas又はCRISPR/Casシステムとして知られ、外来の遺伝的エレメントから特定の種を防御する古細菌及び細菌の適応免疫系である。CRISPR-Casシステムは極めて多様な一群のタンパク質エフェクター、非コードエレメント、並びに遺伝子座構成を含み、その幾つかの例がエンジニアリングされ、適合されることにより、重要なバイオテクノロジーの進歩が生み出されている。
宿主防御に関与するこのシステムの成分には、核酸を修飾する能力を有する1つ以上のエフェクタータンパク質と、エフェクタータンパク質をファージ核酸上の特異的配列に標的化することを担うRNAガイドエレメントとが含まれる。RNAガイドはCRISPR RNA(crRNA)で構成され、1つ又は複数のエフェクタータンパク質による標的核酸の操作を実現するために追加的なトランス活性化型RNA(tracrRNA)を必要とすることもある。crRNAは、crRNAへのタンパク質結合を担うダイレクトリピートと、所望の核酸標的配列に相補的なスペーサー配列とからなる。CRISPRシステムは、crRNAのスペーサー配列を修飾することにより、別のDNA又はRNA標的を標的化するよう再プログラム化し得る。
CRISPR-Casシステムは、大きく2つのクラスに分けることができる:クラス1システムは、一緒になってcrRNAの周りに複合体を形成する複数のエフェクタータンパク質で構成され、クラス2システムは、RNAガイドと複合体化して核酸基質を標的化する単一のエフェクタータンパク質からなる。クラス2システムのシングルサブユニットのエフェクター組成は、エンジニアリング及び適用移行に一層簡便な成分セットを提供し、従ってこれまでプログラム可能なエフェクターの重要な供給源となっている。それにも関わらず、核酸及びポリヌクレオチド(即ち、DNA、RNA、又は任意のハイブリッド、誘導体、又は修飾体)を修飾するための、その独自の特性によって新規適用を実現する、より小さなエフェクター及び/又はユニークなPAM配列要件を有するエフェクターなどの現在のCRISPR-Casシステムを越える更なるプログラム可能なエフェクター及びシステムが依然として必要とされている。
この開示は、最初にゲノムデータベースから計算により同定され、その後、エンジニアリングされ、実験的に検証された、新規の単一エフェクタークラス2 CRISPR-Casシステムのための非天然のエンジニアリングされたシステム及び組成物を提供する。特に、これらのCRISPR-Casシステムの成分の同定により、非天然環境、例えば、システムが最初に発見されたもの以外の細菌、又は哺乳動物細胞などの真核細胞における使用が可能になる。これらの新規エフェクターは、既存のクラス2 CRISPRエフェクターのオルソログ及びホモログと比較して配列及び機能が異なる。
一態様において、本開示は、配列番号1~20のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含むCRISPR関連タンパク質;及びダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイドを含む、CLUST.143952のエンジニアリングされた天然に存在しないクラスター化して規則的な配置の短い回文配列リピート(CRISPR)-Casシステムを提供し、ここで、CRISPR関連タンパク質は、RNAガイドに結合し、スペーサー配列に相補的な標的核酸配列を修飾することができる。一態様において、本開示は、CRISPR関連タンパク質が配列番号1~20のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、CRISPR関連タンパク質又はCRISPR関連タンパク質をコードする核酸;及びダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイド、又はRNAガイドをコードする核酸を含む、CLUST.143952のエンジニアリングされた天然に存在しないクラスター化して規則的な配置の短い回文配列リピート(CRISPR)-Casシステムを提供し、ここで、CRISPR関連タンパク質は、RNAガイドに結合し、スペーサー配列に相補的な標的核酸配列を修飾することができる。
本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質は、少なくとも1つ(例えば、1つ、2つ、又は3つ)のRuvCドメイン又は少なくとも1つの分割されたRuvCドメインを含む。
本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質は、以下の配列のうちの1つ以上を含む:(a)X1X2X3REX4X5X6(配列番号75)[式中、X1はY又はRであり、X2はA又はP又はQ又はVであり、X3はS又はC又はTであり、X4はI又はLであり、X5はF又はM又はY又はLであり、及びX6はN又はAである];(b)DX1X2W(配列番号76)[式中、X1はS又はR又はG又はTであり、及びX2はT又はS又はKである];(c)GX1Q(配列番号77)[式中、X1はI又はV又はPである];(d)YYPX1X2X3X4(配列番号78)[式中、X1はE又はK又はDであり、X2はS又はN又はD又はTであり、X3はL又はI又はFであり、及びX4はK又はF又はNである];(e)X1X2GX3D(配列番号79)[式中、X1はG又はT又はVであり、X2はV又はI又はLであり、及びX3はI又はC又はM又はVである];(f)X1X2WX3PX4X5DX6X7(配列番号80)[式中、X1はH又はNであり、X2はN又はE又はD又はGであり、X3はH又はQ又はR又はA又はV又はK又はI又はEであり、X4はA又はS又はV又はPであり、X5はK又はP又はH又はC又はS又はYであり、X6はF又はY又はPであり、及びX7はL又はM又はCである];(g)X1QX2X3WDX4X5HX6(配列番号81)[式中、X1はE又はRであり、X2はS又はA又はGであり、X3はR又はN又はE又はKであり、X4はR又はK又はL又はMであり、X5はT又はN又はV又はK又はAであり、X6はD又はS又はE又はQである];(h)X1MEX2X3NLNX4(配列番号82)[式中、X1はA又はV又はSであり、X2はD又はNであり、X3はV又はI又はLであり、及びX4はE又はD又はRである];(i)TSX1X2CX3X4CX5(配列番号83)[式中、X1はQ又はNであり、X2はL又はI又はTであり、X3はH又はDであり、X4はV又はC又はA又はLであり、及びX5はQ又はR又はN又はGである];(j)X1NX2RX3X4X5X6FX7CGX8X9X10C(配列番号84)[式中、X1はL又はI又はKであり、X2はF又はY又はLであり、X3はD又はF又はE又はAであり、X4はG又はKであり、X5はR又はEであり、X6はV又はI又はT又はKであり、X7はI又はVであり、X8はN又はCであり、X9はP又はEであり、及びX10はE又はN又はA又はD又はKである];(k)X1X2ADX3NAAX4X5I(配列番号85)[式中、X1はQ又はVであり、X2はN又はDであり、X3はE又はS又はV又はWであり、X4はF又はH又はS又はY又はMであり、及びX5はN又はV又はCである];及び(l)X1X2X3DG(配列番号97)[式中、X1はG又はAであり、X2はV又はL又はM又はIであり、及びX3はR又はKである]。
本明細書に記載されるシステムのいずれかの一部の実施形態において、ダイレクトリピート配列は、配列番号21~35、又は配列番号47~61のいずれか1つに記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。本明細書に記載されるシステムのいずれかの一部の実施形態において、ダイレクトリピート配列は、配列番号21~35又は配列番号47~61のいずれか1つに記載のヌクレオチド配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。
本明細書に記載されるシステムのいずれかの一部の実施形態において、ダイレクトリピート配列は、以下の配列のうちの1つ以上を含む:(a)X1X2X3TX4X5X6X7AX8GX9[式中、X1はC又はTであり、X2はG又はAであり、X3はG又はTであり、X4はT又はA又はGであり、X5はT又はCであり、X6はA又はT又はGであり、X7はC又はAであり、X8はT又はA又はGであり、及びX9はG又はCである];及び(b)AX1ACC[式中、X1はT又はCである]。
一部の実施形態において、CRISPR関連タンパク質は、配列番号1のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号21、又は配列番号47のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号1のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号21のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号2のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号22又は配列番号48のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号3のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号23又は配列番号49のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号3のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号23のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号4のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号24又は配列番号50のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号4のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号24のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号5のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号25又は配列番号51のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号6のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号26又は配列番号52のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号6のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号26のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号7のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号26又は配列番号52のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号7のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号26のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号8のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号27又は配列番号53のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号9のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号28又は配列番号54のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号10のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号29又は配列番号55のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号11のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号30又は配列番号56のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号12のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号31又は配列番号57のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号13のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミ
ノ酸配列を含み、ダイレクトリピート配列は、配列番号31又は配列番号57のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号14のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号30又は配列番号56のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号15のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号32又は配列番号58のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号15のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号32のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号16のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号33又は配列番号59のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号17のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号34又は配列番号60のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号18のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号34又は配列番号60のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号19のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号29又は配列番号55のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号20のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号35又は配列番号61のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。
ノ酸配列を含み、ダイレクトリピート配列は、配列番号31又は配列番号57のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号14のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号30又は配列番号56のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号15のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号32又は配列番号58のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号15のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号32のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号16のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号33又は配列番号59のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号17のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号34又は配列番号60のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号18のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号34又は配列番号60のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号19のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号29又は配列番号55のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号20のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号35又は配列番号61のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。
本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号1(CLUST.143952 3300028591)に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質である。本明細書に記載されるシステムのいずれかの一部の実施形態において、ダイレクトリピート配列は、配列番号21のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。
本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号1に記載のアミノ酸配列(CLUST.143952 3300028591)と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質である。本明細書に記載されるシステムのいずれかの一部の実施形態において、ダイレクトリピート配列は、配列番号21のヌクレオチド配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。
本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質はプロトスペーサー隣接モチーフ(PAM)の認識能を有し、ここで、PAMは核酸配列を含み、これは5’-NNG-3’、5’-NG-3’、5’-TTG-3’、5’-KTG-3’、5’-THG-3’、5’-KHG-3’、又は5’-G-3’として記載される核酸配列を含む。
本明細書に記載されるシステムのいずれかの一部の実施形態において、RNAガイドのスペーサー配列は約15ヌクレオチド~約50ヌクレオチドを含む。本明細書に記載されるシステムのいずれかの一部の実施形態において、RNAガイドのスペーサー配列は20~35ヌクレオチドを含む。
本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質は触媒残基(例えば、アスパラギン酸又はグルタミン酸)を含む。本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質は、標的核酸を切断する。本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質は、ペプチドタグ、蛍光タンパク質、塩基編集ドメイン、DNAメチル化ドメイン、ヒストン残基修飾ドメイン、局在化因子、転写修飾因子、光ゲート制御因子、化学誘導性因子、又はクロマチン可視化因子を更に含む。
本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質をコードする核酸は、細胞(例えば、真核細胞、例えば、哺乳動物細胞、例えば、ヒト細胞)での発現にコドン最適化される。本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質をコードする核酸は、プロモーターに作動可能に連結されている。本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質をコードする核酸は、ベクター内にある。一部の実施形態において、ベクターは、レトロウイルスベクター、レンチウイルスベクター、ファージベクター、アデノウイルスベクター、アデノ随伴ベクター、又は単純ヘルペスベクターを含む。
本明細書に記載されるシステムのいずれかの一部の実施形態において、標的核酸はDNA分子である。本明細書に記載されるシステムのいずれかの一部の実施形態において、標的核酸はPAM配列を含む。
本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質は、非特異的ヌクレアーゼ活性を有する。
本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質及びRNAガイドによる標的核酸の認識により、標的核酸の修飾が生じる。本明細書に記載されるシステムのいずれかの一部の実施形態において、標的核酸の修飾は、二本鎖切断イベントである。本明細書に記載されるシステムのいずれかの一部の実施形態において、標的核酸の修飾は、一本鎖切断イベントである。本明細書に記載されるシステムのいずれかの一部の実施形態において、標的核酸の修飾により、挿入イベントが生じる。本明細書に記載されるシステムのいずれかの一部の実施形態において、標的核酸の修飾により、欠失イベントが生じる。本明細書に記載されるシステムのいずれかの一部の実施形態において、標的核酸の修飾により、細胞毒性又は細胞死が生じる。
本明細書に記載されるシステムのいずれかの一部の実施形態において、システムはドナー鋳型核酸を更に含む。本明細書に記載されるシステムのいずれかの一部の実施形態において、ドナー鋳型核酸はDNA分子である。本明細書に記載されるシステムのいずれかの一部の実施形態において、ドナー鋳型核酸はRNA分子である。
本明細書に記載されるシステムのいずれかの一部の実施形態において、RNAガイドは任意選択でtracrRNA及び/又はモジュレーターRNAを含む。本明細書に記載されるシステムのいずれかの一部の実施形態において、システムはtracrRNAを更に含む。本明細書に記載されるシステムのいずれかの一部の実施形態において、システムはtracrRNAを含まない。本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質は自己プロセシングである。本明細書に記載されるシステムのいずれかの一部の実施形態において、システムはモジュレーターRNAを更に含む。
一部の実施形態において、CRISPR関連タンパク質は、配列番号1のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、tracrRNA配列は、配列番号62、配列番号63、又は配列番号64のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号4のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、tracrRNA配列は、配列番号65、配列番号66、又は配列番号67のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号7のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、tracrRNA配列は、配列番号68、配列番号69、又は配列番号70のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号15のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、tracrRNA配列は、配列番号71、配列番号72、配列番号73、又は配列番号74のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。
本明細書に記載されるシステムのいずれかの一部の実施形態において、システムは、ナノ粒子、リポソーム、エキソソーム、微小胞、又は遺伝子銃を含む送達組成物中に存在する。
本明細書に記載されるシステムのいずれかの一部の実施形態において、システムは細胞内にある。一部の実施形態において、細胞は真核細胞である。一部の実施形態において、細胞は哺乳動物細胞である。一部の実施形態において、細胞はヒト細胞である。一部の実施形態において、細胞は原核細胞である。
別の態様において、本開示は、細胞を提供し、ここで、細胞は、配列番号1~20のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含むCRISPR関連タンパク質;及びダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイドを含む。別の態様において、本開示は、細胞を提供し、ここで、細胞は、CRISPR関連タンパク質が配列番号1~20のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、CRISPR関連タンパク質又はCRISPR関連タンパク質をコードする核酸;及びダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイド、又はRNAガイドをコードする核酸を含む。
本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質は、少なくとも1つ(例えば、1つ、2つ、又は3つ)のRuvCドメイン又は少なくとも1つの分割されたRuvCドメインを含む。
本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質は、以下の配列のうちの1つ以上を含む:(a)X1X2X3REX4X5X6(配列番号75)[式中、X1はY又はRであり、X2はA又はP又はQ又はVであり、X3はS又はC又はTであり、X4はI又はLであり、X5はF又はM又はY又はLであり、及びX6はN又はAである];(b)DX1X2W(配列番号76)[式中、X1はS又はR又はG又はTであり、及びX2はT又はS又はKである];(c)GX1Q(配列番号77)[式中、X1はI又はV又はPである];(d)YYPX1X2X3X4(配列番号78)[式中、X1はE又はK又はDであり、X2はS又はN又はD又はTであり、X3はL又はI又はFであり、及びX4はK又はF又はNである];(e)X1X2GX3D(配列番号79)[式中、X1はG又はT又はVであり、X2はV又はI又はLであり、及びX3はI又はC又はM又はVである];(f)X1X2WX3PX4X5DX6X7(配列番号80)[式中、X1はH又はNであり、X2はN又はE又はD又はGであり、X3はH又はQ又はR又はA又はV又はK又はI又はEであり、X4はA又はS又はV又はPであり、X5はK又はP又はH又はC又はS又はYであり、X6はF又はY又はPであり、及びX7はL又はM又はCである];(g)X1QX2X3WDX4X5HX6(配列番号81)[式中、X1はE又はRであり、X2はS又はA又はGであり、X3はR又はN又はE又はKであり、X4はR又はK又はL又はMであり、X5はT又はN又はV又はK又はAであり、X6はD又はS又はE又はQである];(h)X1MEX2X3NLNX4(配列番号82)[式中、X1はA又はV又はSであり、X2はD又はNであり、X3はV又はI又はLであり、及びX4はE又はD又はRである];(i)TSX1X2CX3X4CX5(配列番号83)[式中、X1はQ又はNであり、X2はL又はI又はTであり、X3はH又はDであり、X4はV又はC又はA又はLであり、及びX5はQ又はR又はN又はGである];(j)X1NX2RX3X4X5X6FX7CGX8X9X10C(配列番号84)[式中、X1はL又はI又はKであり、X2はF又はY又はLであり、X3はD又はF又はE又はAであり、X4はG又はKであり、X5はR又はEであり、X6はV又はI又はT又はKであり、X7はI又はVであり、X8はN又はCであり、X9はP又はEであり、及びX10はE又はN又はA又はD又はKである];(k)X1X2ADX3NAAX4X5I(配列番号85)[式中、X1はQ又はVであり、X2はN又はDであり、X3はE又はS又はV又はWであり、X4はF又はH又はS又はY又はMであり、及びX5はN又はV又はCである];及び(l)X1X2X3DG(配列番号97)[式中、X1はG又はAであり、X2はV又はL又はM又はIであり、及びX3はR又はKである]。
本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号1に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質である。
本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質は、5’-NNG-3’、5’-NG-3’、5’-TTG-3’、5’-KTG-3’、5’-THG-3’、5’-KHG-3’、又は5’-G-3’として記載される核酸配列を含むPAM配列の認識能を有する。
本明細書に記載される細胞のいずれかの一部の実施形態において、ダイレクトリピート配列は、配列番号21~35、又は配列番号47~61のいずれか1つに記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。本明細書に記載される細胞のいずれかの一部の実施形態において、ダイレクトリピート配列は、配列番号21~35又は配列番号47~61のいずれか1つに記載のヌクレオチド配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。
本明細書に記載される細胞のいずれかの一部の実施形態において、ダイレクトリピート配列は、以下の配列のうちの1つ以上を含む:(a)X1X2X3TX4X5X6X7AX8GX9[式中、X1はC又はTであり、X2はG又はAであり、X3はG又はTであり、X4はT又はA又はGであり、X5はT又はCであり、X6はA又はT又はGであり、X7はC又はAであり、X8はT又はA又はGであり、及びX9はG又はCである];及び(b)AX1ACC[式中、X1はT又はCである]。
本明細書に記載される細胞のいずれかの一部の実施形態において、ダイレクトリピートは、配列番号21に記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。
本明細書に記載される細胞のいずれかの一部の実施形態において、ダイレクトリピートは、配列番号21に記載のヌクレオチド配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。
本明細書に記載される細胞のいずれかの一部の実施形態において、スペーサー配列は約15ヌクレオチド~約50ヌクレオチドを含む。本明細書に記載される細胞のいずれかの一部の実施形態において、スペーサー配列は20~35ヌクレオチドを含む。
本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質は触媒残基(例えば、アスパラギン酸又はグルタミン酸)を含む。本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質は、標的核酸を切断する。本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質は、ペプチドタグ、蛍光タンパク質、塩基編集ドメイン、DNAメチル化ドメイン、ヒストン残基修飾ドメイン、局在化因子、転写修飾因子、光ゲート制御因子、化学誘導性因子、又はクロマチン可視化因子を更に含む。
本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質をコードする核酸は、細胞(例えば、真核細胞、例えば、哺乳動物細胞、例えば、ヒト細胞)での発現にコドン最適化される。本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質をコードする核酸は、プロモーターに作動可能に連結されている。本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質をコードする核酸は、ベクター内にある。一部の実施形態において、ベクターは、レトロウイルスベクター、レンチウイルスベクター、ファージベクター、アデノウイルスベクター、アデノ随伴ベクター、又は単純ヘルペスベクターを含む。
本明細書に記載される細胞のいずれかの一部の実施形態において、RNAガイドは任意選択でtracrRNA及び/又はモジュレーターRNAを含む。本明細書に記載される細胞のいずれかの一部の実施形態において、細胞はtracrRNAを更に含む。本明細書に記載される細胞のいずれかの一部の実施形態において、細胞はtracrRNAを含まない。本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質は自己プロセシングである。本明細書に記載される細胞のいずれかの一部の実施形態において、細胞はモジュレーターRNAを更に含む。
本明細書に記載される細胞のいずれかの一部の実施形態において、細胞は真核細胞である。本明細書に記載される細胞のいずれかの一部の実施形態において、細胞は哺乳動物細胞である。本明細書に記載される細胞のいずれかの一部の実施形態において、細胞はヒト細胞である。本明細書に記載される細胞のいずれかの一部の実施形態において、細胞は原核細胞である。
本明細書に記載される細胞のいずれかの一部の実施形態において、標的核酸はDNA分子である。本明細書に記載される細胞のいずれかの一部の実施形態において、標的核酸はPAM配列を含む。
本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質は、非特異的ヌクレアーゼ活性を有する。
本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質及びRNAガイドによる標的核酸の認識により、標的核酸の修飾が生じる。本明細書に記載される細胞のいずれかの一部の実施形態において、標的核酸の修飾は、二本鎖切断イベントである。本明細書に記載される細胞のいずれかの一部の実施形態において、標的核酸の修飾は、一本鎖切断イベントである。本明細書に記載される細胞のいずれかの一部の実施形態において、標的核酸の修飾により、挿入イベントが生じる。本明細書に記載される細胞のいずれかの一部の実施形態において、標的核酸の修飾により、欠失イベントが生じる。本明細書に記載される細胞のいずれかの一部の実施形態において、標的核酸の修飾により、細胞毒性又は細胞死が生じる。
別の態様において、本開示は、(a)システムを提供すること;及び(b)システムを細胞に送達することを含む、本明細書に記載されるシステムを細胞内の標的核酸に結合する方法を提供し、ここで、細胞は標的核酸を含み、CRISPR関連タンパク質はRNAガイドに結合し、スペーサー配列は標的核酸に結合する。一部の実施形態において、細胞は真核細胞、例えば、哺乳動物細胞、例えば、ヒト細胞である。
別の態様において、本開示は、標的核酸を修飾する方法であって、配列番号1~20のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含むCRISPR関連タンパク質;及びダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイドを含む、エンジニアリングされた天然に存在しないCRISPR-Casシステムを、標的核酸に送達することを含む方法を提供し、ここで、CRISPR関連タンパク質はRNAガイドへの結合能を有し、CRISPR関連タンパク質及びRNAガイドによる標的核酸の認識により、標的核酸の修飾が生じる。別の態様において、本開示は、標的核酸を修飾する方法であって、CRISPR関連タンパク質が配列番号1~20のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、CRISPR関連タンパク質又はCRISPR関連タンパク質をコードする核酸;及びダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイドを含む、エンジニアリングされた天然に存在しないCRISPR-Casシステムを、標的核酸に送達することを含む方法を提供し、ここで、CRISPR関連タンパク質はRNAガイドへの結合能を有し、CRISPR関連タンパク質及びRNAガイドによる標的核酸の認識により、標的核酸の修飾が生じる。
本明細書に記載される方法のいずれかの一部の実施形態において、CRISPR関連タンパク質は、以下の配列のうちの1つ以上を含む:(a)X1X2X3REX4X5X6(配列番号75)[式中、X1はY又はRであり、X2はA又はP又はQ又はVであり、X3はS又はC又はTであり、X4はI又はLであり、X5はF又はM又はY又はLであり、及びX6はN又はAである];(b)DX1X2W(配列番号76)[式中、X1はS又はR又はG又はTであり、及びX2はT又はS又はKである];(c)GX1Q(配列番号77)[式中、X1はI又はV又はPである];(d)YYPX1X2X3X4(配列番号78)[式中、X1はE又はK又はDであり、X2はS又はN又はD又はTであり、X3はL又はI又はFであり、及びX4はK又はF又はNである];(e)X1X2GX3D(配列番号79)[式中、X1はG又はT又はVであり、X2はV又はI又はLであり、及びX3はI又はC又はM又はVである];(f)X1X2WX3PX4X5DX6X7(配列番号80)[式中、X1はH又はNであり、X2はN又はE又はD又はGであり、X3はH又はQ又はR又はA又はV又はK又はI又はEであり、X4はA又はS又はV又はPであり、X5はK又はP又はH又はC又はS又はYであり、X6はF又はY又はPであり、及びX7はL又はM又はCである];(g)X1QX2X3WDX4X5HX6(配列番号81)[式中、X1はE又はRであり、X2はS又はA又はGであり、X3はR又はN又はE又はKであり、X4はR又はK又はL又はMであり、X5はT又はN又はV又はK又はAであり、X6はD又はS又はE又はQである];(h)X1MEX2X3NLNX4(配列番号82)[式中、X1はA又はV又はSであり、X2はD又はNであり、X3はV又はI又はLであり、及びX4はE又はD又はRである];(i)TSX1X2CX3X4CX5(配列番号83)[式中、X1はQ又はNであり、X2はL又はI又はTであり、X3はH又はDであり、X4はV又はC又はA又はLであり、及びX5はQ又はR又はN又はGである];(j)X1NX2RX3X4X5X6FX7CGX8X9X10C(配列番号84)[式中、X1はL又はI又はKであり、X2はF又はY又はLであり、X3はD又はF又はE又はAであり、X4はG又はKであり、X5はR又はEであり、X6はV又はI又はT又はKであり、X7はI又はVであり、X8はN又はCであり、X9はP又はEであり、及びX10はE又はN又はA又はD又はKである];(k)X1X2ADX3NAAX4X5I(配列番号85)[式中、X1はQ又はVであり、X2はN又はDであり、X3はE又はS又はV又はWであり、X4はF又はH又はS又はY又はMであり、及びX5はN又はV又はCである];及び(l)X1X2X3DG(配列番号97)[式中、X1はG又はAであり、X2はV又はL又はM又はIであり、及びX3はR又はKである]。
本明細書に記載される方法のいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号1に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質である。
本明細書に記載される方法のいずれかの一部の実施形態において、CRISPR関連タンパク質は、5’-NNG-3’、5’-NG-3’、5’-TTG-3’、5’-KTG-3’、5’-THG-3’、5’-KHG-3’、又は5’-G-3’として記載される核酸配列を含むPAM配列の認識能を有する。
本明細書に記載される方法のいずれかの一部の実施形態において、ダイレクトリピート配列は、配列番号21~35又は配列番号47~61のいずれか1つに記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。本明細書に記載される方法のいずれかの一部の実施形態において、ダイレクトリピート配列は、配列番号21~35又は配列番号47~61のいずれか1つに記載のヌクレオチド配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。
本明細書に記載される方法のいずれかの一部の実施形態において、ダイレクトリピート配列は、以下の配列のうちの1つ以上を含む:(a)X1X2X3TX4X5X6X7AX8GX9[式中、X1はC又はTであり、X2はG又はAであり、X3はG又はTであり、X4はT又はA又はGであり、X5はT又はCであり、X6はA又はT又はGであり、X7はC又はAであり、X8はT又はA又はGであり、及びX9はG又はCである];及び(b)AX1ACC[式中、X1はT又はCである]。
本明細書に記載される方法のいずれかの一部の実施形態において、ダイレクトリピートは、配列番号21に記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。
本明細書に記載される方法のいずれかの一部の実施形態において、ダイレクトリピートは、配列番号21に記載のヌクレオチド配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。
本明細書に記載される方法のいずれかの一部の実施形態において、スペーサー配列は約15ヌクレオチド~約50ヌクレオチドを含む。本明細書に記載される方法のいずれかの一部の実施形態において、スペーサー配列は20~35ヌクレオチドを含む。
本明細書に記載される方法のいずれかの一部の実施形態において、RNAガイドは任意選択でtracrRNA及び/又はモジュレーターRNAを含む。本明細書に記載される方法のいずれかの一部の実施形態において、システムはtracrRNAを更に含む。本明細書に記載される方法のいずれかの一部の実施形態において、システムはtracrRNAを含まない。本明細書に記載される方法のいずれかの一部の実施形態において、CRISPR関連タンパク質は自己プロセシングである。本明細書に記載される方法のいずれかの一部の実施形態において、システムはモジュレーターRNAを更に含む。
本明細書に記載される方法のいずれかの一部の実施形態において、標的核酸はDNA分子である。本明細書に記載される方法のいずれかの一部の実施形態において、標的核酸はPAM配列を含む。
本明細書に記載される方法のいずれかの一部の実施形態において、CRISPR関連タンパク質は、非特異的ヌクレアーゼ活性を有する。
本明細書に記載される方法のいずれかの一部の実施形態において、標的核酸の修飾は、二本鎖切断イベントである。本明細書に記載される方法のいずれかの一部の実施形態において、標的核酸の修飾は、一本鎖切断イベントである。本明細書に記載される方法のいずれかの一部の実施形態において、標的核酸の修飾により、挿入イベントが生じる。本明細書に記載される方法のいずれかの一部の実施形態において、標的核酸の修飾により、欠失イベントが生じる。本明細書に記載される方法のいずれかの一部の実施形態において、標的核酸の修飾により、細胞毒性又は細胞死が生じる。
別の態様において、本開示は、標的核酸の編集方法を提供し、この方法は、本明細書に記載されるシステムを標的核酸に接触させることを含む。別の態様において、本開示は、標的核酸の発現を改変する方法を提供し、この方法は、本明細書に記載されるシステムを標的核酸に接触させることを含む。別の態様において、本開示は、標的核酸のある部位におけるペイロード核酸の挿入を標的化する方法であって、本明細書に記載されるシステムを標的核酸に接触させることを含む、方法を提供する。別の態様において、本開示は、標的核酸の部位からのペイロード核酸の切出しを標的化する方法であって、本明細書に記載されるシステムを標的核酸に接触させることを含む、方法を提供する。別の態様において、本開示は、DNA標的核酸の認識時に一本鎖DNAを非特異的に分解する方法を提供し、この方法は、本明細書に記載されるシステムを標的核酸に接触させることを含む。
本明細書に提供されるシステム又は方法のいずれかの一部の実施形態において、接触は、直接接触又は間接接触を含む。本明細書に提供されるシステム又は方法のいずれかの一部の実施形態において、間接的に接触することは、RNAガイド及び/又はCRISPR関連タンパク質の産生を可能にする条件下で、本明細書に記載されるRNAガイド又はCRISPR関連タンパク質をコードする1つ以上の核酸を投与することを含む。本明細書に提供されるシステム又は方法のいずれかの一部の実施形態において、接触は、インビボでの接触又はインビトロでの接触を含む。本明細書に提供されるシステム又は方法のいずれかの一部の実施形態において、標的核酸をシステムと接触させることは、CRISPR関連タンパク質及びガイドRNAが標的核酸に到達することを可能にする条件下で、核酸を含む細胞をシステムと接触させることを含む。本明細書に提供されるシステム又は方法のいずれかの一部の実施形態において、インビボで細胞をシステムと接触させることは、CRISPR関連タンパク質及びガイドRNAが細胞に到達するか又は細胞内で産生されることを可能にする条件下で、細胞を含む対象にシステムを投与することを含む。
別の態様において、本開示は、(a)標的核酸のターゲティング及び編集方法;(b)核酸の認識に応じた一本鎖核酸の非特異的分解方法;(c)二本鎖標的のスペーサー相補鎖の認識に応じた二本鎖標的の非スペーサー相補鎖のターゲティング及びニッキング方法;(d)二本鎖標的核酸のターゲティング及び切断方法;(e)試料中の標的核酸の検出方法;(f)二本鎖核酸の特異的編集方法;(g)二本鎖核酸の塩基編集方法;(h)細胞における遺伝子型特異的又は転写状態特異的細胞死又は休眠の誘導方法;(i)二本鎖核酸標的におけるインデルの作成方法;(j)二本鎖核酸標的への配列の挿入方法;又は(k)二本鎖核酸標的における配列の欠失又は逆位形成方法である、インビトロ又はエキソビボでの方法における使用のための、本明細書に提供されるシステムを提供する。
別の態様において、本開示は、哺乳類細胞の標的核酸に挿入又は欠失を導入する方法であって、(a)CRISPR関連タンパク質をコードする核酸配列であって、CRISPR関連タンパク質が、配列番号1~20のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、核酸配列;及び(b)ダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイド(又はRNAガイドをコードする核酸)のトランスフェクションを含む方法を提供し;ここで、CRISPR関連タンパク質はRNAガイドへの結合能を有し;及びここで、CRISPR関連タンパク質及びRNAガイドによる標的核酸の認識により、標的核酸の修飾が生じる。
本明細書に提供される方法のいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号1に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む。
本明細書に提供される方法のいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号1に記載のアミノ酸配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む。
本明細書に提供される方法のいずれかの一部の実施形態において、ダイレクトリピートは、配列番号21に記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。
本明細書に提供される方法のいずれかの一部の実施形態において、ダイレクトリピートは、配列番号21に記載のヌクレオチド配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。
本明細書に提供される方法のいずれかの一部の実施形態において、トランスフェクションは一過性トランスフェクションである。本明細書に提供される方法のいずれかの一部の実施形態において、細胞はヒト細胞である。
別の態様において、本開示は、(a)CRISPR関連タンパク質又はCRISPR関連タンパク質をコードする核酸;及び(b)ダイレクトリピート配列とスペーサー配列とを含むRNAガイドを含む組成物を提供し;ここで、CRISPR関連タンパク質は、以下のアミノ酸配列のうちの1つ以上を含み:(i)X1X2X3REX4X5X6(配列番号75)[式中、X1はY又はRであり、X2はA又はP又はQ又はVであり、X3はS又はC又はTであり、X4はI又はLであり、X5はF又はM又はY又はLであり、及びX6はN又はAである];(ii)DX1X2W(配列番号76)[式中、X1はS又はR又はG又はTであり、及びX2はT又はS又はKである];(iii)GX1Q(配列番号77)[式中、X1はI又はV又はPである];(iv)YYPX1X2X3X4(配列番号78)[式中、X1はE又はK又はDであり、X2はS又はN又はD又はTであり、X3はL又はI又はFであり、及びX4はK又はF又はNである];(v)X1X2GX3D(配列番号79)[式中、X1はG又はT又はVであり、X2はV又はI又はLであり、及びX3はI又はC又はM又はVである];(vi)X1X2WX3PX4X5DX6X7(配列番号80)[式中、X1はH又はNであり、X2はN又はE又はD又はGであり、X3はH又はQ又はR又はA又はV又はK又はI又はEであり、X4はA又はS又はV又はPであり、X5はK又はP又はH又はC又はS又はYであり、X6はF又はY又はPであり、及びX7はL又はM又はCである];(vii)X1QX2X3WDX4X5HX6(配列番号81)[式中、X1はE又はRであり、X2はS又はA又はGであり、X3はR又はN又はE又はKであり、X4はR又はK又はL又はMであり、X5はT又はN又はV又はK又はAであり、X6はD又はS又はE又はQである];(viii)X1MEX2X3NLNX4(配列番号82)[式中、X1はA又はV又はSであり、X2はD又はNであり、X3はV又はI又はLであり、及びX4はE又はD又はRである];(ix)TSX1X2CX3X4CX5(配列番号83)[式中、X1はQ又はNであり、X2はL又はI又はTであり、X3はH又はDであり、X4はV又はC又はA又はLであり、及びX5はQ又はR又はN又はGである];(x)X1NX2RX3X4X5X6FX7CGX8X9X10C(配列番号84)[式中、X1はL又はI又はKであり、X2はF又はY又はLであり、X3はD又はF又はE又はAであり、X4はG又はKであり、X5はR又はEであり、X6はV又はI又はT又はKであり、X7はI又はVであり、X8はN又はCであり、X9はP又はEであり、及びX10はE又はN又はA又はD又はKである];(xi)X1X2ADX3NAAX4X5I(配列番号85)[式中、X1はQ又はVであり、X2はN又はDであり、X3はE又はS又はV又はWであり、X4はF又はH又はS又はY又はMであり、及びX5はN又はV又はCである];及び(xii)X1X2X3DG(配列番号97)[式中、X1はG又はAであり、X2はV又はL又はM又はIであり、及びX3はR又はKである];ここで、CRISPR関連タンパク質はRNAガイドに結合し、スペーサーは標的核酸に結合する。
本明細書に記載される組成物のいずれかの一部の実施形態において、ダイレクトリピート配列は、以下の配列のうちの1つ以上を含む:(a)X1X2X3TX4X5X6X7AX8GX9[式中、X1はC又はTであり、X2はG又はAであり、X3はG又はTであり、X4はT又はA又はGであり、X5はT又はCであり、X6はA又はT又はGであり、X7はC又はAであり、X8はT又はA又はGであり、及びX9はG又はCである];及び(b)AX1ACC[式中、X1はT又はCである]。
本明細書に記載される組成物のいずれかの一部の実施形態において、CRISPR関連タンパク質は、少なくとも1つ(例えば、1つ、2つ、又は3つ)のRuvCドメイン又は少なくとも1つの分割されたRuvCドメインを含む。
本明細書に記載される組成物のいずれかの一部の実施形態において、RNAガイドのスペーサー配列は、約15ヌクレオチド~約50ヌクレオチドを含む。本明細書に記載される組成物のいずれかの一部の実施形態において、RNAガイドのスペーサー配列は、20~35ヌクレオチドを含む。
本明細書に記載される組成物のいずれかの一部の実施形態において、CRISPR関連タンパク質は触媒残基(例えば、アスパラギン酸又はグルタミン酸)を含む。本明細書に記載される組成物のいずれかの一部の実施形態において、CRISPR関連タンパク質は標的核酸を切断する。本明細書に記載される組成物のいずれかの一部の実施形態において、CRISPR関連タンパク質は、ペプチドタグ、蛍光タンパク質、塩基編集ドメイン、DNAメチル化ドメイン、ヒストン残基修飾ドメイン、局在化因子、転写修飾因子、光ゲート制御因子、化学誘導性因子、又はクロマチン可視化因子を更に含む。
本明細書に記載される組成物のいずれかの一部の実施形態において、CRISPR関連タンパク質をコードする核酸は、細胞、例えば真核細胞、例えば哺乳類細胞、例えばヒト細胞での発現にコドン最適化される。本明細書に記載される組成物のいずれかの一部の実施形態において、CRISPR関連タンパク質をコードする核酸は、プロモーターに作動可能に連結されている。本明細書に記載される組成物のいずれかの一部の実施形態において、CRISPR関連タンパク質をコードする核酸は、ベクター内にある。一部の実施形態において、ベクターは、レトロウイルスベクター、レンチウイルスベクター、ファージベクター、アデノウイルスベクター、アデノ随伴ベクター、又は単純ヘルペスベクターを含む。
本明細書に記載される組成物のいずれかの一部の実施形態において、標的核酸はDNA分子である。本明細書に記載される組成物のいずれかの一部の実施形態において、標的核酸はPAM配列を含む。
本明細書に記載される組成物のいずれかの一部の実施形態において、CRISPR関連タンパク質は、非特異的ヌクレアーゼ活性を有する。
本明細書に記載される組成物のいずれかの一部の実施形態において、CRISPR関連タンパク質及びRNAガイドによる標的核酸の認識により、標的核酸の修飾が生じる。本明細書に記載される組成物のいずれかの一部の実施形態において、標的核酸の修飾は、二本鎖切断イベントである。本明細書に記載される組成物のいずれかの一部の実施形態において、標的核酸の修飾は、一本鎖切断イベントである。本明細書に記載される組成物のいずれかの一部の実施形態において、標的核酸の修飾により、挿入イベントが生じる。本明細書に記載される組成物のいずれかの一部の実施形態において、標的核酸の修飾により、欠失イベントが生じる。本明細書に記載される組成物のいずれかの一部の実施形態において、標的核酸の修飾により、細胞毒性又は細胞死が生じる。
本明細書に記載される組成物のいずれかの一部の実施形態において、システムはドナー鋳型核酸を更に含む。本明細書に記載される組成物のいずれかの一部の実施形態において、ドナー鋳型核酸はDNA分子である。本明細書に記載される組成物のいずれかの一部の実施形態において、ここでドナー鋳型核酸はRNA分子である。
本明細書に記載される組成物のいずれかの一部の実施形態において、RNAガイドは任意選択でtracrRNAを含む。本明細書に記載される組成物のいずれかの一部の実施形態において、システムはtracrRNAを更に含む。本明細書に記載される組成物のいずれかの一部の実施形態において、システムはtracrRNAを含まない。本明細書に記載される組成物のいずれかの一部の実施形態において、CRISPR関連タンパク質は自己プロセシングである。
本明細書に記載される組成物のいずれかの一部の実施形態において、システムは、ナノ粒子、リポソーム、エキソソーム、微小胞、又は遺伝子銃を含む送達組成物中に存在する。
本明細書に記載される組成物のいずれかの一部の実施形態において、組成物は細胞内にある。一部の実施形態において、細胞は真核細胞である。一部の実施形態において、細胞は哺乳類細胞である。一部の実施形態において、細胞はヒト細胞である。一部の実施形態において、細胞は原核細胞である。
本明細書に記載されるエフェクターは、限定はされないが、1)新規核酸編集特性及び制御機構、2)送達戦略におけるより高い汎用性に比したより小さいサイズ、3)遺伝子型によって惹起される細胞死などの細胞過程、及び4)プログラム可能なRNA誘導型DNA挿入、切出し、及び動員、及び5)非ヒト共生源を介した既存の免疫の差別化されたプロファイルを含めた更なる特徴を提供する。例えば、実施例1、4、及び5並びに図1~3及び5~9を参照のこと。本明細書に記載される新規DNAターゲティングシステムがゲノム及びエピゲノム操作技法のツールボックスに加わることにより、特異的でプログラムされた摂動への幅広い適用が実現する。
本発明の他の特徴及び利点は、以下の詳細な説明から、及び特許請求の範囲から明らかであろう。
図面は、CLUST.143952と呼ばれるタンパク質クラスターの分析結果を表す一連の概略表現である。
CRISPR-Casシステムは、天然に多様であり、プログラム可能なバイオテクノロジーに生かすことのできる様々な活性機構及び機能要素が含まれている。天然では、これらのシステムが外来DNA及びウイルスに対する効率的な防御を実現する一方で、自己と非自己の判別を提供して自己標的化を回避している。エンジニアリングされた設定では、これらのシステムは、分子技術の多様なツールボックスを提供し、ターゲティング空間の境界を画定する。本明細書に記載される方法を用いて、シングルサブユニットのクラス2エフェクターシステム内に、RNAによるプログラムが可能な核酸操作の能力を拡張する、更なる機構及びパラメータが発見された。
特に定義しない限り、本明細書で使用される全ての科学技術用語は、本発明が属する技術分野の当業者が一般的に理解するのと同じ意味を有する。本発明の実施又は試験においては、本明細書に記載されるものと同様の又は等価な方法及び材料を使用し得るが、好適な方法及び材料を以下に記載する。本明細書において言及される刊行物、特許出願、特許、及び他の参考文献は全て、全体として参照により援用される。矛盾が生じる場合、定義を含め、本明細書が優先するものとする。加えて、材料、方法、及び例は例示に過ぎず、限定することを意図するものではない。出願人は、特許法の標準的な慣行に従って、「を含む」、「から本質的になる」、又は「からなる」という移行句を使用して、任意の開示された発明を代替的に請求する権利を留保する。
本明細書で使用される場合、単数形「a」、「an」、及び「the」は、文脈が明らかに他のものを示さない限り、複数の指示対象を含む。例えば、「核酸」への言及は、1つ以上の核酸を意味する。
本明細書において、「好ましくは」、「適切に」、「一般的に」、及び「典型的に」などの用語は、請求される発明の範囲を制限するため、又は特定の特徴が請求される発明の構造又は機能にとって重大、必須、又は更に重要であることを示唆するために使用されるものではないことに留意されたい。むしろ、これらの用語は、本発明の特定の実施形態において利用できる、又は利用できない、代替又は追加の特徴を強調することを単に意図するものである。
本発明を説明及び定義する目的で、用語「実質的に」は、任意の定量的比較、値、測定、又は他の表現に帰することができる固有の不確実性の程度を表すために本明細書で使用されることに留意されたい。用語「実質的に」はまた、問題となっている主題の基本的な機能に変化をもたらすことなく、記載される参照物から定量的表現が変化し得る程度を表すために本明細書で使用される。
用語「CRISPR-Casシステム」は、本明細書で使用されるとき、CRISPRエフェクターをコードする配列、RNAガイド、並びに他の配列及びCRISPR遺伝子座からの転写物を含む、CRISPRエフェクターの発現に関与する、又はその活性を導く核酸及び/又はタンパク質を指す。
用語「CRISPR関連タンパク質」、「CRISPR-Casエフェクター」、「CRISPRエフェクター」、「エフェクター」、「エフェクタータンパク質」、「CRISPR酵素」などは、本明細書で同義的に使用されるとき、酵素活性を実行するタンパク質又はRNAガイドによって指定される核酸上の標的部位に結合するタンパク質を指す。一部の実施形態において、CRISPRエフェクターは、エンドヌクレアーゼ活性、ニッカーゼ活性、及び/又はエキソヌクレアーゼ活性を有する。
用語「RNAガイド」、「ガイドRNA」、「gRNA」、及び「ガイド配列」は、本明細書で使用されるとき、DNA及び/又はRNAなどの標的核酸への本明細書に記載されるエフェクターのターゲティングを促進する任意のRNA分子を指す。例示的な「RNAガイド」としては、限定はされないが、crRNA、並びにtracrRNA及び/又はモジュレーターRNAのいずれかとハイブリダイズ又は融合したcrRNAが挙げられる。一部の実施形態において、RNAガイドは、単一のRNA分子に融合された、又は別個のRNA分子としての、crRNA及びtracrRNAの両方を含む。一部の実施形態において、RNAガイドは、単一のRNA分子に融合された、又は別個のRNA分子としての、crRNA及びモジュレーターRNAを含む。一部の実施形態において、RNAガイドは、単一のRNA分子に融合された、又は別個のRNA分子としての、crRNA、tracrRNA、及びモジュレーターRNAを含む。
用語「CRISPRエフェクター複合体」、「エフェクター複合体」、又は「監視複合体」は、本明細書で使用されるとき、CRISPRエフェクターとRNAガイドとを含む複合体を指す。CRISPRエフェクター複合体は、1つ以上のアクセサリータンパク質を更に含み得る。1つ以上のアクセサリータンパク質は、非触媒性及び/又は非標的結合性であり得る。
用語「CRISPR RNA」及び「crRNA」は、本明細書で使用されるとき、CRISPRエフェクターが核酸配列を特異的に認識するために使用するガイド配列を含むRNA分子を指す。crRNA「スペーサー」配列は、核酸標的配列と相補的であり、それと部分的又は完全に結合する能力を有する。crRNAは、tracrRNAにハイブリダイズする配列を含み得る。次にはcrRNA:tracrRNA二重鎖は、CRISPRエフェクターに結合し得る。本明細書で使用されるとき、用語「プレcrRNA」は、DR-スペーサー-DR配列を含むプロセシングされていないRNA分子を指す。本明細書で使用される場合、「成熟crRNA」という用語は、プレcrRNAの処理された形態を指す。成熟crRNAは、DRスペーサー配列を含んでもよく、ここで、DRはプレcrRNAのDRの短縮型であり、且つ/又はスペーサーはプレcrRNAのスペーサーの短縮型である。
用語「トランス活性化crRNA」又は「tracrRNA」は、本明細書で使用されるとき、CRISPRエフェクターが特定の標的核酸に結合するために必要な構造及び/又は配列モチーフを形成する配列を含むRNA分子を指す。
用語「CRISPRアレイ」は、本明細書で使用されるとき、最初のCRISPRリピートの最初のヌクレオチドから始まって最後の(末端)CRISPRリピートの最後のヌクレオチドで終わる、CRISPRリピートとスペーサーとを含む核酸(例えば、DNA)セグメントを指す。典型的には、CRISPRアレイ中の各スペーサーは2つのリピート間に位置する。用語「CRISPRリピート」、「CRISPRダイレクトリピート」、及び「ダイレクトリピート」は、本明細書で使用されるとき、複数の短い定方向に反復する配列を指し、これはCRISPRアレイ内で配列変異をごく僅かしか又は全く示さない。
用語「モジュレーターRNA」は、本明細書に記載されるとき、CRISPRエフェクター又はCRISPRエフェクターを含む核タンパク質複合体の活性を調節する(例えば、増加又は減少させる)任意のRNA分子を指す。一部の実施形態において、モジュレーターRNAは、CRISPRエフェクター又はCRISPRエフェクターを含む核タンパク質複合体のヌクレアーゼ活性を調節する。
本明細書で使用されるとき、用語「標的核酸」は、RNAガイド中のスペーサーの全体又は一部に相補的なヌクレオチド配列を含む核酸を指す。一部の実施形態において、標的核酸は遺伝子を含む。一部の実施形態において、標的核酸は非コード領域(例えば、プロモーター)を含む。一部の実施形態において、標的核酸は一本鎖である。一部の実施形態において、標的核酸は二本鎖である。「転写活性部位」は、本明細書で使用されるとき、活発に転写されている核酸配列中の部位を指す。
本明細書で使用されるとき、用語「プロトスペーサー隣接モチーフ」又は「PAM」は、エフェクターとRNAガイドとを含む複合体が結合する標的配列に隣接するDNA配列を指す。一部の実施形態において、PAMは、酵素活性に必要である。本明細書で使用されるとき、用語「隣接する」には、複合体のRNAガイドが、PAMに直接隣接する標的配列と特異的に結合し、相互作用し、又は会合する場合が含まれる。そのような場合、標的配列とPAMとの間にヌクレオチドはない。用語「隣接する」にはまた、ターゲティング部分が結合する標的配列とPAMとの間に少数(例えば、1、2、3、4、又は5個)のヌクレオチドがある場合も含まれる。
用語「活性化したCRISPRエフェクター複合体」、「活性化したCRISPR複合体」、及び「活性化した複合体」は、本明細書で使用されるとき、標的核酸を修飾することができるCRISPRエフェクター複合体を指す。一部の実施形態において、活性化したCRISPR複合体は、活性化したCRISPR複合体が標的核酸に結合した後、標的核酸を修飾することができる。一部の実施形態において、活性化したCRISPR複合体の標的核酸への結合により、コラテラル切断などの追加の切断イベントが生じる。
用語「切断イベント」は、本明細書で使用されるとき、DNA及び/又はRNAなどの核酸の切断を指す。一部の実施形態において、切断イベントは、本明細書で使用されるとき、本明細書に記載されるCRISPRシステムのヌクレアーゼによって作り出される標的核酸における切断を指す。一部の実施形態において、切断イベントは二本鎖DNA切断である。一部の実施形態において、切断イベントは一本鎖DNA切断である。一部の実施形態において、切断イベントは、コラテラル核酸の切断を指す。
用語「コラテラル核酸」は、本明細書で使用されるとき、活性化したCRISPR複合体によって非特異的に切断される核酸基質を指す。用語「コラテラルDNアーゼ活性」は、本明細書でCRISPRエフェクターに言及して使用されるとき、活性化したCRISPR複合体の非特異的DNアーゼ活性を指す。用語「コラテラルRNアーゼ活性」は、本明細書でCRISPRエフェクターに言及して使用されるとき、活性化したCRISPR複合体の非特異的RNアーゼ活性を指す。
用語「ドナー鋳型核酸」は、本明細書で使用されるとき、本明細書に記載されるCRISPRエフェクターが標的核酸を修飾した後、標的配列又は標的近位配列に、鋳型化された変更を行うために使用できる核酸分子を指す。一部の実施形態において、ドナー鋳型核酸は二本鎖核酸である。一部の実施形態において、ドナー鋳型核酸は一本鎖核酸である。一部の実施形態において、ドナー鋳型核酸は線状である。一部の実施形態において、ドナー鋳型核酸は環状(例えば、プラスミド)である。一部の実施形態において、ドナー鋳型核酸は外因性核酸分子である。一部の実施形態において、ドナー鋳型核酸は内因性核酸分子(例えば、染色体)である。
本明細書で使用される場合、「ポリヌクレオチド」、「ヌクレオチド」、「オリゴヌクレオチド」、及び「核酸」という用語は、DNA、RNA、それらの誘導体、又はそれらの組み合わせを含む核酸を指すために同義的に使用され得る。当業者に周知の方法を使用して、本発明による遺伝子発現構築物及び組換え細胞を構築することができる。これらの方法としては、インビトロ組換えDNA技術、合成技術、インビボ組換え技術、及びポリメラーゼ連鎖反応(PCR)技術が挙げられる。例えば、Maniatis et al.,1989,MOLECULAR CLONING:A LABORATORY MANUAL,Cold Spring Harbor Laboratory,New York;Ausubel et al.,1989,CURRENT PROTOCOLS IN MOLECULAR BIOLOGY,Greene Publishing Associates and Wiley Interscience,New York、及びPCR Protocols:A Guide to Methods and Applications (Innis et al.,1990,Academic Press,San Diego,Calif.)に記載される技術を参照されたい。
用語「遺伝子修飾」又は「遺伝子エンジニアリング」は、広義には、細胞のゲノム又は核酸の操作を指す。同様に、用語「遺伝子エンジニアリングされた」及び「エンジニアリングされた」は、操作されたゲノム又は核酸を含む細胞を指す。遺伝子修飾の方法としては、例えば、異種遺伝子発現、遺伝子又はプロモーターの挿入又は欠失、核酸変異、遺伝子発現又は不活性化の変化、酵素エンジニアリング、定向進化、知識ベースの設計、ランダム突然変異誘発法、遺伝子シャッフリング、及びコドン最適化が挙げられる。
用語「組換え」は、核酸、タンパク質、又は細胞が遺伝子修飾、エンジニアリング、又は組換えの産物であることを示す。一般に、用語「組換え」は、複数の供給源に由来する遺伝物質を含むか、又はそれらによってコードされる、核酸、タンパク質、又は細胞を指す。本明細書で使用されるとき、用語「組換え」という用語はまた、内因性核酸又はタンパク質の変異型を含む、変異核酸又はタンパク質を含む細胞を説明するために使用され得る。用語「組換え細胞」及び「組換え宿主」は、同義的に使用することができる。一部の実施形態において、組換え細胞は、本明細書に開示されるCRISPRエフェクターを含む。CRISPRエフェクターは組換え細胞における発現のためにコドン最適化することができる。一部の実施形態において、本明細書に開示される組換え細胞は、RNAガイドを更に含む。一部の実施形態において、本明細書に開示される組換え細胞のRNAガイドは、tracrRNAを含む。一部の実施形態において、本明細書に開示される組換え細胞は、モジュレーターRNAを含む。一部の実施形態において、組換え細胞は、大腸菌(E.coli)細胞などの原核細胞である。一部の実施形態において、組換え細胞は、ヒト細胞を含む哺乳動物細胞などの真核細胞である。
CLUST.143952の同定
この出願は、本明細書において「CLUST.143952」と呼ばれる新規タンパク質ファミリーの同定、エンジニアリング、及び使用に関する。図2に示すように、CLUST.143952のタンパク質は、RuvCドメイン(RuvC I、RuvC II、及びRuvC IIIと表示される)を含む。CLUST.143952のタンパク質は、Znフィンガードメインを更に含み得る。表4に示すように、CLUST.143952のエフェクターのサイズは、約700アミノ酸~約850アミノ酸の範囲である。従って、以下に示すように、CLUST.143952のエフェクターは、当技術分野で知られているエフェクターよりも小さい。例えば、表1を参照されたい。
この出願は、本明細書において「CLUST.143952」と呼ばれる新規タンパク質ファミリーの同定、エンジニアリング、及び使用に関する。図2に示すように、CLUST.143952のタンパク質は、RuvCドメイン(RuvC I、RuvC II、及びRuvC IIIと表示される)を含む。CLUST.143952のタンパク質は、Znフィンガードメインを更に含み得る。表4に示すように、CLUST.143952のエフェクターのサイズは、約700アミノ酸~約850アミノ酸の範囲である。従って、以下に示すように、CLUST.143952のエフェクターは、当技術分野で知られているエフェクターよりも小さい。例えば、表1を参照されたい。
CLUST.143952のエフェクターは、他の特定の機能との強力な共出現パターンを呈するタンパク質を検索及び同定するために、計算方法及びアルゴリズムを使用して同定された。特定の実施形態において、これらの計算的方法は、CRISPRアレイにごく近接して共出現するタンパク質を同定することに関するものであった。本明細書に開示される方法は、非コード及びタンパク質コードの両方の(例えば、細菌遺伝子座の非コード範囲にあるファージ配列の断片;又はCRISPR Cas1タンパク質)、他の特徴にごく近接した範囲内に天然に出現するタンパク質の同定においても有用である。本明細書に記載される方法及び計算は1つ以上の計算装置で実施されてもよいことが理解される。
ゲノム又はメタゲノムデータベースから一組のゲノム配列が入手された。データベースは、ショートリード、又はコンティグレベルデータ、又はアセンブルされたスキャフォールド、又は生物の完全ゲノム配列を含んだ。同様に、データベースは、原核生物、若しくは真核生物からのゲノム配列データを含んでもよく、又はメタゲノム環境試料からのデータを含んでもよい。データベースリポジトリの例としては、国立バイオテクノロジー情報センター(National Center for Biotechnology Information:NCBI)のRefSeq、NCBIのGenBank、NCBIの全ゲノムショットガン(Whole Genome Shotgun:WGS)、及びジョイントゲノム研究所(Joint Genome Institute:JGI)の統合微生物ゲノム(Integrated Microbial Genomes:IMG)が挙げられる。
一部の実施形態において、指定される最小長さのゲノム配列データの選択には、最小サイズ要件が課される。特定の例示的実施形態において、最小コンティグ長さは、100ヌクレオチド、500nt、1kb、1.5kb、2kb、3kb、4kb、5kb、10kb、20kb、40kb、又は50kbであってもよい。
一部の実施形態において、公知の又は予測されるタンパク質は、完全な又は選択された一組のゲノム配列データから抽出される。一部の実施形態において、公知の又は予測されるタンパク質は、ソースデータベースによって提供されるコード配列(CDS)アノテーションを抽出することから取られる。一部の実施形態において、予測タンパク質は、計算的方法を適用してヌクレオチド配列からタンパク質を同定することにより決定される。一部の実施形態では、GeneMarkスイートを使用してゲノム配列からタンパク質が予測される。一部の実施形態では、Prodigalを使用してゲノム配列からタンパク質が予測される。一部の実施形態では、同じ一組の配列データに対して複数のタンパク質予測アルゴリズムが用いられ、得られる一組のタンパク質から重複が排除されてもよい。
一部の実施形態において、CRISPRアレイはゲノム配列データから同定される。一部の実施形態では、PILER-CRを使用してCRISPRアレイが同定される。一部の実施形態では、CRISPR認識ツール(CRISPR Recognition Tool:CRT)を使用してCRISPRアレイが同定される。一部の実施形態において、CRISPRアレイは、最小限の回数(例えば2、3、又は4回)繰り返されるヌクレオチドモチーフを同定する発見的手法によって同定され、ここで繰り返されるモチーフの連続する出現間の間隔は、指定される長さ(例えば、50、100、又は150ヌクレオチド)を超えない。一部の実施形態では、同じ一組の配列データに対して複数のCRISPRアレイ同定ツールが用いられ、得られる一組のCRISPRアレイから重複が排除されてもよい。
一部の実施形態において、CRISPRアレイ(本明細書では「CRISPR近位タンパク質クラスター」と呼ばれる)にごく近接しているタンパク質が同定される。一部の実施形態において、近接性はヌクレオチド距離として定義され、20kb、15kb、又は5kb以内であってもよい。一部の実施形態において、近接性は、タンパク質とCRISPRアレイとの間にあるオープンリーディングフレーム(ORF)の数として定義され、特定の例示的距離は、10、5、4、3、2、1、又は0個のORFであり得る。CRISPRアレイとごく近接した範囲内にあると同定されたタンパク質は、次に相同タンパク質クラスターにまとめられる。一部の実施形態において、blastclustを使用してCRISPR近位タンパク質クラスターが形成される。特定の他の実施形態において、mmseqs2を使用してCRISPR近位タンパク質クラスターが形成される。
CRISPR近接タンパク質クラスターのメンバー間に強力な共出現パターンを確立するため、予め編成された完全な一組の公知の及び予測されるタンパク質に対してタンパク質クラスターの各メンバーのBLAST検索が実施されてもよい。一部の実施形態では、UBLAST又はmmseqs2を使用して類似のタンパク質が検索されてもよい。一部の実施形態では、ファミリー内のタンパク質の代表的なサブセットについてのみ検索が実施されてもよい。
一部の実施形態では、CRISPR近接タンパク質クラスターがメトリックによって順位付けされるか又はフィルタリングされることにより共出現が決定される。1つの例示的メトリックは、特定のE値閾値に至るまでのBLASTマッチの数に対するタンパク質クラスター内の要素の数の比である。一部の実施形態では、一定のE値閾値が使用されてもよい。他の実施形態では、E値閾値は、タンパク質クラスターの最も離れたメンバーによって決定されてもよい。一部の実施形態において、大域的な一組のタンパク質がクラスター化され、共出現メトリックは、含まれる1つ又は複数の大域的クラスターの要素の数に対するCRISPR近接タンパク質の要素の数の比である。
一部の実施形態において、手動でのレビュープロセスを用いることにより、クラスター中のタンパク質の天然に存在する遺伝子座構造に基づいてエンジニアリングされるシステムの潜在的機能性及び最小限の一組の成分が評価される。一部の実施形態において、手動でのレビューにはタンパク質クラスターの図解表現が役立ち得るとともに、これは、ペアワイズでの配列類似性、系統樹、供給源生物/環境、予測される機能性ドメイン、及び遺伝子座構造の図解描写を含む情報を含み得る。一部の実施形態において、遺伝子座構造の図解描写は、高い代表性を有する近隣タンパク質ファミリーをフィルタリングし得る。一部の実施形態において、代表性は、含んでいる1つ又は複数の大域的クラスターの1つ又は複数のサイズに対する関連する近隣タンパク質の数の比によって計算されてもよい。特定の例示的実施形態において、タンパク質クラスターの図解表現は、天然に存在する遺伝子座のCRISPRアレイ構造の描写を含み得る。一部の実施形態において、タンパク質クラスターの図解表現は、推定CRISPRアレイの長さに対する保存されたダイレクトリピートの数、又は推定CRISPRアレイの長さに対するユニークなスペーサー配列の数の描写を含み得る。一部の実施形態において、タンパク質クラスターの図解表現は、CRISPRアレイとの推定エフェクターの様々な共出現メトリックの描写を含み、新規CRISPR-Casシステムを予測し、及びその成分を同定し得る。
CLUST.143952のプール型スクリーニング
本明細書で同定された、エンジニアリングされたCLUST.143952 CRISPR-Casシステムの活性、メカニズム、及び機能パラメータを効率的に検証するために、実施例2で説明されるように、大腸菌(E.coli)におけるプール型スクリーニングアプローチを使用した。第一に、CRIST.143952CRISPR-Casシステムの保存タンパク質及び非コードエレメントの計算的同定から、DNA合成及び分子クローニングを用いて個別の成分を単一の人工発現ベクター(一実施形態ではpET-28a+骨格をベースとする)にアセンブルする。第2の実施形態では、エフェクター及び非コードエレメントをmRNA転写物に転写し、異なるリボソーム結合部位を用いて個々のエフェクターを翻訳する。
本明細書で同定された、エンジニアリングされたCLUST.143952 CRISPR-Casシステムの活性、メカニズム、及び機能パラメータを効率的に検証するために、実施例2で説明されるように、大腸菌(E.coli)におけるプール型スクリーニングアプローチを使用した。第一に、CRIST.143952CRISPR-Casシステムの保存タンパク質及び非コードエレメントの計算的同定から、DNA合成及び分子クローニングを用いて個別の成分を単一の人工発現ベクター(一実施形態ではpET-28a+骨格をベースとする)にアセンブルする。第2の実施形態では、エフェクター及び非コードエレメントをmRNA転写物に転写し、異なるリボソーム結合部位を用いて個々のエフェクターを翻訳する。
第二に、天然のcrRNA及びターゲティングスペーサーを、第2のプラスミドpACYC184を標的化する非天然スペーサーを含むプロセシングされていないcrRNAのライブラリに置き換える。このcrRNAライブラリをエフェクター及び非コードエレメントを含むベクター骨格(例えばpET-28a+)にクローニングし、その後、続いてこのライブラリをpACYC184プラスミド標的と共に大腸菌(E.coli)に形質転換する。結果的に、得られる各大腸菌(E.coli)細胞は、ただ1つのターゲティングアレイを含む。代替的実施形態では、非天然スペーサーを含むプロセシングされていないcrRNAのライブラリが、Baba et al.(2006)Mol.Syst.Biol.2:2006.0008;及びGerdes et al.(2003)J.Bacteriol.185(19):5673-84(これらの各々の内容全体は参照により本明細書に援用される)に記載されるものなどの資料から引用される大腸菌(E.coli)必須遺伝子を更に標的化する。この実施形態において、必須遺伝子機能を破壊する新規CRISPR-Casシステムの正の標的化された活性は、細胞死又は成長停止を生じさせる。一部の実施形態において、必須遺伝子ターゲティングスペーサーをpACYC184標的と組み合わせることができる。
第三に、抗生物質選択下で大腸菌(E.coli)を成長させる。一実施形態において、三重抗生物質選択:エンジニアリングされたCRISPRエフェクターシステムを含むpET-28a+ベクターの形質転換の成功を確認するためのカナマイシン、並びにpACYC184標的ベクターの同時形質転換の成功を確認するためのクロラムフェニコール及びテトラサイクリンが用いられる。pACYC184は通常、クロラムフェニコール及びテトラサイクリンに対する耐性を付与するため、抗生物質選択下では、このプラスミドを標的化する新規CRISPR-Casシステムの正の活性により、エフェクター、非コードエレメント、及びcrRNAライブラリの特異的活性エレメントを活性に発現する細胞が排除されることになる。典型的には、生存細胞の集団は、形質転換の12~14時間後に分析される。一部の実施形態において、生存細胞の分析は、形質転換後6~8時間、形質転換後8~12時間、形質転換後最大24時間、又は形質転換後24時間を超えて、行われる。早い時点と比較した後の時点における生存細胞集団を調べると、不活性crRNAと比較してシグナルの枯渇が生じる。
一部の実施形態において、二重抗生物質選択が用いられる。クロラムフェニコール又はテトラサイクリンのいずれかを抜き取って選択圧を除去すると、ターゲティング基質、配列特異性、及び効力に関する新規情報を得ることができる。例えば、選択された遺伝子又は選択されていない遺伝子におけるdsDNAの切断により、選択された遺伝子及び選択されていない遺伝子の両方の枯渇が観察される大腸菌(E.coli)におけるネガティブ選択が生じ得る。CRISPR-Casシステムが転写又は翻訳に干渉する場合(例えば、結合又は転写物の切断によって)、選択は、選択されていない耐性遺伝子というよりむしろ、選択された耐性遺伝子の標的に対してのみ観察される。
一部の実施形態では、カナマイシンのみを使用して、エンジニアリングされたCRISPR-Casシステムを含むpET-28a+ベクターの形質転換の成功が確認される。この実施形態は、成長の変化を観察するためにカナマイシン以外の更なる選択が必要ないため、大腸菌(E.coli)必須遺伝子を標的化するスペーサーを含むライブラリに好適である。この実施形態では、クロラムフェニコール及びテトラサイクリン依存性が取り除かれ、ライブラリ中のそれらの標的(存在する場合)が、ターゲティング基質、配列特異性、及び効力に関するネガティブ又はポジティブの更なる情報源を提供する。
pACYC184プラスミドは、CRISPR-Casシステムの活性に影響を及ぼし得る多様な一組の特徴及び配列を含むため、プール型スクリーンからの活性crRNAをpACYC184にマッピングすることにより、種々の活性機構及び機能パラメータを示唆するものであり得る活性パターンが提供される。このようにして、異種原核生物種における新規CRISPR-Casシステムの再構成に必要な特徴をより包括的に試験し、研究することができる。
本明細書に記載されるインビボプール型スクリーンの重要な利点としては、以下が挙げられる:
(1)汎用性-プラスミド設計により、複数のエフェクター及び/又は非コードエレメントを発現させることが可能になる;ライブラリクローニング戦略により、計算的に予測されたcrRNAの両方の転写方向の発現が実現する;
(2)活性機構及び機能パラメータの包括的試験により、核酸切断を含めた多様な干渉機構を評価し;転写、プラスミドDNA複製などの特徴の共出現;及びcrRNAライブラリについてのフランキング配列を調べて、4Nの複雑さ等価のPAMを確実に決定することができる;
(3)感度-pACYC184は低コピープラスミドであり、僅かな干渉率であっても、プラスミドによってコードされる抗生物質耐性を除去することができるため、CRISPR-Cas活性について高感度を実現する;及び
(4)効率-RNAシーケンシングについてより高い速度及びスループットを実現する最適化された分子生物学ステップは、タンパク質発現試料をスクリーンにおける生存細胞から直接採取することができる。
(1)汎用性-プラスミド設計により、複数のエフェクター及び/又は非コードエレメントを発現させることが可能になる;ライブラリクローニング戦略により、計算的に予測されたcrRNAの両方の転写方向の発現が実現する;
(2)活性機構及び機能パラメータの包括的試験により、核酸切断を含めた多様な干渉機構を評価し;転写、プラスミドDNA複製などの特徴の共出現;及びcrRNAライブラリについてのフランキング配列を調べて、4Nの複雑さ等価のPAMを確実に決定することができる;
(3)感度-pACYC184は低コピープラスミドであり、僅かな干渉率であっても、プラスミドによってコードされる抗生物質耐性を除去することができるため、CRISPR-Cas活性について高感度を実現する;及び
(4)効率-RNAシーケンシングについてより高い速度及びスループットを実現する最適化された分子生物学ステップは、タンパク質発現試料をスクリーンにおける生存細胞から直接採取することができる。
このインビボプール型スクリーンを用いてその作動可能なエレメント、機構及びパラメータ、並びにその内因性細胞環境の外部でエンジニアリングされたシステムにおいて活性であり再プログラム化されるその能力を評価することにより、本明細書に記載される新規CRIST.143952CRISPR-Casファミリーを評価した。
CRISPRエフェクターの活性及び修飾
一部の実施形態において、CRIST.143952のCRISPRエフェクター及びRNAガイドは、他の成分を含み得る二元複合体を形成する。二元複合体は、RNAガイド中のスペーサー配列に相補的な核酸基質(即ち、配列特異的基質又は標的核酸)への結合時に活性化される。一部の実施形態において、配列特異的基質は二本鎖DNAである。一部の実施形態において、配列特異的基質は一本鎖DNAである。一部の実施形態において、配列特異的基質は一本鎖RNAである。一部の実施形態において、配列特異的基質は二本鎖RNAである。一部の実施形態において、配列特異性は、RNAガイド(例えば、crRNA)中のスペーサー配列と標的基質の完全な一致を必要とする。他の実施形態において、配列特異性は、RNAガイド(例えば、crRNA)中のスペーサー配列と標的基質の部分的な(連続的又は非連続的な)一致を必要とする。
一部の実施形態において、CRIST.143952のCRISPRエフェクター及びRNAガイドは、他の成分を含み得る二元複合体を形成する。二元複合体は、RNAガイド中のスペーサー配列に相補的な核酸基質(即ち、配列特異的基質又は標的核酸)への結合時に活性化される。一部の実施形態において、配列特異的基質は二本鎖DNAである。一部の実施形態において、配列特異的基質は一本鎖DNAである。一部の実施形態において、配列特異的基質は一本鎖RNAである。一部の実施形態において、配列特異的基質は二本鎖RNAである。一部の実施形態において、配列特異性は、RNAガイド(例えば、crRNA)中のスペーサー配列と標的基質の完全な一致を必要とする。他の実施形態において、配列特異性は、RNAガイド(例えば、crRNA)中のスペーサー配列と標的基質の部分的な(連続的又は非連続的な)一致を必要とする。
一部の実施形態において、本発明のCRISPRエフェクターは、幅広いpH条件にわたって酵素活性、例えばヌクレアーゼ活性を有する。一部の実施形態において、ヌクレアーゼは、約3.0~約12.0のpHで酵素活性、例えばヌクレアーゼ活性を有する。一部の実施形態において、CRISPRエフェクターは、約4.0~約10.5のpHで酵素活性を有する。一部の実施形態において、CRISPRエフェクターは、約5.5~約8.5のpHで酵素活性を有する。一部の実施形態において、CRISPRエフェクターは、約6.0~約8.0のpHで酵素活性を有する。一部の実施形態において、CRISPRエフェクターは、約7.0のpHで酵素活性を有する。
一部の実施形態において、本発明のCRISPRエフェクターは、約10℃~約100℃の温度範囲で酵素活性、例えばヌクレアーゼ活性を有する。一部の実施形態において、本発明のCRISPRエフェクターは、約20℃~約90℃の温度範囲で酵素活性を有する。一部の実施形態において、本発明のCRISPRエフェクターは、約20℃~約25℃の温度又は約37℃の温度で酵素活性を有する。
一部の実施形態において、二元複合体は標的基質への結合時に活性化した状態になる。一部の実施形態において、活性化した複合体は、「複数回の代謝回転」活性を呈し、従って標的基質への作用時(例えば、それの切断時)、活性化した複合体は活性化した状態のままである。一部の実施形態において、活性化した二元複合体は「単回の代謝回転」活性を呈し、従って標的基質への作用時、二元複合体は不活性状態に戻る。一部の実施形態において、活性化した二元複合体は非特異的な(即ち、「コラテラル」)切断活性を呈し、従って複合体は非標的核酸を切断する。一部の実施形態において、非標的核酸は、DNA分子(例えば、一本鎖又は二本鎖DNA)である。一部の実施形態において、非標的核酸は、RNA分子(例えば、一本鎖又は二本鎖RNA)である。
本発明のCRISPRエフェクターが標的核酸(例えばゲノムDNA)に二本鎖切断又は一本鎖切断を誘導する一部の実施形態において、二本鎖切断は、相同的組換え(Homology Directed Recombination)(HDR)、非相同末端結合(NHEJ)、又は代替非相同末端結合(A-NHEJ)を含めた細胞内因性DNA修復経路を刺激し得る。NHEJは、相同鋳型の必要なしに、切断された標的核酸を修復することができる。この結果、標的遺伝子座に1つ以上のヌクレオチドの欠失又は挿入が生じ得る。HDRは、ドナーDNAなど、相同鋳型を伴い起こり得る。相同鋳型が、標的核酸切断部位に隣接する配列と相同な配列を含み得る。ある場合には、HDRは、切断された標的遺伝子座に外因性ポリヌクレオチド配列を挿入することができる。NHEJ及び/又はHDRによる標的DNAの修飾は、例えば、突然変異、欠失、改変、組込み、遺伝子修正、遺伝子置換、遺伝子タグ付加、トランス遺伝子ノックイン、遺伝子破壊、及び/又は遺伝子ノックアウトにつながり得る。
一部の実施形態において、本明細書に記載されるCRISPRエフェクターは、Hisタグ、GSTタグ、FLAGタグ、又はmycタグを含めた1つ以上のペプチドタグに融合することができる。一部の実施形態において、本明細書に記載されるCRISPRエフェクターは、蛍光タンパク質(例えば、緑色蛍光タンパク質又は黄色蛍光タンパク質)など、検出可能部分に融合することができる。一部の実施形態において、本開示のCRISPRエフェクター及び/又はアクセサリータンパク質は、タンパク質を組織、細胞、又は細胞の領域に侵入又は局在化させるペプチド又は非ペプチド部分に融合される。例えば、本開示のCRISPRエフェクターは、SV40(シミアンウイルス40)NLS、c-Myc NLS、又は他の好適な単節型NLSなどの核局在化配列(NLS)を含んでもよい。NLSは、CRISPRエフェクターのN末端及び/又はC末端に融合されてもよく、且つ単独で融合されても(即ち、単一のNLS)、又はコンカテマー化されてもよい(例えば、2、3、4個等のNLSの鎖)。
一部の実施形態において、少なくとも1つの核外輸送シグナル(NES)が、CRISPRエフェクターをコードする核酸配列に取り付けられている。一部の実施形態において、C末端及び/又はN末端NLS又はNESは、真核細胞、例えばヒト細胞における最適な発現及び核ターゲティングのために取り付けられる。
CRISPRエフェクターにタグが融合される実施形態において、かかるタグは、例えば、液体クロマトグラフィー又は固定化したアフィニティー若しくはイオン交換試薬を利用するビーズ分離による、CRISPRエフェクターの親和性ベース又は電荷ベースの精製を促進し得る。非限定的な例として、本開示の組換えCRISPRエフェクターはポリヒスチジン(His)タグを含み、精製のため、固定化された金属イオンを含むクロマトグラフィーカラムにロードされる(例えば、樹脂上に固定化されたキレートリガンドによってキレートされたZn2+、Ni2+、Cu2+イオン、この樹脂は、個々に調製された樹脂又は市販の樹脂若しくはGE Healthcare Life Sciences、Marlborough,Massachusettsによって商品化されているHisTrap FFカラムなどの既製のカラムであってもよい。ローディングステップの後、カラムは任意選択で、例えば1つ以上の好適な緩衝溶液を使用してリンスされ、次にHisタグが付加されたタンパク質が好適な溶出緩衝液を使用して溶出される。それに代えて又は加えて、本開示の組換えCRISPRエフェクターがFLAGタグを利用する場合、かかるタンパク質は、本業界で公知の免疫沈降法を用いて精製されてもよい。タグが付加された本開示のCRISPRエフェクター又はアクセサリータンパク質について他の好適な精製方法が当業者には明らかであろう。
本明細書に記載されるタンパク質(例えば、CRISPRエフェクター又はアクセサリータンパク質)は、核酸分子又はポリペプチドのいずれとしても送達又は使用することができる。核酸分子を使用する場合、CRISPRエフェクターをコードする核酸分子をコドン最適化することができる。核酸は、任意の目的の生物、詳細にはヒト細胞又は細菌での使用にコドン最適化することができる。例えば、核酸は、マウス、ラット、ウサギ、イヌ、家畜、又は非ヒト霊長類を含めた任意の非ヒト真核生物向けにコドン最適化することができる。コドン使用表が、例えば、www.kazusa.orjp/codon/で利用可能な「コドン使用データベース(Codon Usage Database)」において容易に利用可能であり、これらの表を幾つもの方法で適合させることができる。Nakamura et al.Nucl.Acids Res.28:292(2000)(全体として参照により本明細書に援用される)を参照のこと。特定の配列を特定の宿主細胞での発現にコドン最適化するためのコンピュータアルゴリズムもまた、Gene Forge(Aptagen;Jacobus,PA)など、利用可能である。
一部の例では、真核生物(例えば、ヒト、又は他の哺乳類細胞)細胞で発現させるためのCRISPRエフェクターをコードする本開示の核酸は、1つ以上のイントロン、即ち、第1の端部(例えば、5’末端)にスプライスドナー配列を含み、且つ第2の端部(例えば、3’末端)にスプライスアクセプター配列を含む1つ以上の非コード配列を含む。本開示の様々な実施形態において、限定なしに、シミアンウイルス40(SV40)イントロン、β-グロビンイントロン、及び合成イントロンを含め、任意の好適なスプライスドナー/スプライスアクセプターを使用することができる。それに代えて又は加えて、CRISPRエフェクター又はアクセサリータンパク質をコードする本開示の核酸は、DNAコード配列の3’末端に、ポリアデニル化(ポリA)シグナルなどの転写終結シグナルを含み得る。一部の例では、ポリAシグナルは、SV40イントロンなどのイントロンにごく近接して、又はそれに隣接して位置する。
非活性化/不活性化CRISPRエフェクター
本明細書に記載されるCRISPRエフェクターが、減少したヌクレアーゼ活性、例えば、野生型CRISPRエフェクターと比較したとき少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも97%、又は100%のヌクレアーゼ不活性化となるようにCRISPR酵素を修飾することができる。ヌクレアーゼ活性は、当技術分野で周知の幾つかの方法、例えば、タンパク質のヌクレアーゼドメインへの突然変異の導入によって減少させることができる。一部の実施形態において、ヌクレアーゼ活性の触媒残基が同定され、それらのアミノ酸残基を異なるアミノ酸残基(例えば、グリシン又はアラニン)に置換することによりヌクレアーゼ活性を減少させてもよい。
本明細書に記載されるCRISPRエフェクターが、減少したヌクレアーゼ活性、例えば、野生型CRISPRエフェクターと比較したとき少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも97%、又は100%のヌクレアーゼ不活性化となるようにCRISPR酵素を修飾することができる。ヌクレアーゼ活性は、当技術分野で周知の幾つかの方法、例えば、タンパク質のヌクレアーゼドメインへの突然変異の導入によって減少させることができる。一部の実施形態において、ヌクレアーゼ活性の触媒残基が同定され、それらのアミノ酸残基を異なるアミノ酸残基(例えば、グリシン又はアラニン)に置換することによりヌクレアーゼ活性を減少させてもよい。
不活性化されたCRISPRエフェクターは、1つ以上の機能的ドメインを含むか、又はそれと関連づけられ得る(例えば、融合タンパク質、リンカーペプチド、「GS」リンカーなどを介して)。こうした機能性ドメインは様々な活性、例えば、メチラーゼ活性、デメチラーゼ活性、転写活性化活性、転写抑制活性、転写放出因子活性、ヒストン修飾活性、RNA切断活性、DNA切断活性、核酸結合活性、及びスイッチ活性(例えば、光誘導性)を有することができる。一部の実施形態において、機能性ドメインは、クルッペル関連ボックス(KRAB)、VP64、VP16、Fok1、P65、HSF1、MyoD1、及びビオチン-APEXである。
不活性化されたCRISPRエフェクター上に1つ以上の機能性ドメインを位置させることは、その機能性ドメインが帰属する機能的効果による影響を標的に及ぼすのに正しい空間上の向きとなることを可能にする。例えば、機能性ドメインが転写活性化因子(例えば、VP16、VP64、又はp65)である場合、その転写活性化因子は、それが標的の転写に影響を及ぼすことが可能になる空間上の向きに置かれる。同様に、転写リプレッサーが標的の転写に影響を及ぼすように位置し、及びヌクレアーゼ(例えば、Fok1)が標的を切断又は部分的に切断するように位置する。一部の実施形態において、機能性ドメインはCRISPRエフェクターのN末端に位置する。一部の実施形態において、機能性ドメインはCRISPRエフェクターのC末端に位置する。一部の実施形態において、不活性化されたCRISPRエフェクターは、N末端に第1の機能性ドメイン及びC末端に第2の機能性ドメインを含むように修飾される。
スプリット酵素
本開示はまた、本明細書に記載されるCRISPRエフェクターのスプリットバージョンも提供する。スプリットバージョンのCRISPRエフェクターは送達に有利であり得る。一部の実施形態において、CRISPRエフェクターは酵素の2つの部分に分割され、それらが一緒になって実質的に機能性のCRISPRエフェクターを含む。
本開示はまた、本明細書に記載されるCRISPRエフェクターのスプリットバージョンも提供する。スプリットバージョンのCRISPRエフェクターは送達に有利であり得る。一部の実施形態において、CRISPRエフェクターは酵素の2つの部分に分割され、それらが一緒になって実質的に機能性のCRISPRエフェクターを含む。
分割は、1つ又は複数の触媒ドメインが影響を受けないような方法で行われ得る。CRISPRエフェクターはヌクレアーゼとして機能してもよく、又は本質的に(例えば、その触媒ドメインにある1つ又は複数の突然変異に起因して)触媒活性がごく僅かしかない又は全くないRNA結合タンパク質である不活性化された酵素であってもよい。
一部の実施形態では、ヌクレアーゼローブ及びα-ヘリックスローブが別個のポリペプチドとして発現する。これらのローブはそれ自体には相互作用を及ぼさないが、RNAガイドがそれらを複合体へと動員し、その複合体が完全長CRISPRエフェクターの活性を再現し、部位特異的DNA切断を触媒する。修飾されたRNAガイドを使用すると、二量化が妨げられることによりスプリット酵素活性が無効になり、誘導性の二量化システムの開発が可能となる。スプリット酵素については、例えば、Wright et al.“Rational design of a split-Cas9 enzyme complex,”Proc.Nat’l.Acad.Sci.,112.10(2015):2984-2989(全体として参照により本明細書に援用される)に記載されている。
一部の実施形態において、スプリット酵素は、例えばラパマイシン感受性二量化ドメインを利用することにより、二量化パートナーに融合されてもよい。これにより、CRISPRエフェクター活性を時間的に制御するための化学誘導性CRISPRエフェクターの作成が可能になる。このようにして2つの断片に分割されていることによりCRISPRエフェクターを化学誘導性にすることができ、CRISPRエフェクターの制御された再アセンブルにはラパマイシン感受性二量化ドメインを使用することができる。
分割点は、典型的にはインシリコで設計され、コンストラクトにクローニングされる。この過程でスプリット酵素に突然変異が導入されてもよく、非機能性ドメインが除去されてもよい。一部の実施形態において、スプリットCRISPRエフェクターの2つの部分又は断片(即ち、N末端及びC末端断片)は、例えば野生型CRISPRエフェクターの配列の少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%、又は少なくとも99%を含む完全なCRISPRエフェクターを形成することができる。
自己活性化型又は不活性化型酵素
本明細書に記載されるCRISPRエフェクターは、自己活性化型又は自己不活性化型であるように設計されてもよい。一部の実施形態において、CRISPRエフェクターは自己不活性化型である。例えば、CRISPRエフェクターをコードするコンストラクトに標的配列を導入することができる。従ってCRISPRエフェクターが標的配列を切断するとともに、それによって酵素をコードするコンストラクトがその発現を自己不活性化し得る。自己不活性化CRISPRシステムの構築方法については、例えば、Epstein et al.,“Engineering a Self-Inactivating CRISPR System for AAV Vectors,”Mol.Ther.,24(2016):S50(全体として参照により本明細書に援用される)に記載されている。
本明細書に記載されるCRISPRエフェクターは、自己活性化型又は自己不活性化型であるように設計されてもよい。一部の実施形態において、CRISPRエフェクターは自己不活性化型である。例えば、CRISPRエフェクターをコードするコンストラクトに標的配列を導入することができる。従ってCRISPRエフェクターが標的配列を切断するとともに、それによって酵素をコードするコンストラクトがその発現を自己不活性化し得る。自己不活性化CRISPRシステムの構築方法については、例えば、Epstein et al.,“Engineering a Self-Inactivating CRISPR System for AAV Vectors,”Mol.Ther.,24(2016):S50(全体として参照により本明細書に援用される)に記載されている。
一部の他の実施形態では、弱いプロモーター(例えば、7SKプロモーター)の制御下で発現する更なるRNAガイドが、CRISPRエフェクターをコードする核酸配列を標的化して、その発現を(例えば、核酸の転写及び/又は翻訳を妨げることにより)妨げ及び/又は阻止することができる。CRISPRエフェクターと、RNAガイドと、CRISPRエフェクターをコードする核酸を標的化するRNAガイドとを発現するベクターを細胞にトランスフェクトすると、CRISPRエフェクターをコードする核酸の効率的な破壊につながり、CRISPRエフェクターレベルを低下させることができ、従ってゲノム編集活性を制限することができる。
一部の実施形態において、CRISPRエフェクターのゲノム編集活性は、哺乳類細胞における内因性RNAシグネチャ(例えば、miRNA)を通じて調節することができる。CRISPRエフェクターをコードするmRNAの5’-UTRにmiRNA相補配列を用いることにより、CRISPRエフェクタースイッチを作ることができる。このスイッチは、標的細胞中のmiRNAに選択的且つ効率的に応答する。従って、このスイッチは、異種細胞集団内で内因性miRNA活性を感知することによりゲノム編集を差次的に制御し得る。従って、このスイッチシステムは、細胞内miRNA情報に基づく細胞型選択的なゲノム編集及び細胞エンジニアリングのフレームワークを提供し得る(Hirosawa et al.“Cell-type-specific genome editing with a microRNA-responsive CRISPR-Cas9 switch,”Nucl.Acids Res.,2017 Jul 27;45(13):e118)。
誘導性CRISPRエフェクター
CRISPRエフェクターは、誘導性、例えば、光誘導性又は化学誘導性であってもよい。この機構により、CRISPR酵素中の機能性ドメインを活性化させることが可能になる。光誘導能は、当該技術分野において公知の様々な方法により、例えば、スプリットCRISPRエフェクターにおいてCRY2PHR/CIBN対が用いられる融合複合体を設計することにより実現し得る(例えば、Konermann et al.“Optical control of mammalian endogenous transcription and epigenetic states,”Nature,500.7463(2013):472を参照のこと)。化学誘導能は、例えば、スプリットCRISPRエフェクターにおいてFKBP/FRB(FK506結合タンパク質/FKBPラパマイシン結合ドメイン)対が用いられる融合複合体を設計することにより実現し得る。ラパマイシンは融合複合体の形成に必要であり、従ってCRISPRエフェクターを活性化する(例えば、Zetsche et al.“A split-Cas9 architecture for inducible genome editing and transcription modulation,”Nature Biotech.,33.2(2015):139-142を参照のこと)。
CRISPRエフェクターは、誘導性、例えば、光誘導性又は化学誘導性であってもよい。この機構により、CRISPR酵素中の機能性ドメインを活性化させることが可能になる。光誘導能は、当該技術分野において公知の様々な方法により、例えば、スプリットCRISPRエフェクターにおいてCRY2PHR/CIBN対が用いられる融合複合体を設計することにより実現し得る(例えば、Konermann et al.“Optical control of mammalian endogenous transcription and epigenetic states,”Nature,500.7463(2013):472を参照のこと)。化学誘導能は、例えば、スプリットCRISPRエフェクターにおいてFKBP/FRB(FK506結合タンパク質/FKBPラパマイシン結合ドメイン)対が用いられる融合複合体を設計することにより実現し得る。ラパマイシンは融合複合体の形成に必要であり、従ってCRISPRエフェクターを活性化する(例えば、Zetsche et al.“A split-Cas9 architecture for inducible genome editing and transcription modulation,”Nature Biotech.,33.2(2015):139-142を参照のこと)。
更に、CRISPRエフェクターの発現は、誘導性プロモーター、例えば、テトラサイクリン又はドキシサイクリン制御下での転写活性化(Tet-On及びTet-Off発現システム)、ホルモン誘導性遺伝子発現システム(例えば、エクジソン誘導性遺伝子発現システム)、及びアラビノース誘導性遺伝子発現システムによって調節することができる。RNAとして送達される場合、RNAターゲティングエフェクタータンパク質の発現は、小分子様テトラサイクリンを感知することのできるリボスイッチによって調節されてもよい(例えば、Goldfless et al.“Direct and specific chemical control of eukaryotic translation with a synthetic RNA-protein interaction,”Nucl.Acids Res.,40.9(2012):e64-e64を参照のこと)。
誘導性CRISPRエフェクター及び誘導性CRISPRシステムの様々な実施形態が、例えば、米国特許第8871445号明細書、米国特許出願公開第20160208243号明細書、及び国際公開第2016205764号パンフレット(これらの各々は、本明細書において全体として参照により援用される)に記載されている。
機能性突然変異
本明細書に記載されるとおりのCRISPRエフェクターに様々な突然変異又は修飾を導入して特異性及び/又はロバスト性を改善することができる。一部の実施形態において、プロトスペーサー隣接モチーフ(PAM)を認識するアミノ酸残基が同定される。本明細書に記載されるCRISPRエフェクターは、例えば、PAMを認識するアミノ酸残基を他のアミノ酸残基に置換することにより、異なるPAMを認識するように更に修飾されてもよい。一部の実施形態において、CRISPRエフェクターは、例えば、5’-NNG-3’、5’-NG-3’、5’-TTG-3’、5’-KTG-3’、5’-THG-3’、5’-KHG-3’、又は5’-G-3’を認識することができ、ここで、「K」はT又はGであり、「H」はT、C、又はAである。
本明細書に記載されるとおりのCRISPRエフェクターに様々な突然変異又は修飾を導入して特異性及び/又はロバスト性を改善することができる。一部の実施形態において、プロトスペーサー隣接モチーフ(PAM)を認識するアミノ酸残基が同定される。本明細書に記載されるCRISPRエフェクターは、例えば、PAMを認識するアミノ酸残基を他のアミノ酸残基に置換することにより、異なるPAMを認識するように更に修飾されてもよい。一部の実施形態において、CRISPRエフェクターは、例えば、5’-NNG-3’、5’-NG-3’、5’-TTG-3’、5’-KTG-3’、5’-THG-3’、5’-KHG-3’、又は5’-G-3’を認識することができ、ここで、「K」はT又はGであり、「H」はT、C、又はAである。
一部の実施形態において、本明細書に記載されるCRISPRエフェクターは、1つ以上のアミノ酸残基を突然変異させることにより、1つ以上の機能活性が改変され得る。例えば、一部の実施形態において、CRISPRエフェクターは、1つ以上のアミノ酸残基を突然変異させることにより、そのヘリカーゼ活性が改変される。一部の実施形態において、CRISPRエフェクターは、1つ以上のアミノ酸残基を突然変異させることにより、そのヌクレアーゼ活性(例えば、エンドヌクレアーゼ活性又はエキソヌクレアーゼ活性)が改変される。一部の実施形態において、CRISPRエフェクターは、1つ以上のアミノ酸残基を突然変異させることにより、RNAガイドと機能的に関連するその能力が改変される。一部の実施形態において、CRISPRエフェクターは、1つ以上のアミノ酸残基を突然変異させることにより、標的核酸と機能的に関連するその能力が改変される。
一部の実施形態において、本明細書に記載されるCRISPRエフェクターは標的核酸分子の切断能を有する。一部の実施形態において、CRISPRエフェクターは標的核酸分子の両方の鎖を切断する。しかしながら、一部の実施形態において、CRISPRエフェクターは、1つ以上のアミノ酸残基を突然変異させることにより、その切断活性が改変される。例えば、一部の実施形態において、CRISPRエフェクターは、CRISPRエフェクターが標的核酸を切断する能力を増加させる1つ以上の突然変異を含んでもよい。別の例において、一部の実施形態において、CRISPRエフェクターは、酵素が標的核酸の切断能を有しないものとなる1つ以上の突然変異を含んでもよい。他の実施形態において、CRISPRエフェクターは、この酵素が標的核酸の鎖の切断能(即ち、ニッカーゼ活性)を有するものとなる1つ以上の突然変異を含んでもよい。一部の実施形態において、CRISPRエフェクターは、RNAガイドがハイブリダイズする鎖に相補的な標的核酸の鎖を切断する能力を有する。一部の実施形態において、CRISPRエフェクターは、RNAガイドがハイブリダイズする標的核酸の鎖を切断する能力を有する。
一部の実施形態において、本明細書に開示されるCRISPRエフェクターの1つ以上の残基は、アルギニン部分に変異している。一部の実施形態において、本明細書に開示されるCRISPRエフェクターの1つ以上の残基は、グリシン部分に変異している。一部の実施形態において、本明細書に開示されるCRISPRエフェクターの1つ以上の残基は、本明細書に開示されるCRISPRエフェクターの系統的アラインメントのコンセンサス残基に基づいて変異する。
一部の実施形態において、本明細書に記載されるCRISPRエフェクターは、1つ以上の所望の機能活性(例えば、ヌクレアーゼ活性及び機能的にRNAガイドと相互作用する能力)を保持しつつ酵素のサイズを縮小させるため、1つ以上のアミノ酸残基に欠失を含むようにエンジニアリングされてもよい。このトランケート型CRISPRエフェクターは有利には、負荷に制限のある送達システムとの組み合わせで用いられてもよい。
一態様において、本開示は、図2に示されるドメイン構成を維持しつつ、本明細書に記載される核酸配列(nucleic sequences)と少なくとも10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、又は99%同一の核酸配列を提供する。別の態様において、本開示はまた、図2に示されるドメイン構成を維持しつつ、本明細書に記載されるアミノ酸配列と少なくとも10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、又は99%同一のアミノ酸配列も提供する。
一部の実施形態において、核酸配列は、本明細書に記載される配列と同じである一部分(例えば、少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、30、40、50、60、70、80、90、又は100ヌクレオチド、例えば、連続又は非連続ヌクレオチド)を少なくとも有する。一部の実施形態において、核酸配列は、本明細書に記載される配列と異なる一部分(例えば、少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、30、40、50、60、70、80、90、又は100ヌクレオチド、例えば、連続又は非連続ヌクレオチド)を少なくとも有する。
一部の実施形態において、アミノ酸配列は、本明細書に記載される配列と同じである一部分(例えば、少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、30、40、50、60、70、80、90、又は100アミノ酸残基、例えば、連続又は非連続アミノ酸残基)を少なくとも有する。一部の実施形態において、アミノ酸配列は、本明細書に記載される配列と異なる一部分(例えば、少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、30、40、50、60、70、80、90、又は100アミノ酸残基、例えば、連続又は非連続アミノ酸残基)を少なくとも有する。
2つのアミノ酸配列、又は2つの核酸配列のパーセント同一性を決定するには、それらの配列が最適な比較を目的としてアラインメントされる(例えば、最適なアラインメントとなるように第1及び第2のアミノ酸又は核酸配列の一方又は両方にギャップが導入されてもよく、及び比較を目的として非相同配列が無視されてもよい)。一般に、比較を目的としてアラインメントされる参照配列の長さは、参照配列の長さの少なくとも80%でなければならず、及び一部の実施形態では、参照配列の長さの少なくとも90%、95%、又は100%である。次に、対応するアミノ酸位置又はヌクレオチド位置にあるアミノ酸残基又はヌクレオチドが比較される。第1の配列におけるある位置が第2の配列における対応する位置と同じアミノ酸残基又はヌクレオチドによって占有されているとき、次にはそれらの分子は当該の位置において同一である。2つの配列間のパーセント同一性は、2つの配列を最適にアラインメントするために導入する必要があるギャップの数、及び各ギャップの長さを考慮に入れた、それらの配列によって共有される同一の位置の数の関数である。本開示の目的上、配列の比較及び2つの配列間におけるパーセント同一性の決定は、ギャップペナルティーを12、ギャップ伸長ペナルティーを4、及びフレームシフトギャップペナルティーを5としたBlossum 62スコアリング行列を用いて達成することができる。
一部の実施形態において、本明細書に記載されるヌクレアーゼは、図1A~図1Jに示されるコンセンサス配列を含む。一部の実施形態において、本明細書に記載されるヌクレアーゼは、図1A~図1Jに示されるコンセンサス配列の一部分、例えば、図1A~図1Jのいずれか1つの保存配列を含む。例えば、一部の実施形態において、ヌクレアーゼは、X1X2X3REX4X5X6(配列番号75)[式中、X1はY又はRであり、X2はA又はP又はQ又はVであり、X3はS又はC又はTであり、X4はI又はLであり、X5はF又はM又はY又はLであり、及びX6はN又はAである]として記載される配列を含む。一部の実施形態において、配列番号75に記載の配列は、N末端配列である。一部の実施形態において、ヌクレアーゼは、DX1X2W(配列番号76)[式中、X1はS又はR又はG又はTであり、及びX2はT又はS又はKである]として記載される配列を含む。一部の実施形態において、配列番号76に記載の配列は、N末端配列である。一部の実施形態において、ヌクレアーゼは、GX1Q(配列番号77)[式中、X1はI又はV又はPである]として記載される配列を含む。一部の実施形態において、配列番号77に記載の配列は、N末端配列である。一部の実施形態において、ヌクレアーゼは、YYPX1X2X3X4(配列番号78)[式中、X1はE又はK又はDであり、X2はS又はN又はD又はTであり、X3はL又はI又はFであり、及びX4はK又はF又はNである]として記載される配列を含む。一部の実施形態において、ヌクレアーゼは、X1X2GX3D(配列番号79)[式中、X1はG又はT又はVであり、X2はV又はI又はLであり、及びX3はI又はC又はM又はVである]として記載される配列を含む。一部の実施形態において、ヌクレアーゼは、X1X2X3DG(配列番号97)[式中、X1はG又はAであり、X2はV又はL又はM又はIであり、及びX3はR又はKである]として記載される配列を含む。一部の実施形態において、ヌクレアーゼは、X1X2WX3PX4X5DX6X7(配列番号80)[式中、X1はH又はNであり、X2はN又はE又はD又はGであり、X3はH又はQ又はR又はA又はV又はK又はI又はEであり、X4はA又はS又はV又はPであり、X5はK又はP又はH又はC又はS又はYであり、X6はF又はY又はPであり、及びX7はL又はM又はCである]として記載される配列を含む。一部の実施形態において、ヌクレアーゼは、X1QX2X3WDX4X5HX6(配列番号81)[式中、X1はE又はRであり、X2はS又はA又はGであり、X3はR又はN又はE又はKであり、X4はR又はK又はL又はMであり、X5はT又はN又はV又はK又はAであり、X6はD又はS又はE又はQである]として記載される配列を含む。一部の実施形態において、配列番号81に記載の配列は、C末端配列である。一部の実施形態において、ヌクレアーゼは、X1MEX2X3NLNX4(配列番号82)[式中、X1はA又はV又はSであり、X2はD又はNであり、X3はV又はI又はLであり、及びX4はE又はD又はRである]として記載される配列を含む。一部の実施形態において、配列番号82に記載の配列は、C末端配列である。一部の実施形態において、ヌクレアーゼは、TSX1X2CX3X4CX5(配列番号83)[式中、X1はQ又はNであり、X2はL又はI又はTであり、X3はH又はDであり、X4はV又はC又はA又はLであり、及びX5はQ又はR又はN又はGである]として記載される配列を含む。一部の実施形態において、配列番号83に記載の配列は、C末端配列である。一部の実施形態において、ヌクレアーゼは、X1NX2RX3X4X5X6FX7CGX8X9X10C(配列番号84)[式中、X1はL又はI又はKであり、X2はF又はY又はLであり、X3はD又はF又はE又はAであり、X4はG又はKであり、X5はR又はEであり、X6はV又はI又はT又はKであり、X7はI又はVであり、X8はN又はCであり、X9はP又はEであり、及びX10はE又はN又はA又はD又はKである]として記載される配列を含む。一部の実施形態において、配列番号84に記載の配列は、C末端配列である。一部の実施形態において、ヌクレアーゼは、X1X2ADX3NAAX4X5I(配列番号85)[式中、X1はQ又はVであり、X2はN又はDであり、X3はE又はS又はV又はWであり、X4はF又はH又はS又はY又はMであり、及びX5はN又はV又はCである]として記載される配列を含む。一部の実施形態において、配列番号85に記載の配列は、C末端配列である。
RNAガイド及びRNAガイド修飾
一部の実施形態において、本明細書に記載されるRNAガイドは、ウラシル(U)を含む。一部の実施形態において、本明細書に記載されるRNAガイドは、チミン(T)を含む。一部の実施形態において、本明細書に記載されるRNAガイドのダイレクトリピート配列は、ウラシル(U)を含む。一部の実施形態において、本明細書に記載されるRNAガイドのダイレクトリピート配列は、チミン(T)を含む。一部の実施形態において、表2又は表7によるダイレクトリピート配列は、表2又は表7の対応する配列においてチミンとして示される1つ以上の場所に、ウラシルを含む配列を含む。
一部の実施形態において、本明細書に記載されるRNAガイドは、ウラシル(U)を含む。一部の実施形態において、本明細書に記載されるRNAガイドは、チミン(T)を含む。一部の実施形態において、本明細書に記載されるRNAガイドのダイレクトリピート配列は、ウラシル(U)を含む。一部の実施形態において、本明細書に記載されるRNAガイドのダイレクトリピート配列は、チミン(T)を含む。一部の実施形態において、表2又は表7によるダイレクトリピート配列は、表2又は表7の対応する配列においてチミンとして示される1つ以上の場所に、ウラシルを含む配列を含む。
一部の実施形態において、ダイレクトリピートは、内因性CRISPRアレイにおいて繰り返される配列の1つのコピーのみを含む。一部の実施形態において、ダイレクトリピートは、内因性CRISPRアレイに見られる1つ以上のスペーサー配列に隣接する(例えば、フランキング)完全長配列である。一部の実施形態において、ダイレクトリピートは、内因性CRISPRアレイに見られる1つ以上のスペーサー配列に隣接する(例えば、フランキング)完全長配列の一部(例えば、プロセシングされた部分)である。
スペーサー及びダイレクトリピート
RNAガイドのスペーサー長さは約15~50ヌクレオチドの範囲であってもよい。RNAガイドのスペーサー長さは約20~35ヌクレオチドの範囲であってもよい。一部の実施形態において、RNAガイドのスペーサー長さは、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、又は少なくとも22ヌクレオチドである。一部の実施形態において、スペーサー長さは、15~17ヌクレオチド、15~23ヌクレオチド、16~22ヌクレオチド、17~20ヌクレオチド、20~24ヌクレオチド(例えば、20、21、22、23、又は24ヌクレオチド)、23~25ヌクレオチド(例えば、23、24、又は25ヌクレオチド)、24~27ヌクレオチド、27~30ヌクレオチド、30~45ヌクレオチド(例えば、30、31、32、33、34、35、40、又は45ヌクレオチド)、30又は35~40ヌクレオチド、41~45ヌクレオチド、45~50ヌクレオチド、又はそれ以上である。
RNAガイドのスペーサー長さは約15~50ヌクレオチドの範囲であってもよい。RNAガイドのスペーサー長さは約20~35ヌクレオチドの範囲であってもよい。一部の実施形態において、RNAガイドのスペーサー長さは、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、又は少なくとも22ヌクレオチドである。一部の実施形態において、スペーサー長さは、15~17ヌクレオチド、15~23ヌクレオチド、16~22ヌクレオチド、17~20ヌクレオチド、20~24ヌクレオチド(例えば、20、21、22、23、又は24ヌクレオチド)、23~25ヌクレオチド(例えば、23、24、又は25ヌクレオチド)、24~27ヌクレオチド、27~30ヌクレオチド、30~45ヌクレオチド(例えば、30、31、32、33、34、35、40、又は45ヌクレオチド)、30又は35~40ヌクレオチド、41~45ヌクレオチド、45~50ヌクレオチド、又はそれ以上である。
一部の実施形態において、RNAガイドのダイレクトリピート長さは少なくとも16ヌクレオチドであり、又は16~20ヌクレオチド(例えば、16、17、18、19、又は20ヌクレオチド)である。一部の実施形態において、RNAガイドのダイレクトリピート長さは約40ヌクレオチドである。
例示的ダイレクトリピート配列(例えば、プレcrRNA(例えば、プロセシングされていないcrRNA)又は成熟crRNA(例えば、プロセシングされたcrRNAのダイレクトリピート配列))のダイレクトリピート配列を表2に示す。表7もまた参照のこと。
一部の実施形態において、CRISPR関連タンパク質は、配列番号1のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号21のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号3のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号23のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号4のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号24のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号7のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号26のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号15のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号32のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。
一部の実施形態において、RNAガイドは、図3に記載のダイレクトリピート配列を含む。例えば、一部の実施形態において、RNAガイドは、図3に示されるコンセンサス配列又は図3に示されるコンセンサス配列の一部分のダイレクトリピートを含む。例えば、一部の実施形態において、RNAガイドは、X1X2X3TX4X5X6X7AX8GX9[式中、X1はC又はTであり、X2はG又はAであり、X3はG又はTであり、X4はT又はA又はGであり、X5はT又はCであり、X6はA又はT又はGであり、X7はC又はAであり、X8はT又はA又はGであり、及びX9はG又はCである]として記載される配列を有するダイレクトリピートを含む。一部の実施形態において、RNAガイドは、AX1ACC[式中、X1はT又はCである]として記載される配列を有するダイレクトリピートを含む。
一部の実施形態において、本願のエフェクターに対応するPAMは、5’-NNG-3’、5’-NG-3’、5’-TTG-3’、5’-KTG-3’、5’-THG-3’、5’-KHG-3’、又は5’-G-3’として記載される。本明細書で使用されるとき、N’は、各々、任意のヌクレオチド(例えば、A、G、T、又はC)又はそのサブセット(例えば、Y(C又はT)、K(G又はT)、B(G、T、又はC)、H(A、C、又はT)であり得る。
一部の実施形態において、RNAガイドは、tracrRNAを更に含む。一部の実施形態において、tracrRNAは必要でない(例えば、tracrRNAは任意選択である)。一部の実施形態において、tracrRNAは、表8に示される非コード配列の一部である。例えば、一部の実施形態において、tracrRNAは、表3の配列、又は表3の配列の一部である。
一部の実施形態において、CRISPR関連タンパク質は、配列番号1のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、tracrRNA配列は、配列番号62、配列番号63、又は配列番号64のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号4のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、tracrRNA配列は、配列番号65、配列番号66、又は配列番号67のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号7のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、tracrRNA配列は、配列番号68、配列番号69、又は配列番号70のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号15のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、tracrRNA配列は、配列番号71、配列番号72、配列番号73、又は配列番号74のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。
RNAガイド配列は、CRISPR複合体の形成及び標的への結合の成功は許容するが、同時にヌクレアーゼ活性の成功は許容しない(即ち、ヌクレアーゼ活性のない/インデルを生じさせない)ような方法で修飾されてもよい。こうした修飾ガイド配列は、「デッドガイド」又は「デッドガイド配列」と称される。こうしたデッドガイド又はデッドガイド配列はヌクレアーゼ活性の点で触媒的に不活性又はコンホメーション的に不活性であってもよい。デッドガイド配列は、典型的には、活性なRNA切断を生じるそれぞれのガイド配列よりも短い。一部の実施形態において、デッドガイドは、ヌクレアーゼ活性を有するそれぞれのガイドRNAと比べて5%、10%、20%、30%、40%、又は50%短い。RNAガイドのデッドガイド配列は、13~15ヌクレオチド長(例えば、13、14、又は15ヌクレオチド長)、15~19ヌクレオチド長、又は17~18ヌクレオチド長(例えば、17ヌクレオチド長)であってもよい。
従って、一態様において、本開示は、本明細書に記載されるとおりの機能性CLUST.143952CRISPRエフェクターと、RNAガイドとを含む天然に存在しない又はエンジニアリングされたCRISPRシステムを提供し、ここでRNAガイドはデッドガイド配列を含み、従ってRNAガイドは、検出可能な切断活性なしにCRISPRシステムが細胞の目的のゲノム遺伝子座に向けられるような標的配列へのハイブリダイズ能を有する。デッドガイドの詳細な説明は、例えば、国際公開第2016094872号パンフレット(全体として参照により本明細書に援用される)に記載される。
誘導性RNAガイド
RNAガイドは、誘導性システムの成分として作成することができる。このシステムの誘導可能な性質により、遺伝子編集又は遺伝子発現の時空間的制御が可能となる。一部の実施形態において、誘導性システムの刺激としては、例えば、電磁放射線、音響エネルギー、化学エネルギー、及び/又は熱エネルギーが挙げられる。
RNAガイドは、誘導性システムの成分として作成することができる。このシステムの誘導可能な性質により、遺伝子編集又は遺伝子発現の時空間的制御が可能となる。一部の実施形態において、誘導性システムの刺激としては、例えば、電磁放射線、音響エネルギー、化学エネルギー、及び/又は熱エネルギーが挙げられる。
一部の実施形態において、RNAガイドの転写は、誘導性プロモーター、例えば、テトラサイクリン又はドキシサイクリン制御下での転写活性化(Tet-On及びTet-Off発現システム)、ホルモン誘導性遺伝子発現システム(例えば、エクジソン誘導性遺伝子発現システム)、及びアラビノース誘導性遺伝子発現システムによって調節することができる。誘導性システムの他の例としては、例えば、小分子2ハイブリッド転写活性化システム(FKBP、ABA等)、光誘導性システム(フィトクロム、LOVドメイン、又はクリプトクロム)、又は光誘導性転写エフェクター(LITE)が挙げられる。これらの誘導性システムは、例えば、国際公開第2016205764号パンフレット及び米国特許第8795965号明細書(これらはそれぞれ全体として参照により本明細書に援用される)に記載されている。
化学修飾
ガイドRNAのリン酸骨格、糖、及び/又は塩基に化学修飾を適用することができる。ホスホロチオエートなどの骨格修飾はリン酸骨格上の電荷を修飾し、オリゴヌクレオチドの送達及びヌクレアーゼ耐性に役立つ(例えば、Eckstein,“Phosphorothioates,essential components of therapeutic oligonucleotides,”Nucl.Acid Ther.,24(2014),pp.374-387を参照のこと);2’-O-メチル(2’-OMe)、2’-F、及びロックド核酸(LNA)などの糖修飾は、塩基対合及びヌクレアーゼ耐性の両方を亢進させる(例えば、Allerson et al.“Fully 2‘-modified oligonucleotide duplexes with improved in vitro potency and stability compared to unmodified small interfering RNA,”J.Med.Chem.,48.4(2005):901-904を参照のこと)。化学修飾塩基、とりわけ2-チオウリジン又はN6-メチルアデノシンなどは、より強い塩基対合又はより弱い塩基対合のいずれも可能にすることができる(例えば、Bramsen et al.,“Development of therapeutic-grade small interfering RNAs by chemical engineering”Front.Genet.,2012 Aug 20;3:154を参照のこと)。加えて、RNAは、蛍光色素、ポリエチレングリコール、又はタンパク質を含めた種々の機能性部分との5’末端及び3’末端の両方のコンジュゲーションに適している。
ガイドRNAのリン酸骨格、糖、及び/又は塩基に化学修飾を適用することができる。ホスホロチオエートなどの骨格修飾はリン酸骨格上の電荷を修飾し、オリゴヌクレオチドの送達及びヌクレアーゼ耐性に役立つ(例えば、Eckstein,“Phosphorothioates,essential components of therapeutic oligonucleotides,”Nucl.Acid Ther.,24(2014),pp.374-387を参照のこと);2’-O-メチル(2’-OMe)、2’-F、及びロックド核酸(LNA)などの糖修飾は、塩基対合及びヌクレアーゼ耐性の両方を亢進させる(例えば、Allerson et al.“Fully 2‘-modified oligonucleotide duplexes with improved in vitro potency and stability compared to unmodified small interfering RNA,”J.Med.Chem.,48.4(2005):901-904を参照のこと)。化学修飾塩基、とりわけ2-チオウリジン又はN6-メチルアデノシンなどは、より強い塩基対合又はより弱い塩基対合のいずれも可能にすることができる(例えば、Bramsen et al.,“Development of therapeutic-grade small interfering RNAs by chemical engineering”Front.Genet.,2012 Aug 20;3:154を参照のこと)。加えて、RNAは、蛍光色素、ポリエチレングリコール、又はタンパク質を含めた種々の機能性部分との5’末端及び3’末端の両方のコンジュゲーションに適している。
化学的に合成されるRNAガイド分子には、幅広い種類の修飾を適用することができる。例えば、オリゴヌクレオチドを2’-OMeで修飾してヌクレアーゼ耐性を改善すると、ワトソン・クリック塩基対合の結合エネルギーを変化させることができる。更には、2’-OMe修飾は、オリゴヌクレオチドがトランスフェクション試薬、タンパク質又は細胞中の任意の他の分子とどのように相互作用するかに影響を及ぼし得る。これらの修飾の効果は経験的試験によって決定することができる。
一部の実施形態において、RNAガイドは1つ以上のホスホロチオエート修飾を含む。一部の実施形態において、RNAガイドは、塩基対合を亢進させること及び/又はヌクレアーゼ耐性を増加させることを目的として1つ以上のロックド核酸を含む。
これらの化学修飾の概要については、例えば、Kelley et al.,“Versatility of chemically synthesized guide RNAs for CRISPR-Cas9 genome editing,”J.Biotechnol.2016 Sep 10;233:74-83;国際公開第2016205764号パンフレット;及び米国特許第8795965号明細書(この各々が全体として参照により援用される)を参照することができる。
配列修飾
本明細書に記載されるRNAガイド、tracrRNA及びcrRNAの配列及び長さは最適化することができる。一部の実施形態において、RNAガイドの最適化された長さは、プロセシングされた形態のtracrRNA及び/若しくはcrRNAを同定することによるか、又はcrRNAのRNAガイドについての経験的な長さ研究によって決定されてもよい。
本明細書に記載されるRNAガイド、tracrRNA及びcrRNAの配列及び長さは最適化することができる。一部の実施形態において、RNAガイドの最適化された長さは、プロセシングされた形態のtracrRNA及び/若しくはcrRNAを同定することによるか、又はcrRNAのRNAガイドについての経験的な長さ研究によって決定されてもよい。
RNAガイドはまた、1つ以上のアプタマー配列も含むことができる。アプタマーは、特異的な標的分子に結合することのできるオリゴヌクレオチド又はペプチド分子である。アプタマーは、遺伝子エフェクター、遺伝子アクチベーター、又は遺伝子リプレッサーに特異的であってもよい。一部の実施形態において、アプタマーはタンパク質に特異的であり、次にはそのタンパク質が特異的遺伝子エフェクター、遺伝子アクチベーター、又は遺伝子リプレッサーに特異的であって、それを動員し/それに結合するものであってもよい。エフェクター、アクチベーター、又はリプレッサーは融合タンパク質の形態で存在することができる。一部の実施形態において、RNAガイドは、同じアダプタータンパク質に特異的な2つ以上のアプタマー配列を有する。一部の実施形態において、2つ以上のアプタマー配列は異なるアダプタータンパク質に特異的である。アダプタータンパク質としては、例えば、MS2、PP7、Qβ、F2、GA、fr、JP501、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、φCb5、φCb8r、φCb12r、φCb23r、7s、及びPRR1を挙げることができる。従って、一部の実施形態において、アプタマーは、本明細書に記載されるとおりのアダプタータンパク質のうちのいずれか1つに特異的に結合する結合タンパク質から選択される。一部の実施形態において、アプタマー配列はMS2ループである。アプタマーの詳細な説明については、例えば、Nowak et al.,“Guide RNA engineering for versatile Cas9 functionality,”Nucl.Acid.Res.,2016 Nov 16;44(20):9555-9564;及び国際公開第2016205764号パンフレット(これらはそれぞれ全体として参照により本明細書に援用される)を参照することができる。
ガイド:標的配列一致要件
CRISPRシステムでは、ガイド配列とその対応する標的配列との間の相補性の程度は、約50%、60%、75%、80%、85%、90%、95%、97.5%、99%、又は100%であってもよい。オフターゲット相互作用を減少させるため、例えば、相補性が低い標的配列と相互作用するガイドを減少させるため、CRISPRシステムに突然変異を導入して、CRISPRシステムが標的配列と、80%、85%、90%、又は95%より高い相補性を有するオフターゲット配列との間を区別できるようにしてもよい。一部の実施形態において、相補性の程度は、80%~95%、例えば、約83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、又は95%である(例えば、18ヌクレオチドを有する標的と、1、2、又は3個のミスマッチを有する18ヌクレオチドのオフターゲットとの間を区別する)。従って、一部の実施形態において、ガイド配列とその対応する標的配列との間の相補性の程度は、94.5%、95%、95.5%、96%、96.5%、97%、97.5%、98%、98.5%、99%、99.5%、又は99.9%より高い。一部の実施形態において、相補性の程度は100%である。
CRISPRシステムでは、ガイド配列とその対応する標的配列との間の相補性の程度は、約50%、60%、75%、80%、85%、90%、95%、97.5%、99%、又は100%であってもよい。オフターゲット相互作用を減少させるため、例えば、相補性が低い標的配列と相互作用するガイドを減少させるため、CRISPRシステムに突然変異を導入して、CRISPRシステムが標的配列と、80%、85%、90%、又は95%より高い相補性を有するオフターゲット配列との間を区別できるようにしてもよい。一部の実施形態において、相補性の程度は、80%~95%、例えば、約83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、又は95%である(例えば、18ヌクレオチドを有する標的と、1、2、又は3個のミスマッチを有する18ヌクレオチドのオフターゲットとの間を区別する)。従って、一部の実施形態において、ガイド配列とその対応する標的配列との間の相補性の程度は、94.5%、95%、95.5%、96%、96.5%、97%、97.5%、98%、98.5%、99%、99.5%、又は99.9%より高い。一部の実施形態において、相補性の程度は100%である。
当該分野では、機能性となるのに十分な相補性があるならば、完全な相補性は要件とならないことが公知である。スペーサー/標的に沿ったミスマッチの位置を含め、スペーサー配列と標的配列との間へのミスマッチ、例えば1個以上のミスマッチ、例えば1又は2個のミスマッチの導入により、切断効率の調節を生かすことができる。ミスマッチ、例えば二重ミスマッチが中心寄りに位置するほど(即ち、3’末端又は5’末端にあるのでない);切断効率がより大きい影響を受ける。従って、スペーサー配列に沿ったミスマッチ位置の選択により、切断効率を調節することができる。例えば、標的の100%未満の切断が(例えば、細胞集団中で)所望される場合、スペーサー配列にスペーサーと標的配列との間の1又は2個のミスマッチを導入してもよい。
CRISPRシステムの使用方法
本明細書に記載されるCRISPRシステムには、非常に多数の細胞型における標的ポリヌクレオチドの修飾(例えば、欠失、挿入、転位、不活性化、又は活性化)を含め、多種多様な有用性がある。このCRISPRシステムは、例えば、DNA/RNA検出(例えば、特異的高感度酵素レポーターアンロッキング(specific high sensitivity enzymatic reporter unlocking:SHERLOCK))、核酸の追跡及び標識、エンリッチメントアッセイ(バックグラウンドからの所望の配列の抽出)、循環腫瘍DNAの検出、次世代ライブラリの調製、薬物スクリーニング、疾患診断及び予後判定、及び様々な遺伝的障害の治療において、幅広い範囲にわたる適用を有する。
本明細書に記載されるCRISPRシステムには、非常に多数の細胞型における標的ポリヌクレオチドの修飾(例えば、欠失、挿入、転位、不活性化、又は活性化)を含め、多種多様な有用性がある。このCRISPRシステムは、例えば、DNA/RNA検出(例えば、特異的高感度酵素レポーターアンロッキング(specific high sensitivity enzymatic reporter unlocking:SHERLOCK))、核酸の追跡及び標識、エンリッチメントアッセイ(バックグラウンドからの所望の配列の抽出)、循環腫瘍DNAの検出、次世代ライブラリの調製、薬物スクリーニング、疾患診断及び予後判定、及び様々な遺伝的障害の治療において、幅広い範囲にわたる適用を有する。
DNA/RNA検出
一態様において、本明細書に記載されるCRISPRシステムは、DNA/RNA検出において使用することができる。シングルエフェクターRNA誘導型DNアーゼをCRISPR RNA(crRNA)で再プログラム化することにより、特異的一本鎖DNA(ssDNA)センシング用のプラットフォームがもたらされ得る。そのDNA標的の認識時、活性化したV型単一エフェクターDNAガイドDNaseは、近隣非標的ssDNAの「コラテラル」切断に関与する。このcrRNAによってプログラム化されるコラテラル切断活性により、CRISPRシステムが特異的DNAの存在を標識ssDNAの非特異的分解によって検出することが可能となる。
一態様において、本明細書に記載されるCRISPRシステムは、DNA/RNA検出において使用することができる。シングルエフェクターRNA誘導型DNアーゼをCRISPR RNA(crRNA)で再プログラム化することにより、特異的一本鎖DNA(ssDNA)センシング用のプラットフォームがもたらされ得る。そのDNA標的の認識時、活性化したV型単一エフェクターDNAガイドDNaseは、近隣非標的ssDNAの「コラテラル」切断に関与する。このcrRNAによってプログラム化されるコラテラル切断活性により、CRISPRシステムが特異的DNAの存在を標識ssDNAの非特異的分解によって検出することが可能となる。
DNA検出適用においては、コラテラルssDNA活性をレポーターと組み合わせることができ、例えば、DNAエンドヌクレアーゼ標的化CRISPRトランスレポーター(DNA Endonuclease-Targeted CRISPR trans reporter:DETECTR)法と呼ばれる方法などであり、これは、アトモル濃度のDNA検出感度を実現する(例えば、Chen et al.,Science,360(6387):436-439,2018を参照のこと)(これは全体として参照により本明細書に援用される)。本明細書に記載される酵素を使用する一つの適用は、インビトロ環境における非特異的ssDNAの分解である。フルオロフォア及び消光剤に連結した「レポーター」ssDNA分子もまた、未知のDNA試料(一本鎖又は二本鎖のいずれか)と共にこのインビトロシステムに加えることができる。未知のDNA片中に標的配列を認識すると、このエフェクター複合体がレポーターssDNAを切断し、蛍光リードアウトが生じる。
他の実施形態において、SHERLOCK法(特異的高感度酵素レポーターアンロッキング(Specific High Sensitivity Enzymatic Reporter UnLOCKing))もまた、核酸増幅及びレポーターssDNAのコラテラル切断に基づいたアトモル濃度(又は単一分子)感度のインビトロ核酸検出プラットフォームを提供し、標的のリアルタイム検出を可能にする。SHERLOCKにおけるCRISPRの使用方法については、例えば、Gootenberg,et al.“Nucleic acid detection with CRISPR-Cas13a/C2c2,”Science,356(6336):438-442(2017)(これは全体として参照により本明細書に援用される)に詳細に記載される。
一部の実施形態において、本明細書に記載されるCRISPRシステムは、マルチプレックス化したエラーロバストな蛍光インサイチュハイブリダイゼーション(multiplexed error-robust fluorescence in situ hybridization:MERFISH)において使用することができる。こうした方法については、例えば、Chen et al.,“Spatially resolved,highly multiplexed RNA profiling in single cells,”Science,2015 Apr 24;348(6233):aaa6090(これは全体として参照により本明細書に援用される)に記載されている。
核酸の追跡及び標識
細胞過程は、タンパク質、RNA、及びDNAの間での分子相互作用網に依存する。タンパク質-DNA及びタンパク質-RNA相互作用の正確な検出は、かかる過程を理解する鍵である。インビトロ近接性標識技法は、レポーター基、例えば光活性化可能な基と組み合わせたアフィニティータグを用いることにより、インビトロで目的のタンパク質又はRNAの近くにあるポリペプチド及びRNAを標識する。紫外線照射後、光活性化可能な基がタグ付加分子にごく近接したタンパク質及び他の分子と反応し、それによってそれらを標識する。標識された相互作用分子は、続いて回収し、同定することができる。このRNAターゲティングエフェクタータンパク質を使用して、例えば、プローブを選択のRNA配列に標的化することができる。こうした適用はまた、動物モデルにおいても疾患又は培養が困難な細胞型のインビボイメージングに適用することができる。核酸の追跡及び標識方法については、例えば、米国特許第8795965号明細書;国際公開第2016205764号パンフレット;及び国際公開第2017070605号パンフレット(これらの各々は、本明細書において全体として参照により援用される)に記載されている。
細胞過程は、タンパク質、RNA、及びDNAの間での分子相互作用網に依存する。タンパク質-DNA及びタンパク質-RNA相互作用の正確な検出は、かかる過程を理解する鍵である。インビトロ近接性標識技法は、レポーター基、例えば光活性化可能な基と組み合わせたアフィニティータグを用いることにより、インビトロで目的のタンパク質又はRNAの近くにあるポリペプチド及びRNAを標識する。紫外線照射後、光活性化可能な基がタグ付加分子にごく近接したタンパク質及び他の分子と反応し、それによってそれらを標識する。標識された相互作用分子は、続いて回収し、同定することができる。このRNAターゲティングエフェクタータンパク質を使用して、例えば、プローブを選択のRNA配列に標的化することができる。こうした適用はまた、動物モデルにおいても疾患又は培養が困難な細胞型のインビボイメージングに適用することができる。核酸の追跡及び標識方法については、例えば、米国特許第8795965号明細書;国際公開第2016205764号パンフレット;及び国際公開第2017070605号パンフレット(これらの各々は、本明細書において全体として参照により援用される)に記載されている。
ハイスループットスクリーニング
本明細書に記載されるCRISPRシステムは、次世代シーケンシング(NGS)ライブラリの調製に使用することができる。例えば、費用対効果の高いNGSライブラリを作成するため、CRISPRシステムを使用して標的遺伝子のコード配列を破壊することができ、同時に次世代シーケンシングによって(例えば、Ion Torrent PGMシステムで)、CRISPRエフェクターがトランスフェクトされたクローンをスクリーニングすることができる。NGSライブラリの調製方法に関する詳細な説明については、例えば、Bell et al.,“A high-throughput screening strategy for detecting CRISPR-Cas9 induced mutations using next-generation sequencing,”BMC Genomics,15.1(2014):1002(これは全体として参照により本明細書に援用される)を参照することができる。
本明細書に記載されるCRISPRシステムは、次世代シーケンシング(NGS)ライブラリの調製に使用することができる。例えば、費用対効果の高いNGSライブラリを作成するため、CRISPRシステムを使用して標的遺伝子のコード配列を破壊することができ、同時に次世代シーケンシングによって(例えば、Ion Torrent PGMシステムで)、CRISPRエフェクターがトランスフェクトされたクローンをスクリーニングすることができる。NGSライブラリの調製方法に関する詳細な説明については、例えば、Bell et al.,“A high-throughput screening strategy for detecting CRISPR-Cas9 induced mutations using next-generation sequencing,”BMC Genomics,15.1(2014):1002(これは全体として参照により本明細書に援用される)を参照することができる。
エンジニアリングされた細胞
微生物(例えば、大腸菌(E.coli)、酵母、及び微細藻類)は、合成生物学に広く用いられている。合成生物学の発展には、様々な臨床応用を含め、幅広い有用性がある。例えば、プログラム可能なCRISPRシステムを使用して、例えば癌関連RNAを標的転写物として用いる標的化した細胞死のため、毒性ドメインのタンパク質を分割することができる。更に、例えばキナーゼ又は酵素などの適切なエフェクターとの融合複合体により、合成生物系においてタンパク質間相互作用が関わる経路に影響を及ぼすことができる。
微生物(例えば、大腸菌(E.coli)、酵母、及び微細藻類)は、合成生物学に広く用いられている。合成生物学の発展には、様々な臨床応用を含め、幅広い有用性がある。例えば、プログラム可能なCRISPRシステムを使用して、例えば癌関連RNAを標的転写物として用いる標的化した細胞死のため、毒性ドメインのタンパク質を分割することができる。更に、例えばキナーゼ又は酵素などの適切なエフェクターとの融合複合体により、合成生物系においてタンパク質間相互作用が関わる経路に影響を及ぼすことができる。
一部の実施形態において、ファージ配列を標的化するRNAガイド配列を微生物に導入することができる。従って、本開示はまた、微生物(例えば産生菌株)にファージ感染に対する「ワクチンを接種する」方法も提供する。
一部の実施形態において、本明細書に提供されるCRISPRシステムを使用して微生物をエンジニアリングすることにより、例えば、収率を改善し又は発酵効率を改善することができる。例えば、本明細書に記載されるCRISPRシステムを使用して酵母などの微生物をエンジニアリングすることにより、発酵性糖からバイオ燃料若しくはバイオポリマーを生成し、又は発酵性糖源としての農業廃棄物に由来する植物由来のリグノセルロースを分解することができる。より詳細には、本明細書に記載される方法を使用して、バイオ燃料生産に必要な内因性遺伝子の発現を修飾し、及び/又はバイオ燃料合成を妨げ得る内因性遺伝子を修飾することができる。これらの微生物エンジニアリング方法については、例えば、Verwaal et al.,“CRISPR/Cpf1 enables fast and simple genome editing of Saccharomyces cerevisiae,”Yeast,2017 Sep 8.doi:10.1002/yea.3278;及びHlavova et al.,“Improving microalgae for biotechnology-from genetics to synthetic biology,”Biotechnol.Adv.,2015 Nov 1;33:1194-203(これらはそれぞれ全体として参照により本明細書に援用される)に記載されている。
一部の実施形態において、本明細書で提供されるCRISPRシステムは、真核細胞又は真核生物をエンジニアリングするために使用することができる。例えば、本明細書に記載のCRISPRシステムは、植物細胞、真菌細胞、哺乳動物細胞、爬虫類細胞、昆虫細胞、鳥類細胞、魚類細胞、寄生虫細胞、節足動物細胞、無脊椎動物細胞、脊椎動物細胞、げっ歯類細胞、マウス細胞、ラット細胞、霊長類細胞、非ヒト霊長類細胞、又はヒト細胞に限定されない真核細胞をエンジニアリングするために使用することができる。一部の実施形態において、真核細胞はインビトロ培養物中にある。一部の実施形態において、真核細胞はインビボである。一部の実施形態において、真核細胞はエキソビボである。
遺伝子ドライブ
遺伝子ドライブは、特定の遺伝子又は遺伝子群の遺伝形質に有利な偏りが出る現象である。本明細書に記載されるCRISPRシステムを使用して遺伝子ドライブを構築することができる。例えば、遺伝子の特定のアレルを標的化して破壊することにより、細胞に第2のアレルをコピーさせて配列を固定するようにCRISPRシステムを設計することができる。このコピーのため、第1のアレルが第2のアレルに変換されることになり、子孫に第2のアレルが遺伝する可能性が高くなる。どのように本明細書に記載されるCRISPRシステムを使用して遺伝子ドライブを構築するかに関する詳細な方法については、例えば、Hammond et al.,“A CRISPR-Cas9 gene drive system targeting female reproduction in the malaria mosquito vector Anopheles gambiae,”Nat.Biotechnol.,2016 Jan;34(1):78-83(これは全体として参照により本明細書に援用される)に記載されている。
遺伝子ドライブは、特定の遺伝子又は遺伝子群の遺伝形質に有利な偏りが出る現象である。本明細書に記載されるCRISPRシステムを使用して遺伝子ドライブを構築することができる。例えば、遺伝子の特定のアレルを標的化して破壊することにより、細胞に第2のアレルをコピーさせて配列を固定するようにCRISPRシステムを設計することができる。このコピーのため、第1のアレルが第2のアレルに変換されることになり、子孫に第2のアレルが遺伝する可能性が高くなる。どのように本明細書に記載されるCRISPRシステムを使用して遺伝子ドライブを構築するかに関する詳細な方法については、例えば、Hammond et al.,“A CRISPR-Cas9 gene drive system targeting female reproduction in the malaria mosquito vector Anopheles gambiae,”Nat.Biotechnol.,2016 Jan;34(1):78-83(これは全体として参照により本明細書に援用される)に記載されている。
プール型スクリーニング
本明細書に記載されるとおり、プール型CRISPRスクリーニングは、細胞増殖、薬剤耐性、及びウイルス感染などの生物学的機構に関与する遺伝子を同定するための強力なツールである。細胞がバルクで本明細書に記載されるRNAガイドコードベクターのライブラリによって形質導入され、選択的チャレンジの適用前及び適用後にgRNAの分布が測定される。プール型CRISPRスクリーンは、細胞生存及び増殖に影響を及ぼす機構に対して良好に機能し、個々の遺伝子の活性の測定にまで(例えば、エンジニアリングされたレポーター細胞株を使用することにより)拡張することができる。一度に1つの遺伝子のみが標的化されるアレイ化されたCRISPRスクリーンでは、RNA-seqをリードアウトとして使用することが可能になる。一部の実施形態において、本明細書に記載されるとおりのCRISPRシステムは単一細胞CRISPRスクリーンに使用することができる。プール型CRISPRスクリーニングに関する詳細な説明については、例えば、Datlinger et al.,“Pooled CRISPR screening with single-cell transcriptome read-out,”Nat.Methods.,2017 Mar;14(3):297-301(これは全体として参照により本明細書に援用される)を参照することができる。
本明細書に記載されるとおり、プール型CRISPRスクリーニングは、細胞増殖、薬剤耐性、及びウイルス感染などの生物学的機構に関与する遺伝子を同定するための強力なツールである。細胞がバルクで本明細書に記載されるRNAガイドコードベクターのライブラリによって形質導入され、選択的チャレンジの適用前及び適用後にgRNAの分布が測定される。プール型CRISPRスクリーンは、細胞生存及び増殖に影響を及ぼす機構に対して良好に機能し、個々の遺伝子の活性の測定にまで(例えば、エンジニアリングされたレポーター細胞株を使用することにより)拡張することができる。一度に1つの遺伝子のみが標的化されるアレイ化されたCRISPRスクリーンでは、RNA-seqをリードアウトとして使用することが可能になる。一部の実施形態において、本明細書に記載されるとおりのCRISPRシステムは単一細胞CRISPRスクリーンに使用することができる。プール型CRISPRスクリーニングに関する詳細な説明については、例えば、Datlinger et al.,“Pooled CRISPR screening with single-cell transcriptome read-out,”Nat.Methods.,2017 Mar;14(3):297-301(これは全体として参照により本明細書に援用される)を参照することができる。
飽和突然変異誘発(「バッシング(bashing)」)
本明細書に記載されるCRISPRシステムはインサイチュー飽和突然変異誘発に使用することができる。一部の実施形態では、プール型RNAガイドライブラリを使用して、特定の遺伝子又は調節エレメントに関するインサイチュー飽和突然変異誘発を実施することができる。かかる方法では、決定的な最小の特徴及びそれらの遺伝子又は調節エレメント(例えば、エンハンサー)の個別的な脆弱性を明らかにすることができる。これらの方法については、例えば、Canver et al.,“BCL11A enhancer dissection by Cas9-mediated in situ saturating mutagenesis,”Nature,2015 Nov 12;527(7577):192-7(これは全体として参照により本明細書に援用される)に記載されている。
本明細書に記載されるCRISPRシステムはインサイチュー飽和突然変異誘発に使用することができる。一部の実施形態では、プール型RNAガイドライブラリを使用して、特定の遺伝子又は調節エレメントに関するインサイチュー飽和突然変異誘発を実施することができる。かかる方法では、決定的な最小の特徴及びそれらの遺伝子又は調節エレメント(例えば、エンハンサー)の個別的な脆弱性を明らかにすることができる。これらの方法については、例えば、Canver et al.,“BCL11A enhancer dissection by Cas9-mediated in situ saturating mutagenesis,”Nature,2015 Nov 12;527(7577):192-7(これは全体として参照により本明細書に援用される)に記載されている。
治療上の適用
一部の実施形態において、本明細書に記載されるCRISPRシステムを使用して、標的核酸を編集して、標的核酸を修飾することができる(例えば、1つ以上のアミノ酸残基を挿入、欠失、又は変異させることによって)。例えば、一部の実施形態において、本明細書に記載されるCRISPRシステムは、望ましい核酸配列を含む外因性ドナー鋳型核酸(例えば、DNA分子又はRNA分子)を含む。本明細書に記載されるCRISPRシステムで誘導される切断イベントの分解時に、細胞の分子機構は、切断イベントを修復及び/又は分解する際に、外因性ドナー鋳型核酸を利用することができる。或いは、細胞の分子機構は、切断イベントを修復及び/又は分解する際に、内因性鋳型を利用することができる。一部の実施形態において、本明細書に記載されるCRISPRシステムは、挿入、欠失、及び/又は点突然変異を生じる標的核酸を修飾するために使用され得る。一部の実施形態において、挿入は、傷のない挿入である(すなわち、標的核酸への意図された核酸配列の挿入は、切断イベントの分解時に追加の意図されない核酸配列を生じない)。ドナー鋳型核酸は、二本鎖又は一本鎖核酸分子(例えば、DNA又はRNA)であってもよい。外因性ドナー鋳型核酸の設計方法については、例えば、国際公開第2016094874号パンフレット(この内容全体が参照により本明細書に明示的に援用される)に記載されている。
一部の実施形態において、本明細書に記載されるCRISPRシステムを使用して、標的核酸を編集して、標的核酸を修飾することができる(例えば、1つ以上のアミノ酸残基を挿入、欠失、又は変異させることによって)。例えば、一部の実施形態において、本明細書に記載されるCRISPRシステムは、望ましい核酸配列を含む外因性ドナー鋳型核酸(例えば、DNA分子又はRNA分子)を含む。本明細書に記載されるCRISPRシステムで誘導される切断イベントの分解時に、細胞の分子機構は、切断イベントを修復及び/又は分解する際に、外因性ドナー鋳型核酸を利用することができる。或いは、細胞の分子機構は、切断イベントを修復及び/又は分解する際に、内因性鋳型を利用することができる。一部の実施形態において、本明細書に記載されるCRISPRシステムは、挿入、欠失、及び/又は点突然変異を生じる標的核酸を修飾するために使用され得る。一部の実施形態において、挿入は、傷のない挿入である(すなわち、標的核酸への意図された核酸配列の挿入は、切断イベントの分解時に追加の意図されない核酸配列を生じない)。ドナー鋳型核酸は、二本鎖又は一本鎖核酸分子(例えば、DNA又はRNA)であってもよい。外因性ドナー鋳型核酸の設計方法については、例えば、国際公開第2016094874号パンフレット(この内容全体が参照により本明細書に明示的に援用される)に記載されている。
別の態様において、本開示は、RNA配列特異的干渉;RNA配列特異的遺伝子調節;RNA、RNA産物、lncRNA、非コードRNA、核RNA、又はmRNAのスクリーニング;突然変異誘発;RNAスプライシングの阻害;蛍光インサイチュハイブリダイゼーション;育種;細胞休眠の誘導;細胞周期停止の誘導;細胞成長及び/又は細胞増殖の減少;細胞アネルギーの誘導;細胞アポトーシスの誘導;細胞壊死の誘導;細胞死の誘導;又はプログラムされた細胞死の誘導からなる群から選択される方法における本明細書に記載されるシステムの使用を提供する。
本明細書に記載されるCRISPRシステムは、様々な治療上の適用を有し得る。一部の実施形態において、新規CRISPRシステムは、様々な疾患及び障害、例えば、遺伝性障害(例えば、単一遺伝子疾患)又はヌクレアーゼ活性によって治療することができる疾患(例えば、Pcsk9ターゲティング又はBCL11aターゲティング)を治療するために使用することができる。一部の実施形態において、本明細書に記載される方法は、対象、例えば、ヒト患者などの哺乳類の治療に用いられる。哺乳類対象はまた、イヌ、ネコ、ウマ、サル、ウサギ、ラット、マウス、雌ウシ、ヤギ、又はヒツジなど、家畜化された哺乳類であってもよい。
この方法は、病態又は疾患が感染性であることを含んでもよく、ここで感染性病原体は、ヒト免疫不全ウイルス(HIV)、単純ヘルペスウイルス1型(HSV1)、及び単純ヘルペスウイルス2型(HSV2)からなる群から選択される。
一態様において、本明細書に記載されるCRISPRシステムは、RNA、毒性RNA、及び/又は変異RNA(例えば、スプライシング欠陥又はトランケーション)の過剰発現によって引き起こされる疾患を治療するために使用することができる。例えば、有毒なRNAの発現は、核封入体の形成及び脳、心臓、又は骨格筋の遅発性変性変化に関連し得る。一部の実施形態において、障害は筋強直性ジストロフィーである。筋緊張性ジストロフィーにおいて、有毒なRNAの主な病原性効果は、結合タンパク質を隔離し、選択的スプライシングの調節を損なうことである(例えば、Osborne et al.,“RNA-dominant diseases,” Hum.Mol.Genet.,2009 Apr 15;18(8):1471-81を参照)。筋強直性ジストロフィー(dystrophia myotonica(DM))は、極めて広範囲の臨床的特徴を生じるため、遺伝学者にとって特に興味深いものである。現在DM1型(DM1)と呼ばれている古典的な形態のDMは、細胞質ゾルプロテインキナーゼをコードする遺伝子であるDMPKの3’非翻訳領域(UTR)におけるCTGリピートの拡大によって引き起こされる。本明細書に記載されるCRISPRシステムは、過剰発現されたRNA又は毒性RNA、例えば、DMPK遺伝子、又はDM1骨格筋、心臓、又は脳において誤調節された選択的スプライシングのいずれかを標的とすることができる。
本明細書に記載されるCRISPRシステムは、プラダー・ウィリ症候群、脊髄性筋萎縮症(SMA)、先天性角化異常症などの様々な疾患を引き起こすRNA依存性機能に影響を与えるトランス作用性変異を標的とすることもできる。本明細書に記載されるCRISPRシステムを使用して治療できる疾患のリストは、Cooper et al.,“RNA and disease,” Cell,136.4(2009):777-793及び国際公開第2016205764号パンフレットに要約される(これらはそれぞれ全体として参照により本明細書に援用される)。
本明細書に記載されるCRISPRシステムは、例えば、原発性加齢性タウオパチー(PART)/神経原線維変化(NFT)優勢老人性認知症(アルツハイマー病(AD)で見られるものと同様のNFTを伴うが、プラークを伴わない)、ボクシング認知症(慢性外傷性脳症)、及び進行性核上性麻痺などの原発性及び続発性タウオパチーを含む、様々なタウオパチーの治療にも使用できる。タウオパチー及びこれらの疾患を治療する方法の有用なリストは、例えば、国際公開第2016205764号パンフレット(本明細書において全体として参照により援用される)に記載されている。
本明細書に記載されるCRISPRシステムは、スプライシングの欠陥及び疾患を引き起こし得るシス作用性スプライシングコードを破壊する変異を標的化するためにも使用できる。これらの疾患としては、例えば、SMN1遺伝子の欠失に起因する運動ニューロン変性疾患(例えば、脊髄性筋萎縮症)、デュシェンヌ型筋ジストロフィー(DMD)、前頭側頭型認知症、及び第17染色体に関連するパーキンソニズム(FTDP-17)、及び嚢胞性線維症が挙げられる。
本明細書に記載されるCRISPRシステムは、特にRNAウイルスに対する抗ウイルス活性のために更に使用することができる。エフェクタータンパク質は、ウイルスRNA配列を標的化するために選択された適切なRNAガイドを使用してウイルスRNAを標的化することができる。
更に、インビトロRNAセンシングアッセイを使用して特定のRNA基質を検出することができる。RNAターゲティングエフェクタータンパク質は、生細胞でのRNAベースのセンシングに使用できる。適用例は、例えば、疾患特異的RNAのセンシングによる診断である。
本明細書に記載されるCRISPRシステムの治療用途の詳細な説明は、例えば、米国特許第8795965号明細書、欧州特許第3009511号明細書、国際公開第2016205764号パンフレット、及び国際公開第2017070605号パンフレット(これらの各々は、本明細書において全体として参照により援用される)に見出すことができる。
植物における適用
本明細書に記載されるCRISPRシステムは、植物において幅広い種類の有用性がある。一部の実施形態において、CRISPRシステムを使用して植物のゲノムをエンジニアリングすることができる(例えば、生産を向上させる、所望の翻訳後修飾を有する生産品にする、又は工業製品を生産するための遺伝子を導入する)。一部の実施形態において、CRISPRシステムを使用して、植物に所望の形質を(例えば、ゲノムに対する遺伝性修飾を伴い又は伴わず)導入し、又は植物細胞若しくは全植物における内因性遺伝子の発現を調節することができる。
本明細書に記載されるCRISPRシステムは、植物において幅広い種類の有用性がある。一部の実施形態において、CRISPRシステムを使用して植物のゲノムをエンジニアリングすることができる(例えば、生産を向上させる、所望の翻訳後修飾を有する生産品にする、又は工業製品を生産するための遺伝子を導入する)。一部の実施形態において、CRISPRシステムを使用して、植物に所望の形質を(例えば、ゲノムに対する遺伝性修飾を伴い又は伴わず)導入し、又は植物細胞若しくは全植物における内因性遺伝子の発現を調節することができる。
一部の実施形態において、本CRISPRシステムを使用して、特異的タンパク質、例えば、アレルゲンタンパク質(例えば、ピーナッツ、ダイズ、レンズマメ、エンドウマメ、サヤマメ、及びヤエナリ中のアレルゲンタンパク質)をコードする遺伝子を同定、編集、及び/又はサイレンシングすることができる。タンパク質をコードする遺伝子を同定、編集、及び/又はサイレンシングする方法に関する詳細な説明については、例えば、Nicolaou et al.,“Molecular diagnosis of peanut and legume allergy,”Curr.Opin.Allergy Clin.Immunol.,11(3):222-8(2011)、及び国際公開第2016205764号パンフレット(これらはそれぞれ全体として参照により本明細書に援用される)に記載されている。
CRISPRシステムの送達
本開示及び当技術分野の知識を通じて、本明細書に記載されるCRISPRシステム、又はその成分、その核酸分子、又はその成分をコードする若しくは提供する核酸分子は、ベクター、例えば、プラスミド、又はウイルス送達ベクターなどの様々な送達システムによって送達することができる。本明細書に開示されるCRISPRエフェクター及び/又はいずれかのRNA(例えば、RNAガイド)は、適切なベクター、例えば、プラスミド、又はアデノ随伴ウイルス(AAV)、レンチウイルス、アデノウイルス、及び他のウイルスベクターなどのウイルスベクター、又はそれらの組み合わせを使用して送達することができる。エフェクター及び1つ以上のRNAガイドは、1つ以上のベクター、例えばプラスミド又はウイルスベクターにパッケージングすることができる。
本開示及び当技術分野の知識を通じて、本明細書に記載されるCRISPRシステム、又はその成分、その核酸分子、又はその成分をコードする若しくは提供する核酸分子は、ベクター、例えば、プラスミド、又はウイルス送達ベクターなどの様々な送達システムによって送達することができる。本明細書に開示されるCRISPRエフェクター及び/又はいずれかのRNA(例えば、RNAガイド)は、適切なベクター、例えば、プラスミド、又はアデノ随伴ウイルス(AAV)、レンチウイルス、アデノウイルス、及び他のウイルスベクターなどのウイルスベクター、又はそれらの組み合わせを使用して送達することができる。エフェクター及び1つ以上のRNAガイドは、1つ以上のベクター、例えばプラスミド又はウイルスベクターにパッケージングすることができる。
一部の実施形態において、ベクター、例えばプラスミド又はウイルスベクターは、例えば、筋肉内注射、静脈内投与、経皮投与、鼻腔内投与、経口投与、又は粘膜投与によって目的の組織に送達される。かかる送達は、1回用量又は複数回用量のいずれによるものであってもよい。当業者は、本明細書において実際に送達される投薬量が、ベクターの選択、標的細胞、生物、組織、治療対象の全般的な状態、求められる形質転換/修飾の程度、投与経路、投与様式、及び求められる形質転換/修飾の種類を含むがこれらに限定されず、種々の要因に応じて大きく異なり得ることを理解する。
特定の実施形態において、送達は、アデノウイルスによるものであり、これは少なくとも1×105粒子(粒子単位、puとも称される)のアデノウイルスを含有する1回用量におけるものであることができる。一部の実施形態において、好ましくは用量は少なくとも約1×106粒子、少なくとも約1×107粒子、少なくとも約1×108粒子、及び少なくとも約1×109粒子のアデノウイルスである。送達方法及び用量については、例えば、国際公開第2016205764号パンフレット及び米国特許第8454972号明細書(これらはそれぞれ全体として参照により本明細書に援用される)に記載されている。
一部の実施形態において、送達はプラスミドによるものである。投薬量は、応答を引き出すのに十分な数のプラスミドであり得る。ある場合には、プラスミド組成物中のプラスミドDNAの好適な分量は、約0.1~約2mgであってもよい。プラスミドは概して、(i)プロモーター;(ii)プロモーターに作動可能に連結された、核酸ターゲティングCRISPRエフェクターをコードする配列;(iii)選択可能マーカー;(iv)複製起点;及び(v)(ii)の下流にある且つそれに作動可能に連結された転写ターミネーターを含むことになる。プラスミドはまた、CRISPR複合体のRNA成分もコードすることができるが、代わりに、これらのうちの1つ以上が異なるベクターにコードされてもよい。投与頻度は、医学又は獣医学の実践者(例えば、医師、獣医師)、又は当業者の範囲内にある。
別の実施形態において、送達はリポソーム又はリポフェクチン製剤などによるものであり、当業者に公知の方法によって調製することができる。かかる方法については、例えば、国際公開第2016205764号パンフレット及び米国特許第5593972号明細書;同第5589466号明細書;及び同第5580859号明細書(これらの各々は、本明細書において全体として参照により援用される)に記載されている。
一部の実施形態において、送達はナノ粒子又はエキソソームによるものである。例えば、エキソソームはRNA送達に特に有用であることが示されている。
本明細書に記載されるCRISPRシステムの1つ以上の成分を細胞に導入する更なる手段は、細胞透過性ペプチド(CPP)の使用によるものである。一部の実施形態では、細胞透過性ペプチドがCRISPRエフェクターに連結される。一部の実施形態では、CRISPRエフェクター及び/又はRNAガイドが1つ以上のCPPとカップリングされ、細胞内部へと輸送する(例えば、植物プロトプラスト)。一部の実施形態では、CRISPRエフェクター及び/又は1つ又は複数のRNAガイドが、細胞送達のため1つ以上のCPPにカップリングされている1つ以上の環状又は非環状DNA分子によってコードされる。
CPPは、生体分子を受容体非依存的に細胞膜を越えて輸送する能力を有するタンパク質又はキメラ配列のいずれかに由来する35アミノ酸未満の短鎖ペプチドである。CPPは、カチオン性ペプチド、疎水性配列を有するペプチド、両親媒性ペプチド、プロリンリッチな抗微生物配列を有するペプチド、及びキメラ又は双節型ペプチドであってもよい。CPPの例としては、例えば、Tat(これはHIV 1型によるウイルス複製に必要な核転写活性化因子タンパク質である)、ペネトラチン、カポジ線維芽細胞成長因子(FGF)シグナルペプチド配列、インテグリンβ3シグナルペプチド配列、ポリアルギニンペプチドArg配列、グアニンリッチ分子輸送体、及びスイートアローペプチドが挙げられる。CPP及びその使用方法については、例えば、Haellbrink et al.,“Prediction of cell-penetrating peptides,”Methods Mol.Biol.,2015;1324:39-58;Ramakrishna et al.,“Gene disruption by cell-penetrating peptide-mediated delivery of Cas9 protein and guide RNA,”Genome Res.,2014 Jun;24(6):1020-7;及び国際公開第2016205764号パンフレット(これらの各々は、本明細書において全体として参照により援用される)に記載されている。
本明細書に記載されるCRISPRシステムのための様々な送達方法はまた、例えば、米国特許第8795965号明細書、欧州特許第3009511号明細書、国際公開第2016205764号パンフレット、及び国際公開第2017070605号パンフレット(これらの各々は、本明細書において全体として参照により援用される)にも記載されている。
以下の例に本発明を更に記載するが、これらの例は、特許請求の範囲に記載される本発明の範囲を限定するものではない。
実施例1-CLUST.143952 CRISPR-Casシステムの成分の同定
このタンパク質ファミリーは、上記の計算方法を使用して同定された。CLUST.143952システムは、哺乳類消化器系、ウシ腸、及び腸に限定されない環境から採取された無培養のメタゲノム配列に見られるCRISPRシステムに関連するシングルエフェクターを含む(表4)。例示的なCLUST.143952エフェクターには、以下の表4及び5に示されるものが含まれる。図1A~図1Jに示されるとおり、配列番号1~5、7~12、15、16、18~20に記載のエフェクター配列をアラインメントして配列類似性領域を同定した。図1A~図1Jの上部にコンセンサス配列を記載する。コンセンサス配列の下の棒グラフが配列類似性を表し、ここでは最も高いバーが、最も高い配列類似性の残基を示している。非限定的な配列類似性領域を表6に示す。配列類似性領域は、本明細書に開示されるエフェクターが、ヌクレアーゼを代表する保存されたC末端RuvCドメインを有するファミリーであることを示している。
このタンパク質ファミリーは、上記の計算方法を使用して同定された。CLUST.143952システムは、哺乳類消化器系、ウシ腸、及び腸に限定されない環境から採取された無培養のメタゲノム配列に見られるCRISPRシステムに関連するシングルエフェクターを含む(表4)。例示的なCLUST.143952エフェクターには、以下の表4及び5に示されるものが含まれる。図1A~図1Jに示されるとおり、配列番号1~5、7~12、15、16、18~20に記載のエフェクター配列をアラインメントして配列類似性領域を同定した。図1A~図1Jの上部にコンセンサス配列を記載する。コンセンサス配列の下の棒グラフが配列類似性を表し、ここでは最も高いバーが、最も高い配列類似性の残基を示している。非限定的な配列類似性領域を表6に示す。配列類似性領域は、本明細書に開示されるエフェクターが、ヌクレアーゼを代表する保存されたC末端RuvCドメインを有するファミリーであることを示している。
これらのシステムのダイレクトリピート配列の例及びスペーサー長さを表7に示す。
実施例2-トランス活性化型RNAエレメントの同定
エフェクタータンパク質及びcrRNAに加えて、本明細書に記載される一部のCRISPRシステムはまた、トランス活性化型RNA(tracrRNA)と称されるロバストな酵素活性を活性化させる追加の低分子RNAも含み得る。かかるtracrRNAは、典型的には、crRNAにハイブリダイズする相補領域を含む。crRNA-tracrRNAハイブリッドがエフェクターと複合体を形成して、プログラム可能な酵素活性の活性化をもたらす。
・ tracrRNA配列は、crRNAのダイレクトリピート部分と相同な短い配列モチーフに関して、CRISPRアレイに隣接するゲノム配列を検索することにより同定し得る。検索方法は、全長ダイレクトリピート(DR)又はDR部分配列についての正確な又は縮重の配列一致を含む。例えば、長さnヌクレオチドのDRを、一組の重複する6~10nt kmerに分解することができる。これらのkmerを、CRISPR遺伝子座に隣接する配列とアラインメントすることができ、1kmer以上のアラインメントを有する相同性領域を、tracrRNAとしての実験検証用のDR相同性領域として同定することができる。或いは、全長DR又はDR部分配列及びCRISPRシステムのエレメントに隣接するゲノム配列からの短いkmer配列について、RNA共折り畳み自由エネルギーを計算することができる。低い最小自由エネルギー構造を有する隣接配列エレメントを、tracrRNAとしての実験検証用のDR相同性領域として同定することができる。
・ tracrRNAエレメントは、高頻度で、CRISPR関連遺伝子又はCRISPRアレイにごく近接した範囲内に出現する。DR相同性領域を検索してtracrRNAエレメントを同定するのに代わる方法として、CRISPRエフェクター又はCRISPRアレイに隣接する非コード配列をtracrRNAの直接的な実験検証用にクローニング又は遺伝子合成によって単離することができる。
・ tracrRNAエレメントの実験検証は、CRISPRシステム又は非天然種で異種発現させる合成配列に関して、宿主生物の低分子RNAシーケンシングを用いて実施することができる。由来元のゲノム遺伝子座からの低分子RNA配列のアラインメントを用いて、DR相同性領域を含有するRNA産物の発現及び全長tracrRNAエレメントに典型的なステロタイプの(sterotyped)プロセシングを同定することができる。
・ RNAシーケンシングによって同定された全長tracrRNA候補は、インビトロ又はインビボで、そのtracrRNA候補と組み合わせて、又はそれなしにcrRNA及びエフェクターを発現させて、エフェクター酵素活性の活性化をモニタすることにより検証し得る。
・ エンジニアリングされたコンストラクトでは、tracrRNAの発現は、限定はされないが、哺乳類細胞における発現用のU6、U1、及びH1プロモーター又は細菌における発現用のJ23119プロモーターを含めたプロモーターによってドライブすることができる。
・ 一部の例では、tracrRNAをcrRNAと融合して、シングルRNAガイドとして発現させてもよい。
・ 一部の実施形態において、表8に掲載される非コード配列の中に含まれるtracrRNA。例えば、一部の実施形態において、本システムは、配列番号62~74のいずれか1つに記載のtracrRNAを含む。
エフェクタータンパク質及びcrRNAに加えて、本明細書に記載される一部のCRISPRシステムはまた、トランス活性化型RNA(tracrRNA)と称されるロバストな酵素活性を活性化させる追加の低分子RNAも含み得る。かかるtracrRNAは、典型的には、crRNAにハイブリダイズする相補領域を含む。crRNA-tracrRNAハイブリッドがエフェクターと複合体を形成して、プログラム可能な酵素活性の活性化をもたらす。
・ tracrRNA配列は、crRNAのダイレクトリピート部分と相同な短い配列モチーフに関して、CRISPRアレイに隣接するゲノム配列を検索することにより同定し得る。検索方法は、全長ダイレクトリピート(DR)又はDR部分配列についての正確な又は縮重の配列一致を含む。例えば、長さnヌクレオチドのDRを、一組の重複する6~10nt kmerに分解することができる。これらのkmerを、CRISPR遺伝子座に隣接する配列とアラインメントすることができ、1kmer以上のアラインメントを有する相同性領域を、tracrRNAとしての実験検証用のDR相同性領域として同定することができる。或いは、全長DR又はDR部分配列及びCRISPRシステムのエレメントに隣接するゲノム配列からの短いkmer配列について、RNA共折り畳み自由エネルギーを計算することができる。低い最小自由エネルギー構造を有する隣接配列エレメントを、tracrRNAとしての実験検証用のDR相同性領域として同定することができる。
・ tracrRNAエレメントは、高頻度で、CRISPR関連遺伝子又はCRISPRアレイにごく近接した範囲内に出現する。DR相同性領域を検索してtracrRNAエレメントを同定するのに代わる方法として、CRISPRエフェクター又はCRISPRアレイに隣接する非コード配列をtracrRNAの直接的な実験検証用にクローニング又は遺伝子合成によって単離することができる。
・ tracrRNAエレメントの実験検証は、CRISPRシステム又は非天然種で異種発現させる合成配列に関して、宿主生物の低分子RNAシーケンシングを用いて実施することができる。由来元のゲノム遺伝子座からの低分子RNA配列のアラインメントを用いて、DR相同性領域を含有するRNA産物の発現及び全長tracrRNAエレメントに典型的なステロタイプの(sterotyped)プロセシングを同定することができる。
・ RNAシーケンシングによって同定された全長tracrRNA候補は、インビトロ又はインビボで、そのtracrRNA候補と組み合わせて、又はそれなしにcrRNA及びエフェクターを発現させて、エフェクター酵素活性の活性化をモニタすることにより検証し得る。
・ エンジニアリングされたコンストラクトでは、tracrRNAの発現は、限定はされないが、哺乳類細胞における発現用のU6、U1、及びH1プロモーター又は細菌における発現用のJ23119プロモーターを含めたプロモーターによってドライブすることができる。
・ 一部の例では、tracrRNAをcrRNAと融合して、シングルRNAガイドとして発現させてもよい。
・ 一部の実施形態において、表8に掲載される非コード配列の中に含まれるtracrRNA。例えば、一部の実施形態において、本システムは、配列番号62~74のいずれか1つに記載のtracrRNAを含む。
実施例3-酵素活性の新規RNAモジュレーターの同定
エフェクタータンパク質及びcrRNAに加えて、本明細書に記載される一部のCRISPRシステムはまた、本明細書においてRNAモジュレーターと称される、エフェクター活性を活性化させる又は調節するための追加の低分子RNAも含み得る。
・ RNAモジュレーターは、CRISPR関連遺伝子又はCRISPRアレイにごく近接した範囲内に出現するものと思われる。RNAモジュレーターを同定し、検証するには、CRISPRエフェクター又はCRISPRアレイに隣接する非コード配列を直接的な実験検証用にクローニング又は遺伝子合成によって単離することができる。
・ RNAモジュレーターの実験検証は、CRISPRシステム又は非天然種で異種発現する合成配列に関して、宿主生物の低分子RNAシーケンシングを用いて実施することができる。低分子RNA配列と由来元のゲノム遺伝子座とのアラインメントを用いて、DR相同性領域を含有するRNA産物の発現及びステロタイプの(sterotyped)プロセシングを同定することができる。
・ RNAシーケンシングによって同定された候補RNAモジュレーターは、インビトロ又はインビボで、その候補RNAモジュレーターと組み合わせて、又はそれなしにcrRNA及びエフェクターを発現させて、エフェクター酵素活性の変化をモニタすることにより検証し得る。
・ エンジニアリングされたコンストラクトでは、RNAモジュレーターは、哺乳類細胞における発現用のU6、U1、及びH1プロモーター、又は細菌における発現用のJ23119プロモーターを含めたプロモーターによってドライブすることができる。
・ 一部の例では、RNAモジュレーターをcrRNA、tracrRNA、又は両方のいずれかと人工的に融合し、シングルRNAエレメントとして発現させてもよい。
エフェクタータンパク質及びcrRNAに加えて、本明細書に記載される一部のCRISPRシステムはまた、本明細書においてRNAモジュレーターと称される、エフェクター活性を活性化させる又は調節するための追加の低分子RNAも含み得る。
・ RNAモジュレーターは、CRISPR関連遺伝子又はCRISPRアレイにごく近接した範囲内に出現するものと思われる。RNAモジュレーターを同定し、検証するには、CRISPRエフェクター又はCRISPRアレイに隣接する非コード配列を直接的な実験検証用にクローニング又は遺伝子合成によって単離することができる。
・ RNAモジュレーターの実験検証は、CRISPRシステム又は非天然種で異種発現する合成配列に関して、宿主生物の低分子RNAシーケンシングを用いて実施することができる。低分子RNA配列と由来元のゲノム遺伝子座とのアラインメントを用いて、DR相同性領域を含有するRNA産物の発現及びステロタイプの(sterotyped)プロセシングを同定することができる。
・ RNAシーケンシングによって同定された候補RNAモジュレーターは、インビトロ又はインビボで、その候補RNAモジュレーターと組み合わせて、又はそれなしにcrRNA及びエフェクターを発現させて、エフェクター酵素活性の変化をモニタすることにより検証し得る。
・ エンジニアリングされたコンストラクトでは、RNAモジュレーターは、哺乳類細胞における発現用のU6、U1、及びH1プロモーター、又は細菌における発現用のJ23119プロモーターを含めたプロモーターによってドライブすることができる。
・ 一部の例では、RNAモジュレーターをcrRNA、tracrRNA、又は両方のいずれかと人工的に融合し、シングルRNAエレメントとして発現させてもよい。
実施例4-エンジニアリングされたCLUST.143952 CRISPR-Casシステムの機能検証
CLUST.143952 CRISPR-Casシステムの成分が同定されたところで、3300028591(配列番号1)と称されるメタゲノム供給源からの遺伝子座を機能検証用に選択した。
CLUST.143952 CRISPR-Casシステムの成分が同定されたところで、3300028591(配列番号1)と称されるメタゲノム供給源からの遺伝子座を機能検証用に選択した。
DNA合成及びエフェクターライブラリクローニング
例示的なCLUST.143952 CRISPR-Casシステムの活性を試験するために、pET28a(+)ベクターを使用してシステムを設計及び合成した。簡潔に言えば、CLUST.143952 3300028591エフェクター(表5に示す配列番号1)をコードする大腸菌(E.coli)コドン最適化核酸配列を合成し(Genscript)、pET-28a(+)(EMD-Millipore)に由来するカスタム発現システムにクローニングした。ベクターは、lacプロモーター及び大腸菌(E.coli)リボソーム結合配列の制御下にあるCLUST.143952エフェクターをコードする核酸を含んでいた。ベクターはまた、CLUST.143952エフェクターのオープンリーディングフレームに続くJ23119プロモーターによってドライブされるCRISPRアレイライブラリのアクセプター部位も含んでいた。表8に示すように、CLUST.143952 3300028591エフェクター(配列番号1)に使用される非コード配列は配列番号40に記載される。CLUST.143952 3300028591エフェクター(配列番号1)が非コード配列なしでpET28a(+)に個別にクローニングされた、追加の条件が試験された。図4Aを参照されたい。
例示的なCLUST.143952 CRISPR-Casシステムの活性を試験するために、pET28a(+)ベクターを使用してシステムを設計及び合成した。簡潔に言えば、CLUST.143952 3300028591エフェクター(表5に示す配列番号1)をコードする大腸菌(E.coli)コドン最適化核酸配列を合成し(Genscript)、pET-28a(+)(EMD-Millipore)に由来するカスタム発現システムにクローニングした。ベクターは、lacプロモーター及び大腸菌(E.coli)リボソーム結合配列の制御下にあるCLUST.143952エフェクターをコードする核酸を含んでいた。ベクターはまた、CLUST.143952エフェクターのオープンリーディングフレームに続くJ23119プロモーターによってドライブされるCRISPRアレイライブラリのアクセプター部位も含んでいた。表8に示すように、CLUST.143952 3300028591エフェクター(配列番号1)に使用される非コード配列は配列番号40に記載される。CLUST.143952 3300028591エフェクター(配列番号1)が非コード配列なしでpET28a(+)に個別にクローニングされた、追加の条件が試験された。図4Aを参照されたい。
「リピート-スペーサー-リピート」配列を含むオリゴヌクレオチドライブラリ合成(OLS)プールが計算的に設計され、ここで、「リピート」は、エフェクターに関連するCRISPRアレイに見られるコンセンサスダイレクトリピート配列に相当し、「スペーサー」は、pACYC184プラスミド又は大腸菌(E.coli)必須遺伝子をタイリング(tiling)する配列に相当する。特に、表7に示すように、CLUST.143952 3300028591エフェクター(配列番号1)に使用されるリピート配列は配列番号21に記載される。スペーサー長さは、内因性CRISPRアレイに見られるスペーサー長さの最頻値によって決定した。リピート-スペーサー-リピート配列には、前述のCRISPRアレイライブラリアクセプター部位、及びより大規模なプールからの特異的リピート-スペーサー-リピートライブラリの特定の増幅を実現するユニークなPCRプライミング部位への断片の双方向クローニングを実現する、制限部位が付加された。
次に、Golden Gateアセンブリ法を使用して、リピート-スペーサー-リピートライブラリをプラスミドにクローニングした。簡潔に言えば、本発明者らは初めに、ユニークなPCRプライマーを使用してOLSプール(Agilent Genomics)から各リピート-スペーサー-リピートを増幅し、BsaIを使用してプラスミド骨格を事前に線形化して、潜在的バックグラウンドを低減した両方のDNA断片は、Golden Gateアセンブリマスターミックス(New England Biolabs)に添加する前に、Ampure XP(Beckman Coulter)で精製し、製造者の指示に従ってインキュベートした。Golden Gate反応物を更に精製及び濃縮して、細菌スクリーニングの後続のステップで最大の形質転換効率を実現した。
異なるリピート-スペーサー-リピートエレメントとCRISPRエフェクターとを含むプラスミドライブラリを、Lucigenが推奨するプロトコルに従ってGene Pulser Xcell(登録商標)(Bio-rad)を使用してE.CloniエレクトロコンピテントなE.coli(Lucigen)に電気穿孔した。ライブラリを、精製pACYC184プラスミドで共形質転換するか、又はpACYC184を含むE.Cloniエレクトロコンピテントな大腸菌(E.coli)(Lucigen)に直接形質転換し、BioAssay(登録商標)ディッシュ(Thermo Fisher)のクロラムフェニコール(Fisher)、テトラサイクリン(Alfa Aesar)、カナマイシン(Alfa Aesar)を含む寒天培地に播種し、37℃で10~12時間インキュベートした。近似コロニー数を推定して細菌プレート上に十分なライブラリ提示を確保した後、細菌を回収し、QIAprep Spin Miniprep(登録商標)キット(Qiagen)を使用してプラスミドDNAを抽出し、「出力ライブラリ」を作成した。Illuminaシーケンシングケミストリーに適合性のあるバーコード及び部位を含むカスタムプライマーを使用してPCRを実行することにより、形質変換前の「入力ライブラリ」及び回収後の「出力ライブラリ」の両方からバーコード付きの次世代シーケンシングライブラリを生成し、これをプールし、Nextseq550(Illumina)にロードして、エフェクターを評価した。一貫性を確保するために、各スクリーンに対して少なくとも2つの独立したバイオロジカルレプリケートが実施された。図4Bを参照されたい。
細菌スクリーンシーケンシング解析
Illumina bcl2fastqを使用してスクリーン入力及び出力ライブラリの次世代シーケンシングデータをデマルチプレックス化した。各試料について得られたfastqファイル中のリードが、スクリーニングプラスミドライブラリ用のCRISPRアレイエレメントを含んだ。CRISPRアレイのダイレクトリピート配列を用いてアレイの向きを決定し、スペーサー配列をソース(pACYC184又はE.Cloni)又は陰性対照配列(GFP)にマッピングすることにより対応する標的を決定した。各試料について、所与のプラスミドライブラリ中の各ユニークなアレイエレメントのリード総数(ra)をカウントし、以下のとおり規格化した:(ra+1)/全てのライブラリアレイエレメントの総リード数。所与のアレイエレメントに関する規格化出力リード数を規格化入力リード数で除すことにより、枯渇スコアを計算した。
Illumina bcl2fastqを使用してスクリーン入力及び出力ライブラリの次世代シーケンシングデータをデマルチプレックス化した。各試料について得られたfastqファイル中のリードが、スクリーニングプラスミドライブラリ用のCRISPRアレイエレメントを含んだ。CRISPRアレイのダイレクトリピート配列を用いてアレイの向きを決定し、スペーサー配列をソース(pACYC184又はE.Cloni)又は陰性対照配列(GFP)にマッピングすることにより対応する標的を決定した。各試料について、所与のプラスミドライブラリ中の各ユニークなアレイエレメントのリード総数(ra)をカウントし、以下のとおり規格化した:(ra+1)/全てのライブラリアレイエレメントの総リード数。所与のアレイエレメントに関する規格化出力リード数を規格化入力リード数で除すことにより、枯渇スコアを計算した。
酵素活性及び細菌細胞死を生じさせる特異的パラメータを同定するため、本発明者らは次世代シーケンシング(NGS)を用いて入力及び出力プラスミドライブラリのPCR産物中における個々のCRISPRアレイ(即ち、リピート-スペーサー-リピート)の表現を定量化し、比較した。アレイの枯渇率は、規格化された出力リード数を規格化された入力リード数で割ったものとして定義された。枯渇率が0.2未満(5倍を超える枯渇)の場合、アレイは「強力に枯渇した」と見なし、図5に破線で示した。バイオロジカルレプリケートにわたるアレイ枯渇率を計算する際には、全実験にわたる所与のCRISPRアレイについての最大枯渇率の値をとった(即ち、強力に枯渇したアレイは、全てのバイオロジカルレプリケートで強力に枯渇していなければならない)。各スペーサー標的について、アレイ枯渇率及び以下の特徴:標的鎖、転写物ターゲティング、ORIターゲティング、標的配列モチーフ、フランキング配列モチーフ、及び標的二次構造を含む行列を作成した。この行列中の異なる特徴がCLUST.143952システムについての標的枯渇を説明する程度を調査した。
図5は、所与の標的について、スクリーン出力対スクリーン入力におけるシーケンシングリードの規格化された比率をプロットすることによる、非コード配列と共にエンジニアリングされた組成物の干渉活性の程度を示す。結果は各DR転写方向につきプロットされる。組成物の機能的スクリーニングにおいて、活性RNAガイドと複合体を形成した活性エフェクターは、クロラムフェニコール及びテトラサイクリンに対する大腸菌(E.coli)耐性を付与するpACYC184の能力に干渉し、細胞死及びプール内のスペーサーエレメントの枯渇をもたらす。初期DNAライブラリ(画面入力)と生存形質転換大腸菌(画面出力)のディープシーケンスの結果を比較すると、活性でプログラム可能なCRISPRシステムを可能にする特定の標的配列及びDR転写方向が示唆される。スクリーンはまた、エフェクター複合体がDRの1つの方向でのみ活性であることも示す。このように、スクリーニングから、CLUST.143952 3300028591エフェクターが「逆」方向(5’-GGTA…CATA-[スペーサー]-3’)のDRで活性あったことが示された(図5)。
図6A及び図6Bは、それぞれpACYC184及び大腸菌(E.coli)E.Cloni必須遺伝子を標的化するCLUST.143952 3300028591エフェクター(+非コード配列)についての強力に枯渇した標的の位置を示す。枯渇した標的の隣接配列を分析して、CLUST.143952エフェクターのPAMを決定した。CLUST.143952 3300028591のPAM配列のWebLogo表現(Crooks et al.,Genome Research 14:1188-90,2004)を図7に示し、ここでは「20」位が、標的の5’末端に隣接するヌクレオチドに対応する。非コード配列の非存在下では、CLUST.143952 3300028591エフェクターは活性を保持しなかったことから、CLUST.143952エフェクターにtracrRNAが必要であることが示される。
実施例5-CLUST.143952エフェクターによるGFPのターゲティング
この実施例は、CLUST.143952エフェクターの活性を測定するための蛍光枯渇アッセイ(FDA)の使用を説明する。
この実施例は、CLUST.143952エフェクターの活性を測定するための蛍光枯渇アッセイ(FDA)の使用を説明する。
このアッセイでは、GFPを標的とするように設計された活性CRISPRシステムが、GFPをコードする二本鎖DNA領域に結合して切断することにより、GFP蛍光の枯渇が生じる。FDAアッセイには、インビトロでの転写及び翻訳が含まれ、これにより、CLUST.143952エフェクターをコードするDNA鋳型、及びダイレクトリピート(DR)-スペーサー-ダイレクトリピート(DR)を有するT7プロモーター下のプレcrRNA配列を含むDNA鋳型からのRNPの産生が可能になる。スペーサーはGFPを標的とした。同じワンポット反応において、GFP及びRFPも標的及び蛍光レポーターの両方として産生された(図8A)。標的GFPプラスミド配列は配列番号86に示され、RFPプラスミド配列は配列番号87に示される。TECAN Infinite F Plexプレートリーダーを使用して、GFP及びRFPの蛍光値を37℃で20分ごとに、12時間にわたって測定した。RFPは標的化されなかったため、その蛍光は影響を受けず、そのため、内部シグナル対照として使用された。
配列番号86
配列番号87
配列番号86
配列番号1のエフェクターに対し、2つのGFP標的(+2つの非標的)を設計した。FDAアッセイに使用したRNAガイド配列(標的1及び非標的2についてプレcrRNA、並びに標的3及び非標的4について成熟crRNA)、標的配列、及び非標的対照配列を表9に掲載する。標的配列には、5’-G-3’PAMを使用した。
GFPシグナルをRFPシグナルに規格化し、3つの技術的複製の平均蛍光を各時点で取得した。次に、非GFPターゲティングRNAガイド(代わりにカナマイシン耐性遺伝子を標的とし、GFPシグナルを枯渇させない)とインキュベートしたエフェクターのGFPシグナルを、GFPターゲティングRNAガイドとインキュベートしたエフェクターのGFPシグナルで割ることにより、GFP蛍光枯渇を計算した。得られた値は、図8Bにおいて「枯渇」と呼ばれる。
1又は約1の枯渇は、非GFPターゲティングプレcrRNA及びGFPターゲティングプレcrRNAに関してGFP枯渇にほとんど又は全く差異がないことを示した(例えば、10RFU/10RFU=1)。1を超える枯渇は、非GFPターゲティングプレcrRNA及びGFPターゲティングプレcrRNAに関してGFP枯渇に差異があることを示した(例えば、10RFU/5RFU=2)。GFPシグナルの枯渇は、エフェクターが機能的RNPを形成し、GFPコード領域内に二本鎖DNA切断を導入することによってGFPの産生に干渉したことを示した。GFP枯渇の程度は、CLUST.143952エフェクターの特異的活性と主に相関していた。
図8Bは、それぞれ、配列番号1のエフェクターによって形成され、各GFP標的(標的1及び標的3)につき20分ごとに測定された、RNPの枯渇曲線を示す。各標的において、配列番号1のエフェクターで形成されたRNPの枯渇値は1より大きかった。
これは、CLUST.143952エフェクターがGFPの産生への干渉能を有する機能的RNPを形成したことを示唆している。配列番号1のエフェクターとプレcrRNA(配列番号88)又は成熟crRNA(配列番号91)とで形成されるRNPは活性であった。
実施例6-CLUST.143952エフェクターによる哺乳動物遺伝子のターゲティング
この実施例は、一過性トランスフェクションによって哺乳動物細胞に導入されたCLUST.143952エフェクターを使用して哺乳動物標的に対するインデル評価を説明する。
この実施例は、一過性トランスフェクションによって哺乳動物細胞に導入されたCLUST.143952エフェクターを使用して哺乳動物標的に対するインデル評価を説明する。
配列番号1のエフェクターをpcda3.1骨格(Invitrogen)にクローニングした。次に、プラスミドをマキシプレップし、1μg/μLに希釈した。RNAガイドの調製では、crRNAをコードするdsDNA断片は、標的配列の足場及びU6プロモーターを含むウルトラマー(ultramer)によって誘導された。ウルトラマーを10mMのTris・HClにpH7.5で再懸濁し、最終ストック濃度を100μMにした。続いてワーキングストックを10μMに希釈し、再度10mM Tris・HClを使用して、PCR反応の鋳型として使用した。crRNAの増幅は、次の成分を用いた50μLの反応物で行われた:前述の鋳型0.02μl、フォワードプライマー2.5μl、リバースプライマー2.5μl、NEB HiFiポリメラーゼ25μL、及び水20μl。サイクリング条件は、1×(98℃で30秒)、30×(98℃で10秒、67℃で15秒)、1×(72℃で2分)であった。PCR産物は1.8X SPRI処理でクリーンアップされ、25ng/μLに規格化された。調製した成熟crRNA配列、及びその対応する標的配列を表10に示す。標的配列には、5’-G-3’PAMを使用した。
トランスフェクションの約16時間前に、DMEM/10%FBS+Pen/Strep中の25,000個のHEK293T細胞100μlを96ウェルプレートの各ウェルにプレーティングした。トランスフェクションの日、細胞は70~90%コンフルエントであった。トランスフェクトするウェルごとに、0.5μlのLipofectamine2000と9.5μlのOpti-MEMの混合物を調製し、次に室温で5~20分間インキュベートした(溶液1)。インキュベーション後、lipofectamine:OptiMEM混合物を、182ngのエフェクタープラスミド及び14ngのcrRNA及び最大10μLの水を含む別の混合物に添加した(溶液2)。陰性対照のケースでは、crRNAは溶液2に含まれていなかった。溶液1と溶液2の混合物をピペッティングにより上下に混合し、次に室温で25分間インキュベートした。インキュベーション後、20μLの溶液1と溶液2の混合物を、細胞を含む96ウェルプレートの各ウェルに滴下した。トランスフェクションの72時間後、各ウェルの中央に10μLのTrypLEを添加して細胞をトリプシン処理し、約5分間インキュベートする。次に、100μLのD10培地を各ウェルに加え、混合して細胞を再懸濁した。次に細胞を500gで10分間スピンダウンし、上清を廃棄した。QuickExtract緩衝液を、元の細胞懸濁液量の1/5に加えた。細胞を65℃で15分間、68℃で15分間、98℃で10分間インキュベートした。
次世代シーケンシング用の試料は、2ラウンドのPCRによって調製された。第1のラウンド(PCR1)は、標的に応じて特定のゲノム領域を増幅するために使用された。PCR1産物はカラム精製により精製した。PCRラウンド2(PCR2)は、Illuminaのアダプター及びインデックスを付加するために行われた。次に、反応物をプールし、カラム精製によって精製した。シーケンシングの実行は、150サイクルのNextSeq v2.5の中出力又は高出力キットで行われた。
図9は、配列番号1のエフェクターでトランスフェクションした後のHEK293T細胞におけるAAVS1標的遺伝子座のパーセントインデルを示す。バーは2つのバイオ複製物で測定されたインデルの平均パーセントを反映する。配列番号1のエフェクターについて、パーセントインデルは、陰性対照のパーセントインデルよりも高い。
この実施例は、CLUST.143952ファミリーのヌクレアーゼが哺乳動物細胞において活性を有することを示唆している。
他の実施形態
本発明はその詳細な説明を伴い説明されているが、前述の説明は例示であり、添付の特許請求の範囲によって定義される本発明の範囲を限定する意図はないことが理解されるべきである。他の態様、利点、及び変形例が、以下の特許請求の範囲内にある。
本発明はその詳細な説明を伴い説明されているが、前述の説明は例示であり、添付の特許請求の範囲によって定義される本発明の範囲を限定する意図はないことが理解されるべきである。他の態様、利点、及び変形例が、以下の特許請求の範囲内にある。
Claims (89)
- CLUST.143952のエンジニアリングされた天然に存在しないクラスター化して規則的な配置の短い回文配列リピート(CRISPR)-Casシステムであって、
(a)CRISPR関連タンパク質が配列番号1~20のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、CRISPR関連タンパク質又は前記CRISPR関連タンパク質をコードする核酸;及び
(b)ダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイド
を含み、
前記CRISPR関連タンパク質が、前記RNAガイドに結合し、前記スペーサー配列に相補的な前記標的核酸配列を修飾することができる、CRISPR-Casシステム。 - 前記CRISPR関連タンパク質が、少なくとも1つのRuvCドメイン又は少なくとも1つの分割されたRuvCドメインを含む、請求項1に記載のシステム。
- 前記CRISPR関連タンパク質が、以下の配列:
(a)X1X2X3REX4X5X6(配列番号75)[式中、X1はY又はRであり、X2はA又はP又はQ又はVであり、X3はS又はC又はTであり、X4はI又はLであり、X5はF又はM又はY又はLであり、及びX6はN又はAである];
(b)DX1X2W(配列番号76)[式中、X1はS又はR又はG又はTであり、及びX2はT又はS又はKである];
(c)GX1Q(配列番号77)[式中、X1はI又はV又はPである];
(d)YYPX1X2X3X4(配列番号78)[式中、X1はE又はK又はDであり、X2はS又はN又はD又はTであり、X3はL又はI又はFであり、及びX4はK又はF又はNである];
(e)X1X2GX3D(配列番号79)[式中、X1はG又はT又はVであり、X2はV又はI又はLであり、及びX3はI又はC又はM又はVである];
(f)X1X2WX3PX4X5DX6X7(配列番号80)[式中、X1はH又はNであり、X2はN又はE又はD又はGであり、X3はH又はQ又はR又はA又はV又はK又はI又はEであり、X4はA又はS又はV又はPであり、X5はK又はP又はH又はC又はS又はYであり、X6はF又はY又はPであり、及びX7はL又はM又はCである];
(g)X1QX2X3WDX4X5HX6(配列番号81)[式中、X1はE又はRであり、X2はS又はA又はGであり、X3はR又はN又はE又はKであり、X4はR又はK又はL又はMであり、X5はT又はN又はV又はK又はAであり、X6はD又はS又はE又はQである];
(h)X1MEX2X3NLNX4(配列番号82)[式中、X1はA又はV又はSであり、X2はD又はNであり、X3はV又はI又はLであり、及びX4はE又はD又はRである];
(i)TSX1X2CX3X4CX5(配列番号83)[式中、X1はQ又はNであり、X2はL又はI又はTであり、X3はH又はDであり、X4はV又はC又はA又はLであり、及びX5はQ又はR又はN又はGである];
(j)X1NX2RX3X4X5X6FX7CGX8X9X10C(配列番号84)[式中、X1はL又はI又はKであり、X2はF又はY又はLであり、X3はD又はF又はE又はAであり、X4はG又はKであり、X5はR又はEであり、X6はV又はI又はT又はKであり、X7はI又はVであり、X8はN又はCであり、X9はP又はEであり、及びX10はE又はN又はA又はD又はKである];
(k)X1X2ADX3NAAX4X5I(配列番号85)[式中、X1はQ又はVであり、X2はN又はDであり、X3はE又はS又はV又はWであり、X4はF又はH又はS又はY又はMであり、及びX5はN又はV又はCである];及び
(l)X1X2X3DG(配列番号97)[式中、X1はG又はAであり、X2はV又はL又はM又はIであり、及びX3はR又はKである]
のうちの1つ以上を含む、請求項1又は2に記載のシステム。 - 前記ダイレクトリピート配列が、配列番号21~35又は配列番号47~61のいずれか1つに記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項1~3のいずれか一項に記載のシステム。
- 前記ダイレクトリピート配列が、配列番号21~35又は配列番号47~61のいずれか1つに記載のヌクレオチド配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項1~4のいずれか一項に記載のシステム。
- 前記ダイレクトリピート配列が、以下の配列:
(a)X1X2X3TX4X5X6X7AX8GX9[式中、X1はC又はTであり、X2はG又はAであり、X3はG又はTであり、X4はT又はA又はGであり、X5はT又はCであり、X6はA又はT又はGであり、X7はC又はAであり、X8はT又はA又はGであり、及びX9はG又はCである];及び
(b)AX1ACC[式中、X1はT又はCである]
のうちの1つ以上を含む、請求項1~5のいずれか一項に記載の組成物。 - 前記CRISPR関連タンパク質が、配列番号1に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、及び前記ダイレクトリピート配列が、配列番号21に記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項1~6のいずれか一項に記載のシステム。
- 前記CRISPR関連タンパク質が、配列番号1に記載のアミノ酸配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、及び前記ダイレクトリピート配列が、配列番号21に記載のヌクレオチド配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項1~7のいずれか一項に記載のシステム。
- 前記CRISPR関連タンパク質が、プロトスペーサー隣接モチーフ(PAM)配列の認識能を有し、前記PAM配列が、5’-NNG-3’、5’-NG-3’、5’-TTG-3’、5’-KTG-3’、5’-THG-3’、5’-KHG-3’、又は5’-G-3’として記載される核酸配列を含む、請求項1~8のいずれか一項に記載のシステム。
- 前記RNAガイドの前記スペーサー配列が、約15ヌクレオチド~約50ヌクレオチドを含む、請求項1~9のいずれか一項に記載のシステム。
- 前記RNAガイドの前記スペーサー配列が、20~35ヌクレオチドを含む、請求項1~10のいずれか一項に記載のシステム。
- 前記CRISPR関連タンパク質が、触媒残基(例えば、アスパラギン酸又はグルタミン酸)を含む、請求項1~11のいずれか一項に記載のシステム。
- 前記CRISPR関連タンパク質が、前記標的核酸を切断する、請求項1~12のいずれか一項に記載のシステム。
- 前記CRISPR関連タンパク質が、ペプチドタグ、蛍光タンパク質、塩基編集ドメイン、DNAメチル化ドメイン、ヒストン残基修飾ドメイン、局在化因子、転写修飾因子、光ゲート制御因子、化学誘導性因子、又はクロマチン可視化因子を更に含む、請求項1~13のいずれか一項に記載のシステム。
- 前記CRISPR関連タンパク質をコードする前記核酸が、細胞での発現にコドン最適化される、請求項1~14のいずれか一項に記載のシステム。
- 前記CRISPR関連タンパク質をコードする前記核酸が、プロモーターに作動可能に連結されている、請求項1~15のいずれか一項に記載のシステム。
- 前記CRISPR関連タンパク質をコードする前記核酸が、ベクター内にある、請求項1~16のいずれか一項に記載のシステム。
- 前記ベクターが、レトロウイルスベクター、レンチウイルスベクター、ファージベクター、アデノウイルスベクター、アデノ随伴ベクター、又は単純ヘルペスベクターを含む、請求項17に記載のシステム。
- 前記標的核酸がDNA分子である、請求項1~18のいずれか一項に記載のシステム。
- 前記標的核酸が、PAM配列を含む、請求項1~19のいずれか一項に記載のシステム。
- 前記CRISPR関連タンパク質が、非特異的ヌクレアーゼ活性を含む、請求項1~20のいずれか一項に記載のシステム。
- 前記CRISPR関連タンパク質及びRNAガイドによる前記標的核酸のターゲティングにより、前記標的核酸の修飾が生じる、請求項1~21のいずれか一項に記載のシステム。
- 前記標的核酸の前記修飾が、二本鎖切断イベントである、請求項22に記載のシステム。
- 前記標的核酸の前記修飾が、一本鎖切断イベントである、請求項22に記載のシステム。
- 前記標的核酸の前記修飾により、挿入イベントが生じる、請求項1~24のいずれか一項に記載のシステム。
- 前記標的核酸の前記修飾により、欠失イベントが生じる、請求項1~25のいずれか一項に記載のシステム。
- 前記標的核酸の前記修飾により細胞毒性又は細胞死が生じる、請求項1~26のいずれか一項に記載のシステム。
- ドナー鋳型核酸を更に含む、請求項1~27のいずれか一項に記載のシステム。
- 前記ドナー鋳型核酸がDNA分子である、請求項28に記載のシステム。
- 前記ドナー鋳型核酸がRNA分子である、請求項28に記載のシステム。
- 前記RNAガイドが任意選択でtracrRNAを含む、請求項1~30のいずれか一項に記載のシステム。
- 前記システムがtracrRNAを含まない、請求項1~31のいずれか一項に記載のシステム。
- 前記CRISPR関連タンパク質が自己プロセシングである、請求項1~32のいずれか一項に記載のシステム。
- 前記システムが、ナノ粒子、リポソーム、エキソソーム、微小胞、又は遺伝子銃を含む送達組成物中に存在する、請求項1~33のいずれか一項に記載のシステム。
- 細胞内にある、請求項1~34のいずれか一項に記載のシステム。
- 前記細胞が真核細胞、例えば、哺乳動物細胞、例えば、ヒト細胞である、請求項35に記載のシステム。
- 前記細胞が原核細胞である、請求項35に記載のシステム。
- (a)CRISPR関連タンパク質が配列番号1~20のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、CRISPR関連タンパク質又は前記CRISPR関連タンパク質をコードする核酸;及び
(b)ダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイド
を含む、細胞。 - 前記CRISPR関連タンパク質が、以下の配列:
(a)X1X2X3REX4X5X6(配列番号75)[式中、X1はY又はRであり、X2はA又はP又はQ又はVであり、X3はS又はC又はTであり、X4はI又はLであり、X5はF又はM又はY又はLであり、及びX6はN又はAである];
(b)DX1X2W(配列番号76)[式中、X1はS又はR又はG又はTであり、及びX2はT又はS又はKである];
(c)GX1Q(配列番号77)[式中、X1はI又はV又はPである];
(d)YYPX1X2X3X4(配列番号78)[式中、X1はE又はK又はDであり、X2はS又はN又はD又はTであり、X3はL又はI又はFであり、及びX4はK又はF又はNである];
(e)X1X2GX3D(配列番号79)[式中、X1はG又はT又はVであり、X2はV又はI又はLであり、及びX3はI又はC又はM又はVである];
(f)X1X2WX3PX4X5DX6X7(配列番号80)[式中、X1はH又はNであり、X2はN又はE又はD又はGであり、X3はH又はQ又はR又はA又はV又はK又はI又はEであり、X4はA又はS又はV又はPであり、X5はK又はP又はH又はC又はS又はYであり、X6はF又はY又はPであり、及びX7はL又はM又はCである];
(g)X1QX2X3WDX4X5HX6(配列番号81)[式中、X1はE又はRであり、X2はS又はA又はGであり、X3はR又はN又はE又はKであり、X4はR又はK又はL又はMであり、X5はT又はN又はV又はK又はAであり、X6はD又はS又はE又はQである];
(h)X1MEX2X3NLNX4(配列番号82)[式中、X1はA又はV又はSであり、X2はD又はNであり、X3はV又はI又はLであり、及びX4はE又はD又はRである];
(i)TSX1X2CX3X4CX5(配列番号83)[式中、X1はQ又はNであり、X2はL又はI又はTであり、X3はH又はDであり、X4はV又はC又はA又はLであり、及びX5はQ又はR又はN又はGである];
(j)X1NX2RX3X4X5X6FX7CGX8X9X10C(配列番号84)[式中、X1はL又はI又はKであり、X2はF又はY又はLであり、X3はD又はF又はE又はAであり、X4はG又はKであり、X5はR又はEであり、X6はV又はI又はT又はKであり、X7はI又はVであり、X8はN又はCであり、X9はP又はEであり、及びX10はE又はN又はA又はD又はKである];
(k)X1X2ADX3NAAX4X5I(配列番号85)[式中、X1はQ又はVであり、X2はN又はDであり、X3はE又はS又はV又はWであり、X4はF又はH又はS又はY又はMであり、及びX5はN又はV又はCである];及び
(l)X1X2X3DG(配列番号97)[式中、X1はG又はAであり、X2はV又はL又はM又はIであり、及びX3はR又はKである]
のうちの1つ以上を含む、請求項38に記載の細胞。 - 前記CRISPR関連タンパク質が、配列番号1に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質である、請求項38又は39に記載の細胞。
- 前記CRISPR関連タンパク質が、5’-NNG-3’、5’-NG-3’、5’-TTG-3’、5’-KTG-3’、5’-THG-3’、5’-KHG-3’、又は5’-G-3’として記載される核酸配列を含むPAM配列の認識能を有する、請求項38~40のいずれか一項に記載の細胞。
- 前記ダイレクトリピート配列が、配列番号21~35又は配列番号47~61のいずれか1つに記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項38~41のいずれか一項に記載の細胞。
- 前記ダイレクトリピート配列が、配列番号21~35又は配列番号47~61のいずれか1つに記載のヌクレオチド配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項38~42のいずれか一項に記載の細胞。
- 前記ダイレクトリピート配列が、以下の配列:
(a)X1X2X3TX4X5X6X7AX8GX9[式中、X1はC又はTであり、X2はG又はAであり、X3はG又はTであり、X4はT又はA又はGであり、X5はT又はCであり、X6はA又はT又はGであり、X7はC又はAであり、X8はT又はA又はGであり、及びX9はG又はCである];及び
(b)AX1ACC[式中、X1はT又はCである]
のうちの1つ以上を含む、請求項38~43のいずれか一項に記載の細胞。 - 前記ダイレクトリピートが、配列番号21に記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項38~44のいずれか一項に記載の細胞。
- 前記ダイレクトリピートが、配列番号21に記載のヌクレオチド配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項38~45のいずれか一項に記載の細胞。
- 前記スペーサー配列が約15ヌクレオチド~約50ヌクレオチドを含む、請求項38~46のいずれか一項に記載の細胞。
- 前記スペーサー配列が20~35ヌクレオチドを含む、請求項38~47のいずれか一項に記載の細胞。
- 前記細胞がtracrRNAを更に含む、請求項38~48のいずれか一項に記載の細胞。
- 前記細胞がtracrRNAを含まない、請求項38~49のいずれか一項に記載の細胞。
- 前記細胞が真核細胞、例えば、哺乳動物細胞、例えば、ヒト細胞である、請求項38~50のいずれか一項に記載の細胞。
- 前記細胞が原核細胞である、請求項38~51のいずれか一項に記載の細胞。
- 請求項1~37のいずれか一項に記載のシステムを、細胞内の標的核酸に結合させる方法であって、
(a)前記システムを提供すること;及び
(b)前記システムを前記細胞に送達すること
を含み、前記細胞が前記標的核酸を含み、前記CRISPR関連タンパク質が前記RNAガイドに結合し、前記スペーサー配列が前記標的核酸に結合する、方法。 - 前記細胞が真核細胞、例えば、哺乳動物細胞、例えば、ヒト細胞である、請求項53に記載の方法。
- 標的核酸を修飾する方法であって、
(a)CRISPR関連タンパク質が配列番号1~20のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、CRISPR関連タンパク質又は前記CRISPR関連タンパク質をコードする核酸;及び
(b)ダイレクトリピート配列と前記標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイド;
を含み、
前記CRISPR関連タンパク質がRNAガイドへの結合能を有し、
前記CRISPR関連タンパク質及びRNAガイドによる前記標的核酸の認識により、前記標的核酸の修飾が生じる、
エンジニアリングされた天然に存在しないCRISPR-Casシステムを、標的核酸に送達することを含む方法。 - 前記CRISPR関連タンパク質が、以下の配列:
(a)X1X2X3REX4X5X6(配列番号75)[式中、X1はY又はRであり、X2はA又はP又はQ又はVであり、X3はS又はC又はTであり、X4はI又はLであり、X5はF又はM又はY又はLであり、及びX6はN又はAである];
(b)DX1X2W(配列番号76)[式中、X1はS又はR又はG又はTであり、及びX2はT又はS又はKである];
(c)GX1Q(配列番号77)[式中、X1はI又はV又はPである];
(d)YYPX1X2X3X4(配列番号78)[式中、X1はE又はK又はDであり、X2はS又はN又はD又はTであり、X3はL又はI又はFであり、及びX4はK又はF又はNである];
(e)X1X2GX3D(配列番号79)[式中、X1はG又はT又はVであり、X2はV又はI又はLであり、及びX3はI又はC又はM又はVである];
(f)X1X2WX3PX4X5DX6X7(配列番号80)[式中、X1はH又はNであり、X2はN又はE又はD又はGであり、X3はH又はQ又はR又はA又はV又はK又はI又はEであり、X4はA又はS又はV又はPであり、X5はK又はP又はH又はC又はS又はYであり、X6はF又はY又はPであり、及びX7はL又はM又はCである];
(g)X1QX2X3WDX4X5HX6(配列番号81)[式中、X1はE又はRであり、X2はS又はA又はGであり、X3はR又はN又はE又はKであり、X4はR又はK又はL又はMであり、X5はT又はN又はV又はK又はAであり、X6はD又はS又はE又はQである];
(h)X1MEX2X3NLNX4(配列番号82)[式中、X1はA又はV又はSであり、X2はD又はNであり、X3はV又はI又はLであり、及びX4はE又はD又はRである];
(i)TSX1X2CX3X4CX5(配列番号83)[式中、X1はQ又はNであり、X2はL又はI又はTであり、X3はH又はDであり、X4はV又はC又はA又はLであり、及びX5はQ又はR又はN又はGである];
(j)X1NX2RX3X4X5X6FX7CGX8X9X10C(配列番号84)[式中、X1はL又はI又はKであり、X2はF又はY又はLであり、X3はD又はF又はE又はAであり、X4はG又はKであり、X5はR又はEであり、X6はV又はI又はT又はKであり、X7はI又はVであり、X8はN又はCであり、X9はP又はEであり、及びX10はE又はN又はA又はD又はKである];
(k)X1X2ADX3NAAX4X5I(配列番号85)[式中、X1はQ又はVであり、X2はN又はDであり、X3はE又はS又はV又はWであり、X4はF又はH又はS又はY又はMであり、及びX5はN又はV又はCである];及び
(l)X1X2X3DG(配列番号97)[式中、X1はG又はAであり、X2はV又はL又はM又はIであり、及びX3はR又はKである]
のうちの1つ以上を含む、請求項55に記載の方法。 - 前記CRISPR関連タンパク質が、配列番号1に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質である、請求項55又は56に記載の方法。
- 前記CRISPR関連タンパク質が、5’-NNG-3’、5’-NG-3’、5’-TTG-3’、5’-KTG-3’、5’-THG-3’、5’-KHG-3’、又は5’-G-3’として記載される核酸配列を含むPAM配列の認識能を有する、請求項55~57のいずれか一項に記載の方法。
- 前記ダイレクトリピート配列が、配列番号21~35又は配列番号47~61のいずれか1つに記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項55~58のいずれか一項に記載の方法。
- 前記ダイレクトリピート配列が、配列番号21~35又は配列番号47~61のいずれか1つに記載のヌクレオチド配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項55~59のいずれか一項に記載の方法。
- 前記ダイレクトリピート配列が、以下の配列:
(a)X1X2X3TX4X5X6X7AX8GX9[式中、X1はC又はTであり、X2はG又はAであり、X3はG又はTであり、X4はT又はA又はGであり、X5はT又はCであり、X6はA又はT又はGであり、X7はC又はAであり、X8はT又はA又はGであり、及びX9はG又はCである];及び
(b)AX1ACC[式中、X1はT又はCである]
のうちの1つ以上を含む、請求項55~60のいずれか一項に記載の方法。 - 前記ダイレクトリピートが、配列番号21に記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項55~61のいずれか一項に記載の方法。
- 前記ダイレクトリピートが、配列番号21に記載のヌクレオチド配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項55~62のいずれか一項に記載の方法。
- 前記スペーサー配列が、約15ヌクレオチド~約50ヌクレオチドを含む、請求項55~63のいずれか一項に記載の方法。
- 前記スペーサー配列が、20~35ヌクレオチドを含む、請求項55~64のいずれか一項に記載の方法。
- 前記システムがtracrRNAを更に含む、請求項55~65のいずれか一項に記載の方法。
- 前記標的核酸がDNA分子である、請求項55~66のいずれか一項に記載の方法。
- 前記標的核酸がPAM配列を含む、請求項55~67のいずれか一項に記載の方法。
- 前記CRISPR関連タンパク質が、非特異的ヌクレアーゼ活性を含む、請求項55~68のいずれか一項に記載の方法。
- 前記標的核酸の前記修飾が、二本鎖切断イベントである、請求項55~69のいずれか一項に記載の方法。
- 前記標的核酸の前記修飾が、一本鎖切断イベントである、請求項55~70のいずれか一項に記載の方法。
- 前記標的核酸の前記修飾により、挿入イベントが生じる、請求項55~71のいずれか一項に記載の方法。
- 前記標的核酸の前記修飾により、欠失イベントが生じる、請求項55~72のいずれか一項に記載の方法。
- 前記標的核酸の修飾により、細胞毒性又は細胞死が生じる、請求項55~73のいずれか一項に記載の方法。
- 標的核酸の編集方法であって、請求項1~37のいずれか一項に記載のシステムを前記標的核酸に接触させることを含む、方法。
- 標的核酸の発現を改変する方法であって、請求項1~37のいずれか一項に記載のシステムを前記標的核酸に接触させることを含む、方法。
- 標的核酸のある部位におけるペイロード核酸の挿入を標的化する方法であって、請求項1~37のいずれか一項に記載のシステムを前記標的核酸に接触させることを含む方法。
- 標的核酸のある部位からのペイロード核酸の切出しを標的化する方法であって、請求項1~37のいずれか一項に記載のシステムを前記標的核酸に接触させることを含む方法。
- DNA標的核酸の認識時に一本鎖DNAを非特異的に分解する方法であって、請求項1~37のいずれか一項に記載のシステムを前記標的核酸に接触させることを含む方法。
- 試料中の標的核酸の検出方法であって、
(a)請求項1~37のいずれか一項に記載のシステム及び標識されたレポーター核酸を前記試料に接触させることであって、前記スペーサー配列が前記標的核酸にハイブリダイズすると、前記標識されたレポーター核酸の切断が起こること;及び
(b)前記標識されたレポーター核酸の切断によって生成される検出可能シグナルを測定することであって、それにより前記試料中における前記標的核酸の存在を検出すること
を含む方法。 - インビトロ又はエキソビボでの
(a)標的核酸を標的化し及び編集する方法;
(b)前記核酸の認識時に一本鎖核酸を非特異的に分解する方法;
(c)二本鎖標的のスペーサー相補鎖の認識時に前記二本鎖標的の非スペーサー相補鎖を標的化し及びニッキングする方法;
(d)二本鎖標的核酸を標的化し及び切断する方法;
(e)試料中における標的核酸を検出する方法;
(f)二本鎖核酸を特異的に編集する方法;
(g)二本鎖核酸を塩基編集する方法;
(h)細胞において遺伝子型特異的又は転写状態特異的細胞死又は休眠を誘導する方法;
(i)二本鎖核酸標的にインデルを作成する方法;
(j)二本鎖核酸標的に配列を挿入する方法;又は
(k)二本鎖核酸標的において配列を欠失させるか、又は反転させる方法
における、請求項1~37のいずれか一項に記載のシステムの使用。 - 哺乳類細胞の標的核酸に挿入又は欠失を導入する方法であって、
(a)CRISPR関連タンパク質をコードする核酸配列であって、前記CRISPR関連タンパク質が、配列番号1~20のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、核酸配列;及び
(b)ダイレクトリピート配列と前記標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイド(又は前記RNAガイドをコードする核酸)
のトランスフェクションを含み;
前記CRISPR関連タンパク質が前記RNAガイドへの結合能を有し;及び
前記CRISPR関連タンパク質及びRNAガイドによる前記標的核酸の認識により、前記標的核酸の修飾が生じる、方法。 - 前記CRISPR関連タンパク質が、配列番号1に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、請求項82に記載の方法。
- 前記CRISPR関連タンパク質が、配列番号1に記載のアミノ酸配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、請求項82又は83に記載の方法。
- 前記ダイレクトリピートが、配列番号21に記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項82~84のいずれか一項に記載の方法。
- 前記ダイレクトリピートが、配列番号21に記載のヌクレオチド配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項82~85のいずれか一項に記載の方法。
- 前記トランスフェクションが一過性トランスフェクションである、請求項82~86のいずれか一項に記載の方法。
- 前記細胞がヒト細胞である、請求項82~87のいずれか一項に記載の方法。
- (a)CRISPR関連タンパク質又は前記CRISPR関連タンパク質をコードする核酸;及び
(b)ダイレクトリピート配列とスペーサー配列とを含むRNAガイド
を含む組成物であって、
前記CRISPR関連タンパク質が、以下のアミノ酸配列:
(i)X1X2X3REX4X5X6(配列番号75)[式中、X1はY又はRであり、X2はA又はP又はQ又はVであり、X3はS又はC又はTであり、X4はI又はLであり、X5はF又はM又はY又はLであり、及びX6はN又はAである];
(ii)DX1X2W(配列番号76)[式中、X1はS又はR又はG又はTであり、及びX2はT又はS又はKである];
(iii)GX1Q(配列番号77)[式中、X1はI又はV又はPである];
(iv)YYPX1X2X3X4(配列番号78)[式中、X1はE又はK又はDであり、X2はS又はN又はD又はTであり、X3はL又はI又はFであり、及びX4はK又はF又はNである];
(v)X1X2GX3D(配列番号79)[式中、X1はG又はT又はVであり、X2はV又はI又はLであり、及びX3はI又はC又はM又はVである];
(vi)X1X2WX3PX4X5DX6X7(配列番号80)[式中、X1はH又はNであり、X2はN又はE又はD又はGであり、X3はH又はQ又はR又はA又はV又はK又はI又はEであり、X4はA又はS又はV又はPであり、X5はK又はP又はH又はC又はS又はYであり、X6はF又はY又はPであり、及びX7はL又はM又はCである];
(vii)X1QX2X3WDX4X5HX6(配列番号81)[式中、X1はE又はRであり、X2はS又はA又はGであり、X3はR又はN又はE又はKであり、X4はR又はK又はL又はMであり、X5はT又はN又はV又はK又はAであり、X6はD又はS又はE又はQである];
(viii)X1MEX2X3NLNX4(配列番号82)[式中、X1はA又はV又はSであり、X2はD又はNであり、X3はV又はI又はLであり、及びX4はE又はD又はRである];
(ix)TSX1X2CX3X4CX5(配列番号83)[式中、X1はQ又はNであり、X2はL又はI又はTであり、X3はH又はDであり、X4はV又はC又はA又はLであり、及びX5はQ又はR又はN又はGである];
(x)X1NX2RX3X4X5X6FX7CGX8X9X10C(配列番号84)[式中、X1はL又はI又はKであり、X2はF又はY又はLであり、X3はD又はF又はE又はAであり、X4はG又はKであり、X5はR又はEであり、X6はV又はI又はT又はKであり、X7はI又はVであり、X8はN又はCであり、X9はP又はEであり、及びX10はE又はN又はA又はD又はKである];
(xi)X1X2ADX3NAAX4X5I(配列番号85)[式中、X1はQ又はVであり、X2はN又はDであり、X3はE又はS又はV又はWであり、X4はF又はH又はS又はY又はMであり、及びX5はN又はV又はCである];及び
(xii)X1X2X3DG(配列番号97)[式中、X1はG又はAであり、X2はV又はL又はM又はIであり、及びX3はR又はKである]
のうちの1つ以上を含み;
前記CRISPR関連タンパク質が前記RNAガイドに結合し、及び前記スペーサーが標的核酸に結合する、組成物。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962896308P | 2019-09-05 | 2019-09-05 | |
US62/896,308 | 2019-09-05 | ||
PCT/US2020/049534 WO2021046442A1 (en) | 2019-09-05 | 2020-09-04 | Novel crispr dna targeting enzymes and systems |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022546594A true JP2022546594A (ja) | 2022-11-04 |
JPWO2021046442A5 JPWO2021046442A5 (ja) | 2023-09-11 |
Family
ID=74852250
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022514704A Pending JP2022546594A (ja) | 2019-09-05 | 2020-09-04 | 新規crispr dnaターゲティング酵素及びシステム |
Country Status (7)
Country | Link |
---|---|
US (1) | US20220282283A1 (ja) |
EP (1) | EP4025588A4 (ja) |
JP (1) | JP2022546594A (ja) |
CN (1) | CN114341166A (ja) |
AU (1) | AU2020341711A1 (ja) |
CA (1) | CA3153005A1 (ja) |
WO (1) | WO2021046442A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA3222023A1 (en) | 2021-06-01 | 2022-12-08 | Arbor Biotechnologies, Inc. | Gene editing systems comprising a crispr nuclease and uses thereof |
US20230244412A1 (en) * | 2022-01-28 | 2023-08-03 | Western Digital Technologies, Inc. | Encoding and integrity markers for molecular storage applications |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016205759A1 (en) * | 2015-06-18 | 2016-12-22 | The Broad Institute Inc. | Engineering and optimization of systems, methods, enzymes and guide scaffolds of cas9 orthologs and variants for sequence manipulation |
US9790490B2 (en) * | 2015-06-18 | 2017-10-17 | The Broad Institute Inc. | CRISPR enzymes and systems |
CA3012631A1 (en) * | 2015-06-18 | 2016-12-22 | The Broad Institute Inc. | Novel crispr enzymes and systems |
US20170211142A1 (en) * | 2015-10-22 | 2017-07-27 | The Broad Institute, Inc. | Novel crispr enzymes and systems |
EP3365357B1 (en) * | 2015-10-23 | 2024-02-14 | President and Fellows of Harvard College | Evolved cas9 proteins for gene editing |
WO2017184789A1 (en) * | 2016-04-19 | 2017-10-26 | Keto Patent Group, Inc. | Administration of berberine metabolites |
US11352647B2 (en) * | 2016-08-17 | 2022-06-07 | The Broad Institute, Inc. | Crispr enzymes and systems |
US10392616B2 (en) * | 2017-06-30 | 2019-08-27 | Arbor Biotechnologies, Inc. | CRISPR RNA targeting enzymes and systems and uses thereof |
JP2022538789A (ja) * | 2019-06-14 | 2022-09-06 | アーバー バイオテクノロジーズ, インコーポレイテッド | 新規crispr dnaターゲティング酵素及びシステム |
-
2020
- 2020-09-04 CN CN202080062332.6A patent/CN114341166A/zh active Pending
- 2020-09-04 JP JP2022514704A patent/JP2022546594A/ja active Pending
- 2020-09-04 EP EP20860548.5A patent/EP4025588A4/en active Pending
- 2020-09-04 AU AU2020341711A patent/AU2020341711A1/en active Pending
- 2020-09-04 CA CA3153005A patent/CA3153005A1/en active Pending
- 2020-09-04 US US17/634,461 patent/US20220282283A1/en active Pending
- 2020-09-04 WO PCT/US2020/049534 patent/WO2021046442A1/en unknown
Also Published As
Publication number | Publication date |
---|---|
CN114341166A (zh) | 2022-04-12 |
WO2021046442A1 (en) | 2021-03-11 |
US20220282283A1 (en) | 2022-09-08 |
CA3153005A1 (en) | 2021-03-11 |
EP4025588A4 (en) | 2023-09-06 |
AU2020341711A1 (en) | 2022-03-03 |
EP4025588A1 (en) | 2022-07-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7457653B2 (ja) | 新規crispr dnaターゲティング酵素及びシステム | |
EP3765616B1 (en) | Novel crispr dna and rna targeting enzymes and systems | |
US11667904B2 (en) | CRISPR-associated systems and components | |
JP2022547524A (ja) | 新規crispr dnaターゲティング酵素及びシステム | |
JP2022540153A (ja) | 新規crispr dnaターゲティング酵素及びシステム | |
JP2022538789A (ja) | 新規crispr dnaターゲティング酵素及びシステム | |
CA3093580A1 (en) | Novel crispr dna and rna targeting enzymes and systems | |
JP2022546594A (ja) | 新規crispr dnaターゲティング酵素及びシステム | |
JP2022546701A (ja) | 新規crispr dnaターゲティング酵素及びシステム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230901 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230901 |