JP2022547524A - 新規crispr dnaターゲティング酵素及びシステム - Google Patents
新規crispr dnaターゲティング酵素及びシステム Download PDFInfo
- Publication number
- JP2022547524A JP2022547524A JP2022515511A JP2022515511A JP2022547524A JP 2022547524 A JP2022547524 A JP 2022547524A JP 2022515511 A JP2022515511 A JP 2022515511A JP 2022515511 A JP2022515511 A JP 2022515511A JP 2022547524 A JP2022547524 A JP 2022547524A
- Authority
- JP
- Japan
- Prior art keywords
- seq
- crispr
- sequence
- nucleic acid
- related protein
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/20—Bacteria; Culture media therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/111—General methods applicable to biologically active non-coding nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/06—Animal cells or tissues; Human cells or tissues
- C12N5/0602—Vertebrate cells
- C12N5/0684—Cells of the urinary tract or kidneys
- C12N5/0687—Renal stem cells; Renal progenitors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6816—Hybridisation assays characterised by the detection means
- C12Q1/6823—Release of bound markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/10—Plasmid DNA
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/80—Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Medicinal Chemistry (AREA)
- Cell Biology (AREA)
- Mycology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Urology & Nephrology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Immunology (AREA)
- Analytical Chemistry (AREA)
- Virology (AREA)
- Tropical Medicine & Parasitology (AREA)
- Peptides Or Proteins (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Enzymes And Modification Thereof (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本開示は、標的化した形で核酸を操作するための新規システム、方法、及び組成物について記載する。本開示は、核酸を標的化して修飾するための、天然に存在しないエンジニアリングされたCRISPRシステム、成分、及び方法について記載する。各システムが、一体となって核酸を標的化する1つ以上のタンパク質成分と1つ以上の核酸成分とを含む。
Description
関連出願
本願は、2019年9月9日に出願された米国仮特許出願第62/897,859号の優先権の利益を主張し、その全内容は、本明細書によって参照により援用される。
本願は、2019年9月9日に出願された米国仮特許出願第62/897,859号の優先権の利益を主張し、その全内容は、本明細書によって参照により援用される。
配列表
本出願は、ASCII形式で電子的に提出され、全体として参照により本明細書で援用される配列表を含む。2020年9月9日に作成された前記ASCIIコピーは、A2186-7028WO_SL.txtというファイル名で、サイズは475,511バイトである。
本出願は、ASCII形式で電子的に提出され、全体として参照により本明細書で援用される配列表を含む。2020年9月9日に作成された前記ASCIIコピーは、A2186-7028WO_SL.txtというファイル名で、サイズは475,511バイトである。
本開示は、新規の、クラスター化して規則的な配置の短い回文配列リピート(Clustered Regularly Interspaced Short Palindromic Repeats:CRISPR)及びCRISPR関連(Cas)遺伝子を使用する遺伝子発現のゲノム編集及び調節のためのシステム及び方法に関する。
近年、ゲノムシーケンシング技術及び解析の進歩により、原核生物の生合成経路からヒト病理に及ぶまでの多種多様な自然領域における生物学的活性の遺伝的基礎に関して重要な洞察が得られている。得られた大量の情報を完全に理解し、評価するためには、対応したゲノム及びエピゲノム操作のシーケンス技術の規模、有効性、及び容易さの向上が必要となる。このような新規技術は、バイオテクノロジー、農業、及びヒト治療薬を含めた数多くの領域における新規適用の開発を加速させることになる。
クラスター化して規則的な配置の短い回文配列リピート(CRISPR)及びCRISPR関連(Cas)遺伝子は、まとめてCRISPR-Cas又はCRISPR/Casシステムとして知られ、外来の遺伝的エレメントから特定の種を防御する古細菌及び細菌の適応免疫系である。CRISPR-Casシステムは極めて多様な一群のタンパク質エフェクター、非コードエレメント、並びに遺伝子座構成を含み、その幾つかの例がエンジニアリングされ、適合されることにより、重要なバイオテクノロジーの進歩が生み出されている。
宿主防御に関与するこのシステムの成分には、核酸を修飾する能力を有する1つ以上のエフェクタータンパク質と、エフェクタータンパク質をファージ核酸上の特異的配列に標的化することを担うRNAガイドエレメントとが含まれる。RNAガイドはCRISPR RNA(crRNA)で構成され、1つ又は複数のエフェクタータンパク質による標的核酸の操作を実現するために追加的なトランス活性化型RNA(tracrRNA)を必要とすることもある。crRNAは、crRNAへのタンパク質結合を担うダイレクトリピートと、所望の核酸標的配列に相補的なスペーサー配列とからなる。CRISPRシステムは、crRNAのスペーサー配列を修飾することにより、別のDNA又はRNA標的を標的化するよう再プログラム化し得る。
CRISPR-Casシステムは、大きく2つのクラスに分けることができる:クラス1システムは、一緒になってcrRNAの周りに複合体を形成する複数のエフェクタータンパク質で構成され、クラス2システムは、RNAガイドと複合体化して核酸基質を標的化する単一のエフェクタータンパク質からなる。クラス2システムのシングルサブユニットのエフェクター組成は、エンジニアリング及び適用移行に一層簡便な成分セットを提供し、従ってこれまでプログラム可能なエフェクターの重要な供給源となっている。それにも関わらず、核酸及びポリヌクレオチド(即ち、DNA、RNA、又は任意のハイブリッド、誘導体、又は修飾体)を修飾するための、その独自の特性によって新規適用を実現する、より小さなエフェクター及び/又はユニークなPAM配列要件を有するエフェクターなどの現在のCRISPR-Casシステムを越える更なるプログラム可能なエフェクター及びシステムが依然として必要とされている。
この開示は、最初にゲノムデータベースから計算により同定され、その後、エンジニアリングされ、実験的に検証された、新規の単一エフェクタークラス2 CRISPR-Casシステムのための非天然のエンジニアリングされたシステム及び組成物を提供する。特に、これらのCRISPR-Casシステムの成分の同定により、非天然環境、例えば、システムが最初に発見されたもの以外の細菌、又は哺乳動物細胞などの真核細胞における使用が可能になる。これらの新規エフェクターは、既存のクラス2 CRISPRエフェクターのオルソログ及びホモログと比較して配列及び機能が異なる。
一態様において、本開示は、配列番号1~56のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含むCRISPR関連タンパク質;及びダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイドを含む、CLUST.091979のエンジニアリングされた天然に存在しないクラスター化して規則的な配置の短い回文配列リピート(CRISPR)-Casシステムを提供し、ここで、CRISPR関連タンパク質は、RNAガイドに結合し、スペーサー配列に相補的な標的核酸配列を修飾することができる。一態様において、本開示は、CRISPR関連タンパク質が配列番号1~56のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、CRISPR関連タンパク質又はCRISPR関連タンパク質をコードする核酸;及びダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイド、又はRNAガイドをコードする核酸を含む、CLUST.091979のエンジニアリングされた天然に存在しないクラスター化して規則的な配置の短い回文配列リピート(CRISPR)-Casシステムを提供し、ここで、CRISPR関連タンパク質は、RNAガイドに結合し、スペーサー配列に相補的な標的核酸配列を修飾することができる。
一部の態様において、本開示は、CRISPR関連タンパク質が配列番号241のアミノ酸配列を含む、CRISPR関連タンパク質又はCRISPR関連タンパク質をコードする核酸;及びダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とをRNAガイドを含む、CLUST.091979の、エンジニアリングされた天然に存在しない、クラスター化して規則的な配置の短い回文配列リピート(CRISPR)-Casシステムを提供し、ここで、CRISPR関連タンパク質は、RNAガイドに結合し、スペーサー配列に相補的な標的核酸配列を修飾することができる。一部の実施形態において、CRISPR関連タンパク質は、配列番号4、配列番号10、配列番号12、又は配列番号14に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む。
本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質は、少なくとも1つ(例えば、1つ、2つ、又は3つ)のRuvCドメイン又は少なくとも1つの分割されたRuvCドメインを含む。
本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質は、以下の配列の1つ以上:(a)PX1X2X3X4F(配列番号216)(ここで、X1はL又はM又はI又はC又はFであり、X2はY又はW又はFであり、X3はK又はT又はC又はR又はW又はY又はH又はVであり、X4はI又はL又はMである);(b)RX1X2X3L(配列番号217)(ここで、X1はI又はL又はM又はY又はT又はFであり、X2はR又はQ又はK又はE又はS又はTであり、X3はL又はI又はT又はC又はM又はKである);(c)NX1YX2(配列番号218)(ここで、X1はI又はL又はFであり、X2はK又はR又はV又はEである);(d)KX1X2X3FAX4X5KD(配列番号219)(ここで、X1はT又はI又はN又はA又はS又はF又はVであり、X2はI又はV又はL又はSであり、X3はH又はS又はG又はRであり、X4はD又はS又はEであり、X5はI又はV又はM又はT又はNである);(e)LX1NX2(配列番号220)(ここで、X1はG又はS又はC又はTであり、X2はN又はY又はK又はSである);(f)PX1X2X3X4SQX5DS(配列番号221)(ここで、X1はS又はP又はAであり、X2はY又はS又はA又はP又はE又はY又はQ又はNであり、X3はF又はY又はHであり、X4はT又はSであり、X5はM又はT又はIである);(g)KX1X2VRX3X4QEX5H(配列番号222)(ここで、X1はN又はK又はW又はR又はE又はT又はYであり、X2はM又はR又はL又はS又はK又はV又はE又はT又はI又はDであり、X3はL又はR又はH又はP又はT又はK又はPのQ又はS又はAであり、X4はG又はQ又はN又はR又はK又はE又はI又はT又はS又はCであり、X5はR又はW又はY又はK又はT又はF又はS又はQである);及び(h)X1NGX2X3X4DX5NX6X7X8N(配列番号223)(ここで、X1はI又はK又はV又はLであり、X2はL又はMであり、X3はN又はH又はPであり、X4はA又はS又はCであり、X5はV又はY又はI又はF又はT又はNであり、X6はA又はSであり、X7はS又はA又はPであり、X8はM又はC又はL又はR又はN又はS又はK又はLである)を含む。本明細書に記載されるシステムのいずれかの一部の実施形態において、配列番号216の配列はN末端配列である。本明細書に記載されるシステムのいずれかの一部の実施形態において、配列番号219の配列はC末端配列である。本明細書に記載されるシステムのいずれかの一部の実施形態において、配列番号220の配列はC末端配列である。本明細書に記載されるシステムのいずれかの一部の実施形態において、配列番号221の配列はC末端配列である。本明細書に記載されるシステムのいずれかの一部の実施形態において、配列番号222の配列はC末端配列である。本明細書に記載されるシステムのいずれかの一部の実施形態において、配列番号223の配列はC末端配列である。
本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質は、以下の配列の1つ以上:(a)ECPITKDVINEYK(配列番号290);(b)NLTSITIG(配列番号231);(c)NYRTKIRTLN(配列番号232);(d)ISYIENVEN(配列番号233);(e)ELLSVEQLK(配列番号234);(f)HINSMTINIQDFKIE(配列番号235);(g)KENSLGFIL(配列番号236);(h)GNRQIKKG(配列番号237);(i)DVNFKHA(配列番号238);(j)GYINLYKYLLEH(配列番号239);(k)KEQVLSKLLY(配列番号240);(l)EYIYVSCVNKLRAKYVSYFILKEKYYEKQKEYDIEMGF(配列番号241);(m)DDSTESKESMDKRR(配列番号242);(n)NVQQDINGCLKNIINY(配列番号243);(o)ALENLENSNFEK(配列番号244);(p)QVLPTIKSLL(配列番号245);(q)YHKLENQN(配列番号246);(r)ASDKVKEYIE(配列番号247);(s)TNENNEIVDAKYT(配列番号248);(t)ANFFNLMMKSLHFAS(配列番号249);(u)LLSNNGKTQIALVPSE(配列番号250);(v)HINGLNADFNAANNIKYI(配列番号251)、又は前述のいずれかに対して1つ、2つ、若しくは3つ以下の配列差異(例えば、置換)を有する配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号4と少なくとも70%同一の配列を有する。一部の実施形態において、CRISPR関連タンパク質は、配列番号10と少なくとも70%同一の配列を有する。
本明細書に記載されるシステムのいずれかの一部の実施形態において、ダイレクトリピート配列は、配列番号57~90、配列番号118~151、又は配列番号213のいずれか1つに記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。本明細書に記載されるシステムのいずれかの一部の実施形態において、ダイレクトリピート配列は、配列番号57~90、配列番号118~151、又は配列番号213のいずれか1つに記載のヌクレオチド配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。
本明細書に記載されるシステムのいずれかの一部の実施形態において、ダイレクトリピート配列は、以下の配列の1つ以上:(a)X1X2TX3X4X5X6X7X8(配列番号224)(ここで、X1はA又はC又はGであり、X2はT又はC又はAであり、X3はT又はG又はAであり、X4はT又はGであり、X5はT又はG又はAであり、X6はG又はT又はAであり、X7はT又はG又はAであり、X8はA又はG又はTである)(例えば、ATTGTTGDA(配列番号225));(b)X1X2X3X4X5X6X7X8X9(配列番号226)(ここで、X1はT又はC又はAであり、X2はT又はA又はGであり、X3はT又はC又はAであり、X4はT又はAであり、X5はT又はA又はGであり、X6はT又はAであり、X7はA又はTであり、X8はA又はG又はC又はTであり、X9はG又はA又はCである)(例えば、TTTTWTARG(配列番号227));及び(c)X1X2X3AC(配列番号228)(ここで、X1はA又はC又はGであり、X2はC又はAであり、X3はA又はCである)(例えば、ACAAC(配列番号229))を含む。本明細書に記載されるシステムのいずれかの一部の実施形態において、配列番号224はダイレクトリピートの5’末端に近接している。本明細書に記載されるシステムのいずれかの一部の実施形態において、配列番号228はダイレクトリピートの3’末端に近接している。
本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質はプロトスペーサー隣接モチーフ(PAM)の認識能を有し、ここで、PAM配列は核酸配列を含み、これは5’-NTTN-3’、5’-NTTR-3’、5’-RTTR-3’、5’-TNNT-3’、5’-TNRT-3’、5’-TSRT-3’、5’-TGRT-3’、5’-TNRY-3’、5’-TTNR-3’、5’-TTYR-3’、5’-TTTR-3’、5’-TTCV-3’、5’-DTYR-3’、5’-WTTR-3’、5’-NNR-3’、5’-NYR-3’、5’-YYR-3’、5’-TYR-3’、5’-TTN-3’、5’-TTR-3’、5’-CNT-3’、5’-NGG-3’、5’-BGG-3’、又は5’-R-3’として記載される核酸配列を含み、「N」は任意のヌクレオチドであり、「B」はC又はG又はTであり、「D」はA又はG又はTであり、「R」はA又はGであり、「S」はG又はCであり、「V」はA又はC又はGであり、「W」はA又はTであり、「Y」はC又はTである。
本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号1に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、ダイレクトリピート配列は、配列番号57に記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号1に記載のアミノ酸配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、ダイレクトリピート配列は、配列番号57に記載のヌクレオチド配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質はプロトスペーサー隣接モチーフ(PAM)配列の認識能を有し、ここで、PAM配列は、5’-TNNT-3’又は5’-TNRT-3’として記載される核酸配列を含み、「N」は任意のヌクレオチドであり、「R」はA又はGである。
本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号4に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、ダイレクトリピート配列は、配列番号60に記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号4に記載のアミノ酸配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、ダイレクトリピート配列は、配列番号60に記載のヌクレオチド配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質はプロトスペーサー隣接モチーフ(PAM)配列の認識能を有し、ここで、PAM配列は、5’-NTTN-3’、5’-NTTR-3’(例えば、5’-TTTG-3’)、又は5’-NNR-3’として記載される核酸配列を含み、「N」は任意のヌクレオチドであり、「R」はA又はGである。
本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号10に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、ダイレクトリピート配列は、配列番号62又は配列番号213に記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号10に記載のアミノ酸配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、ダイレクトリピート配列は、配列番号62又は配列番号213に記載のヌクレオチド配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質はプロトスペーサー隣接モチーフ(PAM)配列の認識能を有し、ここで、PAM配列は、5’-NTTN-3’又は5’-RTTR-3’(例えば、5’-ATTG-3’又は5’-GTTA-3’)として記載される核酸配列を含み、「N」は任意のヌクレオチドであり、「R」はA又はGである。
本明細書に記載されるシステムのいずれかの一部の実施形態において、RNAガイドのスペーサー配列は約15ヌクレオチド~約55ヌクレオチドを含む。本明細書に記載されるシステムのいずれかの一部の実施形態において、RNAガイドのスペーサー配列は20~45ヌクレオチドを含む。
本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質は触媒残基(例えば、アスパラギン酸又はグルタミン酸)を含む。本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質は、標的核酸を切断する。本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質は、ペプチドタグ、蛍光タンパク質、塩基編集ドメイン、DNAメチル化ドメイン、ヒストン残基修飾ドメイン、局在化因子、転写修飾因子、光ゲート制御因子、化学誘導性因子、又はクロマチン可視化因子を更に含む。
本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質をコードする核酸は、細胞(例えば、真核細胞、例えば、哺乳動物細胞、例えば、ヒト細胞)での発現にコドン最適化される。本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質をコードする核酸は、プロモーターに作動可能に連結されている。本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質をコードする核酸は、ベクター内にある。一部の実施形態において、ベクターは、レトロウイルスベクター、レンチウイルスベクター、ファージベクター、アデノウイルスベクター、アデノ随伴ベクター、又は単純ヘルペスベクターを含む。
本明細書に記載されるシステムのいずれかの一部の実施形態において、標的核酸はDNA分子である。本明細書に記載されるシステムのいずれかの一部の実施形態において、標的核酸はPAM配列を含む。
本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質は、非特異的ヌクレアーゼ活性を有する。
本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質及びRNAガイドによる標的核酸の認識により、標的核酸の修飾が生じる。本明細書に記載されるシステムのいずれかの一部の実施形態において、標的核酸の修飾は、二本鎖切断イベントである。本明細書に記載されるシステムのいずれかの一部の実施形態において、標的核酸の修飾は、一本鎖切断イベントである。本明細書に記載されるシステムのいずれかの一部の実施形態において、標的核酸の修飾により、挿入イベントが生じる。本明細書に記載されるシステムのいずれかの一部の実施形態において、標的核酸の修飾により、欠失イベントが生じる。本明細書に記載されるシステムのいずれかの一部の実施形態において、標的核酸の修飾により、細胞毒性又は細胞死が生じる。
本明細書に記載されるシステムのいずれかの一部の実施形態において、システムはドナー鋳型核酸を更に含む。本明細書に記載されるシステムのいずれかの一部の実施形態において、ドナー鋳型核酸はDNA分子である。本明細書に記載されるシステムのいずれかの一部の実施形態において、ドナー鋳型核酸はRNA分子である。
本明細書に記載されるシステムのいずれかの一部の実施形態において、RNAガイドは、任意選択でtracrRNA及び/又はモジュレーターRNAを含む。本明細書に記載されるシステムのいずれかの一部の実施形態において、システムはtracrRNAを更に含む。本明細書に記載されるシステムのいずれかの一部の実施形態において、システムはtracrRNAを含まない。本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質は自己プロセシングである。本明細書に記載されるシステムのいずれかの一部の実施形態において、システムはモジュレーターRNAを更に含む。
本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号1のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、tracrRNA配列は、配列番号152、配列番号153、又は配列番号154のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。
本明細書に記載されるシステムのいずれかの一部の実施形態において、システムは、ナノ粒子、リポソーム、エキソソーム、微小胞、又は遺伝子銃を含む送達組成物中に存在する。
本明細書に記載されるシステムのいずれかの一部の実施形態において、システムは細胞内にある。一部の実施形態において、細胞は真核細胞である。一部の実施形態において、細胞は哺乳動物細胞である。一部の実施形態において、細胞はヒト細胞である。一部の実施形態において、細胞は原核細胞である。
別の態様において、本開示は細胞を提供し、ここで、細胞は、配列番号1~56のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含むCRISPR関連タンパク質;及びダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイドを含む。別の態様において、本開示は細胞を提供し、ここで、細胞は、CRISPR関連タンパク質が配列番号1~56のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、CRISPR関連タンパク質又はCRISPR関連タンパク質をコードする核酸;及びダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイド、又はRNAガイドをコードする核酸を含む。
本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質は、少なくとも1つ(例えば、1つ、2つ、又は3つ)のRuvCドメイン又は少なくとも1つの分割されたRuvCドメインを含む。
本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質は、以下の配列の1つ以上:(a)PX1X2X3X4F(配列番号216)(ここで、X1はL又はM又はI又はC又はFであり、X2はY又はW又はFであり、X3はK又はT又はC又はR又はW又はY又はH又はVであり、X4はI又はL又はMである);(b)RX1X2X3L(配列番号217)(ここで、X1はI又はL又はM又はY又はT又はFであり、X2はR又はQ又はK又はE又はS又はTであり、X3はL又はI又はT又はC又はM又はKである);(c)NX1YX2(配列番号218)(ここで、X1はI又はL又はFであり、X2はK又はR又はV又はEである);(d)KX1X2X3FAX4X5KD(配列番号219)(ここで、X1はT又はI又はN又はA又はS又はF又はVであり、X2はI又はV又はL又はSであり、X3はH又はS又はG又はRであり、X4はD又はS又はEであり、X5はI又はV又はM又はT又はNである);(e)LX1NX2(配列番号220)(ここで、X1はG又はS又はC又はTであり、X2はN又はY又はK又はSである);(f)PX1X2X3X4SQX5DS(配列番号221)(ここで、X1はS又はP又はAであり、X2はY又はS又はA又はP又はE又はY又はQ又はNであり、X3はF又はY又はHであり、X4はT又はSであり、X5はM又はT又はIである);(g)KX1X2VRX3X4QEX5H(配列番号222)(ここで、X1はN又はK又はW又はR又はE又はT又はYであり、X2はM又はR又はL又はS又はK又はV又はE又はT又はI又はDであり、X3はL又はR又はH又はP又はT又はK又はPのQ又はS又はAであり、X4はG又はQ又はN又はR又はK又はE又はI又はT又はS又はCであり、X5はR又はW又はY又はK又はT又はF又はS又はQである);及び(h)X1NGX2X3X4DX5NX6X7X8N(配列番号223)(ここで、X1はI又はK又はV又はLであり、X2はL又はMであり、X3はN又はH又はPであり、X4はA又はS又はCであり、X5はV又はY又はI又はF又はT又はNであり、X6はA又はSであり、X7はS又はA又はPであり、X8はM又はC又はL又はR又はN又はS又はK又はLである)を含む。本明細書に記載される細胞のいずれかの一部の実施形態において、配列番号216の配列はN末端配列である。本明細書に記載される細胞のいずれかの一部の実施形態において、配列番号219の配列はC末端配列である。本明細書に記載される細胞のいずれかの一部の実施形態において、配列番号220の配列はC末端配列である。本明細書に記載される細胞のいずれかの一部の実施形態において、配列番号221の配列はC末端配列である。本明細書に記載される細胞のいずれかの一部の実施形態において、配列番号222の配列はC末端配列である。本明細書に記載される細胞のいずれかの一部の実施形態において、配列番号223の配列はC末端配列である。
本明細書に記載される細胞のいずれかの一部の実施形態において、ダイレクトリピート配列は、配列番号57~90、配列番号118~151、又は配列番号213のいずれか1つに記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。本明細書に記載される細胞のいずれかの一部の実施形態において、ダイレクトリピート配列は、配列番号57~90、配列番号118~151、又は配列番号213のいずれか1つに記載のヌクレオチド配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。
本明細書に記載される細胞のいずれかの一部の実施形態において、ダイレクトリピート配列は、以下の配列の1つ以上:(a)X1X2TX3X4X5X6X7X8(配列番号224)(ここで、X1はA又はC又はGであり、X2はT又はC又はAであり、X3はT又はG又はAであり、X4はT又はGであり、X5はT又はG又はAであり、X6はG又はT又はAであり、X7はT又はG又はAであり、X8はA又はG又はTである)(例えば、ATTGTTGDA(配列番号225));(b)X1X2X3X4X5X6X7X8X9(配列番号226)(ここで、X1はT又はC又はAであり、X2はT又はA又はGであり、X3はT又はC又はAであり、X4はT又はAであり、X5はT又はA又はGであり、X6はT又はAであり、X7はA又はTであり、X8はA又はG又はC又はTであり、X9はG又はA又はCである)(例えば、TTTTWTARG(配列番号227));及び(c)X1X2X3AC(配列番号228)(ここで、X1はA又はC又はGであり、X2はC又はAであり、X3はA又はCである)(例えば、ACAAC(配列番号229))を含む。本明細書に記載される細胞のいずれかの一部の実施形態において、配列番号224はダイレクトリピートの5’末端に近接している。本明細書に記載される細胞のいずれかの一部の実施形態において、配列番号228はダイレクトリピートの3’末端に近接している。
本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号1に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、ダイレクトリピート配列は、配列番号57に記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号1に記載のアミノ酸配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、ダイレクトリピート配列は、配列番号57に記載のヌクレオチド配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質はプロトスペーサー隣接モチーフ(PAM)配列の認識能を有し、ここで、PAM配列は、5’-TNNT-3’又は5’-TNRT-3’として記載される核酸配列を含み、「N」は任意のヌクレオチドであり、「R」はA又はGである。
本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号4に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、ダイレクトリピート配列は、配列番号60に記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号4に記載のアミノ酸配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、ダイレクトリピート配列は、配列番号60に記載のヌクレオチド配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質はプロトスペーサー隣接モチーフ(PAM)配列の認識能を有し、ここで、PAM配列は、5’-NTTN-3’、5’-NTTR-3’(例えば、5’-TTTG-3’)、又は5’-NNR-3’として記載される核酸配列を含み、「N」は任意のヌクレオチドであり、「R」はA又はGである。
本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号10に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、ダイレクトリピート配列は、配列番号62又は配列番号213に記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号10に記載のアミノ酸配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、ダイレクトリピート配列は、配列番号62又は配列番号213に記載のヌクレオチド配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質はプロトスペーサー隣接モチーフ(PAM)配列の認識能を有し、ここで、PAM配列は、5’-NTTN-3’又は5’-RTTR-3’(例えば、5’-ATTG-3’又は5’-GTTA-3’)として記載される核酸配列を含み、「N」は任意のヌクレオチドであり、「R」はA又はGである。
本明細書に記載される細胞のいずれかの一部の実施形態において、スペーサー配列は約15ヌクレオチド~約55ヌクレオチドを含む。本明細書に記載される細胞のいずれかの一部の実施形態において、スペーサー配列は20~45ヌクレオチドを含む。
本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質は触媒残基(例えば、アスパラギン酸又はグルタミン酸)を含む。本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質は、標的核酸を切断する。本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質は、ペプチドタグ、蛍光タンパク質、塩基編集ドメイン、DNAメチル化ドメイン、ヒストン残基修飾ドメイン、局在化因子、転写修飾因子、光ゲート制御因子、化学誘導性因子、又はクロマチン可視化因子を更に含む。
本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質をコードする核酸は、細胞(例えば、真核細胞、例えば、哺乳動物細胞、例えば、ヒト細胞)での発現にコドン最適化される。本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質をコードする核酸は、プロモーターに作動可能に連結されている。本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質をコードする核酸は、ベクター内にある。一部の実施形態において、ベクターは、レトロウイルスベクター、レンチウイルスベクター、ファージベクター、アデノウイルスベクター、アデノ随伴ベクター、又は単純ヘルペスベクターを含む。
本明細書に記載される細胞のいずれかの一部の実施形態において、RNAガイドは、任意選択でtracrRNA及び/又はモジュレーターRNAを含む。本明細書に記載される細胞のいずれかの一部の実施形態において、細胞はtracrRNAを更に含む。本明細書に記載される細胞のいずれかの一部の実施形態において、細胞はtracrRNAを含まない。本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質は自己プロセシングである。本明細書に記載される細胞のいずれかの一部の実施形態において、細胞はモジュレーターRNAを更に含む。
本明細書に記載される細胞のいずれかの一部の実施形態において、細胞は真核細胞である。本明細書に記載される細胞のいずれかの一部の実施形態において、細胞は哺乳動物細胞である。本明細書に記載される細胞のいずれかの一部の実施形態において、細胞はヒト細胞である。本明細書に記載される細胞のいずれかの一部の実施形態において、細胞は原核細胞である。
本明細書に記載される細胞のいずれかの一部の実施形態において、標的核酸はDNA分子である。本明細書に記載される細胞のいずれかの一部の実施形態において、標的核酸はPAM配列を含む。
本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質は、非特異的ヌクレアーゼ活性を有する。
本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質及びRNAガイドによる標的核酸の認識により、標的核酸の修飾が生じる。本明細書に記載される細胞のいずれかの一部の実施形態において、標的核酸の修飾は、二本鎖切断イベントである。本明細書に記載される細胞のいずれかの一部の実施形態において、標的核酸の修飾は、一本鎖切断イベントである。本明細書に記載される細胞のいずれかの一部の実施形態において、標的核酸の修飾により、挿入イベントが生じる。本明細書に記載される細胞のいずれかの一部の実施形態において、標的核酸の修飾により、欠失イベントが生じる。本明細書に記載される細胞のいずれかの一部の実施形態において、標的核酸の修飾により、細胞毒性又は細胞死が生じる。
別の態様において、本開示は、(a)システムを提供すること;及び(b)システムを細胞に送達することを含む、本明細書に記載されるシステムを細胞内の標的核酸に結合する方法を提供し、ここで、細胞は標的核酸を含み、CRISPR関連タンパク質はRNAガイドに結合し、スペーサー配列は標的核酸に結合する。一部の実施形態において、細胞は真核細胞、例えば、哺乳動物細胞、例えば、ヒト細胞である。
別の態様において、本開示は、標的核酸を修飾する方法であって、配列番号1~56のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含むCRISPR関連タンパク質;及びダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイドを含む、エンジニアリングされた天然に存在しないCRISPR-Casシステムを、標的核酸に送達することを含む方法を提供し、ここで、CRISPR関連タンパク質はRNAガイドへの結合能を有し、CRISPR関連タンパク質及びRNAガイドによる標的核酸の認識により、標的核酸の修飾が生じる。別の態様において、本開示は、標的核酸を修飾する方法であって、CRISPR関連タンパク質が配列番号1~56のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、CRISPR関連タンパク質又はCRISPR関連タンパク質をコードする核酸;及びダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイドを含む、エンジニアリングされた天然に存在しないCRISPR-Casシステムを、標的核酸に送達することを含む方法を提供し、ここで、CRISPR関連タンパク質はRNAガイドへの結合能を有し、CRISPR関連タンパク質及びRNAガイドによる標的核酸の認識により、標的核酸の修飾が生じる。
本明細書に記載される方法のいずれかの一部の実施形態において、CRISPR関連タンパク質は、以下の配列の1つ以上:(a)PX1X2X3X4F(配列番号216)(ここで、X1はL又はM又はI又はC又はFであり、X2はY又はW又はFであり、X3はK又はT又はC又はR又はW又はY又はH又はVであり、X4はI又はL又はMである);(b)RX1X2X3L(配列番号217)(ここで、X1はI又はL又はM又はY又はT又はFであり、X2はR又はQ又はK又はE又はS又はTであり、X3はL又はI又はT又はC又はM又はKである);(c)NX1YX2(配列番号218)(ここで、X1はI又はL又はFであり、X2はK又はR又はV又はEである);(d)KX1X2X3FAX4X5KD(配列番号219)(ここで、X1はT又はI又はN又はA又はS又はF又はVであり、X2はI又はV又はL又はSであり、X3はH又はS又はG又はRであり、X4はD又はS又はEであり、X5はI又はV又はM又はT又はNである);(e)LX1NX2(配列番号220)(ここで、X1はG又はS又はC又はTであり、X2はN又はY又はK又はSである);(f)PX1X2X3X4SQX5DS(配列番号221)(ここで、X1はS又はP又はAであり、X2はY又はS又はA又はP又はE又はY又はQ又はNであり、X3はF又はY又はHであり、X4はT又はSであり、X5はM又はT又はIである);(g)KX1X2VRX3X4QEX5H(配列番号222)(ここで、X1はN又はK又はW又はR又はE又はT又はYであり、X2はM又はR又はL又はS又はK又はV又はE又はT又はI又はDであり、X3はL又はR又はH又はP又はT又はK又はPのQ又はS又はAであり、X4はG又はQ又はN又はR又はK又はE又はI又はT又はS又はCであり、X5はR又はW又はY又はK又はT又はF又はS又はQである);及び(h)X1NGX2X3X4DX5NX6X7X8N(配列番号223)(ここで、X1はI又はK又はV又はLであり、X2はL又はMであり、X3はN又はH又はPであり、X4はA又はS又はCであり、X5はV又はY又はI又はF又はT又はNであり、X6はA又はSであり、X7はS又はA又はPであり、X8はM又はC又はL又はR又はN又はS又はK又はLである)を含む。本明細書に記載される方法のいずれかの一部の実施形態において、配列番号216の配列はN末端配列である。本明細書に記載される方法のいずれかの一部の実施形態において、配列番号219の配列はC末端配列である。本明細書に記載される方法のいずれかの一部の実施形態において、配列番号220の配列はC末端配列である。本明細書に記載される方法のいずれかの一部の実施形態において、配列番号221の配列はC末端配列である。本明細書に記載される方法のいずれかの一部の実施形態において、配列番号222の配列はC末端配列である。本明細書に記載される方法のいずれかの一部の実施形態において、配列番号223の配列はC末端配列である。
本明細書に記載される方法のいずれかの一部の実施形態において、ダイレクトリピート配列は、配列番号57~90、配列番号118~151、又は配列番号213のいずれか1つに記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。本明細書に記載される方法のいずれかの一部の実施形態において、ダイレクトリピート配列は、配列番号57~90、配列番号118~151、又は配列番号213のいずれか1つに記載のヌクレオチド配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。
本明細書に記載される方法のいずれかの一部の実施形態において、ダイレクトリピート配列は、以下の配列の1つ以上:(a)X1X2TX3X4X5X6X7X8(配列番号224)(ここで、X1はA又はC又はGであり、X2はT又はC又はAであり、X3はT又はG又はAであり、X4はT又はGであり、X5はT又はG又はAであり、X6はG又はT又はAであり、X7はT又はG又はAであり、X8はA又はG又はTである)(例えば、ATTGTTGDA(配列番号225));(b)X1X2X3X4X5X6X7X8X9(配列番号226)(ここで、X1はT又はC又はAであり、X2はT又はA又はGであり、X3はT又はC又はAであり、X4はT又はAであり、X5はT又はA又はGであり、X6はT又はAであり、X7はA又はTであり、X8はA又はG又はC又はTであり、X9はG又はA又はCである)(例えば、TTTTWTARG(配列番号227));及び(c)X1X2X3AC(配列番号228)(ここで、X1はA又はC又はGであり、X2はC又はAであり、X3はA又はCである)(例えば、ACAAC(配列番号229))を含む。本明細書に記載される方法のいずれかの一部の実施形態において、配列番号224はダイレクトリピートの5’末端に近接している。本明細書に記載される方法のいずれかの一部の実施形態において、配列番号228はダイレクトリピートの3’末端に近接している。
本明細書に記載される方法のいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号1に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、ダイレクトリピート配列は、配列番号57に記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。本明細書に記載される方法のいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号1に記載のアミノ酸配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、ダイレクトリピート配列は、配列番号57に記載のヌクレオチド配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。本明細書に記載される方法のいずれかの一部の実施形態において、CRISPR関連タンパク質はプロトスペーサー隣接モチーフ(PAM)配列の認識能を有し、ここで、PAM配列は、5’-TNNT-3’又は5’-TNRT-3’として記載される核酸配列を含み、「N」は任意のヌクレオチドであり、「R」はA又はGである。
本明細書に記載される方法のいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号4に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、ダイレクトリピート配列は、配列番号60に記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。本明細書に記載される方法のいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号4に記載のアミノ酸配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、ダイレクトリピート配列は、配列番号60に記載のヌクレオチド配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。本明細書に記載される方法のいずれかの一部の実施形態において、CRISPR関連タンパク質はプロトスペーサー隣接モチーフ(PAM)配列の認識能を有し、ここで、PAM配列は、5’-NTTN-3’、5’-NTTR-3’(例えば、5’-TTTG-3’)、又は5’-NNR-3’として記載される核酸配列を含み、「N」は任意のヌクレオチドであり、「R」はA又はGである。
本明細書に記載される方法のいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号10に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、ダイレクトリピート配列は、配列番号62又は配列番号213に記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。本明細書に記載される方法のいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号10に記載のアミノ酸配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、ダイレクトリピート配列は、配列番号62又は配列番号213に記載のヌクレオチド配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。本明細書に記載される方法のいずれかの一部の実施形態において、CRISPR関連タンパク質はプロトスペーサー隣接モチーフ(PAM)配列の認識能を有し、ここで、PAM配列は、5’-NTTN-3’又は5’-RTTR-3’(例えば、5’-ATTG-3’又は5’-GTTA-3’)として記載される核酸配列を含み、「N」は任意のヌクレオチドであり、「R」はA又はGである。
本明細書に記載される方法のいずれかの一部の実施形態において、スペーサー配列は、約15ヌクレオチド~約55ヌクレオチドを含む。本明細書に記載される方法のいずれかの一部の実施形態において、スペーサー配列は、20~45ヌクレオチドを含む。
本明細書に記載される方法のいずれかの一部の実施形態において、RNAガイドは、任意選択でtracrRNA及び/又はモジュレーターRNAを含む。本明細書に記載される方法のいずれかの一部の実施形態において、システムはtracrRNAを更に含む。本明細書に記載される方法のいずれかの一部の実施形態において、システムはtracrRNAを含まない。本明細書に記載される方法のいずれかの一部の実施形態において、CRISPR関連タンパク質は自己プロセシングである。本明細書に記載される方法のいずれかの一部の実施形態において、システムはモジュレーターRNAを更に含む。
本明細書に記載される方法のいずれかの一部の実施形態において、標的核酸はDNA分子である。本明細書に記載される方法のいずれかの一部の実施形態において、標的核酸はPAM配列を含む。
本明細書に記載される方法のいずれかの一部の実施形態において、CRISPR関連タンパク質は、非特異的ヌクレアーゼ活性を有する。
本明細書に記載される方法のいずれかの一部の実施形態において、標的核酸の修飾は、二本鎖切断イベントである。本明細書に記載される方法のいずれかの一部の実施形態において、標的核酸の修飾は、一本鎖切断イベントである。本明細書に記載される方法のいずれかの一部の実施形態において、標的核酸の修飾により、挿入イベントが生じる。本明細書に記載される方法のいずれかの一部の実施形態において、標的核酸の修飾により、欠失イベントが生じる。本明細書に記載される方法のいずれかの一部の実施形態において、標的核酸の修飾により、細胞毒性又は細胞死が生じる。
別の態様において、本開示は、標的核酸の編集方法を提供し、この方法は、本明細書に記載されるシステムを標的核酸に接触させることを含む。別の態様において、本開示は、標的核酸の発現を改変する方法を提供し、この方法は、本明細書に記載されるシステムを標的核酸に接触させることを含む。別の態様において、本開示は、標的核酸のある部位におけるペイロード核酸の挿入を標的化する方法であって、本明細書に記載されるシステムを標的核酸に接触させることを含む、方法を提供する。別の態様において、本開示は、標的核酸の部位からのペイロード核酸の切出しを標的化する方法であって、本明細書に記載されるシステムを標的核酸に接触させることを含む、方法を提供する。別の態様において、本開示は、DNA標的核酸の認識時に一本鎖DNAを非特異的に分解する方法を提供し、この方法は、本明細書に記載されるシステムを標的核酸に接触させることを含む。
本明細書に提供されるシステム又は方法のいずれかの一部の実施形態において、接触は、直接接触又は間接接触を含む。本明細書に提供されるシステム又は方法のいずれかの一部の実施形態において、間接的に接触することは、RNAガイド及び/又はCRISPR関連タンパク質の産生を可能にする条件下で、本明細書に記載されるRNAガイド又はCRISPR関連タンパク質をコードする1つ以上の核酸を投与することを含む。本明細書に提供されるシステム又は方法のいずれかの一部の実施形態において、接触は、インビボでの接触又はインビトロでの接触を含む。本明細書に提供されるシステム又は方法のいずれかの一部の実施形態において、標的核酸をシステムと接触させることは、CRISPR関連タンパク質及びガイドRNAが標的核酸に到達することを可能にする条件下で、核酸を含む細胞をシステムと接触させることを含む。本明細書に提供されるシステム又は方法のいずれかの一部の実施形態において、インビボで細胞をシステムと接触させることは、CRISPR関連タンパク質及びガイドRNAが細胞に到達するか又は細胞内で産生されることを可能にする条件下で、細胞を含む対象にシステムを投与することを含む。
別の態様において、本開示は、(a)標的核酸のターゲティング及び編集方法;(b)核酸の認識に応じた一本鎖核酸の非特異的分解方法;(c)二本鎖標的のスペーサー相補鎖の認識に応じた二本鎖標的の非スペーサー相補鎖のターゲティング及びニッキング方法;(d)二本鎖標的核酸のターゲティング及び切断方法;(e)試料中の標的核酸の検出方法;(f)二本鎖核酸の特異的編集方法;(g)二本鎖核酸の塩基編集方法;(h)細胞における遺伝子型特異的又は転写状態特異的細胞死又は休眠の誘導方法;(i)二本鎖核酸標的におけるインデルの作成方法;(j)二本鎖核酸標的への配列の挿入方法;又は(k)二本鎖核酸標的における配列の欠失又は逆位形成方法である、インビトロ又はエキソビボでの方法における使用のための、本明細書に提供されるシステムを提供する。
別の態様において、本開示は(a)CRISPR関連タンパク質が、配列番号1~56のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、CRISPR関連タンパク質をコードする核酸配列;及び(b)ダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイド(又はRNAガイドをコードする核酸)のトランスフェクションを含む、哺乳動物細胞における標的核酸中への挿入又は欠失を導入する方法を提供し、ここで、CRISPR関連タンパク質は、RNAガイドへの結合能を有し、CRISPR関連タンパク質及びRNAガイドによる標的核酸の認識により、標的核酸の修飾が生じる。
本明細書に提供される方法のいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号4に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む。本明細書に提供される方法のいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号4に記載のアミノ酸配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む。本明細書に提供される方法のいずれかの一部の実施形態において、ダイレクトリピートは、配列番号60に記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。本明細書に提供される方法のいずれかの一部の実施形態において、ダイレクトリピートは、配列番号60に記載のヌクレオチド配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。本明細書に提供される方法のいずれかの一部の実施形態において、標的核酸はPAM配列に隣接し、PAM配列は、5’-NTTN-3’、5’-NTTR-3’(例えば、5’-TTTG-3’)、又は5’-NNR-3’として記載される核酸配列を含み、ここで、「N」は任意のヌクレオチドであり、「R」はA又はGである。
本明細書に提供される方法のいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号10に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む。本明細書に提供される方法のいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号10に記載のアミノ酸配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む。本明細書に提供される方法のいずれかの一部の実施形態において、ダイレクトリピートは、配列番号62又は配列番号213に記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。本明細書に提供される方法のいずれかの一部の実施形態において、ダイレクトリピートは、配列番号62又は配列番号213に記載のヌクレオチド配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。本明細書に提供される方法のいずれかの一部の実施形態において、標的核酸はPAM配列に隣接し、PAM配列は、5’-NTTN-3’又は5’-RTTR-3’(例えば、5’-ATTG-3’又は5’-GTTA-3’)として記載される核酸配列を含み、ここで、「N」は任意のヌクレオチドであり、「R」はA又はGである。
本明細書に提供される方法のいずれかの一部の実施形態において、トランスフェクションは一過性トランスフェクションである。本明細書に提供される方法のいずれかの一部の実施形態において、細胞はヒト細胞である。
別の態様において、本開示は、(a)CRISPR関連タンパク質又はCRISPR関連タンパク質をコードする核酸及び(b)ダイレクトリピート配列とスペーサー配列とを含むRNAガイドを含む組成物を提供し;ここで、CRISPR関連タンパク質は、以下のアミノ酸配列の1つ以上:(i)PX1X2X3X4F(配列番号216)(ここで、X1はL又はM又はI又はC又はFであり、X2はY又はW又はFであり、X3はK又はT又はC又はR又はW又はY又はH又はVであり、X4はI又はL又はMである);(ii)RX1X2X3L(配列番号217)(ここで、X1はI又はL又はM又はY又はT又はFであり、X2はR又はQ又はK又はE又はS又はTであり、X3はL又はI又はT又はC又はM又はKである);(iii)NX1YX2(配列番号218)(ここで、X1はI又はL又はFであり、X2はK又はR又はV又はEである);(iv)KX1X2X3FAX4X5KD(配列番号219)(ここで、X1はT又はI又はN又はA又はS又はF又はVであり、X2はI又はV又はL又はSであり、X3はH又はS又はG又はRであり、X4はD又はS又はEであり、X5はI又はV又はM又はT又はNである);(v)LX1NX2(配列番号220)(ここで、X1はG又はS又はC又はTであり、X2はN又はY又はK又はSである);(vi)PX1X2X3X4SQX5DS(配列番号221)(ここで、X1はS又はP又はAであり、X2はY又はS又はA又はP又はE又はY又はQ又はNであり、X3はF又はY又はHであり、X4はT又はSであり、X5はM又はT又はIである);(vii)KX1X2VRX3X4QEX5H(配列番号222)(ここで、X1はN又はK又はW又はR又はE又はT又はYであり、X2はM又はR又はL又はS又はK又はV又はE又はT又はI又はDであり、X3はL又はR又はH又はP又はT又はK又はPのQ又はS又はAであり、X4はG又はQ又はN又はR又はK又はE又はI又はT又はS又はCであり、X5はR又はW又はY又はK又はT又はF又はS又はQである);及び(viii)X1NGX2X3X4DX5NX6X7X8N(配列番号223)(ここで、X1はI又はK又はV又はLであり、X2はL又はMであり、X3はN又はH又はPであり、X4はA又はS又はCであり、X5はV又はY又はI又はF又はT又はNであり、X6はA又はSであり、X7はS又はA又はPであり、X8はM又はC又はL又はR又はN又はS又はK又はLである)を含み、CRISPR関連タンパク質は、RNAガイドに結合し、スペーサー配列に相補的な標的核酸配列を修飾することができる。
本明細書に記載される組成物のいずれかの一部の実施形態において、ダイレクトリピート配列は、以下の配列の1つ以上:(a)X1X2TX3X4X5X6X7X8(配列番号224)(ここで、X1はA又はC又はGであり、X2はT又はC又はAであり、X3はT又はG又はAであり、X4はT又はGであり、X5はT又はG又はAであり、X6はG又はT又はAであり、X7はT又はG又はAであり、X8はA又はG又はTである)(例えば、ATTGTTGDA(配列番号225));(b)X1X2X3X4X5X6X7X8X9(配列番号226)(ここで、X1はT又はC又はAであり、X2はT又はA又はGであり、X3はT又はC又はAであり、X4はT又はAであり、X5はT又はA又はGであり、X6はT又はAであり、X7はA又はTであり、X8はA又はG又はC又はTであり、X9はG又はA又はCである)(例えば、TTTTWTARG(配列番号227));及び(c)X1X2X3AC(配列番号228)(ここで、X1はA又はC又はGであり、X2はC又はAであり、X3はA又はCである)(例えば、ACAAC(配列番号229))を含む。本明細書に記載される組成物のいずれかの一部の実施形態において、配列番号224はダイレクトリピートの5’末端に近接している。本明細書に記載される組成物のいずれかの一部の実施形態において、配列番号228はダイレクトリピートの3’末端に近接している。
本明細書に記載される組成物のいずれかの一部の実施形態において、CRISPR関連タンパク質は、少なくとも1つ(例えば、1つ、2つ、又は3つ)のRuvCドメイン又は少なくとも1つの分割されたRuvCドメインを含む。
本明細書に記載される組成物のいずれかの一部の実施形態において、RNAガイドのスペーサー配列は、約15ヌクレオチド~約55ヌクレオチドを含む。本明細書に記載される組成物のいずれかの一部の実施形態において、RNAガイドのスペーサー配列は、20~45ヌクレオチドを含む。
本明細書に記載される組成物のいずれかの一部の実施形態において、CRISPR関連タンパク質は触媒残基(例えば、アスパラギン酸又はグルタミン酸)を含む。本明細書に記載される組成物のいずれかの一部の実施形態において、CRISPR関連タンパク質は、標的核酸を切断する。本明細書に記載される組成物のいずれかの一部の実施形態において、CRISPR関連タンパク質は、ペプチドタグ、蛍光タンパク質、塩基編集ドメイン、DNAメチル化ドメイン、ヒストン残基修飾ドメイン、局在化因子、転写修飾因子、光ゲート制御因子、化学誘導性因子、又はクロマチン可視化因子を更に含む。
本明細書に記載される組成物のいずれかの一部の実施形態において、CRISPR関連タンパク質をコードする核酸は、細胞(例えば、真核細胞、例えば、哺乳動物細胞、例えば、ヒト細胞)での発現にコドン最適化される。本明細書に記載される組成物のいずれかの一部の実施形態において、CRISPR関連タンパク質をコードする核酸は、プロモーターに作動可能に連結されている。本明細書に記載される組成物のいずれかの一部の実施形態において、CRISPR関連タンパク質をコードする核酸は、ベクター内にある。一部の実施形態において、ベクターは、レトロウイルスベクター、レンチウイルスベクター、ファージベクター、アデノウイルスベクター、アデノ随伴ベクター、又は単純ヘルペスベクターを含む。
本明細書に記載される組成物のいずれかの一部の実施形態において、標的核酸はDNA分子である。本明細書に記載される組成物のいずれかの一部の実施形態において、標的核酸はPAM配列を含む。
本明細書に記載される組成物のいずれかの一部の実施形態において、CRISPR関連タンパク質は、非特異的ヌクレアーゼ活性を有する。
本明細書に記載される組成物のいずれかの一部の実施形態において、CRISPR関連タンパク質及びRNAガイドによる標的核酸の認識により、標的核酸の修飾が生じる。本明細書に記載される組成物のいずれかの一部の実施形態において、標的核酸の修飾は、二本鎖切断イベントである。本明細書に記載される組成物のいずれかの一部の実施形態において、標的核酸の修飾は、一本鎖切断イベントである。本明細書に記載される組成物のいずれかの一部の実施形態において、標的核酸の修飾により、挿入イベントが生じる。本明細書に記載される組成物のいずれかの一部の実施形態において、標的核酸の修飾により、欠失イベントが生じる。本明細書に記載される組成物のいずれかの一部の実施形態において、標的核酸の修飾により、細胞毒性又は細胞死が生じる。
本明細書に記載される組成物のいずれかの一部の実施形態において、システムはドナー鋳型核酸を更に含む。本明細書に記載される組成物のいずれかの一部の実施形態において、ドナー鋳型核酸はDNA分子である。本明細書に記載される組成物のいずれかの一部の実施形態において、ドナー鋳型核酸はRNA分子である。
本明細書に記載される組成物のいずれかの一部の実施形態において、RNAガイドは任意選択でtracrRNAを含む。本明細書に記載される組成物のいずれかの一部の実施形態において、システムはtracrRNAを更に含む。本明細書に記載される組成物のいずれかの一部の実施形態において、システムはtracrRNAを含まない。本明細書に記載される組成物のいずれかの一部の実施形態において、CRISPR関連タンパク質は自己プロセシングである。
本明細書に記載される組成物のいずれかの一部の実施形態において、システムは、ナノ粒子、リポソーム、エキソソーム、微小胞、又は遺伝子銃を含む送達組成物中に存在する。
本明細書に記載される組成物のいずれかの一部の実施形態において、組成物は細胞内にある。一部の実施形態において、細胞は真核細胞である。一部の実施形態において、細胞は哺乳動物細胞である。一部の実施形態において、細胞はヒト細胞である。一部の実施形態において、細胞は原核細胞である。
本明細書に記載されるエフェクターは、限定はされないが、1)新規核酸編集特性及び制御機構、2)送達戦略におけるより高い汎用性に比したより小さいサイズ、3)遺伝子型によって惹起される細胞死などの細胞過程、及び4)プログラム可能なRNA誘導型DNA挿入、切出し、及び動員、及び5)非ヒト共生源を介した既存の免疫の差別化されたプロファイルを含めた更なる特徴を提供する。例えば、実施例1、4、及び5並びに図1~3及び5~11Dを参照されたい。本明細書に記載される新規DNAターゲティングシステムがゲノム及びエピゲノム操作技法のツールボックスに加わることにより、特異的でプログラムされた摂動への幅広い適用が実現する。
本発明の他の特徴及び利点は、以下の詳細な説明から、及び特許請求の範囲から明らかであろう。
図面は、CLUST.091979と呼ばれるタンパク質クラスターの分析結果を表す一連の概略表現である。
CRISPR-Casシステムは、天然に多様であり、プログラム可能なバイオテクノロジーに生かすことのできる様々な活性機構及び機能要素が含まれている。天然では、これらのシステムが外来DNA及びウイルスに対する効率的な防御を実現する一方で、自己と非自己の判別を提供して自己標的化を回避している。エンジニアリングされた設定では、これらのシステムは、分子技術の多様なツールボックスを提供し、ターゲティング空間の境界を画定する。本明細書に記載される方法を用いて、シングルサブユニットのクラス2エフェクターシステム内に、RNAによるプログラムが可能な核酸操作の能力を拡張する、更なる機構及びパラメータが発見された。
特に定義しない限り、本明細書で使用される全ての科学技術用語は、本発明が属する技術分野の当業者が一般的に理解するのと同じ意味を有する。本発明の実施又は試験においては、本明細書に記載されるものと同様の又は等価な方法及び材料を使用し得るが、好適な方法及び材料を以下に記載する。本明細書において言及される刊行物、特許出願、特許、及び他の参考文献は全て、全体として参照により援用される。矛盾が生じる場合、定義を含め、本明細書が優先するものとする。加えて、材料、方法、及び例は例示に過ぎず、限定することを意図するものではない。出願人は、特許法の標準的な慣行に従って、「を含む」、「から本質的になる」、又は「からなる」という移行句を使用して、任意の開示された発明を代替的に請求する権利を留保する。
本明細書で使用される場合、単数形「a」、「an」、及び「the」は、文脈が明らかに他のものを示さない限り、複数の指示対象を含む。例えば、「核酸」への言及は、1つ以上の核酸を意味する。
本明細書において、「好ましくは」、「適切に」、「一般的に」、及び「典型的に」などの用語は、請求される発明の範囲を制限するため、又は特定の特徴が請求される発明の構造又は機能にとって重大、必須、又は更に重要であることを示唆するために使用されるものではないことに留意されたい。むしろ、これらの用語は、本発明の特定の実施形態において利用できる、又は利用できない、代替又は追加の特徴を強調することを単に意図するものである。
本発明を説明及び定義する目的で、用語「実質的に」は、任意の定量的比較、値、測定、又は他の表現に帰することができる固有の不確実性の程度を表すために本明細書で使用されることに留意されたい。用語「実質的に」はまた、問題となっている主題の基本的な機能に変化をもたらすことなく、記載される参照物から定量的表現が変化し得る程度を表すために本明細書で使用される。
用語「CRISPR-Casシステム」は、本明細書で使用されるとき、CRISPRエフェクターをコードする配列、RNAガイド、並びに他の配列及びCRISPR遺伝子座からの転写物を含む、CRISPRエフェクターの発現に関与する、又はその活性を導く核酸及び/又はタンパク質を指す。
用語「CRISPR関連タンパク質」、「CRISPR-Casエフェクター」、「CRISPRエフェクター」、「エフェクター」、「エフェクタータンパク質」、「CRISPR酵素」などは、本明細書で同義的に使用されるとき、酵素活性を実行するタンパク質又はRNAガイドによって指定される核酸上の標的部位に結合するタンパク質を指す。一部の実施形態において、CRISPRエフェクターは、エンドヌクレアーゼ活性、ニッカーゼ活性、及び/又はエキソヌクレアーゼ活性を有する。
用語「RNAガイド」、「ガイドRNA」、「gRNA」、及び「ガイド配列」は、本明細書で使用されるとき、DNA及び/又はRNAなどの標的核酸への本明細書に記載されるエフェクターのターゲティングを促進する任意のRNA分子を指す。例示的な「RNAガイド」としては、限定はされないが、crRNA、並びにtracrRNA及び/又はモジュレーターRNAのいずれかとハイブリダイズ又は融合したcrRNAが挙げられる。一部の実施形態において、RNAガイドは、単一のRNA分子に融合された、又は別個のRNA分子としての、crRNA及びtracrRNAの両方を含む。一部の実施形態において、RNAガイドは、単一のRNA分子に融合された、又は別個のRNA分子としての、crRNA及びモジュレーターRNAを含む。一部の実施形態において、RNAガイドは、単一のRNA分子に融合された、又は別個のRNA分子としての、crRNA、tracrRNA、及びモジュレーターRNAを含む。
用語「CRISPRエフェクター複合体」、「エフェクター複合体」、又は「監視複合体」は、本明細書で使用されるとき、CRISPRエフェクター及びRNAガイドを含む複合体を指す。CRISPRエフェクター複合体は、1つ以上のアクセサリータンパク質を更に含み得る。1つ以上のアクセサリータンパク質は、非触媒的及び/又は非標的結合であり得る。crRNAは、tracrRNAにハイブリダイズする配列を含み得る。次にはcrRNA:tracrRNA二重鎖は、CRISPRエフェクターに結合し得る。本明細書で使用されるとき、用語「プレcrRNA」は、DR-スペーサー-DR配列を含むプロセシングされていないRNA分子を指す。本明細書で使用される場合、「成熟crRNA」という用語は、プレcrRNAの処理された形態を指す。成熟crRNAは、DRスペーサー配列を含んでもよく、ここで、DRはプレcrRNAのDRの短縮型であり、且つ/又はスペーサーはプレcrRNAのスペーサーの短縮型である。
用語「CRISPR RNA」及び「crRNA」は、本明細書で使用されるとき、核酸配列を特異的に認識するためにCRISPRエフェクターによって使用されるガイド配列を含むRNA分子を指す。crRNA「スペーサー」配列は核酸標的配列に相補的であり、核酸標的配列への部分的又は全体的結合能を有する。
用語「トランス活性化crRNA」又は「tracrRNA」は、本明細書で使用されるとき、CRISPRエフェクターが特定の標的核酸に結合するために必要な構造及び/又は配列モチーフを形成する配列を含むRNA分子を指す。
用語「CRISPRアレイ」は、本明細書で使用されるとき、最初のCRISPRリピートの最初のヌクレオチドから始まって最後の(末端)CRISPRリピートの最後のヌクレオチドで終わる、CRISPRリピートとスペーサーとを含む核酸(例えば、DNA)セグメントを指す。典型的には、CRISPRアレイ中の各スペーサーは2つのリピート間に位置する。用語「CRISPRリピート」、「CRISPRダイレクトリピート」、及び「ダイレクトリピート」は、本明細書で使用されるとき、複数の短い定方向に反復する配列を指し、これはCRISPRアレイ内で配列変異をごく僅かしか又は全く示さない。
用語「モジュレーターRNA」は、本明細書に記載されるとき、CRISPRエフェクター又はCRISPRエフェクターを含む核タンパク質複合体の活性を調節する(例えば、増加又は減少させる)任意のRNA分子を指す。一部の実施形態において、モジュレーターRNAは、CRISPRエフェクター又はCRISPRエフェクターを含む核タンパク質複合体のヌクレアーゼ活性を調節する。
本明細書で使用されるとき、用語「標的核酸」は、RNAガイド中のスペーサーの全体又は一部に相補的なヌクレオチド配列を含む核酸を指す。一部の実施形態において、標的核酸は遺伝子を含む。一部の実施形態において、標的核酸は非コード領域(例えば、プロモーター)を含む。一部の実施形態において、標的核酸は一本鎖である。一部の実施形態において、標的核酸は二本鎖である。「転写活性部位」は、本明細書で使用されるとき、活発に転写されている核酸配列中の部位を指す。
本明細書で使用されるとき、用語「プロトスペーサー隣接モチーフ」又は「PAM」は、エフェクター及びRNAガイドを含む複合体が結合する標的配列に隣接するDNA配列を指す。一部の実施形態において、酵素活性のためにPAMが必要である。本明細書で使用されるとき、用語「隣接」は、複合体のRNAガイドが、PAMに直接隣接する標的配列に特異的に結合、相互作用、又は会合する場合を含む。このような場合、標的配列とPAMの間にヌクレオチドは存在しない。用語「隣接」はまた、標的化部分が結合する標的配列とPAMとの間に少数(例えば、1つ、2つ、3つ、4つ、又は5つ)のヌクレオチドが存在する場合を含む。本明細書で使用されるとき、用語「PAM配列を認識すること」は、標的核酸への、CRISPR関連タンパク質及びcrRNAを含む複合体の結合を指し、ここで、標的核酸はPAM配列に隣接する。
用語「活性化したCRISPRエフェクター複合体」、「活性化したCRISPR複合体」、及び「活性化した複合体」は、本明細書で使用されるとき、標的核酸を修飾することができるCRISPRエフェクター複合体を指す。一部の実施形態において、活性化したCRISPR複合体は、活性化したCRISPR複合体が標的核酸に結合した後、標的核酸を修飾することができる。一部の実施形態において、活性化したCRISPR複合体の標的核酸への結合により、コラテラル切断などの追加の切断イベントが生じる。
用語「切断イベント」は、本明細書で使用されるとき、DNA及び/又はRNAなどの核酸の切断を指す。一部の実施形態において、切断イベントは、本明細書で使用されるとき、本明細書に記載されるCRISPRシステムのヌクレアーゼによって作り出される標的核酸における切断を指す。一部の実施形態において、切断イベントは二本鎖DNA切断である。一部の実施形態において、切断イベントは一本鎖DNA切断である。一部の実施形態において、切断イベントは、コラテラル核酸の切断を指す。
用語「コラテラル核酸」は、本明細書で使用されるとき、活性化したCRISPR複合体によって非特異的に切断される核酸基質を指す。用語「コラテラルDNアーゼ活性」は、本明細書でCRISPRエフェクターに言及して使用されるとき、活性化したCRISPR複合体の非特異的DNアーゼ活性を指す。用語「コラテラルRNアーゼ活性」は、本明細書でCRISPRエフェクターに言及して使用されるとき、活性化したCRISPR複合体の非特異的RNアーゼ活性を指す。
用語「ドナー鋳型核酸」は、本明細書で使用されるとき、本明細書に記載されるCRISPRエフェクターが標的核酸を修飾した後、標的配列又は標的近位配列に、鋳型化された変更を行うために使用できる核酸分子を指す。一部の実施形態において、ドナー鋳型核酸は二本鎖核酸である。一部の実施形態において、ドナー鋳型核酸は一本鎖核酸である。一部の実施形態において、ドナー鋳型核酸は線状である。一部の実施形態において、ドナー鋳型核酸は環状(例えば、プラスミド)である。一部の実施形態において、ドナー鋳型核酸は外因性核酸分子である。一部の実施形態において、ドナー鋳型核酸は内因性核酸分子(例えば、染色体)である。
本明細書で使用される場合、「ポリヌクレオチド」、「ヌクレオチド」、「オリゴヌクレオチド」、及び「核酸」という用語は、DNA、RNA、それらの誘導体、又はそれらの組み合わせを含む核酸を指すために同義的に使用され得る。当業者に周知の方法を使用して、本発明による遺伝子発現構築物及び組換え細胞を構築することができる。これらの方法としては、インビトロ組換えDNA技術、合成技術、インビボ組換え技術、及びポリメラーゼ連鎖反応(PCR)技術が挙げられる。例えば、Maniatis et al.,1989,MOLECULAR CLONING:A LABORATORY MANUAL,Cold Spring Harbor Laboratory,New York;Ausubel et al.,1989,CURRENT PROTOCOLS IN MOLECULAR BIOLOGY,Greene Publishing Associates and Wiley Interscience,New York、及びPCR Protocols:A Guide to Methods and Applications (Innis et al.,1990,Academic Press,San Diego,Calif.)に記載される技術を参照されたい。
用語「遺伝子修飾」又は「遺伝子エンジニアリング」は、広義には、細胞のゲノム又は核酸の操作を指す。同様に、用語「遺伝子エンジニアリングされた」及び「エンジニアリングされた」は、操作されたゲノム又は核酸を含む細胞を指す。遺伝子修飾の方法としては、例えば、異種遺伝子発現、遺伝子又はプロモーターの挿入又は欠失、核酸変異、遺伝子発現又は不活性化の変化、酵素エンジニアリング、定向進化、知識ベースの設計、ランダム突然変異誘発法、遺伝子シャッフリング、及びコドン最適化が挙げられる。
用語「組換え」は、核酸、タンパク質、又は細胞が遺伝子修飾、エンジニアリング、又は組換えの産物であることを示す。一般に、用語「組換え」は、複数の供給源に由来する遺伝物質を含むか、又はそれらによってコードされる、核酸、タンパク質、又は細胞を指す。本明細書で使用されるとき、用語「組換え」という用語はまた、内因性核酸又はタンパク質の変異型を含む、変異核酸又はタンパク質を含む細胞を説明するために使用され得る。用語「組換え細胞」及び「組換え宿主」は、同義的に使用することができる。一部の実施形態において、組換え細胞は、本明細書に開示されるCRISPRエフェクターを含む。CRISPRエフェクターは組換え細胞における発現のためにコドン最適化することができる。一部の実施形態において、本明細書に開示される組換え細胞は、RNAガイドを更に含む。一部の実施形態において、本明細書に開示される組換え細胞のRNAガイドは、tracrRNAを含む。一部の実施形態において、本明細書に開示される組換え細胞は、モジュレーターRNAを含む。一部の実施形態において、組換え細胞は、大腸菌(E.coli)細胞などの原核細胞である。一部の実施形態において、組換え細胞は、ヒト細胞を含む哺乳動物細胞などの真核細胞である。
CLUST.091979の同定
この出願は、本明細書において「CLUST.091979」と呼ばれる新規タンパク質ファミリーの同定、エンジニアリング、及び使用に関する。図2に示すように、CLUST.091979のタンパク質は、RuvCドメイン(RuvC I、RuvC II、及びRuvC IIIと表示される)を含む。表5に示すように、CLUST.091979のエフェクターのサイズは、約700アミノ酸~約800アミノ酸の範囲である。したがって、以下に示すように、CLUST.091979のエフェクターは、当技術分野で知られているエフェクターよりも小さい。例えば、表1を参照されたい。
この出願は、本明細書において「CLUST.091979」と呼ばれる新規タンパク質ファミリーの同定、エンジニアリング、及び使用に関する。図2に示すように、CLUST.091979のタンパク質は、RuvCドメイン(RuvC I、RuvC II、及びRuvC IIIと表示される)を含む。表5に示すように、CLUST.091979のエフェクターのサイズは、約700アミノ酸~約800アミノ酸の範囲である。したがって、以下に示すように、CLUST.091979のエフェクターは、当技術分野で知られているエフェクターよりも小さい。例えば、表1を参照されたい。
CLUST.091979のエフェクターは、他の特定の機能との強力な共出現パターンを呈するタンパク質を検索及び同定するために、計算方法及びアルゴリズムを使用して同定された。特定の実施形態において、これらの計算的方法は、CRISPRアレイにごく近接して共出現するタンパク質を同定することに関するものであった。本明細書に開示される方法は、非コード及びタンパク質コードの両方の(例えば、細菌遺伝子座の非コード範囲にあるファージ配列の断片;又はCRISPR Cas1タンパク質)、他の特徴にごく近接した範囲内に天然に出現するタンパク質の同定においても有用である。本明細書に記載される方法及び計算は1つ以上の計算装置で実施されてもよいことが理解される。
ゲノム又はメタゲノムデータベースから一組のゲノム配列が入手された。データベースは、ショートリード、又はコンティグレベルデータ、又はアセンブルされたスキャフォールド、又は生物の完全ゲノム配列を含んだ。同様に、データベースは、原核生物、若しくは真核生物からのゲノム配列データを含んでもよく、又はメタゲノム環境試料からのデータを含んでもよい。データベースリポジトリの例としては、国立バイオテクノロジー情報センター(National Center for Biotechnology Information:NCBI)のRefSeq、NCBIのGenBank、NCBIの全ゲノムショットガン(Whole Genome Shotgun:WGS)、及びジョイントゲノム研究所(Joint Genome Institute:JGI)の統合微生物ゲノム(Integrated Microbial Genomes:IMG)が挙げられる。
一部の実施形態において、指定される最小長さのゲノム配列データの選択には、最小サイズ要件が課される。特定の例示的実施形態において、最小コンティグ長さは、100ヌクレオチド、500nt、1kb、1.5kb、2kb、3kb、4kb、5kb、10kb、20kb、40kb、又は50kbであってもよい。
一部の実施形態において、公知の又は予測されるタンパク質は、完全な又は選択された一組のゲノム配列データから抽出される。一部の実施形態において、公知の又は予測されるタンパク質は、ソースデータベースによって提供されるコード配列(CDS)アノテーションを抽出することから取られる。一部の実施形態において、予測タンパク質は、計算的方法を適用してヌクレオチド配列からタンパク質を同定することにより決定される。一部の実施形態では、GeneMarkスイートを使用してゲノム配列からタンパク質が予測される。一部の実施形態では、Prodigalを使用してゲノム配列からタンパク質が予測される。一部の実施形態では、同じ一組の配列データに対して複数のタンパク質予測アルゴリズムが用いられ、得られる一組のタンパク質から重複が排除されてもよい。
一部の実施形態において、CRISPRアレイはゲノム配列データから同定される。一部の実施形態では、PILER-CRを使用してCRISPRアレイが同定される。一部の実施形態では、CRISPR認識ツール(CRISPR Recognition Tool:CRT)を使用してCRISPRアレイが同定される。一部の実施形態において、CRISPRアレイは、最小限の回数(例えば2、3、又は4回)繰り返されるヌクレオチドモチーフを同定する発見的手法によって同定され、ここで繰り返されるモチーフの連続する出現間の間隔は、指定される長さ(例えば、50、100、又は150ヌクレオチド)を超えない。一部の実施形態では、同じ一組の配列データに対して複数のCRISPRアレイ同定ツールが用いられ、得られる一組のCRISPRアレイから重複が排除されてもよい。
一部の実施形態において、CRISPRアレイ(本明細書では「CRISPR近位タンパク質クラスター」と呼ばれる)にごく近接しているタンパク質が同定される。一部の実施形態において、近接性はヌクレオチド距離として定義され、20kb、15kb、又は5kb以内であってもよい。一部の実施形態において、近接性は、タンパク質とCRISPRアレイとの間にあるオープンリーディングフレーム(ORF)の数として定義され、特定の例示的距離は、10、5、4、3、2、1、又は0個のORFであり得る。CRISPRアレイとごく近接した範囲内にあると同定されたタンパク質は、次に相同タンパク質クラスターにまとめられる。一部の実施形態において、blastclustを使用してCRISPR近位タンパク質クラスターが形成される。特定の他の実施形態において、mmseqs2を使用してCRISPR近位タンパク質クラスターが形成される。
CRISPR近接タンパク質クラスターのメンバー間に強力な共出現パターンを確立するため、予め編成された完全な一組の公知の及び予測されるタンパク質に対してタンパク質クラスターの各メンバーのBLAST検索が実施されてもよい。一部の実施形態では、UBLAST又はmmseqs2を使用して類似のタンパク質が検索されてもよい。一部の実施形態では、ファミリー内のタンパク質の代表的なサブセットについてのみ検索が実施されてもよい。
一部の実施形態では、CRISPR近接タンパク質クラスターがメトリックによって順位付けされるか又はフィルタリングされることにより共出現が決定される。1つの例示的メトリックは、特定のE値閾値に至るまでのBLASTマッチの数に対するタンパク質クラスター内の要素の数の比である。一部の実施形態では、一定のE値閾値が使用されてもよい。他の実施形態では、E値閾値は、タンパク質クラスターの最も離れたメンバーによって決定されてもよい。一部の実施形態において、大域的な一組のタンパク質がクラスター化され、共出現メトリックは、含まれる1つ又は複数の大域的クラスターの要素の数に対するCRISPR近接タンパク質の要素の数の比である。
一部の実施形態において、手動でのレビュープロセスを用いることにより、クラスター中のタンパク質の天然に存在する遺伝子座構造に基づいてエンジニアリングされるシステムの潜在的機能性及び最小限の一組の成分が評価される。一部の実施形態において、手動でのレビューにはタンパク質クラスターの図解表現が役立ち得るとともに、これは、ペアワイズでの配列類似性、系統樹、供給源生物/環境、予測される機能性ドメイン、及び遺伝子座構造の図解描写を含む情報を含み得る。一部の実施形態において、遺伝子座構造の図解描写は、高い代表性を有する近隣タンパク質ファミリーをフィルタリングし得る。一部の実施形態において、代表性は、含んでいる1つ又は複数の大域的クラスターの1つ又は複数のサイズに対する関連する近隣タンパク質の数の比によって計算されてもよい。特定の例示的実施形態において、タンパク質クラスターの図解表現は、天然に存在する遺伝子座のCRISPRアレイ構造の描写を含み得る。一部の実施形態において、タンパク質クラスターの図解表現は、推定CRISPRアレイの長さに対する保存されたダイレクトリピートの数、又は推定CRISPRアレイの長さに対するユニークなスペーサー配列の数の描写を含み得る。一部の実施形態において、タンパク質クラスターの図解表現は、CRISPRアレイとの推定エフェクターの様々な共出現メトリックの描写を含み、新規CRISPR-Casシステムを予測し、及びその成分を同定し得る。
CLUST.091979のプール型スクリーニング
本明細書で同定された、エンジニアリングされたCLUST.091979 CRISPR-Casシステムの活性、メカニズム、及び機能パラメータを効率的に検証するために、実施例4で説明されるように、大腸菌(E.coli)におけるプール型スクリーニングアプローチを使用した。第一に、CRIST.091979CRISPR-Casシステムの保存タンパク質及び非コードエレメントの計算的同定から、DNA合成及び分子クローニングを用いて個別の成分を単一の人工発現ベクター(一実施形態ではpET-28a+骨格をベースとする)にアセンブルする。第2の実施形態では、エフェクター及び非コードエレメントをmRNA転写物に転写し、異なるリボソーム結合部位を用いて個々のエフェクターを翻訳する。
本明細書で同定された、エンジニアリングされたCLUST.091979 CRISPR-Casシステムの活性、メカニズム、及び機能パラメータを効率的に検証するために、実施例4で説明されるように、大腸菌(E.coli)におけるプール型スクリーニングアプローチを使用した。第一に、CRIST.091979CRISPR-Casシステムの保存タンパク質及び非コードエレメントの計算的同定から、DNA合成及び分子クローニングを用いて個別の成分を単一の人工発現ベクター(一実施形態ではpET-28a+骨格をベースとする)にアセンブルする。第2の実施形態では、エフェクター及び非コードエレメントをmRNA転写物に転写し、異なるリボソーム結合部位を用いて個々のエフェクターを翻訳する。
第二に、天然のcrRNA及びターゲティングスペーサーを、第2のプラスミドpACYC184を標的化する非天然スペーサーを含むプロセシングされていないcrRNAのライブラリに置き換える。このcrRNAライブラリをエフェクター及び非コードエレメントを含むベクター骨格(例えばpET-28a+)にクローニングし、その後、続いてこのライブラリをpACYC184プラスミド標的と共に大腸菌(E.coli)に形質転換する。結果的に、得られる各大腸菌(E.coli)細胞は、ただ1つのターゲティングアレイを含む。代替的実施形態では、非天然スペーサーを含むプロセシングされていないcrRNAのライブラリが、Baba et al.(2006)Mol.Syst.Biol.2:2006.0008;及びGerdes et al.(2003)J.Bacteriol.185(19):5673-84(これらの各々の内容全体は参照により本明細書に援用される)に記載されるものなどの資料から引用される大腸菌(E.coli)必須遺伝子を更に標的化する。この実施形態において、必須遺伝子機能を破壊する新規CRISPR-Casシステムの正の標的化された活性は、細胞死又は成長停止を生じさせる。一部の実施形態において、必須遺伝子ターゲティングスペーサーをpACYC184標的と組み合わせることができる。
第三に、抗生物質選択下で大腸菌(E.coli)を成長させる。一実施形態において、三重抗生物質選択:エンジニアリングされたCRISPRエフェクターシステムを含むpET-28a+ベクターの形質転換の成功を確認するためのカナマイシン、並びにpACYC184標的ベクターの同時形質転換の成功を確認するためのクロラムフェニコール及びテトラサイクリンが用いられる。pACYC184は通常、クロラムフェニコール及びテトラサイクリンに対する耐性を付与するため、抗生物質選択下では、このプラスミドを標的化する新規CRISPR-Casシステムの正の活性により、エフェクター、非コードエレメント、及びcrRNAライブラリの特異的活性エレメントを活性に発現する細胞が排除されることになる。典型的には、生存細胞の集団は、形質転換の12~14時間後に分析される。一部の実施形態において、生存細胞の分析は、形質転換後6~8時間、形質転換後8~12時間、形質転換後最大24時間、又は形質転換後24時間を超えて、行われる。早い時点と比較した後の時点における生存細胞集団を調べると、不活性crRNAと比較してシグナルの枯渇が生じる。
一部の実施形態において、二重抗生物質選択が用いられる。クロラムフェニコール又はテトラサイクリンのいずれかを抜き取って選択圧を除去すると、ターゲティング基質、配列特異性、及び効力に関する新規情報を得ることができる。例えば、選択された遺伝子又は選択されていない遺伝子におけるdsDNAの切断により、選択された遺伝子及び選択されていない遺伝子の両方の枯渇が観察される大腸菌(E.coli)におけるネガティブ選択が生じ得る。CRISPR-Casシステムが転写又は翻訳に干渉する場合(例えば、結合又は転写物の切断によって)、選択は、選択されていない耐性遺伝子というよりむしろ、選択された耐性遺伝子の標的に対してのみ観察される。
一部の実施形態では、カナマイシンのみを使用して、エンジニアリングされたCRISPR-Casシステムを含むpET-28a+ベクターの形質転換の成功が確認される。この実施形態は、成長の変化を観察するためにカナマイシン以外の更なる選択が必要ないため、大腸菌(E.coli)必須遺伝子を標的化するスペーサーを含むライブラリに好適である。この実施形態では、クロラムフェニコール及びテトラサイクリン依存性が取り除かれ、ライブラリ中のそれらの標的(存在する場合)が、ターゲティング基質、配列特異性、及び効力に関するネガティブ又はポジティブの更なる情報源を提供する。
pACYC184プラスミドは、CRISPR-Casシステムの活性に影響を及ぼし得る多様な一組の特徴及び配列を含むため、プール型スクリーンからの活性crRNAをpACYC184にマッピングすることにより、種々の活性機構及び機能パラメータを示唆するものであり得る活性パターンが提供される。このようにして、異種原核生物種における新規CRISPR-Casシステムの再構成に必要な特徴をより包括的に試験し、研究することができる。
本明細書に記載されるインビボプール型スクリーンの重要な利点としては、以下が挙げられる:
(1)汎用性-プラスミド設計により、複数のエフェクター及び/又は非コードエレメントを発現させることが可能になる;ライブラリクローニング戦略により、計算的に予測されたcrRNAの両方の転写方向の発現が実現する;
(2)活性機構及び機能パラメータの包括的試験により、核酸切断を含めた多様な干渉機構を評価し;転写、プラスミドDNA複製などの特徴の共出現;及びcrRNAライブラリについてのフランキング配列を調べて、4Nの複雑さ等価のPAMを確実に決定することができる;
(3)感度-pACYC184は低コピープラスミドであり、僅かな干渉率であっても、プラスミドによってコードされる抗生物質耐性を除去することができるため、CRISPR-Cas活性について高感度を実現する;及び
(4)効率-RNAシーケンシングについてより高い速度及びスループットを実現する最適化された分子生物学ステップは、タンパク質発現試料をスクリーンにおける生存細胞から直接採取することができる。
(1)汎用性-プラスミド設計により、複数のエフェクター及び/又は非コードエレメントを発現させることが可能になる;ライブラリクローニング戦略により、計算的に予測されたcrRNAの両方の転写方向の発現が実現する;
(2)活性機構及び機能パラメータの包括的試験により、核酸切断を含めた多様な干渉機構を評価し;転写、プラスミドDNA複製などの特徴の共出現;及びcrRNAライブラリについてのフランキング配列を調べて、4Nの複雑さ等価のPAMを確実に決定することができる;
(3)感度-pACYC184は低コピープラスミドであり、僅かな干渉率であっても、プラスミドによってコードされる抗生物質耐性を除去することができるため、CRISPR-Cas活性について高感度を実現する;及び
(4)効率-RNAシーケンシングについてより高い速度及びスループットを実現する最適化された分子生物学ステップは、タンパク質発現試料をスクリーンにおける生存細胞から直接採取することができる。
このインビボプール型スクリーンを用いてその作動可能なエレメント、機構及びパラメータ、並びにその内因性細胞環境の外部でエンジニアリングされたシステムにおいて活性であり再プログラム化されるその能力を評価することにより、本明細書に記載される新規CRIST.091979CRISPR-Casファミリーを評価した。
CRISPRエフェクターの活性及び修飾
一部の実施形態において、CRIST.091979のCRISPRエフェクター及びRNAガイドは、他の成分を含み得る二元複合体を形成する。二元複合体は、RNAガイド中のスペーサー配列に相補的な核酸基質(即ち、配列特異的基質又は標的核酸)への結合時に活性化される。一部の実施形態において、配列特異的基質は二本鎖DNAである。一部の実施形態において、配列特異的基質は一本鎖DNAである。一部の実施形態において、配列特異的基質は一本鎖RNAである。一部の実施形態において、配列特異的基質は二本鎖RNAである。一部の実施形態において、配列特異性は、RNAガイド(例えば、crRNA)中のスペーサー配列と標的基質の完全な一致を必要とする。他の実施形態において、配列特異性は、RNAガイド(例えば、crRNA)中のスペーサー配列と標的基質の部分的な(連続的又は非連続的な)一致を必要とする。
一部の実施形態において、CRIST.091979のCRISPRエフェクター及びRNAガイドは、他の成分を含み得る二元複合体を形成する。二元複合体は、RNAガイド中のスペーサー配列に相補的な核酸基質(即ち、配列特異的基質又は標的核酸)への結合時に活性化される。一部の実施形態において、配列特異的基質は二本鎖DNAである。一部の実施形態において、配列特異的基質は一本鎖DNAである。一部の実施形態において、配列特異的基質は一本鎖RNAである。一部の実施形態において、配列特異的基質は二本鎖RNAである。一部の実施形態において、配列特異性は、RNAガイド(例えば、crRNA)中のスペーサー配列と標的基質の完全な一致を必要とする。他の実施形態において、配列特異性は、RNAガイド(例えば、crRNA)中のスペーサー配列と標的基質の部分的な(連続的又は非連続的な)一致を必要とする。
一部の実施形態において、本発明のCRISPRエフェクターは酵素活性、例えば、ヌクレアーゼ活性を広範なpH条件にわたり有する。一部の実施形態において、ヌクレアーゼは酵素活性、例えば、ヌクレアーゼ活性を約3.0~約12.0のpHにおいて有する。一部の実施形態において、CRISPRエフェクターは酵素活性を約4.0~約10.5のpHにおいて有する。一部の実施形態において、CRISPRエフェクターは酵素活性を約5.5~約8.5のpHにおいて有する。一部の実施形態において、CRISPRエフェクターは酵素活性を約6.0~約8.0のpHにおいて有する。一部の実施形態において、CRISPRエフェクターは酵素活性を約7.0のpHにおいて有する。
一部の実施形態において、本発明のCRISPRエフェクターは酵素活性、例えば、ヌクレアーゼ活性を約10℃~約100℃の温度範囲において有する。一部の実施形態において、本発明のCRISPRエフェクターは酵素活性を約20℃~約90℃の温度範囲において有する。一部の実施形態において、本発明のCRISPRエフェクターは酵素活性を約20℃~約25℃の温度において又は約37℃の温度において有する。
一部の実施形態において、二元複合体は標的基質への結合時に活性化した状態になる。一部の実施形態において、活性化した複合体は、「複数回の代謝回転」活性を呈し、従って標的基質への作用時(例えば、それの切断時)、活性化した複合体は活性化した状態のままである。一部の実施形態において、活性化した二元複合体は「単回の代謝回転」活性を呈し、従って標的基質への作用時、二元複合体は不活性状態に戻る。一部の実施形態において、活性化した二元複合体は非特異的な(即ち、「コラテラル」)切断活性を呈し、従って複合体は非標的核酸を切断する。一部の実施形態において、非標的核酸は、DNA分子(例えば、一本鎖又は二本鎖DNA)である。一部の実施形態において、非標的核酸は、RNA分子(例えば、一本鎖又は二本鎖RNA)である。
本発明のCRISPRエフェクターが標的核酸(例えば、ゲノムDNA)中で二本鎖分解又は一本鎖分解を誘導する一部の実施形態において、二本鎖分解は、相同組換え(HDR)、非相同末端結合(NHEJ)、又は代替非相同末端結合(A-NHEJ)を含む細胞内因性DNA修復経路を刺激し得る。NHEJは相同性鋳型を必要とせずに、切断された標的核酸を修復し得る。これにより、標的遺伝子座における1つ以上のヌクレオチドの欠失又は挿入が生じ得る。HDRは、ドナーDNAなどの相同性鋳型を用いて起こり得る。相同性鋳型は、標的核酸切断部位をフランキングする配列と相同の配列を含み得る。一部の例において、HDRは外因性ポリヌクレオチド配列を切断標的遺伝子座中に挿入し得る。NHEJ及び/又はHDRに起因する標的DNAの修飾は、例えば、突然変異、欠失、変更、組込み、遺伝子修正、遺伝子置換、遺伝子タグ付け、トランス遺伝子ノックイン、遺伝子破壊、及び/又は遺伝子ノックアウトをもたらし得る。
一部の実施形態において、本明細書に記載されるCRISPRエフェクターは、Hisタグ、GSTタグ、FLAGタグ、又はmycタグを含めた1つ以上のペプチドタグに融合することができる。一部の実施形態において、本明細書に記載されるCRISPRエフェクターは、蛍光タンパク質(例えば、緑色蛍光タンパク質又は黄色蛍光タンパク質)など、検出可能部分に融合することができる。一部の実施形態において、本開示のCRISPRエフェクター及び/又はアクセサリータンパク質は、タンパク質を組織、細胞、又は細胞の領域に侵入又は局在化させるペプチド又は非ペプチド部分に融合される。例えば、本開示のCRISPRエフェクターは、SV40(シミアンウイルス40)NLS、c-Myc NLS、又は他の好適な単節型NLSなどの核局在化配列(NLS)を含んでもよい。NLSは、CRISPRエフェクターのN末端及び/又はC末端に融合されてもよく、且つ単独で融合されても(即ち、単一のNLS)、又はコンカテマー化されてもよい(例えば、2、3、4個等のNLSの鎖)。
一部の実施形態において、少なくとも1つの核外輸送シグナル(NES)が、CRISPRエフェクターをコードする核酸配列に取り付けられている。一部の実施形態において、C末端及び/又はN末端NLS又はNESは、真核細胞、例えばヒト細胞における最適な発現及び核ターゲティングのために取り付けられる。
CRISPRエフェクターにタグが融合される実施形態において、かかるタグは、例えば、液体クロマトグラフィー又は固定化したアフィニティー若しくはイオン交換試薬を利用するビーズ分離による、CRISPRエフェクターの親和性ベース又は電荷ベースの精製を促進し得る。非限定的な例として、本開示の組換えCRISPRエフェクターはポリヒスチジン(His)タグを含み、精製のため、固定化された金属イオンを含むクロマトグラフィーカラムにロードされる(例えば、樹脂上に固定化されたキレートリガンドによってキレートされたZn2+、Ni2+、Cu2+イオン、この樹脂は、個々に調製された樹脂又は市販の樹脂若しくはGE Healthcare Life Sciences、Marlborough,Massachusettsによって商品化されているHisTrap FFカラムなどの既製のカラムであってもよい。ローディングステップの後、カラムは任意選択で、例えば1つ以上の好適な緩衝溶液を使用してリンスされ、次にHisタグが付加されたタンパク質が好適な溶出緩衝液を使用して溶出される。それに代えて又は加えて、本開示の組換えCRISPRエフェクターがFLAGタグを利用する場合、かかるタンパク質は、本業界で公知の免疫沈降法を用いて精製されてもよい。タグが付加された本開示のCRISPRエフェクター又はアクセサリータンパク質について他の好適な精製方法が当業者には明らかであろう。
本明細書に記載されるタンパク質(例えば、CRISPRエフェクター又はアクセサリータンパク質)は、核酸分子又はポリペプチドのいずれとしても送達又は使用することができる。核酸分子を使用する場合、CRISPRエフェクターをコードする核酸分子をコドン最適化することができる。核酸は、任意の目的の生物、詳細にはヒト細胞又は細菌での使用にコドン最適化することができる。例えば、核酸は、マウス、ラット、ウサギ、イヌ、家畜、又は非ヒト霊長類を含めた任意の非ヒト真核生物向けにコドン最適化することができる。コドン使用表が、例えば、www.kazusa.orjp/codon/で利用可能な「コドン使用データベース(Codon Usage Database)」において容易に利用可能であり、これらの表を幾つもの方法で適合させることができる。Nakamura et al.Nucl.Acids Res.28:292(2000)(全体として参照により本明細書に援用される)を参照のこと。特定の配列を特定の宿主細胞での発現にコドン最適化するためのコンピュータアルゴリズムもまた、Gene Forge(Aptagen;Jacobus,PA)など、利用可能である。
一部の例では、真核生物(例えば、ヒト、又は他の哺乳類細胞)細胞で発現させるためのCRISPRエフェクターをコードする本開示の核酸は、1つ以上のイントロン、即ち、第1の端部(例えば、5’末端)にスプライスドナー配列を含み、且つ第2の端部(例えば、3’末端)にスプライスアクセプター配列を含む1つ以上の非コード配列を含む。本開示の様々な実施形態において、限定なしに、シミアンウイルス40(SV40)イントロン、β-グロビンイントロン、及び合成イントロンを含め、任意の好適なスプライスドナー/スプライスアクセプターを使用することができる。それに代えて又は加えて、CRISPRエフェクター又はアクセサリータンパク質をコードする本開示の核酸は、DNAコード配列の3’末端に、ポリアデニル化(ポリA)シグナルなどの転写終結シグナルを含み得る。一部の例では、ポリAシグナルは、SV40イントロンなどのイントロンにごく近接して、又はそれに隣接して位置する。
非活性化/不活性化CRISPRエフェクター
本明細書に記載されるCRISPRエフェクターが、減少したヌクレアーゼ活性、例えば、野生型CRISPRエフェクターと比較したとき少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも97%、又は100%のヌクレアーゼ不活性化となるようにCRISPR酵素を修飾することができる。ヌクレアーゼ活性は、当技術分野で周知の幾つかの方法、例えば、タンパク質のヌクレアーゼドメインへの突然変異の導入によって減少させることができる。一部の実施形態において、ヌクレアーゼ活性の触媒残基が同定され、それらのアミノ酸残基を異なるアミノ酸残基(例えば、グリシン又はアラニン)に置換することによりヌクレアーゼ活性を減少させてもよい。
本明細書に記載されるCRISPRエフェクターが、減少したヌクレアーゼ活性、例えば、野生型CRISPRエフェクターと比較したとき少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも97%、又は100%のヌクレアーゼ不活性化となるようにCRISPR酵素を修飾することができる。ヌクレアーゼ活性は、当技術分野で周知の幾つかの方法、例えば、タンパク質のヌクレアーゼドメインへの突然変異の導入によって減少させることができる。一部の実施形態において、ヌクレアーゼ活性の触媒残基が同定され、それらのアミノ酸残基を異なるアミノ酸残基(例えば、グリシン又はアラニン)に置換することによりヌクレアーゼ活性を減少させてもよい。
不活性化されたCRISPRエフェクターは、1つ以上の機能的ドメインを含むか、又はそれと関連づけられ得る(例えば、融合タンパク質、リンカーペプチド、「GS」リンカーなどを介して)。こうした機能性ドメインは様々な活性、例えば、メチラーゼ活性、デメチラーゼ活性、転写活性化活性、転写抑制活性、転写放出因子活性、ヒストン修飾活性、RNA切断活性、DNA切断活性、核酸結合活性、及びスイッチ活性(例えば、光誘導性)を有することができる。一部の実施形態において、機能性ドメインは、クルッペル関連ボックス(KRAB)、VP64、VP16、Fok1、P65、HSF1、MyoD1、及びビオチン-APEXである。
不活性化されたCRISPRエフェクター上に1つ以上の機能性ドメインを位置させることは、その機能性ドメインが帰属する機能的効果による影響を標的に及ぼすのに正しい空間上の向きとなることを可能にする。例えば、機能性ドメインが転写活性化因子(例えば、VP16、VP64、又はp65)である場合、その転写活性化因子は、それが標的の転写に影響を及ぼすことが可能になる空間上の向きに置かれる。同様に、転写リプレッサーが標的の転写に影響を及ぼすように位置し、及びヌクレアーゼ(例えば、Fok1)が標的を切断又は部分的に切断するように位置する。一部の実施形態において、機能性ドメインはCRISPRエフェクターのN末端に位置する。一部の実施形態において、機能性ドメインはCRISPRエフェクターのC末端に位置する。一部の実施形態において、不活性化されたCRISPRエフェクターは、N末端に第1の機能性ドメイン及びC末端に第2の機能性ドメインを含むように修飾される。
スプリット酵素
本開示はまた、本明細書に記載されるCRISPRエフェクターのスプリットバージョンも提供する。スプリットバージョンのCRISPRエフェクターは送達に有利であり得る。一部の実施形態において、CRISPRエフェクターは酵素の2つの部分に分割され、それらが一緒になって実質的に機能性のCRISPRエフェクターを含む。
本開示はまた、本明細書に記載されるCRISPRエフェクターのスプリットバージョンも提供する。スプリットバージョンのCRISPRエフェクターは送達に有利であり得る。一部の実施形態において、CRISPRエフェクターは酵素の2つの部分に分割され、それらが一緒になって実質的に機能性のCRISPRエフェクターを含む。
分割は、1つ又は複数の触媒ドメインが影響を受けないような方法で行われ得る。CRISPRエフェクターはヌクレアーゼとして機能してもよく、又は本質的に(例えば、その触媒ドメインにある1つ又は複数の突然変異に起因して)触媒活性がごく僅かしかない又は全くないRNA結合タンパク質である不活性化された酵素であってもよい。
一部の実施形態では、ヌクレアーゼローブ及びα-ヘリックスローブが別個のポリペプチドとして発現する。これらのローブはそれ自体には相互作用を及ぼさないが、RNAガイドがそれらを複合体へと動員し、その複合体が完全長CRISPRエフェクターの活性を再現し、部位特異的DNA切断を触媒する。修飾されたRNAガイドを使用すると、二量化が妨げられることによりスプリット酵素活性が無効になり、誘導性の二量化システムの開発が可能となる。スプリット酵素については、例えば、Wright et al.“Rational design of a split-Cas9 enzyme complex,”Proc.Nat’l.Acad.Sci.,112.10(2015):2984-2989(全体として参照により本明細書に援用される)に記載されている。
一部の実施形態において、スプリット酵素は、例えばラパマイシン感受性二量化ドメインを利用することにより、二量化パートナーに融合されてもよい。これにより、CRISPRエフェクター活性を時間的に制御するための化学誘導性CRISPRエフェクターの作成が可能になる。このようにして2つの断片に分割されていることによりCRISPRエフェクターを化学誘導性にすることができ、CRISPRエフェクターの制御された再アセンブルにはラパマイシン感受性二量化ドメインを使用することができる。
分割点は、典型的にはインシリコで設計され、コンストラクトにクローニングされる。この過程でスプリット酵素に突然変異が導入されてもよく、非機能性ドメインが除去されてもよい。一部の実施形態において、スプリットCRISPRエフェクターの2つの部分又は断片(即ち、N末端及びC末端断片)は、例えば野生型CRISPRエフェクターの配列の少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%、又は少なくとも99%を含む完全なCRISPRエフェクターを形成することができる。
自己活性化型又は不活性化型酵素
本明細書に記載されるCRISPRエフェクターは、自己活性化型又は自己不活性化型であるように設計されてもよい。一部の実施形態において、CRISPRエフェクターは自己不活性化型である。例えば、CRISPRエフェクターをコードするコンストラクトに標的配列を導入することができる。従ってCRISPRエフェクターが標的配列を切断するとともに、それによって酵素をコードするコンストラクトがその発現を自己不活性化し得る。自己不活性化CRISPRシステムの構築方法については、例えば、Epstein et al.,“Engineering a Self-Inactivating CRISPR System for AAV Vectors,”Mol.Ther.,24(2016):S50(全体として参照により本明細書に援用される)に記載されている。
本明細書に記載されるCRISPRエフェクターは、自己活性化型又は自己不活性化型であるように設計されてもよい。一部の実施形態において、CRISPRエフェクターは自己不活性化型である。例えば、CRISPRエフェクターをコードするコンストラクトに標的配列を導入することができる。従ってCRISPRエフェクターが標的配列を切断するとともに、それによって酵素をコードするコンストラクトがその発現を自己不活性化し得る。自己不活性化CRISPRシステムの構築方法については、例えば、Epstein et al.,“Engineering a Self-Inactivating CRISPR System for AAV Vectors,”Mol.Ther.,24(2016):S50(全体として参照により本明細書に援用される)に記載されている。
一部の他の実施形態では、弱いプロモーター(例えば、7SKプロモーター)の制御下で発現する更なるRNAガイドが、CRISPRエフェクターをコードする核酸配列を標的化して、その発現を(例えば、核酸の転写及び/又は翻訳を妨げることにより)妨げ及び/又は阻止することができる。CRISPRエフェクターと、RNAガイドと、CRISPRエフェクターをコードする核酸を標的化するRNAガイドとを発現するベクターを細胞にトランスフェクトすると、CRISPRエフェクターをコードする核酸の効率的な破壊につながり、CRISPRエフェクターレベルを低下させることができ、従ってゲノム編集活性を制限することができる。
一部の実施形態において、CRISPRエフェクターのゲノム編集活性は、哺乳類細胞における内因性RNAシグネチャ(例えば、miRNA)を通じて調節することができる。CRISPRエフェクターをコードするmRNAの5’-UTRにmiRNA相補配列を用いることにより、CRISPRエフェクタースイッチを作ることができる。このスイッチは、標的細胞中のmiRNAに選択的且つ効率的に応答する。従って、このスイッチは、異種細胞集団内で内因性miRNA活性を感知することによりゲノム編集を差次的に制御し得る。従って、このスイッチシステムは、細胞内miRNA情報に基づく細胞型選択的なゲノム編集及び細胞エンジニアリングのフレームワークを提供し得る(Hirosawa et al.“Cell-type-specific genome editing with a microRNA-responsive CRISPR-Cas9 switch,”Nucl.Acids Res.,2017 Jul 27;45(13):e118)。
誘導性CRISPRエフェクター
CRISPRエフェクターは、誘導性、例えば、光誘導性又は化学誘導性であってもよい。この機構により、CRISPR酵素中の機能性ドメインを活性化させることが可能になる。光誘導能は、当該技術分野において公知の様々な方法により、例えば、スプリットCRISPRエフェクターにおいてCRY2PHR/CIBN対が用いられる融合複合体を設計することにより実現し得る(例えば、Konermann et al.“Optical control of mammalian endogenous transcription and epigenetic states,”Nature,500.7463(2013):472を参照のこと)。化学誘導能は、例えば、スプリットCRISPRエフェクターにおいてFKBP/FRB(FK506結合タンパク質/FKBPラパマイシン結合ドメイン)対が用いられる融合複合体を設計することにより実現し得る。ラパマイシンは融合複合体の形成に必要であり、従ってCRISPRエフェクターを活性化する(例えば、Zetsche et al.“A split-Cas9 architecture for inducible genome editing and transcription modulation,”Nature Biotech.,33.2(2015):139-142を参照のこと)。
CRISPRエフェクターは、誘導性、例えば、光誘導性又は化学誘導性であってもよい。この機構により、CRISPR酵素中の機能性ドメインを活性化させることが可能になる。光誘導能は、当該技術分野において公知の様々な方法により、例えば、スプリットCRISPRエフェクターにおいてCRY2PHR/CIBN対が用いられる融合複合体を設計することにより実現し得る(例えば、Konermann et al.“Optical control of mammalian endogenous transcription and epigenetic states,”Nature,500.7463(2013):472を参照のこと)。化学誘導能は、例えば、スプリットCRISPRエフェクターにおいてFKBP/FRB(FK506結合タンパク質/FKBPラパマイシン結合ドメイン)対が用いられる融合複合体を設計することにより実現し得る。ラパマイシンは融合複合体の形成に必要であり、従ってCRISPRエフェクターを活性化する(例えば、Zetsche et al.“A split-Cas9 architecture for inducible genome editing and transcription modulation,”Nature Biotech.,33.2(2015):139-142を参照のこと)。
更に、CRISPRエフェクターの発現は、誘導性プロモーター、例えば、テトラサイクリン又はドキシサイクリン制御下での転写活性化(Tet-On及びTet-Off発現システム)、ホルモン誘導性遺伝子発現システム(例えば、エクジソン誘導性遺伝子発現システム)、及びアラビノース誘導性遺伝子発現システムによって調節することができる。RNAとして送達される場合、RNAターゲティングエフェクタータンパク質の発現は、小分子様テトラサイクリンを感知することのできるリボスイッチによって調節されてもよい(例えば、Goldfless et al.“Direct and specific chemical control of eukaryotic translation with a synthetic RNA-protein interaction,”Nucl.Acids Res.,40.9(2012):e64-e64を参照のこと)。
誘導性CRISPRエフェクター及び誘導性CRISPRシステムの様々な実施形態が、例えば、米国特許第8871445号明細書、米国特許出願公開第20160208243号明細書、及び国際公開第2016205764号パンフレット(これらの各々は、本明細書において全体として参照により援用される)に記載されている。
機能性突然変異
本明細書に記載されるとおりのCRISPRエフェクターに様々な突然変異又は修飾を導入して特異性及び/又はロバスト性を改善することができる。一部の実施形態において、プロトスペーサー隣接モチーフ(PAM)を認識するアミノ酸残基が同定される。本明細書に記載されるCRISPRエフェクターは、例えば、PAMを認識するアミノ酸残基を他のアミノ酸残基と置換することによって異なるPAMを認識するように更に修飾することができる。一部の実施形態において、CRISPRエフェクターは、例えば、5’-NTTN-3’、5’-NTTR-3’、5’-RTTR-3’、5’-TNNT-3’、5’-TNRT-3’、5’-TSRT-3’、5’-TGRT-3’、5’-TNRY-3’、5’-TTNR-3’、5’-TTYR-3’、5’-TTTR-3’、5’-TTCV-3’、5’-DTYR-3’、5’-WTTR-3’、5’-NNR-3’、5’-NYR-3’、5’-YYR-3’、5’-TYR-3’、5’-TTN-3’、5’-TTR-3’、5’-CNT-3’、5’-NGG-3’、5’-BGG-3’、又は5’-R-3’を認識し得、ここで、「N」は任意のヌクレオチドであり、「B」はC又はG又はTであり、「D」はA又はG又はTであり、「R」はA又はGであり、「S」はG又はCであり、「V」はA又はC又はGであり、「W」はA又はTであり、「Y」はC又はTである。
本明細書に記載されるとおりのCRISPRエフェクターに様々な突然変異又は修飾を導入して特異性及び/又はロバスト性を改善することができる。一部の実施形態において、プロトスペーサー隣接モチーフ(PAM)を認識するアミノ酸残基が同定される。本明細書に記載されるCRISPRエフェクターは、例えば、PAMを認識するアミノ酸残基を他のアミノ酸残基と置換することによって異なるPAMを認識するように更に修飾することができる。一部の実施形態において、CRISPRエフェクターは、例えば、5’-NTTN-3’、5’-NTTR-3’、5’-RTTR-3’、5’-TNNT-3’、5’-TNRT-3’、5’-TSRT-3’、5’-TGRT-3’、5’-TNRY-3’、5’-TTNR-3’、5’-TTYR-3’、5’-TTTR-3’、5’-TTCV-3’、5’-DTYR-3’、5’-WTTR-3’、5’-NNR-3’、5’-NYR-3’、5’-YYR-3’、5’-TYR-3’、5’-TTN-3’、5’-TTR-3’、5’-CNT-3’、5’-NGG-3’、5’-BGG-3’、又は5’-R-3’を認識し得、ここで、「N」は任意のヌクレオチドであり、「B」はC又はG又はTであり、「D」はA又はG又はTであり、「R」はA又はGであり、「S」はG又はCであり、「V」はA又はC又はGであり、「W」はA又はTであり、「Y」はC又はTである。
一部の実施形態において、本明細書に記載されるCRISPRエフェクターは、1つ以上のアミノ酸残基を突然変異させることにより、1つ以上の機能活性が改変され得る。例えば、一部の実施形態において、CRISPRエフェクターは、1つ以上のアミノ酸残基を突然変異させることにより、そのヘリカーゼ活性が改変される。一部の実施形態において、CRISPRエフェクターは、1つ以上のアミノ酸残基を突然変異させることにより、そのヌクレアーゼ活性(例えば、エンドヌクレアーゼ活性又はエキソヌクレアーゼ活性)が改変される。一部の実施形態において、CRISPRエフェクターは、1つ以上のアミノ酸残基を突然変異させることにより、RNAガイドと機能的に関連するその能力が改変される。一部の実施形態において、CRISPRエフェクターは、1つ以上のアミノ酸残基を突然変異させることにより、標的核酸と機能的に関連するその能力が改変される。
一部の実施形態において、本明細書に記載されるCRISPRエフェクターは標的核酸分子の切断能を有する。一部の実施形態において、CRISPRエフェクターは標的核酸分子の両方の鎖を切断する。しかしながら、一部の実施形態において、CRISPRエフェクターは、1つ以上のアミノ酸残基を突然変異させることにより、その切断活性が改変される。例えば、一部の実施形態において、CRISPRエフェクターは、CRISPRエフェクターが標的核酸を切断する能力を増加させる1つ以上の突然変異を含んでもよい。別の例において、一部の実施形態において、CRISPRエフェクターは、酵素が標的核酸の切断能を有しないものとなる1つ以上の突然変異を含んでもよい。他の実施形態において、CRISPRエフェクターは、この酵素が標的核酸の鎖の切断能(即ち、ニッカーゼ活性)を有するものとなる1つ以上の突然変異を含んでもよい。一部の実施形態において、CRISPRエフェクターは、RNAガイドがハイブリダイズする鎖に相補的な標的核酸の鎖を切断する能力を有する。一部の実施形態において、CRISPRエフェクターは、RNAガイドがハイブリダイズする標的核酸の鎖を切断する能力を有する。
一部の実施形態において、本明細書に開示されるCRISPRエフェクターの1つ以上の残基は、アルギニン部分に変異している。一部の実施形態において、本明細書に開示されるCRISPRエフェクターの1つ以上の残基は、グリシン部分に変異している。一部の実施形態において、本明細書に開示されるCRISPRエフェクターの1つ以上の残基は、本明細書に開示されるCRISPRエフェクターの系統的アラインメントのコンセンサス残基に基づいて変異する。
一部の実施形態において、本明細書に記載されるCRISPRエフェクターは、1つ以上の所望の機能活性(例えば、ヌクレアーゼ活性及び機能的にRNAガイドと相互作用する能力)を保持しつつ酵素のサイズを縮小させるため、1つ以上のアミノ酸残基に欠失を含むようにエンジニアリングされてもよい。このトランケート型CRISPRエフェクターは有利には、負荷に制限のある送達システムとの組み合わせで用いられてもよい。
一態様において、本開示は、図2に示されるドメイン構成を維持しつつ、本明細書に記載される核酸配列(nucleic sequences)と少なくとも10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、又は99%同一の核酸配列を提供する。別の態様において、本開示はまた、図2に示されるドメイン構成を維持しつつ、本明細書に記載されるアミノ酸配列と少なくとも10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、又は99%同一のアミノ酸配列も提供する。
一部の実施形態において、核酸配列は、本明細書に記載される配列と同じである一部分(例えば、少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、30、40、50、60、70、80、90、又は100ヌクレオチド、例えば、連続又は非連続ヌクレオチド)を少なくとも有する。一部の実施形態において、核酸配列は、本明細書に記載される配列と異なる一部分(例えば、少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、30、40、50、60、70、80、90、又は100ヌクレオチド、例えば、連続又は非連続ヌクレオチド)を少なくとも有する。
一部の実施形態において、アミノ酸配列は、本明細書に記載される配列と同じである一部分(例えば、少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、30、40、50、60、70、80、90、又は100アミノ酸残基、例えば、連続又は非連続アミノ酸残基)を少なくとも有する。一部の実施形態において、アミノ酸配列は、本明細書に記載される配列と異なる一部分(例えば、少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、30、40、50、60、70、80、90、又は100アミノ酸残基、例えば、連続又は非連続アミノ酸残基)を少なくとも有する。
2つのアミノ酸配列、又は2つの核酸配列のパーセント同一性を決定するには、それらの配列が最適な比較を目的としてアラインメントされる(例えば、最適なアラインメントとなるように第1及び第2のアミノ酸又は核酸配列の一方又は両方にギャップが導入されてもよく、及び比較を目的として非相同配列が無視されてもよい)。一般に、比較を目的としてアラインメントされる参照配列の長さは、参照配列の長さの少なくとも80%でなければならず、及び一部の実施形態では、参照配列の長さの少なくとも90%、95%、又は100%である。次に、対応するアミノ酸位置又はヌクレオチド位置にあるアミノ酸残基又はヌクレオチドが比較される。第1の配列におけるある位置が第2の配列における対応する位置と同じアミノ酸残基又はヌクレオチドによって占有されているとき、次にはそれらの分子は当該の位置において同一である。2つの配列間のパーセント同一性は、2つの配列を最適にアラインメントするために導入する必要があるギャップの数、及び各ギャップの長さを考慮に入れた、それらの配列によって共有される同一の位置の数の関数である。本開示の目的上、配列の比較及び2つの配列間におけるパーセント同一性の決定は、ギャップペナルティーを12、ギャップ伸長ペナルティーを4、及sびフレームシフトギャップペナルティーを5としたBlossum 62スコアリング行列を用いて達成することができる。
一部の実施形態において、ヌクレアーゼはPX1X2X3X4F(配列番号216)として記載される配列を含み、ここで、X1はL又はM又はI又はC又はFであり、X2はY又はW又はFであり、X3はK又はT又はC又はR又はW又はY又はH又はVであり、X4はI又はL又はMである。一部の実施形態において、配列番号216に記載の配列はN末端配列である。一部の実施形態において、ヌクレアーゼはRX1X2X3L(配列番号217)として記載される配列を含み、ここで、X1はI又はL又はM又はY又はT又はFであり、X2はR又はQ又はK又はE又はS又はTであり、X3はL又はI又はT又はC又はM又はKである。一部の実施形態において、ヌクレアーゼはNX1YX2(配列番号218)として記載される配列を含み、ここで、X1はI又はL又はFであり、X2はK又はR又はV又はEである。一部の実施形態において、ヌクレアーゼはKX1X2X3FAX4X5KD(配列番号219)として記載される配列を含み、ここで、X1はT又はI又はN又はA又はS又はF又はVであり、X2はI又はV又はL又はSであり、X3はH又はS又はG又はRであり、X4はD又はS又はEであり、X5はI又はV又はM又はT又はNである。本明細書に記載されるシステムのいずれかの一部の実施形態において、配列番号219の配列はC末端配列である。一部の実施形態において、ヌクレアーゼはLX1NX2(配列番号220)として記載される配列を含み、ここで、X1はG又はS又はC又はTであり、X2はN又はY又はK又はSである。本明細書に記載されるシステムのいずれかの一部の実施形態において、配列番号220の配列はC末端配列である。一部の実施形態において、ヌクレアーゼはPX1X2X3X4SQX5DS(配列番号221)として記載される配列を含み、ここで、X1はS又はP又はAであり、X2はY又はS又はA又はP又はE又はY又はQ又はNであり、X3はF又はY又はHであり、X4はT又はSであり、X5はM又はT又はIである。本明細書に記載されるシステムのいずれかの一部の実施形態において、配列番号221の配列はC末端配列である。一部の実施形態において、ヌクレアーゼはKX1X2VRX3X4QEX5H(配列番号222)として記載される配列を含み、ここで、X1はN又はK又はW又はR又はE又はT又はYであり、X2はM又はR又はL又はS又はK又はV又はE又はT又はI又はDであり、X3はL又はR又はH又はP又はT又はK又はPのQ又はS又はAであり、X4はG又はQ又はN又はR又はK又はE又はI又はT又はS又はCであり、X5はR又はW又はY又はK又はT又はF又はS又はQである。本明細書に記載されるシステムのいずれかの一部の実施形態において、配列番号222の配列はC末端配列である。一部の実施形態において、ヌクレアーゼはX1NGX2X3X4DX5NX6X7X8N(配列番号223)として記載される配列を含み、ここで、X1はI又はK又はV又はLであり、X2はL又はMであり、X3はN又はH又はPであり、X4はA又はS又はCであり、X5はV又はY又はI又はF又はT又はNであり、X6はA又はSであり、X7はS又はA又はPであり、X8はM又はC又はL又はR又はN又はS又はK又はLである。本明細書に記載されるシステムのいずれかの一部の実施形態において、配列番号223の配列はC末端配列である。
RNAガイド及びRNAガイド修飾
一部の実施形態において、本明細書に記載されるRNAガイドは、ウラシル(U)を含む。一部の実施形態において、本明細書に記載されるRNAガイドは、チミン(T)を含む。一部の実施形態において、本明細書に記載されるRNAガイドのダイレクトリピート配列は、ウラシル(U)を含む。一部の実施形態において、本明細書に記載されるRNAガイドのダイレクトリピート配列は、チミン(T)を含む。一部の実施形態において、表2又は表8によるダイレクトリピート配列は、表2又は表8の対応する配列においてチミンとして示される1つ以上の場所に、ウラシルを含む配列を含む。
一部の実施形態において、本明細書に記載されるRNAガイドは、ウラシル(U)を含む。一部の実施形態において、本明細書に記載されるRNAガイドは、チミン(T)を含む。一部の実施形態において、本明細書に記載されるRNAガイドのダイレクトリピート配列は、ウラシル(U)を含む。一部の実施形態において、本明細書に記載されるRNAガイドのダイレクトリピート配列は、チミン(T)を含む。一部の実施形態において、表2又は表8によるダイレクトリピート配列は、表2又は表8の対応する配列においてチミンとして示される1つ以上の場所に、ウラシルを含む配列を含む。
一部の実施形態において、ダイレクトリピートは、内因性CRISPRアレイにおいて繰り返される配列の1つのコピーのみを含む。一部の実施形態において、ダイレクトリピートは、内因性CRISPRアレイに見られる1つ以上のスペーサー配列に隣接する(例えば、フランキング)完全長配列である。一部の実施形態において、ダイレクトリピートは、内因性CRISPRアレイに見られる1つ以上のスペーサー配列に隣接する(例えば、フランキング)完全長配列の一部(例えば、プロセシングされた部分)である。
スペーサー及びダイレクトリピート
RNAガイドのスペーサー長さは約15~55ヌクレオチドの範囲であってもよい。RNAガイドのスペーサー長さは約20~45ヌクレオチドの範囲であってもよい。一部の実施形態において、RNAガイドのスペーサー長さは、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、又は少なくとも22ヌクレオチドである。一部の実施形態において、スペーサー長さは、15~17ヌクレオチド、15~23ヌクレオチド、16~22ヌクレオチド、17~20ヌクレオチド、20~24ヌクレオチド(例えば、20、21、22、23、又は24ヌクレオチド)、23~25ヌクレオチド(例えば、23、24、又は25ヌクレオチド)、24~27ヌクレオチド、27~30ヌクレオチド、30~45ヌクレオチド(例えば、30、31、32、33、34、35、40、又は45ヌクレオチド)、30又は35~40ヌクレオチド、41~45ヌクレオチド、45~50ヌクレオチド、又はそれ以上である。
RNAガイドのスペーサー長さは約15~55ヌクレオチドの範囲であってもよい。RNAガイドのスペーサー長さは約20~45ヌクレオチドの範囲であってもよい。一部の実施形態において、RNAガイドのスペーサー長さは、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、又は少なくとも22ヌクレオチドである。一部の実施形態において、スペーサー長さは、15~17ヌクレオチド、15~23ヌクレオチド、16~22ヌクレオチド、17~20ヌクレオチド、20~24ヌクレオチド(例えば、20、21、22、23、又は24ヌクレオチド)、23~25ヌクレオチド(例えば、23、24、又は25ヌクレオチド)、24~27ヌクレオチド、27~30ヌクレオチド、30~45ヌクレオチド(例えば、30、31、32、33、34、35、40、又は45ヌクレオチド)、30又は35~40ヌクレオチド、41~45ヌクレオチド、45~50ヌクレオチド、又はそれ以上である。
一部の実施形態において、RNAガイドのダイレクトリピート長さは少なくとも16ヌクレオチドであり、又は16~20ヌクレオチド(例えば、16、17、18、19、又は20ヌクレオチド)である。一部の実施形態において、RNAガイドのダイレクトリピート長さは約19~約40ヌクレオチドである。
例示的なダイレクトリピート配列(例えば、プレcrRNA(例えば、プロセシングされていないcrRNA)のダイレクトリピート配列又は成熟crRNA(例えば、プロセシングされたcrRNAのダイレクトリピート配列))を表2に示す。表8も参照されたい。
一部の実施形態において、CRISPR関連タンパク質は、配列番号1のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号57のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号2のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号58のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号3のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号59のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号4のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号60のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号10のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号62又は配列番号213のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号14のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号128のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号15のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号63のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号17のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号130のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号18のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号70のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号21のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号72のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号22のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号73のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号23のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号74のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号24のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号63のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号27のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号76のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号28のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号77のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号29のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号139のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号31のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号58のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号32のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号80のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、8
7%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号35のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号77のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号36のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号139のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号38のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号80のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号39のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号58のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号41のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号83のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号42のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号84のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号44のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号86のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号45のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号130のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号46のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号84のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号47のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号87のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号48のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号88のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号51のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号84のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号53のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号84のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号55のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号88のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号56のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号90のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。
7%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号35のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号77のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号36のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号139のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号38のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号80のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号39のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号58のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号41のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号83のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号42のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号84のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号44のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号86のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号45のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号130のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号46のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号84のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号47のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号87のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号48のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号88のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号51のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号84のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号53のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号84のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号55のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号88のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号56のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号90のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。
一部の実施形態において、RNAガイドは図3に記載のダイレクトリピート配列を含む。例えば、一部の実施形態において、RNAガイドは、図3に示されるコンセンサス配列のダイレクトリピート又は図3に示されるコンセンサス配列の一部を含む。一部の実施形態において、RNAガイドは、X1X2TX3X4X5X6X7X8(配列番号224)として記載される配列を有するダイレクトリピートを含み、ここで、X1はA又はC又はGであり、X2はT又はC又はAであり、X3はT又はG又はAであり、X4はT又はGであり、X5はT又はG又はAであり、X6はG又はT又はAであり、X7はT又はG又はAであり、X8はA又はG又はTである。例えば、一部の実施形態において、RNAガイドは、ATTGTTGDA(配列番号225)として記載される配列を有するダイレクトリピートを含む。一部の実施形態において、配列番号224はダイレクトリピートの5’末端に近接している。一部の実施形態において、配列番号225はダイレクトリピートの5’末端に近接している。一部の実施形態において、RNAガイドは、X1X2X3X4X5X6X7X8X9(配列番号226)として記載される配列を有するダイレクトリピートを含み、ここで、X1はT又はC又はAであり、X2はT又はA又はGであり、X3はT又はC又はAであり、X4はT又はAであり、X5はT又はA又はGであり、X6はT又はAであり、X7はA又はTであり、X8はA又はG又はC又はTであり、X9はG又はA又はCである。例えば、一部の実施形態において、RNAガイドは、TTTTWTARG(配列番号227)として記載される配列を有するダイレクトリピートを含む。一部の実施形態において、RNAガイドは、X1X2X3AC(配列番号228)として記載される配列を有するダイレクトリピートを含み、ここで、X1はA又はC又はGであり、X2はC又はAであり、X3はA又はCである。例えば、一部の実施形態において、RNAガイドは、ACAAC(配列番号229)として記載される配列を有するダイレクトリピートを含む。一部の実施形態において、配列番号228はダイレクトリピートの3’末端に近接している。一部の実施形態において、配列番号229はダイレクトリピートの3’末端に近接している。
一部の実施形態において、RNAガイドのスペーサーは、表3のPAM配列に隣接する標的核酸に結合する。例えば、一部の実施形態において、本明細書に開示されるエフェクターとRNAガイドとの複合体は、表3に示されるPAM配列に隣接する標的核酸に結合する。
一部の実施形態において、RNAガイドはtracrRNAを更に含む。一部の実施形態において、tracrRNAは必要でない(例えば、tracrRNAは任意選択である)。一部の実施形態において、tracrRNAは、表9に示される非コード配列の一部である。例えば、一部の実施形態において、tracrRNAは表4の配列である。
一部の実施形態において、CRISPR関連タンパク質は、配列番号1のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、tracrRNA配列は、配列番号152、配列番号153、又は配列番号154のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号2のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、tracrRNA配列は、配列番号155、配列番号156、配列番号157、又は配列番号158のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号3のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、tracrRNA配列は、配列番号159、配列番号160、又は配列番号161のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号14のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、tracrRNA配列は、配列番号162のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号17のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、tracrRNA配列は、配列番号163、配列番号164、配列番号165、又は配列番号166のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号18のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、tracrRNA配列は、配列番号167又は配列番号168のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号21のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、tracrRNA配列は、配列番号169、配列番号170、又は配列番号171のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号22のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、tracrRNA配列は、配列番号172、配列番号173、配列番号174、又は配列番号175のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号23のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、tracrRNA配列は、配列番号176、配列番号177、配列番号178、又は配列番号179のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号27のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、tracrRNA配列は、配列番号180又は配列番号181のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号29のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、tracrRNA配列は、配列番号182、配列番号183、又は配列番号184のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号31のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、tracrRNA配列は、配列番号185、配列番号186、配列番号187、又は配列番号188のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号32のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、tracrRNA配列は、配列番号189又は配列番号190のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号36のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、tracrRNA配列は、配列番号182、配列番号183、又は配列番号184のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号38のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、tracrRNA配列は、配列番号189又は配列番号190のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号39のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、tracrRNA配列は、配列番号185、配列番号186、配列番号187、又は配列番号188のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号41のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、tracrRNA配列は、配列番号191、配列番号192、配列番号193、又は配列番号194のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、
85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号43のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、tracrRNA配列は、配列番号197、配列番号198、又は配列番号199のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号44のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、tracrRNA配列は、配列番号195又は配列番号196のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号45のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、tracrRNA配列は、配列番号163、配列番号164、配列番号165、又は配列番号166のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号48のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、tracrRNA配列は、配列番号200、配列番号201、又は配列番号202のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号52のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、tracrRNA配列は、配列番号197、配列番号198、又は配列番号199のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号55のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、tracrRNA配列は、配列番号200、配列番号201、又は配列番号202のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号56のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、tracrRNA配列は、配列番号203又は配列番号204のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。
85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号43のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、tracrRNA配列は、配列番号197、配列番号198、又は配列番号199のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号44のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、tracrRNA配列は、配列番号195又は配列番号196のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号45のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、tracrRNA配列は、配列番号163、配列番号164、配列番号165、又は配列番号166のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号48のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、tracrRNA配列は、配列番号200、配列番号201、又は配列番号202のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号52のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、tracrRNA配列は、配列番号197、配列番号198、又は配列番号199のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号55のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、tracrRNA配列は、配列番号200、配列番号201、又は配列番号202のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号56のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、tracrRNA配列は、配列番号203又は配列番号204のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。
RNAガイド配列は、CRISPR複合体の形成及び標的への結合の成功は許容するが、同時にヌクレアーゼ活性の成功は許容しない(即ち、ヌクレアーゼ活性のない/インデルを生じさせない)ような方法で修飾されてもよい。こうした修飾ガイド配列は、「デッドガイド」又は「デッドガイド配列」と称される。こうしたデッドガイド又はデッドガイド配列はヌクレアーゼ活性の点で触媒的に不活性又はコンホメーション的に不活性であってもよい。デッドガイド配列は、典型的には、活性なRNA切断を生じるそれぞれのガイド配列よりも短い。一部の実施形態において、デッドガイドは、ヌクレアーゼ活性を有するそれぞれのガイドRNAと比べて5%、10%、20%、30%、40%、又は50%短い。RNAガイドのデッドガイド配列は、13~15ヌクレオチド長(例えば、13、14、又は15ヌクレオチド長)、15~19ヌクレオチド長、又は17~18ヌクレオチド長(例えば、17ヌクレオチド長)であってもよい。
従って、一態様において、本開示は、本明細書に記載されるとおりの機能性CLUST.091979CRISPRエフェクターと、RNAガイドとを含む天然に存在しない又はエンジニアリングされたCRISPRシステムを提供し、ここでRNAガイドはデッドガイド配列を含み、従ってRNAガイドは、検出可能な切断活性なしにCRISPRシステムが細胞の目的のゲノム遺伝子座に向けられるような標的配列へのハイブリダイズ能を有する。デッドガイドの詳細な説明は、例えば、国際公開第2016094872号パンフレット(全体として参照により本明細書に援用される)に記載される。
誘導性RNAガイド
RNAガイドは、誘導性システムの成分として作成することができる。このシステムの誘導可能な性質により、遺伝子編集又は遺伝子発現の時空間的制御が可能となる。一部の実施形態において、誘導性システムの刺激としては、例えば、電磁放射線、音響エネルギー、化学エネルギー、及び/又は熱エネルギーが挙げられる。
RNAガイドは、誘導性システムの成分として作成することができる。このシステムの誘導可能な性質により、遺伝子編集又は遺伝子発現の時空間的制御が可能となる。一部の実施形態において、誘導性システムの刺激としては、例えば、電磁放射線、音響エネルギー、化学エネルギー、及び/又は熱エネルギーが挙げられる。
一部の実施形態において、RNAガイドの転写は、誘導性プロモーター、例えば、テトラサイクリン又はドキシサイクリン制御下での転写活性化(Tet-On及びTet-Off発現システム)、ホルモン誘導性遺伝子発現システム(例えば、エクジソン誘導性遺伝子発現システム)、及びアラビノース誘導性遺伝子発現システムによって調節することができる。誘導性システムの他の例としては、例えば、小分子2ハイブリッド転写活性化システム(FKBP、ABA等)、光誘導性システム(フィトクロム、LOVドメイン、又はクリプトクロム)、又は光誘導性転写エフェクター(LITE)が挙げられる。これらの誘導性システムは、例えば、国際公開第2016205764号パンフレット及び米国特許第8795965号明細書(これらはそれぞれ全体として参照により本明細書に援用される)に記載されている。
化学修飾
ガイドRNAのリン酸骨格、糖、及び/又は塩基に化学修飾を適用することができる。ホスホロチオエートなどの骨格修飾はリン酸骨格上の電荷を修飾し、オリゴヌクレオチドの送達及びヌクレアーゼ耐性に役立つ(例えば、Eckstein,“Phosphorothioates,essential components of therapeutic oligonucleotides,”Nucl.Acid Ther.,24(2014),pp.374-387を参照のこと);2’-O-メチル(2’-OMe)、2’-F、及びロックド核酸(LNA)などの糖修飾は、塩基対合及びヌクレアーゼ耐性の両方を亢進させる(例えば、Allerson et al.“Fully 2‘-modified oligonucleotide duplexes with improved in vitro potency and stability compared to unmodified small interfering RNA,”J.Med.Chem.,48.4(2005):901-904を参照のこと)。化学修飾塩基、とりわけ2-チオウリジン又はN6-メチルアデノシンなどは、より強い塩基対合又はより弱い塩基対合のいずれも可能にすることができる(例えば、Bramsen et al.,“Development of therapeutic-grade small interfering RNAs by chemical engineering”Front.Genet.,2012 Aug 20;3:154を参照のこと)。加えて、RNAは、蛍光色素、ポリエチレングリコール、又はタンパク質を含めた種々の機能性部分との5’末端及び3’末端の両方のコンジュゲーションに適している。
ガイドRNAのリン酸骨格、糖、及び/又は塩基に化学修飾を適用することができる。ホスホロチオエートなどの骨格修飾はリン酸骨格上の電荷を修飾し、オリゴヌクレオチドの送達及びヌクレアーゼ耐性に役立つ(例えば、Eckstein,“Phosphorothioates,essential components of therapeutic oligonucleotides,”Nucl.Acid Ther.,24(2014),pp.374-387を参照のこと);2’-O-メチル(2’-OMe)、2’-F、及びロックド核酸(LNA)などの糖修飾は、塩基対合及びヌクレアーゼ耐性の両方を亢進させる(例えば、Allerson et al.“Fully 2‘-modified oligonucleotide duplexes with improved in vitro potency and stability compared to unmodified small interfering RNA,”J.Med.Chem.,48.4(2005):901-904を参照のこと)。化学修飾塩基、とりわけ2-チオウリジン又はN6-メチルアデノシンなどは、より強い塩基対合又はより弱い塩基対合のいずれも可能にすることができる(例えば、Bramsen et al.,“Development of therapeutic-grade small interfering RNAs by chemical engineering”Front.Genet.,2012 Aug 20;3:154を参照のこと)。加えて、RNAは、蛍光色素、ポリエチレングリコール、又はタンパク質を含めた種々の機能性部分との5’末端及び3’末端の両方のコンジュゲーションに適している。
化学的に合成されるRNAガイド分子には、幅広い種類の修飾を適用することができる。例えば、オリゴヌクレオチドを2’-OMeで修飾してヌクレアーゼ耐性を改善すると、ワトソン・クリック塩基対合の結合エネルギーを変化させることができる。更には、2’-OMe修飾は、オリゴヌクレオチドがトランスフェクション試薬、タンパク質又は細胞中の任意の他の分子とどのように相互作用するかに影響を及ぼし得る。これらの修飾の効果は経験的試験によって決定することができる。
一部の実施形態において、RNAガイドは1つ以上のホスホロチオエート修飾を含む。一部の実施形態において、RNAガイドは、塩基対合を亢進させること及び/又はヌクレアーゼ耐性を増加させることを目的として1つ以上のロックド核酸を含む。
これらの化学修飾の概要については、例えば、Kelley et al.,“Versatility of chemically synthesized guide RNAs for CRISPR-Cas9 genome editing,”J.Biotechnol.2016 Sep 10;233:74-83;国際公開第2016205764号パンフレット;及び米国特許第8795965号明細書(この各々が全体として参照により援用される)を参照することができる。
配列修飾
本明細書に記載されるRNAガイド、tracrRNA及びcrRNAの配列及び長さは最適化することができる。一部の実施形態において、RNAガイドの最適化された長さは、プロセシングされた形態のtracrRNA及び/若しくはcrRNAを同定することによるか、又はcrRNAのRNAガイドについての経験的な長さ研究によって決定されてもよい。
本明細書に記載されるRNAガイド、tracrRNA及びcrRNAの配列及び長さは最適化することができる。一部の実施形態において、RNAガイドの最適化された長さは、プロセシングされた形態のtracrRNA及び/若しくはcrRNAを同定することによるか、又はcrRNAのRNAガイドについての経験的な長さ研究によって決定されてもよい。
RNAガイドはまた、1つ以上のアプタマー配列も含むことができる。アプタマーは、特異的な標的分子に結合することのできるオリゴヌクレオチド又はペプチド分子である。アプタマーは、遺伝子エフェクター、遺伝子アクチベーター、又は遺伝子リプレッサーに特異的であってもよい。一部の実施形態において、アプタマーはタンパク質に特異的であり、次にはそのタンパク質が特異的遺伝子エフェクター、遺伝子アクチベーター、又は遺伝子リプレッサーに特異的であって、それを動員し/それに結合するものであってもよい。エフェクター、アクチベーター、又はリプレッサーは融合タンパク質の形態で存在することができる。一部の実施形態において、RNAガイドは、同じアダプタータンパク質に特異的な2つ以上のアプタマー配列を有する。一部の実施形態において、2つ以上のアプタマー配列は異なるアダプタータンパク質に特異的である。アダプタータンパク質としては、例えば、MS2、PP7、Qβ、F2、GA、fr、JP501、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、φCb5、φCb8r、φCb12r、φCb23r、7s、及びPRR1を挙げることができる。従って、一部の実施形態において、アプタマーは、本明細書に記載されるとおりのアダプタータンパク質のうちのいずれか1つに特異的に結合する結合タンパク質から選択される。一部の実施形態において、アプタマー配列はMS2ループである。アプタマーの詳細な説明については、例えば、Nowak et al.,“Guide RNA engineering for versatile Cas9 functionality,”Nucl.Acid.Res.,2016 Nov 16;44(20):9555-9564;及び国際公開第2016205764号パンフレット(これらはそれぞれ全体として参照により本明細書に援用される)を参照することができる。
ガイド:標的配列一致要件
CRISPRシステムでは、ガイド配列とその対応する標的配列との間の相補性の程度は、約50%、60%、75%、80%、85%、90%、95%、97.5%、99%、又は100%であってもよい。オフターゲット相互作用を減少させるため、例えば、相補性が低い標的配列と相互作用するガイドを減少させるため、CRISPRシステムに突然変異を導入して、CRISPRシステムが標的配列と、80%、85%、90%、又は95%より高い相補性を有するオフターゲット配列との間を区別できるようにしてもよい。一部の実施形態において、相補性の程度は、80%~95%、例えば、約83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、又は95%である(例えば、18ヌクレオチドを有する標的と、1、2、又は3個のミスマッチを有する18ヌクレオチドのオフターゲットとの間を区別する)。従って、一部の実施形態において、ガイド配列とその対応する標的配列との間の相補性の程度は、94.5%、95%、95.5%、96%、96.5%、97%、97.5%、98%、98.5%、99%、99.5%、又は99.9%より高い。一部の実施形態において、相補性の程度は100%である。
CRISPRシステムでは、ガイド配列とその対応する標的配列との間の相補性の程度は、約50%、60%、75%、80%、85%、90%、95%、97.5%、99%、又は100%であってもよい。オフターゲット相互作用を減少させるため、例えば、相補性が低い標的配列と相互作用するガイドを減少させるため、CRISPRシステムに突然変異を導入して、CRISPRシステムが標的配列と、80%、85%、90%、又は95%より高い相補性を有するオフターゲット配列との間を区別できるようにしてもよい。一部の実施形態において、相補性の程度は、80%~95%、例えば、約83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、又は95%である(例えば、18ヌクレオチドを有する標的と、1、2、又は3個のミスマッチを有する18ヌクレオチドのオフターゲットとの間を区別する)。従って、一部の実施形態において、ガイド配列とその対応する標的配列との間の相補性の程度は、94.5%、95%、95.5%、96%、96.5%、97%、97.5%、98%、98.5%、99%、99.5%、又は99.9%より高い。一部の実施形態において、相補性の程度は100%である。
当該分野では、機能性となるのに十分な相補性があるならば、完全な相補性は要件とならないことが公知である。スペーサー/標的に沿ったミスマッチの位置を含め、スペーサー配列と標的配列との間へのミスマッチ、例えば1個以上のミスマッチ、例えば1又は2個のミスマッチの導入により、切断効率の調節を生かすことができる。ミスマッチ、例えば二重ミスマッチが中心寄りに位置するほど(即ち、3’末端又は5’末端にあるのでない);切断効率がより大きい影響を受ける。従って、スペーサー配列に沿ったミスマッチ位置の選択により、切断効率を調節することができる。例えば、標的の100%未満の切断が(例えば、細胞集団中で)所望される場合、スペーサー配列にスペーサーと標的配列との間の1又は2個のミスマッチを導入してもよい。
CRISPRシステムの使用方法
本明細書に記載されるCRISPRシステムには、非常に多数の細胞型における標的ポリヌクレオチドの修飾(例えば、欠失、挿入、転位、不活性化、又は活性化)を含め、多種多様な有用性がある。このCRISPRシステムは、例えば、DNA/RNA検出(例えば、特異的高感度酵素レポーターアンロッキング(specific high sensitivity enzymatic reporter unlocking:SHERLOCK))、核酸の追跡及び標識、エンリッチメントアッセイ(バックグラウンドからの所望の配列の抽出)、循環腫瘍DNAの検出、次世代ライブラリの調製、薬物スクリーニング、疾患診断及び予後判定、及び様々な遺伝的障害の治療において、幅広い範囲にわたる適用を有する。
本明細書に記載されるCRISPRシステムには、非常に多数の細胞型における標的ポリヌクレオチドの修飾(例えば、欠失、挿入、転位、不活性化、又は活性化)を含め、多種多様な有用性がある。このCRISPRシステムは、例えば、DNA/RNA検出(例えば、特異的高感度酵素レポーターアンロッキング(specific high sensitivity enzymatic reporter unlocking:SHERLOCK))、核酸の追跡及び標識、エンリッチメントアッセイ(バックグラウンドからの所望の配列の抽出)、循環腫瘍DNAの検出、次世代ライブラリの調製、薬物スクリーニング、疾患診断及び予後判定、及び様々な遺伝的障害の治療において、幅広い範囲にわたる適用を有する。
DNA/RNA検出
一態様において、本明細書に記載されるCRISPRシステムは、DNA/RNA検出において使用することができる。シングルエフェクターRNA誘導型DNアーゼをCRISPR RNA(crRNA)で再プログラム化することにより、特異的一本鎖DNA(ssDNA)センシング用のプラットフォームがもたらされ得る。そのDNA標的の認識時、活性化したV型単一エフェクターDNAガイドDNaseは、近隣非標的ssDNAの「コラテラル」切断に関与する。このcrRNAによってプログラム化されるコラテラル切断活性により、CRISPRシステムが特異的DNAの存在を標識ssDNAの非特異的分解によって検出することが可能となる。
一態様において、本明細書に記載されるCRISPRシステムは、DNA/RNA検出において使用することができる。シングルエフェクターRNA誘導型DNアーゼをCRISPR RNA(crRNA)で再プログラム化することにより、特異的一本鎖DNA(ssDNA)センシング用のプラットフォームがもたらされ得る。そのDNA標的の認識時、活性化したV型単一エフェクターDNAガイドDNaseは、近隣非標的ssDNAの「コラテラル」切断に関与する。このcrRNAによってプログラム化されるコラテラル切断活性により、CRISPRシステムが特異的DNAの存在を標識ssDNAの非特異的分解によって検出することが可能となる。
DNA検出適用においては、コラテラルssDNA活性をレポーターと組み合わせることができ、例えば、DNAエンドヌクレアーゼ標的化CRISPRトランスレポーター(DNA Endonuclease-Targeted CRISPR trans reporter:DETECTR)法と呼ばれる方法などであり、これは、アトモル濃度のDNA検出感度を実現する(例えば、Chen et al.,Science,360(6387):436-439,2018を参照のこと)(これは全体として参照により本明細書に援用される)。本明細書に記載される酵素を使用する一つの適用は、インビトロ環境における非特異的ssDNAの分解である。フルオロフォア及び消光剤に連結した「レポーター」ssDNA分子もまた、未知のDNA試料(一本鎖又は二本鎖のいずれか)と共にこのインビトロシステムに加えることができる。未知のDNA片中に標的配列を認識すると、このエフェクター複合体がレポーターssDNAを切断し、蛍光リードアウトが生じる。
他の実施形態において、SHERLOCK法(特異的高感度酵素レポーターアンロッキング(Specific High Sensitivity Enzymatic Reporter UnLOCKing))もまた、核酸増幅及びレポーターssDNAのコラテラル切断に基づいたアトモル濃度(又は単一分子)感度のインビトロ核酸検出プラットフォームを提供し、標的のリアルタイム検出を可能にする。SHERLOCKにおけるCRISPRの使用方法については、例えば、Gootenberg,et al.“Nucleic acid detection with CRISPR-Cas13a/C2c2,”Science,356(6336):438-442(2017)(これは全体として参照により本明細書に援用される)に詳細に記載される。
一部の実施形態において、本明細書に記載されるCRISPRシステムは、マルチプレックス化したエラーロバストな蛍光インサイチュハイブリダイゼーション(multiplexed error-robust fluorescence in situ hybridization:MERFISH)において使用することができる。こうした方法については、例えば、Chen et al.,“Spatially resolved,highly multiplexed RNA profiling in single cells,”Science,2015 Apr 24;348(6233):aaa6090(これは全体として参照により本明細書に援用される)に記載されている。
核酸の追跡及び標識
細胞過程は、タンパク質、RNA、及びDNAの間での分子相互作用網に依存する。タンパク質-DNA及びタンパク質-RNA相互作用の正確な検出は、かかる過程を理解する鍵である。インビトロ近接性標識技法は、レポーター基、例えば光活性化可能な基と組み合わせたアフィニティータグを用いることにより、インビトロで目的のタンパク質又はRNAの近くにあるポリペプチド及びRNAを標識する。紫外線照射後、光活性化可能な基がタグ付加分子にごく近接したタンパク質及び他の分子と反応し、それによってそれらを標識する。標識された相互作用分子は、続いて回収し、同定することができる。このRNAターゲティングエフェクタータンパク質を使用して、例えば、プローブを選択のRNA配列に標的化することができる。こうした適用はまた、動物モデルにおいても疾患又は培養が困難な細胞型のインビボイメージングに適用することができる。核酸の追跡及び標識方法については、例えば、米国特許第8795965号明細書;国際公開第2016205764号パンフレット;及び国際公開第2017070605号パンフレット(これらの各々は、本明細書において全体として参照により援用される)に記載されている。
細胞過程は、タンパク質、RNA、及びDNAの間での分子相互作用網に依存する。タンパク質-DNA及びタンパク質-RNA相互作用の正確な検出は、かかる過程を理解する鍵である。インビトロ近接性標識技法は、レポーター基、例えば光活性化可能な基と組み合わせたアフィニティータグを用いることにより、インビトロで目的のタンパク質又はRNAの近くにあるポリペプチド及びRNAを標識する。紫外線照射後、光活性化可能な基がタグ付加分子にごく近接したタンパク質及び他の分子と反応し、それによってそれらを標識する。標識された相互作用分子は、続いて回収し、同定することができる。このRNAターゲティングエフェクタータンパク質を使用して、例えば、プローブを選択のRNA配列に標的化することができる。こうした適用はまた、動物モデルにおいても疾患又は培養が困難な細胞型のインビボイメージングに適用することができる。核酸の追跡及び標識方法については、例えば、米国特許第8795965号明細書;国際公開第2016205764号パンフレット;及び国際公開第2017070605号パンフレット(これらの各々は、本明細書において全体として参照により援用される)に記載されている。
ハイスループットスクリーニング
本明細書に記載されるCRISPRシステムは、次世代シーケンシング(NGS)ライブラリの調製に使用することができる。例えば、費用対効果の高いNGSライブラリを作成するため、CRISPRシステムを使用して標的遺伝子のコード配列を破壊することができ、同時に次世代シーケンシングによって(例えば、Ion Torrent PGMシステムで)、CRISPRエフェクターがトランスフェクトされたクローンをスクリーニングすることができる。NGSライブラリの調製方法に関する詳細な説明については、例えば、Bell et al.,“A high-throughput screening strategy for detecting CRISPR-Cas9 induced mutations using next-generation sequencing,”BMC Genomics,15.1(2014):1002(これは全体として参照により本明細書に援用される)を参照することができる。
本明細書に記載されるCRISPRシステムは、次世代シーケンシング(NGS)ライブラリの調製に使用することができる。例えば、費用対効果の高いNGSライブラリを作成するため、CRISPRシステムを使用して標的遺伝子のコード配列を破壊することができ、同時に次世代シーケンシングによって(例えば、Ion Torrent PGMシステムで)、CRISPRエフェクターがトランスフェクトされたクローンをスクリーニングすることができる。NGSライブラリの調製方法に関する詳細な説明については、例えば、Bell et al.,“A high-throughput screening strategy for detecting CRISPR-Cas9 induced mutations using next-generation sequencing,”BMC Genomics,15.1(2014):1002(これは全体として参照により本明細書に援用される)を参照することができる。
エンジニアリングされた細胞
微生物(例えば、大腸菌(E.coli)、酵母、及び微細藻類)は、合成生物学に広く用いられている。合成生物学の発展には、様々な臨床応用を含め、幅広い有用性がある。例えば、プログラム可能なCRISPRシステムを使用して、例えば癌関連RNAを標的転写物として用いる標的化した細胞死のため、毒性ドメインのタンパク質を分割することができる。更に、例えばキナーゼ又は酵素などの適切なエフェクターとの融合複合体により、合成生物系においてタンパク質間相互作用が関わる経路に影響を及ぼすことができる。
微生物(例えば、大腸菌(E.coli)、酵母、及び微細藻類)は、合成生物学に広く用いられている。合成生物学の発展には、様々な臨床応用を含め、幅広い有用性がある。例えば、プログラム可能なCRISPRシステムを使用して、例えば癌関連RNAを標的転写物として用いる標的化した細胞死のため、毒性ドメインのタンパク質を分割することができる。更に、例えばキナーゼ又は酵素などの適切なエフェクターとの融合複合体により、合成生物系においてタンパク質間相互作用が関わる経路に影響を及ぼすことができる。
一部の実施形態において、ファージ配列を標的化するRNAガイド配列を微生物に導入することができる。従って、本開示はまた、微生物(例えば産生菌株)にファージ感染に対する「ワクチンを接種する」方法も提供する。
一部の実施形態において、本明細書に提供されるCRISPRシステムを使用して微生物をエンジニアリングすることにより、例えば、収率を改善し又は発酵効率を改善することができる。例えば、本明細書に記載されるCRISPRシステムを使用して酵母などの微生物をエンジニアリングすることにより、発酵性糖からバイオ燃料若しくはバイオポリマーを生成し、又は発酵性糖源としての農業廃棄物に由来する植物由来のリグノセルロースを分解することができる。より詳細には、本明細書に記載される方法を使用して、バイオ燃料生産に必要な内因性遺伝子の発現を修飾し、及び/又はバイオ燃料合成を妨げ得る内因性遺伝子を修飾することができる。これらの微生物エンジニアリング方法については、例えば、Verwaal et al.,“CRISPR/Cpf1 enables fast and simple genome editing of Saccharomyces cerevisiae,”Yeast,2017 Sep 8.doi:10.1002/yea.3278;及びHlavova et al.,“Improving microalgae for biotechnology-from genetics to synthetic biology,”Biotechnol.Adv.,2015 Nov 1;33:1194-203(これらはそれぞれ全体として参照により本明細書に援用される)に記載されている。
一部の実施形態において、本明細書で提供されるCRISPRシステムは、真核細胞又は真核生物をエンジニアリングするために使用することができる。例えば、本明細書に記載のCRISPRシステムは、植物細胞、真菌細胞、哺乳動物細胞、爬虫類細胞、昆虫細胞、鳥類細胞、魚類細胞、寄生虫細胞、節足動物細胞、無脊椎動物細胞、脊椎動物細胞、げっ歯類細胞、マウス細胞、ラット細胞、霊長類細胞、非ヒト霊長類細胞、又はヒト細胞に限定されない真核細胞をエンジニアリングするために使用することができる。一部の実施形態において、真核細胞はインビトロ培養物中にある。一部の実施形態において、真核細胞はインビボである。一部の実施形態において、真核細胞はエキソビボである。
一部の実施形態において、細胞は細胞系に由来する。組織培養のための広範な細胞系は当技術分野で知られている。細胞系の例としては、限定されるものではないが、293T、MF7、K562、HeLa、及びそれらのトランスジェニック変種が挙げられる。細胞系は、当業者に知られた様々な供給源から入手可能である(例えば、American Type Culture Collection(ATCC)(Manassas,Va.)を参照されたい)。一部の実施形態において、1つ以上の核酸(例えば、ヌクレアーゼポリペプチドコードベクター及びRNAガイド)によってトランスフェクトされた細胞を使用して、1つ以上のベクター由来配列を含む新たな細胞系を樹立して、標的核酸又は標的遺伝子座の修飾を含む新たな細胞系を樹立する。一部の実施形態において、細胞は不死又は不死化細胞である。
一部の実施形態において、細胞は初代細胞である。一部の実施形態において、細胞は、分化全能性幹細胞(例えば、万能)、多能性幹細胞、複能性幹細胞、少能性幹細胞、又は単能性幹細胞などの幹細胞である。一部の実施形態において、細胞は誘導多能性幹細胞(iPSC)であり、又はiPSCに由来する。一部の実施形態において、細胞は分化細胞である。例えば、一部の実施形態において、分化細胞は筋細胞、(例えば、ミオサイト)、脂肪細胞(例えば、アジポサイト)、骨細胞(例えば、骨芽細胞、骨細胞、破骨細胞)、血球(例えば、単球、リンパ球、好中球、好酸球、好塩基球、マクロファージ、赤血球、又は血小板)、神経細胞(例えば、ニューロン)、上皮細胞、免疫細胞(例えば、リンパ球、好中球、単球、又はマクロファージ)、肝細胞(例えば、ヘパトサイト)、線維芽細胞、又は生殖細胞である。一部の実施形態において、細胞は最終分化細胞である。例えば、一部の実施形態において、最終分化細胞は神経細胞、アジポサイト、心筋細胞、骨格筋細胞、表皮細胞、又は腸細胞である。一部の実施形態において、細胞は哺乳動物細胞、例えば、ヒト細胞又はネズミ細胞である。一部の実施形態において、ネズミ細胞は野生型マウス、免疫抑制マウス、又は疾患特異的マウスモデルに由来する。
遺伝子ドライブ
遺伝子ドライブは、特定の遺伝子又は遺伝子群の遺伝形質に有利な偏りが出る現象である。本明細書に記載されるCRISPRシステムを使用して遺伝子ドライブを構築することができる。例えば、遺伝子の特定のアレルを標的化して破壊することにより、細胞に第2のアレルをコピーさせて配列を固定するようにCRISPRシステムを設計することができる。このコピーのため、第1のアレルが第2のアレルに変換されることになり、子孫に第2のアレルが遺伝する可能性が高くなる。どのように本明細書に記載されるCRISPRシステムを使用して遺伝子ドライブを構築するかに関する詳細な方法については、例えば、Hammond et al.,“A CRISPR-Cas9 gene drive system targeting female reproduction in the malaria mosquito vector Anopheles gambiae,”Nat.Biotechnol.,2016 Jan;34(1):78-83(これは全体として参照により本明細書に援用される)に記載されている。
遺伝子ドライブは、特定の遺伝子又は遺伝子群の遺伝形質に有利な偏りが出る現象である。本明細書に記載されるCRISPRシステムを使用して遺伝子ドライブを構築することができる。例えば、遺伝子の特定のアレルを標的化して破壊することにより、細胞に第2のアレルをコピーさせて配列を固定するようにCRISPRシステムを設計することができる。このコピーのため、第1のアレルが第2のアレルに変換されることになり、子孫に第2のアレルが遺伝する可能性が高くなる。どのように本明細書に記載されるCRISPRシステムを使用して遺伝子ドライブを構築するかに関する詳細な方法については、例えば、Hammond et al.,“A CRISPR-Cas9 gene drive system targeting female reproduction in the malaria mosquito vector Anopheles gambiae,”Nat.Biotechnol.,2016 Jan;34(1):78-83(これは全体として参照により本明細書に援用される)に記載されている。
プール型スクリーニング
本明細書に記載されるとおり、プール型CRISPRスクリーニングは、細胞増殖、薬剤耐性、及びウイルス感染などの生物学的機構に関与する遺伝子を同定するための強力なツールである。細胞がバルクで本明細書に記載されるRNAガイドコードベクターのライブラリによって形質導入され、選択的チャレンジの適用前及び適用後にgRNAの分布が測定される。プール型CRISPRスクリーンは、細胞生存及び増殖に影響を及ぼす機構に対して良好に機能し、個々の遺伝子の活性の測定にまで(例えば、エンジニアリングされたレポーター細胞株を使用することにより)拡張することができる。一度に1つの遺伝子のみが標的化されるアレイ化されたCRISPRスクリーンでは、RNA-seqをリードアウトとして使用することが可能になる。一部の実施形態において、本明細書に記載されるとおりのCRISPRシステムは単一細胞CRISPRスクリーンに使用することができる。プール型CRISPRスクリーニングに関する詳細な説明については、例えば、Datlinger et al.,“Pooled CRISPR screening with single-cell transcriptome read-out,”Nat.Methods.,2017 Mar;14(3):297-301(これは全体として参照により本明細書に援用される)を参照することができる。
本明細書に記載されるとおり、プール型CRISPRスクリーニングは、細胞増殖、薬剤耐性、及びウイルス感染などの生物学的機構に関与する遺伝子を同定するための強力なツールである。細胞がバルクで本明細書に記載されるRNAガイドコードベクターのライブラリによって形質導入され、選択的チャレンジの適用前及び適用後にgRNAの分布が測定される。プール型CRISPRスクリーンは、細胞生存及び増殖に影響を及ぼす機構に対して良好に機能し、個々の遺伝子の活性の測定にまで(例えば、エンジニアリングされたレポーター細胞株を使用することにより)拡張することができる。一度に1つの遺伝子のみが標的化されるアレイ化されたCRISPRスクリーンでは、RNA-seqをリードアウトとして使用することが可能になる。一部の実施形態において、本明細書に記載されるとおりのCRISPRシステムは単一細胞CRISPRスクリーンに使用することができる。プール型CRISPRスクリーニングに関する詳細な説明については、例えば、Datlinger et al.,“Pooled CRISPR screening with single-cell transcriptome read-out,”Nat.Methods.,2017 Mar;14(3):297-301(これは全体として参照により本明細書に援用される)を参照することができる。
飽和突然変異誘発(「バッシング(bashing)」)
本明細書に記載されるCRISPRシステムはインサイチュー飽和突然変異誘発に使用することができる。一部の実施形態では、プール型RNAガイドライブラリを使用して、特定の遺伝子又は調節エレメントに関するインサイチュー飽和突然変異誘発を実施することができる。かかる方法では、決定的な最小の特徴及びそれらの遺伝子又は調節エレメント(例えば、エンハンサー)の個別的な脆弱性を明らかにすることができる。これらの方法については、例えば、Canver et al.,“BCL11A enhancer dissection by Cas9-mediated in situ saturating mutagenesis,”Nature,2015 Nov 12;527(7577):192-7(これは全体として参照により本明細書に援用される)に記載されている。
本明細書に記載されるCRISPRシステムはインサイチュー飽和突然変異誘発に使用することができる。一部の実施形態では、プール型RNAガイドライブラリを使用して、特定の遺伝子又は調節エレメントに関するインサイチュー飽和突然変異誘発を実施することができる。かかる方法では、決定的な最小の特徴及びそれらの遺伝子又は調節エレメント(例えば、エンハンサー)の個別的な脆弱性を明らかにすることができる。これらの方法については、例えば、Canver et al.,“BCL11A enhancer dissection by Cas9-mediated in situ saturating mutagenesis,”Nature,2015 Nov 12;527(7577):192-7(これは全体として参照により本明細書に援用される)に記載されている。
治療上の適用
一部の実施形態において、本明細書に記載されるCRISPRシステムを使用して、標的核酸を編集して、標的核酸を修飾することができる(例えば、1つ以上のアミノ酸残基を挿入、欠失、又は変異させることによって)。例えば、一部の実施形態において、本明細書に記載されるCRISPRシステムは、望ましい核酸配列を含む外因性ドナー鋳型核酸(例えば、DNA分子又はRNA分子)を含む。本明細書に記載されるCRISPRシステムで誘導される切断イベントの分解時に、細胞の分子機構は、切断イベントを修復及び/又は分解する際に、外因性ドナー鋳型核酸を利用することができる。或いは、細胞の分子機構は、切断イベントを修復及び/又は分解する際に、内因性鋳型を利用することができる。一部の実施形態において、本明細書に記載されるCRISPRシステムは、挿入、欠失、及び/又は点突然変異を生じる標的核酸を修飾するために使用され得る。一部の実施形態において、挿入は、傷のない挿入である(すなわち、標的核酸への意図された核酸配列の挿入は、切断イベントの分解時に追加の意図されない核酸配列を生じない)。ドナー鋳型核酸は、二本鎖又は一本鎖核酸分子(例えば、DNA又はRNA)であってもよい。外因性ドナー鋳型核酸の設計方法については、例えば、国際公開第2016094874号パンフレット(この内容全体が参照により本明細書に明示的に援用される)に記載されている。
一部の実施形態において、本明細書に記載されるCRISPRシステムを使用して、標的核酸を編集して、標的核酸を修飾することができる(例えば、1つ以上のアミノ酸残基を挿入、欠失、又は変異させることによって)。例えば、一部の実施形態において、本明細書に記載されるCRISPRシステムは、望ましい核酸配列を含む外因性ドナー鋳型核酸(例えば、DNA分子又はRNA分子)を含む。本明細書に記載されるCRISPRシステムで誘導される切断イベントの分解時に、細胞の分子機構は、切断イベントを修復及び/又は分解する際に、外因性ドナー鋳型核酸を利用することができる。或いは、細胞の分子機構は、切断イベントを修復及び/又は分解する際に、内因性鋳型を利用することができる。一部の実施形態において、本明細書に記載されるCRISPRシステムは、挿入、欠失、及び/又は点突然変異を生じる標的核酸を修飾するために使用され得る。一部の実施形態において、挿入は、傷のない挿入である(すなわち、標的核酸への意図された核酸配列の挿入は、切断イベントの分解時に追加の意図されない核酸配列を生じない)。ドナー鋳型核酸は、二本鎖又は一本鎖核酸分子(例えば、DNA又はRNA)であってもよい。外因性ドナー鋳型核酸の設計方法については、例えば、国際公開第2016094874号パンフレット(この内容全体が参照により本明細書に明示的に援用される)に記載されている。
別の態様において、本開示は、RNA配列特異的干渉;RNA配列特異的遺伝子調節;RNA、RNA産物、lncRNA、非コードRNA、核RNA、又はmRNAのスクリーニング;突然変異誘発;RNAスプライシングの阻害;蛍光インサイチュハイブリダイゼーション;育種;細胞休眠の誘導;細胞周期停止の誘導;細胞成長及び/又は細胞増殖の減少;細胞アネルギーの誘導;細胞アポトーシスの誘導;細胞壊死の誘導;細胞死の誘導;又はプログラムされた細胞死の誘導からなる群から選択される方法における本明細書に記載されるシステムの使用を提供する。
本明細書に記載されるCRISPRシステムは、様々な治療上の適用を有し得る。一部の実施形態において、新規CRISPRシステムは、様々な疾患及び障害、例えば、遺伝性障害(例えば、単一遺伝子疾患)又はヌクレアーゼ活性によって治療することができる疾患(例えば、Pcsk9ターゲティング又はBCL11aターゲティング)を治療するために使用することができる。一部の実施形態において、本明細書に記載される方法は、対象、例えば、ヒト患者などの哺乳類の治療に用いられる。哺乳類対象はまた、イヌ、ネコ、ウマ、サル、ウサギ、ラット、マウス、雌ウシ、ヤギ、又はヒツジなど、家畜化された哺乳類であってもよい。
この方法は、病態又は疾患が感染性であることを含んでもよく、ここで感染性病原体は、ヒト免疫不全ウイルス(HIV)、単純ヘルペスウイルス1型(HSV1)、及び単純ヘルペスウイルス2型(HSV2)からなる群から選択される。
一態様において、本明細書に記載されるCRISPRシステムは、RNA、毒性RNA、及び/又は変異RNA(例えば、スプライシング欠陥又はトランケーション)の過剰発現によって引き起こされる疾患を治療するために使用することができる。例えば、有毒なRNAの発現は、核封入体の形成及び脳、心臓、又は骨格筋の遅発性変性変化に関連し得る。一部の実施形態において、障害は筋強直性ジストロフィーである。筋緊張性ジストロフィーにおいて、有毒なRNAの主な病原性効果は、結合タンパク質を隔離し、選択的スプライシングの調節を損なうことである(例えば、Osborne et al.,“RNA-dominant diseases,” Hum.Mol.Genet.,2009 Apr 15;18(8):1471-81を参照)。筋強直性ジストロフィー(dystrophia myotonica(DM))は、極めて広範囲の臨床的特徴を生じるため、遺伝学者にとって特に興味深いものである。現在DM1型(DM1)と呼ばれている古典的な形態のDMは、細胞質ゾルプロテインキナーゼをコードする遺伝子であるDMPKの3’非翻訳領域(UTR)におけるCTGリピートの拡大によって引き起こされる。本明細書に記載されるCRISPRシステムは、過剰発現されたRNA又は毒性RNA、例えば、DMPK遺伝子、又はDM1骨格筋、心臓、又は脳において誤調節された選択的スプライシングのいずれかを標的とすることができる。
本明細書に記載されるCRISPRシステムは、プラダー・ウィリ症候群、脊髄性筋萎縮症(SMA)、先天性角化異常症などの様々な疾患を引き起こすRNA依存性機能に影響を与えるトランス作用性変異を標的とすることもできる。本明細書に記載されるCRISPRシステムを使用して治療できる疾患のリストは、Cooper et al.,“RNA and disease,” Cell,136.4(2009):777-793及び国際公開第2016205764号パンフレットに要約される(これらはそれぞれ全体として参照により本明細書に援用される)。
本明細書に記載されるCRISPRシステムは、例えば、原発性加齢性タウオパチー(PART)/神経原線維変化(NFT)優勢老人性認知症(アルツハイマー病(AD)で見られるものと同様のNFTを伴うが、プラークを伴わない)、ボクシング認知症(慢性外傷性脳症)、及び進行性核上性麻痺などの原発性及び続発性タウオパチーを含む、様々なタウオパチーの治療にも使用できる。タウオパチー及びこれらの疾患を治療する方法の有用なリストは、例えば、国際公開第2016205764号パンフレット(本明細書において全体として参照により援用される)に記載されている。
本明細書に記載されるCRISPRシステムは、スプライシングの欠陥及び疾患を引き起こし得るシス作用性スプライシングコードを破壊する変異を標的化するためにも使用できる。これらの疾患としては、例えば、SMN1遺伝子の欠失に起因する運動ニューロン変性疾患(例えば、脊髄性筋萎縮症)、デュシェンヌ型筋ジストロフィー(DMD)、前頭側頭型認知症、及び第17染色体に関連するパーキンソニズム(FTDP-17)、及び嚢胞性線維症が挙げられる。
本明細書に記載されるCRISPRシステムは、特にRNAウイルスに対する抗ウイルス活性のために更に使用することができる。エフェクタータンパク質は、ウイルスRNA配列を標的化するために選択された適切なRNAガイドを使用してウイルスRNAを標的化することができる。
更に、インビトロRNAセンシングアッセイを使用して特定のRNA基質を検出することができる。RNAターゲティングエフェクタータンパク質は、生細胞でのRNAベースのセンシングに使用できる。適用例は、例えば、疾患特異的RNAのセンシングによる診断である。
本明細書に記載されるCRISPRシステムの治療用途の詳細な説明は、例えば、米国特許第8795965号明細書、欧州特許第3009511号明細書、国際公開第2016205764号パンフレット、及び国際公開第2017070605号パンフレット(これらの各々は、本明細書において全体として参照により援用される)に見出すことができる。
植物における適用
本明細書に記載されるCRISPRシステムは、植物において幅広い種類の有用性がある。一部の実施形態において、CRISPRシステムを使用して植物のゲノムをエンジニアリングすることができる(例えば、生産を向上させる、所望の翻訳後修飾を有する生産品にする、又は工業製品を生産するための遺伝子を導入する)。一部の実施形態において、CRISPRシステムを使用して、植物に所望の形質を(例えば、ゲノムに対する遺伝性修飾を伴い又は伴わず)導入し、又は植物細胞若しくは全植物における内因性遺伝子の発現を調節することができる。
本明細書に記載されるCRISPRシステムは、植物において幅広い種類の有用性がある。一部の実施形態において、CRISPRシステムを使用して植物のゲノムをエンジニアリングすることができる(例えば、生産を向上させる、所望の翻訳後修飾を有する生産品にする、又は工業製品を生産するための遺伝子を導入する)。一部の実施形態において、CRISPRシステムを使用して、植物に所望の形質を(例えば、ゲノムに対する遺伝性修飾を伴い又は伴わず)導入し、又は植物細胞若しくは全植物における内因性遺伝子の発現を調節することができる。
一部の実施形態において、本CRISPRシステムを使用して、特異的タンパク質、例えば、アレルゲンタンパク質(例えば、ピーナッツ、ダイズ、レンズマメ、エンドウマメ、サヤマメ、及びヤエナリ中のアレルゲンタンパク質)をコードする遺伝子を同定、編集、及び/又はサイレンシングすることができる。タンパク質をコードする遺伝子を同定、編集、及び/又はサイレンシングする方法に関する詳細な説明については、例えば、Nicolaou et al.,“Molecular diagnosis of peanut and legume allergy,”Curr.Opin.Allergy Clin.Immunol.,11(3):222-8(2011)、及び国際公開第2016205764号パンフレット(これらはそれぞれ全体として参照により本明細書に援用される)に記載されている。
CRISPRシステムの送達
本開示及び当技術分野の知識を通じて、本明細書に記載されるCRISPRシステム、又はその成分、その核酸分子、又はその成分をコードする若しくは提供する核酸分子は、ベクター、例えば、プラスミド、又はウイルス送達ベクターなどの様々な送達システムによって送達することができる。本明細書に開示されるCRISPRエフェクター及び/又はいずれかのRNA(例えば、RNAガイド)は、適切なベクター、例えば、プラスミド、又はアデノ随伴ウイルス(AAV)、レンチウイルス、アデノウイルス、及び他のウイルスベクターなどのウイルスベクター、又はそれらの組み合わせを使用して送達することができる。エフェクター及び1つ以上のRNAガイドは、1つ以上のベクター、例えばプラスミド又はウイルスベクターにパッケージングすることができる。
本開示及び当技術分野の知識を通じて、本明細書に記載されるCRISPRシステム、又はその成分、その核酸分子、又はその成分をコードする若しくは提供する核酸分子は、ベクター、例えば、プラスミド、又はウイルス送達ベクターなどの様々な送達システムによって送達することができる。本明細書に開示されるCRISPRエフェクター及び/又はいずれかのRNA(例えば、RNAガイド)は、適切なベクター、例えば、プラスミド、又はアデノ随伴ウイルス(AAV)、レンチウイルス、アデノウイルス、及び他のウイルスベクターなどのウイルスベクター、又はそれらの組み合わせを使用して送達することができる。エフェクター及び1つ以上のRNAガイドは、1つ以上のベクター、例えばプラスミド又はウイルスベクターにパッケージングすることができる。
一部の実施形態において、ベクター、例えばプラスミド又はウイルスベクターは、例えば、筋肉内注射、静脈内投与、経皮投与、鼻腔内投与、経口投与、又は粘膜投与によって目的の組織に送達される。かかる送達は、1回用量又は複数回用量のいずれによるものであってもよい。当業者は、本明細書において実際に送達される投薬量が、ベクターの選択、標的細胞、生物、組織、治療対象の全般的な状態、求められる形質転換/修飾の程度、投与経路、投与様式、及び求められる形質転換/修飾の種類を含むがこれらに限定されず、種々の要因に応じて大きく異なり得ることを理解する。
特定の実施形態において、送達は、アデノウイルスによるものであり、これは少なくとも1×105粒子(粒子単位、puとも称される)のアデノウイルスを含有する1回用量におけるものであることができる。一部の実施形態において、好ましくは用量は少なくとも約1×106粒子、少なくとも約1×107粒子、少なくとも約1×108粒子、及び少なくとも約1×109粒子のアデノウイルスである。送達方法及び用量については、例えば、国際公開第2016205764号パンフレット及び米国特許第8454972号明細書(これらはそれぞれ全体として参照により本明細書に援用される)に記載されている。
一部の実施形態において、送達はプラスミドによるものである。投薬量は、応答を引き出すのに十分な数のプラスミドであり得る。ある場合には、プラスミド組成物中のプラスミドDNAの好適な分量は、約0.1~約2mgであってもよい。プラスミドは概して、(i)プロモーター;(ii)プロモーターに作動可能に連結された、核酸ターゲティングCRISPRエフェクターをコードする配列;(iii)選択可能マーカー;(iv)複製起点;及び(v)(ii)の下流にある且つそれに作動可能に連結された転写ターミネーターを含むことになる。プラスミドはまた、CRISPR複合体のRNA成分もコードすることができるが、代わりに、これらのうちの1つ以上が異なるベクターにコードされてもよい。投与頻度は、医学又は獣医学の実践者(例えば、医師、獣医師)、又は当業者の範囲内にある。
別の実施形態において、送達はリポソーム又はリポフェクチン製剤などによるものであり、当業者に公知の方法によって調製することができる。かかる方法については、例えば、国際公開第2016205764号パンフレット及び米国特許第5593972号明細書;同第5589466号明細書;及び同第5580859号明細書(これらの各々は、本明細書において全体として参照により援用される)に記載されている。
一部の実施形態において、送達はナノ粒子又はエキソソームによるものである。例えば、エキソソームはRNA送達に特に有用であることが示されている。
本明細書に記載されるCRISPRシステムの1つ以上の成分を細胞に導入する更なる手段は、細胞透過性ペプチド(CPP)の使用によるものである。一部の実施形態では、細胞透過性ペプチドがCRISPRエフェクターに連結される。一部の実施形態では、CRISPRエフェクター及び/又はRNAガイドが1つ以上のCPPとカップリングされ、細胞内部へと輸送する(例えば、植物プロトプラスト)。一部の実施形態では、CRISPRエフェクター及び/又は1つ又は複数のRNAガイドが、細胞送達のため1つ以上のCPPにカップリングされている1つ以上の環状又は非環状DNA分子によってコードされる。
CPPは、生体分子を受容体非依存的に細胞膜を越えて輸送する能力を有するタンパク質又はキメラ配列のいずれかに由来する35アミノ酸未満の短鎖ペプチドである。CPPは、カチオン性ペプチド、疎水性配列を有するペプチド、両親媒性ペプチド、プロリンリッチな抗微生物配列を有するペプチド、及びキメラ又は双節型ペプチドであってもよい。CPPの例としては、例えば、Tat(これはHIV 1型によるウイルス複製に必要な核転写活性化因子タンパク質である)、ペネトラチン、カポジ線維芽細胞成長因子(FGF)シグナルペプチド配列、インテグリンβ3シグナルペプチド配列、ポリアルギニンペプチドArg配列、グアニンリッチ分子輸送体、及びスイートアローペプチドが挙げられる。CPP及びその使用方法については、例えば、Haellbrink et al.,“Prediction of cell-penetrating peptides,”Methods Mol.Biol.,2015;1324:39-58;Ramakrishna et al.,“Gene disruption by cell-penetrating peptide-mediated delivery of Cas9 protein and guide RNA,”Genome Res.,2014 Jun;24(6):1020-7;及び国際公開第2016205764号パンフレット(これらの各々は、本明細書において全体として参照により援用される)に記載されている。
本明細書に記載されるCRISPRシステムのための様々な送達方法はまた、例えば、米国特許第8795965号明細書、欧州特許第3009511号明細書、国際公開第2016205764号パンフレット、及び国際公開第2017070605号パンフレット(これらの各々は、本明細書において全体として参照により援用される)にも記載されている。
以下の例に本発明を更に記載するが、これらの例は、特許請求の範囲に記載される本発明の範囲を限定するものではない。
実施例1-CLUST.091979 CRISPR-Casシステムの成分の同定
このタンパク質ファミリーは、上記の計算方法を使用して同定された。CLUST.091979システムは、腸、ウシ腸、ヒト腸、ヒツジ腸、陸生、糞便、及び哺乳動物消化系環境に限定されない環境から採取された無培養のメタゲノム配列に見られるCRISPRシステムに関連するシングルエフェクターを含む(表5)。例示的なCLUST.091979エフェクターには、以下の表5及び表6に示されるものが含まれる。図1A~図1Lに示すように、配列番号1~4、14、15、17~19、21~25、27~33、35~49、51~56に記載のエフェクター配列をアラインメントして配列類似性の領域を同定した。バーグラフは配列類似性を示し、最も高いバーは最大配列類似性を有する残基を示す。非限定的な配列類似性の領域を表7に示す。配列類似性の領域は、本明細書に開示されるエフェクターがヌクレアーゼの代表的な保存C末端RuvCドメインを有するファミリーであることを示す。
このタンパク質ファミリーは、上記の計算方法を使用して同定された。CLUST.091979システムは、腸、ウシ腸、ヒト腸、ヒツジ腸、陸生、糞便、及び哺乳動物消化系環境に限定されない環境から採取された無培養のメタゲノム配列に見られるCRISPRシステムに関連するシングルエフェクターを含む(表5)。例示的なCLUST.091979エフェクターには、以下の表5及び表6に示されるものが含まれる。図1A~図1Lに示すように、配列番号1~4、14、15、17~19、21~25、27~33、35~49、51~56に記載のエフェクター配列をアラインメントして配列類似性の領域を同定した。バーグラフは配列類似性を示し、最も高いバーは最大配列類似性を有する残基を示す。非限定的な配列類似性の領域を表7に示す。配列類似性の領域は、本明細書に開示されるエフェクターがヌクレアーゼの代表的な保存C末端RuvCドメインを有するファミリーであることを示す。
これらのシステムのためのダイレクトリピート配列及びスペーサー長さの例を表8に示す。
実施例2-トランス活性化型RNAエレメントの同定
エフェクタータンパク質及びcrRNAに加え、本明細書に記載される一部のCRISPRシステムは、トランス活性化型RNA(tracrRNA)と呼ばれるロバストな酵素活性を活性化させる追加のスモールRNAも含み得る。このようなtracrRNAは、典型的には、crRNAにハイブリダイズする相補的領域を含む。crRNA-tracrRNAハイブリッドはエフェクターとの複合体を形成し、プログラム可能な酵素活性の活性化をもたらす。
・tracrRNA配列は、crRNAのダイレクトリピート部分と相同のショート配列モチーフのためのCRISPRアレイをフランキングするゲノム配列を検索することによって同定することができる。検索方法には、完全ダイレクトリピート(DR)又はDR部分配列についての完全又は縮重配列マッチングが含まれる。例えば、長さn個のヌクレオチドのDRは、重複する6~10nt kmerのセットに分解することができる。これらのkmerを、CRISPR遺伝子座をフランキングする配列とアラインメントすることができ、1以上のkmerアラインメントと相同の領域を、tracrRNAとしての実験的検証のためのDR相同性領域として同定することができる。或いは、RNA同時フォールド自由エネルギーを完全DR又はDR部分配列及びCRISPRシステムのエレメントをフランキングするゲノム配列からのショートkmer配列について計算することができる。低い最小自由エネルギー構造を有するフランキング配列エレメントを、tracrRNAとしての実験的検証のためのDR相同性領域として同定することができる。
・tracrRNAエレメントは、CRISPR関連遺伝子又はCRISPRアレイにごく近接して高頻度で生じる。tracrRNAエレメントを同定するためにDR相同性領域の検索の代替策として、CRISPRエフェクター又はCRISPRアレイをフランキングする非コード配列を、tracrRNAの直接実験的検証のためのクローニング又は遺伝子合成によって単離することができる。
・tracrRNAエレメントの実験的検証は、非天然種において異種発現されるCRISPRシステム又は合成配列のための宿主生物のスモールRNAシーケンシングを使用して実施することができる。由来ゲノム遺伝子座からのスモールRNA配列のアラインメントを使用してDR相同性領域を含む発現RNA産物及び完全tracrRNAエレメントに典型的な固定化プロセシングを同定することができる。
・RNAシーケンシングによって同定された完全tracrRNA候補は、crRNA及びエフェクターをtracrRNA候補と組み合わせて又は組み合わせずに発現させ、エフェクター酵素活性の活性化をモニタリングすることによってインビトロ又はインビボで検証することができる。
・エンジニアリングされた構築物において、tracrRNAの発現は、哺乳動物細胞における発現のためのU6、U1、及びH1プロモーター又は細菌における発現のためのJ23119プロモーターを含むがこれらに限定されないプロモーターによってドライブすることができる。
・一部の例において、tracrRNAはcrRNAと融合させ、シングルRNAガイドとして発現させることができる。
・システムは、表9に列記される非コード配列内に含まれるtracrRNAを含み得る。例えば、一部の実施形態において、システムは、配列番号152~204のいずれか1つに記載されるtracrRNAを含む。
エフェクタータンパク質及びcrRNAに加え、本明細書に記載される一部のCRISPRシステムは、トランス活性化型RNA(tracrRNA)と呼ばれるロバストな酵素活性を活性化させる追加のスモールRNAも含み得る。このようなtracrRNAは、典型的には、crRNAにハイブリダイズする相補的領域を含む。crRNA-tracrRNAハイブリッドはエフェクターとの複合体を形成し、プログラム可能な酵素活性の活性化をもたらす。
・tracrRNA配列は、crRNAのダイレクトリピート部分と相同のショート配列モチーフのためのCRISPRアレイをフランキングするゲノム配列を検索することによって同定することができる。検索方法には、完全ダイレクトリピート(DR)又はDR部分配列についての完全又は縮重配列マッチングが含まれる。例えば、長さn個のヌクレオチドのDRは、重複する6~10nt kmerのセットに分解することができる。これらのkmerを、CRISPR遺伝子座をフランキングする配列とアラインメントすることができ、1以上のkmerアラインメントと相同の領域を、tracrRNAとしての実験的検証のためのDR相同性領域として同定することができる。或いは、RNA同時フォールド自由エネルギーを完全DR又はDR部分配列及びCRISPRシステムのエレメントをフランキングするゲノム配列からのショートkmer配列について計算することができる。低い最小自由エネルギー構造を有するフランキング配列エレメントを、tracrRNAとしての実験的検証のためのDR相同性領域として同定することができる。
・tracrRNAエレメントは、CRISPR関連遺伝子又はCRISPRアレイにごく近接して高頻度で生じる。tracrRNAエレメントを同定するためにDR相同性領域の検索の代替策として、CRISPRエフェクター又はCRISPRアレイをフランキングする非コード配列を、tracrRNAの直接実験的検証のためのクローニング又は遺伝子合成によって単離することができる。
・tracrRNAエレメントの実験的検証は、非天然種において異種発現されるCRISPRシステム又は合成配列のための宿主生物のスモールRNAシーケンシングを使用して実施することができる。由来ゲノム遺伝子座からのスモールRNA配列のアラインメントを使用してDR相同性領域を含む発現RNA産物及び完全tracrRNAエレメントに典型的な固定化プロセシングを同定することができる。
・RNAシーケンシングによって同定された完全tracrRNA候補は、crRNA及びエフェクターをtracrRNA候補と組み合わせて又は組み合わせずに発現させ、エフェクター酵素活性の活性化をモニタリングすることによってインビトロ又はインビボで検証することができる。
・エンジニアリングされた構築物において、tracrRNAの発現は、哺乳動物細胞における発現のためのU6、U1、及びH1プロモーター又は細菌における発現のためのJ23119プロモーターを含むがこれらに限定されないプロモーターによってドライブすることができる。
・一部の例において、tracrRNAはcrRNAと融合させ、シングルRNAガイドとして発現させることができる。
・システムは、表9に列記される非コード配列内に含まれるtracrRNAを含み得る。例えば、一部の実施形態において、システムは、配列番号152~204のいずれか1つに記載されるtracrRNAを含む。
実施例3-酵素活性の新規RNAモジュレーターの同定
エフェクタータンパク質及びcrRNAに加え、本明細書に記載される一部のCRISPRシステムは、本明細書においてRNAモジュレーターと称される、エフェクター活性を活性化又は調節するための追加のスモールRNAも含み得る。
・RNAモジュレーターは、CRISPR関連遺伝子又はCRISPRアレイにごく近接して生じると予測される。RNAモジュレーターを同定及び検証するため、CRISPRエフェクター又はCRISPRアレイをフランキングする非コード配列を、直接実験的検証のためのクローニング又は遺伝子合成によって単離することができる。
・RNAモジュレーターの実験的検証は、非天然種において異種発現されるCRISPRシステム又は合成配列のための宿主生物のスモールRNAシーケンシングを使用して実施することができる。由来ゲノム遺伝子座に対するスモールRNA配列のアラインメントを使用してDR相同性領域を含む発現RNA産物及び固定化プロセシングを同定することができる。
・RNAシーケンシングによって同定された候補RNAモジュレーターは、crRNA及びエフェクターを候補RNAモジュレーターと組み合わせて又は組み合わせずに発現させ、エフェクター酵素活性の変化をモニタリングすることによってインビトロ又はインビボで検証することができる。
・エンジニアリングされた構築物において、RNAモジュレーターは、哺乳動物細胞における発現のためのU6、U1、及びH1プロモーター、又は細菌における発現のためのJ23119プロモーターを含むがこれらに限定されないプロモーターによってドライブすることができる。
・一部の例において、RNAモジュレーターはcrRNA、tracrRNAのいずれか、又はその両方と人工的に融合させ、シングルRNAエレメントとして発現させることができる。
エフェクタータンパク質及びcrRNAに加え、本明細書に記載される一部のCRISPRシステムは、本明細書においてRNAモジュレーターと称される、エフェクター活性を活性化又は調節するための追加のスモールRNAも含み得る。
・RNAモジュレーターは、CRISPR関連遺伝子又はCRISPRアレイにごく近接して生じると予測される。RNAモジュレーターを同定及び検証するため、CRISPRエフェクター又はCRISPRアレイをフランキングする非コード配列を、直接実験的検証のためのクローニング又は遺伝子合成によって単離することができる。
・RNAモジュレーターの実験的検証は、非天然種において異種発現されるCRISPRシステム又は合成配列のための宿主生物のスモールRNAシーケンシングを使用して実施することができる。由来ゲノム遺伝子座に対するスモールRNA配列のアラインメントを使用してDR相同性領域を含む発現RNA産物及び固定化プロセシングを同定することができる。
・RNAシーケンシングによって同定された候補RNAモジュレーターは、crRNA及びエフェクターを候補RNAモジュレーターと組み合わせて又は組み合わせずに発現させ、エフェクター酵素活性の変化をモニタリングすることによってインビトロ又はインビボで検証することができる。
・エンジニアリングされた構築物において、RNAモジュレーターは、哺乳動物細胞における発現のためのU6、U1、及びH1プロモーター、又は細菌における発現のためのJ23119プロモーターを含むがこれらに限定されないプロモーターによってドライブすることができる。
・一部の例において、RNAモジュレーターはcrRNA、tracrRNAのいずれか、又はその両方と人工的に融合させ、シングルRNAエレメントとして発現させることができる。
実施例4-エンジニアリングされたCLUST.091979 CRISPR-Casシステムの機能検証
CLUST.091979 CRISPR-Casシステムの成分を特定した後、AUXO013988882と称されるメタゲノムソース(配列番号1)及びSRR3181151と称されるメタゲノムソース(配列番号4)からの遺伝子座を機能検証のために選択した。
CLUST.091979 CRISPR-Casシステムの成分を特定した後、AUXO013988882と称されるメタゲノムソース(配列番号1)及びSRR3181151と称されるメタゲノムソース(配列番号4)からの遺伝子座を機能検証のために選択した。
DNA合成及びエフェクターライブラリクローニング
例示的なCLUST.091979 CRISPR-Casシステムの活性を試験するために、pET28a(+)ベクターを使用してシステムを設計及び合成した。簡潔に言えば、CLUST.091979 AUXO013988882エフェクター(表6に示される配列番号1)をコードする大腸菌(E.coli)コドン最適化核酸配列及びCLUST.091979 SRR3181151エフェクター(表6に示される配列番号4)をコードする大腸菌(E.coli)コドン最適化核酸配列を合成し(Genscript)、pET-28a(+)(EMD-Millipore)に由来するカスタム発現システムに個別にクローニングした。ベクターは、lacプロモーター及び大腸菌(E.coli)リボソーム結合配列の制御下にあるCLUST.091979エフェクターをコードする核酸を含んでいた。ベクターはまた、CLUST.091979エフェクターのオープンリーディングフレームに続くJ23119プロモーターによってドライブされるCRISPRアレイライブラリのアクセプター部位も含んでいた。表9に示すように、CLUST.091979 AUXO013988882エフェクター(配列番号1)に使用される非コード配列は配列番号98に記載され、CLUST.091979 SRR3181151エフェクター(配列番号4)に使用される非コード配列は配列番号99に記載される。CLUST.091979エフェクターが非コード配列なしでpET28a(+)に個別にクローニングされた、追加の条件が試験された。図4Aを参照されたい。
例示的なCLUST.091979 CRISPR-Casシステムの活性を試験するために、pET28a(+)ベクターを使用してシステムを設計及び合成した。簡潔に言えば、CLUST.091979 AUXO013988882エフェクター(表6に示される配列番号1)をコードする大腸菌(E.coli)コドン最適化核酸配列及びCLUST.091979 SRR3181151エフェクター(表6に示される配列番号4)をコードする大腸菌(E.coli)コドン最適化核酸配列を合成し(Genscript)、pET-28a(+)(EMD-Millipore)に由来するカスタム発現システムに個別にクローニングした。ベクターは、lacプロモーター及び大腸菌(E.coli)リボソーム結合配列の制御下にあるCLUST.091979エフェクターをコードする核酸を含んでいた。ベクターはまた、CLUST.091979エフェクターのオープンリーディングフレームに続くJ23119プロモーターによってドライブされるCRISPRアレイライブラリのアクセプター部位も含んでいた。表9に示すように、CLUST.091979 AUXO013988882エフェクター(配列番号1)に使用される非コード配列は配列番号98に記載され、CLUST.091979 SRR3181151エフェクター(配列番号4)に使用される非コード配列は配列番号99に記載される。CLUST.091979エフェクターが非コード配列なしでpET28a(+)に個別にクローニングされた、追加の条件が試験された。図4Aを参照されたい。
「リピート-スペーサー-リピート」配列を含むオリゴヌクレオチドライブラリ合成(OLS)プールが計算的に設計され、ここで、「リピート」は、エフェクターに関連するCRISPRアレイに見られるコンセンサスダイレクトリピート配列に相当し、「スペーサー」は、pACYC184プラスミド又は大腸菌(E.coli)必須遺伝子をタイリング(tiling)する配列に相当する。特に、表8に示すように、CLUST.091979 AUXO013988882エフェクター(配列番号1)に使用されるリピート配列は配列番号57に記載され、091979 SRR3181151エフェクター(配列番号4)に使用されるリピート配列は配列番号60に記載される。スペーサー長さは、内因性CRISPRアレイに見られるスペーサー長さの最頻値によって決定した。リピート-スペーサー-リピート配列には、前述のCRISPRアレイライブラリアクセプター部位、及びより大規模なプールからの特異的リピート-スペーサー-リピートライブラリの特定の増幅を実現するユニークなPCRプライミング部位への断片の双方向クローニングを実現する、制限部位が付加された。
次に、Golden Gateアセンブリ法を使用して、リピート-スペーサー-リピートライブラリをプラスミドにクローニングした。簡潔に言えば、本発明者らは初めに、ユニークなPCRプライマーを使用してOLSプール(Agilent Genomics)から各リピート-スペーサー-リピートを増幅し、BsaIを使用してプラスミド骨格を事前に線形化して、潜在的バックグラウンドを低減した両方のDNA断片は、Golden Gateアセンブリマスターミックス(New England Biolabs)に添加する前に、Ampure XP(Beckman Coulter)で精製し、製造者の指示に従ってインキュベートした。Golden Gate反応物を更に精製及び濃縮して、細菌スクリーニングの後続のステップで最大の形質転換効率を実現した。
異なるリピート-スペーサー-リピートエレメントとCRISPRエフェクターとを含むプラスミドライブラリを、Lucigenが推奨するプロトコルに従ってGene Pulser Xcell(登録商標)(Bio-rad)を使用してE.CloniエレクトロコンピテントなE.coli(Lucigen)に電気穿孔した。ライブラリを、精製pACYC184プラスミドで共形質転換するか、又はpACYC184を含むE.Cloniエレクトロコンピテントな大腸菌(E.coli)(Lucigen)に直接形質転換し、BioAssay(登録商標)ディッシュ(Thermo Fisher)のクロラムフェニコール(Fisher)、テトラサイクリン(Alfa Aesar)、カナマイシン(Alfa Aesar)を含む寒天培地に播種し、37℃で10~12時間インキュベートした。近似コロニー数を推定して細菌プレート上に十分なライブラリ提示を確保した後、細菌を回収し、QIAprep Spin Miniprep(登録商標)キット(Qiagen)を使用してプラスミドDNAを抽出し、「出力ライブラリ」を作成した。Illuminaシーケンシングケミストリーに適合性のあるバーコード及び部位を含むカスタムプライマーを使用してPCRを実行することにより、形質変換前の「入力ライブラリ」及び回収後の「出力ライブラリ」の両方からバーコード付きの次世代シーケンシングライブラリを生成し、これをプールし、Nextseq550(Illumina)にロードして、エフェクターを評価した。一貫性を確保するために、各スクリーンに対して少なくとも2つの独立したバイオロジカルレプリケートが実施された。図4Bを参照されたい。
細菌スクリーンシーケンシング解析
Illumina bcl2fastqを使用してスクリーン入力及び出力ライブラリの次世代シーケンシングデータをデマルチプレックス化した。各試料について得られたfastqファイル中のリードが、スクリーニングプラスミドライブラリ用のCRISPRアレイエレメントを含んだ。CRISPRアレイのダイレクトリピート配列を用いてアレイの向きを決定し、スペーサー配列をソース(pACYC184又はE.Cloni)又は陰性対照配列(GFP)にマッピングすることにより対応する標的を決定した。各試料について、所与のプラスミドライブラリ中の各ユニークなアレイエレメントのリード総数(ra)をカウントし、以下のとおり規格化した:(ra+1)/全てのライブラリアレイエレメントの総リード数。所与のアレイエレメントに関する規格化出力リード数を規格化入力リード数で除すことにより、枯渇スコアを計算した。
Illumina bcl2fastqを使用してスクリーン入力及び出力ライブラリの次世代シーケンシングデータをデマルチプレックス化した。各試料について得られたfastqファイル中のリードが、スクリーニングプラスミドライブラリ用のCRISPRアレイエレメントを含んだ。CRISPRアレイのダイレクトリピート配列を用いてアレイの向きを決定し、スペーサー配列をソース(pACYC184又はE.Cloni)又は陰性対照配列(GFP)にマッピングすることにより対応する標的を決定した。各試料について、所与のプラスミドライブラリ中の各ユニークなアレイエレメントのリード総数(ra)をカウントし、以下のとおり規格化した:(ra+1)/全てのライブラリアレイエレメントの総リード数。所与のアレイエレメントに関する規格化出力リード数を規格化入力リード数で除すことにより、枯渇スコアを計算した。
酵素活性及び細菌細胞死を生じさせる特異的パラメータを同定するため、本発明者らは次世代シーケンシング(NGS)を用いて入力及び出力プラスミドライブラリのPCR産物中における個々のCRISPRアレイ(即ち、リピート-スペーサー-リピート)の表現を定量化し、比較した。アレイの枯渇率は、規格化された出力リード数を規格化された入力リード数で割ったものとして定義された。枯渇率が0.3未満(3倍を超える枯渇)の場合、アレイは「強力に枯渇した」と見なし、図5及び図8に破線で示した。バイオロジカルレプリケートにわたるアレイ枯渇率を計算する際には、全実験にわたる所与のCRISPRアレイについての最大枯渇率の値をとった(即ち、強力に枯渇したアレイは、全てのバイオロジカルレプリケートで強力に枯渇していなければならない)。各スペーサー標的について、アレイ枯渇率及び以下の特徴:標的鎖、転写物ターゲティング、ORIターゲティング、標的配列モチーフ、フランキング配列モチーフ、及び標的二次構造を含む行列を作成した。この行列中の異なる特徴がCLUST.091979システムについての標的枯渇を説明する程度を調査した。
図5及び図8は、所与の標的について、スクリーン出力対スクリーン入力におけるシーケンシングリードの規格化された比率をプロットすることによる、非コード配列と共にエンジニアリングされたCLUST.091979組成物の干渉活性の程度を示す。結果は各DR転写方向につきプロットされる。組成物の機能的スクリーニングにおいて、活性RNAガイドと複合体を形成した活性エフェクターは、クロラムフェニコール及びテトラサイクリンに対する大腸菌(E.coli)耐性を付与するpACYC184の能力に干渉し、細胞死及びプール内のスペーサーエレメントの枯渇をもたらす。初期DNAライブラリ(画面入力)と生存形質転換大腸菌(画面出力)のディープシーケンスの結果を比較すると、活性でプログラム可能なCRISPRシステムを可能にする特定の標的配列及びDR転写方向が示唆される。スクリーンはまた、エフェクター複合体がDRの1つの方向でのみ活性であることも示す。このように、スクリーンは、CLUST.091979 AUXO013988882エフェクターがDRの「順」方向(5’-ACTA…AACT-[スペーサー]-3’)で活性であったこと(図5)、及びCLUST.091979 SRR3181151エフェクターがDRの「逆」方向(5’-CCTG…CAAC-[スペーサー]-3’)で活性であったこと(図8)を示した。
図6A及び図6Bは、それぞれ、pACYC184及び大腸菌(E.coli)E.Cloni必須遺伝子を標的化するCLUST.091979 AUXO013988882エフェクター(+非コード配列)についての強力に枯渇した標的の位置を示す。同様に、図9A及び図9Bは、それぞれ、pACYC184及び大腸菌(E.coli)E.Cloni必須遺伝子を標的化するCLUST.091979 SRR3181151エフェクターについての強力に枯渇した標的の位置を示す。枯渇した標的の隣接配列を分析して、CLUST.091979 AUXO013988882及びCLUST.091979 SRR3181151のPAM配列を決定した。CLUST.091979 AUXO013988882及びCLUST.091979 SRR3181151のPAM配列のWebLogo表現(Crooks et al.,Genome Research 14:1188-90,2004)は、それぞれ図7及び図10に示され、位置「20」は、標的の5’末端に隣接するヌクレオチドに対応する。
したがって、CLUST.091979 CRISPR-Casの複数のエフェクターがインビボで活性を示す。
実施例5-CLUST.091979による哺乳動物遺伝子のターゲティング
この実施例は、一過性トランスフェクションによって哺乳動物細胞に導入されたCLUST.091979からのヌクレアーゼを使用する複数の標的に対するインデル評価を説明する。
この実施例は、一過性トランスフェクションによって哺乳動物細胞に導入されたCLUST.091979からのヌクレアーゼを使用する複数の標的に対するインデル評価を説明する。
配列番号4、配列番号8、及び配列番号10のエフェクターをpcda3.1骨格(Invitrogen)にクローニングした。次に、プラスミドをマキシプレップし、1μg/μLに希釈した。RNAガイドの調製では、crRNAをコードするdsDNA断片は、標的配列の足場及びU6プロモーターを含むウルトラマー(ultramer)によって誘導された。ウルトラマーを10mMのTris・HClにpH7.5で再懸濁し、最終ストック濃度を100μMにした。続いてワーキングストックを10μMに希釈し、再度10mM Tris・HClを使用して、PCR反応の鋳型として使用した。crRNAの増幅は、次の成分を用いた50μLの反応物で行われた:前述の鋳型0.02μl、フォワードプライマー2.5μl、リバースプライマー2.5μl、NEB HiFiポリメラーゼ25μL、及び水20μl。サイクリング条件は、1×(98℃で30秒)、30×(98℃で10秒、67℃で15秒)、1×(72℃で2分)であった。PCR産物は1.8X SPRI処理でクリーンアップされ、25ng/μLに規格化された。調製されたcrRNA配列及びそれらの対応する標的配列は表10に示される。配列番号205、配列番号207、配列番号252、配列番号254、配列番号256、配列番号258、配列番号260、配列番号262、配列番号264、配列番号266、配列番号268、配列番号270、配列番号272、配列番号274、及び配列番号276の成熟crRNAのダイレクトリピート配列は配列番号60に記載される。配列番号209及び配列番号214の成熟crRNAのダイレクトリピートは配列番号62に記載される。配列番号211、配列番号278、配列番号280、配列番号282、配列番号284、配列番号286、及び配列番号288の成熟crRNAのダイレクトリピートは配列番号213に記載される。
トランスフェクションの約16時間前に、DMEM/10%FBS+Pen/Strep中の25,000個のHEK293T細胞100μlを96ウェルプレートの各ウェルにプレーティングした。トランスフェクションの日、細胞は70~90%コンフルエントであった。トランスフェクトするウェルごとに、0.5μlのLipofectamine2000と9.5μlのOpti-MEMの混合物を調製し、次に室温で5~20分間インキュベートした(溶液1)。インキュベーション後、lipofectamine:OptiMEM混合物を、182ngのエフェクタープラスミド及び14ngのcrRNA及び最大10μLの水を含む別の混合物に添加した(溶液2)。陰性対照の場合、crRNAは溶液2に含まれていなかった。溶液1と溶液2の混合物をピペッティングにより上下に混合し、次に室温で25分間インキュベートした。インキュベーション後、20μLの溶液1と溶液2の混合物を、細胞を含む96ウェルプレートの各ウェルに滴下した。トランスフェクションの72時間後、各ウェルの中央に10μLのTrypLEを添加して細胞をトリプシン処理し、約5分間インキュベートする。次に、100μLのD10培地を各ウェルに加え、混合して細胞を再懸濁した。次に細胞を500gで10分間スピンダウンし、上清を廃棄した。QuickExtract緩衝液を、元の細胞懸濁液量の1/5に加えた。細胞を65℃で15分間、68℃で15分間、98℃で10分間インキュベートした。
次世代シーケンシング用の試料は、2ラウンドのPCRによって調製された。第1のラウンド(PCR1)は、標的に応じて特定のゲノム領域を増幅するために使用された。PCR1産物はカラム精製により精製した。PCRラウンド2(PCR2)は、Illuminaのアダプター及びインデックスを付加するために行われた。次に、反応物をプールし、カラム精製によって精製した。シーケンシングの実行は、150サイクルのNextSeq v2.5の中出力又は高出力キットで行われた。
図11A、図11B、図11C、及び図11Dは、それぞれ、配列番号4又は配列番号10のエフェクターでトランスフェクションした後のHEK293T細胞におけるAAVS1、VEGFA、及びEMX1標的遺伝子座のパーセントインデルを示す。バーは2つのバイオ複製物で測定されたインデルの平均パーセントを反映する。配列番号4及び配列番号10のエフェクターについて、パーセントインデルは、標的のそれぞれにおいて陰性対照のパーセントインデルよりも高かった。
図11Aに示すように、配列番号4のエフェクター及び配列番号205のcrRNAによって形成される複合体は配列番号206のAAVS1標的において活性であり、配列番号4のエフェクター及び配列番号207のcrRNAによって形成される複合体は配列番号208のVEGFA標的において活性であった。図11Bに示すように、配列番号4のエフェクター及び配列番号252のcrRNAによって形成される複合体は配列番号253のAAVS1標的において活性であり、配列番号4のエフェクター及び配列番号254のcrRNAによって形成される複合体は配列番号255のAAVS1標的において活性であり、配列番号4のエフェクター及び配列番号256のcrRNAによって形成される複合体は配列番号257のAAVS1標的において活性であり、配列番号4のエフェクター及び配列番号258のcrRNAによって形成される複合体は配列番号259のAAVS1標的において活性であり、配列番号4のエフェクター及び配列番号274のcrRNAによって形成される複合体は配列番号275のAAVS1標的において活性であった。図11Bに示すように、配列番号4のエフェクター及び配列番号260のcrRNAによって形成される複合体は配列番号261のEMX1標的において活性であった。同様に図11Bに示すように、配列番号4のエフェクター及び配列番号262のcrRNAによって形成される複合体は配列番号263のVEGFA1標的において活性であり、配列番号4のエフェクター及び配列番号264のcrRNAによって形成される複合体は配列番号265のVEGFA1標的において活性であり、配列番号4のエフェクター及び配列番号266のcrRNAによって形成される複合体は配列番号267のVEGFA1標的において活性であり、配列番号4のエフェクター及び配列番号268のcrRNAによって形成される複合体は配列番号269のVEGFA1標的において活性であり、配列番号4のエフェクター及び配列番号270のcrRNAによって形成される複合体は配列番号271のVEGFA1標的において活性であり、配列番号4のエフェクター及び配列番号272のcrRNAによって形成される複合体は配列番号273のVEGFA1標的において活性であり、配列番号4のエフェクター及び配列番号274のcrRNAによって形成される複合体は配列番号275のVEGFA1標的において活性であった。配列番号4のエフェクターは、図11A及び図11Bにおける標的のそれぞれについて5’-TTTG-3’PAMを利用した。
図11Cに示すように、配列番号10のエフェクター及び配列番号209のcrRNAによって形成される複合体は配列番号210のAAVS1標的において活性であり、配列番号10のエフェクター及び配列番号211のcrRNAによって形成される複合体は配列番号212のAAVS1標的において活性であり、配列番号10のエフェクター及び配列番号214のcrRNAによって形成される複合体は配列番号215のVEGFA標的において活性であった。図11Dに示すように、配列番号10のエフェクター及び配列番号278のcrRNAによって形成される複合体は配列番号279のAAVS1標的において活性であり、配列番号10のエフェクター及び配列番号280のcrRNAによって形成される複合体は配列番号281のAAVS1標的において活性であり、配列番号10のエフェクター及び配列番号284のcrRNAによって形成される複合体は配列番号285のAAVS1標的において活性であり、配列番号10のエフェクター及び配列番号286のcrRNAによって形成される複合体は配列番号287のAAVS1標的において活性であった。同様に図11Dに示すように、配列番号10のエフェクター及び配列番号288のcrRNAによって形成される複合体は配列番号289のEMX1標的において活性であり、配列番号10のエフェクター及び配列番号282のcrRNAによって形成される複合体は配列番号283のVEGFA標的において活性であった。配列番号10のエフェクターは、図11C及び図11Dにおける標的について5’-ATTG-3’PAM及び5’-GTTA-3’PAMを利用した。
この実施例は、CLUST.091979ファミリーのヌクレアーゼが哺乳動物細胞において活性を有することを示唆している。
他の実施形態
本発明はその詳細な説明を伴い説明されているが、前述の説明は例示であり、添付の特許請求の範囲によって定義される本発明の範囲を限定する意図はないことが理解されるべきである。他の態様、利点、及び変形例が、以下の特許請求の範囲内にある。
本発明はその詳細な説明を伴い説明されているが、前述の説明は例示であり、添付の特許請求の範囲によって定義される本発明の範囲を限定する意図はないことが理解されるべきである。他の態様、利点、及び変形例が、以下の特許請求の範囲内にある。
Claims (121)
- CLUST.091979のエンジニアリングされた天然に存在しないクラスター化して規則的な配置の短い回文配列リピート(CRISPR)-Casシステムであって、
(a)CRISPR関連タンパク質が配列番号241のアミノ酸配列を含む、CRISPR関連タンパク質又は前記CRISPR関連タンパク質をコードする核酸;及び
(b)ダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイド
を含み、
前記CRISPR関連タンパク質が、前記RNAガイドに結合し、前記スペーサー配列に相補的な前記標的核酸配列を修飾することができる、CRISPR-Casシステム。 - 前記CRISPR関連タンパク質が、配列番号4、配列番号10、配列番号12、又は配列番号14に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、請求項1に記載のシステム。
- CLUST.091979のエンジニアリングされた天然に存在しないクラスター化して規則的な配置の短い回文配列リピート(CRISPR)-Casシステムであって、
(a)CRISPR関連タンパク質が配列番号1~56のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、CRISPR関連タンパク質又は前記CRISPR関連タンパク質をコードする核酸;及び
(b)ダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイド
を含み、
前記CRISPR関連タンパク質が、前記RNAガイドに結合し、前記スペーサー配列に相補的な前記標的核酸配列を修飾することができる、CRISPR-Casシステム。 - 前記CRISPR関連タンパク質が、少なくとも1つのRuvCドメイン又は少なくとも1つの分割されたRuvCドメインを含む、請求項3に記載のシステム。
- 前記CRISPR関連タンパク質が、以下の配列の1つ以上:
(a)PX1X2X3X4F(配列番号216)(ここで、X1はL又はM又はI又はC又はFであり、X2はY又はW又はFであり、X3はK又はT又はC又はR又はW又はY又はH又はVであり、X4はI又はL又はMである);
(b)RX1X2X3L(配列番号217)(ここで、X1はI又はL又はM又はY又はT又はFであり、X2はR又はQ又はK又はE又はS又はTであり、X3はL又はI又はT又はC又はM又はKである);
(c)NX1YX2(配列番号218)(ここで、X1はI又はL又はFであり、X2はK又はR又はV又はEである);
(d)KX1X2X3FAX4X5KD(配列番号219)(ここで、X1はT又はI又はN又はA又はS又はF又はVであり、X2はI又はV又はL又はSであり、X3はH又はS又はG又はRであり、X4はD又はS又はEであり、X5はI又はV又はM又はT又はNである);
(e)LX1NX2(配列番号220)(ここで、X1はG又はS又はC又はTであり、X2はN又はY又はK又はSである);
(f)PX1X2X3X4SQX5DS(配列番号221)(ここで、X1はS又はP又はAであり、X2はY又はS又はA又はP又はE又はY又はQ又はNであり、X3はF又はY又はHであり、X4はT又はSであり、X5はM又はT又はIである);
(g)KX1X2VRX3X4QEX5H(配列番号222)(ここで、X1はN又はK又はW又はR又はE又はT又はYであり、X2はM又はR又はL又はS又はK又はV又はE又はT又はI又はDであり、X3はL又はR又はH又はP又はT又はK又はPのQ又はS又はAであり、X4はG又はQ又はN又はR又はK又はE又はI又はT又はS又はCであり、X5はR又はW又はY又はK又はT又はF又はS又はQである);及び
(h)X1NGX2X3X4DX5NX6X7X8N(配列番号223)(ここで、X1はI又はK又はV又はLであり、X2はL又はMであり、X3はN又はH又はPであり、X4はA又はS又はCであり、X5はV又はY又はI又はF又はT又はNであり、X6はA又はSであり、X7はS又はA又はPであり、X8はM又はC又はL又はR又はN又はS又はK又はLである)
を含む、請求項3又は4に記載のシステム。 - 前記ダイレクトリピート配列が、配列番号57~90、配列番号118~151、又は配列番号213のいずれか1つに記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項3~5のいずれか一項に記載のシステム。
- 前記ダイレクトリピート配列が、配列番号57~90、配列番号118~151、又は配列番号213のいずれか1つに記載のヌクレオチド配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項6に記載のシステム。
- 前記ダイレクトリピート配列が、以下の配列の1つ以上:
(a)X1X2TX3X4X5X6X7X8(配列番号224)(ここで、X1はA又はC又はGであり、X2はT又はC又はAであり、X3はT又はG又はAであり、X4はT又はGであり、X5はT又はG又はAであり、X6はG又はT又はAであり、X7はT又はG又はAであり、X8はA又はG又はTである);
(b)X1X2X3X4X5X6X7X8X9(配列番号226)(ここで、X1はT又はC又はAであり、X2はT又はA又はGであり、X3はT又はC又はAであり、X4はT又はAであり、X5はT又はA又はGであり、X6はT又はAであり、X7はA又はTであり、X8はA又はG又はC又はTであり、X9はG又はA又はCである);及び
(c)X1X2X3AC(配列番号228)(ここで、X1はA又はC又はGであり、X2はC又はAであり、X3はA又はCである)
を含む、請求項3~7のいずれか一項に記載のシステム。 - 前記CRISPR関連タンパク質が、配列番号1に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、前記ダイレクトリピート配列が、配列番号57に記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項3~8のいずれか一項に記載のシステム。
- 前記CRISPR関連タンパク質が、配列番号1に記載のアミノ酸配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、前記ダイレクトリピート配列が、配列番号57に記載のヌクレオチド配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項9に記載のシステム。
- 前記CRISPR関連タンパク質が、配列番号1に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、前記CRISPR関連タンパク質が、プロトスペーサー隣接モチーフ(PAM)配列の認識能を有し、前記PAM配列が、5’-TNNT-3’又は5’-TNRT-3’として記載される核酸配列を含み、「N」は任意のヌクレオチドであり、「R」はA又はGである、請求項3~8のいずれか一項に記載のシステム。
- 前記CRISPR関連タンパク質が、配列番号1に記載のアミノ酸配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)同一性を有するタンパク質であり、前記CRISPR関連タンパク質が、PAM配列の認識能を有し、前記PAM配列が、5’-TNNT-3’又は5’-TNRT-3’として記載される核酸配列を含み、「N」は任意のヌクレオチドであり、「R」はA又はGである、請求項11に記載のシステム。
- 前記CRISPR関連タンパク質が、配列番号4に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一性を有するタンパク質であり、前記ダイレクトリピート配列が、配列番号60に記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項3~8のいずれか一項に記載のシステム。
- 前記CRISPR関連タンパク質が、配列番号4に記載のアミノ酸配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、前記ダイレクトリピート配列が、配列番号60に記載のヌクレオチド配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項13に記載のシステム。
- 前記CRISPR関連タンパク質が、配列番号4に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、前記CRISPR関連タンパク質が、PAM配列の認識能を有し、前記PAM配列が、5’-NTTN-3’、5’-NTTR-3’(例えば、5’-TTTG-3’)、又は5’-NNR-3’として記載される核酸配列を含み、「N」は任意のヌクレオチドであり、「R」はA又はGである、請求項3~8のいずれか一項に記載のシステム。
- 前記CRISPR関連タンパク質が、配列番号4に記載のアミノ酸配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、前記CRISPR関連タンパク質が、PAM配列を認識することができ、前記PAM配列が、5’-NTTN-3’、5’-NTTR-3’(例えば、5’-TTTG-3’)、又は5’-NNR-3’として記載される核酸配列を含み、ここで、「N」は任意のヌクレオチドであり、「R」はA又はGである、請求項15に記載のシステム。
- 前記CRISPR関連タンパク質が、配列番号10に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、前記ダイレクトリピート配列が、配列番号62又は配列番号213に記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項3~8のいずれか一項に記載のシステム。
- 前記CRISPR関連タンパク質が、配列番号10に記載のアミノ酸配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、前記ダイレクトリピート配列が、配列番号62又は配列番号213に記載のヌクレオチド配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項17に記載のシステム。
- 前記CRISPR関連タンパク質が、配列番号10に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、前記CRISPR関連タンパク質が、PAM配列の認識能を有し、前記PAM配列が、5’-NTTN-3’又は5’-RTTR-3’(例えば、5’-ATTG-3’又は5’-GTTA-3’)として記載される核酸配列を含み、「N」は任意のヌクレオチドであり、「R」はA又はGである、請求項3~8のいずれか一項に記載のシステム。
- 前記CRISPR関連タンパク質が、配列番号10に記載のアミノ酸配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、前記CRISPR関連タンパク質が、PAM配列の認識能を有し、前記PAM配列が、5’-NTTN-3’又は5’-RTTR-3’(例えば、5’-ATTG-3’又は5’-GTTA-3’)として記載される核酸配列を含み、「N」は任意のヌクレオチドであり、「R」はA又はGである、請求項19に記載のシステム。
- 前記RNAガイドの前記スペーサー配列が、約15ヌクレオチド~約55ヌクレオチドを含む、請求項1~20のいずれか一項に記載のシステム。
- 前記RNAガイドの前記スペーサー配列が、20~45ヌクレオチドを含む、請求項21に記載のシステム。
- 前記CRISPR関連タンパク質が、触媒残基(例えば、アスパラギン酸又はグルタミン酸)を含む、請求項1~22のいずれか一項に記載のシステム。
- 前記CRISPR関連タンパク質が、前記標的核酸を切断する、請求項1~23のいずれか一項に記載のシステム。
- 前記CRISPR関連タンパク質が、ペプチドタグ、蛍光タンパク質、塩基編集ドメイン、DNAメチル化ドメイン、ヒストン残基修飾ドメイン、局在化因子、転写修飾因子、光ゲート制御因子、化学誘導性因子、又はクロマチン可視化因子を更に含む、請求項1~24のいずれか一項に記載のシステム。
- 前記CRISPR関連タンパク質をコードする前記核酸が、細胞での発現にコドン最適化される、請求項1~25のいずれか一項に記載のシステム。
- 前記CRISPR関連タンパク質をコードする前記核酸が、プロモーターに作動可能に連結されている、請求項1~26のいずれか一項に記載のシステム。
- 前記CRISPR関連タンパク質をコードする前記核酸が、ベクター内にある、請求項1~27のいずれか一項に記載のシステム。
- 前記ベクターが、レトロウイルスベクター、レンチウイルスベクター、ファージベクター、アデノウイルスベクター、アデノ随伴ベクター、又は単純ヘルペスベクターを含む、請求項28に記載のシステム。
- 前記標的核酸がDNA分子である、請求項1~29のいずれか一項に記載のシステム。
- 前記CRISPR関連タンパク質が、非特異的ヌクレアーゼ活性を含む、請求項1~30のいずれか一項に記載のシステム。
- 前記CRISPR関連タンパク質及びRNAガイドによる前記標的核酸の認識により、前記標的核酸の修飾が生じる、請求項1~31のいずれか一項に記載のシステム。
- 前記標的核酸の前記修飾が、二本鎖切断イベントである、請求項32に記載のシステム。
- 前記標的核酸の前記修飾が、一本鎖切断イベントである、請求項32に記載のシステム。
- 前記標的核酸の前記修飾により、挿入イベントが生じる、請求項32に記載のシステム。
- 前記標的核酸の前記修飾により、欠失イベントが生じる、請求項32に記載のシステム。
- 前記標的核酸の前記修飾により細胞毒性又は細胞死が生じる、請求項32~36のいずれか一項に記載のシステム。
- ドナー鋳型核酸を更に含む、請求項1~30のいずれか一項に記載のシステム。
- 前記ドナー鋳型核酸がDNA分子である、請求項38に記載のシステム。
- 前記ドナー鋳型核酸がRNA分子である、請求項38に記載のシステム。
- 前記RNAガイドが任意選択でtracrRNAを含む、請求項1~40のいずれか一項に記載のシステム。
- 前記システムがtracrRNAを含まない、請求項1~40のいずれか一項に記載のシステム。
- 前記CRISPR関連タンパク質が自己プロセシングである、請求項1~42のいずれか一項に記載のシステム。
- 前記システムが、ナノ粒子、リポソーム、エキソソーム、微小胞、又は遺伝子銃を含む送達組成物中に存在する、請求項1~43のいずれか一項に記載のシステム。
- 細胞内にある、請求項1~43のいずれか一項に記載のシステム。
- 前記細胞が真核細胞である、請求項45に記載のシステム。
- 前記細胞が原核細胞である、請求項45に記載のシステム。
- (a)CRISPR関連タンパク質が配列番号1~56のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、CRISPR関連タンパク質又は前記CRISPR関連タンパク質をコードする核酸;及び
(b)ダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイド
を含む、細胞。 - 前記CRISPR関連タンパク質が、以下の配列の1つ以上:
(a)PX1X2X3X4F(配列番号216)(ここで、X1はL又はM又はI又はC又はFであり、X2はY又はW又はFであり、X3はK又はT又はC又はR又はW又はY又はH又はVであり、X4はI又はL又はMである);
(b)RX1X2X3L(配列番号217)(ここで、X1はI又はL又はM又はY又はT又はFであり、X2はR又はQ又はK又はE又はS又はTであり、X3はL又はI又はT又はC又はM又はKである);
(c)NX1YX2(配列番号218)(ここで、X1はI又はL又はFであり、X2はK又はR又はV又はEである);
(d)KX1X2X3FAX4X5KD(配列番号219)(ここで、X1はT又はI又はN又はA又はS又はF又はVであり、X2はI又はV又はL又はSであり、X3はH又はS又はG又はRであり、X4はD又はS又はEであり、X5はI又はV又はM又はT又はNである);
(e)LX1NX2(配列番号220)(ここで、X1はG又はS又はC又はTであり、X2はN又はY又はK又はSである);
(f)PX1X2X3X4SQX5DS(配列番号221)(ここで、X1はS又はP又はAであり、X2はY又はS又はA又はP又はE又はY又はQ又はNであり、X3はF又はY又はHであり、X4はT又はSであり、X5はM又はT又はIである);
(g)KX1X2VRX3X4QEX5H(配列番号222)(ここで、X1はN又はK又はW又はR又はE又はT又はYであり、X2はM又はR又はL又はS又はK又はV又はE又はT又はI又はDであり、X3はL又はR又はH又はP又はT又はK又はPのQ又はS又はAであり、X4はG又はQ又はN又はR又はK又はE又はI又はT又はS又はCであり、X5はR又はW又はY又はK又はT又はF又はS又はQである);及び
(h)X1NGX2X3X4DX5NX6X7X8N(配列番号223)(ここで、X1はI又はK又はV又はLであり、X2はL又はMであり、X3はN又はH又はPであり、X4はA又はS又はCであり、X5はV又はY又はI又はF又はT又はNであり、X6はA又はSであり、X7はS又はA又はPであり、X8はM又はC又はL又はR又はN又はS又はK又はLである)
を含む、請求項48に記載の細胞。 - 前記ダイレクトリピート配列が、配列番号57~90、配列番号118~151、又は配列番号213のいずれか1つに記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項48又は49に記載の細胞。
- 前記ダイレクトリピート配列が、配列番号57~90、配列番号118~151、又は配列番号213のいずれか1つに記載のヌクレオチド配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項50に記載の細胞。
- 前記ダイレクトリピート配列が、以下の配列の1つ以上:
(a)X1X2TX3X4X5X6X7X8(配列番号224)(ここで、X1はA又はC又はGであり、X2はT又はC又はAであり、X3はT又はG又はAであり、X4はT又はGであり、X5はT又はG又はAであり、X6はG又はT又はAであり、X7はT又はG又はAであり、X8はA又はG又はTである);
(b)X1X2X3X4X5X6X7X8X9(配列番号226)(ここで、X1はT又はC又はAであり、X2はT又はA又はGであり、X3はT又はC又はAであり、X4はT又はAであり、X5はT又はA又はGであり、X6はT又はAであり、X7はA又はTであり、X8はA又はG又はC又はTであり、X9はG又はA又はCである);及び
(c)X1X2X3AC(配列番号228)(ここで、X1はA又はC又はGであり、X2はC又はAであり、X3はA又はCである)
を含む、請求項48~51のいずれか一項に記載の細胞。 - 前記CRISPR関連タンパク質が、配列番号1に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、前記ダイレクトリピート配列が、配列番号57に記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項48~52のいずれか一項に記載の細胞。
- 前記CRISPR関連タンパク質が、配列番号1に記載のアミノ酸配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、前記ダイレクトリピート配列が、配列番号57に記載のヌクレオチド配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項53に記載の細胞。
- 前記CRISPR関連タンパク質が、配列番号1に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、前記CRISPR関連タンパク質が、PAM配列の認識能を有し、前記PAM配列が、5’-TNNT-3’又は5’-TNRT-3’として記載される核酸配列を含み、「N」が任意のヌクレオチドであり、「R」がA又はGである、請求項48~52のいずれか一項に記載の細胞。
- 前記CRISPR関連タンパク質が、配列番号1に記載のアミノ酸配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、前記CRISPR関連タンパク質がPAM配列の認識能を有し、前記PAM配列が、5’-TNNT-3’又は5’-TNRT-3’として記載される核酸配列を含み、「N」が任意のヌクレオチドであり、「R」がA又はGである、請求項55に記載の細胞。
- 前記CRISPR関連タンパク質が、配列番号4に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、前記ダイレクトリピート配列が、配列番号60に記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項48~52のいずれか一項に記載の細胞。
- 前記CRISPR関連タンパク質が、配列番号4に記載のアミノ酸配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、前記ダイレクトリピート配列が、配列番号60に記載のヌクレオチド配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項57に記載の細胞。
- 前記CRISPR関連タンパク質が、配列番号4に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、前記CRISPR関連タンパク質がPAM配列の認識能を有し、前記PAM配列が、5’-NTTN-3’、5’-NTTR-3’(例えば、5’-TTTG-3’)、又は5’-NNR-3’として記載される核酸配列を含み、「N」が任意のヌクレオチドであり、「R」がA又はGである、請求項48~52のいずれか一項に記載の細胞。
- 前記CRISPR関連タンパク質が、配列番号4に記載のアミノ酸配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、前記CRISPR関連タンパク質がPAM配列の認識能を有し、前記PAM配列が、5’-NTTN-3’、5’-NTTR-3’(例えば、5’-TTTG-3’)、又は5’-NNR-3’として記載される核酸配列を含み、「N」が任意のヌクレオチドであり、「R」がA又はGである、請求項59に記載の細胞。
- 前記CRISPR関連タンパク質が、配列番号10に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、前記ダイレクトリピート配列が、配列番号62又は配列番号213に記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項48~52のいずれか一項に記載の細胞。
- 前記CRISPR関連タンパク質が、配列番号10に記載のアミノ酸配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、前記ダイレクトリピート配列が、配列番号62又は配列番号213に記載のヌクレオチド配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項61に記載の細胞。
- 前記CRISPR関連タンパク質が、配列番号10に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、前記CRISPR関連タンパク質が、PAM配列の認識能を有し、前記PAM配列が、5’-NTTN-3’又は5’-RTTR-3’(例えば、5’-ATTG-3’又は5’-GTTA-3’)として記載される核酸配列を含み、「N」が任意のヌクレオチドであり、「R」がA又はGである、請求項48~52のいずれか一項に記載の細胞。
- 前記CRISPR関連タンパク質が、配列番号10に記載のアミノ酸配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、前記CRISPR関連タンパク質がPAM配列の認識能を有し、前記PAM配列が、5’-NTTN-3’又は5’-RTTR-3’(例えば、5’-ATTG-3’又は5’-GTTA-3’)として記載される核酸配列を含み、「N」が任意のヌクレオチドであり、「R」がA又はGである、請求項63に記載の細胞。
- 前記スペーサー配列が、約15ヌクレオチド~約55ヌクレオチドを含む、請求項48~64のいずれか一項に記載の細胞。
- 前記スペーサー配列が、20~45ヌクレオチドを含む、請求項65に記載の細胞。
- 前記細胞がtracrRNAを更に含む、請求項48~66のいずれか一項に記載の細胞。
- 前記システムがtracrRNAを含まない、請求項48~66のいずれか一項に記載の細胞。
- 前記細胞が真核細胞、例えば、哺乳動物細胞、例えば、ヒト細胞である、請求項48~68のいずれか一項に記載の細胞。
- 前記細胞が原核細胞である、請求項48~69のいずれか一項に記載の細胞。
- 請求項1~47のいずれか一項に記載のシステムを、細胞内の標的核酸に結合させる方法であって、
(a)前記システムを提供すること;及び
(b)前記システムを前記細胞に送達すること
を含み、前記細胞が前記標的核酸を含み、前記CRISPR関連タンパク質が前記RNAガイドに結合し、前記スペーサー配列が前記標的核酸に結合する、方法。 - 前記細胞が真核細胞、例えば、哺乳動物細胞、例えば、ヒト細胞である、請求項71に記載の方法。
- 標的核酸を修飾する方法であって、
(a)CRISPR関連タンパク質が配列番号1~56のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、CRISPR関連タンパク質又は前記CRISPR関連タンパク質をコードする核酸;及び
(b)ダイレクトリピート配列と前記標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイド;
を含み、
前記CRISPR関連タンパク質がRNAガイドへの結合能を有し、
前記CRISPR関連タンパク質及びRNAガイドによる前記標的核酸の認識により、前記標的核酸の修飾が生じる、
エンジニアリングされた天然に存在しないCRISPR-Casシステムを、標的核酸に送達することを含む方法。 - 前記CRISPR関連タンパク質が、以下の配列の1つ以上:
(a)PX1X2X3X4F(配列番号216)(ここで、X1はL又はM又はI又はC又はFであり、X2はY又はW又はFであり、X3はK又はT又はC又はR又はW又はY又はH又はVであり、X4はI又はL又はMである);
(b)RX1X2X3L(配列番号217)(ここで、X1はI又はL又はM又はY又はT又はFであり、X2はR又はQ又はK又はE又はS又はTであり、X3はL又はI又はT又はC又はM又はKである);
(c)NX1YX2(配列番号218)(ここで、X1はI又はL又はFであり、X2はK又はR又はV又はEである);
(d)KX1X2X3FAX4X5KD(配列番号219)(ここで、X1はT又はI又はN又はA又はS又はF又はVであり、X2はI又はV又はL又はSであり、X3はH又はS又はG又はRであり、X4はD又はS又はEであり、X5はI又はV又はM又はT又はNである);
(e)LX1NX2(配列番号220)(ここで、X1はG又はS又はC又はTであり、X2はN又はY又はK又はSである);
(f)PX1X2X3X4SQX5DS(配列番号221)(ここで、X1はS又はP又はAであり、X2はY又はS又はA又はP又はE又はY又はQ又はNであり、X3はF又はY又はHであり、X4はT又はSであり、X5はM又はT又はIである);
(g)KX1X2VRX3X4QEX5H(配列番号222)(ここで、X1はN又はK又はW又はR又はE又はT又はYであり、X2はM又はR又はL又はS又はK又はV又はE又はT又はI又はDであり、X3はL又はR又はH又はP又はT又はK又はPのQ又はS又はAであり、X4はG又はQ又はN又はR又はK又はE又はI又はT又はS又はCであり、X5はR又はW又はY又はK又はT又はF又はS又はQである);及び
(h)X1NGX2X3X4DX5NX6X7X8N(配列番号223)(ここで、X1はI又はK又はV又はLであり、X2はL又はMであり、X3はN又はH又はPであり、X4はA又はS又はCであり、X5はV又はY又はI又はF又はT又はNであり、X6はA又はSであり、X7はS又はA又はPであり、X8はM又はC又はL又はR又はN又はS又はK又はLである)
を含む、請求項73に記載の方法。 - 前記ダイレクトリピート配列が、配列番号57~90、配列番号118~151、又は配列番号213のいずれか1つに記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項73又は74に記載の方法。
- 前記ダイレクトリピート配列が、配列番号57~90、配列番号118~151、又は配列番号213のいずれか1つに記載のヌクレオチド配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項75に記載の方法。
- 前記ダイレクトリピート配列が、以下の配列の1つ以上:
(a)X1X2TX3X4X5X6X7X8(配列番号224)(ここで、X1はA又はC又はGであり、X2はT又はC又はAであり、X3はT又はG又はAであり、X4はT又はGであり、X5はT又はG又はAであり、X6はG又はT又はAであり、X7はT又はG又はAであり、X8はA又はG又はTである);
(b)X1X2X3X4X5X6X7X8X9(配列番号226)(ここで、X1はT又はC又はAであり、X2はT又はA又はGであり、X3はT又はC又はAであり、X4はT又はAであり、X5はT又はA又はGであり、X6はT又はAであり、X7はA又はTであり、X8はA又はG又はC又はTであり、X9はG又はA又はCである);及び
(c)X1X2X3AC(配列番号228)(ここで、X1はA又はC又はGであり、X2はC又はAであり、X3はA又はCである)
を含む、請求項73~76のいずれか一項に記載の方法。 - 前記CRISPR関連タンパク質が、配列番号1に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、前記ダイレクトリピート配列が、配列番号57に記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項73~77のいずれか一項に記載の方法。
- 前記CRISPR関連タンパク質が、配列番号1に記載のアミノ酸配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、前記ダイレクトリピート配列が、配列番号57に記載のヌクレオチド配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項78に記載の方法。
- 前記CRISPR関連タンパク質が、配列番号1に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、前記CRISPR関連タンパク質が、PAM配列の認識能を有し、前記PAM配列が、5’-TNNT-3’又は5’-TNRT-3’として記載される核酸配列を含み、「N」が任意のヌクレオチドであり、「R」がA又はGである、請求項73~77のいずれか一項に記載の方法。
- 前記CRISPR関連タンパク質が、配列番号1に記載のアミノ酸配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、前記CRISPR関連タンパク質が、PAM配列の認識能を有し、前記PAM配列が、5’-TNNT-3’又は5’-TNRT-3’として記載される核酸配列を含み、「N」が任意のヌクレオチドであり、「R」がA又はGである、請求項80に記載の方法。
- 前記CRISPR関連タンパク質が、配列番号4に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、前記ダイレクトリピート配列が、配列番号60に記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項73~77のいずれか一項に記載の方法。
- 前記CRISPR関連タンパク質が、配列番号4に記載のアミノ酸配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、前記ダイレクトリピート配列が、配列番号60に記載のヌクレオチド配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項82に記載の方法。
- 前記CRISPR関連タンパク質が、配列番号4に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、前記CRISPR関連タンパク質が、PAM配列の認識能を有し、前記PAM配列が、5’-NTTN-3’、5’-NTTR-3’(例えば、5’-TTTG-3’)、又は5’-NNR-3’として記載される核酸配列を含み、「N」が任意のヌクレオチドであり、「R」がA又はGである、請求項73~77のいずれか一項に記載の方法。
- 前記CRISPR関連タンパク質が、配列番号4に記載のアミノ酸配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、前記CRISPR関連タンパク質が、PAM配列の認識能を有し、前記PAM配列が、5’-NTTN-3’、5’-NTTR-3’(例えば、5’-TTTG-3’)、又は5’-NNR-3’として記載される核酸配列を含み、「N」が任意のヌクレオチドであり、「R」がA又はGである、請求項84に記載の方法。
- 前記CRISPR関連タンパク質が、配列番号10に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、前記ダイレクトリピート配列が、配列番号62又は配列番号213に記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項73~77のいずれか一項に記載の方法。
- 前記CRISPR関連タンパク質が、配列番号10に記載のアミノ酸配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、前記ダイレクトリピート配列が、配列番号62又は配列番号213に記載のヌクレオチド配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項86に記載の方法。
- 前記CRISPR関連タンパク質が、配列番号10に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、前記CRISPR関連タンパク質が、PAM配列の認識能を有し、前記PAM配列が、5’-NTTN-3’又は5’-RTTR-3’(例えば、5’-ATTG-3’又は5’-GTTA-3’)として記載される核酸配列を含み、「N」が任意のヌクレオチドであり、「R」がA又はGである、請求項73~77のいずれか一項に記載の方法。
- 前記CRISPR関連タンパク質が、配列番号10に記載のアミノ酸配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質であり、前記CRISPR関連タンパク質がPAM配列の認識能を有し、前記PAM配列が、5’-NTTN-3’又は5’-RTTR-3’(例えば、5’-ATTG-3’又は5’-GTTA-3’)として記載される核酸配列を含み、「N」が任意のヌクレオチドであり、「R」がA又はGである、請求項88に記載の方法。
- 前記スペーサー配列が、約15ヌクレオチド~約55ヌクレオチドを含む、請求項73~89のいずれか一項に記載の方法。
- 前記スペーサー配列が、20~45ヌクレオチドを含む、請求項90に記載の方法。
- 前記システムがtracrRNAを更に含む、請求項73~91のいずれか一項に記載の方法。
- 前記システムがtracrRNAを含まない、請求項73~91のいずれか一項に記載の方法。
- 前記標的核酸がDNA分子である、請求項73~93のいずれか一項に記載の方法。
- 前記CRISPR関連タンパク質が、非特異的ヌクレアーゼ活性を含む、請求項73~94のいずれか一項に記載の方法。
- 前記標的核酸の前記修飾が、二本鎖切断イベントである、請求項73~95のいずれか一項に記載の方法。
- 前記標的核酸の前記修飾が、一本鎖切断イベントである、請求項73~96のいずれか一項に記載の方法。
- 前記標的核酸の前記修飾により、挿入イベントが生じる、請求項73~97のいずれか一項に記載の方法。
- 前記標的核酸の前記修飾により、欠失イベントが生じる、請求項73~98のいずれか一項に記載の方法。
- 前記標的核酸の修飾により、細胞毒性又は細胞死が生じる、請求項73~99のいずれか一項に記載の方法。
- 標的核酸の編集方法であって、請求項1~47のいずれか一項に記載のシステムを前記標的核酸に接触させることを含む、方法。
- 標的核酸の発現を改変する方法であって、請求項1~47のいずれか一項に記載のシステムを前記標的核酸に接触させることを含む、方法。
- 標的核酸のある部位におけるペイロード核酸の挿入を標的化する方法であって、前記標的核酸を請求項1~47のいずれか一項に記載のシステムと接触させることを含む、方法。
- 標的核酸のある部位からのペイロード核酸の切出しを標的化する方法であって、前記標的核酸を請求項1~47のいずれか一項に記載のシステムと接触させることを含む、方法。
- DNA標的核酸の認識時に一本鎖DNAを非特異的に分解する方法であって、前記標的核酸を請求項1~47のいずれか一項に記載のシステムと接触させることを含む、方法。
- 試料中の標的核酸の検出方法であって、
(a)請求項1~47のいずれか一項に記載のシステム及び標識されたレポーター核酸を前記試料に接触させることであって、スペーサー配列が前記標的核酸にハイブリダイズすると、前記標識されたレポーター核酸の切断が起こること;及び
(b)前記標識されたレポーター核酸の切断によって生成される検出可能シグナルを測定することであって、それにより前記試料中における前記標的核酸の存在を検出することを含む、方法。 - (a)標的核酸のターゲティング及び編集方法;
(b)核酸の認識に応じた一本鎖核酸の非特異的分解方法;
(c)二本鎖標的のスペーサー相補鎖の認識に応じた二本鎖標的の非スペーサー相補鎖のターゲティング及びニッキング方法;
(d)二本鎖標的核酸のターゲティング及び切断方法;
(e)試料中の標的核酸の検出方法;
(f)二本鎖核酸の特異的編集方法;
(g)二本鎖核酸の塩基編集方法;
(h)細胞における遺伝子型特異的又は転写状態特異的細胞死又は休眠の誘導方法;
(i)二本鎖核酸標的におけるインデルの作成方法;
(j)二本鎖核酸標的への配列の挿入方法;又は
(k)二本鎖核酸標的における配列の欠失又は逆位形成方法
である、インビトロ又はエキソビボでの方法における、請求項1~47のいずれか一項に記載のシステムの使用。 - 哺乳動物細胞における標的核酸中への挿入又は欠失を導入する方法であって、
(a)CRISPR関連タンパク質が、配列番号1~56のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、CRISPR関連タンパク質をコードする核酸配列;及び
(b)ダイレクトリピート配列と前記標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイド(又はRNAガイドをコードする核酸)
のトランスフェクションを含み、
前記CRISPR関連タンパク質が前記RNAガイドへの結合能を有し;
前記CRISPR関連タンパク質及びRNAガイドによる前記標的核酸の認識により、前記標的核酸の修飾が生じる方法。 - 前記CRISPR関連タンパク質が、配列番号4に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、請求項108に記載の方法。
- 前記CRISPR関連タンパク質が、配列番号4に記載のアミノ酸配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、請求項109に記載の方法。
- 前記ダイレクトリピートが、配列番号60に記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項108に記載の方法。
- 前記ダイレクトリピートが、配列番号60に記載のヌクレオチド配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項111に記載の方法。
- 前記標的核酸がPAM配列に隣接しており、前記PAM配列が、5’-NTTN-3’、5’-NTTR-3’(例えば、5’-TTTG-3’)、又は5’-NNR-3’として記載される核酸配列を含み、「N」が任意のヌクレオチドであり、「R」がA又はGである、請求項108に記載の方法。
- 前記CRISPR関連タンパク質が、配列番号10に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、請求項108に記載の方法。
- 前記CRISPR関連タンパク質が、配列番号10に記載のアミノ酸配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、請求項114に記載の方法。
- 前記ダイレクトリピートが、配列番号62又は配列番号213に記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項108に記載の方法。
- 前記ダイレクトリピートが、配列番号62又は配列番号213に記載のヌクレオチド配列と少なくとも95%(例えば、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項116に記載の方法。
- 前記標的核酸がPAM配列に隣接しており、前記PAM配列が、5’-NTTN-3’又は5’-RTTR-3’(例えば、5’-ATTG-3’又は5’-GTTA-3’)として記載される核酸配列を含み、「N」が任意のヌクレオチドであり、「R」がA又はGである、請求項108に記載の方法。
- 前記トランスフェクションが一過性トランスフェクションである、請求項108~118のいずれか一項に記載の方法。
- 前記細胞がヒト細胞である、請求項108~119のいずれか一項に記載の方法。
- (a)CRISPR関連タンパク質又は前記CRISPR関連タンパク質をコードする核酸、及び
(b)ダイレクトリピート配列とスペーサー配列とを含むRNAガイド
を含む組成物であって、
前記CRISPR関連タンパク質が、以下のアミノ酸配列の1つ以上:
(i)PX1X2X3X4F(配列番号216)(ここで、X1はL又はM又はI又はC又はFであり、X2はY又はW又はFであり、X3はK又はT又はC又はR又はW又はY又はH又はVであり、X4はI又はL又はMである);
(ii)RX1X2X3L(配列番号217)(ここで、X1はI又はL又はM又はY又はT又はFであり、X2はR又はQ又はK又はE又はS又はTであり、X3はL又はI又はT又はC又はM又はKである);
(iii)NX1YX2(配列番号218)(ここで、X1はI又はL又はFであり、X2はK又はR又はV又はEである);
(iv)KX1X2X3FAX4X5KD(配列番号219)(ここで、X1はT又はI又はN又はA又はS又はF又はVであり、X2はI又はV又はL又はSであり、X3はH又はS又はG又はRであり、X4はD又はS又はEであり、X5はI又はV又はM又はT又はNである);
(v)LX1NX2(配列番号220)(ここで、X1はG又はS又はC又はTであり、X2はN又はY又はK又はSである);
(vi)PX1X2X3X4SQX5DS(配列番号221)(ここで、X1はS又はP又はAであり、X2はY又はS又はA又はP又はE又はY又はQ又はNであり、X3はF又はY又はHであり、X4はT又はSであり、X5はM又はT又はIである);
(vii)KX1X2VRX3X4QEX5H(配列番号222)(ここで、X1はN又はK又はW又はR又はE又はT又はYであり、X2はM又はR又はL又はS又はK又はV又はE又はT又はI又はDであり、X3はL又はR又はH又はP又はT又はK又はPのQ又はS又はAであり、X4はG又はQ又はN又はR又はK又はE又はI又はT又はS又はCであり、X5はR又はW又はY又はK又はT又はF又はS又はQである);及び
(viii)X1NGX2X3X4DX5NX6X7X8N(配列番号223)(ここで、X1はI又はK又はV又はLであり、X2はL又はMであり、X3はN又はH又はPであり、X4はA又はS又はCであり、X5はV又はY又はI又はF又はT又はNであり、X6はA又はSであり、X7はS又はA又はPであり、X8はM又はC又はL又はR又はN又はS又はK又はLである)
を含み、
前記CRISPR関連タンパク質が前記RNAガイドに結合し、前記スペーサーが標的核酸に結合する、組成物。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962897859P | 2019-09-09 | 2019-09-09 | |
US62/897,859 | 2019-09-09 | ||
PCT/US2020/049923 WO2021050534A1 (en) | 2019-09-09 | 2020-09-09 | Novel crispr dna targeting enzymes and systems |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022547524A true JP2022547524A (ja) | 2022-11-14 |
JPWO2021050534A5 JPWO2021050534A5 (ja) | 2023-09-15 |
Family
ID=74866391
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022515511A Pending JP2022547524A (ja) | 2019-09-09 | 2020-09-09 | 新規crispr dnaターゲティング酵素及びシステム |
Country Status (11)
Country | Link |
---|---|
US (5) | US20220282308A1 (ja) |
EP (1) | EP4028047A4 (ja) |
JP (1) | JP2022547524A (ja) |
KR (1) | KR20220054434A (ja) |
CN (1) | CN114340657A (ja) |
AU (1) | AU2020347147A1 (ja) |
CA (1) | CA3150454A1 (ja) |
IL (1) | IL291095A (ja) |
MX (1) | MX2022002872A (ja) |
WO (1) | WO2021050534A1 (ja) |
ZA (1) | ZA202202628B (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220282308A1 (en) * | 2019-09-09 | 2022-09-08 | Arbor Biotechnologies, Inc. | Novel crispr dna targeting enzymes and systems |
IL292896A (en) * | 2019-12-23 | 2022-07-01 | Univ California | CRISPR-Cas execution poplipeptides and methods of using them |
EP4305158A1 (en) | 2021-03-09 | 2024-01-17 | Arbor Biotechnologies, Inc. | Compositions comprising a variant polypeptide and uses thereof |
US20240102007A1 (en) | 2021-06-01 | 2024-03-28 | Arbor Biotechnologies, Inc. | Gene editing systems comprising a crispr nuclease and uses thereof |
WO2023250384A2 (en) * | 2022-06-22 | 2023-12-28 | The Regents Of The University Of California | Crispr-cas effector polypeptides and methods of use thereof |
WO2024020567A1 (en) * | 2022-07-22 | 2024-01-25 | Arbor Biotechnologies, Inc. | Compositions comprising a variant polypeptide and uses thereof |
WO2024020557A1 (en) * | 2022-07-22 | 2024-01-25 | Arbor Biotechnologies, Inc. | Compositions comprising a variant nuclease and uses thereof |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040052799A1 (en) * | 1996-11-15 | 2004-03-18 | Astra Aktiebolag | Nucleic acid and amino acid sequences relating to Helicobacter pylori for diagnostics and therapeutics |
US20040216190A1 (en) * | 2003-04-28 | 2004-10-28 | Kovalic David K. | Nucleic acid molecules and other molecules associated with plants and uses thereof for plant improvement |
US8703147B2 (en) * | 2007-11-05 | 2014-04-22 | The Walter And Eliza Hall Institute Of Medical Research | Methods and compositions for treating and preventing malaria (2) |
WO2011119484A1 (en) * | 2010-03-23 | 2011-09-29 | Iogenetics, Llc | Bioinformatic processes for determination of peptide binding |
WO2013082500A2 (en) * | 2011-12-02 | 2013-06-06 | Rhode Island Hospital | Vaccine for falciparum malaria |
AU2016279077A1 (en) * | 2015-06-18 | 2019-03-28 | Omar O. Abudayyeh | Novel CRISPR enzymes and systems |
EP3365441A1 (en) * | 2015-10-22 | 2018-08-29 | The Broad Institute Inc. | Type vi-b crispr enzymes and systems |
WO2017189308A1 (en) * | 2016-04-19 | 2017-11-02 | The Broad Institute Inc. | Novel crispr enzymes and systems |
US10125246B2 (en) * | 2016-06-24 | 2018-11-13 | King Fahd University Of Petroleum And Minerals | Low density polyethylene (LDPE)-asphaltene composition and method of preparation |
WO2018071672A1 (en) * | 2016-10-12 | 2018-04-19 | The Regents Of The University Of Colorado | Novel engineered and chimeric nucleases |
US10392616B2 (en) * | 2017-06-30 | 2019-08-27 | Arbor Biotechnologies, Inc. | CRISPR RNA targeting enzymes and systems and uses thereof |
US20220282308A1 (en) * | 2019-09-09 | 2022-09-08 | Arbor Biotechnologies, Inc. | Novel crispr dna targeting enzymes and systems |
-
2020
- 2020-09-09 US US17/641,523 patent/US20220282308A1/en active Pending
- 2020-09-09 KR KR1020227011364A patent/KR20220054434A/ko unknown
- 2020-09-09 CN CN202080062919.7A patent/CN114340657A/zh active Pending
- 2020-09-09 AU AU2020347147A patent/AU2020347147A1/en active Pending
- 2020-09-09 JP JP2022515511A patent/JP2022547524A/ja active Pending
- 2020-09-09 WO PCT/US2020/049923 patent/WO2021050534A1/en active Application Filing
- 2020-09-09 EP EP20863249.7A patent/EP4028047A4/en active Pending
- 2020-09-09 MX MX2022002872A patent/MX2022002872A/es unknown
- 2020-09-09 CA CA3150454A patent/CA3150454A1/en active Pending
-
2021
- 2021-10-19 US US17/505,578 patent/US11453867B2/en active Active
-
2022
- 2022-03-03 IL IL291095A patent/IL291095A/en unknown
- 2022-03-03 ZA ZA2022/02628A patent/ZA202202628B/en unknown
- 2022-08-17 US US17/820,444 patent/US11795442B2/en active Active
- 2022-12-28 US US18/147,408 patent/US11976308B2/en active Active
-
2023
- 2023-09-12 US US18/465,755 patent/US20240101990A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
EP4028047A4 (en) | 2023-07-26 |
US11976308B2 (en) | 2024-05-07 |
US20220033793A1 (en) | 2022-02-03 |
US11453867B2 (en) | 2022-09-27 |
KR20220054434A (ko) | 2022-05-02 |
CA3150454A1 (en) | 2021-03-18 |
US20230057102A1 (en) | 2023-02-23 |
IL291095A (en) | 2022-05-01 |
US20220282308A1 (en) | 2022-09-08 |
EP4028047A1 (en) | 2022-07-20 |
MX2022002872A (es) | 2022-08-04 |
US20230212542A1 (en) | 2023-07-06 |
WO2021050534A1 (en) | 2021-03-18 |
US11795442B2 (en) | 2023-10-24 |
ZA202202628B (en) | 2023-12-20 |
US20240101990A1 (en) | 2024-03-28 |
AU2020347147A1 (en) | 2022-03-03 |
CN114340657A (zh) | 2022-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210123047A1 (en) | Novel crispr dna targeting enzymes and systems | |
EP3765616B1 (en) | Novel crispr dna and rna targeting enzymes and systems | |
US11667904B2 (en) | CRISPR-associated systems and components | |
US11976308B2 (en) | CRISPR DNA targeting enzymes and systems | |
US20220372456A1 (en) | Novel crispr dna targeting enzymes and systems | |
US20220315913A1 (en) | Novel crispr dna targeting enzymes and systems | |
US20220282283A1 (en) | Novel crispr dna targeting enzymes and systems | |
US20230016656A1 (en) | Novel crispr dna targeting enzymes and systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230907 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230907 |