JP2023539668A - 操作されたCRISPR-Casタンパク質およびその使用方法 - Google Patents

操作されたCRISPR-Casタンパク質およびその使用方法 Download PDF

Info

Publication number
JP2023539668A
JP2023539668A JP2023514122A JP2023514122A JP2023539668A JP 2023539668 A JP2023539668 A JP 2023539668A JP 2023514122 A JP2023514122 A JP 2023514122A JP 2023514122 A JP2023514122 A JP 2023514122A JP 2023539668 A JP2023539668 A JP 2023539668A
Authority
JP
Japan
Prior art keywords
crispr
domain
protein
cas effector
nucleic acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023514122A
Other languages
English (en)
Inventor
ガフィー,シャロン・リー
ワッツ,ジョセフ・マシュー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pairwise Plants Services Inc
Original Assignee
Pairwise Plants Services Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pairwise Plants Services Inc filed Critical Pairwise Plants Services Inc
Publication of JP2023539668A publication Critical patent/JP2023539668A/ja
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/315Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Streptococcus (G), e.g. Enterococci
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/85Fusion polypeptide containing an RNA binding domain
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Abstract

本明細書中に記載されるのは、操作されたCRISPR-Casタンパク質およびそのようなタンパク質の使用方法である。特に、非V型CRISPR-Casヌクレアーゼ由来のヌクレアーゼまたはニッカーゼドメインを有するCas12aのようなV型CRISPR-Casヌクレアーゼが、Rec1ドメインとRec2ドメインとの間のドメイン間リンカー領域内に挿入されている。また、本明細書中に記載されるのは、本発明の操作されたタンパク質を含む複合体、組成物、および系であり、これらは各々、標的核酸を修飾または編集するのに用いられてよい。本発明の操作されたタンパク質は、酵素であってよく、かつ/またはRNAガイドDNA結合タンパク質であってよい。

Description

配列表の電子ファイルに関する陳述
37C.F.R.§1.821に従って提出した、表題1499-37WO_ST25の、922,217バイトのサイズの、2021年8月27日に作成した、EFS-Webを介して提出したASCIIテキストフォーマットの配列表を、紙コピーの代わりに提供する。この配列表は、その開示が参照によって本明細書中に組み込まれる。
分野
本発明は、操作されたタンパク質(例えば、操作された酵素)に、そしてそのようなタンパク質の使用方法に関する。本発明はさらに、標的核酸を修飾または編集するための組成物および系に関する。
II型CRISPRエンドヌクレアーゼ(広く用いられるSpCas9が挙げられる)は、DNA切断について、共通の機構を共有する。このファミリー内での酵素は、2つのヌクレアーゼドメイン(HNHおよびRuvC)を含有し、これらは各々、単一のDNA鎖を切断する。Cas9-sgRNA複合体(またはCas9-crRNA-trRNA複合体)が、その標的DNA配列に結合する場合、標的DNA鎖は、RNAスペーサー配列に結合する一方、非標的DNA鎖は、一本鎖ループを形成する。Cas9のHNHドメインは、標的DNA鎖を切断し、RuvCドメインは、非標的鎖を切断する(図1)。図1に示されるように、II型CRISPRエンドヌクレアーゼ(例えばCas9)の場合、標的DNA鎖および非標的DNA鎖は、それぞれHNHドメインおよびRuvCドメインによって同時に切断されて、平滑末端二本鎖切断を形成する。
II型CRISPRエンドヌクレアーゼとは異なり、V型CRISPRエンドヌクレアーゼ(例えばCas12a)は、非標的鎖から始めて双方のDNA鎖を順次切断する単一のヌクレアーゼドメインのみを有する。図2に示されるように、V型エンドヌクレアーゼ(例えばCas12a)の場合、RuvCドメインは、非標的DNA鎖および標的DNA鎖を順次切断して、スタガー二本鎖切断が生じる。
II型CRISPRエンドヌクレアーゼおよびV型CRISPRエンドヌクレアーゼは、類似の機能を実行するが、それらの機構および構造は、高度に異なっている。2つの異なる型は、異なる前駆体から進化してきたと考えられており、RuvCドメインのみが、2つの型にわたって、重要なあらゆる配列または構造相同性を共有している。V型CRISPRエンドヌクレアーゼは、II型酵素内の標的鎖切断を担うHNHドメインを欠いている。その代わりとして、V型CRISPRエンドヌクレアーゼ内のRuvCドメインは、非標的鎖から始まる双方のDNA鎖を順次切断する(図2)。したがって、RuvCドメインの触媒残基を変異させると、全てのヌクレアーゼ活性を妨げ、標的鎖ニッカーゼを生成するのではなく不活化された酵素を生成する。非標的鎖ニッカーゼ変異が、Cas12aにおいて特定されている。しかしながら、この変異は、RuvCドメインの外側にあり、酵素の触媒効率全体を引き下げることによって機能すると考えられる。V型CRISPR標的鎖ニッカーゼは存在せず、そしてII型CRISPRエンドヌクレアーゼと比較した、V型CRISPRエンドヌクレアーゼの構造および作用機構の差異を考えると、明確な生成方法はない。
本発明の第1の態様は、少なくとも2つの異なるポリペプチドを含む操作されたタンパク質に関し、少なくとも2つの異なるポリペプチドの一方は、第1のV型CRISPR-Casエフェクタータンパク質の第1の部分である第1のCRISPR-Casエフェクターポリペプチドであり、第1のCRISPR-Casエフェクターポリペプチドは、ヌクレアーゼドメインが欠けており;少なくとも2つの異なるポリペプチドのもう1つは、V型CRISPR-Casエフェクタータンパク質に対して異種であり、かつV型CRISPR-Casエフェクタータンパク質の部分でない異種ポリペプチドである。
本発明の別の態様は、標的鎖ニッカーゼドメインまたはその部分であり、かつV型ヌクレアーゼドメインまたはその部分でない第1のヌクレアーゼドメインと;V型CRISPR-Casエフェクタータンパク質の部分である第1のCRISPR-Casエフェクターポリペプチドとを含む操作されたタンパク質に関する。一部の実施形態において、第1のヌクレアーゼドメインは、標的鎖特異的ニッカーゼドメイン、または標的および非標的鎖ニッカーゼドメインである。
本発明の更なる態様は、第1のV型CRISPR-Casエフェクタータンパク質の第1の部分である第1のポリペプチドと;第1のV型CRISPR-Casエフェクタータンパク質の第2の部分である第2のポリペプチドと;第1のV型CRISPR-Casエフェクタータンパク質に対して異種である異種ポリペプチドとを含む操作されたタンパク質に関し、異種ポリペプチドは、第1のポリペプチドと第2のポリペプチドとの間にあり、異種ポリペプチドは、第1のV型CRISPR-Casエフェクタータンパク質のドメイン間リンカー領域に対応する位置において、操作されたタンパク質内に配置されている。
本発明の追加の態様は、配列番号2~17または125~132のいずれか1つに対して少なくとも70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、またはそれを超える配列同一性を有するアミノ酸配列を含む操作されたタンパク質に関し、場合によっては、操作されたタンパク質は、配列番号2~17または125~132のいずれか1つのアミノ酸配列を含む。
本発明の更なる態様は、本明細書中に記載される操作されたタンパク質;ガイド核酸(例えばガイドRNA)、および場合によってはデアミナーゼを含む組成物(例えば塩基編集組成物)または系に関し、場合によっては、操作されたタンパク質、ガイド核酸、および場合によってはデアミナーゼは、複合体を形成するか、または複合体内に含まれる。
本発明の別の態様は、本明細書中に記載される操作されたタンパク質;ガイド核酸(例えばガイドRNA);および場合によってはデアミナーゼを含む複合体に関する。
本発明の追加の態様は、本明細書中に記載される操作されたタンパク質をコードするヌクレオチド配列を含む核酸分子に関する。
本発明の別の態様は、標的核酸を修飾する方法に関し、当該方法は、標的核酸を、本明細書中に記載される操作されたタンパク質、およびガイド核酸(例えばガイドRNA)と接触させることによって、標的核酸を修飾することを含み、場合によっては、操作されたタンパク質およびガイド核酸は、複合体を形成するか、または複合体内に含まれる。
本発明の更なる態様は、標的核酸を修飾する効率を上昇させる方法に関し、当該方法は、標的核酸を、本明細書中に記載される操作されたタンパク質、およびガイド核酸(例えばガイドRNA)と接触させることによって、標的核酸を修飾することを含み、場合によっては、操作されたタンパク質およびガイド核酸は、複合体を形成するか、複合体内に含まれる。
本発明はさらに、本発明の核酸構築体を含む発現カセットおよび/またはベクター、ならびに本発明のポリペプチド、融合タンパク質、および/または核酸構築体を含む細胞を提供する。加えて、本発明は、本発明の核酸構築体、ならびに同上を含む発現カセット、ベクター、および/または細胞を含むキットを提供する。
なお、一実施形態に関して記載される本発明の態様は、異なる実施形態に関して具体的に記載されていなくても、この中に組み込まれ得る。すなわち、全ての実施形態、および/またはあらゆる実施形態の特徴は、いかなる形および/または組合せであれ、組み合わせることができる。出願人は、最初に提出したあらゆる特許請求の範囲を変え、かつ/またはそれに応じて新しいあらゆる特許請求の範囲を提出する権利を保有しており、権利として、最初にその様式で特許請求されていないが、他のあらゆる特許請求の範囲のあらゆる特徴に従属し、かつ/またはこれを組み込むように、最初に提出したあらゆる特許請求の範囲を補正することができることが挙げられる。本発明のこれらの、そして他の目的および/または態様を、以下に示す明細書中で詳細に説明する。本発明の更なる特徴、利点、および詳細は、以下に続く好ましい実施形態の図および詳細な説明を読めば、当業者によって認識されるであろう。そのような説明は、本発明の単なる実例である。
II型CRISPRエンドヌクレアーゼについての作用の機構を示す図である。 V型CRISPRエンドヌクレアーゼについての作用の機構を示す図である。 単一のガイドRNA(sgRNA)に結合したSpCas9(PDB ID 4UN3)および標的DNAの結晶構造である。示されるドメインは、RuvC、架橋ヘリックス、Rec1、Rec2、HNH、およびPAM相互作用である。 Recローブに向かって見られるCas12aドメインのダイアグラムである。この図から、crRNA/標的DNAデュプレックスの部分が、Cas12aの表面にありありと曝される。 LbCas12a内の候補挿入部位上へのSpCas9由来のHNHドメインのオーバレイである。 HNH-3287、3288、3289、3290、3296、3297、3298、および3299を発現する可溶性の画分溶解大腸菌(Escherichia coli)を示す図である。 精製されたHNH-3287、3288、3289、3290、3296、3297、および3298のニッキング活性を示す図である。 本発明の一部の実施形態に従うニッカーゼが、大腸菌内で可溶的に発現されたことを示すゲルの画像である。 本発明の一部の実施形態に従うニッカーゼが、DNA基質にニックを入れることができることを示すゲルの画像である。 本発明の一部の実施形態に従うニッカーゼが、RNA依存性であり得ることを示すゲルの画像である。 本発明の一部の実施形態に従うニッカーゼが、DNAニッカーゼとしての機能を果たすことができることを示すゲルの画像である。 標識された標的鎖を示す図である。 標識された非標的鎖を示す図である。 標識された標的鎖とインキュベートされた試料を含むゲルの画像である。 標識された非標的鎖とインキュベートされた試料を含むゲルの画像である。 図14および図15のレーンを、対照のレーンと共に示すゲル全体の画像である。 本発明の一部の実施形態に従う各酵素対についての編集効率を示す図である FANCFスペーサー1に対応する種々の標的領域についてのCからT編集のパーセンテージを示すグラフである。 FANCFスペーサー2に対応する種々の標的領域についてのCからT編集のパーセンテージを示すグラフである。 AAVS1スペーサー1に対応する種々の標的領域についてのCからT編集のパーセンテージを示すグラフである。 AAVS1スペーサー2に対応する種々の標的領域についてのCからT編集のパーセンテージを示すグラフである。 RNF2スペーサー1に対応する種々の標的領域についてのAからG編集のパーセンテージを示すグラフである。 RNF2スペーサー2に対応する種々の標的領域についてのAからG編集のパーセンテージを示すグラフである。
次に本発明を、本発明の実施形態を示す添付の図面および実施例を参照して、以降で説明する。この説明は、本発明が実行され得る様々な全ての方法の詳細なカタログであることも、本発明に加えられ得る全ての特徴であることも意図されない。例えば、一実施形態に関して具体的に説明される特徴が、他の実施形態に組み込まれてもよく、そして特定の実施形態に関して具体的に説明される特徴が、その実施形態から消されてもよい。ゆえに、本発明は、本発明の一部の実施形態において、本明細書中で示されるあらゆる特徴または特徴の組合せを、除外することも省略することもできることを意図する。また、本明細書中で示唆される種々の実施形態に対する、本発明から逸脱しない多数の変形および追加が、本開示を考慮して、当業者に明らかとなろう。それゆえに、以下の説明は、本発明の一部の特定の実施形態を示すことが意図されており、それらの全ての再配列、組合せ、および変形を網羅的に指定することは意図されない。
別段定義されない限り、本明細書中で用いられる全ての技術用語および科学用語は、本発明が属する技術の当業者によって一般的に理解されるのと同じ意味を有する。本明細書中で本発明の説明に用いられる専門用語は、特定の実施形態のみを説明する目的のものであり、本発明の限定であることは意図されない。
本明細書中で引用される全ての刊行物、特許出願、特許、および他の参照は、参照が示されるセンテンスおよび/または段落に関連する教示について、それらの全体が参照によって組み込まれる。
文脈が別途指示しない限り、本明細書中に記載される本発明の種々の特徴を、あらゆる組合せで用いることができることが具体的に意図される。さらに、本発明はまた、本発明の一部の実施形態において、本明細書中で示されるあらゆる特徴または特徴の組合せを除外することも省略することもできることを意図する。説明のために、組成が、構成要素A、B、およびCを含むと明細書が述べているならば、A、B、もしくはCのいずれか、またはそれらの組合せを単独で、またはあらゆる組合せで省略かつ放棄することができることが具体的に意図される。
本発明および添付の特許請求の範囲の記載に用いられている単数形「a」、「an」、および「the」は、文脈が別途明らかに指示しない限り、複数形を同様に含むことが意図される。
また、本明細書中で用いられる「および/または」は、関連する記載された項目の1つまたは複数の考えられるあらゆる全ての組合せ、および択一的に解釈される場合(「または」)の組合せの欠如を指し、かつ包含する。
測定可能な値、例えば量または濃度等に言及する場合に本明細書中で用いられる用語「約」は、指定された値の±10%、±5%、±1%、±0.5%、または±0.1%の変動、ならびに指定された値を包含することを意図する。例えば、Xが測定可能な値である場合の「約X」は、X、ならびにXの±10%、±5%、±1%、±0.5%、または±0.1%の変動を含むことを意図する。測定可能な値について本明細書中で提供される範囲は、他のあらゆる範囲および/またはその中の個々の値を含み得る。
本明細書中で用いられる「XとYとの間」および「約XとYとの間」等のフレーズは、XおよびYを含むと解釈されるべきである。本明細書中で用いられる「約XとYとの間」等のフレーズは、「約Xと約Yとの間」を意味し、そして「約XからY」等のフレーズは、「約Xから約Y」を意味する。
本明細書中の値の範囲の詳述は、本明細書中で示されない限り、単に、当該範囲内にある別個の各値に個々に言及する速記の方法の役目を果たすことが意図されており、そして別個の各値は、あたかも本明細書中で個々に列挙されているかの如く、本明細書に組み込まれる。例えば、範囲10~15が開示されていれば、11、12、13、および14もまた開示されている。
本明細書中で用いられる用語「含む(「comprise」、「comprises」、および「comprising」)」は、明示される特徴、整数、工程、操作、要素、および/または構成要素の存在を指定するが、1つまたは複数の他の特徴、整数、工程、操作、要素、構成要素、および/またはそれらの群の存在または追加を排除しない。
本明細書中で用いられる移行句「から本質的になる」は、特許請求の範囲が、特許請求の範囲に列挙される指定された材料または工程、および特許請求される本発明の基本的かつ新規の特徴に物質的に影響を与えないものを包含すると解釈されるべきであることを意味する。ゆえに、本発明の特許請求の範囲で用いられる場合の用語「から本質的になる」は、「含む」に等しいと解釈されることは意図されない。
本明細書中で用いられる用語「増大させる」、「増大させること」、「増強させる」、「増強させること」、「向上させる」、および「向上させること」(およびその文法上の変形)は、例えば別の測定可能な特性または量(例えば対照値)と比較して、少なくとも約5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、100%、150%、200%、300%、400%、500%またはそれを超える上昇を説明する。
本明細書中で用いられる用語「引き下げる」、「引き下げられた」、「引き下げること」、「引下げ」、「減少させる」、および「低下させる」(およびその文法上の変形)は、例えば別の測定可能な特性または量(例えば対照値)と比較して、少なくとも約5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%、または100%の低下を説明する。一部の実施形態において、引下げは、検出可能な活性または量をもたらし得ないか、または本質的にもたらし得ない(すなわち、有意でない量、例えば、約10%または5%未満)。
「異種ヌクレオチド配列」または「組換えヌクレオチド配列」は、これが導入される宿主細胞と天然に関連しないヌクレオチド配列であり、天然に存在するヌクレオチド配列の天然に存在しない複数のコピーが挙げられる。
「固有」または「野生型」の核酸、ヌクレオチド配列、ポリペプチド、またはアミノ酸配列は、天然に存在するか、または内因性の核酸、ヌクレオチド配列、ポリペプチド、またはアミノ酸配列を指す。ゆえに、例えば、「野生型mRNA」は、参照生物内に天然に存在するか、または参照生物に内因性のmRNAである。「相同」核酸配列は、これが導入される宿主細胞と天然に関連するヌクレオチド配列である。
本明細書中で用いられる用語「核酸」、「核酸分子」、「ヌクレオチド配列」、および「ポリヌクレオチド」は、直鎖状であるか、もしくは分岐している、一本鎖もしくは二本鎖、またはそれらのハイブリッドであるRNAまたはDNAを指す。また、当該用語は、RNA/DNAハイブリッドを包含する。また、dsRNAが合成的に生成される場合、あまり一般的でない塩基、例えばイノシン、5-メチルシトシン、6-メチルアデニン、ヒポキサンチンその他を、アンチセンス、dsRNA、およびリボザイム対形成に用いることができる。例えば、ウリジンおよびシチジンのC-5プロピン類似体を含有するポリヌクレオチドは、高い親和性でRNAに結合すること、そして遺伝子発現の強力なアンチセンスインヒビターであることが示されている。また、他の修飾、例えば、ホスホジエステル骨格、またはRNAのリボース糖基内の2’-ヒドロキシへの修飾をすることができる。
本明細書中で用いられる用語「ヌクレオチド配列」は、核酸分子の5’末端から3’末端までの、ヌクレオチドのヘテロポリマーまたはヌクレオチドの配列を指し、cDNA、DNA断片または部分、ゲノムDNA、合成(例えば、化学的に合成された)DNA、プラスミドDNA、mRNA、およびアンチセンスRNA(いずれも一本鎖または二本鎖であり得る)が挙げられる、DNA分子またはRNA分子が挙げられる。また、用語「ヌクレオチド配列」、「核酸」、「核酸分子」、「核酸構築体」、「組換え核酸」、「オリゴヌクレオチド」、および「ポリヌクレオチド」は、ヌクレオチドのヘテロポリマーを指すのに本明細書中で互換的に用いられる。本明細書中で提供される核酸分子および/またはヌクレオチド配列が、本明細書中で左から右に5’から3’の向きに示されており、そして米国配列規則、37CFR§§1.821-1.825、および世界知的所有権機関(WIPO)基準ST.25に示されるヌクレオチド文字を示すための標準コードを用いて表される。本明細書中で用いられる「5’領域」は、ポリヌクレオチドの5’末端に最も近いポリヌクレオチドの領域を意味し得る。ゆえに、例えば、ポリヌクレオチドの5’領域内の要素を、ポリヌクレオチドの5’末端に位置決めされた第1のヌクレオチドから、ポリヌクレオチドの途中に位置決めされたヌクレオチドまでのどこでも位置決めすることができる。本明細書中で用いられる「3’領域」は、ポリヌクレオチドの3’末端に最も近いポリヌクレオチドの領域を意味し得る。ゆえに、例えば、ポリヌクレオチドの3’領域内の要素を、ポリヌクレオチドの3’末端に位置決めされた第1のヌクレオチドから、ポリヌクレオチドの途中に位置決めされたヌクレオチドまでのどこでも位置決めすることができる。
本明細書中で用いられる用語「遺伝子」は、mRNA、アンチセンスRNA、miRNA、および抗マイクロRNAアンチセンスオリゴデオキシリボヌクレオチド(AMO)等を生成するのに用いることができる核酸分子を指す。遺伝子は、機能タンパク質または遺伝子産物を生成するのに用いることができる場合もあるし、できない場合もある。遺伝子は、コード領域および非コード領域(例えば、イントロン、調節要素、プロモーター、エンハンサー、終結配列、ならびに/または5’および3’非翻訳領域)の双方を含むことができる。
ポリヌクレオチド、遺伝子、またはポリペプチドは、「単離」されていてもよく、これは、天然の状態で核酸またはポリペプチドと関連して通常見出される構成要素から実質的に、または本質的に遊離している核酸またはポリペプチドをそれぞれ意味する。一部の実施形態において、そのような構成要素として、他の細胞物質、組換え生成由来の培地、および/または核酸もしくはポリペプチドを化学的に合成するのに用いられる種々の化学物質が挙げられる。
用語「変異」は、点変異(例えば、ミスセンス、またはナンセンス、またはフレームシフトをもたらす単一の塩基対の挿入もしくは欠失)、挿入、欠失、および/またはトランケーションを指す。変異が、アミノ酸配列内の残基の、別の残基による置換、または配列内の1つもしくは複数の残基の欠失もしくは挿入である場合、変異は、典型的に、元の残基に続く配列内の残基の位置を同定することによって、そして新たに置換された残基を同定することによって説明される。
本明細書中で用いられる用語「相補的な」または「相補性」は、許容可能な塩および温度条件の下での塩基対合によるポリヌクレオチドの天然の結合を指す。例えば、配列「A-G-T」(5’から3’)は、相補的な配列「T-C-A」(3’から5’)に結合する。2つの一本鎖分子間の相補性は、ヌクレオチドの一部のみが結合する「部分的」であってもよいし、一本鎖分子間に総相補性が存在する場合、完全であってもよい。核酸鎖間の相補性の程度は、核酸鎖間のハイブリダイゼーションの効率および強度に対して大きな影響を有する。
本明細書中で用いられる「相補体」は、コンパレータヌクレオチド配列との100%の相補性を意味し得るし、100%未満の相補性(例えば、「実質的には相補的な」、例えば、約70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%,等の相補性)をも意味し得る。
ヌクレオチド配列またはポリペプチドの「部分」または「断片」(ドメインを含む)は、参照ヌクレオチド配列またはポリペプチドとそれぞれ比較して、長さが引き下げられ(例えば、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20個、またはそれを超える残基(例えば、ヌクレオチドまたはペプチド)だけ引き下げられ)、かつ参照ヌクレオチド配列またはポリペプチドとそれぞれ同一であるかまたはほぼ同一の(例えば、70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%同一の)連続した残基のヌクレオチド配列またはポリペプチドを含む、これから本質的になる、かつ/またはこれからなるヌクレオチド配列またはポリペプチドを意味することが理解される。本発明に従うそのような核酸断片または部分は、適切な場合には、これが構成成分となるより大きなポリヌクレオチド内に含まれてもよい。一例として、本発明のガイド核酸の反復配列は、野生型CRISPR-Cas反復配列の一部(例えば、野生型V型CRISPR-Cas反復、例えば、Cas12a(Cpf1)、Cas12b、Cas12c(C2c3)、Cas12d(CasY)、Cas12e(CasX)、Cas12g、Cas12h、Cas12i、C2c1、C2c4、C2c5、C2c8、C2c9、C2c10、Cas14a、Cas14b,および/またはCas14c等が挙げられるがこれらに限定されないCRISPR Cas系由来の反復)を含んでもよい。
相同性を有する異なる核酸またはタンパク質は、本明細書中で「相同体」と称する。用語相同体は、同じ種および他の種由来の相同配列、ならびに同じ種および他の種由来のオーソログ配列を含む。「相同性」は、位置同一性(すなわち、配列類似性または同一性)のパーセントに換算した、2つ以上の核酸および/またはアミノ酸配列間の類似性のレベルを指す。また、相同性は、異なる核酸またはタンパク質間の類似した機能特性の概念を指す。ゆえに、本発明の組成物および方法はさらに、本発明のヌクレオチド配列およびポリペプチドに対する相同体を含む。本明細書中で用いられる「オーソログ」および「オルソログ」は、種形成の間に共通祖先遺伝子から生じた異なる種における相同ヌクレオチド配列および/またはアミノ酸配列を指す。本発明のヌクレオチド配列の相同体またはオルソログは、本発明の前記ヌクレオチド配列に対して実質的な配列同一性(例えば、少なくとも約70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%または100%)を有する。
本明細書中で用いられる「配列同一性」は、2つの最適にアラインされたポリヌクレオチドまたはポリペプチド配列が、構成要素、例えば、ヌクレオチドまたはアミノ酸のアラインメントのウィンドウの全体を通して不変である程度を指す。「同一性」は、Computational Molecular Biology(Lesk,A.M.,ed.)Oxford University Press,New York(1988);Biocomputing:Informatics and Genome Projects(Smith,D.W.,ed.)Academic Press,New York(1993);Computer Analysis of Sequence Data,Part I(Griffin,A.M.,and Griffin,H.G.,eds.)Humana Press,New Jersey(1994);Sequence Analysis in Molecular Biology(von Heinje,G.,ed.)Academic Press(1987);およびSequence Analysis Primer(Gribskov,M.and Devereux,J.,eds.)Stockton Press,New York(1991)に記載されるものが挙げられるがこれらに限定されない知られている方法によって容易に算出することができる。
本明細書中で用いられる用語「配列同一性パーセント」または「同一性パーセント」は、試験(「対象」)ポリヌクレオチド分子(またはその相補鎖)と比較した、参照(「クエリ」)ポリヌクレオチド分子(またはその相補鎖)の直鎖状ポリヌクレオチド配列内の、2つの配列が最適にアラインされた場合の同一のヌクレオチドのパーセンテージを指す。一部の実施形態において、「同一性パーセント」は、参照ポリペプチドと比較したアミノ酸配列内の同一のアミノ酸のパーセンテージを指し得る。
本明細書中で用いられるフレーズ、2つの核酸分子、ヌクレオチド配列、またはタンパク質配列の文脈における「実質的に同一の」または「実質的同一性」は、以下の配列比較アルゴリズムの1つを用いて、または目視検査によって測定して、最大対応について比較かつアラインした場合のヌクレオチドまたはアミノ酸残基同一性が、少なくとも約70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%または100%である2つ以上の配列またはサブ配列を指す。本発明の一部の実施形態において、実質的同一性は、約10ヌクレオチド~約20ヌクレオチド、約10ヌクレオチド~約25ヌクレオチド、約10ヌクレオチド~約30ヌクレオチド、約15ヌクレオチド~約25ヌクレオチド、約30ヌクレオチド~約40ヌクレオチド、約50ヌクレオチド~約60ヌクレオチド、約70ヌクレオチド~約80ヌクレオチド、約90ヌクレオチド~約100ヌクレオチド、またはそれを超えるヌクレオチド長、およびそれらにおけるあらゆる範囲、最大で配列の完全長である本発明のヌクレオチド配列の連続ヌクレオチドの領域にわたって存在する。一部の実施形態において、ヌクレオチド配列は、少なくとも約20ヌクレオチド(例えば、約20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40ヌクレオチド)にわたって、実質的に同一であり得る。一部の実施形態において、実質的に同一のヌクレオチドまたはタンパク質配列は、これが実質的に同一であるヌクレオチド(またはコードされたタンパク質配列)と実質的に同じ機能を実行する。
配列比較について、典型的に1つの配列が、試験配列が比較される参照配列として機能する。配列比較アルゴリズムを用いる場合、試験配列および参照配列がコンピュータに入力され、必要であれば、サブ配列座標が指定され、配列アルゴリズムプログラムパラメータが指定される。続いて、配列比較アルゴリズムは、指定されたプログラムパラメータに基づいて、参照配列と比較した試験配列についての配列同一性パーセントを算出する。
比較ウィンドウをアラインするための配列の最適なアラインメントが、当業者に周知であり、ツール、例えばSmith and Watermanのローカル相同性アルゴリズム、Needleman and Wunschの相同性アラインメントアルゴリズム、Pearson and Lipmanの類似性の検索方法によって、そして場合によってはこれらのアルゴリズムのコンピュータによる実施、例えばGCG(登録商標)Wisconsin Package(登録商標)(Accelrys Inc.,San Diego,CA)の一部として利用可能なGAP、BESTFIT、FASTA、およびTFASTAによって行われてもよい。試験配列および参照配列のアラインされたセグメントについての「同一性分率」は、参照配列セグメント、例えば、参照配列全体、または参照配列の定義したより小さな部分内の構成要素の総数で割った、2つのアラインされた配列によって共有される同一の構成要素の数である。配列同一性パーセントは、100を乗算した同一性分率として表される。1つまたは複数のポリヌクレオチド配列の比較は、全長ポリヌクレオチド配列もしくはその一部、またはより長いポリヌクレオチド配列に対してであってもよい。また、本発明の目的上、「同一性パーセント」は、翻訳されたヌクレオチド配列についてBLASTXバージョン2.0、そしてポリヌクレオチド配列についてBLASTNバージョン2.0を用いて求められてもよい。
また、2つのヌクレオチド配列は、2つの配列がストリンジェント条件の下で互いにハイブリダイズする場合、実質的に相補的であると考えてもよい。代表的な一部の実施形態において、実質的に相補的であると考えられる2つのヌクレオチド配列は、高度にストリンジェントな条件の下で、互いにハイブリダイズする。
サザンハイブリダイゼーションおよびノーザンハイブリダイゼーション等の核酸ハイブリダイゼーション実験の文脈における「ストリンジェントハイブリダイゼーション条件」および「ストリンジェントハイブリダイゼーション洗浄条件」は、配列依存的であり、様々な環境パラメータの下で異なる。核酸のハイブリダイゼーションの広範囲にわたるガイドが、Tijssen Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes part I chapter2“Overview of principles of hybridization and the strategy of nucleic acid probe assays”Elsevier,New York(1993)において見出される。通常、高度にストリンジェントなハイブリダイゼーション条件および洗浄条件は、定義したイオン強度およびpHでの特定の配列についての熱融点(T)よりも約5℃低くなるように選択される。
は、標的配列の50%が、完全にマッチするプローブにハイブリダイズする(定義したイオン強度およびpH下での)温度である。特定のプローブについてのTと等しくなるように、非常にストリンジェントな条件が選択される。サザンブロットまたはノーザンブロットにおいてフィルター上に100を超える相補的な残基を有する相補的なヌクレオチド配列のハイブリダイゼーション用のストリンジェントハイブリダイゼーション条件の例として、ハイブリダイゼーションが一晩実行される、42℃での1mgヘパリン入り50%ホルムアミドがある。高度にストリンジェントな洗浄条件の例として、72℃にて約15分間の0.1 5M NaClがある。ストリンジェント洗浄条件の例として、65℃にて15分間の0.2×SSC洗浄がある(SSCバッファの解説について、以下のSambrook参照)。多くの場合、高ストリンジェンシー洗浄が、バックグラウンドプローブシグナルを取り除くために、低ストリンジェンシー洗浄の後にある。例えば100を超えるヌクレオチドのデュプレックスについての中程度のストリンジェンシー洗浄の例として、45℃にて15分間の1×SSCがある。例えば100を超えるヌクレオチドのデュプレックスについての低ストリンジェンシー洗浄の例として、40℃にて15分間の4~6×SSCがある。短いプローブ(例えば約10~50ヌクレオチド)について、ストリンジェント条件は、典型的に、約1.0M Naイオン未満の塩濃度、典型的にはpH7.0~8.3にて約0.01~1.0M Naイオン濃度(または他の塩)を包含し、温度は、典型的に、少なくとも約30℃である。また、ストリンジェント条件は、ホルムアミド等の不安定化剤を添加することで達成することができる。一般に、特定のハイブリダイゼーションアッセイにおいて無関係なプローブについて観察されるよりも2×(またはより高い)のシグナル対ノイズ比が、特異的ハイブリダイゼーションの検出を示す。ストリンジェント条件下で互いにハイブリダイズしないヌクレオチド配列は、コードするタンパク質が実質的に同一であるならば、やはり実質的に同一である。これは、例えば、ヌクレオチド配列のコピーが、遺伝コードによって容認される最大コドン縮重を用いて生じる場合に、起こり得る。
本発明のポリヌクレオチドおよび/または組換え核酸構築体は、発現のためにコドン最適化され得る。一部の実施形態において、本発明のポリヌクレオチド、核酸構築体、発現カセット、および/またはベクター(例えば、操作されたタンパク質、核酸結合ドメイン(例えば、DNA結合ドメイン、例えば、ポリヌクレオチドガイドエンドヌクレアーゼ、ジンクフィンガーヌクレアーゼ、転写アクティベータ様エフェクターヌクレアーゼ(TALEN)、アルゴノートタンパク質、および/またはCRISPR-Casエフェクタータンパク質由来の配列特異的DNA結合ドメイン)、ガイド核酸、シトシンデアミナーゼ、および/またはアデニンデアミナーゼを含む/コードする)が、生物(例えば、動物、植物、真菌、古細菌、または細菌)内での発現のためにコドン最適化されていてもよい。一部の実施形態において、本発明のコドン最適化核酸構築体、ポリヌクレオチド、発現カセット、および/またはベクターは、コドン最適化されていない参照核酸構築体、ポリヌクレオチド、発現カセット、および/またはベクターに対して約70%~約99.9%(またはそれを超える)(例えば、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.9%または100%)の同一性を有する。
本明細書中に記載される実施形態のいずれにおいても、本発明のポリヌクレオチドまたは核酸構築体は、生物またはその細胞(例えば、植物および/または植物の細胞)内での発現用の種々のプロモーターおよび/または他の調節要素と作動可能に関連し得る。ゆえに、一部の実施形態において、本発明のポリヌクレオチドまたは核酸構築体はさらに、1つまたは複数のヌクレオチド配列に作動可能に連結した1つまたは複数のプロモーター、イントロン、エンハンサー、および/またはターミネーターを含んでもよい。一部の実施形態において、プロモーターは、イントロンと作動可能に関連し得る(例えば、Ubi1プロモーターおよびイントロン)。一部の実施形態において、イントロンと関連するプロモーターは、「プロモーター領域」と称され得る(例えば、Ubi1プロモーターおよびイントロン)。
ポリヌクレオチドに関して本明細書中で用いられる「作動可能に連結した」または「作動可能に関連した」は、示される要素が、互いに機能的に関連しており、かつ通常物理的にも関連していることを意味する。ゆえに、本明細書中で用いられる用語「作動可能に連結した」または「作動可能に関連した」は、機能的に関連する単一の核酸分子上のヌクレオチド配列を指す。ゆえに、第2のヌクレオチド配列に作動可能に連結した第1のヌクレオチド配列は、第1のヌクレオチド配列が第2のヌクレオチド配列と機能的に関係して配置されている状況を意味する。例えば、プロモーターは、プロモーターがヌクレオチド配列の転写または発現をもたらすならば、前記ヌクレオチド配列と作動可能に関連している。当業者であれば、制御配列(例えばプロモーター)は、作動可能に関連するヌクレオチド配列に、制御配列がその発現を導くように機能する限り、連続している必要はないことを理解するであろう。ゆえに、例えば、転写はされるが翻訳されない介在核酸配列が、プロモーターとヌクレオチド配列との間に存在することができ、そしてプロモーターは依然として、ヌクレオチド配列に「作動可能に連結している」と考えることができる。
本明細書中で用いられる用語、ポリペプチドに関して「連結した」または「融合した」は、一方のポリペプチドの、もう1つへの付着を指す。ポリペプチドは、別のポリペプチドに(N末端またはC末端にて)直接(例えば、ペプチド結合を介して)連結または融合されても、リンカー(例えばペプチドリンカー)を介して連結または融合されてもよい。
ポリペプチドに関する用語「リンカー」は、当該技術において認識されており、2つの分子または部分、例えば、融合タンパク質、例えばCRISPR-Casエフェクタータンパク質ならびに注目するペプチドタグおよび/またはポリペプチドの2つのドメインを連結する化学基または分子を指す。リンカーは、単一の連結分子(例えば単一のアミノ酸)で構成されていてもよいし、複数の連結分子を含んでもよい。一部の実施形態において、リンカーは、有機分子、基、ポリマー、または化学部分、例えば二価有機部分であり得る。一部の実施形態において、リンカーは、アミノ酸であってもよいし、ペプチドであってもよい。一部の実施形態において、リンカーはペプチドである。
一部の実施形態において、本発明に有用なペプチドリンカーは、約2~約100、またはそれを超えるアミノ酸長、例えば、約2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100またはそれを超えるアミノ酸長(例えば、約2~約40、約2~約50、約2~約60、約4~約40、約4~約50、約4~約60、約5~約40、約5~約50、約5~約60、約9~約40、約9~約50、約9~約60、約10~約40、約10~約50、約10~約60、または約2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25アミノ酸~約26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100またはそれを超えるアミノ酸長(例えば、約105、110、115、120、130、140、150、またはそれを超えるアミノ酸長))であり得る。一部の実施形態において、ペプチドリンカーは、GSリンカーであってもよい。一部の実施形態において、ペプチドリンカーは、配列番号18~47のアミノ酸配列の1つを有する。一部の実施形態において、ペプチドリンカーは、(GGS)n、GS、SG、GSSG(配列番号175)、S(GGS)n(配列番号42)、SGGS(配列番号43)、または(GGGGS)n(配列番号44)、のアミノ酸配列を含んでもよく、式中、nは、1~20の整数(例えば、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20)である。一部の実施形態において、ペプチドリンカーは、アミノ酸配列:SGGSGGSGGS(配列番号45)を含んでもよい。一部の実施形態において、ペプチドリンカーは、アミノ酸配列:SGSETPGTSESATPES(配列番号46)を含んでもよく、XTENリンカーとも称される。一部の実施形態において、ペプチドリンカーは、アミノ酸配列:SGGSSGGSSGSETPGTSESATPESSGGSSGGS(配列番号47)を含んでもよく、GS-XTEN-GSリンカーとも称される。
ポリヌクレオチドに関して本明細書中で用いられる用語「連結した」または「融合した」は、一方のポリヌクレオチドの、もう1つのポリヌクレオチドへの付着を指す。一部の実施形態において、2つ以上のポリヌクレオチド分子が、有機分子、基、ポリマー、または化学部分、例えば二価有機部分であり得るリンカーによって連結されていてよい。ポリヌクレオチドは、例えばワトソン-クリック型の塩基対合が挙げられる共有結合もしくは非共有結合を介して、または1つもしくは複数の連結ヌクレオチドを介して、別のポリヌクレオチドに(5’末端または3’末端にて)連結または融合されていてよい。一部の実施形態において、特定の構造のポリヌクレオチドモチーフは、別のポリヌクレオチド配列(例えば、ガイドRNA内のヘアピン構造の伸長部)内に挿入されていてよい。一部の実施形態において、連結ヌクレオチドは、天然に存在するヌクレオチドであってよい。一部の実施形態において、連結ヌクレオチドは、天然に存在しないヌクレオチドであってよい。
「プロモーター」は、プロモーターと作動可能に関連するヌクレオチド配列(例えばコード配列)の転写を制御または調節するヌクレオチド配列である。プロモーターによって制御または調節されるコード配列は、ポリペプチドおよび/または機能RNAをコードし得る。典型的には、「プロモーター」は、RNAポリメラーゼIIの結合部位を含有し、かつ転写の開始を指示するヌクレオチド配列を指す。一般に、プロモーターは、対応するコード配列のコード領域の開始点に対して、5’側、または上流側に見出される。プロモーターは、遺伝子発現の調節因子の働きをする他の要素;例えばプロモーター領域を含んでもよい。これは、TATAボックスコンセンサス配列および多くの場合CAATボックスコンセンサス配列を含む(Breathnach and Chambon,(1981)Annu.Rev.Biochem.50:349)。植物では、CAATボックスは、AGGAボックスによって置換されている場合がある(Messing et al.,(1983)in Genetic Engineering of Plants,T.Kosuge,C.Meredith and A.Hollaender(eds.),Plenum Press,pp.211-227)。一部の実施形態において、プロモーター領域は、少なくとも1つのイントロン(例えば、配列番号48または配列番号49)を含んでもよい。
本発明に有用なプロモーターの例として、組換え核酸分子、例えば、「合成核酸構築体」または「タンパク質-RNA複合体」の調製に用いられる構成的、誘導性、時間的に調節された、発生的に調節された、化学的に調節された、組織選好プロモーターおよび/または組織特異的プロモーターが挙げられ得る。これらの種々のタイプのプロモーターが、当該技術において知られている。
プロモーターの選択は、発現の時間的かつ空間的な必要条件に応じて変わってもよいし、形質転換されることとなる宿主細胞に基づいて変わってもよい。様々な多くの生物用のプロモーターが、当該技術において周知である。当該技術において存在する広範囲にわたる知識に基づいて、注目する特定の宿主生物に適したプロモーターを選択することができる。ゆえに、例えば、モデル生物において高度に構成的に発現される遺伝子の上流側のプロモーターについてかなり知られており、そのような知識は、必要に応じて、他の系において容易にアクセスすることができ、かつ実行することができる。
一部の実施形態において、植物において機能的なプロモーターが、本発明の構築体に用いられてもよい。植物内での発現を駆動するのに有用なプロモーターの非限定的な例として、RubisCo小サブユニット遺伝子1のプロモーター(PrbcS1)、アクチン遺伝子のプロモーター(Pactin)、硝酸還元酵素遺伝子のプロモーター(Pnr)、および重複炭素脱水酵素遺伝子1のプロモーター(Pdca1)が挙げられる(Walker et al.Plant Cell Rep.23:727-735(2005)、Li et al.Gene 403:132-142(2007)、Li et al.Mol Biol.Rep.37:1143-1154(2010)参照)。PrbcS1およびPactinは構成的プロモーターであり、PnrおよびPdca1は誘導性プロモーターである。Pnrは、ニトラートによって誘導され、アンモニウムによって抑制され(Li et al.Gene 403:132-142(2007))、そしてPdca1は、塩によって誘導される(Li et al.Mol Biol.Rep.37:1143-1154(2010))。
植物に有用な構成的プロモーターの例として、以下に限定されないが、セストラムウイルスプロモーター(cmp)(米国特許第7,166,770号)、イネアクチン1プロモーター(Wang et al.(1992)Mol.Cell.Biol.12:3399-3406、および米国特許第5,641,876号)、CaMV35Sプロモーター(Odell et al.(1985)Nature 313:810-812)、CaMV19Sプロモーター(Lawton et al.(1987)Plant Mol.Biol.9:315-324)、nosプロモーター(Ebert et al.(1987)Proc.Natl.Acad.Sci USA 84:5745-5749)、Adhプロモーター(Walker et al.(1987)Proc.Natl.Acad.Sci.USA 84:6624-6629)、スクロース合成酵素プロモーター(Yang & Russell(1990)Proc.Natl.Acad.Sci.USA 87:4144-4148)、およびユビキチンプロモーターが挙げられる。ユビキチンに由来する構成的プロモーターは、多くの細胞型において蓄積している。ユビキチンプロモーターは、トランスジェニック植物に用いられるいくつかの植物種、例えば、ヒマワリ(Binet et al.,1991.Plant Science 79:87-94)、トウモロコシ(Christensen et al.,1989.Plant Molec.Biol.12:619-632)、およびアラビドプシス(arabidopsis)(Norris et al.1993.Plant Molec.Biol.21:895-906)からクローニングされている。トウモロコシユビキチンプロモーター(UbiP)は、トランスジェニック単子葉植物系において開発されており、その配列、および単子葉植物形質転換のために構築されたベクターが、欧州特許出願公開第0342926号に開示されている。ユビキチンプロモーターは、トランスジェニック植物、とりわけ単子葉植物内での本発明のヌクレオチド配列の発現に適している。さらに、McElroy et al.(Mol.Gen.Genet.231:150-160(1991))によって記載されるプロモーター発現カセットは、本発明のヌクレオチド配列の発現用に容易に修飾することができ、そして単子葉植物宿主に用いるのに特に適している。
一部の実施形態において、組織特異的/組織選好プロモーターは、植物細胞内での異種ポリヌクレオチドの発現に用いることができる。組織特異的または組織選好発現パターンとして、以下に限定されないが、緑色組織特異的もしくは緑色組織選好、根特異的もしくは根選好、茎特異的もしくは茎選好、花卉特異的もしくは花卉選好、または花粉特異的もしくは花粉選好なものが挙げられる。緑色組織内での発現に適したプロモーターとして、光合成に関与する遺伝子を調節する多くのものが挙げられ、これらの多くは、単子葉植物および双子葉植物の双方からクローニングされている。一実施形態において、本発明に有用なプロモーターとして、ホスホエノールカルボキシラーゼ遺伝子由来のトウモロコシPEPCプロモーターがある(Hudspeth & Grula,Plant Molec.Biol.12:579-589(1989))。組織特異的プロモーターの非限定的な例として、種子貯蔵タンパク質(例えば、β-コングリシニン、クルシフェリン、napin、およびファゼオリン)、ゼインもしくは油体タンパク質(例えばオレオシン)、または脂肪酸生合成に関与するタンパク質(アシルキャリアタンパク質、ステアロイル-ACPデサチュラーゼ、および脂肪酸デサチュラーゼ(fad2-1)が挙げられる)をコードする遺伝子、および胚発生中に発現される他の核酸(例えばBce4、例えば、Kridl et al.(1991)Seed Sci.Res.1:209-219、および欧州特許出願公開第255378号参照)と関連するものが挙げられる。植物、特にトウモロコシ内での本発明のヌクレオチド配列の発現に有用な組織特異的または組織選好性プロモーターとして、以下に限定されないが、根、髄、葉、または花粉内での発現を導くものが挙げられる。そのようなプロモーターは、例えば、国際公開第93/07278号(プロモーターの開示が参照によって本明細書に組み込まれる)に開示されている。本発明に有用な組織特異的または組織選好プロモーターの他の非限定的な例として、米国特許第6,040,504号に開示されるワタルビスコプロモーター;米国特許第5,604,121号に開示されるイネスクロース合成酵素プロモーター;de Framond(FEBS290:103-106(1991);Ciba-Geigyの欧州特許出願公開第0452269号)によって記載される根特異的プロモーター;米国特許第5,625,136号(Ciba-Geigy)に記載され、トウモロコシtrpA遺伝子の発現を駆動する茎特異的プロモーター;国際公開第01/73087号に開示されるケストルムイエローリーフカーリングウイルスプロモーター;ならびに花粉特異的または花粉選好プロモーター(イネ由来のProOsLPS10およびProOsLPS11(Nguyen et al.Plant Biotechnol.Reports 9(5):297-306(2015))、トウモロコシ由来のZmSTK2_USP(Wang et al.Genome 60(6):485-495(2017))、トマト由来のLAT52およびLAT59(Twell et al.Development 109(3):705-713(1990))、Zm13(米国特許第10,421,972号)、アラビドプシス由来のPLA-δプロモーター(米国特許第7,141,424号)、ならびに/またはトウモロコシ由来のZmC5プロモーター(国際公開第1999/042587号)が挙げられるが、これらに限定されない)がある。
植物組織特異的/組織選好プロモーターの更なる例として、以下に限定されないが、根毛特異的シスエレメント(RHE)(Kim ET AL.The Plant Cell 18:2958-2970(2006))、根特異的プロモーターRCc3(Jeong et al.Plant Physiol.153:185-197(2010))およびRB7(米国特許第5459252号)、レクチンプロモーター(Lindstrom et al.(1990)Der.Genet.11:160-167;およびVodkin(1983)Prog.Clin.Biol.Res.138:87-98)、トウモロコシアルコール脱水素酵素1プロモーター(Dennis et al.(1984)Nucleic Acids Res.12:3983-4000)、S-アデノシル-L-メチオニン合成酵素(SAMS)(Vander Mijnsbrugge et al.(1996)Plant and Cell Physiology,37(8):1108-1115)、トウモロコシ集光性複合体プロモーター(Bansal et al.(1992)Proc.Natl.Acad.Sci.USA 89:3654-3658)、トウモロコシヒートショックタンパク質プロモーター(O’Dell et al.(1985)EMBO J.5:451-458;およびRochester et al.(1986)EMBO J.5:451-458)、エンドウ小サブユニットRuBPカルボキシラーゼプロモーター(Cashmore,“Nuclear genes encoding the small subunit of ribulose-1,5-bisphosphate carboxylase”pp.29-39 In:Genetic Engineering of Plants(Hollaender ed.,Plenum Press 1983、およびPoulsen et al.(1986)Mol.Gen.Genet.205:193-200)、Tiプラスミドマンノピン合成酵素プロモーター(Langridge et al.(1989)Proc.Natl.Acad.Sci.USA 86:3219-3223)、Tiプラスミドノパリン合成酵素プロモーター(Langridge et al.(1989)、前掲)、ペチュニアカルコンイソメラーゼプロモーター(van Tunen et al.(1988)EMBO J.7:1257-1263)、インゲンマメグリシンリッチタンパク質1プロモーター(Keller et al.(1989)Genes Dev.3:1639-1646)、トランケート型CaMV35Sプロモーター(O’Dell et al.(1985)Nature 313:810-812)、ジャガイモパタチンプロモーター(Wenzler et al.(1989)Plant Mol.Biol.13:347-354)、根細胞プロモーター(Yamamoto et al.(1990)Nucleic Acids Res.18:7449)、トウモロコシゼインプロモーター(Kriz et al.(1987)Mol.Gen.Genet.207:90-98;Langridge et al.(1983)Cell 34:1015-1022;Reina et al.(1990)Nucleic Acids Res.18:6425;Reina et al.(1990)Nucleic Acids Res.18:7449;およびWandelt et al.(1989)Nucleic Acids Res.17:2354)、グロブリン-1プロモーター(Belanger et al.(1991)Genetics 129:863-872)、α-チューブリンcabプロモーター(Sullivan et al.(1989)Mol.Gen.Genet.215:431-440)、PEPCaseプロモーター(Hudspeth & Grula(1989)Plant Mol.Biol.12:579-589)、R遺伝子複合体-関連プロモーター(Chandler et al.(1989)Plant Cell 1:1175-1183)、ならびにカルコン合成酵素プロモーター(Franken et al.(1991)EMBO J.10:2605-2612)が挙げられる。
種子特異的発現に有用なものとして、エンドウビシリンプロモーター(Czako et al.(1992)Mol.Gen.Genet.235:33-40)、および米国特許第5,625,136号に開示される種子特異的プロモーターがある。成葉内での発現に有用なプロモーターとして、老化の開始時にスイッチされるもの、例えばシロイヌナズナ(Arabidopsis)属由来のSAGプロモーター(Gan et al.(1995)Science 270:1986-1988)がある。
また、葉緑体内で機能的なプロモーターを用いることができる。そのようなプロモーターの非限定的な例として、バクテリオファージT3遺伝子9 5’UTR、および米国特許第7,579,516号中で開示される他のプロモーターが挙げられる。本発明に有用な他のプロモーターとして、以下に限定されないが、S-E9小サブユニットRuBPカルボキシラーゼプロモーターおよびクニッツトリプシンインヒビター遺伝子プロモーター(Kti3)が挙げられる。
本発明に有用な更なる調節要素として、以下に限定されないが、イントロン、エンハンサー、終止配列、ならびに/または5’および3’非翻訳領域が挙げられる。
本発明に有用なイントロンとして、植物において同定されており、かつ植物から単離されてから、植物の形質転換に用いられることとなる発現カセット中に挿入されるイントロンがあり得る。当業者によって理解されるように、イントロンは、自己切除に必要とされる配列を含むことができ、そして核酸構築体/発現カセット中にフレーム単位で(in frame)組み込まれる。イントロンを、一核酸構築体内で複数のタンパク質コード配列を分離するスペーサーとして用いることもできるし、イントロンを、例えば、mRNAを安定させるのに、一タンパク質コード配列の内側で用いることもできる。イントロンは、タンパク質コード配列内で用いられるならば、切除部位を含んだ「フレーム単位で」挿入される。また、イントロンは、発現を向上させるか、または修飾するように、プロモーターと関連してもよい。一例として、本発明に有用なプロモーター/イントロンの組合せとして、以下に限定されないが、トウモロコシUbi1プロモーターおよびイントロンの組合せが挙げられる。
本発明に有用なイントロンの非限定的な例として、ADHI遺伝子(例えば、Adh1-Sイントロン1、2、および6)、ユビキチン遺伝子(Ubi1)、RuBisCo小サブユニット(rbcS)遺伝子、RuBisCo大サブユニット(rbcL)遺伝子、アクチン遺伝子(例えばactin-1イントロン)、ピルビン酸脱水素酵素キナーゼ遺伝子(pdk)、硝酸還元酵素遺伝子(nr)、重複炭素脱水酵素遺伝子1(Tdca1)、psbA遺伝子、atpA遺伝子、またはそれらのあらゆる組合せ由来のイントロンが挙げられる。
本明細書中で用いられる「編集系」は、現在知られているか、または後に開発されるあらゆる部位特異的(例えば配列特異的)核酸編集系を指し、当該系は、核酸内に修飾(例えば変異)を標的特異的に導入することができる。例えば、編集系(例えば、部位特異的かつ/または配列特異的編集系)として、以下に限定されないが、CRISPR-Cas編集系、メガヌクレアーゼ編集系、ジンクフィンガーヌクレアーゼ(ZFN)編集系、転写アクティベータ様エフェクターヌクレアーゼ(TALEN)編集系、塩基編集系、および/またはプライム編集系が挙げられ得、これらは各々、組成物および/または細胞内で一緒に(例えば、系として)存在し、かつ/または発現される場合に、標的核酸を配列特異的に修飾する(例えば変異させる)ことができる1つもしくは複数のポリペプチドおよび/または1つもしくは複数のポリヌクレオチドを含んでよい。一部の実施形態において、編集系(例えば、部位特異的かつ/または配列特異的編集系)は、1つもしくは複数のポリヌクレオチドおよび/または1つもしくは複数のポリペプチドを含み得、以下に限定されないが、核酸結合ドメイン(例えば、DNA結合ドメイン)、ヌクレアーゼ、別のポリペプチド、および/またはポリヌクレオチドが挙げられる。一部の実施形態において、本発明の操作されたタンパク質を含むCRISPR-Cas編集系が提供され、かつ/または用いられる。
一部の実施形態において、編集系は、例えば、ポリヌクレオチドガイドエンドヌクレアーゼ、CRISPR-Casエンドヌクレアーゼ(例えばCRISPR-Casエフェクタータンパク質)、ジンクフィンガーヌクレアーゼ、転写アクティベータ様エフェクターヌクレアーゼ(TALEN)、および/またはアルゴノートタンパク質に由来し得る1つまたは複数の配列特異的核酸結合ポリペプチド(例えばDNA結合ドメイン)を含む。一部の実施形態において、編集系は、以下に限定されないが、エンドヌクレアーゼ(例えばFok1)、ポリヌクレオチドガイドエンドヌクレアーゼ、CRISPR-Casエンドヌクレアーゼ(例えばCRISPR-Casエフェクタータンパク質)、ジンクフィンガーヌクレアーゼ、および/または転写アクティベータ様エフェクターヌクレアーゼ(TALEN)が挙げられる1つまたは複数の切断ポリペプチド(例えばヌクレアーゼ)を含む。
本明細書中で用いられる「核酸結合ドメイン」は、核酸(例えば標的核酸)に結合するか、または結合することができるポリペプチドまたはドメインを指す。DNA結合ドメインは、例となる核酸結合ドメインであり、部位特異的かつ/または配列特異的核酸結合ドメインであってよい。一部の実施形態において、核酸結合ドメインは、以下に限定されないが、例えば、ポリヌクレオチドガイドエンドヌクレアーゼ、CRISPR-Casエフェクタータンパク質(例えばCRISPR-Casエンドヌクレアーゼ)、ジンクフィンガーヌクレアーゼ、転写アクティベータ様エフェクターヌクレアーゼ(TALEN)、および/またはアルゴノートタンパク質由来の、配列特異的結合ドメイン等の配列特異的核酸結合ドメインであってよい。一部の実施形態において、核酸結合ドメインは、以下に限定されないが、エンドヌクレアーゼ(例えばFok1)、ポリヌクレオチドガイドエンドヌクレアーゼ、CRISPR-Casエンドヌクレアーゼ、ジンクフィンガーヌクレアーゼ、および/または転写アクティベータ様エフェクターヌクレアーゼ(TALEN)等の切断ドメイン(例えばヌクレアーゼドメイン)を含む。一部の実施形態において、核酸結合ドメインは、1つまたは複数の核酸分子(またはその部分もしくは領域)に相補的な特定の標的ヌクレオチド配列(例えばゲノムの遺伝子座)に、核酸結合ドメインを導くか、またはガイドすることによって、核酸結合ドメインを、特定の標的部位にて、ヌクレオチド配列に結合させることができる1つまたは複数の核酸分子と結合する(例えば、複合体を形成する)ことができる(例えば、本明細書中に記載されるガイド核酸と複合体を形成する)ことができるポリペプチドである。一部の実施形態において、核酸結合ドメインは、本明細書中に記載されるCRISPR-Casエフェクタータンパク質である。
一部の実施形態において、編集系は、アセンブルされたリボ核タンパク質複合体等のリボ核タンパク質(例えば、CRISPR-Casエフェクタータンパク質、ガイド核酸、および場合によってはデアミナーゼを含むリボ核タンパク質)を含むか、またはこれである。一部の実施形態において、編集系のリボ核タンパク質は、例えば、標的核酸に接触する場合に、または細胞(例えば植物細胞)中に導入される場合に、一緒にアセンブルされてもよい(例えば、CRISPR-Casエフェクタータンパク質、ガイド核酸、および場合によってはデアミナーゼを含む予めアセンブルされたリボ核タンパク質)。一部の実施形態において、編集系のリボ核タンパク質が、複合体(例えば、共有結合的かつ/または非共有結合的に結合した複合体)にアセンブルしていてもよい一方、リボ核タンパク質の部分が、標的核酸に接触しており、かつ/または植物細胞中への導入の後かつ/もしくはその間にアセンブルしてもよい。一部の実施形態において、編集系は、植物細胞中に導入される場合に、(例えば、共有結合的かつ/または非共有結合的に結合した複合体に)アセンブルされてもよい。一部の実施形態において、リボ核タンパク質は、操作されたタンパク質、ガイド核酸、および場合によってはデアミナーゼを含んでもよい。
本明細書中で用いられる用語「導入遺伝子」または「トランスジェニック」は、一生物のゲノムからとられるか、または合成的に生成され、かつ続いて注目する宿主細胞(例えば植物細胞)または生物または組織中に導入され、かつその後に「安定した」形質転換アプローチまたは形質移入アプローチによる宿主のゲノム中に組み込まれる少なくとも1つの核酸配列を指す。これに対し、用語「一過性の」形質転換または形質移入または導入は、場合によっては適切な化学薬剤または生物学的薬剤を含む、少なくとも1つの核酸(DNA、RNA、一本鎖もしくは二本鎖、またはそれらの混合物)、および/または少なくとも1つのアミノ酸配列が挙げられる分子ツールを導入して、以下に制限されないが、細胞質、細胞小器官(核、ミトコンドリア、液胞、葉緑体が挙げられる)を含む細胞の注目する少なくとも1つのコンパートメント中への、または膜中への移入を達成して、ゲノム中への安定した組込み(integrationまたはincorporation)を達成することなく、そして故に細胞のゲノム中に導入される少なくとも1つの各分子を遺伝することなく、導入された少なくとも1つの分子の転写および/または翻訳および/または結合および/または活性をもたらす方法を指す。用語「導入遺伝子フリー」は、導入遺伝子が、注目する宿主細胞または組織または生物のゲノム内に存在しないか、または見出されない状況を指す。
一部の実施形態において、本発明のポリヌクレオチドおよび/または核酸構築体は、「発現カセット」であり得、または発現カセット内に含まれ得る。本明細書中で用いられる「発現カセット」は、例えば、本発明の核酸構築体(例えば、操作されたタンパク質をコードするポリヌクレオチド、シトシンデアミナーゼをコードするポリヌクレオチド、アデニンデアミナーゼをコードするポリヌクレオチド、デアミナーゼ融合タンパク質をコードするポリヌクレオチド、ペプチドタグをコードするポリヌクレオチド、親和性ポリペプチドをコードするポリヌクレオチド、グリコシラーゼをコードするポリヌクレオチド、および/またはガイド核酸を含むポリヌクレオチド)を含む組換え核酸分子を意味し、核酸構築体は、少なくとも制御配列(例えばプロモーター)と作動可能に結合されている。ゆえに、本発明の一部の実施形態は、例えば、本発明の核酸構築体を発現するように設計された発現カセットを提供する。発現カセットが複数のポリヌクレオチドを含む場合、ポリヌクレオチドは、ポリヌクレオチドの全ての発現を駆動する単一のプロモーターに作動可能に連結されていてもよいし、ポリヌクレオチドは、1つまたは複数の別個のプロモーターに作動可能に連結されていてもよい(例えば、3つのポリヌクレオチドが、1つ、2つ、または3つのプロモーターによって、あらゆる組合せで駆動されてよい)。ゆえに、例えば、発現カセット内に含まれる、操作されたタンパク質をコードするポリヌクレオチド、デアミナーゼ(例えばアデニンデアミナーゼ)をコードするポリヌクレオチド、およびガイド核酸を含むポリヌクレオチドが、各々、単一のプロモーターと作動可能に結合されていてもよく、またはポリヌクレオチドの1つもしくは複数が、別個のプロモーター(例えば、2つまたは3つのプロモーター)(互いと同じであっても異なってもよい)と、あらゆる組合せで作動可能に結合されていてもよい。
一部の実施形態において、本発明のポリヌクレオチド/核酸構築体を含む発現カセットは、生物(例えば、動物、植物、および細菌等)内での発現のために最適化されていてよい。
本発明の核酸構築体を含む発現カセットは、キメラであってもよく、このことは、その構成要素の少なくとも1つが、その他の構成要素の少なくとも1つに関して、異種である(例えば、宿主生物において発現されることとなる、注目するポリヌクレオチドに作動可能に連結した、宿主生物由来のプロモーター。ここで、注目するポリヌクレオチドは、宿主とは異なる生物由来であるか、または当該プロモーターと関連して通常見出されない)ことを意味する。また、発現カセットは、天然に存在するが、異種発現に有用な組換え形態で得られたものであってもよい。
発現カセットは、場合によっては、選択された宿主細胞内で機能的である転写終止領域および/または翻訳終止領域(すなわち終止領域)および/またはエンハンサー領域を含み得る。種々の転写ターミネーターおよびエンハンサーが、当該技術において知られており、発現カセットに用いるのに入手可能である。転写ターミネーターは、転写の終止および正確なmRNAポリアデニル化を担っている。終止領域および/またはエンハンサー領域は、転写開始領域に固有であってもよいし、CRISPR-Casエフェクタータンパク質をコードする遺伝子またはデアミナーゼをコードする遺伝子に固有であってもよいし、宿主細胞に固有であってもよいし、別の源(例えば、プロモーター、CRISPR-Casエフェクタータンパク質をコードする遺伝子またはデアミナーゼをコードする遺伝子、宿主細胞、またはそれらのあらゆる組合せに対して外来であるか、異種である)に固有であってもよい。
また、本発明の発現カセットは、選択マーカーをコードするポリヌクレオチドを含むことができ、これは、形質転換された宿主細胞を選択するのに用いることができる。本明細書中で用いられる「選択マーカー」は、発現された場合に、マーカーを発現する宿主細胞に目立った表現型を与えるので、そのような形質転換された細胞を、マーカーを有していない細胞から区別することができるポリヌクレオチド配列を意味する。そのようなポリヌクレオチド配列は、マーカーが、化学手段によって、例えば選択剤(例えば抗生物質等)を用いることによって選択され得る形質を付与するかどうかに応じて、またはマーカーが単純に、観察もしくは試験を通して、例えばスクリーニング(例えば蛍光)によって識別することができる形質であるかに応じて、選択マーカーまたはスクリーニングマーカーをコードしてよい。適した選択マーカーの多くの例が、当該技術において知られており、本明細書中に記載される発現カセットに用いることができる。
本明細書中に記載される発現カセット、核酸分子/構築体、およびポリヌクレオチド配列は、ベクターと関連させて用いることができる。用語「ベクター」は、細胞中に核酸(複数可)を移入するか、送達するか、または導入するための組成物を指す。ベクターは、移入されるか、送達されるか、または導入されることとなるヌクレオチド配列を含む核酸構築体を含む。宿主生物の形質転換に用いられるベクターは、当該技術において周知である。ベクターの一般的なクラスの非限定的な例として、自己伝染性であっても可動性であってもよいしそうでなくてもよい二本鎖または一本鎖の直鎖状または環状の形態の、ウイルスベクター、プラスミドベクター、ファージベクター、ファージミドベクター、コスミドベクター、フォスミドベクター、バクテリオファージ、人工染色体、ミニサークル、またはアグロバクテリウム(Agrobacterium)属バイナリベクターが挙げられる。一部の実施形態において、ウイルスベクターとして、以下に限定されないが、レトロウイルス、レンチウイルス、アデノウイルス、アデノ随伴ウイルス、または単純ヘルペスウイルスのベクターが挙げられ得る。本明細書中で定義されるベクターは、細胞ゲノム中への組込み、または染色体外の存在(例えば、複製起点を有する自律複製プラスミド)のいずれかによって、原核生物宿主または真核生物宿主を形質転換することができる。加えて、含まれるのは、2つの異なる宿主生物内での複製が天然で、または設計によって可能なDNAビヒクルを意味するシャトルベクターであり、これは、アクチノミセスおよび関連する種、細菌、および真核生物(例えば、より高次の植物、哺乳動物、酵母、または真菌の細胞)から選択され得る。一部の実施形態において、ベクター内の核酸は、宿主細胞内での転写に適したプロモーターまたは他の調節要素の制御下にあり、かつこれと作動可能に連結されている。ベクターは、複数の宿主において機能する二元機能性発現ベクターであってもよい。ゲノムDNAの場合には、これは、それ自体のプロモーターおよび/または他の調節要素を含有してもよく、そしてcDNAの場合には、これは、宿主細胞内での発現に適したプロモーターおよび/または他の調節要素の制御下にあってもよい。したがって、本発明の核酸構築体、および/またはこれを含む発現カセットが、本明細書中に記載されるベクター、および当該技術において知られているベクター内に含まれてもよい。
本明細書中で用いられる「接触させる」、「接触させている」、「接触した」、およびその文法上の変形は、所望される反応(例えば、形質転換、転写制御、ゲノム編集、ニッキング、および/または切断)の構成要素を、所望される反応を実行するのに適した条件下に一緒に置くことを指す。ゆえに、例えば、核酸結合ドメイン(例えばCRISPR-Casエフェクタータンパク質)が発現され、そして核酸結合ドメインがガイド核酸と複合体を形成し、複合体が標的核酸にハイブリダイズし、そして場合によっては、シトシンデアミナーゼおよび/もしくはアデニンデアミナーゼが核酸結合ドメインに(故に、標的核酸に)動員される条件の下で、標的核酸を、例えば、核酸結合ドメイン(例えば、DNA結合ドメイン、例えば配列特異的DNA結合タンパク質(例えば、ポリヌクレオチドガイドエンドヌクレアーゼ、CRISPR-Casエフェクタータンパク質(例えばCRISPR-Casエンドヌクレアーゼ)、ジンクフィンガーヌクレアーゼ、転写アクティベータ様エフェクターヌクレアーゼ(TALEN)、および/またはアルゴノートタンパク質))、ガイド核酸、ならびに場合によってはシトシンデアミナーゼおよび/もしくはアデニンデアミナーゼをコードする本発明の核酸構築体と接触させてよく、またはシトシンデアミナーゼおよび/もしくはアデニンデアミナーゼは、核酸結合ドメインに融合しており、それによって、標的核酸を修飾する。一部の実施形態において、シトシンデアミナーゼおよび/またはアデニンデアミナーゼ、ならびに核酸結合ドメインは、場合によっては共有結合性かつ/または非共有結合性の相互作用を介して、標的核酸に局在する。
一部の実施形態において、操作されたタンパク質が発現され、または標的核酸が、操作されたタンパク質、ガイド核酸、ならびに場合によってはシトシンデアミナーゼおよび/またはアデニンデアミナーゼと接触し得る条件の下で、標的核酸を、操作されたタンパク質、ガイド核酸、ならびに場合によってはシトシンデアミナーゼおよび/またはアデニンデアミナーゼをコードする本発明の核酸構築体と接触させてもよい。操作されたタンパク質は、ガイド核酸と複合体を形成することができ、複合体は、標的核酸にハイブリダイズすることができ、そして場合によっては、シトシンデアミナーゼおよび/もしくはアデニンデアミナーゼは、操作されたタンパク質に(故に、標的核酸に)動員され、またはシトシンデアミナーゼおよび/もしくはアデニンデアミナーゼは、操作されたタンパク質に融合しており、それによって、標的核酸を修飾する。シトシンデアミナーゼおよび/またはアデニンデアミナーゼ、ならびに操作されたタンパク質は、場合によっては共有結合性かつ/または非共有結合性の相互作用を介して、標的核酸に局在してもよい。
本明細書中で用いられる、標的核酸に関する「修飾すること」または「修飾」は、修飾核酸を提供し、かつ/または標的核酸の転写制御を変更して修飾核酸を提供するための、標的核酸の編集(例えば変異)、共有結合修飾、核酸/ヌクレオチド塩基の交換/置換、欠失、切断、および/またはニッキングを含む。一部の実施形態において、修飾は、あらゆるサイズの挿入および/もしくは欠失、ならびに/またはあらゆるタイプの単一塩基変化(SNP)を含んでもよい。一部の実施形態において、修飾はSNPを含む。一部の実施形態において、修飾は、1つまたは複数(例えば、1、2、3、4、5つ、またはこれを超える)のヌクレオチドを交換かつ/または置換すること含む。一部の実施形態において、挿入または欠失は、約1塩基長~約30,000塩基長(例えば、約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、400、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2500、3000、3500、4000、4500、5000、5500、6000、6500、7000、7500、8000、8500、9000、9500、10,000、10,500、11,000、11,500、12,000、12,500、13,000、13,500、14,000、14,500、15,000、15,500、16,000、16,500、17,000、17,500、18,000、18,500、19,000、19,500、20,000、20,500、21,000、21,500、22,000、22,500、23,000、23,500、24,000、24,500、25,000、25,500、26,000、26,500、27,000、27,500、28,000、28,500、29,000、29,500、30,000塩基長以上、またはそれらの中のあらゆる値もしくは範囲)であってよい。ゆえに、一部の実施形態において、挿入または欠失は、約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300~約310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、 960、970、980、990、1000塩基長、またはそれらの中のあらゆる範囲もしくは値;約50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300塩基~約310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000塩基長以上、またはそれらの中のあらゆる値もしくは範囲;約500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000塩基~約2500、3000、3500、4000、4500、5000、5500、6000、6500、7000、7500、8000、8500、9000、9500、もしくは10,000塩基長以上、またはそれらの中のあらゆる値もしくは範囲;あるいは約400、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、もしくは700塩基長から、約710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2500、3000、3500、4000、4500,もしくは5000塩基長以上、またはそれらの中のあらゆる値もしくは範囲であってよい。一部の実施形態において、挿入または欠失は、約1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2500、3000、3500、4000、4500、5000、5500、6000、6500、7000、7500、8000、8500、9000、9500、もしくは10000塩基長~約10,500、11,000、11,500、12,000、12,500、13,000、13,500、14,000、14,500、15,000、15,500、16,000、16,500、17,000、17,500、18,000、18,500、19,000、19,500、20,000、20,500、21,000、21,500、22,000、22,500、23,000、23,500、24,000、24,500、25,000、25,500、26,000、26,500、27,000、27,500、28,000、28,500、29,000、29,500,もしくは30,000塩基長以上、またはそれらの中のあらゆる値もしくは範囲であってよい。
本明細書中で用いられる「動員する」、「動員すること」、または「動員」は、タンパク質-タンパク質相互作用、核酸タンパク質相互作用(例えばRNA-タンパク質相互作用)、および/または化学的相互作用を用いて、1つまたは複数のポリペプチドまたはポリヌクレオチドを、別のポリペプチドまたはポリヌクレオチドに(例えば、ゲノム内の特定の位置に)引き寄せることを指す。タンパク質-タンパク質相互作用として、以下に限定されないが、ペプチドタグ(エピトープ、多量体化エピトープ)および対応する親和性ポリペプチド、RNA動員モチーフおよび対応する親和性ポリペプチド、ならびに/または化学的相互作用が挙げられ得る。動員の目的でポリペプチドおよびポリヌクレオチドに有用であり得る例となる化学的相互作用として、以下に限定されないが、FRB-FKBPのラパマイシン誘導性二量体化;ビオチン-ストレプトアビジン相互作用;SNAPタグ(Hussain et al.Curr Pharm Des.19(30):5437-42(2013));Haloタグ(Los et al.ACS Chem Biol.3(6):373-82(2008));CLIPタグ(Gautier et al.Chemistry & Biology 15:128-136(2008));化合物によって誘導されるDmrA-DmrCヘテロダイマー(Tak et al.Nat Methods 14(12):1163-1166(2017));二官能性リガンドアプローチ(2つのタンパク質-結合化学物質を一緒に融合させる)(Voβ et al.Curr Opin Chemical Biology 28:194-201(2015))(例えばジヒドロ葉酸還元酵素(DHFR)(Kopyteck et al.Cell Cehm Biol 7(5):313-321(2000))が挙げられ得る。
注目するポリヌクレオチドまたは編集系の文脈における「導入すること」、「導入する」、「導入された」(およびその文法上の変形)は、注目するヌクレオチド配列(例えば、ポリヌクレオチド、核酸構築体、および/またはガイド核酸)および/または編集系(例えば、ポリヌクレオチド、ポリペプチド、および/またはリボ核タンパク質)を、宿主生物または前記生物の細胞(例えば、宿主細胞、例えば植物細胞)および/または編集系が、細胞の内部にアクセスするように提示することを意味する。ゆえに、例えば、操作されたタンパク質、ガイド核酸、ならびにシトシンデアミナーゼおよび/またはアデニンデアミナーゼをコードする本発明の核酸構築体が、生物の細胞中に導入されることによって、細胞が、操作されたタンパク質、ガイド核酸、ならびにシトシンデアミナーゼおよび/またはアデニンデアミナーゼにより形質転換されてもよい。一部の実施形態において、操作されたタンパク質および/またはガイド核酸が、生物の細胞中に導入されてもよく、場合によっては、操作されたタンパク質およびガイド核酸は、複合体(例えばリボ核タンパク質)内に含まれてもよい。一部の実施形態において、生物は真核生物(例えば、ヒト等の哺乳動物)である。
本明細書中で用いられる用語「形質転換」は、細胞中への異種核酸、ポリペプチド、および/またはリボ核タンパク質の導入を指す。細胞の形質転換は、安定していてもよいし、一過性であってもよい。ゆえに、一部の実施形態において、宿主細胞または宿主生物は、本発明のポリヌクレオチド/核酸分子により安定して形質転換されていてもよい。一部の実施形態において、宿主細胞または宿主生物は、本発明の核酸構築体、ポリペプチド、および/またはリボ核タンパク質により一時的に形質転換されていてもよい。
ポリヌクレオチド、ポリペプチド、および/またはリボ核タンパク質の文脈における「一過性の形質転換」は、ポリヌクレオチド、ポリペプチド、および/またはリボ核タンパク質が細胞中に導入され、細胞のゲノム中に組み込まれないことを意味する。
細胞中に導入されるポリヌクレオチドの文脈における、「安定して導入すること」または「安定して導入される」によって意図されるのは、導入されたポリヌクレオチドが、細胞のゲノム中に安定して組み込まれていることで、細胞が、ポリヌクレオチドにより安定して形質転換されていることである。
本明細書中で用いられる「安定した形質転換」または「安定して形質転換された」は、核酸分子が細胞中に導入され、細胞のゲノム中に組み込まれることを意味する。したがって、組み込まれた核酸分子は、その後代によって、より詳細には複数の連続する世代の後代によって遺伝され得る。本明細書中で用いられる「ゲノム」は、核および色素体ゲノムを含むので、例えば、葉緑体ゲノムまたはミトコンドリアゲノム中への核酸の組込みを含む。また、本明細書中で用いられる安定した形質転換は、例えば微小染色体またはプラスミドとして、染色体外に維持される導入遺伝子を指し得る。
一過性の形質転換は、例えば、酵素結合免疫吸着アッセイ(ELISA)またはウェスタンブロットによって検出され得、これらは、生物中に導入される1つまたは複数の導入遺伝子によってコードされるペプチドまたはポリペプチドの存在を検出することができる。細胞の安定した形質転換は、例えば、生物(例えば植物)中に導入される導入遺伝子のヌクレオチド配列と特異的にハイブリダイズする核酸配列との細胞のゲノムDNAのサザンブロットハイブリダイゼーションアッセイによって検出することができる。細胞の安定した形質転換は、例えば、宿主生物中に導入される導入遺伝子のヌクレオチド配列と特異的にハイブリダイズする核酸配列との細胞のRNAのノーザンブロットハイブリダイゼーションアッセイによって検出することができる。また、細胞の安定した形質転換は、例えば、当該技術において周知のポリメラーゼ連鎖反応(PCR)または他の増幅反応によって検出することができ、これは、導入遺伝子の標的配列とハイブリダイズする特異的プライマー配列を使用して、導入遺伝子配列の増幅をもたらし、これが標準的な方法に従って検出され得る。また、形質転換は、当該技術において周知であるダイレクトシーケンシングおよび/またはハイブリダイゼーションプロトコールによって検出することができる。
したがって、一部の実施形態において、本発明のヌクレオチド配列、ポリヌクレオチド、核酸構築体、および/または発現カセットは、一過性に発現され得、かつ/または宿主生物のゲノム中に安定して組み込まれ得る。ゆえに、一部の実施形態において、本発明の核酸構築体が、ガイド核酸により細胞中に一過性に導入されるので、DNAは細胞内で維持され得ない。
本発明の核酸構築体、ポリペプチド、および/またはリボ核タンパク質は、当業者に知られているいかなる方法によっても、細胞中に導入され得る。一部の実施形態において、形質転換方法として、以下に限定されないが、細菌媒介核酸送達(例えば、アグロバクテリア(Agrobacteria)を介する)、ウイルス媒介核酸送達、炭化ケイ素および/または核酸ウィスカー媒介核酸送達、リポソーム媒介核酸送達、マイクロインジェクション、マイクロ粒子衝撃、リン酸カルシウム媒介形質転換、シクロデキストリン媒介形質転換、エレクトロポレーション、ナノ粒子媒介形質転換、超音波処理、浸潤、PEG媒介核酸吸収、ならびに細胞(例えば、植物細胞または動物細胞)中への核酸の導入をもたらす他のあらゆる電気的、化学的、物理的(機械的)、かつ/または生物学的機構(それらのあらゆる組合せを含む)を介した形質転換が挙げられる。本発明の一部の実施形態において、細胞の形質転換は、核形質転換を含む。一部の実施形態において、細胞の形質転換は、色素体形質転換(例えば葉緑体形質転換)を含む。一部の実施形態において、本発明の組換え核酸構築体は、従来の育種技術を介して細胞中に導入され得る。
真核生物および原核生物の双方を形質転換する手順は、当該技術において周知であり、かつルーチンであり、文献の全体を通して記載されている(例えば、Jiang et al.2013.Nat.Biotechnol.31:233-239、Ran et al.Nature Protocols 8:2281-2308(2013)参照)。当該技術において知られている種々の植物形質転換方法の一般的なガイドとして、Miki et al.(“Procedures for Introducing Foreign DNA into Plants”in Methods in Plant Molecular Biology and Biotechnology,Glick,B.R.and Thompson,J.E.,Eds.(CRC Press,Inc.,Boca Raton,1993),pages 67-88)およびRakowoczy-Trojanowska(Cell.Mol.Biol.Lett.7:849-858(2002))が挙げられる。
したがって、ヌクレオチド配列、ポリペプチド、および/またはリボ核タンパク質が、当該技術において周知の任意の数の方法により、宿主生物またはその細胞中に導入され得る。本発明の方法は、生物の少なくとも1つの細胞の内部にアクセスするだけの、1つまたは複数のヌクレオチド配列、ポリペプチド、および/またはリボ核タンパク質を生物中に導入する特定の方法に依存しない。複数のヌクレオチド配列、ポリペプチド、および/またはリボ核タンパク質が導入されることとなる場合、これらは、単一の核酸構築体の一部として、または別個の核酸構築体としてアセンブルされ得、かつ同じ、または異なる核酸構築体上に位置決めされ得る。したがって、ヌクレオチド配列、ポリペプチド、および/またはリボ核タンパク質は、単一の形質転換事象において、かつ/または別個の形質転換事象において、注目する細胞中に導入され得、または代わりに、妥当な場合、ヌクレオチド配列は、例えば、育種プロトコールの一部として、植物中に組み込まれ得る。一部の実施形態において、細胞は、真核細胞(例えば、哺乳動物、例えばヒト細胞または植物細胞)である。
一部の実施形態において、本発明の核酸構築体(例えば、本発明の操作されたタンパク質をコードするポリヌクレオチド、デアミナーゼをコードするポリヌクレオチド、ならびに/または同上を含むガイド核酸および/もしくは発現カセットおよび/もしくはベクター)は、少なくとも1つの調節配列に作動可能に連結されていてもよく、場合によっては、少なくとも1つの調節配列が、植物内での発現のためにコドン最適化されていてもよい。一部の実施形態において、少なくとも1つの調節配列は、例えば、プロモーター、オペロン、ターミネーター、またはエンハンサーであってよい。一部の実施形態において、少なくとも1つの調節配列は、プロモーターであってよい。一部の実施形態において、調節配列はイントロンであってよい。一部の実施形態において、少なくとも1つの調節配列は、例えば、イントロンと作動可能に結合されたプロモーター、またはイントロンを含むプロモーター領域であってよい。一部の実施形態において、少なくとも1つの調節配列は、例えばユビキチンプロモーターおよびその関連イントロン(例えば、タルウマゴヤシ(Medicago truncatula)および/またはトウモロコシ(Zea mays)、ならびにそれらの関連するイントロン)であってよい。一部の実施形態において、少なくとも1つの調節配列は、ターミネーターヌクレオチド配列および/またはエンハンサーヌクレオチド配列であってよい。
一部の実施形態において、本発明の核酸構築体は、プロモーター領域と作動可能に結合されていてよく、プロモーター領域はイントロンを含み、場合によっては、プロモーター領域は、ユビキチンプロモーターおよびイントロン(例えばウマゴヤシ(Medicago)属またはトウモロコシユビキチンプロモーターおよびイントロン、例えば、配列番号48または配列番号49であってもよい。一部の実施形態において、イントロンを含むプロモーター領域と作動可能に結合された本発明の核酸構築体は、植物内での発現のためにコドン最適化されていてもよい。
一部の実施形態において、本発明の核酸構築体は、注目する1つまたは複数(例えば、1、2、3、4つ、またはそれを超える)のポリペプチドをコードしていてよく、場合によっては、注目する1つまたは複数のポリペプチドは、植物内での発現のためにコドン最適化されていてもよい。一部の実施形態において、操作されたタンパク質は、注目する1つまたは複数(例えば、1、2、3、4つ、またはそれを超える)のポリペプチドを含んでもよい。例えば、操作されたタンパク質の異種ポリペプチドは、注目するポリペプチドを含んでもよいし、これであってもよい。
本発明に有用な注目するポリペプチドとして、以下に限定されないが、デアミナーゼ活性、ニッカーゼ活性、リコンビナーゼ活性、トランスポザーゼ活性、メチラーゼ活性、グリコシラーゼ(DNAグリコシラーゼ)活性、グリコシラーゼインヒビター活性(例えばウラシル-DNAグリコシラーゼインヒビター(UGI))、デメチラーゼ活性、転写活性化活性、転写抑制活性、転写放出因子(transcription release factor)活性、ヒストン修飾活性、ヌクレアーゼ活性、一本鎖RNA切断活性、二本鎖RNA切断活性、制限酵素活性(例えばFok1)、核酸結合活性、メチルトランスフェラーゼ活性、DNA修復活性、DNA損傷活性、ジスムターゼ活性、アルキル化活性、脱プリン化活性、酸化活性、ピリミジンダイマー形成活性、インテグラーゼ活性、トランスポザーゼ活性、ポリメラーゼ活性、リガーゼ活性、ヘリカーゼ活性、核局在化配列もしくは活性、親和性ポリペプチド、ペプチドタグ、および/またはフォトリアーゼ活性を有するポリペプチドまたはタンパク質ドメインが挙げられ得る。一部の実施形態において、注目するポリペプチドは、Fok1ヌクレアーゼまたはウラシル-DNAグリコシラーゼインヒビターである。核酸(ポリヌクレオチド、発現カセット、および/またはベクター)内にコードされる場合、コードされるポリペプチドまたはタンパク質ドメインは、生物内での発現のためにコドン最適化されていてもよい。一部の実施形態において、注目するポリペプチドは、本発明の操作されたタンパク質、またはCRISPR-Cas融合タンパク質を提供するためにCRISPR-Casエフェクタータンパク質ドメインに連結されていてもよい。一部の実施形態において、ペプチドタグに連結されたCRISPR-Casエフェクタータンパク質ドメインを含むCRISPR-Cas融合タンパク質はまた、注目するポリペプチドに連結されていてもよい(例えば、CRISPR-Casエフェクタータンパク質ドメインは、例えば、ペプチドタグ(または親和性ポリペプチド)、および例えば注目するポリペプチドの双方に連結されていてもよい)。
一部の実施形態において、本発明の編集系は、CRISPR-Casエフェクタータンパク質を含む。本明細書中で用いられる「CRISPR-Casエフェクタータンパク質」は、核酸を切断するか、切るか、もしくはニックを入れ;核酸(例えば、標的核酸および/またはガイド核酸)に結合し;かつ/または本明細書中で規定されるガイド核酸を識別するか、認識するか、もしくはこれに結合するタンパク質またはポリペプチドである。一部の実施形態において、CRISPR-Casエフェクタータンパク質は、酵素(例えば、ヌクレアーゼ、エンドヌクレアーゼ、ニッカーゼその他)であってよく、かつ/または酵素として機能してよい。一部の実施形態において、CRISPR-Casエフェクタータンパク質は、CRISPR-Casヌクレアーゼを指す。一部の実施形態において、CRISPR-Casエフェクタータンパク質は、ヌクレアーゼ活性および/もしくはニッカーゼ活性を含み、ヌクレアーゼ活性および/もしくはニッカーゼ活性が引き下げられたか、もしくは除外されたヌクレアーゼドメインを含み、一本鎖DNA切断活性(ssDNase活性)を含み、または引き下げられたか、もしくは除外されたssDNase活性を有し、かつ/または自己プロセシングRNase活性を含み、または引き下げられたか、もしくは除外された自己プロセシングRNase活性を有する。CRISPR-Casエフェクタータンパク質は、標的核酸に結合してよい。CRISPR-Casエフェクタータンパク質は、I、II、III、IV、V、またはVI型CRISPR-Casエフェクタータンパク質であってよい。一部の実施形態において、CRISPR-Casエフェクタータンパク質は、I型CRISPR-Cas系、II型CRISPR-Cas系、III型CRISPR-Cas系、IV型CRISPR-Cas系、V型CRISPR-Cas系、またはVI型CRISPR-Cas系由来であってよい。一部の実施形態において、本発明のCRISPR-Casエフェクタータンパク質は、II型CRISPR-Cas系またはV型CRISPR-Cas系由来であってよい。一部の実施形態において、CRISPR-Casエフェクタータンパク質は、II型CRISPR-Casエフェクタータンパク質、例えばCas9エフェクタータンパク質であってよい。一部の実施形態において、CRISPR-Casエフェクタータンパク質は、V型CRISPR-Casエフェクタータンパク質、例えばCas12エフェクタータンパク質であってよい。一部の実施形態において、CRISPR-Casエフェクタータンパク質は、Cas12aであってよく、そして場合によっては、配列番号50~66のいずれか1つのアミノ酸配列および/または配列番号67~69のいずれか1つのヌクレオチド配列を有してもよい。一部の実施形態において、CRISPR-Casエフェクタータンパク質は、活性Cas12aであってよく、そして場合によっては、配列番号58のアミノ酸配列を有してもよい。一部の実施形態において、CRISPR-Casエフェクタータンパク質は、不活性(すなわち、死んだ(dead))Cas12aであってよく、そして場合によっては、配列番号50のアミノ酸配列を有してもよい。一部の実施形態において、CRISPR-Casエフェクタータンパク質は、Cas12bであってよく、そして場合によっては、配列番号151のアミノ酸配列を有してもよい。
例示的なCRISPR-Casエフェクタータンパク質として、以下に限定されないが、Cas9、C2c1、C2c3、Cas12a(Cpf1とも称される)、Cas12b、Cas12c、Cas12d、Cas12e、Cas13a、Cas13b、Cas13c、Cas13d、Casl、CaslB、Cas2、Cas3、Cas3’、Cas3”、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(CsnlおよびCsx12としても知られている)、Cas10、Csyl、Csy2、Csy3、Csel、Cse2、Cscl、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmrl、Cmr3、Cmr4、Cmr5、Cmr6、Csbl、Csb2、Csb3、Csxl7、Csxl4、Csx10、Csx16、CsaX、Csx3、Csxl、Csxl5、Csfl、Csf2、Csf3、Csf4(dinG)、および/またはCsf5ヌクレアーゼが挙げられ、場合によっては、CRISPR-Casエフェクタータンパク質は、Cas9、Cas12a(Cpf1)、Cas12b、Cas12c(C2c3)、Cas12d(CasY)、Cas12e(CasX)、Cas12g、Cas12h、Cas12i、C2c4、C2c5、C2c8、C2c9、C2c10、Cas14a、Cas14b,および/またはCas14cエフェクタータンパク質であってよい。
一部の実施形態において、本発明に有用なCRISPR-Casエフェクタータンパク質は、そのヌクレアーゼ活性部位および/またはヌクレアーゼドメイン(例えば、RuvC、HNH、例えばCas12aヌクレアーゼドメインのRuvC部位;例えば、Cas9ヌクレアーゼドメインのRuvC部位および/またはHNH部位)内に変異を含んでもよい。ヌクレアーゼ活性部位および/またはヌクレアーゼドメイン内に変異を有するので、もはやヌクレアーゼ活性を含まないCRISPR-Casエフェクタータンパク質は、一般的に、「不活性」または「死んだ」、例えばdCas9と称される。一部の実施形態において、ヌクレアーゼ活性部位および/またはヌクレアーゼドメイン内に変異を有するCRISPR-Casエフェクタータンパク質は、変異のない同じCRISPR-Casエフェクタータンパク質と比較して、活性が損なわれているか、または活性(例えばニッカーゼ活性)が引き下げられていてよい。
本発明に有用なCRISPR Cas9エフェクタータンパク質またはCas9は、知られているか、または後に同定されるあらゆるCas9ヌクレアーゼであってよい。一部の実施形態において、本発明のCas9は、例えば、連鎖球菌(Streptococcus)属種(例えば、化膿連鎖球菌(S.pyogenes)、S.サーモフィルス(S.thermophilus))、ラクトバチルス(Lactobacillus)属種、ビフィドバクテリウム(Bifidobacterium)属種、カンドレリア(Kandleria)属種、リューコノストック(Leuconostoc)属種、オエノコッカス(Oenococcus)属種、ペディオコッカス(Pediococcus)属種、ワイセラ(Weissella)属種、および/またはオルセネラ(Olsenella)属種由来のタンパク質であってよい。一部の実施形態において、CRISPR-Casエフェクタータンパク質は、Cas9であってよく、そして場合によっては、配列番号70~80もしくは140~143のいずれか1つのヌクレオチド配列、および/または配列番号81~82のいずれか1つのアミノ酸配列を有してもよい。
一部の実施形態において、CRISPR-Casエフェクタータンパク質は、化膿連鎖球菌に由来するCas9であってよく、かつ/またはPAM配列モチーフNGG、NAG、NGAを認識し得る(Mali et al,Science 2013;339(6121):823-826)。一部の実施形態において、CRISPR-Casエフェクタータンパク質は、ストレプトコッカス・サーモフィルス(Streptococcus thermophiles)に由来するCas9であってよく、かつ/またはPAM配列モチーフNGGNGおよび/もしくはNNAGAAW(W=AまたはT)を認識し得る(例えば、Horvath et al,Science,2010;327(5962):167-170、およびDeveau et al,J Bacteriol 2008;190(4):1390-1400参照)。一部の実施形態において、CRISPR-Casエフェクタータンパク質は、ストレプトコッカス・ミュータンス(Streptococcus mutans)に由来するCas9であってよく、かつ/またはPAM配列モチーフNGGおよび/またはNAAR(R=AまたはG)を認識し得る(例えば、Deveau et al,J BACTERIOL 2008;190(4):1390-1400参照)。一部の実施形態において、CRISPR-Casエフェクタータンパク質は、ストレプトコッカス・アウレウス(Streptococcus aureus)に由来するCas9であってよく、かつ/またはPAM配列モチーフNNGRR(R=AまたはG)を認識し得る。一部の実施形態において、CRISPR-Casエフェクタータンパク質は、黄色ブドウ球菌(S.aureus)に由来するCas9であってよく、かつ/またはPAM配列モチーフNGRRT(R=AまたはG)を認識し得る。一部の実施形態において、CRISPR-Casエフェクタータンパク質は、黄色ブドウ球菌に由来するCas9であってよく、かつ/またはPAM配列モチーフNGRRV(R=AまたはG)を認識し得る。一部の実施形態において、CRISPR-Casエフェクタータンパク質は、髄膜炎菌(Neisseria meningitidis)に由来するCas9であってよく、かつ/またはPAM配列モチーフNGATTまたはNGCTT(R=AまたはG、V=A、G、またはC)を認識し得る(例えば、Hou et ah,PNAS 2013,1-6参照)。この段落内の上述の実施形態において、PAM配列モチーフ内のNは、あらゆるヌクレオチド残基、例えば、A、G、C、またはTのいずれでもあり得る。一部の実施形態において、CRISPR-Casエフェクタータンパク質は、レプトトリキア・シャーイイ(Leptotrichia shahii)に由来するCas13aであってよく、かつ/または標的核酸内に位置決めされている場合がある、単一の3’A、U、もしくはCのプロトスペーサーフランキング配列(PFS)(またはRNA PAM(rPAM))配列モチーフを認識し得る。
本発明の実施形態に有用なV型CRISPR-Casエフェクタータンパク質は、あらゆるV型CRISPR-Casヌクレアーゼであり得る。例示的なV型CRISPR-Casエフェクタータンパク質として、以下に限定されないが、Cas12a(Cpf1)、Cas12b、Cas12c(C2c3)、Cas12d(CasY)、Cas12e(CasX)、Cas12g、Cas12h、Cas12i、C2c1、C2c4、C2c5、C2c8、C2c9、C2c10、Cas14a、Cas14b,および/またはCas14cヌクレアーゼが挙げられる。一部の実施形態において、V型CRISPR-Casエフェクタータンパク質は、Cas12aであってよい。一部の実施形態において、V型CRISPR-Casエフェクタータンパク質は、ニッカーゼ、場合によっては、Cas12aニッカーゼであってよい。一部の実施形態において、V型CRISPR-Casエフェクタータンパク質は、Cas12b(例えば配列番号151)であってよい。
一部の実施形態において、CRISPR-Casエフェクタータンパク質は、V型Clustered Regularly Interspaced Short Palindromic Repeat(CRISPR)-Casヌクレアーゼであってよい。Cas12aは、より周知のII型CRISPR Cas9ヌクレアーゼとはいくつかの点で異なる。例えば、Cas9は、ガイドRNA(gRNA、sgRNA、crRNA、crDNA、CRISPRアレイ)結合部位(プロトスペーサ、標的核酸、標的DNA)に対して3’側のGリッチプロトスペーサ隣接モチーフ(PAM)(3’-NGG)を認識する一方、Cas12aは、標的核酸に対して5’側に位置決めされているTリッチPAM(5’-TTN、5’-TTTN)を認識する。実際、Cas9およびCas12aが、それらのガイドRNAに結合する向きは、それらのN末端およびC末端に関して、大半逆である。さらに、Cas12a酵素は、天然のCas9系において見出されるデュアルガイドRNA(sgRNA(例えば、crRNAおよびtracrRNA))ではなく単一のガイドRNA(gRNA、CRISPRアレイ、crRNA)を用い、そしてCas12aは、それ自体のgRNAをプロセシングする。加えて、Cas12aヌクレアーゼ活性は、Cas9ヌクレアーゼ活性によって生成される平滑末端の代わりに、スタガーDNA二本鎖切断を生成し、そしてCas12aは、単一のRuvCドメインに依存して、DNA鎖の双方を切断するが、Cas9は、HNHドメインおよびRuvCドメインを切断に利用する。
本発明に有用なCRISPR Cas12aエフェクタータンパク質は、知られているか、または後に同定されるあらゆるCas12a(以前にCpf1として知られている)(例えば、米国特許第9,790,490号(Cpf1(Cas12a)配列の開示が参照によって組み込まれる)参照)であってよい。用語「Cas12a」は、ヌクレアーゼ活性を有し得るRNAガイドタンパク質を指し、当該タンパク質は、ガイド核酸結合ドメイン、および活性であるか、不活性であるか、または部分的に活性であるDNA切断ドメインを含み、よって、Cas12aのRNAガイドヌクレアーゼ活性は、それぞれ、活性であり得るか、不活性であり得るか、または部分的に活性であり得る。一部の実施形態において、本発明に有用なCas12aは、ヌクレアーゼ活性部位(例えば、Cas12aドメインのRuvC部位)内に変異を含んでもよい。そのヌクレアーゼドメインおよび/またはヌクレアーゼ活性部位内に変異を有するので、もはやヌクレアーゼ活性を含まないCas12aは、一般に、deadCas12a(例えばdCas12a)と称される。一部の実施形態において、ヌクレアーゼドメインおよび/またはヌクレアーゼ活性部位内に変異を有するCas12aは、活性が損なわれていてよく、例えば、ニッカーゼ活性が引き下げられていてよい。
一部の実施形態において、CRISPR-Casエフェクタータンパク質は、生物内での、例えば、動物(例えば、ヒト等の哺乳動物)、植物、真菌、古細菌、または細菌内での発現のために最適化されていてもよい。一部の実施形態において、CRISPR-Casエフェクタータンパク質(例えば、Cas12aポリペプチド/ドメインまたはCas9ポリペプチド/ドメイン)は、植物内での発現のために最適化されていてもよい。
塩基編集に有用なあらゆるデアミナーゼドメイン/ポリペプチドが、本発明に用いられてよい。本明細書中で用いられる「シトシンデアミナーゼ」および「シチジンデアミナーゼ」は、ポリペプチドまたはそのドメインが、シトシン塩基からアミン基の除去を触媒するか、または触媒することができる点で、シトシン脱アミノを触媒するか、または触媒することができるポリペプチドまたはドメインを指す。ゆえに、シトシンデアミナーゼは、シトシンの、(ウラシル中間体を介した)チミジンへの変換をもたらして、CからTの変換を引き起こし、またはゲノム内の相補鎖内で、GからAへの変換を引き起こし得る。ゆえに、一部の実施形態において、本発明のポリヌクレオチドによってコードされるシトシンデアミナーゼは、標的核酸のセンス(例えば、「+」、鋳型)鎖内のC→T変換、または標的核酸のアンチセンス(例えば、「-」、相補)鎖内のG→A変換を生成する。一部の実施形態において、本発明のポリヌクレオチドによってコードされるシトシンデアミナーゼは、ゲノム内の相補鎖内でのCからT、G、またはAへの変換を生成する。
本発明に有用なシトシンデアミナーゼは、あらゆる生物由来の、知られているか、または後に同定されるあらゆるシトシンデアミナーゼであってよい(例えば、米国特許第10,167,457号およびThuronyi et al.Nat.Biotechnol.37:1070-1079(2019)(これらは各々、シトシンデアミナーゼの開示が参照によって本明細書中に組み込まれる))。シトシンデアミナーゼは、シチジンまたはデオキシシチジンの、それぞれウリジンまたはデオキシウリジンへの加水分解脱アミノを触媒することができる。ゆえに、一部の実施形態において、本発明に有用なデアミナーゼまたはデアミナーゼドメインは、シトシンの、ウラシルへの加水分解脱アミノを触媒するシチジンデアミナーゼドメインであってよい。一部の実施形態において、シトシンデアミナーゼは、以下に限定されないが、霊長類(例えば、ヒト、サル、チンパンジー、ゴリラ)、イヌ、ウシ、ラット、またはマウスが挙げられる、天然に存在するシトシンデアミナーゼのバリアントであってよい。ゆえに、一部の実施形態において、本発明に有用なシトシンデアミナーゼは、野生型シトシンデアミナーゼに対して約70%~約100%同一(例えば、天然に存在するシトシンデアミナーゼに対して約70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%同一、そしてそれらの中のあらゆる範囲または値)であってよい。
一部の実施形態において、本発明に有用なシトシンデアミナーゼは、アポリポタンパク質B mRNA編集複合体(APOBEC)ファミリーデアミナーゼであってよい。一部の実施形態において、シトシンデアミナーゼは、APOBEC1デアミナーゼ、APOBEC2デアミナーゼ、APOBEC3Aデアミナーゼ、APOBEC3Bデアミナーゼ、APOBEC3Cデアミナーゼ、APOBEC3Dデアミナーゼ、APOBEC3Fデアミナーゼ、APOBEC3Gデアミナーゼ、APOBEC3Hデアミナーゼ、APOBEC4デアミナーゼ、ヒト活性化誘導デアミナーゼ(hAID)、rAPOBEC1、FERNY、および/またはCDA1、場合によってはpmCDA1、atCDA1(例えばAt2g19570)、および同上の進化バージョンであってよい。進化デアミナーゼは、例えば、米国特許第10,113,163号、Gaudelli et al.Nature 551(7681):464-471(2017)、およびThuronyi et al.(Nature Biotechnology 37:1070-1079(2019)(これらは各々、デアミナーゼおよび進化デアミナーゼの開示が参照によって本明細書に組み込まれる)において開示されている。一部の実施形態において、シトシンデアミナーゼは、配列番号83のアミノ酸配列を有するAPOBEC1デアミナーゼであってよい。一部の実施形態において、シトシンデアミナーゼは、配列番号84のアミノ酸配列を有するAPOBEC3Aデアミナーゼであってよい。一部の実施形態において、シトシンデアミナーゼは、CDA1デアミナーゼ、場合によっては配列番号85のアミノ酸配列を有するCDA1であってよい。一部の実施形態において、シトシンデアミナーゼは、FERNYデアミナーゼ、場合によっては配列番号86のアミノ酸配列を有するFERNYであってよい。一部の実施形態において、シトシンデアミナーゼは、rAPOBEC1デアミナーゼ、場合によっては配列番号87のアミノ酸配列を有するrAPOBEC1デアミナーゼであってよい。一部の実施形態において、シトシンデアミナーゼは、hAIDデアミナーゼ、場合によっては配列番号88または配列番号89のアミノ酸配列を有するhAIDであってよい。一部の実施形態において、本発明に有用なシトシンデアミナーゼは、天然に存在するシトシンデアミナーゼ(例えば「進化デアミナーゼ」)のアミノ酸配列に対して約70%~約100%同一(例えば、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%または100%同一)であってよい(例えば、配列番号90、配列番号91、配列番号92参照)。一部の実施形態において、本発明に有用なシトシンデアミナーゼは、配列番号83~92のいずれか1つのアミノ酸配列に対して約70%~約99.5%同一(例えば、約70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または99.5%同一)(例えば、配列番号83~92のいずれか1つのアミノ酸配列に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも92%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一)であってよい。一部の実施形態において、シトシンデアミナーゼをコードするポリヌクレオチドは、植物内での発現のためにコドン最適化されていてもよく、そしてコドン最適化ポリペプチドは、参照ポリヌクレオチドに対して約70%~99.5%同一であってよい。
本明細書中で用いられる「アデニンデアミナーゼ」および「アデノシンデアミナーゼ」は、アデニンまたはアデノシンの加水分解脱アミノ(例えば、アデニンからのアミン基の除去)を触媒するか、または触媒することができるポリペプチドまたはそのドメインを指す。一部の実施形態において、アデニンデアミナーゼは、アデノシンまたはデオキシアデノシンの、それぞれイノシンまたはデオキシイノシンへの加水分解脱アミノを触媒し得る。一部の実施形態において、アデノシンデアミナーゼは、DNA内のアデニンまたはアデノシンの加水分解脱アミノを触媒し得る。一部の実施形態において、本発明の核酸構築体によってコードされるアデニンデアミナーゼは、標的核酸のセンス(例えば、「+」、鋳型)鎖内のA→G変換、または標的核酸のアンチセンス(例えば、「-」、相補)鎖内のT→C変換を生成し得る。本発明に有用なアデニンデアミナーゼは、あらゆる生物由来の、知られているか、または後に同定されるあらゆるアデニンデアミナーゼであってよい(例えば、米国特許第10,113,163号参照(これは、アデニンデアミナーゼの開示が参照によって本明細書に組み込まれる))。
一部の実施形態において、アデノシンデアミナーゼは、天然に存在するアデニンデアミナーゼのバリアントであってよい。ゆえに、一部の実施形態において、アデノシンデアミナーゼは、野生型アデニンデアミナーゼに対して約70%~100%同一(例えば、天然に存在するアデニンデアミナーゼに対して約70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%同一、そしてそれらの中のあらゆる範囲または値)であってよい。一部の実施形態において、デアミナーゼまたはデアミナーゼは、自然界に存在せず、操作されたか、変異したか、または進化したアデノシンデアミナーゼと称され得る。ゆえに、例えば、操作されたか、変異したか、または進化したアデニンデアミナーゼポリペプチドまたはアデニンデアミナーゼドメインは、天然に存在するアデニンデアミナーゼポリペプチド/ドメインに対して約70%~99.9%同一(例えば、天然に存在するアデニンデアミナーゼポリペプチドまたはアデニンデアミナーゼドメインに対して約70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%または99.9%同一、そしてそれらの中のあらゆる範囲または値)であってよい。一部の実施形態において、アデノシンデアミナーゼは、細菌(例えば、大腸菌、黄色ブドウ球菌、インフルエンザ菌(Haemophilus influenzae)、カウロバクター・クレセンタス(Caulobacter crescentus)等)由来であってもよい。一部の実施形態において、アデニンデアミナーゼポリペプチド/ドメインをコードするポリヌクレオチドは、植物内での発現のためにコドン最適化されていてもよい。
一部の実施形態において、アデニンデアミナーゼドメインは、野生型tRNA特異的アデノシンデアミナーゼドメイン、例えばtRNA特異的アデノシンデアミナーゼ(TadA)、および/または変異/進化アデノシンデアミナーゼドメイン、例えば変異/進化tRNA特異的アデノシンデアミナーゼドメイン(TadA)であってもよい。一部の実施形態において、TadAドメインは、大腸菌由来であってもよい。一部の実施形態において、TadAは、全長TadAに対して修飾された、例えば、トランケートされた、欠けた1つまたは複数のN末端および/またはC末端アミノ酸であってよい(例えば、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のN末端および/またはC末端アミノ酸残基が、全長TadAと比較して、欠けていてもよい)。一部の実施形態において、TadAポリペプチドまたはTadAドメインは、N末端メチオニンを含まない。一部の実施形態において、野生型大腸菌TadAは、配列番号93のアミノ酸配列を含む。一部の実施形態において、変異/進化大腸菌TadAは、配列番号94~97のいずれか1つのアミノ酸配列を含む。一部の実施形態において、TadA/TadAをコードするポリヌクレオチドは、植物内での発現のためにコドン最適化されていてもよい。一部の実施形態において、アデニンデアミナーゼは、配列番号98~103のいずれか1つのアミノ酸配列の全てまたは部分を含んでもよい。一部の実施形態において、アデニンデアミナーゼは、配列番号93~103のいずれか1つのアミノ酸配列の全てまたは部分を含んでもよい。
一部の実施形態において、本発明の核酸構築体はさらに、グリコシラーゼインヒビター(例えば、ウラシル-DNAグリコシラーゼインヒビター等のウラシルグリコシラーゼインヒビター(UGI))をコードしていてもよい。一部の実施形態において、本発明は、操作されたタンパク質およびUGIを含む融合タンパク質、ならびに/または同上をコードする1つもしくは複数のポリヌクレオチドを提供し、場合によっては、1つまたは複数のポリヌクレオチドは、植物内での発現のためにコドン最適化されていてもよい。
本発明に有用な「ウラシルグリコシラーゼインヒビター」は、ウラシル-DNAグリコシラーゼ塩基-切除修復酵素を阻害することができるあらゆるタンパク質またはポリペプチドであってもよい。一部の実施形態において、UGIドメインは、野生型UGIまたはその断片を含む。一部の実施形態において、本発明に有用なUGIドメインは、天然に存在するUGIドメインのアミノ酸配列に対して約70%~約100%同一(例えば、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、または100%同一、そしてそれらの中のあらゆる範囲または値)であってよい。一部の実施形態において、UGIドメインは、配列番号104のアミノ酸配列、または配列番号104のアミノ酸配列に対して約70%~約99.5%の同一性を有する(例えば、配列番号104のアミノ酸配列に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも92%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一である)ポリペプチドを含んでもよい。例えば、一部の実施形態において、UGIドメインは、配列番号104のアミノ酸配列の連続ヌクレオチドの部分と100%同一の、配列番号104のアミノ酸配列の断片(例えば、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80個の連続ヌクレオチド;例えば、約10、15、20、25、30、35、40、45~約50、55、60、65、70、75、80個の連続ヌクレオチド)を含んでもよい。一部の実施形態において、UGIドメインは、知られているUGIに対して約70%~約99.5%の同一性を有する(例えば、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%同一、そしてそれらの中のあらゆる範囲または値)、知られているUGIのバリアント(例えば配列番号104)であってもよい。一部の実施形態において、UGIをコードするポリヌクレオチドは、植物(例えば植物)内での発現のためにコドン最適化されていてよく、そしてコドン最適化されたポリペプチドは、参照ポリヌクレオチドに対して、約70%~約99.5%同一であってよい。
操作されたタンパク質は、標的核酸を修飾するように操作されたタンパク質と機能するように設計されているガイド核酸(例えば、ガイドRNA(gRNA)、CRISPRアレイ、CRISPR RNA、crRNA)と組み合わせて用いられてもよい。本発明に有用なガイド核酸は、少なくとも1つのスペーサー配列および少なくとも1つの反復配列を含んでもよい。ガイド核酸は、操作されたタンパク質と(例えば、操作されたタンパク質のヌクレアーゼドメインと)複合体を形成することができ、そしてスペーサー配列は、標的核酸にハイブリダイズすることができ、これによって、複合体を標的核酸にガイドし、標的核酸は、デアミナーゼ(例えば、場合によっては複合体中に存在し、かつ/またはこれに動員される、シトシンデアミナーゼおよび/またはアデニンデアミナーゼ)によって修飾(例えば、切断または編集)かつ/または調節され得る(例えば、転写を調節する)。
一部の実施形態において、Cas9ドメインを含む操作されたタンパク質(または同上をコードする核酸構築体)は、Cas9ガイド核酸と組み合わせて、標的核酸を修飾するのに用いられてもよく、そしてデアミナーゼ(例えば、シトシンおよび/またはアデニン)は、操作されたタンパク質に連結されていてもよいし、これと複合体を形成してもよい。シトシンデアミナーゼは、標的核酸内のシトシン塩基を脱アミノ化することによって、標的核酸を編集する。アデニンデアミナーゼは、標的核酸内のアデノシン塩基を脱アミノ化することによって、標的核酸を編集する。
同様に、操作されたタンパク質は、Cas12aドメイン(または他の選択されたCRISPR-Casヌクレアーゼ、例えば、C2c1、C2c3、Cas12b、Cas12c、Cas12d、Cas12e、Cas13a、Cas13b、Cas13c、Cas13d、Casl、CaslB、Cas2、Cas3、Cas3’、Cas3”、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(CsnlおよびCsx12としても知られている)、Cas10、Csyl、Csy2、Csy3、Csel、Cse2、Cscl、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmrl、Cmr3、Cmr4、Cmr5、Cmr6、Csbl、Csb2、Csb3、Csxl7、Csxl4、Csx10、Csx16、CsaX、Csx3、Csxl、Csxl5、Csfl、Csf2、Csf3、Csf4(dinG)、および/またはCsf5)を含んでもよく、これは、シトシンデアミナーゼドメインおよび/またはアデニンデアミナーゼドメインとの複合体を形成してもよいし、これに連結されていてもよく、そしてCas12aガイド核酸(または他の選択されたCRISPR-Casヌクレアーゼのためのガイド核酸)と組み合わせて、標的核酸を修飾するのに用いられてもよく、融合タンパク質のシトシンデアミナーゼドメインまたはアデニンデアミナーゼドメインはそれぞれ、標的核酸内のシトシン塩基またはアデノシン塩基を脱アミノ化することによって、標的核酸を編集する。
本明細書中で用いられる「ガイド核酸」、「ガイドRNA」、「gRNA」、「CRISPR RNA/DNA」、「crRNA」、または「crDNA」は、少なくとも1つのスペーサー配列を含む核酸を意味し、これは、標的DNA(例えばプロトスペーサー)、および少なくとも1つの反復配列(例えば、V型Cas12a CRISPR-Cas系の反復、またはその断片もしくは部分;II型Cas9 CRISPR-Cas系の反復またはその断片;V型C2c1 CRISPR Cas系の反復またはその断片;例えば、C2c3、Cas12a(Cpf1とも称される)、Cas12b、Cas12c、Cas12d、Cas12e、Cas13a、Cas13b、Cas13c、Cas13d、Casl、CaslB、Cas2、Cas3、Cas3’、Cas3”、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(CsnlおよびCsx12としても知られている)、Cas10、Csyl、Csy2、Csy3、Csel、Cse2、Cscl、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmrl、Cmr3、Cmr4、Cmr5、Cmr6、Csbl、Csb2、Csb3、Csxl7、Csxl4、Csx10、Csx16、CsaX、Csx3、Csxl、Csxl5、Csfl、Csf2、Csf3、Csf4(dinG)、および/もしくはCsf5、またはそれらの断片のCRISPR-Cas系の反復)と相補的であり(かつこれにハイブリダイズし)、反復配列は、スペーサー配列の5’末端および/または3’末端に連結されていてもよい。一部の実施形態において、ガイド核酸はDNAを含む。一部の実施形態において、ガイド核酸はRNAを含む(例えば、ガイドRNAである)。本発明のgRNAの設計は、I型、II型、III型、IV型、V型、またはVI型CRISPR-Cas系に基づいてもよい。
一部の実施形態において、Cas12a gRNAは、5’側から3’側に、反復配列(全長またはその部分(「ハンドル」);例えばシュードノット様構造)およびスペーサー配列を含んでもよい。
一部の実施形態において、ガイド核酸は、複数の反復配列-スペーサー配列(例えば、2、3、4、5、6、7、8、9、10個、またはそれを超える反復-スペーサー配列)(例えば反復-スペーサー-反復、例えば、反復-スペーサー-反復-スペーサー-反復-スペーサー-反復-スペーサー-反復-スペーサー等)を含んでもよい。本発明のガイド核酸は、合成的であり、人工的であり、かつ自然界に見出されない。gRNAは、非常に長い場合があり、アプタマー(MS2動員戦略におけるような)、またはスペーサーからぶら下がる他のRNA構造として用いられてもよい。
本明細書中で用いられる「反復配列」は、例えば、野生型CRISPR Cas遺伝子座(例えば、Cas9遺伝子座、Cas12a遺伝子座、C2c1遺伝子座その他)のあらゆる反復配列、または本発明の核酸構築体によってコードされるCRISPR-Casエフェクタータンパク質により機能的な合成crRNAの反復配列を指す。本発明に有用な反復配列は、CRISPR-Cas遺伝子座(例えば、I型、II型、III型、IV型、V型、またはVI型)の知られているか、または後に同定されるあらゆる反復配列であってもよいし、I、II、III、IV、V、またはVI型CRISPR-Cas系において機能するように設計された合成反復であってもよい。反復配列は、ヘアピン構造および/またはステムループ構造を含んでもよい。一部の実施形態において、反復配列は、その5’末端にてシュードノット様構造(すなわち、「ハンドル」)を形成してもよい。ゆえに、一部の実施形態において、反復配列は、野生型I型CRISPR-Cas遺伝子座、II型CRISPR-Cas遺伝子座、III型CRISPR-Cas遺伝子座、IV型CRISPR-Cas遺伝子座、V型CRISPR-Cas遺伝子座、および/またはVI型CRISPR-Cas遺伝子座由来の反復配列と同一であり得るか、または実質的に同一であり得る。野生型CRISPR-Cas遺伝子座由来の反復配列は、例えばCRISPRdbにより提供されるCRISPRfinderを用いる(Grissa et al.Nucleic Acids Res.35(Web Server issue):W52-7参照)、確立されたアルゴリズムにより決定されてもよい。一部の実施形態において、反復配列またはその部分は、その3’末端にてスペーサー配列の5’末端に連結されることによって、反復-スペーサー配列(例えば、ガイド核酸、ガイドRNA/DNA、crRNA、crDNA)を形成する。
一部の実施形態において、反復配列は、特定の反復に、そして反復を含むガイド核酸がプロセシングされるか、またはプロセシングされないかに応じて、少なくとも10個のヌクレオチド(例えば、約10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50~100個、もしくはそれを超えるヌクレオチド、またはそれらの中のあらゆる範囲もしくは値;例えば約)を含むか、それから本質的になるか、またはそれからなる。一部の実施形態において、反復配列は、約10~約20、約10~約30、約10~約45、約10~約50、約15~約30、約15~約40、約15~約45、約15~約50、約20~約30、約20~約40、約20~約50、約30~約40、約40~約80、約50~約100個、またはそれを超えるヌクレオチドを含むか、それから本質的になるか、またはそれからなる。
スペーサー配列の5’末端に連結された反復配列は、反復配列の部分(例えば、野生型反復配列の5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、またはそれを超える連続ヌクレオチド)を含み得る。一部の実施形態において、スペーサー配列の5’末端に連結される反復配列の部分は、約5~約10連続ヌクレオチド(例えば、約5、6、7、8、9、10ヌクレオチド)長であり得、そして野生型CRISPR Cas反復ヌクレオチド配列の同じ領域(例えば5’末端)に対して少なくとも90%(例えば、少なくとも約90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、またはそれを超える)の配列同一性を有する。一部の実施形態において、反復配列の部分は、その5’末端にてシュードノット様構造(例えば「ハンドル」)を含んでもよい。
本明細書中で用いられる「スペーサー配列」は、標的核酸(例えば標的DNA)と相補的なヌクレオチド配列(例えばプロトスペーサー)である。スペーサー配列は、標的核酸と完全に相補的であり得るか、または実質的に相補的であり得る(例えば、少なくとも約70%(例えば、約70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、またはそれを超える)相補的である)。ゆえに、一部の実施形態において、スペーサー配列は、標的核酸と比較して、1、2、3、4、または5つのミスマッチを有し得、当該ミスマッチは、連続していてもよいし、非連続であってもよい。一部の実施形態において、スペーサー配列は、標的核酸に対して70%の相補性を有し得る。他の実施形態において、スペーサーヌクレオチド配列は、標的核酸に対して80%の相補性を有し得る。さらに他の実施形態において、スペーサーヌクレオチド配列は、標的核酸(プロトスペーサー)に対して85%、90%、95%、96%、97%、98%、99%、または99.5%等の相補性を有し得る。一部の実施形態において、スペーサー配列は、標的核酸と100%相補的である。スペーサー配列は、長さが約15ヌクレオチド~約30ヌクレオチド(例えば、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、もしくは30ヌクレオチド、またはそれらの中のあらゆる範囲もしくは値)であってよい。ゆえに、一部の実施形態において、スペーサー配列は、少なくとも約15ヌクレオチド~約30ヌクレオチド長である標的核酸(例えばプロトスペーサ)の領域にわたって完全な相補性または実質的な相補性を有し得る。一部の実施形態において、スペーサーは、約20ヌクレオチド長である。一部の実施形態において、スペーサーは、約21、22、または23ヌクレオチド長である。
一部の実施形態において、ガイド核酸のスペーサー配列の5’領域は、標的核酸と完全に相補的であり得る一方、スペーサーの3’領域は、標的核酸と(例えば、V型CRISPR-Cas系内のスペーサーについて)実質的に相補的であり得、またはガイド核酸のスペーサー配列の3’領域は、標的核酸と完全に相補的であり得る一方、スペーサーの5’領域は、標的核酸と(例えば、II型CRISPR-Cas系内のスペーサーについて)実質的に相補的であり得るので、標的核酸に対するスペーサー配列の全体的な相補性は、100%未満であってもよい。ゆえに、例えば、V型CRISPR-Cas系用のガイド核酸において、例えば20ヌクレオチドスペーサー配列の、5’領域内の最初の1、2、3、4、5、6、7、8、9、10ヌクレオチド(すなわちシード領域)は、標的核酸と100%相補的であり得る一方、スペーサー配列の3’領域内の残りのヌクレオチドは、標的核酸と実質的に相補的である(例えば、少なくとも約70%相補的である)。一部の実施形態において、スペーサー配列の5’末端の最初の1~8ヌクレオチド(例えば、最初の1、2、3、4、5、6、7、8ヌクレオチド、およびそれらの中のあらゆる範囲)は、標的核酸と100%相補的であり得る一方、スペーサー配列の3’領域内の残りのヌクレオチドは、標的核酸と実質的に相補的である(例えば、少なくとも約50%(例えば、50%、55%、60%、65%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、またはそれを超える)相補的である)。
更なる例として、II型CRISPR-Cas系用のガイド核酸において、例えば20ヌクレオチドスペーサー配列の、3’領域内の最初の1、2、3、4、5、6、7、8、9、10ヌクレオチド(すなわちシード領域)は、標的核酸と100%相補的であり得る一方、スペーサー配列の5’領域内の残りのヌクレオチドは、標的核酸と実質的に相補的である(例えば、少なくとも約70%相補的である)。一部の実施形態において、スペーサー配列の3’末端の最初の1~10ヌクレオチド(例えば、最初の1、2、3、4、5、6、7、8、9、10ヌクレオチド、およびそれらの中のあらゆる範囲)は、標的核酸と100%相補的であり得る一方、スペーサー配列の5’領域内の残りのヌクレオチドは、標的核酸と実質的に相補的である(例えば、少なくとも約50%(例えば、少なくとも約50%、55%、60%、65%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、もしくはそれを超えるか、またはそれらの中のあらゆる範囲もしくは値)相補的である)。動員ガイドRNAはさらに、本明細書中に記載される1つまたは複数の動員モチーフを含み、これは、ガイドの5’末端または3’末端に連結されていてもよいし、動員ガイド核酸中に(例えば、ヘアピンループ内に)挿入されていてもよい。
一部の実施形態において、スペーサーのシード領域は、約8~約10ヌクレオチド長、約5~約6ヌクレオチド長、または約6ヌクレオチド長であってもよい。
「標的核酸」、「標的DNA」、「標的ヌクレオチド配列」、「標的領域」、または「ゲノム内の標的領域」は、本明細書中で互換的に用いられており、本明細書中で規定されるガイド核酸内のスペーサー配列と完全に相補的な(100%相補的な)、または実質的に相補的な(例えば、少なくとも70%(例えば、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、またはそれを超える)相補的な)配列を含む生物の(例えば植物の)ゲノムの領域を指す。標的核酸は、本明細書中に記載される編集系(またはその構成要素)によって標的とされる。CRISPR-Cas系に有用な標的領域は、生物のゲノム(例えば、植物ゲノムまたは哺乳動物(例えばヒト)ゲノム)内のPAM配列に対して直ぐ3’側に(例えばV型CRISPR-Cas系)、または直ぐ5’側に(例えばII型CRISPR-Cas系)位置決めされ得る。標的領域は、PAM配列に直ぐ隣接して位置決めされている少なくとも15個の連続ヌクレオチド(例えば、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30ヌクレオチド等)のあらゆる領域から選択され得る。
本明細書中で用いられる「プロトスペーサー配列」または「プロトスペーサー」は、ガイド核酸のスペーサー配列と完全に、または、実質的には相補的である(かつこれにハイブリダイズすることができる)配列を指す。一部の実施形態において、プロトスペーサーは、CRISPR反復-スペーサー配列のスペーサー配列と完全に、または実質的に相補的である(かつこれにハイブリダイズする)、本明細書中で定義される標的核酸(例えば、ガイド核酸、CRISPRアレイ、crRNA)の全てまたは部分である。
V型CRISPR-Cas(例えばCas12a)系およびII型CRISPR-Cas(Cas9)系の場合、プロトスペーサー配列は、プロトスペーサー隣接モチーフ(PAM)が隣に(例えば直接隣接して)位置する。IV型CRISPR-Cas系について、PAMは、非標的鎖上の5’末端に、そして標的鎖の3’末端に位置決めされている(一例として、下記参照)。
II型CRISPR-Cas(例えばCas9)系の場合、PAMは、標的領域の直ぐ3’側に位置決めされている。I型CRISPR-Cas系用のPAMは、標的鎖の5’側に位置決めされている。III型CRISPR-Cas系用のPAMは知られていない。Makarova et al.は、CRISPR系の全てのクラス、型、およびサブタイプについての命名法を記載している(Nature Reviews Microbiology13:722-736(2015))。ガイド構造およびPAMが、R.Barrangou(Genome Biol.16:247(2015))によって記載されている。
カノニカルCas12a PAMは、Tリッチである。一部の実施形態において、カノニカルCas12a PAM配列は、5’-TTN、5’-TTTN、または5’-TTTVであり得る。一部の実施形態において、カノニカルCas9(例えば化膿連鎖球菌)PAMは、5’-NGG-3’であり得る。一部の実施形態において、非カノニカルPAMが用いられてもよいが、あまり有効でない可能性がある。
更なるPAM配列が、確立されている実験的アプローチおよび計算論的アプローチにより、当業者によって決定されてもよい。ゆえに、例えば、実験的アプローチは、考えられる全てのヌクレオチド配列が隣に位置する配列を標的とすることと、例えば標的プラスミドDNAの形質転換により、標的化を受けない配列メンバーを識別することとを含む(Esvelt et al.2013.Nat Methods10:1116-1121、Jiang et al.2013.Nat.Biotechnol.31:233-239)。一部の態様において、計算論的アプローチは、天然のスペーサーのBLAST検索を実行して、バクテリオファージまたはプラスミド内の元の標的DNA配列を同定することと、これらの配列をアラインして、標的配列に隣接する保存された配列を決定することとを含み得る(Briner and Barrangou.2014.Appl.Environ.Microbiol.80:994-1001、Mojica et al.2009.Microbiology155:733-740)。
一部の実施形態において、本発明は、本発明の核酸構築体(例えば、本発明の編集系の1つまたは複数の構成要素)を含む発現カセットおよび/またはベクターを提供する。一部の実施形態において、本発明の核酸構築体および/または1つもしくは複数のガイド核酸を含む発現カセットおよび/またはベクターが提供されてもよい。一部の実施形態において、本発明の核酸構築体は、操作されたタンパク質および/またはデアミナーゼをコードしており、そして各々が、同上に、または1つもしくは複数のガイド核酸を含むものとは別個の発現カセットまたはベクター上に含まれてもよい。操作されたタンパク質をコードする核酸構築体、または編集系の構成要素が、ガイド核酸を含むものとは別個の発現カセットまたはベクター上に含まれる場合、標的核酸は、例えば、ガイド核酸を含む発現カセットが提供される(例えば、標的核酸と接触する)よりも前に、これと同時に、またはこれの後に、操作されたタンパク質、または編集系の構成要素を、互いにあらゆる順序でコードする発現カセットまたはベクター、およびガイド核酸と接触して(例えばこれらが提供されて)もよい。
編集系の1つまたは複数の構成要素を互いに、かつ/または標的核酸に動員する方法が、当該技術において知られており、ペプチドタグまたはペプチドタグと相互作用する親和性ポリペプチドの使用を含んでもよい。一部の実施形態において、ガイド核酸は、RNA動員モチーフに連結されていてもよく、そしてデアミナーゼは、RNA動員モチーフと相互作用することができる親和性ポリペプチドに連結されていてもよく、これによってデアミナーゼを標的核酸に動員する。これ以外にも、化学相互作用が、ポリペプチド(例えばデアミナーゼ)を標的核酸に動員するのに用いられてもよい。
本発明に有用なペプチドタグ(例えばエピトープ)として、以下に限定されないが、GCN4ペプチドタグ(例えばSun-タグ)、c-Myc親和性タグ、HA親和性タグ、His親和性タグ、S親和性タグ、メチオニンHis親和性タグ、RGD-His親和性タグ、FLAGオクタペプチド、strepタグもしくはstrepタグII、V5タグ、および/またはVSV-Gエピトープが挙げられ得る。ポリペプチドに連結されていてもよいあらゆるエピトープであって、別のポリペプチドに連結されていてもよい対応する親和性ポリペプチドが存在するあらゆるエピトープが、ペプチドタグとして本発明に用いられてもよい。一部の実施形態において、ペプチドタグは、1、2、またはそれを超えるコピーのペプチドタグ(例えば、反復単位、多量体化エピトープ(例えばタンデム反復))(例えば、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25個、またはそれを超える反復ユニット)を含んでもよい。一部の実施形態において、ペプチドタグと相互作用する/に結合する親和性ポリペプチドが、抗体であってもよい。一部の実施形態において、抗体はscFv抗体であってもよい。一部の実施形態において、ペプチドタグに結合する親和性ポリペプチドは、合成的(例えば、親和性相互作用について進化した)であってもよく、以下に限定されないが、アフィボディ、アンチカリン、モノボディ、および/またはDARPinが挙げられる(例えば、Sha et al.,Protein Sci.26(5):910-924(2017);Gilbreth(Curr Opin Struc Biol 22(4):413-420(2013)、米国特許第9,982,053号(これらは各々、アフィボディ、アンチカリン、モノボディ、および/またはDARPinsに関連する教示について、それらの全体が参照によって組み込まれる)参照)。
一部の実施形態において、ガイド核酸は、RNA動員モチーフに連結されていてもよく、そして動員されることとなるポリペプチド(例えばデアミナーゼ)は、RNA動員モチーフに結合する親和性ポリペプチドに融合していてもよく、ここでは、ガイドは標的核酸に結合し、そしてRNA動員モチーフは親和性ポリペプチドに結合し、これによって、ポリペプチドをガイドに動員して、標的核酸をポリペプチド(例えばデアミナーゼ)と接触させる。一部の実施形態において、2つ以上のポリペプチドが、ガイド核酸に動員されることによって、標的核酸を、2つ以上のポリペプチド(例えばデアミナーゼ)と接触させてもよい。
本発明の一部の実施形態において、ガイドRNAは、1つまたは2つ以上のRNA動員モチーフ(例えば、1、2、3、4、5、6、7、8、9、10モチーフ、またはそれを超える、例えば、少なくとも10~約25モチーフ)に連結されていてもよく、場合によっては、2つ以上のRNA動員モチーフは、同じRNA動員モチーフであっても、異なるRNA動員モチーフであってもよい。一部の実施形態において、RNA動員モチーフおよび対応する親和性ポリペプチドとして、以下に限定されないが、テロメラーゼKu結合モチーフ(例えばKu結合ヘアピン)および対応する親和性ポリペプチドKu(例えばKuヘテロダイマー)、テロメラーゼSm7結合モチーフおよび対応する親和性ポリペプチドSm7、MS2ファージオペレーターステム-ループおよび対応する親和性ポリペプチドMS2コートタンパク質(MCP)、PP7ファージオペレーターステム-ループおよび対応する親和性ポリペプチドPP7コートタンパク質(PCP)、SfMuファージComステム-ループおよび対応する親和性ポリペプチドCom RNA結合タンパク質、PUF結合部位(PBS)および親和性ポリペプチドプミリオ/fem-3mRNA結合因子(PUF)、ならびに/または合成RNAアプタマーおよび対応する親和性ポリペプチドとしてのアプタマーリガンドが挙げられ得る。一部の実施形態において、RNA動員モチーフおよび対応する親和性ポリペプチドは、MS2ファージオペレーターステム-ループおよび親和性ポリペプチドMS2コートタンパク質(MCP)であってもよい。一部の実施形態において、RNA動員モチーフおよび対応する親和性ポリペプチドは、PUF結合部位(PBS)および親和性ポリペプチドプミリオ/fem-3 mRNA結合因子(PUF)であってもよい。本発明に有用であり得る例示的なRNA動員モチーフおよび対応する親和性ポリペプチドとして、以下に限定されないが、配列番号108~118が挙げられ得る。
一部の実施形態において、ポリペプチドおよび核酸を動員するための構成要素として、以下に限定されないが、FRB-FKBPのラパマイシン誘導性の二量体化;ビオチン-ストレプトアビジン;SNAPタグ;Haloタグ;CLIPタグ;化合物によって誘導されるDmrA-DmrCヘテロダイマー;二官能性リガンド(例えば、2つのタンパク質結合化学物質の一緒の融合;例えばジヒドロ葉酸還元酵素(DHFR)が挙げられ得る、化学相互作用を通して機能するものが挙げられ得る。
一部の実施形態において、植物内での発現のために最適化されている本発明の核酸構築体、発現カセット、またはベクターは、同じポリヌクレオチドを含むが、植物内での発現のためにコドン最適化されていない核酸構築体、発現カセット、またはベクターに対して約70%~100%(例えば、約70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%または100%)同一であってよい。
本明細書中に記載される「ペプチドタグ」は、1つまたは複数のポリペプチドを動員するのに使用されてよい。ペプチドタグは、対応する親和性ポリペプチドによって結合することができるあらゆるポリペプチドであってよい。また、ペプチドタグは、エピトープと称され得、複数のコピーで提供される場合には「多量体化エピトープ」と称され得る。例示的なペプチドタグとして、以下に限定されないが、GCN4ペプチドタグ(例えばSun-タグ)、c-Myc親和性タグ、HA親和性タグ、His親和性タグ、S親和性タグ、メチオニンHis親和性タグ、RGD-His親和性タグ、FLAGオクタペプチド、strepタグもしくはstrepタグII、V5タグ、および/またはVSV-Gエピトープが挙げられ得る。一部の実施形態において、ペプチドタグとしてまた、SH2ドメインによって認識される特定の配列の文脈におけるリン酸化チロシン、14-3-3タンパク質によって認識されるホスホセリンを含有する特徴的なコンセンサス配列、SH3ドメインによって認識されるプロリンリッチペプチドモチーフ、PDZタンパク質相互作用ドメイン、またはPDZシグナル配列、および植物由来のAGOhookモチーフが挙げられ得る。ペプチドタグは、国際公開第2018/136783号および米国特許出願公開第2017/0219596号に開示されており、これらは、ペプチドタグの開示が参照によって組み込まれる。本発明に有用であり得るペプチドタグとして、以下に限定されないが、配列番号119および配列番号120が挙げられ得る。ペプチドタグに有用な親和性ポリペプチドとして、以下に限定されないが、配列番号121が挙げられる。
ペプチドタグは、ペプチドタグの1コピー、2コピー、またはそれを超えるコピーを含んでもよいし、その中に存在してもよい(例えば、多量体化ペプチドタグまたは多量体化エピトープ)(例えば、約2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、9、20、21、22、23、24、もしくは25個、またはそれを超えるペプチドタグ)。多量体化される場合、ペプチドタグは、互いに直接融合していてもよいし、1つまたは複数のアミノ酸(例えば、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、またはそれを超えるアミノ酸、場合によっては、約3~約10、約4~約10、約5~約10、約5~約15、または約5~約20個のアミノ酸等、そしてそれらの中のあらゆる値もしくは範囲)を介して互いに連結されていてもよい。ゆえに、一部の実施形態において、本発明のCRISPR-Casエフェクタータンパク質は、1つのペプチドタグに、または2つ以上のペプチドタグに融合したCRISPR-Casエフェクタータンパク質ドメインを含んでもよく、場合によっては、2つ以上のペプチドタグは、1つまたは複数のアミノ酸残基を介して互いに融合している。一部の実施形態において、本発明に有用なペプチドタグは、GCN4ペプチドタグまたはエピトープの単一コピーであってもよいし、ペプチドタグの約2~約25コピー、またはそれを超えるコピーを含む多量体化GCN4エピトープ(例えば、約2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25コピー、またはそれを超えるコピーのGCN4エピトープ、またはそれらの中のあらゆる範囲)であってもよい。
一部の実施形態において、ペプチドタグは、CRISPR-Casポリペプチドまたはドメインに融合していてもよい。一部の実施形態において、ペプチドタグは、CRISPR-Casエフェクタータンパク質のC末端に融合または連結して、CRISPR-Cas融合タンパク質を形成してもよい。一部の実施形態において、ペプチドタグは、CRISPR-Casエフェクタータンパク質のN末端に融合または連結して、CRISPR-Cas融合タンパク質を形成してもよい。一部の実施形態において、ペプチドタグは、CRISPR-Casエフェクタータンパク質内で融合していてもよい(例えば、ペプチドタグは、CRISPR-Casエフェクタータンパク質のループ領域内にあってもよい)。一部の実施形態において、ペプチドタグは、シトシンデアミナーゼに、かつ/またはアデニンデアミナーゼに融合していてもよい。
「親和性ポリペプチド」(例えば「動員ポリペプチド」)は、その対応するペプチドタグ、ペプチドタグ、またはRNA動員モチーフに結合することができるあらゆるポリペプチドを指す。ペプチドタグに対する親和性ポリペプチドは、例えば、ペプチドタグにそれぞれ特異的に結合する抗体および/または一本鎖抗体であってもよい。一部の実施形態において、ペプチドタグに対する抗体として、以下に限定されないが、scFv抗体が挙げられ得る。一部の実施形態において、親和性ポリペプチドは、デアミナーゼ(例えば、シトシンデアミナーゼまたはアデニンデアミナーゼ)のN末端に融合または連結していてもよい。一部の実施形態において、親和性ポリペプチドは、細胞または細胞抽出物の還元条件下で、安定している。
本発明の核酸構築体および/またはガイド核酸は、本明細書中に記載される1つまたは複数の発現カセット内に含まれてもよい。一部の実施形態において、本発明の核酸構築体は、同上内に、またはガイド核酸および/もしくは動員ガイド核酸を含むものとは別個の発現カセットもしくはベクター内に含まれてもよい。
ガイド核酸および動員ガイド核酸と組み合わせて用いられる場合、本発明の核酸構築体(ならびに同上を含む発現カセットおよびベクター)は、標的核酸および/またはその発現を修飾するのに用いられ得る。標的核酸は、本発明の核酸構築体、ならびに/または同上を含む発現カセットおよび/もしくはベクターと、標的核酸を、ガイド核酸/動員ガイド核酸、ならびに/または同上を含む発現カセットおよびベクターと接触させるよりも前に、これと同時に、またはこれの後に、接触させ得る。
本発明の実施形態に従えば、提供されるのは、操作されたタンパク質である。本明細書中で用いられる「操作されたタンパク質」は、CRISPR-Casエフェクタータンパク質由来のポリペプチドを含むポリペプチド(すなわち、CRISPR-Casエフェクターポリペプチド)、およびCRISPR-Casエフェクターポリペプチドに対して異種であるポリペプチド(すなわち、異種ポリペプチド)を指す。CRISPR-Casエフェクタータンパク質由来のポリペプチドは、本明細書中で「CRISPR-Casエフェクターポリペプチド」と称され、そして「CRISPR-Casエフェクターポリペプチド」は、CRISPR-Casエフェクタータンパク質の部分である。したがって、本明細書中で用いられる「CRISPR-Casエフェクターポリペプチド」は、CRISPR-Casエフェクタータンパク質の全てを含むわけではないので、CRISPR-Casエフェクタータンパク質についてのアミノ酸の数と比較して、アミノ酸の数が引き下げられている。一部の実施形態において、CRISPR-Casエフェクターポリペプチドは、ヌクレアーゼドメインが欠けている(例えば、RuvCドメインが欠けている)。CRISPR-Casエフェクターポリペプチドに対して異種であるポリペプチドは、本明細書中で異種ポリペプチドと称される。異種ポリペプチドは、本明細書中に記載される注目するポリペプチドであってもよい。一部の実施形態において、操作されたタンパク質は、デアミナーゼドメイン(例えば、シトシンデアミナーゼおよび/またはアデニンデアミナーゼ)の全てまたは部分を含み、これは、操作されたタンパク質のあらゆる部分に連結されていてよい。例えば、一部の実施形態において、デアミナーゼドメインの全てまたは部分が、CRISPR-CasエフェクターポリペプチドのN末端もしくはC末端に、かつ/または操作されたタンパク質のN末端もしくはC末端に連結されている。一部の実施形態において、デアミナーゼドメインの全てまたは部分は、操作されたタンパク質の2つの部分の間にある。操作されたタンパク質は、核酸を切断するか、切るか、もしくはニックを入れ;核酸(例えば、標的核酸および/またはガイド核酸)に結合し;かつ/または本明細書中で規定されるガイド核酸を識別するか、認識するか、もしくはこれに結合することができる。一部の実施形態において、操作されたタンパク質またはその部分は、酵素(例えば、ヌクレアーゼ、エンドヌクレアーゼ、ニッカーゼその他)であってよく、かつ/または酵素として機能してよい。一部の実施形態において、本発明の操作されたタンパク質は、RNAガイドDNA結合タンパク質である。一部の実施形態において、操作されたタンパク質は、単一のガイド核酸(例えば、gRNA、CRISPRアレイ、および/またはcrRNA)であるガイド核酸中に存在し、かつ/またはこれと複合体を形成し、場合によっては、ガイド核酸は単一のcrRNAである。一部の実施形態において、複合体は、操作されたタンパク質およびガイド核酸を含み、そしてガイド核酸および/または複合体は、単一のガイド核酸(例えば単一のcrRNA)からなる。一部の実施形態において、操作されたタンパク質は、単一のガイド核酸(例えば、単一のcrRNA)に結合し、標的核酸を認識し、かつ/またはこれに結合し、かつヌクレアーゼ活性を有し、場合によっては、操作されたタンパク質は、標的核酸の標的鎖を切断する。
一部の実施形態において、操作されたタンパク質は、第1のCRISPR-Casエフェクターポリペプチドおよび異種ポリペプチドを含む。第1のCRISPR-Casエフェクターポリペプチドは、ヌクレアーゼドメインが欠けていてもよく、場合によってはRuvCドメインが欠けていてもよい。異種ポリペプチドは、第1のCRISPR-CasエフェクターポリペプチドのNまたはC末端に、場合によってはリンカー(例えばペプチドリンカー)ありで、または無しで連結されていてもよい。一部の実施形態において、第1のCRISPR-Casエフェクターポリペプチドは、第1のCRISPR-Casエフェクタータンパク質の部分(例えば、V型CRISPR-Casエフェクタータンパク質の部分、例えばCas12aの部分)である。一部の実施形態において、異種ポリペプチドは、ヌクレアーゼドメイン、場合によってはHNHドメイン(例えば、配列番号1または169~174の1つまたは複数のアミノ酸配列に対して少なくとも70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、または100%の配列同一性を有する配列を含むHNHドメイン)を含む。一部の実施形態において、異種ポリペプチドは、CRISPR-Casエフェクタータンパク質由来のHNHドメインを含み、かつ/または配列番号1もしくは172の1つのアミノ酸配列に対して少なくとも70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、もしくは100%の配列同一性を有する配列を含む。一部の実施形態において、異種ポリペプチドは、CRISPR-Casエフェクタータンパク質に由来しないHNHドメインを含み、かつ/または配列番号169~171もしくは173~174の1つのアミノ酸配列に対して少なくとも70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、もしくは100%の配列同一性を有する配列を含む。一部の実施形態において、異種ポリペプチドは、CRISPR-Casエフェクタータンパク質由来のポリペプチドであり、場合によっては、異種ポリペプチドは、第1のCRISPR-Casエフェクターポリペプチドの部分が由来する第1のCRISPR-Casエフェクタータンパク質のタイプ(例えば、IV型CRISPR-Casエフェクタータンパク質)とは異なるタイプのCRISPR-Casエフェクタータンパク質(例えば、II型CRISPR-Casエフェクタータンパク質)に由来する。
一部の実施形態において、操作されたタンパク質は、第1のCRISPR-Casエフェクターポリペプチド、異種ポリペプチド、および第2のCRISPR-Casエフェクターポリペプチドを含み、これらはあらゆる順序で一緒に連結され得る。一部の実施形態において、第1のCRISPR-Casエフェクターポリペプチドは、RuvCドメインが欠けていてもよい。異種ポリペプチドは、第1のCRISPR-CasエフェクターポリペプチドのNもしくはC末端に、場合によってはリンカー(例えばペプチドリンカー)ありで、もしくは無しで連結されていてよく、かつ/または異種ポリペプチドは、場合によってはリンカー(例えばペプチドリンカー)ありで、もしくは無しで、第2のCRISPR-CasエフェクターポリペプチドのNもしくはC末端に連結されていてもよい。一部の実施形態において、異種ポリペプチドは、第1のCRISPR-Casエフェクターポリペプチドと第2のCRISPR-Casエフェクターポリペプチドとの間にある。一部の実施形態において、第1のCRISPR-Casエフェクターポリペプチドは、第1のCRISPR-Casエフェクタータンパク質の部分(例えば、V型CRISPR-Casエフェクタータンパク質の部分、例えばCas12aの部分)であり、そして第2のCRISPR-Casエフェクターポリペプチドは、第2のCRISPR-Casエフェクタータンパク質の部分(例えば、V型CRISPR-Casエフェクタータンパク質の部分、例えばCas12aの部分)であり、第1のCRISPR-Casエフェクタータンパク質および第2のCRISPR-Casエフェクタータンパク質は、同じタンパク質であっても異なるタンパク質であってもよい。一部の実施形態において、第1のCRISPR-Casエフェクタータンパク質および第2のCRISPR-Casエフェクタータンパク質は、同じであることによって、第1のCRISPR-Casエフェクターポリペプチドおよび第2のCRISPR-Casエフェクターポリペプチドは、同じタンパク質由来の部分であるが、CRISPR-Casエフェクタータンパク質の異なる部分であってもよい。第1のCRISPR-Casエフェクターポリペプチドおよび第2のCRISPR-Casエフェクターポリペプチドは、異なる配列を有してもよい。一部の実施形態において、第1のCRISPR-Casエフェクターポリペプチドおよび第2のCRISPR-Casエフェクターポリペプチドは、同じ配列を含んでもよい。一部の実施形態において、第1のCRISPR-Casエフェクターポリペプチドおよび第2のCRISPR-Casエフェクターポリペプチドは一緒に、CRISPR-Casエフェクタータンパク質の完全配列を提供する。一部の実施形態において、第1のCRISPR-Casエフェクターポリペプチドおよび第2のCRISPR-Casエフェクターポリペプチドは一緒に、CRISPR-Casエフェクタータンパク質の完全配列を構成しない(すなわち、CRISPR-Casエフェクタータンパク質の配列の部分は、第1のCRISPR-Casエフェクターポリペプチドおよび第2のCRISPR-Casエフェクターポリペプチドの2つの配列内に存在しない);例えば、CRISPR-Casエフェクタータンパク質の1もしくは5~10、15、20、25、30個、またはこれを超えるアミノ酸(例えば、1、2、3、4、5、6、7、8、9、10、15、20、25、30個、またはこれを超えるアミノ酸)は、第1および第2のCRISPR-Casエフェクターポリペプチドの配列内に存在しなくてもよい。一部の実施形態において、異種ポリペプチドは、ヌクレアーゼドメイン、場合によってはHNHドメイン(例えば、II型CRISPR-Casエフェクタータンパク質由来のHNHドメイン)を含む。一部の実施形態において、異種ポリペプチドは、CRISPR-Casエフェクタータンパク質に由来しないHNHドメインを含む。一部の実施形態において、異種ポリペプチドは、CRISPR-Casエフェクタータンパク質由来のポリペプチドであり、場合によっては、異種ポリペプチドは、第1のCRISPR-Casエフェクターポリペプチドの部分が由来する第1のCRISPR-Casエフェクタータンパク質(例えば、IV型CRISPR-Casエフェクタータンパク質)のタイプとは異なり、かつ/または第2のCRISPR-Casエフェクターポリペプチドの部分が由来する第2のCRISPR-Casエフェクタータンパク質(例えば、IV型CRISPR-Casエフェクタータンパク質)のタイプとは異なるタイプのCRISPR-Casエフェクタータンパク質(例えば、II型CRISPR-Casエフェクタータンパク質)に由来する。一部の実施形態において、異種ポリペプチドは、II型CRISPR-Casエフェクタータンパク質に由来し(例えば、II型CRISPR-Casエフェクタータンパク質の部分(例えば、HNHドメインまたはその部分)であり)、第1のCRISPR-Casエフェクターポリペプチドは、IV型CRISPR-Casエフェクタータンパク質の部分であり、そして第2のCRISPR-Casエフェクターポリペプチドは、IV型CRISPR-Casエフェクタータンパク質の部分であり、第1および第2のCRISPR-Casエフェクターポリペプチドは異なる。一部の実施形態において、異種ポリペプチドは、第1のCRISPR-Casエフェクターポリペプチドおよび第2のCRISPR-Casエフェクターポリペプチドの1つに対して異種である。一部の実施形態において、異種ポリペプチドは、第1のCRISPR-Casエフェクターポリペプチドおよび第2のCRISPR-Casエフェクターポリペプチドの双方に対して異種である。
本明細書中で用いられる「異種ポリペプチド」は、操作されたタンパク質のCRISPR-Casエフェクターポリペプチドと比較して、天然に存在しないポリペプチドを指す。したがって、操作されたタンパク質の異種ポリペプチドは、自然界で、操作されたタンパク質の少なくとも1つのCRISPR-Casエフェクターポリペプチド内に見出されないので、異種ポリペプチドは、少なくとも1つのCRISPR-Casエフェクターポリペプチドに関して、天然に存在しない。例えば、本発明の操作されたタンパク質は、CRISPR-Casエフェクタータンパク質の部分であるCRISPR-Casエフェクターポリペプチドを含み、そして操作されたタンパク質は異種ポリペプチドを含み、そして異種ポリペプチドは、異種ポリペプチドの非存在下のCRISPR-Casエフェクターポリペプチド(例えば、異種ポリペプチドおよびCRISPR-Casエフェクターポリペプチド(例えば、これの挿入または融合)を含まないか、またはこれを含む前のCRISPR-Casエフェクターポリペプチド)と比較して、天然に存在しない;一部の実施形態において、異種ポリペプチドは、CRISPR-Casエフェクターポリペプチドの部分が由来するCRISPR-Casエフェクタータンパク質に対して異種である。一部の実施形態において、操作されたタンパク質は、異種ポリペプチド、第1のCRISPR-Casエフェクタータンパク質の部分である第1のCRISPR-Casエフェクターポリペプチド、および第2のCRISPR-Casエフェクタータンパク質の部分である第2のCRISPR-Casエフェクターポリペプチドを含み、異種ポリペプチドは、第1のCRISPR-Casエフェクターポリペプチド、第1のCRISPR-Casエフェクタータンパク質、第2のCRISPR-Casエフェクター、および第2のCRISPR-Casエフェクタータンパク質内に天然に存在しない(すなわち、これらに対して異種である)。同様に、異種ポリペプチドをコードするヌクレオチド配列は、操作されたタンパク質のCRISPR-Casエフェクターポリペプチドをコードするヌクレオチド配列に対して異種である(すなわち、これと比較して、天然に存在しない)。
一部の実施形態において、異種ポリペプチドは、操作されたタンパク質のCRISPR-Casエフェクターポリペプチドとは異なるタイプのタンパク質由来のポリペプチドまたはドメインを含む。一部の実施形態において、操作されたタンパク質は、V型CRISPR-Casエフェクタータンパク質(例えばCas 12a)の1つまたは複数(例えば、1、2、3つ、またはそれを超える)の部分(すなわち、これに由来する1つまたは複数のCRISPR-Casエフェクターポリペプチド)、および異なるタイプのCRISPR-Casエフェクタータンパク質、例えばII型CRISPR-Casエフェクタータンパク質由来の1つまたは複数(例えば、1、2、3つ、またはそれを超える)のポリペプチドを含む。2つ以上の部分またはポリペプチドが、同上のタンパク質に由来し、かつ各々が、操作されたタンパク質内に存在する場合、2つ以上の部分またはポリペプチドは、リンカーおよび/または異種ポリペプチドによって、操作されたタンパク質内で互いに分離されていてもよい(すなわち、2つ以上の部分またはポリペプチドは、直接連結されていなくてもよい)し、それらの部分が由来するタンパク質のもの(例えば、野生型タンパク質および/またはCRISPR-Casエフェクタータンパク質)と異なる順序であってもよい。一部の実施形態において、操作されたタンパク質は、V型CRISPR-Casエフェクタータンパク質(例えばCas 12a)の1つまたは複数(例えば、1、2、3つ、またはそれを超える)の部分(すなわち、これに由来する1つまたは複数のCRISPR-Casエフェクターポリペプチド)、ならびにII型CRISPR-Casエフェクタータンパク質(例えばCas 9)由来の少なくとも1つのポリペプチドおよび/またはその部分を含む。一部の実施形態において、操作されたタンパク質は、V型CRISPR-Casエフェクタータンパク質(例えばCas 12a)の部分である第1のCRISPR-Casエフェクターポリペプチド、およびII型CRISPR-Casエフェクタータンパク質(例えばCas 9)由来の異種ポリペプチドを含む。一部の実施形態において、操作されたタンパク質は、V型CRISPR-Casエフェクタータンパク質(例えばCas 12a)の部分である第1のCRISPR-Casエフェクターポリペプチド、II型CRISPR-Casエフェクタータンパク質(例えばCas 9)由来の異種ポリペプチド、およびV型CRISPR-Casエフェクタータンパク質(例えばCas 12a)の部分である第2のCRISPR-Casエフェクターポリペプチドを含み、場合によっては、第1および第2のCRISPR-Casエフェクターポリペプチドは、同じV型CRISPR-Casエフェクタータンパク質(例えばCas 12a)と異なる部分である。一部の実施形態において、操作されたタンパク質は、V型CRISPR-Casエフェクタータンパク質(例えばCas 12a)の部分である第1のCRISPR-Casエフェクターポリペプチド、HNHドメインまたはその部分を含む異種ポリペプチド、およびV型CRISPR-Casエフェクタータンパク質(例えばCas 12a)の部分である第2のCRISPR-Casエフェクターポリペプチドを含み、場合によっては、第1および第2のCRISPR-Casエフェクターポリペプチドは、同じV型CRISPR-Casエフェクタータンパク質(例えばCas 12a)と異なる部分である。
一部の実施形態において、操作されたタンパク質は、V型CRISPR-Casエフェクタータンパク質(例えば、Cas 12a)由来の1つもしくは複数の(例えば、1、2、3つ、またはそれを超える)ドメインまたはその部分、および異なるタイプのCRISPR-Casエフェクタータンパク質、例えばII型CRISPR-Casエフェクタータンパク質由来の1つもしくは複数の(例えば、1、2、3つ、またはそれを超える)ドメインまたはその部分を含む。一部の実施形態において、操作されたタンパク質は、V型CRISPR-Casエフェクタータンパク質(例えばCas 12a)由来の1つまたは複数の(例えば、1、2、3つ、またはそれを超える)ドメインまたはその部分、およびII型CRISPR-Casエフェクタータンパク質(例えばCas 9)由来の少なくとも1つのドメインまたはその部分を含む。一部の実施形態において、操作されたタンパク質の異種ポリペプチドは、CRISPR-Casエフェクターポリペプチドの、かつ/またはCRISPR-Casエフェクターポリペプチドの1つもしくは複数のドメイン(例えばRuvCドメイン)の活性に干渉しないし、悪影響を与えない。
異種ポリペプチドは、約10~約300アミノ酸、例えば、約10、20、30、40、50、60、70、80、90、または100アミノ酸~約110、125、150、175、200、225、250、275、または300アミノ酸の長さを有してもよい。一部の実施形態において、異種ポリペプチドは、約10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、または300アミノ酸の長さを有する。一部の実施形態において、異種ポリペプチドは、約120、125、130、135、または140アミノ酸~約145、150、155、または160アミノ酸の長さを有する。一部の実施形態において、異種ポリペプチドは、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、または160アミノ酸の長さを有する。一部の実施形態において、異種ポリペプチドは、第1のCRISPR-Casエフェクターポリペプチドと第2のCRISPR-Casエフェクターポリペプチドとの間にあり、そして異種ポリペプチドは、第1および第2のCRISPR-Casエフェクターポリペプチドの一方または双方に対して異種である。
一部の実施形態において、CRISPR-Casエフェクターポリペプチドは、約100、150、200、または250アミノ酸~約300、350、または400アミノ酸の長さを有する。一部の実施形態において、CRISPR-Casエフェクターポリペプチドは、約100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、または400アミノ酸の長さを有する。一部の実施形態において、CRISPR-Casエフェクターポリペプチドは、約800、850、または900アミノ酸~約950、1000、1050、または1100アミノ酸の長さを有する。一部の実施形態において、CRISPR-Casエフェクターポリペプチドは、約800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990、1,000、1,010、1,020、1,030、1,040、1,050、1,060、1,070、1,080、1,090、1,100アミノ酸の長さを有する。一部の実施形態において、操作されたタンパク質は、約100、150、200、または250アミノ酸~約300、350、または400アミノ酸の長さを有する第1のCRISPR-Casエフェクターポリペプチド、約10、50、100、または140アミノ酸~約160、200、250、または300アミノ酸の長さを有する異種ポリペプチド;および約100、200、300、400、500、600、700、800、850、または900アミノ酸~約950、1,000、1,050、または1,100アミノ酸の長さを有する第2のCRISPR-Casエフェクターポリペプチドを含む。
一部の実施形態において、異種ポリペプチドは、ヌクレアーゼドメインまたはその部分を含み、これは、本明細書中で「異種ヌクレアーゼドメインまたはその部分」と称され得る。なぜなら、異種ポリペプチド由来のヌクレアーゼドメインまたはその部分は、操作されたタンパク質内に存在する1つまたは複数のCRISPR-Casエフェクターポリペプチドに対して異種であるからである。異種ポリペプチドは、DNAヌクレアーゼドメインまたはその部分であってよい。一部の実施形態において、異種ヌクレアーゼドメインまたはその部分は、CRISPR-Casエフェクタータンパク質由来である。一部の実施形態において、異種ヌクレアーゼドメインまたはその部分は、CRISPR-Casエフェクタータンパク質由来でない。一部の実施形態において、異種ヌクレアーゼドメインまたはその部分は、細菌タンパク質由来であり、場合によっては、異種ヌクレアーゼドメインまたはその部分は、制限酵素、ホーミングエンドヌクレアーゼ、コリシン、ピオシン、逆転写酵素、DNase、および/またはスタンドアロンHNHドメイン由来である。一部の実施形態において、操作されたタンパク質は、ヌクレアーゼドメインまたはその部分(すなわち、異種ヌクレアーゼドメインまたはその部分)を含む異種ポリペプチドを含み、操作されたタンパク質は、場合によっては標的核酸の標的鎖および/または標的核酸の非標的鎖を切断するヌクレアーゼである。一部の実施形態において、操作されたタンパク質は、標的核酸の標的鎖、および標的核酸の非標的鎖を切断し、そして標的核酸の平滑末端二本鎖切断、または標的核酸のスタガー二本鎖切断を実現する。一部の実施形態において、操作されたタンパク質は、標的核酸の標的鎖、および標的核酸の非標的鎖を切断し、そして切られる部位間の距離(例えば、ヌクレオチドの数)は、0、1、2、3、4、または5ヌクレオチド~約6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチドである。
一部の実施形態において、異種ヌクレアーゼドメインまたはその部分は、標的鎖ニッカーゼドメインまたはその部分であってもよい。本明細書中で用いられる「標的鎖ニッカーゼドメインまたはその部分」は、ドメインまたはその部分が、その固有のタンパク質内にある場合に、標的核酸の標的鎖に対するニッカーゼ活性を有するポリペプチドを指す。すなわち、標的鎖ニッカーゼドメインまたはその部分は、ドメインまたはその部分が、その固有のタンパク質内にある場合、標的核酸の標的鎖(センス(例えば、「+」;鋳型)鎖とも称される)にニックを入れる(例えば、これを切断または分解する)ことができる。例えば、Cas9のHNHドメインは、標的核酸の標的鎖にニックを入れ、かつ/またはこれに対するニッカーゼ活性を有する。本明細書中で用いられる「ニッカーゼ活性」は、核酸内の一本鎖切断を指す。
一部の実施形態において、標的鎖ニッカーゼドメインまたはその部分は、操作されたタンパク質内に存在する場合、標的核酸の標的鎖に対するニッカーゼ活性を有してもよい。一部の実施形態において、標的鎖ニッカーゼドメインまたはその部分は、操作されたタンパク質内に存在する場合、標的核酸の非標的鎖(アンチセンス(例えば、「-」、相補)鎖とも称される)に対するニッカーゼ活性を有してもよい。操作されたタンパク質内の標的鎖ニッカーゼドメインまたはその部分が、標的鎖および非標的鎖の双方に対するニッカーゼ活性を有する場合、標的鎖ニッカーゼドメインまたはその部分は、双方の鎖を順次切断し得る。一部の実施形態において、操作されたタンパク質内の標的鎖ニッカーゼドメインまたはその部分は、標的核酸の非標的鎖よりも標的鎖に対して大きい活性(例えば酵素活性)を有する。例えば、操作されたタンパク質内に存在する場合、標的鎖ニッカーゼドメインまたはその部分は、標的核酸の非標的鎖よりも標的核酸の標的鎖を速く選好または切断し得る。
本明細書中で用いられる「標的鎖特異的ニッカーゼドメイン」は、標的核酸の標的鎖に対してのみニッカーゼ活性を有し、かつ標的核酸の非標的鎖にニックを入れないポリペプチドを指す。本明細書中で用いられる「非標的鎖特異的ニッカーゼドメイン」は、標的核酸の非標的鎖に対してのみニッカーゼ活性を有し、かつ標的核酸の標的鎖にニックを入れないポリペプチドを指す。本明細書中で用いられる「標的および非標的鎖ニッカーゼドメイン」は、標的核酸の標的鎖および非標的鎖の双方に対するニッカーゼ活性を有するポリペプチドを指す。一部の実施形態において、操作されたタンパク質は、標的鎖ニッカーゼドメインまたはその部分を含み、標的鎖ニッカーゼドメインまたはその部分は、操作されたタンパク質内の標的鎖特異的ニッカーゼドメインである。一部の実施形態において、操作されたタンパク質は、標的鎖ニッカーゼドメインまたはその部分を含み、標的鎖ニッカーゼドメインまたはその部分は、操作されたタンパク質内の非標的鎖特異的ニッカーゼドメインである。一部の実施形態において、操作されたタンパク質は、標的鎖ニッカーゼドメインまたはその部分を含み、標的鎖ニッカーゼドメインまたはその部分は、操作されたタンパク質内の標的および非標的鎖ニッカーゼドメインである。
操作されたタンパク質は、標的鎖ニッカーゼドメインまたはその部分を含む異種ポリペプチドを含んでもよい。したがって、操作されたタンパク質は、標的核酸の標的鎖および/または標的核酸の非標的鎖に対するニッカーゼ活性を有してもよい。これによって、操作されたタンパク質は、標的鎖ニッカーゼおよび/または非標的鎖ニッカーゼであってもよい。操作されたタンパク質を参照して本明細書中で用いられる「標的鎖ニッカーゼ」は、標的核酸の標的鎖を切断することができる操作されたタンパク質を指す。操作されたタンパク質を参照して本明細書中で用いられる「非標的鎖ニッカーゼ」は、標的核酸の非標的鎖を切断することができる操作されたタンパク質を指す。操作されたタンパク質を参照して本明細書中で用いられる「標的および非標的鎖ニッカーゼ」は、標的核酸の標的および非標的鎖の双方をあらゆる順序で(例えば、順次、または同時に)切断することができる操作されたタンパク質を指す。一部の実施形態において、操作されたタンパク質は、標的鎖ニッカーゼであり、かつ/または標的核酸の標的鎖に対するニッカーゼ活性を有する。一部の実施形態において、操作されたタンパク質は、非標的鎖ニッカーゼであり、かつ/または標的核酸の非標的鎖に対するニッカーゼ活性を有する。一部の実施形態において、操作されたタンパク質は、標的および非標的鎖ニッカーゼであり、かつ/または標的核酸の標的鎖および非標的鎖に対するニッカーゼ活性を有する。
一部の実施形態において、操作されたタンパク質の異種ポリペプチドは、標的鎖ニッカーゼドメインまたはその部分を含み、操作されたタンパク質の標的鎖ニッカーゼドメインまたはその部分は、標的核酸の標的鎖に対するニッカーゼ活性を有し、よって、操作されたタンパク質は、標的鎖ニッカーゼである。一部の実施形態において、操作されたタンパク質の異種ポリペプチドは、標的鎖ニッカーゼドメインまたはその部分を含み、操作されたタンパク質の標的鎖ニッカーゼドメインまたはその部分は、標的核酸の非標的鎖に対するニッカーゼ活性を有し、よって、操作されたタンパク質は、非標的鎖ニッカーゼである。一部の実施形態において、操作されたタンパク質の異種ポリペプチドは、標的鎖ニッカーゼドメインまたはその部分を含み、操作されたタンパク質の標的鎖ニッカーゼドメインまたはその部分は、標的核酸の標的および非標的鎖の双方に対するニッカーゼ活性を有し、よって、操作されたタンパク質は、標的および非標的鎖ニッカーゼである。一部の実施形態において、操作されたタンパク質の異種ポリペプチドは、標的鎖ニッカーゼドメインまたはその部分を含み、操作されたタンパク質の標的鎖ニッカーゼドメインまたはその部分は、標的核酸の少なくとも標的鎖に対するニッカーゼ活性を有し、操作されたタンパク質のCRISPR-Casエフェクターポリペプチドは、標的核酸の少なくとも非標的鎖に対するニッカーゼ活性を有するヌクレアーゼドメインまたはその部分を含み、よって、操作されたタンパク質は、標的および非標的鎖ニッカーゼである。一部の実施形態において、操作されたタンパク質のCRISPR-Casエフェクターポリペプチドは、標的および非標的鎖ニッカーゼドメインまたはその部分であるヌクレアーゼドメインまたはその部分を含むが、ヌクレアーゼドメインまたはその部分は、標的鎖に対するヌクレアーゼ活性が不活化されており、よって、標的核酸の標的鎖が、ヌクレアーゼドメインまたはその部分によってニックを入れられないように不活化されている。
一部の実施形態において、操作されたタンパク質は、1つまたは複数(例えば、1、2つ、またはそれを超える)のヌクレアーゼドメインまたはその部分を含んでもよい。一部の実施形態において、操作されたタンパク質は、少なくとも2つの異なるヌクレアーゼドメインまたはその部分を含む。一部の実施形態において、操作されたタンパク質は、固有のヌクレアーゼドメイン、場合によっては1つまたは複数の(例えば、1、2つ、またはそれを超える)固有のヌクレアーゼドメインを含んでもよい。本明細書中で用いられる「固有のヌクレアーゼドメイン」は、CRISPR-Casエフェクタータンパク質内に天然に存在するヌクレアーゼドメインを指す。一部の実施形態において、操作されたタンパク質は、第1の異種ヌクレアーゼドメイン(例えば、異種ポリペプチドに由来し、かつ/またはその中に存在する)および第2のヌクレアーゼドメインを含む。第2のヌクレアーゼドメインは、CRISPR-Casエフェクタータンパク質に由来してもよく、かつ/またはその中に存在してもよい。一部の実施形態において、第1のヌクレアーゼドメインは、固有のヌクレアーゼドメインであってよく、かつ/または第2のヌクレアーゼドメインは、固有のヌクレアーゼドメインであってもよい。一部の実施形態において、第2のヌクレアーゼドメインは、標的および非標的鎖ニッカーゼドメインまたはその部分である。本明細書中で用いられる「非標的および標的鎖ニッカーゼドメインまたはその部分」は、ドメインまたはその部分が、その固有のタンパク質内にある場合、標的核酸の非標的鎖に対する、そして標的核酸の標的鎖に対するニッカーゼ活性を有し、かつ標的鎖の前に非標的鎖を切断するか、または標的鎖よりも速く非標的鎖を選好もしくは切断するポリペプチドを指す。非標的および標的鎖ニッカーゼドメインまたはその部分は、標的核酸内でのスタガー二本鎖切断を実現してもよい。一部の実施形態において、第2のヌクレアーゼドメインは活性である。一部の実施形態において、第2のヌクレアーゼドメインは、不活化されている(すなわち、死んだか、不活性であるか、またはニッカーゼ活性を欠いている)。一部の実施形態において、第2のヌクレアーゼドメインは、標的核酸の非標的鎖にのみニックを入れ、かつ/または標的核酸の標的鎖に対するニッカーゼ活性を不活化する変異を含む。操作されたタンパク質内のヌクレアーゼドメインまたはその部分は、ニッカーゼ活性を除去または不活化するヌクレアーゼドメインまたはその部分内の変異によって不活化されていてもよい。一部の実施形態において、操作されたタンパク質は、Cas12a(例えば、配列番号50~66の1つ由来)またはCas12b(例えば、配列番号151由来)等のV型CRISPR-Casエフェクタータンパク質由来のヌクレアーゼドメインまたはその部分を含む。一部の実施形態において、ヌクレアーゼドメインは、Cas12aまたはCas12b等のV型CRISPR-Casエフェクタータンパク質由来のRuvCドメインである。操作されたタンパク質は、標的核酸の平滑末端二本鎖切断、または標的核酸のスタガー二本鎖切断を実現する1つまたは複数のヌクレアーゼドメインを含んでもよい。
一部の実施形態において、操作されたタンパク質の異種ポリペプチドは、CRISPR-Casエフェクタータンパク質のHNHドメインの全てまたは部分を含む。異種ポリペプチドおよび/またはHNHドメインは、ジンクフィンガーモチーフを含んでもよく、かつ/またはこれを形成してもよい。一部の実施形態において、異種ポリペプチドおよび/またはHNHドメインは、約10、20、30、40、50、60、70、80、90、または100アミノ酸~約110、125、150、175、200、225、250、275、または300アミノ酸の長さを有する。異種ポリペプチドおよび/またはHNHドメインは、約25もしくは30~約40もしくは45アミノ酸を含んでもよく、かつ/または場合によっては核酸結合および切断部位内にある、1つまたは少なくとも2つのヒスチジンおよびアスパラギンを含んでもよい。一部の実施形態において、異種ポリペプチドおよび/またはHNHドメインは、ジンクフィンガーモチーフ内に存在し、かつ/またはこれを形成する2つのヒスチジンおよび1つのアスパラギンを含む、約25または30~約40または45アミノ酸を含んでよい。異種ポリペプチドおよび/またはHNHドメインは、ループによって連結されている2つの逆平行ベータ鎖を含んでもよく、かつ/もしくは形成してもよく、かつ/またはアルファヘリックスを含んでもよく、場合によっては、ヒスチジンは、ベータ鎖の少なくとも1つの中に存在し、アスパラギンは、ループ内に存在し、かつ/またはヒスチジンもしくはアスパラギンは、アルファヘリックス内に存在する。異種ポリペプチドは、Pediaditakis M,et al.Journal of Bacteriology 194(22);6184-6194に記載される構造を有するHNHドメインの全てまたは部分を含んでもよい。一部の実施形態において、操作されたタンパク質の異種ポリペプチドは、II型CRISPR-Casエフェクタータンパク質のHNHドメイン、例えばCas9 HNHドメインの全てまたは部分を含む。操作されたタンパク質の異種ポリペプチドは、不活性であるHNHドメイン(例えば、Cas9 HNHドメイン)の全てまたは部分を含んでもよい。HNHドメインまたはその部分は、不活化変異(例えば、ニッカーゼ活性を除去する変異)を有してもよい。一部の実施形態において、操作されたタンパク質の異種ポリペプチドは、不活化変異を有するHNHドメインの全てもしくは部分を含み、かつ/またはHNHドメインは不活性である(例えば、ニッカーゼ活性を有していない)。一部の実施形態において、操作されたタンパク質の異種ポリペプチドは、H840A変異を有する不活化HNHドメインの全てまたは部分を含む。一部の実施形態において、操作されたタンパク質の異種ポリペプチドは、配列番号1または169~174の1つまたは複数のアミノ酸配列に対して少なくとも70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、または100%の配列同一性を有するアミノ酸配列を含む。一部の実施形態において、操作されたタンパク質の異種ポリペプチドは、配列番号1または169~174のいずれか1つのアミノ酸配列を含む。
一部の実施形態において、操作されたタンパク質の異種ポリペプチドは、異種ポリペプチドおよび配列番号81のアミノ酸配列が最適にアラインされている場合に、配列番号81のアミノ数839に対応する位置にてヒスチジン残基でないアミノ酸残基を有するアミノ酸配列を含む。一部の実施形態において、操作されたタンパク質の異種ポリペプチドは、異種ポリペプチドおよび配列番号1のアミノ酸配列が最適にアラインされている場合に、配列番号1のアミノ数75に対応する位置にてヒスチジン残基でないアミノ酸残基を有するアミノ酸配列を含む。一部の実施形態において、操作されたタンパク質の異種ポリペプチドは、異種ポリペプチドおよび配列番号81のアミノ酸配列が最適にアラインされている場合に、配列番号81のアミノ数839に対応する位置にてアラニン残基を有するアミノ酸配列を含む。一部の実施形態において、操作されたタンパク質の異種ポリペプチドは、異種ポリペプチドおよび配列番号1のアミノ酸配列が最適にアラインされている場合に、配列番号1のアミノ数75に対応する位置にてアラニン残基を有するアミノ酸配列を含む。
一部の実施形態において、操作されたタンパク質の異種ポリペプチドは、CRISPR-Casエフェクタータンパク質内に存在する2つの連続または非連続アミノ酸の間にあってもよく、かつ/またはこれらに(例えば、直接的または間接的に)連結してもよい。一部の実施形態において、操作されたタンパク質は、CRISPR-Casエフェクタータンパク質またはその部分の2つの連続または非連続アミノ酸の間に異種ポリペプチドを挿入することによって、調製される。一部の実施形態において、操作されたタンパク質は、アミノ末端からカルボキシ末端方向に、第1のCRISPR-Casエフェクターポリペプチド、異種ポリペプチド、および第2のCRISPR-Casエフェクターポリペプチドを含んでよく、第1および第2のCRISPR-Casエフェクターポリペプチドは、同じCRISPR-Casエフェクタータンパク質由来である。
一部の実施形態において、CRISPR-Casエフェクターポリペプチドは、V型CRISPR-Casエフェクタータンパク質、例えばCas12aまたはCas12bの部分を含む。CRISPR-Casエフェクターポリペプチドは、核酸結合ドメイン、例えばV型CRISPR-Casエフェクタータンパク質(例えば、Cas12aまたはCas12b)由来の核酸結合ドメインの全てまたは部分を含んでもよい。一部の実施形態において、操作されたタンパク質のCRISPR-Casエフェクターポリペプチドは、配列番号50~66または151の1つまたは複数のアミノ酸配列の部分に対して少なくとも70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、または100%の配列同一性を有するアミノ酸配列を含む。一部の実施形態において、CRISPR-Casエフェクターポリペプチドは、配列番号50~66または151のいずれか1つのアミノ酸配列の部分を含む。一部の実施形態において、操作されたタンパク質は、配列番号50~66または151のいずれか1つのアミノ酸配列の2つ以上(例えば、2、3、4つ、またはそれを超える)の別個の部分を含む。
一部の実施形態において、本発明の操作されたタンパク質は、CRISPR-Casエフェクタータンパク質内に存在する約5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100個、またはそれを超えるアミノ酸、例えば配列番号50~66または151のいずれか1つの配列を有するものが欠けていてもよい。一部の実施形態において、本発明の操作されたタンパク質は、CRISPR-Casエフェクタータンパク質内に存在する0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、または15個のアミノ酸、例えば配列番号50~66または151のいずれか1つの配列を有するものが欠けていてもよい。例えば、操作されたタンパク質は、配列番号50または配列番号58のアミノ酸残基283~アミノ酸残基293;配列番号55のアミノ酸残基331~アミノ酸残基341;配列番号51のアミノ酸残基312~アミノ酸残基322;または配列番号50、51、58、もしくは55の1つに対して最適にアラインされている配列についての対応するアミノ酸残基(例えば、配列(例えば配列番号52)が配列番号50に対して最適にアラインされている場合にアミノ酸残基283~293に相当するアミノ酸残基)由来の1つまたは複数のアミノ酸が欠けていてもよい。一部の実施形態において、操作されたタンパク質は、CRISPR-Casエフェクターの部分が由来し、かつ操作されたタンパク質内に存在するCRISPR-Casエフェクタータンパク質内に存在する1つまたは複数の(例えば、1、2、3、4つ、またはそれを超える)ドメイン間リンカー領域(例えば、2つのドメイン、例えば2つの隣接ドメインの間にある領域)(例えば、配列番号50~66または151のいずれか1つの配列を有するもの)が欠けている。
一部の実施形態において、操作されたタンパク質の異種ポリペプチドは、CRISPR-Casエフェクタータンパク質(例えば、配列番号50~66または151のいずれか1つのアミノ酸配列を有するCRISPR-Casエフェクタータンパク質)の2つの連続または非連続アミノ酸の間にあってもよく、かつ/またはこれらに(例えば、直接的または間接的に)連結されていてもよい。例えば、操作されたタンパク質は、NからC末端に、第1のCRISPR-Casエフェクターポリペプチド、HNHドメイン、および第2のCRISPR-Casエフェクターポリペプチドを含んでもよく、第1および第2のCRISPR-Casエフェクターポリペプチドは各々、CRISPR-Casエフェクタータンパク質の部分であり、第1のCRISPR-CasエフェクターポリペプチドのC末端の最後のアミノ酸残基、および第2のCRISPR-CasエフェクターポリペプチドのN末端の第1のアミノ酸残基は、CRISPR-Casエフェクタータンパク質の2つの連続または非連続アミノ酸残基である。異種ポリペプチドは、CRISPR-Casエフェクタータンパク質の2つの連続または非連続アミノ酸の一方または双方に直接連結されていてもよい(すなわち、異種ポリペプチドの一方の末端を、CRISPR-Casエフェクタータンパク質の部分であるCRISPR-Casエフェクターポリペプチドの末端に付着するのに、リンカーが用いられない)。一部の実施形態において、異種ポリペプチドは、CRISPR-Casエフェクタータンパク質の2つの連続または非連続アミノ酸の一方または双方に、間接的に(例えば、リンカー、例えばペプチドリンカーを介して)連結されていてもよい。一部の実施形態において、操作されたタンパク質の異種ポリペプチドは、CRISPR-Casエフェクタータンパク質(例えば、配列番号50~66または151のいずれか1つのアミノ酸配列を有するCRISPR-Casエフェクタータンパク質)の2つの連続アミノ酸の間にあってもよく、かつ/またはこれらに(例えば、直接的または間接的に)連結されていてもよい。一部の実施形態において、操作されたタンパク質の異種ポリペプチドは、CRISPR-Casエフェクタータンパク質(例えば、配列番号50~66または151のいずれか1つのアミノ酸配列を有するCRISPR-Casエフェクタータンパク質)の2つの非連続アミノ酸の間にあってもよく、かつ/またはこれらに(例えば、直接的または間接的に)に連結されていてもよい。
一部の実施形態において、2つの連続または非連続アミノ酸は、それぞれ連続または非連続である、アミノ酸残基250、260、270、または280からアミノ酸残基290、300、310、320、330、340、または350までのアミノ酸残基の2つである。一部の実施形態において、異種ポリペプチドは、以下のアミノ酸残基の2つである2つの連続または非連続アミノ酸の間にあってもよいし、かつ/またはこれらに(例えば、直接的または間接的に)連結されていてもよい:CRISPR-Casエフェクタータンパク質(例えば、配列番号50~66または151のいずれか1つのアミノ酸配列を有するCRISPR-Casエフェクタータンパク質)のアミノ酸残基250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、316、317、318、319、320、321、322、323、324、325、326、327、328、329、330、331、332、333、334、335、336、337、338、339、340、341、342、343、344、345、346、347、348、349,および350。一部の実施形態において、操作されたタンパク質の異種ポリペプチドは、CRISPR-Casエフェクタータンパク質(例えば、配列番号50~66または151のいずれか1つのアミノ酸配列を有するCRISPR-Casエフェクタータンパク質)の2つの非連続アミノ酸の間にあってもよく、かつ/またはこれらに(例えば、直接的または間接的に)連結されていてもよく、場合によっては配列番号50~66または151の、2つの非連続アミノ酸残基の一方が、アミノ酸残基270、271、272、273、274、275、276、277、278、279、280、281、282、283、284、または285であり、2つの非連続アミノ酸残基の他方が、アミノ酸残基286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、304、または305である。一部の実施形態において、異種ポリペプチドは、CRISPR-Casエフェクタータンパク質、例えば配列番号50~66または151のいずれか1つのアミノ酸配列を有するCRISPR-Casエフェクタータンパク質のアミノ酸残基290と291、アミノ酸残基291と292、アミノ酸残基292と293、アミノ酸残基293と294、アミノ酸残基320と321、アミノ酸残基321と322、アミノ酸残基339と340、またはアミノ酸残基340と341の間にあり、かつ/またはこれらに(例えば、直接的または間接的に)連結されている。例えば、一部の実施形態において、異種ポリペプチドは、配列番号50のアミノ酸残基290と291;配列番号50のアミノ酸残基291と292;配列番号58のアミノ酸残基291と292;配列番号58のアミノ酸残基292と293;配列番号51のアミノ酸残基320と321;配列番号51のアミノ酸残基321と322;配列番号51のアミノ酸残基322と323;配列番号55のアミノ酸残基339と340;配列番号55のアミノ酸残基340と341;または配列番号50、51、58、もしくは55の1つに対して最適にアラインされている配列についての対応するアミノ酸残基(例えば、配列(例えば配列番号52)が、配列番号50に対して最適にアラインされている場合に、アミノ酸残基291および292に相当するアミノ酸残基)の間にあってもよく、かつ/またはこれらに(例えば、直接的または間接的に)連結されていてもよい。一部の実施形態において、操作されたタンパク質の異種ポリペプチドは、CRISPR-Casエフェクタータンパク質のドメイン間リンカー領域(例えば、2つのドメイン、例えば2つの隣接ドメインの間にある領域)内にあってもよい。一部の実施形態において、異種ポリペプチドは、標的核酸の標的鎖の露出部分に隣接するように、操作されたタンパク質内に配置されていてもよい。
一部の実施形態において、操作されたタンパク質は、ウェッジドメイン、Rec1ドメイン、Rec2ドメイン、PAM相互作用ドメイン、RuvCドメイン、架橋ヘリックス、および/またはNucドメインの全てまたは部分を含み、これらは各々、V型CRISPR-Casエフェクタータンパク質、例えば、Cas12a、Cas12b、および/または配列番号50~66もしくは151のいずれか1つの配列を有するタンパク質由来であってもよい。一部の実施形態において、操作されたタンパク質は、Yamano,Takashi,et al.,Mol Cell 67:633-645(2017)に記載される構造を有するCas12aドメインの全てまたは部分を含む。一部の実施形態において、操作されたタンパク質の異種ポリペプチドは、Rec1ドメインの全てまたは部分についてのポリペプチドと、Rec2ドメインの全てまたは部分についてのポリペプチドとの間にあってよく、これらは各々、V型CRISPR-Casエフェクタータンパク質、例えば、Cas12a、Cas12b、および/または配列番号50~66もしくは151のいずれか1つの配列を有するタンパク質由来であってもよい。一部の実施形態において、異種ポリペプチドの全てまたは部分は、操作されたタンパク質の露出表面またはインターフェースにある。一部の実施形態において、操作されたタンパク質のCRISPR-Casエフェクターポリペプチドは、RuvCドメインの全てまたは部分を含む。当業者であれば理解するように、一部のドメイン(例えば、Cas12aのウェッジドメインおよびRuvCドメイン)は、順番が連続せず、そして2つ以上(例えば、2、3、4つ、またはそれを超える)の非連続配列に分割されていてもよい。例えば、Cas12についてのポリペプチドは、N末端からC末端に、ウェッジドメインの第1の部分(WED-1)、Rec1ドメイン、Rec2ドメイン、ウェッジドメインの第2の部分(WED-2)、PAM相互作用ドメイン(PI)、ウェッジドメインの第3の部分(WED-3)、RuvCドメインの第1の部分(RuvC-1)、架橋ヘリックス、RuvCドメインの第2の部分(RuvC-2)、Nucドメイン、およびRuvCドメインの第3の部分(RuvC-3)を有してもよい。一部の実施形態において、操作されたタンパク質は、活性RuvCドメインの全てまたは部分を含む。一部の実施形態において、操作されたタンパク質は、不活化RuvCドメインの全てまたは部分、場合によってはD10A変異を有する不活化RuvCドメインの全てまたは部分を含む。一部の実施形態において、操作されたタンパク質は、不活化RuvCドメインの全てまたは部分を含み、不活化RuvCドメインの全てまたは部分を含むポリペプチドは、ポリペプチドが配列番号50に対して最適にアラインされている場合に、アミノ酸残基831配列番号50に対応する位置にてアラニンを有し、場合によっては、変異は、D10Aおよび/またはD832A変異と称される。
CRISPR-Casエフェクターポリペプチドは、ヌクレアーゼ、場合によってはRuvC様ヌクレアーゼを含んでもよい。一部の実施形態において、CRISPR-Casエフェクターポリペプチドは、RuvCドメインまたはその部分を含む。一部の実施形態において、CRISPR-Casエフェクターポリペプチドは、Rnase Hスーパーファミリー内のヌクレアーゼを含む。一部の実施形態において、CRISPR-Casエフェクターポリペプチドは、5つのβ鎖を含む(32 145に順序付け)βシートを含んでもよい触媒コアを有するRNase H様酵素を含み、場合によっては、β鎖2は、他のβ鎖に対して逆平行である。両側で、中心βシートは、αヘリックスが側面に位置してもよく、その数は、関連する酵素間で異なってもよい。一部の実施形態において、CRISPR-Casエフェクターポリペプチドは、RNase H様触媒コアを含み、ここでは、活性部位残基は、アスパラギン酸、グルタミン酸、およびヒスチジンの1つまたは複数を含む。一部の実施形態において、RNase H様触媒コアを含むCRISPR-Casエフェクターポリペプチドは、直接的に、または水分子を介して、二価金属イオンの配位に関与する、RNase H様ポリペプチドの活性部位内に、負に帯電した側鎖を含んでもよい。一部の実施形態において、CRISPR-Casエフェクターポリペプチドは、触媒作用の2つのイオン依存性機構を用いるRNase H様触媒コアを含み、場合によっては、イオンは、Mg2+および/またはMn2+である。一部の実施形態において、CRISPR-Casエフェクターポリペプチドは、Majorek KA,et al.Nucleic Acids Res.2014;42(7):4160-4179(その全体が参照によって本明細書に組み込まれる)に記載されるヌクレアーゼおよび/またはRNase H様ヌクレアーゼを含む。
一部の実施形態において、CRISPR-Casエフェクターポリペプチドは、1つまたは複数の(例えば、1、2、3、4つ、またはそれを超える)変異を含む。1つまたは複数の変異は、異種ポリペプチドの活性および/またはCRISPR-Casエフェクターポリペプチドの活性を向上させるか、または修飾することとなってもよい。一部の実施形態において、CRISPR-Casエフェクターポリペプチドは、不活化変異、例えばRuvCドメイン内のD10A変異を含んでもよい。一部の実施形態において、CRISPR-Casエフェクターポリペプチドは、例えば、CRISPR-Casエフェクタータンパク質(例えば、配列番号50~66または151のいずれか1つのアミノ酸配列を有するCRISPR-Casエフェクタータンパク質)のアミノ酸残基243~253の1つまたは複数内の、かつ/または配列GFVTESGEKIK(配列番号122)内の、1つまたは複数の(例えば、1、2、3、4つ、またはそれを超える)変異を含むRec1ドメインの全てまたは部分を含む。一部の実施形態において、CRISPR-Casエフェクターポリペプチドは、ヘアピンおよび/または配列GFVTESGEKIK(配列番号122)を含み、ヘアピンおよび/または配列内のアミノ酸残基の1つまたは複数が変異していてもよい。一部の実施形態において、CRISPR-Casエフェクターポリペプチドは、ヘアピンおよび/または配列GFVTESGEKIK(配列番号122)を含み、ヘアピンおよび/または配列内の全てまたは部分が欠失している。一部の実施形態において、CRISPR-Casエフェクターポリペプチドは、ヘアピンおよび/または配列GFVTESGEKIK(配列番号122)を含み、1、2、3、4、5つ、またはそれを超えるアミノ酸残基が、ヘアピンおよび/または配列の一方または双方の末端に加えられている。
一部の実施形態において、操作されたタンパク質は、NからC末端に、第1のCRISPR-Casエフェクターポリペプチド、HNHドメイン、および第2のCRISPR-Casエフェクターポリペプチドを含み、第1および第2のCRISPR-Casエフェクターポリペプチドは、各々、不活化LbCas12aの部分(例えば、配列番号50の配列を有するLbCas12a)であり、第1のCRISPR-CasエフェクターポリペプチドのC末端の最後のアミノ酸残基および第2のCRISPR-CasエフェクターポリペプチドのN末端の第1のアミノ酸残基は、不活化LbCas12aの2つの連続アミノ酸残基である。HNHドメインは、化膿連鎖球菌Cas9(SpCas9)由来であってもよく、かつ/または配列番号1を含む配列を有してもよい。一部の実施形態において、HNHドメインは、配列番号1または169~174のいずれか1つの配列を有してもよい。HNHドメインは、標的核酸の標的鎖の露出部分に隣接するように、操作されたタンパク質内に配置されていてもよい。操作されたタンパク質は、標的鎖ニッカーゼであってもよい。一部の実施形態において、操作されたタンパク質のみ、標的DNA鎖にニックを入れる。一部の実施形態において、操作されたタンパク質は、標的および非標的鎖ニッカーゼである。
1つまたは複数の(例えば、1、2、3、4つ、またはそれを超える)リンカーは、操作されたタンパク質内に存在してもよい。例えば、リンカーは、CRISPR-Casエフェクターポリペプチドと異種ポリペプチドとの間に存在してもよい。一部の実施形態において、リンカーは、第1のCRISPR-Casエフェクターポリペプチドと異種ポリペプチドとの間に存在してもよく、そしてリンカーは、異種ポリペプチドと第2のCRISPR-Casエフェクターポリペプチドとの間に存在してもよい。例示的なリンカーとして、以下に限定されないが、本明細書中に記載されるものが挙げられる。一部の実施形態において、リンカーは、1~2、3、4、5、6、7、8、9、もしくは10個のアミノ酸を含み、かつ/またはグリシンおよび/もしくはセリンを含む。一部の実施形態において、リンカーは、グリシンおよび/またはセリンである1、2、3、または4つのアミノ酸を含む。一部の実施形態において、操作されたタンパク質は、CRISPR-Casエフェクターポリペプチドと異種ポリペプチドとの間で、リンカーが欠けている。一部の実施形態において、異種ポリペプチドは、CRISPR-CasエフェクターポリペプチドのN末端のアミノ酸残基に、リンカーを介して間接的に連結されており、かつ/または異種ポリペプチドは、CRISPR-CasエフェクターポリペプチドのC末端のアミノ酸残基に、リンカーを介して間接的に連結されている。
一部の実施形態において、異種ポリペプチドは、CRISPR-CasエフェクターポリペプチドのN末端のアミノ酸残基に直接(すなわち、リンカー無しで)連結され、かつ/または異種ポリペプチドは、CRISPR-CasエフェクターポリペプチドのC末端のアミノ酸残基に直接(すなわち、リンカー無しで)連結されている。
操作されたタンパク質は、配列番号2~17、125~132、または157~168のいずれか1つに対して少なくとも70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、またはそれを超える配列同一性を有するアミノ酸配列を含んでもよい。一部の実施形態において、操作されたタンパク質は、配列番号2~17、125~132、または157~168のいずれか1つのアミノ酸配列を含み、かつ/またはこれを有する。操作されたタンパク質は、野生型CRISPR-Casエフェクタータンパク質のアミノ酸配列の全てまたは部分に対して少なくとも70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、またはそれを超える配列同一性を有してもよい。一部の実施形態において、操作されたタンパク質は、配列番号50~66または151のいずれか1つのアミノ酸配列の全てまたは部分に対して少なくとも70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、またはそれを超える配列同一性を有する。一部の実施形態において、操作されたタンパク質は、配列番号50~66または151のいずれか1つのアミノ酸配列の全てまたは部分に対して約70%、75%、または80%~約85%、90%、95%、または98%の配列同一性を有する。
操作されたタンパク質は、CRISPR-Casエフェクタータンパク質(例えば、Cas12a、配列番号50~66もしくは151の配列を有するCRISPR-Casエフェクタータンパク質、および/または野生型CRISPR-Casエフェクタータンパク質)と比較して、効率が上昇し得、例えば、標的核酸の標的鎖および/または非標的鎖にニックを入れる効率が上昇し得る。一部の実施形態において、操作されたタンパク質は、標的核酸の標的鎖にニックを入れる効率が、CRISPR-Casエフェクタータンパク質(例えば、Cas12a、配列番号50~66もしくは151の配列を有するCRISPR-Casエフェクタータンパク質、および/または野生型CRISPR-Casエフェクタータンパク質)と比較して、上昇し得る。一部の実施形態において、操作されたタンパク質は、CRISPR-Casエフェクタータンパク質(例えば、Cas12a、配列番号50~66もしくは151の配列を有するCRISPR-Casエフェクタータンパク質、および/または野生型CRISPR-Casエフェクタータンパク質)による標的核酸内の標的鎖切断の数と比較して、標的核酸内の標的鎖切断の数が増加し得る。一部の実施形態において、操作されたタンパク質は、標的核酸を修飾する効率が、CRISPR-Casエフェクタータンパク質(例えば、Cas12a、配列番号50~66もしくは151の配列を有するCRISPR-Casエフェクタータンパク質、および/または野生型CRISPR-Casエフェクタータンパク質)と比較して、上昇し得る。
操作されたタンパク質を含む組成物、複合体、および系は、本発明の実施形態に従って提供され得る。一部の実施形態において、操作されたタンパク質を含む組成物、複合体、および/または系は、塩基編集組成物、複合体、および/または系であってもよい。本発明の組成物、複合体、および/または系は、ガイド核酸(例えばガイドRNA)および/またはデアミナーゼ(例えば、シトシンデアミナーゼおよび/またはアデニンデアミナーゼ)を含んでもよい。一部の実施形態において、操作されたタンパク質、ガイド核酸、および場合によってはデアミナーゼは、複合体(例えばリボ核タンパク質)を形成するか、または複合体内に含まれる。操作されたタンパク質、ガイド核酸、および場合によってはデアミナーゼは、一緒に天然に存在しなくてもよく、かつ/または操作されたタンパク質、ガイド核酸、および場合によってはデアミナーゼを含む複合体は、一緒に天然に存在しなくてもよい。一部の実施形態において、操作されたタンパク質は、デアミナーゼ(例えば、アデニンデアミナーゼおよび/またはシトシンデアミナーゼ)を含み、かつ/またはこれに融合している。
また、本明細書中で提供されるのは、本発明の操作されたタンパク質を、本発明の核酸分子を含む発現カセットおよび/またはベクターと共にコードする核酸分子である。
一部の実施形態に従えば、標的核酸を、本発明の操作されたタンパク質、ガイド核酸(例えばガイドRNA)、および場合によってはデアミナーゼと接触させることを含む方法が提供される。一部の実施形態において、操作されたタンパク質、ガイド核酸、および/またはデアミナーゼは、複合体を形成するか、または複合体内に含まれる。一部の実施形態において、方法は、標的核酸を修飾し得、かつ/または標的核酸内に1つもしくは複数の一本鎖切断を提供し得る。
一部の実施形態において、操作されたタンパク質を含む組成物、系、方法、および/または複合体は、CRISPR-Casエフェクタータンパク質(例えば、Cas12a、配列番号50~66もしくは151の配列を有するCRISPR-Casエフェクタータンパク質、および/または野生型CRISPR-Casエフェクタータンパク質)を含む組成物、系、方法、および/または複合体と比較して、効率が上昇し得る。一部の実施形態において、標的鎖ニッカーゼである操作されたタンパク質を含む組成物、系、方法、および/または複合体は、CRISPR-Casエフェクタータンパク質(例えば、Cas12a、配列番号50~66もしくは151の配列を有するCRISPR-Casエフェクタータンパク質、および/または野生型CRISPR-Casエフェクタータンパク質)を含む組成物、系、方法、および/または複合体と比較して、効率が上昇し得る。これは、標的鎖にニックを入れることにより、ゲノム編集ツール、例えば塩基エディタおよび/または塩基ダイバーシファイアーの効率を上昇させ得るからであるかもしれない。一部の実施形態において、操作されたタンパク質を含む組成物、系、方法、および/または複合体は、CRISPR-Casエフェクタータンパク質(例えば、Cas12a、配列番号50~66もしくは151の配列を有するCRISPR-Casエフェクタータンパク質、および/または野生型CRISPR-Casエフェクタータンパク質)を含む組成物、系、方法、および/または複合体による標的核酸内の標的鎖切断の数と比較して、標的核酸内の標的鎖切断の数を増加させ得る。
操作されたタンパク質、ならびに/または操作されたタンパク質を含む組成物、系、方法、および/もしくは複合体は、CRISPR-Casエフェクタータンパク質(例えば、Cas12a、配列番号50~66もしくは151の配列を有するCRISPR-Casエフェクタータンパク質、および/または野生型CRISPR-Casエフェクタータンパク質)と、かつ/またはCRISPR-Casエフェクタータンパク質(例えば、Cas12a、配列番号50~66もしくは151の配列を有するCRISPR-Casエフェクタータンパク質、および/または野生型CRISPR-Casエフェクタータンパク質)を含む組成物、系、方法、および/もしくは複合体と比較して、インデルサイズおよび/もしくは組成の向上もしくは改変、標的核酸内の欠失サイズの向上もしくは改変、いずれかの鎖(すなわち、標的核酸の標的または非標的鎖)へのニッキング能力の向上もしくは改変、ならびに/またはヌクレアーゼ活性の増大を実現し得る。一部の実施形態において、操作されたタンパク質、ならびに/または操作されたタンパク質を含む組成物、系、方法、および/もしくは複合体は、触媒的に不活化されたCRISPR-Casエフェクタータンパク質上にヌクレアーゼ機能を与える。一部の実施形態において、操作されたタンパク質、ならびに/または操作されたタンパク質を含む組成物、系、方法、および/もしくは複合体は、Casエフェクタータンパク質(例えば、Cas12a、配列番号50~66もしくは151の配列を有するCRISPR-Casエフェクタータンパク質、および/または野生型CRISPR-Casエフェクタータンパク質)、ならびに/またはCRISPR-Casエフェクタータンパク質(例えば、Cas12a、配列番号50~66もしくは151の配列を有するCRISPR-Casエフェクタータンパク質、および/または野生型CRISPR-Casエフェクタータンパク質)を含む組成物、系、方法、および/もしくは複合体についての標的核酸の編集プロファイルおよび/または様々な切断パターンと比較して、標的核酸についての様々な編集プロファイルおよび/または様々な切断パターンを提供する。
一部の実施形態において、本発明の方法は、対照方法(例えば、標的核酸を、CRISPR-Casエフェクタータンパク質(例えば、Cas12a、配列番号50~66もしくは151の配列を有するCRISPR-Casエフェクタータンパク質、および/または野生型CRISPR-Casエフェクタータンパク質)と接触させることを含み、かつ/または操作されたタンパク質を欠く方法)の効率と比較して、標的核酸を改変する効率が上昇し得る。
本明細書中に記載されるように、本発明の操作されたタンパク質、核酸、発現カセット、および/またはベクターは、生物における発現のためにコドン最適化されていてもよい。本発明に有用な生物は、核酸修飾が有用であり得るあらゆる生物またはその細胞であってよい。生物として、以下に限定されないが、あらゆる動物(例えば哺乳動物)、あらゆる植物、あらゆる真菌、あらゆる古細菌、またはあらゆる細菌が挙げられ得る。一部の実施形態において、生物は、植物またはその細胞であってもよい。一部の実施形態において、生物は、動物、例えば哺乳動物(例えばヒト)である。
標的核酸は、あらゆる生物(例えば真核生物、例えば、哺乳動物または植物)由来のゲノム配列であってもよい。一部の実施形態において、標的核酸は、以下に限定されないが、大腸菌、不死化ヒト細胞株(例えば、HEK293、HeLa、その他)、線虫(Caenorhabditis elegans)、および/またはキイロショウジョウバエ(Drosophila Melanogaster)等のモデル生物由来のゲノム配列である。一部の実施形態において、標的核酸は、非モデル生物由来のゲノム配列である。例示的な非モデル生物として、以下に限定されないが、作物植物(例えば、果実作物植物、蔬菜作物植物、および/または農作物植物)ならびに/または動物、例えば、ヒト、霊長類、および/もしくはマウスが挙げられる。一部の実施形態において、非モデル生物は、作物植物、例えば、トウモロコシ、ダイズ、コムギ、またはキャノーラである。一部の実施形態において、非モデル生物は、ヒト治療薬を試験するための、かつ/またはこれに用いられる動物である。
あらゆる植物または植物部分の標的核酸が、本発明の核酸構築体を用いて修飾され得る。被子植物、裸子植物、単子葉植物、双子葉植物、C3、C4、CAM植物、蘚苔門の植物、シダおよび/もしくはシダ綱以外のシダ、微細藻類、ならびに/または大型藻類が挙げられるあらゆる植物(または、例えば、属もしくはより高次の分類への植物のグループ化)が、本発明の操作されたタンパク質を用いて修飾され得る。本発明に有用な植物および/または植物部分は、あらゆる植物種/変種/品種の植物および/または植物部分であってよい。本明細書中で用いられる用語「植物部分」は、以下に限定されないが、胚、花粉、胚珠、種子、葉、幹、シュート、花卉、枝、果実、仁、穂、コッブ、外皮、茎、根、根端、葯、植物細胞(植物および/または植物の部分において無傷の植物細胞、植物プロトプラスト、植物組織、植物細胞組織培養体、植物カルス、植物塊等が挙げられる)が挙げられる。本明細書中で用いられる「シュート」は、葉および幹を含む地上部を指す。さらに、本明細書中で用いられる「植物細胞」は、植物の構造的生理学的単位を指し、これは、細胞壁を含み、そしてまたプロトプラストを指し得る。植物細胞は、単離された単一の細胞の形態であってもよいし、培養された細胞であってもよいし、より高度に組織化された単位、例えば植物組織または植物器官の一部であってもよい。
本発明に有用な植物の非限定的な例として、芝草(例えば、ブルーグラス、ベントグラス、ライグラス、ウシノケグサ属)、ウモウヨシ、ヒロハノコメススキ、ススキ属、ダンチク属、スイッチグラス、蔬菜作物(アーティチョーク、コールラビ、キバナスズシロ、ニラネギ、アスパラガス、レタス(例えば、サラダ菜、リーフレタス、タチチシャ)、マランガ、メロン(例えば、マスクメロン、スイカ、クレンショーメロン、ハネデューメロン、カンタロープ)、アブラナ属作物(例えば、メキャベツ、キャベツ、カリフラワー、ブロッコリー、コラード、ケール、ハクサイ、パクチョイ)、カルドニ(cardoni)、ニンジン、ハクサイ、オクラ、タマネギ、セロリ、パセリ、ヒヨコマメ、パースニップ、チコリ、コショウ、ジャガイモ、ウリ科植物(例えば、マロウ、キュウリ、ズッキーニ、スカッシュ、カボチャ、ハネデューメロン、スイカ、カンタロープ)、ハツカダイコン、乾球タマネギ、ルタバガ、ナス、セイヨウゴボウ、キクヂシャ、エシャロット、エンダイブ、ニンニク、ホウレンソウ、ネギ、スカッシュ、グリーン、ビート(シュガービートおよび飼料ビート)、サツマイモ、フダンソウ、セイヨウワサビ、トマト、カブ、およびスパイスが挙げられる)、果実作物、例えば、リンゴ、アプリコット、チェリー、ネクタリン、モモ、西洋ナシ、プラム、プルーン、チェリー、マルメロ、イチジク、ナッツ(例えば、クリ、ペカン、ピスタチオ、ヘイゼルナッツ、ピスタチオ、ピーナッツ、クルミ、マカダミアナッツ、アーモンド等)、柑橘類(例えば、クレメンタイン、キンカン、オレンジ、グレープフルーツ、タンジールミカン、ミカン、レモン、ライム等)、ブルーベリー、ブラックラズベリー、ボイゼンベリー、クランベリー、カランツ、グズベリー、ローガンベリー、ラズベリー、ストロベリー、ブラックベリー、ブドウ(ワイン用および食用)、アボカド、バナナ、キーウィ、柿、ザクロ、パイナップル、トロピカルフルーツ、梨状果、メロン、マンゴー、パパイア、およびライチ、農作物植物、例えば、クローバー、アルファルファ、チモシー、マツヨイグサ、メドウフォーム、トウモロコシ(飼料用、スイートコーン、ポップコーン)、ホップ、ホホバ、ソバ、ベニバナ、キノア、コムギ、イネ、オオムギ、ライムギ、キビ、モロコシ、エンバク、ライコムギ、モロコシ、タバコ、カポック、マメ科植物(インゲンマメ(例えば、サヤインゲンおよび乾燥インゲンマメ)、レンズマメ、エンドウ、ダイズ)、油料植物(ナタネ、キャノーラ、マスタード、ポピー、オリーブ、ヒマワリ、ココナッツ、ヒマシ油植物、カカオ豆、落花生、アブラヤシ)、ウキクサ、シロイヌナズナ属、繊維植物(ワタ、アマ、アサ、ジュート)、カンナビス(例えば、アサ(Cannabis sativa)、インド麻(Cannabis indica)、およびカンナビス・ルデラリス(Cannabis ruderalis))、クスノキ科(シナモン、カンファー)、もしくはコーヒー、サトウキビ、チャ、および天然ゴム植物等の植物、ならびに/または花壇用花卉、例えば、顕花植物、サボテン、多肉植物、および/もしくは観賞植物(例えば、バラ、チューリップ、スミレ)、ならびに樹木、例えば森林樹木(広葉樹および常緑植物、例えば針葉樹、例えば、ニレ、トネリコ、オーク、カエデ、モミ、トウヒ、スギ、マツ、カバノキ、イトスギ、ユーカリノキ、ヤナギ)、ならびに潅木および他の苗木が挙げられる。一部の実施形態において、本発明の核酸構築体、ならびに/または同上をコードする発現カセットおよび/もしくはベクターは、トウモロコシ、ダイズ、コムギ、キャノーラ、イネ、トマト、コショウ、ヒマワリ、ラズベリー、ブラックベリー、ブラックラズベリー、および/またはチェリーを修飾するのに用いられ得る。
一部の実施形態において、本発明は、本発明のポリペプチド、ポリヌクレオチド、核酸構築体、発現カセット、またはベクターを含む細胞(例えば、植物細胞、動物細胞、細菌細胞、古細菌細胞等)を提供する。
本発明はさらに、本発明の方法を実行するためのキットを含む。本発明のキットは、標的核酸を修飾するのに適切な、混合、測定、ソーティング、標識その他用の試薬、バッファ、および装置、ならびに説明書等を含み得る。
一部の実施形態において、本発明は、本発明の1つもしくは複数の核酸構築体を含むキット、ならびに/または本明細書中に記載される同上を含む発現カセットおよび/もしくはベクターおよび/もしくは細胞を、場合によってはその使用説明書と共に提供する。一部の実施形態において、キットはさらに、CRISPR-Casガイド核酸(本発明のポリヌクレオチドによってコードされていてもよい、操作されたタンパク質に対応する)、ならびに/または同上を含む発現カセットおよび/もしくはベクターおよび/もしくは細胞を含んでもよい。一部の実施形態において、ガイド核酸は、本発明の1つまたは複数の核酸構築体と同じ発現カセットおよび/またはベクター上に提供されてもよい。一部の実施形態において、ガイド核酸は、本発明の1つまたは複数の核酸構築体を含むものとは別個の発現カセットまたはベクター上に提供されてもよい。
したがって、一部の実施形態において、(a)本明細書中で提供されるポリヌクレオチド、および(b)(a)のポリヌクレオチドの発現を駆動するプロモーターを含む核酸構築体を含むキットが提供される。一部の実施形態において、キットはさらに、ガイド核酸をコードする核酸構築体を含んでもよく、構築体は、標的核酸配列と同一であるか、またはこれと相補的な核酸配列の、ガイド核酸の骨格中へのクローニング用のクローニング部位を含む。
一部の実施形態において、本発明の核酸構築体は、コードされるポリヌクレオチド内に1つまたは複数のイントロンをコードしていてもよいmRNAであってもよい。一部の実施形態において、本発明の核酸構築体、ならびに/または同上を含む発現カセットおよび/もしくはベクター構築体はさらに、形質転換体を識別するのに有用な1つまたは複数の選択マーカー(例えば、抗生物質耐性遺伝子、除草剤耐性遺伝子等をコードする核酸)をコードしていてもよい。
本発明のポリペプチド、ポリヌクレオチド、核酸構築体、発現カセット、ベクター、組成物、キット、系、および/または細胞は、配列番号1~175の1つまたは複数の配列の全てまたは部分を含んでもよい。一部の実施形態において、本発明のポリペプチド、ポリヌクレオチド、核酸構築体、発現カセット、ベクター、組成物、キット、系、および/または細胞は、配列番号1~175の1つまたは複数の配列の少なくとも約20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、またはそれを超える連続アミノ酸を含んでもよい。
次に、本発明を、以下の実施例を参照して説明する。これらの実施例は、特許請求の範囲を本発明に限定することは意図されず、むしろ特定の実施形態の例示となることが意図されることが認識されるべきである。当業者が思い浮かべる、例示される方法におけるあらゆる変形が、本発明の範囲に入ることが意図される。
[実施例1]
既存のドメイン注釈を、PyMOL(The PyMOL Molecular Graphics System,Version 2.0.Schrodinger,LLC)内のSpCas9結晶構造(PDB ID 4UN3)の目視検査と共に用いて、SpCas9由来の完全HNHドメイン(図3)を最初に特定して、その残基境界を決定した。ドメインは、結晶構造が大部分解かれているが、HNHドメインのN末端をRec1ドメインに連結するいくつかの残基は、結晶構造が解かれていない。また、HNHドメインと比較したCas9標的DNA鎖切断部位の位置に注目した。この相対配向を、Cas12aの標的DNA鎖と比較した、HNHドメインの以降の合理的な位置決めにおいて、模倣した。
次に、LbCas12a三元複合体(PDB ID 5XUS)の結晶構造を調べて、標的DNA鎖のアクセス可能領域の位置決めをした。標的DNA/crRNAデュプレックスの、RuvCドメインに最も近い側が、他のCas12aドメインによってかなり遮蔽されているが、Rec1ドメインとRec2ドメインとの間のインターフェースにて(図4)、タンパク質の反対側に、標的DNAの露出部分(図4内で左の矢印によって示す)が存在する。2つのドメインを連結するリンカー(図4内で右の矢印によって示す)が、この露出部位に隣接しており、LbCas12a内の他の残基との相互作用はごく少数である。当該リンカーを、ドメイン挿入のための候補部位として選択した。
次に、LbCas12aと比較したSpCas9 HNHドメインの正確な配置を決定するために、LbCas12aのRec1ドメインとRec2ドメインとの間の溝内に露出するDNA塩基を特定した。続いて、HNHドメインおよびその標的DNA(切断部位の両側の2つの塩基を有する4つの塩基)をユニットとして扱って、HNH標的DNAの、LbCas12aの露出標的鎖へのアラインメントを、HNHドメインを挿入ループの近くに配置して、LbCas12aの他のドメインとの衝突を最小にするアラインメントが特定されるまで、PyMOLを用いてスライディングウィンドウ内で試験した。続いて、HNHドメインの位置を、PyMOLを用いてマニュアルで調整して、HNHとCas12aとの間の衝突を最小にした。
HNHドメインの最終の選択位置を図5に示す。HNHドメインのC末端は、挿入ループのC末端に非常に近い一方、HNH N末端は、挿入ループから比較的遠い。しかしながら、この構造は、SpCas9 Rec1ドメインおよびHNHドメインを連結する、構造化されていない残基を含まない。標的DNA/crRNAデュプレックスと相互作用するこの領域内の高度に保存されたヘアピンを、後の設計のための潜在的部位としてさらに特定した。
計算リンカーモデリングのためのCas12a-HNH融合構造を調製するために、HNHドメインのN末端を最初に、PyMOLを用いて、Rec1ドメインおよびHNHドメインを連結する(そして、SpCas9結晶構造が解かれていない)SpCas9から、残基を追加することによって伸長させた。結果として生じた構造を、表1内に示す挿入ループの至る所にある考えられる挿入部位中にHNHドメイン残基を挿入するカスタムPythonスクリプトを用いて、リンカーモデリングのためにエクスポートして調製した。
続いて、Rosetta巨大分子モデリングソフトウェアパッケージ内に含まれるRosetta Remodelプロトコール(Huang P.S.et al 2011)を用いて、迅速な計算スクリーンを実行して、リンカー切断部位の2つの末端に連結するHNHドメイン末端の能力を試験した。挿入点毎に、ループ閉鎖の10回の繰返し(配列設計も挿入もない)を実行した。10回の繰返しのうち、リンカーが首尾よく連結することができる回数を集計して、比較した(表1)。続いて、これらの挿入部位のうちの2つを、成功したループ閉鎖および手動の検査の速度の組合せに基づいて、リンカー長の変動を含む、より徹底的なリンカーモデリングについて選択した(表1内でボールド体で示す)。
続いて、2つの選択した挿入部位について、細粒試験(fine-grained testing)を、N末端リンカーおよびC末端リンカー内の小さな(2~4残基)グリシン-セリン挿入または欠失により、そしてより徹底的なサンプリング(各々100回の繰返し)により実行した。欠失用の考えられる残基を、配列の手動検査に基づいて選択した。リンカーモデリング結果に基づいて、N末端リンカーの0、2、または4残基の伸長部、およびC末端リンカーの0または2残基の伸長部を含む、8つの設計(挿入部位毎に4つ)を、実験的試験について選択した。
[実施例2]
8つのLbCas12a-HNH構築体(HNH-3287、HNH-3288、HNH-3289、HNH-3290、HNH-3296、HNH-3297、HNH-3298、およびHNH-3299)についてのDNAコード領域を、固相合成を用いて6-ヒスチジンタグと共に合成した。コード領域を、pET28aプラスミド(Novagen)に、誘導性T7プロモーターの後方に円錐形にして、BL21(DE3)-Star細胞(Invitrogen)中に形質移入して、カナマイシン上にプレーティングした。単一のコロニーを、30mlのLuria Broth中で37℃にて、0.5のA600光学濃度まで増殖させた。500mM IPTGを加えて、18時間の発現のために、温度を18℃に下げた。細胞をペレット化して、BugBuster Master Mix(Millipore)と共に、メーカーの指示に従って溶解させた。細胞片をペレット化して、可溶性の画分を、4~12%Bis-Tis PAGEゲル(Invitrogen)上で、還元条件下で画像化して、クマシー染色を用いて視覚化した。8つのHNH構築体は全て、おおよそ160kDaのMWにて、可溶性のタンパク質発現を示した(図6、矢印)。
Cas12aタンパク質の中央にHNHヌクレアーゼを含有する8つの構築体全てについての可溶性タンパク質発現は、融合設計の質に言及する。タンパク質の中央への大きなドメインの挿入により、多くの場合、不溶性のタンパク質発現が生じ、または大腸菌内での発現が生じない。高度に発現されている8つのタンパク質全ての観察は、キメラタンパク質が適切に折り畳まれていること、そしてタンパク質折畳みの破壊に至っていないことを示唆している。
発現プロトコールを反復して、ヌクレアーゼアッセイに適したタンパク質を生成した。8つの構築体をペレット化した後に、大腸菌細胞を凍結して、解凍して、バッファA(20mM HEPES-KOH pH7.5、500mM NaCl、10%グリセロール、2mM TCEP、および10mMイミダゾールpH7.5)中に懸濁させた。0.3mg/mlリゾチームを加えて、細胞を室温にて20分間インキュベートしてから、1/8インチチップ、25%の力、10秒のバーストの後に30秒の静置、2.25分間による超音波処理(QSonica)を続ける。細胞片をペレット化して、上清をNi-NTAアガロース(Bio-Rad)上にロードして、バッファA中20mMイミダゾールで洗浄して、バッファA中300mMイミダゾールで溶出した。タンパク質のおおよその濃度は、200μLの総溶出液中0.5~2mg/ml(NanoDrop A280吸光度によって推定)であった。
[実施例3]
プラスミドベースのアッセイを用いて、ニッキング活性を、精製したHNH-3287、HNH-3288、HNH-3289、HNH-3290、HNH-3296、HNH-3297、およびHNH-3298によって評価した。プラスミドニッキングアッセイは、細菌から抽出したスーパーコイルプラスミドが、アガロースゲル上で、線状化ダブルカットプラスミドよりも短く泳動されるという原理に基づいて、機能する。さらに、1つの鎖のみにニックが入れられれば、プラスミドは、線状化プラスミドよりもずっと長く泳動される。このアッセイは、酵素が二本鎖ヌクレアーゼまたは一本鎖ヌクレアーゼであるかを評価するのに、CRISPR分野において広範囲にわたって用いられている(Jinek et al.,Science.2012 Aug 17;337(6096):816-21)(Zetsche et al.,Cell.2015 Oct 22;163(3):759-71)。
配列5'-TTTAGGAAT CCCTTCTGC AGCACCTGG-3'(配列番号123)(プロトスペーサー隣接モチーフ(PAM)はボールド体である)を合成して、pUC18プラスミド中にクローニングした。プラスミドをDH5α細胞内で発現させて、プラスミドミニプレップキット(Qiagen)を用いて精製した。配列5'-AAUUUCUACU AAGUGUAGAU GGAAUCCCUU CUGCAGCACC UGG-3'(配列番号124)(プラスミドに賞賛的な部分を太字にしている)によるいかなる化学修飾もないCRISPR RNA分子を合成した(Synthego)。30μLの反応液を、10:10:1のRNA:タンパク質:プラスミド比でアセンブルして、37℃にて15分間インキュベートして、85℃にて2分間熱不活化して、1/100v/vSYBR-Safe染料(Invitrogen)を含有する1%アガロースゲル上にロードした。
試験したタンパク質は、野生型LbCas12a(wtLbCas12a)、LbCas12a-R1138A、および種々のキメラHNHタンパク質であった。R1138Aは、AsCas12a(R1226A)についての知られている非鋳型鎖ニッカーゼ変異に対応するLbCas12a内の点変異である(Yamano T,et al.Cell.2016 May 5;165(4):949-62)。試験した濃度は、wtLbCas12aおよびLbCas12a-R1138について、33nMであった。より低い9nMを、種々のHNH構築体に用いて、完全なニッキングを生成するのではなく、予想されるKdに幾分近いことによって、最も活性なヌクレアーゼを見分けた。
結果として生じたゲル(図7)は、HNH-3287、HNH-3288、HNH-3289、HNH-3290、HNH-3296、HNH-3297、およびHNH-3298が全て、低い9nMタンパク質濃度にて約25%効率~約75%効率(上部のバンド、ニックを入れられたプラスミドを、下部のバンド、スーパーコイルプラスミドと比較)であるニッキングのパーセンテージを有するニッカーゼであることを示している。インキュベーションが長いほど、または濃度が高いほど、ニッキングは完全になるが、相対的変異活性の比較はできない。キメラHNH-3298は、ニッキング活性のパーセンテージが最も高いようであり、37℃にて15分間で9nM[タンパク質]である。
[実施例4]
方法
タンパク質の発現および精製
発現および活性の最初の試験について、Hisタグ付けしたタンパク質、SYN3287(配列番号125)、SYN3288(配列番号126)、SYN3289(配列番号127)、SYN3290(配列番号128)、SYN3296(配列番号129)、SYN3297(配列番号130)、SYN3298(配列番号131)、およびSYN3299(配列番号132)、を、30mL培養液中のBL21細胞内で発現させた。各タンパク質は、活性HNHドメインおよび不活化RuvCドメインを含んだ。細胞をペレット化して、一晩中凍結させて、超音波処理によって溶解した。続いて、HisPur(商標)Ni-NTAスピンカラムを用いて、タンパク質を溶解液から粗精製した。
SYN3298およびSYN3289のアッセイについて、タンパク質を、以下の変化を伴って同じように発現させた:タンパク質を、1L培養液中で発現させて、HisTrap-HFカラムを用いてFPLCによって精製した。注目するタンパク質を含有する画分を、陽イオン交換によってさらに精製して、50%グリセロール中で貯蔵した。
プラスミドニッカーゼアッセイ
ニッカーゼまたはヌクレアーゼとしての精製タンパク質の活性を判定するために、1×NEバッファ3.1、100フェントモルのDNA基質、ならびに等部の精製タンパク質および適切なガイドRNA(特に明記しない限り、各々1ピコモル)を含有する30μL反応液を調製した。反応を、37℃にて30分間インキュベートして、室温にて20分のプロテイナーゼK消化によって止めて、1%アガロースゲル上で分離した。プラスミドニッカーゼアッセイ用の標的部位は、配列番号133の配列を有した。
蛍光ニッカーゼアッセイ
1つの標識DNA鎖(配列番号134)および1つの非標識DNA鎖(配列番号135)を、Cy5で標識した基質を生成するために、PAM含有鎖または非PAM含有鎖上にアニーリングすることによって、DNA基質を生成した。このアッセイ用のスペーサーは、配列番号150の配列を含んだ。ニッキング反応を、プラスミドニッカーゼアッセイについて記載したように調製して、37℃にて30分間インキュベートした。プロテイナーゼKにより試料を10分間消化することによって、反応を止めた。続いて、全ての試料を、尿素ローディングバッファと混合して、1×濃度にして、90℃まで5分間加熱して、基質を変性させた。6%TBE尿素ゲル上で4℃、100Vにて泳動することによって、試料を分離した。
HEK293T細胞形質移入
真核HEK293T(ATCC CRL-3216)細胞を、10%(v/v)FBS(FBS)を補充したダルベッコ改変イーグル培地プラスGlutaMax(ThermoFisher)内で、5%CO、37℃にて培養した。タンパク質構成要素を、遺伝子合成を用いて合成してから、CMVプロモーターを有するプラスミドにクローニングした。ガイドRNAを、ヒトU6プロモーターによりクローニングした。HEK293T細胞を、48ウェルコラーゲンコーティングBioCoatプレート(Corning)上に播種した。細胞を、約70%のコンフルエンシーにて形質移入した。375ngのCRISPRプラスミドおよび125ngのガイドRNA発現プラスミドを、メーカーのプロトコールに従って、ウェルあたり1.5μlのリポフェクタミン3000(ThermoFisher Scientific)を用いて形質移入した。形質移入した細胞由来のゲノムDNAを3日後に得て、高スループットIlluminaアンプリコン配列決定を用いて、インデルを検出して定量化した。
設計したタンパク質がどの鎖に優先的にニックを入れるかを判定するために、Cas9ガイド、および同じ鎖上の設計したタンパク質のためのガイドが、互いの近くで(約10bp以内)切れるように、ガイドの対を設計した。試験した各設計が、ヌクレアーゼデッドSpCas9、SpCas9 D10A標的鎖ニッカーゼ、またはSpCas9 H840A非標的鎖ニッカーゼと対形成した。合成ニッカーゼおよびその対形成したCas9ニッカーゼが反対側の鎖を切るならば、二本鎖切断の生成に起因して、同じ鎖を切る場合よりも大きな編集頻度が予想された。
結果
Hisタグ付けした設計合成ニッカーゼは、BL21大腸菌内で首尾よく発現された。
先に述べたように設計したニッカーゼの粗精製後、全ての試料は、図8に示すような予想されるサイズ(約160kDa)にてバンドを示した。このことは、ニッカーゼが大腸菌内で可溶性で発現されたことを示している。
合成ニッカーゼの粗精製から観察された、最初のプラスミドニッキング活性。
プラスミドニッカーゼアッセイを、図8に示す粗ニッカーゼ精製を用いて、先の方法の節に記載するように実行した。一部の精製からの収量が低いことに起因して、設計した全てのニッカーゼを、直接的に比較することができるような低い濃度にて試験した。図9において分かるように、設計の1つの他は全て、陰性対照試料におけるよりも顕著な、ニックが入ったプラスミドの存在を示すバンドを示した。このことは、設計が、DNA基質にニックを入れることができることを示唆している。
粗精製した合成ニッカーゼを用いるプラスミドニッキングのRNA依存性。
プラスミドの観察されたニッキングおよび切断が、ガイド依存性であり、かつランダムなヌクレアーゼ活性に起因しなかったことを確実にするために、プラスミドニッカーゼアッセイを、標的化crRNAの存在下での選択した設計について、反復した。設計SYN3288、SYN3296、およびSYN3298は全て、図10において分かるように、crRNAの存在下で、存在する非切断プラスミドの量の引下げを示した。このことは、これらのヌクレアーゼ活性がRNA依存性であることを示している。
精製した合成ニッカーゼSYN3298のプラスミドニッキング活性。
様々な量のタンパク質+ガイドを、用いたLbCas12a対照の濃度(例えば、30×は、30ピコモルのタンパク質およびガイドが、反応液内に含まれることを示す)と比較して試験した。プラスミドのニッキング、およびそれほどではないにせよ切断を、SYN3298の全ての試験した濃度にて観察した(図11)。このことは、この設計がDNAニッカーゼとしての機能を果たすことを確認している。
精製した合成ニッカーゼSYN3298およびSYN3289を用いる蛍光ニッカーゼアッセイ。
標的(図12)または非標的(図13)上の蛍光Cy5標識を有する基質を、設計したニッカーゼ(活性HNHドメインおよび不活化RuvCドメインを含む)、LbCas12a、またはLbCas12a R1138A変異体(非標的鎖ニッカーゼ)とインキュベートして、変性TBE-尿素ゲル上で分離した。標識バンドの位置のシフトは、その鎖が切断されたことを示している。図14は、標識標的鎖とインキュベートした試料についてのゲルの部分を示し、図15は、標識非標的鎖とインキュベートした試料についてのゲルの部分を示し、図16は、対照、標識標的鎖とインキュベートした試料(「a」と表す囲まれたレーン)、および標識非標的鎖とインキュベートした試料(「b」と表す囲まれたレーン)についてのレーンを有するゲル全体を示す。SYN3298は、非標的DNA鎖ではなく標的DNA鎖用の切断基質について予想される位置のバンドを示す。このことはこれが、標的鎖ニッカーゼとしての機能を果たすことを示している。
HEK293T細胞内のゲノムDNAの配列ベースの鎖特異的ニッカーゼアッセイ。
合成ニッカーゼを、標的鎖(例えばCas9(D10A))または非標的鎖(例えばCas9(H840A))を切る、直ぐ近くのCas9ニッカーゼ(例えばCas9(H840A)またはCas9(D10A))と共に同時形質移入した。配列ベースの鎖特異的ニッカーゼアッセイに用いたスペーサーに関する情報を、表2に記載する。上流のガイドは、どのスペーサーがPAM含有DNA鎖の5’末端のより近くで切れると予想されるかについて言及する。切られた部位間の推定距離を、固有のヌクレアーゼドメイン毎の予測切断部位に基づいて決定した。
Cas9ニッカーゼが、同じ標的部位にてヌクレアーゼデッドLbCas12aと対形成した場合のインデルの観察レベルに対して、酵素対毎の編集効率を正規化した(図17)。図17における括弧内の数字は、正規化の前に観察された編集効率を示す。合成酵素(SYN)(すなわち、SYN3289、SYN3290、またはSYN3298)が優先的に標的鎖を切るならば、(H480A::SYN)/(D10A::SYN)>1である。合成酵素(SYN)(すなわち、SYN3289、SYN3290、またはSYN3298)が優先的に非標的鎖を切るならば、(H480A::SYN)/(D10A::SYN)<1である。
設計したタンパク質がどの鎖に優先的にニックを入れるかを判定するために、Cas9ガイド、および同じ鎖上の設計したタンパク質のためのガイドが、互いの近くで(約10bp以内)切れるように、ガイドの対を設計した。試験した各設計が、ヌクレアーゼデッドSpCas9、SpCas9 D10A標的鎖ニッカーゼ、またはSpCas9 H840A非標的鎖ニッカーゼと対形成した。合成ニッカーゼおよびその対形成したCas9ニッカーゼが反対側の鎖を切るならば、二本鎖切断の生成に起因して、同じ鎖を切る場合よりも大きな編集頻度が見られると予想された。インデル頻度の増大(約3倍の増大)は、全ての設計したニッカーゼが、Cas9非標的鎖ニッカーゼと対形成された場合に、Cas9標的鎖ニッカーゼと比較して、一貫して観察された。このことは、設計されたニッカーゼが、標的DNA鎖を優先的に切ることを示している。
[実施例5]
A3Aシトシンデアミナーゼ(配列番号152)を、SYN3289、SYN3290、またはSYN3298と組み合わせる塩基エディタのためのシトシン塩基編集データを得た(図18~21)。3つのアーキテクチャを、酵素毎に試験した:配列番号160~162を提供するための、リンカー(配列番号22)を用いた合成酵素のN末端へのA3Aの融合、および配列番号45のリンカーを用いた合成酵素のC末端へのUGI(配列番号104)の融合;配列番号163~165を提供するための、以前に公開されたリンカー(配列番号153;Li et al. Nat Biotechnol 36,324-327(2018))を用いた合成酵素のN末端へのA3Aの融合、および配列番号154のリンカーを用いた合成酵素のC末端へのUGI(配列番号104)の融合;または配列番号157~159の1つのペプチドタグ付けした合成酵素に動員される配列番号156を提供するための、A3A(配列番号152)のC末端に融合したUGI(配列番号104)のSuntagベースの動員。図18~21に示す全てのパーセンテージは、3つのデータポイントの全体にわたる平均を示す。試験した酵素は全て、試験した構成の3つ全てにおけるシトシン塩基編集を示した。図18についてのスペーサーは、配列番号144であり、図19についてのスペーサーは、配列番号145であり、図20についてのスペーサーは、配列番号146であり、図21についてのスペーサーは、配列番号147であった。
[実施例6]
TadA8eアデニンデアミナーゼへのN末端融合体としての合成酵素SYN3289、SYN3290、およびSYN3298についてのアデニン塩基編集データを得た(図22~23)。配列番号166~168を提供するためのリンカー(配列番号47)を用いて、合成酵素をTadA8e(配列番号155)に融合させた。図22~23に示す全てのパーセンテージは、3つのデータポイントの全体にわたる平均を示す。試験した3つの設計は全て、TadA8eと融合した場合のアデニン塩基編集活性を示した。図22についてのスペーサーは、配列番号148であり、図23についてのスペーサーは、配列番号149であった。
前述のものは、本発明の実例であり、その限定と解釈されるべきでない。本発明は、以下の特許請求の範囲によって定義され、特許請求の範囲の均等物もその中に含まれるべきである。

Claims (74)

  1. 少なくとも2つの異なるポリペプチドを含む操作されたタンパク質であって、
    前記少なくとも2つの異なるポリペプチドの一方が、第1のV型CRISPR-Casエフェクタータンパク質の第1の部分である第1のCRISPR-Casエフェクターポリペプチドであり、前記第1のCRISPR-Casエフェクターポリペプチドは、ヌクレアーゼドメインが欠けており;
    前記少なくとも2つの異なるポリペプチドのもう1つが、前記第1のV型CRISPR-Casエフェクタータンパク質に対して異種であり、かつV型CRISPR-Casエフェクタータンパク質の部分でない異種ポリペプチドである、
    操作されたタンパク質。
  2. 前記異種ポリペプチドが、約10~約200アミノ酸長を有し、かつ/または前記第1のCRISPR-Casエフェクターポリペプチドが、約100~約400アミノ酸長を有し、場合によっては、前記異種ポリペプチドが、約140~約160アミノ酸長を有し、かつ/または前記第1のCRISPR-Casエフェクターポリペプチドが、約250~約350アミノ酸長を有する、請求項1に記載の操作されたタンパク質。
  3. 前記異種ポリペプチドが、前記第1のCRISPR-Casエフェクターポリペプチドに対して異種である第1のヌクレアーゼドメインまたはその部分を含む、請求項1または2に記載の操作されたタンパク質。
  4. 前記異種ポリペプチドが、標的鎖ニッカーゼドメインまたはその部分を含み、場合によっては、前記異種ポリペプチドが、標的鎖特異的ニッカーゼドメイン、非標的鎖特異的ニッカーゼドメイン、または標的および非標的鎖ニッカーゼドメインを含む、請求項1~3のいずれか一項に記載の操作されたタンパク質。
  5. 第2のヌクレアーゼドメインまたはその部分を含む第2のCRISPR-Casエフェクターポリペプチドをさらに含み、場合によっては、前記第1のCRISPR-Casエフェクターポリペプチドおよび前記第2のCRISPR-Casエフェクターポリペプチドが、非連続的である(すなわち、互いに(場合によっては、少なくとも10、50、100、またはそれを超えるアミノ酸だけ)分離しており、かつ互いに直接付着していない)、請求項1~4のいずれか一項に記載の操作されたタンパク質。
  6. 前記異種ポリペプチドが、前記第2のCRISPR-Casエフェクターポリペプチドに対して異種である、請求項5に記載の操作されたタンパク質。
  7. 前記第1のCRISPR-Casエフェクターポリペプチドおよび前記第2のCRISPR-Casエフェクターポリペプチドが各々、同じ前記CRISPR-Casエフェクタータンパク質の部分(例えば、異なる部分)である、請求項5または6に記載の操作されたタンパク質。
  8. 前記第2のヌクレアーゼドメインまたはその部分が、非標的および標的鎖ニッカーゼドメインまたはその部分である、請求項5~7のいずれか一項に記載の操作されたタンパク質。
  9. 前記第2のヌクレアーゼドメインが活性である、請求項5~8のいずれか一項に記載の操作されたタンパク質。
  10. 前記第2のヌクレアーゼドメインが不活性である、請求項5~8のいずれか一項に記載の操作されたタンパク質。
  11. 前記異種ポリペプチドがHNHドメインを含み、場合によっては、前記HNHドメインが、HNHドメインの活性を修飾する変異(例えばH840A変異)を含む、請求項1~10のいずれか一項に記載の操作されたタンパク質。
  12. 前記第1のCRISPR-Casエフェクターポリペプチドおよび前記第2のCRISPR-Casエフェクターポリペプチドが各々、第1のCRISPR-Casエフェクタータンパク質の部分であり、前記異種ポリペプチドが、前記第1のCRISPR-Casエフェクタータンパク質の2つの連続アミノ酸または非連続アミノ酸である2つのアミノ酸の間にあり、かつ/またはこれらに(例えば、直接的または間接的に)連結されている、請求項5~11のいずれか一項に記載の操作されたタンパク質。
  13. 前記異種ポリペプチドが、前記第1のCRISPR-Casエフェクタータンパク質のドメイン間リンカー領域に対応する位置において、前記操作されたタンパク質内に配置されている、請求項12に記載の操作されたタンパク質。
  14. 前記異種ポリペプチドが、配列番号1または169~174の1つまたは複数に対して少なくとも70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、またはそれを超える配列同一性を有するアミノ酸配列を含み、場合によっては、前記異種ポリペプチドが、配列番号1または169~174のいずれか1つのアミノ酸配列を含む、請求項1~13のいずれか一項に記載の操作されたタンパク質。
  15. 前記操作されたタンパク質が、アミノ末端からカルボキシ末端方向に、前記第1のCRISPR-Casエフェクターポリペプチド、前記異種ポリペプチド、および前記第2のCRISPR-Casエフェクターポリペプチドを含み、場合によっては、前記第2のCRISPR-Casエフェクターポリペプチドが、約800~約1,100アミノ酸(例えば、約900~約950または1,000アミノ酸)長を有する、請求項5~14のいずれか一項に記載の操作されたタンパク質。
  16. 前記第1のV型CRISPR-Casエフェクタータンパク質のウェッジドメイン、Rec1ドメイン、Rec2ドメイン、PAM相互作用ドメイン、RuvCドメイン、架橋ヘリックス、および/またはNucドメインの全てまたは部分をさらに含み、場合によっては、前記操作されたタンパク質が、Cas12aまたはCas12bのウェッジドメイン、Rec1ドメイン、Rec2ドメイン、PAM相互作用ドメイン、RuvCドメイン、架橋ヘリックス、および/またはNucドメインの全てまたは部分を含む、請求項1~15のいずれか一項に記載の操作されたタンパク質。
  17. 前記操作されたタンパク質が、前記Rec1ドメインおよび前記Rec2ドメインを含み、前記異種ポリペプチドが、前記Rec1ドメインと前記Rec2ドメインとの間にある、請求項16に記載の操作されたタンパク質。
  18. 前記第1のV型CRISPR-Casエフェクタータンパク質の少なくとも一部分が欠けており、場合によっては、Cas12aまたはCas12bの少なくとも一部分が欠けている、請求項1~17のいずれか一項に記載の操作されたタンパク質。
  19. 前記第1のCRISPR-Casエフェクターポリペプチドと前記異種ポリペプチドとの間に第1のリンカーを、かつ/または前記異種ポリペプチドと前記第2のCRISPR-Casエフェクターポリペプチドとの間に第2のリンカーをさらに含む、請求項5~18のいずれか一項に記載の操作されたタンパク質。
  20. 前記第1のリンカーおよび/または前記第2のリンカーが、1~10個のアミノ酸を含み、場合によっては、前記第1のリンカーおよび/または前記第2のリンカーが、1、2、3、または4つのアミノ酸を含む、請求項19に記載の操作されたタンパク質。
  21. 前記第1のリンカーおよび/または前記第2のリンカーが、グリシンおよび/またはセリンを含む、請求項19または20に記載の操作されたタンパク質。
  22. 前記操作されたタンパク質が、野生型CRISPR-Casエフェクタータンパク質のアミノ酸配列に対して約70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、またはそれを超える配列同一性を有するアミノ酸配列を含み、場合によっては、前記操作されたタンパク質が、配列番号50~66または151のいずれか1つに対して少なくとも70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、またはそれを超える配列同一性を有するアミノ酸配列を含む、請求項1~21のいずれか一項に記載の操作されたタンパク質。
  23. 前記操作されたタンパク質が、配列番号2~17、125~132、または157~168のいずれか1つに対して約70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、またはそれを超える配列同一性を有するアミノ酸配列を含み、場合によっては、前記操作されたタンパク質が、配列番号2~17、125~132、または157~168のいずれか1つのアミノ酸配列を含む、請求項1~22のいずれか一項に記載の操作されたタンパク質。
  24. 前記操作されたタンパク質がヌクレアーゼであり、場合によっては、前記操作されたタンパク質が、標的鎖ニッカーゼ、非標的鎖ニッカーゼ、または標的および非標的鎖ニッカーゼである、請求項1~23のいずれか一項に記載の操作されたタンパク質。
  25. CRISPR-Casエフェクタータンパク質(例えば、野生型CRISPR-Casエフェクタータンパク質、および/または配列番号50~66または151の1つの配列を有するタンパク質)と比較して、前記操作されたタンパク質の、標的核酸の標的鎖および/または非標的鎖にニックを入れる効率が上昇している、請求項1~24のいずれか一項に記載の操作されたタンパク質。
  26. 標的鎖ニッカーゼドメインまたはその部分であり、かつV型ヌクレアーゼドメインまたはその部分でない第1のヌクレアーゼドメインと;
    V型CRISPR-Casエフェクタータンパク質の部分である第1のCRISPR-Casエフェクターポリペプチドと
    を含む、操作されたタンパク質。
  27. 前記第1のヌクレアーゼドメインが、標的鎖特異的ニッカーゼドメイン、または標的および非標的鎖ニッカーゼドメインである、請求項26に記載の操作されたタンパク質。
  28. 第2のヌクレアーゼドメインをさらに含み、場合によっては、前記第2のヌクレアーゼドメインが、非標的および標的鎖ニッカーゼドメインまたはその部分である、請求項27または28に記載の操作されたタンパク質。
  29. 前記第2のヌクレアーゼドメインが活性である、請求項28に記載の操作されたタンパク質。
  30. 前記第2のヌクレアーゼドメインが不活性である、請求項28に記載の操作されたタンパク質。
  31. 前記第1のヌクレアーゼドメインがHNHドメインを含み、場合によっては、前記HNHドメインが、不活化変異(例えばH840A変異)を含む、請求項26~30のいずれか一項に記載の操作されたタンパク質。
  32. 前記第1のCRISPR-Casエフェクターポリペプチドおよび前記第2のヌクレアーゼドメインが各々、第1のCRISPR-Casエフェクタータンパク質の部分であり、前記第1のヌクレアーゼドメインが、前記第1のCRISPR-Casエフェクタータンパク質の2つの連続アミノ酸または非連続アミノ酸の間にあり、かつ/またはこれらに(例えば、直接的または間接的に)連結されている、請求項28~31のいずれか一項に記載の操作されたタンパク質。
  33. 前記第1のヌクレアーゼドメインが、前記第1のCRISPR-Casエフェクタータンパク質のドメイン間リンカー領域に対応する位置において、前記操作されたタンパク質内に配置されている、請求項33に記載の操作されたタンパク質。
  34. 前記第1のヌクレアーゼドメインが、配列番号1または169~174の1つまたは複数に対して少なくとも70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、またはそれを超える配列同一性を有するアミノ酸配列を含み、場合によっては、前記第1のヌクレアーゼドメインが、配列番号1または169~174のいずれか1つのアミノ酸配列を含む、請求項26~33のいずれか一項に記載の操作されたタンパク質。
  35. アミノ末端からカルボキシ末端方向に、前記第1のCRISPR-Casエフェクターポリペプチド、前記第1のヌクレアーゼドメイン、および前記第2のヌクレアーゼドメインをさらに含む、請求項26~34のいずれか一項に記載の操作されたタンパク質。
  36. 前記V型CRISPR-Casエフェクタータンパク質のウェッジドメイン、Rec1ドメイン、Rec2ドメイン、PAM相互作用ドメイン、RuvCドメイン、架橋ヘリックス、および/またはNucドメインの全てまたは部分をさらに含み、場合によっては、前記操作されたタンパク質が、Cas12aまたはCas12bのウェッジドメイン、Rec1ドメイン、Rec2ドメイン、PAM相互作用ドメイン、RuvCドメイン、架橋ヘリックス、および/またはNucドメインの全てまたは部分を含む、請求項26~35のいずれか一項に記載の操作されたタンパク質。
  37. 前記操作されたタンパク質が、前記Rec1ドメインおよび前記Rec2ドメインを含み、前記第1のヌクレアーゼドメインが、前記Rec1ドメインと前記Rec2ドメインとの間にある、請求項36に記載の操作されたタンパク質。
  38. 前記V型CRISPR-Casエフェクタータンパク質の少なくとも一部分が欠けており、場合によっては、Cas12aまたはCas12bの少なくとも一部分が欠けている、請求項26~37のいずれか一項に記載の操作されたタンパク質。
  39. 前記第1のCRISPR-Casエフェクターポリペプチドと前記第1のヌクレアーゼドメインとの間に第1のリンカーを、かつ/または前記第1のヌクレアーゼドメインと前記第2のヌクレアーゼドメインとの間に第2のリンカーをさらに含む、請求項28~38のいずれか一項に記載の操作されたタンパク質。
  40. 前記第1のリンカーおよび/または前記第2のリンカーが、1~10個のアミノ酸を含み、場合によっては、前記第1のリンカーおよび/または前記第2のリンカーが、1、2、3、または4つのアミノ酸を含む、請求項39に記載の操作されたタンパク質。
  41. 前記第1のリンカーおよび/または前記第2のリンカーが、グリシンおよび/またはセリンを含む、請求項39または40に記載の操作されたタンパク質。
  42. 前記操作されたタンパク質が、野生型CRISPR-Casエフェクタータンパク質に対して少なくとも70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、またはそれを超える配列同一性を有するアミノ酸配列を含み、場合によっては、前記操作されたタンパク質が、配列番号50~66または151のいずれか1つに対して少なくとも70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、またはそれを超える配列同一性を有するアミノ酸配列を含む、請求項26~41のいずれか一項に記載の操作されたタンパク質。
  43. 前記操作されたタンパク質が、配列番号2~17、125~132、または157~168のいずれか1つに対して少なくとも70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、またはそれを超える配列同一性を有するアミノ酸配列を含み、場合によっては、前記操作されたタンパク質が、配列番号2~17、125~132、または157~168のいずれか1つのアミノ酸配列を含む、請求項26~42のいずれか一項に記載の操作されたタンパク質。
  44. 前記操作されたタンパク質がヌクレアーゼであり、場合によっては、前記操作されたタンパク質が、標的鎖ニッカーゼ、非標的鎖ニッカーゼ、または標的および非標的鎖ニッカーゼである、請求項26~42のいずれか一項に記載の操作されたタンパク質。
  45. CRISPR-Casエフェクタータンパク質(例えば、野生型CRISPR-Casエフェクタータンパク質、および/または配列番号50~66または151の1つの配列を有するタンパク質)と比較して、前記操作されたタンパク質の、標的核酸の標的鎖および/または非標的鎖にニックを入れる効率が上昇している、請求項26~44のいずれか一項に記載の操作されたタンパク質。
  46. 配列番号2~17、125~132、または157~168のいずれか1つに対して少なくとも70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、またはそれを超える配列同一性を有するアミノ酸配列を含む操作されたタンパク質であって、場合によっては、配列番号2~17、125~132、または157~168のいずれか1つのアミノ酸配列を有する操作されたタンパク質。
  47. 第1のV型CRISPR-Casエフェクタータンパク質の第1の部分である第1のポリペプチドと;
    前記第1のV型CRISPR-Casエフェクタータンパク質の第2の部分である第2のポリペプチドと;
    前記第1のV型CRISPR-Casエフェクタータンパク質に対して異種である異種ポリペプチドと
    を含む操作されたタンパク質であって、
    前記異種ポリペプチドが、前記第1のポリペプチドと前記第2のポリペプチドとの間にあり、前記異種ポリペプチドが、前記第1のV型CRISPR-Casエフェクタータンパク質のドメイン間リンカー領域に対応する位置において、前記操作されたタンパク質内に配置されている、
    操作されたタンパク質。
  48. 前記ドメイン間リンカー領域が、配列番号50のアミノ酸残基283~293の、または配列番号50に対して最適にアラインされている配列についての対応するアミノ酸残基(例えば、配列(例えば配列番号52)が、配列番号50に対して最適にアラインされている場合に、アミノ酸残基283~293に相当するアミノ酸残基)の1つまたは複数のアミノ酸を含む、請求項47に記載の操作されたタンパク質。
  49. 第1のポリペプチドが、前記第1のV型CRISPR-Casエフェクタータンパク質のウェッジドメインおよび/もしくはRec1ドメインの全てもしくは部分を含み;かつ/または
    前記第2のポリペプチドが、前記第1のV型CRISPR-Casエフェクタータンパク質のウェッジドメイン、Rec2ドメイン、PAM相互作用ドメイン、RuvCドメイン、架橋ヘリックス、および/もしくはNucドメインの全てもしくは部分を含む、
    請求項47または48に記載の操作されたタンパク質。
  50. 前記操作されたタンパク質が、前記Rec1ドメインおよび前記Rec2ドメインを含み、前記異種ポリペプチドが、前記Rec1ドメインと前記Rec2ドメインとの間にある、請求項49に記載の操作されたタンパク質。
  51. 前記第1のV型CRISPR-Casエフェクタータンパク質(例えば、Cas12aまたはCas12b)の少なくとも一部分が欠けている、請求項47~50のいずれか一項に記載の操作されたタンパク質。
  52. 前記異種ポリペプチドが、標的鎖ニッカーゼドメインまたはその部分を含み、場合によっては、前記異種ポリペプチドが、標的鎖特異的ニッカーゼドメイン、非標的鎖特異的ニッカーゼドメイン、または標的および非標的鎖ニッカーゼドメインを含む、請求項47~51のいずれか一項に記載の操作されたタンパク質。
  53. 前記第2のポリペプチドが、ヌクレアーゼドメインまたはその部分を含み、場合によっては、前記ヌクレアーゼドメインまたはその部分が、非標的および標的鎖ニッカーゼドメインまたはその部分(例えば、RuvCドメインまたはその部分)である、請求項47~52のいずれか一項に記載の操作されたタンパク質。
  54. 前記ヌクレアーゼドメインが活性である、請求項53に記載の操作されたタンパク質。
  55. 前記ヌクレアーゼドメインが不活性である、請求項53に記載の操作されたタンパク質。
  56. 前記異種ポリペプチドがHNHドメインを含み、場合によっては、前記HNHドメインが、HNHドメインの活性を修飾する変異(例えばH840A変異)を含む、請求項47~55のいずれか一項に記載の操作されたタンパク質。
  57. 前記異種ポリペプチドが、配列番号1または169~174の1つまたは複数に対して少なくとも70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、またはそれを超える配列同一性を有するアミノ酸配列を含み、場合によっては、前記異種ポリペプチドが、配列番号1または169~174のいずれか1つのアミノ酸配列を含む、請求項47~56のいずれか一項に記載の操作されたタンパク質。
  58. 前記第1のポリペプチドと前記異種ポリペプチドとの間に第1のリンカーを、かつ/または前記異種ポリペプチドと前記第2のポリペプチドとの間に第2のリンカーをさらに含む、請求項47~57のいずれか一項に記載の操作されたタンパク質。
  59. 前記第1のリンカーおよび/または前記第2のリンカーが、1~10個のアミノ酸を含み、場合によっては、前記第1のリンカーおよび/または前記第2のリンカーが、1、2、3、または4つのアミノ酸を含む、請求項58に記載の操作されたタンパク質。
  60. 前記第1のリンカーおよび/または前記第2のリンカーが、グリシンおよび/またはセリンを含む、請求項58または59に記載の操作されたタンパク質。
  61. 前記操作されたタンパク質が、野生型CRISPR-Casエフェクタータンパク質のアミノ酸配列に対して約70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、またはそれを超える配列同一性を有するアミノ酸配列を含み、場合によっては、前記操作されたタンパク質が、配列番号50~66または151のいずれか1つに対して少なくとも70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、またはそれを超える配列同一性を有するアミノ酸配列を含む、請求項47~60のいずれか一項に記載の操作されたタンパク質。
  62. 前記操作されたタンパク質が、配列番号2~17、125~132、または157~168のいずれか1つに対して約70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、またはそれを超える配列同一性を有するアミノ酸配列を含み、場合によっては、前記操作されたタンパク質が、配列番号2~17、125~132、または157~168のいずれか1つのアミノ酸配列を含む、請求項47~61のいずれか一項に記載の操作されたタンパク質。
  63. 前記操作されたタンパク質がヌクレアーゼであり、場合によっては、前記操作されたタンパク質が、標的鎖ニッカーゼ、非標的鎖ニッカーゼ、または標的および非標的鎖ニッカーゼである、請求項47~62のいずれか一項に記載の操作されたタンパク質。
  64. CRISPR-Casエフェクタータンパク質(例えば、野生型CRISPR-Casエフェクタータンパク質、および/または配列番号50~66または151の1つの配列を有するタンパク質)と比較して、前記操作されたタンパク質の、標的核酸の標的鎖および/または非標的鎖にニックを入れる効率が上昇している、請求項47~63のいずれか一項に記載の操作されたタンパク質。
  65. 請求項1~64のいずれか一項に記載の操作されたタンパク質;
    ガイド核酸(例えばガイドRNA)、および
    場合によってはデアミナーゼ
    を含む組成物(例えば塩基編集組成物)または系であって、
    場合によっては、前記操作されたタンパク質、前記ガイド核酸、および場合によっては前記デアミナーゼが、複合体を形成するか、または複合体内に含まれる、
    組成物(例えば塩基編集組成物)または系。
  66. 請求項1~64のいずれか一項に記載の操作されたタンパク質;
    ガイド核酸(例えばガイドRNA);および
    場合によってはデアミナーゼ
    を含む複合体。
  67. 請求項1~64のいずれか一項に記載の操作されたタンパク質をコードするヌクレオチド配列を含む核酸分子。
  68. 請求項67に記載の核酸分子、または請求項1~64のいずれか一項に記載の操作されたタンパク質をコードするヌクレオチド配列を含む発現カセットまたはベクター。
  69. 標的核酸を修飾する方法であって、
    前記標的核酸を、
    請求項1~64のいずれか一項に記載の操作されたタンパク質、および
    ガイド核酸(例えばガイドRNA)
    と接触させることによって、前記標的核酸を修飾することを含み、
    場合によっては、前記操作されたタンパク質および前記ガイド核酸が、複合体を形成するか、または複合体内に含まれる、
    方法。
  70. 対照方法(例えば、前記標的核酸を、野生型CRISPR-Casエフェクタータンパク質と接触させることを含む方法)の効率と比較して、前記標的核酸を修飾し、かつ/または標的核酸の標的鎖および/もしくは非標的鎖にニックを入れる効率が上昇した、請求項69に記載の方法。
  71. 標的核酸を修飾する効率を上昇させる方法であって、
    前記標的核酸を、
    請求項1~64のいずれか一項に記載の操作されたタンパク質、および
    ガイド核酸(例えばガイドRNA)
    と接触させることによって、前記標的核酸を修飾することによって、対照方法(例えば、前記標的核酸を、野生型CRISPR-Casエフェクタータンパク質と接触させることを含み、前記操作されたタンパク質を欠く方法)と比較して、前記標的核酸を修飾する効率を上昇させることを含み、
    場合によっては、前記操作されたタンパク質および前記ガイド核酸が、複合体を形成するか、または複合体内に含まれる、
    方法。
  72. 前記標的核酸が、真核細胞内に存在し、場合によっては、前記標的核酸が、植物細胞内に存在する、請求項69~71のいずれか一項に記載の方法。
  73. 前記操作されたタンパク質が、前記標的核酸に、野生型CRISPR-Casエフェクタータンパク質についての標的核酸の編集プロファイルと比較して異なる編集プロファイルを提供する、請求項69~72のいずれか一項に記載の方法。
  74. 前記操作されたタンパク質が、前記標的核酸に、野生型CRISPR-Casエフェクタータンパク質についての標的核酸の切断パターンと比較して異なる切断パターンを提供する、請求項69~73のいずれか一項に記載の方法。
JP2023514122A 2020-08-28 2021-08-27 操作されたCRISPR-Casタンパク質およびその使用方法 Pending JP2023539668A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063071734P 2020-08-28 2020-08-28
US63/071,734 2020-08-28
PCT/US2021/047913 WO2022047135A1 (en) 2020-08-28 2021-08-27 Engineered crispr-cas proteins and methods of use thereof

Publications (1)

Publication Number Publication Date
JP2023539668A true JP2023539668A (ja) 2023-09-15

Family

ID=77951805

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023514122A Pending JP2023539668A (ja) 2020-08-28 2021-08-27 操作されたCRISPR-Casタンパク質およびその使用方法

Country Status (11)

Country Link
US (1) US20220112473A1 (ja)
EP (1) EP4204436A1 (ja)
JP (1) JP2023539668A (ja)
KR (1) KR20230058090A (ja)
CN (1) CN116745415A (ja)
AU (1) AU2021331344A1 (ja)
CA (1) CA3192195A1 (ja)
CL (1) CL2023000554A1 (ja)
IL (1) IL300823A (ja)
MX (1) MX2023002160A (ja)
WO (1) WO2022047135A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230383271A1 (en) * 2022-02-28 2023-11-30 Pairwise Plants Services, Inc. Engineered proteins and methods of use thereof
WO2024015920A1 (en) * 2022-07-13 2024-01-18 The Broad Institute, Inc. Hybrid crispr-cas systems and methods of use thereof

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NZ221259A (en) 1986-07-31 1990-05-28 Calgene Inc Seed specific transcriptional regulation
US6040504A (en) 1987-11-18 2000-03-21 Novartis Finance Corporation Cotton promoter
DE68918494T2 (de) 1988-05-17 1995-03-23 Lubrizol Genetics Inc Pflanzliches Ubiquitinpromotorsystem.
US5641876A (en) 1990-01-05 1997-06-24 Cornell Research Foundation, Inc. Rice actin gene and promoter
DE69133128T2 (de) 1990-04-12 2003-06-18 Syngenta Participations Ag Gewebe-spezifische Promotoren
US5459252A (en) 1991-01-31 1995-10-17 North Carolina State University Root specific gene promoter
CA2116449C (en) 1991-08-27 2005-04-05 Vaughan Alan Hilder Proteins with insecticidal properties against homopteran insects and their use in plant protection
UA48104C2 (uk) 1991-10-04 2002-08-15 Новартіс Аг Фрагмент днк, який містить послідовність,що кодує інсектицидний протеїн, оптимізовану для кукурудзи,фрагмент днк, який забезпечує направлену бажану для серцевини стебла експресію зв'язаного з нею структурного гена в рослині, фрагмент днк, який забезпечує специфічну для пилку експресію зв`язаного з нею структурного гена в рослині, рекомбінантна молекула днк, спосіб одержання оптимізованої для кукурудзи кодуючої послідовності інсектицидного протеїну, спосіб захисту рослин кукурудзи щонайменше від однієї комахи-шкідника
CN1301300A (zh) 1998-02-20 2001-06-27 曾尼卡有限公司 花粉特异性启动子
AR044724A1 (es) 2000-03-27 2005-10-05 Syngenta Participations Ag Promotores del virus de la rizadura amarilla del cestrum
US7166770B2 (en) 2000-03-27 2007-01-23 Syngenta Participations Ag Cestrum yellow leaf curling virus promoters
EP1687429B1 (en) 2003-10-06 2011-01-12 Syngenta Participations AG Promoter functional in plant plastids
KR100537955B1 (ko) 2003-10-29 2005-12-20 학교법인고려중앙학원 꽃가루 특이적 유전자 발현 프로모터
AR090418A1 (es) 2012-02-01 2014-11-12 Dow Agrosciences Llc Peptido de transito al cloroplasto
WO2016011070A2 (en) 2014-07-14 2016-01-21 The Regents Of The University Of California A protein tagging system for in vivo single molecule imaging and control of gene transcription
ES2847311T3 (es) 2014-08-05 2021-08-02 MabQuest SA Reactivos inmunológicos que se unen a PD-1
US9790490B2 (en) 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
EP3365357B1 (en) 2015-10-23 2024-02-14 President and Fellows of Harvard College Evolved cas9 proteins for gene editing
AU2017306676B2 (en) 2016-08-03 2024-02-22 President And Fellows Of Harvard College Adenosine nucleobase editors and uses thereof
EP3571304A4 (en) 2017-01-20 2020-08-19 The Regents of the University of California TARGETED ACTIVATION IN PLANTS
EP3728588A4 (en) * 2017-12-22 2022-03-09 The Broad Institute, Inc. CAS12A SYSTEMS, METHODS AND COMPOSITIONS FOR TARGETED RNA BASE EDITING
WO2019126716A1 (en) * 2017-12-22 2019-06-27 The Broad Institute, Inc. Cas12b systems, methods, and compositions for targeted rna base editing

Also Published As

Publication number Publication date
US20220112473A1 (en) 2022-04-14
KR20230058090A (ko) 2023-05-02
AU2021331344A1 (en) 2023-03-16
MX2023002160A (es) 2023-04-25
CN116745415A (zh) 2023-09-12
EP4204436A1 (en) 2023-07-05
WO2022047135A1 (en) 2022-03-03
CA3192195A1 (en) 2022-03-03
CL2023000554A1 (es) 2023-08-25
IL300823A (en) 2023-04-01

Similar Documents

Publication Publication Date Title
US20210130827A1 (en) Type v crispr-cas base editors and methods of use thereof
US11926834B2 (en) Compositions and methods for RNA-encoded DNA-replacement of alleles
US11913005B2 (en) Optimized CRISPR-Cas nucleases and base editors and methods of use thereof
JP2022552409A (ja) Cas12aヌクレアーゼの変異体ならびにその作製方法および使用方法
JP2023549339A (ja) 対立遺伝子の、rnaによりコードされるdna置換のための組成物および方法
IL294190A (en) Recruitment of DNA polymerase for template editing
JP2023539668A (ja) 操作されたCRISPR-Casタンパク質およびその使用方法
US20210403898A1 (en) Compositions, systems, and methods for base diversification
EP4097229A1 (en) Compositions, systems, and methods for base diversification
US20230383271A1 (en) Engineered proteins and methods of use thereof
US20230266293A1 (en) Color-based and/or visual methods for identifying the presence of a transgene and compositions and constructs relating to the same
US20230295646A1 (en) Model editing systems and methods relating to the same