JP2024502630A - コンテキスト依存性二本鎖dna特異的デアミナーゼ及びその使用 - Google Patents

コンテキスト依存性二本鎖dna特異的デアミナーゼ及びその使用 Download PDF

Info

Publication number
JP2024502630A
JP2024502630A JP2023542485A JP2023542485A JP2024502630A JP 2024502630 A JP2024502630 A JP 2024502630A JP 2023542485 A JP2023542485 A JP 2023542485A JP 2023542485 A JP2023542485 A JP 2023542485A JP 2024502630 A JP2024502630 A JP 2024502630A
Authority
JP
Japan
Prior art keywords
seq
deaminase
base editor
amino acid
domain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023542485A
Other languages
English (en)
Inventor
ファヒム ファルザドファルド,
ナバ ガラエイ,
ギヨン ジュン,
リアン リン,
ジョン ソク カン,
Original Assignee
マーチ セラピューティクス, インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by マーチ セラピューティクス, インコーポレイテッド filed Critical マーチ セラピューティクス, インコーポレイテッド
Publication of JP2024502630A publication Critical patent/JP2024502630A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

コンテキスト依存的様式で二本鎖DNA中のシトシンヌクレオチドを脱アミノ化することができるデアミナーゼドメインが記載される。特定の標的配列を認識し、且つ/又はそれに結合する1つ以上のターゲティングドメイン(例えば、Cas9、Cpf1、ZF、TALE)と組み合わせて、そのデアミナーゼドメインを含有する非天然の又は操作された標的化塩基エディターも開示される。塩基エディターは、低いオフターゲット効果を伴って、細胞又は対象のゲノム内、例えばヒトミトコンドリアゲノム内での標的化部位の特異的且つ効率的な編集を促進する。デアミナーゼドメイン及び塩基エディターを使用する方法も提供される。

Description

関連出願の相互参照
本出願は、その内容が全体として参照により組み込まれる、2021年1月12日に出願された米国特許出願第63/136,524号明細書の利益及びそれに対する優先権を主張する。
配列表の参照
2022年1月12日に作成され、サイズが374,384バイトである「MILA100_ST25.txt」という名称のテキストファイルとして、2022年1月12日に提出された配列表は、37C.F.R.§1.52(e)(5)に準拠して参照により本明細書に組み込まれる。
開示される本発明は、概して、核酸のターゲティング及び編集、特に目的の標的配列におけるプログラム可能な脱アミノ化のための組成物及び方法に関する。
核酸配列の標的化編集、例えば標的化切断又はゲノムDNAへの特異的修飾の標的化導入は、遺伝子機能の研究にとって非常に有望な手法であり、ヒト遺伝病の新しい治療法を提供する可能性も有する。操作されたジンクフィンガーヌクレアーゼ(ZFN)、転写活性化因子様エフェクターヌクレアーゼ(TALEN)及びCRISRPR-Casシステムを含む現在のゲノムエンジニアリングツールは、ゲノム中の配列特異的なDNA切断を実施する。このプログラム可能な切断は、非相同末端結合(NHEJ)を介した切断部位のDNAの突然変異又は相同組換え修復(HDR)を介した切断部位周囲のDNAの置換を達成し得る。しかし、これらの技術の欠点は、それらが典型的にはわずかな遺伝子編集効率のみをもたらし、さらに所望の改変と競合する可能性がある不要な遺伝子改変を招くことである。
多くの遺伝性疾患は、原則として、ゲノム中の特定の位置に特定のヌクレオチド変化(例えば、ある疾患に関連する遺伝子の特定のコドンにおけるCからTへの変化)をもたらすことによって治療することができるため、塩基エディターは、二本鎖DNA(dsDNA)切断の導入を必要とすることなく、そのような精密遺伝子編集を達成するプログラム可能な方法として企図されてきた。以前に記載されている(シチジン又はアデノシン)デアミナーゼは、一本鎖核酸に作用するため、それらを塩基編集に使用するには、例えば、Cas9システム又は同様のRNA誘導酵素による二本鎖DNA(dsDNA)の巻き戻しを必要とする。従って、既存の塩基エディターは、Cas9又は他のRNA誘導酵素に融合したDNA修飾ドメイン(即ちssDNA特異的デアミナーゼドメイン)を使用する。そのガイドRNAを有するCas9酵素とゲノム標的との結合により、一本鎖DNA領域を露出させるRループが生成されるため、塩基エディターは、露出したssDNA領域によって画定される小さいウィンドウ内で塩基を修飾する。シチジンデアミナーゼを使用する塩基エディターは、C→T変異を可能にし(Komor,A.,et al.,Nature 533,420-424(2016))、アデノシンデアミナーゼに融合した塩基エディターは、A→G変異を可能にした(Gaudelli,N.,et al.,Nature 551,464-471(2017))。しかし、ssDNAをその基質として厳密に要求するため、ssDNA特異的デアミナーゼをジンクフィンガー及びTALEなどのdsDNA特異的DNA結合ドメインと組み合わせて使用しようとする取り組みは、効率的な塩基エディターをもたらしていない。
近年、ミトコンドリアゲノム編集を可能にする二本鎖DNA活性を有するシチジンデアミナーゼが報告された(Mok BY.,et al.,Nature,583(7817):631-637(2020);国際公開第2021/155065A1号パンフレット)。DddAと命名されたこのシチジンデアミナーゼは、二本鎖DNA上にC→U変換を生成し、次にこれが細胞修復及び複製機構によってC→Tに変換される。しかし、DddAは、厳密なコンテキスト特異性を備え、チミンの前にあるデオキシシチジンのみを編集することができる(従ってTCをTTに変換する)ため、その適用可能性を非常に狭い配列コンテキストに制限する。従って、多くの進歩がなされたにもかかわらず、特にRNA誘導エディターによる編集に適していないミトコンドリアなどの細胞小器官において、現在の塩基編集能力を拡大するための組成物、システム及び方法が依然として必要とされている。
国際公開第2021/155065号
Komor,A.,et al.,Nature 533,420-424(2016) Gaudelli,N.,et al.,Nature 551,464-471(2017) Mok BY.,et al.,Nature,583(7817):631-637(2020)
従って、本発明の目的は、核酸編集のための組成物及び方法を提供することである。
本発明の目的は、DNAの巻き戻し又はその機能のための任意の補助核酸部分(例えば、ガイドRNA)への依存を必要とすることなく、dsDNAの塩基編集を可能にする組成物及び方法を提供することである。
本発明の目的は、任意の所与の配列コンテキスト(例えば、NACN、NCCN、NGCN、NTCN)において、高効率でdsDNA中のシチジンの所望の修飾(例えば、塩基編集)の導入を可能にする組成物及び方法を提供することである。
本発明の目的は、最小限のオフターゲット活性で核酸塩基編集を可能にする組成物及び方法を提供することである。
本発明の別の目的は、向上した精度で核酸塩基編集を可能にする組成物及び方法を提供することである。
本発明の別の目的は、オンターゲット編集を最大化すると共に、バイスタンダーオフターゲットを最小化するために、塩基エディターの活性ウィンドウの調整を可能にする組成物及び方法を提供することである。
本発明の別の目的は、広範囲の標的核酸にわたって核酸塩基編集を可能にする組成物及び方法を提供することである。
本発明の別の目的は、ヒト(核又はミトコンドリア)ゲノム中の任意の部位における核酸塩基編集のための組成物及び方法を提供することである。
本発明の別の目的は、多様性生成及びエピジェネティックシーケンシングなどの適用のためのインビトロでのdsDNAの核酸編集のための組成物及び方法を提供することである。
本明細書に含まれる文献、行為、材料、装置、物品などに関するいかなる議論も、これらのいずれか又は全てが先行技術基準の一部をなすこと、又は本出願の各請求項の優先日より前に存在したため、本開示に関連する分野で共通の一般的知識であったことの承認として見なされるべきではない。
本明細書全体を通して、「含む(comprise)」という語又は「含む(comprises)」若しくは「含んでいる」などの変形は、記載される要素、整数若しくはステップ又は要素、整数若しくはステップの群を含むことを意味すると理解されるが、他のいかなる要素、整数若しくはステップ又は要素、整数若しくはステップの群の除外を意味するものではない。
二本鎖DNA中のシトシンを脱アミノ化することができるデアミナーゼドメインが発見されている。開示されるデアミナーゼドメインのいくつかは、より配列特異的であるが、他のものは、以前に特性決定されたデアミナーゼよりも広い範囲の標的配列を編集することができる(即ちより広範なコンテキスト特異性を有する)。これら及び他の特徴に基づいて、デアミナーゼは、以前に特性決定されたdsDNA特異的デアミナーゼと比較して、オフターゲット編集の低減を示し、且つ/又はより広いコンテキストで編集を導入することを可能にすると考えられる。デアミナーゼドメインを使用して、細胞又は対象のゲノム内の単一の標的部位を編集することを含む、核酸をターゲティング及び編集するための試薬、組成物、キット及び方法が提供される。
特に、二本鎖DNAを脱アミノ化することができる単離されたデアミナーゼドメインが開示される。デアミナーゼドメインは、標的ヌクレオチド配列を含まない二本鎖DNA上のデアミナーゼドメインのデアミナーゼ活性と比較して、標的ヌクレオチド配列を含む二本鎖DNAに対してより大きいデアミナーゼ活性を有し得る。典型的には、標的ヌクレオチド配列は、それぞれ個別に完全に又は部分的に規定され、且つ互いに固定された順序関係にある2つ以上の標的ヌクレオチドを含む。一部の形態では、標的ヌクレオチド配列は、2つ以上の標的ヌクレオチドを含み、標的ヌクレオチドは、それぞれ個別に完全に又は部分的に規定され、且つ互いに固定された順序関係にある。
一部の形態では、デアミナーゼのコンテキスト特異性は、確率シーケンスロゴとして表すことができ、この場合、デアミナーゼにより特定の閾値(例えば、25%又は50%)で編集される標的ヌクレオチドのコンテキストの不均質性は、アラインメントされた配列の群により表される。アラインメントは、所与の位置に存在する文字のスタックとして表され、アラインメントに観察される各核酸の頻度は、スタック内の各文字の高さによって表される。
好ましい形態では、デアミナーゼドメインは、バークホルデリア・セノセパシア(Burkholderia cenocepacia)のDddAのデアミナーゼドメインではない。一部の形態では、デアミナーゼドメインは、バークホルデリア・セノセパシア(Burkholderia cenocepacia)由来のDddAのホモログのデアミナーゼドメインではない。一部の形態では、デアミナーゼドメインは、バークホルデリア属(Burkholderia)由来のDddAのデアミナーゼドメインではない。
一部の形態では、デアミナーゼドメインを2つの部分に分割することができ、それにより、デアミナーゼドメインは、2つの部分を近接させるか又は互いに結合させたときにのみ標的ヌクレオチド配列を脱アミノ化することができる。これは、ターゲティングドメインがデアミナーゼ部分を標的配列付近に近接させる場合を除いて、デアミナーゼ活性を防止するのに役立つ。一部の形態では、スプリットデアミナーゼドメインの各部分は、インタクトなデアミナーゼドメインの50%超を含み、その結果、結合された部分は、デアミナーゼドメインの少なくともいくつかの部分の2つのコピーを含む。一部の形態では、スプリットデアミナーゼドメインの各部分は、インタクトなデアミナーゼドメインの少なくとも55%、60%、70%、75%、80%、85%、90%、95%又は95%超を含む。他の形態では、スプリットデアミナーゼドメインの各部分は、インタクトなデアミナーゼドメインの正確に50%を含み、その結果、2つの部分の組合せは、デアミナーゼドメインの構造成分の正確に100%を提供する。典型的には、スプリットデアミナーゼドメインの2つの部分は、1つ以上のアクセサリードメインによって互いに近接される。
一部の形態では、デアミナーゼドメインは、シトシンヌクレオチドを脱アミノ化することができる(本明細書では「シトシンデアミナーゼ」と呼ぶ)。シトシンヌクレオチドを脱アミノ化することができる例示的な標的ヌクレオチド配列としては、いずれかの所与のコンテキストにおけるAC、CC、GC、TCが挙げられるが、これらに限定されない。標的ヌクレオチド配列は、頻度シーケンスロゴ分析により、優勢配列として有用に示すことができる。上記の一部の形態では、3’末端Cは、脱アミノ化される。例示的なシトシンデアミナーゼとしては、配列番号1、配列番号2、配列番号3、配列番号4、配列番号9、配列番号11、配列番号14、配列番号15及び配列番号16のいずれか1つのアミノ酸配列を有するデアミナーゼドメインが挙げられる。
一部の形態では、デアミナーゼドメインは、アデニンヌクレオチドを脱アミノ化することができる(本明細書では「アデノシンデアミナーゼ」と呼ばれる)。
一部の形態では、デアミナーゼドメインは、配列番号1のアミノ酸配列又は配列番号1に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有するBE_R1_11を含む。一部の形態では、デアミナーゼドメインは、配列番号2のアミノ酸配列又は配列番号2に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有するBE_R1_12を含む。一部の形態では、デアミナーゼドメインは、配列番号3のアミノ酸配列又は配列番号3に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有するBE_R1_28を含む。
塩基エディター標的配列に特異的に結合するデアミナーゼドメイン及びターゲティングドメインなどの標的化塩基エディターも記載される。例示的なターゲティングドメインとしては、TALE、BAT、CRISPR-Cas9、Cfp1及びジンクフィンガーが挙げられる。
一部の形態では、標的化塩基エディター標的配列は、デアミナーゼドメインの標的ヌクレオチド配列の実体の20ヌクレオチド以内の標的核酸中に存在するように選択され、標的ヌクレオチド配列の実体は、標的化塩基エディターによって塩基編集されるように選択される。一部の形態では、標的化塩基エディターによって塩基編集されるように選択される標的ヌクレオチド配列の実体の30ヌクレオチド以内の塩基エディター標的配列は、標的ヌクレオチド配列の任意の実体の20ヌクレオチド以内にある標的核酸における唯一の塩基エディター標的配列である。一部の形態では、標的核酸における標的ヌクレオチド配列の実体は、標的ヌクレオチド配列の実体の20ヌクレオチド以内の標的核酸中の塩基エディター標的配列の20ヌクレオチド以内のデアミナーゼドメインの標的ヌクレオチド配列の唯一の実体である。
以上のいずれでも、塩基エディター標的配列は、ミトコンドリアDNA、葉緑体DNA若しくは色素体DNA又はゲノムを有するいずれかの他の膜性細胞小器官中に存在し得る。塩基エディターを使用して、試験管内の例えば合成又は天然DNAに対してインビトロで作用させることもできる。
一部の形態では、塩基エディターは、2つの部分を含み、それにより、第1の部分は、第1のスプリットデアミナーゼドメインを含み、及び第2の部分は、第2のスプリットデアミナーゼドメインを含む。一部の形態では、第1の部分は、配列番号122~181のいずれか1つのアミノ酸配列を含むスプリットデアミナーゼドメインを含み、及び第2の部分は、配列番号127~181のいずれか1つのアミノ酸配列を含むスプリットデアミナーゼドメインを含み、第1及び第2のスプリットデアミナーゼドメインは、単独では不活性であるが、一緒に近接されると脱アミノ化が可能である。一部の形態では、第1のスプリットデアミナーゼドメインは、配列番号122~126のいずれか1つのアミノ酸配列を含む。他の形態では、第1及び第2のスプリットデアミナーゼドメインの両方は、野生型デアミナーゼドメイン活性部位を含む。
特定の形態では、第1及び第2のスプリットデアミナーゼドメインは、BE_R1_11の断片又は変異体をそれぞれ含む。例えば、一部の形態では、第1のスプリットデアミナーゼドメインは、配列番号122、又は127~135、又は150のいずれか1つを含み、及び第2のスプリットデアミナーゼドメインは、配列番号127~135又は150のいずれか1つを含む。一部の形態では、第1のスプリットデアミナーゼドメインは、配列番号122を含み、及び第2のスプリットデアミナーゼドメインは、配列番号127~134又は150のいずれか1つを含む。特定の形態では、第1のスプリットデアミナーゼドメインは、配列番号129を含み、及び第2のスプリットデアミナーゼドメインは、配列番号150を含む。
特定の形態では、第1及び第2のスプリットデアミナーゼドメインは、BE_R1_12の断片又は変異体をそれぞれ含む。例えば、一部の形態では、第1のスプリットデアミナーゼドメインは、配列番号124、又は136~140、又は156~167のいずれか1つを含み、及び第2のスプリットデアミナーゼドメインは、配列番号136~140又は156~167のいずれか1つを含む。一部の形態では、第1のスプリットデアミナーゼドメインは、配列番号124を含み、及び第2のスプリットデアミナーゼドメインは、配列番号156~166のいずれか1つを含む。特定の形態では、第1のスプリットデアミナーゼドメインは、配列番号137を含み、及び第2のスプリットデアミナーゼドメインは、配列番号142を含む。別の形態では、第1のスプリットデアミナーゼドメインは、配列番号139を含み、及び第2のスプリットデアミナーゼドメインは、配列番号144を含む。
特定の形態では、第1及び第2のスプリットデアミナーゼドメインは、BE_R1_41の断片又は変異体をそれぞれ含む。例えば、一部の形態では、第1のスプリットデアミナーゼドメインは、配列番号168~171のいずれか1つを含み、及び第2のスプリットデアミナーゼドメインは、配列番号172~175のいずれか1つを含む。特定の形態では、第1のスプリットデアミナーゼドメインは、配列番号168を含み、及び第2のスプリットデアミナーゼドメインは、配列番号173を含む。別の形態では、第1のスプリットデアミナーゼドメインは、配列番号171を含み、及び第2のスプリットデアミナーゼドメインは、配列番号175を含む。他の形態では、第1のスプリットデアミナーゼドメインは、配列番号171を含み、及び第2のスプリットデアミナーゼドメインは、配列番号173を含む。
特定の形態では、第1及び第2のスプリットデアミナーゼドメインは、BE_R1_28の断片又は変異体をそれぞれ含む。例えば、一部の形態では、第1のスプリットデアミナーゼドメインは、配列番号123、又は146~149、又は151~155のいずれか1つを含み、及び第2のスプリットデアミナーゼドメインは、配列番号146~149又は151~155のいずれか1つを含む。特定の形態では、第1のスプリットデアミナーゼドメインは、配列番号123を含み、及び第2のスプリットデアミナーゼドメインは、配列番号149又は151~153のいずれか1つを含む。
特定の形態では、第1及び第2スプリットデアミナーゼドメインは、BE_R4_21の断片又は変異体をそれぞれ含む。例えば、一部の形態では、第1のスプリットデアミナーゼドメインは、配列番号125又は176~177のいずれか1つを含み、及び第2のスプリットデアミナーゼドメインは、配列番号176~177のいずれか1つを含む。特定の形態では、第1のスプリットデアミナーゼドメインは、配列番号125を含み、及び第2のスプリットデアミナーゼドメインは、配列番号177を含む。他の形態では、第1のスプリットデアミナーゼドメインは、配列番号176を含み、及び第2のスプリットデアミナーゼドメインは、配列番号177を含む。
特定の形態では、第1及び第2スプリットデアミナーゼドメインは、BE_R2_11の断片又は変異体をそれぞれ含む。例えば、一部の形態では、第1のスプリットデアミナーゼドメインは、配列番号126又は180~181のいずれか1つを含み、及び第2のスプリットデアミナーゼドメインは、配列番号180~181のいずれか1つを含む。特定の形態では、第1のスプリットデアミナーゼドメインは、配列番号125を含み、及び第2のスプリットデアミナーゼドメインは、配列番号180~181のいずれか1つを含む。別の形態では、第1のスプリットデアミナーゼドメインは、配列番号180を含み、及び第2のスプリットデアミナーゼドメインは、配列番号181を含む。
他のデアミナーゼを類似の方法で分割して、類似の結果を得ることができる。さらに、他のスプリット及び編集を使用して、デアミナーゼ部分が接近するまでそれらを不活性に保持するという目的を達成することもできる。
一部の形態では、第1の部分若しくは第2の部分又は第1の部分及び第2の部分の両方は、TALE、BAT、CRISPR-Cas9、Cfp1又はジンクフィンガーから選択されるプログラマブルDNA結合ドメインを含む。
例えば、一部の形態では、1つのプログラマブルDNA結合ドメインは、左側TALE及び右側TALEからなる群から選択されるTALEである。「左」及び「右」という用語の使用は、あくまで便宜上の目的で使用され、DNA結合ドメインが標的配列のいずれの側に結合するかを意味するものではない。さらに、異なるクラスのDNA結合ドメイン(例えば、TALE及びZF、ZF及びTALE、BAT及びTALE、dCas9及びTALE)を一緒に使用することができる。例示的な形態では、1つのプログラマブルDNA結合ドメインは、配列番号90、92、95、97~106のいずれか1つのアミノ酸配列を含む左側TALEである。別の例示的な形態では、1つのプログラマブルDNA結合ドメインは、配列番号91、93~94、96、108~113のいずれか1つのアミノ酸配列を含む右側TALEである。一部の形態では、1つ以上のプログラマブルDNA結合ドメインは、配列番号95~96のいずれか1つを含むアミノ酸配列を有する、ミトコンドリアmND1 DNAに結合するTALEである。従って、特定の形態では、1つのプログラマブルDNA結合ドメインは、配列番号96を含むアミノ酸配列を有する、ミトコンドリアmND1 DNAに結合する右側TALEである。別の特定の形態では、1つのプログラマブルDNA結合ドメインは、配列番号95を含むアミノ酸配列を有する、ミトコンドリアhND1 DNAに結合する左側TALEである。一部の形態では、1つ以上のプログラマブルDNA結合ドメインは、配列番号99~106又は108~113のいずれか1つを含むアミノ酸配列を有する、ミトコンドリアmCOX1 DNAに結合するTALEである。例えば、一部の形態では、1つのプログラマブルDNA結合ドメインは、配列番号108~113のいずれかを含むアミノ酸配列を有する、ミトコンドリアmCOX1 DNAに結合する右側TALEである。一部の形態では、1つのプログラマブルDNA結合ドメインは、配列番号90~106のいずれかを含むアミノ酸配列を有する、ミトコンドリアmCOX1 DNAに結合する左側TALEである。他の形態では、1つ以上のプログラマブルDNA結合ドメインは、配列番号98を含むアミノ酸配列を有する、h12 DNAに結合するTALEである。他の形態では、1つのプログラマブルDNA結合ドメインは、配列番号114を含むアミノ酸配列を有する、NT(G)N末端ドメインを有するTALEである。一部の形態では、1つのプログラマブルDNA結合ドメインは、配列番号115を含むアミノ酸配列を有する、NT(bn)N末端ドメインを有するTALEである。他の形態では、1つ以上のプログラマブルDNA結合ドメインは、配列番号92~94のいずれか1つを含むアミノ酸配列を有する、ミトコンドリアND6 DNAに結合するTALEである。一部の形態では、1つのプログラマブルDNA結合ドメインは、配列番号93~94のいずれか1つを含むアミノ酸配列を有する、ミトコンドリアND6 DNAに結合する右側TALEである。一部の形態では、1つのプログラマブルDNA結合ドメインは、配列番号92を含むアミノ酸配列を有する、ミトコンドリアmND6 DNAに結合する左側TALEである。他の形態では、1つ以上のプログラマブルDNA結合ドメインは、配列番号90~91のいずれか1つを含むアミノ酸配列を有する、ミトコンドリアhND DNAに結合するTALEである。例えば、一部の形態では、1つのプログラマブルDNA結合ドメインは、配列番号90を含むアミノ酸配列を有する、ミトコンドリアhND DNAに結合する右側TALEである。一部の形態では、1つのプログラマブルDNA結合ドメインは、配列番号91を含むアミノ酸配列を有する、ミトコンドリアhND DNAに結合する左側TALEである。他の形態では、1つのプログラマブルDNA結合ドメインは、配列番号97を含むアミノ酸配列を有する、h11 DNAに結合するTALEである。プログラマブルDNA結合ドメインは、任意の所望の標的配列を標的とするように設計することができる。
一部の形態では、第1及び第2の部分の一方又は両方は、独立して、ジンクフィンガープログラマブルDNA結合ドメインを含む。例えば、一部の形態では、1つのプログラマブルDNA結合ドメインは、左側ジンクフィンガー及び右側ジンクフィンガーから選択されるジンクフィンガーである。例示的な形態では、1つのプログラマブルDNA結合ドメインは、配列番号82~89のいずれか1つを含むアミノ酸配列を有する、ミトコンドリアmCOX1 DNAに結合するジンクフィンガーである。一部の形態では、1つのプログラマブルDNA結合ドメインは、配列番号82~86又は87~89のいずれか1つのアミノ酸配列を有する、ミトコンドリアmCOX1 DNAに結合する右側ジンクフィンガーである。一部の形態では、1つのプログラマブルDNA結合ドメインは、配列番号82~86のいずれか1つを含むアミノ酸配列を有する、ミトコンドリアmCOX1 DNAに結合する左側ジンクフィンガーである。他の形態では、1つのプログラマブルDNA結合ドメインは、配列番号74~81のいずれか1つを含むアミノ酸配列を有する、hND DNAに結合するジンクフィンガーである。例えば、一部の形態では、1つのプログラマブルDNA結合ドメインは、配列番号78~81のいずれか1つのアミノ酸配列を有する、hND DNAに結合する右側ジンクフィンガーである。一部の形態では、1つのプログラマブルDNA結合ドメインは、配列番号74~77のいずれか1つを含むアミノ酸配列を有する、hND DNAに結合する左側ジンクフィンガーである。
一部の形態では、第1及び第2の部分の一方又は両方は、独立して、BATプログラマブルDNA結合ドメインを含む。例えば、一部の形態では、1つのプログラマブルDNA結合ドメインは、左側BAT及び右側BATからなる群から選択されるBATである。一部の形態では、1つのプログラマブルDNA結合ドメインは、配列番号118~119のいずれか1つを含むアミノ酸配列を有する、mCOX1 DNAに結合するBATである。一部の形態では、1つのプログラマブルDNA結合ドメインは、配列番号119のいずれか1つのアミノ酸配列を有する、mCOX1 DNAに結合する右側BATである。一部の形態では、1つのプログラマブルDNA結合ドメインは、配列番号118のいずれか1つを含むアミノ酸配列を有する、mCOX1 DNAに結合する左側BATである。一部の形態では、1つのプログラマブルDNA結合ドメインは、配列番号120~121のいずれか1つを含むアミノ酸配列を有する、ND6 DNAに結合するBATである。一部の形態では、1つのプログラマブルDNA結合ドメインは、配列番号121のいずれか1つのアミノ酸配列を有する、hND DNAに結合する右側BATである。一部の形態では、1つのプログラマブルDNA結合ドメインは、配列番号120のいずれか1つを含むアミノ酸配列を有する、hND DNAに結合する左側BATである。
例示的な形態では、標的化DNAエディターの第1の部分は、配列番号120のアミノ酸配列を含む第1のスプリットデアミナーゼドメインと、左側TALEプログラマブルDNA結合ドメインとを含み;それにより、第2の部分は、配列番号156、158、160又は164のいずれか1つのアミノ酸配列を含む第2のスプリットデアミナーゼドメインと、右側TALEプログラマブルDNA結合ドメインとを含む。
例示的な形態では、標的化DNAエディターの第1の部分は、配列番号169のアミノ酸配列を含む第1のスプリットデアミナーゼドメインと、左側TALEプログラマブルDNA結合ドメインとを含み;それにより、第2の部分は、配列番号173又は175のいずれか1つのアミノ酸配列を含む第2のスプリットデアミナーゼドメインと、右側TALEプログラマブルDNA結合ドメインとを含む。
例示的な形態では、標的化DNAエディターの第1の部分は、配列番号171のアミノ酸配列を含む第1のスプリットデアミナーゼドメインと、左側TALEプログラマブルDNA結合ドメインとを含み;それにより、第2の部分は、配列番号175のいずれか1つのアミノ酸配列を含む第2のスプリットデアミナーゼドメインと、右側TALEプログラマブルDNA結合ドメインとを含む。
例示的な形態では、標的化DNAエディターの第1の部分は、配列番号169のアミノ酸配列を含む第1のスプリットデアミナーゼドメインのアミノ酸配列を含む第1のスプリットデアミナーゼドメインと、左側BATプログラマブルDNA結合ドメインとを含み;それにより、第2の部分は、配列番号173又は175のいずれか1つのアミノ酸配列を含む第2のスプリットデアミナーゼドメインと、右側TALEプログラマブルDNA結合ドメインとを含む。
例示的な形態では、標的化DNAエディターの第1の部分は、配列番号169のアミノ酸配列を含む第1のスプリットデアミナーゼドメインを含む第1のスプリットデアミナーゼドメインと、第1のコイルドコイルドメインと、任意選択で、左側TALEプログラマブルDNA結合ドメインとを含み、それにより、第2の部分は、(d)配列番号173又は175のいずれか1つのアミノ酸配列を含む第2のスプリットデアミナーゼドメインと、第2のコイルドコイルドメインと、任意選択で、右側TALEプログラマブルDNA結合ドメインとを含み、それにより、第1及び第2のコイルドコイルドメインは、第1及び第2の部分の結合時に一緒に相互作用する。
一部の形態では、第1及び第2の部分は、TALE、BAT、CRISPR-Cas9、Cfp1及びジンクフィンガーからなる群から独立して選択されるプログラマブルDNA結合ドメインをそれぞれ含む。一部の形態では、第1の部分は、TALEであり、及び第2の部分は、TALEであるか、又は第1の部分は、TALEであり、及び第2の部分は、BATであるか、又は第1の部分は、TALEであり、及び第2の部分は、ジンクフィンガーであるか、又は第1の部分は、TALEであり、及び第2の部分は、CRISPR-Cas9であるか、又は第1の部分は、TALEであり、及び第2の部分は、Cfp1であるか、又は第1の部分は、BATであり、及び第2の部分は、TALEであるか、又は第1の部分は、BATであり、及び第2の部分は、BATであるか、又は第1の部分は、BATであり、及び第2の部分は、ジンクフィンガーであるか、又は第1の部分は、BATであり、及び第2の部分は、CRISPR-Cas9であるか、又は第1の部分は、BATであり、及び第2の部分は、Cfp1であるか、又は第1の部分は、ジンクフィンガーであり、及び第2の部分は、TALEであるか、又は第1の部分は、ジンクフィンガーであり、及び第2の部分は、BATであるか、又は第1の部分は、ジンクフィンガーであり、及び第2の部分は、ジンクフィンガーであるか、又は第1の部分は、ジンクフィンガーであり、及び第2の部分は、CRISPR-Cas9であるか、又は第1の部分は、ジンクフィンガーであり、及び第2の部分は、Cfp1であるか、又は第1の部分は、CRISPR-Cas9であり、及び第2の部分は、TALEであるか、又は第1の部分は、CRISPR-Cas9であり、及び第2の部分は、BATであるか、又は第1の部分は、CRISPR-Cas9であり、及び第2の部分は、ジンクフィンガーであるか、又は第1の部分は、CRISPR-Cas9であり、及び第2の部分は、CRISPR-Cas9であるか、又は第1の部分は、CRISPR-Cas9であり、及び第2の部分は、Cfp1であるか、又は第1の部分は、Cfp1であり、及び第2の部分は、TALEであるか、又は第1の部分は、Cfp1であり、及び第2の部分は、BATであるか、又は第1の部分は、Cfp1であり、及び第2の部分は、ジンクフィンガーであるか、又は第1の部分は、Cfp1であり、及び第2の部分は、CRISPR-Cas9であるか、又は第1の部分は、Cfp1であり、及び第2の部分は、Cfp1である。
一部の形態では、標的化塩基エディターの第1及び第2の部分の一方又は両方は、少なくとも1つのリンカーを含む。一部の形態では、第1及び第2の部分の一方又は両方は、少なくとも1つのリンカーを含み、それにより、リンカーは、プログラマブルDNA結合ドメインとスプリットデアミナーゼドメインとの間に位置する。一部の形態では、第1及び第2の部分の両方は、プログラマブルDNA結合ドメインとスプリットデアミナーゼドメインとの間にリンカーを含む。例示的なリンカーは、2~200アミノ酸長である。例えば、一部の形態では、リンカーは、2~16アミノ酸長である。
特定の形態では、リンカーは、GS、GSG、GSS又は配列番号23~27若しくは30のいずれかのアミノ酸配列を含む。リンカーは、従来技術で公知であるいずれかの形態のリジッド又はフレキシブルリンカーでもあり得る(例えば、下記ウェブサイトを参照されたい:ncbi.nlm.nih.gov/pmc/articles/PMC3726540/)。
塩基エディターは、標的DNA鎖上のプログラマブル結合ドメイン結合部位から所望の数の塩基対内に標的核酸を配置するように構成することができる。一部の形態では、塩基エディターは、標的核酸が標的DNA鎖上のプログラマブル結合ドメイン結合部位から9~11塩基対になるように構成される。一部の形態では、標的DNA鎖上の2つのプログラマブル結合ドメインの2つの結合部位間の距離は、12~22塩基対である。他の形態では、標的DNA鎖上の2つのプログラマブル結合ドメインの2つの結合部位間の距離は、14~19塩基対である。
典型的には、塩基エディターの第1及び第2の部分の少なくとも一方は、細胞ターゲティング部分を含む。一般に、第1及び第2の部分の両方は、細胞ターゲティング部分、例えば同じ細胞ターゲティング部分を含む。例示的な細胞ターゲティング部分としては、ミトコンドリアターゲティング配列(MTS)及び核局在化配列(NLS)がある。例示的なNLSとしては、配列番号34~39のいずれか1つのアミノ酸配列を含む。例示的なMTSは、配列番号22、69、71、182又は183のいずれか1つのアミノ酸配列を含む。
一部の形態では、標的化塩基エディターの第1及び第2の部分の少なくとも一方は、塩基除去修復阻害剤を含む。一部の形態では、塩基除去修復阻害剤は、哺乳類の核又はミトコンドリアDNAグリコシラーゼ阻害剤、例えばウラシルグリコシラーゼ阻害剤である。例示的な塩基除去修復阻害剤は、配列番号21又は70のいずれか1つを含むアミノ酸配列を有する。
開示されるデアミナーゼドメイン及び塩基エディターを使用する方法も提供される。一部の形態では、塩基エディターを用いて、標的核酸の塩基編集を行うことができる。例えば、標的核酸と標的化塩基エディターとを接触させるステップを含む方法が開示され、標的核酸は、二本鎖DNAであり、それにより、上記の標的ヌクレオチド配列の実体は、標的化塩基エディターによって脱アミノ化される。典型的には、標的ヌクレオチド配列中の脱アミノ化ヌクレオチドは、チミン又はグアニンヌクレオチドに変換される。この変換は、標的ヌクレオチド配列の塩基編集を完了させる。
本方法の一部の形態では、標的核酸は、ミトコンドリアDNAである。ヌクレオチドが脱アミノ化され得る例示的な標的ヌクレオチド配列としては、限定されないが、AC、CC、GC及びTCが挙げられる。一部の形態では、標的ヌクレオチド配列の最後のCは、標的化塩基エディターによって脱アミノ化される。一部の形態では、ミトコンドリアDNAにおける標的ヌクレオチド配列の実体は、ミトコンドリアDNA配列中に含まれる。塩基編集は、標的ヌクレオチド配列の実体が例えば塩基エディター標的DNA結合配列の1~25塩基(両端の値を含む)である場合に達成され得る。一部の形態では、標的ヌクレオチド配列の実体が塩基エディター標的DNA結合配列の15~20塩基(両端の値を含む)である場合、最適な塩基編集が達成される。一部の形態では、DNA標的領域内の塩基編集の活性ウィンドウは、リンカードメインの長さ、剛性若しくは柔軟性を変更するか、又はDNA結合ドメインの特異性若しくはタイプを変更するか、又は塩基エディターの2つの部分の一方若しくは両方でのスプリットデアミナーゼドメインの一方若しくは両方における分割部位を変更するか、又はデアミナーゼのタイプを変更するか、又はDNA結合部位間の距離を変更することによって増減される。例えば、一部の形態では、DNA標的領域内の塩基編集の活性ウィンドウは、塩基エディターの2つの部分の一方又は両方におけるリンカードメインの長さを増加させることによって拡張される。他の形態では、DNA標的領域内の塩基編集の活性ウィンドウは、塩基エディターの2つの部分の一方又は両方におけるリンカードメインの長さを増加させることによって縮小される。一部の形態では、DNA標的領域内の塩基編集の活性ウィンドウは、塩基エディターの2つの部分の一方又は両方におけるリンカードメインの長さを減少させることによって拡張される。他の形態では、DNA標的領域内の塩基編集の活性ウィンドウは、塩基エディターの2つの部分の一方又は両方におけるリンカードメインの長さを減少させることによって縮小される。一部の形態では、DNA標的領域内の塩基編集の活性ウィンドウは、塩基エディターの2つの部分の一方又は両方におけるDNA結合ドメインの特異性又はタイプを変更することによって拡張される。他の形態では、DNA標的領域内の塩基編集の活性ウィンドウは、塩基エディターの2つの部分の一方又は両方におけるDNA結合ドメインの特異性又はタイプを変更することによって縮小される。
一部の形態では、DNA標的領域内の塩基編集の活性ウィンドウは、塩基エディターの2つの部分の各々におけるスプリットデアミナーゼドメインの一方又は両方の分割部位を変更することによって拡張される。他の形態では、DNA標的領域内の塩基編集の活性ウィンドウは、塩基エディターの2つの部分の各々におけるスプリットデアミナーゼドメインの一方又は両方の分割部位を変更することによって縮小される。
標的核酸は、細胞内にあり得る。このように、本方法の一部の形態では、標的核酸と標的化塩基エディターとを接触させるステップは、細胞内への標的化塩基エディターの進入を促進することによって達成される。一部の形態では、細胞は、動物内にある。従って、本方法の一部の形態では、標的核酸と標的化塩基エディターとを接触させるステップは、標的化塩基エディターを動物に投与することによって達成される。
酵素的方法により、標的核酸中の修飾された(例えば、メチル化された)ヌクレオチドを同定する方法も記載される。具体的には、1つ以上の標的核酸と、シチジンの異なる修飾に対して活性が異なる1つ以上のデアミナーゼドメインとを接触させるステップと、続いて、標的核酸を配列決定するステップとを含む方法が開示される。例えば、一部の形態では、1つ以上のデアミナーゼドメインは、1つ以上の未修飾シトシン(C)、メチル化シトシン(mC)若しくはhmC、fC及びcaCなどの酸化mC塩基又はそれらの組合せの1つ以上に対して集合的又は個別に活性である。従って、一部の形態では、本方法は、1つ以上の標的核酸と、1つ以上の未修飾(C)、メチル化(mC)又は酸化mC塩基(例えば、hmC、fC及びcaC)などのシチジンの様々な修飾に対して活性が異なる1つ以上のデアミナーゼドメインとを接触させるステップと、続いて、標的核酸を配列決定するステップとを含む。
好ましくは、標的核酸は、二本鎖シトシンメチル化DNAであり、デアミナーゼドメインは、二本鎖DNAを脱アミノ化することができる。シトシンメチル化DNAとは、1つ、数個、多数又はほとんどのシトシンがメチル化されたDNAを指す。ゲノムDNAなどの天然DNAは、メチル化されたシトシンの一部のみを有する。例示的な二本鎖シトシンメチル化DNAとしては、植物ゲノムDNA、動物ゲノムDNA及びヒトゲノムDNAなどのゲノムDNAがある。一部の形態では、デアミナーゼドメインは、実質的に標的核酸中の非メチル化シトシンヌクレオチドのみを脱アミノ化する。一部の形態では、標的核酸中の非メチル化シトシンヌクレオチドの実質的に全ては、デアミナーゼドメインによって脱アミノ化されるが、修飾シチジンは、改変されない(又は未修飾塩基よりもはるかに少ない程度に改変される)。好ましくは、デアミナーゼドメインは、標的核酸中の非メチル化シトシンヌクレオチドの90%以上を脱アミノ化する。一部の形態では、デアミナーゼドメインは、標的核酸中の実質的に非メチル化シトシンヌクレオチドのみを集合的に脱アミノ化する。一部の形態では、標的核酸中の非メチル化シトシンヌクレオチドの実質的に全ては、デアミナーゼドメインによって集合的に脱アミノ化されるが、修飾シチジンは、改変されない(又は未修飾塩基よりもはるかに少ない程度に改変される)。好ましくは、デアミナーゼドメインは、標的核酸中の非メチル化シトシンヌクレオチドの90%以上を集合的に脱アミノ化する。脱アミノ化された標的核酸を配列決定することにより、標的核酸中のメチル化シトシンヌクレオチドが同定される(即ち、これらは、デアミナーゼによって編集されないシチジンである)。
生細胞の内部又は外部いずれかの標的核酸のプールで配列多様性を生成する方法も提供される。例えば、本明細書に開示されるデアミナーゼを使用して、非標的化塩基編集によってDNA配列のプールにランダムな非標的化変異を導入することができる。例示的な方法は、標的核酸のデアミナーゼドメインと標的核酸の複数のコピーとを、標的核酸の1コピー当たり平均0.1~5.0ヌクレオチドの脱アミノ化をもたらす時間にわたって且つそのような条件下で接触させることを含む。好ましくは、標的核酸は、二本鎖DNAであり、デアミナーゼドメインは、二本鎖DNAを脱アミノ化することができる。
一部の形態では、標的核酸のコピーは、インビトロである。一部の形態では、標的核酸のコピー中の脱アミノ化ヌクレオチドは、インビトロ反応を介してチミン又はグアニンヌクレオチドに変換される。一部の形態では、この方法は、脱アミノ化ヌクレオチドを標準的な対応物に、例えばdUからdT及びdIからdAに変換することをさらに含み、その後、限定されないが、mRNAディスプレイ、リボソームディスプレイ又はSELEXなどの選択手順が続く。一部の形態では、変換は、PCR増幅によって行われる。他の形態では、多様化されたDNAは、インビボ選択及び指向性進化適用のための細胞に形質変換される。DNA多様性生成のための方法は、とりわけ、多様化しようとする断片が、容易にPCR増幅できるサイズよりもはるかに大きい場合、ランダム化DNAを作製するためのエラープローンPCRに代わる手段を提供する。
一部の形態では、標的核酸のコピー中の脱アミノ化ヌクレオチドがチミン又はグアニンヌクレオチドに変換されると、変換は、標的核酸のコピーの一部又は全ての1つ以上の塩基編集を完了する。一部の形態では、標的核酸のコピー中の脱アミノ化ヌクレオチドは、細胞内で標的核酸のコピーをインキュベートすることによってチミン又はグアニンヌクレオチドに変換される。例えば、標的核酸のコピーは、細胞内にあり得、細胞内へのデアミナーゼドメインの進入を促進することにより、デアミナーゼドメインと標的核酸のコピーとを接触させる。
対象の細胞中のミトコンドリアDNA内の1つ以上の核酸を編集することにより、対象のミトコンドリア遺伝病を治療又は予防する方法も記載される。一部の形態では、この方法は、デアミナーゼドメインと、標的ヌクレオチド(又は標的ヌクレオチド近傍の配列)と相互作用するDNA相互作用ドメインとを含む標的化シトシンデアミナーゼ塩基エディターを細胞に導入し、ミトコンドリアDNA中の標的核酸は、標的化塩基エディターによって脱アミノ化される。一部の形態では、DNA相互作用ドメインは、その標的部位と相互作用するDNA結合ドメイン又は転写因子、即ちプロモーター又は複製起点と相互作用し、且つdsDNA上の特定の領域に沿ってデアミナーゼを運搬するRNA又はDNAポリメラーゼである。一部の形態では、標的ヌクレオチド配列中の脱アミノ化ヌクレオチドは、チミン又はグアニンヌクレオチドに変換される。典型的には、これらの方法は、ミトコンドリアDNAを非病原性形態に編集する。一部の形態では、脱アミノ化ヌクレオチドは、m.583G>A、m.616T>C、m.1606G>A、m.1644G>A、m.3258T>C、m.3271T>C、m.3460G>A、m.4298G>A、m.5728T>C、m.5650G>A、m.3243A>G、m.8344A>G、m.14459G>A、m.11778G>A、m.14484T>C、m.8993T>C、m.14484T>C、m.3460G>A及びm.1555A>Gから選択される位置にある。一部の形態では、細胞は、線維芽細胞、リンパ球、膵臓細胞、筋細胞、神経細胞及び幹細胞からなる群から選択される。
一部の形態では、細胞は、動物内にあり、デアミナーゼドメインと標的核酸のコピーとを接触させるステップは、デアミナーゼドメインを動物に投与することによって達成される。一部の形態では、標的核酸のコピーが細胞内にある場合、デアミナーゼドメインは、細胞内のトランスジェニック発現構築物(例えば、発現ベクター)によってコードされ得る。このような形態では、デアミナーゼドメインと標的核酸のコピーとを接触させるステップは、スタンドアローン型酵素或いはDNA結合ドメイン、転写因子又はDNA若しくはRNAポリメラーゼ(例えば、T7 RNAポリメラーゼなど)などの他のタンパク質ドメインとの融合としてデアミナーゼドメインを細胞内で一過性発現させることによって達成される。
標的化塩基エディターを含むか又は発現するベクターも提供される。例示的なベクターとして、改変アデノウイルス(AAV)ベクター又はレンチウイルスベクターが挙げられる。一部の形態では、標的化塩基エディターは、ベクター内にカプセル化される。一部の形態では、デアミナーゼドメインは、ベクター内に標的化塩基エディターを含む。
開示される方法のさらなる利点は、以下の説明に一部が記載され、説明から部分的に理解されるか、又は開示される方法及び組成物の実施によって知ることができる。開示される方法及び組成物の利点は、添付の特許請求の範囲で特に指摘される要素及び組合せによって実現及び達成されるであろう。以上の概要及び以下の詳細な説明の両方が例示的且つ説明的なものにすぎず、特許請求される本発明を限定するものではないことを理解されたい。
添付の図面は、開示される方法及び組成物のいくつかの実施形態を示し、この説明と共に開示の方法及び組成物の原理を説明するのに役立つ。
図1は、推定デアミナーゼドメインを生成して、実験的に評価及び特性評価し、二本鎖DNA(dsDNA)に対して活性のデアミナーゼを同定し、それらの編集コンテキスト特異性を決定するための段階的システムの概略図であり;pfamデータベースにおけるシチジンデアミナーゼ様(CDA)スーパーファミリーの各デアミナーゼタンパク質ファミリーからの複数のドメインは、無細胞インビトロ転写/翻訳(上から下に、DNA配列は、ATCCGATCAGAGCT(配列番号287)、5’-ATTTGATTAGAGTT-3’(配列番号289)及び3’-TAGGCTAGTTTTGA-5’(配列番号290)を含む)によって合成及び発現され、次にssDNA及びdsDNA基質を用いるアッセイにより特性決定して、次世代シーケンシング(NGS)技術を用いて鎖バイアス及び配列特異性を決定する。これらは、例示的な配列にすぎない。脱アミノ化アッセイに用いた実際の基質についての配列を図2に示す。NGSアッセイに使用される実際の基質は、配列番号73:TAATAATTATATTATTATTTTAAATTAATTATTTAACCGTGGTGCGCGGGGTCGCCCAGCAATAGTATAGGTTGTCGAGTATGAAGGGTCTAAAAGATTTTAAGACACCTTACGGACGAAGAGTTTCTCTCTTAGTCCCCTGATCTGCAGAACCCAGGATATCAAGCACATTTCACTTCACGTGTTTTGATGAAACTATACATCACCCGCGCCACAGGCGCTGTGCGGTTTATAATATATTATAATTTATATTTATATTAAATT(配列番号73)である。 図2A~2Cは、脱アミノ化アッセイにおける二本鎖(図2A、2B)又は一本鎖(図2C)FAM標識DNA基質に対するデアミナーゼドメインの活性を示すゲル電気泳動画像である。 図2A~2Cは、脱アミノ化アッセイにおける二本鎖(図2A、2B)又は一本鎖(図2C)FAM標識DNA基質に対するデアミナーゼドメインの活性を示すゲル電気泳動画像である。 図2Dは、それぞれデアミナーゼドメインBE_R1_11、BE_R1_12、BE_R1_28及びBE_R1_41の各々のそれぞれ非存在(-)又は存在(+)下で二本鎖DNA基質に対する表示デアミナーゼドメインの活性を示すゲル電気泳動画像であり、レーン1~6の各々は、以下の配列:(1)A[15]TGCGCCA[15](配列番号268)、(2)A[15]ACA[15](配列番号269)、(3)A[15]CCA[15](配列番号270)、(4)A[15]GCA[15](配列番号271)、(5)A[15]TCA[15](配列番号272)、(6)A[15]ACGCCTCA[15](配列番号273)(ssDNA基質配列)を含む。二本鎖DNA基質の場合、相補鎖は、所与の基質にアニーリングされた。 図3A~3Bは、DNA脱アミノ化アッセイについてのNGS(図3A)及びサンガー(Sanger)シーケンシング(図3B;上から下に、配列:ATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCCAGGGTGGTTT(配列番号29)、及びATGAATCGGTCAATGCGTGGGGAGAGGTGGTTTGTGTATTGGGTGCCAGGGTGGTTT(配列番号292)に対するデアミナーゼ活性を示す)結果を示す画像である。これらの図は、dsDNAに対するdsCDA処理の結果を示すデータの一部の例を明らかにする。 図3A~3Bは、DNA脱アミノ化アッセイについてのNGS(図3A)及びサンガー(Sanger)シーケンシング(図3B;上から下に、配列:ATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCCAGGGTGGTTT(配列番号29)、及びATGAATCGGTCAATGCGTGGGGAGAGGTGGTTTGTGTATTGGGTGCCAGGGTGGTTT(配列番号292)に対するデアミナーゼ活性を示す)結果を示す画像である。これらの図は、dsDNAに対するdsCDA処理の結果を示すデータの一部の例を明らかにする。 図4A~4Bは、それぞれ編集閾値レベル50%(図4A)及び25%(図4B)での編集効率に基づく表示デアミナーゼと一緒にインキュベートされたdsDNA基質中の変異シトシンにフランキングする領域の確率シーケンスロゴである。図4Aは、(上の列)いかなるコンテキストでもシチジンを編集することができるコンテキスト非依存性デアミナーゼ(混合型特異性を有する)(NCN)の例と、(下2列)シチジンの前にある特定の配列に対して特異的である識別コンテキスト依存性デアミナーゼの例とを示す。 図5は、単独であるか又は結合されたかのいずれかのスプリットデアミナーゼのデアミナーゼ活性を示す。DNA基質に対するBE11、BE12及びBE28デアミナーゼドメインの様々なN及びC末端半分の活性は、それぞれデアミナーゼの各種について、対照並びにrN末端断片(N1、N2、N3、N4、N5)及び5つのC末端断片(C1、C2、C3、C4、C5)の各々を単独及び組み合わせて比較するゲル電気泳動画像により示し;塩基エディターのN及びC末端部分の図は、試験した塩基エディター内のN又はC末端デアミナーゼ(Deam_N/Deam_C)の相対立体配置を示す。 図6は、dsDNAに対して活性又は不活性であるMafB19-deamファミリーのメンバーの配列アラインメントロゴを、このデアミナーゼファミリーのdsDNA特異的メンバーに存在するシグネチャモチーフと一緒に示し、このモチーフは、上記のファミリーの追加のdsDNA特異的デアミナーゼを同定するためのシグネチャとして使用することができる。 図7は、MafB19-deamファミリー内の明瞭な枝を示し、そこに、上記のファミリーの同定されたdsDNA特異的デアミナーゼのほとんどが位置する。 図8は、dsDNAに対して活性又は不活性であるSCP1201-deamファミリーのメンバーの配列アラインメントロゴを、このデアミナーゼファミリーのdsDNA特異的メンバーに存在するシグネチャモチーフと一緒に示し、このモチーフは、上記のファミリーの追加のdsDNA特異的デアミナーゼを同定するためのシグネチャとして使用することができる。 図9は、塩基エディターの迅速な試験のためのインビトロシステムの概略図である。塩基エディターは、デザイナーTALEの下流にあるデアミナーゼドメインをクローニングすることによって作製される。カセット全体をT7プロモーターの下流にクローニングし、インビトロ翻訳(IVT)反応のテンプレートとして使用する。標的(目的のDNA結合ドメイン、例えば、デザイナーTALEの結合部位をコードする)をプラスミド上にクローニングし、次にこれをIVT反応におけるdsDNA基質として使用した。IVTシステム中に発現させると、塩基エディタータンパク質(例えば、TALE-デアミナーゼ融合タンパク質)が基質プラスミド上のその標的に結合し、標的プラスミドに編集を導入する。次に、基質プラスミドをPCR増幅し、編集の位置/頻度をシーケンシング又はT7エンドヌクレアーゼアッセイのいずれかによって決定する。 図10A~10Cは、それぞれBER1_11、BE_R1_12、BE_R1_28又はBE_R1_41と一緒インキュベートされた、様々なdsDNA基質ACACACACACACACAC(配列番号191)(図10A)、ACGTGTACACGTACGT(配列番号192)、GCGCGCGCGCGCGCGCG(配列番号(配列番号194)(図10B)又はTCGAGATCTCGATCGA(配列番号195)、TCTCTCTCTCTCTCTC(配列番号196)及びCCCCCCCCCCCCCCCC(配列番号197)(図10C)において標的化シトシンにフランキングする領域のNGSシーケンシングから得られた確率シーケンスロゴ結果である。 図10A~10Cは、それぞれBER1_11、BE_R1_12、BE_R1_28又はBE_R1_41と一緒インキュベートされた、様々なdsDNA基質ACACACACACACACAC(配列番号191)(図10A)、ACGTGTACACGTACGT(配列番号192)、GCGCGCGCGCGCGCGCG(配列番号(配列番号194)(図10B)又はTCGAGATCTCGATCGA(配列番号195)、TCTCTCTCTCTCTCTC(配列番号196)及びCCCCCCCCCCCCCCCC(配列番号197)(図10C)において標的化シトシンにフランキングする領域のNGSシーケンシングから得られた確率シーケンスロゴ結果である。 図11A~11Bは、(図11A)図9のスキームの修飾に基づいて、デザイナーTALE(TALE_左及びTALE_右と呼ばれる)の下流にデアミナーゼ分割ドメインをクローニングするためのインビトロシステムの概略を示す図であり;(図11B)BE_R1_12に基づく異なるスプリット塩基エディター設計戦略であり、以下を示す:BE_R1_12(wt)、不活性な「不活性型」タンパク質における変異活性部位配列(HAEからHAA)並びに3つの異なる短縮型タンパク質20、40及び60。TALE左(L)及び右(R)ドメインの付加を含むドメイン構成、さらに結果として得られる結合した機能性塩基エディターも示され、これは、TALE L及びR結合ドメインを用いて標的DNAで共局在する。 図11A~11Bは、(図11A)図9のスキームの修飾に基づいて、デザイナーTALE(TALE_左及びTALE_右と呼ばれる)の下流にデアミナーゼ分割ドメインをクローニングするためのインビトロシステムの概略を示す図であり;(図11B)BE_R1_12に基づく異なるスプリット塩基エディター設計戦略であり、以下を示す:BE_R1_12(wt)、不活性な「不活性型」タンパク質における変異活性部位配列(HAEからHAA)並びに3つの異なる短縮型タンパク質20、40及び60。TALE左(L)及び右(R)ドメインの付加を含むドメイン構成、さらに結果として得られる結合した機能性塩基エディターも示され、これは、TALE L及びR結合ドメインを用いて標的DNAで共局在する。 図12は、TALE_Rのみ(対照)並びにそれぞれTALE_Lのみ(対照)又はTALE_L及び不活性な「不活性型」BE_R1_12タンパク質における変異活性部位配列(HAEからHAA)と組み合わせた、TALE_R_BE_R1_12(短縮型20、40又は60)を含む図11に記載した異なる塩基エディター設計の各々について、標的(ポリシトシン)DNA基質に対する塩基エディターデアミナーゼ活性の結果を示す図である。編集済塩基(CからT)は、各構築物ペアについて示されるシーケンシングデータ、それぞれCCCCCCCCCCCCCCCC(配列番号197)、CCCCCCCTTTTTTCCC(配列番号198)、CCCCCCTTTTTTTCCC(配列番号199)に表示される。部分的編集は、サンガークロマトグラムで混合型ピークとして示される。このような場合、ベースコーリングソフトウェアは、コンセンサス塩基として主要ピークを要求するが、実際には、その位置は、塩基の混合物を含む。 図13は、多様な異なる標的DNA基質:CCCCCCCCCCCCCCCC(配列番号197)、ACACACACACACACAC(配列番号191)、ACGTACGTACGTACGT(配列番号200)、CCGGCCGGCCGGCCGG(配列番号201)及びGCGCGCGCGCGCGCGC(配列番号202)、CTCTCTCTCTCTCTCT(配列番号203)又はTCGATCGATCGATCGA(配列番号204)に対する塩基エディターデアミナーゼ活性の結果並びにTALE_Lと組み合わせた塩基エディターTALE_R_BE_R1_12(短縮型30)及び不活性な「不活性型」BE_R1_12タンパク質における変異活性部位配列(HAEからHAA)の配列コンテキストを示す図である。編集済塩基(CからT)は、各基質について示されるシーケンシングデータに表示され、CCCCCCCTTTTTTCCC(配列番号205)、ACACACACATACACAC(配列番号191)、ACGTGTATATGTACGT(配列番号192)、ACGTGTATATGTACGT(配列番号206)、GCGCGCGCGTGCGCGC(配列番号207)、TCTTTTTTTTTTTCTC(配列番号208)、TCGAGATCTCGATCGA(配列番号195)又はTCGAGATCTTGATCGA(配列番号209)をそれぞれ含む。部分的編集は、サンガークロマトグラムの混合型ピークとして示される。このような場合、ベースコーリングソフトウェアは、コンセンサス塩基として主要ピークを要求するが、実際には、その位置は、塩基の混合物を含む。 図14は、塩基エディターの活性の編集ウィンドウを識別して、最適化する実験を示す図である。この図は、設計戦略並びにTALE L及びR結合ドメインを用いて標的DNAで共局在化する、結合された機能性塩基エディター並びに位置G43又はG108(HVE結合部位の両側に位置する)でwt BE_R1_41を分割し、次いでデアミナーゼドメイン全体を4つの方法の各々で再結合することによって得られる4つの異なる切断変異体を含む、BE_R1_41に基づく4つの異なる塩基エディターの各々について、標的(ポリシトシン)DNA基質CCCCCCCCCCCCCCCC(配列番号197)に対する塩基エディターデアミナーゼ活性の結果を示す。編集済塩基(CからT)は、各基質について示されるシーケンシングデータに表示され、CCCCCCTTTTTTCCCC(配列番号210)、CCCCCCTTTTTTTCCC(配列番号199)、CCCCCCCTTTTTTTTC(配列番号211)をそれぞれ含む。対応する活性の位置ウィンドウが描かれ、各設計について定量化される。 図15は、TALE L及びRドメインを用いて、2つの活性部位を有するG108(N)及びG43(C)で切断されたBE_R1_41を再結合することにより形成された塩基エディター並びにTALE L及びRドメインを用いて、1つの活性部位を有するG108(N)及びG108(C)で切断されたBE_R1_41を再結合して形成することにより形成された塩基エディターについて、それぞれ様々な異なる標的DNA基質:CCCCCCCCCCCCCCCC(配列番号197)、ACACACACACACACAC(配列番号191)、ACGTACGTACGTACGT(配列番号200)、CCGGCCGGCCGGCCGG(配列番号201)及びGCGCGCGCGCGCGCGC(配列番号202)、TCTCTCTCTCTCTCTC(配列番号196)、GAGAGAGAGAGAGAGA(配列番号212)又はTCGATCGATCGATCGA(配列番号204)に対する塩基エディターデアミナーゼ活性の結果を示す図である。編集済塩基(CからT)は、各基質について示されるシーケンシングデータに表示され、CCCCCCCTTTTTCCCC(配列番号213)、CCCCCCCCCTTTTCC(配列番号214)、ACACACACATACACA(配列番号215)、ACGTGTATATGTACGT(配列番号206)、CCGGCCGGTTGGCCGG(配列番号216)、TCTTTTTTTTTTTCTC(配列番号217)、TCTCTCTCTTTCTCTC(配列番号218)、GAGAAAAAAAAAGAGA(配列番号219)若しくはTCGAGATCTTGATCGA(配列番号209)又はTCGAGATTTTGATCGA(配列番号220)をそれぞれ含む。 図16A~16Cは、陰性対照(エディターなし)並びにTALE L及びRドメインを用いて、2つの活性部位を有するG108(N)及びG43(C)で切断されたBE_R1_41を再結合することにより形成された塩基エディター、さらにTALE L及びRドメインを用いて、1つの活性部位を有するG108(N)及びG108(C)で切断されたBE_R1_41を再結合して形成することにより形成された塩基エディターの各々について、それぞれ以下の3つ:CCCCCCCCCCCCCCCC(配列番号197)、ACGTACGTACGTACGT(配列番号200)、TCTCTCTCTCTCTCTC(配列番号196)(図16A)及び以下の2つ:GAGAGAGAGAGAGAGA(配列番号212)、TCGATCGATCGATCGA(配列番号204)(図16B)並びに以下の3つ:CCGGCCGGCCGGCCGG(配列番号201)、ACACACACATACACAC(配列番号191)又はGCGCGCGCGCGCGCGC(配列番号202)(図16C)の異なるDNA基質の各々に対する塩基エディターデアミナーゼ活性の結果を示す図である。各基質についてそれぞれ示されるシーケンシングデータに編集済塩基(CからT)が表示される。対応する活性の位置ウィンドウが描かれ、各設計について定量化される。 図16A~16Cは、陰性対照(エディターなし)並びにTALE L及びRドメインを用いて、2つの活性部位を有するG108(N)及びG43(C)で切断されたBE_R1_41を再結合することにより形成された塩基エディター、さらにTALE L及びRドメインを用いて、1つの活性部位を有するG108(N)及びG108(C)で切断されたBE_R1_41を再結合して形成することにより形成された塩基エディターの各々について、それぞれ以下の3つ:CCCCCCCCCCCCCCCC(配列番号197)、ACGTACGTACGTACGT(配列番号200)、TCTCTCTCTCTCTCTC(配列番号196)(図16A)及び以下の2つ:GAGAGAGAGAGAGAGA(配列番号212)、TCGATCGATCGATCGA(配列番号204)(図16B)並びに以下の3つ:CCGGCCGGCCGGCCGG(配列番号201)、ACACACACATACACAC(配列番号191)又はGCGCGCGCGCGCGCGC(配列番号202)(図16C)の異なるDNA基質の各々に対する塩基エディターデアミナーゼ活性の結果を示す図である。各基質についてそれぞれ示されるシーケンシングデータに編集済塩基(CからT)が表示される。対応する活性の位置ウィンドウが描かれ、各設計について定量化される。 図16A~16Cは、陰性対照(エディターなし)並びにTALE L及びRドメインを用いて、2つの活性部位を有するG108(N)及びG43(C)で切断されたBE_R1_41を再結合することにより形成された塩基エディター、さらにTALE L及びRドメインを用いて、1つの活性部位を有するG108(N)及びG108(C)で切断されたBE_R1_41を再結合して形成することにより形成された塩基エディターの各々について、それぞれ以下の3つ:CCCCCCCCCCCCCCCC(配列番号197)、ACGTACGTACGTACGT(配列番号200)、TCTCTCTCTCTCTCTC(配列番号196)(図16A)及び以下の2つ:GAGAGAGAGAGAGAGA(配列番号212)、TCGATCGATCGATCGA(配列番号204)(図16B)並びに以下の3つ:CCGGCCGGCCGGCCGG(配列番号201)、ACACACACATACACAC(配列番号191)又はGCGCGCGCGCGCGCGC(配列番号202)(図16C)の異なるDNA基質の各々に対する塩基エディターデアミナーゼ活性の結果を示す図である。各基質についてそれぞれ示されるシーケンシングデータに編集済塩基(CからT)が表示される。対応する活性の位置ウィンドウが描かれ、各設計について定量化される。 図17A~17Bは、標的領域上の正鎖及び逆鎖に対するスプリットデアミナーゼ塩基エディター及び活性ウィンドウの位置の予測モデル(図17A)並びにそのモデルを確認するデータ(図17B)を示す。図17Bは、G108(N)及びG108(C)で切断されたBE_R1_41を再結合することにより形成された塩基エディターのデアミナーゼ分割半分(1つの活性部位を有する)をTALE L及びR結合ドメインと交換して、ポリC又はポリG DNA基質:CCCCCCCCCCCCCCCC(配列番号197)及びGGGGGGGGGGGGGGGG(配列番号221)に対する編集効率及び活性ウィンドウの位置を評価するアッセイの結果を示す図である。編集済塩基(CからT又はGからA)は、各基質について示されるシーケンシングデータに表示され、CCCCCCCCTTTTTTTC(配列番号197)、CCCCCCCCCCCCCTCC(配列番号222)及びGGAGGGGGGGGGGGGG(配列番号223)をそれぞれ含む。 図17A~17Bは、標的領域上の正鎖及び逆鎖に対するスプリットデアミナーゼ塩基エディター及び活性ウィンドウの位置の予測モデル(図17A)並びにそのモデルを確認するデータ(図17B)を示す。図17Bは、G108(N)及びG108(C)で切断されたBE_R1_41を再結合することにより形成された塩基エディターのデアミナーゼ分割半分(1つの活性部位を有する)をTALE L及びR結合ドメインと交換して、ポリC又はポリG DNA基質:CCCCCCCCCCCCCCCC(配列番号197)及びGGGGGGGGGGGGGGGG(配列番号221)に対する編集効率及び活性ウィンドウの位置を評価するアッセイの結果を示す図である。編集済塩基(CからT又はGからA)は、各基質について示されるシーケンシングデータに表示され、CCCCCCCCTTTTTTTC(配列番号197)、CCCCCCCCCCCCCTCC(配列番号222)及びGGAGGGGGGGGGGGGG(配列番号223)をそれぞれ含む。 図18は、TALE L及びRドメインを用いて、2つの活性部位を有するG108(N)及びG43(C)で切断されたBE_R1_41を再結合することにより形成される塩基エディター並びにTALE Lドメイン及びRドメインを用いて、1つの活性部位を有するG108(N)及びG108(C)で切断されたBE_R1_41を再結合することにより形成される塩基エディターについて、標的DNA基質に対する推定塩基エディター活性ウィンドウを示す図であり、上記のTALE Lドメイン及びRドメインは、それぞれDNA配列TCTAGCCTAGCCGTTTXXXXXXXXXXXXXXXXAGGGTGAGCATCAAACTCA(配列番号224)に結合する。デアミナーゼの性質に基づくらせん状DNA変化との相互作用の関数として示される対応する活性の位置ウィンドウは、周期的及び非対称的な活性ウィンドウを示す。活性ウィンドウの区間及び位置は、本文に記載されるように、位置分割設計(即ち2つのデアミナーゼ半分の各々の分割/切断部位の位置)、リンカーのタイプ、DNA結合ドメインなどの複数の要因に依存する。 図19は、各々TALE L及びRドメインを用いて、BE_R4_7、BE_R4_12、BE_R4_13、BE_R4_17、BE_R4_18、BE_R4_19、BE_R4_20及びBE_R4_21を再結合することにより形成される塩基エディターの各々について、ポリC標的DNA基質CCCCCCCCCCCCCCCC(配列番号197)に対する塩基エディターデアミナーゼ活性の結果を示す図である。編集済塩基(CからT)は、それぞれ各基質について示されるシーケンシングデータに表示される。対応する活性の位置ウィンドウが描かれ、各設計について定量化される。 図20は、TALE L及びRドメインを用いて、2つの活性部位を有するG108(N)及びG43(C)で切断されたBE_R1_41を再結合することにより形成された塩基エディターについて、異なる長さの様々な標的DNA基質(それぞれCCCCC(配列番号225)、CCCCCC(配列番号226)、CCCCCCC(配列番号227)、CCCCCCCC(配列番号228)、CCCCCCCCC(配列番号229)、CCCCCCCCCC(配列番号230)、CCCCCCCCCCC(配列番号231)、CCCCCCCCCCCC(配列番号232)、CCCCCCCCCCCCC(配列番号233)、CCCCCCCCCCCCCC(配列番号234)、CCCCCCCCCCCCCCC(配列番号235)、CCCCCCCCCCCCCCCC(配列番号236)、CCCCCCCCCCCCCCCCC(配列番号237)、CCCCCCCCCCCCCCCCCC(配列番号238)、CCCCCCCCCCCCCCCCCCC(配列番号239)、CCCCCCCCCCCCCCCCCCCC(配列番号240)の配列を有するポリC5~PolyC20)に対する推定塩基エディターデアミナーゼ活性を示す図である。編集済塩基(CからT)は、各基質について示されるシーケンシングデータに表示され、CCCCCCTTTTTCCC(配列番号241)、CCCCCCCTTTTTCCCC(配列番号242)、CCCCCCCCTTTTTCCCC(配列番号243)、CCCCCCCCTTTTTTTCCCC(配列番号244)、CCCCCCCCCCCTTTCCCCCC(配列番号245)をそれぞれ含む。対応する活性の位置ウィンドウが描かれ、各設計について定量化される。 図21A~21Bは、TALE L及びRドメイン、又はBAT_L及びTALE_Rドメイン、又はTALE_L及びBAT_R結合ドメインのいずれかを用いて、2つの活性部位を有するG108(N)及びG43(C)で切断されたBE_R1_41を再結合することにより形成された塩基エディターについて、それぞれ様々な標的DNA基質に対する推定塩基エディターデアミナーゼ活性を示す。図21Aは、異なる長さの様々な標的DNA基質(CCCCCCCCCC(配列番号230)、CCCCCCCCCCCC(配列番号232)、CCCCCCCCCCCCCC(配列番号234)、CCCCCCCCCCCCCCC(配列番号235)、CCCCCCCCCCCCCCCC(配列番号236)、CCCCCCCCCCCCCCCCCC(配列番号238)をそれぞれ含み、CCCCCCTTTTTCCC(配列番号241)、CCCCCCCTTTTTCCCC(配列番号242)、CCCCCCTTTTTCCCC(配列番号246)、CCCCCCCCCTTTCCC(配列番号247)、CCCCCCCCCTTTCCCC(配列番号248)、CCCCCCCCCTTTTTCCCC(配列番号249)、CCCCCCCCCTTTTCCCCC(配列番号250)をそれぞれ含むポリC10~PolyC18)に対する前述した塩基エディターの効果を示す。図21Bは、ポリC16基質に対する上記の塩基エディターデアミナーゼの効果を示し、これは、DNA結合ドメインの性質が塩基エディターの活性ウィンドウ及び編集効率に影響を与えることを立証する。編集済塩基(CからT)は、各基質について示されるシーケンシングデータに表示され、CCCCCCTTTTTCCCC(配列番号246)、CCCCCCCCCTTTCCC(配列番号247)及びCCCCCCCTTTCCCCCC(配列番号251)をそれぞれ含む。対応する活性の位置ウィンドウが描かれ、各設計について定量化される。 図21A~21Bは、TALE L及びRドメイン、又はBAT_L及びTALE_Rドメイン、又はTALE_L及びBAT_R結合ドメインのいずれかを用いて、2つの活性部位を有するG108(N)及びG43(C)で切断されたBE_R1_41を再結合することにより形成された塩基エディターについて、それぞれ様々な標的DNA基質に対する推定塩基エディターデアミナーゼ活性を示す。図21Aは、異なる長さの様々な標的DNA基質(CCCCCCCCCC(配列番号230)、CCCCCCCCCCCC(配列番号232)、CCCCCCCCCCCCCC(配列番号234)、CCCCCCCCCCCCCCC(配列番号235)、CCCCCCCCCCCCCCCC(配列番号236)、CCCCCCCCCCCCCCCCCC(配列番号238)をそれぞれ含み、CCCCCCTTTTTCCC(配列番号241)、CCCCCCCTTTTTCCCC(配列番号242)、CCCCCCTTTTTCCCC(配列番号246)、CCCCCCCCCTTTCCC(配列番号247)、CCCCCCCCCTTTCCCC(配列番号248)、CCCCCCCCCTTTTTCCCC(配列番号249)、CCCCCCCCCTTTTCCCCC(配列番号250)をそれぞれ含むポリC10~PolyC18)に対する前述した塩基エディターの効果を示す。図21Bは、ポリC16基質に対する上記の塩基エディターデアミナーゼの効果を示し、これは、DNA結合ドメインの性質が塩基エディターの活性ウィンドウ及び編集効率に影響を与えることを立証する。編集済塩基(CからT)は、各基質について示されるシーケンシングデータに表示され、CCCCCCTTTTTCCCC(配列番号246)、CCCCCCCCCTTTCCC(配列番号247)及びCCCCCCCTTTCCCCCC(配列番号251)をそれぞれ含む。対応する活性の位置ウィンドウが描かれ、各設計について定量化される。 図22は、BE_R1_41に基づき、異なるスプリット塩基エディターの設計戦略を示す図であり、柔軟性及び活性ウィンドウサイズを増強するために、各々がTALE左(L)及び右(R)ドメイン並びにコイルドコイル(「コイル」)ドメインが付加されたBE_R1_41(N又はC)断片を含むドメイン構成を示す。編集(CからT)を示すCCCCCCCCCCCCCCCC(配列番号236)基質からの編集済塩基は、各基質についてそれぞれ示されるシーケンシングデータに表示され、CCCCCCTTTTTTTCCC(配列番号252)、CCCCCCCTTTTTTTTC(配列番号253)及びTTTTTTTTTTTTCCCC配列番号254)をそれぞれ含む。 図23A~23Bは、標的塩基の最適位置を示すデータを示す。図23Aは、5つの異なる標的DNA基質の各々に対する、TALE_R_BE_R1_12(短縮型60)と組み合わせた塩基エディターTALE_L_「不活性型」dBE_R1_12の塩基エディターデアミナーゼ活性の結果を示す図であり、上記の基質は、病原性ミトコンドリア変異である、マウスミトコンドリアにおけるmCox1 V421A(C6589のTへの変換に相当)の修正にそれぞれ対応し、TALE結合部位に対するC6589の単一塩基シフトを有し、GTAGGAGCAACATAA(配列番号255)、CGTAGGAGCAACATA(配列番号256)、TCGTAGGAGCAACAT(配列番号257)、TTCGTAGGAGCAACA(配列番号258)、ATTCGTAGGAGCAAC(配列番号259)をそれぞれ含む。編集済塩基(CからT)は、各基質について示されるシーケンシングデータに表示され、それぞれTCGTAGGAGTAAACAT(配列番号260)を含む。対応する活性の位置ウィンドウが描かれ、各設計について定量化される。編集済塩基(C6589 CからT)は、このC残基が左側TALE結合部位から10bp(二重らせんの1ターンに相当)離れている場合に存在する。図23Bは、C6589(距離=8~12)及びC6593(距離=12~16)におけるCヌクレオチド各々の左側TALE結合部位から標的dCまでの距離にわたるdC-dT編集効率のグラフである。この例では、C6589が標的塩基であり、C6593がバイスタンダー塩基である。この手法(標的ウィンドウを1度に1bpスライドさせる)を使用して、標的塩基の編集効率を最大化すると共に、任意の所与の標的関するバイスタンダー塩基の編集を最小化することができる。 図23A~23Bは、標的塩基の最適位置を示すデータを示す。図23Aは、5つの異なる標的DNA基質の各々に対する、TALE_R_BE_R1_12(短縮型60)と組み合わせた塩基エディターTALE_L_「不活性型」dBE_R1_12の塩基エディターデアミナーゼ活性の結果を示す図であり、上記の基質は、病原性ミトコンドリア変異である、マウスミトコンドリアにおけるmCox1 V421A(C6589のTへの変換に相当)の修正にそれぞれ対応し、TALE結合部位に対するC6589の単一塩基シフトを有し、GTAGGAGCAACATAA(配列番号255)、CGTAGGAGCAACATA(配列番号256)、TCGTAGGAGCAACAT(配列番号257)、TTCGTAGGAGCAACA(配列番号258)、ATTCGTAGGAGCAAC(配列番号259)をそれぞれ含む。編集済塩基(CからT)は、各基質について示されるシーケンシングデータに表示され、それぞれTCGTAGGAGTAAACAT(配列番号260)を含む。対応する活性の位置ウィンドウが描かれ、各設計について定量化される。編集済塩基(C6589 CからT)は、このC残基が左側TALE結合部位から10bp(二重らせんの1ターンに相当)離れている場合に存在する。図23Bは、C6589(距離=8~12)及びC6593(距離=12~16)におけるCヌクレオチド各々の左側TALE結合部位から標的dCまでの距離にわたるdC-dT編集効率のグラフである。この例では、C6589が標的塩基であり、C6593がバイスタンダー塩基である。この手法(標的ウィンドウを1度に1bpスライドさせる)を使用して、標的塩基の編集効率を最大化すると共に、任意の所与の標的関するバイスタンダー塩基の編集を最小化することができる。 図24は、図10~23に示すデータに従って決定された活性ウィンドウの長さと位置及び異なるスプリット塩基エディターの設計ルールに影響を与える要因を要約した図である。2部スプリット塩基エディターの各部分が二本鎖標的DNAの各対向鎖上に示され、各核酸がXとして示されている。スプリット塩基エディターの各部分は、DNA結合ドメインと、リンカーを介して連結されたデアミナーゼN又はCドメインとを含む(Nドメインが5’DNA鎖に結合し、Cドメインが3’DNA鎖に結合して示されている)。図示される例では、DNA結合ドメイン認識部位同士の距離は、合計19残基であると示され、デアミナーゼ活性ウィンドウは、3つの核酸のオーバーラップを有する各鎖上の7つの核酸を含む(矢印で示す)。 図25A~25Bは、(図25A)スプリットBE12塩基エディターの2つの部分の各々のドメイン構成の概略図を示し、MTSターゲティング配列を含むスプリットデアミナーゼ(「不活性型」dBE_12-N-TALE_L;及びBE_12-C-TALE_R)の各々は、UGI(ミトコンドリアウラシルDNAグリコシラーゼの活性を制限するため)及びGFP(左側TALE融合物の場合)又はmKate(右TALE融合物の場合)に融合され、その結果、TALE L及びR結合ドメインを用いて標的ミトコンドリアDNA(hND1遺伝子)に共局在する結合された機能性塩基エディターが得られ;並びに(図25B)HEK293T細胞株における異なるBE_12に基づくデアミナーゼ切断変異体で共トランスフェクトされたBE_12-不活性型を用いたhND1遺伝子座での塩基編集の結果を示す顕微鏡写真であり、編集されたサンプルにおけるT7エンドヌクレアーゼによる予想切断産物の位置が矢印で示される。 図25A~25Bは、(図25A)スプリットBE12塩基エディターの2つの部分の各々のドメイン構成の概略図を示し、MTSターゲティング配列を含むスプリットデアミナーゼ(「不活性型」dBE_12-N-TALE_L;及びBE_12-C-TALE_R)の各々は、UGI(ミトコンドリアウラシルDNAグリコシラーゼの活性を制限するため)及びGFP(左側TALE融合物の場合)又はmKate(右TALE融合物の場合)に融合され、その結果、TALE L及びR結合ドメインを用いて標的ミトコンドリアDNA(hND1遺伝子)に共局在する結合された機能性塩基エディターが得られ;並びに(図25B)HEK293T細胞株における異なるBE_12に基づくデアミナーゼ切断変異体で共トランスフェクトされたBE_12-不活性型を用いたhND1遺伝子座での塩基編集の結果を示す顕微鏡写真であり、編集されたサンプルにおけるT7エンドヌクレアーゼによる予想切断産物の位置が矢印で示される。 図26は、BE12又はBE41に基づくスプリット塩基エディターのドメイン構成の概略図であり、スプリットデアミナーゼの各々は、TALE_L及びTALE_R DNA結合ドメイン、それぞれG108(N)及びG43(C)で切断された不活性型dBE12又はBE41のいずれかに対するUGI(ミトコンドリアウラシルDNAグリコシラーゼの活性を制限するため)及びGFP(左側TALE若しくはBAT融合物の場合)又はmKate(右TALE若しくはBAT融合物の場合)に融合されたMTSターゲティング配列を含む。標的遺伝子座(hND1)(ACTCAATCCTCTGATC(配列番号261))における編集済塩基(CからT)は、各基質についてそれぞれ示されるシーケンシングデータに表示される。 図27A~27Bは、(図27A)ミトコンドリアhND1遺伝子をターゲティングする4つのスプリットBE41塩基エディターの各々のドメイン構成の概略図を示し、スプリットデアミナーゼは、TALE DNA結合ドメイン(TALE_L-BE_41-N(1);及びTALE_R-BE_41-C(2))又はBAT結合ドメイン(BAT_L-BE_41-N(3);及びBAT_R-BE_41-C(4))のいずれかをそれぞれ含み、それらの各々は、UGI(ミトコンドリアウラシルDNAグリコシラーゼの活性を制限するため)及びGFP(左側TALE又はBAT融合物の場合)又はmKate(右TALE又はBAT融合物の場合)に融合したMTSターゲティング配列を含み;並びに(図27B)HEK293T細胞株における図27Aに示したN-((1)又は(2))とC-((1)又は(2))構築物の異なる組合せの結果を示す顕微鏡写真であり、編集されたサンプルにおけるT7エンドヌクレアーゼによる予想切断産物の位置が矢印で示される。 図28A~28Bは、(図28A)スプリットBE41塩基エディターの2つの部分のドメイン構成の概略図を示し、スプリットデアミナーゼの各々は、左側TALE DNA結合ドメイン(TALE_L-BE_41-N)又は右側ジンクフィンガー(ZF_R2)のいずれかを含み、その各々は、UGI(ミトコンドリアウラシルDNAグリコシラーゼの活性を制限するため)及びGFP(左側のTALE又はBAT融合の場合)又はmKate(右側のTALE又はBAT融合の場合)に融合したMTSターゲティング配列を含み;並びに(図28B)標的化DNA(ACTCAATCCTCTGATC(配列番号261))中の編集済塩基(CからT)は、シーケンシングデータに表示され、処理DNAサンプル及び対照DNAサンプルについて示され、対応する活性の位置ウィンドウが各設計についてそれぞれ描かれ、定量化される。 図29A~29Bは、2つの単一AAV塩基エディター設計のドメイン構成の概略図を示し、これは、MTSターゲティング配列、P2Aに融合し、且つUGI(ミトコンドリアウラシルDNAグリコシラーゼの活性を制限するため)に融合したMTS-BE_41-N、GFPと直接融合したジンクフィンガー左側(ZF_L)DNA結合ドメイン、即ちBE_41-C;GFPに融合した右側ZF;又はMTSターゲティング配列及びUGIに融合した(ミトコンドリアウラシルDNAグリコシラーゼの活性を制限するため)MTS-BE_41-Nと直接融合したTAA_IRESに融合したジンクフィンガー左側(ZF_L)DNA結合ドメイン、即ちBE_41-C、GFPに融合した右側ZFを含む(図29A)。Aに図示される構築物を保有するAAV粒子の様々なMOIでのT7エンドヌクレアーゼアッセイの結果が示されている(図29B)。 マウスNIH3T3細胞株におけるmND1遺伝子座を編集するために使用されるスプリットBE41に基づく塩基エディターのドメイン構成の概略図であり、これは、MTSターゲティング配列、UGI及びGFPに融合したG108で切断されたBE_41-NTALEに融合したTALE左側DNA結合ドメイン;並びにMTSターゲティング配列、UGI及びmKateに融合したG43で切断されたBE_41-Cに融合したTALE右側DNA結合ドメインを含む。 図31A~31Bは、NGSに基づいて決定された編集効率及びオフターゲット(図31A)並びに塩基エディター処理サンプル対陰性対照配列CATTAGTAGAACGCA(配列番号262)における標的遺伝子座のサンガークロマトグラム(図31B)を示す。位置G2820で配列CATTAGTAAAACGCA(配列番号263)において編集された(GからA)核酸塩基が表示される。 図31A~31Bは、NGSに基づいて決定された編集効率及びオフターゲット(図31A)並びに塩基エディター処理サンプル対陰性対照配列CATTAGTAGAACGCA(配列番号262)における標的遺伝子座のサンガークロマトグラム(図31B)を示す。位置G2820で配列CATTAGTAAAACGCA(配列番号263)において編集された(GからA)核酸塩基が表示される。 図32A~32Dは、異なるdsDNA特異的デアミナーゼ(dsCDA)がシチジン修飾に対して異なる活性を有することを示す。図32Aは、シトシン(C)、5-メチルシトシン(5mC)、5-ヒドロキシメチルシトシン(5hmC)、5-ホルミルシトシン(5fC)及び5-カルボキシルシトシン(5caC)の構造の概略図である。図32B~32Dは、メチル化を含まないDNA基質(図32B)、5-メチルシトシン(5mC)(図32C)及び5-ヒドロキシメチルシトシン(5hmC)(図32C)に対してそれぞれデアミナーゼBE_R1_11、BE_R1_12、BE_R1_28、BE_R1_41、BE_R2_11、BE_R2_19、BE_R2_28、BE_R2_31及びDddAの各々を用いたデアミナーゼアッセイの顕微鏡写真である。 図33A~33Bは、BamH1メチラーゼを用いたメチル化(シトシンをメチル化5mCに変換する)によってシトシンを保護するためのアッセイを示す。図33Aは、MTaseなし(対照)、BAMHI MTase又はCpG MTaseのいずれかでdsDNA基質を前処理し、次にds-デアミナーゼを添加した後、シーケンシングするためのアッセイの概略図であり、それにより、未修飾シトシンは、ウラシルに脱アミノ化され、Tとして検出され、修飾シトシンは、脱アミノ化されない。図33Bは、未処理(MTaseなし)又は(BamH1 MTase)で処理し、その後、脱アミノ化及び配列決定した基質DNAの確率シーケンスロゴを示す。 図34A~34Cは、それぞれ5caC、5fC、5hmC若しくは5mCを含むように修飾されたDNA基質:GTACACCATCCGTCCC(配列番号274)及びGTGTTCTCTATTTCAC(配列番号275)に対するBE_R1_11デアミナーゼ(図34A)、BE_R1_28デアミナーゼ(図34B)又はBE_R1_41デアミナーゼ(図34C)の活性を示すシーケンシングクロマトグラムである。GTGTTCTCTATTTCAC(配列番号275) 図34A~34Cは、それぞれ5caC、5fC、5hmC若しくは5mCを含むように修飾されたDNA基質:GTACACCATCCGTCCC(配列番号274)及びGTGTTCTCTATTTCAC(配列番号275)に対するBE_R1_11デアミナーゼ(図34A)、BE_R1_28デアミナーゼ(図34B)又はBE_R1_41デアミナーゼ(図34C)の活性を示すシーケンシングクロマトグラムである。GTGTTCTCTATTTCAC(配列番号275) 図34A~34Cは、それぞれ5caC、5fC、5hmC若しくは5mCを含むように修飾されたDNA基質:GTACACCATCCGTCCC(配列番号274)及びGTGTTCTCTATTTCAC(配列番号275)に対するBE_R1_11デアミナーゼ(図34A)、BE_R1_28デアミナーゼ(図34B)又はBE_R1_41デアミナーゼ(図34C)の活性を示すシーケンシングクロマトグラムである。GTGTTCTCTATTTCAC(配列番号275) 図35は、5位にメチルシトシン、10位にヒドロキシメチルシトシンを含む配列CCGTCGGACCGC(配列番号278)を有するDNA基質に対するTet2酸化酵素及びBGTグルコシル化酵素の活性を示す概略図であり、上記の配列は、5位にカルボキシルシトシン及び10位にグルコシル-メチルシトシンをそれぞれ含むCCGTCGGACCGC(配列番号279)に変換される。 図36は、5mC、5hmC、5fC及び5caCを含むDNA基質GTACACCATCCGTCCC(配列番号274)に対する、単独(BE12/BE41)又は酸化及びグルコシル化後(BE12+TET2-BGT/BE41+TET2-BGT)のBE_R1_12及びBE_R1_41デアミナーゼの活性差をそれぞれ1時間(t1)及び2時間(t2)インキュベーションの各時点で示すシーケンシングクロマトグラムを示す。TET2及びBGTによる酸化及びグルコシル化がない場合、GTACACCATCCGTCCC(配列番号274)におけるBE_R1_41による5mCからTへの脱アミノ化により、GTACACCATTTGTCCC(配列番号276)が得られ;BE_R1_41による5hmCからTへの脱アミノ化により、GTACACCATTTGTCCC(配列番号276)及びGTACACCATTTGTCC(配列番号277)がそれぞれ得られた。この図は、BE41のようにmC又はhmCに対して活性なデアミナーゼの場合、TET2+BGT処理を使用して、メチル化DNAを脱アミノ化から保護することができることを示す。BE12のような一部のデアミナーゼは、通常のコンテキストでは編集することができるが、本質的に修飾DNAに対して活性が低いため、最初のTET2+BGT処理を必要とせずに使用することができる。 図37は、基質DNA:CTAACTTACCATGATTAATTTAAGAATTCTCATCGTCA(配列番号280)に対する1つ以上のデアミナーゼの活性を示す概略図であり、これによりそれぞれ3つの異なる脱アミノ化産物TTAATTTACTATGATTAATTTAAGAATTCTTATTGTTA(配列番号281)、CTAATTTACCATAATTAATTTAAGAATTCTTATCGTTA(配列番号282)及びCTAACTTATCATAATTAATTTAAAAATTCTTATCGTCA(配列番号283)が得られる。 図38A~38Bは、DNA基質に対するBE_R1_12デアミナーゼのデアミナーゼ活性から得られた頻度シーケンスロゴ(図38A)及びNGSのアラインメント配列(図38B)を示す。 図38A~38Bは、DNA基質に対するBE_R1_12デアミナーゼのデアミナーゼ活性から得られた頻度シーケンスロゴ(図38A)及びNGSのアラインメント配列(図38B)を示す。 図39は、GATTGAATGGTACTGATTAGATTTTTAAGAGTAGCAGT(配列番号285)に脱アミノ化されるDNA基質:GATTGAATGGTACTGATCAGATCCTCAAGAGTAGCAGT(配列番号284)上のT7プロモーター及びターミネーターによって規定されるウィンドウ内に多様性を導入するための、ターゲティングドメインとしてT7RNAポリメラーゼ(T7 RNAP)に結合した塩基エディター(BE)を示す概略図である。この図は、エピジェネティックシーケンシング法の概念/ワークフローを示す。 図40は、dCas9結合部位に結合した塩基エディター(スプリットBE41)であり、dCas9/gRNAは、T7プロモーター領域下流の二本鎖DNA上のポリメラーゼのロードブロックとして役立ち;スプリットBE41の一方の半分は、T7ポリメラーゼに融合して示され、別の半分は、自由浮遊酵素として示されている。 図41は、スプリットデアミナーゼの異なる形態を示す図である。
開示される方法及び組成物は、特定の実施形態及びそれに含まれる実施例の以下の詳細な説明並びに図面及びそれらの前述及び後述の説明を参照することにより、より容易に理解することができる。
現在のゲノム編集技術は、遺伝子修正に対する最初のステップとして、標的遺伝子座に二本鎖(ds)DNA切断を導入する。ほとんどの遺伝病は点突然変異から発生するが、DNA切断とそれに続く固定点突然変異への組換えに依存するアプローチは非効率的であり、典型的には、dsDNA切断に対する細胞応答から標的遺伝子座に多量のランダムな挿入及び欠失(インデル)を誘導する。ほとんどの既知の遺伝病の場合、病気の根本的な原因に対処するために、遺伝子の推計学的な破壊ではなく、むしろ標的遺伝子座の点突然変異の修正が必要とされる。
塩基編集は、dsDNA骨格切断又はドナーテンプレートを必要とせずに、プログラム可能な方法で、1つの標的DNA塩基を別の標的DNA塩基に直接、不可逆的に変換することを可能にするゲノム編集への最新アプローチである。既存の塩基編集アプローチは、主として、RNA誘導DNA結合ドメイン(例えば、dCas9又はnCas9)に融合させたssDNA特異的DNAデアミナーゼ(例えば、APOBEC又はAID)を利用する。標的遺伝子座におけるガイドRNA/Cas9によるRループ形成は、ssDNAデアミナーゼ酵素の基質として機能するssDNA領域を露出させる。RNA誘導タンパク質を用いた塩基編集は強力ではあるが、固有の制限を有する。例えば、現時点では、ガイドRNA又は他の核酸をミトコンドリアルーメンに送達する効率的な方法がないため、それは、ミトコンドリアゲノム(又は葉緑体及び色素体などのゲノムを含む他の膜性細胞小器官)を編集するために使用することができない。
ssDNA特異的デアミナーゼをジンクフィンガー及びTALEなどのdsDNA結合ドメインに融合させても、主に、ssDNA特異的デアミナーゼは、dsDNAに対してほとんど又は全く活性がないため、効率的な塩基エディターが達成されていない。この制限に対処するために、ツリーオブライフ(tree of life)が調べられ、dsDNAに対して活性があり、且つ様々な配列コンテキストでdsDNAを編集することができるデアミナーゼが見出された。このように、デアミナーゼは、以前よりもはるかに広範なコンテキストでdsDNAを編集することができ、且つ以前の特性決定デアミナーゼよりもオフターゲット編集を低減する。実施例に示すように、これらのデアミナーゼは、以前に特性決定されたほとんど全てのデアミナーゼ(DddAを除く)の場合のように一本鎖DNAのみならず、二本鎖及び一本鎖DNA基質に対して活性である。
シトシンデアミナーゼが開示される。プログラム可能なターゲティングドメイン(例えば、DNA結合ドメイン)と連結又は関連するこのようなデアミナーゼを含む塩基エディターも提供される。デアミナーゼ及びその塩基エディターは、インビトロ(例えば、試験管内)及びインビボ(例えば、生存細胞内)の両方でDNAの正確な編集を可能にする。塩基エディターは、ヒトの疾患に関連する様々な点突然変異を効率的に修正することができる。このようなカスタム設計された塩基エディターは、ゲノムに標的化(部位特異的)塩基編集を導入するための一般的且つ効率的な方法を提供し、標的化遺伝子修正又はゲノム編集をヒト細胞で実行可能な選択肢にする。それらのタンパク質単独の性質及び一切の核酸部分(例えば、ガイドRNA)の要件がないことから、ミトコンドリアゲノム、葉緑体及び他の色素体の編集など、標的DNAの位置への核酸の送達が困難な場合、記載される塩基エディターを有効に使用することができる。
開示される方法及び組成物のさらなる利点は、以下の説明に一部が詳述され、且つ説明から部分的に理解されるか、又は開示される方法及び組成物の実施によって知ることができるであろう。開示される方法及び組成物の利点は、添付の特許請求の範囲に特に指摘された要素及び組み合わせによって実現及び達成されるであろう。以上の概略的な説明及び以下の詳細な説明の両方が例示的且つ説明的なものであり、特許請求の範囲の発明を限定するものではないことを理解されたい。
開示される方法及び組成物は、別に指定されない限り、特定の合成方法、特定の分析技術又は特定の試薬に限定されず、従って変化し得ることを理解すべきである。本明細書で使用される用語は、特定の実施形態を説明することを目的するにすぎず、限定することを意図しないことも理解されたい。
I.定義
用語「デアミナーゼ」又は「デアミナーゼドメイン」は、脱アミノ化反応を触媒するポリペプチド、タンパク質又は酵素を指す。デアミナーゼは、デアミナーゼの配列特異性に基づいて、DNA中のアデニン(A)又はシトシン(C)を非標化様式で脱アミノ化することができる。dsDNA特異的デアミナーゼは、二本鎖DNAに対して脱アミノ化反応を行うことができ、ssDNA特異的デアミナーゼは、基質としての一本鎖DNAに厳密に作用する。
用語「塩基エディター(BE)」は、デアミナーゼドメイン及び1つ以上の機能性ドメインを含む組成物を指す。デアミナーゼドメインと機能性ドメインは、リンカーを介して融合又は共役することができる。従って、一部の形態では、塩基エディターは、融合タンパク質である。塩基エディターは、標的核酸(例えば、DNA又はRNA)中の標的ヌクレオチド配列内の塩基(例えば、A又はC)に改変を加えることができる。一部の形態では、塩基エディターは、二本鎖DNA分子などの核酸内の塩基を脱アミノ化することができる。好ましくは、塩基エディターは、DNA中のアデニン(A)又はシトシン(C)を標的様式化で脱アミノ化することができる。
用語「リンカー」は、結合(例えば、共有結合)、化学基又は2つの分子若しくは部分、例えば融合タンパク質の2つのドメイン、例えば、アデノシン又はシトシンデアミナーゼドメインとターゲティングドメイン(例えば、DNA結合タンパク質又はドメイン)を連結する分子を指す。典型的には、リンカーは、2つの基、分子若しくは他の部分間又はそれらにフランキングして位置し、且つ共有結合を介して互いに連結され、従って両方を連結する。一部の形態では、リンカーは、アミノ酸又は複数のアミノ酸(例えば、ペプチド)である。一部の形態では、リンカーは、有機分子、基、ポリマー又は化学的部分である。
用語「(突然)変異」は、所与の参照配列からの改変をもたらす配列の変化を指す。変異には、配列、例えば、核酸若しくはアミノ酸配列内の残基の、別の残基による置換又は配列内の1つ若しくは複数の残基の欠失若しくは挿入が含まれる。一部の形態では、変異は、本来の残基、続いて配列内の上記の残基の位置、さらに新たに置換された残基のアイデンティティー(例えば、D10A)を明示することによって記述される。一部の形態では、突然変異は、配列内の残基の位置、元の残基、続いて新たに置換された残基のアイデンティティー(例えば、5650G>A)を明示することによって記述される。変異は、対象の観察可能な特徴(表現型)に識別可能な変化をもたらす場合もあれば又はもたらさない場合もある。
「標的核酸」という用語は、デアミナーゼドメイン又は塩基エディターによって認識及び/又は脱アミノ化され得る標的ヌクレオチド配列を含む核酸分子を指す。標的核酸は、限定するものではないが、生存細胞の内部又は外部いずれかの染色体DNA、ミトコンドリアDNA、RNA、プラスミド、発現ベクターなどであり得る。
「標的ヌクレオチド配列」という用語は、異なるヌクレオチド配列においてヌクレオチドよりもデアミナーゼドメインにより優先的に脱アミノ化されるヌクレオチドを含むヌクレオチド配列を指す。標的ヌクレオチド配列の特定の実体を、脱アミノ化のためにターゲティングすることができる。標的ヌクレオチド配列は、2つ以上のヌクレオチド(例えば、2つ、3つ、4つ、5つ、6つ、7つ、8つ、9つ、10又はそれを超える)を含むことができる。標的ヌクレオチドと呼ばれる標的ヌクレオチド配列中の2つ以上のヌクレオチドは、その標的配列を脱アミノ化するデアミナーゼドメインの標的特異性を規定する。一部の形態では、標的ヌクレオチド配列中の2つ以上の標的ヌクレオチドは、それぞれ個別に完全に又は部分的に規定され、且つ互いに固定された順序関係にある。一般に、「標的ヌクレオチド配列」内の特定のヌクレオチドは、デアミナーゼドメインによって脱アミノ化される。例えば、例示的な標的ヌクレオチド配列CNACでは、標的ヌクレオチド配列の最後のCは、デアミナーゼドメイン(例えば、シトシンデアミナーゼ)によって脱アミノ化され得る。脱アミノ化のために選択されるこのヌクレオチドを「標的ヌクレオチド」と呼ぶことができる。
「塩基エディター標的配列」という用語は、標的化塩基エディターによって認識されて、結合される標的核酸分子内の配列を指す。一般に、塩基エディター標的配列は、標的化塩基エディターによって脱アミノ化された標的ヌクレオチド配列と区別され、且つ/又はそれと重複しない。従って、塩基エディター標的配列は、標的化塩基エディターによって結合されると、核酸分子内の標的ヌクレオチド配列の実体の近傍に標的化塩基エディターを配置する核酸配列を包含する。塩基エディター標的配列と標的ヌクレオチド配列の実体とのこのコロケーションは、標的ヌクレオチド配列の実体の優先的且つ特異的な脱アミノ化を促進する。典型的には、標的化塩基エディターに関連するDNA結合ドメインなどのターゲティングドメインは、塩基エディター標的配列を認識して結合する。
「二本鎖DNA上のデアミナーゼ活性」は、全て標的ヌクレオチド配列を含む1つ以上の二本鎖DNAセグメントの集団に対するデアミナーゼのデアミナーゼ活性を指す。二本鎖DNA上のデアミナーゼ活性は、二本鎖DNAを巻き戻すために、ガイドRNAなどの補助因子の活性を必要としない。従って、この活性は、RNA誘導DNA結合ドメイン(即ちdCas9及びガイドRNA)などの補助因子の存在下でのみdsDNAにアクセスして、これを脱アミノ化することができるAPOBEC及びAIDなどのssDNA特異的デアミナーゼのデアミナーゼ活性と異なる。
ヌクレオチド配列(標的ヌクレオチド配列など)中のヌクレオチドは、そのヌクレオチドが1つの特定のヌクレオチド(例えば、C)でなければならない場合、「完全に規定」される。ヌクレオチド配列(標的ヌクレオチド配列など)中のヌクレオチドは、そのヌクレオチドが、2つ以上の特定のヌクレオチド(例えば、C又はA)であり得るが、任意のヌクレオチド(即ちNであってはならない)ではあり得ない場合、「部分的に規定される」。ヌクレオチド配列中のヌクレオチド(標的ヌクレオチド配列など)は、そのヌクレオチドが任意のヌクレオチド(即ちN)であり得る場合、「規定されていない」。
「互いに固定された順序関係にある」ヌクレオチド配列中のヌクレオチドの群は、ヌクレオチド配列の各実体に対して、ヌクレオチド配列上で同じ順序にあり、同じ数のヌクレオチドによって互いに隔てられているようなヌクレオチドを指す。間隔をあける場合、これは、ヌクレオチド配列の所与の実体におけるヌクレオチドが、全て互いに等間隔である(例えば、全てが互いの間に1つのヌクレオチドを有する)ことを意味しないか又は必要としない。むしろ、これは、ヌクレオチド配列の各実体におけるヌクレオチドが、ヌクレオチド配列の全ての実体と同じヌクレオチドの間隔を有することを意味する。例えば、標的塩基配列(C/T)NACを考慮されたい。このヌクレオチド配列では、第1ヌクレオチドは、部分的に規定され、第2ヌクレオチドは、規定されず、第3及び第4ヌクレオチドは、完全に規定される。従って、これは、完全に又は部分的に規定された3つのヌクレオチドを含むヌクレオチド配列を表す。間隔に関して、(C/T)ヌクレオチドは、それとAヌクレオチドとの間に1つのヌクレオチドを有し、それとCヌクレオチドとの間に2つのヌクレオチドを有し;Aヌクレオチドは、それとCヌクレオチドとの間にヌクレオチドを含まない。この同じ間隔が、この標的ヌクレオチド配列の各実体に存在することになる。ヌクレオチドの順序に関して、(C/T)、A及びCは、上記の標的ヌクレオチド配列の各実体において同じ順序で出現することになる。
ポリペプチドに関して「単離された」又は「精製された」とは、ポリペプチドが、天然に通常見出される細胞成分(例えば、他のポリペプチド、脂質、炭水化物及び核酸)からある程度分離されることを意味する。精製されたポリペプチドは、非還元ポリアクリルアミドゲル上に単一の主要なバンドを生成することができる。精製されたポリペプチドは、少なくとも約75%純粋(例えば、少なくとも80%、85%、90%、95%、97%、98%、99%又は100%純粋)であり得る。精製ポリペプチドは、例えば、天然源からの抽出、化学合成又は宿主細胞若しくはトランスジェニック植物における組換え生産によって取得することができ、例えば、アフィニティークロマトグラフィー、免疫沈降、サイズ排除クロマトグラフィー及びイオン交換クロマトグラフィーを用いて精製することができる。精製の程度は、限定するものではないが、カラムクロマトグラフィーを含む任意の適切な方法を用いて測定することができる。
「導入する」とは、接触させることを指す。「接触」又は「接触させること」とは、少なくとも2つの要素間の即時近接又は結合の状態を可能にするか又は促進することを意味する。例えば、塩基エディター、ベクター又は他の薬剤を細胞に導入することは、細胞と塩基エディター、ベクター又は薬剤との間の接触を提供することである。この用語は、任意の適切な製剤中で、任意の適切な手段により、例えば、トランスフェクション、エレクトロポレーション、形質導入、遺伝子銃、ナノ粒子送達などを介して、接触させた塩基エディター、ベクター又は薬剤の細胞内部への浸透を包含する。
用語「発現」は、プロモーターによって駆動される特定のヌクレオチド配列の転写及び/又は翻訳を包含する。「発現ベクター」又は「発現カセット」は、発現させようとするヌクレオチド配列に作動可能に連結された発現制御配列を有する組換えポリヌクレオチドを含むベクターを指す。発現ベクターは、発現に十分なシス作用要素を含み;発現のための他の要素は、宿主細胞によって又はインビトロ発現系内に供給され得る。発現ベクターは、当技術分野で公知のもの全てを含み、例えば コスミド、プラスミド(例えば、裸又はリポソーム中に含まれる)、ファージミド、BAC、YAC及び組換えポリヌクレオチドを組み込んだウイルスベクター(例えば、レンチウイルス、レトロウイルス、アデノウイルス及びアデノ随伴ウイルスに由来するベクター)が挙げられる。
「作動可能に連結された」又は「作動可能に連結された」という用語は、要素(例えば、調節配列及び異種核酸配列)間の機能的連結を指し、それらがそれらの意図された様式で機能する(例えば、異種核酸配列の発現をもたらす)ことを可能にする。この用語は、そのような配列の転写又は翻訳に影響を与えるように核酸で転写される調節領域及び配列の配置を包含する。例えば、コード配列をプロモーターの制御下に置くために、ポリペプチドの翻訳リーディングフレームの翻訳開始部位は、典型的に、プロモーターの1~約50ヌクレオチド下流に位置する。しかし、プロモーターは、翻訳開始部位の約5,000ヌクレオチド上流又は転写開始部位の約2,000ヌクレオチド上流に配置され得る。プロモーターは、典型的に、少なくともコア(基底)プロモーターを含む。タンパク質に作動可能に連結された細胞小器官局在配列は、連結されたタンパク質が特定の細胞小器官に局在するように指令する。
用語「核局在化配列」又は「NLS」は、例えば、核輸送により、細胞核へのペプチド又はタンパク質の移入を促進するアミノ酸配列を指す。核局在化配列は、当技術分野で公知であり、当業者に明らかであろう。例えば、NLS配列は、国際PCT出願番号PCT/欧州特許出願公開第2000/011690号明細書に記載されており、その内容は、例示的な核局在化配列の開示内容について参照により本明細書に組み込まれる。
本明細書で使用される用語「有効量」は、所望の生物学的応答を誘発するのに十分である生物学的に活性な薬剤の量を指す。例えば、一部の形態では、有効量の塩基エディターは、標的ヌクレオチド配列の編集を誘導するのに十分な塩基エディターの量を指し得る。当業者には理解されるように、薬剤、例えば、デアミナーゼドメイン又は塩基エディターの有効量は、様々な要因、例えば、所望の生物学的応答、例えば、編集しようとする特定の対立遺伝子、ゲノム又は標的部位、ターゲティングされる細胞若しくは組織及び使用される薬剤に応じて変動し得る。
用語「核酸」及び「核酸分子」は、核酸塩基及び酸部分を含む分子、例えば、ヌクレオシド、ヌクレオチド又はヌクレオチドのポリマーを指す。典型的には、高分子核酸、例えば、3個以上のヌクレオチドを含む核酸分子は、直鎖状分子であり、そこで、隣接するヌクレオチドは、ホスホジエステル結合を介して互いに連結される。一部の形態では、「核酸」は、個々の核酸残基(例えば、ヌクレオチド及び/又はヌクレオシド)を指す。一部の形態では、「核酸」は、3つ以上の個別のヌクレオチド残基を含むオリゴヌクレオチド鎖を指す。本明細書で使用される場合、用語「オリゴヌクレオチド」及び「ポリヌクレオチド」は、互換的に使用されて、ヌクレオチドのポリマー(例えば、少なくとも3つのヌクレオチドの配列)を意味し得る。核酸は、RNA並びに一本鎖及び/又は二本鎖DNAを包含する。核酸は、例えば、ゲノム、転写産物、mRNA、tRNA、rRNA、siRNA、snRNA、プラスミド、コスミド、染色体、染色分体又は他の天然に存在する核酸分子に関連して天然に存在することができる。一方で、核酸分子は、非天然に存在する分子、例えば組換えDNA若しくはRNA、人工染色体、操作ゲノム又はそれらの断片或いは合成DNA、RNA、DNA/RNAハイブリッドであり得るか、又は非天然のヌクレオチド若しくはヌクレオシドを含む。さらに、用語「核酸」、「DNA」、「RNA」及び/又は類似の用語は、核酸類似体、例えばホスホジエステル骨格以外を有する類似体を含む。核酸は、天然源から精製し、組換え発現系を用いて製造し、任意選択で精製し、化学合成することなどができる。適切な場合、例えば化学合成された分子の場合、核酸は、化学的に修飾された塩基又は糖及び骨格修飾を有する類似体などのヌクレオシド類似体を含むことができる。核酸配列は、特に指示がない限り、5’~3’方向に表示される。一部の形態では、核酸は、天然ヌクレオシド(例えば、アデノシン、チミジン、グアノシン、シチジン、ウリジン、デオキシアデノシン、デオキシチミジン、デオキシグアノシン及びデオキシシチジン);ヌクレオシド類似体(例えば、2-アミノアデノシン、2-チオチミジン、イノシン、ピロロ-ピリミジン、3-メチルアデノシン、5-メチルシチジン、2-アミノアデノシン、C5-ブロモウリジン、C5-フルオロウリジン、C5-ヨードウリジン、C5-プロピニル-ウリジン、C5-プロピニル-シチジン、C5-メチルシチジン、2-アミノアデノシン、7-デアザアデノシン、7-デアザグアノシン、8-オキソアデノシン、8-オキソグアノシン、O(6)-メチルグアニン及び2-チオシチジン);化学的に修飾された塩基;生物学的に修飾された塩基(例えば、メチル化塩基);インターカレートされた塩基;修飾糖(例えば、2’-フルオロリボース、リボース、2’-デオキシリボース、アラビノース及びヘキソース);並びに/又は修飾されたリン酸基(例えば、ホスホロチオエート及び5’-N-ホスホロアミダイト結合)であるか又はそれらを含む。
用語「ペプチド」は、互いに化学的に結合したアミノ酸から構成される化合物のクラスを指す。一般に、アミノ酸は、アミド結合(CONH)を介して化学的に結合する。しかし、アミノ酸は、当技術分野で公知の他の化学結合によって互いに結合することができる。例えば、アミノ酸はアミン結合によって結合することができる。本明細書で使用されるペプチドとしては、ポリペプチドなど、アミノ酸並びに大及び小ペプチドのオリゴマーを含む。従って、用語「タンパク質」、「ペプチド」及び「ポリペプチド」は、本明細書で互換的に使用される。タンパク質、ペプチド又はポリペプチドは、任意のサイズ、構造又は機能のものであり得る。タンパク質、ペプチド又はポリペプチドは、単一分子でもあり得るか又は多分子複合体であり得る。タンパク質、ペプチド又はポリペプチドは、天然に存在するタンパク質又はペプチドの断片にすぎない。タンパク質、ペプチド又はポリペプチドは、天然に存在する、組換え若しくは合成又はそれらの任意の組合せであり得る。
用語「パーセント(%)配列同一性」は、最大パーセント配列同一性を達成するために、配列をアラインメントし、必要に応じて、ギャップを導入した後、参照核酸配列中のヌクレオチド又はアミノ酸と同一である候補配列中のヌクレオチド又はアミノ酸のパーセンテージを表す。配列同一性パーセントの決定を目的とするアラインメントは、当業者の技術の範囲内にある様々な方法で、例えば、BLAST、BLAST-2、ALIGN、ALIGN-2又はMegalign(DNASTAR)ソフトウェアなどの一般に利用可能なコンピューターソフトウェアを使用して、達成することができる。アラインメントを測定するための適切なパラメーターは、比較対象の配列の全長にわたって最大のアラインメントを達成するのに必要な任意のアルゴリズムを含む公知の方法により決定することができる。
「同一性」は、Computational Molecular Biology, Lesk,A.M.,Ed.,Oxford University Press,New York,1988;Biocomputing:Informatics and Genome Projects,Smith,D.W.,Ed.,Academic Press,New York,1993;Computer Analysis of Sequence Data,Part I,Griffin,A. M.,and Griffin,H.G.,Eds.,Humana Press,New Jersey,1994;Sequence Analysis in Molecular Biology,von Heinje,G.,Academic Press,1987;及びSequence Analysis Primer,Gribskov,M.and Devereux,J.,Eds.,M Stockton Press,New York,1991;及びCarillo,H.,and Lipman,D.,SIAM J Applied Math.,48:1073(1988)に記載されるものを含むが、これらに限定されない公知の方法によって容易に計算することができる。同一性を決定するための好ましい方法は、試験された配列間で最大の一致が得られるように設計される。同一性及び類似性を決定する方法は、一般に利用可能なコンピュータプログラムで体系化される。2つの配列間の同一性パーセントは、Needelman and Wunsch(J.Mol.Biol.,48:443-453,970)アルゴリズム(例えば、NBLAST及びXBLAST)を組み込んだ解析ソフトウェア(即ちGenetics Computer Group,Madison Wis.のSequence Analysis Software Package)を用いて決定することができる。一部の形態では、デフォルトパラメータを使用して、本開示のポリヌクレオチド又はポリペプチドの同一性を決定することができる。
一部の形態では、所与の核酸又はアミノ酸配列Dへの、その配列との若しくはその配列に対する所与の核酸又はアミノ酸配列Cの%配列同一性(代わりに所与の配列Dへの、その配列との若しくはその配列に対する特定の%配列同一性を有するか又は含む所与の配列Cと表すこともできる)は、
分数W/Zの100倍
のように計算され、式中、Wは、C及びDのそのプログラムのアラインメントにおいて、配列アラインメントプログラムにより同一のマッチとしてスコアリングされるヌクレオチド又はアミノ酸の数であり、Zは、D中のヌクレオチド又はアミノ酸の総数である。配列Cの長さが配列Dの長さと等しくない場合、CからDの%配列同一性は、DからCの%配列同一性と等しくないことは理解されるであろう。
本明細書で使用される場合、用語「対象」は、任意の個体、生物又は実体を意味する。対象は、脊椎動物、例えば、哺乳動物であり得る。従って、対象は、ヒト又は動物、例えばマウス、ラット、ウサギ、ヤギ、ブタ、線虫、チンパンジー若しくはウマであり得る。この用語は、特定の年齢又は性別を示すものではない。従って、男性若しくは女性にかかわらず、成人及び新生児の対象、さらに胎児も包含されることを意図する。対象は、健康であるか、又は疾患、障害若しくは状態に罹患しているか若しくはそれに罹患しやすい。患者とは、疾患又は障害に罹患している対象を指す。「患者」という用語は、ヒト及び獣医学的対象を含む。
本明細書における値の範囲の列挙は、本明細書に別段の指示がない限り、範囲内に入る別個の値各々を個別に指す簡潔な方法として使用されることを意図するにすぎず、別個の値の各々は、あたかも本明細書に個別に列挙されたのと同じように本明細書に組み込まれる。
核酸シーケンスロゴに関連して使用される「ビット」という用語は、所与の核酸シーケンスロゴ内の核酸に対応する文字の高さの尺度である。核酸シーケンスロゴは、その配列内の各位置における核酸に対応する文字のスタックを含む。文字の相対的なサイズは、多数のアラインメントされた核酸配列における対応する核酸の頻度を示す。文字の全高は、位置の情報内容をビット単位で表す。
「約」という用語の使用は、約+/-10%の範囲で、記載される値より上又は下いずれかの値を表すことを意図するものであり;他の形態では、値は、約+/-5%の範囲で、記載の値より上又は下いずれかの値の範囲にある可能性があり;他の形態では、値は、約+/-2%の範囲で、記載された値より上又は下いずれかの値の範囲にある可能性があり;他の形態では、値は、約+/-1%の範囲で、記載の値より上又は下いずれかの値の範囲にあり得る。先行する範囲は、文脈から明確にされることが意図され、それ以上の限定は含意されない。
II.組成物
核酸をターゲティング及び編集するための試薬及び組成物が開示される。このような試薬及び組成物は、一本鎖及び/又は二本鎖DNA中の標的ヌクレオチドを脱アミノ化することができるシトシンデアミナーゼドメインを含む。特定の標的配列を認識し、且つ/又はそれに結合するCas9、Cpf1、ZF、TALEなどの1つ以上のターゲティングドメインと組み合わせて、そのようなデアミナーゼドメインを含有する非天然の又は操作されたDNA塩基エディターも開示される。塩基エディターは、低いオフターゲット効果を伴って、細胞又は対象のゲノム内、例えばヒトミトコンドリアゲノム内での標的化部位の特異的且つ効率的な編集を促進する。
二本鎖DNAデアミナーゼ活性を有する非天然のポリペプチドである1つ以上の機能性デアミナーゼタンパク質を含む組成物が記載される。一般に、組成物は、二本鎖DNAデアミナーゼ活性を付与する1つ以上の最小ドメインを含む。例示的なタンパク質ドメインは、配列番号1~16、18~19若しくは40~67のいずれかのアミノ酸配列又は配列番号1~16、18~19若しくは40~67のいずれかに対して少なくとも90%の配列同一性を有するアミノ酸配列の対応領域に対応する。
一部の形態では、組成物は、機能性デアミナーゼドメイン内の切断部位でデアミナーゼタンパク質を切断することによって得られる機能性二本鎖DNAデアミナーゼタンパク質の非天然由来ポリペプチド断片を含む。例えば、一部の形態では、断片はN末端断片に対応し、断片は、切断された機能性デアミナーゼドメインのN末端部分を含む。他の形態では、断片は、C末端断片に対応し、断片は、切断された機能性デアミナーゼドメインのC末端部分を含む。デアミナーゼ活性は、N末端断片をC末端断片と共局在させるか、又はC末端断片をN末端断片と共局在させると回復される。
第1及び第2モノマーを有するヘテロ二量体を含む塩基エディターも記載され、第1モノマーは、第1のプログラマブルDNA結合タンパク質と、切断された二本鎖DNAデアミナーゼのN末端又はC末端断片を含み、及び第2モノマーは、第2のプログラマブルDNA結合タンパク質と、切断された二本鎖DNAデアミナーゼのN末端又はC末端断片を含む。典型的には、第1及び第2モノマーの二量体化は、機能性二本鎖DNAデアミナーゼタンパク質及び機能性二本鎖DNAデアミナーゼ活性を再形成する。一部の形態では、第1及び/又は第2のプログラマブルDNA結合タンパク質は、同じである。他の形態では、第1及び/又は第2のプログラマブルDNA結合タンパク質は、異なる。例示的な第1及び/又は第2のプログラマブルDNA結合タンパク質は、Casドメイン(例えば、Cas9)、ニッカーゼ、ジンクフィンガータンパク質、TALEタンパク質及びTALE様タンパク質を含む。従って、一部の形態では、塩基エディターは、第1及び第2のモノマーを有するヘテロ二量体を含み、その際、第1のモノマーは、Casドメイン、ニッカーゼ、ジンクフィンガータンパク質又はTALEタンパク質;及び切断された二本鎖DNAデアミナーゼのN末端又はC末端断片を含み、及び第2のモノマーは、Casドメイン、ニッカーゼ、ジンクフィンガータンパク質又はTALEタンパク質;並びに切断された二本鎖DNAデアミナーゼの第2のプログラマブルDNA結合タンパク質及びN末端又はC末端断片を含み、それにより、第1及び第2モノマーの二量体化は、二本鎖DNAデアミナーゼ活性を回復させる。例示的なCasドメインとしては、Cas9、Casl2e、Casl2d、Casl2a、Casl2bl、Cas13a、Casl2c及びアルゴノートが挙げられる。
一部の形態では、塩基エディターは、リンカーを含む。リンカーは、より高い効率又は拡張された若しくはより狭い活性ウィンドウに適応するように、設計パラメーターに基づいてリジッド又はフレキシブルにすることができる。例えば、一部の形態では、第1のモノマーは、第1のプログラマブルDNA結合タンパク質を、切断された二本鎖DNAデアミナーゼのN末端又はC末端断片と連結するリンカーを含む。一部の形態では、第2のモノマーは、第1のプログラマブルDNA結合タンパク質を、切断された二本鎖DNAデアミナーゼのN末端又はC末端断片と連結するリンカーを含む。例示的なリンカーは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49又は50アミノ酸を含む。好ましいリンカーとしては、2~10個のアミノ酸が挙げられる。
一部の形態では、塩基エディターは、1つ以上のウラシルグリコシラーゼ阻害剤(UGI)ドメイン及び/又は1つ以上のターゲティング配列を含む。例示的なターゲティング配列としては、核局在化配列(NLS)、ミトコンドリアターゲティング配列(MTS)が挙げられる。
例示的なMTS配列としては、SOD2配列及びCOX8配列が挙げられる。
従って、特定の形態では、塩基エディターは、以下の構造:
[A]-[プログラマブルDNA結合タンパク質]-[切断された二本鎖DNAデアミナーゼのN末端若しくはC末端断片]-[B];又は
[A]-[切断された二本鎖DNAデアミナーゼのN末端若しくはC末端断片][プログラマブルDNA結合タンパク質]-[B]
の1つを有する第1及び/又は第2のモノマーを含み、
「[A]」及び/又は「[B]」は、任意の1つ以上の追加の機能性ドメインを表し、「]-[」は、任意のリンカーである。
例示的な形態では、塩基エディターは以下の構造:
[SOD2]-[UGI](1-2)-[mitoTALE]-[切断された二本鎖DNAデアミナーゼのN末端又はC末端断片]-[UGI](1-2)
を有する。
一部の形態では、第1及び第2のモノマーは、標的部位の片側で第1及び第2のヌクレオチド配列にそれぞれ結合する。例示的な標的部位は、塩基エディターによって脱アミノ化される標的塩基を含む。一部の形態では、標的塩基は、Cである。例えば、一部の形態では、Cは、5’-TC-3’配列コンテキスト内にある。他の形態では、Cは、5’-TCC-3’配列コンテキスト内にある。典型的には、ヌクレオチド配列は、塩基エディターによって脱アミノ化される標的塩基と同じ鎖上にそれぞれ存在する。特定の形態では、第1及び第2のヌクレオチド配列は、塩基エディターによって脱アミノ化される標的塩基を含む鎖と同じ鎖上にそれぞれある。別の形態では、第1及び第2のヌクレオチド配列は、塩基エディターによって脱アミノ化される標的塩基を含む鎖とは反対側の鎖上にそれぞれある。一部の形態では、第1及び第2のヌクレオチド配列は、対向する鎖上にある。
1つ以上のガイドRNAを含む塩基エディターも記載される。例えば、一部の形態では、第1及び/又は第2のプログラマブルDNA結合タンパク質は、核酸プログラマブルDNA結合タンパク質であり、1つ以上のガイドRNAは、塩基エディターを指令して、第1又は第2のヌクレオチド配列の標的部位に結合させる。塩基エディターの第1又は第2のモノマーをコードする単離核酸も記載される。塩基エディターの第1又は第2のモノマーをコードする単離核酸を含むベクターも記載される。塩基エディターの第1又は第2のモノマーをコードする単離された核酸を含有するベクターを含む細胞も記載される。
A.デアミナーゼドメイン
デアミナーゼ、デアミナーゼドメイン及びそのようなデアミナーゼドメインを含むポリペプチドが開示される。「デアミナーゼ」又は「デアミナーゼドメイン」は、ポリペプチドタンパク質又は脱アミノ化反応を触媒する酵素を指す。脱アミノ化反応は、限定するものではないが、窒素塩基(例えば、シトシン、アデニン)などの分子からのアミノ基の除去を含む。一部の形態では、窒素塩基は、ヌクレオシド、ヌクレオチド又は核酸の一部である。従って、開示されるデアミナーゼは、遊離塩基、遊離ヌクレオシド、遊離ヌクレオチド及び/又はポリヌクレオチドの脱アミノ化を触媒することができる。一部の形態では、デアミナーゼドメインは、リボ核酸(RNA)又はデオキシリボ核酸(DNA)基質中の窒素塩基を脱アミノ化することができる。一部の形態では、デアミナーゼドメインは、RNA及びDNAの両方の脱アミノ化を触媒する。RNA又はDNA基質は、一本鎖(ss)又は二本鎖(ds)であり得る。一部の形態では、デアミナーゼドメインは、ssDNA又はdsDNAの脱アミノ化を触媒する。一部の形態では、デアミナーゼドメインは、ssDNA及びdsDNAの両方の脱アミノ化を触媒する。
本明細書中で提供されるデアミナーゼドメインは、任意の生物由来であり得る。従って、デアミナーゼドメインは、原核生物又は真核生物由来であり得る。一部の形態では、デアミナーゼは、脊椎動物デアミナーゼ又は無脊椎動物デアミナーゼである。一部の形態では、デアミナーゼドメインは、ヒト、チンパンジー、ゴリラ、サル、ウシ、イヌ、ラット、マウス、魚類、ハエ、蠕虫、真菌、細菌、ウイルス又はバクテリオファージデアミナーゼドメインである。
好ましい形態では、デアミナーゼドメインを取得することができる生物として、限定されないが、以下が挙げられる:スケルマネラ・スティビイレジスタンス(Skermanella stibiiresistens)、エリスランテ・グッタタ(Erythranthe guttata)、シトラス・シネンシス(Citrus sinensis)、ヒドロカルボニファガ・ダチンゲンシス(Hydrocarboniphaga daqingensis)、チエゲモステリウム・ラクテウム(Tieghemostelium lacteum)、サプロレグニア・パラシチカ(Saprolegnia parasitica)、ビトレラ・ブラシカフォルミス(Vitrella brassicaformis)、リーシュマニア・インファンタム(Leishmania infantum)、シモンシエラ・ムエレリ(Simonsiella muelleri)、クロストリジウム・バクテリウム(Clostridiales bacterium)、キブデロスポランギウム・アリダム(Kibdelosporangium aridum)、デスモスポラ・アクティバ(Desmospora activa)、ナイセリア・ゴノロエア(Neisseria gonorrhoeae)、バチルス・アサヒ(Bacillus asahii)、サエジア・サンギニス(Saezia sanguinis)、炭疽菌(Bacillus anthracis)、ハンガテイクロストリジウム・クラリフラバム(Hungateiclostridium clariflavum)、ルミノコッカス属(Ruminococcus sp.)CAG:563、クロストリジウム・ディスポリカム(Clostridium disporicum)、ウメザワエア・タンジェリナ(Umezawaea tangerina)、コンキフォルミビウス・スティーダエ(Conchiformibius steedae)、ストレプトマイセス・セリカラー(Streptomyces coelicolor)、ストレプトマイセス科細菌(Streptomycetaceae bacterium)MP113-05、ベルコシスポラ属(Verrucosispora sp.)LHW63014、ビブリオ・アエロゲネス(Vibrio aerogenes)、フザリウム・オキシスポラム(Fusarium oxysporum)、バーティシリウム・ロンギスポラム(Verticillium longisporum)、コンドロマイセス・クロカツス(Chondromyces crocatus)、キタサトスポラ・アウレオファシエンス(Kitasatospora aureofaciens)、コレトトリクム・オーキドフィラム(Colletotrichum orchidophilum)、ノノムラエア・ソラニ(Nonomuraea solani)、アキマリナ・スポンギアエ(Aquimarina spongiae)、ディポドミス・オルディ(Dipodomys ordii)、パタジオエナス・ファシアタ・モニリス(Patagioenas fasciata monilis)、ストレプトマイセス・フェオルテイグリセウス(Streptomyces phaeoluteigriseus)、イクタルス・プンクタトゥス(Ictalurus punctatus)、コリネスポラ・カッシコラ(Corynespora cassiicola)、プラティステルノン・メガセファラム(Platysternon megacephalum)、ストレプトマイセス属(Streptomyces sp.)AC1-42W、ギメシア・マリス(Gimesia maris)、バークホルデリア・グルマエ(Burkholderia glumae)、ナカムレラ・マルチパルティタ(Nakamurella multipartita)、スタッケブランティア・ナッサウエンシス(Stackebrandtia nassauensis)、キタサトスポラ・セタエ(Kitasatospora setae)、アスペルギルス・カワチイ(Aspergillus kawachii)、ストレプトマイセス・ツルギディスカベス(Streptomyces turgidiscabies)、アノリス・カロリンシス(Anolis carolinensis)、セラチア・ルビダエ(Serratia rubidaea)、ルミニクロストリジウム・セルロリチカム(Ruminiclostridium cellulolyticum)、アロアクチノシンネマ・イラニカム(Alloactinosynnema iranicum)、フォトラブドゥス・ラウモンディ(Photorhabdus laumondii)、大腸菌(Escherichia coli)、黄色ブドウ球菌(Staphylococcus aureus)、チフス菌(Salmonella typhi)、シュワネラ・プトレファシエンス(Shewanella putrefaciens)、インフルエンザ菌(Haemophilus influenzae,)、カウロバクター・クレセントス(Caulobacter crescentus)、枯草菌(Bacillus subtilis)及びカエノラブディティス・エレガンス(Caenorhabditis elegans)。
一部の形態では、デアミナーゼドメインを取得することができる生物として、限定されないが、以下が挙げられる:スケルマネラ属種(Skermanella sp.)、エリスランテ属種(Erythranthe sp.)、シトラス属種(Citrus sp.)、ヒドロカルボニファガ属種(Hydrocarboniphaga sp.)、チエゲモステリウム属(Tieghemostelium sp.)、サプロレグニア属種(Saprolegnia sp.)、ビトレラ属種(Vitrella sp.)、リーシュマニア属種(Leishmania sp.)、シモンシエラ属種(Simonsiella sp.)、クロストリジウム属(Clostridiales sp.)、キブデロスポランギウム属(Kibdelosporangium sp.)、デスモスポラ種(Desmospora sp.)、ナイセリア属種(Neisseria sp.)、バチルス属種(Bacillus sp.)、サエジア属種(Saezia sp.)、バチルス属種(Bacillus sp.)、ハンガテイクロストリジウム属種(Hungateiclostridium sp.)、ルミノコッカス属種(Ruminococcus sp.)、クロストリジウム属種(Clostridium sp.)、ウメザワエア属種(Umezawaea sp.)、コンキフォルミビウス属種(Conchiformibius sp.)、ストレプトマイセス属種(Streptomyces sp.)、ストレプトマイセス科種(Streptomycetaceae sp.)、ベルコシスポラ属種(Verrucosispora sp.)、ビブリオ属種(Vibrio sp.)、フザリウム属種(Fusarium sp.)、バーティシリウム属種(Verticillium sp.)、コンドロマイセス属種(Chondromyces sp.)、キタサトスポラ属種(Kitasatospora sp.)、コレトトリクム属種(Colletotrichum sp.)、ノノムラエア属(Nonomuraea sp.)、アキマリーナ属種(Aquimarina sp.)、ディポドミス属種(Dipodomys sp.)、パタジオエナス属種(Patagioenas sp.)、イクタルス属種(Ictalurus sp.)、コリネスポラ属種(Corynespora sp.)、プラティステルノン属種(Platysternon sp.)、ストレプトマイセス属種(Streptomyces sp.)、ギメシア属種(Gimesia sp.)、バークホルデリア属種(Burkholderia sp.)、ナカムレラ属種(Nakamurella sp.)、スタッケブランティア属種(Stackebrandtia sp.)、キタサトスポラ属種(Kitasatospora sp.)、アスペルギルス属種(Aspergillus sp.)、アノリス属種(Anolis sp.)、セラチア属種(Serratia sp.)、ルミニクロストリジウム属(Ruminiclostridium sp.)、アロアクチノシンネマ属種(Alloactinosynnema sp.)、フォトラブドゥス属種(Photorhabdus sp.)、エシェリヒア属種(Escherichia sp.)、ブドウ球菌属種(Staphylococcus sp.)、サルモネラ属種(Salmonella sp.)、シュワネラ属種(Shewanella sp.)、ヘモフィルス属種(Haemophilus sp.)、カウロバクター属種(Caulobacter sp.)、バチルス属種(Bacillus sp.)及びカエノラブディティス属種(Caenorhabditis sp.)。
開示されるデアミナーゼ又はデアミナーゼドメインは、任意の公知のデアミナーゼクラン(clan)又はファミリーに属し得る。例えば、その全体が参照により本明細書に援用されるIyer LM,et al.,Nucleic Acids Res.,39(22):9473-97(2011)を参照されたい。例示的なデアミナーゼクランとして、限定されないが、以下が挙げられる:CDD/CDAシチジンデアミナーゼ、ブラストサイジンS-デアミナーゼ(BSD)、植物Des/Cda、LmjF36.5940様、PITG_06599様、DYW様、BURPS668_1122、Pput_2613、SCP1.201、YwqJ、MafB19、TadA-Tad2(ADAT2)、Bd3614、Tad1、RibD様(ジアミノ-ヒドロキシ-ホスホリボシルアミノピリミジンデアミナーゼ)、グアニンデアミナーゼ、dCMPデアミナーゼ及びComE、AID/APOBEC、ZK287.1、B3gp45、XOO_2897並びにOTT_1508(Iyer LMらの表1を参照されたい)。好ましい形態では、デアミナーゼ又はデアミナーゼドメインは、シチジンデアミナーゼ様(CDA)、MafB19様デアミナーゼ、SCP1201-deam、SNAD1、SNAD2、SNAD4、CMP/dCMP、Pput2613-deam、LmjF365940-deam、LoxI_N、DAAD、DYW、YwqJ-デアミナーゼ又はSUKH-4ファミリーに由来する。
CDAクランは、アデノシン、シトシン、グアニン及びシチジンに作用する遊離ヌクレオチドと核酸デアミナーゼの両方を含み、総称してデアミナーゼスーパーファミリーとして知られている。保存されたフォールドは、2134オーダーの3つのらせんと4つのストランドを有する3層のα/β/α構造からなる(Liaw SH,et al.J Biol Chem.,279:35479-35485(2004);Iyer LM,et al.,Nucleic Acids Res.,39(22):9473-97(2011))。このスーパーファミリーは、らせん(らせん4)の存在に基づいて2つの主要な部分にさらに区分され、上記のらせんは、その存在下で末端鎖(鎖4及び5)を互いに平行にするか又は非存在下で逆平行にする。デアミナーゼの活性部位は、保存されたらせん2及び3間に亜鉛イオンを配位する3つの残基で構成される。残基は、通常、らせん2及び3の最初にある[HCD]xE及びCxxCモチーフとして見出される。亜鉛イオンは水分子を活性化し、水分子はアミン基に結合する炭素原子と四面体中間体を形成する。これに続いて、塩基の脱アミノ化が起こる。MafB19様デアミナーゼファミリーは、ナイセリア(Neisseria)MafB19によってプロトタイピングされた核酸/ヌクレオチドデアミナーゼスーパーファミリーのメンバーである。このファミリーのメンバーは、細菌の幅広い系統発生範囲に存在し、細菌多型毒素系の毒素として機能すると予測される。SCP1.201様デアミナーゼは、ストレプトマイセス(Streptomyces)SCP1.201によってプロトタイピングされた核酸/ヌクレオチドデアミナーゼスーパーファミリーのメンバーである。このファミリーのメンバーは、細菌多型毒素系の毒素として機能すると予測される。
デアミナーゼ又はデアミナーゼドメインは、細菌など、前述のいずれかを含む生物由来の天然デアミナーゼの変異体であり得る。一部の形態では、デアミナーゼ又はデアミナーゼドメインは、天然には存在しない。例えば、一部の形態では、デアミナーゼ又はデアミナーゼドメインは、天然に存在するデアミナーゼドメインに対して少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%又は少なくとも99.5%の配列同一性を示す。
デアミナーゼ又はデアミナーゼドメインのサイズは変動し得る。一部の形態では、デアミナーゼ又はデアミナーゼドメインは、約50~250、50~200、50~150、50~100、100~250、100~200、100~150、100~120、120~160、120~140、140~160、150~250、150~200、200~250又は200~220アミノ酸長である。一部の形態では、デアミナーゼ又はデアミナーゼドメインは、約40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240又は250アミノ酸長である。
一部の形態では、開示されるデアミナーゼ又はデアミナーゼドメインは、2つ以上の別個の部分(例えば、2、3、4又は5)に分割することができる。このような形態では、スプリットデアミナーゼドメインは、小成分が結合されて(例えば、共発現若しくは共導入された)、且つ/又は一緒に近接された(例えば、DNA標的ドメインにより)場合にのみ、基質を脱アミノ化することができる。例えば、実施例1は、単一のデアミナーゼドメインをN末端部分とC末端部分に分離することができ、それらの結合時にデアミナーゼ活性を示すことを実証する。当業者であれば、デアミナーゼドメインを異なる位置で分割することができることを理解し、その相補的成分の結合時にデアミナーゼ活性を保持する目的で、単一のデアミナーゼドメインをどこで分割するべきかを決定することができるであろう。
一部の形態では、デアミナーゼドメインは、シトシンデアミナーゼ(本明細書ではシチジンデアミナーゼとも呼ばれる)であり、これは、シチジン又はシトシンの加水分解脱アミノ化を触媒する。一部の形態では、シトシンデアミナーゼは、シチジン又はデオキシシチジンのウリジン又はデオキシウリジンの加水分解脱アミノ化をそれぞれ触媒する。一部の形態では、シトシンデアミナーゼドメインは、シトシンのウラシルへの加水分解脱アミノ化を触媒する。
一部の形態では、デアミナーゼドメインは、アデノシンデアミナーゼ(本明細書ではアデニンデアミナーゼとも称される)であり、これは、アデニン又はアデノシンの加水分解脱アミノ化を触媒する。一部の形態では、アデノシンデアミナーゼは、アデノシン又はデオキシアデノシンのイノシン又はデオキシイノシンへの加水分解脱アミノ化をそれぞれ触媒する。
特定の形態では、単離されたデアミナーゼドメインが開示され、デアミナーゼドメインは、二本鎖DNAを脱アミノ化することができる。デアミナーゼドメインは、標的ヌクレオチド配列を含まない二本鎖DNA上のデアミナーゼドメインのデアミナーゼ活性と比較して、標的ヌクレオチド配列を含む二本鎖DNA上で、より大きいデアミナーゼ活性を有することができる。好ましくは、標的ヌクレオチド配列は、2つ以上の標的ヌクレオチド(例えば、2つ、3つ、4つ、5つ、6つ、7つ、8つ、9つ、10又はそれを超える)を含み、標的ヌクレオチドは、それぞれ個別に完全に又は部分的に規定され、且つ互いに固定された順序関係にある。一部の形態では、標的ヌクレオチド配列は、3つ以上の標的ヌクレオチドを含む。一部の形態では、標的ヌクレオチド配列は、4つ以上の標的ヌクレオチドを含む。一部の形態では、標的ヌクレオチド配列は、5つ以上の標的ヌクレオチドを含む。このような形態では、標的ヌクレオチドは、それぞれ個別に完全に又は部分的に規定され、且つ互いに固定された順序関係にある。好ましくは、デアミナーゼドメインは、バークホルデリア・セノセパシア(Burkholderia cenocepacia)由来のDddAのデアミナーゼドメインではない(Mok BY.,et al.,Nature,583(7817):631-637(2020)を参照されたい)。
デアミナーゼドメインは、標的ヌクレオチド配列を含む核酸基質(例えば、ssDNA、dsDNA、RNA)の脱アミノ化で広範な編集効率を示すことができる。一部の形態では、標的ヌクレオチドを含む核酸基質の編集効率は、少なくとも1%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、 少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%又は少なくとも95%である。一部の形態では、標的ヌクレオチドを含む核酸基質の編集効率は、少なくとも1%である。一部の形態では、標的ヌクレオチドを含む核酸基質の編集効率は、少なくとも10%である。一部の形態では、標的ヌクレオチドを含む核酸基質の編集効率は、少なくとも25%である。一部の形態では、標的ヌクレオチドを含む核酸基質の編集効率は、少なくとも50%である。
一部の形態では、デアミナーゼドメインによって認識及び/又は脱アミノ化される標的ヌクレオチド配列を、シーケンスロゴとして表すことができる。シーケンスロゴは、アミノ酸又は核酸の複数の配列アラインメントをグラフとして表したものである。例えば、図4A~4Cを参照されたい。各ロゴは、シンボルのスタックを含み、1スタックは、シーケンス内の各位置を示す。スタックの全高は、その位置での配列保存性を示し、スタック内のシンボルの高さは、その位置における各アミノ酸又は核酸の相対頻度を示す。各スタック内で、文字は相対頻度により順序付けられ、スタックの全高は、その位置の情報量(ビット)によって決定される(Dey,KK.,et al.,BMC Bioinformatics.19,473(2018);Schneider TD.,et al.,Nucleic Acids Res.,18(20):6097-100(1990)を参照されたい)。
標的ヌクレオチドは、規定された編集閾値でのデアミナーゼ確率シーケンスロゴによって規定されるコンテキスト特異性をそれぞれ示すことができる。標的ヌクレオチドの直前の残基は、最も重要な特異性規定残基であるため、有意な特異性は、ACN、CCN、GCN、TCNである。このような特異性は、オフターゲット編集を低減するのに有意であり得る。しかし、広範な特異性のデアミナーゼは、より多様な標的の編集を可能にし、オフターゲット編集は、本明細書に記載される他の特徴及び設計によって制限され得る。
デアミナーゼ特異性の例として、BE_11_R1は、全てのTC、AC及びCCコンテキストをほぼ等しい確率で編集することができるが、GCコンテキストでは活性が低い。同じデアミナーゼの場合、標的ヌクレオチド後の位置は、ほぼ等しい確率で任意のヌクレオチドであり得る。そのため、図4に示すロゴに基づくBE_R1_11に適した(最も可能性の高い)部位はTCAであるが、他の部位も非常に可能性が高い。BE_R2_17のように、特異性の狭いデアミナーゼの場合、最も可能性の高い(観察された)編集部位は、TCT、TCG及びTCAである(これは、本発明者らの基質中の64の考えられる3ヌクレオチドの組合せ全てのうち、これらの3つの組合せが、少なくとも50%の効率でこのデアミナーゼによって編集された主な組合せであったことを意味する)。
当業者は、任意の開示されるデアミナーゼドメインについてのシーケンスロゴを取得するための適切な方法を容易に決定することができる。非限定的な例を実施例1に記載する。手短には、一部の形態では、様々な配列コンテキストで、目的のデアミナーゼドメインを、標的ヌクレオチド(例えば、シトシンデアミナーゼドメインの場合にはC、アデノシンデアミナーゼドメインの場合にはA)を含む異なる核酸基質(即ち異なる配列を有する)と一緒にインキュベートすることができる。次に、基質を配列決定する。次に、標的ヌクレオチドの編集(脱アミノ化)から生じた配列変異体を同定し、これらの配列変異体の複数の配列アラインメントからシーケンスロゴを生成することができる。シーケンスロゴを生成するための様々なツールが当技術分野で利用可能である。非限定的な例としては、Seq2Logo(ウェブサイト:cbs.dtu.dk/biotools/Seq2Logo/)、WebLogo(インターネットサイト:weblogo.berkeley.edu/logo.cgi)及びWeblogo(Crooks GE,et al.,Genome Research,14:1188-1190(2004))が挙げられる。一部の形態では、シーケンスロゴは、1%、10%、25%又は50%などの異なるレベルの編集(脱アミノ化)効率に対して決定することができる(例えば、図4A~4Cを参照されたい)。
従って、一部の形態では、開示されるデアミナーゼドメインは、シーケンスロゴとして表される標的ヌクレオチド配列を含む核酸基質に対してデアミナーゼ活性を有する。一部の形態では、標的ヌクレオチド配列(シーケンスロゴ)中の標的ヌクレオチドは、各々約0.1~2.0ビット(両端の値を含む)を含む。例えば、一部の形態では、標的ヌクレオチド配列(シーケンスロゴ)中の標的ヌクレオチドは、約0.1、約0.2、約0.25、約0.3、約0.4、約0.5、約0.6、約0.7、約0.75、約0.8、約0.9、約1.0、約1.1、約1.2、約1.25、約1.3、約1.4、約1.5、約1.6、約1.7、約1.75、約1.8、約1.9又は約2.0ビットをそれぞれ呈示する。
一部の形態では、標的ヌクレオチド配列(シーケンスロゴ)中の標的ヌクレオチドは、標的ヌクレオチド配列の約1%~約90%が編集されたとき、各々約0.1~約2.0ビットを呈示する。例えば、一部の形態では、標的ヌクレオチド配列の1%以上が編集されると、標的ヌクレオチドは各々少なくとも0.1ビットを呈示する。一部の形態では、標的ヌクレオチド配列の10%以上が編集されると、標的ヌクレオチドは各々少なくとも0.1ビットを呈示する。一部の形態では、標的ヌクレオチド配列の25%以上が編集されると、標的ヌクレオチドは各々少なくとも0.1ビットを呈示する。一部の形態では、標的ヌクレオチド配列の50%以上が編集されると、標的ヌクレオチドは各々少なくとも0.1ビットを呈示する。
一部の形態では、標的ヌクレオチド配列の1%以上が編集されると、標的ヌクレオチドは各々少なくとも0.25ビットを呈示する。一部の形態では、標的ヌクレオチド配列の10%以上が編集されると、標的ヌクレオチドは各々少なくとも0.25ビットを呈示する。一部の形態では、標的ヌクレオチド配列の25%以上が編集されると、標的ヌクレオチドは各々少なくとも0.25ビットを呈示する。一部の形態では、標的ヌクレオチド配列の50%以上が編集されると、標的ヌクレオチドは各々少なくとも0.25ビットを呈示する。一部の形態では、標的ヌクレオチド配列の1%以上が編集されると、標的ヌクレオチドは各々少なくとも0.5ビットを呈示する。一部の形態では、標的ヌクレオチド配列の10%以上が編集されると、標的ヌクレオチドは各々少なくとも0.5ビットを呈示する。一部の形態では、標的ヌクレオチド配列の25%以上が編集されると、標的ヌクレオチドは各々少なくとも0.5ビットを呈示する。一部の形態では、標的塩基配列の50%以上が編集されると、標的ヌクレオチドは各々少なくとも0.5ビットを呈示する。
特定の形態では、単離されたデアミナーゼドメインは、シトシン含有ヌクレオチド(シトシンデアミナーゼと呼ばれる)を脱アミノ化することができる。シトシンデアミナーゼによって脱アミノ化することができる例示的な標的ヌクレオチド配列としては、AC、CC、GC及びTCが挙げられるが、これらに限定されない。一部の形態では、シトシンデアミナーゼによって脱アミノ化され得る標的ヌクレオチド配列は、限定されないが、Ac、Cc、Gc及びTcを含み、Nは、独立して、任意のヌクレオチドを表し、脱アミノ化されるシトシン含有ヌクレオチドは、小文字である。
1.例示的なシトシンデアミナーゼドメイン
様々な形態では、dsDNA塩基エディター(例えば、DNAbps及びCDA)を含むdsDNA塩基エディター又はポリペプチドは、シトシンデアミナーゼ(CDA)又はその不活性若しくは短縮断片を含むように操作され得る。開示される組成物及び方法に従って使用することができる例示的なシトシンデアミナーゼのアミノ酸配列を以下に記載する。
様々な形態では、CDAタンパク質は、BE11(Uniprot ID番号:A0A1Y5Y1M1_KIBARの成分)であり、これは、以下のアミノ酸配列:
Figure 2024502630000001
(配列番号1)又は配列番号1のCDAと少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%若しくは100%の配列同一性を有するアミノ酸配列或いはその断片を有する。
様々な形態では、CDAタンパク質は、BE12(Uniprot ID No.:A0A2T4Z6L8_9BACL)であり、これは、以下のアミノ酸配列:
Figure 2024502630000002
(配列番号2)又は配列番号2のCDAと少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%若しくは100%の配列同一性を有するアミノ酸配列或いはその断片を有する。
様々な形態では、CDAタンパク質は、BE28(Uniprot ID番号:A0A0K1EKV1_CHOCOの成分)であり、これは、以下のアミノ酸配列:
Figure 2024502630000003
(配列番号3)又は配列番号3のCDAと少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%若しくは100%の配列同一性を有するアミノ酸配列或いはその断片を有する。
様々な形態では、CDAタンパク質は、BE_R1_41(Uniprot ID番号:C5ALM7_BURGBの成分)であり、これは、以下のアミノ酸配列:
Figure 2024502630000004
(配列番号4)又は配列番号4のCDAと少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%若しくは100%の配列同一性を有するアミノ酸配列或いはその断片を有する。
一部の形態では、CDAタンパク質は、BE_R2_7(Uniprot ID番号:A0A1U7ISE2_9CYANの成分)であり、これは、以下のアミノ酸配列:
MPPAGSETDKSTIAKLEISGQNFFGINSGSNPNPRQITFNVNPITKTHAEADAFQQAADVGIRGGKARLIVDRDLCAACGIRGGVNSMAWQLGIEELEIITPSVSKTIAVKPPNRRRQ
(配列番号8)又は配列番号8のCDAと少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%若しくは100%の配列同一性を有するアミノ酸配列或いはその断片を有する。
一部の形態では、CDAタンパク質は、BE_R2_11(Uniprot ID番号:A0A2T4Z7P2_9BACLの成分)であり、これは、以下のアミノ酸配列:
Figure 2024502630000005
(配列番号9)又は配列番号9のCDAと少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%若しくは100%の配列同一性を有するアミノ酸配列或いはその断片を有する。
一部の形態では、CDAタンパク質は、BE_R2_17(Uniprot ID番号:D2ZY33_NEIMUの成分)であり、これは、以下のアミノ酸配列:
Figure 2024502630000006
(配列番号10)又は配列番号10のCDAと少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%若しくは100%の配列同一性を有するアミノ酸配列或いはその断片を有する。
一部の形態では、CDAタンパク質は、BE_R2_18(Uniprot ID番号:A0A0A8K6F0_9RHIZの成分)であり、これは、以下のアミノ酸配列:
Figure 2024502630000007
(配列番号11)又は配列番号11のCDAと少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%若しくは100%の配列同一性を有するアミノ酸配列或いはその断片を有する。
一部の形態では、CDAタンパク質は、BE_R2_29(Uniprot ID番号:D2QYF9_PIRSDの成分)であり、これは、以下のアミノ酸配列:
Figure 2024502630000008
(配列番号14)又は配列番号14のCDAと少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%若しくは100%の配列同一性を有するアミノ酸配列或いはその断片を有する。
一部の形態では、CDAタンパク質は、BE_R2_31(Uniprot ID番号:G8SI56_ACTS5の成分)であり、これは、以下のアミノ酸配列:
Figure 2024502630000009
(配列番号15)又は配列番号15のCDAと少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%若しくは100%の配列同一性を有するアミノ酸配列或いはその断片を有する。
一部の形態では、CDAタンパク質は、BE_R2_48(Uniprot ID番号:A0A2T4Z6L8_9BACLの成分)であり、これは、以下のアミノ酸配列:
Figure 2024502630000010
(配列番号16)又は配列番号16のCDAと少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%若しくは100%の配列同一性を有するアミノ酸配列或いはその断片を有する。
一部の形態では、CDAタンパク質は、BE_R1_10(Uniprot ID番号:A0A3P2ALZ1_9FIRMの成分)であり、これは、以下のアミノ酸配列:
Figure 2024502630000011
(配列番号40)又は配列番号40のCDAと少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%若しくは100%の配列同一性を有するアミノ酸配列或いはその断片を有する。
一部の形態では、CDAタンパク質は、BE_R1_15(Uniprot ID番号:A0A433SEU4_9BURKの成分)であり、これは、以下のアミノ酸配列:
Figure 2024502630000012
(配列番号41)又は配列番号41のCDAと少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%若しくは100%の配列同一性を有するアミノ酸配列或いはその断片を有する。
一部の形態では、CDAタンパク質は、BE_R1_21(Uniprot ID番号:A0A3P2A0L6_9NEISの成分)であり、これは、以下のアミノ酸配列:
Figure 2024502630000013
(配列番号42)又は配列番号42のCDAと少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%若しくは100%の配列同一性を有するアミノ酸配列或いはその断片を有する。
一部の形態では、CDAタンパク質は、BE_R2_1(Uniprot ID番号:A0A0F6W299_9DELTの成分)であり、これは、以下のアミノ酸配列:
Figure 2024502630000014
(配列番号43)又は配列番号43のCDAと少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%若しくは100%の配列同一性を有するアミノ酸配列或いはその断片を有する。
一部の形態では、CDAタンパク質は、BE_R2_3(Uniprot ID番号:A0A0N9HXW6_9PSEUの成分)であり、これは、以下のアミノ酸配列:
Figure 2024502630000015
(配列番号44)又は配列番号44のCDAと少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%若しくは100%の配列同一性を有するアミノ酸配列或いはその断片を有する。
一部の形態では、CDAタンパク質は、BE_R2_19(Uniprot ID番号:A0A1I4B7X1_9PSEUの成分)であり、これは、以下のアミノ酸配列:
Figure 2024502630000016
(配列番号45)又は配列番号45のCDAと少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%若しくは100%の配列同一性を有するアミノ酸配列或いはその断片を有する。
一部の形態では、CDAタンパク質は、BE_R2_20(Uniprot ID番号:A0A1M7DT37_9FIRMの成分)であり、これは、以下のアミノ酸配列:
Figure 2024502630000017
(配列番号46)又は配列番号46のCDAと少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%若しくは100%の配列同一性を有するアミノ酸配列或いはその断片を有する。
一部の形態では、CDAタンパク質は、BE_R2_21(Uniprot ID番号:A0A1N6MQY7_9GAMMの成分)であり、これは、以下のアミノ酸配列:
Figure 2024502630000018
(配列番号47)又は配列番号47のCDAと少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%若しくは100%の配列同一性を有するアミノ酸配列或いはその断片を有する。
一部の形態では、CDAタンパク質は、BE_R2_28(Uniprot ID番号:B9JGM2_AGRRKの成分)であり、これは、以下のアミノ酸配列:
Figure 2024502630000019
(配列番号48)又は配列番号48のCDAと少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%若しくは100%の配列同一性を有するアミノ酸配列或いはその断片を有する。
一部の形態では、CDAタンパク質は、BE_R4_4(Uniprot ID番号:B9JGM2_AGRRKの成分)であり、これは、以下のアミノ酸配列:
Figure 2024502630000020
(配列番号49)又は配列番号40のCDAと少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%若しくは100%の配列同一性を有するアミノ酸配列或いはその断片を有する。
一部の形態では、CDAタンパク質は、BE_R4_6(Uniprot ID番号:A0A7G9FZY2_9FIRMの成分)であり、これは、以下のアミノ酸配列:
Figure 2024502630000021
(配列番号50)又は配列番号50のCDAと少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%若しくは100%の配列同一性を有するアミノ酸配列或いはその断片を有する。
一部の形態では、CDAタンパク質は、BE_R4_7(Uniprot ID番号:A0A7X7XYI6_CLOSPの断片)であり、これは、以下のアミノ酸配列:
Figure 2024502630000022
(配列番号51)又は配列番号51のCDAと少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%若しくは100%の配列同一性を有するアミノ酸配列或いはその断片を有する。
一部の形態では、CDAタンパク質は、BE_R4_10(Uniprot ID番号:MBR1615955.1の成分)であり、これは、以下のアミノ酸配列:
ELPPYDGKTTYGVLILDDGKQYSFNSGKPAPIYRNYIPASHVEGKAAIYMRENKIQSGTVYHNNTDGTCPYCDKMLPTLLEKDSTLKVVPPQNATSSKKGWITNEKIYIGNDKIPKT
(配列番号52)又は配列番号52のCDAと少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%若しくは100%の配列同一性を有するアミノ酸配列或いはその断片を有する。
一部の形態では、CDAタンパク質は、BE_R4_12(Uniprot ID番号:MGYP000605828529の成分)であり、これは、以下のアミノ酸配列:
Figure 2024502630000023
(配列番号53)又は配列番号53のCDAと少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%若しくは100%の配列同一性を有するアミノ酸配列或いはその断片を有する。
一部の形態では、CDAタンパク質は、BE_R4_13(Uniprot ID番号:WP_021798742の成分)であり、これは、以下のアミノ酸配列:
Figure 2024502630000024
(配列番号54)又は配列番号54のCDAと少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%若しくは100%の配列同一性を有するアミノ酸配列或いはその断片を有する。
一部の形態では、CDAタンパク質は、BE_R4_14(Uniprot ID番号:WP_059988487の成分)であり、これは、以下のアミノ酸配列:
Figure 2024502630000025
(配列番号55)又は配列番号55のCDAと少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%若しくは100%の配列同一性を有するアミノ酸配列或いはその断片を有する。
一部の形態では、CDAタンパク質は、BE_R4_15(Uniprot ID番号:WP_082507154の成分)であり、これは、以下のアミノ酸配列:
Figure 2024502630000026
(配列番号56)又は配列番号56のCDAと少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%若しくは100%の配列同一性を有するアミノ酸配列或いはその断片を有する。
一部の形態では、CDAタンパク質は、BE_R4_16(Uniprot ID番号:WP_112210906の成分)であり、これは、以下のアミノ酸配列:
Figure 2024502630000027
(配列番号57)又は配列番号57のCDAと少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%若しくは100%の配列同一性を有するアミノ酸配列或いはその断片を有する。
一部の形態では、CDAタンパク質は、BE_R4_17(Uniprot ID番号:WP_133186147の成分)であり、これは、以下のアミノ酸配列:
Figure 2024502630000028
(配列番号58)又は配列番号58のCDAと少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%若しくは100%の配列同一性を有するアミノ酸配列或いはその断片を有する。
一部の形態では、CDAタンパク質は、BE_R4_18(Uniprot ID番号:WP_157869269の成分)であり、これは、以下のアミノ酸配列:
Figure 2024502630000029
(配列番号59)又は配列番号59のCDAと少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%若しくは100%の配列同一性を有するアミノ酸配列或いはその断片を有する。
一部の形態では、CDAタンパク質は、BE_R4_19(Uniprot ID番号:WP_165946289の成分)であり、これは、以下のアミノ酸配列:
Figure 2024502630000030
(配列番号60)又は配列番号60のCDAと少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%若しくは100%の配列同一性を有するアミノ酸配列或いはその断片を有する。
一部の形態では、CDAタンパク質は、BE_R4_20(Uniprot ID番号:WP_174422267の成分)であり、これは、以下のアミノ酸配列:
Figure 2024502630000031
(配列番号61)又は配列番号61のCDAと少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%若しくは100%の配列同一性を有するアミノ酸配列或いはその断片を有する。
一部の形態では、CDAタンパク質は、BE_R4_21(Uniprot ID番号:WP_189594293の成分)であり、これは、以下のアミノ酸配列:
Figure 2024502630000032
(配列番号62)又は配列番号62のCDAと少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%若しくは100%の配列同一性を有するアミノ酸配列或いはその断片を有する。
一部の形態では、CDAタンパク質は、BE_R4_22(Uniprot ID番号:MGYP000498443267の成分)であり、これは、以下のアミノ酸配列:
Figure 2024502630000033
(配列番号63)又は配列番号63のCDAと少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%若しくは100%の配列同一性を有するアミノ酸配列或いはその断片を有する。
一部の形態では、CDAタンパク質は、BE_R4_23(Uniprot ID番号:WP_195441564の成分)であり、これは、以下のアミノ酸配列:
Figure 2024502630000034
(配列番号64)又は配列番号64のCDAと少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%若しくは100%の配列同一性を有するアミノ酸配列或いはその断片を有する。
一部の形態では、CDAタンパク質は、BE_R4_24(Uniprot ID番号:WP_211232061の成分)であり、これは、以下のアミノ酸配列:
Figure 2024502630000035
(配列番号65)又は配列番号65のCDAと少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%若しくは100%の配列同一性を有するアミノ酸配列或いはその断片を有する。
一部の形態では、CDAタンパク質は、BE_R4_25(Uniprot ID番号:MGYP000402883179の成分)であり、これは、以下のアミノ酸配列:
Figure 2024502630000036
(配列番号66)又は配列番号66のCDAと少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%若しくは100%の配列同一性を有するアミノ酸配列或いはその断片を有する。
一部の形態では、CDAタンパク質は、BE_R4_26(Uniprot ID番号:MGYP000186340475の成分)であり、これは、以下のアミノ酸配列:
Figure 2024502630000037
(配列番号67)又は配列番号67のCDAと少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%若しくは100%の配列同一性を有するアミノ酸配列或いはその断片を有する。
一部の形態では、CDAタンパク質は、以下のアミノ酸配列:
Figure 2024502630000038
(配列番号68)の1つ以上の断片又は配列番号68のCDAと少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%若しくは100%の配列同一性を有するアミノ酸配列或いはその断片を有する。
MafB19デアミナーゼドメイン
一部の形態では、デアミナーゼドメインは、MafB19デアミナーゼドメインである。MafB19デアミナーゼファミリーの活性及び不活性メンバーの配列アラインメントを用いて、MafB19デアミナーゼファミリー中のdsDNA特異的デアミナーゼのシグネチャモチーフを同定した。MafB19デアミナーゼファミリー中のdsDNA特異的CDA中に存在する具体的なシグネチャモチーフは、以下を含む:(M/L)Pモチーフ;T(V/I/L/A)A(R/K/V)モチーフ;(Y/F/W)G(V/H/I/R/K)Nモチーフ;HAE=>活性部位モチーフ;dsDNAに対して活性であるMafB19-deamファミリーのほぼ全メンバーに存在するVD(R/K)モチーフ;並びにCXXCモチーフ(標準CXXCジンク結合モチーフ)。従って、一部の形態では、MafB19デアミナーゼファミリーと関連するデアミナーゼドメインは、(M/L)Pモチーフ;T(V/I/L/A)A(R/K/V)モチーフ;(Y/F/W)G(V/H/I/R/K)Nモチーフ;HA活性部位モチーフ;VD(R/K)モチーフ及び標準CXXCジンク結合モチーフを含む。
SCP1201デアミナーゼドメイン
一部の形態では、デアミナーゼドメインは、SCP1201デアミナーゼファミリーデアミナーゼドメインである。SCP1201デアミナーゼファミリーの活性及び不活性メンバーの配列アラインメントを用いて、SCP1201デアミナーゼファミリー中のdsDNA特異的デアミナーゼのシグネチャモチーフを同定した。SCP1201デアミナーゼファミリーのdsDNA特異的CDA中に存在する具体的なシグネチャモチーフは、以下を含む:L(P/L)モチーフ;(Y/F/E/Q)(D/E/N)G(K/R/D)(T/K/N)TXG(V/L/T)(L/M/F)モチーフ;(P/S/T)(N/G/E/Q)Yモチーフ;(G/S)HVE(G/A/Q)-G又はS後に保存された活性部位モチーフ(HVE)が位置し、これに(G/A/Q)が続く;HNNモチーフ(又は程度は低いが、(H/I)(N/D)(N/H))、G(T/I)C(G/P/N/H)(Y/F)Cモチーフ-G(T/I)後に標準CXXCジンク結合モチーフ;(T/A)LL(P/E)モチーフ;L(E/D/R/K)V(V/I)PPモチーフ及びG(N/D)XXXPKモチーフ。Cx(Y/F)Cは、SCP1201デアミナーゼのdsDNA特異的デアミナーゼで主要なモチーフである。BE_R1_28を除いて、このファミリーの全ての活性メンバーは、厳密に、ジンク結合モチーフ中の2つのC残基間に2つのアミノ酸を有する。このファミリーの不活性メンバーは全て、2つのC残基間に3つ以上のアミノ酸を有する。このファミリーの活性メンバーでは、G(T/I)モチーフ後にジンク結合モチーフが位置する。従って、一部の形態では、SCP1201デアミナーゼファミリーに関連するデアミナーゼドメインは、L(P/L)モチーフ;(Y/F/E/Q)(D/E/N)G(K/R/D)(T/K/N)TXG(V/L/T)(L/M/F)モチーフ;(P/S/T)(N/G/E/Q)Yモチーフ;(G/S)HVE(G/A/Q);HNNモチーフ(又は程度は低いが、(H/I)(N/D)(N/H));G(T/I)C(G/P/N/H)(Y/F)Cモチーフ;(T/A)LL(P/E)モチーフ;L(E/D/R/K)V(V/I)PPモチーフ及びG(N/D)XXXPKモチーフを含む1つ以上の構造的特徴を含む。
特定の形態では、単離されたデアミナーゼドメインは、アデニン含有ヌクレオチドを脱アミノ化することができる(アデノシンデアミナーゼと呼ばれる)。一部の形態では、タンパク質、ポリペプチド又はタンパク質若しくはポリペプチドの1つ以上の機能性ドメインであり、これは、アデニン(又はある分子のアデニン部分)をヒポキサンチン(又はある分子のヒポキサンチン部分)に変換する加水分解脱アミノ化反応を触媒することができる。アデニン含有ヌクレオチドは、アデノシン(A)であり得、ヒポキサンチン含有分子は、イノシン(I)であり得る。アデニン含有分子は、DNA又はRNAであり得る。
さらに別の好適なデアミナーゼドメイン及びその配列は、本開示に基づいて当業者に明らかであろう。例えば、配列番号1~16のいずれか1つ又は本明細書に開示されるアクセッション番号のいずれかの配列をクエリ配列として使用して、相同体及び他の関連タンパク質、ポリペプチド又はそのドメインを同定することができる。このような相同体及び他の関連タンパク質、ポリペプチド又はそのドメインは、RNA若しくはDNA基質に対してデアミナーゼ活性を示し得ることから、開示される組成物及び方法に従って使用することができると考慮される。
一部の形態では、好適なデアミナーゼドメイン(例えば、アデノシンデアミナーゼ又はシトシンデアミナーゼ)は、本明細書に開示されるUniprotアクセッション番号、例えば、配列番号1~16(及びそれらのアミノ酸配列をコードする核酸配列を含む)のいずれかと少なくとも50%、少なくとも60%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%又は少なくとも99%の配列同一性を有する。好ましくは、配列同一性は、クエリ配列の長さの少なくとも50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%又は100%にわたる。従って、一部の形態では、単離されたシトシンデアミナーゼは、配列番号1~16のいずれかの配列(及びそのアミノ酸配列が提供される核酸配列を含む)と少なくとも50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%又は100%の配列同一性を有する。
本明細書に開示されるデアミナーゼのいずれかに対して1つ以上の変異(例えば、保存的又は非保存的変異)を含むシトシン又はアデノシンデアミナーゼ変異体も開示されることは理解すべきである。例えば、構造データに基づくか又は一連の直接進化アプローチ(ランダム突然変異誘発及び選択/スクリーニング)のいずれかによる、デアミナーゼの特定の領域における1つ以上のアミノ酸残基の標的変異により、他のシトシン又はアデノシンデアミナーゼ変異体を、本明細書に開示されるものから進化させ得ることも企図される。従って、1つ以上の変異を、開示されるデアミナーゼドメインのいずれかに導入することができる。一部の形態では、そのような変異は、基質結合を改変し、結合基質の立体構造を改変し、デアミナーゼ活性部位への基質の到達可能性を改変し、標的ヌクレオチド(例えば、C若しくはA)のデアミナーゼ活性部位への非最適提示に対する耐性を改変し、且つ/又は標的ヌクレオチド配列特異性(認識)及び/若しくは編集効率を改変することができる。一部の形態では、好適なシトシン若しくはアデノシンデアミナーゼは、配列番号1~20、40~68に記載されるアミノ酸配列のいずれか1つ又は他に本明細書に記載されるデアミナーゼのいずれかと比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50又はそれを超える変異を有するアミノ酸配列を含む。一部の形態では、シトシン又はアデノシンデアミナーゼは、配列番号1~16又は40~68に記載のアミノ酸配列のいずれか1つと比較して、少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90又は少なくとも100個の同一の連続したアミノ酸残基を有するアミノ酸配列を含む。
B.塩基エディター
デアミナーゼドメイン及び1つ以上の機能性ドメインを含む塩基エディターも開示される。一部の形態では、塩基エディターは、「スプリット」デアミナーゼ、例えば、2つ以上の別個の断片に切断されるデアミナーゼを含む。分割断片の各々は、典型的に、デアミナーゼ活性がなく、例えば、共局在化による、2つ以上の断片の再会合により、デアミナーゼ活性が回復又は増強されるようにする。従って、一部の形態では、塩基エディターは、スプリット塩基エディターである。典型的には、スプリット塩基エディターは、1つ又は複数の機能性ドメインの特異的相互作用に依存して、核酸内の特定の位置で、デアミナーゼドメインを共局在化し、デアミナーゼ活性を再形成する。機能性ドメインは、ポリペプチド若しくはタンパク質又はその一部或いは塩基エディターに所望の特性又は機能を付与する任意の部分であり得る。所望の特性又は機能は、例えば、細胞小器官への局在化、酵素活性、タンパク質相互作用、エピトープタグ付け又はDNA及び/若しくはRNA結合であり得る。一部の形態では、塩基エディターは、(1)プログラマブルDNA結合ドメインと;(2)デアミナーゼドメイン及び任意選択でDNA結合ドメインとデアミナーゼドメインとの間の1つ以上のリンカー並びに/又はターゲティングモチーフなどの1つ以上の追加の機能性ドメインを含む。一部の形態では、デアミナーゼドメインは、スプリットデアミナーゼドメイン、即ち不活性デアミナーゼドメイン又はその断片である。典型的には、2つ以上のスプリットデアミナーゼドメインの共局在化(例えば、プログラマブルDNA結合ドメインによって決定される標的DNA鎖上の会合による)は、2つ以上のスプリットデアミナーゼドメインの1つ以上におけるデアミナーゼ活性を活性化する。
1.スプリットデアミナーゼドメイン
一部の形態では、本組成物は、機能性デアミナーゼドメイン内の切断部位でデアミナーゼタンパク質を切断することによって得られる機能性二本鎖DNAデアミナーゼタンパク質の非天然由来ポリペプチド断片を含む。例えば、一部の形態では、断片は、N末端断片に対応し、断片は、切断された機能性デアミナーゼドメインのN末端部分を含む。他の形態では、断片は、C末端断片に対応し、断片は切断された機能性デアミナーゼドメインのC末端部分を含む。デアミナーゼ活性は、N末端断片をC末端断片と共局在させるとき又はC末端断片をN末端断片と共局在させるときに回復される。スプリットデアミナーゼの異なる形態及び立体配置の例を図41に示す。
第1及び第2のモノマーを有するヘテロダイマーを含む塩基エディターも記載され、第1のモノマーは、第1のプログラマブルDNA結合タンパク質と、切断された二本鎖DNAデアミナーゼのN末端又はC末端断片を含み、及び第2のモノマーは、第2のプログラマブルDNA結合タンパク質と、切断された二本鎖DNAデアミナーゼのN末端又はC末端断片を含む。典型的には、第1及び第2のモノマーの二量体化は、機能性二本鎖DNAデアミナーゼタンパク質及び機能性二本鎖DNAデアミナーゼ活性を再形成する。
i.例示的なスプリットデアミナーゼドメイン
デアミナーゼ活性を欠いた例示的なスプリットデアミナーゼドメインが記載される。典型的には、スプリットデアミナーゼドメインは、デアミナーゼドメインへの1つ以上の変異の導入によって不活性化される。変異は、デアミナーゼドメイン内の所定の位置における1つ以上のアミノ酸の特異的欠失、置換及び付加が含まれる。一部の形態では、スプリットデアミナーゼドメインは、配列番号1~17、40~68のいずれか1つのアミノ酸配列を有するデアミナーゼドメインのいずれかにおける所与の位置にある1つ以上のアミノ酸の1つ以上の特異的欠失、置換又は付加を含む。
a.不活性デアミナーゼドメイン
一部の形態では、スプリットデアミナーゼは、デアミナーゼタンパク質の不活性形態である。例えば、一部の形態では、スプリットデアミナーゼは、デアミナーゼドメインの「不活性型」又は完全に不活性な変異体である。好ましい形態では、不活性型デアミナーゼドメインは、DNA結合領域に1つ以上の変異体を有するデアミナーゼタンパク質である。典型的には、同じタイプの1つ以上のインタクトな、短縮又は切断されたデアミナーゼドメイン断片を有する不活性デアミナーゼドメインが共局在して、短縮又は切断された断片の欠損構造成分を付与することにより、短縮又は切断されたデアミナーゼドメイン断片の活性を再形成することができる。この手法は、ある分割部位でデアミナーゼを切断することが適切ではないと考えられる場合、その活性のために二量体化(又は多量体化)を必要とするスプリットデアミナーゼを作製するのに特に有用である。
一部の形態では、不活性型デアミナーゼドメインは、BE_R1_11(BE_R1_11_不活性型)をベースとし、これは、以下のアミノ酸配列:
Figure 2024502630000039
(配列番号122)又は配列番号122に対して少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%若しくは少なくとも99%の配列同一性を有するアミノ酸或いはその断片を有する。
一部の形態では、不活性型デアミナーゼドメインは、BE_R1_28(BE_R1_28_不活性型)をベースとし、これは、以下のアミノ酸配列:
Figure 2024502630000040
(配列番号123)又は配列番号123に対して少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%若しくは少なくとも99%の配列同一性を有するアミノ酸或いはその断片を有する。
一部の形態では、不活性型デアミナーゼドメインは、BE_R1_12(BE_R1_12_不活性型)をベースとし、これは、以下のアミノ酸配列:
Figure 2024502630000041
(配列番号124)又は配列番号124に対して少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%若しくは少なくとも99%の配列同一性を有するアミノ酸或いはその断片を有する。
一部の形態では、不活性型デアミナーゼドメインは、BE_R4_21(BE_R4_21_不活性型)をベースとし、これは、以下のアミノ酸配列:
Figure 2024502630000042
(配列番号125)又は配列番号125に対して少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%若しくは少なくとも99%の配列同一性を有するアミノ酸或いはその断片を有する。
一部の形態では、不活性型デアミナーゼドメインは、BE_R2_11(BE_R2_11_不活性型)をベースとし、これは、以下のアミノ酸配列:
Figure 2024502630000043
(配列番号126)又は配列番号126に対して少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%若しくは少なくとも99%の配列同一性を有するアミノ酸或いはその断片を有する。
b.短縮又は切断スプリットデアミナーゼドメイン
一部の形態では、スプリットデアミナーゼは、デアミナーゼタンパク質の短縮又は切断された形態である。スプリットタンパク質は、再形成時に1つ以上(2×)の活性部位が、標的上に存在するように、設計することができる。例えば、一部の形態では、スプリットデアミナーゼは、デアミナーゼドメインの完全に不活性な短縮又は切断された断片である。好ましい形態では、短縮又は切断デアミナーゼドメインは、デアミナーゼドメインのアミノ(NH)若しくはカルボキシル(COOH)末端領域又はアミノ(NH)及びカルボキシル(COOH)末端領域の両方から1つ以上のアミノ酸が除去されたデアミナーゼタンパク質である。
一部の形態では、デアミナーゼタンパク質の短縮又は切断形態は、アミノ(NH)末端若しくはカルボキシル(COOH)末端又はアミノ(NH)末端及びカルボキシル(COOH)末端の両方からカウントされる特定の数の連続したアミノ酸残基が欠如した短縮又は切断デアミナーゼタンパク質である。例えば、一部の形態では、デアミナーゼタンパク質の短縮又は切断形態は、アミノ(NH)末端若しくはカルボキシル(COOH)末端又はアミノ(NH)末端及びカルボキシル(COOH)末端の両方からカウントされる5個の連続したアミノ酸残基又は10、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95若しくは100個の連続したアミノ酸残基が欠如した(Δ)短縮又は切断デアミナーゼタンパク質である。
(1)スプリットBE_R1_11デアミナーゼタンパク質
一部の形態では、デアミナーゼタンパク質の短縮又は切断形態は、BE_R1_11デアミナーゼタンパク質の短縮又は切断形態である。
BE_R1_11の切断アミノ(NH)断片
一部の形態では、デアミナーゼタンパク質の短縮又は切断形態は、アミノ(NH)末端に対応するBE_R1_11デアミナーゼタンパク質の断片を得るために特定のアミノ酸残基で切断された短縮又は切断BE_R1_11デアミナーゼタンパク質である。一部の形態では、デアミナーゼタンパク質の短縮又は切断形態は、Gly30、又はGly41、又はSer70、又はGly90、又はGly100のいずれかを含む位置での切除から生じるアミノ(NH)末端のアミノ酸残基を含む、切断されたBE_R1_11デアミナーゼタンパク質断片である。
一部の形態では、デアミナーゼタンパク質の切断形態は、アミノ酸Gly30(BE_R1_11_N_G30)で切断されたBE_R1_11デアミナーゼタンパク質の切断形態であり、これは、以下のアミノ酸配列:
TKSANSGGAAKDLAKYRERQGMPRAGSADDAHTAARLDVG(配列番号127)又は配列番号127に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
一部の形態では、デアミナーゼタンパク質の切断形態は、アミノ酸Gly41(BE_R1_11_N_G41)で切断されたBE_R1_11デアミナーゼタンパク質の切断形態であり、これは、以下のアミノ酸配列:
TKSANSGGAAKDLAKYRERQGMPRAGSADDAHTAARLDVGGRSFYGHNAHG(配列番号128)又は配列番号128に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
一部の形態では、デアミナーゼタンパク質の切断形態は、アミノ酸Ser70(BE_R1_11_N_S70)で切断されたBE_R1_11デアミナーゼタンパク質の切断形態であり、これは、以下のアミノ酸配列:
TKSANSGGAAKDLAKYRERQGMPRAGSADDAHTAARLDVGGRSFYGHNAHGRNIDIKVNAQTKTHAEADVFQQAKNAKVS(配列番号129)又は配列番号129に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
一部の形態では、デアミナーゼタンパク質の切断形態は、アミノ酸Gly90(BE_R1_11_N_G90)で切断されたBE_R1_11デアミナーゼタンパク質の切断形態であり、これは、以下のアミノ酸配列:
TKSANSGGAAKDLAKYRERQGMPRAGSADDAHTAARLDVGGRSFYGHNAHGRNIDIKVNAQTKTHAEADVFQQAKNAKVSADRATLHVDRDLCDACGIK(配列番号130)又は配列番号130に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
一部の形態では、デアミナーゼタンパク質の切断形態は、アミノ酸Gly100(BE_R1_11_N_G100)で切断されたBE_R1_11デアミナーゼタンパク質の切断形態であり、これは、以下のアミノ酸配列:
TKSANSGGAAKDLAKYRERQGMPRAGSADDAHTAARLDVGGRSFYGHNAHGRNIDIKVNAQTKTHAEADVFQQAKNAKVSADRATLHVDRDLCDACGIKGGVGSLMRGVG(配列番号131)又は配列番号131に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
BE_R1_11の切断カルボキシル(COOH)断片
一部の形態では、デアミナーゼタンパク質の短縮又は切断形態は、カルボキシル(COOH)末端に対応するBE_R1_11デアミナーゼタンパク質の断片を得るために特定のアミノ酸残基で切断された短縮又は切断BE_R1_11デアミナーゼタンパク質である。一部の形態では、デアミナーゼタンパク質の短縮又は切断形態は、Gly30、又はGly41、又はSer70、又はGly90、又はGly100のいずれかを含む位置での切断から生じるカルボキシル(COOH)末端のアミノ酸残基を含む、切断されたBE_R1_11デアミナーゼタンパク質断片である。
一部の形態では、デアミナーゼタンパク質の短縮又は切断形態は、アミノ(NH)末端のアミノ酸残基が欠如した切断BE_R1_11デアミナーゼタンパク質である。
一部の形態では、デアミナーゼタンパク質の短縮又は切断形態は、アミノ酸Gly30(BE_R1_11_C_G30)で切断されたBE_R1_11デアミナーゼタンパク質の切断形態であり、これは、以下のアミノ酸配列:
GRSFYGHNAHGRNIDIKVNAQTKTHAEADVFQQAKNAKVSADRATLHVDRDLCDACGIKGGVGSLMRGVGISRLTVNSPSGRFEITASRPSVPRRING(配列番号132)又は配列番号132に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
一部の形態では、デアミナーゼタンパク質の短縮又は切断形態は、アミノ酸Gly41(BE_R1_11_C_G41)で切断されたBE_R1_11デアミナーゼタンパク質の短縮又は切断形態であり、これは、以下のアミノ酸配列:
RNIDIKVNAQTKTHAEADVFQQAKNAKVSADRATLHVDRDLCDACGIKGGVGSLMRGVGISRLTVNSPSGRFEITASRPSVPRRING(配列番号133)又は配列番号133に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
一部の形態では、デアミナーゼタンパク質の切断形態は、アミノ酸Ser70(BE_R1_11_C_S70)で切断されたBE_R1_11デアミナーゼタンパク質の切断形態であり、これは、以下のアミノ酸配列:
ADRATLHVDRDLCDACGIKGGVGSLMRGVGISRLTVNSPSGRFEITASRPSVPRRING(配列番号150)又は配列番号150に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
一部の形態では、デアミナーゼタンパク質の切断形態は、アミノ酸Gly90(BE_R1_11_C_G90)で切断されたBE_R1_11デアミナーゼタンパク質の切断形態であり、これは、以下のアミノ酸配列:
GGVGSLMRGVGISRLTVNSPSGRFEITASRPSVPRRING(配列番号134)又は配列番号134に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
一部の形態では、デアミナーゼタンパク質の切断形態は、アミノ酸Gly100(BE_R1_11_C_G100)で切断されたBE_R1_11デアミナーゼタンパク質の切断形態であり、これは、以下のアミノ酸配列:
ISRLTVNSPSGRFEITASRPSVPRRING(配列番号135)又は配列番号135に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
スプリットBE_R1_11デアミナーゼタンパク質の結合
一部の形態では、デアミナーゼタンパク質の短縮又は切断形態は、デアミナーゼ機能のみが欠如している。一部の形態では、BE_R1_11デアミナーゼタンパク質の短縮又は切断形態の2つ以上の結合により、デアミナーゼ機能が再形成される。例えば、一部の形態では、アミノ(NH)末端から1つ以上のアミノ酸残基が欠如したBE_R1_11デアミナーゼタンパク質の1つの短縮又は切断形態又は完全BE_R1_11デアミナーゼドメインのカルボキシル(COOH)末端からの断片を組み合わせると、カルボキシル(COOH)末端から1つ以上のアミノ酸残基が欠如したBE_R1_11デアミナーゼタンパク質の1つ以上の短縮若しくは切断形態又は完全BE_R1_11デアミナーゼドメインのアミノ(NH)末端からの断片との結合若しくは共局在化時に機能性になる。例えば、一部の形態では、塩基エディターは、配列番号127~131のいずれか1つのアミノ酸配列を有するスプリットBE_R1_11デアミナーゼドメインを含み、この場合、塩基エディターは、配列番号132~135のアミノ酸配列を有する別のスプリットBE_R1_11デアミナーゼドメインとの共局在化又は結合時或いは配列番号122のアミノ酸配列又は配列番号122に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸を有するBE_R1_11デアミナーゼドメインの「不活性型」形態と一緒に、再形成されたデアミナーゼ活性を有する。
(2)スプリットBE_R1_12デアミナーゼタンパク質
一部の形態では、デアミナーゼタンパク質の短縮又は切断形態は、BE_R1_12デアミナーゼタンパク質の短縮又は切断形態である。
BE_R1_12の切断アミノ(NH)断片
一部の形態では、デアミナーゼタンパク質の短縮又は切断形態は、短縮又は切断されたBE_R1_12デアミナーゼタンパク質断片であり、Gly31、又はGly40、又はGly85、Gly110、又はGly140のいずれかを含む位置での切断から生じる(NH)末端のアミノ酸残基を含む。
一部の形態では、デアミナーゼタンパク質の切断形態は、アミノ酸Gly31(BE_R1_12_N_G31)で切断されたBE_R1_12デアミナーゼタンパク質の切断形態であり、これは、以下のアミノ酸配列:
FSKAESGYIEIQRFRRILNMPRYSLTNGRTG(配列番号136)又は配列番号136に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
一部の形態では、デアミナーゼタンパク質の切断形態は、アミノ酸Gly40(BE_R1_12_N_G40)で切断されたBE_R1_12デアミナーゼタンパク質の切断形態であり、これは、以下のアミノ酸配列:
FSKAESGYIEIQRFRRILNMPRYSLTNGRTGTVARVEVNG(配列番号137)又は配列番号137に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
一部の形態では、デアミナーゼタンパク質の切断形態は、アミノ酸Gly 85(BE_R1_12_N_G85)で切断されたBE_R1_12デアミナーゼタンパク質の切断形態であり、これは、以下のアミノ酸配列:
FSKAESGYIEIIQRFRRILNMPRYSLTNGRTGTVARVEVNGRRIFGVNTSLIKNSKYAPRDMDLRRRWLREVNWVPPKKNKPNHLG(配列番号138)又は配列番号138に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
一部の形態では、デアミナーゼタンパク質の切断形態は、アミノ酸Gly110(BE_R1_12_N_G110)で切断されたBE_R1_12デアミナーゼタンパク質の切断形態であり、これは、以下のアミノ酸配列:
FSKAESGYIEIIQRFRRILNMPRYSLTNGRTGTVARVEVNGRRIFGVNTSLIKNSKYAPRDMDLRRRWLREVNWVPPKKNKPNHLGHAQSLSHAESHALIRAYERMERLGG(配列番号139)又は配列番号139に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
一部の形態では、デアミナーゼタンパク質の切断形態は、アミノ酸Gly140(BE_R1_12_N_G140)で切断されたBE_R1_12デアミナーゼタンパク質の切断形態であり、これは、以下のアミノ酸配列:
Figure 2024502630000044
(配列番号140)又は配列番号140に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
BE_R1_12の切断カルボキシル(COOH)断片
一部の形態では、デアミナーゼタンパク質の切断形態は、Gly31、又はGly40、又はGly85、Gly110、又はGly140のいずれかを含む位置での切断から生じるカルボキシル(COOH)末端のアミノ酸残基を含む、切断BE_R1_12デアミナーゼタンパク質断片である。
一部の形態では、デアミナーゼタンパク質の切断形態は、アミノ酸Gly31(BE_R1_12_C_G31)で切断されたBE_R1_12デアミナーゼタンパク質の切断形態であり、これは、以下のアミノ酸配列:
Figure 2024502630000045
(配列番号141)又は配列番号141に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
一部の形態では、デアミナーゼタンパク質の切断形態は、アミノ酸Gly40(BE_R1_12_C_G40)で切断されたBE_R1_12デアミナーゼタンパク質の切断形態であり、これは、以下のアミノ酸配列:
RRIFGVNTSLIKNSKYAPRDMDLRRRWLREVNWVPPKKNKPNHLGHAQSLSHAESHALIRAYERMERLGGQLPKKLTMVVDRPTCNICRGEMPALLKRLGIEELTIYSGGRDAIIIKAIK(配列番号142)又は配列番号142に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
一部の形態では、デアミナーゼタンパク質の切断形態は、アミノ酸Gly 85(BE_R1_12_C_G85)で切断されたBE_R1_12デアミナーゼタンパク質の切断形態であり、これは、以下のアミノ酸配列:
HAQSLSHAESHALIRAYERMERLGGQLPKKLTMVVDRPTCNICRGEMPALLKRLGIEELTIYSGGRDAIIIKAIK(配列番号143)又は配列番号143に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
一部の形態では、デアミナーゼタンパク質の切断形態は、アミノ酸Gly110(BE_R1_12_C_G110)で切断されたBE_R1_12デアミナーゼタンパク質の切断形態であり、これは、以下のアミノ酸配列:
QLPKKLTMVVDRPTCNICRGEMPALLKRLGIEELTIYSGGRDAIIIKAIK(配列番号144)又は配列番号144に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
一部の形態では、デアミナーゼタンパク質の切断形態は、アミノ酸Gly140(BE_R1_12_C_G140)で切断されたBE_R1_12デアミナーゼタンパク質の切断形態であり、これは、以下のアミノ酸配列:
IEELTIYSGGRDAIIIKAIK(配列番号145)又は配列番号145に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
BE_R1_12の短縮断片
一部の形態では、デアミナーゼタンパク質の短縮又は切断形態は、アミノ(NH)末端から数えて特定の数の連続したアミノ酸残基が欠如した(例えば、インタクトなカルボキシル(COOH)末端を得るために)短縮又は切断BE_R1_28デアミナーゼタンパク質である。例えば、一部の形態では、デアミナーゼタンパク質の短縮又は切断形態は、アミノ(NH)末端から数えて5個の連続したアミノ酸残基又は10、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95若しくは100個の連続したアミノ酸残基が欠如した(Δ)短縮又は切断BE_R1_28デアミナーゼタンパク質である。
一部の形態では、デアミナーゼタンパク質の短縮形態は、アミノ(NH)末端から20個の連続したアミノ酸残基が欠如した(Δ)短縮BE_R1_12デアミナーゼタンパク質(BE_R1_12_C_Δ20)であり、これは、以下のアミノ酸配列:
Figure 2024502630000046
(配列番号156)又は配列番号156に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
一部の形態では、デアミナーゼタンパク質の短縮形態は、アミノ(NH)末端から25個の連続したアミノ酸残基が欠如した(Δ)短縮BE_R1_12デアミナーゼタンパク質(BE_R1_12_C_Δ25)であり、これは、以下のアミノ酸配列:
Figure 2024502630000047
(配列番号157)又は配列番号157に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
一部の形態では、デアミナーゼタンパク質の短縮形態は、カルボキシル(COOH)末端から30個の連続したアミノ酸残基が欠如した(Δ)短縮BE_R1_12デアミナーゼタンパク質(BE_R1_12_C_Δ30)であり、これは、以下のアミノ酸配列:
Figure 2024502630000048
(配列番号158)又は配列番号158に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
一部の形態では、デアミナーゼタンパク質の短縮形態は、アミノ(NH)末端から35個の連続したアミノ酸残基が欠如した(Δ)短縮BE_R1_12デアミナーゼタンパク質(BE_R1_12_C_Δ35)であり、これは、以下のアミノ酸配列:
Figure 2024502630000049
(配列番号159)又は配列番号159に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
一部の形態では、デアミナーゼタンパク質の短縮形態は、アミノ(NH)末端から40個の連続したアミノ酸残基が欠如した(Δ)短縮BE_R1_12デアミナーゼタンパク質(BE_R1_12_C_Δ40)であり、これは、以下のアミノ酸配列:
RRIFGVNTSLIKNSKYAPRDMDLRRRWLREVNWVPPKKNKPNHLGHAQSLSHAESHALIRAYERMERLGGQLPKKLTMVVDRPTCNICRGEMPALLKRLGIEELTIYSGGRDAIIIKAIK(配列番号160)又は配列番号160に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
一部の形態では、デアミナーゼタンパク質の短縮形態は、アミノ(NH)末端から45個の連続したアミノ酸残基が欠如した(Δ)短縮BE_R1_12デアミナーゼタンパク質(BE_R1_12_C_Δ45)であり、これは、以下のアミノ酸配列:
VNTSLIKNSKYAPRDMDLRRRWLREVNWVPPKKNKPNHLGHAQSLSHAESHALIRAYERMERLGGQLPKKLTMVVDRPTCNICRGEMPALLKRLGIEELTIYSGGRDAIIIKAIK(配列番号161)又は配列番号161に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
一部の形態では、デアミナーゼタンパク質の短縮形態は、アミノ(NH)末端から50個の連続したアミノ酸残基が欠如した(Δ)短縮BE_R1_12デアミナーゼタンパク質(BE_R1_12_C_Δ50)であり、これは、以下のアミノ酸配列:
IKNSKYAPRDMDLRRRWLREVNWVPPKKNKPNHLGHAQSLSHAESHALIRAYERMERLGGQLPKKLTMVVDRPTCNICRGEMPALLKRLGIEELTIYSGGRDAIIIKAIK(配列番号162)又は配列番号162に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
一部の形態では、デアミナーゼタンパク質の短縮形態は、アミノ(NH)末端から55個の連続したアミノ酸残基が欠如した(Δ)短縮BE_R1_12デアミナーゼタンパク質(BE_R1_12_C_Δ55)であり、これは、以下のアミノ酸配列:
YAPRDMDLRRRWLREVNWVPPKKNKPNHLGHAQSLSHAESHALIRAYERMERLGGQLPKKLTMVVDRPTCNICRGEMPALLKRLGIEELTIYSGGRDAIIIKAIK(配列番号163)又は配列番号163に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
一部の形態では、デアミナーゼタンパク質の短縮形態は、アミノ(NH)末端から60個の連続したアミノ酸残基が欠如した(Δ)短縮BE_R1_12デアミナーゼタンパク質(BE_R1_12_C_Δ60)であり、これは、以下のアミノ酸配列:
MDLRRRWLREVNWVPPKKNKPNHLGHAQSLSHAESHALIRAYERMERLGGQLPKKLTMVVDRPTCNICRGEMPALLKRLGIEELTIYSGGRDAIIIKAIK(配列番号164)又は配列番号164に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
一部の形態では、デアミナーゼタンパク質の短縮形態は、アミノ(NH)末端から70個の連続したアミノ酸残基が欠如した(Δ)短縮BE_R1_12デアミナーゼタンパク質(BE_R1_12_C_Δ70)であり、これは、以下のアミノ酸配列:
VNWVPPKKNKPNHLGHAQSLSHAESHALIRAYERMERLGGQLPKKLTMVVDRPTCNICRGEMPALLKRLGIEELTIYSGGRDAIIIKAIK(配列番号165)又は配列番号165に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
一部の形態では、デアミナーゼタンパク質の短縮形態は、アミノ(NH)末端から75個の連続したアミノ酸残基が欠如した(Δ)短縮BE_R1_12デアミナーゼタンパク質(BE_R1_12_C_Δ75)であり、これは、以下のアミノ酸配列:
PKKNKPNHLGHAQSLSHAESHALIRAYERMERLGGQLPKKLTMVVDRPTCNICRGEMPALLKRLGIEELTIYSGGRDAIIIKAIK(配列番号166)又は配列番号166に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
一部の形態では、デアミナーゼタンパク質の短縮形態は、アミノ(NH)末端から100個の連続したアミノ酸残基が欠如した(Δ)短縮BE_R1_12デアミナーゼタンパク質(BE_R1_12_C_Δ100)であり、これは、以下のアミノ酸配列:
HALIRAYERMERLGGQLPKKLTMVVDRPTCNICRGEMPALLKRLGIEELTIYSGGRDAIIIKAIK(配列番号167)又は配列番号167に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
スプリットBE_R1_12デアミナーゼタンパク質の結合
一部の形態では、トBE_R1_12デアミナーゼタンパク質の短縮又は切断形態は、デアミナーゼ機能のみが欠如している。一部の形態では、BE_R1_12デアミナーゼタンパク質の短縮又は切断形態の2つ以上の結合により、デアミナーゼ機能が再形成される。例えば、一部の形態では、アミノ(NH)末端から1つ以上のアミノ酸残基が欠如したBE_R1_12デアミナーゼタンパク質の1つの短縮又は切断形態又は完全BE_R1_12デアミナーゼドメインのカルボキシル(COOH)末端からの断片を組み合わせると、カルボキシル(COOH)末端から1つ以上のアミノ酸残基が欠如したBE_R1_12デアミナーゼタンパク質の1つ以上の短縮若しくは切断形態又は完全BE_R1_12デアミナーゼドメインのアミノ(NH)末端からの断片との結合又は共局在化時に機能性になる。例えば、一部の形態では、塩基エディターは、配列番号141~145のいずれか1つのアミノ酸配列を有するスプリットBE_R1_12デアミナーゼドメインを含み、この場合、塩基エディターは、配列番号136~140のアミノ酸配列のいずれか1つのアミノ酸配列を有する別のスプリットBE_R1_12デアミナーゼドメインとの共局在化又は結合時或いは配列番号124のアミノ酸配列又は配列番号124に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸を有するBE_R1_12デアミナーゼドメインの「不活性型」形態と一緒に、再形成されたデアミナーゼ活性を有する。
一部の形態では、塩基エディターは、配列番号146~167のいずれか1つのアミノ酸配列を有するスプリットBE_R1_12デアミナーゼドメインを含み、この場合、塩基エディターは、配列番号136~140のいずれかのアミノ酸配列を有する別のスプリットBE_R1_12デアミナーゼドメインとの共局在化又は結合時或いは配列番号124のアミノ酸配列又は配列番号124に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸を有するBE_R1_12デアミナーゼドメインの「不活性型」形態と一緒に、再形成されたデアミナーゼ活性を有する。
(3)スプリットBE_R1_28デアミナーゼタンパク質
一部の形態では、デアミナーゼタンパク質の短縮又は切断形態は、BE_R1_28デアミナーゼタンパク質の短縮又は切断形態である。
BE_R1_28の切断アミノ(NH)断片
一部の形態では、デアミナーゼタンパク質の短縮又は切断形態は、Gly33、又はGly51、又はLys71、Gly101、又はGly126のいずれかを含む位置での切断から生じる(NH)末端のアミノ酸残基を含む、短縮又は切断BE_R1_28デアミナーゼタンパク質断片である。
一部の形態では、デアミナーゼタンパク質の切断形態は、アミノ酸Gly33で切断されたBE_R1_12デアミナーゼタンパク質の切断形態(BE_R1_28_N_G33)であり、これは、以下のアミノ酸配列:
GVGGAITATVGSTAGAAGRAAARAPSLPAYAGG(配列番号146)又は配列番号146に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
一部の形態では、デアミナーゼタンパク質の切断形態は、アミノ酸Gly51で切断されたBE_R1_28デアミナーゼタンパク質の切断形態(BE_R1_28_N_G51)であり、これは、以下のアミノ酸配列:
GVGGAITATVGSTAGAAGRAAARAPSLPAYAGGKTSGVLRTTAGDTALLSG(配列番号147)又は配列番号147に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
一部の形態では、デアミナーゼタンパク質の切断形態は、アミノ酸Lys71で切断されたBE_R1_28デアミナーゼタンパク質の切断形態(BE_R1_28_N_K71)であり、これは、以下のアミノ酸配列:
GVGGAITATVGSTAGAAGRAAARAPSLPAYAGGKTSGVLRTTAGDTALLSGYKGPSASMPRGTPGMNGRIK(配列番号148)又は配列番号148に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
一部の形態では、デアミナーゼタンパク質の切断形態は、アミノ酸Gly101で切断されたBE_R1_28デアミナーゼタンパク質の切断形態(BE_R1_28_N_G101)であり、これは、以下のアミノ酸配列:
GVGGAITATVGSTAGAAGRAAARAPSLPAYAGGKTSGVLRTTAGDTALLSGYKGPSASMPRGTPGMNGRIKSHVEAHAAAVMREQGMKEGTLYINRVPCSG(配列番号149)又は配列番号149に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
BE_R1_28の切断カルボキシル(COOH)断片
一部の形態では、デアミナーゼタンパク質の短縮又は切断形態は、Gly33、又はGly51、又はLys71、Gly101、又はGly126のいずれかを含む位置での切断から生じるカルボキシル(COOH)末端のアミノ酸残基を含む、短縮又は切断BE_R1_28デアミナーゼタンパク質断片である。
一部の形態では、デアミナーゼタンパク質の切断形態は、アミノ酸Gly33末端で切断されたBE_R1_28デアミナーゼタンパク質の切断形態(BE_R1_28_C_G33)であり、これは、以下のアミノ酸配列:
KTSGVLRTTAGDTALLSGYKGPSASMPRGTPGMNGRIKSHVEAHAAAVMREQGMKEGTLYINRVPCSGATGCDAMLPRMLPPDAHLRVVGPNGYDQVFVGL(配列番号151)又は配列番号151に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
一部の形態では、デアミナーゼタンパク質の切断形態は、アミノ酸Gly51で切断されたBE_R1_28デアミナーゼタンパク質の切断形態(BE_R1_28_C_G51)であり、これは、以下のアミノ酸配列:YKGPSASMPRGTPGMNGRIKSHVEAHAAAVMREQGMKEGTLYINRVPCSGATGCDAMLPRMLPPDAHLRVVGPNGYDQVFVGL(配列番号152)又は配列番号152に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
一部の形態では、デアミナーゼタンパク質の切断形態は、アミノ酸Lys71で切断されたBE_R1_28デアミナーゼタンパク質の切断形態(BE_R1_28_C_K71)であり、これは、以下のアミノ酸配列:
SHVEAHAAAVMREQGMKEGTLYINRVPCSGATGCDAMLPRMLPPDAHLRVVGPNGYDQVFVGL(配列番号153)又は配列番号153に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
一部の形態では、デアミナーゼタンパク質の切断形態は、アミノ酸Gly101で切断されたBE_R1_28デアミナーゼタンパク質の切断形態(BE_R1_28_C_G101)であり、これは、以下のアミノ酸配列:
ATGCDAMLPRMLPPDAHLRVVGPNGYDQVFVGL(配列番号154)又は配列番号154に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
一部の形態では、デアミナーゼタンパク質の切断形態は、アミノ酸Gly126で切断されたBE_R1_28デアミナーゼタンパク質の切断形態(BE_R1_28_C_G126)であり、これは、以下のアミノ酸配列:
YDQVFVGL(配列番号155)又は配列番号155に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
スプリットBE_R1_28デアミナーゼタンパク質の結合
一部の形態では、BE_R1_28デアミナーゼタンパク質の短縮又は切断形態は、デアミナーゼ機能のみが欠如している。一部の形態では、BE_R1_28デアミナーゼタンパク質の短縮又は切断形態の2つ以上の結合により、デアミナーゼ機能が再形成される。例えば、一部の形態では、アミノ(NH)末端から1つ以上のアミノ酸残基が欠如したBE_R1_28デアミナーゼタンパク質の1つの短縮又は切断形態又は完全BE_R1_28デアミナーゼドメインのカルボキシル(COOH)末端からの断片を組み合わせると、カルボキシル(COOH)末端から1つ以上のアミノ酸残基が欠如したBE_R1_28デアミナーゼタンパク質の1つ以上の短縮若しくは切断形態又は完全BE_R1_28デアミナーゼドメインのアミノ(NH)末端からの断片との結合又は共局在化時に機能性になる。例えば、一部の形態では、塩基エディターは、配列番号151~155のいずれか1つのアミノ酸配列を有するスプリットBE_R1_28デアミナーゼドメインを含み、この場合、塩基エディターは、配列番号146~149のいずれか1つのアミノ酸配列を有する別のスプリットBE_R1_28デアミナーゼドメインとの共局在化又は結合時或いは配列番号123のアミノ酸配列又は配列番号123に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸を有するBE_R1_12デアミナーゼドメインの「不活性型」形態と一緒に、再形成されたデアミナーゼ活性を有する。
(4)スプリットBE_R1_41デアミナーゼタンパク質
一部の形態では、デアミナーゼタンパク質の短縮又は切断形態は、BE_R1_41デアミナーゼタンパク質の短縮又は切断形態である。
BE_R1_41の切断アミノ(NH)断片
一部の形態では、デアミナーゼタンパク質の短縮又は切断形態は、Gly33、又はGly43、又はGly69、又はGly108のいずれかを含む位置での切断から生じるアミノ(NH)末端のアミノ酸残基を含む、切断されたBE_R1_41デアミナーゼタンパク質断片である。
一部の形態では、デアミナーゼタンパク質の切断形態は、アミノ酸Gly33で切断されたBE_R1_41デアミナーゼタンパク質の切断形態(BE_R1_41_N_G33)であり、これは、以下のアミノ酸配列:
GSYTLGSYQISAPQLPAYNGQTVGTFYYVNGAG(配列番号168)又は配列番号168に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
一部の形態では、デアミナーゼタンパク質の短縮又は切断形態は、アミノ酸Gly43で切断されたBE_R1_41デアミナーゼタンパク質の短縮又は切断形態(BE_R1_41_N_G43)であり、これは、以下のアミノ酸配列:
GSYTLGSYQISAPQLPAYNGQTVGTFYYVNGAGGLESRTFSSG(配列番号169)又は配列番号169に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
一部の形態では、デアミナーゼタンパク質の切断形態は、アミノ酸Gly69で切断されたBE_R1_41デアミナーゼタンパク質の切断形態(BE_R1_41_N_G69)であり、これは、以下のアミノ酸配列:
GSYTLGSYQISAPQLPAYNGQTVGTFYYVNGAGGLESRTFSSGGPTPYPNYANAGHVEGQSALFMRDNG(配列番号170)又は配列番号170に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
一部の形態では、デアミナーゼタンパク質の切断形態は、アミノ酸Gly108で切断されたBE_R1_41デアミナーゼタンパク質の切断形態(BE_R1_41_N_G108)であり、これは、以下のアミノ酸配列:
GSYTLGSYQISAPQLPAYNGQTVGTFYYVNGAGGLESRTFSSGGPTPYPNYANAGHVEGQSALFMRDNGISDGLVFHNNPEGTCGFCVNMTETLLPENSKLTVVPPEG(配列番号171)又は配列番号171に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
BE_R1_41の切断カルボキシル(COOH)断片
一部の形態では、デアミナーゼタンパク質の短縮又は切断形態は、Gly33、又はGly43、又はGly69、又はGly108のいずれかを含む位置での切断から生じるアミノ(COOH)末端のアミノ酸残基を含む、切断されたBE_R1_41デアミナーゼタンパク質断片である。
一部の形態では、デアミナーゼタンパク質の切断形態は、アミノ酸Gly33末端で切断されたBE_R1_41デアミナーゼタンパク質の切断形態(BE_R1_41_C_G33)であり、これは、以下のアミノ酸配列:
GLESRTFSSGGPTPYPNYANAGHVEGQSALFMRDNGISDGLVFHNNPEGTCGFCVNMTETLLPENSKLTVVPPEGAIPVKRGATGETRTFTGNSKSPKSPVKGEC(配列番号172)又は配列番号172に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
一部の形態では、デアミナーゼタンパク質の切断形態は、アミノ酸Gly43で切断されたBE_R1_41デアミナーゼタンパク質の切断形態(BE_R1_41_C_G43)であり、これは、以下のアミノ酸配列:
GPTPYPNYANAGHVEGQSALFMRDNGISDGLVFHNNPEGTCGFCVNMTETLLPENSKLTVVPPEGAIPVKRGATGETRTFTGNSKSPKSPVKGEC(配列番号173)又は配列番号173に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
一部の形態では、デアミナーゼタンパク質の切断形態は、アミノ酸Lys71で切断されたBE_R1_41デアミナーゼタンパク質の切断形態(BE_R1_41_C_G69)であり、これは、以下のアミノ酸配列:
DNGISDGLVFHNNPEGTCGFCVNMTETLLPENSKLTVVPPEGAIPVKRGATGETRTFTGNSKSPKSPVKGEC(配列番号174)又は配列番号174に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
一部の形態では、デアミナーゼタンパク質の切断形態は、アミノ酸Gly108で切断されたBE_R1_41デアミナーゼタンパク質の切断形態(BE_R1_28_C_G108)であり、これは、以下のアミノ酸配列:
AIPVKRGATGETRTFTGNSKSPKSPVKGEC(配列番号175)又は配列番号175に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
スプリットBE_R1_41デアミナーゼタンパク質の結合
一部の形態では、BE_R1_41デアミナーゼタンパク質の短縮又は切断形態は、デアミナーゼ機能のみが欠如している。一部の形態では、BE_R1_41デアミナーゼタンパク質の短縮又は切断形態の2つ以上の結合により、デアミナーゼ機能が再形成される。例えば、一部の形態では、アミノ(NH)末端から1つ以上のアミノ酸残基が欠如したBE_R1_41デアミナーゼタンパク質の1つの短縮若しくは切断形態又は完全BE_R1_41デアミナーゼドメインのカルボキシル(COOH)末端からの断片を組み合わせると、カルボキシル(COOH)末端から1つ以上のアミノ酸残基が欠如したBE_R1_41デアミナーゼタンパク質の1つ以上の短縮若しくは切断形態又は完全BE_R1_41デアミナーゼドメインのアミノ(NH)末端からの断片との結合又は共局在化時に機能性になる。例えば、一部の形態では、塩基エディターは、配列番号168~172のいずれか1つのアミノ酸配列を有するスプリットBE_R1_41デアミナーゼドメインを含み、この場合、塩基エディターは、配列番号173~175のアミノ酸配列を有する別のスプリットBE_R1_41デアミナーゼドメインとの共局在化又は結合時或いは配列番号123のアミノ酸配列又は配列番号123に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸を有するBE_R1_12デアミナーゼドメインの「不活性型」形態と一緒に、再形成されたデアミナーゼ活性を有する。
(5)スプリットBE_R4_21デアミナーゼタンパク質
一部の形態では、デアミナーゼタンパク質の短縮又は切断形態は、BE_R4_21デアミナーゼタンパク質の短縮又は切断形態である。
BE_R4_21の切断アミノ(NH)断片
一部の形態では、デアミナーゼタンパク質の短縮又は切断形態は、Ser62又はGly127のいずれかを含む位置での切断から生じるアミノ(NH)末端のアミノ酸残基を含む、切断されたBE_R4_21デアミナーゼタンパク質断片である。
一部の形態では、デアミナーゼタンパク質の切断形態は、アミノ酸Ser62で切断されたBE_R4_21デアミナーゼタンパク質の切断形態(BE_R4_21_N_S62)であり、これは、以下のアミノ酸配列:
GGSAVVGAGVVATGAKAVTTGKSLSESQATLSVAQRLLATIGEEGKTAGVLELDGELIPLVS(配列番号176)又は配列番号176に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
一部の形態では、デアミナーゼタンパク質の短縮又は切断形態は、アミノ酸Gly127で切断されたBE_R4_21デアミナーゼタンパク質の短縮又は切断形態(BE_R4_21_N_G127)であり、これは、以下のアミノ酸配列:
Figure 2024502630000050
(配列番号177)又は配列番号177に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
BE_R4_21の切断カルボキシル(COOH)断片
一部の形態では、デアミナーゼタンパク質の短縮又は切断形態は、Ser62又はGly127のいずれかを含む位置での切断から生じる(COOH)末端のアミノ酸残基を含む、短縮又は切断されたBE_R4_21デアミナーゼタンパク質断片である。
一部の形態では、デアミナーゼタンパク質の切断形態は、アミノ酸Ser62で切断されたBE_R4_21デアミナーゼタンパク質の切断形態(BE_R4_21_C_S62)であり、これは、以下のアミノ酸配列:
GKSSLPNYAASGHVEGQAALIMRDRGATSGRLLIDNPSGICGYCKSQVATLLPENATLQVGTPLGTVTPSSRWSASRTFTGNDRDPKPWPR(配列番号178)又は配列番号178に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
一部の形態では、デアミナーゼタンパク質の切断形態は、アミノ酸Gly127で切断されたBE_R4_21デアミナーゼタンパク質の切断形態(BE_R4_21_C_G127)であり、これは、以下のアミノ酸配列:
TVTPSSRWSASRTFTGNDRDPKPWPR(配列番号179)又は配列番号179に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
スプリットBE_R4_21デアミナーゼタンパク質の結合
一部の形態では、BE_R4_21デアミナーゼタンパク質の短縮又は切断形態は、デアミナーゼ機能のみが欠如している。一部の形態では、BE_R4_21デアミナーゼタンパク質の短縮又は切断形態の2つ以上の結合により、デアミナーゼ機能が再形成される。例えば、一部の形態では、アミノ(NH)末端から1つ以上のアミノ酸残基が欠如したBE_R4_21デアミナーゼタンパク質の1つの短縮若しくは切断形態又は完全BE_R4_21デアミナーゼドメインのカルボキシル(COOH)末端からの断片を組み合わせると、カルボキシル(COOH)末端から1つ以上のアミノ酸残基が欠如したBE_R4_21デアミナーゼタンパク質の1つ以上の短縮若しくは切断形態又は完全BE_R4_21デアミナーゼドメインのアミノ(NH)末端からの断片との結合又は共局在化時に機能性になる。例えば、一部の形態では、塩基エディターは、配列番号176~177のいずれか1つのアミノ酸配列を有するスプリットBE_R4_21デアミナーゼドメインを含み、この場合、塩基エディターは、配列番号178~179のいずれか1つのアミノ酸配列を有する別のスプリットBE_R4_21デアミナーゼドメインとの共局在化又は結合時或いは配列番号125のアミノ酸配列又は配列番号125に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸を有するBE_R4_21デアミナーゼドメインの「不活性型」形態と一緒に、再形成されたデアミナーゼ活性を有する。
(6)スプリットBE_R2_11デアミナーゼタンパク質
一部の形態では、デアミナーゼタンパク質の短縮又は切断形態は、BE_R2_11デアミナーゼタンパク質の短縮又は切断形態である。
BE_R2_11の短縮断片
一部の形態では、デアミナーゼタンパク質の短縮又は切断形態は、アミノ(NH)末端からの54又は39個の連続したアミノ酸残基の切断から生じるアミノ酸残基を含む、BE_R2_11デアミナーゼタンパク質の断片である。
一部の形態では、デアミナーゼタンパク質の切断形態は、アミノ(NH)末端からの54残基の除去から生じるBE_R2_11デアミナーゼタンパク質の短縮形態(BE_R2_11_N_Δ54)であり、これは、以下のアミノ酸配列:
HYDKVRKELGTSAEVPGHAEGVAFNKAYQVRKNTGTKGGNAVLYVDKIPCVMCKPGIATLMRSAKVDHLDLHYLQDGKMHHVQYVRNPDTDAVYNPFSGKWTKPSKKK(配列番号180)又は配列番号180に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
一部の形態では、デアミナーゼタンパク質の切断形態は、アミノ(NH)末端からの39残基の除去から生じるBE_R2_11デアミナーゼタンパク質の短縮形態(BE_R2_11_N_Δ39)であり、これは、以下のアミノ酸配列:
Figure 2024502630000051
(配列番号181)又は配列番号181に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
スプリットBE_R2_11デアミナーゼタンパク質の結合
一部の形態では、BE_R2_11デアミナーゼタンパク質の短縮又は切断形態は、デアミナーゼ機能のみが欠如している。一部の形態では、BE_R2_11デアミナーゼタンパク質の短縮又は切断形態の2つ以上の結合により、デアミナーゼ機能が再形成される。例えば、一部の形態では、アミノ(NH)末端から1つ以上のアミノ酸残基が欠如したBE_R2_11デアミナーゼタンパク質の1つの短縮若しくは切断形態又は完全BE_R2_11デアミナーゼドメインのカルボキシル(COOH)末端からの断片を組み合わせると、カルボキシル(COOH)末端から1つ以上のアミノ酸残基が欠如したBE_R2_11デアミナーゼタンパク質の1つ以上の短縮若しくは切断形態又は完全BE_R2_11デアミナーゼドメインのアミノ(NH)末端からの断片との結合又は共局在化時に機能性になる。例えば、一部の形態では、塩基エディターは、配列番号180又は181のアミノ酸配列を有するスプリットBE_R2_11デアミナーゼドメインを含み、この場合、塩基エディターは、配列番号180~181のアミノ酸配列を有する別のスプリットBE_R2_11デアミナーゼドメインとの共局在化又は結合時或いは配列番号126のアミノ酸配列又は配列番号126に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸を有するBE_R2_11デアミナーゼドメインの「不活性型」形態と一緒に、再形成されたデアミナーゼ活性を有する。
2.機能性ドメイン
典型的に、塩基エディターは1つ以上の機能性ドメインを含む。機能性ドメインは、プログラマブルDNA結合ドメイン/ターゲティングドメイン、ヌクレアーゼ及び他のドメインを含む。一部の形態では、機能性ドメインは、ターゲティングドメインである。一部の形態では、ターゲティングドメインは、核酸中の特定の標的配列(例えば、DNA又はRNA配列)を認識し、且つ/又はそれに結合することができる。従って、一部の形態では、ターゲティングドメインは、TALE、CRISPR-Cas9、Cfp1又はジンクフィンガーなどのDNA及び/又はRNA結合タンパク質又はドメインである。従って、一部の形態では、塩基エディターは、デアミナーゼドメインと、1つ以上のターゲティングドメイン(例えば、DNA結合タンパク質又はドメイン)を含む標的化塩基エディターであり、各ターゲティングドメインは、標的配列に特異的に結合する。
塩基エディターは、所望の活性(例えば、デアミナーゼ活性)を保持する限り、任意の数の機能性ドメインを含むことができる。例えば、塩基エディターは、1~5つの範囲の機能性ドメインを含むことができる。一部の形態では、塩基エディターは、1、2、3、4、5つ又はそれを超える機能性(例えば、ターゲティング)ドメインを含む。一部の形態では、塩基エディターは、デアミナーゼドメインと、1つの機能性ドメインを含む。一部の形態では、塩基エディターは、デアミナーゼドメインと、2つの機能性ドメインを含む。一部の形態では、塩基エディターは、デアミナーゼドメインと、3つの機能性ドメインを含む。一部の形態では、標的塩基エディターは、デアミナーゼドメインと、1つのターゲティングドメインを含む。一部の形態では、標的塩基エディターは、デアミナーゼドメインと、2つのターゲティングドメインを含む。一部の形態では、標的塩基エディターは、デアミナーゼドメインと、3つのターゲティングドメインを含む。
1つ以上の機能性ドメインとデアミナーゼドメインを、塩基エディター内で任意の方向に配置することができる。例えば、デアミナーゼドメインは、塩基エディターのN末端又はC末端に存在し得る。一部の形態では、塩基エディターは、以下の構成/構造:
NH[デアミナーゼドメイン]-[機能性ドメイン]COOH;又は
NH[機能性ドメイン]-[デアミナーゼドメイン]COOH
に従い、NHは、塩基エディターのN末端であり、COOHは、塩基エディターのC末端である。好ましくは、機能性ドメインはターゲティングドメインである。一部の形態では、上記の一般的なアーキテクチャで使用される「-」は、任意選択のリンカーの存在を示す。
一部の形態では、本明細書に開示される塩基エディターは、リンカーを含まない。一部の形態では、リンカーは、塩基エディター内の1つ以上のドメイン又はタンパク質間(例えば、デアミナーゼドメインと、第1の機能性(例えば、ターゲティング)ドメイン及び/又は第2の機能性ドメインとの間)に存在する。一部の形態では、デアミナーゼドメインと機能性(例えば、ターゲティング)ドメインは、当技術分野で公知の任意の適切なリンカー、例えば、「リンカー」と題されるサブセクションで以下に提供されるリンカーのいずれかを介して融合される。一部の形態では、塩基エディターを形成する様々なドメイン又は成分は、約1~200アミノ酸(両端の値を含む)を含むリンカーを介して融合される。一部の形態では、リンカーは、1~5、1~10、1~20、1~30、1~40、1~50、1~60、1~80、1~100、1~150、1~200、5~10、5~20、5~30、5~40、5~60、5~80、5~100、5~150、5~200、10~20、10~30、10~40、10~50、10~60、10~80、10~100、10~150、10~200、20~30、20~40、20~50、20~60、20~80、20~100、20~150、20~200、30~40、30~50、30~60、30~80、30~100、30~150、30~200、40~50、40~60、40~80、40~100、40~150、40~200、50~60、50~80、50~100、50~150、50~200、60~80、60~100、60~150、60~200、80~100、80~150、80~200、100~150、100~200又は150~200アミノ酸を含む。
特定の形態では、本明細書に開示されるデアミナーゼドメイン及びターゲティングドメインのいずれかを含むターゲティング塩基エディターが開示され、ターゲティングドメインは、塩基エディター標的配列に特異的に結合する。好ましくは、ターゲティングドメインは、TALE、CRISPR-Casエフェクタータンパク質(例えば、Cas9、Cfp1)又はジンクフィンガータンパク質若しくはドメインであるか又はそれを含む。例えば、ターゲティングドメインがCRISPR-Casエフェクタータンパク質(例えば、Cas9、Cfp1)であるか又はそれを含む場合、塩基エディター標的配列は、プロトスペーサー配列と同じであるか又はそれを含むことができる。
塩基エディター標的配列は、標的核酸中で、標的ヌクレオチド配列の脱アミノ化を支持するデアミナーゼドメインの標的ヌクレオチド配列の任意の距離内に存在することができる。開示される標的化塩基エディターのための好ましい設計原理は、脱アミノ化が意図される標的核酸中の標的ヌクレオチド配列の実体に近接した標的核酸にターゲティングドメインが結合するように、塩基エディター標的配列(及びターゲティングドメイン)並びにデアミナーゼドメインとターゲティングドメインの連結を選択することである。この近接性は、所与の標的塩基エディター及び標的核酸について、デアミナーゼドメインが、標的核酸中の標的ヌクレオチド配列の目的とする実体を脱アミノ化することができるようにすべきである。例えば、塩基エディター標的配列は、標的核酸中で、デアミナーゼドメインの標的ヌクレオチド配列の実体の1~100、20~80、40~60、10~50、20~40、1~10、1~20、10~20又は5~10ヌクレオチド内に存在することができる。一部の形態では、塩基エディター標的配列は、標的核酸中で、デアミナーゼドメインの標的ヌクレオチド配列の実体の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30~35、35~40、40~45、45~50、50~60、60~70、70~80、80~90又は90~100ヌクレオチド内に存在する。好ましい形態では、塩基エディター標的配列は、標的核酸中で、デアミナーゼドメインの標的ヌクレオチド配列の実体の20ヌクレオチド以内に存在するように選択される。好ましくは、標的ヌクレオチド配列の実体は、標的塩基エディターによって塩基編集されるように選択される。
一部の形態では、標的ヌクレオチド配列の実体は、標的核酸における標的ヌクレオチド配列の唯一の実体である。場合によっては、標的ヌクレオチド配列の複数(例えば、2つ、3つ、4つ、5つ又はそれを超える)の実体が標的核酸中に存在する。従って、一部の形態では、標的化塩基エディターによって塩基編集されるように選択される標的ヌクレオチドの複数の実体の特定の実体は、標的化塩基エディター標的配列からの距離に基づいて記述又は指定することができる(例えば、標的塩基エディター標的配列から指定された距離内にある唯一の実体として)。
例えば、一部の形態では、塩基編集されるように選択される(標的核酸中の)標的ヌクレオチド配列の実体は、塩基エディター標的配列の1~100、20~80、40~60、10~50、20~40、1~10、1~20、10~20又は5~10ヌクレオチド内のデアミナーゼドメインの標的ヌクレオチド配列の唯一の実体である。一部の形態では、塩基編集されるように選択される(標的核酸中の)標的ヌクレオチド配列の実体は、塩基エディター標的配列の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30~35、35~40、40~45、45~50、50~60、60~70、70~80、80~90又は90~100ヌクレオチド内のデアミナーゼドメインの標的ヌクレオチド配列の唯一の実体である。一部の形態では、塩基編集されるように選択される(標的核酸中の)標的ヌクレオチド配列の実体は、塩基エディター標的配列の20ヌクレオチド以内のデアミナーゼドメインの標的ヌクレオチド配列の唯一の実体である。
しかし、この「唯一の実体」の距離とは独立して、塩基編集されるように選択される(標的核酸中の)標的ヌクレオチド配列の実体は、選択される塩基エディター標的配列から任意の距離であり得る(それが、指定された「唯一の実体」の距離以下である限り)。例えば、塩基編集されるように選択される(標的核酸中の)標的ヌクレオチド配列の実体は、塩基エディター標的配列の20ヌクレオチド以内にあるデアミナーゼドメインの標的ヌクレオチド配列の唯一の実体であり得るが、塩基編集されるように選択される標的ヌクレオチド配列のこの実体は、それ自体が、塩基エディター標的配列の20ヌクレオチド以内である。より一般的には、一部の形態では、塩基編集されるように選択される(標的核酸中の)標的ヌクレオチド配列の実体は、塩基エディター標的配列の1~100、20~80、40~60、10~50、20~40、1~10、1~20、10~20又は5~10ヌクレオチド以内にあるデアミナーゼドメインの標的ヌクレオチド配列の唯一の実体であり得るが、塩基編集されるように選択される標的ヌクレオチド配列のこの実体は、それ自体が、塩基エディター標的配列の1~100、20~80、40~60、10~50、20~40、1~10、1~20、10~20又は5~10ヌクレオチド以内にある。従って、一部の形態では、塩基編集されるように選択される(標的核酸中の)標的ヌクレオチド配列の実体は、塩基エディター標的配列の20ヌクレオチド以内にあるデアミナーゼドメインの標的ヌクレオチド配列の唯一の実体であり得るが、塩基編集されるように選択される標的ヌクレオチド配列のこの実体は、それ自体が、塩基エディター標的配列の20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2又は1ヌクレオチド以内にある。
一部の形態では、塩基エディター標的配列の複数(例えば、2つ、3つ、4つ、5つ又はそれを超える)の実体が標的核酸中に存在する。従って、一部の形態では、選択される塩基エディター標的配列は、標的化塩基エディターによって塩基編集されるように選択される標的ヌクレオチド配列の実体からの距離に基づいて、記述又は指定することができる(例えば、塩基編集されるように選択される標的ヌクレオチド配列の実体から指定距離内にある標的核酸中の唯一の塩基エディター標的配列として)。例えば、一部の形態では、(標的核酸中)塩基編集されるように選択される標的ヌクレオチド配列の1~100、20~80、40~60、10~50、20~40、1~10、1~20、10~20又は5~10ヌクレオチド内にある塩基エディター標的配列は、塩基編集されるように選択される標的ヌクレオチド配列の1~100、20~80、40~60、10~50、20~40、1~10、1~20、10~20又は5~10ヌクレオチド以内にある標的核酸の唯一の塩基エディター標的配列である。一部の形態では、(標的核酸中)塩基編集されるように選択される標的ヌクレオチド配列の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30~35、35~40、40~45、45~50、50~60、60~70、70~80、80~90又は90~100ヌクレオチド以内にある塩基エディター標的配列は、標的核酸において、塩基編集されるように選択される標的ヌクレオチド配列の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30~35、35~40、40~45、45~50、50~60、60~70、70~80、80~90又は90~100ヌクレオチド以内にある唯一の塩基エディター標的配列である。一部の形態では、塩基編集されるように選択される(標的核酸中)標的ヌクレオチド配列の20ヌクレオチド以内の塩基エディター標的配列は、標的核酸中で、塩基編集されるように選択される標的ヌクレオチド配列の20ヌクレオチド以内にある唯一の塩基エディター標的配列である。
一部の形態では、(標的核酸中)塩基編集されるように選択される標的ヌクレオチド配列の1~100、20~80、40~60、10~50、20~40、1~10、1~20、10~20又は5~10ヌクレオチド以内にある塩基エディター標的配列は、標的核酸中において、標的ヌクレオチド配列の任意の実体の1~100、20~80、40~60、10~50、20~40、1~10、1~20、10~20又は5~10ヌクレオチド以内にある唯一の塩基エディター標的配列である。一部の形態では、(標的核酸中)塩基編集されるように選択される標的ヌクレオチド配列の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30~35、35~40、40~45、45~50、50~60、60~70、70~80、80~90又は90~100ヌクレオチド以内にある塩基エディター標的配列は、標的核酸中で、標的ヌクレオチド配列の任意の実体の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30~35、35~40、40~45、45~50、50~60、60~70、70~80、80~90又は90~100ヌクレオチド以内にある唯一の塩基エディター標的配列である。一部の形態では、(標的核酸中)塩基編集されるように選択される標的ヌクレオチド配列の20ヌクレオチド以内にある塩基エディター標的配列は、標的核酸中で、標的ヌクレオチド配列の任意の実体の20ヌクレオチド以内にある唯一の塩基エディター標的配列である。
一部の形態では、標的核酸中で(例えば、標的化塩基エディターによって塩基編集されるように選択される)標的ヌクレオチド配列の実体は、標的核酸中で、標的ヌクレオチド配列の実体の20ヌクレオチド以内の塩基エディターの20ヌクレオチド以内にあるデアミナーゼドメインの標的ヌクレオチド配列の唯一の実体である。一部の形態では、標的核酸中で(例えば、標的塩基エディターにより塩基編集されるように選択される)標的ヌクレオチド配列の実体は、標的核酸中で、標的ヌクレオチド配列の実体の1~100、20~80、40~60、10~50、20~40、1~10、1~20、10~20又は5~10ヌクレオチド以内の塩基エディター標的配列の1~100、20~80、40~60、10~50、20~40、1~10、1~20、10~20又は5~10ヌクレオチド以内にあるデアミナーゼドメインの標的ヌクレオチド配列の唯一の実体である。一部の形態では、標的核酸中で(例えば、標的塩基エディターによって塩基編集されるように選択される)標的ヌクレオチド配列の実体は、標的核酸中で、標的ヌクレオチド配列の実体の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30~35、35~40、40~45、45~50、50~60、60~70、70~80、80~90又は90~100ヌクレオチド以内の塩基エディター標的配列の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30~35、35~40、40~45、45~50、50~60、60~70、70~80、80~90又は90~100ヌクレオチド以内にあるデアミナーゼドメインの標的ヌクレオチド配列の唯一の実体である。
以上のいずれでも、塩基エディター標的配列は、核DNA又はミトコンドリアDNAであり得る。いくつかの好ましい形態では、塩基エディター標的配列は、ミトコンドリアDNA中に存在する。
i.プログラマブルDNA結合タンパク質
一部の形態では、塩基エディターは、少なくとも1つのプログラマブルDNA結合タンパク質を含む。一部の形態では、塩基エディターは、単一のプログラマブルDNA結合タンパク質を含む。例えば、一部の形態では、塩基エディターは、第1及び第2のプログラマブルDNA結合タンパク質を含む。一部の形態では、第1及び/又は第2のプログラマブルDNA結合タンパク質は、同じである。他の形態では、第1及び/又は第2のプログラマブルDNA結合タンパク質は、異なる。例示的な第1及び/又は第2のプログラマブルDNA結合タンパク質は、Casドメイン(例えば、Cas9)、ニッカーゼ、ジンクフィンガータンパク質及びTALEタンパク質を含む。従って、一部の形態では、塩基エディターは、第1及び第2のモノマーを有するヘテロ二量体を含み、第1のモノマーは、Casドメイン、ニッカーゼ、ジンクフィンガータンパク質又はTALEタンパク質;及び切断された二本鎖DNAデアミナーゼのN末端若しくはC末端断片を含み、及び第2のモノマーは、Casドメイン、ニッカーゼ、ジンクフィンガータンパク質又はTALEタンパク質;並びに切断された二本鎖DNAデアミナーゼの第2のプログラマブルDNA結合タンパク質及びN末端若しくはC末端断片を含み、それにより第1及び第2のモノマーの二量体化が二本鎖DNAデアミナーゼ活性を再形成する。例示的なCasドメインは、Cas9、Casl2e、Casl2d、Casl2a、Casl2bl、Cas13a、Casl2c及びアルゴノートを含む。
ii.例示的な機能性ドメイン
一部の形態では、塩基エディターは、プログラマブルDNA結合タンパク質などのプログラマブルDNA結合因子である1つ以上の機能性ドメインを含む。「プログラマブルDNA結合タンパク質」、「pDNA結合タンパク質」、「pDNA結合タンパク質ドメイン」又は「pDNAbp」という用語は、特定の標的DNAヌクレオチド配列(例えば、ゲノムの遺伝子座)に局在し、それと結合する任意のタンパク質を指す。この用語は、RNAプログラム可能なタンパク質を包含し、これは、そのタンパク質に関連する1つ以上の核酸分子(又はその一部若しくは領域)に相補的な特定の標的ヌクレオチド配列(例えば、DNA配列)に局在するようにタンパク質を指令するか、又はそうでなければプログラムする1つ以上の核酸分子(即ち例えばCasシステムの場合にはガイドRNAを含む)と会合する(例えば、複合体を形成する)。この用語は、アミノ酸プログラム可能な方法でヌクレオチド配列に直接結合するタンパク質、例えばジンクフィンガータンパク質及びTALEタンパク質も包含する。例示的なRNAプログラマブルタンパク質は、天然に存在するか非天然である(例えば、操作又は改変された)かにかかわらず、CRISPR-Cas9タンパク質並びにCas9均等物、ホモログ、オルソログ又はパラログであり、CRISPRシステム(II、V、VI型)のいずれかのタイプからのCas9均等物を含み得、そうしたものとして、Cpfl(V型CRISPR-Casシステム)、C2cl(V型CRISPR-Casシステム)、C2c2(VI型CRISPR-Casシステム)、C2c3(V型CRISPR-Casシステム)、dCas9、GeoCas9、CjCas9、Cas12a、Casl2b、Cas12c、Casl2d、Cas12g、Cas12h、Cas12i、Cas13d、Cas14、アルゴノート及びnCas9が挙げられる。さらに別のCas均等物は、Makarova et al.,“C2c2 is a single-component programmable RNAguided RNA-targeting CRISPR effector,”Science 2016;353(6299)に記載されており、その内容は、参照により本明細書に組み込まれる。
a.ジンクフィンガー
一部の形態では、標的塩基エディターは、1つ以上のターゲティングドメインとして、1つ以上のジンクフィンガータンパク質又はジンクフィンガーDNA結合ドメインを含む。デアミナーゼドメインとジンクフィンガードメインを組み合わせたカスタム設計の塩基エディターは、標的化(部位特異的)塩基編集をゲノムに導入するための一般的且つ効率的な方法を提供する。
ジンクフィンガーは、DNAに結合することができるタンパク質ドメインの大きいスーパーファミリーの一部である。ジンクフィンガーは、真核生物に存在する最も一般的なDNA結合モチーフの1つである。酵母ゲノムによってコードされる500のジンクフィンガータンパク質があること並びに恐らく全哺乳類遺伝子の1%がジンクフィンガー含有タンパク質をコードすることが推定される。ジンクフィンガーは、2本の逆平行β鎖とαらせんからなる。亜鉛イオンは、このドメインタイプの安定性にとって非常に重要である-金属イオンの非存在下では、ドメインは、疎水性コアを有するには小さすぎるため、アンフォールドする。個別のフィンガーの構造は、それぞれ高度に保存され、約30アミノ酸残基からなり、これらは、ββαフォールドとして構築され、亜鉛イオンによって互いに保持される。αらせんは、フィンガーのC末端部分で発生し、βシートは、N末端部分で発生する。
ジンクフィンガータンパク質は、亜鉛配位に利用可能なシステイン残基及びヒスチジン残基の数及び位置に従って分類される。アフリカツメガエル(Xenopus)転写因子IIIAに代表されるCCHHクラスが最大である。これらのタンパク質は、タンデムリピートに2本以上のフィンガーを含む。対照的に、ステロイド受容体は、4つ(C4)及び5つ(C5)のシステインを有する2種類の亜鉛配位構造を形成するシステイン残基のみを含む。ジンクフィンガーの別のクラスは、CCHCフィンガーを含む。ショウジョウバエ属(Drosophila)並びに哺乳類及びレトロウイルスタンパク質に見出だされるCCHCフィンガーは、コンセンサス配列C-N-C-N-H-N-C(配列番号28)を示す。C-N-C-N12-H-N-C(配列番号29)型のCCHCフィンガーの立体配置は、神経ジンクフィンガー因子/ミエリン転写因子ファミリーに認められる。最後に、GAL4及びCHA4などのいくつかの酵母転写因子は、2つの亜鉛イオンを配位する非定型C6ジンクフィンガー構造を含む。ジンクフィンガーは、通常、1タンパク質当たり複数のコピー(最大37)で存在する。これらのコピーは、タンデムアレイで編成して、単一のクラスター若しくは複数のクラスターを形成することもできるか、又はタンパク質全体に分散させることができる。
各ジンクフィンガーモチーフは、典型的には、3塩基対配列を認識して結合すると考えられ、そのため、より多くのジンクフィンガーを含むタンパク質はより長い配列をターゲティングし、従って標的部位に対するより大きい特異性及び親和性を有する。一部の形態では、個々のジンクフィンガードメインは、3bpサブサイトに結合し、フィンガーのアレイは、伸長された9又は12bp配列標的に結合することができる。
原則として、目的の任意のゲノム位置をターゲティングするように設計することができるジンクフィンガーDNA結合ドメインは、Cys2His2ジンクフィンガーのタンデムアレイであり得るが、その各々は、一般に、標的DNA配列中の3~4個のヌクレオチドを認識する。Cys2His2ドメインは、以下の一般的な構造を有する:Phe(時としてTyr)-Cys-(2~4アミノ酸)-Cys-(3アミノ酸)-Phe(時としてTyr)-(5アミノ酸)-Leu-(2アミノ酸)-His-(3アミノ酸)-His。複数の(数は変動する:発表された研究では1モノマー当たり3~6本のフィンガーが使用される)フィンガーを互いに連結することにより、ZFNペアは、18~36ヌクレオチド長のゲノム配列に結合するように設計することができる。ジンクフィンガータンパク質は、亜鉛に結合して、DNA二重らせんの主溝に結合する構造ドメインを形成する。各DNA結合フィンガーの重要なアミノ酸の変化は、結合親和性及び特異性に寄与する。
公開された文献は、多くの異なる一般的に入手可能なジンクフィンガー操作方法について記載しており、これらは、大きく2つの概括的カテゴリに分類することができる:(1)特定のDNA配列に結合するタンパク質を設計するために、事前に特性決定された特異性を備える個別のフィンガーを互いに連結するモジュラーアセンブリ方法、又は(2)複数の大きいランダム化ライブラリーを必要とする選択に基づく方法(例えば、ファージディスプレイを用いたランダム化ジンクフィンガーのライブラリーからの望ましい変異体の選択により、DNA特異的結合ドメインを生成することができる)。
操作方法は、合理的設計及び様々なタイプの経験的選択方法を含むが、これらに限定されない。合理的設計は、例えば、トリプレット(又はクワドラプレット)ヌクレオチド配列及び個別のジンクフィンガーアミノ酸配列を含むデータベースの使用を含み、この場合、各トリプレット又はクワドラプレットヌクレオチド配列は、特定のトリプレット又はクワドラプレット配列に結合するジンクフィンガーの1つ以上のアミノ酸配列と関連する。例えば、米国特許第6,140,081号明細書;同第6,453,242号明細書;同第6,534,261号明細書;同第6,610,512号明細書;同第6,746,838号明細書;同第6,866,997号明細書;同第7,067,617号明細書;米国特許出願公開第2002/0165356号明細書;同第2004/0197892号明細書;同第2007/0154989号明細書;同第2007/0213269号明細書;並びに国際公開第98/53059号パンフレット及び同第2003/016496号パンフレットを参照されたい。
多くの研究により、高品質のマルチフィンガードメインを構築するための重要な要件は、より長いアレイ内の個別のフィンガードメインのコンテキスト依存性活性を考慮することであることが明らかにされている。マルチフィンガードメインを構築するためのOligomerized Pool ENgineering(OPEN)法は、個々のジンクフィンガーのコンテキスト依存性活性に取り組むが、頑健でもあり、且つ前述の方法より実施が比較的容易である。その全体が参照により本明細書に援用される国際公開第2009/146179号パンフレットを参照されたい。OPENはスケーラブルであり、これを使用して、同時に極めて多数の異なる標的部位に対して高品質のマルチフィンガードメインを生成することができる。OPENは、様々なDNA配列を結合するように設計されたジンクフィンガープールの大規模なアーカイブの構築により可能になる。現在まで、OPENは、細菌細胞ベースのアッセイで良好に機能する500を超える異なる標的部位のマルチフィンガードメインを生成するために使用されている。
典型的に、切断ドメインに連結したジンクフィンガータンパク質由来のDNA結合ドメインを含むジンクフィンガーヌクレアーゼ(ZFN)(IIS型酵素Foklなど)は、非相同末端結合(NHEJ)により修復される二本鎖DNA切断を介して標的化(部位特異的)DNA変異(例えば欠失)を誘導するために使用される。本明細書に開示される標的化塩基エディターは、切断ドメインの代わりにデアミナーゼドメインが使用され、DNA切断と比較してDNAの標的化塩基編集を達成することを除いて、類似の様式で使用することができる。従って、1つ以上のジンクフィンガータンパク質又はDNA結合ドメインを含む塩基エディターを操作するための方法は明らかであり、ZFNを製造するための当技術分野に公知のものから改変することができる。
ZFNは、二量体として機能し、非特異的切断ドメインを含む各モノマーは、目的の標的DNA配列に結合するように操作された人工ジンクフィンガーのアレイに融合される。従って、一部の形態では、開示される標的化塩基エディターは、デアミナーゼドメインの標的ヌクレオチド配列と(例えば、上流及び下流で)フランキングする塩基エディター標的配列に結合する二量体としても機能し得る。これは、(塩基エディターの)デアミナーゼドメインが2つの異なる部分に分割される場合に特に有用である。従って、一部の形態では、デアミナーゼドメインのN末端部分は、第1のジンクフィンガードメインに連結されるのに対して、デアミナーゼドメインのC末端部分は、第2のジンクフィンガードメインに連結される。2つのジンクフィンガードメイン及び/又はジンクフィンガードメインによって結合された塩基エディター標的配列は、同じであり得るが、同じである必要はない。ジンクフィンガードメインは、2つのジンクフィンガーデアミナーゼドメイン分子が標的核酸上で最適な間隔をあけて二量体化されるように設計及び選択される。一部の形態では、このようなスプリット標的化塩基エディターは、小成分が結合され(例えば、共発現又は共導入され)、二量体化されるときに限り、標的ヌクレオチド配列を脱アミノ化することができる。
ジンクフィンガーは、構造的に多様であり、DNA又はRNA結合からタンパク質間相互作用及び膜結合まで、非常に多様な機能を示す。UniProtKBには40種以上のジンクフィンガーがアノテーションされている。最も頻繁に使用されるのは、C2H2タイプ、CCHCタイプ、PHDタイプ及びRingタイプである。例としては、UniProtKBアクセッション番号Q7Z142、P55197、Q9P2R3、Q9P2G1、Q9P2S6、Q8IUH5、P19811、Q92793、P36406、095081及びQ9ULV3が挙げられる。
一部の形態では、ジンクフィンガータンパク質は、アミノ酸配列:
Figure 2024502630000052
(配列番号72)又は配列番号72に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する(Q7Z142-1)である。
ミトコンドリアhND DNA領域を認識するジンクフィンガー
一部の形態では、ジンクフィンガータンパク質は、左側(L)ジンクフィンガー(ZF)タンパク質である。一部の形態では、左側ジンクフィンガータンパク質は、hND1 DNA配列を認識するZFである。一部の形態では、hND1 DNA配列を認識する左側ジンクフィンガータンパク質は、アミノ酸配列:
MEPGEKPYKCPECGKSFSTSGSLVRHQRTHTGEKPYKCPECGKSFSDCRDLARHQRTHTGEKPYKCPECGKSFSQNSTLTEHQRTHTGEKPYKCPECGKSFSERSHLREHQRTHTGKKTS(配列番号74)又は配列番号74に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する(ZF_hND-L1)である。
一部の形態では、hND1 DNA配列を認識する左側ジンクフィンガータンパク質は、アミノ酸配列:
Figure 2024502630000053
(配列番号75)又は配列番号75に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する(ZF_hND-L2)である。
一部の形態では、hND1 DNA配列を認識する左側ジンクフィンガータンパク質は、アミノ酸配列:
MEPGEKPYKCPECGKSFSDPGHLVRHQRTHTGEKPYKCPECGKSFSQNSTLTEHQRTHTGEKPYKCPECGKSFSRSDKLTEHQRTHTGEKPYKCPECGKSFSQRANLRAHQRTHTGKKTS(配列番号76)又は配列番号76に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する(ZF_hND-L3)である。
一部の形態では、hND1 DNA配列を認識する左側ジンクフィンガータンパク質は、アミノ酸配列:
Figure 2024502630000054
(配列番号77)又は配列番号77に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する(ZF_hND-L4)である。
一部の形態では、ジンクフィンガータンパク質は、右側(R)ジンクフィンガー(ZF)タンパク質である。一部の形態では、右側ジンクフィンガータンパク質は、hND1 DNA配列を認識するZFである。一部の形態では、hND1 DNA配列を認識する右側ジンクフィンガータンパク質は、
MEPGEKPYKCPECGKSFSTKNSLTEHQRTHTGEKPYKCPECGKSFSSKKALTEHQRTHTGEKPYKCPECGKSFSTSGELVRHQRTHTGEKPYKCPECGKSFSTSGNLVRHQRTHTGKKTS(配列番号78)又は配列番号78に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片である。
一部の形態では、hND1 DNA配列を認識する右側ジンクフィンガータンパク質は、アミノ酸配列:
Figure 2024502630000055
(配列番号79)又は配列番号79に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する(ZF_hND-R2)である。
一部の形態では、hND1 DNA配列を認識する右側ジンクフィンガータンパク質は、アミノ酸配列:
MEPGEKPYKCPECGKSFSTSGNLTEHQRTHTGEKPYKCPECGKSFSRSDNLVRHQRTHTGEKPYKCPECGKSFSTSGHLVRHQRTHTGEKPYKCPECGKSFSRADNLTEHQRTHTGKKTS(配列番号80)又は配列番号80に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する(ZF_hND-R3)である。
一部の形態では、hND1 DNA配列を認識する右側ジンクフィンガータンパク質は、アミノ酸配列:
Figure 2024502630000056
(配列番号81)又は配列番号81に対して少なくとも70%、75%、80%、85%、90%、95%又は99%の配列同一性を有するアミノ酸或いはその断片を有する(ZF_hND-R4)である。
ミトコンドリアmCOX1 DNA領域を認識するジンクフィンガー
一部の形態では、左側ジンクフィンガータンパク質は、mCOX DNA配列を認識するZFである。一部の形態では、mCOX DNA配列を認識する左側ジンクフィンガータンパク質は、アミノ酸配列:
Figure 2024502630000057
(配列番号82)又は配列番号82に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する(ZF_mCOX1-L1)である。
一部の形態では、左側ジンクフィンガータンパク質は、mCOX1 DNA配列を認識するZFである。一部の形態では、mCOX1 DNA配列を認識する左側ジンクフィンガータンパク質は、アミノ酸配列:
Figure 2024502630000058
(配列番号83)又は配列番号83に対して少なくとも70%、75%、80%、85%、90%、95%又は99%の配列同一性を有するアミノ酸或いはその断片を有する(ZF_mCOX1-L2)である。
一部の形態では、mCOX1 DNA配列を認識する左側ジンクフィンガータンパク質は、アミノ酸配列:
Figure 2024502630000059
(配列番号84)又は配列番号84に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する(ZF_mCOX1-L3)である。
一部の形態では、mCOX1 DNA配列を認識する左側ジンクフィンガータンパク質は、アミノ酸配列:
Figure 2024502630000060
(配列番号85)又は配列番号85に対して少なくとも70%、75%、80%、85%、90%、95%又は99%の配列同一性を有するアミノ酸或いはその断片を有する(ZF_mCOX1-L4)である。
一部の形態では、mCOX1 DNA配列を認識する左側ジンクフィンガータンパク質は、アミノ酸配列:
Figure 2024502630000061
(配列番号86)又は配列番号86に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する(ZF_mCOX1-L5)である。
一部の形態では、mCOX1 DNA配列を認識する右側ジンクフィンガータンパク質は、アミノ酸配列:
Figure 2024502630000062
(配列番号87)又は配列番号87に対して少なくとも70%、75%、80%、85%、90%、95%又は99%の配列同一性を有するアミノ酸或いはその断片を有する(ZF_mCOX1-R1)である。
一部の形態では、mCOX1 DNA配列を認識する右側ジンクフィンガータンパク質は、アミノ酸配列:
Figure 2024502630000063
(配列番号88)又は配列番号88に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する(ZF_mCOX1-R2)である。
一部の形態では、mCOX1 DNA配列を認識する右側ジンクフィンガータンパク質は、アミノ酸配列:
Figure 2024502630000064
(配列番号89)又は配列番号89に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する(ZF_mCOX1-R3)である。
b.転写活性化因子様(TAL)エフェクター
一部の形態では、標的塩基エディターは、1つ以上のターゲティングドメインとして1つ以上の転写活性化因子様(TAL)エフェクターを含む。デアミナーゼドメインとTALエフェクターを組み合わせたカスタム設計の塩基エディターは、標的化(部位特異的)塩基編集をゲノムに導入するための一般的且つ効率的な方法を提供する。
TALエフェクターは、病原体によって植物細胞に注入される植物病原菌のタンパク質であり、そこで、それらのタンパク質は、核に移動し、特定の植物遺伝子をオンにする転写因子として機能する。転写活性化因子様エフェクター(TALE)のモジュラーDNA認識ドメインは、キサントモナス属(Xanthomonas)の病原性細菌によってコードされる天然の転写因子に初めて発見され、近年ではラルストニア・ソラナケアルム(Ralstonia solanacearum)で見い出された。キサントモナス属(Xanthomonas)TALEは、ゲノム工学分野で最も広く使用されている。TALエフェクターの一次アミノ酸配列は、それが結合するヌクレオチド配列を指令する。このように、標的部位は、TALエフェクターについて予測することができ、TALエフェクターは、本明細書に記載されるような塩基エディター標的配列などの特定のヌクレオチド配列に結合させる目的で操作及び作製することもできる。
TALエフェクターDNA結合ドメイン内の各モジュールには、「リピート可変二残基」(RVD)と呼ばれる、位置12及び13の二残基を介して単一ヌクレオチドとの相互作用を媒介する、典型的には34残基の保存区間を含む。異なる特異性を持つモジュールは、ジンクフィンガーアレイの生成に対して主な制限を呈示するコンテキスト依存性の課題を発生することなく、適合したアレイに融合することができる。従って、この単純な「1つのモジュールから1ヌクレオチド」サイファー(Cypher)は、新規の特異性を備えるTALEの作製を迅速且つ安価にする。
TALエフェクターDNA結合ドメインは、各々約34残基長のアミノ酸リピートのタンデム配列である。これらのリピートは、互いに非常に類似しており;典型的には、それらは、主に2つの位置(アミノ酸12及び13、リピート可変残基又はRVDと呼ばれる)で異なる。各RVDは、4つの可能なヌクレオチドの1つに対する優先的な結合を指定し、各TALEリピートが単一の塩基対に結合することを意味するが、NN RVDは、グアニン以外に、アデニンに結合することがわかっている。RVD及びそれらの対応する標的ヌクレオチドの非限定的な例を以下の表1に示す。国際公開第2010/079430号パンフレット(その全体が参照により本明細書に援用される)も参照されたい。
Figure 2024502630000065
天然のTALEには、それらの標的部位の先頭にTが存在するという厳密な要件(T0ルール)、即ちTALE N末端ドメインによって指令される特異性がある。この特異性を緩くする操作TALE N末端ドメインが記載されており、これは、他のヌクレオチドで開始するターゲティング配列を可能にする(Lamb,B.M.,Mercer,A.C.,&Barbas III,C.F.(2013).Directed evolution of the TALE N-terminal domain for recognition of all 5’bases.Nucleic acids research,41(21),9779-9785)。
TALエフェクターDNA結合は、ジンクフィンガータンパク質のものよりも機構的によく理解されていないが、それらの一見単純なコードは、プログラム可能な部位特異的DNA結合に有益である。TALEは、比較的長い標的配列(これまでに報告された最短のものは、1モノマー当たり13ヌクレオチドに結合する)を有するため、結合部位間のスペーサーの長さに関してZFNほど厳密ではない要件も有すると思われる。単量体及び二量体TALENは、10超、14超、20超又は24超のリピートを含み得る。
特定の核酸に結合するようにTALを操作する方法は、Cermak,et al,Nucl.Acids Res.1-11(2011)に記載されている。米国特許出願公開第2011/0145940号明細書は、TALエフェクター及びそれらを使用してDNAを修飾する方法を開示している。Miller et al.Nature Biotechnol 29:143(2011)は、TAL切断変異体をFoklヌクレアーゼの触媒ドメインに連結することにより、部位特異的ヌクレアーゼ構造のための転写活性化因子様エフェクターヌクレアーゼ(TALEN)を作製したことを報告している。得られたTALENは、不死化ヒト細胞で遺伝子改変を誘導することが明らかにされた。TALE結合ドメインに関する一般的な設計原理は、例えば、国際公開第2011/072246号パンフレットに見出すことができ、これらは、その全体が参照により本明細書に組み込まれる。
配列特異的TALEは、予め選択された標的核酸(例えば、染色体又はミトコンドリアDNA上に存在する)内の特定の配列を認識することができる。従って、一部の形態では、標的ヌクレオチド配列をTALE認識部位について調べることができ、特定のTALEを標的配列に基づいて選択することができる。他の形態では、TALEは、特定の配列をターゲティングするように操作することができる。組み合わせて、塩基エディター標的配列に結合する複数のDNA結合リピートを含む配列特異的TALエフェクターを設計することができる。本明細書に記載されるように、TALエフェクターは、それらがDNAと相互作用する特異性を決定する多数の不完全なリピートを含む。各リピートは、リピートの残基12及び13における特定のジアミノ酸配列に応じて、単一の塩基に結合する。従って、(例えば、当技術分野で公知の標準的な技術を使用して)TALエフェクター内のリピートを操作することにより、特定のDNA部位をターゲティングすることができる。
ZFNと同様に、一部のTALENは、二量体としてのみ機能するエンドヌクレアーゼ(例えば、Fokl)を含み、これを十分に利用して、TALエフェクターの標的特異性を高めることができる。例えば、場合によっては、各Fokleモノマーを異なるDNA標的配列を認識するTALエフェクター配列に融合することができ、2つの認識部位が近接している場合にのみ、不活性モノマーが一緒になって機能性TALENを生成することができる。本明細書に開示される標的塩基エディターは、エンドヌクレアーゼ(例えば、Fokl)の代わりにデアミナーゼドメインが使用され、DNA切断と比較してDNAの標的塩基編集をもたらすことを除けば、類似の方法で使用することができる。このように、1つ以上のTALエフェクターを含む塩基エディターを操作するための方法は明らかであり、TALENを製造するための当技術分野で公知のものから改変することができる。
前述のように、ジンクフィンガーが、塩基エディターのターゲティングドメインとして使用される場合、ターゲティングドメインとしてTALエフェクターを含む、開示される標的化塩基エディターも、一部の形態では、二量体として機能することができる。このように、一部の形態では、開示される標的塩基エディターは、デアミナーゼドメインの標的ヌクレオチド配列と(例えば、上流及び下流で)フランキングする塩基エディター標的配列に結合する二量体として機能することができる。これは、(塩基エディターの)デアミナーゼドメインが2つの個別の部分に分割される場合に特に有用である。従って、一部の形態では、デアミナーゼドメインのN末端部分は、第1のTALエフェクターに連結されるのに対して、デアミナーゼドメインのC末端部分は、第2のTALエフェクターに連結される。2つのTALエフェクター及び/又はTALエフェクターによって結合された塩基エディター標的配列は、同じであり得るが、同じである必要はない。TALエフェクターは、2つのTALE-デアミナーゼドメイン分子が標的核酸上で最適に配置されて二量体化するように設計及び選択することができる。一部の形態では、そのようなスプリット標的塩基エディターは、小成分が結合して(例えば、共発現又は共導入されて)及び二量体化するときに限り、標的ヌクレオチド配列を脱アミノ化することができる。
一部の形態では、TALEタンパク質は、左側(L)TALEタンパク質又は右側(R)TALEタンパク質である。一部の形態では、TALEタンパク質は、hND1 DNA配列を認識するTALEである。
hND DNA領域を認識するTALE
一部の形態では、hND1 DNA配列を認識する左側TALEタンパク質は、アミノ酸配列:
Figure 2024502630000066
(配列番号90)又は配列番号90に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する(TALE_hND-L1)である。
一部の形態では、hND1 DNA配列を認識する右側TALEタンパク質は、アミノ酸配列:
Figure 2024502630000067
(配列番号91)又は配列番号91に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する(TALE_hND-R1)である。
一部の形態では、TALEタンパク質は、mND6 DNA配列を認識するTALEである。一部の形態では、mND6 DNA配列を認識する左側TALEタンパク質は、アミノ酸配列:
Figure 2024502630000068
(配列番号92)又は配列番号92に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する(TALE_mND6-L1)である。
一部の形態では、mND6 DNA配列を認識する右側TALEタンパク質は、アミノ酸配列:
Figure 2024502630000069
(配列番号93)又は配列番号93に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する(TALE_mND6-R1)である。
一部の形態では、mND6 DNA配列を認識する右側TALEタンパク質は、アミノ酸配列:
Figure 2024502630000070
(配列番号94)又は配列番号94に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する(TALE_mND-R2)である。
一部の形態では、TALEタンパク質は、mND1 DNA配列を認識するTALEである。一部の形態では、mND1 DNA配列を認識する左側TALEタンパク質は、アミノ酸配列:
Figure 2024502630000071
(配列番号95)又は配列番号95に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する(TALE_mND1-L1)である。
一部の形態では、mND1 DNA配列を認識する左側TALEタンパク質は、アミノ酸配列:
Figure 2024502630000072
(配列番号96)又は配列番号96に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する(TALE_mND1-L2)である。
一部の形態では、TALEタンパク質は、h11 DNA配列を認識するTALEである。一部の形態では、h11 DNA配列を認識するTALEタンパク質は、アミノ酸配列:
Figure 2024502630000073
(配列番号97)又は配列番号97に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する(TALE_h11)である。
一部の形態では、TALEタンパク質は、h12 DNA配列を認識するTALEである。一部の形態では、h12 DNA配列を認識するTALEタンパク質は、アミノ酸配列:
Figure 2024502630000074
(配列番号98)又は配列番号98に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する(TALE_h12)である。
一部の形態では、TALEタンパク質は、mCOX1 DNA配列を認識するTALEである。一部の形態では、mCOX1 DNA配列を認識する左側TALEタンパク質は、アミノ酸配列:
Figure 2024502630000075
(配列番号99)又は配列番号99に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する(TALE_mCOX1-L1)である。
一部の形態では、mCOX1 DNA配列を認識する左側TALEタンパク質は、アミノ酸配列:
Figure 2024502630000076
(配列番号100)又は配列番号100に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する(TALE_mCOX1-L2)である。
一部の形態では、mCOX1 DNA配列を認識する左側TALEタンパク質は、アミノ酸配列:
Figure 2024502630000077
(配列番号101)又は配列番号101に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する(TALE_mCOX1-L3)である。
一部の形態では、mCOX1 DNA配列を認識する左側TALEタンパク質は、アミノ酸配列:
Figure 2024502630000078
(配列番号102)又は配列番号102に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する(TALE_mCOX1-L4)である。
一部の形態では、mCOX1 DNA配列を認識する左側TALEタンパク質は、アミノ酸配列:
Figure 2024502630000079
(配列番号103)又は配列番号103に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する(TALE_mCOX1-L5)である。
一部の形態では、mCOX1 DNA配列を認識する左側TALEタンパク質は、アミノ酸配列:
Figure 2024502630000080
(配列番号104)又は配列番号104に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する(TALE_mCOX1-L6)である。
一部の形態では、mCOX1 DNA配列を認識する左側TALEタンパク質は、アミノ酸配列:
Figure 2024502630000081
(配列番号105)又は配列番号105に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する(TALE_mCOX1-L7)である。
一部の形態では、mCOX1 DNA配列を認識する左側TALEタンパク質は、アミノ酸配列:
Figure 2024502630000082
(配列番号106)又は配列番号106に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する(TALE_mCOX1-L7)である。
一部の形態では、mCOX1 DNA配列を認識する右側TALEタンパク質は、アミノ酸配列:
Figure 2024502630000083
(配列番号108)又は配列番号108に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する(TALE_mCOX1-R1)である。
一部の形態では、mCOX1 DNA配列を認識する右側TALEタンパク質は、アミノ酸配列:
Figure 2024502630000084
(配列番号109)又は配列番号109に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する(TALE_mCOX1-R2)である。
一部の形態では、mCOX1 DNA配列を認識する右側TALEタンパク質は、アミノ酸配列:
Figure 2024502630000085
(配列番号110)又は配列番号110に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する(TALE_mCOX1-R3)である。
一部の形態では、mCOX1 DNA配列を認識する右側TALEタンパク質は、アミノ酸配列:
Figure 2024502630000086
(配列番号111)又は配列番号111に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する(TALE_mCOX1-R4)である。
一部の形態では、mCOX1 DNA配列を認識する右側TALEタンパク質は、アミノ酸配列:
Figure 2024502630000087
(配列番号112)又は配列番号112に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する(TALE_mCOX1-R5)である。
一部の形態では、mCOX1 DNA配列を認識する右側TALEタンパク質は、アミノ酸配列:
Figure 2024502630000088
(配列番号113)又は配列番号113に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する(TALE_mCOX1-R6)である。
一部の形態では、TALEタンパク質は、NT(G)DNA配列を認識し(TALE_NT(G))、アミノ酸配列:
Figure 2024502630000089
(配列番号114)又は配列番号114に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
一部の形態では、TALEタンパク質は、NT(bN)DNA配列を認識し(TALE_NT(bN))、アミノ酸配列:
Figure 2024502630000090
(配列番号115)又は配列番号115に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
c.BATタンパク質
一部の形態では、DNA結合タンパク質は、TALE様(例えば、BAT)タンパク質である。TALEと異なり、天然のBATは、T0ルールに従わず、そのN末端ドメインで、緩い特異性を有するため、任意の出発ヌクレオチドを有する標的に結合するようにそれらを設計することができる。一部の形態では、BATタンパク質は、左側BATタンパク質又は右側BATタンパク質である。一部の形態では、BATタンパク質は、hND1 DNA配列を認識する左側BATタンパク質である。一部の形態では、hND1 DNA配列を認識する左側BATタンパク質は、アミノ酸配列:
Figure 2024502630000091
(配列番号116)又は配列番号106に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する(BAT_hND1-L)である。
一部の形態では、BATタンパク質は、hND1 DNA配列を認識する右側BATタンパク質である。一部の形態では、hND1 DNA配列を認識する右側BATタンパク質は、アミノ酸配列:
Figure 2024502630000092
(配列番号117)又は配列番号117に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する(BAT_hND1-R)である。
一部の形態では、BATタンパク質は、mCOX1 DNA配列を認識する左側BATタンパク質である。一部の形態では、mCOX1 DNA配列を認識する左側BATタンパク質は、アミノ酸配列:
Figure 2024502630000093
(配列番号118)又は配列番号118に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する(BAT_mCOX1-L)である。
一部の形態では、BATタンパク質は、mCOX1 DNA配列を認識する右側BATタンパク質である。一部の形態では、mCOX1 DNA配列を認識する右側BATタンパク質は、アミノ酸配列:
Figure 2024502630000094
(配列番号119)又は配列番号119に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する(BAT_mCOX1-R)である。
一部の形態では、BATタンパク質は、mND6 DNA配列を認識する左側BATタンパク質である。一部の形態では、mND6 DNA配列を認識する左側BATタンパク質は、アミノ酸配列:
Figure 2024502630000095
(配列番号120)又は配列番号120に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する(BAT_mND6-L)である。
一部の形態では、BATタンパク質は、mND6 DNA配列を認識する右側BATタンパク質である。一部の形態では、mND6 DNA配列を認識する右側BATタンパク質は、アミノ酸配列:
Figure 2024502630000096
(配列番号121)又は配列番号121に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する(BAT_mND6-R)である。
d.CRISPR-Casエフェクタータンパク質
一部の形態では、標的塩基エディターは、1つ以上のターゲティングドメインとして1つ以上のCrispr-Casエフェクタータンパク質を含む。CRISPR-Casシステムの利点は、特定の配列をターゲティングするために、カスタマイズされたタンパク質の生成を必要とするのではなく、ガイド分子によって単一のCasタンパク質をプログラムして、特定の核酸標的を認識することができる点である。換言すれば、Crispr-Casエフェクタータンパク質は、前記ガイド分子を用いて、目的の特定の核酸標的遺伝子座に動員することができる。
好ましくは、CRISPR-Casエフェクタータンパク質は、実質的に全てのDNA切断活性が欠如していると考えられる(例えば、変異酵素のDNA切断活性が、非変異型の酵素のDNA切断活性の約25%、10%、5%、1%、0.1%、0.01%以下である場合)。一例は、変異型のDNA切断活性が、非変異型と比較してゼロ又は無視できる場合であり得る。このような形態では、CRISPR-Casタンパク質は、一般的なDNA結合タンパク質として使用される。
CRISPR(クラスター化した規則的な配置の短い回文反復)は、塩基配列の複数の短い直接的な反復を含むDNA遺伝子座の頭字語である。原核生物のCRISPR/Casシステムは、真核生物で使用される遺伝子編集(特定の遺伝子のサイレンシング、増強又は変更)としての使用のために改変される(例えば、Cong、Science,15:339(6121):819-823(2013)及びJinek,et al.,Science,337(6096):816-21(2012)を参照されたい)。CRISPR/Casシステムを用いたゲノム編集に使用される組成物を調製する方法は、国際公開第2013/176772号パンフレット及び同第2014/018423号パンフレットに詳細に記載されており、これらはその全体が参照により本明細書に具体的に組み込まれる。
本明細書で使用される場合、用語「Cas」は、一般に、CRISPR Casシステム又は複合体のエフェクタータンパク質を指す。用語「Cas」は、別段明らかでない限り、「CRISPR」タンパク質、「CRISPR-Casタンパク質」、「CRISPRエフェクター」、「CRISPR-Casエフェクター」、「CRISPR酵素」、「CRISPR-Cas酵素」などの用語と互換可能に使用され得る。一般に、「CRISPRシステム」は、CRISPR関連(「Cas」)遺伝子の発現又はその活性の指令に関与する転写物及び他の要素を集合的に指し、Cas遺伝子をコードする配列、tracr(トランス活性化CRISPR)配列(例えば、tracrRNA又は活性部分tracrRNA)、tracrメイト配列(「直列反復配列」及び内因性CRISPRシステムに関連するtracrRNAプロセス部分直列反復配列を含む)、ガイド配列(内因性CRISPRシステムに関連する「スペーサー」とも呼ばれる)又はCRISPR遺伝子座からの他の配列及び転写物を含む。ガイド配列に作動可能に連結された1つ以上のtracrメイト配列(例えば、直列反復配列-スペーサー-直列反復配列)は、ヌクレアーゼによるプロセシング前のpre-crRNA(pre-CRISPR RNA)又はヌクレアーゼによるプロセシング後のcrRNAと呼ぶこともできる。
一部の形態では、Cong,Science,15:339(6121):819-823(2013)及びJinek,et al.,Science,337(6096):816-21(2012)に記載されるように、tracrRNAとcrRNAが連結され、キメラcrRNA-tracrRNAハイブリッドを形成するが、この場合、成熟したcrRNAが合成ステムループを介して部分的なtracrRNAに融合され、天然のcrRNA:tracrRNA二重鎖を模倣する。単一の融合crRNA-tracrRNA構築物は、ガイドRNA若しくはgRNA(又はシングルガイドRNA(sgRNA))と呼ぶこともできる。sgRNA内で、crRNA部分は、「標的配列」として識別でき、tracrRNAは、「スカフォールド」と呼ばれることが多い。
CRISPR-Casエフェクタータンパク質は、II型、V型又はVI型Casエフェクタータンパク質であり得るが、限定されない。
CRISPR-Casエフェクタータンパク質の非限定的な例としては、Casl、CaslB、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(Csnl及びCsxl2としても知られる)、CaslO、Csyl、Csy2、Csy3、Csel、Cse2、Cscl、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmrl、Cmr3、Cmr4、Cmr5、Cmr6、Csbl、Csb2、Csb3、Csxl7、Csxl4、CsxlO、Csxl6、CsaX、Csx3、Csxl、Csxl5、Csfl、Csf2、Csf3、Csf4、それらのホモログ又はそれらの修飾バージョンが挙げられる。一部の形態では、修飾されないCRISPR酵素は、DNA切断活性を有する。好ましくは、Crispr-Casエフェクタータンパク質は、変異型CRISPR酵素が標的配列を含む標的ポリヌクレオチドの一方又は両方の鎖を切断する能力を欠失するように、対応する野生型酵素に対して変異される。
(1)Cas9
一部の形態では、II型CRISPR酵素は、国際公開第2014/093595号パンフレットに開示されるようなCas9酵素である。一部の形態では、Cas9酵素は、肺炎レンサ球菌(S.pneumoniae)、化膿レンサ球菌(S.pyogenes)又はS.サーモフィルス(S.thermophilus)Cas9であり、これらの生物に由来する変異Cas9を含み得る。酵素は、Cas9ホモログ又はオルソログであり得る。別のオルソログとしては、例えば、コリネバクター・ジプテリアエ(Corynebacter diptheriae)、ユーバクテリウム・ベントリオサム(Eubacterium ventriosum)、ストレプトコッカス・パストゥリアヌス(Streptococcus pasteurianus)、ラクトバチルス・ファルシミニス(Lactobacillus farciminis)、スフェロアケタ・グロバス(Sphaeroachaeta globus)、アゾスピリルム(Azospirillum)B510、グルコナセトバクター・ジアゾトロフィカス(Gluconacetobacter diazotrophicus)、ナイセリア・シネリアル(Neisseria cinereal)、ゼブリア・インテスチナリス(Roseburia intestinalis)、パルビバキュラム・ラバメンティボランス(Parvibaculum lavamentivorans)、黄色ブドウ球菌(Staphylococcus aureus)、ニトラチフラクター・サルスギニス(Nitratifractor salsuginis)DSM 16511、カンプリオバクター・ラリ(Camplyobacter lari)CF89-12及びストレプトコッカス・サーモフィルス(Streptococcus thermophilus)LMD-9由来のCas9酵素が挙げられる。
一部の形態では、Cas9エフェクタータンパク質及びそのオルソログは、機能増強のために修飾することができる。例えば、CRISPR-Cas9システムの標的特異性の向上は、複数の手法によって達成することができ、そうした手法は、限定されないが、最適活性を有するガイドRNAの設計及び調製するステップと、特定の長さのCas9酵素を選択するステップと、それをコードする核酸分子を切断して、Cas9酵素を切断し、それをコードする核酸分子を切断することにより、対応する野生型Cas9酵素よりもその長さを短くするステップと、キメラCas9酵素を生成するステップとを含み、上記のキメラCas9酵素では、適合させた特異性を有するキメラ酵素に到達するように、酵素の様々な部分が様々なオルソログ間で交換されるか又は取替えられる。
Cas9酵素は、1つ以上の変異を含み得、且つ機能性ドメインとの融合を伴って若しくは伴わずに、又は機能性ドメインに作動可能に連結されるか若しくは連結されない一般的なDNA結合タンパク質として使用され得る。変異は、人為的に導入された変異であり得、触媒ドメイン中に1つ以上の変異を含み得るが、これらに限定されない。Cas9酵素に関する触媒ドメインの例として、限定されないが、RuvC I、RuvC II、RuvC III及びHNHドメインが挙げられる。好適な変異の好ましい例は、Cas9のN末端RuvC Iドメインにおける触媒残基又は内部HNHドメインにおける触媒残基である。一部の形態では、Cas9は、化膿レンサ球菌(Streptococcus pyogenes)Cas9(SpCas9)である(又はそれに由来する)。このような形態では、好ましい変異は、SpCas9の位置10、762、840、854、863及び/又は986のいずれか若しくは全て又はSpCas9の位置番号付けに準拠して、他のCas9オルソログにおける対応する位置にある(これは、例えば、標準的な配列比較ツール、例えば、Lasergene 10スイートによるClustalW又はMegAlignによって確認され得る)。とりわけ、SpCas9における以下の変異:D10A、E762A、H840A、N854A、N863A及び/若しくはD986Aのいずれか又は全てが好ましく;さらに、置換アミノ酸のいずれかに対する保存的置換も考慮される。他のCas9オルソログにおけるSpCas9の位置番号付けに準拠して、対応する位置での同じ変異(又はこれらの変異の保存的置換)も好ましい。特に、SpCas9におけるD10及びH840が好ましい。しかし、他のCas9では、SpCas9 D10及びH840に対応する残基も好ましい。これらは、単独で変異した場合にニッカーゼ活性を付与し、両方の変異が存在する場合、Cas9は、一般的なDNA結合に有用な触媒としてヌル変異体に変換されるために有利である。
一部の形態例では、Cas9タンパク質は、誘導性二量体を含むか若しくは誘導性ヘテロ二量体を含むか、又はほぼそれからなるか若しくはそれからなる。一部の形態では、誘導性ヘテロ二量体の第1の半分又は第1の位置又は第1の断片は、FKBP又は任意選択でFKBP12であるか、又はそれを含むか、又はそれからなるか、又はほぼそれからなる。誘導性CRISPR Casシステムの一部の形態では、誘導性ヘテロ二量体の第2の半分又は第2の位置又は第2の断片は、FRBであるか、又はそれを含むか、又はそれからなるか、又はほぼそれからなる。第1のCRISPR酵素融合構築物の構成は、N’末端Cas9部分-FRB-NESを含むか、又はそれからなるか、又はほぼそれからなり得る。第1のCRISPR酵素融合構築物の構成は、NES-N’末端Cas9部分-FRB-NESを含むか、又はそれからなるか、又はほぼそれからもなり得る。第2のCRISPR酵素融合構築物の構成は、C’末端Cas9部分-FKBP-NLSを含むか、又はほぼそれからなるか、又はそれからなり得る。第2のCRISPR酵素融合構築物の構成は、NLS-C’末端Cas9部分-FKBP-NLSを含むか、又はそれからなるか、又はほぼそれからなり得る。Cas9部分を誘導性二量体の半分又は部分又は断片から隔てるリンカーが存在し得る。誘導物質エネルギー源は、ラパマイシンを含むか、又はほぼそれからなるか、又はそれからなり得る。誘導性二量体は、誘導性ホモ二量体であり得る。一部の形態では、誘導性CRISPR-Casシステムにおいて、CRISPR酵素は、Cas9、例えばSpCas9又はSaCas9である。誘導性CRISPR Casシステムの一部の形態では、Cas9は、SpCas9に従って又はSpCas9に関連して、以下の分割点のいずれか1つで2つの部分に分割される:202A/203S間の分割位置;255F/256D間の分割位置;310E/311I間の分割位置;534R/535K間の分割位置;572E/573C間の分割位置;713S/714G間の分割位置;1003L/104E間の分割位置;1054G/1055E間の分割位置;1114N/1115S間の分割位置;1152K/1153S間の分割位置;1245K/1246G間の分割位置;又は1098と1099との間の分割。
一部の形態では、キメラCas9タンパク質が使用される。キメラCas9タンパク質は、異なるCas9オルソログに由来する断片を含むタンパク質である。例えば、第1のCas9オルソログのN末端を第2のCas9オルソログのC末端と融合させて、得られるCas9キメラタンパク質を生成し得る。これらのキメラCas9タンパク質は、キメラタンパク質が生成された個々のCas9酵素のいずれかの本来の特異性又は効率よりも高い特異性若しくはより高い効率を有し得る。これらのキメラタンパク質は、1つ以上の変異も含み得るか、又は1つ以上の機能性ドメインに連結され得る。
異なるPAM特異性を有するCas9タンパク質も好適である。典型的には、化膿レンサ球菌(S.pyogenes)由来のCas9(spCas9)などのCas9タンパク質は、特定の核酸領域に結合するために標準的なNGG PAM配列を必要とする。一部の形態では、塩基エディターは、例えば、標的塩基が、PAMの約15塩基上流にある4塩基領域(例えば、「脱アミノ化ウィンドウ」)内に配置される正確な位置に配置する必要がある場合がある。その全内容が参照により本明細書に組み込まれるKomor,A.C.,et al.,Nature 533,420-424(2016)を参照されたい。従って、一部の形態では、塩基エディターは、標準的な(例えば、NGG)PAM配列を含まないヌクレオチド配列と結合することができるCas9タンパク質を含み得る。非標準的なPAM配列に結合するCas9ドメインは、当技術分野で記載されており、当業者に明らかであろう。例えば、非標準的なPAM配列に結合するCas9ドメインは、Kleinstiver,BP.,et al.,Nature 523,481-485(2015);Kleinstiver,BP.,et al.,Nature Biotechnology 33,1293-1298(2015)に記載されており;各々の全内容は、参照により本明細書に組み込まれる。
好ましい形態では、CRISPR酵素は、不活性型Cas(dCas)であり、これは、ヌクレアーゼ活性が低下したCRISPR酵素である。例えば、ヌクレアーゼ活性は、変異が一切ないCRISPR酵素と比較して、少なくとも97%又は100%(即ち3%以下及び有利には0%のヌクレアーゼ活性)減少させることができる。一部の形態では、dCasは、不活性型Cas9(dCas9)であり得る。一部の形態では、dCas9は、少なくとも1つの変異又は2つ以上の変異を含むことができる。一部の形態では、少なくとも1つの変異は、位置H840(又は任意の対応するオルソログにおける対応する位置)にあり得る。一部の形態では、2つ以上の変異は、SpCas9タンパク質による位置D10、E762、H840、N854、N863若しくはD986の2つ以上(又は任意の対応するオルソログにおける対応する位置)、SaCas9タンパク質による位置N580(又は任意の対応するオルソログにおける対応する位置)に変異を含み得る。
(2)Cas12a(Cpf1)
一部の形態では、CRISPRエフェクターは、クラス2、V型CRISPRエフェクターである。一部の形態では、CRISPRエフェクターは、クラス2、V-A型;クラス2、V-B型;クラス2、V-C型;クラス2、V-U型;;クラス2、V-U1型;クラス2、V-U2型;クラス2、V-U3型;クラス2、V-U4型;又はクラス2、V-U5型CRISPRエフェクターである。
一部の形態では、CRISPRエフェクターは、Cas12a(Cpf1)である。Cas12sエフェクタータンパク質としては、レンサ球菌属(Streptococcus)、カンピロバクター属(Campylobacter)、ニトラチフラクター属(Nitratifractor)、ブドウ球菌属(Staphylococcus)、パービバキュラム属(Parvibaculum)、ロゼブリア属(Roseburia)、ナイセリア属(Neisseria)、グルコナセトバクター属(Gluconacetobacter)、アゾスピリルム属(Azospirillum)、スフェロケタ属(Sphaerochaeta)、ラクトバシラス属(Lactobacillus)、ユーバクテリウム属(Eubacterium)、コリネバクター属(Corynebacter)、カルノバクテリウム属(Carnobacterium)、ロドバクター属(Rhodobacter)、リステリア属(Listeria)、パルディバクター属(Paludibacter)、クロストリジウム属(Clostridium)、ラクノスピラ科(Lachnospiraceae)、クロストリジアリジウム属(Clostridiaridium)、レプトトリキア属(Leptotrichia)、フランシセラ属(Francisella)、レジオネラ属(Legionella)、アリシクロバチルス属(Alicyclobacillus)、メタノメチオフィラス属(Methanomethyophilus)、ポルフィロモナス属(Porphyromonas)、プレボテラ属(Prevotella)、バクテロイデス門(Bacteroidetes)、ヘルココッカス属(Helcococcus)、レプトスピラ属(Letospira)、デスルホビブリオ属(Desulfovibrio)、デスルホナトロヌム属(Desulfonatronum)、オピツツス科(Opitutaceae)、ツベリバチルス属(Tuberibacillus)、バチルス属(Bacillus)、ブレビバチルス属(Brevibacilus)、メチロバクテリウム属(Methylobacterium)又はアシダミノコッカス属(Acidaminococcus)を含む属の生物由来のエフェクタータンパク質が挙げられる。
一部の形態では、エフェクタータンパク質(例えば、Cpf1)は、S.ミュータンス(S.mutans)、S.アガラクティエ(S.agalactiae)、S.エクイシミリス(S.equisimilis)、S.サングイニス(S.sanguinis)、肺炎レンサ球菌(S.pneumonia);C.ジェジュニ(C.jejuni)、C.コリ(C.coli);N.サルスギニス(N.salsuginis)、N.テルガルカス(N.tergarcus);S.アウリクラリス(S.auricularis)、S.カルノスス(S.carnosus);N.メニンギティディス(N.meningitides)、淋菌(N.gonorrhoeae);リステリア菌(L.monocytogenes)、L.イバノビイ(L.ivanovii);ボツリヌス菌(C.botulinum)、C.ディフィシル(C.difficile)、破傷風菌(C.tetani)、C.ソルデリイ(C.sordellii)由来の生物のエフェクタータンパク質(例えば、Cpf1)を含む。
エフェクタータンパク質は、第1エフェクタータンパク質(例えば、Cpf1)オルソログ由来の第1の断片と、第2のエフェクター(例えば、Cpf1)タンパク質オルソログ由来の第2の断片とを含むキメラエフェクタータンパク質を含み得、第1及び第2のエフェクタータンパク質オルソログは、異なる。Cpf1エフェクタータンパク質は、修飾され得、例えば操作された又は非天然のエフェクタータンパク質又はCpf1であり得る。一部の形態では、修飾は、エフェクタータンパク質の1つ以上のアミノ酸残基の突然変異を含み得る。1つ又は複数の変異は、エフェクタータンパク質の1つ以上の触媒活性ドメインにあり得る。エフェクタータンパク質は、前記1つ以上の変異のないエフェクタータンパク質と比較して、ヌクレアーゼ活性が低減しているか又は消失している可能性がある。好ましい形態では、1つ以上の変異は、2つの変異を含み得る。エフェクタータンパク質は、目的の標的遺伝子座における一方若しくは他方のDNA又はRNA鎖の切断を指令しない場合がある。好ましい形態では、Cpf1エフェクタータンパク質は、FnCpf1エフェクタータンパク質である。好ましい形態では、1つ以上の修飾又は変異アミノ酸残基は、FnCpf1エフェクタータンパク質のアミノ酸位置番号付けに準拠して、D917A、E1006A又はD1255Aである。さらに好ましい形態では、1つ以上の変異アミノ酸残基は、AsCpf1におけるアミノ酸位置を基準として、D908A、E993A及びD1263Aであるか、又はLbCpf1中のアミノ酸位置を基準として、LbD832A、E925A、D947A及びD1180Aである。
一部の形態では、2つ以上の突然変異の1つ以上の突然変異は、RuvCドメインなどのエフェクタータンパク質の触媒活性ドメインに存在することができる。一部の形態では、RuvCドメインは、RuvCI、RuvCII若しくはRuvCIIIドメイン又はRuvCII、RuvCII若しくはRuvCIIIドメインに対して相同的な触媒活性ドメインを含み得る。本明細書に開示される組成物を使用して送達することができる別のCas12a酵素は、国際公開第2016/205711号パンフレット、同第2017/106657号パンフレット及び同第2017/172682号パンフレットに論じられている。
一部の形態では、プロトスペーサー隣接モチーフ(PAM)又はPAM様モチーフは、目的の標的遺伝子座へのエフェクタータンパク質複合体の結合を指令する。一部の形態では、PAMは、5’TTNであり、Nは、A/C/G又はTであり、エフェクタータンパク質は、FnCpf1pである。一部の形態では、PAMは、5’TTTVであり、Vは、A/C又はGであり、エフェクタータンパク質は、AsCpf1、LbCpf1又はPaCpf1pである。一部の形態では、PAMは、5’TTNであり、Nは、A/C/G又はTであり、エフェクタータンパク質は、FnCpf1pであり、PAMは、プロトスペーサーの5’末端の上流に位置する。一部の形態では、PAMは、5’CTAであり、エフェクタータンパク質は、FnCpf1pであり、PAMは、プロトスペーサー又は標的遺伝子座の5’末端の上流に位置する。
e.塩基除去修復阻害剤
一部の形態では、標的化塩基エディターは、塩基除去修復(BER)阻害剤をさらに含む。塩基除去修復は、DNAらせん構造を有意に歪めない小さい塩基損傷を修正する。このような損傷は、通常、脱アミノ化、酸化又はメチル化によって起こる。BERは、核内、さらにミトコンドリア内でも起こり、主として異なるアイソフォームのタンパク質又は遺伝的に遠いタンパク質を使用する。BERは、DNAグリコシラーゼによって開始され、これは、損傷した塩基を認識して、除去するが、脱塩基部位が残り、これは、ショートパッチ修復又はロングパッチ修復によってさらにプロセシングされる。少なくとも11の異なる哺乳類DNAグリコシラーゼが知られており、各々がいくつかの関連する損傷を認識するが、これらは、多くの場合、特異性にある程度の重複を有する。
開示されるデアミナーゼ又は塩基エディターによる標的ヌクレオチドの脱アミノ化によって生じるミスマッチ(例えば、I:T;U:G)の存在に対するDNA修復(例えば、BER)応答は、細胞内で所望の塩基編集を完了する効率の低下を招き得る。従って、BERの阻害剤は、DNAを元の状態に戻し得る望ましくないBER活性を阻害又は低減することができる。
例えば、アデニンの脱アミノ化は、ヒポキサンチン(本明細書では、ヒポキサンチンから形成されるヌクレオシドであるイノシンを「I」と表す)の形成をもたらす。I:T対合の存在に対するBER応答は、細胞の塩基編集効率の低下の原因となり得る。アルキルアデニンDNAグリコシラーゼ(DNA-3-メチルアデニングリコシラーゼ、3-アルキルアデニンDNAグリコシラーゼ又はN-メチルプリンDNAグリコシラーゼとしても知られる)は、細胞内のDNAからのヒポキサンチンの除去を触媒し、それにより塩基除去修復を開始し、I:T対をA:T対に戻す可能性がある。
従って、一部の形態では、BER阻害剤は、アルキルアデニンDNAグリコシラーゼ(例えば、ヒトアルキルアデニンDNAグリコシラーゼ)の阻害剤である。一部の形態では、BER阻害剤は、ポリペプチド阻害剤である。一部の形態では、BER阻害剤は、ヒポキサンチン(例えば、DNA中)に結合するタンパク質である。一部の形態では、BER阻害剤は、触媒として不活性なアルキルアデニンDNAグリコシラーゼタンパク質又はその結合ドメインである。一部の形態では、BER阻害剤は、触媒として不活性なアルキルアデニンDNAグリコシラーゼタンパク質又はその結合ドメインであり、これは、DNAからヒポキサンチンを切除しない。アルキルアデニンDNAグリコシラーゼ塩基除去修復酵素を阻害する(例えば立体的に遮断する)ことができる他のタンパク質も好適である。さらに、塩基除去修復を阻止又は阻害する任意のタンパク質も有用である。
シトシンの脱アミノ化は、ウラシル(「U」)の形成を招く。U:G対合の存在に対するBER応答は、細胞の塩基編集効率の低下の原因となり得る。少なくとも4つの異なるヒトDNAグリコシラーゼがウラシルを除去して、塩基除去修復を開始し、U:G対をC:G対に戻す可能性がある。ウラシル-DNAグリコシラーゼ(UDG)と呼ばれるこれらの酵素は、UNG、SMUG1、TDG及びMBD4を含む。
従って、一部の形態では、BER阻害剤は、ウラシルグリコシラーゼ阻害剤(「UGI」)である。好ましくは、UGIは、上に列挙したもののようなウラシル-DNAグリコシラーゼ塩基除去修復酵素を阻害することができるペプチド又はタンパク質である。本明細書で使用される用語「ウラシルグリコシラーゼ阻害剤」又は「UGI」は、ウラシル-DNAグリコシラーゼ塩基除去修復酵素を阻害することができるタンパク質を指す。一部の形態では、UGIドメインは、野生型UGI又は配列番号21に記載されるようなUGIを含む。一部の形態では、本明細書に提供されるUGIタンパク質は、UGIの断片及びUGI又はUGI断片に相同的なタンパク質を含む。例えば、一部の形態では、UGIドメインは、配列番号21に記載されるアミノ酸配列の断片を含む。一部の形態では、UGIは、以下のアミノ酸配列又はその断片を含む:MTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKML(配列番号21)。一部の形態では、UGIは、配列番号21に記載されるアミノ酸配列と少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%又は少なくとも99.5%同一であるアミノ酸配列を含む。一部の形態では、UGIは、一本鎖DNAに結合するタンパク質(例えば、エルウィニア・タスマニエンシス(Erwinia tasmaniensis)一本鎖結合タンパク質)である。一部の形態では、UGI阻害剤は、ウラシルに結合するタンパク質である(例えば、DNA中のウラシル)。一部の形態では、ウラシルグリコシラーゼ阻害剤は、触媒として不活性なウラシルDNA-グリコシラーゼ(例えば、DNAからウラシルを切除ないUDG)である。他の好適なUGIは、当技術分野で公知であり、例えばWang et al.,J.Biol.Chem.264:1163-1171(1989);Lundquist et al.,J.Biol.Chem.272:21408-21419(1997);Ravishankar et al.,Nucleic Acids Res.26:4880-4887(1998);Putnam et al.,J.Mol.Biol.287:331-346(1999)及び米国特許出願公開第2019/0093099号明細書に記載されているものがあり、これらの文献各々の全内容は、参照により本明細書に組み込まれる。従って、一部の形態では、塩基エディターは、
TNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKML(配列番号70)
の標準的なUGIアミノ酸配列を含む。
特定の理論に縛られることは望まないが、塩基除去修復は、編集済鎖を結合し、編集済塩基をブロックし、アルキルアデニンDNAグリコシラーゼを阻害し、ウラシルDNAグリコシラーゼを阻害し、塩基除去修復を阻害し、編集済塩基を保護し、且つ/又は非編集鎖の修正を促進する分子によって阻害され得る。BER阻害剤の使用は、AからGの塩基編集又はCからTの塩基編集を実施することができるデアミナーゼ又はその塩基エディターの編集効率を高めることができると考えられる。
一部の形態では、さらにBER阻害剤を含む塩基エディターは、以下のアーキテクチャ/構造:
NH[デアミナーゼドメイン]-[機能性ドメイン]-[BER阻害剤]COOH;
NH[デアミナーゼドメイン]-[BER阻害剤]-[機能性ドメイン]COOH;
NH[BER阻害剤]-[デアミナーゼドメイン]-[機能性ドメイン]COOH;
NH[BER阻害剤]-[機能性ドメイン]-[デアミナーゼドメイン]COOH、
NH[機能性ドメイン]-[デアミナーゼドメイン]-[BER阻害剤]COOH、
NH[機能性ドメイン]-[BER阻害剤]-[デアミナーゼドメイン]COOH
に従い、NHは、塩基エディターのN末端であり、COOHは、塩基エディターのC末端であり、「-」は、任意選択のリンカーの存在を示す。好ましくは、機能性ドメインは、ターゲティングドメイン、例えばジンクフィンガー、TALエフェクター若しくはCrispr-CasエフェクターなどのDNA結合タンパク質又はドメインである。
4.リンカー
リンカーを用いて、本明細書に記載されるドメインのいずれかを融合又は結合することができる。一般に、このようなリンカーには、ドメイン間の最小距離又は他の空間的関係を連結するか、又は維持する以外の特異的生物学的活性はない。しかし、特定の形態では、リンカーは、リンカー及び/又はリンカーのフォールディング、柔軟性、正味電荷若しくは疎水性などの連結成分の何らかの特性に影響を与えるように選択され得る。特定の形態では、塩基エディターは、デアミナーゼドメイン及び機能性(例えば、ターゲティング)ドメインを、各ドメインがその必要な機能的特性を保持することを確実にするのに十分な距離だけ隔てるために1つ以上のリンカーを含む。
典型的には、リンカーは、2つの基、分子又は他の部分間に位置するか又はそれらとフランキングし、各々と共有結合を介して連結され、このようにして両方を連結する。リンカーは、共有結合と同様に単純であり得るか、又は多数の原子長さの高分子リンカーであり得る。リンカーは、アミノ酸又は複数のアミノ酸(例えば、ペプチド又はタンパク質)であり得る。好ましい形態では、リンカーは、アミノ酸を含有する。一部の形態では、リンカーは、好ましくは、ペプチドである。好ましいペプチドリンカー配列は、柔軟な伸長された立体構造を採用し、規則的な二次構造を形成する傾向を示さない。好ましくは、リンカーは、アミノ酸を含む。フレキシブルリンカーの典型的なアミノ酸としては、Gly(G)、Asn(N)及びSer(S)がある。従って、特定の形態では、リンカーは、Gly(G)、Asn(N)及びSer(S)アミノ酸の1つ以上の組合せを含む。Thr(T)及びAla(A)などの他の類似の中性アミノ酸もリンカー配列に使用され得る。
一部の形態では、リンカーは、2~200アミノ酸長、例えば、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30~35、35~40、40~45、45~50、50~60、60~70、70~80、80~90、90~100、100~150又は150~200アミノ酸長であり得る。上記のより長い又は短いリンカーも好適である。適切な長さを付与するために、GS、GGS、GGGS(配列番号23)又はGSGなどのGlySerリンカーを、3、4、5、6、7、9、12回又はそれを超えて反復して使用することができる。好適なリンカーとしては、(GGGS)n(配列番号23)、(SGGS)n(配列番号24)、(GGGGS)n(配列番号25)、(EAAAK)n(配列番号26)、(G)n、(GGS)n、SGSETPGTSESATPES(配列番号27;XTENリンカーと呼ばれる)及び(XP)n又はこれらのいずれかの組合せが挙げられ、式中、nは、独立して、1~30の整数であり、Xは、任意のアミノ酸である。一部の形態では、nは、1、2、3、4、5、6、7、8、9、10、11、12、13、14又は15である。一部の形態では、N末端及びC末端NLSは、リンカー(例えば、PKKKRKVEASSPKKRKVEAS;配列番号30)としても機能し得る。
他の形態では、リンカーはペプチド様ではない。リンカーは、有機分子、基、ポリマー又は化学的部分であり得る。特定の形態では、リンカーは、共有結合(例えば、炭素-炭素結合、ジスルフィド結合、炭素-ヘテロ原子結合など)である。一部の形態では、リンカーはアミド結合の炭素-窒素結合である。一部の形態では、リンカーは、環状又は非環状、置換若しくは非置換、分岐若しくは非分岐脂肪族又はヘテロ脂肪族リンカーである。一部の形態では、リンカーは、ポリマー(例えば、ポリエチレン、ポリエチレングリコール、ポリアミド、ポリエステルなど)である。一部の形態では、リンカーは、アミノアルカン酸のモノマー、二量体又はポリマーを含む。一部の形態では、リンカーは、アミノアルカン酸(例えば、グリシン、エタン酸、アラニン、β-アラニン、3-アミノプロパン酸、4-アミノブタン酸、5-ペンタン酸など)を含む。一部の形態では、リンカーは、アミノヘキサン酸(Ahx)のモノマー、二量体又はポリマーを含む。一部の形態では、リンカーは、炭素環部分(例えば、シクロペンタン、シクロヘキサン)、ポリエチレングリコール部分(PEG)又はアリール若しくはヘテロアリール部分に基づく。一部の形態では、リンカーは、フェニル環に基づく。リンカーは、ペプチドからリンカーへの求核剤(例えば、チオール、アミノ)の付着を容易にするための官能化部分を含み得る。任意の求電子剤をリンカーの一部として使用することができる。例示的な求電子剤としては、限定するものではないが、活性化エステル、活性化アミド、マイケルアクセプター、ハロゲン化アルキル、ハロゲン化アリール、ハロゲン化アシル及びイソチオシアネートが挙げられる。
例示的なリンカーは、Maratea et al.(1985),Gene 40:39-46;Murphy et al.(1986)Proc.Natl.Acad.Sci.USA 83:8258-62;米国特許第4,935,233号明細書;及び同第4,751,180号明細書にも開示されている。
i.コイルドコイルリンカー
一部の形態では、デアミナーゼ、スプリットデアミナーゼドメイン、塩基エディター、ターゲティングドメイン又は他の開示されるドメイン、タンパク質若しくはポリペプチドは、リンカーに融合又は作動可能に連結することができ、こうしたリンカーとして、限定されないが、コイルドコイル立体配置を有するタンパク質がある。
一部の形態では、コイルドコイルリンカーは、別のコイルドコイルリンカーと対合する配列を有する。例えば、一部の形態では、2つ以上の異なるコイルドコイルリンカーが共局在化して、標的DNA鎖上の塩基エディターの位置を制限及び誘導することができる、より剛性の立体構造をもたらす。例えば、一部の形態では、塩基エディターは、第1のコイルドコイルリンカーに結合したスプリットデアミナーゼタンパク質ドメインと、第2のコイルドコイルリンカーに結合した第2のスプリットデアミナーゼドメインとを含む。コイルドコイルドメインの共局在化は、標的DNA鎖上の共局在デアミナーゼドメインの位置を誘導するために、より剛性のリンカーを付与する。一部の形態では、第1のコイルドコイルリンカーは、アミノ酸配列:
GGGSGGSGEIAALEAKNAALKAEIAALEAKIAALKAGY(配列番号184)を含む。他の形態では、コイルドコイルは、配列番号184に対して約50%、55%、60%、65%、70%、75%、80%、85%、90%又は95%同一であるアミノ酸配列を含む。
一部の形態では、第2のコイルドコイルリンカーは、アミノ酸配列:
GGSGGSYKIAALKAENAALEAKIAALKAEIAALEAGC(配列番号185)を含む。他の形態では、コイルドコイルは、配列番号185に対して約50%、55%、60%、65%、70%、75%、80%、85%、90%又は95%同一であるアミノ酸配列を含む。
典型的には、第1のコイルドコイルリンカーは、共局在化時に第2のコイルドコイルリンカーと対合する。
5.他のドメイン及び修飾
デアミナーゼ、塩基エディター、ターゲティングドメイン又は他の開示されるドメイン、タンパク質若しくはポリペプチドは、様々な方法で修飾され得る。一部の形態では、修飾は、タンパク質若しくはペプチドをより安定に(例えば、インビボでの分解に対して抵抗性に)するか、又は細胞若しくは細胞内コンパートメントに浸透する能力を高めるか、或いは当業者に理解されるように他の望ましい特性にすることができる。このような修飾として、限定されないが、化学修飾、N末端修飾、C末端修飾、ペプチド結合修飾、骨格修飾、残基修飾、D-アミノ酸若しくは非天然アミノ酸又はその他が挙げられる。一部の形態では、1つ以上の修飾を同時に使用し得る。好ましい形態では、デアミナーゼ、塩基エディター、ターゲティングドメイン又は他の開示されるドメイン、タンパク質又はポリペプチドは、タンパク質分解に対して安定化される。例えば、ペプチドの安定性及び活性は、N-メチル化又はC-メチル化でペプチド結合の一部を保護することによって改善され得る。アミド化のような修飾は、ペプチダーゼに対するペプチドの安定性も高めると考えられる。
修飾は、機能性の改変をもたらす場合と、もたらさない場合がある。例として、とりわけ、デアミナーゼ又は塩基エディターに関して、機能性の改変をもたらさない修飾には、例えば、特定の宿主への発現のためのコドン最適化又はデアミナーゼ若しくは塩基エディターへの特定のマーカー若しくはエピトープタグ(例えば、可視化及び/又は単離若しくは精製用)の付与がある。
一部の形態では、デアミナーゼ、塩基エディター、ターゲティングドメイン又は他の開示されるドメイン、タンパク質若しくはポリペプチドをドメインに融合又は作動可能に連結させることができ、こうしたドメインとして、限定されないが、転写活性化因子、転写抑制因子、リコンビナーゼ、トランスポザーゼ、ヒストンリモデラー、DNAメチルトランスフェラーゼ、クリプトクロム、光誘導性/制御可能ドメイン又は化学的に誘導可能/制御可能なドメインが挙げられる。
i.核局在化配列
一部の形態では、デアミナーゼ、塩基エディター、ターゲティングドメイン又は他の開示されるドメイン、タンパク質若しくはポリペプチドは、1つ以上(例えば、2つ以上、3つ以上又は4つ以上)の核局在化配列(NLS)を含むか又はそれと結合し得る。任意の好都合なNLSを使用することができる。例としては、クラス1及びクラス2の「単節型NLS」並びにクラス3~5のNLSが挙げられる(Kosugi et al.,J Biol Chem.284(1):478-485(2009))。場合によっては、NLSは、式:(K/R)(K/R)X10~12(K/R)3~5を有する。場合によっては、NLSは、式:K:(K/R)X:(K/R)(配列番号31)を有する。NLSは、デアミナーゼ、塩基エディター、ターゲティングドメイン又は他の開示されるドメイン、タンパク質又はポリペプチドのN末端又はC末端に配置することができる。場合によっては、NLSをN末端に配置することが有利である。
使用できるNLSの例としては、T-agNLS(PKKKRKV;配列番号32)、T-Ag由来NLS(PKKKRKVEDPYC-SV40;配列番号33)、NLS SV40(PKKKRKVGPKKKRKVGPKKKRKVGPKKKRKVGC;配列番号34)、システイン-TATのCYGRKKRRQRRR-N末端システイン(配列番号35)、CSIPPEVKFNKPFVYLI(配列番号36)、DRQIKIWFQNRRMKVVKK(配列番号37)、SV40T-Ag由来NLSの(配列番号38)のPKKKRKVEDPYC-C末端システイン及びcMyc NLS(PAAKRVKLD;配列番号39)が挙げられる。他の有用なNLSは、Kosugi et al.,J Biol Chem.284(1):478-485(2009)に記載されている。
ii.ミトコンドリア局在化配列
デアミナーゼ、塩基エディター、ターゲティングドメイン又は他の開示されるドメイン、タンパク質若しくはポリペプチドは、1つ以上(例えば、2つ以上、3つ以上又は4つ以上)のミトコンドリアターゲティング配列(MTS)又はミトコンドリアターゲティング配列(MTS)を含むか又はそれに結合し得る。任意の好都合なミトコンドリア局在化配列を使用することができる。ミトコンドリア局在化配列の例としては、PEDEIWLPEPESVDVPAKPISTSSMMM(配列番号22)、SDHBのミトコンドリア局在化配列、モノ/ジ/トリフェニルホスホニウム又は他のホスホニウムは、VAMP1A、VAMP1B、DGAT2の67N末端アミノ酸及びBaxの20N末端アミノ酸である。MTSは、デアミナーゼ、塩基エディター、ターゲティングドメイン又は他の開示されるドメイン、タンパク質若しくはポリペプチドのN末端又はC末端に配置することができる。
a.Cox8由来のMTS
一部の形態では、ミトコンドリア標的化配列(MTS)は、Cox8に由来する。一部の形態では、ミトコンドリア局在化配列は、Cox8、即ちミトコンドリアシトクロムcオキシダーゼサブユニットVIIIに由来する。一部の形態では、COX8に由来するミトコンドリア局在化配列は、アミノ酸配列:MSVLTPLLLRGLTGSARRLPVPRAKIHSL(配列番号69)を含む。他の形態では、COX8に由来するミトコンドリア局在化配列は、配列番号69に対して約50%、55%、60%、65%、70%、75%、80%、85%、90%又は95%の同一性であるアミノ酸配列を含む。
他の形態では、Cox8に由来するミトコンドリア局在化配列は、アミノ酸配列:SVLTPLLLRSLTGSARRLMVPRAQVHSK(配列番号183)を含む。他の形態では、Cox8に由来するミトコンドリア局在化配列は、配列番号183に対して約50%、55%、60%、65%、70%、75%、80%、85%、90%又は95%同一性であるアミノ酸配列を含む。
b.SOD2由来のMTS
一部の形態では、ミトコンドリア標的化配列(MTS)は、SOD2に由来する。一部の形態では、SOD2由来のミトコンドリア局在化配列は、アミノ酸配列:MLSRAVCGTSRQLAPVLGYLGSRQKHSLPD(配列番号71)を含む。他の形態では、SOD2由来のミトコンドリア局在化配列は、配列番号71に対して約50%、55%、60%、65%、70%、75%、80%、85%、90%又は95%同一であるアミノ酸配列を含む。他の形態では、SOD2由来のミトコンドリア局在化配列は、アミノ酸配列:LCRAACSTGRRLGPVAGAAGSRHKHSLPD(配列番号182)を含む。他の形態では、SOD2由来のミトコンドリア局在化配列は、配列番号182に対して約50%、55%、60%、65%、70%、75%、80%、85%、90%又は95%同一性であるアミノ酸配列を含む。
c.I-Tev Iヌクレアーゼ
一部の形態では、塩基エディターは、1つ以上のヌクレアーゼ、例えば、ホーミングエンドヌクレアーゼI-Tev酵素由来の小さい配列許容性モノマーヌクレアーゼドメインを含む(I-TevI酵素;Kleinstiver,et al.,G3 Genes|Genomes|Genetics,Volume 4,Issue 6,1 June 2014,Pages 1155-1165,https://doi.org/10.1534/g3.114.011445)。I-TevIヌクレアーゼドメインのさらに別の特異性は、必要な切断モチーフが無差別DNA結合から生じる部位の近傍に見つからない可能性があるため、オフターゲット部位での切断を低減する可能性を有する。一部の形態では、I-Tev Iヌクレアーゼは、ミトコンドリア修復システムを誤誘導し、修復を望ましい結果(即ち編集された標的)に向けるためのニッカーゼとして使用することができる。
一部の形態では、標的化塩基エディターは、1つ以上のI-TEVIドメインを含む。一部の形態では、I-TEVIドメインは、以下のアミノ酸配列:
Figure 2024502630000097
(配列番号186)又は配列番号186に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
d.2A自己切断ペプチド
一部の形態では、標的塩基エディターは、2Aペプチドモチーフをさらに含む。2A自己切断ペプチド又は2Aペプチドは、18~22個のaa長ペプチドのクラスであり、これは、細胞内のタンパク質の翻訳中にリボソームスキッピングを誘導し得る。これらのペプチドは、DxExNPGPのコア配列モチーフを共有し、極めて多様なウイルスファミリーに認められる。それらは、リボソームがペプチド結合を作るのを失敗させることによってポリタンパク質の生成を助ける。
2Aペプチドのメンバーは、それらが最初に記載されたウイルスにちなんで命名されている。例えば、最初に記載された2AペプチドであるF2Aは、口蹄疫ウイルス(Foot-and-mouth disease virus)に由来する。「2A」という名称自体は、このウイルスの遺伝子番号付けスキームに由来する。塩基エディターに使用される例示的な2Aペプチドとしては、P2A、E2A、F2A及びT2Aが挙げられる。一部の形態では、2Aペプチドは、アミノ酸配列:ATNFSLLKQAGDVEENPGP(配列番号187)又は配列番号187に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有する。
e.IRES
一部の形態では、標的化塩基エディターは、IRESモチーフをさらに含む。内部リボソーム進入部位(略してIRES)は、タンパク質合成のより大きいプロセスの一部として、キャップ非依存的方法で翻訳開始を可能にするRNAエレメントである。真核生物の翻訳では、開始複合体のアセンブリには5’キャップ認識が必要であるため、開始は、典型的に、mRNA分子の5’末端で起こる。IRESエレメントの位置は、5’UTRであることが多いが、mRNAの他の場所にも起こり得る。IRESを使用して、大腸菌(E.coli)にdsDNA特異的デアミナーゼをクローニングする際に、P2Aペプチドの場合に観察される毒性を回避しながら、意図した真核細胞において規定の終止コドンを有するポリシストロン性タンパク質を発現させることができる。IRES設計を使用して、単一のAAV塩基エディター(DNA結合ドメインとしてZFを使用)を作製し、その場合、必要な全ての成分が単一のAAVベクターにパッケージ化され、次にこのベクターが使用されて、ヒト細胞株のミトコンドリアゲノムを問題なく編集する。
一部の形態では、スプリットデアミナーゼドメイン又は塩基エディターがウイルスベクターなどのベクターを介して送達される場合、塩基エディターは、1つ以上のIRESドメインを含む。一部の形態では、IRESドメインは、核酸配列:
Figure 2024502630000098
(配列番号188)又は配列番号188に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有する核酸或いはその断片を有する。
f.CBhプロモーター
一部の形態では、標的化塩基エディターは、組換えアデノ随伴ウイルス媒介遺伝子発現のためのプロモーターをさらに含む。一部の形態では、プロモーター配列はCBhプロモーターである。
一部の形態では、CBhプロモーターは核酸配列:
Figure 2024502630000099
(配列番号189)又は配列番号189に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有する核酸或いはその断片を有する。
g.ポリアデニル化モチーフ
一部の形態では、標的塩基エディターは、組換えアデノ随伴ウイルス媒介遺伝子発現のためのポリアデニル化モチーフをさらに含む。例示的なポリアデニル化モチーフとしては、SV40、hGH、BGH及びrbGlob由来のものが挙げられる。一部の形態では、ポリアデニル化モチーフは、BGH由来であり、核酸配列:
Figure 2024502630000100
(配列番号190)又は配列番号190に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有する核酸或いはその断片を有する。
6.例示的な塩基エディター立体配置
一部の形態では、標的化塩基エディターは、第1及び第2の部分を含み、第1の部分は、
(a)配列番号120のアミノ酸配列を含む第1のスプリットデアミナーゼドメインと、
(b)左側TALEプログラマブルDNA結合ドメインと
を含み;
第2の部分は、
(c)配列番号156、158、160又は164のいずれか1つのアミノ酸配列を含む第2のスプリットデアミナーゼドメインと、
(d)右側TALEプログラマブルDNA結合ドメインと
を含む。
一部の形態では、標的化塩基エディターは、第1及び第2の部分を含み、第1の部分は、
(a)配列番号169のアミノ酸配列を含む第1のスプリットデアミナーゼドメインと、
(b)左側TALEプログラマブルDNA結合ドメインと
を含み;
第2の部分は、
(c)配列番号173又は175のいずれか1つのアミノ酸配列を含む第2のスプリットデアミナーゼドメインと、
(d)右側TALEプログラマブルDNA結合ドメインと
を含む。
一部の形態では、標的化塩基エディターは、第1及び第2の部分を含み、第1の部分は、
(a)配列番号171のアミノ酸配列を含む第1のスプリットデアミナーゼドメインと、
(b)左側TALEプログラマブルDNA結合ドメインと
を含み;
第2の部分は、
(c)配列番号175のいずれか1つのアミノ酸配列を含む第2のスプリットデアミナーゼドメインと、
(d)右側TALEプログラマブルDNA結合ドメインと
を含む。
一部の形態では、標的化塩基エディターは、第1及び第2の部分を含み、第1の部分は、
(a)配列番号169のアミノ酸配列を含む第1のスプリットデアミナーゼドメインと、
(b)左側BATプログラマブルDNA結合ドメインと
を含み;
第2の部分は、
(c)配列番号173又は175のいずれか1つのアミノ酸配列を含む第2のスプリットデアミナーゼドメインと、
(d)右側TALEプログラマブルDNA結合ドメインと
を含む。
一部の形態では、標的化塩基エディターは、第1及び第2の部分を含み、第1の部分は、
(a)配列番号169のアミノ酸配列を含む第1のスプリットデアミナーゼドメインと、
(b)第1のコイルドコイルドメインと、
(c)任意選択で、左側TALEプログラマブルDNA結合ドメインを含み;
第2の部分は、
(d)配列番号173又は175のいずれか1つのアミノ酸配列を含む第2のスプリットデアミナーゼドメインと、
(e)第2のコイルドコイルドメインと、
(f)任意選択で、右側TALEプログラマブルDNA結合ドメインと
を含み、第1及び第2のコイルドコイルドメインは、第1及び第2の部分の結合時に互いに相互作用する。
標的化塩基エディターを含むか又はそれを発現するベクターも記載される。
一部の形態では、ベクターは、改変アデノウイルス(AAV)ベクター又はレンチウイルスベクターである。典型的には、標的化塩基エディターは、ベクター内に封カプセル化される。
7.例示的な塩基エディター配列
例示的な形態では、塩基エディターは、第1及び第2の部分を含むBE_R1_12デアミナーゼドメインに基づく。例示的な形態では、塩基エディターは、不活性型又は不活性スプリットデアミナーゼドメインBE_R1_12を有する第1の部分と、短縮型スプリットBE_R1_12デアミナーゼドメインを有する第2の部分を含む。
例示的な形態では、塩基エディターは、
pCBh-コザック開始コドン-mCox8MTS-リンカー-TALE_R_mCox1-リンカー-dBE_R1_12-リンカー-UGI-bGH ポリA
のように構成される第1の部分を含む。
例示的な形態では、BE_R1_12塩基エディターの第1の部分は、核酸配列:
Figure 2024502630000101
Figure 2024502630000102
Figure 2024502630000103
(配列番号264)
を有する。
例示的な形態では、BE_R1_12塩基エディターの第1の部分は、
Figure 2024502630000104
(配列番号265)
のアミノ酸配列を有する融合タンパク質である。
例示的な形態では、塩基エディターは、
pCBh-コザック開始コドン-mCox8MTS-リンカー-BAT_R_mCox1-リンカー-BE_R1_12(Δ60)-リンカー-UGI-ポリA
のように構成される第2の部分を含む。
例示的な形態では、BE_R1_12塩基エディターの第2の部分は、核酸配列:
Figure 2024502630000105
Figure 2024502630000106
Figure 2024502630000107
(配列番号266)
を有する。
例示的な形態では、BE_R1_12塩基エディターの第2の部分は、アミノ酸配列:
Figure 2024502630000108
(配列番号267)
を有する融合タンパク質である。
III.方法
開示の組成物及び試薬(デアミナーゼドメイン、塩基エディターなどを含む)並びにそれらの使用に関連する様々な方法が本明細書に開示される。例えば、ゲノム修飾を実施する方法、標的核酸を脱アミノ化する方法、インビトロ又はインビボで核酸(塩基)編集を実施する方法、標的核酸中のメチル化ヌクレオチドを同定する方法及び標的核酸のプールにおける配列多様性を生成する方法が開示される。
A.核酸編集
配列特異的DNAデアミナーゼ及び標的塩基エディターが開示され、これは、インビトロ(例えば、試験管内)及びインビボ(例えば、生存細胞中)の両方でDNAの正確な又は非標的化編集を可能にする。一本鎖DNA上でのみ活性であることが知られている以前に特性決定されたDNAデアミナーゼ(Iyer LM.,et al.,et al.,Nucleic Acids Research 39,9473-9497(2011))の大部分と異なり、本明細書に開示されるデアミナーゼは、二本鎖DNA(dsDNA)に対して活性であり、様々な程度の配列特異性を有する。例えば、デアミナーゼと標的化塩基エディターは、特定のコンテキストではdsDNAを脱アミノ化することができるが、他のコンテキストではできない。こうした特徴により、DNAデアミナーゼ及び標的化塩基エディターは、ssDNA特異的デアミナーゼを使用する塩基エディターよりも、特定の用途について有用となる。例えば、開示のdsDNA特異的デアミナーゼを利用して、その機能のために追加のRNA又はDNA部分を必要としないタンパク質単独塩基エディターが作製される(例えば、デアミナーゼを、タンパク質のみのターゲティングドメインの配列に融合させることによって)。これらのタンパク質のみのエディターは、核酸送達が効率的ではない細胞コンパートメント(例えば、ミトコンドリア及び葉緑体)内に位置するDNA種を編集するのに特に有用であるため、これらの細胞小器官のゲノムを編集するためにRNA誘導塩基エディターを適用する上での主要な制約の1つを回避する。さらに、それらの配列特異性のために、開示される塩基エディターは、所与の標的部位の近傍におけるバイスタンダーヌクレオチドに変異を導入することなく、ヌクレオチド分解能を伴う正確なゲノム編集を達成することができる。既存の塩基エディターは、ヌクレオチド分解能特異性を欠き、編集ウィンドウ内でバイスタンダー塩基に望ましくない変異を導入し得るが、配列特異的DNAデアミナーゼを備える開示の塩基エディターは、デアミナーゼドメインを起源とする追加の層の特異性を有する。これは、ヒトの遺伝病及び他のバイオテクノロジーの応用に取り組む上で広範な有用性がある。例えば、プログラマブルDNA結合ドメイン(例えば、Cas9、Cfp1、TALE、ジンクフィンガー(ZF)など)に融合された所望の特異性を有するデアミナーゼドメインを含む、開示される標的塩基エディターは、配列特異的塩基編集を実施するために使用することができ、その特異性は、DNA結合ドメイン並びにデアミナーゼドメインの両方の特異性に影響され、規定され得る。
さらなる例として、一部の形態では、Cas9(又は別のDNA結合タンパク質)に係留すると、アデノシンデアミナーゼは目的の遺伝子に局在し、DNA基質でAからGへの変異を触媒する。この塩基エディターを用いて、AからGへの復帰を必要とする疾患関連遺伝子の一塩基多型(SNP)をターゲティングして、復帰させることができる。この塩基エディターを用いて、TからCへの復帰を必要とする疾患関連遺伝子のSNPをターゲティングして、Tの反対側のAをGに変異させることにより復帰させることもできる。その後、Tは、例えば、塩基除去修復機構により、Cで置換されるか、又はDNA複製後のラウンドで変更され得る。
このように、核酸編集を行う方法が開示される。一部の形態では、この方法は、標的核酸と標的塩基エディターとを接触させるステップを含み、それにより、標的核酸内の標的ヌクレオチド配列の1つ以上の実体は、標的化塩基エディターによって脱アミノ化される。一部の形態では、標的核酸は、一本鎖DNA又は二本鎖DNAである。好ましくは、標的核酸は、二本鎖DNAである。
好ましくは、標的ヌクレオチド配列中の標的ヌクレオチドが脱アミノ化される。「脱アミノ化される」とは、標的ヌクレオチド中の塩基(例えば、A、C)からアミノ基を除去することを意味する。好ましくは、除去は、加水分解脱アミノ化を介して開示のデアミナーゼによって触媒される。本方法の一部の形態では、標的ヌクレオチド配列中の脱アミノ化ヌクレオチドは、それぞれT及びGとして表されるチミン又はグアニンヌクレオチドに変換される。一部の形態では、CはTに変換される。一部の形態では、AはGに変換される。典型的には、そのような変換は、標的ヌクレオチド配列の塩基編集を完了する。「塩基編集」とは、任意選択で中間体を介したあるヌクレオチドの別のヌクレオチドへの完全な変換を指す。例えば、アデノシンデアミナーゼ又はその塩基エディターによるアデニン(A)の脱アミノ化は、ヒポキサンチン(I)の形成をもたらし、これは、好ましくは、シトシン(C)と塩基対合する。DNA修復及び/又は複製機構は、IからGを修復し、この修復は、塩基編集を完了する。このようにして、塩基編集は、A・T塩基対をG・Cに変更する。
同様に、シトシンデアミナーゼ又はその塩基エディターによるシトシン(C)の脱アミノ化は、ウラシル(U)の形成をもたらし、これは、好ましくはアデノシン(A)と塩基対合する。DNA修復及び/又は複製機構は、その後、UからTを修復し、この修復によって塩基編集が完了する。このようにして、塩基編集は、C・G塩基対をT・Aに変更することができる。
適切なデアミナーゼ又はその塩基エディターが選択される限り、あらゆる標的ヌクレオチド配列を脱アミノ化することができる。一部の形態では、標的ヌクレオチド配列は、AC、CC、GC、TCである。前述の例示的な標的ヌクレオチド配列のいずれかにおいて、一部の形態では、標的ヌクレオチド配列の最後のCは、そのデアミナーゼ又は標的化塩基エディターによって脱アミノ化される。
一部の形態では、意図された標的ヌクレオチド配列は、少なくとも1%、2%、3%、4%、5%、10%、15%、20%、25%、30%、35%、40%、45%又は50%の効率で編集される。一部の形態では、本方法により、19%、18%、16%、14%、12%、10%、8%、6%、4%、2%、1%、0.5%、0.2%未満又は0.1%未満のインデル形成が起こる。一部の形態では、標的ヌクレオチドでの意図される生成物と意図されない生成物の比は、少なくとも2:1、5:1、10:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、100:1若しくは200:1又はそれを超える。一部の形態では、意図される点突然変異とインデル形成の比は、1:1、10:1、50:1、100:1、500:1若しくは1000:1又はそれを超える。
一部の形態では、標的核酸は、核(例えば、染色体)DNAである。一部の形態では、標的核酸は、細胞小器官ゲノム(ミトコンドリア、葉緑体又は色素体)である。一部の形態では、標的核酸は、精製若しくは未精製のゲノムDNA、プラスミド、PCR産物のいずれかの形態又は合成DNAの何らかの形態で、細胞の外部にある。
ミトコンドリアゲノム工学
一部の形態では、標的核酸は、ミトコンドリアDNAである。従って、一部の形態では、塩基エディター標的配列の指定された距離(例えば、20ヌクレオチド)以内にあるミトコンドリアDNA中の標的ヌクレオチド配列の実体は、ミトコンドリアDNA配列に含まれる。
デアミナーゼ及びその塩基エディターを含む、開示される試薬及び組成物を使用して、ミトコンドリアゲノムを操作することができる。これを用いて、ミトコンドリア遺伝病をモデル化する(即ちミトコンドリアゲノムに病原性突然変異を導入する)か、又はミトコンドリア遺伝病に関連する病原性変異体を修正することができる。ガイドRNA(gRNA)をミトコンドリアに送達する効率的なメカニズムがないために、RNA誘導ゲノム編集アプローチは、ミトコンドリアゲノムの操作のための使用に成功していない(Gammage PA.,et al.,Trends Genet.,34(2):101-110(2018))。ssDNA特異的デアミナーゼに融合したTALE及びZFなどのタンパク質のみのDNA結合ドメインは、Cas9と異なり、DNAに結合したとき、ssDNA領域を露出しないため、ミトコンドリアDNA中の標的配列を効率的に編集することができない。近年、ヒト細胞培養物中でミトコンドリアゲノム工学を達成するために、dsDNA特異的シチジンデアミナーゼ(DddA)がTALEに融合された(Mok et al.,2020)。しかし、このデアミナーゼのコンテキスト依存性のために、TCからTTへの変異のみを導入することができ、これは、MITOMAPデータベースで確認された病原性変異の4/93に相当する。これに対して、開示されるデアミナーゼ及びその塩基エディターは、配列特異性を拡大し、集合的に、任意の配列コンテキスト(AC、CC、GC及びTC)でシチジンを編集することができ、これにより、既存のツールでは対処することができないミトコンドリア遺伝子変異の79/93の修正を可能にする。
従って、核酸編集の方法の一部の形態では、標的核酸は、細胞中(例えば、ミトコンドリア中)にある。一部の形態では、この方法は、標的化塩基エディターの細胞への進入を促進することにより、標的核酸及び標的化塩基エディターを接触させるステップを含む。「進入を促進すること」は、標的化塩基エディターをセルと接触させることを含み、その際、標的化塩基エディターは、セルに進入することができるように作製又は構成される。一部の形態では、細胞は、対象(例えば、動物)に存在する。従って、一部の形態では、標的核酸と標的化塩基エディターとを接触させるステップは、標的塩基エディターを対象(例えば、動物)に投与することによって達成される。
標的シトシン又はアデノシンデアミナーゼ塩基エディターを細胞に導入することにより、ミトコンドリアゲノム工学をインビボで実施する方法も開示され、ミトコンドリアDNA中の標的ヌクレオチド配列は、標的化塩基エディターによって脱アミノ化される。一部の形態では、細胞は、対象(例えば、動物)内に存在する。
一部の形態では、ミトコンドリアDNAにおける標的ヌクレオチド又は標的ヌクレオチド配列の編集は、ミトコンドリアにおける変異(例えば、病原性又は疾患関連変異)の修正をもたらす。病原性又は疾患関連ミトコンドリア変異は、当技術分野で公知であり、そのうちのいくつかは、ヒトミトコンドリアDNA変異のデータベースであるMITOMAPデータベース(http://www.mitomap.org/)にカタログ化されている。表2は、病原性ミトコンドリア変異の非限定的なリストを提供する。
Figure 2024502630000109
Figure 2024502630000110
Figure 2024502630000111
Figure 2024502630000112
Figure 2024502630000113
一部の形態では、開示の標的塩基エディターによって脱アミノ化された標的ヌクレオチドは、表2に列挙される変異から選択される。一部の形態では、開示の標的塩基エディターによって脱アミノ化された標的ヌクレオチドは、m.583G>A、m.616T>C、m.1606G>A、m.1644G>A、m.3258T>C、m.3271T>C、m.3460G>A、m.4298G>A、m.5728T>C、m.5650G>A、m.3243A>G、m.8344A>G、m.14459G>A、m.11778G>A、m.14484T>C、m.8993T>C、m.14484T>C、m.3460G>A、ad m.1555A>Gから選択される。最も好ましいのは、m.3243A>G、m.8344A>G、m.14459G>A、m.11778G>A、m.14484T>C、m.8993T>C、m.14484T>C、m.3460G>A及びm.1555A>Gである。
このように、基本的な変異を修正することにより、ミトコンドリア遺伝子疾患に対処する方法が開示される。この方法は、標的化シトシン又はアデノシンデアミナーゼ塩基エディターを細胞に導入するステップを含み、ミトコンドリアDNA中の標的ヌクレオチド配列は、標的化塩基エディターによって脱アミノ化される。一部の形態では、標的ヌクレオチド配列中の脱アミノ化ヌクレオチドは、チミン又はグアニンヌクレオチドに変換される。この変換により、標的ヌクレオチド配列の塩基編集が完了する。塩基編集により、病原性又はミトコンドリア病に関連する変異が修正され、その変異をミトコンドリア核酸のWT又は非病原性形態に復帰させる。任意の好適な患者由来細胞を使用し得、そうした細胞として、限定されないが、線維芽細胞、リンパ球、膵臓細胞、筋細胞、神経細胞及びiPS細胞などの幹細胞が挙げられる。一部の形態では、細胞は、対象(例えば、動物又はヒト)内にあり;従ってそれにより塩基エディターを用いて病原性突然変異及び基礎疾患状態を修正することができる。ミトコンドリアゲノムに正確な編集を導入するための信頼できる技術が全くないことを考慮すると、ミトコンドリア遺伝病の細胞又は動物モデルを作製することは困難であった。ミトコンドリア病を治療するための病原性ミトコンドリア変異体の修正(即ち遺伝子療法適用)以外にも、開示される塩基エディターは、ミトコンドリア遺伝病のための細胞又は動物モデルを作製する方法にも使用することができる。このような方法は、これらの遺伝病並びにミトコンドリア生理学及び遺伝的ヘテロプラスミーの順遺伝学研究を可能にする。さらに、開示の塩基エディターは、癌、代謝障害及び老化などの複雑な疾患の順遺伝学研究も可能にし、これら及び類似の非遺伝的に定義された疾患におけるミトコンドリアコード遺伝子及び突然変異の役割を解明するのに役立ち得る。
このように、ミトコンドリア遺伝病の細胞モデルを作製する方法が開示される。この方法は、標的化シトシン又はアデノシンデアミナーゼ塩基エディターを細胞に導入することを含み、その際、ミトコンドリアDNA中の標的ヌクレオチド配列は、標的化塩基エディターによって脱アミノ化される。一部の形態では、標的ヌクレオチド配列中の脱アミノ化ヌクレオチドは、チミン又はグアニンヌクレオチドに変換される。変換により、標的ヌクレオチド配列の塩基編集が完了する。塩基編集により、以前の野生型又は非変異標的ミトコンドリア核酸に病原性又はミトコンドリア病関連突然変異の導入が起こる。限定されないが、線維芽細胞、リンパ球、膵臓細胞、筋細胞、神経細胞及びiPS細胞などの幹細胞を含むあらゆる好適な細胞が使用され得る。一部の形態では、細胞は、対象(例えば、動物)に存在し;従って、それによりミトコンドリア病の動物モデルを作製することができる。
疾患モデリングのための病原性突然変異を生成するために塩基編集を受けることができる例示的な野生型ミトコンドリアDNA標的ヌクレオチド配列は、表2から選択することができ、限定されないが、CACcCTC、GAGaCAA、CAGaGCC、TCGcATA、GTCaGAG、TAAcAAC、AGTaAAT、TAGaCAA、CACcGCT及びAGAaCCAを含み、病原性変異を生成するために編集される標的ヌクレオチドは、小文字である。
核酸編集の方法に使用される様々な試薬及び組成物は、当技術分野で公知の様々な手段によって細胞又は対象に導入することができる。例えば、デアミナーゼ、標的化塩基エディター又は他の試薬は、DNA、RNA、タンパク質の組合せ又はそれらの組合せなどの様々な形態で送達することができる。例えば、塩基エディターは、DNAコードポリヌクレオチド若しくはRNAコードポリヌクレオチド又はタンパク質として送達され得る。塩基エディターがターゲティングドメインとしてCrispr-Casエフェクタータンパク質を含む場合、適切なガイドRNA又はcrRNAをDNAコードポリヌクレオチド又はRNAとして送達し得る。混合式の送達を含む考えられるあらゆる組合せが構想される。
一部の形態では、本方法は、1つ以上のポリヌクレオチド、例えば、1つ以上のベクター、1つ以上のその転写産物及び/又はそれから転写されるタンパク質を宿主細胞に送達するステップを含む。核酸編集試薬を細胞に導入又は導入するための好適なベクターとして、限定されないが、例えばバクテリオファージ、バキュロウイルス、レトロウイルス(レンチウイルスなど)、アデノウイルス、ポックスウイルス、エプスタイン・バーウイルス(Epstein-Barr viruses)及びアデノ随伴ウイルス(AAV)に由来するプラスミド及びウイルスベクターが挙げられる。ウイルスベクターは、DNAウイルス(例えば、dsDNA若しくはssDNAウイルス)又はRNAウイルス(例えば、ssRNAウイルス)であり得るか、或いはウイルス様粒子(VLP)であり得る。多数のベクター及び発現系は、Addgene、Novagen(Madison,WI)、Clontech(Palo Alto,CA)、Stratagene(La Jolla,CA)及びインビトロgen/Life Technologies(Carlsbad,CA)を含む販売業者から市販されている。有利なベクターは、レンチウイルス及びアデノ随伴ウイルスを含み、そのようなベクターのサブタイプを、特定のタイプの細胞をターゲティングするために選択することもできる。
核酸編集試薬(例えば、塩基エディター)は、様々なウイルス又は非ウイルス技術によって細胞に導入することができる。試薬は、ウイルスベクター(例えば、レンチウイルス、アデノウイルス、ポックスウイルス、エプスタイン・バーウイルス(Epstein-Barr viruses)、アデノ随伴ウイルス(AAV)、ウイルス様粒子(VLP)などのレトロウイルス)で提供することができる。物理的及び/又は化学的方法などの非ウイルスアプローチも使用することができ、そうしたものとして、限定されないが、カチオン性リポソーム及びポリマー、エキソソーム、DNAナノクルー、遺伝子銃、マイクロインジェクション、エレクトロポレーション、ヌクレオフェクション、パーティクルガン、超音波の使用、マグネトフェクション及び細胞透過性ペプチドとの共役が挙げられる。このような方法は、例えば、Nayerossadat N.,et al.,Adv.Biomed.Res.,1:27 (2012)及びLino CA, et al., Drug Deliv.,25(1):1234-1257(2018)に記載されている。当業者は、それぞれの利点及び欠点に関連しで当技術分野で公知の送達方法に基づいて、最適な方法を決定することができるであろう。
一部の形態では、デアミナーゼ又はその塩基エディターは、デアミナーゼ又は塩基エディターをコードするmRNAを介して細胞に導入することができる。mRNAは、N6-メチルアデノシン(m6A)、5-メチルシトシン(m5C)、シュードウリジン(ψ)、N1-メチルプシュードウリジン(me1ψ)及び5-メトキシウリジン(5moU);5’キャップ;ポリ(A)テール;1つ以上の核局在化シグナル;又はそれらの組合せなどの修飾を含有し得る。mRNAは、真核細胞での発現のために最適化されたコドンであり、エレクトロポレーション、トランスフェクション及び/又はナノ粒子媒介による送達を介して細胞に導入することができる。デアミナーゼ又は塩基エディターは、RNA誘導エンドヌクレアーゼをコードするウイルスベクターを介して或いはデアミナーゼ若しくは塩基エディタータンパク質の直接エレクトロポレーション又は塩基エディタータンパク質-RNA複合体を介して導入することもできる。
核酸編集試薬は、それぞれ個別に組成物に含有させ、個々に又は集合的に細胞に導入することができる。代わりに、これらの成分は、細胞への導入のための単一の組成物で提供することができる。
B.修飾ヌクレオチドの同定
標的核酸中のヌクレオチド修飾の存在及び/又は位置(即ちエピジェネティックマーク)を同定するための方法も提供される。
エピジェネティックシーケンシングは、典型的に、DNAシーケンシングによりゲノム内のヌクレオチドに対する修飾を同定及び局在化するために使用される。様々な修飾が存在するが、最も一般的であり且つ重要なものは、5-メチルシトシン(5-mC)及び5-ヒドロキシメチルシトシン(5-hmC)である。これらのエピジェネティック修飾を同定するために使用される主な技術は、バイサルファイトシーケンシング法である(Raiber EA.,et al.,Nat Rev Chem 1,0069(2017))。このアプローチでは、抽出されたゲノムを化学薬品亜硫酸水素塩で処理し、これにより、全ての未修飾シトシンをウラシルに変換する。シーケンシング中、これらは「T」として読み取られる。この技術は広く採用されているが、この方法により、使用されるDNA分子の99%が化学的に破壊される。さらに、未修飾CからUへの変換は全て、塩基の分布を歪めることから、シーケンスエラーが発生する。さらに、変換率が100%ではないため、修飾シトシンの誤同定が起こる可能性がある。ニューイングランドバイオラボ(New England Biolabs)(NEB)によって新たに開発されたアプローチは、亜硫酸水素塩の過酷な化学処理の代わりに、APOBEC:シトシンをウラシルに同様に変換するssDNA特異的酵素を使用する(https://www.neb.com/tools-and-resources/feature-articles/enzymatic-methyl-seq-the-next-generation-of-methylome-analysis)。しかし、APOBECは、5mC及び5hmCも脱アミノ化するため、シトシンとその修飾形態の識別を不可能にする。この方法では、5mC及び5hmCを検出するために、TET2及び酸化促進剤も使用し、これにより、5mC及び5hmCをAPOBECの基質ではない形態に酵素的に修飾する。TET2酵素は、5mCを5caCに変換し、酸化促進剤が5hmCを5ghmCに変換する。最終的に、シトシンは、チミンとして配列決定され、5mC及び5hmCはシトシンとして配列決定され、それによって元の5mC及び5hmC配列情報の完全性を保護する。これは改善であるが、それでも塩基の分布を歪ませ、標準的なゲノム配列決定を困難にする。TET2と酸化エンハンサーを使用する必要があり、APOBECの基質としてssDNA形態のDNAが存在するため、このプロセスは制限され、複雑で非効率的になる。
バイサルファイトシーケンシングの大幅な改善は、近年開発されたTET支援ピリジンボランシーケンシング(TAPS)である(Liu Y.,et al.Nat Biotechnol 37,424-429(2019))。この方法は、酵素的処理と化学的処理を組み合わせて、5-mC及び5-hmCをUに変換する。TAPSは、バイサルファイトシーケンシングよりも過酷ではなく、歪んだ塩基分布から生じるシーケンシングアーティファクトを軽減する。但し、その主な制約は、5-hmCから5-mCを識別することができないことである。
開示されるデアミナーゼ及びその塩基エディターは、dsDNAに対して活性であり、DNAでのメチル化(5mC及び5hmC)又は他の修飾を検出する(又は検出するように進化させる)ことができるため、既存のエピジェネティックシーケンシングワークフローを大幅に促進及び改善し、シーケンシングによるメチル化を超えたエピジェネティックマークを検出するための新たな道の領域を切り開く。エピジェネティックマーカーの同定は、癌及び他の多くの疾患の検出を含む様々なR&D及び診断用途に使用することができ、ゲノムデータに追加の情報層を付与し得る。
このように、エピジェネティックマークの存在及び/又は位置を決定するための方法が提供される。一部の形態では、本方法は、DNA中の修飾ヌクレオチド(例えば、5mC及び5hmC)の存在及び/又は位置を決定するステップを含む。例示的な方法は、標的核酸とデアミナーゼドメインとを接触させるステップを含み、標的核酸は、二本鎖シトシンメチル化DNAであり、標的核酸を配列決定して、標的核酸中のメチル化シトシンヌクレオチドを同定する。好ましくは、デアミナーゼドメインは、二本鎖DNAを脱アミノ化することができ、非メチル化シチジン及び様々な形態のシチジン修飾(例えば、mC及びhmC)に対して異なる活性(例えば、異なる脱アミノ化速度)を有する。一部の形態では、デアミナーゼドメイン及び標的核酸は、デアミナーゼドメインが標的核酸を脱アミノするのに好適な期間及び条件下で、インキュベートされる。一部の形態では、デアミナーゼドメインは、実質的に標的核酸中の非メチル化シトシンヌクレオチドのみを脱アミノ化する。一部の形態では、DNA基質上のメチル化ヌクレオチドは、メチル化シチジンと非メチル化シチジンのより良好な識別を可能にするために、dsCDAで処理する前に、TET2及びBGT酵素処理(従来技術で公知の方法による)を用いて、最初に酸化形態(例えばcaC及びfC)に変換される。一部の形態では、標的核酸中の実質的に全て(又は大部分)の非メチル化シトシンヌクレオチドが、デアミナーゼドメインによって脱アミノ化される。脱アミノ化された標的核酸を配列決定すると、標的核酸中のメチル化シトシンヌクレオチドが同定される(それらはシトシンとして配列決定される)。加えて、標的核酸中の未修飾シトシンは、それらがチミンとして配列決定されることから、同定することができる。核酸を配列決定するための適切な方法は、当技術分野で公知である。標的化シーケンシング、全ゲノムシーケンシング又は全エクソームシーケンシングを含む様々なタイプのシーケンシングを実施することができる。核酸サンプルのシングルエンド又はペアエンドシーケンシングを実施し得る。
適切なシーケンシング方法として、限定されないが、以下が挙げられる:サンガーシーケンシングハイスループットシーケンシング、パイロシーケンシング、合成によるシーケンシング、単一分子シーケンシング、ナノポアシーケンシング(例えば、MinION)、半導体シーケンシング、ライゲーションによるシーケンシング、ハイブリダイゼーションによるシーケンシング、デジタル遺伝子発現(Helicos)、次世代シーケンシング(例えば、Roche 454、HiSeq2000などのSolexaプラットフォーム、SOLiDなど)、合成による単一分子シーケンシング(SMSS)(Helicos)、超並列シーケンシング、クローン単一分子アレイ(Solexa)、単一分子リアルタイムシーケンシング(SMRT)、ショットガンシーケンシング、マキシムギルバートシーケンシング、プライマーウォーキング、PacBio、SOLiD、Ion Torrent又はナノポアプラットフォームを用いたシーケンシング並びに当技術分野で公知の任意の他のシーケンシング方法。
一部の形態では、デアミナーゼドメインは、標的核酸中の非メチル化シトシンヌクレオチドの少なくとも50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%又は99.5%を脱アミノ化する。一部の形態では、デアミナーゼドメインは、標的核酸中の非メチル化シトシンヌクレオチドの50~100%、50~90%、50~80%、60~100%、60~90%、60~80%、70~100%、70~90%、70~80%、80~100%、80~95%、80~90%、90~100%、90~95%、95~100%又は95~99.5%の非メチル化シトシンヌクレオチドを脱アミノ化する。好ましくは、デアミナーゼドメインは、標的核酸中の非メチル化シトシンヌクレオチドの90%以上(例えば、95%、96%、97%、98%、99%、99.5%又はそれを超える)を脱アミノ化する。
一部の形態では、デアミナーゼは、dsDNA特異的シトシンデアミナーゼであり、好ましくは、実質的に非配列特異的シトシンデアミナーゼである。例えば、デアミナーゼドメインは、特定の標的ヌクレオチド配列の脱アミノ化を優先し得るが、これに限定されるわけではない。一部の形態では、dsDNA特異的デアミナーゼの混合物を使用して、任意の個々のデアミナーゼによって課される配列バイアスを最小限に抑え、それらの配列コンテキストとは独立して非メチル化シトシンを脱アミノ化することができる。
異なるdsDNA特異的デアミナーゼ(dsCDA)は、シチジン及びその様々な修飾(即ちエピジェネティックマーク、5mC、5hmC、5fC、5caC)に対して異なる活性を示す。この特徴を利用して、様々なエピジェネティックマーク(シチジン修飾)を示差的にマーキングし、次にこれをシーケンシング法により読み取ることができる。この方法は、バイサルファイトシーケンシングに代わる酵素的代替手段を提供し、DNAのバイサルファイト処理に関連する欠点と技術的制約に対処し、品質の優れた結果の生成を最小化する。実施例に記載されるように、デアミナーゼは非メチル化シチジン[(m)C]に対してより活性であるが、メチル化シチジン(5mC及び5hmC)に対してはそうではないことが明らかにされている。加えて、編集効率(CからT変換)は、非メチル化dC残基で高く、これは、dsCDAが、非メチル化DNA及びメチル化DNAに対して差別的に作用することを示唆するものである。5hmCと5mCは、グルコシル化及び酸化によって保護される場合、脱アミノ化に対してより耐性であることが判明した。
C.配列多様性の生成
ランダム突然変異誘発は、遺伝子及びタンパク質の機能を探究するために、密接に関連する変異体の配列多様性及びライブラリーを生成する一連の技術を包含する。これらの方法のうち、一般的であるのは、エラープローンPCR(Wilson DS and Keefe AD,2001;PMID:18265275)であり、この方法では、エラープローンポリメラーゼ又は別の突然変異誘発因子の酵素を用いて、目的の遺伝子を多様化/増幅し、遺伝子の機能に影響を及ぼし得るランダムな突然変異を導入する。その有用性にもかかわらず、エラープローンPCRは、それが生成できる突然変異の種類に偏りがある。別の手法は、DNAシャッフリング(Joern JM(2003)DNA Shuffling.In:Arnold F.H.,Georgiou G.(eds).Methods in Molecular Biology(商標),vol 231.Humana Press.インターネットサイト:doi.org/10.1385/1-59259-395-X:85)であり、この場合、2つの類似した遺伝子間の短い配列をランダムにシャッフルして、変異遺伝子のライブラリーを生成する。このアプローチの主な制約は、2つの遺伝子が有意な配列類似性を有するという要件である。別の手法では、トランスポザーゼを使用して、DNAの短いセグメントを遺伝子にランダムに挿入する(Cartman ST and Minton NP,Appl Environ Microbiol.,76(4):1103-9(2010))。あまり一般に使用されてはいないが、トランポサーゼベースの手法は、挿入部位の要件という欠点がある。最後に、ランダム変異は、主にグアノシンヌクレオチドの修飾を実施するエチルメタンスルホン酸(EMS)などの化学物質を用して使用することができる。化学的突然変異誘発手法は、多くの場合、インビボDNA修復機構を必要とし、グアノシンに対する修飾のみを行うため、生成することができる配列の多様性が制限される。
開示されるdsDNA特異的デアミナーゼを使用して、目的のDNA分子に調整可能な効率でランダム変異を導入することができ、従って、様々な遺伝的にコードされた生体分子(例えば、抗体、アプタマーなど)を最適化するための指向性進化ワークフローを促進及び合理化することができる。このように、DNA配列のプールをランダムに変異させる方法が提供される。標的核酸のプールで配列多様性を生成するための方法も提供される。このような方法では、デアミナーゼは、好ましくは、実質的に非配列特異的デアミナーゼ又は最小限のコンテキスト依存性で標的配列を集合的に編集することができる配列特異的デアミナーゼの混合物である。例えば、デアミナーゼドメインは、限定されないが、特定の標的ヌクレオチド配列の脱アミノ化を選好し得るか、又は個別の特異性を有する複数のデアミナーゼが同時に使用される。
一部の形態では、このような方法は、デアミナーゼドメインと標的核酸の複数のコピーとを、標的核酸の脱アミノ化をもたらす時間にわたって且つそのような条件下で接触させるステップを含む。一部の形態では、本方法は、標的核酸の1コピー当たり平均0.1~5.0ヌクレオチドの脱アミノ化に影響を及ぼす。一部の形態では、本方法は、標的核酸の1コピー当たり平均約0.1、0.5、1.0、1.5、2.0、2.5、3.0、3.5、4.0、4.5又は5.0ヌクレオチドの脱アミノ化に影響を及ぼす。好ましくは、標的核酸は、二本鎖DNAであり、デアミナーゼドメインは、二本鎖DNAを脱アミノ化することができる。
一部の形態では、標的核酸のコピーは、インビトロである。従って、標的核酸のコピー中の脱アミノ化ヌクレオチドは、インビトロ反応を介してチミン又はグアニンヌクレオチドに変換され得る。
一部の形態では、本方法は、標的核酸の脱アミノ化コピーを選択又はスクリーニング手順に供するステップをさらに含み、それは、インビボ又はインビトロで実施され得る。選択法又はスクリーニング法は、標的核酸のライブラリーに特定の選択圧を加えることにより、不要な変異体を直接排除する。適切な選択手順として、限定されないが、mRNAディスプレイ、リボソームディスプレイ及びSELEX(インビトロ)又はインビボ細胞ベースの選択方法(後者は、細胞に導入する前に、多様なDNA断片を適切なベクターにクローニングする必要がある)が挙げられる。
一部の形態では、標的核酸のコピー中の脱アミノ化ヌクレオチドは、チミン又はグアニンヌクレオチドに変換され、この変換は、標的核酸のコピーの一部又は全ての1つ以上の塩基編集を完了する。
一部の形態では、標的核酸のコピー中の脱アミノ化ヌクレオチドは、細胞中の標的核酸のコピーをインキュベートすることにより、チミン又はグアニンヌクレオチドに変換され得る。従って、一部の形態では、標的核酸のコピーは、細胞内にあり、細胞へのデアミナーゼドメインの進入を促進すること(例えば、mRNA又はタンパク質のエレクトロポレーション、発現ベクターによるトランスフェクション、形質転換など)により、デアミナーゼドメインと標的核酸のコピーとを接触させる。
一部の形態では、デアミナーゼドメインは、単離されたデアミナーゼドメインである。一部の形態では、デアミナーゼドメインは、ターゲティングドメイン(例えば、DNA結合ドメイン、転写因子、DNA又はRNAポリメラーゼ(例えば、ヒト細胞におけるT7 RNAポリメラーゼなどの直交RNAポリメラーゼ)、他の複製及び転写アクセサリー因子など)に融合され、その結果、デアミナーゼドメインは、ターゲティングドメインによって占有されるDNA配列上のターゲティングドメイン(例えば、DNA結合ドメイン標的部位、転写因子標的部位、DNAポリメラーゼ融合の場合には全ゲノム、RNAポリメラーゼ融合により転写されるプロモーター及び遺伝子など)と優先的に共局在する。この手法を用いて、dsDNA特異的デアミナーゼを転写因子又は他の目的のDNA相互作用ドメインに融合させ、融合物を細胞に導入することにより、転写因子又は他のDNA相互作用タンパク質の結合部位をハイスループットで(ChIP-Seqの代替として)同定することができ、目的のドメインとDNAとの相互作用は、CからTへの変異としてデアミナーゼにより一意にマーキングされ、次にこれを、全ゲノムシーケンシングによって検出することができる。
他の形態では、このアプローチは、例えば、デアミナーゼドメインをDNA相互作用ドメインに融合させることにより、細胞内部の目的の遺伝子座を高効率で連続的に多様化するために使用することができる。DNA相互作用ドメインの選択は、変異がゲノム全体に生成される(例えば、デアミナーゼドメインが、融合されたDNAポリメラーゼであるか、又はDNAポリメラーゼに対するアクセサリータンパク質を使用することができる)ように実施することができる。代わりに、ゲノム又はプラスミドの規定セグメントのみをターゲティングすることもできる(例えば、デアミナーゼドメインは、RNAポリメラーゼに融合されて、そのポリメラーゼのプロモーターによって規定される領域をターゲティングする。デアミナーゼは、T7プロモーターを天然にコードしない宿主において、T7 RNAポリメラーゼなどの直交DNAポリメラーゼに融合させることができる。目的のDNAセグメントをT7の前に配置し、所与の宿主で発現させて、ゲノムの残りを多様化させずに、目的のセグメントを連続的に多様化することができる。このような連続的なインビボ多様化戦略は、細胞バーコード適用の目的とする形質の漸進的進化に使用することができる。ssDNA特異的デアミナーゼとは対照的に、dsDNA特異的デアミナーゼを使用すると、これらの適用での編集効率が向上する。例えば、ssDNA特異的デアミナーゼに融合したT7 RNAポリメラーゼは、以前に記載されているが、恐らく、転写中に一過性に生成されるssDNA基質(即ち転写バブル)がポリメラーゼ内に埋め込まれて、ssDNA特異的デアミナーゼに容易にアクセスできないために、そうした設計の編集の効率は、選択を適用することなく、<1%に制限されている(ウェブページ:nature.com/articles/s41467-021-21876-z及びインターネットサイト:pubs.acs.org/doi/10.1021/jacs.8b04001を参照されたい)。dsDNA特異的デアミナーゼは、ポリメラーゼがその転写カセットに沿って通過する際に、それらの好ましい基質(dsDNA)に容易にアクセスできるため、露出したssNDAにのみ作用することができるssDNA特異的デアミナーゼよりも高い編集効率を達成するが、これは、漸進的インビボ進化及び細胞バーコーディング適用に望ましい機能である。
一部の形態では、細胞は、動物内にある。従って、一部の形態では、デアミナーゼドメインを動物に投与して、それを標的核酸のコピーと接触させる。
一部の形態では、標的核酸のコピーが細胞中にある場合、デアミナーゼドメインは、細胞中の発現ベクターによってコードされる。従って、一部の形態では、細胞中でデアミナーゼドメインを(例えば、一過性に)発現させることにより、デアミナーゼドメインを標的核酸のコピーと接触させる。
例示的な方法では、目的のdsDNA(例えば、目的のタンパク質をコードする遺伝子)をdsDNA特異的デアミナーゼで処理して、目的の遺伝子の変異体のライブラリーを作製した後、これを様々な指向性進化戦略(例えば、リボソームディスプレイ)又は他の選択/スクリーニングに基づく方法に供することができる。実施例に記載されるように、CからT編集がgRNA結合部位の上流で観察され、これは、規定標的領域における標的化編集の成功を実証するものである。
IV.キット
開示される試薬、材料及び組成物並びに他の材料は、開示される方法を実施又は実施を補助するのに有用なキットとして任意の好適な組み合わせで一緒に包装することができる。所与のキット内の構成要素が、開示される方法で一緒に使用するために設計及び改変される場合に有用である。
一部の形態では、キットは、例えば、デアミナーゼドメイン又は塩基エディターをコードするヌクレオチド配列を含む1つ以上の核酸構築物を含むことができる。キットは、このようなポリヌクレオチドを含む発現ベクターを含み得る。他の形態では、キットは、適切な緩衝液中のデアミナーゼタンパク質又はその塩基エディターを含み得る。キットは、追加的又は代替的に、デアミナーゼドメイン又はその塩基エディターを発現する細胞を含むことができる。
一部の形態では、キットは、脱アミノ化アッセイを実施し、且つ/又は遺伝子発現を解析するための試薬を含む。例えば、キットは、PCR試薬、シーケンシング試薬、フローサイトメトリー試薬、プライマー及びこれらの組合せを含むことができる。好ましくは、キットは、説明資料を含む。説明資料は、刊行物、記録、図又はキットの組成物及び方法の有用性を伝えるために使用することができる任意の他の表現媒体を含むことができる。例えば、説明資料は、キット構成要素を使用する方法、例えば、インビトロ又はインビボで標的化核酸編集を実施する方法に関する指示を提供し得る。
V.デアミナーゼ酵素ドメインを同定し、特性決定する方法
二本鎖DNA(dsDNA)に対して活性であるデアミナーゼドメインを同定し、それらの編集コンテキスト特異性を決定する方法も記載される。これらの方法は、ゲノミクス及びメタゲノミクスデータベースで利用可能なデアミナーゼドメインを体系的に特性決定する。一部の形態では、本方法は、1つ以上のデアミナーゼタンパク質ファミリーから1つ以上の代表的なデアミナーゼドメインを同定する1つ以上のステップを含む。一部の形態では、これらの方法は、1つ以上のゲノミクス及びメタゲノミクスデータベース内のシチジンデアミナーゼ様(CDA)スーパーファミリーにおけるデアミナーゼドメインを同定する。例示的なゲノミクス及びメタゲノミクスデータベースには、ワールドワイドウェブ:a//pfam.xfam.org/clan/CDAで利用可能なインターネットリソースpfamデータベースが含まれる。pfamデータベース内のタンパク質機能は、一般に計算処理上アノテーションが付けられている。データベースで同定された遺伝子ドメインは、例えば、市販の遺伝子合成サービスを用いて合成される。
上記の方法は、例えば、インビトロ転写/翻訳系を用いて、遺伝子を発現させるための1つ以上のステップを含む。本方法は、合成され、発現されたデアミナーゼドメインの活性を特性決定するステップを含む。典型的には、これら方法は、デアミナーゼを特性決定する1つ以上のステップ、例えば、1つ以上のアッセイを用いてssDNA及びdsDNA基質に対するそれらの鎖バイアス及び配列特異性機能を決定するためのステップを含む。例示的なアッセイは、DNAシーケンシング及び/又は脱アミノ化アッセイを含む。例示的なシーケンシングアッセイは、以下を含む:(i)インビトロ翻訳によって所与のCDAドメインを発現するステップ;(ii)dsDNAプラスミドをインビトロ翻訳反応に付加するステップ;続いて(iii)デアミナーゼ活性に対して好適な条件下で一定期間インキュベートするステップ;並びに(iv)得られたDNA産物の配列分析を行い、デアミナーゼ活性を決定するステップ。例示的な条件は、以下を含む:37℃の温度で2時間のインキュベーション;95℃に短時間加熱による反応の不活性化;例えば、PCRによる残留DNA産物の増幅;DNAの完全性を特定するためのシーケンシング。例示的なシーケンシング技術としては、次世代シーケンシング(NGS)及びサンガーシーケンシングがある。上記の方法により活性デアミナーゼドメインを同定する形態では、本方法は、同一又は異なるゲノミクス及びメタゲノミクスデータベース内のタンパク質遺伝子の遺伝的に関連するサブファミリー中で類似のデアミナーゼドメインを同定するための1つ以上のステップを含む。例えば、一部の形態では、これらの方法は、1つ又は複数のdsCDAの同定に到った最初のスクリーニングで活性dsDNA特異的CDAを含有することが判明したサブファミリーでスクリーニングを反復する。この方法は、同定されたdsCDAに存在し、非活性dsCDAに存在しないシグネチャモチーフを同定するステップも含む。これらのシグネチャモチーフを使用して、データベース内の追加のdsDNAを識別することができる。
同様の手法を使用して、ゲノム及びメタゲノムデータベースから他のRNA及びDNA修飾/プロセシング酵素を迅速に特性決定することができる。
開示される組成物及び方法は、以下の番号付きパラグラフを通してさらに理解することができる。
1.単離されたデアミナーゼドメインであって、二本鎖DNAを脱アミノ化することができ、標的ヌクレオチド配列を含まない二本鎖DNAに対するデアミナーゼドメインのデアミナーゼ活性と比較して、標的ヌクレオチド配列を含む二本鎖DNAに対してより大きいデアミナーゼ活性を有し、
標的ヌクレオチドは、それぞれ個別に完全に又は部分的に規定され、且つ互いに固定された順序関係にあり、
デアミナーゼドメインは、バークホルデリア・セノセパシア(Burkholderia cenocepacia)由来のDddAのデアミナーゼドメインではない、単離されたデアミナーゼドメイン。
2.標的ヌクレオチド配列は、2つ以上の標的ヌクレオチドを含み、
標的ヌクレオチドは、それぞれ個別に完全に又は部分的に規定され、且つ互いに固定された順序関係にある、パラグラフ1に記載のデアミナーゼドメイン。
3.標的ヌクレオチドは、GC、AC又はCCである、パラグラフ1又は2に記載のデアミナーゼ。
4.2つの部分を含み、
2つの部分が一緒に結合されるときにのみ脱アミノ化が可能である、パラグラフ1~3のいずれか1つに記載のデアミナーゼドメイン。
5.シトシンヌクレオチドを脱アミノ化することができる、パラグラフ1~4のいずれか1つに記載のデアミナーゼドメイン。
6.標的ヌクレオチドは、ACである、パラグラフ1~5のいずれか1つに記載のデアミナーゼドメイン。
7.標的ヌクレオチドは、CCである、パラグラフ1~5のいずれか1つに記載のデアミナーゼドメイン。
8.標的ヌクレオチドは、GCである、パラグラフ1~5のいずれか1つに記載のデアミナーゼドメイン。
9.標的ヌクレオチドは、TCである、パラグラフ1又は4に記載のデアミナーゼドメイン。
10.配列番号1~4、9、11、14~16若しくは40~67のいずれか1つのアミノ酸配列又はその断片若しくは変異体を含む、パラグラフ1~9のいずれか1つに記載のデアミナーゼドメイン。
11.配列番号4のアミノ酸配列又は配列番号4に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有するBE_R1_41を含む、パラグラフ10に記載のデアミナーゼドメイン。
12.配列番号1のアミノ酸配列又は配列番号1に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有するBE_R1_11を含む、パラグラフ11に記載のデアミナーゼドメイン。
13.配列番号2のアミノ酸配列又は配列番号2に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有するBE_R1_12を含む、パラグラフ11に記載のデアミナーゼドメイン。
14.配列番号3のアミノ酸配列又は配列番号3に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有するBE_R1_28を含む、パラグラフ11に記載のデアミナーゼドメイン。
15.パラグラフ1~14のいずれか1つに記載のデアミナーゼドメイン及びターゲティングドメインを含む標的化塩基エディターであって、ターゲティングドメインは、塩基エディター標的配列に特異的に結合する、標的化塩基エディター。
16.ターゲティングドメインは、TALE、BAT、CRISPR-Cas9、Cfp1又はジンクフィンガーを含む、パラグラフ15に記載の標的化塩基エディター。
17.塩基エディター標的配列は、デアミナーゼドメインの標的ヌクレオチド配列の実体の20ヌクレオチド以内の標的核酸中に存在するように選択され、
標的ヌクレオチド配列の実体は、標的化塩基エディターによって塩基編集されるように選択される、パラグラフ15又は16に記載の標的化塩基エディター。
18.標的化塩基エディターによって塩基編集されるように選択される標的ヌクレオチド配列の実体の20ヌクレオチド以内の塩基エディター標的配列は、標的ヌクレオチド配列の任意の実体の20ヌクレオチド以内にある標的核酸中の唯一の塩基エディター標的配列である、パラグラフ17に記載の標的化塩基エディター。
19.標的核酸中の標的ヌクレオチド配列の実体は、標的ヌクレオチド配列の実体の20ヌクレオチド以内の標的核酸中の塩基エディター標的配列の20ヌクレオチド以内のデアミナーゼドメインの標的ヌクレオチド配列の唯一の実体である、パラグラフ17又は18に記載の標的化塩基エディター。
20.塩基エディター標的配列は、ミトコンドリアDNA、又は葉緑体DNA、又は色素体DNA中に存在する、パラグラフ15~19のいずれか1つに記載の標的化塩基エディター。
21.2つの部分を含み、
第1の部分は、第1のスプリットデアミナーゼドメインを含み、第2の部分は、第2のスプリットデアミナーゼドメインを含む、パラグラフ15~20のいずれか1つに記載の標的化塩基エディター。
22.第1の部分は、配列番号122~181のいずれか1つのアミノ酸配列を含むスプリットデアミナーゼドメインを含み、
第2の部分は、配列番号127~181のいずれか1つのアミノ酸配列を含むスプリットデアミナーゼドメインを含み、
第1及び第2のスプリットデアミナーゼドメインは、単独では不活性であるが、一緒に近接されると脱アミノ化が可能である、パラグラフ21に記載の標的化塩基エディター。
23.第1のスプリットデアミナーゼドメインは、配列番号122~126のいずれか1つのアミノ酸配列を含む、パラグラフ21~22のいずれか1つに記載の標的化塩基エディター。
24.第1及び第2のスプリットデアミナーゼドメインの両方は、野生型デアミナーゼドメイン活性部位を含む、パラグラフ21~22のいずれか1つに記載の標的化塩基エディター。
25.第1及び第2のスプリットデアミナーゼドメインは、BE_R1_11の断片又は変異体をそれぞれ含む、パラグラフ21~24のいずれか1つに記載の標的化塩基エディター。
26.第1のスプリットデアミナーゼドメインは、配列番号122、又は127~135、又は150のいずれか1つを含み、
第2のスプリットデアミナーゼドメインは、配列番号127~135又は150のいずれか1つを含む、パラグラフ25に記載の標的化塩基エディター。
27.第1のスプリットデアミナーゼドメインは、配列番号122を含み、
第2のスプリットデアミナーゼドメインは、配列番号127~134又は150のいずれか1つを含む、パラグラフ25に記載の標的化塩基エディター。
28.第1のスプリットデアミナーゼドメインは、配列番号129を含み、
第2のスプリットデアミナーゼドメインは、配列番号150を含む、パラグラフ25に記載の標的化塩基エディター。
29.第1及び第2のスプリットデアミナーゼドメインは、BE_R1_12の断片又は変異体をそれぞれ含む、パラグラフ21~24のいずれか1つに記載の標的化塩基エディター。
30.第1のスプリットデアミナーゼドメインは、配列番号124、又は136~140、又は156~167のいずれか1つを含み、
第2のスプリットデアミナーゼドメインは、配列番号136~140又は156~167のいずれか1つを含む、パラグラフ29に記載の標的化塩基エディター。
31.第1のスプリットデアミナーゼドメインは、配列番号124を含み、第2のスプリットデアミナーゼドメインは、配列番号156~166のいずれか1つを含む、パラグラフ29又は30に記載の標的化塩基エディター。
32.第1のスプリットデアミナーゼドメインは、配列番号137を含み、
第2のスプリットデアミナーゼドメインは、配列番号142を含む、パラグラフ29又は30に記載の標的化塩基エディター。
33.第1のスプリットデアミナーゼドメインは、配列番号139を含み、
第2のスプリットデアミナーゼドメインは、配列番号144を含む、パラグラフ29又は30に記載の標的化塩基エディター。
34.第1及び第2のスプリットデアミナーゼドメインは、BE_R1_41の断片又は変異体をそれぞれ含む、パラグラフ22に記載の標的化塩基エディター。
35.第1のスプリットデアミナーゼドメインは、配列番号168~171のいずれか1つを含み、
第2のスプリットデアミナーゼドメインは、配列番号172~175のいずれか1つを含む、パラグラフ34に記載の標的化塩基エディター。
36.第1のスプリットデアミナーゼドメインは、配列番号168を含み、
第2のスプリットデアミナーゼドメインは、配列番号173を含む、パラグラフ34~35に記載の標的化塩基エディター。
37.第1のスプリットデアミナーゼドメインは、配列番号171を含み、
第2のスプリットデアミナーゼドメインは、配列番号175を含む、パラグラフ34~35に記載の標的化塩基エディター。
38.第1のスプリットデアミナーゼドメインは、配列番号171を含み、
第2のスプリットデアミナーゼドメインは、配列番号173を含む、パラグラフ34に記載の標的化塩基エディター。
39.第1及び第2のスプリットデアミナーゼドメインは、BE_R1_28の断片又は変異体をそれぞれ含む、パラグラフ21~24のいずれか1つに記載の標的化塩基エディター。
40.第1のスプリットデアミナーゼドメインは、配列番号123、又は146~149、又は151~155のいずれか1つを含み、
第2のスプリットデアミナーゼドメインは、配列番号146~149又は151~155のいずれか1つを含む、パラグラフ39に記載の標的化塩基エディター。
41.第1のスプリットデアミナーゼドメインは、配列番号123を含み、
第2のスプリットデアミナーゼドメインは、配列番号149又は151~153のいずれか1つを含む、パラグラフ39又は40に記載の標的化塩基エディター。
42.第1及び第2のスプリットデアミナーゼドメインは、BE_R4_21の断片又は変異体をそれぞれ含む、パラグラフ21~24のいずれか1つに記載の標的化塩基エディター。
43.第1のスプリットデアミナーゼドメインは、配列番号125又は176~177のいずれか1つを含み、
第2のスプリットデアミナーゼドメインは、配列番号176~177のいずれか1つを含む、パラグラフ42に記載の標的化塩基エディター。
44.第1のスプリットデアミナーゼドメインは、配列番号125を含み、
第2のスプリットデアミナーゼドメインは、配列番号177を含む、パラグラフ42に記載の標的化塩基エディター。
45.第1のスプリットデアミナーゼドメインは、配列番号176を含み、
第2のスプリットデアミナーゼドメインは、配列番号177を含む、パラグラフ42に記載の標的化塩基エディター。
46.第1及び第2のスプリットデアミナーゼドメインは、BE_R2_11の断片又は変異体をそれぞれ含む、パラグラフ21~24のいずれか1つに記載の標的化塩基エディター。
47.第1のスプリットデアミナーゼドメインは、配列番号126又は180~181のいずれか1つを含み、
第2のスプリットデアミナーゼドメインは、配列番号180~181のいずれか1つを含む、パラグラフ46に記載の標的化塩基エディター。
48.第1のスプリットデアミナーゼドメインは、配列番号125を含み、
第2のスプリットデアミナーゼドメインは、配列番号180~181のいずれか1つを含む、パラグラフ42に記載の標的化塩基エディター。
49.第1のスプリットデアミナーゼドメインは、配列番号180を含み、
第2のスプリットデアミナーゼドメインは、配列番号181を含む、パラグラフ42に記載の標的化塩基エディター。
50.第1の部分若しくは第2の部分又は第1及び第2の部分の両方は、TALE、BAT、CRISPR-Cas9、Cfp1又はジンクフィンガーからなる群から選択されるプログラマブルDNA結合ドメインを含む、パラグラフ22~49のいずれか1つに記載の標的化塩基エディター。
51.1つのプログラマブルDNA結合ドメインは、左側TALE及び右側TALEからなる群から選択されるTALEである、パラグラフ50に記載の標的化塩基エディター。
52.1つのプログラマブルDNA結合ドメインは、配列番号90、92、95、97~106のいずれか1つのアミノ酸配列を含む左側TALEである、パラグラフ50又は51に記載の標的化塩基エディター。
53.1つのプログラマブルDNA結合ドメインは、配列番号91、93~94、96、108~113のいずれか1つのアミノ酸配列を含む右側TALEである、パラグラフ50~52のいずれか1つに記載の標的化塩基エディター。
54.1つ以上のプログラマブルDNA結合ドメインは、配列番号95~96のいずれか1つを含むアミノ酸配列を有する、ミトコンドリアmND1 DNAに結合するTALEである、パラグラフ50~53のいずれか1つに記載の標的化塩基エディター。
55.1つのプログラマブルDNA結合ドメインは、配列番号96を含むアミノ酸配列を有する、ミトコンドリアmND1 DNAに結合する右側TALEである、パラグラフ50~54のいずれか1つに記載の標的化塩基エディター。
56.1つのプログラマブルDNA結合ドメインは、配列番号95を含むアミノ酸配列を有する、ミトコンドリアhND1 DNAに結合する左側TALEである、パラグラフ54又は55に記載の標的化塩基エディター。
57.1つ以上のプログラマブルDNA結合ドメインは、配列番号99~106又は108~113のいずれか1つを含むアミノ酸配列を有する、ミトコンドリアmCOX1 DNAに結合するTALEである、パラグラフ51に記載の標的化塩基エディター。
58.1つのプログラマブルDNA結合ドメインは、配列番号108~113のいずれか1つを含むアミノ酸配列を有する、ミトコンドリアmCOX1 DNAに結合する右側TALEである、パラグラフ57に記載の標的化塩基エディター。
59.1つのプログラマブルDNA結合ドメインは、配列番号90~106のいずれかを含むアミノ酸配列を有する、ミトコンドリアmCOX1 DNAに結合する左側TALEである、パラグラフ57又は58のいずれか1つに記載の標的化塩基エディター。
60.1つ以上のプログラマブルDNA結合ドメインは、配列番号98を含むアミノ酸配列を有する、h12 DNAに結合するTALEである、パラグラフ50に記載の標的化塩基エディター。
61.1つのプログラマブルDNA結合ドメインは、配列番号114を含むアミノ酸配列を有する、NT(G)N末端ドメインを有するTALEである、パラグラフ50に記載の標的化塩基エディター。
62.1つのプログラマブルDNA結合ドメインは、配列番号115を含むアミノ酸配列を有する、NT(bn)N末端ドメインを有するTALEである、パラグラフ50に記載の標的化塩基エディター。
63.1つ以上のプログラマブルDNA結合ドメインは、配列番号92~94のいずれか1つを含むアミノ酸配列を有する、ミトコンドリアND6 DNAに結合するTALEである、パラグラフ51に記載の標的化塩基エディター。
64.1つのプログラマブルDNA結合ドメインは、配列番号93~94のいずれか1つを含むアミノ酸配列を有する、ミトコンドリアND6 DNAに結合する右側TALEである、パラグラフ63に記載の標的化塩基エディター。
65.1つのプログラマブルDNA結合ドメインは、配列番号92を含むアミノ酸配列を有する、ミトコンドリアmND6 DNAに結合する左側TALEである、パラグラフ63又は64に記載の標的化塩基エディター。
66.1つ以上のプログラマブルDNA結合ドメインは、配列番号90~91のいずれか1つを含むアミノ酸配列を有する、ミトコンドリアhND DNAに結合するTALEである、パラグラフ51に記載の標的化塩基エディター。
67.1つのプログラマブルDNA結合ドメインは、配列番号90を含むアミノ酸配列を有する、ミトコンドリアhND DNAに結合する右側TALEである、パラグラフ66に記載の標的化塩基エディター。
68.1つのプログラマブルDNA結合ドメインは、配列番号91を含むアミノ酸配列を有する、ミトコンドリアhND DNAに結合する左側TALEである、パラグラフ66又は67に記載の標的化塩基エディター。
69.1つのプログラマブルDNA結合ドメインは、配列番号97を含むアミノ酸配列を有する、h11 DNAに結合するTALEである、パラグラフ50に記載の標的化塩基エディター。
70.第1及び第2の部分の一方又は両方は、独立して、ジンクフィンガープログラマブルDNA結合ドメインを含む、パラグラフ50~69のいずれか1つに記載の標的化塩基エディター。
71.1つのプログラマブルDNA結合ドメインは、左側ジンクフィンガー及び右側ジンクフィンガーからなる群から選択されるジンクフィンガーである、パラグラフ50~70のいずれか1つに記載の標的化塩基エディター。
72.1つのプログラマブルDNA結合ドメインは、配列番号82~89のいずれか1つを含むアミノ酸配列を有する、mCOX1 DNAに結合するジンクフィンガーである、パラグラフ50若しくは57又は70~71のいずれか1つに記載の標的化塩基エディター。
73.1つのプログラマブルDNA結合ドメインは、配列番号82~86又は87~89のいずれか1つのアミノ酸配列を有する、mCOX1 DNAに結合する右側ジンクフィンガーである、パラグラフ50又は70~72のいずれか1つに記載の標的化塩基エディター。
74.1つのプログラマブルDNA結合ドメインは、配列番号82~86のいずれか1つを含むアミノ酸配列を有する、mCOX1 DNAに結合する左側ジンクフィンガーである、パラグラフ50又は70~73のいずれか1つに記載の標的化塩基エディター。
75.1つのプログラマブルDNA結合ドメインは、配列番号74~81のいずれか1つを含むアミノ酸配列を有する、hND DNAに結合するジンクフィンガーである、パラグラフ50若しくは66又は70~71のいずれか1つに記載の標的化塩基エディター。
76.1つのプログラマブルDNA結合ドメインは、配列番号78~81のいずれか1つのアミノ酸配列を有する、hND DNAに結合する右側ジンクフィンガーである、パラグラフ50若しくは70又は74~75のいずれか1つに記載の標的化塩基エディター。
77.1つのプログラマブルDNA結合ドメインは、配列番号74~77のいずれか1つを含むアミノ酸配列を有する、hND DNAに結合する左側ジンクフィンガーである、パラグラフ50若しくは70又は74~76のいずれか1つに記載の標的化塩基エディター。
78.第1及び第2の部分の一方又は両方は、独立して、BATプログラマブルDNA結合ドメインを含む、パラグラフ50~77のいずれか1つに記載の標的化塩基エディター。
79.1つのプログラマブルDNA結合ドメインは、左側BAT及び右側BATからなる群から選択されるBATである、パラグラフ50~78のいずれか1つに記載の標的化塩基エディター。
80.1つのプログラマブルDNA結合ドメインは、配列番号118~119のいずれか1つを含むアミノ酸配列を有する、mCOX1 DNAに結合するBATである、パラグラフ50、又は57、又は72のいずれか1つに記載の標的化塩基エディター。
81.1つのプログラマブルDNA結合ドメインは、配列番号119のいずれか1つのアミノ酸配列を有する、mCOX1 DNAに結合する右側BATである、パラグラフ50、又は57、又は70、又は72、又は80のいずれか1つに記載の標的化塩基エディター。
82.1つのプログラマブルDNA結合ドメインは、配列番号118のいずれか1つを含むアミノ酸配列を有する、mCOX1 DNAに結合する左側BATである、パラグラフ50、又は57、又は70、又は72、又は80~81のいずれか1つに記載の標的化塩基エディター。
83.1つのプログラマブルDNA結合ドメインは、配列番号120~121のいずれか1つを含むアミノ酸配列を有する、ND6 DNAに結合するBATである、パラグラフ50、又は70、又は63、又は78~79のいずれか1つに記載の標的化塩基エディター。
84.1つのプログラマブルDNA結合ドメインは、配列番号121のいずれか1つのアミノ酸配列を有する、hND DNAに結合する右側BATである、パラグラフ50、又は70、又は63、又は78~79、又は83のいずれか1つに記載の標的化塩基エディター。
85.1つのプログラマブルDNA結合ドメインは、配列番号120のいずれか1つを含むアミノ酸配列を有する、hND DNAに結合する左側BATである、パラグラフ50、又は70、又は63、又は78~79、又は83~84のいずれか1つに記載の標的化塩基エディター。
86.第1の部分は、
(a)配列番号120のアミノ酸配列を含む第1のスプリットデアミナーゼドメインと、
(b)左側TALEプログラマブルDNA結合ドメインと
を含み;
第2の部分は、
(c)配列番号156、158、160又は164のいずれか1つのアミノ酸配列を含む第2のスプリットデアミナーゼドメインと、
(d)右側TALEプログラマブルDNA結合ドメインと
を含む、パラグラフ21~22のいずれか1つに記載の標的化塩基エディター。
87.第1の部分は、
(a)配列番号169のアミノ酸配列を含む第1のスプリットデアミナーゼドメインと、
(b)左側TALEプログラマブルDNA結合ドメインと
を含み;
第2の部分は、
(c)配列番号173又は175のいずれか1つのアミノ酸配列を含む第2のスプリットデアミナーゼドメインと、
(d)右側TALEプログラマブルDNA結合ドメインと
を含む、パラグラフ21~22のいずれか1つに記載の標的化塩基エディター。
88.第1の部分は、
(a)配列番号171のアミノ酸配列を含む第1のスプリットデアミナーゼドメインと、
(b)左側TALEプログラマブルDNA結合ドメインと
を含み;
第2の部分は、
(c)配列番号175のいずれか1つのアミノ酸配列を含む第2のスプリットデアミナーゼドメインと、
(d)右側TALEプログラマブルDNA結合ドメインと
を含む、パラグラフ21~22のいずれか1つに記載の標的化塩基エディター。
89.第1の部分は、
(a)配列番号169のアミノ酸配列を含む第1のスプリットデアミナーゼドメインと、
(b)左側BATプログラマブルDNA結合ドメインと
を含み;
第2の部分は、
(c)配列番号173又は175のいずれか1つのアミノ酸配列を含む第2のスプリットデアミナーゼドメインと、
(d)右側TALEプログラマブルDNA結合ドメインと
を含む、パラグラフ21~22のいずれか1つに記載の標的化塩基エディター。
90.第1の部分は、
(a)配列番号169のアミノ酸配列を含む第1のスプリットデアミナーゼドメインと、
(b)第1のコイルドコイルドメインと、
(c)任意選択で、左側TALEプログラマブルDNA結合ドメインと
を含み;
第2の部分は、
(d)配列番号173又は175のいずれか1つのアミノ酸配列を含む第2のスプリットデアミナーゼドメインと、
(e)第2のコイルドコイルドメインと、
(f)任意選択で、右側TALEプログラマブルDNA結合ドメインと
を含み、第1及び第2のコイルドコイルドメインは、第1及び第2の部分の結合時に一緒に相互作用する、パラグラフ21~22のいずれか1つに記載の標的化塩基エディター。
91.第1及び第2の部分の一方又は両方は、少なくとも1つのリンカーを含む、パラグラフ22~91のいずれか1つに記載の標的化塩基エディター。
92.第1及び第2の部分の一方又は両方は、少なくとも1つのリンカーを含み、
リンカーは、プログラマブルDNA結合ドメインとスプリットデアミナーゼドメインとの間に位置する、パラグラフ50~90のいずれか1つに記載の標的化塩基エディター。
93.第1及び第2の部分の両方は、プログラマブルDNA結合ドメインとスプリットデアミナーゼドメインとの間にリンカーを含む、パラグラフ92のいずれか1つに記載の標的化塩基エディター。
94.リンカーは、2~200アミノ酸長である、パラグラフ91~93のいずれか1つに記載の標的化塩基エディター。
95.リンカーは、2~16アミノ酸長である、パラグラフ94のいずれか1つに記載の標的化塩基エディター。
96.リンカーは、GS、GSG、GSS又は配列番号23~27若しくは30のいずれかのアミノ酸配列を含む、パラグラフ91~95のいずれか1つに記載の標的化塩基エディター。
97.標的核酸が標的DNA鎖上のプログラマブル結合ドメイン結合部位から9~11塩基対であるように構成される、パラグラフ50~96のいずれか1つに記載の標的化塩基エディター。
98.標的DNA鎖上の2つのプログラマブル結合ドメインの2つの結合部位間の距離は、12~22塩基対である、パラグラフ50~97のいずれか1つに記載の標的化塩基エディター。
99.標的DNA鎖上の2つのプログラマブル結合ドメインの2つの結合部位間の距離は、14~19塩基対である、パラグラフ98に記載の標的化塩基エディター。
100.第1及び第2の部分の少なくとも一方は、細胞ターゲティング部分を含む、パラグラフ22~99のいずれか1つに記載の標的化塩基エディター。
101.第1及び第2の部分の両方は、細胞ターゲティング部分を含む、パラグラフ100に記載の標的化塩基エディター。
102.第1及び第2の部分の両方は、同じ細胞ターゲティング部分を含む、パラグラフ101に記載の標的化塩基エディター。
103.細胞ターゲティング部分は、ミトコンドリアターゲティング配列(MTS)及び核局在化配列(NLS)からなる群から選択される、パラグラフ100~102のいずれか1つに記載の標的化塩基エディター。
104.NLSは、配列番号34~39のいずれか1つのアミノ酸配列を含む、パラグラフ103に記載の標的化塩基エディター。
105.MTSは、配列番号22、69、71、182又は183のいずれか1つのアミノ酸配列を含む、パラグラフ104に記載の標的化塩基エディター。
106.第1及び第2の部分の少なくとも一方は、塩基除去修復阻害剤を含む、パラグラフ22~105のいずれか1つに記載の標的化塩基エディター。
107.塩基除去修復阻害剤は、哺乳類DNAグリコシラーゼ阻害剤である、パラグラフ106に記載の標的化塩基エディター。
108.塩基除去修復阻害剤は、ウラシルグリコシラーゼ阻害剤である、パラグラフ106又は107に記載の標的化塩基エディター。
109.塩基除去修復阻害剤は、配列番号21又は70のいずれか1つを含むアミノ酸配列を有する、パラグラフ106~108のいずれか1つに記載の標的化塩基エディター。
110.標的核酸と、パラグラフ17~109のいずれか1つに記載の標的化塩基エディターとを接触させるステップを含む方法であって、標的核酸は、二本鎖DNAであり、それにより、標的ヌクレオチド配列の実体は、標的化塩基エディターによって脱アミノ化される、方法。
111.標的ヌクレオチド配列中の脱アミノ化ヌクレオチドは、チミン又はグアニンヌクレオチドに変換され、変換は、標的ヌクレオチド配列の塩基編集を完了させる、パラグラフ110に記載の方法。
112.標的核酸は、ミトコンドリアDNAである、パラグラフ110又は111に記載の方法。
113.標的ヌクレオチド配列は、ACである、パラグラフ110~112のいずれか1つに記載の方法。
114.標的ヌクレオチド配列は、CCである、パラグラフ110~112のいずれか1つに記載の方法。
115.標的ヌクレオチド配列は、GCである、パラグラフ110~112のいずれか1つに記載の方法。
116.標的ヌクレオチド配列は、TCである、パラグラフ110~112のいずれか1つに記載の方法。
117.標的ヌクレオチド配列中の最後のCは、標的化塩基エディターによって脱アミノ化される、パラグラフ110~116のいずれか1つに記載の方法。
118.標的DNA中の標的ヌクレオチド配列の実体は、塩基エディター標的配列の20ヌクレオチド以内にある、パラグラフ110~117のいずれか1つに記載の方法。
119.標的核酸は、細胞内にあり、標的核酸と標的化塩基エディターとを接触させるステップは、細胞内への標的化塩基エディターの進入を促進することによって達成される、パラグラフ110~118のいずれか1つに記載の方法。
120.標的核酸は、動物内にあり、標的核酸と標的化塩基エディターとを接触させるステップは、標的化塩基エディターを動物に投与することによって達成される、パラグラフ119に記載の方法。
121.標的核酸と、1つ以上のデアミナーゼドメインとを接触させるステップであって、標的核酸は、二本鎖シトシン-メチル化DNAであり、デアミナーゼドメインは、二本鎖DNAを脱アミノ化することができ、デアミナーゼドメインは、実質的に標的核酸中の非メチル化シトシンヌクレオチドのみを脱アミノ化し、
標的核酸中の非メチル化シトシンヌクレオチドの実質的に全ては、デアミナーゼドメインにより脱アミノ化される、ステップと;
脱アミノ化標的核酸を配列決定するステップであって、それにより、標的核酸中のメチル化シトシンヌクレオチドは、同定される、ステップと
を含む方法。
122.デアミナーゼドメインは、標的核酸中の非メチル化シトシンヌクレオチドの90%以上を脱アミノ化する、パラグラフ121に記載の方法。
123.デアミナーゼドメインと標的核酸の複数のコピーとを、標的核酸の1コピー当たり平均0.1~5.0ヌクレオチドの脱アミノ化をもたらす時間にわたって且つそのような条件下で接触させるステップを含む方法であって、標的核酸は、二本鎖DNAであり、デアミナーゼドメインは、二本鎖DNAを脱アミノ化することができる、方法。
124.標的核酸のコピーは、インビトロである、パラグラフ123に記載の方法。
125.標的核酸のコピー中の脱アミノ化ヌクレオチドは、インビトロ反応を介してチミン又はグアニンヌクレオチドに変換される、パラグラフ124に記載の方法。
126.標的核酸の脱アミノ化コピーを選択手順に付すステップをさらに含む、パラグラフ121~125のいずれか1つに記載の方法。
127.選択手順は、mRNAディスプレイ、リボソームディスプレイ若しくはSELEX又は細胞ベースの選択アッセイを含む、パラグラフ126に記載の方法。
128.標的核酸のコピー中の脱アミノ化ヌクレオチドは、チミン又はグアニンヌクレオチドに変換され、変換は、標的核酸のコピーの一部又は全ての1つ以上の塩基編集を完了させる、パラグラフ125~127のいずれか1つに記載の方法。
129.標的核酸のコピー中の脱アミノ化ヌクレオチドは、細胞内で標的核酸のコピーをインキュベートし、その後、DNA複製/増幅ステップを行うことによってチミン又はグアニンヌクレオチドに変換される、パラグラフ123に記載の方法。
130.標的核酸のコピーは、細胞内にあり、デアミナーゼドメインと標的核酸のコピーとを接触させるステップは、細胞内へのデアミナーゼドメインの進入を促進することによって達成される、パラグラフ123に記載の方法。
131.細胞は、動物内にあり、デアミナーゼドメインと標的核酸のコピーとを接触させるステップは、デアミナーゼドメインを動物に投与することによって達成される、パラグラフ130に記載の方法。
132.標的核酸のコピーは、細胞内にあり、デアミナーゼドメインは、細胞内のトランスジェニック発現構築物によってコードされ、デアミナーゼドメインと標的核酸のコピーとを接触させるステップは、デアミナーゼドメインを細胞内で一過性発現させることによって達成される、パラグラフ130に記載の方法。
133.対象の細胞内のミトコンドリアDNA中の1つ以上の核酸を編集することにより、対象のミトコンドリア遺伝病を治療又は予防する方法であって、
パラグラフ1~110のいずれか1つに記載の標的化シトシンデアミナーゼ塩基エディターを細胞に導入するステップ
を含み、ミトコンドリアDNA中の標的核酸は、標的化塩基エディターによって脱アミノ化される、方法。
134.標的ヌクレオチド配列中の脱アミノ化ヌクレオチドは、チミン又はグアニンヌクレオチドに変換される、パラグラフ133に記載の方法。
135.ミトコンドリアDNA中の1つ以上の核酸は、非病原性形態に編集される、パラグラフ133~134のいずれか1つに記載の方法。
136.脱アミノ化ヌクレオチドは、m.583G>A、m.616T>C、m.1606G>A、m.1644G>A、m.3258T>C、m.3271T>C、m.3460G>A、m.4298G>A、m.5728T>C、m.5650G>A、m.3243A>G、m.8344A>G、m.14459G>A、m.11778G>A、m.14484T>C、m.8993T>C、m.14484T>C、m.3460G>A及びm.1555A>Gから選択される位置にある、パラグラフ133~135のいずれか1つに記載の方法。
137.細胞は、線維芽細胞、リンパ球、膵臓細胞、筋細胞、神経細胞及び幹細胞からなる群から選択される、パラグラフ133~136のいずれか1つに記載の方法。
138.パラグラフ22~110のいずれか1つに記載の標的化塩基エディターを含むか又はそれを発現するベクター。
139.改変アデノウイルス(AAV)ベクター、レンチウイルスベクター又はウイルス様粒子(VLP)である、パラグラフ138に記載のベクター。
140.標的化塩基エディターは、ベクター内に封入される、パラグラフ138又は139に記載のベクター。
141.デアミナーゼドメインは、ベクター内の標的化塩基エディターを含む、パラグラフ120又は129~137のいずれか1つに記載の方法。
142.第1及び第2の部分は、TALE、BAT、CRISPR-Cas9、Cfp1及びジンクフィンガーからなる群から独立して選択されるプログラマブルDNA結合ドメインをそれぞれ含む、パラグラフ22~49のいずれか1つに記載の標的化塩基エディター。
143.第1の部分は、TALEであり、及び第2の部分は、TALEであるか、又は第1の部分は、TALEであり、及び第2の部分は、BATであるか、又は第1の部分は、TALEであり、及び第2の部分は、ジンクフィンガーであるか、又は第1の部分は、TALEであり、及び第2の部分は、CRISPR-Cas9であるか、又は第1の部分は、TALEであり、及び第2の部分は、Cfp1であるか、又は第1の部分は、BATであり、及び第2の部分は、TALEであるか、又は第1の部分は、BATであり、及び第2の部分は、BATであるか、又は第1の部分は、BATであり、及び第2の部分は、ジンクフィンガーであるか、又は第1の部分は、BATであり、及び第2の部分は、CRISPR-Cas9であるか、又は第1の部分は、BATであり、及び第2の部分は、Cfp1であるか、又は第1の部分は、ジンクフィンガーであり、及び第2の部分は、TALEであるか、又は第1の部分は、ジンクフィンガーであり、及び第2の部分は、BATであるか、又は第1の部分は、ジンクフィンガーであり、及び第2の部分は、ジンクフィンガーであるか、又は第1の部分は、ジンクフィンガーであり、及び第2の部分は、CRISPR-Cas9であるか、又は第1の部分は、ジンクフィンガーであり、及び第2の部分は、Cfp1であるか、又は第1の部分は、CRISPR-Cas9であり、及び第2の部分は、TALEであるか、又は第1の部分は、CRISPR-Cas9であり、及び第2の部分は、BATであるか、又は第1の部分は、CRISPR-Cas9であり、及び第2の部分は、ジンクフィンガーであるか、又は第1の部分は、CRISPR-Cas9であり、及び第2の部分は、CRISPR-Cas9であるか、又は第1の部分は、CRISPR-Cas9であり、及び第2の部分は、Cfp1であるか、又は第1の部分は、Cfp1であり、及び第2の部分は、TALEであるか、又は第1の部分は、Cfp1であり、及び第2の部分は、BATであるか、又は第1の部分は、Cfp1であり、及び第2の部分は、ジンクフィンガーであるか、又は第1の部分は、Cfp1であり、及び第2の部分は、CRISPR-Cas9であるか、又は第1の部分は、Cfp1であり、及び第2の部分は、Cfp1である、パラグラフ50/142に記載の標的化塩基エディター。
144.ミトコンドリア中のミトコンドリアDNA又は葉緑体中の葉緑体DNAにおける1つ以上の核酸を編集する方法であって、
パラグラフ1~110のいずれか1つに記載の標的化シトシンデアミナーゼ塩基エディターをミトコンドリア又は葉緑体に導入するステップ
を含み、ミトコンドリア又は葉緑体DNA中の標的核酸は、標的化塩基エディターによって脱アミノ化される、方法。
145.ミトコンドリア又は葉緑体は、インビトロである、パラグラフ144に記載の方法。
146.標的ヌクレオチドは、規定の編集閾値でのデアミナーゼ確率シーケンスロゴによって規定されるコンテキスト特異性をそれぞれ呈示する、パラグラフ1又は2に記載のデアミナーゼドメイン。
本発明は、以下の非限定的な例を参照することによってさらに理解されるであろう。
以下の実施例は、本明細書で特許請求される化合物、組成物、物品、装置及び/又は方法がどのように作製及び評価されるかについての完全な開示及び説明を当業者に提供するために提示されるものであり、これらは、あくまで例示的であることが意図され、本開示を限定することを意図するものではない。
実施例1:ssDNA及び/又はdsDNAに対して活性なシトシンデアミナーゼドメインの生成及び同定
材料及び方法
ゲノミクス及びメタゲノミクスデータベースで利用可能な様々な推定デアミナーゼドメインの体系的な特性決定を実施して、デアミナーゼタンパク質及び塩基エディターの活性を評価した。pfamデータベース(https://pfam.xfam.org/clan/CDA、このデータベースにおけるタンパク質機能は、一般に、計算によりアノテーションが付けられている)で入手可能なシチジンデアミナーゼ様(CDA)クランの各デアミナーゼタンパク質ファミリーからの複数の代表的なドメインを選択した。これらのタンパク質ドメインをコードする配列は、市販の合成リソースを使用して合成され、無細胞インビトロ転写/翻訳システムを使用して発現された。一般に、スクリーニングによって同定されたドメイン/ポリペプチドは、天然タンパク質の一部であるが、単離されたデアミナーゼドメインに対応する配列のみ、GBLOCK(商標)遺伝子断片合成システム(IDT)を用いて合成された。dsDNA特異的デアミナーゼは、ゲノム全体に不要な突然変異を導入する可能性があるため、細胞内で発現すると有毒であることが判明したことから、合成インビトロシステムは、これらの酵素の活性を評価するのに効果的であることがわかった。このシステムは、通常、生細胞という状況下で評価される塩基エディター活性の効率的なインビトロ評価を可能にした。続いて、ssDNA及びdsDNA基質上のデアミナーゼドメインの活性を様々なアッセイ(DNAシーケンシング又は脱アミノ化アッセイ)を用いて評価し、それらの鎖バイアス及び配列特異性を決定した。この方法の概要を図1に示す。
シーケンシングアッセイのために、dsDNAプラスミドを、所定のCDAドメインを発現するインビトロ翻訳反応物に添加し、37℃で2時間インキュベートした。二本鎖DNA基質(プラスミド又はPCRアンプリコン)をインビトロ翻訳(IVT)発現タンパク質と一緒にインキュベートすると、高レベルの脱アミノ化(CからT又はGからA)変異を同定することができるが、これは、PCR増幅(Q5U又はKapa U+ポリメラーゼなどのdU許容ポリメラーゼを用いて)並びにそれに続く増幅DNAのNGSハイスループットシーケンシング又はサンガーシーケンシングによって検出することができる。続いて、サンプルを95℃で短時間加熱することによって反応物を不活性化し、基質をPCR増幅し、配列決定した(NGS又はサンガーシーケンシングのいずれかを用いて)。スクリーニングの追加ラウンド(R2~R4)を、最初のラウンドで活性dsDNA特異的CDA(MafB19及びSCP1201デアミナーゼ)を含むことが判明したサブファミリーで実施し、これにより、追加のdsCDAの同定が達成された。
デアミナーゼアッセイの場合、脱アミノ化のためのUSER(ウラシル特異的切除試薬)酵素ベースのアッセイを使用して、基質に対する様々なデアミナーゼドメインの活性を試験した。このアッセイは、シトシン標的残基の脱アミノ化が標的シトシンのウラシルへの変換をもたらすという原理に基づいて機能する。USER酵素は、ウラシル塩基を切除し、その位置でDNA骨格を切断して、DNA基質を2つのより短い断片にカットする。DNA基質は、一端を色素、例えば、FAM標識で標識することができる。鎖の脱アミノ化、切除及び切断時に基質を電気泳動に付すことができ、基質及びそれから放出された任意の断片を、標識の検出により視覚化することができる。dsDNA基質(A(15)XA(15))が基質として使用され、ここで、Xは、基質として示される配列の1つである(例えば、ACと呼ばれる基質は、[A(15)]AC[A(15)]に対応する)。
様々な状況下でdCを含有するFAM標識ssDNA又はdsDNA基質を使用した。インビトロ翻訳ドメインとのインキュベーション後、USER酵素を添加して、脱アミノ化基質を切断した。基質切断は、変性TBE-尿素ゲル上で反応を実行することによって分析した。
同定されたdsDNA特異的デアミナーゼのコンテキスト特異性をフリーフローティング形態で体系的に決定するために、IVTシステム中の考えられるトリプレットヌクレオチド(NNN)を全てコードする合成基質に対する活性を検査し、それらの活性をイルミナシーケンシングによって読み取った。NGSデータから編集頻度>50%の部位(シチジンに対応する)を同定し、編集したシチジンにフランキングするヌクレオチドを抽出し、各デアミナーゼの編集コンテキストを表すシーケンスロゴを作成した。この実験で使用したdsDNA基質の配列は、以下の通りであった。
Figure 2024502630000114
(配列番号73)
基質には、NGSライブラリー調製のための下流増幅を容易にするために、AT単独のアダプターが付加された。
結果
ssDNA及びdsDNAに対するデアミナーゼドメインの活性を脱アミノ化アッセイによって検出した。最初のスクリーニングでは、55の異なるデアミナーゼをコードする遺伝子をインビトロで発現させ、ssDNA及びdsDNA基質(A(15)ACCGCTCA(15);配列番号39)に対するそれらの活性を決定した(表3)。電気泳動後に観察された切断事象は、表示される基質に対する指定デアミナーゼの活性を示す(図2A~2C)。デアミナーゼBE11(配列番号1)、BE12(配列番号2)、BE28(配列番号3)及びBE41(配列番号4)は、dsDNA及びssDNAの両方に対して活性であったのに対して、BE47(配列番号5)、BE54(配列番号6)、BE55(配列番号7)は、ssDNAに対して活性であったことが観察された(図2A、2C)。
これらの結果に触発されて、上で同定された活性のdsDNA特異的デアミナーゼが属するタンパク質ファミリー(具体的には、MafB19-deam及びSCP1201-deamファミリー)から追加のデアミナーゼドメインをさらにスクリーニングした。第2のスクリーニングでは、デアミナーゼアッセイにより追加のデアミナーゼドメインの活性を決定したが、これらのドメインは、dsDNAに対して高い活性のもの:BE_R2_18(配列番号11)、BE_R2_27、BE_R2_29(配列番号14)、BE_R2_31(配列番号15)及びBE_R2_48(配列番号16);BE_R2_11(配列番号9)、19(配列番号45)、28(配列番号48)を含んだが、BE_R2_7(配列番号8)、BE_R2_17(配列番号10)及びBE_R2_26(配列番号12)は、dsDNAに対してより低い活性を示した(図2B)。これにより、dsDNAに対して活性である追加のデアミナーゼドメインが同定され、これらは、dsDNAに対して高い活性を示した。潜在的なdsDNA特異的デアミナーゼのスクリーニングの追加ラウンドを実施した(ラウンドR3及びR4)。同定されたドメインの生化学的特性評価の結果及び配列の詳細を表3に要約する。
次に、同定されたdsDNA特異的デアミナーゼドメインがある程度の配列特異性を有するかどうかを調べた。デアミナーゼアッセイでは、dsDNA基質(A(15)XA(15))を含む様々なコンテキストでdCを含む異なる基質として使用し、ここで、Xは、基質として示された配列の1つである(例えば、ACと呼ばれる基質は、[A(15)]AC[A(15)]に対応する)。使用したdsDNA基質は、以下を含んだ:
1.AAAAAAAAAAAAAAATGCGCCAAAAAAAAAAAAAAA(配列番号268)
2.AAAAAAAAAAAAAAAACAAAAAAAAAAAAAAA(配列番号269)
3.AAAAAAAAAAAAAAACCAAAAAAAAAAAAAAA(配列番号270)
4.AAAAAAAAAAAAAAAGCAAAAAAAAAAAAAAA(配列番号271)
5.AAAAAAAAAAAAAAATCAAAAAAAAAAAAAAA(配列番号272)
6.AAAAAAAAAAAAAAAACCCCTCAAAAAAAAAAAAAAA(配列番号273)。
唯一の既知のdsDNA特異的デアミナーゼ(dddA、近年記載された細菌毒素由来のデアミナーゼ)を陽性対照として使用した。
異なるデアミナーゼドメインは、様々な基質上で異なるレベルの活性を示し、酵素がある程度の配列特異性を有することを示す(図2D)。これらの結果(図2D)に基づいて、単離されたデアミナーゼに対して以下のような配列特異性又は選好が観察された:
BE_R1_11:TC特異的。それより程度は低いが、AC及びGC特異的
BE_R1_12:AC及びGC特異的。それより程度は低いが、CC特異的
BE_R1_28:TC特異的(コンテキスト特異性は、BE_R1_11及びBE_R1_41よりも厳密である)
BE_R1_41:TC特異的。それより程度は低いが、AC及びCC特異的。
次に、シーケンシングによりDNA脱アミノ化事象をアッセイした。シーケンシングの結果、デアミナーゼは、dsDNAに対して非常に活性が高く、ある程度の配列特異性を有し、これらの酵素は、さまざまなコンテキストでのdCを様々な効率で脱アミノ化することが実証された(図3A~3B)。
NGSデータを使用して、同定されたdsDNA特異的デアミナーゼの配列特異性を決定した。手短には、dsDNAプラスミド基質をインビトロ翻訳デアミナーゼと一緒にインキュベートした。続いて、基質をPCR増幅し、イルミナ(Illumina)アダプターとバーコードを第2ラウンドのPCRで追加した。表示される編集頻度を有するSNP変異体を同定し、各レベルの編集効率(25%又は50%編集部位)についてシーケンス頻度ロゴを決定した(図4A~4B)。これらの結果は、同定されたデアミナーゼが、明確な基質特異性を有し、任意のコンテキスト(NCN)下の任意のシチジンを集合的に編集できることを示している。標的配列の状況に応じて、比較的緩い配列特異性又は厳格な配列特異性を有するデアミナーゼを、同定されたデアミナーゼパネルから選択することができる。
dsDNAに対する活性のために、同定されたデアミナーゼは、それらの活性がある程度含有されない場合、生存細胞で発現したときに毒性となり得る。天然系では、これらのタンパク質の活性は、転写レベル若しくは翻訳レベルにおいて又は特定の細胞コンパートメントへの隔離若しくは阻害タンパク質の共発現によって(毒素-抗毒素系の場合など)含有される。毒性タンパク質を不活性な半分に分割することは、FokI(エンドヌクレアーゼ)及びDddA(DNAデアミナーゼ)などの毒性タンパク質を発現するために以前から使用されている。共発現すると、不活性な半分はタンパク質の活性形態を再形成することができる。2つの半分の局在化を制御することにより、タンパク質の完全に機能する形態が所望のコンパートメント/位置(例えば、所望のDNA配列)のみで再形成され、ゲノムの残りの部分に対する毒性タンパク質のオフターゲット活性が最小化されることを確実にすることができる。
これを念頭に置いて、同定されたデアミナーゼの分割バージョンは、細胞に毒性を付与することなくそれらをインビボ適用に使用するために作製された。同定されたデアミナーゼは、(タンパク質の様々なN末端及びC末端半分を作製するために)それらのコード遺伝子に沿って異なる位置で分割され、(個別の半分として又は相補的な半分が結合されたとき)それらの活性をデアミナーゼアッセイで評価した。図5に示すように、いくつかの分割形態は、それらの相補的な半分(BE11:N3+C3、BE12:N2+C2、BE12:N4+C4)と混合すると活性を示した。
dsDNA活性を有する同定されたシチジンデアミナーゼドメイン(「dsCDA」とも呼ばれる)の配列にわたって比較ゲノミクスを実施した。同定されたデアミナーゼの大部分は、CDAクラン内の2つの主要なファミリー(MafB19及びSCP1201)に属していた。図7Aは、dsCDAに対して活性であるMafB19ファミリーのメンバー、dsDNAに対して不活性であるメンバー並びにMafB19ファミリー全体について同定された配列アラインメントロゴ及びシグネチャモチーフを示す。
特定の保存された残基(即ちシグネチャモチーフ)は、実験により試験したMafB19-deamファミリーのdsDNA特異的CDAに存在したが、このファミリーの不活性メンバーには存在しなかった。これらのシグネチャを使用して、このファミリーの追加メンバー、活性メンバーを予測及び同定することができ、それらは以下を含む:
(M/L)Pモチーフ
T(V/I/L/A)A(R/K/V)モチーフ
(Y/F/W)G(V/H/I/R/K)Nモチーフ
HAE=>活性部位モチーフ
VD(R/K)モチーフ=>dsDNAに対して活性であるMafB19-deamファミリーのほぼ全てのメンバーに存在
CXXCモチーフ=>標準的なCXXC亜鉛結合モチーフ。
同定されたシグネチャモチーフを使用して、このファミリー内の追加のdsDNA特異的デアミナーゼを同定することができる。
MafB19-deamファミリー内で、このファミリーで同定されたdsDNA特異的デアミナーゼの大部分が位置する枝が見出された(図7B)。明瞭な枝がこのファミリーの他のデアミナーゼから分岐している(アラインメントツリールート及び他の枝の大部分からの大きい進化距離により示される)。
SCP1201-deamタンパク質ファミリーについても同様の分析を行った(図8)。実験により試験したSCP1201-deamファミリーのdsDNA特異的CDAに存在する特定のシグネチャモチーフは以下の通りである:
L(P/L)モチーフ;
(Y/F/E/Q)(D/E/N)G(K/R/D)(T/K/N)TXG(V/L/T)(L/M/F)モチーフ;
(P/S/T)(N/G/E/Q)Yモチーフ;
(G/S)HVE(G/A/Q)=>G又はS後、保存された活性部位モチーフ(HVE)、続いて(G/A/Q);
HNNモチーフ(又は程度は低いが、(H/I)(N/D)(N/H));
G(T/I)C(G/P/N/H)(Y/F)Cモチーフ=>G(T/I)後、標準的なCXXC亜鉛結合モチーフ。
Cx(Y/F)Cは、このファミリーのdsDNA特異的デアミナーゼで一般的なモチーフである。BE_R1_28を除いて、このファミリーの全ての活性メンバーは、亜鉛結合モチーフの2つのC残基間に厳密に2つのアミノ酸を有する。このファミリーの不活性メンバーは全て、2つのC残基間に2つ以上のアミノ酸残基を有する。G(T/I)モチーフ後、このファミリーの活性メンバーの亜鉛結合モチーフが位置する。
(T/A)LL(P/E)モチーフ;
L(E/D/R/K)V(V/I)PPモチーフ;及び
G(N/D)XXXPKモチーフ。
同定されたシグネチャモチーフは、各ファミリー内の追加のdsDNA特異的デアミナーゼを同定するために使用することができる。
dsDNA/デアミナーゼ相互作用をさらに特性決定するために、dsDNAに結合したデアミナーゼの予測構造モデルを計算した。
dsDNAにドッキングしたBE12の予測構造は、MafB19-deamファミリーの代表例として計算した。MafB19-deamファミリーのシグネチャ残基に対応する位置を決定した。デアミナーゼは、DNAの副溝及び主溝の両方と相互作用することにより、dsDNAに結合すると思われる。保存された/シグネチャモチーフは、酵素活性部位(HAE)とDNA結合部位の周囲にクラスターを形成する。シグネチャモチーフ(特にVDR及びG(V/H/I/R/K)Nモチーフ)は、デアミナーゼとdsDNAとの相互作用を安定化させると考えられる。VDRモチーフ中のR残基は、dsDNA骨格と直接相互作用することから、突起又は塩基フリップアウト機構のいずれかによって二本鎖DNAの巻戻しに関与し得る)。
dsDNAにドッキングされたBE41の予測構造も、SCP1201-deamファミリーの代表例として計算した。SCP1201-deamファミリーのシグネチャ残基に対応する位置を決定した。デアミナーゼは、DNAの副溝及び主溝の両方と相互作用することによってdsDNAに結合すると思われる。保存された/シグネチャモチーフは、酵素活性部位(HAE)とDNA結合部位の周囲にクラスター形成する。シグネチャモチーフ(特に、(Y/F/E/Q)(D/E/N)G(K/Q/T)(T/K)TXG(V/L/T)(L/M/F)、(P/S/T)(N/G/E/Q)Y、SG及びHNNモチーフは、デアミナーゼとdsDNAとの相互作用を安定化させると思われる)。
Figure 2024502630000115
Figure 2024502630000116
Figure 2024502630000117
実施例2:ミトコンドリアゲノム工学のためのタンパク質単独塩基エディターの作製及び同定
ミトコンドリアゲノムの変異によって引き起こされるミトコンドリア遺伝病は、これらの変異の正確な編集を可能にする技術がないために、現時点で治療不能である深刻なヒト疾患の1クラスである。これらの変異の大部分(確認された93の病原性変異のうちの78)は一点突然変異の形態であり、塩基編集によって修正される可能性はあるが、ミトコンドリアへの核酸送達の効率的な機構がないため、CRISPRに基づくような既存のRNA誘導技術はミトコンドリアによく適用されていない。CRISPR及び編集のためにDNA(例えば、テンプレート)又はRNA(例えば、ガイドRNA)部分に依存する編集システムの使用における主な制約は、これらの部分を、ミトコンドリア二重膜を介してミトコンドリアルーメン中にシャトルするのに使用することができる機構がないことである。RNA誘導システム(CRISPR-Cas9など)を用いてミトコンドリアゲノムの編集に成功したことを主張する報告があるが、それらは依然として議論の的となっており、再現性がない。これらの研究のほとんどで提供されたエビデンスは、編集の直接的な証拠(編集された遺伝子座の配列決定)を示すのではなく、間接的(qPCRなど)なものである。
(主にCRISPR-Cas9のようなRNA誘導タンパク質に依存する)正確なゲノムエディターがない場合、プログラム可能なタンパク質のみのヌクレアーゼ(ミトコンドリアジンクフィンガーヌクレアーゼ(mitoZFN)、ミトコンドリアTALE-ヌクレアーゼ(mitoTALEN)及びミトコンドリア制限酵素(mitoRE))を活用して、細胞培養/患者由来サンプル/動物モデルにおけるミトコンドリアゲノムヘテロプラスミーのレベルをシフトさせた。これらの手法は全て、(スプリット)ヌクレアーゼとプログラマブルDNA結合ドメインの融合に依存する。DNA結合ドメイン(ZF、TALE、RE)は、ミトコンドリアゲノムの変異コピー(WTコピーではない)に高い親和性で結合することができるように設計されるため、ミトコンドリアゲノムの変異コピーに優先的に結合して、それを切断し、このようにして、ヘテロプラスミーを所望の(wt)対立遺伝子にシフトさせる。この手法は、有意なレベルのヘテロプラスミー(wt及び変異対立遺伝子の両方がかなりの量で存在する)を有する疾患にのみ適用可能であり、現在、疾患に対処するのにあまり効果的ではない。
dsDNAに対する活性のために、完全長dsDNA特異的デアミンは、細胞内で発現すると有毒である(ゲノム全域に全体的な突然変異を導入する恐れがある)。毒性を管理するために、近年の研究では、TALEN及びZFN並びに他の毒性ドメインにおけるFokIヌクレアーゼの場合に以前に使用された戦略、即ち毒性タンパク質を2つに分割する戦略が使用された。次に、デアミナーゼの半分を、ミトコンドリアターゲティングペプチド及びUGI(修復機構をブロックする)を付加したTALEドメインにそれぞれ融合させた。
TALENアプローチと同様に、TALE結合部位は標的部位の両側に設計された。それらの標的に結合すると、それらは、2つのデアミナーゼの半分を一緒にして、デアミナーゼ結合部位の近傍のシチジンを脱アミノ化することができる機能性シチジンデアミナーゼを形成する。
しかし、Mokらによって記述されたdsDNA特異的DddAに基づく近年のアプローチの主な制約は、その狭いコンテキスト特異性である。DddAのコンテキスト特異性(Mokらの論文の上方のシーケンスロゴに示されるように、TCコンテキストでのみシチジンを編集することができる)のため、公開された塩基エディターは、ヒトで確認された病原性突然変異の4/93を占めるチミンの前に位置するシチジンのみを編集することができる。
dsDNA特異的デアミナーゼのパネルを活用することにより、あらゆるコンテキスト(NCN:ACN、CCN、GCN、TCN)下のシチジンを高効率で編集することができる一連のタンパク質単独塩基エディターが開発された。さらに、標的領域に対するデアミナーゼの活性ウィンドウの調整を可能にすると共に、インビトロ及びインビボで異なるdsDNA基質(核又はミトコンドリアゲノム)を効率的に操作すると共に、正確に編集するための原理を使用した操作ルールが開発された。ミトコンドリアへのガイドRNAの送達のためのCRISPRに基づく方法の制約並びにdddAに基づくアプローチの限定的なコンテキスト特異性のために、本明細書に記載される塩基エディターは、より広い配列コンテキストにおける塩基編集を可能にすることから、ミトコンドリアゲノム工学適用並びに他の膜性細胞小器官における塩基編集に特に適している。
dsDNA特異的シチジンデアミナーゼをプログラマブルDNA結合ドメインに融合させることによるdsDNAの部位特異的脱アミノ化
遺伝子編集実験は、通常、細胞内で実施されるが、これは、実験のラウンド毎に数日から数週間を要し得る。この時間を短縮し、且つ塩基エディターの使用から生じ得る毒性の問題を回避するために、最初の実験では、インビトロ転写/翻訳(IVT)システム(以前には新規dsDNA特異的デアミナーゼの同定に使用されていた)に基づくインビトロシステムをセットアップして、遺伝子エディターと塩基エディターの性能をインビトロで迅速に検査した(図9)。
手短には、塩基エディターは、デザイナーTALE下流のデアミナーゼドメインをクローニングすることによって作製した。カセット全体をT7プロモーターの下流にクローニングし、IVT反応の鋳型として使用した。(目的のDNA結合ドメイン、例えば、デザイナーTALEに対する結合部位をコードする)標的をプラスミドにクローニングした後、これをIVT反応のdsDNA基質として使用した。IVTシステムで発現すると、塩基エディタータンパク質(例えば、TALEデアミナーゼ融合物)が基質プラスミド上のその標的に結合し、標的プラスミドに編集を導入する。次に、基質プラスミドをPCR増幅し、編集の位置/頻度をシーケンシング又はT7エンドヌクレアーゼアッセイのいずれかによって決定した。
同定されたdsDNA特異的デアミナーゼのサブセットに対するTALE完全長デアミナーゼ融合物の活性を、異なる配列コンテキストを有する異なる基質で試験した。デアミナーゼは、考えられる全てのジヌクレオチドコンテキスト(AC、CC、GC、TC)に対して活性であり、異なる融合物は、異なる基質に対して異なる活性ウィンドウ及び編集効率を示した(図10A~10B)。
興味深いことに、編集ウィンドウ内で10bp周期が観察された。編集は、一部の基質(例えば、ポリC又はポリTC)で他の基質よりも顕著であった。最適な編集ウィンドウは、定期的に発生する(1つの二重らせんターンに対応する10bp周期で)。これは、デアミナーゼが二重らせんの片側にのみアクセスできることを示唆している。周期的ウィンドウは、これらのデアミナーゼの活性が高すぎるか、又はTALEとデアミナーゼコア間のリンカーが柔軟すぎるため、TALE_BE_R1_11及びTALE_BE_R1_12ではあまり顕著ではない。これは、デアミナーゼがDNAの副溝及び主溝の両方と相互作用することを予測する構造予測モデルと一致し、これを支持するものである。TALEと融合すると、デアミナーゼの移動は片側から制限されるため、デアミナーゼは、二重らせんの片側へのアクセスが、反対側よりも良好になる。
DNAに結合したTALE-デアミナーゼ融合の予測モデル(dsDNA特異的CDAの例としてBE_R1_41を使用)を計算した。このモデルは、デアミナーゼが、TALEに融合すると、二重らせんの片側に優先的にアクセスできることを示した。DNAの主溝及び副溝と相互作用するための要件により、これらの実験で観察される活性の約10bp周期ウィンドウが要求される。
スプリット塩基エディター設計
遺伝子編集実験は、通常、細胞内で実施されるが、これは、実験のラウンド毎に数日から数週間を要し得る。この時間を短縮し、且つ塩基エディターの使用から生じ得る毒性の問題を回避するために、最初の実験では、インビトロ転写/翻訳(IVT)システム(以前には新規dsDNA特異的デアミナーゼの同定に使用されていた)に基づくインビトロシステムをセットアップして、遺伝子エディターと塩基エディターの性能をインビトロで迅速に検査した。デザイナーTALE下流のデアミナーゼドメインをクローニングすることにより、半分の塩基エディター(TALE_Left及びTALE_Rightと呼ばれる)を作製した。カセット全体をT7プロモーターの下流にクローニングし、IVT反応の鋳型として使用した。(目的のDNA結合ドメイン、例えば、デザイナーTALEに対する結合部位をコードする)標的をプラスミドにクローニングした後、これをIVT反応のdsDNA基質として使用した。IVTシステムで発現すると、塩基エディタータンパク質(例えば、TALEデアミナーゼ融合物)が基質プラスミド上のその標的に結合し、標的プラスミドに編集を導入する。次に、基質プラスミドをPCR増幅し、シーケンシング又はT7エンドヌクレアーゼアッセイのいずれかによって編集の位置/頻度を決定した。
同定されたデアミナーゼの構造データがない場合、スプリットデアミナーゼタンパク質は、SPELLウェブツールを使用して設計したが、これは、アセンブリ時に機能性タンパク質をもたらす可能性があるタンパク質の位置を予測する。VTシステムで予測されたスプリット半分を共発現した後、脱アミノ化アッセイを行うことによってスプリット形態を試験した。BE_R1_11(N3+C3)及びBE_R1_12(N2+C2及びN4+C4)を含むいくつかの設計では、ある程度の活性が示された(スプリット半分のいずれかを個別に発現させた場合、活性は全く検出されなかった)。しかし、これらのスプリット変異体の活性は、完全長デアミナーゼよりも有意に低く、TALE DNA結合ドメインと融合したとき、標的領域の有意な編集をもたらさなかった(図5)。
MafB19-deamファミリーのスプリットデアミナーゼTALE融合物を生成する最初の試みは、これらのデアミナーゼの活性に対する他の要件の可能性を示唆し、スプリットタンパク質を作製するための代替アプローチを見出す動機付けとなった。スプリットタンパク質の設計に際して、目標は、タンパク質がその位置で2つの半分に分割されると、それらの半分のタンパク質は活性を保持しないが、特定の条件下で2つの半分が一緒になると活性が再形成される、目的のタンパク質内の位置を見出すことである。既存のツールを使用する構造データを持たずにスプリットCDAタンパク質を設計する最初の試みは失敗し、タンパク質の構造に関する予備知識なしに、分割タンパク質を作製するための新規且つより普遍的なアプローチが模索された。従来行われていたようにタンパク質をN-terとC-terの半分に分割するのではなく、完全長タンパク質の不活性(不活性型)コピーを、それ自体では活性を保持しないタンパク質の切断コピーで補完するアプローチを考案した。酵素活性は、酵素の不活性型コピーと酵素の切断コピーが共局在化すると再形成される。共局在化は、例えば、DNA分子上に並置結合部位を有するDNA結合ドメインに2つの部分を融合させることによって達成することができる。
BE_R1_12は、初期研究(完全長デアミナーゼとして発現すると強い活性を示した)のために使用し、この条件付きタンパク質共局在化及び活性化の概念を実証するために、TALE DNA結合ドメインに融合させた。
まず、保存されたグルタミン酸(APOBEC及びAIDなどの既知シチジンデアミナーゼとの相同性に基づいて酵素の活性部位であると予測されるHAEモチーフ中のE残基)をアラニンに変異させることによって「不活性型」(不活性)BE_R1_12(不活性型BE12又はdBE12)タンパク質を作製した。
デアミナーゼの不活性型コピーを、基質プラスミド中の標的領域の左側に結合するTALE_Left(TALE_L)ドメインと融合させた。完全長活性BE_R1_12も、5アミノ酸毎にN-terから順次切断した(切断ドメインは依然としてHAE活性部位を保持していた)。切断ドメインを、結合部位を挟んで標的領域の反対側に結合するTALE_Right(TALE_R)ドメインTALE_Lと融合させた。2つのTALE-デアミナーゼ融合物半分をIVTシステム内で個別に又は結合させて試験した。スプリットタンパク質設計の従来の手法と異なり、この新しい手法は、タンパク質構造に関する情報を必要とせず、単量体形態ではなく二量体形態で活性になる機能性スプリットタンパク質の作製を可能にし得る(図11)。
スプリットTALE-BE_R1_12塩基エディターを、TALE結合部位にフランキングするポリC含有基質を処理しながらインキュベートし、塩基編集の結果をサンガーシーケンシングによって読み取った。TALE_R_切断_BE12融合物及びTALE-不活性型_BE12融合物は、dsDNA polyC含有基質に対して不活性である。しかし、TALE_R_切断_BE12とTALE_L_不活性型_BE12の両方を添加すると、TALE結合部位の近傍でデアミナーゼ活性が再形成され、標的領域のシチジンの効率的な編集を可能にする(図12~13)。TCコンテキストでのみシチジンを効率的に編集できるdddAと異なり、分割BE12塩基エディターは、考えられるあらゆるコンテキスト(AC、CC、GC、TC)を効率的に編集することができるため、コンテキスト非依存性塩基エディターとして機能する。この設計では、活性の最大ウィンドウは、標的領域の中央に向かっている。
実施例3:別の分割塩基エディター構造(1×活性部位ではなく2×デアミナーゼ活性部位を有する高効率スプリット塩基エディターを作製する)
活性部位の1コピーではなく、活性部位の2コピーを標的領域に局在化させ、より高いオンターゲット活性をもたらす、スプリット塩基エディター作製のための別の手法が考案された。これを達成するために、単一の分割部位を用いるのではなく、2つの異なる分割部位をデアミナーゼ活性部位の両側に使用した。分割部位は、個別の断片のいずれも酵素活性を引き起こさないように選択されるが、TALEが標的に結合したとき、上記の部位がTALEと融合して、標的領域に局在化すると、互いに補完し合うことができる。各分割部位の大きい方の断片を使用すると、この手法では、従来の手法の1×ではなく、標的上の活性部位(HVE)の2×コピーを付与することができるため、より高い編集活性をもたらす。
BE41の切断(スプリット)断片
この手法は、BE41(SCP1201-deamファミリーに属するタンパク質及びdddAのホモログであり、それらのタンパク質構造及び分割部位は以前に同定された)のスプリット断片を作製することによって実証された。相同性に基づいて、BE41中の位置G43及びG108が潜在的な分割部位として同定された。次に、N-ter及びC-ter断片をTALE_R及びTALE_L DNA結合ドメインに融合させ、IVTシステム内でそれらを個別に又は組み合わせて(N-ter+C-ter断片)発現させた。TALE結合部位によりフランキングされた16bpのポリCを含むプラスミドを基質として使用した(ポリC基質の標的領域全体の全ての位置が編集され得ることから、標的領域全体の編集活性/効率をより良好に定量化及び視覚化することを可能にする)。興味深いことに、分割部位の位置は、塩基エディターの活性ウィンドウ(編集される標的領域内の位置で、サンガークロマトグラムの上部に赤い曲線で示される)に影響を与えた。C_G43断片を含む組合せに対する活性ウィンドウは、16bp標的領域の6~13位であったが、C_G108断片を使用した場合、活性ウィンドウは、8~15位であった。C_G108対C_G43の組合せにおける活性ウィンドウの2bpsのシフトは、C_G108断片内のC_ter断片の長さが短い(従って柔軟性が低い)ためであると考えられる。この特徴を用いて、このクラスの塩基エディターの活性を調整することができる。この実験は、デアミナーゼ内の分割部位の位置が塩基エディターの活性ウィンドウに影響を与え、このクラスの塩基エディターの活性ウィンドウを調整するために活用できることを示している。デアミナーゼタンパク質のさらに別の分割部位の設計は、必要に応じて塩基エディターの活性ウィンドウをさらに調整するのに役立ち得る(図14)。
BE41_N_G108+BE41_C_43の組合せ(2×活性部位分割設計)
BE41_N_G108+BE41_C_43の組合せ(2×活性部位分割設計)により、BE41_N_G108+BE41_C_G108よりも高い編集効率が得られる。1×活性部位の組合せは、TCコンテキスト及びCCコンテキストに対して活性であるが、AC又はGCコンテキストに対しては活性ではない。2×活性部位を有する設計は、TC及びCCコンテキストに対して比較的活性であり、ACコンテキストに対しても、ある程度活性であり、GCコンテキストでもわずかに活性である。最大活性は活性ウィンドウの中央で観察される。2×活性部位設計の場合、最大活性は、位置9~11(16bp標的領域)で観察され、中心からの距離だけ低下する。1×活性部位設計の最大活性は、位置11~13(16bp標的領域)で観察され、距離だけ低下する。赤い星印は、編集部位の位置を示す。星印に対応する位置におけるピークの相対的高さは、編集効率(順鎖上のCからTへの変換(図示)又はGからAへの変換(逆相補鎖上のCからTへの変換))を示す(図15)。
2×活性部位BE41塩基エディター設計
2×活性部位BE41塩基エディター設計は、1×BE41塩基エディターよりも高い活性を示す。両方のBE41塩基エディター構造が、対応する活性ウィンドウ内にあるCCコンテキスト及びTCコンテキストでの編集に優れている。BE41は、ポリTCコンテキストよりもポリCを選好する。1×活性部位BE41塩基エディターは、ACコンテキストに対して困難を有する。
BE41塩基エディターは、逆鎖上のシチジンを脱アミノ化することができ、PCR増幅後に順鎖上にGからA変異をもたらす。逆鎖上の活性ウィンドウは、順鎖上のウィンドウの反対側にある。
あらゆるコンテキストでシチジンを編集することができるBE12塩基エディターと異なり、BE41塩基エディターは、GCコンテキスト下でのシトシンの編集に困難を有し、程度は低いが、ACコンテキストでも同様である。これらのコンテキストでは、活性の最大ウィンドウに対応する位置で、ある程度の編集が観察される(2×活性部位設計の場合には左側TALEから10bp、1×活性部位設計の場合には左側TALEから12bp離れている)。(図16A~C)。
実施例4:活性の塩基エディターウィンドウ:活性ウィンドウに影響を与える要因とその調整方法
デアミナーゼスプリット半分を交換すると、編集効率に影響するが、活性ウィンドウの位置は大きく変わらないと判定された。標的領域におけるDNAの方向性が重要であることが証明された。
TALE_RightとTALE_Leftとの間でデアミナーゼ半分を交換しても、活性ウィンドウの位置は変わらない。即ち、この特定のデアミナーゼ(BE41)の場合、デアミナーゼスプリット半分の配向とは独立に、標的領域内の順鎖の右側(左側ではない)のシトシンが優先的に編集される。活性ウィンドウに近い方の結合部位(この場合には右のTALE)を有するTALEと、より小さい断片を融合させると、恐らく活性ウィンドウに対する大小の断片のより良好な空間調節のために、より高い効率が得られる。これは、意外な観察結果であるが、デアミナーゼは、DNAの副溝と主溝の両方を介して、dsDNAと相互作用し、結合するという発見によって説明することができる。この結合要件は、脱アミノ化活性に必要であり、塩基エディターの活性ウィンドウを制限する。dsDNAらせんの各ターンは10bpであるため、この実験で使用した16bpの標的領域内では、結合のために、1対の副溝ペアと主溝のみがデアミナーゼにアクセス可能であり、従って、順鎖のターンの半分のみがデアミナーゼ結合要件を満たし、効果的に脱アミノ化される。
スプリット塩基エディターの構造モデリング
計算構造モデルを計算して、再形成されたスプリットTALE-BE41とDNA二重らせんとの結合をモデル化した(図17A)。このモデルは、逆鎖上のシチジンもデアミナーゼにアクセス可能であり、脱アミノ化を受けるはずであると予測し、これは、PolyCの代わりにPolyG基質を使用することにより、正しいと確認された。PolyCの代わりにPolyG基質を用いた場合、標的領域の第1の半分の位置が脱アミノ化され(逆鎖上のCs)、提案されたモデルがさらに確認された(図17B)。
これらの知見は、dsDNA特異的デアミナーゼを利用するこのクラスの塩基エディターが、順鎖及び逆鎖に不斉相を伴う周期的な活性ウィンドウを有することを示唆している。
このモデルによれば、DNAのアクセス可能な側に対するデアミナーゼ活性部位の位置(即ち標的領域内のDNAのアクセス可能な副溝及び主溝)は、活性ウィンドウの位置に影響を与えるであろう。分割部位の位置は、DNAに対する活性部位の相対位置に影響を与える。データは、リンカーの柔軟性及び長さを変更すると、DNAのアクセス可能な側に関して酵素活性部位の位置に影響を与える可能性があり、従って、編集ウィンドウと効率に影響を与え得ることを示した。従って、デアミナーゼの本体自体がリンカーとして作用するため、dsDNAへのデアミナーゼのアクセスしやすさに影響を与える可能性がある。これらの知見は、活性ウィンドウを調整すると共に、このクラスの塩基エディターによるバイスタンダー残基の変異を最小化する上で有用性が高い。
塩基エディターの活性の調整ウィンドウ
計算モデル及びデータに基づくスプリットBE41塩基エディターの活性ウィンドウを(図18)に示す。DNAの各鎖の活性ウィンドウに対応するTALE結合部位及び位置が示される。活性ウィンドウは、デアミナーゼの性質、分割部位の位置、使用されるリンカーの種類などに基づいて変化し得る。しかし、デアミナーゼ結合がDNAの副溝及び主溝との相互作用を必要とする場合、周期的及び非対称的な活性ウィンドウが予想される。
異なるdsCDAを用いて作製された塩基エディターは、所与の基質に対して異なる活性ウィンドウ及び編集効率を示し(図19)、さらに異なるデアミナーゼが異なる活性ウィンドウを有することを示している。
DNA結合ドメイン間の距離の影響
効率的な編集を確実にするためには、DNA結合部位間の最適な距離が必要とされる。スプリットBE41デアミナーゼの場合、この距離は、14~19塩基対である。標的領域(2つのDNA結合部位間の距離)が、<14bpの場合、デアミナーゼは、標的領域によく収って、正しい配向でDNAの副溝及び主溝にアクセスするのに十分なスペースがない。一方、標的領域が、>19bpの場合、恐らく2つのデアミナーゼ間の距離が遠くなりすぎるために、編集効率が低下し、それらの相互作用(従って編集効率)は、dsDNAの分子運動及び他の因子に依存的になる。DNA結合部位間の最適な距離は、2つのデアミナーゼ半分が効率的に相互作用することができる最適距離を表す。この最適距離は、デアミナーゼ及びDNA結合ドメインの性質、それらのドメインを結合するリンカー及びデアミナーゼドメイン内の分割部位の位置によって変動する(図20)。
実施例5:DNA結合ドメイン/リンカーの性質は、活性の塩基エディターウィンドウに影響を与える
モデルをさらに確認するために、TALE DNA結合ドメインを、同じDNA配列にターゲティングさせたBAT DNA結合ドメイン(TALEと同じDNA結合コードを有する近年記載されたTALE様DNA結合ドメイン)で置換した。BATリピートは、TALEと同じRDVコード(A:NI、C:HD、G:NN、T:NG)を使用するが、TALE及びBATのN末端とC末端は異なる。T0ルール(TALE結合部位は、厳密にTで開始しなければならない)に従うTALEと異なり、BAT N末端ドメインは、結合に対してより柔軟であり、BAT結合部位は、4つのヌクレオチドのいずれかによって開始することができる。BATのC末端は、TALEと非相同的であり、より短い(この実験で用いるTALEの41aaに対して、BATaでは30aa)。
TALEドメインの1つを同義のBATで置換すると、活性ウィンドウが短くなり、活性ウィンドウは、TALEドメインの方にシフトした(図27A~B)。活性ウィンドウが短いということは、BAT C-terの柔軟性が低く、且つ/又はその長さが短いため、活性デアミナーゼが、二重らせん上で、より短い期間で再形成されることを示唆している。両TALEドメインを同義のBATで置換すると、恐らくBATの短いC-terドメインが、デアミナーゼ半分の相互作用を可能にするのに十分な長さ/柔軟性ではなかったため、塩基編集活性が完全に無効になった。BAT-TALE対の活性は、HEK293細胞で構築物を発現させ、T7エンドヌクレアーゼアッセイによる編集の結果を評価することによってさらに検証した(図27B)。
この実験では、2つの主要な点を実証した:
i)BAT(及び恐らく他のTALE様タンパク質)は、このクラスの塩基エディターでTALEの代替物として使用することができること;並びに
ii)活性ウィンドウは、デアミナーゼドメインに融合したDNA結合ドメインのタイプに依存し、デアミナーゼ半分とDNA結合ドメインとの間のリンカーの配列/長さを変更することによって調整され得ること。
デアミナーゼドメインのC末端ドメインは、その柔軟性及び長さがデアミナーゼ半分同士及びDNAとの相互作用に寄与するため、リンカーの一部と見なすべきである。この識見は、塩基エディターの活性ウィンドウを調整すると共に、標的領域におけるバイスタンダーC残基の変異を回避するために、ウィンドウの範囲を狭めるのに有用である。
TALE/BAT DNA結合ドメインペアを有するDNA結合部位間の距離の影響
DNA結合ドメインの性質は、塩基エディターの活性ウィンドウに影響を与える。BE41の場合、左及び右DNA結合ドメインの両方としてTALEを使用すれば、効率的な編集で、より広い活性ウィンドウが達成される:
左側TALEを同義のBATドメインで置換すると、より狭い活性ウィンドウで、効率的な編集を達成した;
右側TALEをBATで置換すると、活性ウィンドウが小さくなったが、これは、編集効率が低下するという代償を伴なった。
これらのデータは、DNA結合ドメインの性質(即ちDNA結合ドメイン及びデアミナーゼリンカー、例えばDNA結合ドメインのC-terドメインの性質)が、このクラスの塩基エディターの設計における重要な要素であり、恐らく活性デアミナーゼが効果的に再形成され得る標的領域内の区域を制限することにより、活性ウィンドウ及び編集効率に影響を与えることを示している。この機能は、このクラスの塩基エディターにおける重要な設計要素であり、要件(病原性突然変異の修正など)に基づいて、より広い又はより狭い活性ウィンドウを達成すると共に、編集効率を調節するように調整することができる1つのパラメーターである。編集ウィンドウの調整は、標的領域内のオフターゲット(バイスタンダーC残基)を回避するために重要である。(図21B)
実施例6:デアミナーゼの移動の弛緩による塩基エディターの活性ウィンドウを拡大
DNA結合ドメインによって柔軟性の欠如が起こると、活性デアミナーゼの再形成及びDNA二重らせんへのデアミナーゼのアクセスが制限されるかどうかを評価した。潜在的に、相互作用の弛緩は、DNAへのデアミナーゼのアクセスを促進し、活性ウィンドウを拡張する可能性がある。
この仮説を検証するために、TALE融合物を含むか又は含まないスプリットデアミナーゼの末端に相補的なコイルドコイルドメインを付加し、これらの修飾塩基エディターの活性を検査した。図22に示すように、コイルドコイルの存在下でTALEの1つを置換又は除去すると、活性ウィンドウが拡張されたが、これは、結合したDNA結合ドメインを除去することによってデアミナーゼ半分の1つを弛緩すると、デアミナーゼの活性ウィンドウが、除去されたTALE方向に向かって拡張するのを助け得る(即ち右側TALEを除去すると、活性ウィンドウの右側への拡張を招き、左側TALEを除去すると、活性ウィンドウが左側への拡張を招く)ことを実証するものである。
両方のTALEを同時に除去すると、予想された通り、特異性の喪失により、編集は、検出限界未満まで下降した。これらの結果は、編集ウィンドウが、TALEによってデアミナーゼ半分に課せられた制限により制約されることを実証する。
実施例7:塩基エディターの活性ウィンドウの移動による、オンターゲット活性の調整及びバイスタンダーオフターゲットの最小化
塩基編集により変異を導入する際、多くの場合、標的化C残基の編集効率を最大化しながら、標的領域近傍のバイスタンダーCsの変異を最小化することが望まれる。
Mt-CBE塩基エディターの活性ウィンドウを規定するルールを見出した後、病原性ミトコンドリア変異の修正に対応する変異(C6589からT変換に対応する、マウスミトコンドリアのmCox1 V421A)を設置することができる塩基エディター(バイスタンダーC残基(C6593)のオフターゲット変異を最小化する)を設計した。
この目的のために、1bpシフトを用いて、mCox1標的領域をコードする複数のプラスミド基質を調製した。C6589残基はG残基(GCコンテキスト)の前に位置するため、GCコンテキスト内でシチジンを編集することが以前に実証されているBE12塩基エディターを選択した(注:dddAは、GC含有基質に対して活性がない)。2つの非可変結合部位内の標的領域をスライドさせることにより、異なるDNA配列に結合する新しい塩基エディターの作製を必要とすることなく、塩基エディターの活性ウィンドウ内の標的塩基の位置を評価及び最適化した。図23A~23Bに示すように、C6589の標的編集の最大値は、このC残基が左側TALE結合部位から10bp(二重らせんの1ターンに相当)離れているときに発生するが、これは、上記の塩基エディターアーキテクチャでは、デアミナーゼがこの位置でdsDNAに良好なアクセスを有することを示している。標的残基が両方向で10位から離れると、活性が下降するが、標的残基が右側に移動すると下降が急激になる。C6593の場合にも同様の傾向が観察され、この残基が標的ウィンドウ内の14位を通過すると、脱アミノ化活性は検出限界を下回る。
データ:
i)病原性変異に関連するGCコンテキスト内のC残基の効率的且つ標的化された編集を実証し;
ii)BE12塩基エディターの活性ウィンドウと、その活性ウィンドウを調整する方法を記述すると共に;
iii)病原性C6593変異を編集するための塩基編集アーキテクチャを提供し、標的塩基を左側TALE結合部位から10塩基対離して配置することにより、オフターゲットの最小化をもたらす。
同様の標的スライディングアプローチは、複数のDNA結合ドメイン及び塩基エディターの作製を必要とすることなく、他の塩基エディターの編集効率を最適化し、他の塩基エディターのバイスタンダーオフターゲットを最小化することができる。
概要:塩基エディター設計
塩基エディターの活性ウィンドウ及び編集効率に影響を与える様々なパラメーターは、以下の通りである。
1.DNA結合ドメインの性質
異なるタイプのプログラム可能なdsDNA特異的DNA結合ドメイン(TALE、ZF及びBATを含む)を使用して、これらの塩基エディターを作製する際の特異性を提供できることが証明されている。
DNA結合ドメインの性質は、活性ウィンドウの位置及び範囲に影響を及ぼすことも証明されている。dsDNA特異的デアミナーゼには現在、いくつかの固有の制限があること(例えば、ZFは、全ての可能な標的に対して設計することはできず、TALE及びZF、さらに恐らくBATも、他の標的よりもいくつかの標的に結合するなど)を考慮すると、任意の所与の標的について、塩基エディターの性能を最適化するために、デアミナーゼの性質に関していくつかの最適化が必要となり得る。
2.dsDNA特異的デアミナーゼの性質
使用されるデアミナーゼドメインの性質は、シチジン塩基が編集され得る配列コンテキストに影響を及ぼす。以前公開されたdddAデアミナーゼデータは、dddAデアミナーゼがTCコンテキスト内でのみCsを編集できることを示している(Mok et al.)。
ここに提示されるデータは、様々なコンテキスト内でシチジンを編集することができる様々なデアミナーゼを特性決定する。このデアミナーゼのパネルを集合的に使用して、考えられるあらゆるコンテキスト(AC、CC、GC、TC)でシチジンを編集することができる。所与の標的に対して最大のオンターゲット編集と最小のオフターゲット編集を可能にするデアミナーゼを選択することができる。デアミナーゼの性質は、順鎖又は逆鎖のいずれに対する活性ウィンドウの位置及び区間にも影響を与えることが実証されている。
3.分割部位の位置/性質
データは、分割部位の位置が、順方向と逆方向の両方に対する塩基エディターの活性ウィンドウ(の位置及び範囲)に影響を与えることを示している。異なる分割位置を使用して、デアミナーゼの活性ウィンドウを調整することができる。分割塩基エディターを作製するための2つの設計が考案され、提供される:
i.最初の設計戦略は、デアミナーゼの「不活性型」/不活性な、完全長コピーを一方のDNA結合ドメインと融合させ、DNA結合ドメインの他方のコピーのインタクトな活性部位とデアミナーゼの短縮型コピーを融合させる(概念実証としてBE12を使用した)ステップを含む。デアミナーゼの2つのコピー(不活性型又は短縮型)のいずれも活性ではない(個別に又はDNA結合ドメインへの融合物として)。しかし、それらが標的DNA上で一緒にされると、それらは互いに補完し合い、デアミナーゼ活性を再形成することができる(この一般的な設計は、それらの構造についての知識がなくても、分割バージョンを他の酵素にするためにも使用することができる)。この設計では、酵素の不活性型コピー(不活性化された活性部位を含む)は、酵素の短縮型コピー(機能性活性部位を有するが、1つ以上の必要な構造要素を欠いている)の構造要素を補完する。この手法は、その活性のために二量体化を必要とする分割タンパク質の製造にも使用することができる。
ii.第2の設計戦略は、単一タンパク質の2つの別々の分割部位から得られた、より大きい断片を含む(BE41は、概念実証として使用した)。2つの断片(即ちN及びC末端で切断された重複断片)のいずれも個別に活性ではないが、DNA結合ドメインによってそれらが標的にもたらされると酵素活性を再形成する。この設計では、各断片は、他方の断片に欠けている構造モチーフを補完し、標的上に共局在化された2つの活性部位が存在することから、より高い酵素活性が達成される。
前述した手法(i)及び(ii)は、構造データに依存せず、タンパク質構造へのアクセスなしに適用することができ、それらの活性のために二量体又は多量体形成を必要とする分割タンパク質の製造を可能にし得る。これらは、タンパク質が単一の部位で、重複しないN末端及びC末端に分割される従来の手法とは対照的である。従来の手法でスプリットタンパク質を設計するためには、多くの場合、構造データが必要とされる。さらに重要なことに、タンパク質の1コピーのみを標的に対して有効に再形成することができるため、二量体化又は多量体化を必要とするタンパク質は、従来の手法を用いて分割バージョンにすることができない。
4.リンカーの性質
リンカーの長さ及び性質は、二重らせんに沿ってデアミナーゼ活性を再形成することができるdsDNA上の領域を許可/制限することにより、活性ウィンドウの位置及び範囲に影響を与え得ることが実証されている。
DNA結合ドメイン及びデアミナーゼドメイン中に存在する可能性があり、リンカーに隣接して結合する非必須配列は、リンカーの延長として考慮されるべきであることに留意すべきである。例えば、天然に存在するTALE及びTALE様タンパク質は、それらの結合親和性に影響を与えることなく、それらのC-terドメインにおける切断を許容することができる。DNA結合ドメイン又はデアミナーゼドメインの本体の一部である非必須アミノ酸は、リンカーの延長と見なすべきであり、それらの組成(長さ/柔軟性)は、編集効率及び塩基エディターの活性ウィンドウの調整のために調整することができるパラメーターとして機能し得る。
5.DNA結合ドメイン間の距離
標的領域上の活性ウィンドウの位置に影響を与える別のパラメーターは、DNA結合因子を分離する距離である。最適な活性を達成するために、2つの結合部位間の距離が特定の範囲内にある必要があることが実証されている:距離が短すぎると、恐らくdsDNAへのデアミナーゼ半分が立体的に妨害されるため、最小限の編集が起こるか又は編集が全く起こらず;一方、距離が遠すぎると、デアミナーゼ半分の効率的な濃度が低下し、デアミナーゼ半分の相互作用の効率が低下する。
検証した塩基エディターデザインの場合、活性の最適なウィンドウは、14~20bpであることが判明した。異なるタイプのDNA結合ドメイン/デアミナーゼ/リンカーを使用すると、最適な距離がわずかに異なる可能性がある。この範囲を下回ると、デアミナーゼのdsDNAへのアクセスが立体的に妨害されるため、効率的な編集を達成するには、最低1ターンのdsDNA(10bp)の距離が必要になると考えられる(図24)。
実施例8:Mt-CBE塩基エディターを用いたミトコンドリアゲノムの編集
スプリットBE12塩基エディターの活性を実証するために、ミトコンドリアhND1遺伝子を標的とするTALEスプリットデアミナーゼ融合物をUGI(ミトコンドリアウラシルDNAグリコシラーゼの活性を制限するため)及びGFP(左側TALE融合物の場合)及びmKate(右TALE融合物の場合)と融合させ、構築物をHEK293T細胞株に同時トランスフェクトした。細胞を3日後に回収し、編集結果をT7エンドヌクレアーゼアッセイによって評価した(図25A~25B)。
スプリットBE12対BE41塩基エディターの活性ウィンドウを、HEK293ミトコンドリアのhND1標的の編集について比較した。BE12エディターは、より狭い活性ウィンドウを示すのに対して、BE41エディターは、より効率的な編集及びより広い活性ウィンドウをもたらす。両方の塩基エディターの活性ウィンドウは、インビトロ実験で観察された編集ウィンドウと一致する。BE12エディターの活性ウィンドウが狭いことを考慮すると、このエディターは、バイスタンダーオフターゲット編集の最小化が要望される場合に適している(図26)。
実施例9:代替DNA結合ドメイン(TALE、BAT、ZF)の使用
ジンクフィンガー(ZF)、TALE及びTALE様(BAT)タンパク質を含むいくつかの代替DNA結合因子を、Mt-CBEを用いた塩基編集での使用について評価した。
ジンクフィンガー
ジンクフィンガー(ZF)をDNA結合因子として評価した。各ZFリピートは、TALE及びTALE様タンパク質の場合には1リピート当たり1ヌクレオチドであるのに対して、3ヌクレオチド(トリプレット)を認識する(リピートが少ないほど、細胞中で安定している可能性がある)。ZFは、TALE及びTALE様よりも小さい(2つのZF-BEをベクター内に収めることができる)ため、AAVによる遺伝子送達の候補として適しているが、ZFは、特定の所与の標的に対して設計することはできない(考えられる64のトリプレットヌクレオチドがあるが、それらのうちの約50のみを既存のZFによりターゲティングすることができる)。
TALE及びTALE様タンパク質
TALE及びTALE様タンパク質も評価した。これらは、TALEと同じ二ヌクレオチド結合コードを有する反復DNA/RNA結合ドメイン(その多くは、依然として特徴付けられていない)である:
TALE(T0ルール。天然のN-terドメインを有するTALEは、効率的な結合のために結合部位の先頭にTを必要とする。TALE N-terの変異型は、他のヌクレオチドに対して緩い特異性を有するように進化している);
RipTAL(G0ルール。結合部位の最初の塩基は、Gでなければならない);
BAT(緩い結合。結合部位は、任意のヌクレオチドで開始することができる);
MorTL(同定されたメタゲノム配列);
他の多くの特徴付けられていないTALE様タンパク質がゲノミクスデータベースに存在する;
通常、リピートは、交換可能である(1つ又はいくつかのTALEリピートをTALE様リピートで置換することができ、それらは同じ標的に結合する)。
BAT
BATは、ミトコンドリアで機能性であり、塩基エディターの設計のための代替DNA結合ドメインとして使用することができる。前述のように、BATを使用すると、塩基エディターの活性ウィンドウを調整し、バイスタンダーオフターゲットを最小化することができる。さらに、BATの結合特異性は、TALE及びZFよりも緩い。BATは、結合部位の先頭にTを厳密に必要とするTALEと異なり(T0ルール)、より緩いN末端結合特異性を有し、T0ルールに従わない。
BATの結合部位は、Tだけでなく、任意のヌクレオチドから開始することができる。ジンクフィンガーは、配列のサブセットのみをターゲティングすることができる(全トリプレットヌクレオチドがZFリピートの標的になるわけではない)。BATは、その緩い特異性と、TALEのように単純な同義コードにより、塩基エディターの設計のために注目される代替DNA結合ドメインを提供する。
実施例10:dsDNA塩基編集によりターゲティングすることができる配列の範囲の拡大:TALE N末端、BAT及びZFの操作
塩基エディターを設計する場合、DNA結合部位と標的塩基の近接性が、塩基エディターの活性ウィンドウ内(例えば、16bpの標的領域で左側TALE結合部位から約10bp離れ、右側TALE結合部位から約6bp離れている)内にあるという要件は、DNA結合部位の位置に追加の制約を課す。例えば、BE12塩基エディターで最大の塩基編集を達成するためには、左側結合ドメイン間の距離を9~11bpにすべきである。さらに、ジンクフィンガー及びTALEなどのプログラマブルDNA結合ドメインには、特定の塩基をターゲティングすることを困難にし得るいくつかの固有の制限がある。ZFの場合、約15/64のトリプレットヌクレオチドにはそれらを認識できるZFリピートがないため、配列のサブセットをターゲティングさせることはできない。これらの15ヌクレオチドリピートのいずれかが、潜在的な結合部位の近傍に存在すると、ZFを設計することはできない。一方、T0ルールと、結合部位の最初の数bpの性質を含む他のいくつかの要因は、TALEによる効率的な結合にとって重要であり、所与の標的全てについては満たされない可能性がある要件である。
これらの制限は、m6589C>T変異を導入する塩基エディターを設計する上で課題となった。この標的塩基を取り巻く配列コンテキストを考慮すると、高い結合スコアを提供するZF又はTALEを設計することはできなかった。それでも尚、低スコアのZF及びTALEを用いる一連の塩基エディターを実験的に設計及び検証したが、恐らくDNA結合ドメインの結合親和性が低いために、標的塩基の高い編集効率は観察されなかった。好適なコンテキスト(例えば、天然TALEドメインの場合、標的塩基からの最適な距離にT0が存在する)を欠く標的に対する塩基編集は、2つの並行手法によって達成された:
1)N末端に変異の弛緩を伴うTALEの使用;及び
2)BATの使用。
第1の手法では、N末端に変異の弛緩を有するTALEを用い、T0特異性を緩めて、T以外のヌクレオチドで開始する結合部位のターゲティングを可能にするTALEのN末端変異を事前に同定した(以下の表4を参照されたい)。これらの変異の弛緩をTALEタンパク質に組み込むことで、より高い結合スコアを有するTALEを設計することができ(矢印は、結合部位の位置を示す)、これを標的ヌクレオチドの編集に使用した(図23A~23B)。
Figure 2024502630000118
TALEの代わりにBATを使用する第2の手法では、TALEと異なり、BATは、その標的部位の出発ヌクレオチドに明らかな制限がないことが予備研究で明らかにされた。この緩和された特異性は、それらが標的とすることができるDNA配列の範囲を大幅に拡大する。第2のアプローチとして、比較的高い結合スコアを有するBATを設計し、C6589T変異をインストールすることができた(図27A~27B)。
さらに、本発明者らは、TALEの代わりに、ZFをDNA結合ドメインとして使用できることを実証した(図28)。DNA結合ドメインのタイプを変更すると、塩基エディターの活性ウィンドウが変化するが、これは、DNA結合ドメインとそのC末端がデアミナーゼドメインを制限し得ることをさらに示唆している。この知見を利用して、これらのデアミナーゼの活性ウィンドウを調整し、バイスタンダーオフターゲットを低減することができる。サイズが小さいため、ZFベースのエディターは、AAV送達に魅力的である。
実施例11:ZF結合ドメインを用いた単一のAAV塩基エディター設計
TALEとBATは比較的大きいタンパク質であるため、これらのドメインをDNA結合ドメインとして使用する場合、スプリット塩基エディターの2つの半分の一方のみが単一のアデノ随伴ウイルス(AAV)ベクター内に収まる。これに対して、ZFは比較的小さいDNA結合ドメインであることから、塩基エディターの両半分を単一のAAV内に収めることが可能である(そのLTRリピート間に約4.5kbのカーゴを収容することができる)。
スプリットZF-デアミナーゼの両半分を単一のAAVに収容するための2つの異なる手法を検証した:
1)P2Aペプチド(翻訳スキップを経て、真核生物における同じ転写産物からの複数のタンパク質のポリシストロン発現を可能にする);及び
2)内部開始部位として機能し、哺乳類細胞における転写物のバイシストロン発現を可能にする、内部リボソーム進入部位(IRES)。
複数回の試みにもかかわらず、大腸菌(E.coli)でP2A構築物をクローニングすることは、不可能であり(得られた全てのコロニーには、タンパク質を非機能性にする不活性化変異(フレームシフト又は終止コドン)が含まれていた)、これは、フレーム内スプリットデアミナーゼの基本的/潜在性発現でさえ細胞に有毒であることを示唆している。
この設計では、デアミナーゼのN-ter及びC-terが単一のポリペプチドに翻訳されることから、発現すると、細胞に対して毒性の機能性dsDNA特異的デアミナーゼを自発的に再形成することができる。
これに対して、IRES設計では、2つの分割された半分は、2つの別々のポリペプチド鎖として発現され、それらが結合するDNA結合ドメインによって規定される標的領域の近傍でのみ機能性デアミナーゼを共局在及び再形成することができる(翻訳終結を確実にするためにIRESの前に終止コドン(TAA)がある)。この構築物をクローニングして、配列検証し、哺乳類細胞のミトコンドリアにおけるその活性を確認することができた。IRESベクターをHEK293 AAVpro細胞株(Teknova)を用いてAAV2キャプシドにパッケージングし、ウイルス粒子を使用して、表示されるMOIでHEK293細胞を形質導入した。細胞を2週間後に回収し、hND1遺伝子座の編集をT7エンドヌクレアーゼアッセイによって評価した。(図29A~29B)
実施例12:マウスNIH3T3及びES細胞株におけるミトコンドリアゲノムの編集
マウスNIH3T3細胞株における塩基編集は、NIH3T3細胞におけるmND1遺伝子座を編集することにより実施した。スプリットBE41塩基エディターの半分をコードするベクターは、選択なしで、トランスフェクション又は形質導入(AAV2キャプシド)のいずれかでNIH3T3に送達された。T7エンドヌクレアーゼアッセイを用いて、編集の結果を検出した。編集は、T7エンドヌクレアーゼアッセイによってトランスフェクションされた細胞でのトランスフェクションから5日後に検出された。AAV形質導入の場合、T7エンドヌクレアーゼアッセイにより形質導入の2週間後に編集が検出された。観察されたNIH3T3細胞株への送達効率は<20%であり、これは、大部分が、HEK細胞と比較して比較的低い見かけ編集効率を占める。
マウスNIH3T3細胞株における塩基編集の実証に成功すると、これらの編集のマウスES細胞への導入がさらに実証された。(図30)
マウスES細胞への病原性ND1 E24K変異(m.2820G>A)の導入
実験計画:
ピューロマイシン選択マーカーを有するスプリットデアミナーゼ構築物(TALE-BE-左及びTALE-BE-右ターゲティングマウスND1遺伝子)をエレクトロポレーションによりC57BL/6J胚性幹(ES)細胞に送達した。
形質移入体をピューロマイシンの存在下で1週間にわたって選択した後、クローン集団を採取して、96ウェルプレートの個々のウェルに移し、それらの全DNAを抽出した。
遺伝子特異的プライマーを用いて標的領域を増幅し、イルミナ(Illumina)アダプターを第2ラウンドのPCRによってアンプリコンに添加した。アンプリコンは、イルミナMiSeq(2×100bpペアエンド)によって配列決定した。リードを逆多重化し、ペアリードをマージした後、Geneious Primeの変異/SNP分析モジュールによって分析した。
陰性(GFP処理)対照では、NGSによって検出限界(0.1%)を超える変異は検出されなかった。
塩基エディター構築物で処理した細胞では、オンターゲット編集(m.2820G>A)を有する対立遺伝子が主な変異体(56.43%)を構成した。非常に低いレベル(0.12%)のバイスタンダー変異(m.2817G>A)も検出された。検出限界を超えるインデル(挿入/欠失)は検出されなかった(図31A~31B)。
概要:ゲノム工学適用のための塩基エディター
このデータは、バイスタンダー編集をほとんど伴わずに、コンテキスト特異的編集を可能にするゲノム工学のための頑健なシステムを確立し、これを使用して、ミトコンドリアゲノムと核ゲノムの両方を編集することができる。
ミトコンドリアゲノム編集は、癌、老化及び他の遺伝病で多くの意味を有する。ミトコンドリアゲノムの操作並びに順遺伝学研究の実施を可能にする遺伝子ツールがない場合、ゲノム編集のために記載されたシステムにより、これまで相関研究に限定されていた遺伝病の理解を深めることができる。開示される塩基エディターは、これらの疾患におけるミトコンドリアの作用を明解に見抜くと共に、適切な治療法を開発するために、順遺伝学によるミトコンドリア変異の作用の研究を促進する。
類似の手法を使用して、天然の多様性をマイニングするか、又はdsDNAに対して活性であるアデノシンデアミナーゼ(ADA)を進化させることにより、二本鎖DNA特異的アデノシンデアミナーゼ(dsADA)を開発することができる。このようなdsADAは、dsCDAによるCからT(及びAからG)変異を含むデータで実証されているものと類似するAからG(及びTからC)塩基編集を可能にし得る。塩基編集viadsADAは、対処可能な変異の数を38/93から78/93に増加して、ミトコンドリアのさらに40の病原性変異に対処する可能性がある。
塩基エディターユーティリティは、ミトコンドリア又は核ゲノムに限定されず、細胞の内部及び外部の両方並びに膜性細胞小器官内(例えば、葉緑体及び色素体)内の他のdsDNA部分を編集するために使用することができる。
DNA結合ドメインとしてのRNA誘導ヌクレアーゼ(TALE又はZFに代わり)の使用:核ゲノム工学適用の場合、TALE及びZFの代わりに、RNA誘導タンパク質(例えば、CRISPR-Cas9)をDNA結合タンパク質として使用することができる。dsCDAのコンテキスト特異性は、バイスタンダー変異を制限することができ、これは、デアミナーゼドメインとしてssDNA特異的CDA(例えば、APOBECなど)(既存のCRISPRベースの塩基編集技術で使用されている)を使用するよりも有利となり得る。
動物モデルの作製:ミトコンドリア遺伝病の動物モデルの作製:ミトコンドリアゲノムに正確な編集を導入するための信頼できる技術がないため、ミトコンドリア遺伝病の動物モデルを作製することは不可能ではないにしても非常に困難であった。塩基エディターは、遺伝病の修正を促進するだけでなく、動物モデルの作製にも使用することができる。これにより、これらの遺伝病の順遺伝学研究並びにミトコンドリア生理学、さらにミトコンドリア遺伝子工学技術の不足のために更新が不可能であった遺伝子ヘテロプラスミーの研究が可能となるであろう。
植物(及びそれ自体のゲノムをコードする他の細胞小器官)におけるミトコンドリアと葉緑体の操作:それ自体のゲノム(葉緑体及び他の色素体など)で他の膜性細胞小器官を操作するためのCRISPRの使用は、ミトコンドリアの編集と同じ課題に直面している。タンパク質のみのエディター(dsDNA特異的デアミナーゼに融合したプログラマブルDNA結合ドメインを使用して、これらの細胞小器官ゲノムを編集することができる(例えば、作物を改良するか、又は雄性不稔性のような特定の遺伝病に対してそれらを免疫性にするために)。
代謝障害、癌及び老化又はバイオテクノロジー適用の研究のための機能性遺伝子スクリーニング(例えば、エタノール耐性の操作、又は酵母の好気性発酵の改善、又は作物の改良):ミトコンドリアゲノムを選択的に変異誘発する方法がないため、ミトコンドリアゲノムに機能性遺伝子スクリーニング戦略を適用することは不可能であった。同定されたデアミナーゼを目的の細胞(例えば、哺乳動物細胞、酵母細胞など)のミトコンドリアで一過性に発現させ、それらの細胞のミトコンドリアに遺伝的多様性を導入することができる。次に、これらの細胞を選択圧又は機能的スクリーニングスキーム(例えば、癌マーカー若しくは老化マーカーのより速い増殖若しくは存在又はエタノールに対する耐性について選択する)に供して、それらの疾患又はプロセスに関与する遺伝的変異体を同定することができる。
実施例13:酵素エピジェネティックシーケンシング
異なるdsDNA特異的デアミナーゼ(dsCDA)は、5mC、5hmC、5fC、5caCなどのエピジェネティックマーカーを含むシチジン及びその様々な修飾に対して異なる活性を示すことが証明されている(図32A)。この特徴を利用して、様々なエピジェネティックシチジン修飾を示差的にマーキングすることができ、次にこれをシーケンシング方法により読み取ることができる。
方法
この方法は、バイサルファイトシーケンシングに代わる酵素的方法を提供し、DNAのバイサルファイト処理に関連する欠点及び技術的制限に対処し、それにより、優れた品質の結果の生成を最小化する。
脱アミノ化アッセイ
dsDNA特異的デアミナーゼの活性を、非メチル化及びメチル化シチジン(5mC及び5hmC)に対して脱アミノ化アッセイにより試験した。相補配列にアニーリングした[A15]TC[A15](配列番号272)、[A15]T(5mC)[A15]及び[A15]T(5hmC)[A15]を基質として処理した。
修飾ヌクレオチドに対するdsCDA活性を評価するアッセイ
メチルシチジン(5mC)に対するdsCDAの活性を評価するために、BamH1メチルトランスフェラーゼ(部位特異的MTase)及びCpGメチルトランスフェラーゼ(CpG配列でDNAをメチル化する)を用いて、約1kbのPCR断片をメチル化し、基質として使用した。完全長の単離されたdsDNA特異的デアミナーゼドメイン(dsCDA)をIVTシステムで2時間発現させた。発現したdsCDAを基質と一緒に1時間インキュベートした後、反応中の基質をPCR増幅し、編集頻度をサンガー及びNGSシーケンシングにより評価した(図33A)。
修飾ヌクレオチドに対する様々なdsCDA活性を評価するアッセイ
デアミナーゼアッセイは、GTACACCATCCGTCCC(配列番号274)及びGTGTTCTCTATTTCAC(配列番号274)を含む2つのDNA基質の各々を用いて実施され、各々5caC、5fC、5hmC又は5mCのいずれかを含むように修飾され、それぞれBE_R1_11、BE_R1_28及びBE_R1_41を含む3つのdsDNAデアミナーゼの各々を用いて、24時間にわたり行った。サンプルは、15分、45分、2時間及び24時間のインキュベーション後に配列決定した。
酵素酸化及びグルコシル化
GTACACCATCCGTCCC(配列番号274)及びGTGTTCTCTATTCAC(配列番号275)を含むDNA基質を、TET2酵素を用いた処理により酸化し、BGT酵素を用いた処理によりグルコシル化した後、BE_R1_12又はBE_R1_41デアミナーゼと一緒に1時間又は2時間インキュベートし、脱アミノ化の有効性を評価した。
結果
脱アミノ化アッセイでは、デアミナーゼは、非メチル化シチジン[(m)C]に対してはより活性が高い(図32B)が、メチル化シチジン(5mC及び5hmC)に対しては活性ではない(図32C~D)ことが実証された。
DNA修飾を同定するためのアッセイは、非メチル化dC残基に対して編集効率(CからT変換)が高いことを示し、BamH1メチルトランスフェラーゼ、続いてBE_R1_12で基質を処理したサンプルのNGS結果についての頻度シーケンスロゴに示されるように、dsCDAが非メチル化及びメチル化DNAに異なる作用をすることを示唆している(図33B)。
各DNA基質(配列番号274及び275)を用いたデアミナーゼアッセイの結果をそれぞれBE_R1_11(図34A)、BE_R1_28(図34B)及びBE_R1_41(図34C)について示す。
酸化及びグルコシル化は、GTACACCATTTGTCCC(配列番号276)をもたらしたGTACACCATCCGTCCC(配列番号274)のBE_R1_41による5mCのTへの脱アミノ化及びGTACACCATTTGTCCC(配列番号276)をもたらしたBE_R1_41による5mCのTへの脱アミノ化並びにTET2及びBGTによる酸化及びグルコシル化の非存在下のGTACACCATTTGTTCC(配列番号277)によって示されるように、デアミナーゼ保護を増強した(図36を参照されたい)。
バイサルファイトはDNAに損傷を与え、DNAを断片化する。ssDNAデアミナーゼは、DNA変性を必要とし、それを損傷に曝露する。従って、dsDNAデアミナーゼは、修飾されたシトシンが脱アミノ化されず、シーケンシング中にシトシンとして出現するため、より良い解決策を提供する。未修飾シトシンは脱アミノ化され、シーケンシング中にウラシルとして出現する。
DNAは、バイサルファイト又はdsCDAで処理することにより修飾することができ、続いて、PCR増幅及び配列決定された。
実施例14:DNAにおける多様性の生成
DNAに多様性を導入する方法が確立されている。
方法
目的のdsDNA(例えば、目的のタンパク質をコードする遺伝子)に多様性を生成するために、dsDNAをdsDNA特異的デアミナーゼで処理して、目的の遺伝子の変異体のライブラリーを作製した。次に、ライブラリーを、様々な指向性進化戦略(例えば、リボソームディスプレイなど)又は他の選択/スクリーニングに基づく方法に付す。多様性生成は、インビトロ(例えば、デアミナーゼタンパク質を目的のDNA基質と接触させることによって)又はインビボでデアミナーゼドメインを単離ドメイン又はアドレッシングドメイン(例えば、DNA結合ドメイン、RNAポリメラーゼドメイン、転写因子若しくは他のDNA相互作用ドメイン)との融合物としてのいずれかで導入することにより実施することができる。
代表的な例では、基質DNA:CTAACTTACCATGATTAATTTAAGAATTCTCATCGTCA(配列番号280)に対する1つ以上のデアミナーゼの活性により、3つの異なる脱アミノ化産物:TTAATTTACTATGATTAATTTAAGAATTCTTATTGTTA(配列番号281)、CTAATTTACCATAATTAATTTAAGAATTCTTATCGTTA(配列番号282)及びCTAACTTATCATAATTAATTTAAAAATTCTTATCGTCA(配列番号283)がそれぞれ得られる(図37A~B)。
結果
インビトロ多様性の生成:DNA基質に対するBE_R1_12デアミナーゼのデアミナーゼ活性から生じるPCR断片の頻度シーケンスロゴとNGSリードを図39A~39Bに示し、デアミナーゼ活性二本鎖DNA基質の結果として生成された異なる配列のライブラリー内の異なる位置でのCからT及びGからAの様々な脱アミノ化を示す。手短には、単離されたBE_R1_12をIVTシステムにおいて37℃で2時間発現させ、次に発現したデアミナーゼをdsDNA基質と一緒に1時間インキュベートした。編集/多様化された基質をNGSによって評価した。このアプローチは、目的のDNAの変異体ライブラリーを作製するためのエラープローンPCRに代わるものとして役立ち得る。
インビボ多様性生成アッセイ:完全長デアミナーゼは、インビトロ多様性生成に使用することができる;但し、インビボ適用の場合には毒性を引き起こす恐れがある。この制限を回避するために、分割手法を使用した。BE41(BE41_G108_C)の分割された半分の一方をT7RNAポリメラーゼ(ターゲティングドメインとして機能)に融合させた。他方の半分(BE41_G108_N)は自由浮遊酵素として発現された。T7プロモーターを標的配列の上流に付加し、それをBE41_G108_C-T7融合物及びBE41_G108_Nタンパク質と一緒にインキュベートした(図40)。CRISPRi(即ちgRNA/dCas9)を用いて、標的に対するT7 RNAポリメラーゼの進行を阻止し、T7プロモーターの下流における多様性生成の境界を定めると同時に、標的領域上のデアミナーゼの滞留時間を増加させた。この手法は、目的とする形質の継続的なインビボ進化と細胞バーコーディングのために、生存細胞内の規定領域での効率的な多様性生成のために使用することができる。後者のクラスのデアミナーゼのssDNA基質は一過性に(転写バブル内で)生成され、大部分がポリメラーゼタンパク質と一緒に残留し、従ってデアミナーゼにアクセス不可能であるため、dsDNAに対する開示デアミナーゼの活性は、ssDNA特異的デアミナーゼに基づく前述の適用と比較して上記の適用に有利であろう。
他のDNA相互作用ドメインは、類似の方法でDNAターゲティングドメインとして使用することができる。一部の形態では、同様の手法を使用して、従来のChIP-Seqのハイスループット代替物として、目的のDNA相互作用タンパク質(例えば、転写因子)のゲノム全体の標的部位を同定することができる。この目的のために、dsDNA特異的デアミナーゼドメイン(全長又は分割形態のいずれか)を目的のDNA結合ドメインに融合させ、融合タンパク質を目的の細胞(通常は目的のDNA相互作用タンパク質の天然細胞型)に発現させる。次に、DNA相互作用ドメインのフットプリント(即ち結合部位)は、細胞の全ゲノムを配列決定し、増大した(CからT)変異を有するゲノムのセグメントを探すことによって同定することができる。
インビボアッセイでは、gRNA/dCas9を使用して、標的上のT7ポリメラーゼの進行を阻止し、標的領域(T7プロモーターとgRNA結合部位によって規定される)上のデアミナーゼの滞留時間を増加させ、基質配列の多様性を生じさせた。
開示される方法及び組成物は、これらが変動し得ると記載される特定の方法、プロトコル及び試薬に限定されないことが理解される。本明細書で使用される用語は、あくまで特定の実施形態を説明することを目的とし、添付の特許請求の範囲によってのみ限定される本発明の範囲を限定することを意図しないことも理解されたい。
開示されるのは、開示の方法及び組成物のために使用することができるか、それと一緒に使用することができるか、その調製に使用することができるか、又は開示の方法及び組成物の生成物である材料、組成物及び成分である。これら及び他の材料は、本明細書に開示され、これらの材料の組合せ、サブセット、相互作用、群などが開示されるとき、様々な個別の及び集合的な組合せ及び並び換えの具体的な参照は、明示的に開示されない場合もあるが、各々が本明細書で具体的に企図及び記載されることが理解される。例えば、1ステップが開示され、議論され、そのステップを含む多数の構成要素に加えることができる多数の修正が議論される場合、ステップの全ての組合せ及び並び換え並びに可能な修飾は、特に反対に示されない限り、具体的に企図される。従って、分子A、B及びCのクラス並びに分子D、E及びFのクラス及び組合せ分子の例が開示される場合、A~Dが開示され、その際、各々が個別に列挙されなくても、各々が個別に及び集合的に企図される。従って、この例では、組合せA~E、A~F、B~D、B~E、B~F、C~D、C~E及びC~Fの各々が具体的に企図され、A、B及びC;D、E及びF;並びに例の組合せA~Dの開示から開示されると考慮すべきである。同様に、これらの任意のサブセット又は組合せも具体的に企図され、開示される。従って、例えば、A~E、B~F及びC~Eの亜群が具体的に企図され、A、B及びC;D、E及びF;並びに例の組合せA~Dの開示から開示されると考えるべきである。さらに、前述のように企図及び開示される材料、組成物、成分などは、そのような材料の任意の群、亜群、リスト、セットなどから具体的且つ独立して包含又は除外することもできる。これらの概念は、開示される組成物を作製し、使用するアルゴリズム又は方法のステップを含むが、これらに限定されない本出願の全ての態様に適用される。従って、実施され得る様々な追加ステップがある場合、これらの追加のステップの各々は、開示される方法の任意の特定の実施形態又は実施形態の組合せで実行することができ、そのような組合せの各々が具体的に企図され、開示されると考慮すべきであることが理解される。
本明細書及び添付の特許請求の範囲で使用されるように、単数形「1つの(a)」、「1つの(an)」及び「その」は、文脈から明確に別の解釈が要求されない限り、複数形の参照を含むことに留意しなければならない。
本明細書の記載及び特許請求の範囲全体を通して、「含む(comprise)」という語並びに「含んでいる」及び「含む(comprises)」などの語の変形は、「含むが、限定されない」を意味し、例えば他の添加物、成分、整数又はステップを排除することを意図されない。
「任意選択の」又は「任意選択で」とは、次に説明する事象、状況若しくは材料が発生若しくは存在する可能性があるか、又はそれらが発生若しくは存在しない可能性があることと、説明には、事象、状況又は材料が発生又は存在する実体と、それが発生又は存在しない実体とが含まれることとを意味する。
文脈から明らかに別の解釈が指示されない限り、「することができる」という語の使用は、言及される対象又は条件の選択肢又は能力を示す。一般に、こうした「することができる」の使用は、選択肢又は能力を明確に記述するが、選択肢又は能力が、言及される対象又は条件の他の形態又は実施形態に存在しないことがある可能性も残すことを意味する。文脈から明確に別段の解釈が指示されない限り、「であり得る」という語の使用は、言及される対象又は条件の選択肢又は能力を示す。一般に、こうした「であり得る」の使用は、選択肢又は能力を明確に記述するが、選択肢又は能力が、言及される対象又は条件の他の形態又は実施形態に存在しないことがある可能性も残すことを意味する。文脈から明らかに別の解釈が指示されない限り、本明細書における「であり得る」の使用は、対象又は条件の不明又は疑わしい特徴を指すものではない。
範囲は、本明細書では、「約」1つの特定の値から及び/又は「約」別の特定の値までとして表すことができる。そのような範囲が表現されるとき、文脈から特に別の解釈が指示されない限り、1つの特定の値及び/又は他の特定の値から他の特定の値までの範囲も具体的に企図され、開示されると考えられる。同様に、値が近似として表現されるとき、先行する「約」の使用により、特定の値は、文脈から特に別の解釈が指示されない限り、開示されたと見なされるべき別の具体的に企図される実施形態を形成することが理解されるであろう。さらに、各範囲の終点は、文脈から特に別の解釈が要求されない限り、他の終点と関係して且つ他の終点とは独立しての両方で重要であることが理解されるであろう。明示的に開示された範囲内に含まれる値の個別の値及び値の部分範囲の全ても具体的に企図され、文脈から特に別の解釈が指示されない限り、開示されたと見なされるべきであることを理解されたい。最後に、全ての範囲は、列挙された範囲を範囲として且つ第1の終点から第2の終点までの個々の数の集合として指すことを理解されたい。後者の場合、個々の数のいずれも、範囲が指す量、値又は特徴の1つの形態として選択され得ることを理解されたい。このように、1つの範囲は、その範囲が指す量、値又は特徴として選択することができるその集合の単一メンバー(即ち単一の数)からの第1の終点(それを含む)から第2の終点(それを含む)までの数又は値の集合を表す。上記は、特に、これらの実施形態の一部又は全てが明示的に開示されるか否かにかかわらずに適用される。
他に定義されない限り、本明細書で使用される全ての技術用語及び科学用語は、開示される方法及び組成物が属する技術分野の当業者によって一般的に理解されるのと同じ意味を有する。本明細書に記載のものと類似の又は均等な任意の方法及び材料を本方法及び組成物の実施又は試験に使用することができるが、特に有用な方法、装置及び材料は、記載される通りである。本明細書で引用される刊行物及びそれらが引用される資料は、参照により本明細書に具体的に組み込まれる。本明細書のいかなる内容も、本発明が先行発明によりそのような開示に先行する権利がないことの承認として解釈されるべきではない。参照物が先行技術を構成することを承認するものではない。参考文献の議論は、著者が主張することを記述するものであり、本出願人は、引用された文献の正確性及び妥当性に異議を唱える権利を留保する。多くの刊行物が本明細書で参照されるが、そのような参照物は、これらの文献のいずれも当技術分野で共通の一般的な知識の一部を形成することを認めるものではないことが明確に理解されるであろう。
材料、組成、成分、ステップ、技術などの説明は、多くの選択肢及び代替形態を含み得るが、これは、そのような選択肢及び代替形態が互いに均等であるか又はとりわけ明らかな代替形態であると解釈されるべきではなく、その承認でもない。
本明細書に開示される全ての組成物は、本明細書で具体的に開示されることを意図され、そのように考慮されるべきである。さらに、本開示で特定することができるあらゆる亜群は、本明細書で具体的に開示されることを意図され、そのように考慮されるべきである。結果として、任意の組成物又は組成物の亜群は、使用のために具体的に含まれるか若しくは使用から除外されるか、又は組成物のリストに含まれるか若しくは除外され得ることを特に企図される。例えば、デアミナーゼ又はデアミナーゼドメインの任意の群又は集合としては、バークホルデリア・セノセパシア(Burkholderia cenocepacia)由来のDddA、コンドロマイセス・クロカツス(Chondromyces crocatus)由来のUniprot ID番号:A0A0K1EKV1_CHOCOのデアミナーゼドメイン、バークホルデリア・グルマエ(Burkholderia glumae (BGR1株)由来のUniprot ID番号:C5ALM7_BURGB又はこれらの任意の組合せが挙げられる。
当業者は、本明細書に記載の方法及び組成物の特定の実施形態に対する多くの均等物を認識するか、又は常用的な実験のみを用いて確認することができるであろう。このような均等物は、以下の特許請求の範囲に包含されることが意図される。

Claims (146)

  1. 単離されたデアミナーゼドメインであって、二本鎖DNAを脱アミノ化することができ、標的ヌクレオチド配列を含まない二本鎖DNAに対する前記デアミナーゼドメインのデアミナーゼ活性と比較して、前記標的ヌクレオチド配列を含む二本鎖DNAに対してより大きいデアミナーゼ活性を有し、
    標的ヌクレオチドは、それぞれ個別に完全に又は部分的に規定され、且つ互いに固定された順序関係にあり、
    前記デアミナーゼドメインは、バークホルデリア・セノセパシア(Burkholderia cenocepacia)由来のDddAのデアミナーゼドメインではない、単離されたデアミナーゼドメイン。
  2. 前記標的ヌクレオチド配列は、2つ以上の標的ヌクレオチドを含み、
    前記標的ヌクレオチドは、それぞれ個別に完全に又は部分的に規定され、且つ互いに固定された順序関係にある、請求項1に記載のデアミナーゼドメイン。
  3. 前記標的ヌクレオチドは、GC、AC又はCCである、請求項1又は2に記載のデアミナーゼドメイン。
  4. 2つの部分を含み、
    前記2つの部分が一緒に結合されるときにのみ脱アミノ化が可能である、請求項1~3のいずれか一項に記載のデアミナーゼドメイン。
  5. シトシンヌクレオチドを脱アミノ化することができる、請求項1~4のいずれか一項に記載のデアミナーゼドメイン。
  6. 前記標的ヌクレオチド配列は、ACである、請求項1~5のいずれか一項に記載のデアミナーゼドメイン。
  7. 前記標的ヌクレオチド配列は、CCである、請求項1~5のいずれか一項に記載のデアミナーゼドメイン。
  8. 前記標的ヌクレオチド配列は、GCである、請求項1~5のいずれか一項に記載のデアミナーゼドメイン。
  9. 前記標的ヌクレオチド配列は、TCである、請求項1又は4に記載のデアミナーゼドメイン。
  10. 配列番号1~4、9、11、14~16若しくは40~67のいずれか1つのアミノ酸配列又はその断片若しくは変異体を含む、請求項1~9のいずれか一項に記載のデアミナーゼドメイン。
  11. 配列番号4のアミノ酸配列又は配列番号4に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有するBE_R1_41を含む、請求項10に記載のデアミナーゼドメイン。
  12. 配列番号1のアミノ酸配列又は配列番号1に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有するBE_R1_11を含む、請求項11に記載のデアミナーゼドメイン。
  13. 配列番号2のアミノ酸配列又は配列番号2に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有するBE_R1_12を含む、請求項11に記載のデアミナーゼドメイン。
  14. 配列番号3のアミノ酸配列又は配列番号3に対して少なくとも70%、75%、80%、85%、90%、95%若しくは99%の配列同一性を有するアミノ酸或いはその断片を有するBE_R1_28を含む、請求項11に記載のデアミナーゼドメイン。
  15. 請求項1~14のいずれか一項に記載のデアミナーゼドメイン及びターゲティングドメインを含む標的化塩基エディターであって、前記ターゲティングドメインは、塩基エディター標的配列に特異的に結合する、標的化塩基エディター。
  16. 前記ターゲティングドメインは、TALE、BAT、CRISPR-Cas9、Cfp1又はジンクフィンガーを含む、請求項15に記載の標的化塩基エディター。
  17. 前記塩基エディター標的配列は、前記デアミナーゼドメインの前記標的ヌクレオチド配列の実体の20ヌクレオチド以内の標的核酸中に存在するように選択され、
    前記標的ヌクレオチド配列の前記実体は、前記標的化塩基エディターによって塩基編集されるように選択される、請求項15又は16に記載の標的化塩基エディター。
  18. 前記標的化塩基エディターによって塩基編集されるように選択される前記標的ヌクレオチド配列の前記実体の20ヌクレオチド以内の前記塩基エディター標的配列は、標的ヌクレオチド配列の任意の実体の20ヌクレオチド以内にある前記標的核酸中の唯一の塩基エディター標的配列である、請求項17に記載の標的化塩基エディター。
  19. 前記標的核酸中の前記標的ヌクレオチド配列の前記実体は、前記標的ヌクレオチド配列の前記実体の20ヌクレオチド以内の前記標的核酸中の前記塩基エディター標的配列の20ヌクレオチド以内の前記デアミナーゼドメインの前記標的ヌクレオチド配列の唯一の実体である、請求項17又は18に記載の標的化塩基エディター。
  20. 前記塩基エディター標的配列は、ミトコンドリアDNA、又は葉緑体DNA、又は色素体DNA中に存在する、請求項15~19のいずれか一項に記載の標的化塩基エディター。
  21. 2つの部分を含み、
    第1の部分は、第1のスプリットデアミナーゼドメインを含み、第2の部分は、第2のスプリットデアミナーゼドメインを含む、請求項15~20のいずれか一項に記載の標的化塩基エディター。
  22. 前記第1の部分は、配列番号122~181のいずれか1つのアミノ酸配列を含むスプリットデアミナーゼドメインを含み、
    前記第2の部分は、配列番号127~181のいずれか1つのアミノ酸配列を含むスプリットデアミナーゼドメインを含み、
    前記第1及び第2のスプリットデアミナーゼドメインは、単独では不活性であるが、一緒に近接されると脱アミノ化が可能である、請求項21に記載の標的化塩基エディター。
  23. 前記第1のスプリットデアミナーゼドメインは、配列番号122~126のいずれか1つのアミノ酸配列を含む、請求項21又は22に記載の標的化塩基エディター。
  24. 前記第1及び第2のスプリットデアミナーゼドメインの両方は、野生型デアミナーゼドメイン活性部位を含む、請求項21又は22に記載の標的化塩基エディター。
  25. 前記第1及び第2のスプリットデアミナーゼドメインは、BE_R1_11の断片又は変異体をそれぞれ含む、請求項21~24のいずれか一項に記載の標的化塩基エディター。
  26. 前記第1のスプリットデアミナーゼドメインは、配列番号122、又は127~135、又は150のいずれか1つを含み、
    前記第2のスプリットデアミナーゼドメインは、配列番号127~135又は150のいずれか1つを含む、請求項25に記載の標的化塩基エディター。
  27. 前記第1のスプリットデアミナーゼドメインは、配列番号122を含み、
    前記第2のスプリットデアミナーゼドメインは、配列番号127~134又は150のいずれか1つを含む、請求項25に記載の標的化塩基エディター。
  28. 前記第1のスプリットデアミナーゼドメインは、配列番号129を含み、
    前記第2のスプリットデアミナーゼドメインは、配列番号150を含む、請求項25に記載の標的化塩基エディター。
  29. 前記第1及び第2のスプリットデアミナーゼドメインは、BE_R1_12の断片又は変異体をそれぞれ含む、請求項21~24のいずれか一項に記載の標的化塩基エディター。
  30. 前記第1のスプリットデアミナーゼドメインは、配列番号124、又は136~140、又は156~167のいずれか1つを含み、
    前記第2のスプリットデアミナーゼドメインは、配列番号136~140又は156~167のいずれか1つを含む、請求項29に記載の標的化塩基エディター。
  31. 前記第1のスプリットデアミナーゼドメインは、配列番号124を含み、前記第2のスプリットデアミナーゼドメインは、配列番号156~166のいずれか1つを含む、請求項29又は30に記載の標的化塩基エディター。
  32. 前記第1のスプリットデアミナーゼドメインは、配列番号137を含み、
    前記第2のスプリットデアミナーゼドメインは、配列番号142を含む、請求項29又は30に記載の標的化塩基エディター。
  33. 前記第1のスプリットデアミナーゼドメインは、配列番号139を含み、
    前記第2のスプリットデアミナーゼドメインは、配列番号144を含む、請求項29又は30に記載の標的化塩基エディター。
  34. 前記第1及び第2のスプリットデアミナーゼドメインは、BE_R1_41の断片又は変異体をそれぞれ含む、請求項22に記載の標的化塩基エディター。
  35. 前記第1のスプリットデアミナーゼドメインは、配列番号168~171のいずれか1つを含み、
    前記第2のスプリットデアミナーゼドメインは、配列番号172~175のいずれか1つを含む、請求項34に記載の標的化塩基エディター。
  36. 前記第1のスプリットデアミナーゼドメインは、配列番号168を含み、
    前記第2のスプリットデアミナーゼドメインは、配列番号173を含む、請求項34又は35に記載の標的化塩基エディター。
  37. 前記第1のスプリットデアミナーゼドメインは、配列番号171を含み、
    前記第2のスプリットデアミナーゼドメインは、配列番号175を含む、請求項34又は35に記載の標的化塩基エディター。
  38. 前記第1のスプリットデアミナーゼドメインは、配列番号171を含み、
    前記第2のスプリットデアミナーゼドメインは、配列番号173を含む、請求項34に記載の標的化塩基エディター。
  39. 前記第1及び第2のスプリットデアミナーゼドメインは、BE_R1_28の断片又は変異体をそれぞれ含む、請求項21~24のいずれか一項に記載の標的化塩基エディター。
  40. 前記第1のスプリットデアミナーゼドメインは、配列番号123、又は146~149、又は151~155のいずれか1つを含み、
    前記第2のスプリットデアミナーゼドメインは、配列番号146~149又は151~155のいずれか1つを含む、請求項39に記載の標的化塩基エディター。
  41. 前記第1のスプリットデアミナーゼドメインは、配列番号123を含み、
    前記第2のスプリットデアミナーゼドメインは、配列番号149又は151~153のいずれか1つを含む、請求項39又は40に記載の標的化塩基エディター。
  42. 前記第1及び第2のスプリットデアミナーゼドメインは、BE_R4_21の断片又は変異体をそれぞれ含む、請求項21~24のいずれか一項に記載の標的化塩基エディター。
  43. 前記第1のスプリットデアミナーゼドメインは、配列番号125又は176~177のいずれか1つを含み、
    前記第2のスプリットデアミナーゼドメインは、配列番号176~177のいずれか1つを含む、請求項42に記載の標的化塩基エディター。
  44. 前記第1のスプリットデアミナーゼドメインは、配列番号125を含み、
    前記第2のスプリットデアミナーゼドメインは、配列番号177を含む、請求項42に記載の標的化塩基エディター。
  45. 前記第1のスプリットデアミナーゼドメインは、配列番号176を含み、
    前記第2のスプリットデアミナーゼドメインは、配列番号177を含む、請求項42に記載の標的化塩基エディター。
  46. 前記第1及び第2のスプリットデアミナーゼドメインは、BE_R2_11の断片又は変異体をそれぞれ含む、請求項21~24のいずれか一項に記載の標的化塩基エディター。
  47. 前記第1のスプリットデアミナーゼドメインは、配列番号126又は180~181のいずれか1つを含み、
    前記第2のスプリットデアミナーゼドメインは、配列番号180~181のいずれか1つを含む、請求項46に記載の標的化塩基エディター。
  48. 前記第1のスプリットデアミナーゼドメインは、配列番号125を含み、
    前記第2のスプリットデアミナーゼドメインは、配列番号180~181のいずれか1つを含む、請求項42に記載の標的化塩基エディター。
  49. 前記第1のスプリットデアミナーゼドメインは、配列番号180を含み、
    前記第2のスプリットデアミナーゼドメインは、配列番号181を含む、請求項42に記載の標的化塩基エディター。
  50. 前記第1の部分若しくは前記第2の部分又は前記第1及び第2の部分の両方は、TALE、BAT、CRISPR-Cas9、Cfp1又はジンクフィンガーからなる群から選択されるプログラマブルDNA結合ドメインを含む、請求項22~49のいずれか一項に記載の標的化塩基エディター。
  51. 1つのプログラマブルDNA結合ドメインは、左側TALE及び右側TALEからなる群から選択されるTALEである、請求項50に記載の標的化塩基エディター。
  52. 1つのプログラマブルDNA結合ドメインは、配列番号90、92、95、97~106のいずれか1つのアミノ酸配列を含む左側TALEである、請求項50又は51に記載の標的化塩基エディター。
  53. 1つのプログラマブルDNA結合ドメインは、配列番号91、93~94、96、108~113のいずれか1つのアミノ酸配列を含む右側TALEである、請求項50~52のいずれか一項に記載の標的化塩基エディター。
  54. 1つ以上のプログラマブルDNA結合ドメインは、配列番号95~96のいずれか1つを含むアミノ酸配列を有する、ミトコンドリアmND1 DNAに結合するTALEである、請求項50~53のいずれか一項に記載の標的化塩基エディター。
  55. 1つのプログラマブルDNA結合ドメインは、配列番号96を含むアミノ酸配列を有する、ミトコンドリアmND1 DNAに結合する右側TALEである、請求項50~54のいずれか一項に記載の標的化塩基エディター。
  56. 1つのプログラマブルDNA結合ドメインは、配列番号95を含むアミノ酸配列を有する、ミトコンドリアhND1 DNAに結合する左側TALEである、請求項54又は55に記載の標的化塩基エディター。
  57. 1つ以上のプログラマブルDNA結合ドメインは、配列番号99~106又は108~113のいずれか1つを含むアミノ酸配列を有する、ミトコンドリアmCOX1 DNAに結合するTALEである、請求項51に記載の標的化塩基エディター。
  58. 1つのプログラマブルDNA結合ドメインは、配列番号108~113のいずれか1つを含むアミノ酸配列を有する、ミトコンドリアmCOX1 DNAに結合する右側TALEである、請求項57に記載の標的化塩基エディター。
  59. 1つのプログラマブルDNA結合ドメインは、配列番号90~106のいずれか1つを含むアミノ酸配列を有する、ミトコンドリアmCOX1 DNAに結合する左側TALEである、請求項57又は58に記載の標的化塩基エディター。
  60. 1つ以上のプログラマブルDNA結合ドメインは、配列番号98を含むアミノ酸配列を有する、h12 DNAに結合するTALEである、請求項50に記載の標的化塩基エディター。
  61. 1つのプログラマブルDNA結合ドメインは、配列番号114を含むアミノ酸配列を有する、NT(G)N末端ドメインを有するTALEである、請求項50に記載の標的化塩基エディター。
  62. 1つのプログラマブルDNA結合ドメインは、配列番号115を含むアミノ酸配列を有する、NT(bn)N末端ドメインを有するTALEである、請求項50に記載の標的化塩基エディター。
  63. 1つ以上のプログラマブルDNA結合ドメインは、配列番号92~94のいずれか1つを含むアミノ酸配列を有する、ミトコンドリアND6 DNAに結合するTALEである、請求項51に記載の標的化塩基エディター。
  64. 1つのプログラマブルDNA結合ドメインは、配列番号93~94のいずれか1つを含むアミノ酸配列を有する、ミトコンドリアND6 DNAに結合する右側TALEである、請求項63に記載の標的化塩基エディター。
  65. 1つのプログラマブルDNA結合ドメインは、配列番号92を含むアミノ酸配列を有する、ミトコンドリアmND6 DNAに結合する左側TALEである、請求項63又は64に記載の標的化塩基エディター。
  66. 1つ以上のプログラマブルDNA結合ドメインは、配列番号90~91のいずれか1つを含むアミノ酸配列を有する、ミトコンドリアhND DNAに結合するTALEである、請求項51に記載の標的化塩基エディター。
  67. 1つのプログラマブルDNA結合ドメインは、配列番号90を含むアミノ酸配列を有する、ミトコンドリアhND DNAに結合する右側TALEである、請求項66に記載の標的化塩基エディター。
  68. 1つのプログラマブルDNA結合ドメインは、配列番号91を含むアミノ酸配列を有する、ミトコンドリアhND DNAに結合する左側TALEである、請求項66又は67に記載の標的化塩基エディター。
  69. 1つのプログラマブルDNA結合ドメインは、配列番号97を含むアミノ酸配列を有する、h11 DNAに結合するTALEである、請求項50に記載の標的化塩基エディター。
  70. 前記第1及び第2の部分の一方又は両方は、独立して、ジンクフィンガープログラマブルDNA結合ドメインを含む、請求項50~69のいずれか一項に記載の標的化塩基エディター。
  71. 1つのプログラマブルDNA結合ドメインは、左側ジンクフィンガー及び右側ジンクフィンガーからなる群から選択されるジンクフィンガーである、請求項50~70のいずれか一項に記載の標的化塩基エディター。
  72. 1つのプログラマブルDNA結合ドメインは、配列番号82~89のいずれか1つを含むアミノ酸配列を有する、mCOX1 DNAに結合するジンクフィンガーである、請求項50若しくは57又は70若しくは71のいずれか一項に記載の標的化塩基エディター。
  73. 1つのプログラマブルDNA結合ドメインは、配列番号82~86又は87~89のいずれか1つのアミノ酸配列を有する、mCOX1 DNAに結合する右側ジンクフィンガーである、請求項50又は70~72のいずれか一項に記載の標的化塩基エディター。
  74. 1つのプログラマブルDNA結合ドメインは、配列番号82~86のいずれか1つを含むアミノ酸配列を有する、mCOX1 DNAに結合する左側ジンクフィンガーである、請求項50又は70~73のいずれか一項に記載の標的化塩基エディター。
  75. 1つのプログラマブルDNA結合ドメインは、配列番号74~81のいずれか1つを含むアミノ酸配列を有する、hND DNAに結合するジンクフィンガーである、請求項50若しくは66又は70若しくは71のいずれか一項に記載の標的化塩基エディター。
  76. 1つのプログラマブルDNA結合ドメインは、配列番号78~81のいずれか1つのアミノ酸配列を有する、hND DNAに結合する右側ジンクフィンガーである、請求項50若しくは70又は74若しくは75のいずれか一項に記載の標的化塩基エディター。
  77. 1つのプログラマブルDNA結合ドメインは、配列番号74~77のいずれか1つを含むアミノ酸配列を有する、hND DNAに結合する左側ジンクフィンガーである、請求項50若しくは70又は74~76のいずれか一項に記載の標的化塩基エディター。
  78. 前記第1及び第2の部分の一方又は両方は、独立して、BATプログラマブルDNA結合ドメインを含む、請求項50~77のいずれか一項に記載の標的化塩基エディター。
  79. 1つのプログラマブルDNA結合ドメインは、左側BAT及び右側BATからなる群から選択されるBATである、請求項50~78のいずれか一項に記載の標的化塩基エディター。
  80. 1つのプログラマブルDNA結合ドメインは、配列番号118~119のいずれか1つを含むアミノ酸配列を有する、mCOX1 DNAに結合するBATである、請求項50、又は57、又は72のいずれか一項に記載の標的化塩基エディター。
  81. 1つのプログラマブルDNA結合ドメインは、配列番号119のいずれか1つのアミノ酸配列を有する、mCOX1 DNAに結合する右側BATである、請求項50、又は57、又は70、又は72、又は80のいずれか一項に記載の標的化塩基エディター。
  82. 1つのプログラマブルDNA結合ドメインは、配列番号118のいずれか1つを含むアミノ酸配列を有する、mCOX1 DNAに結合する左側BATである、請求項50、若しくは57、若しくは70、若しくは72又は80若しくは81のいずれか一項に記載の標的化塩基エディター。
  83. 1つのプログラマブルDNA結合ドメインは、配列番号120~121のいずれか1つを含むアミノ酸配列を有する、ND6 DNAに結合するBATである、請求項50、若しくは70、若しくは63又は78若しくは79のいずれか一項に記載の標的化塩基エディター。
  84. 1つのプログラマブルDNA結合ドメインは、配列番号121のいずれか1つのアミノ酸配列を有する、hND DNAに結合する右側BATである、請求項50、又は70、又は63或いは78若しくは79又は83のいずれか一項に記載の標的化塩基エディター。
  85. 1つのプログラマブルDNA結合ドメインは、配列番号120のいずれか1つを含むアミノ酸配列を有する、hND DNAに結合する左側BATである、請求項50、又は70、又は63或いは78若しくは79又は83若しくは84のいずれか一項に記載の標的化塩基エディター。
  86. 前記第1の部分は、
    (a)配列番号120のアミノ酸配列を含む第1のスプリットデアミナーゼドメインと、
    (b)左側TALEプログラマブルDNA結合ドメインと
    を含み;
    前記第2の部分は、
    (c)配列番号156、158、160又は164のいずれか1つのアミノ酸配列を含む第2のスプリットデアミナーゼドメインと、
    (d)右側TALEプログラマブルDNA結合ドメインと
    を含む、請求項21又は22に記載の標的化塩基エディター。
  87. 前記第1の部分は、
    (a)配列番号169のアミノ酸配列を含む第1のスプリットデアミナーゼドメインと、
    (b)左側TALEプログラマブルDNA結合ドメインと
    を含み;
    前記第2の部分は、
    (c)配列番号173又は175のいずれか1つのアミノ酸配列を含む第2のスプリットデアミナーゼドメインと、
    (d)右側TALEプログラマブルDNA結合ドメインと
    を含む、請求項21又は22に記載の標的化塩基エディター。
  88. 前記第1の部分は、
    (a)配列番号171のアミノ酸配列を含む第1のスプリットデアミナーゼドメインと、
    (b)左側TALEプログラマブルDNA結合ドメインと
    を含み;
    前記第2の部分は、
    (c)配列番号175のいずれか1つのアミノ酸配列を含む第2のスプリットデアミナーゼドメインと、
    (d)右側TALEプログラマブルDNA結合ドメインと
    を含む、請求項21又は22に記載の標的化塩基エディター。
  89. 前記第1の部分は、
    (a)配列番号169のアミノ酸配列を含む第1のスプリットデアミナーゼドメインと、
    (b)左側BATプログラマブルDNA結合ドメインと
    を含み;
    前記第2の部分は、
    (c)配列番号173又は175のいずれか1つのアミノ酸配列を含む第2のスプリットデアミナーゼドメインと、
    (d)右側TALEプログラマブルDNA結合ドメインと
    を含む、請求項21又は22に記載の標的化塩基エディター。
  90. 前記第1の部分は、
    (a)配列番号169のアミノ酸配列を含む第1のスプリットデアミナーゼドメインと、
    (b)第1のコイルドコイルドメインと、
    (c)任意選択で、左側TALEプログラマブルDNA結合ドメインと
    を含み;
    前記第2の部分は、
    (d)配列番号173又は175のいずれか1つのアミノ酸配列を含む第2のスプリットデアミナーゼドメインと、
    (e)第2のコイルドコイルドメインと、
    (f)任意選択で、右側TALEプログラマブルDNA結合ドメインと
    を含み、前記第1及び第2のコイルドコイルドメインは、前記第1及び第2の部分の結合時に一緒に相互作用する、請求項21又は22に記載の標的化塩基エディター。
  91. 前記第1及び第2の部分の一方又は両方は、少なくとも1つのリンカーを含む、請求項22~91のいずれか一項に記載の標的化塩基エディター。
  92. 前記第1及び第2の部分の一方又は両方は、少なくとも1つのリンカーを含み、
    前記リンカーは、前記プログラマブルDNA結合ドメインと前記スプリットデアミナーゼドメインとの間に位置する、請求項50~90のいずれか一項に記載の標的化塩基エディター。
  93. 前記第1及び第2の部分の両方は、前記プログラマブルDNA結合ドメインと前記スプリットデアミナーゼドメインとの間にリンカーを含む、請求項92に記載の標的化塩基エディター。
  94. 前記リンカーは、2~200アミノ酸長である、請求項91~93のいずれか一項に記載の標的化塩基エディター。
  95. 前記リンカーは、2~16アミノ酸長である、請求項94に記載の標的化塩基エディター。
  96. 前記リンカーは、GS、GSG、GSS又は配列番号23~27若しくは30のいずれかのアミノ酸配列を含む、請求項91~95のいずれか一項に記載の標的化塩基エディター。
  97. 前記標的核酸が標的DNA鎖上のプログラマブル結合ドメイン結合部位から9~11塩基対であるように構成される、請求項50~96のいずれか一項に記載の標的化塩基エディター。
  98. 標的DNA鎖上の2つのプログラマブル結合ドメインの2つの結合部位間の距離は、12~22塩基対である、請求項50~97のいずれか一項に記載の標的化塩基エディター。
  99. 標的DNA鎖上の2つのプログラマブル結合ドメインの2つの結合部位間の距離は、14~19塩基対である、請求項98に記載の標的化塩基エディター。
  100. 前記第1及び第2の部分の少なくとも一方は、細胞ターゲティング部分を含む、請求項22~99のいずれか一項に記載の標的化塩基エディター。
  101. 前記第1及び第2の部分の両方は、細胞ターゲティング部分を含む、請求項100に記載の標的化塩基エディター。
  102. 前記第1及び第2の部分の両方は、同じ細胞ターゲティング部分を含む、請求項101に記載の標的化塩基エディター。
  103. 細胞ターゲティング部分は、ミトコンドリアターゲティング配列(MTS)及び核局在化配列(NLS)からなる群から選択される、請求項100~102のいずれか一項に記載の標的化塩基エディター。
  104. 前記NLSは、配列番号34~39のいずれか1つのアミノ酸配列を含む、請求項103に記載の標的化塩基エディター。
  105. 前記MTSは、配列番号22、69、71、182又は183のいずれか1つのアミノ酸配列を含む、請求項104に記載の標的化塩基エディター。
  106. 前記第1及び第2の部分の少なくとも一方は、塩基除去修復阻害剤を含む、請求項22~105のいずれか一項に記載の標的化塩基エディター。
  107. 前記塩基除去修復阻害剤は、哺乳類DNAグリコシラーゼ阻害剤である、請求項106に記載の標的化塩基エディター。
  108. 前記塩基除去修復阻害剤は、ウラシルグリコシラーゼ阻害剤である、請求項106又は107に記載の標的化塩基エディター。
  109. 前記塩基除去修復阻害剤は、配列番号21又は70のいずれか1つを含むアミノ酸配列を有する、請求項106~108のいずれか一項に記載の標的化塩基エディター。
  110. 標的核酸と、請求項17~109のいずれか一項に記載の標的化塩基エディターとを接触させるステップを含む方法であって、前記標的核酸は、二本鎖DNAであり、それにより、前記標的ヌクレオチド配列の前記実体は、前記標的化塩基エディターによって脱アミノ化される、方法。
  111. 前記標的ヌクレオチド配列中の前記脱アミノ化ヌクレオチドは、チミン又はグアニンヌクレオチドに変換され、前記変換は、前記標的ヌクレオチド配列の塩基編集を完了させる、請求項110に記載の方法。
  112. 前記標的核酸は、ミトコンドリアDNAである、請求項110又は111に記載の方法。
  113. 前記標的ヌクレオチド配列は、ACである、請求項110~112のいずれか一項に記載の方法。
  114. 前記標的ヌクレオチド配列は、CCである、請求項110~112のいずれか一項に記載の方法。
  115. 前記標的ヌクレオチド配列は、GCである、請求項110~112のいずれか一項に記載の方法。
  116. 前記標的ヌクレオチド配列は、TCである、請求項110~112のいずれか一項に記載の方法。
  117. 前記標的ヌクレオチド配列中の最後のCは、前記標的化塩基エディターによって脱アミノ化される、請求項110~116のいずれか一項に記載の方法。
  118. 前記標的DNA中の前記標的ヌクレオチド配列の前記実体は、前記塩基エディター標的配列の20ヌクレオチド以内にある、請求項110~117のいずれか一項に記載の方法。
  119. 前記標的核酸は、細胞内にあり、前記標的核酸と前記標的化塩基エディターとを接触させるステップは、前記細胞内への前記標的化塩基エディターの進入を促進することによって達成される、請求項110~118のいずれか一項に記載の方法。
  120. 前記細胞は、動物内にあり、前記標的核酸と前記標的化塩基エディターとを接触させるステップは、前記標的化塩基エディターを前記動物に投与することによって達成される、請求項119に記載の方法。
  121. 標的核酸と、1つ以上のデアミナーゼドメインとを接触させるステップであって、前記標的核酸は、二本鎖シトシン-メチル化DNAであり、前記デアミナーゼドメインは、二本鎖DNAを脱アミノ化することができ、前記デアミナーゼドメインは、実質的に前記標的核酸中の非メチル化シトシンヌクレオチドのみを脱アミノ化し、
    前記標的核酸中の前記非メチル化シトシンヌクレオチドの実質的に全ては、前記デアミナーゼドメインによって脱アミノ化される、ステップと;
    前記脱アミノ化標的核酸を配列決定するステップであって、それにより、前記標的核酸中のメチル化シトシンヌクレオチドは、同定される、ステップと
    を含む方法。
  122. 前記デアミナーゼドメインは、前記標的核酸中の前記非メチル化シトシンヌクレオチドの90%以上を脱アミノ化する、請求項121に記載の方法。
  123. デアミナーゼドメインと標的核酸の複数のコピーとを、前記標的核酸の1コピー当たり平均0.1~5.0ヌクレオチドの脱アミノ化をもたらす時間にわたって且つそのような条件下で接触させるステップを含む方法であって、前記標的核酸は、二本鎖DNAであり、前記デアミナーゼドメインは、二本鎖DNAを脱アミノ化することができる、方法。
  124. 前記標的核酸の前記コピーは、インビトロである、請求項123に記載の方法。
  125. 前記標的核酸の前記コピー中の前記脱アミノ化ヌクレオチドは、インビトロ反応を介してチミン又はグアニンヌクレオチドに変換される、請求項124に記載の方法。
  126. 前記標的核酸の前記脱アミノ化コピーを選択手順に付すステップをさらに含む、請求項121~125のいずれか一項に記載の方法。
  127. 前記選択手順は、mRNAディスプレイ、リボソームディスプレイ若しくはSELEX又は細胞ベースの選択アッセイを含む、請求項126に記載の方法。
  128. 前記標的核酸の前記コピー中の前記脱アミノ化ヌクレオチドは、チミン又はグアニンヌクレオチドに変換され、前記変換は、標的核酸の前記コピーの一部又は全ての1つ以上の塩基編集を完了させる、請求項125~127のいずれか一項に記載の方法。
  129. 前記標的核酸の前記コピー中の前記脱アミノ化ヌクレオチドは、細胞内で前記標的核酸の前記コピーをインキュベートし、その後、DNA複製/増幅ステップを行うことによってチミン又はグアニンヌクレオチドに変換される、請求項123に記載の方法。
  130. 前記標的核酸の前記コピーは、細胞内にあり、前記デアミナーゼドメインと標的核酸の前記コピーとを接触させるステップは、前記細胞内への前記デアミナーゼドメインの進入を促進することによって達成される、請求項123に記載の方法。
  131. 前記細胞は、動物内にあり、前記デアミナーゼドメインと標的核酸の前記コピーとを接触させるステップは、前記デアミナーゼドメインを前記動物に投与することによって達成される、請求項130に記載の方法。
  132. 前記標的核酸の前記コピーは、細胞内にあり、前記デアミナーゼドメインは、前記細胞内のトランスジェニック発現構築物によってコードされ、前記デアミナーゼドメインと標的核酸の前記コピーとを接触させるステップは、前記デアミナーゼドメインを前記細胞内で一過性発現させることによって達成される、請求項130に記載の方法。
  133. 対象の細胞内のミトコンドリアDNA中の1つ以上の核酸を編集することにより、前記対象のミトコンドリア遺伝病を治療又は予防する方法であって、
    請求項1~110のいずれか一項に記載の標的化シトシンデアミナーゼ塩基エディターを前記細胞に導入するステップ
    を含み、ミトコンドリアDNA中の標的核酸は、前記標的化塩基エディターによって脱アミノ化される、方法。
  134. 前記標的ヌクレオチド配列中の前記脱アミノ化ヌクレオチドは、チミン又はグアニンヌクレオチドに変換される、請求項133に記載の方法。
  135. 前記ミトコンドリアDNA中の1つ以上の核酸は、非病原性形態に編集される、請求項133又は134に記載の方法。
  136. 前記脱アミノ化ヌクレオチドは、m.583G>A、m.616T>C、m.1606G>A、m.1644G>A、m.3258T>C、m.3271T>C、m.3460G>A、m.4298G>A、m.5728T>C、m.5650G>A、m.3243A>G、m.8344A>G、m.14459G>A、m.11778G>A、m.14484T>C、m.8993T>C、m.14484T>C、m.3460G>A及びm.1555A>Gから選択される位置にある、請求項133~135のいずれか一項に記載の方法。
  137. 前記細胞は、線維芽細胞、リンパ球、膵臓細胞、筋細胞、神経細胞及び幹細胞からなる群から選択される、請求項133~136のいずれか一項に記載の方法。
  138. 請求項22~110のいずれか一項に記載の標的化塩基エディターを含むか又はそれを発現するベクター。
  139. 改変アデノウイルス(AAV)ベクター、レンチウイルスベクター又はウイルス様粒子(VLP)である、請求項138に記載のベクター。
  140. 前記標的化塩基エディターは、前記ベクター内に封入される、請求項138又は139に記載のベクター。
  141. 前記デアミナーゼドメインは、ベクター内の標的化塩基エディターを含む、請求項120又は129~137のいずれか一項に記載の方法。
  142. 前記第1及び第2の部分は、TALE、BAT、CRISPR-Cas9、Cfp1及びジンクフィンガーからなる群から独立して選択されるプログラマブルDNA結合ドメインをそれぞれ含む、請求項22~49のいずれか一項に記載の標的化塩基エディター。
  143. 前記第1の部分は、TALEであり、及び前記第2の部分は、TALEであるか、前記第1の部分は、TALEであり、及び前記第2の部分は、BATであるか、前記第1の部分は、TALEであり、及び前記第2の部分は、ジンクフィンガーであるか、前記第1の部分は、TALEであり、及び前記第2の部分は、CRISPR-Cas9であるか、前記第1の部分は、TALEであり、及び前記第2の部分は、Cfp1であるか、前記第1の部分は、BATであり、及び前記第2の部分は、TALEであるか、前記第1の部分は、BATであり、及び前記第2の部分は、BATであるか、前記第1の部分は、BATであり、及び前記第2の部分は、ジンクフィンガーであるか、前記第1の部分は、BATであり、及び前記第2の部分は、CRISPR-Cas9であるか、前記第1の部分は、BATであり、及び前記第2の部分は、Cfp1であるか、前記第1の部分は、ジンクフィンガーであり、及び前記第2の部分は、TALEであるか、前記第1の部分は、ジンクフィンガーであり、及び前記第2の部分は、BATであるか、前記第1の部分は、ジンクフィンガーであり、及び前記第2の部分は、ジンクフィンガーであるか、前記第1の部分は、ジンクフィンガーであり、及び前記第2の部分は、CRISPR-Cas9であるか、前記第1の部分は、ジンクフィンガーであり、及び前記第2の部分は、Cfp1であるか、前記第1の部分は、CRISPR-Cas9であり、及び前記第2の部分は、TALEであるか、前記第1の部分は、CRISPR-Cas9であり、及び前記第2の部分は、BATであるか、前記第1の部分は、CRISPR-Cas9であり、及び前記第2の部分は、ジンクフィンガーであるか、前記第1の部分は、CRISPR-Cas9であり、及び前記第2の部分は、CRISPR-Cas9であるか、前記第1の部分は、CRISPR-Cas9であり、及び前記第2の部分は、Cfp1であるか、前記第1の部分は、Cfp1であり、及び前記第2の部分は、TALEであるか、前記第1の部分は、Cfp1であり、及び前記第2の部分は、BATであるか、前記第1の部分は、Cfp1であり、及び前記第2の部分は、ジンクフィンガーであるか、前記第1の部分は、Cfp1であり、及び前記第2の部分は、CRISPR-Cas9であるか、又は前記第1の部分は、Cfp1であり、及び前記第2の部分は、Cfp1である、請求項50/142に記載の標的化塩基エディター。
  144. ミトコンドリア中のミトコンドリアDNA又は葉緑体中の葉緑体DNAにおける1つ以上の核酸を編集する方法であって、
    請求項1~110のいずれか一項に記載の標的化シトシンデアミナーゼ塩基エディターを前記ミトコンドリア又は前記葉緑体に導入するステップ
    を含み、ミトコンドリア又は葉緑体DNA中の標的核酸は、前記標的化塩基エディターによって脱アミノ化される、方法。
  145. 前記ミトコンドリア又は前記葉緑体は、インビトロである、請求項144に記載の方法。
  146. 前記標的ヌクレオチドは、規定の編集閾値でのデアミナーゼ確率シーケンスロゴによって規定されるコンテキスト特異性をそれぞれ呈示する、請求項1又は2に記載のデアミナーゼドメイン。
JP2023542485A 2021-01-12 2022-01-12 コンテキスト依存性二本鎖dna特異的デアミナーゼ及びその使用 Pending JP2024502630A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163136524P 2021-01-12 2021-01-12
US63/136,524 2021-01-12
PCT/US2022/012204 WO2022155265A2 (en) 2021-01-12 2022-01-12 Context-dependent, double-stranded dna-specific deaminases and uses thereof

Publications (1)

Publication Number Publication Date
JP2024502630A true JP2024502630A (ja) 2024-01-22

Family

ID=80168318

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023542485A Pending JP2024502630A (ja) 2021-01-12 2022-01-12 コンテキスト依存性二本鎖dna特異的デアミナーゼ及びその使用

Country Status (7)

Country Link
EP (1) EP4277989A2 (ja)
JP (1) JP2024502630A (ja)
KR (1) KR20230142500A (ja)
CN (1) CN117321197A (ja)
AU (1) AU2022207981A1 (ja)
CA (1) CA3207102A1 (ja)
WO (1) WO2022155265A2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021536229A (ja) 2018-08-23 2021-12-27 サンガモ セラピューティクス, インコーポレイテッド 操作された標的特異的な塩基エディター
WO2023122722A1 (en) * 2021-12-22 2023-06-29 Sangamo Therapeutics, Inc. Novel zinc finger fusion proteins for nucleobase editing
WO2024065721A1 (en) * 2022-09-30 2024-04-04 Peking University Methods of determining genome-wide dna binding protein binding sites by footprinting with double stranded dna deaminase
CN117106758B (zh) * 2023-08-25 2024-05-17 南京医科大学 一种特异在DNA的gC基序上实现C/G到T/A编辑的RiCBE系统

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4751180A (en) 1985-03-28 1988-06-14 Chiron Corporation Expression using fused genes providing for protein product
US4935233A (en) 1985-12-02 1990-06-19 G. D. Searle And Company Covalently linked polypeptide cell modulators
GB9710807D0 (en) 1997-05-23 1997-07-23 Medical Res Council Nucleic acid binding proteins
GB9710809D0 (en) 1997-05-23 1997-07-23 Medical Res Council Nucleic acid binding proteins
US6140081A (en) 1998-10-16 2000-10-31 The Scripps Research Institute Zinc finger binding domains for GNN
US6534261B1 (en) 1999-01-12 2003-03-18 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
US6453242B1 (en) 1999-01-12 2002-09-17 Sangamo Biosciences, Inc. Selection of sites for targeting by zinc finger proteins and methods of designing zinc finger proteins to bind to preselected sites
US7067617B2 (en) 2001-02-21 2006-06-27 The Scripps Research Institute Zinc finger binding domains for nucleotide sequence ANN
US20040197892A1 (en) 2001-04-04 2004-10-07 Michael Moore Composition binding polypeptides
JP2005500061A (ja) 2001-08-20 2005-01-06 ザ スクリップス リサーチ インスティテュート Cnnについての亜鉛フィンガー結合ドメイン
JP2009520463A (ja) 2005-11-28 2009-05-28 ザ スクリプス リサーチ インスティテュート Tnnのための亜鉛フィンガー結合ドメイン
WO2007081647A2 (en) 2006-01-03 2007-07-19 The Scripps Research Institute Zinc finger domains specifically binding agc
WO2009146179A1 (en) 2008-04-15 2009-12-03 University Of Iowa Research Foundation Zinc finger nuclease for the cftr gene and methods of use thereof
EP2206723A1 (en) 2009-01-12 2010-07-14 Bonas, Ulla Modular DNA-binding domains
AU2010327998B2 (en) 2009-12-10 2015-11-12 Iowa State University Research Foundation, Inc. TAL effector-mediated DNA modification
MX362866B (es) 2012-05-25 2019-02-20 Univ California Metodos y composiciones para la modificacion de adn objetivo dirigida por arn y para la modulacion de la transcripcion dirigida por arn.
EP3808844A1 (en) 2012-07-25 2021-04-21 The Broad Institute, Inc. Inducible dna binding proteins and genome perturbation tools and applications thereof
US20140189896A1 (en) 2012-12-12 2014-07-03 Feng Zhang Crispr-cas component systems, methods and compositions for sequence manipulation
US9790490B2 (en) 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
EP4269577A3 (en) * 2015-10-23 2024-01-17 President and Fellows of Harvard College Nucleobase editors and uses thereof
US20190233814A1 (en) 2015-12-18 2019-08-01 The Broad Institute, Inc. Novel crispr enzymes and systems
CN108884785B (zh) 2016-03-28 2022-03-15 沃尔布罗有限责任公司 用于发动机暖机的燃料供应系统
SG11201900907YA (en) 2016-08-03 2019-02-27 Harvard College Adenosine nucleobase editors and uses thereof
CN110914426A (zh) * 2017-03-23 2020-03-24 哈佛大学的校长及成员们 包含核酸可编程dna结合蛋白的核碱基编辑器
CA3166153A1 (en) 2020-01-28 2021-08-05 The Broad Institute, Inc. Base editors, compositions, and methods for modifying the mitochondrial genome

Also Published As

Publication number Publication date
CN117321197A (zh) 2023-12-29
KR20230142500A (ko) 2023-10-11
WO2022155265A2 (en) 2022-07-21
WO2022155265A3 (en) 2022-08-25
AU2022207981A1 (en) 2023-07-27
CA3207102A1 (en) 2022-07-21
EP4277989A2 (en) 2023-11-22

Similar Documents

Publication Publication Date Title
US11098326B2 (en) Using RNA-guided FokI nucleases (RFNs) to increase specificity for RNA-guided genome editing
US11319532B2 (en) High efficiency base editors comprising Gam
US10392616B2 (en) CRISPR RNA targeting enzymes and systems and uses thereof
US20230021641A1 (en) Cas9 variants having non-canonical pam specificities and uses thereof
JP2024502630A (ja) コンテキスト依存性二本鎖dna特異的デアミナーゼ及びその使用
JP2023525304A (ja) 標的二本鎖ヌクレオチド配列の両鎖同時編集のための方法および組成物
US10011850B2 (en) Using RNA-guided FokI Nucleases (RFNs) to increase specificity for RNA-Guided Genome Editing
CA3130488A1 (en) Methods and compositions for editing nucleotide sequences
EP3658573A1 (en) Methods and compositions for evolving base editors using phage-assisted continuous evolution (pace)
JPWO2020191243A5 (ja)
JPWO2020191234A5 (ja)
JPWO2020191233A5 (ja)
WO2022261509A1 (en) Improved cytosine to guanine base editors
CA3234217A1 (en) Base editing enzymes
CA3227004A1 (en) Improved prime editors and methods of use
Pedrazzoli Expanding the CRISPR-Cas9 toolbox for genome editing
Kim Base Editing: A New Approach to Genome Editing
WO2024086845A2 (en) Engineered casphi2 nucleases
WO2023023519A1 (en) Crispr-associated transposons and uses thereof
CA3163369A1 (en) Variant cas9