JP2022519882A - 糖原病1a型を治療するための組成物および方法 - Google Patents

糖原病1a型を治療するための組成物および方法 Download PDF

Info

Publication number
JP2022519882A
JP2022519882A JP2021546892A JP2021546892A JP2022519882A JP 2022519882 A JP2022519882 A JP 2022519882A JP 2021546892 A JP2021546892 A JP 2021546892A JP 2021546892 A JP2021546892 A JP 2021546892A JP 2022519882 A JP2022519882 A JP 2022519882A
Authority
JP
Japan
Prior art keywords
tada
adenosine deaminase
cas9
domain
amino acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021546892A
Other languages
English (en)
Other versions
JPWO2020168088A5 (ja
Inventor
ニコル ゴーデッリ、
マイケル パッカー、
イアン スレイメイカー、
イ ユ、
ベルンド ゼッツェ、
イボンヌ アラティン、
フランシーヌ グレゴワール、
ジェネシス ラング、
デイビッド エー. ボーン、
スン―ジュ イ、
Original Assignee
ビーム セラピューティクス インク.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ビーム セラピューティクス インク. filed Critical ビーム セラピューティクス インク.
Publication of JP2022519882A publication Critical patent/JP2022519882A/ja
Publication of JPWO2020168088A5 publication Critical patent/JPWO2020168088A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • A61K31/7088Compounds having three or more nucleosides or nucleotides
    • A61K31/7105Natural ribonucleic acids, i.e. containing only riboses attached to adenine, guanine, cytosine or uracil and having 3'-5' phosphodiester links
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • C12N15/1137Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against enzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/09Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/30Special therapeutic applications
    • C12N2320/34Allele or polymorphism specific uses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • C12Y301/03Phosphoric monoester hydrolases (3.1.3)
    • C12Y301/03009Glucose-6-phosphatase (3.1.3.9)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04004Adenosine deaminase (3.5.4.4)

Abstract

本発明は、効率が増加した新規アデノシン塩基エディター(例えばABE8)を含む組成物、および糖原病1a型(GSD1a)に関連する突然変異を改変するためにアデノシンデアミナーゼバリアントを含む塩基エディターを使用する方法を提供する。

Description

関連出願の相互参照
本出願は、2019年2月13日に出願された米国仮出願第62/805,271号、2019年5月23日に出願された米国仮出願第62/852,228号、2019年5月23日に出願された米国仮出願第62/852,224号、2019年7月19日に出願された米国仮出願第62/876,354号、2019年10月9日に出願された米国仮出願第62/912,992号、2019年11月6日に出願された米国仮出願第62/931,722号、2019年11月27日に出願された米国仮出願第62/941,569号、および2020年1月27日に出願された米国仮出願第62/966,526号に対する優先権およびこれらの利益を主張する国際PCT出願であり、これら全ての内容は、その全体が参照により本明細書に組み込まれる。
参照による組み込み
本明細書で言及されている全ての刊行物、特許、および特許出願は、各個々の刊行物、特許、または特許出願が、参照により組み込まれることが具体的にかつ個別に示されていた場合と同程度まで、参照により本明細書に組み込まれる。別途明記されない限り、本明細書で言及されている刊行物、特許、および特許出願は、その全体が参照により本明細書に組み込まれる。
ほとんどの既知の遺伝病では、この疾患の根本的な原因を研究するかまたはこの原因に対処するためには、遺伝子の確率的破壊ではなく標的遺伝子座での点突然変異の補正が必要である。clustered regularly interspaced short palindromic repeat (CRISPR)システムを利用する現在のゲノム編集技術は、遺伝子補正のための第1の工程として、標的遺伝子座で二本鎖DNA破壊を導入する。二本鎖DNA破壊に反応して、細胞内DNA修復プロセスでは、ほとんどの場合、非相同末端結合によりDNA切断部位に無作為の挿入または欠失(インデル)が生じる。ほとんどの遺伝病は点突然変異に起因するが、点突然変異補正のための現在のアプローチは非効率であり、典型的には、dsDNA破壊に対する細胞の反応に起因して、標的遺伝子座で多数の無作為の挿入および欠失(インデル)を誘発する。したがって、より効率的であり、かつ確率的な挿入もしくは欠失(インデル)、または転座等の望ましくない生成物がはるかに少ない改良型のゲノム編集が必要とされている。
糖原病1型(GSD1またはVon Gierke病としても知られる)は、グリコーゲン分解および糖新生の欠乏を引き起こす遺伝性障害であり、組織中にグリコーゲンおよび脂質が蓄積され、生命を脅かす低血糖および乳酸アシドーシスが引き起こされ、かつ潜在的なCNS損傷ならびに長期にわたる肝臓および腎臓の合併症(例えば、脂肪症、肝腺腫、および肝細胞癌)が引き起こされる。
GSD1には、1a型(GSD1a)および1b型(GSD1b)という2つのタイプが存在しており、これらは、異なる遺伝子突然変異により引き起こされる。GSD1aは、グルコース-6-ホスファターゼ(G6PC)遺伝子の突然変異により引き起こされ、GSD1の患者の約80%で発症している。米国では、100,000例の新生児に約1例がGSD1aを有しており、患者の約22%が劣勢突然変異Q347*を持ち、患者の37%が劣勢突然変異R83Cを持つ。
GSD1aに承認された薬物治療は存在していない。肝移植は治癒的ではあるが、承認された治療法は存在せず、現在の治療レジメンは、コーンスターチをほぼ継続的に摂取することを含む。慢性的に治療を受けていない場合には、患者は重度の乳酸アシドーシスを発症し、腎不全へと進行する可能性があり、かつ乳児期または小児期では死亡する可能性がある。GSD1aは、未だ対処されていない重要な医療ニーズの一分野である。したがって、GSD1aの患者を治療するための新規の組成物および方法が必要とされている。
参照による組み込み
本明細書で言及されている全ての刊行物、特許、および特許出願は、各個々の刊行物、特許、または特許出願が、参照により組み込まれることが具体的にかつ個別に示されていた場合と同程度まで、参照により本明細書に組み込まれる。別途明記されない限り、本明細書で言及されている刊行物、特許、および特許出願は、その全体が参照により本明細書に組み込まれる。
本発明は、プログラム可能な核酸塩基エディターを使用する病原性アミノ酸の正確な補正のための組成物および方法を特徴とする。特に、本発明の組成物および方法は、糖原病1a型(GSD1a)の治療に有用である。そのため、本発明は、有害突然変異(例えば、Q347X、R83C)を補正すべく内因性G6PC遺伝子での一塩基多型を正確に補正するためにアデノシン(A)塩基エディター(ABE)(例えばABE8)を使用してGSD1aを治療するための組成物および方法を提供する。
1つの態様において、本発明は、糖原病1a型(GSD1a)に関連する一塩基多型(SNP)を含むG6PCポリヌクレオチドを編集する方法であって、G6PCポリヌクレオチドを、1つまたは複数のガイドポリヌクレオチドと複合体を形成したアデノシンデアミナーゼ塩基エディター8(ABE)と接触させることを含み、ABE8が、ポリヌクレオチドプログラム可能なDNA結合ドメインと、アデノシンデアミナーゼドメインとを含み、ガイドポリヌクレオチドのうちの1つまたは複数が塩基エディターをターゲティング(標的指向化)してGSD1aに関連するSNPのA・TからG・Cへの改変をもたらす、方法を提供する。別の態様において、本発明は、ポリヌクレオチドプログラム可能なDNA結合ドメイン、およびアデノシンデアミナーゼドメインを含むアデノシンデアミナーゼ塩基エディター8(ABE8)、または前記塩基エディターをコードするポリヌクレオチドと、塩基エディターをターゲティングしてGSD1aに関連するSNPのA・TからG・Cへの改変をもたらす1つまたは複数のガイドポリヌクレオチドとを含む細胞を提供する。別の態様において、本発明は、対象におけるGSD1aを治療する方法であって、前記対象に、ポリヌクレオチドプログラム可能なDNA結合ドメインおよびアデノシンデアミナーゼドメインを含むアデノシンデアミナーゼ塩基エディター8(ABE8)、または前記塩基エディターをコードするポリヌクレオチドと、アデノシンデアミナーゼ塩基エディター8(ABE8)をターゲティングしてGSD1aに関連するSNPのA・TからG・Cへの改変をもたらす1つまたは複数のガイドポリヌクレオチドとを投与することを含む方法を提供する。別の態様において、本発明は、肝細胞またはその先駆体を生成する方法であって、a)GSD1aに関連するSNPを含む人工多能性幹細胞または肝細胞先駆体に、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインおよびアデノシンデアミナーゼドメインを含むアデノシンデアミナーゼ塩基エディター8(ABE8)、またはアデノシンデアミナーゼ塩基エディター8(ABE8)をコードするポリヌクレオチドと、塩基エディターをターゲティングしてGSD1aに関連するSNPのA・TからG・Cへの改変をもたらす1つまたは複数のガイドポリヌクレオチドとを導入すること、ならびにb)人工多能性幹細胞または肝細胞先駆体を肝細胞に分化させることを含む方法を提供する。
1つの態様において、本発明は、糖原病1a型(GSD1a)に関連する一塩基多型(SNP)を含むグルコース-6-ホスファターゼ(G6PC)ポリヌクレオチドを編集する方法であって、G6PCポリヌクレオチドを、1つまたは複数のガイドポリヌクレオチドと複合体を形成したアデノシンデアミナーゼ塩基エディター8(ABE8)と接触させることを含み、アデノシンデアミナーゼ塩基エディター8(ABE8)が、Cas9またはCas12ポリペプチド内に挿入されたアデノシンデアミナーゼバリアントドメインを含み、前記ガイドポリヌクレオチドのうちの1つまたは複数が前記塩基エディターを標的指向化してGSD1aに関連するSNPのA・TからG・Cへの改変をもたらす、方法を提供する。別の態様において、本発明は、対象における糖原病1a型(GSD1a)を治療する方法であって、前記対象に、Cas9もしくはCas12ポリペプチド内に挿入されたアデノシンデアミナーゼバリアントを含むアデノシンデアミナーゼ塩基エディター8(ABE8)、または前記塩基エディターをコードするポリヌクレオチドと、アデノシンデアミナーゼ塩基エディター8(ABE8)を標的指向化してGSD1aに関連するSNPのA・TからG・Cへの改変をもたらす1つまたは複数のガイドポリヌクレオチドとを投与し、それにより対象におけるGSD1aを治療することを含む方法を提供する。さらに別の態様において、本発明は、対象における糖原病1a型(GSD1a)を治療する方法であって、対象に、Cas9もしくはCas12ポリペプチド内に挿入されたアデノシンデアミナーゼバリアントを含む融合タンパク質、またはその融合タンパク質をコードするポリヌクレオチドと、融合タンパク質を標的指向化してGSD1aに関連する一塩基多型(SNP)のA・TからG・Cへの改変をもたらす1つまたは複数のガイドポリヌクレオチドとを投与し、それにより対象におけるGSD1aを治療することを含む方法を提供する。
ある態様において、本発明は、ポリヌクレオチドプログラム可能なDNA結合ドメインと、アデノシンデアミナーゼバリアントドメインとを含むアデノシンデアミナーゼ塩基エディター8(ABE8)の有効量を含む、糖原病1a型(GSD1a)の治療のための医薬組成物を提供する。いくつかの実施形態において、この医薬組成物は、アデノシンデアミナーゼ塩基エディター8(ABE8)を標的指向化してGSD1aに関連するSNPのA・TからG・Cへの改変をもたらすことができる1つまたは複数のガイドポリヌクレオチドを含む。別の態様において、本発明は、本明細書で提供される細胞のうちのいずれかの有効量を含む、糖原病1a型(GSD1a)の治療のための医薬組成物を提供する。いくつかの実施形態において、この医薬組成物は、薬学的に許容される賦形剤を含む。
別の態様において、本発明は、糖原病1a型(GSD1a)の治療のためのキットであって、ポリヌクレオチドプログラム可能なDNA結合ドメインおよびアデノシンデアミナーゼドメインを含むアデノシンデアミナーゼ塩基エディター8(ABE8)と、アデノシンデアミナーゼ塩基エディター8(ABE8)を標的指向化してGSD1aに関連するSNPのA・TからG・Cへの改変をもたらすことができる1つまたは複数のガイドポリヌクレオチドとを含むキットを提供する。さらに別の態様において、本発明は、糖原病1a型(GSD1a)の治療のためのキットであって、本明細書で提供される細胞のうちのいずれかを含むキットを提供する。
いくつかの実施形態において、接触させることは、細胞、真核細胞、哺乳動物細胞、またはヒト細胞中で起こる。いくつかの実施形態において、この細胞は、インビボである。いくつかの実施形態において、この細胞は、エクスビボである。いくつかの実施形態において、この細胞は、肝細胞、肝細胞前駆体、またはiPSc由来の肝細胞である。いくつかの実施形態において、この細胞は、G6PCポリペプチドを発現する。いくつかの実施形態において、この細胞または肝細胞先駆体は、GSD1aを有する対象由来である。いくつかの実施形態において、この対象は、哺乳動物またはヒトである。いくつかの実施形態において、この肝細胞または肝細胞先駆体は、哺乳動物細胞またはヒト細胞である。いくつかの実施形態において、この対象の細胞に、アデノシンデアミナーゼ塩基エディター8(ABE8)または前記アデノシンデアミナーゼ塩基エディター8(ABE8)をコードするポリヌクレオチドと、前記1つまたは複数のガイドポリヌクレオチドとが送達される。
上記の態様または本明細書で記述されている本発明の任意の他の態様の様々な実施形態において、GSD1aに関連するSNPは、グルコース-6-ホスファターゼ(G6PC)遺伝子に位置する。1つの実施形態において、糖原病1a型(GSD1a)に関連するSNPでのA・TからG・Cへの改変により、グルタミン(Q)が非グルタミン(X)アミノ酸に変化する。1つの実施形態において、糖原病1a型(GSD1a)に関連するSNPでのA・TからG・Cへの改変により、G6PCポリペプチドにおいてアルギニン(R)が非アルギニン(X)に変化する。1つの実施形態において、GSD1aに関連するSNPは、位置347で非グルタミン(X)アミノ酸を有するかまたは位置83で非アルギニン(X)アミノ酸を有するG6PCポリペプチドの発現をもたらす。1つの実施形態において、塩基エディター補正により、位置347での非グルタミンアミノ酸(X)がグルタミンで置き換えられる。別の実施形態において、塩基エディター補正により、位置83での非アルギニンアミノ酸(X)がアルギニンで置き換えられる。1つの実施形態において、GSD1aに関連するSNPでのA・TからG・Cへの改変は、アミノ酸位置347で早期に終結するかまたは位置83でシステインをコードするG6PCポリペプチドの発現をもたらす。いくつかの実施形態において、SNPでの改変は、Q347Xおよび/またはR83Cのうちの1つまたは複数である。
上記の態様または本明細書で記述されている本発明の任意の他の態様の様々な実施形態において、アデノシンデアミナーゼバリアントは、Cas9またはCas12ポリペプチドの柔軟なループ、アルファヘリックス領域、非構造化部分、または溶媒接触可能部分内に挿入されている。いくつかの実施形態において、アデノシンデアミナーゼバリアントは、Cas9またはCas12ポリペプチドのN末端断片およびC末端断片によって隣接される。いくつかの実施形態において、融合タンパク質またはアデノシンデアミナーゼ塩基エディター8(ABE8)は、構造NH2-[Cas9またはCas12ポリペプチドのN末端断片]-[アデノシンデアミナーゼバリアント]-[Cas9またはCas12ポリペプチドのC末端断片]-COOHを含み、ここで「]-[」の各記載は任意のリンカーである。1つの実施形態において、N末端断片のC末端またはC末端断片のN末端は、Cas9またはCas12ポリペプチドの柔軟なループの一部を含む。1つの実施形態において、この柔軟なループは、標的核酸塩基に近接するアミノ酸を含む。いくつかの実施形態において、1つまたは複数のガイドポリヌクレオチドは、融合タンパク質またはアデノシンデアミナーゼ塩基エディター8(ABE8)を誘導して標的核酸塩基の脱アミノ化をもたらす。いくつかの実施形態において、SNP標的核酸塩基の脱アミノ化により、標的核酸塩基が非野生型核酸塩基で置き換えられ、標的核酸塩基の脱アミノ化によりGSD1aの症状が改善される。1つの実施形態において、標的核酸塩基は、標的ポリヌクレオチド配列中のPAM配列から1~20個の核酸塩基離れている。1つの実施形態において、標的核酸塩基は、PAM配列の2~12個の核酸塩基上流である。
1つの実施形態において、CasポリペプチドまたはCas12ポリペプチドのN末端断片またはC末端断片は、標的ポリヌクレオチド配列に結合する。1つの実施形態において、N末端断片もしくはC末端断片は、RuvCドメインを含むか、N末端断片もしくはC末端断片は、HNHドメインを含むか、N末端断片もC末端断片もHNHドメインを含まないか、またはN末端断片もC末端断片もRuvCドメインを含まない。1つの実施形態において、Cas9またはCas12ポリペプチドは、1つまたは複数の構造ドメインでの部分的なまたは完全な欠失を含み、デアミナーゼは、Cas9またはCas12ポリペプチドの部分的なまたは完全な欠失位置に挿入されている。1つの実施形態において、この欠失は、RuvCドメイン内にあるか、この欠失は、HNHドメイン内にあるか、またはこの欠失は、RuvCドメインとC末端ドメインとを、L-IドメインとHNHドメインとを、もしくはRuvCドメインとL-Iドメインとを架橋する。
様々な実施形態において、ポリヌクレオチドプログラム可能なDNA結合ドメインは、Cas9ポリペプチドである。いくつかの実施形態において、融合タンパク質またはアデノシンデアミナーゼ塩基エディター8(ABE8)は、Cas9ポリペプチドに挿入されたアデノシンデアミナーゼバリアントドメインを含む。いくつかの実施形態において、Cas9ポリペプチドは、Streptococcus pyogenes Cas9 (SpCas9)、Staphylococcus aureus Cas9 (SaCas9)、Streptococcus thermophilus 1 Cas9 (St1Cas9)、またはこれらのバリアントである。いくつかの実施形態において、Cas9ポリペプチドは、以下のアミノ酸配列(Cas9参照配列):
Figure 2022519882000002
(一重下線:HNHドメイン;二重下線: RuvC domain;(Cac9参照配列)、またはその対応する領域を有する。
いくつかの実施形態において、Cas9ポリペプチドは、Cas9ポリペプチド参照配列における番号付けでアミノ酸1017~1069もしくはその対応するアミノ酸の欠失を含むか、Cas9ポリペプチドは、Cas9ポリペプチド参照配列における番号付けでアミノ酸792~872もしくはその対応するアミノ酸の欠失を含むか、またはCas9ポリペプチドは、Cas9ポリペプチド参照配列における番号付けでアミノ酸792~906もしくはその対応するアミノ酸の欠失を含む。いくつかの実施形態において、アデノシンデアミナーゼバリアントは、Cas9ポリペプチドの柔軟なループ内に挿入されている。いくつかの実施形態において、この柔軟なループは、Cas9参照配列における番号付けで位置530~537、569~579、686~691、768~793、943~947、1002~1040、1052~1077、1232~1248、および1298~1300、またはこれらの対応するアミノ酸位置でのアミノ酸残基からなる群から選択される領域を含む。いくつかの実施形態において、デアミナーゼは、Cas9参照配列における番号付けでアミノ酸位置768~769、791~792、792~793、1015~1016、1022~1023、1026~1027、1029~1030、1040~1041、1052~1053、1054~1055、1067~1068、1068~1069、1247~1248、もしくは1248~1249、またはこれらの対応するアミノ酸位置の間に挿入されている。いくつかの実施形態において、デアミナーゼは、Cas9参照配列における番号付けでアミノ酸位置768~769、792~793、1022~1023、1026~1027、1040~1041、1068~1069、もしくは1247~1248、またはこれらの対応するアミノ酸位置の間に挿入されている。いくつかの実施形態において、デアミナーゼは、Cas9参照配列における番号付けでアミノ酸位置1016~1017、1023~1024、1029~1030、1040~1041、1069~1070、もしくは1247~1248、またはこれらの対応するアミノ酸位置の間に挿入されている。いくつかの実施形態において、アデノシンデアミナーゼバリアントは、表10Aで同定されている遺伝子座でCas9ポリペプチド内に挿入されている。いくつかの実施形態において、N末端断片は、Cas9参照配列のアミノ酸残基1~529、538~568、580~685、692~942、948~1001、1026~1051、1078~1231、および/もしくは1248~1297、またはこれらの対応する残基を含む。いくつかの実施形態において、C末端断片は、Cas9参照配列のアミノ酸残基1301~1368、1248~1297、1078~1231、1026~1051、948~1001、692~942、580~685、および/もしくは538~568、またはこれらの対応する残基を含む。
いくつかの実施形態において、Cas9ポリペプチドはニッカーゼであるか、またはCas9ポリペプチドはヌクレアーゼ不活性である。いくつかの実施形態において、Cas9ポリペプチドは、改変SpCas9であり、改変PAMに対する特異性を有するかまたは非G PAMに対する特異性を有する。いくつかの実施形態において、この改変SpCas9ポリペプチドは、アミノ酸置換D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、およびT1337R (SpCas9-MQKFRAER)を含み、改変PAM 5'-NGC-3'に対する特異性を有する。
様々な実施形態において、ポリヌクレオチドプログラム可能なDNA結合ドメインは、改変Streptococcus pyogenes Cas9 (SpCas9)またはそのバリアントである。上記の態様または本明細書で描写されている本発明の任意の他の態様の様々な実施形態において、ポリヌクレオチドプログラム可能なDNA結合ドメインは、改変されたプロトスペーサー隣接モチーフ(PAM)特異性を有するかまたは非G PAMに対する特異性を有する改変SpCas9を含む。一実施形態において、この改変SpCas9は、核酸配列5'-NGA-3'に対する特異性を有する。一実施形態において、この改変SpCas9は、核酸配列5'-AGA-3'または5'-GGA-3'に対する特異性を有する。一実施形態において、この改変SpCas9は、NGA PAMバリアントに対する特異性を有する。
様々な実施形態において、ポリヌクレオチドプログラム可能なDNA結合ドメインは、Staphylococcus aureus Cas9 (SaCas9)またはそのバリアントである。一実施形態において、このSaCas9は、核酸配列5'-NNGRRT-3'に対する特異性を有する。一実施形態において、このSaCas9は、核酸配列5'-GAGAAT-3'に対する特異性を有する。一実施形態において、このSaCas9は、NNGRRT PAMバリアントに対する特異性を有する。
様々な実施形態において、ポリヌクレオチドプログラム可能なDNA結合ドメインは、Cas12ポリペプチドである。一実施形態において、アデノシンデアミナーゼバリアントは、Cas12ポリペプチドに挿入されている。一実施形態において、Cas12ポリペプチドは、Cas12a、Cas12b、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、またはCas12iである。一実施形態において、アデノシンデアミナーゼバリアントは、以下のアミノ酸位置の間に挿入されている:a) BhCas12bの153~154、255~256、306~307、980~981、1019~1020、534~535、604~605、もしくは344~345、またはCas12a、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、もしくはCas12iの対応するアミノ酸残基;b) BvCas12bの147および148、248および249、299および300、991および992、もしくは1031および1032、またはCas12a、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、もしくはCas12iの対応するアミノ酸残基;またはc) AaCas12bの157および158、258および259、310および311、1008および1009、もしくは1044および1045、またはCas12a、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、もしくはCas12iの対応するアミノ酸残基。一実施形態において、アデノシンデアミナーゼバリアントは、表10Bで同定されている遺伝子座でCas12ポリペプチド内に挿入されている。一実施形態において、Cas12ポリペプチドは、Cas12bである。一実施形態において、Cas12ポリペプチドは、BhCas12bドメイン、BvCas12bドメイン、またはAACas12bドメインを含む。
様々な実施形態において、ポリヌクレオチドプログラム可能なDNA結合ドメインは、ヌクレアーゼ不活性バリアントである。他の実施形態において、ポリヌクレオチドプログラム可能なDNA結合ドメインは、ニッカーゼバリアントである。一実施形態において、このニッカーゼバリアントは、アミノ酸置換D10Aまたはその対応するアミノ酸置換を含む。いくつかの実施形態において、アデノシンデアミナーゼドメインは、デオキシリボ核酸(DNA)中のアデノシンを脱アミノ化することができる。いくつかの実施形態において、アデノシンデアミナーゼドメインは、アデノシンデアミナーゼバリアントを含むモノマーである。いくつかの実施形態において、アデノシンデアミナーゼドメインは、野生型アデノシンデアミナーゼドメインとアデノシンデアミナーゼバリアントとを含むヘテロ二量体である。
いくつかの実施形態において、アデノシンデアミナーゼバリアントは、アミノ酸配列:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
を含み、このアミノ酸配列は、少なくとも1つの改変を含む。いくつかの実施形態において、アデノシンデアミナーゼバリアントは、上記の配列に対してアミノ酸位置82および/または166で改変を含む。いくつかの実施形態において、この少なくとも1つの改変は、上記の配列に対してV82S、Y147T、Y147R、Q154S、Y123H、および/またはQ154Rを含む。いくつかの実施形態において、この少なくとも1つの改変は、Y147T+Q154R;Y147T+Q154S;Y147R+Q154S;V82S+Q154S;V82S+Y147R;V82S+Q154R;V82S+Y123H;I76Y+V82S;V82S+Y123H+Y147T;V82S+Y123H+Y147R;V82S+Y123H+Q154R;Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y123H+Y147R+Q154R+I76Y;V82S+Y123H+Y147R+Q154R; およびI76Y + V82S + Y123H + Y147R + Q154Rからなる群から選択される改変の組合せを含む。いくつかの実施形態において、この少なくとも1つの改変は、上記の配列に対してY147T + Q154Sである。
いくつかの実施形態において、アデノシンデアミナーゼバリアントは、149、150、151、152、153、154、155、156、および157からなる群から選択される残基で始まるC末端の欠失を含む。いくつかの実施形態において、アデノシンデアミナーゼバリアントは、TadA*8アデノシンデアミナーゼバリアントドメインを含むアデノシンデアミナーゼモノマーである。いくつかの実施形態において、アデノシンデアミナーゼバリアントは、野生型アデノシンデアミナーゼドメインとTadA*8アデノシンデアミナーゼバリアントドメインとを含むアデノシンデアミナーゼヘテロ二量体である。いくつかの実施形態において、アデノシンデアミナーゼバリアントは、TadAドメインとTadA*8アデノシンデアミナーゼバリアントドメインとを含むアデノシンデアミナーゼヘテロ二量体である。
いくつかの実施形態において、ガイドポリヌクレオチドは、
a) GACCUAGGCGAGGCAGUAGG;
b) CCAGUAUGGACACUGUCCAAA;
c) CAGUAUGGACACUGUCCAAA; および
d) AGUAUGGACACUGUCCAAAG.
の群から選択される核酸配列を含む。
いくつかの実施形態において、1つまたは複数のガイドRNAは、CRISPR RNA (crRNA)およびトランスコード小RNA (tracrRNA)を含み、このcrRNAは、GSD1aに関連するSNPを含むG6PC核酸配列に相補的な核酸配列を含む。いくつかの実施形態において、アデノシンデアミナーゼ塩基エディター8(ABE8)は、GSD1aに関連するSNPを含むG6PC核酸配列に相補的な核酸配列を含む単一ガイドRNA(sgRNA)と複合体を形成する。
いくつかの実施形態において、アデノシンデアミナーゼは、TadAデアミナーゼである。一実施形態において、TadAデアミナーゼは、TadA*8バリアントである。いくつかの実施形態において、TadA*8バリアントは、TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23、TadA*8.24からなる群から選択される。いくつかの実施形態において、アデノシンデアミナーゼ塩基エディター8(ABE8)は、ABE8.1-m、ABE8.2-m、ABE8.3-m、ABE8.4-m、ABE8.5-m、ABE8.6-m、ABE8.7-m、ABE8.8-m、ABE8.9-m、ABE8.10-m、ABE8.11-m、ABE8.12-m、ABE8.13-m、ABE8.14-m、ABE8.15-m、ABE8.16-m、ABE8.17-m、ABE8.18-m、ABE8.19-m、ABE8.20-m、ABE8.21-m、ABE8.22-m、ABE8.23-m、ABE8.24-m、ABE8.1-d、ABE8.2-d、ABE8.3-d、ABE8.4-d、ABE8.5-d、ABE8.6-d、ABE8.7-d、ABE8.8-d、ABE8.9-d、ABE8.10-d、ABE8.11-d、ABE8.12-d、ABE8.13-d、ABE8.14-d、ABE8.15-d、ABE8.16-d、ABE8.17-d、ABE8.18-d、ABE8.19-d、ABE8.20-d、ABE8.21-d、ABE8.22-d、ABE8.23-d、またはABE8.24-dからなる群から選択される。
いくつかの実施形態において、アデノシンデアミナーゼ塩基エディター8(ABE8)は、アデノシンデアミナーゼ活性を有する以下の配列またはその断片:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD
を含むか、またはそれから本質的になる。
いくつかの実施形態において、gRNAは、以下の配列:
GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU
を有する足場を含む。
いくつかの実施形態では、gRNAは、以下の配列:
GUUUUAGUACUCUGUAAUGAAAAUUACAGAAUCUACUAAAACAAGGCAAAAUGCCGUGUUUAUCUCGUCAACUUGUUGGCGAGAUUUU
を有する足場を含む。
ある態様において、本明細書で提供されるのは、1つまたは複数のガイドポリヌクレオチドと複合体を形成したアデノシンデアミナーゼ塩基エディター8(ABE8)を含む塩基エディターであって、このアデノシンデアミナーゼ塩基エディター8(ABE8)は、ポリヌクレオチドプログラム可能なDNA結合ドメインと、アデノシンデアミナーゼドメインとを含み、前記ガイドポリヌクレオチドのうちの1つまたは複数が前記塩基エディターを標的指向化してGSD1aに関連するSNPのA・TからG・Cへの改変をもたらす、塩基エディターである。いくつかの実施形態において、アデノシンデアミナーゼバリアントは、V82S改変および/またはT166R改変を含む。いくつかの実施形態において、アデノシンデアミナーゼバリアントは、以下の改変:Y147T、Y147R、Q154S、Y123H、およびQ154Rのうちの1つまたは複数をさらに含む。いくつかの実施形態において、塩基エディタードメインは、野生型アデノシンデアミナーゼドメインとアデノシンデアミナーゼバリアントとを含むアデノシンデアミナーゼヘテロ二量体を含む。いくつかの実施形態において、アデノシンデアミナーゼバリアントは、完全長TadA8に対して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のN末端アミノ酸残基を欠失している切詰め型のTadA8である。いくつかの実施形態において、アデノシンデアミナーゼバリアントは、完全長TadA8に対して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のC末端アミノ酸残基を欠失している切詰め型のTadA8である。いくつかの実施形態において、ポリヌクレオチドプログラム可能なDNA結合ドメインは、改変Staphylococcus aureus Cas9 (SaCas9)、Streptococcus thermophilus 1 Cas9 (St1Cas9)、改変Streptococcus pyogenes Cas9 (SpCas9)、またはこれらのバリアントである。いくつかの実施形態において、ポリヌクレオチドプログラム可能なDNA結合ドメインは、改変されたプロトスペーサー隣接モチーフ(PAM)特異性を有するかまたは非G PAMに対する特異性を有する、SpCas9のバリアントである。いくつかの実施形態において、ポリヌクレオチドプログラム可能なDNA結合ドメインは、ヌクレアーゼ不活性Cas9である。いくつかの実施形態において、ポリヌクレオチドプログラム可能なDNA結合ドメインは、Cas9ニッカーゼである。
一態様において、本明細書で提供されるのは、1つまたは複数のガイドRNA、ならびに以下の配列:
EIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFMQPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAKFLQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPRAFKYFDTTIARKEYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDGGSGGSGGSGGSGGSGGSGGMDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEGADKRTADGSEFESPKKKRKV*
(ここで、太字の配列は、Cas9に由来する配列を示し、イタリック体の配列は、リンカー配列を示し、下線が引かれた配列は、二部分(bipartite)核局在化配列を示す)を含むポリヌクレオチドプログラム可能なDNA結合ドメインと、
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
のアミノ酸位置82および/または166で改変を含むアデノシンデアミナーゼバリアントを含む少なくとも1つの塩基エディタードメインとを含む融合タンパク質を含む塩基エディターシステムであって、前記ガイドポリヌクレオチドのうちの1つまたは複数が前記塩基エディターを標的指向化してGSD1aに関連するSNPのA・TからG・Cへの改変をもたらす、システムである。
ある態様において、上記で記述された塩基エディターシステムのうちのいずれか1つを含む細胞が提供される。いくつかの実施形態において、この細胞は、ヒト細胞または哺乳動物細胞である。いくつかの実施形態において、この細胞は、エクスビボ、インビボ、またはインビトロである。
本明細書の説明および例は、本開示の実施形態を詳細に説明する。本開示は、本明細書で説明されている特定の実施形態に限定されず、したがって変化し得ることを理解すべきである。当業者は、本開示には、その範囲内に包含される多数の変形および改変が存在することを認識するであろう。
本明細書で開示されているいくつかの実施形態の実施は、別途指示されない限り、当業者の技量の範囲内にある、免疫学、生化学、化学、分子生物学、微生物学、細胞生物学、ゲノミクス、および組換えDNAの従来の技術を用いる。例えば、Sambrook and Green, Molecular Cloning: A Laboratory Manual, 4th Edition (2012); the series Current Protocols in Molecular Biology (F. M. Ausubel, et al.eds.); the series Methods In Enzymology (Academic Press, Inc.), PCR 2: A Practical Approach (M.J. MacPherson, B.D. Hames and G.R. Taylor eds. (1995)), Harlow and Lane, eds. (1988) Antibodies, A Laboratory Manual, and Culture of Animal Cells: A Manual of Basic Technique and Specialized Applications, 6th Edition (R.I. Freshney, ed. (2010))を参照されたい。
本開示の様々な特徴は、単一の実施形態の文脈で説明され得るが、これらの特徴は、別々にまたは任意の適切な組合せでも提供され得る。逆に、本明細書では、本開示は、明確にするために別々の実施形態の文脈で説明され得るが、本開示はまた、単一の実施形態でも実施され得る。本明細書中で使用されるセクション見出しは、まとめる目的のみのためであり、説明されている主題を限定するものと解釈されるべきではない。
本開示の特徴は、添付の特許請求の範囲に特に記載されている。本開示の原理が利用される例示的実施形態を示す下記の詳細な説明を参照することにより、および下記で説明する添付図面を考慮して、本開示の特徴および利点のよりよい理解が得られるだろう。
定義
以下の定義は、当該技術分野の定義を補足するものであって本出願を対象としており、関連するまたは関連性のない案件、例えば共通の所有に係る特許または出願に帰するものではない。本明細書に記載されたものと同様または同等の任意の方法および材料を、本開示の試験の実施において使用することができるが、好ましい材料および方法を本明細書で説明する。従って、本明細書で使用される用語は、特定の実施形態を説明する目的のみのためのものであり、限定することを意図するものではない。
別段の定義がない限り、本明細書で使用されるすべての技術的および科学的用語は、本発明が属する分野の当業者によって一般的に理解される意味を有する。以下の参考文献は、当業者に、本発明において使用される多くの用語の一般的な定義を提供する: Singleton et al., Dictionary of Microbiology and Molecular Biology (2nd ed. 1994); The Cambridge Dictionary of Science and Technology (Walker ed., 1988); The Glossary of Genetics, 5th Ed., R. Rieger et al. (eds.), Springer Verlag (1991); and Hale & Marham, The Harper Collins Dictionary of Biology (1991)。
本出願において、単数形の使用は、特に断りのない限り、複数形を含む。本明細書で使用されるように、単数形「a」、「an」、および「the」は、文脈が明確にそうでないことを指示しない限り、複数の指示対象を含むことに留意しなければならない。本出願において、「または」の使用は、別段の記載がない限り、「および/または」を意味しており、かつ包括的であると理解される。さらに、用語「含む(including)」、ならびに他の形態(例えば、「含む(include)」、「含む(includes)」、および「含まれる(included)」)の使用は、非限定的である。
本明細書およびクレームにおいて使用される場合、用語「含む(comprising)」(および「含む(comprise)」および「含む(comprises)」などのそのあらゆる形態)、「有する(having)」(「有する(have)」および「有する(has)」などのそのあらゆる形態)、「含む(including)」(「含む(include)」および「含む(includes)」などのそのあらゆる形態)または「含む(containing)」(「含む(contains)」および「含む(contain)」などのそのあらゆる形態)は、包括的または開放的であり、追加の、記載されていない要素または方法工程を排除しない。本明細書で議論される任意の実施形態は、本開示の任意の方法または組成物に関して実施することができ、逆もまた同様であると考えられる。さらに、本開示の組成物を用いて、本開示の方法を達成することができる。
用語「約(about)」または「およそ(approximately)」は、当業者によって決定されるように、特定の値について許容可能な誤差範囲内であることを意味し、これは、値がどのように測定または決定されるか、すなわち、測定システムの制限に部分的に依存する。例えば、「約」は、当該技術分野における実務によれば、1以内または1を超える標準偏差内であることを意味し得る。あるいは、「約」は、所定の値の最大20%、最大10%、最大5%、または最大1%の範囲を意味し得る。別法として、特に生物学的システムまたはプロセスに関して、この用語は、同じ桁以内、例えば5倍以内、または2倍以内の値を意味することができる。特定の値が出願および特許請求の範囲に記載されている場合、別段の記載がない限り、その特定の値について許容可能な誤差範囲内にあることを意味する「約」という用語が推定されるべきである。
本明細書で提供される範囲は、この範囲内の値の全ての省略表現であると理解される。例えば、1~50の範囲は、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、または50からなる群からの任意の数、数の組合せ、または部分範囲を含むことが理解される。
明細書における「いくつかの実施形態」、「ある実施形態」、「一実施形態」、または「他の実施形態」という言及は、その実施形態に関連して説明される特定の特徴、構造、または特性が、本開示の少なくともいくつかの実施形態に含まれるが、必ずしもすべての実施形態に含まれるとは限らないことを意味する。
「アデノシンデアミナーゼ」とは、アデニンまたはアデノシンの加水分解的脱アミノ化を触媒することができるポリペプチドまたはその断片を意味する。ある態様において、デアミナーゼまたはデアミナーゼドメインは、アデノシンからイノシン、またはデオキシアデノシンからデオキシイノシンへの加水分解的脱アミノ化を触媒するアデノシンデアミナーゼである。ある態様において、アデノシンデアミナーゼは、デオキシリボ核酸 (DNA) 中のアデニンまたはアデノシンの加水分解的脱アミノ化を触媒する。本明細書中で提供されるアデノシンデアミナーゼ(例えば、遺伝子操作されたアデノシンデアミナーゼ、進化させたアデノシンデアミナーゼ)は、細菌などの任意の生物由来であり得る。
いくつかの実施形態において、アデノシンデアミナーゼは、TadAデアミナーゼである。いくつかの実施形態において、TadAデアミナーゼは、TadAバリアントである。いくつかの実施形態において、TadAバリアントは、TadA*8である。いくつかの実施形態において、デアミナーゼまたはデアミナーゼドメインは、生物(例えば、ヒト、チンパンジー、ゴリラ、サル、ウシ、イヌ、ラット、またはマウス)由来の天然に存在するデアミナーゼのバリアントである。いくつかの実施形態において、デアミナーゼまたはデアミナーゼドメインは、天然には存在しない。例えば、いくつかの実施形態において、デアミナーゼまたはデアミナーゼドメインは、天然に存在するデアミナーゼと少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、少なくとも99.1%、少なくとも99.2%、少なくとも99.3%、少なくとも99.4%、少なくとも99.5%、少なくとも99.6%、少なくとも99.7%、少なくとも99.8%、または少なくとも99.9%同一である。例えば、デアミナーゼドメインは、国際PCT出願番号PCT/2017/045381(国際公開第2018/027078号)およびPCT/US2016/058344(国際公開第2017/070632号)で説明されており、これらのそれぞれは、その全体が参照により本明細書に組み込まれる。同様に、Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017); Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017))、およびRees, H.A., et al., “Base editing: precision chemistry on the genome and transcriptome of living cells.” Nat Rev Genet. 2018 Dec;19(12):770-788. doi: 10.1038/s41576-018-0059-1(これらの内容全体が、参照により本明細書に組み込まれる)を参照されたい。
野生型TadA(wt)アデノシンデアミナーゼは、以下の配列(TadA参照配列とも呼ばれる):
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKKAQSSTD
を有する。
いくつかの実施形態において、アデノシンデアミナーゼは、以下の配列:
MSEVEFSHEY WMRHALTLAK RARDEREVPV GAVLVLNNRV IGEGWNRAIG LHDPTAHAEI MALRQGGLVM QNYRLIDATL YVTFEPCVMC AGAMIHSRIG RVVFGVRNAK TGAAGSLMDV LHYPGMNHRV EITEGILADE CAALLCYFFR MPRQVFNAQK KAQSSTD
中での改変を含む(TadA*7.10とも呼ばれる)。
いくつかの実施形態において、TadA*7.10は、少なくとも1つの改変を含む。いくつかの実施形態において、TadA*7.10は、アミノ酸82および/または166での改変を含む。特定の実施形態において、上記で参照される配列のバリアントは、以下の改変: Y147T、Y147R、Q154S、Y123H、V82S、T166R、および/またはQ154Rのうちの1つまたは複数を含む。改変Y123Hはまた、本明細書では、H123H(Y123H (wt)に戻された、TadA*7.10における改変H123Y)とも称される。他の実施形態において、TadA*7.10配列のバリアントは、
Y147T+Q154R;Y147T+Q154S;Y147R+Q154S;V82S+Q154S;V82S+Y147R;V82S+Q154R;V82S+Y123H;I76Y+V82S;V82S+Y123H+Y147T;V82S+Y123H+Y147R;V82S+Y123H+Q154R;Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y123H+Y147R+Q154R+I76Y;V82S+Y123H+Y147R+Q154R;およびI76Y+V82S+Y123H+Y147R+Q154R
の群から選択される改変の組合せを含む。
他の実施形態において、本発明は、TadA*7.10、TadA参照配列、または別のTadA中の対応する突然変異に対して残基149、150、151、152、153、154、155、156、または157で始まるC末端の欠失を含む欠失(例えばTadA*8)を含むアデノシンデアミナーゼバリアントを提供する。他の実施形態において、アデノシンデアミナーゼバリアントは、以下の改変のうちの1つまたは複数を含むTadA(例えばTadA*8)モノマーである:TadA*7.10、TadA参照配列、または別のTadA中の対応する突然変異に対するY147T、Y147R、Q154S、Y123H、V82S、T166R、および/またはQ154R。他の実施形態において、アデノシンデアミナーゼバリアントは、TadA*7.10、TadA参照配列、または別のTadA中の対応する突然変異に対する
Y147T+Q154R;Y147T+Q154S;Y147R+Q154S;V82S+Q154S;V82S+Y147R;V82S+Q154R;V82S+Y123H;I76Y+V82S;V82S+Y123H+Y147T;V82S+Y123H+Y147R;V82S+Y123H+Q154R;Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y123H+Y147R+Q154R+I76Y;V82S+Y123H+Y147R+Q154R;
およびI76Y + V82S + Y123H + Y147R + Q154Rの群から選択される改変の組合せを含むモノマーである。
さらに他の実施形態において、アデノシンデアミナーゼバリアントは、TadA*7.10、TadA参照配列、または別のTadA中の対応する突然変異に対する以下の改変Y147T、Y147R、Q154S、Y123H、V82S、T166R、および/またはQ154Rのうちの1つまたは複数をそれぞれ有する2つのアデノシンデアミナーゼドメイン(例えばTadA*8)を含むホモ二量体である。他の実施形態において、アデノシンデアミナーゼバリアントは、TadA*7.10、TadA参照配列、または別のTadA中の対応する突然変異に対する
Y147T+Q154R;Y147T+Q154S;Y147R+Q154S;V82S+Q154S;V82S+Y147R;V82S+Q154R;V82S+Y123H;I76Y+V82S;V82S+Y123H+Y147T;V82S+Y123H+Y147R;V82S+Y123H+Q154R;Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y123H+Y147R+Q154R+I76Y;V82S+Y123H+Y147R+Q154R;
およびI76Y + V82S + Y123H + Y147R + Q154Rの群から選択される改変の組合せをそれぞれ有する2つのアデノシンデアミナーゼドメイン(例えばTadA*8)を含むホモ二量体である。
他の実施形態において、アデノシンデアミナーゼバリアントは、野生型TadAアデノシンデアミナーゼドメインと、TadA*7.10、TadA参照配列、または別のTadA中の対応する突然変異に対する以下の改変Y147T、Y147R、Q154S、Y123H、V82S、T166R、および/またはQ154Rのうちの1つまたは複数を含むアデノシンデアミナーゼバリアントドメイン(例えばTadA*8)とを含むヘテロ二量体である。他の実施形態において、アデノシンデアミナーゼバリアントは、野生型TadAアデノシンデアミナーゼドメインと、TadA*7.10、TadA参照配列、または別のTadA中の対応する突然変異に対する
Y147T+Q154R;Y147T+Q154S;Y147R+Q154S;V82S+Q154S;V82S+Y147R;V82S+Q154R;V82S+Y123H;I76Y+V82S;V82S+Y123H+Y147T;V82S+Y123H+Y147R;V82S+Y123H+Q154R;Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y123H+Y147R+Q154R+I76Y;V82S+Y123H+Y147R+Q154R;およびI76Y+V82S+Y123H+Y147R+Q154R、
の群から選択される改変の組合せを含むアデノシンデアミナーゼバリアントドメイン(例えばTadA*8)とを含むヘテロ二量体である。
他の実施形態において、アデノシンデアミナーゼバリアントは、TadA*7.10ドメインと、TadA*7.10、TadA参照配列、または別のTadA中の対応する突然変異に対する以下の改変Y147T、Y147R、Q154S、Y123H、V82S、T166R、および/またはQ154Rのうちの1つまたは複数を含むアデノシンデアミナーゼバリアントドメイン(例えばTadA*8)とを含むヘテロ二量体である。他の実施形態において、アデノシンデアミナーゼバリアントは、TadA*7.10ドメインと、TadA*7.10、TadA参照配列、または別のTadA中の対応する突然変異に対する以下の改変:
Y147T+Q154R;Y147T+Q154S;Y147R+Q154S;V82S+Q154S;V82S+Y147R;V82S+Q154R;V82S+Y123H;I76Y+V82S;V82S+Y123H+Y147T;V82S+Y123H+Y147R;V82S+Y123H+Q154R;Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y123H+Y147R+Q154R+I76Y;V82S+Y123H+Y147R+Q154R;
またはI76Y + V82S + Y123H + Y147R + Q154Rの組合せを含むアデノシンデアミナーゼバリアントドメイン(例えばTadA*8)とを含むヘテロ二量体である。
一実施形態において、アデノシンデアミナーゼは、アデノシンデアミナーゼ活性を有する以下の配列またはその断片:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD
を含むかまたはそれから本質的になるTadA*8である。
いくつかの実施形態において、TadA*8は切詰め型である。いつかの実施形態において、切詰め型のTadA*8は、完全長TadA*8に対して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のN末端アミノ酸残基を欠失している。いくつかの実施形態において、切詰め型のTadA*8は、完全長TadA*8に対して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のC末端アミノ酸残基を欠失している。いくつかの実施形態において、アデノシンデアミナーゼバリアントは、完全長TadA*8である。
特定の実施形態において、アデノシンデアミナーゼヘテロ二量体は、TadA*8ドメインと、以下のうちの1つから選択されるアデノシンデアミナーゼドメインとを含む:
Staphylococcus aureus (S. aureus) TadA:
MGSHMTNDIYFMTLAIEEAKKAAQLGEVPIGAIITKDDEVIARAHNLRETLQQPTAHAEHIAIERAAKVLGSWRLEGCTLYVTLEPCVMCAGTIVMSRIPRVVYGADDPKGGCSGSLMNLLQQSNFNHRAIVDKGVLKEACSTLLTTFFKNLRANKKSTN
Bacillus subtilis (B. subtilis) TadA:
MTQDELYMKEAIKEAKKAEEKGEVPIGAVLVINGEIIARAHNLRETEQRSIAHAEMLVIDEACKALGTWRLEGATLYVTLEPCPMCAGAVVLSRVEKVVFGAFDPKGGCSGTLMNLLQEERFNHQAEVVSGVLEEECGGMLSAFFRELRKKKKAARKNLSE
Salmonella typhimurium (S. typhimurium) TadA:
MPPAFITGVTSLSDVELDHEYWMRHALTLAKRAWDEREVPVGAVLVHNHRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVLQNYRLLDTTLYVTLEPCVMCAGAMVHSRIGRVVFGARDAKTGAAGSLIDVLHHPGMNHRVEIIEGVLRDECATLLSDFFRMRRQEIKALKKADRAEGAGPAV
Shewanella putrefaciens (S. putrefaciens) TadA:
MDEYWMQVAMQMAEKAEAAGEVPVGAVLVKDGQQIATGYNLSISQHDPTAHAEILCLRSAGKKLENYRLLDATLYITLEPCAMCAGAMVHSRIARVVYGARDEKTGAAGTVVNLLQHPAFNHQVEVTSGVLAEACSAQLSRFFKRRRDEKKALKLAQRAQQGIE
Haemophilus influenzae F3031 (H. influenzae) TadA:
MDAAKVRSEFDEKMMRYALELADKAEALGEIPVGAVLVDDARNIIGEGWNLSIVQSDPTΑΗAEIIALRNGAKNIQNYRLLNSTLYVTLEPCTMCAGAILHSRIKRLVFGASDYKTGAIGSRFHFFDDYKMNHTLEITSGVLAEECSQKLSTFFQKRREEKKIEKALLKSLSDK
Caulobacter crescentus (C. crescentus) TadA:
MRTDESEDQDHRMMRLALDAARAAAEAGETPVGAVILDPSTGEVIATAGNGPIAAHDPTAHAEIAAMRAAAAKLGNYRLTDLTLVVTLEPCAMCAGAISHARIGRVVFGADDPKGGAVVHGPKFFAQPTCHWRPEVTGGVLADESADLLRGFFRARRKAKI
Geobacter sulfurreducens (G. sulfurreducens) TadA:
MSSLKKTPIRDDAYWMGKAIREAAKAAARDEVPIGAVIVRDGAVIGRGHNLREGSNDPSAHAEMIAIRQAARRSANWRLTGATLYVTLEPCLMCMGAIILARLERVVFGCYDPKGGAAGSLYDLSADPRLNHQVRLSPGVCQEECGTMLSDFFRDLRRRKKAKATPALFIDERKVPPEP
TadA*7.10
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
「アデノシンデアミナーゼ塩基エディター8(ABE8)ポリペプチド」または「ABE8」は、以下の参照配列:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
のアミノ酸位置82および/または166で改変を含むアデノシンデアミナーゼバリアントを含む、本明細書で定義される塩基エディターを意味する。いくつかの実施形態において、ABE8は、参照配列に対して、本明細書で説明されているさらなる改変を含む。
「アデノシンデアミナーゼ塩基エディター8(ABE8)ポリヌクレオチド」は、ABE8をコードするポリヌクレオチドを意味する。
「投与すること」は、本明細書に記載される1以上の組成物を患者または対象に提供することとして本明細書で言及される。例として、限定するものではないが、組成物の投与、例えば注射は、静脈内 (i.v.) 注射、皮下 (s.c.) 注射、皮内 (i.d.) 注射、腹腔内 (i.p.) 注射または筋肉内(i.m.) 注射によって行われ得る。1つ以上のそのような経路を用いることができる。非経口投与は、例えば、ボーラス注射によって、または経時的に徐々に灌流することによって行うことができる。あるいは、または同時に、投与は経口経路によることができる。
「薬剤(agent)」とは、任意の小分子化合物、抗体、核酸分子、またはポリペプチド、またはそれらの断片を意味する。
「改変」は、本明細書で説明されているもの等の標準技術の既知の方法により検出されるような、遺伝子またはポリペプチドの構造、発現レベル、または活性の変化(例えば、増加または減少)を意味する。本明細書で使用される場合、改変は、ポリヌクレオチドもしくはポリペプチドの配列の変化、または発現レベルの変化(例えば、25%の変化、40%の変化、50%の変化、もしくはより高い変化)を含む。
「改善する」は、疾患の発生または進行の減少、抑制、減衰、低減、停止、または安定化を意味する。
「アナログ」は、同一ではないが、類似の機能的特徴または構造的特徴を有する分子を意味する。例えば、ポリヌクレオチドアナログまたはポリペプチドアナログは、対応する天然に存在するポリヌクレオチドまたはポリペプチドの生物学的活性を保持し、さらには天然に存在するポリヌクレオチドまたはポリペプチドと比較してアナログの機能を増強させる特定の改変を有する。そのような改変は、例えばリガンド結合を変化させることなく、アナログのDNAに対する親和性、効率、特異性、プロテアーゼ抵抗性もしくはヌクレアーゼ抵抗性、膜透過性、および/または半減期を増加させる可能性がある。アナログは、非天然のヌクレオチドまたはアミノ酸を含み得る。
「塩基エディター(BE)」あるいは「核酸塩基エディター(NBE)」とは、ポリヌクレオチドに結合して核酸塩基修飾活性を有する薬剤を意味する。様々な実施形態において、塩基エディターは、核酸塩基修飾ポリペプチド(例えば、デアミナーゼ)および核酸プログラミング可能なヌクレオチド結合ドメインを、ガイドポリヌクレオチド(例えばガイドRNA)とともに含む。様々な実施形態において、該薬剤は、塩基編集活性を有するタンパク質ドメイン、すなわち、核酸分子(例えばDNA)内の塩基(例えばA、T、C、G、U)を改変することができるドメインを含む生体分子複合体である。いくつかの実施形態において、ポリヌクレオチドプログラミング可能なDNA結合ドメインは、デアミナーゼドメインに融合または連結される。1つの実施形態において、該薬剤は、塩基編集活性を有するドメインを含む融合タンパク質である。別の態様において、塩基編集活性を有するタンパク質ドメインは、ガイドRNAに連結される(例えば、ガイドRNA上のRNA結合モチーフおよびデアミナーゼに融合されたRNA結合ドメインを介して)。ある態様において、塩基編集活性を有するドメインは、核酸分子内の塩基を脱アミノ化することができる。ある態様において、塩基エディターは、DNA分子内の1つ以上の塩基を脱アミノ化することができる。ある態様において、塩基エディターは、アデノシン (A) を脱アミノ化することができる。一部の実施形態では、塩基エディターはアデノシン塩基エディター (ABE) である。
いくつかの実施形態において、塩基エディターは、循環置換体(circular permutant)のCas9(例えば、spCAS9またはsaCAS9)および二部分核局在化配列を含む足場にアデノシンデアミナーゼバリアント(例えばTadA*8)をクローニングすることにより生成される(例えばABE8)。循環置換体のCas9は、当該技術分野で既知であり、例えば、Oakes et al., Cell 176, 254-267, 2019で説明されている。例示的な循環置換体を下記に示し、太字の配列は、Cas9に由来する配列を示し、イタリック体の配列は、リンカー配列を示し、下線が引かれた配列は、二部分核局在化配列を示す。
CP5(およびMSP「NGC=Pam Variant with mutations Regular Cas9 likes NGG」PID=タンパク質相互作用ドメイン、および「D10A」ニッカーゼ):
Figure 2022519882000003
いくつかの実施形態において、ABE8は、下記の表7または表9からの塩基エディターから選択される。いくつかの実施形態において、ABE8は、TadAから進化したアデノシンデアミナーゼバリアントを含む。いくつかの実施形態において、ABE8のアデノシンデアミナーゼバリアントは、下記の表7または表9で説明されているTadA*8バリアントである。いくつかの実施形態において、アデノシンデアミナーゼバリアントは、Y147T、Y147R、Q154S、Y123H、V82S、T166R、および/またはQ154Rの群から選択される改変のうちの1つまたは複数を含むTadA*7.10バリアント(例えばTadA*8)である。様々な実施形態では、ABE8は、
Y147T+Q154R;Y147T+Q154S;Y147R+Q154S;V82S+Q154S;V82S+Y147R;V82S+Q154R;V82S+Y123H;I76Y+V82S;V82S+Y123H+Y147T;V82S+Y123H+Y147R;V82S+Y123H+Q154R;Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y123H+Y147R+Q154R+I76Y;V82S+Y123H+Y147R+Q154R;
およびI76Y + V82S + Y123H + Y147R + Q154Rの群から選択される改変の組合せを有するTadA*7.10バリアント(例えばTadA*8)を含む。いくつかの実施形態において、ABE8は、モノマー構築物である。いくつかの実施形態において、ABE8は、ヘテロ二量体構築物である。いくつかの実施形態において、アデノシンデアミナーゼ塩基エディター8(ABE8)は、配列:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD
を含む。
ある態様において、ポリヌクレオチドプログラミング可能なDNA結合ドメインは、CRISPR関連(例えばCasまたはCpf1)酵素である。ある態様において、塩基エディターは、デアミナーゼドメインに融合された、触媒的には死んだCas9 (dCas9) である。ある態様において、塩基エディターは、デアミナーゼドメインに融合されたCas9ニッカーゼ (nCas9) である。塩基エディターの詳細は、国際PCT出願番号PCT/2017/045381(国際公開第2018/027078号)およびPCT/US 2016/058344(国際公開第2017/070632号)に記載されており、それぞれその全体が参照により本明細書に組み込まれる。Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017); Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity”Science Advances 3:eaao4774 (2017), およびRees, H.A., et al., “Base editing: precision chemistry on the genome and transcriptome of living cells.” Nat Rev Genet. 2018 Dec;19(12):770-788. doi: 10.1038/s41576-018-0059-1も参照のこと(その内容全体を参照により本明細書に組み込む) 。
例として、本明細書で説明されている塩基編集組成物、システム、および方法で使用されるアデニン塩基エディター(ABE)は、下記で提供される核酸配列(8877個の塩基対)(Addgene, Watertown, MA.; Gaudelli NM, et al., Nature. 2017 Nov 23;551(7681):464-471. doi: 10.1038/nature24644; Koblan LW, et al., Nat Biotechnol. 2018 Oct;36(9):843-846. doi: 10.1038/nbt.4172.)を有する。ABE核酸配列に対して少なくとも95%以上の同一性を有するポリヌクレオチド配列も包含される。
ATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACAT
GACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGG
TTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTG
ACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCC
ATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACCGT
CAGATCCGCTAGAGATCCGCGGCCGCTAATACGACTCACTATAGGGAGAGCCGCCACCATGAAACGGACA
GCCGACGGAAGCGAGTTCGAGTCACCAAAGAAGAAGCGGAAAGTCTCTGAAGTCGAGTTTAGCCACGAGT
ATTGGATGAGGCACGCACTGACCCTGGCAAAGCGAGCATGGGATGAAAGAGAAGTCCCCGTGGGCGCCGT
GCTGGTGCACAACAATAGAGTGATCGGAGAGGGATGGAACAGGCCAATCGGCCGCCACGACCCTACCGCA
CACGCAGAGATCATGGCACTGAGGCAGGGAGGCCTGGTCATGCAGAATTACCGCCTGATCGATGCCACCC
TGTATGTGACACTGGAGCCATGCGTGATGTGCGCAGGAGCAATGATCCACAGCAGGATCGGAAGAGTGGT
GTTCGGAGCACGGGACGCCAAGACCGGCGCAGCAGGCTCCCTGATGGATGTGCTGCACCACCCCGGCATG
AACCACCGGGTGGAGATCACAGAGGGAATCCTGGCAGACGAGTGCGCCGCCCTGCTGAGCGATTTCTTTA
GAATGCGGAGACAGGAGATCAAGGCCCAGAAGAAGGCACAGAGCTCCACCGACTCTGGAGGATCTAGCGG
AGGATCCTCTGGAAGCGAGACACCAGGCACAAGCGAGTCCGCCACACCAGAGAGCTCCGGCGGCTCCTCC
GGAGGATCCTCTGAGGTGGAGTTTTCCCACGAGTACTGGATGAGACATGCCCTGACCCTGGCCAAGAGGG
CACGCGATGAGAGGGAGGTGCCTGTGGGAGCCGTGCTGGTGCTGAACAATAGAGTGATCGGCGAGGGCTG
GAACAGAGCCATCGGCCTGCACGACCCAACAGCCCATGCCGAAATTATGGCCCTGAGACAGGGCGGCCTG
GTCATGCAGAACTACAGACTGATTGACGCCACCCTGTACGTGACATTCGAGCCTTGCGTGATGTGCGCCG
GCGCCATGATCCACTCTAGGATCGGCCGCGTGGTGTTTGGCGTGAGGAACGCAAAAACCGGCGCCGCAGG
CTCCCTGATGGACGTGCTGCACTACCCCGGCATGAATCACCGCGTCGAAATTACCGAGGGAATCCTGGCA
GATGAATGTGCCGCCCTGCTGTGCTATTTCTTTCGGATGCCTAGACAGGTGTTCAATGCTCAGAAGAAGG
CCCAGAGCTCCACCGACTCCGGAGGATCTAGCGGAGGCTCCTCTGGCTCTGAGACACCTGGCACAAGCGA
GAGCGCAACACCTGAAAGCAGCGGGGGCAGCAGCGGGGGGTCAGACAAGAAGTACAGCATCGGCCTGGCC
ATCGGCACCAACTCTGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGG
TGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGAGCCCTGCTGTTCGACAGCGGCGA
AACAGCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAGAACCGGATCTGC
TATCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGT
CCTTCCTGGTGGAAGAGGATAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGACGAGGTGGC
CTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGAC
CTGCGGCTGATCTATCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACC
TGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGA
GGAAAACCCCATCAACGCCAGCGGCGTGGACGCCAAGGCCATCCTGTCTGCCAGACTGAGCAAGAGCAGA
CGGCTGGAAAATCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAATGGCCTGTTCGGAAACCTGATTGCCC
TGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAG
CAAGGACACCTACGACGACGACCTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTT
CTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGACATCCTGAGAGTGAACACCGAGATCACCA
AGGCCCCCCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGACCTGACCCTGCTGAAAGC
TCTCGTGCGGCAGCAGCTGCCTGAGAAGTACAAAGAGATTTTCTTCGACCAGAGCAAGAACGGCTACGCC
GGCTACATTGACGGCGGAGCCAGCCAGGAAGAGTTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGG
ACGGCACCGAGGAACTGCTCGTGAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAA
CGGCAGCATCCCCCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGCGGCAGGAAGATTTTTAC
CCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCCGCATCCCCTACTACGTGGGCC
CTCTGGCCAGGGGAAACAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACCCCCTGGAA
CTTCGAGGAAGTGGTGGACAAGGGCGCTTCCGCCCAGAGCTTCATCGAGCGGATGACCAACTTCGATAAG
AACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTATAACGAGC
TGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTCCTGAGCGGCGAGCAGAAAAAGGC
CATCGTGGACCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAG
AAAATCGAGTGCTTCGACTCCGTGGAAATCTCCGGCGTGGAAGATCGGTTCAACGCCTCCCTGGGCACAT
ACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAATGAGGAAAACGAGGACATTCTGGA
AGATATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACCTATGCC
CACCTGTTCGACGACAAAGTGATGAAGCAGCTGAAGCGGCGGAGATACACCGGCTGGGGCAGGCTGAGCC
GGAAGCTGATCAACGGCATCCGGGACAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGG
CTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAA
GCCCAGGTGTCCGGCCAGGGCGATAGCCTGCACGAGCACATTGCCAATCTGGCCGGCAGCCCCGCCATTA
AGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTCGTGAAAGTGATGGGCCGGCACAAGCCCGA
GAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACCCAGAAGGGACAGAAGAACAGCCGCGAGAGA
ATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACA
CCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGGCGGGATATGTACGTGGACCAGGA
ACTGGACATCAACCGGCTGTCCGACTACGATGTGGACCATATCGTGCCTCAGAGCTTTCTGAAGGACGAC
TCCATCGACAACAAGGTGCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCTCCGAAG
AGGTCGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATTACCCAGAGAAAGTT
CGACAATCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAG
CTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATCCTGGACTCCCGGATGAACACTAAGTACG
ACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTGATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCG
GAAGGATTTCCAGTTTTACAAAGTGCGCGAGATCAACAACTACCACCACGCCCACGACGCCTACCTGAAC
GCCGTCGTGGGAACCGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACA
AGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAAATCGGCAAGGCTACCGCCAAGTACTT
CTTCTACAGCAACATCATGAACTTTTTCAAGACCGAGATTACCCTGGCCAACGGCGAGATCCGGAAGCGG
CCTCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCCGGGATTTTGCCACCGTGC
GGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAAAAGACCGAGGTGCAGACAGGCGGCTTCAGCAA
AGAGTCTATCCTGCCCAAGAGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAG
TACGGCGGCTTCGACAGCCCCACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGT
CCAAGAAACTGAAGAGTGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAA
TCCCATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTGCCTAAG
TACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCCGGCGAACTGCAGAAGGGAA
ACGAACTGGCCCTGCCCTCCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGG
CTCCCCCGAGGATAATGAGCAGAAACAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATC
GAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAATCTGGACAAAGTGCTGTCCGCCT
ACAACAAGCACCGGGATAAGCCCATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAA
TCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAA
GAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTC
AGCTGGGAGGTGACTCTGGCGGCTCAAAAAGAACCGCCGACGGCAGCGAATTCGAGCCCAAGAAGAAGAG
GAAAGTCTAACCGGTCATCATCACCATCACCATTGAGTTTAAACCCGCTGATCAGCCTCGACTGTGCCTT
CTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCAC
TGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGT
GGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCT
CTATGGCTTCTGAGGCGGAAAGAACCAGCTGGGGCTCGATACCGTCGACCTCTAGCTAGAGCTTGGCGTA
ATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGA
AGCATAAAGTGTAAAGCCTAGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGC
CCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGG
TTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGA
GCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACA
TGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCT
CCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAA
AGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGAT
ACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTC
GGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTA
TCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTA
ACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTA
CACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGC
TCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCA
GAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACACTCAGTGGAACGAAAACTC
ACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGA
AGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGG
CACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTAC
GATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCA
GATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCT
CCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGT
TGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCC
CAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGA
TCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTAC
TGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGT
ATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAA
AAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAG
TTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGA
GCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATAC
TCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATG
TATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCGACGGA
TCGGGAGATCGATCTCCCGATCCCCTAGGGTCGACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAA
GCCAGTATCTGCTCCCTGCTTGTGTGTTGGAGGTCGCTGAGTAGTGCGCGAGCAAAATTTAAGCTACAAC
AAGGCAAGGCTTGACCGACAATTGCATGAAGAATCTGCTTAGGGTTAGGCGTTTTGCGCTGCTTCGCGAT
GTACGGGCCAGATATACGCGTTGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCAT
TAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCC
CAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCAT
TGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATC
「塩基編集活性」とは、ポリヌクレオチド内の塩基を化学的に改変させるように作用することを意味する。一実施形態では、第1の塩基が第2の塩基に変換される。一実施形態では、塩基編集活性は、シチジンデアミナーゼ活性、例えば標的C・GをT・Aに変換する活性である。別の実施形態では、塩基編集活性は、アデノシンまたはアデニンデアミナーゼ活性、例えばA・TをG・Cに変換する活性である。別の実施形態では、塩基編集活性は、シチジンデアミナーゼ活性、例えば標的C・GをT・Aに変換する活性であり、アデノシンまたはアデニンデアミナーゼ活性、例えばA・TをG・Cに変換する活性である。いくつかの実施形態において、塩基編集活性を、編集の効率により評価する。塩基編集効率を任意の適切な手段により測定し得、例えば、サンガー配列決定または次世代配列決定により測定し得る。いくつかの実施形態において、塩基編集効率を、核酸塩基の変換が塩基エディターによりもたらされた総配列決定読み取りの割合により測定し、例えば、標的A.T塩基対がG.C塩基対へと変換された総配列決定読み取りの割合により測定する。いくつかの実施形態において、塩基編集効率を、塩基編集を細胞の集団で実施した場合に、核酸塩基の変換が塩基エディターによりもたらされた総細胞の割合により測定する。
用語「塩基エディターシステム」は、標的ヌクレオチド配列の核酸塩基を編集するためのシステムを指す。様々な実施形態において、塩基エディターシステムは、(1)ポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン(例えばCas9);(2)前記核酸塩基を脱アミノ化するためのデアミナーゼドメイン(例えばアデノシンデアミナーゼ);および(3)1つまたは複数のガイドポリヌクレオチド(例えばガイドRNA)を含む。いくつかの実施形態において、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、ポリヌクレオチドプログラム可能なDNA結合ドメインである。いくつかの実施形態において、塩基エディターは、アデニンまたはアデノシン塩基エディター(ABE)である。いくつかの実施形態において、塩基エディターシステムは、ABE8である。
いくつかの実施形態において、塩基エディターシステムは、複数の塩基編集成分を含み得る。例えば、塩基エディターシステムは、複数のデアミナーゼを含み得る。いくつかの実施形態において、塩基エディターシステムは、1つまたは複数のアデノシンデアミナーゼを含み得る。いくつかの実施形態において、単一のガイドポリヌクレオチドを利用して、異なるデアミナーゼを標的核酸配列にターゲティングすることができる。いくつかの実施形態において、一対のガイドポリヌクレオチドが、異なるデアミナーゼを標的核酸配列にターゲティングするために利用され得る。
塩基エディターシステムのデアミナーゼドメインおよびポリヌクレオチドプログラム可能なヌクレオチド結合成分は、互いに、共有結合的にもしくは非共有結合的に会合され得るか、またはこれらの会合および相互作用の任意の組合せにより会合され得る。例えば、いくつかの実施形態において、デアミナーゼドメインは、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインにより標的ヌクレオチド配列にターゲティングされ得る。いくつかの実施形態において、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、デアミナーゼドメインに融合され得るか、または連結され得る。いくつかの実施形態において、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、デアミナーゼドメインと非共有結合的に相互作用するかまたは会合することにより、デアミナーゼドメインを標的ヌクレオチド配列にターゲティングさせ得る。例えば、いくつかの実施形態において、デアミナーゼドメインは、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインの一部であるさらなる異種部分またはドメインと相互作用し得るか、会合し得るか、または複合体を形成し得るさらなる異種部分またはドメインを含み得る。いくつかの実施形態において、このさらなる異種部分は、ポリペプチドと結合し得るか、相互作用し得るか、会合し得るか、または複合体を形成し得る。いくつかの実施形態において、このさらなる異種部分は、ポリヌクレオチドと結合し得るか、相互作用し得るか、会合し得るか、または複合体を形成し得る。いくつかの実施形態において、このさらなる異種部分は、ガイドポリヌクレオチドと結合し得る。いくつかの実施形態において、このさらなる異種部分は、ポリペプチドリンカーに結合し得る。いくつかの実施形態において、このさらなる異種部分は、ポリヌクレオチドリンカーに結合し得る。このさらなる異種部分は、タンパク質ドメインであり得る。いくつかの実施形態において、このさらなる異種部分は、K相同(KH)ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、ステリルアルファモチーフ、テロメラーゼKu結合モチーフおよびKuタンパク質、テロメラーゼSm7結合モチーフおよびSm7タンパク質、またはRNA認識モチーフであり得る。
塩基エディターシステムは、ガイドポリヌクレオチド成分をさらに含み得る。塩基エディターシステムの成分は、互いに、共有結合、非共有結合的相互作用、またはこれらの会合および相互作用の任意の組合せにより会合され得ることを理解すべきである。いくつかの実施形態において、デアミナーゼドメインは、ガイドポリヌクレオチドにより標的ヌクレオチド配列にターゲティングされ得る。例えば、いくつかの実施形態において、デアミナーゼドメインは、ガイドポリヌクレオチドの一部またはセグメント(例えばポリヌクレオチドモチーフ)と相互作用し得るか、会合し得るか、または複合体を形成し得るさらなる異種部分またはドメイン(例えば、RNA結合タンパク質またはDNA結合タンパク質等のポリヌクレオチド結合ドメイン)を含み得る。いくつかの実施形態において、このさらなる異種部分またはドメイン(例えば、RNA結合タンパク質またはDNA結合タンパク質等のポリヌクレオチド結合ドメイン)は、デアミナーゼドメインに融合され得るか、または連結され得る。いくつかの実施形態において、このさらなる異種部分は、ポリペプチドと結合し得るか、相互作用し得るか、会合し得るか、または複合体を形成し得る。いくつかの実施形態において、このさらなる異種部分は、ポリヌクレオチドと結合し得るか、相互作用し得るか、会合し得るか、または複合体を形成し得る。いくつかの実施形態において、このさらなる異種部分は、ガイドポリヌクレオチドに結合し得る。いくつかの実施形態において、このさらなる異種部分は、ポリペプチドリンカーに結合し得る。いくつかの実施形態において、このさらなる異種部分は、ポリヌクレオチドリンカーに結合し得る。このさらなる異種部分は、タンパク質ドメインであり得る。いくつかの実施形態において、このさらなる異種部分は、K相同(KH)ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、ステリルアルファモチーフ、テロメラーゼKu結合モチーフおよびKuタンパク質、テロメラーゼSm7結合モチーフおよびSm7タンパク質、またはRNA認識モチーフであり得る。
いくつかの実施形態において、塩基エディターシステムは、塩基除去修復(BER)成分の阻害因子をさらに含み得る。塩基エディターシステムの成分は、互いに、共有結合、非共有結合的相互作用、またはこれらの会合および相互作用の任意の組合せにより会合され得ることを理解すべきである。BER成分の阻害因子は、BER阻害因子を含み得る。いくつかの実施形態において、BERの阻害因子は、ウラシルDNAグリコシラーゼ阻害因子(UGI)であり得る。いくつかの実施形態において、BERの阻害因子は、イノシンBER阻害因子であり得る。いくつかの実施形態において、BERの阻害因子は、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインにより標的ヌクレオチド配列にターゲティングされ得る。いくつかの実施形態において、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、BERの阻害因子に融合され得るか、または連結され得る。いくつかの実施形態において、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、デアミナーゼドメインおよびBERの阻害因子に融合され得るか、または連結され得る。いくつかの実施形態において、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、BERの阻害因子との非共有結合的な相互作用または会合により、標的ヌクレオチド配列にBERの阻害因子をターゲティングさせ得る。例えば、いくつかの実施形態において、BER成分の阻害因子は、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインの一部であるさらなる異種部分またはドメインと相互作用し得るか、会合し得るか、または複合体を形成し得るさらなる異種部分またはドメインを含み得る。
いくつかの実施形態において、BERの阻害因子は、ガイドポリヌクレオチドにより標的ヌクレオチド配列にターゲティングされ得る。例えば、いくつかの実施形態において、BERの阻害因子は、ガイドポリヌクレオチドの一部またはセグメント(例えばポリヌクレオチドモチーフ)と相互作用し得るか、会合し得るか、または複合体を形成し得るさらなる異種部分またはドメイン(例えば、RNA結合タンパク質またはDNA結合タンパク質等のポリヌクレオチド結合ドメイン)を含み得る。いくつかの実施形態において、ガイドポリヌクレオチドのさらなる異種部分またはドメイン(例えば、RNA結合タンパク質またはDNA結合タンパク質等のポリヌクレオチド結合ドメイン)は、BERの阻害因子に融合され得るか、または連結され得る。いくつかの実施形態において、このさらなる異種部分は、ポリヌクレオチドと結合し得るか、相互作用し得るか、会合し得るか、または複合体を形成し得る。いくつかの実施形態において、このさらなる異種部分は、ガイドポリヌクレオチドに結合し得る。いくつかの実施形態において、このさらなる異種部分は、ポリペプチドリンカーに結合し得る。いくつかの実施形態において、このさらなる異種部分は、ポリヌクレオチドリンカーに結合し得る。このさらなる異種部分は、タンパク質ドメインであり得る。いくつかの実施形態において、このさらなる異種部分は、K相同(KH)ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、ステリルアルファモチーフ、テロメラーゼKu結合モチーフおよびKuタンパク質、テロメラーゼSm7結合モチーフおよびSm7タンパク質、またはRNA認識モチーフであり得る。
用語「Cas9」または「Cas9ドメイン」は、Cas9タンパク質またはその断片(例えばCas9の活性、不活性、または部分的に活性なDNA切断ドメイン、および/またはCas9のgRNA結合ドメインを含むタンパク質)を含むRNA誘導ヌクレアーゼを指す。Cas9ヌクレアーゼは、casnlヌクレアーゼまたはCRISPR(clustered regularly interspaced short palindromic repeat)結合ヌクレアーゼと呼ばれることもある。CRISPRは、可動遺伝要素(ウイルス、転移因子、および接合プラスミド)に対する防御を提供する適応免疫系である。CRISPRクラスターは、スペーサー、先行する可動要素に相補的な配列、および標的侵入核酸を含む。CRISPRクラスターは転写され、CRISPR RNA (crRNA)へとプロセシングされる。II型CRISPRシステムでは、pre-crRNAの正しいプロセシングには、トランスコード小RNA (tracrRNA)、内因性リボヌクレアーゼ3(rnc)、およびCas9タンパク質が必要である。tracrRNAは、リボヌクレアーゼ3によるpre-crRNAのプロセシングのガイドとなる。続いて、Cas9/crRNA/tracrRNAが、スペーサーに相補的な線状または環状のdsDNA標的をエンドヌクレアーゼで切断する。crRNAに相補的でない標的鎖は、最初にエンドヌクレアーゼにより切断され、次いで、エキソヌクレアーゼにより3'-5'に整えられる。自然界では、DNAの結合および切断には、典型的には、タンパク質および両方のRNAが必要である。しかしながら、crRNAおよびtracrRNAの両方の側面を単一のRNA種に組み込むように、単一ガイドRNA(「sgRNA」または単に「gRNA」)を操作し得る。例えば、Jinek M., Chylinski K., Fonfara I., Hauer M., Doudna J.A., Charpentier E. Science 337:816-821(2012)(この内容全体が、参照により本明細書に組み込まれる)を参照されたい。Cas9は、CRISPR反復配列中の短いモチーフ(PAMまたはプロトスペーサー隣接モチーフ)を認識して、自己対非自己を区別することを助ける。Cas9ヌクレアーゼの配列および構造は、当業者に公知である(例えば、“Complete genome sequence of an M1 strain of Streptococcus pyogenes.”Ferretti et al., J.J., McShan W.M., Ajdic D.J., Savic D.J., Savic G., Lyon K., Primeaux C., Sezate S., Suvorov A.N., Kenton S., Lai H.S., Lin S.P., Qian Y., Jia H.G., Najar F.Z., Ren Q., Zhu H., Song L., White J., Yuan X., Clifton S.W., Roe B.A., McLaughlin R.E., Proc. Natl. Acad. Sci. U.S.A. 98:4658-4663(2001); “CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III.”Deltcheva E., Chylinski K., Sharma C.M., Gonzales K., Chao Y., Pirzada Z.A., Eckert M.R., Vogel J., Charpentier E., Nature 471:602-607(2011);および“A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.” Jinek M., Chylinski K., Fonfara I., Hauer M., Doudna J.A., Charpentier E. Science 337:816-821(2012)(これらの内容全体が、参照により本明細書に組み込まれる)を参照されたい)。Cas9オーソログは、限定されるものではないが、S.pyogenesおよびS.thermophilusを含む種々の種において説明されている。さらなる適切なCas9ヌクレアーゼおよび配列は、本開示に基づいて当業者に明らかとなり、そのようなCas9ヌクレアーゼおよび配列として、Chylinski, Rhun, and Charpentier, “The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems”(2013) RNA Biology 10:5, 726-737(この内容全体が、参照により本明細書に組み込まれる)で開示されている生物および遺伝子座由来のCas9配列が挙げられる。
例示的なCasは、Streptococcus pyogenes Cas9 (spCas9)であり、このアミノ酸配列を以下に示す:
Figure 2022519882000004
(一重下線:HNHドメイン;二重下線:RuvCドメイン)
ヌクレアーゼ不活性化Cas9タンパク質は、「dCas9」タンパク質(ヌクレアーゼ「不活」Cas9)または触媒的に不活性なCAs9と互換的に称され得る。不活性なDNA切断ドメインを有するCas9タンパク質(またはその断片)を生成する方法は、既知である(例えば、Jinek et al., Science. 337:816-821(2012); Qi et al., “Repurposing CRISPR as an RNA-Guided Platform for Sequence-Specific Control of Gene Expression” (2013) Cell. 28;152(5):1173-83(これらのそれぞれの内容全体が参照により本明細書に組み込まれる)を参照されたい)。例えば、Cas9のDNA切断ドメインは、以下の2つのサブドメイン:HNHヌクレアーゼサブドメインおよびRuvC1サブドメインを含むことが知られている。HNHサブドメインは、gRNAに相補的な鎖を切断し、RuvC1サブドメインは、非相補的な鎖を切断する。これらのサブドメイン内の突然変異は、Cas9のヌクレアーゼ活性を抑制し得る。例えば、突然変異D10AおよびH840Aは、S. pyogenes Cas9のヌクレアーゼ活性を完全に不活性化する(Jinek et al., Science. 337:816-821(2012); Qi et al., Cell. 28;152(5):1173-83 (2013))。いくつかの実施形態において、Cas9ヌクレアーゼは、不活性な(例えば不活性化された)DNA切断ドメインを有し、即ち、Cas9は、「nCas9」タンパク質(「ニッカーゼ」Cas9)と称されるニッカーゼである。いくつかの実施形態において、Cas9の断片を含むタンパク質が提供される。例えば、いくつかの実施形態において、タンパク質は、以下の2つのCas9ドメインのうちの1つを含む:(1)Cas9のgRNA結合ドメイン;(2)Cas9のDNA切断ドメイン。いくつかの実施形態において、Cas9またはその断片を含むタンパク質は、「Cas9バリアント」と称される。Cas9バリアントは、Cas9またはその断片と相同性を共有する。例えば、Cas9バリアントは、野生型Cas9と少なくとも約70%同一であるか、少なくとも約80%同一であるか、少なくとも約90%同一であるか、少なくとも約95%同一であるか、少なくとも約96%同一であるか、少なくとも約97%同一であるか、少なくとも約98%同一であるか、少なくとも約99%同一であるか、少なくとも約99.5%同一であるか、または少なくとも約99.9%同一である。いくつかの実施形態において、Cas9バリアントは、野生型Cas9と比較して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50個、またはより多くのアミノ酸の変化を有し得る。いくつかの実施形態において、Cas9バリアントは、野生型Cas9の対応する断片と少なくとも約70%同一であるか、少なくとも約80%同一であるか、少なくとも約90%同一であるか、少なくとも約95%同一であるか、少なくとも約96%同一であるか、少なくとも約97%同一であるか、少なくとも約98%同一であるか、少なくとも約99%同一であるか、少なくとも約99.5%同一であるか、または少なくとも約99.9%同一であるような、Cas9の断片(例えば、gRNA結合ドメインまたはDNA切断ドメイン)を含む。いくつかの実施形態において、この断片は、対応する野生型Cas9のアミノ酸長の少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%同一、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%である。
いくつかの実施形態において、この断片は、少なくとも100個のアミノ酸の長さである。いくつかの実施形態において、この断片は、少なくとも100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、または少なくとも1300個のアミノ酸の長さである。
いくつかの実施形態において、野生型Cas9は、Streptococcus pyogenes由来のCas9に対応する(NCBI参照配列: NC_017053.1、ヌクレオチドおよびアミノ酸の配列は以下の通り)。
ATGGATAAGAAATACTCAATAGGCTTAGATATCGGCACAAATAGCGTCGGATGGGCGGTGATCACTGATGATTATAAGGTTCCGTCTAAAAAGTTCAAGGTTCTGGGAAATACAGACCGCCACAGTATCAAAAAAAATCTTATAGGGGCTCTTTTATTTGGCAGTGGAGAGACAGCGGAAGCGACTCGTCTCAAACGGACAGCTCGTAGAAGGTATACACGTCGGAAGAATCGTATTTGTTATCTACAGGAGATTTTTTCAAATGAGATGGCGAAAGTAGATGATAGTTTCTTTCATCGACTTGAAGAGTCTTTTTTGGTGGAAGAAGACAAGAAGCATGAACGTCATCCTATTTTTGGAAATATAGTAGATGAAGTTGCTTATCATGAGAAATATCCAACTATCTATCATCTGCGAAAAAAATTGGCAGATTCTACTGATAAAGCGGATTTGCGCTTAATCTATTTGGCCTTAGCGCATATGATTAAGTTTCGTGGTCATTTTTTGATTGAGGGAGATTTAAATCCTGATAATAGTGATGTGGACAAACTATTTATCCAGTTGGTACAAATCTACAATCAATTATTTGAAGAAAACCCTATTAACGCAAGTAGAGTAGATGCTAAAGCGATTCTTTCTGCACGATTGAGTAAATCAAGACGATTAGAAAATCTCATTGCTCAGCTCCCCGGTGAGAAGAGAAATGGCTTGTTTGGGAATCTCATTGCTTTGTCATTGGGATTGACCCCTAATTTTAAATCAAATTTTGATTTGGCAGAAGATGCTAAATTACAGCTTTCAAAAGATACTTACGATGATGATTTAGATAATTTATTGGCGCAAATTGGAGATCAATATGCTGATTTGTTTTTGGCAGCTAAGAATTTATCAGATGCTATTTTACTTTCAGATATCCTAAGAGTAAATAGTGAAATAACTAAGGCTCCCCTATCAGCTTCAATGATTAAGCGCTACGATGAACATCATCAAGACTTGACTCTTTTAAAAGCTTTAGTTCGACAACAACTTCCAGAAAAGTATAAAGAAATCTTTTTTGATCAATCAAAAAACGGATATGCAGGTTATATTGATGGGGGAGCTAGCCAAGAAGAATTTTATAAATTTATCAAACCAATTTTAGAAAAAATGGATGGTACTGAGGAATTATTGGTGAAACTAAATCGTGAAGATTTGCTGCGCAAGCAACGGACCTTTGACAACGGCTCTATTCCCCATCAAATTCACTTGGGTGAGCTGCATGCTATTTTGAGAAGACAAGAAGACTTTTATCCATTTTTAAAAGACAATCGTGAGAAGATTGAAAAAATCTTGACTTTTCGAATTCCTTATTATGTTGGTCCATTGGCGCGTGGCAATAGTCGTTTTGCATGGATGACTCGGAAGTCTGAAGAAACAATTACCCCATGGAATTTTGAAGAAGTTGTCGATAAAGGTGCTTCAGCTCAATCATTTATTGAACGCATGACAAACTTTGATAAAAATCTTCCAAATGAAAAAGTACTACCAAAACATAGTTTGCTTTATGAGTATTTTACGGTTTATAACGAATTGACAAAGGTCAAATATGTTACTGAGGGAATGCGAAAACCAGCATTTCTTTCAGGTGAACAGAAGAAAGCCATTGTTGATTTACTCTTCAAAACAAATCGAAAAGTAACCGTTAAGCAATTAAAAGAAGATTATTTCAAAAAAATAGAATGTTTTGATAGTGTTGAAATTTCAGGAGTTGAAGATAGATTTAATGCTTCATTAGGCGCCTACCATGATTTGCTAAAAATTATTAAAGATAAAGATTTTTTGGATAATGAAGAAAATGAAGATATCTTAGAGGATATTGTTTTAACATTGACCTTATTTGAAGATAGGGGGATGATTGAGGAAAGACTTAAAACATATGCTCACCTCTTTGATGATAAGGTGATGAAACAGCTTAAACGTCGCCGTTATACTGGTTGGGGACGTTTGTCTCGAAAATTGATTAATGGTATTAGGGATAAGCAATCTGGCAAAACAATATTAGATTTTTTGAAATCAGATGGTTTTGCCAATCGCAATTTTATGCAGCTGATCCATGATGATAGTTTGACATTTAAAGAAGATATTCAAAAAGCACAGGTGTCTGGACAAGGCCATAGTTTACATGAACAGATTGCTAACTTAGCTGGCAGTCCTGCTATTAAAAAAGGTATTTTACAGACTGTAAAAATTGTTGATGAACTGGTCAAAGTAATGGGGCATAAGCCAGAAAATATCGTTATTGAAATGGCACGTGAAAATCAGACAACTCAAAAGGGCCAGAAAAATTCGCGAGAGCGTATGAAACGAATCGAAGAAGGTATCAAAGAATTAGGAAGTCAGATTCTTAAAGAGCATCCTGTTGAAAATACTCAATTGCAAAATGAAAAGCTCTATCTCTATTATCTACAAAATGGAAGAGACATGTATGTGGACCAAGAATTAGATATTAATCGTTTAAGTGATTATGATGTCGATCACATTGTTCCACAAAGTTTCATTAAAGACGATTCAATAGACAATAAGGTACTAACGCGTTCTGATAAAAATCGTGGTAAATCGGATAACGTTCCAAGTGAAGAAGTAGTCAAAAAGATGAAAAACTATTGGAGACAACTTCTAAACGCCAAGTTAATCACTCAACGTAAGTTTGATAATTTAACGAAAGCTGAACGTGGAGGTTTGAGTGAACTTGATAAAGCTGGTTTTATCAAACGCCAATTGGTTGAAACTCGCCAAATCACTAAGCATGTGGCACAAATTTTGGATAGTCGCATGAATACTAAATACGATGAAAATGATAAACTTATTCGAGAGGTTAAAGTGATTACCTTAAAATCTAAATTAGTTTCTGACTTCCGAAAAGATTTCCAATTCTATAAAGTACGTGAGATTAACAATTACCATCATGCCCATGATGCGTATCTAAATGCCGTCGTTGGAACTGCTTTGATTAAGAAATATCCAAAACTTGAATCGGAGTTTGTCTATGGTGATTATAAAGTTTATGATGTTCGTAAAATGATTGCTAAGTCTGAGCAAGAAATAGGCAAAGCAACCGCAAAATATTTCTTTTACTCTAATATCATGAACTTCTTCAAAACAGAAATTACACTTGCAAATGGAGAGATTCGCAAACGCCCTCTAATCGAAACTAATGGGGAAACTGGAGAAATTGTCTGGGATAAAGGGCGAGATTTTGCCACAGTGCGCAAAGTATTGTCCATGCCCCAAGTCAATATTGTCAAGAAAACAGAAGTACAGACAGGCGGATTCTCCAAGGAGTCAATTTTACCAAAAAGAAATTCGGACAAGCTTATTGCTCGTAAAAAAGACTGGGATCCAAAAAAATATGGTGGTTTTGATAGTCCAACGGTAGCTTATTCAGTCCTAGTGGTTGCTAAGGTGGAAAAAGGGAAATCGAAGAAGTTAAAATCCGTTAAAGAGTTACTAGGGATCACAATTATGGAAAGAAGTTCCTTTGAAAAAAATCCGATTGACTTTTTAGAAGCTAAAGGATATAAGGAAGTTAAAAAAGACTTAATCATTAAACTACCTAAATATAGTCTTTTTGAGTTAGAAAACGGTCGTAAACGGATGCTGGCTAGTGCCGGAGAATTACAAAAAGGAAATGAGCTGGCTCTGCCAAGCAAATATGTGAATTTTTTATATTTAGCTAGTCATTATGAAAAGTTGAAGGGTAGTCCAGAAGATAACGAACAAAAACAATTGTTTGTGGAGCAGCATAAGCATTATTTAGATGAGATTATTGAGCAAATCAGTGAATTTTCTAAGCGTGTTATTTTAGCAGATGCCAATTTAGATAAAGTTCTTAGTGCATATAACAAACATAGAGACAAACCAATACGTGAACAAGCAGAAAATATTATTCATTTATTTACGTTGACGAATCTTGGAGCTCCCGCTGCTTTTAAATATTTTGATACAACAATTGATCGTAAACGATATACGTCTACAAAAGAAGTTTTAGATGCCACTCTTATCCATCAATCCATCACTGGTCTTTATGAAACACGCATTGATTTGAGTCAGCTAGGAGGTGACTGA
Figure 2022519882000005
(一重下線:HNHドメイン;二重下線:RuvCドメイン)
いくつかの実施形態において、野生型Cas9は、以下のヌクレオチドおよび/またはアミノ酸の配列に対応するか、または含む:
ATGGATAAAAAGTATTCTATTGGTTTAGACATCGGCACTAATTCCGTTGGATGGGCTGTCATAACCGATGAATACAAAGTACCTTCAAAGAAATTTAAGGTGTTGGGGAACACAGACCGTCATTCGATTAAAAAGAATCTTATCGGTGCCCTCCTATTCGATAGTGGCGAAACGGCAGAGGCGACTCGCCTGAAACGAACCGCTCGGAGAAGGTATACACGTCGCAAGAACCGAATATGTTACTTACAAGAAATTTTTAGCAATGAGATGGCCAAAGTTGACGATTCTTTCTTTCACCGTTTGGAAGAGTCCTTCCTTGTCGAAGAGGACAAGAAACATGAACGGCACCCCATCTTTGGAAACATAGTAGATGAGGTGGCATATCATGAAAAGTACCCAACGATTTATCACCTCAGAAAAAAGCTAGTTGACTCAACTGATAAAGCGGACCTGAGGTTAATCTACTTGGCTCTTGCCCATATGATAAAGTTCCGTGGGCACTTTCTCATTGAGGGTGATCTAAATCCGGACAACTCGGATGTCGACAAACTGTTCATCCAGTTAGTACAAACCTATAATCAGTTGTTTGAAGAGAACCCTATAAATGCAAGTGGCGTGGATGCGAAGGCTATTCTTAGCGCCCGCCTCTCTAAATCCCGACGGCTAGAAAACCTGATCGCACAATTACCCGGAGAGAAGAAAAATGGGTTGTTCGGTAACCTTATAGCGCTCTCACTAGGCCTGACACCAAATTTTAAGTCGAACTTCGACTTAGCTGAAGATGCCAAATTGCAGCTTAGTAAGGACACGTACGATGACGATCTCGACAATCTACTGGCACAAATTGGAGATCAGTATGCGGACTTATTTTTGGCTGCCAAAAACCTTAGCGATGCAATCCTCCTATCTGACATACTGAGAGTTAATACTGAGATTACCAAGGCGCCGTTATCCGCTTCAATGATCAAAAGGTACGATGAACATCACCAAGACTTGACACTTCTCAAGGCCCTAGTCCGTCAGCAACTGCCTGAGAAATATAAGGAAATATTCTTTGATCAGTCGAAAAACGGGTACGCAGGTTATATTGACGGCGGAGCGAGTCAAGAGGAATTCTACAAGTTTATCAAACCCATATTAGAGAAGATGGATGGGACGGAAGAGTTGCTTGTAAAACTCAATCGCGAAGATCTACTGCGAAAGCAGCGGACTTTCGACAACGGTAGCATTCCACATCAAATCCACTTAGGCGAATTGCATGCTATACTTAGAAGGCAGGAGGATTTTTATCCGTTCCTCAAAGACAATCGTGAAAAGATTGAGAAAATCCTAACCTTTCGCATACCTTACTATGTGGGACCCCTGGCCCGAGGGAACTCTCGGTTCGCATGGATGACAAGAAAGTCCGAAGAAACGATTACTCCATGGAATTTTGAGGAAGTTGTCGATAAAGGTGCGTCAGCTCAATCGTTCATCGAGAGGATGACCAACTTTGACAAGAATTTACCGAACGAAAAAGTATTGCCTAAGCACAGTTTACTTTACGAGTATTTCACAGTGTACAATGAACTCACGAAAGTTAAGTATGTCACTGAGGGCATGCGTAAACCCGCCTTTCTAAGCGGAGAACAGAAGAAAGCAATAGTAGATCTGTTATTCAAGACCAACCGCAAAGTGACAGTTAAGCAATTGAAAGAGGACTACTTTAAGAAAATTGAATGCTTCGATTCTGTCGAGATCTCCGGGGTAGAAGATCGATTTAATGCGTCACTTGGTACGTATCATGACCTCCTAAAGATAATTAAAGATAAGGACTTCCTGGATAACGAAGAGAATGAAGATATCTTAGAAGATATAGTGTTGACTCTTACCCTCTTTGAAGATCGGGAAATGATTGAGGAAAGACTAAAAACATACGCTCACCTGTTCGACGATAAGGTTATGAAACAGTTAAAGAGGCGTCGCTATACGGGCTGGGGACGATTGTCGCGGAAACTTATCAACGGGATAAGAGACAAGCAAAGTGGTAAAACTATTCTCGATTTTCTAAAGAGCGACGGCTTCGCCAATAGGAACTTTATGCAGCTGATCCATGATGACTCTTTAACCTTCAAAGAGGATATACAAAAGGCACAGGTTTCCGGACAAGGGGACTCATTGCACGAACATATTGCGAATCTTGCTGGTTCGCCAGCCATCAAAAAGGGCATACTCCAGACAGTCAAAGTAGTGGATGAGCTAGTTAAGGTCATGGGACGTCACAAACCGGAAAACATTGTAATCGAGATGGCACGCGAAAATCAAACGACTCAGAAGGGGCAAAAAAACAGTCGAGAGCGGATGAAGAGAATAGAAGAGGGTATTAAAGAACTGGGCAGCCAGATCTTAAAGGAGCATCCTGTGGAAAATACCCAATTGCAGAACGAGAAACTTTACCTCTATTACCTACAAAATGGAAGGGACATGTATGTTGATCAGGAACTGGACATAAACCGTTTATCTGATTACGACGTCGATCACATTGTACCCCAATCCTTTTTGAAGGACGATTCAATCGACAATAAAGTGCTTACACGCTCGGATAAGAACCGAGGGAAAAGTGACAATGTTCCAAGCGAGGAAGTCGTAAAGAAAATGAAGAACTATTGGCGGCAGCTCCTAAATGCGAAACTGATAACGCAAAGAAAGTTCGATAACTTAACTAAAGCTGAGAGGGGTGGCTTGTCTGAACTTGACAAGGCCGGATTTATTAAACGTCAGCTCGTGGAAACCCGCCAAATCACAAAGCATGTTGCACAGATACTAGATTCCCGAATGAATACGAAATACGACGAGAACGATAAGCTGATTCGGGAAGTCAAAGTAATCACTTTAAAGTCAAAATTGGTGTCGGACTTCAGAAAGGATTTTCAATTCTATAAAGTTAGGGAGATAAATAACTACCACCATGCGCACGACGCTTATCTTAATGCCGTCGTAGGGACCGCACTCATTAAGAAATACCCGAAGCTAGAAAGTGAGTTTGTGTATGGTGATTACAAAGTTTATGACGTCCGTAAGATGATCGCGAAAAGCGAACAGGAGATAGGCAAGGCTACAGCCAAATACTTCTTTTATTCTAACATTATGAATTTCTTTAAGACGGAAATCACTCTGGCAAACGGAGAGATACGCAAACGACCTTTAATTGAAACCAATGGGGAGACAGGTGAAATCGTATGGGATAAGGGCCGGGACTTCGCGACGGTGAGAAAAGTTTTGTCCATGCCCCAAGTCAACATAGTAAAGAAAACTGAGGTGCAGACCGGAGGGTTTTCAAAGGAATCGATTCTTCCAAAAAGGAATAGTGATAAGCTCATCGCTCGTAAAAAGGACTGGGACCCGAAAAAGTACGGTGGCTTCGATAGCCCTACAGTTGCCTATTCTGTCCTAGTAGTGGCAAAAGTTGAGAAGGGAAAATCCAAGAAACTGAAGTCAGTCAAAGAATTATTGGGGATAACGATTATGGAGCGCTCGTCTTTTGAAAAGAACCCCATCGACTTCCTTGAGGCGAAAGGTTACAAGGAAGTAAAAAAGGATCTCATAATTAAACTACCAAAGTATAGTCTGTTTGAGTTAGAAAATGGCCGAAAACGGATGTTGGCTAGCGCCGGAGAGCTTCAAAAGGGGAACGAACTCGCACTACCGTCTAAATACGTGAATTTCCTGTATTTAGCGTCCCATTACGAGAAGTTGAAAGGTTCACCTGAAGATAACGAACAGAAGCAACTTTTTGTTGAGCAGCACAAACATTATCTCGACGAAATCATAGAGCAAATTTCGGAATTCAGTAAGAGAGTCATCCTAGCTGATGCCAATCTGGACAAAGTATTAAGCGCATACAACAAGCACAGGGATAAACCCATACGTGAGCAGGCGGAAAATATTATCCATTTGTTTACTCTTACCAACCTCGGCGCTCCAGCCGCATTCAAGTATTTTGACACAACGATAGATCGCAAACGATACACTTCTACCAAGGAGGTGCTAGACGCGACACTGATTCACCAATCCATCACGGGATTATATGAAACTCGGATAGATTTGTCACAGCTTGGGGGTGACGGATCCCCCAAGAAGAAGAGGAAAGTCTCGAGCGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGGCTGCAGGA
Figure 2022519882000006
(一重下線:HNHドメイン;二重下線:RuvCドメイン)
いくつかの実施形態において、野生型Cas9は、Streptococcus pyogenes由来のCas9(NCBI参照配列:NC_002737.2(ヌクレオチド配列は以下の通り);およびUniprot参照配列:Q99ZW2(アミノ酸配列は以下の通り)に対応する。
ATGGATAAGAAATACTCAATAGGCTTAGATATCGGCACAAATAGCGTCGGATGGGCGGTGATCACTGATGAATATAAGGTTCCGTCTAAAAAGTTCAAGGTTCTGGGAAATACAGACCGCCACAGTATCAAAAAAAATCTTATAGGGGCTCTTTTATTTGACAGTGGAGAGACAGCGGAAGCGACTCGTCTCAAACGGACAGCTCGTAGAAGGTATACACGTCGGAAGAATCGTATTTGTTATCTACAGGAGATTTTTTCAAATGAGATGGCGAAAGTAGATGATAGTTTCTTTCATCGACTTGAAGAGTCTTTTTTGGTGGAAGAAGACAAGAAGCATGAACGTCATCCTATTTTTGGAAATATAGTAGATGAAGTTGCTTATCATGAGAAATATCCAACTATCTATCATCTGCGAAAAAAATTGGTAGATTCTACTGATAAAGCGGATTTGCGCTTAATCTATTTGGCCTTAGCGCATATGATTAAGTTTCGTGGTCATTTTTTGATTGAGGGAGATTTAAATCCTGATAATAGTGATGTGGACAAACTATTTATCCAGTTGGTACAAACCTACAATCAATTATTTGAAGAAAACCCTATTAACGCAAGTGGAGTAGATGCTAAAGCGATTCTTTCTGCACGATTGAGTAAATCAAGACGATTAGAAAATCTCATTGCTCAGCTCCCCGGTGAGAAGAAAAATGGCTTATTTGGGAATCTCATTGCTTTGTCATTGGGTTTGACCCCTAATTTTAAATCAAATTTTGATTTGGCAGAAGATGCTAAATTACAGCTTTCAAAAGATACTTACGATGATGATTTAGATAATTTATTGGCGCAAATTGGAGATCAATATGCTGATTTGTTTTTGGCAGCTAAGAATTTATCAGATGCTATTTTACTTTCAGATATCCTAAGAGTAAATACTGAAATAACTAAGGCTCCCCTATCAGCTTCAATGATTAAACGCTACGATGAACATCATCAAGACTTGACTCTTTTAAAAGCTTTAGTTCGACAACAACTTCCAGAAAAGTATAAAGAAATCTTTTTTGATCAATCAAAAAACGGATATGCAGGTTATATTGATGGGGGAGCTAGCCAAGAAGAATTTTATAAATTTATCAAACCAATTTTAGAAAAAATGGATGGTACTGAGGAATTATTGGTGAAACTAAATCGTGAAGATTTGCTGCGCAAGCAACGGACCTTTGACAACGGCTCTATTCCCCATCAAATTCACTTGGGTGAGCTGCATGCTATTTTGAGAAGACAAGAAGACTTTTATCCATTTTTAAAAGACAATCGTGAGAAGATTGAAAAAATCTTGACTTTTCGAATTCCTTATTATGTTGGTCCATTGGCGCGTGGCAATAGTCGTTTTGCATGGATGACTCGGAAGTCTGAAGAAACAATTACCCCATGGAATTTTGAAGAAGTTGTCGATAAAGGTGCTTCAGCTCAATCATTTATTGAACGCATGACAAACTTTGATAAAAATCTTCCAAATGAAAAAGTACTACCAAAACATAGTTTGCTTTATGAGTATTTTACGGTTTATAACGAATTGACAAAGGTCAAATATGTTACTGAAGGAATGCGAAAACCAGCATTTCTTTCAGGTGAACAGAAGAAAGCCATTGTTGATTTACTCTTCAAAACAAATCGAAAAGTAACCGTTAAGCAATTAAAAGAAGATTATTTCAAAAAAATAGAATGTTTTGATAGTGTTGAAATTTCAGGAGTTGAAGATAGATTTAATGCTTCATTAGGTACCTACCATGATTTGCTAAAAATTATTAAAGATAAAGATTTTTTGGATAATGAAGAAAATGAAGATATCTTAGAGGATATTGTTTTAACATTGACCTTATTTGAAGATAGGGAGATGATTGAGGAAAGACTTAAAACATATGCTCACCTCTTTGATGATAAGGTGATGAAACAGCTTAAACGTCGCCGTTATACTGGTTGGGGACGTTTGTCTCGAAAATTGATTAATGGTATTAGGGATAAGCAATCTGGCAAAACAATATTAGATTTTTTGAAATCAGATGGTTTTGCCAATCGCAATTTTATGCAGCTGATCCATGATGATAGTTTGACATTTAAAGAAGACATTCAAAAAGCACAAGTGTCTGGACAAGGCGATAGTTTACATGAACATATTGCAAATTTAGCTGGTAGCCCTGCTATTAAAAAAGGTATTTTACAGACTGTAAAAGTTGTTGATGAATTGGTCAAAGTAATGGGGCGGCATAAGCCAGAAAATATCGTTATTGAAATGGCACGTGAAAATCAGACAACTCAAAAGGGCCAGAAAAATTCGCGAGAGCGTATGAAACGAATCGAAGAAGGTATCAAAGAATTAGGAAGTCAGATTCTTAAAGAGCATCCTGTTGAAAATACTCAATTGCAAAATGAAAAGCTCTATCTCTATTATCTCCAAAATGGAAGAGACATGTATGTGGACCAAGAATTAGATATTAATCGTTTAAGTGATTATGATGTCGATCACATTGTTCCACAAAGTTTCCTTAAAGACGATTCAATAGACAATAAGGTCTTAACGCGTTCTGATAAAAATCGTGGTAAATCGGATAACGTTCCAAGTGAAGAAGTAGTCAAAAAGATGAAAAACTATTGGAGACAACTTCTAAACGCCAAGTTAATCACTCAACGTAAGTTTGATAATTTAACGAAAGCTGAACGTGGAGGTTTGAGTGAACTTGATAAAGCTGGTTTTATCAAACGCCAATTGGTTGAAACTCGCCAAATCACTAAGCATGTGGCACAAATTTTGGATAGTCGCATGAATACTAAATACGATGAAAATGATAAACTTATTCGAGAGGTTAAAGTGATTACCTTAAAATCTAAATTAGTTTCTGACTTCCGAAAAGATTTCCAATTCTATAAAGTACGTGAGATTAACAATTACCATCATGCCCATGATGCGTATCTAAATGCCGTCGTTGGAACTGCTTTGATTAAGAAATATCCAAAACTTGAATCGGAGTTTGTCTATGGTGATTATAAAGTTTATGATGTTCGTAAAATGATTGCTAAGTCTGAGCAAGAAATAGGCAAAGCAACCGCAAAATATTTCTTTTACTCTAATATCATGAACTTCTTCAAAACAGAAATTACACTTGCAAATGGAGAGATTCGCAAACGCCCTCTAATCGAAACTAATGGGGAAACTGGAGAAATTGTCTGGGATAAAGGGCGAGATTTTGCCACAGTGCGCAAAGTATTGTCCATGCCCCAAGTCAATATTGTCAAGAAAACAGAAGTACAGACAGGCGGATTCTCCAAGGAGTCAATTTTACCAAAAAGAAATTCGGACAAGCTTATTGCTCGTAAAAAAGACTGGGATCCAAAAAAATATGGTGGTTTTGATAGTCCAACGGTAGCTTATTCAGTCCTAGTGGTTGCTAAGGTGGAAAAAGGGAAATCGAAGAAGTTAAAATCCGTTAAAGAGTTACTAGGGATCACAATTATGGAAAGAAGTTCCTTTGAAAAAAATCCGATTGACTTTTTAGAAGCTAAAGGATATAAGGAAGTTAAAAAAGACTTAATCATTAAACTACCTAAATATAGTCTTTTTGAGTTAGAAAACGGTCGTAAACGGATGCTGGCTAGTGCCGGAGAATTACAAAAAGGAAATGAGCTGGCTCTGCCAAGCAAATATGTGAATTTTTTATATTTAGCTAGTCATTATGAAAAGTTGAAGGGTAGTCCAGAAGATAACGAACAAAAACAATTGTTTGTGGAGCAGCATAAGCATTATTTAGATGAGATTATTGAGCAAATCAGTGAATTTTCTAAGCGTGTTATTTTAGCAGATGCCAATTTAGATAAAGTTCTTAGTGCATATAACAAACATAGAGACAAACCAATACGTGAACAAGCAGAAAATATTATTCATTTATTTACGTTGACGAATCTTGGAGCTCCCGCTGCTTTTAAATATTTTGATACAACAATTGATCGTAAACGATATACGTCTACAAAAGAAGTTTTAGATGCCACTCTTATCCATCAATCCATCACTGGTCTTTATGAAACACGCATTGATTTGAGTCAGCTAGGAGGTGACTGA
Figure 2022519882000007
(配列番号1.一重下線:HNHドメイン;二重下線:RuvCドメイン)
いくつかの実施形態において、Cas9は、下記由来のCas9を指すか、または任意の他の生物由来のCas9を指す:Corynebacterium ulcerans (NCBI Refs: NC_015683.1, NC_017317.1); Corynebacterium diphtheria (NCBI Refs: NC_016782.1, NC_016786.1); Spiroplasma syrphidicola (NCBI Ref: NC_021284.1); Prevotella intermedia (NCBI Ref: NC_017861.1); Spiroplasma taiwanense (NCBI Ref: NC_021846.1); Streptococcus iniae (NCBI Ref: NC_021314.1); Belliella baltica (NCBI Ref: NC_018010.1); Psychroflexus torquisI (NCBI Ref: NC_018721.1); Streptococcus thermophilus (NCBI Ref: YP_820832.1), Listeria innocua (NCBI Ref: NP_472073.1), Campylobacter jejuni (NCBI Ref: YP_002344900.1)またはNeisseria meningitidis (NCBI Ref: YP_002342100.1)。
いくつかの実施形態において、Cas9は、Neisseria meningitidis (Nme)に由来する。いくつかの実施形態において、Cas9は、Nme1、Nme2、またはNme3である。いくつかの実施形態において、Nme1、Nme2、またはNme3に関するPAM相互作用ドメインは、それぞれN4GAT、N4CC、およびN4CAAAである(例えば、Edraki, A., et al., A Compact, High-Accuracy Cas9 with a Dinucleotide PAM for In Vivo Genome Editing, Molecular Cell (2018)を参照されたい)。例示的なNeisseria meningitidis Cas9タンパク質Nme1Cas9(NCBI参照:WP_002235162.1; type II CRISPR RNA-guided endonuclease Cas9)は、以下のアミノ酸配列を有する:
1 maafkpnpin yilgldigia svgwamveid edenpiclid lgvrvferae vpktgdslam
61 arrlarsvrr ltrrrahrll rarrllkreg vlqaadfden glikslpntp wqlraaaldr
121 kltplewsav llhlikhrgy lsqrkneget adkelgallk gvadnahalq tgdfrtpael
181 alnkfekesg hirnqrgdys htfsrkdlqa elillfekqk efgnphvsgg lkegietllm
241 tqrpalsgda vqkmlghctf epaepkaakn tytaerfiwl tklnnlrile qgserpltdt
301 eratlmdepy rkskltyaqa rkllgledta ffkglrygkd naeastlmem kayhaisral
361 ekeglkdkks plnlspelqd eigtafslfk tdeditgrlk driqpeilea llkhisfdkf
421 vqislkalrr ivplmeqgkr ydeacaeiyg dhygkkntee kiylppipad eirnpvvlra
481 lsqarkving vvrrygspar ihietarevg ksfkdrkeie krqeenrkdr ekaaakfrey
541 fpnfvgepks kdilklrlye qqhgkclysg keinlgrlne kgyveidhal pfsrtwddsf
601 nnkvlvlgse nqnkgnqtpy eyfngkdnsr ewqefkarve tsrfprskkq rillqkfded
661 gfkernlndt ryvnrflcqf vadrmrltgk gkkrvfasng qitnllrgfw glrkvraend
721 rhhaldavvv acstvamqqk itrfvrykem nafdgktidk etgevlhqkt hfpqpweffa
781 qevmirvfgk pdgkpefeea dtpeklrtll aeklssrpea vheyvtplfv srapnrkmsg
841 qghmetvksa krldegvsvl rvpltqlklk dlekmvnrer epklyealka rleahkddpa
901 kafaepfyky dkagnrtqqv kavrveqvqk tgvwvrnhng iadnatmvrv dvfekgdkyy
961 lvpiyswqva kgilpdravv qgkdeedwql iddsfnfkfs lhpndlvevi tkkarmfgyf
1021 aschrgtgni nirihdldhk igkngilegi gvktalsfqk yqidelgkei rpcrlkkrpp
1081 vr
別の例示的なNeisseria meningitidis Cas9タンパク質Nme2Cas9(NCBI参照:WP_002230835; type II CRISPR RNA-guided endonuclease Cas9)は、以下のアミノ酸配列を有する:
1 maafkpnpin yilgldigia svgwamveid eeenpirlid lgvrvferae vpktgdslam
61 arrlarsvrr ltrrrahrll rarrllkreg vlqaadfden glikslpntp wqlraaaldr
121 kltplewsav llhlikhrgy lsqrkneget adkelgallk gvannahalq tgdfrtpael
181 alnkfekesg hirnqrgdys htfsrkdlqa elillfekqk efgnphvsgg lkegietllm
241 tqrpalsgda vqkmlghctf epaepkaakn tytaerfiwl tklnnlrile qgserpltdt
301 eratlmdepy rkskltyaqa rkllgledta ffkglrygkd naeastlmem kayhaisral
361 ekeglkdkks plnlsselqd eigtafslfk tdeditgrlk drvqpeilea llkhisfdkf
421 vqislkalrr ivplmeqgkr ydeacaeiyg dhygkkntee kiylppipad eirnpvvlra
481 lsqarkving vvrrygspar ihietarevg ksfkdrkeie krqeenrkdr ekaaakfrey
541 fpnfvgepks kdilklrlye qqhgkclysg keinlvrlne kgyveidhal pfsrtwddsf
601 nnkvlvlgse nqnkgnqtpy eyfngkdnsr ewqefkarve tsrfprskkq rillqkfded
661 gfkecnlndt ryvnrflcqf vadhilltgk gkrrvfasng qitnllrgfw glrkvraend
721 rhhaldavvv acstvamqqk itrfvrykem nafdgktidk etgkvlhqkt hfpqpweffa
781 qevmirvfgk pdgkpefeea dtpeklrtll aeklssrpea vheyvtplfv srapnrkmsg
841 ahkdtlrsak rfvkhnekis vkrvwlteik ladlenmvny kngreielye alkarleayg
901 gnakqafdpk dnpfykkggq lvkavrvekt qesgvllnkk naytiadngd mvrvdvfckv
961 dkkgknqyfi vpiyawqvae nilpdidckg yriddsytfc fslhkydlia fqkdekskve
1021 fayyincdss ngrfylawhd kgskeqqfri stqnlvliqk yqvnelgkei rpcrlkkrpp
1081 vr
いくつかの実施形態において、dCas9は、Cas9ヌクレアーゼ活性を不活性化する1つまたは複数の突然変異を有するCas9アミノ酸配列に対応するか、またはその一部もしくは全体を含む。例えば、いくつかの実施形態において、dCas9ドメインは、D10AおよびH840A突然変異、または別のCas9中の対応する突然変異を含む。いくつかの実施形態において、dCas9は、dCas9(D10AおよびH840A)のアミノ酸配列を含む:
Figure 2022519882000008
(一重下線:HNHドメイン;二重下線:RuvCドメイン)。
いくつかの実施形態において、Cas9ドメインは、D10A突然変異を含み、上記で提供されているアミノ酸配列における840位または本明細書で提供されているアミノ酸配列のうちのいずれかにおける対応する位置での残基は、ヒスチジンのままである。
他の実施形態において、例えばヌクレアーゼ不活性化Cas9(dCas9)をもたらす、D10AおよびH840A以外の突然変異を有するdCas9バリアントが提供される。そのような突然変異は、例えば、D10およびH840での他のアミノ酸置換、またはCas9のヌクレアーゼドメイン内の他の置換(例えば、HNHヌクレアーゼサブドメインおよび/もしくはRuvC1サブドメインにおける置換)を含む。いくつかの実施形態において、dCas9のバリアントまたはホモログであって、少なくとも約70%同一であるか、少なくとも約80%同一であるか、少なくとも約90%同一であるか、少なくとも約95%同一であるか、少なくとも約98%同一であるか、少なくとも約99%同一であるか、少なくとも約99.5%同一であるか、または少なくとも約99.9%同一であるバリアントまたはホモログが提供される。いくつかの実施形態において、dCas9のバリアントであって、約5個のアミノ酸、約10個のアミノ酸、約15個のアミノ酸、約20個のアミノ酸、約25個のアミノ酸、約30個のアミノ酸、約40個のアミノ酸、約50個のアミノ酸、約75個のアミノ酸、約100個のアミノ酸、またはより多くだけ短いかまたは長いアミノ酸配列を有するバリアントが提供される。
いくつかの実施形態において、本明細書で提供されるCas9融合タンパク質は、Cas9タンパク質の完全長アミノ酸配列を含み、例えば、本明細書で提供されるCas9配列のうちの1つを含む。しかしながら、他の実施形態において、本明細書で提供される融合タンパク質は、完全長Cas9配列を含まず、その1つまたは複数の断片のみを含む。好適なCas9ドメインおよびCas9断片の例示的なアミノ酸配列が本明細書で提供され、Cas9ドメインおよび断片のさらなる好適な配列は、当業者に明らかであるだろう。
追加のCas9タンパク質(例えば、ヌクレアーゼ不活Cas9(dCas9)、Cas9ニッカーゼ(nCas9)、またはヌクレアーゼ活性Cas9)(このバリアントおよびホモログを含む)は本開示の範囲内であることを理解すべきである。例示的なCas9タンパク質として、下記で提供されるものが挙げられるが、これらに限定されない。いくつかの実施形態において、Cas9タンパク質は、ヌクレアーゼ不活Cas9(dCas9)である。いくつかの実施形態において、Cas9タンパク質は、Cas9ニッカーゼ(nCas9)である。いくつかの実施形態において、Cas9タンパク質は、ヌクレアーゼ活性Cas9である。
例示的な、触媒的に不活性なCas9(dCas9):
DKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
例示的な触媒的Cas9ニッカーゼ(nCas9):
DKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
例示的な、触媒的に活性なCas9:
DKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD.
いくつかの実施形態において、Cas9は、単細胞原核微生物のドメインおよび界を構成する古細菌(例えばナノアーキア)由来のCas9を指す。いくつかの実施形態において、Cas9は、例えば、Burstein et al., "New CRISPR-Cas systems from uncultivated microbes." Cell Res. 2017 Feb 21. doi: 10.1038/cr.2017.21(この内容全体が参照により本明細書に組み込まれる)で説明されているCasXまたはCasYを指す。ゲノム分解メタゲノミクスを使用して、生命の古細菌ドメインにおいて最初に報告されたCas9を含む多くのCRISPR-Casシステムが同定された。この分岐Cas9タンパク質は、活性CRISPR-Casシステムの一部として、ほとんど研究されていないナノアーキアで見出された。細菌では、それまで未知であった下記の2つのシステム:CRISPR-CasXおよびCRISPR-CasYが発見され、これらは、既に発見された最もコンパクトなシステムに属する。いくつかの実施形態において、Cas9は、CasXまたはCasXのバリアントを指す。いくつかの実施形態において、Cas9は、CasYまたはCasYのバリアントを指す。他のRNA誘導DNA結合タンパク質は、核酸プログラム可能なDNA結合タンパク質(napDNAbp)として使用され得、かつ本開示の範囲内であることを理解すべきである。
特定の実施形態において、本発明の方法で有用なnapDNAbpとして、当該技術分野で既知であり、かつ例えばOakes et al., Cell 176, 254-267, 2019により説明されている循環置換体が挙げられる。例示的な循環置換体を下記に示し、太字の配列は、Cas9に由来する配列を示し、イタリック体の配列は、リンカー配列を示し、下線が引かれた配列は、二部分核局在化配列を示す。
CP5(およびMSP「NGC=Pam Variant with mutations Regular Cas9 likes NGG」PID=タンパク質相互作用ドメイン、および「D10A」ニッカーゼ):
Figure 2022519882000009
塩基エディターに組み込まれ得るポリヌクレオチドプログラム可能なヌクレオチド結合ドメインの非限定的な例として、CRISPRタンパク質由来ドメイン、制限ヌクレアーゼ、メガヌクレアーゼ、TALヌクレアーゼ(TALEN)、およびジンクフィンガーヌクレアーゼ(ZFN)が挙げられる。
いくつかの実施形態において、本明細書で提供される融合タンパク質のうちのいずれかの核酸プログラム可能なDNA結合タンパク質(napDNAbp)は、CasXタンパク質またはCasYタンパク質であり得る。いくつかの実施形態において、napDNAbpは、CasXタンパク質である。いくつかの実施形態において、napDNAbpは、CasYタンパク質である。いくつかの実施形態において、napDNAbpは、天然に存在するCasXタンパク質またはCasYタンパク質と少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。いくつかの実施形態において、napDNAbpは、天然に存在するCasXタンパク質またはCasYタンパク質である。いくつかの実施形態において、napDNAbpは、本明細書で説明されている任意のCasXタンパク質またはCasYタンパク質と少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。他の細菌種由来のCas12b/C2c1、CasX、およびCasYも本開示に従って使用され得ることを理解すべきである。
Cas12b/C2c1 (uniprot.org/uniprot/T0D7A2#2)
sp|T0D7A2|C2C1_ALIAG CRISPR-associated endo-nuclease C2c1 OS = Alicyclobacillus acido-terrestris(strain ATCC 49025 / DSM 3922/CIP 106132 / NCIMB 13137/GD3B) GN=c2c1 PE=1 SV=1
MAVKSIKVKLRLDDMPEIRAGLWKLHKEVNAGVRYYTEWLSLLRQENLYRRSPNGDGEQECDKTAEECKAELLERLRARQVENGHRGPAGSDDELLQLARQLYELLVPQAIGAKGDAQQIARKFLSPLADKDAVGGLGIAKAGNKPRWVRMREAGEPGWEEEKEKAETRKSADRTADVLRALADFGLKPLMRVYTDSEMSSVEWKPLRKGQAVRTWDRDMFQQAIERMMSWESWNQRVGQEYAKLVEQKNRFEQKNFVGQEHLVHLVNQLQQDMKEASPGLESKEQTAHYVTGRALRGSDKVFEKWGKLAPDAPFDLYDAEIKNVQRRNTRRFGSHDLFAKLAEPEYQALWREDASFLTRYAVYNSILRKLNHAKMFATFTLPDATAHPIWTRFDKLGGNLHQYTFLFNEFGERRHAIRFHKLLKVENGVAREVDDVTVPISMSEQLDNLLPRDPNEPIALYFRDYGAEQHFTGEFGGAKIQCRRDQLAHMHRRRGARDVYLNVSVRVQSQSEARGERRPPYAAVFRLVGDNHRAFVHFDKLSDYLAEHPDDGKLGSEGLLSGLRVMSVDLGLRTSASISVFRVARKDELKPNSKGRVPFFFPIKGNDNLVAVHERSQLLKLPGETESKDLRAIREERQRTLRQLRTQLAYLRLLVRCGSEDVGRRERSWAKLIEQPVDAANHMTPDWREAFENELQKLKSLHGICSDKEWMDAVYESVRRVWRHMGKQVRDWRKDVRSGERPKIRGYAKDVVGGNSIEQIEYLERQYKFLKSWSFFGKVSGQVIRAEKGSRFAITLREHIDHAKEDRLKKLADRIIMEALGYVYALDERGKGKWVAKYPPCQLILLEELSEYQFNNDRPPSENNQLMQWSHRGVFQELINQAQVHDLLVGTMYAAFSSRFDARTGAPGIRCRRVPARCTQEHNPEPFPWWLNKFVVEHTLDACPLRADDLIPTGEGEIFVSPFSAEEGDFHQIHADLNAAQNLQQRLWSDFDISQIRLRCDWGEVDGELVLIPRLTGKRTADSYSNKVFYTNTGVTYYERERGKKRRKVFAQEKLSEEEAELLVEADEAREKSVVLMRDPSGIINRGNWTRQKEFWSMV NQRIEGYLVKQIRSRVPLQDSACENTGDI
CasX (uniprot.org/uniprot/F0NN87;uniprot.org/uniprot/F0NH53)
>tr|F0NN87|F0NN87_SULIH CRISPR-associated Casx protein OS = Sulfolobus islandicus(strain HVE10/4) GN = SiH_0402 PE=4 SV=1
MEVPLYNIFGDNYIIQVATEAENSTIYNNKVEIDDEELRNVLNLAYKIAKNNEDAAAERRGKAKKKKGEEGETTTSNIILPLSGNDKNPWTETLKCYNFPTTVALSEVFKNFSQVKECEEVSAPSFVKPEFYEFGRSPGMVERTRRVKLEVEPHYLIIAAAGWVLTRLGKAKVSEGDYVGVNVFTPTRGILYSLIQNVNGIVPGIKPETAFGLWIARKVVSSVTNPNVSVVRIYTISDAVGQNPTTINGGFSIDLTKLLEKRYLLSERLEAIARNALSISSNMRERYIVLANYIYEYLTG SKRLEDLLYFANRDLIMNLNSDDGKVRDLKLISAYVNGELIRGEG
>tr|F0NH53|F0NH53_SULIR CRISPR associated protein, Casx OS = Sulfolobus islandicus (strain REY15A) GN=SiRe_0771 PE=4 SV=1
MEVPLYNIFGDNYIIQVATEAENSTIYNNKVEIDDEELRNVLNLAYKIAKNNEDAAAERRGKAKKKKGEEGETTTSNIILPLSGNDKNPWTETLKCYNFPTTVALSEVFKNFSQVKECEEVSAPSFVKPEFYKFGRSPGMVERTRRVKLEVEPHYLIMAAAGWVLTRLGKAKVSEGDYVGVNVFTPTRGILYSLIQNVNGIVPGIKPETAFGLWIARKVVSSVTNPNVSVVSIYTISDAVGQNPTTINGGFSIDLTKLLEKRDLLSERLEAIARNALSISSNMRERYIVLANYIYEYLTGSKRLEDLLYFANRDLIMNLNSDDGKVRDLKLISAYVNGELIRGEG
Deltaproteobacteria CasX
MEKRINKIRKKLSADNATKPVSRSGPMKTLLVRVMTDDLKKRLEKRRKKPEVMPQVISNNAANNLRMLLDDYTKMKEAILQVYWQEFKDDHVGLMCKFAQPASKKIDQNKLKPEMDEKGNLTTAGFACSQCGQPLFVYKLEQVSEKGKAYTNYFGRCNVAEHEKLILLAQLKPVKDSDEAVTYSLGKFGQRALDFYSIHVTKESTHPVKPLAQIAGNRYASGPVGKALSDACMGTIASFLSKYQDIIIEHQKVVKGNQKRLESLRELAGKENLEYPSVTLPPQPHTKEGVDAYNEVIARVRMWVNLNLWQKLKLSRDDAKPLLRLKGFPSFPVVERRENEVDWWNTINEVKKLIDAKRDMGRVFWSGVTAEKRNTILEGYNYLPNENDHKKREGSLENPKKPAKRQFGDLLLYLEKKYAGDWGKVFDEAWERIDKKIAGLTSHIEREEARNAEDAQSKAVLTDWLRAKASFVLERLKEMDEKEFYACEIQLQKWYGDLRGNPFAVEAENRVVDISGFSIGSDGHSIQYRNLLAWKYLENGKREFYLLMNYGKKGRIRFTDGTDIKKSGKWQGLLYGGGKAKVIDLTFDPDDEQLIILPLAFGTRQGREFIWNDLLSLETGLIKLANGRVIEKTIYNKKIGRDEPALFVALTFERREVVDPSNIKPVNLIGVARGENIPAVIALTDPEGCPLPEFKDSSGGPTDILRIGEGYKEKQRAIQAAKEVEQRRAGGYSRKFASKSRNLADDMVRNSARDLFYHAVTHDAVLVFANLSRGFGRQGKRTFMTERQYTKMEDWLTAKLAYEGLTSKTYLSKTLAQYTSKTCSNCGFTITYADMDVMLVRLKKTSDGWATTLNNKELKAEYQITYYNRYKRQTVEKELSAELDRLSEESGNNDISKWTKGRRDEALFLLKKRFSHRPVQEQFVCLDCGHEVHAAEQAALNIARSWLFLNSNSTEFKSYKSGKQPFVGAWQAFYKRRLKEVWKPNA
CasY (ncbi.nlm.nih.gov/protein/APG80656.1)
>APG80656.1 CRISPR-associated protein CasY [uncultured Parcubacteria group bacterium]
MSKRHPRISGVKGYRLHAQRLEYTGKSGAMRTIKYPLYSSPSGGRTVPREIVSAINDDYVGLYGLSNFDDLYNAEKRNEEKVYSVLDFWYDCVQYGAVFSYTAPGLLKNVAEVRGGSYELTKTLKGSHLYDELQIDKVIKFLNKKEISRANGSLDKLKKDIIDCFKAEYRERHKDQCNKLADDIKNAKKDAGASLGERQKKLFRDFFGISEQSENDKPSFTNPLNLTCCLLPFDTVNNNRNRGEVLFNKLKEYAQKLDKNEGSLEMWEYIGIGNSGTAFSNFLGEGFLGRLRENKITELKKAMMDITDAWRGQEQEEELEKRLRILAALTIKLREPKFDNHWGGYRSDINGKLSSWLQNYINQTVKIKEDLKGHKKDLKKAKEMINRFGESDTKEEAVVSSLLESIEKIVPDDSADDEKPDIPAIAIYRRFLSDGRLTLNRFVQREDVQEALIKERLEAEKKKKPKKRKKKSDAEDEKETIDFKELFPHLAKPLKLVPNFYGDSKRELYKKYKNAAIYTDALWKAVEKIYKSAFSSSLKNSFFDTDFDKDFFIKRLQKIFSVYRRFNTDKWKPIVKNSFAPYCDIVSLAENEVLYKPKQSRSRKSAAIDKNRVRLPSTENIAKAGIALARELSVAGFDWKDLLKKEEHEEYIDLIELHKTALALLLAVTETQLDISALDFVENGTVKDFMKTRDGNLVLEGRFLEMFSQSIVFSELRGLAGLMSRKEFITRSAIQTMNGKQAELLYIPHEFQSAKITTPKEMSRAFLDLAPAEFATSLEPESLSEKSLLKLKQMRYYPHYFGYELTRTGQGIDGGVAENALRLEKSPVKKREIKCKQYKTLGRGQNKIVLYVRSSYYQTQFLEWFLHRPKNVQTDVAVSGSFLIDEKKVKTRWNYDALTVALEPVSGSERVFVSQPFTIFPEKSAEEEGQRYLGIDIGEYGIAYTALEITGDSAKILDQNFISDPQLKTLREEVKGLKLDQRRGTFAMPSTKIARIRESLVHSLRNRIHHLALKHKAKIVYELEVSRFEEGKQKIKKVYATLKKADVYSEIDADKNLQTTVWGKLAVASEISASYTSQFCGACKKLWRAEMQVDETITTQELIGTVRVIKGGTLIDAIKDFMRPPIFDENDTPFPKYRDFCDKHHISKKMRGNSCLFICPFCRANADADIQASQTIALLRYVKEEKKVEDYFERFRKLKN IKVLGQMKKI
用語「Cas12」または「Cas12ドメイン」は、Ca12タンパク質またはその断片(例えば、Cas12の活性な、不活性な、もしくは部分的に活性なDNA切断ドメイン、および/またはCas12のgRNA結合ドメインを含むタンパク質)を含むRNA誘導ヌクレアーゼを指す。Cas12は、クラス2、V型CRISPR/Casシステムに属する。Cas12ヌクレアーゼはまた、CRISPR(clustered regularly interspaced short palindromic repeat)結合ヌクレアーゼとも呼ばれることがある。例示的なBacillus hisashii Cas 12b (BhCas12b) Cas12ドメインの配列を下記に提供する:
MAPKKKRKVGIHGVPAAATRSFILKIEPNEEVKKGLWKTHEVLNHGIAYYMNILKLIRQEAIYEHHEQDPKNPKKVSKAEIQAELWDFVLKMQKCNSFTHEVDKDEVFNILRELYEELVPSSVEKKGEANQLSNKFLYPLVDPNSQSGKGTASSGRKPRWYNLKIAGDPSWEEEKKKWEEDKKKDPLAKILGKLAEYGLIPLFIPYTDSNEPIVKEIKWMEKSRNQSVRRLDKDMFIQALERFLSWESWNLKVKEEYEKVEKEYKTLEERIKEDIQALKALEQYEKERQEQLLRDTLNTNEYRLSKRGLRGWREIIQKWLKMDENEPSEKYLEVFKDYQRKHPREAGDYSVYEFLSKKENHFIWRNHPEYPYLYATFCEIDKKKKDAKQQATFTLADPINHPLWVRFEERSGSNLNKYRILTEQLHTEKLKKKLTVQLDRLIYPTESGGWEEKGKVDIVLLPSRQFYNQIFLDIEEKGKHAFTYKDESIKFPLKGTLGGARVQFDRDHLRRYPHKVESGNVGRIYFNMTVNIEPTESPVSKSLKIHRDDFPKVVNFKPKELTEWIKDSKGKKLKSGIESLEIGLRVMSIDLGQRQAAAASIFEVVDQKPDIEGKLFFPIKGTELYAVHRASFNIKLPGETLVKSREVLRKAREDNLKLMNQKLNFLRNVLHFQQFEDITEREKRVTKWISRQENSDVPLVYQDELIQIRELMYKPYKDWVAFLKQLHKRLEVEIGKEVKHWRKSLSDGRKGLYGISLKNIDEIDRTRKFLLRWSLRPTEPGEVRRLEPGQRFAIDQLNHLNALKEDRLKKMANTIIMHALGYCYDVRKKKWQAKNPACQIILFEDLSNYNPYEERSRFENSKLMKWSRREIPRQVALQGEIYGLQVGEVGAQFSSRFHAKTGSPGIRCSVVTKEKLQDNRFFKNLQREGRLTLDKIAVLKEGDLYPDKGGEKFISLSKDRKCVTTHADINAAQNLQKRFWTRTHGFYKVYCKAYQVDGQTVYIPESKDQKQKIIEEFGEGYFILKDGVYEWVNAGKLKIKKGSSKQSSSELVDSDILKDSFDLASELKGEKLMLYRDPSGNVFPSDKWMAAGVFFGKLERILISKLTNQYSISTIEDDSSKQSMKRPAATKKAGQAKKKK.
BhCas12bアミノ酸配列に対する少なくとも85%またはより高い同一性を有するアミノ酸配列も、本発明の方法で有用である。
「保存的アミノ酸置換」または「保存的変異」という用語は、あるアミノ酸が共通の特性を有する別のアミノ酸に置き換わることを指す。個々のアミノ酸間の共通の性質を定義するための機能的な方法は、相同的な生物の対応するタンパク質間のアミノ酸変化の正規化された頻度を分析することである(Schulz, G. E. and Schirmer, R. H., Principles of Protein Structure, Springer-Verlag, New York (1979))。このような分析によれば、グループ内のアミノ酸が互いに優先的に交換され、それゆえに全体的なタンパク質構造に対するそれらの影響において互いに最も類似しているところアミノ酸のグループを定義することができる(上記Schulz, G. E. and Schirmer, R. H.)。保存変異の非限定的な例としては、例えば正電荷を維持することができるアミノ酸アルギニンからリジンおよびその逆;負電荷を維持することができるアスパラギン酸からグルタミン酸およびその逆;遊離の-OHが維持されるトレオニンからセリン;および遊離NH2を維持できるアスパラギンからグルタミンのようなアミノ酸置換が挙げられる。
本明細書中で交換可能に使用される用語「コード配列」または「タンパク質コード配列」とは、タンパク質をコードするポリヌクレオチドのセグメントをいう。この領域または配列は、5’末端に近い方が開始コドンで境界され、3’末端に近い方が停止コドンで境界される。コード配列はオープンリーディングフレームとも呼ばれる。
本明細書中で使用する場合、用語「デアミナーゼ」または「デアミナーゼドメイン」とは、脱アミノ化反応を触媒するタンパク質または酵素を指す。ある態様において、デアミナーゼは、ヒポキサンチンへのアデニンの加水分解的脱アミノ化を触媒するアデノシンデアミナーゼである。ある態様において、デアミナーゼは、アデノシンまたはアデニン (A) からイノシン (I) への加水分解的脱アミノ化を触媒するアデノシンデアミナーゼである。ある態様において、デアミナーゼまたはデアミナーゼドメインは、アデノシンデアミナーゼであり、それぞれイノシンまたはデオキシイノシンへのアデノシンまたはデオキシアデノシンの加水分解的脱アミノ化を触媒する。ある態様において、アデノシンデアミナーゼは、デオキシリボ核酸 (DNA) 中のアデノシンの加水分解的脱アミノ化を触媒する。本明細書中で提供されるアデノシンデアミナーゼ(例えば、遺伝子操作されたアデノシンデアミナーゼ、進化されたアデノシンデアミナーゼ)は、細菌などの任意の生物由来であり得る。一部の実施形態では、アデノシンデアミナーゼは、Escherichia coli、Staphylococcus aureus、Salmonella typhimurium、Shewanella putrefaciens、Haemophilus influenzae、またはCaulobacter crescentusなどの細菌に由来する。
一部の実施形態では、アデノシンデアミナーゼはTadAデアミナーゼである。一部の実施形態では、TadAデアミナーゼはTadAバリアントである。一部の実施形態では、TadAバリアントはTadA*8である。一部の実施形態では、デアミナーゼまたはデアミナーゼドメインは、ヒト、チンパンジー、ゴリラ、サル、ウシ、イヌ、ラット、またはマウスなどの生物由来の天然に存在するデアミナーゼのバリアントである。一部の実施形態では、デアミナーゼまたはデアミナーゼドメインは自然に存在しない。例えば、一部の実施形態では、デアミナーゼまたはデアミナーゼドメインは、天然に存在するデアミナーゼと少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、少なくとも99.1%、少なくとも99.2%、少なくとも99.3%、少なくとも99.4%、少なくとも99.5%、少なくとも99.6%、少なくとも99.7%、少なくとも99.8%、または少なくとも99.9%同一である。例えば、デアミナーゼドメインは国際PCT出願番号PCT/2017/045381(WO 2018/027078)およびPCT/US2016/058344(WO 2017/070632)に記載されており、これらの各々はその全体で参照により本明細書に組み込まれる。また、その内容が全体で参照により本明細書に組み込まれている、Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016)、Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017)、Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017)、およびRees, H.A., et al., “Base editing: precision chemistry on the genome and transcriptome of living cells.” Nat Rev Genet. 2018 Dec;19(12):770-788. doi: 10.1038/s41576-018-0059-1も参照されたい。
「検出」は、検出されるべき分析物の存在、不在または量を同定することを指す。1つの実施形態において、ポリヌクレオチドまたはポリペプチドにおける配列変化が検出される。別の実施形態では、インデル(indel)の存在が検出される。
「検出可能な標識」とは、目的の分子に連結されたときに、分光学的、光化学的、生化学的、免疫化学的、または化学的手段を介して、後者を検出可能にする組成物を意味する。例えば、有用な標識には、放射性同位体、磁気ビーズ、金属ビーズ、コロイド粒子、蛍光色素、高電子密度試薬、酵素(例えば、ELISAで一般的に用いられるもの)、ビオチン、ジゴキシゲニン、またはハプテンが含まれる。
「疾患」とは、細胞、組織または器官の正常な機能を損傷または妨害するあらゆる状態または障害を意味する。疾患の一例としては、糖原病1型(GSD1またはVon Gierke病としても知られる)が挙げられる。一部の実施形態では、GSD1は1a型(GSD1a)である。
「有効量」とは、未治療の患者と比較して、疾患の症状を改善するために必要な量を意味する。疾患の治療的処置のために本発明を実施するために使用される活性化合物(複数可)の有効量は、投与態様、対象の年齢、体重、および全般的健康状態に依存して変化する。最終的には、主治医または獣医が適切な量および用量を決定する。このような量は「有効」量と呼ばれる。一実施形態では、有効量は、細胞(例えば、インビトロまたはインビボの細胞)内の目的の遺伝子(例えば、G6PC)に改変を導入するのに十分な本発明の塩基エディターの量である。一実施形態では、有効量とは、治療効果(例えば、GSD1aまたはその症状もしくは状態を低下させるまたは制御すること)を達成するために必要な塩基エディターの量である。このような治療効果は、対象、組織または器官の全ての細胞においてG6PCを変化させるのに十分である必要はなく、対象、組織または器官に存在する細胞の約1%、5%、10%、25%、50%、75%またはそれ以上においてG6PCを変化させるだけでよい。一実施形態では、有効量は、GSD1aの一つ以上の症状を改善するのに十分である。
「断片」とは、ポリペプチドまたは核酸分子の一部を意味する。この部分は、参照核酸分子またはポリペプチドの全長の少なくとも約10%、20%、30%、40%、50%、60%、70%、80%、または90%を含む。断片は、10、20、30、40、50、60、70、80、90、または100、200、300、400、500、600、700、800、900、または1000のヌクレオチドまたはアミノ酸を含み得る。
「グルコース-6-ホスファターゼ(G6PC)ポリペプチド」とは、NCBI受託番号AAA16222.1と少なくとも約95%のアミノ酸配列同一性を有するポリペプチドまたはその断片を意味する。特定の実施形態では、本発明は、糖原病1a型(GSD1a)に関連する一塩基多型(SNP)を含むG6PCポリヌクレオチドを編集する方法を提供する。一実施形態では、GSD1aに関連するSNPでのA・TからG・Cへの改変により、G6PCポリペプチド中においてグルタミン(Q)が非グルタミン(X)アミノ酸に変化する。別の実施形態では、GSD1aに関連するSNPでのA・TからG・Cへの改変により、G6PCポリペプチド中においてアルギニン(R)が非アルギニン(X)に変化する。一実施形態では、GSD1aに関連するSNPは、位置347で非グルタミン(X)アミノ酸を有するまたは位置83で非アルギニン(X)アミノ酸を有するG6PCポリペプチドの発現をもたらす。一実施形態では、塩基エディター補正により、位置347のグルタミンが非グルタミンアミノ酸(X)で置き換えられる。別の実施形態では、塩基エディター補正により、位置83のアルギニンが非アルギニンアミノ酸(X)で置き換えられる。特定の実施形態では、G6PCは以下の参照配列と比較して1つまたは複数の改変を含む。特定の実施形態では、GSD1aに関連するG6PCは、Q347XおよびR83Cから選択される1つまたは複数の突然変異を含む。Homo Sapiens由来の例示的なG6PCアミノ酸配列を以下に提供する:
1 MEEGMNVLHD FGIQSTHYLQ VNYQDSQDWF ILVSVIADLR NAFYVLFPIW FHLQEAVGIK
61 LLWVAVIGDW LNLVFKWILF GQRPYWWVLD TDYYSNTSVP LIKQFPVTCE TGPGSPSGHA
121 MGTAGVYYVM VTSTLSIFQG KIKPTYRFRC LNVILWLGFW AVQLNVCLSR IYLAAHFPHQ
181 VVAGVLSGIA VAETFSHIHS IYNASLKKYF LITFFLFSFA IGFYLLLKGL GVDLLWTLEK
241 AQRWCEQPEW VHIDTTPFAS LLKNLGTLFG LGLALNSSMY RESCKGKLSK WLPFRLSSIV
301 ASLVLLHVFD SLKPPSQVEL VFYVLSFCKS AVVPLASVSV IPYCLAQVLG QPHKKSL
「グルコース-6-ホスファターゼポリヌクレオチド」とは、G6PCポリペプチドをコードしているポリヌクレオチドを意味する。Homo Sapiens由来の例示的なG6PCヌクレオチド配列を以下に提供する(GenBank:U01120.1):
1 ATAGCAGAGC AATCACCACC AAGCCTGGAA TAACTGCAAG GGCTCTGCTG ACATCTTCCT
61 GAGGTGCCAA GGAAATGAGG ATGGAGGAAG GAATGAATGT TCTCCATGAC TTTGGGATCC
121 AGTCAACACA TTACCTCCAG GTGAATTACC AAGACTCCCA GGACTGGTTC ATCTTGGTGT
181 CCGTGATCGC AGACCTCAGG AATGCCTTCT ACGTCCTCTT CCCCATCTGG TTCCATCTTC
241 AGGAAGCTGT GGGCATTAAA CTCCTTTGGG TAGCTGTGAT TGGAGACTGG CTCAACCTCG
301 TCTTTAAGTG GTAAGAACCA TATAGAGAGG AGATCAGCAA GAAAAGAGGC TGGCATTCGC
361 TCTCGCAATG TCTGTCCATC AGAAGTTGCT TTCCCCAGGC TATTCAGGAA GCCACGGGCT
421 ACTCATGCTT CCAACCCCTC TCTCTGACTT TGGATCATCT ACATAAAGGG GGAAGACAGA
481 AAAAATCCTA CCAGTGAGTT GAAAATACAG GAAAGCCTAT TTCATATGGG TTAAAGGGTA
541 GGACAGTTGA ATTTCGTGAA AAGTCTGAGT TATATAGGCT TTGAGCAAAG AGTTTTATTA
601 GTATGAAGCA GAAGAGGTAA CATAAAGAAA GATGTATGGG GCCAGGCATG GTGGCTCACA
661 CCTGTAATCC CAGCACTTTG GGAGGCCGAG GTGGGCGAAT CACTCCTGGG TGAACTCAGG
721 AGTTCAAGAC CAGCCTGGGC AACATGGCGA AACTCCATCT CTACAAAAAC ATTACGAAAA
781 TTAGCTGGGC GTGTTGGTGC TGTAGTCCCA GCTACTCAGG AGGCTGAGGT GAGAGGCGGA
841 GGAGGTTGCA GTGAGTCAAG ATCATGCCAC TGCACTCCAG CCTGGGCAAC AGAGTAAGAC
901 CCTGTCTCAA AAAAAAAAAA AAGATAGATG ATGTATGCTG TATGAAAAAA GGAAACACAC
961 AGATGATTCA ACAGCCTGTT TTGTGGGGTA ATGAAAAGTC ACCCTGGGAA CTGGGCTCCA
1021 GCCCTCGTTC TGCCACCCAC CAACTACATG TCCTTGGCAA GTCATATCAA TTATCTGAGT
1081 TTCTGTTTTA TAATCTACAA ATAGGTTATC TCTGGCAGCT TAATAATAAT CAGGGTTAAC
1141 ATTTATTAAA CAGTGTGTGC CAGTCCATGT GCTATGTGCT TTTCTGTGAG GTAGTTACTG
1201 CTATTTACAG AAACAGTAGA TGCAGAGACC AAGGTGCTGA GTTAAATGAT TAGGCCAACA
1261 AGGTTAGTAC ATGCCGAGCC AGGATGGAAG CCCAGGTAGG CAGGCTGGCT TCCGCGGCAA
1321 TGCTCTTATG AACTATGTTA CGTCCAGTGC TGATAAACTG ACTCTCTGGG GAGCAGGGGA
1381 AAGCCCTGAG TTTAGCATTT GCCAATTTCT ATCACGTAAA CATTCCCATT CTGGCCACTT
1441 TCTTTCTTTC TTTCTTTTGT TTGTTTGTTT GAGATGGAGT CTCGCACTGT TGCCTGGCTG
1501 GAGTGCAATG GTGCAATCTC AGCTCACTGC AACCTCTGCC TCTCCGGTTC AAGTGATTCT
1561 CCTGCCTCAG CCTCCCAAGT AGCTGGGATT ACAGGTGCCC GCCACCATGC CCAGCTAATT
1621 TTTTTTGTAT TTTTAGTAGA GACATGGTTT CACTATGTTG ACTAGGCTGG TCTCGAACTC
1681 CTGACCTCAT GATCTGCCTG CCTTGGCCTC CCTAAGTGCT AGGATTACAG GCGTGAGCCA
1741 CTACACCCAG CCGCATGATT CTAAAAAATA AAAAGATGAA GTGTTATTCC AAACATCTGA
1801 TCTCCATTGA AGAACCATGC AATCTCTCTG GGTTGATAGA GGCCAGAGTT AGTGGCTCTC
1861 CCTGATTTCG GTGAGAAATC ACTATTCCAC CATCACGGGA TAAAAGGCAT CCTGACTGGC
1921 GGTTGACACC TATTTCCACA GTGAAAGATA TATCTAGTAC TTTTAAAGGG GAAGTGGTTT
1981 GTCTGAGATA CTCTGTTTCA AAGTAGAGAG GATACAGAAC AAGCATCTGA AGCTATATAC
2041 ATCCTTACAG AGAGCAATTC TGATGGAAAT GCAGGCCATG TTTCCCTGGG GGGGGCTCGT
2101 CCTAGGGGCT GGAGTGCATT CTCTGATGTC AGAGGAAATG CAAGATTCCC TGAGGCCTGA
2161 GGGAACCCAT GGTATATGCA AGTCCAAGTT TCAAACTGTA GTTCCATATG CATTCTTCCA
2221 GGACAAATAC TTCTTGAGGT TAAAAAAAAA AAGTCACATA GCTGCCATTT TATGGATTTC
2281 AGGATTTTTT TTTTTTTTTT TTTGAGATGG AGTCTTGCTC TGTCACCCAG CCTGTAGTGC
2341 AGTGGCATAA TCTCGGCTCA CGGCAACCTC CGCCTCCCAG GTTCAAGCGA TTCTCTTGCC
2401 TTAGCCTCCC GAGTAGCTGG GATTACAGTC ACGCACCACC ACATCTGGCT AATTCTTTAT
2461 ATTTTTTGGT AGAAACGGTG TTTCACCATG TTGGCCAGGC TGGTCTCAAA CTCCTGACCT
2521 CATGTGATCT GCCTGCCTTG GCCTCCCAAA GTGCTGAGAT TACAGGTGTG AGCCACCGCG
2581 CCTGCCTGGA GTTCAGAATC TTGGGCTTCA TTATTTGTGT TTAAATAGAT CATACAGTCA
2641 GGCACGGTGG CTCATGCCTG TAATCCCAGC ACTTTGGGAG GCTGAGGTGG GAGGATTGCC
2701 TGAGTTCAGG AGATGGAGAC CAGCCTGGGC AACATGGTGA AACCCCGTCT CTACTAAAAA
2761 TACAAAAACT AGCTGGATGT GGTGGCACAC ACCTGTAGTC CCAGCTATTC AGGAGGCTGA
2821 GGTGGGAGGA TCCCAGGAGG TAGAGGTCAC AATGAGCCGA GATTGCGCCA CTGCACTCCA
2881 GGCTGGGTTA CTGAGCCAGA TCCTGTCTCA AAAAAAAAAA AGATAATACA TTCAAACAGT
2941 TCAAAATGCA AAAGTTACAT ACATAAGGAA GTGTCATGAA ATATCTCCCT CTCACACTTC
3001 TCCCCAGCCA CCCAGTTCTC CCTTCTAGAG GCAACATGTG AAATCCTTCT CAGGCTACAC
3061 TCTTCTTGAA GGTGTAGGCT TTGGGCAAAA GCATTCATTC AGTAACCCCA GAAACTTGTT
3121 CTGTTTTTCC ATAGGATTCT CTTTGGACAG CGTCCATACT GGTGGGTTTT GGATACTGAC
3181 TACTACAGCA ACACTTCCGT GCCCCTGATA AAGCAGTTCC CTGTAACCTG TGAGACTGGA
3241 CCAGGTAAGC GTCCCAGCCC CTGCAGACAG AAGCTGAGTG GACCTCGTTT ACCTGTTATG
3301 GATGAAACTG ACCTTGAGGG GACATGAGGA GAGCCATTCC TTTGTACTTT TGTCATGCTC
3361 TTCAATTGGC ACAAATTAAT TCACTTCTGC AATACTTTCC TGAATAGCAC AGTAGTATTG
3421 GAAATCTGCC TATTACAGAA CCTGGATGGA GTCCAGAGAG GCACGGGCAT CCATGGGCAA
3481 AGGGCTCGTG AGAGTCACCG CCCTGCAGCG CTGTGTCCTG AGAAAGGAGG GGGCAGAAGC
3541 CTGAGCTTCT GGGGGTCCTT CCCAATGGCC TGGCCCACTG GATGTGCCCT CCTGAGCTGA
3601 CCGTCCAATC CCTTGCCCTC TCTGTGCCTA CGTTTTATTA GTTACAGCCA GATGGTTACT
3661 GTCAAATCAA ATGATAGATT TCATTTTCAG TATGTAATAG GAAGCCCCTC CCTCACCCTA
3721 AAGTCTCAGC TGCCCTCTAA GACTAGTACT CTCTAAGGTA CTAGTATCCC TTCCTCAGAG
3781 ACCCTTTCCC TGACCCCAAA ACTAGGGAAG GTCCCTTAGT TATTTGCTCT CACAGACCAC
3841 GCATTTACCT CAGAGCATAT TCACTCATTC AGCTGTTACT TACCAAGCAC CTACTGGGAG
3901 CTATACACTG TTCTATGTGC TAGGGATACC TCTGTCAGTG AACAACACAG ACACAAAGAT
3961 CCCTGCCCTT GTGGAGCTGA AATCTGAATA GAGGAGGTGA AATATACAAA AATTATAATA
4021 AATAAGTAAA CTAGGCCAGT TGTGGTTGCT CATGCCTGTA ATCCCAGCAC TTTGGGAAGC
4081 CAAGGTAGGT AGATCACCTG AGGTCAGGAG TTCAAAACCA GCCTGGCCAA CATTGCAAAA
4141 TCCTGTCTTT ACTAAAAATG GAAAAATTGG TCAGGCGTGA TGGCACACGC CTGTAGTCTC
4201 AGCTACCTGG GAGGCTGAGG CAGGAGAATC GCTTGAACCT GGGAGGCAGA GGTTGCAGTG
4261 AACCGAGATC GGACCACTGC ACTCCAGCCT GAATGACAGA ACGAGACTCT GTCTCAAAAA
4321 AAAAGTAAAC TATTAATATG TAGGATAGGC CAGGCACGGT GGCTCACCCT GTAATCCCAG
4381 CACTTTGGGA GGCTGAGGCG GGTGGATCAC CTGAGGTGAG GAGTTCAAGA CCAGCCTGGC
4441 CAACATGGCA AAACCCTGTC TCTACTAAAA ATACAAAAAT TAGCTGGGTG TCCTGGTGCA
4501 TGCCTGTAAT CTGAGCTACT CAGGAGGCTA AGGCAGGAGA ATCGCTTGAA CCTGGGAGGT
4561 GGTGAGCCAA GATTGCGCCA TTGCACTCCA GCCTGGGCGA CAAAATGAGA CACCATCTGA
4621 AAAAAAAAAA AAAATATATA TATATATACA CACACACACA CACACACACA CACACACACA
4681 TATAATACTA GAAAATGATT GTTTATAGGC AAAAAAAAAA AAAAAGAAGA AGAAGAAGAA
4741 AAGGAAAGGA GAAGGAAAGA AGGACCAAAC ATCTTTTGTA GAAATATGTT TGCTTTCATC
4801 ATAACAGCTT GTTATCAAGG ATGAATTTCT CCCTGAAATT AATGGAGGCA CAGACTGGAA
4861 AGTTTAAAGT GGCTTTAAGA GGTTATTTTA TTTAGTCCTC TGTCTTAATA GAAGCAAATT
4921 ATTATCTCTG CTCCTTAGGT AGAGTAGCTA AGGCTCAGAA AGTAGGCCGG GCGCGGTGGC
4981 TCACGCCTGT AATCCTAGCA CTTTGGGAGG CCAACGCAGG TGGATCACCT GAGGTCAGGA
5041 GTTTGAGACC AGCCTGGCCA ACATGGTGAA ACCTCGTCAC TAATAAAAAA ATACAAAAAC
5101 TTAGCCAGGC ATGGTGGCGG GCGCCTGTAA TCCCAGCTAC CCAGGAGGCT GCGGCAGGAG
5161 AATCACTTCA ACCCGGGAGG CAGAGGTTGC AGTGAGCTGA AATCACACCA CTGCACTCCA
5221 GCCTTGGTGA CAGAGAAAGA TTCTGTCAGG AAAAAAAAAA AAAAGTTTAA ATGAATTACC
5281 CAAGGTATAT AATTGTTAGT GTTAGAAGGA AGAAGAAGGG AGGGAGGAAG GAAGGGAGAA
5341 AGAAAGGGAA GGAGGAAGGG AGGGAGGGAA GAAAGCCTTT ATTTATCTAT GGGGTTCCCT
5401 GGAAAGCAGG CTGAAATGGA GATTCACGTG CAGGAGTTTA GATACTCTGG GGAACTATAC
5461 TTGTAGAAGG GAAGGAACAG GAACAGGGCA GAAGGAGAGG TCCGGTTGTG ATTCTGCCTC
5521 ATCCAACCCC ACAGCGAGCT CTGAAGCTGG GGATGGCTCC TCAGAGTTGG TCCAAGTTGG
5581 GACAAGGGAA TCAGACCCTG GGGAGAGCGT AACCTTGATC AAGGCGACTC TCTTTAGCCC
5641 AGGGCAATGC CAGGAGAAGG CTGAGAGCAG AAAGCCATCT ACCATCACAC TCTCAACAGC
5701 TACGAAATAA GTCCTGCAGT TCAGGAGGGA GGTCTGGGCG GCACATCTCA GGACCCTCTA
5761 TCTCTCAGGG TAGAGGAATT AAGAATGGGA TGGGAACCAG ACGGGCCATG GTGGCTCACA
5821 CCTATAATCC CAACACTTTG GGAGGCCAAG GGTAGGAGGA TTGCTTGAGC CCAAGAGTTC
5881 AAAACCAGCC TGGGCAAAAA CAATCAAACA AACAAACAAA ACACATTTAA AAAATTTGCT
5941 GTGTGTGGTG GTGTGCACCT GTGGTCCCAG CTACTCAGGG GGCTGAGGTG GGAGGATTGC
6001 TTGAGTCCAG GAGGTCGAGG CTGCAGTGAG CTATGATCAT GGCACTGCAT TGCAGCCTAG
6061 GAGACAAAGC AAGACACTGT CTCTAAAAAA ACAAAAAACA AACAAATAAA AAAACGGAAC
6121 CGGTTGCAAG CAGGGTTAAA TAGCGTGGTC AGAGTAGGAC TCACTGAGAA TATGAGATCT
6181 GAGTCAAGTC TTCAAGGATG TGAGGAAGTA AGTTTCTGGC AGAAGAGCTG TGAAGGGCTG
6241 TCTGGCCAGA GAAGATTGCA ATGCAAAAGC CCTGAGGTGG GAACGTGTTT GGTGTGTTTA
6301 AAGGAAAGCA ATGAGGCCAG TGTAGCCAGA ACAGAGTGTG CAAGGAGAGA AGGAACAGAA
6361 GATGTGGAGG GCAGATCAGT TTGTAATTGT ACGCCCAGTA TGCTGATTCT TTGTGTAATC
6421 TCCAGACTGT ATTAAACTGC AAGAGCAGGG CCCCTCTCTG GCTTTGCTCA TCATTGTATT
6481 CCCAGAGCCT TGCACAATGC TTGGTGCATA GGAGATGGAA ATTTGTTAAA TAAATGAATT
6541 ATGGATAACG AATGGATGGT AAGATGGGTG GATGGATGGG GGGTGAACGG ATGGATGGGG
6601 GGTGAATGGA TGGATGAATG GGTAGATGGG TGGATAGGGG GATGGCTGGG TGGCTGGGTA
6661 GATGATGCAC TGTCTCCCAG ATGAGGACCT TTTCACCTTT ACTCCATTCT CTTTCCTGCC
6721 CTTTAGGGAG CCCCTCTGGC CATGCCATGG GCACAGCAGG TGTATACTAC GTGATGGTCA
6781 CATCTACTCT TTCCATCTTT CAGGGAAAGA TAAAGCCGAC CTACAGATTT CGGTAAGAAC
6841 TCACCACTGG GGTGTAGGTG GTGGAGGGCA GGAGGCAGCT CTCTCTGTAG CTGACACACC
6901 ACGTATTCTT CCTCACATCC CCCTAGCCCG CTCCCACACC TGGGCAGCCG CTGATTAAGA
6961 GTTGTGGCAC TTTGGATAGG GATAAACCTC AGAGTCAGGG AATGTTTGGG CTGAAAGGGA
7021 TCCAGTAGTG CAATCCGTTG TTTTACAGAT AAGGAAACAA AGCCCAACAC CATGAAGGGA
7081 CTTATAAAAA TAAGGTAGTG AAGTAGCAGC AGGGCTTAAA TAAAAACCCA TGTCTGTACC
7141 AACCACAGAG TCACCCATCC AGGTTAAAAT AACCAGAGAA ACAGAAGATA TTCCTACTAC
7201 AGAGAATTCC GGGTGTGCAG CCACAGTGCA AATCCTTTTT ATTTTTATTT TTGAGATGCA
7261 GTCTCGCTCT GTCATCCAGG CTGAAGTGCA GTGGCACGAT CATGTCTCGC TGCAACCTCT
7321 GCCTCCCAGG CTCAAGCGAT CCTCCCACCT CAGCCATCTG AGTAGCTGGG ACCACAGGCC
7381 ACACACCACA CCCAGCTAAT TTCTCGTATC TTTTTGTAGA GACAGAGTTC TGCTATGTTG
7441 CCCAGGCTCA GGCTGGTCTT GATCTCAAGC AATTGGCTTG CCTCAGCCTC CTAAAATATT
7501 GGGATTACAG GCATGAGCCA CCGCGCCAGC CATGCAAATC CTTAATTATC AAACAGATAA
7561 AATAGGGAAG TTAAAATTCA TATACACAAG GGTTAACCAC TTGCCACAGG CATTTTTTTT
7621 TTTTTTTTGA GACGGAATCT CGCTCTGTTG CCCAGGCTGG AGTGCAGTGG CGCCATCTCG
7681 CCTCACTGCA ACCTCCGCTT CCTGGGTTCA AGCTATTCTT CTGCCTCAGC CTACCGAGTA
7741 GCTGGGACTA CAGGCACGTG CCACCACACC TGGCTAATTT TTTTATTTTT AGTAGAGATG
7801 GGGTTTCACC ATATTGGCCA GGCTGGTCTT GAACTCCTGA CCTAGTGATC CATCCGCCTC
7861 AGCCTCCCAA AGTGCTGGGA TTGCAGGCAT GAGCCACCGC GCCTGGCCTT TTTTTTTTTT
7921 TTTTGAGACG GAGTTTTGCT CTTGTTGCCC AGGCTAGAGT GCAGTGGCGC AGTCTCGGCT
7981 CACTGTAACC TCCACCTCCT GAGTTCAAGC AATTCTCCTG CCTCAGCCTC TCAAATAGCT
8041 GGGATTACAG GCGTGAGCCA CCCCACCTGG CTAATTTTGT AATTTTTTTT TTAGTAGAGA
8101 TGGGGTTTCA CCTGTTGATC AGGCTGGTCT CAAACTCCTG ACCTCAAGTG ATCCACCCAC
8161 CTCGGCCTCC CAAAGTGCTG GGATTACAAG CATAAGCCAC CGTGCCTGGT CAATTTTGAT
8221 CTTTTTTAAA GAGACAGGGG TCTTGCTATG TTGCCCAGAC TAGTCTTGAA CTCCTGGCCT
8281 CAAGTGATCC TCTCACCTCG GCCTCCCAAA GTATTGGGAT TACAGGTCTG AGCCGCTGCA
8341 CCCAGCCCCC AACAGGCATC TTTGGACTTT TGAGTACTGG CTTTAATTTA CAAAAATTCC
8401 ACTGAGAGCA CCTAAGTTTG CCAGGCTCCA ACATTTCTGC AGGGGCTGTT TTCTTTGCTG
8461 AAGGATCTGC ACCTGTGTTC TGTTATGGTT GCCTCTTCTG TTGCAGGTGC TTGAATGTCA
8521 TTTTGTGGTT GGGATTCTGG GCTGTGCAGC TGAATGTCTG TCTGTCACGA ATCTACCTTG
8581 CTGCTCATTT TCCTCATCAA GTTGTTGCTG GAGTCCTGTC AGGTATGGGC TGATCTGACT
8641 CCCTTCCTTC TCCCCCAAAC CCCATTCCGT TTCTCTCCCT AATCAGGACA AAATCCCAGC
8701 ATTCCAGCCA CATCCTGTGT GTAATCAGTA CTGTTAGCAT TTCTGTGGGT TGAAAGTCAA
8761 GAATGAGCAA CTTGAAATGA TTAATTTCTA TAAGAGTGCC CAGATCTATA GAATGAATTG
8821 TGTAGAAGTT ACCATACATC AAATTAACGC ACCAAATTGA ATTAGCTTGA AATCTCAGAG
8881 CTTTTTACAA TCTTTATTTC TTACTGGTCT TCAACAGGCC CTAATTTACT TTTCAGGGAA
8941 TCTGCCAAAT TTAACAAATT AACACGATGT CCTAGGAAAG CTGTTCATTT AAATACATTC
9001 ATTTGCAAAC CTAATAGATA ACTGCAGTTG ATCTCTTTTA TAGGTTCAGA GTTTTGAATA
9061 TGTTTTTTTT TGTTTTTTTT TTTTGAGATG GAGTCTCGCT CTGTGACCCA GGCTAGAGTG
9121 CAGTGGTGCG ATCTCGGCTC ACTGCAAGCT CCACCTCCTG GGTTCACGCC ATTCTCCTGC
9181 CTCAGCCTCT CCGAGTAGCT GGGACTACAG GCGCCCGCCA CCATGCCCGG CTAATTTTTT
9241 GTATTTTTAG CAGAGACGGG GTTTCACCGT GGTCTTGATC TCCTGACCTC GTGATCCGCC
9301 CGCCTCGGCC TCCCAAAGCG CTGGGATTAC AAGGGTGAGC CACCGCACCC TGCCTGAATA
9361 TGTGTTTTCT TAGATCCAAT TAACAAGGGT AAGACAAGAT TTAAGTTAAG CATAAGAAAG
9421 ATTTTGTGGG AGGCACTGGA ATATAAGACC TTAACAAAAC TGTGGAATTT CTCCCCTGGA
9481 GATTTGTAAG AACGGAACAT AGCAGCATTC AAAGAAGAAT GTTGAGAACA AGGGAGATAA
9541 TGGTTTCATG GTAATCACAA AAGTAACACA GCATTTAGTA CTGGGTTCCA TGTTTGAGGA
9601 AGAACCTGGA AGCCATATCA CATGAAAAAC CTGGGAATGT TTAGGTTAGA GAGAATAACT
9661 GTGTTCAAAT GTGTGACAGA GGGACTAGAT TCATCACTTA CTAACTCCTG CAGAAAGAAC
9721 TGAGAAAAAT AGACAGTATT AGAGGGGGAC CAGTTTCACA CAGACAAGGA AGAACTATTC
9781 AGCAATCAAT TCCGTTCAAA GATAAAATGG ACTGTTATAG TGGGGGTGAG CTCCCTACCT
9841 CTGAGGGTAT TTCAAGTAGA GATAGGAGGA CCTCCTGGTA GGAAATTTGC ATACGGTGGG
9901 AGATTGTACG TGATATGGCA CCTCCATCTG AAAGAGTCTA TATTGAGGGC AGGCTGGAGT
9961 CACACATGGG AATAAGCCAG GCGACCCTCC CATCTGCCAT CTGTGATTTA ATTCCACAGT
10021 CGCAGAACGG ATGGCATGTC ACCCACTCCT CCAAACCCAC CTCTAGCAAA GGTCCCAAAT
10081 CCTTCCTATC TCTCACAGTC ATGCTTTCTT CCACTCAGGC ATTGCTGTTA CAGAAACTTT
10141 CAGCCACATC CACAGCATCT ATAATGCCAG CCTCAAGAAA TATTTTCTCA TTACCTTCTT
10201 CCTGTTCAGC TTCGCCATCG GATTTTATCT GCTGCTCAAG GGACTGGGTG TAGACCTCCT
10261 GTGGACTCTG GAGAAAGCCC AGAGGTGGTG CGAGCAGCCA GAATGGGTCC ACATTGACAC
10321 CACACCCTTT GCCAGCCTCC TCAAGAACCT GGGCACGCTC TTTGGCCTGG GGCTGGCTCT
10381 CAACTCCAGC ATGTACAGGG AGAGCTGCAA GGGGAAACTC AGCAAGTGGC TCCCATTCCG
10441 CCTCAGCTCT ATTGTAGCCT CCCTCGTCCT CCTGCACGTC TTTGACTCCT TGAAACCCCC
10501 ATCCCAAGTC GAGCTGGTCT TCTACGTCTT GTCCTTCTGC AAGAGTGCGG TAGTGCCCCT
10561 GGCATCCGTC AGTGTCATCC CCTACTGCCT CGCCCAGGTC CTGGGCCAGC CGCACAAGAA
10621 GTCGTTGTAA GAGATGTGGA GTCTTCGGTG TTTAAAGTCA ACAACCATGC CAGGGATTGA
10681 GGAGGACTAC TATTTGAAGC AATGGGCACT GGTATTTGGA GCAAGTGACA TGCCATCCAT
10741 TCTGCCGTCG TGGAATTAAA TCACGGATGG CAGATTGGAG GGTCGCCTGG CTTATTCCCA
10801 TGTGTGACTC CAGCCTGCCC TCAGCACAGA CTCTTTCAGA TGGAGGTGCC ATATCACGTA
10861 CACCATATGC AAGTTTCCCG CCAGGAGGTC CTCCTCTCTC TACTTGAATA CTCTCACAAG
10921 TAGGGAGCTC ACTCCCACTG GAACAGCCCA TTTTATCTTT GAATGGTCTT CTGCCAGCCC
10981 ATTTTGAGGC CAGAGGTGCT GTCAGCTCAG GTGGTCCTCT TTTACAATCC TAATCATATT
11041 GGGTAATGTT TTTGAAAAGC TAATGAAGCT ATTGAGAAAG ACCTGTTGCT AGAAGTTGGG
11101 TTGTTCTGGA TTTTCCCCTG AAGACTTACT TATTCTTCCG TCACATATAC AAAAGCAAGA
11161 CTTCCAGGTA GGGCCAGCTC ACAAGCCCAG GCTGGAGATC CTAACTGAGA ATTTTCTACC
11221 TGTGTTCATT CTTACCGAGA AAAGGAGAAA GGAGCTCTGA ATCTGATAGG AAAAGAAGGC
11281 TGCCTAAGGA GGAGTTTTTA GTATGTGGCG TATCATGCAA GTGCTATGCC AAGCCATGTC
11341 TAAATGGCTT TAATTATATA GTAATGCACT CTCAGTAATG GGGGACCAGC TTAAGTATAA
11401 TTAATAGATG GTTAGTGGGG TAATTCTGCT TCTAGTATTT TTTTTACTGT GCATACATGT
11461 TCATCGTATT TCCTTGGATT TCTGAATGGC TGCAGTGACC CAGATATTGC ACTAGGTCAA
11521 AACATTCAGG TATAGCTGAC ATCTCCTCTA TCACATTACA TCATCCTCCT TATAAGCCCA
11581 GCTCTGCTTT TTCCAGATTC TTCCACTGGC TCCACATCCA CCCCACTGGA TCTTCAGAAG
11641 GCTAGAGGGC GACTCTGGTG GTGCTTTTGT ATGTTTCAAT TAGGCTCTGA AATCTTGGGC
11701 AAAATGACAA GGGGAGGGCC AGGATTCCTC TCTCAGGTCA CTCCAGTGTT ACTTTTAATT
11761 CCTAGAGGGT AAATATGACT CCTTTCTCTA TCCCAAGCCA ACCAAGAGCA CATTCTTAAA
11821 GGAAAAGTCA ACATCTTCTC TCTTTTTTTT TTTTTTTGAG ACAGGGTCTC ACTATGTTGC
11881 CCAGGCTGCT CTTGAATTCC TGGGCTCAAG CAGTCCTCCC ACCCTACCAC AGCGTCCCGC
11941 GTAGCTGGGA CTACAGGTGC AAGCCACTAT GTCCAGCTAG CCAACTCCTC CTTGCCTGCT
12001 TTTCTTTTTT TTTCTTTTTT TGAGACGGCG CACCTATCAC CCAGGCTGGA GTGGAGTGGC
12061 ACGATCTTGG CTCACTGCAA CCTCTTCCTC CTGGTTCAAG CGATTCTCAT GTCTCAGCCT
12121 CCTCAGTAGC TAGGACTACC GGCGTGCACC ACCATGCCAG GCTAATTTTT ATATTTTTAG
12181 AATTTTAGAA GAGATGGGAT TTCATCATGT TGGCCAGGCT GGTCTCGAAC TCCTGACCTC
12241 AAGTGATCCA CCTGCCTTGG CCTCCCAAGG TGCTAGGATT ACAGGCATGA GCCACCGCAC
12301 CGGGCCCTCC TTGCCTGTTT TTCAATCTCA TCTGATATGC AGAGTATTTC TGCCCCACCC
12361 ACCTACCCCC CAAAAAAAGC TGAAGCCTAT TTATTTGAAA GTCCTTGTTT TTGCTACTAA
12421 TTATATAGTA TACCATACAT TATCATTCAA AACAACCATC CTGCTCATAA CATCTTTGAA
12481 AAGAAAAATA TATATGTGCA GTATTTTATT AAAGCAACAT TTTATTTAAG AATAAAGTCT
12541 TGTTAATTAC TATATTTTAG ATGCAATGTG ATCTGAAGTT TCTAATTCTG GCCCAACTAA
12601 ATTTCTAGCT CTGTTTCCCT AAACAAATAA TTTGGTTTCT CTGTGCCTGC ATTTTCCCTT
12661 TGGAGAAGAA AAGTGCTCTC TCTTGAGTTG ACCGAGAGTC CCATTAGGGA TAGGGAGACT
12721 TAAATGCATC CACAGGGGCA CAGGCAGAGT TGAGCACATA AACGGAGGCC CAAAATCAGC
12781 ATAGAACCAG AAAGATTCAG AGTTGGCCAA GAATGAACAT TGGCTACCAG ACCACAAGTC
12841 AGCATGAGTT GCTCTATGGC ATCAAATTGC AACTTGAGAG TAGATGGGCA GGGTCACTAT
12901 CAAATTAAGC AATCAGGGCA CACAAGTTGC AGTAACACAA CAAGACTAGG CCAGCTCTGG
12961 AATCCAGTAA CTCAGTGTCA GCAAGGTTTT GGGTTATAGT TCAAGAAAGT CTAAACAGAG
13021 CCAGTCACAG CACCAAGGAA TGCTCAAGGG AGCTATTGCA GGTTTCTCTG CTAAGAGATT
13081 TATTTCATCC TGGGTGCAGG GTTCGACCTC CAAAGGCCTC AAATCATCAC CGTATCAATG
13141 GATTTCCTGA GGGTAAGCTC CGCTATTTCA CACCTGAACT CCGGAGTCTG TATATTCAGG
13201 GAAGATTGCA TTCTCCTACT GGATTTGGGC TCTCAGAGGG CGTTGTGGGA ACCAGGCCCC
13261 TCACAGAATC AAATGGTCCC AACCAGGGAG AAAGAAAATA GTCTTTTTTT TTTTTTTAAT
13321 AGAGATGGGG GTCTCACTAT GCTGCCCAGG CTGGTCTTGA ACTCCTGGGT TCAAGTGATC
13381 CTCCTGCCTC AGCCTCCCAA AGTGCTGGGA TTACAGTGTG AGCCACTGCG CTTGGCCAGA
13441 AATGGTTTTG ATCTGTCTGA ACTGAACCCT ACTGCTTAGG CATAGCCCCA TCCTTGATAA
13501 TCTATTTGCT CCCAAGGACC AAGTCCAAGA TCCTTACAAG AAAGGTCTGC CAGAAAGTAA
13561 ATACTGCCCC CACTCCCTGA AGTTTATGAG GTTGATAAGA AAACATAACA GATAAAGTTT
13621 ATTGAGTGCT AACTTTA
「ガイドRNA」あるいは「gRNA」は、標的配列に特異的であり得、ポリヌクレオチドプログラミング可能ヌクレオチド結合ドメインタンパク質(例えばCas9またはCpf1)と複合体を形成することができるポリヌクレオチドを意味する。一実施形態において、ガイドポリヌクレオチドはガイドRNA (gRNA) である。gRNAは2個以上のRNAの複合体として存在することもあれば、1個のRNA分子として存在することもある。単一のRNA分子として存在するgRNAは、単一ガイドRNA(sgRNA)と呼ばれることがあるが、 「gRNA」は、単一の分子として、または2つ以上の分子の複合体として存在するガイドRNAを指すために互換的に使用される。典型的には、単一のRNA種として存在するgRNAは、(1) 標的核酸と相同性を共有するドメイン(例えば、標的へのCas9複合体の結合を指示する);および(2) Cas9タンパク質に結合するドメインという2つのドメインを含む。ある態様において、ドメイン (2) は、tracrRNAとして知られる配列に対応し、ステム-ループ構造を含む。例えば、いくつかの態様において、ドメイン (2) は、Jinek et al., Science 337:816-821(2012)(その全内容が参照により本明細書に組み入れられる)に提供されるようなtracrRNAと同一または相同である。gRNAの他の例(例えばドメイン2を含むもの)は、2013年9月6日に出願された米国仮特許出願U.S.S.N.61/874,682号、題名「Switchable Cas9 Nucleases and Uses Thereof」および2013年9月6日に出願された米国仮特許出願U.S.S.N.61/874,746号、題名「Delivery System For Functional Nucleases」中に見つけることができ、これらの各々の全内容はその全体で参照により本明細書に組み込まれる。一部の実施形態では、gRNAは、ドメイン(1)および(2)のうちの2つ以上を含み、「伸長されたgRNA」として言及し得る。伸長されたgRNAは、本明細書中に記載のように、2つ以上のCas9タンパク質と結合し、2つ以上の明白に異なる領域で標的核酸と結合する。gRNAは、標的部位と相補的なヌクレオチド配列を含み、これがヌクレアーゼ/RNA複合体と前記標的部位との結合を媒介し、ヌクレアーゼ:RNA複合体の配列特異性を提供する。当業者には理解されるように、RNAポリヌクレオチド配列、例えばgRNA配列は、DNAポリヌクレオチド配列に含まれる核酸塩基チミン(T)ではなく、ピリミジン誘導体である核酸塩基ウラシル(U)を含む。RNA中において、ウラシルはアデニンと塩基対合し、DNA転写中にチミンを置き換える。
「ヘテロ二量体」とは、野生型TadAドメインとTadAドメインのバリアント(例えばTadA*8)または2つのバリアントTadAドメイン(例えば、TadA*7.10とTadA*8もしくは2つのTadA*8ドメイン)など、2つのドメインを含む融合タンパク質を意味する。
「ハイブリダイゼーション」は、相補的な核酸塩基間の水素結合を意味し、ワトソン-クリック、フーグスティーンまたは逆フーグスティーン水素結合であり得る。例えば、アデニンとチミンは相補的な核酸塩基で、水素結合を形成して対を形成する。
用語「塩基修復の阻害因子」または「IBR」とは、核酸修復酵素、例えば塩基除去修復(BER)酵素の活性を阻害することができるタンパク質を指す。一部の実施形態では、IBRはイノシン塩基除去修復の阻害因子である。例示的な塩基修復の阻害因子としては、APE1、Endo III、Endo IV、Endo V、Endo VIII、Fpg、hOGGl、hNEILl、T7 Endol、T4PDG、UDG、hSMUGl、およびhAAGの阻害因子が挙げられる。一部の実施形態では、IBRはEndo VまたはhAAGの阻害因子である。一部の実施形態では、IBRは触媒的に不活性なEndoVまたは触媒的に不活性なhAAGである。一部の実施形態では、塩基修復阻害因子はEndo VまたはhAAGの阻害因子である。一部の実施形態では、塩基修復阻害因子は触媒的に不活性なEndoVまたは触媒的に不活性なhAAGである。
ある実施形態では、塩基修復阻害因子は、ウラシルグリコシラーゼ阻害因子 (UGI) である。UGIとは、ウラシル-DNAグリコシラーゼの塩基除去修復酵素を阻害することができるタンパク質を指す。いくつかの実施形態において、UGIドメインは、野生型UGIまたはその断片を含む。いくつかの実施形態において、本明細書で提供されるUGIタンパク質は、UGIの断片、および、UGIまたはUGI断片に相同的なタンパク質を含む。ある態様において、塩基修復阻害因子は、イノシン塩基除去修復の阻害因子である。いくつかの態様において、塩基修復阻害因子は、「触媒的に不活性なイノシン特異的ヌクレアーゼ」または「死んだイノシン特異的ヌクレアーゼ」である。いかなる特定の理論にも拘束されることを望まないが、触媒的に不活性なイノシングリコシラーゼ(例えば、アルキルアデニングリコシラーゼ (AAG))は、イノシンに結合することができるが、脱塩基部位を作ることもイノシンを除去することもできず、それによって、新たに形成されるイノシン部分をDNA損傷/修復機構から立体的にブロックする。いくつかの実施形態において、触媒的に不活性なイノシン特異的ヌクレアーゼは、核酸中のイノシンに結合することができるが、核酸を切断しない。代表的な、触媒的に不活性なイノシン特異的ヌクレアーゼの非限定的例としては、(例えばヒト由来の)触媒的に不活性なアルキルアデノシングリコシラーゼ(AAGヌクレアーゼ)、および(例えばE.coli由来の)触媒的に不活性なエンドヌクレアーゼV (EndoVヌクレアーゼ)が挙げられる。いくつかの実施形態において、触媒的に不活性なAAGヌクレアーゼは、E125Q突然変異または別のAAGヌクレアーゼにおける対応する突然変異を含む。
「増加」とは、少なくとも10%、25%、50%、75%、または100%の正の変化を意味する。
「インテイン(intein)」は、それ自身を切り出してそして残った断片(エクステイン(extein))をタンパク質スプライシングとして知られるプロセスにおいてペプチド結合で連結することができるタンパク質の断片である。インテインは「タンパク質イントロン」とも呼ばれる。インテインがそれ自身を切り出し、タンパク質の残りの部分を連結するプロセスは、本明細書において、「タンパク質スプライシング」または「インテイン媒介タンパク質スプライシング」と呼ばれる。ある態様において、前駆体タンパク質(インテイン媒介タンパク質スプライシングの前のインテイン含有タンパク質)のインテインは、2つの遺伝子に由来する。そのようなインテインは、本明細書では分割(split)インテインと呼ばれる(例えば、分割インテイン-Nおよび分割インテイン-C)。例えば、シアノバクテリアでは、DNAポリメラーゼIIIの触媒サブユニットaであるDnaEは2つの別々の遺伝子dnaE-nおよびdnaE-cによってコードされている。dnaE-n遺伝子によってコードされるインテインは本明細書において「インテインN」と称され得る。dnaE-c遺伝子によってコードされるインテインは本明細書において「インテインC」と称され得る。
他のインテイン系も使用され得る。例として、dnaEインテイン、すなわちCfa-N(例えば分割インテイン-N)およびCfa-C(例えば分割インテイン-C)のインテイン対に基づく合成インテインが記述されている(例えば、参照により本明細書に組み入れられるStevens et al., J Am Chem Soc. 2016 Feb. 24; 138(7):2162-5)。本開示に従って使用することができるインテイン対の非限定的な例としては、Cfa DnaEインテイン、Ssp GyrBインテイン、Ssp DnaXインテイン、Ter DnaE3インテイン、Ter ThyXインテイン、Rma DnaBインテイン、およびCne Prp8インテイン(例えば、参照により本明細書に組み込まれる米国特許第8,394,604号に記載のようなもの)が挙げられる。
インテインの例示的なヌクレオチドおよびアミノ酸配列を提供する。
DnaE インテイン-N DNA:
TGCCTGTCATACGAAACCGAGATACTGACAGTAGAATATGGCCTTCTGCCAATCGGGAAGATTGTGGAGAAACGGATAGAATGCACAGTTTACTCTGTCGATAACAATGGTAACATTTATACTCAGCCAGTTGCCCAGTGGCACGACCGGGGAGAGCAGGAAGTATTCGAATACTGTCTGGAGGATGGAAGTCTCATTAGGGCCACTAAGGACCACAAATTTATGACAGTCGATGGCCAGATGCTGCCTATAGACGAAATCTTTGAGCGAGAGTTGGACCTCATGCGAGTTGACAACCTTCCTAAT
DnaE インテイン-N タンパク質:
CLSYETEILTVEYGLLPIGKIVEKRIECTVYSVDNNGNIYTQPVAQWHDR GEQEVFEYCLEDGSLIRATKDHKFMTVDGQMLPIDEIFERELDLMRVDNLPN
DnaE インテイン-C DNA:
ATGATCAAGATAGCTACAAGGAAGTATCTTGGCAAACAAAACGTTTATGA TATTGGAGTCGAAAGAGATCACAACTTTGCTCTGAAGAACGGATTCATAGCTTCTAAT
インテイン-C:
MIKIATRKYLGKQNVYDIGVERDHNFALKNGFIASN
Cfa-N DNA:
TGCCTGTCTTATGATACCGAGATACTTACCGTTGAATATGGCTTCTTGCCTATTGGAAAGATTGTCGAAGAGAGAATTGAATGCACAGTATATACTGTAGACAAGAATGGTTTCGTTTACACACAGCCCATTGCTCAATGGCACAATCGCGGCGAACAAGAAGTATTTGAGTACTGTCTCGAGGATGGAAGCATCATACGAGCAACTAAAGATCATAAATTCATGACCACTGACGGGCAGATGTTGCCAATAGATGAGATATTCGAGCGGGGCTTGGATCTCAAACAAGTGGATGGATTGCCA
Cfa-N タンパク質:
CLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGLDLKQVDGLP
Cfa-C DNA:
ATGAAGAGGACTGCCGATGGATCAGAGTTTGAATCTCCCAAGAAGAAGAGGAAAGTAAAGATAATATCTCGAAAAAGTCTTGGTACCCAAAATGTCTATGATATTGGAGTGGAGAAAGATCACAACTTCCTTCTCAAGAACGGTCTCGTAGCCAGCAAC
Cfa-C タンパク質:
MKRTADGSEFESPKKKRKVKIISRKSLGTQNVYDIGVEKDHNFLLKNGLVASN
分割Cas9のN末端部と分割Cas9のC末端部とを接合するために、インテインNおよびインテインCをそれぞれ分割Cas9のN末端部および分割Cas9のC末端部に融合させ得る。例えば、いくつかの実施形態において、インテイン-Nが、分割されたCas9のN-末端部分のC-末端に融合され、すなわち、N--[分割Cas9のN末端部分]-[インテイン-N]--Cの構造を形成する。いくつかの実施形態において、インテイン-Cが、分割されたCas9のC-末端部分のN-末端に融合され、すなわち、N-[インテイン-C]--[分割Cas9のC末端部分]-Cの構造を形成する。インテインが融合されたところのタンパク質(例えば分割Cas9)を連結するためのインテイン媒介性タンパク質スプライシングの機構は、例えば、参照により本明細書に組み入れられるShah et al., Chem Sci. 2014; 5(1):446-461に記載されているように、当該技術分野において公知である。インテインを設計および使用する方法は当該技術分野で公知であり、例えばWO2014004336、WO2017132580、US20150344549およびUS20180127780によって記載されており、これらの各々はその全体が参照により本明細書に組み込まれる。
用語「単離された」、「精製された」、または「生物学的に純粋な」とは、その天然状態で見出される場合に通常それに付随する成分が、様々な程度まで除去されている物質を指す。「単離」は、元の入手源または周囲環境からの分離の程度を示す。「精製」は、単離よりも高い分離度を示す。「精製された」または「生物学的に純粋な」タンパク質は、不純物がタンパク質の生物学的特性に実質的に影響を与えたり他の有害な結果を引き起こさないように、他の物質が十分に除去されている。すなわち、本発明の核酸またはペプチドは、組換えDNA技術によって産生された場合には細胞物質、ウイルス物質または培地を実質的に含まない場合、あるいは化学的に合成された場合には化学的前駆体その他の化学物質を実質的に含まない場合には、精製されている。純度および均一性は、典型的には、分析化学技術、例えば、ポリアクリルアミドゲル電気泳動または高速液体クロマトグラフィーを用いて決定される。用語「精製された」は、核酸またはタンパク質が電気泳動ゲルにおいて本質的に1つのバンドを生じることを意味し得る。修飾、例えば、リン酸化またはグリコシル化を受けることができるタンパク質については、異なる修飾は、別々に精製することができる異なる単離されたタンパク質を生じ得る。
「単離ポリヌクレオチド」とは、本発明の核酸分子が由来する生物の天然ゲノムにおいて当該遺伝子に隣接する遺伝子を含まない核酸(例えばDNA)を意味する。したがって、この用語は、例えば、ベクターに組み込まれた;自律的に複製するプラスミドやウイルスに組み込まれた;原核生物や真核生物のゲノムDNAに組み込まれた;または他の配列とは独立した別の分子(例えば、PCRまたは制限エンドヌクレアーゼ消化によって生成されたcDNAまたはゲノムもしくはcDNA断片)として存在する組換えDNAを含む。さらに、この用語は、DNA分子から転写されるRNA分子、ならびに、さらなるポリペプチド配列をコードするハイブリッド遺伝子の一部である組換えDNAを含む。
「単離ポリペプチド」とは、天然状態で付随する成分から分離された本発明のポリペプチドを意味する。典型的には、ポリペプチドは、それが天然状態で会合しているタンパク質および天然有機分子から重量で少なくとも60%フリーである場合に、単離されている。好ましくは、調製物は、重量で少なくとも75%、より好ましくは少なくとも90%、およびさらに好ましくは少なくとも99%が本発明のポリペプチドである。本発明の単離されたポリペプチドは、例えば、天然源からの抽出、そのようなポリペプチドをコードする組換え核酸の発現;または化学的にタンパク質を合成することにより得ることができる。純度は、任意の適切な方法、例えば、カラムクロマトグラフィー、ポリアクリルアミドゲル電気泳動、またはHPLC分析によって測定することができる。
本明細書において使用される用語「リンカー」は、2つの分子もしくは部分(例えばタンパク質複合体もしくはリボ核複合体の2つの成分、または融合タンパク質の2つのドメイン、例えば、ポリヌクレオチドプログラミング可能DNA結合ドメイン(例dCas9)とデアミナーゼドメイン(例えばアデノシンデアミナーゼ))を連結する共有結合リンカー(例えば共有結合)、非共有結合リンカー、化学基、または分子を指すことができる。リンカーは、塩基エディターシステムの異なるコンポーネントまたはコンポーネントの異なる部分を繋げることができる。例えば、いくつかの実施形態において、リンカーは、ポリヌクレオチドプログラミング可能ヌクレオチド結合ドメインのガイドポリヌクレオチド結合ドメインおよびデアミナーゼの触媒ドメインを繋げることができる。ある態様において、リンカーは、CRISPRポリペプチドおよびデアミナーゼを結合することができる。ある態様において、リンカーは、Cas9およびデアミナーゼを繋げることができる。ある態様において、リンカーは、dCas9およびデアミナーゼを繋げることができる。ある態様において、リンカーは、nCas9およびデアミナーゼを繋げることができる。ある態様において、リンカーは、ガイドポリヌクレオチドおよびデアミナーゼを繋げることができる。いくつかの実施形態において、リンカーは、塩基エディター系の脱アミノ化成分およびポリヌクレオチドプログラミング可能なヌクレオチド結合成分を繋げることができる。いくつかの実施形態において、リンカーは、塩基エディターシステムの脱アミノ化成分のRNA結合部分と、ポリヌクレオチドプログラミング可能なヌクレオチド結合成分とを繋げることができる。いくつかの実施形態において、リンカーは、塩基エディター系の脱アミノ化成分のRNA結合部分と、ポリヌクレオチドプログラミング可能なヌクレオチド結合成分のRNA結合部分とを結合することができる。リンカーは、2つの基、分子、または他の部分の間に配置され、またはそれらによって挟まれ、共有結合または非共有結合相互作用を介してそれぞれに連結され、かくして2つを連結することができる。ある態様において、リンカーは、有機分子、基、ポリマー、または化学的部分であり得る。ある態様において、リンカーはポリヌクレオチドであり得る。ある態様において、リンカーはDNAリンカーであり得る。ある態様において、リンカーはRNAリンカーであり得る。ある態様において、リンカーは、リガンドに結合することができるアプタマーを含むことができる。ある態様において、リガンドは、炭水化物、ペプチド、タンパク質、または核酸であり得る。いくつかの実施形態において、リンカーは、リボスイッチに由来するアプタマーを含むことができる。アプタマーが由来するリボスイッチは、テオフィリンリボスイッチ、チアミンピロリン酸 (TPP) リボスイッチ、アデノシンコバラミン (AdoCbl) リボスイッチ、S-アデノシルメチオニン(SAM) リボスイッチ、SAHリボスイッチ、フラビンモノヌクレオチド (FMN) リボスイッチ、テトラヒドロ葉酸リボスイッチ、リジンリボスイッチ、グリシンリボスイッチ、プリンリボスイッチ、GlmSリボスイッチ、またはプレクエオシン1 (PreQ1) リボスイッチから選択され得る。ある態様において、リンカーは、ポリペプチドまたはポリペプチドリガンドなどのタンパク質ドメインに結合したアプタマーを含み得る。ある態様において、ポリペプチドリガンドは、K相同 (KH) ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、無菌のαモチーフ、テロメラーゼKu結合モチーフおよびKuタンパク質、テロメラーゼSm7結合モチーフおよびSm7タンパク質、またはRNA認識モチーフであり得る。ある態様において、ポリペプチドリガンドは、塩基エディター系成分の一部であり得る。例えば、核酸塩基編集成分は、デアミナーゼドメインおよびRNA認識モチーフを含み得る。
ある態様において、リンカーは、アミノ酸または複数のアミノ酸(例えばペプチドまたはタンパク質)であり得る。ある態様において、リンカーは、長さが約5~100アミノ酸、例えば、長さが約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、20-30、30~40、40~50、50~60、60~70、70~80、80~90または90~100アミノ酸であり得る。ある態様において、リンカーは、長さが約100~150、150~200、200~250、250~300、300~350、350~400、400~450、または450~500アミノ酸であり得る。より長いまたはより短いリンカーも考えられる。
ある態様において、リンカーは、Cas9ヌクレアーゼドメインを含むRNAプログラム可能ヌクレアーゼのgRNA結合ドメインと、核酸編集タンパク質(例えば、アデノシンデアミナーゼ)の触媒ドメインとを繋げる。ある態様において、リンカーは、dCas9および核酸編集タンパク質を繋げる。例えば、リンカーは、2つの基、分子、または他の部分の間に配置されるか、または2つの基、分子、または他の部分によって隣接され、共有結合を介してそれぞれに連結され、したがって2つを連結する。ある態様において、リンカーは、アミノ酸または複数のアミノ酸(例えば、ペプチドまたはタンパク質)である。ある態様において、リンカーは、有機分子、基、ポリマー、または化学的部分である。ある態様において、リンカーは、長さが5~200アミノ酸、例えば、長さが5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、35、45、50、55、60、60、65、70、70、75、80、85、90、90、95、100、101、102、103、104、105、110、120、130、140、150、160、175、180、190、または200アミノ酸である。より長いまたは短いリンカーも企図される。
一部の実施形態では、核酸塩基エディターのドメインは、SGGSSGSETPGTSESATPESSGGS, SGGSSGGSSGSETPGTSESATPESSGGSSGGS, またはGGSGGSPGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTE PSEGSAPGTSTEPSEGSAPGTSESATPESGPGSEPATSGGSGGSのアミノ酸配列を含むリンカーを介して融合されている。一部の実施形態では、核酸塩基エディターのドメインは、XTENリンカーとしても言及し得る、アミノ酸配列SGSETPGTSESATPESを含むリンカーを介して融合されている。一部の実施形態では、リンカーはアミノ酸配列SGGSを含む。一部の実施形態では、リンカーは、(SGGS)n、(GGGS)n、(GGGGS)n、(G)n、(EAAAK)n、(GGS)n、SGSETPGTSESATPES、もしくは(XP)nモチーフ、またはこれらのいずれかの組合せを含み、式中、nは独立して1~30の整数であり、Xは任意のアミノ酸である。一部の実施形態では、nは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、または15である。
ある態様において、リンカーは、長さが24アミノ酸である。ある態様において、リンカーは、アミノ酸配列SGGSSGGSSGSETPGTSESATPESを含む。ある態様において、リンカーは、40アミノ酸長である。ある態様において、リンカーは、アミノ酸配列SGGSSGGSSGSETPGTESATPESSGGSSGGSSGSSGGSを含む。ある態様において、リンカーは、64アミノ酸長である。ある態様において、リンカーは、アミノ酸配列SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGGSSGGSSGSETPGTSESATPESSGGSSGGSを含む。ある態様において、リンカーは、長さが92アミノ酸である。いくつかの実施形態では、リンカーは、アミノ酸配列PGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGSEPATSを含む。
「マーカー」とは、疾患または障害に関連する発現レベルまたは活性の変化を有する任意のタンパク質またはポリヌクレオチドを意味する。
本明細書中で使用される場合、用語「変異」とは、配列内、例えば核酸もしくはアミノ酸配列内の残基が、別の残基により置換されること、または配列内の1以上の残基の欠失もしくは挿入をいう。変異は、本明細書中において典型的には、元の残基を同定し、次いで配列内の残基の位置を同定し、そして新たに置換された残基を同定することによって、記載される。本明細書中に提供されるアミノ酸置換 (変異) を作製するための種々の方法は、当該技術分野においてよく知られており、例えば、Green and Sambrook, Molecular Cloning: A Laboratory Manual (4th ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (2012))によって提供されている。いくつかの態様において、本開示の塩基エディターは、有意な数の非意図的な変異、例えば非意図的な点突然変異を生成することなく、核酸(例えば対象のゲノム内の核酸)において「意図された変異」例えば点突然変異を効率的に生成することができる。いくつかの実施形態において、意図された変異は、その意図された変異を生じさせるように特に設計された、ガイドポリヌクレオチド(例えばgRNA)に結合した特定の塩基エディター(例えばアデノシン塩基エディター)によって生じる変異である。
一般に、配列(例えば、本明細書に記載のアミノ酸配列)においてなされるかまたは同定される変異は、参照(または野生型)配列、すなわち、その変異を含まない配列に関連して番号付けされる。当業者は、参照配列に対するアミノ酸および核酸配列における突然変異の位置を決定する方法を容易に理解するであろう。
「非保存的変異」という用語は、異なるグループの間のアミノ酸置換に関し、例えば、トリプトファンからリジン、またはセリンからフェニルアラニンなどである。この場合、非保存的アミノ酸置換は、機能性バリアントの生物学的活性を妨害または阻害しないことが好ましい。非保存的アミノ酸置換は、機能的バリアントの生物学的活性が野生型タンパク質と比較して増加するように、機能的バリアントの生物学的活性を増強することができる。
「核局在化配列」、「核局在化シグナル」または「NLS」という用語は、タンパク質の細胞核への移入を促進するアミノ酸配列を意味する。核局在化配列は当該技術分野において公知であり、例えば、2000年11月23日に出願され2001年5月31日にWO/2001/038547として公開された国際PCT出願PCT/EP 2000/011690のPlank et al.に記載されており、その内容は、例示的な核局在化配列の開示について参照により本明細書に組み入れられる。他の実施形態では、NLSは、例えばKoblan et al., Nature Biotech. 2018 doi:10.1038/nbt.4172によって記載された、最適化されたNLSである。一部の実施形態では、NLSは、KRTADGSEFESPKKKRKV, KRPAATKKAGQAKKKK, KKTELQTTNAENKTKKL, KRGINDRNFWRGENGRKTR, RKSGKIAAIVVKRPRK, PKKKRKV, またはMDSLLMNRRKFLYQFKNVRWAKGRRETYLCから選択されるアミノ酸配列を含む。
本明細書中で使用される場合、用語「核酸」および「核酸分子」とは、核酸塩基および酸性部分を含む化合物、例えばヌクレオシド、ヌクレオチド、またはヌクレオチドのポリマーをいう。典型的には、ポリマー核酸、例えば3つ以上のヌクレオチドを含む核酸分子は、隣接するヌクレオチドがホスホジエステル結合を介して互いに連結されている直鎖分子である。ある態様において、「核酸」は、個々の核酸残基(例えばヌクレオチドおよび/またはヌクレオシド)を指す。ある態様において、「核酸」は、3つ以上の個々のヌクレオチド残基を含むオリゴヌクレオチド鎖をいう。本明細書中で使用される、用語「オリゴヌクレオチド」および「ポリヌクレオチド」は、ヌクレオチドのポリマー(例えば少なくとも3つのヌクレオチドの鎖)を指すために交換可能に使用され得る。ある態様において、「核酸」は、RNAならびに一本鎖および/または二本鎖DNAを包含する。核酸は、例えば、ゲノム、転写物、mRNA、tRNA、rRNA、siRNA、snRNA、プラスミド、コスミド、染色体、染色分体、または他の天然に存在する核酸分子との関連において、天然に存在し得る。他方、核酸分子は、例えば非天然に存在する分子、組換えDNAもしくはRNA、人工染色体、操作されたゲノム、もしくはその断片、または合成DNA、RNA、DNA/RNAハイブリッド、または非天然に存在するヌクレオチドもしくはヌクレオシドを含む、非天然に存在する分子であり得る。さらに、用語「核酸」、「DNA」、「RNA」、および/または類似の用語は、核酸アナログ、例えばホスホジエステル骨格以外を有するアナログを含む。核酸は、天然源から精製される、組換え発現系を用いて産生され必要に応じて精製される、化学的に合成される、等が可能である。化学的に合成された分子の場合、核酸は、適切な場合には、例えば、化学的に修飾された塩基または糖、および骨格修飾を有するアナログなどのヌクレオシドアナログを含み得る。核酸配列は、特に示されない限り、5’~3’方向に示される。ある態様において、核酸は、天然ヌクレオシド(例えばアデノシン、チミジン、グアノシン、シチジン、ウリジン、デオキシアデノシン、デオキシチミジン、デオキシグアノシン、およびデオキシシチジン);ヌクレオシド類似体(例えば2-アミノアデノシン、2-チオチミジン、イノシン、ピロロ-ピリミジン、3-メチルアデノシン、5-メチルシチジン、2-アミノアデノシン、C5-ブロモウリジン、C5-フルオロウリジン、C5-ヨードウリジン、C5-プロピニル-ウリジン、C5-プロピニル-シチジン、C5-メチルシチジン、2-アミノアデノシン、7-デアザアデノシン、7-デアザグアノシン、8-オキソアデノシン、8-オキソグアニン、O(6)-メチルグアニン、および2-チオシチジン);化学修飾塩基;生物学的に修飾された塩基(例えばメチル化塩基);挿入塩基;修飾糖(2’-例えば、フルオロリボース、リボース、2’-デオキシリボース、アラビノース、およびヘキソース);および/または修飾リン酸基(例えばホスホロチオエートおよび5’-N-ホスホロアミダイト結合)であるか、またはそれらを含む。
「核酸プログラミング可能DNA結合タンパク質」あるいは「napDNAbp」という用語は、「ポリヌクレオチドプログラミング可能ヌクレオチド結合ドメイン」と互換的に使用され得、特異的な核酸配列にnapDNAbpをガイドするガイド核酸またはガイドポリヌクレオチド(例えばgRNA)のような核酸(例えばDNAまたはRNA)と会合するタンパク質を指す。ある態様において、ポリヌクレオチドによりプログラミング可能なヌクレオチド結合ドメインは、ポリヌクレオチドによりプログラミング可能なDNA結合ドメインである。ある態様において、ポリヌクレオチドによりプログラミング可能なヌクレオチド結合ドメインは、ポリヌクレオチドによりプログラミング可能なRNA結合ドメインである。ある態様において、ポリヌクレオチドによりプログラミング可能なヌクレオチド結合ドメインは、Cas9タンパク質である。Cas9タンパク質は、ガイドRNAに相補的な特異的DNA配列にCas9タンパク質を誘導するガイドRNAと結合することができる。ある態様において、napDNAbpは、Cas9ドメイン、例えばヌクレアーゼ活性Cas9、Cas9ニッカーゼ (nCas9) 、またはヌクレアーゼ不活性Cas9 (dCas9) である。核酸プログラミング可能DNA結合タンパク質の非限定的な例としては、Cas9(例えばdCas9およびnCas9)、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、およびCas12iが挙げられる。Cas酵素の非限定的な例としては、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5d、Cas5t、Cas5h、Cas5a、Cas6、Cas7、Cas8、Cas8a、Cas8b、Cas8c、Cas9(Csn1またはCsx12とも呼ばれる)、Cas10、Cas10d、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i、Csy1、Csy2、Csy3、Csy4、Cse1、Cse2、Cse3、Cse4、Cse5e、Csc1、Csc2、Csa5、Csn1、Csn2、Csm1、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx1S、Csx11、Csf1、Csf2、CsO、Csf4、Csd1、Csd2、Cst1、Cst2、Csh1、Csh2、Csa1、Csa2、Csa3、Csa4、Csa5、タイプII Casエフェクタータンパク質、タイプV Casエフェクタータンパク質、タイプVI Casエフェクタータンパク質、CARF、DinG、それらのホモログ、またはそれらの改変または操作されたバージョンが挙げられる。他の核酸プログラミング可能なDNA結合タンパク質も、本開示に具体的に列記されていないかもしれないが、本開示の範囲内である。例えばMakarova et al. “Classification and Nomenclature of CRISPR-Cas Systems: Where from Here?”CRISPR J. 2018 Oct;1:325-336. doi: 10.1089/crispr.2018.0033; Yan et al., “Functionally diverse type V CRISPR-Cas systems” Science. 2019 Jan 4;363(6422):88-91. doi: 10.1126/science.aav7271を参照(それぞれの全内容が参照により本明細書に組み込まれる)。
用語「核酸塩基」、「窒素塩基」、または「塩基」とは、本明細書中で互換性があるように使用され、ヌクレオシドを形成する窒素含有生体化合物を指し、ヌクレオシドはヌクレオチドの構成成分である。塩基対を形成し、互いに積み重なる核酸塩基の能力は、リボ核酸(RNA)およびデオキシリボ核酸(DNA)などの長鎖らせん構造を直接もたらす。アデニン(A)、シトシン(C)、グアニン(G)、チミン(T)、およびウラシル(U)の5つの核酸塩基は、一次塩基または標準塩基と呼ばれる。アデニンおよびグアニンはプリンに由来し、シトシン、ウラシル、およびチミンはピリミジンに由来する。DNAおよびRNAは、修飾された他の(非一次)塩基も含有することができる。非限定的な例示的な修飾核酸塩基としては、ヒポキサンチン、キサンチン、7-メチルグアニン、5,6-ジヒドロウラシル、5-メチルシトシン(m5C)、および5-ヒドロメチルシトシンを挙げることができる。ヒポキサンチンおよびキサンチンは突然変異原の存在によって生成されることができ、どちらも脱アミノ化(アミン基をカルボニル基で置き換えること)によって生成される。ヒポキサンチンはアデニンから修飾させることができる。キサンチンはグアニンから修飾させることができる。ウラシルはシトシンの脱アミノ化から生じさせることができる。「ヌクレオシド」は、1つの核酸塩基および1つの五炭糖(リボースまたはデオキシリボースのどちらか)からなる。ヌクレオシドの例としては、アデノシン、グアノシン、ウリジン、シチジン、5-メチルウリジン(m5U)、デオキシアデノシン、デオキシグアノシン、チミジン、デオキシウリジン、およびデオキシシチジンが挙げられる。修飾核酸塩基を有するヌクレオシドの例としては、イノシン(I)、キサントシン(X)、7-メチルグアノシン(m7G)、ジヒドロウリジン(D)、5-メチルシチジン(m5C)、およびプソイドウリジン(Ψ)が挙げられる。「ヌクレオチド」は、1つの核酸塩基、1つの五炭糖(リボースまたはデオキシリボースのどちらか)、および少なくとも1つのリン酸基からなる。
「核酸塩基編集ドメイン」または「核酸塩基編集タンパク質」という用語は、本明細書において使用される場合、シトシン(もしくはシチジン)からウラシル(もしくはウリジン)またはチミン(もしくはチミジン)への、およびアデニン(もしくはアデノシン)からヒポキサンチン(もしくはイノシン)への脱アミノ化、ならびに非鋳型ヌクレオチド付加および挿入のような、RNAまたはDNAにおける核酸塩基修飾を触媒することができるタンパク質または酵素を指す。ある態様において、核酸塩基編集ドメインは、デアミナーゼドメイン(例えば、アデニンデアミナーゼもしくはアデノシンデアミナーゼ)である。ある態様において、核酸塩基編集ドメインは、天然に存在する核酸塩基編集ドメインであり得る。いくつかの実施形態において、核酸塩基編集ドメインは、天然に存在する核酸塩基編集ドメインから操作または進化された核酸塩基編集ドメインであり得る。核酸塩基編集ドメインは、細菌、ヒト、チンパンジー、ゴリラ、サル、ウシ、イヌ、ラット、またはマウスなどの任意の生物由来であり得る。
本明細書で使用される場合、「薬剤を取得する」におけるような「取得する」は、その薬剤を合成すること、購入すること、または他の方法で獲得することを含む。
本明細書で使用される「患者」または「対象」は、疾患または障害と診断されている、それらを生じるリスクがある、またはそれらを有するかもしくは生ずる疑いがある哺乳動物対象または個体を指す。ある態様において、用語「患者」は、疾患または障害を生ずる可能性が平均より高い哺乳動物対象を指す。例示的な患者は、ヒト、ヒト以外の霊長類、ネコ、イヌ、ブタ、ウシ、ネコ、ウマ、ラクダ、ラマ、ヤギ、ヒツジ、齧歯類(例えば、マウス、ウサギ、ラット、モルモット)および本明細書に開示される治療から利益を得ることができる他の哺乳動物であり得る。例示的なヒト患者は、男性および/または女性であり得る。
「それを必要とする患者」または「それを必要とする対象」とは、本明細書では、疾患または障害、例えば、それだけには限定されないが糖原病1型(GSD1またはVon Gierke病)を診断された、または有することが疑われる患者として言及される。
「病原性変異」、「病原性バリアント」、「疾患原因変異」、「疾患原因バリアント」、「有害変異」または「素因となる変異」という用語は、特定の疾患または障害に対する個体の感受性または素因を増大させる遺伝子変化または突然変異を指す。ある態様において、病原性変異は、遺伝子によってコードされるタンパク質中の少なくとも1つの野生型アミノ酸が少なくとも1つの病原性アミノ酸によって置換されたものを含む。
用語「タンパク質」、「ペプチド」、「ポリペプチド」、およびそれらの文法的等価物は、本明細書において交換可能に使用され、ペプチド (アミド) 結合によって互いに連結されたアミノ酸残基のポリマーを指す。この用語は、任意のサイズ、構造または機能のタンパク質、ペプチドまたはポリペプチドを指す。典型的には、タンパク質、ペプチド、またはポリペプチドは、少なくとも3アミノ酸長である。タンパク質、ペプチド、またはポリペプチドは、個々のタンパク質または一群のタンパク質を指すことができる。タンパク質、ペプチド、またはポリペプチド中の1以上のアミノ酸は、例えば炭水化物基、ヒドロキシル基、リン酸基、ファルネシル基、イソファルネシル基、脂肪酸基、結合のためのリンカー、官能化、または他の修飾などの化学的実体の添加によって、修飾され得る。タンパク質、ペプチド、またはポリペプチドはまた、単一分子であってもよく、または多分子複合体であってもよい。タンパク質、ペプチド、またはポリペプチドは、天然に存在するタンパク質またはペプチドの単なる断片であり得る。タンパク質、ペプチド、またはポリペプチドは、天然に存在するもの、組換え体、もしくは合成のもの、またはそれらの任意の組合せであり得る。本明細書中で使用される場合、用語「融合タンパク質」とは、少なくとも2つの異なるタンパク質由来のタンパク質ドメインを含むハイブリッドポリペプチドをいう。1つのタンパク質は、融合タンパク質のアミノ末端 (N末端) 部分またはカルボキシ末端(C末端) タンパク質に位置することができ、かくして、それぞれ、アミノ末端融合タンパク質またはカルボキシ末端融合タンパク質を形成する。タンパク質は、異なるドメイン、例えば、核酸結合ドメイン(例えば、標的部位へのタンパク質の結合を誘導するCas9のgRNA結合ドメイン)および核酸切断ドメイン、あるいは核酸編集タンパク質の触媒ドメインを含み得る。ある態様において、タンパク質は、タンパク質性部分、例えば、核酸結合ドメインを構成するアミノ酸配列、および有機化合物、例えば、核酸切断剤として作用し得る化合物を含む。ある態様において、タンパク質は、核酸 (例えば、RNAまたはDNA) と複合体化されているか、または核酸と会合している。本明細書で提供される任意のタンパク質は、当技術分野で公知の任意の方法によって生産することができる。例えば、本明細書で提供されるタンパク質は、組換えタンパク質発現および精製を介して生産することができ、これは、ペプチドリンカーを含む融合タンパク質に特に適している。組換えタンパク質の発現および精製のための方法はよく知られており、Green and Sambrook, Molecular Cloning: A Laboratory Manual (4th ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (2012))によって記載されているものを含み、その全内容は参照により本明細書に組み入れられる。
本明細書に開示されるポリペプチドおよびタンパク質(機能的部分およびその機能的バリアントを含む)は、一つ以上の天然に存在するアミノ酸の代わりに合成アミノ酸を含むことができる。そのような合成アミノ酸は当該分野で公知であり、例えば、アミノシクロヘキサンカルボン酸、ノルロイシン、α-アミノn-デカン酸、ホモセリン、S-アセチルアミノメチル-システイン、trans-3-およびtrans-4-ヒドロキシプロリン、4-アミノフェニルアラニン、4-ニトロフェニルアラニン、4-クロロフェニルアラニン、4-カルボキシフェニルアラニン、β-フェニルセリンβ-ヒドロキシフェニルアラニン、フェニルグリシン、α-ナフチルアラニン、シクロヘキシルアラニン、シクロヘキシルグリシン、インドリン-2-カルボン酸、1,2,3,4-テトラヒドロイソキノリン-3-カルボン酸、アミノマロン酸、アミノマロン酸モノアミド、N'-ベンジル-N'-メチルリジン、N',N'-ジベンジル-リジン、6-ヒドロキシリジン、オルニチン、α-アミノシクロペンタンカルボン酸、アミノシクロヘキサンカルボン酸、アミノシクロヘキサンカルボン酸、α-アミノシクロヘプタンカルボン酸、α-(2-アミノ-2-ノルボルナン)-カルボン酸、α,γ-ジアミノ酪酸、α,β-ジアミノプロピオン酸、ホモフェニルアラニン、およびα-tert-ブチルグリシンが挙げられる。ポリペプチドおよびタンパク質は、ポリペプチド構築物の1つ以上のアミノ酸の翻訳後修飾と結合することができる。翻訳後修飾の非限定的な例としては、リン酸化、アセチル化およびホルミル化を含むアシル化、グリコシル化(N-リンクおよびO-リンクを含む)、アミド化、ヒドロキシル化、メチル化およびエチル化を含むアルキル化、ユビキチン化、ピロリドンカルボン酸の添加、ジスルフィド架橋の形成、硫酸化、ミリストイル化、パルミトイル化、イソプレニル化、ファルネシル化、ゲラニル化、グリピエーション、リポイル化およびヨード化が挙げられる。
タンパク質または核酸に関連して本明細書中で使用される用語「組換え体」とは、自然界には存在しないが、人間の工学の産物であるタンパク質または核酸を指す。例えば、いくつかの実施形態において、組換えタンパク質または核酸分子は、任意の天然に存在する配列と比較して、少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、少なくとも5つ、少なくとも6つ、または少なくとも7つの変異を含むアミノ酸またはヌクレオチド配列を含む。
「減少する」とは、少なくとも10%、25%、50%、75%、または100%の負の変化を意味する。
「参照(reference)」は、基準または対照の条件を意味する。1つの実施形態において、参照は野生型または健常な細胞である。他の実施形態において、限定されないが、参照は、試験条件に晒されていないか、またはプラセボもしくは通常の食塩水、培地、緩衝液、および/または、目的のポリヌクレオチドを保持しない対照ベクターに晒される、非処理細胞である。
「参照配列」は、配列比較の基礎として使用される定義済み配列である。参照配列は、特定の配列のサブセットまたは全体であり得る;例えば、完全長のcDNAもしくは遺伝子配列のセグメント、または完全なcDNAまたは遺伝子配列。ポリペプチドについては、参照ポリペプチド配列の長さは、一般に、少なくとも約16アミノ酸、少なくとも約20アミノ酸、少なくとも約25アミノ酸、約35アミノ酸、約50アミノ酸、または約100アミノ酸である。核酸については、参照核酸配列の長さは、一般に、少なくとも約50ヌクレオチド、少なくとも約60ヌクレオチド、少なくとも約75ヌクレオチド、約100ヌクレオチドまたは約300ヌクレオチドまたはそれらの周辺もしくはそれらの間の任意の整数である。いくつかの実施形態において、参照配列は、目的タンパク質の野生型配列である。他の実施形態では、参照配列は、野生型タンパク質をコードするポリヌクレオチド配列である。
用語「RNAプログラム可能なヌクレアーゼ」および「RNA誘導ヌクレアーゼ」は、切断の標的ではない一つ以上のRNAをとともに使用される(例えば、それに結合または付随する)。ある態様において、RNAプログラム可能ヌクレアーゼは、RNAと複合体である場合、ヌクレアーゼ:RNA複合体と称され得る。典型的には、結合したRNAはガイドRNA (gRNA) と呼ばれる。gRNAは、2つ以上のRNAの複合体として、または単一のRNA分子として存在することができる。単一RNA分子として存在するgRNAは、単一ガイドRNA(sgRNA)として言及し得るが、「gRNA」は、単一分子として、または2つ以上の分子の複合体としてのどちらかで存在するガイドRNAを指すために、互換性があるように使用される。典型的には、単一RNA種として存在するgRNAは、2つのドメイン、すなわち、(1)標的核酸と相同性を共有する(例えば、かつCas9複合体と標的との結合を指示する)ドメイン、ならびに(2)Cas9タンパク質と結合するドメインを含む。一部の実施形態では、ドメイン(2)は、tracrRNAとして知られる配列に対応しており、ステム-ループ構造を含む。例えば、一部の実施形態では、ドメイン(2)は、その全内容が参照により本明細書に組み込まれるJinek et ah, Science 337:816-821(2012)中に提供されるように、tracrRNAと同一または相同的である。gRNAの他の例(例えばドメイン2を含むもの)は、2013年9月6日に出願された米国仮特許出願U.S.S.N.61/874,682号、題名「Switchable Cas9 Nucleases and Uses Thereof」および2013年9月6日に出願された米国仮特許出願U.S.S.N.61/874,746号、題名「Delivery System For Functional Nucleases」中に見つけることができ、これらの各々の全内容はその全体で参照により本明細書に組み込まれる。一部の実施形態では、gRNAは、ドメイン(1)および(2)のうちの2つ以上を含み、「伸長されたgRNA」として言及し得る。例えば、伸長されたgRNAは、例えば、本明細書中に記載のように、2つ以上のCas9タンパク質と結合し、2つ以上の明白に異なる領域で標的核酸と結合するであろう。gRNAは標的部位と相補的なヌクレオチド配列を含み、これがヌクレアーゼ/RNA複合体と前記標的部位との結合を媒介し、ヌクレアーゼ:RNA複合体の配列特異性を提供する。
ある態様において、RNAプログラム可能ヌクレアーゼは、(CRISPR関連システム) Cas9エンドヌクレアーゼ、例えば、Streptococcus pyogenes由来のCas9 (Csnl) である(例えば、"Complete genome sequence of an Ml strain of Streptococcus pyogenes." Ferretti J.J., McShan W.M., Ajdic D.J., Savic D.J., Savic G., Lyon K., Primeaux C, Sezate S., Suvorov A.N., Kenton S., Lai H.S., Lin S.P., Qian Y., Jia H.G., Najar F.Z., Ren Q., Zhu H., Song L., White J., Yuan X., Clifton S.W., Roe B.A., McLaughlin R.E., Proc. Natl. Acad. Sci. U.S.A. 98:4658-4663(2001); "CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III." Deltcheva E., Chylinski K., Sharma CM., Gonzales K., Chao Y., Pirzada Z.A., Eckert M.R., Vogel J., Charpentier E., Nature 471:602-607(2011)参照)。
RNAプログラミング可能なヌクレアーゼ(例えばCas9)はDNA切断部位を標的とするためにRNA:DNAハイブリダイゼーションを使用するため、これらのタンパク質は、原理的に、ガイドRNAによって指定される任意の配列を標的とさせることができる。部位特異的切断(例えばゲノムを改変するため)のためにCas9などのRNAプログラミング可能なヌクレアーゼを使用する方法は、当技術分野で知られている(例えば、Cong, L. et al., Multiplex genome engineering using CRISPR/Cas systems. Science 339, 819-823 (2013)、Mali, P. et ah, RNA-guided human genome engineering via Cas9. Science 339, 823-826 (2013)、Hwang, W.Y. et al., Efficient genome editing in zebrafish using a CRISPR-Cas system. Nature biotechnology 31, 227-229 (2013)、Jinek, M. et ah, RNA-programmed genome editing in human cells. eLife 2, e00471 (2013)、Dicarlo, J.E. et al., Genome engineering in Saccharomyces cerevisiae using CRISPR-Cas systems. Nucleic acids research (2013)、Jiang, W. et ah RNA-guided editing of bacterial genomes using CRISPR-Cas systems. Nature biotechnology 31, 233-239 (2013)を参照、これらの各々の全内容は参照により本明細書に組み込まれる)。
用語「一塩基多型 (SNP)」は、ゲノム中の特定の位置で起こる単一ヌクレオチドの変異であり、ここで、各変異は集団内で認識できるある程度(例>1%)まで存在する。例えば、ヒトゲノムの特定の塩基位置では、ほとんどの個体でCヌクレオチドが出現しうるが、少数の個体ではその位置がAで占められている。これは、この特定の位置にSNPがあり、CまたはAという2つのヌクレオチドのバリエーションがこの位置のアリルであることを意味する。SNPは疾患に対する感受性の差の根底にある。病気の重症度や治療に対する体の反応も、遺伝的バリエーションの表れである。SNPは、遺伝子のコード領域、遺伝子の非コード領域、または遺伝子間領域(遺伝子と遺伝子の間の領域)に存在しうる。ある態様において、コード配列内のSNPは、遺伝子コードの縮重のために、産生されるタンパク質のアミノ酸配列を必ずしも変化させない。コード領域のSNPには、同義SNPと非同義SNPの2種類がある。同義SNPはタンパク質配列に影響しないが、非同義SNPはタンパク質のアミノ酸配列を変化させる。非同義SNPにはミスセンスとナンセンスの2種類がある。タンパク質をコードする領域にないSNPは、遺伝子のスプライシング、転写因子の結合、メッセンジャーRNAの分解、または非コードRNAの配列に影響を与えることがある。この種のSNPによって影響を受ける遺伝子発現はeSNP (発現SNP)と呼ばれ、遺伝子の上流または下流にあり得る。一塩基バリアント (SNV) は、頻度に制限のない一塩基のバリエーションであり、体細胞で生じ得る。体細胞一塩基バリエーションは一塩基改変とも呼ばれ得る。
「特異的に結合する」とは、本発明のポリペプチドおよび/または核酸分子を認識および結合するが、試料(例えば生物学的試料)中の他の分子を実質的に認識および結合しない核酸分子、ポリペプチド、もしくはそれらの複合体(例えば、核酸プログラミング可能DNA結合ドメインおよびガイド核酸)、化合物、または分子を意味する。
本発明の方法において有用な核酸分子は、本発明のポリペプチドまたはその断片をコードする任意の核酸分子を含む。そのような核酸分子は、内因性核酸配列と100%同一である必要はないが、典型的には実質的同一性を示す。内因性配列に対して「実質的同一性」を有するポリヌクレオチドは、典型的には、二本鎖核酸分子の少なくとも一つの鎖とハイブリダイズすることができる。本発明の方法において有用な核酸分子は、本発明のポリペプチドまたはその断片をコードする任意の核酸分子を含む。そのような核酸分子は、内因性核酸配列と100%同一である必要はないが、典型的には実質的同一性を示す。内因性配列に対して「実質的同一性」を有するポリヌクレオチドは、典型的には、二本鎖核酸分子の少なくとも一つの鎖とハイブリダイズすることができる。「ハイブリダイズする」とは、種々のストリンジェンシー条件下で相補的ポリヌクレオチド配列(例えば、本明細書に記載の遺伝子)の間、またはその一部の間に二本鎖分子を形成する対をなすことを意味する。(例えばWahl, G. M. and S. L. Berger (1987) Methods Enzymol. 152:399; Kimmel, A. R. (1987) Methods Enzymol. 152:507参照)。
例えば、ストリンジェントな塩濃度は、通常、約750 mM未満 NaClおよび75 mMクエン酸三ナトリウム、好ましくは約500 mM未満 NaClおよび50 mMクエン酸三ナトリウム、より好ましくは約250 mM未満 NaClおよび25 mMクエン酸三ナトリウムである。低ストリンジェンシーハイブリダイゼーションは、有機溶媒、例えばホルムアミドの非存在下で得ることができ、一方、高ストリンジェンシーハイブリダイゼーションは、少なくとも約35%ホルムアミド、より好ましくは少なくとも約50%ホルムアミドの存在下で得ることができる。ストリンジェントな温度条件は、通常、少なくとも約30℃、より好ましくは少なくとも約37℃、最も好ましくは少なくとも約42℃の温度を含むであろう。ハイブリダイゼーション時間、界面活性剤 (例えば、ドデシル硫酸ナトリウム (SDS))の濃度、および担体DNAの含入または排除などの様々な追加のパラメーターは、当業者によく知られている。必要に応じてこれら様々な条件を組み合わせることによって、様々なレベルのストリンジェンシーが達成される。一実施形態では、ハイブリダイゼーションは、30℃で、750 mM NaCl、75 mMクエン酸三ナトリウムおよび1% SDS中で起こる。別の実施形態では、ハイブリダイゼーションは、37℃で、500 mM NaCl、50 mMクエン酸三ナトリウム、1% SDS、35%ホルムアミドおよび100μg/ml変性サケ精子DNA (ssDNA) 中で起こる。別の実施形態において、ハイブリダイゼーションは、42℃において、250 mM NaCl、25 mMクエン酸三ナトリウム、1% SDS、50%ホルムアミドおよび200μg/ml ssDNA中で起こる。これらの条件の有用なバリエーションは、当業者には容易に明らかになるであろう。
ほとんどの用途では、ハイブリダイゼーションに続く洗浄工程もまた、ストリンジェンシーが異なる。洗浄ストリンジェンシー条件は、塩濃度および温度によって定義することができる。上記のように、洗浄ストリンジェンシーは、塩濃度を低下させるか、または温度を上昇させることによって増加させることができる。例えば、洗浄工程のためのストリンジェントな塩濃度は、好ましくは約30 mM未満 NaClおよび3 mMクエン酸三ナトリウムであり、最も好ましくは約15 mM未満 NaClおよび1.5 mMクエン酸三ナトリウムであり得る。洗浄工程のためのストリンジェントな温度条件は、通常、少なくとも約25℃、より好ましくは少なくとも約42℃、さらにより好ましくは少なくとも約68℃の温度を含む。一実施形態において、洗浄工程は、25℃で、30 mM NaCl、3 mMクエン酸三ナトリウム、および0.1% SDS中で行われる。より好ましい実施形態において、洗浄工程は、42℃で、15 mM NaCl、1.5 mMクエン酸三ナトリウム、および0.1% SDS中で行われる。より好ましい実施形態において、洗浄工程は、68℃で、15 mM NaCl、1.5 mMクエン酸三ナトリウム、および0.1% SDS中で行われる。これらの条件のさらなるバリエーションは、当業者には容易に明らかになるであろう。ハイブリダイゼーション技術は、当業者によく知られており、例えば、Benton and Davis (Science 196:180, 1977); Grunstein and Hogness (Proc. Natl. Acad. Sci., USA 72:3961, 1975); Ausubel et al. (Current Protocols in Molecular Biology, Wiley Interscience, New York, 2001); Berger and Kimmel (Guide to Molecular Cloning Techniques, 1987, Academic Press, New York); およびSambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, New Yorkに記述されている。
「分割(split)」とは、2つ以上の断片に分割されることを意味する。
「分割されたCas9タンパク質」あるいは「分割Cas9」とは、2つの別個のヌクレオチド配列によってコードされるN末端断片およびC末端断片として提供されるCas9タンパク質をいう。Cas9タンパク質のN末端部分およびC末端部分に対応するポリペプチドは、スプライスされて「再構成」Cas9タンパク質を形成することができる。特定の実施形態において、Cas9タンパク質は、例えば、Nishimasu et al., Cell, Volume 156, Issue 5, pp. 935-949, 2014に記載されるように、またはJiang et al. (2016) Science 351: 867-871. PDB file: 5F9Rに記載されるように(それぞれ参照により本明細書に組み込まれる)、タンパク質の非秩序的な領域内で2つの断片に分割される。いくつかの実施形態において、タンパク質は、SpCas9のおよそアミノ酸A292-G364、F445-K483、もしくはE565-T637の間の領域内の任意のC、T、A、もしくはSにおいて、または任意の他のCas9、Cas9バリアント(例えばnCas9、dCas9)、もしくは他のnapDNAbpにおける対応位置において、2つの断片に分割される。ある態様において、タンパク質は、SpCas9 T310、T313、A456、S469、またはC574において2つの断片に分割される。いくつかの実施形態において、タンパク質を2つの断片に分割するプロセスは、タンパク質を「分割(スプリッティング)する」と称される。
他の実施形態では、Cas9タンパク質のN末端部分は、S. pyrogenes Cas9野生型(SpCas9)(NCBI参照配列:NC_002737.2、Uniprot参照配列:Q99ZW2)のアミノ酸1~573または1~637を含み、Cas9タンパク質のC末端部分は、SpCas9野生型のアミノ酸574~1368もしくは638~1368の一部分、またはその対応する位置を含む。
分割されたCas9のC末端部分は、分割されたCas9のN末端部分と連結されて完全なCas9タンパク質を形成することができる。いくつかの実施形態において、Cas9タンパク質のC末端部分は、Cas9タンパク質のN末端部分が終わるところから始まる。このように、いくつかの実施態様において、分割Cas9のC末端部分は、spCas9のアミノ酸 (551-651) -1368の部分を含む。「(551-651) -1368」とは、アミノ酸551~651(両端を含む)の間のアミノ酸から始まり、アミノ酸1368で終わることを意味する。例えば、分割Cas9のC末端部分は、spCas9のアミノ酸551-1368、552-1368、553-1368、554-1368、555-1368、556-1368、557-1368、558-1368、559-1368、560-1368、561-1368、562-1368、563-1368、564-1368、565-1368、566-1368、567-1368、568-1368、569-1368、570-1368、571-1368、572-1368、573-1368、574-1368、575-1368、576-1368、577-1368、578-1368、579-1368、580-1368、581-1368、582-1368、583-1368、584-1368、585-1368、586-1368、587-1368、588-1368、589-1368、590-1368、591-1368、592-1368、593-1368、594-1368、595-1368、596-1368、597-1368、598-1368、599-1368、600-1368、601-1368、602-1368、603-1368、604-1368、605-1368、606-1368、607-1368、608-1368、609-1368、610-1368、611-1368、612-1368、613-1368、614-1368、615-1368、616-1368、617-1368、618-1368、619-1368、620-1368、621-1368、622-1368、623-1368、624-1368、625-1368、626-1368、627-1368、628-1368、629-1368、630-1368、631-1368、632-1368、633-1368、634-1368、635-1368、636-1368、637-1368、638-1368、639-1368、640-1368、641-1368、642-1368、643-1368、644-1368、645-1368、646-1368、647-1368、648-1368、649-1368、650-1368、または651-1368のいずれか1つの部分を含み得る。いくつかの実施形態において、分割されたCas9タンパク質のC末端部分は、SpCas9のアミノ酸574-1368または638-1368の部分を含む。
「対象」とは、哺乳動物を意味し、それだけには限定されないが、ヒト、または、ウシ、ウマ、イヌ、ヒツジ、もしくはネコなどの非ヒト哺乳動物を含む。対象としては、それだけには限定されないが、畜牛、ヤギ、ニワトリ、ウマ、ブタ、ウサギ、およびヒツジを含めた、労働を生産し食料などの物品を提供するために飼育された家畜を含む、家畜が挙げられる。
「実質的に同一である」とは、参照アミノ酸配列(例えば、本明細書に記載のアミノ酸配列のいずれか1つ)または核酸配列(例えば、本明細書に記載の核酸配列のいずれか1つ)に対して少なくとも50%の同一性を示すポリペプチドまたは核酸分子を意味する。一実施形態では、そのような配列は、比較のために使用される配列とアミノ酸レベルまたは核酸において少なくとも60%、80%もしくは85%、90%、95%、またはさらには99%同一である。
配列同一性は、典型的には、配列解析ソフトウェア(例えば、the Genetics Computer Group、University of Wisconsin Biotechnology Center、1710 University Avenue, Madison, Wis. 53705のSequence Analysis Software Package、BLAST、BESTFIT、COBALT、EMBOSS Needle、GAP、またはPILEUP/PRETTYBOXプログラム)を使用して測定する。そのようなソフトウェアは、種々の置換、欠失、および/または他の改変に相同性の程度を割り当てることによって、同一または類似の配列をマッチさせる。保存的置換は、典型的には、以下の群内の置換を含む:グリシン、アラニン;バリン、イソロイシン、ロイシン;アスパラギン酸、グルタミン酸、アスパラギン、グルタミン;セリン、トレオニン;リジン、アルギニン;フェニルアラニン、チロシン。同一性の程度を決定するための例示的なアプローチにおいて、BLASTプログラムを使用することができ、e -3とe -100の間の確率スコアが密接に関連した配列を示す。COBALTは、例えば次のパラメーターと共に使用される:
a) アラインメントパラメータ:Gap penalties-11,-1 and End-Gap penalties-5,-1,
b) CDDパラメーター:Use RPS BLAST on; Blast E-value 0.003; Find Conserved columns and Recompute on
c) クエリー・クラスタリング・パラメータ:Use query clusters on; Word Size 4; Max cluster distance 0.8; Alphabet Regular。
EMBOSS Needleは、例えば次のパラメーターで使用される。
a) Matrix: BLOSUM62;
b) GAP OPEN: 10;
c) GAP EXTEND: 0.5;
d) OUTPUT FORMAT: pair;
e) END GAP PENALTY: false;
f) END GAP OPEN: 10; and
g) END GAP EXTEND: 0.5.
用語「標的部位」とは、核酸分子内の配列であって、核酸塩基エディターによって改変される配列をいう。一実施形態において、標的部位は、デアミナーゼまたはそれを含む融合タンパク質(例えば、アデニンデアミナーゼ)によって脱アミノ化される。
本明細書中で使用される、用語「治療する(treat)」、「治療する(treating)」、「治療(treatment)」などは、障害および/またはそれに関連する症状を軽減もしくは改善すること、または所望の薬理学的および/または生理学的効果を得ることを指す。障害または状態を治療することは、関連する障害、状態または症状を完全に除去することを必要としないことが理解されるであろう(完全な除去が除外されるわけでもない)。いくつかの態様において、効果は、治療的であり、すなわち、限定されるものではないが、効果は、疾患および/またはそれに起因する有害症状を部分的または完全に低減、減少、除去、軽減、緩和、強度低下、または治癒する。ある態様において、効果は予防的であり、すなわち効果は、疾患または状態の発生または再発を保護または予防する。この目的のために、本開示の方法は、本明細書に記載されるような治療的に有効な量の組成物を投与することを含む。
「ウラシルグリコシラーゼ阻害因子」、あるいは「UGI」とは、ウラシル除去修復系を阻害する因子を意味する。1つの実施形態において、該因子は、宿主ウラシル-DNAグリコシラーゼに結合してDNAからのウラシル残基の除去を妨げるタンパク質またはその断片である。一実施形態において、UGIは、ウラシル-DNAグリコシラーゼ塩基除去修復酵素を阻害することができるタンパク質、その断片、またはドメインである。いくつかの態様において、UGIドメインは、野生型UGIまたはその改変バージョンを含む。いくつかの実施形態において、UGIドメインは、下記に提示される例示的アミノ酸配列の断片を含む。いくつかの実施形態において、UGI断片は、下記に提供される例示的UGI配列の少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%を含むアミノ酸配列を含む。いくつかの実施形態において、UGIは、以下に記載されるように、例示的UGIアミノ酸配列またはその断片に対して相同的なアミノ酸配列を含む。いくつかの実施態様において、UGIまたはその一部は、以下に記載されるように、野生型UGIもしくUGI配列またはその一部に対して少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、少なくとも99.5%、少なくとも99.9%または100%の同一性を有する。例示的なUGIは、以下のアミノ酸配列を含む:
>splP14739IUNGI_BPPB2 Uracil-DNA glycosylase inhibitor
MTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSD APEYKPWALVIQDSNGENKIKML.
用語「ベクター」とは、核酸配列を細胞内に導入し、形質転換細胞をもたらすための手段を指す。ベクターとしては、プラスミド、トランスポゾン、ファージ、ウイルス、リポソーム、およびエピソームが挙げられる。「発現ベクター」とは、レシピエント細胞中で発現させるヌクレオチド配列を含む核酸配列である。発現ベクターは、開始、停止、エンハンサー、プロモーター、および分泌配列などの、導入した配列の発現を促進するおよび/または容易にするための追加の核酸配列を含み得る。
本明細書中に提供される任意の組成物または方法は、本明細書中に提供される他の組成物および方法のいずれかの1つまたは複数と組み合わせることができる。
DNA編集は、病原性突然変異を遺伝子レベルで補正することによって病状を改変させるための実行可能な手段として現れた。最近まで、全てのDNA編集プラットフォームは、DNA二本鎖切断(DSB)を指定したゲノム部位で誘導し、内在性DNA修復経路に依存して生成物の結果を半確率的様式で決定することによって機能しており、遺伝子産物の複雑な集団が生じていた。相同組換え修復(HDR)経路によって、正確な、ユーザーに定義された修復結果を達成することができるが、いくつかの課題が、治療上関連性のある細胞種におけるHDRを使用した高効率の修復を妨げてきた。実際には、この経路は、競合する誤りがちな非相同末端結合経路と比較して非効率的である。さらに、HDRは細胞周期のG1およびS期に厳しく制限されており、分裂終了細胞におけるDSBの正確な修復が妨げられている。その結果、これらの集団において、ユーザーに定義されたプログラミング可能な様式で、高効率でゲノム配列を改変することは、困難または不可能であることが判明している。
本開示の特徴は、添付の特許請求の範囲に詳細に記載されている。本開示の特徴および利点のより良好な理解は、本開示の原理が利用されている例示的な実施形態を記載する以下の詳細な説明、およびその内容が以下である添付の図面を参照して得られるであろう:
図1は、GSD1a Q347X突然変異の補正のバイスタンダーおよびオンターゲットのA>G塩基を示す、G6PCヌクレオチド標的配列および対応するアミノ酸配列を示す図である。 図2は、正確な塩基補正およびバイスタンダー編集を示す図である。図2Aは、標的核酸塩基およびバイスタンダー核酸塩基の位置を示す。図2Bは、ABE8バリアントを使用した、HEK293T細胞における、GSD1a G6PC Q347X突然変異の正確なオンターゲットおよびバイスタンダーの補正の百分率を示す。 図3Aおよび3Bは、HEK293T細胞における、GSD1a G6PC Q347X突然変異の補正のエディター最適化を示す図である。図3Aは、GSD1a Q347X突然変異の補正のバイスタンダーおよびオンターゲットのA>G塩基ならびにGGA PAM配列を示す、G6PCヌクレオチド標的配列および対応するアミノ酸配列を示す。図3Bは、ABE8モノマーおよびヘテロ二量体バリアントを使用した、GSD1a G6PC Q347X突然変異の補正の百分率を示すグラフである。 図4は、ABE8二重突然変異体バリアントを使用した、HEK293T細胞における、GSD1a G6PC Q347X突然変異の補正の百分率を示すグラフであり、バイスタンダー(A2)とオンターゲット(A6)とのA>G塩基を比較する。 図5は、ABE8バリアントを使用した、患者由来のBリンパ球における、正確なGSD1a Q347X突然変異の補正の百分率を示すグラフである。 図6Aおよび6Bは、複合ヘテロ接合性(Q347X、G222R)患者のiPS由来肝細胞における、GSD1a G6PC Q347X突然変異の正確な補正を示す図である。図6Aは、GSD1a Q347X突然変異の補正のバイスタンダーおよびオンターゲットのA>G塩基を示す、G6PCヌクレオチド標的配列、対応するアミノ酸配列、およびGGA PAM配列を示す。図6Bは、ABE8バリアントを使用した、GSD1a Q347X突然変異のA>G塩基編集効率を示すグラフであり、オンターゲットとバイスタンダーとの補正を比較する。 図7Aおよび7Bは、患者のiPS由来肝細胞における、GSD1a Q347X突然変異の補正のエディター最適化を示す図である。図7Aは、GSD1aのNGA PAM配列および対応する標的配列を示し、バイスタンダーおよびオンターゲットのA>G塩基を示す。図7Bは、ABE8バリアントを使用した、GSD1a Q347X突然変異の塩基編集効率を示すグラフである。 図8Aおよび8Bは、初代肝細胞同時培養系における、GSD1a Q347X突然変異のin vitro形質導入スケジュールを提供する図である。図8Aは、肝細胞単層または肝細胞同時培養物のどちらかにおけるin vitro形質導入スケジュールタイムラインを提供し、代表的な時点を示す。図8Bは、GSD1a Q347X突然変異の同時培養系において使用したドナー由来の形質導入初代肝細胞の画像を示す。 図9は、GSD1a Q347X突然変異を含有するレンチウイルスベクターを用いて、30、100、および300レンチウイルスの感染多重度(MOI)で形質導入した初代肝細胞同時培養細胞における、6日目(D6)におけるGFP発現の画像を示す(GFP、明視野、マージ)。 図10A、10B、および10Cは、レンチウイルスを形質導入した初代肝細胞同時培養系における、GSD1a Q347X突然変異の補正を示す図である。図10Aは、GSD1a Q347X突然変異を含有するレンチウイルスベクターを用いて、500のMOIで形質導入した初代肝細胞同時培養細胞(ドナーRSE)における、GFP発現の画像を示す。図10Bは、オンターゲットGSD1a Q347X突然変異の補正のA>G塩基編集効率および形質導入初代肝細胞同時培養物中におけるインデルを示すグラフである。破線は、治療上の利点のためのA>G塩基編集効率を表す。図10Cは、ポリエチレングリコール8000(PEG8K)を有するまたは有さない培地中の、コラゲナーゼIII型、IV型、およびヒアルロン酸で処理したまたは未処理のままの、形質導入初代肝細胞同時培養物における、GSD1a Q347X突然変異のA>G塩基編集効率を示すグラフである。 図11は、GSD1a R83C突然変異の補正のバイスタンダーおよびオンターゲットのA>G塩基を示す、G6PCヌクレオチド標的配列および対応するアミノ酸配列を示す図である。 図12Aおよび12Bは、HEK293T細胞における、GSD1a G6PC R83C突然変異の正確な補正を示す図である。図12Aは、GSD1a R83C突然変異の補正のバイスタンダー、同義、およびオンターゲットのA>G塩基を示す、G6PCヌクレオチド標的配列および対応するアミノ酸配列を示す図である。図12Bは、ABE8バリアントを使用した、GSD1a R83C突然変異のA>G塩基編集効率を示すグラフであり、オンターゲットとバイスタンダーとの補正を比較する。 図13Aおよび13Bは、HEK293Tレンチモデル細胞における、プラスミド形質移入によるG6PC R83C突然変異の塩基編集を示す図である。図13Aは、GSD1a gRNA#820のGAGAAT PAM配列および対応する標的配列ならびにGSD1a gRNA#1121のAGA PAM配列および対応する標的配列を示し、これは標的配列のバイスタンダーおよびオンターゲットのA>G塩基を示す。図13Bは、gRNA1121またはgRNA820を有するABE塩基エディターを使用した、GSD1a R83C突然変異のオンターゲットおよびバイスタンダーの補正の百分率を示すグラフである。 図14は、saABE8バリアントを使用した、GSD1a R83C突然変異のA>G塩基編集効率を示すグラフである。 図15は、saABE8二重突然変異体バリアントを使用した、GSD1a R83C突然変異のA>G塩基編集効率を示すグラフである。 図16は、ABE8バリアントを使用した、HEK293T細胞における、GSD1a R83C突然変異のオンターゲット、バイスタンダー、および同義バイスタンダーの補正のA>G塩基編集効率を示すグラフである。 図17Aおよび17Bは、GSD1aのトランスジェニックマウスモデルから単離した初代マウス肝細胞における、GSD1a Q347X突然変異の補正を示す図である。図17Aは、ASCトランスジェニックマウスモデル、huG6PC、R83C(V166L)から単離した初代マウス肝細胞の画像を示す。図17Bは、GSD1aトランスジェニックマウスモデルから単離した初代マウス肝細胞における、ABE8バリアントを使用した、GSD1a R83C突然変異の補正の、位置A12G、A10G、A6G、およびインデルの塩基編集効率を示すグラフである。 図18は、示すような様々な長さのガイドRNAと組み合わせたTadA-SaCas9 ABEエディターを使用した、オンターゲット(12A)およびオフターゲット(6A)の部位でのA>G塩基編集のレベルを示すグラフである。データはHEK293T細胞において得た。標的部位および他の編集の詳細も提供する。 図19は、20ntおよび21ntのガイドRNAと組み合わせたABE8(TadA*8バリアント-SaCas9)を使用した、オンターゲット(12A)およびオフターゲット(6A)の部位でのA>G塩基編集のレベル(パーセント編集)を示すグラフである。データはHEK293T細胞において得た。 図20は、20ntまたは21ntのガイドRNAと組み合わせたABE塩基エディター(TadAバリアント-SaCas9)を使用した、オンターゲット(12A)およびオフターゲット(6A)の部位でのA>G塩基編集のレベル(R83Cの%補正)を示すグラフである。データはHEK293T細胞において得た。 図21は、20ntまたは21ntのガイドRNAと組み合わせたABE塩基エディター(TadAバリアント-SaCas9)を使用した、オンターゲット(12A)およびオフターゲット(6A)の部位でのA>G(%)塩基編集のレベルを示すグラフである。データはGSD1a R83Cの初代ヒト肝細胞レンチウイルスモデルにおいて得た。 図22は、20ntまたは21ntのガイドRNAと組み合わせたABE塩基エディター(TadAバリアント-SaCas9)を使用した、オンターゲット(12A)およびオフターゲット(6A)の部位でのA>G塩基編集のレベル(R83Cの%補正)を示すグラフである。データはGSD1a R83Cの初代ヒト肝細胞レンチウイルスモデルにおいて得た。 図23は、ヘテロ接合性トランスジェニックGSD1a R83Cマウスにおけるオンターゲットおよびオフターゲットの部位でのA>G(%)正確な塩基編集のレベルを示すグラフである。 図24は、NRNN PAMの全ての可能なPAMにアクセスするための、Cas9バリアントを示す表である。そのPAM中に3個以下の定義されたヌクレオチドの認識しか必要としないCas9バリアントのみを列挙する。非G PAMバリアントとしては、SpCas9-NRRH、SpCas9-NRTH、およびSpCas9-NRCHが挙げられる。
本発明は、効率が増加した新規アデノシン塩基エディター(例えばABE8)を含む組成物、および糖原病1a型(GSD1a)に関連する突然変異を改変するためにアデノシンデアミナーゼバリアントを含む塩基エディターを使用する方法を提供する。
本発明は、少なくとも部分的に、アデノシンデアミナーゼバリアント(すなわちABE8)を特徴とする塩基エディターが、内在性グルコース-6-ホスファターゼ(G6PC)遺伝子中の一塩基多型(例えばR83C、Q347X)を正確に補正するという発見に基づく。
GSD1a突然変異、R83CおよびQ347Xは、シチジンからチミジン(C→T)の転移突然変異であり、C・GからT・Aの塩基対置換をもたらす。これらの置換は、A・TからG・Cへの置換を触媒するアデノシン塩基エディター(ABE)を用いて、野生型の非病原性ゲノム配列へと戻し得る。拡大解釈すれば、GSD1aを引き起こす突然変異は、遺伝子療法を使用した場合に起こり得るG6PC遺伝子の過剰発現を誘導する危険性なしに、ABEを使用して野生型配列に復帰させるために潜在的な標的である。したがって、A・TからG・CへのDNA塩基編集は、G6PC遺伝子中の、最も一般的なGSD1aを引き起こす突然変異のうちの1つまたは複数を正確に補正する。
[核酸塩基エディター]
ポリヌクレオチドの標的ヌクレオチド配列を編集、修飾または改変するための塩基エディターまたは核酸塩基エディターが本明細書に開示される。本明細書に記載されるのは、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインおよび核酸塩基編集ドメインを含む核酸塩基エディターまたは塩基エディターである(例えばアデノシンデアミナーゼ)。ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、結合されたガイドポリヌクレオチド(例えばgRNA)と一緒である場合に、(結合されたガイド核酸の塩基と標的ポリヌクレオチド配列の塩基との間の相補的塩基対形成を介して)標的ポリヌクレオチド配列に特異的に結合することができ、それによって、編集されることが所望される標的核酸配列に塩基エディターを局在化させることができる。或る実施態様では、標的ポリヌクレオチド配列は一本鎖DNAまたは二本鎖DNAを含む。或る実施態様では、標的ポリヌクレオチド配列はRNAを含む。或る実施態様では、標的ポリヌクレオチド配列はDNA-RNAハイブリッドを含む。
[ポリヌクレオチドプログラミング可能なヌクレオチド結合ドメイン]
ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインはまた、RNAに結合する核酸プログラム可能タンパク質を含むことができることを理解されたい。例えば、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインをRNAにガイドする核酸と結合され得る。他の核酸プログラム可能DNA結合タンパク質もまた、本開示の範囲内にあるが、それらは本開示には特に列記されていない。
塩基エディターのポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、それ自体が1つ以上のドメインを含むことができる。例えば、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、1つ以上のヌクレアーゼドメインを含むことができる。ある態様において、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインのヌクレアーゼドメインは、エンドヌクレアーゼまたはエキソヌクレアーゼを含むことができる。本明細書において、用語「エキソヌクレアーゼ」は、核酸(例えばRNAまたはDNA)を遊離末端から消化することができるタンパク質またはポリペプチドを指し、用語「エンドヌクレアーゼ」は、核酸(例えばDNAまたはRNA)の内部領域を触媒(例えば劈開)することができるタンパク質またはポリペプチドを指す。ある態様において、エンドヌクレアーゼは、二本鎖核酸の一本鎖を切断することができる。ある態様において、エンドヌクレアーゼは、二本鎖核酸分子の両方の鎖を切断することができる。ある態様において、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、デオキシリボヌクレアーゼであり得る。ある態様において、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、リボヌクレアーゼであり得る。
ある態様において、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインのヌクレアーゼドメインは、標的ポリヌクレオチドの0本、1本または2本の鎖を切断することができる。ある態様において、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、ニッカーゼドメインを含むことができる。本明細書において、用語「ニッカーゼ」は、二本鎖核酸分子(例えばDNA)中の二本鎖の一方の鎖のみを切断することができるヌクレアーゼドメインを含むポリヌクレオチドプログラム可能ヌクレオチド結合ドメインを指す。ある態様において、ニッカーゼは、活性なポリヌクレオチドプログラム可能ヌクレオチド結合ドメインに一つ以上の突然変異を導入することによって、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインの完全に触媒活性な(例えば天然の)形態から誘導することができる。例えば、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインがCas9に由来するニッカーゼドメインを含む場合、Cas9に由来するニッカーゼドメインは、D10A突然変異および位置840におけるヒスチジンを含むことができる。そのような態様において、残基H 840は触媒活性を保持し、それによって核酸二本鎖の一本鎖を切断することができる。別の例において、Cas9由来ニッカーゼドメインは、H840A突然変異を含むことができ、一方、位置10におけるアミノ酸残基は、Dのままである。いくつかの実施形態において、ニッカーゼは、ニッカーゼ活性に必要ではないヌクレアーゼドメインの全部または一部を除去することによって、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインの完全に触媒活性な(例えば天然の)形態から誘導することができる。例えば、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインがCas9に由来するニッカーゼドメインを含む場合、Cas9に由来するニッカーゼドメインは、RuvCドメインまたはHNHドメインの全部または一部の欠失を含むことができる。
例示的な触媒活性Cas9のアミノ酸配列は以下の通りである:
MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD.
したがって、ニッカーゼドメインを含むポリヌクレオチドプログラム可能なヌクレオチド結合ドメインを含む塩基エディターは、特定のポリヌクレオチド標的配列(例えば結合したガイド核酸の相補的配列によって決定される)において一本鎖DNA切断(ニック) を生成することができる。ある態様において、ニッカーゼドメイン(例えばCas9由来のニッカーゼドメイン)を含む塩基エディターによって切断される核酸二本鎖標的ポリヌクレオチド配列の鎖は、塩基エディターによって編集されない鎖である(すなわち、塩基エディターによって切断される鎖は、編集される塩基を含む鎖とは反対の鎖である)。他の態様において、ニッカーゼドメイン(例えばCas9由来のニッカーゼドメイン)を含む塩基エディターは、編集のために標的とされるDNA分子の鎖を切断することができる。このような態様において、非標的鎖は切断されない。
触媒的に死んだ(すなわち標的ポリヌクレオチド配列を切断することができない)ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインを含む塩基エディターも本明細書中に提供される。本明細書において、用語「触媒的に死んだ」および「ヌクレアーゼ不活」は、核酸の鎖を切断することができない結果となる一つ以上の突然変異および/または欠失を有するポリヌクレオチドプログラム可能ヌクレオチド結合ドメインを指すために交換可能に使用される。いくつかの実施形態において、触媒的に死んだポリヌクレオチドプログラム可能ヌクレオチド結合ドメイン塩基エディターは、1つ以上のヌクレアーゼドメインにおける特定の点突然変異の結果としてヌクレアーゼ活性を欠くことができる。例えば、Cas9ドメインを含む塩基エディターの場合、Cas9は、D10A突然変異およびH840A突然変異の両方を含むことができる。このような変異は両方のヌクレアーゼドメインを不活性化し、その結果ヌクレアーゼ活性を失う。他の実施形態において、触媒的に死んだポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、触媒ドメイン(例えばRuvC1および/またはHNHドメイン)の全部または一部の一つ以上の欠失を含むことができる。さらなる態様において、触媒的に死んだポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、点突然変異(例えばD10AまたはH840A)ならびにヌクレアーゼドメインの全部または一部の欠失を含む。
また、本明細書では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインの以前に機能していたバージョンから、触媒的に死んだポリヌクレオチドプログラム可能ヌクレオチド結合ドメインを生成することができる突然変異も企図される。例えば、触媒的に死んだCas9 (「dCas9」) の場合、D10AおよびH840A以外の突然変異を有してヌクレアーゼ不活性化Cas9をもたらすバリアントが提供される。このような突然変異は、例えば、D10およびH840における他のアミノ酸置換、またはCas9のヌクレアーゼドメイン内の他の置換(例えば、HNHヌクレアーゼサブドメインおよび/またはRuvC1サブドメインにおける置換)を含む。さらなる適切なヌクレアーゼ不活性dCas9ドメインは、本開示および当該分野における知識に基づいて当業者に明らかとなり得、本開示の範囲内である。このようなさらなる例示的な適切なヌクレアーゼ不活性Cas9ドメインには、限定されるものではないが、D10A/H840A、D10A/D839A/H840A、およびD10A/D839A/H840A/N863A突然変異体ドメインが含まれる(例えば、Prashant et al., CAS9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering. Nature Biotechnology. 2013; 31(9): 833-838を参照されたい (その全内容は参照により本明細書に組み込まれる))。
塩基エディターに組み込むことができるポリヌクレオチドプログラム可能ヌクレオチド結合ドメインの非限定的な例としては、CRISPRタンパク質由来ドメイン、制限ヌクレアーゼ、メガヌクレアーゼ、TALヌクレアーゼ (TALEN) 、およびジンクフィンガーヌクレアーゼ (ZFN) が挙げられる。いくつかの態様において、塩基エディターは、核酸のCRISPR (すなわちClustered Regularly Interspaced Short Palindromic Repeats)媒介修飾の際に、結合ガイド核酸を介して核酸配列に結合することができる天然もしくは修飾されたタンパク質またはその一部を含むポリヌクレオチドプログラム可能ヌクレオチド結合ドメインを含む。そのようなタンパク質は、本明細書において「CRISPRタンパク質」と呼ばれる。したがって、本明細書に開示されているのは、CRISPRタンパク質の全部または一部を含むポリヌクレオチドプログラム可能ヌクレオチド結合ドメインを含む塩基エディター(すなわち、CRISPRタンパク質の全部または一部をドメインとして含む塩基エディター(それは塩基エディターの「CRISPRタンパク質由来ドメイン」とも呼ばれる))である。塩基エディターに組み込まれたCRISPRタンパク質由来ドメインは、野生型または天然型のCRISPRタンパク質と比較して改変され得る。例えば、以下に記載するように、CRISPRタンパク質由来ドメインは、野生型または天然型のCRISPRタンパク質と比較して、1以上の突然変異、挿入、欠失、再配列および/または組換えを含み得る。
CRISPRは、可動遺伝要素(ウイルス、転移因子、接合プラスミド)に対する防御を提供する適応免疫系である。CRISPRクラスターは、スペーサー、先行する可動要素に相補的な配列、および標的侵入核酸を含む。CRISPRクラスターは転写され、CRISPR RNA (crRNA) にプロセシングされる。II型CRISPRシステムでは、pre‐crRNAの正しいプロセシングはトランスコード小RNA (tracrRNA)、内因性リボヌクレアーゼ3 (rnc) 、およびCas9タンパク質を必要とする。tracrRNAはリボヌクレアーゼ3によるpre-crRNAのプロセシングのガイドとなる。続いて、Cas9/crRNA/tracrRNAが、スペーサーに相補的な線状または環状のdsDNA標的をエンドヌクレアーゼで切断する。crRNAに相補的でない標的鎖は、最初にエンドヌクレアーゼ的に切断され、次にエキソヌクレアーゼ的に3’-5’にトリムされる。自然界では、DNA結合と切断にはタンパク質と両方のRNAが必要である。しかしながら、crRNAおよびtracrRNAの両方の側面を単一のRNA種に組み込むように、単一ガイドRNA (「sgRNA」、あるいは単に「gRNA」)を作製することができる。例えばJinek M., Chylinski K., Fonfara I., Hauer M., Doudna J. A., Charpentier E. Science 337:816-821(2012)を参照されたい(その内容全体が参照により本明細書に組み入れられる)。Cas9は、CRISPR反復配列中の短いモチーフ(PAMまたはプロトスペーサー隣接モチーフ)を認識して、「自己」と「非自己」を区別することを助ける。
いくつかの実施形態において、本明細書に記載される方法は、組み換え操作された(engineered)Casタンパク質を利用することができる。ガイドRNA (gRNA) は、Cas結合に必要な足場配列と、修飾されるゲノム標的を規定するユーザー定義の約20塩基スペーサーとからなる短い合成RNAである。したがって、当業者はCasタンパク質特異性のゲノム標的を変化させることができ、これは、ゲノムの他の部分と比較してgRNA標的化配列がゲノム標的に対していかに特異的であるかによって部分的に決定される。
いくつかの実施形態において、gRNA足場配列は以下の通りである:
GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU。
いくつかの実施形態において、塩基エディターに組み込まれたCRISPRタンパク質由来ドメインは、結合ガイド核酸と組み合わせられた場合に標的ポリヌクレオチドに結合することができるエンドヌクレアーゼ(例えばデオキシリボヌクレアーゼまたはリボヌクレアーゼ)である。いくつかの実施形態において、塩基エディターに組み込まれたCRISPRタンパク質由来ドメインは、結合ガイド核酸と組み合わせられた場合に標的ポリヌクレオチドに結合することができるニッカーゼである。いくつかの実施形態において、塩基エディターに組み込まれたCRISPRタンパク質由来ドメインは、結合ガイド核酸と組み合わせられた場合に標的ポリヌクレオチドに結合することができる触媒的に死んだドメインである。或る実施態様では、塩基エディターのCRISPRタンパク質由来ドメインに結合する標的ポリヌクレオチドはDNAであり、或る実施態様では、塩基エディターのCRISPRタンパク質由来ドメインに結合する標的ポリヌクレオチドはRNAである。
本明細書中で用いることができるCAsタンパク質は、クラス1およびクラス2を含む。Casタンパク質の非限定的な例としては、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5d、Cas5t、Cas5h、Cas5a、Cas6、Cas7、Cas8、Cas9(Csn1またはCsx12とも呼ばれる)、Cas10、Csy1、Csy2、Csy3、Csy4、Cse1、Cse2、Cse3、Cse4、Cse5、Csn1、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Cssx16、Cx16、Cx、Csx3、Csx1、Csx1S、Csf1、Csf2、CsO、Csf4、Csd1、Csd2、Cst1、Cst2、Csh1、Csh2、Csa1、Csa2、Csa3、Csa4、Csa5、Cas12a/Cpf1、Cas12b/C2c1、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、およびCas12i、CARF、DinG、それらのホモログ、またはそれらの改変体が挙げられる。未改変のCRISPR酵素は、Cas9のように、2つの機能性エンドヌクレアーゼ領域、RuvCおよびHNHを有するDNA切断活性を有することができる。CRISPR酵素は、標的配列内および/または標的配列の相補鎖内などの標的配列において、一方または両方の鎖の切断を誘導することができる。例えば、CRISPR酵素は、標的配列の最初または最後のヌクレオチドから約1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、200、500塩基対またはそれ以上にある一方または両方の鎖の切断を誘導することができる。
標的配列を含む標的ポリヌクレオチドの一方または両方の鎖を切断する能力を欠失するように、対応する野生型酵素に対して変異されたCRISPR酵素をコードするベクターを用いることができる。Cas9は、野生型の例示的なCas9ポリペプチド(例えばS. pyogenesからのCas9)と少なくとも、または少なくともおよそ、50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性および/または配列相同性を有するポリペプチドを指すことができる。Cas9は、野生型の例示的なCas9ポリペプチド(例えばS.pyogenesからのもの)に対して、最大で、または最大でおよそ、約50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性および/または配列相同性を有するポリペプチドを指すことができる。Cas9は、野生型、または欠失、挿入、置換、バリアント、突然変異、融合、キメラ、またはそれらの任意の組合せなどのアミノ酸変化を含み得るCas9タンパク質の改変型を指すことができる。
ある態様において、塩基エディターのCRISPRタンパク質由来ドメインは、Corynebacterium ulcerans (NCBI Refs: NC_015683.1, NC_017317.1); Corynebacterium diphtheria (NCBI Refs: NC_016782.1, NC_016786.1); Spiroplasma syrphidicola (NCBI Ref: NC_021284.1); Prevotella intermedia (NCBI Ref: NC_017861.1); Spiroplasma taiwanense (NCBI Ref: NC_021846.1); Streptococcus iniae (NCBI Ref: NC_021314.1); Belliella baltica (NCBI Ref: NC_018010.1); Psychroflexus torquis (NCBI Ref: NC_018721.1); Streptococcus thermophilus (NCBI Ref: YP_820832.1); Listeria innocua (NCBI Ref: NP_472073.1); Campylobacter jejuni (NCBI Ref: YP_002344900.1); Neisseria meningitidis (NCBI Ref: YP_002342100.1), Streptococcus pyogenes, または Staphylococcus aureus由来のCas9の全部または一部を含むことができる。
[核酸塩基エディターのCas9ドメイン]
Cas9ヌクレアーゼの配列および構造は、当業者によく知られている(例えば“Complete genome sequence of an Ml strain of Streptococcus pyogenes.”Ferretti et al., J.J., McShan W.M., Ajdic D.J., Savic D.J., Savic G., Lyon K., Primeaux C, Sezate S., Suvorov A.N., Kenton S., Lai H.S., Lin S.P., Qian Y., Jia H.G., Najar F.Z., Ren Q., Zhu H., Song L., White J., Yuan X., Clifton S.W., Roe B.A., McLaughlin R.E., Proc. Natl. Acad. Sci. U.S.A. 98:4658-4663(2001); “CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III.” Deltcheva E., Chylinski K., Sharma CM., Gonzales K., Chao Y., Pirzada Z.A., Eckert M.R., Vogel J., Charpentier E., Nature 471:602-607(2011); および “A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.” Jinek M., Chylinski K., Fonfara I., Hauer M., Doudna J.A., Charpentier E. Science 337:816-821(2012)参照。その内容全体が参照により本明細書に組み入れられる。)。Cas9オーソログは、限定されるものではないが、S.pyogenesおよびS.thermophilusを含む種々の種において記述されてきた。さらなる適切なCas9ヌクレアーゼおよび配列は、本開示に基づいて当業者に明らかとなり、そのようなCas9ヌクレアーゼおよび配列は、Chylinski, Rhun, and Charpentier, “The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems”(2013) RNA Biology 10:5, 726-737に開示されている生物および遺伝子座由来のCas9配列を含む。その全内容は参照により本明細書に組み込まれる。
いくつかの実施形態において、核酸プログラミング可能DNA結合タンパク質 (napDNAbp) は、Cas9ドメインである。非限定的な例示的Cas9ドメインが本明細書で提供される。Cas9ドメインは、ヌクレアーゼ活性Cas9ドメイン、ヌクレアーゼ不活性Cas9ドメイン(dCas9)、またはCas9ニッカーゼ(nCas9)であり得る。ある態様において、Cas9ドメインは、ヌクレアーゼ活性ドメインである。例えば、Cas9ドメインは、二本鎖核酸の両方の鎖(例えば二本鎖DNA分子の両方の鎖)を切断するCas9ドメインであり得る。いくつかの実施形態において、Cas9ドメインは、本明細書に記載のアミノ酸配列のいずれか1つを含む。いくつかの実施形態において、Cas9ドメインは、本明細書に記載されたアミノ酸配列のいずれか1つに対して少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。いくつかの実施形態において、Cas9ドメインは、本明細書に記載されるアミノ酸配列のいずれか1つと比較して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、またはそれ以上の突然変異を有するアミノ酸配列を含む。いくつかの実施形態において、Cas9ドメインは、本明細書に記載されたアミノ酸配列のいずれか1つと比較して、少なくとも10、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも150、少なくとも200、少なくとも250、少なくとも300、少なくとも350、少なくとも400、少なくとも500、少なくとも600、少なくとも700、少なくとも800、少なくとも900、少なくとも1000、少なくとも1100、または少なくとも1200個の同一の一続きのアミノ酸残基を有するアミノ酸配列を含む。
ある態様において、Cas9の断片を含むタンパク質が提供される。例えば、いくつかの実施形態において、タンパク質は、以下の2つのCas9ドメインのうちの1つを含む:(1) Cas9のgRNA結合ドメイン;(2) Cas9のDNA切断ドメイン。ある態様において、Cas9またはその断片を含むタンパク質は、「Cas9バリアント」と称される。Cas9バリアントは、Cas9またはその断片と相同性を共有する。例えば、Cas9バリアントは、野生型Cas9と少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一である。いくつかの実施形態において、Cas9変異体は、野生型Cas9と比較して、1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 21, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50またはそれ以上のアミノ酸変化を有し得る。いくつかの実施形態において、Cas9バリアントは、Cas9の断片(例えばgRNA結合ドメインまたはDNA切断ドメイン)を含み、その断片は、野生型Cas9の対応する断片と少なくとも約70%同一であり、少なくとも約80%同一であり、少なくとも約90%同一であり、少なくとも約95%同一であり、少なくとも約96%同一であり、少なくとも約97%同一であり、少なくとも約98%同一であり、少なくとも約99%同一であり、少なくとも約99.5%同一であり、または少なくとも約99.9%同一である。ある態様において、断片は、対応する野生型Cas9のアミノ酸長の少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%同一、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%である。ある態様において、断片は、長さが少なくとも100アミノ酸である。ある態様において、断片は、少なくとも100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250,または少なくとも 1300アミノ酸の長さである。
いくつかの実施形態において、本明細書に提供されるCas9融合タンパク質は、Cas9タンパク質の全長アミノ酸配列、例えば、本明細書に提供されるCas9配列の1つを含む。しかしながら、他の実施形態において、本明細書に提供される融合タンパク質は、全長Cas9配列を含まず、その1つ以上の断片のみを含む。好適なCas9ドメインおよびCas9断片の例示的アミノ酸配列が本明細書に提供され、Cas9ドメインおよび断片のさらなる好適な配列は、当業者には明らかであろう。
Cas9タンパク質は、そのガイドRNAに相補的な特定のDNA配列にCas9タンパク質をガイドする、ガイドRNAと結合することができる。ある態様において、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、Cas9ドメイン、例えばヌクレアーゼ活性Cas9、Cas9ニッカーゼ(nCas9) 、またはヌクレアーゼ不活性Cas9 (dCas9) である。核酸プログラム可能なDNA結合タンパク質の例としては、Cas9 (例:dCas9およびnCas9)、CasX、CasY、Cpf1、Cas12b/C2cl、およびCas12c/C2c3が挙げられるが、これらに限定されない。
一部の実施形態では、野生型Cas9は、Streptococcus pyogenes由来のCas9に対応する(NCBI参照配列:NC_017053.1、ヌクレオチドおよびアミノ酸の配列は以下の通りである)。
ATGGATAAGAAATACTCAATAGGCTTAGATATCGGCACAAATAGCGTCGGATGGGCGGTGATCACTGATGATTATAAGGTTCCGTCTAAAAAGTTCAAGGTTCTGGGAAATACAGACCGCCACAGTATCAAAAAAAATCTTATAGGGGCTCTTTTATTTGGCAGTGGAGAGACAGCGGAAGCGACTCGTCTCAAACGGACAGCTCGTAGAAGGTATACACGTCGGAAGAATCGTATTTGTTATCTACAGGAGATTTTTTCAAATGAGATGGCGAAAGTAGATGATAGTTTCTTTCATCGACTTGAAGAGTCTTTTTTGGTGGAAGAAGACAAGAAGCATGAACGTCATCCTATTTTTGGAAATATAGTAGATGAAGTTGCTTATCATGAGAAATATCCAACTATCTATCATCTGCGAAAAAAATTGGCAGATTCTACTGATAAAGCGGATTTGCGCTTAATCTATTTGGCCTTAGCGCATATGATTAAGTTTCGTGGTCATTTTTTGATTGAGGGAGATTTAAATCCTGATAATAGTGATGTGGACAAACTATTTATCCAGTTGGTACAAATCTACAATCAATTATTTGAAGAAAACCCTATTAACGCAAGTAGAGTAGATGCTAAAGCGATTCTTTCTGCACGATTGAGTAAATCAAGACGATTAGAAAATCTCATTGCTCAGCTCCCCGGTGAGAAGAGAAATGGCTTGTTTGGGAATCTCATTGCTTTGTCATTGGGATTGACCCCTAATTTTAAATCAAATTTTGATTTGGCAGAAGATGCTAAATTACAGCTTTCAAAAGATACTTACGATGATGATTTAGATAATTTATTGGCGCAAATTGGAGATCAATATGCTGATTTGTTTTTGGCAGCTAAGAATTTATCAGATGCTATTTTACTTTCAGATATCCTAAGAGTAAATAGTGAAATAACTAAGGCTCCCCTATCAGCTTCAATGATTAAGCGCTACGATGAACATCATCAAGACTTGACTCTTTTAAAAGCTTTAGTTCGACAACAACTTCCAGAAAAGTATAAAGAAATCTTTTTTGATCAATCAAAAAACGGATATGCAGGTTATATTGATGGGGGAGCTAGCCAAGAAGAATTTTATAAATTTATCAAACCAATTTTAGAAAAAATGGATGGTACTGAGGAATTATTGGTGAAACTAAATCGTGAAGATTTGCTGCGCAAGCAACGGACCTTTGACAACGGCTCTATTCCCCATCAAATTCACTTGGGTGAGCTGCATGCTATTTTGAGAAGACAAGAAGACTTTTATCCATTTTTAAAAGACAATCGTGAGAAGATTGAAAAAATCTTGACTTTTCGAATTCCTTATTATGTTGGTCCATTGGCGCGTGGCAATAGTCGTTTTGCATGGATGACTCGGAAGTCTGAAGAAACAATTACCCCATGGAATTTTGAAGAAGTTGTCGATAAAGGTGCTTCAGCTCAATCATTTATTGAACGCATGACAAACTTTGATAAAAATCTTCCAAATGAAAAAGTACTACCAAAACATAGTTTGCTTTATGAGTATTTTACGGTTTATAACGAATTGACAAAGGTCAAATATGTTACTGAGGGAATGCGAAAACCAGCATTTCTTTCAGGTGAACAGAAGAAAGCCATTGTTGATTTACTCTTCAAAACAAATCGAAAAGTAACCGTTAAGCAATTAAAAGAAGATTATTTCAAAAAAATAGAATGTTTTGATAGTGTTGAAATTTCAGGAGTTGAAGATAGATTTAATGCTTCATTAGGCGCCTACCATGATTTGCTAAAAATTATTAAAGATAAAGATTTTTTGGATAATGAAGAAAATGAAGATATCTTAGAGGATATTGTTTTAACATTGACCTTATTTGAAGATAGGGGGATGATTGAGGAAAGACTTAAAACATATGCTCACCTCTTTGATGATAAGGTGATGAAACAGCTTAAACGTCGCCGTTATACTGGTTGGGGACGTTTGTCTCGAAAATTGATTAATGGTATTAGGGATAAGCAATCTGGCAAAACAATATTAGATTTTTTGAAATCAGATGGTTTTGCCAATCGCAATTTTATGCAGCTGATCCATGATGATAGTTTGACATTTAAAGAAGATATTCAAAAAGCACAGGTGTCTGGACAAGGCCATAGTTTACATGAACAGATTGCTAACTTAGCTGGCAGTCCTGCTATTAAAAAAGGTATTTTACAGACTGTAAAAATTGTTGATGAACTGGTCAAAGTAATGGGGCATAAGCCAGAAAATATCGTTATTGAAATGGCACGTGAAAATCAGACAACTCAAAAGGGCCAGAAAAATTCGCGAGAGCGTATGAAACGAATCGAAGAAGGTATCAAAGAATTAGGAAGTCAGATTCTTAAAGAGCATCCTGTTGAAAATACTCAATTGCAAAATGAAAAGCTCTATCTCTATTATCTACAAAATGGAAGAGACATGTATGTGGACCAAGAATTAGATATTAATCGTTTAAGTGATTATGATGTCGATCACATTGTTCCACAAAGTTTCATTAAAGACGATTCAATAGACAATAAGGTACTAACGCGTTCTGATAAAAATCGTGGTAAATCGGATAACGTTCCAAGTGAAGAAGTAGTCAAAAAGATGAAAAACTATTGGAGACAACTTCTAAACGCCAAGTTAATCACTCAACGTAAGTTTGATAATTTAACGAAAGCTGAACGTGGAGGTTTGAGTGAACTTGATAAAGCTGGTTTTATCAAACGCCAATTGGTTGAAACTCGCCAAATCACTAAGCATGTGGCACAAATTTTGGATAGTCGCATGAATACTAAATACGATGAAAATGATAAACTTATTCGAGAGGTTAAAGTGATTACCTTAAAATCTAAATTAGTTTCTGACTTCCGAAAAGATTTCCAATTCTATAAAGTACGTGAGATTAACAATTACCATCATGCCCATGATGCGTATCTAAATGCCGTCGTTGGAACTGCTTTGATTAAGAAATATCCAAAACTTGAATCGGAGTTTGTCTATGGTGATTATAAAGTTTATGATGTTCGTAAAATGATTGCTAAGTCTGAGCAAGAAATAGGCAAAGCAACCGCAAAATATTTCTTTTACTCTAATATCATGAACTTCTTCAAAACAGAAATTACACTTGCAAATGGAGAGATTCGCAAACGCCCTCTAATCGAAACTAATGGGGAAACTGGAGAAATTGTCTGGGATAAAGGGCGAGATTTTGCCACAGTGCGCAAAGTATTGTCCATGCCCCAAGTCAATATTGTCAAGAAAACAGAAGTACAGACAGGCGGATTCTCCAAGGAGTCAATTTTACCAAAAAGAAATTCGGACAAGCTTATTGCTCGTAAAAAAGACTGGGATCCAAAAAAATATGGTGGTTTTGATAGTCCAACGGTAGCTTATTCAGTCCTAGTGGTTGCTAAGGTGGAAAAAGGGAAATCGAAGAAGTTAAAATCCGTTAAAGAGTTACTAGGGATCACAATTATGGAAAGAAGTTCCTTTGAAAAAAATCCGATTGACTTTTTAGAAGCTAAAGGATATAAGGAAGTTAAAAAAGACTTAATCATTAAACTACCTAAATATAGTCTTTTTGAGTTAGAAAACGGTCGTAAACGGATGCTGGCTAGTGCCGGAGAATTACAAAAAGGAAATGAGCTGGCTCTGCCAAGCAAATATGTGAATTTTTTATATTTAGCTAGTCATTATGAAAAGTTGAAGGGTAGTCCAGAAGATAACGAACAAAAACAATTGTTTGTGGAGCAGCATAAGCATTATTTAGATGAGATTATTGAGCAAATCAGTGAATTTTCTAAGCGTGTTATTTTAGCAGATGCCAATTTAGATAAAGTTCTTAGTGCATATAACAAACATAGAGACAAACCAATACGTGAACAAGCAGAAAATATTATTCATTTATTTACGTTGACGAATCTTGGAGCTCCCGCTGCTTTTAAATATTTTGATACAACAATTGATCGTAAACGATATACGTCTACAAAAGAAGTTTTAGATGCCACTCTTATCCATCAATCCATCACTGGTCTTTATGAAACACGCATTGATTTGAGTCAGCTAGGAGGTGACTGA
Figure 2022519882000010
(一重下線:HNHドメイン、二重下線:RuvCドメイン)
一部の実施形態では、野生型Cas9は、以下のヌクレオチドおよび/またはアミノ酸配列に対応する、またはそれを含む:
ATGGATAAAAAGTATTCTATTGGTTTAGACATCGGCACTAATTCCGTTGGATGGGCTGTCATAACCGATGAATACAAAGTACCTTCAAAGAAATTTAAGGTGTTGGGGAACACAGACCGTCATTCGATTAAAAAGAATCTTATCGGTGCCCTCCTATTCGATAGTGGCGAAACGGCAGAGGCGACTCGCCTGAAACGAACCGCTCGGAGAAGGTATACACGTCGCAAGAACCGAATATGTTACTTACAAGAAATTTTTAGCAATGAGATGGCCAAAGTTGACGATTCTTTCTTTCACCGTTTGGAAGAGTCCTTCCTTGTCGAAGAGGACAAGAAACATGAACGGCACCCCATCTTTGGAAACATAGTAGATGAGGTGGCATATCATGAAAAGTACCCAACGATTTATCACCTCAGAAAAAAGCTAGTTGACTCAACTGATAAAGCGGACCTGAGGTTAATCTACTTGGCTCTTGCCCATATGATAAAGTTCCGTGGGCACTTTCTCATTGAGGGTGATCTAAATCCGGACAACTCGGATGTCGACAAACTGTTCATCCAGTTAGTACAAACCTATAATCAGTTGTTTGAAGAGAACCCTATAAATGCAAGTGGCGTGGATGCGAAGGCTATTCTTAGCGCCCGCCTCTCTAAATCCCGACGGCTAGAAAACCTGATCGCACAATTACCCGGAGAGAAGAAAAATGGGTTGTTCGGTAACCTTATAGCGCTCTCACTAGGCCTGACACCAAATTTTAAGTCGAACTTCGACTTAGCTGAAGATGCCAAATTGCAGCTTAGTAAGGACACGTACGATGACGATCTCGACAATCTACTGGCACAAATTGGAGATCAGTATGCGGACTTATTTTTGGCTGCCAAAAACCTTAGCGATGCAATCCTCCTATCTGACATACTGAGAGTTAATACTGAGATTACCAAGGCGCCGTTATCCGCTTCAATGATCAAAAGGTACGATGAACATCACCAAGACTTGACACTTCTCAAGGCCCTAGTCCGTCAGCAACTGCCTGAGAAATATAAGGAAATATTCTTTGATCAGTCGAAAAACGGGTACGCAGGTTATATTGACGGCGGAGCGAGTCAAGAGGAATTCTACAAGTTTATCAAACCCATATTAGAGAAGATGGATGGGACGGAAGAGTTGCTTGTAAAACTCAATCGCGAAGATCTACTGCGAAAGCAGCGGACTTTCGACAACGGTAGCATTCCACATCAAATCCACTTAGGCGAATTGCATGCTATACTTAGAAGGCAGGAGGATTTTTATCCGTTCCTCAAAGACAATCGTGAAAAGATTGAGAAAATCCTAACCTTTCGCATACCTTACTATGTGGGACCCCTGGCCCGAGGGAACTCTCGGTTCGCATGGATGACAAGAAAGTCCGAAGAAACGATTACTCCATGGAATTTTGAGGAAGTTGTCGATAAAGGTGCGTCAGCTCAATCGTTCATCGAGAGGATGACCAACTTTGACAAGAATTTACCGAACGAAAAAGTATTGCCTAAGCACAGTTTACTTTACGAGTATTTCACAGTGTACAATGAACTCACGAAAGTTAAGTATGTCACTGAGGGCATGCGTAAACCCGCCTTTCTAAGCGGAGAACAGAAGAAAGCAATAGTAGATCTGTTATTCAAGACCAACCGCAAAGTGACAGTTAAGCAATTGAAAGAGGACTACTTTAAGAAAATTGAATGCTTCGATTCTGTCGAGATCTCCGGGGTAGAAGATCGATTTAATGCGTCACTTGGTACGTATCATGACCTCCTAAAGATAATTAAAGATAAGGACTTCCTGGATAACGAAGAGAATGAAGATATCTTAGAAGATATAGTGTTGACTCTTACCCTCTTTGAAGATCGGGAAATGATTGAGGAAAGACTAAAAACATACGCTCACCTGTTCGACGATAAGGTTATGAAACAGTTAAAGAGGCGTCGCTATACGGGCTGGGGACGATTGTCGCGGAAACTTATCAACGGGATAAGAGACAAGCAAAGTGGTAAAACTATTCTCGATTTTCTAAAGAGCGACGGCTTCGCCAATAGGAACTTTATGCAGCTGATCCATGATGACTCTTTAACCTTCAAAGAGGATATACAAAAGGCACAGGTTTCCGGACAAGGGGACTCATTGCACGAACATATTGCGAATCTTGCTGGTTCGCCAGCCATCAAAAAGGGCATACTCCAGACAGTCAAAGTAGTGGATGAGCTAGTTAAGGTCATGGGACGTCACAAACCGGAAAACATTGTAATCGAGATGGCACGCGAAAATCAAACGACTCAGAAGGGGCAAAAAAACAGTCGAGAGCGGATGAAGAGAATAGAAGAGGGTATTAAAGAACTGGGCAGCCAGATCTTAAAGGAGCATCCTGTGGAAAATACCCAATTGCAGAACGAGAAACTTTACCTCTATTACCTACAAAATGGAAGGGACATGTATGTTGATCAGGAACTGGACATAAACCGTTTATCTGATTACGACGTCGATCACATTGTACCCCAATCCTTTTTGAAGGACGATTCAATCGACAATAAAGTGCTTACACGCTCGGATAAGAACCGAGGGAAAAGTGACAATGTTCCAAGCGAGGAAGTCGTAAAGAAAATGAAGAACTATTGGCGGCAGCTCCTAAATGCGAAACTGATAACGCAAAGAAAGTTCGATAACTTAACTAAAGCTGAGAGGGGTGGCTTGTCTGAACTTGACAAGGCCGGATTTATTAAACGTCAGCTCGTGGAAACCCGCCAAATCACAAAGCATGTTGCACAGATACTAGATTCCCGAATGAATACGAAATACGACGAGAACGATAAGCTGATTCGGGAAGTCAAAGTAATCACTTTAAAGTCAAAATTGGTGTCGGACTTCAGAAAGGATTTTCAATTCTATAAAGTTAGGGAGATAAATAACTACCACCATGCGCACGACGCTTATCTTAATGCCGTCGTAGGGACCGCACTCATTAAGAAATACCCGAAGCTAGAAAGTGAGTTTGTGTATGGTGATTACAAAGTTTATGACGTCCGTAAGATGATCGCGAAAAGCGAACAGGAGATAGGCAAGGCTACAGCCAAATACTTCTTTTATTCTAACATTATGAATTTCTTTAAGACGGAAATCACTCTGGCAAACGGAGAGATACGCAAACGACCTTTAATTGAAACCAATGGGGAGACAGGTGAAATCGTATGGGATAAGGGCCGGGACTTCGCGACGGTGAGAAAAGTTTTGTCCATGCCCCAAGTCAACATAGTAAAGAAAACTGAGGTGCAGACCGGAGGGTTTTCAAAGGAATCGATTCTTCCAAAAAGGAATAGTGATAAGCTCATCGCTCGTAAAAAGGACTGGGACCCGAAAAAGTACGGTGGCTTCGATAGCCCTACAGTTGCCTATTCTGTCCTAGTAGTGGCAAAAGTTGAGAAGGGAAAATCCAAGAAACTGAAGTCAGTCAAAGAATTATTGGGGATAACGATTATGGAGCGCTCGTCTTTTGAAAAGAACCCCATCGACTTCCTTGAGGCGAAAGGTTACAAGGAAGTAAAAAAGGATCTCATAATTAAACTACCAAAGTATAGTCTGTTTGAGTTAGAAAATGGCCGAAAACGGATGTTGGCTAGCGCCGGAGAGCTTCAAAAGGGGAACGAACTCGCACTACCGTCTAAATACGTGAATTTCCTGTATTTAGCGTCCCATTACGAGAAGTTGAAAGGTTCACCTGAAGATAACGAACAGAAGCAACTTTTTGTTGAGCAGCACAAACATTATCTCGACGAAATCATAGAGCAAATTTCGGAATTCAGTAAGAGAGTCATCCTAGCTGATGCCAATCTGGACAAAGTATTAAGCGCATACAACAAGCACAGGGATAAACCCATACGTGAGCAGGCGGAAAATATTATCCATTTGTTTACTCTTACCAACCTCGGCGCTCCAGCCGCATTCAAGTATTTTGACACAACGATAGATCGCAAACGATACACTTCTACCAAGGAGGTGCTAGACGCGACACTGATTCACCAATCCATCACGGGATTATATGAAACTCGGATAGATTTGTCACAGCTTGGGGGTGACGGATCCCCCAAGAAGAAGAGGAAAGTCTCGAGCGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGGCTGCAGGA
Figure 2022519882000011
(一重下線:HNHドメイン、二重下線:RuvCドメイン)。
一部の実施形態では、野生型Cas9は、Streptococcus pyogenes由来のCas9に対応する(NCBI参照配列:NC_002737.2(ヌクレオチド配列は以下の通りである)およびUniprot参照配列:Q99ZW2(アミノ酸配列は以下の通りである)):
ATGGATAAGAAATACTCAATAGGCTTAGATATCGGCACAAATAGCGTCGGATGGGCGGTGATCACTGATGAATATAAGGTTCCGTCTAAAAAGTTCAAGGTTCTGGGAAATACAGACCGCCACAGTATCAAAAAAAATCTTATAGGGGCTCTTTTATTTGACAGTGGAGAGACAGCGGAAGCGACTCGTCTCAAACGGACAGCTCGTAGAAGGTATACACGTCGGAAGAATCGTATTTGTTATCTACAGGAGATTTTTTCAAATGAGATGGCGAAAGTAGATGATAGTTTCTTTCATCGACTTGAAGAGTCTTTTTTGGTGGAAGAAGACAAGAAGCATGAACGTCATCCTATTTTTGGAAATATAGTAGATGAAGTTGCTTATCATGAGAAATATCCAACTATCTATCATCTGCGAAAAAAATTGGTAGATTCTACTGATAAAGCGGATTTGCGCTTAATCTATTTGGCCTTAGCGCATATGATTAAGTTTCGTGGTCATTTTTTGATTGAGGGAGATTTAAATCCTGATAATAGTGATGTGGACAAACTATTTATCCAGTTGGTACAAACCTACAATCAATTATTTGAAGAAAACCCTATTAACGCAAGTGGAGTAGATGCTAAAGCGATTCTTTCTGCACGATTGAGTAAATCAAGACGATTAGAAAATCTCATTGCTCAGCTCCCCGGTGAGAAGAAAAATGGCTTATTTGGGAATCTCATTGCTTTGTCATTGGGTTTGACCCCTAATTTTAAATCAAATTTTGATTTGGCAGAAGATGCTAAATTACAGCTTTCAAAAGATACTTACGATGATGATTTAGATAATTTATTGGCGCAAATTGGAGATCAATATGCTGATTTGTTTTTGGCAGCTAAGAATTTATCAGATGCTATTTTACTTTCAGATATCCTAAGAGTAAATACTGAAATAACTAAGGCTCCCCTATCAGCTTCAATGATTAAACGCTACGATGAACATCATCAAGACTTGACTCTTTTAAAAGCTTTAGTTCGACAACAACTTCCAGAAAAGTATAAAGAAATCTTTTTTGATCAATCAAAAAACGGATATGCAGGTTATATTGATGGGGGAGCTAGCCAAGAAGAATTTTATAAATTTATCAAACCAATTTTAGAAAAAATGGATGGTACTGAGGAATTATTGGTGAAACTAAATCGTGAAGATTTGCTGCGCAAGCAACGGACCTTTGACAACGGCTCTATTCCCCATCAAATTCACTTGGGTGAGCTGCATGCTATTTTGAGAAGACAAGAAGACTTTTATCCATTTTTAAAAGACAATCGTGAGAAGATTGAAAAAATCTTGACTTTTCGAATTCCTTATTATGTTGGTCCATTGGCGCGTGGCAATAGTCGTTTTGCATGGATGACTCGGAAGTCTGAAGAAACAATTACCCCATGGAATTTTGAAGAAGTTGTCGATAAAGGTGCTTCAGCTCAATCATTTATTGAACGCATGACAAACTTTGATAAAAATCTTCCAAATGAAAAAGTACTACCAAAACATAGTTTGCTTTATGAGTATTTTACGGTTTATAACGAATTGACAAAGGTCAAATATGTTACTGAAGGAATGCGAAAACCAGCATTTCTTTCAGGTGAACAGAAGAAAGCCATTGTTGATTTACTCTTCAAAACAAATCGAAAAGTAACCGTTAAGCAATTAAAAGAAGATTATTTCAAAAAAATAGAATGTTTTGATAGTGTTGAAATTTCAGGAGTTGAAGATAGATTTAATGCTTCATTAGGTACCTACCATGATTTGCTAAAAATTATTAAAGATAAAGATTTTTTGGATAATGAAGAAAATGAAGATATCTTAGAGGATATTGTTTTAACATTGACCTTATTTGAAGATAGGGAGATGATTGAGGAAAGACTTAAAACATATGCTCACCTCTTTGATGATAAGGTGATGAAACAGCTTAAACGTCGCCGTTATACTGGTTGGGGACGTTTGTCTCGAAAATTGATTAATGGTATTAGGGATAAGCAATCTGGCAAAACAATATTAGATTTTTTGAAATCAGATGGTTTTGCCAATCGCAATTTTATGCAGCTGATCCATGATGATAGTTTGACATTTAAAGAAGACATTCAAAAAGCACAAGTGTCTGGACAAGGCGATAGTTTACATGAACATATTGCAAATTTAGCTGGTAGCCCTGCTATTAAAAAAGGTATTTTACAGACTGTAAAAGTTGTTGATGAATTGGTCAAAGTAATGGGGCGGCATAAGCCAGAAAATATCGTTATTGAAATGGCACGTGAAAATCAGACAACTCAAAAGGGCCAGAAAAATTCGCGAGAGCGTATGAAACGAATCGAAGAAGGTATCAAAGAATTAGGAAGTCAGATTCTTAAAGAGCATCCTGTTGAAAATACTCAATTGCAAAATGAAAAGCTCTATCTCTATTATCTCCAAAATGGAAGAGACATGTATGTGGACCAAGAATTAGATATTAATCGTTTAAGTGATTATGATGTCGATCACATTGTTCCACAAAGTTTCCTTAAAGACGATTCAATAGACAATAAGGTCTTAACGCGTTCTGATAAAAATCGTGGTAAATCGGATAACGTTCCAAGTGAAGAAGTAGTCAAAAAGATGAAAAACTATTGGAGACAACTTCTAAACGCCAAGTTAATCACTCAACGTAAGTTTGATAATTTAACGAAAGCTGAACGTGGAGGTTTGAGTGAACTTGATAAAGCTGGTTTTATCAAACGCCAATTGGTTGAAACTCGCCAAATCACTAAGCATGTGGCACAAATTTTGGATAGTCGCATGAATACTAAATACGATGAAAATGATAAACTTATTCGAGAGGTTAAAGTGATTACCTTAAAATCTAAATTAGTTTCTGACTTCCGAAAAGATTTCCAATTCTATAAAGTACGTGAGATTAACAATTACCATCATGCCCATGATGCGTATCTAAATGCCGTCGTTGGAACTGCTTTGATTAAGAAATATCCAAAACTTGAATCGGAGTTTGTCTATGGTGATTATAAAGTTTATGATGTTCGTAAAATGATTGCTAAGTCTGAGCAAGAAATAGGCAAAGCAACCGCAAAATATTTCTTTTACTCTAATATCATGAACTTCTTCAAAACAGAAATTACACTTGCAAATGGAGAGATTCGCAAACGCCCTCTAATCGAAACTAATGGGGAAACTGGAGAAATTGTCTGGGATAAAGGGCGAGATTTTGCCACAGTGCGCAAAGTATTGTCCATGCCCCAAGTCAATATTGTCAAGAAAACAGAAGTACAGACAGGCGGATTCTCCAAGGAGTCAATTTTACCAAAAAGAAATTCGGACAAGCTTATTGCTCGTAAAAAAGACTGGGATCCAAAAAAATATGGTGGTTTTGATAGTCCAACGGTAGCTTATTCAGTCCTAGTGGTTGCTAAGGTGGAAAAAGGGAAATCGAAGAAGTTAAAATCCGTTAAAGAGTTACTAGGGATCACAATTATGGAAAGAAGTTCCTTTGAAAAAAATCCGATTGACTTTTTAGAAGCTAAAGGATATAAGGAAGTTAAAAAAGACTTAATCATTAAACTACCTAAATATAGTCTTTTTGAGTTAGAAAACGGTCGTAAACGGATGCTGGCTAGTGCCGGAGAATTACAAAAAGGAAATGAGCTGGCTCTGCCAAGCAAATATGTGAATTTTTTATATTTAGCTAGTCATTATGAAAAGTTGAAGGGTAGTCCAGAAGATAACGAACAAAAACAATTGTTTGTGGAGCAGCATAAGCATTATTTAGATGAGATTATTGAGCAAATCAGTGAATTTTCTAAGCGTGTTATTTTAGCAGATGCCAATTTAGATAAAGTTCTTAGTGCATATAACAAACATAGAGACAAACCAATACGTGAACAAGCAGAAAATATTATTCATTTATTTACGTTGACGAATCTTGGAGCTCCCGCTGCTTTTAAATATTTTGATACAACAATTGATCGTAAACGATATACGTCTACAAAAGAAGTTTTAGATGCCACTCTTATCCATCAATCCATCACTGGTCTTTATGAAACACGCATTGATTTGAGTCAGCTAGGAGGTGACTGA
Figure 2022519882000012
(一重下線:HNHドメイン、二重下線:RuvCドメイン)
一部の実施形態では、Cas9は、Corynebacterium ulcerans(NCBI参照配列:NC_015683.1、NC_017317.1)、Corynebacterium diphtheria(NCBI参照配列:NC_016782.1、NC_016786.1)、Spiroplasma syrphidicola(NCBI参照配列:NC_021284.1)、Prevotella intermedia(NCBI参照配列:NC_017861.1)、Spiroplasma taiwanense(NCBI参照配列:NC_021846.1)、Streptococcus iniae(NCBI参照配列:NC_021314.1)、Belliella baltica(NCBI参照配列:NC_018010.1)、Psychroflexus torquisI(NCBI参照配列:NC_018721.1)、Streptococcus thermophilus(NCBI参照配列:YP_820832.1)、Listeria innocua(NCBI参照配列:NP_472073.1)、Campylobacter jejuni(NCBI参照配列:YP_002344900.1)、もしくはNeisseria meningitidis(NCBI参照配列:YP_002342100.1)由来のCas9、または任意の他の生物由来のCas9を指す。
そのバリアントおよびホモログを含めた追加のCas9タンパク質(例えば、ヌクレアーゼ不活性型Cas9(dCas9)、Cas9ニッカーゼ(nCas9)、またはヌクレアーゼ活性型Cas9)が本開示の範囲内にあることを理解されたい。例示的なCas9タンパク質としては、それだけには限定されないが、以下に提供するものが挙げられる。一部の実施形態では、Cas9タンパク質はヌクレアーゼ不活性型Cas9(dCas9)である。一部の実施形態では、Cas9タンパク質はCas9ニッカーゼ(nCas9)である。一部の実施形態では、Cas9タンパク質はヌクレアーゼ活性型Cas9である。
ある態様において、Cas9ドメインは、ヌクレアーゼ不活性Cas9ドメイン (dCas9) である。例えば、dCas9ドメインは、二本鎖核酸分子のいずれの鎖も切断することなく、二本鎖核酸分子に結合し得る(例えば、gRNA分子を介して)。いくつかの実施形態において、ヌクレアーゼ不活性dCas9ドメインは、本明細書中に記載されたアミノ酸配列のD10X突然変異およびH840X突然変異、または本明細書中に提供されたアミノ酸配列のいずれかにおける対応する突然変異を含み、Xは任意のアミノ酸変化である。いくつかの実施形態において、ヌクレアーゼ不活性dCas9ドメインは、本明細書に記載のアミノ酸配列のD10A突然変異およびH840A突然変異、または本明細書に記載のアミノ酸配列のいずれかにおける対応する突然変異を含む。一例として、ヌクレアーゼ不活性Cas9ドメインは、クローニングベクターpPlatTET-gRNA 2 (アクセス番号BAV54124)中に提供される以下のアミノ酸配列を含む:
例示的な触媒的に不活性なCas9(dCas9)のアミノ酸配列は以下の通りである:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
(例えばQi et al., “Repurposing CRISPR as an RNA-guided platform for sequence-specific control of gene expression.” Cell. 2013; 152(5):1173-83を参照、その全内容は参照により本明細書に組み込まれる)。
追加の適切なヌクレアーゼ不活性dCas9ドメインは、本開示および当分野における知識に基づいて当業者に明らかとなるであろうし、本開示の範囲内にある。そのような追加の例示的な適切なヌクレアーゼ不活性Cas9ドメインとしては、それだけには限定されないが、D10A/H840A、D10A/D839A/H840A、およびD10A/D839A/H840A/N863Aの突然変異ドメインが挙げられる(例えばPrashant et al., CAS9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering. Nature Biotechnology. 2013; 31(9): 833-838を参照、その全内容は参照により本明細書に組み込まれる)。
一部の実施形態では、Cas9ヌクレアーゼは不活性の(例えば不活性化させた)DNA切断ドメインを有する、すなわち、Cas9は、「nCas9」タンパク質(「ニッカーゼ」Cas9の意)として言及するニッカーゼである。ヌクレアーゼ不活性化Cas9タンパク質は、「dCas9」タンパク質(ヌクレアーゼ「不活性型(dead)」Cas9の意)または触媒的に不活性なCas9として互換性があるように言及され得る。不活性なDNA切断ドメインを有するCas9タンパク質(またはその断片)を作成する方法は知られている(例えば、Jinek et al., Science. 337:816-821(2012)、Qi et al., “Repurposing CRISPR as an RNA-Guided Platform for Sequence-Specific Control of Gene Expression” (2013) Cell. 28;152(5):1173-83を参照、これらの各々の全内容は参照により本明細書に組み込まれる)。例えば、Cas9のDNA切断ドメインは、2つのサブドメイン、すなわちHNHヌクレアーゼサブドメインおよびRuvC1サブドメインを含むことが知られている。HNHサブドメインはgRNAに相補的な鎖を切断する一方で、RuvC1サブドメインは非相補的な鎖を切断する。これらのサブドメイン内の突然変異は、Cas9のヌクレアーゼ活性をサイレンシングする場合がある。例えば、突然変異D10AおよびH840AはS. pyrogenes Cas9のヌクレアーゼ活性を完全に不活性化させる(Jinek et al., Science. 337:816-821(2012)、Qi et al., Cell. 28;152(5):1173-83 (2013))。
いくつかの実施形態において、dCas9ドメインは、本明細書に提供されるdCas9ドメインのいずれかに対して少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性を有するアミノ酸配列を含む。いくつかの実施形態において、Cas9ドメインは、本明細書に記載されるアミノ酸配列のいずれかと比較して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50またはそれ以上の突然変異を有するアミノ酸配列を含む。いくつかの実施形態において、Cas9ドメインは、本明細書に記載されたアミノ酸配列のいずれかと比較して、少なくとも10、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも150、少なくとも200、少なくとも250、少なくとも300、少なくとも350、少なくとも400、少なくとも500、少なくとも600、少なくとも700、少なくとも800、少なくとも900、少なくとも1000、少なくとも1100、または少なくとも1200の同一の連続したアミノ酸残基を有するアミノ酸配列を含む。
ある態様において、dCas9は、Cas9ヌクレアーゼ活性を不活性化する1以上の突然変異を有するCas9アミノ酸配列に対応するか、またはその一部もしくは全体を含む。例えば、いくつかの実施形態において、dCas9ドメインは、D10AおよびH840A突然変異または別のCas9における対応する突然変異を含む。
いくつかの実施形態において、dCas9は、dCas9 (D10AおよびH840A)のアミノ酸配列を含む:
Figure 2022519882000013
(一重下線:HNHドメイン;二重下線:RuvCドメイン)。
いくつかの実施形態において、Cas9ドメインはD10A突然変異を含み、一方、上記で提供したアミノ酸配列における位置840における残基、または本明細書で提供されるアミノ酸配列のいずれかにおける対応する位置における残基は、ヒスチジンのままである。
他の実施形態において、例えばヌクレアーゼ不活性化Cas9 (dCas9) をもたらす、D10AおよびH840A以外の突然変異を有するdCas9バリアントが提供される。このような突然変異は、例えば、D10およびH840における他のアミノ酸置換、またはCas9のヌクレアーゼドメイン内の他の置換(例えば、HNHヌクレアーゼサブドメインおよび/またはRuvC1サブドメインにおける置換)を含む。ある態様において、dCas9のバリアントまたはホモログであって、少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%の同一性を有するものが提供される。ある態様において、約5アミノ酸、約10アミノ酸、約15アミノ酸、約20アミノ酸、約25アミノ酸、約30アミノ酸、約40アミノ酸、約50アミノ酸、約75アミノ酸、約100アミノ酸またはそれ以上だけ短いまたは長いアミノ酸配列を有するdCas9のバリアントが提供される。
ある態様において、Cas9ドメインは、Cas9ニッカーゼである。Cas9ニッカーゼは、二本鎖核酸分子(例えば二本鎖DNA分子)の一方の鎖のみを切断することができるCas9タンパク質であり得る。いくつかの実施形態において、Cas9ニッカーゼは、二本鎖核酸分子の標的鎖を切断し、これは、Cas9ニッカーゼが、Cas9に結合しているgRNA(例えばsgRNA)と塩基対を形成している(相補的である)鎖を切断することを意味する。ある態様において、Cas9ニッカーゼは、D10A突然変異を含み、位置840にヒスチジンを有する。いくつかの実施形態において、Cas9ニッカーゼは、二本鎖核酸分子の非標的、非塩基編集鎖を切断し、これは、Cas9ニッカーゼが、Cas9に結合しているgRNA(例えばsgRNA)と塩基対を形成していない鎖を切断することを意味する。ある態様において、Cas9ニッカーゼは、H840A突然変異を含み位置10にアスパラギン酸残基を有するか、または対応する突然変異。いくつかの実施形態において、Cas9ニッカーゼは、本明細書に提供されるCas9ニッカーゼのいずれかと少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。さらなる適切なCas9ニッカーゼは、本開示および当該分野における知識に基づいて当業者に明らかであり、本開示の範囲内である。
例示的な触媒的Cas9ニッカーゼ (nCas9) のアミノ酸配列は、以下の通りである:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
ある態様において、Cas9は、単細胞原核微生物のドメインおよび界を構成する古細菌(例えばナノアーキア)由来のCas9を指す。ある態様において、核酸プログラミング可能なDNA結合タンパク質は、例えば、Burstein et al., "New CRISPR-Cas systems from uncultivated microbes." Cell Res. 2017 Feb 21. doi: 10.1038/cr.2017.21に記載されているCasXまたはCasYで示され、その全体の内容は参照により本明細書に組み込まれる。ゲノム分解メタゲノミクスを用いて、生命の古細菌ドメインにおいて最初に報告されたCas9を含め、多くのCRISPR‐Cas系が同定された。この分岐Cas9タンパク質は、ほとんど研究されていないナノアーキアにおいて、活性CRISPR‐Cas系の一部として発見された。細菌では、それまで知られていなかった2つの系、CRISPR-CasXとCRISPR-CasYが発見され、それらは、これまでに発見された中でも最もコンパクトな系に入る。いくつかの実施形態において、本明細書に記載される塩基エディターシステムにおいて、Cas9は、CasXまたはCasXのバリアントによって置き換えられる。いくつかの実施形態において、本明細書に記載される塩基エディターシステムにおいて、Cas9は、CasYまたはCasYのバリアントによって置き換えられる。核酸プログラム可能DNA結合タンパク質 (napDNAbp) として他のRNA誘導DNA結合タンパク質も使用され得、本開示の範囲内であることが理解されるべきである。
いくつかの実施形態において、本明細書で提供される融合タンパク質のいずれかの核酸プログラム可能DNA結合タンパク質 (napDNAbp) は、CasXまたはCasYタンパク質であり得る。いくつかの実施形態において、napDNAbpはCasXタンパク質である。いくつかの実施形態において、napDNAbpはCasYタンパク質である。いくつかの実施形態において、napDNAbpは、天然に存在するCasXまたはCasYタンパク質に対して少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性を有するアミノ酸配列を含む。いくつかの実施形態において、プログラミング可能なヌクレオチド結合タンパク質は、天然に存在するCasXまたはCasYタンパク質である。いくつかの実施形態において、プログラミング可能なヌクレオチド結合タンパク質は、本明細書に記載されるいずれかのCasXまたはCasYタンパク質に対して少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性を有するアミノ酸配列を含む。他の細菌種由来のCasXおよびCasYもまた、本開示に従って使用され得ることが理解されるべきである。
例示的なCasX ((uniprot.org/uniprot/F0NN87; uniprot.org/uniprot/F0NH53) tr|F0NN87|F0NN87_SULIHCRISPR-associatedCasx protein OS = Sulfolobus islandicus (strain HVE10/4) GN = SiH_0402 PE=4 SV=1) のアミノ酸配列は以下の通りである:
MEVPLYNIFGDNYIIQVATEAENSTIYNNKVEIDDEELRNVLNLAYKIAKNNEDAAAERRGKAKKKKGEEGETTTSNIILPLSGNDKNPWTETLKCYNFPTTVALSEVFKNFSQVKECEEVSAPSFVKPEFYEFGRSPGMVERTRRVKLEVEPHYLIIAAAGWVLTRLGKAKVSEGDYVGVNVFTPTRGILYSLIQNVNGIVPGIKPETAFGLWIARKVVSSVTNPNVSVVRIYTISDAVGQNPTTINGGFSIDLTKLLEKRYLLSERLEAIARNALSISSNMRERYIVLANYIYEYLTG SKRLEDLLYFANRDLIMNLNSDDGKVRDLKLISAYVNGELIRGEG.
例示的なCasX (>tr|F0NH53|F0NH53_SULIR CRISPR associated protein, Casx OS = Sulfolobus islandicus (strain REY15A) GN=SiRe_0771 PE=4 SV=1) のアミノ酸配列は以下の通りである:
MEVPLYNIFGDNYIIQVATEAENSTIYNNKVEIDDEELRNVLNLAYKIAKNNEDAAAERRGKAKKKKGEEGETTTSNIILPLSGNDKNPWTETLKCYNFPTTVALSEVFKNFSQVKECEEVSAPSFVKPEFYKFGRSPGMVERTRRVKLEVEPHYLIMAAAGWVLTRLGKAKVSEGDYVGVNVFTPTRGILYSLIQNVNGIVPGIKPETAFGLWIARKVVSSVTNPNVSVVSIYTISDAVGQNPTTINGGFSIDLTKLLEKRDLLSERLEAIARNALSISSNMRERYIVLANYIYEYLTGSKRLEDLLYFANRDLIMNLNSDDGKVRDLKLISAYVNGELIRGEG.
Deltaproteobacteria CasX
MEKRINKIRKKLSADNATKPVSRSGPMKTLLVRVMTDDLKKRLEKRRKKPEVMPQVISNNAANNLRMLLDDYTKMKEAILQVYWQEFKDDHVGLMCKFAQPASKKIDQNKLKPEMDEKGNLTTAGFACSQCGQPLFVYKLEQVSEKGKAYTNYFGRCNVAEHEKLILLAQLKPVKDSDEAVTYSLGKFGQRALDFYSIHVTKESTHPVKPLAQIAGNRYASGPVGKALSDACMGTIASFLSKYQDIIIEHQKVVKGNQKRLESLRELAGKENLEYPSVTLPPQPHTKEGVDfAYNEVIARVRMWVNLNLWQKLKLSRDDAKPLLRLKGFPSFPVVERRENEVDWWNTINEVKKLIDAKRDMGRVFWSGVTAEKRNTILEGYNYLPNENDHKKREGSLENPKKPAKRQFGDLLLYLEKKYAGDWGKVFDEAWERIDKKIAGLTSHIEREEARNAEDAQSKAVLTDWLRAKASFVLERLKEMDEKEFYACEIQLQKWYGDLRGNPFAVEAENRVVDISGFSIGSDGHSIQYRNLLAWKYLENGKREFYLLMNYGKKGRIRFTDGTDIKKSGKWQGLLYGGGKAKVIDLTFDPDDEQLIILPLAFGTRQGREFIWNDLLSLETGLIKLANGRVIEKTIYNKKIGRDEPALFVALTFERREVVDPSNIKPVNLIGVARGENIPAVIALTDPEGCPLPEFKDSSGGPTDILRIGEGYKEKQRAIQAAKEVEQRRAGGYSRKFASKSRNLADDMVRNSARDLFYHAVTHDAVLVFANLSRGFGRQGKRTFMTERQYTKMEDWLTAKLAYEGLTSKTYLSKTLAQYTSKTCSNCGFTITYADMDVMLVRLKKTSDGWATTLNNKELKAEYQITYYNRYKRQTVEKELSAELDRLSEESGNNDISKWTKGRRDEALFLLKKRFSHRPVQEQFVCLDCGHEVHAAEQAALNIARSWLFLNSNSTEFKSYKSGKQPFVGAWQAFYKRRLKEVWKPNA
例示的なCasY ((ncbi.nlm.nih.gov/protein/APG80656.1) >APG80656.1 CRISPR-associated protein CasY [uncultured Parcubacteria group bacterium]) のアミノ酸配列は以下の通りである:
MSKRHPRISGVKGYRLHAQRLEYTGKSGAMRTIKYPLYSSPSGGRTVPREIVSAINDDYVGLYGLSNFDDLYNAEKRNEEKVYSVLDFWYDCVQYGAVFSYTAPGLLKNVAEVRGGSYELTKTLKGSHLYDELQIDKVIKFLNKKEISRANGSLDKLKKDIIDCFKAEYRERHKDQCNKLADDIKNAKKDAGASLGERQKKLFRDFFGISEQSENDKPSFTNPLNLTCCLLPFDTVNNNRNRGEVLFNKLKEYAQKLDKNEGSLEMWEYIGIGNSGTAFSNFLGEGFLGRLRENKITELKKAMMDITDAWRGQEQEEELEKRLRILAALTIKLREPKFDNHWGGYRSDINGKLSSWLQNYINQTVKIKEDLKGHKKDLKKAKEMINRFGESDTKEEAVVSSLLESIEKIVPDDSADDEKPDIPAIAIYRRFLSDGRLTLNRFVQREDVQEALIKERLEAEKKKKPKKRKKKSDAEDEKETIDFKELFPHLAKPLKLVPNFYGDSKRELYKKYKNAAIYTDALWKAVEKIYKSAFSSSLKNSFFDTDFDKDFFIKRLQKIFSVYRRFNTDKWKPIVKNSFAPYCDIVSLAENEVLYKPKQSRSRKSAAIDKNRVRLPSTENIAKAGIALARELSVAGFDWKDLLKKEEHEEYIDLIELHKTALALLLAVTETQLDISALDFVENGTVKDFMKTRDGNLVLEGRFLEMFSQSIVFSELRGLAGLMSRKEFITRSAIQTMNGKQAELLYIPHEFQSAKITTPKEMSRAFLDLAPAEFATSLEPESLSEKSLLKLKQMRYYPHYFGYELTRTGQGIDGGVAENALRLEKSPVKKREIKCKQYKTLGRGQNKIVLYVRSSYYQTQFLEWFLHRPKNVQTDVAVSGSFLIDEKKVKTRWNYDALTVALEPVSGSERVFVSQPFTIFPEKSAEEEGQRYLGIDIGEYGIAYTALEITGDSAKILDQNFISDPQLKTLREEVKGLKLDQRRGTFAMPSTKIARIRESLVHSLRNRIHHLALKHKAKIVYELEVSRFEEGKQKIKKVYATLKKADVYSEIDADKNLQTTVWGKLAVASEISASYTSQFCGACKKLWRAEMQVDETITTQELIGTVRVIKGGTLIDAIKDFMRPPIFDENDTPFPKYRDFCDKHHISKKMRGNSCLFICPFCRANADADIQASQTIALLRYVKEEKKVEDYFERFRKLKNIKVLGQMKKI.
Cas9ヌクレアーゼは2つの機能的なエンドヌクレアーゼドメイン:RuvCおよびHNHを有する。Cas9は標的結合の際にコンホメーション変化を受け、これが、標的DNAの逆の鎖を切断するようにヌクレアーゼドメインを配置させる。Cas9媒介性DNA切断の最終結果は、標的DNA(約3~4個のヌクレオチドPAM配列の上流)内の二本鎖切断(DSB)である。その後、生じるDSBは、2つの一般的修復経路のうちの1つによって修復される:(1)効率的であるが誤りがちな非相同末端結合(NHEJ)経路、または(2)効率はより低いが高忠実度の相同組換え修復(HDR)経路。
非相同末端結合(NHEJ)および/または相同組換え修復(HDR)の「効率」は、任意の好都合な方法によって計算することができる。例えば、一部の実施形態では、効率は、成功したHDRの百分率の観点で表すことができる。例えば、検査用ヌクレアーゼアッセイを使用して切断産物を生成することができ、生成物対基質の比を使用して百分率を計算することができる。例えば、HDRが成功した結果新しく組み込まれた制限配列を含有するDNAを直接切断する、検査用ヌクレアーゼ酵素を使用することができる。より多くの切断された基質は、より高いパーセントHDR(より高いHDRの効率)を示す。例示的な例として、HDRの割合(百分率)は、以下の方程式を使用して計算することができる[(切断産物)/(基質+切断産物)](例えば、(b+c)/(a+b+c)、式中、「a」はDNA基質のバンド強度であり、「b」および「c」は切断産物である)。
一部の実施形態では、効率は、成功したNHEJの百分率の観点で表すことができる。例えば、T7エンドヌクレアーゼIアッセイを使用して切断産物を生成することができ、生成物対基質の比を使用してNHEJの百分率を計算することができる。T7エンドヌクレアーゼIは、野生型と突然変異体DNA鎖とのハイブリダイゼーションから生じるミスマッチのヘテロ二本鎖DNAを切断する(NHEJは元の切断部位に小さなランダムな挿入または欠失(インデル)を生じる)。より多くの切断は、より高いパーセントNHEJ(より高いNHEJの効率)を示す。例示的な例として、NHEJの割合(百分率)は、以下の方程式を使用して計算することができる:(1-(1-(b+c)/(a+b+c))1/2)×100、式中、「a」はDNA基質のバンド強度であり、「b」および「c」は切断産物である(Ran et. al., Cell. 2013 Sep. 12; 154(6):1380-9およびRan et al., Nat Protoc. 2013 Nov.; 8(11): 2281-2308)。
NHEJ修復経路は最も活性のある修復機構であり、DSB部位での小さなヌクレオチドの挿入または欠失(インデル)を頻繁に引き起こす。Cas9およびgRNAまたはガイドポリヌクレオチドを発現する細胞集団が突然変異の多様なアレイをもたらす可能性があるため、NHEJ媒介性DSB修復のランダム性は重要な実用的な意味を有する。一部の実施形態では、NHEJは標的DNA中に小さなインデルを生じさせ、その結果、標的遺伝子のオープンリーディングフレーム(ORF)内に未熟なストップコドンをもたらすアミノ酸の欠失、挿入、またはフレームシフト突然変異がもたらされる。理想的な最終結果は、標的遺伝子内の機能喪失型突然変異である。
NHEJ媒介性DSB修復はしばしば遺伝子のオープンリーディングフレームを破壊する一方で、相同組換え修復(HDR)は、単一ヌクレオチド変化からフルオロフォアまたはタグの付加などの大きな挿入までの範囲の、特異的ヌクレオチド変化を生成するために使用することができる。HDRを遺伝子編集に利用するために、所望の配列を含有するDNA修復鋳型を、gRNAおよびCas9またはCas9ニッカーゼと共に目的の細胞種内に送達することができる。修復鋳型は、所望の編集、ならびに追加の相同配列を標的のすぐ上流および下流(左および右の相同アームと呼ぶ)に含有することができる。それぞれの相同アームの長さは、導入する変化の大きさに依存する場合があり、より大きな挿入物はより長い相同アームを必要とする。修復鋳型は、一本鎖オリゴヌクレオチド、二本鎖オリゴヌクレオチド、または二本鎖DNAプラスミドであり得る。HDRの効率は、Cas9、gRNA、および外因性修復鋳型を発現する細胞においてさえも、一般に低い(修飾対立遺伝子の<10%)。HDRは細胞周期のSおよびG2期中に起こるため、HDRの効率は、細胞を同期させることによって増強させることができる。NHEJに関与している遺伝子を化学的または遺伝学的に阻害することも、HDRの頻度を増加させることができる。
一部の実施形態では、Cas9は修飾Cas9である。所定のgRNA標的化配列は、ゲノム全体にわたって、部分的な相同性が存在する追加の部位を有することができる。これらの部位はオフターゲットと呼ばれ、gRNAを設計する際には考慮する必要がある。gRNA設計の最適化に加えて、CRISPR特異性も、Cas9への修飾によって増加させることができる。Cas9は、2つのヌクレアーゼドメイン、RuvCおよびHNHの組み合わせた活性によって二本鎖切断(DSB)を生じる。SpCas9のD10A突然変異体であるCas9ニッカーゼは1つのヌクレアーゼドメインを保持し、DSBではなくDNAニックを生じる。また、特異的遺伝子編集のためにニッカーゼ系をHDR媒介性遺伝子編集と組み合わせることもできる。
一部の実施形態では、Cas9はバリアントCas9タンパク質である。バリアントCas9ポリペプチドは、野生型Cas9タンパク質のアミノ酸配列と比較した場合に1つのアミノ酸が異なる(例えば、1つの欠失、挿入、置換、融合を有する)アミノ酸配列を有する。一部の例では、バリアントCas9ポリペプチドは、Cas9ポリペプチドのヌクレアーゼ活性を低下させるアミノ酸変化(例えば、欠失、挿入、または置換)を有する。例えば、一部の例では、バリアントCas9ポリペプチドは、対応する野生型Cas9タンパク質のヌクレアーゼ活性の50%未満、40%未満、30%未満、20%未満、10%未満、5%未満、または1%未満を有する。一部の実施形態では、バリアントCas9タンパク質は実質的なヌクレアーゼ活性を有さない。対象Cas9タンパク質が実質的なヌクレアーゼ活性を有さないバリアントCas9タンパク質である場合、これは「dCas9」として言及することができる。
一部の実施形態では、バリアントCas9タンパク質は低下したヌクレアーゼ活性を有する。例えば、バリアントCas9タンパク質は、野生型Cas9タンパク質、例えば野生型Cas9タンパク質のエンドヌクレアーゼ活性の約20%未満、約15%未満、約10%未満、約5%未満、約1%未満、または約0.1%未満を示す。
一部の実施形態では、バリアントCas9タンパク質は、ガイド標的配列の相補鎖を切断することができるが、二本鎖ガイド標的配列の非相補鎖を切断する能力が低下している。例えば、バリアントCas9タンパク質は、RuvCドメインの機能を低下させる突然変異(アミノ酸置換)を有することができる。非限定的な例として、一部の実施形態では、バリアントCas9タンパク質は、D10A(アミノ酸位置10におけるアスパラギン酸からアラニン)を有し、したがって、二本鎖ガイド標的配列の相補鎖を切断することができるが、二本鎖ガイド標的配列の非相補鎖を切断する能力が低下している(したがって、バリアントCas9タンパク質が二本鎖標的核酸を切断する際に、二本鎖切断(DSB)の代わりに一本鎖切断(SSB)が生じる)(例えばJinek et al., Science. 2012 Aug. 17; 337(6096):816-21を参照)。
一部の実施形態では、バリアントCas9タンパク質は、二本鎖ガイド標的配列の非相補鎖を切断することができるが、ガイド標的配列の相補鎖を切断する能力が低下している。例えば、バリアントCas9タンパク質は、HNHドメイン(RuvC/HNH/RuvCドメインモチーフ)の機能を低下させる突然変異(アミノ酸置換)を有することができる。非限定的な例として、一部の実施形態では、バリアントCas9タンパク質は、H840A(アミノ酸位置840におけるヒスチジンからアラニン)突然変異を有し、したがってガイド標的配列の非相補鎖を切断することができるが、ガイド標的配列の相補鎖を切断する能力が低下している(したがって、バリアントCas9タンパク質が二本鎖ガイド標的配列を切断する際に、DSBの代わりにSSBが生じる)。そのようなCas9タンパク質は、ガイド標的配列(例えば一本鎖ガイド標的配列)を切断する能力が低下しているが、ガイド標的配列(例えば一本鎖ガイド標的配列)と結合する能力を保持している。
一部の実施形態では、バリアントCas9タンパク質は、二本鎖標的DNAの相補鎖および非相補鎖の両方を切断する能力が低下している。非限定的な例として、一部の実施形態では、バリアントCas9タンパク質は、D10AおよびH840Aの突然変異の両方を保有し、その結果、ポリペプチドは、二本鎖標的DNAの相補鎖および非相補鎖の両方を切断する能力が低下している。そのようなCas9タンパク質は、標的DNA(例えば一本鎖標的DNA)を切断する能力が低下しているが、標的DNA(例えば一本鎖標的DNA)と結合する能力を保持している。
別の非限定的な例として、一部の実施形態では、バリアントCas9タンパク質は、W476AおよびW1126Aの突然変異を保有し、その結果、ポリペプチドは、標的DNAを切断する能力が低下している。そのようなCas9タンパク質は、標的DNA(例えば一本鎖標的DNA)を切断する能力が低下しているが、標的DNA(例えば一本鎖標的DNA)と結合する能力を保持している。
別の非限定的な例として、一部の実施形態では、バリアントCas9タンパク質は、P475A、W476A、N477A、D1125A、W1126A、およびD1127Aの突然変異を保有し、その結果、ポリペプチドは、標的DNAを切断する能力が低下している。そのようなCas9タンパク質は、標的DNA(例えば一本鎖標的DNA)を切断する能力が低下しているが、標的DNA(例えば一本鎖標的DNA)と結合する能力を保持している。
別の非限定的な例として、一部の実施形態では、バリアントCas9タンパク質は、H840A、W476A、およびW1126Aの突然変異を保有し、その結果、ポリペプチドは、標的DNAを切断する能力が低下している。そのようなCas9タンパク質は、標的DNA(例えば一本鎖標的DNA)を切断する能力が低下しているが、標的DNA(例えば一本鎖標的DNA)と結合する能力を保持している。別の非限定的な例として、一部の実施形態では、バリアントCas9タンパク質は、H840A、D10A、W476A、およびW1126Aの突然変異を保有し、その結果、ポリペプチドは、標的DNAを切断する能力が低下している。そのようなCas9タンパク質は、標的DNA(例えば一本鎖標的DNA)を切断する能力が低下しているが、標的DNA(例えば一本鎖標的DNA)と結合する能力を保持している。一部の実施形態では、バリアントCas9は、Cas9 HNHドメインの位置840において修復された触媒的His残基を有する(A840H)。
別の非限定的な例として、一部の実施形態では、バリアントCas9タンパク質は、H840A、P475A、W476A、N477A、D1125A、W1126A、およびD1127Aの突然変異を保有し、その結果、ポリペプチドは、標的DNAを切断する能力が低下している。そのようなCas9タンパク質は、標的DNA(例えば一本鎖標的DNA)を切断する能力が低下しているが、標的DNA(例えば一本鎖標的DNA)と結合する能力を保持している。別の非限定的な例として、一部の実施形態では、バリアントCas9タンパク質は、D10A、H840A、P475A、W476A、N477A、D1125A、W1126A、およびD1127Aの突然変異を保有し、その結果、ポリペプチドは、標的DNAを切断する能力が低下している。そのようなCas9タンパク質は、標的DNA(例えば一本鎖標的DNA)を切断する能力が低下しているが、標的DNA(例えば一本鎖標的DNA)と結合する能力を保持している。一部の実施形態では、バリアントCas9タンパク質がW476AおよびW1126Aの突然変異を保有する場合、またはバリアントCas9タンパク質がP475A、W476A、N477A、D1125A、W1126A、およびD1127Aの突然変異を保有する場合、バリアントCas9タンパク質はPAM配列と効率的に結合しない。したがって、一部のそのような実施形態では、そのようなバリアントCas9タンパク質を結合の方法に使用する場合、この方法はPAM配列を必要としない。言い換えれば、一部の実施形態では、そのようなバリアントCas9タンパク質を結合の方法に使用する場合、この方法はガイドRNAを含むことができるが、この方法はPAM配列の非存在下で行うことができる(したがって、結合の特異性はガイドRNAの標的化セグメントによって提供される)。上記効果(すなわち、一方または他方のヌクレアーゼ部分を不活性化させる)を達成するために、他の残基を突然変異させることができる。非限定的な例として、残基D10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D986、および/またはA987を変更(すなわち置換)することができる。また、アラニン置換以外の突然変異が適切である。
一部の実施形態では、低下した触媒活性を有するバリアントCas9タンパク質(例えば、Cas9タンパク質がD10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D986、および/またはA987の突然変異、例えば、D10A、G12A、G17A、E762A、H840A、N854A、N863A、H982A、H983A、A984A、および/またはD986Aを有する場合)は、ガイドRNAと相互作用する能力を保持している限りは、バリアントCas9タンパク質は依然として部位特異的な様式で標的DNAと結合することができる(依然としてガイドRNAによって標的DNA配列へと誘導されるため)。
一部の実施形態では、バリアントCasタンパク質は、spCas9、spCas9-VRQR、spCas9-VRER、xCas9(sp)、saCas9、saCas9-KKH、spCas9-MQKSER、spCas9-LRKIQK、またはspCas9-LRVSQLであり得る。
一部の実施形態では、アミノ酸置換D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、およびT1337R(SpCas9-MQKFRAER)を含み、改変されたPAM5'-NGC-3'に対して特異性を有する修飾SpCas9を使用した。
S. pyrogenes Cas9の代替としては、哺乳動物細胞において切断活性を示すCpf1ファミリーからのRNA誘導エンドヌクレアーゼを挙げることができる。PrevotellaおよびFrancisella 1由来のCRISPR(CRISPR/Cpf1)は、CRISPR/Cas9系に類似のDNA編集技術である。Cpf1はクラスII CRISPR/Cas系のRNA誘導エンドヌクレアーゼである。この獲得免疫機構はPrevotellaおよびFrancisella細菌において見つかる。Cpf1遺伝子はCRISPR座位に関連しており、ウイルスDNAを探して切断するためにガイドRNAを使用するエンドヌクレアーゼをコードしている。Cpf1はCas9よりも小さく単純なエンドヌクレアーゼであり、CRISPR/Cas9系の制約の一部を克服している。Cas9ヌクレアーゼとは異なり、Cpf1媒介性DNA切断の結果は、短い3'オーバーハングを伴う二本鎖の切断である。Cpf1の互い違いの切断パターンは、従来の制限酵素クローニングに類似の指向性遺伝子移入の可能性を開くことができ、これは遺伝子編集の効率を増加させることができる。上述のCas9バリアントおよび相同分子種と同様、Cpf1は、CRISPRによって標的とされることができる部位の数を、SpCas9が好むNGG PAM部位を欠くATに富んだ領域またはATに富んだゲノムまで拡大することもできる。Cpf1座位は、混合アルファ/ベータドメイン、RuvC-I、続いてらせん領域、RuvC-II、およびジンクフィンガー様ドメインを含有する。Cpf1タンパク質は、Cas9のRuvCドメインに類似のRuvC様エンドヌクレアーゼドメインを有する。さらに、Cpf1はHNHエンドヌクレアーゼドメインを有さず、Cpf1のN末端はCas9のアルファヘリックス認識ローブを有さない。Cpf1 CRISPR-Casドメイン構造は、Cpf1が機能的にユニークであり、クラス2、V型CRISPR系として分類されることを示している。Cpf1座位は、II型系よりもI型およびIII型に類似のCas1、Cas2、およびCas4タンパク質をコードしている。機能的なCpf1はトランス活性化CRISPR RNA(tracrRNA)を必要とせず、したがって、CRISPR(crRNA)のみが必要である。Cpf1はCas9よりも小さいだけでなく、より小さなsgRNA分子(Cas9のヌクレオチドの数の約半分)を有するため、これはゲノム編集に有益である。Cas9によって標的とされるGに富んだPAMとは対照的に、Cpf1-crRNA複合体は、モチーフ5'-YTN-3'または5'-TTN-3'に隣接するプロトスペーサーの同定によって標的DNAまたはRNAを切断する。PAMの同定後、Cpf1は4または5個のヌクレオチドのオーバーハングを有する粘着末端様DNA二本鎖切断を導入する。
一部の実施形態では、Cas9は、改変されたPAM配列に対して特異性を有するCas9バリアントである。一部の実施形態では、追加のCas9バリアントおよびPAM配列はMiller, S.M., et al. Continuous evolution of SpCas9 variants compatible with non-G PAMs, Nat. Biotechnol. (2020)に記載されており、これはその全体で参照により本明細書に組み込まれる。一部の実施形態では、Cas9バリアントは特異性のPAM要件を有さない。一部の実施形態では、Cas9バリアント、例えばSpCas9バリアントは、NRNH PAM(式中、RはAまたはGであり、HはA、C、またはTである)に対して特異性を有する。一部の実施形態では、SpCas9バリアントは、PAM配列AAA、TAA、CAA、GAA、TAT、GAT、またはCACに対して特異性を有する。一部の実施形態では、SpCas9バリアントは、配列番号1における番号付けで位置1114、1134、1135、1137、1139、1151、1180、1188、1211、1218、1219、1221、1249、1256、1264、1290、1318、1317、1320、1321、1323、1332、1333、1335、1337、もしくは1339、またはその対応する位置に、アミノ酸置換を含む。一部の実施形態では、SpCas9バリアントは、配列番号1における番号付けで位置1114、1135、1218、1219、1221、1249、1320、1321、1323、1332、1333、1335、もしくは1337、またはその対応する位置に、アミノ酸置換を含む。一部の実施形態では、SpCas9バリアントは、配列番号1における番号付けで位置1114、1134、1135、1137、1139、1151、1180、1188、1211、1219、1221、1256、1264、1290、1318、1317、1320、1323、1333、またはその対応する位置に、アミノ酸置換を含む。一部の実施形態では、SpCas9バリアントは、配列番号1における番号付けで位置1114、1131、1135、1150、1156、1180、1191、1218、1219、1221、1227、1249、1253、1286、1293、1320、1321、1332、1335、1339、またはその対応する位置に、アミノ酸置換を含む。一部の実施形態では、SpCas9バリアントは、配列番号1における番号付けで位置1114、1127、1135、1180、1207、1219、1234、1286、1301、1332、1335、1337、1338、1349、またはその対応する位置に、アミノ酸置換を含む。SpCas9バリアントの例示的なアミノ酸置換およびPAM特異性を表1A~1Dに示す。
表1A
Figure 2022519882000014
表1B
Figure 2022519882000015
表1C
Figure 2022519882000016
表1D
Figure 2022519882000017
一部の実施形態では、Cas9はNeisseria menigitidis Cas9(NmeCas9)またはそのバリアントである。一部の実施形態では、NmeCas9は、NNNNGAYW PAM(式中、YはCまたはTであり、WはAまたはTである)に対して特異性を有する。一部の実施形態では、NmeCas9は、NNNNGYTT PAM(式中、YはCまたはTである)に対して特異性を有する。一部の実施形態では、NmeCas9は、NNNNGTCT PAMに対して特異性を有する。一部の実施形態では、NmeCas9はNme1 Cas9である。一部の実施形態では、NmeCas9は、NNNNGATT PAM、NNNNCCTA PAM、NNNNCCTC PAM、NNNNCCTT PAM、NNNNCCTG PAM、NNNNCCGT PAM、NNNNCCGGPAM、NNNNCCCA PAM、NNNNCCCT PAM、NNNNCCCC PAM、NNNNCCAT PAM、NNNNCCAG PAM、NNNNCCAT PAM、またはNNNGATT PAMに対して特異性を有する。一部の実施形態では、Nme1Cas9は、NNNNGATT PAM、NNNNCCTA PAM、NNNNCCTC PAM、NNNNCCTT PAM、またはNNNNCCTG PAMに対して特異性を有する。一部の実施形態では、NmeCas9は、CAA PAM、CAAA PAM、またはCCA PAMに対して特異性を有する。一部の実施形態では、NmeCas9はNme2 Cas9である。一部の実施形態では、NmeCas9は、NNNNCC(N4CC)PAM(式中、Nは、A、G、C、またはTのうちの任意の1つである)に対して特異性を有する。一部の実施形態では、NmeCas9は、NNNNCCGT PAM、NNNNCCGGPAM、NNNNCCCA PAM、NNNNCCCT PAM、NNNNCCCC PAM、NNNNCCAT PAM、NNNNCCAG PAM、NNNNCCAT PAM、またはNNNGATT PAMに対して特異性を有する。一部の実施形態では、NmeCas9はNme3Cas9である。一部の実施形態では、NmeCas9は、NNNNCAAA PAM、NNNNCC PAM、またはNNNNCNNN PAMに対して特異性を有する。Edraki et al. Mol. Cell. (2019) 73(4): 714-726に記載されている追加のNmeCas9特徴およびPAM配列は、その全体で参照により本明細書に組み込まれる。
Nme1Cas9の例示的なアミノ酸配列を以下に提供する:
II型CRISPR RNA誘導エンドヌクレアーゼCas9[Neisseria meningitidis]WP_002235162.1
1 maafkpnpin yilgldigia svgwamveid edenpiclid lgvrvferae vpktgdslam
61 arrlarsvrr ltrrrahrll rarrllkreg vlqaadfden glikslpntp wqlraaaldr
121 kltplewsav llhlikhrgy lsqrkneget adkelgallk gvadnahalq tgdfrtpael
181 alnkfekesg hirnqrgdys htfsrkdlqa elillfekqk efgnphvsgg lkegietllm
241 tqrpalsgda vqkmlghctf epaepkaakn tytaerfiwl tklnnlrile qgserpltdt
301 eratlmdepy rkskltyaqa rkllgledta ffkglrygkd naeastlmem kayhaisral
361 ekeglkdkks plnlspelqd eigtafslfk tdeditgrlk driqpeilea llkhisfdkf
421 vqislkalrr ivplmeqgkr ydeacaeiyg dhygkkntee kiylppipad eirnpvvlra
481 lsqarkving vvrrygspar ihietarevg ksfkdrkeie krqeenrkdr ekaaakfrey
541 fpnfvgepks kdilklrlye qqhgkclysg keinlgrlne kgyveidhal pfsrtwddsf
601 nnkvlvlgse nqnkgnqtpy eyfngkdnsr ewqefkarve tsrfprskkq rillqkfded
661 gfkernlndt ryvnrflcqf vadrmrltgk gkkrvfasng qitnllrgfw glrkvraend
721 rhhaldavvv acstvamqqk itrfvrykem nafdgktidk etgevlhqkt hfpqpweffa
781 qevmirvfgk pdgkpefeea dtpeklrtll aeklssrpea vheyvtplfv srapnrkmsg
841 qghmetvksa krldegvsvl rvpltqlklk dlekmvnrer epklyealka rleahkddpa
901 kafaepfyky dkagnrtqqv kavrveqvqk tgvwvrnhng iadnatmvrv dvfekgdkyy
961 lvpiyswqva kgilpdravv qgkdeedwql iddsfnfkfs lhpndlvevi tkkarmfgyf
1021 aschrgtgni nirihdldhk igkngilegi gvktalsfqk yqidelgkei rpcrlkkrpp
1081 vr
Nme2Cas9の例示的なアミノ酸配列を以下に提供する:
II型CRISPR RNA誘導エンドヌクレアーゼCas9[Neisseria meningitidis]WP_002230835.1
1 maafkpnpin yilgldigia svgwamveid eeenpirlid lgvrvferae vpktgdslam
61 arrlarsvrr ltrrrahrll rarrllkreg vlqaadfden glikslpntp wqlraaaldr
121 kltplewsav llhlikhrgy lsqrkneget adkelgallk gvannahalq tgdfrtpael
181 alnkfekesg hirnqrgdys htfsrkdlqa elillfekqk efgnphvsgg lkegietllm
241 tqrpalsgda vqkmlghctf epaepkaakn tytaerfiwl tklnnlrile qgserpltdt
301 eratlmdepy rkskltyaqa rkllgledta ffkglrygkd naeastlmem kayhaisral
361 ekeglkdkks plnlsselqd eigtafslfk tdeditgrlk drvqpeilea llkhisfdkf
421 vqislkalrr ivplmeqgkr ydeacaeiyg dhygkkntee kiylppipad eirnpvvlra
481 lsqarkving vvrrygspar ihietarevg ksfkdrkeie krqeenrkdr ekaaakfrey
541 fpnfvgepks kdilklrlye qqhgkclysg keinlvrlne kgyveidhal pfsrtwddsf
601 nnkvlvlgse nqnkgnqtpy eyfngkdnsr ewqefkarve tsrfprskkq rillqkfded
661 gfkecnlndt ryvnrflcqf vadhilltgk gkrrvfasng qitnllrgfw glrkvraend
721 rhhaldavvv acstvamqqk itrfvrykem nafdgktidk etgkvlhqkt hfpqpweffa
781 qevmirvfgk pdgkpefeea dtpeklrtll aeklssrpea vheyvtplfv srapnrkmsg
841 ahkdtlrsak rfvkhnekis vkrvwlteik ladlenmvny kngreielye alkarleayg
901 gnakqafdpk dnpfykkggq lvkavrvekt qesgvllnkk naytiadngd mvrvdvfckv
961 dkkgknqyfi vpiyawqvae nilpdidckg yriddsytfc fslhkydlia fqkdekskve
1021 fayyincdss ngrfylawhd kgskeqqfri stqnlvliqk yqvnelgkei rpcrlkkrpp
1081 vr
[核酸塩基エディターのCas12ドメイン]
典型的には、微生物CRISPR-Cas系はクラス1およびクラス2系に分けられる。クラス1系は多サブユニットエフェクター複合体を有する一方で、クラス2系は単一のタンパク質エフェクターを有する。例えば、Cas9およびCpf1はクラス2エフェクターではあるが、異なる型である(それぞれII型およびV型)。Cpf1に加えて、クラス2、V型CRISPR-Cas系もCas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、およびCas12iを含む。例えば、Shmakov et al., “Discovery and Functional Characterization of Diverse Class 2 CRISPR Cas Systems,” Mol. Cell, 2015 Nov. 5; 60(3): 385-397、Makarova et al., “Classification and Nomenclature of CRISPR-Cas Systems: Where from Here?” CRISPR Journal, 2018, 1(5): 325-336、およびYan et al., “Functionally Diverse Type V CRISPR-Cas Systems,” Science, 2019 Jan. 4; 363: 88-91を参照されたい(これらの各々の全内容は参照により本明細書に組み込まれる)。V型Casタンパク質はRuvC(またはRuvC様)エンドヌクレアーゼドメインを含有する。成熟CRISPR RNA(crRNA)の産生は一般にtracrRNA非依存性である一方で、例えばCas12b/C2c1は、crRNAの産生にtracrRNAを必要とする。Cas12b/C2c1はDNA切断のためにcrRNAおよびtracrRNAの両方に依存する。
本発明において企図される核酸プログラミング可能なDNA結合タンパク質としては、クラス2、V型(Cas12タンパク質)として分類されるCasタンパク質が挙げられる。Casクラス2、V型タンパク質の非限定的な例としては、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、およびCas12i、そのホモログ、またはその修飾バージョンが挙げられる。本明細書中で使用するCas12タンパク質は、Cas12ヌクレアーゼ、Cas12ドメイン、またはCas12タンパク質ドメインとしても言及することができる。一部の実施形態では、本発明のCas12タンパク質は、デアミナーゼドメインなどの内部融合されたタンパク質ドメインによって中断されたアミノ酸配列を含む。
一部の実施形態では、Cas12ドメインはヌクレアーゼ不活性なCas12ドメインまたはCas12ニッカーゼである。一部の実施形態では、Cas12ドメインはヌクレアーゼ活性型ドメインである。例えば、Cas12ドメインは、二本鎖核酸(例えば二本鎖DNA分子)の一方の鎖にニックを生成するCas12ドメインであり得る。一部の実施形態では、Cas12ドメインは、本明細書中に記載のアミノ酸配列のうちの任意の1つを含む。ある実施形態では、Cas12ドメインは、本明細書中に記載のアミノ酸配列のうちの任意の1つと少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。一部の実施形態では、Cas12ドメインは、本明細書中に記載のアミノ酸配列のうちの任意の1つと比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50個、またはそれより多くの突然変異を有するアミノ酸配列を含む。一部の実施形態では、Cas12ドメインは、本明細書中に記載のアミノ酸配列のうちの任意の1つと比較して、少なくとも10、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも150、少なくとも200、少なくとも250、少なくとも300、少なくとも350、少なくとも400、少なくとも500、少なくとも600、少なくとも700、少なくとも800、少なくとも900、少なくとも1000、少なくとも1100、または少なくとも1200個の同一の連続したアミノ酸残基を有するアミノ酸配列を含む。
一部の実施形態では、Cas12の断片を含むタンパク質を提供する。例えば、一部の実施形態では、タンパク質は、2つのCas12ドメイン:(1)Cas12のgRNA結合ドメインまたは(2)Cas12のDNA切断ドメインのうちの1つを含む。一部の実施形態では、Cas12またはその断片を含むタンパク質は「Cas12バリアント」として言及する。Cas12バリアントは、Cas12またはその断片と相同性を共有する。例えば、Cas12バリアントは、野生型Cas12と少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一である。一部の実施形態では、Cas12バリアントは、野生型Cas12と比較して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50個、またはそれより多くのアミノ酸変化を有し得る。一部の実施形態では、Cas12バリアントは、Cas12の断片(例えば、gRNA結合ドメインまたはDNA切断ドメイン)を含み、断片は、野生型Cas12の対応する断片と少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一である。一部の実施形態では、断片は、対応する野生型Cas12のアミノ酸長の少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%同一、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%である。一部の実施形態では、断片は少なくとも100個のアミノ酸の長さである。一部の実施形態では、断片は、少なくとも100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、または少なくとも1300個のアミノ酸の長さである。
一部の実施形態では、Cas12は、Cas12ヌクレアーゼ活性を改変する1つまたは複数の突然変異を有するCas12アミノ酸配列に対応する、またはその一部もしくは全体を含む。例として、そのような突然変異としては、Cas12のRuvCヌクレアーゼドメイン内のアミノ酸置換が挙げられる。一部の実施形態では、野生型Cas12と少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一である、Cas12のバリアントまたはホモログが提供される。一部の実施形態では、約5個のアミノ酸、約10個のアミノ酸、約15個のアミノ酸、約20個のアミノ酸、約25個のアミノ酸、約30個のアミノ酸、約40個のアミノ酸、約50個のアミノ酸、約75個のアミノ酸、約100個のアミノ酸、またはそれより多くのアミノ酸だけ短いまたは長いアミノ酸配列を有する、Cas12のバリアントを提供する。
一部の実施形態では、本明細書中に提供されるCas12融合タンパク質は、Cas12タンパク質完全長アミノ酸配列、例えば本明細書中に提供されるCas12配列のうちの1つを含む。しかし、他の実施形態では、本明細書中に提供される融合タンパク質は、完全長Cas12配列を含まず、1つまたは複数のその断片のみを含む。適切なCas12ドメインの例示的なアミノ酸配列が本明細書中に提供されており、Cas12ドメインおよび断片の追加の適切な配列は当業者に明らかであろう。
一般に、クラス2、V型Casタンパク質は単一の機能的なRuvCエンドヌクレアーゼドメインを有する(例えばChen et al., “CRISPR-Cas12a target binding unleashes indiscriminate single-stranded DNase activity,” Science 360:436-439 (2018)を参照)。一部の事例では、Cas12タンパク質はバリアントCas12bタンパク質である。(Strecker et al., Nature Communications, 2019, 10(1): Art. No.: 212を参照)。一実施形態では、バリアントCas12ポリペプチドは、野生型Cas12タンパク質のアミノ酸配列と比較した場合に1、2、3、4、5個、またはそれより多くのアミノ酸が異なる(例えば、欠失、挿入、置換、融合を有する)アミノ酸配列を有する。一部の例では、バリアントCas12ポリペプチドは、Cas12ポリペプチドの活性を低下させるアミノ酸変化(例えば、欠失、挿入、または置換)を有する。例えば、一部の例では、バリアントCas12は、対応する野生型Cas12bタンパク質のニッカーゼ活性の50%未満、40%未満、30%未満、20%未満、10%未満、5%未満、または1%未満を有するCas12bポリペプチドである。一部の事例では、バリアントCas12bタンパク質は実質的なニッカーゼ活性を有さない。
一部の事例では、バリアントCas12bタンパク質は低下したニッカーゼ活性を有する。例えば、バリアントCas12bタンパク質は、野生型Cas12bタンパク質のニッカーゼ活性の約20%未満、約15%未満、約10%未満、約5%未満、約1%未満、または約0.1%未満を示す。
一部の実施形態では、Cas12タンパク質としては、哺乳動物細胞において活性を示すCas12a/Cpf1ファミリーからのRNA誘導エンドヌクレアーゼが挙げられる。PrevotellaおよびFrancisella 1由来のCRISPR(CRISPR/Cpf1)は、CRISPR/Cas9系に類似のDNA編集技術である。Cpf1はクラスII CRISPR/Cas系のRNA誘導エンドヌクレアーゼである。この獲得免疫機構はPrevotellaおよびFrancisella細菌において見つかる。Cpf1遺伝子はCRISPR座位に関連しており、ウイルスDNAを探して切断するためにガイドRNAを使用するエンドヌクレアーゼをコードしている。Cpf1はCas9よりも小さく単純なエンドヌクレアーゼであり、CRISPR/Cas9系の制約の一部を克服している。Cas9ヌクレアーゼとは異なり、Cpf1媒介性DNA切断の結果は、短い3'オーバーハングを伴う二本鎖の切断である。Cpf1の互い違いの切断パターンは、従来の制限酵素クローニングに類似の指向性遺伝子移入の可能性を開くことができ、これは遺伝子編集の効率を増加させることができる。上述のCas9バリアントおよび相同分子種と同様、Cpf1は、CRISPRによって標的とされることができる部位の数を、SpCas9が好むNGG PAM部位を欠くATに富んだ領域またはATに富んだゲノムまで拡大することもできる。Cpf1座位は、混合アルファ/ベータドメイン、RuvC-I、続いてらせん領域、RuvC-II、およびジンクフィンガー様ドメインを含有する。Cpf1タンパク質は、Cas9のRuvCドメインに類似のRuvC様エンドヌクレアーゼドメインを有する。さらに、Cpf1は、Cas9とは異なり、HNHエンドヌクレアーゼドメインを有さず、Cpf1のN末端はCas9のアルファヘリックス認識ローブを有さない。Cpf1 CRISPR-Casドメイン構造は、Cpf1が機能的にユニークであり、クラス2、V型CRISPR系として分類されることを示している。Cpf1座位は、II型系よりもI型およびIII型に類似のCas1、Cas2、およびCas4タンパク質をコードしている。機能的なCpf1はトランス活性化CRISPR RNA(tracrRNA)を必要とせず、したがって、CRISPR(crRNA)のみが必要である。Cpf1はCas9よりも小さいだけでなく、より小さなsgRNA分子(Cas9のヌクレオチドの数の約半分)を有するため、これはゲノム編集に有益である。Cas9によって標的とされるGに富んだPAMとは対照的に、Cpf1-crRNA複合体は、モチーフ5'-YTN-3'または5'-TTTN-3'に隣接するプロトスペーサーの同定によって標的DNAまたはRNAを切断する。PAMの同定後、Cpf1は4または5個のヌクレオチドのオーバーハングを有する粘着末端様DNA二本鎖切断を導入する。
本発明の一部の態様では、突然変異させたCRISPR酵素が標的配列を含有する標的ポリヌクレオチドの一方または両方の鎖を切断する能力を欠失するように、対応する野生型酵素に対して突然変異させたCRISPR酵素をコードするベクターを使用することができる。Cas12は、野生型の例示的なCas12ポリペプチド(例えばBacillus hisashii由来のCas12)に対して少なくともまたは少なくともおよそ、50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性および/または配列相同性を有するポリペプチドを指すことができる。Cas12は、野生型の例示的なCas12ポリペプチド(例えば、Bacillus hisashii由来(BhCas12b)、Bacillus sp. V3-13由来(BvCas12b)、およびAlicyclobacillus acidiphilus由来(AaCas12b))に対して最大でまたは最大でおよそ、50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性および/または配列相同性を有するポリペプチドを指すことができる。Cas12は、野生型、または、欠失、挿入、置換、バリアント、突然変異、融合、キメラ、もしくはその任意の組合せなどのアミノ酸変化を含むことができる、Cas12タンパク質の修飾型を指すことができる。
[核酸プログラミング可能なDNA結合タンパク質]
本開示の一部の態様は、塩基エディターなどのタンパク質を特異的な核酸(例えばDNAまたはRNA)配列に誘導するために使用し得る、核酸プログラミング可能なDNA結合タンパク質として作用するドメインを含む融合タンパク質を提供する。特定の実施形態では、融合タンパク質は、核酸プログラミング可能なDNA結合タンパク質ドメインおよびデアミナーゼドメインを含む。核酸プログラミング可能なDNA結合タンパク質の非限定的な例としては、Cas9(例えばdCas9およびnCas9)、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、ならびにCas12iが挙げられる。Cas酵素の非限定的な例としては、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5d、Cas5t、Cas5h、Cas5a、Cas6、Cas7、Cas8、Cas8a、Cas8b、Cas8c、Cas9(Csn1もしくはCsx12としても知られる)、Cas10、Cas10d、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i、Csy1、Csy2、Csy3、Csy4、Cse1、Cse2、Cse3、Cse4、Cse5e、Csc1、Csc2、Csa5、Csn1、Csn2、Csm1、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx1S、Csx11、Csf1、Csf2、CsO、Csf4、Csd1、Csd2、Cst1、Cst2、Csh1、Csh2、Csa1、Csa2、Csa3、Csa4、Csa5、II型Casエフェクタータンパク質、V型Casエフェクタータンパク質、VI型Casエフェクタータンパク質、CARF、DinG、そのホモログ、またはその修飾もしくは操作されたバージョンが挙げられる。他の核酸プログラミング可能なDNA結合タンパク質も本開示の範囲内にあるが、本開示中に具体的に列挙されていない場合がある。例えば、Makarova et al. “Classification and Nomenclature of CRISPR-Cas Systems: Where from Here?” CRISPR J. 2018 Oct;1:325-336. doi: 10.1089/crispr.2018.0033、Yan et al., “Functionally diverse type V CRISPR-Cas systems” Science. 2019 Jan 4;363(6422):88-91. doi: 10.1126/science.aav7271を参照されたい(これらの各々の全内容は参照により本明細書に組み込まれる)。
Cas9とは異なるPAM特異性を有する核酸プログラミング可能なDNA結合タンパク質の一例は、PrevotellaおよびFrancisella 1由来のクラスター化された規則的に間隔の短い回文反復(Clustered Regularly Interspaced Short Palindromic Repeats)(Cpf1)である。Cas9と同様、Cpf1もクラス2CRISPRエフェクターである。Cpf1は、Cas9とは明白に異なる特徴を有する、頑強なDNA干渉を媒介することが示されている。Cpf1はtracrRNAを欠く単一RNA誘導エンドヌクレアーゼであり、Tに富んだプロトスペーサー隣接モチーフ(TTN、TTTN、またはYTN)を利用する。さらに、Cpf1は、互い違いのDNA二本鎖切断を介してDNAを切断する。16個のCpf1ファミリータンパク質のうち、AcidaminococcusおよびLachnospiraceae由来の2つの酵素が、ヒト細胞において効率的なゲノム編集活性を有することが示されている。Cpf1タンパク質は当技術分野で知られており、例えば以前にYamano et al., “Crystal structure of Cpf1 in complex with guide RNA and target DNA.” Cell (165) 2016, p. 949-962に記載されており、その全内容は参照により本明細書に組み込まれる。
ガイドヌクレオチド配列プログラミング可能なDNA結合タンパク質ドメインとして使用し得るヌクレアーゼ不活性Cpf1(dCpf1)バリアントが、本発明の組成物および方法において有用である。Cpf1タンパク質は、Cas9のRuvCドメインに類似のRuvC様エンドヌクレアーゼドメインを有するが、HNHエンドヌクレアーゼドメインを有さず、Cpf1のN末端はCas9のアルファヘリックス認識ローブを有さない。Zetsche et al., Cell, 163, 759-771, 2015(参照により本明細書に組み込まれる)において、Cpf1のRuvC様ドメインが両方のDNA鎖の切断を司っており、RuvC様ドメインの不活性化がCpf1ヌクレアーゼ活性を不活性化させることが示された。例えば、Francisella novicidaCpf1においてD917A、E1006A、またはD1255Aに対応する突然変異は、Cpf1ヌクレアーゼ活性を不活性化させる。一部の実施形態では、本開示のdCpf1は、D917A、E1006A、D1255A、D917A/E1006A、D917A/D1255A、E1006A/D1255A、またはD917A/E1006A/D1255Aに対応する突然変異を含む。Cpf1のRuvCドメインを不活性化させる任意の突然変異、例えば、置換突然変異、欠失、または挿入を、本開示に従って使用し得ることを理解されたい。
一部の実施形態では、本明細書中に提供される融合タンパク質のいずれかの核酸プログラミング可能なDNA結合タンパク質(napDNAbp)は、Cpf1タンパク質であり得る。一部の実施形態では、Cpf1タンパク質はCpf1ニッカーゼ(nCpf1)である。一部の実施形態では、Cpf1タンパク質はヌクレアーゼ不活性なCpf1(dCpf1)である。一部の実施形態では、Cpf1、nCpf1、またはdCpf1は、本明細書中に開示したCpf1配列と少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。一部の実施形態では、dCpf1は、本明細書中に開示したCpf1配列と少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含み、D917A、E1006A、D1255A、D917A/E1006A、D917A/D1255A、E1006A/D1255A、またはD917A/E1006A/D1255Aに対応する突然変異を含む。他の細菌種由来のCpf1も本開示に従って使用し得ることを理解されたい。
野生型Francisella novicidaCpf1(D917、E1006、およびD1255は太字で下線を引いている)
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIDRGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFEDLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDADANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN
Francisella novicidaCpf1 D917A(A917、E1006、およびD1255は太字で下線を引いている)
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIARGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFEDLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDADANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN
Francisella novicidaCpf1 E1006A(D917、A1006、およびD1255は太字で下線を引いている)
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIDRGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFADLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDADANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN
Francisella novicidaCpf1 D1255A(D917、E1006、およびA1255は太字で下線を引いている)
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIDRGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFEDLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDAAANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN
Francisella novicidaCpf1 D917A/E1006A(A917、A1006、およびD1255は太字で下線を引いている)
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIARGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFADLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDADANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN
Francisella novicidaCpf1 D917A/D1255A(A917、E1006、およびA1255は太字で下線を引いている)
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIARGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFEDLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDAAANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN
Francisella novicidaCpf1 E1006A/D1255A(D917、A1006、およびA1255は太字で下線を引いている)
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIDRGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFADLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDAAANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN
Francisella novicidaCpf1 D917A/E1006A/D1255A(A917、A1006、およびA1255は太字で下線を引いている)
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIARGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFADLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDAAANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN
一部の実施形態では、融合タンパク質中に存在するCas9ドメインのうちの1つを、PAM配列について要件のないガイドヌクレオチド配列プログラミング可能なDNA結合タンパク質ドメインで置き換えてもよい。
一部の実施形態では、Cas9ドメインは、Staphylococcus aureus由来のCas9ドメイン(SaCas9)である。一部の実施形態では、SaCas9ドメインは、ヌクレアーゼ活性型SaCas9、ヌクレアーゼ不活性なSaCas9(SaCas9d)、またはSaCas9ニッカーゼ(SaCas9n)である。一部の実施形態では、SaCas9は、N579A突然変異または本明細書中に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含む。
一部の実施形態では、SaCas9ドメイン、SaCas9dドメイン、またはSaCas9nドメインは、非カノニカルPAMを有する核酸配列と結合することができる。一部の実施形態では、SaCas9ドメイン、SaCas9dドメイン、またはSaCas9nドメインは、NNGRRTまたはNNGRRT PAM配列を有する核酸配列と結合することができる。一部の実施形態では、SaCas9ドメインは、E781X、N967X、およびR1014X突然変異のうちの1つもしくは複数、または本明細書中に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含む(式中、Xは任意のアミノ酸である)。一部の実施形態では、SaCas9ドメインは、E781K、N967K、およびR1014Hの突然変異のうちの1つもしくは複数、または本明細書中に提供されるアミノ酸配列のいずれかにおける1つもしくは複数の対応する突然変異を含む。一部の実施形態では、SaCas9ドメインは、E781K、N967K、もしくはR1014Hの突然変異、または本明細書中に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含む。
例示的なSaCas9配列
KRNYILGLDIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG
下線を引いた太字の上記残基N579を、(例えばA579に)突然変異させてSaCas9ニッカーゼを得てもよい。
例示的なSaCas9n配列
KRNYILGLDIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEEASKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG
N579から突然変異させてSaCas9ニッカーゼを得ることができる上記残基A579に、下線を引き太字にしている。
例示的なSaKKH Cas9
KRNYILGLDIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEEASKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRKLINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYKNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPHIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG
N579から突然変異させてSaCas9ニッカーゼを得ることができる上記残基A579は、下線を引き太字にしている。E781、N967、およびR1014から突然変異させてSaKKH Cas9を得ることができる上記残基K781、K967、およびH1014は、下線を引き斜体にしている。
一部の実施形態では、napDNAbpは循環置換体である。以下の配列中において、普通文字はアデノシンデアミナーゼ配列を示し、太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線を引いた配列は二部分核局在化配列を示す。
CP5(MSP「NGC」PIDおよび「D10A」ニッカーゼを有する):
Figure 2022519882000018
一部の実施形態では、核酸プログラミング可能なDNA結合タンパク質(napDNAbp)は、微生物CRISPR-Cas系の単一エフェクターである。微生物CRISPR-Cas系の単一エフェクターとしては、それだけには限定されないが、Cas9、Cpf1、Cas12b/C2c1、およびCas12c/C2c3が挙げられる。典型的には、微生物CRISPR-Cas系はクラス1およびクラス2系に分けられる。クラス1の系は多サブユニットエフェクター複合体をもち、クラス2の系は単一のタンパク質エフェクターをもつ。例えば、Cas9とCpf1はクラス2エフェクターである。Cas9およびCpf1に加えて、3つの異なるクラス2 CRISPR-Casシステム(Cas12b/C2c1およびCas12c/C2c3)がShmakov et al., “Discovery and Functional Characterization of Diverse Class 2 CRISPR Cas Systems”, Mol. Cell, 2015 Nov. 5; 60(3): 385-397によって記載されている(その全体の内容は参照により本明細書に組み込まれる) 。2つの系、Cas12b/C2c1とCas12c/C2c3のエフェクターはCpf1に関連するRuvC様エンドヌクレアーゼ領域を含む。第3の系は、2つの予測されるHEPN RNaseドメインをもつエフェクターを含む。Cas12b/C2c1によるCRISPR RNAの産生とは異なり、成熟CRISPR RNAの産生がtracrRNA非依存性である。Cas12b/C2c1はDNA切断にCRISPRRNAとtracrRNAの両方に依存する。
Alicyclobaccillus acidoterrastris Cas12b/C2c1 (AacC2c1) の結晶構造が、キメラ単一分子ガイドRNA (sgRNA) との複合体として報告されている。例えば、Liu et al., “C2c1-sgRNA Complex Structure Reveals RNA-Guided DNA Cleavage Mechanism”, Mol. Cell, 2017 Jan. 19; 65(2):310-322参照(その内容全体を参照により本明細書に組み込む) 。また、三元複合体として標的DNAに結合したAlicyclobacillus acidoterrestris C2c1においても結晶構造が報告されている。例えば、Yang et al., “PAM-dependent Target DNA Recognition and Cleavage by C2C1 CRISPR-Cas endonuclease”, Cell, 2016 Dec. 15; 167(7):1814-1828参照(その内容全体が参照により本明細書に組み込まれる)。標的DNA鎖および非標的DNA鎖の両方と共に、AacC2c1の触媒的にコンピテントな立体配座は、1つのRuvC触媒ポケット内に独立して捕捉され、Cas12b/C2c1媒介切断は標的DNAのスタガード7ヌクレオチドの切断を生じる。Cas 12b/C2c1三元複合体と以前に同定されたCas9およびCpf1対応物の間の構造比較は、 CRISPR‐Cas9システムにより使用される機構の多様性を示す。
いくつかの実施形態において、本明細書で提供される融合タンパク質のいずれかの核酸プログラム可能DNA結合タンパク質 (napDNAbp) は、Cas12b/C2c1またはCas12c/C2c3タンパク質であり得る。いくつかの実施形態において、napDNAbpはCas12b/C2c1タンパク質である。いくつかの実施形態において、napDNAbpはCas12c/C2c3タンパク質である。いくつかの実施形態において、napDNAbpは、天然に存在するCas12b/C2c1またはCas12c/C2c3タンパク質に対して少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性を有するアミノ酸配列を含む。いくつかの実施形態において、napDNAbpは、天然に存在するCas12b/C2c1またはCas12c/C2c3タンパク質である。いくつかの実施形態において、napDNAbpは、本明細書に提供されるnapDNAbp配列のいずれかに対して少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性を有するアミノ酸配列を含む。他の細菌種由来のCas12b/C2c1またはCas12c/C2c3も本開示に従って使用することができることが理解されるべきである。
Cas12b/C2c1 ((uniprot.org/uniprot/T0D7A2#2) sp|T0D7A2|C2C1_ALIAG CRISPR-associated endonuclease C2c1 OS = Alicyclobacillus acido-terrestris (strain ATCC 49025 / DSM 3922/ CIP 106132 / NCIMB 13137/GD3B) GN=c2c1 PE=1 SV=1) のアミノ酸配列は以下の通りである:
MAVKSIKVKLRLDDMPEIRAGLWKLHKEVNAGVRYYTEWLSLLRQENLYRRSPNGDGEQECDKTAEECKAELLERLRARQVENGHRGPAGSDDELLQLARQLYELLVPQAIGAKGDAQQIARKFLSPLADKDAVGGLGIAKAGNKPRWVRMREAGEPGWEEEKEKAETRKSADRTADVLRALADFGLKPLMRVYTDSEMSSVEWKPLRKGQAVRTWDRDMFQQAIERMMSWESWNQRVGQEYAKLVEQKNRFEQKNFVGQEHLVHLVNQLQQDMKEASPGLESKEQTAHYVTGRALRGSDKVFEKWGKLAPDAPFDLYDAEIKNVQRRNTRRFGSHDLFAKLAEPEYQALWREDASFLTRYAVYNSILRKLNHAKMFATFTLPDATAHPIWTRFDKLGGNLHQYTFLFNEFGERRHAIRFHKLLKVENGVAREVDDVTVPISMSEQLDNLLPRDPNEPIALYFRDYGAEQHFTGEFGGAKIQCRRDQLAHMHRRRGARDVYLNVSVRVQSQSEARGERRPPYAAVFRLVGDNHRAFVHFDKLSDYLAEHPDDGKLGSEGLLSGLRVMSVDLGLRTSASISVFRVARKDELKPNSKGRVPFFFPIKGNDNLVAVHERSQLLKLPGETESKDLRAIREERQRTLRQLRTQLAYLRLLVRCGSEDVGRRERSWAKLIEQPVDAANHMTPDWREAFENELQKLKSLHGICSDKEWMDAVYESVRRVWRHMGKQVRDWRKDVRSGERPKIRGYAKDVVGGNSIEQIEYLERQYKFLKSWSFFGKVSGQVIRAEKGSRFAITLREHIDHAKEDRLKKLADRIIMEALGYVYALDERGKGKWVAKYPPCQLILLEELSEYQFNNDRPPSENNQLMQWSHRGVFQELINQAQVHDLLVGTMYAAFSSRFDARTGAPGIRCRRVPARCTQEHNPEPFPWWLNKFVVEHTLDACPLRADDLIPTGEGEIFVSPFSAEEGDFHQIHADLNAAQNLQQRLWSDFDISQIRLRCDWGEVDGELVLIPRLTGKRTADSYSNKVFYTNTGVTYYERERGKKRRKVFAQEKLSEEEAELLVEADEAREKSVVLMRDPSGIINRGNWTRQKEFWSMV NQRIEGYLVKQIRSRVPLQDSACENTGDI
AacCas12b(Alicyclobacillus acidiphilus)-WP_067623834
MAVKSMKVKLRLDNMPEIRAGLWKLHTEVNAGVRYYTEWLSLLRQENLYRRSPNGDGEQECYKTAEECKAELLERLRARQVENGHCGPAGSDDELLQLARQLYELLVPQAIGAKGDAQQIARKFLSPLADKDAVGGLGIAKAGNKPRWVRMREAGEPGWEEEKAKAEARKSTDRTADVLRALADFGLKPLMRVYTDSDMSSVQWKPLRKGQAVRTWDRDMFQQAIERMMSWESWNQRVGEAYAKLVEQKSRFEQKNFVGQEHLVQLVNQLQQDMKEASHGLESKEQTAHYLTGRALRGSDKVFEKWEKLDPDAPFDLYDTEIKNVQRRNTRRFGSHDLFAKLAEPKYQALWREDASFLTRYAVYNSIVRKLNHAKMFATFTLPDATAHPIWTRFDKLGGNLHQYTFLFNEFGEGRHAIRFQKLLTVEDGVAKEVDDVTVPISMSAQLDDLLPRDPHELVALYFQDYGAEQHLAGEFGGAKIQYRRDQLNHLHARRGARDVYLNLSVRVQSQSEARGERRPPYAAVFRLVGDNHRAFVHFDKLSDYLAEHPDDGKLGSEGLLSGLRVMSVDLGLRTSASISVFRVARKDELKPNSEGRVPFCFPIEGNENLVAVHERSQLLKLPGETESKDLRAIREERQRTLRQLRTQLAYLRLLVRCGSEDVGRRERSWAKLIEQPMDANQMTPDWREAFEDELQKLKSLYGICGDREWTEAVYESVRRVWRHMGKQVRDWRKDVRSGERPKIRGYQKDVVGGNSIEQIEYLERQYKFLKSWSFFGKVSGQVIRAEKGSRFAITLREHIDHAKEDRLKKLADRIIMEALGYVYALDDERGKGKWVAKYPPCQLILLEELSEYQFNNDRPPSENNQLMQWSHRGVFQELLNQAQVHDLLVGTMYAAFSSRFDARTGAPGIRCRRVPARCAREQNPEPFPWWLNKFVAEHKLDGCPLRADDLIPTGEGEFFVSPFSAEEGDFHQIHADLNAAQNLQRRLWSDFDISQIRLRCDWGEVDGEPVLIPRTTGKRTADSYGNKVFYTKTGVTYYERERGKKRRKVFAQEELSEEEAELLVEADEAREKSVVLMRDPSGIINRGDWTRQKEFWSMVNQRIEGYLVKQIRSRVRLQESACENTGDI
BhCas12b (Bacillus hisashii) NCBI Reference Sequence: WP_095142515
MAPKKKRKVGIHGVPAAATRSFILKIEPNEEVKKGLWKTHEVLNHGIAYYMNILKLIRQEAIYEHHEQDPKNPKKVSKAEIQAELWDFVLKMQKCNSFTHEVDKDEVFNILRELYEELVPSSVEKKGEANQLSNKFLYPLVDPNSQSGKGTASSGRKPRWYNLKIAGDPSWEEEKKKWEEDKKKDPLAKILGKLAEYGLIPLFIPYTDSNEPIVKEIKWMEKSRNQSVRRLDKDMFIQALERFLSWESWNLKVKEEYEKVEKEYKTLEERIKEDIQALKALEQYEKERQEQLLRDTLNTNEYRLSKRGLRGWREIIQKWLKMDENEPSEKYLEVFKDYQRKHPREAGDYSVYEFLSKKENHFIWRNHPEYPYLYATFCEIDKKKKDAKQQATFTLADPINHPLWVRFEERSGSNLNKYRILTEQLHTEKLKKKLTVQLDRLIYPTESGGWEEKGKVDIVLLPSRQFYNQIFLDIEEKGKHAFTYKDESIKFPLKGTLGGARVQFDRDHLRRYPHKVESGNVGRIYFNMTVNIEPTESPVSKSLKIHRDDFPKVVNFKPKELTEWIKDSKGKKLKSGIESLEIGLRVMSIDLGQRQAAAASIFEVVDQKPDIEGKLFFPIKGTELYAVHRASFNIKLPGETLVKSREVLRKAREDNLKLMNQKLNFLRNVLHFQQFEDITEREKRVTKWISRQENSDVPLVYQDELIQIRELMYKPYKDWVAFLKQLHKRLEVEIGKEVKHWRKSLSDGRKGLYGISLKNIDEIDRTRKFLLRWSLRPTEPGEVRRLEPGQRFAIDQLNHLNALKEDRLKKMANTIIMHALGYCYDVRKKKWQAKNPACQIILFEDLSNYNPYEERSRFENSKLMKWSRREIPRQVALQGEIYGLQVGEVGAQFSSRFHAKTGSPGIRCSVVTKEKLQDNRFFKNLQREGRLTLDKIAVLKEGDLYPDKGGEKFISLSKDRKCVTTHADINAAQNLQKRFWTRTHGFYKVYCKAYQVDGQTVYIPESKDQKQKIIEEFGEGYFILKDGVYEWVNAGKLKIKKGSSKQSSSELVDSDILKDSFDLASELKGEKLMLYRDPSGNVFPSDKWMAAGVFFGKLERILISKLTNQYSISTIEDDSSKQSMKRPAATKKAGQAKKKK
BvCas12b V4(上記野生型と比較してS893R/K846R/E837Gの変化)と呼ばれるバリアントを含む。BhCas12b(V4)は以下のように表される:5'mRNA Cap---5'UTR---bhCas12b---STOP配列---3'UTR---120個のポリAテイル 5'UTR: GGGAAATAAGAGAGAAAAGAAGAGTAAGAAGAAATATAAGAGCCACC
3'UTR(TriLink標準UTR)
GCTGGAGCCTCGGTGGCCATGCTTCTTGCCCCTTGGGCCTCCCCCCAGCCCCTCCTCCCCTTCCTGCACCCGTACCCCCGTGGTCTTTGAATAAAGTCTGA
bhCas12b(V4)の核酸配列
ATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCCGCCACCAGATCCTTCATCCTGAAGATCGAGCCCAACGAGGAAGTGAAGAAAGGCCTCTGGAAAACCCACGAGGTGCTGAACCACGGAATCGCCTACTACATGAATATCCTGAAGCTGATCCGGCAAGAGGCCATCTACGAGCACCACGAGCAGGACCCCAAGAATCCCAAGAAGGTGTCCAAGGCCGAGATCCAGGCCGAGCTGTGGGATTTCGTGCTGAAGATGCAGAAGTGCAACAGCTTCACACACGAGGTGGACAAGGACGAGGTGTTCAACATCCTGAGAGAGCTGTACGAGGAACTGGTGCCCAGCAGCGTGGAAAAGAAGGGCGAAGCCAACCAGCTGAGCAACAAGTTTCTGTACCCTCTGGTGGACCCCAACAGCCAGTCTGGAAAGGGAACAGCCAGCAGCGGCAGAAAGCCCAGATGGTACAACCTGAAGATTGCCGGCGATCCCTCCTGGGAAGAAGAGAAGAAGAAGTGGGAAGAAGATAAGAAAAAGGACCCGCTGGCCAAGATCCTGGGCAAGCTGGCTGAGTACGGACTGATCCCTCTGTTCATCCCCTACACCGACAGCAACGAGCCCATCGTGAAAGAAATCAAGTGGATGGAAAAGTCCCGGAACCAGAGCGTGCGGCGGCTGGATAAGGACATGTTCATTCAGGCCCTGGAACGGTTCCTGAGCTGGGAGAGCTGGAACCTGAAAGTGAAAGAGGAATACGAGAAGGTCGAGAAAGAGTACAAGACCCTGGAAGAGAGGATCAAAGAGGACATCCAGGCTCTGAAGGCTCTGGAACAGTATGAGAAAGAGCGGCAAGAACAGCTGCTGCGGGACACCCTGAACACCAACGAGTACCGGCTGAGCAAGAGAGGCCTTAGAGGCTGGCGGGAAATCATCCAGAAATGGCTGAAAATGGACGAGAACGAGCCCTCCGAGAAGTACCTGGAAGTGTTCAAGGACTACCAGCGGAAGCACCCTAGAGAGGCCGGCGATTACAGCGTGTACGAGTTCCTGTCCAAGAAAGAGAACCACTTCATCTGGCGGAATCACCCTGAGTACCCCTACCTGTACGCCACCTTCTGCGAGATCGACAAGAAAAAGAAGGACGCCAAGCAGCAGGCCACCTTCACACTGGCCGATCCTATCAATCACCCTCTGTGGGTCCGATTCGAGGAAAGAAGCGGCAGCAACCTGAACAAGTACAGAATCCTGACCGAGCAGCTGCACACCGAGAAGCTGAAGAAAAAGCTGACAGTGCAGCTGGACCGGCTGATCTACCCTACAGAATCTGGCGGCTGGGAAGAGAAGGGCAAAGTGGACATTGTGCTGCTGCCCAGCCGGCAGTTCTACAACCAGATCTTCCTGGACATCGAGGAAAAGGGCAAGCACGCCTTCACCTACAAGGATGAGAGCATCAAGTTCCCTCTGAAGGGCACACTCGGCGGAGCCAGAGTGCAGTTCGACAGAGATCACCTGAGAAGATACCCTCACAAGGTGGAAAGCGGCAACGTGGGCAGAATCTACTTCAACATGACCGTGAACATCGAGCCTACAGAGTCCCCAGTGTCCAAGTCTCTGAAGATCCACCGGGACGACTTCCCCAAGGTGGTCAACTTCAAGCCCAAAGAACTGACCGAGTGGATCAAGGACAGCAAGGGCAAGAAACTGAAGTCCGGCATCGAGTCCCTGGAAATCGGCCTGAGAGTGATGAGCATCGACCTGGGACAGAGACAGGCCGCTGCCGCCTCTATTTTCGAGGTGGTGGATCAGAAGCCCGACATCGAAGGCAAGCTGTTTTTCCCAATCAAGGGCACCGAGCTGTATGCCGTGCACAGAGCCAGCTTCAACATCAAGCTGCCCGGCGAGACACTGGTCAAGAGCAGAGAAGTGCTGCGGAAGGCCAGAGAGGACAATCTGAAACTGATGAACCAGAAGCTCAACTTCCTGCGGAACGTGCTGCACTTCCAGCAGTTCGAGGACATCACCGAGAGAGAGAAGCGGGTCACCAAGTGGATCAGCAGACAAGAGAACAGCGACGTGCCCCTGGTGTACCAGGATGAGCTGATCCAGATCCGCGAGCTGATGTACAAGCCTTACAAGGACTGGGTCGCCTTCCTGAAGCAGCTCCACAAGAGACTGGAAGTCGAGATCGGCAAAGAAGTGAAGCACTGGCGGAAGTCCCTGAGCGACGGAAGAAAGGGCCTGTACGGCATCTCCCTGAAGAACATCGACGAGATCGATCGGACCCGGAAGTTCCTGCTGAGATGGTCCCTGAGGCCTACCGAACCTGGCGAAGTGCGTAGACTGGAACCCGGCCAGAGATTCGCCATCGACCAGCTGAATCACCTGAACGCCCTGAAAGAAGATCGGCTGAAGAAGATGGCCAACACCATCATCATGCACGCCCTGGGCTACTGCTACGACGTGCGGAAGAAGAAATGGCAGGCTAAGAACCCCGCCTGCCAGATCATCCTGTTCGAGGATCTGAGCAACTACAACCCCTACGAGGAAAGGTCCCGCTTCGAGAACAGCAAGCTCATGAAGTGGTCCAGACGCGAGATCCCCAGACAGGTTGCACTGCAGGGCGAGATCTATGGCCTGCAAGTGGGAGAAGTGGGCGCTCAGTTCAGCAGCAGATTCCACGCCAAGACAGGCAGCCCTGGCATCAGATGTAGCGTCGTGACCAAAGAGAAGCTGCAGGACAATCGGTTCTTCAAGAATCTGCAGAGAGAGGGCAGACTGACCCTGGACAAAATCGCCGTGCTGAAAGAGGGCGATCTGTACCCAGACAAAGGCGGCGAGAAGTTCATCAGCCTGAGCAAGGATCGGAAGTGCGTGACCACACACGCCGACATCAACGCCGCTCAGAACCTGCAGAAGCGGTTCTGGACAAGAACCCACGGCTTCTACAAGGTGTACTGCAAGGCCTACCAGGTGGACGGCCAGACCGTGTACATCCCTGAGAGCAAGGACCAGAAGCAGAAGATCATCGAAGAGTTCGGCGAGGGCTACTTCATTCTGAAGGACGGGGTGTACGAATGGGTCAACGCCGGCAAGCTGAAAATCAAGAAGGGCAGCTCCAAGCAGAGCAGCAGCGAGCTGGTGGATAGCGACATCCTGAAAGACAGCTTCGACCTGGCCTCCGAGCTGAAAGGCGAAAAGCTGATGCTGTACAGGGACCCCAGCGGCAATGTGTTCCCCAGCGACAAATGGATGGCCGCTGGCGTGTTCTTCGGAAAGCTGGAACGCATCCTGATCAGCAAGCTGACCAACCAGTACTCCATCAGCACCATCGAGGACGACAGCAGCAAGCAGTCTATGAAAAGGCCGGCGGCCACGAAAAAGGCCGGCCAGGCAAAAAAGAAAAAG
一部の実施形態では、Cas12bはBvCas12Bである。一部の実施形態では、Cas12bは、以下に提供するBvCas12Bの例示的な配列における番号付けでアミノ酸置換S893R、K846R、およびE837Gを含む。
BvCas12b(Bacillus sp. V3-13)NCBI参照配列:WP_101661451.1
MAIRSIKLKMKTNSGTDSIYLRKALWRTHQLINEGIAYYMNLLTLYRQEAIGDKTKEAYQAELINIIRNQQRNNGSSEEHGSDQEILALLRQLYELIIPSSIGESGDANQLGNKFLYPLVDPNSQSGKGTSNAGRKPRWKRLKEEGNPDWELEKKKDEERKAKDPTVKIFDNLNKYGLLPLFPLFTNIQKDIEWLPLGKRQSVRKWDKDMFIQAIERLLSWESWNRRVADEYKQLKEKTESYYKEHLTGGEEWIEKIRKFEKERNMELEKNAFAPNDGYFITSRQIRGWDRVYEKWSKLPESASPEELWKVVAEQQNKMSEGFGDPKVFSFLANRENRDIWRGHSERIYHIAAYNGLQKKLSRTKEQATFTLPDAIEHPLWIRYESPGGTNLNLFKLEEKQKKNYYVTLSKIIWPSEEKWIEKENIEIPLAPSIQFNRQIKLKQHVKGKQEISFSDYSSRISLDGVLGGSRIQFNRKYIKNHKELLGEGDIGPVFFNLVVDVAPLQETRNGRLQSPIGKALKVISSDFSKVIDYKPKELMDWMNTGSASNSFGVASLLEGMRVMSIDMGQRTSASVSIFEVVKELPKDQEQKLFYSINDTELFAIHKRSFLLNLPGEVVTKNNKQQRQERRKKRQFVRSQIRMLANVLRLETKKTPDERKKAIHKLMEIVQSYDSWTASQKEVWEKELNLLTNMAAFNDEIWKESLVELHHRIEPYVGQIVSKWRKGLSEGRKNLAGISMWNIDELEDTRRLLISWSKRSRTPGEANRIETDEPFGSSLLQHIQNVKDDRLKQMANLIIMTALGFKYDKEEKDRYKRWKETYPACQIILFENLNRYLFNLDRSRRENSRLMKWAHRSIPRTVSMQGEMFGLQVGDVRSEYSSRFHAKTGAPGIRCHALTEEDLKAGSNTLKRLIEDGFINESELAYLKKGDIIPSQGGELFVTLSKRYKKDSDNNELTVIHADINAAQNLQKRFWQQNSEVYRVPCQLARMGEDKLYIPKSQTETIKKYFGKGSFVKNNTEQEVYKWEKSEKMKIKTDTTFDLQDLDGFEDISKTIELAQEQQKKYLTMFRDPSGYFFNNETWRPQKEYWSIVNNIIKSCLKKKILSNKVEL
一部の実施形態では、Cas12bはBTCas12b.BTCas12b(Bacillus thermoamylovorans)、NCBI参照配列:WP_041902512である。
MATRSFILKIEPNEEVKKGLWKTHEVLNHGIAYYMNILKLIRQEAIYEHHEQDPKNPKKV
SKAEIQAELWDFVLKMQKCNSFTHEVDKDVVFNILRELYEELVPSSVEKKGEANQLSNKF
LYPLVDPNSQSGKGTASSGRKPRWYNLKIAGDPSWEEEKKKWEEDKKKDPLAKILGKLAE
YGLIPLFIPFTDSNEPIVKEIKWMEKSRNQSVRRLDKDMFIQALERFLSWESWNLKVKEE
YEKVEKEHKTLEERIKEDIQAFKSLEQYEKERQEQLLRDTLNTNEYRLSKRGLRGWREII
QKWLKMDENEPSEKYLEVFKDYQRKHPREAGDYSVYEFLSKKENHFIWRNHPEYPYLYAT
FCEIDKKKKDAKQQATFTLADPINHPLWVRFEERSGSNLNKYRILTEQLHTEKLKKKLTV
QLDRLIYPTESGGWEEKGKVDIVLLPSRQFYNQIFLDIEEKGKHAFTYKDESIKFPLKGT
LGGARVQFDRDHLRRYPHKVESGNVGRIYFNMTVNIEPTESPVSKSLKIHRDDFPKFVNF
KPKELTEWIKDSKGKKLKSGIESLEIGLRVMSIDLGQRQAAAASIFEVVDQKPDIEGKLF
FPIKGTELYAVHRASFNIKLPGETLVKSREVLRKAREDNLKLMNQKLNFLRNVLHFQQFE
DITEREKRVTKWISRQENSDVPLVYQDELIQIRELMYKPYKDWVAFLKQLHKRLEVEIGK
EVKHWRKSLSDGRKGLYGISLKNIDEIDRTRKFLLRWSLRPTEPGEVRRLEPGQRFAIDQ
LNHLNALKEDRLKKMANTIIMHALGYCYDVRKKKWQAKNPACQIILFEDLSNYNPYEERS
RFENSKLMKWSRREIPRQVALQGEIYGLQVGEVGAQFSSRFHAKTGSPGIRCSVVTKEKL
QDNRFFKNLQREGRLTLDKIAVLKEGDLYPDKGGEKFISLSKDRKLVTTHADINAAQNLQ
KRFWTRTHGFYKVYCKAYQVDGQTVYIPESKDQKQKIIEEFGEGYFILKDGVYEWGNAGK
LKIKKGSSKQSSSELVDSDILKDSFDLASELKGEKLMLYRDPSGNVFPSDKWMAAGVFFG
KLERILISKLTNQYSISTIEDDSSKQSM
一部の実施形態では、napDNAbpとはCas12cを指す。一部の実施形態では、Cas12cタンパク質は、Cas12c1またはCas12c1のバリアントである。一部の実施形態では、Cas12タンパク質は、Cas12c2またはCas12c2のバリアントである。一部の実施形態では、Cas12タンパク質は、Oleiphilus sp. HI0009由来のCas12cタンパク質(すなわちOspCas12c)またはOspCas12cのバリアントである。これらのCas12c分子はYan et al., “Functionally Diverse Type V CRISPR-Cas Systems,” Science, 2019 Jan. 4; 363: 88-91に記載されており、その全内容は参照により本明細書に組み込まれる。一部の実施形態では、napDNAbpは、天然に存在するCas12c1、Cas12c2、またはOspCas12cタンパク質と少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。一部の実施形態では、napDNAbpは、天然に存在するCas12c1、Cas12c2、またはOspCas12cタンパク質である。一部の実施形態では、napDNAbpは、本明細書中に記載の任意のCas12c1、Cas12c2、またはOspCas12cタンパク質と少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。他の細菌種由来のCas12c1、Cas12c2、またはOspCas12cも本開示に従って使用し得ることを理解されたい。
Cas12c1
MQTKKTHLHLISAKASRKYRRTIACLSDTAKKDLERRKQSGAADPAQELSCLKTIKFKLEVPEGSKLPSFDRISQIYNALETIEKGSLSYLLFALILSGFRIFPNSSAAKTFASSSCYKNDQFASQIKEIFGEMVKNFIPSELESILKKGRRKNNKDWTEENIKRVLNSEFGRKNSEGSSALFDSFLSKFSQELFRKFDSWNEVNKKYLEAAELLDSMLASYGPFDSVCKMIGDSDSRNSLPDKSTIAFTNNAEITVDIESSVMPYMAIAALLREYRQSKSKAAPVAYVQSHLTTTNGNGLSWFFKFGLDLIRKAPVSSKQSTSDGSKSLQELFSVPDDKLDGLKFIKEACEALPEASLLCGEKGELLGYQDFRTSFAGHIDSWVANYVNRLFELIELVNQLPESIKLPSILTQKNHNLVASLGLQEAEVSHSLELFEGLVKNVRQTLKKLAGIDISSSPNEQDIKEFYAFSDVLNRLGSIRNQIENAVQTAKKDKIDLESAIEWKEWKKLKKLPKLNGLGGGVPKQQELLDKALESVKQIRHYQRIDFERVIQWAVNEHCLETVPKFLVDAEKKKINKESSTDFAAKENAVRFLLEGIGAAARGKTDSVSKAAYNWFVVNNFLAKKDLNRYFINCQGCIYKPPYSKRRSLAFALRSDNKDTIEVVWEKFETFYKEISKEIEKFNIFSQEFQTFLHLENLRMKLLLRRIQKPIPAEIAFFSLPQEYYDSLPPNVAFLALNQEITPSEYITQFNLYSSFLNGNLILLRRSRSYLRAKFSWVGNSKLIYAAKEARLWKIPNAYWKSDEWKMILDSNVLVFDKAGNVLPAPTLKKVCEREGDLRLFYPLLRQLPHDWCYRNPFVKSVGREKNVIEVNKEGEPKVASALPGSLFRLIGPAPFKSLLDDCFFNPLDKDLRECMLIVDQEISQKVEAQKVEASLESCTYSIAVPIRYHLEEPKVSNQFENVLAIDQGEAGLAYAVFSLKSIGEAETKPIAVGTIRIPSIRRLIHSVSTYRKKKQRLQNFKQNYDSTAFIMRENVTGDVCAKIVGLMKEFNAFPVLEYDVKNLESGSRQLSAVYKAVNSHFLYFKEPGRDALRKQLWYGGDSWTIDGIEIVTRERKEDGKEGVEKIVPLKVFPGRSVSARFTSKTCSCCGRNVFDWLFTEKKAKTNKKFNVNSKGELTTADGVIQLFEADRSKGPKFYARRKERTPLTKPIAKGSYSLEEIERRVRTNLRRAPKSKQSRDTSQSQYFCVYKDCALHFSGMQADENAAINIGRRFLTALRKNRRSDFPSNVKISDRLLDN
Cas12c2
MTKHSIPLHAFRNSGADARKWKGRIALLAKRGKETMRTLQFPLEMSEPEAAAINTTPFAVAYNAIEGTGKGTLFDYWAKLHLAGFRFFPSGGAATIFRQQAVFEDASWNAAFCQQSGKDWPWLVPSKLYERFTKAPREVAKKDGSKKSIEFTQENVANESHVSLVGASITDKTPEDQKEFFLKMAGALAEKFDSWKSANEDRIVAMKVIDEFLKSEGLHLPSLENIAVKCSVETKPDNATVAWHDAPMSGVQNLAIGVFATCASRIDNIYDLNGGKLSKLIQESATTPNVTALSWLFGKGLEYFRTTDIDTIMQDFNIPASAKESIKPLVESAQAIPTMTVLGKKNYAPFRPNFGGKIDSWIANYASRLMLLNDILEQIEPGFELPQALLDNETLMSGIDMTGDELKELIEAVYAWVDAAKQGLATLLGRGGNVDDAVQTFEQFSAMMDTLNGTLNTISARYVRAVEMAGKDEARLEKLIECKFDIPKWCKSVPKLVGISGGLPKVEEEIKVMNAAFKDVRARMFVRFEEIAAYVASKGAGMDVYDALEKRELEQIKKLKSAVPERAHIQAYRAVLHRIGRAVQNCSEKTKQLFSSKVIEMGVFKNPSHLNNFIFNQKGAIYRSPFDRSRHAPYQLHADKLLKNDWLELLAEISATLMASESTEQMEDALRLERTRLQLQLSGLPDWEYPASLAKPDIEVEIQTALKMQLAKDTVTSDVLQRAFNLYSSVLSGLTFKLLRRSFSLKMRFSVADTTQLIYVPKVCDWAIPKQYLQAEGEIGIAARVVTESSPAKMVTEVEMKEPKALGHFMQQAPHDWYFDASLGGTQVAGRIVEKGKEVGKERKLVGYRMRGNSAYKTVLDKSLVGNTELSQCSMIIEIPYTQTVDADFRAQVQAGLPKVSINLPVKETITASNKDEQMLFDRFVAIDLGERGLGYAVFDAKTLELQESGHRPIKAITNLLNRTHHYEQRPNQRQKFQAKFNVNLSELRENTVGDVCHQINRICAYYNAFPVLEYMVPDRLDKQLKSVYESVTNRYIWSSTDAHKSARVQFWLGGETWEHPYLKSAKDKKPLVLSPGRGASGKGTSQTCSCCGRNPFDLIKDMKPRAKIAVVDGKAKLENSELKLFERNLESKDDMLARRHRNERAGMEQPLTPGNYTVDEIKALLRANLRRAPKNRRTKDTTVSEYHCVFSDCGKTMHADENAAVNIGGKFIADIEK
OspCas12c
MTKLRHRQKKLTHDWAGSKKREVLGSNGKLQNPLLMPVKKGQVTEFRKAFSAYARATKGEMTDGRKNMFTHSFEPFKTKPSLHQCELADKAYQSLHSYLPGSLAHFLLSAHALGFRIFSKSGEATAFQASSKIEAYESKLASELACVDLSIQNLTISTLFNALTTSVRGKGEETSADPLIARFYTLLTGKPLSRDTQGPERDLAEVISRKIASSFGTWKEMTANPLQSLQFFEEELHALDANVSLSPAFDVLIKMNDLQGDLKNRTIVFDPDAPVFEYNAEDPADIIIKLTARYAKEAVIKNQNVGNYVKNAITTTNANGLGWLLNKGLSLLPVSTDDELLEFIGVERSHPSCHALIELIAQLEAPELFEKNVFSDTRSEVQGMIDSAVSNHIARLSSSRNSLSMDSEELERLIKSFQIHTPHCSLFIGAQSLSQQLESLPEALQSGVNSADILLGSTQYMLTNSLVEESIATYQRTLNRINYLSGVAGQINGAIKRKAIDGEKIHLPAAWSELISLPFIGQPVIDVESDLAHLKNQYQTLSNEFDTLISALQKNFDLNFNKALLNRTQHFEAMCRSTKKNALSKPEIVSYRDLLARLTSCLYRGSLVLRRAGIEVLKKHKIFESNSELREHVHERKHFVFVSPLDRKAKKLLRLTDSRPDLLHVIDEILQHDNLENKDRESLWLVRSGYLLAGLPDQLSSSFINLPIITQKGDRRLIDLIQYDQINRDAFVMLVTSAFKSNLSGLQYRANKQSFVVTRTLSPYLGSKLVYVPKDKDWLVPSQMFEGRFADILQSDYMVWKDAGRLCVIDTAKHLSNIKKSVFSSEEVLAFLRELPHRTFIQTEVRGLGVNVDGIAFNNGDIPSLKTFSNCVQVKVSRTNTSLVQTLNRWFEGGKVSPPSIQFERAYYKKDDQIHEDAAKRKIRFQMPATELVHASDDAGWTPSYLLGIDPGEYGMGLSLVSINNGEVLDSGFIHINSLINFASKKSNHQTKVVPRQQYKSPYANYLEQSKDSAAGDIAHILDRLIYKLNALPVFEALSGNSQSAADQVWTKVLSFYTWGDNDAQNSIRKQHWFGASHWDIKGMLRQPPTEKKPKPYIAFPGSQVSSYGNSQRCSCCGRNPIEQLREMAKDTSIKELKIRNSEIQLFDGTIKLFNPDPSTVIERRRHNLGPSRIPVADRTFKNISPSSLEFKELITIVSRSIRHSPEFIAKKRGIGSEYFCAYSDCNSSLNSEANAAANVAQKFQKQLFFEL
一部の実施形態では、napDNAbpとはCas12g、Cas12h、またはCas12iを指し、これは例えばYan et al., “Functionally Diverse Type V CRISPR-Cas Systems,” Science, 2019 Jan. 4; 363: 88-91に記載されており、これらの各々の全内容は参照により本明細書に組み込まれる。10テラバイトを超える配列データを集約することによって、Cas12g、Cas12h、およびCas12iを含めた以前に特徴づけたクラスVタンパク質に対して弱い類似度を示した、V型Casタンパク質の新しい分類が同定された。一部の実施形態では、Cas12タンパク質は、Cas12gまたはCas12gのバリアントである。一部の実施形態では、Cas12タンパク質は、Cas12hまたはCas12hのバリアントである。一部の実施形態では、Cas12タンパク質は、Cas12iまたはCas12iのバリアントである。他のRNA誘導DNA結合タンパク質をnapDNAbpとして使用してもよく、本開示の範囲内にあることを理解されたい。一部の実施形態では、napDNAbpは、天然に存在するCas12g、Cas12h、またはCas12iタンパク質と少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。一部の実施形態では、napDNAbpは、天然に存在するCas12g、Cas12h、またはCas12iタンパク質である。一部の実施形態では、napDNAbpは、本明細書中に記載の任意のCas12g、Cas12h、またはCas12iタンパク質と少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。他の細菌種由来のCas12g、Cas12h、またはCas12iも本開示に従って使用し得ることを理解されたい。一部の実施形態では、Cas12iはCas12i1またはCas12i2である。
Cas12g1
MAQASSTPAVSPRPRPRYREERTLVRKLLPRPGQSKQEFRENVKKLRKAFLQFNADVSGVCQWAIQFRPRYGKPAEPTETFWKFFLEPETSLPPNDSRSPEFRRLQAFEAAAGINGAAALDDPAFTNELRDSILAVASRPKTKEAQRLFSRLKDYQPAHRMILAKVAAEWIESRYRRAHQNWERNYEEWKKEKQEWEQNHPELTPEIREAFNQIFQQLEVKEKRVRICPAARLLQNKDNCQYAGKNKHSVLCNQFNEFKKNHLQGKAIKFFYKDAEKYLRCGLQSLKPNVQGPFREDWNKYLRYMNLKEETLRGKNGGRLPHCKNLGQECEFNPHTALCKQYQQQLSSRPDLVQHDELYRKWRREYWREPRKPVFRYPSVKRHSIAKIFGENYFQADFKNSVVGLRLDSMPAGQYLEFAFAPWPRNYRPQPGETEISSVHLHFVGTRPRIGFRFRVPHKRSRFDCTQEELDELRSRTFPRKAQDQKFLEAARKRLLETFPGNAEQELRLLAVDLGTDSARAAFFIGKTFQQAFPLKIVKIEKLYEQWPNQKQAGDRRDASSKQPRPGLSRDHVGRHLQKMRAQASEIAQKRQELTGTPAPETTTDQAAKKATLQPFDLRGLTVHTARMIRDWARLNARQIIQLAEENQVDLIVLESLRGFRPPGYENLDQEKKRRVAFFAHGRIRRKVTEKAVERGMRVVTVPYLASSKVCAECRKKQKDNKQWEKNKKRGLFKCEGCGSQAQVDENAARVLGRVFWGEIELPTAIP
Cas12h1
MKVHEIPRSQLLKIKQYEGSFVEWYRDLQEDRKKFASLLFRWAAFGYAAREDDGATYISPSQALLERRLLLGDAEDVAIKFLDVLFKGGAPSSSCYSLFYEDFALRDKAKYSGAKREFIEGLATMPLDKIIERIRQDEQLSKIPAEEWLILGAEYSPEEIWEQVAPRIVNVDRSLGKQLRERLGIKCRRPHDAGYCKILMEVVARQLRSHNETYHEYLNQTHEMKTKVANNLTNEFDLVCEFAEVLEEKNYGLGWYVLWQGVKQALKEQKKPTKIQIAVDQLRQPKFAGLLTAKWRALKGAYDTWKLKKRLEKRKAFPYMPNWDNDYQIPVGLTGLGVFTLEVKRTEVVVDLKEHGKLFCSHSHYFGDLTAEKHPSRYHLKFRHKLKLRKRDSRVEPTIGPWIEAALREITIQKKPNGVFYLGLPYALSHGIDNFQIAKRFFSAAKPDKEVINGLPSEMVVGAADLNLSNIVAPVKARIGKGLEGPLHALDYGYGELIDGPKILTPDGPRCGELISLKRDIVEIKSAIKEFKACQREGLTMSEETTTWLSEVESPSDSPRCMIQSRIADTSRRLNSFKYQMNKEGYQDLAEALRLLDAMDSYNSLLESYQRMHLSPGEQSPKEAKFDTKRASFRDLLRRRVAHTIVEYFDDCDIVFFEDLDGPSDSDSRNNALVKLLSPRTLLLYIRQALEKRGIGMVEVAKDGTSQNNPISGHVGWRNKQNKSEIYFYEDKELLVMDADEVGAMNILCRGLNHSVCPYSFVTKAPEKKNDEKKEGDYGKRVKRFLKDRYGSSNVRFLVASMGFVTVTTKRPKDALVGKRLYYHGGELVTHDLHNRMKDEIKYLVEKEVLARRVSLSDSTIKSYKSFAHV
Cas12i1
MSNKEKNASETRKAYTTKMIPRSHDRMKLLGNFMDYLMDGTPIFFELWNQFGGGIDRDIISGTANKDKISDDLLLAVNWFKVMPINSKPQGVSPSNLANLFQQYSGSEPDIQAQEYFASNFDTEKHQWKDMRVEYERLLAELQLSRSDMHHDLKLMYKEKCIGLSLSTAHYITSVMFGTGAKNNRQTKHQFYSKVIQLLEESTQINSVEQLASIILKAGDCDSYRKLRIRCSRKGATPSILKIVQDYELGTNHDDEVNVPSLIANLKEKLGRFEYECEWKCMEKIKAFLASKVGPYYLGSYSAMLENALSPIKGMTTKNCKFVLKQIDAKNDIKYENEPFGKIVEGFFDSPYFESDTNVKWVLHPHHIGESNIKTLWEDLNAIHSKYEEDIASLSEDKKEKRIKVYQGDVCQTINTYCEEVGKEAKTPLVQLLRYLYSRKDDIAVDKIIDGITFLSKKHKVEKQKINPVIQKYPSFNFGNNSKLLGKIISPKDKLKHNLKCNRNQVDNYIWIEIKVLNTKTMRWEKHHYALSSTRFLEEVYYPATSENPPDALAARFRTKTNGYEGKPALSAEQIEQIRSAPVGLRKVKKRQMRLEAARQQNLLPRYTWGKDFNINICKRGNNFEVTLATKVKKKKEKNYKVVLGYDANIVRKNTYAAIEAHANGDGVIDYNDLPVKPIESGFVTVESQVRDKSYDQLSYNGVKLLYCKPHVESRRSFLEKYRNGTMKDNRGNNIQIDFMKDFEAIADDETSLYYFNMKYCKLLQSSIRNHSSQAKEYREEIFELLRDGKLSVLKLSSLSNLSFVMFKVAKSLIGTYFGHLLKKPKNSKSDVKAPPITDEDKQKADPEMFALRLALEEKRLNKVKSKKEVIANKIVAKALELRDKYGPVLIKGENISDTTKKGKKSSTNSFLMDWLARGVANKVKEMVMMHQGLEFVEVNPNFTSHQDPFVHKNPENTFRARYSRCTPSELTEKNRKEILSFLSDKPSKRPTNAYYNEGAMAFLATYGLKKNDVLGVSLEKFKQIMANILHQRSEDQLLFPSRGGMFYLATYKLDADATSVNWNGKQFWVCNADLVAAYNVGLVDIQKDFKKK
Cas12i2
MSSAIKSYKSVLRPNERKNQLLKSTIQCLEDGSAFFFKMLQGLFGGITPEIVRFSTEQEKQQQDIALWCAVNWFRPVSQDSLTHTIASDNLVEKFEEYYGGTASDAIKQYFSASIGESYYWNDCRQQYYDLCRELGVEVSDLTHDLEILCREKCLAVATESNQNNSIISVLFGTGEKEDRSVKLRITKKILEAISNLKEIPKNVAPIQEIILNVAKATKETFRQVYAGNLGAPSTLEKFIAKDGQKEFDLKKLQTDLKKVIRGKSKERDWCCQEELRSYVEQNTIQYDLWAWGEMFNKAHTALKIKSTRNYNFAKQRLEQFKEIQSLNNLLVVKKLNDFFDSEFFSGEETYTICVHHLGGKDLSKLYKAWEDDPADPENAIVVLCDDLKNNFKKEPIRNILRYIFTIRQECSAQDILAAAKYNQQLDRYKSQKANPSVLGNQGFTWTNAVILPEKAQRNDRPNSLDLRIWLYLKLRHPDGRWKKHHIPFYDTRFFQEIYAAGNSPVDTCQFRTPRFGYHLPKLTDQTAIRVNKKHVKAAKTEARIRLAIQQGTLPVSNLKITEISATINSKGQVRIPVKFDVGRQKGTLQIGDRFCGYDQNQTASHAYSLWEVVKEGQYHKELGCFVRFISSGDIVSITENRGNQFDQLSYEGLAYPQYADWRKKASKFVSLWQITKKNKKKEIVTVEAKEKFDAICKYQPRLYKFNKEYAYLLRDIVRGKSLVELQQIRQEIFRFIEQDCGVTRLGSLSLSTLETVKAVKGIIYSYFSTALNASKNNPISDEQRKEFDPELFALLEKLELIRTRKKKQKVERIANSLIQTCLENNIKFIRGEGDLSTTNNATKKKANSRSMDWLARGVFNKIRQLAPMHNITLFGCGSLYTSHQDPLVHRNPDKAMKCRWAAIPVKDIGDWVLRKLSQNLRAKNIGTGEYYHQGVKEFLSHYELQDLEEELLKWRSDRKSNIPCWVLQNRLAEKLGNKEAVVYIPVRGGRIYFATHKVATGAVSIVFDQKQVWVCNADHVAAANIALTVKGIGEQSSDEENPDGSRIKLQLTS
塩基エディターの代表的な核酸およびタンパク質配列は以下の通りである:
BhCas12b GGSGGS-ABE8-P153にXten20
Figure 2022519882000019
Figure 2022519882000020
MAPKKKRKVGIHGVPAAATRSFILKIEPNEEVKKGLWKTHEVLNHGIAYYMNILKLIRQEAIYEHHEQDPKNPKKVSKAEIQAELWDFVLKMQKCNSFTHEVDKDEVFNILRELYEELVPSSVEKKGEANQLSNKFLYPLVDPNSQSGKGTASSGRKPRWYNLKIAGDPGGSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGSWEEEKKKWEEDKKKDPLAKILGKLAEYGLIPLFIPYTDSNEPIVKEIKWMEKSRNQSVRRLDKDMFIQALERFLSWESWNLKVKEEYEKVEKEYKTLEERIKEDIQALKALEQYEKERQEQLLRDTLNTNEYRLSKRGLRGWREIIQKWLKMDENEPSEKYLEVFKDYQRKHPREAGDYSVYEFLSKKENHFIWRNHPEYPYLYATFCEIDKKKKDAKQQATFTLADPINHPLWVRFEERSGSNLNKYRILTEQLHTEKLKKKLTVQLDRLIYPTESGGWEEKGKVDIVLLPSRQFYNQIFLDIEEKGKHAFTYKDESIKFPLKGTLGGARVQFDRDHLRRYPHKVESGNVGRIYFNMTVNIEPTESPVSKSLKIHRDDFPKVVNFKPKELTEWIKDSKGKKLKSGIESLEIGLRVMSIDLGQRQAAAASIFEVVDQKPDIEGKLFFPIKGTELYAVHRASFNIKLPGETLVKSREVLRKAREDNLKLMNQKLNFLRNVLHFQQFEDITEREKRVTKWISRQENSDVPLVYQDELIQIRELMYKPYKDWVAFLKQLHKRLEVEIGKEVKHWRKSLSDGRKGLYGISLKNIDEIDRTRKFLLRWSLRPTEPGEVRRLEPGQRFAIDQLNHLNALKEDRLKKMANTIIMHALGYCYDVRKKKWQAKNPACQIILFEDLSNYNPYEERSRFENSKLMKWSRREIPRQVALQGEIYGLQVGEVGAQFSSRFHAKTGSPGIRCSVVTKEKLQDNRFFKNLQREGRLTLDKIAVLKEGDLYPDKGGEKFISLSKDRKCVTTHADINAAQNLQKRFWTRTHGFYKVYCKAYQVDGQTVYIPESKDQKQKIIEEFGEGYFILKDGVYEWVNAGKLKIKKGSSKQSSSELVDSDILKDSFDLASELKGEKLMLYRDPSGNVFPSDKWMAAGVFFGKLERILISKLTNQYSISTIEDDSSKQSMKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA
BhCas12b GGSGGS-ABE8-K255にXten20
Figure 2022519882000021
Figure 2022519882000022
MAPKKKRKVGIHGVPAAATRSFILKIEPNEEVKKGLWKTHEVLNHGIAYYMNILKLIRQEAIYEHHEQDPKNPKKVSKAEIQAELWDFVLKMQKCNSFTHEVDKDEVFNILRELYEELVPSSVEKKGEANQLSNKFLYPLVDPNSQSGKGTASSGRKPRWYNLKIAGDPSWEEEKKKWEEDKKKDPLAKILGKLAEYGLIPLFIPYTDSNEPIVKEIKWMEKSRNQSVRRLDKDMFIQALERFLSWESWNLKVKEEYEKVEKEYKTLEERIKGGSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGEDIQALKALEQYEKERQEQLLRDTLNTNEYRLSKRGLRGWREIIQKWLKMDENEPSEKYLEVFKDYQRKHPREAGDYSVYEFLSKKENHFIWRNHPEYPYLYATFCEIDKKKKDAKQQATFTLADPINHPLWVRFEERSGSNLNKYRILTEQLHTEKLKKKLTVQLDRLIYPTESGGWEEKGKVDIVLLPSRQFYNQIFLDIEEKGKHAFTYKDESIKFPLKGTLGGARVQFDRDHLRRYPHKVESGNVGRIYFNMTVNIEPTESPVSKSLKIHRDDFPKVVNFKPKELTEWIKDSKGKKLKSGIESLEIGLRVMSIDLGQRQAAAASIFEVVDQKPDIEGKLFFPIKGTELYAVHRASFNIKLPGETLVKSREVLRKAREDNLKLMNQKLNFLRNVLHFQQFEDITEREKRVTKWISRQENSDVPLVYQDELIQIRELMYKPYKDWVAFLKQLHKRLEVEIGKEVKHWRKSLSDGRKGLYGISLKNIDEIDRTRKFLLRWSLRPTEPGEVRRLEPGQRFAIDQLNHLNALKEDRLKKMANTIIMHALGYCYDVRKKKWQAKNPACQIILFEDLSNYNPYEERSRFENSKLMKWSRREIPRQVALQGEIYGLQVGEVGAQFSSRFHAKTGSPGIRCSVVTKEKLQDNRFFKNLQREGRLTLDKIAVLKEGDLYPDKGGEKFISLSKDRKCVTTHADINAAQNLQKRFWTRTHGFYKVYCKAYQVDGQTVYIPESKDQKQKIIEEFGEGYFILKDGVYEWVNAGKLKIKKGSSKQSSSELVDSDILKDSFDLASELKGEKLMLYRDPSGNVFPSDKWMAAGVFFGKLERILISKLTNQYSISTIEDDSSKQSMKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA
BhCas12b GGSGGS-ABE8-D306にXten20
Figure 2022519882000023
Figure 2022519882000024
MAPKKKRKVGIHGVPAAATRSFILKIEPNEEVKKGLWKTHEVLNHGIAYYMNILKLIRQEAIYEHHEQDPKNPKKVSKAEIQAELWDFVLKMQKCNSFTHEVDKDEVFNILRELYEELVPSSVEKKGEANQLSNKFLYPLVDPNSQSGKGTASSGRKPRWYNLKIAGDPSWEEEKKKWEEDKKKDPLAKILGKLAEYGLIPLFIPYTDSNEPIVKEIKWMEKSRNQSVRRLDKDMFIQALERFLSWESWNLKVKEEYEKVEKEYKTLEERIKEDIQALKALEQYEKERQEQLLRDTLNTNEYRLSKRGLRGWREIIQKWLKMDGGSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGENEPSEKYLEVFKDYQRKHPREAGDYSVYEFLSKKENHFIWRNHPEYPYLYATFCEIDKKKKDAKQQATFTLADPINHPLWVRFEERSGSNLNKYRILTEQLHTEKLKKKLTVQLDRLIYPTESGGWEEKGKVDIVLLPSRQFYNQIFLDIEEKGKHAFTYKDESIKFPLKGTLGGARVQFDRDHLRRYPHKVESGNVGRIYFNMTVNIEPTESPVSKSLKIHRDDFPKVVNFKPKELTEWIKDSKGKKLKSGIESLEIGLRVMSIDLGQRQAAAASIFEVVDQKPDIEGKLFFPIKGTELYAVHRASFNIKLPGETLVKSREVLRKAREDNLKLMNQKLNFLRNVLHFQQFEDITEREKRVTKWISRQENSDVPLVYQDELIQIRELMYKPYKDWVAFLKQLHKRLEVEIGKEVKHWRKSLSDGRKGLYGISLKNIDEIDRTRKFLLRWSLRPTEPGEVRRLEPGQRFAIDQLNHLNALKEDRLKKMANTIIMHALGYCYDVRKKKWQAKNPACQIILFEDLSNYNPYEERSRFENSKLMKWSRREIPRQVALQGEIYGLQVGEVGAQFSSRFHAKTGSPGIRCSVVTKEKLQDNRFFKNLQREGRLTLDKIAVLKEGDLYPDKGGEKFISLSKDRKCVTTHADINAAQNLQKRFWTRTHGFYKVYCKAYQVDGQTVYIPESKDQKQKIIEEFGEGYFILKDGVYEWVNAGKLKIKKGSSKQSSSELVDSDILKDSFDLASELKGEKLMLYRDPSGNVFPSDKWMAAGVFFGKLERILISKLTNQYSISTIEDDSSKQSMKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA
BhCas12b GGSGGS-ABE8-D980にXten20
Figure 2022519882000025
Figure 2022519882000026
MAPKKKRKVGIHGVPAAATRSFILKIEPNEEVKKGLWKTHEVLNHGIAYYMNILKLIRQEAIYEHHEQDPKNPKKVSKAEIQAELWDFVLKMQKCNSFTHEVDKDEVFNILRELYEELVPSSVEKKGEANQLSNKFLYPLVDPNSQSGKGTASSGRKPRWYNLKIAGDPSWEEEKKKWEEDKKKDPLAKILGKLAEYGLIPLFIPYTDSNEPIVKEIKWMEKSRNQSVRRLDKDMFIQALERFLSWESWNLKVKEEYEKVEKEYKTLEERIKEDIQALKALEQYEKERQEQLLRDTLNTNEYRLSKRGLRGWREIIQKWLKMDENEPSEKYLEVFKDYQRKHPREAGDYSVYEFLSKKENHFIWRNHPEYPYLYATFCEIDKKKKDAKQQATFTLADPINHPLWVRFEERSGSNLNKYRILTEQLHTEKLKKKLTVQLDRLIYPTESGGWEEKGKVDIVLLPSRQFYNQIFLDIEEKGKHAFTYKDESIKFPLKGTLGGARVQFDRDHLRRYPHKVESGNVGRIYFNMTVNIEPTESPVSKSLKIHRDDFPKVVNFKPKELTEWIKDSKGKKLKSGIESLEIGLRVMSIDLGQRQAAAASIFEVVDQKPDIEGKLFFPIKGTELYAVHRASFNIKLPGETLVKSREVLRKAREDNLKLMNQKLNFLRNVLHFQQFEDITEREKRVTKWISRQENSDVPLVYQDELIQIRELMYKPYKDWVAFLKQLHKRLEVEIGKEVKHWRKSLSDGRKGLYGISLKNIDEIDRTRKFLLRWSLRPTEPGEVRRLEPGQRFAIDQLNHLNALKEDRLKKMANTIIMHALGYCYDVRKKKWQAKNPACQIILFEDLSNYNPYEERSRFENSKLMKWSRREIPRQVALQGEIYGLQVGEVGAQFSSRFHAKTGSPGIRCSVVTKEKLQDNRFFKNLQREGRLTLDKIAVLKEGDLYPDKGGEKFISLSKDRKCVTTHADINAAQNLQKRFWTRTHGFYKVYCKAYQVDGGSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGGQTVYIPESKDQKQKIIEEFGEGYFILKDGVYEWVNAGKLKIKKGSSKQSSSELVDSDILKDSFDLASELKGEKLMLYRDPSGNVFPSDKWMAAGVFFGKLERILISKLTNQYSISTIEDDSSKQSMKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA
BhCas12b GGSGGS-ABE8-K1019にXten20
Figure 2022519882000027
Figure 2022519882000028
MAPKKKRKVGIHGVPAAATRSFILKIEPNEEVKKGLWKTHEVLNHGIAYYMNILKLIRQEAIYEHHEQDPKNPKKVSKAEIQAELWDFVLKMQKCNSFTHEVDKDEVFNILRELYEELVPSSVEKKGEANQLSNKFLYPLVDPNSQSGKGTASSGRKPRWYNLKIAGDPSWEEEKKKWEEDKKKDPLAKILGKLAEYGLIPLFIPYTDSNEPIVKEIKWMEKSRNQSVRRLDKDMFIQALERFLSWESWNLKVKEEYEKVEKEYKTLEERIKEDIQALKALEQYEKERQEQLLRDTLNTNEYRLSKRGLRGWREIIQKWLKMDENEPSEKYLEVFKDYQRKHPREAGDYSVYEFLSKKENHFIWRNHPEYPYLYATFCEIDKKKKDAKQQATFTLADPINHPLWVRFEERSGSNLNKYRILTEQLHTEKLKKKLTVQLDRLIYPTESGGWEEKGKVDIVLLPSRQFYNQIFLDIEEKGKHAFTYKDESIKFPLKGTLGGARVQFDRDHLRRYPHKVESGNVGRIYFNMTVNIEPTESPVSKSLKIHRDDFPKVVNFKPKELTEWIKDSKGKKLKSGIESLEIGLRVMSIDLGQRQAAAASIFEVVDQKPDIEGKLFFPIKGTELYAVHRASFNIKLPGETLVKSREVLRKAREDNLKLMNQKLNFLRNVLHFQQFEDITEREKRVTKWISRQENSDVPLVYQDELIQIRELMYKPYKDWVAFLKQLHKRLEVEIGKEVKHWRKSLSDGRKGLYGISLKNIDEIDRTRKFLLRWSLRPTEPGEVRRLEPGQRFAIDQLNHLNALKEDRLKKMANTIIMHALGYCYDVRKKKWQAKNPACQIILFEDLSNYNPYEERSRFENSKLMKWSRREIPRQVALQGEIYGLQVGEVGAQFSSRFHAKTGSPGIRCSVVTKEKLQDNRFFKNLQREGRLTLDKIAVLKEGDLYPDKGGEKFISLSKDRKCVTTHADINAAQNLQKRFWTRTHGFYKVYCKAYQVDGQTVYIPESKDQKQKIIEEFGEGYFILKDGVYEWVNAGKGGSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGLKIKKGSSKQSSSELVDSDILKDSFDLASELKGEKLMLYRDPSGNVFPSDKWMAAGVFFGKLERILISKLTNQYSISTIEDDSSKQSMKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA
上記配列について、Kozak配列を太字にして下線を引き、N末端核局在化シグナル(NLS)を表し、小文字の文字はGGGSGGSリンカーを示し、破線による下線はABE8をコードしている配列を示し、未修飾の配列はBhCas12bをコードしており、二重下線はXten20リンカーを示し、一重下線はC末端NLSを示し、GGATCC(点線による下線)はGSリンカーを示し、斜体の文字は3×ヘマグルチニン(HA)タグのコード配列を表す。
[ガイドポリヌクレオチド]
一実施形態では、ガイドポリヌクレオチドはガイドRNAである。RNA/Cas複合体は、Casタンパク質を標的DNAに「ガイド」するのを補助することができる。Cas9/crRNA/tracrRNAは、スペーサーに相補的な線状または環状dsDNA標的をエンドヌクレアーゼ的に切断する。crRNAに相補的でない標的鎖が最初にエンドヌクレアーゼで切断され、次いでエキソヌクレアーゼ的に3’-5’方向にトリムされる。自然界では、DNA結合と切断にはタンパク質と両方のRNAが通常必要とされる。しかしながら、crRNAおよびtracrRNAの両方の側面を単一のRNA種に組み込むように、単一ガイドRNA (「sgRNA」、または単に「gRNA」)を作製することができる。例えば、Jinek M. et al., Science 337:816-821(2012)を参照されたい(その内容全体が参照により本明細書に組み入れられる)。Cas9は、CRISPR反復配列中の短いモチーフ(PAMまたはプロトスペーサー隣接モチーフ)を認識して、自己と非自己を区別するのを助ける。Cas9ヌクレアーゼの配列および構造は、当業者によく知られている(例えば“Complete genome sequence of an M1 strain of Streptococcus pyogenes.”Ferretti, J.J. et al., Natl. Acad. Sci. U.S.A. 98:4658-4663(2001); “CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III.” Deltcheva E. et al., Nature 471:602-607(2011); および “Programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.” Jinek M.et al, Science 337:816-821(2012)参照。その内容全体が参照により本明細書に組み入れられる)。Cas9オーソログは、限定されるものではないが、S. pyogenes および S. thermophilusを含む様々な種において記述されている。さらなる適切なCas9ヌクレアーゼおよび配列は、本開示に基づいて当業者に明らかとなり得、そのようなCas9ヌクレアーゼおよび配列には、Chylinski, Rhun, and Charpentier, “The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems”(2013) RNA Biology 10:5, 726-737に開示されている生物および遺伝子座からのCas9配列が含まれる(その全内容は参照により本明細書に組み込まれる)。ある態様において、Cas9ヌクレアーゼは、不活性(例えば不活化) DNA切断ドメインを有し、すなわち、Cas9はニッカーゼである。
ある態様において、ガイドポリヌクレオチドは、少なくとも一つの単一ガイドRNA (「sgRNA」または「gRNA」)である。ある態様において、ガイドポリヌクレオチドは、少なくとも一つのtracrRNAであり、ある態様において、ガイドポリヌクレオチドは、ポリヌクレオチドプログラム可能なDNA結合ドメイン(例:Cas9またはCpf1)を標的ヌクレオチド配列に導くためにPAM配列を必要としない。
本願明細書に開示される塩基エディターのポリヌクレオチドプログラム可能ヌクレオチド結合ドメイン(例えばCRISPR由来ドメイン)は、ガイドポリヌクレオチドと会合することによって標的ポリヌクレオチド配列を認識することができる。ガイドポリヌクレオチド(例えばgRNA)は、典型的には一本鎖であり、ポリヌクレオチドの標的配列に部位特異的に結合(すなわち相補的塩基対形成を介して)するようにプログラムすることができ、それによって、ガイド核酸を伴った塩基エディターを標的配列に導く。ガイドポリヌクレオチドはDNAであり得る。ガイドポリヌクレオチドはRNAであり得る。ある態様において、ガイドポリヌクレオチドは天然ヌクレオチド(例えばアデノシン)を含む。ある態様において、ガイドポリヌクレオチドは、非天然(または不自然)ヌクレオチド(例えばペプチド核酸またはヌクレオチドアナログ)を含む。ある態様において、ガイド核酸配列の標的化領域は、長さが少なくとも15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30ヌクレオチドであり得る。ガイド核酸の標的化領域は、長さが10~30ヌクレオチドの間、または長さが15~25ヌクレオチドの間、または長さが15~20ヌクレオチドの間であり得る。
いくつかの実施形態において、ガイドポリヌクレオチドは、例えば相補的塩基対形成を介して互いに相互作用できる、2つ以上の個別のポリヌクレオチドを含む(例えば二重ガイドポリヌクレオチド)。例えば、ガイドポリヌクレオチドは、CRISPR RNA (crRNA) およびトランス活性化CRISPR RNA (tracrRNA) を含むことができる。例えば、ガイドポリヌクレオチドは、1以上のトランス活性化CRISPR RNA (tracrRNA) を含むことができる。
II型CRISPRシステムにおいて、CRISPRタンパク質(例Cas9)による核酸の標的化は、典型的には、標的配列を認識する配列を含む第一のRNA分子 (crRNA) と、ガイドRNA-CRISPRタンパク質複合体を安定化させる足場領域を形成する反復配列を含む第二のRNA分子 (trRNA) との間の相補的塩基対形成を必要とする。このような二重ガイドRNAシステムは、本明細書に開示された塩基エディターを標的ポリヌクレオチド配列に導くためのガイドポリヌクレオチドとして利用され得る。
いくつかの実施形態において、本明細書で提供される塩基エディターは、単一ガイドポリヌクレオチド(例えばgRNA)を利用する。いくつかの実施形態において、本明細書で提供される塩基エディターは、デュアル(二重)ガイドポリヌクレオチド(例えばデュアルgRNA)を利用する。いくつかの実施形態において、本明細書で提供される塩基エディターは、一つ以上のガイドポリヌクレオチド(例えば複数のgRNA)を利用する。いくつかの実施形態において、単一ガイドポリヌクレオチドが、本明細書に記載される異なる塩基エディターのために利用される。例えば、単一ガイドポリヌクレオチドを、アデノシン塩基エディターのために利用することができる。
他の実施形態では、ガイドポリヌクレオチドは、核酸のポリヌクレオチド標的化部分および核酸の足場部分の両方を単一分子(すなわち単一分子ガイド核酸)中に含むことができる。例えば、単一分子ガイドポリヌクレオチドは、単一ガイドRNA (sgRNAまたはgRNA)であり得る。本明細書において、「ガイドポリヌクレオチド配列」という用語は、塩基エディターと相互作用し標的ポリヌクレオチド配列に塩基エディターを導くことができる任意の単一、二重または複数分子核酸を企図する。
典型的には、ガイドポリヌクレオチド(例えばcrRNA/trRNA複合体またはgRNA)は、標的ポリヌクレオチド配列を認識しそれに結合することができる配列を含む「ポリヌクレオチド標的セグメント」と、塩基エディターのポリヌクレオチドプログラム可能ヌクレオチド結合ドメイン成分内でガイドポリヌクレオチドを安定化させる「タンパク質結合セグメント」とを含む。或る実施態様では、ガイドポリヌクレオチドのポリヌクレオチド標的セグメントは、DNAポリヌクレオチドを認識してそれに結合し、それによりDNA中の塩基の編集を促進する。他の実施態様では、ガイドポリヌクレオチドのポリヌクレオチド標的セグメントは、RNAポリヌクレオチドを認識しそれに結合し、それによりRNA中の塩基の編集を促進する。ここで、「セグメント」とは、分子の一部分または領域、例えばガイドポリヌクレオチド中の連続したヌクレオチドのストレッチをいう。また、セグメントは、複合体の領域/セクションも表し得、したがってセグメントは2つ以上の分子の領域を含むことができる。例えば、ガイドポリヌクレオチドが複数の核酸分子を含む場合、タンパク質結合セグメントは、例えば相補性の領域に沿ってハイブリダイズした複数の別個の分子の全てまたは一部を含むことができる。ある態様において、2つの別個の分子を含むDNA標的化RNAのタンパク質結合セグメントは、 (i) 長さが100塩基対である第一のRNA分子の塩基対40~75;および(ii) 長さが50塩基対である第二のRNA分子の10~25塩基対を含み得る。「セグメント」の定義は、特定の文脈において特に定義されない限り、全塩基対のうちの特定の数に限定されず、所与のRNA分子からの塩基対の特定の数に限定されず、複合体内の別個の分子の特定の数に限定されず、任意の全長のRNA分子の領域を含み得、他の分子に対する相補性を有する領域を含み得る。
ガイドRNAまたはガイドポリヌクレオチドは、2つ以上のRNA、例えばCRISPR RNA (crRNA) およびトランス活性化crRNA (tracrRNA) を含むことができる。いくつかの実施形態において、ガイドRNAまたはガイドポリヌクレオチドは、crRNAおよびtracrRNAの一部分(例えば機能的部分) の融合によって形成される単一鎖RNA、あるいは単一ガイドRNA (sgRNA) を含む。ガイドRNAまたはガイドポリヌクレオチドは、crRNAおよびtracrRNAを含む二重RNAであってもよい。さらに、crRNAは標的DNAとハイブリダイズし得る。
上述のように、ガイドRNAまたはガイドポリヌクレオチドは、発現産物であり得る。例えば、ガイドRNAをコードするDNAは、ガイドRNAをコードする配列を含むベクターであり得る。ガイドRNAまたはガイドポリヌクレオチドは、単離されたガイドRNA、またはガイドRNAをコードする配列およびプロモーターを含むプラスミドDNAを細胞にトランスフェクトすることによって、細胞に導入することができる。ガイドRNAまたはガイドポリヌクレオチドは、ウイルス媒介遺伝子送達の使用など、他の方法で細胞に導入することもできる。
ガイドRNAまたはガイドポリヌクレオチドを単離することができる。例えば、ガイドRNAは、単離されたRNAの形態で細胞または生物にトランスフェクトされ得る。ガイドRNAは、当技術分野で公知の任意のインビトロ転写系を用いたインビトロ転写によって調製することができる。ガイドRNAは、ガイドRNAをコードする配列を含むプラスミドの形態ではなく、単離されたRNAの形態で細胞に移入され得る。
ガイドRNAまたはガイドポリヌクレオチドは、以下の3つの領域を含み得る:染色体配列中の標的部位に相補的であり得る5’末端における第1の領域、ステムループ構造を形成し得る第2の内部領域、および一本鎖であり得る第3の3’領域。各ガイドRNAが融合タンパク質を特異的な標的部位にガイドするように、各ガイドRNAの第1の領域を異ならせることもできる。さらに、各ガイドRNAの第2および第3の領域は、全てのガイドRNAにおいて同一であり得る。
ガイドRNAまたはガイドポリヌクレオチドの第1の領域は、そのガイドRNAの第1の領域が標的部位と塩基対を形成できるように、染色体配列の標的部位における配列に相補的であり得る。いくつかの実施形態において、ガイドRNAの第一の領域は、約10ヌクレオチド~25ヌクレオチド(すなわち、10ヌクレオチドからヌクレオチドまで;または約10ヌクレオチドから約25ヌクレオチドまで;または10ヌクレオチドから約25ヌクレオチドまで;または約10ヌクレオチドから25ヌクレオチドまで)またはそれ以上を含むことができる。例えば、ガイドRNAの第一の領域と染色体配列中の標的部位との間の塩基対形成の領域は、長さが約10、11、12、13、14、15、16、17、18、19、20、22、23、24、25またはそれ以上のヌクレオチドであり得るか、またはおよそその長さであり得る。いくつかの実施形態において、ガイドRNAの第一の領域は、長さが19、20、もしくは21ヌクレオチド、または約19、20、もしくは21ヌクレオチドであり得る。
ガイドRNAまたはガイドポリヌクレオチドは、二次構造を形成する第2の領域を含むこともできる。例えば、ガイドRNAによって形成される二次構造は、ステム(またはヘアピン)およびループを含むことができる。ループとステムの長さはさまざまであり得る。例えば、ループの長さは(約)3から10ヌクレオチドの範囲であり得、ステムの長さは(約)6から20塩基対の範囲であり得る。ステムは、1から10または約10ヌクレオチドの一つ以上のバルジを含むことができる。第二の領域の全長は、約16から60ヌクレオチド長の範囲であり得る。例えば、ループは長さが(約)4ヌクレオチドであり得、ステムは(約)12塩基対であり得る。
ガイドRNAまたはガイドポリヌクレオチドは、本質的に一本鎖状態であり得る3'末端の第3の領域も含むこともできる。例えば、第3の領域は、対象とする細胞のいずれの染色体配列とも相補的でないこともあれば、ガイドRNAの残りの部分と相補的でないこともある。さらに第3の領域の長さはさまざまであり得る。第3の領域は、長さが約4ヌクレオチド以上であり得る。例えば、第3の領域の長さは、(約)5から60ヌクレオチド長の範囲であり得る。
ガイドRNAまたはガイドポリヌクレオチドは、遺伝子標的の任意のエクソンまたはイントロンを標的とすることができる。いくつかの実施形態において、ガイドは遺伝子のエキソン1または2を標的にすることができる;他の実施形態において、ガイドは遺伝子のエキソン3または4を標的にすることができる。組成物は、全てが同じエクソンを標的とする複数のガイドRNA、またはいくつかの実施形態において、異なるエクソンを標的とする複数のガイドRNAを含むことができる。遺伝子のエキソンとイントロンが標的とされ得る。
ガイドRNAまたはガイドポリヌクレオチドは、(約)20ヌクレオチドの核酸配列を標的とし得る。標的核酸は、(約)20ヌクレオチド未満であり得る。標的核酸は、長さが少なくとも(約)5、10、15、16、17、18、19、20、21、22、23、24、25、30、または1~100ヌクレオチドの間の任意の長さであり得る。標的核酸は、長さが多くとも約5、10、15、16、17、18、19、20、21、22、23、24、25、30、40、50ヌクレオチド、または1~100ヌクレオチドの間の任意の長さであり得る。標的核酸配列は、PAMの最初のヌクレオチドの5’直近の(約)20塩基であり得る。ガイドRNAは、核酸配列を標的化し得る。標的核酸は、少なくとも(約)1~10、1~20、1~30、1~40、1~50、1~60、1~70、1~80、1~90、または1~100ヌクレオチドであり得る。
ガイドポリヌクレオチド、例えば、ガイドRNAは、別の核酸、例えば、細胞のゲノム中の標的核酸またはプロトスペーサーにハイブリダイズし得る核酸を指すことができる。ガイドポリヌクレオチドはRNAであり得る。ガイドポリヌクレオチドはDNAであり得る。ガイドポリヌクレオチドは、核酸の配列に部位特異的に結合するようにプログラムまたは設計することができる。ガイドポリヌクレオチドは、一ポリヌクレオチド鎖を含み得、単一ガイドポリヌクレオチドと呼ばれ得る。ガイドポリヌクレオチドは、2つのポリヌクレオチド鎖を含み得、二重ガイドポリヌクレオチドと呼ばれ得る。ガイドRNAはRNA分子として細胞や胚に導入され得る。例えば、RNA分子は、インビトロで転写され得、および/または化学的に合成され得る。RNAは、合成DNA分子、例えばgBlocks(登録商標)遺伝子断片から転写され得る。ガイドRNAはRNA分子として細胞や胚に導入され得る。ガイドRNAはまた、非RNA核酸分子、例えばDNA分子の形態で細胞または胚に導入され得る。例えば、ガイドRNAをコードするDNAが、対象の細胞または胚におけるガイドRNAの発現のためにプロモーター制御配列に作動可能に連結され得る。RNAコード配列は、RNAポリメラーゼIII (Pol III)によって認識されるプロモーター配列に作動可能に連結され得る。ガイドRNAを発現するために使用することができるプラスミドベクターは、px330ベクターおよびpx333ベクターを含むが、これらに限定されない。いくつかの実施形態において、プラスミドベクター(例えばpx333ベクター)は、少なくとも二つのガイドRNAをコードするDNA配列を含むことができる。
ガイドポリヌクレオチド(例えばガイドRNA)およびターゲティング配列を選択、設計および検証するための方法は、本明細書中に記載され、当業者に知られている。例えば、核酸塩基エディター系におけるデアミナーゼドメイン(例えばAIDドメイン)の潜在的基質混合性(promiscuity)の影響を最小限にするために、意図せず脱アミノ化の標的となり得る残基(例えば、標的核酸遺伝子座内のssDNA上に潜在的に位置し得るオフターゲットC残基)の数を最小限にすることができる。さらに、ソフトウェアツールを使用して、標的核酸配列に対応するgRNAを最適化することができ、例えば、ゲノム全体の総オフターゲット活性を最小限化することができる。例えば、S. pyogenes Cas9を用いた標的化ドメイン選択肢の各可能性について、(例えばNAGまたはNGGなどの選択されたPAMに先行する)ある数(例えば1、2、3、4、5、6、7、8、9、または10)までのミスマッチ塩基対を含むすべてのオフターゲット配列をゲノムにわたって同定することができる。標的部位に相補的なgRNAの第一の領域を同定することができ、すべての第一の領域(例:crRNA)をその総予測オフターゲットスコアに従ってランク付けすることができ;上位にランクされた標的化ドメインは、最大のオンターゲット活性と最小のオフターゲット活性を持つ可能性が高いものを表す。候補標的化gRNAは、当技術分野で公知の方法および/または本明細書に記載の方法を用いて機能的に評価することができる。
非限定的な例として、Cas9と共に使用するためのガイドRNAのcrRNAにおける標的DNAハイブリダイズ配列は、DNA配列探索アルゴリズムを用いて同定することができる。gRNA設計は、Bae S., Park J., & Kim J.-S. Cas-OFFinder: A fast and versatile algorithm that searches for potential off-target sites of Cas9 RNA-guided endonucleases. Bioinformatics 30, 1473-1475 (2014)に記載されているような公開ツールcas-offinderに基づくカスタムgRNA設計ソフトウェアを用いて実施することができる。このソフトウェアは、ガイドのゲノム全体的オフターゲット傾向を計算した後にガイドにスコアを付ける。通常、完全マッチから7個のミスマッチまでの範囲の一致が、17から24までの長さの範囲のガイドについて考慮される。いったんオフターゲットサイトが計算的に決定されると、各ガイドについて集約スコアが計算され、ウェブインターフェースを使用した表形式の出力に要約される。PAM配列に隣接する潜在的な標的部位を同定することに加えて、ソフトウェアは、選択された標的部位から1、2、3または3超のヌクレオチドだけ異なるすべてのPAM隣接配列も同定する。標的核酸配列、例えば標的遺伝子についてのゲノムDNA配列を得て、反復エレメントを、公に入手可能なツール、例えば、RepeatMaskerプログラムを用いてスクリーニングすることができる。RepeatMaskerは、入力されたDNA配列から、反復エレメントや低複雑性領域を探し出す。所与のクエリー配列に存在する反復の詳細な注釈が出力となる。
同定後、ガイドRNA(例えばcrRNA)の第1の領域が、標的部位へのそれらの距離、それらの直交性(orthogonality)、および関連するPAM配列との密接な一致のための5’ヌクレオチドの存在(例えば、関連するPAM (例えば、化膿レンサ球菌についてのNGG PAM、黄色ブドウ球菌についてのNNGRRTまたはNNGRRV PAM) を含むヒトゲノムにおける密接な一致の同定に基づく5’G)に基づいて、階層にランク付けされ得る。本明細書において使用される場合、直交性とは、標的配列に対して最小数のミスマッチを含む、ヒトゲノムにおける配列の数を表す。「高レベルの直交性」または「良好な直交性」は、例えば、意図された標的以外にヒトゲノムにおいて同一の配列を有さず、標的配列において一または二のミスマッチを含有する配列も有さない20マー標的化ドメインを指し得る。良好な直交性を有する標的化ドメインは、オフターゲットDNA切断を最小化するように選択され得る。
いくつかの実施形態において、塩基編集活性を検出すること、および候補ガイドポリヌクレオチドを試験することのためにレポーターシステムが使用され得る。いくつかの態様において、レポーターシステムは、塩基編集活性がレポーター遺伝子の発現をもたらす、レポーター遺伝子ベースのアッセイを含むことができる。例えば、レポーターシステムは、不活性化開始コドン、例えば、鋳型鎖上の3'-TAC-5'から3'-CAC-5'への突然変異を含むレポーター遺伝子を含み得る。標的Cの脱アミノ化に成功すると、対応するmRNAは5'-GUG-3'ではなく5'-AUG-3'として転写され、レポーター遺伝子の翻訳を可能にする。適切なレポーター遺伝子は、当業者には明らかであろう。レポーター遺伝子の非限定的な例としては、緑色蛍光タンパク質 (GFP) 、赤色蛍光タンパク質 (RFP) 、ルシフェラーゼ、分泌型アルカリホスファターゼ (SEAP) 、または、発現が検出可能であり当業者には明らかである他の任意の遺伝子をコードする遺伝子が挙げられる。レポーター系を用いて、多くの異なるgRNAを試験することができ、例えば、標的DNA配列においてどの残基を、それぞれの対応デアミナーゼが標的とするかを決定することができる。非鋳型鎖ヌクレオチド残基を標的とするsgRNAも、特定の塩基編集タンパク質、例えばCas9デアミナーゼ融合タンパク質のオフターゲット効果を評価するために試験することができる。一部の実施形態では、そのようなgRNAは、突然変異させた開始コドンがgRNAとハイブリダイズしないように設計することができる。ガイドポリヌクレオチドは、標準ヌクレオチド、修飾ヌクレオチド(例えばプソイドウリジン)、ヌクレオチド異性体、および/またはヌクレオチド類似体を含むことができる。一部の実施形態では、ガイドポリヌクレオチドは、少なくとも1つの検出可能な標識を含むことができる。検出可能な標識は、フルオロフォア(例えば、FAM、TMR、Cy3、Cy5、テキサスレッド、オレゴングリーン、Alexa Fluors、Haloタグ、もしくは任意の他の適切な蛍光色素)、検出タグ(例えば、ビオチン、ジゴキシゲニンなど)、量子ドット、または金粒子であり得る。
ガイドポリヌクレオチドは、化学的に、および/または酵素的に合成され得る。例えば、ガイドRNAは、標準的なホスホロアミダイトベースの固相合成法を用いて合成することができる。あるいは、ガイドRNAをコードするDNAを、ファージRNAポリメラーゼにより認識されるプロモーター制御配列に作動可能に連結することによって、ガイドRNAをインビトロで合成することができる。適切なファージプロモーター配列の例は、T7、T3、SP6プロモーター配列、またはそれらのバリアントを含む。ガイドRNAが二つの別々の分子(例えば、crRNAとtracrRNA)を含む実施形態において、crRNAは化学的に合成することができ、tracrRNAは酵素的に合成することができる。
一部の実施形態では、塩基エディター系は、塩基エディターを1つまたは複数の座位に標的指向化させる、複数のガイドポリヌクレオチド、例えばgRNA(例えば、少なくとも1個のgRNA、少なくとも2個のgRNA、少なくとも5個のgRNA、少なくとも10個のgRNA、少なくとも20個のgRNA、少なくとも30個のgRNA、または少なくとも50個のgRNA)を含み得る。一部の実施形態では、複数のgRNA配列は、単一のポリヌクレオチド中にタンデムに配置することができる。一部の実施形態では、タンデムに配置したgRNA配列は直接反復によって隔てられる。
ガイドRNAまたはガイドポリヌクレオチドをコードしているDNA配列はベクターの一部であることもできる。さらに、ベクターは、追加の発現制御配列(例えば、エンハンサー配列、Kozak配列、ポリアデニル化配列、転写終結配列など)、選択マーカー配列(例えば、GFPまたはピューロマイシンなどの抗生物質耐性遺伝子)、複製起点等を含むことができる。ガイドRNAまたはガイドポリヌクレオチドをコードしているDNA分子は直鎖状または環状であり得る。
いくつかの態様において、塩基エディター系の1つ以上の構成要素は、DNA配列によってコードされ得る。このようなDNA配列は、発現系(例えば細胞)に一緒に、または別々に導入することができる。例えば、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインおよびガイドRNAをコードするDNA配列を細胞に導入することができ、各DNA配列は別個の分子の一部であることができ(例えばポリヌクレオチドプログラム可能なヌクレオチド結合ドメインのコード配列を含む1つのベクターおよびガイドRNAコード配列を含む第2のベクター)、または両方が同じ分子の一部であることができる(例えばポリヌクレオチドプログラム可能なヌクレオチド結合ドメインおよびガイドRNAの両方のためのコード(および調節)配列を含む一つのベクター)。
ガイドポリヌクレオチドは、新しいまたは増強された特徴を有する核酸を提供するための1以上の改変を含むことができる。ガイドポリヌクレオチドは、核酸親和性タグを含むことができる。ガイドポリヌクレオチドは、合成ヌクレオチド、合成ヌクレオチドアナログ、ヌクレオチド誘導体、および/または修飾ヌクレオチドを含むことができる。
いくつかの態様において、gRNAまたはガイドポリヌクレオチドは修飾(改変)を含むことができる。修飾は、gRNAまたはガイドポリヌクレオチドの任意の位置に施され得る。単一のgRNAまたはガイドポリヌクレオチドに対して複数の修飾を行うことができる。gRNAまたはガイドポリヌクレオチドは、修飾後に品質管理を受けることができる。いくつかの態様において、品質管理は、PAGE、HPLC、MS、またはそれらの任意の組合せを含むことができる。
gRNAまたはガイドポリヌクレオチドの修飾は、置換、挿入、欠失、化学的修飾、物理的修飾、安定化、精製、またはそれらの任意の組合せであり得る。
gRNAまたはガイドポリヌクレオチドはまた、5’アデニル酸、5’グアノシン三リン酸キャップ、5’N 7-メチルグアノシン三リン酸キャップ、5’三リン酸キャップ、3’リン酸、3’チオリン酸、5’リン酸、5’チオリン酸、Cis-Synチミジン二量体、三量体、C12スペーサー、C3スペーサー、C6スペーサー、dスペーサー、PCスペーサー、rスペーサー、スペーサー18、スペーサー9、3’-3’修飾、5’-5’修飾、塩基脱落、アクリジン、アゾベンゼン、ビオチン、ビオチンBB、ビオチンTEG、コレステロールTEG、デスチオビオチンTEG、DNP TEG、DNP-X、DOTA、dT-ビオチン、二重ビオチン、ソラレン、ソラレンC2、ソラレンC6、TINA、3’DABCYL、ブラックホールクエンチャー1、ブラックホールクエンチャー2、DABCYL SE、dT-DABCYL、IRDye QC-1、QSY-21、QSY-35、QSY-7、QSY-9、カルボキシルリンカー、チオールリンカー、2’-デオキシリボヌクレオシド類似体プリン、2’-デオキシリボヌクレオシド類似体ピリミジン、リボヌクレオシド類似体、2’-O-メチルリボヌクレオシド類似体、糖修飾類似体、ウォブル/ユニバーサル塩基、蛍光色素標識、2’-フルオロRNA、2’-O-メチルRNA、メチルホスホネート、ホスホジエステルDNA、ホスホジエステルRNA、ホスホチオエステルDNA、ホスホロチオネートRNA、UNA、プソイドリジン-5’-トリホスフェート、5’-メチルシジン-5’-トリホスフェート、またはそれらの任意の組合せでも修飾され得る。
いくつかの態様において、修飾は永続的である。その他の態様において、修飾は一時的である。いくつかの態様において、gRNAまたはガイドポリヌクレオチドに対して複数の修飾が行われる。gRNAまたはガイドポリヌクレオチドの修飾は、それらのコンホメーション、極性、疎水性、化学反応性、塩基対形成相互作用、またはそれらの組合せなどの、ヌクレオチドの物理化学的特性を変化させることができる。
PAM配列は、当該技術分野で公知の任意のPAM配列であり得る。適切なPAM配列には、以下が含まれるが、これらに限定されない:NGG, NGA, NGC, NGN, NGT, NGCG, NGAG, NGAN, NGNG, NGCN, NGCG, NGTN, NNGRRT, NNNRRT, NNGRR(N), TTTV, TYCV, TYCV, TATV, NNNNGATT, NNAGAAW, または NAAAAC。Yはピリミジンであり、Nは任意のヌクレオチド塩基であり、WはAまたはTである。
修飾はホスホロチオエート置換でもあり得る。いくつかの態様において、天然のホスホジエステル結合は細胞のヌクレアーゼによって急速に分解されやすく、ホスホロチオエート (PS) 結合置換体を用いたヌクレオチド間結合の修飾は、細胞分解による加水分解に対してより安定である。修飾は、gRNAまたはガイドポリヌクレオチドの安定性を増大させることができる。修飾は生物学的活性を増強させることもできる。いくつかの態様において、ホスホロチオエート強化RNA gRNAは、RNアーゼA、RNアーゼT1、子牛血清ヌクレアーゼ、またはそれらの組合せを阻害することができる。これらの特性は、in vivoまたはin vitroでヌクレアーゼへの暴露がある可能性が高いアプリケーションにおいて、PS-RNA gRNAの使用を可能にする。例えば、ホスホロチオエート (PS) 結合をgRNAの5'末端または3'末端における最後の3~5ヌクレオチドの間に導入することができ、それはエキソヌクレアーゼ分解を阻害し得る。いくつかの態様において、ホスホロチオエート結合をgRNA全体に加えてエンドヌクレアーゼによる攻撃を減らすことができる。
[プロトスペーサ隣接モチーフ]
「プロトスペーサー隣接モチーフ (PAM)」またはPAM様モチーフは、CRISPR細菌適応免疫系においてCas9ヌクレアーゼによって標的化されるDNA配列の直後の2~6塩基対DNA配列を指す。いくつかの実施形態では、PAMは5’PAM (すなわちプロトスペーサの5’末端の上流に位置する)であり得る。他の実施形態では、PAMは3’PAM (すなわちプロトスペーサの5’末端の下流に位置する)であり得る。
PAM配列は標的結合に必須であるが、正確な配列はCasタンパク質の種類に依存する。
本明細書で提供される塩基エディターは、標準的または非標準的プロトスペーサー隣接モチーフ (PAM) 配列を含むヌクレオチド配列に結合することができるCRISPRタンパク質由来ドメインを含むことができる。PAM部位は、標的ポリヌクレオチド配列に近接するヌクレオチド配列である。本開示のいくつかの側面は、異なるPAM特異性を有するCRISPRタンパク質の全部または一部を含む塩基エディターを提供する。例えば、S. pyogenes由来のCas9 (spCas9) などのCas9タンパク質は、典型的に、特定の核酸領域に結合するために標準的なNGG PAM配列を必要とし、ここで「NGG」中の「N」はアデニン(A) 、チミン (T) 、グアニン (G) 、またはシトシン(C) であり、Gはグアニンである。PAMはCRISPRタンパク質特異的であり得、異なるCRISPRタンパク質由来ドメインを含む異なる塩基エディター間で異なり得る。PAMは標的配列の5’または3’にあり得る。PAMは、標的配列の上流または下流にあり得る。PAMは、1、2、3、4、5、6、7、8、9、10またはそれ以上のヌクレオチドの長さであり得る。多くの場合、PAMは2~6ヌクレオチドの長さである。いくつかのPAMバリアントが下記表2に記載されている。
表2:Cas9タンパク質および対応するPAM配列
Figure 2022519882000029
一部の実施形態では、PAMはNGCである。一部の実施形態では、NGC PAMはCas9バリアントによって認識される。一部の実施形態では、NGC PAMバリアントは、D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、およびT1337Rから選択される1つまたは複数のアミノ酸置換(「MQKFRAER」と総称する)を含む。
一部の実施形態では、PAMはNGTである。一部の実施形態では、NGT PAMはCas9バリアントによって認識される。一部の実施形態では、NGT PAMバリアントは、1つまたは複数の残基1335、1337、1135、1136、1218、および/または1219での標的化突然変異を通じて生じる。一部の実施形態では、NGT PAMバリアントは、1つまたは複数の残基1219、1335、1337、1218での標的化突然変異を通じて生じる。いくつかの実施形態において、NGT PAMバリアントは、残基1135、1136、1218、1219、および1335の一つまたは複数における標的化突然変異を通じて作成される。いくつかの実施形態において、NGT PAMバリアントは、下記表3Aおよび3Bに提供される標的化突然変異のセットから選択される。
表3A:残基1219, 1335, 1337, 1218におけるNGT PAMバリアント変異
Figure 2022519882000030
表3B:残基1135, 1136, 1218, 1219, および1335におけるNGT PAMバリアント変異
Figure 2022519882000031
いくつかの実施形態において、NGT PAMバリアントは、表2および3のバリアント5、7、28、31、または36から選択される。いくつかの実施形態において、バリアントは、改善されたNGT PAM認識を有する。
いくつかの実施形態では、NGT PAMバリアントは、残基1219、1335、1337および/または1218において突然変異を有する。いくつかの実施形態では、NGT PAMバリアントは、下記表4に提供されるバリアントから、認識を改善するための変異を伴って選択される。
表4:残基1219, 1335, 1337, および1218におけるNGT PAMバリアント変異
Figure 2022519882000032
一部の実施形態では、NGT PAMに対する特異性を有する塩基エディターを、以下の表5に提供するように生じさせ得る。
表5:NGT PAMバリアント
Figure 2022519882000033
一部の実施形態では、NGTNバリアントはバリアント1である。一部の実施形態では、NGTNバリアントはバリアント2である。一部の実施形態では、NGTNバリアントはバリアント3である。一部の実施形態では、NGTNバリアントはバリアント4である。一部の実施形態では、NGTNバリアントはバリアント5である。一部の実施形態では、NGTNバリアントはバリアント6である。
ある態様において、Cas9ドメインは、Streptococcus pyogenes由来のCas9ドメインである(SpCas9)。ある態様において、SpCas9ドメインは、ヌクレアーゼ活性SpCas9、ヌクレアーゼ不活性SpCas9 (SpCas9d) 、またはSpCas9ニッカーゼ (SpCas9n) である。いくつかの実施形態において、SpCas9は、D9X突然変異、または本明細書に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含み、ここでXはD以外のアミノ酸である。いくつかの実施形態において、SpCas9は、D9A突然変異、または本明細書に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含む。ある態様において、SpCas9ドメイン、SpCas9dドメインまたはSpCas9nドメインは、非標準PAMを有する核酸配列に結合することができる。ある態様において、SpCas9ドメイン、SpCas9dドメインまたはSpCas9nドメインは、NGG、NGAまたはNGCG PAM配列を有する核酸配列に結合することができる。
いくつかの実施形態において、SpCas9ドメインは、D1134X、R1335X、およびT1336X突然変異の1つ以上、または本明細書に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含み、ここでXは任意のアミノ酸である。いくつかの実施形態において、SpCas9ドメインは、D1134E、R1335Q、およびT1336R突然変異の1つ以上、または本明細書に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含む。いくつかの実施形態において、SpCas9ドメインは、D1134E、R1335Q、およびT1336R突然変異、または本明細書に提供されるアミノ配列のいずれかにおける対応する突然変異を含む。いくつかの実施形態において、SpCas9ドメインは、D1134X、R1335X、およびT1336X突然変異のうちの1つ以上、または本明細書において提供されるアミノ酸配列のいずれかにおける対応する突然変異を含み、ここでXは任意のアミノ酸である。いくつかの実施形態において、SpCas9ドメインは、D1134V、R1335Q、およびT1336R突然変異の1以上、または本明細書に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含む。いくつかの実施形態において、SpCas9ドメインは、D1134V、R1335Q、およびT1337R突然変異、または本明細書に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含む。いくつかの実施形態において、SpCas9ドメインは、D1134X、G1217X、R1335X、およびT1336X突然変異の1以上、または本明細書に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含み、ここでXは任意のアミノ酸である。いくつかの実施形態において、SpCas9ドメインは、D1134V、G1217R、R1335Q、およびT1336R突然変異の1つ以上、または本明細書に提供されるアミノ配列のいずれかにおける対応する突然変異を含む。いくつかの実施形態において、SpCas9ドメインは、D1134V、G1217R、R1335Q、およびT1336R突然変異、または本明細書において提供されるアミノ酸配列のいずれかにおける対応する突然変異を含む。
いくつかの実施形態において、本明細書に提供される融合タンパク質のいずれかのCas9ドメインは、本明細書に記載されるCas9ポリペプチドに対して少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。いくつかの実施形態において、本明細書に提供される融合タンパク質のいずれかのCas9ドメインは、本明細書に記載される任意のCas9ポリペプチドのアミノ酸配列を含む。いくつかの実施形態において、本明細書に提供される融合タンパク質のいずれかのCas9ドメインは、本明細書に記載される任意のCas9ポリペプチドのアミノ酸配列からなる。
いくつかの例において、本明細書に開示される塩基エディターのCRISPRタンパク質由来ドメインによって認識されるPAMは、塩基エディターをコードするインサート(例えばAAVインサート)とは別個のオリゴヌクレオチド上で細胞に提供され得る。そのような実施形態では、別個のオリゴヌクレオチド上にPAMを提供することは、さもなくば標的配列と同じポリヌクレオチド上に隣接するPAMが存在しないために切断することができない標的配列の切断を可能にする。
一実施形態において、S. pyogenes Cas9 (SpCas9) を、ゲノム工学のためのCRISPRエンドヌクレアーゼとして使用することができる。ただし、他のものも使用され得る。いくつかの実施形態では、異なるエンドヌクレアーゼを用いて特定のゲノム標的を標的化することができる。いくつかの実施形態では、非NGG PAM配列を有する合成SpCas9由来バリアントを使用することができる。さらに、様々な種からの他のCas9オルソログが同定されており、これらの 「非SpCas9」は、本開示でも有用になり得る種々のPAM配列に結合し得る。例えば、比較的大きなサイズのSpCas9(約4kbのコード配列)は、細胞内で効率的に発現することができないSpCas9 cDNAプラスミドをもたらすこともあり得る。逆に、Staphylococcus aureus Cas9 (SaCas9) のコード配列は、SpCas9よりも約1キロベース短いので、細胞内で効率的に発現させ得る。SpCas9と同様に、SaCas9エンドヌクレアーゼは、in vitroの哺乳類細胞およびin vivoのマウスにおいて標的遺伝子を修飾する能力がある。ある実施形態では、Casタンパク質は異なるPAM配列を標的とすることができる。いくつかの実施形態において、標的遺伝子は、Cas9 PAM、例えば、5’-NGGに隣接し得る。他の実施形態では、他のCas9オーソログは異なるPAM要件を有し得る。例えば、S. thermophilus のもののようなPAM(CRISPR1の場合は5’-NNAGAA、CRISPR3の場合は5’-NGGNG)およびNeisseria meningiditis のもの(5’-NNNNGATT)のような他のPAMも標的遺伝子に隣接して見出され得る。
いくつかの実施形態において、S. pyogenes系について、標的遺伝子配列は、5’-NGG PAMの前(すなわち、その5’側)にあり得、20 ntガイドRNA配列が、反対側の鎖と塩基対を形成して、PAMに隣接するCas9切断を媒介することができる。ある実施形態では、隣接切断は、PAMの(約)3塩基対上流であり得る。ある実施形態では、隣接切断は、PAMの(約)10塩基対上流であり得る。ある実施形態では、隣接切断は、PAMの(約)0~20塩基対上流であり得る。例えば、隣接切断は、PAM上流の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30塩基対の隣であり得る。隣接切断はPAMの1~30塩基対下流でもあり得る。PAM配列に結合することができる例示的なSpCas9タンパク質の配列は、以下の通りである:
例示的なPAM結合SpCas9のアミノ酸配列は以下の通りである:
MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
例示的なPAM結合SpCas9nのアミノ酸配列は以下の通りである:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
例示的なPAM結合SpEQR Cas9のアミノ酸配列は以下の通りである:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESVLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFESPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGD
上記配列において、D1134、R1335、およびT1336から突然変異させてSpEQR Cas9を得ることができる残基E1134、Q1334、およびR1336を、下線を引いて太字にしている。
例示的なPAM結合SpVQR Cas9のアミノ酸配列は以下の通りである:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGD
上記配列において、D1134、R1335、およびT1336から突然変異させてSpVQR Cas9を得ることができる残基V1134、Q1334、およびR1336を、下線を引いて太字にしている。
例示的なPAM結合SpVRER Cas9のアミノ酸配列は以下の通りである:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKEYRSTKEVLDATLIHQSITGLYETRIDLSQLGGD.
上記配列において、D1134、G1217、R1335、およびT1336から突然変異させてSpVRER Cas9を得ることができる残基V1134、R1217、Q1334、およびR1336を、下線を引いて太字にしている。
一部の実施形態では、操作したSpCas9バリアントは、3'H(非G PAM)が隣接するプロトスペーサー隣接モチーフ(PAM)配列を認識することができる(表1A~1D、図24を参照)。一部の実施形態では、SpCas9バリアントはNRNH PAM(式中、RはAまたはGであり、HはA、C、またはTである)を認識する。一部の実施形態では、非G PAMは、NRRH、NRTH、またはNRCHである(例えばMiller, S.M., et al. Continuous evolution of SpCas9 variants compatible with non-G PAMs, Nat. Biotechnol. (2020)を参照、その内容がその全体で参照により本明細書に組み込まれる)。
一部の実施形態では、Cas9ドメインは組換えCas9ドメインである。一部の実施形態では、組換えCas9ドメインはSpyMacCas9ドメインである。一部の実施形態では、SpyMacCas9ドメインは、ヌクレアーゼ活性型SpyMacCas9、ヌクレアーゼ不活性なSpyMacCas9(SpyMacCas9d)、またはSpyMacCas9ニッカーゼ(SpyMacCas9n)である。一部の実施形態では、SaCas9ドメイン、SaCas9dドメイン、またはSaCas9nドメインは、非カノニカルPAMを有する核酸配列と結合することができる。一部の実施形態では、SpyMacCas9ドメイン、SpCas9dドメイン、またはSpCas9nドメインは、NAA PAM配列を有する核酸配列と結合することができる。
ネイティブ5'-NAAN-3'PAM特異性を有するStreptococcus macacae中のSpy Cas9の例示的なCas9 Aホモログの配列は当技術分野で知られており、例えばJakimo et al., (www.biorxiv.org/content/biorxiv/early/2018/09/27/429654.full.pdf)によって記載されており、以下に提供する。
SpyMacCas9
MDKKYSIGLDIGTNSVGWAVITDDYKVPSKKFKVLGNTDRHSIKKNLIGALLFGSGETAE
ATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFG
NIVDEVAYHEKYPTIYHLRKKLADSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSD
VDKLFIQLVQIYNQLFEENPINASRVDAKAILSARLSKSRRLENLIAQLPGEKRNGLFGN
LIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNSEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYA
GYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELH
AILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEE
VVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFL
SGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGAYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDRGMIEERLKTYAHLFDDKVMKQLKRRRYTGWG
RLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGHSL
HEQIANLAGSPAIKKGILQTVKIVDELVKVMGHKPENIVIEMARENQTTQKGQKNSRERM
KRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHI
VPQSFIKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLT
KAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSK
LVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKM
IAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFA
TVRKVLSMPQVNIVKKTEIQTVGQNGGLFDDNPKSPLEVTPSKLVPLKKELNPKKYGGYQ
KPTTAYPVLLITDTKQLIPISVMNKKQFEQNPVKFLRDRGYQQVGKNDFIKLPKYTLVDI
GDGIKRLWASSKEIHKGNQLVVSKKSQILLYHAHHLDSDLSNDYLQNHNQQFDVLFNEII
SFSKKCKLGKEHIQKIENVYSNKKNSASIEELAESFIKLLGFTQLGATSPFNFLGVKLNQ
KQYKGKKDYILPCTEGTLIRQSITGLYETRVDLSKIGED.
一部の実施形態では、バリアントCas9タンパク質は、H840A、P475A、W476A、N477A、D1125A、W1126A、およびD1218Aの突然変異を保有し、その結果、ポリペプチドは、標的DNAまたはRNAを切断する能力が低下している。そのようなCas9タンパク質は、標的DNA(例えば一本鎖標的DNA)を切断する能力が低下しているが、標的DNA(例えば一本鎖標的DNA)と結合する能力を保持している。別の非限定的な例として、一部の実施形態では、バリアントCas9タンパク質は、D10A、H840A、P475A、W476A、N477A、D1125A、W1126A、およびD1218Aの突然変異を保有し、その結果、ポリペプチドは、標的DNAを切断する能力が低下している。そのようなCas9タンパク質は、標的DNA(例えば一本鎖標的DNA)を切断する能力が低下しているが、標的DNA(例えば一本鎖標的DNA)と結合する能力を保持している。一部の実施形態では、バリアントCas9タンパク質がW476AおよびW1126Aの突然変異を保有する場合、またはバリアントCas9タンパク質がP475A、W476A、N477A、D1125A、W1126A、およびD1218Aの突然変異を保有する場合、バリアントCas9タンパク質はPAM配列と効率的に結合しない。したがって、一部のそのような事例では、そのようなバリアントCas9タンパク質を結合の方法に使用する場合、この方法はPAM配列を必要としない。言い換えれば、一部の実施形態では、そのようなバリアントCas9タンパク質を結合の方法に使用する場合、この方法はガイドRNAを含むことができるが、この方法はPAM配列の非存在下で行うことができる(したがって、結合の特異性はガイドRNAの標的化セグメントによって提供される)。上記効果(すなわち、一方または他方のヌクレアーゼ部分を不活性化させる)を達成するために、他の残基を突然変異させることができる。非限定的な例として、残基D10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D986、および/またはA987を変更(すなわち置換)することができる。また、アラニン置換以外の突然変異が適切である。
一部の実施形態では、塩基エディターのCRISPRタンパク質由来ドメインは、カノニカルPAM配列(NGG)を有するCas9タンパク質の全体または一部分を含むことができる。他の実施形態では、塩基エディターのCas9由来ドメインは非カノニカルPAM配列を用いることができる。そのような配列は当技術分野において記載されており、当業者に明らかであろう。例えば、非カノニカルPAM配列と結合するCas9ドメインは、Kleinstiver, B. P., et al., “Engineered CRISPR-Cas9 nucleases with altered PAM specificities” Nature 523, 481-485 (2015)およびKleinstiver, B. P., et al., “Broadening the targeting range of Staphylococcus aureus CRISPR-Cas9 by modifying PAM recognition” Nature Biotechnology 33, 1293-1298 (2015)に記載されており、これらの各々の全内容は参照により本明細書に組み込まれる。
[低下したPAM排他性を有するCas9ドメイン]
典型的には、S. pyrogenes由来のCas9(spCas9)などのCas9タンパク質は、特定の核酸領域と結合するためにカノニカルNGG PAM配列を必要とし、ここで、「NGG」中の「N」は、アデノシン(A)、チミジン(T)、またはシトシン(C)であり、Gはグアノシンである。これは、ゲノム内の所望の塩基を編集する能力を制限し得る。一部の実施形態では、本明細書中に提供される塩基編集融合タンパク質は、正確な位置、例えば、PAMの上流である標的塩基を含む領域に配置する必要があり得る。例えばKomor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016)を参照されたい(その内容が全体で参照により本明細書に組み込まれる)。したがって、一部の実施形態では、本明細書中に提供される融合タンパク質のいずれかは、カノニカル(例えばNGG)PAM配列を含有しないヌクレオチド配列と結合することができるCas9ドメインを含有し得る。非カノニカルPAM配列と結合するCas9ドメインは当技術分野において記載されており、当業者に明らかであろう。例えば、非カノニカルPAM配列と結合するCas9ドメインは、Kleinstiver, B. P., et al., “Engineered CRISPR-Cas9 nucleases with altered PAM specificities” Nature 523, 481-485 (2015)およびKleinstiver, B. P., et al., “Broadening the targeting range of Staphylococcus aureus CRISPR-Cas9 by modifying PAM recognition” Nature Biotechnology 33, 1293-1298 (2015)に記載されており、これらの各々の全内容は参照により本明細書に組み込まれる。
[高忠実度のCas9ドメイン]
本開示の一部の態様は、高忠実度のCas9ドメインを提供する。一部の実施形態では、高忠実度のCas9ドメインは、対応する野生型Cas9ドメインと比較して、Cas9ドメインとDNAの糖-リン酸主鎖との間の静電相互作用を減少させる1つまたは複数の突然変異を含む、操作したCas9ドメインである。任意の特定の理論に縛られることを望まずに、DNAの糖-リン酸主鎖との静電相互作用が減少した高忠実度のCas9ドメインは、より少ないオフターゲット効果を有し得る。一部の実施形態では、Cas9ドメイン(例えば野生型Cas9ドメイン)は、Cas9ドメインとDNAの糖-リン酸主鎖との間の会合を減少させる1つまたは複数の突然変異を含む。一部の実施形態では、Cas9ドメインは、Cas9ドメインとDNAの糖-リン酸主鎖との間の会合を、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、または少なくとも70%減少させる1つまたは複数の突然変異を含む。
一部の実施形態では、本明細書中に提供されるCas9融合タンパク質のいずれかは、N497X、R661X、Q695X、および/もしくはQ926X突然変異のうちの1つもしくは複数、または本明細書中に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含む(式中、Xは任意のアミノ酸である)。一部の実施形態では、本明細書中に提供されるCas9融合タンパク質のいずれかは、N497A、R661A、Q695A、および/もしくはQ926A突然変異のうちの1つもしくは複数、または本明細書中に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含む。一部の実施形態では、Cas9ドメインは、D10A突然変異、または本明細書中に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含む。高忠実度のCas9ドメインは当技術分野で知られており、当業者に明らかであろう。例えば、高忠実度のCas9ドメインは、Kleinstiver, B.P., et al. “High-fidelity CRISPR-Cas9 nucleases with no detectable genome-wide off-target effects.” Nature 529, 490-495 (2016)およびSlaymaker, I.M., et al. “Rationally engineered Cas9 nucleases with improved specificity.” Science 351, 84-88 (2015)に記載されており、これらの各々の全内容は参照により本明細書に組み込まれる。
一部の実施形態では、修飾Cas9は高忠実度のCas9酵素である。一部の実施形態では、高忠実度のCas9酵素は、SpCas9(K855A)、eSpCas9(1.1)、SpCas9-HF1、または高精度Cas9バリアント(HypaCas9)である。修飾Cas9 eSpCas9(1.1)は、HNH/RuvC溝と非標的DNA鎖との間の相互作用を弱め、オフターゲット部位での鎖の分離および切断を防止する、アラニン置換を含有する。同様に、SpCas9-HF1は、Cas9とDNAリン酸主鎖との相互作用を破壊するアラニン置換を介して、オフターゲット編集を下げる。HypaCas9は、Cas9の校正および標的識別を増加させる突然変異(SpCas9 N692A/M694A/Q695A/H698A)をREC3ドメイン中に含有する。3つすべての高忠実度の酵素は、野生型Cas9よりも少ないオフターゲット編集を生じる。
例示的な高忠実度のCas9を以下に提供する。
Cas9と比較した高忠実度のCas9ドメイン突然変異を太字で示し、下線を引いた。
DKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTAFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGALSRKLINGIRDKQSGKTILDFLKSDGFANRNFMALIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRAITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
[核局在化配列(NLS) を含む融合タンパク質]
いくつかの態様において、本明細書で提供される融合タンパク質は、一つ以上 (例:2, 3, 4, 5) の核ターゲティング配列、例えば、核局在化配列 (NLS) をさらに含む。一実施形態では、二部分(bipartite)NLSが使用される。いくつかの態様において、NLSは、NLSを含むタンパク質の細胞核中への輸入(例えば核輸送によるもの)を促進するアミノ酸配列を含む。いくつかの実施形態において、本明細書において提供される融合タンパク質のいずれかは、核局在化配列 (NLS) をさらに含む。いくつかの実施形態において、NLSは融合タンパク質のN末端に融合される。いくつかの実施形態において、NLSは融合タンパク質のC末端に融合される。いくつかの実施形態において、NLSはCas9ドメインのN末端に融合される。いくつかの実施形態において、NLSはnCas9ドメインまたはdCas9ドメインのC末端に融合される。いくつかの実施形態において、NLSはデアミナーゼのN末端に融合される。いくつかの実施形態において、NLSはデアミナーゼのC末端に融合される。いくつかの実施形態において、NLSは、1つ以上のリンカーを介して融合タンパク質に融合される。ある態様において、NLSは、リンカーなしで融合タンパク質に融合される。いくつかの実施形態において、NLSは、本明細書において提供または参照されるNLS配列のいずれか1つのアミノ酸配列を含む。さらなる核局在化配列は当技術分野で公知であり、当業者には明らかであろう。例えば、NLS配列は、Plank et al., PCT/EP2000/011690に記載されており、その内容は、例示的な核局在化配列の開示について参照により本明細書に組み込まれる。一部の実施形態では、NLSは、以下から選択されるアミノ酸配列を含む: PKKKRKVEGADKRTADGSEFESPKKKRKV, KRTADGSEFESPKKKRKV, KRPAATKKAGQAKKKK, KKTELQTTNAENKTKKL, KRGINDRNFWRGENGRKTR, RKSGKIAAIVVKRPRKPKKKRKV, またはMDSLLMNRRKFLYQFKNVRWAKGRRETYLC。
いくつかの実施形態において、NLSはリンカー中に存在するか、またはNLSはリンカー、例えば本明細書に記載されるリンカーによって隣接される。いくつかの実施形態において、N末端またはC末端NLSは、二部分NLSである。二部分NLSは、比較的短いスペーサー配列によって分離される二つの塩基性アミノ酸クラスターを含む(それゆえにbipartite、二部分と呼ばれ、一部分(monopartite)NLSは異なる)。ヌクレオプラスミンのNLSであるKR[PAATKKAGQA]KKKKは遍在的な二部シグナルのプロトタイプであり、塩基性アミノ酸の二つのクラスターが約10アミノ酸のスペーサーによって隔てられたものである。例示的な二部NLSの配列は、PKKKRKVEGADKRTADGSEFESPKKKRKVである。
一部の実施形態では、アデノシンデアミナーゼ、napDNAbp(例えばCas9ドメイン)、およびNLSを含む融合タンパク質は、リンカー配列を含まない。一部の実施形態では、ドメインまたはタンパク質(例えば、アデノシンデアミナーゼ、Cas9ドメイン、またはNLS)のうちの1つまたは複数の間のリンカー配列が存在する。一部の実施形態では、アデノシンデアミナーゼおよびCas9ドメインを有する例示的なCas9融合タンパク質の一般構造は、以下の構造のいずれかを含み、ここで、NLSは核局在化配列(例えば、本明細書中に提供される任意のNLS)であり、NH2は融合タンパク質のN末端であり、COOHは融合タンパク質のC末端である:
NH2-NLS-[アデノシンデアミナーゼ]-[Cas9ドメイン]-COOH、
NH2-NLS [Cas9ドメイン]-[ アデノシンデアミナーゼ]-COOH、
NH2-[ アデノシンデアミナーゼ]-[Cas9ドメイン]-NLS-COOH、または
NH2-[Cas9ドメイン]-[ アデノシンデアミナーゼ]-NLS-COOH。
本開示の融合タンパク質は1つまたは複数の追加の特徴を含み得ることを理解されたい。例えば、一部の実施形態では、融合タンパク質は、阻害因子、細胞質局在化配列、核外輸送配列などの輸出配列、または他の局在化配列、ならびに融合タンパク質の可溶化、精製、または検出に有用な配列タグを含み得る。本明細書中に提供される適切なタンパク質タグとしては、それだけには限定されないが、ビオチンカルボキシラーゼ担体タンパク質(BCCP)タグ、mycタグ、カルモジュリンタグ、FLAGタグ、ヘマグルチニン(HA)タグ、ヒスチジンタグまたはHisタグとしても言及するポリヒスチジンタグ、マルトース結合タンパク質(MBP)タグ、nusタグ、グルタチオン-S-トランスフェラーゼ(GST)タグ、緑色蛍光タンパク質(GFP)タグ、チオレドキシンタグ、Sタグ、Softag(例えば、Softag1、Softag3)、strepタグ、ビオチンリガーゼタグ、FlAsHタグ、V5タグ、およびSBPタグが挙げられる。追加の適切な配列は当業者に明らかであろう。一部の実施形態では、融合タンパク質は、1つまたは複数のHisタグを含む。
1以上の核局在化配列 (NLS) を含むCRISPR酵素をコードするベクターを使用することができる。例えば、約1、2、3、4、5、6、7、8、9、10個のNLSを使用することができる。CRISPR酵素は、アミノ末端またはその近傍のNLS、カルボキシ末端またはその近傍の約1個、2個、3個、4個、5個、6個、7個、8個、9個、10個またはそれ以上のNLS、またはこれらの任意の組合せ(例えばアミノ末端における1以上のNLSおよびカルボキシ末端における1以上のNLS)を含むことができる。複数のNLSが存在する場合、各NLSは他から独立して選択することができ、したがって1つのNLSが1つ以上のコピーで存在することができ、および/または1つ以上のコピーで存在する1つ以上の他のNLSと組み合わせて存在することができる。
法において使用されるCRISPR酵素は、約6個のNLSを含むことができる。NLSに最も近いアミノ酸がN-またはC-末端からポリペプチド鎖に沿って約50アミノ酸内(例えば1、2、3、4、5、10、15、20、25、30、40、または50アミノ酸内)にあるとき、そのNLSはN-またはC-末端の近傍にあると考えられる。
[核酸塩基編集ドメイン]
ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインおよび核酸塩基編集ドメイン(例えばデアミナーゼドメイン)を含む融合タンパク質を含む塩基エディターを本明細書に記載する。塩基エディターは、標的配列を認識することができるガイドポリヌクレオチドと相互作用することによって、標的ポリヌクレオチド配列中の1以上の塩基を編集するようにプログラムすることができる。標的配列がいったん認識されると、編集が行われるポリヌクレオチド上に塩基エディターが固定され、次いで、塩基エディターのデアミナーゼドメイン成分が標的塩基を編集することができる。
ある態様において、核酸塩基編集ドメインは、デアミナーゼドメインを含む。本明細書で特に説明されているように、デアミナーゼドメインは、アデノシンデアミナーゼを含むいくつかの実施形態では、「アデニンデアミナーゼ」および「アデノシンデアミナーゼ」という用語は、交換可能に使用され得る。核酸塩基編集タンパク質の詳細は、国際PCT出願番号PCT/2017/045381 (WO2018/027078) およびPCT/US2016/058344 (WO2017/070632) に記載されており、これらの各々は、その全体が参照により本明細書に組み込まれる。Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017); および Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity”Science Advances 3:eaao4774 (2017)も参照(その全内容が参照により本明細書に組み込まれる)。
[AからGへの編集]
いくつかの実施形態において、本明細書に記載される塩基エディターは、アデノシンデアミナーゼを含むデアミナーゼドメインを含むことができる。塩基エディターのこのようなアデノシンデアミナーゼドメインは、Aを脱アミノ化して、Gの塩基対形成特性を示すイノシン (I) を形成することによって、アデニン (A) 核酸塩基からグアニン (G) 核酸塩基への編集することを促進することができる。アデノシンデアミナーゼは、デオキシリボ核酸 (DNA) 中のデオキシアデノシン残基のアデニンを脱アミノ化すること(すなわちアミン基を除去すること)ができる。
いくつかの実施形態において、本明細書において提供される核酸塩基エディターは、1つ以上のタンパク質ドメインを融合させ、それによって融合タンパク質を生成することによって作製することができる。ある態様において、本明細書において提供される融合タンパク質は、融合タンパク質の塩基編集活性(例えば効率、選択性、特異性)を改善する一つ以上の特徴を含む。例えば、本明細書中に提供される融合タンパク質は、ヌクレアーゼ活性が低下したCas9ドメインを含むことができる。いくつかの実施形態において、本明細書中で提供される融合タンパク質は、ヌクレアーゼ活性を有さないCas9ドメイン (dCas9) 、または、Cas9ニッカーゼ(nCas9) と呼ばれる、二本鎖DNA分子の一鎖を切断するCas9ドメインを有することができる。いかなる特定の理論にも拘束されることを望まないが、触媒残基(例えばH840)の存在が、標的Aと反対のTを含有する非編集(例えば非脱アミノ化)鎖を切断するCas9の活性を維持する。Cas9の触媒残基の突然変異(例えばD10からA10)は、標的A残基を含有する編集鎖の切断を妨げる。このようなCas9バリエーションは、gRNAによって規定される標的配列に基づく特定の位置で単一鎖DNA切断 (ニック) を生じさせることができ、非編集鎖の修復を導き、最終的には編集鎖においてTからCへの変化をもたらす。ある態様において、AからGへの塩基エディターは、イノシン塩基除去修復の阻害因子、例えば、ウラシルグリコシラーゼ阻害因子 (UGI) ドメインまたは触媒的に不活性なイノシン特異的ヌクレアーゼをさらに含む。いかなる特定の理論にも束縛されることを望まないが、UGIドメインまたは触媒的に不活性なイノシン特異的ヌクレアーゼは、脱アミノ化されたアデノシン残基(例えばイノシン)の塩基除去修復を阻害または防止することができ、これが、塩基エディターの活性または効率を改善させることができる。
アデノシンデアミナーゼを含む塩基エディターは、DNA、RNAおよびDNA-RNAハイブリッドを含む任意のポリヌクレオチドに作用することができる。特定の実施形態では、アデノシンデアミナーゼを含む塩基エディターは、RNAを含むポリヌクレオチドの標的Aを脱アミノ化することができる。例えば、塩基エディターは、RNAポリヌクレオチドおよび/またはDNA-RNAハイブリッドポリヌクレオチドの標的Aを脱アミノ化することができるアデノシンデアミナーゼドメインを含むことができる。一実施形態によると、塩基エディターに組み込まれたアデノシンデアミナーゼは、RNAに作用するアデノシンデアミナーゼ(ADAR、例えばADAR1またはADAR2)の全部または一部を含む。別の実施形態では、塩基エディターに組み込まれたアデノシンデアミナーゼは、tRNAに作用するアデノシンデアミナーゼ(ADAT)の全部または一部を含む。アデノシンデアミナーゼドメインを含む塩基エディターはまた、DNAポリヌクレオチドのA核酸塩基を脱アミノ化する能力も有し得る。一実施形態では、塩基エディターのアデノシンデアミナーゼドメインは、1以上の突然変異を含むADATの全部または一部を含み、これがDNA中の標的AをADATが脱アミノ化することを可能にする。例えば、塩基エディターは、D108N、A106V、D147Y、E155V、L84F、H123Y、I156F、または別のアデノシンデアミナーゼにおける対応する突然変異の1以上を含む大腸菌由来のADAT (EcTadA)の全部または一部を含むことができる。
アデノシンデアミナーゼは、任意の適切な生物(例えばE. coli)に由来することができる。一部の実施形態では、アデノシンデアミナーゼは原核生物に由来する。一部の実施形態では、アデノシンデアミナーゼは細菌に由来する。一部の実施形態では、アデノシンデアミナーゼは、Escherichia coli、Staphylococcus aureus、Salmonella typhi、Shewanella putrefaciens、Haemophilus influenzae、Caulobacter crescentus、または Bacillus subtilisに由来する。一部の実施形態では、アデノシンデアミナーゼはE. coliに由来する。ある態様において、アデニンデアミナーゼは、天然に存在するアデノシンデアミナーゼが本明細書に提供される突然変異のいずれかに対応する一つ以上の突然変異を含むものである(例えば、ecTadAにおける突然変異)。任意の相同タンパク質中の対応する残基は、例えば、配列アラインメントおよび相同残基の決定によって同定することができる。本明細書中に記載された突然変異のいずれか(例えば、ecTadAで同定された突然変異のいずれか)に対応する、任意の天然アデノシンデアミナーゼ(例えば、ecTadAに対して相同性を有するもの)における突然変異を、それに応じて生成することができる。
[アデノシンデアミナーゼ]
一部の実施形態では、本明細書中に記載の塩基エディターは、アデノシンデアミナーゼを含むデアミナーゼドメインを含むことができる。塩基エディターのそのようなアデノシンデアミナーゼドメインは、Aを脱アミノ化してGの塩基対合特性を示すイノシン(I)を形成することによって、アデニン(A)核酸塩基からグアニン(G)核酸塩基への編集を容易にすることができる。アデノシンデアミナーゼは、デオキシリボ核酸(DNA)中のデオキシアデノシン残基のアデニンを脱アミノ化(すなわちアミン基を除去)することができる。
一部の実施形態では、本明細書中に提供されるアデノシンデアミナーゼは、アデニンを脱アミノ化することができる。一部の実施形態では、本明細書中に提供されるアデノシンデアミナーゼは、DNAのデオキシアデノシン残基中のアデニンを脱アミノ化することができる。一部の実施形態では、アデニンデアミナーゼは、本明細書中に提供される突然変異のいずれか(例えばecTadA中の突然変異)に対応する1つまたは複数の突然変異を含む、天然に存在するアデノシンデアミナーゼである。当業者は、例えば配列アラインメントおよび相同的残基の決定によって、任意の相同的タンパク質中の対応する残基を同定することができるであろう。したがって、当業者は、任意の天然に存在するアデノシンデアミナーゼ(例えばecTadAに対して相同性を有するもの)中に、本明細書中に記載の突然変異のいずれか、例えばecTadA中で同定された突然変異のいずれかに対応する突然変異を生じさせることができるであろう。一部の実施形態では、アデノシンデアミナーゼは原核生物に由来する。一部の実施形態では、アデノシンデアミナーゼは細菌に由来する。一部の実施形態では、アデノシンデアミナーゼは、Escherichia coli、Staphylococcus aureus、Salmonella typhi、Shewanella putrefaciens、Haemophilus influenzae、Caulobacter crescentus、または Bacillus subtilisに由来する。一部の実施形態では、アデノシンデアミナーゼはE. coliに由来する。
本発明は、増加した効率(>50~60%)および特異性を有するアデノシンデアミナーゼバリアントを提供する。具体的には、本明細書中に記載のアデノシンデアミナーゼバリアントは、ポリヌクレオチド内の所望の塩基を編集する可能性がより高く、改変することを意図しない塩基(すなわち「バイスタンダー」)を編集する可能性がより低い。
特定の実施形態では、TadAは、PCT/US2017/045381(WO 2018/027078)(その全体で参照により本明細書に組み込まれる)に記載されているTadAのうちの任意の1つである。
一部の実施形態では、本発明の核酸塩基エディターは、以下の配列中に1つの改変を含むアデノシンデアミナーゼバリアントである:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
(TadA*7.10とも呼ばれる)。
特定の実施形態では、融合タンパク質は、単一の(例えばモノマーとして提供される)TadA*8バリアントを含む。一部の実施形態では、TadA*8は、Cas9ニッカーゼと連結している。一部の実施形態では、本発明の融合タンパク質は、TadA*8バリアントと連結した野生型TadA(TadA(野生型))のヘテロ二量体を含む。他の実施形態では、本発明の融合タンパク質は、TadA*8バリアントと連結したTadA*7.10のヘテロ二量体を含む。一部の実施形態では、塩基エディターは、TadA*8バリアントモノマーを含むABE8である。一部の実施形態では、塩基エディターは、TadA*8バリアントおよびTadA(野生型)のヘテロ二量体を含むABE8である。一部の実施形態では、塩基エディターは、TadA*8バリアントおよびTadA*7.10のヘテロ二量体を含むABE8である。一部の実施形態では、塩基エディターは、TadA*8バリアントのヘテロ二量体を含むABE8である。一部の実施形態では、TadA*8バリアントは表7から選択される。一部の実施形態では、ABE8は表7から選択される。関連配列は以下の通りである:
野生型TadA(TadA(野生型))または「TadA参照配列」
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKKAQSSTD (配列番号2)
TadA*7.10:
MSEVEFSHEYW MRHALTLAKR ARDEREVPVG AVLVLNNRVI GEGWNRAIGL HDPTAHAEIM ALRQGGLVMQ NYRLIDATLY VTFEPCVMCA GAMIHSRIGR VVFGVRNAKT GAAGSLMDVL HYPGMNHRVE ITEGILADEC AALLCYFFRM PRQVFNAQKK AQSSTD
ある態様において、アデノシンデアミナーゼは、本明細書で提供されるアデノシンデアミナーゼのいずれかのアミノ酸配列のいずれかに対して少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性を有するアミノ酸配列を含む。本明細書において提供されるアデノシンデアミナーゼは、一つ以上の突然変異(例えば本明細書に提供される突然変異のいずれか)を含み得ることが理解されるべきである。本開示は、特定のパーセント同一性を有するとともに、本明細書に記載される突然変異のいずれかまたはそれらの組合せを伴うデアミナーゼドメインを提供する。いくつかの実施形態において、アデノシンデアミナーゼは、参照配列と比較して、または本明細書に提供されるアデノシンデアミナーゼのいずれかと比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50個またはそれ以上の変異を有するアミノ酸配列を含む。いくつかの実施形態において、アデノシンデアミナーゼは、当該技術分野において既知であるかまたは本明細書に記載されるアミノ酸配列のいずれかと比較して、少なくとも5個、少なくとも10個、少なくとも15個、少なくとも20個、少なくとも25個、少なくとも30個、少なくとも35個、少なくとも40個、少なくとも45個、少なくとも50個、少なくとも60個、少なくとも70個、少なくとも80個、少なくとも90個、少なくとも100個、少なくとも110個、少なくとも120個、少なくとも130個、少なくとも140個、少なくとも150個、少なくとも160個、または少なくとも170個の同一の一続きのアミノ酸残基を有するアミノ酸配列を含む。
ある実施形態において、TadAデアミナーゼは、全長大腸菌TadAデアミナーゼである。例えば、特定の実施形態において、アデノシンデアミナーゼは、以下のアミノ酸配列を含む:
MRRAFITGVFFLSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKKAQSSTD
しかしながら、本出願において有用なさらなるアデノシンデアミナーゼが当業者には明
らかであり、本開示の範囲内であることが理解されるべきである。例えば、アデノシンデアミナーゼは、tRNAに作用するアデノシンデアミナーゼ(ADAT)のホモログであり得る。限定されるものではないが、例示的なAD ATホモログのアミノ酸配列は以下のものを含む:
Staphylococcus aureus TadA:
MGSHMTNDIYFMTLAIEEAKKAAQLGEVPIGAIITKDDEVIARAHNLRETLQQPTAHAEHIAIERAAKVLGSWRLEGCTLYVTLEPCVMCAGTIVMSRIPRVVYGADDPKGGCSGS LMNLLQQSNFNHRAIVDKGVLKEACSTLLTTFFKNLRANKKSTN
Bacillus subtilis TadA:
MTQDELYMKEAIKEAKKAEEKGEVPIGAVLVINGEIIARAHNLRETEQRSIAHAEMLVIDEACKALGTWRLEGATLYVTLEPCPMCAGAVVLSRVEKVVFGAFDPKGGCSGTLMNLLQEERFNHQAEVVSGVLEEECGGMLSAFFRELRKKKKAARKNLSE
Salmonella typhimurium (S. typhimurium) TadA:
MPPAFITGVTSLSDVELDHEYWMRHALTLAKRAWDEREVPVGAVLVHNHRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVLQNYRLLDTTLYVTLEPCVMCAGAMVHSRIGRVVFGARDAKTGAAGSLIDVLHHPGMNHRVEIIEGVLRDECATLLSDFFRMRRQEIKALKKADRAEGAGPAV
Shewanella putrefaciens (S. putrefaciens) TadA:
MDEYWMQVAMQMAEKAEAAGEVPVGAVLVKDGQQIATGYNLSISQHDPTAHAEILCLRSAGKKLENYRLLDATLYITLEPCAMCAGAMVHSRIARVVYGARDEKTGAAGTVVNLLQHPAFNHQVEVTSGVLAEACSAQLSRFFKRRRDEKKALKLAQRAQQGIE
Haemophilus influenzae F3031 (H. influenzae) TadA:
MDAAKVRSEFDEKMMRYALELADKAEALGEIPVGAVLVDDARNIIGEGWNLSIVQSDPTΑΗAEIIALRNGAKNIQNYRLLNSTLYVTLEPCTMCAGAILHSRIKRLVFGASDYKTGAIGSRFHFFDDYKMNHTLEITSGVLAEECSQKLSTFFQKRREEKKIEKALLKSLSDK
Caulobacter crescentus (C. crescentus) TadA:
MRTDESEDQDHRMMRLALDAARAAAEAGETPVGAVILDPSTGEVIATAGNGPIAAHDPTAHAEIAAMRAAAAKLGNYRLTDLTLVVTLEPCAMCAGAISHARIGRVVFGADDPKGGAVVHGPKFFAQPTCHWRPEVTGGVLADESADLLRGFFRARRKAKI
Geobacter sulfurreducens (G. sulfurreducens) TadA:
MSSLKKTPIRDDAYWMGKAIREAAKAAARDEVPIGAVIVRDGAVIGRGHNLREGSNDPSAHAEMIAIRQAARRSANWRLTGATLYVTLEPCLMCMGAIILARLERVVFGCYDPKGGAAGSLYDLSADPRLNHQVRLSPGVCQEECGTMLSDFFRDLRRRKKAKATPALFIDERKVPPEP
E. coli TadA (ecTadA) の実施形態は以下のものを含む:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
ある態様において、アデノシンデアミナーゼは、原核生物由来である。ある態様において、アデノシンデアミナーゼは、細菌由来である。ある態様において、アデノシンデアミナーゼは、Escherichia coli、Staphylococcus aureus、Salmonella typhi、Shewanella putrefaciens、Haemophilus influenzae、Caulobacter crescentus、またはBacillus subtilisに由来する。ある態様において、アデノシンデアミナーゼは、大腸菌由来である。
1つの実施形態において、本発明の融合タンパク質は、TadA7.10に連結された野生型TadAがCas9ニッカーゼに連結されたものを含む。特定の実施形態では、融合タンパク質は、単一のTadA7.10ドメイン(例えば、モノマーとして提供される)を含む。他の実施形態では、ABE7.10エディターは、TadA7.10およびTadA(wt) を含み、これらはヘテロ二量体を形成することができる。
ある態様において、アデノシンデアミナーゼは、本明細書に提供されるアデノシンデアミナーゼのいずれかに記載のアミノ酸配列のいずれかに対して少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。本明細書において提供されるアデノシンデアミナーゼは、一つ以上の突然変異(例えば、本明細書に提供される突然変異のいずれか)を含み得ることが理解されるべきである。本開示は、特定のパーセント同一性を有するデアミナーゼドメインが加えて本明細書に記載される突然変異のいずれかまたはその組合せを含むものを提供する。いくつかの実施形態において、アデノシンデアミナーゼは、参照配列または本明細書に提供されるアデノシンデアミナーゼのいずれかと比較して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、またはそれ以上の変異を有するアミノ酸配列を含む。いくつかの実施形態において、アデノシンデアミナーゼは、当該技術分野において既知であるかまたは本明細書に記載されたアミノ酸配列のいずれかと比較して、少なくとも5個、少なくとも10個、少なくとも15個、少なくとも20個、少なくとも25個、少なくとも30個、少なくとも35個、少なくとも40個、少なくとも45個、少なくとも50個、少なくとも60個、少なくとも70個、少なくとも80個、少なくとも90個、少なくとも100個、少なくとも110個、少なくとも120個、少なくとも130個、少なくとも140個、少なくとも150個、少なくとも160個、または少なくとも170個の同一の連続するアミノ酸残基を有するアミノ酸配列を含む。
本明細書中に提供される突然変異のいずれか(例えばTadA参照アミノ酸配列に基づくもの)を、E. coliTadA(ecTadA)、S. aureusTadA(saTadA)、または他のアデノシンデアミナーゼ(例えば細菌アデノシンデアミナーゼ)などの他のアデノシンデアミナーゼ内に導入し得ることを理解されたい。本明細書中に提供されるTadA参照アミノ酸配列と比較して突然変異させた残基に相同的な配列をどのように同定するかは、当業者には明らかであろう。したがって、TadA参照配列と比較して同定された突然変異のいずれかを、相同的なアミノ酸残基を有する他のアデノシンデアミナーゼ(例えばecTada)中において行い得る。また、本明細書中に提供される突然変異のいずれかを、TadA参照配列ともしくは別のアデノシンデアミナーゼと比較して、個々にまたは任意の組合せで行い得ることも、理解されたい。
ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるD108X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含み、Xは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある態様において、アデノシンデアミナーゼは、D108G、D108N、D108V、D108A、またはD108Y突然変異、または別のアデノシンデアミナーゼにおける対応する突然変異を含む。
ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるA106X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含み、Xは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるA106V突然変異、または別のアデノシンデアミナーゼ(例えば野生型TadAまたはecTadA)における対応する突然変異を含む。
ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるE155X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含み、Xの存在は、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるE155D、E155G、またはE155V突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。
ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるD147X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含み、Xの存在は、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるD147Y突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。
ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるA106X、E155X、またはD147X、突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含み、Xは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある態様において、アデノシンデアミナーゼは、E155D、E155G、またはE155V突然変異を含む。ある態様において、アデノシンデアミナーゼは、D147Yを含む。
例えば、アデノシンデアミナーゼは、TadA参照配列に関連するD108N、A106V、E155V、および/またはD147Y突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含み得る。ある態様において、アデノシンデアミナーゼは、TadA参照配列における以下の突然変異群(突然変異の群は「;」によって分離されている)、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む:D108NおよびA106V;D108NおよびE155V;D108NおよびD147Y;A106VおよびE155V;A106VおよびD147Y;E155VおよびD147Y;D108N, A106V,およびE155V;D108N, A106V,およびD147Y;D108N, E155V,およびD147Y;A106V, E155V,およびD 147Y;およびD108N, A106V, E155V,およびD147Y。ただし、ここで提供される対応する突然変異の任意の組合せを、アデノシンデアミナーゼ(例えばecTadA)において作製することができることを理解されたい。
いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるH8X、T17X、L18X、W23X、L34X、W45X、R51X、A56X、E59X、E85X、M94X、I95X、V102X、F104X、A106X、R107X、D108X、K110X、M118X、N127X、A138X、F149X、M151X、R153X、Q154X、I156X、および/またはK157X突然変異のうちの1以上、または他のアデノシンデアミナーゼ(例えばecTadA)における1以上の対応する突然変異を含み、ここで、Xの存在は、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列に関連するH8Y、T17S、L18E、W23L、L34S、W45L、R51H、A56E、またはA56S、E59G、E85K、またはE85G、M94L、I95L、V102A、F104L、A106V、R107C、またはR107H、またはR107P、D108G、またはD108N、またはD108A、D108Y、K110I、M118K、N127S、A138V、F149Y、M151V、R153C、Q154L、I156D、および/またはK157R突然変異のうちの1つ以上、または他のアデノシンデアミナーゼ(例えばecTadA)に関連する1つ以上の対応する突然変異を含む。
ある態様において、アデノシンデアミナーゼは、TadA参照配列に関連するH8X、D108X、および/またはN127X突然変異のうちの1つ以上、または別のアデノシンデアミナーゼ(例えばecTadA)における1つ以上の対応する突然変異を含み、Xは任意のアミノ酸の存在を示す。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、および/またはN127S突然変異の1以上、または別のアデノシンデアミナーゼ(例えばecTadA)に関連する1以上の対応する突然変異を含む。
いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列に関連するH8X、R26X、M61X、L68X、M70X、A106X、D108X、A109X、N127X、D147X、R152X、Q154X、E155X、K161X、Q163X、および/またはT166X突然変異の1以上、または別のアデノシンデアミナーゼ(例えばecTadA)に関連する1以上の対応する突然変異を含み、ここでXは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸の存在を示す。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列に関連するH8Y、R26W、M61I、L68Q、M70V、A106T、D108N、A109T、N127S、D147Y、R152C、Q154HもしくはQ154R、E155GもしくはE155VもしくはE155D、K161Q、Q163H、および/もしくはT166P突然変異の1つ以上、または他のアデノシンデアミナーゼ(例えばecTadA)に関連する1つ以上の対応する突然変異を含む。
いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列に関連するH8X、D108X、N127X、D147X、R152X、およびQ154Xからなる群より選択される1つ、2つ、3つ、4つ、5つ、または6つの突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)に関連する対応する突然変異(複数可)を含み、ここでXは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸の存在を示す。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列に関連するH8X、M61X、M70X、D108X、N127X、Q154X、E155X、およびQ163Xからなる群より選択される1つ、2つ、3つ、4つ、5つ、6つ、7つ、または8つの突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)に関連する対応する突然変異(複数可)を含み、ここでXは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸の存在を示す。ある態様において、アデノシンデアミナーゼは、TadA参照配列に関連するH8X、D108X、N127X、E155X、およびT166Xからなる群より選択される1つ、2つ、3つ、4つ、または5つの突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)に関連する対応する突然変異(複数可)を含み、ここでXは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸の存在を示す。
ある態様において、アデノシンデアミナーゼは、H8X、A106X、D108X、別のアデノシンデアミナーゼに関連する突然変異(複数可)からなる群から選択される1、2、3、4、5、または6個の突然変異を含み、ここでXは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す。ある態様において、アデノシンデアミナーゼは、H8X、R26X、L68X、D108X、N127X、D147X、およびE155Xからなる群より選択される1つ、2つ、3つ、4つ、5つ、6つ、7つ、または8つの突然変異、または別のアデノシンデアミナーゼに関連する対応する突然変異(複数可)を含み、Xは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸の存在を示す。ある態様において、アデノシンデアミナーゼは、TadA参照配列に関連するH8X、D108X、A109X、N127X、およびE155Xからなる群より選択される1つ、2つ、3つ、4つ、または5つの突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)に関連する対応する突然変異(複数可)を含み、Xは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸の存在を示す。
いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列に関連するH8Y、D108N、N127S、D147Y、R152C、およびQ154Hからなる群より選択される1つ、2つ、3つ、4つ、5つ、または6つの突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)に関連する対応する突然変異を含む。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列に関連するH8Y、M61I、M70V、D108N、N127S、Q154R、E155GおよびQ163Hからなる群より選択される1つ、2つ、3つ、4つ、5つ、6つ、7つまたは8つの突然変異、または他のアデノシンデアミナーゼ(例えばecTadA)に関連する対応する突然変異を含む。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、N127S、E155V、およびT166Pからなる群より選択される1つ、2つ、3つ、4つ、または5つの突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異(複数可)を含む。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列に関連するH8Y、A106T、D108N、N127S、E155D、およびK161Qからなる群から選択される1つ、2つ、3つ、4つ、5つ、または6つの突然変異、または他のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列に関連するH8Y、R26W、L68Q、D108N、N127S、D147Y、およびE155Vからなる群より選択される1つ、2つ、3つ、4つ、5つ、6つ、7つ、または8つの突然変異、または他のアデノシンデアミナーゼ(例えばecTadA)に関連する対応する突然変異を含む。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列に関連するH8Y、D108N、A109T、N127S、およびE155Gからなる群より選択される1つ、2つ、3つ、4つ、または5つの突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)に関連する対応する突然変異(複数可)を含む。
本明細書に提供される突然変異のいずれか、および任意のさらなる突然変異(例えばecTadAアミノ酸配列に基づくもの)は、任意の他のアデノシンデアミナーゼに導入することができる。本明細書に提供される突然変異のいずれも、TadA参照配列または別のアデノシンデアミナーゼ(例えばecTadA)において、個々に、または任意の組合せで作製することができる。
AからGへの核酸塩基編集タンパク質の詳細は、国際PCT出願第PCT/2017/045381号(国際公開第2018/027078号)およびGaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature, 551, 464-471 (2017)に記載されており、その内容全体が参照により本明細書に組み込まれる。
ある態様において、アデノシンデアミナーゼは、別のアデノシンデアミナーゼ(例えばecTadA)において一つ以上の対応する突然変異を含む。ある態様において、アデノシンデアミナーゼは、TadA参照配列に関連するD108N、D108G、もしくはD108V突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)に関連する対応する突然変異を含む。ある態様において、アデノシンデアミナーゼは、TadA参照配列に関連するA106VおよびD108N突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)に関連する対応する突然変異を含む。ある態様において、アデノシンデアミナーゼは、TadA参照配列に関連するR107CおよびD108N突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)に関連する対応する突然変異を含む。ある態様において、アデノシンデアミナーゼは、TadA参照配列に関連するH8Y、D108N、N127S、D147Y、およびQ154H突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)に関連する対応する突然変異を含む。ある態様において、アデノシンデアミナーゼは、TadA参照配列に関連するH8Y、D108N、N127S、D147Y、およびE155V突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)に関連する対応する突然変異を含む。ある態様において、アデノシンデアミナーゼは、TadA参照配列に関連するD108N、D147Y、およびE155V突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)に関連する対応する突然変異を含む。ある態様において、アデノシンデアミナーゼは、TadA参照配列に関連するH8Y、D108N、およびN127S突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)に関連する対応する突然変異を含む。ある態様において、アデノシンデアミナーゼは、TadA参照配列に関連するA106V、D108N、D147YおよびE155V突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)に関連する対応する突然変異を含む。
いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列に関連するS2X、H8X、I49X、L84X、H123X、N127X、I156Xおよび/またはK160X突然変異の1つ以上、または別のアデノシンデアミナーゼに関連する1つ以上の対応する突然変異を含み、Xの存在は、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列に関連するS2A、H8Y、I49F、L84F、H123Y、N127S、I156Fおよび/またはK160S突然変異のうちの1つ以上、または別のアデノシンデアミナーゼ(例えばecTadA)に関連する1つ以上の対応する突然変異を含む。
ある態様において、アデノシンデアミナーゼは、L84X突然変異アデノシンデアミナーゼを含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある態様において、アデノシンデアミナーゼは、TadA参照配列に関連するL84F突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)に関連する対応する突然変異を含む。
ある態様において、アデノシンデアミナーゼは、TadA参照配列に関連するH123X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)に関連する対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある態様において、アデノシンデアミナーゼは、TadA参照配列に関連するH123Y突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)に関連する対応する突然変異を含む。
ある態様において、アデノシンデアミナーゼは、TadA参照配列に関連するI156X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)に関連する対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある態様において、アデノシンデアミナーゼは、TadA参照配列に関連するI156F突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)に関連する対応する突然変異を含む。
ある態様において、アデノシンデアミナーゼは、TadA参照配列に関連する、L84X、A106X、D108X、H123X、D147X、E155X、およびI156Xからなる群より選択される1つ、2つ、3つ、4つ、5つ、6つ、または7つの突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)に関連する対応する突然変異(複数可)を含み、ここでXは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸の存在を示す。ある態様において、アデノシンデアミナーゼは、TadA参照配列に関連するS2X、I49X、A106X、D108X、D147X、およびE155Xからなる群より選択される1つ、2つ、3つ、4つ、5つ、または6つの突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)に関連する対応する突然変異(複数可)を含み、ここでXは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸の存在を示す。ある態様において、アデノシンデアミナーゼは、TadA参照配列に関連するH8X、A106X、D108X、N127X、およびK160Xからなる群より選択される1、2、3、4、または5個の突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)に関連する対応する突然変異(複数可)を含み、ここでXは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸の存在を示す。
ある態様において、アデノシンデアミナーゼは、TadA参照配列に関連する、L84F、A106V、D108N、H123Y、D147Y、E155V、およびI156Fからなる群より選択される1つ、2つ、3つ、4つ、5つ、6つ、または7つの突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)に関連する対応する突然変異を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列と比較してS2A、I49F、A106V、D108N、D147Y、およびE155Vからなる群から選択される1、2、3、4、5、もしくは6個の突然変異を含む、または別のアデノシンデアミナーゼと比較して対応する1つもしくは複数の突然変異を含む。
いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列に関連するH8Y、A106T、D108N、N127S、およびK160Sからなる群より選択される1つ、2つ、3つ、4つ、または5つの突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異もしくは突然変異を含む。
いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列に関連するE 25 X、R 26 X、R 107 X、A 142 X、および/またはA 143 X突然変異のうちの1以上、または別のアデノシンデアミナーゼ(例えばecTadA)に関連する1以上の対応する突然変異を含み、Xの存在は、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。ある態様において、アデノシンデアミナーゼは、TadA参照配列関連するE25M, E25D, E25A, E25R, E25V, E25S, E25Y, R26G, R26N, R26Q, R26C, R26L, R26K, R107P, R107K, R107A, R107N, R107W, R107H, R107S, A142N, A142D, A142G, A143D, A143G, A143E, A143L, A143W, A143M, A143S, A143Q および/または A143R突然変異のうちの1以上、または他のアデノシンデアミナーゼ(例えばecTadA)に関連する1以上の対応する突然変異を含む。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列に対応する本明細書に記載の突然変異のうちの1つ以上、または別のアデノシンデアミナーゼ(例えばecTadA)に関連する対応する突然変異のうちの1つ以上を含む。
ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるE25X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある態様において、アデノシンデアミナーゼは、TadA参照配列に関連するE25M、E25D、E25A、E25R、E25V、E25S、またはE25Y突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)に関連する対応する突然変異を含む。
ある態様において、アデノシンデアミナーゼは、TadA参照配列に関連するR26X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)に関連する対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列に関連するR26G、R26N、R26Q、R26C、R26L、またはR26K突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)に関連する対応する突然変異を含む。
ある態様において、アデノシンデアミナーゼは、TadA参照配列に関連するR107X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)に関連する対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある態様において、アデノシンデアミナーゼは、TadA参照配列に関連するR107P、R107K、R107A、R107N、R107W、R107H、またはR107S突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)に関連する対応する突然変異を含む。
ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるA142X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるA142N、A142D、A142G突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。
ある態様において、アデノシンデアミナーゼは、TadA参照配列に関連するA143X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)に関連する対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある態様において、アデノシンデアミナーゼは、TadA参照配列に関連するA143D、A143G、A143E、A143L、A143W、A143M、A143S、A143Qおよび/またはA143Rの突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)に関連する対応する突然変異を含む。
いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列に関連するH36X、N37X、P48X、I49X、R51X、M70X、N72X、D77X、E134X、S146X、Q154X、K157X、および/またはK161X突然変異の1つ以上、または別のアデノシンデアミナーゼ(例えばecTadA)に関連する1つ以上の対応する突然変異を含み、ここでXの存在は、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列に関連するH36L、N37T、N37S、P48T、P48L、I49V、R51H、R51L、M70L、N72S、D77G、E134G、S146R、S146C、Q154H、K157N、および/またはK161T突然変異の1以上、または別のアデノシンデアミナーゼ(例えばecTadA)に関連する1以上の対応する突然変異を含む。
いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列に関連するH36X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)に関連する対応する突然変異を含み、ここでXは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列に関連するH36L突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)に関連する対応する突然変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列と比較してN37X突然変異を含む、または別のアデノシンデアミナーゼ(例えばecTadA)と比較して対応する突然変異を含み、ただし、Xは、野生型アデノシンデアミナーゼ中の対応するアミノ酸以外の任意のアミノ酸を示す。ある態様において、アデノシンデアミナーゼは、TadA参照配列に関連するN37TまたはN37S突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)に関連する対応する突然変異を含む。
ある態様において、アデノシンデアミナーゼは、TadA参照配列に関連するP48X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)に関連する対応する突然変異を含み、ここでXは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある態様において、アデノシンデアミナーゼは、TadA参照配列に関連するP48TまたはP48L突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)に関連する対応する突然変異を含む。
ある態様において、アデノシンデアミナーゼは、TadA参照配列に関連するR51X突然変異、または別のアデノシンデアミナーゼに関連する対応する突然変異を含み、Xは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある態様において、アデノシンデアミナーゼは、TadA参照配列に関連するR51HまたはR51L突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)に関連する対応する突然変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列と比較してS146X突然変異を含む、または別のアデノシンデアミナーゼ(例えばecTadA)と比較して対応する突然変異を含み、ただし、Xは、野生型アデノシンデアミナーゼ中の対応するアミノ酸以外の任意のアミノ酸を示す。ある態様において、アデノシンデアミナーゼは、TadA参照配列に関連するS146RまたはS146C突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)に関連する対応する突然変異を含む。
ある態様において、アデノシンデアミナーゼは、TadA参照配列に関連するK157X突然変異、または別のアデノシンデアミナーゼに関連する対応する突然変異を含み、Xは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある態様において、アデノシンデアミナーゼは、TadA参照配列に関連するK157N突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)に関連する対応する突然変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列と比較してP48X突然変異を含む、または別のアデノシンデアミナーゼ(例えばecTadA)と比較して対応する突然変異を含み、ただし、Xは、野生型アデノシンデアミナーゼ中の対応するアミノ酸以外の任意のアミノ酸を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列と比較してP48S、P48T、もしくはP48Aの突然変異を含む、または別のアデノシンデアミナーゼ(例えばecTadA)と比較して対応する突然変異を含む。
ある態様において、アデノシンデアミナーゼは、TadA参照配列に関連するA142X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)に関連する対応する突然変異を含み、Xは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある態様において、アデノシンデアミナーゼは、TadA参照配列に関連するA142N突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)に関連する対応する突然変異を含む。
ある態様において、アデノシンデアミナーゼは、TadA参照配列に関連するW23X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)に関連する対応する突然変異を含み、ここでXは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある態様において、アデノシンデアミナーゼは、TadA参照配列に関連するW23RまたはW23L突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)に関連する対応する突然変異を含む。
ある態様において、アデノシンデアミナーゼは、TadA参照配列に関連するR152X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)に関連する対応する突然変異を含み、ここでXは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある態様において、アデノシンデアミナーゼは、TadA参照配列に関連するR152PまたはR52H突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)に関連する対応する突然変異を含む。
一実施形態では、アデノシンデアミナーゼは、TadA参照配列と比較してH36L、R51L、L84F、A106V、D108N、H123Y、S146C、D147Y、E155V、I156F、およびK157Nを含み得る、または別のアデノシンデアミナーゼと比較して対応する突然変異を含み得る。一部の実施形態では、アデノシンデアミナーゼは、tadA基準配列に関連する突然変異の以下の組合せを含み、ここで、組合せの各突然変異は「_」によって分離され、突然変異の各組合せは括弧内にある:
(A106V_D108N)、
(R107C_D108N)、
(H8Y_D108N_N127S_D147Y_Q154H)、
(H8Y_D108N_N127S_D147Y_E155V)、
(D108N_D147Y_E155V)、
(H8Y_D108N_N127S)、
(H8Y_D108N_N127S_D147Y_Q154H)、
(A106V_D108N_D147Y_E155V)、
(D108Q_D147Y_E155V)、
(D108M_D147Y_E155V)、
(D108L_D147Y_E155V)、
(D108K_D147Y_E155V)、
(D108I_D147Y_E155V)、
(D108F_D147Y_E155V)、
(A106V_D108N_D147Y)、
(A106V_D108M_D147Y_E155V)、
(E59A_A106V_D108N_D147Y_E155V)、
(E59A cat dead_A106V_D108N_D147Y_E155V),
(L84F_A106V_D108N_H123Y_D147Y_E155V_I156Y)、
(L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F)、
(E25G_R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V
_I156F)、(E25D_R26G_L84F_A106V_R107K_D108N_H123Y_A142N_A143G_D147Y_E155V_
I156F)、
(R26Q_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F)、
(E25M_R26G_L84F_A106V_R107P_D108N_H123Y_A142N_A143D_D147Y_E155V
_I156F)、
(R26C_L84F_A106V_R107H_D108N_H123Y_A142N_D147Y_E155V_I156F)、(L84F_A106V_D108N_H123Y_A142N_A143L_D147Y_E155V_I156F)、
(R26G_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F)、
(E25A_R26G_L84F_A106V_R107N_D108N_H123Y_A142N_A143E_D147Y_E155V
_I156F)、
(R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F)、
(A106V_D108N_A142N_D147Y_E155V)、
(R26G_A106V_D108N_A142N_D147Y_E155V)、
(E25D_R26G_A106V_R107K_D108N_A142N_A143G_D147Y_E155V)、
(R26G_A106V_D108N_R107H_A142N_A143D_D147Y_E155V)、
(E25D_R26G_A106V_D108N_A142N_D147Y_E155V)、
(A106V_R107K_D108N_A142N_D147Y_E155V)、
(A106V_D108N_A142N_A143G_D147Y_E155V)、
(A106V_D108N_A142N_A143L_D147Y_E155V)、
(H36L_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N)、
(N37T_P48T_M70L_L84F_A106V_D108N_H123Y_D147Y_I49V_E155V_I156F)、
(N37S_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_K161T)、
(H36L_L84F_A106V_D108N_H123Y_D147Y_Q154H_E155V_I156F)、
(N72S_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F)、
(H36L_P48L_L84F_A106V_D108N_H123Y_E134G_D147Y_E155V_I156F)、
(H36L_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_K157N)、(H36L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F)、
(L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F_K161T)、
(N37S_R51H_D77G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(R51L_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_K157N)、
(D24G_Q71R_L84F_H96L_A106V_D108N_H123Y_D147Y_E155V_I156F_K160E)、
(H36L_G67V_L84F_A106V_D108N_H123Y_S146T_D147Y_E155V_I156F)、
(Q71L_L84F_A106V_D108N_H123Y_L137M_A143E_D147Y_E155V_I156F)、
(E25G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_Q159L)、
(L84F_A91T_F104I_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(N72D_L84F_A106V_D108N_H123Y_G125A_D147Y_E155V_I156F)、
(P48S_L84F_S97C_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(W23G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(D24G_P48L_Q71R_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_Q159L)、
(L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F)、
(H36L_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_I156F
_K157N)、(N37S_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F_K161T)、
(L84F_A106V_D108N_D147Y_E155V_I156F)、
(R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N_K161T)、
(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K161T)、
(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N_K160E_K161T)、
(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N_K160E)、
(R74Q_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(R74A_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(R74Q_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(L84F_R98Q_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(L84F_A106V_D108N_H123Y_R129Q_D147Y_E155V_I156F)、
(P48S_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F)、
(P48S_A142N)、
(P48T_I49V_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F_L157N)、
(P48T_I49V_A142N)、
(H36L_P48S_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N)、
(H36L_P48S_R51L_L84F_A106V_D108N_H123Y_S146C_A142N_D147Y_E155V_I156F(H36L_P48T_I49V_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N)、
(H36L_P48T_I49V_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_I156F_K157N)、
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N)、
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_I156F_K157N)、
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_A142N_D147Y_E155V_I156F_K157N)、
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N)、
(W23R_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N)、
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F_K161T)、
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152H_E155V_I156F_K157N)、
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V_I156F_K157N)、
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V_I156F_K157N)、
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142A_S146C_D147Y_E155V
_I156F_K157N)、
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142A_S146C_D147Y_R152P_E155V_I156F_K157N)、
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F_K161T)、
(W23R_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V_I156F_K157N)、
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_R152P_E155V
_I156F_K157N)
特定の実施形態では、本明細書で提供される融合タンパク質は、融合タンパク質の塩基編集活性を改善する1つ以上の特徴を含む。例えば、本明細書に提供される融合タンパク質は、ヌクレアーゼ活性が低下したCas9ドメインを含み得る。いくつかの実施形態において、本明細書で提供される融合タンパク質は、ヌクレアーゼ活性を有さないCas9ドメイン (dCas9) 、またはCas9ニッカーゼ(nCas9) と呼ばれる、二本鎖DNA分子の1鎖を切断するCas9ドメインを有し得る。
一部の実施形態では、アデノシンデアミナーゼはTadA*7.10である。一部の実施形態では、TadA*7.10は少なくとも1つの改変を含む。特定の実施形態では、TadA*7.10は、以下の改変のうちの1つまたは複数を含む:Y147T、Y147R、Q154S、Y123H、V82S、T166R、およびQ154R。改変Y123Hは、本明細書中においてH123Hとしても言及する(TadA*7.10中の改変H123YがY123H(野生型)に逆戻りしている)。他の実施形態では、TadA*7.10は、
Y147T+Q154R;Y147T+Q154S;Y147R+Q154S;V82S+Q154S;V82S+Y147R;V82S+Q154R;V82S+Y123H;I76Y+V82S;V82S+Y123H+Y147T;V82S+Y123H+Y147R;V82S+Y123H+Q154R;Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y123H+Y147R+Q154R+I76Y;V82S+Y123H+Y147R+Q154R;
およびI76Y+V82S+Y123H+Y147R+Q154Rの群から選択される改変の組合せを含む。特定の実施形態では、アデノシンデアミナーゼバリアントは、TadA*7.10、TadA参照配列、または別のTadA中の対応する突然変異と比較して、残基149、150、151、152、153、154、155、156、および157から開始されるC末端の欠失を含む。
他の実施形態では、本発明の塩基エディターは、TadA*7.10、TadA参照配列、または別のTadA中の対応する突然変異と比較して、以下の改変のうちの1つまたは複数:Y147T、Y147R、Q154S、Y123H、V82S、T166R、および/またはQ154Rを含む、アデノシンデアミナーゼバリアント(例えばTadA*8)を含むモノマーである。他の実施形態では、アデノシンデアミナーゼバリアント(TadA*8)は、TadA*7.10、TadA参照配列、または別のTadA中の対応する突然変異と比較して、
Y147T+Q154R;Y147T+Q154S;Y147R+Q154S;V82S+Q154S;V82S+Y147R;V82S+Q154R;V82S+Y123H;I76Y+V82S;V82S+Y123H+Y147T;V82S+Y123H+Y147R;V82S+Y123H+Q154R;Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y123H+Y147R+Q154R+I76Y;V82S+Y123H+Y147R+Q154R;およびI76Y+V82S+Y123H+Y147R+Q154R、
の群から選択される改変の組合せを含むモノマーである。他の実施形態では、塩基エディターは、野生型アデノシンデアミナーゼと、TadA*7.10、TadA参照配列、または別のTadA中の対応する突然変異と比較して、以下の改変のうちの1つまたは複数:Y147T、Y147R、Q154S、Y123H、V82S、T166R、および/またはQ154Rを含むアデノシンデアミナーゼバリアント(例えばTadA*8)とを含むヘテロ二量体である。他の実施形態では、塩基エディターは、TadA*7.10ドメインと、TadA*7.10、TadA参照配列、または別のTadA中の対応する突然変異と比較して、
Y147T+Q154R;Y147T+Q154S;Y147R+Q154S;V82S+Q154S;V82S+Y147R;V82S+Q154R;V82S+Y123H;I76Y+V82S;V82S+Y123H+Y147T;V82S+Y123H+Y147R;V82S+Y123H+Q154R;Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y123H+Y147R+Q154R+I76Y;V82S+Y123H+Y147R+Q154R;
およびI76Y+V82S+Y123H+Y147R+Q154Rの群から選択される改変の組合せを含むアデノシンデアミナーゼバリアントドメイン(例えばTadA*8)とを含むヘテロ二量体である。
一実施形態では、アデノシンデアミナーゼは、アデノシンデアミナーゼ活性を有する以下の配列またはその断片を含む、またはそれから本質的になるTadA*8である:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD
一部の実施形態では、TadA*8は切断されている。一部の実施形態では、切断されたTadA*8は、完全長TadA*8と比較して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のN末端アミノ酸残基を欠く。一部の実施形態では、切断されたTadA*8は、完全長TadA*8と比較して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のC末端アミノ酸残基を欠く。一部の実施形態では、アデノシンデアミナーゼバリアントは完全長TadA*8である。
一部の実施形態では、TadA*8は、TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23、TadA*8.24である。
一実施形態では、本発明の融合タンパク質は、Cas9ニッカーゼと連結している、本明細書中に記載のアデノシンデアミナーゼバリアント(例えばTadA*8)と連結している野生型TadAを含む。特定の実施形態では、融合タンパク質は単一のTadA*8ドメイン(例えばモノマーとして提供されるもの)を含む。他の実施形態では、塩基エディターはTadA*8およびTadA(野生型)を含み、これらはヘテロ二量体を形成することができる。例示的な配列は以下の通りである:
TadA(野生型):
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKKAQSSTD
TadA*7.10:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
TadA*8:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD.
ある態様において、アデノシンデアミナーゼは、本明細書に提供されるアデノシンデアミナーゼのいずれかに記載のアミノ酸配列のいずれかに対して少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。本明細書において提供されるアデノシンデアミナーゼは、一つ以上の突然変異(例えば、本明細書に提供される突然変異のいずれか)を含み得ることが理解されるべきである。本開示は、特定のパーセント同一性を有するデアミナーゼドメインが加えて本明細書に記載される突然変異のいずれかまたはその組合せを含むものを提供する。いくつかの実施形態において、アデノシンデアミナーゼは、参照配列または本明細書に提供されるアデノシンデアミナーゼのいずれかと比較して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、またはそれ以上の変異を有するアミノ酸配列を含む。いくつかの実施形態において、アデノシンデアミナーゼは、当該技術分野において既知であるかまたは本明細書に記載されたアミノ酸配列のいずれかと比較して、少なくとも5個、少なくとも10個、少なくとも15個、少なくとも20個、少なくとも25個、少なくとも30個、少なくとも35個、少なくとも40個、少なくとも45個、少なくとも50個、少なくとも60個、少なくとも70個、少なくとも80個、少なくとも90個、少なくとも100個、少なくとも110個、少なくとも120個、少なくとも130個、少なくとも140個、少なくとも150個、少なくとも160個、または少なくとも170個の同一の連続するアミノ酸残基を有するアミノ酸配列を含む。
特定の実施形態では、TadA*8は、太字で示した以下の位置のうちの任意の位置に1つまたは複数の突然変異を含む。他の実施形態では、TadA*8は、下線で示した以下の位置のうちの任意の位置に1つまたは複数の突然変異を含む:
MSEVEFSHEY WMRHALTLAK RARDEREVPV GAVLVLNNRV IGEGWNRAIG 50 LHDPTAHAEI MALRQGGLVM QNYRLIDATL YVTFEPCVMC AGAMIHSRIG 100RVVFGVRNAK TGAAGSLMDV LHYPGMNHRV EITEGILADE CAALLCYFFR 150MPRQVFNAQK KAQSSTD
例えば、TadA*8は、TadA*7.10、TadA参照配列、または別のTadA中の対応する突然変異と比較して、アミノ酸位置82および/もしくは166(例えば、V82S、T166R)での改変を、単独で、または、以下のうちの任意の1つもしくは複数:Y147T、Y147R、Q154S、Y123H、および/もしくはQ154Rと組み合わせて含む。特定の実施形態では、改変の組合せは、TadA*7.10、TadA参照配列、または別のTadA中の対応する突然変異と比較して、以下の群から選択される:
Y147T+Q154R;Y147T+Q154S;Y147R+Q154S;V82S+Q154S;V82S+Y147R;V82S+Q154R;V82S+Y123H;I76Y+V82S;V82S+Y123H+Y147T;V82S+Y123H+Y147R;V82S+Y123H+Q154R;Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y123H+Y147R+Q154R+I76Y;V82S+Y123H+Y147R+Q154R;
およびI76Y+V82S+Y123H+Y147R+Q154R。
一部の実施形態では、アデノシンデアミナーゼはTadA*8であり、アデノシンデアミナーゼ活性を有する以下の配列またはその断片を含む、またはそれから本質的になる:
MSEVEFSHEY WMRHALTLAK RARDEREVPV GAVLVLNNRV IGEGWNRAIG LHDPTAHAEI MALRQGGLVM QNYRLIDATL YVTFEPCVMC AGAMIHSRIG
RVVFGVRNAK TGAAGSLMDV LHYPGMNHRV EITEGILADE CAALLCTFFR
MPRQVFNAQK KAQSSTD
一部の実施形態では、TadA*8は切断されている。一部の実施形態では、切断されたTadA*8は、完全長TadA*8と比較して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のN末端アミノ酸残基を欠く。一部の実施形態では、切断されたTadA*8は、完全長TadA*8と比較して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のC末端アミノ酸残基を欠く。一部の実施形態では、アデノシンデアミナーゼバリアントは完全長TadA*8である。
一実施形態では、本発明の融合タンパク質は、Cas9ニッカーゼと連結している、本明細書中に記載のアデノシンデアミナーゼバリアント(例えばTadA*8)と連結している野生型TadAを含む。特定の実施形態では、融合タンパク質は単一のTadA*8ドメイン(例えばモノマーとして提供されるもの)を含む。他の実施形態では、塩基エディターはTadA*8およびTadA(野生型)を含み、これらはヘテロ二量体を形成することができる。
[追加的ドメイン]
本明細書に記載される塩基エディターは、ポリヌクレオチドの核酸塩基の編集、修飾、または改変を促進させるのを助ける任意のドメインを含むことができる。ある態様において、塩基エディターは、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン(例えばCas9)、核酸塩基編集ドメイン(例えばデアミナーゼドメイン)、および一つ以上のさらなるドメインを含む。ある態様において、追加のドメインは、塩基エディターの酵素的または触媒的機能、塩基エディターの結合機能を促進することができ、または所望の塩基編集結果に干渉し得る細胞機構(例えば酵素)の阻害因子であり得る。ある態様において、塩基エディターは、ヌクレアーゼ、ニッカーゼ、リコンビナーゼ、デアミナーゼ、メチルトランスフェラーゼ、メチラーゼ、アセチラーゼ、アセチルトランスフェラーゼ、転写アクチベーター、または転写リプレッサードメインを含むことができる。
ある態様において、塩基エディターは、ウラシルグリコシラーゼ阻害因子 (UGI) ドメインを含むことができる。ある態様において、U:Gヘテロ二本鎖DNAの存在に対する細胞DNA修復応答が、細胞における核酸塩基編集効率の低下の原因となりうる。ある態様において、ウラシルDNAグリコシラーゼ (UDG)が、細胞内のDNAからのUの除去を触媒し得、それが塩基除去修復 (BER) を開始し得、大部分がU:G対からC:G対への復帰をもたらす。ある態様において、一本鎖に結合する、編集された塩基をブロックする、UGIを阻害する、BERを阻害する、編集された塩基を保護する、および/または編集されていない鎖の修復を促進する、1以上のドメインを含む塩基エディターにおいてBERは阻害され得る。したがって、本開示は、UGIドメインを含む塩基編集融合タンパク質を企図する。
ある態様において、塩基エディターは、二本鎖切断 (DSB) 結合タンパク質の全部または一部をドメインとして含む。例えば、DSB結合タンパク質は、バクテリオファージMuのGamタンパク質を含み得、これはDSBの末端に結合してそれらを分解から保護することができる。Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity”Science Advances 3:eaao4774 (2017)を参照されたい(その全内容が参照により本明細書に組み入れられる)。
さらに、一部の実施形態では、Gamタンパク質を塩基エディターのN末端に融合させることができる。一部の実施形態では、Gamタンパク質を塩基エディターのC末端に融合させることができる。バクテリオファージMuのGamタンパク質は、二本鎖切断(DSB)の末端と結合して、それらを分解から保護することができる。一部の実施形態では、Gamを使用してDSBの遊離末端と結合させることは、塩基編集過程中にインデルの形成を低下させることができる。一部の実施形態では、174個の残基のGamタンパク質を塩基エディターのN末端と融合させる。Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017)を参照されたい。一部の実施形態では、1つもしくは複数の突然変異は、野生型ドメインと比較して塩基エディタードメインの長さを変化させることができる。例えば、少なくとも1つのドメイン中の少なくとも1つのアミノ酸の欠失は、塩基エディターの長さを減らすことができる。別の事例では、1つもしくは複数の突然変異は、野生型ドメインと比較してドメインの長さを変化させない。例えば、任意のドメイン中の置換が塩基エディターの長さを変化させる/させない。
ある態様において、塩基エディターは、核酸ポリメラーゼ (NAP) の全てまたは一部をドメインとして含むことができる。例えば、塩基エディターは、真核生物NAPの全部または一部を含むことができる。いくつかの実施形態において、塩基エディターに組み込まれるNAPまたはその一部は、DNAポリメラーゼである。ある態様において、塩基エディターに組み込まれるNAPまたはその一部は、損傷乗り越えポリメラーゼ活性を有する。いくつかの実施形態において、塩基エディターに組み込まれるNAPまたはその一部は損傷乗り越えDNAポリメラーゼである。いくつかの実施形態において、塩基エディターに組み込まれるNAPまたはその一部は、Rev7、Rev1複合体、ポリメラーゼイオタ、ポリメラーゼカッパ、またはポリメラーゼイタである。いくつかの実施形態において、塩基エディターに組み込まれるNAPまたはその一部は、真核生物ポリメラーゼアルファ、ベータ、ガンマ、デルタ、イプシロン、ガンマ、イータ、イオタ、カッパ、ラムダ、ミュー、またはニュー成分である。ある態様において、塩基エディターに組み込まれるNAPまたはその一部は、核酸ポリメラーゼ(例えば損傷乗り越えDNAポリメラーゼ)に対して少なくとも75%、80%、85%、90%、95%、96%、97%、98%、99%、または99.5%の同一性であるアミノ酸配列を含む。
[塩基エディターシステム]
本明細書中に提供される塩基エディター系の使用は、(a)対象のポリヌクレオチド(例えば、二本鎖または一本鎖のDNAまたはRNA)の標的ヌクレオチド配列を、核酸塩基エディター(例えばアデノシン塩基エディター)およびガイドポリ核酸(例えばgRNA)を含む塩基エディター系と接触させる工程であって、標的ヌクレオチド配列が標的核酸塩基対を含む工程と、(b)前記標的領域の鎖の分離を誘導する工程と、(c)標的領域の一本鎖中の前記標的核酸塩基対の第1の核酸塩基を、第2の核酸塩基へと変換する工程と、(d)前記標的領域の1本を超えない鎖を切断する工程であって、第1の核酸塩基の塩基に相補的な第3の核酸塩基を第2の核酸塩基に相補的な第4の核酸塩基によって置き換える工程とを含む。一部の実施形態では、ステップ (b) は省略されることを理解されたい。ある態様において、前記標的核酸塩基対は、1以上の遺伝子における複数の核酸塩基対である。いくつかの実施形態において、本明細書に提供される塩基エディターシステムは、1以上の遺伝子における複数の核酸塩基対の多重編集を可能にする。ある態様において、複数の核酸塩基対は、同一遺伝子内に位置する。いくつかの実施形態において、複数の核酸塩基対は、1またはそれより多い遺伝子に位置し、ここで、少なくとも1つの遺伝子は、異なる遺伝子座に位置する。
いくつかの実施形態において、切断された一本鎖(ニック鎖)は、ガイド核酸にハイブリダイズされる。いくつかの実施態様において、切断された一本鎖は、第一の核酸塩基を含む鎖と反対である。一部の実施形態では、塩基エディターはCas9ドメインを含む。いくつかの実施形態において、第1の塩基はアデニンであり、第2の塩基はG、C、AまたはTではない。いくつかの実施形態において、第2の塩基はイノシンである。
本明細書に提供される塩基編集システムは、触媒的に欠陥のあるStreptococcus pyogenes Cas9と、アデノシンデアミナーゼと、塩基除去修復の阻害因子とを含む融合タンパク質を用いて、二本鎖DNA切断を生じることなく、ドナーDNA鋳型を必要とせず、かつ過剰な確率的挿入および欠失を誘導することなく、DNAにおけるプログラム可能な一塩基(C→TまたはA→G)変化を誘導する、ゲノム編集の新規なアプローチを提供する。
本明細書では、塩基エディター系を用いて核酸塩基を編集するためのシステム、組成物、および方法を提供する。いくつかの実施形態において、塩基エディターシステムは、(1)核酸塩基を編集するための、ポリヌクレオチドプログラミング可能なヌクレオチド結合ドメインおよび核酸塩基編集ドメイン(例えば2つのデアミナーゼドメイン)を含む塩基エディター(BE)と、(2)ポリヌクレオチドプログラミング可能ヌクレオチド結合ドメインに付随するガイドポリヌクレオチド(例えばガイドRNA)とを含む。いくつかの実施形態において、塩基エディターシステムは、アデノシン塩基エディター (ABE)を含む。ある態様において、ポリヌクレオチドプログラミング可能なヌクレオチド結合ドメインは、ポリヌクレオチドプログラミング可能なDNA結合ドメインである。ある態様において、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、ポリヌクレオチドプログラミング可能なRNA結合ドメインである。ある態様において、核酸塩基編集ドメインは、デアミナーゼドメインである。一部の実施形態では、デアミナーゼドメインはアデニンデアミナーゼまたはアデノシンデアミナーゼであり得る。一部の実施形態では、アデノシン塩基エディターは、DNA中のアデニンを脱アミノ化することができる。一部の実施形態では、ABEは進化したTadAバリアントを含む。
核酸塩基編集タンパク質の詳細は、国際PCT出願番号PCT/2017/045381 (WO2018/027078) およびPCT/US2016/058344 (WO2017/070632) に記載されており、これらの各々は、その全体が参照により本明細書に組み込まれる。Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017); および Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity”Science Advances 3:eaao4774 (2017)も参照のこと(その内容全体が参照により本明細書に組み入れられる)。
いくつかの実施形態において、単一のガイドポリヌクレオチドを利用して、デアミナーゼを標的核酸配列にターゲティングすることができる。ある態様において、一対のガイドポリヌクレオチドが、異なるデアミナーゼを標的核酸配列にターゲティングするために利用され得る。
塩基エディター系の核酸塩基成分およびポリヌクレオチドプログラミング可能なヌクレオチド結合成分は、互いに共有結合的または非共有結合的により結合され得る。例えば、いくつかの実施形態において、デアミナーゼドメインが、ポリヌクレオチドプログラミング可能なヌクレオチド結合ドメインによって標的ヌクレオチド配列にターゲティングされ得る。ある態様において、ポリヌクレオチドプログラミング可能なヌクレオチド結合ドメインは、デアミナーゼドメインに融合または連結され得る。いくつかの実施形態において、ポリヌクレオチドプログラミング可能なヌクレオチド結合ドメインは、デアミナーゼドメインと非共有結合的に相互作用または結合することによって、デアミナーゼドメインを標的ヌクレオチド配列にターゲティングすることができる。例えば、いくつかの実施形態において、核酸塩基編集成分、例えばデアミナーゼ成分は、ポリヌクレオチドプログラミング可能なヌクレオチド結合ドメインの一部をなすさらなる異種部分またはドメインと相互作用し、会合し、または複合体を形成することができる、さらなる異種部分またはドメインを含むことができる。いくつかの実施形態において、追加の異種部分は、ポリペプチドと結合し、相互作用し、会合し、または複合体を形成することができる。いくつかの実施形態において、追加の異種部分は、ポリヌクレオチドと結合し、相互作用し、会合し、または複合体を形成することができる。いくつかの実施形態において、追加の異種部分は、ガイドポリヌクレオチドに結合することができる。いくつかの実施形態において、追加の異種部分は、ポリペプチドリンカーに結合することができる。いくつかの実施形態において、追加の異種部分は、ポリヌクレオチドリンカーに結合することができる。追加の異種部分は、タンパク質ドメインであってもよい。いくつかの実施形態において、追加の異種部分は、K相同 (KH) ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、ステリルαモチーフ、テロメラーゼKu結合モチーフおよびKuタンパク質、テロメラーゼSm7結合モチーフおよびSm7タンパク質、またはRNA認識モチーフであり得る。
塩基編集システムは、ガイドポリヌクレオチド成分をさらに含むことができる。塩基編集システムの構成要素は、共有結合、非共有結合的相互作用、またはそれらの結合および相互作用の任意の組合せを介して互いに結合され得ることが理解されるべきである。ある態様において、デアミナーゼドメインは、ガイドポリヌクレオチドによって標的ヌクレオチド配列にターゲティングされ得る。例えば、いくつかの実施形態において、塩基エディター系の核酸塩基編集成分、例えばデアミナーゼ成分は、ガイドポリヌクレオチドの一部またはセグメント(例えばポリヌクレオチドモチーフ) と相互作用し、結合し、または複合体を形成し得るさらなる異種部分またはドメイン(例えばRNAまたはDNA結合タンパク質のようなポリヌクレオチド結合ドメイン)を含み得る。いくつかの実施形態において、追加の異種部分またはドメイン(例えばRNAまたはDNA結合タンパク質などのポリヌクレオチド結合ドメイン)は、デアミナーゼドメインに融合または連結され得る。いくつかの実施形態において、追加の異種部分は、ポリペプチドと結合し、相互作用し、会合し、またはポリペプチドと複合体を形成することができる。いくつかの実施形態において、追加の異種部分は、ポリヌクレオチドと結合し、相互作用し、会合し、またはポリヌクレオチドと複合体を形成することができる。いくつかの実施形態において、追加の異種部分は、ガイドポリヌクレオチドに結合することができる。いくつかの実施形態において、追加の異種部分は、ポリペプチドリンカーに結合することができる。いくつかの実施形態において、追加の異種部分は、ポリヌクレオチドリンカーに結合することができる。追加の異種部分は、タンパク質ドメインであってもよい。いくつかの実施形態において、追加の異種部分は、K相同 (KH) ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、無菌アルファモチーフ、テロメラーゼKu結合モチーフおよびKuタンパク質、テロメラーゼSm7結合モチーフおよびSm7タンパク質、またはRNA認識モチーフであり得る。
一部の実施形態では、塩基エディターは編集された鎖の塩基除去修復(BER)を阻害する。一部の実施形態では、塩基エディターは、編集されていない鎖を保護または結合する。一部の実施形態では、塩基エディターはUGI活性を含む。一部の実施形態では、塩基エディターは、触媒的に不活性なイノシン特異的ヌクレアーゼを含む。一部の実施形態では、塩基エディターはニッカーゼ活性を含む。一部の実施形態では、塩基対の意図する編集はPAM部位の上流である。一部の実施形態では、塩基対の意図する編集は、PAM部位の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個のヌクレオチド上流である。一部の実施形態では、塩基対の意図する編集はPAM部位の下流である。一部の実施形態では、意図する編集された塩基対は、PAM部位の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個のヌクレオチド下流である。
いくつかの実施形態では、本方法は、標準(例えばNGG) PAMサイトを必要としない。いくつかの実施態様において、核酸塩基エディターは、リンカーまたはスペーサーを含む。ある態様において、リンカーまたはスペーサーは、長さが1~25アミノ酸である。ある態様において、リンカーまたはスペーサーは、長さが5~20アミノ酸である。ある態様において、リンカーまたはスペーサーは、長さが10、11、12、13、14、15、16、17、18、19、または20アミノ酸である。
一部の実施形態では、本明細書中に提供される塩基編集融合タンパク質は、例えば、標的塩基が定義された領域(例えば「脱アミノ化ウィンドウ」)内に配置される場合など、正確な位置に位置する必要がある。一部の実施形態では、標的は、4個の塩基の領域内にあることができる。一部の実施形態では、そのような定義された標的領域は、PAMの約15個の塩基上流であり得る。Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016)、Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017)、およびKomor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017)を参照されたい(その内容が全体で参照により本明細書に組み込まれる)。
一部の実施形態では、標的領域は標的ウィンドウを含み、標的ウィンドウは標的核酸塩基対を含む。一部の実施形態では、標的ウィンドウは1~10個のヌクレオチドを含む。一部の実施形態では、標的ウィンドウは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個のヌクレオチドの長さである。一部の実施形態では、塩基対の意図する編集は標的ウィンドウ内にある。一部の実施形態では、標的ウィンドウは、塩基対の意図する編集を含む。一部の実施形態では、方法は、本明細書中に提供される塩基エディターのいずれかを使用して行う。一部の実施形態では、標的ウィンドウは脱アミノ化ウィンドウである。脱アミノ化ウィンドウは、塩基エディターが標的ヌクレオチドに対して作用して脱アミノ化する、定義された領域であり得る。一部の実施形態では、脱アミノ化ウィンドウは、2、3、4、5、6、7、8、9、または10個の塩基の領域内にある。一部の実施形態では、脱アミノ化ウィンドウは、PAMの5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、または25個の塩基上流である。
本開示の塩基エディターは、標的ポリヌクレオチド配列の編集を容易にする、任意のドメイン、特徴、またはアミノ酸配列を含むことができる。例えば、一部の実施形態では、塩基エディターは核局在化配列(NLS)を含む。一部の実施形態では、塩基エディターのNLSは、デアミナーゼドメインとポリヌクレオチドプログラミング可能なヌクレオチド結合ドメインとの間に局在化している。一部の実施形態では、塩基エディターのNLSは、ポリヌクレオチドプログラミング可能なヌクレオチド結合ドメインに対してC末端に局在化している。
本明細書中に開示する塩基エディター中に存在することができる他の例示的な特徴は、細胞質局在化配列などの局在化配列、核外輸送配列などの輸出配列、または他の局在化配列、ならびに融合タンパク質の可溶化、精製、または検出に有用な配列タグである。本明細書中に提供される適切なタンパク質タグとしては、それだけには限定されないが、ビオチンカルボキシラーゼ担体タンパク質(BCCP)タグ、mycタグ、カルモジュリンタグ、FLAGタグ、ヘマグルチニン(HA)タグ、ヒスチジンタグまたはHisタグとしても言及するポリヒスチジンタグ、マルトース結合タンパク質(MBP)タグ、nusタグ、グルタチオン-S-トランスフェラーゼ(GST)タグ、緑色蛍光タンパク質(GFP)タグ、チオレドキシンタグ、Sタグ、Softag(例えば、Softag1、Softag3)、strepタグ、ビオチンリガーゼタグ、FlAsHタグ、V5タグ、およびSBPタグが挙げられる。追加の適切な配列は当業者に明らかであろう。一部の実施形態では、融合タンパク質は、1つまたは複数のHisタグを含む。
融合タンパク質に含めることができるタンパク質ドメインの非限定的な例としては、デアミナーゼドメイン(例えばアデノシンデアミナーゼ)、ウラシルグリコシラーゼ阻害因子(UGI)ドメイン、エピトープタグ、およびレポーター遺伝子配列が挙げられる。
エピトープタグの非限定的な例としては、ヒスチジン(His)タグ、V5タグ、FLAGタグ、インフルエンザヘマグルチニン(HA)タグ、Mycタグ、VSV-Gタグ、およびチオレドキシン(Trx)タグが挙げられる。レポーター遺伝子の例としては、それだけには限定されないが、グルタチオン-5-トランスフェラーゼ(GST)、西洋ワサビペルオキシダーゼ(HRP)、クロラムフェニコールアセチルトランスフェラーゼ(CAT)、ベータ-ガラクトシダーゼ、ベータ-グルクロニダーゼ、ルシフェラーゼ、緑色蛍光タンパク質(GFP)、HcRed、DsRed、シアン蛍光タンパク質(CFP)、黄色蛍光タンパク質(YFP)、および青色蛍光タンパク質(BFP)を含めた自己蛍光タンパク質が挙げられる。さらなるタンパク質配列としては、それだけには限定されないが、マルトース結合タンパク質(MBP)、Sタグ、Lex A DNA結合ドメイン(DBD)融合物、GAL4 DNA結合ドメイン融合物、および単純ヘルペスウイルス(HSV)BP16タンパク質融合物を含めた、DNA分子と結合するまたは他の細胞分子と結合するアミノ酸配列を挙げることができる。
一部の実施形態では、アデノシン塩基エディター(ABE)は、DNA中のアデニンを脱アミノ化することができる。一部の実施形態では、ABEは、BE3のAPOBEC1構成成分を、天然もしくは操作したE. coliTadA、ヒトADAR2、マウスADA、またはヒトADAT2で置き換えることによって生成する。一部の実施形態では、ABEは進化したTadAバリアントを含む。一部の実施形態では、ABEはABE1.2(TadA*-XTEN-nCas9-NLS)である。一部の実施形態では、TadA*は、A106VおよびD108Nの突然変異を含む
一部の実施形態では、ABEは第二世代ABEである。一部の実施形態では、ABEはABE2.1であり、これは、追加の突然変異のD147YおよびE155VをTadA*中に含む(TadA*2.1)。一部の実施形態では、ABEはABE2.2であり、これは、ヒトアルキルアデニンDNAグリコシラーゼの触媒的に不活性なバージョン(E125Q突然変異を有するAAG)と融合したABE2.1である。一部の実施形態では、ABEはABE2.3であり、これは、E. coliEndo Vの触媒的に不活性なバージョン(D35A突然変異で不活性化)と融合したABE2.1である。一部の実施形態では、ABEはABE2.6であり、これは、ABE2.1中のリンカーの2倍の長さのリンカー(32個のアミノ酸、(SGGS)2-XTEN-(SGGS)2)を有する。一部の実施形態では、ABEはABE2.7であり、これは、追加の野生型TadAモノマーで繋ぎ留められたABE2.1である。一部の実施形態では、ABEはABE2.8であり、これは、追加のTadA*2.1モノマーで繋ぎ留められたABE2.1である。一部の実施形態では、ABEはABE2.9であり、これは、進化したTadA(TadA*2.1)とABE2.1のN末端との直接融合物である。一部の実施形態では、ABEはABE2.10であり、これは、野生型TadAとABE2.1のN末端との直接融合物である。一部の実施形態では、ABEはABE2.11であり、これは、TadA*モノマーのN末端に不活性化させるE59A突然変異を有するABE2.9である。一部の実施形態では、ABEはABE2.12であり、これは、内部TadA*モノマー中に不活性化させるE59A突然変異を有するABE2.9である。
一部の実施形態では、ABEは第三世代ABEである。一部の実施形態では、ABEはABE3.1であり、これは、3つの追加のTadAの突然変異(L84F、H123Y、およびI156F)を有するABE2.3である。
一部の実施形態では、ABEは第四世代ABEである。一部の実施形態では、ABEはABE4.3であり、これは、追加のTadA突然変異A142Nを有するABE3.1である(TadA*4.3)。
一部の実施形態では、ABEは第五世代ABEである。一部の実施形態では、ABEはABE5.1であり、これは、生存クローンからの突然変異のコンセンサスセット(H36L、R51L、S146C、およびK157N)をABE3.1内に輸入することによって生成する。一部の実施形態では、ABEはABE5.3であり、これは、野生型E. coliTadAを含有するヘテロ二量体構築物が、内部進化したTadA*と融合している。一部の実施形態では、以下の表6に示すように、ABEは、ABE5.2、ABE5.4、ABE5.5、ABE5.6、ABE5.7、ABE5.8、ABE5.9、ABE5.10、ABE5.11、ABE5.12、ABE5.13、またはABE5.14である。一部の実施形態では、ABEは第六世代ABEである。一部の実施形態では、以下の表6に示すように、ABEは、ABE6.1、ABE6.2、ABE6.3、ABE6.4、ABE6.5、またはABE6.6である。一部の実施形態では、ABEは第七世代ABEである。一部の実施形態では、以下の表6に示すように、ABEは、ABE7.1、ABE7.2、ABE7.3、ABE7.4、ABE7.5、ABE7.6、ABE7.7、ABE7.8、ABE 7.9、またはABE7.10である。
表6:ABEの遺伝子型
Figure 2022519882000034
Figure 2022519882000035
一部の実施形態では、塩基エディターは第八世代ABE(ABE8)である。一部の実施形態では、ABE8はTadA*8バリアントを含有する。一部の実施形態では、ABE8は、TadA*8バリアント(「ABE8.x-m」)を含有するモノマー構築物を有する。一部の実施形態では、ABE8はABE8.1-mであり、これは、Y147T突然変異を有するTadA*7.10(TadA*8.1)を含有するモノマー構築物を有する。一部の実施形態では、ABE8はABE8.2-mであり、これは、Y147R突然変異を有するTadA*7.10(TadA*8.2)を含有するモノマー構築物を有する。一部の実施形態では、ABE8はABE8.3-mであり、これは、Q154S突然変異を有するTadA*7.10(TadA*8.3)を含有するモノマー構築物を有する。一部の実施形態では、ABE8はABE8.4-mであり、これは、Y123H突然変異を有するTadA*7.10(TadA*8.4)を含有するモノマー構築物を有する。一部の実施形態では、ABE8はABE8.5-mであり、これは、V82S突然変異を有するTadA*7.10(TadA*8.5)を含有するモノマー構築物を有する。一部の実施形態では、ABE8はABE8.6-mであり、これは、T166R突然変異を有するTadA*7.10(TadA*8.6)を含有するモノマー構築物を有する。一部の実施形態では、ABE8はABE8.7-mであり、これは、Q154R突然変異を有するTadA*7.10(TadA*8.7)を含有するモノマー構築物を有する。一部の実施形態では、ABE8はABE8.8-mであり、これは、Y147R、Q154R、およびY123Hの突然変異を有するTadA*7.10(TadA*8.8)を含有するモノマー構築物を有する。一部の実施形態では、ABE8はABE8.9-mであり、これは、Y147R、Q154R、およびI76Yの突然変異を有するTadA*7.10(TadA*8.9)を含有するモノマー構築物を有する。一部の実施形態では、ABE8はABE8.10-mであり、これは、Y147R、Q154R、およびT166Rの突然変異を有するTadA*7.10(TadA*8.10)を含有するモノマー構築物を有する。一部の実施形態では、ABE8はABE8.11-mであり、これは、Y147TおよびQ154Rの突然変異を有するTadA*7.10(TadA*8.11)を含有するモノマー構築物を有する。一部の実施形態では、ABE8はABE8.12-mであり、これは、Y147TおよびQ154Sの突然変異を有するTadA*7.10(TadA*8.12)を含有するモノマー構築物を有する。一部の実施形態では、ABE8はABE8.13-mであり、これは、Y123H(H123Yから逆戻りしたY123H)、Y147R、Q154R、およびI76Yの突然変異を有するTadA*7.10(TadA*8.13)を含有するモノマー構築物を有する。一部の実施形態では、ABE8はABE8.14-mであり、これは、I76YおよびV82Sの突然変異を有するTadA*7.10(TadA*8.14)を含有するモノマー構築物を有する。一部の実施形態では、ABE8はABE8.15-mであり、これは、V82SおよびY147Rの突然変異を有するTadA*7.10(TadA*8.15)を含有するモノマー構築物を有する。一部の実施形態では、ABE8はABE8.16-mであり、これは、V82S、Y123H(H123Yから逆戻りしたY123H)、およびY147Rの突然変異を有するTadA*7.10(TadA*8.16)を含有するモノマー構築物を有する。一部の実施形態では、ABE8はABE8.17-mであり、これは、V82SおよびQ154Rの突然変異を有するTadA*7.10(TadA*8.17)を含有するモノマー構築物を有する。一部の実施形態では、ABE8はABE8.18-mであり、これは、V82S、Y123H(H123Yから逆戻りしたY123H)、およびQ154Rの突然変異を有するTadA*7.10(TadA*8.18)を含有するモノマー構築物を有する。一部の実施形態では、ABE8はABE8.19-mであり、これは、V82S、Y123H(H123Yから逆戻りしたY123H)、Y147R、およびQ154Rの突然変異を有するTadA*7.10(TadA*8.19)を含有するモノマー構築物を有する。一部の実施形態では、ABE8はABE8.20-mであり、これは、I76Y、V82S、Y123H(H123Yから逆戻りしたY123H)、Y147R、およびQ154Rの突然変異を有するTadA*7.10(TadA*8.20)を含有するモノマー構築物を有する。一部の実施形態では、ABE8はABE8.21-mであり、これは、Y147RおよびQ154Sの突然変異を有するTadA*7.10(TadA*8.21)を含有するモノマー構築物を有する。一部の実施形態では、ABE8はABE8.22-mであり、これは、V82SおよびQ154Sの突然変異を有するTadA*7.10(TadA*8.22)を含有するモノマー構築物を有する。一部の実施形態では、ABE8はABE8.23-mであり、これは、V82SおよびY123H(H123Yから逆戻りしたY123H)の突然変異を有するTadA*7.10(TadA*8.23)を含有するモノマー構築物を有する。一部の実施形態では、ABE8はABE8.24-mであり、これは、V82S、Y123H(H123Yから逆戻りしたY123H)、およびY147Tの突然変異を有するTadA*7.10(TadA*8.24)を含有するモノマー構築物を有する。
一部の実施形態では、ABE8は、TadA*8バリアント(「ABE8.x-d」)と融合した野生型E. coliTadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.1-dであり、これは、Y147T突然変異を有するTadA*7.10(TadA*8.1)と融合した野生型E. coliTadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.2-dであり、これは、Y147R突然変異を有するTadA*7.10(TadA*8.2)と融合した野生型E. coliTadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.3-dであり、これは、Q154S突然変異を有するTadA*7.10(TadA*8.3)と融合した野生型E. coliTadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.4-dであり、これは、Y123H突然変異を有するTadA*7.10(TadA*8.4)と融合した野生型E. coliTadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.5-dであり、これは、V82S突然変異を有するTadA*7.10(TadA*8.5)と融合した野生型E. coliTadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.6-dであり、これは、T166R突然変異を有するTadA*7.10(TadA*8.6)と融合した野生型E. coliTadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.7-dであり、これは、Q154R突然変異を有するTadA*7.10(TadA*8.7)と融合した野生型E. coliTadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.8-dであり、これは、Y147R、Q154R、およびY123H 突然変異を有するTadA*7.10(TadA*8.8)と融合した野生型E. coliTadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.9-dであり、これは、Y147R、Q154R、およびI76Y 突然変異を有するTadA*7.10(TadA*8.9)と融合した野生型E. coliTadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.10-dであり、これは、Y147R、Q154R、およびT166Rの突然変異を有するTadA*7.10(TadA*8.10)と融合した野生型E. coliTadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.11-dであり、これは、Y147TおよびQ154Rの突然変異を有するTadA*7.10(TadA*8.11)と融合した野生型E. coliTadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.12-dであり、これは、Y147TおよびQ154Sの突然変異を有するTadA*7.10(TadA*8.12)と融合した野生型E. coliTadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.13-dであり、これは、Y123H(H123Yから逆戻りしたY123H)、Y147R、Q154R、およびI76Yの突然変異を有するTadA*7.10(TadA*8.13)と融合した野生型E. coliTadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.14-dであり、これは、I76YおよびV82Sの突然変異を有するTadA*7.10(TadA*8.14)と融合した野生型E. coliTadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.15-dであり、これは、V82SおよびY147Rの突然変異を有するTadA*7.10(TadA*8.15)と融合した野生型E. coliTadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.16-dであり、これは、V82S、Y123H(H123Yから逆戻りしたY123H)、およびY147Rの突然変異を有するTadA*7.10(TadA*8.16)と融合した野生型E. coliTadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.17-dであり、これは、V82SおよびQ154Rの突然変異を有するTadA*7.10(TadA*8.17)と融合した野生型E. coliTadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.18-dであり、これは、V82S、Y123H(H123Yから逆戻りしたY123H)、およびQ154Rの突然変異を有するTadA*7.10(TadA*8.18)と融合した野生型E. coliTadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.19-dであり、これは、V82S、Y123H(H123Yから逆戻りしたY123H)、Y147R、およびQ154Rの突然変異を有するTadA*7.10(TadA*8.19)と融合した野生型E. coliTadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.20-dであり、これは、I76Y、V82S、Y123H(H123Yから逆戻りしたY123H)、Y147R、およびQ154Rの突然変異を有するTadA*7.10(TadA*8.20)と融合した野生型E. coliTadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.21-dであり、これは、Y147RおよびQ154Sの突然変異を有するTadA*7.10(TadA*8.21)と融合した野生型E. coliTadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.22-dであり、これは、V82SおよびQ154Sの突然変異を有するTadA*7.10(TadA*8.22)と融合した野生型E. coliTadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.23-dであり、これは、V82SおよびY123H(H123Yから逆戻りしたY123H)の突然変異を有するTadA*7.10(TadA*8.23)と融合した野生型E. coliTadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.24-dであり、これは、V82S、Y123H(H123Yから逆戻りしたY123H)、およびY147Tの突然変異を有するTadA*7.10(TadA*8.24)と融合した野生型E. coliTadAを含有するヘテロ二量体構築物を有する。
一部の実施形態では、ABE8は、TadA*8バリアント(「ABE8.x-7」)と融合したTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.1-7であり、これは、Y147T突然変異を有するTadA*7.10(TadA*8.1)と融合したTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.2-7であり、これは、Y147R突然変異を有するTadA*7.10(TadA*8.2)と融合したTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.3-7であり、これは、Q154S突然変異を有するTadA*7.10(TadA*8.3)と融合したTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.4-7であり、これは、Y123H突然変異を有するTadA*7.10(TadA*8.4)と融合したTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.5-7であり、これは、V82S突然変異を有するTadA*7.10(TadA*8.5)と融合したTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.6-7であり、これは、T166R突然変異を有するTadA*7.10(TadA*8.6)と融合したTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.7-7であり、これは、Q154R突然変異を有するTadA*7.10(TadA*8.7)と融合したTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.8-7であり、これは、Y147R、Q154R、およびY123Hの突然変異を有するTadA*7.10(TadA*8.8)と融合したTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.9-7であり、これは、Y147R、Q154R、およびI76Yの突然変異を有するTadA*7.10(TadA*8.9)と融合したTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.10-7であり、これは、Y147R、Q154R、およびT166Rの突然変異を有するTadA*7.10(TadA*8.10)と融合したTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.11-7であり、これは、Y147TおよびQ154Rの突然変異を有するTadA*7.10(TadA*8.11)と融合したTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.12-7であり、これは、Y147TおよびQ154Sの突然変異を有するTadA*7.10(TadA*8.12)と融合したTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.13-7であり、これは、Y123H(H123Yから逆戻りしたY123H)、Y147R、Q154R、およびI76Yの突然変異を有するTadA*7.10(TadA*8.13)と融合したTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.14-7であり、これは、I76YおよびV82Sの突然変異を有するTadA*7.10(TadA*8.14)と融合したTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.15-7であり、これは、V82SおよびY147Rの突然変異を有するTadA*7.10(TadA*8.15)と融合したTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.16-7であり、これは、V82S、Y123H(H123Yから逆戻りしたY123H)、およびY147Rの突然変異を有するTadA*7.10(TadA*8.16)と融合したTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.17-7であり、これは、V82SおよびQ154Rの突然変異を有するTadA*7.10(TadA*8.17)と融合したTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.18-7であり、これは、V82S、Y123H(H123Yから逆戻りしたY123H)、およびQ154Rの突然変異を有するTadA*7.10(TadA*8.18)と融合したTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.19-7であり、これは、V82S、Y123H(H123Yから逆戻りしたY123H)、Y147R、およびQ154Rの突然変異を有するTadA*7.10(TadA*8.19)と融合したTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.20-7であり、これは、I76Y、V82S、Y123H(H123Yから逆戻りしたY123H)、Y147R、およびQ154Rの突然変異を有するTadA*7.10(TadA*8.20)と融合したTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.21-7であり、これは、Y147RおよびQ154Sの突然変異を有するTadA*7.10(TadA*8.21)と融合したTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.22-7であり、これは、V82SおよびQ154Sの突然変異を有するTadA*7.10(TadA*8.22)と融合したTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.23-7であり、これは、V82SおよびY123H(H123Yから逆戻りしたY123H)の突然変異を有するTadA*7.10(TadA*8.23)と融合したTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.24-7であり、これは、V82S、Y123H(H123Yから逆戻りしたY123H)、およびY147Tの突然変異を有するTadA*7.10(TadA*8.24)と融合したTadA*7.10を含有するヘテロ二量体構築物を有する。
一部の実施形態では、以下の表7に示すように、ABEは、
ABE8.1-m、ABE8.2-m、ABE8.3-m、ABE8.4-m、ABE8.5-m、ABE8.6-m、ABE8.7-m、ABE8.8-m、ABE8.9-m、ABE8.10-m、ABE8.11-m、ABE8.12-m、ABE8.13-m、ABE8.14-m、ABE8.15-m、ABE8.16-m、ABE8.17-m、ABE8.18-m、ABE8.19-m、ABE8.20-m、ABE8.21-m、ABE8.22-m、ABE8.23-m、ABE8.24-m、ABE8.1-d、ABE8.2-d、ABE8.3-d、ABE8.4-d、ABE8.5-d、ABE8.6-d、ABE8.7-d、ABE8.8-d、ABE8.9-d、ABE8.10-d、ABE8.11-d、ABE8.12-d、ABE8.13-d、ABE8.14-d、ABE8.15-d、ABE8.16-d、ABE8.17-d、ABE8.18-d、ABE8.19-d、ABE8.20-d、ABE8.21-d、ABE8.22-d、ABE8.23-d、
、またはABE8.24-dである。
表7:アデノシンデアミナーゼ塩基エディター8(ABE8)
Figure 2022519882000036
Figure 2022519882000037
一部の実施形態では、塩基エディター(例えばABE8)は、アデノシンデアミナーゼバリアント(例えばTadA*8)を、循環置換体Cas9(例えばCP5またはCP6)および二部分核局在化配列を含む足場内にクローニングすることによって生成する。一部の実施形態では、塩基エディター(例えば、ABE7.9、ABE7.10、またはABE8)は、NGC PAM CP5バリアント(S. pyrogenes Cas9またはspVRQR Cas9)である。一部の実施形態では、塩基エディター(例えば、ABE7.9、ABE7.10、またはABE8)は、AGA PAM CP5バリアント(S. pyrogenes Cas9またはspVRQR Cas9)である。一部の実施形態では、塩基エディター(例えば、ABE7.9、ABE7.10、またはABE8)は、NGC PAM CP6バリアント(S. pyrogenes Cas9またはspVRQR Cas9)である。一部の実施形態では、塩基エディター(例えば、ABE7.9、ABE7.10、またはABE8)は、AGA PAM CP6バリアント(S. pyrogenes Cas9またはspVRQR Cas9)である。
一部の実施形態では、ABEは、以下の表8に示す遺伝子型を有する。
表8:ABEの遺伝子型
Figure 2022519882000038
以下の表9に示すように、40個のABE8の遺伝子型を記載する。ABEの進化したE. coliTadA部分中における残基位置を示す。ABE8中における突然変異の変化は、ABE7.10突然変異と明白に異なる場合に示す。一部の実施形態では、ABEは、以下の表9に示すようにABEのうちの1つの遺伝子型を有する。
表9:進化されたTadAにおける残基アイデンティティ
Figure 2022519882000039
Figure 2022519882000040
一部の実施形態では、塩基エディターは、アデノシンデアミナーゼ活性を有する以下の配列またはその断片を含む、またはそれから本質的になるABE8.1である:
ABE8.1_Y147T_CP5_NGC PAM_モノマー
Figure 2022519882000041
上記配列において、普通文字はアデノシンデアミナーゼ配列を示し、太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線を引いた配列は二部分核局在化配列を示す。
一部の実施形態では、塩基エディターは、アデノシンデアミナーゼ活性を有する以下の配列またはその断片を含む、またはそれから本質的になるABE8.1である:
pNMG-B335 ABE8.1_Y147T_CP5_NGC PAM_モノマー
Figure 2022519882000042
上記配列において、普通文字はアデノシンデアミナーゼ配列を示し、太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線を引いた配列は二部分核局在化配列を示す。
一部の実施形態では、塩基エディターは、アデノシンデアミナーゼ活性を有する以下の配列またはその断片を含む、またはそれから本質的になるABE8.14である:
NGC PAM CP5を有するpNMG-357_ABE8.14
Figure 2022519882000043
上記配列において、普通文字はアデノシンデアミナーゼ配列を示し、太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線を引いた配列は二部分核局在化配列を示す。
一部の実施形態では、塩基エディターは、アデノシンデアミナーゼ活性を有する以下の配列またはその断片を含む、またはそれから本質的になるABE8.8-mである:
ABE8.8-m
Figure 2022519882000044
上記配列において、普通文字はアデノシンデアミナーゼ配列を示し、太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線を引いた配列は二部分核局在化配列を示し、二重下線を引いた配列は突然変異を示す。
一部の実施形態では、塩基エディターは、アデノシンデアミナーゼ活性を有する以下の配列またはその断片を含む、またはそれから本質的になるABE8.8-dである:
ABE8.8-d
Figure 2022519882000045
上記配列において、普通文字はアデノシンデアミナーゼ配列を示し、太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線を引いた配列は二部分核局在化配列を示し、二重下線を引いた配列は突然変異を示す。
一部の実施形態では、塩基エディターは、アデノシンデアミナーゼ活性を有する以下の配列またはその断片を含む、またはそれから本質的になるABE8.13-mである:
ABE8.13-m
Figure 2022519882000046
上記配列において、普通文字はアデノシンデアミナーゼ配列を示し、太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線を引いた配列は二部分核局在化配列を示し、二重下線を引いた配列は突然変異を示す。
一部の実施形態では、塩基エディターは、アデノシンデアミナーゼ活性を有する以下の配列またはその断片を含む、またはそれから本質的になるABE8.13-dである:
ABE8.13-d
Figure 2022519882000047
上記配列において、普通文字はアデノシンデアミナーゼ配列を示し、太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線を引いた配列は二部分核局在化配列を示し、二重下線を引いた配列は突然変異を示す。
一部の実施形態では、塩基エディターは、アデノシンデアミナーゼ活性を有する以下の配列またはその断片を含む、またはそれから本質的になるABE8.17-mである:
ABE8.17-m
Figure 2022519882000048
上記配列において、普通文字はアデノシンデアミナーゼ配列を示し、太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線を引いた配列は二部分核局在化配列を示し、二重下線を引いた配列は突然変異を示す。
一部の実施形態では、塩基エディターは、アデノシンデアミナーゼ活性を有する以下の配列またはその断片を含む、またはそれから本質的になるABE8.17-dである:
ABE8.17-d
Figure 2022519882000049
上記配列において、普通文字はアデノシンデアミナーゼ配列を示し、太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線を引いた配列は二部分核局在化配列を示し、二重下線を引いた配列は突然変異を示す。
一部の実施形態では、塩基エディターは、アデノシンデアミナーゼ活性を有する以下の配列またはその断片を含む、またはそれから本質的になるABE8.20-mである:
ABE8.20-m
Figure 2022519882000050
上記配列において、普通文字はアデノシンデアミナーゼ配列を示し、太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線を引いた配列は二部分核局在化配列を示し、二重下線を引いた配列は突然変異を示す。
一部の実施形態では、塩基エディターは、アデノシンデアミナーゼ活性を有する以下の配列またはその断片を含む、またはそれから本質的になるABE8.20-dである:
ABE8.20-d
Figure 2022519882000051
上記配列において、普通文字はアデノシンデアミナーゼ配列を示し、太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線を引いた配列は二部分核局在化配列を示し、二重下線を引いた配列は突然変異を示す。
一部の実施形態では、本発明のABE8は以下の配列から選択される:
01. monoABE8.1_bpNLS + Y147T
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
02. monoABE8.1_bpNLS + Y147R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCRFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
03. monoABE8.1_bpNLS + Q154S
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRSVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
04. monoABE8.1_bpNLS + Y123H
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
05. monoABE8.1_bpNLS + V82S
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYSTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
06. monoABE8.1_bpNLS + T166R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSRDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
07. monoABE8.1_bpNLS + Q154R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
08. monoABE8.1_bpNLS + Y147R_Q154R_Y123H
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
09. monoABE8.1_bpNLS + Y147R_Q154R_I76Y
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
10. monoABE8.1_bpNLS + Y147R_Q154R_T166R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSRDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
11. monoABE8.1_bpNLS + Y147T_Q154R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
12. monoABE8.1_bpNLS + Y147T_Q154S
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRSVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
13. monoABE8.1_bpNLS + H123Y123H_Y147R_Q154R_I76Y
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
14. monoABE8.1_bpNLS + V82S + Q154R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYSTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
一部の実施形態では、塩基エディターは、核酸塩基編集ドメイン(例えばデアミナーゼドメインの全体または一部分)と融合したポリヌクレオチドプログラミング可能なヌクレオチド結合ドメイン(例えばCas9由来ドメイン)を含む融合タンパク質である。特定の実施形態では、本明細書中に提供される融合タンパク質は、融合タンパク質の塩基編集活性を改善させる1つまたは複数の特徴を含む。例えば、本明細書中に提供される融合タンパク質のいずれかは、ヌクレアーゼ活性が低下したCas9ドメインを含み得る。一部の実施形態では、本明細書中に提供される融合タンパク質のいずれかは、ヌクレアーゼ活性を有さないCas9ドメイン(dCas9)、または、Cas9ニッカーゼ(nCas9)として言及する、二本鎖DNA分子の一方の鎖を切断するCas9ドメインを有し得る。
一部の実施形態では、塩基エディターは、ウラシルグリコシラーゼ阻害因子(UGI)の全体または一部分を含むドメインをさらに含む。一部の実施形態では、塩基エディターは、ウラシルDNAグリコシラーゼ(UDG)などのウラシル結合タンパク質(UBP)の全体または一部分を含むドメインを含む。一部の実施形態では、塩基エディターは、核酸ポリメラーゼの全体または一部分を含むドメインを含む。一部の実施形態では、塩基エディター内に取り込まれた核酸ポリメラーゼまたはその一部分は、損傷乗り越えDNAポリメラーゼである。
一部の実施形態では、塩基エディターのドメインは複数のドメインを含むことができる。例えば、Cas9に由来するポリヌクレオチドプログラミング可能なヌクレオチド結合ドメインを含む塩基エディターは、野生型または天然のCas9のRECローブおよびNUCローブに対応するRECローブおよびNUCローブを含むことができる。別の例では、塩基エディターは、RuvCIドメイン、BHドメイン、REC1ドメイン、REC2ドメイン、RuvCIIドメイン、L1ドメイン、HNHドメイン、L2ドメイン、RuvCIIIドメイン、WEDドメイン、TOPOドメイン、またはCTDドメインのうちの1つまたは複数を含むことができる。一部の実施形態では、塩基エディターの1つまたは複数のドメインは、ドメインを含むポリペプチドの野生型バージョンと比較して1つの突然変異(例えば、置換、挿入、欠失)を含む。例えば、ポリヌクレオチドプログラミング可能なDNA結合ドメインのHNHドメインはH840A置換を含むことができる。別の例では、ポリヌクレオチドプログラミング可能なDNA結合ドメインのRuvCIドメインは D10A置換を含むことができる。
本明細書中に開示した塩基エディターの異なるドメイン(例えば隣接ドメイン)を、1つまたは複数のリンカードメイン(例えばXTENリンカードメイン)を使用してまたは使用せずに、互いに接続することができる。一部の実施形態では、リンカードメインは、単結合(例えば共有結合)、化学基、または、2つの分子もしくは部分、例えば、例えば第1のドメイン(例えばCas9由来ドメイン)および第2のドメイン(例えばアデノシンデアミナーゼドメイン)などの融合タンパク質の2つのドメインを連結する分子であり得る。一部の実施形態では、リンカーは共有結合(例えば、炭素-炭素結合、ジスルフィド結合、炭素-ヘテロ原子結合など)である。特定の実施形態では、リンカーは、アミド結合の炭素窒素結合である。特定の実施形態では、リンカーは、環状または非環状、置換または非置換、分枝状または非分枝状の脂肪族またはヘテロ脂肪族のリンカーである。特定の実施形態では、リンカーはポリマー(例えば、ポリエチレン、ポリエチレングリコール、ポリアミド、ポリエステルなど)である。特定の実施形態では、リンカーは、アミノアルカン酸のモノマー、二量体、またはポリマーを含む。一部の実施形態では、リンカーは、アミノアルカン酸(例えば、グリシン、エタン酸、アラニン、ベータ-アラニン、3-アミノプロパン酸、4-アミノブタン酸、5-ペンタン酸など)を含む。一部の実施形態では、リンカーは、アミノヘキサン酸(Ahx)のモノマー、二量体、またはポリマーを含む。特定の実施形態では、リンカーは、炭素環部分(例えば、シクロペンタン、シクロヘキサン)に基づく。他の実施形態では、リンカーはポリエチレングリコール部分(PEG)を含む。特定の実施形態では、リンカーは、アリールまたはヘテロアリール部分を含む。特定の実施形態では、リンカーはフェニル環に基づく。リンカーは、ペプチドからの求核剤(例えば、チオール、アミノ)とリンカーとの付着を容易にするための官能化部分を含むことができる。任意の求電子剤をリンカーの一部として使用することができる。例示的な求電子剤としては、それだけには限定されないが、活性化エステル、活性化アミド、Michaelアクセプター、ハロゲン化アルキル、ハロゲン化アリール、ハロゲン化アシル、およびイソチオシアネートが挙げられる。一部の実施形態では、リンカーは、Cas9ヌクレアーゼドメインを含めたRNAプログラミング可能なヌクレアーゼのgRNA結合ドメインと核酸編集タンパク質の触媒ドメインとを結合させる。一部の実施形態では、リンカーは、dCas9と第2のドメイン(例えばUGIなど)とを結合させる。
典型的には、リンカーは、2つの基、分子、または他の部分の間に位置する、またはそれが隣接しており、共有結合を介してそれぞれと接続しており、したがって2つが接続される。一部の実施形態では、リンカーはアミノ酸または複数のアミノ酸(例えばペプチドまたはタンパク質)である。一部の実施形態では、リンカーは、有機分子、基、ポリマー、または化学部分である。一部の実施形態では、リンカーは、2~100個のアミノ酸の長さ、例えば、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30~35、35~40、40~45、45~50、50~60、60~70、70~80、80~90、90~100、100~150、または150~200個のアミノ酸の長さである。一部の実施形態では、リンカーは、約3~約104(例えば、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、55、60、65、70、75、80、85、90、95、または100)個のアミノ酸の長さである。より長いまたはより短いリンカーも企図される。一部の実施形態では、リンカードメインは、XTENリンカーとしても言及することができるアミノ酸配列SGSETPGTSESATPESを含む。核酸塩基エディターの活性のために最適な長さを達成するために、融合タンパク質ドメインを連結させるための任意の方法を用いることができる(例えば、(SGGS)n、(GGGS)n、(GGGGS)n、および(G)nの形態の非常に柔軟なリンカーから、(EAAAK)n、(GGS)n、SGSETPGTSESATPES(例えばGuilinger JP, Thompson DB, Liu DR. Fusion of catalytically inactive Cas9 to FokI nuclease improves the specificity of genome modification. Nat. Biotechnol. 2014; 32(6): 577-82を参照、その全内容は参照により本明細書に組み込まれる)、または(XP)nモチーフの形態のより剛性なリンカーまでの範囲)。一部の実施形態では、nは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、または15である。一部の実施形態では、リンカーは(GGS)nモチーフを含み、式中、nは1、3、または7である。一部の実施形態では、本明細書中に提供される融合タンパク質のCas9ドメインは、アミノ酸配列SGSETPGTSESATPESを含むリンカーを介して融合している。一部の実施形態では、リンカーは複数のプロリン残基を含み、5~21、5~14、5~9、5~7個のアミノ酸の長さ、例えば、PAPAP、PAPAPA、PAPAPAP、PAPAPAPA、P(AP)4、P(AP)7、P(AP)10である(例えばTan J, Zhang F, Karcher D, Bock R. Engineering of high-precision base editors for site-specific single nucleotide replacement. Nat Commun. 2019 Jan 25;10(1):439を参照、その全内容は参照により本明細書に組み込まれる)。そのようなプロリンに富んだリンカーは「剛性(rigid)」リンカーとも呼ばれる。
本発明の融合タンパク質は核酸編集ドメインを含む。一部の実施形態では、デアミナーゼはアデノシンデアミナーゼである。一部の実施形態では、デアミナーゼは脊椎動物デアミナーゼである。一部の実施形態では、デアミナーゼは無脊椎動物デアミナーゼである。一部の実施形態では、デアミナーゼは、ヒト、チンパンジー、ゴリラ、サル、ウシ、イヌ、ラット、またはマウスのデアミナーゼである。一部の実施形態では、デアミナーゼはヒトデアミナーゼである。一部の実施形態では、デアミナーゼはラットデアミナーゼである。
[リンカー]
特定の実施形態では、リンカーは、本発明のペプチドまたはペプチドドメインのいずれかを連結させるために使用し得る。リンカーは、共有結合のような単純なものであってもよく、または、多数の原子の長さのポリマーリンカーであってもよい。特定の実施形態では、リンカーは、ポリペプチドであるかまたはアミノ酸に基づく。他の実施形態では、リンカーはペプチド様ではない。特定の実施形態では、リンカーは、共有結合(例えば、炭素-炭素結合、ジスルフィド結合、炭素-ヘテロ原子結合など)である。特定の実施形態では、リンカーは、アミド結合の炭素-窒素結合である。特定の実施形態では、リンカーは、環状または非環状、置換または非置換、分枝状または非分枝状の脂肪族またはヘテロ脂肪族のリンカーである。特定の実施形態では、リンカーはポリマー(例えば、ポリエチレン、ポリエチレングリコール、ポリアミド、ポリエステルなど)である。特定の実施形態では、リンカーは、アミノアルカン酸のモノマー、二量体、またはポリマーを含む。特定の実施形態では、リンカーはアミノアルカン酸(例えば、グリシン、エタン酸、アラニン、ベータ-アラニン、3-アミノプロパン酸、4-アミノブタン酸、5-ペンタン酸など)を含む。特定の実施形態では、リンカーは、アミノヘキサン酸(Ahx)のモノマー、二量体、またはポリマーを含む。特定の実施形態では、リンカーは、炭素環部分(例えば、シクロペンタン、シクロヘキサン)に基づく。他の実施形態では、リンカーはポリエチレングリコール部分(PEG)を含む。他の実施形態では、リンカーはアミノ酸を含む。特定の実施形態では、リンカーはペプチドを含む。特定の実施形態では、リンカーは、アリールまたはヘテロアリール部分を含む。特定の実施形態では、リンカーはフェニル環に基づく。リンカーは、ペプチドからの求核剤(例えば、チオール、アミノ)とリンカーとの付着を容易にするための官能化部分を含み得る。任意の求電子剤をリンカーの一部として使用し得る。例示的な求電子剤としては、それだけには限定されないが、活性化エステル、活性化アミド、Michaelアクセプター、ハロゲン化アルキル、ハロゲン化アリール、ハロゲン化アシル、およびイソチオシアネートが挙げられる。
一部の実施形態では、リンカーは、アミノ酸または複数のアミノ酸(例えばペプチドまたはタンパク質)である。一部の実施形態では、リンカーは、単結合 (例えば共有結合)、有機分子、基、ポリマー、または化学部分である。一部の実施形態では、リンカーは、約3~約104(例えば、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、55、60、65、70、75、80、85、90、95、または100)個のアミノ酸の長さである。
一部の実施形態では、アデノシンデアミナーゼとnapDNAbpとは、4、16、32、または104個のアミノ酸の長さであるリンカーを介して融合している。一部の実施形態では、リンカーは約3~約104個のアミノ酸の長さである。一部の実施形態では、本明細書中に提供される融合タンパク質のいずれかは、リンカーを介して互いに融合しているアデノシンデアミナーゼおよびCas9ドメインを含む。核酸塩基エディターの活性のために最適な長さを達成するために、デアミナーゼドメイン(例えば操作したecTadA)およびCas9ドメインの間に、様々なリンカーの長さおよび柔軟性を用いることができる(例えば、(GGGS)n、(GGGGS)n、および(G)nの形態の非常に柔軟なリンカーから、(EAAAK)n、(SGGS)n、SGSETPGTSESATPES(例えばGuilinger JP, Thompson DB, Liu DR. Fusion of catalytically inactive Cas9 to FokI nuclease improves the specificity of genome modification. Nat. Biotechnol. 2014; 32(6): 577-82を参照、その全内容は参照により本明細書に組み込まれる)、および(XP)nの形態のより剛性なリンカーまでの範囲)。いくつかの実施態様において、nは、1、2、3、4、5、6、7、8、9、10、11、12、13、14または15である。ある実施形態において、リンカーは、(GGS)nモチーフを含み、ここで、nは、1、3、または7である。いくつかの実施形態において、本明細書で提供される融合タンパク質のいずれかのアデノシンデアミナーゼおよびCas9ドメインは、アミノ酸配列SGSETPGTSESATPESを含むリンカー(例えばXTENリンカー)を介して融合される。
[ガイドRNAを伴うCas9複合体]
本開示のいくつかの態様は、本明細書において提供される融合タンパク質のいずれかと、融合タンパク質のCAS9ドメイン(例えばdCas9、ヌクレアーゼ活性Cas9、またはCas9ニッカーゼ)に結合したガイドRNA(例えば、GSD1a標的化可能な突然変異を有するG6PCアリルを標的化するガイド)とを含む複合体を提供する。融合タンパク質ドメインを連結するための任意の方法を用いて(例えば、(GGGS)n、(GGGGS)n、および(G)nの形態の非常に柔軟なリンカーから、(EAAAK)n、(SGGS)n、SGSETPGTSESATPES(例えば、Guilinger JP, Thompson DB, Liu DR. Fusion of catalytically inactive Cas9 to FokI nuclease improves the specificity of genome modification. Nat. Biotechnol. 2014; 32(6): 577-82参照。その全内容は参照により本明細書に組み込まれる)、および(XP)nの形態のより剛性の高いリンカーまで)、核酸塩基エディターの活性のための最適な長さを達成することができる。いくつかの実施形態において、nは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、または15である。いくつかの実施形態において、リンカーは、(GGS)nモチーフを含み、ここで、nは、1、3、または7である。いくつかの実施形態において、本明細書において提供される融合タンパク質のCas9ドメインは、アミノ酸配列SGSETPGTSESATPESを含むリンカーを介して融合される。
いくつかの実施形態において、ガイド核酸(例えばガイドRNA)は、15~100ヌクレオチド長であり、標的配列に相補的である少なくとも10個の連続したヌクレオチドの配列を含む。いくつかの実施形態において、ガイドRNAは、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、または50ヌクレオチド長である。いくつかの実施形態において、ガイドRNAは、標的配列に相補的な15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、または40個の連続したヌクレオチドの配列を含む。いくつかの実施形態において、標的配列はDNA配列である。いくつかの実施形態において、標的配列は、細菌、酵母、真菌、昆虫、植物、または動物のゲノムにおける配列である。いくつかの実施形態において、標的配列は、ヒトのゲノムにおける配列である。いくつかの実施形態において、標的配列の3’末端は、標準PAM配列(NGG)にすぐ隣接している。いくつかの実施形態において、標的配列の3’末端は、非標準PAM配列(例えば、表2に記載されている配列または5’-NAA-3’)にすぐ隣接している。いくつかの実施形態において、ガイド核酸(例えばガイドRNA)は、GSD1a標的化可能な突然変異を有するG6PCアリルにおける配列に相補的である。
本開示のいくつかの態様は、本明細書において提供される融合タンパク質または複合体を使用する方法を提供する。例えば、本開示のいくつかの態様は、DNA分子を、本明細書において提供される融合タンパク質のいずれか、および少なくとも1つのガイドRNAと接触させることを含む方法を提供し、ここで、ガイドRNAは、約15~100ヌクレオチド長であり、標的配列に相補的である少なくとも10個の連続したヌクレオチドの配列を含む。いくつかの実施形態において、標的配列の3’末端は、AGC、GAG、TTT、GTG、またはCAA配列にすぐ隣接している。いくつかの実施形態において、標的配列の3’末端は、NGA、NGCG、NGN、NNGRRT、NNNRRT、NGCG、NGCN、NGTN、NGTN、NGTN、または5’(TTTV)配列にすぐ隣接している。
それぞれの配列における特定の位置または残基の番号付けは、使用される特定のタンパク質および番号付けスキームに依存することが理解されるであろう。例えば、成熟タンパク質の前駆体と成熟タンパク質そのものとでは番号付けが異なることがあり、種ごとの配列の違いが番号付けに影響することがある。当業者は、当技術分野で周知の方法、例えば、配列アラインメントおよび相同的残基の決定によって、任意の相同的タンパク質およびそれぞれのコード核酸中のそれぞれの残基を同定することができる。
本明細書に開示された融合タンパク質のいずれかを標的部位、例えば、編集される突然変異を含む部位にターゲティングするためには、融合タンパク質をガイドRNAと共に共発現させることが典型的に必要であることは当業者には明らかであろう。本明細書の他の箇所でより詳細に説明されるように、ガイドRNAは、典型的には、Cas9結合を可能にするtracrRNAフレームワークと、Cas9:核酸編集酵素/ドメイン融合タンパク質に配列特異性を付与するガイド配列とを含む。あるいは、ガイドRNAおよびtracrRNAは、2つの核酸分子として別々に提供され得る。いくつかの実施形態において、ガイドRNAは、ガイド配列が標的配列に相補的な配列を含むという構造を含む。ガイド配列は典型的には20ヌクレオチド長である。Cas9:核酸編集酵素/ドメイン融合タンパク質を特定のゲノム標的部位にターゲティングするための適切なガイドRNAの配列は、本開示に基づいて当業者に明らかであろう。そのような適切なガイドRNA配列は、典型的には、編集される標的ヌクレオチドの50ヌクレオチド以内の上流または下流内の核酸配列に相補的なガイド配列を含む。提供された融合タンパク質のいずれかを特定の標的配列にターゲティングするのに適切ないくつかの例示的なガイドRNA配列が本明細書に提供される。
[ガイドRNAを伴うCas12複合体]
本開示のいくつかの態様は、本明細書において提供される融合タンパク質のいずれかと、ガイドRNA(例えば、編集のための標的ポリヌクレオチドを標的指向化させるガイド)とを含む複合体を提供する。
いくつかの実施形態において、ガイド核酸(例えばガイドRNA)は、15~100ヌクレオチド長であり、標的配列に相補的である少なくとも10個の連続したヌクレオチドの配列を含む。いくつかの実施形態において、ガイドRNAは、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、または50ヌクレオチド長である。いくつかの実施形態において、ガイドRNAは、標的配列に相補的な15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、または40個の連続したヌクレオチドの配列を含む。いくつかの実施形態において、標的配列はDNA配列である。いくつかの実施形態において、標的配列は、細菌、酵母、真菌、昆虫、植物、または動物のゲノムにおける配列である。いくつかの実施形態において、標的配列は、ヒトのゲノムにおける配列である。いくつかの実施形態において、標的配列の3’末端は、標準PAM配列にすぐ隣接している。いくつかの実施形態において、標的配列の3’末端は、非標準PAM配列にすぐ隣接している。
本開示のいくつかの態様は、本明細書において提供される融合タンパク質または複合体を使用する方法を提供する。例えば、本開示のいくつかの態様は、DNA分子を、本明細書において提供される融合タンパク質のいずれか、および少なくとも1つのガイドRNAと接触させることを含む方法を提供し、ここで、ガイドRNAは、約15~100ヌクレオチド長であり、標的配列に相補的である少なくとも10個の連続したヌクレオチドの配列を含む。いくつかの実施形態において、標的配列の3’末端は、例えば、TTN、DTTN、GTTN、ATTN、ATTC、DTTNT、WTTN、HATY、TTTN、TTTV、TTTC、TG、RTR、またはYTN PAM部位にすぐ隣接している。
それぞれの配列における特定の位置または残基の番号付けは、使用される特定のタンパク質および番号付けスキームに依存することが理解されるであろう。例えば、成熟タンパク質の前駆体と成熟タンパク質そのものとでは番号付けが異なることがあり、種ごとの配列の違いが番号付けに影響することがある。当業者は、当技術分野で周知の方法、例えば、配列アラインメントおよび相同的残基の決定によって、任意の相同的タンパク質およびそれぞれのコード核酸中のそれぞれの残基を同定することができる。
本明細書に開示された融合タンパク質のいずれかを標的部位、例えば、編集される突然変異を含む部位にターゲティングするためには、融合タンパク質をガイドRNAと共に共発現させることが典型的に必要であることは当業者には明らかであろう。本明細書の他の箇所でより詳細に説明されるように、ガイドRNAは、典型的には、Cas12結合を可能にするtracrRNAフレームワークと、Cas12:核酸編集酵素/ドメイン融合タンパク質に配列特異性を付与するガイド配列とを含む。あるいは、ガイドRNAおよびtracrRNAは、2つの核酸分子として別々に提供され得る。いくつかの実施形態において、ガイドRNAは、ガイド配列が標的配列に相補的な配列を含むという構造を含む。ガイド配列は典型的には20ヌクレオチド長である。Cas12:核酸編集酵素/ドメイン融合タンパク質を特定のゲノム標的部位にターゲティングするための適切なガイドRNAの配列は、本開示に基づいて当業者に明らかであろう。そのような適切なガイドRNA配列は、典型的には、編集される標的ヌクレオチドの50ヌクレオチド以内の上流または下流内の核酸配列に相補的なガイド配列を含む。提供された融合タンパク質のいずれかを特定の標的配列にターゲティングするのに適切ないくつかの例示的なガイドRNA配列が本明細書に提供される。
本明細書に開示される塩基エディターのドメインは、デアミナーゼドメインがCas12タンパク質に内在化する限り、任意の順序で配列され得る。例えば、Cas12ドメインおよびデアミナーゼドメインを含む融合タンパク質を含む塩基エディターの非限定的な例は、次のように配列され得る:
NH2- [Cas12ドメイン]-リンカー1- [ABE8]-リンカー2- [Cas12ドメイン]-COOH;
NH2- [Cas12ドメイン]-リンカー1- [ABE8]- [Cas12ドメイン]-COOH;
NH2- [Cas12ドメイン]- [ABE8]-リンカー2- [Cas12ドメイン]-COOH;
NH2- [Cas12ドメイン]- [ABE8]- [Cas12ドメイン]-COOH;
NH2- [Cas12ドメイン]-リンカー1- [ABE8]-リンカー2- [Cas12ドメイン]- [イノシンBER阻害因子]-COOH;
NH2- [Cas12ドメイン]-リンカー1- [ABE8]- [Cas12ドメイン]- [イノシンBER阻害因子]-COOH;
NH2- [Cas12ドメイン]- [ABE8]-リンカー2- [Cas12ドメイン]- [イノシンBER阻害因子]-COOH;;
NH2- [Cas12ドメイン]- [ABE8]- [Cas12ドメイン]- [イノシンBER阻害因子]-COOH;
NH2- [イノシンBER阻害因子]- [Cas12ドメイン]-リンカー1- [ABE8]-リンカー2- [Cas12ドメイン]-COOH;
NH2- [イノシンBER阻害因子]- [Cas12ドメイン]-リンカー1- [ABE8]- [Cas12ドメイン]-COOH;
NH2- [イノシンBER阻害因子]- [Cas12ドメイン]- [ABE8]-リンカー2- [Cas12ドメイン]-COOH;
NH2- [イノシンBER阻害因子]NH2- [Cas12ドメイン]- [ABE8]- [Cas12ドメイン]-COOH;
さらに、場合によっては、Gamタンパク質を塩基エディターのN末端に融合させることができる。場合によっては、Gamタンパク質を塩基エディターのC末端に融合させることができる。バクテリオファージMuのGamタンパク質は二本鎖切断(DSB) の末端に結合し、それらを分解から保護することができる。いくつかの実施形態において、Gamを使用してDSBの遊離末端を結合することにより、塩基編集のプロセス中のインデル形成を低減することができる。いくつかの実施形態において、174残基のGamタンパク質は、塩基エディターのN末端に融合される。Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity”Science Advances 3:eaao4774 (2017)を参照されたい。場合によっては、1つまたは複数の突然変異が、野生型ドメインと比較して、塩基編集ドメインの長さを変化させることができる。例えば、少なくとも1つのドメインにおける少なくとも1つのアミノ酸の欠失は、塩基エディターの長さを短くすることができる。別の例では、1つまたは複数の突然変異は、野生型ドメインに対するドメインの長さを変化させない。例えば、いずれかのドメインにおける置換(複数可)は塩基エディターの長さを変えない。すべてのドメインの長さが野生型ドメインと同じであるような塩基エディターの非限定的な例は、以下を含み得る:
NH2- [Cas12ドメイン]-リンカー1- [APOBEC1]-リンカー2- [Cas12ドメイン]-COOH;
NH2- [Cas12ドメイン]-リンカー1- [APOBEC1]- [Cas12ドメイン]-COOH;
NH2- [Cas12ドメイン]- [APOBEC1]-リンカー2- [Cas12ドメイン]-COOH;
NH2- [Cas12ドメイン]- [APOBEC1]- [Cas12ドメイン]-COOH;
NH2- [Cas12ドメイン]-リンカー1- [APOBEC1]-リンカー2- [Cas12ドメイン]- [UGI]-COOH;
NH2- [Cas12ドメイン]-リンカー1- [APOBEC1]- [Cas12ドメイン]- [UGI]-COOH;
NH2- [Cas12ドメイン]- [APOBEC1]-リンカー2- [Cas12ドメイン]- [UGI]-COOH;
NH2- [Cas12ドメイン]- [APOBEC1]- [Cas12ドメイン]- [UGI]-COOH;
NH2- [UGI]- [Cas12ドメイン]-リンカー1- [APOBEC1]-リンカー2- [Cas12ドメイン]-COOH;
NH2- [UGI]- [Cas12ドメイン]-リンカー1- [APOBEC1]- [Cas12ドメイン]-COOH;
NH2- [UGI]- [Cas12ドメイン]- [APOBEC1]-リンカー2- [Cas12ドメイン]-COOH;
NH2- [UGI]- [Cas12ドメイン]- [APOBEC1]- [Cas12ドメイン]-COOH;
いくつかの実施形態において、本明細書において提供される塩基編集融合タンパク質は、正確な位置、例えば、標的塩基が規定された領域(例えば「脱アミノ化ウィンドウ」)内に配置されるような位置に位置付けられる必要がある。場合によっては、標的は4塩基領域内にあり得る。場合によっては、そのような規定された標的領域は、PAMの約15塩基上流にあり得る。Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017); and Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017) 参照;その全内容が参照により本明細書に組み入れられる。
規定された標的領域は、脱アミノ化ウィンドウであり得る。脱アミノ化ウィンドウは、塩基エディターが標的ヌクレオチドに作用して脱アミノ化する、規定された領域であり得る。いくつかの実施形態において、脱アミノ化ウィンドウは、2、3、4、5、6、7、8、9または10塩基領域内にある。いくつかの実施形態において、脱アミノ化ウィンドウは、PAMの5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24または25塩基上流にある。
本開示の塩基エディターは、標的ポリヌクレオチド配列の編集を促進させる任意のドメイン、特徴またはアミノ酸配列を含むことができる。例えば、いくつかの実施形態において、塩基エディターは、核局在化配列(NLS)を含む。いくつかの実施形態において、塩基エディターのNLSは、デアミナーゼドメインとnapDNAbpドメインとの間に位置する。いくつかの実施形態において、塩基エディターのNLSは、napDNAbpドメインに対してC末端に位置する。
融合タンパク質に含まれるタンパク質ドメインは、異種機能ドメインであり得る。融合タンパク質に含まれ得るタンパク質ドメインの非限定的な例としては、デアミナーゼドメイン(例えば、シチジンデアミナーゼおよび/またはアデノシンデアミナーゼ)、ウラシルグリコシラーゼ阻害因子(UGI)ドメイン、エピトープタグ、およびレポーター遺伝子配列が挙げられる。タンパク質ドメインは、例えば、以下の活性のうちの1つまたは複数を有する異種機能ドメインであり得る:転写活性化活性、転写抑制活性、転写放出因子活性、遺伝子抑制活性、クロマチン修飾活性、エピジェネティック修飾活性、ヒストン修飾活性、RNA切断活性、および核酸結合活性。そのような異種機能ドメインは、標的DNAと結合した標的ポリペプチド(例えばヒストン、DNA結合タンパク質など)の修飾などの機能活性を付与し、例えばヒストンメチル化、ヒストンアセチル化、ヒストンユビキチン化などをもたらすことができる。付与される他の機能および/または活性は、トランスポザーゼ活性、インテグラーゼ活性、リコンビナーゼ活性、リガーゼ活性、ユビキチンリガーゼ活性、脱ユビキチン化活性、アデニル化活性、脱アデニル化活性、SUMO化活性、脱SUMO化活性、または上記のものの任意の組合せを含み得る。
ドメインは、エピトープタグ、レポータータンパク質、他の結合ドメインを用いて検出または標識され得る。エピトープタグの非限定的な例は、ヒスチジン(His)タグ、V5タグ、FLAGタグ、インフルエンザヘマグルチニン(HA)タグ、Mycタグ、VSV-Gタグ、およびチオレドキシン(Trx)タグを含む。レポーター遺伝子の例としては、グルタチオン-5-トランスフェラーゼ(GST)、西洋ワサビペルオキシダーゼ(HRP)、クロラムフェニコールアセチルトランスフェラーゼ(CAT)、β-ガラクトシダーゼ、β-グルクロニダーゼ、ルシフェラーゼ、緑色蛍光タンパク質(GFP)、HcRed、DsRed、シアン蛍光タンパク質(CFP)、黄色蛍光タンパク質(YFP)、および青色蛍光タンパク質(BFP)を含む自己蛍光タンパク質が挙げられるが、これらに限定されない。さらなるタンパク質配列には、DNA分子に結合するかまたは他の細胞分子に結合するアミノ酸配列が含まれ得、これらには、マルトース結合タンパク質(MBP)、Sタグ、Lex A DNA結合ドメイン(DBD)融合体、GAL4 DNA結合ドメイン融合体、および単純ヘルペスウイルス(HSV)BP16タンパク質融合体が挙げられるが、これらに限定されない。
いくつかの実施形態において、BhCas12bガイドポリヌクレオチドは以下の配列を有する:
BhCas12b sgRNA足場(下線)+20nt~23ntガイド配列(Nnによって表される)
5’GUUCUGTCUUUUGGUCAGGACAACCGUCUAGCUAUAAGUGCUGCAGGGUGUGAGAAACUCCUAUUGCUGGACGAUGUCUCUUACGAGGCAUUAGCACNNNNNNNNNNNNNNNNNNNN-3’
いくつかの実施形態において、BvCas12bおよびAaCas12bガイドポリヌクレオチドは以下の配列を有する:
BvCas12b sgRNA足場(下線)+20nt~23ntガイド配列(Nnによって表される)
5’GACCUAUAGGGUCAAUGAAUCUGUGCGUGUGCCAUAAGUAAUUAAAAAUUACCCACCACAGGAGCACCUGAAAACAGGUGCUUGGCACNNNNNNNNNNNNNNNNNNNN-3’
AaCas12b sgRNA足場(下線)+20nt~23ntガイド配列(Nnによって表される)
5’GUCUAAAGGACAGAAUUUUUCAACGGGUGUGCCAAUGGCCACUUUCCAGGUGGCAAAGCCCGUUGAACUUCUCAAAAAGAACGAUCUGAGAAGUGGCACNNNNNNNNNNNNNNNNNNNN-3’
[アデノシンデアミナーゼバリアントおよびCas9ドメインを含む融合タンパク質を使用する方法]
本開示のいくつかの態様は、本明細書において提供される融合タンパク質または複合体を使用する方法を提供する。例えば、本開示のいくつかの態様は、タンパク質の突然変異体型をコードするDNA分子を、本明細書において提供される融合タンパク質のいずれか、および少なくとも1つのガイドRNAと接触させることを含む方法を提供し、ここで、ガイドRNAは、約15~100ヌクレオチド長であり、標的配列に相補的である少なくとも10個の連続したヌクレオチドの配列を含む。いくつかの実施形態において、標的配列の3’末端は、標準PAM配列(NGG)にすぐ隣接している。いくつかの実施形態において、標的配列の3’末端は、標準PAM配列(NGG)にすぐ隣接していない。いくつかの実施形態において、標的配列の3’末端は、AGC、GAG、TTT、GTG、またはCAA配列にすぐ隣接している。いくつかの実施形態において、標的配列の3’末端は、NGA、NGCG、NGN、NNGRRT、NNNRRT、NGCG、NGCN、NGTN、NGTN、NGTN、または5’(TTTV)配列にすぐ隣接している。
それぞれの配列における特定の位置または残基の番号付けは、使用される特定のタンパク質および番号付けスキームに依存することが理解されるであろう。例えば、成熟タンパク質の前駆体と成熟タンパク質そのものとでは番号付けが異なることがあり、種ごとの配列の違いが番号付けに影響することがある。当業者は、当技術分野で周知の方法、例えば、配列アラインメントおよび相同的残基の決定によって、任意の相同的タンパク質およびそれぞれのコード核酸中のそれぞれの残基を同定することができる。
本明細書に開示された、Cas9ドメインおよびアデノシンデアミナーゼバリアント(例えば、ABE8)を含む融合タンパク質のいずれかを標的部位、例えば、編集される突然変異を含む部位にターゲティングするためには、融合タンパク質をガイドRNA(例えばsgRNA)と共に共発現させることが典型的に必要であることは当業者には明らかであろう。本明細書の他の箇所でより詳細に説明されるように、ガイドRNAは、典型的には、Cas9結合を可能にするtracrRNAフレームワークと、Cas9:核酸編集酵素/ドメイン融合タンパク質に配列特異性を付与するガイド配列とを含む。あるいは、ガイドRNAおよびtracrRNAは、2つの核酸分子として別々に提供され得る。いくつかの実施形態において、ガイドRNAは、ガイド配列が標的配列に相補的な配列を含むという構造を含む。ガイド配列は典型的には20ヌクレオチド長である。Cas9:核酸編集酵素/ドメイン融合タンパク質を特定のゲノム標的部位にターゲティングするための適切なガイドRNAの配列は、本開示に基づいて当業者に明らかであろう。そのような適切なガイドRNA配列は、典型的には、編集される標的ヌクレオチドの50ヌクレオチド以内の上流または下流内の核酸配列に相補的なガイド配列を含む。提供された融合タンパク質のいずれかを特定の標的配列にターゲティングするのに適切ないくつかの例示的なガイドRNA配列が本明細書に提供される。
[塩基エディターの効率性]
CRISPR-Cas9ヌクレアーゼは、標的ゲノム編集を媒介するために広く使用されている。ほとんどのゲノム編集応用において、Cas9はガイドポリヌクレオチド(例えば単一ガイドRNA (sgRNA))と複合体を形成し、sgRNA配列により指定される標的部位で二本鎖DNA切断 (DSB) を誘導する。細胞は主に非相同末端結合 (NHEJ) 修復経路を介してこのDSBに応答し、遺伝子を破壊するフレームシフト変異を生じる確率的挿入または欠失 (インデル) を生じる。DSBに隣接する配列と高度の相同性を有するドナーDNA鋳型の存在下で、相同性指向性修復 (HDR) として知られる代替経路を介して遺伝子補正が達成され得る。残念ながら、ほとんどの非侵襲的条件下では、HDRは非効率であり、細胞状態および細胞型に依存し、より高いインデルの頻度によって支配される。ヒトの疾患に関連する既知の遺伝的変異の大部分は点突然変異であるため、より効率的かつクリーンに正確な点突然変異を作製できる方法が必要である。本明細書に提供される塩基編集システムは、二本鎖DNA切断を生じることなく、ドナーDNA鋳型を必要とせず、かつ過剰な確率的挿入および欠失を誘導することなく、ゲノム編集を提供するための新しい方法を提供する。
本発明の塩基エディターは、有利なことに、著しい割合のインデルを生成することなく、突然変異を含むタンパク質をコードする特定のヌクレオチド塩基を修飾する。「インデル(indel)」という用語は、本明細書において使用される場合、核酸内のヌクレオチド塩基の挿入または欠失を指す。このような挿入または欠失は、遺伝子のコード領域内でフレームシフト突然変異を引き起こす可能性がある。いくつかの実施形態において、標的核酸配列において多数の挿入(insertion)または欠失(deletion)(すなわちインデル:indel)を生じることなく、核酸内の特定のヌクレオチドを効率的に改変(例えば変異または脱アミノ化)する塩基エディターを生成することが望ましい。特定の実施形態では、本明細書に提供される塩基エディターのいずれも、インデルに対して意図された改変(例えば点突然変異または脱アミノ化)のより大きな割合を生成することができる。
いくつかの実施形態において、本明細書で提供される塩基エディター系のいずれも、標的ポリヌクレオチド配列において、50%未満、40%未満、30%未満、20%未満、19%未満、18%未満、17%未満、16%未満、15%未満、14%未満、13%未満、12%未満、11%未満、10%未満、9%未満、8%未満、7%未満、6%未満、5%未満、4%未満、3%未満、2%未満、1%未満、0.9%未満、0.8%未満、未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.09%未満、0.08%未満、0.07%未満、未満、0.06%未満、0.05%未満、0.04%未満、0.03%未満、0.02%未満、または0.01%未満のインデル形成をもたらす。
いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのいずれも、標的ポリヌクレオチド配列において、50%未満、40%未満、30%未満、20%未満、19%未満、18%未満、17%未満、16%未満、15%未満、14%未満、13%未満、12%未満、11%未満、10%未満、9%未満、8%未満、7%未満、6%未満、5%未満、4%未満、3%未満、2%未満、1%未満、0.9%未満、0.8%未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.09%未満、0.08%未満、0.07%未満、0.06%未満、0.05%未満、0.04%未満、0.03%未満、0.02%未満、または0.01%未満のインデル形成をもたらす。いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのいずれも、標的ポリヌクレオチド配列において、0.8%未満のインデル形成をもたらす。いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのいずれも、標的ポリヌクレオチド配列において、多くとも0.8%のインデル形成をもたらす。いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのいずれも、標的ポリヌクレオチド配列において、0.3%未満のインデル形成をもたらす。いくつかの実施形態において、記載されるABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのいずれも、標的ポリヌクレオチド配列において、ABE7塩基エディターのうちの1つを含む塩基エディターシステムと比較して低いインデル形成をもたらす。いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのいずれも、標的ポリヌクレオチド配列において、ABE7.10を含む塩基エディターシステムと比較して低いインデル形成をもたらす。
いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのいずれも、ABE7塩基エディターのうちの1つを含む塩基エディターシステムと比較して、インデル頻度が低下している。いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのいずれも、ABE7塩基エディターのうちの1つを含む塩基エディターシステムと比較して、インデル頻度が少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、または少なくとも95%低下している。いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムは、ABE7.10を含む塩基エディターシステムと比較して、インデル頻度が少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、または少なくとも95%低下している。
本発明は、上昇した効率および特異性を有するアデノシンデアミナーゼバリアント(例えば、ABE8バリアント)を提供する。特に、本明細書に記載されるアデノシンデアミナーゼバリアントは、ポリヌクレオチド内の所望の塩基を編集する可能性がより高く、変化させることが意図されない塩基(例えば「バイスタンダー」)を編集する可能性がより低い。
いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのうちの1つを含む塩基編集システムのいずれも、バイスタンダー編集または突然変異が低下している。いくつかの実施形態において、非意図的な編集または突然変異は、バイスタンダー突然変異またはバイスタンダー編集、例えば、標的ヌクレオチド配列の標的ウィンドウ内にある非意図的なまたは非標的の位置の標的塩基(例えば、AまたはC)の塩基編集である。いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのうちの1つを含む塩基編集システムのいずれも、ABE7塩基エディター、例えば、ABE7.10を含む塩基エディターシステムと比較して、バイスタンダー編集または突然変異が低下している。いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのうちの1つを含む塩基編集システムのいずれも、ABE7塩基エディター、例えば、ABE7.10を含む塩基エディターシステムと比較して、バイスタンダー編集または突然変異が少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%低下している。いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのうちの1つを含む塩基編集システムのいずれも、ABE7塩基エディター、例えば、ABE7.10を含む塩基エディターシステムと比較して、バイスタンダー編集または突然変異が少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、または少なくとも3.0倍低下している。
いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのうちの1つを含む塩基編集システムのいずれも、偽性編集が低下している。いくつかの実施形態において、非意図的な編集または突然変異は、偽性突然変異または偽性編集、例えば、ゲノムの非意図的なまたは非標的の領域における標的塩基(例えば、AまたはC)の非特異的編集またはガイド非依存性編集である。いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのうちの1つを含む塩基編集システムのいずれも、ABE7塩基エディター、例えば、ABE7.10を含む塩基エディターシステムと比較して、偽性編集が低下している。いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのうちの1つを含む塩基編集システムのいずれも、ABE7塩基エディター、例えば、ABE7.10を含む塩基エディターシステムと比較して、偽性編集が少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%低下している。いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのうちの1つを含む塩基編集システムのいずれも、ABE7塩基エディター、例えば、ABE7.10を含む塩基エディターシステムと比較して、偽性編集が少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、または少なくとも3.0倍低下している。
本開示のいくつかの態様は、本明細書において提供されるいずれかの塩基エディターが、有意な数の非意図的な突然変異(例えば非意図的な点突然変異など)(すなわち、バイスタンダーの突然変異)を生成することなく、核酸(例えば対象のゲノム内の核酸)において、意図される突然変異(例えば点突然変異など)を効率的に生成することができるという認識に基づく。いくつかの実施形態において、本明細書において提供される塩基エディターのいずれも、少なくとも0.01%の意図される突然変異(すなわち、少なくとも0.01%の塩基編集効率)を生成することができる。いくつかの実施形態において、本明細書において提供される塩基エディターのいずれも、少なくとも0.01%、1%、2%、3%、4%、5%、10%、15%、20%、25%、30%、40%、45%、50%、60%、70%、80%、90%、95%、または99%の意図される突然変異を生成することができる。
いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのいずれも、少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%の塩基編集効率を有する。いくつかの実施形態において、塩基編集効率は、細胞集団における編集された核酸塩基のパーセンテージを計算することによって測定され得る。いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのいずれも、細胞集団における編集された核酸塩基によって測定した場合に少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%の塩基編集効率を有する。
いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのいずれも、ABE7塩基エディターと比較してより高い塩基編集効率を有する。いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのいずれも、ABE7塩基エディター、例えば、ABE7.10と比較して、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも99%、少なくとも100%、少なくとも105%、少なくとも110%、少なくとも115%、少なくとも120%、少なくとも125%、少なくとも130%、少なくとも135%、少なくとも140%、少なくとも145%、少なくとも150%、少なくとも155%、少なくとも160%、少なくとも165%、少なくとも170%、少なくとも175%、少なくとも180%、少なくとも185%、少なくとも190%、少なくとも195%、少なくとも200%、少なくとも210%、少なくとも220%、少なくとも230%、少なくとも240%、少なくとも250%、少なくとも260%、少なくとも270%、少なくとも280%、少なくとも290%、少なくとも300%、少なくとも310%、少なくとも320%、少なくとも330%、少なくとも340%、少なくとも350%、少なくとも360%、少なくとも370%、少なくとも380%、少なくとも390%、少なくとも400%、少なくとも450%、または少なくとも500%より高い塩基編集効率を有する。
いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのいずれも、ABE7塩基エディター、例えば、ABE7.10と比較して、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、少なくとも3.0倍、少なくとも3.1倍、少なくとも3.2倍、少なくとも3.3倍、少なくとも3.4倍、少なくとも3.5倍、少なくとも3.6倍、少なくとも3.7倍、少なくとも3.8倍、少なくとも3.9倍、少なくとも4.0倍、少なくとも4.1倍、少なくとも4.2倍、少なくとも4.3倍、少なくとも4.4倍、少なくとも4.5倍、少なくとも4.6倍、少なくとも4.7倍、少なくとも4.8倍、少なくとも4.9倍、または少なくとも5.0倍より高い塩基編集効率を有する。
いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのいずれも、少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%のオンターゲット塩基編集効率を有する。いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのいずれも、細胞集団における編集された標的核酸塩基によって測定した場合に少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%のオンターゲット塩基編集効率を有する。
いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのいずれも、ABE7塩基エディターと比較してより高いオンターゲット塩基編集効率を有する。いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのいずれも、ABE7塩基エディター、例えば、ABE7.10と比較して、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも99%、少なくとも100%、少なくとも105%、少なくとも110%、少なくとも115%、少なくとも120%、少なくとも125%、少なくとも130%、少なくとも135%、少なくとも140%、少なくとも145%、少なくとも150%、少なくとも155%、少なくとも160%、少なくとも165%、少なくとも170%、少なくとも175%、少なくとも180%、少なくとも185%、少なくとも190%、少なくとも195%、少なくとも200%、少なくとも210%、少なくとも220%、少なくとも230%、少なくとも240%、少なくとも250%、少なくとも260%、少なくとも270%、少なくとも280%、少なくとも290%、少なくとも300%、少なくとも310%、少なくとも320%、少なくとも330%、少なくとも340%、少なくとも350%、少なくとも360%、少なくとも370%、少なくとも380%、少なくとも390%、少なくとも400%、少なくとも450%、または少なくとも500%より高いオンターゲット塩基編集効率を有する。
いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのいずれも、ABE7塩基エディター、例えば、ABE7.10と比較して、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、少なくとも3.0倍、少なくとも3.1倍、少なくとも3.2倍、少なくとも3.3倍、少なくとも3.4倍、少なくとも3.5倍、少なくとも3.6倍、少なくとも3.7倍、少なくとも3.8倍、少なくとも3.9倍、少なくとも4.0倍、少なくとも4.1倍、少なくとも4.2倍、少なくとも4.3倍、少なくとも4.4倍、少なくとも4.5倍、少なくとも4.6倍、少なくとも4.7倍、少なくとも4.8倍、少なくとも4.9倍、または少なくとも5.0倍より高いオンターゲット塩基編集効率を有する。
本明細書に記載されるABE8塩基エディターバリアントは、プラスミド、ベクター、LNP複合体、またはmRNAを介して宿主細胞に送達され得る。いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのいずれも、mRNAとして宿主細胞に送達される。いくつかの実施形態において、核酸に基づく送達システム、例えば、mRNAを介して送達されるABE8塩基エディターは、編集された核酸塩基によって測定した場合に少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%のオンターゲット編集効率を有する。いくつかの実施形態において、mRNAシステムによって送達されるABE8塩基エディターは、プラスミドまたはベクターシステムによって送達されるABE8塩基エディターと比較してより高い塩基編集効率を有する。いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのいずれも、mRNAシステムによって送達されるとき、プラスミドまたはベクターシステムによって送達されるときと比較して、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも99%、少なくとも100%、少なくとも105%、少なくとも110%、少なくとも115%、少なくとも120%、少なくとも125%、少なくとも130%、少なくとも135%、少なくとも140%、少なくとも145%、少なくとも150%、少なくとも155%、少なくとも160%、少なくとも165%、少なくとも170%、少なくとも175%、少なくとも180%、少なくとも185%、少なくとも190%、少なくとも195%、少なくとも200%、少なくとも210%、少なくとも220%、少なくとも230%、少なくとも240%、少なくとも250%、少なくとも260%、少なくとも270%、少なくとも280%、少なくとも290%、少なくとも300%より高い、少なくとも310%、少なくとも320%、少なくとも330%、少なくとも340%、少なくとも350%、少なくとも360%、少なくとも370%、少なくとも380%、少なくとも390%、少なくとも400%、少なくとも450%、または少なくとも500%のオンターゲット編集効率を有する。いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのいずれも、mRNAシステムによって送達されるとき、プラスミドまたはベクターシステムによって送達されるときと比較して、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、少なくとも3.0倍、少なくとも3.1倍、少なくとも3.2倍、少なくとも3.3倍、少なくとも3.4倍、少なくとも3.5倍、少なくとも3.6倍、少なくとも3.7倍、少なくとも3.8倍、少なくとも3.9倍、少なくとも4.0倍、少なくとも4.1倍、少なくとも4.2倍、少なくとも4.3倍、少なくとも4.4倍、少なくとも4.5倍、少なくとも4.6倍、少なくとも4.7倍、少なくとも4.8倍、少なくとも4.9倍、または少なくとも5.0倍より高いオンターゲット編集効率を有する。
いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのいずれも、標的ポリヌクレオチド配列において、50%未満、40%未満、30%未満、20%未満、19%未満、18%未満、17%未満、16%未満、15%未満、14%未満、13%未満、12%未満、11%未満、10%未満、9%未満、8%未満、7%未満、6%未満、5%未満、4%未満、3%未満、2%未満、1%未満、0.9%未満、0.8%未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.09%未満、0.08%未満、0.07%未満、0.06%未満、0.05%未満、0.04%未満、0.03%未満、0.02%未満、または0.01%未満のオフターゲット編集をもたらす。
いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのいずれも、mRNAシステムによって送達されるとき、プラスミドまたはベクターシステムによって送達されるときと比較してより低いガイド付きオフターゲット編集効率を有する。いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのいずれも、mRNAシステムによって送達されるとき、プラスミドまたはベクターシステムによって送達されるときと比較して、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%より低いガイド付きオフターゲット編集効率を有する。いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのいずれも、mRNAシステムによって送達されるとき、プラスミドまたはベクターシステムによって送達されるときと比較して、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、または少なくとも3.0倍より低いガイド付きオフターゲット編集効率を有する。いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのいずれも、mRNAシステムによって送達されるとき、プラスミドまたはベクターシステムによって送達されるときと比較して、ガイド付きオフターゲット編集効率が少なくとも約2.2倍減少している。
いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのいずれも、mRNAシステムによって送達されるとき、プラスミドまたはベクターシステムによって送達されるときと比較してより低いガイド非依存性オフターゲット編集効率を有する。いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのいずれも、mRNAシステムによって送達されるとき、プラスミドまたはベクターシステムによって送達されるときと比較して、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%より低いガイド非依存性オフターゲット編集効率を有する。いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのいずれも、mRNAシステムによって送達されるとき、プラスミドまたはベクターシステムによって送達されるときと比較して、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、少なくとも3.0倍、少なくとも5.0倍、少なくとも10.0倍、少なくとも20.0倍、少なくとも50.0倍、少なくとも70.0倍、少なくとも100.0倍、少なくとも120.0倍、少なくとも130.0倍、または少なくとも150.0倍より低いガイド非依存性オフターゲット編集効率を有する。いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントは、mRNAシステムによって送達されるとき、プラスミドまたはベクターシステムによって送達されるときと比較して、ガイド非依存性オフターゲット編集効率(例えば、偽性RNA脱アミノ化)が134.0倍減少している。いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントは、ゲノム全体のガイド非依存性突然変異率を上昇させない。
本開示のいくつかの態様は、本明細書において提供されるいずれかの塩基エディターが、有意な数の非意図的な突然変異(例えば、偽性オフターゲット編集またはバイスタンダー編集)を生成することなく、核酸(例えば対象のゲノム内の核酸)において、意図される突然変異(例えば点突然変異など)を効率的に生成することができるという認識に基づく。いくつかの実施形態において、意図される突然変異は、標的遺伝子における突然変異を変化させるまたは補正するように特に設計されたgRNAに結合した特異的塩基エディターによって生成される突然変異である。本開示のいくつかの態様は、本明細書において提供されるいずれかの塩基エディターが、有意な数の非意図的な突然変異を生成することなく、核酸(例えば対象のゲノム内の核酸)において、意図される突然変異を効率的に生成することができるという認識に基づく。いくつかの実施形態において、意図される突然変異は、意図される突然変異を変化させるまたは補正するように特に設計されたgRNAに結合した特異的塩基エディターによって生成される突然変異である。いくつかの実施形態において、意図される突然変異は、終止コドン、例えば、遺伝子のコード領域内の未熟な終止コドンを生成する突然変異である。いくつかの実施形態において、意図される突然変異は、終止コドンを除去する突然変異である。いくつかの実施形態において、意図される突然変異は、遺伝子のスプライシングを変化させる突然変異である。いくつかの実施形態において、意図される突然変異は、遺伝子の調節配列(例えば遺伝子プロモーターまたは遺伝子リプレッサー)を変化させる突然変異である。
いくつかの実施形態において、本明細書において提供される塩基エディターは、1:1より大きい、意図される突然変異のインデル(すなわち、非意図的な突然変異)に対する比を生成することができる。いくつかの実施形態において、本明細書に提供される塩基エディターは、少なくとも1.5:1、少なくとも2:1、少なくとも2.5:1、少なくとも3:1、少なくとも3.5:1、少なくとも4:1、少なくとも4.5:1、少なくとも5:1、少なくとも5.5:1、少なくとも6:1、少なくとも6.5:1、少なくとも7:1、少なくとも7.5:1、少なくとも8:1、少なくとも10:1、少なくとも15:1、少なくとも20:1、少なくとも25:1、少なくとも30:1、少なくとも40:1、少なくとも50:1、少なくとも100:1、少なくとも200:1、少なくとも300:1、少なくとも400:1、少なくとも500:1、少なくとも600:1、少なくとも700:1、少なくとも800:1、少なくとも900:1、もしくは少なくとも1000:1、またはそれ以上の、意図される突然変異対インデルの比を生じることができる。本明細書に記載される塩基エディターの特徴は、本明細書において提供される融合タンパク質、または融合タンパク質を使用する方法のいずれにも適用され得ることが理解されるべきである。
意図された突然変異およびインデルの数は、例えば、国際PCT出願番号PCT/2017/045381 (WO2030/027078) およびPCT/US2016/058344 (WO2017/070632);Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017); および Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity,”Science Advances 3:eaao4774 (2017)(その全内容は参照によりここに組み込まれる)に記載されているもののような、任意の適切な方法を用いて決定することができる。
いくつかの実施形態において、インデル頻度を計算するために、インデルが生じ得るウィンドウの両側に隣接する二つの10 bp配列に対する正確なマッチについて配列決定リードがスキャンされる。完全マッチが見つからない場合、そのリードは解析から除外される。このインデルウィンドウの長さが参照配列と完全にマッチする場合、リードはインデルを含まないものとして分類される。インデルウィンドウが参照配列よりも2塩基以上長いかまたは短い場合、配列決定リードは、それぞれ挿入または欠失として分類される。いくつかの態様において、本明細書において提供される塩基エディターは、核酸の領域におけるインデルの形成を制限することができる。ある態様において、その領域は、塩基エディターによって標的化されるヌクレオチドのところにあるか、または塩基エディターによって標的化されるヌクレオチドの2、3、4、5、6、7、8、9または10ヌクレオチド以内の領域である。
標的ヌクレオチド領域で形成されるインデルの数は、核酸(例えば細胞のゲノム内の核酸)が塩基エディターに曝される時間の量に依存し得る。いくつかの実施形態において、インデルの数または割合は、標的ヌクレオチド配列(例えば細胞のゲノム内の核酸)を塩基エディターに曝してから少なくとも1時間、少なくとも2時間、少なくとも6時間、少なくとも12時間、少なくとも24時間、少なくとも36時間、少なくとも48時間、少なくとも3日、少なくとも4日、少なくとも5日、少なくとも7日、少なくとも10日、または少なくとも14日後に決定される。本明細書に記載される塩基エディターの特徴は、本明細書に提供される融合タンパク質、または融合タンパク質を使用する方法のいずれにも適用され得ることが理解されるべきである。
いくつかの実施形態において、本明細書において提供される塩基エディターは、核酸の領域におけるインデルの形成を制限することができる。いくつかの実施形態において、その領域は、塩基エディターによって標的化されるヌクレオチドのところにあるか、または塩基エディターによって標的化されるヌクレオチドの2、3、4、5、6、7、8、9もしくは10ヌクレオチド以内の領域である。いくつかの実施形態において、本明細書において提供される塩基エディターのいずれも、核酸の領域においてインデルの形成を1%未満、1.5%未満、2%未満、2.5%未満、3%未満、3.5%未満、4%未満、4.5%未満、5%未満、6%未満、7%未満、8%未満、9%未満、10%未満、12%未満、15%未満、または20%未満に制限することができる。核酸領域で形成されるインデルの数は、核酸(例えば細胞のゲノム内の核酸)が塩基エディターに曝される時間の量に依存し得る。いくつかの実施形態において、インデルの任意の数または割合は、核酸(例えば細胞のゲノム内の核酸)を塩基エディターに曝してから少なくとも1時間、少なくとも2時間、少なくとも6時間、少なくとも12時間、少なくとも24時間、少なくとも36時間、少なくとも48時間、少なくとも3日、少なくとも4日、少なくとも5日、少なくとも7日、少なくとも10日、または少なくとも14日後に決定される。
[多重編集]
いくつかの実施形態において、本明細書に提供される塩基エディターシステムは、1以上の遺伝子における複数の核酸塩基対の多重編集を可能にする。ある態様において、複数の核酸塩基対は、同一遺伝子内に位置する。いくつかの実施形態において、複数の核酸塩基対は、1つまたはそれより多い遺伝子に位置し、ここで、少なくとも1つの遺伝子は、異なる遺伝子座に位置する。ある態様において、多重編集は、1以上のガイドポリヌクレオチドを含むことができる。いくつかの実施形態では、多重編集は、1つ以上の塩基エディターシステムを含むことができる。いくつかの実施形態において、多重編集は、単一のガイドポリヌクレオチドを有する1つ以上の塩基エディターシステムを含むことができる。いくつかの実施形態において、多重編集は、複数のガイドポリヌクレオチドを有する1つ以上の塩基エディターシステムを含むことができる。いくつかの実施形態において、多重編集は、単一の塩基エディター系を有する1以上のガイドポリヌクレオチドを含むことができる。いくつかの実施形態において、多重編集は、標的ポリヌクレオチド配列への結合を標的化するためにPAM配列を必要としない少なくとも1つのガイドポリヌクレオチドを含むことができる。いくつかの実施形態において、多重編集は、標的ポリヌクレオチド配列への結合を標的化するためにPAM配列を必要とする少なくとも1つのガイドポリヌクレオチドを含むことができる。いくつかの実施形態において、多重編集は、標的ポリヌクレオチド配列への結合を標的化するためにPAM配列を必要としない少なくとも1つのガイドポリヌクレオチドと、標的ポリヌクレオチド配列への結合を標的化するためにPAM配列を必要とする少なくとも1つのガイドポリヌクレオチドとの混合物を含むことができる。本明細書に記載される塩基エディターのいずれかを使用する多重編集の特徴は、本明細書に提供される塩基エディターのいずれかを使用する方法の任意の組合せに適用され得ることを理解されたい。また、本明細書に記載される塩基エディターのいずれかを使用する多重編集は、複数の核酸塩基対の順次的編集を含むことができることを理解されたい。
いくつかの実施形態において、複数の核酸塩基対は、1つ以上の遺伝子内にある。ある実施形態において、複数の核酸塩基対は、同じ遺伝子内にある。いくつかの実施形態において、1つ以上の遺伝子における少なくとも1つの遺伝子は、異なる遺伝子座に位置する。
いくつかの実施形態において、編集は、少なくとも1つのタンパク質コード領域における複数の核酸塩基対の編集である。いくつかの実施形態において、編集は、少なくとも1つのタンパク質非コード領域における複数の核酸塩基対の編集である。いくつかの実施形態において、編集は、少なくとも1つのタンパク質コード領域および少なくとも1つのタンパク質非コード領域における複数の核酸塩基対の編集である。
いくつかの態様において、編集は、1以上のガイドポリヌクレオチドを伴う。いくつかの実施形態では、塩基エディターシステムは、1つ以上の塩基エディターシステムを含むことができる。いくつかの実施形態では、塩基エディターシステムは、単一のガイドポリヌクレオチドとともに1つ以上の塩基エディターシステムを含むことができる。いくつかの実施形態において、塩基エディターシステムは、複数のガイドポリヌクレオチドとともに1つ以上の塩基エディターシステムを含むことができる。いくつかの実施形態において、編集は、単一の塩基エディター系を有する1以上のガイドポリヌクレオチドを伴う。いくつかの実施形態において、編集は、標的ポリヌクレオチド配列への結合を標的化するためにPAM配列を必要としない少なくとも1つのガイドポリヌクレオチドを伴う。いくつかの実施形態において、編集は、標的ポリヌクレオチド配列への結合を標的化するためにPAM配列を必要とする少なくとも1つのガイドポリヌクレオチドを伴う。いくつかの実施形態において、編集は、標的ポリヌクレオチド配列への結合を標的化するためにPAM配列を必要としない少なくとも1つのガイドポリヌクレオチドと、標的ポリヌクレオチド配列への結合を標的化するためにPAM配列を必要とする少なくとも1つのガイドポリヌクレオチドとの混合物を伴う。本明細書に記載される塩基エディターのいずれかを使用する多重編集の特徴は、本明細書に提供される塩基エディターのいずれかを使用する方法の任意の組合せに適用され得ることを理解されたい。また、編集は、複数の核酸塩基対の順次的編集を含むことができることを理解されたい。
いくつかの実施形態において、1つまたは複数の遺伝子における複数の核酸塩基対の多重編集が可能な塩基エディターシステムは、本明細書に記載されるABE8塩基エディターバリアントのうちの1つを含む。いくつかの実施形態において、1つまたは複数の遺伝子における複数の核酸塩基対の多重編集が可能な塩基エディターシステムは、ABE7塩基エディターのうちの1つを含む。いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのうちの1つを含む多重編集が可能な塩基エディターシステムは、ABE7塩基エディターのうちの1つを含む多重編集が可能な塩基エディターシステムと比較してより高い多重編集効率を有する。いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのうちの1つを含む多重編集が可能な塩基エディターシステムは、ABE7塩基エディターのうちの1つを含む多重編集が可能な塩基エディターシステムと比較して、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも99%、少なくとも100%、少なくとも105%、少なくとも110%、少なくとも115%、少なくとも120%、少なくとも125%、少なくとも130%、少なくとも135%、少なくとも140%、少なくとも145%、少なくとも150%、少なくとも155%、少なくとも160%、少なくとも165%、少なくとも170%、少なくとも175%、少なくとも180%、少なくとも185%、少なくとも190%、少なくとも195%、少なくとも200%、少なくとも210%、少なくとも220%、少なくとも230%、少なくとも240%、少なくとも250%、少なくとも260%、少なくとも270%、少なくとも280%、少なくとも290%、少なくとも300%より高い、少なくとも310%、少なくとも320%、少なくとも330%、少なくとも340%、少なくとも350%、少なくとも360%、少なくとも370%、少なくとも380%、少なくとも390%、少なくとも400%、少なくとも450%、または少なくとも500%より高い多重編集効率を有する。いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのうちの1つを含む多重編集が可能な塩基エディターシステムは、ABE7塩基エディターのうちの1つを含む多重編集が可能な塩基エディターシステムと比較して、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、少なくとも3.0倍、少なくとも3.1倍、少なくとも3.2倍、少なくとも3.3倍、少なくとも3.4倍、少なくとも3.5倍、少なくとも4.0倍、少なくとも4.5倍、少なくとも5.0倍、少なくとも5.5倍、または少なくとも6.0倍より高い多重編集効率を有する。
[内部挿入を有する融合タンパク質]
本明細書では、核酸プログラミング可能核酸結合タンパク質、例えば、napDNAbpに融合した異種ポリペプチドを含む融合タンパク質を提供する。異種ポリペプチドは、天然または野生型のnapDNAbpポリペプチド配列には見出されないポリペプチドであり得る。異種ポリペプチドは、napDNAbpのC末端、napDNAbpのN末端でnapDNAbpに融合してもよく、またはnapDNAbpの内部位置で挿入されてもよい。いくつかの実施形態において、異種ポリペプチドは、napDNAbpの内部位置で挿入される。
いくつかの実施形態において、異種ポリペプチドは、デアミナーゼまたはその機能的断片である。例えば、融合タンパク質は、Cas9またはCas12(例えば、Cas12b/C2c1)ポリペプチドのN末端断片およびC末端断片によって隣接されるデアミナーゼ(例えば、アデノシンデアミナーゼ)を含み得る。融合タンパク質におけるデアミナーゼは、アデノシンデアミナーゼであり得る。いくつかの実施形態において、アデノシンデアミナーゼは、TadA(例えば、TadA7.10またはTadA*8)である。いくつかの実施形態において、TadAはTadA*8である。本明細書に記載されるTadA配列(例えば、TadA7.10またはTadA*8)は、上述の融合タンパク質に適切なデアミナーゼである。
デアミナーゼは、循環置換体デアミナーゼであり得る。例えば、デアミナーゼは、循環置換体アデノシンデアミナーゼであり得る。いくつかの実施形態において、デアミナーゼは、TadA参照配列における番号付けでアミノ酸残基116において循環置換された循環置換体TadAである。いくつかの実施形態において、デアミナーゼは、TadA参照配列における番号付けでアミノ酸残基136において循環置換された循環置換体TadAである。いくつかの実施形態において、デアミナーゼは、TadA参照配列における番号付けでアミノ酸残基65において循環置換された循環置換体TadAである。
融合タンパク質は、2つ以上のデアミナーゼを含み得る。融合タンパク質は、例えば、1、2、3、4、5、またはそれ以上のデアミナーゼを含み得る。いくつかの実施形態において、融合タンパク質は、1つのデアミナーゼを含む。いくつかの実施形態において、融合タンパク質は、2つのデアミナーゼを含む。融合タンパク質における2つ以上のデアミナーゼは、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはそれらの組合せであり得る。2つ以上のデアミナーゼは、ホモ二量体であり得る。2つ以上のデアミナーゼは、ヘテロ二量体であり得る。2つ以上のデアミナーゼは、タンデムでnapDNAbpに挿入され得る。いくつかの実施形態において、2つ以上のデアミナーゼは、napDNAbp内でタンデムでないこともあり得る。
いくつかの実施形態において、融合タンパク質中のnapDNAbpは、Cas9ポリペプチドまたはその断片である。Cas9ポリペプチドは、バリアントCas9ポリペプチドであり得る。いくつかの実施形態において、Cas9ポリペプチドは、Cas9ニッカーゼ(nCas9)ポリペプチドまたはその断片である。いくつかの実施形態において、Cas9ポリペプチドは、ヌクレアーゼ不活Cas9(dCas9)ポリペプチドまたはその断片である。融合タンパク質中のCas9ポリペプチドは、完全長Cas9ポリペプチドであり得る。場合によっては、融合タンパク質中のCas9ポリペプチドは、完全長Cas9ポリペプチドでないこともあり得る。Cas9ポリペプチドは、例えば、天然に存在するCas9タンパク質に対してN末端またはC末端において、切詰め型であり得る。Cas9ポリペプチドは、循環置換されたCas9タンパク質であり得る。Cas9ポリペプチドは、依然として標的ポリヌクレオチドおよびガイド核酸配列に結合することのできる、Cas9ポリペプチドの断片、一部分、またはドメインであり得る。
いくつかの実施形態において、Cas9ポリペプチドは、Streptococcus pyogenes Cas9 (SpCas9)、Staphylococcus aureus Cas9 (SaCas9)、Streptococcus thermophilus 1 Cas9 (St1Cas9)、またはその断片もしくはバリアントである。
融合タンパク質のCas9ポリペプチドは、天然に存在するCas9ポリペプチドに対して少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性を有するアミノ酸配列を含み得る。
融合タンパク質のCas9ポリペプチドは、以下に記載される(以下で「Cas9参照配列」と呼ばれる)Cas9アミノ酸配列に対して少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性を有するアミノ酸配列を含み得る:
Figure 2022519882000052
(一重下線: HNHドメイン; 二重下線: RuvCドメイン)
いくつかの実施形態において、融合タンパク質中のnapDNAbpは、Cas12ポリペプチド、例えばCas12b/C2c1、またはその断片である。Cas12ポリペプチドは、バリアントCas12ポリペプチドであり得る。
異種ポリペプチド(例えば、デアミナーゼ)は、例えば、napDNAbpが標的ポリヌクレオチドおよびガイド核酸に結合するその能力を保持するように、適切な位置でnapDNAbp(例えば、Cas9またはCas12(例えば、Cas12b/C2c1))に挿入され得る。デアミナーゼ(例えば、アデノシンデアミナーゼ)は、デアミナーゼの機能(例えば、塩基編集活性)またはnapDNAbpの機能(例えば、標的核酸およびガイド核酸に結合する能力)を損なうことなくnapDNAbpに挿入され得る。デアミナーゼ(例えば、アデノシンデアミナーゼ)は、例えば、結晶学的試験によって示されるような非秩序的な領域または高い温度因子もしくはB因子を含む領域において、napDNAbpに挿入され得る。タンパク質の領域のうち、秩序性の低い、非秩序的な、または構造化されていない領域、例えば溶媒に曝される領域およびループは、構造または機能を損なうことなく挿入に使用され得る。デアミナーゼ(例えば、アデノシンデアミナーゼ)は、柔軟なループ領域または溶媒に曝される領域においてnapDNAbpに挿入され得る。いくつかの実施形態において、デアミナーゼ(例えば、アデノシンデアミナーゼ)は、Cas9またはCas12b/C2c1ポリペプチドの柔軟なループに挿入される。
いくつかの実施形態において、デアミナーゼ(例えば、アデノシンデアミナーゼ)の挿入位置は、Cas9ポリペプチドの結晶構造のB因子分析によって決定される。いくつかの実施形態において、デアミナーゼ(例えば、アデノシンデアミナーゼ)は、平均よりも高いB因子(例えば、非秩序的な領域を含む総タンパク質またはタンパク質ドメインと比較してより高いB因子)を含むCas9ポリペプチドの領域に挿入される。B因子または温度因子は、原子の平均的位置からの(例えば、結晶格子内の温度依存性原子振動または静的無秩序の結果としての)ゆらぎを示し得る。骨格原子のB因子が高い(例えば、B因子が平均よりも高い)ことは、比較的高い局所運動性を有する領域を示し得る。そのような領域は、構造または機能を損なうことなくデアミナーゼを挿入するのに使用され得る。デアミナーゼ(例えば、アデノシンデアミナーゼ)は、総タンパク質の平均B因子よりも50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、または200%より大きなB因子をもつCα原子を有する残基の位置で挿入され得る。デアミナーゼ(例えば、アデノシンデアミナーゼ)は、ある残基を含むCas9タンパク質ドメインの平均B因子よりも50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、または200%より大きなB因子をもつCα原子を有する残基の位置で挿入され得る。平均よりも高いB因子を含むCas9ポリペプチド位置は、例えば、上記Cas9参照配列における番号付けで残基768、792、1052、1015、1022、1026、1029、1067、1040、1054、1068、1246、1247、および1248を含み得る。平均よりも高いB因子を含むCas9ポリペプチド領域は、例えば、上記Cas9参照配列における番号付けで残基792~872、792~906、および2~791を含み得る。
異種ポリペプチド(例えば、デアミナーゼ)は、上記Cas9参照配列における番号付けで768、791、792、1015、1016、1022、1023、1026、1029、1040、1052、1054、1067、1068、1069、1246、1247、および1248からなる群から選択されるアミノ酸残基、または別のCas9ポリペプチドにおける対応するアミノ酸残基で、napDNAbpに挿入され得る。いくつかの実施形態において、異種ポリペプチドは、上記Cas9参照配列における番号付けでアミノ酸位置768~769、791~792、792~793、1015~1016、1022~1023、1026~1027、1029~1030、1040~1041、1052~1053、1054~1055、1067~1068、1068~1069、1247~1248、もしくは1248~1249、またはそれらの対応するアミノ酸位置の間に挿入される。いくつかの実施形態において、異種ポリペプチドは、上記Cas9参照配列における番号付けでアミノ酸位置769~770、792~793、793~794、1016~1017、1023~1024、1027~1028、1030~1031、1041~1042、1053~1054、1055~1056、1068~1069、1069~1070、1248~1249、もしくは1249~1250、またはそれらの対応するアミノ酸位置の間に挿入される。いくつかの実施形態において、異種ポリペプチドは、上記Cas9参照配列における番号付けで768、791、792、1015、1016、1022、1023、1026、1029、1040、1052、1054、1067、1068、1069、1246、1247、および1248からなる群から選択されるアミノ酸残基、または別のCas9ポリペプチドにおける対応するアミノ酸残基を置き換える。挿入位置に関する上記Cas9参照配列への言及は、例示を目的とするものであることが理解されるべきである。本明細書に記載される挿入は、上記Cas9参照配列のCas9ポリペプチド配列に限定されず、バリアントCas9ポリペプチド、例えばCas9ニッカーゼ(nCas9)、ヌクレアーゼ不活Cas9(dCas9)、ヌクレアーゼドメインを欠くCas9バリアント、切詰め型Cas9、または部分的もしくは完全なHNHドメインを欠くCas9ドメインにおける対応する位置での挿入を含む。
異種ポリペプチド(例えば、デアミナーゼ)は、上記Cas9参照配列における番号付けで768、792、1022、1026、1040、1068、および1247からなる群から選択されるアミノ酸残基、または別のCas9ポリペプチドにおける対応するアミノ酸残基で、napDNAbpに挿入され得る。いくつかの実施形態において、異種ポリペプチドは、上記Cas9参照配列における番号付けでアミノ酸位置768~769、792~793、1022~1023、1026~1027、1029~1030、1040~1041、1068~1069、もしくは1247~1248、またはそれらの対応するアミノ酸位置の間に挿入される。いくつかの実施形態において、異種ポリペプチドは、上記Cas9参照配列における番号付けでアミノ酸位置769~770、793~794、1023~1024、1027~1028、1030~1031、1041~1042、1069~1070、もしくは1248~1249、またはそれらの対応するアミノ酸位置の間に挿入される。いくつかの実施形態において、異種ポリペプチドは、上記Cas9参照配列における番号付けで768、792、1022、1026、1040、1068、および1247からなる群から選択されるアミノ酸残基、または別のCas9ポリペプチドにおける対応するアミノ酸残基を置き換える。
異種ポリペプチド(例えば、デアミナーゼ)は、本明細書に記載されるアミノ酸残基、または別のCas9ポリペプチドにおける対応するアミノ酸残基で、napDNAbpに挿入され得る。一実施形態では、異種ポリペプチド(例えば、デアミナーゼ)は、上記Cas9参照配列における番号付けで1002、1003、1025、1052~1056、1242~1247、1061~1077、943~947、686~691、569~578、530~539、および1060~1077からなる群から選択されるアミノ酸残基、または別のCas9ポリペプチドにおける対応するアミノ酸残基で、napDNAbpに挿入され得る。デアミナーゼ(例えば、アデノシンデアミナーゼ)は、残基のN末端もしくはC末端で挿入されるか、または残基を置き換え得る。いくつかの実施形態において、デアミナーゼ(例えば、アデノシンデアミナーゼ)は、残基のC末端で挿入される。
いくつかの実施形態において、アデノシンデアミナーゼ(例えば、TadA)は、上記Cas9参照配列における番号付けで1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052、および1246からなる群から選択されるアミノ酸残基、または別のCas9ポリペプチドにおける対応するアミノ酸残基で挿入される。いくつかの実施形態において、アデノシンデアミナーゼ(例えば、TadA)は、上記Cas9参照配列における番号付けで残基792~872、792~906、もしくは2~791、または別のCas9ポリペプチドにおける対応するアミノ酸残基の代わりに挿入される。いくつかの実施形態において、アデノシンデアミナーゼは、上記Cas9参照配列における番号付けで1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052、および1246からなる群から選択されるアミノ酸、または別のCas9ポリペプチドにおける対応するアミノ酸残基のN末端で挿入される。いくつかの実施形態において、アデノシンデアミナーゼは、上記Cas9参照配列における番号付けで1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052、および1246からなる群から選択されるアミノ酸、または別のCas9ポリペプチドにおける対応するアミノ酸残基のC末端で挿入される。いくつかの実施形態において、アデノシンデアミナーゼは、上記Cas9参照配列における番号付けで1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052、および1246からなる群から選択されるアミノ酸、または別のCas9ポリペプチドにおける対応するアミノ酸残基を置き換えるように挿入される。
いくつかの実施形態において、デアミナーゼ(例えば、アデノシンデアミナーゼ)は、上記Cas9参照配列における番号付けでアミノ酸残基768、または別のCas9ポリペプチドにおける対応するアミノ酸残基で挿入される。いくつかの実施形態において、デアミナーゼ(例えば、アデノシンデアミナーゼ)は、上記Cas9参照配列における番号付けでアミノ酸残基768、または別のCas9ポリペプチドにおける対応するアミノ酸残基のN末端で挿入される。いくつかの実施形態において、デアミナーゼ(例えば、アデノシンデアミナーゼ)は、上記Cas9参照配列における番号付けでアミノ酸残基768、または別のCas9ポリペプチドにおける対応するアミノ酸残基のC末端で挿入される。いくつかの実施形態において、デアミナーゼ(例えば、アデノシンデアミナーゼ)は、上記Cas9参照配列における番号付けでアミノ酸残基768、または別のCas9ポリペプチドにおける対応するアミノ酸残基を置き換えるように挿入される。
いくつかの実施形態において、デアミナーゼ(例えば、アデノシンデアミナーゼ)は、上記Cas9参照配列における番号付けで、アミノ酸残基791で挿入されるか、またはアミノ酸残基792で挿入されるか、または別のCas9ポリペプチドにおける対応するアミノ酸残基で挿入される。いくつかの実施形態において、デアミナーゼ(例えば、アデノシンデアミナーゼ)は、上記Cas9参照配列における番号付けで、アミノ酸残基791のN末端で挿入されるか、またはアミノ酸792のN末端で挿入されるか、または別のCas9ポリペプチドにおける対応するアミノ酸残基で挿入される。いくつかの実施形態において、デアミナーゼ(例えば、アデノシンデアミナーゼ)は、上記Cas9参照配列における番号付けで、アミノ酸791のC末端で挿入されるか、またはアミノ酸792のN末端で挿入されるか、または別のCas9ポリペプチドにおける対応するアミノ酸残基で挿入される。いくつかの実施形態において、デアミナーゼ(例えば、アデノシンデアミナーゼ)は、上記Cas9参照配列における番号付けで、アミノ酸791を置き換えるように挿入されるか、またはアミノ酸792を置き換えるように挿入されるか、または別のCas9ポリペプチドにおける対応するアミノ酸残基を置き換えるように挿入される。
いくつかの実施形態において、デアミナーゼ(例えば、アデノシンデアミナーゼ)は、上記Cas9参照配列における番号付けでアミノ酸残基1016、または別のCas9ポリペプチドにおける対応するアミノ酸残基で挿入される。いくつかの実施形態において、デアミナーゼ(例えば、アデノシンデアミナーゼ)は、上記Cas9参照配列における番号付けでアミノ酸残基1016、または別のCas9ポリペプチドにおける対応するアミノ酸残基のN末端で挿入される。いくつかの実施形態において、デアミナーゼ(例えば、アデノシンデアミナーゼ)は、上記Cas9参照配列における番号付けでアミノ酸残基1016、または別のCas9ポリペプチドにおける対応するアミノ酸残基のC末端で挿入される。いくつかの実施形態において、デアミナーゼ(例えば、アデノシンデアミナーゼ)は、上記Cas9参照配列における番号付けでアミノ酸残基1016、または別のCas9ポリペプチドにおける対応するアミノ酸残基を置き換えるように挿入される。
いくつかの実施形態において、デアミナーゼ(例えば、アデノシンデアミナーゼ)は、上記Cas9参照配列における番号付けで、アミノ酸残基1022で挿入されるか、またはアミノ酸残基1023で挿入されるか、または別のCas9ポリペプチドにおける対応するアミノ酸残基で挿入される。いくつかの実施形態において、デアミナーゼ(例えば、アデノシンデアミナーゼ)は、上記Cas9参照配列における番号付けで、アミノ酸残基1022のN末端で挿入されるか、またはアミノ酸残基1023のN末端で挿入されるか、または別のCas9ポリペプチドにおける対応するアミノ酸残基で挿入される。いくつかの実施形態において、デアミナーゼ(例えば、アデノシンデアミナーゼ)は、上記Cas9参照配列における番号付けで、アミノ酸残基1022のC末端で挿入されるか、またはアミノ酸残基1023のC末端で挿入されるか、または別のCas9ポリペプチドにおける対応するアミノ酸残基で挿入される。いくつかの実施形態において、デアミナーゼ(例えば、アデノシンデアミナーゼ)は、上記Cas9参照配列における番号付けで、アミノ酸残基1022を置き換えるように挿入されるか、またはアミノ酸残基1023を置き換えるように挿入されるか、または別のCas9ポリペプチドにおける対応するアミノ酸残基を置き換えるように挿入される。
いくつかの実施形態において、デアミナーゼ(例えば、アデノシンデアミナーゼ)は、上記Cas9参照配列における番号付けで、アミノ酸残基1026で挿入されるか、またはアミノ酸残基1029で挿入されるか、または別のCas9ポリペプチドにおける対応するアミノ酸残基で挿入される。いくつかの実施形態において、デアミナーゼ(例えば、アデノシンデアミナーゼ)は、上記Cas9参照配列における番号付けで、アミノ酸残基1026のN末端で挿入されるか、またはアミノ酸残基1029のN末端で挿入されるか、または別のCas9ポリペプチドにおける対応するアミノ酸残基で挿入される。いくつかの実施形態において、デアミナーゼ(例えば、アデノシンデアミナーゼ)は、上記Cas9参照配列における番号付けで、アミノ酸残基1026のC末端で挿入されるか、またはアミノ酸残基1029のC末端で挿入されるか、または別のCas9ポリペプチドにおける対応するアミノ酸残基で挿入される。いくつかの実施形態において、デアミナーゼ(例えば、アデノシンデアミナーゼ)は、上記Cas9参照配列における番号付けで、アミノ酸残基1026を置き換えるように挿入されるか、またはアミノ酸残基1029を置き換えるように挿入されるか、または別のCas9ポリペプチドにおける対応するアミノ酸残基を置き換えるように挿入される。
いくつかの実施形態において、デアミナーゼ(例えば、アデノシンデアミナーゼ)は、上記Cas9参照配列における番号付けでアミノ酸残基1040、または別のCas9ポリペプチドにおける対応するアミノ酸残基で挿入される。いくつかの実施形態において、デアミナーゼ(例えば、アデノシンデアミナーゼ)は、上記Cas9参照配列における番号付けでアミノ酸残基1040、または別のCas9ポリペプチドにおける対応するアミノ酸残基のN末端で挿入される。いくつかの実施形態において、デアミナーゼ(例えば、アデノシンデアミナーゼ)は、上記Cas9参照配列における番号付けでアミノ酸残基1040、または別のCas9ポリペプチドにおける対応するアミノ酸残基のC末端で挿入される。いくつかの実施形態において、デアミナーゼ(例えば、アデノシンデアミナーゼ)は、上記Cas9参照配列における番号付けでアミノ酸残基1040、または別のCas9ポリペプチドにおける対応するアミノ酸残基を置き換えるように挿入される。
いくつかの実施形態において、デアミナーゼ(例えば、アデノシンデアミナーゼ)は、上記Cas9参照配列における番号付けで、アミノ酸残基1052で挿入されるか、またはアミノ酸残基1054で挿入されるか、または別のCas9ポリペプチドにおける対応するアミノ酸残基で挿入される。いくつかの実施形態において、デアミナーゼ(例えば、アデノシンデアミナーゼ)は、上記Cas9参照配列における番号付けで、アミノ酸残基1052のN末端で挿入されるか、またはアミノ酸残基1054のN末端で挿入されるか、または別のCas9ポリペプチドにおける対応するアミノ酸残基で挿入される。いくつかの実施形態において、デアミナーゼ(例えば、アデノシンデアミナーゼ)は、上記Cas9参照配列における番号付けで、アミノ酸残基1052のC末端で挿入されるか、またはアミノ酸残基1054のC末端で挿入されるか、または別のCas9ポリペプチドにおける対応するアミノ酸残基で挿入される。いくつかの実施形態において、デアミナーゼ(例えば、アデノシンデアミナーゼ)は、上記Cas9参照配列における番号付けで、アミノ酸残基1052を置き換えるように挿入されるか、またはアミノ酸残基1054を置き換えるように挿入されるか、または別のCas9ポリペプチドにおける対応するアミノ酸残基を置き換えるように挿入される。
いくつかの実施形態において、デアミナーゼ(例えば、アデノシンデアミナーゼ)は、上記Cas9参照配列における番号付けで、アミノ酸残基1067で挿入されるか、またはアミノ酸残基1068で挿入されるか、またはアミノ酸残基1069で挿入されるか、または別のCas9ポリペプチドにおける対応するアミノ酸残基で挿入される。いくつかの実施形態において、デアミナーゼ(例えば、アデノシンデアミナーゼ)は、上記Cas9参照配列における番号付けで、アミノ酸残基1067のN末端で挿入されるか、またはアミノ酸残基1068のN末端で挿入されるか、またはアミノ酸残基1069のN末端で挿入されるか、または別のCas9ポリペプチドにおける対応するアミノ酸残基で挿入される。いくつかの実施形態において、デアミナーゼ(例えば、アデノシンデアミナーゼ)は、上記Cas9参照配列における番号付けで、アミノ酸残基1067のC末端で挿入されるか、またはアミノ酸残基1068のC末端で挿入されるか、またはアミノ酸残基1069のC末端で挿入されるか、または別のCas9ポリペプチドにおける対応するアミノ酸残基で挿入される。いくつかの実施形態において、デアミナーゼ(例えば、アデノシンデアミナーゼ)は、上記Cas9参照配列における番号付けで、アミノ酸残基1067を置き換えるように挿入されるか、またはアミノ酸残基1068を置き換えるように挿入されるか、またはアミノ酸残基1069を置き換えるように挿入されるか、または別のCas9ポリペプチドにおける対応するアミノ酸残基を置き換えるように挿入される。
いくつかの実施形態において、デアミナーゼ(例えば、アデノシンデアミナーゼ)は、上記Cas9参照配列における番号付けで、アミノ酸残基1246で挿入されるか、またはアミノ酸残基1247で挿入されるか、またはアミノ酸残基1248で挿入されるか、または別のCas9ポリペプチドにおける対応するアミノ酸残基で挿入される。いくつかの実施形態において、デアミナーゼ(例えば、アデノシンデアミナーゼ)は、上記Cas9参照配列における番号付けで、アミノ酸残基1246のN末端で挿入されるか、またはアミノ酸残基1247のN末端で挿入されるか、またはアミノ酸残基1248のN末端で挿入されるか、または別のCas9ポリペプチドにおける対応するアミノ酸残基で挿入される。いくつかの実施形態において、デアミナーゼ(例えば、アデノシンデアミナーゼ)は、上記Cas9参照配列における番号付けで、アミノ酸残基1246のC末端で挿入されるか、またはアミノ酸残基1247のC末端で挿入されるか、またはアミノ酸残基1248のC末端で挿入されるか、または別のCas9ポリペプチドにおける対応するアミノ酸残基で挿入される。いくつかの実施形態において、デアミナーゼ(例えば、アデノシンデアミナーゼ)は、上記Cas9参照配列における番号付けで、アミノ酸残基1246を置き換えるように挿入されるか、またはアミノ酸残基1247を置き換えるように挿入されるか、またはアミノ酸残基1248を置き換えるように挿入されるか、または別のCas9ポリペプチドにおける対応するアミノ酸残基を置き換えるように挿入される。
いくつかの実施形態において、異種ポリペプチド(例えば、デアミナーゼ)は、Cas9ポリペプチドの柔軟なループに挿入される。柔軟なループ部分は、上記Cas9参照配列における番号付けで530~537、569~570、686~691、943~947、1002~1025、1052~1077、1232~1247、もしくは1298~1300、または別のCas9ポリペプチドにおける対応するアミノ酸残基からなる群から選択され得る。柔軟なループ部分は、上記Cas9参照配列における番号付けで1~529、538~568、580~685、692~942、948~1001、1026~1051、1078~1231、もしくは1248~1297、または別のCas9ポリペプチドにおける対応するアミノ酸残基からなる群から選択され得る。
異種ポリペプチド(例えば、アデニンデアミナーゼ)は、上記Cas9参照配列における番号付けでアミノ酸残基1017~1069、1242~1247、1052~1056、1060~1077、1002~1003、943~947、530~537、568~579、686~691、1242~1247、1298~1300、1066~1077、1052~1056、もしくは1060~1077、または別のCas9ポリペプチドにおける対応するアミノ酸残基に対応するCas9ポリペプチド領域に挿入され得る。
異種ポリペプチド(例えば、アデニンデアミナーゼ)は、Cas9ポリペプチドの欠失領域の代わりに挿入され得る。欠失領域は、Cas9ポリペプチドのN末端またはC末端部分に対応し得る。いくつかの実施形態において、欠失領域は、上記Cas9参照配列における番号付けで残基792~872、または別のCas9ポリペプチドにおける対応するアミノ酸残基に対応する。いくつかの実施形態において、欠失領域は、上記Cas9参照配列における番号付けで残基792~906、または別のCas9ポリペプチドにおける対応するアミノ酸残基に対応する。いくつかの実施形態において、欠失領域は、上記Cas9参照配列における番号付けで残基2~791、または別のCas9ポリペプチドにおける対応するアミノ酸残基に対応する。いくつかの実施形態において、欠失領域は、上記Cas9参照配列における番号付けで残基1017~1069、またはそれらの対応するアミノ酸残基に対応する。
例示的な内部融合塩基エディターを以下の表10Aに提供する。
表10A:Cas9タンパク質における挿入位置
Figure 2022519882000053
異種ポリペプチド(例えば、デアミナーゼ)は、Cas9ポリペプチドの構造的ドメインまたは機能的ドメイン内に挿入され得る。異種ポリペプチド(例えば、デアミナーゼ)は、Cas9ポリペプチドの2つの構造的ドメインまたは機能的ドメインの間に挿入され得る。異種ポリペプチド(例えば、デアミナーゼ)は、Cas9ポリペプチドの構造的ドメインまたは機能的ドメインの代わりに、例えば、そのドメインをCas9ポリペプチドから欠失させた後に挿入され得る。Cas9ポリペプチドの構造的ドメインまたは機能的ドメインは、例えば、RuvC I、RuvC II、RuvC III、Rec1、Rec2、PI、またはHNHを含み得る。
いくつかの実施形態において、Cas9ポリペプチドは、RuvC I、RuvC II、RuvC III、Rec1、Rec2、PI、またはHNHドメインからなる群から選択される1つまたは複数のドメインを欠く。いくつかの実施形態において、Cas9ポリペプチドは、ヌクレアーゼドメインを欠く。いくつかの実施形態において、Cas9ポリペプチドは、HNHドメインを欠く。いくつかの実施形態において、Cas9ポリペプチドは、Cas9ポリペプチドのHNH活性が低下または消失するように、HNHドメインの一部分を欠く。
いくつかの実施形態において、Cas9ポリペプチドは、ヌクレアーゼドメインの欠失を含み、デアミナーゼが、ヌクレアーゼドメインを置き換えるように挿入されている。いくつかの実施形態において、HNHドメインは欠失しており、デアミナーゼがその場所に挿入されている。いくつかの実施形態において、RuvCドメインのうちの1つまたは複数は欠失しており、デアミナーゼがその場所に挿入されている。
異種ポリペプチドを含む融合タンパク質は、napDNAbpのN末端断片およびC末端断片によって隣接され得る。いくつかの実施形態において、融合タンパク質は、Cas9ポリペプチドのN末端断片およびC末端断片によって隣接されるデアミナーゼを含む。N末端断片またはC末端断片は、標的ポリヌクレオチド配列に結合し得る。N末端断片のC末端またはC末端断片のN末端は、Cas9ポリペプチドの柔軟なループの一部を含み得る。N末端断片のC末端またはC末端断片のN末端は、Cas9ポリペプチドのアルファ-ヘリックス構造の一部を含み得る。N末端断片またはC末端断片は、DNA結合ドメインを含み得る。N末端断片またはC末端断片は、RuvCドメインを含み得る。N末端断片またはC末端断片は、HNHドメインを含み得る。いくつかの実施形態において、N末端断片およびC末端断片のいずれも、HNHドメインを含まない。
いくつかの実施形態において、N末端Cas9断片のC末端は、融合タンパク質が標的核酸塩基を脱アミノ化するときに標的核酸塩基に近接するアミノ酸を含む。いくつかの実施形態において、C末端Cas9断片のN末端は、融合タンパク質が標的核酸塩基を脱アミノ化するときに標的核酸塩基に近接するアミノ酸を含む。異なるデアミナーゼの挿入位置は、標的核酸塩基と、N末端Cas9断片のC末端またはC末端Cas9断片のN末端におけるアミノ酸との間に近接性があるように、異なり得る。例えば、ABEの挿入位置は、上記Cas9参照配列における番号付けで1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052、および1246、または別のCas9ポリペプチドにおける対応するアミノ酸残基からなる群から選択されるアミノ酸残基にあり得る。
融合タンパク質のN末端Cas9断片(すなわち、融合タンパク質中のデアミナーゼに隣接するN末端Cas9断片)は、Cas9ポリペプチドのN末端を含み得る。融合タンパク質のN末端Cas9断片は、少なくとも約100、200、300、400、500、600、700、800、900、1000、1100、1200、または1300アミノ酸長を含み得る。融合タンパク質のN末端Cas9断片は、上記Cas9参照配列における番号付けでアミノ酸残基1~56、1~95、1~200、1~300、1~400、1~500、1~600、1~700、1~718、1~765、1~780、1~906、1~918、もしくは1~1100、または別のCas9ポリペプチドにおける対応するアミノ酸残基に対応する配列を含み得る。N末端Cas9断片は、上記Cas9参照配列における番号付けでアミノ酸残基1~56、1~95、1~200、1~300、1~400、1~500、1~600、1~700、1~718、1~765、1~780、1~906、1~918、もしくは1~1100、または別のCas9ポリペプチドにおける対応するアミノ酸残基に対して、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の配列同一性を含む配列を含み得る。
融合タンパク質のC末端Cas9断片(すなわち、融合タンパク質中のデアミナーゼに隣接するC末端Cas9断片)は、Cas9ポリペプチドのC末端を含み得る。融合タンパク質のC末端Cas9断片は、少なくとも約100、200、300、400、500、600、700、800、900、1000、1100、1200、または1300アミノ酸長を含み得る。融合タンパク質のC末端Cas9断片は、上記Cas9参照配列における番号付けでアミノ酸残基1099~1368、918~1368、906~1368、780~1368、765~1368、718~1368、94~1368、もしくは56~1368、または別のCas9ポリペプチドにおける対応するアミノ酸残基に対応する配列を含み得る。N末端Cas9断片は、上記Cas9参照配列における番号付けでアミノ酸残基1099~1368、918~1368、906~1368、780~1368、765~1368、718~1368、94~1368、もしくは56~1368、または別のCas9ポリペプチドにおける対応するアミノ酸残基に対して、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の配列同一性を含む配列を含み得る。
融合タンパク質のN末端Cas9断片およびC末端Cas9断片は、一緒にすると、例えば上記Cas9参照配列に記載されるような、完全長の天然に存在するCas9ポリペプチド配列に対応しない場合がある。
本明細書に記載される融合タンパク質は、非標的部位(例えば、オフターゲット部位)における脱アミノ化が低下している、例えばゲノム全体的偽性脱アミノ化が低下している、標的化された脱アミノ化をもたらし得る。本明細書に記載される融合タンパク質は、非標的部位におけるバイスタンダー脱アミノ化が低下している、標的化された脱アミノ化をもたらし得る。望ましくない脱アミノ化またはオフターゲット脱アミノ化は、例えば、Cas9ポリペプチドのN末端またはC末端に融合したデアミナーゼを含む末端融合タンパク質と比較して、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%、または少なくとも99%低下し得る。望ましくない脱アミノ化またはオフターゲット脱アミノ化は、例えば、Cas9ポリペプチドのN末端またはC末端に融合したデアミナーゼを含む末端融合タンパク質と比較して、少なくとも1倍、少なくとも2倍、少なくとも3倍、少なくとも4倍、少なくとも5倍、少なくとも10倍、少なくとも15倍、少なくとも20倍、少なくとも30倍、少なくとも40倍、少なくとも50倍、少なくとも60倍、少なくとも70倍、少なくとも80倍、少なくとも90倍、または少なくとも100倍低下し得る。
いくつかの実施形態において、融合タンパク質のデアミナーゼ(例えば、アデノシンデアミナーゼ)は、Rループの範囲内の2個を超えない核酸塩基を脱アミノ化する。いくつかの実施形態において、融合タンパク質のデアミナーゼは、Rループの範囲内の3個を超えない核酸塩基を脱アミノ化する。いくつかの実施形態において、融合タンパク質のデアミナーゼは、Rループの範囲内の2、3、4、5、6、7、8、9、または10個を超えない核酸塩基を脱アミノ化する。Rループは、DNA:RNAハイブリッド、DNA:DNAまたはRNA:RNA相補的構造、および関連する一本鎖DNAを含む三本鎖核酸構造である。本明細書において使用される場合、Rループは、標的ポリヌクレオチドがCRISPR複合体または塩基編集複合体に接触すると形成され得、ガイドポリヌクレオチドの一部分、例えばガイドRNAが、標的ポリヌクレオチドの一部分、例えば標的DNAとハイブリダイズし、これに取って代わる。いくつかの実施形態において、Rループは、スペーサー配列および標的DNA相補的配列のハイブリダイズした領域を含む。Rループ領域は、長さが約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、または50核酸塩基対であり得る。いくつかの実施形態において、Rループ領域は、長さが約20核酸塩基対である。本明細書において使用される場合、Rループ領域は、ガイドポリヌクレオチドとハイブリダイズする標的DNA鎖に限定されないことが理解されるべきである。例えば、Rループ領域内の標的核酸塩基の編集は、ガイドRNAの相補鎖を含むDNA鎖に対するものであり得、またはガイドRNAに相補的な鎖とは反対の鎖であるDNA鎖に対するものであり得る。いくつかの実施形態において、Rループの領域における編集は、標的DNA配列におけるガイドRNAの非相補鎖(プロトスペーサー鎖)上の核酸塩基の編集を含む。
本明細書に記載される融合タンパク質は、標準塩基編集とは異なる編集ウィンドウにおける標的脱アミノ化をもたらし得る。いくつかの実施形態において、標的核酸塩基は、標的ポリヌクレオチド配列におけるPAM配列の約1~約20塩基上流にある。いくつかの実施形態において、標的核酸塩基は、標的ポリヌクレオチド配列におけるPAM配列の約2~約12塩基上流にある。いくつかの実施形態において、標的核酸塩基は、PAM配列から約1~9塩基対、約2~10塩基対、約3~11塩基対、約4~12塩基対、約5~13塩基対、約6~14塩基対、約7~15塩基対、約8~16塩基対、約9~17塩基対、約10~18塩基対、約11~19塩基対、約12~20塩基対、約1~7塩基対、約2~8塩基対、約3~9塩基対、約4~10塩基対、約5~11塩基対、約6~12塩基対、約7~13塩基対、約8~14塩基対、約9~15塩基対、約10~16塩基対、約11~17塩基対、約12~18塩基対、約13~19塩基対、約14~20塩基対、約1~5塩基対、約2~6塩基対、約3~7塩基対、約4~8塩基対、約5~9塩基対、約6~10塩基対、約7~11塩基対、約8~12塩基対、約9~13塩基対、約10~14塩基対、約11~15塩基対、約12~16塩基対、約13~17塩基対、約14~18塩基対、約15~19塩基対、約16~20塩基対、約1~3塩基対、約2~4塩基対、約3~5塩基対、約4~6塩基対、約5~7塩基対、約6~8塩基対、約7~9塩基対、約8~10塩基対、約9~11塩基対、約10~12塩基対、約11~13塩基対、約12~14塩基対、約13~15塩基対、約14~16塩基対、約15~17塩基対、約16~18塩基対、約17~19塩基対、約18~20塩基対離れている、または上流にある。いくつかの実施形態において、標的核酸塩基は、PAM配列から約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、またはそれ以上の塩基対離れている、または上流にある。いくつかの実施形態において、標的核酸塩基は、PAM配列の約1、2、3、4、5、6、7、8、または9塩基対上流にある。いくつかの実施形態において、標的核酸塩基は、PAM配列の約2、3、4、または6塩基対上流にある。
融合タンパク質は、2つ以上の異種ポリペプチドを含み得る。例えば、融合タンパク質は、1つまたは複数のUGIドメインおよび/または1つまたは複数の核局在化シグナルをさらに含み得る。2つ以上の異種ドメインは、タンデムで挿入され得る。2つ以上の異種ドメインは、それらがNapDNAbpにおいてタンデムにならないような位置で挿入され得る。
融合タンパク質は、デアミナーゼとnapDNAbpポリペプチドとの間にリンカーを含み得る。リンカーはペプチドまたは非ペプチドリンカーであり得る。例えば、リンカーは、XTEN、(GGGS)n、(GGGGS)n、(G)n、(EAAAK)n、(GGS)n、SGSETPGTSESATPESであり得る。いくつかの実施形態において、融合タンパク質は、N末端Cas9断片とデアミナーゼとの間にリンカーを含む。いくつかの実施形態において、融合タンパク質は、C末端Cas9断片とデアミナーゼとの間にリンカーを含む。いくつかの実施形態において、napDNAbpのN末端断片およびC末端断片は、リンカーを用いてデアミナーゼに接続される。いくつかの実施形態において、N末端断片およびC末端断片は、リンカーを用いずにデアミナーゼドメインに繋げられる。いくつかの実施形態において、融合タンパク質は、N末端Cas9断片とデアミナーゼとの間にリンカーを含むが、C末端Cas9断片とデアミナーゼとの間にはリンカーを含まない。いくつかの実施形態において、融合タンパク質は、C末端Cas9断片とデアミナーゼとの間にリンカーを含むが、N末端Cas9断片とデアミナーゼとの間にはリンカーを含まない。
他の実施形態において、Cas12ポリペプチドのN末端断片またはC末端断片は、核酸プログラミング可能DNA結合ドメインまたはRuvCドメインを含む。他の実施形態において、融合タンパク質は、Cas12ポリペプチドと触媒ドメインとの間にリンカーを含む。他の実施形態において、リンカーのアミノ酸配列は、GGSGGSまたはGSSGSETPGTSESATPESSGである。他の実施形態において、リンカーは剛性リンカーである。上記態様の他の実施形態では、リンカーは、GGAGGCTCTGGAGGAAGCまたはGGCTCTTCTGGATCTGAAACACCTGGCACAAGCGAGAGCGCCACCCCTGAGAGCTCTGGCによってコードされる。
Cas9またはCas12ポリペプチドのN末端断片およびC末端断片によって隣接される異種触媒ドメインを含む融合タンパク質も、本明細書に記載される方法における塩基編集に有用である。Cas9もしくはCas12および1つまたは複数のデアミナーゼドメイン、例えば、アデノシンデアミナーゼを含む、またはCas9もしくはCas12配列によって隣接されるアデノシンデアミナーゼドメインを含む融合タンパク質も、標的配列の高度に特異的かつ効率的な塩基編集に有用である。一実施形態では、キメラCas9またはCas12融合タンパク質は、Cas12ポリペプチドに挿入された異種触媒ドメインを含む。
様々な実施形態において、触媒ドメインは、DNA修飾活性(例えば、デアミナーゼ活性)、例えばアデノシンデアミナーゼ活性を有する。いくつかの実施形態において、アデノシンデアミナーゼは、TadA(例えば、TadA7.10)である。いくつかの実施形態において、TadAはTadA*8である。他の実施形態において、融合タンパク質は、1つまたは複数の触媒ドメインを含む。他の実施形態において、1つまたは複数の触媒ドメインのうちの少なくとも1つは、Cas12ポリペプチドに挿入されるか、またはCas12のN末端もしくはC末端で融合している。他の実施形態において、1つまたは複数の触媒ドメインのうちの少なくとも1つは、Cas12ポリペプチドのループ、アルファヘリックス領域、構造化されていない部分、または溶媒接触可能部分内に挿入されている。他の実施形態において、Cas12ポリペプチドは、Cas12a、Cas12b、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、またはCas12iである。他の実施形態において、Cas12ポリペプチドは、Bacillus hisashii Cas12b、Bacillus thermoamylovorans Cas12b、Bacillus sp. V3-13 Cas12b、またはAlicyclobacillus acidiphilus Cas12bに対して少なくとも約85%のアミノ酸配列同一性を有する。他の実施形態において、Cas12ポリペプチドは、Bacillus hisashii Cas12b、Bacillus thermoamylovorans Cas12b、Bacillus sp. V3-13 Cas12b、またはAlicyclobacillus acidiphilus Cas12bに対して少なくとも約90%のアミノ酸配列同一性を有する。他の実施形態において、Cas12ポリペプチドは、Bacillus hisashii Cas12b、Bacillus thermoamylovorans Cas12b、Bacillus sp. V3-13 Cas12b、またはAlicyclobacillus acidiphilus Cas12bに対して少なくとも約95%のアミノ酸配列同一性を有する。他の実施形態において、Cas12ポリペプチドは、Bacillus hisashii Cas12b, Bacillus thermoamylovorans Cas12b, Bacillus sp. V3-13 Cas12b、またはAlicyclobacillus acidiphilus Cas12bの断片を含むか、またはそれから本質的になる。
他の実施形態において、触媒ドメインは、BhCas12bのアミノ酸位置153~154、255~256、306~307、980~981、1019~1020、534~535、604~605、もしくは344~345、またはCas12a、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、もしくはCas12iの対応するアミノ酸残基の間に挿入される。他の実施形態において、触媒ドメインは、BhCas12bのアミノ酸P153とS154との間に挿入される。他の実施形態において、触媒ドメインは、BhCas12bのアミノ酸K255とE256との間に挿入される。他の実施形態において、触媒ドメインは、BhCas12bのアミノ酸D980とG981との間に挿入される。他の実施形態において、触媒ドメインは、BhCas12bのアミノ酸K1019とL1020との間に挿入される。他の実施形態において、触媒ドメインは、BhCas12bのアミノ酸F534とP535との間に挿入される。他の実施形態において、触媒ドメインは、BhCas12bのアミノ酸K604とG605との間に挿入される。他の実施形態において、触媒ドメインは、BhCas12bのアミノ酸H344とF345との間に挿入される。他の実施形態において、触媒ドメインは、BvCas12bのアミノ酸位置147と148、248と249、299と300、991と992、もしくは1031と1032、またはCas12a、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、もしくはCas12iの対応するアミノ酸残基の間に挿入される。他の実施形態において、触媒ドメインは、BvCas12bのアミノ酸P147とD148との間に挿入される。他の実施形態において、触媒ドメインは、BvCas12bのアミノ酸G248とG249との間に挿入される。他の実施形態において、触媒ドメインは、BvCas12bのアミノ酸P299とE300との間に挿入される。他の実施形態において、触媒ドメインは、BvCas12bのアミノ酸G991とE992との間に挿入される。他の実施形態において、触媒ドメインは、BvCas12bのアミノ酸K1031とM1032との間に挿入される。他の実施形態において、触媒ドメインは、AaCas12bのアミノ酸位置157と158、258と259、310と311、1008と1009、もしくは1044と1045、またはCas12a、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、もしくはCas12iの対応するアミノ酸残基の間に挿入される。他の実施形態において、触媒ドメインは、AaCas12bのアミノ酸P157とG158との間に挿入される。他の実施形態において、触媒ドメインは、AaCas12bのアミノ酸V258とG259との間に挿入される。他の実施形態において、触媒ドメインは、AaCas12bのアミノ酸D310とP311との間に挿入される。他の実施形態において、触媒ドメインは、AaCas12bのアミノ酸G1008とE1009との間に挿入される。他の実施形態において、触媒ドメインは、AaCas12bのアミノ酸G1044とK1045との間に挿入される。
他の実施形態において、融合タンパク質は、核局在化シグナル(例えば、二部分核局在化シグナル)を含む。他の実施形態において、核局在化シグナルのアミノ酸配列は、MAPKKKRKVGIHGVPAAである。上記態様の他の実施形態では、核局在化シグナルは、以下の配列によってコードされる: ATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCC。他の実施形態において、Cas12bポリペプチドは、RuvCドメインの触媒活性を抑制する突然変異を含む。他の実施形態において、Cas12bポリペプチドは、D574A、D829Aおよび/またはD952A突然変異を含む。他の実施形態において、融合タンパク質は、タグ(例えば、インフルエンザヘマグルチニンタグ)をさらに含む。
いくつかの実施形態において、融合タンパク質は、napDNAbpドメイン(例えば、Cas12由来ドメイン)と、内部で融合した核酸塩基編集ドメイン(例えば、デアミナーゼドメイン、例えば、アデノシンデアミナーゼドメインの全部または一部分)を含む。いくつかの実施形態において、napDNAbpはCas12bである。いくつかの実施形態において、塩基エディターは、BhCas12bドメインと、表10Bに提供される遺伝子座に挿入された、内部で融合したTadA*8ドメインを含む。
表10B:Cas12bタンパク質における挿入位置
Figure 2022519882000054
非限定的な例として、アデノシンデアミナーゼ(例えば、ABE8.13)をBhCas12bに挿入すると、核酸配列を効果的に編集する融合タンパク質(例えば、ABE8.13-BhCas12b)が産生され得る。
例示的な、しかし非限定的な融合タンパク質は、米国仮出願第62/852,228号および第62/852,224号に記載されており、その内容全体が参照により本明細書に組み込まれる。
[核酸を編集する方法]
本開示のいくつかの態様は、核酸を編集するための方法を提供する。いくつかの実施形態において、本方法は、タンパク質をコードしている核酸分子の核酸塩基(例えば二本鎖DNA配列の塩基対)を編集するための方法である。いくつかの実施形態において、本方法は、a) 核酸(例えば二本鎖DNA配列)の標的領域を、塩基エディターおよびガイド核酸(例えばgRNA)を含む複合体と接触させる工程と、b) 前記標的領域の鎖分離を誘導する工程と、c) 標的領域の一本鎖における前記標的核酸塩基対の第一の核酸塩基を第二の核酸塩基に変換する工程と、d) nCas9を用いて、前記標的領域の、一本を超えない数の鎖を切断する工程とを含み、ここで、第一の核酸塩基に相補的な第三の核酸塩基が、第二の核酸塩基に相補的な第四の核酸塩基によって置き換えられる。ある実施形態において、本方法は、核酸において20%未満のインデル形成をもたらす。一部の実施形態では、工程bが省略されることが理解されるべきである。いくつかの実施形態において、本方法は、19%未満、18%未満、16%未満、14%未満、12%未満、10%未満、8%未満、6%未満、4%未満、2%未満、1%未満、0.5%未満、0.2%未満、または0.1%未満のインデル形成をもたらす。いくつかの実施態様において、本方法は、第二の核酸塩基を、第四の核酸塩基に相補的な第五の核酸塩基で置き換え、それによって意図された編集塩基対(例えばG・CからA・T)を生成することをさらに含む。いくつかの実施形態では、意図された塩基対の少なくとも5%が編集される。いくつかの実施形態では、意図された塩基対の少なくとも10%、15%、20%、25%、30%、35%、40%、45%、または50%が編集される。
ある実施形態において、標的ヌクレオチドにおける意図された生成物対意図されない生成物の比は、少なくとも2:1、少なくとも5:1、少なくとも10:1、少なくとも20:1、少なくとも30:1、少なくとも40:1、少なくとも50:1、少なくとも60:1、少なくとも70:1、少なくとも80:1、少なくとも90:1、少なくとも100:1、もしくは少なくとも200:1、またはそれ以上である。いくつかの実施形態において、意図された突然変異対インデル形成の比は、1:1超、10:1超、50:1超、100:1超、500:1超、もしくは1000:1超、またはそれ以上である。いくつかの実施形態において、切断された一本鎖(ニック鎖)が、ガイド核酸にハイブリダイズされる。いくつかの実施態様において、切断された一本鎖は、第一の核酸塩基を含む鎖とは反対の鎖である。一部の実施形態では、塩基エディターはdCas9ドメインを含む。いくつかの実施形態において、塩基エディターは、編集されていない鎖を保護または結合する。いくつかの実施形態において、意図される編集塩基対は、PAM部位の上流にある。ある実施形態において、意図される編集塩基対は、PAM部位の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド上流である。いくつかの実施形態において、意図される編集塩基対は、PAM部位の下流にある。いくつかの実施形態において、意図される編集塩基対は、PAM部位の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド下流にある。いくつかの実施形態において、本方法は、正準(例えばNGG)PAMサイトを必要としない。一部の実施形態では、核酸塩基エディターはリンカーを含む。ある態様において、リンカーは、長さが1~25アミノ酸である。ある態様において、リンカーは、長さが5~20アミノ酸である。ある実施形態において、リンカーは、長さが10、11、12、13、14、15、16、17、18、19、または20アミノ酸である。一実施形態において、リンカーは、長さが32アミノ酸である。別の実施形態では、「長いリンカー(long linker)」は、長さが少なくとも約60アミノ酸である。他の実施形態において、リンカーは、長さが約3~100アミノ酸である。一部の実施形態では、標的領域は標的ウィンドウを含み、標的ウィンドウは標的核酸塩基対を含む。ある実施形態において、標的ウィンドウは、1~10ヌクレオチドを含む。いくつかの実施形態において、標的ウィンドウは、長さが1~9、1~8、1~7、1~6、1~5、1~4、1~3、1~2、または1ヌクレオチドである。ある態様において、標的ウィンドウは、長さが1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチドである。いくつかの実施形態において、意図される編集塩基対は、標的ウィンドウ内にある。いくつかの実施態様において、標的ウィンドウは、意図される編集塩基対を含む。いくつかの実施形態において、本方法は、本明細書に提供される塩基エディターのいずれかを用いて実施される。
いくつかの実施形態において、本開示は、ヌクレオチド(例えば、タンパク質をコードする遺伝子中のSNP)を編集するための方法を提供する。いくつかの実施形態において、本開示は、二本鎖DNA配列の核酸塩基対を編集するための方法を提供する。いくつかの実施形態において、本方法は、a) 二本鎖DNA配列の標的領域を、塩基エディターおよびガイド核酸(例えばgRNA)を含む複合体と接触させ、ここで、標的領域が標的核酸塩基対を含む、工程と、b) 上記標的領域の鎖分離を誘導する工程と、c) 標的領域の一本鎖における前記標的核酸塩基対の第一の核酸塩基を第二の核酸塩基に変換する工程と、d) 前記標的領域の一本を超えない数の鎖を切断する工程と、を含み、ここで、第一の核酸塩基に相補的な第三の核酸塩基が、第二の核酸塩基に相補的な第四の核酸塩基によって置き換えられ、第二の核酸塩基が、第四の核酸塩基に相補的な第五の核酸塩基によって置き換えられ、それによって、意図された編集塩基対を生成し、ここで意図された塩基対を生成する効率は少なくとも5%である。一部の実施形態では、工程bは省略されることが理解されるべきである。いくつかの実施形態では、意図された塩基対の少なくとも5%が編集される。いくつかの実施形態では、意図された塩基対の少なくとも10%、15%、20%、25%、30%、35%、40%、45%、または50%が編集される。いくつかの態様において、本方法は、19%未満、18%未満、16%未満、14%未満、12%未満、10%未満、8%未満、6%未満、4%未満、2%未満、1%未満、0.5%未満、0.2%未満、または0.1%未満のインデル形成を引き起こす。ある実施形態において、標的ヌクレオチドにおける意図された生成物対意図されない生成物の比は、少なくとも2:1、少なくとも5:1、少なくとも10:1、少なくとも20:1、少なくとも30:1、少なくとも40:1、少なくとも50:1、少なくとも60:1、少なくとも70:1、少なくとも80:1、少なくとも90:1、少なくとも100:1、もしくは少なくとも200:1、またはそれ以上である。いくつかの実施形態において、意図された突然変異対インデル形成の比は、1:1超、10:1超、50:1超、100:1超、500:1超、もしくは1000:1超、またはそれ以上である。いくつかの実施形態において、切断された一本鎖が、ガイド核酸にハイブリダイズされる。いくつかの実施態様において、切断された一本鎖は、第一の核酸塩基を含む鎖とは反対の鎖である。いくつかの実施形態において、意図される編集塩基対は、PAM部位の上流にある。ある実施形態において、意図される編集塩基対は、PAM部位の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド上流である。いくつかの実施形態において、意図される編集塩基対は、PAM部位の下流にある。いくつかの実施形態において、意図される編集塩基対は、PAM部位の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド下流にある。いくつかの実施形態において、本方法は、正準(例えばNGG)PAMサイトを必要としない。ある態様において、リンカーは、長さが1~25アミノ酸である。ある態様において、リンカーは、長さが5~20アミノ酸である。ある実施形態において、リンカーは、長さが10、11、12、13、14、15、16、17、18、19、または20アミノ酸である。一部の実施形態では、標的領域は標的ウィンドウを含み、標的ウィンドウは標的核酸塩基対を含む。ある実施形態において、標的ウィンドウは、1~10ヌクレオチドを含む。いくつかの実施形態において、標的ウィンドウは、長さが1~9、1~8、1~7、1~6、1~5、1~4、1~3、1~2、または1ヌクレオチドである。ある態様において、標的ウィンドウは、長さが1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチドである。いくつかの実施形態において、意図される編集塩基対は、標的ウィンドウ内で起こる。いくつかの実施態様において、標的ウィンドウは、意図される編集塩基対を含む。いくつかの実施形態において、核酸塩基エディターは、本明細書に提供される塩基エディターのいずれかである。
[宿主細胞における融合タンパク質の発現]
アデノシンデアミナーゼバリアントを含む本発明の融合タンパク質は、当業者に知られるルーチンの方法を用いて、細菌、酵母、真菌、昆虫、植物、および動物細胞を含むがこれらに限定されない実質的にあらゆる目的宿主細胞において発現され得る。例えば、本発明のアデノシンデアミナーゼをコードするDNAは、cDNA配列に基づいてCDSの上流および下流に適切なプライマーを設計することによってクローニングされ得る。クローニングされたDNAは、直接、または所望であれば制限酵素での消化の後に、または適切なリンカーおよび/もしくは核局在化シグナルの付加の後に、塩基編集システムの1つまたは複数のさらなる構成要素をコードするDNAとライゲートされ得る。塩基編集システムは宿主細胞において翻訳されて複合体を形成する。
本明細書に記載されるタンパク質ドメインをコードするDNAは、DNAを化学的に合成することによって、またはPCR法およびGibsonアセンブリ法を利用することにより合成された部分的に重複するオリゴDNA短鎖を接続して、その完全長をコードするDNAを構築することによって、得ることができる。化学合成またはPCR法の組合せもしくはGibsonアセンブリ法によって完全長DNAを構築する利点は、使用されるコドンが、DNAが導入される宿主に従ってCDS完全長で設計され得ることである。異種DNAの発現において、タンパク質発現レベルは、そのDNA配列を宿主生物において高頻度で使用されるコドンに変換することによって上昇すると予想される。使用される宿主におけるコドン使用頻度のデータとしては、例えば、上総DNA研究所のホームページに開示されている遺伝子コード使用頻度データベース(http://www.kazusa.or.jp/codon/index.html)を使用してもよいし、または各宿主におけるコドン使用頻度を示す文書を参照してもよい。得られたデータおよび導入されるDNA配列を参照することにより、DNA配列について使用されるものの中で宿主において低い使用頻度を示すコドンが、同じアミノ酸をコードし高い使用頻度を示すコドンに変換され得る。
核酸配列認識モジュールおよび/または核酸塩基変換酵素をコードするDNAを含む発現ベクターは、例えば、適切な発現ベクターにおいてプロモーターの下流にDNAを連結することによって産生することができる。
発現ベクターとしては、Escherichia coli由来プラスミド(例えば、pBR322、pBR325、pUC12、pUC13)、Bacillus subtilis由来プラスミド(例えば、pUB110、pTP5、pC194)、酵母由来プラスミド(例えば、pSH19、pSH15)、昆虫細胞発現プラスミド(例えば、pFast-Bac)、動物細胞発現プラスミド(例えば、pA1-11、pXT1、pRc/CMV、pRc/RSV、pcDNAI/Neo)、ラムダファージなどのようなバクテリオファージ、バキュロウイルスなどのような昆虫ウイルスベクター(例えば、BmNPV、AcNPV)、レトロウイルス、ワクシニアウイルス、アデノウイルスなどのような動物ウイルスベクターなどが使用される。
プロモーターとしては、遺伝子発現のために使用される宿主に適切な任意のプロモーターを使用することができる。DSBを使用する従来の方法では、宿主細胞の生存率が毒性のために著しく減少する場合があるので、誘導性プロモーターを使用して誘導の開始までに細胞の数を増加させることが望ましい。しかしながら、十分な細胞増殖は、本発明の核酸修飾酵素複合体を発現させることによっても得ることができるため、構成的プロモーターも制限なく使用し得る。
例えば、宿主が動物細胞である場合には、SRアルファプロモーター、SV40プロモーター、LTRプロモーター、CMV(サイトメガロウイルス)プロモーター、RSV(ラウス肉腫ウイルス)プロモーター、MoMuLV(モロニーマウス白血病ウイルス)LTR、HSV-TK(単純ヘルペスウイルスのチミジンキナーゼ)プロモーターなどが使用される。これらのうち、CMVプロモーター、SRアルファプロモーターなどが好ましい。
宿主がEscherichia coliである場合には、trpプロモーター、lacプロモーター、recAプロモーター、ラムダP.sub.Lプロモーター、lppプロモーター、T7プロモーターなどが好ましい。
宿主がBacillus属である場合には、SPO1プロモーター、SPO2プロモーター、penPプロモーターなどが好ましい。
宿主が酵母である場合には、Gal1/10プロモーター、PHO5プロモーター、PGKプロモーター、GAPプロモーター、ADHプロモーターなどが好ましい。
宿主が昆虫細胞である場合には、ポリヘドリンプロモーター、P10プロモーターなどが好ましい。
宿主が植物細胞である場合には、CaMV35Sプロモーター、CaMV19Sプロモーター、NOSプロモーターなどが好ましい。
発現ベクターとしては、上記のものの他に、エンハンサー、スプライシングシグナル、ターミネーター、ポリA付加シグナル、選択マーカー。例えば、薬物耐性遺伝子、栄養要求性相補遺伝子など、複製起点などを含むものを所望により使用し得る。
本明細書に記載されるタンパク質ドメインをコードするRNAは、例えば、鋳型として上記の核酸配列認識モジュールおよび/または核酸塩基変換酵素をコードするDNAをコードするベクターを使用することによる、それ自体公知であるin vitro転写システムにおけるmRNAへの転写によって調製され得る。
本発明の融合タンパク質は、核酸配列認識モジュールおよび/または核酸塩基変換酵素をコードするDNAを含む発現ベクターを宿主細胞に導入し、宿主細胞を培養することにより、細胞内で発現させ得る。
宿主としては、Escherichia属、Bacillus属、酵母、昆虫細胞、昆虫、動物細胞などが使用される。
Escherichia属としては、Escherichia coli K12.cndot.DH1 [Proc. Natl. Acad. Sci. USA, 60, 160 (1968)]、Escherichia coli JM103 [Nucleic Acids Research, 9, 309 (1981)]、Escherichia coli JA221 [Journal of Molecular Biology, 120, 517 (1978)]、Escherichia coli HB101 [Journal of Molecular Biology, 41, 459 (1969)]、Escherichia coli C600 [Genetics, 39, 440 (1954)]などが使用される。
Bacillus属としては、Bacillus subtilis M1114 [Gene, 24, 255 (1983)]、Bacillus subtilis 207-21 [Journal of Biochemistry, 95, 87 (1984)]などが使用される。
酵母としては、Saccharomyces cerevisiae AH22、AH22R.sup.-、NA87-11A、DKD-5D、20B-12、Schizosaccharomyces pombe NCYC1913、NCYC2036、Pichia pastoris KM71などが使用される。
ウイルスがAcNPVである場合の昆虫細胞としては、ヨトウガ幼虫由来樹立株の細胞(Spodoptera frugiperda細胞; Sf細胞)、Trichoplusia niの中腸由来MG1細胞、Trichoplusia niの卵由来のHigh Five(商標)細胞、Mamestra brassicae由来細胞、Estigmena acrea由来細胞などが使用される。ウイルスがBmNPVの場合には、Bombyx mori由来樹立株の細胞(Bombyx mori N細胞; BmN細胞)などが昆虫細胞として使用される。Sf細胞としては、例えば、Sf9細胞(ATCC CRL1711)、Sf21細胞[上記すべて、In Vivo, 13, 213-217 (1977)]などが使用される。
昆虫としては、例えば、Bombyx moriの幼虫、Drosophila、コオロギなどが使用される [Nature, 315, 592 (1985)]。
動物細胞としては、サルCOS-7細胞、サルVero細胞、チャイニーズハムスター卵巣(CHO)細胞、dhfr遺伝子欠損CHO細胞、マウスL細胞、マウスAtT-20細胞、マウスミエローマ細胞、ラットGH3細胞、ヒトFL細胞などの細胞株、ヒトおよび他の哺乳動物のiPS細胞、ES細胞などの多能性幹細胞、ならびに様々な組織から調製された初代培養細胞が使用される。また、ゼブラフィッシュ胚、Xenopus卵母細胞などを使用し得る。
植物細胞としては、様々な植物(例えば、イネ、コムギ、トウモロコシなどの穀類、トマト、キュウリ、ナスなどの農産物、カーネーション、Eustoma russellianumなどの園芸植物、タバコ、arabidopsis thalianaなどの実験植物など)から調製された、懸濁培養細胞、カルス、プロトプラスト、葉断片、根断片などが使用される。
上記の宿主細胞はすべて、ハプロイド(一倍体)または倍数体(例えば二倍体、三倍体、四倍体など)であり得る。従来の突然変異導入方法において、突然変異は、原理的に、ヘテロ遺伝子型を産生するために、1つの相同染色体だけに導入される。したがって、所望の表現型は、優性突然変異が生じない限りは発現されず、ホモ接合は、不都合なことに、労力および時間を要する。対照的に、本発明によれば、突然変異がゲノム内の相同染色体における任意のアリルに導入され得るため、所望の表現型は、劣性突然変異の場合でさえも一回の生成で発現し得、このことは、従来の方法の問題が解決され得るため極めて有用である。
発現ベクターは、宿主の種類に従って、公知の方法(例えば、リゾチーム法、コンピテント法、PEG法、CaCl2共沈法、エレクトロポレーション法、マイクロインジェクション法、粒子銃法、リポフェクション法、アグロバクテリウム法など)によって導入され得る。
Escherichia coliは、例えば、Proc. Natl. Acad. Sci. USA, 69, 2110 (1972), Gene, 17, 107 (1982)などに記載されている方法に従って形質転換され得る。
Bacillus属は、例えば、Molecular & General Genetics, 168, 111 (1979)などに記載されている方法に従ってベクターに導入され得る。
酵母は、例えば、Methods in Enzymology, 194, 182-187 (1991), Proc. Natl. Acad. Sci. USA, 75, 1929 (1978)などに記載されている方法に従ってベクターに導入され得る。
昆虫細胞および昆虫は、例えば、Bio/Technology, 6, 47-55 (1988)などに記載されている方法に従ってベクターに導入され得る。
動物細胞は、例えば、Cell Engineering additional volume 8, New Cell Engineering Experiment Protocol, 263-267 (1995)(Shujunsha刊行)、およびVirology, 52, 456 (1973)に記載されている方法に従ってベクターに導入され得る。
ベクターが導入された細胞は、宿主の種類に従い、公知の方法に従って培養され得る。
例えば、Escherichia coliまたはBacillus属を培養する場合、液体培地が培養に使用する培地として好ましい。培地は、好ましくは、形質転換体の成長に必要な炭素源、窒素源、無機物質などを含む。炭素源の例としては、グルコース、デキストリン、可溶性デンプン、スクロースなどが挙げられる。窒素源の例としては、アンモニウム塩、硝酸塩、コーンスティープリカー、ペプトン、カゼイン、肉エキス、大豆ケーキ、ジャガイモエキスなどのような無機または有機物質が挙げられ、無機物質の例としては、塩化カルシウム、リン酸二水素ナトリウム、塩化マグネシウムなどが挙げられる。培地は、酵母エキス、ビタミン、成長促進因子などを含んでもよい。培地のpHは好ましくは約5~約8である。
Escherichia coliを培養するための培地としては、例えば、グルコース、カザミノ酸を含むM9培地 [Journal of Experiments in Molecular Genetics, 431-433, Cold Spring Harbor Laboratory, New York 1972]が好ましい。必要に応じて、例えば、3ベータ-インドリルアクリル酸などの薬剤を培地に添加して、プロモーターの効率的な機能を確実にしてもよい。Escherichia coliは通常約15~約43℃で培養される。必要に応じて曝気および攪拌を行ってもよい。
Bacillus属は通常約30~約40℃で培養される。必要に応じて曝気および攪拌を行ってもよい。
酵母を培養するための培地の例としては、バークホルダー最少培地 [Proc. Natl. Acad. Sci. USA, 77, 4505 (1980)]、0.5%カザミノ酸含有SD培地 [Proc. Natl. Acad. Sci. USA, 81, 5330 (1984)]などが挙げられる。培地のpHは好ましくは約5~約8である。培養は通常約20℃~約35℃で行われる。必要に応じて曝気および攪拌を行ってもよい。
昆虫細胞または昆虫を培養するための培地としては、例えば、必要に応じて不活化10%ウシ血清などのような添加剤を含むグレース昆虫培地 [Nature, 195, 788 (1962)]などが使用される。培地のpHは好ましくは約6.2~約6.4である。培養は通常約27℃で行われる。必要に応じて曝気および攪拌を行ってもよい。
動物細胞を培養するための培地としては、例えば、約5~約20%のウシ胎児血清を含む最小必須培地(MEM) [Science, 122, 501 (1952)]、Dulbecco改変イーグル培地(DMEM) [Virology, 8, 396 (1959)]、RPMI 1640培地 [The Journal of the American Medical Association, 199, 519 (1967)]、199培地 [Proceeding of the Society for the Biological Medicine, 73, 1 (1950)]などが使用される。培地のpHは好ましくは約6~約8である。培養は通常約30℃~約40℃で行われる。必要に応じて曝気および攪拌を行ってもよい。
植物細胞を培養するための培地としては、例えば、MS培地、LS培地、B5培地等が用いられる。培地のpHは好ましくは約5~約8である。培養は、一般に約20℃~約30℃で行われる。必要に応じて曝気および攪拌を行ってもよい。
動物細胞、昆虫細胞、植物細胞などのような高等真核細胞が宿主細胞として使用される場合、本発明の塩基編集システム(例えば、アデノシンデアミナーゼバリアントを含む)をコードするDNAが、誘導性プロモーター(例えば、メタロチオネインプロモーター(重金属イオンによって誘導される)、熱ショックタンパク質プロモーター(熱ショックによって誘導される)、Tet-ON/Tet-OFF系プロモーター(テトラサイクリンまたはその誘導体の追加または除去によって誘導される)、ステロイド応答性プロモーター(ステロイドホルモンまたはその誘導体によって誘導される)など)の調節下で宿主細胞に導入され、誘導物質が適切な段階で培地に添加されて(または培地から除去されて)核酸修飾酵素複合体の発現を誘導し、培養が所与の期間にわたって実施されて、塩基編集および標的遺伝子への突然変異の導入が行われ、塩基編集システムの一過性発現が実現され得る。
大腸菌などの原核細胞は誘導プロモーターを利用することができる。誘導性プロモーターの例としては、lacプロモーター(IPTGによって誘導される)、cspAプロモーター(寒冷ショックによって誘導される)、araBADプロモーター(アラビノースによって誘導される)などが挙げられるが、これらに限定されない。
あるいは、動物細胞、昆虫細胞、植物細胞などのような高等真核細胞が宿主細胞として使用される場合、上記の誘導性プロモーターをベクター除去機構として利用し得る。すなわち、ベクターに、宿主細胞において機能する複製起点と、複製に必要なタンパク質(例えば、動物細胞の場合はSV40 onおよびラージT抗原、oriPおよびEBNA-1など)をコードする核酸が搭載され、そのタンパク質をコードする核酸の発現が、上記の誘導性プロモーターによって調節される。結果として、ベクターは誘導物質の存在下で自律的に複製可能であるが、誘導物質が除去されると、自律的複製は利用できず、ベクターは細胞分裂と共に自然に脱落する(自律的複製は、Tet-OFF系ベクターにおけるテトラサイクリンおよびドキシサイクリンの付加により不可能である)。
[塩基エディターを使用する方法]
疾患関連遺伝子およびアリルにおける点突然変異の補正は、治療および基礎研究に応用される遺伝子補正の新しい戦略を提供する。
本開示は、本明細書において提供される塩基エディターシステムによって補正され得る点突然変異に関連するかまたはそれによって引き起こされる疾患と診断された対象の治療のための方法を提供する。例えば、いくつかの実施形態において、そのような疾患、例えば遺伝子突然変異によって引き起こされる疾患を有する対象に、疾患関連遺伝子における点突然変異を補正する有効量の核酸塩基エディター(例えば、アデノシンデアミナーゼ塩基エディター)を投与することを含む方法が提供される。本開示は、デアミナーゼ媒介遺伝子編集によって補正し得る点突然変異に関連するかまたはそれによって引き起こされるGSD1aの治療のための方法を提供する。本明細書において提供される戦略および融合タンパク質で治療し得る適切な疾患は、本開示に基づいて当業者に明らかであろう。
本明細書では、疾患または障害に関連する標的ヌクレオチド配列における核酸塩基を編集するための塩基エディターまたは塩基エディターシステムを使用する方法を提供する。いくつかの実施形態において、塩基エディター(例えば、アデノシンデアミナーゼおよびCas9ドメインを含む)の活性は、点突然変異の補正をもたらす。いくつかの実施形態において、標的DNA配列は、疾患または障害に関連するG→A点突然変異を含み、突然変異体A塩基の脱アミノ化は、疾患または障害に関連しない配列をもたらす。いくつかの実施形態において、標的DNA配列は、疾患または障害に関連するT→C点突然変異を含み、突然変異体C塩基の脱アミノ化は、疾患または障害に関連しない配列をもたらす。
いくつかの実施形態において、標的DNA配列はタンパク質をコードし、点突然変異はコドンに存在し、野生型コドンと比較した突然変異体コドンによってコードされるアミノ酸の変化をもたらす。いくつかの実施形態において、突然変異体Aの脱アミノ化は、突然変異体コドンによってコードされるアミノ酸の変化をもたらす。いくつかの実施形態において、突然変異体Aの脱アミノ化は、野生型アミノ酸をコードするコドンをもたらす。いくつかの実施形態において、突然変異体Cの脱アミノ化は、突然変異体コドンによってコードされるアミノ酸の変化をもたらす。いくつかの実施形態において、突然変異体Cの脱アミノ化は、野生型アミノ酸をコードするコドンをもたらす。いくつかの実施形態において、対象は、疾患もしくは障害を有するか、または疾患もしくは障害と診断されている。
いくつかの実施形態において、本明細書において提供されるアデノシンデアミナーゼは、DNAのデオキシアデノシン残基を脱アミノ化することができる。本開示の他の態様は、アデノシンデアミナーゼ(例えば、本明細書に記載されるDNAのデオキシアデノシンを脱アミノ化するアデノシンデアミナーゼ)と、特定のヌクレオチド配列に結合することができるドメイン(例えば、Cas9またはCpf1タンパク質)とを含む、融合タンパク質を提供する。例えば、アデノシンは、典型的にはシトシン残基と塩基対を形成するイノシン残基に変換され得る。そのような融合タンパク質は、とりわけ、核酸配列の標的化編集に有用である。そのような融合タンパク質は、DNAのin vitroでの標的化編集のために、例えば、突然変異体細胞もしくは動物の生成のために、標的化された突然変異の導入のために、例えば、ex vivoでの細胞における、例えば、対象から得られた後に同じまたは別の対象に再導入される細胞における遺伝子欠陥の補正のために、ならびに標的化された突然変異のin vivoでの導入、例えば、本明細書において提供される核酸塩基エディターを使用して治療することができるGからAまたはTからCの突然変異における、遺伝子欠陥の補正または疾患関連遺伝子中の不活化突然変異の導入のために使用され得る。本開示は、デアミナーゼや、デアミナーゼおよび核酸塩基エディターを利用する融合タンパク質、核酸、ベクター、細胞、組成物、方法、キット、システムなどを提供する。
[G6PC遺伝子中のヌクレオチドを標的化するための核酸塩基エディターの使用]
G6PC遺伝子におけるヌクレオチドを標的化する核酸塩基エディターの適合性は、本明細書に記載されるように評価される。一実施形態において、目的の単一細胞は、本明細書に記載される核酸塩基エディターをコードする核酸分子(複数可)を、レポーター(例えば、GFP)をコードする少量のベクターと共にトランスフェクトされるか、形質導入されるか、または他のかたちでそれによって修飾される。これらの細胞は、293T、K562またはU20Sなどの不死化ヒト細胞株であり得る。あるいは、初代ヒト細胞を使用してもよい。細胞は、組織生検、手術、血液、血漿、血清、または他の生物学的流体からなど、対象または個体から得られてもよい。そのような細胞は、最終的な細胞標的に関連したものであり得る。
送達は、以下にさらに記載するようにウイルスベクターを用いて実施され得る。一実施形態において、トランスフェクションは、脂質トランスフェクション(Lipofectamine、Metafectamine、またはFugeneなど)を用いて、またはエレクトロポレーションによって実施され得る。トランスフェクション後、GFPの発現を蛍光顕微鏡またはフローサイトメトリーのいずれかによって決定して、一貫した高レベルのトランスフェクションを確認し得る。最も高い活性を与えるエディターの組合せを決定するために、これらの予備的なトランスフェクションは異なる複数の核酸塩基エディターを含み得る。
核酸塩基エディターの活性は、本明細書に記載されるように、すなわち標的遺伝子を配列決定して標的配列の変化を検出することによって評価される。サンガー配列決定のためには、精製されたPCRアンプリコンをプラスミド骨格中にクローニングし、形質転換し、ミニプレップし、単一のプライマーで配列決定する。配列決定はまた、次世代配列決定技術を用いて実施され得る。次世代配列決定を使用する場合、アンプリコンは、意図される切断部位が非対称に配置された300~500bpであり得る。PCRに続いて、次世代配列決定のアダプターおよびバーコード(例えば、Illumina multiplexアダプターとインデックス)をアンプリコンの末端に付加し得る(例えば高スループット配列決定(例えばIllumina MiSeqでのもの)で使用するために)。
最初の試験で最大レベルの標的特異的変化を誘導する融合タンパク質を、さらなる評価のために選択し得る。
特定の実施形態では、核酸塩基エディターを用いて、目的のポリヌクレオチドを標的化する。一実施形態において、本発明の核酸塩基エディターは、核酸配列、例えば、GSD1a関連突然変異を有するG6PCポリヌクレオチドを標的化するために使用されるガイドRNAと併せて細胞(例えば、肝細胞)に送達され、それにより、標的遺伝子、すなわちG6PCを変化させる。
いくつかの実施形態において、塩基エディターは、目的の遺伝子(例えばG6PC)の配列に対する1つまたは複数の編集を導入するように、ガイドRNAによって標的指向化される。いくつかの実施形態において、1つまたは複数の変化は、グルコース-6-ホスファターゼ(G6PC)遺伝子に導入される。いくつかの実施形態において、1つまたは複数の変化はR83Cである。いくつかの実施形態において、1つまたは複数の変化はQ347Xである。いくつかの実施形態において、変化は、以下に提供されるNCBI参照配列番号AAA16222.1に見出される代表的なHomo sapiens G6PCタンパク質に導入される:
1 MEEGMNVLHD FGIQSTHYLQ VNYQDSQDWF ILVSVIADLR NAFYVLFPIW FHLQEAVGIK
61 LLWVAVIGDW LNLVFKWILF GQRPYWWVLD TDYYSNTSVP LIKQFPVTCE TGPGSPSGHA
121 MGTAGVYYVM VTSTLSIFQG KIKPTYRFRC LNVILWLGFW AVQLNVCLSR IYLAAHFPHQ
181 VVAGVLSGIA VTETFSHIHS IYNASLKKYF LITFFLFSFA IGFYLLLKGL GVDLLWTLEK
241 AQRWCEQPEW VHIDTTPFAS LLKNLGTLFG LGLALNSSMY RESCKGKLSK WLPFRLSSIV
301 ASLVLLHVFD SLKPPSQVEL VFYVLSFCKS AVVPLASVSV IPYCLAQVLG QPHKKSL
いくつかの実施形態において、変化は、以下に提供されるGenBank参照配列番号U01120.1に見出される代表的なHomo sapiens G6PC核酸配列に導入される:
1 tagcagagca atcaccacca agcctggaat aactgcaagg gctctgctga catcttcctg
61 aggtgccaag gaaatgagga tggaggaagg aatgaatgtt ctccatgact ttgggatcca
121 gtcaacacat tacctccagg tgaattacca agactcccag gactggttca tcttggtgtc
181 cgtgatcgca gacctcagga atgccttcta cgtcctcttc cccatctggt tccatcttca
241 ggaagctgtg ggcattaaac tcctttgggt agctgtgatt ggagactggc tcaacctcgt
301 ctttaagtgg attctctttg gacagcgtcc atactggtgg gttttggata ctgactacta
361 cagcaacact tccgtgcccc tgataaagca gttccctgta acctgtgaga ctggaccagg
421 gagcccctct ggccatgcca tgggcacagc aggtgtatac tacgtgatgg tcacatctac
481 tctttccatc tttcagggaa agataaagcc gacctacaga tttcggtgct tgaatgtcat
541 tttgtggttg ggattctggg ctgtgcagct gaatgtctgt ctgtcacgaa tctaccttgc
601 tgctcatttt cctcatcaag ttgttgctgg agtcctgtca ggcattgctg ttacagaaac
661 tttcagccac atccacagca tctataatgc cagcctcaag aaatattttc tcattacctt
721 cttcctgttc agcttcgcca tcggatttta tctgctgctc aagggactgg gtgtagacct
781 cctgtggact ctggagaaag cccagaggtg gtgcgagcag ccagaatggg tccacattga
841 caccacaccc tttgccagcc tcctcaagaa cctgggcacg ctctttggcc tggggctggc
901 tctcaactcc agcatgtaca gggagagctg caaggggaaa ctcagcaagt ggctcccatt
961 ccgcctcagc tctattgtag cctccctcgt cctcctgcac gtctttgact ccttgaaacc
1021 cccatcccaa gtcgagctgg tcttctacgt cttgtccttc tgcaagagtg cggtagtgcc
1081 cctggcatcc gtcagtgtca tcccctactg cctcgcccag gtcctgggcc agccgcacaa
1141 gaagtcgttg taagagatgt ggagtcttcg gtgtttaaag tcaacaacca tgccagggat
1201 tgaggaggac tactatttga agcaatgggc actggtattt ggagcaagtg acatgccatc
1261 cattctgccg tcgtggaatt aaatcacgga tggcagattg gagggtcgcc tggcttattc
1321 ccatgtgtga ctccagcctg ccctcagcac agactctttc agatggaggt gccatatcac
1381 gtacaccata tgcaagtttc ccgccaggag gtcctcctct ctctacttga atactctcac
1441 aagtagggag ctcactccca ctggaacagc ccattttatc tttgaatggt cttctgccag
1501 cccattttga ggccagaggt gctgtcagct caggtggtcc tcttttacaa tcctaatcat
1561 attgggtaat gtttttgaaa agctaatgaa gctattgaga aagacctgtt gctagaagtt
1621 gggttgttct ggattttccc ctgaagactt acttattctt ccgtcacata tacaaaagca
1681 agacttccag gtagggccag ctcacaagcc caggctggag atcctaactg agaattttct
1741 acctgtgttc attcttaccg agaaaaggag aaaggagctc tgaatctgat aggaaaagaa
1801 ggctgcctaa ggaggagttt ttagtatgtg gcgtatcatg caagtgctat gccaagccat
1861 gtctaaatgg ctttaattat atagtaatgc actctcagta atgggggacc agcttaagta
1921 taattaatag atggttagtg gggtaattct gcttctagta ttttttttac tgtgcataca
1981 tgttcatcgt atttccttgg atttctgaat ggctgcagtg acccagatat tgcactaggt
2041 caaaacattc aggtatagct gacatctcct ctatcacatt acatcatcct ccttataagc
2101 ccagctctgc tttttccaga ttcttccact ggctccacat ccaccccact ggatcttcag
2161 aaggctagag ggcgactctg gtggtgcttt tgtatgtttc aattaggctc tgaaatcttg
2221 ggcaaaatga caaggggagg gccaggattc ctctctcagg tcactccagt gttactttta
2281 attcctagag ggtaaatatg actcctttct ctatcccaag ccaaccaaga gcacattctt
2341 aaaggaaaag tcaacatctt ctctcttttt tttttttttt gagacagggt ctcactatgt
2401 tgcccaggct gctcttgaat tcctgggctc aagcagtcct cccaccctac cacagcgtcc
2461 cgcgtagctg gcatacaggt gcaagccact atgtccagct agccaactcc tccttgcctg
2521 cttttctttt tttttctttt tttgagacgg cgcacctatc acccaggctg gagtggagtg
2581 gcacgatctt ggctcactgc aacctcttcc tcctggttca agcgattctc atgtctcagc
2641 ctcctcagta gctaggacta ccggcgtgca ccaccatgcc aggctaattt ttatattttt
2701 agaattttag aagagatggg atttcatcat gttggccagg ctggtctcga actcctgacc
2761 tcaagtgatc cacctgcctt ggcctcccaa ggtgctagga ttacaggcat gagccaccgc
2821 accgggccct ccttgcctgt ttttcaatct catctgatat gcagagtatt tctgccccac
2881 ccacctaccc cccaaaaaaa gctgaagcct atttatttga aagtccttgt ttttgctact
2941 aattatatag tataccatac attatcattc aaaacaacca tcctgctcat aacatctttg
3001 aaaagaaaaa tatatatgtg cagtatttta ttaaagcaac attttattta agaataaagt
3061 cttgttaatt actatatttt agatgcaatg tgatc
[意図される突然変異の生成]
いくつかの実施形態において、本明細書において提供される方法の目的は、遺伝子編集を介して機能不全遺伝子の機能を回復することである。いくつかの実施形態において、機能不全遺伝子の機能は、意図される突然変異を導入することによって回復される。いくつかの実施形態において、本明細書において提供される方法は、遺伝子産物の正常な機能を妨害するために使用され得る。本明細書において提供される核酸塩基編集タンパク質は、例えばヒト細胞培養物中の疾患関連突然変異を補正することによって、遺伝子編集に基づくヒト治療についてin vitroで検証され得る。本明細書において提供される核酸塩基編集タンパク質、例えば、ポリヌクレオチドプログラミング可能ヌクレオチド結合ドメイン(例えば、Cas9)および核酸塩基編集ドメイン(例えば、アデノシンデアミナーゼドメイン)を含む融合タンパク質が、AからGまたはCからTへの任意の単一点突然変異を補正するために使用され得ることが当事者によって理解されるであろう。最初の場合には、突然変異体AからIへの脱アミノ化によって突然変異が補正され、後者の場合には、突然変異体Tと塩基対を形成するAの脱アミノ化に続く1ラウンドの複製によって突然変異が補正される。
いくつかの実施形態において、本開示は、有意な数の非意図的な突然変異、例えば非意図的な点突然変異を生成することなく、核酸(例えば対象のゲノム内の核酸)において、意図される突然変異、例えば点突然変異を効率的に生成する塩基エディターを提供する。いくつかの実施形態において、意図される突然変異は、その意図される突然変異を生成するように特に設計された、ガイドポリヌクレオチド(例えばgRNA)に結合した特定の塩基エディター(例えばアデノシン塩基エディター)によって生成される突然変異である。いくつかの実施形態において、意図される突然変異は、疾患または障害に関連する突然変異である。いくつかの実施形態において、意図される突然変異は、疾患または障害に関連する、アデニン(A)からグアニン(G)への点突然変異である。いくつかの実施形態において、意図される突然変異は、疾患または障害に関連する、シトシン(C)からチミン(T)への点突然変異である。いくつかの実施形態において、意図される突然変異は、遺伝子のコード領域または非コード領域における、アデニン(A)からグアニン(G)への点突然変異である。いくつかの実施形態において、意図される突然変異は、遺伝子のコード領域または非コード領域における、シトシン(C)からチミン(T)への点突然変異である。いくつかの実施形態において、意図される突然変異は、終止コドン、例えば、遺伝子のコード領域内の未熟終止コドンを生成する点突然変異である。いくつかの実施形態において、意図される突然変異は、終止コドンを除去する突然変異である。
いくつかの実施形態において、本明細書において提供されるいずれかの塩基エディターは、1:1より大きい、意図される突然変異の非意図的な突然変異に対する比(例えば、意図される点突然変異:非意図的な点突然変異)を生成することができる。いくつかの実施形態において、本明細書において提供されるいずれかの塩基エディターは、少なくとも1.5:1、少なくとも2:1、少なくとも2.5:1、少なくとも3:1、少なくとも3.5:1、少なくとも4:1、少なくとも4.5:1、少なくとも5:1、少なくとも5.5:1、少なくとも6:1、少なくとも6.5:1、少なくとも7:1、少なくとも7.5:1、少なくとも8:1、少なくとも10:1、少なくとも12:1、少なくとも15:1、少なくとも20:1、少なくとも25:1、少なくとも30:1、少なくとも40:1、少なくとも50:1、少なくとも100:1、少なくとも150:1、少なくとも200:1、少なくとも250:1、少なくとも500:1、もしくは少なくとも1000:1、またはそれ以上の、意図される突然変異の非意図的な突然変異に対する比(例えば、意図される点突然変異:非意図的な点突然変異)を生成することができる。
塩基エディター効率の詳細は、国際PCT出願第PCT/2017/045381号(WO 2018/027078)およびPCT/US2016/058344号(WO 2017/070632)に記載されており、これらの各々は、その全体が参照により本明細書に組み込まれる。Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017); およびKomor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017)も参照のこと(これらの内容は、その全体が参照により本明細書に組み込まれる)。
いくつかの実施形態において、本明細書において提供される方法を使用した、1つまたは複数の遺伝子における複数の核酸塩基対の編集は、少なくとも1つの意図される突然変異の形成をもたらす。いくつかの実施形態において、前記少なくとも1つの意図される突然変異の前記形成は、疾患を引き起こす突然変異の正確な補正をもたらす。多重編集は、本明細書において提供される任意の方法または方法の組合せを使用して達成され得ることが理解されるべきである。
[病原性突然変異の正確な補正]
いくつかの実施形態において、意図される突然変異は、病原性突然変異または疾患を引き起こす突然変異の正確な補正である。病原性突然変異は、病原性一塩基多型(SNP)であるか、またはSNPによって引き起こされ得る。例えば、病原性突然変異は、遺伝子によってコードされるタンパク質におけるアミノ酸変化であり得る。別の例において、病原性突然変異は、遺伝子中の病原性SNPであり得る。正確な補正は、病原性突然変異をその野生型状態に戻すことであり得る。いくつかの実施形態において、病原性突然変異は、疾患または障害に関連するG→A点突然変異であり、AからGへの塩基エディター(ABE)による突然変異体A塩基の脱アミノ化は、疾患または障害に関連しない配列をもたらす。いくつかの実施形態において、病原性突然変異はC→T点突然変異である。C→T点突然変異は、例えば、AからGへの塩基エディター(ABE)を逆鎖にターゲティングし、病原性T核酸塩基の相補体Aを編集することにより、補正し得る。塩基エディターは、病原性SNPに、または病原性SNPの相補体にターゲティングされ得る。病原性または疾患を引き起こす突然変異および他の配列バリエーションの説明の命名法は、den Dunnen, J.T. and Antonarakis, S.E., “Mutation Nomenclature Extensions and Suggestions to Describe Complex Mutations: A Discussion.” Human Mutation 15:712 (2000)に記載されており、その全内容が参照により本明細書に組み込まれる。
特定の実施形態において、疾患または障害は、糖原病1型(GSD1またはVon Gierke病)である。いくつかの実施形態において、疾患または障害はGSD1aである。いくつかの実施形態において、病原性突然変異はG6PC遺伝子に存在する。いくつかの実施形態において、病原性突然変異はG6PC遺伝子のQ347Xである。いくつかの実施形態において、病原性突然変異はG6PC遺伝子のR83Cである。
[合成ライブラリー]
本明細書では、融合タンパク質ライブラリー、および標準塩基エディターと比較して代替的な好ましい塩基編集ウィンドウを可能にする塩基編集を最適化するようにそれを使用する方法を提供する。いくつかの実施形態において、本開示は、複数の融合タンパク質を含む最適化された塩基編集のためのタンパク質ライブラリーであって、複数の融合タンパク質の各々が、Cas9ポリペプチドのN末端断片およびC末端断片によって隣接されるデアミナーゼを含み、融合タンパク質の各々のN末端断片が、複数の融合タンパク質の残りのN末端断片とは異なるか、または融合タンパク質の各々のC末端断片が、複数の融合タンパク質の残りのC末端断片とは異なり、融合タンパク質の各々のデアミナーゼが、標的ポリヌクレオチド配列におけるプロトスペーサー隣接モチーフ(PAM)配列に近接する標的核酸塩基を脱アミノ化し、N末端断片またはC末端断片が標的ポリヌクレオチド配列に結合する、タンパク質ライブラリーを提供する。いくつかの実施形態において、CRISPR Rループ内の各核酸塩基について、複数の融合タンパク質のうちの少なくとも1つが、核酸塩基を脱アミノ化する。いくつかの実施形態において、PAM配列から1~20塩基対離れた標的ポリヌクレオチド内の各核酸塩基について、複数の融合タンパク質のうちの少なくとも1つが、核酸塩基を脱アミノ化する。いくつかの実施形態において、本明細書では、最適化された塩基編集を可能にする融合タンパク質ライブラリーを含むキットを提供する。
いくつかの実施形態において、アデノシンデアミナーゼアリル、例えば、TadAアリルの合成ライブラリーが、塩基編集効率および/または特異性が改変されたアデノシン塩基エディターを生成するために利用され得る。いくつかの実施形態において、合成ライブラリーから生成されたアデノシン塩基エディターは、より高い塩基編集効率および/または特異性を含む。いくつかの実施形態において、合成ライブラリーから生成されたアデノシン塩基エディターは、野生型TadAを用いるアデノシン塩基エディターと比較して、上昇した塩基編集効率、上昇した塩基編集特異性、低下したオフターゲット編集、低下したバイスタンダー編集、低下したインデル形成、および/または低下した偽性編集を示す。いくつかの実施形態において、合成ライブラリーから生成されたアデノシン塩基エディターは、TadA*7.10を用いるアデノシン塩基エディターと比較して、上昇した塩基編集効率、上昇した塩基編集特異性、低下したオフターゲット編集、低下したバイスタンダー編集、低下したインデル形成、および/または低下した偽性編集を示す。いくつかの実施形態において、合成ライブラリーは、ABEのランダム化されたTadA部分を含む。いくつかの実施形態において、合成ライブラリーは、TadAの各位置に20種すべての標準アミノ酸の置換を含む。いくつかの実施形態において、合成ライブラリーは、ライブラリーメンバー毎に平均頻度1~2のヌクレオチド置換突然変異を含む。いくつかの実施形態において、合成ライブラリーは、TadA*7.10に見出されるバックグラウンド突然変異を含む。
[送達システム]
[核酸塩基エディターおよびgRNAの、核酸に基づく送達]
本開示による塩基編集システムをコードする核酸は、in vitroまたはin vivoで、当技術分野で公知の方法により、または本明細書に記載されるように、対象に投与され得、または細胞に送達され得る。一実施形態において、核酸塩基エディターは、例えばベクター(例えばウイルスベクターまたは非ウイルスベクター)、ベクターに基づかない方法(例えば、裸のDNA、DNA複合体、脂質ナノ粒子の使用)、またはそれらの組合せによって送達され得る。
核酸塩基エディターをコードする核酸は、例えばトランスフェクションもしくはエレクトロポレーションによって、裸のDNAもしくはRNAとして細胞(例えば、造血細胞もしくはそれらの先駆体、造血幹細胞、および/または誘導性多能性幹細胞)に直接送達され得、または、標的細胞による取り込みを促進する分子(例えばN-アセチルガラクトサミン)に結合させ得る。本明細書に記載されるベクターなどの核酸ベクターも使用し得る。
核酸ベクターは、本明細書に記載される融合タンパク質のドメインをコードする1つまたは複数の配列を含み得る。ベクターはまた、タンパク質をコードする配列に関連する(例えば、挿入されているか、融合されている)シグナルペプチド(例えば、核局在化、核小体局在化、またはミトコンドリア局在化のためのもの)をコードする配列も含み得る。一例として、核酸ベクターは、1つまたは複数の核局在化配列(例えばSV40からの核局在化配列)を含むCas9コード配列と、アデノシンデアミナーゼバリアント(例えば、ABE8)とを含み得る。
核酸ベクターはまた、任意の適切な数の調節/制御エレメント、例えばプロモーター、エンハンサー、イントロン、ポリアデニル化シグナル、Kozakコンセンサス配列、または内部リボソームエントリー部位(IRES)を含み得る。これらのエレメントは当技術分野でよく知られている。造血細胞の場合、適切なプロモーターはIFNベータまたはCD45を含み得る。
本開示による核酸ベクターは、組換えウイルスベクターを含む。例示的なウイルスベクターは、本明細書中に記載される。当技術分野で知られる他のウイルスベクターも使用し得る。さらに、ウイルス粒子を用いて、核酸および/またはペプチドの形態の塩基編集システム構成要素を送達し得る。例えば、「空の」ウイルス粒子は、任意の適切なカーゴを含有するようにアセンブルされ得る。ウイルスベクターおよびウイルス粒子はまた、標的指向化リガンドを組み込んで標的組織特異性を変化させるように操作し得る。
ウイルスベクターに加えて、本開示によるゲノム編集システムをコードする核酸を送達するために非ウイルスベクターを使用し得る。非ウイルス核酸ベクターの1つの重要なカテゴリーは、有機または無機であり得るナノ粒子である。ナノ粒子は当技術分野でよく知られている。任意の適切なナノ粒子設計を用いて、ゲノム編集システム構成要素またはそのような構成要素をコードする核酸を送達し得る。例えば、有機(例えば、脂質および/またはポリマー)ナノ粒子が、本開示の特定の実施形態において送達ビヒクルとしての使用のために適切であり得る。ナノ粒子製剤、および/または遺伝子導入において使用するための例示的な脂質を、表11(下記)に示す。
Figure 2022519882000055
表12は、遺伝子導入および/またはナノ粒子製剤における使用のための例示的なポリマーを列記する。
Figure 2022519882000056
表13は、本明細書に記載される融合タンパク質をコードするポリヌクレオチドのための送達法を要約する。
Figure 2022519882000057
別の態様において、例えばCas9もしくはそのバリアントなどの核酸結合タンパク質および目的のゲノム核酸配列を標的化するgRNAのような、ゲノム編集システム構成要素またはそのような構成要素をコードする核酸の送達は、リボ核タンパク質(RNP)を細胞に送達することによって達成され得る。RNPは、標的化gRNAと複合体を形成した核酸結合タンパク質、例えば、Cas9を含む。RNPは、エレクトロポレーション、ヌクレオフェクション、またはカチオン性脂質媒介方法、例えば、Zuris, J.A. et al., 2015, Nat. Biotechnology, 33(1):73-80によって報告されているもののような、公知の方法を用いて細胞に送達し得る。RNPは、CRISPR塩基編集システムにおける使用のために有利であり、特に初代細胞のようなトランスフェクトが困難な細胞のために有利である。さらに、RNPは、細胞におけるタンパク質発現で起こり得る困難を軽減し得、特に、CRISPRプラスミドにおいて使用され得るCMVまたはEF1Aなどの真核生物プロモーターがよく発現されない場合にはそうである。有利なことに、RNPの使用は、細胞への外来DNAの送達を必要としない。さらに、核酸結合タンパク質およびgRNA複合体を含むRNPは、経時的に分解されるので、RNPの使用は、オフターゲット効果を制限する可能性を有する。プラスミドベースの技術の場合と同様の方法で、RNPは、結合タンパク質(例えばCas9バリアント)を送達するために、そして相同性依存修復(HDR)を導くために使用され得る。
核酸分子発現をコードする塩基エディターを駆動するために使用されるプロモーターは、AAV ITRを含み得る。これは、ベクター中のスペースを占領してしまい得る追加のプロモーターエレメントの必要性を排除するために有利であり得る。解放された追加のスペースは、ガイド核酸または選択マーカーなどの追加のエレメントの発現を駆動するために使用し得る。ITR活性は比較的弱いので、これは選択したヌクレアーゼの過剰発現による潜在的毒性を低下させるために使用し得る。
任意の適切なプロモーターを使用して、塩基エディターおよび、適切な場合には、ガイド核酸の発現を駆動し得る。遍在性発現のために使用し得るプロモーターとしては、CMV、CAG、CBh、PGK、SV40、フェリチン重鎖または軽鎖などが挙げられる。脳または他のCNS細胞での発現については、適切なプロモーターとしては、すべてのニューロンについてのシナプシンI、興奮性ニューロンについてのCaMKIIα、GABA作動性ニューロンについてのGAD67もしくはGAD65またはVGATなどが挙げられる。肝細胞での発現については、適切なプロモーターとしては、アルブミンプロモーターが挙げられる。肺細胞での発現については、適切なプロモーターとしては、SP-Bが挙げられる。内皮細胞については、適切なプロモーターはICAMが挙げられる。造血細胞については、適切なプロモーターはIFNベータまたはCD45が挙げられる。骨芽細胞については、適切なプロモーターはOG-2が挙げられる。
いくつかの実施形態において、本開示の塩基エディターは、同じ核酸分子内で別々のプロモーターが塩基エディターおよび適合性ガイド核酸の発現を駆動することを可能にするのに十分に小さいサイズである。例えば、ベクターまたはウイルスベクターは、塩基エディターをコードする核酸に作動可能に連結された第1のプロモーター、およびガイド核酸に作動可能に連結された第2のプロモーターを含み得る。
ガイド核酸の発現を駆動するために使用されるプロモーターには、U6またはH1などのPol IIIプロモーター、ならびにgRNAアデノ随伴ウイルス(AAV)を発現するためのPol IIプロモーターおよびイントロンのカセットの使用が含まれ得る。
[ウイルスベクター]
したがって、本明細書に記載される塩基エディターは、ウイルスベクターを用いて送達され得る。いくつかの実施形態において、本明細書に開示される塩基エディターは、ウイルスベクターに含まれる核酸上にコードされ得る。いくつかの実施形態において、塩基エディターシステムの1つまたは複数の構成要素は、1つまたは複数のウイルスベクター上にコードされ得る。例えば、塩基エディターおよびガイド核酸が、単一のウイルスベクター上にコードされ得る。他の実施形態において、塩基エディターおよびガイド核酸は、異なるウイルスベクター上にコードされる。いずれの場合にも、塩基エディターおよびガイド核酸は、各々、プロモーターおよびターミネーターに作動可能に連結され得る。ウイルスベクター上にコードされる構成要素の組合せは、選択されたウイルスベクターのカーゴサイズ制約によって決定され得る。
塩基エディターの送達のためのRNAまたはDNAウイルスベースのシステムの使用は、培養中または宿主中の特定の細胞にウイルスを標的指向化させ、ウイルスの積荷を核または宿主細胞ゲノムに輸送するための高度に進化したプロセスを利用する。ウイルスベクターは、培養中の細胞、患者(in vivo)に直接投与し得、または、それらを用いて細胞をin vitroで処理し得、その改変された細胞を任意で患者に投与し得る(ex vivo)。従来のウイルスベースのシステムは、遺伝子導入のためのレトロウイルス、レンチウイルス、アデノウイルス、アデノ随伴および単純ヘルペスウイルスベクターを含み得る。レトロウイルス、レンチウイルス、およびアデノ随伴ウイルスの遺伝子導入法では、宿主ゲノムへの組み込みが可能であり、挿入された導入遺伝子の長期発現を多くの場合もたらす。さらに、多くの異なる細胞型および標的組織において高い形質導入効率が観察されている。
ウイルスベクターは、レンチウイルス(例えば、HIVおよびFIVに基づくベクター)、アデノウイルス(例えば、AD100)、レトロウイルス(例えば、Maloneyマウス白血病ウイルス、MML-V)、ヘルペスウイルスベクター(例えば、HSV-2)、およびアデノ随伴ウイルス(AAV)、または他のプラスミドもしくはウイルスベクター型、特に、例えば、米国特許第8,454,972号(アデノウイルスの製剤、用量)、米国特許第8,404,658号(AAVの製剤、用量)、および米国特許第5,846,946号(DNAプラスミドの製剤、用量)からの製剤および用量、ならびにレンチウイルス、AAVおよびアデノウイルスが関わる臨床試験およびそれに関する出版物からの製剤および用量を使用するものを含み得る。例えば、AAVについては、投与経路、製剤および用量は、米国特許第8,454,972号およびAAVが関わる臨床試験におけるようにすることができる。アデノウイルスについては、投与経路、製剤および用量は、米国特許第8,404,658号およびアデノウイルスが関わる臨床試験におけるようにすることができる。プラスミド送達については、投与経路、製剤および用量は、米国特許第5,846,946号およびプラスミドが関わる臨床試験におけるようにすることができる。用量は、平均的な70kgの個体(例えば成人男性)に基づいて算出するか、またはそれに外挿し得、患者、対象、体重および種の異なる哺乳動物について調整し得る。投与の頻度は、年齢、性別、全般的な健康状態、患者または対象の他の状態および対処される特定の状態または症状を含む通常の要因に依存して、医学または獣医学の実施者(例えば医師、獣医師)の技量の範囲内である。ウイルスベクターは目的の組織に注射し得る。細胞型特異的塩基編集のために、塩基エディターおよび任意のガイド核酸の発現を、細胞型特異的プロモーターによって駆動し得る。
レトロウイルスの指向性は、外来のエンベロープタンパク質を組み込み、標的細胞の潜在的な標的集団を拡大することによって変化させ得る。レンチウイルスベクターは、非分裂細胞を形質導入または感染させることができ、典型的には高いウイルス力価を産生するレトロウイルスベクターである。したがって、レトロウイルス遺伝子導入系の選択は標的組織に依存する。レトロウイルスベクターは、6~10kbまでの外来配列のパッケージング能力を有するシス作用性の長い末端反復から構成される。最小シス作用性LTRは、ベクターの複製およびパッケージングのために十分であり、次いでそれを用いて治療遺伝子が標的細胞に組み込まれ、永続的な導入遺伝子発現が提供される。広く使用されているレトロウイルスベクターには、マウス白血病ウイルス(MuLV)、テナガザル白血病ウイルス(GaLV)、サル免疫不全ウイルス(SIV)、ヒト免疫不全ウイルス(HIV)、およびそれらの組合せに基づくものが含まれる(例えばBuchscher et al., J. Virol. 66:2731-2739 (1992); Johann et al., J. Virol. 66:1635-1640 (1992); Sommnerfelt et al., Virol. 176:58-59 (1990); Wilson et al., J. Virol. 63:2374-2378 (1989); Miller et al., J. Virol. 65:2220-2224 (1991); PCT/US94/05700参照)。
レトロウイルスベクター、特にレンチウイルスベクターは、標的細胞への効率的な組み込みのために所定の長さより小さいポリヌクレオチド配列を必要とし得る。例えば、9kbを超える長さのレトロウイルスベクターは、より小さいサイズのものと比較して低いウイルス力価をもたらし得る。いくつかの態様において、本開示の塩基エディターは、レトロウイルスベクターを介して効率的なパッケージングおよび標的細胞への送達を可能にするのに十分なサイズである。いくつかの実施形態において、塩基エディターは、ガイド核酸および/または標的指向化可能なヌクレアーゼ系の他の構成要素と共に発現された場合でも、効率的なパッキングおよび送達を可能にするサイズである。
一過性発現が好ましい用途では、アデノウイルスベースのシステムを使用し得る。アデノウイルスベースのベクターは、多くの細胞型において非常に高い形質導入効率が可能であり、細胞分裂を必要としない。このようなベクターでは、高い力価および発現レベルが得られている。このベクターは比較的簡単なシステムで大量に生成し得る。アデノ随伴ウイルス(「AAV」)ベクターもまた、例えば核酸およびペプチドのin vitro生成において、ならびにin vivoおよびex vivoの遺伝子治療手順のために、標的核酸を細胞に形質導入するために使用され得る(例えば、West et al., Virology 160:38-47 (1987); 米国特許第4,797,368号; WO 93/24641; Kotin, Human Gene Therapy 5:793-801 (1994); Muzyczka, J. Clin. Invest. 94:1351 (1994)を参照)。組換えAAVベクターの構築は、米国特許第5,173,414号; Tratschin et al., Mol. Cell. Biol. 5:3251-3260 (1985); Tratschin, et al., Mol. Cell. Biol. 4:2072-2081 (1984); Hermonat & Muzyczka, PNAS 81:6466-6470 (1984); およびSamulski et al., J. Virol. 63:03822-3828 (1989)を含む多くの刊行物に記載されている。
AAVはパルボウイルスファミリーに属する小さな一本鎖DNA依存性ウイルスである。4.7 kbの野生型 (wt) AAVゲノムは、それぞれ四つの複製タンパク質および三つのキャプシドタンパク質をコードする二つの遺伝子からなり、両側に145 bpの逆方向末端反復配列 (ITR) がある。ビリオンは三つのキャプシドタンパク質Vp1、Vp2およびVp3から成り、これらは同じオープンリーディングフレームから1:1:10比で産生されるが、異なるスプライシング (Vp1) および選択的翻訳開始部位(Vp2とVp3のそれぞれ)から産生される。Vp3はビリオン中に最も豊富に存在するサブユニットであり、細胞表面での受容体認識に関与し、ウイルスの指向性を規定する。ウイルス感染性に機能するホスホリパーゼドメインがVp1のユニークなN末端に同定されている。
組換えAAV(rAAV)は、wt AAVと同様に、ベクター導入遺伝子カセットを挟むシス作用性145-bp ITRを利用し、外来DNAのパッケージングのために最大4.5kbを提供する。感染後、rAAVは本発明の融合タンパク質を発現し得、環状の頭・尾コンカテマーの状態のエピソームとして存在することにより、宿主ゲノムに組み込まれることなく存続し得る。このシステムを用いたrAAVの成功例は数多くあるが、in vitroおよびin vivoでは、パッケージング能力が限られているため、遺伝子のコード配列の長さがwt AAVゲノムの長さ以上である場合にAAV媒介遺伝子送達の使用が制限されている。
ウイルスベクターは用途に基づいて選択し得る。例えば、in vivo遺伝子送達の場合、AAVが他のウイルスベクターよりも有利であり得る。いくつかの実施形態において、AAVは低い毒性を可能にする。毒性は、免疫応答を活性化し得る細胞粒子の超遠心分離を必要としない精製方法に起因し得る。いくつかの実施形態において、AAVは、宿主ゲノムに組み込まれないため、挿入突然変異を引き起こす確率の低さを可能にする。アデノウイルスは一般的に、それらが誘導する強い免疫原性応答のため、ワクチンとして使用されている。ウイルスベクターのパッケージング能力は、ベクターにパッケージングされ得る塩基エディターのサイズを制限し得る。
AAVは、2つの145塩基の逆方向末端反復配列(ITR)を含め、約4.5Kbまたは4.75Kbのパッケージング能力を有する。これは、本開示の塩基エディターならびにプロモーターおよび転写ターミネーターが単一のウイルスベクターに収まり得ることを意味する。4.5 Kbまたは4.75 Kbを超える構築物は、ウイルス産生を有意に減少させ得る。例えば、SpCas9は非常に大きく、遺伝子自体が4.1 Kbを超え、AAVに詰め込むことが困難であるため、本開示の実施形態は、従来の塩基エディターよりも短い長さの開示された塩基エディターを利用することを含む。いくつかの例では、塩基エディターは4 kb未満である。開示される塩基エディターは、4.5 kb、4.4 kb、4.3 kb、4.2 kb、4.1 kb、4 kb、3.9 kb、3.8 kb、3.7 kb、3.6 kb、3.5 kb、3.4 kb、3.3 kb、3.2 kb、3.1 kb、3 kb、2.9 kb、2.8 kb、2.7 kb、2.6 kb、2.5 kb、2 kb、または1.5 kb未満であり得る。いくつかの実施形態において、開示された塩基エディターは、長さが4.5 kb以下である。
AAVは、AAV1、AAV2、AAV5、またはそれらの任意の組合せであり得る。標的とする細胞に関してAAVのタイプを選択することができる。例えば、AAV血清型1、2、5またはハイブリッドキャプシドAAV1、AAV2、AAV5またはそれらの任意の組合せを選択して、脳または神経細胞を標的化することができる;また、心臓組織を標的とするAAV4を選択することができる。AAV8は肝臓への送達に有用である。これらの細胞に関する特定のAAV血清型の表は、Grimm, D. et al, J. Virol. 82: 5887-5911 (2008)に見出され得る。
レンチウイルスは複雑なレトロウイルスであり、有糸分裂細胞と有糸分裂後細胞の両方に感染してその遺伝子を発現する能力を有する。最も一般的に知られているレンチウイルスはヒト免疫不全ウイルス(HIV)であり、これは広範囲の細胞型を標的化するために他のウイルスのエンベロープ糖タンパク質を使用する。
レンチウイルスは以下のように調製し得る。pCasES10(レンチウイルストランスファープラスミド骨格を含む)をクローニングした後、低継代(p=5)のHEK293FTを、T-75フラスコ中に播種し、抗生物質なしで、10%ウシ胎児血清を含むDMEM中でトランスフェクションの前日に50%コンフルエンスにした。20時間後、培地をOptiMEM(無血清)培地に変え、トランスフェクションを4時間後に行った。10μgのレンチウイルストランスファープラスミド(pCasES10)および以下のパッケージングプラスミド: 5μgのpMD2.G(VSV-g偽型)および7.5μgのpsPAX2(gag/pol/rev/tat)を細胞にトランスフェクトする。トランスフェクションは、4mLのOptiMEM中でカチオン性脂質送達剤(50μlのLipofectamine 2000および100μlのプラス試薬)を用いて行い得る。6時間後、培地を10%ウシ胎児血清を含む抗生物質不含DMEMに変更する。これらの方法は細胞培養中に血清を用いるが、無血清法が好ましい。
レンチウイルスは以下のように精製し得る。ウイルス上清を48時間後に回収する。上清からまずデブリを除去し、0.45μm低タンパク質結合(PVDF)フィルターを通して濾過する。次いで、これらを24,000rpmで2時間超遠心機で遠心する。ウイルスペレットを50μlのDMEM中に4℃で一晩再懸濁する。次いでそれらを等分し、直ちに-80℃で凍結する。
別の実施形態では、ウマ感染性貧血ウイルス(EIAV)に基づく最小の非霊長類レンチウイルスベクターも考えられる。別の実施形態では、血管静止タンパク質エンドスタチンおよびアンジオスタチンを発現するウマ感染性貧血ウイルスに基づくレンチウイルス遺伝子治療ベクター、RetinoStat(登録商標)を、網膜下注射を介して送達することが考えられる。別の実施形態では、自己不活化レンチウイルスベクターの使用が考えられる。
システムの任意のRNA、例えばガイドRNAまたは塩基エディターをコードするmRNAは、RNAの形態で送達され得る。塩基エディターをコードするmRNAは、in vitro転写を使用して生成され得る。例えば、ヌクレアーゼmRNAは、以下のエレメントを含むPCRカセットを用いて合成され得る: T7プロモーター、任意でKozak配列(GCCACC)、ヌクレアーゼ配列、およびβグロビン-ポリAテールからの3’UTRのような3’UTR。このカセットは、T7ポリメラーゼによる転写に使用され得る。ガイドポリヌクレオチド(例えばgRNA)もまた、in vitro転写を用いて、T7プロモーター、次いで配列「GG」、およびガイドポリヌクレオチド配列を含有するカセットから転写され得る。
発現を増強し、毒性の可能性を低下させるために、塩基エディターをコードする配列および/またはガイド核酸は、1つまたは複数の修飾ヌクレオシドを含むように、例えば擬似Uまたは5-メチル-Cを使用して、修飾され得る。
AAVベクターの小さいパッケージング能力は、このサイズを超える多数の遺伝子の送達および/または大きな生理学的調節エレメントの使用を困難にする。これらの課題は、例えば、送達されるタンパク質を2つ以上の断片に分割することによって対処することができ、ここで、N末端断片を分割インテイン-Nに融合し、C末端断片を分割インテイン-Cに融合する。そしてこれらの断片を2つ以上のAAVベクターにパッケージングする。本明細書で使用される場合、「インテイン」とは、隣接するN末端エクステインおよびC末端エクステイン(例えば、繋げようとする断片)をライゲートする自己スプライシングタンパク質イントロン(例えばペプチド)を指す。異種タンパク質断片を繋げるための特定のインテインの使用は、例えば、Wood et al., J. Biol. Chem. 289(21); 14512-9 (2014)に記載されている。例えば、インテインIntNおよびIntCは、別々のタンパク質断片に融合された場合、互いを認識して、自身をスプライスして排出し、それと同時に、融合している上記タンパク質断片の隣接するN末端エクステインおよびC末端エクステインをライゲートして、それによって2つのタンパク質断片から完全長タンパク質を再構成する。他の適切なインテインは当業者に明らかであろう。
本発明の融合タンパク質の断片は、長さを変え得る。いくつかの実施形態において、タンパク質断片は、長さが2アミノ酸~約1000アミノ酸の範囲である。いくつかの実施形態において、タンパク質断片は、長さが約5アミノ酸~約500アミノ酸の範囲である。いくつかの実施形態において、タンパク質断片は、長さが約20アミノ酸~約200アミノ酸の範囲である。いくつかの実施形態において、タンパク質断片は、長さが約10アミノ酸~約100アミノ酸の範囲である。他の長さの適切なタンパク質断片は、当業者には明らかであろう。
一実施形態において、大きな導入遺伝子発現カセットを2つの別々の半分(5’および3’末端、またはヘッドおよびテール)に分割することによって二重AAVベクターが生成され、カセットの各半分が単一のAAVベクター(5kb未満)内にパッケージングされる。次いで、両方の二重AAVベクターによる同一細胞の同時感染に続いて、(1)5’および3’ゲノム(二重AAV重複ベクター)間の相同組換え(HR)、(2)ITRを介した5’および3’ゲノム(二重AAVトランススプライシングベクター)の尾・頭コンカテマー化、または(3)それら2つのメカニズムの組合せ(二重AAVハイブリッドベクター)により、完全長導入遺伝子発現カセットの再構築が達成される。in vivoでの二重AAVベクターの使用は完全長タンパク質の発現をもたらす。二重AAVベクタープラットフォームの使用は、>4.7kbのサイズの導入遺伝子のための効率的で実行可能な遺伝子導入戦略を表す。
[インテイン]
いくつかの実施形態において、ヌクレアーゼ(例えばCas9)の一部分または断片は、インテインに融合される。ヌクレアーゼは、インテインのN末端またはC末端に融合され得る。いくつかの実施形態において、融合タンパク質の一部分または断片は、インテインに融合され、AAVキャプシドタンパク質に融合される。インテイン、ヌクレアーゼおよびキャプシドタンパク質は、任意の配置(例えば、ヌクレアーゼ-インテイン-キャプシド、インテイン-ヌクレアーゼ-キャプシド、キャプシド-インテイン-ヌクレアーゼなど)で一緒に融合され得る。いくつかの実施形態において、インテインのN末端は融合タンパク質のC末端に融合され、インテインのC末端はAAVキャプシドタンパク質のN末端に融合される。
インテイン(介在タンパク質)は、多種多様な生物に見出される自己プロセシングドメインであり、タンパク質スプライシングとして知られるプロセスを行うものである。タンパク質スプライシングは、ペプチド結合の切断と形成の両方からなる多段階の生化学的反応である。タンパク質スプライシングの内因性基質は、インテインを含む生物に見出されるタンパク質であるが、インテインはまた、実質的にあらゆるポリペプチド骨格を化学的に操作するために使用することもできる。
タンパク質スプライシングでは、インテインは、二つのペプチド結合を切断することによって一前駆体ポリペプチドから自身を切り出し、それによって、隣接するエクステイン(外部タンパク質)配列を、新しいペプチド結合の形成を介して連結する。この転位は翻訳後に起こる(翻訳と同時に起こる可能性もある)。インテイン媒介性タンパク質スプライシングは自発的に起こり、インテインドメインの折りたたみだけを必要とする。
インテインの約5%が分割インテインであり、これらはN-インテインとC-インテインという二つの別々のポリペプチドとして転写され翻訳され、その各々が一つのエクステインに融合している。翻訳の際に、インテイン断片は、自発的にかつ非共有結合的に標準インテイン構造へとアセンブルし、トランスにタンパク質スプライシングを行う。タンパク質スプライシングの機序には一連のアシル転移反応が関わっており、これが、インテイン-エキステイン接合部における2つのペプチド結合の切断と、N-エキステインとC-エキステインの間の新しいペプチド結合の形成とをもたらす。このプロセスは、N‐エクステインとインテインのN‐末端とを繋げるペプチド結合の活性化によって開始される。事実上すべてのインテインは、N末端にシステインまたはセリンを有し、これがN-エクステインのC末端残基のカルボニル炭素を攻撃する。このNからO/Sへのアシル基の移動は、保存されたトレオニンとヒスチジン(TXXHモチーフと呼ばれる)、および一般的に見出されるアスパラギン酸によって促進され、直鎖状 (チオ)エステル中間体の形成をもたらす。次に、この中間体は、システイン、セリン、またはトレオニンであるC-エクステインの最初の残基 (+1) の求核攻撃によってトランス-(チオ)エステル化される。生成した分枝 (チオ)エステル中間体は、インテインの高度に保存されたC末端アスパラギンの環化というユニークな変換によって、解消される。この過程は、ヒスチジン(高度に保存されたHNFモチーフに見出されるもの)と最後から2番目のヒスチジンによって促進され、アスパラギン酸も関与し得る。このスクシンイミド生成反応は、反応複合体からインテインを切除し、非ペプチド結合を介して結合されたエクステインを残す。この構造は、インテイン非依存的態様で迅速に転位し、安定なペプチド結合になる。
いくつかの実施形態では、塩基エディター(例えばABE、CBE)のN末端断片が分割インテイン-Nに融合され、C末端断片が分割インテイン-Cに融合される。そしてこれらの断片を2つ以上のAAVベクターにパッケージングする。異種タンパク質断片を連結するための特定のインテインの使用は、例えば、Wood et al., J. Biol. Chem. 289(21); 14512-9 (2014)に記載されている。例えば、インテインIntNおよびIntCは、別々のタンパク質断片に融合された場合、互いを認識して、自身をスプライスして排出し、それと同時に、融合している上記タンパク質断片の隣接するN-およびC-末端エクステインをライゲートして、それによってそれによって2つのタンパク質断片から完全長タンパク質を再構成する。他の適切なインテインは当業者に明らかであろう。
いくつかの実施形態において、ABEは、SpCas9の選択された領域内のAla、Ser、Thr、またはCys残基において、N末端断片およびC末端断片に分割された。これらの領域は、Cas9結晶構造解析により同定されたループ領域に対応する。各断片のN-末端をインテイン-Nに融合させ、各断片のC-末端を、アミノ酸位置S303、T310、T313、S355、A456、S460、A463、T466、S469、T472、T474、C574、S577、A589、およびS590(下記配列で太字の大文字で示されている)においてインテインCに融合させた。
1 mdkkysigld igtnsvgwav itdeykvpsk kfkvlgntdr hsikknliga llfdsgetae
61 atrlkrtarr rytrrknric ylqeifsnem akvddsffhr leesflveed kkherhpifg
121 nivdevayhe kyptiyhlrk klvdstdkad lrliylalah mikfrghfli egdlnpdnsd
181 vdklfiqlvq tynqlfeenp inasgvdaka ilsarlsksr rlenliaqlp gekknglfgn
241 lialslgltp nfksnfdlae daklqlskdt ydddldnlla qigdqyadlf laaknlsdai
301 llSdilrvnT eiTkaplsas mikrydehhq dltllkalvr qqlpekykei ffdqSkngya
361 gyidggasqe efykfikpil ekmdgteell vklnredllr kqrtfdngsi phqihlgelh
421 ailrrqedfy pflkdnreki ekiltfripy yvgplArgnS rfAwmTrkSe eTiTpwnfee
481 vvdkgasaqs fiermtnfdk nlpnekvlpk hsllyeyftv yneltkvkyv tegmrkpafl
541 sgeqkkaivd llfktnrkvt vkqlkedyfk kieCfdSvei sgvedrfnAS lgtyhdllki
601 ikdkdfldne enedilediv ltltlfedre mieerlktya hlfddkvmkq lkrrrytgwg
661 rlsrklingi rdkqsgktil dflksdgfan rnfmqlihdd sltfkediqk aqvsgqgdsl
721 hehianlags paikkgilqt vkvvdelvkv mgrhkpeniv iemarenqtt qkgqknsrer
781 mkrieegike lgsqilkehp ventqlqnek lylyylqngr dmyvdqeldi nrlsdydvdh
841 ivpqsflkdd sidnkvltrs dknrgksdnv pseevvkkmk nywrqllnak litqrkfdnl
901 tkaergglse ldkagfikrq lvetrqitkh vaqildsrmn tkydendkli revkvitlks
961 klvsdfrkdf qfykvreinn yhhahdayln avvgtalikk ypklesefvy gdykvydvrk
1021 miakseqeig katakyffys nimnffktei tlangeirkr plietngetg eivwdkgrdf
1081 atvrkvlsmp qvnivkktev qtggfskesi lpkrnsdkli arkkdwdpkk yggfdsptva
1141 ysvlvvakve kgkskklksv kellgitime rssfeknpid fleakgykev kkdliiklpk
1201 yslfelengr krmlasagel qkgnelalps kyvnflylas hyeklkgspe dneqkqlfve
1261 qhkhyldeii eqisefskrv iladanldkv lsaynkhrdk pireqaenii hlftltnlga
1321 paafkyfdtt idrkrytstk evldatlihq sitglyetri dlsqlggd
[突然変異を標的化するための核酸塩基エディターの使用]
突然変異を標的化する核酸塩基エディターの適合性は、本明細書に記載されるように評価される。一実施形態において、目的の単一細胞は、塩基編集システムを、レポーター(例えば、GFP)をコードする少量のベクターと共に形質導入される。これらの細胞は、293T、K562またはU20Sなどの不死化ヒト細胞株を含め、当技術分野で知られる任意の細胞株であり得る。あるいは、初代細胞(例えば、ヒト)を使用し得る。そのような細胞は、最終的な細胞標的に関連したものであり得る。
送達は、ウイルスベクターを用いて実施され得る。一実施形態において、トランスフェクションは、脂質トランスフェクション(LipofectamineまたはFugeneなど)を用いて、またはエレクトロポレーションによって実施され得る。トランスフェクション後、GFPの発現を蛍光顕微鏡またはフローサイトメトリーのいずれかによって決定して、一貫した高レベルのトランスフェクションを確認し得る。最も高い活性を与えるエディターの組合せを決定するために、これらの予備的なトランスフェクションは異なる複数の核酸塩基エディターを含み得る。
核酸塩基エディターの活性は、本明細書に記載されるように、すなわち細胞のゲノムを配列決定して標的配列の変化を検出することによって評価される。サンガー配列決定のためには、精製されたPCRアンプリコンをプラスミド骨格中にクローニングし、形質転換し、ミニプレップし、単一のプライマーで配列決定する。配列決定はまた、次世代配列決定技術を用いて実施され得る。次世代配列決定を使用する場合、アンプリコンは、意図される切断部位が非対称に配置された300~500bpであり得る。PCRに続いて、次世代配列決定のアダプターおよびバーコード(例えば、Illumina multiplexアダプターとインデックス)をアンプリコンの末端に付加し得る(例えば高スループット配列決定(例えばIllumina MiSeq上でのもの)で使用するために)。
最初の試験で最大レベルの標的特異的変化を誘導する融合タンパク質を、さらなる評価のために選択し得る。
特定の実施形態では、核酸塩基エディターを用いて、目的のポリヌクレオチドを標的化する。一実施形態において、本発明の核酸塩基エディターは、細胞のゲノムにおける目的の突然変異を標的化するために使用されるガイドRNAと併せて細胞(例えば、造血細胞もしくはそれらの先駆体、造血幹細胞、および/または誘導性多能性幹細胞)に送達され、それにより、突然変異を変化させる。いくつかの実施形態において、塩基エディターは、目的の遺伝子の配列に対する1つまたは複数の編集を導入するように、ガイドRNAによってターゲティングされる。
システムは、1つまたは複数の異なるベクターを含み得る。一態様において、塩基エディターは、所望の細胞型、優先的には真核細胞、好ましくは哺乳動物細胞またはヒト細胞の発現のためにコドン最適化される。
一般に、コドン最適化とは、目的の宿主細胞における発現を増強するために、天然配列の少なくとも一つのコドン(例えば約1個、2個、3個、4個、5個、10個、15個、20個、25個、50個以上のコドン)を、天然アミノ酸配列を維持しながら、その宿主細胞の遺伝子においてより頻繁にまたは最も頻繁に使用されるコドンで置換することによって、核酸配列を改変するプロセスをいう。様々な種は特定のアミノ酸の特定のコドンについて特定の偏りを示す。コドンバイアス(生物間のコドン利用の違い)は、メッセンジャーRNA (mRNA) の翻訳効率としばしば相関し、それは特に、翻訳されるコドンの性質および特定のトランスファーRNA (tRNA) 分子の利用可能性に依存すると考えられている。細胞内の選択されたtRNAの優位性は、一般にペプチド合成で最も頻繁に使われるコドンを反映している。従って、遺伝子は、コドン最適化に基づいて、所与の生物における最適な遺伝子発現に合わせて調整することができる。コドン使用表は、例えば、「コドン使用データベース」www.kazusa.orjp/codon/ (2002年7月9日に訪問した)で容易に入手可能であり、これらの表は、多くの方法で適合させることができる。Nakamura, Y., et al. "Codon usage tabulated from the international DNA sequence databases: status for the year 2000" Nucl. Acids Res. 28:292 (2000)参照。例えばGene Forge (Aptagen; Jacobus, Pa.)のような、特定の宿主細胞における発現のために特定の配列をコドン最適化するためのコンピュータアルゴリズムも利用可能である。ある態様において、操作されたヌクレアーゼをコードする配列中の一つ以上のコドン(例えば1、2、3、4、5、10、15、20、25、50以上、または全てのコドン)は、特定のアミノ酸について最も頻繁に使用されるコドンに対応する。
パッケージング細胞は、典型的には、宿主細胞に感染し得るウイルス粒子を形成するために使用される。そのような細胞は、アデノウイルスをパッケージングする293細胞、およびレトロウイルスをパッケージングするpsi.2細胞またはPA317細胞を含む。遺伝子治療に使用されるウイルスベクターは、通常、核酸ベクターをウイルス粒子にパッケージする細胞株を作製することによって生成される。ベクターは、典型的には、パッケージングおよびその後の宿主への組み込みに必要な最小のウイルス配列を含み、他のウイルス配列は、発現されるべきポリヌクレオチドのための発現カセットによって置き換えられる。欠けているウイルス機能は、典型的にはパッケージング細胞株によってトランスに供給される。例えば、遺伝子治療に使用されるAAVベクターは、典型的には、パッケージングおよび宿主ゲノムへの組み込みに必要なAAVゲノムからのITR配列のみを有する。ウイルスDNAは、他のAAV遺伝子、すなわちrepおよびcapをコードするがITR配列を欠くヘルパープラスミドを含む細胞株においてパッケージングされ得る。細胞株は、ヘルパーとしてのアデノウイルスによっても感染され得る。ヘルパーウイルスは、AAVベクターの複製およびヘルパープラスミドからのAAV遺伝子の発現を促進することができる。場合によっては、ヘルパープラスミドは、ITR配列の欠如のために、有意な量ではパッケージングされない。アデノウイルスによる汚染は、例えばAAVよりもアデノウイルスの方が感受性である熱処理によって減少させることができる。
[医薬組成物]
本開示の他の態様は、本明細書に記載される塩基エディター、融合タンパク質、または融合タンパク質-ガイドポリヌクレオチド複合体のいずれかを含む医薬組成物に関する。用語「医薬組成物」は、本明細書中で使用される場合、薬学的使用のために処方される組成物を指す。いくつかの態様において、薬学的組成物は、薬学的に許容される担体をさらに含む。ある態様において、薬学的組成物は、さらなる剤(例えば特異的送達、半減期の延長のためのもの、または他の治療化合物)を含む。
本明細書で使用されるところの用語「薬学的に許容される担体」は、液体または固体の充填剤、希釈剤、賦形剤、製造助剤(例えば潤滑剤、タルクマグネシウム、ステアリン酸カルシウムまたはステアリン酸亜鉛、あるいはステアリン酸)、または溶媒カプセル化材料などの、身体のある部位(例えば送達部位)から別の部位(例えば器官、組織または身体の一部)への化合物の運搬または輸送に関与する薬学的に許容される材料、組成物またはビヒクルを意味する。薬学的に許容される担体は、製剤の他の成分と適合し、対象の組織に有害でないという意味で許容される(例えば生理的適合性、無菌性、生理的pH等)。
薬学的に許容される担体として役立つことができる物質のいくつかの非限定的な例は、以下を含む: (1) ラクトース、グルコースおよびスクロースのような糖;(2) コーンスターチ、ジャガイモでん粉等のでん粉;(3) セルロースおよびその誘導体 (カルボキシメチルセルロースナトリウム、メチルセルロース、エチルセルロース、微結晶セルロース、酢酸セルロース等);(4) トラガント末;(5) モルト;(6)ゼラチン;(7) ステアリン酸マグネシウム、ラウリル硫酸ナトリウム、タルク等の潤滑剤;(8) ココアバター、坐剤用ワックス等の添加剤;(9) 落花生油、綿実油、ベニバナ油、ゴマ油、オリーブ油、コーン油、大豆油等の油;(10) プロピレングリコール等のグリコール;(11) ポリオール、例えばグリセリン、ソルビトール、マンニトールおよびポリエチレングリコール (PEG); (12) エステル、例えばオレイン酸エチルおよびラウリン酸エチルなど;(13) 寒天;(14) 水酸化マグネシウム、水酸化アルミニウム等の緩衝剤;(15) アルギン酸;(16) パイロジェンフリー水;(17) 生理食塩液;(18) リンガー液;(19)エチルアルコール;(20) pH緩衝液;(21) ポリエステル、ポリカーボネートおよび/またはポリ無水物;(22) ポリペプチドおよびアミノ酸のような増量剤 (23) エタノールのような血清アルコール;および (23) 製剤に使用される他の非毒性適合性物質。湿潤剤、着色剤、離型剤、コーティング剤、甘味剤、風味料、香料、保存剤および抗酸化剤も製剤中に存在させることができる。「賦形剤」、「担体」、「薬学的に許容される担体」、「ビヒクル」などの用語は、本明細書では交換可能に使用される。
薬学的組成物は、約5.0~約8.0の範囲などの生理学的pHを反映する所定のレベルに製剤のpHを維持するために、一つ以上のpH緩衝化合物を含むことができる。水性液体製剤で使用されるpH緩衝化合物は、アミノ酸またはヒスチジンなどのアミノ酸の混合物、またはヒスチジンおよびグリシンなどのアミノ酸の混合物であり得る。いくつかの態様において、pH緩衝化合物は、製剤のpHを所定のレベル、例えば約5.0~約8.0の範囲に維持し、カルシウムイオンをキレートしない剤である。このようなpH緩衝化合物の典型的な例としては、イミダゾールおよび酢酸イオンが挙げられるが、これらに限定されない。pH緩衝化合物は、製剤のpHを所定のレベルに維持するのに適した任意の量で存在し得る。
薬学的組成物はまた、一つ以上の浸透圧調節剤、すなわち、処方物の浸透圧特性(例えば、等張性、オスモラリティ、および/または浸透圧)をレシピエント個体の血流および血液細胞にとって許容可能なレベルに調節する化合物を含有することができる。浸透圧調節剤は、カルシウムイオンをキレートしない薬剤であり得る。浸透圧調節剤は、製剤の浸透圧特性を調節する当業者に公知または入手可能な任意の化合物であり得る。当業者は、本発明の処方における使用のための所定の浸透圧調節剤の適合性を経験的に決定することができる。適切なタイプの浸透圧調節剤の例示的な例としては、塩化ナトリウムおよび酢酸ナトリウムのような塩;スクロース、デキストロース、マンニトールなどの糖;グリシンなどのアミノ酸;これらの薬剤および/または薬剤タイプの1つ以上の混合物が挙げられるが、これらに限定されない。浸透圧調節剤は、製剤の浸透圧特性を調節するのに十分な任意の濃度で存在し得る。
いくつかの態様において、薬学的組成物は、対象への送達のために、例えば遺伝子編集のために製剤化される。本明細書に記載の医薬組成物を投与する適切な経路は、限定されるものではないが、局所、皮下、後頭下、経皮、皮内、病巣内、関節内、腹腔内、膀胱内、経粘膜、歯肉、歯内、蝸牛内、経鼓膜、器官内、硬膜外、髄腔内、筋肉内、静脈内、血管内、骨内、眼周囲、腫瘍内、脳内、および脳室内投与を含む。
いくつかの態様において、本明細書に記載される薬学的組成物は、患部(例えば腫瘍部位)に局所的に投与される。いくつかの実施形態において、本明細書に記載される薬学的組成物は、注射、カテーテル、坐剤、またはインプラントによって、対象に投与され、インプラントは、多孔質、非多孔質、またはゼラチン質材料であり、例えば、シアラスティック膜、または繊維などの膜を含む。
他の態様において、本明細書に記載される薬学的組成物は、制御放出システムにおいて送達される。一実施形態では、ポンプを使用することができる(例えばLanger, 1990, Science 249: 1527-1533; Sefton, 1989, CRC Crit. Ref. Biomed. Eng. 14:201; Buchwald et al., 1980, Surgery 88:507; Saudek et al., 1989, N. Engl. J. Med. 321:574参照)。別の実施形態では、ポリマー材料を使用することができる。(例えばMedical Applications of Controlled Release (Langer and Wise eds., CRC Press, Boca Raton, Fla., 1974); Controlled Drug Bioavailability, Drug Product Design and Performance (Smolen and Ball eds., Wiley, New York, 1984); Ranger and Peppas, 1983, Macromol. Sci. Rev. Macromol. Chem. 23:61. See also Levy et al., 1985, Science 228: 190; During et al., 1989, Ann. Neurol. 25:351; Howard et ah, 1989, J. Neurosurg. 71: 105.)。他の制御放出システムは、例えば、上記Langerに記載されている。
いくつかの態様において、薬学的組成物は、対象、例えばヒトへの静脈内または皮下投与に適合された組成物として、ルーチンの手順に従って製剤化される。いくつかの態様において、注射による投与のための医薬組成物は、可溶化剤としての無菌等張使用の溶液および注射部位の痛みを緩和するためのリグノカインなどの局所麻酔薬である。一般に、成分は、単位投与形態、例えば、活性剤の量を示すアンプルまたはサシェットのような密閉容器内の乾燥凍結乾燥粉末または水を含まない濃縮物として、別々にまたは一緒に供給される。薬剤が注入によって投与される場合には、無菌の医薬グレードの水または生理食塩水を含む注入ボトルを用いてそれを分注することができる。医薬組成物が注射によって投与される場合、投与前に成分を混合することができるように、注射用滅菌水または生理食塩水のアンプルを提供することができる。
全身投与のための医薬組成物は、液体、例えば滅菌生理食塩水、乳酸化リンゲル液またはハンク液であり得る。さらに、医薬組成物は、固体形態であって、使用の直前に再溶解または懸濁され得る。凍結乾燥形態もまた考えられる。医薬組成物は、非経口投与にも適した、リポソームまたは微結晶などの脂質粒子または小胞内に含有することができる。粒子は、組成物がその中に含まれる限り、単ラメラまたは複数ラメラのような任意の適切な構造であり得る。化合物は、融合性脂質ジオレオイルホスファチジルエタノールアミン(DOPE)、低量(5-10モル%)のカチオン性脂質を含み、ポリエチレングリコール (PEG) コーティングにより安定化された、「安定化プラスミド脂質粒子」(SPLP)中に捕捉され得る (Zhang Y. P. et ah, Gene Ther. 1999, 6: 1438-47)。このような粒子および小胞には、N-[l-(2,3-ジオレオイルキシ)プロピル]-N,N,N-トリメチル-アモニウムメチル硫酸塩、あるいは「DOTAP」のような正電荷脂質が特に好ましい。このような脂質粒子の調製はよく知られている。例えば、米国特許第4,880,635;4,906,477;4,911,928;4,917,951;4,920,016;および4,921,757号参照(その各々は、参照により本明細書に組み込まれる)。
本明細書に記載の医薬組成物は、例えば、単位用量として投与または包装することができる。「単位用量」という用語は、本開示の薬学的組成物に関して使用される場合、対象のための単一用量として適した物理的に個別の単位を指し、各単位は、必要な希釈剤(例えば担体、またはビヒクル)と合わせて所望の治療効果を生じるように計算された所定量の活性物質を含有する。
さらに、この薬学的組成物は、 (a) 凍結乾燥形態の本発明の化合物を含有する容器、および (b) 本発明の凍結乾燥化合物の再構成または希釈のために使用される、薬学的に許容される希釈剤 (例えば無菌のもの) を含有する第2の容器を含む薬学的キットとして提供することができる。必要に応じて、そのような容器には、医薬品または生物学的製剤の製造、使用または販売を規制する政府機関によって規定された様式の通知であって、人に投与するための製造、使用または販売の機関による承認を反映するものとすることができる。
別の態様では、上記疾患の治療に有用な材料を含む製品が含まれる。いくつかの実施態様において、製品は、容器およびラベルを含む。適切な容器は、例えばボトル、バイアル、シリンジ、および試験管を含む。容器は、ガラスまたはプラスチックなどの様々な材料から形成することができる。いくつかの実施形態において、容器は、本明細書に記載される疾患を治療するために有効である組成物を保持し、無菌アクセスポートを有し得る。例えば、容器は、静脈内溶液バッグ、または皮下注射針によって穿刺可能なストッパーを有するバイアルであり得る。組成物中の活性剤は、本発明の化合物である。いくつかの態様において、容器上のまたは容器に付随するラベルは、選択される疾患を治療するために組成物が使用されることを示す。製品は、リン酸緩衝生理食塩水、リンゲル液、またはデキストロース溶液などの薬学的に許容される緩衝液を含む第2の容器をさらに含むことができる。さらに、他の緩衝剤、希釈剤、フィルター、針、注射器、および使用説明書付き添付文書を含め、商業的観点および使用者の観点から望ましい他の物質を含むことができる。
いくつかの態様において、本明細書に記載される融合タンパク質、gRNA、および/または複合体のいずれかは、薬学的組成物の一部として提供される。いくつかの態様において、薬学的組成物は、本明細書に提供される融合タンパク質のいずれかを含む。いくつかの態様において、薬学的組成物は、本明細書に提供される複合体のいずれかを含む。いくつかの態様において、薬学的組成物は、gRNAおよびカチオン性脂質と複合体を形成するRNA-ガイドヌクレアーゼ(例えばCas9)を含むリボ核タンパク質複合体を含む。ある態様において、薬学的組成物は、gRNA、核酸プログラム可能DNA結合タンパク質、カチオン性脂質、および薬学的に許容される賦形剤を含む。薬学的組成物は、場合により、1つ以上の追加の治療活性物質を含むことができる。
いくつかの実施形態において、本明細書において提供される組成物は、対象内で標的化されたゲノム改変を実行するために、対象、例えばヒト対象に投与される。いくつかの実施形態において、対象から細胞が取得され、本明細書において提供される医薬組成物のいずれかと接触される。いくつかの実施形態において、対象から取り出されてex vivoで医薬組成物と接触された細胞は、場合により、所望のゲノム改変が細胞において実行または検出された後に、対象に再導入される。ヌクレアーゼを含む医薬組成物を送達する方法は公知であり、例えば米国特許第6,453,242号、第6,503,717号、第6,534,261号、第6,599,692号、第6,607,882号、第6,689,558号、第6,824,978号、第6,933,113号、第6,979,539号、第7,013,219号、および第7,163,824号に記載されており、その開示全体が参照により本明細書に組み込まれる。本明細書において提供される医薬組成物の説明は、主に、ヒトへの投与に適切な医薬組成物に向けられているが、そのような組成物は、一般に、あらゆる種類の動物または生物への投与、例えば、獣医学的使用に適切なことが、当業者によって理解されるであろう。
種々の動物への投与に適した組成物を与えるための、ヒトへの投与に適した医薬組成物の改変は十分に理解されており、通常の熟練した獣医薬理学者は、もし必要だとしても単に通常の実験で、そのような改変を設計および/または実施することができる。薬学的組成物の投与が意図される対象には、限定されるものではないが、ヒトおよび/または他の霊長類;哺乳動物、家畜、ペット、およびウシ、ブタ、ウマ、ヒツジ、ネコ、イヌ、マウス、および/またはラットなどの商業的に関連のある哺乳動物;ニワトリ、カモ、ガチョウおよび/またはシチメンチョウのような商業的に関連のある鳥類が含まれる。
本明細書に記載される薬学的組成物の製剤は、薬学の分野において公知の、または今後開発される任意の方法によって調製することができる。一般に、このような調製方法は、活性成分を賦形剤および/または1つ以上の他の補助成分と会合させ、次いで、必要および/または所望であれば、製品を所望の単回または複数回投与単位に成形および/または包装する工程を含む。薬学的製剤はさらに、薬学的に許容される賦形剤を含むことができ、それは、本明細書で使用される場合、所望の特定の剤形に適した、溶媒、分散媒体、希釈剤、または他の液体ビヒクル、分散または懸濁助剤、界面活性剤、等張剤、増粘剤または乳化剤、保存剤、固体結合剤、潤滑剤などのいずれかおよび全てを含む。Remington’s The Science and Practice of Pharmacy, 21st Edition, A. R. Gennaro (Lippincott, Williams & Wilkins, Baltimore, MD, 2006(参照によりその全体が本明細書に組み込まれる)は、薬学的組成物を製剤化する際に使用される種々の賦形剤およびその調製のための公知の技術を開示する。ヌクレアーゼを含む医薬組成物を製造するためのさらなる適切な方法、試薬、賦形剤および溶媒については、参照によりその全体が本明細書に組み込まれるPCT出願PCT/US2010/055131(2010年11月2日出願、公開番号WO2011/053982 A8)も参照のこと。
あらゆる従来の賦形剤媒体は、望ましくない生物学的効果を生じさせること、または他のかたちで医薬組成物の何らかの他の成分と有害な様式で相互作用することなどによって、物質またはその誘導体と不適合である場合を除き、その使用が本開示の範囲内にあると考えられる。
上記の組成物は、有効量で投与することができる。有効量は、投与方法、治療される特定の状態、および所望の結果に依存する。それはまた、状態のステージ、対象の年齢および身体的状態、もしあれば併用療法の性質、および医師によく知られた同様の因子に依存し得る。治療用途のためには、それは医学的に望ましい結果を達成するのに十分な量である。
いくつかの実施形態では、本開示による組成物は、多様な疾患、障害、および/または状態のいずれかの治療のために使用され得る。
[糖原病1a型(GSD1a)を治療する方法]
対象(例えばヒトなどの哺乳動物)に、本明細書に記載される塩基エディターシステム(例えば、アデノシンデアミナーゼ塩基エディター8(ABE8)およびgRNA)をコードするポリヌクレオチドを含む治療有効量の医薬組成物を投与することを含む、糖原病1a型(GSD1a)および/またはGSD1aを引き起こすG6PCの遺伝子突然変異を治療する方法も提供される。いくつかの実施形態において、塩基エディターは、ポリヌクレオチドプログラミング可能DNA結合ドメインおよびアデノシンデアミナーゼドメインを含む融合タンパク質である。対象の細胞に、塩基エディターと、塩基エディターを標的指向化させる1つまたは複数のガイドポリヌクレオチドが形質導入され、G6PC遺伝子における突然変異を含有する核酸配列のA・TからG・Cへの変化が実行される。
本明細書に記載の方法は、本明細書に記載の組成物の有効量を対象(そのような治療を必要としていると特定された対象、または疾患のリスクがありそのような治療を必要としていると疑われる対象を含む)に投与することを含む。このような治療を必要とする対象を同定することは、対象または医療専門家の判断にあり得、主観的(例えば所見)または客観的(例えば、検査または診断方法によって測定可能)であり得る。
治療方法は、一般的に、例えば、それを必要とする対象(例えば、ヒト患者)、G6PC遺伝子を標的とする塩基エディターおよびgRNAをコードするベクターを含む薬学的組成物の治療有効量の投与を含む。このような治療は、GSD1aを患っている、それを有している、それに罹患しやすい、またはその罹患のリスクがある対象、特にヒト対象に適切に投与される。本明細書における組成物は、GSD1aが関与し得る任意の他の障害の治療にも使用され得る。
一実施形態において、本発明は、治療の進行を監視する方法を提供する。本方法は、GSD1aに関連する障害またはその症状に罹患しているかまたは罹患しやすい対象において、診断マーカー(マーカー)(例えば、GSD1aに関連するSNP)または診断測定(例えば、スクリーニング、アッセイ)のレベルを決定する工程を含み、ここでその対象は、疾患またはその症状を治療するのに十分な治療量の本明細書における組成物を投与された対象である。この方法で測定されたマーカーのレベルを、健康な正常対照または他の罹患患者のいずれかにおけるマーカーの既知のレベルと比較して、対象の疾患状態を確立することができる。好ましい態様において、第1のレベルの決定よりも後の時点で、対象におけるマーカーの第2のレベルが決定され、疾患の経過または治療の有効性をモニターするためにこの2つのレベルが比較される。特定の好ましい実施形態では、対象における治療前のマーカーのレベルが、本発明による治療を開始する前に決定される。このマーカーの治療前レベルを治療開始後の対象のマーカーレベルと比較して、治療の有効性を判定することができる。
いくつかの実施形態において、対象から細胞が取得され、本明細書において提供される医薬組成物と接触される。いくつかの実施形態において、対象から取り出されてex vivoで医薬組成物と接触された細胞は、場合により、所望のゲノム改変が細胞において影響を受けた、または検出された後に、対象に再導入される。ヌクレアーゼを含む医薬組成物を送達する方法は、例えば米国特許第6,453,242号、第6,503,717号、第6,534,261号、第6,599,692号、第6,607,882号、第6,689,558号、第6,824,978号、第6,933,113号、第6,979,539号、第7,013,219号、および第7,163,824号に記載されており、その開示全体が参照により本明細書に組み込まれる。本明細書において提供される医薬組成物の説明は、主に、ヒトへの投与に適切な医薬組成物に向けられているが、そのような組成物は、一般に、あらゆる種類の動物または生物への投与、例えば、獣医学的使用に適切なことが、当業者によって理解されるであろう。
[キット]
本開示の様々な態様は、塩基エディターシステムを含むキットを提供する。一実施形態において、キットは、核酸塩基エディター融合タンパク質をコードするヌクレオチド配列を含む核酸構築物を含む。融合タンパク質は、デアミナーゼ(例えば、アデニンデアミナーゼ)および核酸プログラミング可能DNA結合タンパク質(napDNAbp)を含む。いくつかの実施形態において、キットは、目的の核酸分子、例えば、G6PC GSD1a関連突然変異を標的化することのできる、少なくとも1つのガイドRNAを含む。いくつかの実施形態において、キットは、少なくとも1つのガイドRNAをコードするヌクレオチド配列を含む核酸構築物を含む。
キットは、いくつかの実施形態において、1つまたは複数のG6PC GSD1a関連突然変異を編集するためにキットを使用するための説明書を提供する。説明書は、一般に、核酸分子を編集するためのキットの使用に関する情報を含む。他の実施形態では、説明書は、以下のうちの少なくとも1つを含む:注意事項;警告;臨床試験;および/または参考資料。使用説明書は、容器(もしあれば)に直接印刷するか、容器に貼付するラベルとして印刷するか、または容器内にもしくは容器と共に提供される独立したシート、パンフレット、カードまたはフォルダーとして印刷され得る。さらなる実施形態では、キットは、適切な動作パラメータのためのラベルまたは別個のインサート(添付文書)の形態で説明書を含むことができる。さらに別の実施形態では、キットは、検出、較正、または正規化のための標準として使用される、適切なポジティブおよびネガティブコントロールまたは対照サンプルを有する1つ以上の容器を含むことができる。キットは、(滅菌) リン酸緩衝生理食塩水、リンゲル液、またはデキストロース溶液などの薬学的に許容される緩衝液を含む第2の容器をさらに含むことができる。さらに、他の緩衝剤、希釈剤、フィルター、針、注射器、および使用説明書付きの添付文書を含む、商業的観点および使用者の観点から望ましい他の物質を含むことができる。特定の実施形態では、キットは、糖原病1a型(GSD1a)を有する対象の治療に有用である。
本発明の実施は、別段の表示がない限り、分子生物学(組換え技術を含む)、微生物学、細胞生物学、生化学および免疫学の従来の技術を利用し、これらは当業者の技量の範囲内である。そのような技術は、“Molecular Cloning: A Laboratory Manual”, 4th edition (Sambrook, 2012); “Oligonucleotide Synthesis” (Gait, 1984); “Animal Cell Culture” (Freshney, 1987); “Methods in Enzymology” “Handbook of Experimental Immunology” (Weir, 1996); “Gene Transfer Vectors for Mammalian Cells” (Miller and Calos, 1987); “Current Protocols in Molecular Biology” (Ausubel, 1987); “PCR: The Polymerase Chain Reaction”, (Mullis, 1994); “Current Protocols in Immunology” (Coligan, 1991)などの文献で詳しく説明されている。これらの技術は、本発明のポリヌクレオチドおよびポリペプチドの製造に適用可能であり、したがって、本発明の製造および実施において考慮され得る。特定の実施形態のために特に有用な技術は、以下のセクションで論じられる。
以下の実施例は、当業者に本発明のアッセイ、スクリーニング、および治療方法をいかに作って使用するかの完全な開示および説明を提供するために記載されており、本発明者らがその発明とみなすものの範囲を限定することを意図するものではない。
これらの実施例は、例示のみを目的として提供されるものであり、本明細書において提供される特許請求の範囲を限定するものではない。
[実施例1. HEK293T細胞における糖原病1a型(Von Gierke病)のQ347X突然変異を補正するための遺伝子編集]
[実施例1.1 Q347X突然変異の補正のための塩基編集戦略]
GSD1aは、グルコース-6-ホスファターゼ(G6PC)遺伝子における突然変異によって引き起こされ、これはGSD1患者の約80%に影響している。Q347X突然変異は、米国でGSD1aと診断される年間約500人の患者に影響を及ぼす。この突然変異は、G6PCタンパク質の位置347で未熟に終結する終止コドンを導入する単一塩基置換(Q347X)である。Q347Xの正確な補正は、G6PCの発現を回復させ、グルコース代謝を正常化すると考えられる。
検証されたプロトスペーサー隣接モチーフ(PAM)配列優先性のあるCas9部分を用いるアデノシン塩基エディター(ABE)を、標的化部位においてA>Gの効率的な変換を行うことによってQ347X突然変異を補正する能力について評価する。代表的なG6PCヌクレオチド標的配列および対応するアミノ酸配列を、図1に示す。Q347X突然変異の補正のための標的部位およびバイスタンダー部位の「a」核酸塩基が示されている。この部位における正確な補正は、次の変換をもたらす: TAG>CAG(終止コドン>グルタミン)。
[実施例1.2 Q347Xを発現するHEK293T細胞における正確な補正]
Q347X突然変異を、検証されたプロトスペーサー隣接モチーフ(PAM)配列優先性のあるCas9部分を用いるA・TからG・Cへの DNA塩基エディター(ABE)を使用した野生型配列への復帰のために標的化した。ABE塩基エディターは、Homo sapiens G6PC核酸配列におけるアデノシン(A)核酸塩基を標的化してQ347X突然変異を補正するために使用され得る。SNPにおけるA>Gの補正は、G6PCポリペプチドにおいて位置347の終止コドン(Q347X)をグルタミンに変化させる。
どのABE-Cas9プラットフォームが標的化されたQ347X突然変異を最も効率的かつ正確に補正することができるかを決定するために、Q347X突然変異を有するG6PCアリルを、レンチウイルス形質導入によってHEK293T細胞のゲノムに組み込んだ。
オンターゲット部位およびバイスタンダー部位の「a」核酸塩基を示すG6PC標的/インサートアミノ酸配列を、図3Aに示す。G6PC gRNA配列は、以下に示すG6PC標的配列の相補体にハイブリダイズする:
GACCTAGGCGAGGCAGTAGG GGA
上記でNGA PAM配列(すなわち、SpCas9-VRQR)には下線を付している。
gRNA足場配列は以下の通りである:
GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU
GSD1a Q347X突然変異の正確なオンターゲットおよびバイスタンダー補正のパーセンテージを、ABE8バリアントを使用して分析した(図2Aおよび2B)。バリアント2は、アデノシンデアミナーゼTadA7.10 VRQR構築物を利用するポジティブコントロールABEである。バリアント3は、TadA*8.5(TadA*7.10+V82S)のモノマー構築物(IVT MSP471)を利用するABE8.5である。バリアント4は、野生型TadAとTadA*8.18(TadA*7.10+V82S)のヘテロ二量体構築物(IVT MSP465)を利用するABE8.18である。
80%を超えるQ347突然変異のオンターゲットで正確な補正がHEK293T細胞で観察された(図2Aおよび2B)。V348Aのバイスタンダー編集は、すべての塩基エディターバリアントで検出不可能であった。すべての塩基エディターバリアントにおいてインデルのレベルは3.5%未満であった。
[実施例1.3 HEK293T細胞におけるGSD1a Q347X突然変異の補正のためのエディターの最適化]
GSD1aにおけるQ347X突然変異を補正するのに最適なABE塩基エディターを決定するために、様々なヘテロ二量体およびモノマーABE塩基エディターを、HEK293T-Q347X細胞にエレクトロポレーションした。
Q347X突然変異の標的/スペーサー配列を、図3Aに示す。標的/スペーサー配列は、オンターゲットおよびバイスタンダーの「a」核酸塩基を示す。Q347X突然変異は、NGA PAMバリアント(例えば、GGA)を使用して標的化され得る。
ABE8バリアントでQ347X突然変異を標的化して、ガイドRNA(gRNA)272を試験した(図3~4)。gRNAには、本明細書において提供される、または当業者の知識に基づいて、かつ当業者に理解されるように決定される、疾患関連遺伝子の足場配列およびスペーサー配列(標的配列)が包含される。(例えば、Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017); Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017), およびRees, H.A., et al., “Base editing: precision chemistry on the genome and transcriptome of living cells.” Nat Rev Genet. 2018 Dec;19(12):770-788. doi: 10.1038/s41576-018-0059-1を参照のこと)。
gRNA配列(#272)は、以下に示すG6PC DNA標的配列の相補体にハイブリダイズする:
gacctaggcgaggcagtagGgga
上記でNGA PAM配列(すなわち、SpCas9)には下線を付している。
gRNA足場配列は以下の通りである:
GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU
様々なABE塩基エディターバリアントを使用したQ347Xの補正率を、ポジティブコントロールABE7.10 VRQRヘテロ二量体構築物(IVT464)、ポジティブコントロールモノマー構築物(IVTmsp468)、およびネガティブコントロールGFPに対して評価した(図3B)。図3Bには、ABE8モノマーおよびヘテロ二量体バリアント構築物を使用したGSD1a G6PC Q347X突然変異の補正のパーセンテージを示すグラフが示されている。モノマーABE8バリアント構築物は、TadA*8.1(TadA*7.10+Y147T)のモノマー構築物(IVT MSP469)を利用するABE8.1、TadA*8.2(TadA*7.10+Y147R)のモノマー構築物(IVT MSP470)を利用するABE8.2、TadA*8.3(TadA*7.10+Q154S)のモノマー構築物(IVT MSP473)を利用するABE8.3、TadA*8.5(TadA*7.10+V82S)のモノマー構築物(IVT MSP471)を利用するABE8.5、TadA*8.7(TadA*7.10+Q154R)のモノマー構築物(IVT MSP472)を利用するABE8.7を含む。ヘテロ二量体ABE8バリアント構築物は、野生型TadAとTadA*8.14(TadA*7.10+Y147T)のヘテロ二量体構築物(IVT MSP463)を利用するABE8.14、野生型TadAとTadA*8.15(TadA*7.10+Y147R)のヘテロ二量体構築物(IVT MSP464)を利用するABE8.15、野生型TadAとTadA*8.16(TadA*7.10+Q154S)のヘテロ二量体構築物(IVT MSP467)を利用するABE8.16、野生型TadAとTadA*8.18(TadA*7.10+V82S)のヘテロ二量体構築物(IVT MSP465)を利用するABE8.18、野生型TadAとTadA*8.20(TadA*7.10+Q154R)のヘテロ二量体構築物(IVT MSP466)を利用するABE8.20を含む。
Q347X突然変異の補正率は、V82S突然変異を有するヘテロ二量体バリアントについては>85%の編集、V82S突然変異を有するモノマーバリアントでは約80%の編集を示した。バイスタンダー活性は、試験されたすべてのバリアントでごくわずかであった。
[実施例1.4 HEK293T細胞におけるGSD1a Q347X突然変異の補正のための二重突然変異体エディターの最適化]
様々な二重突然変異体ABE8バリアントを使用したQ347Xの補正率を、ポジティブコントロールABE7.10 VRQRヘテロ二量体構築物(IVT464)、ポジティブコントロールモノマー構築物(IVTmsp468)、およびネガティブコントロールGFPに対して評価した(図4)。図4には、オンターゲット(A6)とバイスタンダー(A2)のA>G核酸塩基を比較する、二重突然変異体ABE8モノマーバリアント構築物を使用したGSD1a G6PC Q347X突然変異の補正のパーセンテージを示すグラフが示されている。モノマーABE8バリアント構築物は、TadA*8.5(TadA*7.10+V82S)のモノマー構築物(IVT MSP471)を利用するABE8.5、TadA*8.28(TadA*7.10+V82S+Y154S)のモノマー構築物(IVT MSP501)を利用するABE8.28、TadA*8.29(TadA*7.10+V82S+Y147R)のモノマー構築物(IVT MSP499)を利用するABE8.29、TadA*8.30(TadA*7.10+V82S+Y154R)のモノマー構築物(IVT MSP500)を利用するABE8.30、TadA*8.31(TadA*7.10+V82S+H123H)のモノマー構築物(IVT MSP503)を利用するABE8.31、TadA*8.32(TadA*7.10+V82S+H123H+Y147T)のモノマー構築物(IVT MSP502)を利用するABE8.32を含む。
二重突然変異体ABE8バリアントは、約70%~80%の塩基編集効率で、単一突然変異体(V82Sモノマー)ABE8(ABE8.5)と同様の性能を示した。バイスタンダー活性は、試験されたすべてのバリアントでごくわずかであった。
[実施例1.5 患者由来のB-リンパ球におけるGSD1a Q347X突然変異の補正のためのエディターの最適化]
GSD1aにおけるQ347X突然変異を補正するのに最適なABE塩基エディターを決定するために、ヘテロ二量体およびモノマーABE塩基エディターを、G6PC Q347X突然変異を含有する患者由来のB-リンパ球(Coriell Institute)にエレクトロポレーションした。
ABE8バリアントでQ347X突然変異を標的化して、ガイドRNA(gRNA)272を試験した(図3~4)。gRNAには、本明細書において提供される、または当業者の知識に基づいて、かつ当業者に理解されるように決定される、疾患関連遺伝子の足場配列およびスペーサー配列(標的配列)が包含される。(例えば、Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017); Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017), およびRees, H.A., et al., “Base editing: precision chemistry on the genome and transcriptome of living cells.” Nat Rev Genet. 2018 Dec;19(12):770-788. doi: 10.1038/s41576-018-0059-1を参照のこと)。
gRNA配列(#272)は、以下に示すG6PC DNA標的配列の相補体にハイブリダイズする:
gacctaggcgaggcagtagG gga
上記でNGA PAM配列(すなわち、SpCas9)には下線を付している。
gRNA足場配列は以下の通りである:
GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU
様々なABE塩基エディターバリアントを使用したQ347Xの補正率を、ポジティブコントロールABE7.10 VRQR構築物(MSP565)およびネガティブコントロールGFPに対して評価した(図5)。図5には、ABE8モノマーおよびヘテロ二量体バリアント構築物を使用したGSD1a G6PC Q347X突然変異のA>G補正のパーセンテージを示すグラフが示されている。構築物は、野生型TadAとTadA*8.2(TadA*7.10+Y147R)のヘテロ二量体構築物(MSP559)を利用するABE8.2、野生型TadAとTadA*8.18(TadA*7.10+V82S)のヘテロ二量体構築物(MSP560)を利用するABE8.18、およびTadA*8.5(TadA*7.10+V82S)のモノマー構築物(MSP561)を利用するABE8.5を含む。
Q347X突然変異の補正率は、ABE8バリアントで約50%~60%の塩基編集を示した。バイスタンダー活性は、試験されたすべてのバリアントでごくわずかであった。
[実施例1.6 ヘテロ接合性患者iPSc由来のQ347X肝細胞における正確な補正]
正確なオンターゲット塩基編集を、ヘテロ接合性患者iPSc由来ヒト肝細胞(Definigen、Hep GSD1aロット493、507、および518)を使用して試験した。GSD1a iPSc由来肝細胞は、複合ヘテロ接合性(Q347X/G222R)であり、Q347X突然変異を有する。
Q347X突然変異の標的/スペーサー配列を、図6Aに示す。標的/スペーサー配列は、オンターゲットおよびバイスタンダーの「a」核酸塩基を示す。Q347X突然変異は、NGA PAMバリアント(例えば、GGA)を使用して標的化され得る。
gRNA配列は、以下に示すG6PC DNA標的配列の相補体にハイブリダイズする:
gacctaggcgaggcagtagG gga
上記でNGA PAM配列(すなわち、SpCas9)には下線を付している。
gRNA足場配列は以下の通りである:
GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU
Q347XのオンターゲットおよびバイスタンダーのA>G塩基編集補正率を、ヘテロ接合性(Q347X、G222R)患者iPSc由来ヒト肝細胞でABE 7.10 VRQRを使用して評価した(図6B)。オンターゲット塩基編集は、Q347X突然変異の最大15%のオンターゲットで正確な補正をもたらした。検出可能なバイスタンダー編集は観察されず、非常に低いレベルのインデルが観察された。
[実施例1.7 患者iPSc由来肝細胞におけるGSD1a Q347X突然変異の補正のためのエディターの最適化]
iPSc由来ヒト肝細胞(Definigen、Hep GSD1aロット493、507、および518)においてin vitroトランスフェクション方法を使用して、塩基編集を試験した。GSD1a iPSc由来肝細胞は、複合ヘテロ接合性(Q347X/G222R)であり、Q347X突然変異を有する。製造に特異的なプレーティングおよび維持プロトコールを使用して、細胞を成長させ、分化をさらに駆動した。gRNAおよびmRNA複合体のリポフェクションに基づくトランスフェクションを、細胞プレーティングの12日後に行った。細胞を溶解し、トランスフェクションの48時間後にgDNAを回収した。
Q347X突然変異の標的/スペーサー配列を、図7Aに示す。標的/スペーサー配列は、オンターゲットおよびバイスタンダーの「a」核酸塩基を示す。Q347X突然変異は、NGA PAMバリアント(例えば、GGA)を使用して標的化され得る。
gRNA配列は、以下に示すG6PC DNA標的配列の相補体にハイブリダイズする:
gacctaggcgaggcagtagG gga
上記でNGA PAM配列(すなわち、SpCas9)には下線を付している。
gRNA足場配列は以下の通りである:
GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU
患者iPSc由来肝細胞におけるABE8バリアントを使用したGSD1a Q347X突然変異の補正のためのオンターゲットA、Gへの変換、およびインデルの塩基編集効率を、図7Bに示す。様々なABE塩基エディターバリアントの編集効率を、ポジティブコントロールTriLink pBxt464 ABE7.10 VRQR構築物および未処理ネガティブコントロールに対して評価した(図7B)。生成された塩基エディターバリアント構築物は、pUtR-TriLink-ABE7.10(Y147R)-VRQR 120A Bbsl、pUtR-TriLink-ABE7.10(V82S)-VRQR 120A Bbsl、pUtR-TriLink-mono-ABE7.10(V82S)-VRQR 120A Bbsl、pUtR-TriLink-VRQR-GeneArt 120A Bbsl、およびpUtR-TriLink-Cas9-VRQR-ヌクレアーゼ-bpNLS 120A Bbslを含む。TriLink構築物は、TriLink Bio Technologiesから購入した。
iPSc由来肝細胞では、すべての最適化された塩基エディターバリアントにおいて、患者iPSc由来肝細胞中のG6PC Q347Xの同様の編集が、約10%~12%のA>G編集効率で観察された。Cas9-VRQRヌクレアーゼは、標的領域において、未処理対照に対して同様の配列プロファイルで効率的なインデルをもたらした。すべての塩基エディターで、もたらされたインデルおよびバイスタンダーV348A変換は低値か検出不可能であった。
[実施例2. GSD1a突然変異のための初代肝細胞共培養システムのin vitro形質導入]
[実施例2.1 共培養システムおよび形質導入方法論]
初代肝細胞共培養システムでin vitro形質導入方法を使用して、塩基編集を試験した。共培養システムを生成するには、初代ヒト肝細胞(PHH)(BioIVT)を1ウェル当たり350k細胞でCollagen-Type I被覆24ウェルプレート(Corning、354408)にプレーティングし、37℃、5% CO2でインキュベートして、接着細胞単一層を生成した。プレーティングの4時間後、プレーティングした肝細胞をCP培地(BioIVT)で洗浄して未接着細胞を除去した。3T3-J2マウス胎仔線維芽細胞(Kerafast(Howard Green (Harvard), Bostonから供給))をウェル毎に95%肝細胞:5%線維芽細胞の比で播種し、37C、5% CO2でさらに12時間培養して共培養物を形成した。培養培地は2日毎に交換し(500μL/ウェル)、継続的に維持した。図8Bには、2つの異なるヒト肝臓から単離された、2名のヒト肝細胞ドナーRSEおよびTVR由来の形質導入初代肝細胞の画像が示されている。これらは、BioIVT(Maryland, US)によって単離され、凍結保存され、研究目的で販売供給されたものである。
形質導入を実施するために、VectorBuilder(en.vectorbuilder.com)によって製造および精製されたプラスミドベクターにG6PC-R83CまたはG6PC-Q347Xを導入するようにレンチウイルスを設計した。肝細胞共培養物の形成後2日目に、レンチウイルスを1ウェル当たりMOI 500で培養培地に滴加した。共培養物を16時間形質導入した後、培地を新鮮なCP培地(BioIVT)に変えた。培養培地は2日毎に交換し(500μL/ウェル)、継続的に維持した。タンパク質発現は、肝共培養物中で7日間にわたって起こる。形質導入後7日目に、gRNAおよび塩基エディターmRNAと合剤にしたリポフェクションに基づく試薬を使用して、共培養物をトランスフェクトした。細胞を溶解し、トランスフェクションの48時間後にgDNAを回収した。図8Aは、代表的な時点を示す、肝細胞単一層または肝細胞共培養物のいずれかにおけるin vitro形質導入スケジュールのタイムラインを提供する。
[実施例2.2 レンチウイルスを使用したGSD1a Q347X突然変異のための初代肝細胞共培養システムのin vitro形質導入]
in vitro形質導入を試験した。初代肝細胞共培養物に、半機能的力価を有する、G6PC Q347X突然変異の発現を駆動するCMVプロモーターおよび3XFLAG-Tagを備えて設計されたレンチウイルスベクターを、首尾よく形質導入した。図9には、GSD1a Q347X突然変異を補正するために30、100、および300レンチウイルスの感染多重度(MOI)でレンチウイルスベクターとTriLink ABE7.10 VRQR(NGA PAM)を形質導入された初代肝細胞共培養細胞における6日目のGFP発現(GFP、明視野、マージ)が示されている。
[実施例2.3 GSD1a Q347X突然変異のためのin vitroレンチウイルス形質導入初代肝細胞共培養システムの最適化]
in vitroレンチウイルス形質導入初代ヒト肝細胞(PHH)共培養システムにおける編集効率を、最適化された条件を使用して評価した。ヒトドナーRSE由来のPHH共培養システムに、TBG-G6PC Q347XのMOI 500レンチウイルスを2日目に形質導入した(図10A)。8日目、形質導入共培養物にTriLink ABE7.10 VRQR、gRNA 272(NGA PAM)をトランスフェクトした。
gRNA配列(#272)は、以下に示すG6PC DNA標的配列の相補体にハイブリダイズする:
gacctaggcgaggcagtagG gga
上記でNGA PAM配列(すなわち、SpCas9)には下線を付している。
ABE塩基エディターがトランスフェクトされた共培養物のオンターゲット編集効率を、インデルに対して評価した(図10B)。形質導入初代肝細胞共培養物におけるGSD1a Q347X突然変異のA>G塩基編集効率は、約11%~15%であった。図10Bに示されるように、動物モデルにおいて治療効果を達成するには、5%を超える塩基編集効率が必要であった。
さらなる実験では、1% DMSOを含み、4% PEG8000を含む培地または含まない培地において、ヒトドナーRSE由来のPHH共培養物を2日目に形質導入した。トランスフェクション後、トランスフェクション試薬の進入を妨げる障害であると思われる、分泌された細胞外マトリックス(ECM)を分解するために、コラゲナーゼIII、コラゲナーゼIV、およびヒアルロニダーゼを含む0.5mg/ml溶液で共培養物を処理したか、または未処理のまま2分間維持した。
ABE塩基エディターがトランスフェクトされた共培養物のオンターゲット編集効率を、インデルに対して評価した(図10C)。形質導入初代肝細胞共培養物の位置6におけるGSD1a Q347X突然変異のA>G塩基編集効率は、すべての治療群で約11%~15%であった。処理したPPH共培養物におけるQ347X補正は、インデルおよびバイスタンダーV348A変換をもたらした。
[実施例2.4 GSD1aのトランスジェニックマウスモデルから単離された初代マウス肝細胞におけるG6PC R83C突然変異の塩基編集]
初代マウス肝細胞共培養システムを使用して、R83Cの補正のための塩基編集を試験した。ヒトG6PC R83C(V166L)突然変異を含有するトランスジェニックマウスモデルから、初代マウス肝細胞を単離した(図17A)。GSD1aにおけるR83C突然変異を補正するのに最適なABE塩基エディターを決定するために、様々なsaCas9-ABE塩基エディター構築物を、実施例2.1に記載したように、初代マウス肝細胞共培養システムにトランスフェクトした。
R83C突然変異の標的/スペーサー核酸配列を、以下に示す。標的/スペーサー核酸配列は、オンターゲット(太字、イタリック体、および下線付きのフォント)、同義(イタリック体および下線付き)、およびバイスタンダー(イタリック体)の「a」核酸塩基を示す。プロトスペーサー塩基は太字であり、PAMは太字で下線を付してあり、プロトスペーサー外の塩基は小文字である。R83C突然変異は、NNGRRT PAMバリアント(例えば、GAGAAT)を使用して標的化され得る。
Figure 2022519882000058
対応するアミノ酸配列は以下の通りである:
WWYPCQGFLI
gRNA配列(#820)は、以下に示すG6PC DNA標的配列の相補体にハイブリダイズする:
CCAGTATGGACaCTGTCCAAA gAGAAT
上記でNNGRRT PAM配列(すなわち、SaCas9)には下線を付している。
gRNA足場配列は以下の通りである:
GUUUUAGUACUCUGUAAUGAAAAUUACAGAAUCUACUAAAACAAGGCAAAAUGCCGUGUUUAUCUCGUCAACUUGUUGGCGAGAUUUU
GSD1a R83C突然変異の補正に関して、様々なsaCas9ニッカーゼ-ABE塩基エディターバリアント構築物を使用した、オンターゲット(A12G)、同義(A10G)、バイスタンダー(A6G)、およびインデルの編集効率を試験した(図17B)。saCas9ニッカーゼ-ABE塩基エディターバリアント構築物は、pGL79 pUTR-TriLink- ABE8.1 (ABE7.10 + Y147T)-saCas9n、pGL80 pUTR-TriLink- ABE8.2 (ABE7.10 + Y147R)-saCas9n、pGL82 pUTR-TriLink- ABE8.7 (ABE7.10 + Q154R)-saCas9n、pGL83 pUTR-TriLink- ABE8.3 (ABE7.10 + Q154S)-saCas9n、pGL92 pUTR-TriLink-ABE7.10-saCas9n、pGL98 pUTR-TriLink-monoTadA-ABE8.12(ABE7.10 + Y147T + Q154S)-saCas9nを含む。
saCas9ニッカーゼ-ABE塩基エディターバリアント構築物pGL79 pUTR-TriLink- ABE8.1 (ABE7.10 + Y147T)-saCas9nおよびpGL80 pUTR-TriLink- ABE8.2 (ABE7.10 + Y147R)-saCas9nが、最も良好なオンターゲット編集効率を達成した(図17B)。
[実施例3. HEK293T細胞における糖原病1a型(Von Gierke病)のR83C突然変異を補正するための遺伝子編集]
[実施例3.1 R83C突然変異の補正のための塩基編集戦略]
GSD1aは、グルコース-6-ホスファターゼ(G6PC)遺伝子における突然変異によって引き起こされ、これはGSD1患者の約80%に影響を及ぼす。R83C突然変異は、米国でGSD1aと診断される年間約900人の患者に影響を及ぼす。この突然変異は、G6PCタンパク質の位置83(R83C)にシステインを導入する単一塩基置換である。R83Cの正確な補正は、G6PCの発現を回復させ、グルコース代謝を正常化すると考えられる。
検証されたプロトスペーサー隣接モチーフ(PAM)配列優先性のあるCas9部分を用いるアデノシン塩基エディター(ABE)を、標的化部位においてA>Gの効率的な変換を行うことによってR83C突然変異を補正する能力について評価した。R83C突然変異の補正のためのオンターゲット部位およびバイスタンダー部位の「a」核酸塩基を示す代表的なG6PCヌクレオチド標的配列および対応するアミノ酸配列を、図11に示す。この部位における正確な補正は、次の変換をもたらす: TGT>CGTまたはTGT>CGC(システイン>アルギニン)。
[実施例3.2 Q347Xを発現するHEK293T細胞における正確な補正]
R83C突然変異を、検証されたプロトスペーサー隣接モチーフ(PAM)配列優先性のあるCas9部分を用いるA・TからG・Cへの DNA塩基エディター(ABE)を使用した野生型配列への復帰のために標的化した。ABE塩基エディターは、Homo sapiens G6PC核酸配列におけるアデノシン(A)核酸塩基を標的化してR83C突然変異を補正するために使用され得る。SNPにおけるA>Gの補正は、G6PCポリペプチドにおいて位置83(R83C)のシステインをアルギニンに変化させる。
どのABE-Cas9プラットフォームが標的化されたR83C突然変異を最も効率的かつ正確に補正することができるかを決定するために、R83C突然変異を有するG6PCアリルを、レンチウイルス形質導入によってHEK293T細胞のゲノムに組み込んだ。
オンターゲット部位、同義、およびバイスタンダー部位の「a」核酸塩基を示すG6PC標的/インサートアミノ酸配列を、図12Aに示す。G6PC gRNA配列は、以下に示すG6PC標的配列の相補体にハイブリダイズする:
CCAGTTGGACACTGTCCAAAGAGAAT
上記でNNGRRT PAM配列(すなわち、SaCas9)には下線を付している。
gRNA足場配列は以下の通りである:
GUUUUAGUACUCUGUAAUGAAAAUUACAGAAUCUACUAAAACAAGGCAAAAUGCCGUGUUUAUCUCGUCAACUUGUUGGCGAGAUUUU
GSD1a Q347X突然変異のオンターゲットおよびバイスタンダー補正の補正のパーセンテージを、ABE8バリアントを使用して分析した(図12B)。空のプラスミドをABE塩基エディターsaABE7.10のネガティブコントロールとして使用した。バリアント2は、モノマーTadA-SaCas9,pGL78構築物を利用するポジティブコントロールABEである。バリアント3は、野生型TadAとTadA*8.18(TadA*7.10+V82S)-SaCas9,pGL81のヘテロ二量体構築物を利用する塩基エディターである。バリアント4は、野生型TadAとTadA*8.16(TadA*7.10+Q154S)-SaCas9,pGL83のヘテロ二量体構築物を利用する塩基エディターである。
約30%のR83C突然変異のオンターゲットで正確な補正がHEK293T細胞で観察された(図12B)。約3%のA>G塩基編集がプラスミドで観察された。バイスタンダー編集はバリアント1とバリアント2とで比較可能であった。バリアント3は、バイスタンダー補正と比較してより高いオンターゲット補正を示した。
[実施例3.3 HEK293T細胞におけるプラスミドトランスフェクションによるG6PC R83C突然変異の塩基編集]
GSD1aにおけるQ347X突然変異を補正するのに最適なABE塩基エディターを決定するために、様々なABE塩基エディターを、HEK293T-R83C細胞にエレクトロポレーションした。G6PC DNA標的配列の相補体にハイブリダイズするガイドRNA(gRNA)配列#820および#1121を、図13Aに示す。gRNA配列は、オンターゲット、同義、およびバイスタンダーの「a」核酸塩基を示す。NNGRRT PAMバリアント(例えば、gRNA #820 GAGAAT PAM)(すなわち、SaCas9)またはNGA PAMバリアント(例えば、gRNA #1121 AGA PAM)(すなわち、SpCas9)のいずれかを使用して、R83C突然変異を標的化した。gRNA #820および#1121を、GSD1a R83C突然変異の補正における使用について試験した。
gRNA #1121について、足場配列は以下の通りである:
GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU
gRNA #820について、足場配列は以下の通りである:
GUUUUAGUACUCUGUAAUGAAAAUUACAGAAUCUACUAAAACAAGGCAAAAUGCCGUGUUUAUCUCGUCAACUUGUUGGCGAGAUUUU
ABE塩基エディター構築物は、gRNA #820または#1121のいずれか、塩基エディター7.9または7.10、およびバリアントVRQR、VRQR CP5、VRQR CP6、またはsaCas9-ABE(saABE)を含み得る。図13Bに示すABE塩基エディター構築物は、ABE7.9 VRQR gRNA #1121、ABE7.10 VRQR gRNA#1121、ABE7.9 VRQR CP5 gRNA#1121、ABE7.10 VRQR CP5 gRNA#1121、ABE7.9 VRQR CP6 gRNA#1121、ABE7.10 VRQR CP6 gRNA#1121、ABE7.9 saABE gRNA#820、およびABE7.10 saABE gRNA#820を含む。様々なABE塩基エディターバリアントを使用したR83Cの補正率を、ネガティブコントロールに対して評価した(図13B)。
図13Bに示されるように、gRNA #820を伴うABE塩基エディターsaABE 7.10が、バイスタンダー(Y85H)編集と比較するとR83C突然変異の最も良好なA>G補正を達成した。NGA PAMを使用したgRNA #1121を伴うABE塩基エディターは、好ましくないバイスタンダー(Y85H)編集をもたらし、核酸塩基A10がABE VRQRにとって理想的でないことを示した。循環置換体5および6の存在は、核酸塩基A10におけるA>G塩基編集を増加させた。
[実施例3.4 HEK293T細胞におけるGSD1a R83C突然変異の補正のためのエディターの最適化]
GSD1aにおけるR83C突然変異を補正するのに最適なABE塩基エディターを決定するために、様々なヘテロ二量体saCas9-ABE(saABE)塩基エディターを、HEK293T-R83C細胞にエレクトロポレーションした。塩基エディターは、oADE001/002 cDNA PCRからのmRNA IVTと、2.5μgの塩基エディターおよび1μgのガイドRNAを用いて調製した。HEK293T pLenti G6PC R83C細胞は、p7-20、三連で200k細胞/ウェルであった。
R83C突然変異の標的/スペーサー核酸配列を、以下に示す。標的/スペーサー核酸配列は、オンターゲット(太字、イタリック体、および下線付きのフォント)、同義(イタリック体および下線付き)、およびバイスタンダー(イタリック体)の「a」核酸塩基を示す。プロトスペーサー塩基は太字であり、PAMは太字で下線を付してあり、プロトスペーサー外の塩基は小文字である。R83C突然変異は、NNGRRT PAMバリアント(例えば、GAGAAT)を使用して標的化され得る。
Figure 2022519882000059
対応するアミノ酸配列は以下の通りである:
WWYPCQGFLI
G6PC DNA標的配列の相補体にハイブリダイズするgRNA配列(#820)を以下に示す:
CCAGuAuGGACACUGUCCAAA gAGAAT
上記でNNGRRT PAM配列(すなわち、SaCas9)には下線を付している。
上記のgRNA配列について、足場配列は以下の通りである:
GUUUUAGUACUCUGUAAUGAAAAUUACAGAAUCUACUAAAACAAGGCAAAAUGCCGUGUUUAUCUCGUCAACUUGUUGGCGAGAUUUU
GSD1a R83C突然変異の補正に関して、様々なsaCas9-ABE(saABE)塩基エディターヘテロ二量体バリアント構築物を使用した、オンターゲット(A12G)、同義(A10G)、バイスタンダー(A6G、A0G)、ならびにA6G+A10GおよびA6G+A12Gの複合編集の編集効率を試験した(図14)。様々なABE塩基エディターバリアントを使用したR83Cの補正率を、モノマーTadA-saCas9ポジティブコントロールならびにGFPおよび未処理のネガティブコントロールに対して評価した(図14)。saABE塩基エディターバリアントヘテロ二量体構築物は、TadA*8.14 ((WT) + (TadA7.10 + Y147T)) - saCas9、TadA*8.15 ((WT) + (TadA7.10 + Y147R)) - saCas9、TadA*8.18 ((WT) + (TadA7.10 + V82S)) - saCas9、TadA*8.20 ((WT) + (TadA7.10 + Q154R)) - saCas9、およびTadA*8.16 ((WT) + (TadA7.10 + Q154S)) - saCas9を含む。
R83C突然変異の直接補正には、プロトスペーサー領域内の12G位におけるA>G変換が関与する。6G位におけるバイスタンダー(Y85H(TAC>CAC))は、突然変異が酵素の活性部位に位置しているためG6PC活性を低下させ得るが、R83Cより活性が低くなることはないと予想される。10Gにおける変換は同義、すなわち、TGT>CGC(システイン>アルギニン)である。
[実施例3.5 HEK293T細胞におけるGSD1a R83C突然変異の補正のための二重突然変異体エディターの最適化]
様々な二重突然変異体モノマーおよびヘテロ二量体ABE8 saCas9ニッカーゼ(saCas9n)ABE(saABE)塩基エディターバリアントを使用したR83Cの補正率を評価した。二重突然変異体塩基エディターは、oADE001/002 cDNA PCRからのmRNA IVTと、2.5μgの塩基エディターおよび1μgのガイドRNAを用いて調製した。HEK293T pLenti G6PC R83C細胞は、p7-20、三連で200k細胞/ウェルであった。
R83C突然変異の標的/スペーサー核酸配列を、以下に示す。標的/スペーサー核酸配列は、オンターゲット(太字、イタリック体、および下線付きのフォント)、同義(イタリック体および下線付き)、およびバイスタンダー(イタリック体)の「a」核酸塩基を示す。プロトスペーサー塩基は太字であり、PAMは太字で下線を付してあり、プロトスペーサー外の塩基は小文字である。R83C突然変異は、NNGRRT PAMバリアント(例えば、GAGAAT)を使用して標的化され得る。
Figure 2022519882000060
対応するアミノ酸配列は以下の通りである:
WWYPCQGFLI
G6PC DNA標的配列の相補体にハイブリダイズするgRNA配列(#820)を以下に示す:
CCAGUAUGGACaCUGUCCAAA gAGAAT
上記でNNGRRT PAM配列(すなわち、SaCas9)には下線を付している。
上記のgRNA配列について、足場配列は以下の通りである:
GUUUUAGUACUCUGUAAUGAAAAUUACAGAAUCUACUAAAACAAGGCAAAAUGCCGUGUUUAUCUCGUCAACUUGUUGGCGAGAUUUU
様々なsaCas9n-ABE(saABE)塩基エディター二重突然変異体モノマーおよびヘテロ二量体バリアント構築物を使用した、GSD1a R83C突然変異のオンターゲット(A12G)、同義(A10G)、バイスタンダー(A6G、A0G)、および複合(A6G+A10GおよびA6G+A12G)補正の編集効率を試験した(図15)。様々な二重突然変異体ABE塩基エディターバリアントを使用したR83Cの補正率を、モノマーTadA-saCas9nポジティブコントロールおよびヘテロ二量体TadA-saCas9nポジティブコントロールに対して評価した(図15)。saABE塩基エディターバリアントモノマー構築物は、TadA*8.1 (TadA7.10 + Y147T) - saCas9n、TadA*8.2 (TadA7.10 + Y147R) - saCas9n、TadA*8.3 (TadA7.10 + Q154S) - saCas9n、TadA*8.12 (TadA7.10 + Y147T + Q154S) - saCas9n、およびTadA*8.27 (TadA7.10 + Y147R + Q154S) - saCas9nを含む。
saABE塩基エディターバリアントヘテロ二量体構築物は、TadA*8.14 ((WT) + (TadA7.10 + Y147T)) - saCas9n、TadA*8.15 ((WT) + (TadA7.10 + Y147R)) - saCas9n、TadA*8.20 ((WT) + (TadA7.10 + Q154R)) - saCas9n、TadA*8.25 ((WT) + (TadA7.10 + Y147T/Q154S)) - saCas9n、およびTadA*8.33 ((WT) + (TadA7.10 + Y147R + Q154S)) - saCas9nを含む。
R83C突然変異の直接補正には、プロトスペーサー領域内の12G位におけるA>G変換が関与する。6G位におけるバイスタンダー(Y85H(TAC>CAC))は、突然変異が酵素の活性部位に位置しているためG6PC活性を低下させ得るが、R83Cより活性が低くなることはないと予想される。10Gにおける変換は同義、すなわち、TGT>CGC(システイン>アルギニン)である。
R83C標的化のためにTadA-SaCas9エディターに単一突然変異ではなく2つの突然変異を含めることによるさらなるエディター最適化実験の目的は、上昇したレベルのオンターゲット編集を達成すること、または12Gおよび6Gにおける編集をさらに切り離すことであった。試験した二重突然変異体はいずれも、改善されたオンターゲット編集をもたらさないが、試験した単一突然変異体と同様の編集のレベルは維持する。図15に示されるように、TadA-SaCas9エディターは、標的部位における30~40%のA>G変換、および約20%のバイスタンダー編集をもたらす。配列決定が示したところによれば、これらの編集は主に、高頻度のオンターゲット編集を伴い、バイスタンダー編集を伴わずに、切り離された様式で起こる。例えば、二量体TadA-SaCas9 pGL83は、以下の表14に示される編集を生成する。
表14:TadA-SaCas9 A>G 塩基編集頻度
Figure 2022519882000061

太字および下線付きで示してあるのは、R83CのA>G核酸塩基オンターゲット補正である。太字およびイタリック体で示してあるのは、Y85CのA>G核酸塩基バイスタンダー補正である。
[実施例3.6 HEK293T細胞におけるGSD1a R83C補正のための最適化されたエディターの再現性研究]
最適化されたエディターによるGSD1a R83C補正の再現性を、図16に示されるように評価した。
R83C突然変異の標的/スペーサー核酸配列を、以下に示す。標的/スペーサー核酸配列は、オンターゲット(太字、イタリック体、および下線付きのフォント)、同義(イタリック体および下線付き)、およびバイスタンダー(イタリック体)の「a」核酸塩基を示す。プロトスペーサー塩基は太字であり、PAMは太字で下線を付してあり、プロトスペーサー外の塩基は小文字である。R83C突然変異は、NNGRRT PAMバリアント(例えば、GAGAAT)を使用して標的化され得る。
Figure 2022519882000062
対応するアミノ酸配列は以下の通りである:
WWYPCQGFLI
G6PC DNA標的配列の相補体にハイブリダイズするgRNA配列(#820)を以下に示す:
CCAGUAUGGACaCUGUCCAAA gAGAAT
上記でNNGRRT PAM配列(すなわち、SaCas9)には下線を付している。
上記のgRNA配列について、足場配列は以下の通りである:
GUUUUAGUACUCUGUAAUGAAAAUUACAGAAUCUACUAAAACAAGGCAAAAUGCCGUGUUUAUCUCGUCAACUUGUUGGCGAGAUUUU
様々な最適化されたABE塩基エディターを使用した、GSD1a R83C突然変異のオンターゲット(A12G)、同義(A10G)、およびバイスタンダー(A6G、A0G)補正の編集効率を試験した(図16)。ABE塩基エディターバリアントを使用したR83Cの補正率を、pGL78モノマーABE7.10ポジティブコントロールに対して評価した(図15)。ABE塩基エディターバリアント構築物は、pGL97モノマーQ154S (TadA*8.3)、pGL95モノマーY147T (TadA*8.1)、pGL98モノマーY147T + Q154S (TadA*8.12)、pGL83二量体Q154S (TadA*8.16)、pGL79二量体Y147T (TadA*8.14)、およびpGL93二量体Y147T + Q154S (TadA*8.25)を含む。
図16に示されるように、最適化されたヘテロ二量体ABE塩基エディターバリアントは、GSD1a R83C突然変異の補正に関し、バイスタンダーと比較してより良好なオンターゲット(12A)A>G塩基編集効率を示した。
[実施例3.7 HEK293細胞におけるGSD1a R83C補正のためのガイドRNA切詰め研究]
GSD1a R83C補正について、ガイドの長さを変化させることが編集に及ぼす効果(例えば、オンターゲット活性およびオフターゲット活性の変化)を理解するために、ガイドRNA切詰め研究を実施した。1つの実験では、SaCas9に融合したモノマーTadA(pGL78)を含むABEバリアントを用い、R83C部位を標的化する異なる長さのガイドを試験した:
CCAGUAUGGACaCUGUCCAAA (21nt)
CAGUAUGGACaCUGUCCAAA (20nt)
AGUAUGGACaCUGUCCAAA (19nt)
簡潔に述べると、塩基エディターをコードするmRNAをin vitro転写したところ、断片分析機によって純度約70%であると決定された。G6PC R83C標的配列のレンチウイルス挿入が施されたHEK293T細胞(200K細胞/ウェル)に、2.5μgのエディターmRNA、1μgのガイドRNAを三連でトランスフェクトした。驚くべきことに、ガイドの標的化領域の長さを変えると、6Aにおけるオフターゲットバイスタンダー編集(望ましくない)だけでなく、12Aにおけるオンターゲット編集(望ましい)も変化した(図18)。特に、19ntおよび20ntのガイドは、TadA-SaCas9塩基エディターによる増加したオンターゲットおよび減少したオフターゲット編集を示した。理論に拘束されることを望むものではないが、オンターゲット活性が高く、オンターゲット編集のオフターゲット編集に対する比が高いガイドRNAが、塩基編集のために望ましい。
別の実験では、様々なABE8を20ntおよび21ntのガイドと共に試験した(図19)。モノマー(TadA*8)および二量体(TadA(wt)-TadA*8)のバリアントは、20ntガイドと共に使用したとき、21ntガイドと共に使用したときと比較して、オンターゲット編集(12A; 望ましい)のオフターゲット編集(6A; 望ましくない)に対する比の増加を示した。一般に、20ntガイドを伴うABEエディターは、21ntガイドとの併用と比較してより高いオンターゲット編集(12A; 望ましい)も示した。前述の塩基エディターと比較すると、20ntガイドを伴うmono-R20A/K21A、mono-V82G、di-R20A/K21A、di-V82G、di/mono二重突然変異体は、増加したオンターゲット活性および減少したオフターゲット活性を示した。さらなる実験が示したところによれば、20ntガイドRNAと組み合わせた、SaCas9に融合したY147TおよびQ1545突然変異を含むモノマーTadA7.10、またはY147T、Q1545、およびV82G突然変異を含むヘテロ二量体TadA(wt)-TadA7.10は、GSD1a R83C部位において、低レベルのオフターゲット、バイスタンダー編集を伴う、高レベルのオンターゲット編集を提供した(図20)。
これらの塩基エディターとガイドの組合せを、本明細書に記載されるレンチウイルス形質導入初代肝細胞共培養システムにおいても試験した。形質導入共培養物に、diTadA-ABE7.10(Y147T/Q154S)-SaCas9またはmono TadA ABE7.10(Y147T/Q154S)-SaCas9(それぞれMSP602またはMSP603)およびgRNA 820(20ntまたは21nt)をトランスフェクトした。すべてのmRNA/gRNAの組合せが、形質導入肝細胞において特異的なオンターゲット(12G)編集をもたらした。gRNA820-20ntのトランスフェクションは、上昇したレベルのオンターゲット編集をもたらした(図21)。別の実験では、以前に試験した塩基エディターとガイドの組合せのいくつか(すなわち、バリアント3~5の条件)を試験したところ、有意なレベルの正確なR83C補正が初代ヒト肝細胞モデルにおいて観察された(図22)。
[実施例4 ヘテロ接合性トランスジェニックGSD1a R83Cマウスにおけるin vivoでの正確な補正]
G6PC R83Cの正確な補正に関する分子的概念実証研究を、GSD1aのヒト化トランスジェニックマウスモデルにおいて行った。2つの別々の研究において、エディターmRNAおよびgRNAと合剤にしたLNPを動物に投薬した。研究1は10~15週齢の動物で行い、投薬後7日目にテイクダウン(TD)した。研究2の動物は8~11週齢であり、LNP投薬後2週目にテイクダウンした。テイクダウンの後、肝臓を単離し、ホモジナイズし、PCRおよび次世代配列決定分析を標的部位およびその付近で行った。
トランスジェニックマウスモデルは、Applied StemCell(Miliptas, CA)にて、ヒトcDNA転写物(G6PC-201、ENST00000253801.6)に点突然変異R83C(CGT>TGT)を有するように設計された一本鎖DNA(ssDNA)ドナー(約1.2kb)を使用して、マウスG6PC遺伝子のノックアウトおよびヒトG6PC cDNAのノックインによって生成された。使用されたエディターは、ヘテロ二量体SaABE8(Y147T、Q154S、V82G)としても記載されるヘテロ二量体SaABE8.12(V82G)であった。gRNAは以下の配列を有した: CAGTATGGACACTGTCCAAA。
R83C突然変異の標的/スペーサー核酸配列を、以下に示す。
Figure 2022519882000063
標的/スペーサー核酸配列は、オンターゲット(太字のフォント)、同義(イタリック体のフォント)、およびバイスタンダー(下線付きのフォント)の「A」核酸塩基を示す。R83C突然変異は、GAGAAT PAM配列を使用して標的化され得る。
図23に示されるように、R83C突然変異を含むヒトG6PCを有するトランスジェニックマウスは、約15~25%のR83Cのオンターゲットで正確な補正をもたらし、Y85H突然変異をもたらすバイスタンダー編集は低値であった(約2~7%)。
[実施例5. 材料および方法]
本明細書に記載の実施例において提供された結果は、以下の材料および方法を使用して得られた。
使用された標的ポリヌクレオチドおよびgRNAおよびプライマーのDNA配列は、本明細書に記載されている。gRNAについては、以下の足場配列が示される: GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU。この足場は、NGG、NGA、NGC、NGT PAM(すなわちSpCas9)に使用され得る。以下の足場配列: GUUUUAGUAC UCUGUAAUGA AAAUUACAGA AUCUACUAAA ACAAGGCAAA AUGCCGUGUU UAUCUCGUCA ACUUGUUGGC GAGAUUUUは、NNGRRT PAM(すなわちSaCas9)に使用され得る。gRNAには、本明細書において提供される、または当業者の知識に基づいて、かつ当業者に理解されるように決定される、疾患関連遺伝子(例えば、表3Aおよび3B)の足場配列およびスペーサー配列(標的配列)が包含される。(例えば、Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017); Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017), およびRees, H.A., et al., “Base editing: precision chemistry on the genome and transcriptome of living cells.” Nat Rev Genet. 2018 Dec;19(12):770-788. doi: 10.1038/s41576-018-0059-1を参照のこと)。
PCRは、VeraSeq ULtra DNA polymerase(Enzymatics)、またはQ5 Hot Start High-Fidelity DNA Polymerase(New England Biolabs)を使用して実施した。塩基エディター(BE)プラスミドは、USERクローニング(New England Biolabs)を使用して構築した。デアミナーゼ遺伝子は、gBlocks Gene Fragments(Integrated DNA Technologies)として合成した。使用したCas9遺伝子は以下に記載する。Cas9遺伝子は以前に報告されているプラスミドから得た。デアミナーゼおよび融合遺伝子をpCMV(哺乳動物コドン最適化)またはpET28b(E. coliコドン最適化)骨格にクローニングした。sgRNA発現プラスミドは、部位指向性突然変異誘発を使用して構築した。
簡潔に述べると、T4 Polynucleotide Kinase(New England Biolabs)を製造元の説明書に従って使用し、本明細書上記のプライマーを5′リン酸化した。次に、Q5 Hot Start High- Fidelity Polymerase(New England Biolabs)と、リン酸化したプライマーおよび鋳型としての目的の遺伝子をコードするプラスミドを製造元の説明書に従って使用して、PCRを実施した。PCR産物をDpnI(20 U、New England Biolabs)と共に37℃で1時間インキュベートし、QIAprepスピンカラム(Qiagen)で精製し、QuickLigase(New England Biolabs)を製造元の説明書に従って使用してライゲートした。DNAベクター増幅はMach1コンピテント細胞(ThermoFisher Scientific)を使用して行った。
[細胞培養]
HEK293T(ATCC CRL-3216)およびU2OS(ATCC HTB-96)は、10%(v/v)ウシ胎児血清(FBS)を補ったGlutaMax(ThermoFisher)を含むDulbecco改変イーグル培地に、37℃、5% CO2で維持した。HCC1954細胞(ATCC CRL-2338)は、上記の通り補ったRPMI-1640培地(ThermoFisher Scientific)に維持した。目的の遺伝子(例えばSERPINA1、G6PC、IDUAなど)を含む不死化細胞(Taconic Biosciences)は、10%(v/v)ウシ胎児血清(FBS)および200μg ml-1 Geneticin(ThermoFisher Scientific)を補ったGlutaMax(ThermoFisher Scientific)を含むDulbecco改変イーグル培地で培養した。
HEK293T(293T)細胞株はAmerican Tissue Culture Collection(ATCC)から得た。293T細胞は、10%ウシ胎児血清および1%ペニシリン/ストレプトマイシンを補ったDMEMに、37℃、5% CO2で維持した。すべての細胞株に、製造元の説明書に従い、24ウェルプレートでLipofectamine 2000(Invitrogen)をトランスフェクトした。リポフェクションに使用したDNAの量は1ウェル当たり1μgであった。対照GFP発現プラスミドの送達後に蛍光顕微鏡によって決定した293T細胞のトランスフェクション効率は、常に80%よりも高かった。
[トランスフェクション]
HEK293T細胞を48ウェルのコラーゲン被覆BioCoatプレート(Corning)に播種し、およそ85%のコンフルエンシーでトランスフェクトした。簡潔に述べると、1ウェル当たり1.5μlのLipofectamine 2000(ThermoFisher Scientific)を製造元のプロトコールに従って使用して、750ngのBEおよび250ngのsgRNA発現プラスミドをトランスフェクトした。HEK293T細胞は、製造元の説明書に従って適切なAmaxa Nucleofector IIプログラム(HEK293T細胞についてはプログラムQ-001を使用するVキット)を使用してトランスフェクトした。
プラスミドトランスフェクションのためには、Opti-MEM培地およびLipofectamine 2000を使用して、HEK293T細胞をプレーティングし、U6プロモーターを含みgRNAをコードする250ngの発現プラスミドと、Cas9/ABE8バリアント塩基エディターをコードする750ngの発現プラスミドとをトランスフェクトした。使用したABE8バリアントは、NGG PAM配列を含んだ。細胞は37℃、5% CO2に5日間維持し、トランスフェクション後3日目に培地を交換した。その後、細胞を溶解し、ゲノムDNAを単離し、標準的手順を使用して、典型的には20~100ngの鋳型DNAを使用してPCRを実施した。アダプター(Illumina)の付加後、DNAをディープシーケンシングに供した。所望の部位における塩基編集をMiSeq分析によって分析した。
[ゲノムDNAサンプルの高スループットDNA配列決定]
トランスフェクト細胞を3日後に回収し、Agencourt DNAdvance Genomic DNA Isolation Kit(Beckman Coulter)を製造元の説明書に従って使用してゲノムDNAを単離した。オンターゲットおよびオフターゲットの目的のゲノム領域を、隣接する高スループット配列決定プライマー対を用いたPCRによって増幅した。PCR増幅は、Phusion high-fidelity DNA polymerase(ThermoFisher)を製造元の説明書に従って用い、5ngのゲノムDNAを鋳型として使用して行った。サイクル数は、反応が増幅の線形範囲内で停止することを確実にするために、各プライマー対について別々に決定した。PCR産物はRapidTips(Diffinity Genomics)を使用して精製した。精製されたDNAを、配列決定アダプターを含むプライマーを用いたPCRによって増幅した。Quant-iT PicoGreen dsDNA Assay Kit(ThermoFisher)およびKAPA Library Quantification Kit-Illumina(KAPA Biosystems)を使用して、産物をゲル精製し、数量化した。サンプルは過去に記載されているように(Pattanayak, Nature Biotechnol. 31, 839-843 (2013))、Illumina MiSeqで配列決定した。
293T細胞の二連トランスフェクションから回収したゲノムDNAまたはRNAのPCRアンプリコンにディープシーケンシングを実施した。PCR産物の質をゲル電気泳動によって検証した後、PCR産物をゲル抽出によって、例えばZymoclean Gel DNA Recovery Kit(Zymo Research)を使用して単離した。ショットガンライブラリーをせん断せずに調製した。ライブラリーをqPCRによって数量化し、MiSeq 500サイクル配列決定キットバージョン2を使用して断片の各末端から、1つのMiSeq Nanoフローセルで251サイクル配列決定した。Fastqファイルを生成し、bcl2fastq v2.17.1.14 Conversion Software(Illumina)で逆多重化した。
[他の実施形態]
上記の説明から、種々の用途および条件に適用させるために、本明細書に記述する本発明に変形および修正を加えることができることが明らかであろう。そのような実施形態もまた、以下の特許請求の範囲の範囲内である。
本明細書における可変要素の定義における要素のリストの記載は、リストされた要素のいずれかの単一要素または組合せ(またはサブコンビネーション)としてのその可変要素の定義を含む。本明細書における実施形態の説明は、いずれかの単一の実施形態としての、または任意の他の実施形態もしくはその一部との組合せにおける、その実施形態を含む。
本明細書に言及されているすべての刊行物、特許、および特許出願は、それぞれの個々の刊行物、特許、または特許出願が具体的かつ個別に参照により組み込まれることが示されているのと同じ程度に、参照により本明細書に組み込まれる。別段の表示がない限り、本明細書に言及されている刊行物、特許および特許出願は、その全体が参照により本明細書に組み込まれる。

Claims (205)

  1. 糖原病1a型(GSD1a)に関連する一塩基多型(SNP)を含むグルコース-6-ホスファターゼ(G6PC)ポリヌクレオチドを編集する方法であって、前記G6PCポリヌクレオチドを、1つまたは複数のガイドポリヌクレオチドと複合体を形成したアデノシンデアミナーゼ塩基エディター8(ABE8)と接触させることを含み、前記アデノシンデアミナーゼ塩基エディター8(ABE8)が、ポリヌクレオチドプログラム可能なDNA結合ドメインと、アデノシンデアミナーゼドメインとを含み、前記ガイドポリヌクレオチドのうちの1つまたは複数が前記塩基エディターをターゲティングしてGSD1aに関連する前記SNPのA・TからG・Cへの改変をもたらす、方法。
  2. 前記接触させることが、細胞、真核細胞、哺乳動物細胞、またはヒト細胞中で起こる、請求項1に記載の方法。
  3. 前記細胞が、インビボである、請求項1または2に記載の方法。
  4. 前記細胞が、エクスビボである、請求項1または2に記載の方法。
  5. GSD1aに関連する前記SNPでのA・TからG・Cへの前記改変により、前記G6PCポリペプチドにおいてグルタミン(Q)が非グルタミン(X)アミノ酸に変化するかまたはアルギニン(R)が非アルギニン(X)に変化する、請求項1~4のいずれか一項に記載の方法。
  6. GSD1aに関連する前記SNPでのA・TからG・Cへの前記改変により、位置347で非グルタミン(X)アミノ酸を有するかまたは位置83で非アルギニン(X)アミノ酸を有するG6PCポリペプチドの発現をもたらす、請求項1~5のいずれか一項に記載の方法。
  7. 塩基エディター補正により、位置347での前記非グルタミンアミノ酸(X)がグルタミンで置き換えられるかまたは位置83での前記非アルギニンアミノ酸(X)がアルギニンで置き換えられる、請求項1~6のいずれか一項に記載の方法。
  8. GSD1aに関連する前記SNPでのA・TからG・Cへの前記改変により、アミノ酸位置347で早期に終結するかまたは位置83のシステインで早期に終結するG6PCポリペプチドの発現をもたらす、請求項1~7のいずれか一項に記載の方法。
  9. 前記SNPでのA・TからG・Cへの前記改変が、Q347Xおよび/またはR83Cのうちの1つまたは複数をコードする、請求項1~8のいずれか一項に記載の方法。
  10. 前記ポリヌクレオチドプログラム可能なDNA結合ドメインが、Streptococcus pyogenes Cas9 (SpCas9)またはそのバリアントである、請求項1~9のいずれか一項に記載の方法。
  11. 前記ポリヌクレオチドプログラム可能なDNA結合ドメインが、改変されたプロトスペーサー隣接モチーフ(PAM)特異性を有するかまたは非G PAMに対する特異性を有する改変SpCas9を含む、請求項1~10のいずれか一項に記載の方法。
  12. 前記改変SpCas9が、核酸配列5'-NGA-3'に対する特異性を有する、請求項11に記載の方法。
  13. 前記改変SpCas9が、核酸配列5'-AGA-3'または5'-GGA-3'に対する特異性を有する、請求項11または12に記載の方法。
  14. 前記改変SpCas9が、NGA PAMバリアントに対する特異性を有する、請求項11に記載の方法。
  15. 前記ポリヌクレオチドプログラム可能なDNA結合ドメインが、Staphylococcus aureus Cas9 (SaCas9)またはそのバリアントである、請求項1~9のいずれか一項に記載の方法。
  16. SaCas9が、核酸配列5'-NNGRRT-3'に対するプロトスペーサー隣接モチーフ(PAM)特異性を有する、請求項15に記載の方法。
  17. 前記SaCas9が、核酸配列5'-GAGAAT-3'に対する特異性を有する、請求項16に記載の方法。
  18. 前記SaCas9が、NNGRRT PAMバリアントに対する特異性を有する、請求項15に記載の方法。
  19. 前記ポリヌクレオチドプログラム可能なDNA結合ドメインが、ヌクレアーゼ不活性バリアントである、請求項1~18のいずれか一項に記載の方法。
  20. 前記ポリヌクレオチドプログラム可能なDNA結合ドメインが、ニッカーゼバリアントである、請求項1~18のいずれか一項に記載の方法。
  21. 前記ニッカーゼバリアントが、アミノ酸置換D10Aまたは対応するアミノ酸置換を含む、請求項20に記載の方法。
  22. 前記アデノシンデアミナーゼドメインが、デオキシリボ核酸(DNA)中のアデノシンを脱アミノ化することができる、請求項1~21のいずれか一項に記載の方法。
  23. 前記アデノシンデアミナーゼドメインが、アデノシンデアミナーゼバリアントを含むモノマーである、請求項1~22のいずれか一項に記載の方法。
  24. 前記アデノシンデアミナーゼドメインが、野生型アデノシンデアミナーゼドメインとアデノシンデアミナーゼバリアントとを含むヘテロ二量体である、請求項1~22のいずれか一項に記載の方法。
  25. 前記アデノシンデアミナーゼバリアントが、
    MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
    のアミノ酸配列を含み、前記アミノ酸配列が、少なくとも1つの改変を含む、請求項23または24に記載の方法。
  26. 前記少なくとも1つの改変が、V82S、Y147T、Y147R、Q154S、Y123H、および/またはQ154Rを含む、請求項25に記載の方法。
  27. 前記少なくとも1つの改変が、
    Y147T+Q154R;Y147T+Q154S;Y147R+Q154S;V82S+Q154S;V82S+Y147R;V82S+Q154R;V82S+Y123H;I76Y+V82S;V82S+Y123H+Y147T;V82S+Y123H+Y147R;V82S+Y123H+Q154R;Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y123H+Y147R+Q154R+I76Y;V82S+Y123H+Y147R+Q154R;
    およびI76Y + V82S + Y123H + Y147R + Q154Rからなる群から選択される改変の組合せを含む、請求項25または26に記載の方法。
  28. 前記少なくとも1つの改変が、Y147T + Q154Sを含む、請求項25~27のいずれか一項に記載の方法。
  29. 前記ガイドポリヌクレオチドが、
    a) GACCUAGGCGAGGCAGUAGG;
    b) CCAGUAUGGACACUGUCCAAA;
    c) CAGUAUGGACACUGUCCAAA; および
    d) AGUAUGGACACUGUCCAAAG
    からなる群から選択される核酸配列を含む、請求項1~28のいずれか一項に記載の方法。
  30. 前記アデノシンデアミナーゼが、TadAデアミナーゼである、請求項1に記載の方法。
  31. 前記TadAデアミナーゼが、TadA*8バリアントである、請求項30に記載の方法。
  32. 前記TadA*8バリアントが、TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23、TadA*8.24からなる群から選択される、請求項31に記載の方法。
  33. 前記アデノシンデアミナーゼ塩基エディター8(ABE8)が、ABE8.1-m、ABE8.2-m、ABE8.3-m、ABE8.4-m、ABE8.5-m、ABE8.6-m、ABE8.7-m、ABE8.8-m、ABE8.9-m、ABE8.10-m、ABE8.11-m、ABE8.12-m、ABE8.13-m、ABE8.14-m、ABE8.15-m、ABE8.16-m、ABE8.17-m、ABE8.18-m、ABE8.19-m、ABE8.20-m、ABE8.21-m、ABE8.22-m、ABE8.23-m、ABE8.24-m、ABE8.1-d、ABE8.2-d、ABE8.3-d、ABE8.4-d、ABE8.5-d、ABE8.6-d、ABE8.7-d、ABE8.8-d、ABE8.9-d、ABE8.10-d、ABE8.11-d、ABE8.12-d、ABE8.13-d、ABE8.14-d、ABE8.15-d、ABE8.16-d、ABE8.17-d、ABE8.18-d、ABE8.19-d、ABE8.20-d、ABE8.21-d、ABE8.22-d、ABE8.23-d、またはABE8.24-dからなる群から選択される、請求項1に記載の方法。
  34. 前記1つまたは複数のガイドRNAが、CRISPR RNA (crRNA)およびトランスコード小RNA (tracrRNA)を含み、前記crRNAが、GSD1aに関連する前記SNPを含むG6PC核酸配列に相補的な核酸配列を含む、請求項1~33のいずれか一項に記載の方法。
  35. 前記アデノシンデアミナーゼ塩基エディター8(ABE8)が、GSD1aに関連する前記SNPを含むG6PC核酸配列に相補的な核酸配列を含む単一ガイドRNA(sgRNA)と複合体を形成する、請求項1~34のいずれか一項に記載の方法。
  36. 前記アデノシンデアミナーゼドメインが、アデノシンデアミナーゼ活性を有する以下の配列またはその断片:
    MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD
    を含むか、またはそれから本質的になる、請求項1~35のいずれか一項に記載の方法。
  37. ポリヌクレオチドプログラム可能なDNA結合ドメイン、およびアデノシンデアミナーゼドメインを含むアデノシンデアミナーゼ塩基エディター8(ABE8)、または前記塩基エディターをコードするポリヌクレオチドと、
    前記塩基エディターをターゲティングしてGSD1aに関連するSNPのA・TからG・Cへの改変をもたらす1つまたは複数のガイドポリヌクレオチドと
    を含む細胞。
  38. 肝細胞、肝細胞前駆体、またはiPSc由来の肝細胞である、請求項37に記載の細胞。
  39. G6PCポリペプチドを発現する、請求項37または38に記載の細胞。
  40. GSD1aを有する対象由来である、請求項37~39のいずれか一項に記載の細胞。
  41. 哺乳動物細胞である、請求項37~40のいずれか一項に記載の細胞。
  42. ヒト細胞である、請求項37~41のいずれか一項に記載の細胞。
  43. GSD1aに関連する前記SNPでのA・TからG・Cへの前記改変により、前記G6PCポリペプチドにおいてグルタミンが非グルタミン(X)アミノ酸に変化するかまたはアルギニンが非アルギニン(X)アミノ酸に変化する、請求項37~42のいずれか一項に記載の細胞。
  44. GSD1aに関連する前記SNPが、位置347で非グルタミン(X)アミノ酸を含むかまたは位置83で非アルギニン(X)アミノ酸を含むG6PCポリペプチドの発現をもたらす、請求項37~43のいずれか一項に記載の細胞。
  45. 塩基エディター補正により、位置347での前記非グルタミンアミノ酸(X)がグルタミンで置き換えられるかまたは位置83での前記非アルギニンアミノ酸(X)がアルギニンで置き換えられる、請求項37~44のいずれか一項に記載の細胞。
  46. GSD1aに関連する前記SNPでのA・TからG・Cへの前記改変により、アミノ酸位置347で早期に終結するかまたは位置83でシステインをコードするG6PCポリペプチドの発現をもたらす、請求項37~45のいずれか一項に記載の細胞。
  47. 前記改変が、Q347Xおよび/またはR83Cのうちの1つまたは複数である、請求項37~46のいずれか一項に記載の細胞。
  48. 前記ポリヌクレオチドプログラム可能なDNA結合ドメインが、Streptococcus pyogenes Cas9 (SpCas9)またはそのバリアントである、請求項37~47のいずれか一項に記載の細胞。
  49. 前記ポリヌクレオチドプログラム可能なDNA結合ドメインが、改変されたプロトスペーサー隣接モチーフ(PAM)特異性を有するかまたは非G PAMに対する特異性を有する改変SpCas9を含む、請求項37~48のいずれか一項に記載の細胞。
  50. 前記改変SpCas9が、核酸配列5'-NGA-3'に対する特異性を有する、請求項49に記載の細胞。
  51. 前記改変SpCas9が、核酸配列5'-AGA-3'または5'-GGA-3'に対する特異性を有する、請求項49または50に記載の細胞。
  52. 前記改変SpCas9が、NGA PAMバリアントに対する特異性を有する、請求項51に記載の細胞。
  53. 前記ポリヌクレオチドプログラム可能なDNA結合ドメインが、Staphylococcus aureus Cas9 (SaCas9)またはそのバリアントである、請求項37~47のいずれか一項に記載の細胞。
  54. 前記SaCas9が、核酸配列5'-NNGRRT-3'に対する特異性を有する、請求項53に記載の細胞。
  55. 前記SaCas9が、核酸配列5'-GAGAAT-3'に対する特異性を有する、請求項54に記載の細胞。
  56. 前記SaCas9が、NNGRRT PAMバリアントに対する特異性を有する、請求項53に記載の細胞。
  57. 前記ポリヌクレオチドプログラム可能なDNA結合ドメインが、ヌクレアーゼ不活性バリアントである、請求項37~56のいずれか一項に記載の細胞。
  58. 前記ポリヌクレオチドプログラム可能なDNA結合ドメインが、ニッカーゼバリアントである、請求項37~56のいずれか一項に記載の細胞。
  59. 前記ニッカーゼバリアントが、アミノ酸置換D10Aまたはその対応するアミノ酸置換を含む、請求項58に記載の細胞。
  60. 前記アデノシンデアミナーゼドメインが、デオキシリボ核酸(DNA)中のアデノシンを脱アミノ化することができる、請求項37~59のいずれか一項に記載の細胞。
  61. 前記アデノシンデアミナーゼドメインが、アデノシンデアミナーゼバリアントを含むモノマーである、請求項1~60のいずれか一項に記載の細胞。
  62. 前記アデノシンデアミナーゼドメインが、野生型アデノシンデアミナーゼドメインとアデノシンデアミナーゼバリアントとを含むヘテロ二量体である、請求項1~60のいずれか一項に記載の細胞。
  63. 前記アデノシンデアミナーゼバリアントが、
    MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
    のアミノ酸配列を含み、前記アミノ酸配列が、少なくとも1つの改変を含む、請求項61または62に記載の細胞。
  64. 前記少なくとも1つの改変が、V82S、Y147T、Y147R、Q154S、Y123H、および/またはQ154Rを含む、請求項63に記載の細胞。
  65. 前記少なくとも1つの改変が、
    Y147T+Q154R;Y147T+Q154S;Y147R+Q154S;V82S+Q154S;V82S+Y147R;V82S+Q154R;V82S+Y123H;I76Y+V82S;V82S+Y123H+Y147T;V82S+Y123H+Y147R;V82S+Y123H+Q154R;Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y123H+Y147R+Q154R+I76Y;V82S+Y123H+Y147R+Q154R;
    およびI76Y + V82S + Y123H + Y147R + Q154Rからなる群から選択される改変の組合せを含む、請求項63または64に記載の細胞。
  66. 前記少なくとも1つの改変が、Y147T + Q154Sを含む、請求項63~65のいずれか一項に記載の細胞。
  67. 前記ガイドポリヌクレオチドが、
    a) GACCUAGGCGAGGCAGUAGG;
    b) CCAGUAUGGACACUGUCCAAA;
    c) CAGUAUGGACACUGUCCAAA; および
    d) AGUAUGGACACUGUCCAAAG
    からなる群から選択される核酸配列を含む、請求項37~66のいずれか一項に記載の細胞。
  68. 前記アデノシンデアミナーゼが、TadAデアミナーゼである、請求項37に記載の細胞。
  69. 前記TadAデアミナーゼが、TadA*8バリアントである、請求項68に記載の細胞。
  70. 前記TadA*8バリアントが、TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23、TadA*8.24からなる群から選択される、請求項69に記載の細胞。
  71. 前記アデノシンデアミナーゼ塩基エディター8(ABE8)が、ABE8.1-m、ABE8.2-m、ABE8.3-m、ABE8.4-m、ABE8.5-m、ABE8.6-m、ABE8.7-m、ABE8.8-m、ABE8.9-m、ABE8.10-m、ABE8.11-m、ABE8.12-m、ABE8.13-m、ABE8.14-m、ABE8.15-m、ABE8.16-m、ABE8.17-m、ABE8.18-m、ABE8.19-m、ABE8.20-m、ABE8.21-m、ABE8.22-m、ABE8.23-m、ABE8.24-m、ABE8.1-d、ABE8.2-d、ABE8.3-d、ABE8.4-d、ABE8.5-d、ABE8.6-d、ABE8.7-d、ABE8.8-d、ABE8.9-d、ABE8.10-d、ABE8.11-d、ABE8.12-d、ABE8.13-d、ABE8.14-d、ABE8.15-d、ABE8.16-d、ABE8.17-d、ABE8.18-d、ABE8.19-d、ABE8.20-d、ABE8.21-d、ABE8.22-d、ABE8.23-d、またはABE8.24-dからなる群から選択される、請求項37に記載の細胞。
  72. 前記1つまたは複数のガイドRNAが、CRISPR RNA (crRNA)およびトランスコード小RNA (tracrRNA)を含み、前記crRNAが、GSD1aに関連する前記SNPを含むG6PC核酸配列に相補的な核酸配列を含む、請求項37~71のいずれか一項に記載の細胞。
  73. 前記塩基エディターが、GSD1aに関連する前記SNPを含むG6PC核酸配列に相補的な核酸配列を含む単一ガイドRNA(sgRNA)と複合体を形成する、請求項37~72のいずれか一項に記載の細胞。
  74. 前記アデノシンデアミナーゼ塩基エディター8(ABE8)が、アデノシンデアミナーゼ活性を有する以下の配列またはその断片:
    MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD
    を含むか、またはそれから本質的になる、請求項37~73のいずれか一項に記載の細胞。
  75. 前記gRNAが、以下の配列:
    GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU
    を有する足場を含む、請求項37~74のいずれか一項に記載の細胞。
  76. 前記gRNAが、以下の配列:
    GUUUUAGUACUCUGUAAUGAAAAUUACAGAAUCUACUAAAACAAGGCAAAAUGCCGUGUUUAUCUCGUCAACUUGUUGGCGAGAUUUU
    を有する足場を含む、請求項37~74のいずれか一項に記載の細胞。
  77. 対象におけるGSD1aを治療する方法であって、前記対象に、
    ポリヌクレオチドプログラム可能なDNA結合ドメインおよびアデノシンデアミナーゼドメインを含むアデノシンデアミナーゼ塩基エディター8(ABE8)、または前記塩基エディターをコードするポリヌクレオチドと、
    前記アデノシンデアミナーゼ塩基エディター8(ABE8)をターゲティングしてGSD1aに関連するSNPのA・TからG・Cへの改変をもたらす1つまたは複数のガイドポリヌクレオチドと
    を投与することを含む方法。
  78. 前記対象が、哺乳動物またはヒトである、請求項77に記載の方法。
  79. 前記対象の細胞に、前記アデノシンデアミナーゼ塩基エディター8(ABE8)または前記アデノシンデアミナーゼ塩基エディター8(ABE8)をコードするポリヌクレオチドと、前記1つまたは複数のガイドポリヌクレオチドとを送達することを含む、請求項77または78に記載の方法。
  80. 前記細胞が、肝細胞、肝細胞前駆体、またはiPSc由来の肝細胞である、請求項79に記載の方法。
  81. GSD1aに関連する前記SNPでのA・TからG・Cへの前記改変により、アミノ酸位置347で早期に終結するかまたは位置83でシステインをコードするG6PCポリペプチドの発現をもたらす、請求項77~80のいずれか一項に記載の方法。
  82. 前記改変が、Q347Xおよび/またはR83Cのうちの1つまたは複数である、請求項77~81のいずれか一項に記載の方法。
  83. 前記ポリヌクレオチドプログラム可能なDNA結合ドメインが、Streptococcus pyogenes Cas9 (SpCas9)またはそのバリアントである、請求項77~82のいずれか一項に記載の方法。
  84. 前記ポリヌクレオチドプログラム可能なDNA結合ドメインが、改変されたプロトスペーサー隣接モチーフ(PAM)特異性を有するかまたは非G PAMに対する特異性を有する改変SpCas9を含む、請求項77~83のいずれか一項に記載の方法。
  85. 前記改変SpCas9が、核酸配列5'-NGA-3'に対する特異性を有する、請求項84に記載の方法。
  86. 前記改変SpCas9が、核酸配列5'-AGA-3'または5'-GGA-3'に対する特異性を有する、請求項84または85に記載の方法。
  87. 前記改変SpCas9が、NGA PAMバリアントに対する特異性を有する、請求項84に記載の方法。
  88. 前記ポリヌクレオチドプログラム可能なDNA結合ドメインが、Staphylococcus aureus Cas9 (SaCas9)またはそのバリアントである、請求項77~82のいずれか一項に記載の方法。
  89. 前記SaCas9が、核酸配列5'-NNGRRT-3'に対する特異性を有する、請求項88に記載の方法。
  90. 前記SaCas9が、核酸配列5'-GAGAAT-3'に対する特異性を有する、請求項88または89に記載の方法。
  91. 前記SaCas9が、NNGRRT PAMバリアントに対する特異性を有する、請求項88に記載の方法。
  92. 前記ポリヌクレオチドプログラム可能なDNA結合ドメインが、ヌクレアーゼ不活性バリアントである、請求項77~91のいずれか一項に記載の方法。
  93. 前記ポリヌクレオチドプログラム可能なDNA結合ドメインが、ニッカーゼバリアントである、請求項77~91のいずれか一項に記載の方法。
  94. 前記ニッカーゼバリアントが、アミノ酸置換D10Aまたはその対応するアミノ酸置換を含む、請求項93に記載の方法。
  95. 前記アデノシンデアミナーゼドメインが、デオキシリボ核酸(DNA)中のアデノシンを脱アミノ化することができる、請求項77~94のいずれか一項に記載の方法。
  96. 前記アデノシンデアミナーゼドメインが、アデノシンデアミナーゼバリアントを含むモノマーである、請求項77~95のいずれか一項に記載の方法。
  97. 前記アデノシンデアミナーゼドメインが、野生型アデノシンデアミナーゼドメインとアデノシンデアミナーゼバリアントとを含むヘテロ二量体である、請求項77~95のいずれか一項に記載の方法。
  98. 前記アデノシンデアミナーゼバリアントが、
    MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
    のアミノ酸配列を含み、前記アミノ酸配列が、少なくとも1つの改変を含む、請求項96または97に記載の方法。
  99. 少なくとも1つの改変が、V82S、Y147T、Y147R、Q154S、Y123H、および/またはQ154Rを含む、請求項98に記載の方法。
  100. 前記少なくとも1つの改変が、
    Y147T+Q154R;Y147T+Q154S;Y147R+Q154S;V82S+Q154S;V82S+Y147R;V82S+Q154R;V82S+Y123H;I76Y+V82S;V82S+Y123H+Y147T;V82S+Y123H+Y147R;V82S+Y123H+Q154R;Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y123H+Y147R+Q154R+I76Y;V82S+Y123H+Y147R+Q154R;
    およびI76Y + V82S + Y123H + Y147R + Q154Rからなる群から選択される改変の組合せを含む、請求項98または99に記載の方法。
  101. 前記少なくとも1つの改変が、Y147T + Q154Sを含む、請求項98~100のいずれか一項に記載の方法。
  102. 前記ガイドポリヌクレオチドが、
    a) GACCUAGGCGAGGCAGUAGG;
    b) CCAGUAUGGACACUGUCCAAA;
    c) CAGUAUGGACACUGUCCAAA; および
    d) AGUAUGGACACUGUCCAAAG
    からなる群から選択される核酸配列を有する、請求項77~101のいずれか一項に記載の方法。
  103. 前記アデノシンデアミナーゼが、TadAデアミナーゼである、請求項77に記載の方法。
  104. 前記TadAデアミナーゼが、TadA*8バリアントである、請求項103に記載の方法。
  105. 前記TadA*8バリアントが、TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23、TadA*8.24からなる群から選択される、請求項104に記載の方法。
  106. 前記アデノシンデアミナーゼ塩基エディター8(ABE8)が、ABE8.1-m、ABE8.2-m、ABE8.3-m、ABE8.4-m、ABE8.5-m、ABE8.6-m、ABE8.7-m、ABE8.8-m、ABE8.9-m、ABE8.10-m、ABE8.11-m、ABE8.12-m、ABE8.13-m、ABE8.14-m、ABE8.15-m、ABE8.16-m、ABE8.17-m、ABE8.18-m、ABE8.19-m、ABE8.20-m、ABE8.21-m、ABE8.22-m、ABE8.23-m、ABE8.24-m、ABE8.1-d、ABE8.2-d、ABE8.3-d、ABE8.4-d、ABE8.5-d、ABE8.6-d、ABE8.7-d、ABE8.8-d、ABE8.9-d、ABE8.10-d、ABE8.11-d、ABE8.12-d、ABE8.13-d、ABE8.14-d、ABE8.15-d、ABE8.16-d、ABE8.17-d、ABE8.18-d、ABE8.19-d、ABE8.20-d、ABE8.21-d、ABE8.22-d、ABE8.23-d、またはABE8.24-dからなる群から選択される、請求項77に記載の方法。
  107. 前記1つまたは複数のガイドRNAが、CRISPR RNA (crRNA)およびトランスコード小RNA (tracrRNA)を含み、前記crRNAが、GSD1aに関連する前記SNPを含むG6PC核酸配列に相補的な核酸配列を含む、請求項77~106のいずれか一項に記載の方法。
  108. 前記塩基エディターが、GSD1aに関連する前記SNPを含むG6PC核酸配列に相補的な核酸配列を含む単一ガイドRNA(sgRNA)と複合体を形成する、請求項77~107のいずれか一項に記載の方法。
  109. 肝細胞またはその先駆体を生成する方法であって、
    (a)GSD1aに関連するSNPを含む人工多能性幹細胞または肝細胞先駆体に、
    ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインおよびアデノシンデアミナーゼドメインを含むアデノシンデアミナーゼ塩基エディター8(ABE8)、または前記アデノシンデアミナーゼ塩基エディター8(ABE8)をコードするポリヌクレオチドと、
    前記塩基エディターをターゲティングしてGSD1aに関連する前記SNPのA・TからG・Cへの改変をもたらす1つまたは複数のガイドポリヌクレオチドと
    を導入すること、ならびに
    (b)前記人工多能性幹細胞を肝細胞またはその先駆体に分化させること
    を含む方法。
  110. 前記肝細胞先駆体が、GSD1aを有する対象から得られる、請求項109に記載の方法。
  111. 前記肝細胞または肝細胞先駆体が、哺乳動物細胞またはヒト細胞である、請求項109または110に記載の方法。
  112. GSD1aに関連する前記SNPでのA・TからG・Cへの前記改変により、G6PCポリペプチドにおいてグルタミンが非グルタミン(X)アミノ酸に変化するかまたはアルギニンが非アルギニン(X)アミノ酸に変化する、請求項109~111のいずれか一項に記載の方法。
  113. GSD1aに関連する前記SNPでのA・TからG・Cへの前記改変により、位置347で非グルタミン(X)アミノ酸を有するかまたは位置83で非アルギニン(X)アミノ酸を有するG6PCポリペプチドの発現をもたらす、請求項109~112のいずれか一項に記載の方法。
  114. 工程(a)の前記人工多能性幹細胞が、Q347X突然変異を含む、請求項109~113のいずれか一項に記載の方法。
  115. 工程(a)の前記人工多能性幹細胞が、R83C突然変異を含む、請求項109~114のいずれか一項に記載の方法。
  116. 前記アデノシンデアミナーゼドメインが、デオキシリボ核酸(DNA)中のアデノシンを脱アミノ化することができる、請求項109~115のいずれか一項に記載の方法。
  117. 前記アデノシンデアミナーゼドメインが、アデノシンデアミナーゼバリアントを含むモノマーである、請求項109~116のいずれか一項に記載の方法。
  118. 前記アデノシンデアミナーゼドメインが、野生型アデノシンデアミナーゼドメインとアデノシンデアミナーゼバリアントとを含むヘテロ二量体である、請求項109~116のいずれか一項に記載の方法。
  119. 前記アデノシンデアミナーゼバリアントが、
    MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
    のアミノ酸配列を含み、前記アミノ酸配列が、少なくとも1つの改変を含む、請求項117または118に記載の方法。
  120. 前記少なくとも1つの改変が、V82S、Y147T、Y147R、Q154S、Y123H、および/またはQ154Rを含む、請求項119に記載の方法。
  121. 前記少なくとも1つの改変が、
    Y147T+Q154R;Y147T+Q154S;Y147R+Q154S;V82S+Q154S;V82S+Y147R;V82S+Q154R;V82S+Y123H;I76Y+V82S;V82S+Y123H+Y147T;V82S+Y123H+Y147R;V82S+Y123H+Q154R;Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y123H+Y147R+Q154R+I76Y;V82S+Y123H+Y147R+Q154R;およびI76Y + V82S + Y123H + Y147R + Q154Rからなる群から選択される改変の組合せを含む、請求項119または120に記載の方法。
  122. 前記少なくとも1つの改変が、Y147T + Q154Sを含む、請求項119~121のいずれか一項に記載の方法。
  123. 前記ガイドポリヌクレオチドが、
    a) GACCUAGGCGAGGCAGUAGG;
    b) CCAGUAUGGACACUGUCCAAA;
    c) CAGUAUGGACACUGUCCAAA; および
    d) AGUAUGGACACUGUCCAAAG
    からなる群から選択される核酸配列を含む、請求項109~122のいずれか一項に記載の方法。
  124. 前記アデノシンデアミナーゼが、TadAデアミナーゼである、請求項109に記載の方法。
  125. 前記TadAデアミナーゼが、TadA*8バリアントである、請求項124に記載の方法。
  126. 前記TadA*8バリアントが、TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23、TadA*8.24からなる群から選択される、請求項125に記載の方法。
  127. 前記アデノシンデアミナーゼ塩基エディター8(ABE8)が、ABE8.1-m、ABE8.2-m、ABE8.3-m、ABE8.4-m、ABE8.5-m、ABE8.6-m、ABE8.7-m、ABE8.8-m、ABE8.9-m、ABE8.10-m、ABE8.11-m、ABE8.12-m、ABE8.13-m、ABE8.14-m、ABE8.15-m、ABE8.16-m、ABE8.17-m、ABE8.18-m、ABE8.19-m、ABE8.20-m、ABE8.21-m、ABE8.22-m、ABE8.23-m、ABE8.24-m、ABE8.1-d、ABE8.2-d、ABE8.3-d、ABE8.4-d、ABE8.5-d、ABE8.6-d、ABE8.7-d、ABE8.8-d、ABE8.9-d、ABE8.10-d、ABE8.11-d、ABE8.12-d、ABE8.13-d、ABE8.14-d、ABE8.15-d、ABE8.16-d、ABE8.17-d、ABE8.18-d、ABE8.19-d、ABE8.20-d、ABE8.21-d、ABE8.22-d、ABE8.23-d、またはABE8.24-dからなる群から選択される、請求項109に記載の方法。
  128. 前記1つまたは複数のガイドRNAが、CRISPR RNA (crRNA)およびトランスコード小RNA (tracrRNA)を含み、前記crRNAが、GSD1aに関連する前記SNPを含むG6PC核酸配列に相補的な核酸配列を含む、請求項109~127のいずれか一項に記載の方法。
  129. 前記塩基エディターが、GSD1aに関連する前記SNPを含むG6PC核酸配列に相補的な核酸配列を含む単一ガイドRNA(sgRNA)と複合体を形成する、請求項109~128のいずれか一項に記載の方法。
  130. 糖原病1a型(GSD1a)に関連する一塩基多型(SNP)を含むグルコース-6-ホスファターゼ(G6PC)ポリヌクレオチドを編集する方法であって、前記G6PCポリヌクレオチドを、1つまたは複数のガイドポリヌクレオチドと複合体を形成したアデノシンデアミナーゼ塩基エディター8(ABE8)と接触させることを含み、前記アデノシンデアミナーゼ塩基エディター8(ABE8)が、Cas9またはCas12ポリペプチド内に挿入されたアデノシンデアミナーゼバリアントドメインを含み、前記ガイドポリヌクレオチドのうちの1つまたは複数が前記塩基エディターをターゲティングしてGSD1aに関連する前記SNPのA・TからG・Cへの改変をもたらす、方法。
  131. 対象における糖原病1a型(GSD1a)を治療する方法であって、前記対象に、
    Cas9もしくはCas12ポリペプチド内に挿入されたアデノシンデアミナーゼバリアントを含むアデノシンデアミナーゼ塩基エディター8(ABE8)、または前記塩基エディターをコードするポリヌクレオチドと、
    前記アデノシンデアミナーゼ塩基エディター8(ABE8)をターゲティングしてGSD1aに関連するSNPのA・TからG・Cへの改変をもたらす1つまたは複数のガイドポリヌクレオチドと
    を投与し、それにより前記対象におけるGSD1aを治療することを含む方法。
  132. 対象における糖原病1a型(GSD1a)を治療する方法であって、前記対象に、
    Cas9もしくはCas12ポリペプチド内に挿入されたアデノシンデアミナーゼバリアントを含む融合タンパク質、または前記融合タンパク質をコードするポリヌクレオチドと、
    前記融合タンパク質をターゲティングしてGSD1aに関連する一塩基多型(SNP)のA・TからG・Cへの改変をもたらす1つまたは複数のガイドポリヌクレオチドと
    を投与し、それにより前記対象におけるGSD1aを治療することを含む方法。
  133. 前記アデノシンデアミナーゼ塩基エディター8(ABE8)が、ABE8.1-m、ABE8.2-m、ABE8.3-m、ABE8.4-m、ABE8.5-m、ABE8.6-m、ABE8.7-m、ABE8.8-m、ABE8.9-m、ABE8.10-m、ABE8.11-m、ABE8.12-m、ABE8.13-m、ABE8.14-m、ABE8.15-m、ABE8.16-m、ABE8.17-m、ABE8.18-m、ABE8.19-m、ABE8.20-m、ABE8.21-m、ABE8.22-m、ABE8.23-m、ABE8.24-m、ABE8.1-d、ABE8.2-d、ABE8.3-d、ABE8.4-d、ABE8.5-d、ABE8.6-d、ABE8.7-d、ABE8.8-d、ABE8.9-d、ABE8.10-d、ABE8.11-d、ABE8.12-d、ABE8.13-d、ABE8.14-d、ABE8.15-d、ABE8.16-d、ABE8.17-d、ABE8.18-d、ABE8.19-d、ABE8.20-d、ABE8.21-d、ABE8.22-d、ABE8.23-d、またはABE8.24-dからなる群から選択される、請求項130または131に記載の方法。
  134. 前記アデノシンデアミナーゼバリアントが、
    MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
    のアミノ酸配列を含み、前記アミノ酸配列が、少なくとも1つの改変を含む、請求項130~133のいずれか一項に記載の方法。
  135. 前記アデノシンデアミナーゼバリアントが、アミノ酸位置82および/または166で改変を含む、請求項134に記載の方法。
  136. 前記少なくとも1つの改変が、V82S、T166R、Y147T、Y147R、Q154S、Y123H、および/またはQ154Rを含む、請求項134または135に記載の方法。
  137. 前記アデノシンデアミナーゼバリアントが、以下の改変の組合せ:
    Y147T+Q154R;Y147T+Q154S;Y147R+Q154S;V82S+Q154S;V82S+Y147R;V82S+Q154R;V82S+Y123H;I76Y+V82S;V82S+Y123H+Y147T;V82S+Y123H+Y147R;V82S+Y123H+Q154R;Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y123H+Y147R+Q154R+I76Y;V82S+Y123H+Y147R+Q154R;およびI76Y + V82S + Y123H + Y147R + Q154Rのうちの1つを含む、請求項134~136のいずれか一項に記載の方法。
  138. 前記アデノシンデアミナーゼバリアントが、TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23、TadA*8.24である、請求項130~137のいずれか一項に記載の方法。
  139. 前記アデノシンデアミナーゼバリアントが、149、150、151、152、153、154、155、156、および157からなる群から選択される残基で始まるC末端の欠失を含む、請求項134~138のいずれか一項に記載の方法。
  140. 前記アデノシンデアミナーゼバリアントが、TadA*8アデノシンデアミナーゼバリアントドメインを含むアデノシンデアミナーゼモノマーである、請求項130~139のいずれか一項に記載の方法。
  141. 前記アデノシンデアミナーゼバリアントが、野生型アデノシンデアミナーゼドメインとTadA*8アデノシンデアミナーゼバリアントドメインとを含むアデノシンデアミナーゼヘテロ二量体である、請求項130~139のいずれか一項に記載の方法。
  142. 前記アデノシンデアミナーゼバリアントが、TadAドメインとTadA*8アデノシンデアミナーゼバリアントドメインとを含むアデノシンデアミナーゼヘテロ二量体である、請求項130~139のいずれか一項に記載の方法。
  143. GSD1aに関連する前記SNPが、グルコース-6-ホスファターゼ(G6PC)遺伝子に位置する、請求項131~142のいずれか一項に記載の方法。
  144. GSD1aに関連する前記SNPでのA・TからG・Cへの前記改変により、前記G6PCポリペプチドにおいてグルタミン(Q)が非グルタミン(X)アミノ酸に変化するかまたはアルギニン(R)が非アルギニン(X)に変化する、請求項130または143に記載の方法。
  145. GSD1aに関連する前記SNPでのA・TからG・Cへの前記改変により、位置347で非グルタミン(X)アミノ酸を有するかまたは位置83で非アルギニン(X)アミノ酸を有するG6PCポリペプチドの発現をもたらす、請求項130または143~144のいずれか一項に記載の方法。
  146. GSD1aに関連する前記SNPでのA・TからG・Cへの前記改変により、位置347での前記非グルタミンアミノ酸(X)がグルタミンで置き換えられるかまたは位置83での前記非アルギニンアミノ酸(X)がアルギニンで置き換えられる、請求項130または143~145のいずれか一項に記載の方法。
  147. GSD1aに関連する前記SNPでのA・TからG・Cへの前記改変により、アミノ酸位置347で早期に終結するかまたは位置83のシステインで早期に終結するG6PCポリペプチドの発現をもたらす、請求項130または143~146のいずれか一項に記載の方法。
  148. 前記SNPでのA・TからG・Cへの前記改変が、Q347Xおよび/またはR83Cのうちの1つまたは複数をコードする、請求項130または143~147のいずれか一項に記載の方法。
  149. 前記アデノシンデアミナーゼバリアントが、前記Cas9またはCas12ポリペプチドの柔軟なループ、アルファヘリックス領域、非構造化部分、または溶媒接触可能部分内に挿入されている、請求項130~148のいずれか一項に記載の方法。
  150. 前記アデノシンデアミナーゼバリアントが、前記Cas9またはCas12ポリペプチドのN末端断片およびC末端断片によって隣接される、請求項130~149のいずれか一項に記載の方法。
  151. 前記融合タンパク質またはアデノシンデアミナーゼ塩基エディター8(ABE8)が、構造NH2-[前記Cas9またはCas12ポリペプチドのN末端断片]-[アデノシンデアミナーゼバリアント]-[前記Cas9またはCas12ポリペプチドのC末端断片]-COOHを含み、ここで「]-[」の各記載は任意のリンカーである、請求項150に記載の方法。
  152. 前記N末端断片のC末端または前記C末端断片のN末端が、前記Cas9または前記Cas12ポリペプチドの柔軟なループの一部を含み、必要に応じて、前記柔軟なループが、標的核酸塩基に近接するアミノ酸を含む、請求項150または151に記載の方法。
  153. 前記1つまたは複数のガイドポリヌクレオチドが前記融合タンパク質またはアデノシンデアミナーゼ塩基エディター8(ABE8)を誘導して標的核酸塩基の脱アミノ化をもたらす、請求項130~152のいずれか一項に記載の方法。
  154. 前記SNP標的核酸塩基の前記脱アミノ化により、前記標的核酸塩基が非野生型核酸塩基で置き換えられ、前記標的核酸塩基の前記脱アミノ化によりGSD1aの症状が改善される、請求項153に記載の方法。
  155. 前記標的核酸塩基が、標的ポリヌクレオチド配列中のPAM配列から1~20個の核酸塩基離れている、請求項152~154のいずれか一項に記載の方法。
  156. 前記標的核酸塩基が、前記PAM配列の2~12個の核酸塩基上流である、請求項152~155のいずれか一項に記載の方法。
  157. 前記Cas9またはCas12ポリペプチドの前記N末端断片または前記C末端断片が、前記標的ポリヌクレオチド配列に結合する、請求項150~156のいずれか一項に記載の方法。
  158. 前記N末端断片もしくは前記C末端断片が、RuvCドメインを含むか、
    前記N末端断片もしくは前記C末端断片が、HNHドメインを含むか、
    前記N末端断片も前記C末端断片もHNHドメインを含まないか、または
    前記N末端断片も前記C末端断片もRuvCドメインを含まない、
    請求項150~157のいずれか一項に記載の方法。
  159. 前記Cas9またはCas12ポリペプチドが、1つまたは複数の構造ドメインでの部分的なまたは完全な欠失を含み、前記デアミナーゼが、前記Cas9またはCas12ポリペプチドの部分的なまたは完全な欠失位置に挿入されている、請求項150~158のいずれか一項に記載の方法。
  160. 前記欠失が、RuvCドメイン内にあるか、
    前記欠失が、HNHドメイン内にあるか、または
    前記欠失が、RuvCドメインとC末端ドメインとを、L-IドメインとHNHドメインとを、もしくはRuvCドメインとL-Iドメインとを架橋する、
    請求項159に記載の方法。
  161. 前記融合タンパク質またはアデノシンデアミナーゼ塩基エディター8(ABE8)が、Cas9ポリペプチドを含む、請求項130~160のいずれか一項に記載の方法。
  162. 前記Cas9ポリペプチドが、Streptococcus pyogenes Cas9 (SpCas9)、Staphylococcus aureus Cas9 (SaCas9)、Streptococcus thermophilus 1 Cas9 (St1Cas9)、またはこれらのバリアントである、請求項161に記載の方法。
  163. 前記Cas9ポリペプチドが、以下のアミノ酸配列(Cas9参照配列):
    Figure 2022519882000064
    (一重下線:HNHドメイン;二重下線:RuvCドメイン)、またはその対応する領域を有する、請求項161または162に記載の方法。
  164. 前記Cas9ポリペプチドが、前記Cas9ポリペプチド参照配列における番号付けでアミノ酸1017~1069もしくはその対応するアミノ酸の欠失を含むか、
    前記Cas9ポリペプチドが、Cas9ポリペプチド参照配列における番号付けでアミノ酸792~872もしくはその対応するアミノ酸の欠失を含むか、または
    前記Cas9ポリペプチドが、Cas9ポリペプチド参照配列における番号付けでアミノ酸792~906もしくはその対応するアミノ酸の欠失を含む、
    請求項163に記載の方法。
  165. 前記アデノシンデアミナーゼバリアントが、前記Cas9ポリペプチドの柔軟なループ内に挿入されている、請求項161~164のいずれか一項に記載の方法。
  166. 前記柔軟なループが、前記Cas9参照配列における番号付けで位置530~537、569~579、686~691、768~793、943~947、1002~1040、1052~1077、1232~1248、および1298~1300、またはこれらの対応するアミノ酸位置でのアミノ酸残基からなる群から選択される領域を含む、請求項165に記載の方法。
  167. 前記デアミナーゼが、前記Cas9参照配列における番号付けでアミノ酸位置768~769、791~792、792~793、1015~1016、1022~1023、1026~1027、1029~1030、1040~1041、1052~1053、1054~1055、1067~1068、1068~1069、1247~1248、もしくは1248~1249、またはこれらの対応するアミノ酸位置の間に挿入されている、請求項163~166のいずれか一項に記載の方法。
  168. 前記デアミナーゼが、前記Cas9参照配列における番号付けでアミノ酸位置768~769、792~793、1022~1023、1026~1027、1040~1041、1068~1069、もしくは1247~1248、またはこれらの対応するアミノ酸位置の間に挿入されている、請求項163~167のいずれか一項に記載の方法。
  169. 前記デアミナーゼが、前記Cas9参照配列における番号付けでアミノ酸位置1016~1017、1023~1024、1029~1030、1040~1041、1069~1070、もしくは1247~1248、またはこれらの対応するアミノ酸位置の間に挿入されている、請求項163~168のいずれか一項に記載の方法。
  170. 前記アデノシンデアミナーゼバリアントが、表10Aで同定されている遺伝子座で前記Cas9ポリペプチド内に挿入されている、請求項163~169のいずれか一項に記載の方法。
  171. 前記N末端断片が、前記Cas9参照配列のアミノ酸残基1~529、538~568、580~685、692~942、948~1001、1026~1051、1078~1231、および/もしくは1248~1297、またはこれらの対応する残基を含む、請求項163~170のいずれか一項に記載の方法。
  172. 前記C末端断片が、前記Cas9参照配列のアミノ酸残基1301~1368、1248~1297、1078~1231、1026~1051、948~1001、692~942、580~685、および/もしくは538~568、またはこれらの対応する残基を含む、請求項163~171のいずれか一項に記載の方法。
  173. 前記Cas9ポリペプチドがニッカーゼであるか、または前記Cas9ポリペプチドがヌクレアーゼ不活性である、請求項161~172のいずれか一項に記載の方法。
  174. 前記Cas9ポリペプチドが、改変SpCas9であり、改変されたPAMに対する特異性を有するかまたは非G PAMに対する特異性を有する、請求項161~173のいずれか一項に記載の方法。
  175. 前記改変SpCas9ポリペプチドが、アミノ酸置換D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、およびT1337Rを含み(SpCas9-MQKFRAER)、前記改変されたPAMである5'-NGC-3'に対する特異性を有する、請求項174に記載の方法。
  176. 前記アデノシンデアミナーゼバリアントが、Cas12ポリペプチドに挿入されている、請求項130~160のいずれか一項に記載の方法。
  177. 前記Cas12ポリペプチドが、Cas12a、Cas12b、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、またはCas12iである、請求項176に記載の方法。
  178. 前記アデノシンデアミナーゼバリアントが、以下のアミノ酸位置の間:
    a) BhCas12bの153~154、255~256、306~307、980~981、1019~1020、534~535、604~605、もしくは344~345、またはCas12a、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、もしくはCas12iの対応するアミノ酸残基;
    b) BvCas12bの147および148、248および249、299および300、991および992、もしくは1031および1032、またはCas12a、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、もしくはCas12iの対応するアミノ酸残基;または
    c) AaCas12bの157および158、258および259、310および311、1008および1009、もしくは1044および1045、またはCas12a、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、もしくはCas12iの対応するアミノ酸残基
    に挿入されている、請求項176または177に記載の方法。
  179. 前記アデノシンデアミナーゼバリアントが、表10Bで同定されている遺伝子座で前記Cas12ポリペプチド内に挿入されている、請求項176~178のいずれか一項に記載の方法。
  180. 前記Cas12ポリペプチドが、Cas12bである、請求項176~179のいずれか一項に記載の方法。
  181. 前記Cas12ポリペプチドが、BhCas12bドメイン、BvCas12bドメイン、またはAACas12bドメインを含む、請求項176~180のいずれか一項に記載の方法。
  182. 前記ガイドRNAが、CRISPR RNA (crRNA)およびトランス活性化crRNA (tracrRNA)を含み、前記crRNAが、GSD1aに関連する前記SNPを含むG6PC核酸配列に相補的な核酸配列を含む、請求項130~181のいずれか一項に記載の方法。
  183. 前記対象が、哺乳動物またはヒトである、請求項131~182のいずれか一項に記載の方法。
  184. ポリヌクレオチドプログラム可能なDNA結合ドメインと、アデノシンデアミナーゼバリアントドメインとを含むアデノシンデアミナーゼ塩基エディター8(ABE8)の有効量を含む、糖原病1a型(GSD1a)の治療のための医薬組成物。
  185. 前記アデノシンデアミナーゼ塩基エディター8(ABE8)をターゲティングしてGSD1aに関連するSNPのA・TからG・Cへの改変をもたらすことができる1つまたは複数のガイドポリヌクレオチドをさらに含む、請求項184に記載の医薬組成物。
  186. 前記アデノシンデアミナーゼバリアントドメインが、前記ポリヌクレオチドプログラム可能なDNA結合ドメイン内に挿入されている、請求項184または185に記載の医薬組成物。
  187. 前記アデノシンデアミナーゼ塩基エディター8(ABE8)が、ABE8.1-m、ABE8.2-m、ABE8.3-m、ABE8.4-m、ABE8.5-m、ABE8.6-m、ABE8.7-m、ABE8.8-m、ABE8.9-m、ABE8.10-m、ABE8.11-m、ABE8.12-m、ABE8.13-m、ABE8.14-m、ABE8.15-m、ABE8.16-m、ABE8.17-m、ABE8.18-m、ABE8.19-m、ABE8.20-m、ABE8.21-m、ABE8.22-m、ABE8.23-m、ABE8.24-m、ABE8.1-d、ABE8.2-d、ABE8.3-d、ABE8.4-d、ABE8.5-d、ABE8.6-d、ABE8.7-d、ABE8.8-d、ABE8.9-d、ABE8.10-d、ABE8.11-d、ABE8.12-d、ABE8.13-d、ABE8.14-d、ABE8.15-d、ABE8.16-d、ABE8.17-d、ABE8.18-d、ABE8.19-d、ABE8.20-d、ABE8.21-d、ABE8.22-d、ABE8.23-d、またはABE8.24-dからなる群から選択される、請求項184~186のいずれか一項に記載の医薬組成物。
  188. 請求項33~76のいずれか一項に記載の細胞の有効量を含む、糖原病1a型(GSD1a)の治療のための医薬組成物。
  189. 薬学的に許容される賦形剤をさらに含む、請求項184~188のいずれか一項に記載の医薬組成物。
  190. 糖原病1a型(GSD1a)の治療のためのキットであって、ポリヌクレオチドプログラム可能なDNA結合ドメインおよびアデノシンデアミナーゼドメインを含むアデノシンデアミナーゼ塩基エディター8(ABE8)と、前記アデノシンデアミナーゼ塩基エディター8(ABE8)をターゲティングしてGSD1aに関連するSNPのA・TからG・Cへの改変をもたらすことができる1つまたは複数のガイドポリヌクレオチドとを含むキット。
  191. 糖原病1a型(GSD1a)の治療のためのキットであって、請求項37~76のいずれか一項に記載の細胞を含むキット。
  192. 1つまたは複数のガイドポリヌクレオチドと複合体を形成したアデノシンデアミナーゼ塩基エディター8(ABE8)を含む塩基エディターであって、前記アデノシンデアミナーゼ塩基エディター8(ABE8)が、ポリヌクレオチドプログラム可能なDNA結合ドメインと、アデノシンデアミナーゼドメインとを含み、前記ガイドポリヌクレオチドのうちの1つまたは複数が前記塩基エディターをターゲティングしてGSD1aに関連するSNPのA・TからG・Cへの改変をもたらす、塩基エディター。
  193. アデノシンデアミナーゼバリアントが、V82S改変および/またはT166R改変を含む、請求項192に記載の塩基エディターシステム。
  194. 前記アデノシンデアミナーゼバリアントが、以下の改変:Y147T、Y147R、Q154S、Y123H、およびQ154Rのうちの1つまたは複数をさらに含む、請求項193に記載の塩基エディターシステム。
  195. 前記塩基エディタードメインが、野生型アデノシンデアミナーゼドメインとアデノシンデアミナーゼバリアントとを含むアデノシンデアミナーゼヘテロ二量体を含む、請求項193または194に記載の塩基エディターシステム。
  196. 前記アデノシンデアミナーゼバリアントが、完全長TadA8に対して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のN末端アミノ酸残基を欠失している切詰め型のTadA8である、請求項192~195のいずれか一項に記載の塩基エディター。
  197. 前記アデノシンデアミナーゼバリアントが、完全長TadA8に対して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のC末端アミノ酸残基を欠失している切詰め型のTadA8である、請求項192~196のいずれか一項に記載の塩基エディター。
  198. 前記ポリヌクレオチドプログラム可能なDNA結合ドメインが、改変Staphylococcus aureus Cas9 (SaCas9)、Streptococcus thermophilus 1 Cas9 (St1Cas9)、改変Streptococcus pyogenes Cas9 (SpCas9)、またはこれらのバリアントである、請求項192~197のいずれか一項に記載の塩基エディターシステム。
  199. 前記ポリヌクレオチドプログラム可能なDNA結合ドメインが、改変されたプロトスペーサー隣接モチーフ(PAM)特異性を有するかまたは非G PAMに対する特異性を有する、SpCas9のバリアントである、請求項198に記載の塩基エディターシステム。
  200. 前記ポリヌクレオチドプログラム可能なDNA結合ドメインが、ヌクレアーゼ不活性Cas9である、請求項198に記載の塩基エディターシステム。
  201. 前記ポリヌクレオチドプログラム可能なDNA結合ドメインが、Cas9ニッカーゼである、請求項198に記載の塩基エディターシステム。
  202. 1つまたは複数のガイドRNA、ならびに以下の配列:
    EIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFMQPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAKFLQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPRAFKYFDTTIARKEYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDGGSGGSGGSGGSGGSGGSGGMDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEGADKRTADGSEFESPKKKRKV*
    (ここで、太字の配列は、Cas9に由来する配列を示し、イタリック体の配列は、リンカー配列を示し、下線が引かれた配列は、二部分核局在化配列を示す)を含むポリヌクレオチドプログラム可能なDNA結合ドメインと、
    MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
    のアミノ酸位置82および/または166で改変を含むアデノシンデアミナーゼバリアントを含む少なくとも1つの塩基エディタードメインとを含む融合タンパク質を含む塩基エディターシステムであって、前記ガイドポリヌクレオチドのうちの1つまたは複数が前記塩基エディターをターゲティングしてGSD1aに関連するSNPのA・TからG・Cへの改変をもたらす、塩基エディターシステム。
  203. 請求項192~202のいずれか一項に記載の塩基エディターシステムを含む細胞。
  204. 前記細胞が、ヒト細胞または哺乳動物細胞である、請求項203に記載の細胞。
  205. 前記細胞が、エクスビボ、インビボ、またはインビトロである、請求項203に記載の細胞。
JP2021546892A 2019-02-13 2020-02-13 糖原病1a型を治療するための組成物および方法 Pending JP2022519882A (ja)

Applications Claiming Priority (17)

Application Number Priority Date Filing Date Title
US201962805271P 2019-02-13 2019-02-13
US62/805,271 2019-02-13
US201962852224P 2019-05-23 2019-05-23
US201962852228P 2019-05-23 2019-05-23
US62/852,228 2019-05-23
US62/852,224 2019-05-23
US201962876354P 2019-07-19 2019-07-19
US62/876,354 2019-07-19
US201962912992P 2019-10-09 2019-10-09
US62/912,992 2019-10-09
US201962931722P 2019-11-06 2019-11-06
US62/931,722 2019-11-06
US201962941569P 2019-11-27 2019-11-27
US62/941,569 2019-11-27
US202062966526P 2020-01-27 2020-01-27
US62/966,526 2020-01-27
PCT/US2020/018124 WO2020168088A1 (en) 2019-02-13 2020-02-13 Compositions and methods for treating glycogen storage disease type 1a

Publications (2)

Publication Number Publication Date
JP2022519882A true JP2022519882A (ja) 2022-03-25
JPWO2020168088A5 JPWO2020168088A5 (ja) 2023-02-17

Family

ID=72045644

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021546892A Pending JP2022519882A (ja) 2019-02-13 2020-02-13 糖原病1a型を治療するための組成物および方法

Country Status (8)

Country Link
US (1) US20220127594A1 (ja)
EP (1) EP3924478A4 (ja)
JP (1) JP2022519882A (ja)
KR (1) KR20210129108A (ja)
CN (1) CN114026237A (ja)
AU (1) AU2020221355A1 (ja)
CA (1) CA3128886A1 (ja)
WO (1) WO2020168088A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019178427A1 (en) 2018-03-14 2019-09-19 Arbor Biotechnologies, Inc. Novel crispr dna targeting enzymes and systems
AU2020397041A1 (en) * 2019-12-04 2022-06-09 Arbor Biotechnologies, Inc. Compositions comprising a nuclease and uses thereof
WO2022081890A1 (en) * 2020-10-14 2022-04-21 Beam Therapeutics Inc. Compositions and methods for treating glycogen storage disease type 1a

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL258821B (en) * 2015-10-23 2022-07-01 Harvard College Nucleobase editors and their uses
EP3371305A1 (en) * 2015-11-06 2018-09-12 Crispr Therapeutics AG Materials and methods for treatment of glycogen storage disease type 1a
CN117731805A (zh) * 2016-03-30 2024-03-22 因特利亚治疗公司 用于crispr/cas成分的脂质纳米颗粒制剂
WO2018020323A2 (en) * 2016-07-25 2018-02-01 Crispr Therapeutics Ag Materials and methods for treatment of fatty acid disorders
IL264565B1 (en) * 2016-08-03 2024-03-01 Harvard College Adenosine nuclear base editors and their uses
US20200030381A1 (en) * 2017-02-28 2020-01-30 Vor Biopharma, Inc Compositions and methods for inhibition of lineage specific proteins
CN111328290A (zh) * 2017-06-26 2020-06-23 博德研究所 用于靶向核酸编辑的基于crispr/cas-腺嘌呤脱氨酶的组合物、系统和方法
US11168322B2 (en) * 2017-06-30 2021-11-09 Arbor Biotechnologies, Inc. CRISPR RNA targeting enzymes and systems and uses thereof
WO2019023680A1 (en) * 2017-07-28 2019-01-31 President And Fellows Of Harvard College METHODS AND COMPOSITIONS FOR EVOLUTION OF BASIC EDITORS USING PHAGE-ASSISTED CONTINUOUS EVOLUTION (PACE)
CN112469824A (zh) * 2018-05-11 2021-03-09 比姆医疗股份有限公司 利用可编程碱基编辑器系统编辑单核苷酸多态性的方法
EP4100519A2 (en) * 2020-02-05 2022-12-14 The Broad Institute, Inc. Adenine base editors and uses thereof

Also Published As

Publication number Publication date
KR20210129108A (ko) 2021-10-27
US20220127594A1 (en) 2022-04-28
EP3924478A1 (en) 2021-12-22
AU2020221355A1 (en) 2021-08-12
EP3924478A4 (en) 2023-01-25
CN114026237A (zh) 2022-02-08
CA3128886A1 (en) 2020-08-20
WO2020168088A1 (en) 2020-08-20

Similar Documents

Publication Publication Date Title
US20230075877A1 (en) Novel nucleobase editors and methods of using same
WO2020168132A1 (en) Adenosine deaminase base editors and methods of using same to modify a nucleobase in a target sequence
US11752202B2 (en) Compositions and methods for treating hemoglobinopathies
JP2021523737A (ja) プログラム可能塩基エディターシステムを用いて病原性アミノ酸を置換する方法
WO2020168051A9 (en) Methods of editing a disease-associated gene using adenosine deaminase base editors, including for the treatment of genetic disease
US20220387622A1 (en) Methods of editing a single nucleotide polymorphism using programmable base editor systems
CN114072509A (zh) 脱氨反应脱靶减低的核碱基编辑器和使用其修饰核碱基靶序列的方法
JP2022519882A (ja) 糖原病1a型を治療するための組成物および方法
US20230101597A1 (en) Compositions and methods for treating alpha-1 antitrypsin deficiency
JP2022519507A (ja) 低減された非標的脱アミノ化を有する核酸塩基エディターおよび核酸塩基エディターの特徴づけのためのアッセイ
US20220313799A1 (en) Compositions and methods for editing a mutation to permit transcription or expression
CN114929287A (zh) 用于治疗乙型肝炎的组合物和方法
US20220290164A1 (en) Recombinant rabies viruses for gene therapy
US20230383277A1 (en) Compositions and methods for treating glycogen storage disease type 1a
US20230270840A1 (en) Viral guide rna delivery
WO2023049935A1 (en) Compositions and methods for treating hepatitis b virus infection

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230209

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240220