JP2022520081A - アデノシンデアミナーゼ塩基エディターおよびそれを用いて標的配列中の核酸塩基を改変する方法 - Google Patents

アデノシンデアミナーゼ塩基エディターおよびそれを用いて標的配列中の核酸塩基を改変する方法 Download PDF

Info

Publication number
JP2022520081A
JP2022520081A JP2021546894A JP2021546894A JP2022520081A JP 2022520081 A JP2022520081 A JP 2022520081A JP 2021546894 A JP2021546894 A JP 2021546894A JP 2021546894 A JP2021546894 A JP 2021546894A JP 2022520081 A JP2022520081 A JP 2022520081A
Authority
JP
Japan
Prior art keywords
fusion protein
tada
cas9
adenosine deaminase
domain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021546894A
Other languages
English (en)
Other versions
JPWO2020168132A5 (ja
Inventor
ニコル ゴーデッリ、
マイケル パッカー、
イアン スレイメイカー、
イ ユ、
ベルンド ゼッツェ、
ジェイソン マイケル ゲールケ、
ナタリー ペトロシャン、
アンジェリカ メッサーナ、
イボンヌ アラティン、
フランシーヌ グレゴワール、
ジェネシス ラング、
シャウナ バーコヴィッチ、
デイビッド エー. ボーン、
スン―ジュ イ、
Original Assignee
ビーム セラピューティクス インク.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ビーム セラピューティクス インク. filed Critical ビーム セラピューティクス インク.
Publication of JP2022520081A publication Critical patent/JP2022520081A/ja
Publication of JPWO2020168132A5 publication Critical patent/JPWO2020168132A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04004Adenosine deaminase (3.5.4.4)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/09Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
    • C07K2319/81Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor containing a Zn-finger domain for DNA binding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04005Cytidine deaminase (3.5.4.5)

Abstract

本開示は、増加した効率を有する新規のアデノシン塩基エディター(例えばABE8)を含む組成物および標的配列を編集するためにこれらのアデノシンデアミナーゼバリアントを使用する方法を提供する。

Description

関連出願の相互参照
本出願は、2019年2月13日に出願された米国仮出願第62/805,271号、2019年2月13日に出願された同第62/805,238号、2019年2月13日に出願された同第62/805,277号、2019年5月23日に出願された同第62/852,228号、2019年5月23日に出願された同第62/852,224号、2019年7月11日に出願された同第62/873,138号、2019年7月11日に出願された同第62/873,140号、2019年7月11日に出願された同第62/873,144号、2019年7月19日に出願された同第62/876,354号、2019年8月19日に出願された同第62/888,867号、2019年10月9日に出願された同第62/912,992号、2019年11月6日に出願された同第62/931,722号、2019年11月6日に出願された同第62/931,747号、2019年11月27日に出願された同第62/941,523号、2019年11月27日に出願された同第62/941,569号、および2020年1月27日に出願された同第62/966,526号の優先権および利益を主張する国際PCT出願であり、これらのすべての内容は参照により全体が本明細書に組み込まれる。
参照による組み込み
本明細書において言及されるすべての刊行物、特許、および特許出願は、各個々の刊行物、特許、または特許出願が、参照により本明細書に組み込まれることを特におよび個々に指し示されたのと同じ程度まで、参照により本明細書に組み込まれる。他にいかなる指摘もなければ、本明細書において言及される刊行物、特許、および特許出願は参照により全体が本明細書に組み込まれる。
開示の背景
核酸配列の標的化された編集、例えば、ゲノムDNAの標的化された切断または標的化された改変は、遺伝子機能の研究のための非常に有望なアプローチであり、そしてまた、ヒト遺伝子疾患に対する新たな療法を提供する潜在能力を有する。現在利用可能な塩基エディターとしては、標的C・G塩基対をT・Aに変換するシチジン塩基エディター(例えばBE4)およびA・TをG・Cに変換するアデニン塩基エディター(例えばABE7.10)が挙げられる。より高い特異性および効率と共に標的配列内の改変を誘導することができる改善された塩基エディターに対する必要性が当該分野において存在する。
本発明は、増加した効率を有する新規のアデニン塩基エディター(例えばABE8)を含む組成物、および標的配列を編集するためにアデノシンデアミナーゼバリアントを含む塩基エディターを使用する方法を提供する。
一態様において、本発明は、ポリヌクレオチドプログラム可能なDNA結合ドメイン、ならびに
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
のアミノ酸位置82および/もしくは166における改変、または
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSST
のバリアント中の位置82および/もしくは166に対応する改変を含むアデノシンデアミナーゼバリアントである少なくとも1つの塩基エディタードメインを含む、融合タンパク質を提供する。いくつかの実施形態において、本発明は、ポリヌクレオチドプログラム可能なDNA結合ドメイン、ならびに
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD、またはそれに対して少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、もしくは99%の同一性であるアミノ酸配列のアミノ酸位置82および/または166における改変を含むアデノシンデアミナーゼバリアントである少なくとも1つの塩基エディタードメインを含む、融合タンパク質を提供する。いくつかの実施形態において、アデノシンデアミナーゼバリアントは、以下のアデノシンデアミナーゼのいずれか、またはそれに対する任意のバリアント中の
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
に対応するアミノ酸位置82および/または166における改変を含む:
Staphylococcus aureus (S. aureus) TadA:
MGSHMTNDIYFMTLAIEEAKKAAQLGEVPIGAIITKDDEVIARAHNLRETLQQPTAHAEHIAIERAAKVLGSWRLEGCTLYVTLEPCVMCAGTIVMSRIPRVVYGADDPKGGCSGSLMNLLQQSNFNHRAIVDKGVLKEACSTLLTTFFKNLRANKKSTN
Bacillus subtilis (B. subtilis) TadA:
MTQDELYMKEAIKEAKKAEEKGEVPIGAVLVINGEIIARAHNLRETEQRSIAHAEMLVIDEACKALGTWRLEGATLYVTLEPCPMCAGAVVLSRVEKVVFGAFDPKGGCSGTLMNLLQEERFNHQAEVVSGVLEEECGGMLSAFFRELRKKKKAARKNLSE
Salmonella typhimurium (S. typhimurium) TadA:
MPPAFITGVTSLSDVELDHEYWMRHALTLAKRAWDEREVPVGAVLVHNHRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVLQNYRLLDTTLYVTLEPCVMCAGAMVHSRIGRVVFGARDAKTGAAGSLIDVLHHPGMNHRVEIIEGVLRDECATLLSDFFRMRRQEIKALKKADRAEGAGPAV
Shewanella putrefaciens (S. putrefaciens) TadA:
MDEYWMQVAMQMAEKAEAAGEVPVGAVLVKDGQQIATGYNLSISQHDPTAHAEILCLRSAGKKLENYRLLDATLYITLEPCAMCAGAMVHSRIARVVYGARDEKTGAAGTVVNLLQHPAFNHQVEVTSGVLAEACSAQLSRFFKRRRDEKKALKLAQRAQQGIE
Haemophilus influenzae F3031 (H. influenzae) TadA:
MDAAKVRSEFDEKMMRYALELADKAEALGEIPVGAVLVDDARNIIGEGWNLSIVQSDPTΑΗAEIIALRNGAKNIQNYRLLNSTLYVTLEPCTMCAGAILHSRIKRLVFGASDYKTGAIGSRFHFFDDYKMNHTLEITSGVLAEECSQKLSTFFQKRREEKKIEKALLKSLSDK
Caulobacter crescentus (C. crescentus) TadA:
MRTDESEDQDHRMMRLALDAARAAAEAGETPVGAVILDPSTGEVIATAGNGPIAAHDPTAHAEIAAMRAAAAKLGNYRLTDLTLVVTLEPCAMCAGAISHARIGRVVFGADDPKGGAVVHGPKFFAQPTCHWRPEVTGGVLADESADLLRGFFRARRKAKI
Geobacter sulfurreducens (G. sulfurreducens) TadA:
MSSLKKTPIRDDAYWMGKAIREAAKAAARDEVPIGAVIVRDGAVIGRGHNLREGSNDPSAHAEMIAIRQAARRSANWRLTGATLYVTLEPCLMCMGAIILARLERVVFGCYDPKGGAAGSLYDLSADPRLNHQVRLSPGVCQEECGTMLSDFFRDLRRRKKAKATPALFIDERKVPPEP
いくつかの実施形態において、ポリヌクレオチドプログラム可能なDNA結合ドメインは、以下の配列:
Figure 2022520081000002
を含み、ここで太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線を付した配列は二部分核局在化配列を示す。
上記の態様の様々な実施形態において、アデノシンデアミナーゼバリアントは、アミノ酸位置82および166における改変を含む。上記の態様の様々な実施形態において、アデノシンデアミナーゼバリアントはV82Sの改変を含む。上記の態様の様々な実施形態において、アデノシンデアミナーゼバリアントはT166Rの改変を含む。上記の態様の様々な実施形態において、アデノシンデアミナーゼバリアントはV82SおよびT166Rの改変を含む。上記の態様の様々な実施形態において、アデノシンデアミナーゼバリアントは、以下の改変:Y147T、Y147R、Q154S、Y123H、およびQ154Rの1つまたは複数をさらに含む。別の実施形態において、アデノシンデアミナーゼバリアントは、以下の改変:Y147T+Q154R;Y147T+Q154S;Y147R+Q154S;V82S+Q154S;V82S+Y147R;V82S+Q154R;V82S+Y123H;I76Y+V82S;V82S+Y123H+Y147T;V82S+Y123H+Y147R;V82S+Y123H+Q154R;Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y123H+Y147R+Q154R+I76Y;V82S+Y123H+Y147R+Q154R;またはI76Y+V82S+Y123H+Y147R+Q154Rの組合せを含む。上記の態様の様々な実施形態において、アデノシンデアミナーゼバリアントは、149、150、151、152、153、154、155、156、および157からなる群から選択される残基において始まるC末端の欠失を含む。
いくつかの実施形態において、塩基エディタードメインはアデノシンデアミナーゼバリアントモノマーを含む。いくつかの実施形態において、塩基エディタードメインは、ABE8.1-m、ABE8.2-m、ABE8.3-m、ABE8.4-m、ABE8.5-m、ABE8.6-m、ABE8.7-m、ABE8.8-m、ABE8.9-m、ABE8.10-m、ABE8.11-m、ABE8.12-m、ABE8.13-m、ABE8.14-m、ABE8.15-m、ABE8.16-m、ABE8.17-m、ABE8.18-m、ABE8.19-m、ABE8.20-m、ABE8.21-m、ABE8.22-m、ABE8.23-m、またはABE8.24-mである。様々な実施形態において、塩基エディタードメインは、野生型アデノシンデアミナーゼドメインおよびアデノシンデアミナーゼバリアントを含むアデノシンデアミナーゼヘテロダイマーを含む。いくつかの実施形態において、塩基エディタードメインは、ABE8.1-d、ABE8.2-d、ABE8.3-d、ABE8.4-d、ABE8.5-d、ABE8.6-d、ABE8.7-d、ABE8.8-d、ABE8.9-d、ABE8.10-d、ABE8.11-d、ABE8.12-d、ABE8.13-d、ABE8.14-d、ABE8.15-d、ABE8.16-d、ABE8.17-d、ABE8.18-d、ABE8.19-d、ABE8.20-d、ABE8.21-d、ABE8.22-d、ABE8.23-d、またはABE8.24-dである。上記の態様の様々な実施形態において、塩基エディターは、TadA7.10ドメインおよびアデノシンデアミナーゼバリアントドメインを含むヘテロダイマーを含む。いくつかの実施形態において、アデノシンデアミナーゼバリアントは、TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23、またはTadA*8.24である。
様々な実施形態において、アデノシンデアミナーゼバリアントは、アデノシンデアミナーゼ活性を有する以下の配列またはその断片を含むまたはから本質的になる:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD
別の実施形態において、アデノシンデアミナーゼバリアントは、全長アデノシンデアミナーゼと比べて1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のN末端アミノ酸残基を欠いている。別の実施形態において、アデノシンデアミナーゼバリアントは、全長アデノシンデアミナーゼと比べて1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のC末端アミノ酸残基を欠いている。いくつかの実施形態において、アデノシンデアミナーゼバリアントはY147T+Q154Rを含む。いくつかの実施形態において、アデノシンデアミナーゼバリアントはY147T+Q154Sを含む。いくつかの実施形態において、アデノシンデアミナーゼバリアントはY147R+Q154Sを含む。いくつかの実施形態において、アデノシンデアミナーゼバリアントは、V82S+Q154S;V82S+Y147Rを含む。いくつかの実施形態において、アデノシンデアミナーゼバリアントはV82S+Q154Rを含む。いくつかの実施形態において、アデノシンデアミナーゼバリアントはV82S+Y123Hを含む。いくつかの実施形態において、アデノシンデアミナーゼバリアントはI76Y+V82Sを含む。いくつかの実施形態において、アデノシンデアミナーゼバリアントはV82S+Y123H+Y147Tを含む。いくつかの実施形態において、アデノシンデアミナーゼバリアントはV82S+Y123H+Y147Rを含む。いくつかの実施形態において、アデノシンデアミナーゼバリアントはV82S+Y123H+Q154Rを含む。いくつかの実施形態において、アデノシンデアミナーゼバリアントはY147R+Q154R +Y123Hを含む。いくつかの実施形態において、アデノシンデアミナーゼバリアントはY147R+Q154R+I76Yを含む。いくつかの実施形態において、アデノシンデアミナーゼバリアントはY147R+Q154R+T166Rを含む。いくつかの実施形態において、アデノシンデアミナーゼバリアントはY123H+Y147R+Q154R+I76Yを含む。いくつかの実施形態において、アデノシンデアミナーゼバリアントはV82S+Y123H+Y147R+Q154Rを含む。いくつかの実施形態において、アデノシンデアミナーゼバリアントはI76Y+V82S+Y123H+Y147R+Q154Rを含む。
いくつかの実施形態において、ポリヌクレオチドプログラム可能なDNA結合ドメインはCas9である。いくつかの実施形態において、Cas9ポリペプチドは、以下のアミノ酸配列(Cas9参照配列):
Figure 2022520081000003
(一重下線:HNHドメイン;二重下線:RuvCドメイン;(Cas9参照配列))、またはその対応する領域を含む。
様々な実施形態において、ポリヌクレオチドプログラム可能なDNA結合ドメインは、Staphylococcus aureusCas9 (SaCas9)、Streptococcus thermophilus 1Cas9 (St1Cas9)、Streptococcus pyogenesCas9 (SpCas9)、またはそのバリアントである。様々な実施形態において、ポリヌクレオチドプログラム可能なDNA結合ドメインは、改変されたプロトスペーサー隣接モチーフ (PAM) 特異性を有するまたは非G PAMに対する特異性を有するSpCas9のバリアントを含む。上記の態様の様々な実施形態において、改変されたPAMは、核酸配列5'-NGC-3'に対する特異性を有する。上記の態様の様々な実施形態において、改変されたSpCas9は、アミノ酸置換D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、およびT1337R、またはこれらの対応するアミノ酸置換を含む。上記の態様の様々な実施形態において、ポリヌクレオチドプログラム可能なDNA結合ドメインはヌクレアーゼ不活性またはニッカーゼバリアントである。上記の態様の様々な実施形態において、ニッカーゼバリアントはアミノ酸置換D10Aまたはその対応するアミノ酸置換を含む。上記の態様の様々な実施形態において、塩基エディターはジンクフィンガードメインをさらに含む。上記の態様の様々な実施形態において、アデノシンデアミナーゼドメインは、デオキシリボ核酸 (DNA) 中のアデニンを脱アミノ化することができる。
様々な実施形態において、アデノシンデアミナーゼバリアントはTadAデアミナーゼである。上記の態様の様々な実施形態において、TadAデアミナーゼはTadA*7.10である。様々な実施形態において、TadAデアミナーゼはTadA*8バリアントである。アデノシンデアミナーゼバリアントは、デオキシリボ核酸 (DNA) 中のアデニンを脱アミノ化することができる。いくつかの実施形態において、アデノシンデアミナーゼバリアントは、Staphylococcus aureus TadA、Bacillus subtilisTadA、Salmonella typhimuriumTadA、Shewanella putrefaciensTadA、Haemophilus influenzaeF3031 TadA、Caulobacter crescentus(C. crescentus) TadA、もしくはGeobacter sulfurreducensTadA、またはその断片である。いくつかの実施形態において、アデノシンデアミナーゼバリアントは、天然に存在しないアデノシンデアミナーゼである。
上記の態様の様々な実施形態において、融合タンパク質は、ポリヌクレオチドプログラム可能なDNA結合ドメインおよびアデノシンデアミナーゼドメインの間のリンカーを含有する。上記の態様の様々な実施形態において、リンカーはアミノ酸配列:SGGSSGGSSGSETPGTSESATPESを含む。上記の態様の様々な実施形態において、1つまたは複数の核局在化シグナルを含む。上記の態様の様々な実施形態において、核局在化シグナルは二部分核局在化シグナルである。
上記の態様の様々な実施形態において、Cas9はStCas9またはSaCas9である。上記の態様の様々な実施形態において、Cas9は、改変されたSaCas9である。上記の態様の様々な実施形態において、改変されたSaCas9は、アミノ酸置換E781K、N967K、およびR1014H、またはこれらの対応するアミノ酸置換を含む。上記の態様の様々な実施形態において、改変されたSaCas9は、アミノ酸配列:
KRNYILGLAIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRKLINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYKNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPHIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG
を含む。
アデノシンデアミナーゼバリアントドメインであって、
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSST
のアミノ酸配列を含み、該アミノ酸配列が少なくとも1つの改変を含む、アデノシンデアミナーゼバリアントドメイン、およびCas9またはCas12ポリペプチドであって、アデノシンデアミナーゼバリアントドメインがCas9またはCas12ポリペプチド内に挿入されている、Cas9またはCas12ポリペプチドを含む、融合タンパク質。
いくつかの実施形態において、アデノシンデアミナーゼバリアントドメインは、TadA*8アデノシンデアミナーゼバリアントドメインを含むアデノシンデアミナーゼモノマーである。いくつかの実施形態において、アデノシンデアミナーゼバリアントドメインは、野生型アデノシンデアミナーゼドメインおよびTadA*8アデノシンデアミナーゼバリアントドメインを含むアデノシンデアミナーゼヘテロダイマーである。いくつかの実施形態において、アデノシンデアミナーゼバリアントドメインは、TadAドメインおよびTadA*8アデノシンデアミナーゼバリアントドメインを含むアデノシンデアミナーゼヘテロダイマーである。いくつかの実施形態において、アデノシンデアミナーゼバリアントドメインは、Cas9またはCas12ポリペプチドの柔軟なループ、アルファヘリックス領域、非構造化部分、または溶媒接近可能部分内に挿入されている。いくつかの実施形態において、柔軟なループは、Cas9またはCas12ポリペプチドのアルファヘリックス構造の部分を含む。いくつかの実施形態において、アデノシンデアミナーゼバリアントドメインは、Cas9ポリペプチドのN末端断片およびC末端断片によって隣接される。いくつかの実施形態において、融合タンパク質は、構造:NH2-[Cas9のN末端断片]-[アデノシンデアミナーゼバリアント]-[Cas9のC末端断片]-COOHを含み、ここで「]-[」の各記載は任意のリンカーである。いくつかの実施形態において、Cas9またはCas12ポリペプチドのN末端断片またはC末端断片は標的ポリヌクレオチド配列に結合する。
いくつかの実施形態において、N末端断片のC末端またはC末端断片のN末端は、Cas9またはCas12ポリペプチドの柔軟なループの部分を含む。いくつかの実施形態において、柔軟なループは、融合タンパク質が標的核酸塩基を脱アミノ化するときに標的核酸塩基に近接するアミノ酸を含む。いくつかの実施形態において、標的核酸塩基は、標的ポリヌクレオチド配列中のプロトスペーサー隣接モチーフ (PAM) 配列から1~20個の核酸塩基だけ離れている。いくつかの実施形態において、標的核酸塩基は、2~12個の核酸塩基だけPAM配列の上流にある。いくつかの実施形態において、N末端断片もしくはC末端断片は、RuvCドメインを含み、N末端断片もしくはC末端断片はHNHドメインを含み、N末端断片もC末端断片もHNHドメインを含まず、またはN末端断片もC末端断片もRuvCドメインを含まない。いくつかの実施形態において、Cas9またはCas12ポリペプチドは、1つまたは複数の構造ドメイン中の部分的または完全な欠失を含み、アデノシンデアミナーゼは、Cas9またはCas12ポリペプチドの部分的または完全な欠失の位置において挿入されている。いくつかの実施形態において、欠失はRuvCドメイン内にあり、欠失はHNHドメイン内にあり、または欠失はRuvCドメインおよびC末端ドメインを架橋する。
いくつかの実施形態において、アデノシンデアミナーゼバリアントドメインはCas12ポリペプチド中に挿入されている。いくつかの実施形態において、Cas9ポリペプチドは、Streptococcus pyogenesCas9 (SpCas9)、Staphylococcus aureusCas9 (SaCas9)、Streptococcus thermophilus 1Cas9 (St1Cas9)、またはそのバリアントである。いくつかの実施形態において、Cas9は、以下のアミノ酸配列(Cas9参照配列):
Figure 2022520081000004
(一重下線:HNHドメイン;二重下線:RuvCドメイン;(「Cas9参照配列」))、またはその対応する領域を含む。
一態様において、本発明は、本明細書で提供される任意の融合タンパク質であって、Cas9ポリペプチドが、Cas9ポリペプチド参照配列における番号付けでアミノ酸1017~1069もしくはその対応するアミノ酸の欠失を含み、Cas9ポリペプチドが、Cas9ポリペプチド参照配列における番号付けでアミノ酸792~872もしくはその対応するアミノ酸の欠失を含み、またはCas9ポリペプチドが、Cas9ポリペプチド参照配列における番号付けでアミノ酸792~906もしくはその対応するアミノ酸の欠失を含む、融合タンパク質を提供する。一実施形態において、アデノシンデアミナーゼバリアントドメインは、Cas9ポリペプチドの柔軟なループ内に挿入されている。一実施形態において、柔軟なループは、Cas9参照配列における番号付けで位置530~537、569~579、686~691、768~793、943~947、1002~1040、1052~1077、1232~1248、および1298~1300、またはこれらの対応するアミノ酸位置におけるアミノ酸残基からなる群から選択される領域を含む。一実施形態において、アデノシンデアミナーゼバリアントドメインは、Cas9参照配列における番号付けでアミノ酸位置768~769、791~792、792~793、1015~1016、1022~1023、1026~1027、1029~1030、1040~1041、1052~1053、1054~1055、1067~1068、1068~1069、1247~1248、もしくは1248~1249、またはその対応するアミノ酸位置の間に挿入されている。一実施形態において、アデノシンデアミナーゼバリアントドメインは、Cas9参照配列における番号付けでアミノ酸位置768~769、792~793、1022~1023、1026~1027、1040~1041、1068~1069、もしくは1247~1248またはその対応するアミノ酸位置の間に挿入されている。一実施形態において、アデノシンデアミナーゼバリアントドメインは、Cas9参照配列における番号付けでアミノ酸位置1016~1017、1023~1024、1029~1030、1040~1041、1069~1070、もしくは1247~1248またはその対応するアミノ酸位置の間に挿入されている。一実施形態において、デアミナーゼバリアントドメインは、表10Aにおいて特定される遺伝子座においてCas9ポリペプチド内に挿入されている。一実施形態において、N末端断片は、Cas9参照配列のアミノ酸残基1~529、538~568、580~685、692~942、948~1001、1026~1051、1078~1231、および/もしくは1248~1297、またはその対応する残基を含む。一実施形態において、C末端断片は、Cas9参照配列のアミノ酸残基1301~1368、1248~1297、1078~1231、1026~1051、948~1001、692~942、580~685、および/もしくは538~568、またはその対応する残基を含む。
いくつかの実施形態において、Cas9ポリペプチドはニッカーゼであり、またはCas9ポリペプチドはヌクレアーゼ不活性である。一実施形態において、Cas9ポリペプチドは改変されたSpCas9ポリペプチドであり、改変されたPAMに対する特異性または非G PAMに対する特異性を有する。一実施形態において、改変されたSpCas9ポリペプチドは、アミノ酸置換D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、およびT1337R (SpCas9-MQKFRAER) を含み、改変されたPAM 5'-NGC-3'に対する特異性を有する。
一実施形態において、アデノシンデアミナーゼバリアントドメインはCas12ポリペプチド中に挿入されている。一実施形態において、Cas12ポリペプチドは、Cas12a、Cas12b、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、またはCas12iである。一実施形態において、Cas12ポリペプチドは、Bacillus hisashii Cas12b、Bacillus thermoamylovorans Cas12b、Bacillus sp. V3-13 Cas12b、またはAlicyclobacillus acidiphilus Cas12bに対して少なくとも約85%のアミノ酸配列同一性を有する。一実施形態において、Cas12ポリペプチドは、Bacillus hisashii Cas12b、Bacillus thermoamylovorans Cas12b、Bacillus sp. V3-13 Cas12b、またはAlicyclobacillus acidiphilus Cas12bの断片を含むまたはから本質的になる。一実施形態において、アデノシンデアミナーゼバリアントドメインは、アミノ酸位置:a) BhCas12bの153~154、255~256、306~307、980~981、1019~1020、534~535、604~605、もしくは344~345、もしくはCas12a、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、もしくはCas12iの対応するアミノ酸残基、b) BvCas12bの147および148、248および249、299および300、991および992、もしくは1031および1032、もしくはCas12a、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、もしくはCas12iの対応するアミノ酸残基、またはc) AaCas12bの157および158、258および259、310および311、1008および1009、もしくは1044および1045、もしくはCas12a、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、もしくはCas12iの対応するアミノ酸残基の間に挿入されている。一実施形態において、アデノシンデアミナーゼバリアントドメインは、表10Bにおいて特定される遺伝子座において挿入されている。
いくつかの実施形態において、Cas12ポリペプチドはCas12bである。一実施形態において、Cas12ポリペプチドは、BhCas12bドメイン、BvCas12bドメイン、またはAACas12bドメインを含む。Cas12bポリペプチドは、RuvCドメインの触媒活性をサイレンシングする突然変異を含む。一実施形態において、Cas12bポリペプチドは、D574A、D829Aおよび/またはD952A突然変異を含む。
一実施形態において、アデノシンデアミナーゼバリアントドメインは、Staphylococcus aureus TadA、Bacillus subtilisTadA、Salmonella typhimuriumTadA、Shewanella putrefaciensTadA、Haemophilus influenzaeF3031 TadA、Caulobacter crescentus(C. crescentus) TadA、もしくはGeobacter sulfurreducensTadA、またはそのバリアントもしくは断片を含む。一実施形態において、アデノシンデアミナーゼは、天然に存在しないアデノシンデアミナーゼである。
様々な実施形態において、融合タンパク質はシチジンデアミナーゼをさらに含む。一態様において、本発明は、構造:NH2-[TadA*8]-[Cas9]-[シチジンデアミナーゼ]-COOHを含む融合タンパク質を提供し、ここで「]-[」の各記載は任意のリンカーである。別の態様において、本発明は、構造:NH2-[シチジンデアミナーゼ]-[Cas9]-[TadA*8]-COOH を含む融合タンパク質を提供し、ここで「]-[」の各記載は任意のリンカーである。
一態様において、本発明は、構造:NH2-[Cas9 (TadA*8)]-[シチジンデアミナーゼ]-COOHを含む融合タンパク質を提供し、ここで「]-[」の各記載は任意のリンカーである(例えばTadA*8はCas9の内部で融合しており、シチジンデアミナーゼはC末端に融合している)。一態様において、本発明は、構造:NH2-[シチジンデアミナーゼ]-[Cas9 (TadA*8)]-COOHを含む融合タンパク質を提供し、ここで「]-[」の各記載は任意のリンカーである(例えばTadA*8はCas9の内部で融合しており、シチジンデアミナーゼはN末端に融合している)。別の態様において、本発明は、構造:NH2-[Cas9(シチジンデアミナーゼ)]-[TadA*8]-COOHを含む融合タンパク質を提供し、ここで「]-[」の各記載は任意のリンカーである。さらに別の態様において、本発明は、構造:NH2-[TadA*8]-[Cas9(シチジンデアミナーゼ)]-COOHを含む融合タンパク質を提供し、ここで「]-[」の各記載は任意のリンカーである。
一態様において、本発明は、構造:NH2-[Cas12(アデノシンデアミナーゼ)]-[シチジンデアミナーゼ]-COOHを含む融合タンパク質を提供し、ここで「]-[」の各記載は任意のリンカーである(例えばアデノシンデアミナーゼはCas12の内部で融合しており、シチジンデアミナーゼはC末端に融合している)。一態様において、本発明は、構造:NH2-[シチジンデアミナーゼ]-[Cas12(アデノシンデアミナーゼ)]-COOHを含む融合タンパク質を提供し、ここで「]-[」の各記載は任意のリンカーである(例えばアデノシンデアミナーゼはCas12の内部で融合しており、シチジンデアミナーゼはN末端に融合している)。別の態様において、本発明は、構造:NH2-[Cas12(シチジンデアミナーゼ)]-[アデノシンデアミナーゼ]-COOHを含む融合タンパク質を提供し、ここで「]-[」の各記載は任意のリンカーである。さらに別の態様において、本発明は、構造:NH2-[アデノシンデアミナーゼ]-[Cas12(シチジンデアミナーゼ)]-Cを含む融合タンパク質を提供し、ここで「]-[」の各記載は任意のリンカーである。
別の態様において、本発明は、標的核酸塩基の脱アミノ化をもたらすための1つまたは複数のガイド核酸配列との複合体中にある本明細書で提供される任意の融合タンパク質を提供する。いくつかの実施形態において、融合タンパク質は、標的ポリヌクレオチドとさらに複合体化している。
一態様において、本発明は、本明細書で提供される任意の融合タンパク質をコードするポリヌクレオチドを提供する。別の態様において、本発明は、本明細書で提供される任意のポリヌクレオチドを含む、発現ベクターを提供する。いくつかの実施形態において、発現ベクターは哺乳動物発現ベクターである。いくつかの実施形態において、ベクターは、アデノ随伴ウイルス (AAV)、レトロウイルスベクター、アデノウイルスベクター、レンチウイルスベクター、センダイウイルスベクター、およびヘルペスウイルスベクターからなる群から選択されるウイルスベクターである。いくつかの実施形態において、ベクターはプロモーターを含む。
一態様において、本発明は、本明細書で提供される任意の融合タンパク質を含む、細胞を提供する。一態様において、本発明は、本明細書で提供される任意のポリヌクレオチドを含む、細胞を提供する。一態様において、本発明は、本明細書で提供される任意のベクターを含む、細胞を提供する。様々な実施形態において、細胞は、細菌細胞、植物細胞、昆虫細胞、ヒト細胞、または哺乳動物細胞である。
一態様において、本発明は、1つまたは複数のガイドポリヌクレオチドとの複合体中にある本明細書で提供される任意の融合ポリペプチドを含む、塩基エディターを提供する。一態様において、本発明は、本明細書で提供される任意の融合タンパク質、および薬学的に許容される賦形剤を含む、医薬組成物を提供する。一態様において、本発明は、本明細書で提供される任意のポリヌクレオチド、および薬学的に許容される賦形剤を含む、医薬組成物を提供する。一態様において、本発明は、本明細書で提供される任意のベクター、および薬学的に許容される賦形剤を含む、医薬組成物を提供する。一態様において、本発明は、本明細書で提供される任意の細胞、および薬学的に許容される賦形剤を含む、医薬組成物を提供する。一態様において、本発明は、本明細書で提供される任意の塩基エディター、および薬学的に許容される賦形剤を含む、医薬組成物を提供する。
一態様において、本発明は、本明細書で提供される任意の融合タンパク質を含む、キットを提供する。一態様において、本発明は、本明細書で提供される任意のポリヌクレオチドを含む、キットを提供する。一態様において、本発明は、本明細書で提供される任意のベクターを含む、キットを提供する。一態様において、本発明は、本明細書で提供される任意の塩基エディターを含む、キットを提供する。
別の態様において、本発明は、ポリヌクレオチド配列を、本明細書で提供される任意の融合タンパク質と接触させることを含み、融合タンパク質のアデノシンデアミナーゼバリアントドメインがポリヌクレオチド中の核酸塩基を脱アミノ化し、それによりポリヌクレオチド配列を編集する、方法を提供する。いくつかの実施形態において、方法は、標的ポリヌクレオチド配列を標的核酸塩基の脱アミノ化をもたらすための1つまたは複数のガイドポリヌクレオチドと接触させることをさらに含む。
一態様において、本発明は、標的ポリヌクレオチドを編集する方法であって、標的ポリヌクレオチドを請求項116に記載の塩基エディターと接触させて、標的ポリヌクレオチド中でA・TからG・Cへの改変をもたらすことを含む、方法を提供する。いくつかの実施形態において、方法は、細胞、真核細胞、哺乳動物細胞、またはヒト細胞中で接触させることをさらに含む。いくつかの実施形態において、細胞はin vivoである。いくつかの実施形態において、細胞はex vivoである。
一態様において、本発明は、対象において遺伝的欠陥を処置する方法であって、対象に本明細書で提供される任意の融合タンパク質を含むもしくはから本質的になる塩基エディター、または前記塩基エディターをコードするポリヌクレオチドおよび対象の標的ヌクレオチド配列中の標的核酸塩基を脱アミノ化するように塩基エディターに指示する1つまたは複数のガイドポリヌクレオチドを投与することを含み、それにより遺伝的欠陥を処置、方法を提供する。
いくつかの実施形態において、ガイドポリヌクレオチドは、a) GACCUAGGCGAGGCAGUAGG;b)CCAGUAUGGACACUGUCCAAA;c) CAGUAUGGACACUGUCCAAA;およびd)AGUAUGGACACUGUCCAAAGからなる群から選択される核酸配列を含む。様々な実施形態において、gRNAは、核酸配列
GUUUUUGUACUCUCAAGAUUUAAGUAACUGUACAACGAAACUUACACAGUUACUUAAAUCUUGCAGAAGCUACAAAGAUAAGGCUUCAUGCCGAAAUCAACACCCUGUCAUUUUAUGGCAGGGUG
をさらに含む。様々な実施形態において、ガイドRNAは、CRISPR RNA (crRNA) およびトランス活性化crRNA (tracrRNA) を含む。
いくつかの実施形態において、方法は、塩基エディター、または前記塩基エディターをコードするポリヌクレオチド、および1つまたは複数のガイドポリヌクレオチドを対象の細胞に送達することをさらに含む。様々な実施形態において、対象は哺乳動物またはヒトである。様々な実施形態において、標的核酸塩基の脱アミノ化は標的核酸塩基を野生型核酸塩基で置き換える。様々な実施形態において、標的核酸塩基の脱アミノ化は標的核酸塩基を非野生型核酸塩基で置き換え、標的核酸塩基の脱アミノ化は遺伝学的状態の症状を改善する。様々な実施形態において、標的ポリヌクレオチド配列は、標的核酸塩基以外の核酸塩基における遺伝学的状態に関連する突然変異を含む。
本明細書の説明および実施例は、本開示の実施形態を詳細に説明する。本開示は本明細書に記載の特定の実施形態に限定されず、それらは改変され得ることが理解されるべきである。当業者は、本開示の多数の変形形態および改変があることを認識し、これらはその範囲内に包含される。
本明細書に開示されるいくつかの実施形態の実施は、他に指し示されなければ、免疫学、生化学、化学、分子生物学、微生物学、細胞生物学、遺伝学および組換えDNAの従来技術を用い、これらは当該分野の技術的範囲内である。例えば、Sambrook and Green, Molecular Cloning: A Laboratory Manual, 4th Edition (2012); the series Current Protocols in Molecular Biology (F. M. Ausubel, et al. eds.); the series Methods In Enzymology (Academic Press, Inc.), PCR 2: A Practical Approach (M.J. MacPherson, B.D. Hames and G.R. Taylor eds. (1995)), Harlow and Lane, eds. (1988) Antibodies, A Laboratory Manual, and Culture of Animal Cells: A Manual of Basic Technique and Specialized Applications, 6th Edition (R.I. Freshney, ed. (2010))を参照されたい。
本明細書において使用されるセクションの見出しは編集上の目的のものに過ぎず、記載される主題を限定するものと解釈されるべきではない。
本開示の様々な特徴が単一の実施形態の文脈において記載され得るが、特徴はまた、別々にまたは任意の好適な組合せで提供され得る。反対に、本開示は明確性のために別々の実施形態の文脈において本明細書に記載され得るが、本開示はまた単一の実施形態において実施され得る。本明細書において使用されるセクションの見出しは編集上の目的のものに過ぎず、記載される主題を限定するものと解釈されるべきではない。
本開示の特徴は、添付の特許請求の範囲において精細に記載される。本開示の特徴および利点のより良好な理解は、本開示の原理が利用される実例的な実施形態を記載する以下の詳細な説明を参照することにより、また本明細書において以下に説明されるような添付の図面を考慮することにより得られる。
[定義]
以下の定義は、当該技術分野の定義を補足するものであって本出願を対象としており、関連するまたは関連性のない案件、例えば共通の所有に係る特許または出願に帰するものではない。本明細書に記載されたものと同様または同等の任意の方法および材料を、本開示の試験の実施において使用することができるが、好ましい材料および方法を本明細書で説明する。従って、本明細書で使用される用語は、特定の実施形態を説明する目的のみのためのものであり、限定することを意図するものではない。
別段の定義がない限り、本明細書で使用されるすべての技術的および科学的用語は、本発明が属する分野の当業者によって一般的に理解される意味を有する。以下の参考文献は、当業者に、本発明において使用される多くの用語の一般的な定義を提供する: Singleton et al., Dictionary of Microbiology and Molecular Biology (2nd ed. 1994); The Cambridge Dictionary of Science and Technology (Walker ed., 1988); The Glossary of Genetics, 5th Ed., R. Rieger et al. (eds.), Springer Verlag (1991); and Hale & Marham, The Harper Collins Dictionary of Biology (1991)。
本出願において、単数形の使用は、特に断りのない限り、複数形を含む。本明細書で使用される場合、文脈が明確にそうでないことを指示しない限り、単数形「a」、「an」、および「the」は複数への言及を含むことが留意されなければならない。本出願において、そうでないことが記載されない限り、「または」の使用は「および/または」を意味し、包含的であることが理解される。さらには、用語「含む (including)」、ならびに「含む (include)」、「含む (includes)」、および「含まれる (included)」などの他の形態の使用は、非限定的である。
本明細書及びクレームにおいて使用される場合、用語「含む(comprising)」(および「含む(comprise)」および「含む(comprises)」などのそのあらゆる形態)、「有する(having)」(「有する(have)」および「有する(has)」などのそのあらゆる形態)、「含む(including)」(「含む(include)」および「含む(includes)」などのそのあらゆる形態)又は「含む(containing)」(「含む(contains)」および「含む(contain)」などのそのあらゆる形態)は、包括的又は開放的であり、追加の、記載されていない要素又は方法工程を排除しない。本明細書で議論される任意の実施形態は、本開示の任意の方法または組成物に関して実施することができ、逆もまた同様であると考えられる。さらに、本開示の組成物を用いて、本開示の方法を達成することができる。
用語「約(about)」または「およそ(approximately)」は、当業者によって決定されるように、特定の値について許容可能な誤差範囲内であることを意味し、これは、値がどのように測定または決定されるか、すなわち、測定システムの制限に部分的に依存する。例えば、「約」は、当該技術分野における実務によれば、1以内または1を超える標準偏差内であることを意味し得る。あるいは、「約」は、所定の値の最大20%、最大10%、最大5%、または最大1%の範囲を意味し得る。別法として、特に生物学的システムまたはプロセスに関して、この用語は、同じ桁以内、例えば5倍以内、2倍以内の値を意味することができる。特定の値が出願および特許請求の範囲に記載されている場合、別段の記載がない限り、その特定の値について許容可能な誤差範囲内にあることを意味する「約」という用語が推定されるべきである。
本明細書で提供される範囲は、範囲内のすべての値についての省略形であると理解される。例えば、1~50の範囲は、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、または50からなる群からの任意の数、数の組合せ、またはサブ範囲を含むと理解される。
明細書における「いくつかの実施形態」、「ある実施形態」、「一実施形態」、または「他の実施形態」という言及は、その実施形態に関連して説明される特定の特徴、構造、または特性が、本開示の少なくともいくつかの実施形態に含まれるが、必ずしもすべての実施形態に含まれるとは限らないことを意味する。
「脱塩基(abasic)塩基エディター」とは、核酸塩基を切り出してDNA核酸塩基(A、T、C、またはG)を挿入することができる薬剤を意味する。脱塩基塩基エディターは、核酸グリコシラーゼポリペプチドまたはその断片を含む。一実施形態において、核酸グリコシラーゼは、下記の配列のアミノ酸204またはウラシルDNAグリコシラーゼの対応位置においてAspを含み(例えば、アミノ酸204におけるAsnを置換して)、かつシトシン-DNAグリコシラーゼ活性を有する、変異型ヒトウラシルDNAグリコシラーゼまたはその活性断片である。一実施形態において、核酸グリコシラーゼは、下記の配列のアミノ酸147またはウラシルDNAグリコシラーゼの対応位置においてAla、Gly、Cys、またはSerを含み(例えば、アミノ酸147におけるTyrを置換して)、かつチミン-DNAグリコシラーゼ活性を有する、変異型ヒトウラシルDNAグリコシラーゼまたはその活性断片である。例示的なヒトウラシル-DNAグリコシラーゼ、アイソフォーム1の配列は以下の通りである:
1 mgvfclgpwg lgrklrtpgk gplqllsrlc gdhlqaipak kapagqeepg tppssplsae
61 qldriqrnka aallrlaarn vpvgfgeswk khlsgefgkp yfiklmgfva eerkhytvyp
121 pphqvftwtq mcdikdvkvv ilgqdpyhgp nqahglcfsv qrpvppppsl eniykelstd
181 iedfvhpghg dlsgwakqgv lllnavltvr ahqanshker gweqftdavv swlnqnsngl
241 vfllwgsyaq kkgsaidrkr hhvlqtahps plsvyrgffg crhfsktnel lqksgkkpid
301 wkel
ヒトのウラシル-DNAグリコシラーゼ、アイソフォーム2の配列は以下の通りである。
1 migqktlysf fspsparkrh apspepavqg tgvagvpees gdaaaipakk apagqeepgt
61 ppssplsaeq ldriqrnkaa allrlaarnv pvgfgeswkk hlsgefgkpy fiklmgfvae
121 erkhytvypp phqvftwtqm cdikdvkvvi lgqdpyhgpn qahglcfsvq rpvppppsle
181 niykelstdi edfvhpghgd lsgwakqgvl llnavltvra hqanshkerg weqftdavvs
241 wlnqnsnglv fllwgsyaqk kgsaidrkrh hvlqtahpsp lsvyrgffgc rhfsktnell
301 qksgkkpidw kel
他の実施形態では、脱塩基エディターは、PCT/JP205/080958およびUS20170321210に記載されている脱塩基エディターのいずれかであり、これらは参照により本明細書に組み入れられる。特定の実施形態では、脱塩基エディターは、上記の配列に太字、下線で示された位置、または当該技術分野で知られる任意の他の脱塩基エディターまたはウラシルデグリコシラーゼにおける対応アミノ酸において突然変異を含む。一実施形態では、脱塩基エディターは、Y147、N204、L272、および/またはR276または対応位置に突然変異を含む。別の実施形態では、脱塩基エディターは、Y147AもしくはY147G突然変異または対応する突然変異を含む。別の実施形態では、脱塩基エディターは、N204D突然変異または対応する突然変異を含む。別の実施形態では、脱塩基エディターは、L272A突然変異または対応する突然変異を含む。別の実施形態では、脱塩基エディターは、R276EもしくはR276C突然変異または対応する突然変異を含む。
「アデノシンデアミナーゼ」とは、アデニンまたはアデノシンの加水分解的脱アミノ化を触媒することができるポリペプチドまたはその断片を意味する。いくつかの実施形態において、デアミナーゼまたはデアミナーゼドメインは、アデノシンからイノシン、またはデオキシアデノシンからデオキシイノシンへの加水分解的脱アミノ化を触媒するアデノシンデアミナーゼである。いくつかの実施形態において、アデノシンデアミナーゼは、デオキシリボ核酸 (DNA) 中のアデニンまたはアデノシンの加水分解的脱アミノ化を触媒する。本明細書中で提供されるアデノシンデアミナーゼ(例えば、遺伝子操作されたアデノシンデアミナーゼ、進化させたアデノシンデアミナーゼ)は、細菌などの任意の生物由来であり得る。
いくつかの実施形態において、アデノシンデアミナーゼはTadAデアミナーゼである。いくつかの実施形態において、TadAデアミナーゼはTadAバリアントである。いくつかの実施形態において、TadAバリアントはTadA*8である。いくつかの実施形態において、デアミナーゼまたはデアミナーゼドメインは、ヒト、チンパンジー、ゴリラ、サル、ウシ、イヌ、ラット、またはマウスなどの生物からの天然に存在するデアミナーゼのバリアントである。いくつかの実施形態において、デアミナーゼまたはデアミナーゼドメインは天然に存在しない。例えば、いくつかの実施形態において、デアミナーゼまたはデアミナーゼドメインは、天然に存在するデアミナーゼに対して少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、少なくとも99.1%、少なくとも99.2%、少なくとも99.3%、少なくとも99.4%、少なくとも99.5%、少なくとも99.6%、少なくとも99.7%、少なくとも99.8%、または少なくとも99.9%の同一性である。例えば、デアミナーゼドメインは、国際PCT出願番号PCT/2017/045381 (WO 2018/027078)およびPCT/US2016/058344 (WO 2017/070632)に記載されており、これらのそれぞれは参照により全体が本明細書に組み込まれる。Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017); Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity”Science Advances 3:eaao4774 (2017) )、およびRees, H.A., et al., “Base editing: precision chemistry on the genome and transcriptome of living cells.” Nat Rev Genet. 2018 Dec;19(12):770-788. doi: 10.1038/s41576-018-0059-1(これらの全内容は参照により本明細書に組み込まれる)も参照されたい。
野生型TadA (wt) アデノシンデアミナーゼは以下の配列(TadA参照配列とも称される;配列番号2)を有する:
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKKAQSSTD
いくつかの実施形態において、アデノシンデアミナーゼは、以下の配列における改変を含む:
MSEVEFSHEY WMRHALTLAK RARDEREVPV GAVLVLNNRV IGEGWNRAIG LHDPTAHAEI MALRQGGLVM QNYRLIDATL YVTFEPCVMC AGAMIHSRIG RVVFGVRNAK TGAAGSLMDV LHYPGMNHRV EITEGILADE CAALLCYFFR MPRQVFNAQK KAQSSTD
(TadA*7.10とも称される)。
いくつかの実施形態において、TadA*7.10は少なくとも1つの改変を含む。いくつかの実施形態において、TadA*7.10はアミノ酸82および/または166における改変を含む。特定の実施形態において、上記の参照される配列のバリアントは、以下の改変:Y147T、Y147R、Q154S、Y123H、V82S、T166R、および/またはQ154Rの1つまたは複数を含む。改変Y123Hは本明細書でH123H(TadA*7.10における改変H123YがY123H (wt) に復帰している)と称されることもある。他の実施形態において、TadA*7.10配列のバリアントは、Y147T+Q154R;Y147T+Q154S;Y147R+Q154S;V82S+Q154S;V82S+Y147R;V82S+Q154R;V82S+Y123H;I76Y+V82S;V82S+Y123H+Y147T;V82S+Y123H+Y147R;V82S+Y123H+Q154R;Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y123H+Y147R+Q154R+I76Y;V82S+Y123H+Y147R+Q154R;およびI76Y+V82S+Y123H+Y147R+Q154Rの群から選択される改変の組合せを含む。
他の実施形態において、本発明は、欠失を含むアデノシンデアミナーゼバリアント、例えば、TadA*7.10、TadA参照配列と比べて残基149、150、151、152、153、154、155、156、もしくは15において始まるC末端の欠失、または別のTadA 7における対応する突然変異を含む、TadA*8を提供する。他の実施形態において、アデノシンデアミナーゼバリアントは、TadA*7.10、TadA参照配列と比べて以下の改変:Y147T、Y147R、Q154S、Y123H、V82S、T166R、および/もしくはQ154Rの1つもしくは複数、または別のTadAにおける対応する突然変異を含むTadA(例えばTadA*8)モノマーである。他の実施形態において、アデノシンデアミナーゼバリアントは、TadA*7.10、TadA参照配列と比べてY147T+Q154R;Y147T+Q154S;Y147R+Q154S;V82S+Q154S;V82S+Y147R;V82S+Q154R;V82S+Y123H;I76Y+V82S;V82S+Y123H+Y147T;V82S+Y123H+Y147R;V82S+Y123H+Q154R;Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y123H+Y147R+Q154R+I76Y;V82S+Y123H+Y147R+Q154R;およびI76Y+V82S+Y123H+Y147R+Q154Rの群から選択される改変の組合せ、または別のTadAにおける対応する突然変異を含むモノマーである。
さらに他の実施形態において、アデノシンデアミナーゼバリアントは、TadA*7.10、TadA参照配列と比べて以下の改変Y147T、Y147R、Q154S、Y123H、V82S、T166R、および/もしくはQ154Rの1つもしくは複数、または別のTadAにおける対応する突然変異をそれぞれ有する2つのアデノシンデアミナーゼドメイン(例えばTadA*8)を含むホモダイマーである。他の実施形態において、アデノシンデアミナーゼバリアントは、TadA*7.10、TadA参照配列と比べてY147T+Q154R;Y147T+Q154S;Y147R+Q154S;V82S+Q154S;V82S+Y147R;V82S+Q154R;V82S+Y123H;I76Y+V82S;V82S+Y123H+Y147T;V82S+Y123H+Y147R;V82S+Y123H+Q154R;Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y123H+Y147R+Q154R+I76Y;V82S+Y123H+Y147R+Q154R;およびI76Y+V82S+Y123H+Y147R+Q154Rの群から選択される改変の組合せ、または別のTadAにおける対応する突然変異をそれぞれ有する2つのアデノシンデアミナーゼドメイン(例えばTadA*8)を含むホモダイマーである。
他の実施形態において、アデノシンデアミナーゼバリアントは、野生型TadAアデノシンデアミナーゼドメイン、ならびに、TadA*7.10、TadA参照配列と比べて以下の改変Y147T、Y147R、Q154S、Y123H、V82S、T166R、および/もしくはQ154Rの1つもしくは複数、または別のTadAにおける対応する突然変異を含むアデノシンデアミナーゼバリアントドメイン(例えばTadA*8)を含むヘテロダイマーである。他の実施形態において、アデノシンデアミナーゼバリアントは、野生型TadAアデノシンデアミナーゼドメイン、ならびに、TadA*7.10、TadA参照配列と比べてY147T+Q154R;Y147T+Q154S;Y147R+Q154S;V82S+Q154S;V82S+Y147R;V82S+Q154R;V82S+Y123H;I76Y+V82S;V82S+Y123H+Y147T;V82S+Y123H+Y147R;V82S+Y123H+Q154R;Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y123H+Y147R+Q154R+I76Y;V82S+Y123H+Y147R+Q154R;およびI76Y+V82S+Y123H+Y147R+Q154Rの群から選択される改変の組合せ、または別のTadAにおける対応する突然変異を含むアデノシンデアミナーゼバリアントドメイン(例えばTadA*8)を含むヘテロダイマーである。
他の実施形態において、アデノシンデアミナーゼバリアントは、TadA*7.10ドメイン、ならびに、TadA*7.10、TadA参照配列と比べて以下の改変Y147T、Y147R、Q154S、Y123H、V82S、T166R、および/もしくはQ154Rの1つもしくは複数、または別のTadAにおける対応する突然変異を含むアデノシンデアミナーゼバリアントドメイン(例えばTadA*8)を含むヘテロダイマーである。他の実施形態において、アデノシンデアミナーゼバリアントは、TadA*7.10ドメイン、および、TadA*7.10、TadA参照配列と比べて以下の改変:Y147T+Q154R;Y147T+Q154S;Y147R+Q154S;V82S+Q154S;V82S+Y147R;V82S+Q154R;V82S+Y123H;I76Y+V82S;V82S+Y123H+Y147T;V82S+Y123H+Y147R;V82S+Y123H+Q154R;Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y123H+Y147R+Q154R+I76Y;V82S+Y123H+Y147R+Q154R;もしくはI76Y+V82S+Y123H+Y147R+Q154Rの組合せ、または別のTadAにおける対応する突然変異を含むアデノシンデアミナーゼバリアントドメイン(例えばTadA*8)を含むヘテロダイマーである。
一実施形態において、アデノシンデアミナーゼは、アデノシンデアミナーゼ活性を有する以下の配列またはその断片を含むまたはから本質的になるTadA*8である:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD
いくつかの実施形態において、TadA*8は切詰られている。いくつかの実施形態において、切詰型TadA*8は、全長TadA*8と比べて1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のN末端アミノ酸残基を欠いている。いくつかの実施形態において、切詰型TadA*8は、全長TadA*8と比べて1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のC末端アミノ酸残基を欠いている。いくつかの実施形態において、アデノシンデアミナーゼバリアントは全長TadA*8である。
特定の実施形態において、アデノシンデアミナーゼヘテロダイマーは、TadA*8ドメインおよび以下の1つから選択されるアデノシンデアミナーゼドメインを含む:
Staphylococcus aureus (S. aureus) TadA:
MGSHMTNDIYFMTLAIEEAKKAAQLGEVPIGAIITKDDEVIARAHNLRETLQQPTAHAEHIAIERAAKVLGSWRLEGCTLYVTLEPCVMCAGTIVMSRIPRVVYGADDPKGGCSGSLMNLLQQSNFNHRAIVDKGVLKEACSTLLTTFFKNLRANKKSTN
Bacillus subtilis (B. subtilis) TadA:
MTQDELYMKEAIKEAKKAEEKGEVPIGAVLVINGEIIARAHNLRETEQRSIAHAEMLVIDEACKALGTWRLEGATLYVTLEPCPMCAGAVVLSRVEKVVFGAFDPKGGCSGTLMNLLQEERFNHQAEVVSGVLEEECGGMLSAFFRELRKKKKAARKNLSE
Salmonella typhimurium (S. typhimurium) TadA:
MPPAFITGVTSLSDVELDHEYWMRHALTLAKRAWDEREVPVGAVLVHNHRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVLQNYRLLDTTLYVTLEPCVMCAGAMVHSRIGRVVFGARDAKTGAAGSLIDVLHHPGMNHRVEIIEGVLRDECATLLSDFFRMRRQEIKALKKADRAEGAGPAV
Shewanella putrefaciens (S. putrefaciens) TadA:
MDEYWMQVAMQMAEKAEAAGEVPVGAVLVKDGQQIATGYNLSISQHDPTAHAEILCLRSAGKKLENYRLLDATLYITLEPCAMCAGAMVHSRIARVVYGARDEKTGAAGTVVNLLQHPAFNHQVEVTSGVLAEACSAQLSRFFKRRRDEKKALKLAQRAQQGIE
Haemophilus influenzae F3031 (H. influenzae) TadA:
MDAAKVRSEFDEKMMRYALELADKAEALGEIPVGAVLVDDARNIIGEGWNLSIVQSDPTΑΗAEIIALRNGAKNIQNYRLLNSTLYVTLEPCTMCAGAILHSRIKRLVFGASDYKTGAIGSRFHFFDDYKMNHTLEITSGVLAEECSQKLSTFFQKRREEKKIEKALLKSLSDK
Caulobacter crescentus (C. crescentus) TadA:
MRTDESEDQDHRMMRLALDAARAAAEAGETPVGAVILDPSTGEVIATAGNGPIAAHDPTAHAEIAAMRAAAAKLGNYRLTDLTLVVTLEPCAMCAGAISHARIGRVVFGADDPKGGAVVHGPKFFAQPTCHWRPEVTGGVLADESADLLRGFFRARRKAKI
Geobacter sulfurreducens (G. sulfurreducens) TadA:
MSSLKKTPIRDDAYWMGKAIREAAKAAARDEVPIGAVIVRDGAVIGRGHNLREGSNDPSAHAEMIAIRQAARRSANWRLTGATLYVTLEPCLMCMGAIILARLERVVFGCYDPKGGAAGSLYDLSADPRLNHQVRLSPGVCQEECGTMLSDFFRDLRRRKKAKATPALFIDERKVPPEP
TadA*7.10
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
「アデノシンデアミナーゼ塩基エディター8 (ABE8) ポリペプチド」または「ABE8」とは、以下の参照配列:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
のアミノ酸位置82および/または166における改変を含むアデノシンデアミナーゼバリアントを含む本明細書で定義されるような塩基エディターを意味する。いくつかの実施形態において、ABE8は、参照配列と比べて、本明細書に記載されるようなさらなる改変を含む。
「アデノシンデアミナーゼ塩基エディター8 (ABE8) ポリヌクレオチド」とは、ABE8をコードするポリヌクレオチドを意味する。
「投与すること」は、本明細書に記載される1以上の組成物を患者または対象に提供することとして本明細書で言及される。例として、限定するものではないが、組成物の投与、例えば注射は、静脈内 (i.v.) 注射、皮下 (s.c.) 注射、皮内 (i.d.) 注射、腹腔内 (i.p.) 注射又は筋肉内(i.m.) 注射によって行われ得る。1つ以上のそのような経路を用いることができる。非経口投与は、例えば、ボーラス注射によって、または経時的に徐々に灌流することによって行うことができる。あるいは、または同時に、投与は経口経路によることができる。
「薬剤(agent)」とは、任意の小分子化合物、抗体、核酸分子、またはポリペプチド、またはそれらの断片を意味する。
「改変」とは、本明細書に記載のものなどの標準的な当該分野で公知の方法により検出される、遺伝子またはポリペプチドの構造、発現レベルまたは活性における変化(例えば増加または減少)を意味する。本明細書で使用される場合、改変は、25%の変化、40%の変化、50%の変化、またはより大きい変化などの、ポリヌクレオチドもしくはポリペプチド配列における変化または発現レベルにおける変化を含む。
「改善する(ameliorate)」とは、疾患の発生または進行を減少させる、抑制する、減衰させる、低減させる、停止させる、または安定させることを意味する。
「アナログ」とは、同一ではないが、類似の機能的または構造的特徴を有する分子を意味する。例えば、ポリヌクレオチドまたはポリペプチドアナログは、天然に存在するポリヌクレオチドまたはポリペプチドと比べてアナログの機能を増強するある特定の改変を有しながら、対応する天然に存在するポリヌクレオチドまたはポリペプチドの生物活性を保持する。そのような改変は、例えばリガンド結合性を改変することなく、アナログのDNAに対する親和性、効率、特異性、プロテアーゼもしくはヌクレアーゼ耐性、膜透過性、および/または半減期を増加させ得る。アナログは非天然ヌクレオチドまたはアミノ酸を含み得る。
「塩基エディター (BE)」または「核酸塩基エディター (NBE)」とは、ポリヌクレオチドに結合し、核酸塩基修飾活性を有する薬剤を意味する。様々な実施形態において、塩基エディターは、核酸塩基修飾ポリペプチド(例えばデアミナーゼ)および核酸プログラム可能なヌクレオチド結合ドメインをガイドポリヌクレオチド(例えばガイドRNA)と組み合わせて含む。様々な実施形態において、該薬剤は、塩基編集活性を有するタンパク質ドメイン、すなわち、核酸分子(例えばDNA)内の塩基(例えばA、T、C、G、U)を改変することができるドメインを含む生体分子複合体である。いくつかの実施形態において、ポリヌクレオチドプログラム可能なDNA結合ドメインはデアミナーゼドメインに融合または連結している。一実施形態において、薬剤は、塩基編集活性を有するドメインを含む融合タンパク質である。別の実施形態において、塩基編集活性を有するタンパク質ドメインは(例えばガイドRNA上のRNA結合モチーフおよびデアミナーゼに融合したRNA結合ドメインを介して)ガイドRNAに連結している。いくつかの実施形態において、塩基編集活性を有するドメインは、核酸分子内の塩基を脱アミノ化することができる。いくつかの実施形態において、塩基エディターは、DNA分子内の1つまたは複数の塩基を脱アミノ化することができる。いくつかの実施形態において、塩基エディターは、DNA内のアデノシン (A) を脱アミノ化することができる。いくつかの実施形態において、塩基エディターはアデノシン塩基エディター (ABE) である。
例として、本明細書に記載の塩基編集組成物、システム、および方法において使用されるシチジン塩基エディター (CBE) は、下記の核酸配列(8877塩基対)(Addgene, Watertown, MA.; Komor AC, et al., 2017, Sci Adv., 30;3(8):eaao4774. doi: 10.1126/sciadv.aao4774)を有する。BE4核酸配列に対して少なくとも95%以上の同一性を有するポリヌクレオチド配列も包含される。
1 atatgccaag tacgccccct attgacgtca atgacggtaa atggcccgcc tggcattatg
61 cccagtacat gaccttatgg gactttccta cttggcagta catctacgta ttagtcatcg
121 ctattaccat ggtgatgcgg ttttggcagt acatcaatgg gcgtggatag cggtttgact
181 cacggggatt tccaagtctc caccccattg acgtcaatgg gagtttgttt tggcaccaaa
241 atcaacggga ctttccaaaa tgtcgtaaca actccgcccc attgacgcaa atgggcggta
301 ggcgtgtacg gtgggaggtc tatataagca gagctggttt agtgaaccgt cagatccgct
361 agagatccgc ggccgctaat acgactcact atagggagag ccgccaccat gagctcagag
421 actggcccag tggctgtgga ccccacattg agacggcgga tcgagcccca tgagtttgag
481 gtattcttcg atccgagaga gctccgcaag gagacctgcc tgctttacga aattaattgg
541 gggggccggc actccatttg gcgacataca tcacagaaca ctaacaagca cgtcgaagtc
601 aacttcatcg agaagttcac gacagaaaga tatttctgtc cgaacacaag gtgcagcatt
661 acctggtttc tcagctggag cccatgcggc gaatgtagta gggccatcac tgaattcctg
721 tcaaggtatc cccacgtcac tctgtttatt tacatcgcaa ggctgtacca ccacgctgac
781 ccccgcaatc gacaaggcct gcgggatttg atctcttcag gtgtgactat ccaaattatg
841 actgagcagg agtcaggata ctgctggaga aactttgtga attatagccc gagtaatgaa
901 gcccactggc ctaggtatcc ccatctgtgg gtacgactgt acgttcttga actgtactgc
961 atcatactgg gcctgcctcc ttgtctcaac attctgagaa ggaagcagcc acagctgaca
1021 ttctttacca tcgctcttca gtcttgtcat taccagcgac tgcccccaca cattctctgg
1081 gccaccgggt tgaaatctgg tggttcttct ggtggttcta gcggcagcga gactcccggg
1141 acctcagagt ccgccacacc cgaaagttct ggtggttctt ctggtggttc tgataaaaag
1201 tattctattg gtttagccat cggcactaat tccgttggat gggctgtcat aaccgatgaa
1261 tacaaagtac cttcaaagaa atttaaggtg ttggggaaca cagaccgtca ttcgattaaa
1321 aagaatctta tcggtgccct cctattcgat agtggcgaaa cggcagaggc gactcgcctg
1381 aaacgaaccg ctcggagaag gtatacacgt cgcaagaacc gaatatgtta cttacaagaa
1441 atttttagca atgagatggc caaagttgac gattctttct ttcaccgttt ggaagagtcc
1501 ttccttgtcg aagaggacaa gaaacatgaa cggcacccca tctttggaaa catagtagat
1561 gaggtggcat atcatgaaaa gtacccaacg atttatcacc tcagaaaaaa gctagttgac
1621 tcaactgata aagcggacct gaggttaatc tacttggctc ttgcccatat gataaagttc
1681 cgtgggcact ttctcattga gggtgatcta aatccggaca actcggatgt cgacaaactg
1741 ttcatccagt tagtacaaac ctataatcag ttgtttgaag agaaccctat aaatgcaagt
1801 ggcgtggatg cgaaggctat tcttagcgcc cgcctctcta aatcccgacg gctagaaaac
1861 ctgatcgcac aattacccgg agagaagaaa aatgggttgt tcggtaacct tatagcgctc
1921 tcactaggcc tgacaccaaa ttttaagtcg aacttcgact tagctgaaga tgccaaattg
1981 cagcttagta aggacacgta cgatgacgat ctcgacaatc tactggcaca aattggagat
2041 cagtatgcgg acttattttt ggctgccaaa aaccttagcg atgcaatcct cctatctgac
2101 atactgagag ttaatactga gattaccaag gcgccgttat ccgcttcaat gatcaaaagg
2161 tacgatgaac atcaccaaga cttgacactt ctcaaggccc tagtccgtca gcaactgcct
2221 gagaaatata aggaaatatt ctttgatcag tcgaaaaacg ggtacgcagg ttatattgac
2281 ggcggagcga gtcaagagga attctacaag tttatcaaac ccatattaga gaagatggat
2341 gggacggaag agttgcttgt aaaactcaat cgcgaagatc tactgcgaaa gcagcggact
2401 ttcgacaacg gtagcattcc acatcaaatc cacttaggcg aattgcatgc tatacttaga
2461 aggcaggagg atttttatcc gttcctcaaa gacaatcgtg aaaagattga gaaaatccta
2521 acctttcgca taccttacta tgtgggaccc ctggcccgag ggaactctcg gttcgcatgg
2581 atgacaagaa agtccgaaga aacgattact ccatggaatt ttgaggaagt tgtcgataaa
2641 ggtgcgtcag ctcaatcgtt catcgagagg atgaccaact ttgacaagaa tttaccgaac
2701 gaaaaagtat tgcctaagca cagtttactt tacgagtatt tcacagtgta caatgaactc
2761 acgaaagtta agtatgtcac tgagggcatg cgtaaacccg cctttctaag cggagaacag
2821 aagaaagcaa tagtagatct gttattcaag accaaccgca aagtgacagt taagcaattg
2881 aaagaggact actttaagaa aattgaatgc ttcgattctg tcgagatctc cggggtagaa
2941 gatcgattta atgcgtcact tggtacgtat catgacctcc taaagataat taaagataag
3001 gacttcctgg ataacgaaga gaatgaagat atcttagaag atatagtgtt gactcttacc
3061 ctctttgaag atcgggaaat gattgaggaa agactaaaaa catacgctca cctgttcgac
3121 gataaggtta tgaaacagtt aaagaggcgt cgctatacgg gctggggacg attgtcgcgg
3181 aaacttatca acgggataag agacaagcaa agtggtaaaa ctattctcga ttttctaaag
3241 agcgacggct tcgccaatag gaactttatg cagctgatcc atgatgactc tttaaccttc
3301 aaagaggata tacaaaaggc acaggtttcc ggacaagggg actcattgca cgaacatatt
3361 gcgaatcttg ctggttcgcc agccatcaaa aagggcatac tccagacagt caaagtagtg
3421 gatgagctag ttaaggtcat gggacgtcac aaaccggaaa acattgtaat cgagatggca
3481 cgcgaaaatc aaacgactca gaaggggcaa aaaaacagtc gagagcggat gaagagaata
3541 gaagagggta ttaaagaact gggcagccag atcttaaagg agcatcctgt ggaaaatacc
3601 caattgcaga acgagaaact ttacctctat tacctacaaa atggaaggga catgtatgtt
3661 gatcaggaac tggacataaa ccgtttatct gattacgacg tcgatcacat tgtaccccaa
3721 tcctttttga aggacgattc aatcgacaat aaagtgctta cacgctcgga taagaaccga
3781 gggaaaagtg acaatgttcc aagcgaggaa gtcgtaaaga aaatgaagaa ctattggcgg
3841 cagctcctaa atgcgaaact gataacgcaa agaaagttcg ataacttaac taaagctgag
3901 aggggtggct tgtctgaact tgacaaggcc ggatttatta aacgtcagct cgtggaaacc
3961 cgccaaatca caaagcatgt tgcacagata ctagattccc gaatgaatac gaaatacgac
4021 gagaacgata agctgattcg ggaagtcaaa gtaatcactt taaagtcaaa attggtgtcg
4081 gacttcagaa aggattttca attctataaa gttagggaga taaataacta ccaccatgcg
4141 cacgacgctt atcttaatgc cgtcgtaggg accgcactca ttaagaaata cccgaagcta
4201 gaaagtgagt ttgtgtatgg tgattacaaa gtttatgacg tccgtaagat gatcgcgaaa
4261 agcgaacagg agataggcaa ggctacagcc aaatacttct tttattctaa cattatgaat
4321 ttctttaaga cggaaatcac tctggcaaac ggagagatac gcaaacgacc tttaattgaa
4381 accaatgggg agacaggtga aatcgtatgg gataagggcc gggacttcgc gacggtgaga
4441 aaagttttgt ccatgcccca agtcaacata gtaaagaaaa ctgaggtgca gaccggaggg
4501 ttttcaaagg aatcgattct tccaaaaagg aatagtgata agctcatcgc tcgtaaaaag
4561 gactgggacc cgaaaaagta cggtggcttc gatagcccta cagttgccta ttctgtccta
4621 gtagtggcaa aagttgagaa gggaaaatcc aagaaactga agtcagtcaa agaattattg
4681 gggataacga ttatggagcg ctcgtctttt gaaaagaacc ccatcgactt ccttgaggcg
4741 aaaggttaca aggaagtaaa aaaggatctc ataattaaac taccaaagta tagtctgttt
4801 gagttagaaa atggccgaaa acggatgttg gctagcgccg gagagcttca aaaggggaac
4861 gaactcgcac taccgtctaa atacgtgaat ttcctgtatt tagcgtccca ttacgagaag
4921 ttgaaaggtt cacctgaaga taacgaacag aagcaacttt ttgttgagca gcacaaacat
4981 tatctcgacg aaatcataga gcaaatttcg gaattcagta agagagtcat cctagctgat
5041 gccaatctgg acaaagtatt aagcgcatac aacaagcaca gggataaacc catacgtgag
5101 caggcggaaa atattatcca tttgtttact cttaccaacc tcggcgctcc agccgcattc
5161 aagtattttg acacaacgat agatcgcaaa cgatacactt ctaccaagga ggtgctagac
5221 gcgacactga ttcaccaatc catcacggga ttatatgaaa ctcggataga tttgtcacag
5281 cttgggggtg actctggtgg ttctggagga tctggtggtt ctactaatct gtcagatatt
5341 attgaaaagg agaccggtaa gcaactggtt atccaggaat ccatcctcat gctcccagag
5401 gaggtggaag aagtcattgg gaacaagccg gaaagcgata tactcgtgca caccgcctac
5461 gacgagagca ccgacgagaa tgtcatgctt ctgactagcg acgcccctga atacaagcct
5521 tgggctctgg tcatacagga tagcaacggt gagaacaaga ttaagatgct ctctggtggt
5581 tctggaggat ctggtggttc tactaatctg tcagatatta ttgaaaagga gaccggtaag
5641 caactggtta tccaggaatc catcctcatg ctcccagagg aggtggaaga agtcattggg
5701 aacaagccgg aaagcgatat actcgtgcac accgcctacg acgagagcac cgacgagaat
5761 gtcatgcttc tgactagcga cgcccctgaa tacaagcctt gggctctggt catacaggat
5821 agcaacggtg agaacaagat taagatgctc tctggtggtt ctcccaagaa gaagaggaaa
5881 gtctaaccgg tcatcatcac catcaccatt gagtttaaac ccgctgatca gcctcgactg
5941 tgccttctag ttgccagcca tctgttgttt gcccctcccc cgtgccttcc ttgaccctgg
6001 aaggtgccac tcccactgtc ctttcctaat aaaatgagga aattgcatcg cattgtctga
6061 gtaggtgtca ttctattctg gggggtgggg tggggcagga cagcaagggg gaggattggg
6121 aagacaatag caggcatgct ggggatgcgg tgggctctat ggcttctgag gcggaaagaa
6181 ccagctgggg ctcgataccg tcgacctcta gctagagctt ggcgtaatca tggtcatagc
6241 tgtttcctgt gtgaaattgt tatccgctca caattccaca caacatacga gccggaagca
6301 taaagtgtaa agcctagggt gcctaatgag tgagctaact cacattaatt gcgttgcgct
6361 cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaatga atcggccaac
6421 gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc
6481 tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt
6541 tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg
6601 ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg
6661 agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat
6721 accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta
6781 ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct
6841 gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc
6901 ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa
6961 gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg
7021 taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag
7081 tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt
7141 gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta
7201 cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc
7261 agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca
7321 cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa
7381 cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat
7441 ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct
7501 taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt
7561 tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat
7621 ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta
7681 atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg
7741 gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt
7801 tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg
7861 cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg
7921 taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc
7981 ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa
8041 ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac
8101 cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt
8161 ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg
8221 gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa
8281 gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata
8341 aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgacgtc gacggatcgg
8401 gagatcgatc tcccgatccc ctagggtcga ctctcagtac aatctgctct gatgccgcat
8461 agttaagcca gtatctgctc cctgcttgtg tgttggaggt cgctgagtag tgcgcgagca
8521 aaatttaagc tacaacaagg caaggcttga ccgacaattg catgaagaat ctgcttaggg
8581 ttaggcgttt tgcgctgctt cgcgatgtac gggccagata tacgcgttga cattgattat
8641 tgactagtta ttaatagtaa tcaattacgg ggtcattagt tcatagccca tatatggagt
8701 tccgcgttac ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc
8761 cattgacgtc aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac
8821 gtcaatgggt ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatc
いくつかの実施形態において、シチジン塩基エディターは、以下のうちの1つから選択される核酸配列を有するBE4である:
元のBE4核酸配列:
ATGagctcagagactggcccagtggctgtggaccccacattgagacggcggatcgagccccatgagtttgaggtattcttcgatccgagagagctccgcaaggagacctgcctgctttacgaaattaattgggggggccggcactccatttggcgacatacatcacagaacactaacaagcacgtcgaagtcaacttcatcgagaagttcacgacagaaagatatttctgtccgaacacaaggtgcagcattacctggtttctcagctggagccgcgaatgtagtagggccatcactgaattcctgtcaaggtatccccacgtcactctgtttatttacatcgcaaggctgtaccaccacgctgacccccgcaatcgacaaggcctgcgggatttgatctcttcaggtgtgactatccaaattatgactgagcaggagtcaggatactgctggagaaactttgtgaattatagcccgagtaatgaagcccactggcctaggtatccccatctgtgggtacgactgtacgttcttgaactgtactgcatcatactgggcctgcctccttgtctcaacattctgagaaggaagcagccacagctgacattctttaccatcgctcttcagtcttgtcattaccagcgactgcccccacacattctctgggccaccgggttgaaatctggtggttcttctggtggttctagcggcagcgagactcccgggacctcagagtccgccacacccgaaagttctggtggttcttctggtggttctgataaaaagtattctattggtttagccatcggcactaattccgttggatgggctgtcataaccgatgaatacaaagtaccttcaaagaaatttaaggtgttggggaacacagaccgtcattcgattaaaaagaatcttatcggtgccctcctattcgatagtggcgaaacggcagaggcgactcgcctgaaacgaaccgctcggagaaggtatacacgtcgcaagaaccgaatatgttacttacaagaaatttttagcaatgagatggccaaagttgacgattctttctttcaccgtttggaagagtccttccttgtcgaagaggacaagaaacatgaacggcaccccatctttggaaacatagtagatgaggtggcatatcatgaaaagtacccaacgatttatcacctcagaaaaaagctagttgactcaactgataaagcggacctgaggttaatctacttggctcttgcccatatgataaagttccgtgggcactttctcattgagggtgatctaaatccggacaactcggatgtcgacaaactgttcatccagttagtacaaacctataatcagttgtttgaagagaaccctataaatgcaagtggcgtggatgcgaaggctattcttagcgcccgcctctctaaatcccgacggctagaaaacctgatcgcacaattacccggagagaagaaaaatgggttgttcggtaaccttatagcgctctcactaggcctgacaccaaattttaagtcgaacttcgacttagctgaagatgccaaattgcagcttagtaaggacacgtacgatgacgatctcgacaatctactggcacaaattggagatcagtatgcggacttatttttggctgccaaaaaccttagcgatgcaatcctcctatctgacatactgagagttaatactgagattaccaaggcgccgttatccgcttcaatgatcaaaaggtacgatgaacatcaccaagacttgacacttctcaaggccctagtccgtcagcaactgcctgagaaatataaggaaatattctttgatcagtcgaaaaacgggtacgcaggttatattgacggcggagcgagtcaagaggaattctacaagtttatcaaacccatattagagaagatggatgggacggaagagttgcttgtaaaactcaatcgcgaagatctactgcgaaagcagcggactttcgacaacggtagcattccacatcaaatccacttaggcgaattgcatgctatacttagaaggcaggaggatttttatccgttcctcaaagacaatcgtgaaaagattgagaaaatcctaacctttcgcataccttactatgtgggacccctggcccgagggaactctcggttcgcatggatgacaagaaagtccgaagaaacgattactccatggaattttgaggaagttgtcgataaaggtgcgtcagctcaatcgttcatcgagaggatgaccaactttgacaagaatttaccgaacgaaaaagtattgcctaagcacagtttactttacgagtatttcacagtgtacaatgaactcacgaaagttaagtatgtcactgagggcatgcgtaaacccgcctttctaagcggagaacagaagaaagcaatagtagatctgttattcaagaccaaccgcaaagtgacagttaagcaattgaaagaggactactttaagaaaattgaatgcttcgattctgtcgagatctccggggtagaagatcgatttaatgcgtcacttggtacgtatcatgacctcctaaagataattaaagataaggacttcctggataacgaagagaatgaagatatcttagaagatatagtgttgactcttaccctctttgaagatcgggaaatgattgaggaaagactaaaaacatacgctcacctgttcgacgataaggttatgaaacagttaaagaggcgtcgctatacgggctggggacgattgtcgcggaaacttatcaacgggataagagacaagcaaagtggtaaaactattctcgattttctaaagagcgacggcttcgccaataggaactttatgcagctgatccatgatgactctttaaccttcaaagaggatatacaaaaggcacaggtttccggacaaggggactcattgcacgaacatattgcgaatcttgctggttcgccagccatcaaaaagggcatactccagacagtcaaagtagtggatgagctagttaaggtcatgggacgtcacaaaccggaaaacattgtaatcgagatggcacgcgaaaatcaaacgactcagaaggggcaaaaaaacagtcgagagcggatgaagagaatagaagagggtattaaagaactgggcagccagatcttaaaggagcatcctgtggaaaatacccaattgcagaacgagaaactttacctctattacctacaaaatggaagggacatgtatgttgatcaggaactggacataaaccgtttatctgattacgacgtcgatcacattgtaccccaatcctttttgaaggacgattcaatcgacaataaagtgcttacacgctcggataagaaccgagggaaaagtgacaatgttccaagcgaggaagtcgtaaagaaaatgaagaactattggcggcagctcctaaatgcgaaactgataacgcaaagaaagttcgataacttaactaaagctgagaggggtggcttgtctgaacttgacaaggccggatttattaaacgtcagctcgtggaaacccgccaaatcacaaagcatgttgcacagatactagattcccgaatgaatacgaaatacgacgagaacgataagctgattcgggaagtcaaagtaatcactttaaagtcaaaattggtgtcggacttcagaaaggattttcaattctataaagttagggagataaataactaccaccatgcgcacgacgcttatcttaatgccgtcgtagggaccgcactcattaagaaatacccgaagctagaaagtgagtttgtgtatggtgattacaaagtttatgacgtccgtaagatgatcgcgaaaagcgaacaggagataggcaaggctacagccaaatacttcttttattctaacattatgaatttctttaagacggaaatcactctggcaaacggagagatacgcaaacgacctttaattgaaaccaatggggagacaggtgaaatcgtatgggataagggccgggacttcgcgacggtgagaaaagttttgtccatgccccaagtcaacatagtaaagaaaactgaggtgcagaccggagggttttcaaaggaatcgattcttccaaaaaggaatagtgataagctcatcgctcgtaaaaaggactgggacccgaaaaagtacggtggcttcgatagccctacagttgcctattctgtcctagtagtggcaaaagttgagaagggaaaatccaagaaactgaagtcagtcaaagaattattggggataacgattatggagcgctcgtcttttgaaaagaaccccatcgacttccttgaggcgaaaggttacaaggaagtaaaaaaggatctcataattaaactaccaaagtatagtctgtttgagttagaaaatggccgaaaacggatgttggctagcgccggagagcttcaaaaggggaacgaactcgcactaccgtctaaatacgtgaatttcctgtatttagcgtcccattacgagaagttgaaaggttcacctgaagataacgaacagaagcaactttttgttgagcagcacaaacattatctcgacgaaatcatagagcaaatttcggaattcagtaagagagtcatcctagctgatgccaatctggacaaagtattaagcgcatacaacaagcacagggataaacccatacgtgagcaggcggaaaatattatccatttgtttactcttaccaacctcggcgctccagccgcattcaagtattttgacacaacgatagatcgcaaacgatacacttctaccaaggaggtgctagacgcgacactgattcaccaatccatcacgggattatatgaaactcggatagatttgtcacagcttgggggtgactctggtggttctggaggatctggtggttctactaatctgtcagatattattgaaaaggagaccggtaagcaactggttatccaggaatccatcctcatgctcccagaggaggtggaagaagtcattgggaacaagccggaaagcgatatactcgtgcacaccgcctacgacgagagcaccgacgagaatgtcatgcttctgactagcgacgcccctgaatacaagccttgggctctggtcatacaggatagcaacggtgagaacaagattaagatgctctctggtggttctggaggatctggtggttctactaatctgtcagatattattgaaaaggagaccggtaagcaactggttatccaggaatccatcctcatgctcccagaggaggtggaagaagtcattgggaacaagccggaaagcgatatactcgtgcacaccgcctacgacgagagcaccgacgagaatgtcatgcttctgactagcgacgcccctgaatacaagccttgggctctggtcatacaggatagcaacggtgagaacaagattaagatgctctctggtggttctAAAAGGACGGCGGACGGATCAGAGTTCGAGAGTCCGAAAAAAAAACGAAAGGTCGAAtaa
BE4コドン最適化1核酸配列:
ATGTCATCCGAAACCGGGCCAGTGGCCGTAGACCCAACACTCAGGAGGCGGATAGAACCCCATGAGTTTGAAGTGTTCTTCGACCCCAGAGAGCTGCGCAAAGAGACTTGCCTCCTGTATGAAATAAATTGGGGGGGTCGCCATTCAATTTGGAGGCACACTAGCCAGAATACTAACAAACACGTGGAGGTAAATTTTATCGAGAAGTTTACCACCGAAAGATACTTTTGCCCCAATACACGGTGTTCAATTACCTGGTTTCTGTCATGGAGTCCATGTGGAGAATGTAGTAGAGCGATAACTGAGTTCCTGTCTCGATATCCTCACGTCACGTTGTTTATATACATCGCTCGGCTTTATCACCATGCGGACCCGCGGAACAGGCAAGGTCTTCGGGACCTCATATCCTCTGGGGTGACCATCCAGATAATGACGGAGCAAGAGAGCGGATACTGCTGGCGAAACTTTGTTAACTACAGCCCAAGCAATGAGGCACACTGGCCTAGATATCCGCATCTCTGGGTTCGACTGTATGTCCTTGAACTGTACTGCATAATTCTGGGACTTCCGCCATGCTTGAACATTCTGCGGCGGAAACAACCACAGCTGACCTTTTTCACGATTGCTCTCCAAAGTTGTCACTACCAGCGATTGCCACCCCACATCTTGTGGGCTACTGGACTCAAGTCTGGAGGAAGTTCAGGCGGAAGCAGCGGGTCTGAAACGCCCGGAACCTCAGAGAGCGCAACGCCCGAAAGCTCTGGAGGGTCAAGTGGTGGTAGTGATAAGAAATACTCCATCGGCCTCGCCATCGGTACGAATTCTGTCGGTTGGGCCGTTATCACCGATGAGTACAAGGTCCCTTCTAAGAAATTCAAGGTTTTGGGCAATACAGACCGCCATTCTATAAAAAAAAACCTGATCGGCGCCCTTTTGTTTGACAGTGGTGAGACTGCTGAAGCGACTCGCCTGAAGCGAACTGCCAGGAGGCGGTATACGAGGCGAAAAAACCGAATTTGTTACCTCCAGGAGATTTTCTCAAATGAAATGGCCAAGGTAGATGATAGTTTTTTTCACCGCTTGGAAGAAAGTTTTCTCGTTGAGGAGGACAAAAAGCACGAGAGGCACCCAATCTTTGGCAACATAGTCGATGAGGTCGCATACCATGAGAAATATCCTACGATCTATCATCTCCGCAAGAAGCTGGTCGATAGCACGGATAAAGCTGACCTCCGGCTGATCTACCTTGCTCTTGCTCACATGATTAAATTCAGGGGCCATTTCCTGATAGAAGGAGACCTCAATCCCGACAATTCTGATGTCGACAAACTGTTTATTCAGCTCGTTCAGACCTATAATCAACTCTTTGAGGAGAACCCCATCAATGCTTCAGGGGTGGACGCAAAGGCCATTTTGTCCGCGCGCTTGAGTAAATCACGACGCCTCGAGAATTTGATAGCTCAACTGCCGGGTGAGAAGAAAAACGGGTTGTTTGGGAATCTCATAGCGTTGAGTTTGGGACTTACGCCAAACTTTAAGTCTAACTTTGATTTGGCCGAAGATGCCAAATTGCAGCTGTCCAAAGATACCTATGATGACGACTTGGATAACCTTCTTGCGCAGATTGGTGACCAATACGCGGATCTGTTTCTTGCCGCAAAAAATCTGTCCGACGCCATACTCTTGTCCGATATACTGCGCGTCAATACTGAGATAACTAAGGCTCCCCTCAGCGCGTCCATGATTAAAAGATACGATGAGCACCACCAAGATCTCACTCTGTTGAAAGCCCTGGTTCGCCAGCAGCTTCCAGAGAAGTATAAGGAGATATTTTTCGACCAATCTAAAAACGGCTATGCGGGTTACATTGACGGTGGCGCCTCTCAAGAAGAATTCTACAAGTTTATAAAGCCGATACTTGAGAAAATGGACGGTACAGAGGAATTGTTGGTTAAGCTCAATCGCGAGGACTTGTTGAGAAAGCAGCGCACATTTGACAATGGTAGTATTCCACACCAGATTCATCTGGGCGAGTTGCATGCCATTCTTAGAAGACAAGAAGATTTTTATCCGTTTCTGAAAGATAACAGAGAAAAGATTGAAAAGATACTTACCTTTCGCATACCGTATTATGTAGGTCCCCTGGCTAGAGGGAACAGTCGCTTCGCTTGGATGACTCGAAAATCAGAAGAAACAATAACCCCCTGGAATTTTGAAGAAGTGGTAGATAAAGGTGCGAGTGCCCAATCTTTTATTGAGCGGATGACAAATTTTGACAAGAATCTGCCTAACGAAAAGGTGCTTCCCAAGCATTCCCTTTTGTATGAATACTTTACAGTATATAATGAACTGACTAAAGTGAAGTACGTTACCGAGGGGATGCGAAAGCCAGCTTTTCTCAGTGGCGAGCAGAAAAAAGCAATAGTTGACCTGCTGTTCAAGACGAATAGGAAGGTTACCGTCAAACAGCTCAAAGAAGATTACTTTAAAAAGATCGAATGTTTTGATTCAGTTGAGATAAGCGGAGTAGAGGATAGATTTAACGCAAGTCTTGGAACTTATCATGACCTTTTGAAGATCATCAAGGATAAAGATTTTTTGGACAACGAGGAGAATGAAGATATCCTGGAAGATATAGTACTTACCTTGACGCTTTTTGAAGATCGAGAGATGATCGAGGAGCGACTTAAGACGTACGCACATCTCTTTGACGATAAGGTTATGAAACAATTGAAACGCCGGCGGTATACTGGCTGGGGCAGGCTTTCTCGAAAGCTGATTAATGGTATCCGCGATAAGCAGTCTGGAAAGACAATCCTTGACTTTCTGAAAAGTGATGGATTTGCAAATAGAAACTTTATGCAGCTTATACATGATGACTCTTTGACGTTCAAGGAAGACATCCAGAAGGCACAGGTATCCGGCCAAGGGGATAGCCTCCATGAACACATAGCCAACCTGGCCGGCTCACCAGCTATTAAAAAGGGAATATTGCAAACCGTTAAGGTTGTTGACGAACTCGTTAAGGTTATGGGCCGACACAAACCAGAGAATATCGTGATTGAGATGGCTAGGGAGAATCAGACCACTCAAAAAGGTCAGAAAAATTCTCGCGAAAGGATGAAGCGAATTGAAGAGGGAATCAAAGAACTTGGCTCTCAAATTTTGAAAGAGCACCCGGTAGAAAACACTCAGCTGCAGAATGAAAAGCTGTATCTGTATTATCTGCAGAATGGTCGAGATATGTACGTTGATCAGGAGCTGGATATCAATAGGCTCAGTGACTACGATGTCGACCACATCGTTCCTCAATCTTTCCTGAAAGATGACTCTATCGACAACAAAGTGTTGACGCGATCAGATAAGAACCGGGGAAAATCCGACAATGTACCCTCAGAAGAAGTTGTCAAGAAGATGAAAAACTATTGGAGACAATTGCTGAACGCCAAGCTCATAACACAACGCAAGTTCGATAACTTGACGAAAGCCGAAAGAGGTGGGTTGTCAGAATTGGACAAAGCTGGCTTTATTAAGCGCCAATTGGTGGAGACCCGGCAGATTACGAAACACGTAGCACAAATTTTGGATTCACGAATGAATACCAAATACGACGAAAACGACAAATTGATACGCGAGGTGAAAGTGATTACGCTTAAGAGTAAGTTGGTTTCCGATTTCAGGAAGGATTTTCAGTTTTACAAAGTAAGAGAAATAAACAACTACCACCACGCCCATGATGCTTACCTCAACGCGGTAGTTGGCACAGCTCTTATCAAAAAATATCCAAAGCTGGAAAGCGAGTTCGTTTACGGTGACTATAAAGTATACGACGTTCGGAAGATGATAGCCAAATCAGAGCAGGAAATTGGGAAGGCAACCGCAAAATACTTCTTCTATTCAAACATCATGAACTTCTTTAAGACGGAGATTACGCTCGCGAACGGCGAAATACGCAAGAGGCCCCTCATAGAGACTAACGGCGAAACCGGGGAGATCGTATGGGACAAAGGACGGGACTTTGCGACCGTTAGAAAAGTACTTTCAATGCCACAAGTGAATATTGTTAAAAAGACAGAAGTACAAACAGGGGGGTTCAGTAAGGAATCCATTTTGCCCAAGCGGAACAGTGATAAATTGATAGCAAGGAAAAAAGATTGGGACCCTAAGAAGTACGGTGGTTTCGACTCTCCTACCGTTGCATATTCAGTCCTTGTAGTTGCGAAAGTGGAAAAGGGGAAAAGTAAGAAGCTTAAGAGTGTTAAAGAGCTTCTGGGCATAACCATAATGGAACGGTCTAGCTTCGAGAAAAATCCAATTGACTTTCTCGAGGCTAAAGGTTACAAGGAGGTAAAAAAGGACCTGATAATTAAACTCCCAAAGTACAGTCTCTTCGAGTTGGAGAATGGGAGGAAGAGAATGTTGGCATCTGCAGGGGAGCTCCAAAAGGGGAACGAGCTGGCTCTGCCTTCAAAATACGTGAACTTTCTGTACCTGGCCAGCCACTACGAGAAACTCAAGGGTTCTCCTGAGGATAACGAGCAGAAACAGCTGTTTGTAGAGCAGCACAAGCATTACCTGGACGAGATAATTGAGCAAATTAGTGAGTTCTCAAAAAGAGTAATCCTTGCAGACGCGAATCTGGATAAAGTTCTTTCCGCCTATAATAAGCACCGGGACAAGCCTATACGAGAACAAGCCGAGAACATCATTCACCTCTTTACCCTTACTAATCTGGGCGCGCCGGCCGCCTTCAAATACTTCGACACCACGATAGACAGGAAAAGGTATACGAGTACCAAAGAAGTACTTGACGCCACTCTCATCCACCAGTCTATAACAGGGTTGTACGAAACGAGGATAGATTTGTCCCAGCTCGGCGGCGACTCAGGAGGGTCAGGCGGCTCCGGTGGATCAACGAATCTTTCCGACATAATCGAGAAAGAAACCGGCAAACAGTTGGTGATCCAAGAATCAATCCTGATGCTGCCTGAAGAAGTAGAAGAGGTGATTGGCAACAAACCTGAGTCTGACATTCTTGTCCACACCGCGTATGACGAGAGCACGGACGAGAACGTTATGCTTCTCACTAGCGACGCCCCTGAGTATAAACCATGGGCGCTGGTCATCCAAGATTCCAATGGGGAAAACAAGATTAAGATGCTTAGTGGTGGGTCTGGAGGGAGCGGTGGGTCCACGAACCTCAGCGACATTATTGAAAAAGAGACTGGTAAACAACTTGTAATACAAGAGTCTATTCTGATGTTGCCTGAAGAGGTGGAGGAGGTGATTGGGAACAAACCGGAGTCTGATATACTTGTTCATACCGCCTATGACGAATCTACTGATGAGAATGTGATGCTTTTaACGTCAGACGCTCCCGAGTACAAACCCTGGGCTCTGGTGATTCAGGACAGCAATGGTGAGAATAAGATTAAAATGTTGAGTGGGGGCTCAAAGCGCACGGCTGACGGTAGCGAATTTGAGAGCCCCAAAAAAAAACGAAAGGTCGAAtaa
BE4コドン最適化2核酸配列:
ATGAGCAGCGAGACAGGCCCTGTGGCTGTGGATCCTACACTGCGGAGAAGAATCGAGCCCCACGAGTTCGAGGTGTTCTTCGACCCCAGAGAGCTGCGGAAAGAGACATGCCTGCTGTACGAGATCAACTGGGGCGGCAGACACTCTATCTGGCGGCACACAAGCCAGAACACCAACAAGCACGTGGAAGTGAACTTTATCGAGAAGTTTACGACCGAGCGGTACTTCTGCCCCAACACCAGATGCAGCATCACCTGGTTTCTGAGCTGGTCCCCTTGCGGCGAGTGCAGCAGAGCCATCACCGAGTTTCTGTCCAGATATCCCCACGTGACCCTGTTCATCTATATCGCCCGGCTGTACCACCACGCCGATCCTAGAAATAGACAGGGACTGCGCGACCTGATCAGCAGCGGAGTGACCATCCAGATCATGACCGAGCAAGAGAGCGGCTACTGCTGGCGGAACTTCGTGAACTACAGCCCCAGCAACGAAGCCCACTGGCCTAGATATCCTCACCTGTGGGTCCGACTGTACGTGCTGGAACTGTACTGCATCATCCTGGGCCTGCCTCCATGCCTGAACATCCTGAGAAGAAAGCAGCCTCAGCTGACCTTCTTCACAATCGCCCTGCAGAGCTGCCACTACCAGAGACTGCCTCCACACATCCTGTGGGCCACCGGACTTAAGAGCGGAGGATCTAGCGGCGGCTCTAGCGGATCTGAGACACCTGGCACAAGCGAGTCTGCCACACCTGAGAGTAGCGGCGGATCTTCTGGCGGCTCCGACAAGAAGTACTCTATCGGACTGGCCATCGGCACCAACTCTGTTGGATGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGGTGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAATCTGATCGGCGCCCTGCTGTTCGACTCTGGCGAAACAGCCGAAGCCACCAGACTGAAGAGAACCGCCAGGCGGAGATACACCCGGCGGAAGAACCGGATCTGCTACCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGACAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGATGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGAGACTGATCTACCTGGCTCTGGCCCACATGATCAAGTTCCGGGGCCACTTTCTGATCGAGGGCGATCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCTCTGGCGTGGACGCCAAGGCTATCCTGTCTGCCAGACTGAGCAAGAGCAGAAGGCTGGAAAACCTGATCGCCCAGCTGCCTGGCGAGAAGAAGAATGGCCTGTTCGGCAACCTGATTGCCCTGAGCCTGGGACTGACCCCTAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAGCAAGGACACCTACGACGACGACCTGGACAATCTGCTGGCCCAGATCGGCGATCAGTACGCCGACTTGTTTCTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGATATCCTGAGAGTGAACACCGAGATCACAAAGGCCCCTCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGATCTGACCCTGCTGAAGGCCCTCGTTAGACAGCAGCTGCCAGAGAAGTACAAAGAGATTTTCTTCGATCAGTCCAAGAACGGCTACGCCGGCTACATTGATGGCGGAGCCAGCCAAGAGGAATTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGGACGGCACCGAGGAACTGCTGGTCAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAATGGCTCTATCCCTCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGAGACAAGAGGACTTTTACCCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCAGGATCCCCTACTACGTGGGACCACTGGCCAGAGGCAATAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACACCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCCAGCGCTCAGTCCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCTAACGAGAAGGTGCTGCCCAAGCACTCCCTGCTGTATGAGTACTTCACCGTGTACAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTTCTGAGCGGCGAGCAGAAAAAGGCCATTGTGGATCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACAGCGTGGAAATCAGCGGCGTGGAAGATCGGTTCAATGCCAGCCTGGGCACATACCACGACCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAACGAAGAGAACGAGGACATTCTCGAGGACATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACATACGCCCACCTGTTCGACGACAAAGTGATGAAGCAACTGAAGCGGAGGCGGTACACAGGCTGGGGCAGACTGTCTCGGAAGCTGATCAACGGCATCCGGGATAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAAGCCCAGGTGTCCGGCCAAGGCGATTCTCTGCACGAGCACATTGCCAACCTGGCCGGATCTCCCGCCATTAAGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTTGTGAAAGTGATGGGCAGACACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACACAGAAGGGCCAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGACGGGATATGTACGTGGACCAAGAGCTGGACATCAACCGGCTGAGCGACTACGATGTGGACCATATCGTGCCCCAGAGCTTTCTGAAGGACGACTCCATCGATAACAAGGTCCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGATAACGTGCCCTCCGAAGAGGTGGTCAAGAAGATGAAGAACTACTGGCGACAGCTGCTGAACGCCAAGCTGATTACCCAGCGGAAGTTCGATAACCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTTGATAAGGCCGGCTTCATTAAGCGGCAGCTGGTGGAAACCCGGCAGATCACCAAACACGTGGCACAGATTCTGGACTCCCGGATGAACACTAAGTACGACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTCATCACCCTGAAGTCTAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTCTACAAAGTGCGGGAAATCAACAACTACCATCACGCCCACGACGCCTACCTGAATGCCGTTGTTGGAACAGCCCTGATCAAGAAGTATCCCAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAACAAGAGATCGGCAAGGCTACCGCCAAGTACTTTTTCTACAGCAACATCATGAACTTTTTCAAGACAGAGATCACCCTGGCCAACGGCGAGATCCGGAAAAGACCCCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCAGAGATTTTGCCACAGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAGAAAACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCTAAGCGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAGTACGGCGGCTTCGATAGCCCTACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAAAAGCTCAAGAGCGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTTGAGAAGAACCCGATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTCAAGAAGGACCTCATCATCAAGCTCCCCAAGTACAGCCTGTTCGAGCTGGAAAATGGCCGGAAGCGGATGCTGGCCTCAGCAGGCGAACTGCAGAAAGGCAATGAACTGGCCCTGCCTAGCAAATACGTCAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCAGCCCCGAGGACAATGAGCAAAAGCAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAACCTGGATAAGGTGCTGTCTGCCTATAACAAGCACCGGGACAAGCCTATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAACCTGGGAGCCCCTGCCGCCTTCAAGTACTTCGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAAGAGGTGCTGGACGCCACACTGATCCACCAGTCTATCACCGGCCTGTACGAAACCCGGATCGACCTGTCTCAGCTCGGCGGCGATTCTGGTGGTTCTGGCGGAAGTGGCGGATCCACCAATCTGAGCGACATCATCGAAAAAGAGACAGGCAAGCAGCTCGTGATCCAAGAATCCATCCTGATGCTGCCTGAAGAGGTTGAGGAAGTGATCGGCAACAAGCCTGAGTCCGACATCCTGGTGCACACCGCCTACGATGAGAGCACCGATGAGAACGTCATGCTGCTGACAAGCGACGCCCCTGAGTACAAGCCTTGGGCTCTCGTGATTCAGGACAGCAATGGGGAGAACAAGATCAAGATGCTGAGCGGAGGTAGCGGAGGCAGTGGCGGAAGCACAAACCTGTCTGATATCATTGAAAAAGAAACCGGGAAGCAACTGGTCATTCAAGAGTCCATTCTCATGCTCCCGGAAGAAGTCGAGGAAGTCATTGGAAACAAACCCGAGAGCGATATTCTGGTCCACACAGCCTATGACGAGTCTACAGACGAAAACGTGATGCTCCTGACCTCTGACGCTCCCGAGTATAAGCCCTGGGCACTTGTTATCCAGGACTCTAACGGGGAAAACAAAATCAAAATGTTGTCCGGCGGCAGCAAGCGGACAGCCGATGGATCTGAGTTCGAGAGCCCCAAGAAGAAACGGAAGGTgGAGtaa
いくつかの実施形態において、塩基エディターは、アデノシンデアミナーゼバリアント(例えばTadA*8)を、循環置換体Cas9(例えばspCAS9またはsaCAS9)および二部分核局在化配列を含む足場にクローニングすることにより生成される(例えばABE8)。循環置換体Cas9は当該分野において公知であり、例えば、Oakes et al., Cell 176, 254-267, 2019に記載されている。例示的な循環置換体は、太字の配列がCas9に由来する配列を示し、斜体の配列がリンカー配列を示し、下線を付した配列が二部分核局在化配列を示す場合に従う。
CP5(MSP 「NGC=Pam Variant with mutations Regular Cas9 likes NGG」PID=タンパク質相互作用ドメインおよび「D10A」ニッカーゼを有する):
Figure 2022520081000005
いくつかの実施形態において、ABE8は、下記の表7、表9、表14、または表15からの塩基エディターから選択される。いくつかの実施形態において、ABE8は、TadAから進化したアデノシンデアミナーゼバリアントを含有する。いくつかの実施形態において、ABE8のアデノシンデアミナーゼバリアントは、下記の表7、表9、表14または表15に記載されるようなTadA*8バリアントである。いくつかの実施形態において、アデノシンデアミナーゼバリアントは、Y147T、Y147R、Q154S、Y123H、V82S、T166R、および/またはQ154Rの群から選択される改変の1つまたは複数を含むTadA*7.10バリアント(例えばTadA*8)である。様々な実施形態において、ABE8は、Y147T+Q154R;Y147T+Q154S;Y147R+Q154S;V82S+Q154S;V82S+Y147R;V82S+Q154R;V82S+Y123H;I76Y+V82S;V82S+Y123H+Y147T;V82S+Y123H+Y147R;V82S+Y123H+Q154R;Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y123H+Y147R+Q154R+I76Y;V82S+Y123H+Y147R+Q154R;およびI76Y+V82S+Y123H+Y147R+Q154Rの群から選択される改変の組合せを有するTadA*7.10バリアント(例えばTadA*8)を含む。いくつかの実施形態において、ABE8はモノマー構築物である。いくつかの実施形態において、ABE8はヘテロダイマー構築物である。いくつかの実施形態において、ABE8は、配列:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD
を含む。
いくつかの実施形態において、ポリヌクレオチドプログラム可能なDNA結合ドメインはCRISPR関連(例えばCasまたはCpf1)酵素である。いくつかの実施形態において、塩基エディターは、デアミナーゼドメインに融合した、触媒不活Cas9 (dCas9) である。いくつかの実施形態において、塩基エディターは、デアミナーゼドメインに融合したCas9ニッカーゼ(nCas9)である。塩基エディターの詳細は、国際PCT出願番号PCT/2017/045381 (WO 2018/027078)およびPCT/US2016/058344 (WO 2017/070632)に記載されており、これらのそれぞれは参照により全体が本明細書に組み込まれる。Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage”Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage”Nature 551, 464-471 (2017); Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity”Science Advances 3:eaao4774 (2017)、およびRees, H.A., et al., “Base editing: precision chemistry on the genome and transcriptome of living cells.” Nat Rev Genet. 2018 Dec;19(12):770-788. doi: 10.1038/s41576-018-0059-1(これらの全内容は参照により本明細書に組み込まれる)も参照されたい。
例として、本明細書に記載の塩基編集組成物、システムおよび方法において使用されるアデニン塩基エディター (ABE) は、以下において提供されるような核酸配列(8877塩基対)(Addgene, Watertown, MA.; Gaudelli NM, et al., Nature. 2017 Nov 23;551(7681):464-471. doi: 10.1038/nature24644; Koblan LW, et al., Nat Biotechnol. 2018 Oct;36(9):843-846. doi: 10.1038/nbt.4172.)を有する。ABE核酸配列に対して少なくとも95%またはより高い同一性を有するポリヌクレオチド配列もまた包含される。
ATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACAT
GACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGG
TTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTG
ACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCC
ATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACCGT
CAGATCCGCTAGAGATCCGCGGCCGCTAATACGACTCACTATAGGGAGAGCCGCCACCATGAAACGGACA
GCCGACGGAAGCGAGTTCGAGTCACCAAAGAAGAAGCGGAAAGTCTCTGAAGTCGAGTTTAGCCACGAGT
ATTGGATGAGGCACGCACTGACCCTGGCAAAGCGAGCATGGGATGAAAGAGAAGTCCCCGTGGGCGCCGT
GCTGGTGCACAACAATAGAGTGATCGGAGAGGGATGGAACAGGCCAATCGGCCGCCACGACCCTACCGCA
CACGCAGAGATCATGGCACTGAGGCAGGGAGGCCTGGTCATGCAGAATTACCGCCTGATCGATGCCACCC
TGTATGTGACACTGGAGCCATGCGTGATGTGCGCAGGAGCAATGATCCACAGCAGGATCGGAAGAGTGGT
GTTCGGAGCACGGGACGCCAAGACCGGCGCAGCAGGCTCCCTGATGGATGTGCTGCACCACCCCGGCATG
AACCACCGGGTGGAGATCACAGAGGGAATCCTGGCAGACGAGTGCGCCGCCCTGCTGAGCGATTTCTTTA
GAATGCGGAGACAGGAGATCAAGGCCCAGAAGAAGGCACAGAGCTCCACCGACTCTGGAGGATCTAGCGG
AGGATCCTCTGGAAGCGAGACACCAGGCACAAGCGAGTCCGCCACACCAGAGAGCTCCGGCGGCTCCTCC
GGAGGATCCTCTGAGGTGGAGTTTTCCCACGAGTACTGGATGAGACATGCCCTGACCCTGGCCAAGAGGG
CACGCGATGAGAGGGAGGTGCCTGTGGGAGCCGTGCTGGTGCTGAACAATAGAGTGATCGGCGAGGGCTG
GAACAGAGCCATCGGCCTGCACGACCCAACAGCCCATGCCGAAATTATGGCCCTGAGACAGGGCGGCCTG
GTCATGCAGAACTACAGACTGATTGACGCCACCCTGTACGTGACATTCGAGCCTTGCGTGATGTGCGCCG
GCGCCATGATCCACTCTAGGATCGGCCGCGTGGTGTTTGGCGTGAGGAACGCAAAAACCGGCGCCGCAGG
CTCCCTGATGGACGTGCTGCACTACCCCGGCATGAATCACCGCGTCGAAATTACCGAGGGAATCCTGGCA
GATGAATGTGCCGCCCTGCTGTGCTATTTCTTTCGGATGCCTAGACAGGTGTTCAATGCTCAGAAGAAGG
CCCAGAGCTCCACCGACTCCGGAGGATCTAGCGGAGGCTCCTCTGGCTCTGAGACACCTGGCACAAGCGA
GAGCGCAACACCTGAAAGCAGCGGGGGCAGCAGCGGGGGGTCAGACAAGAAGTACAGCATCGGCCTGGCC
ATCGGCACCAACTCTGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGG
TGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGAGCCCTGCTGTTCGACAGCGGCGA
AACAGCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAGAACCGGATCTGC
TATCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGT
CCTTCCTGGTGGAAGAGGATAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGACGAGGTGGC
CTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGAC
CTGCGGCTGATCTATCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACC
TGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGA
GGAAAACCCCATCAACGCCAGCGGCGTGGACGCCAAGGCCATCCTGTCTGCCAGACTGAGCAAGAGCAGA
CGGCTGGAAAATCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAATGGCCTGTTCGGAAACCTGATTGCCC
TGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAG
CAAGGACACCTACGACGACGACCTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTT
CTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGACATCCTGAGAGTGAACACCGAGATCACCA
AGGCCCCCCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGACCTGACCCTGCTGAAAGC
TCTCGTGCGGCAGCAGCTGCCTGAGAAGTACAAAGAGATTTTCTTCGACCAGAGCAAGAACGGCTACGCC
GGCTACATTGACGGCGGAGCCAGCCAGGAAGAGTTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGG
ACGGCACCGAGGAACTGCTCGTGAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAA
CGGCAGCATCCCCCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGCGGCAGGAAGATTTTTAC
CCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCCGCATCCCCTACTACGTGGGCC
CTCTGGCCAGGGGAAACAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACCCCCTGGAA
CTTCGAGGAAGTGGTGGACAAGGGCGCTTCCGCCCAGAGCTTCATCGAGCGGATGACCAACTTCGATAAG
AACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTATAACGAGC
TGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTCCTGAGCGGCGAGCAGAAAAAGGC
CATCGTGGACCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAG
AAAATCGAGTGCTTCGACTCCGTGGAAATCTCCGGCGTGGAAGATCGGTTCAACGCCTCCCTGGGCACAT
ACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAATGAGGAAAACGAGGACATTCTGGA
AGATATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACCTATGCC
CACCTGTTCGACGACAAAGTGATGAAGCAGCTGAAGCGGCGGAGATACACCGGCTGGGGCAGGCTGAGCC
GGAAGCTGATCAACGGCATCCGGGACAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGG
CTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAA
GCCCAGGTGTCCGGCCAGGGCGATAGCCTGCACGAGCACATTGCCAATCTGGCCGGCAGCCCCGCCATTA
AGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTCGTGAAAGTGATGGGCCGGCACAAGCCCGA
GAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACCCAGAAGGGACAGAAGAACAGCCGCGAGAGA
ATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACA
CCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGGCGGGATATGTACGTGGACCAGGA
ACTGGACATCAACCGGCTGTCCGACTACGATGTGGACCATATCGTGCCTCAGAGCTTTCTGAAGGACGAC
TCCATCGACAACAAGGTGCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCTCCGAAG
AGGTCGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATTACCCAGAGAAAGTT
CGACAATCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAG
CTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATCCTGGACTCCCGGATGAACACTAAGTACG
ACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTGATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCG
GAAGGATTTCCAGTTTTACAAAGTGCGCGAGATCAACAACTACCACCACGCCCACGACGCCTACCTGAAC
GCCGTCGTGGGAACCGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACA
AGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAAATCGGCAAGGCTACCGCCAAGTACTT
CTTCTACAGCAACATCATGAACTTTTTCAAGACCGAGATTACCCTGGCCAACGGCGAGATCCGGAAGCGG
CCTCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCCGGGATTTTGCCACCGTGC
GGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAAAAGACCGAGGTGCAGACAGGCGGCTTCAGCAA
AGAGTCTATCCTGCCCAAGAGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAG
TACGGCGGCTTCGACAGCCCCACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGT
CCAAGAAACTGAAGAGTGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAA
TCCCATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTGCCTAAG
TACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCCGGCGAACTGCAGAAGGGAA
ACGAACTGGCCCTGCCCTCCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGG
CTCCCCCGAGGATAATGAGCAGAAACAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATC
GAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAATCTGGACAAAGTGCTGTCCGCCT
ACAACAAGCACCGGGATAAGCCCATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAA
TCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAA
GAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTC
AGCTGGGAGGTGACTCTGGCGGCTCAAAAAGAACCGCCGACGGCAGCGAATTCGAGCCCAAGAAGAAGAG
GAAAGTCTAACCGGTCATCATCACCATCACCATTGAGTTTAAACCCGCTGATCAGCCTCGACTGTGCCTT
CTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCAC
TGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGT
GGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCT
CTATGGCTTCTGAGGCGGAAAGAACCAGCTGGGGCTCGATACCGTCGACCTCTAGCTAGAGCTTGGCGTA
ATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGA
AGCATAAAGTGTAAAGCCTAGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGC
CCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGG
TTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGA
GCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACA
TGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCT
CCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAA
AGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGAT
ACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTC
GGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTA
TCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTA
ACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTA
CACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGC
TCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCA
GAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACACTCAGTGGAACGAAAACTC
ACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGA
AGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGG
CACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTAC
GATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCA
GATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCT
CCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGT
TGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCC
CAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGA
TCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTAC
TGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGT
ATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAA
AAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAG
TTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGA
GCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATAC
TCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATG
TATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCGACGGA
TCGGGAGATCGATCTCCCGATCCCCTAGGGTCGACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAA
GCCAGTATCTGCTCCCTGCTTGTGTGTTGGAGGTCGCTGAGTAGTGCGCGAGCAAAATTTAAGCTACAAC
AAGGCAAGGCTTGACCGACAATTGCATGAAGAATCTGCTTAGGGTTAGGCGTTTTGCGCTGCTTCGCGAT
GTACGGGCCAGATATACGCGTTGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCAT
TAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCC
CAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCAT
TGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATC
「塩基編集活性」とは、ポリヌクレオチド内の塩基を化学的に改変させるように作用することを意味する。一実施形態では、第1の塩基が第2の塩基に変換される。一実施形態では、塩基編集活性は、シチジンデアミナーゼ活性、例えば標的C・GをT・Aに変換する活性である。別の実施形態において、塩基編集活性は、例えば標的C・GをT・Aに変換する、シチジンデアミナーゼ活性、例えばA・TをG・Cに変換する、アデノシンまたはアデニンデアミナーゼ活性である(PCT/US2019/044935、PCT/US2020/016288を参照されたい;これらのそれぞれは参照により全体が本明細書に組み込まれる)。
いくつかの実施形態において、塩基編集活性は、編集の効率により評価される。塩基編集効率は、任意の好適な平均により、例えば、サンガー配列決定または次世代配列決定により測定され得る。いくつかの実施形態において、塩基編集効率は、塩基エディターによりもたらされた核酸塩基変換を有する全配列決定リードのパーセンテージ、例えば、G.C塩基対に変換された標的A.T塩基対を有する全配列決定リードのパーセンテージにより測定される。いくつかの実施形態において、塩基編集効率は、塩基編集が細胞の集団において行われる場合に、塩基エディターによりもたらされた核酸塩基変換を有する総細胞のパーセンテージにより測定される。
用語「塩基エディターシステム」とは、標的ヌクレオチド配列の核酸塩基を編集するための系を指す。様々な実施形態において、塩基エディターシステムは、(1) ポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン(例えばCas9);(2) 前記核酸塩基を脱アミノ化するためのデアミナーゼドメイン(例えばアデノシンデアミナーゼおよび/またはシチジンデアミナーゼ;PCT/US2019/044935、PCT/US2020/016288を参照されたい;これらのそれぞれは参照により全体が本明細書に組み込まれる);ならびに (3) 1つまたは複数のガイドポリヌクレオチド(例えばガイドRNA)を含む。いくつかの実施形態において、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、ポリヌクレオチドプログラム可能なDNA結合ドメインである。いくつかの実施形態において、塩基エディターはアデニンまたはアデノシン塩基エディター (ABE) である。いくつかの実施形態において、塩基エディターシステムはABE8である。
いくつかの実施形態において、塩基エディターシステムは1つより多くの塩基編集成分を含み得る。例えば、塩基エディターシステムは1つより多くのデアミナーゼを含み得る。いくつかの実施形態において、塩基エディターシステムは1つまたは複数のアデノシンデアミナーゼを含み得る。いくつかの実施形態において、シングルガイドポリヌクレオチドは、異なるデアミナーゼを標的核酸配列に標的化するために利用され得る。いくつかの実施形態において、ガイドポリヌクレオチドの単一のペアは、異なるデアミナーゼを標的核酸配列に標的化するために利用され得る。
塩基エディターシステムのデアミナーゼドメインおよびポリヌクレオチドプログラム可能なヌクレオチド結合成分は、共有結合的にもしくは非共有結合的に、またはこれらの会合および相互作用の任意の組合せで互いに会合され得る。例えば、いくつかの実施形態において、デアミナーゼドメインは、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインにより標的ヌクレオチド配列に標的化することができる。いくつかの実施形態において、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインはデアミナーゼドメインに融合または連結され得る。いくつかの実施形態において、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、デアミナーゼドメインと非共有結合的に相互作用または会合することによりデアミナーゼドメインを標的ヌクレオチド配列に標的化することができる。例えば、いくつかの実施形態において、デアミナーゼドメインは、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインの部分である追加の異種部分またはドメインと相互作用すること、会合すること、または複合体を形成することができる追加の異種部分またはドメインを含むことができる。いくつかの実施形態において、追加の異種部分は、ポリペプチドに結合すること、それと相互作用すること、会合すること、または複合体を形成することができるものであり得る。いくつかの実施形態において、追加の異種部分は、ポリヌクレオチドに結合すること、それと相互作用すること、会合すること、または複合体を形成することができるものであり得る。いくつかの実施形態において、追加の異種部分は、ガイドポリヌクレオチドに結合することができるものであり得る。いくつかの実施形態において、追加の異種部分は、ポリペプチドリンカーに結合することができるものであり得る。いくつかの実施形態において、追加の異種部分は、ポリヌクレオチドリンカーに結合することができるものであり得る。追加の異種部分はタンパク質ドメインであり得る。いくつかの実施形態において、追加の異種部分は、K相同 (KH) ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、無菌のアルファモチーフ、テロメラーゼKu結合モチーフおよびKuタンパク質、テロメラーゼSm7結合モチーフおよびSm7タンパク質、またはRNA認識モチーフであり得る。
塩基エディターシステムはガイドポリヌクレオチド成分をさらに含み得る。塩基エディターシステムの成分は、共有結合、非共有相互作用、またはこれらの会合および相互作用の任意の組合せを介して互いに会合し得ることが理解されるべきである。いくつかの実施形態において、デアミナーゼドメインは、ガイドポリヌクレオチドにより標的ヌクレオチド配列に標的化され得る。例えば、いくつかの実施形態において、デアミナーゼドメインは、ガイドポリヌクレオチドの部分またはセグメント(例えばポリヌクレオチドモチーフ)と相互作用すること、会合すること、または複合体を形成することができる追加の異種部分またはドメイン(例えばRNAまたはDNA結合タンパク質などのポリヌクレオチド結合ドメイン)を含むことができる。いくつかの実施形態において、追加の異種部分またはドメイン(例えばRNAまたはDNA結合タンパク質などのポリヌクレオチド結合ドメイン)はデアミナーゼドメインに融合または連結され得る。いくつかの実施形態において、追加の異種部分は、ポリペプチドに結合すること、それと相互作用すること、会合すること、または複合体を形成することができるものであり得る。いくつかの実施形態において、追加の異種部分は、ポリヌクレオチドに結合すること、それと相互作用すること、会合すること、または複合体を形成することができるものであり得る。いくつかの実施形態において、追加の異種部分は、ガイドポリヌクレオチドに結合することができるものであり得る。いくつかの実施形態において、追加の異種部分は、ポリペプチドリンカーに結合することができるものであり得る。いくつかの実施形態において、追加の異種部分は、ポリヌクレオチドリンカーに結合することができるものであり得る。追加の異種部分はタンパク質ドメインであり得る。いくつかの実施形態において、追加の異種部分は、K相同 (KH) ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、無菌のアルファモチーフ、テロメラーゼKu結合モチーフおよびKuタンパク質、テロメラーゼSm7結合モチーフおよびSm7タンパク質、またはRNA認識モチーフであり得る。
いくつかの実施形態において、塩基エディターシステムは塩基除去修復 (BER) 成分の阻害因子をさらに含むことができる。塩基エディターシステムの成分は、共有結合、非共有相互作用、またはこれらの会合および相互作用の任意の組合せを介して互いに会合し得ることが理解されるべきである。BER成分の阻害因子はBER阻害因子を含み得る。いくつかの実施形態において、BERの阻害因子はウラシルDNAグリコシラーゼ阻害因子 (UGI) であることができる。いくつかの実施形態において、BERの阻害因子はイノシンBER阻害因子であることができる。いくつかの実施形態において、BERの阻害因子は、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインにより標的ヌクレオチド配列に標的化され得る。いくつかの実施形態において、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、BERの阻害因子に融合または連結され得る。いくつかの実施形態において、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインはデアミナーゼドメインおよびBERの阻害因子に融合または連結され得る。いくつかの実施形態において、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、BERの阻害因子と非共有的に相互作用することまたは会合することによりBERの阻害因子を標的ヌクレオチド配列に標的化することができる。例えば、いくつかの実施形態において、BER成分の阻害因子は、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインの部分である追加の異種部分またはドメインと相互作用すること、会合すること、または複合体を形成することができる追加の異種部分またはドメインを含むことができる。
いくつかの実施形態において、BERの阻害因子は、ガイドポリヌクレオチドにより標的ヌクレオチド配列に標的化され得る。例えば、いくつかの実施形態において、BERの阻害因子は、ガイドポリヌクレオチドの部分またはセグメント(例えばポリヌクレオチドモチーフ)と相互作用すること、会合すること、または複合体を形成することができる追加の異種部分またはドメイン(例えばRNAまたはDNA結合タンパク質などのポリヌクレオチド結合ドメイン)を含むことができる。いくつかの実施形態において、ガイドポリヌクレオチド(例えばRNAまたはDNA結合タンパク質などのポリヌクレオチド結合ドメイン)の追加の異種部分またはドメインはBERの阻害因子に融合または連結され得る。いくつかの実施形態において、追加の異種部分は、ポリヌクレオチドに結合すること、それと相互作用すること、会合すること、または複合体を形成することができるものであり得る。いくつかの実施形態において、追加の異種部分は、ガイドポリヌクレオチドに結合することができるものであり得る。いくつかの実施形態において、追加の異種部分は、ポリペプチドリンカーに結合することができるものであり得る。いくつかの実施形態において、追加の異種部分は、ポリヌクレオチドリンカーに結合することができるものであり得る。追加の異種部分はタンパク質ドメインであり得る。いくつかの実施形態において、追加の異種部分は、K相同 (KH) ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、無菌のアルファモチーフ、テロメラーゼKu結合モチーフおよびKuタンパク質、テロメラーゼSm7結合モチーフおよびSm7タンパク質、またはRNA認識モチーフであり得る。
用語「Cas9」または「Cas9ドメイン」は、Cas9タンパク質またはその断片(例えばCas9の活性、不活性、または部分的に活性なDNA切断ドメイン、および/またはCas9のgRNA結合ドメインを含むタンパク質)を含むRNA誘導ヌクレアーゼを指す。Cas9ヌクレアーゼは、casnlヌクレアーゼまたはCRISPR(clustered regularly interspaced short palindromic repeat)結合ヌクレアーゼと呼ばれることもある。CRISPRは、可動遺伝要素(ウイルス、転移因子、接合プラスミド)に対する防御を提供する適応免疫系である。CRISPRクラスターは、スペーサー、先行する可動要素に相補的な配列、および標的侵入核酸を含有する。CRISPRクラスターは転写され、CRISPR RNA (crRNA) にプロセシングされる。II型CRISPRシステムでは、pre-crRNAの正しいプロセシングはトランスコード小RNA (tracrRNA)、内因性リボヌクレアーゼ3(rnc)、およびCas9タンパク質を必要とする。tracrRNAはリボヌクレアーゼ3によるpre-crRNAのプロセシングのガイドとなる。続いて、Cas9/crRNA/tracrRNAが、スペーサーに相補的な線状または環状のdsDNA標的をエンドヌクレアーゼで切断する。crRNAに相補的でない標的鎖は、最初にエンドヌクレアーゼ的に切断され、次にエキソヌクレアーゼ的に3’-5’にトリムされる。天然には、DNA結合および切断は、タンパク質および両方のRNAを典型的に必要とする。しかしながら、シングルガイドRNA(「sgRNA」、または単に「gRNA」)は、crRNAおよびtracrRNAの両方の側面を単一のRNA種に組み込むように操作され得る。例えば、Jinek M., Chylinski K., Fonfara I., Hauer M., Doudna J.A., Charpentier E. Science 337:816-821(2012)を参照されたい(その全内容は参照により本明細書に組み入れられる)。Cas9は、CRISPR反復配列中の短いモチーフ(PAMまたはプロトスペーサー隣接モチーフ)を認識して、自己と非自己を区別することを助ける。Cas9ヌクレアーゼの配列および構造は、当業者に周知である(例えば“Complete genome sequence of an M1 strain of Streptococcus pyogenes.”Ferretti et al., J.J., McShan W.M., Ajdic D.J., Savic D.J., Savic G., Lyon K., Primeaux C., Sezate S., Suvorov A.N., Kenton S., Lai H.S., Lin S.P., Qian Y., Jia H.G., Najar F.Z., Ren Q., Zhu H., Song L., White J., Yuan X., Clifton S.W., Roe B.A., McLaughlin R.E., Proc. Natl. Acad. Sci. U.S.A. 98:4658-4663(2001); “CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III.” Deltcheva E., Chylinski K., Sharma C.M., Gonzales K., Chao Y., Pirzada Z.A., Eckert M.R., Vogel J., Charpentier E., Nature 471:602-607(2011);および“A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.” Jinek M., Chylinski K., Fonfara I., Hauer M., Doudna J.A., Charpentier E. Science 337:816-821(2012)を参照されたい(それぞれの全内容は参照により本明細書に組み込まれる)。Cas9オーソログは、限定されるものではないが、S. pyogenesおよびS. thermophilusを含む様々な種において記載されてきた。追加の好適なCas9ヌクレアーゼおよび配列は、本開示に基づいて当業者に明らかとなり、そのようなCas9ヌクレアーゼおよび配列は、Chylinski, Rhun, and Charpentier, “The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems”(2013) RNA Biology 10:5, 726-737(その全内容は参照により本明細書に組み込まれる)に開示されている生物および遺伝子座からのCas9配列を含む。
例示的なCas9は、Streptococcus pyogenes Cas9(spCas9)であり、そのアミノ酸配列は以下に提供される。
Figure 2022520081000006
(一重下線:HNHドメイン;二重下線:RuvCドメイン)
ヌクレアーゼ不活性化Cas9タンパク質は、互換的に「dCas9」タンパク質(nuclease-“dead”Cas9の意)または触媒不活性Cas9とも称され得る。不活性なDNA切断ドメインを有するCas9タンパク質(またはその断片)を生成する方法は公知である(例えばJinek et al, Science. 337:816-821(2012);Qi et al, “Repurposing CRISPR as an RNA-Guided Platform for Sequence-Specific Control of Gene Expression” (2013) Cell. 28;152(5):1173-83参照(各内容は参照により本明細書に組み込まれる))。例えば、Cas9のDNA切断ドメインは、HNHヌクレアーゼサブドメインとRuvC1サブドメインという2つのサブドメインを含むことが知られている。HNHサブドメインはgRNAに相補的な鎖を切断し、RuvC1サブドメインは非相補的な鎖を切断する。これらのサブドメイン内の変異はCas9のヌクレアーゼ活性を抑制し得る。例えば、突然変異D10AおよびH840Aは、S. pyogenes Cas9のヌクレアーゼ活性を完全に不活性化する(Jinek et al, Science. 337:816-821(2012);Qi et al, Cell. 28;152(5):1173-83 (2013))。いくつかの実施形態において、Cas9ヌクレアーゼは、不活性な(例えば不活性化された)DNA切断ドメインを有し、すなわち、Cas9は、「nCas9」タンパク質(「nickase」Cas9の意)と呼ばれるニッカーゼである。いくつかの実施形態において、Cas9の断片を含むタンパク質が提供される。例えば、いくつかの実施形態において、タンパク質は、以下の2つのCas9ドメインのうちの1つを含む:(1) Cas9のgRNA結合ドメイン;または(2) Cas9のDNA切断ドメイン。いくつかの実施形態において、Cas9またはその断片を含むタンパク質は、「Cas9バリアント」と称される。Cas9バリアントは、Cas9またはその断片と相同性を共有する。例えば、Cas9バリアントは、野生型Cas9と少なくとも約70%の同一性、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一である。いくつかの実施形態において、Cas9変異体は、野生型Cas9と比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50またはより多くのアミノ酸変化を有し得る。いくつかの実施形態において、Cas9バリアントは、Cas9の断片(例えばgRNA結合ドメインまたはDNA切断ドメイン)を含み、その断片は、野生型Cas9の対応する断片と少なくとも約70%の同一性であり、少なくとも約80%同一であり、少なくとも約90%同一であり、少なくとも約95%同一であり、少なくとも約96%同一であり、少なくとも約97%同一であり、少なくとも約98%同一であり、少なくとも約99%同一であり、少なくとも約99.5%同一であり、または少なくとも約99.9%同一である。いくつかの実施形態において、断片は、対応する野生型Cas9のアミノ酸長の少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%同一、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%である。
いくつかの実施形態において、断片は、長さが少なくとも100アミノ酸である。いくつかの実施形態において、断片は、少なくとも100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、または少なくとも1300アミノ酸の長さである。
いくつかの実施形態において、野生型Cas9は、Streptococcus pyogenesからのCas9に対応する(NCBI参照配列:NC_017053.1、ヌクレオチド配列およびアミノ酸配列は以下の通り)。
ATGGATAAGAAATACTCAATAGGCTTAGATATCGGCACAAATAGCGTCGGATGGGCGGTGATCACTGATGATTATAAGGTTCCGTCTAAAAAGTTCAAGGTTCTGGGAAATACAGACCGCCACAGTATCAAAAAAAATCTTATAGGGGCTCTTTTATTTGGCAGTGGAGAGACAGCGGAAGCGACTCGTCTCAAACGGACAGCTCGTAGAAGGTATACACGTCGGAAGAATCGTATTTGTTATCTACAGGAGATTTTTTCAAATGAGATGGCGAAAGTAGATGATAGTTTCTTTCATCGACTTGAAGAGTCTTTTTTGGTGGAAGAAGACAAGAAGCATGAACGTCATCCTATTTTTGGAAATATAGTAGATGAAGTTGCTTATCATGAGAAATATCCAACTATCTATCATCTGCGAAAAAAATTGGCAGATTCTACTGATAAAGCGGATTTGCGCTTAATCTATTTGGCCTTAGCGCATATGATTAAGTTTCGTGGTCATTTTTTGATTGAGGGAGATTTAAATCCTGATAATAGTGATGTGGACAAACTATTTATCCAGTTGGTACAAATCTACAATCAATTATTTGAAGAAAACCCTATTAACGCAAGTAGAGTAGATGCTAAAGCGATTCTTTCTGCACGATTGAGTAAATCAAGACGATTAGAAAATCTCATTGCTCAGCTCCCCGGTGAGAAGAGAAATGGCTTGTTTGGGAATCTCATTGCTTTGTCATTGGGATTGACCCCTAATTTTAAATCAAATTTTGATTTGGCAGAAGATGCTAAATTACAGCTTTCAAAAGATACTTACGATGATGATTTAGATAATTTATTGGCGCAAATTGGAGATCAATATGCTGATTTGTTTTTGGCAGCTAAGAATTTATCAGATGCTATTTTACTTTCAGATATCCTAAGAGTAAATAGTGAAATAACTAAGGCTCCCCTATCAGCTTCAATGATTAAGCGCTACGATGAACATCATCAAGACTTGACTCTTTTAAAAGCTTTAGTTCGACAACAACTTCCAGAAAAGTATAAAGAAATCTTTTTTGATCAATCAAAAAACGGATATGCAGGTTATATTGATGGGGGAGCTAGCCAAGAAGAATTTTATAAATTTATCAAACCAATTTTAGAAAAAATGGATGGTACTGAGGAATTATTGGTGAAACTAAATCGTGAAGATTTGCTGCGCAAGCAACGGACCTTTGACAACGGCTCTATTCCCCATCAAATTCACTTGGGTGAGCTGCATGCTATTTTGAGAAGACAAGAAGACTTTTATCCATTTTTAAAAGACAATCGTGAGAAGATTGAAAAAATCTTGACTTTTCGAATTCCTTATTATGTTGGTCCATTGGCGCGTGGCAATAGTCGTTTTGCATGGATGACTCGGAAGTCTGAAGAAACAATTACCCCATGGAATTTTGAAGAAGTTGTCGATAAAGGTGCTTCAGCTCAATCATTTATTGAACGCATGACAAACTTTGATAAAAATCTTCCAAATGAAAAAGTACTACCAAAACATAGTTTGCTTTATGAGTATTTTACGGTTTATAACGAATTGACAAAGGTCAAATATGTTACTGAGGGAATGCGAAAACCAGCATTTCTTTCAGGTGAACAGAAGAAAGCCATTGTTGATTTACTCTTCAAAACAAATCGAAAAGTAACCGTTAAGCAATTAAAAGAAGATTATTTCAAAAAAATAGAATGTTTTGATAGTGTTGAAATTTCAGGAGTTGAAGATAGATTTAATGCTTCATTAGGCGCCTACCATGATTTGCTAAAAATTATTAAAGATAAAGATTTTTTGGATAATGAAGAAAATGAAGATATCTTAGAGGATATTGTTTTAACATTGACCTTATTTGAAGATAGGGGGATGATTGAGGAAAGACTTAAAACATATGCTCACCTCTTTGATGATAAGGTGATGAAACAGCTTAAACGTCGCCGTTATACTGGTTGGGGACGTTTGTCTCGAAAATTGATTAATGGTATTAGGGATAAGCAATCTGGCAAAACAATATTAGATTTTTTGAAATCAGATGGTTTTGCCAATCGCAATTTTATGCAGCTGATCCATGATGATAGTTTGACATTTAAAGAAGATATTCAAAAAGCACAGGTGTCTGGACAAGGCCATAGTTTACATGAACAGATTGCTAACTTAGCTGGCAGTCCTGCTATTAAAAAAGGTATTTTACAGACTGTAAAAATTGTTGATGAACTGGTCAAAGTAATGGGGCATAAGCCAGAAAATATCGTTATTGAAATGGCACGTGAAAATCAGACAACTCAAAAGGGCCAGAAAAATTCGCGAGAGCGTATGAAACGAATCGAAGAAGGTATCAAAGAATTAGGAAGTCAGATTCTTAAAGAGCATCCTGTTGAAAATACTCAATTGCAAAATGAAAAGCTCTATCTCTATTATCTACAAAATGGAAGAGACATGTATGTGGACCAAGAATTAGATATTAATCGTTTAAGTGATTATGATGTCGATCACATTGTTCCACAAAGTTTCATTAAAGACGATTCAATAGACAATAAGGTACTAACGCGTTCTGATAAAAATCGTGGTAAATCGGATAACGTTCCAAGTGAAGAAGTAGTCAAAAAGATGAAAAACTATTGGAGACAACTTCTAAACGCCAAGTTAATCACTCAACGTAAGTTTGATAATTTAACGAAAGCTGAACGTGGAGGTTTGAGTGAACTTGATAAAGCTGGTTTTATCAAACGCCAATTGGTTGAAACTCGCCAAATCACTAAGCATGTGGCACAAATTTTGGATAGTCGCATGAATACTAAATACGATGAAAATGATAAACTTATTCGAGAGGTTAAAGTGATTACCTTAAAATCTAAATTAGTTTCTGACTTCCGAAAAGATTTCCAATTCTATAAAGTACGTGAGATTAACAATTACCATCATGCCCATGATGCGTATCTAAATGCCGTCGTTGGAACTGCTTTGATTAAGAAATATCCAAAACTTGAATCGGAGTTTGTCTATGGTGATTATAAAGTTTATGATGTTCGTAAAATGATTGCTAAGTCTGAGCAAGAAATAGGCAAAGCAACCGCAAAATATTTCTTTTACTCTAATATCATGAACTTCTTCAAAACAGAAATTACACTTGCAAATGGAGAGATTCGCAAACGCCCTCTAATCGAAACTAATGGGGAAACTGGAGAAATTGTCTGGGATAAAGGGCGAGATTTTGCCACAGTGCGCAAAGTATTGTCCATGCCCCAAGTCAATATTGTCAAGAAAACAGAAGTACAGACAGGCGGATTCTCCAAGGAGTCAATTTTACCAAAAAGAAATTCGGACAAGCTTATTGCTCGTAAAAAAGACTGGGATCCAAAAAAATATGGTGGTTTTGATAGTCCAACGGTAGCTTATTCAGTCCTAGTGGTTGCTAAGGTGGAAAAAGGGAAATCGAAGAAGTTAAAATCCGTTAAAGAGTTACTAGGGATCACAATTATGGAAAGAAGTTCCTTTGAAAAAAATCCGATTGACTTTTTAGAAGCTAAAGGATATAAGGAAGTTAAAAAAGACTTAATCATTAAACTACCTAAATATAGTCTTTTTGAGTTAGAAAACGGTCGTAAACGGATGCTGGCTAGTGCCGGAGAATTACAAAAAGGAAATGAGCTGGCTCTGCCAAGCAAATATGTGAATTTTTTATATTTAGCTAGTCATTATGAAAAGTTGAAGGGTAGTCCAGAAGATAACGAACAAAAACAATTGTTTGTGGAGCAGCATAAGCATTATTTAGATGAGATTATTGAGCAAATCAGTGAATTTTCTAAGCGTGTTATTTTAGCAGATGCCAATTTAGATAAAGTTCTTAGTGCATATAACAAACATAGAGACAAACCAATACGTGAACAAGCAGAAAATATTATTCATTTATTTACGTTGACGAATCTTGGAGCTCCCGCTGCTTTTAAATATTTTGATACAACAATTGATCGTAAACGATATACGTCTACAAAAGAAGTTTTAGATGCCACTCTTATCCATCAATCCATCACTGGTCTTTATGAAACACGCATTGATTTGAGTCAGCTAGGAGGTGACTGA
Figure 2022520081000007
(一重下線:HNHドメイン;二重下線:RuvCドメイン)
いくつかの実施形態において、野生型Cas9は、以下のヌクレオチドおよび/またはアミノ酸配列に対応する、またはそれを含む:
ATGGATAAAAAGTATTCTATTGGTTTAGACATCGGCACTAATTCCGTTGGATGGGCTGTCATAACCGATGAATACAAAGTACCTTCAAAGAAATTTAAGGTGTTGGGGAACACAGACCGTCATTCGATTAAAAAGAATCTTATCGGTGCCCTCCTATTCGATAGTGGCGAAACGGCAGAGGCGACTCGCCTGAAACGAACCGCTCGGAGAAGGTATACACGTCGCAAGAACCGAATATGTTACTTACAAGAAATTTTTAGCAATGAGATGGCCAAAGTTGACGATTCTTTCTTTCACCGTTTGGAAGAGTCCTTCCTTGTCGAAGAGGACAAGAAACATGAACGGCACCCCATCTTTGGAAACATAGTAGATGAGGTGGCATATCATGAAAAGTACCCAACGATTTATCACCTCAGAAAAAAGCTAGTTGACTCAACTGATAAAGCGGACCTGAGGTTAATCTACTTGGCTCTTGCCCATATGATAAAGTTCCGTGGGCACTTTCTCATTGAGGGTGATCTAAATCCGGACAACTCGGATGTCGACAAACTGTTCATCCAGTTAGTACAAACCTATAATCAGTTGTTTGAAGAGAACCCTATAAATGCAAGTGGCGTGGATGCGAAGGCTATTCTTAGCGCCCGCCTCTCTAAATCCCGACGGCTAGAAAACCTGATCGCACAATTACCCGGAGAGAAGAAAAATGGGTTGTTCGGTAACCTTATAGCGCTCTCACTAGGCCTGACACCAAATTTTAAGTCGAACTTCGACTTAGCTGAAGATGCCAAATTGCAGCTTAGTAAGGACACGTACGATGACGATCTCGACAATCTACTGGCACAAATTGGAGATCAGTATGCGGACTTATTTTTGGCTGCCAAAAACCTTAGCGATGCAATCCTCCTATCTGACATACTGAGAGTTAATACTGAGATTACCAAGGCGCCGTTATCCGCTTCAATGATCAAAAGGTACGATGAACATCACCAAGACTTGACACTTCTCAAGGCCCTAGTCCGTCAGCAACTGCCTGAGAAATATAAGGAAATATTCTTTGATCAGTCGAAAAACGGGTACGCAGGTTATATTGACGGCGGAGCGAGTCAAGAGGAATTCTACAAGTTTATCAAACCCATATTAGAGAAGATGGATGGGACGGAAGAGTTGCTTGTAAAACTCAATCGCGAAGATCTACTGCGAAAGCAGCGGACTTTCGACAACGGTAGCATTCCACATCAAATCCACTTAGGCGAATTGCATGCTATACTTAGAAGGCAGGAGGATTTTTATCCGTTCCTCAAAGACAATCGTGAAAAGATTGAGAAAATCCTAACCTTTCGCATACCTTACTATGTGGGACCCCTGGCCCGAGGGAACTCTCGGTTCGCATGGATGACAAGAAAGTCCGAAGAAACGATTACTCCATGGAATTTTGAGGAAGTTGTCGATAAAGGTGCGTCAGCTCAATCGTTCATCGAGAGGATGACCAACTTTGACAAGAATTTACCGAACGAAAAAGTATTGCCTAAGCACAGTTTACTTTACGAGTATTTCACAGTGTACAATGAACTCACGAAAGTTAAGTATGTCACTGAGGGCATGCGTAAACCCGCCTTTCTAAGCGGAGAACAGAAGAAAGCAATAGTAGATCTGTTATTCAAGACCAACCGCAAAGTGACAGTTAAGCAATTGAAAGAGGACTACTTTAAGAAAATTGAATGCTTCGATTCTGTCGAGATCTCCGGGGTAGAAGATCGATTTAATGCGTCACTTGGTACGTATCATGACCTCCTAAAGATAATTAAAGATAAGGACTTCCTGGATAACGAAGAGAATGAAGATATCTTAGAAGATATAGTGTTGACTCTTACCCTCTTTGAAGATCGGGAAATGATTGAGGAAAGACTAAAAACATACGCTCACCTGTTCGACGATAAGGTTATGAAACAGTTAAAGAGGCGTCGCTATACGGGCTGGGGACGATTGTCGCGGAAACTTATCAACGGGATAAGAGACAAGCAAAGTGGTAAAACTATTCTCGATTTTCTAAAGAGCGACGGCTTCGCCAATAGGAACTTTATGCAGCTGATCCATGATGACTCTTTAACCTTCAAAGAGGATATACAAAAGGCACAGGTTTCCGGACAAGGGGACTCATTGCACGAACATATTGCGAATCTTGCTGGTTCGCCAGCCATCAAAAAGGGCATACTCCAGACAGTCAAAGTAGTGGATGAGCTAGTTAAGGTCATGGGACGTCACAAACCGGAAAACATTGTAATCGAGATGGCACGCGAAAATCAAACGACTCAGAAGGGGCAAAAAAACAGTCGAGAGCGGATGAAGAGAATAGAAGAGGGTATTAAAGAACTGGGCAGCCAGATCTTAAAGGAGCATCCTGTGGAAAATACCCAATTGCAGAACGAGAAACTTTACCTCTATTACCTACAAAATGGAAGGGACATGTATGTTGATCAGGAACTGGACATAAACCGTTTATCTGATTACGACGTCGATCACATTGTACCCCAATCCTTTTTGAAGGACGATTCAATCGACAATAAAGTGCTTACACGCTCGGATAAGAACCGAGGGAAAAGTGACAATGTTCCAAGCGAGGAAGTCGTAAAGAAAATGAAGAACTATTGGCGGCAGCTCCTAAATGCGAAACTGATAACGCAAAGAAAGTTCGATAACTTAACTAAAGCTGAGAGGGGTGGCTTGTCTGAACTTGACAAGGCCGGATTTATTAAACGTCAGCTCGTGGAAACCCGCCAAATCACAAAGCATGTTGCACAGATACTAGATTCCCGAATGAATACGAAATACGACGAGAACGATAAGCTGATTCGGGAAGTCAAAGTAATCACTTTAAAGTCAAAATTGGTGTCGGACTTCAGAAAGGATTTTCAATTCTATAAAGTTAGGGAGATAAATAACTACCACCATGCGCACGACGCTTATCTTAATGCCGTCGTAGGGACCGCACTCATTAAGAAATACCCGAAGCTAGAAAGTGAGTTTGTGTATGGTGATTACAAAGTTTATGACGTCCGTAAGATGATCGCGAAAAGCGAACAGGAGATAGGCAAGGCTACAGCCAAATACTTCTTTTATTCTAACATTATGAATTTCTTTAAGACGGAAATCACTCTGGCAAACGGAGAGATACGCAAACGACCTTTAATTGAAACCAATGGGGAGACAGGTGAAATCGTATGGGATAAGGGCCGGGACTTCGCGACGGTGAGAAAAGTTTTGTCCATGCCCCAAGTCAACATAGTAAAGAAAACTGAGGTGCAGACCGGAGGGTTTTCAAAGGAATCGATTCTTCCAAAAAGGAATAGTGATAAGCTCATCGCTCGTAAAAAGGACTGGGACCCGAAAAAGTACGGTGGCTTCGATAGCCCTACAGTTGCCTATTCTGTCCTAGTAGTGGCAAAAGTTGAGAAGGGAAAATCCAAGAAACTGAAGTCAGTCAAAGAATTATTGGGGATAACGATTATGGAGCGCTCGTCTTTTGAAAAGAACCCCATCGACTTCCTTGAGGCGAAAGGTTACAAGGAAGTAAAAAAGGATCTCATAATTAAACTACCAAAGTATAGTCTGTTTGAGTTAGAAAATGGCCGAAAACGGATGTTGGCTAGCGCCGGAGAGCTTCAAAAGGGGAACGAACTCGCACTACCGTCTAAATACGTGAATTTCCTGTATTTAGCGTCCCATTACGAGAAGTTGAAAGGTTCACCTGAAGATAACGAACAGAAGCAACTTTTTGTTGAGCAGCACAAACATTATCTCGACGAAATCATAGAGCAAATTTCGGAATTCAGTAAGAGAGTCATCCTAGCTGATGCCAATCTGGACAAAGTATTAAGCGCATACAACAAGCACAGGGATAAACCCATACGTGAGCAGGCGGAAAATATTATCCATTTGTTTACTCTTACCAACCTCGGCGCTCCAGCCGCATTCAAGTATTTTGACACAACGATAGATCGCAAACGATACACTTCTACCAAGGAGGTGCTAGACGCGACACTGATTCACCAATCCATCACGGGATTATATGAAACTCGGATAGATTTGTCACAGCTTGGGGGTGACGGATCCCCCAAGAAGAAGAGGAAAGTCTCGAGCGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGGCTGCAGGA
Figure 2022520081000008
(一重下線:HNHドメイン;二重下線:RuvCドメイン)
いくつかの実施形態において、野生型Cas9はStreptococcus pyogenesからのCas9に対応する(NCBI参照配列:NC_002737.2(以下のヌクレオチド配列);およびUniprot参照配列:Q99ZW2(以下のアミノ酸配列)。
ATGGATAAGAAATACTCAATAGGCTTAGATATCGGCACAAATAGCGTCGGATGGGCGGTGATCACTGATGAATATAAGGTTCCGTCTAAAAAGTTCAAGGTTCTGGGAAATACAGACCGCCACAGTATCAAAAAAAATCTTATAGGGGCTCTTTTATTTGACAGTGGAGAGACAGCGGAAGCGACTCGTCTCAAACGGACAGCTCGTAGAAGGTATACACGTCGGAAGAATCGTATTTGTTATCTACAGGAGATTTTTTCAAATGAGATGGCGAAAGTAGATGATAGTTTCTTTCATCGACTTGAAGAGTCTTTTTTGGTGGAAGAAGACAAGAAGCATGAACGTCATCCTATTTTTGGAAATATAGTAGATGAAGTTGCTTATCATGAGAAATATCCAACTATCTATCATCTGCGAAAAAAATTGGTAGATTCTACTGATAAAGCGGATTTGCGCTTAATCTATTTGGCCTTAGCGCATATGATTAAGTTTCGTGGTCATTTTTTGATTGAGGGAGATTTAAATCCTGATAATAGTGATGTGGACAAACTATTTATCCAGTTGGTACAAACCTACAATCAATTATTTGAAGAAAACCCTATTAACGCAAGTGGAGTAGATGCTAAAGCGATTCTTTCTGCACGATTGAGTAAATCAAGACGATTAGAAAATCTCATTGCTCAGCTCCCCGGTGAGAAGAAAAATGGCTTATTTGGGAATCTCATTGCTTTGTCATTGGGTTTGACCCCTAATTTTAAATCAAATTTTGATTTGGCAGAAGATGCTAAATTACAGCTTTCAAAAGATACTTACGATGATGATTTAGATAATTTATTGGCGCAAATTGGAGATCAATATGCTGATTTGTTTTTGGCAGCTAAGAATTTATCAGATGCTATTTTACTTTCAGATATCCTAAGAGTAAATACTGAAATAACTAAGGCTCCCCTATCAGCTTCAATGATTAAACGCTACGATGAACATCATCAAGACTTGACTCTTTTAAAAGCTTTAGTTCGACAACAACTTCCAGAAAAGTATAAAGAAATCTTTTTTGATCAATCAAAAAACGGATATGCAGGTTATATTGATGGGGGAGCTAGCCAAGAAGAATTTTATAAATTTATCAAACCAATTTTAGAAAAAATGGATGGTACTGAGGAATTATTGGTGAAACTAAATCGTGAAGATTTGCTGCGCAAGCAACGGACCTTTGACAACGGCTCTATTCCCCATCAAATTCACTTGGGTGAGCTGCATGCTATTTTGAGAAGACAAGAAGACTTTTATCCATTTTTAAAAGACAATCGTGAGAAGATTGAAAAAATCTTGACTTTTCGAATTCCTTATTATGTTGGTCCATTGGCGCGTGGCAATAGTCGTTTTGCATGGATGACTCGGAAGTCTGAAGAAACAATTACCCCATGGAATTTTGAAGAAGTTGTCGATAAAGGTGCTTCAGCTCAATCATTTATTGAACGCATGACAAACTTTGATAAAAATCTTCCAAATGAAAAAGTACTACCAAAACATAGTTTGCTTTATGAGTATTTTACGGTTTATAACGAATTGACAAAGGTCAAATATGTTACTGAAGGAATGCGAAAACCAGCATTTCTTTCAGGTGAACAGAAGAAAGCCATTGTTGATTTACTCTTCAAAACAAATCGAAAAGTAACCGTTAAGCAATTAAAAGAAGATTATTTCAAAAAAATAGAATGTTTTGATAGTGTTGAAATTTCAGGAGTTGAAGATAGATTTAATGCTTCATTAGGTACCTACCATGATTTGCTAAAAATTATTAAAGATAAAGATTTTTTGGATAATGAAGAAAATGAAGATATCTTAGAGGATATTGTTTTAACATTGACCTTATTTGAAGATAGGGAGATGATTGAGGAAAGACTTAAAACATATGCTCACCTCTTTGATGATAAGGTGATGAAACAGCTTAAACGTCGCCGTTATACTGGTTGGGGACGTTTGTCTCGAAAATTGATTAATGGTATTAGGGATAAGCAATCTGGCAAAACAATATTAGATTTTTTGAAATCAGATGGTTTTGCCAATCGCAATTTTATGCAGCTGATCCATGATGATAGTTTGACATTTAAAGAAGACATTCAAAAAGCACAAGTGTCTGGACAAGGCGATAGTTTACATGAACATATTGCAAATTTAGCTGGTAGCCCTGCTATTAAAAAAGGTATTTTACAGACTGTAAAAGTTGTTGATGAATTGGTCAAAGTAATGGGGCGGCATAAGCCAGAAAATATCGTTATTGAAATGGCACGTGAAAATCAGACAACTCAAAAGGGCCAGAAAAATTCGCGAGAGCGTATGAAACGAATCGAAGAAGGTATCAAAGAATTAGGAAGTCAGATTCTTAAAGAGCATCCTGTTGAAAATACTCAATTGCAAAATGAAAAGCTCTATCTCTATTATCTCCAAAATGGAAGAGACATGTATGTGGACCAAGAATTAGATATTAATCGTTTAAGTGATTATGATGTCGATCACATTGTTCCACAAAGTTTCCTTAAAGACGATTCAATAGACAATAAGGTCTTAACGCGTTCTGATAAAAATCGTGGTAAATCGGATAACGTTCCAAGTGAAGAAGTAGTCAAAAAGATGAAAAACTATTGGAGACAACTTCTAAACGCCAAGTTAATCACTCAACGTAAGTTTGATAATTTAACGAAAGCTGAACGTGGAGGTTTGAGTGAACTTGATAAAGCTGGTTTTATCAAACGCCAATTGGTTGAAACTCGCCAAATCACTAAGCATGTGGCACAAATTTTGGATAGTCGCATGAATACTAAATACGATGAAAATGATAAACTTATTCGAGAGGTTAAAGTGATTACCTTAAAATCTAAATTAGTTTCTGACTTCCGAAAAGATTTCCAATTCTATAAAGTACGTGAGATTAACAATTACCATCATGCCCATGATGCGTATCTAAATGCCGTCGTTGGAACTGCTTTGATTAAGAAATATCCAAAACTTGAATCGGAGTTTGTCTATGGTGATTATAAAGTTTATGATGTTCGTAAAATGATTGCTAAGTCTGAGCAAGAAATAGGCAAAGCAACCGCAAAATATTTCTTTTACTCTAATATCATGAACTTCTTCAAAACAGAAATTACACTTGCAAATGGAGAGATTCGCAAACGCCCTCTAATCGAAACTAATGGGGAAACTGGAGAAATTGTCTGGGATAAAGGGCGAGATTTTGCCACAGTGCGCAAAGTATTGTCCATGCCCCAAGTCAATATTGTCAAGAAAACAGAAGTACAGACAGGCGGATTCTCCAAGGAGTCAATTTTACCAAAAAGAAATTCGGACAAGCTTATTGCTCGTAAAAAAGACTGGGATCCAAAAAAATATGGTGGTTTTGATAGTCCAACGGTAGCTTATTCAGTCCTAGTGGTTGCTAAGGTGGAAAAAGGGAAATCGAAGAAGTTAAAATCCGTTAAAGAGTTACTAGGGATCACAATTATGGAAAGAAGTTCCTTTGAAAAAAATCCGATTGACTTTTTAGAAGCTAAAGGATATAAGGAAGTTAAAAAAGACTTAATCATTAAACTACCTAAATATAGTCTTTTTGAGTTAGAAAACGGTCGTAAACGGATGCTGGCTAGTGCCGGAGAATTACAAAAAGGAAATGAGCTGGCTCTGCCAAGCAAATATGTGAATTTTTTATATTTAGCTAGTCATTATGAAAAGTTGAAGGGTAGTCCAGAAGATAACGAACAAAAACAATTGTTTGTGGAGCAGCATAAGCATTATTTAGATGAGATTATTGAGCAAATCAGTGAATTTTCTAAGCGTGTTATTTTAGCAGATGCCAATTTAGATAAAGTTCTTAGTGCATATAACAAACATAGAGACAAACCAATACGTGAACAAGCAGAAAATATTATTCATTTATTTACGTTGACGAATCTTGGAGCTCCCGCTGCTTTTAAATATTTTGATACAACAATTGATCGTAAACGATATACGTCTACAAAAGAAGTTTTAGATGCCACTCTTATCCATCAATCCATCACTGGTCTTTATGAAACACGCATTGATTTGAGTCAGCTAGGAGGTGACTGA
Figure 2022520081000009
(配列番号1;一重下線:HNHドメイン;二重下線:RuvCドメイン)
いくつかの実施形態において、Cas9は、Corynebacterium ulcerans (NCBI Refs:NC_015683.1, NC_017317.1);Corynebacterium diphtheria (NCBI Refs:NC_016782.1, NC_016786.1);Spiroplasma syrphidicola (NCBI Ref:NC_021284.1);Prevotella intermedia (NCBI Ref:NC_017861.1);Spiroplasma taiwanense (NCBI Ref: NC_021846.1);Streptococcus iniae (NCBI Ref:NC_021314.1);Belliella baltica (NCBI Ref:NC_018010.1);Psychroflexus torquisI (NCBI Ref:NC_018721.1);Streptococcus thermophilus (NCBI Ref:YP_820832.1), Listeria innocua (NCBI Ref:NP_472073.1), Campylobacter jejuni (NCBI Ref:YP_002344900.1) もしくはNeisseria meningitidis (NCBI Ref:YP_002342100.1)からのCas9、または任意の他の生物からのCas9を指す。
いくつかの実施形態において、Cas9はNeisseria meningitidis (Nme) 由来である。いくつかの実施形態において、Cas9は、Nme1、Nme2またはNme3である。いくつかの実施形態において、Nme1、Nme2またはNme3のPAM相互作用ドメインは、それぞれN4GAT、N4CC、およびN4CAAAである(例えばEdraki, A., et al., A Compact, High-Accuracy Cas9 with a Dinucleotide PAM for In Vivo Genome Editing, Molecular Cell (2018)を参照されたい)。例示的なNeisseria meningitidis Cas9タンパク質、Nme1Cas9(NCBI Reference:WP_002235162.1;II型CRISPR RNA誘導型エンドヌクレアーゼCas9)は以下のアミノ酸配列を有する:
1 maafkpnpin yilgldigia svgwamveid edenpiclid lgvrvferae vpktgdslam
61 arrlarsvrr ltrrrahrll rarrllkreg vlqaadfden glikslpntp wqlraaaldr
121 kltplewsav llhlikhrgy lsqrkneget adkelgallk gvadnahalq tgdfrtpael
181 alnkfekesg hirnqrgdys htfsrkdlqa elillfekqk efgnphvsgg lkegietllm
241 tqrpalsgda vqkmlghctf epaepkaakn tytaerfiwl tklnnlrile qgserpltdt
301 eratlmdepy rkskltyaqa rkllgledta ffkglrygkd naeastlmem kayhaisral
361 ekeglkdkks plnlspelqd eigtafslfk tdeditgrlk driqpeilea llkhisfdkf
421 vqislkalrr ivplmeqgkr ydeacaeiyg dhygkkntee kiylppipad eirnpvvlra
481 lsqarkving vvrrygspar ihietarevg ksfkdrkeie krqeenrkdr ekaaakfrey
541 fpnfvgepks kdilklrlye qqhgkclysg keinlgrlne kgyveidhal pfsrtwddsf
601 nnkvlvlgse nqnkgnqtpy eyfngkdnsr ewqefkarve tsrfprskkq rillqkfded
661 gfkernlndt ryvnrflcqf vadrmrltgk gkkrvfasng qitnllrgfw glrkvraend
721 rhhaldavvv acstvamqqk itrfvrykem nafdgktidk etgevlhqkt hfpqpweffa
781 qevmirvfgk pdgkpefeea dtpeklrtll aeklssrpea vheyvtplfv srapnrkmsg
841 qghmetvksa krldegvsvl rvpltqlklk dlekmvnrer epklyealka rleahkddpa
901 kafaepfyky dkagnrtqqv kavrveqvqk tgvwvrnhng iadnatmvrv dvfekgdkyy
961 lvpiyswqva kgilpdravv qgkdeedwql iddsfnfkfs lhpndlvevi tkkarmfgyf
1021 aschrgtgni nirihdldhk igkngilegi gvktalsfqk yqidelgkei rpcrlkkrpp
1081 vr
別の例示的なNeisseria meningitidis Cas9タンパク質、Nme2Cas9(NCBI Reference:WP_002230835;II型CRISPR RNA誘導型エンドヌクレアーゼCas9)は以下のアミノ酸配列を有する:
1 maafkpnpin yilgldigia svgwamveid eeenpirlid lgvrvferae vpktgdslam
61 arrlarsvrr ltrrrahrll rarrllkreg vlqaadfden glikslpntp wqlraaaldr
121 kltplewsav llhlikhrgy lsqrkneget adkelgallk gvannahalq tgdfrtpael
181 alnkfekesg hirnqrgdys htfsrkdlqa elillfekqk efgnphvsgg lkegietllm
241 tqrpalsgda vqkmlghctf epaepkaakn tytaerfiwl tklnnlrile qgserpltdt
301 eratlmdepy rkskltyaqa rkllgledta ffkglrygkd naeastlmem kayhaisral
361 ekeglkdkks plnlsselqd eigtafslfk tdeditgrlk drvqpeilea llkhisfdkf
421 vqislkalrr ivplmeqgkr ydeacaeiyg dhygkkntee kiylppipad eirnpvvlra
481 lsqarkving vvrrygspar ihietarevg ksfkdrkeie krqeenrkdr ekaaakfrey
541 fpnfvgepks kdilklrlye qqhgkclysg keinlvrlne kgyveidhal pfsrtwddsf
601 nnkvlvlgse nqnkgnqtpy eyfngkdnsr ewqefkarve tsrfprskkq rillqkfded
661 gfkecnlndt ryvnrflcqf vadhilltgk gkrrvfasng qitnllrgfw glrkvraend
721 rhhaldavvv acstvamqqk itrfvrykem nafdgktidk etgkvlhqkt hfpqpweffa
781 qevmirvfgk pdgkpefeea dtpeklrtll aeklssrpea vheyvtplfv srapnrkmsg
841 ahkdtlrsak rfvkhnekis vkrvwlteik ladlenmvny kngreielye alkarleayg
901 gnakqafdpk dnpfykkggq lvkavrvekt qesgvllnkk naytiadngd mvrvdvfckv
961 dkkgknqyfi vpiyawqvae nilpdidckg yriddsytfc fslhkydlia fqkdekskve
1021 fayyincdss ngrfylawhd kgskeqqfri stqnlvliqk yqvnelgkei rpcrlkkrpp
1081 vr
いくつかの実施形態において、dCas9は、Cas9ヌクレアーゼ活性を不活性化する1つまたは複数の突然変異を有するCas9アミノ酸配列に対応するか、またはその一部もしくは全体を含む。例えば、いくつかの実施形態において、dCas9ドメインは、D10AおよびH840A突然変異または別のCas9における対応する突然変異を含む。いくつかの実施形態において、dCas9は、以下のdCas9(D10AおよびH840A)のアミノ酸配列を含む:
Figure 2022520081000010
(一重下線:HNHドメイン;二重下線:RuvCドメイン)。
いくつかの実施形態において、Cas9ドメインはD10A突然変異を含み、一方、上記で提供したアミノ酸配列における位置840における残基、または本明細書で提供されるアミノ酸配列のいずれかにおける対応する位置における残基は、ヒスチジンのままである。
他の実施形態において、例えばヌクレアーゼ不活性化Cas9 (dCas9) をもたらす、D10AおよびH840A以外の突然変異を有するdCas9バリアントが提供される。このような突然変異は、例えば、D10およびH840における他のアミノ酸置換、またはCas9のヌクレアーゼドメイン内の他の置換(例えばHNHヌクレアーゼサブドメインおよび/またはRuvC1サブドメインにおける置換)を含む。いくつかの実施形態において、dCas9のバリアントまたはホモログであって、少なくとも約70%の同一性、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%の同一性を有するものが提供される。いくつかの実施形態において、約5アミノ酸、約10アミノ酸、約15アミノ酸、約20アミノ酸、約25アミノ酸、約30アミノ酸、約40アミノ酸、約50アミノ酸、約75アミノ酸、約100アミノ酸またはより多くのアミノ酸だけ短いまたは長いアミノ酸配列を有するdCas9のバリアントが提供される。
いくつかの実施形態において、本明細書に提供されるCas9融合タンパク質は、Cas9タンパク質の全長アミノ酸配列、例えば、本明細書に提供されるCas9配列の1つを含む。しかしながら、他の実施形態において、本明細書に提供される融合タンパク質は、全長Cas9配列を含まず、その1つまたは複数の断片のみを含む。好適なCas9ドメインおよびCas9断片の例示的なアミノ酸配列が本明細書に提供され、Cas9ドメインおよび断片のさらなる好適な配列は、当業者には明らかであろう。
追加的なCas9タンパク質(例えばヌクレアーゼ不活(dead)Cas9(dCas9)、Cas9ニッカーゼ(nCas9)、またはヌクレアーゼ活性Cas9)は、そのバリアントおよびホモログを含めて、本開示の範囲内にあることが理解されるべきである。例示的なCas9タンパク質は、限定されるものではないが、下記に提供されるものを含む。いくつかの実施形態において、Cas9タンパク質は、ヌクレアーゼ不活Cas9(dCas9)である。いくつかの実施形態において、Cas9タンパク質は、Cas9ニッカーゼ(nCas9)である。いくつかの実施形態において、Cas9タンパク質はヌクレアーゼ活性Cas9である。
例示的な触媒不活性Cas9(dCas9):
DKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
例示的な触媒的Cas9ニッカーゼ(nCas9):
DKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
例示的な触媒的活性Cas9:
DKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
いくつかの実施形態において、Cas9は、単細胞原核微生物のドメインおよび界を構成する古細菌(例えばナノアーキア)由来のCas9を指す。いくつかの実施形態において、Cas9は、例えば、Burstein et al., "New CRISPR-Cas systems from uncultivated microbes." Cell Res. 2017 Feb 21. doi:10.1038/cr.2017.21に記載されているCasXまたはCasYを指し、その全体の内容は参照により本明細書に組み込まれる。ゲノム分解メタゲノミクスを用いて、生命の古細菌ドメインにおいて最初に報告されたCas9を含め、多くのCRISPR-Cas系が同定された。この分岐Cas9タンパク質は、ほとんど研究されていないナノアーキアにおいて、活性CRISPR-Cas系の一部として発見された。細菌では、それまで知られていなかった二つの系、CRISPR-CasXとCRISPR-CasYが発見され、それらは、これまでに発見された中でも最もコンパクトな系に入る。いくつかの実施形態において、Cas9は、CasXまたはCasXのバリアントを表す。いくつかの実施形態において、Cas9は、CasYまたはCasYのバリアントを表す。核酸プログラミング可能なDNA結合タンパク質(napDNAbp:nucleic acid programmable DNA binding protein)として他のRNA誘導DNA結合タンパク質も使用され得、本開示の範囲内であることが理解されるべきである。
特定の実施形態において、本開示の方法において有用なnapDNAbpとしては、当該分野において公知であり、例えばOakes et al., Cell 176, 254-267, 2019に記載されている、循環置換体が挙げられる。例示的な循環置換体は、太字の配列がCas9に由来する配列を示し、斜体の配列がリンカー配列を示し、下線を付した配列が二部分核局在化配列を示す場合に従う。
CP5(MSP 「NGC=Pam Variant with mutations Regular Cas9 likes NGG」PID=タンパク質相互作用ドメインおよび「D10A」ニッカーゼを有する):
Figure 2022520081000011
塩基エディターに組み込むことができるポリヌクレオチドプログラム可能なヌクレオチド結合ドメインの非限定的な例としては、CRISPRタンパク質由来ドメイン、制限ヌクレアーゼ、メガヌクレアーゼ、TALヌクレアーゼ (TALEN)、およびジンクフィンガーヌクレアーゼ (ZFN) が挙げられる。
いくつかの実施形態において、本明細書で提供される融合タンパク質のいずれかの核酸プログラム可能DNA結合タンパク質 (napDNAbp) は、CasXまたはCasYタンパク質であり得る。いくつかの実施形態において、napDNAbpはCasXタンパク質である。いくつかの実施形態において、napDNAbpはCasYタンパク質である。いくつかの実施形態において、napDNAbpは、天然に存在するCasXまたはCasYタンパク質に対して少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性を有するアミノ酸配列を含む。いくつかの実施形態において、napDNAbpは、天然に存在するCasXまたはCasYタンパク質である。いくつかの実施形態において、napDNAbpは、本明細書に記載されるいずれかのCasXまたはCasYタンパク質に対して少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性を有するアミノ酸配列を含む。他の細菌種由来のCas12b/C2c1、CasXおよびCasYもまた、本開示にしたがって使用され得ることを理解されたい。
Cas12b/C2c1 (uniprot.org/uniprot/T0D7A2#2)
sp|T0D7A2|C2C1_ALIAG CRISPR-associated endo- nuclease C2c1 OS = Alicyclobacillus acido-terrestris (strain ATCC 49025 / DSM 3922/ CIP 106132 / NCIMB 13137/GD3B) GN=c2c1 PE=1 SV=1
MAVKSIKVKLRLDDMPEIRAGLWKLHKEVNAGVRYYTEWLSLLRQENLYRRSPNGDGEQECDKTAEECKAELLERLRARQVENGHRGPAGSDDELLQLARQLYELLVPQAIGAKGDAQQIARKFLSPLADKDAVGGLGIAKAGNKPRWVRMREAGEPGWEEEKEKAETRKSADRTADVLRALADFGLKPLMRVYTDSEMSSVEWKPLRKGQAVRTWDRDMFQQAIERMMSWESWNQRVGQEYAKLVEQKNRFEQKNFVGQEHLVHLVNQLQQDMKEASPGLESKEQTAHYVTGRALRGSDKVFEKWGKLAPDAPFDLYDAEIKNVQRRNTRRFGSHDLFAKLAEPEYQALWREDASFLTRYAVYNSILRKLNHAKMFATFTLPDATAHPIWTRFDKLGGNLHQYTFLFNEFGERRHAIRFHKLLKVENGVAREVDDVTVPISMSEQLDNLLPRDPNEPIALYFRDYGAEQHFTGEFGGAKIQCRRDQLAHMHRRRGARDVYLNVSVRVQSQSEARGERRPPYAAVFRLVGDNHRAFVHFDKLSDYLAEHPDDGKLGSEGLLSGLRVMSVDLGLRTSASISVFRVARKDELKPNSKGRVPFFFPIKGNDNLVAVHERSQLLKLPGETESKDLRAIREERQRTLRQLRTQLAYLRLLVRCGSEDVGRRERSWAKLIEQPVDAANHMTPDWREAFENELQKLKSLHGICSDKEWMDAVYESVRRVWRHMGKQVRDWRKDVRSGERPKIRGYAKDVVGGNSIEQIEYLERQYKFLKSWSFFGKVSGQVIRAEKGSRFAITLREHIDHAKEDRLKKLADRIIMEALGYVYALDERGKGKWVAKYPPCQLILLEELSEYQFNNDRPPSENNQLMQWSHRGVFQELINQAQVHDLLVGTMYAAFSSRFDARTGAPGIRCRRVPARCTQEHNPEPFPWWLNKFVVEHTLDACPLRADDLIPTGEGEIFVSPFSAEEGDFHQIHADLNAAQNLQQRLWSDFDISQIRLRCDWGEVDGELVLIPRLTGKRTADSYSNKVFYTNTGVTYYERERGKKRRKVFAQEKLSEEEAELLVEADEAREKSVVLMRDPSGIINRGNWTRQKEFWSMV NQRIEGYLVKQIRSRVPLQDSACENTGDI
CasX (uniprot.org/uniprot/F0NN87; uniprot.org/uniprot/F0NH53)
>tr|F0NN87|F0NN87_SULIH CRISPR-associated Casx protein OS = Sulfolobus islandicus (strain HVE10/4) GN = SiH_0402 PE=4 SV=1
MEVPLYNIFGDNYIIQVATEAENSTIYNNKVEIDDEELRNVLNLAYKIAKNNEDAAAERRGKAKKKKGEEGETTTSNIILPLSGNDKNPWTETLKCYNFPTTVALSEVFKNFSQVKECEEVSAPSFVKPEFYEFGRSPGMVERTRRVKLEVEPHYLIIAAAGWVLTRLGKAKVSEGDYVGVNVFTPTRGILYSLIQNVNGIVPGIKPETAFGLWIARKVVSSVTNPNVSVVRIYTISDAVGQNPTTINGGFSIDLTKLLEKRYLLSERLEAIARNALSISSNMRERYIVLANYIYEYLTG SKRLEDLLYFANRDLIMNLNSDDGKVRDLKLISAYVNGELIRGEG
>tr|F0NH53|F0NH53_SULIR CRISPR associated protein, Casx OS = Sulfolobus islandicus (strain REY15A) GN=SiRe_0771 PE=4 SV=1
MEVPLYNIFGDNYIIQVATEAENSTIYNNKVEIDDEELRNVLNLAYKIAKNNEDAAAERRGKAKKKKGEEGETTTSNIILPLSGNDKNPWTETLKCYNFPTTVALSEVFKNFSQVKECEEVSAPSFVKPEFYKFGRSPGMVERTRRVKLEVEPHYLIMAAAGWVLTRLGKAKVSEGDYVGVNVFTPTRGILYSLIQNVNGIVPGIKPETAFGLWIARKVVSSVTNPNVSVVSIYTISDAVGQNPTTINGGFSIDLTKLLEKRDLLSERLEAIARNALSISSNMRERYIVLANYIYEYLTGSKRLEDLLYFANRDLIMNLNSDDGKVRDLKLISAYVNGELIRGEG
Deltaproteobacteria CasX
MEKRINKIRKKLSADNATKPVSRSGPMKTLLVRVMTDDLKKRLEKRRKKPEVMPQVISNNAANNLRMLLDDYTKMKEAILQVYWQEFKDDHVGLMCKFAQPASKKIDQNKLKPEMDEKGNLTTAGFACSQCGQPLFVYKLEQVSEKGKAYTNYFGRCNVAEHEKLILLAQLKPVKDSDEAVTYSLGKFGQRALDFYSIHVTKESTHPVKPLAQIAGNRYASGPVGKALSDACMGTIASFLSKYQDIIIEHQKVVKGNQKRLESLRELAGKENLEYPSVTLPPQPHTKEGVDAYNEVIARVRMWVNLNLWQKLKLSRDDAKPLLRLKGFPSFPVVERRENEVDWWNTINEVKKLIDAKRDMGRVFWSGVTAEKRNTILEGYNYLPNENDHKKREGSLENPKKPAKRQFGDLLLYLEKKYAGDWGKVFDEAWERIDKKIAGLTSHIEREEARNAEDAQSKAVLTDWLRAKASFVLERLKEMDEKEFYACEIQLQKWYGDLRGNPFAVEAENRVVDISGFSIGSDGHSIQYRNLLAWKYLENGKREFYLLMNYGKKGRIRFTDGTDIKKSGKWQGLLYGGGKAKVIDLTFDPDDEQLIILPLAFGTRQGREFIWNDLLSLETGLIKLANGRVIEKTIYNKKIGRDEPALFVALTFERREVVDPSNIKPVNLIGVARGENIPAVIALTDPEGCPLPEFKDSSGGPTDILRIGEGYKEKQRAIQAAKEVEQRRAGGYSRKFASKSRNLADDMVRNSARDLFYHAVTHDAVLVFANLSRGFGRQGKRTFMTERQYTKMEDWLTAKLAYEGLTSKTYLSKTLAQYTSKTCSNCGFTITYADMDVMLVRLKKTSDGWATTLNNKELKAEYQITYYNRYKRQTVEKELSAELDRLSEESGNNDISKWTKGRRDEALFLLKKRFSHRPVQEQFVCLDCGHEVHAAEQAALNIARSWLFLNSNSTEFKSYKSGKQPFVGAWQAFYKRRLKEVWKPNA
CasY (ncbi.nlm.nih.gov/protein/APG80656.1)
>APG80656.1 CRISPR-associated protein CasY [uncultured Parcubacteria group bacterium]
MSKRHPRISGVKGYRLHAQRLEYTGKSGAMRTIKYPLYSSPSGGRTVPREIVSAINDDYVGLYGLSNFDDLYNAEKRNEEKVYSVLDFWYDCVQYGAVFSYTAPGLLKNVAEVRGGSYELTKTLKGSHLYDELQIDKVIKFLNKKEISRANGSLDKLKKDIIDCFKAEYRERHKDQCNKLADDIKNAKKDAGASLGERQKKLFRDFFGISEQSENDKPSFTNPLNLTCCLLPFDTVNNNRNRGEVLFNKLKEYAQKLDKNEGSLEMWEYIGIGNSGTAFSNFLGEGFLGRLRENKITELKKAMMDITDAWRGQEQEEELEKRLRILAALTIKLREPKFDNHWGGYRSDINGKLSSWLQNYINQTVKIKEDLKGHKKDLKKAKEMINRFGESDTKEEAVVSSLLESIEKIVPDDSADDEKPDIPAIAIYRRFLSDGRLTLNRFVQREDVQEALIKERLEAEKKKKPKKRKKKSDAEDEKETIDFKELFPHLAKPLKLVPNFYGDSKRELYKKYKNAAIYTDALWKAVEKIYKSAFSSSLKNSFFDTDFDKDFFIKRLQKIFSVYRRFNTDKWKPIVKNSFAPYCDIVSLAENEVLYKPKQSRSRKSAAIDKNRVRLPSTENIAKAGIALARELSVAGFDWKDLLKKEEHEEYIDLIELHKTALALLLAVTETQLDISALDFVENGTVKDFMKTRDGNLVLEGRFLEMFSQSIVFSELRGLAGLMSRKEFITRSAIQTMNGKQAELLYIPHEFQSAKITTPKEMSRAFLDLAPAEFATSLEPESLSEKSLLKLKQMRYYPHYFGYELTRTGQGIDGGVAENALRLEKSPVKKREIKCKQYKTLGRGQNKIVLYVRSSYYQTQFLEWFLHRPKNVQTDVAVSGSFLIDEKKVKTRWNYDALTVALEPVSGSERVFVSQPFTIFPEKSAEEEGQRYLGIDIGEYGIAYTALEITGDSAKILDQNFISDPQLKTLREEVKGLKLDQRRGTFAMPSTKIARIRESLVHSLRNRIHHLALKHKAKIVYELEVSRFEEGKQKIKKVYATLKKADVYSEIDADKNLQTTVWGKLAVASEISASYTSQFCGACKKLWRAEMQVDETITTQELIGTVRVIKGGTLIDAIKDFMRPPIFDENDTPFPKYRDFCDKHHISKKMRGNSCLFICPFCRANADADIQASQTIALLRYVKEEKKVEDYFERFRKLKNIKVLGQMKKI
用語「Cas12」または「Cas12ドメイン」は、Cas12タンパク質またはその断片(例えばCas12の活性、不活性、もしくは部分的に活性なDNA切断ドメイン、および/またはCas12のgRNA結合ドメインを含むタンパク質)を含むRNA誘導ヌクレアーゼを指す。Cas12は、クラス2、V型CRISPR/Cas系に属する。Cas12ヌクレアーゼはCRISPR(clustered regularly interspaced short palindromic repeat)関連ヌクレアーゼと称されることもある。例示的なBacillus hisashii Cas 12b (BhCas12b) Cas 12ドメインの配列は以下に提供される:
MAPKKKRKVGIHGVPAAATRSFILKIEPNEEVKKGLWKTHEVLNHGIAYYMNILKLIRQEAIYEHHEQDPKNPKKVSKAEIQAELWDFVLKMQKCNSFTHEVDKDEVFNILRELYEELVPSSVEKKGEANQLSNKFLYPLVDPNSQSGKGTASSGRKPRWYNLKIAGDPSWEEEKKKWEEDKKKDPLAKILGKLAEYGLIPLFIPYTDSNEPIVKEIKWMEKSRNQSVRRLDKDMFIQALERFLSWESWNLKVKEEYEKVEKEYKTLEERIKEDIQALKALEQYEKERQEQLLRDTLNTNEYRLSKRGLRGWREIIQKWLKMDENEPSEKYLEVFKDYQRKHPREAGDYSVYEFLSKKENHFIWRNHPEYPYLYATFCEIDKKKKDAKQQATFTLADPINHPLWVRFEERSGSNLNKYRILTEQLHTEKLKKKLTVQLDRLIYPTESGGWEEKGKVDIVLLPSRQFYNQIFLDIEEKGKHAFTYKDESIKFPLKGTLGGARVQFDRDHLRRYPHKVESGNVGRIYFNMTVNIEPTESPVSKSLKIHRDDFPKVVNFKPKELTEWIKDSKGKKLKSGIESLEIGLRVMSIDLGQRQAAAASIFEVVDQKPDIEGKLFFPIKGTELYAVHRASFNIKLPGETLVKSREVLRKAREDNLKLMNQKLNFLRNVLHFQQFEDITEREKRVTKWISRQENSDVPLVYQDELIQIRELMYKPYKDWVAFLKQLHKRLEVEIGKEVKHWRKSLSDGRKGLYGISLKNIDEIDRTRKFLLRWSLRPTEPGEVRRLEPGQRFAIDQLNHLNALKEDRLKKMANTIIMHALGYCYDVRKKKWQAKNPACQIILFEDLSNYNPYEERSRFENSKLMKWSRREIPRQVALQGEIYGLQVGEVGAQFSSRFHAKTGSPGIRCSVVTKEKLQDNRFFKNLQREGRLTLDKIAVLKEGDLYPDKGGEKFISLSKDRKCVTTHADINAAQNLQKRFWTRTHGFYKVYCKAYQVDGQTVYIPESKDQKQKIIEEFGEGYFILKDGVYEWVNAGKLKIKKGSSKQSSSELVDSDILKDSFDLASELKGEKLMLYRDPSGNVFPSDKWMAAGVFFGKLERILISKLTNQYSISTIEDDSSKQSMKRPAATKKAGQAKKKK。
BhCas12bアミノ酸配列に対して少なくとも85%またはより高い同一性を有するアミノ酸配列もまた本開示の方法において有用である。
「保存的アミノ酸置換」または「保存的変異」という用語は、あるアミノ酸が共通の特性を有する別のアミノ酸に置き換わることを指す。個々のアミノ酸間の共通の性質を定義するための機能的な方法は、相同的な生物の対応するタンパク質間のアミノ酸変化の正規化された頻度を分析することである(Schulz, G. E. and Schirmer, R. H., Principles of Protein Structure, Springer-Verlag, New York (1979))。このような分析によれば、グループ内のアミノ酸が互いに優先的に交換され、それゆえに全体的なタンパク質構造に対するそれらの影響において互いに最も類似しているところアミノ酸のグループを定義することができる(上記Schulz, G. E. and Schirmer, R. H.)。保存変異の非限定的な例としては、例えば正電荷を維持することができるアミノ酸アルギニンからリジンおよびその逆;負電荷を維持することができるアスパラギン酸からグルタミン酸およびその逆;遊離の-OHが維持されるトレオニンからセリン;および遊離NH2を維持できるアスパラギンからグルタミンのようなアミノ酸置換が挙げられる。
本明細書中で交換可能に使用される用語「コード配列」または「タンパク質コード配列」とは、タンパク質をコードするポリヌクレオチドのセグメントをいう。この領域または配列は、5’末端に近い方が開始コドンで境界され、3’末端に近い方が停止コドンで境界される。コード配列はオープンリーディングフレームとも呼ばれる。
「シチジンデアミナーゼ」とは、アミノ基をカルボニル基に変換する脱アミノ化反応を触媒することができるポリペプチドまたはその断片を意味する。一実施形態において、シチジンデアミナーゼは、シトシンをウラシルに、または5-メチルシトシンをチミンに変換する。Petromyzon marinus由来のPmCDA1(Petromyzon marinus cytosine deaminase 1)、または哺乳動物(例えば、ヒト、ブタ、ウシ、ウマ、サル等)由来のAID(活性化誘導シチジンデアミナーゼ; AICDA)、およびAPOBECは、例示的シチジンデアミナーゼである。
本明細書中で使用する場合、用語「デアミナーゼ」または「デアミナーゼドメイン」とは、脱アミノ化反応を触媒するタンパク質または酵素を指す。いくつかの実施形態において、デアミナーゼは、ヒポキサンチンへのアデニンの加水分解的脱アミノ化を触媒するアデノシンデアミナーゼである。いくつかの実施形態において、デアミナーゼは、アデノシンまたはアデニン (A) からイノシン (I) への加水分解的脱アミノ化を触媒するアデノシンデアミナーゼである。いくつかの実施形態において、デアミナーゼまたはデアミナーゼドメインは、アデノシンデアミナーゼであり、それぞれイノシンまたはデオキシイノシンへのアデノシンまたはデオキシアデノシンの加水分解的脱アミノ化を触媒する。いくつかの実施形態において、アデノシンデアミナーゼは、デオキシリボ核酸 (DNA) 中のアデノシンの加水分解的脱アミノ化を触媒する。本明細書中で提供されるアデノシンデアミナーゼ(例えば、遺伝子操作されたアデノシンデアミナーゼ、進化されたアデノシンデアミナーゼ)は、細菌などの任意の生物由来であり得る。いくつかの実施形態において、アデノシンデアミナーゼは、Escherichia coli、Staphylococcus aureus、Salmonella typhimurium、Shewanella putrefaciens、Haemophilus influenzae、またはCaulobacter crescentusなどの細菌由来である。
いくつかの実施形態において、アデノシンデアミナーゼはTadAデアミナーゼである。いくつかの実施形態において、TadAデアミナーゼはTadAバリアントである。いくつかの実施形態において、TadAバリアントはTadA*8である。いくつかの実施形態において、デアミナーゼまたはデアミナーゼドメインは、ヒト、チンパンジー、ゴリラ、サル、ウシ、イヌ、ラット、またはマウスなどの生物からの天然に存在するデアミナーゼのバリアントである。いくつかの実施形態において、デアミナーゼまたはデアミナーゼドメインは天然に存在しない。例えば、いくつかの実施形態において、デアミナーゼまたはデアミナーゼドメインは、天然に存在するデアミナーゼに対して少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、少なくとも99.1%、少なくとも99.2%、少なくとも99.3%、少なくとも99.4%、少なくとも99.5%、少なくとも99.6%、少なくとも99.7%、少なくとも99.8%、または少なくとも99.9%の同一性である。例えば、デアミナーゼドメインは、国際PCT出願番号PCT/2017/045381 (WO 2018/027078)およびPCT/US2016/058344 (WO 2017/070632)に記載されており、これらのそれぞれは参照により全体が本明細書に組み込まれる。Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017); Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity”Science Advances 3:eaao4774 (2017) )、およびRees, H.A., et al., “Base editing: precision chemistry on the genome and transcriptome of living cells.” Nat Rev Genet. 2018 Dec;19(12):770-788. doi: 10.1038/s41576-018-0059-1もまた参照されたい(これらの全内容は参照により本明細書に組み込まれる)。
「検出」は、検出されるべき分析物の存在、不在または量を同定することを指す。一実施形態において、ポリヌクレオチドまたはポリペプチドにおける配列変化が検出される。別の実施形態では、インデル(indel)の存在が検出される。
「検出可能な標識」とは、目的の分子に連結されたときに、分光学的、光化学的、生化学的、免疫化学的、または化学的手段を介して、後者を検出可能にする組成物を意味する。例えば、有用な標識としては、放射性同位体、磁気ビーズ、金属ビーズ、コロイド粒子、蛍光色素、高電子密度試薬、酵素(例えばELISAで一般的に用いられるもの)、ビオチン、ジゴキシゲニン、またはハプテンが挙げられる。
「疾患」とは、細胞、組織または臓器の正常な機能を損傷または妨害するあらゆる状態または障害を意味する。
本明細書で使用される用語「有効量」は、所望の生物学的応答を誘発するために十分な、生物活性剤の量を指す。疾患の治療的処置のために本開示を実施するために使用される活性剤の有効量は、投与態様、対象の年齢、体重、および全般的健康状態に依存して変化する。最終的には、主治医または獣医が適切な量および用量を決定する。このような量は「有効」量と呼ばれる。一実施形態において、有効量は、細胞(例えばin vitroまたはin vivoの細胞)内の目的の遺伝子に改変を導入するために十分な本開示の塩基エディター(例えば、プログラム可能なDNA結合タンパク質、核酸塩基エディターおよびgRNAを含む融合タンパク質)の量である。一実施形態において、有効量は、治療効果(例えば疾患またはその症状もしくは状態を低減もしくは制御するため)を達成するために必要な塩基エディターの量である。そのような治療効果は、すべての対象の細胞、組織または臓器において目的の遺伝子を改変するために十分である必要はなく、対象、組織または臓器中に存在する細胞の約1%、5%、10%、25%、50%、75%またはより多くにおいて目的の遺伝子を改変するだけでよい。
「断片」とは、ポリペプチドまたは核酸分子の部分を意味する。この部分は、参照核酸分子またはポリペプチドの全長の少なくとも約10%、20%、30%、40%、50%、60%、70%、80%、または90%を含む。断片は、10、20、30、40、50、60、70、80、90、または100、200、300、400、500、600、700、800、900、または1000のヌクレオチドまたはアミノ酸を含み得る。
「ガイドRNA」あるいは「gRNA」は、標的配列に特異的であり得るポリヌクレオチドプログラミング可能ヌクレオチド結合ドメインタンパク質(例えばCas9またはCpf1)と複合体を形成することができるポリヌクレオチドを意味する。ある実施形態において、ガイドポリヌクレオチドはガイドRNA (gRNA) である。gRNAは2個以上のRNAの複合体として存在することもあれば、1個のRNA分子として存在することもある。単一のRNA分子として存在するgRNAは、単一ガイドRNA(sgRNA)と呼ばれることがあるが、「gRNA」は、単一の分子として、または2つ以上の分子の複合体として存在するガイドRNAを指すために互換的に使用される。典型的には、単一のRNA種として存在するgRNAは、(1) 標的核酸と相同性を共有するドメイン(例えば、標的へのCas9複合体の結合を指示する);および(2) Cas9タンパク質に結合するドメインという二つのドメインを含む。いくつかの実施形態において、ドメイン (2) は、tracrRNAとして知られる配列に対応し、ステム-ループ構造を含む。例えば、いくつかの実施形態において、ドメイン (2) は、Jinek et al., Science 337:816-821(2012)(その全内容が参照により本明細書に組み入れられる)に提供されるようなtracrRNAと同一または相同である。gRNA (例えばドメイン2を含むもの)の他の例は、「Switchable Cas9 Nucleases and Uses Thereof」と題される2013年9月6日に出願された米国仮特許出願U.S.S.N 61/874,682および「Delivery System For Functional Nucleases」と題される2013年9月6日に出願された米国仮特許出願U.S.S.N. 61/874,746に見出され得、それぞれの全内容は参照により本明細書に組み込まれる。いくつかの実施形態において、gRNAは、ドメイン (1) および(2) の二つ以上を含み、「伸長されたgRNA。」と称され得る。伸長されたgRNAは、本明細書に記載されるように、二つ以上のCas9タンパク質と結合し、二つ以上の異なる領域における標的核酸と結合する。gRNAは、標的部位を相補するヌクレオチド配列を含み、これが前記標的部位へのヌクレアーゼ/RNA複合体の結合を媒介し、ヌクレアーゼ:RNA複合体の配列特異性を提供する。
「ヘテロダイマー」とは、野生型TadAドメインおよびTadAドメインのバリアント(例えばTadA*8)または2つのバリアントTadAドメイン(例えばTadA*7.10およびTadA*8もしくは2つのTadA*8ドメイン)などの2つのドメインを含む融合タンパク質を意味する。
「ハイブリダイゼーション」は、相補的な核酸塩基間の水素結合を意味し、ワトソン-クリック、フーグスティーンまたは逆フーグスティーン水素結合であり得る。たとえば、アデニンとチミンは相補的な核酸塩基で、水素結合を形成して対を形成する。
用語「塩基修復の阻害因子」または「IBR」は、核酸修復酵素、例えば塩基除去修復(BER)酵素の活性を阻害することができるタンパク質を指す。ある実施形態では、IBRは、イノシン塩基除去修復の阻害因子である。塩基修復の阻害因子の例としては、APE1、Endo III、Endo IV、Endo V、Endo VIII、Fpg、hOGGl、hNEILl、T7 Endol、T4 PDG、UDG、hSMUGLおよびhAAGの阻害因子が挙げられる。いくつかの実施形態では、IBRは、Endo VまたはhAAGの阻害因子である。いくつかの実施形態では、IBRは、触媒的に不活性なEndoVまたは触媒的に不活性なhAAGである。いくつかの実施形態では、塩基修復阻害因子はEndo VまたはhAAGの阻害因子である。いくつかの実施形態では、塩基修復阻害因子は、触媒的に不活性なEndoVまたは触媒的に不活性なhAAGである。
いくつかの実施形態では、塩基修復阻害因子は、ウラシルグリコシラーゼ阻害因子 (UGI) である。UGIとは、ウラシル-DNAグリコシラーゼの塩基除去修復酵素を阻害することができるタンパク質を指す。いくつかの実施形態において、UGIドメインは、野生型UGIまたはその断片を含む。いくつかの実施形態において、本明細書で提供されるUGIタンパク質は、UGIの断片、および、UGIまたはUGI断片に相同的なタンパク質を含む。いくつかの実施形態において、塩基修復阻害因子は、イノシン塩基除去修復の阻害因子である。いくつかの実施形態において、塩基修復阻害因子は、「触媒的に不活性なイノシン特異的ヌクレアーゼ」または「死んだイノシン特異的ヌクレアーゼ」である。いかなる特定の理論にも拘束されることを望まないが、触媒的に不活性なイノシングリコシラーゼ(例えば、アルキルアデニングリコシラーゼ (AAG))は、イノシンに結合することができるが、脱塩基部位を作ることもイノシンを除去することもできず、それによって、新たに形成されるイノシン部分をDNA損傷/修復機構から立体的にブロックする。いくつかの実施形態において、触媒的に不活性なイノシン特異的ヌクレアーゼは、核酸中のイノシンに結合することができるが、核酸を切断しない。代表的な、触媒的に不活性なイノシン特異的ヌクレアーゼの非限定的例としては、(例えばヒト由来の)触媒的に不活性なアルキルアデノシングリコシラーゼ(AAGヌクレアーゼ)、および(例えばE.coli由来の)触媒的に不活性なエンドヌクレアーゼV (EndoVヌクレアーゼ)が挙げられる。いくつかの実施形態において、触媒的に不活性なAAGヌクレアーゼは、E125Q突然変異または別のAAGヌクレアーゼにおける対応する突然変異を含む。
「増加」とは、少なくとも10%、25%、50%、75%、または100%の正の変化を意味する。
「インテイン(intein)」は、それ自身を切り出してそして残った断片(エクステイン(extein))をタンパク質スプライシングとして知られるプロセスにおいてペプチド結合で連結することができるタンパク質の断片である。インテインは「タンパク質イントロン」とも呼ばれる。インテインがそれ自身を切り出し、タンパク質の残りの部分を連結するプロセスは、本明細書において、「タンパク質スプライシング」または「インテイン媒介タンパク質スプライシング」と呼ばれる。いくつかの実施形態において、前駆体タンパク質(インテイン媒介タンパク質スプライシングの前のインテイン含有タンパク質)のインテインは、二つの遺伝子に由来する。そのようなインテインは、本明細書では分割(split)インテインと呼ばれる(例えば、分割インテイン-Nおよび分割インテイン-C)。たとえば、シアノバクテリアでは、DNAポリメラーゼIIIの触媒サブユニットaであるDnaEは2つの別々の遺伝子dnaE-nおよびdnaE-cによってコードされている。dnaE-n遺伝子によってコードされるインテインは本明細書において「インテインN」と称され得る。dnaE-c遺伝子によってコードされるインテインは本明細書において「インテインC」と称され得る。
他のインテイン系も使用され得る。例として、dnaEインテイン、すなわちCfa-N(例えば分割インテイン-N)およびCfa-C(例えば分割インテイン-C)のインテイン対に基づく合成インテインが記述されている(例えば、参照により本明細書に組み入れられるStevens et al., J Am Chem Soc. 2016 Feb. 24; 138(7):2162-5)。本開示に従って使用することができるインテイン対の非限定的な例としては、Cfa DnaEインテイン、Ssp GyrBインテイン、Ssp DnaXインテイン、Ter DnaE3インテイン、Ter ThyXインテイン、Rma DnaBインテイン、およびCne Prp8インテイン(例えば、参照により本明細書に組み込まれる米国特許第8,394,604号に記載のようなもの)が挙げられる。
インテインの例示的なヌクレオチドおよびアミノ酸配列を提供する。
DnaE インテイン-N DNA:
TGCCTGTCATACGAAACCGAGATACTGACAGTAGAATATGGCCTTCTGCCAATCGGGAAGATTGTGGAGAAACGGATAGAATGCACAGTTTACTCTGTCGATAACAATGGTAACATTTATACTCAGCCAGTTGCCCAGTGGCACGACCGGGGAGAGCAGGAAGTATTCGAATACTGTCTGGAGGATGGAAGTCTCATTAGGGCCACTAAGGACCACAAATTTATGACAGTCGATGGCCAGATGCTGCCTATAGACGAAATCTTTGAGCGAGAGTTGGACCTCATGCGAGTTGACAACCTTCCTAAT
DnaE インテイン-N タンパク質:
CLSYETEILTVEYGLLPIGKIVEKRIECTVYSVDNNGNIYTQPVAQWHDR GEQEVFEYCLEDGSLIRATKDHKFMTVDGQMLPIDEIFERELDLMRVDNLPN
DnaE インテイン-C DNA:
ATGATCAAGATAGCTACAAGGAAGTATCTTGGCAAACAAAACGTTTATGA TATTGGAGTCGAAAGAGATCACAACTTTGCTCTGAAGAACGGATTCATAGCTTCTAAT
インテイン-C: MIKIATRKYLGKQNVYDIGVERDHNFALKNGFIASN
Cfa-N DNA:
TGCCTGTCTTATGATACCGAGATACTTACCGTTGAATATGGCTTCTTGCCTATTGGAAAGATTGTCGAAGAGAGAATTGAATGCACAGTATATACTGTAGACAAGAATGGTTTCGTTTACACACAGCCCATTGCTCAATGGCACAATCGCGGCGAACAAGAAGTATTTGAGTACTGTCTCGAGGATGGAAGCATCATACGAGCAACTAAAGATCATAAATTCATGACCACTGACGGGCAGATGTTGCCAATAGATGAGATATTCGAGCGGGGCTTGGATCTCAAACAAGTGGATGGATTGCCA
Cfa-N タンパク質:
CLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGLDLKQVDGLP
Cfa-C DNA:
ATGAAGAGGACTGCCGATGGATCAGAGTTTGAATCTCCCAAGAAGAAGAGGAAAGTAAAGATAATATCTCGAAAAAGTCTTGGTACCCAAAATGTCTATGATATTGGAGTGGAGAAAGATCACAACTTCCTTCTCAAGAACGGTCTCGTAGCCAGCAAC
Cfa-C タンパク質: MKRTADGSEFESPKKKRKVKIISRKSLGTQNVYDIGVEKDHNFLLKNGLVASN
分割Cas9のN末端部と分割Cas9のC末端部とを接合するために、インテインNおよびインテインCをそれぞれ分割Cas9のN末端部および分割Cas9のC末端部に融合させ得る。例えば、いくつかの実施形態において、インテイン-Nが、分割されたCas9のN-末端部分のC-末端に融合され、すなわち、N--[分割Cas9のN末端部分]-[インテイン-N]--Cの構造を形成する。いくつかの実施形態において、インテイン-Cが、分割されたCas9のC-末端部分のN-末端に融合され、すなわち、N-[インテイン-C]--[分割Cas9のC末端部分]-Cの構造を形成する。インテインが融合されたところのタンパク質(例えば分割Cas9)を連結するためのインテイン媒介性タンパク質スプライシングの機構は、例えば、参照により本明細書に組み入れられるShah et al., Chem Sci. 2014; 5(1):446-461に記載されているように、当該技術分野において公知である。インテインを設計および使用する方法は当該技術分野で公知であり、例えばWO2014004336、WO2017132580、US20150344549およびUS20180127780によって記載されており、これらの各々はその全体が参照により本明細書に組み込まれる
用語「単離された」、「精製された」、または「生物学的に純粋な」とは、その天然状態で見出される場合に通常それに付随する成分が、様々な程度まで除去されている物質を指す。「単離」は、元の入手源又は周囲環境からの分離の程度を示す。「精製」は、単離よりも高い分離度を示す。「精製された」又は「生物学的に純粋な」タンパク質は、不純物がタンパク質の生物学的特性に実質的に影響を与えたり他の有害な結果を引き起こさないように、他の物質が十分に除去されている。すなわち、本開示の核酸またはペプチドは、組換えDNA技術によって産生された場合には細胞物質、ウイルス物質または培地を実質的に含まない場合、あるいは化学的に合成された場合には化学的前駆体その他の化学物質を実質的に含まない場合には、精製されている。純度および均一性は、典型的には、分析化学技術、例えば、ポリアクリルアミドゲル電気泳動または高速液体クロマトグラフィーを用いて決定される。用語「精製された」は、核酸またはタンパク質が電気泳動ゲルにおいて本質的に1つのバンドを生じることを意味し得る。修飾、例えば、リン酸化またはグリコシル化を受けることができるタンパク質については、異なる修飾は、別々に精製することができる異なる単離されたタンパク質を生じ得る。
「単離ポリヌクレオチド」とは、本開示の核酸分子が由来する生物の天然ゲノムにおいて当該遺伝子に隣接する遺伝子を含まない核酸(例えばDNA)を意味する。したがって、この用語は、例えば、ベクターに組み込まれた;自律的に複製するプラスミドやウイルスに組み込まれた;原核生物や真核生物のゲノムDNAに組み込まれた;または他の配列とは独立した別の分子(例えば、PCRまたは制限エンドヌクレアーゼ消化によって生成されたcDNAまたはゲノムもしくはcDNA断片)として存在する組換えDNAを含む。さらに、この用語は、DNA分子から転写されるRNA分子、ならびに、さらなるポリペプチド配列をコードするハイブリッド遺伝子の一部である組換えDNAを含む。
「単離されたポリペプチド」とは、天然にそれに付随する成分から分離された本開示のポリペプチドを意味する。典型的には、ポリペプチドは、それが天然に付随されるタンパク質および天然に存在する有機分子の少なくとも60重量%を有しない場合に、単離されている。好ましくは、調製物は、少なくとも75%、より好ましくは少なくとも90%、最も好ましくは少なくとも99%の重量の本開示のポリペプチドである。本開示の単離されたポリペプチドは、例えば、天然の供給源からの抽出により、そのようなポリペプチドをコードする組換え核酸の発現により、またはタンパク質を化学的に合成することにより得られ得る。純度は、任意の適切な方法、例えば、カラムクロマトグラフィー、ポリアクリルアミドゲル電気泳動、またはHPLC分析により測定することができる。
本明細書で使用される用語「リンカー」は、2つの分子または部分、例えば、タンパク質複合体もしくはリボヌクレオ複合体の2つの成分、または融合タンパク質の2つのドメイン、例えば、ポリヌクレオチドプログラム可能なDNA結合ドメイン(例えばdCas9)およびデアミナーゼドメイン(例えばアデノシンデアミナーゼ、シチジンデアミナーゼ、もしくはアデノシンデアミナーゼおよびシチジンデアミナーゼを連結する共有性リンカー(例えば共有結合)、非共有性リンカー、化学基、または分子を指すことができる;PCT/US2019/044935、PCT/US2020/016288(これらのそれぞれは参照により全体が本明細書に組み込まれる)を参照されたい)。リンカーは、塩基エディターシステムの異なるコンポーネントまたはコンポーネントの異なる部分を繋げることができる。例えば、いくつかの実施形態において、リンカーは、ポリヌクレオチドプログラミング可能ヌクレオチド結合ドメインのガイドポリヌクレオチド結合ドメインおよびデアミナーゼの触媒ドメインを繋げることができる。いくつかの実施形態において、リンカーは、CRISPRポリペプチドおよびデアミナーゼを結合することができる。いくつかの実施形態において、リンカーは、Cas9およびデアミナーゼを繋げることができる。いくつかの実施形態において、リンカーは、dCas9およびデアミナーゼを繋げることができる。いくつかの実施形態において、リンカーは、nCas9およびデアミナーゼを繋げることができる。いくつかの実施形態において、リンカーは、ガイドポリヌクレオチドおよびデアミナーゼを繋げることができる。いくつかの実施形態において、リンカーは、塩基エディター系の脱アミノ化成分およびポリヌクレオチドプログラミング可能なヌクレオチド結合成分を繋げることができる。いくつかの実施形態において、リンカーは、塩基エディターシステムの脱アミノ化成分のRNA結合部分と、ポリヌクレオチドプログラミング可能なヌクレオチド結合成分とを繋げることができる。いくつかの実施形態において、リンカーは、塩基エディター系の脱アミノ化成分のRNA結合部分と、ポリヌクレオチドプログラミング可能なヌクレオチド結合成分のRNA結合部分とを結合することができる。リンカーは、2つの基、分子、または他の部分の間に配置され、またはそれらによって挟まれ、共有結合または非共有結合相互作用を介してそれぞれに連結され、かくして2つを連結することができる。いくつかの実施形態において、リンカーは、有機分子、基、ポリマー、または化学的部分であり得る。いくつかの実施形態において、リンカーはポリヌクレオチドであり得る。いくつかの実施形態において、リンカーはDNAリンカーであり得る。いくつかの実施形態において、リンカーはRNAリンカーであり得る。いくつかの実施形態において、リンカーは、リガンドに結合することができるアプタマーを含むことができる。いくつかの実施形態において、リガンドは、炭水化物、ペプチド、タンパク質、または核酸であり得る。いくつかの実施形態において、リンカーは、リボスイッチに由来するアプタマーを含むことができる。アプタマーが由来するリボスイッチは、テオフィリンリボスイッチ、チアミンピロリン酸 (TPP) リボスイッチ、アデノシンコバラミン (AdoCbl) リボスイッチ、S-アデノシルメチオニン(SAM) リボスイッチ、SAHリボスイッチ、フラビンモノヌクレオチド (FMN) リボスイッチ、テトラヒドロ葉酸リボスイッチ、リジンリボスイッチ、グリシンリボスイッチ、プリンリボスイッチ、GlmSリボスイッチ、またはプレクエオシン1 (PreQ1) リボスイッチから選択され得る。いくつかの実施形態において、リンカーは、ポリペプチドまたはポリペプチドリガンドなどのタンパク質ドメインに結合したアプタマーを含み得る。いくつかの実施形態において、ポリペプチドリガンドは、K相同 (KH) ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、無菌のαモチーフ、テロメラーゼKu結合モチーフおよびKuタンパク質、テロメラーゼSm7結合モチーフおよびSm7タンパク質、またはRNA認識モチーフであり得る。いくつかの実施形態において、ポリペプチドリガンドは、塩基エディター系成分の一部であり得る。例えば、核酸塩基編集成分は、デアミナーゼドメインおよびRNA認識モチーフを含み得る。
いくつかの実施形態において、リンカーは、アミノ酸または複数のアミノ酸(例えばペプチドまたはタンパク質)であり得る。いくつかの実施形態において、リンカーは、長さが約5~100アミノ酸、例えば、長さが約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、20-30、30~40、40~50、50~60、60~70、70~80、80~90または90~100アミノ酸であり得る。いくつかの実施形態において、リンカーは、長さが約100~150、150~200、200~250、250~300、300~350、350~400、400~450、または450~500アミノ酸であり得る。より長いまたはより短いリンカーも考えられる。
いくつかの実施形態において、リンカーは、Cas9ヌクレアーゼドメインを含むRNAプログラム可能ヌクレアーゼのgRNA結合ドメインと、核酸編集タンパク質(例えば、アデノシンデアミナーゼ)の触媒ドメインとを繋げる。いくつかの実施形態において、リンカーは、dCas9および核酸編集タンパク質を繋げる。例えば、リンカーは、2つの基、分子、または他の部分の間に配置されるか、または2つの基、分子、または他の部分によって隣接され、共有結合を介してそれぞれに連結され、したがって2つを連結する。いくつかの実施形態において、リンカーは、アミノ酸または複数のアミノ酸(例えば、ペプチドまたはタンパク質)である。いくつかの実施形態において、リンカーは、有機分子、基、ポリマー、または化学的部分である。いくつかの実施形態において、リンカーは、長さが5~200アミノ酸、例えば、長さが5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、35、45、50、55、60、60、65、70、70、75、80、85、90、90、95、100、101、102、103、104、105、110、120、130、140、150、160、175、180、190、または200アミノ酸である。より長いまたはより短いリンカーも考えられる。
いくつかの実施形態において、核酸塩基エディターのドメインは、SGGSSGSETPGTSESATPESSGGS、SGGSSGGSSGSETPGTSESATPESSGGSSGGS、またはGGSGGSPGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTE PSEGSAPGTSTEPSEGSAPGTSESATPESGPGSEPATSGGSGGSのアミノ酸配列を含むリンカーを介して融合される。いくつかの実施形態において、核酸塩基エディターのドメインは、XTENリンカーとも称され得る、アミノ酸配列SGSETPGTSESATPESを含むリンカーを介して融合される。いくつかの実施形態において、リンカーはアミノ酸配列SGGSを含む。いくつかの実施形態において、リンカーは、(SGGS)n、(GGGS)n、(GGGGS)n、(G)n、(EAAAK)n、(GGS)n、SGSETPGTSESATPES、もしくは(XP)nモチーフ、またはこれらの任意の組合せを含み、ここでnは独立して1~30の整数であり、Xは任意のアミノ酸である。いくつかの実施形態において、nは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、または15である。
いくつかの実施形態において、リンカーは、長さが24アミノ酸である。いくつかの実施形態において、リンカーは、アミノ酸配列SGGSSGGSSGSETPGTSESATPESを含む。いくつかの実施形態において、リンカーは、40アミノ酸長である。いくつかの実施形態において、リンカーは、アミノ酸配列SGGSSGGSSGSETPGTESATPESSGGSSGGSSGSSGGSを含む。いくつかの実施形態において、リンカーは、64アミノ酸長である。いくつかの実施形態において、リンカーは、アミノ酸配列SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGGSSGGSSGSETPGTSESATPESSGGSSGGSを含む。いくつかの実施形態において、リンカーは、長さが92アミノ酸である。いくつかの実施形態では、リンカーは、アミノ酸配列PGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGSEPATSを含む。
「マーカー」とは、疾患または障害に関連する発現レベルまたは活性の変化を有する任意のタンパク質またはポリヌクレオチドを意味する。
本明細書中で使用される場合、用語「変異」とは、配列内、例えば核酸もしくはアミノ酸配列内の残基が、別の残基により置換されること、または配列内の1以上の残基の欠失もしくは挿入をいう。変異は、本明細書中において典型的には、元の残基を同定し、次いで配列内の残基の位置を同定し、そして新たに置換された残基を同定することによって、記載される。本明細書中に提供されるアミノ酸置換 (変異) を作製するための種々の方法は、当該技術分野においてよく知られており、例えば、Green and Sambrook, Molecular Cloning: A Laboratory Manual (4th ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (2012) )によって提供されている。いくつかの実施形態において、本開示の塩基エディターは、有意な数の非意図的な変異、例えば非意図的な点突然変異を生成することなく、核酸(例えば対象のゲノム内の核酸)において「意図された変異」例えば点突然変異を効率的に生成することができる。いくつかの実施形態において、意図された変異は、その意図された変異を生じさせるように特に設計された、ガイドポリヌクレオチド(例えばgRNA)に結合した特定の塩基エディター(例えばアデノシン塩基エディター)によって生じる変異である。
一般に、配列(例えば、本明細書に記載のアミノ酸配列)においてなされるか又は同定される変異は、参照(または野生型)配列、すなわち、その変異を含まない配列に関連して番号付けされる。当業者は、参照配列に対するアミノ酸および核酸配列における突然変異の位置を決定する方法を容易に理解するであろう。
「非保存的変異」という用語は、異なるグループの間のアミノ酸置換に関し、例えば、トリプトファンからリジン、またはセリンからフェニルアラニンなどである。この場合、非保存的アミノ酸置換は、機能性バリアントの生物学的活性を妨害または阻害しないことが好ましい。非保存的アミノ酸置換は、機能的バリアントの生物学的活性が野生型タンパク質と比較して増加するように、機能的バリアントの生物学的活性を増強することができる。
「核局在化配列」、「核局在化シグナル」または「NLS」という用語は、タンパク質の細胞核への移入を促進するアミノ酸配列を意味する。核局在化配列は当該技術分野において公知であり、例えば、2000年11月23日に出願され2001年5月31日にWO/2001/038547として公開された国際PCT出願PCT/EP 2000/011690のPlank et al.に記載されており、その内容は、例示的な核局在化配列の開示について参照により本明細書に組み入れられる。他の実施形態では、NLSは、例えばKoblan et al., Nature Biotech. 2018 doi:10.1038/nbt.4172によって記載された、最適化されたNLSである。いくつかの実施形態において、NLSは、アミノ酸配列KRTADGSEFESPKKKRKV, KRPAATKKAGQAKKKK, KKTELQTTNAENKTKKL, KRGINDRNFWRGENGRKTR, RKSGKIAAIVVKRPRK, PKKKRKV, またはMDSLLMNRRKFLYQFKNVRWAKGRRETYLC
を含む。
本明細書中で使用される場合、用語「核酸」および「核酸分子」とは、核酸塩基および酸性部分を含む化合物、例えばヌクレオシド、ヌクレオチド、またはヌクレオチドのポリマーをいう。典型的には、ポリマー核酸、例えば3つ以上のヌクレオチドを含む核酸分子は、隣接するヌクレオチドがホスホジエステル結合を介して互いに連結されている直鎖分子である。いくつかの実施形態において、「核酸」は、個々の核酸残基(例えばヌクレオチドおよび/またはヌクレオシド)を指す。いくつかの実施形態において、「核酸」は、三つ以上の個々のヌクレオチド残基を含むオリゴヌクレオチド鎖をいう。本明細書中で使用される、用語「オリゴヌクレオチド」、および「ポリヌクレオチド」は、ヌクレオチドのポリマー(例えば少なくとも3つのヌクレオチドの鎖)を指すために交換可能に使用され得る。いくつかの実施形態において、「核酸」は、RNAならびに一本鎖および/または二本鎖DNAを包含する。核酸は、例えば、ゲノム、転写物、mRNA、tRNA、rRNA、siRNA、snRNA、プラスミド、コスミド、染色体、染色分体、または他の天然に存在する核酸分子との関連において、天然に存在し得る。他方、核酸分子は、例えば非天然に存在する分子、組換えDNAもしくはRNA、人工染色体、操作されたゲノム、もしくはその断片、または合成DNA、RNA、DNA/RNAハイブリッド、または非天然に存在するヌクレオチドもしくはヌクレオシドを含む、非天然に存在する分子であり得る。さらに、用語「核酸」、「DNA」、「RNA」、および/または類似の用語は、核酸アナログ、例えばホスホジエステル骨格以外を有するアナログを含む。核酸は、天然源から精製される、組換え発現系を用いて産生され必要に応じて精製される、化学的に合成される、等が可能である。化学的に合成された分子の場合、核酸は、適切な場合には、例えば、化学的に修飾された塩基または糖、および骨格修飾を有するアナログなどのヌクレオシドアナログを含み得る。核酸配列は、特に示されない限り、5’~3’方向に示される。いくつかの実施形態において、核酸は、天然ヌクレオシド(例えばアデノシン、チミジン、グアノシン、シチジン、ウリジン、デオキシアデノシン、デオキシチミジン、デオキシグアノシン、およびデオキシシチジン);ヌクレオシド類似体(例えば2-アミノアデノシン、2-チオチミジン、イノシン、ピロロ-ピリミジン、3-メチルアデノシン、5-メチルシチジン、2-アミノアデノシン、C5-ブロモウリジン、C5-フルオロウリジン、C5-ヨードウリジン、C5-プロピニル-ウリジン、C5-プロピニル-シチジン、C5-メチルシチジン、2-アミノアデノシン、7-デアザアデノシン、7-デアザグアノシン、8-オキソアデノシン、8-オキソグアニン、O(6)-メチルグアニン、および2-チオシチジン);化学修飾塩基;生物学的に修飾された塩基(例えばメチル化塩基);挿入塩基;修飾糖(2’例えば-フルオロリボース、リボース、2’-デオキシリボース、アラビノース、およびヘキソース);および/または修飾リン酸基(例えばホスホロチオエートおよび5’-N-ホスホロアミダイト結合)であるか、またはそれらを含む。
「核酸プログラミング可能DNA結合タンパク質」あるいは「napDNAbp」という用語は、「ポリヌクレオチドプログラミング可能ヌクレオチド結合ドメイン」と互換的に使用され得、特異的な核酸配列にnapDNAbpをガイドするガイド核酸またはガイドポリヌクレオチド(例えばgRNA)のような核酸(例えばDNAまたはRNA)と会合するタンパク質を指す。いくつかの実施形態において、ポリヌクレオチドによりプログラミング可能なヌクレオチド結合ドメインは、ポリヌクレオチドによりプログラミング可能なDNA結合ドメインである。いくつかの実施形態において、ポリヌクレオチドによりプログラミング可能なヌクレオチド結合ドメインは、ポリヌクレオチドによりプログラミング可能なRNA結合ドメインである。いくつかの実施形態において、ポリヌクレオチドによりプログラミング可能なヌクレオチド結合ドメインは、Cas9タンパク質である。Cas9タンパク質は、ガイドRNAに相補的な特異的DNA配列にCas9タンパク質を誘導するガイドRNAと結合することができる。いくつかの実施形態において、napDNAbpは、Cas9ドメイン、例えばヌクレアーゼ活性Cas9、Cas9ニッカーゼ (nCas9) 、またはヌクレアーゼ不活性Cas9 (dCas9) である。核酸プログラミング可能DNA結合タンパク質の非限定的な例としては、Cas9(例えばdCas9およびnCas9)、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、およびCas12iが挙げられる。Cas酵素の非限定的な例としては、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5d、Cas5t、Cas5h、Cas5a、Cas6、Cas7、Cas8、Cas8a、Cas8b、Cas8c、Cas9(Csn1またはCsx12とも呼ばれる)、Cas10、Cas10d、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i、Csy1、Csy2、Csy3、Csy4、Cse1、Cse2、Cse3、Cse4、Cse5e、Csc1、Csc2、Csa5、Csn1、Csn2、Csm1、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx1S、Csx11、Csf1、Csf2、CsO、Csf4、Csd1、Csd2、Cst1、Cst2、Csh1、Csh2、Csa1、Csa2、Csa3、Csa4、Csa5、タイプII Casエフェクタータンパク質、タイプV Casエフェクタータンパク質、タイプVI Casエフェクタータンパク質、CARF、DinG、それらのホモログ、またはそれらの改変または操作されたバージョンが挙げられる。他の核酸プログラミング可能なDNA結合タンパク質も、本開示に具体的に列記されていないかもしれないが、本開示の範囲内である。例えばMakarova et al. “Classification and Nomenclature of CRISPR-Cas Systems: Where from Here?”CRISPR J. 2018 Oct;1:325-336. doi: 10.1089/crispr.2018.0033; Yan et al., “Functionally diverse type V CRISPR-Cas systems” Science. 2019 Jan 4;363(6422):88-91. doi: 10.1126/science.aav7271を参照(それぞれの全内容が参照により本明細書に組み込まれる)。
用語「核酸塩基」、「窒素塩基」、または「塩基」は、本明細書中で互換的に使用され、ヌクレオシドを形成する窒素含有生物学的化合物を指し、ヌクレオシドはヌクレオチドの成分である。塩基対を形成し、互いに積み重なる核酸塩基の能力は、直接、リボ核酸 (RNA) およびデオキシリボ核酸 (DNA) のような長鎖らせん構造をもたらす。アデニン (A)、シトシン (C)、グアニン(G)、チミン (T)、ウラシル (U) の5種類の核酸塩基は、一次塩基または標準塩基と呼ばれる。アデニンとグアニンはプリンに由来し、シトシン、ウラシル、チミンはピリミジンに由来する。DNAとRNAは修飾された他の(非一次) 塩基を含むこともある。非限定的な例示的修飾核酸塩基としては、ヒポキサンチン、キサンチン、7-メチルグアニン、5,6-ジヒドロウラシル、5-メチルシトシン (m5C)、および5-ヒドロメチルシトシンが挙げられる。ヒポキサンチンとキサンチンは変異原の存在によって生成され得、どちらも脱アミノ化(アミン基のカルボニル基への置換)によって生成される。ヒポキサンチンはアデニンから修飾され得る。キサンチンはグアニンから修飾され得る。ウラシルはシトシンの脱アミノ化によって生じ得る。「ヌクレオシド」は核酸塩基と五炭糖(リボースまたはデオキシリボース)からなる。ヌクレオシドの例としては、アデノシン、グアノシン、ウリジン、シチジン、5-メチルウリジン (m5U)、デオキシアデノシン、デオキシグアノシン、チミジン、デオキシウリジン、およびデオキシシチジンが挙げられる。修飾核酸塩基を有するヌクレオシドとしては、イノシン (I)、キサントシン (X)、7-メチルグアノシン (m7G)、ジヒドロウリジン (D)、5-メチルシチジン(m5C)、プソイドウリジン (Ψ) 等が挙げられる。ヌクレオチドは、核酸塩基、五炭糖(リボースまたはデオキシリボース)、および少なくとも一つのリン酸基からなる。
「核酸塩基編集ドメイン」または「核酸塩基編集タンパク質」という用語は、本明細書において使用される場合、シトシン(もしくはシチジン)からウラシル(もしくはウリジン)またはチミン(もしくはチミジン)への、およびアデニン(もしくはアデノシン)からヒポキサンチン(もしくはイノシン)への脱アミノ化、ならびに非鋳型ヌクレオチド付加および挿入のような、RNAまたはDNAにおける核酸塩基修飾を触媒することができるタンパク質または酵素を指す。いくつかの実施形態において、核酸塩基編集ドメインは、デアミナーゼドメイン(例えば、アデニンデアミナーゼもしくはアデノシンデアミナーゼ)である。いくつかの実施形態において、核酸塩基編集ドメインは、複数のデアミナーゼドメイン(例えば、アデニンデアミナーゼもしくはアデノシンデアミナーゼと、シチジンもしくはシトシンデアミナーゼ)である。いくつかの実施形態において、核酸塩基編集ドメインは、天然に存在する核酸塩基編集ドメインであり得る。いくつかの実施形態において、核酸塩基編集ドメインは、天然に存在する核酸塩基編集ドメインから操作または進化された核酸塩基編集ドメインであり得る。核酸塩基編集ドメインは、細菌、ヒト、チンパンジー、ゴリラ、サル、ウシ、イヌ、ラット、またはマウスなどの任意の生物由来であり得る。
本明細書で使用される場合、「薬剤を取得する」におけるような「取得する」は、その薬剤を合成すること、購入すること、または他の方法で獲得することを含む。
本明細書で使用される「患者」または「対象」は、疾患または障害と診断されている、それらを生じるリスクがある、またはそれらを有するかもしくは生ずる疑いがある哺乳動物対象または個体を指す。いくつかの実施形態において、用語「患者」は、疾患または障害を生ずる可能性が平均より高い哺乳動物対象を指す。例示的な患者は、ヒト、ヒト以外の霊長類、ネコ、イヌ、ブタ、ウシ、ネコ、ウマ、ラクダ、ラマ、ヤギ、ヒツジ、齧歯類(例えば、マウス、ウサギ、ラット、モルモット)および本明細書に開示される治療から利益を得ることができる他の哺乳動物であり得る。例示的なヒト患者は、男性および/または女性であり得る。
「それを必要とする患者」または「それを必要とする対象」は、本明細書では、疾患または障害と診断された、またはそれを有するリスクがある、またはそれを有することがあらかじめ決定された、またはそれを有することが疑われる患者として言及される。
「病原性変異」、「病原性バリアント」、「疾患原因変異」、「疾患原因バリアント」、「有害変異」または「素因となる変異」という用語は、特定の疾患または障害に対する個体の感受性または素因を増大させる遺伝子変化または突然変異を指す。いくつかの実施形態において、病原性変異は、遺伝子によってコードされるタンパク質中の少なくとも1つの野生型アミノ酸が少なくとも1つの病原性アミノ酸によって置換されたものを含む。
用語「タンパク質」、「ペプチド」、「ポリペプチド」、およびそれらの文法的等価物は、本明細書において交換可能に使用され、ペプチド (アミド) 結合によって互いに連結されたアミノ酸残基のポリマーを指す。この用語は、任意のサイズ、構造または機能のタンパク質、ペプチドまたはポリペプチドを指す。典型的には、タンパク質、ペプチド、またはポリペプチドは、少なくとも3アミノ酸長である。タンパク質、ペプチド、またはポリペプチドは、個々のタンパク質または一群のタンパク質を指すことができる。タンパク質、ペプチド、またはポリペプチド中の1以上のアミノ酸は、例えば炭水化物基、ヒドロキシル基、リン酸基、ファルネシル基、イソファルネシル基、脂肪酸基、結合のためのリンカー、官能化、または他の修飾などの化学的実体の添加によって、修飾され得る。タンパク質、ペプチド、またはポリペプチドはまた、単一分子であってもよく、または多分子複合体であってもよい。タンパク質、ペプチド、またはポリペプチドは、天然に存在するタンパク質またはペプチドの単なる断片であり得る。タンパク質、ペプチド、またはポリペプチドは、天然に存在するもの、組換え体、もしくは合成のもの、またはそれらの任意の組み合わせであり得る。本明細書中で使用される場合、用語「融合タンパク質」とは、少なくとも二つの異なるタンパク質由来のタンパク質ドメインを含むハイブリッドポリペプチドをいう。1つのタンパク質は、融合タンパク質のアミノ末端 (N末端) 部分またはカルボキシ末端(C末端) タンパク質に位置することができ、かくして、それぞれ、アミノ末端融合タンパク質またはカルボキシ末端融合タンパク質を形成する。タンパク質は、異なるドメイン、例えば、核酸結合ドメイン(例えば、標的部位へのタンパク質の結合を誘導するCas9のgRNA結合ドメイン)および核酸切断ドメイン、あるいは核酸編集タンパク質の触媒ドメインを含み得る。いくつかの実施形態において、タンパク質は、タンパク質性部分、例えば、核酸結合ドメインを構成するアミノ酸配列、および有機化合物、例えば、核酸切断剤として作用し得る化合物を含む。いくつかの実施形態において、タンパク質は、核酸 (例えば、RNAまたはDNA) と複合体化されているか、または核酸と会合している。本明細書で提供される任意のタンパク質は、当技術分野で公知の任意の方法によって生産することができる。例えば、本明細書で提供されるタンパク質は、組換えタンパク質発現および精製を介して生産することができ、これは、ペプチドリンカーを含む融合タンパク質に特に適している。組換えタンパク質の発現および精製のための方法はよく知られており、Green and Sambrook, Molecular Cloning: A Laboratory Manual (4th ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (2012))によって記載されているものを含み、その全内容は参照により本明細書に組み入れられる。
本明細書に開示されるポリペプチドおよびタンパク質(機能的部分およびその機能的バリアントを含む)は、一つ以上の天然に存在するアミノ酸の代わりに合成アミノ酸を含むことができる。そのような合成アミノ酸は当該分野で公知であり、例えば、アミノシクロヘキサンカルボン酸、ノルロイシン、α-アミノn-デカン酸、ホモセリン、S-アセチルアミノメチル-システイン、trans-3-およびtrans-4-ヒドロキシプロリン、4-アミノフェニルアラニン、4-ニトロフェニルアラニン、4-クロロフェニルアラニン、4-カルボキシフェニルアラニン、β-フェニルセリンβ-ヒドロキシフェニルアラニン、フェニルグリシン、α-ナフチルアラニン、シクロヘキシルアラニン、シクロヘキシルグリシン、インドリン-2-カルボン酸、1,2,3,4-テトラヒドロイソキノリン-3-カルボン酸、アミノマロン酸、アミノマロン酸モノアミド、N'-ベンジル-N'-メチルリジン、N',N'-ジベンジル-リジン、6-ヒドロキシリジン、オルニチン、α-アミノシクロペンタンカルボン酸、アミノシクロヘキサンカルボン酸、アミノシクロヘキサンカルボン酸、α-アミノシクロヘプタンカルボン酸、α-(2-アミノ-2-ノルボルナン)-カルボン酸、α,γ-ジアミノ酪酸、α,β-ジアミノプロピオン酸、ホモフェニルアラニン、およびα-tert-ブチルグリシンが挙げられる。ポリペプチドおよびタンパク質は、ポリペプチド構築物の1つ以上のアミノ酸の翻訳後修飾と結合することができる。翻訳後修飾の非限定的な例としては、リン酸化、アセチル化およびホルミル化を含むアシル化、グリコシル化(N-リンクおよびO-リンクを含む)、アミド化、ヒドロキシル化、メチル化およびエチル化を含むアルキル化、ユビキチン化、ピロリドンカルボン酸の添加、ジスルフィド架橋の形成、硫酸化、ミリストイル化、パルミトイル化、イソプレニル化、ファルネシル化、ゲラニル化、グリピエーション、リポイル化およびヨード化が挙げられる。
タンパク質または核酸に関連して本明細書中で使用される用語「組み換え体」とは、自然界には存在しないが、人間の工学の産物であるタンパク質または核酸を指す。例えば、いくつかの実施形態において、組換えタンパク質または核酸分子は、任意の天然に存在する配列と比較して、少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、少なくとも5つ、少なくとも6つ、または少なくとも7つの変異を含むアミノ酸またはヌクレオチド配列を含む。
「減少する」とは、少なくとも10%、25%、50%、75%、または100%の負の変化を意味する。
「参照(reference)」は、基準または対照の条件を意味する。一実施形態において、参照は野生型または健常な細胞である。他の実施形態において、限定されないが、参照は、試験条件に晒されていないか、またはプラセボもしくは通常の食塩水、培地、緩衝液、および/または、目的のポリヌクレオチドを保持しない対照ベクターに晒される、非処理細胞である。
「参照配列」は、配列比較の基礎として使用される定義済み配列である。参照配列は、特定の配列のサブセット又は全体であり得る;例えば、完全長のcDNAもしくは遺伝子配列のセグメント、または完全なcDNAまたは遺伝子配列。ポリペプチドについては、参照ポリペプチド配列の長さは、一般に、少なくとも約16アミノ酸、少なくとも約20アミノ酸、少なくとも約25アミノ酸、約35アミノ酸、約50アミノ酸、または約100アミノ酸である。核酸については、参照核酸配列の長さは、一般に、少なくとも約50ヌクレオチド、少なくとも約60ヌクレオチド、少なくとも約75ヌクレオチド、約100ヌクレオチドまたは約300ヌクレオチドまたはそれらの周辺もしくはそれらの間の任意の整数である。いくつかの実施形態において、参照配列は、目的タンパク質の野生型配列である。他の実施形態では、参照配列は、野生型タンパク質をコードするポリヌクレオチド配列である。
用語「RNAプログラム可能なヌクレアーゼ」および「RNA誘導ヌクレアーゼ」は、切断の標的ではない一つ以上のRNAをとともに使用される(例えば、それに結合または付随する)。いくつかの実施形態において、RNAプログラム可能ヌクレアーゼは、RNAと複合体である場合、ヌクレアーゼ:RNA複合体と称され得る。典型的には、結合したRNAはガイドRNA (gRNA) と呼ばれる。gRNAは2個以上のRNAの複合体として存在することもあれば、1個のRNA分子として存在することもある。単一のRNA分子として存在するgRNAは、単一ガイドRNA(sgRNA)と呼ばれることがあるが、「gRNA」は、単一の分子として、または2つ以上の分子の複合体として存在するガイドRNAを指すために互換的に使用される。典型的には、単一のRNA種として存在するgRNAは、(1) 標的核酸と相同性を共有するドメイン(例えば標的へのCas9複合体の結合を指示する);および(2) Cas9タンパク質に結合するドメインという二つのドメインを含む。いくつかの実施形態において、ドメイン (2) は、tracrRNAとして知られる配列に対応し、ステム-ループ構造を含む。例えば、いくつかの実施形態において、ドメイン (2) は、Jinek et al., Science 337:816-821(2012)(その全内容が参照により本明細書に組み入れられる)に提供されるようなtracrRNAと同一または相同である。gRNA (例えばドメイン2を含むもの)の他の例は、「Switchable Cas9 Nucleases and Uses Thereof」と題され2013年9月6日に出願された米国仮特許出願U.S.S.N.61/874,682および「Delivery System For Functional Nucleases」と題され2013年9月6日に出願された米国仮特許出願U.S.S.N.61/874,746に見出され得、それら各々の全内容が参照により本明細書に組み入れられる。いくつかの実施形態において、gRNAは、ドメイン (1) および(2) の二つ以上を含み、「伸長されたgRNA」と称され得る。例として、伸長されたgRNAは、本明細書に記載されるように、例えば二つ以上のCas9タンパク質と結合し、二つ以上の異なる領域における標的核酸と結合する。gRNAは、標的部位を相補するヌクレオチド配列を含み、これが上記標的部位へのヌクレアーゼ/RNA複合体の結合を媒介し、ヌクレアーゼ:RNA複合体の配列特異性を提供する。
いくつかの実施形態において、RNAプログラム可能ヌクレアーゼは、(CRISPR関連システム) Cas9エンドヌクレアーゼ、例えば、Streptococcus pyogenes由来のCas9 (Csnl) である(例えば、"Complete genome sequence of an Ml strain of Streptococcus pyogenes." Ferretti J.J., McShan W.M., Ajdic D.J., Savic D.J., Savic G., Lyon K., Primeaux C, Sezate S., Suvorov A.N., Kenton S., Lai H.S., Lin S.P., Qian Y., Jia H.G., Najar F.Z., Ren Q., Zhu H., Song L., White J., Yuan X., Clifton S.W., Roe B.A., McLaughlin R.E., Proc. Natl. Acad. Sci. U.S.A. 98:4658-4663(2001); "CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III." Deltcheva E., Chylinski K., Sharma CM., Gonzales K., Chao Y., Pirzada Z.A., Eckert M.R., Vogel J., Charpentier E., Nature 471:602-607(2011)参照)。
RNAプログラム可能なヌクレアーゼ(例:Cas9) は、DNA切断部位を標的とするためにRNA:DNAハイブリダイゼーションを使用するので、これらのタンパク質は、原理的に、ガイドRNAによって指定されるあらゆる配列を標的とすることができる。部位特異的切断のためにCas9のようなRNAプログラム可能なヌクレアーゼを使用する方法(例えばゲノムを改変するために) は、当該技術分野において公知である(例えばCong, L. et al., Multiplex genome engineering using CRISPR/Cas systems. Science 339, 819-823 (2013);Mali, P. et ah., RNA-guided human genome engineering via Cas9. Science 339, 823-826 (2013);Hwang, W.Y. et al., Efficient genome editing in zebrafish using a CRISPR-Cas system. Nature biotechnology 31, 227-229 (2013);Jinek, M. et ah., RNA-programmed genome editing in human cells. eLife 2, e00471 (2013);Dicarlo, J.E. et al., Genome engineering in Saccharomyces cerevisiae using CRISPR-Cas systems. Nucleic acids research (2013);Jiang, W. et ah., RNA-guided editing of bacterial genomes using CRISPR-Cas systems. Nature biotechnology 31, 233-239 (2013)を参照。これらの各々の全内容は参照により本明細書に組み入れられる)。
用語「一塩基多型 (SNP)」は、ゲノム中の特定の位置で起こる単一ヌクレオチドの変異であり、ここで、各変異は集団内で認識できるある程度(例>1%)まで存在する。たとえば、ヒトゲノムの特定の塩基位置では、ほとんどの個体でCヌクレオチドが出現しうるが、少数の個体ではその位置がAで占められている。これは、この特定の位置にSNPがあり、CまたはAという2つのヌクレオチドのバリエーションがこの位置のアリルであることを意味する。SNPは疾患に対する感受性の差の根底にある。病気の重症度や治療に対する体の反応も、遺伝的バリエーションの表れである。SNPは、遺伝子のコード領域、遺伝子の非コード領域、または遺伝子間領域(遺伝子と遺伝子の間の領域)に存在しうる。いくつかの実施形態において、コード配列内のSNPは、遺伝子コードの縮重のために、産生されるタンパク質のアミノ酸配列を必ずしも変化させない。コード領域のSNPには、同義SNPと非同義SNPの2種類がある。同義SNPはタンパク質配列に影響しないが、非同義SNPはタンパク質のアミノ酸配列を変化させる。非同義SNPにはミスセンスとナンセンスの2種類がある。タンパク質をコードする領域にないSNPは、遺伝子のスプライシング、転写因子の結合、メッセンジャーRNAの分解、または非コードRNAの配列に影響を与えることがある。この種のSNPによって影響を受ける遺伝子発現はeSNP (発現SNP)と呼ばれ、遺伝子の上流または下流にあり得る。一塩基バリアント (SNV) は、頻度に制限のない一塩基のバリエーションであり、体細胞で生じ得る。体細胞一塩基バリエーションは一塩基改変とも呼ばれ得る。
「特異的に結合する」とは、本開示のポリペプチドおよび/または核酸分子を認識および結合するが、試料(例えば生物学的試料)中の他の分子を実質的に認識および結合しない核酸分子、ポリペプチド、もしくはそれらの複合体(例えば核酸プログラミング可能DNA結合ドメインおよびガイド核酸)、化合物、または分子を意味する。
本開示の方法において有用な核酸分子は、本開示のポリペプチドまたはその断片をコードする任意の核酸分子を含む。そのような核酸分子は、内因性核酸配列と100%同一である必要はないが、典型的には実質的同一性を示す。内因性配列に対して「実質的同一性」を有するポリヌクレオチドは、典型的には、二本鎖核酸分子の少なくとも一つの鎖とハイブリダイズすることができる。本開示の方法において有用な核酸分子は、本開示のポリペプチドまたはその断片をコードする任意の核酸分子を含む。そのような核酸分子は、内因性核酸配列と100%同一である必要はないが、典型的には実質的同一性を示す。内因性配列に対して「実質的同一性」を有するポリヌクレオチドは、典型的には、二本鎖核酸分子の少なくとも一つの鎖とハイブリダイズすることができる。「ハイブリダイズする」とは、種々のストリンジェンシー条件下で相補的ポリヌクレオチド配列(例えば、本明細書に記載の遺伝子)の間、またはその一部の間に二本鎖分子を形成する対をなすことを意味する。(例えばWahl, G. M. and S. L. Berger (1987) Methods Enzymol. 152:399; Kimmel, A. R. (1987) Methods Enzymol. 152:507参照)。
例えば、ストリンジェントな塩濃度は、通常、約750 mM未満 NaClおよび75 mMクエン酸三ナトリウム、好ましくは約500 mM未満 NaClおよび50 mMクエン酸三ナトリウム、より好ましくは約250 mM未満 NaClおよび25 mMクエン酸三ナトリウムである。低ストリンジェンシーハイブリダイゼーションは、有機溶媒、例えばホルムアミドの非存在下で得ることができ、一方、高ストリンジェンシーハイブリダイゼーションは、少なくとも約35%ホルムアミド、より好ましくは少なくとも約50%ホルムアミドの存在下で得ることができる。ストリンジェントな温度条件は、通常、少なくとも約30℃、より好ましくは少なくとも約37℃、最も好ましくは少なくとも約42℃の温度を含むであろう。ハイブリダイゼーション時間、界面活性剤 (例えば、ドデシル硫酸ナトリウム (SDS) ) の濃度、および担体DNAの含入または排除などの様々な追加のパラメータは、当業者によく知られている。必要に応じてこれら様々な条件を組み合わせることによって、様々なレベルのストリンジェンシーが達成される。一実施形態において、ハイブリダイゼーションは、30℃で、750 mM NaCl、75 mMクエン酸三ナトリウムおよび1% SDS中で起こる。別の実施形態において、ハイブリダイゼーションは、37℃で、500 mM NaCl、50 mMクエン酸三ナトリウム、1% SDS、35%ホルムアミドおよび100μg/ml変性サケ精子DNA (ssDNA) 中で起こる。別の実施形態において、ハイブリダイゼーションは、42℃において、250 mM NaCl、25 mMクエン酸三ナトリウム、1% SDS、50%ホルムアミドおよび200μg/ml ssDNA中で起こる。これらの条件の有用なバリエーションは、当業者には容易に明らかになるであろう。
ほとんどの用途では、ハイブリダイゼーションに続く洗浄工程もまた、ストリンジェンシーが異なる。洗浄ストリンジェンシー条件は、塩濃度および温度によって定義することができる。上記のように、洗浄ストリンジェンシーは、塩濃度を低下させるか、または温度を上昇させることによって増加させることができる。例えば、洗浄工程のためのストリンジェントな塩濃度は、好ましくは約30 mM未満 NaClおよび3 mMクエン酸三ナトリウムであり、最も好ましくは約15 mM未満 NaClおよび1.5 mMクエン酸三ナトリウムであり得る。洗浄工程のためのストリンジェントな温度条件は、通常、少なくとも約25℃、より好ましくは少なくとも約42℃、さらにより好ましくは少なくとも約68℃の温度を含む。ある実施形態において、洗浄工程は、25℃で、30 mM NaCl、3 mMクエン酸三ナトリウム、および0.1% SDS中で行われる。より好ましい実施形態において、洗浄工程は、42Cで、15 mM NaCl、1.5 mMクエン酸三ナトリウム、および0.1% SDS中で行われる。より好ましい実施形態において、洗浄工程は、68℃で、15 mM NaCl、1.5 mMクエン酸三ナトリウム、および0.1% SDS中で行われる。これらの条件のさらなるバリエーションは、当業者には容易に明らかになるであろう。ハイブリダイゼーション技術は、当業者によくしられており、例えば、Benton and Davis (Science 196:180, 1977); Grunstein and Hogness (Proc. Natl. Acad. Sci., USA 72:3961, 1975); Ausubel et al. (Current Protocols in Molecular Biology, Wiley Interscience, New York, 2001); Berger and Kimmel (Guide to Molecular Cloning Techniques, 1987, Academic Press, New York); およびSambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, New Yorkに記述されている。
「分割(split)」とは、2つ以上の断片に分割されることを意味する。
「分割されたCas9タンパク質」あるいは「分割Cas9」とは、二つの別個のヌクレオチド配列によってコードされるN末端断片およびC末端断片として提供されるCas9タンパク質をいう。Cas9タンパク質のN末端部分およびC末端部分に対応するポリペプチドは、スプライスされて「再構成」Cas9タンパク質を形成することができる。特定の実施形態において、Cas9タンパク質は、例えば、Nishimasu et al., Cell, Volume 156, Issue 5, pp. 935-949, 2014に記載されるように、またはJiang et al. (2016) Science 351: 867-871. PDB file: 5F9Rに記載されるように(それぞれ参照により本明細書に組み込まれる)、タンパク質の非秩序的な領域内で2つの断片に分割される。いくつかの実施形態において、タンパク質は、SpCas9のおよそアミノ酸A292-G364、F445-K483、もしくはE565-T637の間の領域内の任意のC、T、A、もしくはSにおいて、または任意の他のCas9、Cas9バリアント(例えばnCas9、dCas9)、もしくは他のnapDNAbpにおける対応位置において、二つの断片に分割される。いくつかの実施形態において、タンパク質は、SpCas9 T310、T313、A456、S469、またはC574において2つの断片に分割される。いくつかの実施形態において、タンパク質を2つの断片に分割するプロセスは、タンパク質を「分割(スプリッティング)する」と称される。
他の実施形態において、Cas9タンパク質のN末端部分は、S. pyogenes Cas9野生型(SpCas9)(NCBI参照配列:NC_002737.2、Uniprot参照配列:Q99ZW2)のアミノ酸1~573または1~637を含み、Cas9タンパク質のC末端部分は、SpCas9野生型のアミノ酸574~1368もしくは638~1368の部分、またはその対応する部分を含む。
分割されたCas9のC末端部分は、分割されたCas9のN末端部分と連結されて完全なCas9タンパク質を形成することができる。いくつかの実施形態において、Cas9タンパク質のC末端部分は、Cas9タンパク質のN末端部分が終わるところから始まる。このように、いくつかの実施形態において、分割Cas9のC末端部分は、spCas9のアミノ酸 (551-651) -1368の部分を含む。「(551-651) -1368」とは、アミノ酸551~651(両端を含む)のあいだのアミノ酸から始まり、アミノ酸1368で終わることを意味する。例えば、分割Cas9のC末端部分は、spCas9のアミノ酸551-1368、552-1368、553-1368、554-1368、555-1368、556-1368、557-1368、558-1368、559-1368、560-1368、561-1368、562-1368、563-1368、564-1368、565-1368、566-1368、567-1368、568-1368、569-1368、570-1368、571-1368、572-1368、573-1368、574-1368、575-1368、576-1368、577-1368、578-1368、579-1368、580-1368、581-1368、582-1368、583-1368、584-1368、585-1368、586-1368、587-1368、588-1368、589-1368、590-1368、591-1368、592-1368、593-1368、594-1368、595-1368、596-1368、597-1368、598-1368、599-1368、600-1368、601-1368、602-1368、603-1368、604-1368、605-1368、606-1368、607-1368、608-1368、609-1368、610-1368、611-1368、612-1368、613-1368、614-1368、615-1368、616-1368、617-1368、618-1368、619-1368、620-1368、621-1368、622-1368、623-1368、624-1368、625-1368、626-1368、627-1368、628-1368、629-1368、630-1368、631-1368、632-1368、633-1368、634-1368、635-1368、636-1368、637-1368、638-1368、639-1368、640-1368、641-1368、642-1368、643-1368、644-1368、645-1368、646-1368、647-1368、648-1368、649-1368、650-1368、または651-1368のいずれか1つの部分を含み得る。いくつかの実施形態において、分割されたCas9タンパク質のC末端部分は、SpCas9のアミノ酸574-1368または638-1368の部分を含む。
「対象」とは、限定されるものではないが、ウシ、ウマ、イヌ、ヒツジまたはネコなどのヒトまたは非ヒト哺乳動物を含む哺乳動物を意味する。対象は、家畜、労働力を生じ食料などの商品を供給するために飼育される飼育動物を含み、ウシ、ヤギ、ニワトリ、ウマ、ブタ、ウサギ、およびヒツジを含むが、これらに限定されない。
「実質的に同一である」とは、参照アミノ酸配列(例えば本明細書に記載のアミノ酸配列のいずれか1つ)または核酸配列(例えば本明細書に記載の核酸配列のいずれか1つ)に対して少なくとも50%の同一性を示すポリペプチドまたは核酸分子を意味する。一実施形態において、そのような配列は、比較のために使用される配列とアミノ酸レベルまたは核酸において少なくとも60%、80%または85%、90%、95%または99%までもの同一性を有する。
配列同一性は、典型的には、配列解析ソフトウェア(例えば、Genetics Computer Group, University of Wisconsin Biotechnology Center, 1710 University Avenue, Madison, Wis. 53705のSequence Analysis Software Package、BLAST、BESTFIT、GAP、またはPILEUP/PRETTYBOXプログラム)を用いて測定される。そのようなソフトウェアは、種々の置換、欠失、および/または他の改変に相同性の程度を割り当てることによって、同一または類似の配列をマッチさせる。保存的置換は、典型的には、以下の群内の置換を含む:グリシン、アラニン;バリン、イソロイシン、ロイシン;アスパラギン酸、グルタミン酸、アスパラギン、グルタミン;セリン、トレオニン;リジン、アルギニン;フェニルアラニン、チロシン。同一性の程度を決定するための例示的なアプローチにおいて、BLASTプログラムを使用することができ、e-3とe-100の間の確率スコアが密接に関連した配列を示す。COBALTは、たとえば次のパラメータとともに使用される:
a) アラインメントパラメータ:Gap penalties-11,-1 and End-Gap penalties-5,-1,
b) CDDパラメータ:Use RPS BLAST on; Blast E-value 0.003; Find Conserved columns and Recompute on
c) クエリー・クラスタリング・パラメータ:Use query clusters on; Word Size 4; Max cluster distance 0.8; Alphabet Regular。
EMBOSS Needleは、たとえば次のパラメータで使用される。
a) Matrix: BLOSUM62;
b) GAP OPEN: 10;
c) GAP EXTEND: 0.5;
d) OUTPUT FORMAT: pair;
e) END GAP PENALTY: false;
f) END GAP OPEN: 10; and
g) END GAP EXTEND: 0.5.
用語「標的部位」とは、核酸分子内の配列であって、核酸塩基エディターによって改変される配列をいう。一実施形態において、標的部位は、デアミナーゼまたはデアミナーゼ(例えばアデニンデアミナーゼ)を含む融合タンパク質により脱アミノ化される。
本明細書中で使用される、用語「治療する(treat)」、「治療する(treating)」、「治療(treatment)」などは、障害および/またはそれに関連する症状を軽減もしくは改善すること、または所望の薬理学的および/または生理学的効果を得ることを指す。障害または状態を治療することは、関連する障害、状態または症状を完全に除去することを必要としないことが理解されるであろう(完全な除去が除外されるわけでもない)。いくつかの実施形態において、効果は、治療的であり、すなわち、限定されるものではないが、効果は、疾患および/またはそれに起因する有害症状を部分的または完全に低減、減少、除去、軽減、緩和、強度低下、または治癒する。いくつかの実施形態において、効果は予防的であり、すなわち効果は、疾患または状態の発生または再発を保護または予防する。この目的のために、本開示の方法は、本明細書に記載されるような治療的に有効な量の組成物を投与することを含む。
「ウラシルグリコシラーゼ阻害因子」、あるいは「UGI」とは、ウラシル除去修復系を阻害する因子を意味する。一実施形態において、該因子は、宿主ウラシル-DNAグリコシラーゼに結合してDNAからのウラシル残基の除去を妨げるタンパク質またはその断片である。ある実施形態において、UGIは、ウラシル-DNAグリコシラーゼ塩基除去修復酵素を阻害することができるタンパク質、その断片、またはドメインである。いくつかの実施形態において、UGIドメインは、野生型UGIまたはその改変バージョンを含む。いくつかの実施形態において、UGIドメインは、下記に提示される例示的アミノ酸配列の断片を含む。いくつかの実施形態において、UGI断片は、下記に提供される例示的UGI配列の少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%を含むアミノ酸配列を含む。いくつかの実施形態において、UGIは、以下に記載されるように、例示的UGIアミノ酸配列またはその断片に対して相同的なアミノ酸配列を含む。いくつかの実施形態において、UGIまたはその一部は、以下に記載されるように、野生型UGIもしくUGI配列またはその一部に対して少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、少なくとも99.5%、少なくとも99.9%または100%の同一性を有する。例示的なUGIは、以下のアミノ酸配列を含む:
>splP14739IUNGI_BPPB2 Uracil-DNA glycosylase inhibitor
MTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSD APEYKPWALVIQDSNGENKIKML.
用語「ベクター」は、核酸配列を細胞に導入して形質転換細胞を結果としてもたらす手段を指す。ベクターとしては、プラスミド、トランスポゾン、ファージ、ウイルス、リポソーム、およびエピソームが挙げられる。「発現ベクター」は、レシピエント細胞において発現されるべきヌクレオチド配列を含む核酸配列である。発現ベクターは、導入された配列の発現を促進するかつ/または促すための追加の核酸配列、例えば、開始、終止、エンハンサー、プロモーター、および分泌配列を含み得る。
本明細書に提供される組成物または方法は、本明細書に提供される他の組成物および方法の1つ以上と組み合わせることができる。
DNA編集は、遺伝子レベルで病原性突然変異を補正することによって病状を変化させるための実行可能な手段として登場した。最近まで、全てのDNA編集プラットフォームは、特定のゲノム部位でDNA二本鎖切断(DSB)を誘導すること、および内因性DNA修復経路に依存して産物アウトカムを半確率的な様式で決定することによって機能し、複雑な遺伝子産物集団を生じさせている。正確な、ユーザー定義の修復アウトカムは、相同性誘導型修復(HDR)経路を介して達成され得るが、多くの課題によって、治療上関連のある細胞型におけるHDRを使用しての効率の高い修復は妨げられている。実際には、この経路は、競合的な、エラープローン非相同末端結合経路と比較して不十分である。さらに、HDRは、細胞周期のG1期およびS期に厳しく限定されており、これが、有糸分裂後細胞におけるDSBの正確な修復を妨げている。結果として、これらの集団においてゲノム配列を、ユーザー定義のプログラム可能な様式で、高い効率で改変することが困難であるかまたは不可能であることが証明されている。
プラスミドを示す図である。図1Aは、TadA7.10-dCas9塩基エディターをコードする発現ベクターである。図1Bは、クロラムフェニコール耐性(CamR)およびスペクチノマイシン耐性(SpectR)を付与するタンパク質をコードする核酸分子を含むプラスミドである。このプラスミドはまた、2つの点突然変異によって無効とされたカナマイシン耐性遺伝子を含む。図1Cは、クロラムフェニコール耐性(CamR)およびスペクチノマイシン耐性(SpectR)を付与するタンパク質をコードする核酸分子を含むプラスミドである。このプラスミドはまた、3つの点突然変異によって無効とされたカナマイシン耐性遺伝子を含む。 指向的進化を介するアデニンデアミナーゼ(TadA)の選択を示す図である。図2Aは、プロトスペーサーおよびPAM配列を有するゲノムDNAで使用するための、ガイドRNAおよびデアミナーゼ(例えばTadA)を有する塩基エディターを示す概略図である。図2Bは、指向的進化を介するアデニンデアミナーゼ(TadA)選択を示す概略図である。図2Cは、欠陥のあるカナマイシン耐性遺伝子を含む図1A~1Cで示された発現ベクターで形質導入された細菌コロニーの画像である。このベクターはエラープローンPCRを使用して生成されたABE7.10バリアントを含有していた。これらの「進化した」ABE7.10バリアントを発現する細菌細胞を、増加濃度のカナマイシンを使用してカナマイシン耐性について選択した。アデノシンデアミナーゼ活性を有するABE7.10バリアントを発現する細菌は、カナマイシン耐性遺伝子に導入された突然変異を補正し、これによって、カナマイシン耐性を回復させることができた。カナマイシン耐性細胞を、さらなる分析に選択した。 胎児ヘモグロビンの上方調節について治療上関連のある部位であるヘモグロビンサブユニットガンマ(HGB1)遺伝子座の調節領域の編集を示す図である。図3Aは、HGB1遺伝子の調節領域の一部についての図である。図3Bは、表6に列挙したアデノシンデアミナーゼバリアントの効率および特異性を定量している。編集を、胎児ヘモグロビンの上方調節について治療上関連のある部位であるHEK293T細胞のヘモグロビンサブユニットガンマ1(HGB1)遺伝子座でアッセイした。上部のパネルは、HGB1遺伝子の調節配列の標的領域におけるヌクレオチド残基を示す。A5、A8、A9、およびA11は、HGB1における編集されたアデノシン残基を示す。 非カノニカルPAM配列を認識するdCas9を含むアデノシン塩基エディターの相対的有効性を示す図である。上部のパネルは、ヘモグロビンサブユニットのコード配列を示す。下部のパネルは、様々な長さのガイドRNAを有するアデノシンデアミナーゼバリアント塩基エディターの効率を示すグラフである。 ABE8の効率および特異性を示すグラフである。意図的な標的ヌクレオチドおよび非意図的な標的ヌクレオチド(バイスタンダー)での編集のパーセントが定量されている。 ABE8の効率および特異性を示すグラフである。意図的な標的ヌクレオチドおよび非意図的な標的ヌクレオチド(バイスタンダー)での編集のパーセントが定量されている。 第8世代のアデニン塩基エディターがヒト細胞においてA・TからG・Cへの優れた変換を媒介することを示す図である。図7Aは、アデニン塩基編集の概要を示している:i)ABE8は、ゲノム内のsgRNA標的部位でR-ループを生成する、ii)TadAデアミナーゼは、R-ループのss-DNA部分での加水分解による脱アミノ化を介して、アデニンをイノシンに化学的に変換する、iii)Cas9のD10Aニッカーゼは、イノシンを含有する鎖の向かいにある鎖にニックを挿入する、iv)イノシンを含有する鎖は、DNA複製の際に鋳型として使用され得る、v)イノシンは、DNAポリメラーゼの背景においてシトシンと優先的に塩基対を形成する、そしてvi)複製後、イノシンは、グアノシンによって置き換えられ得る。図7Bは、ABE8.x-mおよびABE8.x-dのアーキテクチャーを示す。ABE8.x-m/dの命名は、以下の通りである:ABE8は、ABE7.10進化キャンペーン(7回の進化の繰り返しが行われた(Gaudelli, N. M. et al. Programmable base editing of A*T to G*C in genomic DNA without DNA cleavage. Nature 551, 464-471, doi:10.1038/nature24644 (2017))を進めたもう1ラウンドの進化(ラウンド8)から開発されたアデニン塩基エディターである。ABE8.xの数値「x」は、どの突然変異が、対応するABE8エディターの進化したTadAプロモーターに含まれるかを示す。各数値は、表9において記載されている異なる突然変異セットを表す。「m」または「d」という指定は、ABE8構築物が、進化したTadAに連結したN末端野生型TadAを含有する(「d」)か、またはTadAの進化型バリアントのみを含有する(「m」)かを示す。図7Cは、TadA7.10のバックグラウンド突然変異の合成ライブラリーにおけるアミノ酸位置に対する、バリアントアミノ酸のパーセンテージを示すグラフである。図7Dは、tRNAArg2と複合したS. aureusのTadA(示されていない)(PDB 2B3J)とアラインした、E.coliのTadAデアミナーゼ(PDB 1Z3A)の3つの視点(すなわち、概要、活性部位、およびC末端のα-ヘリックス)を示す概略図である。第8ラウンドの進化において同定された突然変異が強調されている。ABE8の全体を通した鍵となる残基および活性部位が標識されている。C末端のアルファヘリックスの領域が強調されている。図7Eは、8つのゲノム部位にわたる、Hek293T細胞における、ABE7.10構築物と比較した、中心的なABE8構築物のA・TからG・Cへの塩基編集効率を示すグラフである。値および誤差のバーは、異なる日に行われた3つの独立した生物学的反復の平均およびs.d.を反映している。 Cas9 PAM-バリアントABE8および触媒不活Cas9 ABE8バリアントが、ヒト細胞において、対応するABE7.10バリアントよりも高いA・TからG・Cへの変換を媒介することを示す図である。値および誤差のバーは、異なる日に行われた3つの独立した生物学的反復の平均およびs.d.を反映している。ABE7.10およびABE8のエディター活性のウィンドウが示されている。数値は、プロトスペーサー内の位置を示している。標的DNA骨格内の誘導されたニックの位置が三角形によって示されており、また、対応するPAM認識配列が示されている。図8Aは、NG-Cas9 ABE8(-NG PAM)でのHek293T細胞におけるA・TからG・Cへの変換を示すグラフである。図8Bは、Sa-Cas9 ABE8(-NNGRRT PAM)でのHek293T細胞におけるA・TからG・Cへの変換を示すグラフである。図8Cは、触媒的に不活化されたdCas9-ABE8(D10A、S. pyogenesのCas9におけるH840A)でのHek293T細胞におけるA・TからG・Cへの変換を示すグラフである。 Hek293T細胞における、ABE7.10、ABEmax、および1つのBPNLSを有するABEmaxの間の、オンターゲットおよびオフターゲット編集の頻度の間の比較を示す図である。個々のデータポイントが示されており、誤差のバーは、異なる日に行われた、n=3またはn=4の独立した生物学的反復についてのs.d.を表す。図9Aおよび図9Bは、オンターゲットDNA編集の頻度を示すグラフである。図9Cおよび図9Dは、sgRNAによって誘導されたDNA-オフターゲット編集の頻度を示すグラフである。図9Eおよび図9Fは、RNAオフターゲット編集の頻度を示すグラフである。 HEK293T細胞におけるTadAのC末端でのアルファ-ヘリックストランケーションABE構築物のA・TからG・Cへの変換および対応するINDEL形成の中央値を示す図である。図10Aおよび図10Cは、8つのゲノム部位にわたるA・TからG・Cへの編集変換の中央値を示すヒートマップである。図10Bおよび図10Dは、INDEL形成を示すヒートマップである。デルタ残基の値は、TadA内での欠失位置に対応する。中央値は、n=3の生物学的反復から得た。 8つのゲノム部位にわたる、HEK293T細胞における40のABE8構築物のA・TからG・Cへの変換の中央値を示すヒートマップである。中央値は、n=3以上の生物学的反復から決定された。 8つのゲノム部位にわたる、HEK293T細胞における40のABE8構築物のINDEL%の中央値を示すヒートマップである。中央値は、2以上の生物学的反復から決定された。 ABE8:ABE7での、編集における倍の変化を示すグラフである。標的である8つの異なるゲノム部位内の全てのA位にわたる、ABE8:ABE7での、Hek293T細胞におけるA・TからG・Cへの編集の平均が表されている。位置2~12は、20位が-NGG PAMのすぐ5’である20ntのプロトスペーサー内の標的アデニンの位置を示す。 ABE8の系統樹を示す図である。さらなる研究に選択された中心的なABE8構築物が強調されている。 8つのゲノム部位にわたる、HEK293T細胞における中心的な8つのABE8構築物のA・TからG・Cへの変換の中央値を示すヒートマップである。中央値は、n=3以上の生物学的反復から決定された。 HEK293T細胞における8つのゲノム部位で試験した中心的な8つのABE8のINDEL頻度の中央値を示すヒートマップである。 HEK293T細胞における6つのゲノム部位での、中心的なNG-ABE8構築物(-NG PAM)のA・TからG・Cへの変換の中央値を示すヒートマップである。中央値は、n=3の生物学的反復から得た。 HEK293T細胞内の6つのゲノム部位で試験した中心的なNG-ABE8のINDEL頻度の中央値を示すヒートマップである。中央値は、n=3の生物学的反復から得た。 HEK293T細胞内の6つのゲノム部位での、中心的なSa-ABE8構築物(-NNGRRT PAM)のA・TからG・Cへの変換の中央値を示すヒートマップである。部位の位置は、22ntのプロトスペーサー内の-2から20(5'から3')まで番号付けされている。20位は、NNGRRT PAMの5’である。中央値は、n=3の生物学的反復から得た。 HEK293T細胞内の8つのゲノム部位で試験した中心的なSa-ABE8のINDEL頻度の中央値を示すヒートマップである。中央値は、n=3の生物学的反復から得た。 HEK293T細胞内の8つのゲノム部位での中心的なdC9-ABE8-m構築物のA・TからG・Cへの変換の中央値を示すヒートマップである。不活Cas9(dC9)は、S. pyogenesのCas9内のD10A突然変異およびH840A突然変異として定義される。中央値は、n≧3の生物学的反復から得た。 HEK293T細胞内の8つのゲノム部位での中心的なdC9-ABE8-d構築物のA・TからG・Cへの変換の中央値を示すヒートマップである。不活Cas9(dC9)は、S. pyogenesのCas9内のD10A突然変異およびH840A突然変異として定義される。中央値は、n≧3の生物学的反復から得た。 HEK293T細胞内の8つのゲノム部位で試験した中心的なdC9-ABE8のINDEL頻度の中央値を示す図である。中央値は、n≧3の生物学的反復から得られる。図23Aおよび図23Cは、ABE7.10と比較した、dC9-ABE8-mバリアントで示されたINDEL頻度を示すヒートマップである。図23Bおよび23Dは、ABE7.10と比較した、dC9-ABE8-dバリアントで示されたINDEL頻度を示すヒートマップである。 ABE8およびABE7.10で処置されたHek293T細胞でのC・GからT・Aへの編集を示す図である。図24(上部)は、標的内の全ての「C」位にわたって平均した、各部位での編集頻度を示す箱ひげ図である。プロトスペーサー内のシトシンは影を付けて示されている。箱の境界は、第1(下部)および第3(上部)四分位数を示し、一方、箱の中のバンドは中央値を示す。中央値からの四分位範囲(|Q3-Q1|)の1.5倍よりも大きい値は、外れ値としてマークされており、個別に示されている。ひげは、箱の端から、外れ値と見なされない最大値および最小値まで延びている。図24(下部)は、部位および標的DNA配列を示す表である。 ABE8構築物によるDNAオンターゲット編集およびsgRNA依存性のDNAオフターゲット編集、ならびに、DNAに対する特異性を向上させるための、TadA突然変異を有するABE8構築物を示す図である。個々のデータポイントが示されており、誤差のバーは、異なる日に行われた、n=3の独立した生物学的反復についてのs.d.を表す。図25Aおよび図25Bは、ABE7と比較した、中心的なABE8構築物についてのオンターゲットDNA編集頻度を示すグラフである。図25Cおよび図25Dは、RNAオフターゲット編集を向上させる4つのゲノム遺伝子座でのABE8の構築のためのオンターゲットDNA編集頻度を示すグラフである。図25Eおよび図25Fは、ABE7と比較した、ABE8構築物での、sgRNAによって誘導されたDNAオフターゲット編集の頻度を示すグラフである。図25Gおよび図25Hは、RNAオフターゲット編集を向上させることが分かっている既知のsgRNA依存性の遺伝子座でのABE8構築物でのオフターゲットDNA編集頻度を示すグラフである。 ヒト細胞における12のこれまでに同定されたsgRNA依存性のCas9オフターゲット遺伝子座でのインデル頻度を示すグラフである。個々のデータポイントが示されており、誤差のバーは、異なる日に行われた、n=3の独立した生物学的反復についてのs.d.を表す。 一次細胞におけるA・TからG・Cへの変換および表現型アウトカムを示す図である。図27Aは、HBG1/2のゲノム塩基編集部位を示す概略図である。図27Bは、2人の別個のドナーのABEで処置したCD34+細胞における-198 HBG1/2部位でのA・TからG・Cへの変換を示すグラフである。NGS分析を、処置後48時間および144時間に行った。A7で示された-198 HBG1/2標的配列が強調されている。A・TからG・CへのパーセントがA7についてプロットされている。図27Cは、ABEで処置した細胞に由来する赤血球における、α-グロビンの画分として形成されたγ-グロビンのパーセンテージを示すグラフである。ABE処置および赤血球分化後の、2人の異なるドナーの値が示されている。 HBG1/2の上流の-198プロモーター部位での、ABE8で処置したCD34+細胞のA・TからG・Cへの変換を示す図である。図28Aは、2人のドナーのCD34+細胞におけるABE8のAからGへの編集頻度を示すヒートマップであり、ドナー2は、エディター処置の48時間後および144時間後に、鎌状赤血球症についてヘテロ接合型である。図28Bは、A7のみの編集または組合せ(A7+A8)編集のいずれかを含有する全配列決定リードの分布のグラフ表示である。 ガンマ-グロビンプロモーターの-198部位での、ABE8で処置したCD34+細胞のINDEL頻度を示すヒートマップである。48時間および144時間の時点での2人のドナーの頻度が示されている。HBG1/2 -198プロモーター標的部位でのA・TからG・Cへの完全な変換によって、10ntのポリG鎖が生じる。このようなホモポリマーランは、PCRおよび配列決定によって誘発される誤差の割合を増加させ、この部位でのINDEL頻度の見かけの上昇を生じさせることが多い。 UHPLC UV-Visトレース(220nm)、および未処置の分化したCD34+細胞(ドナー1)のグロビン鎖の組み込みレベルを示す図である。 UHPLC UV-Visトレース(220nm)、およびABE7.10-mで処置した分化したCD34+細胞(ドナー1)のグロビン鎖の組み込みレベルを示す図である。 UHPLC UV-Visトレース(220nm)、およびABE7.10-dで処置した分化したCD34+細胞(ドナー1)のグロビン鎖の組み込みレベルを示す図である。 UHPLC UV-Visトレース(220nm)、およびABE8.8-mで処置した分化したCD34+細胞(ドナー1)のグロビン鎖の組み込みレベルを示す図である。 UHPLC UV-Visトレース(220nm)、およびABE8.8-dで処置した分化したCD34+細胞(ドナー1)のグロビン鎖の組み込みレベルを示す図である。 UHPLC UV-Visトレース(220nm)、およびABE8.13-mで処置した分化したCD34+細胞(ドナー1)のグロビン鎖の組み込みレベルを示す図である。 UHPLC UV-Visトレース(220nm)、およびABE8.13-dで処置した分化したCD34+細胞(ドナー1)のグロビン鎖の組み込みレベルを示す図である。 UHPLC UV-Visトレース(220nm)、およびABE8.17-mで処置した分化したCD34+細胞(ドナー1)のグロビン鎖の組み込みレベルを示す図である。 UHPLC UV-Visトレース(220nm)、およびABE8.17-dで処置した分化したCD34+細胞(ドナー1)のグロビン鎖の組み込みレベルを示す図である。 UHPLC UV-Visトレース(220nm)、およびABE8.20-mで処置した分化したCD34+細胞(ドナー1)のグロビン鎖の組み込みレベルを示す図である。 UHPLC UV-Visトレース(220nm)、およびABE8.20-dで処置した分化したCD34+細胞(ドナー1)のグロビン鎖の組み込みレベルを示す図である。 UHPLC UV-Visトレース(220nm)、および未処置の分化したCD34+細胞(ドナー2)のグロビン鎖の組み込みレベルを示す図である。注記:ドナー2は、鎌状赤血球症についてヘテロ接合型である。 UHPLC UV-Visトレース(220nm)、およびABE7.10-mで処置した分化したCD34+細胞(ドナー2)のグロビン鎖の組み込みレベルを示す図である。注記:ドナー2は、鎌状赤血球症についてヘテロ接合型である。 UHPLC UV-Visトレース(220nm)、およびABE7.10-dで処置した分化したCD34+細胞(ドナー2)のグロビン鎖の組み込みレベルを示す図である。注記:ドナー2は、鎌状赤血球症についてヘテロ接合型である。 UHPLC UV-Visトレース(220nm)、およびABE8.8-mで処置した分化したCD34+細胞(ドナー2)のグロビン鎖の組み込みレベルを示す図である。注記:ドナー2は、鎌状赤血球症についてヘテロ接合型である。 UHPLC UV-Visトレース(220nm)、およびABE8.8-dで処置した分化したCD34+細胞(ドナー2)のグロビン鎖の組み込みレベルを示す図である。注記:ドナー2は、鎌状赤血球症についてヘテロ接合型である。 UHPLC UV-Visトレース(220nm)、およびABE8.13-mで処置した分化したCD34+細胞(ドナー2)のグロビン鎖の組み込みレベルを示す図である。注記:ドナー2は、鎌状赤血球症についてヘテロ接合型である。 UHPLC UV-Visトレース(220nm)、およびABE8.13-dで処置した分化したCD34+細胞(ドナー2)のグロビン鎖の組み込みレベルを示す図である。注記:ドナー2は、鎌状赤血球症についてヘテロ接合型である。 UHPLC UV-Visトレース(220nm)、およびABE8.17-d(ドナー2、注記:ドナー2は、鎌状赤血球症についてヘテロ接合型である)(図48A)またはABE8.17-m(ドナー1)(図48B)で処置した分化したCD34+細胞のグロビン鎖の組み込みレベルを示す図である。 UHPLC UV-Visトレース(220nm)、およびABE8.20-dで処置した分化したCD34+細胞(ドナー2)のグロビン鎖の組み込みレベルを示す図である。注記:ドナー2は、鎌状赤血球症についてヘテロ接合型である。 UHPLC UV-Visトレース(220nm)、およびABE8.20-mで処置した分化したCD34+細胞(ドナー2)のグロビン鎖の組み込みレベルを示す図である。注記:ドナー2は、鎌状赤血球症についてヘテロ接合型である。 2つの独立した部位でのABE8.8での編集が、脱核前の赤血球分化後11日目に90%を超える編集に達し、および赤血球分化後18日目にアルファグロビンまたは総ベータファミリーグロビンに対して約60%のガンマグロビンを達成したことを示す図である。図51Aは、2つの独立した実験における2人の健康なドナーにおけるABE8.8編集の平均を示すグラフである。編集効率を、HBG1とHBG2とを区別するプライマーで測定した。図51Bは、2つの独立した実験における1人の健康なドナーの平均を示すグラフである。編集効率を、HBG1およびHBG2の両方を認識するプライマーで測定した。図51Cは、ヘテロ接合型E6V突然変異を有するドナーにおけるABE8.8の編集を示すグラフである。図51Dおよび図51Eは、ABE8.8を編集された細胞におけるガンマグロビンの増加を示すグラフである。 鎌状赤血球の突然変異を補正するためのABEバリアントを使用する編集のパーセントを示す図である。図52Aは、SCD患者の線維芽細胞における、約70%の編集を有する異なるエディターバリアントのスクリーニングを示すグラフである。図52Bは、編集ウィンドウ内に存在し、SCD突然変異の編集の代理として役立つ、隣接したプロリン内の同義突然変異A13を標的化する、リードABEバリアントで編集された健康なドナーのCD34細胞を示すグラフである。ABE8バリアントは、代理A13でおよそ40%の平均編集頻度を示した。 ABE処置に伴うRNAにおける細胞のAからIへの編集を検出するためのRNAアンプリコン配列決定を示す図である。個々のデータポイントが示されており、誤差のバーは、異なる日に行われた、n=3の独立した生物学的反復についてのs.d.を表す。図53Aは、ABE7およびCas9(D10A)ニッカーゼ対照と比較した、中心的なABE8構築物についての標的化されたRNAアンプリコンにおけるAからIへの編集頻度を示すグラフである。図53Bは、RNAオフターゲット編集を向上させることが報告されている突然変異を有するABE8についての、標的化されたRNAアンプリコンにおけるAからIへの編集頻度を示すグラフである。図53Cは、示された構築物で処置した細胞から単離された細胞mRNA試料における、最大レベルのAからIへの突然変異を示すグラフである。 第8世代のアデニン塩基エディターが、ヒト細胞においてA・TからG・Cへの優れた変換を媒介することを示す図である。図54Aおよび図54Bは、ABE8とABE7との間の、塩基編集における絶対的な変化および倍の変化を示す。8つの異なるゲノム部位の標的内の全ての「A」位にわたるHek293T細胞におけるABE8:ABE7のA・TからG・Cへの編集の平均が表されている。2~12位は、20位が-NGG PAMのすぐ5’である20ntのプロトスペーサー内の標的アデニンの位置を示す。各ポイントは、同一の部位および位置でのABE7.10エディターの中央値に対する比較として示されている(図54A)。各位置での編集における絶対差(ABE8-ABE7)が示されている(図54B)。ABE8:ABE7の編集の比が示されている。図54C(上部)は、ABE7.10およびABE8のエディター活性ウィンドウを示す概略図である。数値は、プロトスペーサー内の位置を示す。標的DNA骨格内の誘導されたニックの位置が三角形によって示されており、対応するPAM認識配列が示されている。図54C(下部)は、標的可能な部位であるABE7とABE8との比較を示すヒートマップである。各ボックスは、ABE7またはABE8で標的化され得る、ClinVarデータベース(Landrum, M. J. et al. ClinVar: public archive of interpretations of clinically relevant variants. Nucleic Acids Res 44, D862-868, doi:10.1093/nar/gkv1222 (2016)、Landrum, M. J. et al. ClinVar: public archive of relationships among sequence variation and human phenotype. Nucleic Acids Res 42, D980-985, doi:10.1093/nar/gkt1113 (2014))における病原性のG→AまたはC→T SNVバリアントの数値およびパーセンテージを示す。分析は、20ntのプロトスペーサー配列、およびNGGまたはNGA PAMを標的化し得るCas9を考慮している。編集ウィンドウは、ABE7では5~7、ABE8では4~8と仮定された。正確な補正は、少なくとも1つの考えられるスペーサー/PAMの組合せにおいて、特定のウィンドウ内で、病原性の突然変異のみが編集可能であったことを示唆している。全ての考えられる補正戦略が他の修飾された塩基を伴う場合、対応するバリアントは、「バイスタンダーを有する」カテゴリーにカウントされる。 プラスミドまたはmRNA送達を使用する、ABE8構築物によるDNAオンターゲット塩基編集、sgRNA依存性のDNAオフターゲット塩基編集、およびsgRNA非依存性のオフターゲットmRNA編集を示す図である。図55Aおよび図55Bは、ABE7と比較した、中心的なABE8構築物についてのオンターゲットDNA編集頻度を示すヒートマップである。構築物はプラスミドとして(図55A)、およびmRNAとして(図55B)送達された。図55Cおよび図55Dは、ABE8と比較した、ABE8についてのsgRNA依存性のオフターゲットDNA編集頻度を示すヒートマップである。構築物は、プラスミドとして(図55C)、およびmRNAとして(図55D)送達された。図55Eは、示されたアンプリコンの125ntの領域において測定されたAからGへの最大編集頻度を示すヒートマップである。構築物は、プラスミドとして(左)、およびmRNAとして(右)送達された。 中央値は、図55Dおよび図55E(右側)以外において、異なる日に行われたn=3またはn=4の独立した生物学的反復について示されており、図55Dでは、一部の試料で<5,000Miseqのリードが得られて排除され(具体的には、HEK4OT3(ABE7.10-d n=1およびABE8.13-m n=2)、ならびにHEK4OT4(ABE8.13-d、ABE8.17-d、ABE8.20-m、およびABE8.20-d n=2))、図55E(右側)では、CTNNB1について、ABE8.8-m:n=2であった。 ABE8ガイド非依存性のDNAオフターゲット分析を示す概略図である。 全ゲノム配列決定に送られた各試料についての突然変異分類プロットを示す図である。全ての全ゲノム配列決定された試料における突然変異型の分布。塩基エディターが生じさせるタイプの突然変異に有意に富んでいた試料は、**で示されている。エディターが生じさせるタイプの突然変異が有意に少ない試料は、で示されている。 塩基エディターmRNAで処置した細胞の全トランスクリプトームおよび全ゲノム配列決定のデータを示すグラフである。各エディターについて、オッズ比は、未処理対照と比較した、各処置の反復におけるエディター誘導型の突然変異型(BE4ではCからT、および他ではAからG)ならびに全ての他の突然変異型についての突然変異頻度における倍の変化を定量する。[***]は、処置群と未処置対照群との間での片側のマン・ホイットニーのU検定での有意なp値(<0.05)を示す。 全ゲノム配列決定の前にB2M陽性細胞およびB2M陰性細胞をフローソーティングするために使用されるゲートの代表例を示す図である。図59Aは、未処置の状態について単細胞クローン内にソートされた、生存したB2M陽性HEK293T細胞の代表的なプロットおよびゲートを示す。図59Bは、全ての処置された状態(ABE、CBE、またはCas9処置細胞)についてソートされた、生存したB2M陰性HEK293T細胞の代表的なプロットおよびゲートを示す。 HEK293T細胞内の8つの異なるゲノム部位にわたる、ABEによって生じるアリルを示すグラフである。 ヒト細胞における、12のこれまでに同定されたsgRNA依存性Cas9オフターゲット遺伝子座でのINDEL頻度の中央値を示すヒートマップを示す図である。示されているデータは、異なる日に行われたn=3の独立した生物学的反復の中央値である。構築物は、プラスミド送達を使用してHEK293T細胞に投与された。 NRNN PAMについての全ての考えられるPAMへの接近についてCas9バリアントを示す表である。それらのPAMにおける3つ以下の規定されたヌクレオチドの認識を必要とするCas9バリアントのみが列挙されている。非G PAMバリアントとしては、SpCas9-NRRH、SpCas9-NRTH、およびSpCas9-NRCHが含まれる。
本開示は、増加した効率を有する新規のアデニン塩基エディター(例えばABE8)を含む組成物、および標的核酸塩基配列において修飾を生じさせるためにこれらを使用する方法を提供する。
[核酸塩基エディター]
ポリヌクレオチドの標的ヌクレオチド配列を編集、修飾または改変するための塩基エディターまたは核酸塩基エディターが本明細書に開示される。本明細書に記載されるのは、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインおよび核酸塩基編集ドメインを含む核酸塩基エディターまたは塩基エディターである。(例えば、アデノシンデアミナーゼ)ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、結合されたガイドポリヌクレオチド(例えばgRNA)と一緒である場合に、(結合されたガイド核酸の塩基と標的ポリヌクレオチド配列の塩基との間の相補的塩基対形成を介して)標的ポリヌクレオチド配列に特異的に結合することができ、それによって、編集されることが所望される標的核酸配列に塩基エディターを局在化させることができる。いくつかの実施形態では、標的ポリヌクレオチド配列は一本鎖DNAまたは二本鎖DNAを含む。いくつかの実施形態では、標的ポリヌクレオチド配列はRNAを含む。いくつかの実施形態では、標的ポリヌクレオチド配列はDNA-RNAハイブリッドを含む。
[ポリヌクレオチドプログラミング可能なヌクレオチド結合ドメイン]
ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインはまた、RNAに結合する核酸プログラム可能タンパク質を含むことができることを理解されたい。例えば、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインをRNAにガイドする核酸と結合され得る。他の核酸プログラム可能DNA結合タンパク質もまた、本開示の範囲内にあるが、それらは本開示には特に列記されていない。
塩基エディターのポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、それ自体が1つ以上のドメインを含むことができる。例えば、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、1つ以上のヌクレアーゼドメインを含むことができる。いくつかの実施形態において、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインのヌクレアーゼドメインは、エンドヌクレアーゼまたはエキソヌクレアーゼを含むことができる。本明細書において、用語「エキソヌクレアーゼ」は、核酸(例えばRNAまたはDNA)を遊離末端から消化することができるタンパク質またはポリペプチドを指し、用語「エンドヌクレアーゼ」は、核酸(例えばDNAまたはRNA)の内部領域を触媒(例えば劈開)することができるタンパク質またはポリペプチドを指す。いくつかの実施形態において、エンドヌクレアーゼは、二本鎖核酸の一本鎖を切断することができる。いくつかの実施形態において、エンドヌクレアーゼは、二本鎖核酸分子の両方の鎖を切断することができる。いくつかの実施形態において、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、デオキシリボヌクレアーゼであり得る。いくつかの実施形態において、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、リボヌクレアーゼであり得る。
いくつかの実施形態において、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインのヌクレアーゼドメインは、標的ポリヌクレオチドの0本、1本または2本の鎖を切断することができる。いくつかの実施形態において、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、ニッカーゼドメインを含むことができる。本明細書において、用語「ニッカーゼ」は、二本鎖核酸分子(例えばDNA)中の二本鎖の一方の鎖のみを切断することができるヌクレアーゼドメインを含むポリヌクレオチドプログラム可能ヌクレオチド結合ドメインを指す。いくつかの実施形態において、ニッカーゼは、活性なポリヌクレオチドプログラム可能ヌクレオチド結合ドメインに一つ以上の突然変異を導入することによって、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインの完全に触媒活性な(例えば天然の)形態から誘導することができる。例えば、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインがCas9に由来するニッカーゼドメインを含む場合、Cas9に由来するニッカーゼドメインは、D10A突然変異および位置840におけるヒスチジンを含むことができる。そのような実施形態において、残基H 840は触媒活性を保持し、それによって核酸二本鎖の一本鎖を切断することができる。別の例において、Cas9由来ニッカーゼドメインは、H840A突然変異を含むことができ、一方、位置10におけるアミノ酸残基は、Dのままである。いくつかの実施形態において、ニッカーゼは、ニッカーゼ活性に必要ではないヌクレアーゼドメインの全部または一部を除去することによって、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインの完全に触媒活性な(例えば天然の)形態から誘導することができる。例えば、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインがCas9に由来するニッカーゼドメインを含む場合、Cas9に由来するニッカーゼドメインは、RuvCドメインまたはHNHドメインの全部または一部の欠失を含むことができる。
例示的な触媒活性Cas9のアミノ酸配列は以下の通りである:
MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
したがって、ニッカーゼドメインを含むポリヌクレオチドプログラム可能なヌクレオチド結合ドメインを含む塩基エディターは、特定のポリヌクレオチド標的配列(例えば結合したガイド核酸の相補的配列によって決定される)において一本鎖DNA切断(ニック) を生成することができる。いくつかの実施形態において、ニッカーゼドメイン(例えばCas9由来のニッカーゼドメイン)を含む塩基エディターによって切断される核酸二本鎖標的ポリヌクレオチド配列の鎖は、塩基エディターによって編集されない鎖である(すなわち、塩基エディターによって切断される鎖は、編集される塩基を含む鎖とは反対の鎖である)。他の実施形態において、ニッカーゼドメイン(例えばCas9由来のニッカーゼドメイン)を含む塩基エディターは、編集のために標的とされるDNA分子の鎖を切断することができる。このような実施形態において、非標的鎖は切断されない。
触媒的に死んだ(すなわち標的ポリヌクレオチド配列を切断することができない)ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインを含む塩基エディターも本明細書中に提供される。本明細書において、用語「触媒的に死んだ」および「ヌクレアーゼ不活」は、核酸の鎖を切断することができない結果となる一つ以上の突然変異および/または欠失を有するポリヌクレオチドプログラム可能ヌクレオチド結合ドメインを指すために交換可能に使用される。いくつかの実施形態において、触媒的に死んだポリヌクレオチドプログラム可能ヌクレオチド結合ドメイン塩基エディターは、1つ以上のヌクレアーゼドメインにおける特定の点突然変異の結果としてヌクレアーゼ活性を欠くことができる。例えば、Cas9ドメインを含む塩基エディターの場合、Cas9は、D10A突然変異およびH840A突然変異の両方を含むことができる。このような変異は両方のヌクレアーゼドメインを不活性化し、その結果ヌクレアーゼ活性を失う。他の実施形態において、触媒的に死んだポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、触媒ドメイン(例えばRuvC1および/またはHNHドメイン)の全部又は一部の一つ以上の欠失を含むことができる。さらなる実施形態において、触媒的に死んだポリヌクレオチドプログラム可能ヌクレオチド結合ドメインは、点突然変異(例えばD10AまたはH840A)ならびにヌクレアーゼドメインの全部または一部の欠失を含む。
また、本明細書では、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインの以前に機能していたバージョンから、触媒的に死んだポリヌクレオチドプログラム可能ヌクレオチド結合ドメインを生成することができる突然変異も企図される。例えば、触媒的に死んだCas9 (「dCas9」) の場合、D10AおよびH840A以外の突然変異を有してヌクレアーゼ不活性化Cas9をもたらすバリアントが提供される。このような突然変異は、例えば、D10およびH840における他のアミノ酸置換、またはCas9のヌクレアーゼドメイン内の他の置換(例えば、HNHヌクレアーゼサブドメインおよび/またはRuvC1サブドメインにおける置換)を含む。さらなる適切なヌクレアーゼ不活性dCas9ドメインは、本開示および当該分野における知識に基づいて当業者に明らかとなり得、本開示の範囲内である。このようなさらなる例示的な適切なヌクレアーゼ不活性Cas9ドメインには、限定されるものではないが、D10A/H840A、D10A/D839A/H840A、およびD10A/D839A/H840A/N863A突然変異体ドメインが含まれる(例えば、Prashant et al., CAS9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering. Nature Biotechnology. 2013; 31(9): 833-838を参照されたい (その全内容は参照により本明細書に組み込まれる))。
塩基エディターに組み込むことができるポリヌクレオチドプログラム可能ヌクレオチド結合ドメインの非限定的な例としては、CRISPRタンパク質由来ドメイン、制限ヌクレアーゼ、メガヌクレアーゼ、TALヌクレアーゼ (TALEN) 、およびジンクフィンガーヌクレアーゼ (ZFN) が挙げられる。いくつかの実施形態において、塩基エディターは、核酸のCRISPR (すなわちClustered Regularly Interspaced Short Palindromic Repeats)媒介修飾の際に、結合ガイド核酸を介して核酸配列に結合することができる天然もしくは修飾されたタンパク質またはその一部を含むポリヌクレオチドプログラム可能ヌクレオチド結合ドメインを含む。そのようなタンパク質は、本明細書において「CRISPRタンパク質」と呼ばれる。従って、本明細書に開示されているのは、CRISPRタンパク質の全部または一部を含むポリヌクレオチドプログラム可能ヌクレオチド結合ドメインを含む塩基エディター(すなわち、CRISPRタンパク質の全部または一部をドメインとして含む塩基エディター(それは塩基エディターの「CRISPRタンパク質由来ドメイン」とも呼ばれる))である。塩基エディターに組み込まれたCRISPRタンパク質由来ドメインは、野生型または天然型のCRISPRタンパク質と比較して改変され得る。例えば、以下に記載するように、CRISPRタンパク質由来ドメインは、野生型または天然型のCRISPRタンパク質と比較して、1以上の突然変異、挿入、欠失、再配列および/または組換えを含み得る。
CRISPRは、可動遺伝要素(ウイルス、転移因子、接合プラスミド)に対する防御を提供する適応免疫系である。CRISPRクラスターは、スペーサー、先行する可動要素に相補的な配列、および標的侵入核酸を含む。CRISPRクラスターは転写され、CRISPR RNA (crRNA) にプロセシングされる。II型CRISPRシステムでは、pre‐crRNAの正しいプロセシングはトランスコード小RNA (tracrRNA)、内因性リボヌクレアーゼ3 (rnc) 、およびCas9タンパク質を必要とする。tracrRNAはリボヌクレアーゼ3によるpre-crRNAのプロセシングのガイドとなる。続いて、Cas9/crRNA/tracrRNAが、スペーサーに相補的な線状または環状のdsDNA標的をエンドヌクレアーゼで切断する。crRNAに相補的でない標的鎖は、最初にエンドヌクレアーゼ的に切断され、次にエキソヌクレアーゼ的に3’-5’にトリムされる。自然界では、DNA結合と切断にはタンパク質と両方のRNAが必要である。しかしながら、crRNAおよびtracrRNAの両方の側面を単一のRNA種に組み込むように、単一ガイドRNA (「sgRNA」、あるいは単に「gRNA」)を作製することができる。例えばJinek M., Chylinski K., Fonfara I., Hauer M., Doudna J. A., Charpentier E. Science 337:816-821(2012)を参照されたい(その内容全体が参照により本明細書に組み入れられる)。Cas9は、CRISPR反復配列中の短いモチーフ(PAMまたはプロトスペーサー隣接モチーフ)を認識して、「自己」と「非自己」を区別することを助ける。
いくつかの実施形態において、本明細書に記載される方法は、組み換え操作された(engineered)Casタンパク質を利用することができる。ガイドRNA (gRNA) は、Cas結合に必要な足場配列と、修飾されるゲノム標的を規定するユーザー定義の約20塩基スペーサーとからなる短い合成RNAである。したがって、当業者はCasタンパク質特異性のゲノム標的を変化させることができ、これは、ゲノムの他の部分と比較してgRNA標的化配列がゲノム標的に対していかに特異的であるかによって部分的に決定される。
いくつかの実施形態において、gRNA足場配列は以下の通りである:
GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU
いくつかの実施形態において、塩基エディターに組み込まれたCRISPRタンパク質由来ドメインは、結合ガイド核酸と組み合わせられた場合に標的ポリヌクレオチドに結合することができるエンドヌクレアーゼ(例えばデオキシリボヌクレアーゼまたはリボヌクレアーゼ)である。いくつかの実施形態において、塩基エディターに組み込まれたCRISPRタンパク質由来ドメインは、結合ガイド核酸と組み合わせられた場合に標的ポリヌクレオチドに結合することができるニッカーゼである。いくつかの実施形態において、塩基エディターに組み込まれたCRISPRタンパク質由来ドメインは、結合ガイド核酸と組み合わせられた場合に標的ポリヌクレオチドに結合することができる触媒的に死んだドメインである。いくつかの実施形態において、塩基エディターのCRISPRタンパク質由来ドメインに結合する標的ポリヌクレオチドはDNAである。いくつかの実施形態において、塩基エディターのCRISPRタンパク質由来ドメインに結合する標的ポリヌクレオチドはRNAである。
本明細書中で用いることができるCAsタンパク質は、クラス1およびクラス2を含む。Casタンパク質の非限定的な例としては、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5d、Cas5t、Cas5h、Cas5a、Cas6、Cas7、Cas8、Cas9(Csn1またはCsx12とも呼ばれる)、Cas10、Csy1、Csy2、Csy3、Csy4、Cse1、Cse2、Cse3、Cse4、Cse5、Csn1、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Cssx16、Cx16、Cx、Csx3、Csx1、Csx1S、Csf1、Csf2、CsO、Csf4、Csd1、Csd2、Cst1、Cst2、Csh1、Csh2、Csa1、Csa2、Csa3、Csa4、Csa5、Cas12a/Cpf1、Cas12b/C2c1、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、およびCas12i、CARF、DinG、それらのホモログ、またはそれらの改変体が挙げられる。未改変のCRISPR酵素は、Cas9のように、2つの機能性エンドヌクレアーゼ領域、RuvCおよびHNHを有するDNA切断活性を有することができる。CRISPR酵素は、標的配列内および/または標的配列の相補鎖内などの標的配列において、一方または両方の鎖の切断を誘導することができる。例えば、CRISPR酵素は、標的配列の最初または最後のヌクレオチドから約1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、200、500塩基対またはそれ以上にある一方または両方の鎖の切断を誘導することができる。
標的配列を含む標的ポリヌクレオチドの一方または両方の鎖を切断する能力を欠失するように、対応する野生型酵素に対して変異されたCRISPR酵素をコードするベクターを用いることができる。Cas9は、野生型の例示的なCas9ポリペプチド(例えばS. pyogenesからのCas9)と少なくとも、または少なくともおよそ、50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性および/または配列相同性を有するポリペプチドを指すことができる。Cas9は、野生型の例示的なCas9ポリペプチド(例えばS.pyogenesからのもの)に対して、最大で、または最大でおよそ、約50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性および/または配列相同性を有するポリペプチドを指すことができる。Cas9は、野生型、または欠失、挿入、置換、バリアント、突然変異、融合、キメラ、またはそれらの任意の組合せなどのアミノ酸変化を含み得るCas9タンパク質の改変型を指すことができる。
いくつかの実施形態において、塩基エディターのCRISPRタンパク質由来ドメインは、Corynebacterium ulcerans (NCBI Refs: NC_015683.1, NC_017317.1); Corynebacterium diphtheria (NCBI Refs: NC_016782.1, NC_016786.1); Spiroplasma syrphidicola (NCBI Ref: NC_021284.1); Prevotella intermedia (NCBI Ref: NC_017861.1); Spiroplasma taiwanense (NCBI Ref: NC_021846.1); Streptococcus iniae (NCBI Ref: NC_021314.1); Belliella baltica (NCBI Ref: NC_018010.1); Psychroflexus torquis (NCBI Ref: NC_018721.1); Streptococcus thermophilus (NCBI Ref: YP_820832.1); Listeria innocua (NCBI Ref: NP_472073.1); Campylobacter jejuni (NCBI Ref: YP_002344900.1); Neisseria meningitidis (NCBI Ref: YP_002342100.1), Streptococcus pyogenes, または Staphylococcus aureus由来のCas9の全部または一部を含むことができる。
[核酸塩基エディターのCas9ドメイン]
Cas9ヌクレアーゼの配列および構造は、当業者によく知られている(例えば“Complete genome sequence of an Ml strain of Streptococcus pyogenes.”Ferretti et al., J.J., McShan W.M., Ajdic D.J., Savic D.J., Savic G., Lyon K., Primeaux C, Sezate S., Suvorov A.N., Kenton S., Lai H.S., Lin S.P., Qian Y., Jia H.G., Najar F.Z., Ren Q., Zhu H., Song L., White J., Yuan X., Clifton S.W., Roe B.A., McLaughlin R.E., Proc. Natl. Acad. Sci. U.S.A. 98:4658-4663(2001); “CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III.” Deltcheva E., Chylinski K., Sharma CM., Gonzales K., Chao Y., Pirzada Z.A., Eckert M.R., Vogel J., Charpentier E., Nature 471:602-607(2011); および “A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.” Jinek M., Chylinski K., Fonfara I., Hauer M., Doudna J.A., Charpentier E. Science 337:816-821(2012)参照。その内容全体が参照により本明細書に組み入れられる。)。Cas9オーソログは、限定されるものではないが、S.pyogenesおよびS.thermophilusを含む種々の種において記述されてきた。さらなる適切なCas9ヌクレアーゼおよび配列は、本開示に基づいて当業者に明らかとなり、そのようなCas9ヌクレアーゼおよび配列は、Chylinski, Rhun, and Charpentier, “The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems”(2013) RNA Biology 10:5, 726-737に開示されている生物および遺伝子座由来のCas9配列を含む。その全内容は参照により本明細書に組み込まれる。
いくつかの実施形態において、核酸プログラミング可能なDNA結合タンパク質 (napDNAbp) は、Cas9ドメインである。非限定的な例示的Cas9ドメインが本明細書で提供される。Cas9ドメインは、ヌクレアーゼ活性Cas9ドメイン、ヌクレアーゼ不活性Cas9ドメイン (dCas9)、またはCas9ニッカーゼ(nCas9) であり得る。いくつかの実施形態において、Cas9ドメインは、ヌクレアーゼ活性ドメインである。例えば、Cas9ドメインは、二本鎖核酸の両方の鎖(例えば二本鎖DNA分子の両方の鎖)を切断するCas9ドメインであり得る。いくつかの実施形態において、Cas9ドメインは、本明細書に記載のアミノ酸配列のいずれか1つを含む。いくつかの実施形態において、Cas9ドメインは、本明細書に記載されたアミノ酸配列のいずれか1つに対して少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。いくつかの実施形態において、Cas9ドメインは、本明細書に記載のアミノ酸配列のいずれか1つと比較して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50またはより多くの突然変異を有するアミノ酸配列を含む。いくつかの実施形態において、Cas9ドメインは、本明細書に記載されたアミノ酸配列のいずれか1つと比較して、少なくとも10、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも150、少なくとも200、少なくとも250、少なくとも300、少なくとも350、少なくとも400、少なくとも500、少なくとも600、少なくとも700、少なくとも800、少なくとも900、少なくとも1000、少なくとも1100、または少なくとも1200個の同一の一続きのアミノ酸残基を有するアミノ酸配列を含む。
いくつかの実施形態において、Cas9の断片を含むタンパク質が提供される。例えば、いくつかの実施形態において、タンパク質は、以下の2つのCas9ドメインのうちの1つを含む:(1) Cas9のgRNA結合ドメイン;または(2) Cas9のDNA切断ドメイン。いくつかの実施形態において、Cas9またはその断片を含むタンパク質は、「Cas9バリアント」と称される。Cas9バリアントは、Cas9またはその断片と相同性を共有する。例えば、Cas9バリアントは、野生型Cas9と少なくとも約70%の同一性、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一である。いくつかの実施形態において、Cas9変異体は、野生型Cas9と比較して、1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 21, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50またはそれ以上のアミノ酸変化を有し得る。いくつかの実施形態において、Cas9バリアントは、Cas9の断片(例えばgRNA結合ドメインまたはDNA切断ドメイン)を含み、その断片は、野生型Cas9の対応する断片と少なくとも約70%の同一性であり、少なくとも約80%同一であり、少なくとも約90%同一であり、少なくとも約95%同一であり、少なくとも約96%同一であり、少なくとも約97%同一であり、少なくとも約98%同一であり、少なくとも約99%同一であり、少なくとも約99.5%同一であり、または少なくとも約99.9%同一である。いくつかの実施形態において、断片は、対応する野生型Cas9のアミノ酸長の少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%同一、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%である。いくつかの実施形態において、断片は、長さが少なくとも100アミノ酸である。いくつかの実施形態において、断片は、少なくとも100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、または少なくとも1300アミノ酸の長さである。
いくつかの実施形態において、本明細書に提供されるCas9融合タンパク質は、Cas9タンパク質の全長アミノ酸配列、例えば、本明細書に提供されるCas9配列の1つを含む。しかしながら、他の実施形態において、本明細書に提供される融合タンパク質は、全長Cas9配列を含まず、その1つ以上の断片のみを含む。好適なCas9ドメインおよびCas9断片の例示的アミノ酸配列が本明細書に提供され、Cas9ドメインおよび断片のさらなる好適な配列は、当業者には明らかであろう。
Cas9タンパク質は、そのガイドRNAに相補的な特定のDNA配列にCas9タンパク質をガイドする、ガイドRNAと結合することができる。いくつかの実施形態において、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、Cas9ドメイン、例えばヌクレアーゼ活性Cas9、Cas9ニッカーゼ(nCas9) 、またはヌクレアーゼ不活性Cas9 (dCas9) である。核酸プログラム可能なDNA結合タンパク質の例としては、Cas9 (例:dCas9およびnCas9)、CasX、CasY、Cpfl、Cas12b/C2Cl、およびCas12c/C2C3が挙げられるが、これらに限定されない。
いくつかの実施形態において、野生型Cas9はStreptococcus pyogenesからのCas9(NCBI参照配列:NC_017053.1、以下のヌクレオチドおよびアミノ酸配列)に対応する。
ATGGATAAGAAATACTCAATAGGCTTAGATATCGGCACAAATAGCGTCGGATGGGCGGTGATCACTGATGATTATAAGGTTCCGTCTAAAAAGTTCAAGGTTCTGGGAAATACAGACCGCCACAGTATCAAAAAAAATCTTATAGGGGCTCTTTTATTTGGCAGTGGAGAGACAGCGGAAGCGACTCGTCTCAAACGGACAGCTCGTAGAAGGTATACACGTCGGAAGAATCGTATTTGTTATCTACAGGAGATTTTTTCAAATGAGATGGCGAAAGTAGATGATAGTTTCTTTCATCGACTTGAAGAGTCTTTTTTGGTGGAAGAAGACAAGAAGCATGAACGTCATCCTATTTTTGGAAATATAGTAGATGAAGTTGCTTATCATGAGAAATATCCAACTATCTATCATCTGCGAAAAAAATTGGCAGATTCTACTGATAAAGCGGATTTGCGCTTAATCTATTTGGCCTTAGCGCATATGATTAAGTTTCGTGGTCATTTTTTGATTGAGGGAGATTTAAATCCTGATAATAGTGATGTGGACAAACTATTTATCCAGTTGGTACAAATCTACAATCAATTATTTGAAGAAAACCCTATTAACGCAAGTAGAGTAGATGCTAAAGCGATTCTTTCTGCACGATTGAGTAAATCAAGACGATTAGAAAATCTCATTGCTCAGCTCCCCGGTGAGAAGAGAAATGGCTTGTTTGGGAATCTCATTGCTTTGTCATTGGGATTGACCCCTAATTTTAAATCAAATTTTGATTTGGCAGAAGATGCTAAATTACAGCTTTCAAAAGATACTTACGATGATGATTTAGATAATTTATTGGCGCAAATTGGAGATCAATATGCTGATTTGTTTTTGGCAGCTAAGAATTTATCAGATGCTATTTTACTTTCAGATATCCTAAGAGTAAATAGTGAAATAACTAAGGCTCCCCTATCAGCTTCAATGATTAAGCGCTACGATGAACATCATCAAGACTTGACTCTTTTAAAAGCTTTAGTTCGACAACAACTTCCAGAAAAGTATAAAGAAATCTTTTTTGATCAATCAAAAAACGGATATGCAGGTTATATTGATGGGGGAGCTAGCCAAGAAGAATTTTATAAATTTATCAAACCAATTTTAGAAAAAATGGATGGTACTGAGGAATTATTGGTGAAACTAAATCGTGAAGATTTGCTGCGCAAGCAACGGACCTTTGACAACGGCTCTATTCCCCATCAAATTCACTTGGGTGAGCTGCATGCTATTTTGAGAAGACAAGAAGACTTTTATCCATTTTTAAAAGACAATCGTGAGAAGATTGAAAAAATCTTGACTTTTCGAATTCCTTATTATGTTGGTCCATTGGCGCGTGGCAATAGTCGTTTTGCATGGATGACTCGGAAGTCTGAAGAAACAATTACCCCATGGAATTTTGAAGAAGTTGTCGATAAAGGTGCTTCAGCTCAATCATTTATTGAACGCATGACAAACTTTGATAAAAATCTTCCAAATGAAAAAGTACTACCAAAACATAGTTTGCTTTATGAGTATTTTACGGTTTATAACGAATTGACAAAGGTCAAATATGTTACTGAGGGAATGCGAAAACCAGCATTTCTTTCAGGTGAACAGAAGAAAGCCATTGTTGATTTACTCTTCAAAACAAATCGAAAAGTAACCGTTAAGCAATTAAAAGAAGATTATTTCAAAAAAATAGAATGTTTTGATAGTGTTGAAATTTCAGGAGTTGAAGATAGATTTAATGCTTCATTAGGCGCCTACCATGATTTGCTAAAAATTATTAAAGATAAAGATTTTTTGGATAATGAAGAAAATGAAGATATCTTAGAGGATATTGTTTTAACATTGACCTTATTTGAAGATAGGGGGATGATTGAGGAAAGACTTAAAACATATGCTCACCTCTTTGATGATAAGGTGATGAAACAGCTTAAACGTCGCCGTTATACTGGTTGGGGACGTTTGTCTCGAAAATTGATTAATGGTATTAGGGATAAGCAATCTGGCAAAACAATATTAGATTTTTTGAAATCAGATGGTTTTGCCAATCGCAATTTTATGCAGCTGATCCATGATGATAGTTTGACATTTAAAGAAGATATTCAAAAAGCACAGGTGTCTGGACAAGGCCATAGTTTACATGAACAGATTGCTAACTTAGCTGGCAGTCCTGCTATTAAAAAAGGTATTTTACAGACTGTAAAAATTGTTGATGAACTGGTCAAAGTAATGGGGCATAAGCCAGAAAATATCGTTATTGAAATGGCACGTGAAAATCAGACAACTCAAAAGGGCCAGAAAAATTCGCGAGAGCGTATGAAACGAATCGAAGAAGGTATCAAAGAATTAGGAAGTCAGATTCTTAAAGAGCATCCTGTTGAAAATACTCAATTGCAAAATGAAAAGCTCTATCTCTATTATCTACAAAATGGAAGAGACATGTATGTGGACCAAGAATTAGATATTAATCGTTTAAGTGATTATGATGTCGATCACATTGTTCCACAAAGTTTCATTAAAGACGATTCAATAGACAATAAGGTACTAACGCGTTCTGATAAAAATCGTGGTAAATCGGATAACGTTCCAAGTGAAGAAGTAGTCAAAAAGATGAAAAACTATTGGAGACAACTTCTAAACGCCAAGTTAATCACTCAACGTAAGTTTGATAATTTAACGAAAGCTGAACGTGGAGGTTTGAGTGAACTTGATAAAGCTGGTTTTATCAAACGCCAATTGGTTGAAACTCGCCAAATCACTAAGCATGTGGCACAAATTTTGGATAGTCGCATGAATACTAAATACGATGAAAATGATAAACTTATTCGAGAGGTTAAAGTGATTACCTTAAAATCTAAATTAGTTTCTGACTTCCGAAAAGATTTCCAATTCTATAAAGTACGTGAGATTAACAATTACCATCATGCCCATGATGCGTATCTAAATGCCGTCGTTGGAACTGCTTTGATTAAGAAATATCCAAAACTTGAATCGGAGTTTGTCTATGGTGATTATAAAGTTTATGATGTTCGTAAAATGATTGCTAAGTCTGAGCAAGAAATAGGCAAAGCAACCGCAAAATATTTCTTTTACTCTAATATCATGAACTTCTTCAAAACAGAAATTACACTTGCAAATGGAGAGATTCGCAAACGCCCTCTAATCGAAACTAATGGGGAAACTGGAGAAATTGTCTGGGATAAAGGGCGAGATTTTGCCACAGTGCGCAAAGTATTGTCCATGCCCCAAGTCAATATTGTCAAGAAAACAGAAGTACAGACAGGCGGATTCTCCAAGGAGTCAATTTTACCAAAAAGAAATTCGGACAAGCTTATTGCTCGTAAAAAAGACTGGGATCCAAAAAAATATGGTGGTTTTGATAGTCCAACGGTAGCTTATTCAGTCCTAGTGGTTGCTAAGGTGGAAAAAGGGAAATCGAAGAAGTTAAAATCCGTTAAAGAGTTACTAGGGATCACAATTATGGAAAGAAGTTCCTTTGAAAAAAATCCGATTGACTTTTTAGAAGCTAAAGGATATAAGGAAGTTAAAAAAGACTTAATCATTAAACTACCTAAATATAGTCTTTTTGAGTTAGAAAACGGTCGTAAACGGATGCTGGCTAGTGCCGGAGAATTACAAAAAGGAAATGAGCTGGCTCTGCCAAGCAAATATGTGAATTTTTTATATTTAGCTAGTCATTATGAAAAGTTGAAGGGTAGTCCAGAAGATAACGAACAAAAACAATTGTTTGTGGAGCAGCATAAGCATTATTTAGATGAGATTATTGAGCAAATCAGTGAATTTTCTAAGCGTGTTATTTTAGCAGATGCCAATTTAGATAAAGTTCTTAGTGCATATAACAAACATAGAGACAAACCAATACGTGAACAAGCAGAAAATATTATTCATTTATTTACGTTGACGAATCTTGGAGCTCCCGCTGCTTTTAAATATTTTGATACAACAATTGATCGTAAACGATATACGTCTACAAAAGAAGTTTTAGATGCCACTCTTATCCATCAATCCATCACTGGTCTTTATGAAACACGCATTGATTTGAGTCAGCTAGGAGGTGACTGA
Figure 2022520081000012
(一重下線:HNHドメイン;二重下線:RuvCドメイン)
いくつかの実施形態において、野生型Cas9は、以下のヌクレオチドおよび/またはアミノ酸配列に対応する、またはそれを含む:
ATGGATAAAAAGTATTCTATTGGTTTAGACATCGGCACTAATTCCGTTGGATGGGCTGTCATAACCGATGAATACAAAGTACCTTCAAAGAAATTTAAGGTGTTGGGGAACACAGACCGTCATTCGATTAAAAAGAATCTTATCGGTGCCCTCCTATTCGATAGTGGCGAAACGGCAGAGGCGACTCGCCTGAAACGAACCGCTCGGAGAAGGTATACACGTCGCAAGAACCGAATATGTTACTTACAAGAAATTTTTAGCAATGAGATGGCCAAAGTTGACGATTCTTTCTTTCACCGTTTGGAAGAGTCCTTCCTTGTCGAAGAGGACAAGAAACATGAACGGCACCCCATCTTTGGAAACATAGTAGATGAGGTGGCATATCATGAAAAGTACCCAACGATTTATCACCTCAGAAAAAAGCTAGTTGACTCAACTGATAAAGCGGACCTGAGGTTAATCTACTTGGCTCTTGCCCATATGATAAAGTTCCGTGGGCACTTTCTCATTGAGGGTGATCTAAATCCGGACAACTCGGATGTCGACAAACTGTTCATCCAGTTAGTACAAACCTATAATCAGTTGTTTGAAGAGAACCCTATAAATGCAAGTGGCGTGGATGCGAAGGCTATTCTTAGCGCCCGCCTCTCTAAATCCCGACGGCTAGAAAACCTGATCGCACAATTACCCGGAGAGAAGAAAAATGGGTTGTTCGGTAACCTTATAGCGCTCTCACTAGGCCTGACACCAAATTTTAAGTCGAACTTCGACTTAGCTGAAGATGCCAAATTGCAGCTTAGTAAGGACACGTACGATGACGATCTCGACAATCTACTGGCACAAATTGGAGATCAGTATGCGGACTTATTTTTGGCTGCCAAAAACCTTAGCGATGCAATCCTCCTATCTGACATACTGAGAGTTAATACTGAGATTACCAAGGCGCCGTTATCCGCTTCAATGATCAAAAGGTACGATGAACATCACCAAGACTTGACACTTCTCAAGGCCCTAGTCCGTCAGCAACTGCCTGAGAAATATAAGGAAATATTCTTTGATCAGTCGAAAAACGGGTACGCAGGTTATATTGACGGCGGAGCGAGTCAAGAGGAATTCTACAAGTTTATCAAACCCATATTAGAGAAGATGGATGGGACGGAAGAGTTGCTTGTAAAACTCAATCGCGAAGATCTACTGCGAAAGCAGCGGACTTTCGACAACGGTAGCATTCCACATCAAATCCACTTAGGCGAATTGCATGCTATACTTAGAAGGCAGGAGGATTTTTATCCGTTCCTCAAAGACAATCGTGAAAAGATTGAGAAAATCCTAACCTTTCGCATACCTTACTATGTGGGACCCCTGGCCCGAGGGAACTCTCGGTTCGCATGGATGACAAGAAAGTCCGAAGAAACGATTACTCCATGGAATTTTGAGGAAGTTGTCGATAAAGGTGCGTCAGCTCAATCGTTCATCGAGAGGATGACCAACTTTGACAAGAATTTACCGAACGAAAAAGTATTGCCTAAGCACAGTTTACTTTACGAGTATTTCACAGTGTACAATGAACTCACGAAAGTTAAGTATGTCACTGAGGGCATGCGTAAACCCGCCTTTCTAAGCGGAGAACAGAAGAAAGCAATAGTAGATCTGTTATTCAAGACCAACCGCAAAGTGACAGTTAAGCAATTGAAAGAGGACTACTTTAAGAAAATTGAATGCTTCGATTCTGTCGAGATCTCCGGGGTAGAAGATCGATTTAATGCGTCACTTGGTACGTATCATGACCTCCTAAAGATAATTAAAGATAAGGACTTCCTGGATAACGAAGAGAATGAAGATATCTTAGAAGATATAGTGTTGACTCTTACCCTCTTTGAAGATCGGGAAATGATTGAGGAAAGACTAAAAACATACGCTCACCTGTTCGACGATAAGGTTATGAAACAGTTAAAGAGGCGTCGCTATACGGGCTGGGGACGATTGTCGCGGAAACTTATCAACGGGATAAGAGACAAGCAAAGTGGTAAAACTATTCTCGATTTTCTAAAGAGCGACGGCTTCGCCAATAGGAACTTTATGCAGCTGATCCATGATGACTCTTTAACCTTCAAAGAGGATATACAAAAGGCACAGGTTTCCGGACAAGGGGACTCATTGCACGAACATATTGCGAATCTTGCTGGTTCGCCAGCCATCAAAAAGGGCATACTCCAGACAGTCAAAGTAGTGGATGAGCTAGTTAAGGTCATGGGACGTCACAAACCGGAAAACATTGTAATCGAGATGGCACGCGAAAATCAAACGACTCAGAAGGGGCAAAAAAACAGTCGAGAGCGGATGAAGAGAATAGAAGAGGGTATTAAAGAACTGGGCAGCCAGATCTTAAAGGAGCATCCTGTGGAAAATACCCAATTGCAGAACGAGAAACTTTACCTCTATTACCTACAAAATGGAAGGGACATGTATGTTGATCAGGAACTGGACATAAACCGTTTATCTGATTACGACGTCGATCACATTGTACCCCAATCCTTTTTGAAGGACGATTCAATCGACAATAAAGTGCTTACACGCTCGGATAAGAACCGAGGGAAAAGTGACAATGTTCCAAGCGAGGAAGTCGTAAAGAAAATGAAGAACTATTGGCGGCAGCTCCTAAATGCGAAACTGATAACGCAAAGAAAGTTCGATAACTTAACTAAAGCTGAGAGGGGTGGCTTGTCTGAACTTGACAAGGCCGGATTTATTAAACGTCAGCTCGTGGAAACCCGCCAAATCACAAAGCATGTTGCACAGATACTAGATTCCCGAATGAATACGAAATACGACGAGAACGATAAGCTGATTCGGGAAGTCAAAGTAATCACTTTAAAGTCAAAATTGGTGTCGGACTTCAGAAAGGATTTTCAATTCTATAAAGTTAGGGAGATAAATAACTACCACCATGCGCACGACGCTTATCTTAATGCCGTCGTAGGGACCGCACTCATTAAGAAATACCCGAAGCTAGAAAGTGAGTTTGTGTATGGTGATTACAAAGTTTATGACGTCCGTAAGATGATCGCGAAAAGCGAACAGGAGATAGGCAAGGCTACAGCCAAATACTTCTTTTATTCTAACATTATGAATTTCTTTAAGACGGAAATCACTCTGGCAAACGGAGAGATACGCAAACGACCTTTAATTGAAACCAATGGGGAGACAGGTGAAATCGTATGGGATAAGGGCCGGGACTTCGCGACGGTGAGAAAAGTTTTGTCCATGCCCCAAGTCAACATAGTAAAGAAAACTGAGGTGCAGACCGGAGGGTTTTCAAAGGAATCGATTCTTCCAAAAAGGAATAGTGATAAGCTCATCGCTCGTAAAAAGGACTGGGACCCGAAAAAGTACGGTGGCTTCGATAGCCCTACAGTTGCCTATTCTGTCCTAGTAGTGGCAAAAGTTGAGAAGGGAAAATCCAAGAAACTGAAGTCAGTCAAAGAATTATTGGGGATAACGATTATGGAGCGCTCGTCTTTTGAAAAGAACCCCATCGACTTCCTTGAGGCGAAAGGTTACAAGGAAGTAAAAAAGGATCTCATAATTAAACTACCAAAGTATAGTCTGTTTGAGTTAGAAAATGGCCGAAAACGGATGTTGGCTAGCGCCGGAGAGCTTCAAAAGGGGAACGAACTCGCACTACCGTCTAAATACGTGAATTTCCTGTATTTAGCGTCCCATTACGAGAAGTTGAAAGGTTCACCTGAAGATAACGAACAGAAGCAACTTTTTGTTGAGCAGCACAAACATTATCTCGACGAAATCATAGAGCAAATTTCGGAATTCAGTAAGAGAGTCATCCTAGCTGATGCCAATCTGGACAAAGTATTAAGCGCATACAACAAGCACAGGGATAAACCCATACGTGAGCAGGCGGAAAATATTATCCATTTGTTTACTCTTACCAACCTCGGCGCTCCAGCCGCATTCAAGTATTTTGACACAACGATAGATCGCAAACGATACACTTCTACCAAGGAGGTGCTAGACGCGACACTGATTCACCAATCCATCACGGGATTATATGAAACTCGGATAGATTTGTCACAGCTTGGGGGTGACGGATCCCCCAAGAAGAAGAGGAAAGTCTCGAGCGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGGCTGCAGGA
Figure 2022520081000013
(一重下線:HNHドメイン;二重下線:RuvCドメイン)。
いくつかの実施形態において、野生型Cas9は、Streptococcus pyogenesからのCas9(NCBI参照配列:NC_002737.2(以下のヌクレオチド配列);およびUniprot参照配列:Q99ZW2(以下のアミノ酸配列)に対応する:
ATGGATAAGAAATACTCAATAGGCTTAGATATCGGCACAAATAGCGTCGGATGGGCGGTGATCACTGATGAATATAAGGTTCCGTCTAAAAAGTTCAAGGTTCTGGGAAATACAGACCGCCACAGTATCAAAAAAAATCTTATAGGGGCTCTTTTATTTGACAGTGGAGAGACAGCGGAAGCGACTCGTCTCAAACGGACAGCTCGTAGAAGGTATACACGTCGGAAGAATCGTATTTGTTATCTACAGGAGATTTTTTCAAATGAGATGGCGAAAGTAGATGATAGTTTCTTTCATCGACTTGAAGAGTCTTTTTTGGTGGAAGAAGACAAGAAGCATGAACGTCATCCTATTTTTGGAAATATAGTAGATGAAGTTGCTTATCATGAGAAATATCCAACTATCTATCATCTGCGAAAAAAATTGGTAGATTCTACTGATAAAGCGGATTTGCGCTTAATCTATTTGGCCTTAGCGCATATGATTAAGTTTCGTGGTCATTTTTTGATTGAGGGAGATTTAAATCCTGATAATAGTGATGTGGACAAACTATTTATCCAGTTGGTACAAACCTACAATCAATTATTTGAAGAAAACCCTATTAACGCAAGTGGAGTAGATGCTAAAGCGATTCTTTCTGCACGATTGAGTAAATCAAGACGATTAGAAAATCTCATTGCTCAGCTCCCCGGTGAGAAGAAAAATGGCTTATTTGGGAATCTCATTGCTTTGTCATTGGGTTTGACCCCTAATTTTAAATCAAATTTTGATTTGGCAGAAGATGCTAAATTACAGCTTTCAAAAGATACTTACGATGATGATTTAGATAATTTATTGGCGCAAATTGGAGATCAATATGCTGATTTGTTTTTGGCAGCTAAGAATTTATCAGATGCTATTTTACTTTCAGATATCCTAAGAGTAAATACTGAAATAACTAAGGCTCCCCTATCAGCTTCAATGATTAAACGCTACGATGAACATCATCAAGACTTGACTCTTTTAAAAGCTTTAGTTCGACAACAACTTCCAGAAAAGTATAAAGAAATCTTTTTTGATCAATCAAAAAACGGATATGCAGGTTATATTGATGGGGGAGCTAGCCAAGAAGAATTTTATAAATTTATCAAACCAATTTTAGAAAAAATGGATGGTACTGAGGAATTATTGGTGAAACTAAATCGTGAAGATTTGCTGCGCAAGCAACGGACCTTTGACAACGGCTCTATTCCCCATCAAATTCACTTGGGTGAGCTGCATGCTATTTTGAGAAGACAAGAAGACTTTTATCCATTTTTAAAAGACAATCGTGAGAAGATTGAAAAAATCTTGACTTTTCGAATTCCTTATTATGTTGGTCCATTGGCGCGTGGCAATAGTCGTTTTGCATGGATGACTCGGAAGTCTGAAGAAACAATTACCCCATGGAATTTTGAAGAAGTTGTCGATAAAGGTGCTTCAGCTCAATCATTTATTGAACGCATGACAAACTTTGATAAAAATCTTCCAAATGAAAAAGTACTACCAAAACATAGTTTGCTTTATGAGTATTTTACGGTTTATAACGAATTGACAAAGGTCAAATATGTTACTGAAGGAATGCGAAAACCAGCATTTCTTTCAGGTGAACAGAAGAAAGCCATTGTTGATTTACTCTTCAAAACAAATCGAAAAGTAACCGTTAAGCAATTAAAAGAAGATTATTTCAAAAAAATAGAATGTTTTGATAGTGTTGAAATTTCAGGAGTTGAAGATAGATTTAATGCTTCATTAGGTACCTACCATGATTTGCTAAAAATTATTAAAGATAAAGATTTTTTGGATAATGAAGAAAATGAAGATATCTTAGAGGATATTGTTTTAACATTGACCTTATTTGAAGATAGGGAGATGATTGAGGAAAGACTTAAAACATATGCTCACCTCTTTGATGATAAGGTGATGAAACAGCTTAAACGTCGCCGTTATACTGGTTGGGGACGTTTGTCTCGAAAATTGATTAATGGTATTAGGGATAAGCAATCTGGCAAAACAATATTAGATTTTTTGAAATCAGATGGTTTTGCCAATCGCAATTTTATGCAGCTGATCCATGATGATAGTTTGACATTTAAAGAAGACATTCAAAAAGCACAAGTGTCTGGACAAGGCGATAGTTTACATGAACATATTGCAAATTTAGCTGGTAGCCCTGCTATTAAAAAAGGTATTTTACAGACTGTAAAAGTTGTTGATGAATTGGTCAAAGTAATGGGGCGGCATAAGCCAGAAAATATCGTTATTGAAATGGCACGTGAAAATCAGACAACTCAAAAGGGCCAGAAAAATTCGCGAGAGCGTATGAAACGAATCGAAGAAGGTATCAAAGAATTAGGAAGTCAGATTCTTAAAGAGCATCCTGTTGAAAATACTCAATTGCAAAATGAAAAGCTCTATCTCTATTATCTCCAAAATGGAAGAGACATGTATGTGGACCAAGAATTAGATATTAATCGTTTAAGTGATTATGATGTCGATCACATTGTTCCACAAAGTTTCCTTAAAGACGATTCAATAGACAATAAGGTCTTAACGCGTTCTGATAAAAATCGTGGTAAATCGGATAACGTTCCAAGTGAAGAAGTAGTCAAAAAGATGAAAAACTATTGGAGACAACTTCTAAACGCCAAGTTAATCACTCAACGTAAGTTTGATAATTTAACGAAAGCTGAACGTGGAGGTTTGAGTGAACTTGATAAAGCTGGTTTTATCAAACGCCAATTGGTTGAAACTCGCCAAATCACTAAGCATGTGGCACAAATTTTGGATAGTCGCATGAATACTAAATACGATGAAAATGATAAACTTATTCGAGAGGTTAAAGTGATTACCTTAAAATCTAAATTAGTTTCTGACTTCCGAAAAGATTTCCAATTCTATAAAGTACGTGAGATTAACAATTACCATCATGCCCATGATGCGTATCTAAATGCCGTCGTTGGAACTGCTTTGATTAAGAAATATCCAAAACTTGAATCGGAGTTTGTCTATGGTGATTATAAAGTTTATGATGTTCGTAAAATGATTGCTAAGTCTGAGCAAGAAATAGGCAAAGCAACCGCAAAATATTTCTTTTACTCTAATATCATGAACTTCTTCAAAACAGAAATTACACTTGCAAATGGAGAGATTCGCAAACGCCCTCTAATCGAAACTAATGGGGAAACTGGAGAAATTGTCTGGGATAAAGGGCGAGATTTTGCCACAGTGCGCAAAGTATTGTCCATGCCCCAAGTCAATATTGTCAAGAAAACAGAAGTACAGACAGGCGGATTCTCCAAGGAGTCAATTTTACCAAAAAGAAATTCGGACAAGCTTATTGCTCGTAAAAAAGACTGGGATCCAAAAAAATATGGTGGTTTTGATAGTCCAACGGTAGCTTATTCAGTCCTAGTGGTTGCTAAGGTGGAAAAAGGGAAATCGAAGAAGTTAAAATCCGTTAAAGAGTTACTAGGGATCACAATTATGGAAAGAAGTTCCTTTGAAAAAAATCCGATTGACTTTTTAGAAGCTAAAGGATATAAGGAAGTTAAAAAAGACTTAATCATTAAACTACCTAAATATAGTCTTTTTGAGTTAGAAAACGGTCGTAAACGGATGCTGGCTAGTGCCGGAGAATTACAAAAAGGAAATGAGCTGGCTCTGCCAAGCAAATATGTGAATTTTTTATATTTAGCTAGTCATTATGAAAAGTTGAAGGGTAGTCCAGAAGATAACGAACAAAAACAATTGTTTGTGGAGCAGCATAAGCATTATTTAGATGAGATTATTGAGCAAATCAGTGAATTTTCTAAGCGTGTTATTTTAGCAGATGCCAATTTAGATAAAGTTCTTAGTGCATATAACAAACATAGAGACAAACCAATACGTGAACAAGCAGAAAATATTATTCATTTATTTACGTTGACGAATCTTGGAGCTCCCGCTGCTTTTAAATATTTTGATACAACAATTGATCGTAAACGATATACGTCTACAAAAGAAGTTTTAGATGCCACTCTTATCCATCAATCCATCACTGGTCTTTATGAAACACGCATTGATTTGAGTCAGCTAGGAGGTGACTGA
Figure 2022520081000014
(一重下線:HNHドメイン;二重下線:RuvCドメイン)
いくつかの実施形態において、Cas9は、Corynebacterium ulcerans(NCBI Refs:NC_015683.1、NC_017317.1);Corynebacterium diphtheria(NCBI Refs:NC_016782.1、NC_016786.1);Spiroplasma syrphidicola(NCBI Ref:NC_021284.1);Prevotella intermedia(NCBI Ref:NC_017861.1);Spiroplasma taiwanense(NCBI Ref:NC_021846.1);Streptococcus iniae(NCBI Ref:NC_021314.1);Belliella baltica(NCBI Ref:NC_018010.1);Psychroflexus torquisI(NCBI Ref:NC_018721.1);Streptococcus thermophilus(NCBI Ref:YP_820832.1)、Listeria innocua(NCBI Ref:NP_472073.1)、Campylobacter jejuni(NCBI Ref:YP_002344900.1)もしくはNeisseria meningitidis(NCBI Ref:YP_002342100.1)からのCas9、または任意の他の生物からのCas9を指す。
追加的なCas9タンパク質(例えばヌクレアーゼ不活(dead)Cas9(dCas9)、Cas9ニッカーゼ(nCas9)、またはヌクレアーゼ活性Cas9) は、そのバリアントおよびホモログを含めて、本開示の範囲内にあることを理解されたい。例示的なCas9タンパク質は、限定されるものではないが、以下に提供されるものを含む。いくつかの実施形態において、Cas9タンパク質は、ヌクレアーゼ不活Cas9 (dCas9) である。いくつかの実施形態において、Cas9タンパク質は、Cas9ニッカーゼ(nCas9) である。いくつかの実施形態において、Cas9タンパク質はヌクレアーゼ活性Cas9である。
いくつかの実施形態において、Cas9ドメインは、ヌクレアーゼ不活性Cas9ドメイン (dCas9) である。例えば、dCas9ドメインは、二本鎖核酸分子のいずれの鎖も切断することなく、二本鎖核酸分子に結合し得る(例えば、gRNA分子を介して)。いくつかの実施形態において、ヌクレアーゼ不活性dCas9ドメインは、本明細書中に記載されたアミノ酸配列のD10X突然変異およびH840X突然変異、または本明細書中に提供されたアミノ酸配列のいずれかにおける対応する突然変異を含み、Xは任意のアミノ酸変化である。いくつかの実施形態において、ヌクレアーゼ不活性dCas9ドメインは、本明細書に記載のアミノ酸配列のD10A突然変異およびH840A突然変異、または本明細書に記載のアミノ酸配列のいずれかにおける対応する突然変異を含む。一例として、ヌクレアーゼ不活性Cas9ドメインは、クローニングベクターpPlatTET-gRNA 2 (アクセス番号BAV54124)中に提供される以下のアミノ酸配列を含む:
例示的な触媒不活性Cas9 (dCas9) のアミノ酸配列は以下の通りである:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
(例えばQi et al., “Repurposing CRISPR as an RNA-guided platform for sequence-specific control of gene expression.” Cell. 2013; 152(5):1173-83(その全内容は参照により本明細書に組み込まれる)を参照されたい)。
さらなる適切なヌクレアーゼ不活性dCas9ドメインは、本開示および当該分野における知識に基づいて当業者に明らかとなり、本開示の範囲内である。このようなさらなる例示的な適切なヌクレアーゼ不活性Cas9ドメインには、限定されるものではないが、D10A/H840A、D10A/D839A/H840A、およびD10A/D839A/H840A/N863A突然変異体ドメインが含まれる(例えばPrashant et al., CAS9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering. Nature Biotechnology. 2013; 31(9):833-838を参照されたい (その全内容は参照により本明細書に組み込まれる))。
いくつかの実施形態において、Cas9ヌクレアーゼは、不活性な(例えば不活性化された) DNA切断ドメインを有し、すなわち、Cas9は、「nCas9」タンパク質(「nickase」Cas9の意)と呼ばれるニッカーゼである。ヌクレアーゼ不活性化Cas9タンパク質は、互換的に「dCas9」タンパク質(nuclease-“dead”Cas9の意)または触媒的に不活性なCas9とも称され得る。不活性なDNA切断ドメインを有するCas9タンパク質(またはその断片)を生成する方法は公知である(例えばJinek et al, Science. 337:816-821(2012); Qi et al, “Repurposing CRISPR as an RNA-Guided Platform for Sequence-Specific Control of Gene Expression” (2013) Cell. 28; 152(5):1173-83参照 (各内容は参照により本明細書に組み込まれる))。例えば、Cas9のDNA切断ドメインは、HNHヌクレアーゼサブドメインとRuvC1サブドメインという2つのサブドメインを含むことが知られている。HNHサブドメインはgRNAに相補的な鎖を切断し、RuvC1サブドメインは非相補的な鎖を切断する。これらのサブドメイン内の変異はCas9のヌクレアーゼ活性を抑制し得る。例えば、突然変異D10AおよびH840Aは、S. pyogenes Cas9 のヌクレアーゼ活性を完全に不活性化する(Jinek et al, Science. 337:816-821(2012); Qi et al, Cell. 28;152(5):1173-83 (2013))。
いくつかの実施形態において、dCas9ドメインは、本明細書に提供されるdCas9ドメインのいずれかに対して少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性を有するアミノ酸配列を含む。いくつかの実施形態において、Cas9ドメインは、本明細書に記載されるアミノ酸配列のいずれかと比較して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50またはそれ以上の突然変異を有するアミノ酸配列を含む。いくつかの実施形態において、Cas9ドメインは、本明細書に記載されたアミノ酸配列のいずれかと比較して、少なくとも10、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも150、少なくとも200、少なくとも250、少なくとも300、少なくとも350、少なくとも400、少なくとも500、少なくとも600、少なくとも700、少なくとも800、少なくとも900、少なくとも1000、少なくとも1100、または少なくとも1200の同一の連続したアミノ酸残基を有するアミノ酸配列を含む。
いくつかの実施形態において、dCas9は、Cas9ヌクレアーゼ活性を不活性化する1以上の突然変異を有するCas9アミノ酸配列に対応するか、またはその一部もしくは全体を含む。例えば、いくつかの実施形態において、dCas9ドメインは、D10AおよびH840A突然変異または別のCas9における対応する突然変異を含む。
いくつかの実施形態において、dCas9は、dCas9 (D10AおよびH840A)のアミノ酸配列を含む:
Figure 2022520081000015
(一重下線:HNHドメイン;二重下線:RuvCドメイン)
いくつかの実施形態において、Cas9ドメインはD10A突然変異を含み、一方、上記で提供したアミノ酸配列における位置840における残基、または本明細書で提供されるアミノ酸配列のいずれかにおける対応する位置における残基は、ヒスチジンのままである。
他の実施形態において、例えばヌクレアーゼ不活性化Cas9 (dCas9) をもたらす、D10AおよびH840A以外の突然変異を有するdCas9バリアントが提供される。このような突然変異は、例えば、D10およびH840における他のアミノ酸置換、またはCas9のヌクレアーゼドメイン内の他の置換(例えば、HNHヌクレアーゼサブドメインおよび/またはRuvC1サブドメインにおける置換)を含む。いくつかの実施形態において、dCas9のバリアントまたはホモログであって、少なくとも約70%の同一性、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%の同一性を有するものが提供される。いくつかの実施形態において、約5アミノ酸、約10アミノ酸、約15アミノ酸、約20アミノ酸、約25アミノ酸、約30アミノ酸、約40アミノ酸、約50アミノ酸、約75アミノ酸、約100アミノ酸またはそれ以上だけ短いまたは長いアミノ酸配列を有するdCas9のバリアントが提供される。
いくつかの実施形態において、Cas9ドメインは、Cas9ニッカーゼである。Cas9ニッカーゼは、二本鎖核酸分子(例えば二本鎖DNA分子)の一方の鎖のみを切断することができるCas9タンパク質であり得る。いくつかの実施形態において、Cas9ニッカーゼは、二本鎖核酸分子の標的鎖を切断し、これは、Cas9ニッカーゼが、Cas9に結合しているgRNA(例えばsgRNA)と塩基対を形成している(相補的である)鎖を切断することを意味する。いくつかの実施形態において、Cas9ニッカーゼは、D10A突然変異を含み、位置840にヒスチジンを有する。いくつかの実施形態において、Cas9ニッカーゼは、二本鎖核酸分子の非標的、非塩基編集鎖を切断し、これは、Cas9ニッカーゼが、Cas9に結合しているgRNA(例えばsgRNA)と塩基対を形成していない鎖を切断することを意味する。いくつかの実施形態において、Cas9ニッカーゼは、H840A突然変異を含み位置10にアスパラギン酸残基を有するか、または対応する突然変異。いくつかの実施形態において、Cas9ニッカーゼは、本明細書に提供されるCas9ニッカーゼのいずれかと少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。さらなる適切なCas9ニッカーゼは、本開示および当該分野における知識に基づいて当業者に明らかであり、本開示の範囲内である。
例示的な触媒的Cas9ニッカーゼ (nCas9) のアミノ酸配列は、以下の通りである:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
いくつかの実施形態において、Cas9は、単細胞原核微生物のドメインおよび界を構成する古細菌(例えばナノアーキア)由来のCas9を指す。いくつかの実施形態において、プログラミング可能なヌクレオチド結合タンパク質は、例えば、Burstein et al., "New CRISPR-Cas systems from uncultivated microbes." Cell Res. 2017 Feb 21. doi: 10.1038/cr.2017.21に記載されているCasXまたはCasYタンパク質であり得、その全体の内容は参照により本明細書に組み込まれる。ゲノム分解メタゲノミクスを用いて、生命の古細菌ドメインにおいて最初に報告されたCas9を含め、多くのCRISPR‐Cas系が同定された。この分岐Cas9タンパク質は、ほとんど研究されていないナノアーキアにおいて、活性CRISPR-Cas系の一部として発見された。細菌では、それまで知られていなかった二つの系、CRISPR-CasXとCRISPR-CasYが発見され、それらは、これまでに発見された中でも最もコンパクトな系に入る。いくつかの実施形態において、本明細書に記載される塩基エディターシステムにおいて、Cas9は、CasXまたはCasXのバリアントによって置き換えられる。いくつかの実施形態において、本明細書に記載される塩基エディターシステムにおいて、Cas9は、CasYまたはCasYのバリアントによって置き換えられる。核酸プログラム可能DNA結合タンパク質 (napDNAbp) として他のRNA誘導DNA結合タンパク質も使用され得、本開示の範囲内であることが理解されるべきである。
いくつかの実施形態において、本明細書で提供される融合タンパク質のいずれかの核酸プログラム可能DNA結合タンパク質 (napDNAbp) は、CasXまたはCasYタンパク質であり得る。いくつかの実施形態において、napDNAbpはCasXタンパク質である。いくつかの実施形態において、napDNAbpはCasYタンパク質である。いくつかの実施形態において、napDNAbpは、天然に存在するCasXまたはCasYタンパク質に対して少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性を有するアミノ酸配列を含む。いくつかの実施形態において、プログラミング可能なヌクレオチド結合タンパク質は、天然に存在するCasXまたはCasYタンパク質である。いくつかの実施形態において、プログラミング可能なヌクレオチド結合タンパク質は、本明細書に記載されるいずれかのCasXまたはCasYタンパク質に対して少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性を有するアミノ酸配列を含む。他の細菌種由来のCasXおよびCasYもまた、本開示に従って使用され得ることが理解されるべきである。
例示的なCasX ((uniprot.org/uniprot/F0NN87; uniprot.org/uniprot/F0NH53) tr|F0NN87|F0NN87_SULIHCRISPR-associatedCasx protein OS = Sulfolobus islandicus (strain HVE10/4) GN = SiH_0402 PE=4 SV=1) のアミノ酸配列は以下のとおりである:
MEVPLYNIFGDNYIIQVATEAENSTIYNNKVEIDDEELRNVLNLAYKIAKNNEDAAAERRGKAKKKKGEEGETTTSNIILPLSGNDKNPWTETLKCYNFPTTVALSEVFKNFSQVKECEEVSAPSFVKPEFYEFGRSPGMVERTRRVKLEVEPHYLIIAAAGWVLTRLGKAKVSEGDYVGVNVFTPTRGILYSLIQNVNGIVPGIKPETAFGLWIARKVVSSVTNPNVSVVRIYTISDAVGQNPTTINGGFSIDLTKLLEKRYLLSERLEAIARNALSISSNMRERYIVLANYIYEYLTG SKRLEDLLYFANRDLIMNLNSDDGKVRDLKLISAYVNGELIRGEG
例示的なCasX (>tr|F0NH53|F0NH53_SULIR CRISPR associated protein, Casx OS = Sulfolobus islandicus (strain REY15A) GN=SiRe_0771 PE=4 SV=1) のアミノ酸配列は以下のとおりである:
MEVPLYNIFGDNYIIQVATEAENSTIYNNKVEIDDEELRNVLNLAYKIAKNNEDAAAERRGKAKKKKGEEGETTTSNIILPLSGNDKNPWTETLKCYNFPTTVALSEVFKNFSQVKECEEVSAPSFVKPEFYKFGRSPGMVERTRRVKLEVEPHYLIMAAAGWVLTRLGKAKVSEGDYVGVNVFTPTRGILYSLIQNVNGIVPGIKPETAFGLWIARKVVSSVTNPNVSVVSIYTISDAVGQNPTTINGGFSIDLTKLLEKRDLLSERLEAIARNALSISSNMRERYIVLANYIYEYLTGSKRLEDLLYFANRDLIMNLNSDDGKVRDLKLISAYVNGELIRGEG
Deltaproteobacteria CasX
MEKRINKIRKKLSADNATKPVSRSGPMKTLLVRVMTDDLKKRLEKRRKKPEVMPQVISNNAANNLRMLLDDYTKMKEAILQVYWQEFKDDHVGLMCKFAQPASKKIDQNKLKPEMDEKGNLTTAGFACSQCGQPLFVYKLEQVSEKGKAYTNYFGRCNVAEHEKLILLAQLKPVKDSDEAVTYSLGKFGQRALDFYSIHVTKESTHPVKPLAQIAGNRYASGPVGKALSDACMGTIASFLSKYQDIIIEHQKVVKGNQKRLESLRELAGKENLEYPSVTLPPQPHTKEGVDfAYNEVIARVRMWVNLNLWQKLKLSRDDAKPLLRLKGFPSFPVVERRENEVDWWNTINEVKKLIDAKRDMGRVFWSGVTAEKRNTILEGYNYLPNENDHKKREGSLENPKKPAKRQFGDLLLYLEKKYAGDWGKVFDEAWERIDKKIAGLTSHIEREEARNAEDAQSKAVLTDWLRAKASFVLERLKEMDEKEFYACEIQLQKWYGDLRGNPFAVEAENRVVDISGFSIGSDGHSIQYRNLLAWKYLENGKREFYLLMNYGKKGRIRFTDGTDIKKSGKWQGLLYGGGKAKVIDLTFDPDDEQLIILPLAFGTRQGREFIWNDLLSLETGLIKLANGRVIEKTIYNKKIGRDEPALFVALTFERREVVDPSNIKPVNLIGVARGENIPAVIALTDPEGCPLPEFKDSSGGPTDILRIGEGYKEKQRAIQAAKEVEQRRAGGYSRKFASKSRNLADDMVRNSARDLFYHAVTHDAVLVFANLSRGFGRQGKRTFMTERQYTKMEDWLTAKLAYEGLTSKTYLSKTLAQYTSKTCSNCGFTITYADMDVMLVRLKKTSDGWATTLNNKELKAEYQITYYNRYKRQTVEKELSAELDRLSEESGNNDISKWTKGRRDEALFLLKKRFSHRPVQEQFVCLDCGHEVHAAEQAALNIARSWLFLNSNSTEFKSYKSGKQPFVGAWQAFYKRRLKEVWKPNA
例示的なCasY ((ncbi.nlm.nih.gov/protein/APG80656.1) >APG80656.1 CRISPR-associated protein CasY [uncultured Parcubacteria group bacterium]) のアミノ酸配列は以下のとおりである:
MSKRHPRISGVKGYRLHAQRLEYTGKSGAMRTIKYPLYSSPSGGRTVPREIVSAINDDYVGLYGLSNFDDLYNAEKRNEEKVYSVLDFWYDCVQYGAVFSYTAPGLLKNVAEVRGGSYELTKTLKGSHLYDELQIDKVIKFLNKKEISRANGSLDKLKKDIIDCFKAEYRERHKDQCNKLADDIKNAKKDAGASLGERQKKLFRDFFGISEQSENDKPSFTNPLNLTCCLLPFDTVNNNRNRGEVLFNKLKEYAQKLDKNEGSLEMWEYIGIGNSGTAFSNFLGEGFLGRLRENKITELKKAMMDITDAWRGQEQEEELEKRLRILAALTIKLREPKFDNHWGGYRSDINGKLSSWLQNYINQTVKIKEDLKGHKKDLKKAKEMINRFGESDTKEEAVVSSLLESIEKIVPDDSADDEKPDIPAIAIYRRFLSDGRLTLNRFVQREDVQEALIKERLEAEKKKKPKKRKKKSDAEDEKETIDFKELFPHLAKPLKLVPNFYGDSKRELYKKYKNAAIYTDALWKAVEKIYKSAFSSSLKNSFFDTDFDKDFFIKRLQKIFSVYRRFNTDKWKPIVKNSFAPYCDIVSLAENEVLYKPKQSRSRKSAAIDKNRVRLPSTENIAKAGIALARELSVAGFDWKDLLKKEEHEEYIDLIELHKTALALLLAVTETQLDISALDFVENGTVKDFMKTRDGNLVLEGRFLEMFSQSIVFSELRGLAGLMSRKEFITRSAIQTMNGKQAELLYIPHEFQSAKITTPKEMSRAFLDLAPAEFATSLEPESLSEKSLLKLKQMRYYPHYFGYELTRTGQGIDGGVAENALRLEKSPVKKREIKCKQYKTLGRGQNKIVLYVRSSYYQTQFLEWFLHRPKNVQTDVAVSGSFLIDEKKVKTRWNYDALTVALEPVSGSERVFVSQPFTIFPEKSAEEEGQRYLGIDIGEYGIAYTALEITGDSAKILDQNFISDPQLKTLREEVKGLKLDQRRGTFAMPSTKIARIRESLVHSLRNRIHHLALKHKAKIVYELEVSRFEEGKQKIKKVYATLKKADVYSEIDADKNLQTTVWGKLAVASEISASYTSQFCGACKKLWRAEMQVDETITTQELIGTVRVIKGGTLIDAIKDFMRPPIFDENDTPFPKYRDFCDKHHISKKMRGNSCLFICPFCRANADADIQASQTIALLRYVKEEKKVEDYFERFRKLKNIKVLGQMKKI
Cas9ヌクレアーゼはRuvCとHNHという二つの機能性エンドヌクレアーゼ領域をもっている。Cas9は標的DNAに結合するとコンホメーション変化を起こし、これがヌクレアーゼドメインを位置付け、標的DNAの反対側の鎖を切断させる。Cas9を介したDNA切断の最終結果は、標的DNA内の二本鎖切断 (DSB) である(PAM配列の約3~4ヌクレオチド上流)。生じたDSBは、次の二つの一般的修復経路のうちの一つにより修復される:(1) 効率的だが誤りがちな非相同末端結合 (NHEJ) 経路;または(2) 効率は低いが忠実度の高い相同性誘導修復 (HDR) 経路。
非相同末端結合 (NHEJ) および/または相同性誘導型修復(HDR) の「効率」は、任意の簡便な方法によって計算することができる。例えば、いくつかの実施形態において、効率は、成功したHDRのパーセンテージで表すことができる。例えば、検査用ヌクレアーゼ分析を用いて切断産物を生成し、基質に対する産物の比を用いてパーセンテージを計算することができる。たとえば、HDRが成功した結果として新たに組み込まれた制限配列を含むDNAを直接切断する測量用ヌクレアーゼ酵素を使用することができる。切断される基質が多いほどHDRの割合が高かった(HDRの効率がより高かった)ことを示す。例示的な例として、HDRの割合 (パーセンテージ) は、以下の式を用いて計算することができる[(切断産物)/(基質+切断産物)] (例えば(b+c) / (a+b+c) ここで、「a」はDNA基質のバンド強度であり、「b」および「c」は切断生成物である。)。
いくつかの実施形態において、効率はNHEJの成功率で表すことができる。例えば、T7エンドヌクレアーゼIアッセイを用いて切断産物を生成し、基質に対する産物の比を用いてNHEJのパーセンテージを計算することができる。T7エンドヌクレアーゼIは、野生型および突然変異体DNA鎖(NHEJは最初の切断部位に小さなランダムな挿入(insertion)や欠失(deletion)(インデル:indel)を生じる)のハイブリダイゼーションから生じるミスマッチのヘテロ二本鎖DNAを切断する。切断が多いほどNHEJの割合が高いこと(NHEJの効率が高いこと)を示す。例示的な例として、NHEJの割合 (パーセンテージ) は、式 (1-(1-(b+c)/(a+b+c))1/2) ×100を用いて計算することができ、ここで、「a」はDNA基質のバンド強度であり、「b」および「c」は切断生成物である(Ran et. al., Cell. 2013 Sep. 12; 154(6):1380-9; and Ran et al., Nat Protoc. 2013 Nov.; 8(11):2281-2308)。
NHEJ修復経路は最も活性な修復機構であり、DSB部位での小ヌクレオチド挿入または欠失 (インデル) を頻繁に引き起こす。NHEJ媒介DSB修復のランダム性は、Cas9およびgRNAまたはガイドポリヌクレオチドを発現する細胞集団が多様な突然変異のアレイをもたらし得るので、重要な実際的意味を有する。ほとんどの実施形態において、NHEJは標的DNAに小さなインデルを生じさせ、その結果、標的遺伝子のオープンリーディングフレーム (ORF) 内に未熟な終止コドンをもたらすアミノ酸欠失、挿入、またはフレームシフト突然変異が生じる。理想的な最終結果は、標的遺伝子内の機能喪失型変異である。
NHEJ媒介DSB修復はしばしば遺伝子のオープンリーディングフレームを破壊するが、相同性誘導型修復 (HDR) は単一ヌクレオチド変化からフルオロフォアまたはタグの付加のような大きな挿入までの範囲の特異的ヌクレオチド変化を生成するために使用できる。HDRを遺伝子編集に利用するために、所望の配列を含むDNA修復テンプレートを、gRNAおよびCas9またはCas9ニッカーゼと共に目的の細胞型に送達することができる。修復テンプレートは、所望の編集ならびにその標的のすぐ上流および下流(左右相同アームと呼ばれる)にさらなる相同配列を含むことができる。各相同アームの長さは導入される変化の大きさに依存し得、より大きな挿入はより長い相同アームを必要とする。修復鋳型は、一本鎖オリゴヌクレオチド、二本鎖オリゴヌクレオチド、または二本鎖DNAプラスミドであり得る。HDRの効率は、Cas9、gRNAおよび外因性修復テンプレートを発現する細胞においても、一般的に低い(10%未満の修正アリル)。HDRは細胞周期のS期とG2期の間に起こるので、細胞を同調させることによってHDRの効率を高めることができる。NHEJに関与する遺伝子を化学的または遺伝的に阻害することもHDR頻度を増加させ得る。
いくつかの実施形態において、Cas9は、改変されたCas9である。所与のgRNA標的配列は、ゲノム全体にわたり、部分的な相同性が存在するさらなる部位を有し得る。これらの部位はオフターゲットと呼ばれ、gRNAを設計する際に考慮する必要があるが、gRNAの設計を最適化することに加えて、Cas9を修飾することによってCRISPRの特異性を高めることもできる。Cas9は2つのヌクレアーゼドメイン、RuvCおよびHNHの組合せ活性を介して二本鎖切断 (DSB) を生成する。SpCas9のD10A変異体であるCas9ニッカーゼは1つのヌクレアーゼドメインを保持し、DSBではなくDNAニックを生成する。特異的遺伝子編集のためのHDR媒介遺伝子編集にニッカーゼを組み合わせることもできる。
いくつかの実施形態において、Cas9はバリアントCas9タンパク質である。バリアントCas9ポリペプチドは、野生型Cas9タンパク質のアミノ酸配列と比較して、一アミノ酸単位で異なる(例えば欠失、挿入、置換、融合を有する)アミノ酸配列を有する。いくつかの例において、バリアントCas9ポリペプチドは、Cas9ポリペプチドのヌクレアーゼ活性を低下させるアミノ酸変化(例えば欠失、挿入、または置換)を有する。例えば、いくつかの例において、バリアントCas9ポリペプチドは、対応する野生型Cas9タンパク質のヌクレアーゼ活性の50%未満、40%未満、30%未満、20%未満、10%未満、5%未満、または1%未満を有する。いくつかの実施形態において、バリアントCas9タンパク質は実質的なヌクレアーゼ活性をもたない。対象Cas9タンパク質が、実質的なヌクレアーゼ活性を有さないバリアントCas9タンパク質である場合、それは「dCas9」と称され得る。
いくつかの実施形態において、バリアントCas9タンパク質はヌクレアーゼ活性を低下させる。例えば、バリアントCas9タンパク質は、野生型Cas9タンパク質(例えば野生型Cas9タンパク質)のエンドヌクレアーゼ活性の約20%未満、約15%未満、約10%未満、約5%未満、約1%未満、または約0.1%未満を示す。
いくつかの実施形態において、バリアントCas9タンパク質は、ガイド標的配列の相補鎖を切断することができるが、二本鎖ガイド標的配列の非相補鎖を切断する能力が低下している。例えば、バリアントCas9タンパク質は、RuvCドメインの機能を低下させる突然変異(アミノ酸置換)を有することができる。非限定的な例として、いくつかの実施形態において、バリアントCas9タンパク質は、D10A (アミノ酸位置10におけるアスパラギン酸からアラニン)を有し、したがって、二本鎖ガイド標的配列の相補鎖を切断することができるが、二本鎖ガイド標的配列の非相補鎖を切断する能力が低下している(したがって、このバリアントCas9タンパク質が二本鎖標的核酸を切断するとき、二本鎖切断 (DSB) の代わりに一本鎖切断 (SSB) を生じる) (例えばJinek et al., Science. 2012 Aug. 17; 337(6096):816-21参照)。
いくつかの実施形態において、バリアントCas9タンパク質は、二本鎖ガイド標的配列の非相補鎖を切断することができるが、ガイド標的配列の相補鎖を切断する能力が低下している。例えば、バリアントCas9タンパク質は、HNHドメインの機能を低下させる変異(アミノ酸置換)を有することができる(RuvC/HNH/RuvCドメインモチーフ)。非限定的な例として、いくつかの実施形態において、バリアントCas9タンパク質は、H840A (アミノ酸位置840におけるヒスチジンからアラニン)突然変異を有し、したがって、ガイド標的配列の非相補的ストランドを切断することができるが、ガイド標的配列の相補的ストランドを切断する能力が低下している(したがって、このバリアントCas9タンパク質が二本鎖ガイド標的配列を切断すると、DSBの代わりにSSBが生じる)。このようなCas9タンパク質は、ガイド標的配列(例えば一本鎖ガイド標的配列)を切断する能力が低下しているが、ガイド標的配列(例えば一本鎖ガイド標的配列)に結合する能力を保持している。
いくつかの実施形態において、バリアントCas9タンパク質は、二本鎖標的DNAの相補鎖および非相補鎖の両方を切断する能力が低下している。非限定的な例として、いくつかの実施形態において、バリアントCas9タンパク質は、D10AおよびH840A突然変異の両方を有し、その結果、ポリペプチドは、二本鎖標的DNAの相補鎖および非相補鎖の両方を切断する能力が低下している。このようなCas9タンパク質は、標的DNA (例えば一本鎖標的DNA)を切断する能力が低下しているが、標的DNA (例えば一本鎖標的DNA)に結合する能力は保持している。
別の非限定的な例として、いくつかの実施形態において、バリアントCas9タンパク質は、W476AおよびW1126A突然変異を有し、その結果、ポリペプチドは、標的DNA (例えば一本鎖標的DNA)を切断する能力が低下しているが、標的DNA (例えば一本鎖標的DNA)に結合する能力は保持している。
別の非限定的な例として、いくつかの実施形態において、バリアントCas9タンパク質は、P475A、W476A、N477A、D1125A、W1126A、およびD1127A突然変異を有し、その結果、ポリペプチドは、標的DNAを切断する能力が低下している。そのようなCas9タンパク質は、標的DNAを切断する能力を低下しているが(例えば一本鎖標的DNA)、標的DNA (例えば一本鎖標的DNA)に結合する能力を保持している。
別の非限定的な例として、いくつかの実施形態において、バリアントCas9タンパク質は、H840A、W476A、およびW1126A突然変異を有し、その結果、ポリペプチドは、標的DNA (例えば一本鎖標的DNA)を切断する能力が低下しているが、標的DNA (例えば一本鎖標的DNA)に結合する能力は保持している。別の非限定的な例として、いくつかの実施形態において、バリアントCas9タンパク質は、H840A、D10A、W476A、およびW1126A突然変異を有し、その結果、ポリペプチドは、標的DNAを切断する能力が低下している。このようなCas9タンパク質は、標的DNA (例えば一本鎖標的DNA)を切断する能力が低下しているが、標的DNA (例えば一本鎖標的DNA)に結合する能力は保持している。いくつかの実施形態において、バリアントCas9は、Cas9 HNHドメインの位置840における触媒的His残基が回復されている(A840H)。
別の非限定的な例として、いくつかの実施形態において、バリアントCas9タンパク質は、H840A、P475A、W476A、N477A、D1125A、W1126A、およびD1127A突然変異を有し、その結果、ポリペプチドは、標的DNA (例えば一本鎖標的DNA)を切断する能力を低下させるが、標的DNA (例えば一本鎖標的DNA)に結合する能力を保持する。別の非限定的な例として、いくつかの実施形態において、バリアントCas9タンパク質は、D10A、H840A、P475A、W476A、N477A、D1125A、W1126A、およびD1127A突然変異を有し、その結果、ポリペプチドは、標的DNAを切断する能力が低下している。そのようなCas9タンパク質は、標的DNA (例えば一本鎖標的DNA)を切断する能力を低下しているが、標的DNA (例えば一本鎖標的DNA)に結合する能力を保持している。いくつかの実施形態において、バリアントCas9タンパク質がW476AおよびW1126A変異を有する場合、またはバリアントCas9タンパク質がP475A、W476A、N477A、D1125A、W1126A、およびD1127A変異を有する場合、バリアントCas9タンパク質はPAM配列に効率的に結合しない。したがって、一部のこのような実施形態において、このようなバリアントCas9タンパク質を結合の方法に用いると、この方法はPAM配列を必要としない。換言すれば、いくつかの実施形態において、このようなバリアントCas9タンパク質を結合の方法に用いる場合、この方法はガイドRNAを含み得るが、この方法は、PAM配列の非存在下で行うことができる(したがって、結合の特異性はガイドRNAの標的セグメントによってもたらされる)。上記の効果を達成するために、他の残基を変異させ得る(すなわち一方または他方のヌクレアーゼ部分を不活性化する)。非限定的な例として、残基D10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D986、および/またはA987を改変(すなわち置換)することができる。また、アラニン置換以外の変異も好適である。
いくつかの実施形態において、低下した触媒活性を有するバリアントCas9タンパク質(例えばCas9タンパク質がD10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D986、および/またはA987突然変異、例えばD10A、G12A、G17A、E762A、H840A、N854A、N863A、H982A、H983A、A984A、および/またはD986Aを有する場合)は、それがガイドRNAと相互作用する能力を保持する限り、部位特異的様式で標的DNAに結合することができる(ガイドRNAによって標的DNA配列に誘導されるからである)。
いくつかの実施形態において、バリアントCasタンパク質はspCas9、spCas9-VRQR、spCas9-VRER、xCas9 (sp)、saCas9、saCas9-KKH、spCas9-MQKSER、spCas9-LRKIQK、またはspCas9-LRVSQLであり得る。
いくつかの実施形態において、アミノ酸置換D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、およびT1337R (SpCas9-MQKFRAER)を含み、改変されたPAM 5'-NGC-3'に対する特異性を有する改変されたSpCas9が使用された。
S. pyogenes Cas9の代替としては、哺乳動物細胞において切断活性を示すCpf1ファミリー由来のRNA誘導エンドヌクレアーゼが挙げられ得る。PrevotellaおよびFrancisella 1由来のCRISPR (CRISPR/Cpf1) は、CRISPR/Cas9系に類似したDNA編集技術である。Cpf1はクラスII CRISPR/Cas系のRNA誘導エンドヌクレアーゼである。この獲得免疫機構はPrevotellaやFrancisella細菌に見られる。Cpf1遺伝子はCRISPR遺伝子座に関連しており、ウイルスDNAを見出して切断するためにガイドRNAを用いるエンドヌクレアーゼをコードしている。Cpf1はCas9より小さく単純なエンドヌクレアーゼであり、CRISPR/Cas9系の制限のいくつかを克服する。Cas9ヌクレアーゼとは異なり、Cpf1を介したDNA切断の結果は、短い3'突出を伴う二本鎖切断である。Cpf1の互い違いの切断パターンは、伝統的な制限酵素クローニングに類似した、方向性のある遺伝子導入の可能性を開くことができ、これは遺伝子編集の効率を高め得る。上述したCas9のバリアントおよびオーソログと同様に、Cpf1は、CRISPRが標的とすることができる部位の数を、SpCas9が好むNGG PAM部位を欠くATに富む領域またはATに富むゲノムに拡大することもできる。Cpf1遺伝子座はアルファ/ベータ混合ドメイン、RuvC-Iとそれに続くらせん領域、RuvC-IIおよびジンクフィンガー様ドメインを含む。Cpf1タンパク質は、Cas9のRuvCドメインに類似したRuvC様エンドヌクレアーゼドメインを有する。さらに、Cpf1はHNHエンドヌクレアーゼ領域をもたず、Cpf1のN末端はCas9のアルファヘリックス認識ローブをもたない。Cpf1 CRISPR-Casドメイン構成は、Cpf1が機能的にユニークであり、クラス2、タイプV CRISPRシステムとして分類されることを示した。Cpf1遺伝子座は、II型系よりもI型およびIII型に類似したCas1、Cas2およびCas4タンパク質をコードしていた。機能的Cpf1はトランス活性化CRISPR RNA (tracrRNA) を必要としない;したがって、CRISPR (crRNA) だけを要する。Cpf1はCas9より小さいだけでなく、より小さいsgRNA分子(Cas9の約半分の数のヌクレオチド)を有するので、これはゲノム編集に有益である。Cas9が標的とするGリッチPAMとは対照的に、Cpf1-crRNA複合体は、モチーフ5'-YTN-3'に隣接するプロトスペーサーの同定によって標的DNAまたはRNAを切断する。PAMの同定後、Cpf1は、4または5ヌクレオチドの突出を有するスティッキーエンド様のDNA二本鎖切断を導入する。
いくつかの実施形態において、Cas9は、改変されたPAM配列に対して特異性を有するCas9バリアントである。いくつかの実施形態において、追加のCas9バリアントおよびPAM配列は、Miller, S.M., et al. Continuous evolution of SpCas9 variants compatible with non-G PAMs, Nat. Biotechnol. (2020)(その全体は参照により本明細書に組み込まれる)に記載されている。いくつかの実施形態において、Cas9バリアントは特定のPAM要求を有しない。いくつかの実施形態において、Cas9バリアント、例えばSpCas9バリアントは、NRNH PAMに対して特異性を有し、ここでRはAまたはGであり、HはA、C、またはTである。いくつかの実施形態において、SpCas9バリアントは、PAM配列AAA、TAA、CAA、GAA、TAT、GAT、またはCACに対して特異性を有する。いくつかの実施形態において、SpCas9バリアントは、配列番号1における番号付けで位置1114、1134、1135、1137、1139、1151、1180、1188、1211、1218、1219、1221、1249、1256、1264、1290、1318、1317、1320、1321、1323、1332、1333、1335、1337、もしくは1339、またはその対応する位置におけるアミノ酸置換を含む。いくつかの実施形態において、SpCas9バリアントは、配列番号1における番号付けで位置1114、1135、1218、1219、1221、1249、1320、1321、1323、1332、1333、1335、もしくは1337、またはその対応する位置におけるアミノ酸置換を含む。いくつかの実施形態において、SpCas9バリアントは、配列番号1における番号付けで位置1114、1134、1135、1137、1139、1151、1180、1188、1211、1219、1221、1256、1264、1290、1318、1317、1320、1323、1333、またはその対応する位置におけるアミノ酸置換を含む。いくつかの実施形態において、SpCas9バリアントは、配列番号1における番号付けで位置1114、1131、1135、1150、1156、1180、1191、1218、1219、1221、1227、1249、1253、1286、1293、1320、1321、1332、1335、1339、またはその対応する位置におけるアミノ酸置換を含む。いくつかの実施形態において、SpCas9バリアントは、配列番号1における番号付けで位置1114、1127、1135、1180、1207、1219、1234、1286、1301、1332、1335、1337、1338、1349、またはその対応する位置におけるアミノ酸置換を含む。SpCas9バリアントの例示的なアミノ酸置換およびPAM特異性は表1A~1Dに示される。
表1A
Figure 2022520081000016
表1B
Figure 2022520081000017
表1C
Figure 2022520081000018
表1D
Figure 2022520081000019
いくつかの実施形態において、Cas9はNeisseria menigitidis Cas9 (NmeCas9) またはそのバリアントである。いくつかの実施形態において、NmeCas9はNNNNGAYW PAMに対して特異性を有し、ここでYはCまたはTであり、WはAまたはTである。いくつかの実施形態において、NmeCas9はNNNNGYTT PAMに対して特異性を有し、ここでYはCまたはTである。いくつかの実施形態において、NmeCas9はNNNNGTCT PAMに対して特異性を有する。いくつかの実施形態において、NmeCas9はNme1 Cas9である。いくつかの実施形態において、NmeCas9は、NNNNGATT PAM、NNNNCCTA PAM、NNNNCCTC PAM、NNNNCCTT PAM、NNNNCCTG PAM、NNNNCCGT PAM、NNNNCCGGPAM、NNNNCCCA PAM、NNNNCCCT PAM、NNNNCCCC PAM、NNNNCCAT PAM、NNNNCCAG PAM、NNNNCCAT PAM、またはNNNGATT PAMに対して特異性を有する。いくつかの実施形態において、Nme1Cas9は、NNNNGATT PAM、NNNNCCTA PAM、NNNNCCTC PAM、NNNNCCTT PAM、またはNNNNCCTG PAMに対して特異性を有する。いくつかの実施形態において、NmeCas9は、CAA PAM、CAAA PAM、またはCCA PAMに対して特異性を有する。いくつかの実施形態において、NmeCas9はNme2 Cas9である。いくつかの実施形態において、NmeCas9はNNNNCC (N4CC) PAMに対して特異性を有し、ここでNはA、G、C、またはTのいずれか1つである。いくつかの実施形態において、NmeCas9は、NNNNCCGT PAM、NNNNCCGGPAM、NNNNCCCA PAM、NNNNCCCT PAM、NNNNCCCC PAM、NNNNCCAT PAM、NNNNCCAG PAM、NNNNCCAT PAM、またはNNNGATT PAMに対して特異性を有する。いくつかの実施形態において、NmeCas9はNme3Cas9である。いくつかの実施形態において、NmeCas9は、NNNNCAAA PAM、NNNNCC PAM、またはNNNNCNNN PAMに対して特異性を有する。Edraki et al. Mol. Cell. (2019) 73(4): 714-726に記載されるような追加のNmeCas9の特徴およびPAM配列は参照により全体が本明細書に組み込まれる。Nme1Cas9の例示的なアミノ酸配列は以下に提供される:
II型CRISPR RNA誘導型エンドヌクレアーゼCas9 [Neisseria meningitidis] WP_002235162.1
1 maafkpnpin yilgldigia svgwamveid edenpiclid lgvrvferae vpktgdslam
61 arrlarsvrr ltrrrahrll rarrllkreg vlqaadfden glikslpntp wqlraaaldr
121 kltplewsav llhlikhrgy lsqrkneget adkelgallk gvadnahalq tgdfrtpael
181 alnkfekesg hirnqrgdys htfsrkdlqa elillfekqk efgnphvsgg lkegietllm
241 tqrpalsgda vqkmlghctf epaepkaakn tytaerfiwl tklnnlrile qgserpltdt
301 eratlmdepy rkskltyaqa rkllgledta ffkglrygkd naeastlmem kayhaisral
361 ekeglkdkks plnlspelqd eigtafslfk tdeditgrlk driqpeilea llkhisfdkf
421 vqislkalrr ivplmeqgkr ydeacaeiyg dhygkkntee kiylppipad eirnpvvlra
481 lsqarkving vvrrygspar ihietarevg ksfkdrkeie krqeenrkdr ekaaakfrey
541 fpnfvgepks kdilklrlye qqhgkclysg keinlgrlne kgyveidhal pfsrtwddsf
601 nnkvlvlgse nqnkgnqtpy eyfngkdnsr ewqefkarve tsrfprskkq rillqkfded
661 gfkernlndt ryvnrflcqf vadrmrltgk gkkrvfasng qitnllrgfw glrkvraend
721 rhhaldavvv acstvamqqk itrfvrykem nafdgktidk etgevlhqkt hfpqpweffa
781 qevmirvfgk pdgkpefeea dtpeklrtll aeklssrpea vheyvtplfv srapnrkmsg
841 qghmetvksa krldegvsvl rvpltqlklk dlekmvnrer epklyealka rleahkddpa
901 kafaepfyky dkagnrtqqv kavrveqvqk tgvwvrnhng iadnatmvrv dvfekgdkyy
961 lvpiyswqva kgilpdravv qgkdeedwql iddsfnfkfs lhpndlvevi tkkarmfgyf
1021 aschrgtgni nirihdldhk igkngilegi gvktalsfqk yqidelgkei rpcrlkkrpp
1081 vr
Nme2Cas9の例示的なアミノ酸配列は以下に提供される:
II型CRISPR RNA誘導型エンドヌクレアーゼCas9 [Neisseria meningitidis] WP_002230835.1
1 maafkpnpin yilgldigia svgwamveid eeenpirlid lgvrvferae vpktgdslam
61 arrlarsvrr ltrrrahrll rarrllkreg vlqaadfden glikslpntp wqlraaaldr
121 kltplewsav llhlikhrgy lsqrkneget adkelgallk gvannahalq tgdfrtpael
181 alnkfekesg hirnqrgdys htfsrkdlqa elillfekqk efgnphvsgg lkegietllm
241 tqrpalsgda vqkmlghctf epaepkaakn tytaerfiwl tklnnlrile qgserpltdt
301 eratlmdepy rkskltyaqa rkllgledta ffkglrygkd naeastlmem kayhaisral
361 ekeglkdkks plnlsselqd eigtafslfk tdeditgrlk drvqpeilea llkhisfdkf
421 vqislkalrr ivplmeqgkr ydeacaeiyg dhygkkntee kiylppipad eirnpvvlra
481 lsqarkving vvrrygspar ihietarevg ksfkdrkeie krqeenrkdr ekaaakfrey
541 fpnfvgepks kdilklrlye qqhgkclysg keinlvrlne kgyveidhal pfsrtwddsf
601 nnkvlvlgse nqnkgnqtpy eyfngkdnsr ewqefkarve tsrfprskkq rillqkfded
661 gfkecnlndt ryvnrflcqf vadhilltgk gkrrvfasng qitnllrgfw glrkvraend
721 rhhaldavvv acstvamqqk itrfvrykem nafdgktidk etgkvlhqkt hfpqpweffa
781 qevmirvfgk pdgkpefeea dtpeklrtll aeklssrpea vheyvtplfv srapnrkmsg
841 ahkdtlrsak rfvkhnekis vkrvwlteik ladlenmvny kngreielye alkarleayg
901 gnakqafdpk dnpfykkggq lvkavrvekt qesgvllnkk naytiadngd mvrvdvfckv
961 dkkgknqyfi vpiyawqvae nilpdidckg yriddsytfc fslhkydlia fqkdekskve
1021 fayyincdss ngrfylawhd kgskeqqfri stqnlvliqk yqvnelgkei rpcrlkkrpp
1081 vr
[核酸塩基エディターのCas12ドメイン]
典型的には、微生物CRISPR-Cas系はクラス1およびクラス2系に分けられる。クラス1の系は多サブユニットエフェクター複合体を有し、クラス2の系は単一のタンパク質エフェクターを有する。例えば、Cas9およびCpf1は、異なる型(それぞれII型およびV型)ではあるが、クラス2のエフェクターである。Cpf1に加えて、クラス2、V型CRISPR-Cas系はまた、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、およびCas12i)を含む。例えば、Shmakov et al., “Discovery and Functional Characterization of Diverse Class 2 CRISPR Cas Systems,”Mol. Cell, 2015 Nov. 5; 60(3): 385-397; Makarova et al., “Classification and Nomenclature of CRISPR-Cas Systems: Where from Here?”CRISPR Journal, 2018, 1(5): 325-336;およびYan et al., “Functionally Diverse Type V CRISPR-Cas Systems,” Science, 2019 Jan. 4; 363: 88-91を参照されたい(それぞれの全内容は参照により本明細書に組み込まれる)。V型Casタンパク質はRuvC(またはRuvC様)エンドヌクレアーゼドメインを含有する。成熟CRISPR RNA (crRNA)の産生は一般にtracrRNA非依存性であるが、例えばCas12b/C2c1はcrRNAの産生のためにtracrRNAを必要とする。Cas12b/C2c1はDNA切断のためにcrRNAおよびtracrRNAの両方に依存する。
本開示において企図される核酸プログラム可能なDNA結合タンパク質としては、クラス2、V型(Cas12タンパク質)として分類されるCasタンパク質が挙げられる。Casクラス2、V型タンパク質の非限定的な例としては、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、およびCas12i、これらのホモログ、またはこれらの改変されたバージョンが挙げられる。本明細書で使用される場合、Cas12タンパク質はまた、Cas12ヌクレアーゼ、Cas12ドメイン、またはCas12タンパク質ドメインと称され得る。いくつかの実施形態において、本開示のCas12タンパク質は、デアミナーゼドメインなどの内部で融合したタンパク質ドメインを差し挟まれたアミノ酸配列を含む。
いくつかの実施形態において、Cas12ドメインはヌクレアーゼ不活性Cas12ドメインまたはCas12ニッカーゼである。いくつかの実施形態において、Cas12ドメインはヌクレアーゼ活性ドメインである。例えば、Cas12ドメインは、二本鎖核酸(例えば二本鎖DNA分子)の1つの鎖にニックを入れるCas12ドメインであり得る。いくつかの実施形態において、Cas12ドメインは、本明細書に記載されるアミノ酸配列のいずれか1つを含む。いくつかの実施形態において、Cas12ドメインは、本明細書に記載のアミノ酸配列のいずれか1つに対して少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。いくつかの実施形態において、Cas12ドメインは、本明細書に記載のアミノ酸配列のいずれか1つと比較して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50またはそれより多くの突然変異を有するアミノ酸配列を含む。いくつかの実施形態において、Cas12ドメインは、本明細書に記載のアミノ酸配列のいずれか1つと比較して少なくとも10、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも150、少なくとも200、少なくとも250、少なくとも300、少なくとも350、少なくとも400、少なくとも500、少なくとも600、少なくとも700、少なくとも800、少なくとも900、少なくとも1000、少なくとも1100、または少なくとも1200個の同一の連続するアミノ酸残基を有するアミノ酸配列を含む。
いくつかの実施形態において、Cas12の断片を含むタンパク質が提供される。例えば、いくつかの実施形態において、タンパク質は、2つのCas12ドメイン:(1) Cas12のgRNA結合ドメイン、または (2) Cas12のDNA切断ドメインのうちの1つを含む。いくつかの実施形態において、Cas12またはその断片を含むタンパク質は「Cas12バリアント」と称される。Cas12バリアントはCas12、またはその断片に対して相同性を共有する。例えば、Cas12バリアントは、野生型Cas12に対して少なくとも約70%の同一性、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一である。いくつかの実施形態において、Cas12バリアントは、野生型Cas12と比較して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50またはそれより多くのアミノ酸変化を有し得る。いくつかの実施形態において、Cas12バリアントはCas12の断片(例えばgRNA結合ドメインまたはDNA切断ドメイン)を含み、断片は、野生型Cas12の対応する断片に対して少なくとも約70%の同一性、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一である。いくつかの実施形態において、断片は、対応する野生型Cas12のアミノ酸長の少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%同一、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%である。いくつかの実施形態において、断片は少なくとも100アミノ酸の長さである。いくつかの実施形態において、断片は、少なくとも100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、または少なくとも1300アミノ酸の長さである。
いくつかの実施形態において、Cas12は、Cas12ヌクレアーゼ活性を改変する1つまたは複数の突然変異を有するCas12アミノ酸配列に対応する、またはそれを部分的もしくは全体的に含む。そのような突然変異の例としては、Cas12のRuvCヌクレアーゼドメイン内のアミノ酸置換が挙げられる。いくつかの実施形態において、野生型Cas12に対して少なくとも約70%の同一性、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%の同一性であるCas12のバリアントまたはホモログが提供される。いくつかの実施形態において、約5アミノ酸、約10アミノ酸、約15アミノ酸、約20アミノ酸、約25アミノ酸、約30アミノ酸、約40アミノ酸、約50アミノ酸、約75アミノ酸、約100アミノ酸またはより多くのアミノ酸だけより短い、またはより長いアミノ酸配列を有するCas12のバリアントが提供される。
いくつかの実施形態において、本明細書で提供されるCas12融合タンパク質は、Cas12タンパク質の全長アミノ酸配列、例えば、本明細書で提供されるCas12配列の1つを含む。他の実施形態において、しかしながら、本明細書で提供される融合タンパク質は、全長Cas12配列を含まず、その1つまたは複数の断片のみを含む。好適なCas12ドメインの例示的なアミノ酸配列は本明細書で提供され、Cas12ドメインおよび断片の追加の好適な配列は当業者に明らかである。
一般に、クラス2、V型Casタンパク質は単一の機能的なRuvCエンドヌクレアーゼドメインを有する(例えばChen et al., “CRISPR-Cas12a target binding unleashes indiscriminate single-stranded DNase activity,” Science 360:436-439 (2018)を参照されたい)。一部の場合には、Cas12タンパク質はバリアントCas12bタンパク質である。(Strecker et al., Nature Communications, 2019, 10(1): Art. No.: 212を参照されたい)。一実施形態において、バリアントCas12ポリペプチドは、野生型Cas12タンパク質のアミノ酸配列と比較した場合に1、2、3、4、5またはそれより多くのアミノ酸により異なる(例えば欠失、挿入、置換、融合を有する)アミノ酸配列を有する。一部の事例では、バリアントCas12ポリペプチドは、Cas12ポリペプチドの活性を低減させるアミノ酸変化(例えば欠失、挿入、または置換)を有する。例えば、一部の事例では、バリアントCas12は、対応する野生型Cas12bタンパク質のニッカーゼ活性の50%未満、40%未満、30%未満、20%未満、10%未満、5%未満、または1%未満を有するCas12bポリペプチドである。一部の場合には、バリアントCas12bタンパク質は実質的なニッカーゼ活性を有しない。
一部の場合には、バリアントCas12bタンパク質は低減したニッカーゼ活性を有する。例えば、バリアントCas12bタンパク質は、野生型Cas12bタンパク質のニッカーゼ活性の約20%未満、約15%未満、約10%未満、約5%未満、約1%未満、または約0.1%未満を呈する。
いくつかの実施形態において、Cas12タンパク質は、哺乳動物細胞中で活性を示すCas12a/Cpf1ファミリーからのRNA誘導型エンドヌクレアーゼを含む。PrevotellaおよびFrancisella 1由来のCRISPR (CRISPR/Cpf1) は、CRISPR/Cas9システムに類似したDNA編集技術である。Cpf1はクラスII CRISPR/Cas系のRNA誘導エンドヌクレアーゼである。この獲得免疫機構はPrevotellaやFrancisella細菌に見られる。Cpf1遺伝子はCRISPR遺伝子座に関連しており、ウイルスDNAを見出して切断するためにガイドRNAを用いるエンドヌクレアーゼをコードしている。Cpf1はCas9より小さく単純なエンドヌクレアーゼであり、CRISPR/Cas9系の制限のいくつかを克服する。Cas9ヌクレアーゼとは異なり、Cpf1を介したDNA切断の結果は、短い3'突出を伴う二本鎖切断である。Cpf1の互い違いの切断パターンは、伝統的な制限酵素クローニングに類似した、方向性のある遺伝子導入の可能性を開くことができ、これは遺伝子編集の効率を高め得る。上述したCas9のバリアントおよびオーソログと同様に、Cpf1は、CRISPRが標的とすることができる部位の数を、SpCas9が好むNGG PAM部位を欠くATに富む領域またはATに富むゲノムに拡大することもできる。Cpf1遺伝子座はアルファ/ベータ混合ドメイン、RuvC-Iとそれに続くらせん領域、RuvC-IIおよびジンクフィンガー様ドメインを含む。Cpf1タンパク質は、Cas9のRuvCドメインに類似したRuvC様エンドヌクレアーゼドメインを有する。さらに、Cas9とは異なり、Cpf1はHNHエンドヌクレアーゼ領域をもたず、Cpf1のN末端はCas9のアルファヘリックス認識ローブをもたない。Cpf1 CRISPR-Casドメイン構成は、Cpf1が機能的にユニークであり、クラス2、タイプV CRISPRシステムとして分類されることを示した。Cpf1遺伝子座は、II型系よりもI型およびIII型に類似したCas1、Cas2およびCas4タンパク質をコードしていた。機能的Cpf1はトランス活性化CRISPR RNA (tracrRNA) を必要としない;したがって、CRISPR (crRNA) だけを要する。Cpf1はCas9より小さいだけでなく、より小さいsgRNA分子(Cas9の約半分の数のヌクレオチド)を有するので、これはゲノム編集に有益である。Cas9が標的とするGリッチPAMとは対照的に、Cpf1-crRNA複合体は、モチーフ5'-YTN-3'または5'-TTTN-3'に隣接するプロトスペーサーの同定によって標的DNAまたはRNAを切断する。PAMの同定後、Cpf1は、4または5ヌクレオチドの突出を有するスティッキーエンド様のDNA二本鎖切断を導入する。
本開示のいくつかの態様において、標的配列を含む標的ポリヌクレオチドの一方または両方の鎖を切断する能力を欠失するように、対応する野生型酵素に対して変異されたCRISPR酵素をコードするベクターを用いることができる。Cas12は、野生型の例示的なCas12ポリペプチド(例えばBacillus hisashiiからのCas12)と少なくとも、または少なくともおよそ、50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性および/または配列相同性を有するポリペプチドを指すことができる。Cas12は、野生型の例示的なCas12ポリペプチド(例えばBacillus hisashii (BhCas12b)、Bacillus sp. V3-13 (BvCas12b)、およびAlicyclobacillus acidiphilus (AaCas12b) 由来)に対して、最大で、または最大でおよそ、50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性および/または配列相同性を有するポリペプチドを指すことができる。Cas12は、野生型、または欠失、挿入、置換、バリアント、突然変異、融合、キメラ、またはそれらの任意の組合せなどのアミノ酸変化を含み得るCas12タンパク質の改変型を指すことができる。
[核酸プログラム可能なDNA結合タンパク質]
本開示のいくつかの態様は、核酸プログラミング可能なDNA結合タンパク質として作用するドメインを含む融合タンパク質を提供し、これは、塩基エディターのようなタンパク質を特異的な核酸(例えばDNAまたはRNA)配列に誘導するために使用され得る。特定の実施形態において、融合タンパク質は、核酸プログラミング可能なDNA結合タンパク質ドメインとデアミナーゼドメインとを含む。核酸プログラム可能なDNA結合タンパク質の非限定的な例としては、Cas9(例えばdCas9 および nCas9)、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、およびCas12iが挙げられる。Cas酵素の非限定的な例としては、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5d、Cas5t、Cas5h、Cas5a、Cas6、Cas7、Cas8、Cas8a、Cas8b、Cas8c、Cas9 (Csn1もしくはCsx12としても公知)、Cas10、Cas10d、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i、Csy1 、Csy2、Csy3、Csy4、Cse1、Cse2、Cse3、Cse4、Cse5e、Csc1、Csc2、Csa5、Csn1、Csn2、Csm1、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx1S、Csx11、Csf1、Csf2、CsO、Csf4、Csd1、Csd2、Cst1、Cst2、Csh1、Csh2、Csa1、Csa2、Csa3、Csa4、Csa5、II型Casエフェクタータンパク質、V型Casエフェクタータンパク質、VI型Casエフェクタータンパク質、CARF、DinG、これらのホモログ、またはこれらの改変もしくは操作されたバージョンが挙げられる。他の核酸プログラム可能なDNA結合タンパク質もまた本開示の範囲内であるが、それらは本開示に特に列記されないことがある。例えば、Makarova et al. “Classification and Nomenclature of CRISPR-Cas Systems: Where from Here?”CRISPR J. 2018 Oct;1:325-336. doi: 10.1089/crispr.2018.0033; Yan et al., “Functionally diverse type V CRISPR-Cas systems” Science. 2019 Jan 4;363(6422):88-91. doi: 10.1126/science.aav7271(それぞれの全内容は参照により本明細書に組み込まれる)を参照されたい。
Cas9とは異なるPAM特異性を有する核酸プログラム可能なDNA結合タンパク質の一例はPrevotella および Francisella 1由来のClustered Regularly Interspaced Short Palindromic Repeats(Cpf1)である。Cas9と同様に、Cpf1もクラス2 CRISPRエフェクターである。Cpf1はCas9とは異なる特徴でロバストなDNA干渉を媒介することが示されている。Cpf1は、tracrRNAを欠く単一RNA誘導エンドヌクレアーゼであり、Tに富むプロトスペーサー隣接モチーフ(TTN、TTTN、またはYTN)を利用する。さらに、Cpf1はDNAを互い違いのDNA二本鎖切断で切断する。16のCpf1ファミリータンパク質のうち、AcidaminococcusとLachnospiraceaeからの二つの酵素がヒト細胞において効率的なゲノム編集活性を有することが示されている。Cpf1タンパク質は当技術分野で知られており、例えば過去にYamano et al., “Crystal structure of Cpf1 in complex with guide RNA and target DNA.”Cell (165) 2016, p. 949-962に記載されており、その全体の内容は参照により本明細書に組み込まれる。
ガイドヌクレオチド配列プログラム可能DNA結合タンパク質ドメインとして使用され得るヌクレアーゼ不活性Cpf1 (dCpf1) バリアントも、本発明の組成物および方法において有用である。Cpf1タンパク質は、Cas9のRuvCドメインに類似したRuvC様エンドヌクレアーゼドメインを有するが、HNHエンドヌクレアーゼドメインを有さず、Cpf1のN末端はCas9のアルファ-ヘリックス認識ローブを有さない。Zetsche et al., Cell, 163, 759-771, 2015 (参照により本明細書に組み込まれる) は、Cpf1のRuvC様ドメインが両方のDNA鎖の切断を担い、RuvC様ドメインの不活性化はCpf1ヌクレアーゼ活性を不活性化することを示した。例えば、Francisella novicida Cpf1におけるD917A、E1006A、またはD1255Aに対応する突然変異は、Cpf1ヌクレアーゼ活性を不活性化する。いくつかの実施形態において、本開示のdCpf1は、D917A、E1006A、D1255A、D917A/E1006A、D917A/D1255A、E1006A/D1255A、またはD917A/E1006A/D1255Aに対応する突然変異を含む。Cpf1のRuvCドメインを不活性化する任意の突然変異、例えば、置換変異、欠失、または挿入が、本開示にしたがって使用され得ることを理解されたい。
いくつかの実施形態において、本明細書で提供される融合タンパク質のいずれかの核酸プログラミング可能なDNA結合タンパク質 (napDNAbp) は、Cpf1タンパク質であり得る。いくつかの実施形態において、Cpf1タンパク質は、Cpf1ニッカーゼ (nCpf1) である。いくつかの実施形態において、Cpf1タンパク質は、ヌクレアーゼ不活性Cpf1 (dCpf1) である。いくつかの実施形態において、Cpf1、nCpf1、またはdCpf1は、本明細書に開示されたCpf1配列に対して少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性を有するアミノ酸配列を含む。いくつかの実施形態において、dCpf1は、本明細書に開示されたCpf1配列に対して少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性を有するアミノ酸配列を含み、D917A、E1006A、D1255A、D917A/E1006A、D917A/D1255A、E1006A/D1255A、またはD917A/E1006A/D1255Aに対応する突然変異を含む。他の細菌種からのCpf1もまた本開示にしたがって使用され得ることが理解されるべきである。
野生型Francisella novicidaCpf1(D917、E1006、およびD1255を太字とし、下線を付している)
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIDRGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFEDLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDADANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN
Francisella novicida Cpf1 D917A(A917、E1006、およびD1255を太字とし、下線を付している)
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIARGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFEDLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDADANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN
Francisella novicida Cpf1 E1006A(D917、A1006、およびD1255を太字とし、下線を付している)
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIDRGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFADLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDADANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN
Francisella novicida Cpf1 D1255A(D917、E1006、およびA1255を太字とし、下線を付している)
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIDRGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFEDLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDAAANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN
Francisella novicida Cpf1 D917A/E1006A(A917、A1006、およびD1255を太字とし、下線を付している)
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIARGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFADLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDADANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN
Francisella novicida Cpf1 D917A/D1255A(A917、E1006、およびA1255を太字とし、下線を付している)
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIARGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFEDLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDAAANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN
Francisella novicida Cpf1 E1006A/D1255A(D917、A1006、およびA1255を太字とし、下線を付している)
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIDRGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFADLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDAAANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN
Francisella novicida Cpf1 D917A/E1006A/D1255A(A917、A1006、およびA1255を太字とし、下線を付している)
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIARGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFADLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDAAANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN
いくつかの実施形態において、融合タンパク質中に存在するCas9ドメインの1つは、PAM配列を必要としないガイドヌクレオチド配列プログラミング可能なDNA結合タンパク質ドメインで置換され得る。
いくつかの実施形態において、Cas9ドメインは、Staphylococcus aureus由来のCas9ドメイン(SaCas9)である。いくつかの実施形態において、SaCas9ドメインは、ヌクレアーゼ活性SaCas9、ヌクレアーゼ不活性SaCas9 (SaCas9d) 、またはSaCas9ニッカーゼ (SaCas9n) である。いくつかの実施形態において、SaCas9は、N579A突然変異、または本明細書に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含む。
いくつかの実施形態において、SaCas9ドメイン、SaCas9dドメイン、またはSaCas9nドメインは、非標準PAMを有する核酸配列に結合することができ、いくつかの実施形態において、SaCas9ドメイン、SaCas9dドメイン、またはSaCas9nドメインは、NNGRRTまたはNNGRRT PAM配列を有する核酸配列に結合することができる。いくつかの実施形態において、SaCas9ドメインは、E781X、N967X、およびR1014X突然変異の1以上、または本明細書に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含み、ここでXは任意のアミノ酸である。いくつかの実施形態において、SaCas9ドメインは、E781K、N967K、およびR1014H突然変異のうちの1つ以上、または本明細書に提供されるアミノ酸配列のいずれかにおける1つ以上の対応する突然変異を含む。いくつかの実施形態において、SaCas9ドメインは、E781K、N967K、またはR1014H突然変異、または本明細書に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含む。
例示的なSaCas9配列
KRNYILGLDIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG
下線を付して太字としている上記の残基N579は、SaCas9ニッカーゼをもたらすために(例えばA579に)突然変異され得る。
例示的なSaCas9n 配列
KRNYILGLDIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEEASKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG
SaCas9ニッカーゼをもたらすためにN579から突然変異され得る上記の残基A579に下線を付し、太字としている。
例示的なSaKKH Cas9
Figure 2022520081000020
SaCas9ニッカーゼをもたらすためにN579から突然変異され得る上記の残基A579に下線を付し、太字としている。SaKKH Cas9をもたらすためにE781、N967、およびR1014から突然変異され得る上記の残基K781、K967、およびH1014に下線を付し、斜体としている。
いくつかの実施形態において、napDNAbpは循環置換体である。以下の配列において、プレーンテキストはアデノシンデアミナーゼ配列を示し、太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線を付した配列は二部分核局在化配列を示す。
CP5(MSP 「NGC」 PIDおよび「D10A」ニッカーゼを有する):
Figure 2022520081000021
いくつかの実施形態において、核酸プログラム可能なDNA結合タンパク質 (napDNAbp) は微生物CRISPR-Cas系の単一のエフェクターである。微生物CRISPR-Cas系の単一のエフェクターとしては、非限定的に、Cas9、Cpf1、Cas12b/C2c1、およびCas12c/C2c3が挙げられる。典型的には、微生物CRISPR-Cas系はクラス1およびクラス2系に分けられる。クラス1の系は多サブユニットエフェクター複合体をもち、クラス2の系は単一のタンパク質エフェクターをもつ。たとえば、Cas9とCpf1はクラス2エフェクターである。Cas9およびCpf1に加えて、三つの異なるクラス2 CRISPR-Casシステム(Cas12b/C2c1およびCas12c/C2c3)がShmakov et al., “Discovery and Functional Characterization of Diverse Class 2 CRISPR Cas Systems”, Mol. Cell, 2015 Nov. 5; 60(3): 385-397によって記載されている(その全体の内容は参照により本明細書に組み込まれる) 。2つの系、Cas12b/C2c1とCas12c/C2c3のエフェクターはCpf1に関連するRuvC様エンドヌクレアーゼ領域を含む。第3の系は、2つの予測されるHEPN RNaseドメインをもつエフェクターを含む。Cas12b/C2c1によるCRISPR RNAの産生とは異なり、成熟CRISPR RNAの産生がtracrRNA非依存性である。Cas12b/C2c1はDNA切断にCRISPRRNAとtracrRNAの両方に依存する。
Alicyclobaccillus acidoterrastris Cas12b/C2c1 (AacC2c1) の結晶構造が、キメラ単一分子ガイドRNA (sgRNA) との複合体として報告されている。例えば、Liu et al., “C2c1-sgRNA Complex Structure Reveals RNA-Guided DNA Cleavage Mechanism”, Mol. Cell, 2017 Jan. 19; 65(2):310-322参照(その内容全体を参照により本明細書に組み込む) 。また、三元複合体として標的DNAに結合したAlicyclobacillus acidoterrestris C2c1においても結晶構造が報告されている。例えば、Yang et al., “PAM-dependent Target DNA Recognition and Cleavage by C2C1 CRISPR-Cas endonuclease”, Cell, 2016 Dec. 15; 167(7):1814-1828参照(その内容全体が参照により本明細書に組み込まれる)。標的DNA鎖および非標的DNA鎖の両方と共に、AacC2c1の触媒的にコンピテントな立体配座は、1つのRuvC触媒ポケット内に独立して捕捉され、Cas12b/C2c1媒介切断は標的DNAのスタガード7ヌクレオチドの切断を生じる。Cas 12b/C2c1三元複合体と以前に同定されたCas9およびCpf1対応物の間の構造比較は、 CRISPR‐Cas9システムにより使用される機構の多様性を示す。
いくつかの実施形態において、本明細書で提供される融合タンパク質のいずれかの核酸プログラム可能DNA結合タンパク質 (napDNAbp) は、Cas12b/C2c1またはCas12c/C2c3タンパク質であり得る。いくつかの実施形態において、napDNAbpはCas12b/C2c1タンパク質である。いくつかの実施形態において、napDNAbpはCas12c/C2c3タンパク質である。いくつかの実施形態において、napDNAbpは、天然に存在するCas12b/C2c1またはCas12c/C2c3タンパク質に対して少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性を有するアミノ酸配列を含む。いくつかの実施形態において、napDNAbpは、天然に存在するCas12b/C2c1またはCas12c/C2c3タンパク質である。いくつかの実施形態において、napDNAbpは、本明細書に提供されるnapDNAbp配列のいずれかに対して少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性を有するアミノ酸配列を含む。他の細菌種由来のCas12b/C2c1またはCas12c/C2c3も本開示に従って使用することができることが理解されるべきである。
Cas12b/C2c1 ((uniprot.org/uniprot/T0D7A2#2) sp|T0D7A2|C2C1_ALIAG CRISPR-associated endonuclease C2c1 OS = Alicyclobacillus acido-terrestris (strain ATCC 49025 / DSM 3922/ CIP 106132 / NCIMB 13137/GD3B) GN=c2c1 PE=1 SV=1) のアミノ酸配列は以下の通りである:
MAVKSIKVKLRLDDMPEIRAGLWKLHKEVNAGVRYYTEWLSLLRQENLYRRSPNGDGEQECDKTAEECKAELLERLRARQVENGHRGPAGSDDELLQLARQLYELLVPQAIGAKGDAQQIARKFLSPLADKDAVGGLGIAKAGNKPRWVRMREAGEPGWEEEKEKAETRKSADRTADVLRALADFGLKPLMRVYTDSEMSSVEWKPLRKGQAVRTWDRDMFQQAIERMMSWESWNQRVGQEYAKLVEQKNRFEQKNFVGQEHLVHLVNQLQQDMKEASPGLESKEQTAHYVTGRALRGSDKVFEKWGKLAPDAPFDLYDAEIKNVQRRNTRRFGSHDLFAKLAEPEYQALWREDASFLTRYAVYNSILRKLNHAKMFATFTLPDATAHPIWTRFDKLGGNLHQYTFLFNEFGERRHAIRFHKLLKVENGVAREVDDVTVPISMSEQLDNLLPRDPNEPIALYFRDYGAEQHFTGEFGGAKIQCRRDQLAHMHRRRGARDVYLNVSVRVQSQSEARGERRPPYAAVFRLVGDNHRAFVHFDKLSDYLAEHPDDGKLGSEGLLSGLRVMSVDLGLRTSASISVFRVARKDELKPNSKGRVPFFFPIKGNDNLVAVHERSQLLKLPGETESKDLRAIREERQRTLRQLRTQLAYLRLLVRCGSEDVGRRERSWAKLIEQPVDAANHMTPDWREAFENELQKLKSLHGICSDKEWMDAVYESVRRVWRHMGKQVRDWRKDVRSGERPKIRGYAKDVVGGNSIEQIEYLERQYKFLKSWSFFGKVSGQVIRAEKGSRFAITLREHIDHAKEDRLKKLADRIIMEALGYVYALDERGKGKWVAKYPPCQLILLEELSEYQFNNDRPPSENNQLMQWSHRGVFQELINQAQVHDLLVGTMYAAFSSRFDARTGAPGIRCRRVPARCTQEHNPEPFPWWLNKFVVEHTLDACPLRADDLIPTGEGEIFVSPFSAEEGDFHQIHADLNAAQNLQQRLWSDFDISQIRLRCDWGEVDGELVLIPRLTGKRTADSYSNKVFYTNTGVTYYERERGKKRRKVFAQEKLSEEEAELLVEADEAREKSVVLMRDPSGIINRGNWTRQKEFWSMV NQRIEGYLVKQIRSRVPLQDSACENTGDI
AacCas12b (Alicyclobacillus acidiphilus) - WP_067623834
MAVKSMKVKLRLDNMPEIRAGLWKLHTEVNAGVRYYTEWLSLLRQENLYRRSPNGDGEQECYKTAEECKAELLERLRARQVENGHCGPAGSDDELLQLARQLYELLVPQAIGAKGDAQQIARKFLSPLADKDAVGGLGIAKAGNKPRWVRMREAGEPGWEEEKAKAEARKSTDRTADVLRALADFGLKPLMRVYTDSDMSSVQWKPLRKGQAVRTWDRDMFQQAIERMMSWESWNQRVGEAYAKLVEQKSRFEQKNFVGQEHLVQLVNQLQQDMKEASHGLESKEQTAHYLTGRALRGSDKVFEKWEKLDPDAPFDLYDTEIKNVQRRNTRRFGSHDLFAKLAEPKYQALWREDASFLTRYAVYNSIVRKLNHAKMFATFTLPDATAHPIWTRFDKLGGNLHQYTFLFNEFGEGRHAIRFQKLLTVEDGVAKEVDDVTVPISMSAQLDDLLPRDPHELVALYFQDYGAEQHLAGEFGGAKIQYRRDQLNHLHARRGARDVYLNLSVRVQSQSEARGERRPPYAAVFRLVGDNHRAFVHFDKLSDYLAEHPDDGKLGSEGLLSGLRVMSVDLGLRTSASISVFRVARKDELKPNSEGRVPFCFPIEGNENLVAVHERSQLLKLPGETESKDLRAIREERQRTLRQLRTQLAYLRLLVRCGSEDVGRRERSWAKLIEQPMDANQMTPDWREAFEDELQKLKSLYGICGDREWTEAVYESVRRVWRHMGKQVRDWRKDVRSGERPKIRGYQKDVVGGNSIEQIEYLERQYKFLKSWSFFGKVSGQVIRAEKGSRFAITLREHIDHAKEDRLKKLADRIIMEALGYVYALDDERGKGKWVAKYPPCQLILLEELSEYQFNNDRPPSENNQLMQWSHRGVFQELLNQAQVHDLLVGTMYAAFSSRFDARTGAPGIRCRRVPARCAREQNPEPFPWWLNKFVAEHKLDGCPLRADDLIPTGEGEFFVSPFSAEEGDFHQIHADLNAAQNLQRRLWSDFDISQIRLRCDWGEVDGEPVLIPRTTGKRTADSYGNKVFYTKTGVTYYERERGKKRRKVFAQEELSEEEAELLVEADEAREKSVVLMRDPSGIINRGDWTRQKEFWSMVNQRIEGYLVKQIRSRVRLQESACENTGDI
BhCas12b (Bacillus hisashii) NCBI Reference Sequence: WP_095142515
MAPKKKRKVGIHGVPAAATRSFILKIEPNEEVKKGLWKTHEVLNHGIAYYMNILKLIRQEAIYEHHEQDPKNPKKVSKAEIQAELWDFVLKMQKCNSFTHEVDKDEVFNILRELYEELVPSSVEKKGEANQLSNKFLYPLVDPNSQSGKGTASSGRKPRWYNLKIAGDPSWEEEKKKWEEDKKKDPLAKILGKLAEYGLIPLFIPYTDSNEPIVKEIKWMEKSRNQSVRRLDKDMFIQALERFLSWESWNLKVKEEYEKVEKEYKTLEERIKEDIQALKALEQYEKERQEQLLRDTLNTNEYRLSKRGLRGWREIIQKWLKMDENEPSEKYLEVFKDYQRKHPREAGDYSVYEFLSKKENHFIWRNHPEYPYLYATFCEIDKKKKDAKQQATFTLADPINHPLWVRFEERSGSNLNKYRILTEQLHTEKLKKKLTVQLDRLIYPTESGGWEEKGKVDIVLLPSRQFYNQIFLDIEEKGKHAFTYKDESIKFPLKGTLGGARVQFDRDHLRRYPHKVESGNVGRIYFNMTVNIEPTESPVSKSLKIHRDDFPKVVNFKPKELTEWIKDSKGKKLKSGIESLEIGLRVMSIDLGQRQAAAASIFEVVDQKPDIEGKLFFPIKGTELYAVHRASFNIKLPGETLVKSREVLRKAREDNLKLMNQKLNFLRNVLHFQQFEDITEREKRVTKWISRQENSDVPLVYQDELIQIRELMYKPYKDWVAFLKQLHKRLEVEIGKEVKHWRKSLSDGRKGLYGISLKNIDEIDRTRKFLLRWSLRPTEPGEVRRLEPGQRFAIDQLNHLNALKEDRLKKMANTIIMHALGYCYDVRKKKWQAKNPACQIILFEDLSNYNPYEERSRFENSKLMKWSRREIPRQVALQGEIYGLQVGEVGAQFSSRFHAKTGSPGIRCSVVTKEKLQDNRFFKNLQREGRLTLDKIAVLKEGDLYPDKGGEKFISLSKDRKCVTTHADINAAQNLQKRFWTRTHGFYKVYCKAYQVDGQTVYIPESKDQKQKIIEEFGEGYFILKDGVYEWVNAGKLKIKKGSSKQSSSELVDSDILKDSFDLASELKGEKLMLYRDPSGNVFPSDKWMAAGVFFGKLERILISKLTNQYSISTIEDDSSKQSMKRPAATKKAGQAKKKK
BvCas12b V4と称されるバリアントを含む(上記のwtに対してS893R/K846R/E837Gの変化)。BhCas12b (V4) は以下のように発現される:5' mRNA Cap---5'UTR---bhCas12b---終止配列 --- 3'UTR --- 120ポリAテイル5'UTR:
GGGAAATAAGAGAGAAAAGAAGAGTAAGAAGAAATATAAGAGCCACC
3'UTR(TriLink標準UTR)
GCTGGAGCCTCGGTGGCCATGCTTCTTGCCCCTTGGGCCTCCCCCCAGCCCCTCCTCCCCTTCCTGCACCCGTACCCCCGTGGTCTTTGAATAAAGTCTGA
bhCas12b (V4) の核酸配列
ATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCCGCCACCAGATCCTTCATCCTGAAGATCGAGCCCAACGAGGAAGTGAAGAAAGGCCTCTGGAAAACCCACGAGGTGCTGAACCACGGAATCGCCTACTACATGAATATCCTGAAGCTGATCCGGCAAGAGGCCATCTACGAGCACCACGAGCAGGACCCCAAGAATCCCAAGAAGGTGTCCAAGGCCGAGATCCAGGCCGAGCTGTGGGATTTCGTGCTGAAGATGCAGAAGTGCAACAGCTTCACACACGAGGTGGACAAGGACGAGGTGTTCAACATCCTGAGAGAGCTGTACGAGGAACTGGTGCCCAGCAGCGTGGAAAAGAAGGGCGAAGCCAACCAGCTGAGCAACAAGTTTCTGTACCCTCTGGTGGACCCCAACAGCCAGTCTGGAAAGGGAACAGCCAGCAGCGGCAGAAAGCCCAGATGGTACAACCTGAAGATTGCCGGCGATCCCTCCTGGGAAGAAGAGAAGAAGAAGTGGGAAGAAGATAAGAAAAAGGACCCGCTGGCCAAGATCCTGGGCAAGCTGGCTGAGTACGGACTGATCCCTCTGTTCATCCCCTACACCGACAGCAACGAGCCCATCGTGAAAGAAATCAAGTGGATGGAAAAGTCCCGGAACCAGAGCGTGCGGCGGCTGGATAAGGACATGTTCATTCAGGCCCTGGAACGGTTCCTGAGCTGGGAGAGCTGGAACCTGAAAGTGAAAGAGGAATACGAGAAGGTCGAGAAAGAGTACAAGACCCTGGAAGAGAGGATCAAAGAGGACATCCAGGCTCTGAAGGCTCTGGAACAGTATGAGAAAGAGCGGCAAGAACAGCTGCTGCGGGACACCCTGAACACCAACGAGTACCGGCTGAGCAAGAGAGGCCTTAGAGGCTGGCGGGAAATCATCCAGAAATGGCTGAAAATGGACGAGAACGAGCCCTCCGAGAAGTACCTGGAAGTGTTCAAGGACTACCAGCGGAAGCACCCTAGAGAGGCCGGCGATTACAGCGTGTACGAGTTCCTGTCCAAGAAAGAGAACCACTTCATCTGGCGGAATCACCCTGAGTACCCCTACCTGTACGCCACCTTCTGCGAGATCGACAAGAAAAAGAAGGACGCCAAGCAGCAGGCCACCTTCACACTGGCCGATCCTATCAATCACCCTCTGTGGGTCCGATTCGAGGAAAGAAGCGGCAGCAACCTGAACAAGTACAGAATCCTGACCGAGCAGCTGCACACCGAGAAGCTGAAGAAAAAGCTGACAGTGCAGCTGGACCGGCTGATCTACCCTACAGAATCTGGCGGCTGGGAAGAGAAGGGCAAAGTGGACATTGTGCTGCTGCCCAGCCGGCAGTTCTACAACCAGATCTTCCTGGACATCGAGGAAAAGGGCAAGCACGCCTTCACCTACAAGGATGAGAGCATCAAGTTCCCTCTGAAGGGCACACTCGGCGGAGCCAGAGTGCAGTTCGACAGAGATCACCTGAGAAGATACCCTCACAAGGTGGAAAGCGGCAACGTGGGCAGAATCTACTTCAACATGACCGTGAACATCGAGCCTACAGAGTCCCCAGTGTCCAAGTCTCTGAAGATCCACCGGGACGACTTCCCCAAGGTGGTCAACTTCAAGCCCAAAGAACTGACCGAGTGGATCAAGGACAGCAAGGGCAAGAAACTGAAGTCCGGCATCGAGTCCCTGGAAATCGGCCTGAGAGTGATGAGCATCGACCTGGGACAGAGACAGGCCGCTGCCGCCTCTATTTTCGAGGTGGTGGATCAGAAGCCCGACATCGAAGGCAAGCTGTTTTTCCCAATCAAGGGCACCGAGCTGTATGCCGTGCACAGAGCCAGCTTCAACATCAAGCTGCCCGGCGAGACACTGGTCAAGAGCAGAGAAGTGCTGCGGAAGGCCAGAGAGGACAATCTGAAACTGATGAACCAGAAGCTCAACTTCCTGCGGAACGTGCTGCACTTCCAGCAGTTCGAGGACATCACCGAGAGAGAGAAGCGGGTCACCAAGTGGATCAGCAGACAAGAGAACAGCGACGTGCCCCTGGTGTACCAGGATGAGCTGATCCAGATCCGCGAGCTGATGTACAAGCCTTACAAGGACTGGGTCGCCTTCCTGAAGCAGCTCCACAAGAGACTGGAAGTCGAGATCGGCAAAGAAGTGAAGCACTGGCGGAAGTCCCTGAGCGACGGAAGAAAGGGCCTGTACGGCATCTCCCTGAAGAACATCGACGAGATCGATCGGACCCGGAAGTTCCTGCTGAGATGGTCCCTGAGGCCTACCGAACCTGGCGAAGTGCGTAGACTGGAACCCGGCCAGAGATTCGCCATCGACCAGCTGAATCACCTGAACGCCCTGAAAGAAGATCGGCTGAAGAAGATGGCCAACACCATCATCATGCACGCCCTGGGCTACTGCTACGACGTGCGGAAGAAGAAATGGCAGGCTAAGAACCCCGCCTGCCAGATCATCCTGTTCGAGGATCTGAGCAACTACAACCCCTACGAGGAAAGGTCCCGCTTCGAGAACAGCAAGCTCATGAAGTGGTCCAGACGCGAGATCCCCAGACAGGTTGCACTGCAGGGCGAGATCTATGGCCTGCAAGTGGGAGAAGTGGGCGCTCAGTTCAGCAGCAGATTCCACGCCAAGACAGGCAGCCCTGGCATCAGATGTAGCGTCGTGACCAAAGAGAAGCTGCAGGACAATCGGTTCTTCAAGAATCTGCAGAGAGAGGGCAGACTGACCCTGGACAAAATCGCCGTGCTGAAAGAGGGCGATCTGTACCCAGACAAAGGCGGCGAGAAGTTCATCAGCCTGAGCAAGGATCGGAAGTGCGTGACCACACACGCCGACATCAACGCCGCTCAGAACCTGCAGAAGCGGTTCTGGACAAGAACCCACGGCTTCTACAAGGTGTACTGCAAGGCCTACCAGGTGGACGGCCAGACCGTGTACATCCCTGAGAGCAAGGACCAGAAGCAGAAGATCATCGAAGAGTTCGGCGAGGGCTACTTCATTCTGAAGGACGGGGTGTACGAATGGGTCAACGCCGGCAAGCTGAAAATCAAGAAGGGCAGCTCCAAGCAGAGCAGCAGCGAGCTGGTGGATAGCGACATCCTGAAAGACAGCTTCGACCTGGCCTCCGAGCTGAAAGGCGAAAAGCTGATGCTGTACAGGGACCCCAGCGGCAATGTGTTCCCCAGCGACAAATGGATGGCCGCTGGCGTGTTCTTCGGAAAGCTGGAACGCATCCTGATCAGCAAGCTGACCAACCAGTACTCCATCAGCACCATCGAGGACGACAGCAGCAAGCAGTCTATGAAAAGGCCGGCGGCCACGAAAAAGGCCGGCCAGGCAAAAAAGAAAAAG
いくつかの実施形態において、Cas12bはBvCas12Bである。いくつかの実施形態において、Cas12bは、以下に提供されるBvCas12Bの例示的な配列における番号付けでアミノ酸置換S893R、K846R、およびE837Gを含む。
BvCas12b (Bacillus sp. V3-13) NCBI Reference Sequence: WP_101661451.1
MAIRSIKLKMKTNSGTDSIYLRKALWRTHQLINEGIAYYMNLLTLYRQEAIGDKTKEAYQAELINIIRNQQRNNGSSEEHGSDQEILALLRQLYELIIPSSIGESGDANQLGNKFLYPLVDPNSQSGKGTSNAGRKPRWKRLKEEGNPDWELEKKKDEERKAKDPTVKIFDNLNKYGLLPLFPLFTNIQKDIEWLPLGKRQSVRKWDKDMFIQAIERLLSWESWNRRVADEYKQLKEKTESYYKEHLTGGEEWIEKIRKFEKERNMELEKNAFAPNDGYFITSRQIRGWDRVYEKWSKLPESASPEELWKVVAEQQNKMSEGFGDPKVFSFLANRENRDIWRGHSERIYHIAAYNGLQKKLSRTKEQATFTLPDAIEHPLWIRYESPGGTNLNLFKLEEKQKKNYYVTLSKIIWPSEEKWIEKENIEIPLAPSIQFNRQIKLKQHVKGKQEISFSDYSSRISLDGVLGGSRIQFNRKYIKNHKELLGEGDIGPVFFNLVVDVAPLQETRNGRLQSPIGKALKVISSDFSKVIDYKPKELMDWMNTGSASNSFGVASLLEGMRVMSIDMGQRTSASVSIFEVVKELPKDQEQKLFYSINDTELFAIHKRSFLLNLPGEVVTKNNKQQRQERRKKRQFVRSQIRMLANVLRLETKKTPDERKKAIHKLMEIVQSYDSWTASQKEVWEKELNLLTNMAAFNDEIWKESLVELHHRIEPYVGQIVSKWRKGLSEGRKNLAGISMWNIDELEDTRRLLISWSKRSRTPGEANRIETDEPFGSSLLQHIQNVKDDRLKQMANLIIMTALGFKYDKEEKDRYKRWKETYPACQIILFENLNRYLFNLDRSRRENSRLMKWAHRSIPRTVSMQGEMFGLQVGDVRSEYSSRFHAKTGAPGIRCHALTEEDLKAGSNTLKRLIEDGFINESELAYLKKGDIIPSQGGELFVTLSKRYKKDSDNNELTVIHADINAAQNLQKRFWQQNSEVYRVPCQLARMGEDKLYIPKSQTETIKKYFGKGSFVKNNTEQEVYKWEKSEKMKIKTDTTFDLQDLDGFEDISKTIELAQEQQKKYLTMFRDPSGYFFNNETWRPQKEYWSIVNNIIKSCLKKKILSNKVEL
いくつかの実施形態において、Cas12bはBTCas12bである。BTCas12b (Bacillus thermoamylovorans) NCBI参照配列:WP_041902512
MATRSFILKIEPNEEVKKGLWKTHEVLNHGIAYYMNILKLIRQEAIYEHHEQDPKNPKKV
SKAEIQAELWDFVLKMQKCNSFTHEVDKDVVFNILRELYEELVPSSVEKKGEANQLSNKF
LYPLVDPNSQSGKGTASSGRKPRWYNLKIAGDPSWEEEKKKWEEDKKKDPLAKILGKLAE
YGLIPLFIPFTDSNEPIVKEIKWMEKSRNQSVRRLDKDMFIQALERFLSWESWNLKVKEE
YEKVEKEHKTLEERIKEDIQAFKSLEQYEKERQEQLLRDTLNTNEYRLSKRGLRGWREII
QKWLKMDENEPSEKYLEVFKDYQRKHPREAGDYSVYEFLSKKENHFIWRNHPEYPYLYAT
FCEIDKKKKDAKQQATFTLADPINHPLWVRFEERSGSNLNKYRILTEQLHTEKLKKKLTV
QLDRLIYPTESGGWEEKGKVDIVLLPSRQFYNQIFLDIEEKGKHAFTYKDESIKFPLKGT
LGGARVQFDRDHLRRYPHKVESGNVGRIYFNMTVNIEPTESPVSKSLKIHRDDFPKFVNF
KPKELTEWIKDSKGKKLKSGIESLEIGLRVMSIDLGQRQAAAASIFEVVDQKPDIEGKLF
FPIKGTELYAVHRASFNIKLPGETLVKSREVLRKAREDNLKLMNQKLNFLRNVLHFQQFE
DITEREKRVTKWISRQENSDVPLVYQDELIQIRELMYKPYKDWVAFLKQLHKRLEVEIGK
EVKHWRKSLSDGRKGLYGISLKNIDEIDRTRKFLLRWSLRPTEPGEVRRLEPGQRFAIDQ
LNHLNALKEDRLKKMANTIIMHALGYCYDVRKKKWQAKNPACQIILFEDLSNYNPYEERS
RFENSKLMKWSRREIPRQVALQGEIYGLQVGEVGAQFSSRFHAKTGSPGIRCSVVTKEKL
QDNRFFKNLQREGRLTLDKIAVLKEGDLYPDKGGEKFISLSKDRKLVTTHADINAAQNLQ
KRFWTRTHGFYKVYCKAYQVDGQTVYIPESKDQKQKIIEEFGEGYFILKDGVYEWGNAGK
LKIKKGSSKQSSSELVDSDILKDSFDLASELKGEKLMLYRDPSGNVFPSDKWMAAGVFFG
KLERILISKLTNQYSISTIEDDSSKQSM
いくつかの実施形態において、napDNAbpはCas12cを指す。いくつかの実施形態において、Cas12cタンパク質はCas12c1またはCas12c1のバリアントである。いくつかの実施形態において、Cas12タンパク質はCas12c2またはCas12c2のバリアントである。いくつかの実施形態において、Cas12タンパク質はOleiphilus sp. HI0009からのCas12cタンパク質(すなわち、OspCas12c)またはOspCas12cのバリアントである。これらのCas12c分子はYan et al., “Functionally Diverse Type V CRISPR-Cas Systems,” Science, 2019 Jan. 4; 363: 88-91(その全内容は参照により本明細書に組み込まれる)に記載されている。いくつかの実施形態において、napDNAbpは、天然に存在するCas12c1、Cas12c2、またはOspCas12cタンパク質に対して少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。いくつかの実施形態において、napDNAbpは、天然に存在するCas12c1、Cas12c2、またはOspCas12cタンパク質である。いくつかの実施形態において、napDNAbpは、本明細書に記載の任意のCas12c1、Cas12c2、またはOspCas12cタンパク質に対して少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。他の細菌種からのCas12c1、Cas12c2、またはOspCas12cもまた本開示にしたがって使用され得ることが理解されるべきである。
Cas12c1
MQTKKTHLHLISAKASRKYRRTIACLSDTAKKDLERRKQSGAADPAQELSCLKTIKFKLEVPEGSKLPSFDRISQIYNALETIEKGSLSYLLFALILSGFRIFPNSSAAKTFASSSCYKNDQFASQIKEIFGEMVKNFIPSELESILKKGRRKNNKDWTEENIKRVLNSEFGRKNSEGSSALFDSFLSKFSQELFRKFDSWNEVNKKYLEAAELLDSMLASYGPFDSVCKMIGDSDSRNSLPDKSTIAFTNNAEITVDIESSVMPYMAIAALLREYRQSKSKAAPVAYVQSHLTTTNGNGLSWFFKFGLDLIRKAPVSSKQSTSDGSKSLQELFSVPDDKLDGLKFIKEACEALPEASLLCGEKGELLGYQDFRTSFAGHIDSWVANYVNRLFELIELVNQLPESIKLPSILTQKNHNLVASLGLQEAEVSHSLELFEGLVKNVRQTLKKLAGIDISSSPNEQDIKEFYAFSDVLNRLGSIRNQIENAVQTAKKDKIDLESAIEWKEWKKLKKLPKLNGLGGGVPKQQELLDKALESVKQIRHYQRIDFERVIQWAVNEHCLETVPKFLVDAEKKKINKESSTDFAAKENAVRFLLEGIGAAARGKTDSVSKAAYNWFVVNNFLAKKDLNRYFINCQGCIYKPPYSKRRSLAFALRSDNKDTIEVVWEKFETFYKEISKEIEKFNIFSQEFQTFLHLENLRMKLLLRRIQKPIPAEIAFFSLPQEYYDSLPPNVAFLALNQEITPSEYITQFNLYSSFLNGNLILLRRSRSYLRAKFSWVGNSKLIYAAKEARLWKIPNAYWKSDEWKMILDSNVLVFDKAGNVLPAPTLKKVCEREGDLRLFYPLLRQLPHDWCYRNPFVKSVGREKNVIEVNKEGEPKVASALPGSLFRLIGPAPFKSLLDDCFFNPLDKDLRECMLIVDQEISQKVEAQKVEASLESCTYSIAVPIRYHLEEPKVSNQFENVLAIDQGEAGLAYAVFSLKSIGEAETKPIAVGTIRIPSIRRLIHSVSTYRKKKQRLQNFKQNYDSTAFIMRENVTGDVCAKIVGLMKEFNAFPVLEYDVKNLESGSRQLSAVYKAVNSHFLYFKEPGRDALRKQLWYGGDSWTIDGIEIVTRERKEDGKEGVEKIVPLKVFPGRSVSARFTSKTCSCCGRNVFDWLFTEKKAKTNKKFNVNSKGELTTADGVIQLFEADRSKGPKFYARRKERTPLTKPIAKGSYSLEEIERRVRTNLRRAPKSKQSRDTSQSQYFCVYKDCALHFSGMQADENAAINIGRRFLTALRKNRRSDFPSNVKISDRLLDN
Cas12c2
MTKHSIPLHAFRNSGADARKWKGRIALLAKRGKETMRTLQFPLEMSEPEAAAINTTPFAVAYNAIEGTGKGTLFDYWAKLHLAGFRFFPSGGAATIFRQQAVFEDASWNAAFCQQSGKDWPWLVPSKLYERFTKAPREVAKKDGSKKSIEFTQENVANESHVSLVGASITDKTPEDQKEFFLKMAGALAEKFDSWKSANEDRIVAMKVIDEFLKSEGLHLPSLENIAVKCSVETKPDNATVAWHDAPMSGVQNLAIGVFATCASRIDNIYDLNGGKLSKLIQESATTPNVTALSWLFGKGLEYFRTTDIDTIMQDFNIPASAKESIKPLVESAQAIPTMTVLGKKNYAPFRPNFGGKIDSWIANYASRLMLLNDILEQIEPGFELPQALLDNETLMSGIDMTGDELKELIEAVYAWVDAAKQGLATLLGRGGNVDDAVQTFEQFSAMMDTLNGTLNTISARYVRAVEMAGKDEARLEKLIECKFDIPKWCKSVPKLVGISGGLPKVEEEIKVMNAAFKDVRARMFVRFEEIAAYVASKGAGMDVYDALEKRELEQIKKLKSAVPERAHIQAYRAVLHRIGRAVQNCSEKTKQLFSSKVIEMGVFKNPSHLNNFIFNQKGAIYRSPFDRSRHAPYQLHADKLLKNDWLELLAEISATLMASESTEQMEDALRLERTRLQLQLSGLPDWEYPASLAKPDIEVEIQTALKMQLAKDTVTSDVLQRAFNLYSSVLSGLTFKLLRRSFSLKMRFSVADTTQLIYVPKVCDWAIPKQYLQAEGEIGIAARVVTESSPAKMVTEVEMKEPKALGHFMQQAPHDWYFDASLGGTQVAGRIVEKGKEVGKERKLVGYRMRGNSAYKTVLDKSLVGNTELSQCSMIIEIPYTQTVDADFRAQVQAGLPKVSINLPVKETITASNKDEQMLFDRFVAIDLGERGLGYAVFDAKTLELQESGHRPIKAITNLLNRTHHYEQRPNQRQKFQAKFNVNLSELRENTVGDVCHQINRICAYYNAFPVLEYMVPDRLDKQLKSVYESVTNRYIWSSTDAHKSARVQFWLGGETWEHPYLKSAKDKKPLVLSPGRGASGKGTSQTCSCCGRNPFDLIKDMKPRAKIAVVDGKAKLENSELKLFERNLESKDDMLARRHRNERAGMEQPLTPGNYTVDEIKALLRANLRRAPKNRRTKDTTVSEYHCVFSDCGKTMHADENAAVNIGGKFIADIEK
OspCas12c
MTKLRHRQKKLTHDWAGSKKREVLGSNGKLQNPLLMPVKKGQVTEFRKAFSAYARATKGEMTDGRKNMFTHSFEPFKTKPSLHQCELADKAYQSLHSYLPGSLAHFLLSAHALGFRIFSKSGEATAFQASSKIEAYESKLASELACVDLSIQNLTISTLFNALTTSVRGKGEETSADPLIARFYTLLTGKPLSRDTQGPERDLAEVISRKIASSFGTWKEMTANPLQSLQFFEEELHALDANVSLSPAFDVLIKMNDLQGDLKNRTIVFDPDAPVFEYNAEDPADIIIKLTARYAKEAVIKNQNVGNYVKNAITTTNANGLGWLLNKGLSLLPVSTDDELLEFIGVERSHPSCHALIELIAQLEAPELFEKNVFSDTRSEVQGMIDSAVSNHIARLSSSRNSLSMDSEELERLIKSFQIHTPHCSLFIGAQSLSQQLESLPEALQSGVNSADILLGSTQYMLTNSLVEESIATYQRTLNRINYLSGVAGQINGAIKRKAIDGEKIHLPAAWSELISLPFIGQPVIDVESDLAHLKNQYQTLSNEFDTLISALQKNFDLNFNKALLNRTQHFEAMCRSTKKNALSKPEIVSYRDLLARLTSCLYRGSLVLRRAGIEVLKKHKIFESNSELREHVHERKHFVFVSPLDRKAKKLLRLTDSRPDLLHVIDEILQHDNLENKDRESLWLVRSGYLLAGLPDQLSSSFINLPIITQKGDRRLIDLIQYDQINRDAFVMLVTSAFKSNLSGLQYRANKQSFVVTRTLSPYLGSKLVYVPKDKDWLVPSQMFEGRFADILQSDYMVWKDAGRLCVIDTAKHLSNIKKSVFSSEEVLAFLRELPHRTFIQTEVRGLGVNVDGIAFNNGDIPSLKTFSNCVQVKVSRTNTSLVQTLNRWFEGGKVSPPSIQFERAYYKKDDQIHEDAAKRKIRFQMPATELVHASDDAGWTPSYLLGIDPGEYGMGLSLVSINNGEVLDSGFIHINSLINFASKKSNHQTKVVPRQQYKSPYANYLEQSKDSAAGDIAHILDRLIYKLNALPVFEALSGNSQSAADQVWTKVLSFYTWGDNDAQNSIRKQHWFGASHWDIKGMLRQPPTEKKPKPYIAFPGSQVSSYGNSQRCSCCGRNPIEQLREMAKDTSIKELKIRNSEIQLFDGTIKLFNPDPSTVIERRRHNLGPSRIPVADRTFKNISPSSLEFKELITIVSRSIRHSPEFIAKKRGIGSEYFCAYSDCNSSLNSEANAAANVAQKFQKQLFFEL
いくつかの実施形態において、napDNAbpはCas12g、Cas12h、またはCas12iを指し、これらは、例えば、Yan et al., “Functionally Diverse Type V CRISPR-Cas Systems,” Science, 2019 Jan. 4; 363: 88-91(それぞれの全内容は参照により本明細書に組み込まれる)に記載されている。10テラバイトより大きい配列データを集約することにより、Cas12g、Cas12h、およびCas12iを含む、以前に特徴付けられたクラスVタンパク質に対して弱い類似性を示すV型Casタンパク質の新たな分類が同定された。いくつかの実施形態において、Cas12タンパク質はCas12gまたはCas12gのバリアントである。いくつかの実施形態において、Cas12タンパク質はCas12hまたはCas12hのバリアントである。いくつかの実施形態において、Cas12タンパク質はCas12iまたはCas12iのバリアントである。他のRNAガイドDNA結合タンパク質をnapDNAbpとして使用することができ、それらは本開示の範囲内であることが理解されるべきである。いくつかの実施形態において、napDNAbpは、天然に存在するCas12g、Cas12h、またはCas12iタンパク質に対して少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。いくつかの実施形態において、napDNAbpは、天然に存在するCas12g、Cas12h、またはCas12iタンパク質である。いくつかの実施形態において、napDNAbpは、本明細書に記載の任意のCas12g、Cas12h、またはCas12iタンパク質に対して少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。他の細菌種からのCas12g、Cas12h、またはCas12iもまた本開示にしたがって使用され得ることが理解されるべきである。いくつかの実施形態において、Cas12iはCas12i1またはCas12i2である。
Cas12g1
MAQASSTPAVSPRPRPRYREERTLVRKLLPRPGQSKQEFRENVKKLRKAFLQFNADVSGVCQWAIQFRPRYGKPAEPTETFWKFFLEPETSLPPNDSRSPEFRRLQAFEAAAGINGAAALDDPAFTNELRDSILAVASRPKTKEAQRLFSRLKDYQPAHRMILAKVAAEWIESRYRRAHQNWERNYEEWKKEKQEWEQNHPELTPEIREAFNQIFQQLEVKEKRVRICPAARLLQNKDNCQYAGKNKHSVLCNQFNEFKKNHLQGKAIKFFYKDAEKYLRCGLQSLKPNVQGPFREDWNKYLRYMNLKEETLRGKNGGRLPHCKNLGQECEFNPHTALCKQYQQQLSSRPDLVQHDELYRKWRREYWREPRKPVFRYPSVKRHSIAKIFGENYFQADFKNSVVGLRLDSMPAGQYLEFAFAPWPRNYRPQPGETEISSVHLHFVGTRPRIGFRFRVPHKRSRFDCTQEELDELRSRTFPRKAQDQKFLEAARKRLLETFPGNAEQELRLLAVDLGTDSARAAFFIGKTFQQAFPLKIVKIEKLYEQWPNQKQAGDRRDASSKQPRPGLSRDHVGRHLQKMRAQASEIAQKRQELTGTPAPETTTDQAAKKATLQPFDLRGLTVHTARMIRDWARLNARQIIQLAEENQVDLIVLESLRGFRPPGYENLDQEKKRRVAFFAHGRIRRKVTEKAVERGMRVVTVPYLASSKVCAECRKKQKDNKQWEKNKKRGLFKCEGCGSQAQVDENAARVLGRVFWGEIELPTAIP
Cas12h1
MKVHEIPRSQLLKIKQYEGSFVEWYRDLQEDRKKFASLLFRWAAFGYAAREDDGATYISPSQALLERRLLLGDAEDVAIKFLDVLFKGGAPSSSCYSLFYEDFALRDKAKYSGAKREFIEGLATMPLDKIIERIRQDEQLSKIPAEEWLILGAEYSPEEIWEQVAPRIVNVDRSLGKQLRERLGIKCRRPHDAGYCKILMEVVARQLRSHNETYHEYLNQTHEMKTKVANNLTNEFDLVCEFAEVLEEKNYGLGWYVLWQGVKQALKEQKKPTKIQIAVDQLRQPKFAGLLTAKWRALKGAYDTWKLKKRLEKRKAFPYMPNWDNDYQIPVGLTGLGVFTLEVKRTEVVVDLKEHGKLFCSHSHYFGDLTAEKHPSRYHLKFRHKLKLRKRDSRVEPTIGPWIEAALREITIQKKPNGVFYLGLPYALSHGIDNFQIAKRFFSAAKPDKEVINGLPSEMVVGAADLNLSNIVAPVKARIGKGLEGPLHALDYGYGELIDGPKILTPDGPRCGELISLKRDIVEIKSAIKEFKACQREGLTMSEETTTWLSEVESPSDSPRCMIQSRIADTSRRLNSFKYQMNKEGYQDLAEALRLLDAMDSYNSLLESYQRMHLSPGEQSPKEAKFDTKRASFRDLLRRRVAHTIVEYFDDCDIVFFEDLDGPSDSDSRNNALVKLLSPRTLLLYIRQALEKRGIGMVEVAKDGTSQNNPISGHVGWRNKQNKSEIYFYEDKELLVMDADEVGAMNILCRGLNHSVCPYSFVTKAPEKKNDEKKEGDYGKRVKRFLKDRYGSSNVRFLVASMGFVTVTTKRPKDALVGKRLYYHGGELVTHDLHNRMKDEIKYLVEKEVLARRVSLSDSTIKSYKSFAHV
Cas12i1
MSNKEKNASETRKAYTTKMIPRSHDRMKLLGNFMDYLMDGTPIFFELWNQFGGGIDRDIISGTANKDKISDDLLLAVNWFKVMPINSKPQGVSPSNLANLFQQYSGSEPDIQAQEYFASNFDTEKHQWKDMRVEYERLLAELQLSRSDMHHDLKLMYKEKCIGLSLSTAHYITSVMFGTGAKNNRQTKHQFYSKVIQLLEESTQINSVEQLASIILKAGDCDSYRKLRIRCSRKGATPSILKIVQDYELGTNHDDEVNVPSLIANLKEKLGRFEYECEWKCMEKIKAFLASKVGPYYLGSYSAMLENALSPIKGMTTKNCKFVLKQIDAKNDIKYENEPFGKIVEGFFDSPYFESDTNVKWVLHPHHIGESNIKTLWEDLNAIHSKYEEDIASLSEDKKEKRIKVYQGDVCQTINTYCEEVGKEAKTPLVQLLRYLYSRKDDIAVDKIIDGITFLSKKHKVEKQKINPVIQKYPSFNFGNNSKLLGKIISPKDKLKHNLKCNRNQVDNYIWIEIKVLNTKTMRWEKHHYALSSTRFLEEVYYPATSENPPDALAARFRTKTNGYEGKPALSAEQIEQIRSAPVGLRKVKKRQMRLEAARQQNLLPRYTWGKDFNINICKRGNNFEVTLATKVKKKKEKNYKVVLGYDANIVRKNTYAAIEAHANGDGVIDYNDLPVKPIESGFVTVESQVRDKSYDQLSYNGVKLLYCKPHVESRRSFLEKYRNGTMKDNRGNNIQIDFMKDFEAIADDETSLYYFNMKYCKLLQSSIRNHSSQAKEYREEIFELLRDGKLSVLKLSSLSNLSFVMFKVAKSLIGTYFGHLLKKPKNSKSDVKAPPITDEDKQKADPEMFALRLALEEKRLNKVKSKKEVIANKIVAKALELRDKYGPVLIKGENISDTTKKGKKSSTNSFLMDWLARGVANKVKEMVMMHQGLEFVEVNPNFTSHQDPFVHKNPENTFRARYSRCTPSELTEKNRKEILSFLSDKPSKRPTNAYYNEGAMAFLATYGLKKNDVLGVSLEKFKQIMANILHQRSEDQLLFPSRGGMFYLATYKLDADATSVNWNGKQFWVCNADLVAAYNVGLVDIQKDFKKK
Cas12i2
MSSAIKSYKSVLRPNERKNQLLKSTIQCLEDGSAFFFKMLQGLFGGITPEIVRFSTEQEKQQQDIALWCAVNWFRPVSQDSLTHTIASDNLVEKFEEYYGGTASDAIKQYFSASIGESYYWNDCRQQYYDLCRELGVEVSDLTHDLEILCREKCLAVATESNQNNSIISVLFGTGEKEDRSVKLRITKKILEAISNLKEIPKNVAPIQEIILNVAKATKETFRQVYAGNLGAPSTLEKFIAKDGQKEFDLKKLQTDLKKVIRGKSKERDWCCQEELRSYVEQNTIQYDLWAWGEMFNKAHTALKIKSTRNYNFAKQRLEQFKEIQSLNNLLVVKKLNDFFDSEFFSGEETYTICVHHLGGKDLSKLYKAWEDDPADPENAIVVLCDDLKNNFKKEPIRNILRYIFTIRQECSAQDILAAAKYNQQLDRYKSQKANPSVLGNQGFTWTNAVILPEKAQRNDRPNSLDLRIWLYLKLRHPDGRWKKHHIPFYDTRFFQEIYAAGNSPVDTCQFRTPRFGYHLPKLTDQTAIRVNKKHVKAAKTEARIRLAIQQGTLPVSNLKITEISATINSKGQVRIPVKFDVGRQKGTLQIGDRFCGYDQNQTASHAYSLWEVVKEGQYHKELGCFVRFISSGDIVSITENRGNQFDQLSYEGLAYPQYADWRKKASKFVSLWQITKKNKKKEIVTVEAKEKFDAICKYQPRLYKFNKEYAYLLRDIVRGKSLVELQQIRQEIFRFIEQDCGVTRLGSLSLSTLETVKAVKGIIYSYFSTALNASKNNPISDEQRKEFDPELFALLEKLELIRTRKKKQKVERIANSLIQTCLENNIKFIRGEGDLSTTNNATKKKANSRSMDWLARGVFNKIRQLAPMHNITLFGCGSLYTSHQDPLVHRNPDKAMKCRWAAIPVKDIGDWVLRKLSQNLRAKNIGTGEYYHQGVKEFLSHYELQDLEEELLKWRSDRKSNIPCWVLQNRLAEKLGNKEAVVYIPVRGGRIYFATHKVATGAVSIVFDQKQVWVCNADHVAAANIALTVKGIGEQSSDEENPDGSRIKLQLTS
塩基エディターの代表的な核酸およびタンパク質配列は以下の通りである:
BhCas12b GGSGGS-ABE8-Xten20 at P153
Figure 2022520081000022
Figure 2022520081000023
MAPKKKRKVGIHGVPAAATRSFILKIEPNEEVKKGLWKTHEVLNHGIAYYMNILKLIRQEAIYEHHEQDPKNPKKVSKAEIQAELWDFVLKMQKCNSFTHEVDKDEVFNILRELYEELVPSSVEKKGEANQLSNKFLYPLVDPNSQSGKGTASSGRKPRWYNLKIAGDPGGSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGSWEEEKKKWEEDKKKDPLAKILGKLAEYGLIPLFIPYTDSNEPIVKEIKWMEKSRNQSVRRLDKDMFIQALERFLSWESWNLKVKEEYEKVEKEYKTLEERIKEDIQALKALEQYEKERQEQLLRDTLNTNEYRLSKRGLRGWREIIQKWLKMDENEPSEKYLEVFKDYQRKHPREAGDYSVYEFLSKKENHFIWRNHPEYPYLYATFCEIDKKKKDAKQQATFTLADPINHPLWVRFEERSGSNLNKYRILTEQLHTEKLKKKLTVQLDRLIYPTESGGWEEKGKVDIVLLPSRQFYNQIFLDIEEKGKHAFTYKDESIKFPLKGTLGGARVQFDRDHLRRYPHKVESGNVGRIYFNMTVNIEPTESPVSKSLKIHRDDFPKVVNFKPKELTEWIKDSKGKKLKSGIESLEIGLRVMSIDLGQRQAAAASIFEVVDQKPDIEGKLFFPIKGTELYAVHRASFNIKLPGETLVKSREVLRKAREDNLKLMNQKLNFLRNVLHFQQFEDITEREKRVTKWISRQENSDVPLVYQDELIQIRELMYKPYKDWVAFLKQLHKRLEVEIGKEVKHWRKSLSDGRKGLYGISLKNIDEIDRTRKFLLRWSLRPTEPGEVRRLEPGQRFAIDQLNHLNALKEDRLKKMANTIIMHALGYCYDVRKKKWQAKNPACQIILFEDLSNYNPYEERSRFENSKLMKWSRREIPRQVALQGEIYGLQVGEVGAQFSSRFHAKTGSPGIRCSVVTKEKLQDNRFFKNLQREGRLTLDKIAVLKEGDLYPDKGGEKFISLSKDRKCVTTHADINAAQNLQKRFWTRTHGFYKVYCKAYQVDGQTVYIPESKDQKQKIIEEFGEGYFILKDGVYEWVNAGKLKIKKGSSKQSSSELVDSDILKDSFDLASELKGEKLMLYRDPSGNVFPSDKWMAAGVFFGKLERILISKLTNQYSISTIEDDSSKQSMKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA
BhCas12b GGSGGS-ABE8-Xten20 at K255
Figure 2022520081000024
Figure 2022520081000025
MAPKKKRKVGIHGVPAAATRSFILKIEPNEEVKKGLWKTHEVLNHGIAYYMNILKLIRQEAIYEHHEQDPKNPKKVSKAEIQAELWDFVLKMQKCNSFTHEVDKDEVFNILRELYEELVPSSVEKKGEANQLSNKFLYPLVDPNSQSGKGTASSGRKPRWYNLKIAGDPSWEEEKKKWEEDKKKDPLAKILGKLAEYGLIPLFIPYTDSNEPIVKEIKWMEKSRNQSVRRLDKDMFIQALERFLSWESWNLKVKEEYEKVEKEYKTLEERIKGGSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGEDIQALKALEQYEKERQEQLLRDTLNTNEYRLSKRGLRGWREIIQKWLKMDENEPSEKYLEVFKDYQRKHPREAGDYSVYEFLSKKENHFIWRNHPEYPYLYATFCEIDKKKKDAKQQATFTLADPINHPLWVRFEERSGSNLNKYRILTEQLHTEKLKKKLTVQLDRLIYPTESGGWEEKGKVDIVLLPSRQFYNQIFLDIEEKGKHAFTYKDESIKFPLKGTLGGARVQFDRDHLRRYPHKVESGNVGRIYFNMTVNIEPTESPVSKSLKIHRDDFPKVVNFKPKELTEWIKDSKGKKLKSGIESLEIGLRVMSIDLGQRQAAAASIFEVVDQKPDIEGKLFFPIKGTELYAVHRASFNIKLPGETLVKSREVLRKAREDNLKLMNQKLNFLRNVLHFQQFEDITEREKRVTKWISRQENSDVPLVYQDELIQIRELMYKPYKDWVAFLKQLHKRLEVEIGKEVKHWRKSLSDGRKGLYGISLKNIDEIDRTRKFLLRWSLRPTEPGEVRRLEPGQRFAIDQLNHLNALKEDRLKKMANTIIMHALGYCYDVRKKKWQAKNPACQIILFEDLSNYNPYEERSRFENSKLMKWSRREIPRQVALQGEIYGLQVGEVGAQFSSRFHAKTGSPGIRCSVVTKEKLQDNRFFKNLQREGRLTLDKIAVLKEGDLYPDKGGEKFISLSKDRKCVTTHADINAAQNLQKRFWTRTHGFYKVYCKAYQVDGQTVYIPESKDQKQKIIEEFGEGYFILKDGVYEWVNAGKLKIKKGSSKQSSSELVDSDILKDSFDLASELKGEKLMLYRDPSGNVFPSDKWMAAGVFFGKLERILISKLTNQYSISTIEDDSSKQSMKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA
BhCas12b GGSGGS-ABE8-Xten20 at D306
Figure 2022520081000026
Figure 2022520081000027
MAPKKKRKVGIHGVPAAATRSFILKIEPNEEVKKGLWKTHEVLNHGIAYYMNILKLIRQEAIYEHHEQDPKNPKKVSKAEIQAELWDFVLKMQKCNSFTHEVDKDEVFNILRELYEELVPSSVEKKGEANQLSNKFLYPLVDPNSQSGKGTASSGRKPRWYNLKIAGDPSWEEEKKKWEEDKKKDPLAKILGKLAEYGLIPLFIPYTDSNEPIVKEIKWMEKSRNQSVRRLDKDMFIQALERFLSWESWNLKVKEEYEKVEKEYKTLEERIKEDIQALKALEQYEKERQEQLLRDTLNTNEYRLSKRGLRGWREIIQKWLKMDGGSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGENEPSEKYLEVFKDYQRKHPREAGDYSVYEFLSKKENHFIWRNHPEYPYLYATFCEIDKKKKDAKQQATFTLADPINHPLWVRFEERSGSNLNKYRILTEQLHTEKLKKKLTVQLDRLIYPTESGGWEEKGKVDIVLLPSRQFYNQIFLDIEEKGKHAFTYKDESIKFPLKGTLGGARVQFDRDHLRRYPHKVESGNVGRIYFNMTVNIEPTESPVSKSLKIHRDDFPKVVNFKPKELTEWIKDSKGKKLKSGIESLEIGLRVMSIDLGQRQAAAASIFEVVDQKPDIEGKLFFPIKGTELYAVHRASFNIKLPGETLVKSREVLRKAREDNLKLMNQKLNFLRNVLHFQQFEDITEREKRVTKWISRQENSDVPLVYQDELIQIRELMYKPYKDWVAFLKQLHKRLEVEIGKEVKHWRKSLSDGRKGLYGISLKNIDEIDRTRKFLLRWSLRPTEPGEVRRLEPGQRFAIDQLNHLNALKEDRLKKMANTIIMHALGYCYDVRKKKWQAKNPACQIILFEDLSNYNPYEERSRFENSKLMKWSRREIPRQVALQGEIYGLQVGEVGAQFSSRFHAKTGSPGIRCSVVTKEKLQDNRFFKNLQREGRLTLDKIAVLKEGDLYPDKGGEKFISLSKDRKCVTTHADINAAQNLQKRFWTRTHGFYKVYCKAYQVDGQTVYIPESKDQKQKIIEEFGEGYFILKDGVYEWVNAGKLKIKKGSSKQSSSELVDSDILKDSFDLASELKGEKLMLYRDPSGNVFPSDKWMAAGVFFGKLERILISKLTNQYSISTIEDDSSKQSMKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA
BhCas12b GGSGGS-ABE8-Xten20 at D980
Figure 2022520081000028
Figure 2022520081000029
MAPKKKRKVGIHGVPAAATRSFILKIEPNEEVKKGLWKTHEVLNHGIAYYMNILKLIRQEAIYEHHEQDPKNPKKVSKAEIQAELWDFVLKMQKCNSFTHEVDKDEVFNILRELYEELVPSSVEKKGEANQLSNKFLYPLVDPNSQSGKGTASSGRKPRWYNLKIAGDPSWEEEKKKWEEDKKKDPLAKILGKLAEYGLIPLFIPYTDSNEPIVKEIKWMEKSRNQSVRRLDKDMFIQALERFLSWESWNLKVKEEYEKVEKEYKTLEERIKEDIQALKALEQYEKERQEQLLRDTLNTNEYRLSKRGLRGWREIIQKWLKMDENEPSEKYLEVFKDYQRKHPREAGDYSVYEFLSKKENHFIWRNHPEYPYLYATFCEIDKKKKDAKQQATFTLADPINHPLWVRFEERSGSNLNKYRILTEQLHTEKLKKKLTVQLDRLIYPTESGGWEEKGKVDIVLLPSRQFYNQIFLDIEEKGKHAFTYKDESIKFPLKGTLGGARVQFDRDHLRRYPHKVESGNVGRIYFNMTVNIEPTESPVSKSLKIHRDDFPKVVNFKPKELTEWIKDSKGKKLKSGIESLEIGLRVMSIDLGQRQAAAASIFEVVDQKPDIEGKLFFPIKGTELYAVHRASFNIKLPGETLVKSREVLRKAREDNLKLMNQKLNFLRNVLHFQQFEDITEREKRVTKWISRQENSDVPLVYQDELIQIRELMYKPYKDWVAFLKQLHKRLEVEIGKEVKHWRKSLSDGRKGLYGISLKNIDEIDRTRKFLLRWSLRPTEPGEVRRLEPGQRFAIDQLNHLNALKEDRLKKMANTIIMHALGYCYDVRKKKWQAKNPACQIILFEDLSNYNPYEERSRFENSKLMKWSRREIPRQVALQGEIYGLQVGEVGAQFSSRFHAKTGSPGIRCSVVTKEKLQDNRFFKNLQREGRLTLDKIAVLKEGDLYPDKGGEKFISLSKDRKCVTTHADINAAQNLQKRFWTRTHGFYKVYCKAYQVDGGSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGGQTVYIPESKDQKQKIIEEFGEGYFILKDGVYEWVNAGKLKIKKGSSKQSSSELVDSDILKDSFDLASELKGEKLMLYRDPSGNVFPSDKWMAAGVFFGKLERILISKLTNQYSISTIEDDSSKQSMKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA
BhCas12b GGSGGS-ABE8-Xten20 at K1019
Figure 2022520081000030
Figure 2022520081000031
MAPKKKRKVGIHGVPAAATRSFILKIEPNEEVKKGLWKTHEVLNHGIAYYMNILKLIRQEAIYEHHEQDPKNPKKVSKAEIQAELWDFVLKMQKCNSFTHEVDKDEVFNILRELYEELVPSSVEKKGEANQLSNKFLYPLVDPNSQSGKGTASSGRKPRWYNLKIAGDPSWEEEKKKWEEDKKKDPLAKILGKLAEYGLIPLFIPYTDSNEPIVKEIKWMEKSRNQSVRRLDKDMFIQALERFLSWESWNLKVKEEYEKVEKEYKTLEERIKEDIQALKALEQYEKERQEQLLRDTLNTNEYRLSKRGLRGWREIIQKWLKMDENEPSEKYLEVFKDYQRKHPREAGDYSVYEFLSKKENHFIWRNHPEYPYLYATFCEIDKKKKDAKQQATFTLADPINHPLWVRFEERSGSNLNKYRILTEQLHTEKLKKKLTVQLDRLIYPTESGGWEEKGKVDIVLLPSRQFYNQIFLDIEEKGKHAFTYKDESIKFPLKGTLGGARVQFDRDHLRRYPHKVESGNVGRIYFNMTVNIEPTESPVSKSLKIHRDDFPKVVNFKPKELTEWIKDSKGKKLKSGIESLEIGLRVMSIDLGQRQAAAASIFEVVDQKPDIEGKLFFPIKGTELYAVHRASFNIKLPGETLVKSREVLRKAREDNLKLMNQKLNFLRNVLHFQQFEDITEREKRVTKWISRQENSDVPLVYQDELIQIRELMYKPYKDWVAFLKQLHKRLEVEIGKEVKHWRKSLSDGRKGLYGISLKNIDEIDRTRKFLLRWSLRPTEPGEVRRLEPGQRFAIDQLNHLNALKEDRLKKMANTIIMHALGYCYDVRKKKWQAKNPACQIILFEDLSNYNPYEERSRFENSKLMKWSRREIPRQVALQGEIYGLQVGEVGAQFSSRFHAKTGSPGIRCSVVTKEKLQDNRFFKNLQREGRLTLDKIAVLKEGDLYPDKGGEKFISLSKDRKCVTTHADINAAQNLQKRFWTRTHGFYKVYCKAYQVDGQTVYIPESKDQKQKIIEEFGEGYFILKDGVYEWVNAGKGGSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGLKIKKGSSKQSSSELVDSDILKDSFDLASELKGEKLMLYRDPSGNVFPSDKWMAAGVFFGKLERILISKLTNQYSISTIEDDSSKQSMKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA
上記の配列について、Kozak配列を太字とし、下線を付しており;N末端核局在化シグナル (NLS) を示し、小文字はGGGSGGSリンカーを示し、破線の下線はABE8をコードする配列を示し、非改変の配列はBhCas12bをコードし、二重下線はXten20リンカーを示し、一重下線はC末端NLSを示し、GGATCC(点線の下線)はGSリンカーを示し、斜体字は3xヘマグルチニン(HA)タグのコード配列を表す。
[ガイドポリヌクレオチド]
ある実施形態では、ガイドポリヌクレオチドはガイドRNAである。RNA/Cas複合体は、Casタンパク質を標的DNAに「ガイド」するのを補助することができる。Cas9/crRNA/tracrRNAは、スペーサーに相補的な線状または環状dsDNA標的をエンドヌクレアーゼ的に切断する。crRNAに相補的でない標的鎖が最初にエンドヌクレアーゼで切断され、次いでエキソヌクレアーゼ的に3’-5’方向にトリムされる。自然界では、DNA結合と切断にはタンパク質と両方のRNAが通常必要とされる。しかしながら、crRNAおよびtracrRNAの両方の側面を単一のRNA種に組み込むように、単一ガイドRNA (「sgRNA」、または単に「gRNA」)を作製することができる。例えば、Jinek M. et al., Science 337:816-821(2012)を参照されたい(その内容全体が参照により本明細書に組み入れられる)。Cas9は、CRISPR反復配列中の短いモチーフ(PAMまたはプロトスペーサー隣接モチーフ)を認識して、自己と非自己を区別するのを助ける。Cas9ヌクレアーゼの配列および構造は、当業者によく知られている(例えば“Complete genome sequence of an M1 strain of Streptococcus pyogenes.” Ferretti, J.J. et al., Natl. Acad. Sci. U.S.A. 98:4658-4663(2001); “CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III.” Deltcheva E. et al., Nature 471:602-607(2011); および “Programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.” Jinek M.et al, Science 337:816-821(2012)参照。その内容全体が参照により本明細書に組み入れられる)。Cas9オーソログは、限定されるものではないが、S. pyogenes および S. thermophilusを含む様々な種において記述されている。さらなる適切なCas9ヌクレアーゼおよび配列は、本開示に基づいて当業者に明らかとなり得、そのようなCas9ヌクレアーゼおよび配列には、Chylinski, Rhun, and Charpentier, “The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems”(2013) RNA Biology 10:5, 726-737に開示されている生物および遺伝子座からのCas9配列が含まれる(その全内容は参照により本明細書に組み込まれる)。いくつかの実施形態において、Cas9ヌクレアーゼは、不活性(例えば不活化) DNA切断ドメインを有し、すなわち、Cas9はニッカーゼである。
いくつかの実施形態において、ガイドポリヌクレオチドは、少なくとも一つの単一ガイドRNA (「sgRNA」または「gRNA」)である。いくつかの実施形態において、ガイドポリヌクレオチドは、少なくとも一つのtracrRNAであり、いくつかの実施形態において、ガイドポリヌクレオチドは、ポリヌクレオチドプログラム可能なDNA結合ドメイン(例:Cas9またはCpf1)を標的ヌクレオチド配列に導くためにPAM配列を必要としない。
本願明細書に開示される塩基エディターのポリヌクレオチドプログラム可能ヌクレオチド結合ドメイン(例えばCRISPR由来ドメイン)は、ガイドポリヌクレオチドと会合することによって標的ポリヌクレオチド配列を認識することができる。ガイドポリヌクレオチド(例えばgRNA)は、典型的には一本鎖であり、ポリヌクレオチドの標的配列に部位特異的に結合(すなわち相補的塩基対形成を介して)するようにプログラムすることができ、それによって、ガイド核酸を伴った塩基エディターを標的配列に導く。ガイドポリヌクレオチドはDNAであり得る。ガイドポリヌクレオチドはRNAであり得る。いくつかの実施形態において、ガイドポリヌクレオチドは天然ヌクレオチド(例えばアデノシン)を含む。いくつかの実施形態において、ガイドポリヌクレオチドは、非天然(または不自然)ヌクレオチド(例えばペプチド核酸またはヌクレオチドアナログ)を含む。いくつかの実施形態において、ガイド核酸配列の標的化領域は、長さが少なくとも15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30ヌクレオチドであり得る。ガイド核酸の標的化領域は、長さが10~30ヌクレオチドの間、または長さが15~25ヌクレオチドの間、または長さが15~20ヌクレオチドの間であり得る。
いくつかの実施形態において、ガイドポリヌクレオチドは、例えば相補的塩基対形成を介して互いに相互作用できる、二つ以上の個別のポリヌクレオチドを含む(例えば二重ガイドポリヌクレオチド)。例えば、ガイドポリヌクレオチドは、CRISPR RNA (crRNA) およびトランス活性化CRISPR RNA (tracrRNA) を含むことができる。例えば、ガイドポリヌクレオチドは、1以上のトランス活性化CRISPR RNA (tracrRNA) を含むことができる。
II型CRISPRシステムにおいて、CRISPRタンパク質(例Cas9)による核酸の標的化は、典型的には、標的配列を認識する配列を含む第一のRNA分子 (crRNA) と、ガイドRNA-CRISPRタンパク質複合体を安定化させる足場領域を形成する反復配列を含む第二のRNA分子 (trRNA) との間の相補的塩基対形成を必要とする。このような二重ガイドRNAシステムは、本明細書に開示された塩基エディターを標的ポリヌクレオチド配列に導くためのガイドポリヌクレオチドとして利用され得る。
いくつかの実施形態において、本明細書で提供される塩基エディターは、単一ガイドポリヌクレオチド(例えばgRNA)を利用する。いくつかの実施形態において、本明細書で提供される塩基エディターは、デュアル(二重)ガイドポリヌクレオチド(例えばデュアルgRNA)を利用する。いくつかの実施形態において、本明細書で提供される塩基エディターは、一つ以上のガイドポリヌクレオチド(例えば複数のgRNA)を利用する。いくつかの実施形態において、単一ガイドポリヌクレオチドが、本明細書に記載される異なる塩基エディターのために利用される。例えば、単一ガイドポリヌクレオチドを、シチジン塩基エディターおよびアデノシン塩基エディターのために利用することができる。
他の実施形態では、ガイドポリヌクレオチドは、核酸のポリヌクレオチド標的化部分および核酸の足場部分の両方を単一分子(すなわち単一分子ガイド核酸)中に含むことができる。例えば、単一分子ガイドポリヌクレオチドは、単一ガイドRNA (sgRNAまたはgRNA)であり得る。本明細書において、「ガイドポリヌクレオチド配列」という用語は、塩基エディターと相互作用し標的ポリヌクレオチド配列に塩基エディターを導くことができる任意の単一、二重または複数分子核酸を企図する。
典型的には、ガイドポリヌクレオチド(例えばcrRNA/trRNA複合体またはgRNA)は、標的ポリヌクレオチド配列を認識しそれに結合することができる配列を含む「ポリヌクレオチド標的セグメント」と、塩基エディターのポリヌクレオチドプログラム可能ヌクレオチド結合ドメイン成分内でガイドポリヌクレオチドを安定化させる「タンパク質結合セグメント」とを含む。いくつかの実施形態では、ガイドポリヌクレオチドのポリヌクレオチド標的セグメントは、DNAポリヌクレオチドを認識してそれに結合し、それによりDNA中の塩基の編集を促進する。他の実施形態では、ガイドポリヌクレオチドのポリヌクレオチド標的セグメントは、RNAポリヌクレオチドを認識しそれに結合し、それによりRNA中の塩基の編集を促進する。ここで、「セグメント」とは、分子の一部分または領域、例えばガイドポリヌクレオチド中の連続したヌクレオチドのストレッチをいう。また、セグメントは、複合体の領域/セクションも表し得、従ってセグメントは2つ以上の分子の領域を含むことができる。例えば、ガイドポリヌクレオチドが複数の核酸分子を含む場合、タンパク質結合セグメントは、例えば相補性の領域に沿ってハイブリダイズした複数の別個の分子の全てまたは一部を含むことができる。いくつかの実施形態において、二つの別個の分子を含むDNA標的化RNAのタンパク質結合セグメントは、 (i) 長さが100塩基対である第一のRNA分子の塩基対40~75;および(ii) 長さが50塩基対である第二のRNA分子の10~25塩基対を含み得る。「セグメント」の定義は、特定の文脈において特に定義されない限り、全塩基対のうちの特定の数に限定されず、所与のRNA分子からの塩基対の特定の数に限定されず、複合体内の別個の分子の特定の数に限定されず、任意の全長のRNA分子の領域を含み得、他の分子に対する相補性を有する領域を含み得る。
ガイドRNAまたはガイドポリヌクレオチドは、2つ以上のRNA、例えばCRISPR RNA (crRNA) およびトランス活性化crRNA (tracrRNA) を含むことができる。ガイドRNAまたはガイドポリヌクレオチドは、時に、crRNAおよびtracrRNAの一部分(例えば機能的部分) の融合によって形成される単一鎖RNA、あるいは単一ガイドRNA (sgRNA) を含み得る。ガイドRNAまたはガイドポリヌクレオチドは、crRNAおよびtracrRNAを含む二重RNAであってもよい。さらに、crRNAは標的DNAとハイブリダイズし得る。
上述のように、ガイドRNAまたはガイドポリヌクレオチドは、発現産物であり得る。例えば、ガイドRNAをコードするDNAは、ガイドRNAをコードする配列を含むベクターであり得る。ガイドRNAまたはガイドポリヌクレオチドは、単離されたガイドRNA、またはガイドRNAをコードする配列およびプロモーターを含むプラスミドDNAを細胞にトランスフェクトすることによって、細胞に導入することができる。ガイドRNAまたはガイドポリヌクレオチドは、ウイルス媒介遺伝子送達の使用など、他の方法で細胞に導入することもできる。
ガイドRNAまたはガイドポリヌクレオチドを単離することができる。例えば、ガイドRNAは、単離されたRNAの形態で細胞または生物にトランスフェクトされ得る。ガイドRNAは、当技術分野で公知の任意のインビトロ転写系を用いたインビトロ転写によって調製することができる。ガイドRNAは、ガイドRNAをコードする配列を含むプラスミドの形態ではなく、単離されたRNAの形態で細胞に移入され得る。
ガイドRNAまたはガイドポリヌクレオチドは、以下の3つの領域を含み得る:染色体配列中の標的部位に相補的であり得る5’末端における第1の領域、ステムループ構造を形成し得る第2の内部領域、および一本鎖であり得る第3の3’領域。各ガイドRNAが融合タンパク質を特異的な標的部位にガイドするように、各ガイドRNAの第1の領域を異ならせることもできる。さらに、各ガイドRNAの第2および第3の領域は、すべてのガイドRNAにおいて同一であり得る。
ガイドRNAまたはガイドポリヌクレオチドの第1の領域は、そのガイドRNAの第1の領域が標的部位と塩基対を形成できるように、染色体配列の標的部位における配列に相補的であり得る。いくつかの実施形態では、ガイドRNAの第一の領域は、約10ヌクレオチド~25ヌクレオチド(すなわち、10ヌクレオチドからヌクレオチドまで;または約10ヌクレオチドから約25ヌクレオチドまで;または10ヌクレオチドから約25ヌクレオチドまで;または約10ヌクレオチドから25ヌクレオチドまで)またはそれ以上を含むことができる。例えば、ガイドRNAの第一の領域と染色体配列中の標的部位との間の塩基対形成の領域は、長さが約10、11、12、13、14、15、16、17、18、19、20、22、23、24、25またはそれ以上のヌクレオチドであり得るか、またはおよそその長さであり得る。ときに、ガイドRNAの第一の領域は、長さが19、20、もしくは21ヌクレオチド、または約19、20、もしくは21ヌクレオチドであり得る。
ガイドRNAまたはガイドポリヌクレオチドは、二次構造を形成する第2の領域を含むこともできる。例えば、ガイドRNAによって形成される二次構造は、ステム(またはヘアピン)およびループを含むことができる。ループとステムの長さはさまざまであり得る。例えば、ループの長さは(約)3から10ヌクレオチドの範囲であり得、ステムの長さは(約)6から20塩基対の範囲であり得る。ステムは、1から10または約10ヌクレオチドの一つ以上のバルジを含むことができる。第二の領域の全長は、約16から60ヌクレオチド長の範囲であり得る。例えば、ループは長さが(約)4ヌクレオチドであり得、ステムは(約)12塩基対であり得る。
ガイドRNAまたはガイドポリヌクレオチドは、本質的に一本鎖状態であり得る3'末端の第3の領域も含むこともできる。たとえば、第3の領域は、対象とする細胞のいずれの染色体配列とも相補的でないこともあれば、ガイドRNAの残りの部分と相補的でないこともある。さらに第3の領域の長さはさまざまであり得る。第3の領域は、長さが約4ヌクレオチド以上であり得る。例えば、第3の領域の長さは、(約)5から60ヌクレオチド長の範囲であり得る。
ガイドRNAまたはガイドポリヌクレオチドは、遺伝子標的の任意のエクソンまたはイントロンを標的とすることができる。いくつかの実施形態では、ガイドは遺伝子のエクソン1または2を標的にすることができる;他の実施形態では、ガイドは遺伝子のエクソン3または4を標的にすることができる。組成物は、全てが同じエクソンを標的とする複数のガイドRNA、またはいくつかの実施形態では、異なるエクソンを標的とする複数のガイドRNAを含むことができる。遺伝子のエクソンとイントロンが標的とされ得る。
ガイドRNAまたはガイドポリヌクレオチドは、(約)20ヌクレオチドの核酸配列を標的とし得る。標的核酸は、(約)20ヌクレオチド未満であり得る。標的核酸は、長さが少なくとも(約)5、10、15、16、17、18、19、20、21、22、23、24、25、30、または1~100ヌクレオチドの間の任意の長さであり得る。標的核酸は、長さが多くとも約5、10、15、16、17、18、19、20、21、22、23、24、25、30、40、50ヌクレオチド、または1~100ヌクレオチドの間の任意の長さであり得る。標的核酸配列は、PAMの最初のヌクレオチドの5’直近の(約)20塩基であり得る。ガイドRNAは、核酸配列を標的化し得る。標的核酸は、少なくとも(約)1~10、1~20、1~30、1~40、1~50、1~60、1~70、1~80、1~90、または1~100ヌクレオチドであり得る。
ガイドポリヌクレオチド、例えば、ガイドRNAは、別の核酸、例えば、細胞のゲノム中の標的核酸またはプロトスペーサーにハイブリダイズし得る核酸を指すことができる。ガイドポリヌクレオチドはRNAであり得る。ガイドポリヌクレオチドはDNAであり得る。ガイドポリヌクレオチドは、核酸の配列に部位特異的に結合するようにプログラムまたは設計することができる。ガイドポリヌクレオチドは、一ポリヌクレオチド鎖を含み得、単一ガイドポリヌクレオチドと呼ばれ得る。ガイドポリヌクレオチドは、2つのポリヌクレオチド鎖を含み得、二重ガイドポリヌクレオチドと呼ばれ得る。ガイドRNAはRNA分子として細胞や胚に導入され得る。例えば、RNA分子は、インビトロで転写され得、および/または化学的に合成され得る。RNAは、合成DNA分子、例えばgBlocks(登録商標)遺伝子断片から転写され得る。ガイドRNAはRNA分子として細胞や胚に導入され得る。ガイドRNAはまた、非RNA核酸分子、例えばDNA分子の形態で細胞または胚に導入され得る。例えば、ガイドRNAをコードするDNAが、対象の細胞または胚におけるガイドRNAの発現のためにプロモーター制御配列に作動可能に連結され得る。RNAコード配列は、RNAポリメラーゼIII (Pol III)によって認識されるプロモーター配列に作動可能に連結され得る。ガイドRNAを発現するために使用することができるプラスミドベクターは、px330ベクターおよびpx333ベクターを含むが、これらに限定されない。いくつかの実施形態では、プラスミドベクター(例えばpx333ベクター)は、少なくとも二つのガイドRNAをコードするDNA配列を含むことができる。
ガイドポリヌクレオチド(例えばガイドRNA)およびターゲティング配列を選択、設計および検証するための方法は、本明細書中に記載され、当業者に知られている。例えば、核酸塩基エディター系におけるデアミナーゼドメイン(例えばAIDドメイン)の潜在的基質混合性(promiscuity)の影響を最小限にするために、意図せず脱アミノ化の標的となり得る残基(例えば、標的核酸遺伝子座内のssDNA上に潜在的に位置し得るオフターゲットC残基)の数を最小限にすることができる。さらに、ソフトウェアツールを使用して、標的核酸配列に対応するgRNAを最適化することができ、例えば、ゲノム全体の総オフターゲット活性を最小限化することができる。例えば、S. pyogenes Cas9を用いた標的化ドメイン選択肢の各可能性について、(例えばNAGまたはNGGなどの選択されたPAMに先行する)ある数(例えば1、2、3、4、5、6、7、8、9、または10)までのミスマッチ塩基対を含むすべてのオフターゲット配列をゲノムにわたって同定することができる。標的部位に相補的なgRNAの第一の領域を同定することができ、すべての第一の領域(例:crRNA)をその総予測オフターゲットスコアに従ってランク付けすることができ;上位にランクされた標的化ドメインは、最大のオンターゲット活性と最小のオフターゲット活性を持つ可能性が高いものを表す。候補標的化gRNAは、当技術分野で公知の方法および/または本明細書に記載の方法を用いて機能的に評価することができる。
非限定的な例として、Cas9と共に使用するためのガイドRNAのcrRNAにおける標的DNAハイブリダイズ配列は、DNA配列探索アルゴリズムを用いて同定することができる。gRNA設計は、Bae S., Park J., & Kim J.-S. Cas-OFFinder: A fast and versatile algorithm that searches for potential off-target sites of Cas9 RNA-guided endonucleases. Bioinformatics 30, 1473-1475 (2014)に記載されているような公開ツールcas-offinderに基づくカスタムgRNA設計ソフトウェアを用いて実施することができる。このソフトウェアは、ガイドのゲノム全体的オフターゲット傾向を計算した後にガイドにスコアを付ける。通常、完全マッチから7個のミスマッチまでの範囲の一致が、17から24までの長さの範囲のガイドについて考慮される。いったんオフターゲットサイトが計算的に決定されると、各ガイドについて集約スコアが計算され、ウェブインターフェースを使用した表形式の出力に要約される。PAM配列に隣接する潜在的な標的部位を同定することに加えて、ソフトウェアは、選択された標的部位から1、2、3または3超のヌクレオチドだけ異なるすべてのPAM隣接配列も同定する。標的核酸配列、例えば標的遺伝子についてのゲノムDNA配列を得て、反復エレメントを、公に入手可能なツール、例えば、RepeatMaskerプログラムを用いてスクリーニングすることができる。RepeatMaskerは、入力されたDNA配列から、反復エレメントや低複雑性領域を探し出す。所与のクエリー配列に存在する反復の詳細な注釈が出力となる。
同定後、ガイドRNA(例えばcrRNA)の第1の領域が、標的部位へのそれらの距離、それらの直交性(orthogonality)、および関連するPAM配列との密接な一致のための5’ヌクレオチドの存在(例えば、関連するPAM (例えば、化膿レンサ球菌についてのNGG PAM、黄色ブドウ球菌についてのNNGRRTまたはNNGRRV PAM) を含むヒトゲノムにおける密接な一致の同定に基づく5’G)に基づいて、階層にランク付けされ得る。本明細書において使用される場合、直交性とは、標的配列に対して最小数のミスマッチを含む、ヒトゲノムにおける配列の数を表す。「高レベルの直交性」または「良好な直交性」は、例えば、意図された標的以外にヒトゲノムにおいて同一の配列を有さず、標的配列において一または二のミスマッチを含有する配列も有さない20マー標的化ドメインを指し得る。良好な直交性を有する標的化ドメインは、オフターゲットDNA切断を最小化するように選択され得る。
いくつかの実施形態において、塩基編集活性を検出すること、および候補ガイドポリヌクレオチドを試験することのためにレポーターシステムが使用され得る。いくつかの実施形態において、レポーターシステムは、塩基編集活性がレポーター遺伝子の発現をもたらす、レポーター遺伝子ベースのアッセイを含むことができる。例えば、レポーターシステムは、不活性化開始コドン、例えば、鋳型鎖上の3'-TAC-5'から3'-CAC-5'への突然変異を含むレポーター遺伝子を含み得る。標的Cの脱アミノ化に成功すると、対応するmRNAは5'-GUG-3'ではなく5'-AUG-3'として転写され、レポーター遺伝子の翻訳を可能にする。適切なレポーター遺伝子は、当業者には明らかであろう。レポーター遺伝子の非限定的な例としては、緑色蛍光タンパク質 (GFP) 、赤色蛍光タンパク質 (RFP) 、ルシフェラーゼ、分泌型アルカリホスファターゼ (SEAP) 、または、発現が検出可能であり当業者には明らかである他の任意の遺伝子をコードする遺伝子が挙げられる。レポーター系を用いて、多くの異なるgRNAを試験することができ、例えば、標的DNA配列に関してどの残基を、それぞれの対応デアミナーゼが標的とするかを決定することができる。非鋳型鎖を標的とするsgRNAも、特定の塩基編集タンパク質(例えばCas9デアミナーゼ融合タンパク質)のオフターゲット効果を評価するために試験することができる。いくつかの実施形態において、そのようなgRNAは、変異開始コドンがgRNAと塩基対を形成しないように設計することができる。ガイドポリヌクレオチドは、標準リボヌクレオチド、修飾リボヌクレオチド(例えば、プソイドウリジン)、リボヌクレオチド異性体、および/またはリボヌクレオチド類似体を含むことができる。いくつかの実施形態において、ガイドポリヌクレオチドは、少なくとも1つの検出可能な標識を含むことができる。検出可能な標識は、フルオロフォア(例えば、FAM、TMR、Cy3、Cy5、テキサスレッド、オレゴングリーン、Alexa Fluor、Haloタグ、または適切な蛍光色素)、検出タグ(例えば、ビオチン、ジゴキシゲニン等)、量子ドット、または金粒子であり得る。
ガイドポリヌクレオチドは、化学的に合成され得るか、酵素的に合成され得るか、またはそれらの組み合わせであり得る。例えば、ガイドRNAは、標準的なホスホロアミダイトベースの固相合成法を用いて合成することができる。あるいは、ガイドRNAをコードするDNAを、ファージRNAポリメラーゼにより認識されるプロモーター制御配列に作動可能に連結することによって、ガイドRNAをインビトロで合成することができる。適切なファージプロモーター配列の例は、T7、T3、SP6プロモーター配列、またはそれらのバリアントを含む。ガイドRNAが二つの別々の分子(例えば、crRNAとtracrRNA)を含む実施形態において、crRNAは化学的に合成することができ、tracrRNAは酵素的に合成することができる。
いくつかの実施形態において、塩基エディター系は、複数のガイドポリヌクレオチド、例えばgRNAを含み得る。例えば、gRNAは、塩基エディター系に含まれる一つ以上の標的遺伝子座(例えば少なくとも1 gRNA、少なくとも2 gRNA、少なくとも5 gRNA、少なくとも10 gRNA、少なくとも20 gRNA、少なくとも30 gRNA、少なくとも50 gRNA)を標的とすることができる。前記複数のgRNA配列はタンデムに配置され得、好ましくは直接反復によって分離される。
ガイドRNAまたはガイドポリヌクレオチドをコードするDNA配列がベクターの一部であってもよい。さらに、ベクターは、追加の発現制御配列(例えばエンハンサー配列、Kozak配列、ポリアデニル化配列、転写終結配列など。)、選択可能なマーカー配列(例えばGFPまたはピューロマイシンなどの抗生物質耐性遺伝子)、複製起点などを含むことができる。ガイドRNAをコードするDNA分子は線状であってもよい。ガイドRNAまたはガイドポリヌクレオチドをコードするDNA分子も環状であってもよい。
いくつかの実施形態において、塩基エディター系の1つ以上の構成要素は、DNA配列によってコードされ得る。このようなDNA配列は、発現系(例えば細胞)に一緒に、または別々に導入することができる。例えば、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインおよびガイドRNAをコードするDNA配列を細胞に導入することができ、各DNA配列は別個の分子の一部であることができ(例えばポリヌクレオチドプログラム可能なヌクレオチド結合ドメインのコード配列を含む1つのベクターおよびガイドRNAコード配列を含む第2のベクター)、または両方が同じ分子の一部であることができる(例えばポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン及びガイドRNAの両方のためのコード(および調節)配列を含む一つのベクター)。
ガイドポリヌクレオチドは、新しいまたは増強された特徴を有する核酸を提供するための1以上の改変を含むことができる。ガイドポリヌクレオチドは、核酸親和性タグを含むことができる。ガイドポリヌクレオチドは、合成ヌクレオチド、合成ヌクレオチドアナログ、ヌクレオチド誘導体、および/または修飾ヌクレオチドを含むことができる。
いくつかの実施形態において、gRNAまたはガイドポリヌクレオチドは修飾(改変)を含むことができる。修飾は、gRNAまたはガイドポリヌクレオチドの任意の位置に施され得る。単一のgRNAまたはガイドポリヌクレオチドに対して複数の修飾を行うことができる。gRNAまたはガイドポリヌクレオチドは、修飾後に品質管理を受けることができる。いくつかの実施形態において、品質管理は、PAGE、HPLC、MS、またはそれらの任意の組み合わせを含むことができる。
gRNAまたはガイドポリヌクレオチドの修飾は、置換、挿入、欠失、化学的修飾、物理的修飾、安定化、精製、またはそれらの任意の組合せであり得る。
gRNAまたはガイドポリヌクレオチドはまた、5’アデニル酸、5’グアノシン三リン酸キャップ、5’N 7-メチルグアノシン三リン酸キャップ、5’三リン酸キャップ、3’リン酸、3’チオリン酸、5’リン酸、5’チオリン酸、Cis-Synチミジン二量体、三量体、C12スペーサー、C3スペーサー、C6スペーサー、dスペーサー、PCスペーサー、rスペーサー、スペーサー18、スペーサー9、3’-3’修飾、5’-5’修飾、塩基脱落、アクリジン、アゾベンゼン、ビオチン、ビオチンBB、ビオチンTEG、コレステロールTEG、デスチオビオチンTEG、DNP TEG、DNP-X、DOTA、dT-ビオチン、二重ビオチン、ソラレン、ソラレンC2、ソラレンC6、TINA、3’DABCYL、ブラックホールクエンチャー1、ブラックホールクエンチャー2、DABCYL SE、dT-DABCYL、IRDye QC-1、QSY-21、QSY-35、QSY-7、QSY-9、カルボキシルリンカー、チオールリンカー、2’-デオキシリボヌクレオシド類似体プリン、2’-デオキシリボヌクレオシド類似体ピリミジン、リボヌクレオシド類似体、2’-O-メチルリボヌクレオシド類似体、糖修飾類似体、ウォブル/ユニバーサル塩基、蛍光色素標識、2’-フルオロRNA、2’-O-メチルRNA、メチルホスホネート、ホスホジエステルDNA、ホスホジエステルRNA、ホスホチオエステルDNA、ホスホロチオネートRNA、UNA、プソイドリジン-5’-トリホスフェート、5’-メチルシジン-5’-トリホスフェート、またはそれらの任意の組合せでも修飾され得る。
いくつかの実施形態において、修飾は永続的である。その他の実施形態において、修飾は一時的である。いくつかの実施形態において、gRNAまたはガイドポリヌクレオチドに対して複数の修飾が行われる。gRNAまたはガイドポリヌクレオチドの修飾は、それらのコンホメーション、極性、疎水性、化学反応性、塩基対形成相互作用、またはそれらの組み合わせなどの、ヌクレオチドの物理化学的特性を変化させることができる。
PAM配列は、当該技術分野で公知の任意のPAM配列であり得る。適切なPAM配列には、以下が含まれるが、これらに限定されない:NGG, NGA, NGC, NGN, NGT, NGCG, NGAG, NGAN, NGNG, NGCN, NGCG, NGTN, NNGRRT, NNNRRT, NNGRR(N), TTTV, TYCV, TYCV, TATV, NNNNGATT, NNAGAAW, または NAAAAC。Yはピリミジンであり、Nは任意のヌクレオチド塩基であり、WはAまたはTである。
修飾はホスホロチオエート置換でもあり得る。いくつかの実施形態において、天然のホスホジエステル結合は細胞のヌクレアーゼによって急速に分解されやすく、ホスホロチオエート (PS) 結合置換体を用いたヌクレオチド間結合の修飾は、細胞分解による加水分解に対してより安定である。修飾は、gRNAまたはガイドポリヌクレオチドの安定性を増大させることができる。修飾は生物学的活性を増強させることもできる。いくつかの実施形態において、ホスホロチオエート強化RNA gRNAは、RNアーゼA、RNアーゼT1、子牛血清ヌクレアーゼ、またはそれらの組み合わせを阻害することができる。これらの特性は、in vivoまたはin vitroでヌクレアーゼへの暴露がある可能性が高いアプリケーションにおいて、PS-RNA gRNAの使用を可能にする。例えば、ホスホロチオエート (PS) 結合をgRNAの5'末端または''末端における最後の3~5ヌクレオチドの間に導入することができ、それはエキソヌクレアーゼ分解を阻害し得る。いくつかの実施形態において、ホスホロチオエート結合をgRNA全体に加えてエンドヌクレアーゼによる攻撃を減らすことができる。
[プロトスペーサー隣接モチーフ]
「プロトスペーサー隣接モチーフ (PAM)」またはPAM様モチーフは、CRISPR細菌適応免疫系においてCas9ヌクレアーゼによって標的化されるDNA配列の直後の2~6塩基対DNA配列を指す。いくつかの実施形態では、PAMは5’PAM (すなわちプロトスペーサーの5’末端の上流に位置する)であり得る。他の実施形態では、PAMは3’PAM (すなわちプロトスペーサーの5’末端の下流に位置する)であり得る。
PAM配列は標的結合に必須であるが、正確な配列はCasタンパク質の種類に依存する。
本明細書で提供される塩基エディターは、標準的または非標準的プロトスペーサー隣接モチーフ (PAM) 配列を含むヌクレオチド配列に結合することができるCRISPRタンパク質由来ドメインを含むことができる(図2A)。PAM部位は、標的ポリヌクレオチド配列に近接するヌクレオチド配列である。本開示のいくつかの態様は、異なるPAM特異性を有するCRISPRタンパク質の全部または一部を含む塩基エディターを提供する。
例えば、S. pyogenes由来のCas9 (spCas9) などのCas9タンパク質は、典型的に、特定の核酸領域に結合するために標準的なNGG PAM配列を必要とし、ここで「NGG」中の「N」はアデニン(A) 、チミン (T) 、グアニン (G) 、またはシトシン(C) であり、Gはグアニンである。PAMはCRISPRタンパク質特異的であり得、異なるCRISPRタンパク質由来ドメインを含む異なる塩基エディター間で異なり得る。PAMは標的配列の5’または3’にあり得る。PAMは、標的配列の上流または下流にあり得る。PAMは、1、2、3、4、5、6、7、8、9、10またはそれ以上のヌクレオチドの長さであり得る。多くの場合、PAMは2~6ヌクレオチドの長さである。いくつかのPAMバリアントが下記表2に記載されている。
表2:Cas9タンパク質および対応するPAM配列
Figure 2022520081000032
いくつかの実施形態において、PAMはNGCである。いくつかの実施形態において、NGC PAMはCas9バリアントにより認識される。いくつかの実施形態において、NGC PAMバリアントは、D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、およびT1337R(まとめて「MQKFRAER」と称される)から選択される1つまたは複数のアミノ酸置換を含む。
いくつかの実施形態において、PAMはNGTである。いくつかの実施形態において、NGT PAMはCas9バリアントにより認識される。いくつかの実施形態において、NGT PAMバリアントは、1つまたは複数の残基1335、1337、1135、1136、1218、および/または1219における標的化された突然変異を通じて生成される。いくつかの実施形態において、NGT PAMバリアントは、残基1219、1335、1337、1218の一つまたは複数における標的化突然変異を通じて作成される。いくつかの実施形態において、NGT PAMバリアントは、残基1135、1136、1218、1219、および1335の一つまたは複数における標的化突然変異を通じて作成される。いくつかの実施形態において、NGT PAMバリアントは、下記表3Aおよび3Bに提供される標的化突然変異のセットから選択される。
表3A:残基1219, 1335, 1337, 1218におけるNGT PAMバリアント変異
Figure 2022520081000033
表3B:残基1135, 1136, 1218, 1219, および1335におけるNGT PAMバリアント変異
Figure 2022520081000034
いくつかの実施形態において、NGT PAMバリアントは、表2および3のバリアント5、7、28、31、または36から選択される。いくつかの実施形態において、バリアントは、改善されたNGT PAM認識を有する。
いくつかの実施形態では、NGT PAMバリアントは、残基1219、1335、1337および/または1218において突然変異を有する。いくつかの実施形態では、NGT PAMバリアントは、下記表4に提供されるバリアントから、認識を改善するための変異を伴って選択される。
表4:残基1219, 1335, 1337, および1218におけるNGT PAMバリアント変異
Figure 2022520081000035
いくつかの実施形態において、NGT PAMに対して特異性を有する塩基エディターが以下の表5に提供されるように生成され得る。
表5:NGT PAMバリアント
Figure 2022520081000036
いくつかの実施形態において、NGTNバリアントはバリアント1である。いくつかの実施形態において、NGTNバリアントはバリアント2である。いくつかの実施形態において、NGTNバリアントはバリアント3である。いくつかの実施形態において、NGTNバリアントはバリアント4である。いくつかの実施形態において、NGTNバリアントはバリアント5である。いくつかの実施形態において、NGTNバリアントはバリアント6である。
いくつかの実施形態において、Cas9ドメインは、Streptococcus pyogenes由来のCas9ドメインである(SpCas9)。いくつかの実施形態において、SpCas9ドメインは、ヌクレアーゼ活性SpCas9、ヌクレアーゼ不活性SpCas9 (SpCas9d) 、またはSpCas9ニッカーゼ (SpCas9n) である。いくつかの実施形態において、SpCas9は、D9X突然変異、または本明細書に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含み、ここでXはD以外のアミノ酸である。いくつかの実施形態において、SpCas9は、D9A突然変異、または本明細書に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含む。いくつかの実施形態において、SpCas9ドメイン、SpCas9dドメインまたはSpCas9nドメインは、非標準PAMを有する核酸配列に結合することができる。いくつかの実施形態において、SpCas9ドメイン、SpCas9dドメインまたはSpCas9nドメインは、NGG、NGAまたはNGCG PAM配列を有する核酸配列に結合することができる。いくつかの実施形態において、SpCas9ドメインは、D1134X、R1335X、およびT1336X突然変異の1つ以上、または本明細書に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含み、ここでXは任意のアミノ酸である。いくつかの実施形態において、SpCas9ドメインは、D1134E、R1335Q、およびT1336R突然変異の1つ以上、または本明細書に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含む。いくつかの実施形態において、SpCas9ドメインは、D1134E、R1335Q、およびT1336R突然変異、または本明細書に提供されるアミノ配列のいずれかにおける対応する突然変異を含む。いくつかの実施形態において、SpCas9ドメインは、D1134X、R1335X、およびT1336X突然変異のうちの1つ以上、または本明細書において提供されるアミノ酸配列のいずれかにおける対応する突然変異を含み、ここでXは任意のアミノ酸である。いくつかの実施形態において、SpCas9ドメインは、D1134V、R1335Q、およびT1336R突然変異の1以上、または本明細書に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含む。いくつかの実施形態において、SpCas9ドメインは、D1134V、R1335Q、およびT1337R突然変異、または本明細書に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含む。いくつかの実施形態において、SpCas9ドメインは、D1134X、G1217X、R1335X、およびT1336X突然変異の1以上、または本明細書に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含み、ここでXは任意のアミノ酸である。いくつかの実施形態において、SpCas9ドメインは、D1134V、G1217R、R1335Q、およびT1336R突然変異の1つ以上、または本明細書に提供されるアミノ配列のいずれかにおける対応する突然変異を含む。いくつかの実施形態において、SpCas9ドメインは、D1134V、G1217R、R1335Q、およびT1336R突然変異、または本明細書において提供されるアミノ酸配列のいずれかにおける対応する突然変異を含む。
いくつかの実施形態において、本明細書に提供される融合タンパク質のいずれかのCas9ドメインは、本明細書に記載されるCas9ポリペプチドに対して少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。いくつかの実施形態において、本明細書に提供される融合タンパク質のいずれかのCas9ドメインは、本明細書に記載される任意のCas9ポリペプチドのアミノ酸配列を含む。いくつかの実施形態において、本明細書に提供される融合タンパク質のいずれかのCas9ドメインは、本明細書に記載される任意のCas9ポリペプチドのアミノ酸配列からなる。
いくつかの例において、本明細書に開示される塩基エディターのCRISPRタンパク質由来ドメインによって認識されるPAMは、塩基エディターをコードするインサート(例えばAAVインサート)とは別個のオリゴヌクレオチド上で細胞に提供され得る。そのような実施形態では、別個のオリゴヌクレオチド上にPAMを提供することは、さもなくば標的配列と同じポリヌクレオチド上に隣接するPAMが存在しないために切断することができない標的配列の切断を可能にする。
ある実施形態において、S. pyogenes Cas9 (SpCas9) を、ゲノム工学のためのCRISPRエンドヌクレアーゼとして使用することができる。ただし、他のものも使用され得る。いくつかの実施形態では、異なるエンドヌクレアーゼを用いて特定のゲノム標的を標的化することができる。いくつかの実施形態では、非NGG PAM配列を有する合成SpCas9由来バリアントを使用することができる。さらに、様々な種からの他のCas9オルソログが同定されており、これらの 「非SpCas9」は、本開示でも有用になり得る種々のPAM配列に結合し得る。例えば、比較的大きなサイズのSpCas9(約4kbのコード配列)は、細胞内で効率的に発現することができないSpCas9 cDNAプラスミドをもたらすこともあり得る。逆に、Staphylococcus aureus Cas9 (SaCas9) のコード配列は、SpCas9よりも約1キロベース短いので、細胞内で効率的に発現させ得る。SpCas9と同様に、SaCas9エンドヌクレアーゼは、in vitroの哺乳類細胞およびin vivoのマウスにおいて標的遺伝子を修飾する能力がある。いくつかの実施形態では、Casタンパク質は異なるPAM配列を標的とすることができる。いくつかの実施形態において、標的遺伝子は、Cas9 PAM、例えば、5’-NGGに隣接し得る。他の実施形態では、他のCas9オーソログは異なるPAM要件を有し得る。例えば、S. thermophilus のもののようなPAM(CRISPR1の場合は5’-NNAGAA、CRISPR3の場合は5’-NGGNG)およびNeisseria meningiditis のもの(5’-NNNNGATT)のような他のPAMも標的遺伝子に隣接して見出され得る。
いくつかの実施形態において、S. pyogenes系について、標的遺伝子配列は、5’-NGG PAMの前(すなわち、その5’側)にあり得、20 ntガイドRNA配列が、反対側の鎖と塩基対を形成して、PAMに隣接するCas9切断を媒介することができる。いくつかの実施形態では、隣接切断は、PAMの(約)3塩基対上流であり得る。いくつかの実施形態では、隣接切断は、PAMの(約)10塩基対上流であり得る。いくつかの実施形態では、隣接切断は、PAMの(約)0~20塩基対上流であり得る。例えば、隣接切断は、PAM上流の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30塩基対の隣であり得る。隣接切断はPAMの1~30塩基対下流でもあり得る。PAM配列に結合することができる例示的なSpCas9タンパク質の配列は、以下の通りである:
例示的なPAM結合SpCas9のアミノ酸配列は以下の通りである:
MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
例示的なPAM結合性SpCas9nのアミノ酸配列は以下の通りである:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
例示的なPAM結合性SpEQR Cas9のアミノ酸配列は以下の通りである:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESVLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFESPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGD
上記の配列において、SpEQR Cas9をもたらすためにD1134、R1335、およびT1336から突然変異され得る残基E1134、Q1334、およびR1336に下線を付し、太字としている。
例示的なPAM結合性SpVQR Cas9のアミノ酸配列は以下の通りである:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGD
上記の配列において、SpVQR Cas9をもたらすためにD1134、R1335、およびT1336から突然変異され得る残基V1134、Q1334、およびR1336に下線を付し、太字としている。
例示的なPAM結合性SpVRER Cas9のアミノ酸配列は以下の通りである:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKEYRSTKEVLDATLIHQSITGLYETRIDLSQLGGD
上記の配列において、SpVRER Cas9をもたらすためにD1134、G1217、R1335、およびT1336から突然変異され得る残基V1134、R1217、Q1334、およびR1336に下線を付し、太字としている。
いくつかの実施形態において、操作されたSpCas9バリアントは、3' Hによって隣接されるプロトスペーサー隣接モチーフ (PAM) 配列(非G PAM)を認識することができる(表1A~1D;図62を参照されたい)。いくつかの実施形態において、SpCas9バリアントはNRNH PAMを認識する(ここでRはAまたはGであり、HはA、CまたはTである)。いくつかの実施形態において、非G PAMはNRRH、NRTH、またはNRCHである(例えばMiller, S.M., et al. Continuous evolution of SpCas9 variants compatible with non-G PAMs, Nat. Biotechnol. (2020)(その内容は参照により全体が本明細書に組み込まれる)を参照されたい)。
いくつかの実施形態において、Cas9ドメインは組換えCas9ドメインである。いくつかの実施形態において、組換えCas9ドメインはSpyMacCas9ドメインである。いくつかの実施形態において、SpyMacCas9ドメインはヌクレアーゼ活性SpyMacCas9、ヌクレアーゼ不活性SpyMacCas9 (SpyMacCas9d)、またはSpyMacCas9ニッカーゼ (SpyMacCas9n) である。いくつかの実施形態において、SaCas9ドメイン、SaCas9dドメイン、またはSaCas9nドメインは、非正準的PAMを有する核酸配列に結合することができる。いくつかの実施形態において、SpyMacCas9ドメイン、SpCas9dドメイン、またはSpCas9nドメインは、NAA PAM配列を有する核酸配列に結合することができる。
ネイティブ5'-NAAN-3' PAM特異性を有するStreptococcus macacaeにおけるSpy Cas9の例示的なCas9 Aホモログの配列は当該分野において公知であり、例えば、Jakimo et al., (www.biorxiv.org/content/biorxiv/early/2018/09/27/429654.full.pdf)に記載されており、以下に提供される。
SpyMacCas9
MDKKYSIGLDIGTNSVGWAVITDDYKVPSKKFKVLGNTDRHSIKKNLIGALLFGSGETAE
ATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFG
NIVDEVAYHEKYPTIYHLRKKLADSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSD
VDKLFIQLVQIYNQLFEENPINASRVDAKAILSARLSKSRRLENLIAQLPGEKRNGLFGN
LIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNSEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYA
GYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELH
AILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEE
VVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFL
SGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGAYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDRGMIEERLKTYAHLFDDKVMKQLKRRRYTGWG
RLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGHSL
HEQIANLAGSPAIKKGILQTVKIVDELVKVMGHKPENIVIEMARENQTTQKGQKNSRERM
KRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHI
VPQSFIKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLT
KAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSK
LVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKM
IAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFA
TVRKVLSMPQVNIVKKTEIQTVGQNGGLFDDNPKSPLEVTPSKLVPLKKELNPKKYGGYQ
KPTTAYPVLLITDTKQLIPISVMNKKQFEQNPVKFLRDRGYQQVGKNDFIKLPKYTLVDI
GDGIKRLWASSKEIHKGNQLVVSKKSQILLYHAHHLDSDLSNDYLQNHNQQFDVLFNEII
SFSKKCKLGKEHIQKIENVYSNKKNSASIEELAESFIKLLGFTQLGATSPFNFLGVKLNQ
KQYKGKKDYILPCTEGTLIRQSITGLYETRVDLSKIGED
いくつかの実施形態において、バリアントCas9タンパク質は、H840A、P475A、W476A、N477A、D1125A、W1126A、およびD1218A突然変異を有し、その結果、ポリペプチドは、標的DNAまたはRNAを切断する低下した能力を有する。そのようなCas9タンパク質は、標的DNA (例えば一本鎖標的DNA)を切断する能力を低下しているが、標的DNA (例えば一本鎖標的DNA)に結合する能力を保持する。別の非限定的な例として、いくつかの実施形態において、バリアントCas9タンパク質は、D10A、H840A、P475A、W476A、N477A、D1125A、W1126A、およびD1218A突然変異を有し、その結果、ポリペプチドは、標的DNAを切断する能力が低下している。そのようなCas9タンパク質は、標的DNA (例えば一本鎖標的DNA)を切断する能力を低下しているが、標的DNA (例えば一本鎖標的DNA)に結合する能力を保持している。いくつかの実施形態において、バリアントCas9タンパク質がW476AおよびW1126A突然変異を有する場合、またはバリアントCas9タンパク質がP475A、W476A、N477A、D1125A、W1126A、およびD1218A突然変異を有する場合、バリアントCas9タンパク質はPAM配列に効率的に結合しない。したがって、このような場合には、このようなバリアントCas9タンパク質を結合の方法に用いると、この方法はPAM配列を必要としない。換言すれば、いくつかの実施形態において、このようなバリアントCas9タンパク質を結合の方法に用いる場合、この方法はガイドRNAを含み得るが、この方法は、PAM配列の非存在下で行うことができる(したがって、結合の特異性はガイドRNAの標的セグメントによってもたらされる)。上記の効果を達成するために、他の残基を変異させ得る(すなわち一方または他方のヌクレアーゼ部分を不活性化する)。非限定的な例として、残基D10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D986、および/またはA987を改変(すなわち置換)することができる。また、アラニン置換以外の変異も好適である。
いくつかの実施形態において、塩基エディターのCRISPRタンパク質由来ドメインは、正準的PAM配列 (NGG) を有するCas9タンパク質の全部または一部を含み得る。他の実施形態において、塩基エディターのCas9由来ドメインは、非正準的PAM配列を用いることができる。そのような配列は本技術分野で記述されており当業者には明らかであろう。例えば、非正準的PAM配列に結合するCas9ドメインは、Kleinstiver, B. P., et al., “Engineered CRISPR-Cas9 nucleases with altered PAM specificities”Nature, 523, 481-485 (2015); および Kleinstiver, B. P., et al., “Broadening the targeting range of Staphylococcus aureus CRISPR-Cas9 by modifying PAM recognition” Nature Biotechnology, 33, 1293-1298 (2015)に記述されており、それぞれの全内容を参照によりここに組み込む。
[PAM排他性が低減されたCas9ドメイン]
典型的には、S. pyogenes由来のCas9 (spCas9) などのCas9タンパク質は、特定の核酸領域に結合するために標準的なNGG PAM配列を必要とし、ここで「NGG」の「N」はアデノシン(A) 、チミジン (T) またはシトシン (C) であり、Gはグアノシンである。これは、ゲノム内の所望の塩基を編集する能力を制限し得る。いくつかの実施形態において、本明細書に提供される塩基編集融合タンパク質は、正確な位置、例えばPAMの上流にある標的塩基を含む領域に配置することが必要になり得る。例えばKomor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016)参照(これらの内容全体は、参照により本明細書に組み込まれる)。したがって、いくつかの実施形態において、本明細書で提供される融合タンパク質のいずれかは、標準的(例えばNGG)PAM配列を含まないヌクレオチド配列に結合することができるCas9ドメインを含み得る。非正準的PAM配列に結合するCas9ドメインは本技術分野において記述されており当業者には明らかであろう。例えば、非標準PAM配列に結合するCas9ドメインは、Kleinstiver, B. P., et al., “Engineered CRISPR-Cas9 nucleases with altered PAM specificities”Nature 523, 481-485 (2015); および Kleinstiver, B. P., et al., “Broadening the targeting range of Staphylococcus aureus CRISPR-Cas9 by modifying PAM recognition” Nature Biotechnology 33, 1293-1298 (2015)に記述されており、それぞれの全内容を参照によりここに組み込む。
[高忠実度Cas9ドメイン]
本開示のいくつかの態様は、高忠実度Cas9ドメインを提供する。いくつかの実施形態において、高忠実度Cas9ドメインは、対応する野生型Cas9ドメインと比較して、Cas9ドメインとDNAの糖-リン酸骨格との間の静電相互作用を減少させる1つ以上の突然変異を含む人工Cas9ドメインである。任意の特定の理論により縛られることを望まないが、DNAの糖-リン酸骨格との静電相互作用を減少させた高忠実度Cas9ドメインは、より少ないオフターゲット効果を有し得る。いくつかの実施形態において、Cas9ドメイン(例えば野生型Cas9ドメイン) は、Cas9ドメインとDNAの糖-リン酸骨格との間の結合を低減させる一つ以上の突然変異を含む。いくつかの実施形態において、Cas9ドメインは、Cas9ドメインとDNAの糖-リン酸骨格との間の結合を少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、または少なくとも70%だけ低減させる一つ以上の突然変異を含む。
いくつかの実施形態において、本明細書で提供されるCas9融合タンパク質のいずれかは、N497X、R661X、Q695X、および/またはQ926X突然変異の1以上、または本明細書で提供されるアミノ酸配列のいずれかにおける対応する突然変異を含み、ここでXは任意のアミノ酸である。いくつかの実施形態において、本明細書で提供されるCas9融合タンパク質のいずれかは、N497A、R661A、Q695A、および/またはQ926A突然変異の1以上、または本明細書で提供されるアミノ酸配列のいずれかにおける対応する突然変異を含む。いくつかの実施形態において、Cas9ドメインは、D10A突然変異、または本明細書に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含む。高い忠実度を有するCas9ドメインは当技術分野で公知であり、当業者には明らかであろう。例えば、高い忠実度を有するCas9ドメインは、Kleinstiver, B.P., et al. “High-fidelity CRISPR-Cas9 nucleases with no detectable genome-wide off-target effects.” Nature 529, 490-495 (2016); および Slaymaker, I.M., et al. “Rationally engineered Cas9 nucleases with improved specificity.”Science 351, 84-88 (2015)に記述されており、それぞれの全内容は参照により本明細書に組み入れられる。
いくつかの実施形態において、改変されたCas9は、高忠実度Cas9酵素である。いくつかの実施形態において、高忠実度Cas9酵素は、SpCas9(K855A)、eSpCas9(1.1)、SpCas9-HF1、または高精度Cas9バリアント(HypaCas9)である。改変されたCas9 eSpCas9(1.1)は、HNH/RuvCグルーブと非標的DNA鎖との間の相互作用を弱めるアラニン置換を含み、オフターゲット部位での鎖分離と切断を防止する。同様に、SpCas9-HF1は、DNAリン酸骨格とのCas9の相互作用を破壊するアラニン置換を介して、オフターゲット編集を低下させる。HypaCas9は、Cas9の校正と標的識別を増加させる突然変異をREC3ドメインに含む(SpCas9 N692A/M694A/Q695A/H698A)。3つの高忠実度酵素はすべて、野生型Cas9よりもオフターゲット編集が少ない。
例示的な高忠実度Cas9を以下に示す。
Cas9に対する高忠実度Cas9ドメイン突然変異を太字および下線で示している。
DKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTAFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGALSRKLINGIRDKQSGKTILDFLKSDGFANRNFMALIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRAITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
[核局在化配列 (NLS) を含む融合タンパク質]
いくつかの実施形態において、本明細書で提供される融合タンパク質は、一つ以上 (例:2, 3, 4, 5) の核ターゲティング配列、例えば、核局在化配列 (NLS) をさらに含む。一実施形態では、二部分(bipartite)NLSが使用される。いくつかの実施形態において、NLSは、NLSを含むタンパク質の細胞核中への輸入(例えば核輸送によるもの)を促進するアミノ酸配列を含む。いくつかの実施形態において、本明細書において提供される融合タンパク質のいずれかは、核局在化配列 (NLS) をさらに含む。いくつかの実施形態において、NLSは融合タンパク質のN末端に融合される。いくつかの実施形態において、NLSは融合タンパク質のC末端に融合される。いくつかの実施形態において、NLSはCas9ドメインのN末端に融合される。いくつかの実施形態において、NLSはnCas9ドメインまたはdCas9ドメインのC末端に融合される。いくつかの実施形態において、NLSはデアミナーゼのN末端に融合される。いくつかの実施形態において、NLSはデアミナーゼのC末端に融合される。いくつかの実施形態において、NLSは、1つ以上のリンカーを介して融合タンパク質に融合される。いくつかの実施形態において、NLSは、リンカーなしで融合タンパク質に融合される。いくつかの実施形態において、NLSは、本明細書において提供または参照されるNLS配列のいずれか1つのアミノ酸配列を含む。さらなる核局在化配列は当技術分野で公知であり、当業者には明らかであろう。例えば、NLS配列は、Plank et al., PCT/EP2000/011690に記載されており、その内容は、例示的な核局在化配列の開示について参照により本明細書に組み込まれる。いくつかの実施形態において、NLSは、アミノ酸配列PKKKRKVEGADKRTADGSEFESPKKKRKV, KRTADGSEFESPKKKRKV, KRPAATKKAGQAKKKK, KKTELQTTNAENKTKKL, KRGINDRNFWRGENGRKTR, RKSGKIAAIVVKRPRKPKKKRKV, またはMDSLLMNRRKFLYQFKNVRWAKGRRETYLCを含む。
いくつかの実施形態において、NLSはリンカー中に存在するか、またはNLSはリンカー、例えば本明細書に記載されるリンカーによって隣接される。いくつかの実施形態において、N末端またはC末端NLSは、二部分NLSである。二部分NLSは、比較的短いスペーサー配列によって分離される二つの塩基性アミノ酸クラスターを含む(それゆえにbipartite、二部分と呼ばれ、一部分(monopartite)NLSは異なる)。ヌクレオプラスミンのNLSであるKR[PAATKKAGQA]KKKKは遍在的な二部シグナルのプロトタイプであり、塩基性アミノ酸の二つのクラスターが約10アミノ酸のスペーサーによって隔てられたものである。例示的な二部NLSの配列は、PKKKRKVEGADKRTADGSEFESPKKKRKVである。
いくつかの実施形態において、本開示の融合タンパク質はリンカー配列を含まない。いくつかの実施形態において、ドメインまたはタンパク質の1つまたは複数の間のリンカー配列が存在する。いくつかの実施形態において、アデノシンデアミナーゼまたはシチジンデアミナーゼおよびCas9ドメインを有する例示的なCas9融合タンパク質の一般構造は以下の構造のいずれか1つを含み、ここでNLSは核局在化配列(例えば本明細書で提供される任意のNLS)であり、NH2は融合タンパク質のN末端であり、COOHは融合タンパク質のC末端である:
NH2-NLS-[アデノシンデアミナーゼ]-[Cas9ドメイン]-COOH、
NH2-NLS[Cas9ドメイン]-[アデノシンデアミナーゼ]-COOH、
NH2-[アデノシンデアミナーゼ]-[Cas9ドメイン]-NLS-COOH、
NH2-[Cas9ドメイン]-[アデノシンデアミナーゼ]-NLS-COOH、
NH2-NLS-[シチジンデアミナーゼ]-[Cas9ドメイン]-COOH、
NH2-NLS[Cas9ドメイン]-[シチジンデアミナーゼ]-COOH、
NH2-[シチジンデアミナーゼ]-[Cas9ドメイン]-NLS-COOH、または
NH2-[Cas9ドメイン]-[シチジンデアミナーゼ]-NLS-COOH。
本開示の融合タンパク質は、1つ以上のさらなる特徴を含み得ることが理解されるべきである。例えば、いくつかの実施形態において、融合タンパク質は、阻害因子、細胞質局在化配列、核外輸送配列などの輸送配列、または他の局在化配列、ならびに融合タンパク質の可溶化、精製、または検出に有用な配列タグを含むことができる。本明細書において提供される適切なタンパク質タグには、限定されるものではないが、ビオチンカルボキシラーゼキャリアータグ (BCCP) タグ、myc-タグ、カルモジュリンタグ、FLAG-タグ、ヘマグルチニン (HA) -タグ、ポリヒスチジンタグ(ヒスチジンタグまたはHis-タグとも呼ばれる)、マルトース結合タンパク質 (MBP) -タグ、nus-タグ、グルタチオン-S-トランスフェラーゼ (GST) -タグ、緑色蛍光タンパク質 (GFP) -タグ、チオレドキシンタグ、S-タグ、ソフタグ(例えばSoftag1、Softag3)、ストレプトタグ、ビオチンリガーゼタグ、FLAsHタグ、V5タグ、およびSBP-タグが含まれる。さらなる適切な配列は、当業者には明らかであろう。いくつかの実施形態において、融合タンパク質は、1つ以上のHisタグを含む。
1以上の核局在化配列 (NLS) を含むCRISPR酵素をコードするベクターを使用することができる。例えば、約1、2、3、4、5、6、7、8、9、10個のNLSを使用することができる。CRISPR酵素は、アミノ末端またはその近傍のNLS、カルボキシ末端またはその近傍の約1個、2個、3個、4個、5個、6個、7個、8個、9個、10個またはそれ以上のNLS、またはこれらの任意の組み合わせ(例えばアミノ末端における1以上のNLSおよびカルボキシ末端における1以上のNLS)を含むことができる。複数のNLSが存在する場合、各NLSは他から独立して選択することができ、したがって1つのNLSが1つ以上のコピーで存在することができ、および/または1つ以上のコピーで存在する1つ以上の他のNLSと組み合わせて存在することができる。
方法において使用されるCRISPR酵素は、約6個のNLSを含むことができる。NLSに最も近いアミノ酸がN-またはC-末端からポリペプチド鎖に沿って約50アミノ酸内(例えば1、2、3、4、5、10、15、20、25、30、40、または50アミノ酸内)にあるとき、そのNLSはN-またはC-末端の近傍にあると考えられる。
[核酸塩基編集ドメイン]
ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインおよび核酸塩基編集ドメイン(例えばデアミナーゼドメイン)を含む融合タンパク質を含む塩基エディターを本明細書に記載する。塩基エディターは、標的配列を認識することができるガイドポリヌクレオチドと相互作用することによって、標的ポリヌクレオチド配列中の1以上の塩基を編集するようにプログラムすることができる。標的配列がいったん認識されると、編集が行われるポリヌクレオチド上に塩基エディターが固定され、次いで、塩基エディターのデアミナーゼドメイン成分が標的塩基を編集することができる。
いくつかの実施形態において、核酸塩基編集ドメインは、デアミナーゼドメインを含む。本明細書で特に説明されているように、デアミナーゼドメインは、シトシンデアミナーゼまたはアデノシンデアミナーゼを含む。いくつかの実施形態では、「シトシンデアミナーゼ」および「シチジンデアミナーゼ」という用語は、交換可能に使用され得る。いくつかの実施形態では、「アデニンデアミナーゼ」および「アデノシンデアミナーゼ」という用語は、交換可能に使用され得る。核酸塩基編集タンパク質の詳細は、国際PCT出願番号PCT/2017/045381 (WO2018/027078) およびPCT/US2016/058344 (WO2017/070632) に記載されており、これらの各々は、その全体が参照により本明細書に組み込まれる。Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017); および Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity”Science Advances 3:eaao4774 (2017)も参照(その全内容が参照により本明細書に組み込まれる)。
[AからGへの編集]
いくつかの実施形態において、本明細書に記載される塩基エディターは、アデノシンデアミナーゼを含むデアミナーゼドメインを含むことができる。塩基エディターのこのようなアデノシンデアミナーゼドメインは、Aを脱アミノ化して、Gの塩基対形成特性を示すイノシン (I) を形成することによって、アデニン (A) 核酸塩基からグアニン (G) 核酸塩基への編集することを促進することができる。アデノシンデアミナーゼは、デオキシリボ核酸 (DNA) 中のデオキシアデノシン残基のアデニンを脱アミノ化すること(すなわちアミン基を除去すること)ができる。
いくつかの実施形態において、本明細書において提供される核酸塩基エディターは、1つ以上のタンパク質ドメインを融合させ、それによって融合タンパク質を生成することによって作製することができる。いくつかの実施形態において、本明細書において提供される融合タンパク質は、融合タンパク質の塩基編集活性(例えば効率、選択性、特異性)を改善する一つ以上の特徴を含む。例えば、本明細書中に提供される融合タンパク質は、ヌクレアーゼ活性が低下したCas9ドメインを含むことができる。いくつかの実施形態において、本明細書中で提供される融合タンパク質は、ヌクレアーゼ活性を有さないCas9ドメイン (dCas9) 、または、Cas9ニッカーゼ(nCas9) と呼ばれる、二本鎖DNA分子の一鎖を切断するCas9ドメインを有することができる。いかなる特定の理論にも拘束されることを望まないが、触媒残基(例えばH840)の存在が、標的Aと反対のTを含有する非編集(例えば非脱アミノ化)鎖を切断するCas9の活性を維持する。Cas9の触媒残基の突然変異(例えばD10からA10)は、標的A残基を含有する編集鎖の切断を妨げる。このようなCas9バリエーションは、gRNAによって規定される標的配列に基づく特定の位置で単一鎖DNA切断 (ニック) を生じさせることができ、非編集鎖の修復を導き、最終的には編集鎖においてTからCへの変化をもたらす。いくつかの実施形態において、AからGへの塩基エディターは、イノシン塩基除去修復の阻害因子、例えば、ウラシルグリコシラーゼ阻害因子 (UGI) ドメインまたは触媒的に不活性なイノシン特異的ヌクレアーゼをさらに含む。いかなる特定の理論にも束縛されることを望まないが、UGIドメインまたは触媒的に不活性なイノシン特異的ヌクレアーゼは、脱アミノ化されたアデノシン残基(例えばイノシン)の塩基除去修復を阻害または防止することができ、これが、塩基エディターの活性または効率を改善させることができる。
アデノシンデアミナーゼを含む塩基エディターは、DNA、RNAおよびDNA-RNAハイブリッドを含む任意のポリヌクレオチドに作用することができる。特定の実施形態では、アデノシンデアミナーゼを含む塩基エディターは、RNAを含むポリヌクレオチドの標的Aを脱アミノ化することができる。例えば、塩基エディターは、RNAポリヌクレオチドおよび/またはDNA-RNAハイブリッドポリヌクレオチドの標的Aを脱アミノ化することができるアデノシンデアミナーゼドメインを含むことができる。ある実施形態では、塩基エディターに組み込まれたアデノシンデアミナーゼは、RNAに作用するアデノシンデアミナーゼ(ADAR、例えばADAR1またはADAR2)の全部または一部を含む。別の実施形態では、塩基エディターに組み込まれたアデノシンデアミナーゼは、tRNAに作用するアデノシンデアミナーゼ(ADAT)の全部または一部を含む。アデノシンデアミナーゼドメインを含む塩基エディターはまた、DNAポリヌクレオチドのA核酸塩基を脱アミノ化する能力も有し得る。ある実施形態では、塩基エディターのアデノシンデアミナーゼドメインは、1以上の突然変異を含むADATの全部または一部を含み、これがDNA中の標的AをADATが脱アミノ化することを可能にする。例えば、塩基エディターは、D108N、A106V、D147Y、E155V、L84F、H123Y、I157F、または別のアデノシンデアミナーゼにおける対応する突然変異の1以上を含む大腸菌由来のADAT (EcTadA)の全部または一部を含むことができる。
アデノシンデアミナーゼは、任意の適切な生物(例えば大腸菌)に由来することができる。いくつかの実施形態において、アデニンデアミナーゼは、天然に存在するアデノシンデアミナーゼが本明細書に提供される突然変異のいずれかに対応する一つ以上の突然変異を含むものである(例えば、ecTadAにおける突然変異)。任意の相同タンパク質中の対応する残基は、例えば、配列アラインメントおよび相同残基の決定によって同定することができる。本明細書中に記載された突然変異のいずれか(例えば、ecTadAで同定された突然変異のいずれか)に対応する、任意の天然アデノシンデアミナーゼ(例えば、ecTadAに対して相同性を有するもの)における突然変異を、それに応じて生成することができる。
[CからTへの編集]
いくつかの実施形態において、本明細書に開示される塩基エディターは、ポリヌクレオチドの標的シチジン (C) 塩基を脱アミノ化してチミンの塩基対形成特性を有するウリジン (U) を生成することができる、シチジンデアミナーゼを含む融合タンパク質を含む。いくつかの実施形態において、例えば、ポリヌクレオチドが二本鎖(例えばDNA)である場合、ウリジン塩基は次いで、チミジン塩基で置換されて(例えば細胞修復機構により)、C:GからT:Aへの転移を生じさせることができる。他の実施形態において、塩基エディターによる核酸中のCからUへの脱アミノ化は、UからTへの置換を伴うことができない。
ポリヌクレオチド中の標的Cを脱アミノ化してUを生じさせることは、本明細書に記載の塩基エディターによって実行することができるタイプの塩基編集の非限定的な例である。別の例において、シチジンデアミナーゼドメインを含む塩基エディターは、シトシン (C) 塩基からグアニン (G) 塩基への変換を媒介することができる。例えば、塩基エディターのシチジンデアミナーゼドメインによるシチジンの脱アミノ化によって生成されたポリヌクレオチドのUは、塩基除去修復機構(例えばウラシルDNAグリコシラーゼ (UDG) ドメインによるもの)によってポリヌクレオチドから切り出され、脱塩基部位を生成することができる。次に、脱塩基部位の反対側の核酸塩基が、Cのような別の塩基で置換され得(例えば塩基修復機構により)、例えばこれは損傷乗り越えポリメラーゼによって行われる。脱塩基部位の反対側の核酸塩基がCで置換されるのが典型的であるが、他の置換(例えばA、G、T)も起こりうる。
したがって、いくつかの実施形態において、本明細書に記載される塩基エディターは、ポリヌクレオチド中の標的Cを脱アミノ化してUにすることができる脱アミノ化ドメイン(例えばシチジンデアミナーゼドメイン)を含む。さらに、以下に記載するように、塩基エディターは、脱アミノ化から生じるUの、いくつかの実施形態においてはTまたはGへの、変換を促進させるさらなるドメインを含むことができる。例えば、シチジンデアミナーゼドメインを含む塩基エディターは、さらにウラシルグリコシラーゼ阻害因子 (UGI) ドメインを含み、TによるUの置換を媒介し、CからTへの塩基編集事象を完了することができる。損傷乗り越えポリメラーゼは脱塩基部位の反対側でCの取り込みを促進することができるので(すなわち脱塩基部位でのGの取り込みをもたらし、CからGへの塩基編集事象を完了する)、別の例では塩基エディターは損傷乗り越えポリメラーゼを組み込んで、CからGへの塩基編集の効率を改善させることができる。
ドメインとしてシチジンデアミナーゼを含む塩基エディターは、DNA、RNAおよびDNA-RNAハイブリッドを含む任意のポリヌクレオチドにおいて標的Cを脱アミノ化することができる。典型的には、シチジンデアミナーゼは、ポリヌクレオチドの一本鎖部分の文脈に配置されるC核酸塩基を触媒する。いくつかの実施形態において、標的Cを含むポリヌクレオチド全体が一本鎖であり得る。例えば、塩基エディターに組み込まれたシチジンデアミナーゼは、一本鎖RNAポリヌクレオチド中の標的Cを脱アミノ化することができる。他の実施形態において、シチジンデアミナーゼドメインを含む塩基エディターは、二本鎖ポリヌクレオチドに作用することができるが、標的Cは、脱アミノ化反応の時点で一本鎖状態になるポリヌクレオチドの一部に位置し得る。例えば、NAGPBドメインがCas9ドメインを含む実施形態において、いくつかのヌクレオチドは、Cas9-gRNA-標的DNA複合体の形成の際に対合しないままにしておくことができ、その結果、Cas9「Rループ複合体」が形成される。これらの不対ヌクレオチドは、一本鎖特異的ヌクレオチドデアミナーゼ酵素(例えばシチジンデアミナーゼ)の基質として作用し得る一本鎖DNAのバブルを形成することができる。
いくつかの実施形態において、塩基エディターのシチジンデアミナーゼは、アポリポタンパク質B mRNA編集複合体(APOBEC) ファミリーデアミナーゼの全部または一部を含むことができる。APOBECは進化的に保存されたシチジンデアミナーゼファミリーである。このファミリーのメンバーはCからUへの編集酵素である。APOBEC様タンパク質のN末端ドメインは触媒ドメインであり、C末端ドメインは偽(pseudo)触媒ドメインである。より具体的には、触媒ドメインは亜鉛依存性のシチジンデアミナーゼドメインであり、シチジンの脱アミノ化にとって重要である。APOBECファミリーメンバーには、APOBEC1、APOBEC2、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D(今では「APOBEC3E」はこれを指す)、APOBEC3F、APOBEC3G、APOBEC3H、APOBEC4、および活性化誘導(シチジン) デアミナーゼが含まれる。いくつかの実施形態において、塩基エディターに組み込まれたデアミナーゼは、APOBEC1デアミナーゼの全部または一部を含む。いくつかの実施形態において、塩基エディターに組み込まれたデアミナーゼは、APOBEC2デアミナーゼの全部または一部を含む。いくつかの実施形態において、塩基エディターに組み込まれたデアミナーゼは、APOBEC3デアミナーゼの全部または一部を含む。いくつかの実施形態において、塩基エディターに組み込まれたデアミナーゼは、APOBEC3Aデアミナーゼの全部または一部を含む。いくつかの実施形態において、塩基エディターに組み込まれたデアミナーゼは、APOBEC3Bデアミナーゼの全部または一部を含む。いくつかの実施形態において、塩基エディターに組み込まれたデアミナーゼは、APOBEC3Cデアミナーゼの全部または一部を含む。いくつかの実施形態において、塩基エディターに組み込まれたデアミナーゼは、APOBEC3Dデアミナーゼの全部または一部を含む。いくつかの実施形態において、塩基エディターに組み込まれたデアミナーゼは、APOBEC3Eデアミナーゼの全部または一部を含む。いくつかの実施形態において、塩基エディターに組み込まれたデアミナーゼは、APOBEC3Fデアミナーゼの全部または一部を含む。いくつかの実施形態において、塩基エディターに組み込まれたデアミナーゼは、APOBEC3Gデアミナーゼの全部または一部を含む。いくつかの実施形態において、塩基エディターに組み込まれたデアミナーゼは、APOBEC3Hデアミナーゼの全部または一部を含む。いくつかの実施形態において、塩基エディターに組み込まれたデアミナーゼは、APOBEC4デアミナーゼの全部または一部を含む。いくつかの実施形態において、塩基エディターに組み込まれたデアミナーゼは、活性化誘導デアミナーゼ(AID) の全部または一部を含む。いくつかの実施形態において、塩基エディターに組み込まれたデアミナーゼは、シチジンデアミナーゼ1 (CDA1) の全部または一部を含む。塩基エディターは、任意の適切な生物(例えばヒトまたはラット)からのデアミナーゼを含むことができることを理解されるべきである。いくつかの実施形態において、塩基エディターのデアミナーゼドメインは、ヒト、チンパンジー、ゴリラ、サル、ウシ、イヌ、ラット、またはマウス由来である。いくつかの実施形態において、塩基エディターのデアミナーゼドメインは、ラットに由来する(例えばラットAPOBEC1)。いくつかの実施形態において、塩基エディターのデアミナーゼドメインは、ヒトAPOBEC1である。いくつかの実施形態において、塩基エディターのデアミナーゼドメインは、PmCDA1である。
PmCDA1のアミノ酸配列および核酸配列を下記に示す。
>tr|A5H718|A5H718_PETMA Cytosine deaminase OS=Petromyzon marinus OX=7757 PE=2 SV=1 amino acid sequence:
MTDAEYVRIHEKLDIYTFKKQFFNNKKSVSHRCYVLFELKRRGERRACFWGYAVNKPQSGTERGIHAEIFSIRKVEEYLRDNPGQFTINWYSSWSPCADCAEKILEWYNQELRGNGHTLKIWACKLYYEKNARNQIGLWNLRDNGVGLNVMVSEHYQCCRKIFIQSSHNQLNENRWLEKTLKRAEKRRSELSIMIQVKILHTTKSPAV
核酸配列:>EF094822.1 Petromyzon marinus isolate PmCDA.21 cytosine deaminase mRNA, complete cds:
TGACACGACACAGCCGTGTATATGAGGAAGGGTAGCTGGATGGGGGGGGGGGGAATACGTTCAGAGAGGACATTAGCGAGCGTCTTGTTGGTGGCCTTGAGTCTAGACACCTGCAGACATGACCGACGCTGAGTACGTGAGAATCCATGAGAAGTTGGACATCTACACGTTTAAGAAACAGTTTTTCAACAACAAAAAATCCGTGTCGCATAGATGCTACGTTCTCTTTGAATTAAAACGACGGGGTGAACGTAGAGCGTGTTTTTGGGGCTATGCTGTGAATAAACCACAGAGCGGGACAGAACGTGGAATTCACGCCGAAATCTTTAGCATTAGAAAAGTCGAAGAATACCTGCGCGACAACCCCGGACAATTCACGATAAATTGGTACTCATCCTGGAGTCCTTGTGCAGATTGCGCTGAAAAGATCTTAGAATGGTATAACCAGGAGCTGCGGGGGAACGGCCACACTTTGAAAATCTGGGCTTGCAAACTCTATTACGAGAAAAATGCGAGGAATCAAATTGGGCTGTGGAACCTCAGAGATAACGGGGTTGGGTTGAATGTAATGGTAAGTGAACACTACCAATGTTGCAGGAAAATATTCATCCAATCGTCGCACAATCAATTGAATGAGAATAGATGGCTTGAGAAGACTTTGAAGCGAGCTGAAAAACGACGGAGCGAGTTGTCCATTATGATTCAGGTAAAAATACTCCACACCACTAAGAGTCCTGCTGTTTAAGAGGCTATGCGGATGGTTTTC
ヒト活性化誘導性シチジンデアミナーゼ(AID)のコード配列(CDS)のアミノ酸配列および核酸配列を下記に示す。
>tr|Q6QJ80|Q6QJ80_HUMAN Activation-induced cytidine deaminase OS=Homo sapiens OX=9606 GN=AICDA PE=2 SV=1 amino acid sequence:
MDSLLMNRRKFLYQFKNVRWAKGRRETYLCYVVKRRDSATSFSLDFGYLRNKNGCHVELL
FLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGNPNLSLRIFTARLYFCEDRK
AEPEGLRRLHRAGVQIAIMTFKAPV
ヒト活性化誘導性シチジンデアミナーゼ(AID)のコード配列(CDS)のアミノ酸配列および核酸配列を下記に示す。
>tr|Q6QJ80|Q6QJ80_HUMAN Activation-induced cytidine deaminase OS=Homo sapiens OX=9606 GN=AICDA PE=2 SV=1 amino acid sequence:
MDSLLMNRRKFLYQFKNVRWAKGRRETYLCYVVKRRDSATSFSLDFGYLRNKNGCHVELL
FLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGNPNLSLRIFTARLYFCEDRK
AEPEGLRRLHRAGVQIAIMTFKAPV
核酸配列:>NG_011588.1:5001-15681 Homo sapiens activation induced cytidine deaminase (AICDA), RefSeqGene (LRG_17) on chromosome 12:
AGAGAACCATCATTAATTGAAGTGAGATTTTTCTGGCCTGAGACTTGCAGGGAGGCAAGAAGACACTCTGGACACCACTATGGACAGGTAAAGAGGCAGTCTTCTCGTGGGTGATTGCACTGGCCTTCCTCTCAGAGCAAATCTGAGTAATGAGACTGGTAGCTATCCCTTTCTCTCATGTAACTGTCTGACTGATAAGATCAGCTTGATCAATATGCATATATATTTTTTGATCTGTCTCCTTTTCTTCTATTCAGATCTTATACGCTGTCAGCCCAATTCTTTCTGTTTCAGACTTCTCTTGATTTCCCTCTTTTTCATGTGGCAAAAGAAGTAGTGCGTACAATGTACTGATTCGTCCTGAGATTTGTACCATGGTTGAAACTAATTTATGGTAATAATATTAACATAGCAAATCTTTAGAGACTCAAATCATGAAAAGGTAATAGCAGTACTGTACTAAAAACGGTAGTGCTAATTTTCGTAATAATTTTGTAAATATTCAACAGTAAAACAACTTGAAGACACACTTTCCTAGGGAGGCGTTACTGAAATAATTTAGCTATAGTAAGAAAATTTGTAATTTTAGAAATGCCAAGCATTCTAAATTAATTGCTTGAAAGTCACTATGATTGTGTCCATTATAAGGAGACAAATTCATTCAAGCAAGTTATTTAATGTTAAAGGCCCAATTGTTAGGCAGTTAATGGCACTTTTACTATTAACTAATCTTTCCATTTGTTCAGACGTAGCTTAACTTACCTCTTAGGTGTGAATTTGGTTAAGGTCCTCATAATGTCTTTATGTGCAGTTTTTGATAGGTTATTGTCATAGAACTTATTCTATTCCTACATTTATGATTACTATGGATGTATGAGAATAACACCTAATCCTTATACTTTACCTCAATTTAACTCCTTTATAAAGAACTTACATTACAGAATAAAGATTTTTTAAAAATATATTTTTTTGTAGAGACAGGGTCTTAGCCCAGCCGAGGCTGGTCTCTAAGTCCTGGCCCAAGCGATCCTCCTGCCTGGGCCTCCTAAAGTGCTGGAATTATAGACATGAGCCATCACATCCAATATACAGAATAAAGATTTTTAATGGAGGATTTAATGTTCTTCAGAAAATTTTCTTGAGGTCAGACAATGTCAAATGTCTCCTCAGTTTACACTGAGATTTTGAAAACAAGTCTGAGCTATAGGTCCTTGTGAAGGGTCCATTGGAAATACTTGTTCAAAGTAAAATGGAAAGCAAAGGTAAAATCAGCAGTTGAAATTCAGAGAAAGACAGAAAAGGAGAAAAGATGAAATTCAACAGGACAGAAGGGAAATATATTATCATTAAGGAGGACAGTATCTGTAGAGCTCATTAGTGATGGCAAAATGACTTGGTCAGGATTATTTTTAACCCGCTTGTTTCTGGTTTGCACGGCTGGGGATGCAGCTAGGGTTCTGCCTCAGGGAGCACAGCTGTCCAGAGCAGCTGTCAGCCTGCAAGCCTGAAACACTCCCTCGGTAAAGTCCTTCCTACTCAGGACAGAAATGACGAGAACAGGGAGCTGGAAACAGGCCCCTAACCAGAGAAGGGAAGTAATGGATCAACAAAGTTAACTAGCAGGTCAGGATCACGCAATTCATTTCACTCTGACTGGTAACATGTGACAGAAACAGTGTAGGCTTATTGTATTTTCATGTAGAGTAGGACCCAAAAATCCACCCAAAGTCCTTTATCTATGCCACATCCTTCTTATCTATACTTCCAGGACACTTTTTCTTCCTTATGATAAGGCTCTCTCTCTCTCCACACACACACACACACACACACACACACACACACACACACACACAAACACACACCCCGCCAACCAAGGTGCATGTAAAAAGATGTAGATTCCTCTGCCTTTCTCATCTACACAGCCCAGGAGGGTAAGTTAATATAAGAGGGATTTATTGGTAAGAGATGATGCTTAATCTGTTTAACACTGGGCCTCAAAGAGAGAATTTCTTTTCTTCTGTACTTATTAAGCACCTATTATGTGTTGAGCTTATATATACAAAGGGTTATTATATGCTAATATAGTAATAGTAATGGTGGTTGGTACTATGGTAATTACCATAAAAATTATTATCCTTTTAAAATAAAGCTAATTATTATTGGATCTTTTTTAGTATTCATTTTATGTTTTTTATGTTTTTGATTTTTTAAAAGACAATCTCACCCTGTTACCCAGGCTGGAGTGCAGTGGTGCAATCATAGCTTTCTGCAGTCTTGAACTCCTGGGCTCAAGCAATCCTCCTGCCTTGGCCTCCCAAAGTGTTGGGATACAGTCATGAGCCACTGCATCTGGCCTAGGATCCATTTAGATTAAAATATGCATTTTAAATTTTAAAATAATATGGCTAATTTTTACCTTATGTAATGTGTATACTGGCAATAAATCTAGTTTGCTGCCTAAAGTTTAAAGTGCTTTCCAGTAAGCTTCATGTACGTGAGGGGAGACATTTAAAGTGAAACAGACAGCCAGGTGTGGTGGCTCACGCCTGTAATCCCAGCACTCTGGGAGGCTGAGGTGGGTGGATCGCTTGAGCCCTGGAGTTCAAGACCAGCCTGAGCAACATGGCAAAACGCTGTTTCTATAACAAAAATTAGCCGGGCATGGTGGCATGTGCCTGTGGTCCCAGCTACTAGGGGGCTGAGGCAGGAGAATCGTTGGAGCCCAGGAGGTCAAGGCTGCACTGAGCAGTGCTTGCGCCACTGCACTCCAGCCTGGGTGACAGGACCAGACCTTGCCTCAAAAAAATAAGAAGAAAAATTAAAAATAAATGGAAACAACTACAAAGAGCTGTTGTCCTAGATGAGCTACTTAGTTAGGCTGATATTTTGGTATTTAACTTTTAAAGTCAGGGTCTGTCACCTGCACTACATTATTAAAATATCAATTCTCAATGTATATCCACACAAAGACTGGTACGTGAATGTTCATAGTACCTTTATTCACAAAACCCCAAAGTAGAGACTATCCAAATATCCATCAACAAGTGAACAAATAAACAAAATGTGCTATATCCATGCAATGGAATACCACCCTGCAGTACAAAGAAGCTACTTGGGGATGAATCCCAAAGTCATGACGCTAAATGAAAGAGTCAGACATGAAGGAGGAGATAATGTATGCCATACGAAATTCTAGAAAATGAAAGTAACTTATAGTTACAGAAAGCAAATCAGGGCAGGCATAGAGGCTCACACCTGTAATCCCAGCACTTTGAGAGGCCACGTGGGAAGATTGCTAGAACTCAGGAGTTCAAGACCAGCCTGGGCAACACAGTGAAACTCCATTCTCCACAAAAATGGGAAAAAAAGAAAGCAAATCAGTGGTTGTCCTGTGGGGAGGGGAAGGACTGCAAAGAGGGAAGAAGCTCTGGTGGGGTGAGGGTGGTGATTCAGGTTCTGTATCCTGACTGTGGTAGCAGTTTGGGGTGTTTACATCCAAAAATATTCGTAGAATTATGCATCTTAAATGGGTGGAGTTTACTGTATGTAAATTATACCTCAATGTAAGAAAAAATAATGTGTAAGAAAACTTTCAATTCTCTTGCCAGCAAACGTTATTCAAATTCCTGAGCCCTTTACTTCGCAAATTCTCTGCACTTCTGCCCCGTACCATTAGGTGACAGCACTAGCTCCACAAATTGGATAAATGCATTTCTGGAAAAGACTAGGGACAAAATCCAGGCATCACTTGTGCTTTCATATCAACCATGCTGTACAGCTTGTGTTGCTGTCTGCAGCTGCAATGGGGACTCTTGATTTCTTTAAGGAAACTTGGGTTACCAGAGTATTTCCACAAATGCTATTCAAATTAGTGCTTATGATATGCAAGACACTGTGCTAGGAGCCAGAAAACAAAGAGGAGGAGAAATCAGTCATTATGTGGGAACAACATAGCAAGATATTTAGATCATTTTGACTAGTTAAAAAAGCAGCAGAGTACAAAATCACACATGCAATCAGTATAATCCAAATCATGTAAATATGTGCCTGTAGAAAGACTAGAGGAATAAACACAAGAATCTTAACAGTCATTGTCATTAGACACTAAGTCTAATTATTATTATTAGACACTATGATATTTGAGATTTAAAAAATCTTTAATATTTTAAAATTTAGAGCTCTTCTATTTTTCCATAGTATTCAAGTTTGACAATGATCAAGTATTACTCTTTCTTTTTTTTTTTTTTTTTTTTTTTTTGAGATGGAGTTTTGGTCTTGTTGCCCATGCTGGAGTGGAATGGCATGACCATAGCTCACTGCAACCTCCACCTCCTGGGTTCAAGCAAAGCTGTCGCCTCAGCCTCCCGGGTAGATGGGATTACAGGCGCCCACCACCACACTCGGCTAATGTTTGTATTTTTAGTAGAGATGGGGTTTCACCATGTTGGCCAGGCTGGTCTCAAACTCCTGACCTCAGAGGATCCACCTGCCTCAGCCTCCCAAAGTGCTGGGATTACAGATGTAGGCCACTGCGCCCGGCCAAGTATTGCTCTTATACATTAAAAAACAGGTGTGAGCCACTGCGCCCAGCCAGGTATTGCTCTTATACATTAAAAAATAGGCCGGTGCAGTGGCTCACGCCTGTAATCCCAGCACTTTGGGAAGCCAAGGCGGGCAGAACACCCGAGGTCAGGAGTCCAAGGCCAGCCTGGCCAAGATGGTGAAACCCCGTCTCTATTAAAAATACAAACATTACCTGGGCATGATGGTGGGCGCCTGTAATCCCAGCTACTCAGGAGGCTGAGGCAGGAGGATCCGCGGAGCCTGGCAGATCTGCCTGAGCCTGGGAGGTTGAGGCTACAGTAAGCCAAGATCATGCCAGTATACTTCAGCCTGGGCGACAAAGTGAGACCGTAACAAAAAAAAAAAAATTTAAAAAAAGAAATTTAGATCAAGATCCAACTGTAAAAAGTGGCCTAAACACCACATTAAAGAGTTTGGAGTTTATTCTGCAGGCAGAAGAGAACCATCAGGGGGTCTTCAGCATGGGAATGGCATGGTGCACCTGGTTTTTGTGAGATCATGGTGGTGACAGTGTGGGGAATGTTATTTTGGAGGGACTGGAGGCAGACAGACCGGTTAAAAGGCCAGCACAACAGATAAGGAGGAAGAAGATGAGGGCTTGGACCGAAGCAGAGAAGAGCAAACAGGGAAGGTACAAATTCAAGAAATATTGGGGGGTTTGAATCAACACATTTAGATGATTAATTAAATATGAGGACTGAGGAATAAGAAATGAGTCAAGGATGGTTCCAGGCTGCTAGGCTGCTTACCTGAGGTGGCAAAGTCGGGAGGAGTGGCAGTTTAGGACAGGGGGCAGTTGAGGAATATTGTTTTGATCATTTTGAGTTTGAGGTACAAGTTGGACACTTAGGTAAAGACTGGAGGGGAAATCTGAATATACAATTATGGGACTGAGGAACAAGTTTATTTTATTTTTTGTTTCGTTTTCTTGTTGAAGAACAAATTTAATTGTAATCCCAAGTCATCAGCATCTAGAAGACAGTGGCAGGAGGTGACTGTCTTGTGGGTAAGGGTTTGGGGTCCTTGATGAGTATCTCTCAATTGGCCTTAAATATAAGCAGGAAAAGGAGTTTATGATGGATTCCAGGCTCAGCAGGGCTCAGGAGGGCTCAGGCAGCCAGCAGAGGAAGTCAGAGCATCTTCTTTGGTTTAGCCCAAGTAATGACTTCCTTAAAAAGCTGAAGGAAAATCCAGAGTGACCAGATTATAAACTGTACTCTTGCATTTTCTCTCCCTCCTCTCACCCACAGCCTCTTGATGAACCGGAGGAAGTTTCTTTACCAATTCAAAAATGTCCGCTGGGCTAAGGGTCGGCGTGAGACCTACCTGTGCTACGTAGTGAAGAGGCGTGACAGTGCTACATCCTTTTCACTGGACTTTGGTTATCTTCGCAATAAGGTATCAATTAAAGTCGGCTTTGCAAGCAGTTTAATGGTCAACTGTGAGTGCTTTTAGAGCCACCTGCTGATGGTATTACTTCCATCCTTTTTTGGCATTTGTGTCTCTATCACATTCCTCAAATCCTTTTTTTTATTTCTTTTTCCATGTCCATGCACCCATATTAGACATGGCCCAAAATATGTGATTTAATTCCTCCCCAGTAATGCTGGGCACCCTAATACCACTCCTTCCTTCAGTGCCAAGAACAACTGCTCCCAAACTGTTTACCAGCTTTCCTCAGCATCTGAATTGCCTTTGAGATTAATTAAGCTAAAAGCATTTTTATATGGGAGAATATTATCAGCTTGTCCAAGCAAAAATTTTAAATGTGAAAAACAAATTGTGTCTTAAGCATTTTTGAAAATTAAGGAAGAAGAATTTGGGAAAAAATTAACGGTGGCTCAATTCTGTCTTCCAAATGATTTCTTTTCCCTCCTACTCACATGGGTCGTAGGCCAGTGAATACATTCAACATGGTGATCCCCAGAAAACTCAGAGAAGCCTCGGCTGATGATTAATTAAATTGATCTTTCGGCTACCCGAGAGAATTACATTTCCAAGAGACTTCTTCACCAAAATCCAGATGGGTTTACATAAACTTCTGCCCACGGGTATCTCCTCTCTCCTAACACGCTGTGACGTCTGGGCTTGGTGGAATCTCAGGGAAGCATCCGTGGGGTGGAAGGTCATCGTCTGGCTCGTTGTTTGATGGTTATATTACCATGCAATTTTCTTTGCCTACATTTGTATTGAATACATCCCAATCTCCTTCCTATTCGGTGACATGACACATTCTATTTCAGAAGGCTTTGATTTTATCAAGCACTTTCATTTACTTCTCATGGCAGTGCCTATTACTTCTCTTACAATACCCATCTGTCTGCTTTACCAAAATCTATTTCCCCTTTTCAGATCCTCCCAAATGGTCCTCATAAACTGTCCTGCCTCCACCTAGTGGTCCAGGTATATTTCCACAATGTTACATCAACAGGCACTTCTAGCCATTTTCCTTCTCAAAAGGTGCAAAAAGCAACTTCATAAACACAAATTAAATCTTCGGTGAGGTAGTGTGATGCTGCTTCCTCCCAACTCAGCGCACTTCGTCTTCCTCATTCCACAAAAACCCATAGCCTTCCTTCACTCTGCAGGACTAGTGCTGCCAAGGGTTCAGCTCTACCTACTGGTGTGCTCTTTTGAGCAAGTTGCTTAGCCTCTCTGTAACACAAGGACAATAGCTGCAAGCATCCCCAAAGATCATTGCAGGAGACAATGACTAAGGCTACCAGAGCCGCAATAAAAGTCAGTGAATTTTAGCGTGGTCCTCTCTGTCTCTCCAGAACGGCTGCCACGTGGAATTGCTCTTCCTCCGCTACATCTCGGACTGGGACCTAGACCCTGGCCGCTGCTACCGCGTCACCTGGTTCACCTCCTGGAGCCCCTGCTACGACTGTGCCCGACATGTGGCCGACTTTCTGCGAGGGAACCCCAACCTCAGTCTGAGGATCTTCACCGCGCGCCTCTACTTCTGTGAGGACCGCAAGGCTGAGCCCGAGGGGCTGCGGCGGCTGCACCGCGCCGGGGTGCAAATAGCCATCATGACCTTCAAAGGTGCGAAAGGGCCTTCCGCGCAGGCGCAGTGCAGCAGCCCGCATTCGGGATTGCGATGCGGAATGAATGAGTTAGTGGGGAAGCTCGAGGGGAAGAAGTGGGCGGGGATTCTGGTTCACCTCTGGAGCCGAAATTAAAGATTAGAAGCAGAGAAAAGAGTGAATGGCTCAGAGACAAGGCCCCGAGGAAATGAGAAAATGGGGCCAGGGTTGCTTCTTTCCCCTCGATTTGGAACCTGAACTGTCTTCTACCCCCATATCCCCGCCTTTTTTTCCTTTTTTTTTTTTTGAAGATTATTTTTACTGCTGGAATACTTTTGTAGAAAACCACGAAAGAACTTTCAAAGCCTGGGAAGGGCTGCATGAAAATTCAGTTCGTCTCTCCAGACAGCTTCGGCGCATCCTTTTGGTAAGGGGCTTCCTCGCTTTTTAAATTTTCTTTCTTTCTCTACAGTCTTTTTTGGAGTTTCGTATATTTCTTATATTTTCTTATTGTTCAATCACTCTCAGTTTTCATCTGATGAAAACTTTATTTCTCCTCCACATCAGCTTTTTCTTCTGCTGTTTCACCATTCAGAGCCCTCTGCTAAGGTTCCTTTTCCCTCCCTTTTCTTTCTTTTGTTGTTTCACATCTTTAAATTTCTGTCTCTCCCCAGGGTTGCGTTTCCTTCCTGGTCAGAATTCTTTTCTCCTTTTTTTTTTTTTTTTTTTTTTTTTTTAAACAAACAAACAAAAAACCCAAAAAAACTCTTTCCCAATTTACTTTCTTCCAACATGTTACAAAGCCATCCACTCAGTTTAGAAGACTCTCCGGCCCCACCGACCCCCAACCTCGTTTTGAAGCCATTCACTCAATTTGCTTCTCTCTTTCTCTACAGCCCCTGTATGAGGTTGATGACTTACGAGACGCATTTCGTACTTTGGGACTTTGATAGCAACTTCCAGGAATGTCACACACGATGAAATATCTCTGCTGAAGACAGTGGATAAAAAACAGTCCTTCAAGTCTTCTCTGTTTTTATTCTTCAACTCTCACTTTCTTAGAGTTTACAGAAAAAATATTTATATACGACTCTTTAAAAAGATCTATGTCTTGAAAATAGAGAAGGAACACAGGTCTGGCCAGGGACGTGCTGCAATTGGTGCAGTTTTGAATGCAACATTGTCCCCTACTGGGAATAACAGAACTGCAGGACCTGGGAGCATCCTAAAGTGTCAACGTTTTTCTATGACTTTTAGGTAGGATGAGAGCAGAAGGTAGATCCTAAAAAGCATGGTGAGAGGATCAAATGTTTTTATATCAACATCCTTTATTATTTGATTCATTTGAGTTAACAGTGGTGTTAGTGATAGATTTTTCTATTCTTTTCCCTTGACGTTTACTTTCAAGTAACACAAACTCTTCCATCAGGCCATGATCTATAGGACCTCCTAATGAGAGTATCTGGGTGATTGTGACCCCAAACCATCTCTCCAAAGCATTAATATCCAATCATGCGCTGTATGTTTTAATCAGCAGAAGCATGTTTTTATGTTTGTACAAAAGAAGATTGTTATGGGTGGGGATGGAGGTATAGACCATGCATGGTCACCTTCAAGCTACTTTAATAAAGGATCTTAAAATGGGCAGGAGGACTGTGAACAAGACACCCTAATAATGGGTTGATGTCTGAAGTAGCAAATCTTCTGGAAACGCAAACTCTTTTAAGGAAGTCCCTAATTTAGAAACACCCACAAACTTCACATATCATAATTAGCAAACAATTGGAAGGAAGTTGCTTGAATGTTGGGGAGAGGAAAATCTATTGGCTCTCGTGGGTCTCTTCATCTCAGAAATGCCAATCAGGTCAAGGTTTGCTACATTTTGTATGTGTGTGATGCTTCTCCCAAAGGTATATTAACTATATAAGAGAGTTGTGACAAAACAGAATGATAAAGCTGCGAACCGTGGCACACGCTCATAGTTCTAGCTGCTTGGGAGGTTGAGGAGGGAGGATGGCTTGAACACAGGTGTTCAAGGCCAGCCTGGGCAACATAACAAGATCCTGTCTCTCAAAAAAAAAAAAAAAAAAAAGAAAGAGAGAGGGCCGGGCGTGGTGGCTCACGCCTGTAATCCCAGCACTTTGGGAGGCCGAGCCGGGCGGATCACCTGTGGTCAGGAGTTTGAGACCAGCCTGGCCAACATGGCAAAACCCCGTCTGTACTCAAAATGCAAAAATTAGCCAGGCGTGGTAGCAGGCACCTGTAATCCCAGCTACTTGGGAGGCTGAGGCAGGAGAATCGCTTGAACCCAGGAGGTGGAGGTTGCAGTAAGCTGAGATCGTGCCGTTGCACTCCAGCCTGGGCGACAAGAGCAAGACTCTGTCTCAGAAAAAAAAAAAAAAAAGAGAGAGAGAGAGAAAGAGAACAATATTTGGGAGAGAAGGATGGGGAAGCATTGCAAGGAAATTGTGCTTTATCCAACAAAATGTAAGGAGCCAATAAGGGATCCCTATTTGTCTCTTTTGGTGTCTATTTGTCCCTAACAACTGTCTTTGACAGTGAGAAAAATATTCAGAATAACCATATCCCTGTGCCGTTATTACCTAGCAACCCTTGCAATGAAGATGA

GCAGATCCACAGGAAAACTTGAATGCACAACTGTCTTATTTTAATCTTATTGTACATAAGTTTGTAAAAGAGTTAAAAATTGTTACTTCATGTATTCATTTATATTTTATATTATTTTGCGTCTAATGATTTTTTATTAACATGATTTCCTTTTCTGATATATTGAAATGGAGTCTCAAAGCTTCATAAATTTATAACTTTAGAAATGATTCTAATAACAACGTATGTAATTGTAACATTGCAGTAATGGTGCTACGAAGCCATTTCTCTTGATTTTTAGTAAACTTTTATGACAGCAAATTTGCTTCTGGCTCACTTTCAATCAGTTAAATAAATGATAAATAATTTTGGAAGCTGTGAAGATAAAATACCAAATAAAATAATATAAAAGTGATTTATATGAAGTTAAAATAAAAAATCAGTATGATGGAATAAACTTG
本開示の態様に従ってCas9に融合され得る他の例示的デアミナーゼが、以下に提供される。実施形態において、デアミナーゼは活性化誘導性デアミナーゼ(AID)である。いくつかの実施形態において、それぞれの配列の活性ドメイン、例えば、局在化シグナル(核局在化配列、核外搬出シグナル、細胞質局在化シグナル)を伴わないドメインが使用され得ることが理解されるべきである。
ヒトAID:
Figure 2022520081000037
(下線:核局在化配列;二重下線:核外輸送シグナル)
マウスAID:
Figure 2022520081000038
(下線:核局在化配列;二重下線:核外輸送シグナル)
イヌAID:
Figure 2022520081000039
(下線:核局在化配列;二重下線:核外輸送シグナル)
ウシAID:
Figure 2022520081000040
(下線:核局在化配列;二重下線:核外輸送シグナル)
ラットAID:
Figure 2022520081000041
(下線:核局在化配列;二重下線:核外輸送シグナル)
マウスAPOBEC-3-(2):
Figure 2022520081000042
(斜体:核酸編集ドメイン)
ラットAPOBEC-3:
Figure 2022520081000043
(斜体:核酸編集ドメイン)
アカゲザルAPOBEC-3G:
Figure 2022520081000044
(斜体:核酸編集ドメイン;下線:細胞質局在化シグナル)
チンパンジーAPOBEC-3G:
Figure 2022520081000045
(斜体:核酸編集ドメイン;下線:細胞質局在化シグナル)
ミドリザルAPOBEC-3G:
Figure 2022520081000046
(斜体:核酸編集ドメイン;下線:細胞質局在化シグナル)
ヒトAPOBEC-3G:
Figure 2022520081000047
(斜体:核酸編集ドメイン;下線:細胞質局在化シグナル)
ヒトAPOBEC-3F:
Figure 2022520081000048
(斜体:核酸編集ドメイン)
ヒトAPOBEC-3B:
Figure 2022520081000049
(斜体:核酸編集ドメイン)
ラットAPOBEC-3B:
MQPQGLGPNAGMGPVCLGCSHRRPYSPIRNPLKKLYQQTFYFHFKNVRYAWGRKNNFLCYEVNGMDCALPVPLRQGVFRKQGHIHAELCFIYWFHDKVLRVLSPMEEFKVTWYMSWSPCSKCAEQVARFLAAHRNLSLAIFSSRLYYYLRNPNYQQKLCRLIQEGVHVAAMDLPEFKKCWNKFVDNDGQPFRPWMRLRINFSFYDCKLQEIFSRMNLLREDVFYLQFNNSHRVKPVQNRYYRRKSYLCYQLERANGQEPLKGYLLYKKGEQHVEILFLEKMRSMELSQVRITCYLTWSPCPNCARQLAAFKKDHPDLILRIYTSRLYFWRKKFQKGLCTLWRSGIHVDVMDLPQFADCWTNFVNPQRPFRPWNELEKNSWRIQRRLRRIKESWGL
ウシAPOBEC-3B:
DGWEVAFRSGTVLKAGVLGVSMTEGWAGSGHPGQGACVWTPGTRNTMNLLREVLFKQQFGNQPRVPAPYYRRKTYLCYQLKQRNDLTLDRGCFRNKKQRHAERFIDKINSLDLNPSQSYKIICYITWSPCPNCANELVNFITRNNHLKLEIFASRLYFHWIKSFKMGLQDLQNAGISVAVMTHTEFEDCWEQFVDNQSRPFQPWDKLEQYSASIRRRLQRILTAPI
チンパンジーAPOBEC-3B:
MNPQIRNPMEWMYQRTFYYNFENEPILYGRSYTWLCYEVKIRRGHSNLLWDTGVFRGQMYSQPEHHAEMCFLSWFCGNQLSAYKCFQITWFVSWTPCPDCVAKLAKFLAEHPNVTLTISAARLYYYWERDYRRALCRLSQAGARVKIMDDEEFAYCWENFVYNEGQPFMPWYKFDDNYAFLHRTLKEIIRHLMDPDTFTFNFNNDPLVLRRHQTYLCYEVERLDNGTWVLMDQHMGFLCNEAKNLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFISWSPCFSWGCAGQVRAFLQENTHVRLRIFAARIYDYDPLYKEALQMLRDAGAQVSIMTYDEFEYCWDTFVYRQGCPFQPWDGLEEHSQALSGRLRAILQVRASSLCMVPHRPPPPPQSPGPCLPLCSEPPLGSLLPTGRPAPSLPFLLTASFSFPPPASLPPLPSLSLSPGHLPVPSFHSLTSCSIQPPCSSRIRETEGWASVSKEGRDLG
ヒトAPOBEC-3C:
Figure 2022520081000050
(斜体:核酸編集ドメイン)
ゴリラAPOBEC-3C
Figure 2022520081000051
(斜体:核酸編集ドメイン)
ヒトAPOBEC-3A:
Figure 2022520081000052
(斜体:核酸編集ドメイン)
アカゲザルAPOBEC-3A:
Figure 2022520081000053
(斜体:核酸編集ドメイン)
ウシAPOBEC-3A:
Figure 2022520081000054
(斜体:核酸編集ドメイン)
ヒトAPOBEC-3H:
Figure 2022520081000055
(斜体:核酸編集ドメイン)
アカゲザルAPOBEC-3H:
MALLTAKTFSLQFNNKRRVNKPYYPRKALLCYQLTPQNGSTPTRGHLKNKKKDHAEIRFINKIKSMGLDETQCYQVTCYLTWSPCPSCAGELVDFIKAHRHLNLRIFASRLYYHWRPNYQEGLLLLCGSQVPVEVMGLPEFTDCWENFVDHKEPPSFNPSEKLEELDKNSQAIKRRLERIKSRSVDVLENGLRSLQLGPVTPSSSIRNSR
ヒトAPOBEC-3D:
Figure 2022520081000056
(斜体:核酸編集ドメイン)
ヒトAPOBEC-1:
MTSEKGPSTGDPTLRRRIEPWEFDVFYDPRELRKEACLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERDFHPSMSCSITWFLSWSPCWECSQAIREFLSRHPGVTLVIYVARLFWHMDQQNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLTFFRLHLQNCHYQTIPPHILLATGLIHPSVAWR
マウスAPOBEC-1:
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSVWRHTSQNTSNHVEVNFLEKFTTERYFRPNTRCSITWFLSWSPCGECSRAITEFLSRHPYVTLFIYIARLYHHTDQRNRQGLRDLISSGVTIQIMTEQEYCYCWRNFVNYPPSNEAYWPRYPHLWVKLYVLELYCIILGLPPCLKILRRKQPQLTFFTITLQTCHYQRIPPHLLWATGLK
ラットAPOBEC-1:
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLK
ヒトAPOBEC-2:
MAQKEEAAVATEAASQNGEDLENLDDPEKLKELIELPPFEIVTGERLPANFFKFQFRNVEYSSGRNKTFLCYVVEAQGKGGQVQASRGYLEDEHAAAHAEEAFFNTILPAFDPALRYNVTWYVSSSPCAACADRIIKTLSKTKNLRLLILVGRLFMWEEPEIQAALKKLKEAGCKLRIMKPQDFEYVWQNFVEQEEGESKAFQPWEDIQENFLYYEEKLADILK
マウスAPOBEC-2:
MAQKEEAAEAAAPASQNGDDLENLEDPEKLKELIDLPPFEIVTGVRLPVNFFKFQFRNVEYSSGRNKTFLCYVVEVQSKGGQAQATQGYLEDEHAGAHAEEAFFNTILPAFDPALKYNVTWYVSSSPCAACADRILKTLSKTKNLRLLILVSRLFMWEEPEVQAALKKLKEAGCKLRIMKPQDFEYIWQNFVEQEEGESKAFEPWEDIQENFLYYEEKLADILK
ラットAPOBEC-2:
MAQKEEAAEAAAPASQNGDDLENLEDPEKLKELIDLPPFEIVTGVRLPVNFFKFQFRNVEYSSGRNKTFLCYVVEAQSKGGQVQATQGYLEDEHAGAHAEEAFFNTILPAFDPALKYNVTWYVSSSPCAACADRILKTLSKTKNLRLLILVSRLFMWEEPEVQAALKKLKEAGCKLRIMKPQDFEYLWQNFVEQEEGESKAFEPWEDIQENFLYYEEKLADILK
ウシAPOBEC-2:
MAQKEEAAAAAEPASQNGEEVENLEDPEKLKELIELPPFEIVTGERLPAHYFKFQFRNVEYSSGRNKTFLCYVVEAQSKGGQVQASRGYLEDEHATNHAEEAFFNSIMPTFDPALRYMVTWYVSSSPCAACADRIVKTLNKTKNLRLLILVGRLFMWEEPEIQAALRKLKEAGCRLRIMKPQDFEYIWQNFVEQEEGESKAFEPWEDIQENFLYYEEKLADILK
Petromyzon marinus CDA1 (pmCDAl) :
MTDAEYVRIHEKLDIYTFKKQFFNNKKSVSHRCYVLFELKRRGERRACFWGYAVNKPQSGTERGIHAEIFSIRKVEEYLRDNPGQFTINWYSSWSPCADCAEKILEWYNQELRGNGHTLKIWACKLYYEKNARNQIGLWNLRDNGVGLNVMVSEHYQCCRKIFIQSSHNQLNENRWLEKTLKRAEKRRSELSFMIQVKILHTTKSPAV
ヒトAPOBEC3G D316R D317R:
MKPHFRNTVERMYRDTFSYNFYNRPILSRRNTVWLCYEVKTKGPSRPPLDAKIFRGQVYSELKYHPEMRFFHWFSKWRKLHRDQEYEVTWYISWSPCTKCTRDMATFLAEDPKVTLTIFVARLYYFWDPDYQEALRSLCQKRDGPRATMKFNYDEFQHCWSKFVYSQRELFEPWNNLPKYYILLHFMLGEILRHSMDPPTFTFNFNNEPWVRGRHETYLCYEVERMHNDTWVLLNQRRGFLCNQAPHKHGFLEGRHAELCFLDVIPFWKLDLDQDYRVTCFTSWSPCFSCAQEMAKFISKKHVSLCIFTARIYRRQGRCQEGLRTLAEAGAKISFTYSEFKHCWDTFVDHQGCPFQPWDGLDEHSQDLSGRLRAILQNQEN
ヒトAPOBEC3G A鎖:
MDPPTFTFNFNNEPWWGRHETYLCYEVERMHNDTWVLLNQRRGFLCNQAPHKHGFLEGRHAELCFLDVIPFWKLDLDQDYRVTCFTSWSPCFSCAQEMAKFISKNKHVSLCIFTARIYDDQGRCQEGLRTLAEAGAKISFTYSEFKHCWDTFVDHQGCPFQPWDGLDEHSQDLSGRLRAILQ
ヒトAPOBEC3G A鎖D120R D121R:
MDPPTFTFNFNNEPWVRGRHETYLCYEVERMHNDTWVLLNQRRGFLCNQAPHKHGFLEGRHAELCFLDVIPFWKLDLDQDYRVTCFTSWSPCFSCAQEMAKFISKNKHVSLCIFTARIYRRQGRCQEGLRTLAEAGAKISFMTYSEFKHCWDTFVDHQGCPFQPWDGLDEHSQDLSGRLRAILQ
本開示のいくつかの態様は、例えばデアミナーゼドメインに点突然変異を生じさせることによって、本明細書に記載される融合タンパク質のいずれかのデアミナーゼドメイン触媒活性を調節することが、融合タンパク質(例えば塩基エディター)のプロセス特性に影響を及ぼすという認識に基づく。例えば、塩基編集融合タンパク質内のデアミナーゼドメインの触媒活性を減少させるが除去はしない突然変異は、デアミナーゼドメインが標的残基に隣接する残基の脱アミノ化を触媒する可能性を低くし、それによって脱アミノ化のウィンドウを狭めることができる。脱アミノ化のウィンドウを狭める能力は、特定の標的残基に隣接する残基の望まれない脱アミノ化を防ぐことができ、それは、オフターゲット効果を減少させるか、または防ぐことができる。
例えば、いくつかの実施形態において、塩基エディターに組み込まれたAPOBECデアミナーゼは、rAPOBEC1のH121X、H122X、R26X、R118X、W90X、W90X、およびR132Xからなる群から選択される1以上の突然変異、または別のAPOBECデアミナーゼにおける1以上の対応する突然変異を含むことができ、ここでXは任意のアミノ酸である。いくつかの実施形態において、塩基エディターに組み込まれたAPOBECデアミナーゼは、rAPOBEC1のH121R、H122R、R26A、R26E、R118A、W90A、W90Y、およびR132Eからなる群から選択される1以上の突然変異、または別のAPOBECデアミナーゼにおける1以上の対応する突然変異を含むことができる。
いくつかの実施形態において、塩基エディターに組み込まれたAPOBECデアミナーゼは、hAPOBEC3GのD316X、D317X、R320X、R320X、R313X、W285X、W285X、R326Xからなる群から選択される1以上の突然変異、または別のAPOBECデアミナーゼにおける1以上の対応する突然変異を含むことができ、ここでXは任意のアミノ酸である。いくつかの実施形態において、本明細書で提供される融合タンパク質のいずれかは、hAPOBEC3GのD316R、D317R、R320A、R320E、R313A、W285A、W285Y、R326Eからなる群から選択される1以上の突然変異、または別のAPOBECデアミナーゼにおける1以上の対応する突然変異を含むAPOBECデアミナーゼを含む。
いくつかの実施形態において、塩基エディターに組み込まれたAPOBECデアミナーゼは、rAPOBEC1のH121RおよびH122R突然変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する突然変異を含むことができる。いくつかの実施形態において、塩基エディターに組み込まれたAPOBECデアミナーゼは、rAPOBEC1のR26A突然変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する突然変異を含むAPOBECデアミナーゼを含むことができる。いくつかの実施形態において、塩基エディターに組み込まれたAPOBECデアミナーゼは、rAPOBEC1のR26E突然変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する突然変異を含むAPOBECデアミナーゼを含むことができる。いくつかの実施形態において、塩基エディターに組み込まれたAPOBECデアミナーゼは、rAPOBEC1のR118A突然変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する突然変異を含むAPOBECデアミナーゼを含むことができる。いくつかの実施形態において、塩基エディターに組み込まれたAPOBECデアミナーゼは、rAPOBEC1のW90A突然変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する突然変異を含むAPOBECデアミナーゼを含むことができる。いくつかの実施形態において、塩基エディターに組み込まれたAPOBECデアミナーゼは、rAPOBEC1のW90Y突然変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する突然変異を含むAPOBECデアミナーゼを含むことができる。いくつかの実施形態において、塩基エディターに組み込まれたAPOBECデアミナーゼは、rAPOBEC1のR132E突然変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する突然変異を含むAPOBECデアミナーゼを含むことができる。いくつかの実施形態において、塩基エディターに組み込まれたAPOBECデアミナーゼは、rAPOBEC1のW90YおよびR26E突然変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する突然変異を含むAPOBECデアミナーゼを含むことができる。いくつかの実施形態において、塩基エディターに組み込まれたAPOBECデアミナーゼは、rAPOBEC1のR26EおよびR132E突然変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する突然変異を含むAPOBECデアミナーゼを含むことができる。いくつかの実施形態において、塩基エディターに組み込まれたAPOBECデアミナーゼは、rAPOBEC1のW90YおよびR132E突然変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する突然変異を含むAPOBECデアミナーゼを含むことができる。いくつかの実施形態において、塩基エディターに組み込まれたAPOBECデアミナーゼは、rAPOBEC1のW90Y、R26E、およびR132E突然変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する突然変異を含むAPOBECデアミナーゼを含むことができる。
いくつかの実施形態において、塩基エディターに組み込まれたAPOBECデアミナーゼは、hAPOBEC3GのD316RおよびD317R突然変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する突然変異を含むAPOBECデアミナーゼを含むことができる。いくつかの実施形態において、本明細書で提供される融合タンパク質のいずれかは、hAPOBEC3GのR320A突然変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する突然変異を含むAPOBECデアミナーゼを含む。いくつかの実施形態において、塩基エディターに組み込まれたAPOBECデアミナーゼは、hAPOBEC3GのR320E突然変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する突然変異を含むAPOBECデアミナーゼを含むことができる。いくつかの実施形態において、塩基エディターに組み込まれたAPOBECデアミナーゼは、hAPOBEC3GのR313A突然変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する突然変異を含むAPOBECデアミナーゼを含むことができる。いくつかの実施形態において、塩基エディターに組み込まれたAPOBECデアミナーゼは、hAPOBEC3GのW285A突然変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する突然変異を含むAPOBECデアミナーゼを含むことができる。いくつかの実施形態において、塩基エディターに組み込まれたAPOBECデアミナーゼは、hAPOBEC3GのW285Y突然変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する突然変異を含むAPOBECデアミナーゼを含むことができる。いくつかの実施形態において、塩基エディターに組み込まれたAPOBECデアミナーゼは、hAPOBEC3GのR326E突然変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する突然変異を含むAPOBECデアミナーゼを含むことができる。いくつかの実施形態において、塩基エディターに組み込まれたAPOBECデアミナーゼは、hAPOBEC3GのW285YおよびR320E突然変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する突然変異を含むAPOBECデアミナーゼを含むことができる。いくつかの実施形態において、塩基エディターに組み込まれたAPOBECデアミナーゼは、hAPOBEC3GのR320EおよびR326E突然変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する突然変異を含むAPOBECデアミナーゼを含むことができる。いくつかの実施形態において、塩基エディターに組み込まれたAPOBECデアミナーゼは、hAPOBEC3GのW285YおよびR326E突然変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する突然変異を含むAPOBECデアミナーゼを含むことができる。いくつかの実施形態において、塩基エディターに組み込まれたAPOBECデアミナーゼは、hAPOBEC3GのW285Y、R320E、およびR326E突然変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する突然変異を含むAPOBECデアミナーゼを含むことができる。
限定されるものではないが、Addgeneから入手できるSaBE3、SaKKH-BE3、VQR-BE3、EQR-BE3、VRER-BE3、YE1-BE3、EE-BE3、YE2-BE3、およびYEE-BE3(プラスミド85169、85170、85171、85172、85173、85174、85175、85176、85177)を含め、多数の改変シチジンデアミナーゼが市販されている。いくつかの実施形態において、塩基エディターに組み込まれるデアミナーゼは、APOBEC1デアミナーゼの全部または一部を含む。
CからTへの核酸塩基編集タンパク質の詳細は、国際PCT出願番号PCT/US2016/058344 (WO2017/070632) およびKomor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016) に記載されており、これらの全内容は参照により本明細書に組み入れられる。
[Cas9ドメインならびにアデノシンデアミナーゼおよび/またはシチジンデアミナーゼを含む融合タンパク質]
本開示のいくつかの態様は、Cas9ドメインまたは他の核酸プログラミング可能なDNA結合タンパク質と、1つ以上のアデノシンデアミナーゼドメイン、シチジンデアミナーゼドメイン、および/またはDNAグリコシラーゼドメインとを含む融合タンパク質を提供する。このCas9ドメインは、本明細書に提供されるCas9ドメインまたはCas9タンパク質(例えばdCas9またはnCas9)のいずれでもあり得ることが理解されるべきである。いくつかの実施形態において、本明細書に提供されるCas9ドメインまたはCas9タンパク質(例えばdCas9またはnCas9)のいずれかが、本明細書に提供されるシチジンデアミナーゼおよびアデノシンデアミナーゼのいずれかと融合され得る。本明細書に開示される塩基エディターのドメインは、任意の順序で配列され得る。
例えば、限定するものではないが、いくつかの実施形態において、融合タンパク質は、以下の構造を含む:
NH2-[シチジンデアミナーゼ]-[Cas9ドメイン]-[アデノシンデアミナーゼ]-COOH;
NH2-[アデノシンデアミナーゼ]-[Cas9ドメイン]-[シチジンデアミナーゼ]-COOH;
NH2-[アデノシンデアミナーゼ]-[シチジンデアミナーゼ]-[Cas9ドメイン]-COOH;
NH2-[シチジンデアミナーゼ]-[アデノシンデアミナーゼ]-[Cas9ドメイン]-COOH;
NH2-[Cas9ドメイン]-[アデノシンデアミナーゼ]-[シチジンデアミナーゼ]-COOH; または
NH2-[Cas9ドメイン]-[シチジンデアミナーゼ]-[アデノシンデアミナーゼ]-COOH。
いくつかの実施形態において、融合タンパク質のアデノシンデアミナーゼはTadA*8およびシチジンデアミナーゼを含む。いくつかの実施形態において、TadA*8は、TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23、またはTadA*8.24である。
例示的な融合タンパク質構造としては以下が挙げられる:
NH2-[アデノシンデアミナーゼ]-[Cas9]-[シチジンデアミナーゼ]-COOH、
NH2-[シチジンデアミナーゼ]-[Cas9]-[アデノシンデアミナーゼ]-COOH、
NH2-[TadA*8]-[Cas9]-[シチジンデアミナーゼ]-COOH、または
NH2-[シチジンデアミナーゼ]-[Cas9]-[TadA*8]-COOH。
いくつかの実施形態において、シチジンデアミナーゼ、脱塩基エディター、およびアデノシンデアミナーゼ、ならびにnapDNAbp(例えばCas9ドメイン)を含む融合タンパク質は、リンカー配列を含まない。いくつかの実施形態において、リンカーが、シチジンデアミナーゼおよびアデノシンデアミナーゼドメインならびにnapDNAbpの間に存在する。いくつかの実施形態において、上記の一般的な構築で使用される「-」は、任意のリンカーの存在を示す。いくつかの実施形態において、シチジンデアミナーゼおよびアデノシンデアミナーゼおよびnapDNAbpは、本明細書に提供される任意のリンカーを介して融合される。例えば、いくつかの実施形態において、シチジンデアミナーゼおよびアデノシンデアミナーゼおよびnapDNAbpは、「リンカー」と題されたセクションにおいて以下に提供されるリンカーのいずれかを介して融合される。
いくつかの実施形態において、シチジンデアミナーゼ、アデノシンデアミナーゼおよびCas9またはCas12ドメインを有する典型的なCas9またはCas12融合タンパク質の一般的な構築は、以下の構造のいずれかを含み、ここで、NLSは核局在化配列(例えば本明細書に提供される任意のNLS)であり、NH2は融合タンパク質のN末端であり、COOHは融合タンパク質のC末端である。
NH2-NLS-[シチジンデアミナーゼ]-[Cas9ドメイン]-[アデノシンデアミナーゼ]-COOH;
NH2-NLS-[アデノシンデアミナーゼ]-[Cas9ドメイン]-[シチジンデアミナーゼ]-COOH;
NH2-NLS-[アデノシンデアミナーゼ] [シチジンデアミナーゼ]-[Cas9ドメイン]-COOH;
NH2-NLS-[シチジンデアミナーゼ]-[アデノシンデアミナーゼ]-[Cas9ドメイン]-COOH;
NH2-NLS-[Cas9ドメイン]-[アデノシンデアミナーゼ]-[シチジンデアミナーゼ]-COOH;
NH2-NLS-[Cas9ドメイン]-[シチジンデアミナーゼ]-[アデノシンデアミナーゼ]-COOH;
NH2-[シチジンデアミナーゼ]-[Cas9ドメイン]-[アデノシンデアミナーゼ]-NLS-COOH;
NH2-[アデノシンデアミナーゼ]-[Cas9ドメイン]-[シチジンデアミナーゼ]-NL2-COOH;
NH2-[アデノシンデアミナーゼ] [シチジンデアミナーゼ]-[Cas9ドメイン]-NLS-COOH;
NH2-[シチジンデアミナーゼ]-[アデノシンデアミナーゼ]-[Cas9ドメイン]-NLS-COOH;
NH2-[Cas9ドメイン]-[アデノシンデアミナーゼ]-[シチジンデアミナーゼ]-NLS-COOH; または
NH2-[Cas9ドメイン]-[シチジンデアミナーゼ]-[アデノシンデアミナーゼ]-NLS-COOH.
いくつかの実施形態において、NLSはリンカー中に存在するか、またはNLSはリンカー、例えば本明細書に記載されるリンカーによって隣接される。いくつかの実施形態において、N末端またはC末端のNLSは、二部分NLSである。二部分NLSは、比較的短いスペーサー配列によって分離される二つの塩基性アミノ酸クラスターを含む(それゆえにbipartite、二部分と呼ばれ、一部分(monopartite)NLSは異なる)。ヌクレオプラスミンのNLSであるKR[PAATKKAGQA]KKKKは遍在的な二部シグナルのプロトタイプであり、塩基性アミノ酸の二つのクラスターが約10アミノ酸のスペーサーによって隔てられたものである。例示的な二部NLSの配列は、PKKKRKVEGADKRTADGSEFESPKKKRKVである。
いくつかの実施形態において、シチジンデアミナーゼ、アデノシンデアミナーゼ、Cas9ドメインおよびNLSを含む融合タンパク質は、リンカー配列を含まない。いくつかの実施形態において、一つ以上のドメインまたはタンパク質(例えばシチジンデアミナーゼ、アデノシンデアミナーゼ、Cas9ドメインまたはNLS)の間にリンカー配列が存在する。
本開示の融合タンパク質は、1つ以上のさらなる特徴を含み得ることが理解されるべきである。例えば、いくつかの実施形態において、融合タンパク質は、阻害因子、細胞質局在化配列、核輸出配列などの輸出配列、または他の局在化配列、ならびに融合タンパク質の可溶化、精製、または検出に有用な配列タグを含むことができる。本明細書において提供される適切なタンパク質タグには、限定されるものではないが、ビオチンカルボキシラーゼキャリアータンパク質(BCCP) タグ、myc-タグ、カルモジュリンタグ、FLAG-タグ、ヘマグルチニン(HA) -タグ、ポリヒスチジンタグ(ヒスチジンタグまたはHis-タグとも呼ばれる)、マルトース結合タンパク質(MBP) -タグ、nus-タグ、グルタチオン-S-トランスフェラーゼ(GST) -タグ、緑色蛍光タンパク質(GFP) -タグ、チオレドキシンタグ、S-タグ、ソフタグ(例えばSoftag 1、Softag 3)、ストレプトタグ、ビオチンリガーゼタグ、FlAsHタグ、V5タグ、およびSBP-タグが含まれる。さらなる適切な配列は、当業者には明らかであろう。いくつかの実施形態において、融合タンパク質は、1つ以上のHisタグを含む。
例示的な、ただし非限定的な融合タンパク質は国際PCT出願番号PCT/2017/044935およびPCT/US2020/016288に記載されており、これらのそれぞれは参照により全体が本明細書に組み込まれる。
[アデノシンデアミナーゼ]
いくつかの実施形態において、本明細書に記載される塩基エディターは、アデノシンデアミナーゼを含むデアミナーゼドメインを含むことができる。塩基エディターのこのようなアデノシンデアミナーゼドメインは、Aを脱アミノ化して、Gの塩基対形成特性を示すイノシン (I) を形成することによって、アデニン (A) 核酸塩基からグアニン (G) 核酸塩基への編集することを促進することができる。アデノシンデアミナーゼは、デオキシリボ核酸 (DNA) 中のデオキシアデノシン残基のアデニンを脱アミノ化すること(すなわちアミン基を除去すること)ができる。
いくつかの実施形態において、本明細書に提供されるアデノシンデアミナーゼは、アデニンを脱アミノ化することができる。いくつかの実施形態において、本明細書で提供されるアデノシンデアミナーゼは、DNAのデオキシアデノシン残基中のアデニンを脱アミノ化することができる。アデノシンデアミナーゼは、いくつかの実施形態において、アデニンデアミナーゼは、本明細書に提供される突然変異のいずれか(例えばecTadAにおける突然変異)に対応する一つ以上の突然変異を含む、天然に存在するアデノシンデアミナーゼである。当業者は、例えば配列アラインメントおよび相同的残基の決定によって、任意の相同的タンパク質中の対応する残基を同定することができる。したがって、当業者は、任意の天然に存在するアデノシンデアミナーゼ(例えばecTadA対する相同性を有するもの)において、本明細書に記載された突然変異のいずれか(例えばecTadAにおいて同定される突然変異のいずれか)に対応する突然変異を生成することができる。いくつかの実施形態において、アデノシンデアミナーゼは原核生物由来である。いくつかの実施形態において、アデノシンデアミナーゼは、細菌由来である。いくつかの実施形態において、アデノシンデアミナーゼは、Escherichia coli、Staphylococcus aureus、Salmonella typhi、Shewanella putrefaciens、Haemophilus influenzae、Caulobacter crescentus、またはBacillus subtilisに由来する。いくつかの実施形態において、アデノシンデアミナーゼは、大腸菌由来である。
本開示は、増加した効率(>50~60%)および特異性を有するアデノシンデアミナーゼバリアントを提供する。特に、本明細書に記載のアデノシンデアミナーゼバリアントは、ポリヌクレオチド内の所望の塩基を編集する可能性がより高く、改変が意図されない塩基(すなわち、「バイスタンダー」)を編集する可能性がより低い。
特定の実施形態において、TadAは、PCT/US2017/045381 (WO 2018/027078)(参照により全体が本明細書に組み込まれる)に記載のTadAのいずれか1つである。
いくつかの実施形態において、本開示の核酸塩基エディターは、以下の配列中に改変を含むアデノシンデアミナーゼバリアントである:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
(TadA*7.10とも称される)。
特定の実施形態において、融合タンパク質は、単一の(例えばモノマーとして提供される)TadA*8バリアントを含む。いくつかの実施形態において、TadA*8はCas9ニッカーゼに連結している。いくつかの実施形態において、本開示の融合タンパク質は、TadA*8バリアントに連結した野生型TadA(TadA (wt) )のヘテロダイマーとして含む。他の実施形態において、本開示の融合タンパク質は、TadA*8バリアントに連結したTadA*7.10のヘテロダイマーとして含む。いくつかの実施形態において、塩基エディターは、TadA*8バリアントモノマーを含むABE8である。いくつかの実施形態において、塩基エディターは、TadA*8バリアントおよびTadA (wt)のヘテロダイマーを含むABE8である。いくつかの実施形態において、塩基エディターは、TadA*8バリアントおよびTadA*7.10のヘテロダイマーを含むABE8である。いくつかの実施形態において、塩基エディターは、TadA*8バリアントのヘテロダイマーを含むABE8である。いくつかの実施形態において、TadA*8バリアントは表7から選択される。いくつかの実施形態において、ABE8は表7から選択される。関連する配列は以下の通りである:
野生型TadA(TadA (wt) )または「TadA参照配列」
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKKAQSSTD
TadA*7.10:
MSEVEFSHEYW MRHALTLAKR ARDEREVPVG AVLVLNNRVI GEGWNRAIGL HDPTAHAEIM ALRQGGLVMQ NYRLIDATLY VTFEPCVMCA GAMIHSRIGR VVFGVRNAKT GAAGSLMDVL HYPGMNHRVE ITEGILADEC AALLCYFFRM PRQVFNAQKK AQSSTD
いくつかの実施形態において、アデノシンデアミナーゼは、本明細書で提供されるアデノシンデアミナーゼのいずれかのアミノ酸配列のいずれかに対して少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性を有するアミノ酸配列を含む。本明細書において提供されるアデノシンデアミナーゼは、一つ以上の突然変異(例えば本明細書に提供される突然変異のいずれか)を含み得ることが理解されるべきである。本開示は、特定のパーセント同一性を有するとともに、本明細書に記載される突然変異のいずれかまたはそれらの組合せを伴うデアミナーゼドメインを提供する。いくつかの実施形態において、アデノシンデアミナーゼは、参照配列と比較して、または本明細書に提供されるアデノシンデアミナーゼのいずれかと比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50個またはそれ以上の変異を有するアミノ酸配列を含む。いくつかの実施形態において、アデノシンデアミナーゼは、当該技術分野において既知であるかまたは本明細書に記載されるアミノ酸配列のいずれかと比較して、少なくとも5個、少なくとも10個、少なくとも15個、少なくとも20個、少なくとも25個、少なくとも30個、少なくとも35個、少なくとも40個、少なくとも45個、少なくとも50個、少なくとも60個、少なくとも70個、少なくとも80個、少なくとも90個、少なくとも100個、少なくとも110個、少なくとも120個、少なくとも130個、少なくとも140個、少なくとも150個、少なくとも160個、または少なくとも170個の同一の一続きのアミノ酸残基を有するアミノ酸配列を含む。
いくつかの実施形態において、TadAデアミナーゼは、全長大腸菌TadAデアミナーゼである。例えば、特定の実施形態において、アデノシンデアミナーゼは、以下のアミノ酸配列を含む:
MRRAFITGVFFLSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKKAQSSTD
しかしながら、本出願において有用なさらなるアデノシンデアミナーゼが当業者には明らかであり、本開示の範囲内であることが理解されるべきである。例えば、アデノシンデアミナーゼは、tRNAに作用するアデノシンデアミナーゼ(ADAT)のホモログであり得る。限定されるものではないが、例示的なAD ATホモログのアミノ酸配列は以下のものを含む:
Staphylococcus aureus TadA:
MGSHMTNDIYFMTLAIEEAKKAAQLGEVPIGAIITKDDEVIARAHNLRETLQQPTAHAEHIAIERAAKVLGSWRLEGCTLYVTLEPCVMCAGTIVMSRIPRVVYGADDPKGGCSGS LMNLLQQSNFNHRAIVDKGVLKEACSTLLTTFFKNLRANKKSTN
Bacillus subtilis TadA:
MTQDELYMKEAIKEAKKAEEKGEVPIGAVLVINGEIIARAHNLRETEQRSIAHAEMLVIDEACKALGTWRLEGATLYVTLEPCPMCAGAVVLSRVEKVVFGAFDPKGGCSGTLMNLLQEERFNHQAEVVSGVLEEECGGMLSAFFRELRKKKKAARKNLSE
Salmonella typhimurium (S. typhimurium) TadA:
MPPAFITGVTSLSDVELDHEYWMRHALTLAKRAWDEREVPVGAVLVHNHRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVLQNYRLLDTTLYVTLEPCVMCAGAMVHSRIGRVVFGARDAKTGAAGSLIDVLHHPGMNHRVEIIEGVLRDECATLLSDFFRMRRQEIKALKKADRAEGAGPAV
Shewanella putrefaciens (S. putrefaciens) TadA:
MDEYWMQVAMQMAEKAEAAGEVPVGAVLVKDGQQIATGYNLSISQHDPTAHAEILCLRSAGKKLENYRLLDATLYITLEPCAMCAGAMVHSRIARVVYGARDEKTGAAGTVVNLLQHPAFNHQVEVTSGVLAEACSAQLSRFFKRRRDEKKALKLAQRAQQGIE
Haemophilus influenzae F3031 (H. influenzae) TadA:
MDAAKVRSEFDEKMMRYALELADKAEALGEIPVGAVLVDDARNIIGEGWNLSIVQSDPTΑΗAEIIALRNGAKNIQNYRLLNSTLYVTLEPCTMCAGAILHSRIKRLVFGASDYKTGAIGSRFHFFDDYKMNHTLEITSGVLAEECSQKLSTFFQKRREEKKIEKALLKSLSDK
Caulobacter crescentus (C. crescentus) TadA:
MRTDESEDQDHRMMRLALDAARAAAEAGETPVGAVILDPSTGEVIATAGNGPIAAHDPTAHAEIAAMRAAAAKLGNYRLTDLTLVVTLEPCAMCAGAISHARIGRVVFGADDPKGGAVVHGPKFFAQPTCHWRPEVTGGVLADESADLLRGFFRARRKAKI
Geobacter sulfurreducens (G. sulfurreducens) TadA:
MSSLKKTPIRDDAYWMGKAIREAAKAAARDEVPIGAVIVRDGAVIGRGHNLREGSNDPSAHAEMIAIRQAARRSANWRLTGATLYVTLEPCLMCMGAIILARLERVVFGCYDPKGGAAGSLYDLSADPRLNHQVRLSPGVCQEECGTMLSDFFRDLRRRKKAKATPALF IDERKVPPEP
E. coli TadA (ecTadA) の実施形態は以下のものを含む:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
いくつかの実施形態において、アデノシンデアミナーゼは、原核生物由来である。いくつかの実施形態において、アデノシンデアミナーゼは、細菌由来である。いくつかの実施形態において、アデノシンデアミナーゼは、Escherichia coli、Staphylococcus aureus、Salmonella typhi、Shewanella putrefaciens、Haemophilus influenzae、Caulobacter crescentus、またはBacillus subtilisに由来する。いくつかの実施形態において、アデノシンデアミナーゼは、大腸菌由来である。
一実施形態において、本開示の融合タンパク質は、TadA7.10に連結された野生型TadAがCas9ニッカーゼに連結されたものを含む。特定の実施形態では、融合タンパク質は、単一のTadA7.10ドメイン(例えば、モノマーとして提供される)を含む。他の実施形態では、ABE7.10エディターは、TadA7.10およびTadA(wt) を含み、これらはヘテロ二量体を形成することができる。
いくつかの実施形態において、アデノシンデアミナーゼは、本明細書に提供されるアデノシンデアミナーゼのいずれかに記載のアミノ酸配列のいずれかに対して少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。本明細書において提供されるアデノシンデアミナーゼは、一つ以上の突然変異(例えば、本明細書に提供される突然変異のいずれか)を含み得ることが理解されるべきである。本開示は、特定のパーセント同一性を有するデアミナーゼドメインが加えて本明細書に記載される突然変異のいずれかまたはその組合せを含むものを提供する。いくつかの実施形態において、アデノシンデアミナーゼは、参照配列または本明細書に提供されるアデノシンデアミナーゼのいずれかと比較して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、またはそれ以上の変異を有するアミノ酸配列を含む。いくつかの実施形態において、アデノシンデアミナーゼは、当該技術分野において既知であるかまたは本明細書に記載されたアミノ酸配列のいずれかと比較して、少なくとも5個、少なくとも10個、少なくとも15個、少なくとも20個、少なくとも25個、少なくとも30個、少なくとも35個、少なくとも40個、少なくとも45個、少なくとも50個、少なくとも60個、少なくとも70個、少なくとも80個、少なくとも90個、少なくとも100個、少なくとも110個、少なくとも120個、少なくとも130個、少なくとも140個、少なくとも150個、少なくとも160個、または少なくとも170個の同一の連続するアミノ酸残基を有するアミノ酸配列を含む。
本明細書に提供される突然変異(例えばTadA参照配列に基づくもの)のいずれもが、大腸菌TadA(ecTadA)、黄色ブドウ球菌TadA(saTadA)、または他のアデノシンデアミナーゼ(例えば細菌アデノシンデアミナーゼ)などの他のアデノシンデアミナーゼに導入され得ることが理解されるべきである。さらなるデアミナーゼを同様にアラインメントして、本明細書中に提供されるように変異させ得る相同的アミノ酸残基を同定できることは、当業者には明らかであろう。したがって、TadA参照配列において同定された突然変異のいずれも、相同的なアミノ酸残基を有する他のアデノシンデアミナーゼ(例えばecTada)において作製することができる。また、本明細書中に提供される突然変異のいずれも、TadA参照配列または別のアデノシンデアミナーゼにおいて、個々にまたは任意の組合せで作製できることが理解されるべきである。
いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるD108X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含み、Xは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態において、アデノシンデアミナーゼは、D108G、D108N、D108V、D108A、またはD108Y突然変異、または別のアデノシンデアミナーゼにおける対応する突然変異を含む。
いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるA106X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含み、Xは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるA106V突然変異、または別のアデノシンデアミナーゼ(例えば野生型TadAまたはecTadA)における対応する突然変異を含む。
いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるE155X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含み、Xの存在は、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるE155D、E155G、またはE155V突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。
いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるD147X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含み、Xの存在は、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるD147Y突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。
いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるA106X、E155X、またはD147X、突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含み、Xは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態において、アデノシンデアミナーゼは、E155D、E155G、またはE155V突然変異を含む。いくつかの実施形態において、アデノシンデアミナーゼは、D147Yを含む。
例えば、アデノシンデアミナーゼは、TadA参照配列におけるD108N、A106V、E155V、および/またはD147Y突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含み得る。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列における以下の突然変異群(突然変異の群は「;」によって分離されている)、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む:D108NおよびA106V;D108NおよびE155V;D108NおよびD147Y;A106VおよびE155V;A106VおよびD147Y;E155VおよびD147Y;D108N, A106V,およびE155V;D108N, A106V,およびD147Y;D108N, E155V,およびD147Y;A106V, E155V,およびD 147Y;およびD108N, A106V, E155V,およびD147Y。ただし、ここで提供される対応する突然変異の任意の組合せを、アデノシンデアミナーゼ(例えばecTadA)において作製することができることを理解されたい。
いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるH8X、T17X、L18X、W23X、L34X、W45X、R51X、A56X、E59X、E85X、M94X、I95X、V102X、F104X、A106X、R107X、D108X、K110X、M118X、N127X、A138X、F149X、M151X、R153X、Q154X、I156X、および/またはK157X突然変異のうちの1以上、または他のアデノシンデアミナーゼ(例えばecTadA)における1以上の対応する突然変異を含み、ここで、Xの存在は、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列に関連するH8Y、T17S、L18E、W23L、L34S、W45L、R51H、A56E、またはA56S、E59G、E85K、またはE85G、M94L、I95L、V102A、F104L、A106V、R107C、またはR107H、またはR107P、D108G、またはD108N、またはD108A、D108Y、K110I、M118K、N127S、A138V、F149Y、M151V、R153C、Q154L、I156D、および/またはK157R突然変異のうちの1つ以上、または他のアデノシンデアミナーゼ(例えばecTadA)における1つ以上の対応する突然変異を含む。
いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるH8X、D108X、および/またはN127X突然変異のうちの1つ以上、または別のアデノシンデアミナーゼ(例えばecTadA)における1つ以上の対応する突然変異を含み、Xは任意のアミノ酸の存在を示す。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、および/またはN127S突然変異の1以上、または別のアデノシンデアミナーゼ(例えばecTadA)における1以上の対応する突然変異を含む。
いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるH8X、R26X、M61X、L68X、M70X、A106X、D108X、A109X、N127X、D147X、R152X、Q154X、E155X、K161X、Q163X、および/またはT166X突然変異の1以上、または別のアデノシンデアミナーゼ(例えばecTadA)における1以上の対応する突然変異を含み、ここでXは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸の存在を示す。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、R26W、M61I、L68Q、M70V、A106T、D108N、A109T、N127S、D147Y、R152C、Q154HもしくはQ154R、E155GもしくはE155VもしくはE155D、K161Q、Q163H、および/もしくはT166P突然変異の1つ以上、または他のアデノシンデアミナーゼ(例えばecTadA)における1つ以上の対応する突然変異を含む。
いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるH8X、D108X、N127X、D147X、R152X、およびQ154Xからなる群より選択される1つ、2つ、3つ、4つ、5つ、または6つの突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異(複数可)を含み、ここでXは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸の存在を示す。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるH8X、M61X、M70X、D108X、N127X、Q154X、E155X、およびQ163Xからなる群より選択される1つ、2つ、3つ、4つ、5つ、6つ、7つ、または8つの突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異(複数可)を含み、ここでXは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸の存在を示す。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるH8X、D108X、N127X、E155X、およびT166Xからなる群より選択される1つ、2つ、3つ、4つ、または5つの突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異(複数可)を含み、ここでXは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸の存在を示す。
いくつかの実施形態において、アデノシンデアミナーゼは、H8X、A106X、D108X、別のアデノシンデアミナーゼにおける突然変異(複数可)からなる群から選択される1、2、3、4、5、または6個の突然変異を含み、ここでXは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す。いくつかの実施形態において、アデノシンデアミナーゼは、H8X、R26X、L68X、D108X、N127X、D147X、およびE155Xからなる群より選択される1つ、2つ、3つ、4つ、5つ、6つ、7つ、または8つの突然変異、または別のアデノシンデアミナーゼにおける対応する突然変異(複数可)を含み、Xは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸の存在を示す。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるH8X、D108X、A109X、N127X、およびE155Xからなる群より選択される1つ、2つ、3つ、4つ、または5つの突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異(複数可)を含み、Xは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸の存在を示す。
いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、N127S、D147Y、R152C、およびQ154Hからなる群より選択される1つ、2つ、3つ、4つ、5つ、または6つの突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、M61I、M70V、D108N、N127S、Q154R、E155GおよびQ163Hからなる群より選択される1つ、2つ、3つ、4つ、5つ、6つ、7つまたは8つの突然変異、または他のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、N127S、E155V、およびT166Pからなる群より選択される1つ、2つ、3つ、4つ、または5つの突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異(複数可)を含む。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、A106T、D108N、N127S、E155D、およびK161Qからなる群から選択される1つ、2つ、3つ、4つ、5つ、または6つの突然変異、または他のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、R26W、L68Q、D108N、N127S、D147Y、およびE155Vからなる群より選択される1つ、2つ、3つ、4つ、5つ、6つ、7つ、または8つの突然変異、または他のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、A109T、N127S、およびE155Gからなる群より選択される1つ、2つ、3つ、4つ、または5つの突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異(複数可)を含む。
本明細書に提供される突然変異のいずれか、および任意のさらなる突然変異(例えばecTadAアミノ酸配列に基づくもの)は、任意の他のアデノシンデアミナーゼに導入することができる。本明細書に提供される突然変異のいずれも、TadA参照配列または別のアデノシンデアミナーゼ(例えばecTadA)において、個々に、または任意の組合せで作製することができる。
AからGへの核酸塩基編集タンパク質の詳細は、国際PCT出願第PCT/2017/045381号(国際公開第2018/027078号)およびGaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature, 551, 464-471 (2017)に記載されており、その内容全体が参照により本明細書に組み込まれる。
いくつかの実施形態において、アデノシンデアミナーゼは、別のアデノシンデアミナーゼ(例えばecTadA)において一つ以上の対応する突然変異を含む。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列においてD108N、D108G、もしくはD108V突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)において対応する突然変異を含む。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるA106VおよびD108N突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるR107CおよびD108N突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、N127S、D147Y、およびQ154H突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、N127S、D147Y、およびE155V突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるD108N、D147Y、およびE155V突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、およびN127S突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるA106V、D108N、D147YおよびE155V突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。
いくつかの実施形態において、アデノシンデアミナーゼは、tadA参照配列におけるS2X、H8X、I49X、L84X、H123X、N127X、I156Xおよび/またはK160X突然変異の1つ以上、または別のアデノシンデアミナーゼにおける1つ以上の対応する突然変異を含み、Xの存在は、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるS2A、H8Y、I49F、L84F、H123Y、N127S、I156Fおよび/またはK160S突然変異のうちの1つ以上、または別のアデノシンデアミナーゼ(例えばecTadA)における1つ以上の対応する突然変異を含む。
いくつかの実施形態において、アデノシンデアミナーゼは、L84X突然変異アデノシンデアミナーゼを含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるL84F突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。
いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるH123X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるH123Y突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。
いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるI156X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるI156F突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。
いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列において、L84X、A106X、D108X、H123X、D147X、E155X、およびI156Xからなる群より選択される1つ、2つ、3つ、4つ、5つ、6つ、または7つの突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異(複数可)を含み、ここでXは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸の存在を示す。いくつかの実施形態において、アデノシンデアミナーゼは、tadA参照配列においてS2X、I49X、A106X、D108X、D147X、およびE155Xからなる群より選択される1つ、2つ、3つ、4つ、5つ、または6つの突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異(複数可)を含み、ここでXは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸の存在を示す。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列においてH8X、A106X、D108X、N127X、およびK160Xからなる群より選択される1、2、3、4、または5個の突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異(複数可)を含み、ここでXは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸の存在を示す。
いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列において、L84F、A106V、D108N、H123Y、D147Y、E155V、およびI156Fからなる群より選択される1つ、2つ、3つ、4つ、5つ、6つ、または7つの突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列において、S2A、I49F、A106V、D108N、D147Y、およびE155Vからなる群より選択される1つ、2つ、3つ、4つ、5つ、または6つの突然変異を含む。
いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列においてH8Y、A106T、D108N、N127S、およびK160Sからなる群より選択される1つ、2つ、3つ、4つ、または5つの突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異もしくは突然変異を含む。
いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列においてE25X、R26X、R107X、A142X、および/またはA143X突然変異のうちの1以上、または別のアデノシンデアミナーゼ(例えばecTadA)における1以上の対応する突然変異を含み、Xの存在は、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。いくつかの実施形態において、アデノシンデアミナーゼは、TadA基準配列においてE25M, E25D, E25A, E25R, E25V, E25S, E25Y, R26G, R26N, R26Q, R26C, R26L, R26K, R107P, R107K, R107A, R107N, R107W, R107H, R107S, A142N, A142D, A142G, A143D, A143G, A143E, A143L, A143W, A143M, A143S, A143Q および/または A143R突然変異のうちの1以上、または他のアデノシンデアミナーゼ(例えばecTadA)における1以上の対応する突然変異を含む。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列に対応する本明細書に記載の突然変異のうちの1つ以上、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異のうちの1つ以上を含む。
いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるE25X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるE25M、E25D、E25A、E25R、E25V、E25S、またはE25Y突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。
いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるR26X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるR26G、R26N、R26Q、R26C、R26L、またはR26K突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。
いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるR107X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるR107P、R107K、R107A、R107N、R107W、R107H、またはR107S突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。
いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるA142X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるA142N、A142D、A142G突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。
いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるA143X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるA143D、A143G、A143E、A143L、A143W、A143M、A143S、A143Qおよび/またはA143Rの突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。
いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるH36X、N37X、P48X、I49X、R51X、M70X、N72X、D77X、E134X、S146X、Q154X、K157X、および/またはK161X突然変異の1つ以上、または別のアデノシンデアミナーゼ(例えばecTadA)における1つ以上の対応する突然変異を含み、ここでXの存在は、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるH36L、N37T、N37S、P48T、P48L、I49V、R51H、R51L、M70L、N72S、D77G、E134G、S146R、S146C、Q154H、K157N、および/またはK161T突然変異の1以上、または別のアデノシンデアミナーゼ(例えばecTadA)における1以上の対応する突然変異を含む。
いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるH36X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含み、ここでXは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるH36L突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。
いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるN37X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含み、Xは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるN37TまたはN37S突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。
いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるP48X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含み、ここでXは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるP48TまたはP48L突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。
いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるR51X突然変異、または別のアデノシンデアミナーゼにおける対応する突然変異を含み、Xは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるR51HまたはR51L突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。
いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるS146X突然変異、または別のアデノシンデアミナーゼにおける対応する突然変異を含み、Xは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるS146RまたはS146C突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。
いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるK157X突然変異、または別のアデノシンデアミナーゼにおける対応する突然変異を含み、Xは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるK157N突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。
いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるP48X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含み、ここでXは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるP48S、P48T、またはP48A突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。
いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるA142X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含み、Xは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるA142N突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。
いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるW23X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含み、ここでXは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるW23RまたはW23L突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。
いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるR152X突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含み、ここでXは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるR152PまたはR52H突然変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する突然変異を含む。
一実施形態では、アデノシンデアミナーゼは、突然変異H36L、R51L、L84F、A106V、D108N、H123Y、S146C、D147Y、E155V、I156F、およびK157Nを含むことができる。いくつかの実施形態では、アデノシンデアミナーゼは、tadA基準配列に関連する突然変異の以下の組合せを含み、ここで、組合せの各突然変異は「_」によって分離され、突然変異の各組合せは括弧内にある:
(A106V_D108N)、
(R107C_D108N)、
(H8Y_D108N_N127S_D147Y_Q154H)、
(H8Y_D108N_N127S_D147Y_E155V)、
(D108N_D147Y_E155V)、
(H8Y_D108N_N127S)、
(H8Y_D108N_N127S_D147Y_Q154H)、
(A106V_D108N_D147Y_E155V)、
(D108Q_D147Y_E155V)、
(D108M_D147Y_E155V)、
(D108L_D147Y_E155V)、
(D108K_D147Y_E155V)、
(D108I_D147Y_E155V)、
(D108F_D147Y_E155V)、
(A106V_D108N_D147Y)、
(A106V_D108M_D147Y_E155V)、
(E59A_A106V_D108N_D147Y_E155V)、
(E59A cat dead_A106V_D108N_D147Y_E155V)、
(L84F_A106V_D108N_H123Y_D147Y_E155V_I156Y)、
(L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(D103A_D104N)、
(G22P_D103A_D104N)、
(D103A_D104N_S138A)、
(R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F)、
(E25G_R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V
_I156F)、(E25D_R26G_L84F_A106V_R107K_D108N_H123Y_A142N_A143G_D147Y_E155V_
I156F)、
(R26Q_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F)、
(E25M_R26G_L84F_A106V_R107P_D108N_H123Y_A142N_A143D_D147Y_E155V
_I156F)、
(R26C_L84F_A106V_R107H_D108N_H123Y_A142N_D147Y_E155V_I156F)、(L84F_A106V_D108N_H123Y_A142N_A143L_D147Y_E155V_I156F)、
(R26G_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F)、
(E25A_R26G_L84F_A106V_R107N_D108N_H123Y_A142N_A143E_D147Y_E155V
_I156F)、
(R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F)、
(A106V_D108N_A142N_D147Y_E155V)、
(R26G_A106V_D108N_A142N_D147Y_E155V)、
(E25D_R26G_A106V_R107K_D108N_A142N_A143G_D147Y_E155V)、
(R26G_A106V_D108N_R107H_A142N_A143D_D147Y_E155V)、
(E25D_R26G_A106V_D108N_A142N_D147Y_E155V)、
(A106V_R107K_D108N_A142N_D147Y_E155V)、
(A106V_D108N_A142N_A143G_D147Y_E155V)、
(A106V_D108N_A142N_A143L_D147Y_E155V)、
(H36L_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N)、
(N37T_P48T_M70L_L84F_A106V_D108N_H123Y_D147Y_I49V_E155V_I156F)、
(N37S_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_K161T)、
(H36L_L84F_A106V_D108N_H123Y_D147Y_Q154H_E155V_I156F)、
(N72S_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F)、
(H36L_P48L_L84F_A106V_D108N_H123Y_E134G_D147Y_E155V_I156F)、
(H36L_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_K157N)、(H36L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F)、
(L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F_K161T)、
(N37S_R51H_D77G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(R51L_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_K157N)、
(D24G_Q71R_L84F_H96L_A106V_D108N_H123Y_D147Y_E155V_I156F_K160E)、
(H36L_G67V_L84F_A106V_D108N_H123Y_S146T_D147Y_E155V_I156F)、
(Q71L_L84F_A106V_D108N_H123Y_L137M_A143E_D147Y_E155V_I156F)、
(E25G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_Q159L)、
(L84F_A91T_F104I_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(N72D_L84F_A106V_D108N_H123Y_G125A_D147Y_E155V_I156F)、
(P48S_L84F_S97C_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(W23G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(D24G_P48L_Q71R_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_Q159L)、
(L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F)、
(H36L_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_I156F
_K157N)、(N37S_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F_K161T)、
(L84F_A106V_D108N_D147Y_E155V_I156F)、
(R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N_K161T)、
(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K161T)、
(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N_K160E_K161T)、
(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N_K160E)、
(R74Q_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(R74A_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(R74Q_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(L84F_R98Q_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(L84F_A106V_D108N_H123Y_R129Q_D147Y_E155V_I156F)、
(P48S_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F)、
(P48S_A142N)、
(P48T_I49V_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F_L157N)、
(P48T_I49V_A142N)、
(H36L_P48S_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N)、
(H36L_P48S_R51L_L84F_A106V_D108N_H123Y_S146C_A142N_D147Y_E155V_I156F (H36L_P48T_I49V_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N)、
(H36L_P48T_I49V_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_I156F_K157N)、
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N)、
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_I156F_K157N)、
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_A142N_D147Y_E155V_I156F_K157N)、
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N)、
(W23R_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N)、
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F_K161T)、
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152H_E155V_I156F_K157N)、
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V_I156F_K157N)、
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V_I156F_K157N)、
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142A_S146C_D147Y_E155V
_I156F_K157N)、
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142A_S146C_D147Y_R152P_E155V_I156F_K157N)、
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F_K161T)、
(W23R_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V_I156F_K157N)、
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_R152P_E155V
_I156F_K157N)
特定の実施形態では、本明細書で提供される融合タンパク質は、融合タンパク質の塩基編集活性を改善する1つ以上の特徴を含む。例えば、本明細書に提供される融合タンパク質は、ヌクレアーゼ活性が低下したCas9ドメインを含み得る。いくつかの実施形態において、本明細書で提供される融合タンパク質は、ヌクレアーゼ活性を有さないCas9ドメイン (dCas9) 、またはCas9ニッカーゼ(nCas9) と呼ばれる、二本鎖DNA分子の1鎖を切断するCas9ドメインを有し得る。
いくつかの実施形態において、アデノシンデアミナーゼはTadA*7.10である。いくつかの実施形態において、TadA*7.10は少なくとも1つの改変を含む。特定の実施形態において、TadA*7.10は、以下の改変:Y147T、Y147R、Q154S、Y123H、V82S、T166R、およびQ154Rの1つまたは複数を含む。改変Y123Hは本明細書でH123Hと称されることもある(Y123H (wt) に復帰するTadA*7.10における改変H123Y)。他の実施形態において、TadA*7.10は、Y147T+Q154R;Y147T+Q154S;Y147R+Q154S;V82S+Q154S;V82S+Y147R;V82S+Q154R;V82S+Y123H;I76Y+V82S;V82S+Y123H+Y147T;V82S+Y123H+Y147R;V82S+Y123H+Q154R;Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y123H+Y147R+Q154R+I76Y;V82S+Y123H+Y147R+Q154R;およびI76Y+V82S+Y123H+Y147R+Q154Rの群から選択される改変の組合せを含む。特定の実施形態において、アデノシンデアミナーゼバリアントは、TadA*7.10、TadA参照配列と比べて残基149、150、151、152、153、154、155、156、および157において始まるC末端の欠失、または別のTadAにおける対応する突然変異を含む。
他の実施形態において、本開示の塩基エディターは、TadA*7.10、TadA参照配列と比べて以下の改変:Y147T、Y147R、Q154S、Y123H、V82S、T166R、および/もしくはQ154Rの1つもしくは複数、または別のTadAにおける対応する突然変異を含むアデノシンデアミナーゼバリアント(例えばTadA*8)を含むモノマーである。他の実施形態において、アデノシンデアミナーゼバリアント(TadA*8)は、TadA*7.10、TadA参照配列と比べてY147T+Q154R;Y147T+Q154S;Y147R+Q154S;V82S+Q154S;V82S+Y147R;V82S+Q154R;V82S+Y123H;I76Y+V82S;V82S+Y123H+Y147T;V82S+Y123H+Y147R;V82S+Y123H+Q154R;Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y123H+Y147R+Q154R+I76Y;V82S+Y123H+Y147R+Q154R;およびI76Y+V82S+Y123H+Y147R+Q154Rの群から選択される改変の組合せ、または別のTadAにおける対応する突然変異を含むモノマーである。他の実施形態において、塩基エディターは、野生型アデノシンデアミナーゼ、ならびに、TadA*7.10、TadA参照配列と比べて以下の改変Y147T、Y147R、Q154S、Y123H、V82S、T166R、および/もしくはQ154Rの1つもしくは複数、または別のTadAにおける対応する突然変異を含むアデノシンデアミナーゼバリアント(例えばTadA*8)を含むヘテロダイマーである。他の実施形態において、塩基エディターは、TadA*7.10ドメイン、ならびに、TadA*7.10、TadA参照配列と比べてY147T+Q154R;Y147T+Q154S;Y147R+Q154S;V82S+Q154S;V82S+Y147R;V82S+Q154R;V82S+Y123H;I76Y+V82S;V82S+Y123H+Y147T;V82S+Y123H+Y147R;V82S+Y123H+Q154R;Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y123H+Y147R+Q154R+I76Y;V82S+Y123H+Y147R+Q154R;およびI76Y+V82S+Y123H+Y147R+Q154Rの群から選択される改変の組合せ、または別のTadAにおける対応する突然変異を含むアデノシンデアミナーゼバリアントドメイン(例えばTadA*8)を含むヘテロダイマーである。
一実施形態において、アデノシンデアミナーゼは、アデノシンデアミナーゼ活性を有する以下の配列またはその断片を含むまたはから本質的になるTadA*8である:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD
いくつかの実施形態において、TadA*8は切り詰められている。いくつかの実施形態において、切詰型TadA*8は、全長TadA*8と比べて1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のN末端アミノ酸残基を欠いている。いくつかの実施形態において、切詰型TadA*8は、全長TadA*8と比べて1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のC末端アミノ酸残基を欠いている。いくつかの実施形態において、アデノシンデアミナーゼバリアントは全長TadA*8である。
いくつかの実施形態において、TadA*8は、TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23、またはTadA*8.24である。
一実施形態において、本開示の融合タンパク質は、Cas9ニッカーゼに連結した、本明細書に記載のアデノシンデアミナーゼバリアント(例えばTadA*8)に連結した野生型TadAを含む。特定の実施形態において、融合タンパク質は単一のTadA*8ドメイン(例えばモノマーとして提供される)を含む。他の実施形態において、塩基エディターは、ヘテロダイマーを形成することができるTadA*8およびTadA (wt) を含む。例示的な配列は以下の通りである:
TadA (wt) または「TadA参照配列」:
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKKAQSSTD
TadA*7.10:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
TadA*8:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD.
いくつかの実施形態において、アデノシンデアミナーゼは、本明細書に提供されるアデノシンデアミナーゼのいずれかに記載のアミノ酸配列のいずれかに対して少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。本明細書において提供されるアデノシンデアミナーゼは、一つ以上の突然変異(例えば、本明細書に提供される突然変異のいずれか)を含み得ることが理解されるべきである。本開示は、特定のパーセント同一性を有するデアミナーゼドメインが加えて本明細書に記載される突然変異のいずれかまたはその組合せを含むものを提供する。いくつかの実施形態において、アデノシンデアミナーゼは、参照配列または本明細書に提供されるアデノシンデアミナーゼのいずれかと比較して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、またはそれ以上の変異を有するアミノ酸配列を含む。いくつかの実施形態において、アデノシンデアミナーゼは、当該技術分野において既知であるかまたは本明細書に記載されたアミノ酸配列のいずれかと比較して、少なくとも5個、少なくとも10個、少なくとも15個、少なくとも20個、少なくとも25個、少なくとも30個、少なくとも35個、少なくとも40個、少なくとも45個、少なくとも50個、少なくとも60個、少なくとも70個、少なくとも80個、少なくとも90個、少なくとも100個、少なくとも110個、少なくとも120個、少なくとも130個、少なくとも140個、少なくとも150個、少なくとも160個、または少なくとも170個の同一の連続するアミノ酸残基を有するアミノ酸配列を含む。
特定の実施形態において、TadA*8は、太字で示される以下の位置のいずれかにおける1つまたは複数の突然変異を含む。他の実施形態において、TadA*8は、下線で示される位置のいずれかにおける1つまたは複数の突然変異を含む:
Figure 2022520081000057
例えば、TadA*8は、単独でまたはTadA*7.10、TadA参照配列と比べて以下のY147T、Y147R、Q154S、Y123H、および/もしくはQ154Rの任意の1つもしくは複数、もしくは別のTadAにおける対応する突然変異と組み合わせて、アミノ酸位置82および/または166における改変(例えばV82S、T166R)を含む。特定の実施形態において、改変の組合せは、TadA*7.10、TadA参照配列と比べてY147T+Q154R;Y147T+Q154S;Y147R+Q154S;V82S+Q154S;V82S+Y147R;V82S+Q154R;V82S+Y123H;I76Y+V82S;V82S+Y123H+Y147T;V82S+Y123H+Y147R;V82S+Y123H+Q154R;Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y123H+Y147R+Q154R+I76Y;V82S+Y123H+Y147R+Q154R;およびI76Y+V82S+Y123H+Y147R+Q154R、または別のTadAにおける対応する突然変異の群から選択される。
いくつかの実施形態において、アデノシンデアミナーゼは、アデノシンデアミナーゼ活性を有する以下の配列またはその断片を含むまたはから本質的になるTadA*8である:
MSEVEFSHEY WMRHALTLAK RARDEREVPV GAVLVLNNRV IGEGWNRAIG LHDPTAHAEI MALRQGGLVM QNYRLIDATL YVTFEPCVMC AGAMIHSRIG
RVVFGVRNAK TGAAGSLMDV LHYPGMNHRV EITEGILADE CAALLCTFFR
MPRQVFNAQK KAQSSTD
いくつかの実施形態において、TadA*8は切り詰められている。いくつかの実施形態において、切詰型TadA*8は、全長TadA*8と比べて1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のN末端アミノ酸残基を欠いている。いくつかの実施形態において、切詰型TadA*8は、全長TadA*8と比べて1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のC末端アミノ酸残基を欠いている。いくつかの実施形態において、アデノシンデアミナーゼバリアントは全長TadA*8である。
一実施形態において、本開示の融合タンパク質は、Cas9ニッカーゼに連結した、本明細書に記載のアデノシンデアミナーゼバリアント(例えばTadA*8)に連結した野生型TadAを含む。特定の実施形態において、融合タンパク質は単一のTadA*8ドメイン(例えばモノマーとして提供される)を含む。他の実施形態において、塩基エディターは、ヘテロダイマーを形成することができるTadA*8およびTadA (wt)を含む。
[シチジンデアミナーゼ]
本明細書で提供される融合タンパク質は、1つ以上のシチジンデアミナーゼを含む。いくつかの実施形態において、本明細書において提供されるシチジンデアミナーゼは、シトシンまたは5-メチルシトシンを脱アミノ化してウラシルまたはチミンにすることができる。いくつかの実施形態において、本明細書に提供されるシチジンデアミナーゼは、DNA中のシトシンを脱アミノ化することができる。シチジンデアミナーゼは、任意の適切な生物に由来することができる。いくつかの実施形態において、シチジンデアミナーゼは、天然に存在するシチジンデアミナーゼが本明細書に提供される突然変異のいずれかに対応する1つ以上の突然変異を含むところのものである。当業者は、例えば、配列アラインメントおよび相同的残基の決定によって、任意の相同的タンパク質中の対応する残基を同定することができる。従って、当業者は、本明細書に記載された突然変異のいずれかに対応する突然変異を、任意の天然に存在するシチジンデアミナーゼにおいて生じさせることができる。いくつかの実施形態において、シチジンデアミナーゼは、原核生物由来である。いくつかの実施形態において、シチジンデアミナーゼは、細菌由来である。いくつかの実施形態において、シチジンデアミナーゼは、哺乳動物(例えば、ヒト)由来である。
いくつかの実施形態において、シチジンデアミナーゼは、本明細書に記載されるシチジンデアミナーゼアミノ酸配列のいずれかに対して少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。本明細書において提供されるシチジンデアミナーゼは、一つ以上の突然変異(例えば、本明細書に提供される突然変異のいずれか)を含み得ることを理解されたい。本開示は、特定のパーセント同一性を有する任意のデアミナーゼドメインに、本明細書に記載される突然変異またはその組合せのいずれかが加えられたものを提供する。いくつかの実施形態において、シチジンデアミナーゼは、参照配列または本明細書に提供されるいずれかのシチジンデアミナーゼと比較して、1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 21, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50個またはそれ以上の変異を有するアミノ酸配列を含む。いくつかの実施形態において、シチジンデアミナーゼは、当技術分野において既知であるかまたは本明細書に記載されたアミノ酸配列のいずれかと比較して、少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも110、少なくとも120、少なくとも130、少なくとも140、少なくとも150、少なくとも160、または少なくとも170個の同一の連続するアミノ酸残基を有するアミノ酸配列を含む。
本開示の融合タンパク質は、2つ以上の核酸編集ドメインを含む。いくつかの実施形態において、核酸編集ドメインは、CからUへの塩基変化を触媒することができる。いくつかの実施形態において、核酸編集ドメインは、デアミナーゼドメインであり、特に、2つのデアミナーゼドメインである。いくつかの実施形態では、デアミナーゼはシチジンデアミナーゼとアデノシンデアミナーゼである。いくつかの実施形態において、デアミナーゼは、シチジンデアミナーゼまたはアデノシンデアミナーゼである。いくつかの実施形態において、デアミナーゼは、アポリポタンパク質B mRNA編集複合体 (APOBEC) ファミリーデアミナーゼである。いくつかの実施形態において、デアミナーゼは、APOBEClデアミナーゼである。いくつかの実施形態において、デアミナーゼは、APOBEC 2デアミナーゼである。いくつかの実施形態において、デアミナーゼは、APOBEC3デアミナーゼである。いくつかの実施形態において、デアミナーゼは、APOBEC3Aデアミナーゼである。いくつかの実施形態において、デアミナーゼは、APOBEC3Bデアミナーゼである。いくつかの実施形態において、デアミナーゼは、APOBEC3Cデアミナーゼである。いくつかの実施形態において、デアミナーゼは、APOBEC3Dデアミナーゼである。いくつかの実施形態において、デアミナーゼは、APOBEC3Eデアミナーゼである。いくつかの実施形態において、デアミナーゼは、APOBEC3Fデアミナーゼである。いくつかの実施形態において、デアミナーゼは、APOBEC3Gデアミナーゼである。いくつかの実施形態において、デアミナーゼは、APOBEC3Hデアミナーゼである。いくつかの実施形態において、デアミナーゼは、APOBEC4デアミナーゼである。いくつかの実施形態において、デアミナーゼは、活性化誘導デアミナーゼ (AID) である。いくつかの実施形態において、デアミナーゼは、脊椎動物デアミナーゼである。いくつかの実施形態において、デアミナーゼは、無脊椎動物デアミナーゼである。いくつかの実施形態において、デアミナーゼは、ヒト、チンパンジー、ゴリラ、サル、ウシ、イヌ、ラット、またはマウスデアミナーゼである。いくつかの実施形態において、デアミナーゼは、ヒトデアミナーゼである。いくつかの実施形態において、デアミナーゼは、ラットデアミナーゼ、例えば、rAPOBEClである。いくつかの実施形態において、デアミナーゼは、Petromyzon marinusシチジンデアミナーゼ1 (pmCDAl) である。いくつかの実施形態において、デアミナーゼは、ヒトAPOBEC3Gである。いくつかの実施形態において、デアミナーゼは、ヒトAPOBEC3Gの断片である。いくつかの実施形態において、デアミナーゼは、D316R D317R突然変異を含むヒトAPOBEC3Gバリアントである。いくつかの実施形態において、デアミナーゼは、ヒトAPOBEC3Gの断片であり、D316R D317R突然変異に対応する突然変異を含む。いくつかの実施形態において、核酸編集ドメインは、本明細書に記載される任意のデアミナーゼのデアミナーゼドメインに対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも92%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%) 、または少なくとも99.5%の同一性である。
特定の実施形態では、本明細書で提供される融合タンパク質は、融合タンパク質の塩基編集活性を改善する1つ以上の特徴を含む。例えば、本明細書に提供される融合タンパク質は、ヌクレアーゼ活性が低下したCas9ドメインを含み得る。いくつかの実施形態において、本明細書で提供される融合タンパク質は、ヌクレアーゼ活性を有さないCas9ドメイン (dCas9) 、またはCas9ニッカーゼ(nCas9) と呼ばれる、二本鎖DNA分子の1鎖を切断するCas9ドメインを有し得る。
[追加的ドメイン]
本明細書に記載される塩基エディターは、ポリヌクレオチドの核酸塩基の核酸塩基編集、修飾、または改変を促進させるのを助ける任意のドメインを含むことができる。いくつかの実施形態において、塩基エディターは、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン(例えばCas9)、核酸塩基編集ドメイン(例えばデアミナーゼドメイン)、および一つ以上のさらなるドメインを含む。いくつかの実施形態において、追加のドメインは、塩基エディターの酵素的または触媒的機能、塩基エディターの結合機能を促進することができ、または所望の塩基編集結果に干渉し得る細胞機構(例えば酵素)の阻害因子であり得る。いくつかの実施形態において、塩基エディターは、ヌクレアーゼ、ニッカーゼ、リコンビナーゼ、デアミナーゼ、メチルトランスフェラーゼ、メチラーゼ、アセチラーゼ、アセチルトランスフェラーゼ、転写アクチベーター、または転写リプレッサードメインを含むことができる。
いくつかの実施形態において、塩基エディターは、ウラシルグリコシラーゼ阻害因子 (UGI) ドメインを含むことができる。いくつかの実施形態において、U:Gヘテロ二本鎖DNAの存在に対する細胞DNA修復応答が、細胞における核酸塩基編集効率の低下の原因となりうる。このような実施形態では、ウラシルDNAグリコシラーゼ (UDG)が、細胞内のDNAからのUの除去を触媒し得、それが塩基除去修復 (BER) を開始し得、大部分がU:G対からC:G対への復帰をもたらす。このような実施形態では、一本鎖に結合する、編集された塩基をブロックする、UGIを阻害する、BERを阻害する、編集された塩基を保護する、および/または編集されていない鎖の修復を促進する、1以上のドメインを含む塩基エディターにおいてBERは阻害され得る。したがって、本開示は、UGIドメインを含む塩基編集融合タンパク質を企図する。
いくつかの実施形態において、塩基エディターは、二本鎖切断 (DSB) 結合タンパク質の全部または一部をドメインとして含む。例えば、DSB結合タンパク質は、バクテリオファージMuのGamタンパク質を含み得、これはDSBの末端に結合してそれらを分解から保護することができる。Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity”Science Advances 3:eaao4774 (2017)を参照されたい、その全内容が参照により本明細書に組み入れられる。
さらに、いくつかの実施形態では、Gamタンパク質を塩基エディターのN末端に融合させることができる。いくつかの実施形態では、Gamタンパク質を塩基エディターのC末端に融合させることができる。バクテリオファージMuのGamタンパク質は二本鎖切断(DSB) の末端に結合し、それらを分解から保護することができる。いくつかの実施形態において、Gamを使用してDSBの遊離末端を結合することにより、塩基編集のプロセス中のインデル形成を低減することができる。いくつかの実施形態において、174残基のGamタンパク質は、塩基エディターのN末端に融合される。Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity”Science Advances 3:eaao4774 (2017)を参照されたい。いくつかの実施形態では、1つまたは複数の突然変異が、野生型ドメインと比較して、塩基編集ドメインの長さを変化させることができる。例えば、少なくとも1つのドメインにおける少なくとも1つのアミノ酸の欠失は、塩基エディターの長さを短くすることができる。別の例では、1つまたは複数の突然変異は、野生型ドメインに対するドメインの長さを変化させない。例えば、いずれかのドメインにおける置換(複数可)は塩基エディターの長さを変えない。
いくつかの実施形態において、塩基エディターは、核酸ポリメラーゼ (NAP) の全てまたは一部をドメインとして含むことができる。例えば、塩基エディターは、真核生物NAPの全部または一部を含むことができる。いくつかの実施形態において、塩基エディターに組み込まれるNAPまたはその一部は、DNAポリメラーゼである。いくつかの実施形態において、塩基エディターに組み込まれるNAPまたはその一部は、損傷乗り越えポリメラーゼ活性を有する。いくつかの実施形態では、塩基エディターに組み込まれるNAPまたはその一部は損傷乗り越えDNAポリメラーゼである。いくつかの実施形態において、塩基エディターに組み込まれるNAPまたはその一部は、Rev7、Rev1複合体、ポリメラーゼイオタ、ポリメラーゼカッパ、またはポリメラーゼイタである。いくつかの実施形態において、塩基エディターに組み込まれるNAPまたはその一部は、真核生物ポリメラーゼアルファ、ベータ、ガンマ、デルタ、イプシロン、ガンマ、イータ、イオタ、カッパ、ラムダ、ミュー、またはニュー成分である。いくつかの実施形態において、塩基エディターに組み込まれるNAPまたはその一部は、核酸ポリメラーゼ(例えば損傷乗り越えDNAポリメラーゼ)に対して少なくとも75%、80%、85%、90%、95%、96%、97%、98%、99%、または99.5%の同一性であるアミノ酸配列を含む。
[その他の核酸塩基エディター]
本開示は、モジュラー式マルチエフェクター核酸塩基エディターを提供し、ここでは、実質的にあらゆる当技術分野で知られる核酸塩基エディターが、本明細書中に記載された融合タンパク質に挿入され得、または、シチジンデアミナーゼまたはアデノシンデアミナーゼの代わりに交換され得る。一実施形態において、本開示は、脱塩基型核酸塩基エディタードメインを含むマルチエフェクター核酸塩基エディターを特徴とする。脱塩基型核酸塩基エディターは当技術分野で公知であり、例えば、Kavli et al., EMBO J. 15:3442-3447, 1996によって記述されており、この文献は参照により本明細書に組み込まれる。
いくつかの実施形態において、マルチエフェクター核酸塩基エディターは、以下のドメインA~C、A~D、またはA~Eを含み、
NH2-[A-B-C]-COOH、
NH2-[A-B-C-D]-COOH、または
NH2-[A-B-C-D-E]-COOH
ここで、AおよびCまたはA、CおよびEは、それぞれ以下のうちの1つ以上を含み、アデノシンデアミナーゼドメインまたはその活性断片、シチジンデアミナーゼドメインまたはその活性断片、DNAグリコシラーゼドメインまたはその活性断片、ここでBまたはBおよびDは、それぞれ核酸配列特異的結合活性を有する1つ以上のドメインを含む。
いくつかの実施形態において、マルチエフェクター核酸塩基エディターは、NH2-[An-Bo-Cn]-COOH、
NH2-[An-Bo-Cn-Do]-COOH、または
NH2-[An-Bo-Cp-Do-Eq]-COOH
を含み、
ここで、AおよびCまたはA、CおよびEは、それぞれ以下のうちの1つ以上を含み、アデノシンデアミナーゼドメインまたはその活性断片、シチジンデアミナーゼドメインまたはその活性断片、DNAグリコシラーゼドメインまたはその活性断片、ここでnは1、2、3、4または5の整数であり、pは0、1、2、3、4または5の整数であり、BまたはBおよびDはそれぞれ、核酸配列特異的結合活性を有するドメインを含み、oは1、2、3、4、または5の整数である。
[塩基エディターシステム]
本明細書で提供される塩基エディターシステムの使用は、(a) 対象のポリヌクレオチド(例えば、二本鎖DNAまたはRNA、一本鎖DNAまたはRNA)の標的ヌクレオチド配列を、核酸塩基エディター(例えば、アデノシン塩基エディター)およびガイドポリ核酸(例えばgRNA)を含む塩基エディターシステムと接触させ、ここで、標的ヌクレオチド配列が標的核酸塩基対を含む、工程と;(b) 前記標的領域の鎖分離を誘導する工程と;(c)標的領域の一本鎖における前記標的核酸塩基対の第1の核酸塩基を第2の核酸塩基に変換する工程と;(d) 前記標的領域の鎖を2本以上は切断することなく、第1の核酸塩基に相補的な第3の核酸塩基が、第2の核酸塩基に相補的な第4の核酸塩基に置換される工程とを含む。いくつかの実施形態では、ステップ (b) は省略されることを理解されたい。いくつかの実施形態において、前記標的核酸塩基対は、1以上の遺伝子における複数の核酸塩基対である。いくつかの実施形態において、本明細書に提供される塩基エディターシステムは、1以上の遺伝子における複数の核酸塩基対の多重編集を可能にする。いくつかの実施形態において、複数の核酸塩基対は、同一遺伝子内に位置する。いくつかの実施形態において、複数の核酸塩基対は、1またはそれより多い遺伝子に位置し、ここで、少なくとも1つの遺伝子は、異なる遺伝子座に位置する。
いくつかの実施形態において、切断された一本鎖(ニック鎖)は、ガイド核酸にハイブリダイズされる。いくつかの実施形態において、切断された一本鎖は、第一の核酸塩基を含む鎖と反対である。いくつかの実施形態では、塩基エディターはCas9ドメインを含む。いくつかの実施形態において、第1の塩基はアデニンであり、第2の塩基はG、C、AまたはTではない。いくつかの実施形態において、第2の塩基はイノシンである。
本明細書に提供される塩基編集システムは、触媒的に欠陥のあるStreptococcus pyogenes Cas9と、アデノシンデアミナーゼと、塩基除去修復の阻害因子とを含む融合タンパク質を用いて、二本鎖DNA切断を生じることなく、ドナーDNA鋳型を必要とせず、かつ過剰な確率的挿入および欠失を誘導することなく、DNAにおけるプログラム可能な一塩基(C→TまたはA→G)変化を誘導する、ゲノム編集の新規なアプローチを提供する。
本明細書では、塩基エディター系を用いて核酸塩基を編集するためのシステム、組成物、および方法を提供する。いくつかの実施形態において、塩基エディターシステムは、(1)核酸塩基を編集するための、ポリヌクレオチドプログラミング可能なヌクレオチド結合ドメインおよび核酸塩基編集ドメイン(例えば、デアミナーゼドメイン)を含む塩基エディター(BE)と、(2)ポリヌクレオチドプログラミング可能ヌクレオチド結合ドメインに付随するガイドポリヌクレオチド(例えばガイドRNA)とを含む(図2A)。いくつかの実施形態において、塩基エディターシステムは、アデノシン塩基エディター (ABE)を含む。いくつかの実施形態において、ポリヌクレオチドプログラミング可能なヌクレオチド結合ドメインは、ポリヌクレオチドプログラミング可能なDNA結合ドメインである。いくつかの実施形態において、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、ポリヌクレオチドプログラミング可能なRNA結合ドメインである。いくつかの実施形態において、核酸塩基編集ドメインは、デアミナーゼドメインである。いくつかの実施形態において、デアミナーゼドメインは、アデニンデアミナーゼまたはアデノシンデアミナーゼであり得る。いくつかの実施形態において、アデノシン塩基エディターは、DNA中のアデニンを脱アミノ化することができる。いくつかの実施形態において、ABEは、進化されたTadAバリアントを含む。
核酸塩基編集タンパク質の詳細は、国際PCT出願番号PCT/2017/045381(国際公開第2018/027078号)およびPCT/US 2016/058344(国際公開第2017/070632号)に記載されており、それぞれその全体が参照により本明細書に組み込まれる。Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017);およびKomor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity”Science Advances 3:eaao4774 (2017)も参照のこと、その内容全体を参照により本明細書に組み込む。
いくつかの実施形態において、単一のガイドポリヌクレオチドを利用して、デアミナーゼを標的核酸配列にターゲティングすることができる。いくつかの実施形態において、一対のガイドポリヌクレオチドが、異なるデアミナーゼを標的核酸配列にターゲティングするために利用され得る。
塩基エディター系の核酸塩基成分およびポリヌクレオチドプログラミング可能なヌクレオチド結合成分は、互いに共有結合的または非共有結合的により結合され得る。例えば、いくつかの実施形態において、デアミナーゼドメインは、ポリヌクレオチドプログラミング可能なヌクレオチド結合ドメインによって標的ヌクレオチド配列にターゲティングされ得る。いくつかの実施形態において、ポリヌクレオチドプログラミング可能なヌクレオチド結合ドメインは、デアミナーゼドメインに融合または連結され得る。いくつかの実施形態において、ポリヌクレオチドプログラミング可能なヌクレオチド結合ドメインは、デアミナーゼドメインと非共有結合的に相互作用または結合することによって、デアミナーゼドメインを標的ヌクレオチド配列にターゲティングすることができる。例えば、いくつかの実施形態において、核酸塩基編集成分、例えばデアミナーゼ成分は、ポリヌクレオチドプログラミング可能なヌクレオチド結合ドメインの一部をなすさらなる異種部分またはドメインと相互作用し、会合し、または複合体を形成することができる、さらなる異種部分またはドメインを含むことができる。いくつかの実施形態において、追加の異種部分は、ポリペプチドと結合し、相互作用し、会合し、または複合体を形成することができる。いくつかの実施形態において、追加の異種部分は、ポリヌクレオチドと結合し、相互作用し、会合し、または複合体を形成することができる。いくつかの実施形態において、追加の異種部分は、ガイドポリヌクレオチドに結合することができる。いくつかの実施形態において、追加の異種部分は、ポリペプチドリンカーに結合することができる。いくつかの実施形態において、追加の異種部分は、ポリヌクレオチドリンカーに結合することができる。追加の異種部分は、タンパク質ドメインであってもよい。いくつかの実施形態において、追加の異種部分は、K相同 (KH) ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、無菌アルファモチーフ、テロメラーゼKu結合モチーフおよびKuタンパク質、テロメラーゼSm7結合モチーフおよびSm7タンパク質、またはRNA認識モチーフであり得る。
塩基編集システムは、ガイドポリヌクレオチド成分をさらに含むことができる。塩基編集システムの構成要素は、共有結合、非共有結合的相互作用、またはそれらの結合および相互作用の任意の組合せを介して互いに結合され得ることが理解されるべきである。いくつかの実施形態において、デアミナーゼドメインは、ガイドポリヌクレオチドによって標的ヌクレオチド配列にターゲティングされ得る。例えば、いくつかの実施形態において、塩基エディター系の核酸塩基編集成分、例えばデアミナーゼ成分は、ガイドポリヌクレオチドの一部またはセグメント(例えばポリヌクレオチドモチーフ)と相互作用し、結合し、または複合体を形成し得るさらなる異種部分またはドメイン(例えばRNAまたはDNA結合タンパク質のようなポリヌクレオチド結合ドメイン)を含み得る。いくつかの実施形態において、追加の異種部分またはドメイン(例えばRNAまたはDNA結合タンパク質などのポリヌクレオチド結合ドメイン)は、デアミナーゼドメインに融合または連結され得る。いくつかの実施形態において、追加の異種部分は、ポリペプチドと結合し、相互作用し、会合し、またはポリペプチドと複合体を形成することができる。いくつかの実施形態において、追加の異種部分は、ポリヌクレオチドと結合し、相互作用し、会合し、またはポリヌクレオチドと複合体を形成することができる。いくつかの実施形態において、追加の異種部分は、ガイドポリヌクレオチドに結合することができる。いくつかの実施形態において、追加の異種部分は、ポリペプチドリンカーに結合することができる。いくつかの実施形態において、追加の異種部分は、ポリヌクレオチドリンカーに結合することができる。追加の異種部分は、タンパク質ドメインであってもよい。いくつかの実施形態において、追加の異種部分は、K相同 (KH) ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、無菌アルファモチーフ、テロメラーゼKu結合モチーフおよびKuタンパク質、テロメラーゼSm7結合モチーフおよびSm7タンパク質、またはRNA認識モチーフであり得る。
いくつかの実施形態において、塩基編集システムは、塩基除去修復 (BER) コンポーネントの阻害因子をさらに含むことができる。塩基編集システムの構成要素は、共有結合、非共有結合的相互作用、またはそれらの結合および相互作用の任意の組み合わせを介して互いに結合され得ることが理解されるべきである。BER成分の阻害因子は、塩基除去修復阻害因子を含み得る。いくつかの実施形態において、塩基除去修復の阻害因子は、ウラシルDNAグリコシラーゼ阻害因子 (UGI) であり得る。いくつかの実施形態において、塩基除去修復の阻害因子は、イノシン塩基除去修復阻害因子であり得る。いくつかの実施形態において、塩基除去修復の阻害因子は、ポリヌクレオチドプログラミング可能なヌクレオチド結合ドメインにより標的ヌクレオチド配列にターゲティングされ得る。いくつかの実施形態において、ポリヌクレオチドプログラミング可能なヌクレオチド結合ドメインは、塩基除去修復の阻害因子に融合または連結され得る。いくつかの実施形態において、ポリヌクレオチドプログラミング可能なヌクレオチド結合ドメインは、デアミナーゼドメインおよび塩基除去修復の阻害因子に融合または連結され得る。いくつかの実施形態において、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、塩基除去修復の阻害因子と非共有結合的に相互作用するか、または塩基除去修復の阻害因子と会合することによって、塩基除去修復の阻害因子を標的ヌクレオチド配列へとターゲティングすることができる。例えば、いくつかの実施形態において、塩基除去修復成分の阻害因子は、ポリヌクレオチドプログラミング可能なヌクレオチド結合ドメインの一部であるさらなる異種部分またはドメインと相互作用、会合、または複合体形成し得るさらなる異種部分またはドメインを含み得る。いくつかの実施形態において、塩基除去修復の阻害因子は、ガイドポリヌクレオチドにより標的ヌクレオチド配列にターゲティングされ得る。例えば、いくつかの実施形態において、塩基除去修復の阻害因子は、ガイドポリヌクレオチドの一部またはセグメント(例えば、ポリヌクレオチドモチーフ)と相互作用、会合、または複合体形成し得るさらなる異種部分またはドメイン(例えば、RNAまたはDNA結合タンパク質のようなポリヌクレオチド結合ドメイン)を含み得る。いくつかの実施形態において、ガイドポリヌクレオチドのさらなる異種部分またはドメイン(例えば、RNAまたはDNA結合タンパク質のようなポリヌクレオチド結合ドメイン)は、塩基除去修復の阻害因子に融合または連結され得る。いくつかの実施形態において、追加の異種部分は、ポリヌクレオチドと結合、相互作用、会合、または複合体形成することができる。いくつかの実施形態において、追加の異種部分は、ガイドポリヌクレオチドに結合することができる。いくつかの実施形態において、追加の異種部分は、ポリペプチドリンカーに結合することができる。いくつかの実施形態において、追加の異種部分は、ポリヌクレオチドリンカーに結合することができる。追加の異種部分は、タンパク質ドメインであってもよい。いくつかの実施形態において、追加の異種部分は、K相同 (KH) ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、無菌アルファモチーフ、テロメラーゼKu結合モチーフおよびKuタンパク質、テロメラーゼSm7結合モチーフおよびSm7タンパク質、またはRNA認識モチーフであり得る。
いくつかの実施形態において、塩基エディターは、編集された鎖の塩基除去修復(BER)を阻害する。いくつかの実施形態において、塩基エディターは、編集されていない鎖を保護または結合する。いくつかの実施形態では、塩基エディターはUGI活性を含む。いくつかの実施形態において、塩基エディターは、触媒的に不活性なイノシン特異的ヌクレアーゼを含む。いくつかの実施形態では、塩基エディターはニッカーゼ活性を含む。いくつかの実施形態において、塩基対の意図された編集は、PAM部位の上流にある。いくつかの実施形態において、塩基対の意図された編集は、PAM部位の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド上流にある。いくつかの実施形態において、塩基対の意図された編集は、PAM部位の下流にある。いくつかの実施形態において、意図される編集された塩基対は、PAM部位の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド下流にある。
いくつかの実施形態では、本方法は、標準(例えばNGG) PAMサイトを必要としない。いくつかの実施形態において、核酸塩基エディターは、リンカーまたはスペーサーを含む。いくつかの実施形態において、リンカーまたはスペーサーは、長さが1~25アミノ酸である。いくつかの実施形態において、リンカーまたはスペーサーは、長さが5~20アミノ酸である。いくつかの実施形態において、リンカーまたはスペーサーは、長さが10、11、12、13、14、15、16、17、18、19、または20アミノ酸である。
いくつかの実施形態において、本明細書中で提供される塩基編集融合タンパク質は、正確な位置、例えば、標的塩基が規定された領域(例えば「脱アミノ化ウィンドウ」)内に配置されるような位置に配置される必要がある。いくつかの実施形態において、標的は4塩基領域内にあり得る。いくつかの実施形態において、そのような規定された標的領域は、PAMの約15塩基上流にあり得る。Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017); およびKomor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity”Science Advances 3:eaao4774 (2017) 参照;その全内容が参照により本明細書に組み入れられる。
いくつかの実施形態では、標的領域は標的ウィンドウを含み、標的ウィンドウは標的核酸塩基対を含む。いくつかの実施形態において、標的ウィンドウは、1~10ヌクレオチドを含む。いくつかの実施形態において、標的ウィンドウは、長さが1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチドである。いくつかの実施形態において、塩基対の意図された編集は、標的ウィンドウ内にある。いくつかの実施形態において、標的ウィンドウは、塩基対の意図された編集を含む。いくつかの実施形態において、本方法は、本明細書に提供される塩基エディターのいずれかを用いて実施される。いくつかの実施形態において、標的ウィンドウは、脱アミノ化ウィンドウである。脱アミノ化ウィンドウは、塩基エディターが標的ヌクレオチドに作用して脱アミノ化する、規定された領域であり得る。いくつかの実施形態において、脱アミノ化ウィンドウは、2、3、4、5、6、7、8、9または10塩基領域内にある。いくつかの実施形態において、脱アミノ化ウィンドウは、PAMの5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24または25塩基上流にある。
本開示の塩基エディターは、標的ポリヌクレオチド配列の編集を促進させる任意のドメイン、特徴またはアミノ酸配列を含むことができる。例えば、いくつかの実施形態において、塩基エディターは、核局在化配列 (NLS) を含む。いくつかの実施形態において、塩基エディターのNLSは、デアミナーゼドメインとポリヌクレオチドプログラム可能なヌクレオチド結合ドメインとの間に位置する。いくつかの実施形態において、塩基エディターのNLSは、ポリヌクレオチドプログラム可能ヌクレオチド結合ドメインに対してC末端に位置する。
本明細書に開示される塩基エディターに存在し得る他の例示的特徴は、細胞質局在化配列、核輸出配列などの輸出配列、または他の局在化配列などの局在化配列、ならびに融合タンパク質の可溶化、精製、または検出に有用な配列タグである。本明細書において提供される適切なタンパク質タグには、限定されるものではないが、ビオチンカルボキシラーゼキャリアータンパク質(BCCP) タグ、myc-タグ、カルモジュリンタグ、FLAG-タグ、ヘマグルチニン (HA) -タグ、ヒスチジンタグまたはHis-タグとも呼ばれるポリヒスチジンタグ、マルトース結合タンパク質 (MBP) -タグ、nus-タグ、グルタチオン-S-トランスフェラーゼ (GST) -タグ、緑色蛍光タンパク質 (GFP) -タグ、チオレドキシンタグ、S-タグ、ソフタグ(例ソフタグ1、ソフタグ3)、ストレプトタグ、ビオチンリガーゼタグ、FlAsHタグ、V5タグ、およびSBP-タグが含まれる。さらなる適切な配列は、当業者には明らかであろう。いくつかの実施形態において、融合タンパク質は、1つ以上のHisタグを含む。
融合タンパク質に含まれ得るタンパク質ドメインの非限定的な例としては、デアミナーゼドメイン(例えばアデノシンデアミナーゼ)、ウラシルグリコシラーゼ阻害因子 (UGI) ドメイン、エピトープタグおよびレポーター遺伝子配列が挙げられる。
エピトープタグの非限定的な例は、ヒスチジン (His) タグ、V5タグ、FLAGタグ、インフルエンザヘマグルチニン (HA) タグ、Mycタグ、VSV-Gタグ、およびチオレドキシン (Trx) タグを含む。レポーター遺伝子の例としては、グルタチオン-5-トランスフェラーゼ (GST) 、西洋ワサビペルオキシダーゼ (HRP) 、クロラムフェニコールアセチルトランスフェラーゼ (CAT) 、ベータ-ガラクトシダーゼ、ベータ-グルクロニダーゼ、ルシフェラーゼ、緑色蛍光タンパク質 (GFP) 、HcRed、DsRed、シアン蛍光タンパク質 (CFP) 、黄色蛍光タンパク質 (YFP) 、および青色蛍光タンパク質 (BFP) を含む自己蛍光タンパク質が挙げられるが、これらに限定されない。さらなるタンパク質配列には、DNA分子に結合するかまたは他の細胞分子に結合するアミノ酸配列が含まれ得、これらには、マルトース結合タンパク質 (MBP) 、Sタグ、Lex A DNA結合ドメイン (DBD) 融合体、GAL4 DNA結合ドメイン融合体、および単純ヘルペスウイルス (HSV) BP16タンパク質融合体が挙げられるが、これらに限定されない。
いくつかの実施形態において、アデノシン塩基エディター(ABE)は、DNA中のアデニンを脱アミノ化することができる。いくつかの実施形態において、ABEは、BE3のAPOBEC1成分を、天然または操作された大腸菌TadA、ヒトADAR2、マウスADA、またはヒトADAT2で置換することによって生成される。いくつかの実施形態において、ABEは、進化されたTadAバリアントを含む。いくつかの実施形態では、ABEはABE 1.2 (TadA*-XTEN-nCas9-NLS) である。いくつかの実施形態において、TadA*はA106VおよびD108N突然変異を含む。
いくつかの実施形態において、ABEは第二世代ABEである。いくつかの実施形態において、ABEはABE 2.1であり、これは、TadA* (TadA*2.1) において追加の突然変異D147YおよびE155Vを含むものである。いくつかの実施形態において、ABEはABE 2.2であり、これはABE 2.1が触媒的に不活性化されたバージョンのヒトアルキルアデニンDNAグリコシラーゼ(E125Q変異を伴うAAG)に融合されたものである。いくつかの実施形態において、ABEはABE 2.3であり、これはABE 2.1が触媒的に不活性化されたバージョンの大腸菌Endo V (D35A変異で不活化される)に融合されたものである。いくつかの実施形態において、ABEはABE 2.6であり、これはABE 2.1におけるリンカーの二倍の長さ(32アミノ酸、(SGGS)2-XTEN-(SGGS)2)のリンカーを有する。いくつかの実施形態において、ABEはABE 2.7であり、これはABE 2.1が追加の野生型TadAモノマーと連結されたものである。いくつかの実施形態では、ABEはABE 2.8であり、これはABE 2.1が追加のTadA*2.1モノマーでつながれたものである。いくつかの実施形態において、ABEはABE 2.9であり、これは進化されたTadA (TadA*2.1) とABE 2.1のN末端との直接融合体である。いくつかの実施形態において、ABEはABE 2.10であり、これは野生型TadAとABE 2.1のN末端との直接融合体である。いくつかの実施形態において、ABEはABE 2.11であり、これは、TadA*モノマーのN末端において不活性化E59A突然変異を有するABE 2.9である。いくつかの実施形態において、ABEはABE 2.12であり、これは、内部TadA*モノマーにおいて不活性化E59A突然変異を有するABE 2.9である。
いくつかの実施形態において、ABEは、第三世代ABEである。いくつかの実施形態において、ABEはABE 3.1であり、これは、三つのさらなるTadA突然変異(L84F、H123Y、およびI156F)を伴うABE 2.3である。
いくつかの実施形態において、ABEは第四世代ABEである。いくつかの実施形態において、ABEはABE4.3であり、これはさらなるTadA突然変異A142N (TadA*4.3) を伴うABE 3.1である。
いくつかの実施形態において、ABEは第五世代ABEである。いくつかの実施形態において、ABEはABE 5.1であり、これは生存クローンからの突然変異のコンセンサスセット(H36L、R51L、S146C、およびK157N) をABE 3.1に輸入することによって生成される。いくつかの実施形態において、ABEはABE 5.3であり、これは内部の進化されたTadA*に融合された野生型大腸菌TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態において、ABEは、以下の表6に示されるように、ABE 5.2、ABE 5.4、ABE 5.5、ABE 5.6、ABE 5.7、ABE 5.8、ABE 5.9、ABE 5.10、ABE 5.11、ABE 5.12、ABE 5.13、またはABE 5.14である。いくつかの実施形態では、ABEは第6世代ABEである。いくつかの実施形態では、ABEは、以下の表6に示されるように、ABE 6.1、ABE 6.2、ABE 6.3、ABE 6.4、ABE 6.5、またはABE 6.6である。いくつかの実施形態において、ABEは、第七世代ABEである。いくつかの実施形態において、ABEは、以下の表6に示されるように、ABE7.1、ABE7.2、ABE7.3、ABE7.4、ABE7.5、ABE7.6、ABE7.7、ABE7.8、ABE7.9、またはABE7.10である。
表6:ABEの遺伝子型
Figure 2022520081000058
Figure 2022520081000059
いくつかの実施形態では、塩基エディターは、第八世代ABE (ABE8)である。いくつかの実施形態では、ABE8は、TadA*8バリアントを含む。いくつかの実施形態では、ABE8は、TadA*8バリアント (「ABE8.x-m」)を含むモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.1-mであり、これはY147T突然変異を含むTadA*7.10(TadA*8.1)を含むモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.2-mであり、これはY147R突然変異を含むTadA*7.10(TadA*8.2)を含むモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.3-mであり、これはQ154S突然変異を含むTadA*7.10 (TadA*8.3)を含むモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.4-mであり、これはY123H突然変異を含むTadA*7.10(TadA*8.4)を含むモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.5-mであり、これはV82S突然変異を含むTadA*7.10(TadA*8.5)を含むモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.6-mであり、これはT166R突然変異を含むTadA*7.10(TadA*8.6)を含むモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.7-mであり、これはQ154R突然変異を含むTadA*7.10(TadA*8.7)を含むモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.8-mであり、これはY147R、Q154RおよびY123H突然変異を含むTadA*7.10(TadA*8.8)を含むモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.9-mであり、これはY147R、Q154RおよびI76Y突然変異を含むTadA*7.10(TadA*8.9)を含むモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.10-mであり、これはY147R、Q154RおよびT166R突然変異を含むTadA*7.10(TadA*8.10)を含むモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.11-mであり、これはY147TおよびQ154R突然変異を含むTadA*7.10(TadA*8.11)を含むモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.12-mであり、これはY147TおよびQ154S突然変異を含むTadA*7.10(TadA*8.12)を含むモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.13-mであり、これはY123H(H123Yから戻されたY123H)、Y147R、Q154RおよびI76Y突然変異を含むTadA*7.10(TadA*8.13)を含むモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.14-mであり、これはI76YおよびV82S突然変異を含むTadA*7.10(TadA*8.14)を含むモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.15-mであり、これはV82SおよびY147R突然変異を含むTadA*7.10(TadA*8.15)を含むモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.16-mであり、これはV82S、Y123H (H123Yから戻されたY123H)およびY147R突然変異を含むTadA*7.10(TadA*8.16)を含むモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.17-mであり、これはV82SおよびQ154R突然変異を含むTadA*7.10(TadA*8.17)を含むモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.18-mであり、これはV82S、Y123H(H123Yから戻されたY123H)およびQ154R突然変異を含むTadA*7.10 (TadA*8.18)を含むモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.19-mであり、これはV82S、Y123H (H123Yから戻されたY123H)、Y147RおよびQ154R突然変異を含むTadA*7.10(TadA*8.19)を含むモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.20-mであり、これはI76Y、V82S、Y123H(H123Yから戻されたY123H)、Y147RおよびQ154R突然変異を含むTadA*7.10(TadA*8.20)を含むモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.21-mであり、これはY147RおよびQ154S突然変異を含むTadA*7.10 (TadA*8.21)を含むモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.22-mであり、これはV82SおよびQ154S突然変異を含むTadA*7.10(TadA*8.22)を含むモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.23-mであり、これはV82SおよびY123H (H123Yから戻されたY123H)突然変異を含むTadA*7.10 (TadA*8.23)を含むモノマー構築物を有する。いくつかの実施形態では、ABE8はABE8.24-mであり、これはV82S、Y123H(H123Yから戻されたY123H)およびY147T突然変異を含むTadA*7.10 (TadA*8.24)を含むモノマー構築物を有する。
いくつかの実施形態では、ABE8は、TadA*8バリアントに融合された野生型大腸菌TadAを含むヘテロ二量体構築物を有する(「ABE8.x-d」)。いくつかの実施形態では、ABE8はABE8.1-dであり、これはY147T突然変異を含むTadA*7.10 (TadA*8.1)に融合された野生型大腸菌TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.2-dであり、これはY147R突然変異を含むTadA*7.10 (TadA*8.2)に融合された野生型大腸菌TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.3-dであり、これはQ154S突然変異を含むTadA*7.10 (TadA*8.3)に融合された野生型大腸菌TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.4-dであり、これはY123H突然変異を含むTadA*7.10 (TadA*8.4)に融合された野生型大腸菌TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.5-dであり、これはV82S突然変異を含むTadA*7.10 (TadA*8.5)に融合された野生型大腸菌TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.6-dであり、これはT166R突然変異を含むTadA*7.10 (TadA*8.6)に融合された野生型大腸菌TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.7-dであり、これはQ154R突然変異を含むTadA*7.10 (TadA*8.7)に融合された野生型大腸菌TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.8-dであり、これはY147R、Q154RおよびY123H突然変異を含むTadA*7.10 (TadA*8.8)に融合された野生型大腸菌TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.9-dであり、これはY147R、Q154RおよびI76Y突然変異を含むTadA*7.10 (TadA*8.9)に融合された野生型大腸菌TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.10-dであり、これはY147R、Q154RおよびT166R突然変異を含むTadA*7.10 (TadA*8.10)に融合された野生型大腸菌TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.11-dであり、これはY147TおよびQ154R突然変異を含むTadA*7.10 (TadA*8.11)に融合された野生型大腸菌TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.12-dであり、これはY147TおよびQ154S突然変異を含むTadA*7.10 (TadA*8.12)に融合された野生型大腸菌TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.13-dであり、これはY123H(H123Yから戻されたY123H)、Y147R、Q154RおよびI76Y突然変異を含むTadA*7.10 (TadA*8.13)に融合された野生型大腸菌TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.14-dであり、これはI76YおよびV82S突然変異を含むTadA*7.10 (TadA*8.14)に融合された野生型大腸菌TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.15-dであり、これはV82SおよびY147R突然変異を含むTadA*7.10 (TadA*8.15)に融合された野生型大腸菌TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.16-dであり、これはV82S、Y123H(H123Yから戻されたY123H)およびY147R突然変異を含むTadA*7.10 (TadA*8.16)に融合された野生型大腸菌TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.17-dであり、これはV82SおよびQ154R突然変異を含むTadA*7.10 (TadA*8.17)に融合された野生型大腸菌TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.18-dであり、これはV82S、Y123H (H123Yから戻されたY123H)およびQ154R突然変異を含むTadA*7.10 (TadA*8.18)に融合された野生型大腸菌TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.19-dであり、これはV82S、Y123H (H123Yから戻されたY123H)、Y147RおよびQ154R突然変異を含むTadA*7.10 (TadA*8.19)に融合された野生型大腸菌TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.20-dであり、これはI76Y、V82S、Y123H (H123Yから戻されたY123H)、Y147RおよびQ154R突然変異を含むTadA*7.10 (TadA*8.20)に融合された野生型大腸菌TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.21-dであり、これはY147RおよびQ154S突然変異を含むTadA*7.10 (TadA*8.21)に融合された野生型大腸菌TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.22-dであり、これはV82SおよびQ154S突然変異を含むTadA*7.10 (TadA*8.22)に融合された野生型大腸菌TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.23-dであり、これはV82SおよびY123H (H123Yから戻されたY123H)突然変異を含むTadA*7.10 (TadA*8.23)に融合された野生型大腸菌TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.24-dであり、これはV82S、Y123H (H123Yから戻されたY123H)およびY147T突然変異を含むTadA*7.10 (TadA*8.24)に融合された野生型大腸菌TadAを含むヘテロ二量体構築物を有する。
いくつかの実施形態では、ABE8は、TadA*8バリアントに融合されたTadA*7.10を含むヘテロ二量体構築物を有する(「ABE8.x-7」)。いくつかの実施形態では、ABE8はABE8.1-7であり、これはY147T突然変異を含むTadA*7.10 (TadA*8.1)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.2-7であり、これはY147R突然変異を含むTadA*7.10 (TadA*8.2)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.3-7であり、これはQ154S突然変異を含むTadA*7.10 (TadA*8.3)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.4-7であり、これはY123H突然変異を含むTadA*7.10 (TadA*8.4)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.5-7であり、これはV82S突然変異を含むTadA*7.10 (TadA*8.5)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.6-7であり、これはT166R突然変異を含むTadA*7.10 (TadA*8.6)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.7-7であり、これはQ154R突然変異を含むTadA*7.10 (TadA*8.7)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.8-7であり、これはY147R、Q154RおよびY123H突然変異を含むTadA*7.10 (TadA*8.8)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.9-7であり、これはY147R、Q154RおよびI76Y突然変異を含むTadA*7.10 (TadA*8.9)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.10-7であり、これはY147R、Q154RおよびT166R突然変異を含むTadA*7.10 (TadA*8.10)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.11-7であり、これはY147TおよびQ154R突然変異を含むTadA*7.10 (TadA*8.11)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.12-7であり、これはY147TおよびQ154S 突然変異を含むTadA*7.10 (TadA*8.12)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.13-7であり、これはY123H (H123Yから戻されたY123H)、Y147R、Q154RおよびI76Y突然変異を含むTadA*7.10 (TadA*8.13)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.14-7であり、これはI76YおよびV82S突然変異を含むTadA*7.10 (TadA*8.14)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.15-7であり、これはV82SおよびY147R突然変異を含むTadA*7.10 (TadA*8.15)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.16-7であり、これはV82S、Y123H (H123Yから戻されたY123H)およびY147R突然変異を含むTadA*7.10 (TadA*8.16)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.17-7であり、これはV82SおよびQ154R突然変異を含むTadA*7.10 (TadA*8.17)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.18-7であり、これはV82S、Y123H (H123Yから戻されたY123H)およびQ154R 突然変異を含むTadA*7.10 (TadA*8.18)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.19-7であり、これはV82S、Y123H (H123Yから戻されたY123H)、Y147RおよびQ154R突然変異を含むTadA*7.10 (TadA*8.19)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.20-7であり、これはI76Y、V82S、Y123H (H123Yから戻されたY123H)、Y147RおよびQ154R突然変異を含むTadA*7.10 (TadA*8.20)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.21-7であり、これはY147RおよびQ154S突然変異を含むTadA*7.10(TadA*8.21)に融合されたTadA*7.10を含むヘテロ二量体を有する。いくつかの実施形態では、ABE8はABE8.22-7であり、これはV82SおよびQ154S突然変異を含むTadA*7.10 (TadA*8.22)に融合されたTadA*7.10を含むヘテロ二量体を有する。いくつかの実施形態では、ABE8はABE8.23-7であり、これはV82SおよびY123H (H123Yから戻されたY123H) 突然変異を含むTadA*7.10 (TadA*8.23)に融合されたTadA*7.10を含むヘテロ二量体を有する。いくつかの実施形態では、ABE8はABE8.24-7であり、これはV82S、Y123H (H123Yから戻されたY123H)およびY147T突然変異を含むTadA*7.10 (TadA*8.24)に融合されたTadA*7.10を含むヘテロ二量体を有する。
いくつかの実施形態では、以下の表7に示されるように、ABEは、ABE8.1-m、ABE8.2-m、ABE8.3-m、ABE8.4-m、ABE8.5-m、ABE8.6-m、ABE8.7-m、ABE8.8-m、ABE8.9-m、ABE8.10-m、ABE8.11-m、ABE8.12-m、ABE8.13-m、ABE8.14-m、ABE8.15-m、ABE8.16-m、ABE8.17-m、ABE8.18-m、ABE8.19-m、ABE8.20-m、ABE8.21-m、ABE8.22-m、ABE8.23-m、ABE8.24-m、ABE8.1-d、ABE8.2-d、ABE8.3-d、ABE8.4-d、ABE8.5-d、ABE8.6-d、ABE8.7-d、ABE8.8-d、ABE8.9-d、ABE8.10-d、ABE8.11-d、ABE8.12-d、ABE8.13-d、ABE8.14-d、ABE8.15-d、ABE8.16-d、ABE8.17-d、ABE8.18-d、ABE8.19-d、ABE8.20-d、ABE8.21-d、ABE8.22-d、ABE8.23-dまたはABE8.24-dである。
表7:アデノシンデアミナーゼ塩基エディター8バリアント
Figure 2022520081000060
Figure 2022520081000061
いくつかの実施形態では、塩基エディター(例えば、ABE8)は、アデノシンデアミナーゼバリアント(例えば、TadA*8)を循環置換体Cas9(例えば、CP5またはCP6)および二部分核局在化配列を含む足場にクローニングすることによって生成される。いくつかの実施形態では、塩基エディター(例えば、ABE7.9、ABE7.10またはABE8)は、NGC PAM CP5バリアント(S. pyrogenes Cas9またはspVRQR Cas9)である。いくつかの実施形態では、塩基エディター(例えば、ABE7.9、ABE7.10またはABE8)はAGA PAM CP5バリアント(S. pyrogenes Cas9またはspVRQR Cas9)である。いくつかの実施形態では、塩基エディター(例えば、ABE7.9、ABE7.10またはABE8)はNGC PAM CP6バリアント(S. pyrogenes Cas9またはspVRQR Cas9)である。いくつかの実施形態では、塩基エディター(例えば、ABE7.9、ABE7.10またはABE8)はAGA PAM CP6バリアント(S. pyrogenes Cas9またはspVRQR Cas9)である。
いくつかの実施形態では、ABEは、以下の表8に示される遺伝子型を有する。
表8:ABEの遺伝子型
Figure 2022520081000062
以下の表9に示されるように、40個のABE8の遺伝子型は記載されている。ABEの進化された大腸菌TadA部分中の残基位置は、示されている。ABE8中の突然変異変化は、ABE7.10突然変異と異なっている場合に示されている。いくつかの実施形態では、ABEは、以下の表9に示されている、ABEのうちの1つの遺伝子型を有する。
表9:進化されたTadAの残基アイデンティティ
Figure 2022520081000063
Figure 2022520081000064
いくつかの実施形態では、塩基エディターはABE8.1であり、これは、次の配列またはアデノシンデアミナーゼ活性を有するその断片を含むまたはから本質的になる:
ABE8.1_Y147T_CP5_NGC PAM_モノマー
Figure 2022520081000065
上の配列において、標準文字はアデノシンデアミナーゼ配列を示し、太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線を付した配列は二部分核局在化配列を示す。
いくつかの実施形態では、塩基エディターはABE8.1であり、これは次の配列またはアデノシンデアミナーゼ活性を有するその断片を含むまたはから本質的になる:
pNMG-B335 ABE8.1_Y147T_CP5_NGC PAM_モノマー
Figure 2022520081000066
上の配列において、標準文字はアデノシンデアミナーゼ配列を示し、太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線を付した配列は二部分核局在化配列を示す。
いくつかの実施形態では、塩基エディターはABE8.14であり、これは次の配列またはアデノシンデアミナーゼ活性を有するその断片を含むまたはから本質的になる:
NGC PAM CP5を含むpNMG-357_ABE8.14
Figure 2022520081000067
上の配列において、標準文字はアデノシンデアミナーゼ配列を示し、太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線を付した配列は二部分核局在化配列を示す。
いくつかの実施形態では、塩基エディターはABE8.8-mであり、これは次の配列またはアデノシンデアミナーゼ活性を有するその断片を含むまたはから本質的になる:
ABE8.8-m
Figure 2022520081000068
上の配列において、標準文字はアデノシンデアミナーゼ配列を示し、太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線を付した配列は二部分核局在化配列を示し、二重下線を付した配列は突然変異を示す。
いくつかの実施形態では、塩基エディターはABE8.8-dであり、これは次の配列またはアデノシンデアミナーゼ活性を有するその断片を含むまたはから本質的になる:
ABE8.8-d
Figure 2022520081000069
上の配列において、標準文字はアデノシンデアミナーゼ配列を示し、太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線を付した配列は二部分核局在化配列を示し、二重下線を付した配列は突然変異を示す。
いくつかの実施形態では、塩基エディターはABE8.13-mであり、これは次の配列またはアデノシンデアミナーゼ活性を有するその断片を含むまたはから本質的になる:
ABE8.13-m
Figure 2022520081000070
上の配列において、標準文字はアデノシンデアミナーゼ配列を示し、太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線を付した配列は二部分核局在化配列を示し、二重下線を付した配列は突然変異を示す。
いくつかの実施形態では、塩基エディターはABE8.13-dであり、これは次の配列またはアデノシンデアミナーゼ活性を有するその断片を含むまたはから本質的になる:
ABE8.13-d
Figure 2022520081000071
上の配列において、標準文字はアデノシンデアミナーゼ配列を示し、太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線を付した配列は二部分核局在化配列を示し、二重下線を付した配列は突然変異を示す。
いくつかの実施形態では、塩基エディターはABE8.17-mであり、これは次の配列またはアデノシンデアミナーゼ活性を有するその断片を含むまたはから本質的になる:
ABE8.17-m
Figure 2022520081000072
上の配列において、標準文字はアデノシンデアミナーゼ配列を示し、太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線を付した配列は二部分核局在化配列を示し、二重下線を付した配列は突然変異を示す。
いくつかの実施形態では、塩基エディターはABE8.17-dであり、これは次の配列またはアデノシンデアミナーゼ活性を有するその断片を含むまたはから本質的になる:
ABE8.17-d
Figure 2022520081000073
上の配列において、標準文字はアデノシンデアミナーゼ配列を示し、太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線を付した配列は二部分核局在化配列を示し、二重下線を付した配列は突然変異を示す。
いくつかの実施形態では、塩基エディターはABE8.20-mであり、これは次の配列またはアデノシンデアミナーゼ活性を有するその断片を含むまたはから本質的になる:
ABE8.20-m
Figure 2022520081000074
上の配列において、標準文字はアデノシンデアミナーゼ配列を示し、太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線を付した配列は二部分核局在化配列を示し、二重下線を付した配列は突然変異を示す。
いくつかの実施形態では、塩基エディターはABE8.20-dであり、これは、次の配列またはアデノシンデアミナーゼ活性を有するその断片を含むまたはから本質的になる:
ABE8.20-d
Figure 2022520081000075
上の配列において、標準文字はアデノシンデアミナーゼ配列を示し、太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線を付した配列は二部分核局在化配列を示し、二重下線を付した配列は突然変異を示す。
いくつかの実施形態では、本開示のABE8は、次の配列から選択される:
01. monoABE8.1_bpNLS + Y147T
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
02. monoABE8.1_bpNLS + Y147R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCRFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
03. monoABE8.1_bpNLS + Q154S
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRSVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
04. monoABE8.1_bpNLS + Y123H
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
05. monoABE8.1_bpNLS + V82S
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYSTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
06. monoABE8.1_bpNLS + T166R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSRDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
07. monoABE8.1_bpNLS + Q154R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
08. monoABE8.1_bpNLS + Y147R_Q154R_Y123H
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
09. monoABE8.1_bpNLS + Y147R_Q154R_I76Y
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
10. monoABE8.1_bpNLS + Y147R_Q154R_T166R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSRDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
11. monoABE8.1_bpNLS + Y147T_Q154R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
12. monoABE8.1_bpNLS + Y147T_Q154S
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRSVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
13. monoABE8.1_bpNLS + H123Y123H_Y147R_Q154R_I76Y
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
14. monoABE8.1_bpNLS + V82S + Q154R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYSTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
いくつかの実施形態では、塩基エディターは、核酸塩基編集ドメイン(例えば、デミナーゼドメインの全部または一部)に融合されたポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン(例えば、Cas9に由来するドメイン)を含む融合タンパク質である。いくつかの実施形態において、本明細書において提供される融合タンパク質は、融合タンパク質の塩基編集活性を改善する一つ以上の特徴を含む。例えば、本明細書中に提供される融合タンパク質は、ヌクレアーゼ活性が低下したCas9ドメインを含むことができる。いくつかの実施形態において、本明細書中で提供される融合タンパク質は、ヌクレアーゼ活性を有さないCas9ドメイン (dCas9) 、または、Cas9ニッカーゼ(nCas9) と呼ばれる、二本鎖DNA分子の一鎖を切断するCas9ドメインを有することができる。
いくつかの実施形態において、塩基エディターは、ウラシルグリコシラーゼ阻害因子 (UGI) の全部または一部を含むドメインをさらに含む。いくつかの実施形態において、塩基エディターは、ウラシルDNAグリコシラーゼ(UDG)などの、ウラシル結合タンパク質(UBP)の全部または一部を含むドメインを含む。いくつかの実施形態において、塩基エディターは、核酸ポリメラーゼの全てまたは一部を含むドメインを含む。いくつかの実施形態において、塩基エディターに組み込まれる核酸ポリメラーゼまたはその一部は、損傷乗り越えDNAポリメラーゼである。
いくつかの実施形態では、塩基エディターのドメインは、複数のドメインを含むことができる。例えば、Cas9に由来するポリヌクレオチドプログラム可能なヌクレオチド結合ドメインを含む塩基エディターは、野生型または天然のCas9のRECローブおよびNUCローブに対応するRECローブおよびNUCローブを含むことができる。別の例では、塩基エディターは、RuvCIドメイン、BHドメイン、REC1ドメイン、REC2ドメイン、RuvCIIドメイン、L1ドメイン、HNHドメイン、L2ドメイン、RuvCIIIドメイン、WEDドメイン、TOPOドメインまたはCTDドメインのうちの1つ以上を含むことができる。いくつかの実施形態において、塩基エディターの一つ以上のドメインは、そのドメインを含むポリペプチドの野生型バージョンに対する突然変異(例えば置換、挿入、欠失)を含む。例えば、ポリヌクレオチドプログラム可能DNA結合ドメインのHNHドメインは、H840A置換を含むことができる。別の例では、ポリヌクレオチドプログラム可能なDNA結合ドメインのRuvCIドメインは、D10A置換を含むことができる。
本明細書に開示される塩基エディターの異なるドメイン(例えば隣接ドメイン)は、一つ以上のリンカードメイン(例えばXTENリンカードメイン)を使用して、または使用せずに、互いに接続され得る。いくつかの実施形態では、リンカードメインは、二つの分子もしくは部分、例えば、第一のドメイン(例えばCas9由来ドメイン)および第二のドメイン(例えばアデノシンデアミナーゼドメイン)のような融合タンパク質の二つのドメイン、をつなげる結合(例えば共有結合)、化学基、または分子であり得る。いくつかの実施形態において、リンカーは、共有結合(例えば炭素-炭素結合、ジスルフィド結合、炭素-ヘテロ原子結合など。)である。いくつかの実施形態において、リンカーは、アミド結合における炭素窒素結合である。特定の実施形態では、リンカーは、環状または非環状、置換または非置換、分枝または非分枝の脂肪族またはヘテロ脂肪族リンカーである。いくつかの実施形態において、リンカーは、ポリマー(例えばポリエチレン、ポリエチレングリコール、ポリアミド、ポリエステルなど)である。特定の実施形態では、リンカーは、アミノアルカン酸のモノマー、ダイマーまたはポリマーを含む。いくつかの実施形態において、リンカーは、アミノアルカン酸(例えばグリシン、エタン酸、アラニン、ベータ-アラニン、3-アミノプロパン酸、4-アミノブタン酸、5-ペンタン酸等)を含む。いくつかの実施形態において、リンカーは、アミノヘキサン酸 (Ahx) のモノマー、ダイマーまたはポリマーを含む。いくつかの実施形態において、リンカーは炭素環部分(例えばシクロペンタン、シクロヘキサン)に基づく。他の実施形態において、リンカーはポリエチレングリコール部分 (PEG) を含む。いくつかの実施形態において、リンカーは、アリールまたはヘテロアリール部分を含む。いくつかの実施形態において、リンカーは、フェニル環に基づく。リンカーは、ペプチドからリンカーへの求核剤(例えばチオール、アミノ)の結合を促進させる官能化部分を含むことができる。リンカーの一部として任意の求電子剤を使用することができる。例示的な求電子剤としては、活性化エステル、活性化アミド、マイケル受容体、ハロゲン化アルキル、ハロゲン化アリール、ハロゲン化アシル、およびイソチオシアナートが挙げられるが、これらに限定されない。いくつかの実施形態において、リンカーは、Cas9ヌクレアーゼドメインを含むRNAプログラム可能ヌクレアーゼのgRNA結合ドメインと、核酸編集タンパク質の触媒ドメインとを結合する。いくつかの実施形態において、リンカーは、dCas9と第二のドメイン(例えばUGI等)とを連結する。
典型的には、リンカーは、2つの基、分子、または他の部分の間に配置されるか、または2つの基、分子、または他の部分によって隣接され、共有結合を介してそれぞれに連結され、したがって2つを連結する。いくつかの実施形態において、リンカーは、アミノ酸または複数のアミノ酸(例えばペプチドまたはタンパク質)である。いくつかの実施形態において、リンカーは、有機分子、基、ポリマー、または化学的部分である。いくつかの実施形態において、リンカーは、長さが2~100アミノ酸であり、例えば、長さが2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30~35、35~40、40~45、45~50、50~60、60~70、70~80、80~90、90~100、100~150または150~200アミノ酸である。いくつかの実施形態において、リンカーは、長さが約3~約104 (例えば5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100)アミノ酸である。より長いまたはより短いリンカーも考えられる。いくつかの実施形態において、リンカードメインは、XTENリンカーとも呼ばれ得るアミノ酸配列SGSETPGTSESATPESを含む。融合タンパク質ドメインを連結するための任意の方法を用いて(例えば、(SGGS)n、(GGGS)n、(GGGGS)n、および(G)nの形態の非常に柔軟なリンカーから、(EAAAK)n、(GGS)n、SGSETPGTSESATPESの形態のより剛性の高いリンカーまで(例えばGuilinger JP, Thompson DB, Liu DR. Fusion of catalytically inactive Cas9 to FokI nuclease improves the specificity of genome modification. Nat. Biotechnol. 2014; 32(6): 577-82参照。その全内容は参照によりここに組み込まれる)、または (XP)nモチーフ)、核酸塩基エディターの活性のための最適な長さを達成することができる。いくつかの実施形態において、nは、1、2、3、4、5、6、7、8、9、10、11、12、13、14または15である。いくつかの実施形態において、リンカーは、(GGS)nモチーフを含み、ここで、nは、1、3、または7である。いくつかの実施形態において、本明細書で提供される融合タンパク質のCas9ドメインは、アミノ酸配列SGSETPGTSESATPESを含むリンカーを介して融合される。いくつかの実施形態において、リンカーは、複数のプロリン残基を含み長さが5~21、5~14、5~9、5~7アミノ酸であり、例えば、PAPAP、PAPAPA、PAPAPAP、PAPAPAPA、P(AP)4、P(AP)7、P(AP)10である(例えば、Tan J, Zhang F, Karcher D, Bock R. Engineering of high-precision base editors for site-specific single nucleotide replacement. Nat Commun. 2019 Jan 25;10(1):439を参照;その全内容は参照によりここに組み込まれる)。このようなプロリンに富むリンカーはまた、「硬質(rigid)」リンカーとも呼ばれる。
本開示の融合タンパク質は、核酸編集ドメインを含む。いくつかの実施形態では、デアミナーゼは、アデノシンデアミナーゼである。いくつかの実施形態において、デアミナーゼは、脊椎動物デアミナーゼである。いくつかの実施形態において、デアミナーゼは、無脊椎動物デアミナーゼである。いくつかの実施形態において、デアミナーゼは、ヒト、チンパンジー、ゴリラ、サル、ウシ、イヌ、ラット、またはマウスデアミナーゼである。いくつかの実施形態において、デアミナーゼは、ヒトデアミナーゼである。いくつかの実施形態において、デアミナーゼは、ラットデアミナーゼである。
[リンカー]
いくつかの実施形態において、本開示のペプチドまたはペプチドドメインのいずれかを連結するためにリンカーが使用され得る。リンカーは、共有結合のように単純であり得、またはそれは、多原子の長さであるポリマーリンカーであり得る。いくつかの実施形態において、リンカーは、ポリペプチドであるか、またはアミノ酸に基づくものである。他の実施形態において、リンカーはペプチド様ではない。いくつかの実施形態において、リンカーは、共有結合(例えば、炭素-炭素結合、ジスルフィド結合、炭素-ヘテロ原子結合、等)である。いくつかの実施形態において、リンカーは、アミド連結の炭素-窒素結合である。特定の実施形態では、リンカーは、環状または非環状、置換または非置換、分枝または非分枝の脂肪族またはヘテロ脂肪族リンカーである。いくつかの実施形態において、リンカーは、ポリマー(例えばポリエチレン、ポリエチレングリコール、ポリアミド、ポリエステル、その他)である。特定の実施形態では、リンカーは、アミノアルカン酸のモノマー、ダイマーまたはポリマーを含む。いくつかの実施形態において、リンカーは、アミノアルカン酸(例えば、グリシン、エタン酸、アラニン、ベータ-アラニン、3-アミノプロパン酸、4-アミノブタン酸、5-ペンタン酸、等)を含む。特定の実施形態では、リンカーは、アミノヘキサン酸 (Ahx) のモノマー、ダイマーまたはポリマーを含む。いくつかの実施形態において、リンカーは、炭素環部分(例えばシクロペンタン、シクロヘキサン)に基づく。他の実施形態において、リンカーは、ポリエチレングリコール部分 (PEG) を含む。他の実施形態において、リンカーはアミノ酸を含む。いくつかの実施形態において、リンカーはペプチドを含む。いくつかの実施形態において、リンカーは、アリールまたはヘテロアリール部分を含む。いくつかの実施形態において、リンカーは、フェニル環に基づく。リンカーは、ペプチドからの求核剤(例えばチオール、アミノ)がリンカーに結合することを促進するための官能化部分を含み得る。リンカーの一部として任意の求電子剤を使用することができる。例示的な求電子剤としては、活性化エステル、活性化アミド、マイケル受容体、ハロゲン化アルキル、ハロゲン化アリール、ハロゲン化アシル、およびイソチオシアナートが挙げられるが、これらに限定されない。
いくつかの実施形態において、リンカーは、一アミノ酸または複数のアミノ酸(例えばペプチドまたはタンパク質)である。いくつかの実施形態において、リンカーは、結合(例えば共有結合)、有機分子、基、ポリマー、または化学的部分である。いくつかの実施形態において、リンカーは、長さが約3~約104(例えば5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、55、60、65、70、75、80、85、90、95、または100)アミノ酸である。
いくつかの実施形態において、アデノシンデアミナーゼおよびnapDNAbpは、長さが4、16、32または104アミノ酸であるリンカーを介して融合される。いくつかの実施形態において、リンカーは、長さが約3~約104アミノ酸である。いくつかの実施形態において、本明細書で提供される融合タンパク質のいずれかは、リンカーを介して互いに融合されたアデノシンデアミナーゼ、およびCas9ドメインを含む。核酸塩基エディターの活性のための最適な長さを達成するために、デアミナーゼドメイン(例えば、設計されたecTadA)およびCas9ドメインの間で種々のリンカーの長さおよび柔軟性を利用することができる(例えば、(GGGS)n、(GGGGS)n、および(G)nの形態の非常に柔軟なリンカーから、(EAAAK)n、(SGGS)n、SGSETPGTSESATPESの形態のより剛性の高いリンカーまで(例えばGuilinger JP, Thompson DB, Liu DR. Fusion of catalytically inactive Cas9 to FokI nuclease improves the specificity of genome modification. Nat. Biotechnol. 2014; 32(6): 577-82参照。その全内容は参照によりここに組み込まれる)、および (XP)n)。いくつかの実施形態において、nは、1、2、3、4、5、6、7、8、9、10、11、12、13、14または15である。いくつかの実施形態において、リンカーは、(GGS)nモチーフを含み、ここで、nは、1、3、または7である。いくつかの実施形態において、本明細書で提供される融合タンパク質のいずれかのアデノシンデアミナーゼおよびCas9ドメインは、アミノ酸配列SGSETPGTSESATPESを含むリンカー(例えばXTENリンカー)を介して融合される。
[ガイドRNAを伴うCas9複合体]
本開示のいくつかの態様は、本明細書に提供される融合タンパク質のいずれかと、融合タンパク質のCas9ドメイン(例えば、dCas9、ヌクレアーゼ活性Cas9、またはCas9ニッカーゼ)に結合したガイドRNA(例えば、A\突然変異を標的にするガイド)とを含む複合体を提供する。融合タンパク質ドメインを連結するための任意の方法を用いて(例えば、(GGGS)n、(GGGGS)n、および(G)nの形態の非常に柔軟なリンカーから、(EAAAK)n、(SGGS)n、SGSETPGTSESATPESの形態のより剛性の高いリンカーまで(例えばGuilinger JP, Thompson DB, Liu DR. Fusion of catalytically inactive Cas9 to FokI nuclease improves the specificity of genome modification. Nat. Biotechnol. 2014; 32(6): 577-82参照。その全内容は参照によりここに組み込まれる)、または (XP)nモチーフ)核酸塩基エディターの活性のための最適な長さを達成することができる。いくつかの実施形態において、nは、1、2、3、4、5、6、7、8、9、10、11、12、13、14または15である。いくつかの実施形態において、リンカーは、(GGS)nモチーフを含み、ここで、nは、1、3、または7である。いくつかの実施形態において、本明細書で提供される融合タンパク質のCas9ドメインは、アミノ酸配列SGSETPGTSESATPESを含むリンカーを介して融合される。
いくつかの実施形態において、ガイド核酸(例えばガイドRNA)は、15~100ヌクレオチド長であり、標的配列に相補的である少なくとも10個の連続するヌクレオチドの配列を含む。いくつかの実施形態において、ガイドRNAは、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、または50ヌクレオチドの長さである。いくつかの実施形態において、ガイドRNAは、標的配列に相補的な15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、または40個の連続したヌクレオチドの配列を含む。いくつかの実施形態において、標的配列はDNA配列である。いくつかの実施形態において、標的配列は、細菌、酵母、真菌、昆虫、植物または動物のゲノムにおける配列である。いくつかの実施形態において、標的配列は、ヒトのゲノムにおける配列である。いくつかの実施形態において、標的配列の3’末端は、標準PAM配列(NGG) にすぐ隣接している。いくつかの実施形態において、標的配列の3’末端は、非標準PAM配列(例えば、表2に記載されている配列または5’-NAA-3’)にすぐ隣接している。いくつかの実施形態において、ガイド核酸(例えばガイドRNA)は、目的遺伝子(例えば疾患または障害に関連する遺伝子)における配列に相補的である。
本開示のいくつかの態様は、本明細書に提供される融合タンパク質または複合体を使用する方法を提供する。例えば、本開示のいくつかの態様は、DNA分子を、本明細書中に提供される融合タンパク質のいずれか、および少なくとも一つのガイドRNAと接触させることを含む方法を提供し、ここで、ガイドRNAは、約15~100ヌクレオチド長であり、標的配列に相補的である少なくとも10個の連続したヌクレオチドの配列を含む。いくつかの実施形態において、標的配列の3’末端は、AGC、GAG、TTT、GTG、またはCAA配列にすぐ隣接している。いくつかの実施形態において、標的配列の3’末端は、NGA、NGCG、NGN、NNGRRT、NNNRRT、NGCG、NGCN、NGTN、NGTN、NGTN、または5’ (TTTV) 配列にすぐ隣接している。
それぞれの配列における特定の位置または残基の番号付けは、使用される特定のタンパク質および番号付けスキームに依存することが理解されるであろう。たとえば、成熟タンパク質の前駆体と成熟タンパク質そのものとでは番号付けが異なることがあり、種ごとの配列の違いが番号付けに影響することがある。当業者は、当業者に周知の方法、例えば、配列アラインメントおよび相同的残基の決定によって、任意の相同的タンパク質およびそれぞれのコード核酸中のそれぞれの残基を同定することができる。
本明細書に開示された融合タンパク質のいずれかを標的部位、例えば、編集される突然変異を含む部位にターゲティングするためには、融合タンパク質をガイドRNAと共に共発現させることが典型的に必要であることは当業者には明らかであろう。本明細書の他の箇所でより詳細に説明されるように、ガイドRNAは、典型的には、Cas9結合を可能にするtracrRNAフレームワークと、Cas9:核酸編集酵素/ドメイン融合タンパク質に配列特異性を付与するガイド配列とを含む。あるいは、ガイドRNAおよびtracrRNAは、2つの核酸分子として別々に提供され得る。いくつかの実施形態において、ガイドRNAは、ガイド配列が標的配列に相補的な配列を含むという構造を含む。ガイド配列は典型的には20ヌクレオチド長である。Cas9:核酸編集酵素/ドメイン融合タンパク質を特定のゲノム標的部位にターゲティングするための適切なガイドRNAの配列は、本開示に基づいて当業者に明らかであろう。そのような適切なガイドRNA配列は、典型的には、編集される標的ヌクレオチドの50ヌクレオチド以内の上流または下流内の核酸配列に相補的なガイド配列を含む。提供された融合タンパク質のいずれかを特定の標的配列に標的化するのに適したいくつかの例示的なガイドRNA配列が本明細書に提供される。
[ガイドRNAを伴うCas12複合体]
本開示のいくつかの態様は、本明細書で提供される任意の融合タンパク質、およびガイドRNA(例えば編集のために標的ポリヌクレオチドを標的化するガイド)を含む複合体を提供する。
いくつかの実施形態において、ガイド核酸(例えばガイドRNA)は、15~100ヌクレオチド長であり、標的配列に相補的である少なくとも10個の連続するヌクレオチドの配列を含む。いくつかの実施形態において、ガイドRNAは、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、または50ヌクレオチドの長さである。いくつかの実施形態において、ガイドRNAは、標的配列に相補的な15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、または40個の連続したヌクレオチドの配列を含む。いくつかの実施形態において、標的配列はDNA配列である。いくつかの実施形態において、標的配列は、細菌、酵母、真菌、昆虫、植物または動物のゲノムにおける配列である。いくつかの実施形態において、標的配列は、ヒトのゲノムにおける配列である。いくつかの実施形態において、標的配列の3’末端は、標準PAM配列にすぐ隣接している。いくつかの実施形態において、標的配列の3’末端は、非標準PAM配列にすぐ隣接している。
本開示のいくつかの態様は、本明細書に提供される融合タンパク質または複合体を使用する方法を提供する。例えば、本開示のいくつかの態様は、DNA分子を、本明細書中に提供される融合タンパク質のいずれか、および少なくとも一つのガイドRNAと接触させることを含む方法を提供し、ここで、ガイドRNAは、約15~100ヌクレオチド長であり、標的配列に相補的である少なくとも10個の連続したヌクレオチドの配列を含む。いくつかの実施形態において、標的配列の3’末端は、例えば、TTN、DTTN、GTTN、ATTN、ATTC、DTTNT、WTTN、HATY、TTTN、TTTV、TTTC、TG、RTR、またはYTN PAM部位にすぐ隣接している。
それぞれの配列における特定の位置または残基の番号付けは、使用される特定のタンパク質および番号付けスキームに依存することが理解されるであろう。たとえば、成熟タンパク質の前駆体と成熟タンパク質そのものとでは番号付けが異なることがあり、種ごとの配列の違いが番号付けに影響することがある。当業者は、当業者に周知の方法、例えば、配列アラインメントおよび相同的残基の決定によって、任意の相同的タンパク質およびそれぞれのコード核酸中のそれぞれの残基を同定することができる。
本明細書に開示された融合タンパク質のいずれかを標的部位、例えば、編集される突然変異を含む部位にターゲティングするためには、融合タンパク質をガイドRNAと共に共発現させることが典型的に必要であることは当業者には明らかであろう。本明細書の他の箇所でより詳細に説明されるように、ガイドRNAは、典型的には、Cas12結合を可能にするtracrRNAフレームワークと、Cas12:核酸編集酵素/ドメイン融合タンパク質に配列特異性を付与するガイド配列とを含む。あるいは、ガイドRNAおよびtracrRNAは、2つの核酸分子として別々に提供され得る。いくつかの実施形態において、ガイドRNAは、ガイド配列が標的配列に相補的な配列を含むという構造を含む。ガイド配列は典型的には20ヌクレオチド長である。Cas12:核酸編集酵素/ドメイン融合タンパク質を特定のゲノム標的部位にターゲティングするための適切なガイドRNAの配列は、本開示に基づいて当業者に明らかであろう。そのような適切なガイドRNA配列は、典型的には、編集される標的ヌクレオチドの50ヌクレオチド以内の上流または下流内の核酸配列に相補的なガイド配列を含む。提供された融合タンパク質のいずれかを特定の標的配列に標的化するのに適したいくつかの例示的なガイドRNA配列が本明細書に提供される。
本明細書に開示される塩基エディターのドメインは、デアミナーゼドメインがCas12タンパク質中で内部化される限り、任意の順序で並べることができる。例えばCas12ドメインおよびデアミナーゼドメインを含む融合タンパク質を含む塩基エディターの非限定的な例は、以下の通りに並べることができる:
NH2-[Cas12ドメイン]-リンカー1-[ABE8]-リンカー2-[Cas12ドメイン]-COOH、
NH2-[Cas12ドメイン]-リンカー1-[ABE8]-[Cas12ドメイン]-COOH、
NH2-[Cas12ドメイン]-[ABE8]-リンカー2-[Cas12ドメイン]-COOH、
NH2-[Cas12ドメイン]-[ABE8]-[Cas12ドメイン]-COOH、
NH2-[Cas12ドメイン]-リンカー1-[ABE8]-リンカー2-[Cas12ドメイン]-[イノシンBER阻害因子]-COOH、
NH2-[Cas12ドメイン]-リンカー1-[ABE8]-[Cas12ドメイン]-[イノシンBER阻害因子]-COOH、
NH2-[Cas12ドメイン]-[ABE8]-リンカー2-[Cas12ドメイン]-[イノシンBER阻害因子]-COOH、
NH2-[Cas12ドメイン]-[ABE8]-[Cas12ドメイン]-[イノシンBER阻害因子]-COOH、
NH2-[イノシンBER阻害因子]-[Cas12ドメイン]-リンカー1-[ABE8]-リンカー2-[Cas12ドメイン]-COOH、
NH2-[イノシンBER阻害因子]-[Cas12ドメイン]-リンカー1-[ABE8]-[Cas12ドメイン]-COOH、
NH2-[イノシンBER阻害因子]-[Cas12ドメイン]-[ABE8]-リンカー2-[Cas12ドメイン]-COOH、
NH2-[イノシンBER阻害因子]NH2-[Cas12ドメイン]-[ABE8]-[Cas12ドメイン]-COOH
さらに、場合によっては、Gamタンパク質を塩基エディターのN末端に融合させることができる。場合によっては、Gamタンパク質を塩基エディターのC末端に融合させることができる。バクテリオファージMuのGamタンパク質は二本鎖切断(DSB) の末端に結合し、それらを分解から保護することができる。いくつかの実施形態において、Gamを使用してDSBの遊離末端を結合することにより、塩基編集のプロセス中のインデル形成を低減することができる。いくつかの実施形態において、174残基のGamタンパク質は、塩基エディターのN末端に融合される。Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity”Science Advances 3:eaao4774 (2017)を参照されたい。場合によっては、1つまたは複数の突然変異が、野生型ドメインと比較して、塩基編集ドメインの長さを変化させることができる。例えば、少なくとも1つのドメインにおける少なくとも1つのアミノ酸の欠失は、塩基エディターの長さを短くすることができる。別の例では、1つまたは複数の突然変異は、野生型ドメインに対するドメインの長さを変化させない。例えば、いずれかのドメインにおける置換(複数可)は塩基エディターの長さを変えない。すべてのドメインの長さが野生型ドメインと同じであるそのような塩基エディターの非限定的な例は以下を含むことができる:
NH2-[Cas12ドメイン]-リンカー1-[APOBEC1]-リンカー2-[Cas12ドメイン]-COOH、
NH2-[Cas12ドメイン]-リンカー1-[APOBEC1]-[Cas12ドメイン]-COOH、
NH2-[Cas12ドメイン]-[APOBEC1]-リンカー2-[Cas12ドメイン]-COOH、
NH2-[Cas12ドメイン]-[APOBEC1]-[Cas12ドメイン]-COOH、
NH2-[Cas12ドメイン]-リンカー1-[APOBEC1]-リンカー2-[Cas12ドメイン]-[UGI]-COOH、
NH2-[Cas12ドメイン]-リンカー1-[APOBEC1]-[Cas12ドメイン]-[UGI]-COOH、
NH2-[Cas12ドメイン]-[APOBEC1]-リンカー2-[Cas12ドメイン]-[UGI]-COOH、
NH2-[Cas12ドメイン]-[APOBEC1]-[Cas12ドメイン]-[UGI]-COOH、
NH2-[UGI]-[Cas12ドメイン]-リンカー1-[APOBEC1]-リンカー2-[Cas12ドメイン]-COOH、
NH2-[UGI]-[Cas12ドメイン]-リンカー1-[APOBEC1]-[Cas12ドメイン]-COOH、
NH2-[UGI]-[Cas12ドメイン]-[APOBEC1]-リンカー2-[Cas12ドメイン]-COOH、
NH2-[UGI]-[Cas12ドメイン]-[APOBEC1]-[Cas12ドメイン]-COOH
いくつかの実施形態において、本明細書で提供される塩基編集融合タンパク質は、正確な位置、例えば、標的塩基が規定された領域(例えば「脱アミノ化ウィンドウ」)内に配置されるような位置に配置される必要がある。場合によっては、標的は4塩基領域内にあり得る。場合によっては、そのような規定された標的領域は、PAMの約15塩基上流にあり得る。Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017); and Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity”Science Advances 3:eaao4774 (2017) 参照;その全内容が参照により本明細書に組み入れられる。
定義された標的領域は、脱アミノ化ウィンドウであり得る。脱アミノ化ウィンドウは、塩基エディターが標的ヌクレオチドに作用して脱アミノ化する、規定された領域であり得る。いくつかの実施形態において、脱アミノ化ウィンドウは、2、3、4、5、6、7、8、9又は10塩基領域内にある。いくつかの実施形態において、脱アミノ化ウィンドウは、PAMの5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24又は25塩基上流にある。
本開示の塩基エディターは、標的ポリヌクレオチド配列の編集を促進させる任意のドメイン、特徴またはアミノ酸配列を含むことができる。例えば、いくつかの実施形態において、塩基エディターは、核局在化配列 (NLS) を含む。いくつかの実施形態において、塩基エディターのNLSは、デアミナーゼドメインとnapDNAbpドメインとの間に位置する。いくつかの実施形態において、塩基エディターのNLSは、napDNAbpドメインに対してC末端に位置する。
融合タンパク質に含まれるタンパク質ドメインは異種の機能的ドメインであることができる。融合タンパク質に含まれ得るタンパク質ドメインの非限定的な例としては、デアミナーゼドメイン(例えばシチジンデアミナーゼおよび/またはアデノシンデアミナーゼ; PCT/US2019/044935、PCT/US2020/016288(これらのそれぞれは参照により全体が本明細書に組み込まれる)を参照されたい)、ウラシルグリコシラーゼ阻害因子 (UGI) ドメイン、エピトープタグ、ならびにレポーター遺伝子配列が挙げられる。タンパク質ドメインは、例えば、以下の活性:転写活性化活性、転写抑制活性、転写放出因子活性、遺伝子サイレンシング活性、クロマチン修飾活性、エピジェネティック修飾活性、ヒストン修飾活性、RNA切断活性、および核酸結合活性のうちの1つまたは複数を有する、異種の機能的ドメインであることができる。そのような異種の機能的ドメインは、例えば、ヒストンメチル化、ヒストンアセチル化、およびヒストンユビキチン化などに繋がる、標的DNAと関連付けられる標的ポリペプチド(例えばヒストン、DNA結合タンパク質など)の修飾などの機能活性を付与することができる。付与される他の機能および/または活性は、トランスポザーゼ活性、インテグラーゼ活性、リコンビナーゼ活性、リガーゼ活性、ユビキチンリガーゼ活性、脱ユニキチン化活性、アデニル化活性、脱アデニル化活性、SUMO化活性、脱SUMO化活性、または上記の任意の組合せを含むことができる。
ドメインは、エピトープタグ、レポータータンパク質、他の結合ドメインを用いて検出または標識され得る。エピトープタグの非限定的な例としては、ヒスチジン (His) タグ、V5タグ、FLAGタグ、インフルエンザヘマグルチニン (HA) タグ、Mycタグ、VSV-Gタグ、およびチオレドキシン (Trx) タグが挙げられる。レポーター遺伝子の例としては、グルタチオン-5-トランスフェラーゼ (GST)、ホースラディッシュペルオキシダーゼ (HRP)、クロラムフェニコールアセチルトランスフェラーゼ (CAT) ベータ-ガラクトシダーゼ、ベータ-グルクロニダーゼ、ルシフェラーゼ、緑色蛍光タンパク質 (GFP)、HcRed、DsRed、シアン蛍光タンパク質 (CFP)、黄色蛍光タンパク質 (YFP)、および青色蛍光タンパク質 (BFP) を含む自家蛍光タンパク質が挙げられるがこれらに限定されない。さらなるタンパク質配列には、DNA分子に結合するかまたは他の細胞分子に結合するアミノ酸配列が含まれ得、これらには、マルトース結合タンパク質 (MBP) 、Sタグ、Lex A DNA結合ドメイン (DBD) 融合体、GAL4 DNA結合ドメイン融合体、および単純ヘルペスウイルス (HSV) BP16タンパク質融合体が挙げられるが、これらに限定されない。
いくつかの実施形態において、BhCas12bガイドポリヌクレオチドは以下の配列を有する:
BhCas12b sgRNA足場(下線)+20nt~23ntガイド配列(Nnにより示される)
5’GUUCUGTCUUUUGGUCAGGACAACCGUCUAGCUAUAAGUGCUGCAGGGUGUGAGAAACUCCUAUUGCUGGACGAUGUCUCUUACGAGGCAUUAGCACNNNNNNNNNNNNNNNNNNNN-3’
いくつかの実施形態において、BvCas12bおよびAaCas12bガイドポリヌクレオチドは以下の配列を有する:
BvCas12b sgRNA足場(下線)+20nt~23ntガイド配列(Nnにより示される)
5’GACCUAUAGGGUCAAUGAAUCUGUGCGUGUGCCAUAAGUAAUUAAAAAUUACCCACCACAGGAGCACCUGAAAACAGGUGCUUGGCACNNNNNNNNNNNNNNNNNNNN-3’
AaCas12b sgRNA足場(下線)+20nt~23ntガイド配列(Nnにより示される)
5’GUCUAAAGGACAGAAUUUUUCAACGGGUGUGCCAAUGGCCACUUUCCAGGUGGCAAAGCCCGUUGAACUUCUCAAAAAGAACGAUCUGAGAAGUGGCACNNNNNNNNNNNNNNNNNNNN-3’
[アデノシンデアミナーゼバリアントおよびCas9ドメインを含む融合タンパク質を使用する方法]
本開示のいくつかの態様は、本明細書に提供される融合タンパク質または複合体を使用する方法を提供する。例えば、本開示のいくつかの態様は、突然変異型のタンパク質をコードするDNA分子を、本明細書中に提供される融合タンパク質のいずれか、および少なくとも一つのガイドRNAと接触させることを含む方法を提供し、ここで、ガイドRNAは、約15~100ヌクレオチド長であり、標的配列に相補的である少なくとも10個の連続したヌクレオチドの配列を含む。いくつかの実施形態において、標的配列の3’末端は、標準PAM配列(NGG) に直接隣接する。いくつかの実施形態において、標的配列の3'末端は、標準PAM配列(NGG) に直接隣接していない。いくつかの実施形態において、標的配列の3’末端は、AGC、GAG、TTT、GTG、またはCAA配列にすぐ隣接している。いくつかの実施形態において、標的配列の3’末端は、NGA、NGCG、NGN、NNGRRT、NNNRRT、NGCG、NGCN、NGTN、NGTN、NGTN、または5’ (TTTV) 配列にすぐ隣接している。
それぞれの配列における特定の位置または残基の番号付けは、使用される特定のタンパク質および番号付けスキームに依存することが理解されるであろう。たとえば、成熟タンパク質の前駆体と成熟タンパク質そのものとでは番号付けが異なることがあり、種ごとの配列の違いが番号付けに影響することがある。当業者は、当業者に周知の方法、例えば、配列アラインメントおよび相同的残基の決定によって、任意の相同的タンパク質およびそれぞれのコード核酸中のそれぞれの残基を同定することができる。
本明細書に開示された、Cas9ドメインとアデノシンデアミナーゼバリアント (例えばABE8) を含む融合タンパク質のいずれかを標的部位、例えば、編集される突然変異を含む部位にターゲティングするためには、融合タンパク質をガイドRNA、例えばsgRNAと共に共発現させることが典型的に必要であることは当業者には明らかであろう。本明細書の他の箇所でより詳細に説明されるように、ガイドRNAは、典型的には、Cas9結合を可能にするtracrRNAフレームワークと、Cas9:核酸編集酵素/ドメイン融合タンパク質に配列特異性を付与するガイド配列とを含む。あるいは、ガイドRNAおよびtracrRNAは、2つの核酸分子として別々に提供され得る。いくつかの実施形態において、ガイドRNAは、ガイド配列が標的配列に相補的な配列を含むという構造を含む。ガイド配列は典型的には20ヌクレオチド長である。Cas9:核酸編集酵素/ドメイン融合タンパク質を特定のゲノム標的部位にターゲティングするための適切なガイドRNAの配列は、本開示に基づいて当業者に明らかであろう。そのような適切なガイドRNA配列は、典型的には、編集される標的ヌクレオチドの50ヌクレオチド以内の上流または下流内の核酸配列に相補的なガイド配列を含む。提供された融合タンパク質のいずれかを特定の標的配列に標的化するのに適したいくつかの例示的なガイドRNA配列が本明細書に提供される。
[塩基エディターの効率性]
CRISPR-Cas9ヌクレアーゼは、標的ゲノム編集を媒介するために広く使用されている。ほとんどのゲノム編集応用において、Cas9はガイドポリヌクレオチド(例えば単一ガイドRNA (sgRNA))と複合体を形成し、sgRNA配列により指定される標的部位で二本鎖DNA切断 (DSB) を誘導する。細胞は主に非相同末端結合 (NHEJ) 修復経路を介してこのDSBに応答し、遺伝子を破壊するフレームシフト変異を生じる確率的挿入または欠失 (インデル) を生じる。DSBに隣接する配列と高度の相同性を有するドナーDNA鋳型の存在下で、相同性誘導型修復 (HDR) として知られる代替経路を介して遺伝子補正が達成され得る。残念ながら、ほとんどの非侵襲的条件下では、HDRは非効率であり、細胞状態および細胞型に依存し、より高いインデルの頻度によって支配される。ヒトの疾患に関連する既知の遺伝的変異の大部分は点突然変異であるため、より効率的かつクリーンに正確な点突然変異を作製できる方法が必要である。本明細書に提供される塩基編集システムは、二本鎖DNA切断を生じることなく、ドナーDNA鋳型を必要とせず、かつ過剰な確率的挿入および欠失を誘導することなく、ゲノム編集を提供するための新しい方法を提供する。
本開示の融合タンパク質は、有利には、有意な割合のインデルを生成することなく突然変異を含むタンパク質をコードする特異的なヌクレオチド塩基を改変する。本明細書で使用される場合、「インデル(indel)」は、核酸内のヌクレオチド塩基の挿入または欠失を指す。このような挿入または欠失は、遺伝子のコード領域内でフレームシフト突然変異を引き起こす可能性がある。いくつかの実施形態において、核酸において多数の挿入または欠失(すなわちインデル)を生じることなく、核酸内の特定のヌクレオチドを効率的に改変(例えば変異)する塩基エディターを生成することが望ましい。特定の実施形態では、本明細書に提供される塩基エディターのいずれも、インデルに対して意図された改変(例えば突然変異)のより大きな割合を生成することができる。
いくつかの実施形態において、本明細書で提供される塩基エディター系のいずれも、標的ポリヌクレオチド配列において、50%未満、40%未満、30%未満、20%未満、19%未満、18%未満、17%未満、16%未満、15%未満、14%未満、13%未満、12%未満、11%未満、10%未満、9%未満、8%未満、7%未満、6%未満、5%未満、4%未満、3%未満、2%未満、1%未満、0.9%未満、0.8%未満、未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.09%未満、0.08%未満、0.07%未満、未満、0.06%未満、0.05%未満、0.04%未満、0.03%未満、0.02%未満、または0.01%未満のインデル形成をもたらす。
いくつかの実施形態において、本明細書に記載のABE8塩基エディターバリアントの1つを含む任意の塩基エディターシステムは、標的ポリヌクレオチド配列において50%未満、40%未満、30%未満、20%未満、19%未満、18%未満、17%未満、16%未満、15%未満、14%未満、13%未満、12%未満、11%未満、10%未満、9%未満、8%未満、7%未満、6%未満、5%未満、4%未満、3%未満、2%未満、1%未満、0.9%未満、0.8%未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.09%未満、0.08%未満、0.07%未満、0.06%未満、0.05%未満、0.04%未満、0.03%未満、0.02%未満、または0.01%未満のインデル形成を結果としてもたらす。いくつかの実施形態において、本明細書に記載のABE8塩基エディターバリアントの1つを含む任意の塩基エディターシステムは、標的ポリヌクレオチド配列において0.8%未満のインデル形成を結果としてもたらす。いくつかの実施形態において、本明細書に記載のABE8塩基エディターバリアントの1つを含む任意の塩基エディターシステムは、標的ポリヌクレオチド配列において最高で0.8%のインデル形成を結果としてもたらす。いくつかの実施形態において、本明細書に記載のABE8塩基エディターバリアントの1つを含む任意の塩基エディターシステムは、標的ポリヌクレオチド配列において0.3%未満のインデル形成を結果としてもたらす。いくつかの実施形態において、記載されるABE8塩基エディターバリアントの1つを含む任意の塩基エディターシステムは、ABE7塩基エディターの1つを含む塩基エディターシステムと比較して、標的ポリヌクレオチド配列においてより低いインデル形成を結果としてもたらす。いくつかの実施形態において、本明細書に記載のABE8塩基エディターバリアントの1つを含む任意の塩基エディターシステムは、ABE7.10を含む塩基エディターシステムと比較して、標的ポリヌクレオチド配列においてより低いインデル形成を結果としてもたらす。
いくつかの実施形態において、本明細書に記載のABE8塩基エディターバリアントの1つを含む任意の塩基エディターシステムは、ABE7塩基エディターの1つを含む塩基エディターシステムと比較してインデル頻度の低減を有する。いくつかの実施形態において、本明細書に記載のABE8塩基エディターバリアントの1つを含む任意の塩基エディターシステムは、ABE7塩基エディターの1つを含む塩基エディターシステムと比較してインデル頻度における少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、または少なくとも95%の低減を有する。いくつかの実施形態において、本明細書に記載のABE8塩基エディターバリアントの1つを含む塩基エディターシステムは、ABE7.10を含む塩基エディターシステムと比較してインデル頻度における少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、または少なくとも95%の低減を有する。
本開示は、増加した効率および特異性を有するアデノシンデアミナーゼバリアント(例えばABE8バリアント)を提供する。特に、本明細書に記載のアデノシンデアミナーゼバリアントは、ポリヌクレオチド内の所望の塩基を編集する可能性がより高く、改変が意図されない塩基(例えば「バイスタンダー」)を編集する可能性がより低い。
いくつかの実施形態において、本明細書に記載のABE8塩基エディターバリアントの1つを含む任意の塩基編集システムは、低減したバイスタンダー編集または突然変異を有する。いくつかの実施形態において、意図されない編集または突然変異はバイスタンダー突然変異またはバイスタンダー編集、例えば、標的ヌクレオチド配列の標的ウィンドウ中の意図されないまたは非標的位置における標的塩基(例えばAまたはC)の塩基編集である。いくつかの実施形態において、本明細書に記載のABE8塩基エディターバリアントの1つを含む任意の塩基編集システムは、ABE7塩基エディター、例えばABE7.10を含む塩基エディターシステムと比較して低減したバイスタンダー編集または突然変異を有する。いくつかの実施形態において、本明細書に記載のABE8塩基エディターバリアントの1つを含む任意の塩基編集システムは、ABE7塩基エディター、例えばABE7.10を含む塩基エディターシステムと比較して少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%低減したバイスタンダー編集または突然変異を有する。いくつかの実施形態において、本明細書に記載のABE8塩基エディターバリアントの1つを含む任意の塩基編集システムは、ABE7塩基エディター、例えばABE7.10を含む塩基エディターシステムと比較して少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、または少なくとも3.0倍低減したバイスタンダー編集または突然変異を有する。
いくつかの実施形態において、本明細書に記載のABE8塩基エディターバリアントの1つを含む任意の塩基編集システムは低減した目的外編集(spurious editing)を有する。いくつかの実施形態において、意図されない編集または突然変異は目的外突然変異または目的外編集、例えば、ゲノムの意図されないまたは非標的領域の標的塩基(例えばAまたはC)の非特異的編集またはガイド非依存的編集である。いくつかの実施形態において、本明細書に記載のABE8塩基エディターバリアントの1つを含む任意の塩基編集システムは、ABE7塩基エディター、例えばABE7.10を含む塩基エディターシステムと比較して低減した目的外編集を有する。いくつかの実施形態において、本明細書に記載のABE8塩基エディターバリアントの1つを含む任意の塩基編集システムは、ABE7塩基エディター、例えばABE7.10を含む塩基エディターシステムと比較して少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%低減した目的外編集を有する。いくつかの実施形態において、本明細書に記載のABE8塩基エディターバリアントの1つを含む任意の塩基編集システムは、ABE7塩基エディター、例えばABE7.10を含む塩基エディターシステムと比較して少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、または少なくとも3.0倍低減した目的外編集を有する。
本開示のいくつかの態様は、本明細書に提供される塩基エディターが、有意な数の非意図的な突然変異(例えば非意図的な点突然変異など)(すなわち、バイスタンダーの突然変異)を生成することなく、核酸(例えば対象のゲノム内の核酸)において、意図する突然変異(例えば点突然変異など)を効率的に生成することができるという認識に基づく。いくつかの実施形態において、本明細書に提供される塩基エディターのいずれも、少なくとも0.01%の意図された突然変異(すなわち、少なくとも0.01%の塩基編集効率)を生じることができる。いくつかの実施形態において、本明細書に提供される塩基エディターのいずれも、少なくとも0.01%、1%、2%、3%、4%、5%、10%、15%、20%、25%、30%、40%、45%、50%、60%、70%、80%、90%、95%、または99%の意図された突然変異を生じることができる。
いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのいずれも、少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%の塩基編集効率を有する。いくつかの実施形態において、塩基編集効率は、細胞集団における編集された核酸塩基のパーセンテージを計算することによって測定され得る。いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのいずれも、細胞集団における編集された核酸塩基によって測定すると、少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%の塩基編集効率を有する。
いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのいずれも、ABE7塩基エディターと比較して高い塩基編集効率を有する。いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのいずれも、ABE7塩基エディター、例えばABE7.10と比較して少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも99%、少なくとも100%、少なくとも105%、少なくとも110%、少なくとも115%、少なくとも120%、少なくとも125%、少なくとも130%、少なくとも135%、少なくとも140%、少なくとも145%、少なくとも150%、少なくとも155%、少なくとも160%、少なくとも165%、少なくとも170%、少なくとも175%、少なくとも180%、少なくとも185%、少なくとも190%、少なくとも195%、少なくとも200%、少なくとも210%、少なくとも220%、少なくとも230%、少なくとも240%、少なくとも250%、少なくとも260%、少なくとも270%、少なくとも280%、少なくとも290%、少なくとも300%、少なくとも310%、少なくとも320%、少なくとも330%、少なくとも340%、少なくとも350%、少なくとも360%、少なくとも370%、少なくとも380%、少なくとも390%、少なくとも400%、少なくとも450%、または少なくとも500%高い塩基編集効率を有する。
いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのいずれも、ABE7塩基エディター、例えばABE7.10と比較して少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、少なくとも3.0倍、少なくとも3.1倍、少なくとも3.2倍、少なくとも3.3倍、少なくとも3.4倍、少なくとも3.5倍、少なくとも3.6倍、少なくとも3.7倍、少なくとも3.8倍、少なくとも3.9倍、少なくとも4.0倍、少なくとも4.1倍、少なくとも4.2倍、少なくとも4.3倍、少なくとも4.4倍、少なくとも4.5倍、少なくとも4.6倍、少なくとも4.7倍、少なくとも4.8倍、少なくとも4.9倍、または少なくとも5.0倍高い塩基編集効率を有する。
いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのいずれも、少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%のオンターゲット塩基編集効率を有する。いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのいずれも、細胞集団における編集された標的核酸塩基によって測定すると、少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%のオンターゲット塩基編集効率を有する。
いくつかの実施形態において、本明細書において記載されるABE8塩基エディターバリアントのいずれも、ABE7塩基エディターと比較して高いオンターゲット塩基編集効率を有する。いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのいずれも、ABE7塩基エディター、例えばABE7.10と比較して少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも99%、少なくとも100%、少なくとも105%、少なくとも110%、少なくとも115%、少なくとも120%、少なくとも125%、少なくとも130%、少なくとも135%、少なくとも140%、少なくとも145%、少なくとも150%、少なくとも155%、少なくとも160%、少なくとも165%、少なくとも170%、少なくとも175%、少なくとも180%、少なくとも185%、少なくとも190%、少なくとも195%、少なくとも200%、少なくとも210%、少なくとも220%、少なくとも230%、少なくとも240%、少なくとも250%、少なくとも260%、少なくとも270%、少なくとも280%、少なくとも290%、少なくとも300%、少なくとも310%、少なくとも320%、少なくとも330%、少なくとも340%、少なくとも350%、少なくとも360%、少なくとも370%、少なくとも380%、少なくとも390%、少なくとも400%、少なくとも450%、または少なくとも500%高いオンターゲット塩基編集効率を有する。
いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのいずれも、ABE7塩基エディター、例えばABE7.10と比較して少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、少なくとも3.0倍、少なくとも3.1倍、少なくとも3.2倍、少なくとも3.3倍、少なくとも3.4倍、少なくとも3.5倍、少なくとも3.6倍、少なくとも3.7倍、少なくとも3.8倍、少なくとも3.9倍、少なくとも4.0倍、少なくとも4.1倍、少なくとも4.2倍、少なくとも4.3倍、少なくとも4.4倍、少なくとも4.5倍、少なくとも4.6倍、少なくとも4.7倍、少なくとも4.8倍、少なくとも4.9倍、または少なくとも5.0倍高いオンターゲット塩基編集効率を有する。
本明細書に記載されるABE8塩基エディターバリアントは、プラスミド、ベクター、LNP複合体、またはmRNAを介して宿主細胞に送達され得る。いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのいずれも、mRNAとして宿主細胞に送達される。いくつかの実施形態において、核酸ベースの送達系、例えばmRNAを介して送達されるABE8塩基エディターは、編集された核酸塩基によって測定すると、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%のオンターゲット編集効率を有する。いくつかの実施形態において、mRNA系によって送達されるABE8塩基エディターは、プラスミドまたはベクター系によって送達されるABE8塩基エディターと比較して高い塩基編集効率を有する。いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのいずれも、mRNA系によって送達される場合、プラスミドまたはベクター系によって送達される場合と比較して少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも99%、少なくとも100%、少なくとも105%、少なくとも110%、少なくとも115%、少なくとも120%、少なくとも125%、少なくとも130%、少なくとも135%、少なくとも140%、少なくとも145%、少なくとも150%、少なくとも155%、少なくとも160%、少なくとも165%、少なくとも170%、少なくとも175%、少なくとも180%、少なくとも185%、少なくとも190%、少なくとも195%、少なくとも200%、少なくとも210%、少なくとも220%、少なくとも230%、少なくとも240%、少なくとも250%、少なくとも260%、少なくとも270%、少なくとも280%、少なくとも290%、少なくとも300%高い、少なくとも310%、少なくとも320%、少なくとも330%、少なくとも340%、少なくとも350%、少なくとも360%、少なくとも370%、少なくとも380%、少なくとも390%、少なくとも400%、少なくとも450%、または少なくとも500%のオンターゲット編集効率を有する。いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのいずれも、mRNA系によって送達される場合、プラスミドまたはベクター系によって送達される場合と比較して少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、少なくとも3.0倍、少なくとも3.1倍、少なくとも3.2倍、少なくとも3.3倍、少なくとも3.4倍、少なくとも3.5倍、少なくとも3.6倍、少なくとも3.7倍、少なくとも3.8倍、少なくとも3.9倍、少なくとも4.0倍、少なくとも4.1倍、少なくとも4.2倍、少なくとも4.3倍、少なくとも4.4倍、少なくとも4.5倍、少なくとも4.6倍、少なくとも4.7倍、少なくとも4.8倍、少なくとも4.9倍、または少なくとも5.0倍高いオンターゲット編集効率を有する。
いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントの1つを含む塩基エディター系のいずれも、標的ポリヌクレオチド配列において、50%未満、40%未満、30%未満、20%未満、19%未満、18%未満、17%未満、16%未満、15%未満、14%未満、13%未満、12%未満、11%未満、10%未満、9%未満、8%未満、7%未満、6%未満、5%未満、4%未満、3%未満、2%未満、1%未満、0.9%未満、0.8%未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.09%未満、0.08%未満、0.07%未満、0.06%未満、0.05%未満、0.04%未満、0.03%未満、0.02%未満、または0.01%未満のオフターゲット編集を生じさせる。
いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのいずれも、mRNA系によって送達される場合、プラスミドまたはベクター系によって送達される場合と比較して低い誘導型オフターゲット編集効率を有する。いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのいずれも、mRNA系によって送達される場合、プラスミドまたはベクター系によって送達される場合と比較して少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%低い誘導型オフターゲット編集効率を有する。いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのいずれも、mRNA系によって送達される場合、プラスミドまたはベクター系によって送達される場合と比較して少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、または少なくとも3.0倍低い誘導型オフターゲット編集効率を有する。いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのいずれも、mRNA系によって送達される場合、プラスミドまたはベクター系によって送達される場合と比較して、誘導型オフターゲット編集効率の少なくとも約2.2倍の低下を有する。
いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのいずれも、mRNA系によって送達される場合、プラスミドまたはベクター系によって送達される場合と比較して低いガイド非依存性のオフターゲット編集効率を有する。いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのいずれも、mRNA系によって送達される場合、プラスミドまたはベクター系によって送達される場合と比較して少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%低いガイド非依存性のオフターゲット編集効率を有する。いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントのいずれも、mRNA系によって送達される場合、プラスミドまたはベクター系によって送達される場合と比較して少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、少なくとも3.0倍、少なくとも5.0倍、少なくとも10.0倍、少なくとも20.0倍、少なくとも50.0倍、少なくとも70.0倍、少なくとも100.0倍、少なくとも120.0倍、少なくとも130.0倍、または少なくとも150.0倍低いガイド非依存性のオフターゲット編集効率を有する。いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントは、mRNA系によって送達される場合、プラスミドまたはベクター系によって送達される場合と比較して、ガイド非依存性のオフターゲット編集効率(例えば、目的外RNA脱アミノ化)の134.0倍の低下を有する。いくつかの実施形態において、本明細書に記載されるABE8塩基エディターバリアントは、ゲノム全体でのガイド非依存性の突然変異率を増加させない。
本開示のいくつかの態様は、本明細書に提供される塩基エディターのいずれもが、有意な数の非意図的な突然変異(例えば、目的外オフターゲット編集またはバイスタンダー編集)を生成することなく、核酸(例えば、対象のゲノム内の核酸)において、点突然変異などの意図された突然変異を効率的に生成することができるという認識に基づく。いくつかの実施形態において、意図された突然変異は、標的遺伝子内の突然変異を改変または補正するように特異的に設計されたgRNAに結合した特異的塩基エディターによって生じる突然変異である。本開示のいくつかの態様は、本明細書に提供される塩基エディターのいずれかが、有意な数の非意図的な突然変異を生成することなく、核酸(例えば、対象のゲノム内の核酸)において、意図された突然変異を効率的に生成することができるという認識に基づく。いくつかの実施形態において、意図された突然変異は、意図された突然変異を改変または補正するように特異的に設計されたgRNAに結合した特異的塩基エディターによって生じる突然変異である。いくつかの実施形態において、意図された突然変異は、遺伝子のコード領域内の終止コドン、例えば未成熟終止コドンを生じさせる突然変異である。いくつかの実施形態において、意図された突然変異は、終止コドンを排除する突然変異である。いくつかの実施形態において、意図された突然変異は、遺伝子のスプライシングを改変する突然変異である。いくつかの実施形態において、意図された突然変異は、遺伝子の調節配列(例えば、遺伝子プロモーターまたは遺伝子リプレッサー)を改変する突然変異である。
いくつかの実施形態において、本明細書に提供される塩基エディターは、1:1より大きい、意図された突然変異対インデル(すなわち、非意図的な突然変異)の比を生成することができる。いくつかの実施形態において、本明細書に提供される塩基エディターは、少なくとも1.5:1、少なくとも2:1、少なくとも2.5:1、少なくとも3:1、少なくとも3.5:1、少なくとも4:1、少なくとも4.5:1、少なくとも5:1、少なくとも5.5:1、少なくとも6:1、少なくとも6.5:1、少なくとも7:1、少なくとも7.5:1、少なくとも8:1、少なくとも10:1、少なくとも12:1、少なくとも15:1、少なくとも20:1、少なくとも25:1、少なくとも30:1、少なくとも40:1、少なくとも50:1、少なくとも100:1、少なくとも200:1、少なくとも300:1、少なくとも400:1、少なくとも500:1、少なくとも600:1、少なくとも700:1、少なくとも800:1、少なくとも900:1、もしくは少なくとも1000:1、またはそれ以上の、意図される突然変異対インデルの比を生じることができる。本明細書に記載される塩基エディターの特徴が融合タンパク質のいずれかまたは本明細書に提供される融合タンパク質を使用する方法に適用され得ることが、理解されるべきである。
意図された突然変異およびインデルの数は、例えば、国際PCT出願番号PCT/2017/045381 (WO2030/027078) およびPCT/US2016/058344 (WO2017/070632);Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017); および Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity,”Science Advances 3:eaao4774 (2017)(その全内容は参照によりここに組み込まれる)に記載されているもののような、任意の適切な方法を用いて決定することができる。
いくつかの実施形態において、インデル頻度を計算するために、インデルが生じ得るウィンドウの両側に隣接する二つの10 bp配列に対する正確なマッチについて配列決定リードがスキャンされる。完全マッチが見つからない場合、そのリードは解析から除外される。このインデルウィンドウの長さが参照配列と完全にマッチする場合、リードはインデルを含まないものとして分類される。インデルウィンドウが参照配列よりも2塩基以上長いかまたは短い場合、配列決定リードは、それぞれ挿入または欠失として分類される。いくつかの実施形態において、本明細書において提供される塩基エディターは、核酸の領域におけるインデルの形成を制限することができる。いくつかの実施形態において、その領域は、塩基エディターによって標的化されるヌクレオチドのところにあるか、または塩基エディターによって標的化されるヌクレオチドの2、3、4、5、6、7、8、9または10ヌクレオチド以内の領域である。
標的ヌクレオチド領域で形成されるインデルの数は、核酸(例えば細胞のゲノム内の核酸)が塩基エディターに曝される時間の量に依存し得る。いくつかの実施形態において、インデルの数または割合は、標的ヌクレオチド配列(例えば細胞のゲノム内の核酸)を塩基エディターに曝してから少なくとも1時間、少なくとも2時間、少なくとも6時間、少なくとも12時間、少なくとも24時間、少なくとも36時間、少なくとも48時間、少なくとも3日、少なくとも4日、少なくとも5日、少なくとも7日、少なくとも10日、または少なくとも14日後に決定される。本明細書に記載される塩基エディターの特徴は、本明細書に提供される融合タンパク質、または融合タンパク質を使用する方法のいずれにも適用され得ることが理解されるべきである。
いくつかの実施形態において、本明細書に提供される塩基エディターは、核酸の領域におけるインデルの形成を制限することができる。いくつかの実施形態において、領域は、塩基エディターによって標的化されるヌクレオチドであるか、または塩基エディターによって標的化されるヌクレオチドの2、3、4、5、6、7、8、9、もしくは10ヌクレオチド内の領域である。いくつかの実施形態において、本明細書に提供される塩基エディターのいずれも、核酸の領域でのインデルの形成を、1%未満、1.5%未満、2%未満、2.5%未満、3%未満、3.5%未満、4%未満、4.5%未満、5%未満、6%未満、7%未満、8%未満、9%未満、10%未満、12%未満、15%未満、または20%未満まで制限することができる。核酸領域で形成されるインデルの数は、核酸(例えば、細胞のゲノム内の核酸)が塩基エディターに曝露される時間の量に依存し得る。いくつかの実施形態において、インデルの数または割合はいずれも、核酸(例えば、細胞のゲノム内の核酸)を塩基エディターに曝露した少なくとも1時間、少なくとも2時間、少なくとも6時間、少なくとも12時間、少なくとも24時間、少なくとも36時間、少なくとも48時間、少なくとも3日、少なくとも4日、少なくとも5日、少なくとも7日、少なくとも10日、または少なくとも14日後に決定される。
[多重編集]
いくつかの実施形態において、本明細書に提供される塩基エディターシステムは、1以上の遺伝子における複数の核酸塩基対の多重編集を可能にする。いくつかの実施形態において、複数の核酸塩基対は、同一遺伝子内に位置する。いくつかの実施形態において、複数の核酸塩基対は、1つまたはそれより多い遺伝子に位置し、ここで、少なくとも1つの遺伝子は、異なる遺伝子座に位置する。いくつかの実施形態において、多重編集は、1以上のガイドポリヌクレオチドを含むことができる。いくつかの実施形態では、多重編集は、1つ以上の塩基エディターシステムを含むことができる。いくつかの実施形態において、多重編集は、単一のガイドポリヌクレオチドを有する1つ以上の塩基エディターシステムを含むことができる。いくつかの実施形態において、多重編集は、複数のガイドポリヌクレオチドを有する1つ以上の塩基エディターシステムを含むことができる。いくつかの実施形態において、多重編集は、単一の塩基エディター系を有する1以上のガイドポリヌクレオチドを含むことができる。いくつかの実施形態において、多重編集は、標的ポリヌクレオチド配列への結合を標的化するためにPAM配列を必要としない少なくとも1つのガイドポリヌクレオチドを含むことができる。いくつかの実施形態において、多重編集は、標的ポリヌクレオチド配列への結合を標的化するためにPAM配列を必要とする少なくとも1つのガイドポリヌクレオチドを含むことができる。いくつかの実施形態において、多重編集は、標的ポリヌクレオチド配列への結合を標的化するためにPAM配列を必要としない少なくとも1つのガイドポリヌクレオチドと、標的ポリヌクレオチド配列への結合を標的化するためにPAM配列を必要とする少なくとも1つのガイドポリヌクレオチドとの混合物を含むことができる。本明細書に記載される塩基エディターのいずれかを使用する多重編集の特徴は、本明細書に提供される塩基エディターのいずれかを使用する方法の任意の組み合わせに適用され得ることを理解されたい。また、本明細書に記載される塩基エディターのいずれかを使用する多重編集は、複数の核酸塩基対の順次的編集を含むことができることを理解されたい。
いくつかの実施形態において、複数の核酸塩基対は、1つ以上の遺伝子内にある。いくつかの実施形態において、複数の核酸塩基対は、同じ遺伝子内にある。いくつかの実施形態において、1つ以上の遺伝子における少なくとも1つの遺伝子は、異なる遺伝子座に位置する。
いくつかの実施形態において、編集は、少なくとも1つのタンパク質コード領域における複数の核酸塩基対の編集である。いくつかの実施形態において、編集は、少なくとも1つのタンパク質非コード領域における複数の核酸塩基対の編集である。いくつかの実施形態において、編集は、少なくとも1つのタンパク質コード領域および少なくとも1つのタンパク質非コード領域における複数の核酸塩基対の編集である。
いくつかの実施形態において、編集は、1以上のガイドポリヌクレオチドを伴う。いくつかの実施形態では、塩基エディターシステムは、1つ以上の塩基エディターシステムを含むことができる。いくつかの実施形態では、塩基エディターシステムは、単一のガイドポリヌクレオチドとともに1つ以上の塩基エディターシステムを含むことができる。いくつかの実施形態において、塩基エディターシステムは、複数のガイドポリヌクレオチドとともに1つ以上の塩基エディターシステムを含むことができる。いくつかの実施形態において、編集は、単一の塩基エディター系を有する1以上のガイドポリヌクレオチドを伴う。いくつかの実施形態において、編集は、標的ポリヌクレオチド配列への結合を標的化するためにPAM配列を必要としない少なくとも1つのガイドポリヌクレオチドを伴う。いくつかの実施形態において、編集は、標的ポリヌクレオチド配列への結合を標的化するためにPAM配列を必要とする少なくとも1つのガイドポリヌクレオチドを伴う。いくつかの実施形態において、編集は、標的ポリヌクレオチド配列への結合を標的化するためにPAM配列を必要としない少なくとも1つのガイドポリヌクレオチドと、標的ポリヌクレオチド配列への結合を標的化するためにPAM配列を必要とする少なくとも1つのガイドポリヌクレオチドとの混合物を伴う。本明細書に記載される塩基エディターのいずれかを使用する多重編集の特徴は、本明細書に提供される塩基エディターのいずれかを使用する方法の任意の組み合わせに適用され得ることを理解されたい。また、編集は、複数の核酸塩基対の順次的編集を含むことができることを理解されたい。
いくつかの実施形態では、1以上の遺伝子における複数の核酸塩基対の多重編集を可能にする塩基エディターシステムは、本明細書に記載されるABE8塩基エディターバリアントの1つを含む。いくつかの実施形態では、1以上の遺伝子における複数の核酸塩基対の多重編集を可能にする塩基エディターシステムは、ABE7塩基エディターの1つを含む。いくつかの実施形態では、本明細書に記載されるABE8塩基エディターバリアントの1つを含む多重編集を可能にする塩基エディターシステムは、ABE7塩基エディターの1つを含む多重編集を可能にする塩基エディターシステムと比較してさらに高い多重編集効率を有する。いくつかの実施形態では、本明細書に記載されるABE8塩基エディターバリアントの1つを含む多重編集を可能にする塩基エディターシステムは、ABE7塩基エディターの1つを含む多重編集を可能にする塩基エディターシステムと比較して、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも99%、少なくとも100%、少なくとも105%、少なくとも110%、少なくとも115%、少なくとも120%、少なくとも125%、少なくとも130%、少なくとも135%、少なくとも140%、少なくとも145%、少なくとも150%、少なくとも155%、少なくとも160%、少なくとも165%、少なくとも170%、少なくとも175%、少なくとも180%、少なくとも185%、少なくとも190%、少なくとも195%、少なくとも200%、少なくとも210%、少なくとも220%、少なくとも230%、少なくとも240%、少なくとも250%、少なくとも260%、少なくとも270%、少なくとも280%、少なくとも290%、少なくとも300%さらに高い、少なくとも310%、少なくとも320%、少なくとも330%、少なくとも340%、少なくとも350%、少なくとも360%、少なくとも370%、少なくとも380%、少なくとも390%、少なくとも400%、少なくとも450%または少なくとも500%さらに高い多重編集効率を有する。いくつかの実施形態では、本明細書に記載されるABE8塩基エディターバリアントの1つを含む多重編集を可能にする塩基エディターシステムは、ABE7塩基エディターの1つを含む多重編集を可能にする塩基エディターシステムと比較して、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、少なくとも3.0倍、少なくとも3.1倍、少なくとも3.2倍、少なくとも3.3倍、少なくとも3.4倍、少なくとも3.5倍、少なくとも4.0倍、少なくとも4.5倍、少なくとも5.0倍、少なくとも5.5倍または少なくとも6.0倍高い多重編集効率を有する。
[内部挿入を有する融合タンパク質]
核酸プログラム可能な核酸結合タンパク質、例えばnapDNAbpに融合された異種ポリペプチドを含む融合タンパクが本明細書で提供される。異種ポリペプチドは、天然または野生型napDNAbpポリペプチド配列において見出されないポリペプチドであり得る。異種ポリペプチドは、napDNAbpのC末端、napDNAbpのN末端でnapDNAbpに融合され得る、またはnapDNAbpの内部の位置に挿入され得る。いくつかの実施形態では、異種ポリペプチドはnapDNAbpの内部の位置に挿入され得る。
いくつかの実施形態では、異種ポリペプチドはデアミナーゼまたはその機能的断片である。例えば、融合タンパク質は、Cas9またはCas12(例えば、Cas12b/C2c1)ポリペプチドのN末端断片およびC末端断片に隣接されるデアミナーゼを含み得る。融合タンパク質中のデアミナーゼは、アデノシンデアミナーゼであり得る。いくつかの実施形態では、アデノシンデアミナーゼはTadA (例えば、TadA7.10またはTadA*8)である。いくつかの実施形態では、TadAはTadA*8である。本明細書に記載されるTadA配列(例えば、TadA7.10またはTadA*8)は、上に記載される融合タンパク質のために適切なデアミナーゼである。
デアミナーゼは、循環置換体デアミナーゼであり得る。例えば、デアミナーゼは、循環置換体アデノシンデアミナーゼであり得る。いくつかの実施形態では、デアミナーゼは、TadA参照配列における番号付けでアミノ酸残基116において環状に置換されている、循環置換体TadAである。いくつかの実施形態では、デアミナーゼは、TadA参照配列における番号付けでアミノ酸残基136において環状に置換されている、循環置換体TadAである。いくつかの実施形態では、デアミナーゼは、TadA参照配列における番号付けでアミノ酸残基65において環状に置換されている、循環置換体TadAである。
融合タンパク質は、複数のデアミナーゼを含み得る。融合タンパク質は、例えば1、2、3、4、5またはそれ以上のデアミナーゼを含み得る。いくつかの実施形態では、融合タンパク質は、1つのデアミナーゼを含む。いくつかの実施形態では、融合タンパク質は、2つのデアミナーゼを含む。融合タンパク質における2つまたはそれ以上のデアミナーゼは、アデノシンデアミナーゼ、シチジンデアミナーゼまたはそれらの組合せであり得る。2つまたはそれ以上のデアミナーゼは、ホモ二量体であり得る。2つまたはそれ以上のデアミナーゼは、ヘテロ二量体であり得る。2つまたはそれ以上のデアミナーゼは、napDNAbp中にタンデムに挿入され得る。いくつかの実施形態では、2つまたはそれ以上のデアミナーゼは、napDNAbp中でタンデムでなくてもよい。
いくつかの実施形態では、融合タンパク質中のnapDNAbpは、Cas9ポリペプチドまたはその断片である。Cas9ポリペプチドは、バリアントCas9ポリペプチドであり得る。いくつかの実施形態では、Cas9ポリペプチドは、Cas9ニッカーゼ(nCas9)ポリペプチドまたはその断片である。いくつかの実施形態では、Cas9ポリペプチドは、ヌクレアーゼ不活Cas9 (dCas9)ポリペプチドまたはその断片である。融合タンパク質中のCas9ポリペプチドは、全長Cas9ポリペプチドであり得る。いくつかの実施形態では、融合タンパク質中のCas9ポリペプチドは、全長Cas9ポリペプチドでなくてもよい。Cas9ポリペプチドは、例えば、天然に存在するCas9タンパク質と比べてN末端またはC末端で切詰され得る。Cas9ポリペプチドは、環状に置換されたCas9タンパク質であり得る。Cas9ポリペプチドは、標的ポリペプチドおよびガイド核酸配列に結合できるCas9ポリペプチドの断片、部分またはドメインであり得る。
いくつかの実施形態では、Cas9ポリペプチドは、Streptococcus pyogenes Cas9 (SpCas9)、Staphylococcus aureus Cas9 (SaCas9)、Streptococcus thermophilus 1 Cas9 (St1Cas9)またはそれらの断片もしくはバリアントである。
融合タンパク質のCas9ポリペプチドは、天然に存在するCas9ポリペプチドに対して少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%または少なくとも99.5%の同一性であるアミノ酸配列を含み得る。
融合タンパク質のCas9ポリペプチドは、以下に記載されるCas9アミノ酸配列(以下で「Cas9参照配列」と呼ばれる)に対して少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%または少なくとも99.5%の同一性であるアミノ酸配列を含み得る:
Figure 2022520081000076
(一重下線:HNHドメイン;二重下線:RuvCドメイン)
Cas9ポリペプチドのNおよびC末端断片によって隣接される異種触媒ドメインを含む融合タンパク質は、本明細書に記載される方法における塩基編集のためにも有用である。Cas9および1つ以上のデアミナーゼドメイン、例えばアデノシンデアミナーゼを含む、またはCas9配列によって隣接されるアデノシンデアミナーゼドメインを含む融合タンパク質も標的配列の高度に特異的で効率的な塩基編集のために有用である。ある実施形態では、キメラCas9融合タンパク質は、Cas9ポリペプチド内に挿入された異種触媒ドメイン(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼまたはアデノシンデアミナーゼおよびシチジンデアミナーゼ)を含む。いくつかの実施形態では、融合タンパク質は、Cas9内に挿入されたアデノシンデアミナーゼドメインおよびシチジンデアミナーゼドメインを含む。いくつかの実施形態では、アデノシンデアミナーゼは、Cas9内に融合され、シチジンデアミナーゼはC末端に融合されている。いくつかの実施形態では、アデノシンデアミナーゼは、Cas9内に融合され、シチジンデアミナーゼはN末端に融合されている。いくつかの実施形態では、シチジンデアミナーゼはCas9内に融合され、アデノシンデアミナーゼはC末端に融合されている。いくつかの実施形態では、シチジンデアミナーゼは、Cas9内に融合され、アデノシンデアミナーゼはN末端に融合されている。
アデノシンデアミナーゼおよびシチジンデアミナーゼおよびCas9を含む融合タンパク質の例示的構造は以下に提供される:
NH2-[Cas9(アデノシンデアミナーゼ)]-[シチジンデアミナーゼ]-COOH;
NH2-[シチジンデアミナーゼ]-[Cas9(アデノシンデアミナーゼ)]-COOH;
NH2-[Cas9(シチジンデアミナーゼ)]-[アデノシンデアミナーゼ]-COOH;または
NH2-[アデノシンデアミナーゼ]-[Cas9(シチジンデアミナーゼ)]-COOH
いくつかの実施形態において、上記の一般的な構築で使用される「-」は、任意のリンカーの存在を示す。
様々な実施形態において、触媒ドメインは、アデノシンデアミナーゼ活性などのDNA修飾活性(例えば、デアミナーゼ活性)を有する。いくつかの実施形態では、アデノシンデアミナーゼはTadA(例えば、TadA7.10)である。いくつかの実施形態では、TadAはTadA*8である。いくつかの実施形態では、TadA*8はCas9内に融合され、シチジンデアミナーゼはC末端に融合されている。いくつかの実施形態では、TadA*8はCas9内に融合され、シチジンデアミナーゼはN末端に融合されている。いくつかの実施形態では、シチジンデアミナーゼはCas9内に融合され、TadA*8はC末端に融合されている。いくつかの実施形態では、シチジンデアミナーゼはCas9内に融合され、TadA*8はN末端に融合されている。TadA*8およびシチジンデアミナーゼおよびCas9を含む融合タンパク質の例示的構造は以下に提供される:
NH2-[Cas9(TadA*8)]-[シチジンデアミナーゼ]-COOH;
NH2-[シチジンデアミナーゼ]-[Cas9(TadA*8)]-COOH;
NH2-[Cas9(シチジンデアミナーゼ)]-[TadA*8]-COOH;または
NH2-[TadA*8]-[Cas9(シチジンデアミナーゼ)]-COOH
いくつかの実施形態において、上記の一般的な構築で使用される「-」は、任意のリンカーの存在を示す。
異種ポリペプチド(例えば、デアミナーゼ)は、例えばnapDNAbpが標的ポリペプチドおよびガイド核酸に結合するその能力を保持するように、適切な位置でnapDNAbp(例えば、Cas9またはCas12(例えば、Cas12b/C2c1))に挿入され得る。デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼまたはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、デアミナーゼ(例えば、塩基編集活性)の機能またはnapDNAbpの機能(例えば、標的核酸およびガイド核酸に結合する能力)を損なうことなくnapDNAbpに挿入され得る。デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼまたはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、napDNAbp中の、例えば非秩序的な領域、または結晶学的研究によって示される高温因子もしくはBファクターを含む領域に挿入され得る。低秩序的、非秩序的または不定型、例えば溶媒曝露領域およびループであるタンパク質の領域は、構造または機能を損なうことなく挿入のために使用され得る。デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼまたはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、napDNAbp中の柔軟なループ領域または溶媒曝露領域に挿入され得る。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼまたはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、Cas9またはCas12b/C2c1ポリペプチドの柔軟なループに挿入される。
いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼまたはアデノシンデアミナーゼおよびシチジンデアミナーゼ)の挿入位置は、Cas9ポリペプチドの結晶構造のBファクター分析によって決定される。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼまたはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、平均より高いBファクター(例えば、総タンパク質または非秩序的な領域を有するタンパク質ドメインと比較してさらに高いBファクター)を有するCas9ポリペプチドの領域中に挿入される。Bファクターまたは温度因子は、それらの平均的位置からの原子の揺らぎ(例えば、温度依存性の原子振動または結晶格子における静的無秩序の結果)を示し得る。骨格原子についての高いBファクター(例えば、平均より高いBファクター)は、比較的高い局所移動性を有する領域を示し得る。そのような領域は、構造または機能を損なうことなくデアミナーゼを挿入するために使用され得る。デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼまたはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、総タンパク質についての平均的Bファクターより50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%または200%を超えて大きいBファクターを有するCα原子を有する残基を含む位置に挿入され得る。デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼまたはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、残基を含むCas9タンパク質ドメインについての平均Bファクターより50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%または200%を超えて大きいBファクターを有するCα原子を有する残基を含む位置に挿入され得る。平均より高いBファクターを含むCas9ポリペプチド位置としては、例えば、上記のCas9参照配列における番号付けで残基768、792、1052、1015、1022、1026、1029、1067、1040、1054、1068、1246、1247および1248が挙げられる。平均より高いBファクターを含むCas9ポリペプチド領域としては、例えば、上記のCas9参照配列における番号付けで残基792-872、792-906および2-791が挙げられる。
異種ポリペプチド(例えば、デアミナーゼ)は:上記のCas9参照配列における番号付けで768、791、792、1015、1016、1022、1023、1026、1029、1040、1052、1054、1067、1068、1069、1246、1247および1248からなる群から選択されるアミノ酸残基、または別のCas9ポリペプチド中の対応するアミノ酸残基でnapDNAbpに挿入され得る。いくつかの実施形態では、異種ポリペプチドは、上記のCas9参照配列における番号付けでアミノ酸位置768-769、791-792、792-793、1015-1016、1022-1023、1026-1027、1029-1030、1040-1041、1052-1053、1054-1055、1067-1068、1068-1069、1247-1248もしくは1248-1249、またはそれらの対応するアミノ酸位置の間に挿入される。いくつかの実施形態では、異種ポリペプチドは、上記のCas9参照配列における番号付けでアミノ酸位置769-770、792-793、793-794、1016-1017、1023-1024、1027-1028、1030-1031、1041-1042、1053-1054、1055-1056、1068-1069、1069-1070、1248-1249もしくは1249-1250、またはそれらの対応するアミノ酸位置の間に挿入される。いくつかの実施形態では、異種ポリペプチドは:上記のCas9参照配列における番号付けで768、791、792、1015、1016、1022、1023、1026、1029、1040、1052、1054、1067、1068、1069、1246、1247および1248からなる群から選択されるアミノ酸残基、または別のCas9ポリペプチド中の対応するアミノ酸残基を置き換える。挿入位置に関して上記のCas9参照配列を参照することが、例示目的であることは理解されるべきである。本明細書において議論される挿入は、上記のCas9参照配列のCas9ポリペプチド配列に限定されず、バリアントCas9ポリペプチド、例えばCas9ニッカーゼ(nCas9)、ヌクレアーゼ不活Cas9 (dCas9)、ヌクレアーゼドメインを欠いているCas9バリアント、切詰型Cas9またはHNHドメインを部分的にまたは完全に欠いているCas9ドメイン、中の対応する位置での挿入を含む。
異種ポリペプチド(例えば、デアミナーゼ)は:上記のCas9参照配列における番号付けで768、792、1022、1026、1040、1068および1247からなる群から選択されるアミノ酸残基、または別のCas9ポリペプチド中の対応するアミノ酸残基でnapDNAbpに挿入され得る。いくつかの実施形態では、異種ポリペプチドは、上記のCas9参照配列における番号付けでアミノ酸位置768-769、792-793、1022-1023、1026-1027、1029-1030、1040-1041、1068-1069もしくは1247-1248、またはそれらの対応するアミノ酸位置の間に挿入される。いくつかの実施形態では、異種ポリペプチドは、上記のCas9参照配列における番号付けでアミノ酸位置769-770、793-794、1023-1024、1027-1028、1030-1031、1041-1042、1069-1070もしくは1248-1249、またはそれらの対応するアミノ酸位置の間に挿入される。いくつかの実施形態では、異種ポリペプチドは:上記のCas9参照配列における番号付けで768、792、1022、1026、1040、1068および1247からなる群から選択されるアミノ酸残基、または別のCas9ポリペプチド中の対応するアミノ酸残基を置き換える。
異種ポリペプチド(例えば、デアミナーゼ)は、本明細書に記載されるアミノ酸残基、または別のCas9ポリペプチド中の対応するアミノ酸残基でnapDNAbpに挿入され得る。ある実施形態では、異種ポリペプチド(例えば、デアミナーゼ)は:上記のCas9参照配列における番号付けで1002、1003、1025、1052-1056、1242-1247、1061-1077、943-947、686-691、569-578、530-539および1060-1077からなる群から選択されるアミノ酸残基、または別のCas9ポリペプチド中の対応するアミノ酸残基でnapDNAbpに挿入され得る。デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼまたはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、残基のN末端またはC末端に挿入され得る、または残基を置き換え得る。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼまたはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、残基のC末端に挿入される。
いくつかの実施形態では、アデノシンデアミナーゼ(例えば、TadA)は:上記のCas9参照配列における番号付けで1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052および1246からなる群から選択されるアミノ酸残基、または別のCas9ポリペプチド中の対応するアミノ酸残基に挿入される。いくつかの実施形態では、アデノシンデアミナーゼ(例えば、TadA)は、上記のCas9参照配列における番号付けで残基792-872、792-906もしくは2-791、または別のCas9ポリペプチド中の対応するアミノ酸残基の代わりに挿入される。いくつかの実施形態では、アデノシンデアミナーゼは:上記のCas9参照配列における番号付けで1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052および1246からなる群から選択されるアミノ酸、または別のCas9ポリペプチド中の対応するアミノ酸残基のN末端に挿入される。いくつかの実施形態では、アデノシンデアミナーゼは:上記のCas9参照配列における番号付けで1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052および1246からなる群から選択されるアミノ酸、または別のCas9ポリペプチド中の対応するアミノ酸残基のC末端に挿入される。いくつかの実施形態では、アデノシンデアミナーゼは:上記のCas9参照配列における番号付けで1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052および1246からなる群から選択されるアミノ酸、または別のCas9ポリペプチド中の対応するアミノ酸残基を置き換えるように挿入される。
いくつかの実施形態では、CBE(例えば、APOBEC1)は:上記のCas9参照配列における番号付けで1016、1023、1029、1040、1069および1247からなる群から選択されるアミノ酸残基、または別のCas9ポリペプチド中の対応するアミノ酸残基に挿入される。いくつかの実施形態では、ABEは:上記のCas9参照配列における番号付けで1016、1023、1029、1040、1069および1247からなる群から選択されるアミノ酸、または別のCas9ポリペプチド中の対応するアミノ酸残基のN末端に挿入される。いくつかの実施形態では、ABEは:上記のCas9参照配列における番号付けで1016、1023、1029、1040、1069および1247からなる群から選択されるアミノ酸、または別のCas9ポリペプチド中の対応するアミノ酸残基のC末端に挿入される。いくつかの実施形態では、ABEは:上記のCas9参照配列における番号付けで1016、1023、1029、1040、1069および1247からなる群から選択されるアミノ酸、または別のCas9ポリペプチド中の対応するアミノ酸残基を置き換えるように挿入される。
いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼまたはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列における番号付けでアミノ酸残基768、または別のCas9ポリペプチド中の対応するアミノ酸残基に挿入される。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼまたはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列における番号付けでアミノ酸残基768、または別のCas9ポリペプチド中の対応するアミノ酸残基のN末端に挿入される。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼまたはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列における番号付けでアミノ酸残基768、または別のCas9ポリペプチド中の対応するアミノ酸残基のC末端に挿入される。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼまたはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列における番号付けでアミノ酸残基768、または別のCas9ポリペプチド中の対応するアミノ酸残基を置き換えるように挿入される。
いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼまたはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列における番号付けでアミノ酸残基791もしくは別のCas9ポリペプチド中の対応するアミノ酸残基に挿入される、または上記のCas9参照配列における番号付けでアミノ酸残基792もしくは別のCas9ポリペプチド中の対応するアミノ酸残基に挿入される。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼまたはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列における番号付けでアミノ酸残基791もしくは別のCas9ポリペプチド中の対応するアミノ酸残基のN末端に挿入される、または上記のCas9参照配列における番号付けでアミノ酸792もしくは別のCas9ポリペプチド中の対応するアミノ酸残基のN末端に挿入される。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼまたはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列における番号付けでアミノ酸791もしくは別のCas9ポリペプチド中の対応するアミノ酸残基のC末端に挿入される、または上記のCas9参照配列における番号付けでアミノ酸792もしくは別のCas9ポリペプチド中の対応するアミノ酸残基のN末端に挿入される。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼまたはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列における番号付けでアミノ酸791もしくは別のCas9ポリペプチド中の対応するアミノ酸残基を置き換えるように挿入される、または上記のCas9参照配列における番号付けでアミノ酸792もしくは別のCas9ポリペプチド中の対応するアミノ酸残基を置き換えるように挿入される。
いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼまたはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列における番号付けでアミノ酸残基1016、または別のCas9ポリペプチド中の対応するアミノ酸残基に挿入される。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼまたはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列における番号付けでアミノ酸残基1016、または別のCas9ポリペプチド中の対応するアミノ酸残基のN末端に挿入される。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼまたはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列における番号付けでアミノ酸残基1016、または別のCas9ポリペプチド中の対応するアミノ酸残基のC末端に挿入される。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼまたはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列における番号付けでアミノ酸残基1016、または別のCas9ポリペプチド中の対応するアミノ酸残基を置き換えるように挿入される。
いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼまたはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列における番号付けでアミノ酸残基1022もしくは別のCas9ポリペプチド中の対応するアミノ酸残基に挿入される、または上記のCas9参照配列における番号付けでアミノ酸残基1023もしくは別のCas9ポリペプチド中の対応するアミノ酸残基に挿入される。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼまたはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列における番号付けでアミノ酸残基1022もしくは別のCas9ポリペプチド中の対応するアミノ酸残基のN末端に挿入される、または上記のCas9参照配列における番号付けでアミノ酸残基1023もしくは別のCas9ポリペプチド中の対応するアミノ酸残基のN末端に挿入される。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼまたはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列における番号付けでアミノ酸残基1022もしくは別のCas9ポリペプチド中の対応するアミノ酸残基のC末端に挿入される、または上記のCas9参照配列における番号付けでアミノ酸残基1023もしくは別のCas9ポリペプチド中の対応するアミノ酸残基のC末端に挿入される。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼまたはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列における番号付けでアミノ酸残基1022もしくは別のCas9ポリペプチド中の対応するアミノ酸残基を置き換えるように挿入される、または上記のCas9参照配列における番号付けでアミノ酸残基1023もしくは別のCas9ポリペプチド中の対応するアミノ酸残基を置き換えるように挿入される。
いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼまたはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列における番号付けでアミノ酸残基1026もしくは別のCas9ポリペプチド中の対応するアミノ酸残基に挿入される、または上記のCas9参照配列における番号付けでアミノ酸残基1029もしくは別のCas9ポリペプチド中の対応するアミノ酸残基に挿入される。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼまたはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列における番号付けでアミノ酸残基1026もしくは別のCas9ポリペプチド中の対応するアミノ酸残基のN末端に挿入される、または上記のCas9参照配列における番号付けでアミノ酸残基1029もしくは別のCas9ポリペプチド中の対応するアミノ酸残基のN末端に挿入される。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼまたはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列における番号付けでアミノ酸残基1026もしくは別のCas9ポリペプチド中の対応するアミノ酸残基のC末端に挿入される、または上記のCas9参照配列における番号付けでアミノ酸残基1029もしくは別のCas9ポリペプチド中の対応するアミノ酸残基のC末端に挿入される。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼまたはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列における番号付けでアミノ酸残基1026もしくは別のCas9ポリペプチド中の対応するアミノ酸残基を置き換えるように挿入される、または上記のCas9参照配列における番号付けでアミノ酸残基1029もしくは別のCas9ポリペプチド中の対応するアミノ酸残基を置き換えるように挿入される。
いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼまたはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列における番号付けでアミノ酸残基1040、または別のCas9ポリペプチド中の対応するアミノ酸残基に挿入される。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼまたはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列における番号付けでアミノ酸残基1040、または別のCas9ポリペプチド中の対応するアミノ酸残基のN末端に挿入される。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼまたはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列における番号付けでアミノ酸残基1040、または別のCas9ポリペプチド中の対応するアミノ酸残基のC末端に挿入される。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼまたはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列における番号付けでアミノ酸残基1040、または別のCas9ポリペプチド中の対応するアミノ酸残基を置き換えるように挿入される。
いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼまたはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列における番号付けでアミノ酸残基1052もしくは別のCas9ポリペプチド中の対応するアミノ酸残基に挿入される、または上記のCas9参照配列における番号付けでアミノ酸残基1054もしくは別のCas9ポリペプチド中の対応するアミノ酸残基に挿入される。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼまたはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列における番号付けでアミノ酸残基1052もしくは別のCas9ポリペプチド中の対応するアミノ酸残基のN末端に挿入される、または上記のCas9参照配列における番号付けでアミノ酸残基1054もしくは別のCas9ポリペプチド中の対応するアミノ酸残基のN末端に挿入される。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼまたはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列における番号付けでアミノ酸残基1052もしくは別のCas9ポリペプチド中の対応するアミノ酸残基のC末端に挿入される、または上記のCas9参照配列における番号付けでアミノ酸残基1054もしくは別のCas9ポリペプチド中の対応するアミノ酸残基のC末端に挿入される。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼまたはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列における番号付けでアミノ酸残基1052もしくは別のCas9ポリペプチド中の対応するアミノ酸残基を置き換えるように挿入される、または上記のCas9参照配列における番号付けでアミノ酸残基1054もしくは別のCas9ポリペプチド中の対応するアミノ酸残基を置き換えるように挿入される。
いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼまたはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列における番号付けでアミノ酸残基1067もしくは別のCas9ポリペプチド中の対応するアミノ酸残基に挿入される、または上記のCas9参照配列における番号付けでアミノ酸残基1068もしくは別のCas9ポリペプチド中の対応するアミノ酸残基に挿入される、または上記のCas9参照配列における番号付けでアミノ酸残基1069もしくは別のCas9ポリペプチド中の対応するアミノ酸残基に挿入される。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼまたはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列における番号付けでアミノ酸残基1067もしくは別のCas9ポリペプチド中の対応するアミノ酸残基のN末端に挿入される、または上記のCas9参照配列における番号付けでアミノ酸残基1068もしくは別のCas9ポリペプチド中の対応するアミノ酸残基のN末端に挿入される、または上記のCas9参照配列における番号付けでアミノ酸残基1069もしくは別のCas9ポリペプチド中の対応するアミノ酸残基のN末端に挿入される。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼまたはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列における番号付けでアミノ酸残基1067もしくは別のCas9ポリペプチド中の対応するアミノ酸残基のC末端に挿入される、または上記のCas9参照配列における番号付けでアミノ酸残基1068もしくは別のCas9ポリペプチド中の対応するアミノ酸残基のC末端に挿入される、または上記のCas9参照配列における番号付けでアミノ酸残基1069もしくは別のCas9ポリペプチド中の対応するアミノ酸残基のC末端に挿入される。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼまたはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列における番号付けでアミノ酸残基1067もしくは別のCas9ポリペプチド中の対応するアミノ酸残基を置き換えるように挿入される、または上記のCas9参照配列における番号付けでアミノ酸残基1068もしくは別のCas9ポリペプチド中の対応するアミノ酸残基を置き換えるように挿入される、または上記のCas9参照配列における番号付けでアミノ酸残基1069もしくは別のCas9ポリペプチド中の対応するアミノ酸残基を置き換えるように挿入される。
いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼまたはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列における番号付けでアミノ酸残基1246もしくは別のCas9ポリペプチド中の対応するアミノ酸残基に挿入される、または上記のCas9参照配列における番号付けでアミノ酸残基1247もしくは別のCas9ポリペプチド中の対応するアミノ酸残基に挿入される、または上記のCas9参照配列における番号付けでアミノ酸残基1248もしくは別のCas9ポリペプチド中の対応するアミノ酸残基に挿入される。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼまたはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列における番号付けでアミノ酸残基1246もしくは別のCas9ポリペプチド中の対応するアミノ酸残基のN末端に挿入される、または上記のCas9参照配列における番号付けでアミノ酸残基1247もしくは別のCas9ポリペプチド中の対応するアミノ酸残基のN末端に挿入される、または上記のCas9参照配列における番号付けでアミノ酸残基1248もしくは別のCas9ポリペプチド中の対応するアミノ酸残基のN末端に挿入される。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼまたはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列における番号付けでアミノ酸残基1246もしくは別のCas9ポリペプチド中の対応するアミノ酸残基のC末端に挿入される、または上記のCas9参照配列における番号付けでアミノ酸残基1247もしくは別のCas9ポリペプチド中の対応するアミノ酸残基のC-末端に挿入される、または上記のCas9参照配列における番号付けでアミノ酸残基1248もしくは別のCas9ポリペプチド中の対応するアミノ酸残基のC-末端に挿入される。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼまたはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列における番号付けでアミノ酸残基1246もしくは別のCas9ポリペプチド中の対応するアミノ酸残基を置き換えるように挿入される、または上記のCas9参照配列における番号付けでアミノ酸残基1247もしくは別のCas9ポリペプチド中の対応するアミノ酸残基を置き換えるように挿入される、または上記のCas9参照配列における番号付けでアミノ酸残基1248もしくは別のCas9ポリペプチド中の対応するアミノ酸残基を置き換えるように挿入される。
いくつかの実施形態では、異種ポリペプチド(例えば、デアミナーゼ)は、Cas9ポリペプチドの柔軟なループに挿入される。柔軟なループ部分は、上記のCas9参照配列における番号付けで530-537、569-570、686-691、943-947、1002-1025、1052-1077、1232-1247もしくは1298-1300、または別のCas9ポリペプチド中の対応するアミノ酸残基からなる群から選択され得る。柔軟なループ部分は:上記のCas9参照配列における番号付けで1-529、538-568、580-685、692-942、948-1001、1026-1051、1078-1231もしくは1248-1297、または別のCas9ポリペプチド中の対応するアミノ酸残基からなる群から選択され得る。
異種ポリペプチド(例えば、アデニンデアミナーゼ)は、上記のCas9参照配列における番号付けでアミノ酸残基: 1017-1069、1242-1247、1052-1056、1060-1077、1002-1003、943-947、530-537、568-579、686-691、1242-1247、1298-1300、1066-1077、1052-1056もしくは1060-1077または別のCas9ポリペプチド中の対応するアミノ酸残基に対応するCas9ポリペプチド領域に挿入され得る。
異種ポリペプチド(例えば、アデニンデアミナーゼ)は、Cas9ポリペプチドの欠失された領域の代わりに挿入され得る。欠失された領域は、Cas9ポリペプチドのN末端またはC末端部に対応し得る。いくつかの実施形態では、欠失された領域は、上記のCas9参照配列における番号付けで残基792-872、または別のCas9ポリペプチド中の対応するアミノ酸残基に対応する。いくつかの実施形態では、欠失された領域は、上記のCas9参照配列における番号付けで残基792-906、または別のCas9ポリペプチド中の対応するアミノ酸残基に対応する。いくつかの実施形態では、欠失された領域は、上記のCas9参照配列における番号付けで残基2-791、または別のCas9ポリペプチド中の対応するアミノ酸残基に対応する。いくつかの実施形態では、欠失された領域は、上記のCas9参照配列における番号付けで残基1017-1069、またはそれらの対応するアミノ酸残基に対応する。
例示的な内部融合塩基エディターは、以下の表10Aに提供される:
表10A:Cas9タンパク質における挿入遺伝子座
Figure 2022520081000077
異種ポリペプチド(例えば、デアミナーゼ)は、Cas9ポリペプチドの構造または機能ドメイン内に挿入され得る。異種ポリペプチド(例えば、デアミナーゼ)は、Cas9ポリペプチドの2つの構造または機能ドメイン間に挿入され得る。異種ポリペプチド(例えば、デアミナーゼ)は、Cas9ポリペプチドの構造または機能ドメインの代わりに、例えば、Cas9ポリペプチドからドメインを欠失させた後に、挿入され得る。Cas9ポリペプチドの構造または機能ドメインとして、例えば、RuvC I、RuvC II、RuvC III、Rec1、Rec2、PIまたはHNHが挙げられる。
いくつかの実施形態では、Cas9ポリペプチドは:RuvC I、RuvC II、RuvC III、Rec1、Rec2、PIまたはHNHドメインからなる群から選択される1つ以上のドメインを欠いている。いくつかの実施形態では、Cas9ポリペプチドは、ヌクレアーゼドメインを欠いている。いくつかの実施形態では、Cas9ポリペプチドは、HNHドメインを欠いている。いくつかの実施形態では、Cas9ポリペプチドは、Cas9ポリペプチドのHNH活性が低減するまたは消失するようにHNHドメインの一部を欠いている。いくつかの実施形態では、Cas9ポリペプチドは、ヌクレアーゼドメインが欠失され、デアミナーゼはヌクレアーゼドメインを置き換えるように挿入される。いくつかの実施形態では、HNHドメインは欠失され、デアミナーゼはその場所に挿入される。いくつかの実施形態では、RuvCドメインの1つ以上は欠失され、デアミナーゼはその場所に挿入される。
異種ポリペプチドを含む融合タンパク質は、napDNAbpのN末端およびC末端断片によって隣接され得る。いくつかの実施形態では、融合タンパク質は、Cas9ポリペプチドのN末端断片およびC末端断片によって隣接されるデアミナーゼを含む。N末端断片またはC末端断片は、標的ポリヌクレオチド配列に結合できる。N末端断片のC末端またはC末端断片のN末端は、Cas9ポリペプチドの柔軟なループの一部を含み得る。N末端断片のC末端またはC末端断片のN末端は、Cas9ポリペプチドのアルファヘリックス構造の一部を含み得る。N末端断片またはC末端断片は、DNA結合ドメインを含み得る。N末端断片またはC末端断片は、RuvCドメインを含み得る。N末端断片またはC末端断片は、HNHドメインを含み得る。いくつかの実施形態では、N末端断片およびC末端断片のいずれもHNHドメインを含まない。
いくつかの実施形態では、N末端Cas9断片のC末端は、融合タンパク質が標的核酸塩基を脱アミノ化する場合に、標的核酸塩基に近接しているアミノ酸を含む。いくつかの実施形態では、C末端Cas9断片のN末端は、融合タンパク質が標的核酸塩基を脱アミノ化する場合に、標的核酸塩基に近接しているアミノ酸を含む。異なるデアミナーゼの挿入位置は、標的核酸塩基と、N末端Cas9断片のC末端またはC末端Cas9断片のN末端中のアミノ酸との間を近接にするために異なっていてよい。例えば、ABEの挿入位置は:上記のCas9参照配列における番号付けで1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052および1246からなる群から選択されるアミノ酸残基または別のCas9ポリペプチド中の対応するアミノ酸残基であってよい。
融合タンパク質のN末端Cas9断片(すなわち、融合タンパク質中のデアミナーゼに隣接しているN末端Cas9断片)は、Cas9ポリペプチドのN末端を含み得る。融合タンパク質のN末端Cas9断片は、少なくとも約:100、200、300、400、500、600、700、800、900、1000、1100、1200または1300アミノ酸の長さを含み得る。融合タンパク質のN末端Cas9断片は、上記のCas9参照配列における番号付けでアミノ酸残基: 1-56、1-95、1-200、1-300、1-400、1-500、1-600、1-700、1-718、1-765、1-780、1-906、1-918もしくは1-1100または別のCas9ポリペプチド中の対応するアミノ酸残基に対応する配列を含み得る。N末端Cas9断片は:少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%または少なくとも99.5%配列同一性を、上記のCas9参照配列における番号付けでアミノ酸残基:1-56、1-95、1-200、1-300、1-400、1-500、1-600、1-700、1-718、1-765、1-780、1-906、1-918もしくは1-1100または別のCas9ポリペプチド中の対応するアミノ酸残基に有する配列を含み得る。
融合タンパク質のC末端Cas9断片(すなわち、融合タンパク質中のデアミナーゼに隣接するC末端Cas9断片)は、Cas9ポリペプチドのC末端を含み得る。融合タンパク質のC末端Cas9断片は、少なくとも約:100、200、300、400、500、600、700、800、900、1000、1100、1200または1300アミノ酸の長さを含み得る。融合タンパク質のC末端Cas9断片は、上記のCas9参照配列における番号付けでアミノ酸残基:1099-1368、918-1368、906-1368、780-1368、765-1368、718-1368、94-1368もしくは56-1368または別のCas9ポリペプチド中の対応するアミノ酸残基に対応する配列を含み得る。N末端Cas9断片は:少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%または少なくとも99.5%配列同一性を、上記のCas9参照配列における番号付けでアミノ酸残基:1099-1368、918-1368、906-1368、780-1368、765-1368、718-1368、94-1368もしくは56-1368または別のCas9ポリペプチド中の対応するアミノ酸残基に有する配列を含み得る。
合わせて、融合タンパク質のN末端Cas9断片およびC末端Cas9断片は、全長の天然に存在するCas9ポリペプチド配列、例えば、上記Cas9参照配列に記載されるものに対応しなくてもよい。
本明細書に記載される融合タンパク質は、ゲノムワイドな目的外脱アミノ化の低減など、非標的部位(例えば、オフターゲット部位)での脱アミノ化が低減した標的化脱アミノ化をもたらし得る。本明細書に記載される融合タンパク質は、非標的部位でのバイスタンダー脱アミノ化が低減した標的脱アミノ化をもたらし得る。望ましくない脱アミノ化またはオフターゲット脱アミノ化は、例えば、Cas9ポリペプチドのN末端またはC末端に融合されたデアミナーゼを含む末端融合タンパク質と比較して、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%または少なくとも99%低減し得る。望ましくない脱アミノ化またはオフターゲット脱アミノ化は、例えば、Cas9ポリペプチドのN末端またはC末端に融合されたデアミナーゼを含む末端融合タンパク質と比較して、少なくとも1倍、少なくとも2分の1、少なくとも3分の1、少なくとも4分の1、少なくとも5分の1、少なくとも10分の1、少なくとも15分の1、少なくとも20分の1、少なくとも30分の1、少なくとも40分の1、少なくとも50分の1、少なくとも60分の1、少なくとも70分の1、少なくとも80分の1、少なくとも90分の1または少なくとも100分の1に低減され得る。
いくつかの実施形態では、融合タンパク質のデアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼまたはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、Rループの範囲内の2以下の核酸塩基を脱アミノ化する。いくつかの実施形態では、融合タンパク質のデアミナーゼは、Rループの範囲内の3以下の核酸塩基を脱アミノ化する。いくつかの実施形態では、融合タンパク質のデアミナーゼは、Rループの範囲内の2、3、4、5、6、7、8、9または10以下の核酸塩基を脱アミノ化する。Rループは、DNA:RNAバイブリッド、DNA:DNAまたはRNA: RNA相補的構造および1本鎖DNAと会合したものを含む3本鎖核酸構造である。本明細書で使用される場合、Rループは、標的ポリヌクレオチドがCRISPR複合体または塩基編集複合体と接触する場合に形成され得る、ここでガイドポリヌクレオチド、例えばガイドRNAの一部は、標的ポリヌクレオチド、例えば標的DNAの一部とハイブリダイズし、置き換える。いくつかの実施形態では、Rループは、スペーサー配列および標的DNA相補配列のハイブリダイズ領域を含む。Rループ領域は、長さが約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49または50核酸塩基対であり得る。いくつかの実施形態では、Rループ領域は、長さが約20核酸塩基対である。本明細書で使用される場合、Rループ領域は、ガイドポリヌクレオチドとハイブリダイズする標的DNA鎖に限定されないことは理解されるべきである。例えば、Rループ領域内の標的核酸塩基の編集は、ガイドRNAへの相補鎖を含むDNA鎖に対してであり得る、またはガイドRNAへの相補鎖の反対の鎖であるDNA鎖に対してであり得る。いくつかの実施形態では、Rループの領域中の編集は、標的DNA配列中のガイドRNAへの非相補鎖(プロトスペーサー鎖)上の核酸塩基を編集することを含む。
本明細書に記載される融合タンパク質は、標準塩基編集とは異なる編集ウィンドウにおける標的脱アミノ化をもたらし得る。いくつかの実施形態では、標的核酸塩基は、標的ポリヌクレオチド配列中のPAM配列の約1から約20塩基上流にある。いくつかの実施形態では、標的核酸塩基は、標的ポリヌクレオチド配列中のPAM配列の約2から約12塩基上流にある。いくつかの実施形態では、標的核酸塩基は、約1から9塩基対、約2から10塩基対、約3から11塩基対、約4から12塩基対、約5から13塩基対、約6から14塩基対、約7から15塩基対、約8から16塩基対、約9から17塩基対、約10から18塩基対、約11から19塩基対、約12から20塩基対、約1から7塩基対、約2から8塩基対、約3から9塩基対、約4から10塩基対、約5から11塩基対、約6から12塩基対、約7から13塩基対、約8から14塩基対、約9から15塩基対、約10から16塩基対、約11から17塩基対、約12から18塩基対、約13から19塩基対、約14から20塩基対、約1から5塩基対、約2から6塩基対、約3から7塩基対、約4から8塩基対、約5から9塩基対、約6から10塩基対、約7から11塩基対、約8から12塩基対、約9から13塩基対、約10から14塩基対、約11から15塩基対、約12から16塩基対、約13から17塩基対、約14から18塩基対、約15から19塩基対、約16から20塩基対、約1から3塩基対、約2から4塩基対、約3から5塩基対、約4から6塩基対、約5から7塩基対、約6から8塩基対、約7から9塩基対、約8から10塩基対、約9から11塩基対、約10から12塩基対、約11から13塩基対、約12から14塩基対、約13から15塩基対、約14から16塩基対、約15から17塩基対、約16から18塩基対、約17から19塩基対、約18から20塩基対、PAM配列から離れているまたは上流にある。いくつかの実施形態では、標的核酸塩基は、約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20またはこれを超える塩基対、PAM配列から離れているまたは上流にある。いくつかの実施形態では、標的核酸塩基は、約1、2、3、4、5、6、7、8または9塩基対PAM配列の上流にある。いくつかの実施形態では、標的核酸塩基は、約2、3、4または6塩基対、PAM配列の上流にある。
融合タンパク質は、複数の異種ポリペプチドを含み得る。例えば、融合タンパク質は、1つ以上のUGIドメインおよび/または1つ以上の核局在化シグナルをさらに含み得る。2つ以上の異種ドメインは、タンデムに挿入され得る。2つ以上の異種ドメインは、それらがNapDNAbp中でタンデムではないような位置に挿入され得る。
融合タンパク質は、デアミナーゼとnapDNAbpポリペプチドとの間にリンカーを含み得る。リンカーは、ペプチドまたは非ペプチドリンカーであり得る。例えば、リンカーは、XTEN、(GGGS)n、(GGGGS)n、(G)n、(EAAAK)n、(GGS)n、SGSETPGTSESATPESであり得る。いくつかの実施形態では、融合タンパク質は、N末端Cas9断片とデアミナーゼとの間にリンカーを含む。いくつかの実施形態では、融合タンパク質は、C末端Cas9断片とデアミナーゼとの間にリンカーを含む。いくつかの実施形態では、napDNAbpのN末端およびC末端断片は、リンカーを用いてデアミナーゼに連結されている。いくつかの実施形態では、N末端およびC末端断片はリンカーを含まずにデアミナーゼドメインに繋がれている。いくつかの実施形態では、融合タンパク質は、N末端Cas9断片とデアミナーゼとの間にリンカーを含むが、C末端Cas9断片とデアミナーゼとの間にリンカーを含まない。いくつかの実施形態では、融合タンパク質は、C末端Cas9断片とデアミナーゼとの間にリンカーを含むが、N末端Cas9断片とデアミナーゼの間にはリンカーを含まない。
いくつかの実施形態では、融合タンパク質中のnapDNAbpは、Cas12ポリペプチド、例えばCas12b/C2c1、またはその断片である。Cas12ポリペプチドは、バリアントCas12ポリペプチドであり得る。他の実施形態では、Cas12ポリペプチドのNまたはC末端断片は、核酸プログラム可能なDNA結合ドメインまたはRuvCドメインを含む。他の実施形態では、融合タンパク質は、Cas12ポリペプチドと触媒ドメインとの間にリンカーを含む。他の実施形態では、リンカーのアミノ酸配列は、GGSGGSまたはGSSGSETPGTSESATPESSGである。他の実施形態では、リンカーは、剛性の高いリンカーである。上記の態様の他の実施形態では、リンカーは、GGAGGCTCTGGAGGAAGCまたはGGCTCTTCTGGATCTGAAACACCTGGCACAAGCGAGAGCGCCACCCCTGAGAGCTCTGGCによってコードされる。
Cas12ポリペプチドのNおよびC末端断片によって隣接される異種触媒ドメインを含む融合タンパク質は、本明細書に記載される方法での塩基編集のためにも有用である。Cas12および1つ以上のデアミナーゼドメイン、例えばアデノシンデアミナーゼを含む、またはCas12配列によって隣接されるアデノシンデアミナーゼドメインを含む融合タンパク質は、標的配列の高度に特異的で効率的な塩基編集のためにも有用である。ある実施形態では、キメラCas12融合タンパク質は、Cas12ポリペプチド内に挿入された異種触媒ドメイン(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼまたはアデノシンデアミナーゼおよびシチジンデアミナーゼ)を含む。いくつかの実施形態では、融合タンパク質は、Cas12内に挿入されたアデノシンデアミナーゼドメインおよびシチジンデアミナーゼドメインを含む。いくつかの実施形態では、アデノシンデアミナーゼは、Cas12内に融合され、シチジンデアミナーゼはC末端に融合されている。いくつかの実施形態では、アデノシンデアミナーゼはCas12内に融合され、シチジンデアミナーゼはN末端に融合されている。いくつかの実施形態では、シチジンデアミナーゼはCas12内に融合され、アデノシンデアミナーゼはC末端に融合されている。いくつかの実施形態では、シチジンデアミナーゼはCas12内に融合され、アデノシンデアミナーゼはN末端に融合されている。アデノシンデアミナーゼおよびシチジンデアミナーゼおよびCas12を含む融合タンパク質の例示的構造は、以下に提供される:
NH2-[Cas12(アデノシンデアミナーゼ)]-[シチジンデアミナーゼ]-COOH;
NH2-[シチジンデアミナーゼ]-[Cas12(アデノシンデアミナーゼ)]-COOH;
NH2-[Cas12(シチジンデアミナーゼ)]-[アデノシンデアミナーゼ]-COOH;または
NH2-[アデノシンデアミナーゼ]-[Cas12(シチジンデアミナーゼ)]-COOH;
いくつかの実施形態において、上記の一般的な構築で使用される「-」は、任意のリンカーの存在を示す。
様々な実施形態では、触媒ドメインは、DNA修飾活性(例えば、デアミナーゼ活性)、アデノシンデアミナーゼ活性などを有する。いくつかの実施形態では、アデノシンデアミナーゼはTadA(例えば、TadA7.10)である。いくつかの実施形態では、TadAはTadA*8である。いくつかの実施形態では、TadA*8はCas12内に融合され、シチジンデアミナーゼはC末端に融合されている。いくつかの実施形態では、TadA*8はCas12内に融合され、シチジンデアミナーゼはN末端に融合されている。いくつかの実施形態では、シチジンデアミナーゼは、Cas12内に融合され、TadA*8はC末端に融合されている。いくつかの実施形態では、シチジンデアミナーゼはCas12内に融合され、TadA*8はN末端に融合されている。TadA*8およびシチジンデアミナーゼおよびCas12を含む融合タンパク質の例示的構造は、以下に提供される:
N-[Cas12(TadA*8)]-[シチジンデアミナーゼ]-C;
N-[シチジンデアミナーゼ]-[Cas12(TadA*8)]-C;
N-[Cas12(シチジンデアミナーゼ)]-[TadA*8]-C;または
N-[TadA*8]-[Cas12(シチジンデアミナーゼ)]-C
いくつかの実施形態において、上記の一般的な構築で使用される「-」は、任意のリンカーの存在を示す。
他の実施形態では、融合タンパク質は、1つ以上の触媒ドメインを含む。他の実施形態では、1つ以上の触媒ドメインの少なくとも1つは、Cas12ポリペプチド内に挿入される、またはCas12 N末端もしくはC末端に融合される。他の実施形態では、1つ以上の触媒ドメインの少なくとも1つは、Cas12ポリペプチドのループ、アルファヘリックス領域、不定型部分または溶媒露出部分内に挿入される。他の実施形態では、Cas12ポリペプチドは、Cas12a、Cas12b、Cas12c、Cas12d、Cas12e、Cas12g、Cas12hまたはCas12iである。他の実施形態では、Cas12ポリペプチドは、Bacillus hisashii Cas12b、Bacillus thermoamylovorans Cas12b、Bacillus sp. V3-13 Cas12bまたはAlicyclobacillus acidiphilus Cas12bに対して少なくとも約85%アミノ酸配列同一性を有する。他の実施形態では、Cas12ポリペプチドは、Bacillus hisashii Cas12b、Bacillus thermoamylovorans Cas12b、Bacillus sp. V3-13 Cas12bまたはAlicyclobacillus acidiphilus Cas12bに対して少なくとも約90%アミノ酸配列同一性を有する。他の実施形態では、Cas12ポリペプチドは、Bacillus hisashii Cas12b、Bacillus thermoamylovorans Cas12b、Bacillus sp. V3-13 Cas12bまたはAlicyclobacillus acidiphilus Cas12bに対して少なくとも約95%アミノ酸配列同一性を有する。他の実施形態では、Cas12ポリペプチドは、Bacillus hisashii Cas12b、Bacillus thermoamylovorans Cas12b、Bacillus sp. V3-13 Cas12bまたはAlicyclobacillus acidiphilus Cas12bの断片を含むまたはそれから本質的になる。
他の実施形態では、触媒ドメインは、BhCas12bのアミノ酸位置153-154、255-256、306-307、980-981、1019-1020、534-535、604-605もしくは344-345、またはCas12a、Cas12c、Cas12d、Cas12e、Cas12g、Cas12hもしくはCas12iの対応するアミノ酸残基の間に挿入される。他の実施形態では、触媒ドメインは、BhCas12bのアミノ酸P153とS154との間に挿入される。他の実施形態では、触媒ドメインは、BhCas12bのアミノ酸K255とE256との間に挿入される。他の実施形態では、触媒ドメインは、BhCas12bのアミノ酸D980とG981との間に挿入される。他の実施形態では、触媒ドメインは、BhCas12bのアミノ酸K1019とL1020との間に挿入される。他の実施形態では、触媒ドメインは、BhCas12bのアミノ酸F534とP535との間に挿入される。他の実施形態では、触媒ドメインは、BhCas12bのアミノ酸K604とG605との間に挿入される。他の実施形態では、触媒ドメインは、BhCas12bのアミノ酸H344とF345との間に挿入される。他の実施形態では、触媒ドメインは、BvCas12bのアミノ酸位置147と148、248と249、299と300、991と992もしくは1031と1032との間に、またはCas12a、Cas12c、Cas12d、Cas12e、Cas12g、Cas12hもしくはCas12iの対応するアミノ酸残基の間に挿入される。他の実施形態では、触媒ドメインは、BvCas12bのアミノ酸P147とD148との間に挿入される。他の実施形態では、触媒ドメインは、BvCas12bのアミノ酸G248とG249との間に挿入される。他の実施形態では、触媒ドメインは、BvCas12bのアミノ酸P299とE300との間に挿入される。他の実施形態では、触媒ドメインは、BvCas12bのアミノ酸G991とE992との間に挿入される。他の実施形態では、触媒ドメインは、BvCas12bのアミノ酸K1031とM1032との間に挿入される。他の実施形態では、触媒ドメインは、AaCas12bのアミノ酸位置157と158、258と259、310と311、1008と1009もしくは1044と1045との間、またはCas12a、Cas12c、Cas12d、Cas12e、Cas12g、Cas12hもしくはCas12iの対応するアミノ酸残基の間に挿入される。他の実施形態では、触媒ドメインは、AaCas12bのアミノ酸P157とG158との間に挿入される。他の実施形態では、触媒ドメインは、AaCas12bのアミノ酸V258とG259との間に挿入される。他の実施形態では、触媒ドメインは、AaCas12bのアミノ酸D310とP311との間に挿入される。他の実施形態では、触媒ドメインは、AaCas12bのアミノ酸G1008とE1009との間に挿入される。他の実施形態では、触媒ドメインは、AaCas12bのアミノ酸G1044とK1045との間に挿入される。
他の実施形態では、融合タンパク質は、核局在化シグナル(例えば、二部分核局在化シグナル)を含む。他の実施形態では、核局在化シグナルのアミノ酸配列は、MAPKKKRKVGIHGVPAAである。上記の態様の他の実施形態では、核局在化シグナルは、以下の配列によってコードされる:ATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCC。他の実施形態では、Cas12bポリペプチドは、RuvCドメインの触媒活性を抑制する突然変異を含む。他の実施形態では、Cas12bポリペプチドは、D574A、D829Aおよび/またはD952A突然変異を含む。他の実施形態では、融合タンパク質は、タグ(例えば、インフルエンザヘマグルチニンタグ)をさらに含む。
いくつかの実施形態では、融合タンパク質は、内部で融合された核酸塩基編集ドメイン(例えば、デアミナーゼドメイン、例えばアデノシンデアミナーゼドメインの全部または一部)を含むnapDNAbpドメイン(例えば、Cas12に由来するドメイン)を含む。いくつかの実施形態では、napDNAbpはCas12bである。いくつかの実施形態では、塩基エディターは、以下の表に提供される遺伝子座に挿入された内部で融合されたTadA*8ドメインを含むBhCas12bドメインを含む。
表10B:Cas12bタンパク質における挿入遺伝子座
Figure 2022520081000078
非限定的例の方法により、アデノシンデアミナーゼ(例えば、ABE8.13)は、核酸配列を効果的に編集する融合タンパク質(例えば、ABE8.13-BhCas12b)を産生するようにBhCas12bに挿入され得る。
いくつかの実施形態では、本明細書において記載される塩基編集システムは、Cas9に挿入されたTadAを有するABEを含む。Cas9に挿入されたTadAを有する関連するABEの配列を提供する。
101 Cas9 TadAins 1015
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVGSSGSETPGTSESATPESSGSEVEFSHEYWMRHAL
TLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQG
GLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGS
LMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSST
DYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
102 Cas9 TadAins 1022
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIGSSGSETPGTSESATPESSGSEVEFSHE
YWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAE
IMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNA
KTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQ
KKAQSSTDAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
103 Cas9 TadAins 1029
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGSSGSETPGTSESATPESSGS
EVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLH
DPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRV
VFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMP
RQVFNAQKKAQSSTDGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
103 Cas9 TadAins 1040
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSGSSGSETPGT
SESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVI
GEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCA
GAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADEC
AALLCYFFRMPRQVFNAQKKAQSSTDNIMNFFKTEITLANGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
105 Cas9 TadAins 1068
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGEGSSGSETPGTSESATPESSGSEVEFSHEYWMR
HALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMAL
RQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGA
AGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQ
SSTDTGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
106 Cas9 TadAins 1247
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGGSS
GSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVL
VLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTF
EPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITE
GILADECAALLCYFFRMPRQVFNAQKKAQSSTDSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
107 Cas9 TadAins 1054
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDERE
VPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLID
ATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMN
HRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
108 Cas9 TadAins 1026
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEGSSGSETPGTSESATPESSGSEVE
FSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPT
AHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFG
VRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQV
FNAQKKAQSSTDQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
109 Cas9 TadAins 768
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQGSSGSETPGTSESATPESSGSEVEFSHEYWMR
HALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMAL
RQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGA
AGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRTTQKGQKNSR
ERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQEL
DINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKK
MKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQIT
KHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREI
NNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQE
IGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGR
DFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDP
KKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNP
IDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELAL
PSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSK
RVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFD
TTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
110.1 Cas9 TadAins 1250
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPG
SSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGA
VLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYV
TFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEI
TEGILADECAALLCYFFRMPREDNEQKQLFVEQHKHYLDEIIEQISEFSK
RVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFD
TTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
110.2 Cas9 TadAins 1250
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPG
SSGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVP
VGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDAT
LYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHR
VEITEGILADECAALLCYFFRMPREDNEQKQLFVEQHKHYLDEIIEQISE
FSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFK
YFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
110.3 Cas9 TadAins 1250
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPG
SSGSSGSETPGTSESATPESGSSSGSEVEFSHEYWMRHALTLAKRARDER
EVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLI
DATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGM
NHRVEITEGILADECAALLCYFFRMPREDNEQKQLFVEQHKHYLDEIIEQ
ISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPA
AFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
110.4 Cas9 TadAins 1250
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPG
SSGSSGSETPGTSESATPESGSSSGSEVEFSHEYWMRHALTLAKRARDER
EVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLI
DATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGM
NHRVEITEGILADECAALLCYFFRMRREDNEQKQLFVEQHKHYLDEIIEQ
ISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPA
AFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
110.5 Cas9 TadAins 1249
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSGS
SGSSGSETPGTSESATPESGSSSGSEVEFSHEYWMRHALTLAKRARDERE
VPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLID
ATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMN
HRVEITEGILADECAALLCYFFRMRRPEDNEQKQLFVEQHKHYLDEIIEQ
ISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPA
AFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
110.5 Cas9 TadAinsデルタ59-66 1250
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPG
SSGSSGSETPGTSESATPESGSSGSEVEFSHEYWMRHALTLAKRARDERE
VPVGAVLVLNNRVIGEGWNRAHAEIMALRQGGLVMQNYRLIDATLYVTFE
PCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEG
ILADECAALLCYFFRMPRQVFNAQKKAQSSTDEDNEQKQLFVEQHKHYLD
EIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTN
LGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGG
D
110.6 Cas9 TadAins 1251
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPE
GSSGSSGSETPGTSESATPESGSSSGSEVEFSHEYWMRHALTLAKRARDE
REVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRL
IDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPG
MNHRVEITEGILADECAALLCYFFRMRRDNEQKQLFVEQHKHYLDEIIEQ
ISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPA
AFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
110.7 Cas9 TadAins 1252
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPE
DGSSGSSGSETPGTSESATPESGSSSGSEVEFSHEYWMRHALTLAKRARD
EREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYR
LIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYP
GMNHRVEITEGILADECAALLCYFFRMRRNEQKQLFVEQHKHYLDEIIEQ
ISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPA
AFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
110.8 Cas9 TadAinsデルタ59-66 C切詰型1250
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPG
SSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGA
VLVLNNRVIGEGWNRAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMC
AGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADE
CAALLCYFFRMPRQEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADA
NLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKR
YTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
111.1 Cas9 TadAins 997
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALSHE
YWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAE
IMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNA
KTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQ
KKAQSSTDGSSGSETPGTSESATPESSGIKKYPKLESEFVYGDYKVYDVR
KMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGET
GEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKL
IARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIM
ERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGE
LQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEI
IEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLG
APAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
111.2 Cas9 TadAins 997
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALSHE
YWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAE
IMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNA
KTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQ
KKAQSSTDGSSGSSGSETPGTSESATPESSGGSSIKKYPKLESEFVYGDY
KVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLI
ETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPK
RNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKEL
LGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRM
LASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHK
HYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLF
TLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLS
QLGGD
112 デルタHNH TadA
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSEVEFSHE
YWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAE
IMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNA
KTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQ
KKAQSSTDGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDEND
KLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTAL
IKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFK
TEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKK
TEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVA
KVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIK
LPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKG
SPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKH
RDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATL
IHQSITGLYETRIDLSQLGGD
113 N末端単一TadAヘリックス切詰165-末端
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIG
LHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIG
RVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFR
MPRSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSV
GWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKR
TARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERH
PIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRG
HFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARL
SKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQL
SKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAP
LSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGG
ASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHL
GELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMT
RKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYE
YFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKE
DYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDIL
EDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKL
INGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQ
GDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARE
NQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYL
QNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGK
SDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGF
IKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDF
RKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVY
DVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETN
GETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNS
DKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGI
TIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLAS
AGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYL
DEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLT
NLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLG
GD
114 N末端単一TadAヘリックス切詰165-末端デルタ59-65
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRTAH
AEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVR
NAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRSGGS
SGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITD
EYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYT
RRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIV
DEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGD
LNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLE
NLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDD
DLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIK
RYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFY
KFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAIL
RRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETI
TPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNE
LTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIE
CFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTL
TLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDK
QSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEH
IANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKG
QKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMY
VDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSE
EVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVE
TRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFY
KVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIA
KSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIV
WDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARK
KDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSS
FEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKG
NELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQI
SEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAA
FKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
115.1 Cas9 TadAins1004
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREV
PVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDA
TLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNH
RVEITEGILADECAALLCYFFRMPRQLESEFVYGDYKVYDVRKMIAKSEQ
EIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKG
RDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWD
PKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKN
PIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELA
LPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFS
KRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYF
DTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
115.2 Cas9 TadAins1005
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDERE
VPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLID
ATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMN
HRVEITEGILADECAALLCYFFRMPRQESEFVYGDYKVYDVRKMIAKSEQ
EIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKG
RDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWD
PKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKN
PIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELA
LPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFS
KRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYF
DTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
115.3 Cas9 TadAins1006
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLEGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDER
EVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLI
DATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGM
NHRVEITEGILADECAALLCYFFRMPRQSEFVYGDYKVYDVRKMIAKSEQ
EIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKG
RDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWD
PKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKN
PIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELA
LPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFS
KRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYF
DTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
115.4 Cas9 TadAins1007
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDE
REVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRL
IDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPG
MNHRVEITEGILADECAALLCYFFRMPRQEFVYGDYKVYDVRKMIAKSEQ
EIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKG
RDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWD
PKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKN
PIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELA
LPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFS
KRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYF
DTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
116.1 Cas9 TadAins C末端切詰型2 792
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGGSSGSETP
GTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNR
VIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVM
CAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILAD
ECAALLCYFFRMPRQSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQE
LDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVK
KMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQI
TKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVRE
INNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQ
EIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKG
RDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWD
PKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKN
PIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELA
LPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFS
KRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYF
DTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
116.2 Cas9 TadAins C末端切詰型2 791
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSSGSETPG
TSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRV
IGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMC
AGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADE
CAALLCYFFRMPRQGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQE
LDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVK
KMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQI
TKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVRE
INNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQ
EIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKG
RDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWD
PKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKN
PIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELA
LPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFS
KRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYF
DTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
116.3 Cas9 TadAins C末端切詰型2 790
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKEGSSGSETPGT
SESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVI
GEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCA
GAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADEC
AALLCYFFRMPRQLGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQE
LDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVK
KMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQI
TKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVRE
INNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQ
EIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKG
RDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWD
PKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKN
PIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELA
LPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFS
KRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYF
DTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
117 Cas9デルタ1017-1069
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYSSGSEVEFSHEYWMRHALTLAKRARDEREVPVGA
VLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYV
TFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEI
TEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDGEIVWDKGRDFATVR
KVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGF
DSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEA
KGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVN
FLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILAD
ANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRK
RYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
118 Cas9 TadA-CP116ins 1067
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNMNHRVEITEGILADECAALLCYFFRMPRQVFNAQ
KKAQSSTDGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRAR
DEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNY
RLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHY
PGGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
119 Cas9 TadAins 701
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPV
GAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATL
YVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRV
EITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDLTFKEDIQKAQVS
GQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMA
RENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLY
YLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNR
GKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKA
GFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVS
DFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYK
VYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
120 Cas9 TadACP136ins 1248
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSMN
HRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDGSSGSETPGT
SESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVI
GEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCA
GAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
121 Cas9 TadACP136ins 1052
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLAMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDGSSGS
ETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVL
NNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEP
CVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGNGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
122 Cas9 TadACP136ins 1041
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSMNHRVEITEG
ILADECAALLCYFFRMPRQVFNAQKKAQSSTDGSSGSETPGTSESATPES
SGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAI
GLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRI
GRVVFGVRNAKTGAAGSLMDVLHYPGNIMNFFKTEITLANGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
123 Cas9 TadACP139ins 1299
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPE
DNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRMN
HRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDGSSGSETPGT
SESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVI
GEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCA
GAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
124 Cas9デルタ792-872 TadAins
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSEVEFSHE
YWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAE
IMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNA
KTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQ
KKAQSSTDEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKA
GFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVS
DFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYK
VYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
125 Cas9デルタ792-906 TadAins
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSEVEFSHE
YWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAE
IMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNA
KTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQ
KKAQSSTDGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDK
LIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALI
KKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKT
EITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKT
EVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAK
VEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKL
PKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGS
PEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHR
DKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLI
HQSITGLYETRIDLSQLGGD
126 TadA CP65ins 1003
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGR
VVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRM
PRQVFNAQKKAQSSTDGSSGSETPGTSESATPESSGSEVEFSHEYWMRHA
LTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPLESEFVYGDYK
VYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
127 TadA CP65ins 1016
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVM
CAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILAD
ECAALLCYFFRMPRQVFNAQKKAQSSTDGSSGSETPGTSESATPESSGSE
VEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHD
PYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
128 TadA CP65ins 1022
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMITAHAEIMALRQGGLVMQNYRLIDATLYV
TFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEI
TEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDGSSGSETPGTSESAT
PESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWN
RAIGLHDPAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
129 TadA CP65ins 1029
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEITAHAEIMALRQGGLVMQNYRL
IDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPG
MNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDGSSGSETP
GTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNR
VIGEGWNRAIGLHDPGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
130 TadA CP65ins 1041
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSTAHAEIMALR
QGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAA
GSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQS
STDGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREV
PVGAVLVLNNRVIGEGWNRAIGLHDPNIMNFFKTEITLANGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
131 TadA CP65ins 1054
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIG
RVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFR
MPRQVFNAQKKAQSSTDGSSGSETPGTSESATPESSGSEVEFSHEYWMRH
ALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
132 TadA CP65ins 1246
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGTAH
AEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVR
NAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFN
AQKKAQSSTDGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKR
ARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
いくつかの実施形態では、アデノシンデアミナーゼ塩基エディターは、TadAまたはそのバリアントを特定の位置でCas9ポリペプチドに挿入して生成された。
例示的に、さらに限定せずに、融合タンパク質は、国際PCT出願番号PCT/US2020/016285ならびに米国仮出願第62/852,228号および第62/852,224号に記載されており、その内容はその全体が参照により本明細書に組み込まれる。
[核酸を編集するための方法]
本開示のいくつかの態様は、核酸を編集するための方法を提供する。いくつかの実施形態では、方法は、タンパク質をコードする核酸分子(例えば、二本鎖DNA配列の塩基対)の核酸塩基を編集するための方法である。いくつかの実施形態では、方法は: a)核酸の標的領域(例えば、二本鎖DNA配列)を塩基エディターおよびガイド核酸(例えばgRNA)を含む複合体と接触させる工程、b) 前記標的領域の鎖分離を誘導する工程、c) 標的領域の一本鎖における前記標的核酸塩基対の第1の核酸塩基を第2の核酸塩基に変換する工程、およびd) nCas9を使用して前記標的領域の鎖を2本以上は切断することなく、第1の核酸塩基に相補的な第3の核酸塩基が、第2の核酸塩基に相補的な第4の核酸塩基に置換される工程を含む。いくつかの実施形態において、本方法は、核酸において20%未満のインデル形成をもたらす。いくつかの実施形態では、工程bが省略されることが理解されるべきである。いくつかの実施形態において、本方法は、19%未満、18%未満、16%未満、14%未満、12%未満、10%未満、8%未満、6%未満、4%未満、2%未満、1%未満、0.5%未満、0.2%未満、または0.1%未満のインデル形成をもたらす。いくつかの実施形態において、本方法は、第二の核酸塩基を、第四の核酸塩基に相補的な第五の核酸塩基で置き換え、それによって意図された編集塩基対(例えばG・CからA・T)を生成することをさらに含む。いくつかの実施形態では、意図された塩基対の少なくとも5%が編集される。いくつかの実施形態では、意図された塩基対の少なくとも10%、15%、20%、25%、30%、35%、40%、45%、または50%が編集される。
いくつかの実施形態において、標的ヌクレオチドにおける意図された生成物対意図されない生成物の比は、少なくとも2:1、少なくとも5:1、少なくとも10:1、少なくとも20:1、少なくとも30:1、少なくとも40:1、少なくとも50:1、少なくとも60:1、少なくとも70:1、少なくとも80:1、少なくとも90:1、少なくとも100:1、もしくは少なくとも200:1、またはそれ以上である。いくつかの実施形態において、意図された突然変異対インデル形成の比は、1:1超、10:1超、50:1超、100:1超、500:1超、もしくは1000:1超、またはそれ以上である。いくつかの実施形態において、切断された一本鎖(ニック鎖)が、ガイド核酸にハイブリダイズされる。いくつかの実施形態において、切断された一本鎖は、第一の核酸塩基を含む鎖とは反対の鎖である。いくつかの実施形態では、塩基エディターはdCas9ドメインを含む。いくつかの実施形態において、塩基エディターは、編集されていない鎖を保護または結合する。いくつかの実施形態において、意図される編集塩基対は、PAM部位の上流にある。いくつかの実施形態において、意図される編集塩基対は、PAM部位の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド上流である。いくつかの実施形態において、意図される編集塩基対は、PAM部位の下流にある。いくつかの実施形態において、意図される編集塩基対は、PAM部位の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド下流にある。いくつかの実施形態において、本方法は、正準(例えばNGG)PAMサイトを必要としない。いくつかの実施形態では、核酸塩基エディターはリンカーを含む。いくつかの実施形態において、リンカーは、長さが1~25アミノ酸である。いくつかの実施形態において、リンカーは、長さが5~20アミノ酸である。いくつかの実施形態において、リンカーは、長さが10、11、12、13、14、15、16、17、18、19、または20アミノ酸である。一実施形態において、リンカーは、長さが32アミノ酸である。別の実施形態では、「長いリンカー(long linker)」は、長さが少なくとも約60アミノ酸である。他の実施形態において、リンカーは、長さが約3~100アミノ酸である。いくつかの実施形態では、標的領域は標的ウィンドウを含み、標的ウィンドウは標的核酸塩基対を含む。いくつかの実施形態において、標的ウィンドウは、1~10ヌクレオチドを含む。いくつかの実施形態において、標的ウィンドウは、長さが1~9、1~8、1~7、1~6、1~5、1~4、1~3、1~2、または1ヌクレオチドである。いくつかの実施形態において、標的ウィンドウは、長さが1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチドである。いくつかの実施形態において、意図される編集塩基対は、標的ウィンドウ内にある。いくつかの実施形態において、標的ウィンドウは、意図される編集塩基対を含む。いくつかの実施形態において、本方法は、本明細書に提供される塩基エディターのいずれかを用いて実施される。
いくつかの実施形態において、本開示は、ヌクレオチドを編集するための方法(例えば、タンパク質をコードする遺伝子におけるSNP)を提供する。いくつかの実施形態において、本開示は、二本鎖DNA配列の核酸塩基対を編集するための方法を提供する。いくつかの実施形態において、本方法は、a) 二本鎖DNA配列の標的領域を、塩基エディターおよびガイド核酸(例えばgRNA)を含む複合体と接触させ、ここで、標的領域が標的核酸塩基対を含む、工程と、b) 上記標的領域の鎖分離を誘導する工程と、c) 標的領域の一本鎖における前記標的核酸塩基対の第一の核酸塩基を第二の核酸塩基に変換する工程と、d) 前記標的領域の一本を超えない数の鎖を切断する工程と、を含み、ここで、第一の核酸塩基に相補的な第三の核酸塩基が、第二の核酸塩基に相補的な第四の核酸塩基によって置き換えられ、第二の核酸塩基が、第四の核酸塩基に相補的な第五の核酸塩基によって置き換えられ、それによって、意図された編集塩基対を生成し、ここで意図された塩基対を生成する効率は少なくとも5%である。いくつかの実施形態では、工程bは省略されることが理解されるべきである。いくつかの実施形態では、意図された塩基対の少なくとも5%が編集される。いくつかの実施形態では、意図された塩基対の少なくとも10%、15%、20%、25%、30%、35%、40%、45%、または50%が編集される。いくつかの実施形態において、本方法は、19%未満、18%未満、16%未満、14%未満、12%未満、10%未満、8%未満、6%未満、4%未満、2%未満、1%未満、0.5%未満、0.2%未満、または0.1%未満のインデル形成を引き起こす。いくつかの実施形態において、標的ヌクレオチドにおける意図された生成物対意図されない生成物の比は、少なくとも2:1、少なくとも5:1、少なくとも10:1、少なくとも20:1、少なくとも30:1、少なくとも40:1、少なくとも50:1、少なくとも60:1、少なくとも70:1、少なくとも80:1、少なくとも90:1、少なくとも100:1、もしくは少なくとも200:1、またはそれ以上である。いくつかの実施形態において、意図された突然変異対インデル形成の比は、1:1超、10:1超、50:1超、100:1超、500:1超、もしくは1000:1超、またはそれ以上である。いくつかの実施形態において、切断された一本鎖が、ガイド核酸にハイブリダイズされる。いくつかの実施形態において、切断された一本鎖は、第一の核酸塩基を含む鎖とは反対の鎖である。いくつかの実施形態において、意図される編集塩基対は、PAM部位の上流にある。いくつかの実施形態において、意図される編集塩基対は、PAM部位の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド上流である。いくつかの実施形態において、意図される編集塩基対は、PAM部位の下流にある。いくつかの実施形態において、意図される編集塩基対は、PAM部位の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド下流にある。いくつかの実施形態において、本方法は、正準(例えばNGG)PAMサイトを必要としない。いくつかの実施形態において、リンカーは、長さが1~25アミノ酸である。いくつかの実施形態において、リンカーは、長さが5~20アミノ酸である。いくつかの実施形態において、リンカーは、長さが10、11、12、13、14、15、16、17、18、19、または20アミノ酸である。いくつかの実施形態では、標的領域は標的ウィンドウを含み、標的ウィンドウは標的核酸塩基対を含む。いくつかの実施形態において、標的ウィンドウは、1~10ヌクレオチドを含む。いくつかの実施形態において、標的ウィンドウは、長さが1~9、1~8、1~7、1~6、1~5、1~4、1~3、1~2、または1ヌクレオチドである。いくつかの実施形態において、標的ウィンドウは、長さが1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチドである。いくつかの実施形態において、意図される編集塩基対は、標的ウィンドウ内で起こる。いくつかの実施形態において、標的ウィンドウは、意図される編集塩基対を含む。いくつかの実施形態において、核酸塩基エディターは、本明細書に提供される塩基エディターのいずれかである。
[宿主細胞における融合タンパク質の発現]
アデノシンデアミナーゼバリアントを含む本開示の融合タンパク質は、当業者に知られるルーチンの方法を使用して、細菌細胞、酵母細胞、真菌細胞、昆虫細胞、植物細胞、および動物細胞を含むがこれらに限定されない事実上全ての目的の宿主細胞において発現させることができる。例えば、本開示のアデノシンデアミナーゼをコードするDNAは、cDNA配列に基づいてCDSの上流および下流の適切なプライマーを設計することによってクローニングすることができる。クローニングされたDNAは、直接的に、または所望の場合には制限酵素で消化した後に、または適切なリンカーおよび/もしくは核局在化シグナルを付加した後に、塩基編集系の1つまたは複数のさらなる成分をコードするDNAとライゲーションされ得る。塩基編集系は、宿主細胞において翻訳されて、複合体を形成する。
本明細書に記載されるタンパク質ドメインをコードするDNAは、DNAを化学合成することによって、または、PCR法およびGibsonアセンブリ法を利用して、合成された部分的にオーバーラップするオリゴDNA短鎖を結合して、完全長のそれをコードするDNAを構築することによって、得ることができる。化学合成またはPCR法もしくはGibsonアセンブリ法の組合せによる完全長DNAの構築の利点は、使用されるコドンが、DNAを導入する宿主に従って、完全長CDSにおいて設計され得ることである。異種DNAの発現において、タンパク質発現レベルは、そのDNA配列を宿主生物において非常に頻繁に使用されるコドンに変換することによって増加することが予想される。使用される宿主におけるコドン使用頻度のデータとして、例えば、公益財団法人かずさDNA研究所のホームページで開示されている遺伝子コード使用頻度データベース(http://www.kazusa.or.jp/codon/index.html)を使用することができるか、または、各宿主におけるコドン使用頻度を示す文献を参照してもよい。得られたデータおよび導入されるDNA配列を参照することによって、DNA配列に使用されるもののうち、宿主における使用頻度が低いコドンが、同一のアミノ酸をコードし高い使用頻度を示すコドンに変換され得る。
例えば、DNAを適切な発現ベクターにおけるプロモーターの下流に連結することによって、核酸配列認識モジュールおよび/または核酸塩基変換酵素をコードするDNAを含む発現ベクターを産生することができる。
発現ベクターとしては、Escherichia coli由来プラスミド(例えば、pBR322、pBR325、pUC12、pUC13);Bacillus subtilis由来プラスミド(例えば、pUB110、pTP5、pC194);酵母由来プラスミド(例えば、pSH19、pSH15);昆虫細胞発現プラスミド(例えば、pFast-Bac);動物細胞発現プラスミド(例えば、pA1-11、pXT1、pRc/CMV、pRc/RSV、pcDNAI/Neo);ラムダファージなどのバクテリオファージ;バキュロウイルスなどの昆虫ウイルスベクター(例えば、BmNPV、AcNPV);レトロウイルス、ワクシニアウイルス、アデノウイルスなどの動物ウイルスベクターなどが使用される。
プロモーターとして、遺伝子発現に使用される宿主に適切なあらゆるプロモーターを使用することができる。DSBを使用する従来の方法において、宿主細胞の生存率は毒性が理由で大きく低下することが時としてあるため、誘導性プロモーターを使用することによる誘導の開始によって細胞の数を増加させることが望ましい。しかし、十分な細胞増殖はまた、本開示の核酸修飾酵素複合体を発現させることによっても付与され得るため、構成的プロモーターも制限することなく使用することができる。
例えば、宿主が動物細胞である場合、SRアルファプロモーター、SV40プロモーター、LTRプロモーター、CMV(サイトメガロウイルス)プロモーター、RSV(ラウス肉腫ウイルス)プロモーター、MoMuLV(モロニーマウス白血病ウイルス)LTR、HSV-TK(単純ヘルペスウイルスチミジンキナーゼ)プロモーターなどが使用される。これらのうち、CMVプロモーター、SRアルファプロモーターなどが好ましい。
宿主がEscherichia coliである場合、trpプロモーター、lacプロモーター、recAプロモーター、lamda.P.sub.Lプロモーター、lppプロモーター、T7プロモーターなどが好ましい。
宿主がBacillus属である場合、SPO1プロモーター、SPO2プロモーター、penPプロモーターなどが好ましい。
宿主が酵母である場合、Gal1/10プロモーター、PHO5プロモーター、PGKプロモーター、GAPプロモーター、ADHプロモーターなどが好ましい。
宿主が昆虫細胞である場合、ポリヘドリンプロモーター、P10プロモーターなどが好ましい。
宿主が植物細胞である場合、CaMV35Sプロモーター、CaMV19Sプロモーター、NOSプロモーターなどが好ましい。
発現ベクターとしては、上記のものに加えて、要求に応じた、エンハンサー、スプライシングシグナル、ターミネーター、ポリA付加シグナル、薬物耐性遺伝子、栄養要求性相補遺伝子などの選択マーカー、複製起点などを含有するものが使用され得る。
本明細書に記載されるタンパク質ドメインをコードするRNAは、例えば、上記の核酸配列認識モジュールおよび/または核酸塩基変換酵素をコードするDNAをコードするベクターを鋳型として使用することによる、それ自体が知られているin vitro転写系でのmRNAの転写によって、調製することができる。
本開示の融合タンパク質は、核酸配列認識モジュールおよび/または核酸塩基変換酵素をコードするDNAを含む発現ベクターを宿主細胞に導入し、宿主細胞を培養することによって、細胞内で発現させることができる。
宿主としては、Escherichia属、Bacillus属、酵母、昆虫細胞、昆虫、動物細胞などが使用される。
Escherichia属としては、Escherichia coli K12.cndot.DH1[Proc. Natl. Acad. Sci. USA, 60, 160 (1968)]、Escherichia coli JM103[Nucleic Acids Research, 9, 309 (1981)]、Escherichia coli JA221[Journal of Molecular Biology, 120, 517 (1978)]、Escherichia coli HB101[Journal of Molecular Biology, 41, 459 (1969)]、Escherichia coli C600[Genetics, 39, 440 (1954)]などが使用される。
Bacillus属としては、Bacillus subtilis M1114[Gene, 24, 255 (1983)]、Bacillus subtilis 207-21[Journal of Biochemistry, 95, 87 (1984)]などが使用される。
酵母としては、Saccharomyces cerevisiae AH22、AH22R.sup.-、NA87-11A、DKD-5D、20B-12、Schizosaccharomyces pombe NCYC1913、NCYC2036、Pichia pastoris KM71などが使用される。
ウイルスがAcNPVである場合の昆虫細胞としては、ヨウトガ幼虫由来樹立株の細胞(Spodoptera frugiperda細胞、Sf細胞)、Trichoplusia niの中腸由来MG1細胞、Trichoplusia niの卵由来のHigh Five(商標)細胞、Mamestra brassicae由来細胞、Estigmena acrea由来細胞などが使用される。ウイルスがBmNPVである場合、Bombyx mori由来樹立株の細胞(Bombyx mori N細胞、BmN細胞)などが、昆虫細胞として使用される。Sf細胞としては、例えば、Sf9細胞(ATCC CRL1711)、Sf21細胞[上記の全て、In Vivo, 13, 213-217 (1977)]などが使用される。
昆虫としては、例えば、Bombyx moriの幼虫、Drosophila、コオロギなどが使用される[Nature, 315, 592 (1985)]。
動物細胞としては、サルCOS-7細胞、サルVero細胞、チャイニーズハムスター卵巣(CHO)細胞、dhfr遺伝子欠損CHO細胞、マウスL細胞、マウスAtT-20細胞、マウスミエローマ細胞、ラットGH3細胞、ヒトFL細胞などの細胞株、ヒトおよび他の哺乳動物のiPS細胞、ES細胞などの多能性幹細胞、ならびに様々な組織から調製された初代培養細胞が使用される。さらに、ゼブラフィッシュ胚、Xenopus卵母細胞などもまた使用することができる。
植物細胞としては、様々な植物(例えば、イネ、コムギ、トウモロコシなどの穀物、トマト、キュウリ、ナスなどの農産物、カーネーション、Eustoma russellianumなどの園芸植物、タバコ、arabidopsis thalianaなどの実験植物など)から調製された懸濁培養細胞、カルス、プロトプラスト、葉断片、根断片などが使用される。
全ての上記の宿主細胞は、ハプロイド(一倍体)、またはポリプロイド(例えば、二倍体、三倍体、四倍体など)であり得る。従来の突然変異導入方法において、突然変異は原則的に、ヘテロ遺伝子型を得るために、ただ一つの相同染色体に導入される。したがって、所望の表現型は優性突然変異が生じない限り発現せず、ホモ接合性は不都合なことに、労力および時間を要する。逆に、本開示に従うと、突然変異は、ゲノム内の相同染色体上の任意のアリルに導入され得るため、所望の表現型は、劣性突然変異のケースであっても単一の世代で発現し得、このことは、従来の方法の課題を解決することができるため、非常に有用である。
発現ベクターは、宿主の種類に従って既知の方法(例えば、リゾチーム法、コンピテント法、PEG法、CaCl2共沈法、エレクトロポレーション法、マイクロインジェクション法、粒子銃法、リポフェクション法、アグロバクテリウム法など)によって導入することができる。
Escherichia coliは、例えば、Proc. Natl. Acad. Sci. USA, 69, 2110 (1972)、Gene, 17, 107 (1982)に記載された方法に従って形質転換することができる。
Bacillus属は、例えば、Molecular & General Genetics, 168, 111 (1979)などに記載された方法に従ってベクターに導入することができる。
酵母は、例えば、Methods in Enzymology, 194, 182-187 (1991)、Proc. Natl. Acad. Sci. USA, 75, 1929 (1978)などに記載された方法に従ってベクターに導入することができる。
昆虫細胞および昆虫は、例えば、Bio/Technology, 6, 47-55 (1988)などに記載された方法に従ってベクターに導入することができる。
動物細胞は、例えば、Cell Engineering additional volume 8, New Cell Engineering Experiment Protocol, 263-267 (1995)(株式会社学研メディカル秀潤社による刊行)、およびVirology, 52, 456 (1973)に記載された方法に従ってベクターに導入することができる。
ベクターを導入された細胞は、宿主の種類に従って既知の方法に従って培養することができる。
例えば、Escherichia coliまたはBacillus属が培養される場合、液体培地が、培養に使用される培地として好ましい。培地は好ましくは、形質転換体の成長に必要な炭素源、窒素源、無機物質などを含有している。炭素源の例としては、グルコース、デキストリン、可溶性デンプン、スクロースなどが挙げられる。窒素源の例としては、アンモニウム塩、硝酸塩、コーンスティープリカー、ペプトン、カゼイン、肉エキス、大豆ケーキ、ジャガイモエキス等のような無機又は有機物質が挙げられ、無機物質としては、塩化カルシウム、リン酸二水素ナトリウム、塩化マグネシウム等が挙げられる。培地は、酵母エキス、ビタミン、成長促進因子などを含有してもよい。培地のpHは好ましくは約5~約8である。
Escherichia coliを培養するための培地としては、例えば、グルコース、カザミノ酸[Journal of Experiments in Molecular Genetics, 431-433, Cold Spring Harbor Laboratory, New York 1972]を含有するM9培地が好ましい。必要であれば、プロモーターの効率的な機能を確実にするために、例えば、3-ベータ-インドリルアクリル酸などの作用物質を培地に添加してもよい。Escherichia coliは、一般に約15~約43℃で培養される。必要であれば、曝気および撹拌を行ってもよい。
Bacillus属は、一般に約30~約40℃で培養される。必要であれば、曝気および撹拌を行ってもよい。
酵母を培養するための培地の例としては、バークホルダー最少培地[Proc. Natl. Acad. Sci. USA, 77, 4505 (1980)]、0.5%カザミノ酸含有SD培地[Proc. Natl. Acad. Sci. USA, 81, 5330 (1984)]などが含まれる。培地のpHは、好ましくは約5~約8である。培養は、一般に約20℃~約35℃で行われる。必要であれば、曝気および撹拌を行ってもよい。
昆虫細胞または昆虫を培養するための培地としては、例えば、適切な不活化10%ウシ血清などの添加物を含有するグレース昆虫培地[Nature, 195, 788 (1962)]などが使用される。培地のpHは、好ましくは約6.2から約6.4である。培養は一般に約27℃で行われる。必要であれば、曝気および撹拌を行ってもよい。
動物細胞を培養するための培地としては、例えば、約5~約20%ウシ胎児血清を含有する最少必須培地(MEM)[Science, 122, 501 (1952)]、ダルベッコ変法イーグル培地(DMEM)[Virology, 8, 396 (1959)]、RPMI 1640培地[The Journal of the American Medical Association, 199, 519 (1967)]、199培地[Proceeding of the Society for the Biological Medicine, 73, 1 (1950)]などが使用される。培地のpHは、好ましくは約6~約8である。培養は一般に約30℃~約40℃で行われる。必要に応じて通気および撹拌を行ってもよい。
植物細胞を培養するための培地としては、例えば、MS培地、LS培地、B5培地等が用いられる。培地のpHは好ましくは約5~約8である。培養は、一般に約20℃~約30℃で行われる。必要に応じて曝気及び攪拌を行ってもよい。
動物細胞、昆虫細胞、植物細胞などの高等真核細胞が宿主細胞として使用される場合、誘導性プロモーター(例えば、メタロチオネインプロモーター(重金属イオンによって誘導される)、熱ショックタンパク質プロモーター(熱ショックによって誘導される)、Tet-ON/Tet-OFF系プロモーター(テトラサイクリンまたはその誘導体の添加または除去によって誘導される)、ステロイド応答性プロモーター(ステロイドホルモンまたはその誘導体によって誘導される)など)の制御下で、本開示の塩基編集系(例えば、アデノシンデアミナーゼバリアントを含む)をコードするDNAが宿主細胞に導入され、核酸修飾酵素複合体の発現を誘導するために適切な段階で誘導物質が培地に添加され(または培地から除去され)、培養が、塩基編集を行うために所与の時間行われ、標的遺伝子への突然変異の導入、塩基編集系の一過性発現が行われ得る。
Escherichia coliなどの原核細胞は、誘導性プロモーターを利用することができる。誘導性プロモーターの例としては、lacプロモーター(IPTGによって誘導される)、cspAプロモーター(低温ショックによって誘導される)、araBADプロモーター(アラビノースによって誘導される)などが含まれるが、これらに限定されない。
あるいは、上記の誘導プロモーターはまた、動物細胞、昆虫細胞、植物細胞などの高等真核細胞を宿主細胞として使用する場合に、ベクター除去機構として利用することができる。すなわち、ベクターには、宿主細胞において機能する複製起点、ならびに複製に必要なタンパク質(例えば、動物細胞ではSV40およびラージT抗原、oriP、ならびにEBNA-1など)をコードする核酸が載せられ、これらタンパク質をコードする核酸の発現は、上記の誘導性プロモーターによって制御される。その結果、ベクターは誘導物質の存在下で自律的に複製可能であるが、誘導物質が除去されると自律複製はできなくなり、ベクターは、細胞分裂と共に衰えていく(自律的複製は、Tet-OFF系ベクターにおいて、テトラサイクリンおよびドキシサイクリンの添加によっては不可能である)。
[送達系]
[核酸塩基エディターおよびgRNAの、核酸ベースの送達]
本開示による塩基編集系をコードする核酸は、当技術分野において公知の方法によってまたは本明細書に記載されるように、対象に投与することができるか、またはin vitroもしくはin vivoで細胞に送達することができる。一実施形態において、核酸塩基エディターは、例えば、ベクター(例えばウイルスベクターもしくは非ウイルスベクター)、非ベクターベースの方法(例えば、裸のDNA、DNA複合体、脂質ナノ粒子を使用する)、またはそれらの組合せによって送達することができる。
核酸塩基エディターをコードする核酸は、例えばトランスフェクションまたはエレクトロポレーションによって、細胞(例えば、造血細胞もしくはその前駆細胞、造血幹細胞、および/または人工多能性幹細胞)に裸のDNAまたはRNAとして直接送達することができるか、あるいは、標的細胞による取り込みを促進する分子(例えばN-アセチルガラクトサミン)にコンジュゲートさせることができる。本明細書に記載されるベクターなどの核酸ベクターもまた、使用することができる。
核酸ベクターは、本明細書に記載される融合タンパク質のドメインをコードする1つまたは複数の配列を含み得る。ベクターはまた、タンパク質をコードする配列に付随する(例えば、当該配列に挿入されているまたは融合している)、シグナルペプチド(例えば、核局在化、核小体局在化、またはミトコンドリア局在化のための)をコードする配列も含み得る。一例として、核酸ベクターは、1つまたは複数の核局在化配列(例えば、SV40からの核局在化配列)を含むCas9コード配列およびアデノシンデアミナーゼバリアント(例えばABE8)を含み得る。
核酸ベクターはまた、任意の適切な数の調節/制御エレメント、例えば、プロモーター、エンハンサー、イントロン、ポリアデニル化シグナル、Kozakコンセンサス配列、または内部リボソームエントリー部位(IRES)を含み得る。これらのエレメントは、当技術分野において周知である。造血細胞では、適切なプロモーターとしては、IFNbetaまたはCD45を含み得る。
本開示による核酸ベクターとしては、組換えウイルスベクターが含まれる。例示的なウイルスベクターが本明細書において示されている。当技術分野において公知の他のウイルスベクターも使用することができる。加えて、ウイルス粒子は、塩基編集系成分を核酸および/またはペプチド形態で送達するために使用することができる。例えば、「空の」ウイルス粒子を、任意の適切なカーゴを含有するようにアセンブルすることができる。ウイルスベクターおよびウイルス粒子はまた、標的化リガンドを組み込んで標的組織特異性を改変するように操作することもできる。
ウイルスベクターに加えて、非ウイルスベクターは、本開示によるゲノム編集系をコードする核酸を送達するために使用することができる。非ウイルス核酸ベクターの1つの重要なカテゴリーはナノ粒子であり、これは、有機または無機であり得る。ナノ粒子は、当技術分野において周知である。任意の適切なナノ粒子設計を、ゲノム編集系成分またはこのような成分をコードする核酸を送達するために使用することができる。例えば、有機(例えば、脂質および/またはポリマー)ナノ粒子は、本開示のある特定の実施形態において、送達ビヒクルとしての使用に適切であり得る。ナノ粒子製剤および/または遺伝子導入において使用するための例示的な脂質を表11に示す(以下)。
Figure 2022520081000079
表12は、遺伝子導入および/またはナノ粒子製剤において使用するための例示的なポリマーを列挙している。
Figure 2022520081000080
表13は、本明細書に記載される融合タンパク質をコードするポリヌクレオチドのための送達方法をまとめている。
Figure 2022520081000081
別の態様において、ゲノム編集系成分またはこのような成分をコードする核酸、例えば、例えばCas9またはそのバリアントなどの核酸結合タンパク質、および目的のゲノム核酸配列を標的化するgRNAの送達が、リボ核タンパク質(RNP)を細胞に送達することによって達成され得る。RNPは、標的化gRNAとの複合体内に、核酸結合タンパク質、例えばCas9を含む。RNPは、例えば、Zuris, J.A. et al., 2015, Nat. Biotechnology, 33(1):73-80によって報告されているような、エレクトロポレーション、ヌクレオフェクション、またはカチオン性脂質媒介方法などの既知の方法を使用して、細胞に送達され得る。RNPは、CRISPR塩基編集系における使用に、特に、一次細胞などのトランスフェクトが困難な細胞に有利である。加えて、RNPはまた、特に、真核生物プロモーター、例えば、CRISPRプラスミドにおいて使用され得るCMVまたはEF1Aが良く発現していない場合の、細胞内でのタンパク質発現に伴って生じ得る困難を軽減させ得る。有利には、RNPの使用では、外来DNAを細胞に送達する必要がない。さらに、核酸結合タンパク質およびgRNAの複合体を含むRNPは時間とともに分解されるため、RNPの使用は、オフターゲット効果を制限する可能性を有する。プラスミドベースの技術の様式に類似の様式で、RNPを、結合タンパク質(例えばCas9バリアント)を送達するため、および相同性誘導型修復(HDR)を指示するために使用することができる。
塩基エディターをコードする核酸分子の発現を駆動するために使用されるプロモーターには、AAV ITRが含まれ得る。これは、ベクター内の空間を奪い得るさらなるプロモーターエレメントの必要性を排除するために有利であり得る。解放されたさらなる空間は、ガイド核酸または選択マーカーなどのさらなるエレメントの発現を駆動するために使用することができる。ITR活性は比較的弱く、したがって、ITRは、選択されたヌクレアーゼの過剰発現に起因する潜在的毒性を低減させるために使用することができる。
任意の適切なプロモーターを、塩基エディターおよび適切な場合にはガイド核酸の発現を駆動するために使用することができる。遍在的発現では、使用され得るプロモーターとしては、CMV、CAG、CBh、PGK、SV40、フェリチン重鎖または軽鎖などが含まれる。脳または他のCNS細胞の発現では、適切なプロモーターとしては、全ニューロンではシナプシンI、興奮性ニューロンではCaMKIIα、GABA作動性ニューロンではGAD67またはGAD65またはVGATなどが含まれ得る。肝細胞の発現では、適切なプロモーターとしては、アルブミンプロモーターが含まれる。肺細胞の発現では、適切なプロモーターとしては、SP-Bが含まれ得る。内皮細胞では、適切なプロモーターとしては、ICAMが含まれ得る。造血細胞では、適切なプロモーターとしては、IFNβまたはCD45が含まれ得る。骨芽細胞では、適切なプロモーターとしては、OG-2が含まれ得る。
いくつかの実施形態において、本開示の塩基エディターは、別個のプロモーターが同一の核酸分子内での塩基エディターおよび適合するガイド核酸の発現を駆動することを可能にするほどに小さいサイズのものである。例えば、ベクターまたはウイルスベクターは、塩基エディターをコードする核酸に作動可能に連結された第1のプロモーター、およびガイド核酸に作動可能に連結された第2のプロモーターを含み得る。
ガイド核酸の発現を駆動するために使用されるプロモーターとしては、U6またはH1などのPol IIIプロモーター、Pol IIプロモーターの使用、およびgRNAアデノ随伴ウイルス(AAV)を発現させるためのイントロンカセットが含まれ得る。
[ウイルスベクター]
本明細書に記載される塩基エディターは、したがって、ウイルスベクターで送達することができる。いくつかの実施形態において、本明細書に開示される塩基エディターは、ウイルスベクターに含有される核酸上でコードされ得る。いくつかの実施形態において、塩基エディター系の1つまたは複数の成分は、1つまたは複数のウイルスベクター上でコードされ得る。例えば、塩基エディターおよびガイド核酸は、単一のウイルスベクター上でコードされ得る。他の実施形態において、塩基エディターおよびガイド核酸は、異なるウイルスベクターでコードされ得る。いずれの場合でも、塩基エディターおよびガイド核酸はそれぞれ、プロモーターおよびターミネーターに作動可能に連結され得る。ウイルスベクター上でコードされる成分の組合せは、選択されたウイルスベクターのカーゴサイズの制約によって決定することができる。
塩基エディターを送達するためのRNAウイルスまたはDNAウイルスベースの系の使用は、培養物または宿主における特異的細胞へのウイルスの標的化、および核または宿主細胞ゲノムへのウイルスペイロードの輸送のための、高度に進化したプロセスを利用する。ウイルスベクターは、培養中の細胞、患者(in vivo)に直接投与することができるか、またはウイルスベクターは、細胞をin vitroで処置するために使用することができ、また、修飾細胞を、患者(ex vivo)に必要に応じて投与することができる。従来のウイルスベースの系としては、遺伝子導入のための、レトロウイルスベクター、レンチウイルスベクター、アデノウイルスベクター、アデノ随伴ウイルスベクター、および単純ヘルペスウイルスベクターが含まれ得る。宿主ゲノム内への組み込みは、レトロウイルス、レンチウイルス、およびアデノ随伴ウイルス遺伝子導入方法で可能であり、これによって、挿入された導入遺伝子の長期の発現が生じることが多い。加えて、高い形質導入効率が、多くの異なる細胞型および標的組織において観察されている。
ウイルスベクターとしては、レンチウイルス(例えば、HIVおよびFIVベースのベクター)、アデノウイルス(例えばAD100)、レトロウイルス(例えば、モロニーマウス白血病ウイルス、MML-V)、ヘルペスウイルスベクター(例えばHSV-2)、ならびにアデノ随伴ウイルス(AAV)、または、特に、例えば米国特許第8,454,972号(アデノウイルスのための製剤、用量)、米国特許第8,404,658号(AAVのための製剤、用量)、および米国特許第5,846,946号(DNAプラスミドのための製剤、用量)の製剤および用量を使用する、ならびに、レンチウイルス、AAV、およびアデノウイルスが関わる臨床試験および臨床試験に関する刊行物の製剤および用量を使用する、他のプラスミドもしくはウイルスベクター型が含まれ得る。例えば、AAVでは、投与経路、製剤、および用量は、米国特許第8,454,972号、およびAAVが関わる臨床試験における通りであり得る。アデノウイルスでは、投与経路、製剤、および用量は、米国特許第8,404,658号、およびアデノウイルスが関わる臨床試験における通りであり得る。プラスミド送達では、投与経路、製剤、および用量は、米国特許第5,846,946号、およびプラスミドが関わる臨床研究における通りであり得る。用量は、平均70kgの個体(例えば成人男性)に基づき得るかまたはそれに対して外挿され得、異なる体重および種の患者、対象、哺乳動物に対して調整され得る。投与頻度の決定は、患者または対象の年齢、性別、全体的健康、他の状態、および対処される特定の状態または症候を含む、通常の因子に応じて、医学または獣医学の実施者(例えば、医師、獣医師)の範囲内である。ウイルスベクターは、目的の組織に注射することができる。細胞型特異的塩基編集では、塩基エディターおよび必要に応じたガイド核酸の発現は、細胞型特異的プロモーターによって駆動することができる。
レトロウイルスの指向性は、外来エンベロープタンパク質を組み込むことによって改変することができ、標的細胞の潜在的標的集団を拡大させることができる。レンチウイルスベクターは、非分裂細胞に形質導入または感染させることができる、および典型的には高ウイルス力価を生じさせることができる、レトロウイルスベクターである。レトロウイルス遺伝子導入系の選択は、したがって、標的組織に依存する。レトロウイルスベクターは、最大6~10kbの外来配列をパッケージングする能力を有するシス作用性の長い末端反復から構成される。最小のシス作用性LTRは、ベクターの複製およびパッケージングにとって十分であり、これらベクターは次に、治療遺伝子を標的細胞に組み込んで永続的な導入遺伝子発現をもたらすために使用される。広く使用されているレトロウイルスベクターとしては、マウス白血病ウイルス(MuLV)、テナガザル白血病ウイルス(GaLV)、サル免疫不全ウイルス(SIV)、ヒト免疫不全ウイルス(HIV)、およびそれらの組合せに基づくレトロウイルスベクターが含まれる(例えば、Buchscher et al., J. Virol. 66:2731-2739 (1992)、Johann et al., J. Virol. 66:1635-1640 (1992)、Sommnerfelt et al., Virol. 176:58-59 (1990)、Wilson et al., J. Virol. 63:2374-2378 (1989)、Miller et al., J. Virol. 65:2220-2224 (1991)、PCT/US94/05700を参照されたい)。
レトロウイルスベクター、特にレンチウイルスベクターが標的細胞への効率的な組み込みのために所与の長さよりも小さいポリヌクレオチド配列を必要とし得る。例えば、9kbよりも長いレトロウイルスベクターは、より小さいサイズのレトロウイルスベクターと比較して、低いウイルス力価を生じさせ得る。いくつかの態様において、本開示の塩基エディターは、レトロウイルスベクターを介する効率的なパッケージングおよび標的細胞への送達を可能にするために十分なサイズのものである。いくつかの実施形態において、塩基エディターは、ガイド核酸および/または標的可能なヌクレアーゼ系の他の成分と共に発現した場合であっても効率的なパッキングおよび送達を可能にすることができるサイズのものである。
一過性発現が好ましい適用において、アデノウイルスベースの系を使用することができる。アデノウイルスベースのベクターは、多くの細胞型において非常に高い形質導入効率が可能であり、細胞分裂を必要としない。このようなベクターで、高い力価および発現レベルが得られている。このベクターは、比較的シンプルな系で大量に生産することができる。アデノ随伴ウイルス(「AAV」)ベクターもまた、例えば、核酸およびペプチドのin vitroでの生産において、ならびにin vivoおよびex vivoでの遺伝子治療手順のために、細胞に標的核酸を形質導入するために使用することができる(例えば、West et al., Virology 160:38-47 (1987)、米国特許第4,797,368号、WO93/24641、Kotin, Human Gene Therapy 5:793-801 (1994)、Muzyczka, J. Clin. Invest. 94:1351 (1994)を参照されたい)。組換えAAVベクターの構築は、米国特許第5,173,414号、Tratschin et al., Mol. Cell. Biol. 5:3251-3260 (1985)、Tratschin, et al., Mol. Cell. Biol. 4:2072-2081 (1984)、Hermonat & Muzyczka, PNAS 81:6466-6470 (1984)、およびSamulski et al., J. Virol. 63:03822-3828 (1989)を含む多くの刊行物に記載されている。
AAVはパルボウイルスファミリーに属する小さな一本鎖DNA依存性ウイルスである。4.7 kbの野生型 (wt) AAVゲノムは、それぞれ四つの複製タンパク質および三つのキャプシドタンパク質をコードする二つの遺伝子からなり、両側に145 bpの逆方向末端反復配列 (ITR) がある。ビリオンは三つのキャプシドタンパク質Vp1、Vp2およびVp3から成り、これらは同じオープンリーディングフレームから1:1:10比で産生されるが、異なるスプライシング (Vp1) および選択的翻訳開始部位(Vp2とVp3のそれぞれ)から産生される。Vp3は、ビリオンにおける最も豊富なサブユニットであり、ウイルスの指向性を規定する細胞表面での受容体の認識に関与する。ウイルスの感染性において機能するホスホリパーゼドメインが、Vp1の固有のN末端において同定されている。
wt AAVと同様に、組換えAAV(rAAV)は、シス作用性の145bpのITRを利用して、ベクターの導入遺伝子カセットに隣接し、外来DNAのパッケージングを最大4.5kbとする。感染の後、rAAVは、本開示の融合タンパク質を発現し得、環状の頭・尾結合コンカテマーにおいてエピソームで存在することによって宿主ゲノムへの組み込みを伴わずに存続することができる。in vitroおよびin vivoで、この系を使用したrAAVの成功の多くの例が存在するが、遺伝子のコード配列の長さがwt AAVゲノムと等しいかまたはそれよりサイズが大きい場合、制限されたパッケージング能力によって、AAV媒介遺伝子送達の使用が制限されている。
ウイルスベクターは、本願に基づいて選択することができる。例えば、in vivoでの遺伝子送達では、AAVは他のウイルスベクターよりも有利であり得る。いくつかの実施形態において、AAVは低毒性を可能とし、これは、精製方法が、免疫応答を活性化し得る細胞粒子の超遠心分離を必要としないためであり得る。いくつかの実施形態において、AAVは、挿入による突然変異生成を生じさせる確率を下げることを可能とし、これは、AAVが宿主ゲノムに組み込まれないためである。アデノウイルスは、それが誘発する免疫原性応答が強力であるため、ワクチンとして一般に使用されている。ウイルスベクターのパッケージング能力は、ベクターにパッケージされ得る塩基エディターのサイズを制限し得る。
AAVは、2つの145ベースの逆方向末端反復(ITR)を含む約4.5kbまたは4.75kbのパッケージング能力を有する。このことは、開示された塩基エディターならびにプロモーターおよび転写ターミネーターが単一のウイルスベクターに収まり得ることを意味する。4.5 Kbまたは4.75 Kbを超える構築物は、ウイルス産生を有意に減少させ得る。例えば、SpCas9は非常に大きく、遺伝子自体が4.1 Kbを超え、AAVに詰め込むことが困難であるため、本開示の実施形態は、従来の塩基エディターよりも短い長さの開示された塩基エディターを利用することを含む。いくつかの例では、塩基エディターは4 kb未満である。開示される塩基エディターは、4.5 kb、4.4 kb、4.3 kb、4.2 kb、4.1 kb、4 kb、3.9 kb、3.8 kb、3.7 kb、3.6 kb、3.5 kb、3.4 kb、3.3 kb、3.2 kb、3.1 kb、3 kb、2.9 kb、2.8 kb、2.7 kb、2.6 kb、2.5 kb、2 kb、または1.5 kb未満であり得る。いくつかの実施形態において、開示された塩基エディターは、長さが4.5 kb以下である。
AAVは、AAV1、AAV2、AAV5、またはそれらの任意の組み合わせであり得る。標的とする細胞に関してAAVのタイプを選択することができる。例えば、AAV血清型1、2、5またはハイブリッドキャプシドAAV1、AAV2、AAV5またはそれらの任意の組合せを選択して、脳または神経細胞を標的化することができる;また、心臓組織を標的とするAAV4を選択することができる。AAV8は肝臓への送達に有用である。これらの細胞に関する特定のAAV血清型の表は、Grimm, D. et al, J. Virol. 82: 5887-5911 (2008)に見出され得る。
レンチウイルスは、有糸分裂細胞および有糸分裂後細胞の両方に感染し、これらの細胞においてその遺伝子を発現させる能力を有する、複雑なレトロウイルスである。最も一般的に知られているレンチウイルスはヒト免疫不全ウイルス(HIV)であり、これは、他のウイルスのエンベロープ糖タンパク質を使用して、広範な細胞型を標的化する。
レンチウイルスは、以下のように調製することができる。pCasES10(これは、レンチウイルストランスファープラスミド骨格を含有する)をクローニングした後、低継代(p=5)のHEK293FTを50%のコンフルーエンスまでT-75フラスコに播種し、その翌々日に、10%ウシ胎児血清を有し抗生物質を有さないDMEM内でトランスフェクトした。20時間後、培地をOptiMEM(無血清)培地に交換し、トランスフェクションを4時間後に行った。細胞に、10μgのレンチウイルストランスファープラスミド(pCasES10)、ならびに以下のパッケージングプラスミド:5μgのpMD2.G(VSV-gシュード(peudo)タイプ)および7.5μgのpsPAX2(gag/pol/rev/tat)をトランスフェクトした。トランスフェクションは、カチオン性脂質送達剤(50μlのリポフェクタミン2000および100ulのPlus試薬)を有する4mLのOptiMEM中で行うことができる。6時間後、培地を、10%ウシ胎児血清を有する、抗生物質を含まないDMEMに交換する。これらの方法は細胞培養の際に血清を使用するが、無血清方法が好ましい。
レンチウイルスは、以下の通りに精製することができる。ウイルス上清を48時間後に回収する。上清はまずデブリを取り除き、0.45μmの低タンパク質結合(PVDF)フィルターを通して濾過する。これらを次いで、超遠心機で2時間、24,000rpmで回転させる。ウイルスペレットを50μlのDMEM中で一晩、4℃で再懸濁する。これらを次いで等分し、-80℃ですぐに凍結する。
別の実施形態において、ウマ伝染性貧血ウイルス(EIAV)に基づく最小の非霊長類レンチウイルスベクターもまた検討される。別の実施形態において、RetinoStat.(登録商標)、すなわち、血管新生抑制タンパク質であるエンドスタチンおよびアンジオスタチンを発現するウマ伝染性貧血ウイルスベースのレンチウイルス遺伝子治療ベクターが、網膜下注射を介して送達されることが考えられる。別の実施形態において、自己不活性化レンチウイルスベクターの使用が検討される。
系の任意のRNA、例えば、ガイドRNAまたは塩基エディターをコードするmRNAを、RNAの形態で送達することができる。塩基エディターをコードするmRNAは、in vitroでの転写を使用して生成することができる。例えば、ヌクレアーゼmRNAは、以下のエレメント:T7プロモーター、必要に応じたコザック配列(GCCACC)、ヌクレアーゼ配列、およびβグロビン-ポリA尾部の3’UTRなどの3’UTRを含有するPCRカセットを使用して合成することができる。カセットは、T7ポリメラーゼによる転写に使用することができる。ガイドポリヌクレオチド(例えばgRNA)はまた、T7プロモーターとその後に続く配列「GG」およびガイドポリヌクレオチド配列とを含有するカセットからのin vitroでの転写を使用して転写することができる。
発現を増強させ、考えられる毒性を低減するために、塩基エディターコード配列および/またはガイド核酸を、例えば擬似-Uまたは5-メチル-Cを使用して、1つまたは複数の修飾ヌクレオシドを含めるように修飾することができる。
AAVベクターの小さいパッケージング能力は、このサイズを超える多数の遺伝子の送達および/または大きな生理学的調節エレメントの使用を困難にする。これらの課題は、例えば、タンパク質を分けて2つ以上の断片に送達するようにすることによって対処することができ、この場合、N末端断片はスプリットインテイン-Nに融合し、C末端断片はスプリットインテイン-Cに融合する。これらの断片は次いで、2つ以上のAAVベクターにパッケージングされる。本明細書で使用される場合、「インテイン」は、隣接するN末端エクステインおよびC末端エクステイン(例えば、結合される断片)をライゲートする、セルフスプライシングするタンパク質のイントロン(例えばペプチド)を指す。異種タンパク質断片を結合するためのある特定のインテインの使用が、例えばWood et al., J. Biol. Chem. 289(21); 14512-9 (2014)に記載されている。例えば、別個のタンパク質断片に融合すると、インテインIntNおよびIntCは互いに認識し、それら自体をスプライシング除去し、また、これらが融合するタンパク質断片の隣接するN末端エクステインおよびC末端エクステインを同時にライゲートし、これによって、2つのタンパク質断片から完全長タンパク質を再構成する。他の適切なインテインは、当業者に自明であろう。
本開示の融合タンパク質の断片は長さが様々であり得る。いくつかの実施形態において、タンパク質断片は、2アミノ酸長から約1000アミノ酸長の範囲である。いくつかの実施形態において、タンパク質断片は、約5アミノ酸長から約500アミノ酸長の範囲である。いくつかの実施形態において、タンパク質断片は、約20アミノ酸長から約200アミノ酸長の範囲である。いくつかの実施形態において、タンパク質断片は、約10アミノ酸長から約100アミノ酸長の範囲である。他の長さの適切なタンパク質断片は、当業者に自明であろう。
一実施形態において、デュアルAAVベクターは、大きな導入遺伝子発現カセットを2つの別個の半分(5'末端および3'末端、または頭部および尾部)に分割するによって生成され、ここで、カセットの各半分は、単一のAAVベクター(<5kbのもの)にパッケージされる。完全長導入遺伝子発現カセットの再アセンブリが次いで、両方のデュアルAAVベクターによる同一の細胞の共感染と、その後の、(1)5'ゲノムと3'ゲノムとの間の相同組換え(HR)(デュアルAAVがオーバーラップしているベクター)、(2)ITRが媒介する、5'ゲノムおよび3'ゲノムの尾部・頭部のコンカテマー化(デュアルAAVトランススプライシングベクター)、または(3)これらの2つのメカニズムの組合せ(デュアルAAVハイブリッドベクター)とによって達成される。in vivoでのデュアルAAVベクターの使用によって、完全長タンパク質が発現する。デュアルAAVベクタープラットフォームの使用は、>4.7kbのサイズの導入遺伝子のための効率的かつ実行可能な遺伝子導入戦略である。
[インテイン]
いくつかの実施形態において、ヌクレアーゼ(例えばCas9)の一部または断片を、インテインに融合する。ヌクレアーゼは、インテインのN末端またはC末端に融合することができる。いくつかの実施形態において、融合タンパク質の一部または断片はインテインに融合され、AAVキャプシドタンパク質に融合される。インテイン、ヌクレアーゼおよび、キャプシドタンパク質は、任意の配置で(例えば、ヌクレアーゼ-インテイン-キャプシド、インテイン-ヌクレアーゼ-キャプシド、キャプシド-インテイン-ヌクレアーゼなど)共に融合することができる。いくつかの実施形態において、インテインのN末端は融合タンパク質のC末端に融合され、インテインのC末端はAAVキャプシドタンパク質のN末端に融合される。
インテイン(介在タンパク質)は、多種多様な生物に見出される自己プロセシングドメインであり、タンパク質スプライシングとして知られるプロセスを行うものである。タンパク質スプライシングは、ペプチド結合の切断と形成の両方からなる多段階の生化学的反応である。タンパク質スプライシングの内因性基質は、インテインを含む生物に見出されるタンパク質であるが、インテインはまた、実質的にあらゆるポリペプチド骨格を化学的に操作するために使用することもできる。
タンパク質スプライシングでは、インテインは、二つのペプチド結合を切断することによって一前駆体ポリペプチドから自身を切り出し、それによって、隣接するエクステイン(外部タンパク質)配列を、新しいペプチド結合の形成を介して連結する。この転位は翻訳後に起こる(翻訳と同時に起こる可能性もある)。インテイン媒介性タンパク質スプライシングは自発的に起こり、インテインドメインの折りたたみだけを必要とする。
インテインの約5%が分割インテインであり、これらはN-インテインとC-インテインという二つの別々のポリペプチドとして転写され翻訳され、その各々が一つのエクステインに融合している。翻訳の際に、インテイン断片は、自発的にかつ非共有結合的に標準インテイン構造へとアセンブルし、トランスにタンパク質スプライシングを行う。タンパク質スプライシングの機序には一連のアシル転移反応が関わっており、これが、インテイン-エクステイン接合部における2つのペプチド結合の切断と、N-エクステインとC-エクステインの間の新しいペプチド結合の形成とをもたらす。このプロセスは、N‐エクステインとインテインのN‐末端とを繋げるペプチド結合の活性化によって開始される。事実上すべてのインテインは、N末端にシステインまたはセリンを有し、これがN-エクステインのC末端残基のカルボニル炭素を攻撃する。このNからO/Sへのアシル基の移動は、保存されたトレオニンとヒスチジン(TXXHモチーフと呼ばれる)、および一般的に見出されるアスパラギン酸によって促進され、直鎖状 (チオ)エステル中間体の形成をもたらす。次に、この中間体は、システイン、セリン、またはトレオニンであるC-エクステインの最初の残基 (+1) の求核攻撃によってトランス-(チオ)エステル化される。生成した分枝 (チオ)エステル中間体は、インテインの高度に保存されたC末端アスパラギンの環化というユニークな変換によって、解消される。この過程は、ヒスチジン(高度に保存されたHNFモチーフに見出されるもの)と最後から2番目のヒスチジンによって促進され、アスパラギン酸も関与し得る。このスクシンイミド生成反応は、反応複合体からインテインを切除し、非ペプチド結合を介して結合されたエクステインを残す。この構造は、インテイン非依存的態様で迅速に転位し、安定なペプチド結合になる。
いくつかの実施形態では、塩基エディター(例えばABE、CBE)のN末端断片が分割インテイン-Nに融合され、C末端断片が分割インテイン-Cに融合される。そしてこれらの断片を2つ以上のAAVベクターにパッケージングする。異種タンパク質断片を連結するための特定のインテインの使用は、例えば、Wood et al., J. Biol. Chem. 289(21); 14512-9 (2014)に記載されている。例えば、インテインIntNおよびIntCは、別々のタンパク質断片に融合された場合、互いを認識して、自身をスプライスして排出し、それと同時に、融合している上記タンパク質断片の隣接するN-およびC-末端エクステインをライゲートして、それによってそれによって2つのタンパク質断片から完全長タンパク質を再構成する。他の適切なインテインは当業者に明らかであろう。
いくつかの実施形態において、ABEを、SpCas9の選択された領域内のAla、Ser、Thr、またはCys残基でN末端断片およびC末端断片に分割した。これらの領域は、Cas9結晶構造解析により同定されたループ領域に対応する。各断片のN-末端をインテイン-Nに融合させ、各断片のC-末端を、アミノ酸位置S303、T310、T313、S355、A456、S460、A463、T466、S469、T472、T474、C574、S577、A589、およびS590(下記配列で太字の大文字で示されている)においてインテインCに融合させる。
1 mdkkysigld igtnsvgwav itdeykvpsk kfkvlgntdr hsikknliga llfdsgetae
61 atrlkrtarr rytrrknric ylqeifsnem akvddsffhr leesflveed kkherhpifg
121 nivdevayhe kyptiyhlrk klvdstdkad lrliylalah mikfrghfli egdlnpdnsd
181 vdklfiqlvq tynqlfeenp inasgvdaka ilsarlsksr rlenliaqlp gekknglfgn
241 lialslgltp nfksnfdlae daklqlskdt ydddldnlla qigdqyadlf laaknlsdai
301 llSdilrvnT eiTkaplsas mikrydehhq dltllkalvr qqlpekykei ffdqSkngya
361 gyidggasqe efykfikpil ekmdgteell vklnredllr kqrtfdngsi phqihlgelh
421 ailrrqedfy pflkdnreki ekiltfripy yvgplArgnS rfAwmTrkSe eTiTpwnfee
481 vvdkgasaqs fiermtnfdk nlpnekvlpk hsllyeyftv yneltkvkyv tegmrkpafl
541 sgeqkkaivd llfktnrkvt vkqlkedyfk kieCfdSvei sgvedrfnAS lgtyhdllki
601 ikdkdfldne enedilediv ltltlfedre mieerlktya hlfddkvmkq lkrrrytgwg
661 rlsrklingi rdkqsgktil dflksdgfan rnfmqlihdd sltfkediqk aqvsgqgdsl
721 hehianlags paikkgilqt vkvvdelvkv mgrhkpeniv iemarenqtt qkgqknsrer
781 mkrieegike lgsqilkehp ventqlqnek lylyylqngr dmyvdqeldi nrlsdydvdh
841 ivpqsflkdd sidnkvltrs dknrgksdnv pseevvkkmk nywrqllnak litqrkfdnl
901 tkaergglse ldkagfikrq lvetrqitkh vaqildsrmn tkydendkli revkvitlks
961 klvsdfrkdf qfykvreinn yhhahdayln avvgtalikk ypklesefvy gdykvydvrk
1021 miakseqeig katakyffys nimnffktei tlangeirkr plietngetg eivwdkgrdf
1081 atvrkvlsmp qvnivkktev qtggfskesi lpkrnsdkli arkkdwdpkk yggfdsptva
1141 ysvlvvakve kgkskklksv kellgitime rssfeknpid fleakgykev kkdliiklpk
1201 yslfelengr krmlasagel qkgnelalps kyvnflylas hyeklkgspe dneqkqlfve
1261 qhkhyldeii eqisefskrv iladanldkv lsaynkhrdk pireqaenii hlftltnlga
1321 paafkyfdtt idrkrytstk evldatlihq sitglyetri dlsqlggd
[突然変異を標的化するための核酸塩基エディターの使用]
突然変異を標的化する核酸塩基エディターの適合性を、本明細書に記載のように評価する。一実施形態において、目的の単細胞に、塩基編集系を、レポーター(例えばGFP)をコードする少量のベクターと共に形質導入する。これらの細胞は、293T、K562、またはU20Sなどの不死化ヒト細胞株を含む、当技術分野において公知の任意の細胞株であり得る。あるいは、一次細胞(例えばヒト)を使用してもよい。このような細胞は、最終的な細胞標的に関連し得る。
送達は、ウイルスベクターを使用して行ってよい。一実施形態において、トランスフェクションは、脂質トランスフェクション(リポフェクタミンもしくはFugeneなど)を使用して、またはエレクトロポレーションによって、行ってよい。トランスフェクションの後、GFPの発現を、一貫したかつ高レベルのトランスフェクションを確認するために、蛍光顕微鏡法によってまたはフローサイトメトリーによって決定することができる。これらの予備のトランスフェクションは、エディターのどの組合せが最大の活性をもたらすかを決定するために、異なる核酸塩基エディターを含み得る。
核酸塩基エディターの活性は、本明細書に記載のように、すなわち、標的配列内の改変を検出するために細胞のゲノムを配列決定することによって、評価される。サンガー配列決定では、精製されたPCRアンプリコンがプラスミド骨格にクローニングされ、形質転換され、ミニプレップされ、そして単一のプライマーで配列決定される。配列決定はまた、次世代配列決定技術を使用して行ってもよい。次世代配列決定を使用する場合、アンプリコンは300~500bpであり得、非対称に置かれた意図された切断部位を有する。PCRの後、次世代配列決定アダプターおよびバーコード(例えば、Illuminaマルチプレックスアダプターおよびインデックス)を、例えばハイスループット配列決定において(例えばIllumina MiSeqで)使用するために、アンプリコンの末端に付加してよい。
初期試験で最大レベルの標的特異的な改変を誘導する融合タンパク質を、さらなる評価に選択することができる。
特定の実施形態において、核酸塩基エディターは、目的のポリヌクレオチドを標的化するために使用される。一実施形態において、本開示の核酸塩基エディターは、細胞のゲノム内の目的の突然変異を標的化するために使用されるガイドRNAと組み合わせて、細胞(例えば、造血細胞もしくはその前駆細胞、造血幹細胞、および/または人工多能性幹細胞)に送達され、これによって、突然変異が改変する。いくつかの実施形態において、塩基エディターは、1つまたは複数の編集を目的の遺伝子の配列に導入するためのガイドRNAによって標的化される。
系は、1つまたは複数の異なるベクターを含み得る。一態様において、塩基エディターは、所望の細胞型、優先的には真核細胞、好ましくは哺乳動物細胞またはヒト細胞を発現させるためにコドン最適化される。
一般に、コドン最適化とは、天然アミノ酸配列を維持しながら、天然配列の少なくとも1つのコドン(例えば、約1、2、3、4、5、10、15、20、25、50以上のコドン、またはこれを超えるコドン)を、その宿主細胞の遺伝子においてより頻繁にまたは最も頻繁に使用されるコドンで置き換えることによる、目的の宿主細胞における発現を増強させるために核酸配列を修飾するプロセスを指す。様々な種が、特定のアミノ酸のある特定のコドンに特定のバイアスを示す。コドンバイアス(生物間のコドン利用の違い)は、メッセンジャーRNA (mRNA) の翻訳効率としばしば相関し、それは特に、翻訳されるコドンの性質および特定のトランスファーRNA (tRNA) 分子の利用可能性に依存すると考えられている。細胞内の選択されたtRNAの優位性は、一般にペプチド合成で最も頻繁に使われるコドンを反映している。従って、遺伝子は、コドン最適化に基づいて、所与の生物における最適な遺伝子発現に合わせて調整することができる。コドン使用表は、例えば、「コドン使用データベース」www.kazusa.orjp/codon/ (2002年7月9日に訪問した)で容易に入手可能であり、これらの表は、多くの方法で適合させることができる。Nakamura, Y., et al. "Codon usage tabulated from the international DNA sequence databases: status for the year 2000" Nucl. Acids Res. 28:292 (2000)参照。例えばGene Forge (Aptagen; Jacobus, Pa.)のような、特定の宿主細胞における発現のために特定の配列をコドン最適化するためのコンピュータアルゴリズムも利用可能である。いくつかの実施形態において、操作されたヌクレアーゼをコードする配列中の一つ以上のコドン(例えば1、2、3、4、5、10、15、20、25、50以上、または全てのコドン)は、特定のアミノ酸について最も頻繁に使用されるコドンに対応する。
パッケージング細胞は、典型的には、宿主細胞に感染し得るウイルス粒子を形成するために使用される。そのような細胞は、アデノウイルスをパッケージングする293細胞、およびレトロウイルスをパッケージングするpsi.2細胞またはPA317細胞を含む。遺伝子治療に使用されるウイルスベクターは、通常、核酸ベクターをウイルス粒子にパッケージする細胞株を作製することによって生成される。ベクターは、典型的には、パッケージングおよびその後の宿主への組み込みに必要な最小のウイルス配列を含み、他のウイルス配列は、発現されるべきポリヌクレオチドのための発現カセットによって置き換えられる。欠けているウイルス機能は、典型的にはパッケージング細胞株によってトランスに供給される。例えば、遺伝子治療に使用されるAAVベクターは、典型的には、パッケージングおよび宿主ゲノムへの組み込みに必要なAAVゲノムからのITR配列のみを有する。ウイルスDNAは、他のAAV遺伝子、すなわちrepおよびcapをコードするがITR配列を欠くヘルパープラスミドを含む細胞株においてパッケージングされ得る。細胞株は、ヘルパーとしてのアデノウイルスによっても感染され得る。ヘルパーウイルスは、AAVベクターの複製およびヘルパープラスミドからのAAV遺伝子の発現を促進することができる。場合によっては、ヘルパープラスミドは、ITR配列の欠如のために、有意な量ではパッケージングされない。アデノウイルスによる汚染は、例えばAAVよりもアデノウイルスの方が感受性である熱処理によって減少させることができる。
[マルチエフェクター核酸塩基エディターのアプリケーション]
マルチエフェクター核酸塩基エディターを用いて、目的のポリヌクレオチドを標的とし、タンパク質発現を改変する変化を作り出すことができる。一実施形態では、マルチエフェクター核酸塩基エディターは、スプライス部位、エンハンサー、および転写調節エレメントを含むがこれらに限定されない非コード配列または調節配列を改変するために使用される。次いで、当該技術分野で公知の任意の方法を用いて、その調節エレメントによって制御される遺伝子の発現に対する当該改変の影響をアッセイする。特定の実施形態において、マルチエフェクター核酸塩基エディターは、調節配列を実質的に変化させて、それによって、遺伝子発現を調節するその能力を消失させることができる。有利なことに、これは、他のRNAプログラミング可能ヌクレアーゼとは対照的に、ゲノム標的配列に二本鎖切断を生じることなく行うことができる。
マルチエフェクター核酸塩基エディターを用いて、目的のポリヌクレオチドを標的とし、タンパク質活性を改変する変化を作り出すことができる。例えば、突然変異誘発の文脈において、マルチエフェクター核酸塩基エディターは、エラープローンPCRおよび他のポリメラーゼベースの方法と比べて多くの利点を有する。本開示のマルチエフェクター核酸塩基エディターは、標的領域内の複数の塩基に変化を生じるので、そのような変異は、エラープローンPCRによって導入される変異と比較して、タンパク質レベルで発現される可能性がより高い。エラープローンPCRによって導入される変異は、コドン中の単一ヌクレオチド変化が依然として同じアミノ酸をコードし得ること(例えば、コドンの縮重)を考慮すると、タンパク質レベルで発現される可能性がより低い。ポリヌクレオチド全体にわたってランダムな変化を誘導するエラープローンPCRとは異なり、本開示のマルチエフェクター核酸塩基エディターは、対象タンパク質の小さな領域または限定された領域内の特定のアミノ酸を標的化するために使用できる。
他の実施形態において、本開示のマルチエフェクター核酸塩基エディターは、生物のゲノム内の目的のポリヌクレオチドを標的化するために使用される。一実施形態において、生物は、微生物叢の細菌(例えばBacteriodetes、Verrucomicrobia、Firmicutes;ガンマプロテオバクテリア、アルファプロテオバクテリア、Bacteriodetes、Clostridia、Erysipelotrichia、Bacilli;Enterobacteriales、Bacteriodales、Verrucomicrobiales、Clostridiales、Erysiopelotrichales、Lactobacillales;Enterobacteriaceae、Bacteroidaceae、Erysiopelotrichaceae、Prevotellaceae、Coriobacteriaceae、およびAlcaligenaceae;Escherichia、Bacteroides、Alistipes、Akkermansia、Clostridium、Lactobacillus)である。別の実施形態では、生物は農業上重要な動物(例えばウシ、ヒツジ、ヤギ、ウマ、ニワトリ、シチメンチョウ)または植物(例えばダイズ、コムギ、トウモロコシ、コメ、タバコ、リンゴ、ブドウ、モモ、プラム、チェリー)である。一実施形態において、本開示のマルチエフェクター核酸塩基エディターは、細胞のゲノム内の様々な配列をタイル状にカバーするために使用されるガイドRNAのライブラリーと共に細胞に送達され、それによってゲノム全体の配列を系統的に改変する。
突然変異を、種々のタンパク質のいずれかにおいて作製して、構造-機能分析を促進ささせ、またはタンパク質の内因性活性を変化させ得る。突然変異は、例えば、酵素(例えばキナーゼ、ホスファターゼ、カルボキシラーゼ、ホスホジエステラーゼ)または酵素基質、受容体またはそのリガンド、ならびに抗体およびその抗原において作製され得る。一実施形態では、マルチエフェクター核酸塩基エディターは、酵素の活性部位、受容体のリガンド結合部位、または抗体の相補性決定領域 (CDR) をコードする核酸分子を標的とする。酵素の場合、活性部位に変異を導入すると、酵素活性が増加、減少、または消失し得る。酵素に対する突然変異の影響は、当技術分野で知られるおよび/または当業者には明らかである多くのアッセイのいずれかを含む、酵素活性アッセイにおいて特徴付けされる。受容体の場合、リガンド結合部位に生成された変異は、リガンドに対する受容体の親和性を増加、減少、または消失させ得る。このような突然変異の効果は、当技術分野で知られるおよび/または当業者には明らかである多くのアッセイのいずれかを含む、受容体/リガンド結合アッセイにおいてアッセイされる。
[合成ライブラリー]
融合タンパク質ライブラリーおよびそれを使用して標準的塩基エディターと比較して選択的な好ましい塩基編集ウィンドウを可能とする塩基編集を最適化する方法が本明細書で提供される。いくつかの実施形態において、本開示は、複数の融合タンパク質を含む最適化された塩基編集のためのタンパク質ライブラリーを提供し、ここで複数の融合タンパク質のそれぞれは、Cas9ポリペプチドのN末端断片およびC末端断片によって隣接されるデアミナーゼを含み、融合タンパク質のそれぞれのN末端断片は複数の融合タンパク質の残りのN末端断片とは異なり、または融合タンパク質のそれぞれのC末端断片は複数の融合タンパク質の残りのC末端断片とは異なり、融合タンパク質のそれぞれのデアミナーゼは、標的ポリヌクレオチド配列中のプロトスペーサー隣接モチーフ (PAM) 配列に近接した標的核酸塩基を脱アミノ化し、N末端断片またはC末端断片は標的ポリヌクレオチド配列に結合する。いくつかの実施形態において、CRISPR R-ループ内の各核酸塩基について、複数の融合タンパク質の少なくとも1つは核酸塩基を脱アミノ化する。いくつかの実施形態において、PAM配列から1~20塩基対離れた標的ポリヌクレオチド内の各核酸塩基について、複数の融合タンパク質の少なくとも1つは核酸塩基を脱アミノ化する。いくつかの実施形態において、最適化された塩基編集を可能とする融合タンパク質ライブラリーを含むキットが本明細書で提供される。
いくつかの実施形態において、改変された塩基編集効率および/または特異性を有するアデノシン塩基エディターを生成するためにアデノシンデアミナーゼアリル、例えばTadAアリルの合成ライブラリーが利用され得る。いくつかの実施形態において、合成ライブラリーから生成されるアデノシン塩基エディターはより高い塩基編集効率および/または特異性を含む。いくつかの実施形態において、合成ライブラリーから生成されるアデノシン塩基エディターは、野生型TadAを有するアデノシン塩基エディターと比較して増加した塩基編集効率、増加した塩基編集特異性、低減したオフターゲット編集、低減したバイスタンダー編集、低減したインデル形成、および/または低減した目的外編集を呈する。いくつかの実施形態において、合成ライブラリーから生成されるアデノシン塩基エディターは、TadA*7.10を有するアデノシン塩基エディターと比較して増加した塩基編集効率、増加した塩基編集特異性、低減したオフターゲット編集、低減したバイスタンダー編集、低減したインデル形成、および/または低減した目的外編集を呈する。いくつかの実施形態において、合成ライブラリーは、ABEの無作為化されたTadA部分を含む。いくつかの実施形態において、合成ライブラリーは、TadAの各位置における20個すべての標準的アミノ酸置換を含む。いくつかの実施形態において、合成ライブラリーは、ライブラリーメンバー当たり1~2個のヌクレオチド置換突然変異の平均頻度を含む。いくつかの実施形態において、合成ライブラリーは、TadA*7.10において見出されるバックグラウンド突然変異を含む。
[医薬組成物]
本開示の他の態様は、本明細書に記載の任意の塩基エディター、融合タンパク質、または融合タンパク質-ガイドポリヌクレオチド複合体を含む医薬組成物に関する。用語「医薬組成物」は、本明細書で使用される場合、薬学的使用のために製剤化された組成物を指す。いくつかの実施形態において、医薬組成物は、薬学的に許容される担体をさらに含む。いくつかの実施形態において、医薬組成物は、さらなる剤(例えば特異的送達、半減期の延長のためのもの、または他の治療化合物)を含む。
ここで使用されるところの用語「薬学的に許容される担体」は、液体または固体の充填剤、希釈剤、賦形剤、製造助剤(例えば潤滑剤、タルクマグネシウム、ステアリン酸カルシウムまたはステアリン酸亜鉛、あるいはステアリン酸)、または溶媒カプセル化材料などの、身体のある部位(例えば送達部位)から別の部位(例えば器官、組織または身体の一部)への化合物の運搬または輸送に関与する薬学的に許容される材料、組成物またはビヒクルを意味する。薬学的に許容される担体は、製剤の他の成分と適合し、対象の組織に有害でないという意味で許容される(例えば生理的適合性、無菌性、生理的pH等)。
薬学的に許容される担体として役立つことができる物質のいくつかの非限定的な例は、以下を含む: (1) ラクトース、グルコースおよびスクロースのような糖;(2) コーンスターチ、ジャガイモでん粉等のでん粉;(3) セルロース及びその誘導体 (カルボキシメチルセルロースナトリウム、メチルセルロース、エチルセルロース、微結晶セルロース、酢酸セルロース等);(4) トラガント末;(5) モルト;(6)ゼラチン;(7) ステアリン酸マグネシウム、ラウリル硫酸ナトリウム、タルク等の潤滑剤;(8) ココアバター、坐剤用ワックス等の添加剤;(9) 落花生油、綿実油、ベニバナ油、ゴマ油、オリーブ油、コーン油、大豆油等の油;(10) プロピレングリコール等のグリコール;(11) ポリオール、例えばグリセリン、ソルビトール、マンニトール及びポリエチレングリコール (PEG); (12) エステル、例えばオレイン酸エチルおよびラウリン酸エチルなど;(13) 寒天;(14) 水酸化マグネシウム、水酸化アルミニウム等の緩衝剤;(15) アルギン酸;(16) パイロジェンフリー水;(17) 生理食塩液;(18) リンガー液;(19)エチルアルコール;(20) pH緩衝液;(21) ポリエステル、ポリカーボネート及び/又はポリ無水物;(22) ポリペプチドおよびアミノ酸のような増量剤 (23) エタノールのような血清アルコール;及び (23) 製剤に使用される他の非毒性適合性物質。湿潤剤、着色剤、離型剤、コーティング剤、甘味剤、風味料、香料、保存剤および抗酸化剤も製剤中に存在させることができる。「賦形剤」、「担体」、「薬学的に許容される担体」、「ビヒクル」などの用語は、本明細書では交換可能に使用される。
医薬組成物は、約5.0~約8.0の範囲などの生理学的pHを反映する所定のレベルに製剤のpHを維持するために、一つ以上のpH緩衝化合物を含むことができる。水性液体製剤で使用されるpH緩衝化合物は、アミノ酸またはヒスチジンなどのアミノ酸の混合物、またはヒスチジンおよびグリシンなどのアミノ酸の混合物であり得る。あるいは、pH緩衝化合物は、好ましくは、製剤のpHを所定のレベル、例えば約5.0~約8.0の範囲に維持し、カルシウムイオンをキレートしない剤である。このようなpH緩衝化合物の典型的な例としては、イミダゾールおよび酢酸イオンが挙げられるが、これらに限定されない。pH緩衝化合物は、製剤のpHを所定のレベルに維持するのに適した任意の量で存在し得る。
医薬組成物はまた、一つ以上の浸透圧調節剤、すなわち、処方物の浸透圧特性(例えば、等張性、オスモラリティ、および/または浸透圧)をレシピエント個体の血流および血液細胞にとって許容可能なレベルに調節する化合物を含有することができる。浸透圧調節剤は、カルシウムイオンをキレートしない薬剤であり得る。浸透圧調節剤は、製剤の浸透圧特性を調節する当業者に公知または入手可能な任意の化合物であり得る。当業者は、本発明の処方における使用のための所定の浸透圧調節剤の適合性を経験的に決定することができる。適切なタイプの浸透圧調節剤の例示的な例としては、塩化ナトリウムおよび酢酸ナトリウムのような塩;スクロース、デキストロース、マンニトールなどの糖;グリシンなどのアミノ酸;これらの薬剤および/または薬剤タイプの1つ以上の混合物が挙げられるが、これらに限定されない。浸透圧調節剤は、製剤の浸透圧特性を調節するのに十分な任意の濃度で存在し得る。
いくつかの実施形態において、医薬組成物は、対象への送達のために、例えば遺伝子編集のために製剤化される。本明細書に記載の医薬組成物を投与する適切な経路は、限定されるものではないが、局所、皮下、経皮、皮内、病巣内、関節内、腹腔内、膀胱内、経粘膜、歯肉、歯内、蝸牛内、経鼓膜、器官内、硬膜外、髄腔内、筋肉内、静脈内、血管内、骨内、眼周囲、腫瘍内、脳内、および脳室内投与を含む。
いくつかの実施形態において、本明細書に記載の医薬組成物は、疾患部位(例えば腫瘍部位)に局所的に投与される。いくつかの実施形態において、本明細書に記載される医薬組成物は、注射、カテーテル、坐剤、またはインプラントによって、対象に投与され、インプラントは、多孔質、非多孔質、またはゼラチン質材料であり、例えば、シアラスティック膜、または繊維などの膜を含む。
他の実施形態において、本明細書に記載される医薬組成物は、制御放出システムにおいて送達される。一実施形態では、ポンプを使用することができる(例えばLanger, 1990, Science 249: 1527-1533; Sefton, 1989, CRC Crit. Ref. Biomed. Eng. 14:201; Buchwald et al., 1980, Surgery 88:507; Saudek et al., 1989, N. Engl. J. Med. 321:574参照)。別の実施形態では、ポリマー材料を使用することができる。(例えばMedical Applications of Controlled Release (Langer and Wise eds., CRC Press, Boca Raton, Fla., 1974); Controlled Drug Bioavailability, Drug Product Design and Performance (Smolen and Ball eds., Wiley, New York, 1984); Ranger and Peppas, 1983, Macromol. Sci. Rev. Macromol. Chem. 23:61. See also Levy et al., 1985, Science 228: 190; During et al., 1989, Ann. Neurol. 25:351; Howard et ah, 1989, J. Neurosurg. 71: 105.)。他の制御放出システムは、例えば、上記Langerに記載されている。
いくつかの実施形態において、医薬組成物は、対象、例えばヒトへの静脈内または皮下投与に適合された組成物として、ルーチンの手順に従って製剤化される。いくつかの実施形態において、注射による投与のための医薬組成物は、可溶化剤としての無菌等張使用の溶液および注射部位の痛みを緩和するためのリグノカインなどの局所麻酔薬である。一般に、成分は、単位投与形態、例えば、活性剤の量を示すアンプルまたはサシェットのような密閉容器内の乾燥凍結乾燥粉末または水を含まない濃縮物として、別々にまたは一緒に供給される。薬剤が注入によって投与される場合には、無菌の医薬グレードの水または生理食塩水を含む注入ボトルを用いてそれを分注することができる。医薬組成物が注射によって投与される場合、投与前に成分を混合することができるように、注射用滅菌水または生理食塩水のアンプルを提供することができる。
全身投与のための医薬組成物は、液体、例えば滅菌生理食塩水、乳酸化リンゲル液またはハンク液であり得る。さらに、医薬組成物は、固体形態であって、使用の直前に再溶解または懸濁され得る。凍結乾燥形態もまた考えられる。医薬組成物は、非経口投与にも適した、リポソームまたは微結晶などの脂質粒子または小胞内に含有することができる。粒子は、組成物がその中に含まれる限り、単ラメラまたは複数ラメラのような任意の適切な構造であり得る。化合物は、融合性脂質ジオレオイルホスファチジルエタノールアミン(DOPE)、低量(5-10モル%)のカチオン性脂質を含み、ポリエチレングリコール (PEG) コーティングにより安定化された、「安定化プラスミド脂質粒子」(SPLP)中に捕捉され得る (Zhang Y. P. et ah, Gene Ther. 1999, 6: 1438-47)。このような粒子および小胞には、N-[l-(2,3-ジオレオイルキシ)プロピル]-N,N,N-トリメチル-アモニウムメチル硫酸塩、あるいは「DOTAP」のような正電荷脂質が特に好ましい。このような脂質粒子の調製はよく知られている。例えば、米国特許第4,880,635;4,906,477;4,911,928;4,917,951;4,920,016;および4,921,757号参照(その各々は、参照により本明細書に組み込まれる)。
本明細書に記載の医薬組成物は、例えば、単位用量として投与または包装することができる。「単位用量」という用語は、本開示の医薬組成物に関して使用される場合、対象のための単一用量として適した物理的に個別の単位を指し、各単位は、必要な希釈剤(例えば担体、またはビヒクル)と合わせて所望の治療効果を生じるように計算された所定量の活性物質を含有する。
さらに、この医薬組成物は、 (a) 凍結乾燥形態の本開示の化合物を含有する容器、および (b) 本開示の凍結乾燥化合物の再構成または希釈のために使用される、薬学的に許容される希釈剤 (例えば無菌のもの) を含有する第2の容器を含む薬学的キットとして提供することができる。必要に応じて、そのような容器には、医薬品又は生物学的製剤の製造、使用又は販売を規制する政府機関によって規定された様式の通知であって、人に投与するための製造、使用又は販売の機関による承認を反映するものとすることができる。
別の態様では、上記疾患の治療に有用な材料を含む製品が含まれる。いくつかの実施形態において、製品は、容器及びラベルを含む。適切な容器は、例えばボトル、バイアル、シリンジ、および試験管を含む。容器は、ガラスまたはプラスチックなどの様々な材料から形成することができる。いくつかの実施形態において、容器は、本明細書に記載される疾患を治療するために有効である組成物を保持し、無菌アクセスポートを有し得る。例えば、容器は、静脈内溶液バッグ、または皮下注射針によって穿刺可能なストッパーを有するバイアルであり得る。組成物中の活性剤は、本開示の化合物である。いくつかの実施形態において、容器上のまたは容器に付随するラベルは、選択される疾患を治療するために組成物が使用されることを示す。製品は、リン酸緩衝生理食塩水、リンゲル液、またはデキストロース溶液などの薬学的に許容される緩衝液を含む第2の容器をさらに含むことができる。さらに、他の緩衝剤、希釈剤、フィルター、針、注射器、および使用説明書付き添付文書を含め、商業的観点および使用者の観点から望ましい他の物質を含むことができる。
いくつかの実施形態において、本明細書に記載される融合タンパク質、gRNA、および/または複合体のいずれかは、医薬組成物の一部として提供される。いくつかの実施形態において、医薬組成物は、本明細書に提供される融合タンパク質のいずれかを含む。いくつかの実施形態において、医薬組成物は、本明細書に提供される複合体のいずれかを含む。いくつかの実施形態において、医薬組成物は、gRNAおよびカチオン性脂質と複合体を形成するRNA-ガイドヌクレアーゼ(例えばCas9)を含むリボ核タンパク質複合体を含む。いくつかの実施形態において、医薬組成物は、gRNA、核酸プログラム可能DNA結合タンパク質、カチオン性脂質、および薬学的に許容される賦形剤を含む。医薬組成物は、場合により、1つ以上の追加の治療活性物質を含むことができる。
いくつかの実施形態において、本明細書で提供される組成物は、対象内で標的化されたゲノム改変を行うために、対象、例えばヒト対象に投与される。いくつかの実施形態において、対象から細胞が取得され、本明細書中に提供される医薬組成物のいずれかと接触される。いくつかの実施形態において、対象から取り出されて医薬組成物とex vivoで接触された細胞は、任意で、所望のゲノム改変が細胞内で行われたかまたは検出された後に、対象に再導入される。ヌクレアーゼを含む医薬組成物を送達する方法は公知であり、例えば米国特許第6,453,242号、6,503,717号、6,534,261号、6,599,692号、6,607,882号、6,689,558号、6,824,978号、6,933,113号、6,979,539号、7,013,219号、および7,163,824号に記載されており、それらの全ての開示は、その全体が参照により本明細書に組み込まれる。本明細書で提供される医薬組成物の説明は、主として、ヒトへの投与に適した医薬組成物に向けられているが、当業者には、そのような組成物が、あらゆる種類の動物または生物への投与、例えば獣医学的使用に一般的に適していることが理解される。
種々の動物への投与に適した組成物を与えるための、ヒトへの投与に適した医薬組成物の改変は十分に理解されており、通常の熟練した獣医薬理学者は、もし必要だとしても単に通常の実験で、そのような改変を設計および/または実施することができる。医薬組成物の投与が意図される対象には、限定されるものではないが、ヒトおよび/または他の霊長類;哺乳動物、家畜、ペット、およびウシ、ブタ、ウマ、ヒツジ、ネコ、イヌ、マウス、および/またはラットなどの商業的に関連のある哺乳動物;ニワトリ、カモ、ガチョウ及び/又は七面鳥のような商業的に関連のある鳥類が含まれる。
本明細書に記載される医薬組成物の製剤は、薬学の分野において公知の、または今後開発される任意の方法によって調製することができる。一般に、このような調製方法は、活性成分を賦形剤および/または1つ以上の他の補助成分と会合させ、次いで、必要および/または所望であれば、製品を所望の単回または複数回投与単位に成形および/または包装する工程を含む。薬学的製剤はさらに、薬学的に許容される賦形剤を含むことができ、それは、本明細書で使用される場合、所望の特定の剤形に適した、溶媒、分散媒体、希釈剤、または他の液体ビヒクル、分散または懸濁助剤、界面活性剤、等張剤、増粘剤または乳化剤、保存剤、固体結合剤、潤滑剤などのいずれかおよび全てを含む。Remington’s The Science and Practice of Pharmacy, 21st Edition, A. R. Gennaro (Lippincott, Williams & Wilkins, Baltimore, MD, 2006(参照によりその全体が本明細書に組み込まれる)は、医薬組成物を製剤化する際に使用される種々の賦形剤およびその調製のための公知の技術を開示する。ヌクレアーゼを含む医薬組成物を製造するためのさらなる適切な方法、試薬、賦形剤および溶媒については、参照によりその全体が本明細書に組み込まれるPCT出願PCT/US2010/055131(2010年11月2日出願、公開番号WO2011/053982 A8)も参照のこと。
あらゆる従来の賦形剤媒体は、望ましくない生物学的効果を生じさせること、または他のかたちで医薬組成物の何らかの他の成分と有害な様式で相互作用することなどによって、物質またはその誘導体と不適合である場合を除き、その使用が本開示の範囲内にあると考えられる。
上記の組成物は、有効量で投与することができる。有効量は、投与方法、治療される特定の状態、および所望の結果に依存する。それはまた、状態のステージ、対象の年齢および身体的状態、もしあれば併用療法の性質、および医師によく知られた同様の因子に依存し得る。治療用途のためには、それは医学的に望ましい結果を達成するのに十分な量である。
いくつかの実施形態において、本開示による組成物は、様々な疾患、障害、および/または状態のいずれかの処置のために使用され得る。
[キット]
本開示の様々な態様は、塩基エディターシステムを含むキットを提供する。一実施形態において、キットは、核酸塩基エディター融合タンパク質をコードするヌクレオチド配列を含む核酸構築物を含む。融合タンパク質は、デアミナーゼ(例えばアデニンデアミナーゼ)および核酸プログラム可能なDNA結合タンパク質(napDNAbp) を含む。いくつかの実施形態において、キットは、目的の核酸分子を標的化することができる少なくとも1つのガイドRNAを含む。いくつかの実施形態において、キットは、少なくとも1つのガイドRNAをコードするヌクレオチド配列を含む核酸構築物を含む。
キットは、いくつかの実施形態において、1つまたは複数の突然変異を編集するためにキットを使用するための使用説明書を提供する。説明書は、一般に、核酸分子を編集するためのキットの使用に関する情報を含む。他の実施形態では、説明書は、以下のうちの少なくとも1つを含む:注意事項;警告;臨床試験;および/または参考資料。使用説明書は、容器(もしあれば)に直接印刷するか、容器に貼付するラベルとして印刷するか、または容器内にもしくは容器と共に提供される独立したシート、パンフレット、カードまたはフォルダーとして印刷され得る。さらなる実施形態では、キットは、適切な動作パラメータのためのラベルまたは別個のインサート(添付文書)の形態で説明書を含むことができる。さらに別の実施形態では、キットは、検出、較正、または正規化のための標準として使用される、適切なポジティブおよびネガティブコントロールまたは対照サンプルを有する1つ以上の容器を含むことができる。キットは、(滅菌) リン酸緩衝生理食塩水、リンゲル液、またはデキストロース溶液などの薬学的に許容される緩衝液を含む第2の容器をさらに含むことができる。さらに、他の緩衝剤、希釈剤、フィルター、針、注射器、および使用説明書付きの添付文書を含む、商業的観点および使用者の観点から望ましい他の物質を含むことができる。
本開示の実施は、別段の表示がない限り、分子生物学(組換え技術を含む)、微生物学、細胞生物学、生化学および免疫学の従来の技術を利用し、これらは当業者の技量の範囲内である。そのような技術は、“Molecular Cloning: A Laboratory Manual”, second edition (Sambrook, 1989); “Oligonucleotide Synthesis” (Gait, 1984); “Animal Cell Culture” (Freshney, 1987); “Methods in Enzymology” “Handbook of Experimental Immunology” (Weir, 1996); “Gene Transfer Vectors for Mammalian Cells” (Miller and Calos, 1987); “Current Protocols in Molecular Biology” (Ausubel, 1987); “PCR: The Polymerase Chain Reaction”, (Mullis, 1994); “Current Protocols in Immunology” (Coligan, 1991)などの文献で詳しく説明されている。これらの技術は、本開示のポリヌクレオチドおよびポリペプチドの製造に適用可能であり、したがって、本開示の製造および実施において考慮され得る。特定の実施形態のために特に有用な技術は、以下のセクションで論じられる。
以下の実施例は、当業者に本発明のアッセイ、スクリーニング、および治療方法をいかに作って使用するかの完全な開示および説明を提供するために記載されており、本発明者らがその発明とみなすものの範囲を限定することを意図するものではない。
[実施例1:編集効率が増加したアデノシン塩基エディター]
Tad7.10-dCas9融合タンパク質を含む塩基編集系は、およそ10~20%の効率で標的ポリヌクレオチドを編集し得るが、より高い効率を要する使用では、これらの使用は限定され得る。増加した効率および特異性を有するアデニン塩基エディターを同定するための試みにおいて、アデノシンデアミナーゼTadA 7.10を含む構築物をエラープローンPCRによって突然変異生成し、その後、核酸プログラム可能なDNA結合タンパク質であるdCas9をコードする核酸配列に隣接して、発現ベクターにクローニングした(図1A、図2B)。アデノシンデアミナーゼバリアントを含む発現ベクターを、クロラムフェニコール耐性(CamR)およびスペクチノマイシン耐性(SpectR)をコードし、2つの点突然変異によって非機能的にされたカナマイシン耐性遺伝子を有する選択プラスミドと共に、コンピテント細菌細胞に同時形質転換した(進化ラウンド7の戦略)(図1B、図2B)。細胞を、アデノシンデアミナーゼ活性についてのリードアウトであるカナマイシン耐性の回復について選択した。その後の選択ラウンドにおいて、発現ベクターを、クロラムフェニコール耐性(CamR)およびスペクチノマイシン耐性(SpectR)をコードし、3つの点突然変異によって非機能的にされたカナマイシン耐性遺伝子を有するプラスミドと共に、コンピテント細胞に同時形質転換した(進化ラウンド8の戦略)(図1C、図2B)。不活性化されたカナマイシン耐性遺伝子の核酸配列を以下に示す。
Figure 2022520081000082
上記の配列において、小文字はカナマイシン耐性プロモーター領域を示し、太字の配列は標的化された不活化部分を示し(Q4およびW15)、斜体の配列は、カナマイシン耐性遺伝子の標的化された不活性部位を示し(D208N)、そして、下線を引かれた配列はPAM配列を示す。
再び、細胞を、増加カナマイシン濃度を有する一連のアガロースプレートに播種した。図2Cに示すように、効率的な塩基編集活性を有するアデノシンデアミナーゼバリアントは、カナマイシン耐性遺伝子内に存在する突然変異を補正することができ、さらなる分析に選択された。細菌細胞において効率的な塩基編集を示すアデノシンデアミナーゼバリアント塩基エディターが、表14に記載されている。選択されたアデノシンデアミナーゼバリアントを含む塩基エディターをコードする哺乳動物発現ベクターを生成した。
E6V(E7Vとも呼ばれる)突然変異を含む鎌状赤血球症に関連するβ-グロビンタンパク質を発現するHek293T細胞を使用して、アデノシンデアミナーゼバリアントの編集効率を試験した(図3Aおよび図3B)。「Hek293T/HBBE6V」細胞と呼ばれるこれらの細胞に、表14で列挙されるABE8を含む融合タンパク質を含む塩基編集系を発現するレンチウイルスベクターを使用して形質導入した。循環置換Cas9および二分核定位配列を含む足場内でアデノシンデアミナーゼバリアントをクローニングすることによって、ABE8を生成した。循環置換Cas9は当技術分野において知られており、例えば、Oakes et al., Cell 176, 254-267, 2019に記載されている。これらの配列は、本明細書において以下で提供される。
胎児ヘモグロビンの上方調節は、鎌状赤血球症を克服するための治療アプローチである。図3Aは、胎児ヘモグロビンの上方調節について治療上関連のある部位を示す。残基5および8のアデノシンの編集は、BCL11Aの結合を有意に低減させ得、それによって、胎児ヘモグロビンの発現を増加させ得る。図3Aを参照すると、ABE8は、ABE7.10よりもおよそ2~3倍高い塩基編集活性を示した。
表14:新規アデニン塩基エディターABE8
Figure 2022520081000083
図4を参照すると、ABE8が、HBB E6Vをコードするポリヌクレオチドを標的化する18、19、20、21、または22ヌクレオチドのガイドRNAと共に、Hek293T/HBBE6V細胞に導入された。ABE8エディターは、循環置換(Cp)-Cas9に融合された場合、編集効率の増加を示した。全部で、40の異なるABE8構築物(表15)および3つのABE7.10構築物が、Hek293T/HBBE6V細胞における編集活性について試験された。例示的な構築物の配列を以下に示す。編集の特異性を評価するために、標的突然変異および非意図的なまたはバイスタンダーの突然変異をモニタリングした(図5)。コドン5におけるアデノシンの非意図的な編集は、サイレントであった。しかし、コドン9の非意図的な編集によって、セリンからプロリンへの突然変異が生じた。再び図5を参照すると、複数のABE8が、ABE7.10エディターと比較して増加した編集効率および特異性を示し、いずれのエディターも、セリンからプロリンへのミスセンス突然変異を生じさせる著しいバイスタンダー編集を有していなかった。
選択されたABE8およびABE7.10対照のさらなる分析を、鎌状赤血球突然変異を含む線維芽細胞において行った。図6で示すように、ABE8エディターは、ABE7.10と比較して塩基編集活性が増加していた。ABE8.18は、およそ70%の効率を示した。選択されたABE8エディターはまた、前例のない特異性も示した。重要なことに、全てのABE8エディターでの平均INDEL形成は0.1%未満であった。
Figure 2022520081000084
Figure 2022520081000085
[実施例2:ABE8の設計のためのコドン最適化およびNLSの選択]
Cas9のコドン使用および核局在化配列が真核生物におけるゲノム編集効率を大きく改変し得ることが分かっている(例えば、Kim, S. et al., Rescue of high-specificity Cas9 variants using sgRNAs with matched 5' nucleotides. Genome Biol 18, 218, doi:10.1186/s13059-017-1355-3 (2017)、Mikami, M. et al., Comparison of CRISPR/Cas9 expression constructs for efficient targeted mutagenesis in rice. Plant Mol Biol 88, 561-572, doi:10.1007/s11103-015-0342-x (2015)、Jinek, M. et al., RNA-programmed genome editing in human cells. Elife 2, e00471, doi:10.7554/eLife.00471 (2013)を参照されたい)。塩基エディターのオリジナルのCas9n成分は6つの潜在的なポリアデニル化部位を含み、真核生物における発現を少なくする(例えば、Kim, S. et al., Rescue of high-specificity Cas9 variants using sgRNAs with matched 5' nucleotides. Genome Biol 18, 218, doi:10.1186/s13059-017-1355-3 (2017)、Komor, A. C. et al., Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage. Nature 533, 420-424, doi:10.1038/nature17946 (2016)、Gaudelli, N. M. et al. Programmable base editing of A*T to G*C in genomic DNA without DNA cleavage. Nature 551, 464-471, doi:10.1038/nature24644 (2017)を参照されたい)。これを、広く最適化されたコドン配列で置き換えると、塩基編集効率が向上する(例えば、Cong, L. et al. Multiplex genome engineering using CRISPR/Cas systems. Science 339, 819-823, doi:10.1126/science.1231143 (2013)、Koblan, L. W. et al. Improving cytidine and adenine base editors by expression optimization and ancestral reconstruction. Nat Biotechnol, doi:10.1038/nbt.4172 (2018)、Zafra, M. P. et al. Optimized base editors enable efficient editing in cells, organoids and mice. Nat Biotechnol, doi:10.1038/nbt.4194 (2018)を参照されたい)。
4つのABE構築物を伴うDNAオンターゲット(図9A、図9B)、DNAオフターゲット(図9C、図9D)、およびRNAオフターゲット(図9E)塩基編集の頻度を評価したが、これらの全ては、コドン最適化されたCas9(D10A)を含んでいる(Cong, L. et al. Multiplex genome engineering using CRISPR/Cas systems. Science 339, 819-823, doi:10.1126/science.1231143 (2013)):i)単一のC末端BP-SV40 NLSを有するABE7.10、ii)ABE7.10の5’TadA野生型部分を欠くmonoABE7.10、iii)コドン最適化されたTadA領域および2つのBPNLS配列を含むABEmax、ならびにiv)ABEmaxとしてのTadAのコドン最適化を有するが単一のC末端BP-SV40 NLSを含むABEmax(-BPNLS)。
4つの構築物の全てが、著しく類似したオンターゲット編集効率を示し、このことは、NLSのアーキテクチャーおよびTadAのコドン最適化がオンターゲット編集効率を決定するものではないことを示している(図9A、図9B)。オフターゲットプロファイルもまた非常に類似していたが、ABEmaxは、ABE7.10と比較した場合、1つの部位で、より優れたDNAオフターゲット編集を示した(p=0.00027、ステューデントの両側T検定)(図9C、図9D)。ABEmax(-NBPNLS)は、ABE7.10よりも1.6倍高いRNAオフターゲット編集の平均頻度を示した(図9E)。2×BPNLSとで、オンターゲット編集効率に差はなかった。
[実施例3:拡張された標的化範囲を有する優れたアデニン塩基エディター]
アデニン塩基エディター(ABE)は、標的DNAにおいて、二本鎖切断(DSB)を生じさせることなく、アデニンからグアニンへの効率的なプログラム可能な変換を可能にする(Gaudelli, N. M. et al. Programmable base editing of A*T to G*C in genomic DNA without DNA cleavage. Nature 551, 464-471, doi:10.1038/nature24644 (2017)、Komor, A. C., et al. Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage. Nature 533, 420-424, doi:10.1038/nature17946 (2016)、Rees, H. A. & Liu, D. R. Base editing: precision chemistry on the genome and transcriptome of living cells. Nat Rev Genet 19, 770-788, doi:10.1038/s41576-018-0059-1 (2018))。ABEは、触媒機能が失われたCas9タンパク質(D10AニッカーゼCas9、nCas9)に共有結合で融合している進化したE. coli tRNAARG修飾酵素であるTadAを含む分子機械である(図7Aおよび図7B)。ガイドRNA(gRNA)はABEを標的ゲノムDNA配列に向け、そして、結合および安定なR-ループの形成がなされると、一本鎖ヌクレオチドの短鎖がTadAに接近可能となり、TadAがアデニンをイノシンに化学的に変換する。イノシンは、DNAポリメラーゼ結合ポケットにおいてシトシンと排他的に塩基対合し(Yasui, M. et al. Miscoding properties of 2'-deoxyinosine, a nitric oxide-derived DNA Adduct, during translesion synthesis catalyzed by human DNA polymerases. J Mol Biol 377, 1015-1023, doi:10.1016/j.jmb.2008.01.033 (2008))、DNA複製または鎖の切除およびニックの修復の後に、ユーザー定義の塩基対でABE触媒型のA・TからG・Cへの塩基転位型突然変異を生じさせる(図7A)。
第7世代のABE(ABE7)によって、ヒト(Zeng, Y. et al. Correction of the Marfan Syndrome Pathogenic FBN1 Mutation by Base Editing in Human Cells and Heterozygous Embryos. Molecular Therapy, doi:10.1016/j.ymthe.2018.08.007 (2018))、マウス(Liu, Z. et al. Highly efficient RNA-guided base editing in rabbit. Nat Commun 9, 2717, doi:10.1038/s41467-018-05232-2 (2018)、Song, C.-Q. et al. Adenine base editing in an adult mouse model of tyrosinaemia. Nature Biomedical Engineering, doi:10.1038/s41551-019-0357-8 (2019)、Ryu, S. M. et al. Adenine base editing in mouse embryos and an adult mouse model of Duchenne muscular dystrophy. Nat Biotechnol, doi:10.1038/nbt.4148 (2018))、細菌(Gaudelli, N. M. et al. Programmable base editing of A*T to G*C in genomic DNA without DNA cleavage. Nature 551, 464-471, doi:10.1038/nature24644 (2017))、植物(Hua, K., et al. Precise A.T to G.C Base Editing in the Rice Genome. Mol Plant 11, 627-630, doi:10.1016/j.molp.2018.02.007 (2018)、Yan, F. et al. Highly Efficient A.T to G.C Base Editing by Cas9n-Guided tRNA Adenosine Deaminase in Rice. Mol Plant 11, 631-634, doi:10.1016/j.molp.2018.02.008 (2018))、および様々な他の種(Rees, H. A. & Liu, D. R. Publisher Correction: Base editing: precision chemistry on the genome and transcriptome of living cells. Nat Rev Genet 19, 801, doi:10.1038/s41576-018-0068-0 (2018))のゲノムにおいてA・TからG・Cへの効率的な変換が可能となっている。しかし、一部の状況では、ABE7などの塩基エディターを、例えば修飾された塩基編集ウィンドウ、非NGG Cas9バリアントとの向上した適合性(例えば、Huang, T. P. et al. Circularly permuted and PAM-modified Cas9 variants broaden the targeting scope of base editors. Nat Biotechnol 37, 626-631, doi:10.1038/s41587-019-0134-y (2019)、Hua, K., Tao, X. & Zhu, J. K. Expanding the base editing scope in rice by using Cas9 variants. Plant Biotechnol J, doi:10.1111/pbi.12993 (2018)、Yang, L. et al. Increasing targeting scope of adenosine base editors in mouse and rat embryos through fusion of TadA deaminase with Cas9 variants. Protein Cell 9, 814-819, doi:10.1007/s13238-018-0568-x (2018)を参照されたい)、ヒト細胞株などにおける向上した塩基編集効率(例えば、Rees, H. A., et al. Development of hRad51-Cas9 nickase fusions that mediate HDR without double-stranded breaks. Nat Commun 10, 2212, doi:10.1038/s41467-019-09983-4 (2019)を参照されたい)を有するように操作することが、または、in vivoで使用する場合(例えば、Ryu, S. M. et al. Adenine base editing in mouse embryos and an adult mouse model of Duchenne muscular dystrophy. Nat Biotechnol, doi:10.1038/nbt.4148 (2018)を参照されたい)および/もしくは標的アデニンがカノニカルなABE編集ウィンドウの外縁(位置3、4、7、および8)に位置する場合が、有利であり得る。
これまでのアデニン塩基エディターを改善するために、細菌選択系のストリンジェンシー(Gaudelli, N. M. et al. Programmable base editing of A*T to G*C in genomic DNA without DNA cleavage. Nature 551, 464-471, doi:10.1038/nature24644 (2017)を参照されたい)を、抗生物質選択を生き残るために3つの同時のA・TからG・Cへの変換編集を行わなければならないABEを設計することによって増加させた(図2Bおよび図2C)。これまでのABEの進化では、TadAライブラリーはエラープローンPCRを介して作成された。対照的に、ライブラリーメンバー当たり1~2のヌクレオチド置換突然変異の平均頻度を有する、TadAの各位置での20のカノニカルなアミノ酸置換の全てを含む、TadAアリルの合成ライブラリーを利用した(図7C)。この化学的に合成されたライブラリーによって、エラープローンPCR技術で達成可能な、より大きな配列空間への接近が可能となった(Gaudelli, N. M. et al. Programmable base editing of A*T to G*C in genomic DNA without DNA cleavage. Nature 551, 464-471, doi:10.1038/nature24644 (2017)を参照されたい)。
約300のクローンを単離し、その後、配列決定した。得られた配列決定データから、高い頻度で富んでいた8つの突然変異をTadA内で同定した(表7および表9)。8つの同定されたアミノ酸突然変異のうち6つは、コドン当たり少なくとも2つの核酸塩基の変化を必要とし、このことは、これまでのTadAエラープローンライブラリーでは観察されなかった。豊富な突然変異のうちの2つは、アデニン脱アミノ化の活性部位に近い残基を改変する(I76およびV82)(図7D)。TadA7.10のC末端アルファヘリックスにおける4つのこれまでに報告された突然変異に加えて、2つの新たな突然変異が同一のアルファヘリックス内で観察された(Y147RおよびQ154R)(図7D)。この高度に突然変異したアルファヘリックスは、トランケーションの際に塩基編集効率が実質的に低減したため、ロバストな生成物の形成に必要である(図10A~図10D)。
哺乳動物細胞におけるTadAバリアントの活性を試験するために、ABEコドンの最適化およびNLSの方向付けを、最も好ましいオンターゲットおよびオフターゲットプロファイルと共に利用した(実施例2、図9A~図9Eを参照されたい)。8つの豊富なTadA突然変異をABE7.10に様々な組合せで組み込み、40の新たなABE8バリアントを得た(表7および表9)。ABEのTadA領域が、野生型(TadA)と進化した(TadA)プロモーターまたは操作されたTadAの単一のプロモーターとのいずれかのヘテロ二量体融合体である、ABE8構築物の2つのアーキテクチャーバリアントが作製され、約500塩基対の、より小さなエディターが得られた。これらのアーキテクチャーバリアントは、それぞれABE8.x-dおよびABE8.x-mと呼ばれる(表7および表9)。
まず、これらの40の構築物を、ABE7.10と比較したこれらのオンターゲットDNA編集効率について、カノニカルな20ntのS. pyogenesプロトスペーサー内の2から20(ここで、NGG PAM=位置21、22、23)までの範囲の位置に標的「A」塩基を含有する8つのゲノム部位にわたって評価した(図11Aおよび図11B)。N末端の野生型TadA構築物は、ABE8を使用するロバストなDNA編集には不要であった(Grunewald, J. et al. CRISPR DNA base editors with reduced RNA off-target and self-editing activities. Nat Biotechnol 37, 1041-1048, doi:10.1038/s41587-019-0236-6 (2019)、Rees, H. A., et al. Analysis and minimization of cellular RNA editing by DNA adenine base editors. Sci Adv 5, eaax5717, doi:10.1126/sciadv.aax5717 (2019)、Hua, K. et al. Simplified adenine base editors improve adenine base editing efficiency in rice. Plant Biotechnol J, doi:10.1111/pbi.13244 (2019)も参照されたい)。N末端の野生型TadAを含有する構築物(ABE8.x-d)は、編集ウィンドウの両優先性、すなわち、総DNA編集アウトカムおよびINDEL頻度に関して、その節約型のアーキテクチャー(ABE8.x-m)と同様に機能する(図7E、図11Aおよび図11B、図12)。構築物内でのTadA(wt):TadA8の二量化はABE8の活性に不要であり得るが、このことは、植物核で見られているようなABE8発現塩基エディター間で生じるin trans TadA8:TadA8二量化の可能性を排除しない(Hua, K. et al. Simplified adenine base editors improve adenine base editing efficiency in rice. Plant Biotechnol J, doi:10.1111/pbi.13244 (2019))。
NGG-PAM部位では、ABE8は、ABE7.10と比較して、プロトスペーサー内のカノニカルな位置(A5~A7)で約1.5倍高い編集を、および非カノニカルな位置(A3~A4、A8~A10)で約3.2倍高い編集を生じさせている(図13)。非NGG PAMバリアントでのABE8編集は、ABE7.10の約4.2倍の全体のオンターゲット編集を生じさせた。標的の配列、標的ウィンドウ内の「A」の位置、およびABE8構築物自体の配列同一性が、編集効率に影響し得る全ての因子である(図7E、図11Aおよび図11B、図13)。全体として、試験した全ての部位における全ての位置にわたる編集における変化の中央値は、ABE7.10と比較して1.94倍である(1.34~4.49の範囲)。編集ウィンドウにわたるABE8活性の増加によって、さらなる約3000を超える、ClinVarデータベースにおいて同定されている疾患関連突然変異の逆戻りが可能となる(図54C)。
次に、40の構築物からなる大きなABE8プールから、ABE8構築物のサブセット(ABE8.8-m、ABE8.13-m、ABE8.17-m、ABE8.20-m、ABE8.8-d、ABE8.13-m、ABE8.17-d、およびABE8.20-d)を選択して、より詳細に評価した。これらの構築物は、階層的クラスタリング分析を通して決定すると8つのゲノム部位の間で編集性能が明確に異なるABE8に相当する(図14)。これらのABE8は、試験した全てのゲノム部位でABE7.10よりも性能が優れており(P値=0.0006871、両側ウィルコクソンの順位和検定)、ABE8指向的進化キャンペーンから同定された突然変異の様々な組合せを包含する(図15Aおよび図15B、ならびに図16Aおよび図16B)。
非NGG PAMを認識するABEバリアントは記載されているが、これらの構築物の編集効率は、NGG PAM配列を標的化するS. pyogenesのCas9で見られたアウトカムと比較した場合、多くの場合で低下している(例えば、Huang, T. P. et al. Circularly permuted and PAM-modified Cas9 variants broaden the targeting scope of base editors. Nat Biotechnol 37, 626-631, doi:10.1038/s41587-019-0134-y (2019)、Hua, K. et al., Expanding the base editing scope in rice by using Cas9 variants. Plant Biotechnol J, doi:10.1111/pbi.12993 (2018)、Yang, L. et al., Increasing targeting scope of adenosine base editors in mouse and rat embryos through fusion of TadA deaminase with Cas9 variants. Protein Cell 9, 814-819, doi:10.1007/s13238-018-0568-x (2018)を参照されたい)。進化したデアミナーゼが非NGG PAMを有する標的部位での編集効率も増加させるかどうかを決定するために、S. pyogenesのCas9を、操作されたS. py.バリアントNG-Cas9(PAM:NG)(Nishimasu, H. et al. Engineered CRISPR-Cas9 nuclease with expanded targeting space. Science (2018))またはStaphylococcus aureus Cas9(SaCas9、PAM:NNGRRT)(Ran, F. A. et al. In vivo genome editing using Staphylococcus aureus Cas9. Nature 520, 186-191, doi:10.1038/nature14299 (2015))で置き換える、ABE8エディターを作製した。SpCas9-NG(NG-ABE8.x-m/d)およびSaCas9(Sa-ABE8.x-m/d)の両方についてABE8バリアントをABE7.10と比較すると、A・TからG・Cへの編集頻度において、それぞれ1.6倍および2.0倍の中央値の増加が観察された(図8A、図8B、および図17~20)。SpCas9-ABE8と同様に、非NGG PAMバリアントについてのABE7.10構築物とABE8構築物との間の編集効率の最も大きな差は、編集ウィンドウ内の好ましい位置の周辺に位置する標的位置Aで見られる(S. pyogenes:位置4~8、S. aureus:位置6~13、Rees, H. A. & Liu, D. R., Base editing: precision chemistry on the genome and transcriptome of living cells. Nat Rev Genet 19, 770-788, doi:10.1038/s41576-018-0059-1 (2018)も参照されたい)。非NGG PAMを利用するABE8オルソログは、効率的なA塩基編集のための標的化範囲を広げる。
インデル形成を最小にすることが必要である場合の適用では、Cas9の、触媒活性が損なわれたD10Aニッカーゼ突然変異体を、触媒的に「死んだ」バージョンのCas9(D10A+H840A)(Jinek, M. et al. A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity. Science 337, 816-821, doi:10.1126/science.1225829 (2012)を参照されたい)で置き換えることの影響を、中心的な8つのABE8構築物(「dC9-ABE8.x-m/d」)において調査した。ABEにおいてニッカーゼを不活Cas9で置き換えることによって、dC9-ABE8バリアントでは、より高い(2.1倍)オンターゲットDNA編集効率を維持しながら、ABE7.10と比較してインデル頻度の>90%の低減が見られた(図8C、図21Aおよび図21B、図22Aおよび図22B、図23A~図23D)。バックグラウンドを上回るインデルが見られるが、頻度は、試験部位で0.3~0.8%の範囲であった。dC9-ABE8バリアントは、カノニカルなABE8と比較してオンターゲットDNA編集効率が中央値で14%低減していた。
オンターゲット遺伝子座での別のクラスの望ましくないABE媒介型ゲノム編集は、ABE依存性のシトシンからウラシル(C・GからT・A)への変換であり得る(Grunewald, J. et al., CRISPR DNA base editors with reduced RNA off-target and self-editing activities. Nat Biotechnol 37, 1041-1048, doi:10.1038/s41587-019-0236-6 (2019)、Lee, C. et al. CRISPR-Pass: Gene Rescue of Nonsense Mutations Using Adenine Base Editors. Mol Ther 27, 1364-1371, doi:10.1016/j.ymthe.2019.05.013 (2019)を参照されたい)。試験した8つの標的部位で、CからTへの編集の95パーセンタイルが、ABE8バリアントで0.45%、ABE7.10-dまたは-mで0.15%と測定され、このことは、ABEでのオンターゲットシトシン脱アミノ化が生じ得るが、頻度は一般に非常に低いことを示している(図24)。したがって、ABE8は、AからGへの変換に対する高い特異性を保持している。
[実施例4:ABE8構築物によるDNAオンターゲット編集およびsgRNA依存性のDNAオフターゲット編集は、DNAに対する特異性を向上させる]
全ての塩基エディターと同様に、ABE8は、ゲノムおよびトランスクリプトーム内のオフターゲット遺伝子座で作用する可能性を有する(例えば、Gaudelli, N. M. et al. Programmable base editing of A*T to G*C in genomic DNA without DNA cleavage. Nature 551, 464-471, doi:10.1038/nature24644 (2017)、Komor, A. C., et al., Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage. Nature 533, 420-424, doi:10.1038/nature17946 (2016)、Grunewald, J. et al. CRISPR DNA base editors with reduced RNA off-target and self-editing activities. Nat Biotechnol 37, 1041-1048, doi:10.1038/s41587-019-0236-6 (2019)、Rees, H. A., et al., Analysis and minimization of cellular RNA editing by DNA adenine base editors. Sci Adv 5, eaax5717, doi:10.1126/sciadv.aax5717 (2019)、Rees, H. A. et al. Improving the DNA specificity and applicability of base editing through protein engineering and protein delivery. Nat Commun 8, 15790, doi:10.1038/ncomms15790 (2017)、Jin, S. et al. Cytosine, but not adenine, base editors induce genome-wide off-target mutations in rice. Science 364, 292-295, doi:10.1126/science.aaw7166 (2019)、Zuo, E. et al. Cytosine base editor generates substantial off-target single-nucleotide variants in mouse embryos. Science 364, 289-292, doi:10.1126/science.aav9973 (2019)、Lee, H. K., et al., Cytosine but not adenine base editor generates mutations in mice. Biorxiv, doi:https://doi.org/10.1101/731927 (2019)、Grunewald, J. et al. Transcriptome-wide off-target RNA editing induced by CRISPR-guided DNA base editors. Nature 569, 433-437, doi:10.1038/s41586-019-1161-z (2019)、Zhou, C. et al. Off-target RNA mutation induced by DNA base editing and its elimination by mutagenesis. Nature 571, 275-278, doi:10.1038/s41586-019-1314-0 (2019)を参照されたい)。
ゲノムDNA内の4つのオンターゲット遺伝子座(図25Aおよび図25B)ならびに12のこれまでに同定されたsgRNA関連オフターゲット遺伝子座での塩基編集(Tsai, S. Q. et al. GUIDE-seq enables genome-wide profiling of off-target cleavage by CRISPR-Cas nucleases. Nat Biotechnol 33, 187-197, doi:10.1038/nbt.3117 (2015))(図25Eおよび図25F)を測定し、これらのうちの全てがHEK293T細胞における真のCas9オフターゲット遺伝子座であることが確認された(図26)。オンターゲット遺伝子座でのこれらの増加した活性から予想して、ABE8構築物は、ABE7.10よりも3~6倍大きなDNAオフターゲット編集頻度を示す。このことはABE8構築物の使用についての警告であるが、sgRNAの慎重な選択および分析によって、sgRNA依存性のオフターゲット編集を実質的に減少させることができる(Tsai, S. Q. et al. GUIDE-seq enables genome-wide profiling of off-target cleavage by CRISPR-Cas nucleases. Nat Biotechnol 33, 187-197, doi:10.1038/nbt.3117 (2015)、Yeh, W. H., et al., In vivo base editing of post-mitotic sensory cells. Nat Commun 9, 2184, doi:10.1038/s41467-018-04580-3 (2018)を参照されたい)。無差別なsgRNAの使用を必要とする適用では、ABE8.17mのTadAドメインへの、V106W突然変異を増強するDNA特異性およびRNA特異性の導入(Rees, H. A., Wilson, C., Doman, J. L. & Liu, D. R. Analysis and minimization of cellular RNA editing by DNA adenine base editors. Sci Adv 5, eaax5717, doi:10.1126/sciadv.aax5717 (2019))によって、ABE7.10のレベルを超えるオンターゲット編集レベルを維持しながらDNAオフターゲット編集を2.6倍低下させることができる(図25C、図25D、図25G、および図25H)。
ABE8のsgRNA非依存性のオフターゲット活性を測定するために、細胞RNAの標的化された増幅およびハイスループット配列決定を、ABEで処置したHEK293T細胞において行った(Gaudelli, N. M. et al. Programmable base editing of A*T to G*C in genomic DNA without DNA cleavage. Nature 551, 464-471, doi:10.1038/nature24644 (2017)、Rees, H. A., et al., Analysis and minimization of cellular RNA editing by DNA adenine base editors. Sci Adv 5, eaax5717, doi:10.1126/sciadv.aax5717 (2019)を参照されたい)。このアッセイにおいて、ABE8は、ABE7.10と比較して2.3~5.3倍の間大きい、細胞RNAアデノシン脱アミノ化の平均頻度を示した(図25A)。
ABE8のオフターゲット脱アミノ化の効果を、ABE7.10の目的外細胞RNA脱アミノ化を弱めるように設計された、これまでに公開されている突然変異(Grunewald, J. et al. CRISPR DNA base editors with reduced RNA off-target and self-editing activities. Nat Biotechnol 37, 1041-1048, doi:10.1038/s41587-019-0236-6 (2019)、Rees, H. A., et al., Analysis and minimization of cellular RNA editing by DNA adenine base editors. Sci Adv 5, eaax5717, doi:10.1126/sciadv.aax5717 (2019)、Grunewald, J. et al. Transcriptome-wide off-target RNA editing induced by CRISPR-guided DNA base editors. Nature 569, 433-437, doi:10.1038/s41586-019-1161-z (2019)、Zhou, C. et al. Off-target RNA mutation induced by DNA base editing and its elimination by mutagenesis. Nature 571, 275-278, doi:10.1038/s41586-019-1314-0 (2019))をABE8に組み込むことによって評価した。これらの突然変異を、ABE8.17-mのデアミナーゼ酵素のTadA部分に組み込んだ。導入されたRNAオフターゲッティング突然変異の全ては、ABE8.17-mのオンターゲット編集頻度を様々な程度まで低下させ、V106WおよびF148AでABE8は最低となった(図25Cおよび図25D)。これらのうち、V106Wのみが、オフターゲットRNAおよびDNA編集のレベルを実質的に低減させることができた(図25B)。したがって、ABE8にV106W突然変異を含めることは、高いオンターゲット編集効率と、DNAおよびRNAオフターゲット脱アミノ化事象の低減とを可能にし、また、細胞トランスクリプトームの一時的な混乱を回避しなくてはならない場合に、または無差別なsgRNAとの使用に、適用可能である。
ABE8に関連するオフターゲット編集を包括的に評価するために、オンターゲット編集およびオフターゲット編集を、3つのオンターゲット部位を標的化することによってABE7およびABE8において(図55Aおよび図55B)、またゲノムDNAにおける高いsgRNA関連Cas9オフターゲット活性についてこれまでに特徴付けられた12の遺伝子座において(Tsai, S. Q. et al. GUIDE-seq enables genome-wide profiling of off-target cleavage by CRISPR-Cas nucleases. Nat Biotechnol 33, 187-197, doi:10.1038/nbt.3117 (2015)を参照されたい、図55Cおよび図55D)、そしてHEK293T細胞において(図61)比較した。ゲノム編集物質のプラスミド送達は塩基編集研究の目的で広く使用されているが、mRNA送達は、一次ヒト細胞の編集に、より効果的であり(Hendel, A. et al. Chemically modified guide RNAs enhance CRISPR-Cas genome editing in human primary cells. Nat Biotechnol 33, 985-989, doi:10.1038/nbt.3290 (2015))、塩基エディターの送達方法は、そのオフターゲットプロファイルの重要な決定要因である(Rees, H. A. et al. Improving the DNA specificity and applicability of base editing through protein engineering and protein delivery. Nat Commun 8, 15790, doi:10.1038/ncomms15790 (2017))。したがって、プラスミドまたはmRNA送達の影響を、オンターゲットおよびオフターゲット活性について試験した。ABE7およびABE8両方のオンターゲット効率は、mRNAの寿命がプラスミドの過剰発現と比較してより一時的であるにもかかわらず、ABEのプラスミド送達とmRNA送達との間で同程度であった。特に、細胞へのABEのmRNA送達によって、特に標的アデニン塩基が編集ウィンドウの中央にある場合に(位置5または6)、プラスミド送達と比較して(図55A)編集効率が増加した(図55B)。
プラスミドの過剰発現を塩基エディターのための送達様式として使用した場合、ABE8構築物は、ABE7.10より3~6倍大きなsgRNA依存性のDNAオフターゲット編集頻度を示した(図55C)。注目すべきことには、mRNAを使用してABEを送達した場合、ABE8構築物を伴うガイド依存性のDNAオフターゲット編集は、平均で1.5倍(ABE7.10-dで)および2.2倍(ABE7.10-dと比較して最も大きく修飾されたABE8であるABE8.20-mで)低下した。特に、非反復性のsgRNA HEK2およびHEK3を伴うオフターゲット塩基編集活性は、プラスミド送達での14%超から、mRNA送達によって0.4%未満まで低減した(図55Cおよび図55D)。したがって、治療適用および高いDNA編集特異性を要する他の適用では、mRNA送達、sgRNAの慎重な選択(Tsai, S. Q. et al. GUIDE-seq enables genome-wide profiling of off-target cleavage by CRISPR-Cas nucleases. Nat Biotechnol 33, 187-197, doi:10.1038/nbt.3117 (2015)、Yeh, W. H., et al. In vivo base editing of post-mitotic sensory cells. Nat Commun 9, 2184, doi:10.1038/s41467-018-04580-3 (2018))、およびDNAオフターゲット編集の頻度を実質的に低減させるためにTadAにV106Wを含めることの考慮は、非反復性のsgRNA HEK2およびHEK3にとって、陰性対照のそれよりも有利である(図55E)。
次に、ABE8を伴う細胞mRNAの目的外脱アミノ化のレベルを測定した。目的の構築物全てについてのデータをハイスループット様式で得るために、本発明者らは、ABEで処置したHEK293T細胞における2つの細胞RNAの標的化された増幅およびハイスループット配列決定で開始した。これまでの刊行物(Grunewald, J. et al. CRISPR DNA base editors with reduced RNA off-target and self-editing activities. Nat Biotechnol 37, 1041-1048, doi:10.1038/s41587-019-0236-6 (2019)、Rees, H. A., et al. Analysis and minimization of cellular RNA editing by DNA adenine base editors. Sci Adv 5, eaax5717, doi:10.1126/sciadv.aax5717 (2019)、Grunewald, J. et al. Transcriptome-wide off-target RNA editing induced by CRISPR-guided DNA base editors. Nature 569, 433-437, doi:10.1038/s41586-019-1161-z (2019)、Zhou, C. et al. Off-target RNA mutation induced by DNA base editing and its elimination by mutagenesis. Nature 571, 275-278, doi:10.1038/s41586-019-1314-0 (2019))と一致して、ABE7での処置、およびさらに大きな程度でABE8での処置は、プラスミド過剰発現によって送達された場合、細胞RNAにおける検出可能なAからIへの脱アミノ化を生じさせた(図55E)。しかし、mRNA構築物として送達されると、mRNAの脱アミノ化レベルは、平均34倍(ABE7.10-dのケース)から134倍(ABE8.17-m)、大きく低減し(図55E)、このことは、mRNA送達が細胞RNA編集の頻度を効果的に低減させ得ることを示している。
[実施例5:血液学的障害の処置のためのアデニン塩基エディター]
ABE8構築物をヒト造血幹細胞(HSC)において評価した。細胞療法として患者に投与する前のHSCのEx vivoでの操作および/または編集は、血液学的障害の処置のための有望なアプローチである。ABEがHBG1/2のプロモーター領域の位置-198でTからCへの置換を導入し得ることがこれまでに実証されている(Gaudelli, N. M. et al. Programmable base editing of A*T to G*C in genomic DNA without DNA cleavage. Nature 551, 464-471, doi:10.1038/nature24644 (2017))。この天然に存在するアリルは、成人期に向けてγ-グロビンのレベルが増加する遺伝性高胎児ヘモグロビン血症(HPFH)を生じさせ、これにより、鎌状赤血球症およびβ-サラセミアにおいて見られるβ-グロビンの欠乏が低減し得る(Wienert, B. et al. KLF1 drives the expression of fetal hemoglobin in British HPFH. Blood 130, 803-807, doi:10.1182/blood-2017-02-767400 (2017))。HPFH表現型を再現すること、およびABE8の臨床的関連性を評価することを目的として、CD34+造血幹細胞を2人のドナーから単離し、ABE8エディターをコードするmRNA、および標的Aをプロトスペーサー内の位置7に置く、末端を修飾されたsgRNAをトランスフェクトした。
-198 HBG1/2プロモーター標的部位でのABE8の平均編集効率は、早期の時点(48時間)ではいずれのABE7.10構築物よりも2~3倍高く、後期の時点(144時間)ではいずれのABE7.10よりも1.3~2倍高かった(図27B、図28Aおよび図28B、図29Aおよび図29B)。これらの動態的区別は、細胞療法を投与する前に細胞培養を最小に維持しなければならないex vivo療法にとって、臨床的に重要である。
次に、ABE処置および赤血球分化の後に産生されたγ-グロビンタンパク質の量を、UPLCによって定量した(図30~図50)。ABE8処置群に由来する赤血球におけるγ-グロビン発現/α-グロビン発現の%の平均3.5倍の増加が、疑処置細胞と比較した場合に見られ、約1.4倍の増加が、ABE8.13-dをABE7.10-m/dで達成されたレベルと比較した場合に見られた(図27C)。少なくとも約≧20%のHbF発現細胞が、さらに高い最小レベルを必要とする可能性が高い鎌状赤血球症患者およびβ-サラセミア患者の症候を改善するために必要である(例えば、Canver, M. C. & Orkin, S. H. Customizing the genome as therapy for the beta-hemoglobinopathies. Blood 127, 2536-2545, doi:10.1182/blood-2016-01-678128 (2016)、Fitzhugh, C. D. et al. At least 20% donor myeloid chimerism is necessary to reverse the sickle phenotype after allogeneic HSCT. Blood 130, 1946-1948, doi:10.1182/blood-2017-03-772392 (2017)を参照されたい)。ABE8編集の後に見られたγ-グロビンレベルは、これらの閾値よりも高くABE7.10で達成されるレベルよりも大きいHbFレベルと一貫している。
全体として、ABE8は、γ-グロビン遺伝子HBG1およびHBG2のプロモーターで、天然に存在する遺伝性高胎児ヘモグロビン血症(HPFH)アリルを再現し(図27Aを参照されたい)、ヒトCD34+細胞培養物における最大60%の編集効率、および、対応する、分化した赤血球におけるガンマグロビン発現の上方調節を達成した。
[実施例6:鎌状赤血球症およびベータサラセミアの処置のための相補的塩基編集アプローチ]
鎌状赤血球症(SCD)およびベータサラセミアは、重度の貧血および多くの臓器系にわたる著しい疾患合併症をもたらす、ベータグロビンの産生および機能の障害である。胎児ヘモグロビン(HbF)の上方調節またはベータグロビン遺伝子の補正を介して操作された造血幹細胞の自己移植は、ベータヘモグロビン異常症を有する患者における疾病負荷を低減させる可能性を有する。塩基編集は、二本鎖DNAの切断の導入を伴わずにゲノムの正確な修飾を可能にする、最近開発された技術である。
ガンマグロビン遺伝子プロモーターを、HbFを抑制解除するであろう改変を同定するために、シトシンおよびアデニン塩基エディター(ABE)で包括的にスクリーニングした。HbFを有意に上方調節した3つの領域を同定し、最も効果的なヌクレオチド残基変換が、遺伝性高胎児ヘモグロビン血症(HPFH)を有する患者で見られる天然の変形形態によって裏付けられる。ABEは、HBG1プロモーターおよびHBG2プロモーター内の主要な調節モチーフでのヌクレオチド変換の後にHbFのレベルを有意に増加させることが明らかにされている。CD34+造血幹細胞および造血前駆細胞(HSPC)を臨床スケールで精製し、自己複製能力を保存するように設計されたプロセスを使用して編集した。UPLCによると、2つの独立した部位での異なるABEでの編集は94パーセントに達し、最大63パーセントのガンマグロビンをもたらした(図51A~図51E)。観察されたHbFのレベルは、HPFHの臨床的所見、およびHbF用量の上昇と疾患の軽度化とを結び付ける非介入治療に基づいて、大部分のSCD患者およびベータサラセミア患者に防御をもたらすはずである(Ngo et al., 2011 Brit J Hem、Musallam et al., 2012 Blood)。
SCDのGlu6Val突然変異の直接的な補正は、SCD集団のために設計された遺伝子療法の最近の目的であった。現在の塩基編集技術ではまだ、鎌状ベータグロビンにおけるA-Tトランスバージョンで得られるもののように突然変異を変換することができない。しかし、ABEバリアントは、バリンの、反対向きに鎖を形成したアデニン残基を認識および編集するように設計されている。これによって、バリンがアラニンに変換され、Hb G-Makassarとして公知の天然に存在するバリアントが産生される。この位置にアラニンを有するベータグロビンは、ポリマー形成に関与せず、Hb G-Makassarを有する患者は、正常な血液学的パラメータおよび赤血球形態学を示す。これらのABEバリアントで編集されたSCD患者の線維芽細胞は、標的アデニンの最大70パーセントの変換を達成している(図52A)。健康なドナーのCD34細胞を次いで、編集ウィンドウ内に存在し、SCD突然変異を編集するための代理として働く、隣接したプロリン内の同義突然変異を標的化する、代表ABEバリアントで編集した。平均編集頻度は40パーセントであった(図52B)。同種異系移植設定においてこれらのレベルで記録されたドナー骨髄のキメラ性は、鎌状表現型を逆転させるために必要な20パーセントを超えている(Fitzhugh et al, 2017 Blood)。
[実施例7:全ゲノム配列決定]
全ゲノム配列決定(WGS)を行って(図56)、ABE8が、ABE7.10またはCas9では報告されていないがCBEでこれまでに報告されているように、sgRNA非依存性の様式でゲノムワイドな点突然変異を誘導し得る(本明細書において「目的外脱アミノ化」と呼ばれる)程度を評価した(Jin, S. et al. Cytosine, but not adenine, base editors induce genome-wide off-target mutations in rice. Science 364, 292-295, doi:10.1126/science.aaw7166 (2019)、Zuo, E. et al. Cytosine base editor generates substantial off-target single-nucleotide variants in mouse embryos. Science 364, 289-292, doi:10.1126/science.aav9973 (2019)、Lee, H. K., et al. Cytosine base editor 4 but not adenine base editor generates off-target mutations in mouse embryos. Commun Biol 3, 19, doi:10.1038/s42003-019-0745-3 (2020)、McGrath, E. et al. Targeting specificity of APOBEC-based cytosine base editor in human iPSCs determined by whole genome sequencing. Nat Commun 10, 5353, doi:10.1038/s41467-019-13342-8 (2019))。したがって、HEK293T細胞に、塩基エディターをコードするmRNAおよびB2M(部位21)を標的化するsgRNAをトランスフェクトした(図56)。72時間のインキュベーションの後、蛍光活性化細胞選別(FACS)を使用して、成功裏に塩基編集されたB2M陰性単細胞を単離した(図56)。1回選別された細胞を個別にクローン増殖して、Illuminaベースの全ゲノム配列決定を行うために十分なゲノムDNAを生成した。全ての処置された試料で、オンターゲットB2M遺伝子座で2つの対立遺伝子が編集されていることが確認され、このことは、活性な塩基エディターまたはCas9が受け取られたことを示している。
胚注射マウス実験におけるABE7.10-dで処置した動物で得られたこれまでの結果と一致して(Jin, S. et al. Cytosine, but not adenine, base editors induce genome-wide off-target mutations in rice. Science 364, 292-295, doi:10.1126/science.aaw7166 (2019)、Zuo, E. et al. Cytosine base editor generates substantial off-target single-nucleotide variants in mouse embryos. Science 364, 289-292, doi:10.1126/science.aav9973 (2019)、Lee, H. K., et al. Cytosine base editor 4 but not adenine base editor generates off-target mutations in mouse embryos. Commun Biol 3, 19, doi:10.1038/s42003-019-0745-3 (2020)、McGrath, E. et al. Targeting specificity of APOBEC-based cytosine base editor in human iPSCs determined by whole genome sequencing. Nat Commun 10, 5353, doi:10.1038/s41467-019-13342-8 (2019))、ABE7.10-dでの処置の際のゲノムワイドなAからGへの突然変異に、検出可能な増加(P値=0.911、片側のウィルコクソン-マン・ホイットニーのU検定、表16)は見られなかった(図57および図58)。同時に、これまでの報告と一致して、未処置対照と比較して、BE4で処置した試料において、CからTへの突然変異に統計的に有意な増加が見られた(P値=0.010、片側のウィルコクソン-マン・ホイットニーのU検定、表16)(Jin, S. et al. Cytosine, but not adenine, base editors induce genome-wide off-target mutations in rice. Science 364, 292-295, doi:10.1126/science.aaw7166 (2019)、Zuo, E. et al. Cytosine base editor generates substantial off-target single-nucleotide variants in mouse embryos. Science 364, 289-292, doi:10.1126/science.aav9973 (2019)、Lee, H. K., et al. Cytosine base editor 4 but not adenine base editor generates off-target mutations in mouse embryos. Commun Biol 3, 19, doi:10.1038/s42003-019-0745-3 (2020)、McGrath, E. et al. Targeting specificity of APOBEC-based cytosine base editor in human iPSCs determined by whole genome sequencing. Nat Commun 10, 5353, doi:10.1038/s41467-019-13342-8 (2019))。未処置の試料と比較すると、ABE8.17-m群、ABE8.20-m群、またはCas9群にわたるA→Gの突然変異率の%に、統計的に有意な増加は見られなかった(それぞれ、P値=0.375、0.643、および0.27、片側のウィルコクソン-マン・ホイットニーのU検定、図57、図58、表16)。しかし、Cas9処置群におけるAからGへの突然変異率が上昇した試料を含む、ほとんどの処置群における個々の試料は、実質的に高いまたは低いAからGまたはCからT突然変異の相対的比率を示した。
ABE7.10-d、ABE8.20-m、ABE8.17-m、Cas9、およびBE4で処置した細胞から全ゲノム配列決定データを得るために、5つ(BE4、Cas9、処置なし、ABE7.10-d、およびABE8.20-m)または6つ(ABE8.17-m)の単細胞HEK293T細胞クローンから>20倍のゲノムカバレージでゲノムDNAを配列決定した。実施例8に記載するように、各試料の突然変異プロファイルを、バックグラウンド対照と呼ばれる1つの未処置試料と比較して計算し、相対的突然変異の絶対数(表17)と共に図57に示す。
塩基エディター処置が検出可能なレベルの非誘導型目的外DNA脱アミノ化をもたらすかどうかを決定するために、高度のクロマチン接近可能性を仮定して、高度に形質転換された細胞株HEK293Tを使用した。このようなわけで、真の突然変異率の反映として絶対数に頼るよりも、突然変異の相対的割合を比較するために、この系を使用した。これらの実験において、各試料が、バックグラウンド対照(BE4のケース)またはAからG(ABEおよびCas9で処置した試料のケース)と比較して、CからTへの突然変異の統計的に有意な(フィッシャーの正確確率検定、図58)増加または低下を示したかどうかを計算した。これまでの研究と一致して(例えば、Rees, H. A., Wilson, C., Doman, J. L. & Liu, D. R. Analysis and minimization of cellular RNA editing by DNA adenine base editors. Sci Adv 5, eaax5717, doi:10.1126/sciadv.aax5717 (2019)、Grunewald, J. et al. Transcriptome-wide off-target RNA editing induced by CRISPR-guided DNA base editors. Nature 569, 433-437, doi:10.1038/s41586-019-1161-z (2019)、Grunewald, J. et al. CRISPR DNA base editors with reduced RNA off-target and self-editing activities. Nat Biotechnol 37, 1041-1048, doi:10.1038/s41587-019-0236-6 (2019)、Zhou, C. et al. Off-target RNA mutation induced by DNA base editing and its elimination by mutagenesis. Nature 571, 275-278, doi:10.1038/s41586-019-1314-0 (2019)を参照されたい)、この分析によって、5/5のBE4クローンがゲノムワイドなCからTへの突然変異の有意な増加を示したこと(図57において**で示されている)、ならびに0/5のABE7.10-d、0/4の未処置、1/6のABE8.17-m、2/5のABE8.20-m、および1/5のCas9で処置したクローンが、AからGへの突然変異の増加を示すこと(図57において**で示されている)が確認された。バックグラウンド対照と比較してAからGへの突然変異の数が増加した、Cas9で処置した試料は、配列試料の残りと比較すると、検出される突然変異数の大きな増加を示す(9,532)。29個の残りの試料は、3,043~6,056の範囲に入った。1/5のABE8.20-mで処置したクローンは、ゲノムワイドなAからGへの突然変異の頻度において有意な低減を示した(図57においてで示されている)。AからGへの突然変異における統計的に有意な増加を示す、Cas9で処置した試料と共に、これらの2つの予想外のデータポイントは、細胞間に可変性が存在し得ることを示し、この可変性は、mRNAでトランスフェクトされたHEK293T細胞の最初の群の中での既存の遺伝的変異によって生じ得る。この理由から、これらのデータは、データセットにおける考えられる外れ値の影響を軽減するために、平均よりも中央値として表されている。
採用したプロトコール(実施例8を参照されたい)は、単細胞クローンから成長させたHEK293T細胞を使用しないように適用させた(McGrath, E. et al. Targeting specificity of APOBEC-based cytosine base editor in human iPSCs determined by whole genome sequencing. Nat Commun 10, 5353, doi:10.1038/s41467-019-13342-8 (2019)を参照されたい)。逆に、ATCCから入手したHEK293T細胞の試料を使用し、トランスフェクションの前におよそ4週間、培養で維持した。
マン・ホイットニーのU検定を使用して、処置群間のシトシン残基またはアデニン残基の脱アミノ化頻度の違いの統計的有意性の分析を行った(表16)。(未処置対照群と比較した)このタイプの有意な編集を有する唯一の群はBE4処置群であり、これは、未処置対照と比較してC:GからT:A(またはG:CからA:T)への突然変異の有意な(p=0.018)増加を示している。このアッセイは、ここで試験したABE塩基エディターが、BE4と同様のレベルでゲノムにおいて目的外脱アミノ化を生じさせないことを示唆している。しかし、細胞の不均質性または一部の他の実験的限界が偽陽性または偽陰性の結果を生じさせ得る可能性がある。
全体的に、これらの結果は、ABE7またはABE8での処置がBE3およびBE4などのCBEで見られたような突然変異率の実質的な上昇をもたらさないことを示している。これらの所見は、ABEのDNA特異性をさらに特徴付け、研究ツールとしてのこれらの使用および治療適用におけるこれらの使用の両方を推奨するものである。
表16:全ゲノム配列決定に付された処置群間の相対的なシトシンおよびアデニン脱アミノ化誘導突然変異頻度の比較から得られたP値
Figure 2022520081000086
表17:各全ゲノム配列決定サンプル中に検出された、未処理対照と比較した変異総数
Figure 2022520081000087
[実施例8:材料および方法]
全体的な方法:
全てのクローニングは、USER酵素(New England Biolabs)クローニング方法を介して行い(Geu-Flores et al., USER fusion: a rapid and efficient method for simultaneous fusion and cloning of multiple PCR products. Nucleic Acids Res 35, e55, doi:10.1093/nar/gkm106 (2007)を参照されたい)、PCR増幅のための鋳型は、細菌または哺乳動物のコドン最適化された遺伝子断片として購入した(GeneArt)。生成されたベクターを、Mach T1RCompetent Cells(Thermo Fisher Scientific)に形質転換し、-80℃で維持して長期保存した。この研究において使用した全てのプライマーはIntegrated DNA Technologiesから購入し、PCRSは、Phusion U DNA Polymerase Green MultiPlex PCR Master Mix(ThermoFisher)またはQ5 Hot Start High-Fidelity 2x Master Mix(New England Biolabs)のいずれかを使用して行った。この研究において使用した全てのプラスミドは、エンドトキシン除去手順を伴うZymoPURE Plasmid Midiprep(Zymo Research Corporation)を使用して、50mLのMach1培養物から新たに調製した。分子生物学的グレードのHyclone水(GE Healthcare Life Sciences)を、全てのアッセイ、トランスフェクション、およびPCR反応において使用して、DNAse活性を確実に除去した。
Hek293T哺乳動物細胞のトランスフェクションに使用したsgRNAのアミノ酸配列を、以下の表18に示す。20ntの標的プロトスペーサーが太字で示されている。標的DNA配列が「G」で始まっていなかった場合は、「G」をプライマーの5'末端に付加したが、それは、ヒトU6プロモーターが転写開始部位で「G」を好むことが分かっているためである(Cong, L. et al., Multiplex genome engineering using CRISPR/Cas systems. Science 339, 819-823, doi:10.1126/science.1231143 (2013)を参照されたい)。これまでに記載されているpFYF sgRNAプラスミドを、PCR増幅のための鋳型として使用した。
表18:Hek293T哺乳類細胞トランスフェクションのために使用されたsgRNAの配列
Figure 2022520081000088
sgRNAの足場配列は以下の通りである:
S. pyogenes:
GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC
S. aureus: GUUUUAGUACUCUGUAAUGAAAAUUACAGAAUCUACUAAAACAAGGCAAAAUGCCGUGUUUAUCUCGUCAACUUGUUGGCGAGA
[指向的進化のためのインプット細菌TadAライブラリーの作製]
TadA8.0ライブラリーを、TadA7.10オープンリーディングフレーム内の各アミノ酸位置で20のアミノ酸全てをコードするように設計した(Gaudelli, N. M. et al., Programmable base editing of A*T to G*C in genomic DNA without DNA cleavage. Nature 551, 464-471, doi:10.1038/nature24644 (2017))。各TadA8.0ライブラリーメンバーは、約1~2個の新たなコード突然変異を含み、化学的に合成され、そしてRanomics Inc(Toronto、Canada)から購入された。TadA8.0ライブラリーをPhusion U Green MultiPlex PCR Master MixでPCR増幅し、ABEの指向的進化に最適化された細菌ベクターにUSERアセンブルした(Gaudelli, N. M. et al., Programmable base editing of A*T to G*C in genomic DNA without DNA cleavage. Nature 551, 464-471, doi:10.1038/nature24644 (2017))。
[TadAバリアントの細菌進化]
TadA8ライブラリーを含むABEの指向的進化を、以下の変更をして、以前に記載されているように行った(Gaudelli, N. M. et al., Programmable base editing of A*T to G*C in genomic DNA without DNA cleavage. Nature 551, 464-471, doi:10.1038/nature24644 (2017)):i)E. coli 10ベータ(New England Biolabs)を進化宿主として使用した、およびii)カナマイシン上での生存が3つの遺伝子不活化成分の補正に依存した(例えば、生存は、カナマイシンにおける2つの停止突然変異および1つの活性部位突然変異の逆転を必要とした)。カナマイシン耐性遺伝子の配列(以下)は、ABE8進化のための選択突然変異を含む。10個のベータ宿主細胞において選択プラスミドおよびエディターを一晩共培養した後、ライブラリー培養物を、プラスミド維持抗生物質および増加濃度の選択抗生物質であるカナマイシン(64~512μg/mL)を補充した2xYT寒天培地に平板播種した。細菌を1日成長させ、生存クローンのTadA8部分を、富化した後、サンガー配列決定した。同定された目的のTadA8突然変異を次いで、USERアセンブリを介して哺乳動物発現ベクターに組み込んだ。
以下の配列において、小文字はカナマイシン耐性プロモーター領域を示し、太字の配列は標的化された不活化部分を示し(Q4およびW15)、斜体の配列はカナマイシン耐性遺伝子の標的化された不活性部位を示し(D208N)、そして下線を引かれた配列はPAM配列を示す。
不活化されたカナマイシン耐性遺伝子:
Figure 2022520081000089
[一般的なHEK293TおよびRPMI-8226哺乳動物の培養条件]
細胞を5%CO2で37℃で培養した。HEK293T細胞[CLBTx013、American Type Cell Culture Collection(ATCC)]を、10%(v/v)ウシ胎児血清(A31606-02、Thermo Fisher Scientific)を添加した、ダルベッコ変法イーグル培地にGlutamax(10566-016、Thermo Fisher Scientific)を加えたものの中で培養した。RPMI-8226(CCL-155、ATCC)細胞を、10%(v/v)ウシ胎児血清(Gibco)を添加したRPMI-1640培地(Gibco)内で培養した。細胞は、提供元から受け取った後、マイコプラズマが陰性であると試験された。
[Hek293TのプラスミドトランスフェクションおよびgDNA抽出]
HEK293T細胞を、48ウェルのポリ-D-リシン処置したBioCoatプレート(Corning)に35,000個細胞/ウェルの密度で播種し、平板播種の18~24時間後にトランスフェクトした。細胞を、NucleoCounter NC-200(Chemometec)を使用して計数した。これらの細胞に、Opti-MEM低減血清培地(ThermoFisher Scientific)内で12.5μLの総体積まで希釈された、750ngの塩基エディターまたはヌクレアーゼ対照、250ngのsgRNA、および10ngのGFP-maxプラスミド(Lonza)を添加した。溶液を、11μLのOpti-MEM低減血清培地内で1.5μlのリポフェクタミン2000(ThermoFisher)と組み合わせ、室温で15分間放置した。全体で25μLの混合物を次いで、事前に播種したHek293T細胞に移し、約120時間インキュベートさせた。インキュベーションの後、培地を吸引し、細胞を250μLの1×PBS溶液(ThermoFisher Scientific)で2回洗浄し、そして、100μLの新たに調製した溶解緩衝液を添加した(100mMのTris-HCl、pH7.0、0.05%SDS、25μg/mLのプロテイナーゼK(Thermo Fisher Scientific))。溶解緩衝液を含有するトランスフェクションプレートを37℃で1時間インキュベートし、混合物を96ウェルPCRプレートに移し、そして、80℃で30分間加熱した。
[Hek293TのmRNAリポフェクション]
HEK293T細胞を、ポリ-D-リシンで被覆した48ウェルプレート(Corning)に平板播種し、その16から20時間後、抗生物質を有さないDMEM+Glutamax培地(Thermo Fisher Scientific)において、ウェル当たり30,000個細胞の密度でリポフェクションを行った。500ngのCas9または塩基エディター発現mRNAを、100ngの化学修飾された合成sgRNA(2'-O-メチルアナログ、ならびに5'末端の最初の3つおよび3'末端の最後の3つのRNA残基での3'ホスホロチオエート結合、Synthego)と組み合わせて、OPTIMEM+Glutamaxと合わせて15μlの総体積とした。これを、ウェル当たり1.0μlのリポフェクタミンMessengerMaxおよび9.0μlのOPTIMEM+Glutamaxを含む10μlの脂質混合物と組み合わせた。細胞を、トランスフェクションの3日後に回収し、DNAまたはRNAのいずれかを回収し、以下に記載するように処理した。
[ゲノムDNAの調製および編集された細胞のクローン単離を含む、全ゲノム配列決定のためのHEK293T細胞の処置]
細胞に、B2M内の一領域を標的化するsgRNAと組み合わされた、塩基エディターまたはCas9をコードするmRNAをリポフェクションし、これは、本明細書に記載されるように、ABE、CBE、またはCas9によって成功裏に標的化されると、スプライシング部位の混乱(ABE、Cas9)または終止コドンの組み込み(CBE)のいずれかを介して、B2Mの混乱をもたらす(sgRNA標的配列:5'-CTTACCCCACTTAACTATCT-3'、Synthego)(Qasim, W. et al. Molecular remission of infant B-ALL after infusion of universal TALEN gene-edited CAR T cells. Sci Transl Med 9, doi:10.1126/scitranslmed.aaj2013 (2017))。トランスフェクションの24時間後、細胞を新たなプレートに3:8に分けて、細胞の成長を促した。トランスフェクションの3日後、HEK293T細胞をTryplE Express(ThermoFisher)で回収し、FACS緩衝液(PBS、1%BSA、共にThermoFisher)で1回洗浄し、そして、4℃で15分間冷やした。細胞を次いでペレット化し(1500×g、5分間)、1:100希釈のPE抗ヒトB2-マイクログロビン(Biolegend 316306)を有するFACS緩衝液の溶液中に再懸濁した。細胞を暗所で4℃で30分間インキュベートした。細胞を次いで、遠心分離(1500×g、5分間)によってFACS緩衝液で3回洗浄し、FACS緩衝液中に再懸濁した。個々のB2M陰性細胞を96ウェルプレートに選別し、ただし、未処置細胞では、B2M陽性細胞を96ウェルプレートに選別した。代表的なFACSプロットを図59Aおよび図59Bに示す。選別の9日後、ウェルを調べ、単一コロニーを含有するウェルに印をつけ、TryplE Expressで処置して、細胞の成長を促した。さらに4日間成長させた後、Agincourt DNAdvanceキット(Beckmann Coulter)を製造業者の使用説明書に従って使用して、ゲノムDNAを細胞から回収した。
ゲノムDNAを断片化し、96ウェルプレートNexteraインデックスプライマー(Illumina)を製造業者の使用説明書に従って使用して、Nextera DNA Flex Library Prep Kit(Illumina)を使用してアダプターライゲーションした。ライブラリーのサイズおよび濃度をFragment Analyzer(Agilent)によって確認し、Illumina HiSeqを使用する全ゲノム配列決定のためにNovogeneに送った。
[全トランスクリプトームおよび全ゲノム配列決定のデータの分析]
全ての標的化されたNGSデータを、4つの一般的なステップ:(1)アラインメント、(2)重複のマーキング、(3)バリアントコーリング、(4)アーティファクトおよび生殖細胞株突然変異を除去するためのバリアントのバックグラウンドフィルタリングを行うことによって、分析した。各ステップを以下に記載する。突然変異の参照アリルおよび代替アリルが、参照ゲノムのプラス鎖と比較して報告されている。
[全トランスクリプトーム分析の詳細]
1.レーンレベルのFASTQファイルを、STAR(v2.7.2a)とパラメータセットとを使用して、ヒトゲノム(Gencode GRCh38v31一次アセンブリ)に対して個別にアラインして、ReadGroupを特定し、そして、ゲノムアラインされたBAMファイルおよびトランスクリプトームアラインされたBAMファイルの両方をアウトプットした。
2.ステップ(1)で得られた各試料についてのレーンレベルのゲノムアラインメントをマージし、座標によってソートし、そして、Picard(v2.20.5)を使用して重複をマークした。
3.それらがスプライスジャンクションに広がっていることを理由にそれらのcigar stringにNを含むリードを、GATK(v4.1.3.0)SplitNCigarReadsを使用して分割した。
4.塩基の品質スコアを、Picardをデフォルト設定で使用して再測定した。
5.バリアントを、GATK HaplotypeCallerを使用してコールした。マッピングの品質≧30のリードのみを考慮し、非参照塩基をカウントするための最小塩基品質(Phredスコア)を20に設定した。RNA-seqにおけるバリアントコールのための標準設定を使用した:最小塩基品質=20、最小マッピング品質=30、ソフトクリップされた塩基を使用しない、standard-call-conf=20。
6.塩基エディターで処置した試料に特有の突然変異を、バックグラウンドフィルタリングを使用して同定した。最高のカバレッジの「未処置」試料を、バックグラウンド試料として使用した。カノニカルな染色体上の置換のみを考慮した。突然変異は、以下の基準を満たしている場合、塩基エディターで処置した試料に特有であると考えた:
a.突然変異のゲノム位置が、処置した試料では≧30リードのカバレージを有しており、未処置の試料では≧20リードのカバレージを有していた、
b.未処置の試料が、参照、非突然変異体、突然変異の位置での塩基を裏付ける、≧99%のリードを有していた、
c.処置した試料における突然変異のバリアントアリル頻度が≧20%であった。
[全ゲノム配列決定分析の詳細]
1.レーンレベルのFASTQファイルを、BWA(0.7.17-r1188)memと、ReadGroupを特定するように設定されたパラメータとを使用して、ヒトゲノム(Gencode GRCh38v31一次アセンブリ)に対して個別にアラインした。-M flagもまた、短くなったスプリットヒットを二次アラインメントとしてマークするように設定された。
2.ステップ(1)で得られた各試料についてのレーンレベルのゲノムアラインメントをマージし、座標によってソートし、そして、デフォルトセッティングを使用して、Picard(v2.20.5)を使用して重複をマークした。
3.バリアントを、GATK(v4.1.3.0)HaplotypeCallerを使用してコールした。マッピングの品質≧30のリードのみを考慮し、非参照塩基をカウントするための最小塩基品質(Phredスコア)を20に設定した。DNA-seqにおけるバリアントコールのための標準設定を使用した。
4.塩基エディターで処置した試料に特有の突然変異を、バックグラウンドフィルタリングを使用して同定した。最高のカバレッジの「未処置」試料を、バックグラウンド試料として使用した。カノニカルな染色体上の置換のみを考慮した。突然変異は、以下の基準を満たしている場合、塩基エディターで処置した試料に特有であると考えられた:
a.突然変異のゲノム位置が、処置した試料および未処置の試料で≧10リードのカバレージを有していた、
b.未処置の試料が、参照、非突然変異体、突然変異の位置での塩基を裏付ける、≧99%のリードを有していた。
[ABEのアーキテクチャーおよびABE8構築物についてのDNAおよびRNAオフターゲット編集の分析]
HEK293T細胞を、ポリ-D-リシンで被覆した48ウェルプレート(Corning)に平板播種し、その16から20時間後、抗生物質を有さないDMEM+Glutamax培地(Thermo Fisher Scientific)において、ウェル当たり30,000個細胞の密度でリポフェクションを行った。750ngのニッカーゼまたは塩基エディター発現プラスミドDNAを、15μlのOPTIMEM+Glutamax中で、250ngのsgRNA発現プラスミドDNAと組み合わせた。これを、ウェル当たり1.5μlのリポフェクタミン2000および8.5μlのOPTIMEM+Glutamaxを含む10μlの脂質混合物と組み合わせた。細胞を、トランスフェクションの3日後に回収し、DNAまたはRNAのいずれかを回収した。DNA分析のために、細胞を1×PBS中で1回洗浄し、次いで、製造業者の使用説明書に従って、100μlのQuickExtract(商標)緩衝液(Lucigen)に溶解した。RNAの回収では、MagMAX(商標)mirVana(商標)Total RNA Isolation Kit(Thermo Fisher Scientific)を、KingFisher(商標)Flex Purification Systemと共に、製造業者の使用説明書に従って使用した。
標的化されたRNA配列決定を、主に以前に記載されているように行った(Rees, H. A. et al., Analysis and minimization of cellular RNA editing by DNA adenine base editors. Sci Adv 5, eaax5717, doi:10.1126/sciadv.aax5717 (2019)を参照されたい)。cDNAを、単離されたRNAから、SuperScript IV One-Step RT-PCR SystemとEZDnase(Thermo Fisher Scientific)とを製造業者の使用説明書に従って使用して調製した。以下のプログラムを使用した:58℃を12分、98℃を2分、その後、アンプリコンによって変えられたPCRサイクル:CTNNB1およびIP90では、[98℃を10秒、60℃を10秒、72℃を30秒]を32サイクル、ならびにRSL1D1では、[98℃を10秒、58℃を10秒、72℃を30秒]を35サイクル。No RT対照を、試料と同時にランした。組合せRT-PCRの後、Illumina Miseqを本明細書に記載される通りに使用して、アンプリコンにバーコードを付加し、配列決定した。各アンプリコンにおけるフォワードプライマーの末端の後の最初の塩基で始まる、各アンプリコンの最初の125ntを、参照配列に対してアラインし、各アンプリコンにおけるAからIへの頻度の平均および最大値の分析に使用した(図53A~図53C)。
オフターゲットDNA配列決定を、以下の表19に列挙するこれまでに公開されたプライマーを使用して(Komor, A. C. et al., Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage. Nature 533, 420-424, doi:10.1038/nature17946 (2016)、Rees, H. A. et al., Analysis and minimization of cellular RNA editing by DNA adenine base editors. Sci Adv 5, eaax5717, doi:10.1126/sciadv.aax5717 (2019)を参照されたい)、2段階PCRおよびバーコーディング方法を使用して行って、Illumina Miseqシーケンサーを本明細書に記載されるように使用する配列決定のための試料を調製した。
表19:ゲノム部位を増幅するために使用されたHTSプライマー
Figure 2022520081000090
Figure 2022520081000091
Figure 2022520081000092
Figure 2022520081000093
[CD34+細胞において使用するABEエディターのためのmRNA産生]
エディターを、5'UTR、コザック配列、ORF、および3'UTRが続くdT7プロモーターをコードするプラスミドにクローニングした。dT7プロモーターは、環状プラスミドからの転写を防ぐT7プロモーター内の不活化点突然変異を有する。このプラスミドは、フォワードプライマーがT7プロモーター内のSNPを補正し、リバースプライマーが120A尾部を3'UTRに付け加えた、PCR反応を鋳型とした(Q5 Hot Start 2X Master Mix)。得られたPCR産物をZymo Researchの25μg DCCカラムで精製し、その後のin vitro転写においてmRNA鋳型として使用した。NEB HiScribe High-Yield Kitを取扱説明書に従って使用したが、N1-メチル-プソイドウリジンでのウリジンの全置換、およびCleanCap AG(Trilink)での同時転写キャッピングを行った。反応クリーンナップを塩化リチウム沈殿によって行った。増幅に使用したプライマーは、表20で見ることができる。Cas9 mRNAは、Trilinkから購入した(CleanCap Cas9 mRNA 5moU)。
表20: ABE8 T7インビトロ転写反応のために使用されたプライマー
Figure 2022520081000094
[CD34+細胞の調製]
動員された末梢血を入手し、ヒトCD34+HSPC(HemaCare、M001F-GCSF/MOZ-2)を増やした。CD34+細胞を解凍し、エレクトロポレーションの48時間前に、1%Glutamax(Gibco)、100ng/mLのTPO(Peprotech)、SCF(Peprotech)、およびFlt-3(Peprotech)を含有するX-VIVO 10(Lonza)に入れた。
[CD34+細胞のエレクトロポレーション]
解凍の48時間後、細胞を回転させて沈ませてX-VIVO 10培地を除去し、0.1%HSA(Akron Biotechnologies)を有するMaxCyte緩衝液(HyClone)中で洗浄した。細胞を次いで、冷たいMaxCyte緩衝液中で、1mL当たり1,250,000個細胞で再懸濁し、複数の20μLのアリコートに分けた。ABE mRNA(0.15μM)および-198 HBG1/2 sgRNA(4.05μM)を次いで、実験条件に従って等分し、MaxCyte緩衝液中で全部で5μlに増やした。sgRNAの配列を表21に示す。20μLの細胞を、3つの群の5μLのRNA混合物に添加し、エレクトロポレーションのために、OC25x3 MaxCyteキュベットの各チャンバにロードした。電荷を受けた後、25μLをチャンバから回収し、未処置の24ウェル培養プレート内のウェルの中央に置いた。細胞を、インキュベーター(37℃、5%CO2)内に20分間回収した。20分間の回収の後、1%Glutamax、100ng/mLのTPO、SCF、およびFlt-3を含有するX-VIVO 10を、1mL当たり1,000,000個細胞の濃度となるように、細胞に添加した。細胞を次いで、インキュベーター(37℃、5%CO2)内で48時間、さらに回収させた。
表21:CD34+トランスフェクションのために使用されたsgRNAの配列
Figure 2022520081000095

a、c、g、u:2'-O-メチル残基
s:ホスホロチオエート
sgRNA足場配列:
S. pyogenes:
5’-GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAG
UGGCACCGAGUCGGUGCUsususu-3’
[ABEエレクトロポレーション後の赤血球分化]
エレクトロポレーション後の48時間の休止の後(培養の0日目)、細胞を回転させて沈め、5%ヒト血清、330μg/mLのトランスフェリン(Sigma)、10μg/mLのヒトインスリン(Sigma)、2U/mLのヘパリンナトリウム(Sigma)、3U/mLのEPO(Peprotech)、100ng/mLのSCF(Peprotech)、5μg/mLのIL3、および50μMのヒドロコルチゾン(Sigma)を含有する「第1相」」IMDM培地(ATCC)に、1mL当たり20,000個細胞で移した。培養の4日目に、細胞に、4倍体積の同一の培地を加えた。7日目に、細胞を回転させて沈め、5%ヒト血清(Sigma)、330μg/mLのトランスフェリン、10μg/mLのヒトインスリン、2U/mLのヘパリンナトリウム、3U/mLのEPO、および100ng/mLのSCFを含有する「第2相」IMDM培地に、1mL当たり200,000個細胞で移した。11日目に、細胞を回転させて沈め、5%ヒト血清、330μg/mLのトランスフェリン、10μg/mLのヒトインスリン、2U/mLのヘパリンナトリウム、および3U/mLのEPOを含有する「第3相」IMDM培地に、1mL当たり1,000,000個細胞で移した。14日目に、細胞を回転させて沈め、11日目と同一の培地に再懸濁したが、1mL当たり5,000,000個細胞であった。18日目に、分化した赤血球を、500,000個細胞のアリコートに回収し、500μLのDPBS(Gibco)中で1回洗浄し、そして-80℃で24時間凍結し、その後、UHPLC処理を行った。
[UHPLC分析のための赤血球試料の調製]
凍結された赤血球ペレットを室温で解凍した。ペレットをACK溶解緩衝液で5×104個細胞/μLの最終濃度まで希釈した。試料をピペットによって混合し、室温で5分間インキュベートした。試料を次いで-80℃で5分間凍結し、解凍させ、そしてピペットによって混合し、その後、6,700gで10分間遠心分離した。上清を慎重に除去し(細胞デブリペレットを崩壊させることなく)、新たなプレートに移し、そして、UHPLC分析のために超純水中で5×103個細胞/μLまで希釈した。
[超高速液体クロマトグラフィー(UHPLC)分析]
グロビン鎖の逆相分離を、バイナリポンプおよびUV検出器で構成されたUHPLC系で行った(Thermo Fisher Scientific、Vanquish Horizon)。固定相は、ACQUITYペプチドBEH C18カラム(2.1×150mm、1.7μmのビーズ、300Aの孔)と、その後の、AQUITYペプチドBEH C18 VanGuardプレカラム(2.1×5mm、1.7μmのビーズ、300Aの孔)(共にWaters Corp)とからなり、カラム温度は60℃であった。溶出を、水中の0.1%トリフルオロ酢酸(TFA)(A)、およびアセトニトリル中の0.08%TFA(B)を使用して、流速0.25mL/分で行った。グロビン鎖の分離を、0~10分まで40~52%B、10~10.5分まで52~40%B、12分まで40%Bの線形勾配を使用して行った。試料注射体積は10μLであり、データレート5Hzで波長220nmでのUVスペクトルを、分析全体を通して回収した。グロビン鎖の同一性を、ヘモグロビン標準のLC/MS分析を介して確認した。
[CD34+細胞でのゲノムDNA抽出]
ABEエレクトロポレーションの後(48時間後)、1%Glutamax(Gibco)、100ng/mLのTPO(Peprotech)、SCF(Peprotech)、およびFlt-3(Peprotech)を含有するX-VIVO 10培地(Lonza)中で、細胞のアリコートを培養した。培養の48時間後および144時間後、100,000個の細胞を回収し、回転させて沈めた。50μLのQuick Extract(Lucigen)を細胞ペレットに添加し、細胞混合物を96ウェルPCRプレート(Bio-Rad)に移した。溶解物を65℃で15分間加熱し、その後、98℃で10分間加熱した。細胞溶解物を-20℃で保管した。
[ゲノムDNA試料の次世代配列決定(NGS)]
ゲノムDNA試料をハイスループット配列決定のために増幅し、調製した(Gaudelli, N. M. et al. Programmable base editing of A*T to G*C in genomic DNA without DNA cleavage. Nature 551, 464-471, doi:10.1038/nature24644 (2017)を参照されたい)。1μLのgDNAを、Phusion U Green Multiplex PCR Master Mixならびに0.5μMの各フォワードプライマーおよびリバースプライマーを含有する25μLのPCR反応物に添加した。増幅後、PCR産物に、固有のIlluminaバーコーディングプライマー対を使用してバーコードを付けた。バーコーディング反応物は、0.5μMの各illuminaフォワードプライマーおよびリバースプライマー、増幅された目的のゲノム部位を含有する2μLのPCR混合物、ならびにQ5 Hot Start High-Fidelity 2x Master Mixを、総体積25μLで含んでいた。全てのPCR条件は、これまでに公開されている通りに行った(Gaudelli, N. M. et al. Programmable base editing of A*T to G*C in genomic DNA without DNA cleavage. Nature 551, 464-471, doi:10.1038/nature24644 (2017)を参照されたい)。部位特異的な哺乳動物細胞ゲノムDNA増幅に使用したプライマーを、表19に列挙する。DNA濃度を、NanoDrop 1000分光光度計(ThermoFisher Scientific)を使用して定量し、Illumina MiSeq機器で、製造業者のプロトコールに従って配列決定した。
[標的化されたNGSデータの分析]
全ての標的化されたNGSデータを、4つの一般的なステップを行うことによって分析した:(1)Illumina逆多重化、(2)リードのトリミングおよびフィルタリング、(3)予想されるアンプリコン配列に対する全リードのアラインメント、ならびに(4)アラインメントの統計の獲得および編集率の定量。各ステップを、以下に、より詳細に記載する。
1.MiSeqによって作成されたベースコールファイル(BCF)からFASTQファイルを作成するために、以下のパラメータでIllumina bcl2fastq(v2.20.0.422)を実行することによって逆多重化を行った:
bcl2fastq\
--ignore-missing-bcls\
--ignore-missing-filter\
--ignore-missing-positions\
--ignore-missing-controls\
--auto-set-to-zero-barcode-mismatches\
--find-adapters-with-sliding-window\
--adapter-stringency 0.9\
--mask-short-adapter-reads 35\
--minimum-trimmed-read-length 35\
2.ステップ(1)で作成されたFASTQファイルを、trimmomatic(v0.39)14と、Illumina TruSeqアダプターをクリップし、20塩基よりも短いリードを排除し、そして4bpのスライディングウィンドウ内の平均塩基品質(Phredスコア)が15未満に低下した場合はリードの残りの3'末端をトリムするように設定されたパラメータとを使用して処理した。加えて、リードの末端で品質スコアが3以下である全ての塩基を除去した。最後に、1ラウンド目のPCRプライマーはリード1のプライマー配列の後に4つのランダム化された塩基を含んでいるため、各リードの最初の4つの塩基をトリムした。trimmomaticを実行するために使用されるコマンドを以下に示す:
trimmomatic SE -phred33 $input_fastq $output_fastq\
ILLUMINACLIP:illumine_adapters.fa:2:30:10\
LEADING:3 TRAILING:3\
SLIDINGWINDOW:4:15\
MINLEN:20\
HEADCROP:4
3.end-to-endモードのbowtie2(v2.35)15と、非常に感受性の高いフラッグによって特定されるアラインメントパラメータとを使用して、リードをアンプリコン配列に対してアラインした。参照配列を、ヒトゲノム(GRCh38)に基づいて各プライマー対について予想されるアンプリコン配列(プライマーを含む)として決定した。bowtie2によって作成されたSAMファイルをBAMファイルに変換し、ソートし、そしてsamtoolsパッケージ(v1.9)16を使用してインデックスを付けた。少なくとも5,000個のアラインされたリードを有する試料のみを、分析に考慮した。
4.ステップ(3)で作成されたBAMファイルを、bam-readcountsツール(https://github.com/genome/bam-readcount)を使用して処理して、アラインメントにおける各位置での非参照塩基、欠失、および挿入の数をまとめた標準文字ファイルを作成した。編集率についての統計から信頼度の低い塩基コールを排除するために、非参照塩基を数えるための最小塩基品質(Phredスコア)を29に設定した。塩基エディター標的部位(そのプロトスペーサー+PAM配列と定義される)とオーバーラップする挿入および/または欠失を有していたリードのみを、挿入率および欠失率にカウントした。標的部位における各位置での編集率を、アラインメントにおける所与の位置での、塩基品質閾値を超える塩基の総数に対する、所与のタイプの非参照塩基(例えばG)の分数として計算した。
同一のコンピュータ分析アプローチを使用して行われたさらなる分析において、異なる遺伝子座でABE7およびABE8によって生成されたハプロタイプが、図60に示されている。
[他の実施形態]
上記の説明から、種々の用途および条件に適用させるために、本明細書に記述する本発明に変形および修正を加えることができることが明らかであろう。そのような実施形態もまた、以下の特許請求の範囲の範囲内である。
本明細書における可変要素の定義における要素のリストの記載は、リストされた要素のいずれかの単一要素または組合せ(またはサブコンビネーション)としてのその可変要素の定義を含む。本明細書における実施形態の説明は、いずれかの単一の実施形態としての、または任意の他の実施形態もしくはその一部との組合せにおける、その実施形態を含む。
本明細書に言及されているすべての刊行物、特許、および特許出願は、それぞれの個々の刊行物、特許、または特許出願が具体的かつ個別に参照により組み込まれることが示されているのと同じ程度に、参照により本明細書に組み込まれる。別段の表示がない限り、本明細書に言及されている刊行物、特許および特許出願は、その全体が参照により本明細書に組み込まれる。
本開示の方法および組成物を包含する以下の番号付けされた追加の実施形態が本明細書において想定される:
1. 配列番号2における番号付けでアミノ酸位置82もしくは166における改変、または別のアデノシンデアミナーゼにおける対応する改変を含むアミノ酸配列を含むアデノシンデアミナーゼであって、前記アデノシンデアミナーゼの前記アミノ酸配列が配列番号2に対して少なくとも85%の配列同一性を含む、アデノシンデアミナーゼ。
2. デオキシリボ核酸 (DNA) 配列の核酸塩基を脱アミノ化する、実施形態1に記載のアデノシンデアミナーゼ。
3. 前記アデノシンデアミナーゼの前記アミノ酸配列が配列番号2に対して少なくとも90%の配列同一性を含む、実施形態1または2のいずれか1つに記載のアデノシンデアミナーゼ。
4. 前記アデノシンデアミナーゼの前記アミノ酸配列が配列番号2に対して少なくとも95%の配列同一性を含む、実施形態1または2のいずれか1つに記載のアデノシンデアミナーゼ。
5. 前記アデノシンデアミナーゼの前記アミノ酸配列が配列番号2に対して少なくとも99%の配列同一性を含む、実施形態1または2のいずれか1つに記載のアデノシンデアミナーゼ。
6. 前記アミノ酸配列が、配列番号2における番号付けで位置82における前記改変、または別のアデノシンデアミナーゼにおける対応する改変を含む、実施形態1~5のいずれか1つに記載のアデノシンデアミナーゼ。
7. 前記アミノ酸配列が、配列番号2における番号付けで位置166における前記改変、または別のアデノシンデアミナーゼにおける対応する改変を含む、実施形態1~5のいずれか1つに記載のアデノシンデアミナーゼ。
8. 前記アミノ酸配列が、配列番号2における番号付けで位置82および166における改変、または別のアデノシンデアミナーゼにおける対応する改変を含む、実施形態1~5のいずれか1つに記載のアデノシンデアミナーゼ。
9. 前記アミノ酸配列がV82Sの改変を含み、位置82が配列番号2における番号付けによるものである、実施形態1~5のいずれか1つに記載のアデノシンデアミナーゼ。
10. 前記アミノ酸配列がV82Xの改変を含み、位置82が配列番号2における番号付けによるものであり、XがV以外の任意のアミノ酸である、実施形態1~5のいずれか1つに記載のアデノシンデアミナーゼ。
11. 前記アミノ酸配列がT166Rの改変を含み、位置166が配列番号2における番号付けによるものである、実施形態1~5のいずれか1つに記載のアデノシンデアミナーゼ。
12. 前記アミノ酸配列がT166Xの改変を含み、位置166が配列番号2における番号付けによるものであり、XがT以外の任意のアミノ酸である、実施形態1~5のいずれか1つに記載のアデノシンデアミナーゼ。
13. 前記アミノ酸配列がV82SおよびT166Rの改変を含み、位置82および166が配列番号2における番号付けによるものである、実施形態1~5のいずれか1つに記載のアデノシンデアミナーゼ。
14. 前記アミノ酸配列が、配列番号2における番号付けで、76、82、123、147、154、および166からなる群から選択される位置における1つまたは複数の改変をさらに含む、実施形態1~13のいずれか1つに記載のアデノシンデアミナーゼ。
15. 前記アミノ酸配列が、配列番号2における番号付けで、V82S、Y147T、Y147R、Q154S、Y123H、Q154R、およびT166Rからなる群から選択される1つまたは複数の改変をさらに含む、実施形態1~14のいずれか1つに記載のアデノシンデアミナーゼ。
16. 前記アミノ酸配列が、Y147T+Q154R;Y147T+Q154S;Y147R+Q154S;V82S+Q154S;V82S+Y147R;V82S+Q154R;V82S+Y123H;I76Y+V82S;V82S+Y123H+Y147T;V82S+Y123H+Y147R;V82S+Y123H+Q154R;Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y123H+Y147R+Q154R+I76Y;V82S+Y123H+Y147R+Q154R;およびI76Y+V82S+Y123H+Y147R+Q154Rからなる群から選択される改変の組合せをさらに含む、実施形態1~15のいずれか1つに記載のアデノシンデアミナーゼ。
17. 前記アミノ酸配列が、配列番号2における番号付けで、149、150、151、152、153、154、155、156、および157からなる群から選択される位置において始まるC末端の欠失をさらに含む、実施形態1~16のいずれか1つに記載のアデノシンデアミナーゼ。
18. 前記アデノシンデアミナーゼが、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインとの複合体中にある、実施形態1~17のいずれか1つに記載のアデノシンデアミナーゼ。
19. 標的デオキシリボ核酸においてAからGへの改変をもたらす、実施形態1~18のいずれか1つに記載のアデノシンデアミナーゼ。
20. 前記複合体が、前記ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインおよび配列番号2のアデノシンデアミナーゼを含むタンパク質複合体よりも高い塩基編集効率を含む、実施形態18または19のいずれか1つに記載のアデノシンデアミナーゼ。
21. 前記複合体が少なくとも50%の塩基編集効率を含む、実施形態18~20のいずれか1つに記載のアデノシンデアミナーゼ。
22. 前記複合体が少なくとも70%の塩基編集効率を含む、実施形態18~21のいずれか1つに記載のアデノシンデアミナーゼ。
23. 前記複合体が、前記ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインおよび配列番号2のアデノシンデアミナーゼを含むタンパク質複合体よりも少なくとも5倍高い塩基編集効率を含む、実施形態18~21のいずれか1つに記載のアデノシンデアミナーゼ。
24. 前記塩基編集効率が、前記アデノシンデアミナーゼによりもたらされた標的核酸塩基の改変を含む全配列決定リードのパーセンテージにより決定される、実施形態20~23のいずれか1つに記載のアデノシンデアミナーゼ。
25. 前記複合体が、前記ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインおよび配列番号2のアデノシンデアミナーゼを含むタンパク質複合体よりも低いインデル形成率を含む、実施形態18~24のいずれか1つに記載のアデノシンデアミナーゼ。
26. 前記複合体が、前記ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインおよび配列番号2のアデノシンデアミナーゼを含むタンパク質複合体と比べて10%未満の標的ポリヌクレオチドにおけるインデル形成を結果としてもたらす、実施形態18~25のいずれか1つに記載のアデノシンデアミナーゼ。
27. 前記複合体が、細胞中のゲノムにおける10%未満のインデルを結果としてもたらす、実施形態18~26のいずれか1つに記載のアデノシンデアミナーゼ。
28. 前記インデル形成が、前記標的核酸塩基改変に隣接する配列および非改変配列の間のミスマッチ頻度により測定される、実施形態25~27のいずれか1つに記載のアデノシンデアミナーゼ。
29. 前記複合体が、前記ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインおよび配列番号2のアデノシンデアミナーゼを含むタンパク質複合体よりも高い標的核酸塩基に対する特異性を含む、実施形態18~28のいずれか1つに記載のアデノシンデアミナーゼ。
30. 前記複合体が、前記ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインおよび配列番号2のアデノシンデアミナーゼを含むタンパク質複合体よりも低いオフターゲット脱アミノ化を結果としてもたらす、実施形態18~29のいずれか1つに記載のアデノシンデアミナーゼ。
31. 前記オフターゲット脱アミノ化が目的外核酸塩基の脱アミノ化を含む、実施形態30に記載のアデノシンデアミナーゼ。
32. 前記オフターゲット脱アミノ化がバイスタンダー核酸塩基の脱アミノ化を含む、実施形態30に記載のアデノシンデアミナーゼ。
33. 前記複合体が、前記ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインおよび配列番号2のアデノシンデアミナーゼを含むタンパク質複合体よりも広い塩基編集範囲を含む、実施形態18~32のいずれか1つに記載のアデノシンデアミナーゼ。
34. 前記複合体が、前記ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインおよび配列番号2のアデノシンデアミナーゼを含むタンパク質複合体と比較して、正準的PAM配列の5、6、または7塩基対上流の標的核酸塩基において少なくとも1.5倍高い塩基編集効率を含む、実施形態18~33のいずれか1つに記載のアデノシンデアミナーゼ。
35. 前記複合体が、前記ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインおよび配列番号2のアデノシンデアミナーゼを含むタンパク質複合体と比較して、標的ポリヌクレオチド中の非正準的PAM配列の3、4、8、9、または10塩基対上流の標的核酸塩基において少なくとも3倍高い塩基編集効率を含む、実施形態18~34のいずれか1つに記載のアデノシンデアミナーゼ。
36. 前記ポリヌクレオチドプログラム可能なヌクレオチド結合タンパク質がCas9ポリペプチドまたはその断片である、実施形態1~35のいずれか1つに記載のアデノシンデアミナーゼ。
37. 前記Cas9ポリペプチドがCas9ニッカーゼ(nCas9) である、実施形態36に記載のアデノシンデアミナーゼ。
38. 前記Cas9ポリペプチドがヌクレアーゼ不活Cas9 (dCas9) である、実施形態36に記載のアデノシンデアミナーゼ。
39. 前記Cas9ポリペプチドがSpCas9ポリペプチドを含む、実施形態36~38のいずれか1つに記載のアデノシンデアミナーゼ。
40. 前記SpCas9ポリペプチドがD10Aおよび/またはH840Aのアミノ酸置換を含む、実施形態39に記載のアデノシンデアミナーゼ。
41. 前記Cas9ポリペプチドがSaCas9ポリペプチドを含む、実施形態36~40のいずれか1つに記載のアデノシンデアミナーゼ。
42. 前記Cas9ポリペプチドが、改変されたPAMに対して特異性を有する、実施形態36~41のいずれか1つに記載のアデノシンデアミナーゼ。
43. 前記Cas9ポリペプチドが、NGG、NGA、NGCG、NGN、NNGRRT、NNNRRT、NGCG、NGCN、NGTN、およびNGCからなる群から選択されるPAM配列に対して特異性を有し、ここでNはA、G、C、またはTであり、RはAまたはGである、実施形態36~42のいずれか1つに記載のアデノシンデアミナーゼ。
44. a)ポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン、
b)配列番号2における番号付けでアミノ酸位置82もしくは166における改変、または別のアデノシンデアミナーゼにおける対応する改変を含むアミノ酸配列を含むアデノシンデアミナーゼであって、前記アデノシンデアミナーゼの前記アミノ酸配列が配列番号2に対して少なくとも85%の配列同一性を含む、アデノシンデアミナーゼ
を含む、融合ポリペプチド。
45. a)ポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン、および
b)アデノシンデアミナーゼ
を含み、前記ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインおよび配列番号2のアデノシンデアミナーゼを含む第2の融合ポリペプチドよりも高い塩基編集効率を含む、
融合ポリペプチド。
46. 少なくとも50%の塩基編集効率を含む、実施形態45に記載の融合ポリペプチド。
47. 少なくとも70%の塩基編集効率を含む、実施形態45に記載の融合ポリペプチド。
48. 前記ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインおよび配列番号2のアデノシンデアミナーゼを含むタンパク質複合体よりも少なくとも5倍高い塩基編集効率を含む、実施形態45に記載の融合ポリペプチド。
49. 前記塩基編集効率が、前記アデノシンデアミナーゼによりもたらされた標的核酸塩基の改変を含む全配列決定リードのパーセンテージにより決定される、実施形態45~48のいずれか1つに記載の融合ポリペプチド。
50. a)ポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン、および
b)アデノシンデアミナーゼ
を含み、前記ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインおよび配列番号2のアデノシンデアミナーゼを含む第2の融合ポリペプチドと比較して、標的ポリヌクレオチド配列においてより低いインデル形成を結果としてもたらす、
低減したインデル形成率を有する融合ポリペプチド。
51. 前記ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインおよび配列番号2のアデノシンデアミナーゼを含む第2の融合ポリペプチドと比較して、標的ポリヌクレオチド配列において5%未満のインデル形成を結果としてもたらす、実施形態50に記載の融合ポリペプチド。
52. 細胞中のゲノムにおける10%未満のインデルを結果としてもたらす、実施形態44~51のいずれか1つに記載の融合ポリペプチド。
53. 前記インデル形成が、前記標的核酸塩基改変に隣接する配列および非改変配列の間のミスマッチ頻度により測定される、実施形態51~52のいずれか1つに記載の融合ポリペプチド。
54. a)ポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン、および
b)アデノシンデアミナーゼ
を含み、前記ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインおよび配列番号2のアデノシンデアミナーゼを含む融合ポリペプチドよりも高い標的核酸塩基に対する特異性を含む、
より高い特異性を有する融合ポリペプチド。
55. a)ポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン、および
b)アデノシンデアミナーゼ
を含み、前記ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインおよび配列番号2のアデノシンデアミナーゼを含む融合ポリペプチドよりも低いオフターゲット脱アミノ化を結果としてもたらす、融合ポリペプチド。
56. 前記オフターゲット脱アミノ化が目的外核酸塩基の脱アミノ化を含む、実施形態55に記載の融合ポリペプチド。
57. 前記オフターゲット脱アミノ化がバイスタンダー核酸塩基の脱アミノ化を含む、実施形態55に記載の融合ポリペプチド。
58. a)ポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン、および
b)アデノシンデアミナーゼ
を含み、前記ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインおよび配列番号2のアデノシンデアミナーゼを含む融合ポリペプチドよりも広い塩基編集範囲を含む、融合ポリペプチド。
59. 前記ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインおよび配列番号2のアデノシンデアミナーゼを含む融合ポリペプチドと比較して、正準的PAM配列の5、6、または7塩基対上流の標的核酸塩基において少なくとも1.5倍高い塩基編集効率を含む、実施形態58に記載の融合ポリペプチド。
60. 前記ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインおよび配列番号2のアデノシンデアミナーゼを含む融合ポリペプチドと比較して、標的ポリヌクレオチド中の非正準的PAM配列の3、4、8、9、または10塩基対上流の標的核酸塩基において少なくとも3倍高い塩基編集効率を含む、実施形態58または59に記載の融合ポリペプチド。
61. 前記アデノシンデアミナーゼが、デオキシリボ核酸 (DNA) 配列の核酸塩基を脱アミノ化する、実施形態44~60のいずれか1つに記載の融合ポリペプチド。
62. 前記アデノシンデアミナーゼの前記アミノ酸配列が配列番号2に対して少なくとも90%の配列同一性を含む、実施形態44~61のいずれか1つに記載の融合ポリペプチド。
63. 前記アデノシンデアミナーゼの前記アミノ酸配列が配列番号2に対して少なくとも95%の配列同一性を含む、実施形態44~61のいずれか1つに記載の融合ポリペプチド。
64. 前記アデノシンデアミナーゼの前記アミノ酸配列が配列番号2に対して少なくとも99%の配列同一性を含む、実施形態44~61のいずれか1つに記載の融合ポリペプチド。
65. 前記アミノ酸配列が、配列番号2における番号付けで位置82における前記改変、または別のアデノシンデアミナーゼにおける対応する改変を含む、実施形態44~64のいずれか1つに記載の融合ポリペプチド。
66. 前記アミノ酸配列が、配列番号2における番号付けで位置166における前記改変、または別のアデノシンデアミナーゼにおける対応する改変を含む、実施形態44~64のいずれか1つに記載の融合ポリペプチド。
67. 前記アミノ酸配列が、配列番号2における番号付けで位置82および166における改変、または別のアデノシンデアミナーゼにおける対応する改変を含む、実施形態44~64のいずれか1つに記載の融合ポリペプチド。
68. 前記アミノ酸配列がV82Sの改変を含み、位置82が配列番号2における番号付けによるものである、実施形態44~64のいずれか1つに記載の融合ポリペプチド。
69. 前記アミノ酸配列がV82Xの改変を含み、位置82が配列番号2における番号付けによるものであり、XがV以外の任意のアミノ酸である、実施形態44~64のいずれか1つに記載の融合ポリペプチド。
70. 前記アミノ酸配列がT166Rの改変を含み、位置166が配列番号2における番号付けによるものである、実施形態44~64のいずれか1つに記載の融合ポリペプチド。
71. 前記アミノ酸配列がT166Xの改変を含み、位置166が配列番号2における番号付けによるものであり、XがT以外の任意のアミノ酸である、実施形態44~64のいずれか1つに記載の融合ポリペプチド。
72. 前記アミノ酸配列がV82SおよびT166Rの改変を含み、位置82および166が配列番号2における番号付けによるものである、実施形態44~64のいずれか1つに記載の融合ポリペプチド。
73. 前記アミノ酸配列が、配列番号2における番号付けで、76、82、123、147、154、および166からなる群から選択される位置における1つまたは複数の改変をさらに含む、実施形態44~71のいずれか1つに記載の融合ポリペプチド。
74. 前記アミノ酸配列が、配列番号2における番号付けで、V82S、Y147T、Y147R、Q154S、Y123H、Q154R、およびT166Rからなる群から選択される1つまたは複数の改変をさらに含む、実施形態44~73のいずれか1つに記載の融合ポリペプチド。
75. 前記アミノ酸配列が、Y147T+Q154R;Y147T+Q154S;Y147R+Q154S;V82S+Q154S;V82S+Y147R;V82S+Q154R;V82S+Y123H;I76Y+V82S;V82S+Y123H+Y147T;V82S+Y123H+Y147R;V82S+Y123H+Q154R;Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y123H+Y147R+Q154R+I76Y;V82S+Y123H+Y147R+Q154R;およびI76Y+V82S+Y123H+Y147R+Q154Rからなる群から選択される改変の組合せをさらに含む、実施形態44~74のいずれか1つに記載の融合ポリペプチド。
76. 前記アミノ酸配列が、配列番号2における番号付けで、149、150、151、152、153、154、155、156、および157からなる群から選択される位置において始まるC末端の欠失をさらに含む、実施形態44~75のいずれか1つに記載の融合ポリペプチド。
77. 前記アデノシンデアミナーゼが、標的デオキシリボ核酸においてAからGへの改変をもたらす、実施形態44~76のいずれか1つに記載の融合ポリペプチド。
78. 前記ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインが実質的なヌクレアーゼ活性を含まない、実施形態44~77のいずれか1つに記載の融合ポリペプチド。
79. 前記ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインが触媒不活Cas9 (dCas9)を含む、実施形態44~78のいずれか1つに記載の融合ポリペプチド。
80. 前記融合ポリペプチドのインデル形成頻度が、ニッカーゼCas9および前記アデノシンデアミナーゼを含む融合ポリペプチドよりも低い、実施形態79に記載の融合ポリペプチド。
81. 前記インデル形成頻度が、ニッカーゼCas9および前記アデノシンデアミナーゼを含む融合ポリペプチドよりも少なくとも約90%低い、実施形態80に記載の融合ポリペプチド。
82. 構造:
NH2-[前記ポリヌクレオチドプログラム可能なヌクレオチド結合タンパク質のN末端断片]-[前記アデノシンデアミナーゼ]-[前記ポリヌクレオチドプログラム可能なヌクレオチド結合タンパク質のC末端断片]-COOH
を含み、ここで「]-[」の各記載は任意のリンカーである、実施形態44~81のいずれか1つに記載の融合ポリペプチド。
83. 前記ポリヌクレオチドプログラム可能なヌクレオチド結合タンパク質がCas9ポリペプチドである、実施形態44~82のいずれか1つに記載の融合ポリペプチド。
84. 前記N末端断片のC末端または前記C末端断片のN末端が前記Cas9ポリペプチドの柔軟なループの部分を含む、実施形態83に記載の融合ポリペプチド。
85. 前記Cas9ポリペプチドがCas9ニッカーゼ(nCas9) である、実施形態83または84に記載の融合ポリペプチド。
86. 前記Cas9ポリペプチドがヌクレアーゼ不活Cas9 (dCas9) である、実施形態83または84に記載の融合ポリペプチド。
87. 前記Cas9ポリペプチドがSpCas9ポリペプチドを含む、実施形態83~86のいずれか1つに記載の融合ポリペプチド。
88. 前記SpCas9ポリペプチドがD10Aおよび/またはH840Aのアミノ酸置換を含む、実施形態87に記載の融合ポリペプチド。
89. 前記Cas9ポリペプチドがSaCas9ポリペプチドを含む、実施形態83~88のいずれか1つに記載の融合ポリペプチド。
90. 前記Cas9ポリペプチドが、改変されたPAMに対して特異性を有する、実施形態83~89のいずれか1つに記載の融合ポリペプチド。
91. 前記Cas9ポリペプチドが、NGG、NGA、NGCG、NGN、NNGRRT、NNNRRT、NGCG、NGCN、NGTN、およびNGCからなる群から選択されるPAM配列に対して特異性を有し、ここでNはA、G、C、またはTであり、RはAまたはGである、実施形態83~90のいずれか1つに記載の融合ポリペプチド。
92. a)実施形態1~43のいずれか1つに記載のアデノシンデアミナーゼを含む第1のアデノシンデアミナーゼモノマー、および
b)第2のアデノシンデアミナーゼモノマー
を含む、アデノシンデアミナーゼダイマー。
93. 前記第2のアデノシンデアミナーゼモノマーが配列番号2のアミノ酸配列を含む、実施形態92に記載のアデノシンデアミナーゼダイマー。
94. 前記第2のアデノシンデアミナーゼモノマーが野生型アデノシンデアミナーゼのアミノ酸配列を含む、実施形態92または93に記載のアデノシンデアミナーゼダイマー。
95. 前記第2のアデノシンデアミナーゼモノマーが、配列番号2における番号付けで位置82もしくは166における改変、または別のアデノシンデアミナーゼモノマーにおける対応する改変を含むアミノ酸配列を含む、実施形態92~94のいずれか1つに記載のアデノシンデアミナーゼダイマー。
96. 前記第2のアデノシンデアミナーゼモノマーが、前記第1のアデノシンデアミナーゼモノマーのアミノ酸配列と同じアミノ酸配列を含む、実施形態92~95のいずれか1つに記載のアデノシンデアミナーゼダイマー。
97. a)ポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン、および
b)実施形態1~43のいずれか1つに記載のアデノシンデアミナーゼ
を含む、塩基エディターシステム。
98. 標的ポリヌクレオチド配列中の標的核酸塩基を編集する方法であって、前記標的ポリヌクレオチド配列を、実施形態1~43のいずれか1つに記載のアデノシンデアミナーゼと接触させることを含み、前記アデノシンデアミナーゼが前記標的ポリヌクレオチド配列中の前記標的核酸塩基を脱アミノ化し、それにより、前記標的ポリヌクレオチド配列中の前記標的核酸塩基を編集する、方法。
99. 標的ポリヌクレオチド配列中の標的核酸塩基を編集する方法であって、前記標的ポリヌクレオチド配列を、実施形態44~91のいずれか1つに記載の融合ポリペプチドと接触させることを含み、前記アデノシンデアミナーゼが前記標的ポリヌクレオチド配列中の前記標的核酸塩基を脱アミノ化し、それにより、前記標的ポリヌクレオチド配列中の前記標的核酸塩基を編集する、方法。
100. 標的ポリヌクレオチド配列中の標的核酸塩基を編集する方法であって、前記標的ポリヌクレオチド配列を、実施形態97に記載の塩基エディターシステムと接触させることを含み、前記アデノシンデアミナーゼが前記標的ポリヌクレオチド配列中の前記標的核酸塩基を脱アミノ化し、それにより、前記標的ポリヌクレオチド配列中の前記標的核酸塩基を編集する、方法。
101. それを必要とする対象において障害を処置する方法であって、前記対象の標的ポリヌクレオチド配列を、実施形態1~43のいずれか1つに記載のアデノシンデアミナーゼと接触させることを含み、前記アデノシンデアミナーゼが前記標的ポリヌクレオチド配列中の標的核酸塩基を脱アミノ化し、それにより、前記対象において前記障害を処置する、方法。
102. それを必要とする対象において障害を処置する方法であって、前記対象の標的ポリヌクレオチド配列を、実施形態44~91のいずれか1つに記載の融合ポリペプチドと接触させることを含み、前記アデノシンデアミナーゼが前記標的ポリヌクレオチド配列中の標的核酸塩基を脱アミノ化し、それにより、前記対象において前記障害を処置する、方法。
103. それを必要とする対象において障害を処置する方法であって、前記対象の標的ポリヌクレオチド配列を、実施形態97に記載の塩基エディターシステムと接触させることを含み、前記アデノシンデアミナーゼが前記標的ポリヌクレオチド配列中の標的核酸塩基を脱アミノ化し、それにより、前記対象において前記障害を処置する、方法。
104. 前記障害が点突然変異の結果としてもたらされるものである、実施形態101~103のいずれか1つに記載の方法。
105. 前記点突然変異がGからAへの点突然変異である、実施形態104に記載の方法。
106. 前記標的核酸塩基が突然変異体A塩基である、実施形態105に記載の方法。
107. 前記突然変異体A塩基の前記脱アミノ化が、障害と関連付けられない配列を結果としてもたらす、実施形態106に記載の方法。
108. 前記標的核酸塩基の前記脱アミノ化が、前記標的ポリヌクレオチドによりコードされるアミノ酸コドンの変化を結果としてもたらす、実施形態98~107のいずれか1つに記載の方法。
109. 前記脱アミノ化がスプライス部位の導入を結果としてもたらす、実施形態98~107のいずれか1つに記載の方法。
110. 前記脱アミノ化がスプライス部位の除去を結果としてもたらす、実施形態98~107のいずれか1つに記載の方法。
111. 前記脱アミノ化が停止コドンの除去を結果としてもたらす、実施形態98~107のいずれか1つに記載の方法。
112. 前記脱アミノ化が遺伝子プロモーター配列中の改変の導入を結果としてもたらす、実施形態98~107のいずれか1つに記載の方法。
113. 前記改変が、前記遺伝子プロモーター配列に作動可能に連結した遺伝子の転写の増加に繋がる、実施形態112に記載の方法。
114. 前記改変が、前記遺伝子プロモーター配列に作動可能に連結した遺伝子の転写の減少に繋がる、実施形態112に記載の方法。
115. 前記脱アミノ化が遺伝子リプレッサー配列中の改変の導入を結果としてもたらす、実施形態98~107のいずれか1つに記載の方法。
116. 前記改変が、前記遺伝子リプレッサー配列に作動可能に連結した遺伝子の転写の増加に繋がる、実施形態115に記載の方法。
117. 前記改変が、前記遺伝子リプレッサー配列に作動可能に連結した遺伝子の転写の減少に繋がる、実施形態115に記載の方法。
118. 前記接触がin vivoで行われる、実施形態98~117のいずれか1つに記載の方法。
119. 前記接触がex vivoで行われる、実施形態98~117のいずれか1つに記載の方法。
120. 前記接触が細胞中で行われる、実施形態98~117のいずれか1つに記載の方法。
121. 前記細胞のゲノムにおいて15%未満のインデルを結果としてもたらす、実施形態120に記載の方法。
122. 前記細胞のゲノムにおいて5%未満のインデルを結果としてもたらす、実施形態120に記載の方法。
123. 前記細胞のゲノムにおいて2%未満のインデルを結果としてもたらす、実施形態120に記載の方法。
124. 前記細胞が哺乳動物細胞またはヒト細胞である、実施形態120~123のいずれか1つに記載の方法。
125. 前記接触が細胞の集団中で行われる、実施形態98~117のいずれか1つに記載の方法。
126. 細胞の前記集団の少なくとも40%が、前記接触後に前記脱アミノ化された標的核酸塩基を含む、実施形態125に記載の方法。
127. 細胞の前記集団の少なくとも50%が、前記接触後に前記脱アミノ化された標的核酸塩基を含む、実施形態125に記載の方法。
128. 細胞の前記集団の少なくとも60%が、前記接触後に前記脱アミノ化された標的核酸塩基を含む、実施形態125に記載の方法。
129. 細胞の前記集団の少なくとも85%が、前記接触後に生存している、実施形態125~128のいずれか1つに記載の方法。
130. 細胞の前記集団が哺乳動物細胞またはヒト細胞である、実施形態125~129のいずれか1つに記載の方法。
131. 前記アデノシンデアミナーゼが、標的デオキシリボ核酸においてAからGへの改変をもたらす、実施形態98~130のいずれか1つに記載の方法。
132. 配列番号2のアデノシンデアミナーゼを使用する方法よりも高い塩基編集効率を結果としてもたらす、実施形態98~131のいずれか1つに記載の方法。
133. 配列番号2のアデノシンデアミナーゼを使用する方法よりも少なくとも5倍高い塩基編集効率を結果としてもたらす、実施形態98~132のいずれか1つに記載の方法。
134. 少なくとも50%の塩基編集効率を結果としてもたらす、実施形態98~133のいずれか1つに記載の方法。
135. 少なくとも70%の塩基編集効率を結果としてもたらす、実施形態98~133のいずれか1つに記載の方法。
136. 配列番号2のアデノシンデアミナーゼを使用する方法よりも低いインデル形成率を結果としてもたらす、実施形態98~135のいずれか1つに記載の方法。
137. 配列番号2のアデノシンデアミナーゼを使用する方法よりも高い標的核酸塩基に対する特異性を結果としてもたらす、実施形態98~135のいずれか1つに記載の方法。
138. 配列番号2のアデノシンデアミナーゼを使用する方法よりも低いオフターゲット脱アミノ化を結果としてもたらす、実施形態98~135のいずれか1つに記載の方法。
139. 前記標的ポリヌクレオチド配列を、前記標的核酸塩基の前記脱アミノ化をもたらすように前記融合ポリペプチドに指示するガイドポリヌクレオチドと接触させることをさらに含む、実施形態99~138のいずれか1つに記載の方法。
140. 前記ガイドポリヌクレオチドが、前記標的ポリヌクレオチド配列とハイブリダイズする核酸配列を含む、実施形態139に記載の方法。

Claims (134)

  1. ポリヌクレオチドプログラム可能なDNA結合ドメイン、ならびに
    MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSST
    のアミノ酸位置82および/または166における改変を含むアデノシンデアミナーゼバリアントを含む少なくとも1つの塩基エディタードメインを含む、融合タンパク質。
  2. 前記アデノシンデアミナーゼバリアントがアミノ酸位置82および166における改変を含む、請求項1に記載の融合タンパク質。
  3. 前記アデノシンデアミナーゼバリアントがV82Sの改変を含む、請求項1または2に記載の融合タンパク質。
  4. 前記アデノシンデアミナーゼバリアントがT166Rの改変を含む、請求項1~3のいずれか一項に記載の融合タンパク質。
  5. 前記アデノシンデアミナーゼバリアントがV82SおよびT166Rの改変を含む、請求項1~4のいずれか一項に記載の融合タンパク質。
  6. 前記アデノシンデアミナーゼバリアントが、以下の改変:Y147T、Y147R、Q154S、Y123H、およびQ154Rの1つまたは複数をさらに含む、請求項1~5のいずれか一項に記載の融合タンパク質。
  7. 前記アデノシンデアミナーゼバリアントが、Y147T+Q154R;Y147T+Q154S;Y147R+Q154S;V82S+Q154S;V82S+Y147R;V82S+Q154R;V82S+Y123H;I76Y+V82S;V82S+Y123H+Y147T;V82S+Y123H+Y147R;V82S+Y123H+Q154R;Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y123H+Y147R+Q154R+I76Y;V82S+Y123H+Y147R+Q154R;およびI76Y+V82S+Y123H+Y147R+Q154Rからなる群から選択される改変の組合せを含む、請求項1~6のいずれか一項に記載の融合タンパク質。
  8. 前記アデノシンデアミナーゼバリアントが、149、150、151、152、153、154、155、156、および157からなる群から選択される残基において始まるC末端の欠失を含む、請求項1~6のいずれか一項に記載の融合タンパク質。
  9. 前記塩基エディタードメインがアデノシンデアミナーゼバリアントモノマーを含む、請求項1~8のいずれか一項に記載の融合タンパク質。
  10. 前記塩基エディタードメインが、ABE8.1-m、ABE8.2-m、ABE8.3-m、ABE8.4-m、ABE8.5-m、ABE8.6-m、ABE8.7-m、ABE8.8-m、ABE8.9-m、ABE8.10-m、ABE8.11-m、ABE8.12-m、ABE8.13-m、ABE8.14-m、ABE8.15-m、ABE8.16-m、ABE8.17-m、ABE8.18-m、ABE8.19-m、ABE8.20-m、ABE8.21-m、ABE8.22-m、ABE8.23-m、またはABE8.24-mである、請求項1~9のいずれか一項に記載の融合タンパク質。
  11. 前記塩基エディタードメインが、野生型アデノシンデアミナーゼドメインおよびアデノシンデアミナーゼバリアントを含むアデノシンデアミナーゼヘテロダイマーを含む、請求項1~8のいずれか一項に記載の融合タンパク質。
  12. 前記塩基エディタードメインが、ABE8.1-d、ABE8.2-d、ABE8.3-d、ABE8.4-d、ABE8.5-d、ABE8.6-d、ABE8.7-d、ABE8.8-d、ABE8.9-d、ABE8.10-d、ABE8.11-d、ABE8.12-d、ABE8.13-d、ABE8.14-d、ABE8.15-d、ABE8.16-d、ABE8.17-d、ABE8.18-d、ABE8.19-d、ABE8.20-d、ABE8.21-d、ABE8.22-d、ABE8.23-d、またはABE8.24-dである、請求項1~8または11のいずれか一項に記載の融合タンパク質。
  13. 前記塩基エディタードメインが、TadA7.10ドメインおよびアデノシンデアミナーゼバリアントドメインを含むアデノシンデアミナーゼヘテロダイマーを含む、請求項1~8のいずれか一項に記載の融合タンパク質。
  14. 前記アデノシンデアミナーゼバリアントが、TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23、またはTadA*8.24である、請求項1~13のいずれか一項に記載の融合タンパク質。
  15. 前記アデノシンデアミナーゼバリアントが、アデノシンデアミナーゼ活性を有する以下の配列またはその断片を含むまたはから本質的になる、請求項1に記載の融合タンパク質。
    MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD
  16. 前記アデノシンデアミナーゼバリアントが、全長アデノシンデアミナーゼと比べて1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のN末端アミノ酸残基を欠いている、請求項1~15のいずれか一項に記載の融合タンパク質。
  17. 前記アデノシンデアミナーゼバリアントが、全長アデノシンデアミナーゼと比べて1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のC末端アミノ酸残基を欠いている切詰型アデノシンデアミナーゼである、請求項1~16のいずれか一項に記載の融合タンパク質。
  18. 前記ポリヌクレオチドプログラム可能なDNA結合ドメインが、以下の配列:
    Figure 2022520081000096
    を含み、ここで太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線を付した配列は二部分核局在化配列を示す、請求項1~17のいずれか一項に記載の融合タンパク質。
  19. 前記アデノシンデアミナーゼバリアントがY147R+Q154R+Y123Hを含む、請求項1~18のいずれか一項に記載の融合タンパク質。
  20. 前記アデノシンデアミナーゼバリアントがY147R+Q154R+I76Yを含む、請求項1~18のいずれか一項に記載の融合タンパク質。
  21. 前記アデノシンデアミナーゼバリアントがY147R+Q154R+T166Rを含む、請求項1~18のいずれか一項に記載の融合タンパク質。
  22. 前記アデノシンデアミナーゼバリアントがY147T+Q154Rを含む、請求項1~18のいずれか一項に記載の融合タンパク質。
  23. 前記アデノシンデアミナーゼバリアントがY147T+Q154Sを含む、請求項1~18のいずれか一項に記載の融合タンパク質。
  24. 前記アデノシンデアミナーゼバリアントがY147R+Q154Sを含む、請求項1~18のいずれか一項に記載の融合タンパク質。
  25. 前記アデノシンデアミナーゼバリアントがV82S+Q154Sを含む、請求項1~18のいずれか一項に記載の融合タンパク質。
  26. 前記アデノシンデアミナーゼバリアントがV82S+Y147Rを含む、請求項1~18のいずれか一項に記載の融合タンパク質。
  27. 前記アデノシンデアミナーゼバリアントがV82S+Q154Rを含む、請求項1~18のいずれか一項に記載の融合タンパク質。
  28. 前記アデノシンデアミナーゼバリアントがV82S+Y123Hを含む、請求項1~18のいずれか一項に記載の融合タンパク質。
  29. 前記アデノシンデアミナーゼバリアントがI76Y+V82Sを含む、請求項1~18のいずれか一項に記載の融合タンパク質。
  30. 前記アデノシンデアミナーゼバリアントがV82S+Y123H+Y147Tを含む、請求項1~18のいずれか一項に記載の融合タンパク質。
  31. 前記アデノシンデアミナーゼバリアントがV82S+Y123H+Y147Rを含む、請求項1~18のいずれか一項に記載の融合タンパク質。
  32. 前記アデノシンデアミナーゼバリアントがV82S+Y123H+Q154Rを含む、請求項1~18のいずれか一項に記載の融合タンパク質。
  33. 前記アデノシンデアミナーゼバリアントがY123H+Y147R+Q154R+I76Yを含む、請求項1~18のいずれか一項に記載の融合タンパク質。
  34. 前記アデノシンデアミナーゼバリアントがV82S+Y123H+Y147R+Q154Rを含む、請求項1~18のいずれか一項に記載の融合タンパク質。
  35. 前記アデノシンデアミナーゼバリアントがI76Y+V82S+Y123H+Y147R+Q154Rを含む、請求項1~18のいずれか一項に記載の融合タンパク質。
  36. 前記ポリヌクレオチドプログラム可能なDNA結合ドメインがCas9である、請求項1~35のいずれか一項に記載の融合タンパク質。
  37. 前記Cas9ポリペプチドが、以下のアミノ酸配列(Cas9参照配列):
    Figure 2022520081000097
    (一重下線:HNHドメイン;二重下線:RuvCドメイン;(Cas9参照配列))、またはその対応する領域を含む、請求項36に記載の融合タンパク質。
  38. 前記Cas9が、Staphylococcus aureus Cas9 (SaCas9)、Streptococcus thermophilus 1 Cas9 (St1Cas9)、Streptococcus pyogenes Cas9 (SpCas9)、またはそのバリアントである、請求項36に記載の融合タンパク質。
  39. 前記Cas9が、改変されたプロトスペーサー隣接モチーフ (PAM)特異性を有するまたは非G PAMに対する特異性を有するSpCas9である、請求項38に記載の融合タンパク質。
  40. 前記改変されたPAMが、核酸配列5'-NGC-3'に対する特異性を有する、請求項39に記載の融合タンパク質。
  41. 前記SpCas9が、アミノ酸置換D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、およびT1337R、またはそれらの対応するアミノ酸置換を含む、請求項39または40に記載の融合タンパク質。
  42. 前記ポリヌクレオチドプログラム可能なDNA結合ドメインがヌクレアーゼ不活性またはニッカーゼバリアントである、請求項1~41のいずれか一項に記載の融合タンパク質。
  43. 前記ニッカーゼバリアントがアミノ酸置換D10Aまたはその対応するアミノ酸置換を含む、請求項42に記載の融合タンパク質。
  44. 前記塩基エディタードメインがジンクフィンガードメインをさらに含む、請求項1~43のいずれか一項に記載の融合タンパク質。
  45. 前記アデノシンデアミナーゼバリアントが、デオキシリボ核酸 (DNA)中のアデニンを脱アミノ化することができる、請求項1~44のいずれか一項に記載の融合タンパク質。
  46. 前記アデノシンデアミナーゼバリアントが、Staphylococcus aureus TadA、Bacillus subtilis TadA、Salmonella typhimurium TadA、Shewanella putrefaciens TadA、Haemophilus influenzae F3031 TadA、Caulobacter crescentus (C. crescentus) TadA、もしくはGeobacter sulfurreducens TadA、またはその断片である、請求項1~45のいずれか一項に記載の融合タンパク質。
  47. 前記アデノシンデアミナーゼバリアントが、天然に存在しないアデノシンデアミナーゼである、請求項1~45のいずれか一項に記載の融合タンパク質。
  48. 前記ポリヌクレオチドプログラム可能なDNA結合ドメインおよび前記アデノシンデアミナーゼバリアントの間のリンカーを含む、請求項1~47のいずれか一項に記載の融合タンパク質。
  49. 前記リンカーが、アミノ酸配列:SGGSSGGSSGSETPGTSESATPESを含む、請求項48に記載の融合タンパク質。
  50. 1つまたは複数の核局在化シグナルを含む、請求項1~49のいずれか一項に記載の融合タンパク質。
  51. 前記核局在化シグナルが二部分核局在化シグナルである、請求項50に記載の融合タンパク質。
  52. 前記Cas9が、改変されたSaCas9である、請求項38に記載の融合タンパク質。
  53. 前記改変されたSaCas9が、アミノ酸置換E781K、N967K、およびR1014H、またはそれらの対応するアミノ酸置換を含む、請求項51に記載の融合タンパク質。
  54. 前記改変されたSaCas9がアミノ酸配列:
    KRNYILGLAIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRKLINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYKNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPHIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG
    を含む、請求項51に記載の融合タンパク質。
  55. MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSST
    のアミノ酸配列、または前記アミノ酸配列が少なくとも1つの改変を含むそのバリアントを含むアデノシンデアミナーゼバリアントドメイン、
    およびCas9またはCas12ポリペプチドであって、前記アデノシンデアミナーゼバリアントドメインが前記Cas9または前記Cas12ポリペプチド内に挿入されている、前記Cas9またはCas12ポリペプチド
    を含む、融合タンパク質。
  56. 前記アデノシンデアミナーゼバリアントドメインが、アミノ酸位置82および/または166における改変を含む、請求項55に記載の融合タンパク質。
  57. 前記少なくとも1つの改変が、V82S、T166R、Y147T、Y147R、Q154S、Y123H、および/またはQ154Rを含む、請求項55または56に記載の融合タンパク質。
  58. 前記アデノシンデアミナーゼバリアントドメインが、改変の以下の組合せ:Y147T+Q154R;Y147T+Q154S;Y147R+Q154S;V82S+Q154S;V82S+Y147R;V82S+Q154R;V82S+Y123H;I76Y+V82S;V82S+Y123H+Y147T;V82S+Y123H+Y147R;V82S+Y123H+Q154R;Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y123H+Y147R+Q154R+I76Y;V82S+Y123H+Y147R+Q154R;およびI76Y+V82S+Y123H+Y147R+Q154R
    のうちの1つを含む、請求項55~57のいずれか一項に記載の融合タンパク質。
  59. 前記アデノシンデアミナーゼバリアントドメインが、TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23、またはTadA*8.24である、請求項55~58のいずれか一項に記載の融合タンパク質。
  60. 前記アデノシンデアミナーゼバリアントドメインが、149、150、151、152、153、154、155、156、および157からなる群から選択される残基において始まるC末端の欠失を含む、請求項55~59のいずれか一項に記載の融合タンパク質。
  61. 前記アデノシンデアミナーゼバリアントドメインが、TadA*8アデノシンデアミナーゼバリアントドメインを含むアデノシンデアミナーゼモノマーである、請求項55~60のいずれか一項に記載の融合タンパク質。
  62. 前記アデノシンデアミナーゼバリアントドメインが、野生型アデノシンデアミナーゼドメインおよびTadA*8アデノシンデアミナーゼバリアントドメインを含むアデノシンデアミナーゼヘテロダイマーである、請求項55~60のいずれか一項に記載の融合タンパク質。
  63. 前記アデノシンデアミナーゼバリアントドメインが、TadAドメインおよびTadA*8アデノシンデアミナーゼバリアントドメインを含むアデノシンデアミナーゼヘテロダイマーである、請求項55~61のいずれか一項に記載の融合タンパク質。
  64. 前記アデノシンデアミナーゼバリアントドメインが、前記Cas9またはCas12ポリペプチドの柔軟なループ、アルファヘリックス領域、非構造化部分、または溶媒接近可能部分内に挿入されている、請求項55~63のいずれか一項に記載の融合タンパク質。
  65. 前記柔軟なループが、前記Cas9またはCas12ポリペプチドのアルファヘリックス構造の部分を含む、請求項64に記載の融合タンパク質。
  66. 前記アデノシンデアミナーゼバリアントドメインが、前記Cas9ポリペプチドのN末端断片およびC末端断片によって隣接される、請求項55~65のいずれか一項に記載の融合タンパク質。
  67. 構造:
    NH2-[Cas9のN末端断片]-[アデノシンデアミナーゼバリアント]-[Cas9のC末端断片]-COOH
    を含み、ここで「]-[」の各記載は任意のリンカーである、
    請求項65に記載の融合タンパク質。
  68. 前記Cas9またはCas12ポリペプチドの前記N末端断片または前記C末端断片が標的ポリヌクレオチド配列に結合する、請求項66または67のいずれか一項に記載の融合タンパク質。
  69. 前記N末端断片のC末端または前記C末端断片のN末端が、前記Cas9または前記Cas12ポリペプチドの柔軟なループの部分を含む、請求項66~68のいずれか一項に記載の融合タンパク質。
  70. 前記柔軟なループが、前記融合タンパク質が標的核酸塩基を脱アミノ化するときに前記標的核酸塩基に近接するアミノ酸を含む、請求項69に記載の融合タンパク質。
  71. 前記標的核酸塩基が、前記標的ポリヌクレオチド配列中のプロトスペーサー隣接モチーフ (PAM)配列から1~20個の核酸塩基だけ離れている、請求項68~70のいずれか一項に記載の融合タンパク質。
  72. 前記標的核酸塩基が、2~12個の核酸塩基だけ前記PAM配列の上流にある、請求項68~71のいずれか一項に記載の融合タンパク質。
  73. 前記N末端断片もしくは前記C末端断片がRuvCドメインを含み、
    前記N末端断片もしくは前記C末端断片がHNHドメインを含み、
    前記N末端断片も前記C末端断片もHNHドメインを含まず、または
    前記N末端断片も前記C末端断片もRuvCドメインを含まない、
    請求項66~72のいずれか一項に記載の融合タンパク質。
  74. 前記Cas9またはCas12ポリペプチドが、1つまたは複数の構造ドメイン中の部分的または完全な欠失を含み、前記アデノシンデアミナーゼが、前記Cas9またはCas12ポリペプチドの前記部分的または完全な欠失の位置において挿入されている、請求項66~73のいずれか一項に記載の融合タンパク質。
  75. 前記欠失がRuvCドメイン内にあり、
    前記欠失がHNHドメイン内にあり、または
    前記欠失がRuvCドメインおよびC末端ドメインを架橋する、
    請求項74に記載の融合タンパク質。
  76. 前記アデノシンデアミナーゼバリアントドメインがCas12ポリペプチド中に挿入されている、請求項55~75のいずれか一項に記載の融合タンパク質。
  77. 前記Cas9ポリペプチドが、Streptococcus pyogenes Cas9 (SpCas9)、Staphylococcus aureus Cas9 (SaCas9)、Streptococcus thermophilus 1 Cas9 (St1Cas9)、またはそのバリアントである、請求項76に記載の融合タンパク質。
  78. 前記Cas9が、以下のアミノ酸配列(Cas9参照配列):
    Figure 2022520081000098
    (一重下線:HNHドメイン;二重下線:RuvCドメイン;(「Cas9参照配列」))、またはその対応する領域を含む、請求項76または77に記載の融合タンパク質。
  79. 前記Cas9ポリペプチドが、前記Cas9ポリペプチド参照配列における番号付けでアミノ酸1017~1069もしくはその対応するアミノ酸の欠失を含み、
    前記Cas9ポリペプチドが、前記Cas9ポリペプチド参照配列における番号付けでアミノ酸792~872もしくはその対応するアミノ酸の欠失を含み、または
    前記Cas9ポリペプチドが、前記Cas9ポリペプチド参照配列における番号付けでアミノ酸792~906もしくはその対応するアミノ酸の欠失を含む、
    請求項78に記載の融合タンパク質。
  80. 前記アデノシンデアミナーゼバリアントドメインが、Cas9ポリペプチドの柔軟なループ内に挿入されている、請求項76~79のいずれか一項に記載の融合タンパク質。
  81. 前記柔軟なループが、前記Cas9参照配列における番号付けで位置530~537、569~579、686~691、768~793、943~947、1002~1040、1052~1077、1232~1248、および1298~1300、またはそれらの対応するアミノ酸位置におけるアミノ酸残基からなる群から選択される領域を含む、請求項80に記載の融合タンパク質。
  82. 前記アデノシンデアミナーゼバリアントドメインが、前記Cas9参照配列における番号付けでアミノ酸位置768~769、791~792、792~793、1015~1016、1022~1023、1026~1027、1029~1030、1040~1041、1052~1053、1054~1055、1067~1068、1068~1069、1247~1248、もしくは1248~1249、またはその対応するアミノ酸位置の間に挿入されている、請求項78~81のいずれか一項に記載の融合タンパク質。
  83. 前記アデノシンデアミナーゼバリアントドメインが、前記Cas9参照配列における番号付けでアミノ酸位置768~769、792~793、1022~1023、1026~1027、1040~1041、1068~1069、もしくは1247~1248またはその対応するアミノ酸位置の間に挿入されている、請求項78~82のいずれか一項に記載の融合タンパク質。
  84. 前記アデノシンデアミナーゼバリアントドメインが、前記Cas9参照配列における番号付けでアミノ酸位置1016~1017、1023~1024、1029~1030、1040~1041、1069~1070、もしくは1247~1248またはその対応するアミノ酸位置の間に挿入されている、請求項78~83のいずれか一項に記載の融合タンパク質。
  85. 前記アデノシンデアミナーゼバリアントドメインが、表10Aにおいて特定される遺伝子座において前記Cas9ポリペプチド内に挿入されている、請求項76~84のいずれか一項に記載の融合タンパク質。
  86. 前記N末端断片が、前記Cas9参照配列のアミノ酸残基1~529、538~568、580~685、692~942、948~1001、1026~1051、1078~1231、および/もしくは1248~1297、またはその対応する残基を含む、請求項78~85のいずれか一項に記載の融合タンパク質。
  87. 前記C末端断片が、前記Cas9参照配列のアミノ酸残基1301~1368、1248~1297、1078~1231、1026~1051、948~1001、692~942、580~685、および/もしくは538~568、またはその対応する残基を含む、請求項78~86のいずれか一項に記載の融合タンパク質。
  88. 前記Cas9ポリペプチドがニッカーゼであり、または前記Cas9ポリペプチドがヌクレアーゼ不活性である、請求項78~87のいずれか一項に記載の融合タンパク質。
  89. 前記Cas9ポリペプチドが改変されたSpCas9ポリペプチドであり、改変されたPAMに対する特異性または非G PAMに対する特異性を有する、請求項78~88のいずれか一項に記載の融合タンパク質。
  90. 前記改変されたSpCas9ポリペプチドが、アミノ酸置換D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、およびT1337R (SpCas9-MQKFRAER) を含み、前記改変されたPAM 5'-NGC-3'に対する特異性を有する、請求項89のいずれか一項に記載の融合タンパク質。
  91. 前記アデノシンデアミナーゼバリアントドメインがCas12ポリペプチド中に挿入されている、請求項55~75のいずれか一項に記載の方法。
  92. 前記Cas12ポリペプチドが、Cas12a、Cas12b、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、またはCas12iである、請求項91に記載の融合タンパク質。
  93. 前記Cas12ポリペプチドが、Bacillus hisashii Cas12b、Bacillus thermoamylovorans Cas12b、Bacillus sp. V3-13 Cas12b、またはAlicyclobacillus acidiphilus Cas12bに対して少なくとも約85%のアミノ酸配列同一性を有する、請求項91~92のいずれか一項に記載の融合タンパク質。
  94. 前記Cas12ポリペプチドが、Bacillus hisashii Cas12b、Bacillus thermoamylovorans Cas12b、Bacillus sp. V3-13 Cas12b、またはAlicyclobacillus acidiphilus Cas12bの断片を含むまたはから本質的になる、請求項91~93のいずれか一項に記載の融合タンパク質。
  95. 前記アデノシンデアミナーゼバリアントドメインが、アミノ酸位置:
    a) BhCas12bの153~154、255~256、306~307、980~981、1019~1020、534~535、604~605、もしくは344~345、もしくはCas12a、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、もしくはCas12iの対応するアミノ酸残基、
    b) BvCas12bの147および148、248および249、299および300、991および992、もしくは1031および1032、もしくはCas12a、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、もしくはCas12iの対応するアミノ酸残基、または
    c) AaCas12bの157および158、258および259、310および311、1008および1009、もしくは1044および1045、もしくはCas12a、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、もしくはCas12iの対応するアミノ酸残基
    の間に挿入されている、請求項91~94のいずれか一項に記載の融合タンパク質。
  96. 前記アデノシンデアミナーゼバリアントドメインが、表10Bにおいて特定される遺伝子座において挿入されている、請求項91~95のいずれか一項に記載の融合タンパク質。
  97. 前記Cas12ポリペプチドがCas12bである、請求項91~96のいずれか一項に記載の融合タンパク質。
  98. 前記Cas12ポリペプチドが、BhCas12bドメイン、BvCas12bドメイン、またはAACas12bドメインを含む、請求項91~97のいずれか一項に記載の融合タンパク質。
  99. 前記Cas12bポリペプチドが、RuvCドメインの触媒活性をサイレンシングする突然変異を含む、請求項97~98のいずれか一項に記載の融合タンパク質。
  100. 前記Cas12bポリペプチドが、D574A、D829Aおよび/またはD952A突然変異を含む、請求項99に記載の融合タンパク質。
  101. 前記アデノシンデアミナーゼバリアントドメインが、Staphylococcus aureus TadA、Bacillus subtilis TadA、Salmonella typhimurium TadA、Shewanella putrefaciens TadA、Haemophilus influenzae F3031 TadA、Caulobacter crescentus (C. crescentus) TadA、もしくはGeobacter sulfurreducens TadA、またはそのバリアントもしくは断片を含む、請求項1~100のいずれか一項に記載の融合タンパク質。
  102. 前記アデノシンデアミナーゼが、天然に存在しないアデノシンデアミナーゼである、請求項1~100のいずれか一項に記載の融合タンパク質。
  103. シチジンデアミナーゼをさらに含む、請求項1~102のいずれかに記載の融合タンパク質。
  104. 構造:
    NH2-[TadA*8]-[Cas9]-[シチジンデアミナーゼ]-COOH、または
    NH2-[シチジンデアミナーゼ]-[Cas9]-[TadA*8]-COOH
    を含み、ここで「]-[」の各記載は任意のリンカーである、融合タンパク質。
  105. 構造:
    NH2-[Cas9 (TadA*8)]-[シチジンデアミナーゼ]-COOH、
    NH2-[シチジンデアミナーゼ]-[Cas9 (TadA*8)]-COOH、
    NH2-[Cas9(シチジンデアミナーゼ)]-[TadA*8]-COOH、または
    NH2-[TadA*8]-[Cas9(シチジンデアミナーゼ)]-COOH
    を含み、ここで「]-[」の各記載は任意のリンカーである、融合タンパク質。
  106. 構造:
    NH2-[Cas12(アデノシンデアミナーゼ)]-[シチジンデアミナーゼ]-COOH、
    NH2-[シチジンデアミナーゼ]-[Cas12(アデノシンデアミナーゼ)]-COOH、
    NH2-[Cas12(シチジンデアミナーゼ)]-[アデノシンデアミナーゼ]-COOH、または
    NH2-[アデノシンデアミナーゼ]-[Cas12(シチジンデアミナーゼ)]-COOH
    を含み、ここで「]-[」の各記載は任意のリンカーである、融合タンパク質。
  107. 標的核酸塩基の脱アミノ化をもたらすための1つまたは複数のガイド核酸配列との複合体中にある、請求項1~106のいずれか一項に記載の融合タンパク質。
  108. 前記標的ポリヌクレオチドとさらに複合体化した、請求項107に記載の融合タンパク質。
  109. 請求項1~108のいずれか一項に記載の融合タンパク質をコードする、ポリヌクレオチド。
  110. 請求項109に記載のポリヌクレオチドを含む、発現ベクター。
  111. 哺乳動物発現ベクターである、請求項110に記載の発現ベクター。
  112. アデノ随伴ウイルス (AAV)、レトロウイルスベクター、アデノウイルスベクター、レンチウイルスベクター、センダイウイルスベクター、およびヘルペスウイルスベクターからなる群から選択されるウイルスベクターである、請求項111に記載の発現ベクター。
  113. プロモーターを含む、請求項111~112のいずれか一項に記載の発現ベクター。
  114. 請求項1~108のいずれか一項に記載の融合タンパク質、請求項109に記載のポリヌクレオチド、または請求項111~113のいずれか一項に記載のベクターを含む、細胞。
  115. 細菌細胞、植物細胞、昆虫細胞、ヒト細胞、または哺乳動物細胞である、請求項114に記載の細胞。
  116. 1つまたは複数のガイドポリヌクレオチドとの複合体中にある請求項1~108のいずれか一項に記載の融合ポリペプチドを含む、塩基エディター。
  117. 請求項1~108のいずれか一項に記載の融合タンパク質、請求項109に記載のポリヌクレオチド、請求項111~113のいずれか一項に記載のベクター、請求項114もしくは115に記載の細胞、または請求項116に記載の塩基エディター、および薬学的に許容される賦形剤を含む、医薬組成物。
  118. 請求項1~108のいずれか一項に記載の融合タンパク質、請求項109に記載のポリヌクレオチド、請求項111~113のいずれか一項に記載のベクター、または請求項116に記載の塩基エディターを含む、キット。
  119. 塩基編集方法であって、ポリヌクレオチド配列を、請求項1~108のいずれか一項に記載の融合タンパク質と接触させることを含み、前記融合タンパク質の前記アデノシンデアミナーゼバリアントドメインが前記ポリヌクレオチド中の核酸塩基を脱アミノ化し、それにより前記ポリヌクレオチド配列を編集する、方法。
  120. 前記標的ポリヌクレオチド配列を、前記標的核酸塩基の脱アミノ化をもたらすための1つまたは複数のガイドポリヌクレオチドと接触させることをさらに含む、請求項119に記載の方法。
  121. 標的ポリヌクレオチドを編集する方法であって、前記標的ポリヌクレオチドを請求項116に記載の塩基エディターと接触させて、前記標的ポリヌクレオチド中でA・TからG・Cへの改変をもたらすことを含む、方法。
  122. 前記接触させることが、細胞、真核細胞、哺乳動物細胞、またはヒト細胞中でなされる、請求項120または121に記載の方法。
  123. 前記細胞がin vivoである、請求項122に記載の方法。
  124. 前記細胞がex vivoである、請求項122に記載の方法。
  125. 対象において遺伝的欠陥を処置する方法であって、前記対象に請求項1~108のいずれか一項に記載の融合タンパク質を含むもしくはから本質的になる塩基エディター、または前記塩基エディターをコードするポリヌクレオチドおよび前記対象の標的ヌクレオチド配列中の標的核酸塩基を脱アミノ化するように前記塩基エディターに指示する1つまたは複数のガイドポリヌクレオチドを投与することを含み、それにより前記遺伝的欠陥を処置する、方法。
  126. 前記ガイドポリヌクレオチドが、
    a) GACCUAGGCGAGGCAGUAGG;
    b) CCAGUAUGGACACUGUCCAAA;
    c) CAGUAUGGACACUGUCCAAA; および
    d) AGUAUGGACACUGUCCAAAG
    からなる群から選択される核酸配列を含む、請求項116、120、121または125のいずれか一項に記載の方法。
  127. 前記gRNAが、核酸配列:
    GUUUUUGUACUCUCAAGAUUUAAGUAACUGUACAACGAAACUUACACAGUUACUUAAAUCUUGCAGAAGCUACAAAGAUAAGGCUUCAUGCCGAAAUCAACACCCUGUCAUUUUAUGGCAGGGUG
    を含む、請求項116、120、121、125または126のいずれか一項に記載の方法。
  128. 前記ガイドRNAが、CRISPR RNA (crRNA)およびトランス活性化crRNA (tracrRNA)を含む、請求項116、120、121または125~127のいずれか一項に記載の方法。
  129. 前記塩基エディター、または前記塩基エディターをコードする前記ポリヌクレオチド、および1つまたは複数のガイドポリヌクレオチドを前記対象の細胞に送達することを含む、請求項125~128のいずれか一項に記載の方法。
  130. 前記対象が哺乳動物またはヒトである、請求項125~129のいずれか一項に記載の方法。
  131. 前記標的核酸塩基の前記脱アミノ化が前記標的核酸塩基を野生型核酸塩基で置き換える、請求項125~130のいずれか一項に記載の方法。
  132. 前記標的核酸塩基の前記脱アミノ化が前記標的核酸塩基を非野生型核酸塩基で置き換え、前記標的核酸塩基の前記脱アミノ化が前記遺伝学的状態の症状を改善する、請求項125~130のいずれか一項に記載の方法。
  133. 前記標的ポリヌクレオチド配列が、前記標的核酸塩基以外の核酸塩基における前記遺伝学的状態に関連する突然変異を含む、請求項125~130のいずれか一項に記載の方法。
  134. ポリヌクレオチドプログラム可能なDNA結合ドメイン、ならびに
    MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSST
    のアミノ酸位置82および/もしくは166における改変、または
    MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSST
    のバリアントにおける位置82および/もしくは166に対応する改変を含むアデノシンデアミナーゼバリアントを含む少なくとも1つの塩基エディタードメインを含む、融合タンパク質。
JP2021546894A 2019-02-13 2020-02-13 アデノシンデアミナーゼ塩基エディターおよびそれを用いて標的配列中の核酸塩基を改変する方法 Pending JP2022520081A (ja)

Applications Claiming Priority (33)

Application Number Priority Date Filing Date Title
US201962805238P 2019-02-13 2019-02-13
US201962805277P 2019-02-13 2019-02-13
US201962805271P 2019-02-13 2019-02-13
US62/805,277 2019-02-13
US62/805,238 2019-02-13
US62/805,271 2019-02-13
US201962852228P 2019-05-23 2019-05-23
US201962852224P 2019-05-23 2019-05-23
US62/852,224 2019-05-23
US62/852,228 2019-05-23
US201962873138P 2019-07-11 2019-07-11
US201962873144P 2019-07-11 2019-07-11
US201962873140P 2019-07-11 2019-07-11
US62/873,138 2019-07-11
US62/873,144 2019-07-11
US62/873,140 2019-07-11
US201962876354P 2019-07-19 2019-07-19
US62/876,354 2019-07-19
US201962888867P 2019-08-19 2019-08-19
US62/888,867 2019-08-19
US201962912992P 2019-10-09 2019-10-09
US62/912,992 2019-10-09
US201962931747P 2019-11-06 2019-11-06
US201962931722P 2019-11-06 2019-11-06
US62/931,722 2019-11-06
US62/931,747 2019-11-06
US201962941569P 2019-11-27 2019-11-27
US201962941523P 2019-11-27 2019-11-27
US62/941,523 2019-11-27
US62/941,569 2019-11-27
US202062966526P 2020-01-27 2020-01-27
US62/966,526 2020-01-27
PCT/US2020/018192 WO2020168132A1 (en) 2019-02-13 2020-02-13 Adenosine deaminase base editors and methods of using same to modify a nucleobase in a target sequence

Publications (2)

Publication Number Publication Date
JP2022520081A true JP2022520081A (ja) 2022-03-28
JPWO2020168132A5 JPWO2020168132A5 (ja) 2023-02-17

Family

ID=72043868

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021546894A Pending JP2022520081A (ja) 2019-02-13 2020-02-13 アデノシンデアミナーゼ塩基エディターおよびそれを用いて標的配列中の核酸塩基を改変する方法

Country Status (8)

Country Link
US (2) US20220170027A1 (ja)
EP (1) EP3924479A4 (ja)
JP (1) JP2022520081A (ja)
KR (1) KR20210139265A (ja)
CN (1) CN114072496A (ja)
AU (1) AU2020221366A1 (ja)
CA (1) CA3129158A1 (ja)
WO (1) WO2020168132A1 (ja)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4257696A3 (en) 2018-03-14 2024-01-24 Arbor Biotechnologies, Inc. Novel crispr dna targeting enzymes and systems
US20220235347A1 (en) 2019-02-13 2022-07-28 Beam Therapeutics Inc. Compositions and methods for treating hemoglobinopathies
WO2022119295A1 (ko) * 2020-12-01 2022-06-09 한양대학교 산학협력단 티민-사이토신 서열 특이적 사이토신 교정 활성이 증진된 아데닌 염기교정 유전자가위 및 이의 용도
US20240002834A1 (en) * 2020-12-01 2024-01-04 Iucf-Hyu (Industry-University Cooperation Foundation Hanyang University) Adenine base editor lacking cytosine editing activity and use thereof
CN115704015A (zh) * 2021-08-12 2023-02-17 清华大学 基于腺嘌呤和胞嘧啶双碱基编辑器的靶向诱变系统
CN115772512A (zh) * 2021-09-07 2023-03-10 华东师范大学 腺嘌呤脱氨酶、包含其的腺嘌呤碱基编辑器及其应用
WO2023052366A1 (en) 2021-09-28 2023-04-06 INSERM (Institut National de la Santé et de la Recherche Médicale) Base editing approaches for the treatment of beta-hemoglobinopathies
CN114045277A (zh) * 2021-10-21 2022-02-15 复旦大学 碱基编辑器及其构建方法与应用
WO2023099591A1 (en) 2021-12-01 2023-06-08 INSERM (Institut National de la Santé et de la Recherche Médicale) Methods for increasing fetal hemoglobin content by editing the +55-kb region of the erythroid-specific bcl11a enhancer
WO2023121965A1 (en) 2021-12-20 2023-06-29 Beam Therapeutics Inc. Nanomaterial comprising diamines
WO2023121964A1 (en) 2021-12-20 2023-06-29 Beam Therapeutics Inc. Nanomaterials comprising disulfides
WO2023121970A1 (en) 2021-12-20 2023-06-29 Beam Therapeutics Inc. Ionizable amine and ester lipids and lipid nanoparticles
WO2023121971A1 (en) 2021-12-20 2023-06-29 Beam Therapeutics Inc. Nanomaterials comprising tetravalent lipid compounds
WO2023121975A1 (en) 2021-12-20 2023-06-29 Beam Therapeutics Inc. Ionizable amine lipids and lipid nanoparticles
WO2023144104A1 (en) 2022-01-25 2023-08-03 INSERM (Institut National de la Santé et de la Recherche Médicale) Base editing approaches for the treatment of βeta-thalassemia
CN117187220A (zh) * 2022-03-08 2023-12-08 中国科学院遗传与发育生物学研究所 腺嘌呤脱氨酶及其在碱基编辑中的用途
CN114634923B (zh) * 2022-04-07 2024-02-23 尧唐(上海)生物科技有限公司 腺苷脱氨酶、碱基编辑器融合蛋白、碱基编辑器系统及用途
WO2023212715A1 (en) 2022-04-28 2023-11-02 The Broad Institute, Inc. Aav vectors encoding base editors and uses thereof
WO2023217888A1 (en) 2022-05-10 2023-11-16 Institut National de la Santé et de la Recherche Médicale Base editing approaches for correcting the cd39 (cag>tag) mutation in patients suffering from βeta-thalassemia
CN114686456B (zh) * 2022-05-10 2023-02-17 中山大学 基于双分子脱氨酶互补的碱基编辑系统及其应用
WO2023217904A1 (en) 2022-05-10 2023-11-16 Institut National de la Santé et de la Recherche Médicale Syncitin-1 fusion proteins and uses thereof for cargo delivery into target cells
WO2023245141A2 (en) * 2022-06-15 2023-12-21 Beam Therapeutics Inc. Compositions and methods for reducing complement activation
WO2024006774A2 (en) * 2022-06-27 2024-01-04 Beam Therapeutics Inc. Compositions and methods for non-genotoxic cell conditioning
WO2024019936A1 (en) 2022-07-20 2024-01-25 Beam Therapeutics Inc. Nanomaterials comprising triols
WO2024018056A1 (en) 2022-07-22 2024-01-25 Institut National de la Santé et de la Recherche Médicale Base editing approaches for correcting the ivs2-1 (g>a) mutation in patients suffering from βeta-thalassemia
CN117568313B (zh) * 2024-01-15 2024-04-26 上海贝斯昂科生物科技有限公司 基因编辑组合物及其用途

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150165054A1 (en) * 2013-12-12 2015-06-18 President And Fellows Of Harvard College Methods for correcting caspase-9 point mutations
EP3350203A4 (en) * 2015-09-17 2019-06-26 The Regents of The University of California CAS9 VARIANTS POLYPEPTIDES COMPRISING INTERNAL INSERTIONS
AU2017306676B2 (en) * 2016-08-03 2024-02-22 President And Fellows Of Harvard College Adenosine nucleobase editors and uses thereof
EP3538561A4 (en) * 2016-11-11 2020-10-21 The Regents of The University of California RNA-GUIDED POLYPEPTIDE VARIANTS AND METHOD OF USING
EP3625342B1 (en) * 2017-05-18 2022-08-24 The Broad Institute, Inc. Systems, methods, and compositions for targeted nucleic acid editing
US10392616B2 (en) * 2017-06-30 2019-08-27 Arbor Biotechnologies, Inc. CRISPR RNA targeting enzymes and systems and uses thereof
US11946040B2 (en) 2019-02-04 2024-04-02 The General Hospital Corporation Adenine DNA base editor variants with reduced off-target RNA editing
US20220235347A1 (en) * 2019-02-13 2022-07-28 Beam Therapeutics Inc. Compositions and methods for treating hemoglobinopathies
EP3923994A4 (en) * 2019-02-13 2023-01-25 Beam Therapeutics, Inc. COMPOSITIONS AND METHODS FOR THE TREATMENT OF ALPHA-1 ANTITRYPSIN DEFICIENCY
CA3140093A1 (en) * 2019-05-21 2020-11-26 Beam Therapeutics Inc. Methods of editing a single nucleotide polymorphism using programmable base editor systems

Also Published As

Publication number Publication date
WO2020168132A1 (en) 2020-08-20
EP3924479A4 (en) 2023-01-25
AU2020221366A1 (en) 2021-08-26
EP3924479A1 (en) 2021-12-22
CN114072496A (zh) 2022-02-18
KR20210139265A (ko) 2021-11-22
US20220170027A1 (en) 2022-06-02
CA3129158A1 (en) 2020-08-20
WO2020168132A9 (en) 2020-10-08
US11155803B2 (en) 2021-10-26
US20210130805A1 (en) 2021-05-06

Similar Documents

Publication Publication Date Title
US11155803B2 (en) Adenosine deaminase base editors and methods of using same to modify a nucleobase in a target sequence
US20210380955A1 (en) Methods of editing single nucleotide polymorphism using programmable base editor systems
US20210371858A1 (en) Methods of suppressing pathogenic mutations using programmable base editor systems
US20210277379A1 (en) Multi-effector nucleobase editors and methods of using same to modify a nucleic acid target sequence
US20220136012A1 (en) Nucleobase editors having reduced off-target deamination and methods of using same to modify a nucleobase target sequence
US20230140953A1 (en) Methods of editing a disease-associated gene using adenosine deaminase base editors, including for the treatment of genetic disease
US20230017979A1 (en) Compositions and methods for non-toxic conditioning
US20220098593A1 (en) Splice acceptor site disruption of a disease-associated gene using adenosine deaminase base editors, including for the treatment of genetic disease
US20220313799A1 (en) Compositions and methods for editing a mutation to permit transcription or expression
US20230070861A1 (en) Compositions and methods for treating hepatitis b
JP2022519882A (ja) 糖原病1a型を治療するための組成物および方法
US20240132867A1 (en) Adenosine deaminase base editors and methods of using same to modify a nucleobase in a target sequence

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230209

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240220