JP2022532139A - B型肝炎を治療するための組成物及び方法 - Google Patents

B型肝炎を治療するための組成物及び方法 Download PDF

Info

Publication number
JP2022532139A
JP2022532139A JP2021566276A JP2021566276A JP2022532139A JP 2022532139 A JP2022532139 A JP 2022532139A JP 2021566276 A JP2021566276 A JP 2021566276A JP 2021566276 A JP2021566276 A JP 2021566276A JP 2022532139 A JP2022532139 A JP 2022532139A
Authority
JP
Japan
Prior art keywords
hbv
tada
protein
cas9
nucleic acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021566276A
Other languages
English (en)
Other versions
JPWO2020231863A5 (ja
Inventor
エレナ スメカロヴァ、
マイケル パッカー、
フランシーヌ グレゴワール、
ルイス バレラ、
ジュゼッペ チャラメラ、
Original Assignee
ビーム セラピューティクス インク.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ビーム セラピューティクス インク. filed Critical ビーム セラピューティクス インク.
Publication of JP2022532139A publication Critical patent/JP2022532139A/ja
Publication of JPWO2020231863A5 publication Critical patent/JPWO2020231863A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • A61K31/7088Compounds having three or more nucleosides or nucleotides
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/20Antivirals for DNA viruses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • C12N15/1131Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04004Adenosine deaminase (3.5.4.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04005Cytidine deaminase (3.5.4.5)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2730/00Reverse transcribing DNA viruses
    • C12N2730/00011Details
    • C12N2730/10011Hepadnaviridae
    • C12N2730/10111Orthohepadnavirus, e.g. hepatitis B virus
    • C12N2730/10121Viruses as such, e.g. new isolates, mutants or their genomic sequences

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Virology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Mycology (AREA)
  • Communicable Diseases (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Oncology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

本発明は、B型肝炎ウイルス(HBV)ゲノムに変異を導入するための組成物及び方法を特徴とする。【選択図】なし

Description

関連出願の相互参照
本国際PCT出願は、2019年5月10日に出願された米国仮出願第62/846,422号、及び2019年10月29日に出願された米国仮出願第62/927,585号の優先権及び利益を主張し、その各々の内容は、その全体が参照により本明細書に援用される。
B型肝炎は、B型肝炎ウイルス(HBV)によって引き起こされる深刻な肝臓感染症である。HBVは小さなDNAヘパドナウイルスであり、RNA中間体を介して複製し、宿主のゲノムに組み込まれることで感染細胞内で存続することができる。米国の85万人~220万人を含め、世界中でおよそ2億5700万人が、HBVに慢性的に感染している。慢性HBV感染症は、慢性肝炎、肝硬変、及び/または肝細胞癌として現れる。慢性HBV感染症の成人の20%~30%は、肝細胞癌または肝硬変を発症する。HBV感染症は、年間60万人~100万人の死亡の原因となっている。
HBV感染症に対する現在の治療アプローチには厳しい制限がある。ヌクレオチド逆転写酵素阻害剤であるテノホビルなどの抗ウイルス薬は、ウイルス複製を減少させることができるが、HBV感染患者を治癒することはない。これらの抗ウイルス療法は、患者に月額500ドル~1500ドルもの費用を負担させ得る。HBVによる肝障害の程度により、移植が必要になる場合がある。臓器移植に固有のリスクに加えて、費用負担は法外なものになり得る。したがって、HBV感染症を治療するための改善された方法が緊急に必要とされている。
以下に記載するように、本発明は、HBVゲノムに改変を導入することによってB型肝炎ウイルス(HBV)感染を治療するための組成物及び方法を特徴とする。特定の実施形態では、本発明は、HBVゲノムを改変して、未成熟終止コドンまたはHBVのコード配列またはHBVの共有結合閉環状DNA(cccDNA:covalently closed circular DNA)内の核酸塩基の脱アミノ化などの変化を導入するための塩基編集系(例えば、プログラム可能なDNA結合タンパク質、塩基エディター、及びgRNAを含む融合タンパク質)を提供する。
本明細書において、B型肝炎(HBV)ゲノムを編集するための方法及び組成物、ならびに関連する治療及びその使用を提供する。一態様では、本明細書において、B型肝炎ウイルス(HBV)ゲノムの核酸塩基の編集方法を提供し、方法は、HBVゲノムを、1つ以上のガイドRNA、ならびにポリヌクレオチドプログラム可能なDNA結合ドメイン及びアデノシンデアミナーゼまたはシチジンデアミナーゼドメインを含む塩基編集体と接触させることを含み、前記ガイドRNAは、前記塩基編集体を標的指向化してHBVゲノムの核酸塩基の改変をもたらす。いくつかの実施形態では、HBVゲノムの核酸塩基は、HBVタンパク質をコードするポリヌクレオチドである。いくつかの実施形態では、接触を、真核細胞、哺乳類細胞、またはヒト細胞において行う。いくつかの実施形態では、接触は、細胞内、in vivoまたはex vivoである。いくつかの実施形態では、シチジンデアミナーゼは、HBVゲノム内の標的CをUに変換する。いくつかの実施形態では、シチジンデアミナーゼは、HBVタンパク質をコードするポリヌクレオチド内の標的C・GをT・Aに変換する。いくつかの実施形態では、アデノシンデアミナーゼは、HBVタンパク質をコードするポリヌクレオチド内の標的A・TをG・Cに変換する。
上記の方法のいくつかの実施形態では、HBVタンパク質をコードするポリヌクレオチド中のHBVゲノム内の核酸塩基の改変は、未成熟終止コドンを生じさせる。いくつかの実施形態では、核酸塩基の改変は、HBV Xタンパク質において、R87*またはW120*終結を生じさせる。いくつかの実施形態では、核酸塩基の改変は、HBV Sタンパク質において、W35*またはW36*を生じさせる。いくつかの実施形態では、HBVポリヌクレオチドの改変は、ミスセンス変異である。いくつかの実施形態では、ミスセンス変異は、HBV pol遺伝子内にある。いくつかの実施形態では、ミスセンス変異は、HBV pol遺伝子によってコードされるHBVポリメラーゼタンパク質中のE24G、L25F、P26F、R27C、V48A、V48I、S382F、V378I、V378A、V379I、V379A、L377F、D380G、D380N、F381P、R376G、A422T、F423P、A432V、M433V、P434S、D540G、A688V、D689G、A717T、E718K、P713S、P713L、またはL719Pを生じさせる。いくつかの実施形態では、ミスセンス変異は、HBVコア遺伝子内にある。いくつかの実施形態では、ミスセンス変異は、HBVコア遺伝子によってコードされるHBVコアタンパク質において、T160A、T160A、P161F、S162L、C183R、または*184Qを生じさせる。いくつかの実施形態では、ミスセンス変異は、HBV X遺伝子内にある。いくつかの実施形態では、ミスセンス変異は、HBV X遺伝子によってコードされるHBV Xタンパク質において、H86R、W120R、E122K、E121K、またはL141Pを生じさせる。特定の実施形態では、ミスセンス変異は、HBV S遺伝子によってコードされるHBV Sタンパク質において、S38F、L39F、W35R、W36R、T37I、T37A、R78Q、S34L、F80P、またはD33Gを生じさせる。
上記の方法のいくつかの実施形態では、本明細書に提供するポリヌクレオチドプログラム可能なDNA結合ドメインは、Streptococcus pyogenes Cas9 (SpCas9)、Staphylococcus aureus Cas9 (SaCas9)、Streptococcus thermophilus 1 Cas9 (St1Cas9)、Steptococcus canis Cas9 (ScCas9)、またはそのバリアントから選択されるCas9である。いくつかの実施形態では、Cas9は、5’-NGG-3’、5’-NAG-3’、5’-NGA-3’、5’-NAA-3’、5’-NNAGGA-3’、または5’-NNACCA-3’から選択される核酸配列に対して、プロトスペーサー隣接モチーフ(PAM)特異性を有する。いくつかの実施形態では、ポリヌクレオチドプログラム可能なDNA結合ドメインは、改変されたプロトスペーサー隣接モチーフ(PAM)特異性を有する改変されたCas9を含む。いくつかの実施形態では、改変されたPAMは、5’-NNNRRT-3’、NGA-3’、5’-NGCG-3’、5’-NGN-3’、NGCN-3’、5’-NGTN-3’、または5’-NAA-3’から選択される。いくつかの実施形態では、ポリヌクレオチドプログラム可能なDNA結合ドメインは、ヌクレアーゼ不活性バリアントまたはニッカーゼバリアントである。いくつかの実施形態では、ヌクレアーゼ不活性バリアントまたはニッカーゼバリアントは、アミノ酸置換D10Aまたはそれに対応するアミノ酸置換を含むヌクレアーゼ不活性化Cas9 (dCas9)である。
上記の方法のいくつかの実施形態では、アデノシンデアミナーゼドメインは、デオキシリボ核酸(DNA)中のアデニンを脱アミノ化することができる。いくつかの実施形態では、アデノシンデアミナーゼは、TadAデアミナーゼである。いくつかの実施形態では、TadAデアミナーゼは、TadA*7.10、TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23、またはTadA*8.24である。いくつかの実施形態では、シチジンデアミナーゼドメインは、DNA中のシチジンを脱アミノ化することができる。いくつかの実施形態では、シチジンデアミナーゼは、APOBECまたはその誘導体である。いくつかの実施形態では、塩基編集体は、ウラシルグリコシラーゼ阻害因子(UGI:uracil glycosylase inhibitor)をさらに含む。いくつかの実施形態では、塩基編集体は、ウラシルグリコシラーゼ阻害因子(UGI)を含まない。
上記の方法のいくつかの実施形態では、HBVゲノム中の核酸塩基を編集するための1つ以上のガイドRNAは、CRISPR RNA (crRNA)及びトランスコードされた低分子RNA (tracrRNA)を含み、crRNAは、HBV核酸配列に相補的な核酸配列を含む。いくつかの実施形態では、塩基編集体は、HBV核酸配列に相補的な核酸配列を含む単一のガイドRNA (sgRNA)と複合体を形成している。いくつかの実施形態では、HBVタンパク質は、HBV S、ポリメラーゼ(pol)、コア、またはXタンパク質である。
いくつかの態様では、B型肝炎ウイルス(HBV)ゲノムの核酸塩基を編集するための上記の方法は、1つ以上の核酸塩基を編集することを含む。いくつかの実施形態では、方法は、2つ以上のHBV核酸配列を標的とする2つ以上のガイドRNAを含む。いくつかの実施形態では、ガイドRNAは、UCAAUCCCAACAAGGACACC;GGGAACAAGAUCUACAGCAU;AAGCCCAGGAUGAUGGGAUG;CUGCCAACUGGAUCCUGCGC;GACACAUCCAGCGAUAACCA;GCUGCCAACUGGAUCCUGCG;UAUGGAUGAUGUGGUAUUGG;CCAUGCCCCAAAGCCACCCA;AAGCCACCCAAGGCACAGCU;GAGAAGUCCACCACGAGUCU;CUUCUCUCAAUUUUCUAGGG;GACGACGAGGCAGGUCCCCU;CCCAACAAGGACACCUGGCC;UGCCAACUGGAUCCUGCGCG;AGGAGUUCCGCAGUAUGGAU;CCGCAGUAUGGAUCGGCAGA;CCUCUGCCGAUCCAUACUGC;CGCCCACCGAAUGUUGCCCA;GACUUCUCUCAAUUUUCUAG;GUUCCGCAGUAUGGAUCGGC;UACUAACAUUGAGGUUCCCG;UCCGCAGUAUGGAUCGGCAG;UCCUCUGCCGAUCCAUACUG;GUAGCUCCAAAUUCUUUAUA;またはAAUCCACACUCCGAAAGACAの1つ以上から選択される、5’から3’までの配列、またはその1、2、3、4、または5ヌクレオチドの5’トランケーション断片を含む。
別の態様では、対象におけるB型肝炎ウイルス(HBV)感染症の治療方法を提供し、方法は、それを必要とする対象に、融合タンパク質または前記融合タンパク質をコードするポリヌクレオチドを投与することを含み、融合タンパク質は、ポリヌクレオチドプログラム可能なDNA結合ドメイン及びアデノシンデアミナーゼまたはシチジンデアミナーゼドメインである塩基編集体ドメイン、ならびに塩基編集体ドメインを標的指向化して、HBVポリペプチドをコードする核酸配列のA・TからG・C、C・GからT・A、またはC・GからU・Aへの改変を生じさせる1つ以上のガイドポリヌクレオチドを含む。
別の態様では、対象におけるB型肝炎ウイルス(HBV)感染症の治療方法を提供し、方法は、それを必要とする対象に、ポリヌクレオチドプログラム可能なDNA結合ドメイン及びアデノシンデアミナーゼまたはシチジンデアミナーゼドメインである塩基編集体ドメインをコードする1つ以上のポリヌクレオチド、ならびに塩基編集体ドメインを標的指向化し、HBVポリペプチドをコードする核酸配列のA・TからG・C、C・GからT・A、またはC・GからU・Aへの改変を生じさせる1つ以上のガイドポリヌクレオチドを投与することを含む。
上記の治療方法のいくつかの実施形態では、対象は、哺乳類またはヒトである。いくつかの実施形態では、方法は、融合タンパク質、前記融合タンパク質をコードするポリヌクレオチド、またはポリヌクレオチドプログラム可能なDNA結合ドメイン及び塩基編集体ドメインをコードする1つ以上のポリヌクレオチド、ならびに前記1つ以上のガイドポリヌクレオチドを、対象の細胞に送達することを含む。いくつかの実施形態では、細胞は肝細胞である。いくつかの実施形態では、ポリヌクレオチドプログラム可能なDNA結合ドメインは、Streptococcus pyogenes Cas9 (SpCas9)、Staphylococcus aureus Cas9 (SaCas9)、Streptococcus thermophilus 1 Cas9 (St1Cas9)、Steptococcus canis Cas9 (ScCas9)、またはそのバリアントから選択されるCas9である。いくつかの実施形態では、Cas9は、5’-NGG-3’、5’-NAG-3’、5’-NGA-3’、5’-NAA-3’、5’-NNAGGA-3’、または5’-NNACCA-3’から選択される核酸配列に対して、プロトスペーサー隣接モチーフ(PAM)特異性を有する。いくつかの実施形態では、ポリヌクレオチドプログラム可能なDNA結合ドメインは、改変されたプロトスペーサー隣接モチーフ(PAM)特異性を有する改変されたCas9を含む。いくつかの実施形態では、改変されたPAMの核酸配列は、5’-NNNRRT-3’、NGA-3’、5’-NGCG-3’、5’-NGN-3’、NGCN-3’、5’-NGTN-3’、または5’-NAA-3’から選択される。いくつかの実施形態では、ポリヌクレオチドプログラム可能なDNA結合ドメインは、ヌクレアーゼ不活性バリアントまたはニッカーゼバリアントである。いくつかの実施形態では、ヌクレアーゼ不活性バリアントまたはニッカーゼバリアントは、アミノ酸置換D10Aまたはそれに対応するアミノ酸置換を含むヌクレアーゼ不活性化Cas9 (dCas9)である。いくつかの実施形態では、アデノシンデアミナーゼドメインは、デオキシリボ核酸(DNA)中のアデニンを脱アミノ化することができる。いくつかの実施形態では、アデノシンデアミナーゼは、TadAデアミナーゼである。いくつかの実施形態では、TadAデアミナーゼは、TadA*7.10、TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23、またはTadA*8.24である。いくつかの実施形態では、シチジンデアミナーゼドメインは、DNA中のシチジンを脱アミノ化することができる。いくつかの実施形態では、シチジンデアミナーゼは、APOBECまたはその誘導体である。いくつかの実施形態では、塩基編集体は、1つ以上のウラシルグリコシラーゼ阻害因子(UGI)をさらに含む。いくつかの実施形態では、塩基編集体は、ウラシルグリコシラーゼ阻害因子(UGI)を含まない。いくつかの実施形態では、1つ以上のガイドRNAは、CRISPR RNA (crRNA)及びトランスコードされた低分子RNA (tracrRNA)を含み、crRNAは、HBV核酸配列に相補的な核酸配列を含む。いくつかの実施形態では、塩基編集体は、HBV核酸配列に相補的な核酸配列を含む単一のガイドRNA (sgRNA)と複合体を形成している。いくつかの実施形態では、sgRNAは、HBV核酸配列に相補的な少なくとも10個の連続ヌクレオチドを含む核酸配列を含む。いくつかの実施形態では、sgRNAは、HBV核酸配列に相補的な15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、または40個の連続ヌクレオチドを含む核酸配列を含む。
いくつかの実施形態では、上記の方法は、1つ以上の核酸塩基を編集することを含む。いくつかの実施形態では、上記の方法は、2つ以上のHBV核酸配列を標的とする2つ以上のガイドRNAを含む。いくつかの実施形態では、上記の方法は、3、4、または5つのHBV核酸配列を標的とする2つ以上のガイドRNAを含む。上記の方法のいくつかの実施形態では、HBV核酸配列は、HBVポリメラーゼ、HBVコアタンパク質、HBV Sタンパク質、HBV Xタンパク質、またはそれらの組み合わせから選択される1つ以上のHBVタンパク質をコードする。上記の方法のいくつかの実施形態では、1つ以上のガイドRNAは、UCAAUCCCAACAAGGACACC;GGGAACAAGAUCUACAGCAU;AAGCCCAGGAUGAUGGGAUG;CUGCCAACUGGAUCCUGCGC;GACACAUCCAGCGAUAACCA;GCUGCCAACUGGAUCCUGCG;UAUGGAUGAUGUGGUAUUGG;CCAUGCCCCAAAGCCACCCA;AAGCCACCCAAGGCACAGCU;GAGAAGUCCACCACGAGUCU;CUUCUCUCAAUUUUCUAGGG;GACGACGAGGCAGGUCCCCU;CCCAACAAGGACACCUGGCC;UGCCAACUGGAUCCUGCGCG;AGGAGUUCCGCAGUAUGGAU;CCGCAGUAUGGAUCGGCAGA;CCUCUGCCGAUCCAUACUGC;CGCCCACCGAAUGUUGCCCA;GACUUCUCUCAAUUUUCUAG;GUUCCGCAGUAUGGAUCGGC;UACUAACAUUGAGGUUCCCG;UCCGCAGUAUGGAUCGGCAG;UCCUCUGCCGAUCCAUACUG;GUAGCUCCAAAUUCUUUAUA;またはAAUCCACACUCCGAAAGACAの1つ以上から選択される、5’から3’までの配列、またはその1、2、3、4、または5ヌクレオチドの5’トランケーション断片を含む。いくつかの実施形態では、HBVタンパク質をコードするポリヌクレオチドの改変は、未成熟終止コドンである。いくつかの実施形態では、核酸配列の改変は、核酸にコードされるHBV Xタンパク質において、R87*またはW120*を生じさせる。いくつかの実施形態では、核酸配列の改変は、核酸にコードされるHBV Sタンパク質において、W35*またはW36*を生じさせる。いくつかの実施形態では、HBVタンパク質をコードするポリヌクレオチドの改変は、ミスセンス変異である。いくつかの実施形態では、ミスセンス変異は、HBV pol遺伝子内にある。いくつかの実施形態では、HBV pol遺伝子内のミスセンス変異は、HBV pol遺伝子によってコードされるHBVポリメラーゼ中のE24G、L25F、P26F、R27C、V48A、V48I、S382F、V378I、V378A、V379I、V379A、L377F、D380G、D380N、F381P、R376G、A422T、F423P、A432V、M433V、P434S、D540G、A688V、D689G、A717T、E718K、P713S、P713L、またはL719Pを生じさせる。いくつかの実施形態では、ミスセンス変異は、HBVコア遺伝子内にある。いくつかの実施形態では、HBVコア遺伝子内のミスセンス変異は、HBVコア遺伝子によってコードされるHBVコアタンパク質において、T160A、T160A、P161F、S162L、C183R、または*184Qを生じさせる。いくつかの実施形態では、ミスセンス変異は、HBV X遺伝子内にある。いくつかの実施形態では、ミスセンス変異は、HBV X遺伝子によってコードされるHBV Xタンパク質において、H86R、W120R、E122K、E121K、またはL141Pを生じさせる。いくつかの実施形態では、ミスセンス変異は、HBV S遺伝子内にある。いくつかの実施形態では、ミスセンス変異は、HBV S遺伝子によってコードされるHBV Sタンパク質において、S38F、L39F、W35R、W36R、T37I、T37A、R78Q、S34L、F80P、またはD33Gを生じさせる。いくつかの実施形態では、塩基編集体は、BE4またはBE4のバリアントであり、APOBEC-1がAPOBEC-3Aの配列で置き換えられており、及び/またはCas9が、V1134、R1217、Q1334、及びR1336を含むCas9バリアント(SpCas9-VRQRと呼ばれる)で置き換えられている。
一態様では、組成物を、例えば、HBV感染症を治療するために提供する。一態様では、組成物を提供し、組成物は、ガイドRNAに結合した塩基編集体を含み、ガイドRNAは、HBV遺伝子に相補的な核酸配列を含む。一実施形態では、塩基編集体は、アデノシンデアミナーゼまたはシチジンデアミナーゼである。一実施形態では、アデノシンデアミナーゼは、デオキシリボ核酸(DNA)中のアデニンを脱アミノ化することができる。一実施形態では、アデノシンデアミナーゼは、TadAデアミナーゼである。一実施形態では、TadAデアミナーゼは、TadA*7.10、TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23、またはTadA*8.24である。一実施形態では、シチジンデアミナーゼドメインは、DNA中のシチジンを脱アミノ化することができる。一実施形態では、シチジンデアミナーゼは、APOBECまたはその誘導体である。一実施形態では、塩基編集体は、1つ以上のウラシルグリコシラーゼ阻害因子(UGI)をさらに含む。一実施形態では、塩基編集体は、ウラシルグリコシラーゼ阻害因子(UGI)を含まない。一実施形態では、塩基編集体は、(i)Cas9ニッカーゼを含むか;
(ii)ヌクレアーゼ不活性Cas9を含むか;
(iii)UGIドメインを含まないか;
(iv)APOBEC-1またはAPOBEC-3Aシチジンデアミナーゼを含むか;
(v)
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLKSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSGGSKRTADGSEFESPKKKRKVEに対して少なくとも80%、85%、90%、95%、96%、97%、98%、99%、または100%の同一性であるアミノ酸配列を含むか;または
(vi)
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLKSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSGGSKRTADGSEFESPKKKRKVEに対して少なくとも80%、85%、90%、95%、96%、97%、98%、99%、または100%の同一性であるアミノ酸配列を含む。
一実施形態では、組成物のガイドRNAは、HBVポリメラーゼ、HBVコアタンパク質、HBV Sタンパク質、またはHBV Xタンパク質をコードするHBV遺伝子に相補的な核酸配列を含む。一実施形態では、ガイドRNAは、HBV Xタンパク質をコードするHBV遺伝子に完全に相補的である15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30個の連続ヌクレオチドを含む。一実施形態では、ガイドRNAは、HBV Sタンパク質をコードするHBV遺伝子に完全に相補的である15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30個の連続ヌクレオチドを含む。一実施形態では、ガイドRNAは、HBVポリメラーゼをコードするHBV遺伝子に完全に相補的である15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30個の連続ヌクレオチドを含む。一実施形態では、ガイドRNAは、HBVコアタンパク質をコードするHBV遺伝子に完全に相補的である15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30個の連続ヌクレオチドを含む。一実施形態では、ガイドRNAは、5’から3’にかけて、UCAAUCCCAACAAGGACACC;GGGAACAAGAUCUACAGCAU;
AAGCCCAGGAUGAUGGGAUG;CUGCCAACUGGAUCCUGCGC;
GACACAUCCAGCGAUAACCA;GCUGCCAACUGGAUCCUGCG;
UAUGGAUGAUGUGGUAUUGG;CCAUGCCCCAAAGCCACCCA;
AAGCCACCCAAGGCACAGCU;GAGAAGUCCACCACGAGUCU;
CUUCUCUCAAUUUUCUAGGG;GACGACGAGGCAGGUCCCCU;
CCCAACAAGGACACCUGGCC;UGCCAACUGGAUCCUGCGCG;
AGGAGUUCCGCAGUAUGGAU;CCGCAGUAUGGAUCGGCAGA;
CCUCUGCCGAUCCAUACUGC;CGCCCACCGAAUGUUGCCCA;
GACUUCUCUCAAUUUUCUAG;GUUCCGCAGUAUGGAUCGGC;
UACUAACAUUGAGGUUCCCG;UCCGCAGUAUGGAUCGGCAG;
UCCUCUGCCGAUCCAUACUG;GUAGCUCCAAAUUCUUUAUA、及び
AAUCCACACUCCGAAAGACAからなる群から選択される核酸の5’末端からの1、2、3、4、または5個の核酸のトランケーションを含む。一実施形態では、ガイドRNAは、5’から3’にかけて、UCAAUCCCAACAAGGACACC;GGGAACAAGAUCUACAGCAU;
AAGCCCAGGAUGAUGGGAUG;CUGCCAACUGGAUCCUGCGC;
GACACAUCCAGCGAUAACCA;GCUGCCAACUGGAUCCUGCG;
UAUGGAUGAUGUGGUAUUGG;CCAUGCCCCAAAGCCACCCA;
AAGCCACCCAAGGCACAGCU;GAGAAGUCCACCACGAGUCU;
CUUCUCUCAAUUUUCUAGGG;GACGACGAGGCAGGUCCCCU;
CCCAACAAGGACACCUGGCC;UGCCAACUGGAUCCUGCGCG;
AGGAGUUCCGCAGUAUGGAU;CCGCAGUAUGGAUCGGCAGA;
CCUCUGCCGAUCCAUACUGC;CGCCCACCGAAUGUUGCCCA;
GACUUCUCUCAAUUUUCUAG;GUUCCGCAGUAUGGAUCGGC;
UACUAACAUUGAGGUUCCCG;UCCGCAGUAUGGAUCGGCAG;
UCCUCUGCCGAUCCAUACUG;GUAGCUCCAAAUUCUUUAUA、及び
AAUCCACACUCCGAAAGACAからなる群から選択される核酸を含む。一実施形態では、上記の組成物は脂質をさらに含む。一実施形態では、脂質はカチオン性脂質である。一実施形態では、組成物は、薬学的に許容される賦形剤をさらに含む。
別の態様では、医薬組成物を提供し、医薬組成物は、薬学的に許容される賦形剤中に、塩基編集体、または塩基編集体をコードする核酸、ならびにHBV遺伝子に相補的な核酸配列を含む1つ以上のガイドRNA (gRNA)を含む。一実施形態では、塩基編集体は、(i)Cas9ニッカーゼを含むか;
(ii)ヌクレアーゼ不活性Cas9を含むか;
(iii)UGIドメインを含まないか;
(iv)APOBEC-1またはAPOBEC-3Aシチジンデアミナーゼを含むか;
(v)
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLKSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSGGSKRTADGSEFESPKKKRKVEに対して少なくとも80%、85%、90%、95%、96%、97%、98%、99%、または100%の同一性であるアミノ酸配列を含むか;または
(vi)
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLKSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSGGSKRTADGSEFESPKKKRKVEに対して少なくとも80%、85%、90%、95%、96%、97%、98%、99%、または100%の同一性であるアミノ酸配列を含む。一実施形態では、塩基編集体は、Cas9、またはV1134、R1217、Q1334、及びR1336を含むCas9バリアント(SpCas9-VRQR)を含む。一実施形態では、gRNA及び塩基編集体を、一緒にまたは別々に製剤化する。一実施形態では、gRNAは、5’から3’にかけて、
UCAAUCCCAACAAGGACACC;GGGAACAAGAUCUACAGCAU
AAGCCCAGGAUGAUGGGAUG;CUGCCAACUGGAUCCUGCGC
GACACAUCCAGCGAUAACCA;GCUGCCAACUGGAUCCUGCG
UAUGGAUGAUGUGGUAUUGG;CCAUGCCCCAAAGCCACCCA
AAGCCACCCAAGGCACAGCU;GAGAAGUCCACCACGAGUCU
CUUCUCUCAAUUUUCUAGGG;GACGACGAGGCAGGUCCCCU
CCCAACAAGGACACCUGGCC;UGCCAACUGGAUCCUGCGCG
AGGAGUUCCGCAGUAUGGAU;CCGCAGUAUGGAUCGGCAGA
CCUCUGCCGAUCCAUACUGC;CGCCCACCGAAUGUUGCCCA
GACUUCUCUCAAUUUUCUAG;GUUCCGCAGUAUGGAUCGGC
UACUAACAUUGAGGUUCCCG;UCCGCAGUAUGGAUCGGCAG
UCCUCUGCCGAUCCAUACUG;GUAGCUCCAAAUUCUUUAUA;またはAAUCCACACUCCGAAAGACAの1つ以上から選択される核酸配列、またはその1、2、3、4、もしくは5ヌクレオチドの5’トランケーション断片を含む。一実施形態では、医薬組成物は、哺乳類細胞での発現に適したベクターをさらに含み、ベクターは、塩基編集体をコードするポリヌクレオチドを含む。一実施形態では、ベクターはウイルスベクターである。一実施形態では、ウイルスベクターは、レトロウイルスベクター、アデノウイルスベクター、レンチウイルスベクター、ヘルペスウイルスベクター、またはアデノ随伴ウイルスベクター(AAV)である。一実施形態では、医薬組成物は、哺乳類細胞での発現に適したリボ核粒子(ribonucleoparticle)をさらに含む。
別の態様では、HBV感染症の治療方法を提供し、方法は、それを必要とする対象に上記の組成物または医薬組成物を投与することを含む。
別の態様は、以下からなる群から選択される改変を含むHBVゲノムを提供する:
X遺伝子にR87STOPまたはW120STOPを導入する未成熟終止コドン。
S遺伝子にW35STOPまたはW36STOPを導入する未成熟終止コドン。
HBVポリメラーゼに、E24G、L25F、P26F、R27C、V48A、V48I、S382F、V378I、V378A、V379I、V379A、L377F、D380G、D380N、F381P、R376G、A422T、F423P、A432V、M433V、P434S、D540G、A688V、D689G、A717T、E718K、P713S、P713L、またはL719Pを導入するHBV pol遺伝子内のミスセンス変異;
HBVコアポリペプチドに、T160A、T160A、P161F、S162L、C183R、またはSTOP184Qを導入するHBVコア遺伝子内のミスセンス変異;
HBV Xポリペプチドに、H86R、W120R、E122K、E121K、またはL141Pを導入するX遺伝子内のミスセンス変異、及び
HBV Sポリペプチドに、S38F、L39F、W35R、W36R、T37I、T37A、R78Q、S34L、F80P、またはD33Gを導入するS遺伝子内のミスセンス変異。
一実施形態では、HBVゲノムは、上記の改変のうちの2つ以上を含む。
上記の方法、または上記のHBVゲノムの実施形態では、HBVは、遺伝子型Cまたは遺伝子型Dである。
別の態様では、対象におけるHBV感染症の治療における上記の態様及び実施形態のいずれかの組成物の使用を提供する。
別の態様では、対象におけるHBV感染症の治療における上記の態様及び実施形態のいずれかの医薬組成物の使用を提供する。
上記の使用の一実施形態では、対象は哺乳類である。上記の使用の実施形態では、対象はヒトである。
上記の方法または医薬組成物の一実施形態では、1つ以上のガイドRNAは、表26に列挙されている通りである。
別の態様では、HBV遺伝子に相補的な核酸配列を含むガイドRNA (gRNA)を提供する。一実施形態では、ガイドRNAは、HBVポリメラーゼ、HBVコアタンパク質、HBV Sタンパク質、またはHBV Xタンパク質をコードするHBV遺伝子に相補的な核酸配列を含む。一実施形態では、ガイドRNAは、HBV Xタンパク質をコードするHBV遺伝子に完全に相補的である15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30個の連続ヌクレオチドを含む。一実施形態では、ガイドRNAは、HBV Sタンパク質をコードするHBV遺伝子に完全に相補的である15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30個の連続ヌクレオチドを含む。一実施形態では、ガイドRNAは、HBVポリメラーゼをコードするHBV遺伝子に完全に相補的である15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30個の連続ヌクレオチドを含む。一実施形態では、ガイドRNAは、HBVコアタンパク質をコードするHBV遺伝子に完全に相補的である15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30個の連続ヌクレオチドを含む。一実施形態では、ガイドRNAは、5’から3’にかけて、UCAAUCCCAACAAGGACACC;GGGAACAAGAUCUACAGCAU;
AAGCCCAGGAUGAUGGGAUG;CUGCCAACUGGAUCCUGCGC;
GACACAUCCAGCGAUAACCA;GCUGCCAACUGGAUCCUGCG;
UAUGGAUGAUGUGGUAUUGG;CCAUGCCCCAAAGCCACCCA;
AAGCCACCCAAGGCACAGCU;GAGAAGUCCACCACGAGUCU;
CUUCUCUCAAUUUUCUAGGG;GACGACGAGGCAGGUCCCCU;
CCCAACAAGGACACCUGGCC;UGCCAACUGGAUCCUGCGCG;
AGGAGUUCCGCAGUAUGGAU;CCGCAGUAUGGAUCGGCAGA;
CCUCUGCCGAUCCAUACUGC;CGCCCACCGAAUGUUGCCCA;
GACUUCUCUCAAUUUUCUAG;GUUCCGCAGUAUGGAUCGGC;
UACUAACAUUGAGGUUCCCG;UCCGCAGUAUGGAUCGGCAG;
UCCUCUGCCGAUCCAUACUG;GUAGCUCCAAAUUCUUUAUA、及び
AAUCCACACUCCGAAAGACAからなる群から選択される核酸の5’末端からの1、2、3、4、または5個の核酸のトランケーションを含む。一実施形態では、ガイドRNAは、5’から3’にかけて、
UCAAUCCCAACAAGGACACC;GGGAACAAGAUCUACAGCAU;
AAGCCCAGGAUGAUGGGAUG;CUGCCAACUGGAUCCUGCGC;
GACACAUCCAGCGAUAACCA;GCUGCCAACUGGAUCCUGCG;
UAUGGAUGAUGUGGUAUUGG;CCAUGCCCCAAAGCCACCCA;
AAGCCACCCAAGGCACAGCU;GAGAAGUCCACCACGAGUCU;
CUUCUCUCAAUUUUCUAGGG;GACGACGAGGCAGGUCCCCU;
CCCAACAAGGACACCUGGCC;UGCCAACUGGAUCCUGCGCG;
AGGAGUUCCGCAGUAUGGAU;CCGCAGUAUGGAUCGGCAGA;
CCUCUGCCGAUCCAUACUGC;CGCCCACCGAAUGUUGCCCA;
GACUUCUCUCAAUUUUCUAG;GUUCCGCAGUAUGGAUCGGC;
UACUAACAUUGAGGUUCCCG;UCCGCAGUAUGGAUCGGCAG;
UCCUCUGCCGAUCCAUACUG;GUAGCUCCAAAUUCUUUAUA、及び
AAUCCACACUCCGAAAGACAからなる群から選択される核酸を含む。
別の態様では、医薬組成物を提供し、医薬組成物は、(i)塩基編集体をコードする核酸;ならびに(ii)上記の態様及び実施形態のいずれかのガイドRNAを含む。一実施形態では、医薬組成物は、脂質をさらに含む。医薬組成物の一実施形態では、塩基編集体をコードする核酸はmRNAである。
本発明によって定義される組成物及び物品を、以下に示す実施例に関連して単離したか、さもなければ製造した。本発明の他の特徴及び利点は、発明を実施するための形態から、及び特許請求の範囲から明らかになるであろう。
定義
以下の定義は、当技術分野の定義を補足するものであり、本出願を対象としており、任意の関連するかまたは関連しない場合に、例えば、一般に所有されている特許または出願に帰属するものではない。本明細書に記載の方法及び材料と同様または均等な方法及び材料を、本開示の実施または試験において使用することができるものの、好ましい材料及び方法を本明細書に記載する。したがって、本明細書中で使用する用語は、特定の実施形態を説明することのみを目的とし、限定することを意図していない。
別途定義されない限り、本明細書中で使用するすべての技術用語及び科学用語は、本発明が属する技術分野の当業者によって一般に理解されている意味を有する。以下の参考文献は、本発明において使用する多くの用語の一般的な定義を含む技術の1つを提供する:Singleton et al., Dictionary of Microbiology and Molecular Biology (2nd ed.1994);The Cambridge Dictionary of Science and Technology (Walker ed., 1988);The Glossary of Genetics,5th Ed., R. Rieger et al. (eds.),Springer Verlag (1991)、及びHale & Marham, The Harper Collins Dictionary of Biology (1991)。本明細書中で使用する場合、以下の用語は、特に明記しない限り、以下でそれらに帰する意味を有する。
本出願において、単数形の使用は、別途明確に記述されない限り、複数形を含む。本明細書中で使用する場合、単数形「a」、「an」、及び「the」は、文脈上、別途明確に指示されない限り、複数形の指示対象を含むことに留意しなければならない。本出願において、「または」の使用は、別途記載のない限り、「及び/または」を意味する。さらに、用語「含むこと(including)」、ならびに「含む(include)」、「含む(includes)」、及び「含まれる(included)」などの他の形態の使用は、限定的でない。
本明細書及び特許請求の範囲(複数可)において使用する場合、単語「含む(comprising)」(及び「含む(comprise)」及び「含む(comprises)」などの任意の形式の含むcomprising))、「有する(having)」(及び「有する(have)」及び「有する(has)」などの任意の形式の有する(having))、「含む(including)」(及び「含む(includes)」及び「含む(include)」などの任意の形式の含む(including))または「含む(containing)」(及び「含む(contains)」及び「含む(contain)」などの任意の形式の含む(containing))は、包括的または非制限的であり、引用していない追加の要素または方法ステップを除外しない。本明細書中で言及する任意の実施形態は、本開示の任意の方法または組成物に関して実施することができ、逆もまた同様であることが企図される。さらに、本開示の組成物を使用して、本開示の方法を達成することができる。
用語「約」または「およそ」とは、当業者が測定する特定の値についての許容可能な誤差範囲内であることを意味し、値の測定方法または決定方法、すなわち、測定系の限界に部分的に依存する。例えば、「約」は、当技術分野における慣例に従い、1以内のまたは1を上回る標準偏差を意味し得る。あるいは、「約」は、所与の値の最大20%、最大10%、最大5%、または最大1%の範囲を意味し得る。あるいは、特に生物学的システムまたはプロセスに関して、この用語は、例えば、値の5倍以内、2倍以内の規模を意味し得る。別途記載のない限り、本出願及び特許請求の範囲に特定の値が記載される場合、用語「約」は、特定の値について許容可能な誤差範囲内にあることを意味するものとみなされるべきである。
本明細書中での言及「いくつかの実施形態」、「実施形態」、「一実施形態」または「他の実施形態」は、実施形態に関連して記載される特定の特性、構造、または特徴が、少なくともいくつかの実施形態には含まれるが、本開示のすべての実施形態に含まれる必要はないことを意味する。
「アデノシンデアミナーゼ」とは、アデニンまたはアデノシンの加水分解性脱アミノ化を触媒することができるポリペプチドまたはその断片を意味する。いくつかの実施形態では、デアミナーゼまたはデアミナーゼドメインは、アデノシンからイノシンへの、またはデオキシアデノシンからデオキシイノシンへの加水分解的脱アミノ化を触媒するアデノシンデアミナーゼである。いくつかの実施形態では、アデノシンデアミナーゼは、デオキシリボ核酸(DNA)中のアデニンまたはアデノシンの加水分解的な脱アミノ化を触媒する。本明細書中で提供するアデノシンデアミナーゼ(例えば、改変されたアデノシンデアミナーゼ、進化されたアデノシンデアミナーゼ)は、細菌などの任意の生物に由来し得る。
いくつかの実施形態では、デアミナーゼまたはデアミナーゼドメインは、ヒト、チンパンジー、ゴリラ、サル、ウシ、イヌ、ラット、またはマウスなどの生物に由来する天然デアミナーゼのバリアントである。いくつかの実施形態では、デアミナーゼまたはデアミナーゼドメインは、自然界には存在しない。例えば、いくつかの実施形態では、デアミナーゼまたはデアミナーゼドメインは、天然デアミナーゼと、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性である。いくつかの実施形態では、アデノシンデアミナーゼは、E. coli、S. aureus、S. typhi、S. putrefaciens、H. influenzae、またはC. crescentusなどの細菌に由来する。いくつかの実施形態では、アデノシンデアミナーゼは、TadAデアミナーゼである。いくつかの実施形態では、TadAデアミナーゼは、E. coli TadA (ecTadA)デアミナーゼまたはその断片である。
例えば、デアミナーゼドメインは、国際PCT出願第PCT/2017/045381号(WO2018/027078)及び第PCT/US2016/058344号(WO2017/070632)に記載されており、これらのそれぞれは、その全体が参照により本明細書に援用される。また、Komor, A.C., et al., ”Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533,420-424 (2016);Gaudelli, N. M., et al., ”Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551,464-471 (2017);Komor, A. C., et al., ”Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao 4774 (2017))、及びRees, H. A., et al., ”Base editing: precision chemistry on the genome and transcriptome of living cells.” Nat Rev Genet.2018 Dec;19 (12):770-788. doi:10.1038/s41576-018-0059-1も参照されたい(その全内容は参照により本明細書に援用される)。
野生型TadA (wt)アデノシンデアミナーゼは、以下の配列(TadA参照配列とも呼ばれる)を有する:
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKKAQSSTD。
いくつかの実施形態では、アデノシンデアミナーゼは、以下の配列の改変を含む:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
(TadA*7.10とも呼ばれる)。
いくつかの実施形態では、TadA*7.10は、少なくとも1つの改変を含む。いくつかの実施形態では、TadA*7.10は、アミノ酸82及び/または166に改変を含む。特定の実施形態では、上記の参照配列のバリアントは、以下の改変のうちの1つ以上を含む:Y147T、Y147R、Q154S、Y123H、V82S、T166R、及び/またはQ154R。改変Y123Hとは、TadA*7.10の改変H123Yが、Y123H TadA (wt)に戻されたことを指す。他の実施形態では、TadA*7.10配列のバリアントは:Y147T+Q154R;Y147T+Q154S;Y147R+Q154S;V82S+Q154S;V82S+Y147R;V82S+Q154R;V82S+Y123H;I76Y+V82S;V82S+Y123H+Y147T;V82S+Y123H+Y147R;V82S+Y123H+Q154R;Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y123H+Y147R+Q154R+I76Y;V82S+Y123H+Y147R+Q154R、及びI76Y+V82S+Y123H+Y147R+Q154Rの群から選択される改変の組み合わせを含む。
他の実施形態では、本発明は、TadA*7.10、TadA参照配列、または別のTadAにおける対応する変異と比較して、残基149、150、151、152、153、154、155、156、または157で始まるC末端の欠失を含む、欠失、例えば、TadA*8を含むアデノシンデアミナーゼバリアントを提供する。他の実施形態では、アデノシンデアミナーゼバリアントは、TadA*7.10、TadA参照配列、または別のTadAの対応する変異と比較して、以下の改変:Y147T、Y147R、Q154S、Y123H、V82S、T166R、及び/またはQ154Rのうちの1つ以上を含むTadA (例えば、TadA*8)単量体である。他の実施形態では、アデノシンデアミナーゼバリアントは、TadA*7.10、TadA参照配列、または別のTadAの対応する変異と比較して、以下の改変:Y147T+Q154R;Y147T+Q154S;Y147R+Q154S;V82S+Q154S;V82S+Y147R;V82S+Q154R;V82S+Y123H;I76Y+V82S;V82S+Y123H+Y147T;V82S+Y123H+Y147R;V82S+Y123H+Q154R;Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y123H+Y147R+Q154R+I76Y;V82S+Y123H+Y147R+Q154R、及びI76Y+V82S+Y123H+Y147R+Q154Rを含むTadA (例えば、TadA*8)単量体である。
さらに他の実施形態では、アデノシンデアミナーゼバリアントは、TadA*7.10、TadA参照配列、または別のTadAの対応する変異と比較して、それぞれが、以下の改変:Y147T、Y147R、Q154S、Y123H、V82S、T166R、及び/またはQ154Rのうちの1つ以上を有する2つのアデノシンデアミナーゼドメインを含むホモ二量体である。他の実施形態では、アデノシンデアミナーゼバリアントは、TadA*7.10、TadA参照配列、または別のTadAの対応する変異と比較して、それぞれが:Y147T+Q154R;Y147T+Q154S;Y147R+Q154S;V82S+Q154S;V82S+Y147R;V82S+Q154R;V82S+Y123H;I76Y+V82S;V82S+Y123H+Y147T;V82S+Y123H+Y147R;V82S+Y123H+Q154R;Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y123H+Y147R+Q154R+I76Y;V82S+Y123H+Y147R+Q154R、及びI76Y+V82S+Y123H+Y147R+Q154Rの群から選択される改変の組み合わせを有する2つのアデノシンデアミナーゼドメイン(例えば、TadA*8)を含むホモ二量体である。他の実施形態では、アデノシンデアミナーゼバリアントは、野生型TadAアデノシンデアミナーゼドメイン、及びTadA*7.10、TadA参照配列、または別のTadAの対応する変異と比較して、以下の改変、すなわち、Y147T、Y147R、Q154S、Y123H、V82S、T166R、及び/またはQ154Rのうちの1つ以上を含むアデノシンデアミナーゼバリアントドメイン(例えば、TadA*8)を含むヘテロ二量体である。他の実施形態では、アデノシンデアミナーゼバリアントは、野生型TadAアデノシンデアミナーゼドメイン、及びTadA*7.10、TadA参照配列、または別のTadAの対応する変異と比較して:Y147T+Q154R;Y147T+Q154S;Y147R+Q154S;V82S+Q154S;V82S+Y147R;V82S+Q154R;V82S+Y123H;I76Y+V82S;V82S+Y123H+Y147T;V82S+Y123H+Y147R;V82S+Y123H+Q154R;Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y123H+Y147R+Q154R+I76Y;V82S+Y123H+Y147R+Q154R、及びI76Y+V82S+Y123H+Y147R+Q154Rの群から選択される改変の組み合わせを含むアデノシンデアミナーゼバリアントドメイン(例えば、TadA*8)を含むヘテロ二量体である。
他の実施形態では、アデノシンデアミナーゼバリアントは、TadA*7.10ドメイン、及びTadA*7.10、TadA参照配列、または別のTadAの対応する変異と比較して、以下の改変、すなわち、Y147T、Y147R、Q154S、Y123H、V82S、T166R、及び/またはQ154Rのうちの1つ以上を含むアデノシンデアミナーゼバリアントドメイン(例えば、TadA*8)を含むヘテロ二量体である。他の実施形態では、アデノシンデアミナーゼバリアントは、TadA*7.10ドメイン、及びTadA*7.10、TadA参照配列、または別のTadAの対応する変異と比較して、以下の改変の組み合わせ:Y147T+Q154R;Y147T+Q154S;Y147R+Q154S;V82S+Q154S;V82S+Y147R;V82S+Q154R;V82S+Y123H;I76Y+V82S;V82S+Y123H+Y147T;V82S+Y123H+Y147R;V82S+Y123H+Q154R;Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y123H+Y147R+Q154R+I76Y;V82S+Y123H+Y147R+Q154R;またはI76Y+V82S+Y123H+Y147R+Q154Rを含むアデノシンデアミナーゼバリアントドメイン(例えば、TadA*8)を含むヘテロ二量体である。一実施形態では、アデノシンデアミナーゼは、アデノシンデアミナーゼ活性を有する以下の配列またはその断片を含むか、または本質的にそれらからなるTadA*8である:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD。
いくつかの実施形態では、TadA*8は、短縮されている。いくつかの実施形態では、短縮型TadA*8は、全長TadA*8に対して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のN末端アミノ酸残基を欠失している。いくつかの実施形態では、短縮型TadA*8は、全長TadA*8に対して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のC末端アミノ酸残基を欠失している。いくつかの実施形態では、アデノシンデアミナーゼバリアントは、全長TadA*8である。特定の実施形態では、アデノシンデアミナーゼヘテロ二量体は、TadA*8ドメイン、及び以下のうちの1つから選択されるアデノシンデアミナーゼドメインを含む:
Staphylococcus aureus (S. aureus)TadA:
MGSHMTNDIYFMTLAIEEAKKAAQLGEVPIGAIITKDDEVIARAHNLRETLQQPTAH AEHIAIERAAKVLGSWRLEGCTLYVTLEPCVMCAGTIVMSRIPRVVYGADDPKGGCSGS LMNLLQQSNFNHRAIVDKGVLKEACSTLLTTFFKNLRANKKSTN
Bacillus subtilis (B. subtilis)TadA:
MTQDELYMKEAIKEAKKAEEKGEVPIGAVLVINGEIIARAHNLRETEQRSIAHAEML VIDEACKALGTWRLEGATLYVTLEPCPMCAGAVVLSRVEKVVFGAFDPKGGCSGTLMN LLQEERFNHQAEVVSGVLEEECGGMLSAFFRELRKKKKAARKNLSE
Salmonella typhimurium (S. typhimurium)TadA:
MPPAFITGVTSLSDVELDHEYWMRHALTLAKRAWDEREVPVGAVLVHNHRVIGEG WNRPIGRHDPTAHAEIMALRQGGLVLQNYRLLDTTLYVTLEPCVMCAGAMVHSRIG RVVFGARDAKTGAAGSLIDVLHHPGMNHRVEIIEGVLRDECATLLSDFFRMRRQEIK ALKKADRAEGAGPAV
Shewanella putrefaciens (S. putrefaciens)TadA:
MDEYWMQVAMQMAEKAEAAGEVPVGAVLVKDGQQIATGYNLSISQHDPTAHAEI LCLRSAGKKLENYRLLDATLYITLEPCAMCAGAMVHSRIARVVYGARDEKTGAAGT VVNLLQHPAFNHQVEVTSGVLAEACSAQLSRFFKRRRDEKKALKLAQRAQQGIE
Haemophilus influenzae F3031 (H. influenzae)TadA:
MDAAKVRSEFDEKMMRYALELADKAEALGEIPVGAVLVDDARNIIGEGWNLSIVQSDPTΑΗ AEIIALRNGAKNIQNYRLLNSTLYVTLEPCTMCAGAILHSRIKRLVFGASDYK TGAIGSRFHFFDDYKMNHTLEITSGVLAEECSQKLSTFFQKRREEKKIEKALLKSLSDK
Caulobacter crescentus (C. crescentus)TadA:
MRTDESEDQDHRMMRLALDAARAAAEAGETPVGAVILDPSTGEVIATAGNGPIAAH DPTAHAEIAAMRAAAAKLGNYRLTDLTLVVTLEPCAMCAGAISHARIGRVVFGADD PKGGAVVHGPKFFAQPTCHWRPEVTGGVLADESADLLRGFFRARRKAKI
Geobacter sulfurreducens (G. sulfurreducens)TadA:
MSSLKKTPIRDDAYWMGKAIREAAKAAARDEVPIGAVIVRDGAVIGRGHNLREGSN DPSAHAEMIAIRQAARRSANWRLTGATLYVTLEPCLMCMGAIILARLERVVFGCYDP KGGAAGSLYDLSADPRLNHQVRLSPGVCQEECGTMLSDFFRDLRRRKKAKATPALF IDERKVPPEP
TadA*7.10
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD。
「アデノシンデアミナーゼ塩基編集体8 (ABE8)ポリペプチド」または「ABE8」とは、本明細書中で定義されるように、塩基編集体を意味し、以下の参照配列のアミノ酸位置82及び/または166に改変を含むアデノシンデアミナーゼバリアントを含む:MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD。
いくつかの実施形態では、ABE8は、参照配列に対して、本明細書に記載するように、さらなる改変を含む。
「アデノシンデアミナーゼ塩基編集体8 (ABE8)ポリヌクレオチド」とは、ABE8をコードするポリヌクレオチドを意味する。
「投与する」とは、本明細書に記載の1つ以上の組成物を患者または対象に提供することとして、本明細書中では言及される。例として、限定されないが、組成物の投与、例えば注射を、静脈内(i.v.)注射、皮下(s.c.)注射、皮内(i.d.)注射、腹腔内(i.p.)注射、または筋肉内(i.m.)注射によって実施することができる。1つ以上のそのような経路を使用することができる。非経口投与は、例えば、ボーラス注射または経時的な漸進的灌流によって行うことができる。あるいは、または同時に、投与は経口経路によって行うことができる。
「薬剤」とは、任意の小分子化学化合物、抗体、核酸分子、もしくはポリペプチド、またはその断片を意味する。
「改変」とは、当技術分野で公知の標準的な方法、例えば、本明細書に記載の方法によって検出する、遺伝子またはポリペプチドの発現レベルまたは活性の変化(増加または減少)を意味する。本明細書中で使用する場合、改変には、発現レベルの10%の変化、発現レベルの25%の変化、40%の変化、及び50%以上の変化が含まれる。
「寛解する」とは、例えば、疾患の発症または進行を、低下、抑制、減弱化、減少、抑止、及び/または安定化することを意味する。
「類似体」とは、同一ではないが類似した機能的または構造的特徴を有する分子を意味する。例えば、ポリペプチド類似体は、対応する天然ポリペプチドの生物活性を保持する一方で、類似体の機能を天然ポリペプチドに対して高める特定の生化学的修飾を有する。そのような生化学的修飾は、類似体のプロテアーゼ耐性、膜透過性、または半減期を、例えば、リガンド結合を変化させることなく増加させ得る。類似体は、非天然アミノ酸を含んでいてもよい。
「塩基編集体(BE)」または「核酸塩基編集体(NBE)」とは、ポリヌクレオチドに結合し、核酸塩基改変活性を有する薬剤を意味する。様々な実施形態において、塩基編集体は、核酸塩基改変ポリペプチド(例えば、デアミナーゼ)及びガイドポリヌクレオチド(例えば、ガイドRNA)と組み合わせたポリヌクレオチドプログラム可能なヌクレオチド結合ドメインを含む。様々な実施形態において、薬剤は、塩基編集活性を有するタンパク質ドメイン、すなわち、核酸分子(例えば、DNA)内の塩基(例えば、A、T、C、G、またはU)を改変することができるドメインを含む生体分子複合体である。いくつかの実施形態では、ポリヌクレオチドプログラム可能なDNA結合ドメインを、デアミナーゼドメインに融合または連結する。一実施形態では、薬剤は、塩基編集活性を有する1つ以上のドメインを含む融合タンパク質である。別の実施形態では、塩基編集活性を有するタンパク質ドメインを、ガイドRNAに連結する(例えば、ガイドRNA上のRNA結合モチーフ及びデアミナーゼに融合させたRNA結合ドメインを介して)。いくつかの実施形態では、塩基編集活性を有するドメインは、核酸分子内の塩基を脱アミノ化することができる。いくつかの実施形態では、塩基編集体は、DNA分子内の1つ以上の塩基を脱アミノ化することができる。いくつかの実施形態では、塩基編集体は、DNA内のシトシン(C)またはアデノシン(A)を脱アミノ化することができる。いくつかの実施形態では、塩基編集体は、DNA内のシトシン(C)及びアデノシン(A)を脱アミノ化することができる。いくつかの実施形態では、塩基編集体は、シチジン塩基編集体(CBE)である。いくつかの実施形態では、塩基編集体は、アデノシン塩基編集体(ABE)である。いくつかの実施形態では、塩基編集体は、アデノシン塩基編集体(ABE)及びシチジン塩基編集体(CBE)である。いくつかの実施形態では、塩基編集体は、アデノシンデアミナーゼに融合させたヌクレアーゼ不活性Cas9 (dCas9)である。いくつかの実施形態では、Cas9は、円順列変異体(circular permutant)Cas9 (例えば、spCas9またはsaCas9)である。円順列変異体Cas9は、当技術分野で公知であり、例えば、Oakes et al., Cell 176,254-267,2019に記載されている。いくつかの実施形態では、塩基編集体を、塩基除去修復の阻害因子、例えば、UGIドメイン、またはdISNドメインに融合させる。いくつかの実施形態では、融合タンパク質は、デアミナーゼに融合させたCas9ニッカーゼ、及びUGIまたはdISNドメインなどの塩基除去修復の阻害因子を含む。他の実施形態では、塩基編集体は、塩基脱落の塩基編集体である。
いくつかの実施形態では、アデノシンデアミナーゼを、TadAから進化させる。いくつかの実施形態では、ポリヌクレオチドプログラム可能なDNA結合ドメインは、CRISPR関連(例えば、CasまたはCpf1)酵素である。いくつかの実施形態では、塩基編集体は、デアミナーゼドメインに融合させた触媒的に不活性のCas9 (dCas9)である。いくつかの実施形態では、塩基編集体は、デアミナーゼドメインに融合させたCas9ニッカーゼ(nCas9)である。いくつかの実施形態では、塩基編集体を、塩基除去修復(BER)の阻害因子に融合させる。いくつかの実施形態では、塩基除去修復の阻害因子は、ウラシルDNAグリコシラーゼ阻害因子(UGI)である。いくつかの実施形態では、塩基除去修復の阻害因子は、イノシン塩基除去修復阻害因子である。塩基編集体の詳細は、国際PCT出願第PCT/2017/045381号(WO2018/027078)及び第PCT/US2016/058344号(WO2017/070632)に記載されており、これらのそれぞれは、その全体が参照により本明細書に援用される。また、Komor, A. C., et al., ”Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533,420-424 (2016);Gaudelli, N. M., et al., ”Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551,464-471 (2017);Komor, A. C., et al., ”Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao 4774 (2017)、及びRees, H. A., et al., ”Base editing: precision chemistry on the genome and transcriptome of living cells.” Nat Rev Genet.2018 Dec;19 (12):770-788.doi:10.1038/s41576-018-0059-1も参照されたい(その全内容は参照により本明細書に援用される)。
いくつかの実施形態では、塩基編集体は、アデノシンデアミナーゼバリアント(例えば、TadA*8)を、円順列変異体Cas9 (例えば、spCAS9)及び二連の(bipartite)核局在化配列を含む骨格にクローニングすることによって生成される(例えば、ABE8)。円順列変異体Cas9は、当技術分野で公知であり、例えば、Oakes et al., Cell 176,254-267,2019に記載されている。例示的な円順列変異体の配列を以下に記載し、太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線が引かれた配列は二連の核局在化配列を示す。
CP5 (MSP「NGC=変異を有するPamバリアント、通常のCas9はNGGを好む」PID=タンパク質相互作用ドメイン及び「D10A」ニッカーゼを有する):
Figure 2022532139000001
いくつかの実施形態では、ABE8は、以下の表8の塩基編集体から選択される。いくつかの実施形態では、ABE8は、TadAから進化されたアデノシンデアミナーゼバリアントを含む。いくつかの実施形態では、ABE8のアデノシンデアミナーゼバリアントは、以下の表8に記載するようなTadA*8バリアントである。いくつかの実施形態では、アデノシンデアミナーゼバリアントは、Y147T、Y147R、Q154S、Y123H、V82S、T166R、及び/またはQ154Rからなる群から選択される1つ以上の改変を含むTadA*7.10バリアント(例えば、TadA*8)である。様々な実施形態において、ABE8は、Y147T+Q154R;Y147T+Q154S;Y147R+Q154S;V82S+Q154S;V82S+Y147R;V82S+Q154R;V82S+Y123H;I76Y+V82S;V82S+Y123H+Y147T;V82S+Y123H+Y147R;V82S+Y123H+Q154R;Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y123H+Y147R+Q154R+I76Y;V82S+Y123H+Y147R+Q154R、及びI76Y+V82S+Y123H+Y147R+Q154Rの群から選択される改変の組み合わせを含むTadA*7.10バリアント(例えば、TadA*8)を含む。
いくつかの実施形態では、ABE8は単量体構築物である。いくつかの実施形態では、ABE8はヘテロ二量体構築物である。いくつかの実施形態では、ABE8塩基編集体は、以下の配列を含む:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD
例として、本明細書に記載の塩基編集組成物、系及び方法において使用するアデニン塩基編集体ABEは、以下に示す核酸配列(8877塩基対)を有する(Addgene, Watertown, MA.;Gaudelli NM, et al., Nature.2017 Nov 23;551 (7681):464-471.doi:10.1038/nature24644;Koblan LW, et al., Nat Biotechnol.2018 Oct;36 (9):843-846.doi:10.1038/nbt.4172.)。ABE核酸配列に対して少なくとも95%以上の同一性を有するポリヌクレオチド配列もまた、包含される。
ATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACAT
GACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGG
TTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTG
ACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCC
ATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACCGT
CAGATCCGCTAGAGATCCGCGGCCGCTAATACGACTCACTATAGGGAGAGCCGCCACCATGAAACGGACA
GCCGACGGAAGCGAGTTCGAGTCACCAAAGAAGAAGCGGAAAGTCTCTGAAGTCGAGTTTAGCCACGAGT
ATTGGATGAGGCACGCACTGACCCTGGCAAAGCGAGCATGGGATGAAAGAGAAGTCCCCGTGGGCGCCGT
GCTGGTGCACAACAATAGAGTGATCGGAGAGGGATGGAACAGGCCAATCGGCCGCCACGACCCTACCGCA
CACGCAGAGATCATGGCACTGAGGCAGGGAGGCCTGGTCATGCAGAATTACCGCCTGATCGATGCCACCC
TGTATGTGACACTGGAGCCATGCGTGATGTGCGCAGGAGCAATGATCCACAGCAGGATCGGAAGAGTGGT
GTTCGGAGCACGGGACGCCAAGACCGGCGCAGCAGGCTCCCTGATGGATGTGCTGCACCACCCCGGCATG
AACCACCGGGTGGAGATCACAGAGGGAATCCTGGCAGACGAGTGCGCCGCCCTGCTGAGCGATTTCTTTA
GAATGCGGAGACAGGAGATCAAGGCCCAGAAGAAGGCACAGAGCTCCACCGACTCTGGAGGATCTAGCGG
AGGATCCTCTGGAAGCGAGACACCAGGCACAAGCGAGTCCGCCACACCAGAGAGCTCCGGCGGCTCCTCC
GGAGGATCCTCTGAGGTGGAGTTTTCCCACGAGTACTGGATGAGACATGCCCTGACCCTGGCCAAGAGGG
CACGCGATGAGAGGGAGGTGCCTGTGGGAGCCGTGCTGGTGCTGAACAATAGAGTGATCGGCGAGGGCTG
GAACAGAGCCATCGGCCTGCACGACCCAACAGCCCATGCCGAAATTATGGCCCTGAGACAGGGCGGCCTG
GTCATGCAGAACTACAGACTGATTGACGCCACCCTGTACGTGACATTCGAGCCTTGCGTGATGTGCGCCG
GCGCCATGATCCACTCTAGGATCGGCCGCGTGGTGTTTGGCGTGAGGAACGCAAAAACCGGCGCCGCAGG
CTCCCTGATGGACGTGCTGCACTACCCCGGCATGAATCACCGCGTCGAAATTACCGAGGGAATCCTGGCA
GATGAATGTGCCGCCCTGCTGTGCTATTTCTTTCGGATGCCTAGACAGGTGTTCAATGCTCAGAAGAAGG
CCCAGAGCTCCACCGACTCCGGAGGATCTAGCGGAGGCTCCTCTGGCTCTGAGACACCTGGCACAAGCGA
GAGCGCAACACCTGAAAGCAGCGGGGGCAGCAGCGGGGGGTCAGACAAGAAGTACAGCATCGGCCTGGCC
ATCGGCACCAACTCTGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGG
TGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGAGCCCTGCTGTTCGACAGCGGCGA
AACAGCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAGAACCGGATCTGC
TATCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGT
CCTTCCTGGTGGAAGAGGATAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGACGAGGTGGC
CTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGAC
CTGCGGCTGATCTATCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACC
TGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGA
GGAAAACCCCATCAACGCCAGCGGCGTGGACGCCAAGGCCATCCTGTCTGCCAGACTGAGCAAGAGCAGA
CGGCTGGAAAATCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAATGGCCTGTTCGGAAACCTGATTGCCC
TGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAG
CAAGGACACCTACGACGACGACCTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTT
CTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGACATCCTGAGAGTGAACACCGAGATCACCA
AGGCCCCCCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGACCTGACCCTGCTGAAAGC
TCTCGTGCGGCAGCAGCTGCCTGAGAAGTACAAAGAGATTTTCTTCGACCAGAGCAAGAACGGCTACGCC
GGCTACATTGACGGCGGAGCCAGCCAGGAAGAGTTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGG
ACGGCACCGAGGAACTGCTCGTGAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAA
CGGCAGCATCCCCCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGCGGCAGGAAGATTTTTAC
CCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCCGCATCCCCTACTACGTGGGCC
CTCTGGCCAGGGGAAACAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACCCCCTGGAA
CTTCGAGGAAGTGGTGGACAAGGGCGCTTCCGCCCAGAGCTTCATCGAGCGGATGACCAACTTCGATAAG
AACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTATAACGAGC
TGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTCCTGAGCGGCGAGCAGAAAAAGGC
CATCGTGGACCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAG
AAAATCGAGTGCTTCGACTCCGTGGAAATCTCCGGCGTGGAAGATCGGTTCAACGCCTCCCTGGGCACAT
ACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAATGAGGAAAACGAGGACATTCTGGA
AGATATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACCTATGCC
CACCTGTTCGACGACAAAGTGATGAAGCAGCTGAAGCGGCGGAGATACACCGGCTGGGGCAGGCTGAGCC
GGAAGCTGATCAACGGCATCCGGGACAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGG
CTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAA
GCCCAGGTGTCCGGCCAGGGCGATAGCCTGCACGAGCACATTGCCAATCTGGCCGGCAGCCCCGCCATTA
AGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTCGTGAAAGTGATGGGCCGGCACAAGCCCGA
GAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACCCAGAAGGGACAGAAGAACAGCCGCGAGAGA
ATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACA
CCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGGCGGGATATGTACGTGGACCAGGA
ACTGGACATCAACCGGCTGTCCGACTACGATGTGGACCATATCGTGCCTCAGAGCTTTCTGAAGGACGAC
TCCATCGACAACAAGGTGCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCTCCGAAG
AGGTCGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATTACCCAGAGAAAGTT
CGACAATCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAG
CTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATCCTGGACTCCCGGATGAACACTAAGTACG
ACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTGATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCG
GAAGGATTTCCAGTTTTACAAAGTGCGCGAGATCAACAACTACCACCACGCCCACGACGCCTACCTGAAC
GCCGTCGTGGGAACCGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACA
AGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAAATCGGCAAGGCTACCGCCAAGTACTT
CTTCTACAGCAACATCATGAACTTTTTCAAGACCGAGATTACCCTGGCCAACGGCGAGATCCGGAAGCGG
CCTCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCCGGGATTTTGCCACCGTGC
GGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAAAAGACCGAGGTGCAGACAGGCGGCTTCAGCAA
AGAGTCTATCCTGCCCAAGAGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAG
TACGGCGGCTTCGACAGCCCCACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGT
CCAAGAAACTGAAGAGTGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAA
TCCCATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTGCCTAAG
TACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCCGGCGAACTGCAGAAGGGAA
ACGAACTGGCCCTGCCCTCCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGG
CTCCCCCGAGGATAATGAGCAGAAACAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATC
GAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAATCTGGACAAAGTGCTGTCCGCCT
ACAACAAGCACCGGGATAAGCCCATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAA
TCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAA
GAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTC
AGCTGGGAGGTGACTCTGGCGGCTCAAAAAGAACCGCCGACGGCAGCGAATTCGAGCCCAAGAAGAAGAG
GAAAGTCTAACCGGTCATCATCACCATCACCATTGAGTTTAAACCCGCTGATCAGCCTCGACTGTGCCTT
CTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCAC
TGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGT
GGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCT
CTATGGCTTCTGAGGCGGAAAGAACCAGCTGGGGCTCGATACCGTCGACCTCTAGCTAGAGCTTGGCGTA
ATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGA
AGCATAAAGTGTAAAGCCTAGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGC
CCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGG
TTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGA
GCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACA
TGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCT
CCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAA
AGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGAT
ACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTC
GGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTA
TCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTA
ACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTA
CACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGC
TCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCA
GAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACACTCAGTGGAACGAAAACTC
ACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGA
AGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGG
CACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTAC
GATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCA
GATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCT
CCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGT
TGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCC
CAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGA
TCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTAC
TGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGT
ATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAA
AAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAG
TTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGA
GCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATAC
TCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATG
TATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCGACGGA
TCGGGAGATCGATCTCCCGATCCCCTAGGGTCGACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAA
GCCAGTATCTGCTCCCTGCTTGTGTGTTGGAGGTCGCTGAGTAGTGCGCGAGCAAAATTTAAGCTACAAC
AAGGCAAGGCTTGACCGACAATTGCATGAAGAATCTGCTTAGGGTTAGGCGTTTTGCGCTGCTTCGCGAT
GTACGGGCCAGATATACGCGTTGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCAT
TAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCC
CAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCAT
TGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATC
例として、本明細書に記載の塩基編集組成物、系及び方法において使用するシチジン塩基編集体(CBE)は、以下に示す核酸配列(8877塩基対)を有する(Addgene,Watertown,MA.;Komor AC, et al., 2017,Sci Adv., 30;3 (8):eaao 4774.doi:10.1126/sciadv.aao4774)。BE4核酸配列に対して少なくとも95%以上の同一性を有するポリヌクレオチド配列もまた、包含される。
1 ATATGCCAAG TACGCCCCCT ATTGACGTCA ATGACGGTAA ATGGCCCGCC TGGCATTATG
61 CCCAGTACAT GACCTTATGG GACTTTCCTA CTTGGCAGTA CATCTACGTA TTAGTCATCG
121 CTATTACCAT GGTGATGCGG TTTTGGCAGT ACATCAATGG GCGTGGATAG CGGTTTGACT
181 CACGGGGATT TCCAAGTCTC CACCCCATTG ACGTCAATGG GAGTTTGTTT TGGCACCAAA
241 ATCAACGGGA CTTTCCAAAA TGTCGTAACA ACTCCGCCCC ATTGACGCAA ATGGGCGGTA
301 GGCGTGTACG GTGGGAGGTC TATATAAGCA GAGCTGGTTT AGTGAACCGT CAGATCCGCT
361 AGAGATCCGC GGCCGCTAAT ACGACTCACT ATAGGGAGAG CCGCCACCAT GAGCTCAGAG
421 ACTGGCCCAG TGGCTGTGGA CCCCACATTG AGACGGCGGA TCGAGCCCCA TGAGTTTGAG
481 GTATTCTTCG ATCCGAGAGA GCTCCGCAAG GAGACCTGCC TGCTTTACGA AATTAATTGG
541 GGGGGCCGGC ACTCCATTTG GCGACATACA TCACAGAACA CTAACAAGCA CGTCGAAGTC
601 AACTTCATCG AGAAGTTCAC GACAGAAAGA TATTTCTGTC CGAACACAAG GTGCAGCATT
661 ACCTGGTTTC TCAGCTGGAG CCCATGCGGC GAATGTAGTA GGGCCATCAC TGAATTCCTG
721 TCAAGGTATC CCCACGTCAC TCTGTTTATT TACATCGCAA GGCTGTACCA CCACGCTGAC
781 CCCCGCAATC GACAAGGCCT GCGGGATTTG ATCTCTTCAG GTGTGACTAT CCAAATTATG
841 ACTGAGCAGG AGTCAGGATA CTGCTGGAGA AACTTTGTGA ATTATAGCCC GAGTAATGAA
901 GCCCACTGGC CTAGGTATCC CCATCTGTGG GTACGACTGT ACGTTCTTGA ACTGTACTGC
961 ATCATACTGG GCCTGCCTCC TTGTCTCAAC ATTCTGAGAA GGAAGCAGCC ACAGCTGACA
1021 TTCTTTACCA TCGCTCTTCA GTCTTGTCAT TACCAGCGAC TGCCCCCACA CATTCTCTGG
1081 GCCACCGGGT TGAAATCTGG TGGTTCTTCT GGTGGTTCTA GCGGCAGCGA GACTCCCGGG
1141 ACCTCAGAGT CCGCCACACC CGAAAGTTCT GGTGGTTCTT CTGGTGGTTC TGATAAAAAG
1201 TATTCTATTG GTTTAGCCAT CGGCACTAAT TCCGTTGGAT GGGCTGTCAT AACCGATGAA
1261 TACAAAGTAC CTTCAAAGAA ATTTAAGGTG TTGGGGAACA CAGACCGTCA TTCGATTAAA
1321 AAGAATCTTA TCGGTGCCCT CCTATTCGAT AGTGGCGAAA CGGCAGAGGC GACTCGCCTG
1381 AAACGAACCG CTCGGAGAAG GTATACACGT CGCAAGAACC GAATATGTTA CTTACAAGAA
1441 ATTTTTAGCA ATGAGATGGC CAAAGTTGAC GATTCTTTCT TTCACCGTTT GGAAGAGTCC
1501 TTCCTTGTCG AAGAGGACAA GAAACATGAA CGGCACCCCA TCTTTGGAAA CATAGTAGAT
1561 GAGGTGGCAT ATCATGAAAA GTACCCAACG ATTTATCACC TCAGAAAAAA GCTAGTTGAC
1621 TCAACTGATA AAGCGGACCT GAGGTTAATC TACTTGGCTC TTGCCCATAT GATAAAGTTC
1681 CGTGGGCACT TTCTCATTGA GGGTGATCTA AATCCGGACA ACTCGGATGT CGACAAACTG
1741 TTCATCCAGT TAGTACAAAC CTATAATCAG TTGTTTGAAG AGAACCCTAT AAATGCAAGT
1801 GGCGTGGATG CGAAGGCTAT TCTTAGCGCC CGCCTCTCTA AATCCCGACG GCTAGAAAAC
1861 CTGATCGCAC AATTACCCGG AGAGAAGAAA AATGGGTTGT TCGGTAACCT TATAGCGCTC
1921 TCACTAGGCC TGACACCAAA TTTTAAGTCG AACTTCGACT TAGCTGAAGA TGCCAAATTG
1981 CAGCTTAGTA AGGACACGTA CGATGACGAT CTCGACAATC TACTGGCACA AATTGGAGAT
2041 CAGTATGCGG ACTTATTTTT GGCTGCCAAA AACCTTAGCG ATGCAATCCT CCTATCTGAC
2101 ATACTGAGAG TTAATACTGA GATTACCAAG GCGCCGTTAT CCGCTTCAAT GATCAAAAGG
2161 TACGATGAAC ATCACCAAGA CTTGACACTT CTCAAGGCCC TAGTCCGTCA GCAACTGCCT
2221 GAGAAATATA AGGAAATATT CTTTGATCAG TCGAAAAACG GGTACGCAGG TTATATTGAC
2281 GGCGGAGCGA GTCAAGAGGA ATTCTACAAG TTTATCAAAC CCATATTAGA GAAGATGGAT
2341 GGGACGGAAG AGTTGCTTGT AAAACTCAAT CGCGAAGATC TACTGCGAAA GCAGCGGACT
2401 TTCGACAACG GTAGCATTCC ACATCAAATC CACTTAGGCG AATTGCATGC TATACTTAGA
2461 AGGCAGGAGG ATTTTTATCC GTTCCTCAAA GACAATCGTG AAAAGATTGA GAAAATCCTA
2521 ACCTTTCGCA TACCTTACTA TGTGGGACCC CTGGCCCGAG GGAACTCTCG GTTCGCATGG
2581 ATGACAAGAA AGTCCGAAGA AACGATTACT CCATGGAATT TTGAGGAAGT TGTCGATAAA
2641 GGTGCGTCAG CTCAATCGTT CATCGAGAGG ATGACCAACT TTGACAAGAA TTTACCGAAC
2701 GAAAAAGTAT TGCCTAAGCA CAGTTTACTT TACGAGTATT TCACAGTGTA CAATGAACTC
2761 ACGAAAGTTA AGTATGTCAC TGAGGGCATG CGTAAACCCG CCTTTCTAAG CGGAGAACAG
2821 AAGAAAGCAA TAGTAGATCT GTTATTCAAG ACCAACCGCA AAGTGACAGT TAAGCAATTG
2881 AAAGAGGACT ACTTTAAGAA AATTGAATGC TTCGATTCTG TCGAGATCTC CGGGGTAGAA
2941 GATCGATTTA ATGCGTCACT TGGTACGTAT CATGACCTCC TAAAGATAAT TAAAGATAAG
3001 GACTTCCTGG ATAACGAAGA GAATGAAGAT ATCTTAGAAG ATATAGTGTT GACTCTTACC
3061 CTCTTTGAAG ATCGGGAAAT GATTGAGGAA AGACTAAAAA CATACGCTCA CCTGTTCGAC
3121 GATAAGGTTA TGAAACAGTT AAAGAGGCGT CGCTATACGG GCTGGGGACG ATTGTCGCGG
3181 AAACTTATCA ACGGGATAAG AGACAAGCAA AGTGGTAAAA CTATTCTCGA TTTTCTAAAG
3241 AGCGACGGCT TCGCCAATAG GAACTTTATG CAGCTGATCC ATGATGACTC TTTAACCTTC
3301 AAAGAGGATA TACAAAAGGC ACAGGTTTCC GGACAAGGGG ACTCATTGCA CGAACATATT
3361 GCGAATCTTG CTGGTTCGCC AGCCATCAAA AAGGGCATAC TCCAGACAGT CAAAGTAGTG
3421 GATGAGCTAG TTAAGGTCAT GGGACGTCAC AAACCGGAAA ACATTGTAAT CGAGATGGCA
3481 CGCGAAAATC AAACGACTCA GAAGGGGCAA AAAAACAGTC GAGAGCGGAT GAAGAGAATA
3541 GAAGAGGGTA TTAAAGAACT GGGCAGCCAG ATCTTAAAGG AGCATCCTGT GGAAAATACC
3601 CAATTGCAGA ACGAGAAACT TTACCTCTAT TACCTACAAA ATGGAAGGGA CATGTATGTT
3661 GATCAGGAAC TGGACATAAA CCGTTTATCT GATTACGACG TCGATCACAT TGTACCCCAA
3721 TCCTTTTTGA AGGACGATTC AATCGACAAT AAAGTGCTTA CACGCTCGGA TAAGAACCGA
3781 GGGAAAAGTG ACAATGTTCC AAGCGAGGAA GTCGTAAAGA AAATGAAGAA CTATTGGCGG
3841 CAGCTCCTAA ATGCGAAACT GATAACGCAA AGAAAGTTCG ATAACTTAAC TAAAGCTGAG
3901 AGGGGTGGCT TGTCTGAACT TGACAAGGCC GGATTTATTA AACGTCAGCT CGTGGAAACC
3961 CGCCAAATCA CAAAGCATGT TGCACAGATA CTAGATTCCC GAATGAATAC GAAATACGAC
4021 GAGAACGATA AGCTGATTCG GGAAGTCAAA GTAATCACTT TAAAGTCAAA ATTGGTGTCG
4081 GACTTCAGAA AGGATTTTCA ATTCTATAAA GTTAGGGAGA TAAATAACTA CCACCATGCG
4141 CACGACGCTT ATCTTAATGC CGTCGTAGGG ACCGCACTCA TTAAGAAATA CCCGAAGCTA
4201 GAAAGTGAGT TTGTGTATGG TGATTACAAA GTTTATGACG TCCGTAAGAT GATCGCGAAA
4261 AGCGAACAGG AGATAGGCAA GGCTACAGCC AAATACTTCT TTTATTCTAA CATTATGAAT
4321 TTCTTTAAGA CGGAAATCAC TCTGGCAAAC GGAGAGATAC GCAAACGACC TTTAATTGAA
4381 ACCAATGGGG AGACAGGTGA AATCGTATGG GATAAGGGCC GGGACTTCGC GACGGTGAGA
4441 AAAGTTTTGT CCATGCCCCA AGTCAACATA GTAAAGAAAA CTGAGGTGCA GACCGGAGGG
4501 TTTTCAAAGG AATCGATTCT TCCAAAAAGG AATAGTGATA AGCTCATCGC TCGTAAAAAG
4561 GACTGGGACC CGAAAAAGTA CGGTGGCTTC GATAGCCCTA CAGTTGCCTA TTCTGTCCTA
4621 GTAGTGGCAA AAGTTGAGAA GGGAAAATCC AAGAAACTGA AGTCAGTCAA AGAATTATTG
4681 GGGATAACGA TTATGGAGCG CTCGTCTTTT GAAAAGAACC CCATCGACTT CCTTGAGGCG
4741 AAAGGTTACA AGGAAGTAAA AAAGGATCTC ATAATTAAAC TACCAAAGTA TAGTCTGTTT
4801 GAGTTAGAAA ATGGCCGAAA ACGGATGTTG GCTAGCGCCG GAGAGCTTCA AAAGGGGAAC
4861 GAACTCGCAC TACCGTCTAA ATACGTGAAT TTCCTGTATT TAGCGTCCCA TTACGAGAAG
4921 TTGAAAGGTT CACCTGAAGA TAACGAACAG AAGCAACTTT TTGTTGAGCA GCACAAACAT
4981 TATCTCGACG AAATCATAGA GCAAATTTCG GAATTCAGTA AGAGAGTCAT CCTAGCTGAT
5041 GCCAATCTGG ACAAAGTATT AAGCGCATAC AACAAGCACA GGGATAAACC CATACGTGAG
5101 CAGGCGGAAA ATATTATCCA TTTGTTTACT CTTACCAACC TCGGCGCTCC AGCCGCATTC
5161 AAGTATTTTG ACACAACGAT AGATCGCAAA CGATACACTT CTACCAAGGA GGTGCTAGAC
5221 GCGACACTGA TTCACCAATC CATCACGGGA TTATATGAAA CTCGGATAGA TTTGTCACAG
5281 CTTGGGGGTG ACTCTGGTGG TTCTGGAGGA TCTGGTGGTT CTACTAATCT GTCAGATATT
5341 ATTGAAAAGG AGACCGGTAA GCAACTGGTT ATCCAGGAAT CCATCCTCAT GCTCCCAGAG
5401 GAGGTGGAAG AAGTCATTGG GAACAAGCCG GAAAGCGATA TACTCGTGCA CACCGCCTAC
5461 GACGAGAGCA CCGACGAGAA TGTCATGCTT CTGACTAGCG ACGCCCCTGA ATACAAGCCT
5521 TGGGCTCTGG TCATACAGGA TAGCAACGGT GAGAACAAGA TTAAGATGCT CTCTGGTGGT
5581 TCTGGAGGAT CTGGTGGTTC TACTAATCTG TCAGATATTA TTGAAAAGGA GACCGGTAAG
5641 CAACTGGTTA TCCAGGAATC CATCCTCATG CTCCCAGAGG AGGTGGAAGA AGTCATTGGG
5701 AACAAGCCGG AAAGCGATAT ACTCGTGCAC ACCGCCTACG ACGAGAGCAC CGACGAGAAT
5761 GTCATGCTTC TGACTAGCGA CGCCCCTGAA TACAAGCCTT GGGCTCTGGT CATACAGGAT
5821 AGCAACGGTG AGAACAAGAT TAAGATGCTC TCTGGTGGTT CTCCCAAGAA GAAGAGGAAA
5881 GTCTAACCGG TCATCATCAC CATCACCATT GAGTTTAAAC CCGCTGATCA GCCTCGACTG
5941 TGCCTTCTAG TTGCCAGCCA TCTGTTGTTT GCCCCTCCCC CGTGCCTTCC TTGACCCTGG
6001 AAGGTGCCAC TCCCACTGTC CTTTCCTAAT AAAATGAGGA AATTGCATCG CATTGTCTGA
6061 GTAGGTGTCA TTCTATTCTG GGGGGTGGGG TGGGGCAGGA CAGCAAGGGG GAGGATTGGG
6121 AAGACAATAG CAGGCATGCT GGGGATGCGG TGGGCTCTAT GGCTTCTGAG GCGGAAAGAA
6181 CCAGCTGGGG CTCGATACCG TCGACCTCTA GCTAGAGCTT GGCGTAATCA TGGTCATAGC
6241 TGTTTCCTGT GTGAAATTGT TATCCGCTCA CAATTCCACA CAACATACGA GCCGGAAGCA
6301 TAAAGTGTAA AGCCTAGGGT GCCTAATGAG TGAGCTAACT CACATTAATT GCGTTGCGCT
6361 CACTGCCCGC TTTCCAGTCG GGAAACCTGT CGTGCCAGCT GCATTAATGA ATCGGCCAAC
6421 GCGCGGGGAG AGGCGGTTTG CGTATTGGGC GCTCTTCCGC TTCCTCGCTC ACTGACTCGC
6481 TGCGCTCGGT CGTTCGGCTG CGGCGAGCGG TATCAGCTCA CTCAAAGGCG GTAATACGGT
6541 TATCCACAGA ATCAGGGGAT AACGCAGGAA AGAACATGTG AGCAAAAGGC CAGCAAAAGG
6601 CCAGGAACCG TAAAAAGGCC GCGTTGCTGG CGTTTTTCCA TAGGCTCCGC CCCCCTGACG
6661 AGCATCACAA AAATCGACGC TCAAGTCAGA GGTGGCGAAA CCCGACAGGA CTATAAAGAT
6721 ACCAGGCGTT TCCCCCTGGA AGCTCCCTCG TGCGCTCTCC TGTTCCGACC CTGCCGCTTA
6781 CCGGATACCT GTCCGCCTTT CTCCCTTCGG GAAGCGTGGC GCTTTCTCAT AGCTCACGCT
6841 GTAGGTATCT CAGTTCGGTG TAGGTCGTTC GCTCCAAGCT GGGCTGTGTG CACGAACCCC
6901 CCGTTCAGCC CGACCGCTGC GCCTTATCCG GTAACTATCG TCTTGAGTCC AACCCGGTAA
6961 GACACGACTT ATCGCCACTG GCAGCAGCCA CTGGTAACAG GATTAGCAGA GCGAGGTATG
7021 TAGGCGGTGC TACAGAGTTC TTGAAGTGGT GGCCTAACTA CGGCTACACT AGAAGAACAG
7081 TATTTGGTAT CTGCGCTCTG CTGAAGCCAG TTACCTTCGG AAAAAGAGTT GGTAGCTCTT
7141 GATCCGGCAA ACAAACCACC GCTGGTAGCG GTGGTTTTTT TGTTTGCAAG CAGCAGATTA
7201 CGCGCAGAAA AAAAGGATCT CAAGAAGATC CTTTGATCTT TTCTACGGGG TCTGACGCTC
7261 AGTGGAACGA AAACTCACGT TAAGGGATTT TGGTCATGAG ATTATCAAAA AGGATCTTCA
7321 CCTAGATCCT TTTAAATTAA AAATGAAGTT TTAAATCAAT CTAAAGTATA TATGAGTAAA
7381 CTTGGTCTGA CAGTTACCAA TGCTTAATCA GTGAGGCACC TATCTCAGCG ATCTGTCTAT
7441 TTCGTTCATC CATAGTTGCC TGACTCCCCG TCGTGTAGAT AACTACGATA CGGGAGGGCT
7501 TACCATCTGG CCCCAGTGCT GCAATGATAC CGCGAGACCC ACGCTCACCG GCTCCAGATT
7561 TATCAGCAAT AAACCAGCCA GCCGGAAGGG CCGAGCGCAG AAGTGGTCCT GCAACTTTAT
7621 CCGCCTCCAT CCAGTCTATT AATTGTTGCC GGGAAGCTAG AGTAAGTAGT TCGCCAGTTA
7681 ATAGTTTGCG CAACGTTGTT GCCATTGCTA CAGGCATCGT GGTGTCACGC TCGTCGTTTG
7741 GTATGGCTTC ATTCAGCTCC GGTTCCCAAC GATCAAGGCG AGTTACATGA TCCCCCATGT
7801 TGTGCAAAAA AGCGGTTAGC TCCTTCGGTC CTCCGATCGT TGTCAGAAGT AAGTTGGCCG
7861 CAGTGTTATC ACTCATGGTT ATGGCAGCAC TGCATAATTC TCTTACTGTC ATGCCATCCG
7921 TAAGATGCTT TTCTGTGACT GGTGAGTACT CAACCAAGTC ATTCTGAGAA TAGTGTATGC
7981 GGCGACCGAG TTGCTCTTGC CCGGCGTCAA TACGGGATAA TACCGCGCCA CATAGCAGAA
8041 CTTTAAAAGT GCTCATCATT GGAAAACGTT CTTCGGGGCG AAAACTCTCA AGGATCTTAC
8101 CGCTGTTGAG ATCCAGTTCG ATGTAACCCA CTCGTGCACC CAACTGATCT TCAGCATCTT
8161 TTACTTTCAC CAGCGTTTCT GGGTGAGCAA AAACAGGAAG GCAAAATGCC GCAAAAAAGG
8221 GAATAAGGGC GACACGGAAA TGTTGAATAC TCATACTCTT CCTTTTTCAA TATTATTGAA
8281 GCATTTATCA GGGTTATTGT CTCATGAGCG GATACATATT TGAATGTATT TAGAAAAATA
8341 AACAAATAGG GGTTCCGCGC ACATTTCCCC GAAAAGTGCC ACCTGACGTC GACGGATCGG
8401 GAGATCGATC TCCCGATCCC CTAGGGTCGA CTCTCAGTAC AATCTGCTCT GATGCCGCAT
8461 AGTTAAGCCA GTATCTGCTC CCTGCTTGTG TGTTGGAGGT CGCTGAGTAG TGCGCGAGCA
8521 AAATTTAAGC TACAACAAGG CAAGGCTTGA CCGACAATTG CATGAAGAAT CTGCTTAGGG
8581 TTAGGCGTTT TGCGCTGCTT CGCGATGTAC GGGCCAGATA TACGCGTTGA CATTGATTAT
8641 TGACTAGTTA TTAATAGTAA TCAATTACGG GGTCATTAGT TCATAGCCCA TATATGGAGT
8701 TCCGCGTTAC ATAACTTACG GTAAATGGCC CGCCTGGCTG ACCGCCCAAC GACCCCCGCC
8761 CATTGACGTC AATAATGACG TATGTTCCCA TAGTAACGCC AATAGGGACT TTCCATTGAC
8821 GTCAATGGGT GGAGTATTTA CGGTAAACTG CCCACTTGGC AGTACATCAA GTGTATC
いくつかの実施形態では、シチジン塩基編集体は、以下のうちの1つから選択される核酸配列を有するBE4である:
オリジナルBE4核酸配列:
ATGagctcagagactggcccagtggctgtggaccccacattgagacggcggatcgagccccatgagtttgaggtattcttcgatccgagagagctccgcaaggagacctgcctgctttacgaaattaattgggggggccggcactccatttggcgacatacatcacagaacactaacaagcacgtcgaagtcaacttcatcgagaagttcacgacagaaagatatttctgtccgaacacaaggtgcagcattacctggtttctcagctggagccgcgaatgtagtagggccatcactgaattcctgtcaaggtatccccacgtcactctgtttatttacatcgcaaggctgtaccaccacgctgacccccgcaatcgacaaggcctgcgggatttgatctcttcaggtgtgactatccaaattatgactgagcaggagtcaggatactgctggagaaactttgtgaattatagcccgagtaatgaagcccactggcctaggtatccccatctgtgggtacgactgtacgttcttgaactgtactgcatcatactgggcctgcctccttgtctcaacattctgagaaggaagcagccacagctgacattctttaccatcgctcttcagtcttgtcattaccagcgactgcccccacacattctctgggccaccgggttgaaatctggtggttcttctggtggttctagcggcagcgagactcccgggacctcagagtccgccacacccgaaagttctggtggttcttctggtggttctgataaaaagtattctattggtttagccatcggcactaattccgttggatgggctgtcataaccgatgaatacaaagtaccttcaaagaaatttaaggtgttggggaacacagaccgtcattcgattaaaaagaatcttatcggtgccctcctattcgatagtggcgaaacggcagaggcgactcgcctgaaacgaaccgctcggagaaggtatacacgtcgcaagaaccgaatatgttacttacaagaaatttttagcaatgagatggccaaagttgacgattctttctttcaccgtttggaagagtccttccttgtcgaagaggacaagaaacatgaacggcaccccatctttggaaacatagtagatgaggtggcatatcatgaaaagtacccaacgatttatcacctcagaaaaaagctagttgactcaactgataaagcggacctgaggttaatctacttggctcttgcccatatgataaagttccgtgggcactttctcattgagggtgatctaaatccggacaactcggatgtcgacaaactgttcatccagttagtacaaacctataatcagttgtttgaagagaaccctataaatgcaagtggcgtggatgcgaaggctattcttagcgcccgcctctctaaatcccgacggctagaaaacctgatcgcacaattacccggagagaagaaaaatgggttgttcggtaaccttatagcgctctcactaggcctgacaccaaattttaagtcgaacttcgacttagctgaagatgccaaattgcagcttagtaaggacacgtacgatgacgatctcgacaatctactggcacaaattggagatcagtatgcggacttatttttggctgccaaaaaccttagcgatgcaatcctcctatctgacatactgagagttaatactgagattaccaaggcgccgttatccgcttcaatgatcaaaaggtacgatgaacatcaccaagacttgacacttctcaaggccctagtccgtcagcaactgcctgagaaatataaggaaatattctttgatcagtcgaaaaacgggtacgcaggttatattgacggcggagcgagtcaagaggaattctacaagtttatcaaacccatattagagaagatggatgggacggaagagttgcttgtaaaactcaatcgcgaagatctactgcgaaagcagcggactttcgacaacggtagcattccacatcaaatccacttaggcgaattgcatgctatacttagaaggcaggaggatttttatccgttcctcaaagacaatcgtgaaaagattgagaaaatcctaacctttcgcataccttactatgtgggacccctggcccgagggaactctcggttcgcatggatgacaagaaagtccgaagaaacgattactccatggaattttgaggaagttgtcgataaaggtgcgtcagctcaatcgttcatcgagaggatgaccaactttgacaagaatttaccgaacgaaaaagtattgcctaagcacagtttactttacgagtatttcacagtgtacaatgaactcacgaaagttaagtatgtcactgagggcatgcgtaaacccgcctttctaagcggagaacagaagaaagcaatagtagatctgttattcaagaccaaccgcaaagtgacagttaagcaattgaaagaggactactttaagaaaattgaatgcttcgattctgtcgagatctccggggtagaagatcgatttaatgcgtcacttggtacgtatcatgacctcctaaagataattaaagataaggacttcctggataacgaagagaatgaagatatcttagaagatatagtgttgactcttaccctctttgaagatcgggaaatgattgaggaaagactaaaaacatacgctcacctgttcgacgataaggttatgaaacagttaaagaggcgtcgctatacgggctggggacgattgtcgcggaaacttatcaacgggataagagacaagcaaagtggtaaaactattctcgattttctaaagagcgacggcttcgccaataggaactttatgcagctgatccatgatgactctttaaccttcaaagaggatatacaaaaggcacaggtttccggacaaggggactcattgcacgaacatattgcgaatcttgctggttcgccagccatcaaaaagggcatactccagacagtcaaagtagtggatgagctagttaaggtcatgggacgtcacaaaccggaaaacattgtaatcgagatggcacgcgaaaatcaaacgactcagaaggggcaaaaaaacagtcgagagcggatgaagagaatagaagagggtattaaagaactgggcagccagatcttaaaggagcatcctgtggaaaatacccaattgcagaacgagaaactttacctctattacctacaaaatggaagggacatgtatgttgatcaggaactggacataaaccgtttatctgattacgacgtcgatcacattgtaccccaatcctttttgaaggacgattcaatcgacaataaagtgcttacacgctcggataagaaccgagggaaaagtgacaatgttccaagcgaggaagtcgtaaagaaaatgaagaactattggcggcagctcctaaatgcgaaactgataacgcaaagaaagttcgataacttaactaaagctgagaggggtggcttgtctgaacttgacaaggccggatttattaaacgtcagctcgtggaaacccgccaaatcacaaagcatgttgcacagatactagattcccgaatgaatacgaaatacgacgagaacgataagctgattcgggaagtcaaagtaatcactttaaagtcaaaattggtgtcggacttcagaaaggattttcaattctataaagttagggagataaataactaccaccatgcgcacgacgcttatcttaatgccgtcgtagggaccgcactcattaagaaatacccgaagctagaaagtgagtttgtgtatggtgattacaaagtttatgacgtccgtaagatgatcgcgaaaagcgaacaggagataggcaaggctacagccaaatacttcttttattctaacattatgaatttctttaagacggaaatcactctggcaaacggagagatacgcaaacgacctttaattgaaaccaatggggagacaggtgaaatcgtatgggataagggccgggacttcgcgacggtgagaaaagttttgtccatgccccaagtcaacatagtaaagaaaactgaggtgcagaccggagggttttcaaaggaatcgattcttccaaaaaggaatagtgataagctcatcgctcgtaaaaaggactgggacccgaaaaagtacggtggcttcgatagccctacagttgcctattctgtcctagtagtggcaaaagttgagaagggaaaatccaagaaactgaagtcagtcaaagaattattggggataacgattatggagcgctcgtcttttgaaaagaaccccatcgacttccttgaggcgaaaggttacaaggaagtaaaaaaggatctcataattaaactaccaaagtatagtctgtttgagttagaaaatggccgaaaacggatgttggctagcgccggagagcttcaaaaggggaacgaactcgcactaccgtctaaatacgtgaatttcctgtatttagcgtcccattacgagaagttgaaaggttcacctgaagataacgaacagaagcaactttttgttgagcagcacaaacattatctcgacgaaatcatagagcaaatttcggaattcagtaagagagtcatcctagctgatgccaatctggacaaagtattaagcgcatacaacaagcacagggataaacccatacgtgagcaggcggaaaatattatccatttgtttactcttaccaacctcggcgctccagccgcattcaagtattttgacacaacgatagatcgcaaacgatacacttctaccaaggaggtgctagacgcgacactgattcaccaatccatcacgggattatatgaaactcggatagatttgtcacagcttgggggtgactctggtggttctggaggatctggtggttctactaatctgtcagatattattgaaaaggagaccggtaagcaactggttatccaggaatccatcctcatgctcccagaggaggtggaagaagtcattgggaacaagccggaaagcgatatactcgtgcacaccgcctacgacgagagcaccgacgagaatgtcatgcttctgactagcgacgcccctgaatacaagccttgggctctggtcatacaggatagcaacggtgagaacaagattaagatgctctctggtggttctggaggatctggtggttctactaatctgtcagatattattgaaaaggagaccggtaagcaactggttatccaggaatccatcctcatgctcccagaggaggtggaagaagtcattgggaacaagccggaaagcgatatactcgtgcacaccgcctacgacgagagcaccgacgagaatgtcatgcttctgactagcgacgcccctgaatacaagccttgggctctggtcatacaggatagcaacggtgagaacaagattaagatgctctctggtggttctAAAAGGACGGCGGACGGATCAGAGTTCGAGAGTCCGAAAAAAAAACGAAAGGTCGAAtaa
BE4コドン最適化1核酸配列:
ATGTCATCCGAAACCGGGCCAGTGGCCGTAGACCCAACACTCAGGAGGCGGATAGAACCCCATGAGTTTGAAGTGTTCTTCGACCCCAGAGAGCTGCGCAAAGAGACTTGCCTCCTGTATGAAATAAATTGGGGGGGTCGCCATTCAATTTGGAGGCACACTAGCCAGAATACTAACAAACACGTGGAGGTAAATTTTATCGAGAAGTTTACCACCGAAAGATACTTTTGCCCCAATACACGGTGTTCAATTACCTGGTTTCTGTCATGGAGTCCATGTGGAGAATGTAGTAGAGCGATAACTGAGTTCCTGTCTCGATATCCTCACGTCACGTTGTTTATATACATCGCTCGGCTTTATCACCATGCGGACCCGCGGAACAGGCAAGGTCTTCGGGACCTCATATCCTCTGGGGTGACCATCCAGATAATGACGGAGCAAGAGAGCGGATACTGCTGGCGAAACTTTGTTAACTACAGCCCAAGCAATGAGGCACACTGGCCTAGATATCCGCATCTCTGGGTTCGACTGTATGTCCTTGAACTGTACTGCATAATTCTGGGACTTCCGCCATGCTTGAACATTCTGCGGCGGAAACAACCACAGCTGACCTTTTTCACGATTGCTCTCCAAAGTTGTCACTACCAGCGATTGCCACCCCACATCTTGTGGGCTACTGGACTCAAGTCTGGAGGAAGTTCAGGCGGAAGCAGCGGGTCTGAAACGCCCGGAACCTCAGAGAGCGCAACGCCCGAAAGCTCTGGAGGGTCAAGTGGTGGTAGTGATAAGAAATACTCCATCGGCCTCGCCATCGGTACGAATTCTGTCGGTTGGGCCGTTATCACCGATGAGTACAAGGTCCCTTCTAAGAAATTCAAGGTTTTGGGCAATACAGACCGCCATTCTATAAAAAAAAACCTGATCGGCGCCCTTTTGTTTGACAGTGGTGAGACTGCTGAAGCGACTCGCCTGAAGCGAACTGCCAGGAGGCGGTATACGAGGCGAAAAAACCGAATTTGTTACCTCCAGGAGATTTTCTCAAATGAAATGGCCAAGGTAGATGATAGTTTTTTTCACCGCTTGGAAGAAAGTTTTCTCGTTGAGGAGGACAAAAAGCACGAGAGGCACCCAATCTTTGGCAACATAGTCGATGAGGTCGCATACCATGAGAAATATCCTACGATCTATCATCTCCGCAAGAAGCTGGTCGATAGCACGGATAAAGCTGACCTCCGGCTGATCTACCTTGCTCTTGCTCACATGATTAAATTCAGGGGCCATTTCCTGATAGAAGGAGACCTCAATCCCGACAATTCTGATGTCGACAAACTGTTTATTCAGCTCGTTCAGACCTATAATCAACTCTTTGAGGAGAACCCCATCAATGCTTCAGGGGTGGACGCAAAGGCCATTTTGTCCGCGCGCTTGAGTAAATCACGACGCCTCGAGAATTTGATAGCTCAACTGCCGGGTGAGAAGAAAAACGGGTTGTTTGGGAATCTCATAGCGTTGAGTTTGGGACTTACGCCAAACTTTAAGTCTAACTTTGATTTGGCCGAAGATGCCAAATTGCAGCTGTCCAAAGATACCTATGATGACGACTTGGATAACCTTCTTGCGCAGATTGGTGACCAATACGCGGATCTGTTTCTTGCCGCAAAAAATCTGTCCGACGCCATACTCTTGTCCGATATACTGCGCGTCAATACTGAGATAACTAAGGCTCCCCTCAGCGCGTCCATGATTAAAAGATACGATGAGCACCACCAAGATCTCACTCTGTTGAAAGCCCTGGTTCGCCAGCAGCTTCCAGAGAAGTATAAGGAGATATTTTTCGACCAATCTAAAAACGGCTATGCGGGTTACATTGACGGTGGCGCCTCTCAAGAAGAATTCTACAAGTTTATAAAGCCGATACTTGAGAAAATGGACGGTACAGAGGAATTGTTGGTTAAGCTCAATCGCGAGGACTTGTTGAGAAAGCAGCGCACATTTGACAATGGTAGTATTCCACACCAGATTCATCTGGGCGAGTTGCATGCCATTCTTAGAAGACAAGAAGATTTTTATCCGTTTCTGAAAGATAACAGAGAAAAGATTGAAAAGATACTTACCTTTCGCATACCGTATTATGTAGGTCCCCTGGCTAGAGGGAACAGTCGCTTCGCTTGGATGACTCGAAAATCAGAAGAAACAATAACCCCCTGGAATTTTGAAGAAGTGGTAGATAAAGGTGCGAGTGCCCAATCTTTTATTGAGCGGATGACAAATTTTGACAAGAATCTGCCTAACGAAAAGGTGCTTCCCAAGCATTCCCTTTTGTATGAATACTTTACAGTATATAATGAACTGACTAAAGTGAAGTACGTTACCGAGGGGATGCGAAAGCCAGCTTTTCTCAGTGGCGAGCAGAAAAAAGCAATAGTTGACCTGCTGTTCAAGACGAATAGGAAGGTTACCGTCAAACAGCTCAAAGAAGATTACTTTAAAAAGATCGAATGTTTTGATTCAGTTGAGATAAGCGGAGTAGAGGATAGATTTAACGCAAGTCTTGGAACTTATCATGACCTTTTGAAGATCATCAAGGATAAAGATTTTTTGGACAACGAGGAGAATGAAGATATCCTGGAAGATATAGTACTTACCTTGACGCTTTTTGAAGATCGAGAGATGATCGAGGAGCGACTTAAGACGTACGCACATCTCTTTGACGATAAGGTTATGAAACAATTGAAACGCCGGCGGTATACTGGCTGGGGCAGGCTTTCTCGAAAGCTGATTAATGGTATCCGCGATAAGCAGTCTGGAAAGACAATCCTTGACTTTCTGAAAAGTGATGGATTTGCAAATAGAAACTTTATGCAGCTTATACATGATGACTCTTTGACGTTCAAGGAAGACATCCAGAAGGCACAGGTATCCGGCCAAGGGGATAGCCTCCATGAACACATAGCCAACCTGGCCGGCTCACCAGCTATTAAAAAGGGAATATTGCAAACCGTTAAGGTTGTTGACGAACTCGTTAAGGTTATGGGCCGACACAAACCAGAGAATATCGTGATTGAGATGGCTAGGGAGAATCAGACCACTCAAAAAGGTCAGAAAAATTCTCGCGAAAGGATGAAGCGAATTGAAGAGGGAATCAAAGAACTTGGCTCTCAAATTTTGAAAGAGCACCCGGTAGAAAACACTCAGCTGCAGAATGAAAAGCTGTATCTGTATTATCTGCAGAATGGTCGAGATATGTACGTTGATCAGGAGCTGGATATCAATAGGCTCAGTGACTACGATGTCGACCACATCGTTCCTCAATCTTTCCTGAAAGATGACTCTATCGACAACAAAGTGTTGACGCGATCAGATAAGAACCGGGGAAAATCCGACAATGTACCCTCAGAAGAAGTTGTCAAGAAGATGAAAAACTATTGGAGACAATTGCTGAACGCCAAGCTCATAACACAACGCAAGTTCGATAACTTGACGAAAGCCGAAAGAGGTGGGTTGTCAGAATTGGACAAAGCTGGCTTTATTAAGCGCCAATTGGTGGAGACCCGGCAGATTACGAAACACGTAGCACAAATTTTGGATTCACGAATGAATACCAAATACGACGAAAACGACAAATTGATACGCGAGGTGAAAGTGATTACGCTTAAGAGTAAGTTGGTTTCCGATTTCAGGAAGGATTTTCAGTTTTACAAAGTAAGAGAAATAAACAACTACCACCACGCCCATGATGCTTACCTCAACGCGGTAGTTGGCACAGCTCTTATCAAAAAATATCCAAAGCTGGAAAGCGAGTTCGTTTACGGTGACTATAAAGTATACGACGTTCGGAAGATGATAGCCAAATCAGAGCAGGAAATTGGGAAGGCAACCGCAAAATACTTCTTCTATTCAAACATCATGAACTTCTTTAAGACGGAGATTACGCTCGCGAACGGCGAAATACGCAAGAGGCCCCTCATAGAGACTAACGGCGAAACCGGGGAGATCGTATGGGACAAAGGACGGGACTTTGCGACCGTTAGAAAAGTACTTTCAATGCCACAAGTGAATATTGTTAAAAAGACAGAAGTACAAACAGGGGGGTTCAGTAAGGAATCCATTTTGCCCAAGCGGAACAGTGATAAATTGATAGCAAGGAAAAAAGATTGGGACCCTAAGAAGTACGGTGGTTTCGACTCTCCTACCGTTGCATATTCAGTCCTTGTAGTTGCGAAAGTGGAAAAGGGGAAAAGTAAGAAGCTTAAGAGTGTTAAAGAGCTTCTGGGCATAACCATAATGGAACGGTCTAGCTTCGAGAAAAATCCAATTGACTTTCTCGAGGCTAAAGGTTACAAGGAGGTAAAAAAGGACCTGATAATTAAACTCCCAAAGTACAGTCTCTTCGAGTTGGAGAATGGGAGGAAGAGAATGTTGGCATCTGCAGGGGAGCTCCAAAAGGGGAACGAGCTGGCTCTGCCTTCAAAATACGTGAACTTTCTGTACCTGGCCAGCCACTACGAGAAACTCAAGGGTTCTCCTGAGGATAACGAGCAGAAACAGCTGTTTGTAGAGCAGCACAAGCATTACCTGGACGAGATAATTGAGCAAATTAGTGAGTTCTCAAAAAGAGTAATCCTTGCAGACGCGAATCTGGATAAAGTTCTTTCCGCCTATAATAAGCACCGGGACAAGCCTATACGAGAACAAGCCGAGAACATCATTCACCTCTTTACCCTTACTAATCTGGGCGCGCCGGCCGCCTTCAAATACTTCGACACCACGATAGACAGGAAAAGGTATACGAGTACCAAAGAAGTACTTGACGCCACTCTCATCCACCAGTCTATAACAGGGTTGTACGAAACGAGGATAGATTTGTCCCAGCTCGGCGGCGACTCAGGAGGGTCAGGCGGCTCCGGTGGATCAACGAATCTTTCCGACATAATCGAGAAAGAAACCGGCAAACAGTTGGTGATCCAAGAATCAATCCTGATGCTGCCTGAAGAAGTAGAAGAGGTGATTGGCAACAAACCTGAGTCTGACATTCTTGTCCACACCGCGTATGACGAGAGCACGGACGAGAACGTTATGCTTCTCACTAGCGACGCCCCTGAGTATAAACCATGGGCGCTGGTCATCCAAGATTCCAATGGGGAAAACAAGATTAAGATGCTTAGTGGTGGGTCTGGAGGGAGCGGTGGGTCCACGAACCTCAGCGACATTATTGAAAAAGAGACTGGTAAACAACTTGTAATACAAGAGTCTATTCTGATGTTGCCTGAAGAGGTGGAGGAGGTGATTGGGAACAAACCGGAGTCTGATATACTTGTTCATACCGCCTATGACGAATCTACTGATGAGAATGTGATGCTTTTaACGTCAGACGCTCCCGAGTACAAACCCTGGGCTCTGGTGATTCAGGACAGCAATGGTGAGAATAAGATTAAAATGTTGAGTGGGGGCTCAAAGCGCACGGCTGACGGTAGCGAATTTGAGAGCCCCAAAAAAAAACGAAAGGTCGAAtaa
BE4コドン最適化2核酸配列:
ATGAGCAGCGAGACAGGCCCTGTGGCTGTGGATCCTACACTGCGGAGAAGAATCGAGCCCCACGAGTTCGAGGTGTTCTTCGACCCCAGAGAGCTGCGGAAAGAGACATGCCTGCTGTACGAGATCAACTGGGGCGGCAGACACTCTATCTGGCGGCACACAAGCCAGAACACCAACAAGCACGTGGAAGTGAACTTTATCGAGAAGTTTACGACCGAGCGGTACTTCTGCCCCAACACCAGATGCAGCATCACCTGGTTTCTGAGCTGGTCCCCTTGCGGCGAGTGCAGCAGAGCCATCACCGAGTTTCTGTCCAGATATCCCCACGTGACCCTGTTCATCTATATCGCCCGGCTGTACCACCACGCCGATCCTAGAAATAGACAGGGACTGCGCGACCTGATCAGCAGCGGAGTGACCATCCAGATCATGACCGAGCAAGAGAGCGGCTACTGCTGGCGGAACTTCGTGAACTACAGCCCCAGCAACGAAGCCCACTGGCCTAGATATCCTCACCTGTGGGTCCGACTGTACGTGCTGGAACTGTACTGCATCATCCTGGGCCTGCCTCCATGCCTGAACATCCTGAGAAGAAAGCAGCCTCAGCTGACCTTCTTCACAATCGCCCTGCAGAGCTGCCACTACCAGAGACTGCCTCCACACATCCTGTGGGCCACCGGACTTAAGAGCGGAGGATCTAGCGGCGGCTCTAGCGGATCTGAGACACCTGGCACAAGCGAGTCTGCCACACCTGAGAGTAGCGGCGGATCTTCTGGCGGCTCCGACAAGAAGTACTCTATCGGACTGGCCATCGGCACCAACTCTGTTGGATGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGGTGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAATCTGATCGGCGCCCTGCTGTTCGACTCTGGCGAAACAGCCGAAGCCACCAGACTGAAGAGAACCGCCAGGCGGAGATACACCCGGCGGAAGAACCGGATCTGCTACCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGACAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGATGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGAGACTGATCTACCTGGCTCTGGCCCACATGATCAAGTTCCGGGGCCACTTTCTGATCGAGGGCGATCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCTCTGGCGTGGACGCCAAGGCTATCCTGTCTGCCAGACTGAGCAAGAGCAGAAGGCTGGAAAACCTGATCGCCCAGCTGCCTGGCGAGAAGAAGAATGGCCTGTTCGGCAACCTGATTGCCCTGAGCCTGGGACTGACCCCTAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAGCAAGGACACCTACGACGACGACCTGGACAATCTGCTGGCCCAGATCGGCGATCAGTACGCCGACTTGTTTCTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGATATCCTGAGAGTGAACACCGAGATCACAAAGGCCCCTCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGATCTGACCCTGCTGAAGGCCCTCGTTAGACAGCAGCTGCCAGAGAAGTACAAAGAGATTTTCTTCGATCAGTCCAAGAACGGCTACGCCGGCTACATTGATGGCGGAGCCAGCCAAGAGGAATTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGGACGGCACCGAGGAACTGCTGGTCAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAATGGCTCTATCCCTCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGAGACAAGAGGACTTTTACCCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCAGGATCCCCTACTACGTGGGACCACTGGCCAGAGGCAATAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACACCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCCAGCGCTCAGTCCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCTAACGAGAAGGTGCTGCCCAAGCACTCCCTGCTGTATGAGTACTTCACCGTGTACAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTTCTGAGCGGCGAGCAGAAAAAGGCCATTGTGGATCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACAGCGTGGAAATCAGCGGCGTGGAAGATCGGTTCAATGCCAGCCTGGGCACATACCACGACCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAACGAAGAGAACGAGGACATTCTCGAGGACATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACATACGCCCACCTGTTCGACGACAAAGTGATGAAGCAACTGAAGCGGAGGCGGTACACAGGCTGGGGCAGACTGTCTCGGAAGCTGATCAACGGCATCCGGGATAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAAGCCCAGGTGTCCGGCCAAGGCGATTCTCTGCACGAGCACATTGCCAACCTGGCCGGATCTCCCGCCATTAAGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTTGTGAAAGTGATGGGCAGACACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACACAGAAGGGCCAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGACGGGATATGTACGTGGACCAAGAGCTGGACATCAACCGGCTGAGCGACTACGATGTGGACCATATCGTGCCCCAGAGCTTTCTGAAGGACGACTCCATCGATAACAAGGTCCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGATAACGTGCCCTCCGAAGAGGTGGTCAAGAAGATGAAGAACTACTGGCGACAGCTGCTGAACGCCAAGCTGATTACCCAGCGGAAGTTCGATAACCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTTGATAAGGCCGGCTTCATTAAGCGGCAGCTGGTGGAAACCCGGCAGATCACCAAACACGTGGCACAGATTCTGGACTCCCGGATGAACACTAAGTACGACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTCATCACCCTGAAGTCTAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTCTACAAAGTGCGGGAAATCAACAACTACCATCACGCCCACGACGCCTACCTGAATGCCGTTGTTGGAACAGCCCTGATCAAGAAGTATCCCAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAACAAGAGATCGGCAAGGCTACCGCCAAGTACTTTTTCTACAGCAACATCATGAACTTTTTCAAGACAGAGATCACCCTGGCCAACGGCGAGATCCGGAAAAGACCCCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCAGAGATTTTGCCACAGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAGAAAACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCTAAGCGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAGTACGGCGGCTTCGATAGCCCTACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAAAAGCTCAAGAGCGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTTGAGAAGAACCCGATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTCAAGAAGGACCTCATCATCAAGCTCCCCAAGTACAGCCTGTTCGAGCTGGAAAATGGCCGGAAGCGGATGCTGGCCTCAGCAGGCGAACTGCAGAAAGGCAATGAACTGGCCCTGCCTAGCAAATACGTCAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCAGCCCCGAGGACAATGAGCAAAAGCAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAACCTGGATAAGGTGCTGTCTGCCTATAACAAGCACCGGGACAAGCCTATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAACCTGGGAGCCCCTGCCGCCTTCAAGTACTTCGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAAGAGGTGCTGGACGCCACACTGATCCACCAGTCTATCACCGGCCTGTACGAAACCCGGATCGACCTGTCTCAGCTCGGCGGCGATTCTGGTGGTTCTGGCGGAAGTGGCGGATCCACCAATCTGAGCGACATCATCGAAAAAGAGACAGGCAAGCAGCTCGTGATCCAAGAATCCATCCTGATGCTGCCTGAAGAGGTTGAGGAAGTGATCGGCAACAAGCCTGAGTCCGACATCCTGGTGCACACCGCCTACGATGAGAGCACCGATGAGAACGTCATGCTGCTGACAAGCGACGCCCCTGAGTACAAGCCTTGGGCTCTCGTGATTCAGGACAGCAATGGGGAGAACAAGATCAAGATGCTGAGCGGAGGTAGCGGAGGCAGTGGCGGAAGCACAAACCTGTCTGATATCATTGAAAAAGAAACCGGGAAGCAACTGGTCATTCAAGAGTCCATTCTCATGCTCCCGGAAGAAGTCGAGGAAGTCATTGGAAACAAACCCGAGAGCGATATTCTGGTCCACACAGCCTATGACGAGTCTACAGACGAAAACGTGATGCTCCTGACCTCTGACGCTCCCGAGTATAAGCCCTGGGCACTTGTTATCCAGGACTCTAACGGGGAAAACAAAATCAAAATGTTGTCCGGCGGCAGCAAGCGGACAGCCGATGGATCTGAGTTCGAGAGCCCCAAGAAGAAACGGAAGGTgGAGtaa
「塩基編集活性」とは、ポリヌクレオチド内の塩基を化学的に変化させるように作用することを意味する。一実施形態では、第1の塩基を、第2の塩基に変換する。一実施形態では、塩基編集活性とは、シチジンデアミナーゼ活性、例えば、標的C・GからT・Aへの変換である。別の実施形態では、塩基編集活性は、アデノシンまたはアデニンデアミナーゼ活性、例えば、A・TからG・Cへの変換である。別の実施形態では、塩基編集活性とは、シチジンデアミナーゼ活性、例えば、標的C・GからT・Aへの変換、及びアデノシンまたはアデニンデアミナーゼ活性、例えば、A・TからG・Cへの変換である。
用語「塩基編集系」とは、標的ヌクレオチド配列の核酸塩基を編集するための系を指す。様々な実施形態において、塩基編集(BE)系は、(1)標的ヌクレオチド配列中の核酸塩基を脱アミノ化するための、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン、デアミナーゼドメイン及びシチジンデアミナーゼドメイン;ならびに(2)ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインと組み合わせた1つ以上のガイドポリヌクレオチド(例えば、ガイドRNA)を含む。様々な実施形態において、塩基編集(BE)系は、アデノシンデアミナーゼまたはシチジンデアミナーゼから選択される核酸塩基編集体ドメイン、及び核酸配列特異的結合活性を有するドメインを含む。いくつかの実施形態では、塩基編集系は、(1)標的ヌクレオチド配列中の1つ以上の核酸塩基を脱アミノ化するための、ポリヌクレオチドプログラム可能なDNA結合ドメイン及びデアミナーゼドメインを含む塩基編集体(BE);ならびに(2)ポリヌクレオチドでプログラム可能なDNA結合ドメインと組み合わせた1つ以上のガイドRNAを含む。いくつかの実施形態では、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、ポリヌクレオチドプログラム可能なDNA結合ドメインである。いくつかの実施形態では、塩基編集体は、シチジン塩基編集体(CBE)である。いくつかの実施形態では、塩基編集体は、アデニンまたはアデノシン塩基編集体(ABE)である。いくつかの実施形態では、塩基編集体は、アデニンもしくはアデノシン塩基編集体(ABE)またはシチジン塩基編集体(CBE)である。
用語「Cas9」または「Cas9ドメイン」とは、Cas9タンパク質またはその断片(例えば、Cas9及び/またはCas9のgRNA結合ドメインの活性、不活性、または部分的に活性なDNA切断ドメインを含むタンパク質)を含むRNAガイドヌクレアーゼを指す。Cas9ヌクレアーゼは、casnlヌクレアーゼまたはCRISPR (clustered regularly interspaced short palindromic repeat)関連ヌクレアーゼと呼ばれることもある。例示的なCas9は、Streptococcus pyogenes Cas9 (spCas9)であり、そのアミノ酸配列を以下に示す:
Figure 2022532139000002
用語「保存的アミノ酸置換」または「保存的変異」とは、あるアミノ酸を、共通の特性を有する別のアミノ酸に置き換えることを指す。個々のアミノ酸間の共通の特性を定義する機能的な方法は、相同生物の対応するタンパク質間のアミノ酸変化の正規化された頻度を分析することである(Schulz,G.E.and Schirmer,R.H., Principles of Protein Structure,Springer-Verlag,New York (1979))。そのような分析によれば、アミノ酸のグループは、グループ内のアミノ酸が互いに優先的に交換される場合に定義することができ、したがって、全体的なタンパク質構造への影響が互いに最も類似している(Schulz,G.E.and Schirmer,R.H., 上記)。保存的変異の非限定的な例として、アミノ酸置換、例えば、正電荷を維持することができるような、アルギニンからリジンへのアミノ酸置換、及びその逆;負電荷を維持することができるように、アスパラギン酸からグルタミン酸へ、及びその逆;遊離-OHを維持できるように、スレオニンからセリンへ;ならびに遊離の-NH2を維持できるような、アスパラギンからグルタミンへの置換が挙げられる。
本明細書中で互換的に使用する用語「コード配列」または「タンパク質コード配列」とは、タンパク質をコードするポリヌクレオチドのセグメントを指す。領域または配列は、開始コドンによって5’末端の近位に、そして終止コドンによって3’末端の近位に境界付けられている。本明細書に記載の塩基編集体で有用な終止コドンとして、以下が挙げられる:
Figure 2022532139000003
コード配列は、オープンリーディングフレームとも呼ばれ得る。
「シチジンデアミナーゼ」とは、アミノ基をカルボニル基に変換する脱アミノ化反応を触媒することができるポリペプチドまたはその断片を意味する。一実施形態では、シチジンデアミナーゼは、シトシンをウラシルに、または5-メチルシトシンをチミンに変換する。Petromyzon marinus (Petromyzon marinusシトシンデアミナーゼ1、「PmCDA1」)に由来するPmCDA1、哺乳類(例えば、ヒト、ブタ、ウシ、ウマ、サルなど)に由来するAID (活性化誘導シチジンデアミナーゼ;AICDA)、及びAPOBECは例示的なシチジンデアミナーゼである。
本明細書中で使用する用語「デアミナーゼ」または「デアミナーゼドメイン」とは、脱アミノ化反応を触媒するタンパク質または酵素を指す。いくつかの実施形態では、デアミナーゼまたはデアミナーゼドメインは、シチジンまたはデオキシシチジンから、それぞれ、ウリジンまたはデオキシウリジンへの加水分解的脱アミノ化を触媒するシチジンデアミナーゼである。いくつかの実施形態では、デアミナーゼまたはデアミナーゼドメインは、シトシンからウラシルへの加水分解的脱アミノ化を触媒するシトシンデアミナーゼである。いくつかの実施形態では、デアミナーゼは、アデニンからヒポキサンチンへの加水分解的脱アミノ化を触媒するアデノシンデアミナーゼである。いくつかの実施形態では、デアミナーゼは、アデノシンまたはアデニン(A)からイノシン(I)への加水分解的脱アミノ化を触媒するアデノシンデアミナーゼである。いくつかの実施形態では、デアミナーゼまたはデアミナーゼドメインは、アデノシンまたはデオキシアデノシンから、それぞれ、イノシンまたはデオキシイノシンへの加水分解的脱アミノ化を触媒するアデノシンデアミナーゼである。いくつかの実施形態では、アデノシンデアミナーゼは、デオキシリボ核酸(DNA)中のアデノシンの加水分解的な脱アミノ化を触媒する。本明細書中で提供するアデノシンデアミナーゼ(例えば、改変されたアデノシンデアミナーゼ、進化されたアデノシンデアミナーゼ)は、細菌などの任意の生物に由来し得る。いくつかの実施形態では、アデノシンデアミナーゼは、E. coli、S. aureus、S. typhi、S. putrefaciens、H. influenzae、またはC. crescentusなどの細菌に由来する。いくつかの実施形態では、アデノシンデアミナーゼは、TadAデアミナーゼである。いくつかの実施形態では、デアミナーゼまたはデアミナーゼドメインは、ヒト、チンパンジー、ゴリラ、サル、ウシ、イヌ、ラット、またはマウスなどの生物に由来する天然デアミナーゼのバリアントである。いくつかの実施形態では、デアミナーゼまたはデアミナーゼドメインは、自然界には存在しない。例えば、いくつかの実施形態では、デアミナーゼまたはデアミナーゼドメインは、天然デアミナーゼと、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、少なくとも99.1%、少なくとも99.2%、少なくとも99.3%、少なくとも99.4%、少なくとも99.5%、少なくとも99.6%、少なくとも99.7%、少なくとも99.8%、または少なくとも99.9%の同一性である。
「検出」とは、検出される分析物の存在、不在、または量を同定することを指す。一実施形態では、ポリヌクレオチドまたはポリペプチドの配列の変化を検出する。別の実施形態では、インデルの存在を検出する。
「検出可能な標識」とは、目的の分子に連結した場合に、分光学的、光化学的、生化学的、免疫化学的、または化学的手段を介して、目的の分子を検出可能にする組成物を意味する。例えば、有用な標識として、放射性同位元素、磁気ビーズ、金属ビーズ、コロイド粒子、蛍光色素、高電子密度試薬、酵素(例えば、酵素結合免疫吸着測定法(ELISA)で一般的に使用される酵素)、ビオチン、ジゴキシゲニン、またはハプテンが挙げられる。
「疾患」とは、細胞、組織、または臓器の正常な機能を損傷または妨害する病態または障害を意味する。疾患の例として、HBV感染症、ならびに肝硬変、肝細胞癌(HCC)、及びHBV感染症に関連するか、またはHBV感染症に起因する他の疾患を含む関連する疾患及び障害が挙げられる。
「有効量」とは、未処置の患者と比較した、疾患の症状を寛解するのに必要とされる量を意味する。疾患の治療的処置のために、本発明を実施するために使用する活性化合物(複数可)の有効量は、投与様式、対象の年齢、体重、及び一般的健康によって異なる。最終的には、担当医師または獣医が、適切な量及び投薬レジメンを決定するだろう。そのような量は、「有効」量と呼ばれる。一実施形態では、有効量は、細胞(例えば、in vitroまたはin vivoの細胞)内のHBVゲノムに変化を導入するのに十分な本発明の塩基編集体の量である。一実施形態では、有効量は、治療効果を達成するために(例えば、HBV感染症を低減または制御するために)必要とされる塩基編集体の量である。そのような治療効果は、対象、組織または器官のすべての細胞内のHBVゲノムを変化させるのに十分である必要はなく、対象、組織または器官に存在する約1%、5%、10%、25%、50%、75%またはそれ以上の細胞内のHBVゲノムを変化させるのに十分であればよい。一実施形態では、有効量は、HBVの1つ以上の症状を改善するのに十分である。
いくつかの実施形態では、本明細書に提供する融合タンパク質、例えば、nCas9ドメイン及びデアミナーゼドメイン(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ)を含む核酸塩基編集体の有効量とは、本明細書に記載の核酸塩基編集体が特異的に結合し、編集する標的部位の編集を誘導するのに十分な量を指す。当業者であれば理解するように、薬剤、例えば、融合タンパク質の有効量は、例えば、所望の生物学的応答、例えば、編集しようとする特定のゲノムまたは標的部位、標的とする細胞または組織、及び/または使用する薬剤などの様々な要因に応じて変化し得る。
いくつかの実施形態では、本明細書に提供する融合タンパク質、例えば、nCas9ドメイン及びデアミナーゼドメインを含む融合タンパク質の有効量は、融合タンパク質が特異的に結合し、編集する標的部位の編集を誘導するのに十分な融合タンパク質の量を指し得る。当業者であれば理解するように、薬剤、例えば、融合タンパク質の有効量は、例えば、所望の生物学的応答、例えば、編集しようとする特定のゲノムまたは標的部位、標的とする細胞または組織、及び/または使用する薬剤などの様々な要因に応じて変化し得る。
「断片」とは、ポリペプチドまたは核酸分子の一部分を意味する。この部分は、好ましくは、参照核酸分子またはポリペプチドの全長の少なくとも10%、20%、30%、40%、50%、60%、70%、80%、または90%を含有する。断片は、10、20、30、40、50、60、70、80、90、または100、200、300、400、500、600、700、800、900、または1000ヌクレオチドまたはアミノ酸を含有し得る。
「ガイドRNA」または「gRNA」とは、標的配列に特異的であり、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインタンパク質(例えば、Cas9またはCpf1)と複合体を形成することができるポリヌクレオチドを意味する。一実施形態では、ガイドポリヌクレオチドはガイドRNA (gRNA)である。gRNAは、2つ以上のRNAの複合体として、または単一のRNA分子として存在し得る。単一のRNA分子として存在するgRNAは、単一のガイドRNA (sgRNA)と呼ばれる場合があるが、「gRNA」は、単一分子として、または2つ以上の分子の複合体として存在するガイドRNAを指すために交換可能に使用される。通常、単一のRNA種として存在するgRNAは、2つのドメイン: (1)標的核酸と相同性を共有するドメイン(例えば、Cas9複合体の標的への結合を誘導するドメイン)、及び(2)Cas9タンパク質に結合するドメインを含む。いくつかの実施形態では、ドメイン(2)は、tracrRNAとして知られる配列に対応し、ステムループ構造を含む。例えば、いくつかの実施形態では、ドメイン(2)は、Jinek et al., Science 337:816-821 (2012)に記載されているように、tracrRNAと同一または相同であり、その全内容は、参照により本明細書に援用される。gRNAの他の例(例えば、ドメイン2を含むもの)は、「Switchable Cas9 Nucleases and Uses Thereof」と題されたUS20160208288、及び「Delivery System For Functional Nucleases」と題されたUS9,737,604に見出すことができ、それぞれの全内容は、全体が参照により本明細書に援用される。いくつかの実施形態では、gRNAは、2つ以上のドメイン(1)及び(2)を含み、「拡張gRNA」と呼ばれ得る。拡張gRNAは、本明細書に記載するように、2つ以上のCas9タンパク質に結合し、2つ以上の異なる領域で標的核酸に結合する。gRNAは、標的部位に相補的なヌクレオチド配列を含み、この配列は、標的部位へのヌクレアーゼ/RNA複合体の結合を媒介し、ヌクレアーゼ:RNA複合体の配列特異性を提供する。
「HBVポリメラーゼタンパク質」とは、B型肝炎ウイルス感染症において機能する野生型HBVポリメラーゼアミノ酸配列またはその断片に対して少なくとも約95%の同一性を有するポリペプチドを意味する。一実施形態では、HBVポリメラーゼは、HBV A、B、C、D、E、F、G、またはH遺伝子型によってコードされる。一実施形態では、HBVポリメラーゼアミノ酸配列は、UniPro登録番号Q8B5R0-1で提供され、その配列を以下に示す。
Figure 2022532139000004
HBVポリメラーゼ内の変異として、E24G、L25F、P26F、R27C、V48A、V48I、S382F、V378I、V378A、V379I、V379A、L377F、D380G、D380N、F381P、R376G、A422T、F423P、A432V、M433V、P434S、D540G、A688V、D689G、A717T、E718K、P713S、P713L、またはL719Pが挙げられる。
他の例示的なHBV DNAポリメラーゼとして、例えば、以下の配列を有するNCBI登録番号AAB59972.1が挙げられる。
MPLSYQHFRKLLLLDDEAGPLEEELPRLADEGLNRRVAEDLNLG
NLNVSIPWTHKVGNFTGLYSSTVPVFNPHWKTPSFPNIHLHQDIIKKCEQFVGPLTVN
EKRRLQLIMPARFYPKVTKYLPLDKGIKPYYPEHLVNHYFQTRHYLHTLWKAGILYKR
ETTHSASFCGSPYSWEQDLQHGAESFHQQSSGILSRPPVGSSLQSKHSKSRLGLQSQQ
GHLARRQQGRSWSIRAGFHPTARRPFGVEPSGSGHTTNFASKSASCLHQSPDRKAAYP
AVSTFEKHSSSGHAVEFHNLSPNSARSQSERPVFPCWWLQFRSSKPCSDYCLSLIVNL
LEDWGPCAEHGEHHIRIPRTPSRVTGGVFLVDKNPHNTAESRLVVDFSQFSRGNYRVS
WPKFAVPNLQSLTNLLSSNLSWLSLDVSAAFYHLPLHPAAMPHLLVGSSGLSRYVARL
SSNSRILNHQHGTMPNLHDYCSRNLYVSLLLLYQTFGRKLHLYSHPIILGFRKIPMGV
GLSPFLLAQFTSAICSVVRRAFPHCLAFSYMDDVVLGAKSVQHLESLFTAVTNFLLSL
GIHLNPNKTKRWGYSLNFMGYVIGSYGSLPQEHIIQKIKECFRKLPINRPIDWKVCQR
IVGLLGFAAPFTQCGYPALMPLYACIQSKQAFTFSPTYKAFLCKQYLNLYPVARQRPG
LCQVFADATPTGWGLVMGHQRVRGTFSAPLPIHTAELLAACFARSRSGANIIGTDNSV
VLSRKYTSYPWLLGCAANWILRGTSFVYVPSALNPADDPSRGRLGLSRPLLRLPFRPT
TGRTSLYADSPSVPSHLPDRVHFASPLHVAWRPP
「HBVポリメラーゼ遺伝子」とは、HBVポリメラーゼをコードするポリヌクレオチドを意味する。
「B型肝炎表面抗原(HBsAg)ポリペプチド」とは、HBVウイルス感染症において機能する、NCBI登録番号AAB59969.1に対して少なくとも約85%の同一性を有する抗原性タンパク質またはその断片を意味する。例示的なHBsAgアミノ酸配列を以下に示す:
MENITSGFLGPLLVLQAGFFLLTRILTIPQSLDSWWTSLNFLGGTTVCLGQNSQSPTSNHSPTSCPPTCPGYRWMCLRRFIIFLFILLLCLIFLLVLLDYQGMLPVCPLIPGSSTTSTGPCRTCMTTAQGTSMYPSCCCTKPSDGNCTCIPIPSSWAFGKFLWEWASARFSWLSLLVPFVQWF
「HbsAgポリヌクレオチド」とは、HBsAgタンパク質をコードするポリヌクレオチドを意味する。
「HBV Xタンパク質」とは、HBVウイルス感染症において機能する、NCBI登録番号AAB59970.1に対して少なくとも約85%の同一性を有するポリペプチドまたはその断片を意味する。例示的なアミノ酸配列を以下に示す:
1 maarlccqld pardvlclrp vgaescgrpf sgslgtlssp spsavptdhg ahlslrglpv
61 cafssagpca lrftsarrme ttvnahrmlp kvlhkrtlgl samsttdlea yfkdclfkdw
121 eelgeeirlk vfvlggcrhk lvcapapcnf ftsa
「コア抗原前駆体」とは、HBVウイルス感染症において機能する、NCBI登録番号AAB59971.1に対して少なくとも約85%の同一性を有するポリペプチドまたはその断片を意味する。
「HBVコアタンパク質」とは、野生型HBVコアタンパク質のアミノ酸配列またはその断片に対して少なくとも約95%の同一性を有するポリペプチドを意味する。一実施形態では、HBVコアタンパク質は、B型肝炎ウイルス感染症において機能する。一実施形態では、HBVコアタンパク質は、HBV A、B、C、D、E、F、G、またはH遺伝子型によってコードされる。一実施形態では、HBVコアタンパク質のアミノ酸配列は、以下に示すNCBI GenBank登録番号AXG50928.1で提供される:
1 mdidpykefg asvellsflp sdffpsirdl ldtasalyre alespehcsp hhtalrqail
61 cwgelmnlat wvgsnledpa srelvvsyvn vnmglkirql lwfhiscltf gretvleylv
121 sfgvwirtpp ayrppnapil stlpettvvr rrgrsprrrt psprrrrsqs prrrrsqsre
181 sqc
「HBV Xタンパク質」とは、HBV Xタンパク質をコードするポリヌクレオチドを意味する。
「HBV Xタンパク質(遺伝子型B)」とは、野生型HBV遺伝子型B Xタンパク質のアミノ酸配列またはその断片に対して少なくとも約95%の同一性を有するポリペプチドを意味する。一実施形態では、HBV Xタンパク質は、B型肝炎ウイルス感染症において機能する。一実施形態では、HBV遺伝子型B Xタンパク質のアミノ酸配列は、以下に示すNCBI GenBank登録番号BAQ95575.1で提供される:
1 maarlccqld pardvlclrp vgaesrgrpl pgplgalppa sppvvpsdhg ahlslrglpv
61 cafssagpca lrftsarrme ttvnahrmlp kvlhkrtlgl samsttdlea yfkdclfkdw
121 eelgeeirlk vfvlggcrhk lvcapapcnf ftsa
「HBV Xタンパク質(遺伝子型C)」とは、野生型HBV遺伝子型C Xタンパク質のアミノ酸配列またはその断片に対して少なくとも約95%の同一性を有するポリペプチドを意味する。一実施形態では、HBV Xタンパク質は、B型肝炎ウイルス感染症において機能する。一実施形態では、HBV遺伝子型C Xタンパク質のアミノ酸配列は、以下に示すNCBI GenBank登録番号BAQ95563.1で提供される:
1 maarvccqld pardvlclrp vgaesrgrpv sgpfgplpsp sssavpadyg ahlslrglpv
61 cafssagpca lrftsarrme ttvnahrmlp kvlhkrtlgl samsttdlea yfkdclfkdw
121 eelgeeirlk vfvlggcrhk lvcapapcnf ftsa
「HBV Sタンパク質」とは、野生型HBV Sタンパク質のアミノ酸配列またはその断片に対して少なくとも約95%の同一性を有するポリペプチドを意味する。一実施形態では、HBV Sタンパク質は、B型肝炎ウイルス感染症において機能する。一実施形態では、HBV Sタンパク質は、HBV A、B、C、D、E、F、G、またはH遺伝子型によってコードされる。一実施形態では、HBV Sタンパク質のアミノ酸配列は、以下に示すNCBI GenBank登録番号ABV02793.1で提供される:
1 menttsgflg pllvlqagff lltrnltipq sldswwtsln flggaptcpg qnsqsptsnh
61 sptscppicp gyrwmclrrf iiflfilllc lifllvlldy qgmlpvcpll pgtsttstgp
121 cktctipaqg tsmfpsccct kpsdgnctci pipsswafar flwewasvrf swlsllvpfv
181 qwfvglsptv wlsviwmmwy wgpslynils pflpllpiff clwvyi
B型肝炎ウイルスサブタイプaywの完全なゲノム、HBVポリメラーゼ、HBsAgタンパク質、HBV Xタンパク質、及びコア抗原前駆体をコードするポリヌクレオチドを含む完全なゲノムは、GenBank登録番号U95551.1で提供され、その配列を以下に示す:
1 aattccacaa cctttcacca aactctgcaa gatcccagag tgagaggcct gtatttccct
61 gctggtggct ccagttcagg agcagtaaac cctgttccga ctactgcctc tcccttatcg
121 tcaatcttct cgaggattgg ggaccctgcg ctgaacatgg agaacatcac atcaggattc
181 ctaggacccc ttctcgtgtt acaggcgggg tttttcttgt tgacaagaat cctcacaata
241 ccgcagagtc tagactcgtg gtggacttct ctcaattttc tagggggaac taccgtgtgt
301 cttggccaaa attcgcagtc cccaacctcc aatcactcac caacctcctg tcctccaact
361 tgtcctggtt atcgctggat gtgtctgcgg cgttttatca tcttcctctt catcctgctg
421 ctatgcctca tcttcttgtt ggttcttctg gactatcaag gtatgttgcc cgtttgtcct
481 ctaattccag gatcctcaac caccagcacg ggaccatgcc gaacctgcat gactactgct
541 caaggaacct ctatgtatcc ctcctgttgc tgtaccaaac cttcggacgg aaattgcacc
601 tgtattccca tcccatcatc ctgggctttc ggaaaattcc tatgggagtg ggcctcagcc
661 cgtttctcct ggctcagttt actagtgcca tttgttcagt ggttcgtagg gctttccccc
721 actgtttggc tttcagttat atggatgatg tggtattggg ggccaagtct gtacagcatc
781 ttgagtccct ttttaccgct gttaccaatt ttcttttgtc tttgggtata catttaaacc
841 ctaacaaaac aaagagatgg ggttactctc tgaattttat gggttatgtc attggaagtt
901 atgggtcctt gccacaagaa cacatcatac aaaaaatcaa agaatgtttt agaaaacttc
961 ctattaacag gcctattgat tggaaagtat gtcaacgaat tgtgggtctt ttgggttttg
1021 ctgccccatt tacacaatgt ggttatcctg cgttaatgcc cttgtatgca tgtattcaat
1081 ctaagcaggc tttcactttc tcgccaactt acaaggcctt tctgtgtaaa caatacctga
1141 acctttaccc cgttgcccgg caacggccag gtctgtgcca agtgtttgct gacgcaaccc
1201 ccactggctg gggcttggtc atgggccatc agcgcgtgcg tggaaccttt tcggctcctc
1261 tgccgatcca tactgcggaa ctcctagccg cttgttttgc tcgcagcagg tctggagcaa
1321 acattatcgg gactgataac tctgttgtcc tctcccgcaa atatacatcg tatccatggc
1381 tgctaggctg tgctgccaac tggatcctgc gcgggacgtc ctttgtttac gtcccgtcgg
1441 cgctgaatcc tgcggacgac ccttctcggg gtcgcttggg actctctcgt ccccttctcc
1501 gtctgccgtt ccgaccgacc acggggcgca cctctcttta cgcggactcc ccgtctgtgc
1561 cttctcatct gccggaccgt gtgcacttcg cttcacctct gcacgtcgca tggagaccac
1621 cgtgaacgcc caccgaatgt tgcccaaggt cttacataag aggactcttg gactctctgc
1681 aatgtcaacg accgaccttg aggcatactt caaagactgt ttgtttaaag actgggagga
1741 gttgggggag gagattagat taaaggtctt tgtactagga ggctgtaggc ataaattggt
1801 ctgcgcacca gcaccatgca actttttcac ctctgcctaa tcatctcttg ttcatgtcct
1861 actgttcaag cctccaagct gtgccttggg tggctttggg gcatggacat cgacccttat
1921 aaagaatttg gagctactgt ggagttactc tcgtttttgc cttctgactt ctttccttca
1981 gtacgagatc ttctagatac cgcctcagct ctgtatcggg aagccttaga gtctcctgag
2041 cattgttcac ctcaccatac tgcactcagg caagcaattc tttgctgggg ggaactaatg
2101 actctagcta cctgggtggg tgttaatttg gaagatccag catctagaga cctagtagtc
2161 agttatgtca acactaatat gggcctaaag ttcaggcaac tcttgtggtt tcacatttct
2221 tgtctcactt ttggaagaga aaccgttata gagtatttgg tgtctttcgg agtgtggatt
2281 cgcactcctc cagcttatag accaccaaat gcccctatcc tatcaacact tccggaaact
2341 actgttgtta gacgacgagg caggtcccct agaagaagaa ctccctcgcc tcgcagacga
2401 aggtctcaat cgccgcgtcg cagaagatct caatctcggg aacctcaatg ttagtattcc
2461 ttggactcat aaggtgggga actttactgg tctttattct tctactgtac ctgtctttaa
2521 tcctcattgg aaaacaccat cttttcctaa tatacattta caccaagaca ttatcaaaaa
2581 atgtgaacag tttgtaggcc cacttacagt taatgagaaa agaagattgc aattgattat
2641 gcctgctagg ttttatccaa aggttaccaa atatttacca ttggataagg gtattaaacc
2701 ttattatcca gaacatctag ttaatcatta cttccaaact agacactatt tacacactct
2761 atggaaggcg ggtatattat ataagagaga aacaacacat agcgcctcat tttgtgggtc
2821 accatattct tgggaacaag atctacagca tggggcagaa tctttccacc agcaatcctc
2881 tgggattctt tcccgaccac cagttggatc cagccttcag agcaaacaca gcaaatccag
2941 attgggactt caatcccaac aaggacacct ggccagacgc caacaaggta ggagctggag
3001 cattcgggct gggtttcacc ccaccgcacg gaggcctttt ggggtggagc cctcaggctc
3061 agggcatact acaaactttg ccagcaaatc cgcctcctgc ctccaccaat cgccagacag
3121 gaaggcagcc taccccgctg tctccacctt tgagaaacac tcatcctcag gccatgcagt
3181 gg
「ヘテロ二量体」とは、野生型TadAドメイン及びTadAドメインのバリアント(例えば、TadA*8)または2つのバリアントTadAドメイン(例えば、TadA*7.10及びTadA*8、または2つのTadA*8ドメイン)などの2つのドメインを含む融合タンパク質を意味する。
「ハイブリダイゼーション」とは水素結合を意味し、それは、相補的な核酸塩基間のワトソン・クリック型、フーグスティーン型、または逆フーグスティーン型の水素結合であってもよい。例えば、アデニンとチミンは、水素結合の形成を通じて対になる相補的な核酸塩基である。
用語「単離された」、「精製された」、または「生物学的に純粋な」とは、天然状態で認められるように通常それに付随する成分から様々な程度にフリーである物質を指す。「単離する」とは、元の供給源または周囲からの分離の程度を示す。「精製する」とは、単離よりも高い分離度を示す。「精製された」または「生物学的に純粋な」タンパク質は、他の物質を十分に含まないため、不純物がタンパク質の生物学的特性に実質的に影響を与えたり、他の悪影響を引き起こしたりすることはない。すなわち、本発明の核酸またはペプチドは、組換えDNA技術によって生成される場合、細胞物質、ウイルス物質、もしくは培養培地を含まず、または化学的に合成される場合、化学前駆体もしくは他の化学物質を実質的に含まない場合に、精製される。純度及び均一性は、通常、分析化学技術、例えば、ポリアクリルアミドゲル電気泳動または高速液体クロマトグラフィーを使用して測定される。用語「精製された」とは、核酸またはタンパク質が電気泳動ゲルにおいて本質的に1つのバンドを生じさせることを示し得る。リン酸化またはグリコシル化などの修飾に供され得るタンパク質の場合、異なる修飾は、別々に精製することができる異なる単離されたタンパク質を生じさせ得る。
「単離されたポリヌクレオチド」とは、本発明の核酸分子が由来する生物の天然ゲノムにおいて、遺伝子に隣接する遺伝子を含まない核酸(例えば、DNA)を意味する。したがって、この用語には、例えば、ベクターに組み込まれる組換えDNA;自律的に複製するプラスミドまたはウイルスに組み込まれる組換えDNA;または原核生物もしくは真核生物のゲノムDNAに組み込まれる組換えDNA;または、他の配列とは独立した別個の分子(例えば、PCRまたは制限エンドヌクレアーゼ消化によって生成されるcDNAまたはゲノム断片もしくはcDNA断片)として存在する組換えDNAが含まれる。さらに、この用語には、DNA分子から転写されるRNA分子、及び追加のポリペプチド配列をコードするハイブリッド遺伝子の一部である組換えDNAが含まれる。
「増加」とは、少なくとも10%、25%、50%、75%、または100%の正の変化を意味する。
用語「塩基修復の阻害因子」、「塩基修復阻害因子」、「IBR」またはそれらの文法上の同等物は、核酸修復酵素、例えば塩基除去修復酵素の活性を阻害することができるタンパク質を指す。いくつかの実施形態では、IBRは、イノシン塩基除去修復の阻害因子である。塩基修復の例示的な阻害因子として、APE1、Endo III、Endo IV、Endo V、Endo VIII、Fpg、hOGG1、hNEIL1、T7 Endol、T4PDG、UDG、hSMUG1、及びhAAGの阻害因子が挙げられる。いくつかの実施形態では、塩基修復阻害因子は、Endo VまたはhAAGの阻害因子である。いくつかの実施形態では、IBRは、Endo VまたはhAAGの阻害因子である。いくつかの実施形態では、IBRは、触媒的に不活性なEndoVまたは触媒的に不活性なhAAGである。いくつかの実施形態では、塩基修復阻害因子は、触媒的に不活性なEndoVまたは触媒的に不活性なhAAGである。いくつかの実施形態では、塩基修復阻害因子は、ウラシルグリコシラーゼ阻害因子(UGI)である。UGIとは、ウラシルDNAグリコシラーゼの塩基除去修復酵素を阻害することができるタンパク質のことである。いくつかの実施形態では、UGIドメインは、野生型UGIまたは野生型UGIの断片を含む。いくつかの実施形態では、本明細書に提供するUGIタンパク質には、UGIの断片、及びUGIまたはUGI断片に相同なタンパク質が含まれる。いくつかの実施形態では、塩基修復阻害因子は、イノシン塩基除去修復の阻害因子である。いくつかの実施形態では、塩基修復阻害因子は、「触媒的に不活性なイノシン特異的ヌクレアーゼ」または「不活性イノシン特異的ヌクレアーゼ」である。特定の理論に拘泥することを望むものではないが、触媒的に不活性なイノシングリコシラーゼ(例えば、アルキルアデニングリコシラーゼ(AAG))はイノシンに結合することができるが、脱塩基部位を作成したりイノシンを除去したりすることはできず、その結果、新たに形成されるイノシン部分は、DNA損傷/修復機構から立体的に遮断される。いくつかの実施形態では、触媒的に不活性なイノシン特異的ヌクレアーゼは、核酸中のイノシンに結合することができるが、核酸を切断しない。非限定的な例示的な触媒的に不活性なイノシン特異的ヌクレアーゼとして、例えば、ヒト由来の触媒的に不活性なアルキルアデノシングリコシラーゼ(AAGヌクレアーゼ)、及び例えば、E. coli由来の触媒的に不活性なエンドヌクレアーゼV (EndoVヌクレアーゼ)が挙げられる。いくつかの実施形態では、触媒的に不活性なAAGヌクレアーゼは、E125Q変異または別のAAGヌクレアーゼにおける対応する変異を含む。
「インテイン」とは、タンパク質スプライシングと呼ばれるプロセスにおいて、それ自身を切除し、残りの断片(エクステイン)をペプチド結合で結合することができるタンパク質の断片である。インテインは「タンパク質イントロン」とも呼ばれる。インテインがそれ自身を切除し、タンパク質の残りの部分を結合するプロセスは、本明細書中では「タンパク質スプライシング」または「インテイン媒介タンパク質スプライシング」と呼ばれる。いくつかの実施形態では、前駆体タンパク質のインテイン(インテイン媒介タンパク質スプライシング前のインテイン含有タンパク質)は、2つの遺伝子に由来する。そのようなインテインは、本明細書中ではスプリットインテイン(例えば、スプリットインテイン-N及びスプリットインテイン-C)と呼ばれる。例えば、シアノバクテリアでは、DNAポリメラーゼIIIの触媒サブユニットaであるDnaEは、2つの別々の遺伝子dnaE-n及びdnaE-cによってコードされる。dnaE-n遺伝子によってコードされるインテインは、本明細書中では「インテイン-N」と呼ばれ得る。dnaE-c遺伝子によってコードされるインテインは、本明細書中では「インテイン-C」と呼ばれ得る。
他のインテイン系もまた、使用することができる。例えば、dnaEインテイン、Cfa-N (例えば、スプリットインテイン-N)及びCfa-C (例えば、スプリットインテイン-C)インテインペアに基づく合成インテインが記載されている(例えば、参照により本明細書に援用されるStevens et al., J Am Chem Soc.2016 Feb.24;138 (7):2162-5)。本開示に従って使用され得るインテインペアの非限定的な例として:Cfa DnaEインテイン、Spp GyrBインテイン、Spp DnaXインテイン、Ter DnaE3インテイン、Ter ThyXインテイン、Rma DnaBインテイン及びCne Prp8インテイン(例えば、参照により本明細書に援用される米国特許第8,394,604号に記載されている)が挙げられる。
インテインの例示的なヌクレオチド配列及びアミノ酸配列を示す。
DnaEインテイン-N DNA:
TGCCTGTCATACGAAACCGAGATACTGACAGTAGAATATGGCCTTCTGCCAATCGGGAAGATTGTGGAGAAACGGATAGAATGCACAGTTTACTCTGTCGATAACAATGGTAACATTTATACTCAGCCAGTTGCCCAGTGGCACGACCGGGGAGAGCAGGAAGTATTCGAATACTGTCTGGAGGATGGAAGTCTCATTAGGGCCACTAAGGACCACAAATTTATGACAGTCGATGGCCAGATGCTGCCTATAGACGAAATCTTTGAGCGAGAGTTGGACCTCATGCGAGTTGACAACCTTCCTAAT
DnaEインテイン-Nタンパク質:
CLSYETEILTVEYGLLPIGKIVEKRIECTVYSVDNNGNIYTQPVAQWHDR GEQEVFEYCLEDGSLIRATKDHKFMTVDGQMLPIDEIFERELDLMRVDNL PN
DnaEインテイン-CDNA:
ATGATCAAGATAGCTACAAGGAAGTATCTTGGCAAACAAAACGTTTATGA TATTGGAGTCGAAAGAGATCACAACTTTGCTCTGAAGAACGGATTCATAG CTTCTAAT
インテイン-C:MIKIATRKYLGKQNVYDIGVERDHNFALKNGFIASN
Cfa-N DNA:
TGCCTGTCTTATGATACCGAGATACTTACCGTTGAATATGGCTTCTTGCCTATTGGAAAGATTGTCGAAGAGAGAATTGAATGCACAGTATATACTGTAGACAAGAATGGTTTCGTTTACACACAGCCCATTGCTCAATGGCACAATCGCGGCGAACAAGAAGTATTTGAGTACTGTCTCGAGGATGGAAGCATCATACGAGCAACTAAAGATCATAAATTCATGACCACTGACGGGCAGATGTTGCCAATAGATGAGATATTCGAGCGGGGCTTGGATCTCAAACAAGTGGATGGATTGCCA
Cfa-Nタンパク質:
CLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGLDLKQVDGLP
Cfa-C DNA:
ATGAAGAGGACTGCCGATGGATCAGAGTTTGAATCTCCCAAGAAGAAGAGGAAAGTAAAGATAATATCTCGAAAAAGTCTTGGTACCCAAAATGTCTATGATATTGGAGTGGAGAAAGATCACAACTTCCTTCTCAAGAACGGTCTCGTAGCCAGCAAC
Cfa-Cタンパク質:
MKRTADGSEFESPKKKRKVKIISRKSLGTQNVYDIGVEKDHNFLLKNGLVASN
スプリットCas9のN末端部分とスプリットCas9のC末端部分とを結合させるために、インテイン-N及びインテイン-Cを、それぞれ、スプリットCas9のN末端部分及びスプリットCas9のC末端部分に融合させてもよい。例えば、いくつかの実施形態では、インテイン-Nを、スプリットCas9のN末端部分のC末端に融合させ、すなわち、N--[スプリットCas9のN末端部分]-[インテイン-N]--Cの構造を形成させる。いくつかの実施形態では、インテイン-Cを、スプリットCas9のC末端部分のN末端に融合させ、すなわち、N-[インテイン-C]--[スプリットCas9のC末端部分]-Cの構造を形成させる。インテインを融合させるタンパク質(例えば、スプリットCas9)を結合するための、インテイン媒介性のタンパク質スプライシング機構は、例えば、参照により本明細書に援用されるShah et al., Chem Sci.2014;5 (1):446-461に記載されているように、当技術分野で公知である。インテインを設計し、使用するための方法は当技術分野で公知であり、例えば、WO2014004336、WO2017132580、US20150344549、及びUS20180127780に記載されており、これらのそれぞれは、その全体が参照により本明細書に援用される。
「単離されたポリペプチド」とは、それに天然に付随する成分から分離された本発明のポリペプチドを意味する。一般的には、ポリペプチドは、それが少なくとも60重量%であり、タンパク質及びそれが天然に関連する天然の有機分子を含まない場合に、単離されている。好ましくは、製剤は、少なくとも75重量%、より好ましくは少なくとも90重量%、最も好ましくは少なくとも99重量%の本発明のポリペプチドである。本発明の単離されたポリペプチドを、例えば、天然の供給源からの抽出によって、そのようなポリペプチドをコードする組換え核酸の発現によって;またはタンパク質を化学的に合成することによって取得してもよい。純度は、適切な方法、例えば、カラムクロマトグラフィー、ポリアクリルアミドゲル電気泳動、またはHPLC分析によって測定することができる。
本明細書中で使用する用語「リンカー」とは、共有結合リンカー(例えば、共有結合)、非共有結合リンカー、化学基、あるいは2つの分子もしくは部分、例えば、タンパク質複合体もしくはリボヌクレオ複合体の2つの成分、または融合タンパク質の2つのドメイン、例えば、ポリヌクレオチドプログラム可能なDNA結合ドメイン(例えば、dCas9)及びデアミナーゼドメイン((例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)を連結する分子を指し得る。リンカーは、塩基編集系の様々な成分または成分の異なる部分を結合することができる。例えば、いくつかの実施形態では、リンカーは、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインのガイドポリヌクレオチド結合ドメインとデアミナーゼの触媒ドメインを結合することができる。いくつかの実施形態では、リンカーは、CRISPRポリペプチドとデアミナーゼを結合することができる。いくつかの実施形態では、リンカーは、Cas9とデアミナーゼを結合することができる。いくつかの実施形態では、リンカーは、dCas9とデアミナーゼを結合することができる。いくつかの実施形態では、リンカーは、nCas9とデアミナーゼを結合することができる。いくつかの実施形態では、リンカーは、ガイドポリヌクレオチドとデアミナーゼを結合することができる。いくつかの実施形態では、リンカーは、塩基編集系の脱アミノ化成分とポリヌクレオチドプログラム可能なヌクレオチド結合成分を結合することができる。いくつかの実施形態では、リンカーは、塩基編集系の脱アミノ化成分のRNA結合部分とポリヌクレオチドプログラム可能なヌクレオチド結合成分を結合することができる。いくつかの実施形態では、リンカーは、塩基編集系の脱アミノ化成分のRNA結合部分とポリヌクレオチドプログラム可能なヌクレオチド結合成分のRNA結合部分を結合することができる。リンカーは、2つの基、分子、または他の部分の間に位置するか、それらに隣接し、共有結合または非共有結合相互作用を介してそれぞれに接続し、したがって2つを接続することができる。いくつかの実施形態では、リンカーは、有機分子、基、重合体、または化学部分であり得る。いくつかの実施形態では、リンカーは、ポリヌクレオチドであり得る。いくつかの実施形態では、リンカーは、DNAリンカーであり得る。いくつかの実施形態では、リンカーは、RNAリンカーであり得る。いくつかの実施形態では、リンカーは、リガンドに結合することができるアプタマーを含み得る。いくつかの実施形態では、リガンドは、炭水化物、ペプチド、タンパク質、または核酸であり得る。いくつかの実施形態では、リンカーは、リボスイッチに由来し得るアプタマーを含み得る。アプタマーが由来するリボスイッチは、テオフィリンリボスイッチ、チアミンピロリン酸(TPP)リボスイッチ、アデノシンコバラミン(AdoCbl)リボスイッチ、S-アデノシルメチオニン(SAM)リボスイッチ、SAHリボスイッチ、フラビンモノヌクレオチド(FMN)リボスイッチ、テトラヒドロ葉酸リボスイッチ、リジンリボスイッチ、グリシンリボスイッチ、プリンリボスイッチ、GlmSリボスイッチ、またはプレクオシン1 (PreQ1)リボスイッチから選択され得る。いくつかの実施形態では、リンカーは、ポリペプチド、またはポリペプチドリガンドなどのタンパク質ドメインに結合したアプタマーを含み得る。いくつかの実施形態では、ポリペプチドリガンドは、Kホモロジー(KH)ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、ステライルαモチーフ、テロメラーゼKu結合モチーフ及びKuタンパク質、テロメラーゼSm7結合モチーフ及びSm7タンパク質、またはRNA認識モチーフであり得る。いくつかの実施形態では、ポリペプチドリガンドは、塩基編集系成分の一部であり得る。例えば、核酸塩基編集成分は、デアミナーゼドメイン及びRNA認識モチーフを含み得る。
いくつかの実施形態では、リンカーは、1つのアミノ酸または複数のアミノ酸(例えば、ペプチドまたはタンパク質)であり得る。いくつかの実施形態では、リンカーは、長さが約5~100アミノ酸、例えば、約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、20~30、30~40、40~50、50~60、60~70、70~80、80~90、または90~100アミノ酸の長さであり得る。いくつかの実施形態では、リンカーは、長さが約100~150、150~200、200~250、250~300、300~350、350~400、400~450、または450~500アミノ酸であり得る。より長いかまたはより短いリンカーもまた企図され得る。
いくつかの実施形態では、リンカーは、Cas9ヌクレアーゼドメインを含む、RNAプログラム可能なヌクレアーゼのgRNA結合ドメインと、核酸編集タンパク質(例えば、シチジンデアミナーゼまたはアデノシンデアミナーゼ)の触媒ドメインを結合する。いくつかの実施形態では、リンカーは、dCas9と核酸編集タンパク質を結合する。例えば、リンカーは、2つの基、分子、または他の部分の間に位置するか、それらに隣接し、共有結合を介してそれぞれに接続し、したがって2つを接続する。いくつかの実施形態では、リンカーは、1つのアミノ酸または複数のアミノ酸(例えば、ペプチドまたはタンパク質)である。いくつかの実施形態では、リンカーは、有機分子、基、重合体、または化学部分である。いくつかの実施形態では、リンカーは、長さが5~200アミノ酸、例えば、長さが5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、35、45、50、55、60、60、65、70、70、75、80、85、90、90、95、100、101、102、103、104、105、110、120、130、140、150、160、175、180、190、または200アミノ酸である。
いくつかの実施形態では、塩基編集体のドメインを、SGGSSGSETPGTSESATPESSGGS、SGGSSGGSSGSETPGTSESATPESSGGSSGGS、またはGGSGGSPGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTE PSEGSAPGTSTEPSEGSAPGTSESATPESGPGSEPATSGGSGGSのアミノ酸配列を含むリンカーを介して融合させる。いくつかの実施形態では、核酸塩基編集体のドメインを、XTENリンカーとも呼ばれ得るアミノ酸配列SGSETPGTSESATPESを含むリンカーを介して融合させる。いくつかの実施形態では、リンカーは、24アミノ酸の長さである。いくつかの実施形態では、リンカーは、アミノ酸配列SGGSSGGSSGSETPGTSESATPESを含む。いくつかの実施形態では、リンカーは、40アミノ酸の長さである。いくつかの実施形態では、リンカーは、アミノ酸配列SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGGSSGGSを含む。いくつかの実施形態では、リンカーは、64アミノ酸の長さである。いくつかの実施形態では、リンカーは、アミノ酸配列SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGGSSGGSSGSETPGTSESATPESSGGS SGGSを含む。いくつかの実施形態では、リンカーは、92アミノ酸の長さである。いくつかの実施形態では、リンカーは、アミノ酸配列PGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGSEPATSを含む。
「マーカー」とは、疾患または障害に関連して発現レベルまたは活性が変化する任意のタンパク質またはポリヌクレオチドを意味する。
本明細書中で使用する用語「変異」とは、配列内の残基、例えば、核酸またはアミノ酸配列の別の残基による置換、または配列内の1つ以上の残基の欠失または挿入を指す。変異は、通常、元の残基を明らかにし、続いて配列内の残基の位置を明らかにし、そして新たに置換された残基を明らかにすることによって、本明細書に記載される。本明細書中で提供されるアミノ酸置換(変異)を行うための様々な方法は当技術分野で周知であり、例えば、Green and Sambrook,Molecular Cloning:A Laboratory Manual (4thed., Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y. (2012))に記載されている。いくつかの実施形態では、本開示の塩基編集体は、有意な数の意図しない変異、例えば、意図しない点変異を生成することなく、核酸(例えば、対象のゲノム内の核酸)内に、点変異などの「意図する変異」を効率的に生成することができる。いくつかの実施形態では、意図される変異は、意図される変異を生成するように特別に設計されたガイドポリヌクレオチド(例えば、gRNA)に結合した特異的な塩基編集体(例えば、シチジン塩基編集体またはアデノシン塩基編集体)によって生成される変異である。
一般的に、配列(例えば、本明細書に記載のアミノ酸配列)内で作成または同定される変異は、参照(または野生型)配列、すなわち、変異を含まない配列に関連して付番される。当業者であれば、参照配列に対するアミノ酸配列及び核酸配列の変異の位置を決定する方法を容易に理解するであろう。
用語「非保存的変異」には、例えば、トリプトファンからリジン、またはセリンからフェニルアラニンなど、異なるグループ間のアミノ酸置換が含まれる。この場合、非保存的アミノ酸置換は、機能的バリアントの生物学的活性を妨害したり阻害したりしないことが好ましい。非保存的アミノ酸置換は、機能的バリアントの生物学的活性を増強することができ、その結果、機能的バリアントの生物学的活性は、野生型タンパク質に比べて増加する。
いくつかの実施形態では、本開示の塩基編集体は、有意な数の意図しない変異、例えば、意図しない点変異を生成することなく、核酸(例えば、対象のゲノム内の核酸)内の点変異などの「意図する変異」を効率的に生成することができる。いくつかの実施形態では、意図される変異は、意図される変異を生成するように特別に設計されたガイドポリヌクレオチド(例えば、gRNA)に結合した特異的な塩基編集体(例えば、シチジン塩基編集体またはアデノシン塩基編集体)によって生成される変異である。
一般的に、配列(例えば、本明細書に記載のアミノ酸配列)内で作成または同定される変異は、参照(または野生型)配列、すなわち、変異を含まない配列に関連して付番される。当業者であれば、参照配列に対するアミノ酸配列及び核酸配列の変異の位置を決定する方法を容易に理解するであろう。
用語「非保存的変異」には、例えば、トリプトファンからリジン、セリンからフェニルアラニンなど、異なるグループ間のアミノ酸置換が含まれる。この場合、非保存的アミノ酸置換は、機能的バリアントの生物学的活性を妨害したり阻害したりしないことが好ましい。非保存的アミノ酸置換は、機能的バリアントの生物学的活性を増強することができ、その結果、機能的バリアントの生物学的活性は、野生型タンパク質に比べて増加する。
用語「核局在化配列」、「核局在化シグナル」、または「NLS」とは、細胞核へのタンパク質の輸入を促進するアミノ酸配列を指す。核局在化配列は当技術分野で公知であり、例えば、2000年11月23日に出願され、2001年5月31日にWO/2001/038547として公開されたPlank et al., 国際PCT出願、PCT/EP2000/011690に記載されており、その内容は、例示的な核局在化配列を開示するために参照により本明細書に援用される。他の実施形態では、NLSは、例えば、Koblan et al., Nature Biotech.2018 doi:10.1038/nbt.4172によって記載された最適化されたNLSである。いくつかの実施形態では、NLSは、アミノ酸配列KRTADGSEFESPKKKRKV、KRPAATKKAGQAKKKK、KKTELQTTNAENKTKKL、KRGINDRNFWRGENGRKTR、RKSGKIAAIVVKRPRK、PKKKRKV、またはMDSLLMNRRKFLYQFKNVRWAKGRRETYLCを含む。
本明細書中で同じ意味で使用される用語「核酸塩基」、「窒素性塩基」、または「塩基」とは、ヌクレオチドの成分であるヌクレオシドを形成する窒素含有生体化合物を指す。核酸塩基が塩基対を形成し、互いに積み重なる能力は、リボ核酸(RNA)やデオキシリボ核酸(DNA)などの長鎖らせん構造を直接的に生じさせる。5つの核酸塩基(アデニン(A)、シトシン(C)、グアニン(G)、チミン(T)、及びウラシル(U))は、一次核酸塩基または標準核酸塩基と呼ばれる。アデニンとグアニンはプリンに由来し、シトシン、ウラシル、及びチミンはピリミジンに由来する。DNA及びRNAには、修飾された他の(非一次)塩基を含めることもできる。非限定的な例示的な修飾核酸塩基には、ヒポキサンチン、キサンチン、7-メチルグアニン、5,6-ジヒドロウラシル、5-メチルシトシン(m5C)、及び5-ヒドロメチルシトシンが含まれ得る。ヒポキサンチンとキサンチンは、変異原物質の存在によって生成され、どちらも脱アミノ化(アミン基のカルボニル基への置換)によって生成され得る。ヒポキサンチンは、アデニンから修飾することができる。キサンチンは、グアニンから修飾することができる。ウラシルは、シトシンの脱アミノ化から生じ得る。「ヌクレオシド」は、核酸塩基と5つの炭素糖(リボースまたはデオキシリボースのいずれか)からなる。ヌクレオシドの例として、アデノシン、グアノシン、ウリジン、シチジン、5-メチルウリジン(m5U)、デオキシアデノシン、デオキシグアノシン、チミジン、デオキシウリジン、及びデオキシシチジンが挙げられる。核酸塩基が修飾されたヌクレオシドの例として、イノシン(I)、キサントシン(X)、7-メチルグアノシン(m7G)、ジヒドロウリジン(D)、5-メチルシチジン(m5C)、及びシュードウリジン(Ψ)が挙げられる。「ヌクレオチド」は、核酸塩基、5つの炭素糖(リボースまたはデオキシリボースのいずれか)、及び少なくとも1つのリン酸基からなる。
本明細書中で使用する用語「核酸」及び「核酸分子」とは、核酸塩基及び酸性部分を含む化合物、例えば、ヌクレオシド、ヌクレオチド、またはヌクレオチドの重合体を指す。通常、高分子核酸、例えば、3つ以上のヌクレオチドを含む核酸分子は直鎖状分子であり、隣接するヌクレオチドがホスホジエステル結合を介して互いに連結されている。いくつかの実施形態では、「核酸」は、個々の核酸残基(例えば、ヌクレオチド及び/またはヌクレオシド)を指す。いくつかの実施形態では、「核酸」は、3つ以上の個々のヌクレオチド残基を含むオリゴヌクレオチド鎖を指す。本明細書中で使用する場合、用語「オリゴヌクレオチド」及び「ポリヌクレオチド」とは、ヌクレオチドの重合体(例えば、少なくとも3つのヌクレオチドのストリング)を指すために同じ意味で用いられ得る。いくつかの実施形態では、「核酸」は、RNAならびに一本鎖及び/または二本鎖DNAを包含する。核酸は、例えば、ゲノム、転写産物、mRNA、tRNA、rRNA、siRNA、snRNA、プラスミド、コスミド、染色体、クロマチド、または他の天然の核酸分子の状況下で、天然であり得る。一方、核酸分子は、非天然の分子、例えば、組換えDNAもしくはRNA、人工染色体、改変されたゲノム、またはその断片、あるいは合成DNA、RNA、DNA/RNAハイブリッドであり得るか、または非天然のヌクレオチドまたはヌクレオシドを含む。さらに、「核酸」、「DNA」、「RNA」、及び/または同様の用語には、核酸類似体、例えば、ホスホジエステル骨格以外を有する類似体が含まれる。核酸は、天然の供給源から精製することができ、組換え発現系を使用して生成し、例えば、任意選択で精製したり化学合成したりすることができる。必要に応じて、例えば、化学的に合成された分子の場合、核酸は、化学的に修飾された塩基または糖を有する類似体などのヌクレオシド類似体、及び骨格修飾を含み得る。核酸配列は、特に明記しない限り、5’から3’方向に提示される。いくつかの実施形態では、核酸は、天然のヌクレオシド(例えば、アデノシン、チミジン、グアノシン、シチジン、ウリジン、デオキシアデノシン、デオキシチミジン、デオキシグアノシン、及びデオキシシチジン);ヌクレオシド類似体(例えば、2-アミノアデノシン、2-チオチミジン、イノシン、ピロロ-ピリミジン、3-メチルアデノシン、5-メチルシチジン、2-アミノアデノシン、C5-ブロモウリジン、C5-フルオロウリジン、C5-ヨードウリジン、C5-プロピニル-ウリジン、C5-プロピニル-シチジン、C5-メチルシチジン、2-アミノアデノシン、7-デアザアデノシン、7-デアザグアノシン、8-オキソアデノシン、8-オキソグアノシン、O (6)-メチルグアニン、及び2-チオシチジン);化学的に修飾された塩基;生物学的に修飾された塩基(例えば、メチル化された塩基);インターカレートされた塩基;修飾された糖(2’-例えば、フルオロリボース、リボース、2’-デオキシリボース、アラビノース、及びヘキソース)、及び/または修飾されたリン酸基(例えば、ホスホロチオエート及び5’-N-ホスホルアミダイト結合)であるか、またはそれらを含む。
用語「核酸プログラム可能なDNA結合タンパク質」または「napDNAbp」は、「ポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン」と同じ意味で用いられる場合があり、napDNAbpを特定の核酸配列に誘導するガイド核酸またはガイドポリヌクレオチド(例えば、gRNA)などの核酸(例えば、DNAまたはRNA)と結合するタンパク質を指す。いくつかの実施形態では、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、ポリヌクレオチドプログラム可能なDNA結合ドメインである。いくつかの実施形態では、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、ポリヌクレオチドプログラム可能なRNA結合ドメインである。いくつかの実施形態では、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、Cas9タンパク質である。Cas9タンパク質は、ガイドRNAに相補的な特定のDNA配列にCas9タンパク質をガイドするガイドRNAと結合することができる。いくつかの実施形態では、napDNAbpは、Cas9ドメイン、例えば、ヌクレアーゼ活性Cas9、Cas9ニッカーゼ(nCas9)、またはヌクレアーゼ不活性Cas9 (dCas9)である。核酸プログラム可能なDNA結合タンパク質の非限定的な例として、Cas9 (例えば、dCas9及びnCas9)、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、及びCas12iが挙げられる。Cas酵素の非限定的な例として、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5d、Cas5t、Cas5h、Cas5a、Cas6、Cas7、Cas8、Cas8a、Cas8b、Cas8c、Cas9 (Csn1またはCsx12としても知られる)、Cas10、Cas10d、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i、Csy1、Csy2、Csy3、Csy4、Cse1、Cse2、Cse3、Cse4、Cse5e、Csc1、Csc2、Csa5、Csn1、Csn2、Csm1、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx1S、Csx11、Csf1、Csf2、CsO、Csf4、Csd1、Csd2、Cst1、Cst2、Csh1、Csh2、Csa1、Csa2、Csa3、Csa4、Csa5、II型Casエフェクタータンパク質、V型Casエフェクタータンパク質、VI型Casエフェクタータンパク質、CARF、DinG、その相同体、またはその修飾もしくは改変バージョンが挙げられる。他の核酸プログラム可能なDNA結合タンパク質もまた、本開示の範囲内であるが、それらは、本開示に具体的に記載されていない可能性がある。例えば、Makarova et al. ”Classification and Nomenclature of CRISPR-Cas Systems: Where from Here?” CRISPR J.2018 Oct;1:325-336.doi:10.1089/crispr.2018.0033;Yan et al., ”Functionally diverse type V CRISPR-Cas systems” Science.2019 Jan 4;363 (6422):88-91.doi:10.1126/science.aav7271を参照されたい(それぞれの全内容が参照により本明細書に援用される)。
本明細書中で使用する用語「核酸塩基編集ドメイン」または「核酸塩基編集タンパク質」とは、RNAまたはDNAにおける核酸塩基改変、例えば、シトシン(またはシチジン)からウラシル(またはウリジン)またはチミン(またはチミジン)へ、及びアデニン(またはアデノシン)からヒポキサンチン(またはイノシン)への脱アミノ化、ならびに鋳型不在でヌクレオチドの付加及び挿入を触媒することができるタンパク質または酵素を指す。いくつかの実施形態では、核酸塩基編集ドメインは、デアミナーゼドメイン(例えば、アデニンデアミナーゼまたはアデノシンデアミナーゼ;またはシチジンデアミナーゼまたはシトシンデアミナーゼ)である。いくつかの実施形態では、核酸塩基編集ドメインは、複数のデアミナーゼドメイン(例えば、アデニンデアミナーゼもしくはアデノシンデアミナーゼまたはシチジンデアミナーゼもしくはシトシンデアミナーゼ)である。いくつかの実施形態では、核酸塩基編集ドメインは、天然の核酸塩基編集ドメインであり得る。いくつかの実施形態では、核酸塩基編集ドメインは、天然の核酸塩基編集ドメインから改変するか、または進化させた核酸塩基編集ドメインであり得る。核酸塩基編集ドメインは、細菌、ヒト、チンパンジー、ゴリラ、サル、ウシ、イヌ、ラット、またはマウスなどの任意の生物に由来し得る。
本明細書中で使用する場合、「薬剤の入手」における「入手」には、薬剤の合成、購入、または他の方法での入手が含まれる。
本明細書中で使用する「患者」または「対象」は、疾患もしくは障害を有するか、または発症するリスクがあるか、または罹患もしくは発症する疑いがあると診断された哺乳類対象または個体を指す。いくつかの実施形態では、用語「患者」とは、疾患または障害を発症する可能性が平均よりも高い哺乳類対象を指す。例示的な患者は、本明細書に開示する療法から恩恵を得ることができる、ヒト、非ヒト霊長類、ネコ、イヌ、ブタ、ウシ、ネコ、ウマ、ラクダ、ラマ、ヤギ、ヒツジ、げっ歯類(例えば、マウス、ウサギ、ラット、またはモルモット)及び他の哺乳類であり得る。例示的なヒト患者は、男性及び/または女性であり得る。
「それを必要とする患者」または「それを必要とする対象」とは、本明細書中では、疾患もしくは障害を有するか、リスクがあるか、または有していると診断されたか、有すると予め決定されたか、あるいは有すると疑われる患者を指す。
用語「タンパク質」、「ペプチド」、「ポリペプチド」、及びそれらの文法上の同等物は、本明細書中では同じ意味で使用され、ペプチド(アミド)結合によって一緒に連結されたアミノ酸残基の重合体を指す。これらの用語は、任意のサイズ、構造、または機能のタンパク質、ペプチド、またはポリペプチドを指す。通常、タンパク質、ペプチド、またはポリペプチドは、長さが少なくとも3アミノ酸である。タンパク質、ペプチド、またはポリペプチドは、個々のタンパク質またはタンパク質の集合を指し得る。タンパク質、ペプチド、またはポリペプチド中の1つ以上のアミノ酸は、化学実体、例えば、炭水化物基、ヒドロキシル基、リン酸基、ファルネシル基、イソファルネシル基、脂肪酸基、結合、官能化、または他の修飾のためのリンカーなどの付加により修飾することができる。タンパク質、ペプチド、またはポリペプチドはまた、単一分子であり得るか、または多分子複合体であり得る。タンパク質、ペプチド、またはポリペプチドは、天然のタンパク質またはペプチドの単なる断片であり得る。タンパク質、ペプチド、またはポリペプチドは、天然の、組換え、もしくは合成、またはそれらの任意の組み合わせであり得る。本明細書中で使用する用語「融合タンパク質」とは、少なくとも2つの異なるタンパク質に由来するタンパク質ドメインを含むハイブリッドポリペプチドを指す。1つのタンパク質を、融合タンパク質のアミノ末端(N末端)部分またはカルボキシ末端(C末端)タンパク質に配置し、したがって、それぞれ、アミノ末端融合タンパク質またはカルボキシ末端融合タンパク質を形成することができる。タンパク質は、異なるドメイン、例えば、核酸結合ドメイン(例えば、タンパク質の標的部位への結合を指示するCas9のgRNA結合ドメイン)及び核酸切断ドメイン、または核酸編集タンパク質の触媒ドメインを含み得る。いくつかの実施形態では、タンパク質は、タンパク質性部分、例えば、核酸結合ドメインを構成するアミノ酸配列、及び有機化合物、例えば、核酸切断剤として作用することができる化合物を含む。いくつかの実施形態では、タンパク質は、核酸、例えば、RNAまたはDNAと複合体を形成しているか、またはそれらと会合している。本明細書中で提供するタンパク質のいずれも、当技術分野で公知の任意の方法によって生成することができる。例えば、本明細書中で提供するタンパク質を、組換えタンパク質の発現及び精製を介して生成することができ、これは、ペプチドリンカーを含む融合タンパク質に特に適している。組換えタンパク質の発現及び精製の方法は周知であり、Green and Sambrook,Molecular Cloning:A Laboratory Manual (4th ed., Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y. (2012))に記載されている方法が含まれ、その全内容は、参照により本明細書に援用される。
本明細書に開示するポリペプチド及びタンパク質(その機能的部分及び機能的バリアントを含む)は、1つ以上の天然アミノ酸の代わりに合成アミノ酸を含むことができる。そのような合成アミノ酸は当技術分野で公知であり、例えば、アミノシクロヘキサンカルボン酸、ノルロイシン、α-アミノn-デカン酸、ホモセリン、S-アセチルアミノメチル-システイン、トランス-3-及びトランス-4-ヒドロキシプロリン、4-アミノフェニルアラニン、4-ニトロフェニルアラニン、4-クロロフェニルアラニン、4-カルボキシフェニルアラニン、β-フェニルセリンβ-ヒドロキシフェニルアラニン、フェニルグリシン、α-ナフチルアラニン、シクロヘキシルアラニン、シクロヘキシルグリシン、インドリン-2-カルボン酸、1,2,3,4-テトラヒドロイソキノリン-3-カルボン酸、アミノマロン酸、アミノマロン酸モノアミド、N’-ベンジル-N’-メチル-リジン、N’,N’-ジベンジル-リジン、6-ヒドロキシリジン、オルニチン、α-アミノシクロペンタンカルボン酸、α-アミノシクロヘキサンカルボン酸、α-アミノシクロヘプタンカルボン酸、α-(2-アミノ-2-ノルボルナン)-カルボン酸、α,γ-ジアミノ酪酸、α,β-ジアミノプロピオン酸、ホモフェニルアラニン、及びα-tert-ブチルグリシンが挙げられる。ポリペプチド及びタンパク質は、ポリペプチド構築物の1つ以上のアミノ酸の翻訳後修飾に関連付けることができる。翻訳後修飾の非限定的な例として、リン酸化、アセチル化及びホルミル化を含むアシル化、グリコシル化(N-結合及びO-結合を含む)、アミド化、ヒドロキシル化、メチル化及びエチル化を含むアルキル化、ユビキチン化、ピロリドンカルボン酸の付加、ジスルフィド架橋の形成、硫酸化、ミリストイル化、パルミトイル化、イソプレニル化、ファルネシル化、ゲラニル化、グリピエーション、リポイル化及びヨウ素化が挙げられる。
タンパク質または核酸に関して本明細書中で使用する用語「組換え」とは、自然界には存在しないが、人間工学の産物であるタンパク質または核酸を指す。例えば、いくつかの実施形態では、組換えタンパク質または核酸分子は、任意の天然の配列と比較して、少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、少なくとも5つ、少なくとも6つ、または少なくとも7つの変異を含むアミノ酸またはヌクレオチド配列を含む。
「減少」とは、少なくとも10%、25%、50%、75%、または100%の負の変化を意味する。
「参照」とは、標準または対照の条件を意味する。一実施形態では、本明細書に記載の塩基編集系で処理した細胞に存在するウイルス量を、未処理の対照細胞に存在するHBV感染症のレベルと比較し、そこで対照は参照として機能する。別の実施形態では、本明細書に記載の塩基編集系と接触させた細胞に存在するHBVゲノムの配列を、未処理の対照細胞に存在するHBVゲノムの配列と比較する。
「参照配列」とは、配列比較の基礎として使用される規定の配列である。参照配列は、指定の配列のサブセットまたは全体;例えば、全長のcDNAもしくは遺伝子配列のセグメント、または完全なcDNAもしくは遺伝子配列であってもよい。ポリペプチドの場合、参照ポリペプチド配列の長さは、一般的に、少なくとも約16アミノ酸、少なくとも約20アミノ酸、少なくとも約25アミノ酸、約35アミノ酸、約50アミノ酸、または約100アミノ酸である。核酸の場合、参照核酸配列の長さは、一般的に、少なくとも約50ヌクレオチド、少なくとも約60ヌクレオチド、少なくとも約75ヌクレオチド、約100ヌクレオチド、または約300ヌクレオチド、またはその周辺またはそれらの間の任意の整数である。いくつかの実施形態では、参照配列は、目的のタンパク質の野生型配列である。他の実施形態では、参照配列は、野生型タンパク質をコードするポリヌクレオチド配列である。
用語「RNAプログラム可能なヌクレアーゼ」及び「RNAガイドヌクレアーゼ」は、切断の標的ではない1つ以上のRNA (複数可)と共に使用される(例えば、結合または会合させる)。いくつかの実施形態では、RNAプログラム可能なヌクレアーゼは、RNAとの複合体にある場合、ヌクレアーゼ:RNA複合体と呼ばれ得る。通常、結合したRNA (複数可)はガイドRNA (gRNA)と呼ばれる。いくつかの実施形態では、RNAプログラム可能なヌクレアーゼは、(CRISPR会合系)Cas9エンドヌクレアーゼ、例えば、Streptococcus pyogenes由来のCas9 (Csn1)である(例えば、”Complete genome sequence of an Ml strain of Streptococcus pyogenes.”Ferretti J.J., McShan W.M., Ajdic D.J., Savic D.J., Savic G., Lyon K., Primeaux C,Sezate S., Suvorov A.N., Kenton S., Lai H.S., Lin S.P., Qian Y., Jia H.G., Najar F.Z., Ren Q., Zhu H., Song L., White J., Yuan X., Clifton S.W., Roe B.A., McLaughlin R.E., Proc.Natl.Acad.Sci.U.S.A.98:4658-4663 (2001);”CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III.” Deltcheva E., Chylinski K., Sharma CM., Gonzales K., Chao Y., Pirzada Z.A., Eckert M.R., Vogel J., Charpentier E., Nature 471:602-607 (2011)を参照のこと)。
「特異的に結合する」とは、本発明のポリペプチド及び/または核酸分子を認識して結合するが、試料中の他の分子、例えば、生物学的試料を実質的に認識及び結合しない核酸分子、ポリペプチド、もしくはその複合体(例えば、核酸プログラム可能なDNA結合ドメイン及びガイド核酸)、化合物、または分子を意味する。
本発明の方法において有用な核酸分子には、本発明のポリペプチドまたはその断片をコードする任意の核酸分子が含まれる。そのような核酸分子は、内在性核酸配列と100%同一である必要はないが、一般的には実質的な同一性を示す。内在性配列に対して「実質的な同一性」を有するポリヌクレオチドは、一般的には、二本鎖核酸分子の少なくとも1本の鎖とハイブリダイズすることができる。本発明の方法において有用な核酸分子には、本発明のポリペプチドまたはその断片をコードする任意の核酸分子が含まれる。そのような核酸分子は、内在性核酸配列と100%同一である必要はないが、一般的には実質的な同一性を示す。内在性配列に対して「実質的な同一性」を有するポリヌクレオチドは、一般的には、二本鎖核酸分子の少なくとも1本の鎖とハイブリダイズすることができる。「ハイブリダイズさせる」とは、様々な厳密性の条件下で、相補的なポリヌクレオチド配列(例えば、本明細書に記載の遺伝子)、またはその一部の間で二本鎖分子を形成するように対合させることを意味する。(例えば、Wahl,G.M. and S.L.Berger (1987)Methods Enzymol.152:399;Kimmel,A.R. (1987) Methods Enzymol.152:507を参照のこと)。
例えば、厳密な塩濃度は、通常、約750mM NaCl及び75mMクエン酸三ナトリウム未満、好ましくは約500mM NaCl及び50mMクエン酸三ナトリウム未満、より好ましくは約250mM NaCl及び25mMクエン酸三ナトリウム未満である。有機溶媒、例えば、ホルムアミドの非存在下では、低い厳密性のハイブリダイゼーションを得ることができる一方で、少なくとも約35%のホルムアミド、より好ましくは少なくとも約50%のホルムアミドの存在下では、高い厳密性のハイブリダイゼーションを得ることができる。厳密な温度条件には、通常は、少なくとも約30℃、より好ましくは少なくとも約37℃、最も好ましくは少なくとも約42℃の温度が含まれる。ハイブリダイゼーション時間、界面活性剤、例えば、ドデシル硫酸ナトリウム(SDS)の濃度、及びキャリアDNAの包含または除外などの様々な付加的パラメータは、当業者には周知である。必要に応じて、これらの様々な条件を組み合わせることによって、様々なレベルの厳密性が達成される。好ましい実施形態では、ハイブリダイゼーションを、750mM NaCl、75mMクエン酸三ナトリウム、及び1%SDS中にて30℃で実施する。より好ましい実施形態では、ハイブリダイゼーションを、500mM NaCl、50mMクエン酸三ナトリウム、1%SDS、35%ホルムアミド、及び100μg/ml 変性サケ精子DNA (ssDNA)中にて37℃で実施する。最も好ましい実施形態では、ハイブリダイゼーションを、250mM NaCl、25mMクエン酸三ナトリウム、1%SDS、50%ホルムアミド、及び200μg/ml ssDNA中にて42℃で実施する。これらの条件の有用な変形は、当業者には容易に明らかであろう。
ほとんどの用途では、ハイブリダイゼーションに続く洗浄ステップの厳密性も様々に異なる。洗浄の厳密性の条件は、塩濃度と温度によって定義することができる。上記のように、洗浄の厳密性は、塩濃度を下げるか、温度を上げることによって高めることができる。例えば、洗浄ステップの厳密な塩濃度は、約30mM NaCl及び3mMクエン酸三ナトリウム未満、または約15mM NaCl及び1.5mMクエン酸三ナトリウム未満である。洗浄ステップの厳密な温度条件には、通常、少なくとも約25℃、少なくとも約42℃、さらには少なくとも約68℃の温度が含まれる。一実施形態では、洗浄ステップを、30mM NaCl、3mMクエン酸三ナトリウム、及び0.1%SDS中にて25℃で実施する。別の実施形態では、洗浄ステップを、15mM NaCl、1.5mMクエン酸三ナトリウム、及び0.1%SDS中にて42℃で実施する。より好ましい実施形態では、洗浄ステップを、15mM NaCl、1.5mMクエン酸三ナトリウム、及び0.1%SDS中にて68℃で実施する。これらの条件の追加の変形は、当業者には容易に明らかであろう。ハイブリダイゼーション技術は当業者に周知であり、例えば、Benton and Davis (Science 196:180,1977);Grunstein and Hogness (Proc.Natl.Acad.Sci., USA 72:3961,1975);Ausubel et al. (Current Protocols in Molecular Biology, Wiley Interscience, New York,2001);Berger and Kimmel (Guide to Molecular Cloning Techniques,1987,Academic Press, New York)、及びSambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, New Yorkに記載されている。
「スプリット」とは、2つ以上の断片に分割されることを意味する。
「スプリットCas9タンパク質」または「スプリットCas9」は、2つの別個のヌクレオチド配列によってコードされるN末端断片及びC末端断片として提供されるCas9タンパク質を指す。Cas9タンパク質のN末端部分及びC末端部分に対応するポリペプチドは、スプライシングされて「再構成された」Cas9タンパク質を形成し得る。特定の実施形態では、Cas9タンパク質は、例えば、Nishimasu et al., Cell, Volume 156,Issue 5,pp.935-949,2014に記載されているように、またはJiang et al. (2016)Science 351:867-871に記載されているように、タンパク質の変性領域内で2つの断片に分割される。PDBファイル:5F9R、それぞれが参照により本明細書に援用される。いくつかの実施形態では、タンパク質は、およそアミノ酸A292~G364、F445~K483、もしくはE565~T637の間のSpCas9の領域内の任意のC、T、A、もしくはSで、または任意の他のCas9、Cas9バリアント(例えば、nCas9、dCas9)、もしくは他のnapDNAbpの対応する位置で2つの断片に分割される。いくつかの実施形態では、タンパク質は、SpCas9 T310、T313、A456、S469、またはC574で2つの断片に分割される。いくつかの実施形態では、タンパク質を2つの断片に分割するプロセスは、タンパク質の「分割」と呼ばれる。
他の実施形態では、Cas9タンパク質のN末端部分は、アミノ酸1~573または1~637 S. pyogenes Cas9野生型(SpCas9)(NCBI参照配列:NC_002737.2、Uniprot参照配列:Q99ZW2)を含み、Cas9タンパク質のC末端部分は、SpCas9野生型のアミノ酸574~1368または638~1368の一部を含む。
スプリットCas9のC末端部分をスプリットCas9のN末端部分と結合させて、完全なCas9タンパク質を形成することができる。いくつかの実施形態では、Cas9タンパク質のC末端部分は、Cas9タンパク質のN末端部分が終結する位置から開始する。したがって、いくつかの実施形態では、スプリットCas9のC末端部分は、spCas9のアミノ酸(551~651)~1368の一部を含む。「(551~651)~1368」とは、アミノ酸551~651(両端を含む)の間のアミノ酸で開始し、アミノ酸1368で終結することを意味する。例えば、スプリットCas9のC末端部分は、spCas9のアミノ酸551~1368、552~1368、553~1368、554~1368、555~1368、556~1368、557~1368、558~1368、559~1368、560~1368、561~1368、562~1368、563~1368、564~1368、565~1368、566~1368、567~1368、568~1368、569~1368、570~1368、571~1368、572~1368、573~1368、574~1368、575~1368、576~1368、577~1368、578~1368、579~1368、580~1368、581~1368、582~1368、583~1368、584~1368、585~1368、586~1368、587~1368、588~1368、589~1368、590~1368、591~1368、592~1368、593~1368、594~1368、595~1368、596~1368、597~1368、598~1368、599~1368、600~1368、601~1368、602~1368、603~1368、604~1368、605~1368、606~1368、607~1368、608~1368、609~1368、610~1368、611~1368、612~1368、613~1368、614~1368、615~1368、616~1368、617~1368、618~1368、619~1368、620~1368、621~1368、622~1368、623~1368、624~1368、625~1368、626~1368、627~1368、628~1368、629~1368、630~1368、631~1368、632~1368、633~1368、634~1368、635~1368、636~1368、637~1368、638~1368、639~1368、640~1368、641~1368、642~1368、643~1368、644~1368、645~1368、646~1368、647~1368、648~1368、649~1368、650~1368、または651~1368のうちのいずれか1つの一部を含み得る。いくつかの実施形態では、スプリットCas9タンパク質のC末端部分は、SpCas9のアミノ酸574~1368または638~1368の一部を含む。
「対象」とは、ヒトまたは非ヒト哺乳類、例えば、非ヒト霊長類(サル)、ウシ、ウマ、イヌ、ヒツジ、またはネコを含むが、これらに限定されない哺乳類を意味する。いくつかの実施形態では、本明細書に記載の対象は、HBVに感染しているか、またはHBVを発症する傾向がある。
「実質的に同一」とは、ポリペプチドまたは核酸分子が、参照アミノ酸配列(例えば、本明細書に記載のアミノ酸配列のいずれか1つ)または核酸配列(例えば、本明細書に記載の核酸配列のいずれか1つ)に対して少なくとも50%の同一性を示すことを意味する。一実施形態では、そのような配列は、比較に使用される配列に対して、アミノ酸レベルで、または核酸で、少なくとも60%、80%、85%、90%、95%、またはさらに99%の同一性である。
配列同一性は、通常、配列分析ソフトウェア(例えば、Genetics Computer Group, University of Wisconsin Biotechnology Center,1710 University Avenue,Madison,Wis.53705の配列分析ソフトウェアパッケージ、BLAST、BESTFIT、GAP、またはPILEUP/PRETTYBOXプログラム)を使用して測定する。そのようなソフトウェアは、様々な置換、欠失、及び/または他の改変に相同性の程度を割り当てることによって、同一または類似の配列を一致させる。保存的置換は、通常、以下の群、すなわち、グリシン、アラニン、バリン、イソロイシン、ロイシン、アスパラギン酸、グルタミン酸、アスパラギン、グルタミン、セリン、スレオニン、リジン、アルギニン、及びフェニルアラニン、チロシン内の置換を含む。同一性の程度を測定する例示的な方法では、密接に関連した配列を示すe-3~e-100の確率スコアでBLASTプログラムを使用してもよい。COBALTは、例えば、以下のパラメータで使用する:
a)アラインメントパラメータ:Gap penalties-11,-1及びEnd-Gap penalties-5,-1、
b)CDDパラメータ:Use RPS BLAST on;Blast E-value 0.003;Find Conserved columns and Recompute on、及び
c)クエリクラスタリングパラメータ:Use query clusters on;Word Size 4;Max cluster distance 0.8;Alphabet Regular。
EMBOSS Needleは、例えば、以下のパラメータで使用する:
a)Matrix:BLOSUM62;
b)GAP OPEN:10;
c)GAP EXTEND:0.5;
d)OUTPUT FORMAT:pair;
e)END GAP PENALTY:false;
f)END GAP OPEN:10、及び
g)END GAP EXTEND:0.5。
用語「標的部位」とは、デアミナーゼまたはデアミナーゼ(例えば、シチジンデアミナーゼまたはアデニンデアミナーゼ)融合タンパク質もしくは本明細書に開示する塩基編集体を含む融合タンパク質によって脱アミノ化される核酸分子内の配列を指す。
RNAプログラム可能なヌクレアーゼ(例えば、Cas9)は、RNA:DNAハイブリダイゼーションを使用してDNA切断部位を標的とするため、これらのタンパク質は、原則として、ガイドRNAで指定される任意の配列を標的とすることができる。部位特異的切断(例えば、ゲノムを改変するための)のために、Cas9などのRNAプログラム可能なヌクレアーゼを使用する方法は、当技術分野で公知である(例えば、Cong,L.et ah, Multiplex genome engineering using CRISPR/Cas systems.Science 339,819-823 (2013);Mali,P.et ah,RNA-guided human genome engineering via Cas9. Science 339,823-826 (2013);Hwang,W.Y.et ah,Efficient genome editing in zebrafish using a CRISPR-Cas system. Nature biotechnology 31,227-229 (2013);Jinek,M.et ah,RNA-programmed genome editing in human cells. eLife 2,e00471 (2013);Dicarlo,J.E.et ah,Genome engineering in Saccharomyces cerevisiae using CRISPR-Cas systems. Nucleic acids research (2013);Jiang,W.et ah RNA-guided editing of bacterial genomes using CRISPR-Cas systems. Nature biotechnology 31,233-239 (2013)を参照されたい;それぞれの全内容が参照により本明細書に援用される。
本明細書中で使用する場合、用語「治療する」、「治療すること」、及び「治療」などは、障害及び/またはそれに関連する症状を低減及び/または寛解させるか、または所望の薬理学的及び/または生理学的な効果を得ることを指す。障害または病態を治療することは、障害、病態、またはそれらに関連する症状が完全に排除されることを、除外はしないものの、必ずしも必要としないことが理解されるだろう。いくつかの実施形態では、効果は治療的であり、すなわち、効果は、非限定的に、疾患及び/または疾患に起因する有害な症状を、部分的または完全に、減少、低減、抑止、軽減、緩和、強度を低下させるか、または治癒する。いくつかの実施形態では、効果は予防的であり、すなわち、効果は、疾患または病態の発症または再発を防御または予防する。この目的のために、本明細書に開示する方法は、本明細書に記載するような治療有効量の組成物を投与することを含む。一実施形態では、本発明は、HBV感染症の治療を提供する。
「ウラシルグリコシラーゼ阻害因子」または「UGI」とは、ウラシル除去修復系を阻害する薬剤を意味する。一実施形態では、薬剤は、宿主のウラシルDNAグリコシラーゼに結合し、DNAからのウラシル残基の除去を防止するタンパク質またはその断片である。一実施形態では、UGIとは、ウラシルDNAグリコシラーゼの塩基除去修復酵素を阻害することができるタンパク質、その断片、またはドメインのことである。いくつかの実施形態では、UGIドメインは、野生型UGIまたはその改変バージョンを含む。いくつかの実施形態では、UGIドメインは、以下に記載する例示的なアミノ酸配列の断片を含む。いくつかの実施形態では、UGI断片は、以下に示す例示的なUGI配列の少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%を含むアミノ酸配列を含む。いくつかの実施形態では、UGIは、以下に記載するように、例示的なUGIアミノ酸配列またはその断片に相同であるアミノ酸配列を含む。いくつかの実施形態では、UGIまたはその一部は、以下に記載するように、野生型UGIもしくはUGI配列、またはその一部と、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、少なくとも99.5%、少なくとも99.9%、または100%の同一性である。例示的なUGIは、以下のようなアミノ酸配列を含む:
>splP14739IUNGI_BPPB2ウラシルDNAグリコシラーゼ阻害因子
MTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLT S D APE YKPW ALVIQDS NGENKIKML。
本明細書において提供される範囲は、その範囲内のすべての値の簡略表記であることが理解される。例えば、1~50の範囲は、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、または50からなる群からの任意の数、数の組み合わせ、または下位範囲を含むことが理解される。
本明細書の変数の任意の定義の中の化学基のリストの列挙は、任意の単一の基または列挙した基の組み合わせとしてその変数の定義を含む。本明細書の変数または態様についての実施形態の列挙は、任意の単一の実施形態として、または任意の他の実施形態もしくはその一部と組み合わせてその実施形態を含む。
本明細書に提供する任意の組成物または方法は、本明細書に提供する任意の他の組成物及び方法のうちの1つ以上と組み合わせることができる。
本明細書の説明及び実施例は、本開示の実施形態を詳細に示す。本開示は、本明細書に記載する特定の実施形態に限定されず、したがって、様々に異なり得ることを理解されたい。当業者であれば、本開示の多くの変形及び修正が存在し、それらが本開示の範囲内に含まれることを認識するであろう。
すべての用語は、当業者によって理解されるであろうように理解されることを意図している。別段の定義がない限り、本明細書中で使用するすべての技術用語及び科学用語は、本開示が関与する当業者によって一般に理解される意味と同じ意味を有する。
本明細書に開示するいくつかの実施形態の実施は、別途示されない限り、当技術分野の技術の範囲内である免疫学、生化学、化学、分子生物学、微生物学、細胞生物学、ゲノミクス及び組換えDNAの従来技術を使用する。例えば、Sambrook and Green, Molecular Cloning: A Laboratory Manual,4th Edition (2012);the series Current Protocols in Molecular Biology (F.M. Ausubel, et al. eds.);the series Methods In Enzymology(Academic Press, Inc.),PCR 2:A Practical Approach (M.J. MacPherson, B.D. Hames and G.R. Taylor eds. (1995)),Harlow and Lane, eds. (1988) Antibodies, A Laboratory Manual, and Culture of Animal Cells: A Manual of Basic Technique and Specialized Applications,6th Edition (R.I. Freshney, ed. (2010))を参照されたい。
本開示の様々な特徴は、単一の実施形態の状況下に記載することができるが、特徴を、別個に、または任意の適切な組み合わせで提供することもできる。逆に、本開示は、明確にするために別個の実施形態の状況下に本明細書に記載することができるが、本開示はまた、単一の実施形態で実施することもできる。本明細書で使用される節の見出しは、単に構成目的のものであり、記載される主題を限定するものと解釈されるべきではない。
本開示の特徴は、添付の特許請求の範囲において、特に記載される。本明細書の特徴及び利点のより良い理解は、本開示の原理を利用する例示的な実施形態を記載する以下の詳細な説明を参照することによって、及び以下に記載する添付の図面を考慮して得られる。
B型肝炎表面抗原(HBsAg)遺伝子、ポリメラーゼ遺伝子、プロテインX遺伝子、及びコア遺伝子の部分的に二本鎖及び重複するオープンリーディングフレーム(ORF)を示す図である。HBsAg遺伝子は、ORF プレS1、ORF プレS2、及びORF Sを含み、それぞれ、大、中、及び小の表面タンパク質をコードする。ORFコアとPreCはキャプシドタンパク質をコードする。 HBVのライフサイクルを描いた図である。用語「ER」は、小胞体を意味する。用語「HBsAg」は、B型肝炎表面抗原を意味する。「HBx転写活性化因子」は、ポリメラーゼII及びIIIプロモーターのHBV特異的転写活性化因子である。 世界中のB型肝炎ウイルス遺伝子型の地理的分布の地図である。 ウイルス遺伝子に終止コドンを導入し、慢性HBVを治療するための脱塩基部位を生成するための塩基編集戦略の概要を示す。 終止コドンを導入するため、及び塩基編集を介して脱塩基を生成するために適合させたガイドRNAスクリーニング戦略の概要を示す。 cccDNAに脱塩基部位を生成するための保存されたgRNA設計を示す図である。 HBVゲノムの0.05%未満で発生するアミノ酸を生成すると予想される16個のガイドRNA(三角形として示されている)の相対位置を示すHBV cccDNAの図である。 gRNA候補によって生成された塩基編集の最大パーセンテージを示すグラフである。 gRNA候補に関する情報をまとめたチャートである。 図4A及び4Bは、塩基編集体を示す。図4Aは、APOBECシチジンデアミナーゼドメイン、Cas9ドメイン、及び2つのウラシルグリコシラーゼ阻害因子(UGI)ドメインを有する塩基編集体の図である。図4Bは、BE4の図を示す。 HBVゲノムへの本開示のガイドRNAのマッピングを示す図である。各三角形は、ユニークなガイドRNAを表す。 HBV遺伝子を標的とするガイドRNA分子のスクリーニング及びスクリーニングから観察された結果のサブセットをまとめた概略図である。「PAM」は、プロトスペーサー隣接モチーフを指す。「Pol」は、HBVポリメラーゼ遺伝子を指す。「S」は、HBV表面タンパク質を指す。「X」は、HBVタンパク質X遺伝子を指す。「コア」は、HBVコアタンパク質を指す。MSPbeam52、50、…などはガイドRNAを指し、本出願ではM52、M50、…などとも呼ばれる。このスクリーニングでは、20%を超えるオンターゲット塩基編集を示した12個のgRNAが同定された。 BE4及びA3ABE4塩基編集体を比較するグラフを含む。グラフは、各塩基編集体で使用される様々なガイドRNAで観察された編集率を示している。MSPbeam39、40、…などは、本出願ではM39、M40、…などとも呼ばれる。 HBVレンチウイルスベクターで形質導入し、塩基編集体をコードする核酸構築物でトランスフェクトしたHepG2-NTCP細胞株で観察された機能的塩基編集を示すグラフである。試験した核酸構築物は、DNA分子、野生型RNA分子、またはN1残基で修飾されたシュードウリジン(PsU)を含むRNA分子であった。「NTCP」とは、タウロコール酸ナトリウム共輸送ポリペプチドを指す。MSPbeam39、40、…などは、本出願ではM39、M40、…などとも呼ばれる。 HBVレンチウイルスベクターで形質導入し、塩基編集体をコードする核酸構築物でトランスフェクトしたHepG2-NTCP細胞株で観察された機能的塩基編集を示すグラフである。試験した核酸構築物は、DNAフォーマットのトランスフェクション(一方は塩基編集体をコードし、もう一方はgRNAをコードする2つのプラスミド)またはRNAフォーマット(RNAがN1残基で修飾されている、塩基編集体をコードするPsU修飾自家製mRNA及び合成gRNA)であった。RNAフォーマットで塩基編集体とストップ/機能変化(「FC」)リードgRNAを使用すると、HepG2-NTCP lenti HBV細胞株において最大80%の編集が観察された。「NTCP」とは、タウロコール酸ナトリウム共輸送ポリペプチドを指す。MSPbeam39、40、…などは、本出願ではM39、M40、…などとも呼ばれる。 HBVレンチウイルスベクターで形質導入し、BE4、BE4-VRQR、またはABE塩基編集体をコードする3つの核酸構築物のうちの1つでトランスフェクトしたHepG2-NTCP細胞株で観察された機能的塩基編集を示すグラフである。MSPbeam39、40、…などは、本出願ではM39、M40、…などとも呼ばれる。
HBVゲノムの保存領域にマッピングするガイドRNAを示す図である。 長期の初代肝細胞共培養を示す概略図である。 肝細胞単層または肝細胞共培養の実験タイムラインを示す。 共培養系で使用された、ドナー(RSE、TVR)由来の形質導入された初代肝細胞の画像を示す。 図13A~13Fは、HBVに感染させた初代ヒト肝細胞(PHH)系を特徴決定したものである。図13Aは、プレーティングから試験のエンドポイントまでの13日間の感染及び治療スケジュールを示すタイムラインである。 図13Bは、HBV感染PHH細胞の、未処理、インターフェロンによる処理、またはテノホビルによる処理後のPHH培養物中に存在する細胞外HBV DNAの量を示すグラフである。陰性対照として、PHH細胞を、ポリエチレングリコールなしでHBVウイルスに曝露させた。 図13Cは、図13B及び13Cの凡例に記載された実験条件に曝露させたPHH培養物中に存在するHBV表面抗原(HBsAg)の量を示すグラフである。 図13Dは、図13B及び13Cの凡例に記載された実験条件に曝露させたPHH培養物中に存在する細胞内HBV DNAの量を示すグラフである。 図13Eは、図13B及び13Cの凡例に記載された実験条件に曝露させたPHH培養物中に存在する全HBV RNAの量を示すグラフである。 図13Fは、図13B及び13Cの凡例に記載された実験条件に曝露させたPHH培養物中に存在するプレゲノムRNA (pgRNA)の量を示すグラフである。 BE4及びgRNAでのトランスフェクションが、HBVに感染したPHHにおけるHBVマーカーレベルの低下をもたらすことを示すグラフである。BE4塩基編集体をHBVゲノムのPol及びX遺伝子領域にそれぞれ標的指向化するガイドRNA52及び190を使用した。BE4を、ウリジングリコシラーゼ阻害因子(UGI)ドメインの存在下及び非存在下で試験した。 HBV感染させたPHH細胞でのスクリーニングにおける機能的ガイドRNAの同定を示すグラフであり、cccDNAの代理物であるHBsAgのレベルの低下は、機能的gRNAを示している。終止コドンを導入するガイドRNAはStop-39など…として記載されており、保存されたアミノ酸に変化を導入するガイドRNAは、保存-4など…として示される。さらなる分析のために選択したgRNA (Stop-191、保存-12)をボックスで示す。 HBVでの塩基編集作用の機構的態様を示す。UGIドメインを有するBE4塩基編集体(BE4)、UGIドメインを有さないBE4塩基編集体(BE4_noUGI)、Cas9、UGIドメインを有さない触媒的に不活性な(すなわち、ニッカーゼ活性がない)BE4塩基編集体(dBE4_noUGI)、または不活性Cas9 (dCas9)のいずれかをコードするmRNAでトランスフェクトしたHBV感染PHH細胞におけるHBsAgのレベルを示すグラフである。細胞を、塩基編集体のみをコードするmRNAでトランスフェクトしたか、またはgRNA191もしくはgRNA12のいずれかでもトランスフェクトした。 HBVでの塩基編集作用の機構的態様を示す。図16Aについて記載したようにトランスフェクトしたHBV感染PHH細胞における細胞外HBV DNAのレベルを示すグラフである。 HepG2-NTCP Lenti-HBV及びHBVに感染させたPHHにおける塩基編集を比較している。BE4及びUGIでトランスフェクトしたHepG2-NTCP Lenti-HBVと、UGIを有さないBE4で観察された編集効率を示すグラフである。 HepG2-NTCP Lenti-HBV及びHBVに感染させたPHHにおける塩基編集を比較している。BE4及びUGIでトランスフェクトしたHBV感染PHHと、UGIを有さないBE4で観察された編集効率を示すグラフである。 HBV-Lenti-HepG2とHBV感染PHHにおいて、gRNA190を使用して、塩基編集、インデル率、及びトランスバージョン率(すなわち、CからAまたはG)を比較するグラフである。 本明細書に記載の塩基編集試薬の抗ウイルス活性を評価するための臨床的に適切な系として、HBVウイルスに感染させた初代肝細胞共培養(PHH)の使用に関連する概略的タイムラインを示す。いくつかの実施形態では、HBVに感染させたPHH共培養物を、本明細書に記載の実験で使用して、塩基編集体の抗ウイルス効果をアッセイし、評価した。簡潔に述べると、塩基編集試薬(塩基編集体mRNA及び合成gRNA)を、2週間の間に2回リポフェクションを介してPHH共培養物にトランスフェクトした。第1のトランスフェクションは、HBV感染の3日後に実施し、ウイルストランスフェクション時にcccDNAが完全に形成されたことを確認した。細胞外パラメータ(HBsAg、HBeAg、及びHBV DNA)を、記載する実験の過程でモニタリングし、細胞内パラメータ(HBV DNA、ウイルスRNA、及び編集)を、記載する実験の最後にモニタリングした。HbsAgは、HBVの表面タンパク質抗原を指す。その検出は、個体におけるHBV感染を示す。HBeAgとは、ウイルスが活発に複製している場合に感染した血液中を循環するHBVタンパク質抗原であるB型肝炎e抗原を指す。HBeAgの存在は、個体が感染性であり、ウイルスを他者に広めることができることを示唆している。 HBV感染初代肝細胞共培養物(PHH)、ならびにHBVポリメラーゼ及びS遺伝子配列の交差点にあるポリヌクレオチド配列を標的とするgRNA12を使用する14日間の実験の結果を示す棒グラフを示す。抗ウイルス薬エンテカビルを、塩基編集体(BE4及びBE4-noUGI)の有効性を評価するための対照として使用した。観察されたように、BE4-noUGI塩基編集体及びgRNA12は、試験した4つすべてのウイルスマーカーパラメータの減少、すなわち、HBV DNA、HBsAg、HBeAg、及びpgRNAマーカーパラメータの量またはレベルの減少をもたらした。さらに、BE4-noUGI塩基編集体及びgRNA12は、エンテカビルと比較して、試験した4つすべてのHBVパラメータを減少させる上で全体的に優れたパフォーマンスを示した。したがって、本明細書に記載の塩基編集アプローチは、HBV抗ウイルス薬エンテカビルと比較して、試験したウイルス(HBV)パラメータを減少させるのにより効率的であることが示された。
複数のgRNA (gRNA多重化)をBE4と組み合わせて使用した結果を示す棒グラフを示す。評価したHBVパラメータには、pgRNA、HBsAg、HBeAg、及びHBV全DNAが含まれていた。結果は、特定のHBVパラメータのgRNA特異的減少を示しており、gRNA19は、試験した他のgRNAと比較してHBV阻害活性の向上を示している。さらに、特にgRNA19+gRNA190の組み合わせ、及びgRNA190、gRNA12、gRNA40及びgRNA52の組み合わせで、gRNA多重化を使用すると、HBV阻害の測定可能な向上が観察され、これらは最適なHBV阻害活性を示した。 HBVに感染させたPHH培養系及びBE4塩基編集体を使用した塩基編集の結果を示す棒グラフを示す。NGS配列は、HBVに感染させたPHH培養物から精製した全DNAと、cccDNAを濃縮した同じ試料で実行した。結果は、cccDNAを濃縮した試料で塩基編集(塩基編集率(%))の有意な増加を示し、したがって、BE4塩基編集体とgRNAによるHBV cccDNAの塩基編集が成功したことを示している。HBV-PHHから精製した全ゲノムDNAにおける塩基編集の減少の発見は、編集されたcccDNAが複製能力のあるウイルス粒子へと増殖することができないことを示唆している。 例えば、下記の実施例10に記載するように、BE4及びnoUGI (BE4_noUGI)と共に複数のgRNA (gRNA多重化)を使用した結果を示す棒グラフを示す。評価したHBVパラメータには、HBsAg、HBeAg、pgRNA、及びHBV全DNAが含まれていた。結果は、HBVパラメータの有意なgRNA特異的阻害を示しており、gRNA12及びgRNA19は阻害活性の増加を示している。さらに、BE_noUGIを用いたgRNA19のHBV阻害活性は、試験した他のgRNAの組み合わせと同等に効果的であることがわかった。 HBVに感染させたPHH培養系及びBE4_noUGI塩基編集体を使用した塩基編集の結果を示す棒グラフを示す。NGS配列は、HBVに感染させたPHH培養物から精製した全DNAと、cccDNAを濃縮した同じ試料で実行した。結果は、cccDNAを濃縮した試料で塩基編集(塩基編集率(%))の有意な増加を示し、したがって、BE_noUGIとgRNAによるHBV cccDNAの塩基編集が成功したことを示している。HBV-PHHから精製した全ゲノムDNAにおけるロバストな塩基編集活性の発見は、編集されたcccDNAが複製能力のあるウイルス粒子へと増殖することができないことを示唆している。 図25A~25Dは、ニッカーゼ活性のない塩基編集体dBE4_noUGI (H840A)及びHBVウイルスパラメータHBsAg (図25A)、細胞外HBV DNA (図25B)、HBeAg (図25C)、及びアルブミン(細胞生存率/代謝率)(図25D)における塩基編集体の有効性を評価するための長期(例えば、25日)実験におけるHBV感染PHH系の使用に関連するグラフ及び棒グラフを示す。この実験の結果は、dBE4_noUGI (D10A_H840A)とgRNA12が、HBVに感染させたPHHのウイルスパラメータを減少させることを示した。さらに、インターフェロンと塩基編集成分(dBE4_noUGI+gRNA12)の両方がHBVウイルスパラメータを減少させたが、インターフェロン治療は、本明細書に記載の塩基編集体及び塩基編集系の使用と比較してより毒性が高いことがわかった。塩基編集体dBE4_noUGI (H840A)は、アミノ酸配列MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLKSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSGGSKRTADGSEFESPKKKRKVEを含む。
図26A~26Cは、遺伝子型D及びCのHBVに感染させ、HBVパラメータ、すなわち、HBsAg (図26A)、HBeAg (図26B)及び細胞外HBV DNA (図26C)を評価することによって、HBVの低減または阻害において本明細書に記載するような塩基編集体(例えば、dBE4_no UGI)及びBE系(例えば、dBE4_no UGI+gRNA、例えば、gRNA12)を評価するためのPHH培養物を含む長期(例えば、25日)実験の結果を示すグラフ及び棒グラフを示す。この実験により、遺伝子型CのHBVが、実験の終了時にウイルス量がより高かったことから、より積極的に細胞に感染したことが示された。さらに、dBE4_no UGI及びgRNA12によるHBV感染PHH培養物のトランスフェクションは、遺伝子型DのHBV及び遺伝子型CのHBVの両方の対照と比較してウイルスパラメータの減少をもたらした。 図26A~26Cは、遺伝子型D及びCのHBVに感染させ、HBVパラメータ、すなわち、HBsAg (図26A)、HBeAg (図26B)及び細胞外HBV DNA (図26C)を評価することによって、HBVの低減または阻害において本明細書に記載するような塩基編集体(例えば、dBE4_no UGI)及びBE系(例えば、dBE4_no UGI+gRNA、例えば、gRNA12)を評価するためのPHH培養物を含む長期(例えば、25日)実験の結果を示すグラフ及び棒グラフを示す。この実験により、遺伝子型CのHBVが、実験の終了時にウイルス量がより高かったことから、より積極的に細胞に感染したことが示された。さらに、dBE4_no UGI及びgRNA12によるHBV感染PHH培養物のトランスフェクションは、遺伝子型DのHBV及び遺伝子型CのHBVの両方の対照と比較してウイルスパラメータの減少をもたらした。 図26A~26Cは、遺伝子型D及びCのHBVに感染させ、HBVパラメータ、すなわち、HBsAg (図26A)、HBeAg (図26B)及び細胞外HBV DNA (図26C)を評価することによって、HBVの低減または阻害において本明細書に記載するような塩基編集体(例えば、dBE4_no UGI)及びBE系(例えば、dBE4_no UGI+gRNA、例えば、gRNA12)を評価するためのPHH培養物を含む長期(例えば、25日)実験の結果を示すグラフ及び棒グラフを示す。この実験により、遺伝子型CのHBVが、実験の終了時にウイルス量がより高かったことから、より積極的に細胞に感染したことが示された。さらに、dBE4_no UGI及びgRNA12によるHBV感染PHH培養物のトランスフェクションは、遺伝子型DのHBV及び遺伝子型CのHBVの両方の対照と比較してウイルスパラメータの減少をもたらした。 図27A及び図27Bは、アデニン塩基編集体ABE7.10及びHBVポリメラーゼ活性部位を標的とするHBV特異的gRNA、例えば、gRNA94によるHBV感染PHH培養物のトランスフェクションの結果を示す棒グラフを示す。示すように、ABE7.10+gRNA94は、対照(未処置PHH、及びABE7.10のみを処置したPHH)と比較して、アッセイしたPHH培養物において有意なgRNA特異的HBV阻害、ならびにHBVマーカーHBsAg、HBeAg、pgRNA、及びHBV全DNAの減少を示した。(図27A)。 さらに、HBVに感染させたPHHにおけるABE7.10+gRNA94は、ロバストなHBV cccDNA編集をもたらした。(図27B)。全HBVゲノムDNAで観察された塩基編集の欠如は、編集されたHBV cccDNAが複製能力のあるウイルス粒子へと増殖することができないことを示唆している。
本発明は、HBVゲノムを編集するための組成物及び方法を特徴とする。例えば、本明細書で企図される組成物は、いくつかの実施形態では、塩基編集体、HBV遺伝子中の特定のヌクレオチドを標的とするガイド核酸を含むことができる。いくつかの実施形態では、編集により、ウイルスタンパク質のうちの1つのコード配列に未成熟終止コドンを導入する。別の実施形態では、編集により、1つ以上のHBVタンパク質のコード配列に1つ以上の機能的置換を導入する。
HBVゲノムは、3.2kbの部分的に二本鎖のDNAと、7つのタンパク質をコードするオープンリーディングフレーム(ORF)を含む。図1に示すように、オープンリーディングフレーム(ORF)Pは、ウイルスポリメラーゼをコードする。ORF C/PreCは、キャプシドタンパク質をコードする。ORF プレS1、ORF プレS2、及びORF Sは、それぞれ、大(L)、中(M)、及び小(S)の表面タンパク質をコードする。ORF Xは、分泌性Xタンパク質をコードする。
部分的に二本鎖のHBVゲノムは、宿主因子によって共有結合で閉じた環状DNA (cccDNA)に変換される。cccDNAは、宿主RNAポリメラーゼによって転写され、プレゲノムRNA (pgRNA)を含むウイルスmRNAを生成する。pgRNAは、HBVポリメラーゼによってゲノムHBV DNAに逆転写され、cccDNAに変換され、ビリオンにパッケージングされ、または宿主細胞のゲノムに組み込まれ得る(図2)。HBVライフサイクルの重要な成分であるcccDNAは、慢性HBV感染症の原因となる安定した分子である。HBVゲノムの編集は、cccDNAの形成を妨害し、それによってウイルスの病原性を低下させることができる。
10種類の異なるHBV遺伝子型(A~J)が存在する(図3A)。「遺伝子型」は、任意の他のゲノムとの配列同一性が92%未満であることを特徴とし、サブ遺伝子型は、配列同一性が96~92%未満であることを特徴とする。遺伝子型DのHBVは、米国で最も一般的である(図3A)。HBV遺伝子型Dの研究モデルは、ウイルスストック(例えば、遺伝子型D、サブ遺伝子型ayw (Imquest))及びマウスモデル(例えば、ヒト化マウスモデル(Phoenixbio))を含めて利用することができる。したがって、いくつかの実施形態では、HBV ORFを標的とし、編集するための方法及び組成物を提供する。これらの組成物は、Cas9または他の核酸プログラム可能なDNA結合タンパク質ドメイン及びアデノシンデアミナーゼドメインまたはシトシンデアミナーゼドメインを有する核酸塩基編集体を含み得る。いくつかの実施形態では、塩基編集体は、1つ以上の改変をHBV ORFに導入する。いくつかの実施形態では、改変は、HBVタンパク質の保存部分における変異をもたらす。特定の実施形態では、改変は、1つ以上の終止コドンを導入する。本明細書全体を通して、タンパク質の未成熟終止をもたらす終止コドンの導入は、アミノ酸記号、アミノ酸位置、及び用語STOPによって表される(例えば、R87STOPは、アミノ酸位置87でアルギニンをコードするコドンが終止コドンに置き換えられることを示す)。利点として、本発明の方法は、HBVゲノムに二本鎖切断を導入しない。
本発明は、塩基編集を使用して慢性HBVを治療するための戦略を提供する(図3B)。本明細書において、HBV遺伝子に終止コドンまたは機能的変異を導入するガイドRNAを同定するための、またはHBVゲノムの超保存領域に脱塩基部位を生成するgRNAを同定するためのスクリーニングを記載する(図3C)。本明細書に記載の方法及び組成物を使用してウイルス遺伝子に終止コドンを導入することは、二本鎖切断を生成することなく達成し、それにより、HBVが宿主のゲノムに組み込まれた後に宿主遺伝物質を切断するリスクを排除または低減することができる。さらに、組成物は、天然のHBV抗ウイルス制限因子であるデアミナーゼを使用する。例えば、インターフェロンαまたはリンホトキシンβ受容体(LTBR)でAPOBECサイトジンデアミナーゼを誘導すると、脱塩基部位の形成及びcccDNA分解が促進される(図3B)。さらに、ウラシルグリコシラーゼ阻害因子ドメインの非存在下で塩基編集体を使用すると、細胞のウラシルグリコシラーゼをcccDNAに標的指向化し、その分解を促進することができる。
提供する別のスクリーニングは、cccDNAで脱塩基部位を生成するために使用することができる保存されたgRNAを同定する。図3Dに示すように、レンチウイルスを使用して塩基編集体とgRNA (Lenti-HBV)を導入した場合、編集効率が20%を上回る7つのガイドRNAが同定された。保存領域を標的とするgRNAを図3Eに示す。いくつかのgRNAは、少なくとも45%の編集効率を有していた(図3F及び3G)。
いくつかの態様では、シチジンデアミナーゼドメインまたはアデノシンデアミナーゼドメインを含む塩基編集体を用いてHBV cccDNAを編集するための方法及び組成物を提供する。一実施形態では、塩基編集体は、APOBECシチジンデアミナーゼドメイン、Cas9ドメイン、及び任意選択で、1つ以上のウラシルグリコシラーゼ阻害因子(UGI)ドメインを含む(図4A、4B)。
核酸塩基編集体
本明細書において、ポリヌクレオチドの標的ヌクレオチド配列を編集、修飾、または改変するための塩基編集体または核酸塩基編集体を開示する。本明細書において、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン及び核酸塩基編集ドメイン(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ)を含む核酸塩基編集体または塩基編集体を記載する。ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、結合したガイドポリヌクレオチド(例えば、gRNA)と組み合わせた場合、標的ポリヌクレオチド配列に特異的に結合し(すなわち、結合ガイド核酸の塩基と標的ポリヌクレオチド配列の塩基との間の相補的塩基対形成を介して)、それにより、編集することが望まれる標的核酸配列に塩基編集体を局在化させることができる。いくつかの実施形態では、標的ポリヌクレオチド配列は、一本鎖DNAまたは二本鎖DNAを含む。いくつかの実施形態では、標的ポリヌクレオチド配列は、RNAを含む。いくつかの実施形態では、標的ポリヌクレオチド配列は、DNA-RNAハイブリッドを含む。
ポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン
ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインはまた、RNAに結合する核酸プログラム可能なタンパク質を含み得ることを理解すべきである。例えば、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインを、該ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインをRNAへガイドする核酸と会合させることができる。他の核酸プログラム可能なDNA結合タンパク質もまた、本開示の範囲内であるが、それらは、本開示に具体的に記載されていない。
塩基編集体のポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、それ自体が1つ以上のドメインを含み得る。例えば、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、1つ以上のヌクレアーゼドメインを含み得る。いくつかの実施形態では、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインのヌクレアーゼドメインは、エンドヌクレアーゼまたはエキソヌクレアーゼを含み得る。本明細書において、用語「エキソヌクレアーゼ」とは、遊離末端から核酸(例えば、RNAまたはDNA)を消化することができるタンパク質またはポリペプチドを指し、用語「エンドヌクレアーゼ」とは、核酸(例えば、DNAまたはRNA)の内部領域を触媒する(例えば、切断する)ことができるタンパク質またはポリペプチドを指す。いくつかの実施形態では、エンドヌクレアーゼは、二本鎖核酸の一本鎖を切断することができる。いくつかの実施形態では、エンドヌクレアーゼは、二本鎖核酸分子の両方の鎖を切断することができる。いくつかの実施形態では、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、デオキシリボヌクレアーゼであり得る。いくつかの実施形態では、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、リボヌクレアーゼであり得る。
いくつかの実施形態では、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインのヌクレアーゼドメインは、標的ポリヌクレオチドの0、1、または2本の鎖を切断することができる。いくつかの場合では、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、ニッカーゼドメインを含み得る。本明細書において、用語「ニッカーゼ」とは、二本鎖核酸分子(例えば、DNA)中の2本の鎖のうちの1本の鎖のみを切断することができるヌクレアーゼドメインを含むポリヌクレオチドプログラム可能なヌクレオチド結合ドメインを指す。いくつかの実施形態では、ニッカーゼは、1つ以上の変異を活性なポリヌクレオチドプログラム可能なヌクレオチド結合ドメインに導入することによって、完全に触媒的に活性な(例えば、天然の)形態のポリヌクレオチドプログラム可能なヌクレオチド結合ドメインから誘導され得る。例えば、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインがCas9に由来するニッカーゼドメインを含む場合、Cas9由来のニッカーゼドメインは、D10A変異及び840位のヒスチジンを含み得る。そのような場合、残基H840は触媒活性を保持し、それによって核酸二本鎖の一本鎖を切断することができる。別の例では、Cas9由来のニッカーゼドメインは、H840A変異を含むことができ、一方、10位のアミノ酸残基はDのままである。いくつかの実施形態では、ニッカーゼは、完全に触媒的に活性な(例えば、天然)形態のポリヌクレオチドプログラム可能なヌクレオチド結合ドメインから、ニッカーゼ活性を必要としないヌクレアーゼドメインの全部または一部を除去することにより、誘導され得る。例えば、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインがCas9に由来するニッカーゼドメインを含む場合、Cas9由来のニッカーゼドメインは、RuvCドメインまたはHNHドメインの全部または一部の欠失を含み得る。
例示的な触媒活性Cas9のアミノ酸配列は以下の通りである:
MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD。
したがって、ニッカーゼドメインを含むポリヌクレオチドプログラム可能なヌクレオチド結合ドメインを含む塩基編集体は、特定のポリヌクレオチド標的配列(例えば、結合したガイド核酸の相補的配列によって決定される)で一本鎖DNA切断(ニック)を生成することができる。いくつかの実施形態では、ニッカーゼドメイン(例えば、Cas9由来のニッカーゼドメイン)を含む塩基編集体によって切断される核酸二重標的ポリヌクレオチド配列の鎖は、塩基編集体によって編集されない鎖である(すなわち、塩基編集体によって切断される鎖は、編集される塩基を含む鎖の反対側にある)。他の実施形態では、ニッカーゼドメイン(例えば、Cas9由来のニッカーゼドメイン)を含む塩基編集体は、編集の標的となるDNA分子の鎖を切断することができる。そのような場合、非標的鎖は切断されない。
触媒的に不活性の(すなわち、標的ポリヌクレオチド配列を切断することができない)ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインを含む塩基編集体もまた、本明細書において提供する。本明細書において、用語「触媒的に不活性」及び「ヌクレアーゼ不活性」は、核酸の鎖を切断することができないという結果をもたらす1つ以上の変異及び/または欠失を有するポリヌクレオチドプログラム可能なヌクレオチド結合ドメインを指すために同じ意味で用いられる。いくつかの実施形態では、触媒的に不活性なポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン塩基編集体は、1つ以上のヌクレアーゼドメインにおける特定の点変異の結果として、ヌクレアーゼ活性を欠損し得る。例えば、Cas9ドメインを含む塩基編集体の場合、Cas9は、D10A変異とH840A変異の両方を含み得る。そのような変異は、両方のヌクレアーゼドメインを不活性化し、それによってヌクレアーゼ活性の喪失をもたらす。他の実施形態では、触媒的に不活性なポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、触媒ドメイン(例えば、RuvC1及び/またはHNHドメイン)の全部または一部の1つ以上の欠失を含み得る。さらなる実施形態では、触媒的に不活性なポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、点変異(例えば、D10AまたはH840A)、及びヌクレアーゼドメインの全部または一部の欠失を含む。
また、本明細書では、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインの以前の機能的バージョンから、触媒的に不活性なポリヌクレオチドプログラム可能なヌクレオチド結合ドメインを生成することができる変異が企図される。例えば、触媒的に不活性なCas9 (「dCas9」)の場合、D10A及びH840A以外の変異を有する変異体を提供し、その結果、ヌクレアーゼ不活性化Cas9が生じる。そのような変異は、例として、D10及びH840での他のアミノ酸置換、またはCas9のヌクレアーゼドメイン内の他の置換(例えば、HNHヌクレアーゼサブドメイン及び/またはRuvC1サブドメインでの置換)を含む。追加の適切なヌクレアーゼ不活性dCas9ドメインは、本開示及び当技術分野の知識に基づいて当業者には明らかであり得、そして本開示の範囲内である。そのような追加の例示的な適切なヌクレアーゼ不活性Cas9ドメインには、D10A/H840A、D10A/D839A/H840A、及びD10A/D839A/H840A/N863A変異ドメインが含まれるが、これらに限定されない(例えば、Prashant et al., CAS9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering. Nature Biotechnology.2013;31 (9):833-838を参照のこと;それぞれの全内容は、参照により本明細書に援用される。
塩基編集体に組み込むことができるポリヌクレオチドプログラム可能なヌクレオチド結合ドメインの非限定的な例として、CRISPRタンパク質由来ドメイン、制限ヌクレアーゼ、メガヌクレアーゼ、TALヌクレアーゼ(TALEN)、及びジンクフィンガーヌクレアーゼ(ZFN)が挙げられる。いくつかの場合では、塩基編集体は、天然もしくは改変タンパク質またはその一部を含むポリヌクレオチドプログラム可能なヌクレオチド結合ドメインを含み、結合したガイド核酸を介して、CRISPR (すなわち、Clustered Regularly Interspaced Short Palindromic Repeats)を介した核酸の改変中に核酸配列に結合することができる。そのようなタンパク質は、本明細書中では「CRISPRタンパク質」と呼ばれる。したがって、本明細書において、CRISPRタンパク質の全部または一部を含むポリヌクレオチドプログラム可能なヌクレオチド結合ドメインを含む塩基編集体(すなわち、塩基編集体の「CRISPRタンパク質由来ドメイン」とも呼ばれる、CRISPRタンパク質の全部または一部をドメインとして含む塩基編集体)を開示する。塩基編集体に組み込まれたCRISPRタンパク質由来のドメインは、野生型または天然バージョンのCRISPRタンパク質と比較して改変することができる。例えば、以下に記載するように、CRISPRタンパク質由来ドメインは、CRISPRタンパク質の野生型または天然バージョンと比較して、1つ以上の変異、挿入、欠失、再配列及び/または組換えを含み得る。
CRISPRは、可動性遺伝子エレメント(ウイルス、転移因子、及び接合プラスミド)に対する防御を提供する適応免疫系である。CRISPRクラスターには、スペーサー、前述の可動性エレメントに相補的な配列、及び標的侵入核酸が含まれる。CRISPRクラスターは、転写され、プロセシングされてCRISPR RNA (crRNA)になる。II型CRISPR系では、プレcrRNAを正しくプロセシングするには、トランスコードされた低分子RNA (tracrRNA)、内在性リボヌクレアーゼ3 (rnc)及びCas9タンパク質が必要である。tracrRNAは、プレcrRNAのリボヌクレアーゼ3支援プロセシングのガイドとして機能する。続いて、Cas9/crRNA/tracrRNAは、スペーサーに相補的な直鎖または環状のdsDNA標的をエンドヌクレアーゼ的に切断する。crRNAに相補的でない標的鎖は、最初にエンドヌクレアーゼ的に切断され、次いで3’-5’エキソヌクレアーゼ的にトリミングされる。自然界では、DNAの結合及び切断には、通常、タンパク質と両方のRNAが必要である。しかしながら、単一のガイドRNA (「sgRNA」、または単に「gNRA」)は、crRNA及びtracrRNAの両方の態様を単一のRNA種に組み込むように改変することができる。例えば、Jinek M., Chylinski K., Fonfara I., Hauer M., Doudna J.A., Charpentier E.Science 337:816-821 (2012)を参照されたい(これらの全内容は、参照により本明細書に援用される)。Cas9は、CRISPRリピート配列の短いモチーフ(PAMまたはプロトスペーサー隣接モチーフ)を認識して、自己と非自己を区別するのに役立つ。
いくつかの実施形態では、本明細書に記載の方法は、改変されたCasタンパク質を利用することができる。ガイドRNA (gRNA)は、Cas結合に必要な足場配列と、改変するゲノム(またはポリヌクレオチド、例えば、DNAもしくはRNA)標的を定義するユーザー定義の約20ヌクレオチドスペーサーからなる短い合成RNAである。したがって、当業者は、gRNAに存在する標的配列を変更することにより、Casタンパク質のゲノムまたはポリヌクレオチド標的を変更することができる。Casタンパク質の特異性は、ゲノムの他の部分と比較して、gRNA標的配列がゲノムポリヌクレオチド標的配列に対してどれほど特異的であるかによって部分的に決定される。
いくつかの実施形態では、gRNA足場配列は以下の通りである:
GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU。
一実施形態では、RNA足場は、ステムループを含む。一実施形態では、RNA足場は核酸配列:GUUUUUGUACUCUCAAGAUUUAAGUAACUGUACAACGAAACUUACACAGUUACUUAAAUCUUGCAGAAGCUACAAAGAUAAGGCUUCAUGCCGAAAUCAACACCCUGUCAUUUUAUGGCAGGGUGを含む。一実施形態では、RNA足場は核酸配列:GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUを含む。
一実施形態では、S. pyrogenesのsgRNA足場ポリヌクレオチド配列は以下の通りである:
GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC。
一実施形態では、S. aureusのsgRNA足場ポリヌクレオチド配列は以下の通りである:
GUUUUAGUACUCUGUAAUGAAAAUUACAGAAUCUACUAAAACAAGGCAAAAUGCCGUGUUUAUCUCGUCAACUUGUUGGCGAGA。
一実施形態では、BhCas12bのsgRNA足場は、以下のポリヌクレオチド配列を有する:
GUUCUGTCUUUUGGUCAGGACAACCGUCUAGCUAUAAGUGCUGCAGGGUGUGAGAAACUCCUAUUGCUGGACGAUGUCUCUUACGAGGCAUUAGCAC。
一実施形態では、BvCas12b sgRNA足場は、以下のポリヌクレオチド配列を有する:GACCUAUAGGGUCAAUGAAUCUGUGCGUGUGCCAUAAGUAAUUAAAAAUUACCCACCACAGGAGCACCUGAAAACAGGUGCUUGGCAC。
いくつかの実施形態では、塩基編集体に組み込まれるCRISPRタンパク質由来ドメインは、結合したガイド核酸と組み合わせた場合に標的ポリヌクレオチドに結合することができるエンドヌクレアーゼ(例えば、デオキシリボヌクレアーゼまたはリボヌクレアーゼ)である。いくつかの実施形態では、塩基編集体に組み込まれたCRISPRタンパク質由来ドメインは、結合したガイド核酸と組み合わせた場合に標的ポリヌクレオチドに結合することができるニッカーゼである。いくつかの実施形態では、塩基編集体に組み込まれたCRISPRタンパク質由来ドメインは、結合したガイド核酸と組み合わせた場合に標的ポリヌクレオチドに結合することができる触媒的に不活性なドメインである。いくつかの実施形態では、塩基編集体のCRISPRタンパク質由来ドメインが結合する標的ポリヌクレオチドは、DNAである。いくつかの実施形態では、塩基編集体のCRISPRタンパク質由来ドメインが結合する標的ポリヌクレオチドは、RNAである。
本明細書中で使用し得るCasタンパク質には、クラス1及びクラス2が含まれる。Casタンパク質の非限定的な例として、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5d、Cas5t、Cas5h、Cas5a、Cas6、Cas7、Cas8、Cas9 (Csn1またはCsx12としても知られる)、Cas10、Csy1、Csy2、Csy3、Csy4、Cse1、Cse2、Cse3、Cse4、Cse5e、Csc1、Csc2、Csa5、Csn1、Csn2、Csm1、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx1S、Csf1、Csf2、CsO、Csf4、Csd1、Csd2、Cst1、Cst2、Csh1、Csh2、Csa1、Csa2、Csa3、Csa4、Csa5、Cas12a/Cpf1、Cas12b/C2c1、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、及びCas12i、CARF、DinG、その相同体、またはその修飾または改変バージョンが挙げられる。2つの機能的なエンドヌクレアーゼドメイン:RuvC及びHNHを有するCas9などの未改変のCRISPR酵素は、DNA切断活性を有し得る。CRISPR酵素は、標的配列で、例えば、標的配列内及び/または標的配列の相補配列内で、一方または両方の鎖の切断を指示することができる。例えば、CRISPR酵素は、標的配列の最初または最後のヌクレオチドから、約1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、200、500、またはそれ以上の塩基対内の一方または両方の鎖の切断を指示することができる。
変異型CRISPR酵素が、標的配列を含む標的ポリヌクレオチドの一方または両方の鎖を切断する能力を欠くように、対応する野生型酵素に関して変異導入したCRISPR酵素をコードするベクターを使用することができる。Cas9は、野生型の例示的なCas9ポリペプチド(例えば、S. pyogenes由来のCas9)に対して、少なくともまたは少なくとも約50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性及び/または配列相同性を有するポリペプチドを指し得る。Cas9は、野生型の例示的なCas9ポリペプチド(例えば、S. pyogenes由来の)に対して、多くともまたは多くとも約50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性及び/または配列相同性を有するポリペプチドを指し得る。Cas9は、欠失、挿入、置換、バリアント、変異、融合、キメラ、またはそれらの任意の組み合わせなどのアミノ酸変化を含み得るCas9タンパク質の野生型または改変形態を指し得る。
いくつかの実施形態では、塩基編集体のCRISPRタンパク質由来ドメインは、Corynebacterium ulcerans (NCBI Refs:NC_015683.1,NC_017317.1);Corynebacterium diphtheria (NCBI Refs:NC_016782.1,NC_016786.1);Spiroplasma syrphidicola (NCBI Ref:NC_021284.1);Prevotella intermedia (NCBI Ref:NC_017861.1);Spiroplasma taiwanense (NCBI Ref:NC_021846.1);Streptococcus iniae (NCBI Ref:NC_021314.1);Belliella baltica (NCBI Ref:NC_018010.1);Psychroflexus torquis (NCBI Ref:NC_018721.1);Streptococcus thermophilus (NCBI Ref:YP_820832.1);Listeria innocua (NCBI Ref:NP_472073.1);Campylobacter jejuni (NCBI Ref:YP_002344900.1);Neisseria meningitidis (NCBI Ref:YP_002342100.1),Streptococcus pyogenes、またはStaphylococcus aureus由来のCas9の全部または一部を含み得る。
核酸塩基編集体のCas9ドメイン
Cas9ヌクレアーゼの配列及び構造は当業者に周知である(例えば、”Complete genome sequence of an Ml strain of Streptococcus pyogenes.” Ferretti et al., J.J., McShan W.M., Ajdic D.J., Savic D.J., Savic G., Lyon K., Primeaux C,Sezate S., Suvorov A.N., Kenton S., Lai H.S., Lin S.P., Qian Y., Jia H.G., Najar F.Z., Ren Q., Zhu H., Song L., White J., Yuan X., Clifton S.W., Roe B.A., McLaughlin R.E., Proc.Natl.Acad.Sci.U.S.A.98:4658-4663 (2001);”CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III.” Deltcheva E., Chylinski K., Sharma CM., Gonzales K., Chao Y., Pirzada Z.A., Eckert M.R., Vogel J., Charpentier E., Nature 471:602-607 (2011)、及び”A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.” Jinek M., Chylinski K., Fonfara I., Hauer M., Doudna J.A., Charpentier E. Science 337:816-821 (2012)を参照されたい(これらのそれぞれの全内容は、参照により本明細書に援用される))。Cas9オルソログは、S. pyogenes及びS. thermophilusを含むがこれらに限定されない、様々な種で記載されている。追加の適切なCas9ヌクレアーゼ及び配列は、本開示に基づいて当業者には明らかであり、そのようなCas9ヌクレアーゼ及び配列として、Chylinski, Rhun, and Charpentier, ”The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems” (2013)RNA Biology 10:5,726-737に開示されている生物及び遺伝子座に由来するCas9配列が挙げられ;その全内容は、参照により本明細書に援用される。
いくつかの態様では、核酸プログラム可能なDNA結合タンパク質(napDNAbp)はCas9ドメインである。本明細書において、非限定的な例示的なCas9ドメインを提供する。Cas9ドメインは、ヌクレアーゼ活性Cas9ドメイン、ヌクレアーゼ不活性Cas9ドメイン、またはCas9ニッカーゼであり得る。いくつかの実施形態では、Cas9ドメインは、ヌクレアーゼ活性ドメインである。例えば、Cas9ドメインは、二本鎖核酸の両方の鎖(例えば、二本鎖DNA分子の両方の鎖)を切断するCas9ドメインであり得る。いくつかの実施形態では、Cas9ドメインは、本明細書に記載のアミノ酸配列のいずれか1つを含む。いくつかの実施形態では、Cas9ドメインは、本明細書に記載するアミノ酸配列のいずれか1つに対して、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。いくつかの実施形態では、Cas9ドメインは、本明細書に記載のアミノ酸配列のいずれか1つと比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50またはそれ以上の変異を有するアミノ酸配列を含む。いくつかの実施形態では、Cas9ドメインは、本明細書に記載のアミノ酸配列のいずれか1つと比較して、少なくとも10、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも150、少なくとも200、少なくとも250、少なくとも300、少なくとも350、少なくとも400、少なくとも500、少なくとも600、少なくとも700、少なくとも800、少なくとも900、少なくとも1000、少なくとも1100、または少なくとも1200の同一の連続アミノ酸残基を有するアミノ酸配列を含む。
いくつかの実施形態では、Cas9の断片を含むタンパク質を提供する。例えば、いくつかの実施形態では、タンパク質は、2つのCas9ドメイン: (1)Cas9のgRNA結合ドメイン;または(2)Cas9のDNA切断ドメインのうちの1つを含む。いくつかの実施形態では、Cas9またはその断片を含むタンパク質は、「Cas9バリアント」と呼ばれる。Cas9バリアントは、Cas9またはその断片と相同性を共有する。例えば、Cas9バリアントは、野生型Cas9と、少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一である。いくつかの実施形態では、Cas9バリアントは、野生型Cas9と比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50またはそれ以上のアミノ酸変化を有し得る。いくつかの実施形態では、Cas9バリアントは、Cas9の断片(例えば、gRNA結合ドメインまたはDNA切断ドメイン)を含み、その結果、断片は、野生型Cas9の対応する断片と、少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一である。いくつかの実施形態では、断片は、対応する野生型Cas9の、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%同一、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%のアミノ酸長である。いくつかの実施形態では、断片は、少なくとも100アミノ酸長である。いくつかの実施形態では、断片は、少なくとも100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、または少なくとも1300アミノ酸長である。
いくつかの実施形態では、本明細書中で提供するCas9融合タンパク質は、Cas9タンパク質の全長アミノ酸配列、例えば、本明細書中で提供するCas9配列の1つを含む。しかしながら、他の実施形態では、本明細書中で提供する融合タンパク質は、全長のCas9配列を含まず、1つ以上のその断片のみを含む。本明細書において、適切なCas9ドメイン及びCas9断片の例示的なアミノ酸配列を提供し、Cas9ドメイン及び断片のさらなる適切な配列は、当業者には明らかであろう。
Cas9タンパク質は、ガイドRNAに相補性を有する特定のDNA配列にCas9タンパク質をガイドするガイドRNAと結合することができる。いくつかの実施形態では、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、Cas9ドメイン、例えば、ヌクレアーゼ活性Cas9、Cas9ニッカーゼ(nCas9)、またはヌクレアーゼ不活性Cas9 (dCas9)である。核酸プログラム可能なDNA結合タンパク質の例として、Cas9 (例えば、dCas9及びnCas9)、CasX、CasY、Cpf1、Cas12b/C2C1、及びCas12c/C2C3が挙げられるが、これらに限定されない。
いくつかの実施形態では、野生型Cas9は、Streptococcus pyogenes由来のCas9 (NCBI参照配列:NC_017053.1、以下のヌクレオチド及びアミノ酸配列)に対応する。
ATGGATAAGAAATACTCAATAGGCTTAGATATCGGCACAAATAGCGTCGGATGGGCGGTGATCACTGATGATTATAAGGTTCCGTCTAAAAAGTTCAAGGTTCTGGGAAATACAGACCGCCACAGTATCAAAAAAAATCTTATAGGGGCTCTTTTATTTGGCAGTGGAGAGACAGCGGAAGCGACTCGTCTCAAACGGACAGCTCGTAGAAGGTATACACGTCGGAAGAATCGTATTTGTTATCTACAGGAGATTTTTTCAAATGAGATGGCGAAAGTAGATGATAGTTTCTTTCATCGACTTGAAGAGTCTTTTTTGGTGGAAGAAGACAAGAAGCATGAACGTCATCCTATTTTTGGAAATATAGTAGATGAAGTTGCTTATCATGAGAAATATCCAACTATCTATCATCTGCGAAAAAAATTGGCAGATTCTACTGATAAAGCGGATTTGCGCTTAATCTATTTGGCCTTAGCGCATATGATTAAGTTTCGTGGTCATTTTTTGATTGAGGGAGATTTAAATCCTGATAATAGTGATGTGGACAAACTATTTATCCAGTTGGTACAAATCTACAATCAATTATTTGAAGAAAACCCTATTAACGCAAGTAGAGTAGATGCTAAAGCGATTCTTTCTGCACGATTGAGTAAATCAAGACGATTAGAAAATCTCATTGCTCAGCTCCCCGGTGAGAAGAGAAATGGCTTGTTTGGGAATCTCATTGCTTTGTCATTGGGATTGACCCCTAATTTTAAATCAAATTTTGATTTGGCAGAAGATGCTAAATTACAGCTTTCAAAAGATACTTACGATGATGATTTAGATAATTTATTGGCGCAAATTGGAGATCAATATGCTGATTTGTTTTTGGCAGCTAAGAATTTATCAGATGCTATTTTACTTTCAGATATCCTAAGAGTAAATAGTGAAATAACTAAGGCTCCCCTATCAGCTTCAATGATTAAGCGCTACGATGAACATCATCAAGACTTGACTCTTTTAAAAGCTTTAGTTCGACAACAACTTCCAGAAAAGTATAAAGAAATCTTTTTTGATCAATCAAAAAACGGATATGCAGGTTATATTGATGGGGGAGCTAGCCAAGAAGAATTTTATAAATTTATCAAACCAATTTTAGAAAAAATGGATGGTACTGAGGAATTATTGGTGAAACTAAATCGTGAAGATTTGCTGCGCAAGCAACGGACCTTTGACAACGGCTCTATTCCCCATCAAATTCACTTGGGTGAGCTGCATGCTATTTTGAGAAGACAAGAAGACTTTTATCCATTTTTAAAAGACAATCGTGAGAAGATTGAAAAAATCTTGACTTTTCGAATTCCTTATTATGTTGGTCCATTGGCGCGTGGCAATAGTCGTTTTGCATGGATGACTCGGAAGTCTGAAGAAACAATTACCCCATGGAATTTTGAAGAAGTTGTCGATAAAGGTGCTTCAGCTCAATCATTTATTGAACGCATGACAAACTTTGATAAAAATCTTCCAAATGAAAAAGTACTACCAAAACATAGTTTGCTTTATGAGTATTTTACGGTTTATAACGAATTGACAAAGGTCAAATATGTTACTGAGGGAATGCGAAAACCAGCATTTCTTTCAGGTGAACAGAAGAAAGCCATTGTTGATTTACTCTTCAAAACAAATCGAAAAGTAACCGTTAAGCAATTAAAAGAAGATTATTTCAAAAAAATAGAATGTTTTGATAGTGTTGAAATTTCAGGAGTTGAAGATAGATTTAATGCTTCATTAGGCGCCTACCATGATTTGCTAAAAATTATTAAAGATAAAGATTTTTTGGATAATGAAGAAAATGAAGATATCTTAGAGGATATTGTTTTAACATTGACCTTATTTGAAGATAGGGGGATGATTGAGGAAAGACTTAAAACATATGCTCACCTCTTTGATGATAAGGTGATGAAACAGCTTAAACGTCGCCGTTATACTGGTTGGGGACGTTTGTCTCGAAAATTGATTAATGGTATTAGGGATAAGCAATCTGGCAAAACAATATTAGATTTTTTGAAATCAGATGGTTTTGCCAATCGCAATTTTATGCAGCTGATCCATGATGATAGTTTGACATTTAAAGAAGATATTCAAAAAGCACAGGTGTCTGGACAAGGCCATAGTTTACATGAACAGATTGCTAACTTAGCTGGCAGTCCTGCTATTAAAAAAGGTATTTTACAGACTGTAAAAATTGTTGATGAACTGGTCAAAGTAATGGGGCATAAGCCAGAAAATATCGTTATTGAAATGGCACGTGAAAATCAGACAACTCAAAAGGGCCAGAAAAATTCGCGAGAGCGTATGAAACGAATCGAAGAAGGTATCAAAGAATTAGGAAGTCAGATTCTTAAAGAGCATCCTGTTGAAAATACTCAATTGCAAAATGAAAAGCTCTATCTCTATTATCTACAAAATGGAAGAGACATGTATGTGGACCAAGAATTAGATATTAATCGTTTAAGTGATTATGATGTCGATCACATTGTTCCACAAAGTTTCATTAAAGACGATTCAATAGACAATAAGGTACTAACGCGTTCTGATAAAAATCGTGGTAAATCGGATAACGTTCCAAGTGAAGAAGTAGTCAAAAAGATGAAAAACTATTGGAGACAACTTCTAAACGCCAAGTTAATCACTCAACGTAAGTTTGATAATTTAACGAAAGCTGAACGTGGAGGTTTGAGTGAACTTGATAAAGCTGGTTTTATCAAACGCCAATTGGTTGAAACTCGCCAAATCACTAAGCATGTGGCACAAATTTTGGATAGTCGCATGAATACTAAATACGATGAAAATGATAAACTTATTCGAGAGGTTAAAGTGATTACCTTAAAATCTAAATTAGTTTCTGACTTCCGAAAAGATTTCCAATTCTATAAAGTACGTGAGATTAACAATTACCATCATGCCCATGATGCGTATCTAAATGCCGTCGTTGGAACTGCTTTGATTAAGAAATATCCAAAACTTGAATCGGAGTTTGTCTATGGTGATTATAAAGTTTATGATGTTCGTAAAATGATTGCTAAGTCTGAGCAAGAAATAGGCAAAGCAACCGCAAAATATTTCTTTTACTCTAATATCATGAACTTCTTCAAAACAGAAATTACACTTGCAAATGGAGAGATTCGCAAACGCCCTCTAATCGAAACTAATGGGGAAACTGGAGAAATTGTCTGGGATAAAGGGCGAGATTTTGCCACAGTGCGCAAAGTATTGTCCATGCCCCAAGTCAATATTGTCAAGAAAACAGAAGTACAGACAGGCGGATTCTCCAAGGAGTCAATTTTACCAAAAAGAAATTCGGACAAGCTTATTGCTCGTAAAAAAGACTGGGATCCAAAAAAATATGGTGGTTTTGATAGTCCAACGGTAGCTTATTCAGTCCTAGTGGTTGCTAAGGTGGAAAAAGGGAAATCGAAGAAGTTAAAATCCGTTAAAGAGTTACTAGGGATCACAATTATGGAAAGAAGTTCCTTTGAAAAAAATCCGATTGACTTTTTAGAAGCTAAAGGATATAAGGAAGTTAAAAAAGACTTAATCATTAAACTACCTAAATATAGTCTTTTTGAGTTAGAAAACGGTCGTAAACGGATGCTGGCTAGTGCCGGAGAATTACAAAAAGGAAATGAGCTGGCTCTGCCAAGCAAATATGTGAATTTTTTATATTTAGCTAGTCATTATGAAAAGTTGAAGGGTAGTCCAGAAGATAACGAACAAAAACAATTGTTTGTGGAGCAGCATAAGCATTATTTAGATGAGATTATTGAGCAAATCAGTGAATTTTCTAAGCGTGTTATTTTAGCAGATGCCAATTTAGATAAAGTTCTTAGTGCATATAACAAACATAGAGACAAACCAATACGTGAACAAGCAGAAAATATTATTCATTTATTTACGTTGACGAATCTTGGAGCTCCCGCTGCTTTTAAATATTTTGATACAACAATTGATCGTAAACGATATACGTCTACAAAAGAAGTTTTAGATGCCACTCTTATCCATCAATCCATCACTGGTCTTTATGAAACACGCATTGATTTGAGTCAGCTAGGAGGTGACTGA
Figure 2022532139000005
いくつかの実施形態では、野生型Cas9は、以下のヌクレオチド配列及び/またはアミノ酸配列に対応するか、またはそれらを含む:
ATGGATAAAAAGTATTCTATTGGTTTAGACATCGGCACTAATTCCGTTGGATGGGCTGTCATAACCGATGAATACAAAGTACCTTCAAAGAAATTTAAGGTGTTGGGGAACACAGACCGTCATTCGATTAAAAAGAATCTTATCGGTGCCCTCCTATTCGATAGTGGCGAAACGGCAGAGGCGACTCGCCTGAAACGAACCGCTCGGAGAAGGTATACACGTCGCAAGAACCGAATATGTTACTTACAAGAAATTTTTAGCAATGAGATGGCCAAAGTTGACGATTCTTTCTTTCACCGTTTGGAAGAGTCCTTCCTTGTCGAAGAGGACAAGAAACATGAACGGCACCCCATCTTTGGAAACATAGTAGATGAGGTGGCATATCATGAAAAGTACCCAACGATTTATCACCTCAGAAAAAAGCTAGTTGACTCAACTGATAAAGCGGACCTGAGGTTAATCTACTTGGCTCTTGCCCATATGATAAAGTTCCGTGGGCACTTTCTCATTGAGGGTGATCTAAATCCGGACAACTCGGATGTCGACAAACTGTTCATCCAGTTAGTACAAACCTATAATCAGTTGTTTGAAGAGAACCCTATAAATGCAAGTGGCGTGGATGCGAAGGCTATTCTTAGCGCCCGCCTCTCTAAATCCCGACGGCTAGAAAACCTGATCGCACAATTACCCGGAGAGAAGAAAAATGGGTTGTTCGGTAACCTTATAGCGCTCTCACTAGGCCTGACACCAAATTTTAAGTCGAACTTCGACTTAGCTGAAGATGCCAAATTGCAGCTTAGTAAGGACACGTACGATGACGATCTCGACAATCTACTGGCACAAATTGGAGATCAGTATGCGGACTTATTTTTGGCTGCCAAAAACCTTAGCGATGCAATCCTCCTATCTGACATACTGAGAGTTAATACTGAGATTACCAAGGCGCCGTTATCCGCTTCAATGATCAAAAGGTACGATGAACATCACCAAGACTTGACACTTCTCAAGGCCCTAGTCCGTCAGCAACTGCCTGAGAAATATAAGGAAATATTCTTTGATCAGTCGAAAAACGGGTACGCAGGTTATATTGACGGCGGAGCGAGTCAAGAGGAATTCTACAAGTTTATCAAACCCATATTAGAGAAGATGGATGGGACGGAAGAGTTGCTTGTAAAACTCAATCGCGAAGATCTACTGCGAAAGCAGCGGACTTTCGACAACGGTAGCATTCCACATCAAATCCACTTAGGCGAATTGCATGCTATACTTAGAAGGCAGGAGGATTTTTATCCGTTCCTCAAAGACAATCGTGAAAAGATTGAGAAAATCCTAACCTTTCGCATACCTTACTATGTGGGACCCCTGGCCCGAGGGAACTCTCGGTTCGCATGGATGACAAGAAAGTCCGAAGAAACGATTACTCCATGGAATTTTGAGGAAGTTGTCGATAAAGGTGCGTCAGCTCAATCGTTCATCGAGAGGATGACCAACTTTGACAAGAATTTACCGAACGAAAAAGTATTGCCTAAGCACAGTTTACTTTACGAGTATTTCACAGTGTACAATGAACTCACGAAAGTTAAGTATGTCACTGAGGGCATGCGTAAACCCGCCTTTCTAAGCGGAGAACAGAAGAAAGCAATAGTAGATCTGTTATTCAAGACCAACCGCAAAGTGACAGTTAAGCAATTGAAAGAGGACTACTTTAAGAAAATTGAATGCTTCGATTCTGTCGAGATCTCCGGGGTAGAAGATCGATTTAATGCGTCACTTGGTACGTATCATGACCTCCTAAAGATAATTAAAGATAAGGACTTCCTGGATAACGAAGAGAATGAAGATATCTTAGAAGATATAGTGTTGACTCTTACCCTCTTTGAAGATCGGGAAATGATTGAGGAAAGACTAAAAACATACGCTCACCTGTTCGACGATAAGGTTATGAAACAGTTAAAGAGGCGTCGCTATACGGGCTGGGGACGATTGTCGCGGAAACTTATCAACGGGATAAGAGACAAGCAAAGTGGTAAAACTATTCTCGATTTTCTAAAGAGCGACGGCTTCGCCAATAGGAACTTTATGCAGCTGATCCATGATGACTCTTTAACCTTCAAAGAGGATATACAAAAGGCACAGGTTTCCGGACAAGGGGACTCATTGCACGAACATATTGCGAATCTTGCTGGTTCGCCAGCCATCAAAAAGGGCATACTCCAGACAGTCAAAGTAGTGGATGAGCTAGTTAAGGTCATGGGACGTCACAAACCGGAAAACATTGTAATCGAGATGGCACGCGAAAATCAAACGACTCAGAAGGGGCAAAAAAACAGTCGAGAGCGGATGAAGAGAATAGAAGAGGGTATTAAAGAACTGGGCAGCCAGATCTTAAAGGAGCATCCTGTGGAAAATACCCAATTGCAGAACGAGAAACTTTACCTCTATTACCTACAAAATGGAAGGGACATGTATGTTGATCAGGAACTGGACATAAACCGTTTATCTGATTACGACGTCGATCACATTGTACCCCAATCCTTTTTGAAGGACGATTCAATCGACAATAAAGTGCTTACACGCTCGGATAAGAACCGAGGGAAAAGTGACAATGTTCCAAGCGAGGAAGTCGTAAAGAAAATGAAGAACTATTGGCGGCAGCTCCTAAATGCGAAACTGATAACGCAAAGAAAGTTCGATAACTTAACTAAAGCTGAGAGGGGTGGCTTGTCTGAACTTGACAAGGCCGGATTTATTAAACGTCAGCTCGTGGAAACCCGCCAAATCACAAAGCATGTTGCACAGATACTAGATTCCCGAATGAATACGAAATACGACGAGAACGATAAGCTGATTCGGGAAGTCAAAGTAATCACTTTAAAGTCAAAATTGGTGTCGGACTTCAGAAAGGATTTTCAATTCTATAAAGTTAGGGAGATAAATAACTACCACCATGCGCACGACGCTTATCTTAATGCCGTCGTAGGGACCGCACTCATTAAGAAATACCCGAAGCTAGAAAGTGAGTTTGTGTATGGTGATTACAAAGTTTATGACGTCCGTAAGATGATCGCGAAAAGCGAACAGGAGATAGGCAAGGCTACAGCCAAATACTTCTTTTATTCTAACATTATGAATTTCTTTAAGACGGAAATCACTCTGGCAAACGGAGAGATACGCAAACGACCTTTAATTGAAACCAATGGGGAGACAGGTGAAATCGTATGGGATAAGGGCCGGGACTTCGCGACGGTGAGAAAAGTTTTGTCCATGCCCCAAGTCAACATAGTAAAGAAAACTGAGGTGCAGACCGGAGGGTTTTCAAAGGAATCGATTCTTCCAAAAAGGAATAGTGATAAGCTCATCGCTCGTAAAAAGGACTGGGACCCGAAAAAGTACGGTGGCTTCGATAGCCCTACAGTTGCCTATTCTGTCCTAGTAGTGGCAAAAGTTGAGAAGGGAAAATCCAAGAAACTGAAGTCAGTCAAAGAATTATTGGGGATAACGATTATGGAGCGCTCGTCTTTTGAAAAGAACCCCATCGACTTCCTTGAGGCGAAAGGTTACAAGGAAGTAAAAAAGGATCTCATAATTAAACTACCAAAGTATAGTCTGTTTGAGTTAGAAAATGGCCGAAAACGGATGTTGGCTAGCGCCGGAGAGCTTCAAAAGGGGAACGAACTCGCACTACCGTCTAAATACGTGAATTTCCTGTATTTAGCGTCCCATTACGAGAAGTTGAAAGGTTCACCTGAAGATAACGAACAGAAGCAACTTTTTGTTGAGCAGCACAAACATTATCTCGACGAAATCATAGAGCAAATTTCGGAATTCAGTAAGAGAGTCATCCTAGCTGATGCCAATCTGGACAAAGTATTAAGCGCATACAACAAGCACAGGGATAAACCCATACGTGAGCAGGCGGAAAATATTATCCATTTGTTTACTCTTACCAACCTCGGCGCTCCAGCCGCATTCAAGTATTTTGACACAACGATAGATCGCAAACGATACACTTCTACCAAGGAGGTGCTAGACGCGACACTGATTCACCAATCCATCACGGGATTATATGAAACTCGGATAGATTTGTCACAGCTTGGGGGTGACGGATCCCCCAAGAAGAAGAGGAAAGTCTCGAGCGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGGCTGCAGGA
Figure 2022532139000006
いくつかの実施形態では、野生型Cas9は、Streptococcus pyogenes (NCBI参照配列:NC_002737.2 (以下のヌクレオチド配列)、及びUniprot参照配列:Q99ZW2 (以下のアミノ酸配列)由来のCas9に対応する:
ATGGATAAGAAATACTCAATAGGCTTAGATATCGGCACAAATAGCGTCGGATGGGCGGTGATCACTGATGAATATAAGGTTCCGTCTAAAAAGTTCAAGGTTCTGGGAAATACAGACCGCCACAGTATCAAAAAAAATCTTATAGGGGCTCTTTTATTTGACAGTGGAGAGACAGCGGAAGCGACTCGTCTCAAACGGACAGCTCGTAGAAGGTATACACGTCGGAAGAATCGTATTTGTTATCTACAGGAGATTTTTTCAAATGAGATGGCGAAAGTAGATGATAGTTTCTTTCATCGACTTGAAGAGTCTTTTTTGGTGGAAGAAGACAAGAAGCATGAACGTCATCCTATTTTTGGAAATATAGTAGATGAAGTTGCTTATCATGAGAAATATCCAACTATCTATCATCTGCGAAAAAAATTGGTAGATTCTACTGATAAAGCGGATTTGCGCTTAATCTATTTGGCCTTAGCGCATATGATTAAGTTTCGTGGTCATTTTTTGATTGAGGGAGATTTAAATCCTGATAATAGTGATGTGGACAAACTATTTATCCAGTTGGTACAAACCTACAATCAATTATTTGAAGAAAACCCTATTAACGCAAGTGGAGTAGATGCTAAAGCGATTCTTTCTGCACGATTGAGTAAATCAAGACGATTAGAAAATCTCATTGCTCAGCTCCCCGGTGAGAAGAAAAATGGCTTATTTGGGAATCTCATTGCTTTGTCATTGGGTTTGACCCCTAATTTTAAATCAAATTTTGATTTGGCAGAAGATGCTAAATTACAGCTTTCAAAAGATACTTACGATGATGATTTAGATAATTTATTGGCGCAAATTGGAGATCAATATGCTGATTTGTTTTTGGCAGCTAAGAATTTATCAGATGCTATTTTACTTTCAGATATCCTAAGAGTAAATACTGAAATAACTAAGGCTCCCCTATCAGCTTCAATGATTAAACGCTACGATGAACATCATCAAGACTTGACTCTTTTAAAAGCTTTAGTTCGACAACAACTTCCAGAAAAGTATAAAGAAATCTTTTTTGATCAATCAAAAAACGGATATGCAGGTTATATTGATGGGGGAGCTAGCCAAGAAGAATTTTATAAATTTATCAAACCAATTTTAGAAAAAATGGATGGTACTGAGGAATTATTGGTGAAACTAAATCGTGAAGATTTGCTGCGCAAGCAACGGACCTTTGACAACGGCTCTATTCCCCATCAAATTCACTTGGGTGAGCTGCATGCTATTTTGAGAAGACAAGAAGACTTTTATCCATTTTTAAAAGACAATCGTGAGAAGATTGAAAAAATCTTGACTTTTCGAATTCCTTATTATGTTGGTCCATTGGCGCGTGGCAATAGTCGTTTTGCATGGATGACTCGGAAGTCTGAAGAAACAATTACCCCATGGAATTTTGAAGAAGTTGTCGATAAAGGTGCTTCAGCTCAATCATTTATTGAACGCATGACAAACTTTGATAAAAATCTTCCAAATGAAAAAGTACTACCAAAACATAGTTTGCTTTATGAGTATTTTACGGTTTATAACGAATTGACAAAGGTCAAATATGTTACTGAAGGAATGCGAAAACCAGCATTTCTTTCAGGTGAACAGAAGAAAGCCATTGTTGATTTACTCTTCAAAACAAATCGAAAAGTAACCGTTAAGCAATTAAAAGAAGATTATTTCAAAAAAATAGAATGTTTTGATAGTGTTGAAATTTCAGGAGTTGAAGATAGATTTAATGCTTCATTAGGTACCTACCATGATTTGCTAAAAATTATTAAAGATAAAGATTTTTTGGATAATGAAGAAAATGAAGATATCTTAGAGGATATTGTTTTAACATTGACCTTATTTGAAGATAGGGAGATGATTGAGGAAAGACTTAAAACATATGCTCACCTCTTTGATGATAAGGTGATGAAACAGCTTAAACGTCGCCGTTATACTGGTTGGGGACGTTTGTCTCGAAAATTGATTAATGGTATTAGGGATAAGCAATCTGGCAAAACAATATTAGATTTTTTGAAATCAGATGGTTTTGCCAATCGCAATTTTATGCAGCTGATCCATGATGATAGTTTGACATTTAAAGAAGACATTCAAAAAGCACAAGTGTCTGGACAAGGCGATAGTTTACATGAACATATTGCAAATTTAGCTGGTAGCCCTGCTATTAAAAAAGGTATTTTACAGACTGTAAAAGTTGTTGATGAATTGGTCAAAGTAATGGGGCGGCATAAGCCAGAAAATATCGTTATTGAAATGGCACGTGAAAATCAGACAACTCAAAAGGGCCAGAAAAATTCGCGAGAGCGTATGAAACGAATCGAAGAAGGTATCAAAGAATTAGGAAGTCAGATTCTTAAAGAGCATCCTGTTGAAAATACTCAATTGCAAAATGAAAAGCTCTATCTCTATTATCTCCAAAATGGAAGAGACATGTATGTGGACCAAGAATTAGATATTAATCGTTTAAGTGATTATGATGTCGATCACATTGTTCCACAAAGTTTCCTTAAAGACGATTCAATAGACAATAAGGTCTTAACGCGTTCTGATAAAAATCGTGGTAAATCGGATAACGTTCCAAGTGAAGAAGTAGTCAAAAAGATGAAAAACTATTGGAGACAACTTCTAAACGCCAAGTTAATCACTCAACGTAAGTTTGATAATTTAACGAAAGCTGAACGTGGAGGTTTGAGTGAACTTGATAAAGCTGGTTTTATCAAACGCCAATTGGTTGAAACTCGCCAAATCACTAAGCATGTGGCACAAATTTTGGATAGTCGCATGAATACTAAATACGATGAAAATGATAAACTTATTCGAGAGGTTAAAGTGATTACCTTAAAATCTAAATTAGTTTCTGACTTCCGAAAAGATTTCCAATTCTATAAAGTACGTGAGATTAACAATTACCATCATGCCCATGATGCGTATCTAAATGCCGTCGTTGGAACTGCTTTGATTAAGAAATATCCAAAACTTGAATCGGAGTTTGTCTATGGTGATTATAAAGTTTATGATGTTCGTAAAATGATTGCTAAGTCTGAGCAAGAAATAGGCAAAGCAACCGCAAAATATTTCTTTTACTCTAATATCATGAACTTCTTCAAAACAGAAATTACACTTGCAAATGGAGAGATTCGCAAACGCCCTCTAATCGAAACTAATGGGGAAACTGGAGAAATTGTCTGGGATAAAGGGCGAGATTTTGCCACAGTGCGCAAAGTATTGTCCATGCCCCAAGTCAATATTGTCAAGAAAACAGAAGTACAGACAGGCGGATTCTCCAAGGAGTCAATTTTACCAAAAAGAAATTCGGACAAGCTTATTGCTCGTAAAAAAGACTGGGATCCAAAAAAATATGGTGGTTTTGATAGTCCAACGGTAGCTTATTCAGTCCTAGTGGTTGCTAAGGTGGAAAAAGGGAAATCGAAGAAGTTAAAATCCGTTAAAGAGTTACTAGGGATCACAATTATGGAAAGAAGTTCCTTTGAAAAAAATCCGATTGACTTTTTAGAAGCTAAAGGATATAAGGAAGTTAAAAAAGACTTAATCATTAAACTACCTAAATATAGTCTTTTTGAGTTAGAAAACGGTCGTAAACGGATGCTGGCTAGTGCCGGAGAATTACAAAAAGGAAATGAGCTGGCTCTGCCAAGCAAATATGTGAATTTTTTATATTTAGCTAGTCATTATGAAAAGTTGAAGGGTAGTCCAGAAGATAACGAACAAAAACAATTGTTTGTGGAGCAGCATAAGCATTATTTAGATGAGATTATTGAGCAAATCAGTGAATTTTCTAAGCGTGTTATTTTAGCAGATGCCAATTTAGATAAAGTTCTTAGTGCATATAACAAACATAGAGACAAACCAATACGTGAACAAGCAGAAAATATTATTCATTTATTTACGTTGACGAATCTTGGAGCTCCCGCTGCTTTTAAATATTTTGATACAACAATTGATCGTAAACGATATACGTCTACAAAAGAAGTTTTAGATGCCACTCTTATCCATCAATCCATCACTGGTCTTTATGAAACACGCATTGATTTGAGTCAGCTAGGAGGTGACTGA
Figure 2022532139000007
いくつかの実施形態では、Cas9とは:Corynebacterium ulcerans (NCBI Refs:NC_015683.1,NC_017317.1);Corynebacterium diphtheria (NCBI Refs:NC_016782.1,NC_016786.1);Spiroplasma syrphidicola (NCBI Ref:NC_021284.1);Prevotella intermedia (NCBI Ref:NC_017861.1);Spiroplasma taiwanense (NCBI Ref:NC_021846.1);Streptococcus iniae (NCBI Ref:NC_021314.1);Belliella baltica (NCBI Ref:NC_018010.1);Psychroflexus torquisI (NCBI Ref:NC_018721.1);Streptococcus thermophilus (NCBI Ref:YP_820832.1);Listeria innocua (NCBI Ref:NP_472073.1);Campylobacter jejuni (NCBI Ref:YP_002344900.1);もしくはNeisseria meningitidis (NCBI Ref:YP_002342100.1)に由来するCas9または任意の他の生物に由来するCas9を指す。
バリアント及び相同体を含む、追加のCas9タンパク質(例えば、ヌクレアーゼ不活性Cas9 (dCas9)、Cas9ニッカーゼ(nCas9)、またはヌクレアーゼ活性Cas9)が、本開示の範囲内にあることを理解されたい。例示的なCas9タンパク質として、以下に示すタンパク質が挙げられるが、これらに限定されない。いくつかの実施形態では、Cas9タンパク質は、ヌクレアーゼ不活性Cas9 (dCas9)である。いくつかの実施形態では、Cas9タンパク質は、Cas9ニッカーゼ(nCas9)である。いくつかの実施形態では、Cas9タンパク質は、ヌクレアーゼ活性Cas9である。
いくつかの実施形態では、Cas9ドメインは、ヌクレアーゼ不活性Cas9ドメイン(dCas9)である。例えば、dCas9ドメインは、二本鎖核酸分子のいずれかの鎖を切断することなく、二本鎖核酸分子に(例えば、gRNA分子を介して)結合し得る。いくつかの実施形態では、ヌクレアーゼ不活性dCas9ドメインは、本明細書に記載のアミノ酸配列のD10X変異及びH840X変異、または本明細書中で提供する任意のアミノ酸配列における対応する変異を含み、Xは任意のアミノ酸変化である。いくつかの実施形態では、ヌクレアーゼ不活性dCas9ドメインは、本明細書に記載のアミノ酸配列のD10A変異及びH840A変異、または本明細書中で提供する任意のアミノ酸配列における対応する変異を含む。一例として、ヌクレアーゼ不活性Cas9ドメインは、クローニングベクターpPlatTET-gRNA2 (登録番号BAV54124)に記載されているアミノ酸配列を含む。
例示的な触媒的に不活性なCas9 (dCas9)のアミノ酸配列は以下の通りである:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
(例えば、Qi et al., ”Repurposing CRISPR as an RNA-guided platform for sequence-specific control of gene expression.” Cell.2013;152 (5):1173-83を参照のこと;その全内容は、参照により本明細書に援用される)。
いくつかの実施形態では、Cas9ヌクレアーゼは、不活性(例えば、不活性化)DNA切断ドメインを有し、すなわち、Cas9は、「nCas9」タンパク質(「ニッカーゼ」Cas9)と呼ばれるニッカーゼである。ヌクレアーゼ不活性化Cas9タンパク質は、「dCas9」タンパク質(ヌクレアーゼ「不活性な」Cas9)または触媒的に不活性なCas9として、同じ意味で呼ばれ得る。不活性なDNA切断ドメインを有するCas9タンパク質(またはその断片)の生成方法は公知である(例えば、Jinek et al., Science.337:816-821 (2012);Qi et al., ”Repurposing CRISPR as an RNA-Guided Platform for Sequence-Specific Control of Gene Expression” (2013)Cell.28;152 (5):1173-83を参照されたい(それぞれの全内容は参照により本明細書に援用される))。例えば、Cas9のDNA切断ドメインには、HNHヌクレアーゼサブドメインとRuvC1サブドメインの2つのサブドメインが含まれることが知られている。HNHサブドメインはgRNAに相補的な鎖を切断し、一方、RuvC1サブドメインは非相補的な鎖を切断する。これらのサブドメイン内の変異は、Cas9のヌクレアーゼ活性をサイレンシングし得る。例えば、変異D10A及びH840Aは、S. pyogenes Cas9のヌクレアーゼ活性を完全に不活性化する(Jinek et al., Science.337:816-821 (2012);Qi et al., Cell.28;152 (5):1173-83 (2013))。
いくつかの実施形態では、dCas9ドメインは、本明細書中で提供するdCas9ドメインのいずれか1つに対して、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。いくつかの実施形態では、Cas9ドメインは、本明細書に記載のアミノ酸配列のいずれか1つと比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50以上またはそれ以上の変異を有するアミノ酸配列を含む。いくつかの実施形態では、Cas9ドメインは、本明細書に記載のアミノ酸配列のいずれか1つと比較して、少なくとも10、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも150、少なくとも200、少なくとも250、少なくとも300、少なくとも350、少なくとも400、少なくとも500、少なくとも600、少なくとも700、少なくとも800、少なくとも900、少なくとも1000、少なくとも1100、または少なくとも1200の同一の連続アミノ酸残基を有するアミノ酸配列を含む。
いくつかの実施形態では、dCas9は、Cas9ヌクレアーゼ活性を不活性化する1つ以上の変異を有するCas9アミノ酸配列に対応するか、または部分的または全体的にそれを含む。例えば、いくつかの実施形態では、dCas9ドメインは、D10A及びH840A変異または別のCas9における対応する変異を含む。
いくつかの実施形態では、dCas9は、dCas9のアミノ酸配列(D10A及びH840A)を含む:
Figure 2022532139000008
いくつかの実施形態では、Cas9ドメインは、D10A変異を含み、一方、位置840の残基は、上記で提供したアミノ酸配列中のヒスチジンのままであるか、または本明細書中で提供するアミノ酸配列のいずれかの対応する位置にある。
他の実施形態では、D10A及びH840A以外の変異を有するdCas9バリアントを提供し、これは、例えば、ヌクレアーゼ不活性化Cas9 (dCas9)をもたらす。そのような変異は、例として、D10及びH840での他のアミノ酸置換、またはCas9のヌクレアーゼドメイン内の他の置換(例えば、HNHヌクレアーゼサブドメイン及び/またはRuvC1サブドメインでの置換)を含む。いくつかの実施形態では、少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一であるdCas9のバリアントまたは相同体を提供する。いくつかの実施形態では、約5アミノ酸、約10アミノ酸、約15アミノ酸、約20アミノ酸、約25アミノ酸、約30アミノ酸、約40アミノ酸、約50アミノ酸、約75アミノ酸、約100アミノ酸またはそれ以上、短いかまたは長いアミノ酸配列を有するdCas9のバリアントを提供する。
いくつかの実施形態では、Cas9ドメインは、Cas9ニッカーゼである。Cas9ニッカーゼは、二本鎖核酸分子(例えば、二本鎖DNA分子)の1本の鎖のみを切断することができるCas9タンパク質であり得る。いくつかの実施形態では、Cas9ニッカーゼは、二本鎖核酸分子の標的鎖を切断するが、これは、Cas9ニッカーゼが、Cas9に結合するgRNA (例えば、sgRNA)と塩基対形成する(相補的である)鎖を切断することを意味する。いくつかの実施形態では、Cas9ニッカーゼは、D10A変異を含み、そして840位にヒスチジンを有する。いくつかの実施形態では、Cas9ニッカーゼは、二本鎖核酸分子の非標的未塩基編集鎖を切断するが、これは、Cas9ニッカーゼが、Cas9に結合するgRNA (例えば、sgRNA)と塩基対形成しない鎖を切断することを意味する。いくつかの実施形態では、Cas9ニッカーゼは、H840A変異を含み、そして10位にアスパラギン酸残基、または対応する変異を有する。いくつかの実施形態では、Cas9ニッカーゼは、本明細書中で提供するCas9ニッカーゼのいずれか1つに対して、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。さらなる適切なCas9ニッカーゼは、本開示及び当技術分野の知識に基づいて当業者には明らかであり、そして本開示の範囲内である。
例示的な触媒性Cas9ニッカーゼ(nCas9)のアミノ酸配列は以下の通りである:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
いくつかの実施形態では、Cas9は、単細胞原核微生物のドメイン及び界を構成する古細菌(例えば、ナノ古細菌)由来のCas9を指す。いくつかの実施形態では、プログラム可能なヌクレオチド結合タンパク質は、例えば、Burstein et al., ”New CRISPR-Cas systems from uncultivated microbes.” Cell Res.2017 Feb 21.doi:10.1038/cr.2017.21に記載されているCasXまたはCasYタンパク質であってもよく、その全内容は、参照により本明細書に援用される。ゲノム分解メタゲノミクスを使用して、古細菌の生命領域で最初に報告されたCas9を含む、複数のCRISPR-Cas系を同定した。この多様なCas9タンパク質は、活性CRISPR-Cas系の一部として、ほとんど研究されていないナノ古細菌で発見された。細菌では、これまで知られていなかった2つの系、CRISPR-CasXとCRISPR-CasYが発見され、これらは、これまでに発見された中で最もコンパクトな系の1つである。いくつかの実施形態では、本明細書に記載の塩基編集系において、Cas9は、CasX、またはCasXのバリアントによって置き換えられる。いくつかの実施形態では、本明細書に記載の塩基編集系において、Cas9は、CasY、またはCasYのバリアントによって置き換えられる。他のRNAガイドDNA結合タンパク質を、核酸プログラム可能なDNA結合タンパク質(napDNAbp)として使用してもよく、そして本開示の範囲内にあることを理解すべきである。
いくつかの実施形態では、本明細書中で提供する融合タンパク質のいずれかの核酸プログラム可能なDNA結合タンパク質(napDNAbp)は、CasXまたはCasYタンパク質であり得る。いくつかの実施形態では、napDNAbpはCasXタンパク質である。いくつかの実施形態では、napDNAbpはCasYタンパク質である。いくつかの実施形態では、napDNAbpは、天然のCasXまたはCasYタンパク質と、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。いくつかの実施形態では、プログラム可能なヌクレオチド結合タンパク質は、天然のCasXまたはCasYタンパク質である。いくつかの実施形態では、プログラム可能なヌクレオチド結合タンパク質は、本明細書に記載する任意のCasXまたはCasYタンパク質と、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。他の細菌種由来のCasX及びCasYもまた、本開示に従って使用してもよいことを理解すべきである。
例示的なCasX ((uniprot.org/uniprot/F0NN87;uniprot.org/uniprot/F0NH53)tr|F0NN87|F0NN87_SULIHCRISPR関連Casxタンパク質 OS=Sulfolobus islandicus (HVE10/4株)GN=SiH_0402 PE=4 SV=1)アミノ酸配列は以下の通りである:
MEVPLYNIFGDNYIIQVATEAENSTIYNNKVEIDDEELRNVLNLAYKIAKNNEDAAAERRGKAKKKKGEEGETTTSNIILPLSGNDKNPWTETLKCYNFPTTVALSEVFKNFSQVKECEEVSAPSFVKPEFYEFGRSPGMVERTRRVKLEVEPHYLIIAAAGWVLTRLGKAKVSEGDYVGVNVFTPTRGILYSLIQNVNGIVPGIKPETAFGLWIARKVVSSVTNPNVSVVRIYTISDAVGQNPTTINGGFSIDLTKLLEKRYLLSERLEAIARNALSISSNMRERYIVLANYIYEYLTGSKRLEDLLYFANRDLIMNLNSDDGKVRDLKLISAYVNGELIRGEG。
例示的なCasX (>tr|F0NH53|F0NH53_SULIR CRISPR関連タンパク質、Casx OS=Sulfolobus islandicus (REY15A株)GN=SiRe_0771 PE=4 SV=1)アミノ酸配列は以下の通りである:
MEVPLYNIFGDNYIIQVATEAENSTIYNNKVEIDDEELRNVLNLAYKIAKNNEDAAAERRGKAKKKKGEEGETTTSNIILPLSGNDKNPWTETLKCYNFPTTVALSEVFKNFSQVKECEEVSAPSFVKPEFYKFGRSPGMVERTRRVKLEVEPHYLIMAAAGWVLTRLGKAKVSEGDYVGVNVFTPTRGILYSLIQNVNGIVPGIKPETAFGLWIARKVVSSVTNPNVSVVSIYTISDAVGQNPTTINGGFSIDLTKLLEKRDLLSERLEAIARNALSISSNMRERYIVLANYIYEYLTGSKRLEDLLYFANRDLIMNLNSDDGKVRDLKLISAYVNGELIRGEG。
デルタプロテオバクテリア(Deltaproteobacteria)CasX
MEKRINKIRKKLSADNATKPVSRSGPMKTLLVRVMTDDLKKRLEKRRKKPEVMPQVISNNAANNLRMLLDDYTKMKEAILQVYWQEFKDDHVGLMCKFAQPASKKIDQNKLKPEMDEKGNLTTAGFACSQCGQPLFVYKLEQVSEKGKAYTNYFGRCNVAEHEKLILLAQLKPVKDSDEAVTYSLGKFGQRALDFYSIHVTKESTHPVKPLAQIAGNRYASGPVGKALSDACMGTIASFLSKYQDIIIEHQKVVKGNQKRLESLRELAGKENLEYPSVTLPPQPHTKEGVDfAYNEVIARVRMWVNLNLWQKLKLSRDDAKPLLRLKGFPSFPVVERRENEVDWWNTINEVKKLIDAKRDMGRVFWSGVTAEKRNTILEGYNYLPNENDHKKREGSLENPKKPAKRQFGDLLLYLEKKYAGDWGKVFDEAWERIDKKIAGLTSHIEREEARNAEDAQSKAVLTDWLRAKASFVLERLKEMDEKEFYACEIQLQKWYGDLRGNPFAVEAENRVVDISGFSIGSDGHSIQYRNLLAWKYLENGKREFYLLMNYGKKGRIRFTDGTDIKKSGKWQGLLYGGGKAKVIDLTFDPDDEQLIILPLAFGTRQGREFIWNDLLSLETGLIKLANGRVIEKTIYNKKIGRDEPALFVALTFERREVVDPSNIKPVNLIGVARGENIPAVIALTDPEGCPLPEFKDSSGGPTDILRIGEGYKEKQRAIQAAKEVEQRRAGGYSRKFASKSRNLADDMVRNSARDLFYHAVTHDAVLVFANLSRGFGRQGKRTFMTERQYTKMEDWLTAKLAYEGLTSKTYLSKTLAQYTSKTCSNCGFTITYADMDVMLVRLKKTSDGWATTLNNKELKAEYQITYYNRYKRQTVEKELSAELDRLSEESGNNDISKWTKGRRDEALFLLKKRFSHRPVQEQFVCLDCGHEVHAAEQAALNIARSWLFLNSNSTEFKSYKSGKQPFVGAWQAFYKRRLKEVWKPNA
例示的なCasY ((ncbi.nlm.nih.gov/protein/APG80656.1)>APG80656.1CRISPR関連タンパク質CasY[未培養パークバクテリア(Parcubacteria)群細菌])アミノ酸配列は以下の通りである:
MSKRHPRISGVKGYRLHAQRLEYTGKSGAMRTIKYPLYSSPSGGRTVPREIVSAINDDYVGLYGLSNFDDLYNAEKRNEEKVYSVLDFWYDCVQYGAVFSYTAPGLLKNVAEVRGGSYELTKTLKGSHLYDELQIDKVIKFLNKKEISRANGSLDKLKKDIIDCFKAEYRERHKDQCNKLADDIKNAKKDAGASLGERQKKLFRDFFGISEQSENDKPSFTNPLNLTCCLLPFDTVNNNRNRGEVLFNKLKEYAQKLDKNEGSLEMWEYIGIGNSGTAFSNFLGEGFLGRLRENKITELKKAMMDITDAWRGQEQEEELEKRLRILAALTIKLREPKFDNHWGGYRSDINGKLSSWLQNYINQTVKIKEDLKGHKKDLKKAKEMINRFGESDTKEEAVVSSLLESIEKIVPDDSADDEKPDIPAIAIYRRFLSDGRLTLNRFVQREDVQEALIKERLEAEKKKKPKKRKKKSDAEDEKETIDFKELFPHLAKPLKLVPNFYGDSKRELYKKYKNAAIYTDALWKAVEKIYKSAFSSSLKNSFFDTDFDKDFFIKRLQKIFSVYRRFNTDKWKPIVKNSFAPYCDIVSLAENEVLYKPKQSRSRKSAAIDKNRVRLPSTENIAKAGIALARELSVAGFDWKDLLKKEEHEEYIDLIELHKTALALLLAVTETQLDISALDFVENGTVKDFMKTRDGNLVLEGRFLEMFSQSIVFSELRGLAGLMSRKEFITRSAIQTMNGKQAELLYIPHEFQSAKITTPKEMSRAFLDLAPAEFATSLEPESLSEKSLLKLKQMRYYPHYFGYELTRTGQGIDGGVAENALRLEKSPVKKREIKCKQYKTLGRGQNKIVLYVRSSYYQTQFLEWFLHRPKNVQTDVAVSGSFLIDEKKVKTRWNYDALTVALEPVSGSERVFVSQPFTIFPEKSAEEEGQRYLGIDIGEYGIAYTALEITGDSAKILDQNFISDPQLKTLREEVKGLKLDQRRGTFAMPSTKIARIRESLVHSLRNRIHHLALKHKAKIVYELEVSRFEEGKQKIKKVYATLKKADVYSEIDADKNLQTTVWGKLAVASEISASYTSQFCGACKKLWRAEMQVDETITTQELIGTVRVIKGGTLIDAIKDFMRPPIFDENDTPFPKYRDFCDKHHISKKMRGNSCLFICPFCRANADADIQASQTIALLRYVKEEKKVEDYFERFRKLKNIKVLGQMKKI。
いくつかの実施形態では、核酸プログラム可能なDNA結合タンパク質(napDNAbp)は、微生物のCRISPR-Cas系の単一のエフェクターである。微生物CRISPR-Cas系の単一エフェクターには、限定されないが、Cas9、Cpf1、Cas12b/C2c1、及びCas12c/C2c3が含まれる。通常、微生物CRISPR-Cas系はクラス1系とクラス2系に分けられる。クラス1系はマルチサブユニットエフェクター複合体を有し、クラス2系は単一のタンパク質エフェクターを有する。例えば、Cas9及びCpf1は、クラス2エフェクターである。Cas9とCpf1に加えて、3つの異なるクラス2CRISPR-Cas系(Cas12b/C2c1及びCas12c/C2c3)が、Shmakov et al., ”Discovery and Functional Characterization of Diverse Class 2 CRISPR Cas Systems”, Mol. Cell, 2015 Nov.5;60 (3):385-397により記載され、その全内容は参照により本明細書に援用される。系の2つのエフェクター、Cas12b/C2c1及びCas12c/C2c3は、Cpf1に関連するRuvC様のエンドヌクレアーゼドメインを含んでいる。第3の系は、2つの予測HEPN RNaseドメインを有するエフェクターを含む。成熟CRISPR RNAの生成は、Cas12b/C2c1によるCRISPR RNAの生成とは異なり、tracrRNAに依存しない。Cas12b/C2c1は、DNA切断に関して、CRISPR RNAとtracrRNAの両方に依存する。
キメラ単一分子ガイドRNA (sgRNA)と複合体を形成しているAlicyclobaccillus acidoterrastris Cas12b/C2c1 (AacC2c1)の結晶構造が報告されている。例えば、Liu et al., ”C2c1-sgRNA Complex Structure Reveals RNA-Guided DNA Cleavage Mechanism”,Mol.Cell,2017 Jan.19;65 (2):310-322を参照されたい(その全内容は参照により本明細書に援用される)。結晶構造は、三元複合体として標的DNAに結合したAlicyclobacillus acidoterrestris C2c1でも報告されている。例えば、Yang et al., ”PAM-dependent Target DNA Recognition and Cleavage by C2C1 CRISPR-Cas endonuclease”,Cell,2016 Dec.15;167 (7):1814-1828を参照されたい(その全内容は参照により本明細書に援用される)。標的DNA鎖と非標的DNA鎖の両方で、単一のRuvC触媒ポケット内に独立して配置され、Cas12b/C2c1を介した切断により、標的DNAのねじれ形の7か所のヌクレオチド切断を生じさせる、AacC2c1の触媒能力のあるコンフォメーションが捕捉されている。Cas12b/C2c1三元複合体と以前に同定されたCas9及びCpf1の対応物との構造比較は、CRISPR-Cas9系で使用されるメカニズムの多様性を示している。
いくつかの実施形態では、本明細書中で提供する融合タンパク質のいずれかの核酸プログラム可能なDNA結合タンパク質(napDNAbp)は、Cas12b/C2c1またはCas12c/C2c3タンパク質であり得る。いくつかの実施形態では、napDNAbpはCas12b/C2c1タンパク質である。いくつかの実施形態では、napDNAbpはCas12c/C2c3タンパク質である。いくつかの実施形態では、napDNAbpは、天然のCas12b/C2c1またはCas12c/C2c3タンパク質と、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。いくつかの実施形態では、napDNAbpは、天然のCas12b/C2c1またはCas12c/C2c3タンパク質である。いくつかの実施形態では、napDNAbpは、本明細書中で提供するnapDNAbp配列のいずれか1つと、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。他の細菌種由来のCas12b/C2c1またはCas12c/C2c3もまた、本開示に従って使用してもよいことを理解すべきである。
Cas12b/C2c1 ((uniprot.org/uniprot/T0D7A2#2)sp|T0D7A2|C2C1_ALIAG CRISPR関連エンドヌクレアーゼC2c1 OS=Alicyclobacillus acido-terrestris (株ATCC49025/DSM3922/CIP106132/NCIMB13137/GD3B)GN=c2c1 PE=1 SV=1)アミノ酸配列は以下の通りである:
MAVKSIKVKLRLDDMPEIRAGLWKLHKEVNAGVRYYTEWLSLLRQENLYRRSPNGDGEQECDKTAEECKAELLERLRARQVENGHRGPAGSDDELLQLARQLYELLVPQAIGAKGDAQQIARKFLSPLADKDAVGGLGIAKAGNKPRWVRMREAGEPGWEEEKEKAETRKSADRTADVLRALADFGLKPLMRVYTDSEMSSVEWKPLRKGQAVRTWDRDMFQQAIERMMSWESWNQRVGQEYAKLVEQKNRFEQKNFVGQEHLVHLVNQLQQDMKEASPGLESKEQTAHYVTGRALRGSDKVFEKWGKLAPDAPFDLYDAEIKNVQRRNTRRFGSHDLFAKLAEPEYQALWREDASFLTRYAVYNSILRKLNHAKMFATFTLPDATAHPIWTRFDKLGGNLHQYTFLFNEFGERRHAIRFHKLLKVENGVAREVDDVTVPISMSEQLDNLLPRDPNEPIALYFRDYGAEQHFTGEFGGAKIQCRRDQLAHMHRRRGARDVYLNVSVRVQSQSEARGERRPPYAAVFRLVGDNHRAFVHFDKLSDYLAEHPDDGKLGSEGLLSGLRVMSVDLGLRTSASISVFRVARKDELKPNSKGRVPFFFPIKGNDNLVAVHERSQLLKLPGETESKDLRAIREERQRTLRQLRTQLAYLRLLVRCGSEDVGRRERSWAKLIEQPVDAANHMTPDWREAFENELQKLKSLHGICSDKEWMDAVYESVRRVWRHMGKQVRDWRKDVRSGERPKIRGYAKDVVGGNSIEQIEYLERQYKFLKSWSFFGKVSGQVIRAEKGSRFAITLREHIDHAKEDRLKKLADRIIMEALGYVYALDERGKGKWVAKYPPCQLILLEELSEYQFNNDRPPSENNQLMQWSHRGVFQELINQAQVHDLLVGTMYAAFSSRFDARTGAPGIRCRRVPARCTQEHNPEPFPWWLNKFVVEHTLDACPLRADDLIPTGEGEIFVSPFSAEEGDFHQIHADLNAAQNLQQRLWSDFDISQIRLRCDWGEVDGELVLIPRLTGKRTADSYSNKVFYTNTGVTYYERERGKKRRKVFAQEKLSEEEAELLVEADEAREKSVVLMRDPSGIINRGNWTRQKEFWSMVNQRIEGYLVKQIRSRVPLQDSACENTGDI
BhCas12b (Bacillus hisashii)NCBI参照配列:WP_095142515
MAPKKKRKVGIHGVPAAATRSFILKIEPNEEVKKGLWKTHEVLNHGIAYYMNILKLIRQEAIYEHHEQDPKNPKKVSKAEIQAELWDFVLKMQKCNSFTHEVDKDEVFNILRELYEELVPSSVEKKGEANQLSNKFLYPLVDPNSQSGKGTASSGRKPRWYNLKIAGDPSWEEEKKKWEEDKKKDPLAKILGKLAEYGLIPLFIPYTDSNEPIVKEIKWMEKSRNQSVRRLDKDMFIQALERFLSWESWNLKVKEEYEKVEKEYKTLEERIKEDIQALKALEQYEKERQEQLLRDTLNTNEYRLSKRGLRGWREIIQKWLKMDENEPSEKYLEVFKDYQRKHPREAGDYSVYEFLSKKENHFIWRNHPEYPYLYATFCEIDKKKKDAKQQATFTLADPINHPLWVRFEERSGSNLNKYRILTEQLHTEKLKKKLTVQLDRLIYPTESGGWEEKGKVDIVLLPSRQFYNQIFLDIEEKGKHAFTYKDESIKFPLKGTLGGARVQFDRDHLRRYPHKVESGNVGRIYFNMTVNIEPTESPVSKSLKIHRDDFPKVVNFKPKELTEWIKDSKGKKLKSGIESLEIGLRVMSIDLGQRQAAAASIFEVVDQKPDIEGKLFFPIKGTELYAVHRASFNIKLPGETLVKSREVLRKAREDNLKLMNQKLNFLRNVLHFQQFEDITEREKRVTKWISRQENSDVPLVYQDELIQIRELMYKPYKDWVAFLKQLHKRLEVEIGKEVKHWRKSLSDGRKGLYGISLKNIDEIDRTRKFLLRWSLRPTEPGEVRRLEPGQRFAIDQLNHLNALKEDRLKKMANTIIMHALGYCYDVRKKKWQAKNPACQIILFEDLSNYNPYEERSRFENSKLMKWSRREIPRQVALQGEIYGLQVGEVGAQFSSRFHAKTGSPGIRCSVVTKEKLQDNRFFKNLQREGRLTLDKIAVLKEGDLYPDKGGEKFISLSKDRKCVTTHADINAAQNLQKRFWTRTHGFYKVYCKAYQVDGQTVYIPESKDQKQKIIEEFGEGYFILKDGVYEWVNAGKLKIKKGSSKQSSSELVDSDILKDSFDLASELKGEKLMLYRDPSGNVFPSDKWMAAGVFFGKLERILISKLTNQYSISTIEDDSSKQSMKRPAATKKAGQAKKKK
いくつかの実施形態では、Cas12bはBvCas12Bであり、これは、BhCas12bのバリアントであり、BhCas12Bと比較して以下の変化を含む:S893R、K846R、及びE837G。
BvCas12b (Bacillus種V3-13)NCBI参照配列:WP_101661451.1
MAIRSIKLKMKTNSGTDSIYLRKALWRTHQLINEGIAYYMNLLTLYRQEAIGDKTKEAYQAELINIIRNQQRNNGSSEEHGSDQEILALLRQLYELIIPSSIGESGDANQLGNKFLYPLVDPNSQSGKGTSNAGRKPRWKRLKEEGNPDWELEKKKDEERKAKDPTVKIFDNLNKYGLLPLFPLFTNIQKDIEWLPLGKRQSVRKWDKDMFIQAIERLLSWESWNRRVADEYKQLKEKTESYYKEHLTGGEEWIEKIRKFEKERNMELEKNAFAPNDGYFITSRQIRGWDRVYEKWSKLPESASPEELWKVVAEQQNKMSEGFGDPKVFSFLANRENRDIWRGHSERIYHIAAYNGLQKKLSRTKEQATFTLPDAIEHPLWIRYESPGGTNLNLFKLEEKQKKNYYVTLSKIIWPSEEKWIEKENIEIPLAPSIQFNRQIKLKQHVKGKQEISFSDYSSRISLDGVLGGSRIQFNRKYIKNHKELLGEGDIGPVFFNLVVDVAPLQETRNGRLQSPIGKALKVISSDFSKVIDYKPKELMDWMNTGSASNSFGVASLLEGMRVMSIDMGQRTSASVSIFEVVKELPKDQEQKLFYSINDTELFAIHKRSFLLNLPGEVVTKNNKQQRQERRKKRQFVRSQIRMLANVLRLETKKTPDERKKAIHKLMEIVQSYDSWTASQKEVWEKELNLLTNMAAFNDEIWKESLVELHHRIEPYVGQIVSKWRKGLSEGRKNLAGISMWNIDELEDTRRLLISWSKRSRTPGEANRIETDEPFGSSLLQHIQNVKDDRLKQMANLIIMTALGFKYDKEEKDRYKRWKETYPACQIILFENLNRYLFNLDRSRRENSRLMKWAHRSIPRTVSMQGEMFGLQVGDVRSEYSSRFHAKTGAPGIRCHALTEEDLKAGSNTLKRLIEDGFINESELAYLKKGDIIPSQGGELFVTLSKRYKKDSDNNELTVIHADINAAQNLQKRFWQQNSEVYRVPCQLARMGEDKLYIPKSQTETIKKYFGKGSFVKNNTEQEVYKWEKSEKMKIKTDTTFDLQDLDGFEDISKTIELAQEQQKKYLTMFRDPSGYFFNNETWRPQKEYWSIVNNIIKSCLKKKILSNKVEL
Cas9ヌクレアーゼは、RuvCとHNHの2つの機能的なエンドヌクレアーゼドメインを有する。Cas9は、標的結合時にコンフォメーション変化を起こし、それにより、標的DNAの反対側の鎖を切断するようにヌクレアーゼドメインが配置される。Cas9を介したDNA切断の最終結果は、標的DNA内の二本鎖切断(DSB)である(PAM配列の約3~4ヌクレオチド上流)。結果として得られるDSBは、以下の2つの一般的な修復経路のいずれかによって修復される: (1)効率的であるがエラーが発生しやすい非相同末端結合(NHEJ)経路;または(2)効率は低いが、忠実度の高い相同組換え修復(HDR)経路。
非相同末端結合(NHEJ)及び/または相同組換え修復(HDR)の「効率」は、任意の簡便な方法で計算することができる。例えば、いくつかの場合では、効率を、成功したHDRの割合で表すことができる。例えば、サーベイヤーヌクレアーゼアッセイを使用して切断産物を生成することができ、基質に対する産物の比率を使用して割合を計算することができる。例えば、HDRが成功した結果として、新たに組み込まれた制限酵素配列を含むDNAを直接切断するサーベイヤーヌクレアーゼ酵素を使用することができる。切断された基質が多いほど、HDRの割合が高くなる(HDRの効率が高くなる)。説明のための例として、HDRの割合(百分率)は、以下の式を使用して計算することができる[(切断産物)/(基質と切断産物)](例えば、(b+c)/(a+b+c)、式中、「a」はDNA基質のバンド強度、「b」及び「c」は切断産物である)。
いくつかの場合では、効率を、成功したNHEJの割合で表すことができる。例えば、T7エンドヌクレアーゼIアッセイを使用して切断産物を生成し、基質に対する産物の比率を使用してNHEJの割合を計算することができる。T7エンドヌクレアーゼIは、野生型と変異型のDNA鎖のハイブリダイゼーションから生じるミスマッチのヘテロ二本鎖DNAを切断する(NHEJは、元の切断部位に小さなランダムな挿入または欠失(インデル)を生成する)。切断が多いほど、NHEJの割合が高くなる(NHEJの効率が高くなる)。説明のための例として、NHEJの割合(百分率)は、以下の式を使用して計算することができる: (1-(1-(b+c)/(a+b+c))1/2)×100、式中、「a」はDNA基質のバンド強度であり、「b」及び「c」は切断産物である(Ran et.al., Cell.2013 Sep.12;154 (6):1380-9、及びRan et al., Nat Protoc.2013 Nov.;8 (11):2281-2308)。
NHEJ修復経路は最も活発な修復機構であり、DSB部位で小さなヌクレオチドの挿入または削除(インデル)を頻繁に引き起こす。Cas9とgRNAまたはガイドポリヌクレオチドを発現する細胞の集団は多様な変異を生じ得るため、NHEJを介したDSB修復のランダム性は重要な実用上の意味を有している。ほとんどの場合、NHEJは、標的DNAに小さなインデルを生じさせ、その結果、アミノ酸の欠失、挿入、またはフレームシフト変異が生じ、標的遺伝子のオープンリーディングフレーム(ORF)内で未成熟終止コドンを生じさせる。理想的な最終結果は、標的遺伝子内の機能喪失型変異である。
NHEJを介したDSB修復は遺伝子のオープンリーディングフレームを破壊することがよくあるが、相同組換え修復(HDR)を使用して、単一ヌクレオチドの変化からフルオロフォアやタグの付加などの大きな挿入までの特定のヌクレオチド変化を生成することができる。HDRを遺伝子編集に利用するために、目的の配列を含むDNA修復テンプレートを、gRNA(複数可)及びCas9またはCas9ニッカーゼと共に目的の細胞型に送達することができる。修復テンプレートには、所望の編集、及び標的のすぐ上流及び下流の追加の相同配列(左右の相同性アームと呼ばれる)を含めることができる。各相同性アームの長さは、導入する変化のサイズに依存する可能性があり、挿入が大きいほど、より長い相同性アームが必要になる。修復テンプレートは、一本鎖オリゴヌクレオチド、二本鎖オリゴヌクレオチド、または二本鎖DNAプラスミドであり得る。また、Cas9、gRNA、及び外来性修復テンプレートを発現する細胞でも、HDRの効率は一般に低い(改変された対立遺伝子の10%未満)。HDRは、細胞周期のS期とG2期に発生するため、細胞を同期させることでHDRの効率を高めることができる。NHEJに関与する遺伝子を化学的または遺伝的に阻害することも、HDR頻度を増加させ得る。
いくつかの実施形態では、Cas9は、改変されたCas9である。所与のgRNA標的化配列は、部分的な相同性が存在するゲノム全体に追加の部位を有し得る。これらの部位はオフターゲットと呼ばれ、gRNAを設計する際に考慮する必要がある。gRNA設計の最適化に加えて、Cas9の改変を通じてCRISPRの特異性を高めることもできる。Cas9は、RuvCとHNHの2つのヌクレアーゼドメインの複合活性を介して二本鎖切断(DSB)を生成する。SpCas9のD10A変異体であるCas9ニッカーゼは、1つのヌクレアーゼドメインを保持し、DSBではなくDNAニックを生成する。ニッカーゼ系は、特定の遺伝子編集のためにHDRを介した遺伝子編集と組み合わせることもできる。
いくつかの場合では、Cas9は、バリアントCas9タンパク質である。バリアントCas9ポリペプチドは、野生型Cas9タンパク質のアミノ酸配列と比較した場合、1つのアミノ酸が異なっている(例えば、欠失、挿入、置換、融合を有する)アミノ酸配列を有する。いくつかの場合では、バリアントCas9ポリペプチドは、Cas9ポリペプチドのヌクレアーゼ活性を低下させるアミノ酸変化(例えば、欠失、挿入、または置換)を有する。例えば、いくつかの場合では、バリアントCas9ポリペプチドは、対応する野生型Cas9タンパク質のヌクレアーゼ活性の50%未満、40%未満、30%未満、20%未満、10%未満、5%未満、または1%未満を有する。いくつかの場合では、バリアントCas9タンパク質は、実質的なヌクレアーゼ活性を有さない。対象のCas9タンパク質が、実質的なヌクレアーゼ活性を有さないバリアントCas9タンパク質である場合、それは「dCas9」と呼ばれ得る。
いくつかの場合では、バリアントCas9タンパク質は、低いヌクレアーゼ活性を有する。例えば、バリアントCas9タンパク質は、野生型Cas9タンパク質、例えば、野生型Cas9タンパク質のエンドヌクレアーゼ活性の約20%未満、約15%未満、約10%未満、約5%未満、約1%未満、または約0.1%未満を示す。
いくつかの場合では、バリアントCas9タンパク質は、ガイド標的配列の相補鎖を切断することができるが、二本鎖ガイド標的配列の非相補鎖を切断する能力が低下している。例えば、バリアントCas9タンパク質は、RuvCドメインの機能を低下させる変異(アミノ酸置換)を有し得る。非限定的な例として、いくつかの実施形態では、バリアントCas9タンパク質は、D10A (アミノ酸位置10でアスパラギン酸からアラニンへ)を有し、したがって二本鎖ガイド標的配列の相補鎖を切断することができるが、二本鎖ガイド標的配列の非相補鎖を切断する能力が低下している(したがって、バリアントCas9タンパク質が二本鎖標的核酸を切断する場合に二本鎖切断(DSB)の代わりに一本鎖切断(SSB)を生じさせる)(例えば、Jinek et al., Science.2012 Aug.17;337 (6096):816-21を参照のこと)。
いくつかの場合では、バリアントCas9タンパク質は、二本鎖ガイド標的配列の非相補鎖を切断することができるが、ガイド標的配列の相補鎖を切断する能力が低下している。例えば、バリアントCas9タンパク質は、HNHドメイン(RuvC/HNH/RuvCドメインモチーフ)の機能を低下させる変異(アミノ酸置換)を有し得る。非限定的な例として、いくつかの実施形態では、バリアントCas9タンパク質は、H840A (アミノ酸位置840でヒスチジンからアラニンへの)変異を有し、したがってガイド標的配列の非相補鎖を切断することができるが、ガイド標的配列の相補鎖を切断する能力が低下している(したがって、バリアントCas9タンパク質が二本鎖ガイド標的配列を切断する場合に、DSBではなくSSBを生じさせる)。そのようなCas9タンパク質は、ガイド標的配列(例えば、一本鎖ガイド標的配列)を切断する能力が低下しているが、ガイド標的配列(例えば、一本鎖ガイド標的配列)に結合する能力を保持している。
いくつかの場合では、バリアントCas9タンパク質は、二本鎖標的DNAの相補鎖と非相補鎖の両方を切断する能力が低下している。非限定的な例として、いくつかの場合では、バリアントCas9タンパク質は、D10A及びH840A変異の両方を含み、それにより、このポリペプチドは、二本鎖標的DNAの相補鎖及び非相補鎖の両方を切断する能力が低下している。そのようなCas9タンパク質は、標的DNA (例えば、一本鎖標的DNA)を切断する能力が低下しているが、標的DNA (例えば、一本鎖標的DNA)に結合する能力を保持している。
別の非限定的な例として、いくつかの場合では、バリアントCas9タンパク質は、W476A及びW1126A変異を有し、それにより、このポリペプチドは、標的DNAを切断する能力が低下している。そのようなCas9タンパク質は、標的DNA (例えば、一本鎖標的DNA)を切断する能力が低下しているが、標的DNA (例えば、一本鎖標的DNA)に結合する能力を保持している。
別の非限定的な例として、いくつかの場合では、バリアントCas9タンパク質は、P475A、W476A、N477A、D1125A、W1126A、及びD1127A変異を有し、それにより、このポリペプチドは、標的DNAを切断する能力が低下している。そのようなCas9タンパク質は、標的DNA (例えば、一本鎖標的DNA)を切断する能力が低下しているが、標的DNA (例えば、一本鎖標的DNA)に結合する能力を保持している。
別の非限定的な例として、いくつかの場合では、バリアントCas9タンパク質は、H840A、W476A、及びW1126A変異を有し、それにより、このポリペプチドは、標的DNAを切断する能力が低下している。そのようなCas9タンパク質は、標的DNA (例えば、一本鎖標的DNA)を切断する能力が低下しているが、標的DNA (例えば、一本鎖標的DNA)に結合する能力を保持している。別の非限定的な例として、いくつかの場合では、バリアントCas9タンパク質は、H840A、D10A、W476A、及びW1126A変異を有し、それにより、このポリペプチドは、標的DNAを切断する能力が低下している。そのようなCas9タンパク質は、標的DNA (例えば、一本鎖標的DNA)を切断する能力が低下しているが、標的DNA (例えば、一本鎖標的DNA)に結合する能力を保持している。いくつかの実施形態では、バリアントCas9は、Cas9 HNHドメイン(A840H)の840位に触媒的His残基を回復させている。
別の非限定的な例として、いくつかの場合では、バリアントCas9タンパク質は、H840A、P475A、W476A、N477A、D1125A、W1126A、及びD1127A変異を有し、それにより、このポリペプチドは、標的DNAを切断する能力が低下している。そのようなCas9タンパク質は、標的DNA (例えば、一本鎖標的DNA)を切断する能力が低下しているが、標的DNA (例えば、一本鎖標的DNA)に結合する能力を保持している。別の非限定的な例として、いくつかの場合では、バリアントCas9タンパク質は、D10A、H840A、P475A、W476A、N477A、D1125A、W1126A、及びD1127A変異を有し、それにより、このポリペプチドは、標的DNAを切断する能力が低下している。そのようなCas9タンパク質は、標的DNA (例えば、一本鎖標的DNA)を切断する能力が低下しているが、標的DNA (例えば、一本鎖標的DNA)に結合する能力を保持している。いくつかの場合では、バリアントCas9タンパク質がW476A及びW1126A変異を含む場合、またはバリアントCas9タンパク質がP475A、W476A、N477A、D1125A、W1126A、及びD1127A変異を含む場合、バリアントCas9タンパク質はPAM配列に効率的に結合しない。したがって、いくつかのそのような場合、そのようなバリアントCas9タンパク質を結合方法で使用する場合、方法はPAM配列を必要としない。言い換えれば、いくつかの場合では、そのようなバリアントCas9タンパク質を結合方法で使用する場合、方法はガイドRNAを含むことができるが、方法はPAM配列がなくても実施することができる(そして結合の特異性はしたがって、ガイドRNAの標的化セグメントによって提供される)。他の残基は、上記の効果を達成するために変異させることができる(すなわち、1つまたは他のヌクレアーゼ部分を不活性化する)。非限定的な例として、残基D10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D986、及び/またはA987を改変する(すなわち、置換する)ことができる。また、アラニン置換以外の変異も適している。
いくつかの実施形態では、触媒活性が低下したバリアントCas9タンパク質(例えば、Cas9タンパク質が、D10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D986、及び/またはA987変異、例えば、D10A、G12A、G17A、E762A、H840A、N854A、N863A、H982A、H983A、A984A、及び/またはD986Aを有する場合)、バリアントCas9タンパク質は、ガイドRNAと相互作用する能力を保持している限り、依然として部位特異的な方法で標的DNAに結合することができる(ガイドRNAによって標的DNA配列にガイドされるため)。
いくつかの実施形態では、バリアントCasタンパク質は、spCas9、spCas9-VRQR、spCas9-VRER、xCas9 (sp)、saCas9、saCas9-KKH、spCas9-MQKSER、spCas9-LRKIQK、またはspCas9-LRVSQLであり得る。
いくつかの実施形態では、アミノ酸置換D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、及びT1337R (SpCas9-MQKFRAER)を含み、改変PAM5’-NGC-3’に対する特異性を有する改変SpCas9を使用した。
S. pyogenes Cas9の代替物は、哺乳類細胞で切断活性を示すCpf1ファミリーのRNAガイドエンドヌクレアーゼを含み得る。Prevotella及びFrancisella1由来のCRISPR (CRISPR/Cpf1)は、CRISPR/Cas9系に類似したDNA編集技術である。Cpf1は、クラスII CRISPR/Cas系のRNAガイドエンドヌクレアーゼである。この獲得免疫機構は、Prevotella菌及びFrancisella菌において認められる。Cpf1遺伝子は、CRISPR遺伝子座に関連付けられており、ガイドRNAを使用してウイルスDNAを見つけて切断するエンドヌクレアーゼをコードする。Cpf1は、Cas9よりも小さくて単純なエンドヌクレアーゼであり、CRISPR/Cas9系の制限のいくつかを克服している。Cas9ヌクレアーゼとは異なり、Cpf1を介したDNA切断の結果は、短い3’オーバーハングを伴う二本鎖切断である。Cpf1のねじれ形の切断パターンは、従来の制限酵素クローニングと同様に、方向性のある遺伝子導入を利用可能とすることができ、遺伝子編集の効率を高めることができる。上記のCas9バリアント及びオルソログと同様に、Cpf1もまた、CRISPRによって標的とすることができる部位の数を、SpCas9が選好するNGG PAM部位を欠くATリッチ領域またはATリッチゲノムにまで拡張することができる。Cpf1遺伝子座には、混合α/βドメイン、RuvC-Iとそれに続くヘリカル領域、RuvC-II、及びジンクフィンガー様ドメインが含まれている。Cpf1タンパク質は、Cas9のRuvCドメインに類似したRuvC様エンドヌクレアーゼドメインを有する。さらに、Cpf1は、HNHエンドヌクレアーゼドメインを有さず、Cpf1のN末端にはCas9のαヘリカル認識ローブがない。Cpf1 CRISPR-Casドメインアーキテクチャは、Cpf1が機能的にユニークであり、クラス2、V型CRISPR系として分類されることを示している。Cpf1遺伝子座は、II型系よりもI型及びIII型に類似したCas1、Cas2、及びCas4タンパク質をコードする。機能的Cpf1は、トランス活性化CRISPR RNA (tracrRNA)を必要とせず、したがってCRISPR (crRNA)のみが必要である。これは、Cpf1がCas9よりも小さいだけでなく、より小さいsgRNA分子(Cas9の約半分のヌクレオチド)を有することから、ゲノム編集に有効である。Cpf1-crRNA複合体は、Cas9が標的とするGリッチPAMとは対照的に、プロトスペーサー隣接モチーフ5’-YTN-3’を同定することにより、標的DNAまたはRNAを切断する。PAMの同定後、Cpf1は4または5ヌクレオチドのオーバーハングの粘着末端様DNA二本鎖切断を導入する。
本開示のいくつかの態様は、核酸プログラム可能なDNA結合タンパク質として作用するドメインを含む融合タンパク質を提供し、これは、塩基編集体などのタンパク質を特定の核酸(例えば、DNAまたはRNA)配列にガイドするために使用し得る。特定の実施形態では、融合タンパク質は、核酸プログラム可能なDNA結合タンパク質ドメイン及びデアミナーゼドメインを含む。DNA結合タンパク質としては、限定されないが、Cas9 (例えば、dCas9及びnCas9)、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、及びCas12iが挙げられる。Cas9とは異なるPAM特異性を有するプログラム可能なポリヌクレオチド結合タンパク質の一例は、Prevotella及び Francisella1 (Cpf1)由来のClustered Regularly Interspaced Short Palindromic Repeatである。Cas9と同様に、Cpf1もまた、クラス2CRISPRエフェクターである。Cpf1は、Cas9とは異なる機能を備えたロバストなDNA干渉を媒介することが示されている。Cpf1は、tracrRNAを欠く単一のRNAガイドエンドヌクレアーゼであり、Tリッチなプロトスペーサー隣接モチーフ(TTN、TTTN、またはYTN)を利用する。さらに、Cpf1は、ねじれ形のDNA二本鎖切断を介してDNAを切断する。16種類のCpf1ファミリータンパク質のうち、Acidaminococcus及びLachnospiraceae由来の2つの酵素は、ヒト細胞で効率的なゲノム編集活性を有していることが示されている。Cpf1タンパク質は、当技術分野で公知であり、以前に、例えば、Yamano et al., “Crystal structure of Cpf1 in complex with guide RNA and target DNA.” Cell (165)2016, p.949-962に記載されており、その全内容は、参照により本明細書に援用される。
ガイドヌクレオチド配列でプログラム可能なポリヌクレオチド結合タンパク質ドメインとして使用し得るヌクレアーゼ不活性Cpf1 (dCpf1)バリアントもまた、本組成物及び方法において有用である。Cpf1タンパク質は、Cas9のRuvCドメインに類似したRuvC様エンドヌクレアーゼドメインを有するが、HNHエンドヌクレアーゼドメインはなく、Cpf1のN末端にはCas9のαヘリカル認識ローブがない。それは、Zetsche et al., Cell, 163, 759-771, 2015 (参照により本明細書に援用される)において、Cpf1のRuvC様ドメインが両方のDNA鎖の切断に関与し、RuvC様ドメインの不活性化がCpf1ヌクレアーゼ活性を不活性化することが示している。例えば、Francisella novicida Cpf1のD917A、E1006A、またはD1255Aに対応する変異は、Cpf1ヌクレアーゼ活性を不活性化する。いくつかの実施形態では、本開示のdCpf1は、D917A、E1006A、D1255A、D917A/E1006A、D917A/D1255A、E1006A/D1255A、またはD917A/E1006A/D1255Aに対応する変異を含む。Cpf1のRuvCドメインを不活性化する任意の変異、例えば、置換変異、欠失、または挿入を、本開示に従って使用し得ることを理解されたい。
いくつかの実施形態では、本明細書中で提供する融合タンパク質のいずれかの核酸プログラム可能なヌクレオチド結合タンパク質は、Cpf1タンパク質であり得る。いくつかの実施形態では、Cpf1タンパク質は、Cpf1ニッカーゼ(nCpf1)である。いくつかの実施形態では、Cpf1タンパク質は、ヌクレアーゼ不活性Cpf1 (dCpf1)である。いくつかの実施形態では、Cpf1、nCpf1、またはdCpf1は、本明細書に開示するCpf1配列と、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。いくつかの実施形態では、dCpf1は、本明細書に開示するCpf1配列と、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含み、D917A、E1006A、D1255A、D917A/E1006A、D917A/D1255A、E1006A/D1255A、またはD917A/E1006A/D1255Aに対応する変異を含む。他の細菌種由来のCpf1もまた、本開示に従って使用してもよいことを理解すべきである。
野生型Francisella novicida Cpf1のアミノ酸配列は以下の通りである:D917、E1006、及びD1255は、太字で下線が引かれている。
Figure 2022532139000009
Francisella novicida Cpf1 D917Aのアミノ酸配列は以下の通りである: (A917、E1006、及びD1255は、太字で下線が引かれている)。
Figure 2022532139000010
Francisella novicida Cpf1 E1006Aのアミノ酸配列は以下の通りである: (D917、A1006、及びD1255は、太字で下線が引かれている)。
Figure 2022532139000011
Francisella novicida Cpf1 D1255Aのアミノ酸配列は以下の通りである: (D917、E1006、及びA1255変異の位置は、太字で下線が引かれている)。
Figure 2022532139000012
Francisella novicida Cpf1 D917A/E1006Aのアミノ酸配列は以下の通りである: (A917、A1006、及びD1255は、太字で下線が引かれている)。
Figure 2022532139000013
Francisella novicida Cpf1 D917A/D1255Aのアミノ酸配列は以下の通りである: (A917、E1006、及びA1255は、太字で下線が引かれている)。
Figure 2022532139000014
Francisella novicida Cpf1 E1006A/D1225Aのアミノ酸配列は以下の通りである: (D917、A1006、及びA1255は、太字で下線が引かれている)。
Figure 2022532139000015
Francisella novicida Cpf1 D917A/E1006A/D1255Aのアミノ酸配列は以下の通りである: (A917、A1006、及びA1255は、太字で下線が引かれている)。
Figure 2022532139000016
いくつかの実施形態では、融合タンパク質に存在するCas9ドメインの1つを、PAM配列を必要としないガイドヌクレオチド配列でプログラム可能なDNA結合タンパク質ドメインで置き換えてもよい。
いくつかの実施形態では、Casドメインは、Staphylococcus aureus (SaCas9)由来のCas9ドメインである。いくつかの実施形態では、SaCas9ドメインは、ヌクレアーゼ活性SaCas9、ヌクレアーゼ不活性SaCas9 (SaCas9d)、またはSaCas9ニッカーゼ(SaCas9n)である。いくつかの実施形態では、SaCas9ドメインは、N579A変異、または本明細書中で提供するアミノ酸配列のいずれかにおける対応する変異を含む。
いくつかの実施形態では、SaCas9ドメイン、SaCas9dドメイン、またはSaCas9nドメインは、非標準PAMを有する核酸配列に結合することができる。いくつかの実施形態では、SaCas9ドメイン、SaCas9dドメイン、またはSaCas9nドメインは、NNGRRTまたはNNGRRT PAM配列を有する核酸配列に結合することができる。いくつかの実施形態では、SaCas9ドメインは、E781X、N967X、及びR1014X変異のうちの1つ以上、または本明細書中で提供するアミノ酸配列のいずれかにおける対応する変異を含み、Xは任意のアミノ酸である。いくつかの実施形態では、SaCas9ドメインは、E781K、N967K、及びR1014H変異のうちの1つ以上、または本明細書中で提供するアミノ酸配列のいずれかにおける1つ以上の対応する変異を含む。いくつかの実施形態では、SaCas9ドメインは、E781K、N967K、もしくはR1014H変異、または本明細書中で提供するアミノ酸配列のいずれかにおける対応する変異を含む。
例示的なSaCas9のアミノ酸配列は以下の通りである:
Figure 2022532139000017
この配列では、下線が引かれ、太字で示されている残基N579を変異させて(例えば、A579に)、SaCas9ニッカーゼを得ることができる。
例示的なSaCas9nのアミノ酸配列は以下の通りである:
Figure 2022532139000018
この配列では、残基N579から変異させてSaCas9ニッカーゼを得ることができる残基A579には、下線が引かれ、太字で示されている。
例示的なSaKKH Cas9のアミノ酸配列は以下の通りである:
Figure 2022532139000019
残基N579から変異させてSaCas9ニッカーゼを得ることができる上記の残基A579には、下線が引かれ、太字で示されている。E781、N967、及びR1014から変異させてSaKKH Cas9を得ることができる上記の残基K781、K967、及びH1014には、下線が引かれ、イタリック体で示されている。
高忠実度Cas9ドメイン
本開示のいくつかの態様は、高忠実度Cas9ドメインを提供する。いくつかの実施形態では、高忠実度Cas9ドメインは、対応する野生型Cas9ドメインと比較して、Cas9ドメインとDNAの糖リン酸骨格との間の静電相互作用を低下させる1つ以上の変異を含む改変Cas9ドメインである。DNAの糖リン酸骨格との静電相互作用が低下した高忠実度Cas9ドメインは、オフターゲット効果がより低くなり得る。いくつかの実施形態では、Cas9ドメイン(例えば、野生型Cas9ドメイン)は、Cas9ドメインとDNAの糖リン酸骨格との間の会合を低下させる1つ以上の変異を含む。いくつかの実施形態では、Cas9ドメインは、Cas9ドメインとDNAの糖リン酸骨格との間の会合を、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、または少なくとも70%低下させる1つ以上の変異を含む。
いくつかの実施形態では、本明細書中で提供するCas9融合タンパク質のいずれかは、N497X、R661X、Q695X、及び/またはQ926X変異のうちの1つ以上、または本明細書中で提供するアミノ酸配列のいずれかにおける対応する変異を含み、Xは任意のアミノ酸である。いくつかの実施形態では、本明細書中で提供するCas9融合タンパク質のいずれかは、N497A、R661A、Q695A、及び/またはQ926A変異のうちの1つ以上、または本明細書中で提供するアミノ酸配列のいずれかにおける対応する変異を含む。いくつかの実施形態では、Cas9ドメインは、D10A変異、または本明細書中で提供するアミノ酸配列のいずれかにおける対応する変異を含む。高忠実度Cas9ドメインは当技術分野で公知であり、当業者には明らかであろう。例えば、高忠実度Cas9ドメインは、Kleinstiver, B.P., et al. “High-fidelity CRISPR-Cas9 nucleases with no detectable genome-wide off-target effects.” Nature 529,490-495 (2016)、及びSlaymaker, I.M., et al. “Rationally engineered Cas9 nucleases with improved specificity.” Science 351,84-88 (2015)に記載されており;それぞれの全内容は、参照により本明細書に援用される。
いくつかの実施形態では、改変Cas9は、高忠実度Cas9酵素である。いくつかの実施形態では、高忠実度Cas9酵素は、SpCas9 (K855A)、eSpCas9 (1.1)、SpCas9-HF1、または超精密Cas9バリアント(HypaCas9)である。改変Cas9 eSpCas9 (1.1)には、HNH/RuvC溝と非標的DNA鎖の間の相互作用を弱めるアラニン置換が含まれており、鎖の分離とオフターゲット部位での切断を防止する。同様に、SpCas9-HF1は、Cas9とDNAリン酸骨格との相互作用を妨害するアラニン置換を介してオフターゲット編集を低減する。HypaCas9は、REC3ドメインに変異(SpCas9 N692A/M694A/Q695A/H698A)を含んでおり、Cas9の校正及び標的の識別が向上している。3つの高忠実度酵素はすべて、野生型Cas9よりもオフターゲット編集の生成がより少ない。
例示的な高忠実度Cas9を以下に提供する。
Cas9と比較した高忠実度Cas9ドメインの変異を、太字と下線で示す。
Figure 2022532139000020
ガイドポリヌクレオチド
一実施形態では、ガイドポリヌクレオチドはガイドRNAである。RNA/Cas複合体は、Casタンパク質を標的DNAに「ガイド」するのを支援することができる。Cas9/crRNA/tracrRNAが、スペーサーに相補的な直鎖または環状のdsDNA標的をエンドヌクレアーゼ的に切断する。crRNAに相補的でない標的鎖は、最初にエンドヌクレアーゼ的に切断され、次いで3’-5’エキソヌクレアーゼ的にトリミングされる。自然界では、DNAの結合及び切断には、通常、タンパク質と両方のRNAが必要である。しかしながら、単一のガイドRNA (「sgRNA」、または単に「gNRA」)は、crRNA及びtracrRNAの両方の態様を単一のRNA種に組み込むように改変することができる。例えば、Jinek M.et al, Science 337:816-821 (2012)を参照されたい(その全内容は、参照により本明細書に援用される)。Cas9は、CRISPRリピート配列内の短いモチーフ(PAMまたはプロトスペーサー隣接モチーフ)を認識して、自己と非自己を区別することを支援する。Cas9ヌクレアーゼの配列及び構造は当業者に周知である(例えば、”Complete genome sequence of an M1 strain of Streptococcus pyogenes.” Ferretti, J.J. et al., Natl.Acad.Sci.U.S.A.98:4658-4663 (2001);”CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III.” Deltcheva E.et al., Nature 471:602-607 (2011)、及び”Programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.” Jinek M.et al, Science 337:816-821 (2012)を参照されたい(これらのそれぞれの全内容は、参照により本明細書に援用される))。Cas9オルソログは、S. pyogenes及びS. thermophilusを含むがこれらに限定されない、様々な種で記載されている。追加の適切なCas9ヌクレアーゼ及び配列は、本開示に基づいて当業者に明らかであり得、そのようなCas9ヌクレアーゼ及び配列には、Chylinski, Rhun,and Charpentier,”The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems” (2013)RNA Biology 10:5,726-737 (その全内容は、参照により本明細書に組み込まれる)に開示された生物及び遺伝子座からのCas9配列が含まれる。いくつかの実施形態では、Cas9ヌクレアーゼは、不活性(例えば、不活性化)DNA切断ドメインを有し、すなわち、Cas9はニッカーゼである。
いくつかの実施形態では、ガイドポリヌクレオチドは、少なくとも1つの単一のガイドRNA (「sgRNA」または「gNRA」)である。いくつかの実施形態では、ガイドポリヌクレオチドは、少なくとも1つのtracrRNAである。いくつかの実施形態では、ガイドポリヌクレオチドは、ポリヌクレオチドプログラム可能なDNA結合ドメイン(例えば、Cas9またはCpf1)を標的ヌクレオチド配列にガイドするためにPAM配列を必要としない。
本明細書に開示する塩基編集体のポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン(例えば、CRISPR由来ドメイン)は、ガイドポリヌクレオチドと会合することによって標的ポリヌクレオチド配列を認識することができる。ガイドポリヌクレオチド(例えば、gRNA)は、一般的には一本鎖であり、ポリヌクレオチドの標的配列に部位特異的に結合するように(すなわち、相補的塩基対を介して)プログラムし、それにより、ガイド核酸と組み合わせて、塩基編集体を標的配列へ向かわせることができる。ガイドポリヌクレオチドはDNAであり得る。ガイドポリヌクレオチドはRNAであり得る。いくつかの場合では、ガイドポリヌクレオチドは、天然ヌクレオチド(例えば、アデノシン)を含む。いくつかの場合では、ガイドポリヌクレオチドは、非天然(non-natural)(または非天然(unnatural))ヌクレオチド(例えば、ペプチド核酸またはヌクレオチド類似体)を含む。いくつかの場合では、ガイド核酸配列の標的領域は、長さが少なくとも15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30ヌクレオチドであり得る。ガイド核酸の標的領域は、長さが10~30ヌクレオチドの間、または長さが15~25ヌクレオチドの間、または長さが15~20ヌクレオチドの間であり得る。
いくつかの実施形態では、ガイドポリヌクレオチドは、2つ以上の個々のポリヌクレオチドを含み、これは、例えば、相補的塩基対形成(例えば、二重ガイドポリヌクレオチド)を介して互いに相互作用することができる。例えば、ガイドポリヌクレオチドは、CRISPR RNA (crRNA)及びトランス活性化CRISPR RNA (tracrRNA)を含み得る。例えば、ガイドポリヌクレオチドは、1つ以上のトランス活性化CRISPR RNA (tracrRNA)を含み得る。
II型CRISPR系では、CRISPRタンパク質(Cas9など)による核酸の標的化には、通常、標的配列を認識する配列を含む第1のRNA分子(crRNA)と、ガイドRNA-CRISPRタンパク質複合体を安定化する足場領域を形成する反復配列を含む第2のRNA分子(trRNA)の間の相補的な塩基対形成が必要である。そのようなデュアルガイドRNA系をガイドポリヌクレオチドとして使用して、本明細書に開示する塩基編集体を標的ポリヌクレオチド配列に向かわせることができる。
いくつかの実施形態では、本明細書中で提供する塩基編集体は、単一のガイドポリヌクレオチド(例えば、gRNA)を利用する。いくつかの実施形態では、本明細書中で提供する塩基編集体は、二重ガイドポリヌクレオチド(例えば、二重gRNA)を利用する。いくつかの実施形態では、本明細書中で提供する塩基編集体は、1つ以上のガイドポリヌクレオチド(例えば、多重gRNA)を利用する。いくつかの実施形態では、単一のガイドポリヌクレオチドを、本明細書に記載する異なる塩基編集体のために利用する。例えば、単一のガイドポリヌクレオチドを、シチジン塩基編集体及びアデノシン塩基編集体に利用することができる。
他の実施形態では、ガイドポリヌクレオチドは、核酸のポリヌクレオチド標的化部分及び核酸の足場部分の両方を単一分子(すなわち、単一分子ガイド核酸)に含むことができる。例えば、単一分子ガイドポリヌクレオチドは、単一のガイドRNA (sgRNAまたはgRNA)であり得る。本明細書において、ガイドポリヌクレオチド配列という用語は、塩基編集体と相互作用し、標的ポリヌクレオチド配列に向かわせることができる任意の単一、二重、または多重分子核酸を企図する。
通常、ガイドポリヌクレオチド(例えば、crRNA/trRNA複合体またはgRNA)は、標的ポリヌクレオチド配列を認識して結合することができる配列を含む「ポリヌクレオチド標的化セグメント」、及び塩基編集体のポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン成分内のガイドポリヌクレオチドを安定化する「タンパク質結合セグメント」を含む。いくつかの実施形態では、ガイドポリヌクレオチドのポリヌクレオチド標的化セグメントは、DNAポリヌクレオチドを認識して結合し、それにより、DNA中の塩基の編集を容易にする。他の場合では、ガイドポリヌクレオチドのポリヌクレオチド標的化セグメントは、RNAポリヌクレオチドを認識して結合し、それにより、RNA中の塩基の編集を容易にする。本明細書において、「セグメント」とは、分子のセクションまたは領域、例えば、ガイドポリヌクレオチド中のヌクレオチドの連続ストレッチを指す。セグメントはまた、セグメントが複数の分子の領域を含むことができるような、複合体の領域/セクションを指し得る。例えば、ガイドポリヌクレオチドが複数の核酸分子を含む場合、タンパク質結合セグメントは、例えば、相補性の領域に沿ってハイブリダイズされる複数の別個の分子の全部または一部を含み得る。いくつかの実施形態では、2つの別個の分子を含むDNA標的化RNAのタンパク質結合セグメントは、(i)長さが100塩基対である第1のRNA分子の塩基対40~75及び;(ii)長さが50塩基対である第2のRNA分子の10~25塩基対を含み得る。「セグメント」の定義は、特定の文脈で特に定義されていない限り、特定の数の総塩基対に限定されず、所与のRNA分子に由来する任意の特定の数の塩基対に限定されず、複合体内の別々の分子の特定の数に限定されず、任意の全長のRNA分子の領域が含まれ得、他の分子と相補的な領域が含まれ得る。
ガイドRNAまたはガイドポリヌクレオチドは、2つ以上のRNA、例えば、CRISPR RNA (crRNA)及びトランス活性化crRNA (tracrRNA)を含み得る。ガイドRNAまたはガイドポリヌクレオチドは、場合により、crRNAの一部(例えば、機能部分)とtracrRNAとの融合によって形成される一本鎖RNA、または単一のガイドRNA (sgRNA)を含み得る。ガイドRNAまたはガイドポリヌクレオチドはまた、crRNA及びtracrRNAを含む二重RNAであり得る。さらに、crRNAは標的DNAとハイブリダイズすることができる。
上記のように、ガイドRNAまたはガイドポリヌクレオチドは、発現産物であり得る。例えば、ガイドRNAをコードするDNAは、ガイドRNAをコードする配列を含むベクターであり得る。ガイドRNAまたはガイドポリヌクレオチドは、単離されたガイドRNA、またはガイドRNA及びプロモーターをコードする配列を含むプラスミドDNAで細胞をトランスフェクトすることによって細胞に移行させることができる。ガイドRNAまたはガイドポリヌクレオチドは、ウイルスを介した遺伝子送達を使用するなど、他の方法で細胞に移行させることもできる。
ガイドRNAまたはガイドポリヌクレオチドはRNAは、単離され得る。例えば、ガイドRNAは、単離されたRNAの形態で細胞または生物にトランスフェクトすることができる。ガイドRNAは、当技術分野で公知の任意のin vitro転写系を使用するin vitro転写によって調製することができる。ガイドRNAは、ガイドRNAのコード配列を含むプラスミドの形態ではなく、単離されたRNAの形態で細胞に移行させることができる。
ガイドRNAまたはガイドポリヌクレオチドは、3つの領域:染色体配列の標的部位に相補的であり得る5’末端の第1の領域、ステムループ構造を形成することができる第2の内部領域、及び一本鎖であり得る第3の3’領域を含み得る。各ガイドRNAの第1の領域はまた、各ガイドRNAが融合タンパク質を特定の標的部位にガイドするように、異なり得る。さらに、各ガイドRNAの第2及び第3の領域は、すべてのガイドRNAにおいて同一であり得る。
ガイドRNAまたはガイドポリヌクレオチドの第1の領域は、ガイドRNAの第1の領域が標的部位と塩基対を形成することができるように、染色体配列中の標的部位での配列に相補的であり得る。いくつかの場合では、ガイドRNAの第1の領域は、約10ヌクレオチド~25ヌクレオチド(すなわち、10ヌクレオチド~ヌクレオチド;または約10ヌクレオチド~約25ヌクレオチド;または10ヌクレオチド~約25ヌクレオチド;または約10ヌクレオチド~25ヌクレオチド)またはそれ以上を含み得る。例えば、ガイドRNAの第1の領域と染色体配列中の標的部位との間の塩基対形成の領域は、約10、11、12、13、14、15、16、17、18、19、20、22、23、24、25、またはそれ以上のヌクレオチド長であり得る。場合により、ガイドRNAの第1の領域は、19、20、または21ヌクレオチド長であり得るか、または約19、20、または21ヌクレオチド長とすることができる。
ガイドRNAまたはガイドポリヌクレオチドはまた、二次構造を形成する第2の領域を含み得る。例えば、ガイドRNAによって形成される二次構造は、ステム(またはヘアピン)及びループを含み得る。ループとステムの長さは様々に異なる。例えば、ループは、長さが約3~10ヌクレオチドの範囲であり得、ステムは、長さが約6~20塩基対の範囲であり得る。ステムは、1~10または約10ヌクレオチドの1つ以上のバルジを含み得る。第2の領域の全長は、長さが約16~60ヌクレオチドの範囲であり得る。例えば、ループは、長さが4ヌクレオチドであり得るか、または約4ヌクレオチドであり得、ステムは、12塩基対であり得るか、または約12塩基対であり得る。
ガイドRNAまたはガイドポリヌクレオチドはまた、本質的に一本鎖であり得る3’末端に第3の領域を含み得る。例えば、第3の領域は、場合により、目的の細胞内の任意の染色体配列に対して相補性ではなく、場合により、ガイドRNAの残りの部分に対して相補性ではない。さらに、第3の領域の長さは様々に異なり得る。第3の領域は、4ヌクレオチド超または約4ヌクレオチド超の長さであり得る。例えば、第3の領域の長さは、約5~60ヌクレオチド長の範囲であり得る。
ガイドRNAまたはガイドポリヌクレオチドは、遺伝子標的の任意のエクソンまたはイントロンを標的とすることができる。いくつかの場合では、ガイドは、遺伝子のエクソン1または2を標的とすることができ、他の場合では、ガイドは、遺伝子のエクソン3または4を標的とすることができる。組成物は、すべてが同じエクソンを標的とする多重ガイドRNA、またはいくつかの場合では、異なるエクソンを標的とすることができる多重ガイドRNAを含み得る。遺伝子のエクソン及びイントロンが標的となり得る。
ガイドRNAまたはガイドポリヌクレオチドは、20ヌクレオチドまたは約20ヌクレオチドの核酸配列を標的とすることができる。標的核酸は、20ヌクレオチド未満または約20ヌクレオチド未満であり得る。標的核酸は、少なくとも5、10、15、16、17、18、19、20、21、22、23、24、25、30、もしくは少なくとも約5、10、15、16、17、18、19、20、21、22、23、24、25、30、または1~100ヌクレオチドの長さのいずれかであり得る。標的核酸は、多くとも5、10、15、16、17、18、19、20、21、22、23、24、25、30、40、50、もしくは多くとも約5、10、15、16、17、18、19、20、21、22、23、24、25、30、40、50、または1~100ヌクレオチドの長さのいずれかであり得る。標的核酸配列は、PAMの第1のヌクレオチドのすぐ5’側の20塩基であるか、または約20塩基であり得る。ガイドRNAは、核酸配列を標的とすることができる。標的核酸は、少なくとも1~10、1~20、1~30、1~40、1~50、1~60、1~70、1~80、1~90、もしくは1~100ヌクレオチド、または少なくとも約1~10、1~20、1~30、1~40、1~50、1~60、1~70、1~80、1~90、または1~100ヌクレオチドであり得る。
ガイドポリヌクレオチド、例えば、ガイドRNAとは、別の核酸、例えば、細胞のゲノム中の標的核酸またはプロトスペーサーにハイブリダイズすることができる核酸を指し得る。ガイドポリヌクレオチドはRNAであり得る。ガイドポリヌクレオチドはDNAであり得る。ガイドポリヌクレオチドは、核酸の配列に部位特異的に結合するようにプログラムまたは設計することができる。ガイドポリヌクレオチドは、ポリヌクレオチド鎖を含み得、単一のガイドポリヌクレオチドと呼ばれ得る。ガイドポリヌクレオチドは、2つのポリヌクレオチド鎖を含み得、二重ガイドポリヌクレオチドと呼ばれ得る。ガイドRNAは、RNA分子として細胞または胚に導入することができる。例えば、RNA分子を、in vitroで転写することができ、及び/または化学的に合成することができる。RNAは、合成DNA分子、例えば、gBlocks (登録商標)遺伝子断片から転写させることができる。次いで、ガイドRNAを、RNA分子として細胞または胚に導入することができる。ガイドRNAはまた、非RNA核酸分子、例えば、DNA分子の形態で細胞または胚に導入することもできる。例えば、ガイドRNAをコードするDNAを、目的の細胞または胚内でガイドRNAを発現させるためのプロモーター制御配列に作動可能に連結することができる。RNAコード配列は、RNAポリメラーゼIII (Pol III)によって認識されるプロモーター配列に作動可能に連結することができる。ガイドRNAを発現させるために使用することができるプラスミドベクターとして、px330ベクター及びpx333ベクターが挙げられるが、これらに限定されない。いくつかの場合では、プラスミドベクター(例えば、px333ベクター)は、少なくとも2つのガイドRNAをコードするDNA配列を含み得る。
ガイドポリヌクレオチド、例えば、ガイドRNA及び標的化配列を選択、設計、及び検証するための方法は、本明細書に記載されており、当業者に公知である。例えば、核酸塩基編集系におけるデアミナーゼドメイン(例えば、AIDドメイン)の潜在的な基質非特異性の影響を最小限にするために、意図せずに脱アミノ化の標的となる可能性のある残基の数(例えば、標的核酸遺伝子座内のssDNAに潜在的に存在し得るオフターゲットC残基)を最小限に抑えてもよい。さらに、ソフトウェアツールを使用して、標的核酸配列に対応するgRNAを最適化し、例えば、ゲノム全体のオフターゲット活性の合計を最小限に抑えることができる。例えば、S. pyogenes Cas9を使用した可能な標的化ドメインの選択ごとに、最大で特定数(例えば、1、2、3、4、5、6、7、8、9、または10個)のミスマッチ塩基対を含むすべてのオフターゲット配列(例えば、NAGまたはNGGなどの先行して選択されたPAM)を、ゲノム全体で同定することができる。標的部位に相補的なgRNAの第1の領域を同定することができ、すべての第1の領域(例えば、crRNA)を、その予測されたオフターゲットスコアの合計に従ってランク付けすることができ;上位の標的化ドメインは、オンターゲット活性が最大でオフターゲット活性が最小である可能性が高いドメインを表す。候補標的化gRNAは、当技術分野で公知の方法及び/または本明細書に記載の方法を使用することによって機能的に評価することができる。
非限定的な例として、Cas9と共に使用するためのガイドRNAのcrRNA中の標的DNAハイブリダイズ配列を、DNA配列検索アルゴリズムを使用して同定してもよい。gRNA設計は、Bae S., Park J., & Kim J.-S. Cas-OFFinder:A fast and versatile algorithm that searches for potential off-target sites of Cas9 RNA-guided endonucleases.Bioinformatics 30,1473-1475 (2014)に記載されているように、パブリックツールcas-offinderに基づくカスタムgRNA設計ソフトウェアを使用して実施してもよい。このソフトウェアは、ゲノム全体のオフターゲット傾向を計算した後、ガイドをスコアリングする。17~24の長さの範囲のガイドに対して、通常、完全一致~7か所の不一致の範囲の一致を考慮する。オフターゲット部位を計算によって決定した後、ガイドごとに集計スコアを計算し、Webインターフェイスを使用して表形式の出力にまとめる。PAM配列に隣接する潜在的な標的部位を同定することに加えて、ソフトウェアは、選択された標的部位から1、2、3または3ヌクレオチド超異なるすべてのPAM隣接配列も同定する。標的核酸配列、例えば、標的遺伝子に対するゲノムDNA配列を取得してもよく、そして反復エレメントを、公的に利用可能なツール、例えば、RepeatMaskerプログラムを使用してスクリーニングしてもよい。RepeatMaskerは、入力DNA配列を、反復エレメント及び複雑度の低い領域に対して検索する。出力は、所与のクエリ配列に存在する反復の詳細なアノテーションである。
同定に続いて、ガイドRNA、例えば、crRNAの第1の領域を、標的部位までの距離、それらの直交性、及び関連するPAM配列との密接な一致のための5’ヌクレオチド(例えば、適切なPAM、例えば、S. pyogenesの場合はNGG PAM、S. aureusの場合はNNGRRTまたはNNGRRV PAMを含むヒトゲノム内の密接な一致の同定に基づく5’G)の存在に基づいて階層にランク付けしてもよい。本明細書中で使用する場合、直交性とは、標的配列に対する最小数のミスマッチを含むヒトゲノム中の配列の数を指す。「高レベルの直交性」または「良好な直交性」とは、例えば、意図した標的以外にヒトゲノムに同一の配列を有さない、または標的配列内に1つもしくは2つのミスマッチを含む配列を有さない20merの標的化ドメインを指し得る。オフターゲットDNA切断を最小限に抑えるために、良好な直交性を有する標的化ドメインを選択してもよい。
いくつかの実施形態では、レポーター系を、塩基編集活性を検出し、候補ガイドポリヌクレオチドを試験するために使用してもよい。いくつかの実施形態では、レポーター系は、塩基編集活性がレポーター遺伝子の発現をもたらすレポーター遺伝子ベースのアッセイを含み得る。例えば、レポーター系は、不活性化された開始コドン、例えば、3’-TAC-5’から3’-CAC-5’へのテンプレート鎖上の変異を含むレポーター遺伝子を含み得る。標的Cの脱アミノ化が成功すると、対応するmRNAは5’-GUG-3’ではなく5’-AUG-3’として転写され、レポーター遺伝子の翻訳が可能になる。適切なレポーター遺伝子は、当業者には明らかであろう。レポーター遺伝子の非限定的な例として、緑色蛍光タンパク質(GFP)、赤色蛍光タンパク質(RFP)、ルシフェラーゼ、分泌型アルカリホスファターゼ(SEAP)をコードする遺伝子、またはその発現が検出可能で当業者に明らかな任意の他の遺伝子が挙げられる。レポーター系を使用して、例えば、標的DNA配列に関して、それぞれのデアミナーゼが標的とする残基(複数可)を決定するために、多くの異なるgRNAを試験することができる。Cas9デアミナーゼ融合タンパク質などの特定の塩基編集タンパク質のオフターゲット効果を評価するために、非テンプレート鎖を標的とするsgRNAを試験することもできる。いくつかの実施形態では、そのようなgRNAを、変異した開始コドンがgRNAと塩基対を形成しないように設計することができる。ガイドポリヌクレオチドは、標準的なリボヌクレオチド、修飾されたリボヌクレオチド(例えば、シュードウリジン)、リボヌクレオチド異性体、及び/またはリボヌクレオチド類似体を含み得る。いくつかの実施形態では、ガイドポリヌクレオチドは、少なくとも1つの検出可能な標識を含み得る。検出可能な標識は、フルオロフォア(例えば、FAM、TMR、Cy3、Cy5、Texas Red、Oregon Green、Alexa Fluors、Haloタグ、または適切な蛍光色素)、検出タグ(例えば、ビオチン、ジゴキシゲニンなど)、量子ドット、または金粒子であり得る。
ガイドポリヌクレオチドは、化学的に合成するか、酵素的に合成するか、またはそれらの組み合わせであり得る。例えば、ガイドRNAは、標準的なホスホルアミダイト系の固相合成法を使用して合成することができる。あるいは、ガイドRNAをコードするDNAを、ファージRNAポリメラーゼによって認識されるプロモーター制御配列に作動可能に連結することによって、ガイドRNAをin vitroで合成することができる。適切なファージプロモーター配列の例として、T7、T3、SP6プロモーター配列、またはそれらのバリアントが挙げられる。ガイドRNAが2つの別個の分子(例えば、crRNA及びtracrRNA)を含む実施形態では、crRNAは化学的に合成することができ、tracrRNAは酵素的に合成することができる。
いくつかの実施形態では、塩基編集系は、複数のガイドポリヌクレオチド、例えば、gRNAを含み得る。例えば、gRNAは、塩基編集系に含まれる1つ以上の標的遺伝子座を標的とし得る(例えば、少なくとも1つのgRNA、少なくとも2つのgRNA、少なくとも5つのgRNA、少なくとも10個のgRNA、少なくとも20個のgRNA、少なくとも30個のgRNA、少なくとも50個のgRNA)。多重gRNA配列はタンデムに配置することができ、好ましくは直接反復によって分離される。
ガイドRNA (gRNA)またはガイドポリヌクレオチドをコードするDNA配列もまた、ベクターの一部であり得る。さらに、ベクターは、追加の発現制御配列(例えば、エンハンサー配列、コザック配列、ポリアデニル化配列、転写終結配列など)、選択可能なマーカー配列(例えば、GFPまたはピューロマイシンなどの抗生物質耐性遺伝子)、複製起点などを含み得る。ガイドRNAをコードするDNA分子はまた、直鎖状とすることもできる。ガイドRNA (gRNA)またはガイドポリヌクレオチドをコードするDNA配列はまた、環状とすることもできる。
いくつかの実施形態では、塩基編集系の1つ以上の成分は、DNA配列によってコードされ得る。そのようなDNA配列を、一緒にまたは別々に、発現系、例えば、細胞に導入してもよい。例えば、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン及びガイドRNAをコードするDNA配列を細胞に導入することができ、各DNA配列は別個の分子(例えば、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインコード配列を含む1つのベクターと、ガイドRNAコード配列を含む第2のベクター)の一部とすることができるか、または両方を同じ分子の一部にすることができる(例えば、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインとガイドRNAの両方のコード(及び調節)配列を含む1つのベクター)。
ガイドポリヌクレオチドに1つ以上の修飾を含めて、核酸に新しいまたは強化された特徴を提供することができる。ガイドポリヌクレオチドは、核酸親和性タグを含み得る。ガイドポリヌクレオチドは、合成ヌクレオチド、合成ヌクレオチド類似体、ヌクレオチド誘導体、及び/または修飾ヌクレオチドを含み得る。
いくつかの場合では、gRNAまたはガイドポリヌクレオチドは修飾を含み得る。修飾は、gRNAまたはガイドポリヌクレオチドの任意の位置で行うことができる。単一のgRNAまたはガイドポリヌクレオチドに複数の修飾を加えることができる。修飾後に、gRNAまたはガイドポリヌクレオチドを品質管理に供することができる。いくつかの場合では、品質管理には、PAGE、HPLC、MS、またはそれらの任意の組み合わせが含まれる。
gRNAまたはガイドポリヌクレオチドの修飾は、置換、挿入、欠失、化学的修飾、物理的修飾、安定化、精製、またはそれらの任意の組み合わせであり得る。
gRNAまたはガイドポリヌクレオチドはまた、5’アデニレート、5’グアノシン-三リン酸cap、5’N7-メチルグアノシン-三リン酸cap、5’三リン酸cap、3’リン酸、3’チオリン酸、5’リン酸、5’チオリン酸、シス-Synチミジン二量体、三量体、C12スペーサー、C3スペーサー、C6スペーサー、dSpacer、PCスペーサー、rSpacer、Spacer18、Spacer9,3’-3’修飾、5’-5’修飾、脱塩基、アクリジン、アゾベンゼン、ビオチン、ビオチンBB、ビオチンTEG、コレステリルTEG、デスチオビオチンTEG、DNP TEG、DNP-X、DOTA、dT-ビオチン、デュアルビオチン、PCビオチン、ソラレンC2、ソラレンC6、TINA、3’DABCYL、ブラックホールクエンチャー1、ブラックホールクエンチャー2、DABCYL SE、dT-DABCYL、IRDye QC-1、QSY-21、QSY-35、QSY-7、QSY-9、カルボキシルリンカー、チオールリンカー、2’-デオキシリボヌクレオシド類似体プリン、2’-デオキシリボヌクレオシド類似体ピリミジン、リボヌクレオシド類似体、2’-O-メチルリボヌクレオシド類似体、糖修飾類似体、ウォブル/ユニバーサル塩基、蛍光色素標識、2’-フルオロRNA、2’-O-メチルRNA、ホスホン酸メチル、ホスホジエステルDNA、ホスホジエステルRNA、ホスホチオエートDNA、ホスホロチオエートRNA、UNA、シュードウリジン-5’-三リン酸、5’-メチルシチジン-5’-三リン酸、またはそれらの任意の組み合わせによって修飾され得る。
いくつかの場合では、修飾は永続的である。他の場合では、修飾は一時的である。いくつかの場合では、gRNAまたはガイドポリヌクレオチドに対して、複数の修飾を行う。gRNAまたはガイドポリヌクレオチド修飾は、それらのコンフォメーション、極性、疎水性、化学反応性、塩基対相互作用、またはそれらの任意の組み合わせなどのヌクレオチドの物理化学的特性を変えることができる。
PAM配列は、当技術分野で公知の任意のPAM配列であり得る。適切なPAM配列として、NGG、NGA、NGC、NGN、NGT、NGCG、NGAG、NGAN、NGNG、NGCN、NGCG、NGTN、NNGRRT、NNNRRT、NNGRR (N)、TTTV、TYCV、TYCV、TATV、NNNNGATT、NNAGAAW、またはNAAAACが挙げられるが、これらに限定されない。Yはピリミジンであり;Nは任意のヌクレオチド塩基であり;Wは、AまたはTである。
修飾はまた、ホスホロチオエート置換体であり得る。いくつかの場合では、天然のホスホジエステル結合は、細胞のヌクレアーゼによる急速な分解を受けやすい可能性があり;ホスホロチオエート(PS)結合置換体を使用したヌクレオチド間結合の修飾は、細胞分解による加水分解に対してより安定している可能性がある。修飾は、gRNAまたはガイドポリヌクレオチドの安定性を高めることができる。修飾はまた、生物学的活性を高めることができる。いくつかの場合では、ホスホロチオエートで強化されたRNA gRNAは、RNase A、RNase T1、ウシ血清ヌクレアーゼ、またはそれらの任意の組み合わせを阻害することができる。これらの特性により、ヌクレアーゼへの曝露がin vivoまたはin vitroで高確率で行われる用途において、PS-RNA gRNAを使用することができる。例えば、ホスホロチオエート(PS)結合をgRNAの5’-または‘‘-末端の最後の3-5ヌクレオチドの間に導入することができ、エキソヌクレアーゼ分解を阻害することができる。いくつかの場合では、ホスホロチオエート結合をgRNA全体に付加してエンドヌクレアーゼによる攻撃を減らすことができる。
プロトスペーサー隣接モチーフ
用語「プロトスペーサー隣接モチーフ(PAM)」またはPAM様モチーフとは、CRISPR細菌適応免疫系のCas9ヌクレアーゼが標的とするDNA配列の直後にある2~6塩基対のDNA配列を指す。いくつかの実施形態では、PAMは5’PAM (すなわち、プロトスペーサーの5’末端の上流に位置する)であり得る。他の実施形態では、PAMは3’PAM (すなわち、プロトスペーサーの5’末端の下流に位置する)であり得る。
PAM配列は標的結合に不可欠であるが、正確な配列はCasタンパク質の種類によって異なる。
本明細書中で提供する塩基編集体は、標準または非標準プロトスペーサー隣接モチーフ(PAM)配列を含むヌクレオチド配列に結合することができるCRISPRタンパク質由来ドメインを含み得る。PAM部位は、標的ポリヌクレオチド配列に近接するヌクレオチド配列である。本開示のいくつかの態様は、異なるPAM特異性を有するCRISPRタンパク質の全部または一部を含む塩基編集体を提供する。例えば、通常、Cas9タンパク質、例えば、S. pyogenes由来のCas9 (spCas9)は、特定の核酸領域に結合するために標準的なNGG PAM配列を必要とし、「NGG」の「N」は、アデニン(A)、チミン(T)、グアニン(G)、またはシトシン(C)であり、Gはグアニンである。PAMはCRISPRタンパク質特異的であり、異なるCRISPRタンパク質由来ドメインを含む異なる塩基編集体間で異なり得る。PAMは、標的配列の5’または3’であり得る。PAMは、標的配列の上流または下流であり得る。PAMは、1、2、3、4、5、6、7、8、9、10ヌクレオチド以上の長さであり得る。多くの場合、PAMの長さは2~6ヌクレオチドである。以下の表1に、いくつかのPAMバリアントを記載する。
Figure 2022532139000021
いくつかの実施形態では、PAMはNGCである。いくつかの実施形態では、NGC PAMは、Cas9バリアントによって認識される。いくつかの実施形態では、NGC PAMバリアントは、D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、及びT1337R (「MQKFRAER」と総称される)から選択される1つ以上のアミノ酸置換を含む。
いくつかの実施形態では、PAMはNGTである。いくつかの実施形態では、NGT PAMはCas9バリアントによって認識される。いくつかの実施形態では、NGT PAMバリアントは、1つ以上の残基1335、1337、1135、1136、1218、及び/または1219での標的変異によって生成される。いくつかの実施形態では、NGT PAMバリアントは、1つ以上の残基1219、1335、1337、1218での標的変異によって作成される。いくつかの実施形態では、NGT PAMバリアントは、1つ以上の残基1135、1136、1218、1219、及び1335での標的変異によって作成される。いくつかの実施形態では、NGT PAMバリアントは、以下の表2及び3に示す標的変異のセットから選択される。
Figure 2022532139000022
Figure 2022532139000023
いくつかの実施形態では、NGT PAMバリアントは、表2及び3のバリアント5、7、28、31、または36から選択される。いくつかの実施形態では、バリアントは、NGT PAM認識が向上している。
いくつかの実施形態では、NGT PAMバリアントは、残基1219、1335、1337、及び/または1218で変異を有する。いくつかの実施形態では、NGT PAMバリアントは、以下の表4に示すバリアントからの認識を向上させるための変異を用いて選択される。
Figure 2022532139000024
いくつかの実施形態では、NGT PAMは、以下の表5に示すバリアントから選択される。
Figure 2022532139000025
いくつかの実施形態では、NGTNバリアントは、バリアント1である。いくつかの実施形態では、NGTNバリアントは、バリアント2である。いくつかの実施形態では、NGTNバリアントは、バリアント3である。いくつかの実施形態では、NGTNバリアントは、バリアント4である。いくつかの実施形態では、NGTNバリアントはバリアント5である。いくつかの実施形態では、NGTNバリアントはバリアント6である。
いくつかの実施形態では、Cas9ドメインは、Streptococcus pyogenes (SpCas9)由来のCas9ドメインである。いくつかの実施形態では、SpCas9ドメインは、ヌクレアーゼ活性SpCas9、ヌクレアーゼ不活性SpCas9 (SpCas9d)、またはSpCas9ニッカーゼ(SpCas9n)である。いくつかの実施形態では、SpCas9は、D9X変異、または本明細書中で提供するアミノ酸配列のいずれかにおける対応する変異を含み、Xは、Dを除く任意のアミノ酸である。いくつかの実施形態では、SpCas9は、D9A変異、または本明細書中で提供するアミノ酸配列のいずれかにおける対応する変異を含む。いくつかの実施形態では、SpCas9ドメイン、SpCas9dドメイン、またはSpCas9nドメインは、非標準PAMを有する核酸配列に結合することができる。いくつかの実施形態では、SpCas9ドメイン、SpCas9dドメイン、またはSpCas9nドメインは、NGG、NGA、またはNGCG PAM配列を有する核酸配列に結合することができる。
いくつかの実施形態では、SpCas9ドメインは、D1135X、R1335X、及びT1337X変異のうちの1つ以上、または本明細書中で提供するアミノ酸配列のいずれかにおける対応する変異を含み、Xは任意のアミノ酸である。いくつかの実施形態では、SpCas9ドメインは、D1135E、R1335Q、及びT1337R変異のうちの1つ以上、または本明細書中で提供するアミノ酸配列のいずれかにおける対応する変異を含む。いくつかの実施形態では、SpCas9ドメインは、D1135E、R1335Q、及びT1337R変異、または本明細書中で提供するアミノ酸配列のいずれかにおける対応する変異を含む。いくつかの実施形態では、SpCas9ドメインは、D1135X、R1335X、及びT1337X変異のうちの1つ以上、または本明細書中で提供するアミノ酸配列のいずれかにおける対応する変異を含み、Xは任意のアミノ酸である。いくつかの実施形態では、SpCas9ドメインは、D1135V、R1335Q、及びT1337R変異のうちの1つ以上、または本明細書中で提供するアミノ酸配列のいずれかにおける対応する変異を含む。いくつかの実施形態では、SpCas9ドメインは、D1135V、R1335Q、及びT1337R変異、または本明細書中で提供するアミノ酸配列のいずれかにおける対応する変異を含む。いくつかの実施形態では、SpCas9ドメインは、D1135X、G1218X、R1335X、及びT1337X変異のうちの1つ以上、または本明細書中で提供するアミノ酸配列のいずれかにおける対応する変異を含み、Xは任意のアミノ酸である。いくつかの実施形態では、SpCas9ドメインは、D1135V、G1218R、R1335Q、及びT1337R変異のうちの1つ以上、または本明細書中で提供するアミノ酸配列のいずれかにおける対応する変異を含む。いくつかの実施形態では、SpCas9ドメインは、D1135V、G1218R、R1335Q、及びT1337R変異、または本明細書中で提供するアミノ酸配列のいずれかにおける対応する変異を含む。
いくつかの実施形態では、本明細書中で提供する融合タンパク質のいずれかのCas9ドメインは、本明細書に記載のCas9ポリペプチドに対して、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。いくつかの実施形態では、本明細書中で提供する融合タンパク質のいずれかのCas9ドメインは、本明細書に記載の任意のCas9ポリペプチドのアミノ酸配列を含む。いくつかの実施形態では、本明細書中で提供する融合タンパク質のいずれかのCas9ドメインは、本明細書に記載の任意のCas9ポリペプチドのアミノ酸配列からなる。
いくつかの例では、本明細書に開示する塩基編集体のCRISPRタンパク質由来ドメインによって認識されるPAMを、塩基編集体をコードするインサート(例えば、AAVインサート)とは別個のオリゴヌクレオチド上にて、細胞に提供することができる。そのような実施形態では、別個のオリゴヌクレオチド上にPAMを提供することにより、標的配列と同じポリヌクレオチド上にPAMが隣接して存在しないことから、存在していれば切断できないであろう標的配列の切断が可能になり得る。
一実施形態では、S. pyogenes Cas9 (SpCas9)をゲノム改変用のCRISPRエンドヌクレアーゼとして使用することができる。しかしながら、他のものを使用することができる。いくつかの実施形態では、異なるエンドヌクレアーゼを使用して、特定のゲノム標的を標的化することができる。いくつかの実施形態では、非NGG PAM配列を有する合成SpCas9由来バリアントを使用することができる。さらに、様々な種に由来する他のCas9オルソログが同定されており、これらの「非SpCas9」は、本開示にも有用であり得る様々なPAM配列に結合することができる。例えば、比較的大きなサイズのSpCas9 (およそ4kbのコード配列)は、細胞内で効率的に発現できないSpCas9 cDNAを保有するプラスミドをもたらし得る。逆に、Staphylococcus aureus Cas9 (SaCas9)のコード配列は、SpCas9よりもおよそ1キロベース短く、細胞内で効率的に発現できる可能性がある。SpCas9と同様に、SaCas9エンドヌクレアーゼは、in vitroで哺乳類細胞において、及びin vivoでマウスにおいて、標的遺伝子を改変することができる。いくつかの実施形態では、Casタンパク質は、異なるPAM配列を標的とすることができる。いくつかの実施形態では、標的遺伝子は、例えば、Cas9 PAM、5’-NGGに隣接し得る。他の実施形態では、他のCas9オルソログは、異なるPAM要件を有し得る。例えば、S. thermophilus (CRISPR1の場合は5’-NNAGAA、CRISPR3の場合は5’-NGGNG)及びNeisseria meningiditis (5’-NNNNGATT)のものなどの他のPAMも標的遺伝子に隣接して見出され得る。
いくつかの実施形態では、S. pyogenes系の場合、標的遺伝子配列は、5’-NGG PAMより先行させることができ(すなわち、5’側へ)、20ntのガイドRNA配列は、反対の鎖と塩基対を形成して、PAMに隣接するCas9切断を媒介することができる。いくつかの実施形態では、隣接するcutは、PAMの3塩基対または約3塩基対上流であり得る。いくつかの実施形態では、隣接するcutは、PAMの10塩基対または約10塩基対上流であり得る。いくつかの実施形態では、隣接するcutは、PAMの0~20塩基対または約0~20塩基対上流であり得る。例えば、隣接するcutは、PAMの、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30塩基対上流に隣接し得る。隣接するcutはまた、PAMの1~30塩基対下流であり得る。PAM配列に結合することができる例示的なSpCas9タンパク質の配列は以下の通りである:
例示的なPAM結合SpCas9のアミノ酸配列は以下の通りである:
MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD。
例示的なPAM結合SpCas9nのアミノ酸配列は以下の通りである:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD。
例示的なPAM結合SpEQR Cas9のアミノ酸配列は以下の通りである:
Figure 2022532139000026
この配列では、D1135、R1335、及びT1337から変異させてSpEQR Cas9を生成し得る残基E1135、Q1335、及びR1337に、下線が引かれ、太字で示されている。
例示的なPAM結合SpVQR Cas9のアミノ酸配列は以下の通りである:
Figure 2022532139000027
この配列では、D1135、R1335、及びT1337から変異させてSpVQR Cas9を生成し得る残基V1135、Q1335、及びR1337に、下線が引かれ、太字で示されている。
例示的なPAM結合SpVRER Cas9のアミノ酸配列は以下の通りである:
Figure 2022532139000028
上記の配列では、D1134、G1217、R1335、及びT1337から変異させてSpVRER Cas9を生成し得る残基V1135、R1218、Q1335、及びR1337に、下線が引かれ、太字で示されている。
いくつかの実施形態では、Cas9ドメインは、組換えCas9ドメインである。いくつかの実施形態では、組換えCas9ドメインは、SpyMacCas9ドメインである。いくつかの実施形態では、SpyMacCas9ドメインは、ヌクレアーゼ活性SpyMacCas9、ヌクレアーゼ不活性SpyMacCas9 (SpyMacCas9d)、またはSpyMacCas9ニッカーゼ(SpyMacCas9n)である。いくつかの実施形態では、SaCas9ドメイン、SaCas9dドメイン、またはSaCas9nドメインは、非標準PAMを有する核酸配列に結合することができる。いくつかの実施形態では、SpyMacCas9ドメイン、SpCas9dドメイン、またはSpCas9nドメインは、NAA PAM配列を有する核酸配列に結合することができる。
例示的なSpyMacCas9
MDKKYSIGLDIGTNSVGWAVITDDYKVPSKKFKVLGNTDRHSIKKNLIGALLFGSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLADSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQIYNQLFEENPINASRVDAKAILSARLSKSRRLENLIAQLPGEKRNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNSEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGAYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDRGMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGHSLHEQIANLAGSPAIKKGILQTVKIVDELVKVMGHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFIKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEIQTVGQNGGLFDDNPKSPLEVTPSKLVPLKKELNPKKYGGYQKPTTAYPVLLITDTKQLIPISVMNKKQFEQNPVKFLRDRGYQQVGKNDFIKLPKYTLVDIGDGIKRLWASSKEIHKGNQLVVSKKSQILLYHAHHLDSDLSNDYLQNHNQQFDVLFNEIISFSKKCKLGKEHIQKIENVYSNKKNSASIEELAESFIKLLGFTQLGATSPFNFLGVKLNQKQYKGKKDYILPCTEGTLIRQSITGLYETRVDLSKIGED。
いくつかの場合では、バリアントCas9タンパク質は、H840A、P475A、W476A、N477A、D1125A、W1126A、及びD1218A変異を有し、それにより、このポリペプチドは、標的DNAまたは標的RNAを切断する能力が低下している。そのようなCas9タンパク質は、標的DNA (例えば、一本鎖標的DNA)を切断する能力が低下しているが、標的DNA (例えば、一本鎖標的DNA)に結合する能力を保持している。別の非限定的な例として、いくつかの場合では、バリアントCas9タンパク質は、D10A、H840A、P475A、W476A、N477A、D1125A、W1126A、及びD1218A変異を有し、それにより、このポリペプチドは、標的DNAを切断する能力が低下している。そのようなCas9タンパク質は、標的DNA (例えば、一本鎖標的DNA)を切断する能力が低下しているが、標的DNA (例えば、一本鎖標的DNA)に結合する能力を保持している。いくつかの場合では、バリアントCas9タンパク質がW476A及びW1126A変異を含む場合、またはバリアントCas9タンパク質がP475A、W476A、N477A、D1125A、W1126A、及びD1218A変異を含む場合、バリアントCas9タンパク質はPAM配列に効率的に結合しない。したがって、いくつかのそのような場合、そのようなバリアントCas9タンパク質を結合方法で使用する場合、方法はPAM配列を必要としない。言い換えれば、いくつかの場合では、そのようなバリアントCas9タンパク質を結合方法で使用する場合、方法はガイドRNAを含むことができるが、方法はPAM配列がなくても実施することができる(そして結合の特異性はしたがって、ガイドRNAの標的化セグメントによって提供される)。他の残基は、上記の効果を達成するために変異させることができる(すなわち、1つまたは他のヌクレアーゼ部分を不活性化する)。非限定的な例として、残基D10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D986、及び/またはA987を改変する(すなわち、置換する)ことができる。また、アラニン置換以外の変異も適している。
いくつかの実施形態では、塩基編集体のCRISPRタンパク質由来ドメインは、標準PAM配列(NGG)を有するCas9タンパク質の全部または一部を含み得る。他の実施形態では、塩基編集体のCas9由来ドメインは、非標準PAM配列を使用することができる。そのような配列は当技術分野で説明されており、当業者には明らかであろう。例えば、非標準PAM配列に結合するCas9ドメインは、Kleinstiver, B.P., et al., ”Engineered CRISPR-Cas9 nucleases with altered PAM specificities” Nature 523,481-485 (2015)、及びKleinstiver, B.P., et al., ”Broadening the targeting range of Staphylococcus aureus CRISPR-Cas9 by modifying PAM recognition” Nature Biotechnology 33,1293-1298 (2015)に記載されており;それぞれの全内容は、参照により本明細書に援用される。
排他性が低下したCas9ドメイン
通常、Cas9タンパク質、例えば、S. pyogenes由来のCas9 (spCas9)は、特定の核酸領域に結合するために標準的なNGG PAM配列を必要とし、「NGG」の「N」は、アデノシン(A)、チミジン(T)、またはシトシン(C)であり、Gはグアノシンである。これにより、ゲノム内の目的の塩基を編集する機能が制限され得る。いくつかの実施形態では、本明細書中で提供する塩基編集融合タンパク質は、正確な位置、例えば、PAMの上流にある標的塩基を含む領域に配置される必要があり得る。例えば、Komor, A.C., et al., ”Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533,420-424 (2016)を参照されたい;その全内容は参照により本明細書に援用される。したがって、いくつかの実施形態では、本明細書中で提供する融合タンパク質のいずれかは、標準(例えば、NGG)PAM配列を含まないヌクレオチド配列に結合することができるCas9ドメインを含み得る。非標準PAM配列に結合するCas9ドメインは当技術分野で説明されており、当業者には明らかであろう。例えば、非標準PAM配列に結合するCas9ドメインは、Kleinstiver, B.P., et al., ”Engineered CRISPR-Cas9 nucleases with altered PAM specificities” Nature 523,481-485 (2015)、及びKleinstiver, B.P., et al., ”Broadening the targeting range of Staphylococcus aureus CRISPR-Cas9 by modifying PAM recognition” Nature Biotechnology 33,1293-1298 (2015);Nishimasu, H., et al., ”Engineered CRISPR-Cas9 nuclease with expanded targeting space” Science.2018 Sep 21;361 (6408):1259-1262,Chatterjee,P., et al., Minimal PAM specificity of a highly similar SpCas9 ortholog” Sci Adv.2018 Oct 24;4 (10):eaau0766.doi:10.1126/sciadv.aau0766に記載されており;それぞれの全内容は、参照により本明細書に援用される。
Cas9ドメインとシチジンデアミナーゼ及び/またはアデノシンデアミナーゼを含む融合タンパク質
本開示のいくつかの態様は、Cas9ドメインまたは他の核酸プログラム可能なDNA結合タンパク質及び1つ以上のアデノシンデアミナーゼドメイン、シチジンデアミナーゼドメイン、及び/またはDNAグリコシラーゼドメインを含む融合タンパク質を提供する。Cas9ドメインは、本明細書中で提供するCas9ドメインまたはCas9タンパク質(例えば、dCas9またはnCas9)のいずれかであり得ることを理解すべきである。いくつかの実施形態では、本明細書中で提供するCas9ドメインまたはCas9タンパク質(例えば、dCas9またはnCas9)のいずれかを、本明細書中で提供するシチジンデアミナーゼ及びアデノシンデアミナーゼのいずれかと融合させてもよい。本明細書に開示する塩基編集体のドメインは、任意の順序で配置することができる。
例えば、限定されないが、いくつかの実施形態では、融合タンパク質は、構造:
NH2-[シチジンデアミナーゼ]-[Cas9ドメイン]-[アデノシンデアミナーゼ]-COOH;
NH2-[アデノシンデアミナーゼ]-[Cas9ドメイン]-[シチジンデアミナーゼ]-COOH;
NH2-[アデノシンデアミナーゼ]-[シチジンデアミナーゼ]-[Cas9ドメイン]-COOH;
NH2-[シチジンデアミナーゼ]-[アデノシンデアミナーゼ]-[Cas9ドメイン]-COOH;
NH2-[Cas9ドメイン]-[アデノシンデアミナーゼ]-[シチジンデアミナーゼ]-COOH;または
NH2-[Cas9ドメイン]-[シチジンデアミナーゼ]-[アデノシンデアミナーゼ]-COOHを含む。
いくつかの実施形態では、融合タンパク質のアデノシンデアミナーゼは、TadA*8及びシチジンデアミナーゼを含む。いくつかの実施形態では、TadA*8は、TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23、またはTadA*8.24である。
例示的な融合タンパク質構造として、以下が挙げられる:
NH2-[アデノシンデアミナーゼ]-[Cas9]-[シチジンデアミナーゼ]-COOH;
NH2-[シチジンデアミナーゼ]-[Cas9]-[アデノシンデアミナーゼ]-COOH;
NH2-[TadA*8]-[Cas9]-[シチジンデアミナーゼ]-COOH;または
NH2-[シチジンデアミナーゼ]-[Cas9]-[TadA*8]-COOH。
いくつかの実施形態では、シチジンデアミナーゼ、脱塩基編集体、ならびにアデノシンデアミナーゼ及びnapDNAbp (例えば、Cas9ドメイン)を含む融合タンパク質は、リンカー配列を含まない。いくつかの実施形態では、リンカーは、シチジンデアミナーゼドメイン及びアデノシンデアミナーゼドメインとnapDNAbpとの間に存在する。いくつかの実施形態では、上記の一般的なアーキテクチャで使用される「-」は、任意選択のリンカーの存在を示す。いくつかの実施形態では、シチジンデアミナーゼ及びアデノシンデアミナーゼならびにnapDNAbpを、本明細書中で提供するリンカーのいずれかを介して融合させる。例えば、いくつかの実施形態では、シチジンデアミナーゼ及びアデノシンデアミナーゼならびにnapDNAbpを、以下の「リンカー」と題された節に示すリンカーのいずれかを介して融合させる。
いくつかの実施形態では、シチジンデアミナーゼ、アデノシンデアミナーゼ及びCas9またはCas12ドメインを有する例示的なCas9またはCas12融合タンパク質の一般的なアーキテクチャは、以下の構造のいずれか1つを含み、NLSは核局在化配列(例えば、本明細書中で提供する任意のNLS)であり、NH2は融合タンパク質のN末端であり、COOHは融合タンパク質のC末端である。
NH2-NLS-[シチジンデアミナーゼ]-[Cas9ドメイン]-[アデノシンデアミナーゼ]-COOH;
NH2-NLS-[アデノシンデアミナーゼ]-[Cas9ドメイン]-[シチジンデアミナーゼ]-COOH;
NH2-NLS-[アデノシンデアミナーゼ]-[シチジンデアミナーゼ]-[Cas9ドメイン]-COOH;
NH2-NLS-[シチジンデアミナーゼ]-[アデノシンデアミナーゼ]-[Cas9ドメイン]-COOH;
NH2-NLS-[Cas9ドメイン]-[アデノシンデアミナーゼ]-[シチジンデアミナーゼ]-COOH;
NH2-NLS-[Cas9ドメイン]-[シチジンデアミナーゼ]-[アデノシンデアミナーゼ]-COOH;
NH2-[シチジンデアミナーゼ]-[Cas9ドメイン]-[アデノシンデアミナーゼ]-NLS-COOH;
NH2-[アデノシンデアミナーゼ]-[Cas9ドメイン]-[シチジンデアミナーゼ]-NL2-COOH;
NH2-[アデノシンデアミナーゼ]-[シチジンデアミナーゼ]-[Cas9ドメイン]-NLS-COOH;
NH2-[シチジンデアミナーゼ]-[アデノシンデアミナーゼ]-[Cas9ドメイン]-NLS-COOH;
NH2-[Cas9ドメイン]-[アデノシンデアミナーゼ]-[シチジンデアミナーゼ]-NLS-COOH;または
NH2-[Cas9ドメイン]-[シチジンデアミナーゼ]-[アデノシンデアミナーゼ]-NLS-COOH。
いくつかの実施形態では、NLSはリンカー内に存在するか、またはNLSは、例えば本明細書に記載のリンカーに隣接している。いくつかの実施形態では、N末端またはC末端NLSは、二連のNLSである。二連のNLSは、比較的短いスペーサー配列によって分離された2つの塩基性アミノ酸クラスターを含む(したがって、二連すなわち2部分であるが、monopartite NLSはそうではない)。ヌクレオプラスミンのNLSであるKR[PAATKKAGQA]KKKKは、ユビキタスな二連のシグナルのプロトタイプであり;塩基性アミノ酸の2つのクラスターが、約10アミノ酸のスペーサーで分離されている。例示的な二連のNLSの配列は以下の通りである:
PKKKRKVEGADKRTADGSEFESPKKKRKV。
いくつかの実施形態では、シチジンデアミナーゼ、アデノシンデアミナーゼ、Cas9ドメイン及びNLSを含む融合タンパク質は、リンカー配列を含まない。いくつかの実施形態では、1つ以上のドメインまたはタンパク質(例えば、シチジンデアミナーゼ、アデノシンデアミナーゼ、Cas9ドメインまたはNLS)間にリンカー配列が存在する。
本開示の融合タンパク質は、1つ以上の追加の特性を含み得ることを理解すべきである。例えば、いくつかの実施形態では、融合タンパク質は、阻害因子、細胞質局在化配列、核外輸送配列などの輸出配列、または他の局在化配列、ならびに融合タンパク質の可溶化、精製、または検出に有用な配列タグを含み得る。本明細書中で提供する適切なタンパク質タグとして、ビオチンカルボキシラーゼキャリアタンパク質(BCCP)タグ、mycタグ、カルモジュリンタグ、FLAGタグ、ヘマグルチニン(HA)タグ、ヒスチジンタグまたはHisタグとも呼ばれるポリヒスチジンタグ、マルトース結合タンパク質(MBP)タグ、nusタグ、グルタチオン-S-トランスフェラーゼ(GST)タグ、緑色蛍光タンパク質(GFP)タグ、チオレドキシンタグ、Sタグ、Softag (例えば、Softag1、Softag3)、strepタグ、ビオチンリガーゼタグ、FlAsHタグ、V5タグ、及びSBPタグが挙げられるが、これらに限定されない。追加の適切な配列は当業者には明らかであろう。いくつかの実施形態では、融合タンパク質は、1つ以上のHisタグを含む。
例示的であるが非限定的な融合タンパク質は、国際PCT出願第PCT/2017/044935及びPCT/US2020/016288に記載されており、これらのそれぞれは、その全体が参照により本明細書に援用される。
核局在化配列(NLS)を含む融合タンパク質
いくつかの実施形態では、本明細書中で提供する融合タンパク質は、1つ以上(例えば、2、3、4、5)の核標的化配列、例えば、核局在化配列(NLS)をさらに含む。一実施形態では、二連のNLSを使用する。いくつかの実施形態では、NLSは、NLSを含むタンパク質の細胞核への(例えば、核輸送による)輸入を容易にするアミノ酸配列を含む。いくつかの実施形態では、本明細書中で提供する融合タンパク質のいずれかは、核局在化配列(NLS)をさらに含む。いくつかの実施形態では、NLSを、融合タンパク質のN末端に融合させる。いくつかの実施形態では、NLSを、融合タンパク質のC末端に融合させる。いくつかの実施形態では、NLSを、Cas9ドメインのN末端に融合させる。いくつかの実施形態では、NLSを、nCas9ドメインまたはdCas9ドメインのC末端に融合させる。いくつかの実施形態では、NLSを、デアミナーゼのN末端に融合させる。いくつかの実施形態では、NLSを、デアミナーゼのC末端に融合させる。いくつかの実施形態では、NLSを、1つ以上のリンカーを介して融合タンパク質に融合させる。いくつかの実施形態では、NLSを、リンカーを用いずに融合タンパク質に融合させる。いくつかの実施形態では、NLSは、本明細書中で提供するか、または参照するNLS配列のいずれか1つのアミノ酸配列を含む。追加の核局在化配列は当技術分野で公知であり、当業者には明らかであろう。例えば、NLS配列はPlank et al., PCT/EP2000/011690に記載されており、その内容は、例示的な核局在化配列を開示するために参照により本明細書に援用される。いくつかの実施形態では、NLSは、アミノ酸配列PKKKRKVEGADKRTADGSEFESPKKKRKV、KRTADGSEFESPKKKRKV、KRPAATKKAGQAKKKK、KKTELQTTNAENKTKKL、KRGINDRNFWRGENGRKTR、RKSGKIAAIVVKRPRKPKKKRKV、またはMDSLLMNRRKFLYQFKNVRWAKGRRETYLCを含む。
いくつかの実施形態では、NLSはリンカー内に存在するか、またはNLSは、リンカー、例えば本明細書に記載のリンカーに隣接している。いくつかの実施形態では、N末端またはC末端NLSは、二連のNLSである。二連のNLSは、比較的短いスペーサー配列によって分離された2つの塩基性アミノ酸クラスターを含む(したがって、二連-2部であるが、monopartite NLSはそうではない)。ヌクレオプラスミンのNLSであるKR[PAATKKAGQA]KKKKは、ユビキタスな二連のシグナルのプロトタイプであり;塩基性アミノ酸の2つのクラスターが、約10アミノ酸のスペーサーで分離されている。例示的な二連のNLSの配列は以下の通りである:
PKKKRKVEGADKRTADGSEFESPKKKRKV
いくつかの実施形態では、融合タンパク質は、リンカー配列を含まない。いくつかの実施形態では、1つ以上のドメインまたはタンパク質間にリンカー配列が存在する。いくつかの実施形態では、アデノシンデアミナーゼまたはシチジンデアミナーゼ及びCas9ドメインを有する例示的なCas9融合タンパク質の一般的なアーキテクチャは、以下の構造のいずれか1つを含み、NLSは核局在化配列(例えば、本明細書中で提供する任意のNLS)であり、NH2は融合タンパク質のN末端であり、COOHは融合タンパク質のC末端である:
NH2-NLS-[アデノシンデアミナーゼ]-[Cas9ドメイン]-COOH;
NH2-NLS-[Cas9ドメイン]-[アデノシンデアミナーゼ]-COOH;
NH2-[アデノシンデアミナーゼ]-[Cas9ドメイン]-NLS-COOH;
NH2-[Cas9ドメイン]-[アデノシンデアミナーゼ]-NLS-COOH;
NH2-NLS-[シチジンデアミナーゼ]-[Cas9ドメイン]-COOH;
NH2-NLS[Cas9ドメイン]-[シチジンデアミナーゼ]-COOH;
NH2-[シチジンデアミナーゼ]-[Cas9ドメイン]-NLS-COOH;または
NH2-[Cas9ドメイン]-[シチジンデアミナーゼ]-NLS-COOH。
本開示の融合タンパク質は、1つ以上の追加の特性を含み得ることを理解すべきである。例えば、いくつかの実施形態では、融合タンパク質は、阻害因子、細胞質局在化配列、核外輸送配列などの輸出配列、または他の局在化配列、ならびに融合タンパク質の可溶化、精製、または検出に有用な配列タグを含み得る。本明細書中で提供する適切なタンパク質タグとして、ビオチンカルボキシラーゼキャリアタンパク質(BCCP)タグ、mycタグ、カルモジュリンタグ、FLAGタグ、ヘマグルチニン(HA)タグ、ヒスチジンタグまたはHisタグとも呼ばれるポリヒスチジンタグ、マルトース結合タンパク質(MBP)タグ、nusタグ、グルタチオン-S-トランスフェラーゼ(GST)タグ、緑色蛍光タンパク質(GFP)タグ、チオレドキシンタグ、Sタグ、Softag (例えば、Softag1、Softag3)、strepタグ、ビオチンリガーゼタグ、FlAsHタグ、V5タグ、及びSBPタグが挙げられるが、これらに限定されない。追加の適切な配列は当業者には明らかであろう。いくつかの実施形態では、融合タンパク質は、1つ以上のHisタグを含む。
1つ以上の核局在化配列(NLS)を含むCRISPR酵素をコードするベクターを使用することができる。例えば、1、2、3、4、5、6、7、8、9、10個または約1、2、3、4、5、6、7、8、9、10個のNLSを使用することができる。CRISPR酵素は、アミノ末端またはその近位にNLSを、カルボキシ末端またはその近位に約1、2、3、4、5、6、7、8、9、10個またはそれを上回るNLSを、またはこれらの任意の組み合わせで(例えば、アミノ末端に1つ以上のNLS及びカルボキシ末端に1つ以上のNLSを)含み得る。複数のNLSが存在する場合、それぞれを他のNLSとは独立して選択できるため、単一のNLSが複数のコピーで、及び/または1つ以上のコピーに存在する1つ以上の他のNLSと組み合わせて存在し得る。
この方法で使用するCRISPR酵素は、約6個のNLSを含むことができる。NLSに最も近位のアミノ酸がN末端またはC末端からポリペプチド鎖に沿って約50アミノ酸以内、例えば、1、2、3、4、5、10、15、20、25、30、40、または50アミノ酸以内にある場合、NLSは、N末端またはC末端の近位にあると見なされる。
内部挿入を伴う融合タンパク質
本明細書において、核酸プログラム可能な核酸結合タンパク質、例えば、napDNAbpに融合させた異種ポリペプチドを含む融合タンパク質を提供する。異種ポリペプチドは、天然型すなわち野生型のnapDNAbpポリペプチド配列には見出されないポリペプチドであり得る。異種ポリペプチドは、napDNAbpのC末端、napDNAbpのN末端でnapDNAbpに融合するか、またはnapDNAbpの内部位置に挿入することができる。いくつかの実施形態では、異種ポリペプチドを、napDNAbpの内部位置に挿入する。
いくつかの実施形態では、異種ポリペプチドは、デアミナーゼまたはその機能的断片である。例えば、融合タンパク質は、Cas9またはCas12 (例えば、Cas12b/C2c1)ポリペプチドのN末端断片及びC末端断片に隣接するデアミナーゼを含み得る。融合タンパク質内のデアミナーゼは、アデノシンデアミナーゼであり得る。いくつかの実施形態では、アデノシンデアミナーゼは、TadA (例えば、TadA7.10またはTadA*8)である。いくつかの実施形態では、TadAは、TadA*8である。本明細書に記載のTadA配列(例えば、TadA7.10またはTadA*8)は、上記の融合タンパク質に適したデアミナーゼである。
デアミナーゼは、環状置換デアミナーゼであり得る。例えば、デアミナーゼは、環状置換アデノシンデアミナーゼであり得る。いくつかの実施形態では、デアミナーゼは、TadA参照配列において付番されたアミノ酸残基116で環状に置換された環状置換TadAである。いくつかの実施形態では、デアミナーゼは、TadA参照配列において付番されたアミノ酸残基136で環状に置換された環状置換TadAである。いくつかの実施形態では、デアミナーゼは、TadA参照配列において付番されたアミノ酸残基65で環状に置換された環状置換TadAである。
融合タンパク質は、複数のデアミナーゼを含み得る。融合タンパク質は、例えば、1、2、3、4、5またはそれ以上のデアミナーゼを含み得る。いくつかの実施形態では、融合タンパク質は、1つのデアミナーゼを含む。いくつかの実施形態では、融合タンパク質は、2つのデアミナーゼを含む。融合タンパク質の2つ以上のデアミナーゼは、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはそれらの組み合わせであり得る。2つ以上のデアミナーゼは、ホモ二量体であり得る。2つ以上のデアミナーゼは、ヘテロ二量体であり得る。2つ以上のデアミナーゼは、napDNAbpにタンデムに挿入することができる。いくつかの実施形態では、2つ以上のデアミナーゼは、napDNAbpにタンデムに存在していなくてもよい。
いくつかの実施形態では、融合タンパク質内のnapDNAbpは、Cas9ポリペプチドまたはその断片である。Cas9ポリペプチドは、バリアントCas9ポリペプチドであり得る。いくつかの実施形態では、Cas9ポリペプチドは、Cas9ニッカーゼ(nCas9)ポリペプチドまたはその断片である。いくつかの実施形態では、Cas9ポリペプチドは、ヌクレアーゼ不活性Cas9 (dCas9)ポリペプチドまたはその断片である。融合タンパク質内のCas9ポリペプチドは、全長のCas9ポリペプチドであり得る。いくつかの場合では、融合タンパク質内のCas9ポリペプチドは、全長のCas9ポリペプチドでなくてもよい。Cas9ポリペプチドは、例えば、天然のCas9タンパク質と比較して、N末端またはC末端で短縮され得る。Cas9ポリペプチドは、環状置換Cas9タンパク質であり得る。Cas9ポリペプチドは、Cas9ポリペプチドの断片、一部、またはドメインであり得るが、それは依然として標的ポリヌクレオチド及びガイド核酸配列に結合することができる。
いくつかの実施形態では、Cas9ポリペプチドは、Streptococcus pyogenes Cas9 (SpCas9)、Staphylococcus aureus Cas9 (SaCas9)、Streptococcus thermophilus 1 Cas9 (St1Cas9)、またはその断片もしくはバリアントである。
融合タンパク質のCas9ポリペプチドは、天然のCas9ポリペプチドと、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含み得る。
融合タンパク質のCas9ポリペプチドは、以下に記載するCas9アミノ酸配列(以下で「Cas9参照配列」と呼ばれる)と、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含み得る。
Figure 2022532139000029
Cas9ポリペプチドのN末端及びC末端断片に隣接する異種触媒ドメインを含む融合タンパク質もまた、本明細書に記載の方法における塩基編集に有用である。Cas9及び1つ以上のデアミナーゼドメイン、例えば、アデノシンデアミナーゼを含むか、またはCas9配列に隣接するアデノシンデアミナーゼドメインを含む融合タンパク質もまた、標的配列の高度に特異的かつ効率的な塩基編集に有用である。一実施形態では、キメラCas9融合タンパク質は、Cas9ポリペプチド内に挿入された異種触媒ドメイン(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を含む。いくつかの実施形態では、融合タンパク質は、Cas9内に挿入されたアデノシンデアミナーゼドメイン及びシチジンデアミナーゼドメインを含む。いくつかの実施形態では、アデノシンデアミナーゼを、Cas9内で融合させ、シチジンデアミナーゼを、C末端に融合させる。いくつかの実施形態では、アデノシンデアミナーゼを、Cas9内で融合させ、シチジンデアミナーゼを、N末端に融合させる。いくつかの実施形態では、シチジンデアミナーゼを、Cas9内で融合させ、アデノシンデアミナーゼを、C末端に融合させる。いくつかの実施形態では、シチジンデアミナーゼを、Cas9内で融合させ、アデノシンデアミナーゼを、N末端に融合させる。
アデノシンデアミナーゼ及びシチジンデアミナーゼ及びCas9の融合タンパク質の例示的な構造を以下に示す:
NH2-[Cas9(アデノシンデアミナーゼ)]-[シチジンデアミナーゼ]-COOH;
NH2-[シチジンデアミナーゼ]-[Cas9(アデノシンデアミナーゼ)]-COOH;
NH2-[Cas9(シチジンデアミナーゼ)]-[アデノシンデアミナーゼ]-COOH;または
NH2-[アデノシンデアミナーゼ]-[Cas9(シチジンデアミナーゼ)]-COOH。
いくつかの実施形態では、上記の一般的なアーキテクチャで使用される「-」は、任意選択のリンカーの存在を示す。
様々な実施形態において、触媒ドメインは、アデノシンデアミナーゼ活性などのDNA改変活性(例えば、デアミナーゼ活性)を有する。いくつかの実施形態では、アデノシンデアミナーゼは、TadA (例えば、TadA7.10)である。いくつかの実施形態では、TadAはTadA*8である。いくつかの実施形態では、TadA*8をCas9内で融合させ、シチジンデアミナーゼをC末端に融合させる。いくつかの実施形態では、TadA*8をCas9内で融合させ、シチジンデアミナーゼをN末端に融合させる。いくつかの実施形態では、シチジンデアミナーゼをCas9内で融合させ、TadA*8をC末端に融合させる。いくつかの実施形態では、シチジンデアミナーゼをCas9内で融合させ、TadA*8をN末端に融合させる。TadA*8及びシチジンデアミナーゼ及びCas9の融合タンパク質の例示的な構造を以下に示す:
NH2-[Cas9(TadA*8)]-[シチジンデアミナーゼ]-COOH;
NH2-[シチジンデアミナーゼ]-[Cas9(TadA*8)]-COOH;
NH2-[Cas9(シチジンデアミナーゼ)]-[TadA*8]-COOH;または
NH2-[TadA*8]-[Cas9(シチジンデアミナーゼ)]-COOH。
いくつかの実施形態では、上記の一般的なアーキテクチャで使用される「-」は、任意選択のリンカーの存在を示す。
異種ポリペプチド(例えば、デアミナーゼ)を、適切な位置で、napDNAbp (例えば、Cas9またはCas12 (例えば、Cas12b/C2c1))に挿入することができ、それにより、napDNAbpは、標的ポリヌクレオチド及びガイド核酸に結合する能力を保持する。デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、デアミナーゼの機能(例えば、塩基編集活性)またはnapDNAbp (例えば、標的核酸及びガイド核酸に結合する能力)を損なうことなく、napDNAbpに挿入することができる。デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)は、例えば、結晶学的研究に示されるように、変性領域または高温因子もしくはB因子を含む領域でnapDNAbpに挿入することができる。あまり秩序化されていない、変性、または不定形のタンパク質の領域、例えば、溶媒に曝された領域及びループを、構造または機能を損なうことなく挿入に使用することができる。デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)は、柔軟なループ領域または溶媒に曝された領域のnapDNAbpに挿入することができる。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、Cas9またはCas12b/C2c1ポリペプチドの柔軟なループに挿入する。
いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)の挿入位置を、Cas9ポリペプチドの結晶構造のB因子分析によって決定する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、平均よりも高いB因子(例えば、全タンパク質または変性領域を含むタンパク質ドメインと比較して、より高いB因子)を有するCas9ポリペプチドの領域に挿入する。B因子または温度因子は、原子のそれらの平均位置からの変動を示すことができる(例えば、温度依存性の原子振動または結晶格子の静的無秩序性の結果として)。バックボーン原子の高いB因子(例えば、平均よりも高いB因子)は、比較的高い局所移動度を有する領域を示し得る。そのような領域は、構造や機能を損なうことなくデアミナーゼを挿入するために使用することができる。デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、全タンパク質について、平均B因子よりも、50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、または200%超高いB因子を有するCΑ原子を有する残基を有する位置に、挿入することができる。デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、残基を含むCas9タンパク質ドメインについて、平均B因子よりも、50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、または200%超高いB因子を有するCΑ原子を有する残基を有する位置に、挿入することができる。平均よりも高いB因子を有するCas9ポリペプチドの位置として、例えば、上記のCas9参照配列における付番で、残基768、792、1052、1015、1022、1026、1029、1067、1040、1054、1068、1246、1247、及び1248が挙げられ得る。平均よりも高いB因子を有するCas9ポリペプチド領域として、例えば、上記のCas9参照配列における付番で、残基792~872、792~906、及び2~791が挙げられ得る。
異種ポリペプチド(例えば、デアミナーゼ)は、上記のCas9参照配列における付番で:768、791、792、1015、1016、1022、1023、1026、1029、1040、1052、1054、1067、1068、1069、1246、1247、及び1248からなる群から選択されるアミノ酸残基、または別のCas9ポリペプチドの対応するアミノ酸残基において、napDNAbpに挿入することができる。いくつかの実施形態では、異種ポリペプチドを、上記のCas9参照配列における付番で、アミノ酸位置768~769、791~792、792~793、1015~1016、1022~1023、1026~1027、1029~1030、1040~1041、1052~1053、1054~1055、1067~1068、1068~1069、1247~1248、もしくは1248~1249、またはその対応するアミノ酸位置の間に挿入する。いくつかの実施形態では、異種ポリペプチドを、上記のCas9参照配列における付番で、アミノ酸位置769~770、792~793、793~794、1016~1017、1023~1024、1027~1028、1030~1031、1041~1042、1053~1054、1055~1056、1068~1069、1069~1070、1248~1249、もしくは1249~1250、またはその対応するアミノ酸位置の間に挿入する。いくつかの実施形態では、異種ポリペプチドで、上記のCas9参照配列における付番で:768、791、792、1015、1016、1022、1023、1026、1029、1040、1052、1054、1067、1068、1069、1246、1247、及び1248からなる群から選択されるアミノ酸残基、または別のCas9ポリペプチドの対応するアミノ酸残基を置換する。挿入位置に関する上記のCas9参照配列への参照は、例示を目的としていることを理解すべきである。本明細書中で論じる挿入は、上記のCas9参照配列のCas9ポリペプチド配列に限定されないが、バリアントCas9ポリペプチド、例えば、Cas9ニッカーゼ(nCas9)、ヌクレアーゼ不活性Cas9 (dCas9)、ヌクレアーゼドメイン欠損型Cas9バリアント、短縮型Cas9、または部分的または完全にHNHドメインを欠損したCas9ドメインの対応する位置での挿入を含む。
異種ポリペプチド(例えば、デアミナーゼ)は、上記のCas9参照配列における付番で:768、792、1022、1026、1040、1068、及び1247からなる群から選択されるアミノ酸残基、または別のCas9ポリペプチドの対応するアミノ酸残基において、napDNAbpに挿入することができる。いくつかの実施形態では、異種ポリペプチドを、上記のCas9参照配列における付番で、アミノ酸位置768~769、792~793、1022~1023、1026~1027、1029~1030、1040~1041、1068~1069、もしくは1247~1248、またはその対応するアミノ酸位置の間に挿入する。いくつかの実施形態では、異種ポリペプチドを、上記のCas9参照配列における付番で、アミノ酸位置769~770、793~794、1023~1024、1027~1028、1030~1031、1041~1042、1069~1070、もしくは1248~1249、またはその対応するアミノ酸位置の間に挿入する。いくつかの実施形態では、異種ポリペプチドで、上記のCas9参照配列における付番で:768、792、1022、1026、1040、1068、及び1247からなる群から選択されるアミノ酸残基、または別のCas9ポリペプチドの対応するアミノ酸残基を置換する。
異種ポリペプチド(例えば、デアミナーゼ)は、本明細書に記載のアミノ酸残基、または別のCas9ポリペプチドの対応するアミノ酸残基において、napDNAbpに挿入することができる。一実施形態では、異種ポリペプチド(例えば、デアミナーゼ)は、上記のCas9参照配列における付番で:1002、1003、1025、1052~1056、1242~1247、1061~1077、943~947、686~691、569~578、530~539、及び1060~1077からなる群から選択されるアミノ酸残基、または別のCas9ポリペプチドの対応するアミノ酸残基において、napDNAbpに挿入することができる。デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、残基のN末端もしくはC末端に挿入するか、または残基を置き換えることができる。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、残基のC末端に挿入する。
いくつかの実施形態では、アデノシンデアミナーゼ(例えば、TadA)を、上記のCas9参照配列における付番で:1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052、及び1246からなる群から選択されるアミノ酸残基、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入する。いくつかの実施形態では、アデノシンデアミナーゼ(例えば、TadA)を、上記のCas9参照配列における付番で、残基792~872、792~906、もしくは2~791、または別のCas9ポリペプチドの対応するアミノ酸残基の代わりに挿入する。いくつかの実施形態では、アデノシンデアミナーゼを、上記のCas9参照配列における付番で:1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052、及び1246からなる群から選択されるアミノ酸、または別のCas9ポリペプチドの対応するアミノ酸残基のN末端に挿入する。いくつかの実施形態では、アデノシンデアミナーゼを、上記のCas9参照配列における付番で:1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052、及び1246からなる群から選択されるアミノ酸、または別のCas9ポリペプチドの対応するアミノ酸残基のC末端に挿入する。いくつかの実施形態では、アデノシンデアミナーゼを、上記のCas9参照配列における付番で:1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052、及び1246からなる群から選択されるアミノ酸、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入して置換する。
いくつかの実施形態では、CBE (例えば、APOBEC1)を、上記のCas9参照配列における付番で:1016、1023、1029、1040、1069、及び1247からなる群から選択されるアミノ酸残基、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入する。いくつかの実施形態では、ABEを、上記のCas9参照配列における付番で:1016、1023、1029、1040、1069、及び1247からなる群から選択されるアミノ酸、または別のCas9ポリペプチドの対応するアミノ酸残基のN末端に挿入する。いくつかの実施形態では、ABEを、上記のCas9参照配列における付番で:1016、1023、1029、1040、1069、及び1247からなる群から選択されるアミノ酸、または別のCas9ポリペプチドの対応するアミノ酸残基のC末端に挿入する。いくつかの実施形態では、ABEを、上記のCas9参照配列における付番で:1016、1023、1029、1040、1069、及び1247からなる群から選択されるアミノ酸、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入して置換する。
いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基768、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基768、または別のCas9ポリペプチドの対応するアミノ酸残基のN末端に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基768、または別のCas9ポリペプチドの対応するアミノ酸残基のC末端に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基768、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入して置換する。
いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基791に挿入するか、もしくはアミノ酸残基792に挿入するか、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基791のN末端に挿入するか、もしくはアミノ酸792のN末端に挿入するか、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸791のC末端に挿入するか、もしくはアミノ酸792のN末端に挿入するか、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸791に挿入して置換するか、もしくはアミノ酸792に挿入して置換するか、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入して置換する。
いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1016、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1016、または別のCas9ポリペプチドの対応するアミノ酸残基のN末端に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1016、または別のCas9ポリペプチドの対応するアミノ酸残基のC末端に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1016、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入して置換する。
いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1022に挿入するか、もしくはアミノ酸残基1023に挿入するか、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1022のN末端に挿入するか、もしくはアミノ酸残基1023のN末端に挿入するか、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1022のC末端に挿入するか、もしくはアミノ酸残基1023のC末端に挿入するか、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1022に挿入して置換するか、もしくはアミノ酸残基1023に挿入して置換するか、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入して置換する。
いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1026に挿入するか、もしくはアミノ酸残基1029に挿入するか、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1026のN末端に挿入するか、もしくはアミノ酸残基1029のN末端に挿入するか、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1026のC末端に挿入するか、もしくはアミノ酸残基1029のC末端に挿入するか、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1026に挿入して置換するか、もしくはアミノ酸残基1029に挿入して置換するか、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入して置換する。
いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1040、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1040、または別のCas9ポリペプチドの対応するアミノ酸残基のN末端に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1040、または別のCas9ポリペプチドの対応するアミノ酸残基のC末端に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1040、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入して置換する。
いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1052に挿入するか、もしくはアミノ酸残基1054に挿入するか、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1052のN末端に挿入するか、もしくはアミノ酸残基1054のN末端に挿入するか、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1052のC末端に挿入するか、もしくはアミノ酸残基1054のC末端に挿入するか、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1052に挿入して置換するか、もしくはアミノ酸残基1054に挿入して置換するか、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入して置換する。
いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1067に挿入するか、もしくはアミノ酸残基1068に挿入するか、もしくはアミノ酸残基1069に挿入するか、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1067のN末端に挿入するか、もしくはアミノ酸残基1068のN末端に挿入するか、もしくはアミノ酸残基1069のN末端に挿入するか、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1067のC末端に挿入するか、もしくはアミノ酸残基1068のC末端に挿入するか、もしくはアミノ酸残基1069のC末端に挿入するか、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1067に挿入して置換するか、もしくはアミノ酸残基1068に挿入して置換するか、もしくはアミノ酸残基1069に挿入して置換するか、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入して置換する。
いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1246に挿入するか、もしくはアミノ酸残基1247に挿入するか、もしくはアミノ酸残基1248に挿入するか、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1246のN末端に挿入するか、もしくはアミノ酸残基1247のN末端に挿入するか、もしくはアミノ酸残基1248のN末端に挿入するか、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1246のC末端に挿入するか、もしくはアミノ酸残基1247のC末端に挿入するか、もしくはアミノ酸残基1248のC末端に挿入するか、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1246に挿入して置換するか、もしくはアミノ酸残基1247に挿入して置換するか、もしくはアミノ酸残基1248に挿入して置換するか、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入して置換する。
いくつかの実施形態では、異種ポリペプチド(例えば、デアミナーゼ)を、Cas9ポリペプチドの柔軟なループに挿入する。柔軟なループ部分は、上記のCas9参照配列における付番で、530~537、569~570、686~691、943~947、1002~1025、1052~1077、1232~1247、もしくは1298~1300、または別のCas9ポリペプチドの対応するアミノ酸残基からなる群から選択することができる。柔軟なループ部分は、上記のCas9参照配列における付番で、1~529、538~568、580~685、692~942、948~1001、1026~1051、1078~1231、もしくは1248~1297、または別のCas9ポリペプチドの対応するアミノ酸残基からなる群から選択することができる。
異種ポリペプチド(例えば、アデニンデアミナーゼ)は、上記のCas9参照配列における付番で、アミノ酸残基:1017~1069、1242~1247、1052~1056、1060~1077、1002~1003、943~947、530~537、568~579、686~691、1242~1247、1298~1300、1066~1077、1052~1056、もしくは1060~1077、または別のCas9ポリペプチドの対応するアミノ酸残基に対応するCas9ポリペプチド領域に挿入することができる。
異種ポリペプチド(例えば、アデニンデアミナーゼ)は、Cas9ポリペプチドの欠失領域の代わりに挿入することができる。欠失領域は、Cas9ポリペプチドのN末端またはC末端部分に対応し得る。いくつかの実施形態では、欠失領域は、上記のCas9参照配列における付番で、残基792~872、または別のCas9ポリペプチドの対応するアミノ酸残基に対応する。いくつかの実施形態では、欠失領域は、上記のCas9参照配列における付番で、残基792~906、または別のCas9ポリペプチドの対応するアミノ酸残基に対応する。いくつかの実施形態では、欠失領域は、上記のCas9参照配列における付番で、残基2~791、または別のCas9ポリペプチドの対応するアミノ酸残基に対応する。いくつかの実施形態では、欠失領域は、上記のCas9参照配列における付番で、残基1017~1069、またはその対応するアミノ酸残基に対応する。
例示的な内部融合塩基編集体を、以下の表5Aに示す:
Figure 2022532139000030
異種ポリペプチド(例えば、デアミナーゼ)は、Cas9ポリペプチドの構造的または機能的ドメイン内に挿入することができる。異種ポリペプチド(例えば、デアミナーゼ)は、Cas9ポリペプチドの2つの構造的または機能的ドメインの間に挿入することができる。異種ポリペプチド(例えば、デアミナーゼ)は、例えば、Cas9ポリペプチドからドメインを欠失させた後、Cas9ポリペプチドの構造的または機能的ドメインの代わりに挿入することができる。Cas9ポリペプチドの構造的または機能的ドメインは、例えば、RuvC I、RuvC II、RuvC III、Rec1、Rec2、PI、またはHNHを含み得る。
いくつかの実施形態では、Cas9ポリペプチドは、RuvC I、RuvC II、RuvC III、Rec1、Rec2、PI、またはHNHドメインからなる群から選択される1つ以上のドメインを欠失している。いくつかの実施形態では、Cas9ポリペプチドは、ヌクレアーゼドメインを欠失している。いくつかの実施形態では、Cas9ポリペプチドは、HNHドメインを欠失している。いくつかの実施形態では、Cas9ポリペプチドは、HNHドメインの一部を欠失しており、それにより、Cas9ポリペプチドは、HNH活性が低下または無効化している。いくつかの実施形態では、Cas9ポリペプチドは、ヌクレアーゼドメインの欠失を含み、ヌクレアーゼドメインを置換するためにデアミナーゼが挿入されている。いくつかの実施形態では、HNHドメインを欠失させ、その場所にデアミナーゼを挿入する。いくつかの実施形態では、1つ以上のRuvCドメインを欠失させ、その場所にデアミナーゼを挿入する。
異種ポリペプチドを含む融合タンパク質を、napDNAbpのN末端及びC末端断片に隣接させることができる。いくつかの実施形態では、融合タンパク質は、Cas9ポリペプチドのN末端断片及びC末端断片に隣接するデアミナーゼを含む。N末端断片またはC末端断片は、標的ポリヌクレオチド配列に結合することができる。N末端断片のC末端またはC末端断片のN末端は、Cas9ポリペプチドの柔軟なループの一部を含み得る。N末端断片のC末端またはC末端断片のN末端は、Cas9ポリペプチドのαヘリックス構造の一部を含み得る。N末端断片またはC末端断片は、DNA結合ドメインを含み得る。N末端断片またはC末端断片は、RuvCドメインを含み得る。N末端断片またはC末端断片は、HNHドメインを含み得る。いくつかの実施形態では、N末端断片及びC末端断片のいずれも、HNHドメインを含まない。
いくつかの実施形態では、N末端Cas9断片のC末端は、融合タンパク質が標的核酸塩基を脱アミノ化する際に標的核酸塩基に近接しているアミノ酸を含む。いくつかの実施形態では、C末端Cas9断片のN末端は、融合タンパク質が標的核酸塩基を脱アミノ化する際に標的核酸塩基に近接しているアミノ酸を含む。標的核酸塩基と、N末端Cas9断片のC末端またはC末端Cas9断片のN末端のアミノ酸との間の近接性を得るために、異なるデアミナーゼの挿入位置は、異なり得る。例えば、ABEの挿入位置は、上記のCas9参照配列における付番で:1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052、及び1246からなる群から選択されるアミノ酸残基、または別のCas9ポリペプチドの対応するアミノ酸残基であり得る。
融合タンパク質のN末端Cas9断片(すなわち、融合タンパク質のデアミナーゼに隣接するN末端Cas9断片)は、Cas9ポリペプチドのN末端を含み得る。融合タンパク質のN末端Cas9断片は、少なくとも約100、200、300、400、500、600、700、800、900、1000、1100、1200、または1300アミノ酸の長さを含み得る。融合タンパク質のN末端Cas9断片は、上記のCas9参照配列における付番で、アミノ酸残基:1~56、1~95、1~200、1~300、1~400、1~500、1~600、1~700、1~718、1~765、1~780、1~906、1~918、もしくは1~1100、または別のCas9ポリペプチドの対応するアミノ酸残基に対応する配列を含み得る。N末端Cas9断片は、上記のCas9参照配列における付番で、アミノ酸残基:1~56、1~95、1~200、1~300、1~400、1~500、1~600、1~700、1~718、1~765、1~780、1~906、1~918、もしくは1~1100、または別のCas9ポリペプチドの対応するアミノ酸残基に対して、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の配列同一性を有する配列を含み得る。
融合タンパク質のC末端Cas9断片(すなわち、融合タンパク質のデアミナーゼに隣接するC末端Cas9断片)は、Cas9ポリペプチドのC末端を含み得る。融合タンパク質のC末端Cas9断片は、少なくとも約100、200、300、400、500、600、700、800、900、1000、1100、1200、または1300アミノ酸の長さを含み得る。融合タンパク質のC末端Cas9断片は、上記のCas9参照配列における付番で、アミノ酸残基:1099~1368、918~1368、906~1368、780~1368、765~1368、718~1368、94~1368、もしくは56~1368、または別のCas9ポリペプチドの対応するアミノ酸残基に対応する配列を含み得る。N末端Cas9断片は、上記のCas9参照配列における付番で、アミノ酸残基:1099~1368、918~1368、906~1368、780~1368、765~1368、718~1368、94~1368、もしくは56~1368、または別のCas9ポリペプチドの対応するアミノ酸残基に対して、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の配列同一性を有する配列を含み得る。
融合タンパク質のN末端Cas9断片及びC末端Cas9断片は一緒に、例えば、上記のCas9参照配列に記載されているように、全長の天然Cas9ポリペプチド配列に対応しない場合がある。
本明細書に記載の融合タンパク質は、ゲノム全体の目的外(spurious)脱アミノ化の減少などの、非標的部位(例えば、オフターゲット部位)での脱アミノ化の減少を伴う標的化脱アミノ化をもたらすことができる。本明細書に記載の融合タンパク質は、非標的部位でのバイスタンダー脱アミノ化を低減して、標的化脱アミノ化をもたらすことができる。望ましくない脱アミノ化またはオフターゲット脱アミノ化を、例えば、Cas9ポリペプチドのN末端またはC末端に融合したデアミナーゼを含む末端融合タンパク質に比べて、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%、または少なくとも99%減少させることができる。望ましくない脱アミノ化またはオフターゲット脱アミノ化を、例えば、Cas9ポリペプチドのN末端またはC末端に融合したデアミナーゼを含む末端融合タンパク質に比べて、少なくとも1倍、少なくとも2倍、少なくとも3倍、少なくとも4倍、少なくとも5倍、少なくとも10倍、少なくとも15倍、少なくとも20倍、少なくとも30倍、少なくとも40倍、少なくとも50倍、少なくとも60倍、少なくとも70倍、少なくとも80倍、少なくとも90倍、または少なくとも100倍減少させることができる。
いくつかの実施形態では、融合タンパク質のデアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)は、Rループの範囲内で2つ以下の核酸塩基を脱アミノ化する。いくつかの実施形態では、融合タンパク質のデアミナーゼは、Rループの範囲内で3つ以下の核酸塩基を脱アミノ化する。いくつかの実施形態では、融合タンパク質のデアミナーゼは、Rループの範囲内で2、3、4、5、6、7、8、9、または10個以下の核酸塩基を脱アミノ化する。Rループは、DNA:RNAハイブリッド、DNA:DNA、またはRNA:RNA相補構造を含み、一本鎖DNAと会合する三本鎖核酸構造である。本明細書中で使用する場合、Rループは、標的ポリヌクレオチドをCRISPR複合体または塩基編集複合体と接触させる場合に形成され得、その場合、ガイドポリヌクレオチドの一部、例えば、ガイドRNAは、標的ポリヌクレオチド、例えば、標的DNAの一部とハイブリダイズし、置き換わる。いくつかの実施形態では、Rループは、スペーサー配列及び標的DNA相補配列のハイブリダイズした領域を含む。Rループ領域は、約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、または50核酸塩基対の長さであり得る。いくつかの実施形態では、Rループ領域は、長さが約20核酸塩基対である。本明細書中で使用する場合、Rループ領域は、ガイドポリヌクレオチドとハイブリダイズする標的DNA鎖に限定されないことを理解すべきである。例えば、Rループ領域内の標的核酸塩基の編集は、ガイドRNAに対する相補鎖を含むDNA鎖に対する編集であり得るか、またはガイドRNAに相補的な鎖の反対側の鎖であるDNA鎖に対する編集であり得る。いくつかの実施形態では、Rループの領域での編集は、標的DNA配列中のガイドRNAに対する非相補鎖(プロトスペーサー鎖)上の核酸塩基を編集することを含む。
本明細書に記載の融合タンパク質は、標準的な塩基編集とは異なる編集ウィンドウで標的の脱アミノ化をもたらすことができる。いくつかの実施形態では、標的核酸塩基は、標的ポリヌクレオチド配列中のPAM配列の約1~約20塩基上流である。いくつかの実施形態では、標的核酸塩基は、標的ポリヌクレオチド配列中のPAM配列の約2~約12塩基上流である。いくつかの実施形態では、標的核酸塩基は、PAM配列から、約1~9塩基対、約2~10塩基対、約3~11塩基対、約4~12塩基対、約5~13塩基対、約6~14塩基対、約7~15塩基対、約8~16塩基対、約9~17塩基対、約10~18塩基対、約11~19塩基対、約12~20塩基対、約1~7塩基対、約2~8塩基対、約3~9塩基対、約4~10塩基対、約5~11塩基対、約6~12塩基対、約7~13塩基対、約8~14塩基対、約9~15塩基対、約10~16塩基対、約11~17塩基対、約12~18塩基対、約13~19塩基対、約14~20塩基対、約1~5塩基対、約2~6塩基対、約3~7塩基対、約4~8塩基対、約5~9塩基対、約6~10塩基対、約7~11塩基対、約8~12塩基対、約9~13塩基対、約10~14塩基対、約11~15塩基対、約12~16塩基対、約13~17塩基対、約14~18塩基対、約15~19塩基対、約16~20塩基対、約1~3塩基対、約2~4塩基対、約3~5塩基対、約4~6塩基対、約5~7塩基対、約6~8塩基対、約7~9塩基対、約8~10塩基対、約9~11塩基対、約10~12塩基対、約11~13塩基対、約12~14塩基対、約13~15塩基対、約14~16塩基対、約15~17塩基対、約16~18塩基対、約17~19塩基対、約18~20塩基対、離れているか、または上流である。いくつかの実施形態では、標的核酸塩基は、PAM配列から、約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20塩基対、またはそれ以上離れているか、または上流にある。いくつかの実施形態では、標的核酸塩基は、PAM配列から、約1、2、3、4、5、6、7、8、または9塩基対、上流にある。いくつかの実施形態では、標的核酸塩基は、PAM配列から、約2、3、4、または6塩基対、上流にある。
融合タンパク質は、複数の異種ポリペプチドを含み得る。例えば、融合タンパク質は、1つ以上のUGIドメイン及び/または1つ以上の核局在化シグナルをさらに含み得る。2つ以上の異種ドメインをタンデムに挿入することができる。2つ以上の異種ドメインは、NapDNAbp内でタンデムにならないような位置に挿入することができる。
融合タンパク質は、デアミナーゼとnapDNAbpポリペプチドとの間にリンカーを含み得る。リンカーは、ペプチドリンカーまたは非ペプチドリンカーであり得る。例えば、リンカーは、XTEN、(GGGS)n、(GGGGS)n、(G)n、(EAAAK)n、(GGS)n、SGSETPGTSESATPESであり得る。いくつかの実施形態では、融合タンパク質は、N末端Cas9断片とデアミナーゼとの間にリンカーを含む。いくつかの実施形態では、融合タンパク質は、C末端Cas9断片とデアミナーゼとの間にリンカーを含む。いくつかの実施形態では、napDNAbpのN末端及びC末端断片を、リンカーでデアミナーゼに接続する。いくつかの実施形態では、N末端及びC末端断片を、リンカーを用いずにデアミナーゼに結合する。いくつかの実施形態では、融合タンパク質は、N末端Cas9断片とデアミナーゼとの間にリンカーを含むが、C末端Cas9断片とデアミナーゼとの間にリンカーを含まない。いくつかの実施形態では、融合タンパク質は、C末端Cas9断片とデアミナーゼとの間にリンカーを含むが、N末端Cas9断片とデアミナーゼとの間にリンカーを含まない。
いくつかの実施形態では、融合タンパク質内のnapDNAbpは、Cas12ポリペプチド、例えば、Cas12b/C2c1またはその断片である。Cas12ポリペプチドは、バリアントCas12ポリペプチドであり得る。他の実施形態では、Cas12ポリペプチドのN末端またはC末端断片は、核酸プログラム可能なDNA結合ドメインまたはRuvCドメインを含む。他の実施形態では、融合タンパク質は、Cas12ポリペプチドと触媒ドメインとの間にリンカーを含む。他の実施形態では、リンカーのアミノ酸配列は、GGSGGSまたはGSSGSETPGTSESATPESSGである。他の実施形態では、リンカーは、強固なリンカーである。上記の態様の他の実施形態では、リンカーは、GGAGGCTCTGGAGGAAGCまたはGGCTCTTCTGGATCTGAAACACCTGGCACAAGCGAGAGCGCCACCCCTGAGAGCTCTGGCによってコードされる。
Cas12ポリペプチドのN末端及びC末端断片に隣接する異種触媒ドメインを含む融合タンパク質もまた、本明細書に記載の方法における塩基編集に有用である。Cas12と1つ以上のデアミナーゼドメイン、例えば、アデノシンデアミナーゼを含むか、またはCas12配列に隣接するアデノシンデアミナーゼドメインを含む融合タンパク質もまた、標的配列の高度に特異的かつ効率的な塩基編集に有用である。一実施形態では、キメラCas12融合タンパク質は、Cas12ポリペプチド内に挿入された異種触媒ドメイン(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を含む。いくつかの実施形態では、融合タンパク質は、Cas12内に挿入されたアデノシンデアミナーゼドメイン及びシチジンデアミナーゼドメインを含む。いくつかの実施形態では、アデノシンデアミナーゼを、Cas12内で融合させ、シチジンデアミナーゼを、C末端に融合させる。いくつかの実施形態では、アデノシンデアミナーゼを、Cas12内で融合させ、シチジンデアミナーゼを、N末端に融合させる。いくつかの実施形態では、シチジンデアミナーゼを、Cas12内で融合させ、アデノシンデアミナーゼを、C末端に融合させる。いくつかの実施形態では、シチジンデアミナーゼを、Cas12内で融合させ、アデノシンデアミナーゼを、N末端に融合させる。アデノシンデアミナーゼ及びシチジンデアミナーゼ及びCas12の融合タンパク質の例示的な構造を以下に示す:
NH2-[Cas12(アデノシンデアミナーゼ)]-[シチジンデアミナーゼ]-COOH;
NH2-[シチジンデアミナーゼ]-[Cas12(アデノシンデアミナーゼ)]-COOH;
NH2-[Cas12(シチジンデアミナーゼ)]-[アデノシンデアミナーゼ]-COOH;または
NH2-[アデノシンデアミナーゼ]-[Cas12(シチジンデアミナーゼ)]-COOH;
いくつかの実施形態では、上記の一般的なアーキテクチャで使用される「-」は、任意選択のリンカーの存在を示す。
様々な実施形態において、触媒ドメインは、アデノシンデアミナーゼ活性などのDNA改変活性(例えば、デアミナーゼ活性)を有する。いくつかの実施形態では、アデノシンデアミナーゼは、TadA (例えば、TadA7.10)である。いくつかの実施形態では、TadAはTadA*8である。いくつかの実施形態では、TadA*8をCas12内で融合させ、シチジンデアミナーゼをC末端に融合させる。いくつかの実施形態では、TadA*8をCas12内で融合させ、シチジンデアミナーゼをN末端に融合させる。いくつかの実施形態では、シチジンデアミナーゼをCas12内で融合させ、TadA*8をC末端に融合させる。いくつかの実施形態では、シチジンデアミナーゼをCas12内で融合させ、TadA*8をN末端に融合させる。TadA*8及びシチジンデアミナーゼ及びCas12の融合タンパク質の例示的な構造を以下に示す:
N-[Cas12(TadA*8)]-[シチジンデアミナーゼ]-C;
N-[シチジンデアミナーゼ]-[Cas12(TadA*8)]-C;
N-[Cas12(シチジンデアミナーゼ)]-[TadA*8]-C;または
N-[TadA*8]-[Cas12(シチジンデアミナーゼ)]-C。
いくつかの実施形態では、上記の一般的なアーキテクチャで使用される「-」は、任意選択のリンカーの存在を示す。
他の実施形態では、融合タンパク質は、1つ以上の触媒ドメインを含む。他の実施形態では、1つ以上の触媒ドメインの少なくとも1つを、Cas12ポリペプチド内に挿入するか、またはCas12のN末端またはC末端に融合させる。他の実施形態では、1つ以上の触媒ドメインの少なくとも1つを、Cas12ポリペプチドのループ、αヘリックス領域、不定形部分、または溶媒にアクセス可能な部分内に挿入する。他の実施形態では、Cas12ポリペプチドは、Cas12a、Cas12b、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、またはCas12iである。他の実施形態では、Cas12ポリペプチドは、Bacillus hisashii Cas12b、Bacillus thermoamylovorans Cas12b、Bacillus種V3-13 Cas12b、またはAlicyclobacillus acidiphilus Cas12bに対して、少なくとも約85%のアミノ酸配列同一性を有する。他の実施形態では、Cas12ポリペプチドは、Bacillus hisashii Cas12b、Bacillus thermoamylovorans Cas12b、Bacillus種V3-13 Cas12b、またはAlicyclobacillus acidiphilus Cas12bに対して、少なくとも約90%のアミノ酸配列同一性を有する。他の実施形態では、Cas12ポリペプチドは、Bacillus hisashii Cas12b、Bacillus thermoamylovorans Cas12b、Bacillus種V3-13 Cas12b、またはAlicyclobacillus acidiphilus Cas12bに対して、少なくとも約95%のアミノ酸配列同一性を有する。他の実施形態では、Cas12ポリペプチドは、Bacillus hisashii Cas12b、Bacillus thermoamylovorans Cas12b、Bacillus種V3-13 Cas12b、またはAlicyclobacillus acidiphilus Cas12bの断片を含むか、または本質的にそれらからなる。
他の実施形態では、触媒ドメインを、BhCas12bのアミノ酸位置153~154、255~256、306~307、980~981、1019~1020、534~535、604~605、もしくは344~345またはCas12a、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、もしくはCas12iの対応するアミノ酸残基の間に挿入する。他の実施形態では、触媒ドメインを、BhCas12bのアミノ酸P153とS154の間に挿入する。他の実施形態では、触媒ドメインを、BhCas12bのアミノ酸K255とE256の間に挿入する。他の実施形態では、触媒ドメインを、BhCas12bのアミノ酸D980とG981の間に挿入する。他の実施形態では、触媒ドメインを、BhCas12bのアミノ酸K1019とL1020の間に挿入する。他の実施形態では、触媒ドメインを、BhCas12bのアミノ酸F534とP535の間に挿入する。他の実施形態では、触媒ドメインを、BhCas12bのアミノ酸K604とG605の間に挿入する。他の実施形態では、触媒ドメインを、BhCas12bのアミノ酸H344とF345の間に挿入する。他の実施形態では、触媒ドメインを、BvCas12bのアミノ酸位置147と148、248と249、299と300、991と992、もしくは1031と1032、またはCas12a、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、もしくはCas12iの対応するアミノ酸残基の間に挿入する。他の実施形態では、触媒ドメインを、BvCas12bのアミノ酸P147とD148の間に挿入する。他の実施形態では、触媒ドメインを、BvCas12bのアミノ酸G248とG249の間に挿入する。他の実施形態では、触媒ドメインを、BvCas12bのアミノ酸P299とE300の間に挿入する。他の実施形態では、触媒ドメインを、BvCas12bのアミノ酸G991とE992の間に挿入する。他の実施形態では、触媒ドメインを、BvCas12bのアミノ酸K1031とM1032の間に挿入する。他の実施形態では、触媒ドメインを、AaCas12bのアミノ酸位置157と158、258と259、310と311、1008と1009、または1044と1045、またはCas12a、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、もしくはCas12iの対応するアミノ酸残基の間に挿入する。他の実施形態では、触媒ドメインを、AaCas12bのアミノ酸P157とG158の間に挿入する。他の実施形態では、触媒ドメインを、AaCas12bのアミノ酸V258とG259の間に挿入する。他の実施形態では、触媒ドメインを、AaCas12bのアミノ酸D310とP311の間に挿入する。他の実施形態では、触媒ドメインを、AaCas12bのアミノ酸G1008とE1009の間に挿入する。他の実施形態では、触媒ドメインを、AaCas12bのアミノ酸G1044とK1045の間に挿入する。
他の実施形態では、融合タンパク質は、核局在化シグナル(例えば、二連の核局在化シグナル)を含む。他の実施形態では、核局在化シグナルのアミノ酸配列は、MAPKKKRKVGIHGVPAAである。上記の態様の他の実施形態では、核局在化シグナルは、以下の配列によってコード化される:
ATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCC。他の実施形態では、Cas12bポリペプチドは、RuvCドメインの触媒活性をサイレンシングする変異を含む。他の実施形態では、Cas12bポリペプチドは、D574A、D829A及び/またはD952A変異を含む。他の実施形態では、融合タンパク質は、タグ(例えば、インフルエンザヘマグルチニンタグ)をさらに含む。
いくつかの実施形態では、融合タンパク質は、内部的に融合させた核酸塩基編集ドメイン(例えば、アデノシンデアミナーゼドメインなどのデアミナーゼドメインの全部または一部)を有するnapDNAbpドメイン(例えば、Cas12由来ドメイン)を含む。いくつかの実施形態では、napDNAbpはCas12bである。いくつかの実施形態では、塩基編集体は、以下の表6に示す遺伝子座に挿入された内部的に融合させたTadA*8ドメインを有するBhCas12bドメインを含む。
Figure 2022532139000031
非限定的な例として、アデノシンデアミナーゼ(例えば、ABE8.13)をBhCas12bに挿入して、核酸配列を効果的に編集する融合タンパク質(例えば、ABE8.13-BhCas12b)を生成してもよい。
いくつかの実施形態では、本明細書に記載の塩基編集系は、Cas9にTadAが挿入されたABEを含む。Cas9にTadAが挿入された適切なABEの配列を示す。
101 Cas9 TadAins 1015
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVGSSGSETPGTSESATPESSGSEVEFSHEYWMRHAL
TLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQG
GLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGS
LMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSST
DYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
102 Cas9 TadAins 1022
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIGSSGSETPGTSESATPESSGSEVEFSHE
YWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAE
IMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNA
KTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQ
KKAQSSTDAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
103 Cas9 TadAins 1029
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGSSGSETPGTSESATPESSGS
EVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLH
DPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRV
VFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMP
RQVFNAQKKAQSSTDGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
103 Cas9 TadAins 1040
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSGSSGSETPGT
SESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVI
GEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCA
GAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADEC
AALLCYFFRMPRQVFNAQKKAQSSTDNIMNFFKTEITLANGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
105 Cas9 TadAins 1068
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGEGSSGSETPGTSESATPESSGSEVEFSHEYWMR
HALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMAL
RQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGA
AGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQ
SSTDTGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
106 Cas9 TadAins 1247
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGGSS
GSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVL
VLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTF
EPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITE
GILADECAALLCYFFRMPRQVFNAQKKAQSSTDSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
107 Cas9 TadAins 1054
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDERE
VPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLID
ATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMN
HRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
108 Cas9 TadAins 1026
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEGSSGSETPGTSESATPESSGSEVE
FSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPT
AHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFG
VRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQV
FNAQKKAQSSTDQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
109 Cas9 TadAins 768
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQGSSGSETPGTSESATPESSGSEVEFSHEYWMR
HALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMAL
RQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGA
AGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRTTQKGQKNSR
ERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQEL
DINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKK
MKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQIT
KHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREI
NNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQE
IGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGR
DFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDP
KKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNP
IDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELAL
PSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSK
RVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFD
TTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
110.1 Cas9 TadAins 1250
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPG
SSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGA
VLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYV
TFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEI
TEGILADECAALLCYFFRMPREDNEQKQLFVEQHKHYLDEIIEQISEFSK
RVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFD
TTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
110.2 Cas9 TadAins 1250
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPG
SSGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVP
VGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDAT
LYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHR
VEITEGILADECAALLCYFFRMPREDNEQKQLFVEQHKHYLDEIIEQISE
FSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFK
YFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
110.3 Cas9 TadAins 1250
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPG
SSGSSGSETPGTSESATPESGSSSGSEVEFSHEYWMRHALTLAKRARDER
EVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLI
DATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGM
NHRVEITEGILADECAALLCYFFRMPREDNEQKQLFVEQHKHYLDEIIEQ
ISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPA
AFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
110.4 Cas9 TadAins 1250
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPG
SSGSSGSETPGTSESATPESGSSSGSEVEFSHEYWMRHALTLAKRARDER
EVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLI
DATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGM
NHRVEITEGILADECAALLCYFFRMRREDNEQKQLFVEQHKHYLDEIIEQ
ISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPA
AFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
110.5 Cas9 TadAins 1249
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSGS
SGSSGSETPGTSESATPESGSSSGSEVEFSHEYWMRHALTLAKRARDERE
VPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLID
ATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMN
HRVEITEGILADECAALLCYFFRMRRPEDNEQKQLFVEQHKHYLDEIIEQ
ISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPA
AFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
110.5 Cas9 TadAins Δ59-66 1250
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPG
SSGSSGSETPGTSESATPESGSSGSEVEFSHEYWMRHALTLAKRARDERE
VPVGAVLVLNNRVIGEGWNRAHAEIMALRQGGLVMQNYRLIDATLYVTFE
PCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEG
ILADECAALLCYFFRMPRQVFNAQKKAQSSTDEDNEQKQLFVEQHKHYLD
EIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTN
LGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGG
D
110.6 Cas9 TadAins 1251
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPE
GSSGSSGSETPGTSESATPESGSSSGSEVEFSHEYWMRHALTLAKRARDE
REVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRL
IDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPG
MNHRVEITEGILADECAALLCYFFRMRRDNEQKQLFVEQHKHYLDEIIEQ
ISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPA
AFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
110.7 Cas9 TadAins 1252
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPE
DGSSGSSGSETPGTSESATPESGSSSGSEVEFSHEYWMRHALTLAKRARD
EREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYR
LIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYP
GMNHRVEITEGILADECAALLCYFFRMRRNEQKQLFVEQHKHYLDEIIEQ
ISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPA
AFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
110.8 Cas9 TadAins Δ59-66C-短縮型1250
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPG
SSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGA
VLVLNNRVIGEGWNRAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMC
AGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADE
CAALLCYFFRMPRQEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADA
NLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKR
YTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
111.1 Cas9 TadAins997
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALSHE
YWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAE
IMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNA
KTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQ
KKAQSSTDGSSGSETPGTSESATPESSGIKKYPKLESEFVYGDYKVYDVR
KMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGET
GEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKL
IARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIM
ERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGE
LQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEI
IEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLG
APAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
111.2 Cas9 TadAins997
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALSHE
YWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAE
IMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNA
KTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQ
KKAQSSTDGSSGSSGSETPGTSESATPESSGGSSIKKYPKLESEFVYGDY
KVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLI
ETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPK
RNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKEL
LGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRM
LASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHK
HYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLF
TLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLS
QLGGD
112 ΔHNH TadA
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSEVEFSHE
YWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAE
IMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNA
KTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQ
KKAQSSTDGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDEND
KLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTAL
IKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFK
TEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKK
TEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVA
KVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIK
LPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKG
SPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKH
RDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATL
IHQSITGLYETRIDLSQLGGD
113 N末端単-TadAヘリックス短縮165末端
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIG
LHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIG
RVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFR
MPRSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSV
GWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKR
TARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERH
PIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRG
HFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARL
SKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQL
SKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAP
LSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGG
ASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHL
GELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMT
RKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYE
YFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKE
DYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDIL
EDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKL
INGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQ
GDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARE
NQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYL
QNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGK
SDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGF
IKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDF
RKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVY
DVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETN
GETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNS
DKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGI
TIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLAS
AGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYL
DEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLT
NLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLG
GD
114 N末端単-TadAヘリックス短縮165末端Δ59-65
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRTAH
AEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVR
NAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRSGGS
SGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITD
EYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYT
RRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIV
DEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGD
LNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLE
NLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDD
DLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIK
RYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFY
KFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAIL
RRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETI
TPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNE
LTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIE
CFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTL
TLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDK
QSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEH
IANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKG
QKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMY
VDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSE
EVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVE
TRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFY
KVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIA
KSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIV
WDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARK
KDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSS
FEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKG
NELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQI
SEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAA
FKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
115.1 Cas9 TadAins1004
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREV
PVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDA
TLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNH
RVEITEGILADECAALLCYFFRMPRQLESEFVYGDYKVYDVRKMIAKSEQ
EIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKG
RDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWD
PKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKN
PIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELA
LPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFS
KRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYF
DTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
115.2 Cas9 TadAins1005
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDERE
VPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLID
ATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMN
HRVEITEGILADECAALLCYFFRMPRQESEFVYGDYKVYDVRKMIAKSEQ
EIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKG
RDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWD
PKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKN
PIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELA
LPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFS
KRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYF
DTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
115.3 Cas9 TadAins1006
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLEGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDER
EVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLI
DATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGM
NHRVEITEGILADECAALLCYFFRMPRQSEFVYGDYKVYDVRKMIAKSEQ
EIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKG
RDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWD
PKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKN
PIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELA
LPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFS
KRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYF
DTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
115.4 Cas9 TadAins1007
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDE
REVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRL
IDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPG
MNHRVEITEGILADECAALLCYFFRMPRQEFVYGDYKVYDVRKMIAKSEQ
EIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKG
RDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWD
PKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKN
PIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELA
LPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFS
KRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYF
DTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
116.1 Cas9 TadAinsC末端短縮2 792
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGGSSGSETP
GTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNR
VIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVM
CAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILAD
ECAALLCYFFRMPRQSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQE
LDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVK
KMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQI
TKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVRE
INNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQ
EIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKG
RDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWD
PKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKN
PIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELA
LPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFS
KRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYF
DTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
116.2 Cas9 TadAinsC末端短縮2 791
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSSGSETPG
TSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRV
IGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMC
AGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADE
CAALLCYFFRMPRQGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQE
LDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVK
KMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQI
TKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVRE
INNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQ
EIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKG
RDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWD
PKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKN
PIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELA
LPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFS
KRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYF
DTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
116.3 Cas9 TadAinsC末端短縮2 790
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKEGSSGSETPGT
SESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVI
GEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCA
GAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADEC
AALLCYFFRMPRQLGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQE
LDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVK
KMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQI
TKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVRE
INNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQ
EIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKG
RDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWD
PKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKN
PIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELA
LPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFS
KRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYF
DTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
117 Cas9 Δ1017-1069
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYSSGSEVEFSHEYWMRHALTLAKRARDEREVPVGA
VLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYV
TFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEI
TEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDGEIVWDKGRDFATVR
KVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGF
DSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEA
KGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVN
FLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILAD
ANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRK
RYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
118 Cas9 TadA-CP116ins 1067
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNMNHRVEITEGILADECAALLCYFFRMPRQVFNAQ
KKAQSSTDGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRAR
DEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNY
RLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHY
PGGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
119 Cas9 TadAins 701
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPV
GAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATL
YVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRV
EITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDLTFKEDIQKAQVS
GQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMA
RENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLY
YLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNR
GKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKA
GFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVS
DFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYK
VYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
120 Cas9 TadACP136ins 1248
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSMN
HRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDGSSGSETPGT
SESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVI
GEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCA
GAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
121 Cas9 TadACP136ins 1052
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLAMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDGSSGS
ETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVL
NNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEP
CVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGNGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
122 Cas9 TadACP136ins 1041
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSMNHRVEITEG
ILADECAALLCYFFRMPRQVFNAQKKAQSSTDGSSGSETPGTSESATPES
SGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAI
GLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRI
GRVVFGVRNAKTGAAGSLMDVLHYPGNIMNFFKTEITLANGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
123 Cas9 TadACP139ins 1299
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPE
DNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRMN
HRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDGSSGSETPGT
SESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVI
GEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCA
GAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
124 Cas9 Δ792-872 TadAins
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSEVEFSHE
YWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAE
IMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNA
KTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQ
KKAQSSTDEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKA
GFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVS
DFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYK
VYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
125 Cas9 Δ792-906 TadAins
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSEVEFSHE
YWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAE
IMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNA
KTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQ
KKAQSSTDGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDK
LIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALI
KKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKT
EITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKT
EVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAK
VEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKL
PKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGS
PEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHR
DKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLI
HQSITGLYETRIDLSQLGGD
126 TadA CP65ins 1003
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGR
VVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRM
PRQVFNAQKKAQSSTDGSSGSETPGTSESATPESSGSEVEFSHEYWMRHA
LTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPLESEFVYGDYK
VYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
127 TadA CP65ins 1016
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVM
CAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILAD
ECAALLCYFFRMPRQVFNAQKKAQSSTDGSSGSETPGTSESATPESSGSE
VEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHD
PYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
128 TadA CP65ins 1022
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMITAHAEIMALRQGGLVMQNYRLIDATLYV
TFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEI
TEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDGSSGSETPGTSESAT
PESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWN
RAIGLHDPAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
129 TadA CP65ins 1029
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEITAHAEIMALRQGGLVMQNYRL
IDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPG
MNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDGSSGSETP
GTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNR
VIGEGWNRAIGLHDPGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
130 TadA CP65ins 1041
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSTAHAEIMALR
QGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAA
GSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQS
STDGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREV
PVGAVLVLNNRVIGEGWNRAIGLHDPNIMNFFKTEITLANGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
131 TadA CP65ins 1054
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIG
RVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFR
MPRQVFNAQKKAQSSTDGSSGSETPGTSESATPESSGSEVEFSHEYWMRH
ALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPGEIRKRPLIE
TNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKR
NSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELL
GITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRML
ASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
132 TadA CP65ins 1246
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKV
MGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDD
SIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGTAH
AEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVR
NAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFN
AQKKAQSSTDGSSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKR
ARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPSPEDNEQKQLFVEQHKH
YLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT
LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGD
いくつかの実施形態では、アデノシンデアミナーゼ塩基編集体を生成し、TadAまたはそのバリアントを、同定された位置でCas9ポリペプチドに挿入した。
例示的であるが非限定的な融合タンパク質は、国際PCT出願第PCT/US2020/016285号及び米国仮出願第62/852,228号及び第62/852,224号に記載されており、それらの内容は、その全体が参照により本明細書に援用される。
核酸塩基編集ドメイン
本明細書において、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン及び核酸塩基編集ドメイン(例えば、デアミナーゼドメイン)を含む融合タンパク質を含む塩基編集体を記載する。塩基編集体は、標的配列を認識することができるガイドポリヌクレオチドと相互作用することによって、標的ポリヌクレオチド配列中の1つ以上の塩基を編集するようにプログラムすることができる。標的配列が認識されると、塩基編集体は編集を行うポリヌクレオチドに固定され、次いで塩基編集体のデアミナーゼドメイン成分は、標的塩基を編集することができる。
いくつかの実施形態では、核酸塩基編集ドメインは、デアミナーゼドメインを含む。本明細書に特に記載するように、デアミナーゼドメインは、シトシンデアミナーゼまたはアデノシンデアミナーゼを含む。いくつかの実施形態では、用語「シトシンデアミナーゼ」及び「シチジンデアミナーゼ」は、同じ意味で用いられ得る。いくつかの実施形態では、用語「アデニンデアミナーゼ」及び「アデノシンデアミナーゼ」は、同じ意味で用いられ得る。核酸塩基編集タンパク質の詳細は、国際PCT出願第PCT/2017/045381号(WO2018/027078)及び第PCT/US2016/058344号(WO2017/070632)に記載されており、これらのそれぞれは、その全体が参照により本明細書に援用される。また、Komor, A.C., et al., ”Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533,420-424 (2016);Gaudelli, N.M., et al., ”Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551,464-471 (2017)、及びKomor, A.C., et al., ”Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao 4774 (2017)も参照されたい(その全内容は、参照により本明細書に援用される)。
AからGへの編集
いくつかの実施形態では、本明細書に記載の塩基編集体は、アデノシンデアミナーゼを含むデアミナーゼドメインを含み得る。そのような塩基編集体のアデノシンデアミナーゼドメインは、アデニン(A)を脱アミノ化して、グアニン(G)の塩基対形成特性を示すイノシン(I)を形成することにより、核酸塩基Aから核酸塩基Gへの編集を促進する。アデノシンデアミナーゼは、デオキシリボ核酸(DNA)中のデオキシアデノシン残基のアデニンを脱アミノ化(すなわち、アミン基を除去)することができる。
いくつかの実施形態では、本明細書中で提供する核酸塩基編集体は、1つ以上のタンパク質ドメインを一緒に融合することによって作製することができ、それにより、融合タンパク質が生成される。特定の実施形態では、本明細書中で提供する融合タンパク質は、融合タンパク質の塩基編集活性(例えば、効率、選択性、及び特異性)を向上させる1つ以上の特性を含む。例えば、本明細書中で提供する融合タンパク質は、ヌクレアーゼ活性が低下したCas9ドメインを含み得る。いくつかの実施形態では、本明細書中で提供する融合タンパク質は、ヌクレアーゼ活性を有さないCas9ドメイン(dCas9)、またはCas9ニッカーゼ(nCas9)と呼ばれる二本鎖DNA分子の1本の鎖を切断するCas9ドメインを有し得る。特定の理論に拘泥することを望むものではないが、触媒残基(例えば、H840)の存在は、標的Aの反対側のTを含む非編集(例えば、非脱アミノ化)鎖を切断するCas9の活性を維持する。Cas9の触媒残基の変異(例えば、D10からA10への)は、標的A残基を含む編集された鎖の切断を防止する。そのようなCas9バリアントは、gRNAで規定された標的配列に基づいて特定の場所で一本鎖DNA切断(ニック)を生成し、非編集鎖の修復をもたらし、最終的には非編集鎖上のTからCへの変化を生じさせることができる。いくつかの実施形態では、AからGへの塩基編集体は、イノシン塩基除去修復の阻害因子、例えば、ウラシルグリコシラーゼ阻害因子(UGI)ドメインまたは触媒的に不活性なイノシン特異的ヌクレアーゼをさらに含む。特定の理論に拘泥することを望むものではないが、UGIドメインまたは触媒的に不活性なイノシン特異的ヌクレアーゼは、脱アミノ化アデノシン残基(例えば、イノシン)の塩基除去修復を阻害または防止することができ、これにより、塩基編集体の活性または効率を向上させることができる。
アデノシンデアミナーゼを含む塩基編集体は、DNA、RNA、及びDNA-RNAハイブリッドを含む任意のポリヌクレオチドに作用することができる。特定の実施形態では、アデノシンデアミナーゼを含む塩基編集体は、RNAを含むポリヌクレオチドの標的Aを脱アミノ化することができる。例えば、塩基編集体は、RNAポリヌクレオチド及び/またはDNA-RNAハイブリッドポリヌクレオチドの標的Aを脱アミノ化することができるアデノシンデアミナーゼドメインを含み得る。一実施形態では、塩基編集体に組み込まれたアデノシンデアミナーゼは、RNA (ADAR、例えば、ADAR1またはADAR2)に作用するアデノシンデアミナーゼの全部または一部を含む。別の実施形態では、塩基編集体に組み込まれたアデノシンデアミナーゼは、tRNA (ADAT)に作用するアデノシンデアミナーゼの全部または一部を含む。アデノシンデアミナーゼドメインを含む塩基編集体はまた、DNAポリヌクレオチドのA核酸塩基を脱アミノ化することができる可能性がある。一実施形態では、塩基編集体のアデノシンデアミナーゼドメインは、ADATがDNA中の標的Aを脱アミノ化することを可能にする1つ以上の変異を含む、ADATの全部または一部を含む。例えば、塩基編集体は、変異:D108N、A106V、D147Y、E155V、L84F、H123Y、I156F、または別のアデノシンデアミナーゼにおける対応する変異の1つ以上を含むEscherichia coli由来のADAT (EcTadA)の全部または一部を含み得る。
アデノシンデアミナーゼは、任意の適切な生物(例えば、E. coli)に由来し得る。いくつかの実施形態では、アデニンデアミナーゼは、本明細書中で提供する変異のいずれかに対応する1つ以上の変異(例えば、ecTadAにおける変異)を含む天然のアデノシンデアミナーゼである。任意の相同タンパク質の対応する残基は、例えば、配列アラインメント及び相同残基の決定によって同定することができる。本明細書に記載の変異のいずれかに対応する任意の天然のアデノシンデアミナーゼ(例えば、ecTadAと相同性を有する)の変異(例えば、ecTadAで同定された変異のいずれか)を、それに応じて生成することができる。
アデノシンデアミナーゼ
いくつかの実施形態では、本明細書に記載の融合タンパク質は、アデノシンデアミナーゼを含むデアミナーゼドメインを含み得る。そのような塩基編集体のアデノシンデアミナーゼドメインは、アデニン(A)を脱アミノ化して、グアニン(G)の塩基対形成特性を示すイノシン(I)を形成することにより、核酸塩基Aから核酸塩基Gへの編集を促進する。アデノシンデアミナーゼは、デオキシリボ核酸(DNA)中のデオキシアデノシン残基のアデニンを脱アミノ化(すなわち、アミン基を除去)することができる。
いくつかの実施形態では、本明細書中で提供するアデノシンデアミナーゼは、アデニンを脱アミノ化することができる。いくつかの実施形態では、本明細書中で提供するアデノシンデアミナーゼは、DNAのデオキシアデノシン残基のアデニンを脱アミノ化することができる。いくつかの実施形態では、アデニンデアミナーゼは、本明細書中で提供する変異のいずれかに対応する1つ以上の変異(例えば、ecTadAにおける変異)を含む天然のアデノシンデアミナーゼである。当業者であれば、任意の相同タンパク質の対応する残基を、例えば、配列アラインメント及び相同残基の決定によって同定することができる。したがって、当業者であれば、本明細書に記載の変異のいずれかに対応する任意の天然のアデノシンデアミナーゼ(例えば、ecTadAと相同性を有する)の変異(例えば、ecTadAで同定された変異のいずれか)を、それに応じて生成することができる。いくつかの実施形態では、アデノシンデアミナーゼは、原核生物由来である。いくつかの実施形態では、アデノシンデアミナーゼは、細菌由来である。いくつかの実施形態では、アデノシンデアミナーゼは、Escherichia coli、Staphylococcus aureus、Salmonella typhi、Shewanella putrefaciens、Haemophilus influenzae、Caulobacter crescentus、またはBacillus subtilis由来である。いくつかの実施形態では、アデノシンデアミナーゼは、E. coli由来である。
本開示は、効率が向上し(>50~60%)、特異性が向上したアデノシンデアミナーゼバリアントを提供する。特に、本明細書に記載のアデノシンデアミナーゼバリアントは、ポリヌクレオチド内の所望の塩基を編集する可能性が高く、改変することを意図していない塩基(すなわち、「バイスタンダー」)を編集する可能性が低い。
特定の実施形態では、TadAは、PCT/US2017/045381 (WO2018/027078)に記載されているTadAのいずれか1つであり、その全体が参照により本明細書に援用される。
いくつかの実施形態では、本開示の核酸塩基編集体は、以下の配列の変化を含むアデノシンデアミナーゼバリアントである:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD (TadA*7.10とも呼ばれる)。
特定の実施形態では、融合タンパク質は、単一の(例えば、単量体として提供される)TadA*8バリアントを含む。いくつかの実施形態では、TadA*8を、Cas9ニッカーゼに連結する。いくつかの実施形態では、本開示の融合タンパク質は、ヘテロ二量体として、TadA*8バリアントに連結された野生型TadA (TadA (wt))を含む。他の実施形態では、本開示の融合タンパク質は、ヘテロ二量体として、TadA*8バリアントに連結されたTadA*7.10を含む。いくつかの実施形態では、塩基編集体は、TadA*8バリアント単量体を含むABE8である。いくつかの実施形態では、塩基編集体は、TadA*8バリアントとTadA (wt)のヘテロ二量体を含むABE8である。いくつかの実施形態では、塩基編集体は、TadA*8バリアントとTadA*7.10のヘテロ二量体を含むABE8である。いくつかの実施形態では、塩基編集体は、TadA*8バリアントのヘテロ二量体を含むABE8である。いくつかの実施形態では、TadA*8バリアントは表8から選択される。いくつかの実施形態では、ABE8は表8、9、または10から選択される。適切な配列は以下の通りである:
野生型TadA (TadA (wt))または「TadA参照配列」
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKKAQSSTD
TadA*7.10:
MSEVEFSHEYW MRHALTLAKR ARDEREVPVG AVLVLNNRVI GEGWNRAIGL HDPTAHAEIM ALRQGGLVMQ NYRLIDATLY VTFEPCVMCA GAMIHSRIGR VVFGVRNAKT GAAGSLMDVL HYPGMNHRVE ITEGILADEC AALLCYFFRM PRQVFNAQKK AQSSTD
いくつかの実施形態では、アデノシンデアミナーゼは、本明細書中で提供するアデノシンデアミナーゼのいずれかに記載のアミノ酸配列のいずれか1つに対して、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。本明細書中で提供するアデノシンデアミナーゼは、1つ以上の変異(例えば、本明細書中で提供する変異のいずれか)を含み得ることを理解すべきである。本開示は、特定割合の同一性に加えて、本明細書に記載の変異のいずれか、またはそれらの組み合わせを含む任意のデアミナーゼドメインを提供する。いくつかの実施形態では、アデノシンデアミナーゼは、参照配列、または本明細書中で提供するアデノシンデアミナーゼのいずれかと比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50またはそれ以上の変異を有するアミノ酸配列を含む。いくつかの実施形態では、アデノシンデアミナーゼは、当技術分野で公知の、または本明細書に記載のアミノ酸配列のいずれか1つと比較して、少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも110、少なくとも120、少なくとも130、少なくとも140、少なくとも150、少なくとも160、または少なくとも170個の同一の連続アミノ酸残基を有するアミノ酸配列を含む。
いくつかの実施形態では、TadAデアミナーゼは、全長E. coli TadAデアミナーゼである。例えば、特定の実施形態では、アデノシンデアミナーゼは、アミノ酸配列:
MRRAFITGVFFLSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKKAQSSTDを含む。
しかしながら、本出願において有用な追加のアデノシンデアミナーゼは、当業者には明らかであり、本開示の範囲内にあることを理解すべきである。例えば、アデノシンデアミナーゼは、tRNA (ADAT)に作用するアデノシンデアミナーゼの相同体であり得る。限定されないが、例示的なAD AT相同体のアミノ酸配列として、以下が挙げられる:
Staphylococcus aureus TadA:
MGSHMTNDIYFMTLAIEEAKKAAQLGEVPIGAIITKDDEVIARAHNLRETLQQPTAHAEHIAIERAAKVLGSWRLEGCTLYVTLEPCVMCAGTIVMSRIPRVVYGADDPKGGCSGS LMNLLQQSNFNHRAIVDKGVLKEACSTLLTTFFKNLRANKKSTN
Bacillus subtilis TadA:
MTQDELYMKEAIKEAKKAEEKGEVPIGAVLVINGEIIARAHNLRETEQRSIAHAEMLVIDEACKALGTWRLEGATLYVTLEPCPMCAGAVVLSRVEKVVFGAFDPKGGCSGTLMNLLQEERFNHQAEVVSGVLEEECGGMLSAFFRELRKKKKAARKNLSE
Salmonella typhimurium (S. typhimurium)TadA:
MPPAFITGVTSLSDVELDHEYWMRHALTLAKRAWDEREVPVGAVLVHNHRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVLQNYRLLDTTLYVTLEPCVMCAGAMVHSRIGRVVFGARDAKTGAAGSLIDVLHHPGMNHRVEIIEGVLRDECATLLSDFFRMRRQEIKALKKADRAEGAGPAV
Shewanella putrefaciens (S. putrefaciens)TadA:
MDEYWMQVAMQMAEKAEAAGEVPVGAVLVKDGQQIATGYNLSISQHDPTAHAEILCLRSAGKKLENYRLLDATLYITLEPCAMCAGAMVHSRIARVVYGARDEKTGAAGTVVNLLQHPAFNHQVEVTSGVLAEACSAQLSRFFKRRRDEKKALKLAQRAQQGIE
Haemophilus influenzae F3031 (H. influenzae)TadA:
MDAAKVRSEFDEKMMRYALELADKAEALGEIPVGAVLVDDARNIIGEGWNLSIVQSDPTΑΗAEIIALRNGAKNIQNYRLLNSTLYVTLEPCTMCAGAILHSRIKRLVFGASDYKTGAIGSRFHFFDDYKMNHTLEITSGVLAEECSQKLSTFFQKRREEKKIEKALLKSLSDK
Caulobacter crescentus (C. crescentus)TadA:
MRTDESEDQDHRMMRLALDAARAAAEAGETPVGAVILDPSTGEVIATAGNGPIAAHDPTAHAEIAAMRAAAAKLGNYRLTDLTLVVTLEPCAMCAGAISHARIGRVVFGADDPKGGAVVHGPKFFAQPTCHWRPEVTGGVLADESADLLRGFFRARRKAKI
Geobacter sulfurreducens (G. sulfurreducens)TadA:
MSSLKKTPIRDDAYWMGKAIREAAKAAARDEVPIGAVIVRDGAVIGRGHNLREGSNDPSAHAEMIAIRQAARRSANWRLTGATLYVTLEPCLMCMGAIILARLERVVFGCYDPKGGAAGSLYDLSADPRLNHQVRLSPGVCQEECGTMLSDFFRDLRRRKKAKATPALFIDERKVPPEP
E. coli TadA (ecTadA)の実施形態として、以下が挙げられる。
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
いくつかの実施形態では、アデノシンデアミナーゼは、原核生物由来である。いくつかの実施形態では、アデノシンデアミナーゼは、細菌由来である。いくつかの実施形態では、アデノシンデアミナーゼは、Escherichia coli、Staphylococcus aureus、Salmonella typhi、Shewanella putrefaciens、Haemophilus influenzae、Caulobacter crescentus、またはBacillus subtilis由来である。いくつかの実施形態では、アデノシンデアミナーゼは、E. coli由来である。
一実施形態では、本開示の融合タンパク質は、Cas9ニッカーゼに連結されたTadA*7.10に連結された野生型TadAを含む。特定の実施形態では、融合タンパク質は、単一の(例えば、単量体として提供される)TadA*7.10ドメインを含む。他の実施形態では、ABE7.10編集体は、ヘテロ二量体を形成することができるTadA*7.10及びTadA (wt)を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、本明細書中で提供するアデノシンデアミナーゼのいずれかに記載のアミノ酸配列のいずれか1つに対して、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。本明細書中で提供するアデノシンデアミナーゼは、1つ以上の変異(例えば、本明細書中で提供する変異のいずれか)を含み得ることを理解すべきである。本開示は、特定割合の同一性に加えて、本明細書に記載の変異のいずれか、またはそれらの組み合わせを含む任意のデアミナーゼドメインを提供する。いくつかの実施形態では、アデノシンデアミナーゼは、参照配列、または本明細書中で提供するアデノシンデアミナーゼのいずれかと比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50またはそれ以上の変異を有するアミノ酸配列を含む。いくつかの実施形態では、アデノシンデアミナーゼは、当技術分野で公知の、または本明細書に記載のアミノ酸配列のいずれか1つと比較して、少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも110、少なくとも120、少なくとも130、少なくとも140、少なくとも150、少なくとも160、または少なくとも170個の同一の連続アミノ酸残基を有するアミノ酸配列を含む。
本明細書中で提供する変異(例えば、TadA参照配列に基づく)のいずれかを、他のアデノシンデアミナーゼ、例えば、E. coli TadA (ecTadA)、S. aureus TadA (saTadA)、または他のアデノシンデアミナーゼ(例えば、細菌性アデノシンデアミナーゼ)に導入することができることを理解すべきである。追加のデアミナーゼを同様にアラインメントして、本明細書中で提供するように変異させることができる相同アミノ酸残基を同定することができることは、当業者には明らかであろう。したがって、TadA参照配列で同定された変異はいずれも、相同アミノ酸残基を有する他のアデノシンデアミナーゼ(例えば、ecTada)で行うことができる。本明細書中で提供する変異のいずれも、TadA参照配列または別のアデノシンデアミナーゼにおいて個別に、または任意の組み合わせで行うことができることも理解すべきである。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるD108X変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、D108G、D108N、D108V、D108A、もしくはD108Y変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA106X変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA106V変異、または別のアデノシンデアミナーゼ(例えば、野生型TadAまたはecTadA)における対応する変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるE155X変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含み、Xの存在は、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるE155D、E155G、またはE155V変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるD147X変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含み、Xの存在は、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるD147Y変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA106X、E155X、もしくはD147X変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、E155D、E155G、またはE155V変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは、D147Yを含む。
例えば、アデノシンデアミナーゼは、TadA参照配列におけるD108N、A106V、E155V、及び/またはD147Y変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列における以下の変異のグループ(変異のグループは「;」によって分けられる)、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む:D108N及びA106V;D108N及びE155V;D108N及びD147Y;A106V及びE155V;A106V及びD147Y;E155V及びD147Y;D108N、A106V、及びE155V;D108N、A106V、及びD147Y;D108N、E155V、及びD147Y;A106V、E155V、及びD147Y;ならびにD108N、A106V、E155V、及びD147Y。しかしながら、本明細書中で提供する対応する変異の任意の組み合わせを、アデノシンデアミナーゼ(例えば、ecTadA)において行い得ることを理解すべきである。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列における、H8X、T17X、L18X、W23X、L34X、W45X、R51X、A56X、E59X、E85X、M94X、I95X、V102X、F104X、A106X、R107X、D108X、K110X、M118X、N127X、A138X、F149X、M151X、R153X、Q154X、I156X、及び/またはK157X変異の1つ以上、または別のアデノシンデアミナーゼ(例えば、ecTadA)の1つ以上の対応する変異を含み、Xの存在は、野生型アデノシンデアミナーゼの対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列における、H8Y、T17S、L18E、W23L、L34S、W45L、R51H、A56E、またはA56S、E59G、E85K、またはE85G、M94L、I95L、V102A、F104L、A106V、R107C、またはR107H、またはR107P、D108G、またはD108N、またはD108V、またはD108A、またはD108Y、K110I、M118K、N127S、A138V、F149Y、M151V、R153C、Q154L、I156D、及び/またはK157R変異の1つ以上、あるいは別のアデノシンデアミナーゼ(例えば、ecTadA)の1つ以上の対応する変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8X、D108X、及び/またはN127X変異の1つ以上、または別のアデノシンデアミナーゼ(例えば、ecTadA)における1つ以上の対応する変異を含み、Xは任意のアミノ酸の存在を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、及び/またはN127S変異の1つ以上、または別のアデノシンデアミナーゼ(例えば、ecTadA)における1つ以上の対応する変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列における、H8X、R26X、M61X、L68X、M70X、A106X、D108X、A109X、N127X、D147X、R152X、Q154X、E155X、K161X、Q163X、及び/またはT166X変異の1つ以上、または別のアデノシンデアミナーゼ(例えば、ecTadA)の1つ以上の対応する変異を含み、Xは、野生型アデノシンデアミナーゼの対応するアミノ酸以外の任意のアミノ酸の存在を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、R26W、M61I、L68Q、M70V、A106T、D108N、A109T、N127S、D147Y、R152C、Q154HまたはQ154R、E155GまたはE155VまたはE155D、K161Q、Q163H、及び/またはT166P変異の1つ以上、あるいは別のアデノシンデアミナーゼ(例えば、ecTadA)における1つ以上の対応する変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列における、H8X、D108X、N127X、D147X、R152X、及びQ154Xからなる群から選択される1、2、3、4、5、もしくは6つの変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)の対応する1つの変異もしくは複数の変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8X、M61X、M70X、D108X、N127X、Q154X、E155X、及びQ163Xからなる群から選択される1、2、3、4、5、6、7、もしくは8つの変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)の対応する1つの変異もしくは複数の変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列における、H8X、D108X、N127X、E155X、及びT166Xからなる群から選択される1、2、3、4、もしくは5つの変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)の対応する1つの変異もしくは複数の変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す。
いくつかの実施形態では、アデノシンデアミナーゼは、H8X、A106X、D108Xからなる群から選択される1、2、3、4、5、もしくは6つの変異、別のアデノシンデアミナーゼの対応する1つの変異もしくは複数の変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す。いくつかの実施形態では、アデノシンデアミナーゼは、H8X、R26X、L68X、D108X、N127X、D147X、及びE155Xからなる群から選択される1、2、3、4、5、6、7、もしくは8つの変異、または別のアデノシンデアミナーゼの対応する1つの変異もしくは複数の変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列における、H8X、D108X、A109X、N127X、及びE155Xからなる群から選択される1、2、3、4、もしくは5つの変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)の対応する1つの変異もしくは複数の変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列における、H8Y、D108N、N127S、D147Y、R152C、及びQ154Hからなる群から選択される1、2、3、4、5、もしくは6つの変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)の対応する1つの変異もしくは複数の変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列における、H8Y、M61I、M70V、D108N、N127S、Q154R、E155G及びQ163Hからなる群から選択される1、2、3、4、5、6、7、もしくは8つの変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)の対応する1つの変異もしくは複数の変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列における、H8Y、D108N、N127S、E155V、及びT166Pからなる群から選択される1、2、3、4、もしくは5つの変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)の対応する1つの変異もしくは複数の変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列における、H8Y、A106T、D108N、N127S、E155D、及びK161Qからなる群から選択される1、2、3、4、5、もしくは6つの変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)の対応する1つの変異もしくは複数の変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列における、H8Y、R26W、L68Q、D108N、N127S、D147Y、及びE155Vからなる群から選択される1、2、3、4、5、6、7、もしくは8つの変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)の対応する1つの変異もしくは複数の変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列における、H8Y、D108N、A109T、N127S、及びE155Gからなる群から選択される1、2、3、4、もしくは5つの変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)の対応する1つの変異もしくは複数の変異を含む。
本明細書中で提供する変異のいずれか、及び任意の追加の変異(例えば、ecTadAアミノ酸配列に基づく)は、他の任意のアデノシンデアミナーゼに導入することができる。本明細書中で提供する変異のいずれも、TadA参照配列または別のアデノシンデアミナーゼ(例えば、ecTadA)において個別に、または任意の組み合わせで行うことができる。
AからGへの核酸塩基編集タンパク質の詳細は、国際PCT出願第PCT/2017/045381 (WO2018/027078)及びGaudelli, N.M., et al., ”Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage”Nature,551,464-471 (2017)に記載されており、その全内容は参照により本明細書に援用される。
いくつかの実施形態では、アデノシンデアミナーゼは、別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異の1つ以上を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるD108N、D108G、もしくはD108V変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA106V及びD108N変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR107C及びD108N変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、N127S、D147Y、及びQ154H変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、N127S、D147Y、及びE155V変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるD108N、D147Y、及びE155V変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、及びN127S変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA106V、D108N、D147Y、及びE155V変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列における、S2X、H8X、I49X、L84X、H123X、N127X、I156X及び/またはK160X変異の1つ以上、または別のアデノシンデアミナーゼの対応する変異の1つ以上を含み、Xの存在は、野生型アデノシンデアミナーゼの対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるS2A、H8Y、I49F、L84F、H123Y、N127S、I156F及び/またはK160S変異の1つ以上、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異の1つ以上を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、L84X変異型アデノシンデアミナーゼを含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるL84F変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH123X変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH123Y変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるI156X変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるI156F変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列における、L84X、A106X、D108X、H123X、D147X、E155X、及びI156Xからなる群から選択される1、2、3、4、5、6、もしくは7つの変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)の対応する1つの変異もしくは複数の変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列における、S2X、I49X、A106X、D108X、D147X、及びE155Xからなる群から選択される1、2、3、4、5、もしくは6つの変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)の対応する1つの変異もしくは複数の変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列における、H8X、A106X、D108X、N127X、及びK160Xからなる群から選択される1、2、3、4、もしくは5つの変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)の対応する1つの変異もしくは複数の変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列における、L84F、A106V、D108N、H123Y、D147Y、E155V、及びI156Fからなる群から選択される1、2、3、4、5、6、もしくは7つの変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)の対応する1つの変異もしくは複数の変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列における、S2A、I49F、A106V、D108N、D147Y、及びE155Vからなる群から選択される1、2、3、4、5、もしくは6つの変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列における、H8Y、A106T、D108N、N127S、及びK160Sからなる群から選択される1、2、3、4、もしくは5つの変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)の対応する1つの変異もしくは複数の変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列における、E25X、R26X、R107X、A142X、及び/またはA143X変異の1つ以上、または別のアデノシンデアミナーゼ(例えば、ecTadA)の対応する変異の1つ以上を含み、Xの存在は、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列における、E25M、E25D、E25A、E25R、E25V、E25S、E25Y、R26G、R26N、R26Q、R26C、R26L、R26K、R107P、R107K、R107A、R107N、R107W、R107H、R107S、A142N、A142D、A142G、A143D、A143G、A143E、A143L、A143W、A143M、A143S、A143Q及び/またはA143R変異の1つ以上、または別のアデノシンデアミナーゼ(例えば、ecTadA)の対応する変異の1つ以上を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列に対応する本明細書に記載の変異の1つ以上、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異の1つ以上を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるE25X変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるE25M、E25D、E25A、E25R、E25V、E25S、またはE25Y変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR26X変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR26G、R26N、R26Q、R26C、R26L、もしくはR26K変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR107X変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR107P、R107K、R107A、R107N、R107W、R107H、もしくはR107S変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA142X変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA142N、A142D、A142G変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA143X変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA143D、A143G、A143E、A143L、A143W、A143M、A143S、A143Q及び/またはA143R変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列における、H36X、N37X、P48X、I49X、R51X、M70X、N72X、D77X、E134X、S146X、Q154X、K157X、及び/またはK161X変異の1つ以上、または別のアデノシンデアミナーゼ(例えば、ecTadA)の対応する変異の1つ以上を含み、Xの存在は、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH36L、N37T、N37S、P48T、P48L、I49V、R51H、R51L、M70L、N72S、D77G、E134G、S146R、S146C、Q154H、K157N、及び/またはK161T変異の1つ以上、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異の1つ以上を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH36X変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH36L変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるN37X変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるN37T、もしくはN37S変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるP48X変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるP48T、もしくはP48L変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR51X変異、または別のアデノシンデアミナーゼにおける対応する変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR51H、もしくはR51L変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるS146X変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるS146R、もしくはS146C変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるK157X変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるK157N変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるP48X変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるP48S、P48T、もしくはP48A変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA142X変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA142N変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるW23X変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるW23R、もしくはW23L変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR152X変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR152P、もしくはR52H変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。
一実施形態では、アデノシンデアミナーゼは、変異H36L、R51L、L84F、A106V、D108N、H123Y、S146C、D147Y、E155V、I156F、及びK157Nを含み得る。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列に関連する以下の変異の組み合わせを含み、組み合わせの各変異は、「_」によって区切られ、変異の各組み合わせは、括弧の間にある。
(A106V_D108N),
(R107C_D108N),
(H8Y_D108N_N127S_D147Y_Q154H),
(H8Y_D108N_N127S_D147Y_E155V),
(D108N_D147Y_E155V),
(H8Y_D108N_N127S),
(H8Y_D108N_N127S_D147Y_Q154H),
(A106V_D108N_D147Y_E155V),
(D108Q_D147Y_E155V),
(D108M_D147Y_E155V),
(D108L_D147Y_E155V),
(D108K_D147Y_E155V),
(D108I_D147Y_E155V),
(D108F_D147Y_E155V),
(A106V_D108N_D147Y),
(A106V_D108M_D147Y_E155V),
(E59A_A106V_D108N_D147Y_E155V),
(E59A cat不活性_A106V_D108N_D147Y_E155V),
(L84F_A106V_D108N_H123Y_D147Y_E155V_I156Y),
(L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(D103A_D104N),
(G22P_D103A_D104N),
(D103A_D104N_S138A),
(R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F),
(E25G_R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V
_I156F),
(E25D_R26G_L84F_A106V_R107K_D108N_H123Y_A142N_A143G_D147Y_E155V_I156F),
(R26Q_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F),
(E25M_R26G_L84F_A106V_R107P_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F),
(R26C_L84F_A106V_R107H_D108N_H123Y_A142N_D147Y_E155V_I156F),
(L84F_A106V_D108N_H123Y_A142N_A143L_D147Y_E155V_I156F),
(R26G_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F),
(E25A_R26G_L84F_A106V_R107N_D108N_H123Y_A142N_A143E_D147Y_E155V_I156F),
(R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F),
(A106V_D108N_A142N_D147Y_E155V),
(R26G_A106V_D108N_A142N_D147Y_E155V),
(E25D_R26G_A106V_R107K_D108N_A142N_A143G_D147Y_E155V),
(R26G_A106V_D108N_R107H_A142N_A143D_D147Y_E155V),
(E25D_R26G_A106V_D108N_A142N_D147Y_E155V),
(A106V_R107K_D108N_A142N_D147Y_E155V),
(A106V_D108N_A142N_A143G_D147Y_E155V),
(A106V_D108N_A142N_A143L_D147Y_E155V),
(H36L_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N),
(N37T_P48T_M70L_L84F_A106V_D108N_H123Y_D147Y_I49V_E155V_I156F),
(N37S_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_K161T),
(H36L_L84F_A106V_D108N_H123Y_D147Y_Q154H_E155V_I156F),
(N72S_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F),
(H36L_P48L_L84F_A106V_D108N_H123Y_E134G_D147Y_E155V_I156F),
(H36L_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_K157N),
(H36L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F),
(L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F_K161T),
(N37S_R51H_D77G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(R51L_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_K157N),
(D24G_Q71R_L84F_H96L_A106V_D108N_H123Y_D147Y_E155V_I156F_K160E),
(H36L_G67V_L84F_A106V_D108N_H123Y_S146T_D147Y_E155V_I156F),
(Q71L_L84F_A106V_D108N_H123Y_L137M_A143E_D147Y_E155V_I156F),
(E25G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_Q159L),
(L84F_A91T_F104I_A106V_D108N_H123Y_D147Y_E155V_I156F),
(N72D_L84F_A106V_D108N_H123Y_G125A_D147Y_E155V_I156F),
(P48S_L84F_S97C_A106V_D108N_H123Y_D147Y_E155V_I156F),
(W23G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(D24G_P48L_Q71R_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_Q159L),
(L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F),
(H36L_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_I156F_K157N),(N37S_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F_K161T),
(L84F_A106V_D108N_D147Y_E155V_I156F),
(R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N_K161T),
(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K161T),
(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N_K160E_K161T),
(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N_K160E),
(R74Q_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(R74A_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(R74Q_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(L84F_R98Q_A106V_D108N_H123Y_D147Y_E155V_I156F),
(L84F_A106V_D108N_H123Y_R129Q_D147Y_E155V_I156F),
(P48S_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F),
(P48S_A142N),
(P48T_I49V_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F_L157N),
(P48T_I49V_A142N),
(H36L_P48S_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N),
(H36L_P48S_R51L_L84F_A106V_D108N_H123Y_S146C_A142N_D147Y_E155V_I156F(H36L_P48T_I49V_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N),
(H36L_P48T_I49V_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_I156F_K157N),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_I156F_K157N),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_A142N_D147Y_E155V_I156F_K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N),
(W23R_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F_K161T),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152H_E155V_I156F_K157N),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V_I156F_K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V_I156F_K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142A_S146C_D147Y_E155V
_I156F_K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142A_S146C_D147Y_R152P_E155V_I156F_K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F_K161T),
(W23R_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V_I156F_K157N),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_R152P_E155V
_I156F_K157N)。
特定の実施形態では、本明細書中で提供する融合タンパク質は、融合タンパク質の塩基編集活性を向上させる1つ以上の特性を含む。例えば、本明細書中で提供する融合タンパク質のいずれかは、ヌクレアーゼ活性が低下したCas9ドメインを含み得る。いくつかの実施形態では、本明細書中で提供する融合タンパク質のいずれかは、ヌクレアーゼ活性を有さないCas9ドメイン(dCas9)、またはCas9ニッカーゼ(nCas9)と呼ばれる二本鎖DNA分子の1本の鎖を切断するCas9ドメインを有し得る。
いくつかの実施形態では、アデノシンデアミナーゼはTadA*7.10である。いくつかの実施形態では、TadA*7.10は、少なくとも1つの改変を含む。特定の実施形態では、TadA*7.10は、以下の改変のうちの1つ以上を含む:Y147T、Y147R、Q154S、Y123H、V82S、T166R、及びQ154R。改変Y123Hとは、本明細書中では、H123Hとも呼ばれる(Y123H (wt)に逆戻りしたTadA*7.10の改変H123Y)。他の実施形態では、TadA*7.10は:Y147T+Q154R;Y147T+Q154S;Y147R+Q154S;V82S+Q154S;V82S+Y147R;V82S+Q154R;V82S+Y123H;I76Y+V82S;V82S+Y123H+Y147T;V82S+Y123H+Y147R;V82S+Y123H+Q154R;Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y123H+Y147R+Q154R+I76Y;V82S+Y123H+Y147R+Q154R、及びI76Y+V82S+Y123H+Y147R+Q154Rの群から選択される改変の組み合わせを含む。特定の実施形態では、アデノシンデアミナーゼバリアントは、TadA*7.10、TadA参照配列、または別のTadAにおける対応する変異と比較して、残基149、150、151、152、153、154、155、156、または157で始まるC末端の欠失を含む。
他の実施形態では、本開示の塩基編集体は、TadA*7.10、TadA参照配列、または別のTadAの対応する変異と比較して、以下の改変:Y147T、Y147R、Q154S、Y123H、V82S、T166R、及び/またはQ154Rのうちの1つ以上を含むアデノシンデアミナーゼバリアント(例えば、TadA*8)を含む単量体である。他の実施形態では、アデノシンデアミナーゼバリアント(TadA*8)は、TadA*7.10、TadA参照配列、または別のTadAの対応する変異と比較して:Y147T+Q154R;Y147T+Q154S;Y147R+Q154S;V82S+Q154S;V82S+Y147R;V82S+Q154R;V82S+Y123H;I76Y+V82S;V82S+Y123H+Y147T;V82S+Y123H+Y147R;V82S+Y123H+Q154R;Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y123H+Y147R+Q154R+I76Y;V82S+Y123H+Y147R+Q154R、及びI76Y+V82S+Y123H+Y147R+Q154Rの群から選択される改変の組み合わせを含む単量体である。他の実施形態では、塩基編集体は、野生型アデノシンデアミナーゼと、TadA*7.10、TadA参照配列、または別のTadAの対応する変異と比較して、以下の改変、すなわち、Y147T、Y147R、Q154S、Y123H、V82S、T166R、及び/またはQ154Rのうちの1つ以上を含むアデノシンデアミナーゼバリアント(例えば、TadA*8)と、を含むヘテロ二量体である。他の実施形態では、塩基編集体は、TadA*7.10ドメインと、TadA*7.10、TadA参照配列、または別のTadAの対応する変異と比較して:Y147T+Q154R;Y147T+Q154S;Y147R+Q154S;V82S+Q154S;V82S+Y147R;V82S+Q154R;V82S+Y123H;I76Y+V82S;V82S+Y123H+Y147T;V82S+Y123H+Y147R;V82S+Y123H+Q154R;Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y123H+Y147R+Q154R+I76Y;V82S+Y123H+Y147R+Q154R、及びI76Y+V82S+Y123H+Y147R+Q154Rの群から選択される改変の組み合わせを含むアデノシンデアミナーゼバリアントドメイン(例えば、TadA*8)と、を含むヘテロ二量体である。
一実施形態では、アデノシンデアミナーゼは、アデノシンデアミナーゼ活性を有する以下の配列またはその断片を含むか、または本質的にそれらからなるTadA*8である:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD
いくつかの実施形態では、TadA*8は、短縮されている。いくつかの実施形態では、短縮されたTadA*8は、全長TadA*8と比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のN末端アミノ酸残基を欠失している。いくつかの実施形態では、短縮されたTadA*8は、全長TadA*8と比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のC末端アミノ酸残基を欠失している。いくつかの実施形態では、アデノシンデアミナーゼバリアントは全長TadA*8である。
いくつかの実施形態では、TadA*8は、TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23、またはTadA*8.24である。
一実施形態では、本開示の融合タンパク質は、Cas9ニッカーゼに連結された本明細書に記載のアデノシンデアミナーゼバリアント(例えば、TadA*8)に連結された野生型TadAを含む。特定の実施形態では、融合タンパク質は、単一の(例えば、単量体として提供される)TadA*8バリアントを含む。他の実施形態では、塩基編集体は、ヘテロ二量体を形成することができるTadA*8及びTadA (wt)を含む。例示的な配列は以下の通りである:
TadA (wt)または「TadA参照配列」:
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKKAQSSTD
TadA*7.10:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
TadA*8:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD。
いくつかの実施形態では、アデノシンデアミナーゼは、本明細書中で提供するアデノシンデアミナーゼのいずれかに記載のアミノ酸配列のいずれか1つに対して、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。本明細書中で提供するアデノシンデアミナーゼは、1つ以上の変異(例えば、本明細書中で提供する変異のいずれか)を含み得ることを理解すべきである。本開示は、特定割合の同一性に加えて、本明細書に記載の変異のいずれか、またはそれらの組み合わせを含む任意のデアミナーゼドメインを提供する。いくつかの実施形態では、アデノシンデアミナーゼは、参照配列、または本明細書中で提供するアデノシンデアミナーゼのいずれかと比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50またはそれ以上の変異を有するアミノ酸配列を含む。いくつかの実施形態では、アデノシンデアミナーゼは、当技術分野で公知の、または本明細書に記載のアミノ酸配列のいずれか1つと比較して、少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも110、少なくとも120、少なくとも130、少なくとも140、少なくとも150、少なくとも160、または少なくとも170個の同一の連続アミノ酸残基を有するアミノ酸配列を含む。
特定の実施形態では、TadA*8は、太字で示す以下の位置のいずれかに1つ以上の変異を含む。他の実施形態では、TadA*8は、下線付きで示す位置のいずれかに1つ以上の変異を含む:
Figure 2022532139000032
例えば、TadA*8は、TadA*7.10、TadA参照配列、または別のTadAの対応する変異と比較して、アミノ酸位置82及び/または166 (例えば、V82S、T166R)において改変を、単独で、またはY147T、Y147R、Q154S、Y123H、及び/またはQ154Rのいずれか1つ以上と組み合わせて含む。特定の実施形態では、改変の組み合わせは、TadA*7.10、TadA参照配列、または別のTadAの対応する変異と比較して:Y147T+Q154R;Y147T+Q154S;Y147R+Q154S;V82S+Q154S;V82S+Y147R;V82S+Q154R;V82S+Y123H;I76Y+V82S;V82S+Y123H+Y147T;V82S+Y123H+Y147R;V82S+Y123H+Q154R;Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y123H+Y147R+Q154R+I76Y;V82S+Y123H+Y147R+Q154R、及びI76Y+V82S+Y123H+Y147R+Q154Rの群から選択される。
いくつかの実施形態では、アデノシンデアミナーゼは、アデノシンデアミナーゼ活性を有する以下の配列またはその断片を含むか、または本質的にそれらからなるTadA*8である:
MSEVEFSHEY WMRHALTLAK RARDEREVPV GAVLVLNNRV IGEGWNRAIG LHDPTAHAEI MALRQGGLVM QNYRLIDATL YVTFEPCVMC AGAMIHSRIG RVVFGVRNAK TGAAGSLMDV LHYPGMNHRV EITEGILADE CAALLCTFFR MPRQVFNAQK KAQSSTD
いくつかの実施形態では、TadA*8は、短縮されている。いくつかの実施形態では、短縮されたTadA*8は、全長TadA*8と比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のN末端アミノ酸残基を欠失している。いくつかの実施形態では、短縮されたTadA*8は、全長TadA*8と比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のC末端アミノ酸残基を欠失している。いくつかの実施形態では、アデノシンデアミナーゼバリアントは全長TadA*8である。
一実施形態では、本開示の融合タンパク質は、Cas9ニッカーゼに連結された本明細書に記載のアデノシンデアミナーゼバリアント(例えば、TadA*8)に連結された野生型TadAを含む。特定の実施形態では、融合タンパク質は、単一の(例えば、単量体として提供される)TadA*8ドメインを含む。他の実施形態では、塩基編集体は、ヘテロ二量体を形成することができるTadA*8及びTadA (wt)を含む。
CからTへの編集
いくつかの実施形態では、本明細書に開示する塩基編集体は、ポリヌクレオチドの標的シチジン(C)塩基を脱アミノ化して、チミンの塩基対形成特性を有するウリジン(U)を生成することができるシチジンデアミナーゼを含む融合タンパク質を含む。いくつかの実施形態では、例えば、ポリヌクレオチドが二本鎖(例えば、DNA)である場合、次いで、ウリジン塩基を(例えば、細胞修復機構によって)チミジン塩基で置換して、C:GからT:Aへの転移を生じさせることができる。他の実施形態では、塩基編集体による核酸中のCからUへの脱アミノ化は、UからTへの置換を伴うことはできない。
ポリヌクレオチド中の標的Cを脱アミノ化してUを生じさせることは、本明細書に記載の塩基編集体によって実行し得る塩基編集のタイプの非限定的な例である。別の例では、シチジンデアミナーゼドメインを含む塩基編集体は、シトシン(C)塩基からグアニン(G)塩基への転換を媒介することができる。例えば、塩基編集体のシチジンデアミナーゼドメインによるシチジンの脱アミノ化によって生成されるポリヌクレオチドのUは、塩基除去修復機構によって(例えば、ウラシルDNAグリコシラーゼ(UDG)ドメインによって)ポリヌクレオチドから切除され、脱塩基部位が生成され得る。次いで、脱塩基部位の反対側の核酸塩基を、例えば、損傷乗り越えポリメラーゼによって、Cなどの別の塩基で(例えば、塩基修復機構によって)置換することができる。脱塩基部位の反対側の核酸塩基がCで置換されるのが一般的であるが、他の置換(例えば、A、GまたはT)も生じ得る。
したがって、いくつかの実施形態では、本明細書に記載の塩基編集体は、ポリヌクレオチド中の標的CをUに脱アミノ化することができる脱アミノ化ドメイン(例えば、シチジンデアミナーゼドメイン)を含む。さらに、以下に記載するように、いくつかの実施形態では、塩基編集体は、脱アミノ化で生じるUからTまたはGへの転換を容易にする追加のドメインを含み得る。例えば、UからTへの置換を媒介してCからTへの塩基編集事象を完了させるために、シチジンデアミナーゼドメインを含む塩基編集体に、さらに、ウラシルグリコシラーゼ阻害因子(UGI)ドメインを含めることができる。別の例では、損傷乗り越えポリメラーゼが、脱塩基部位の反対側のCの組み込みを促進する(すなわち、脱塩基部位でのGの組み込みをもたらし、CからGへの塩基編集事象を完了する)ことができることから、塩基編集体に損傷乗り越えポリメラーゼを組み込み、CからGへの塩基編集の効率を向上させることができる。
ドメインとしてシチジンデアミナーゼを含む塩基編集体は、DNA、RNA、及びDNA-RNAハイブリッドを含む任意のポリヌクレオチドの標的Cを脱アミノ化することができる。通常、シチジンデアミナーゼは、ポリヌクレオチドの一本鎖部分に関連して配置される核酸塩基Cを触媒する。いくつかの実施形態では、標的Cを含むポリヌクレオチド全体は、一本鎖であり得る。例えば、塩基編集体に組み込まれたシチジンデアミナーゼは、一本鎖RNAポリヌクレオチドの標的Cを脱アミノ化することができる。他の実施形態では、シチジンデアミナーゼドメインを含む塩基編集体は、二本鎖ポリヌクレオチドに作用することができるが、標的Cは、脱アミノ化反応の時点で一本鎖状態にあるポリヌクレオチドの部分に配置することができる。例えば、NAGPBドメインがCas9ドメインを含む実施形態では、Cas9-gRNA-標的DNA複合体の形成中にいくつかのヌクレオチドを対合させないままにしておくことができ、その結果、Cas9「Rループ複合体」が形成される。これらの対合していないヌクレオチドは、一本鎖DNAのバブルを形成し、一本鎖特異的ヌクレオチドデアミナーゼ酵素(例えば、シチジンデアミナーゼ)の基質として機能し得る。
いくつかの実施形態では、塩基編集体のシチジンデアミナーゼは、アポリポタンパク質B mRNA編集複合体(APOBEC)ファミリーデアミナーゼの全部または一部を含み得る。APOBECは、進化的に保存されたシチジンデアミナーゼのファミリーである。このファミリーのメンバーは、CからUへの編集酵素である。APOBEC様タンパク質のN末端ドメインは触媒ドメインであり、一方、C末端ドメインは疑似触媒ドメインである。より具体的には、触媒ドメインは、亜鉛依存性シチジンデアミナーゼドメインであり、シチジン脱アミノ化に重要である。APOBECファミリーのメンバーには、APOBEC1、APOBEC2、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D (「APOBEC3E」はこれを指す)、APOBEC3F、APOBEC3G、APOBEC3H、APOBEC4、及び活性化誘導(シチジン)デアミナーゼが含まれる。いくつかの実施形態では、塩基編集体に組み込まれたデアミナーゼは、APOBEC1デアミナーゼの全部または一部を含む。いくつかの実施形態では、塩基編集体に組み込まれたデアミナーゼは、APOBEC2デアミナーゼの全部または一部を含む。いくつかの実施形態では、塩基編集体に組み込まれたデアミナーゼは、APOBEC3デアミナーゼの全部または一部を含む。いくつかの実施形態では、塩基編集体に組み込まれたデアミナーゼは、APOBEC3Aデアミナーゼの全部または一部を含む。いくつかの実施形態では、塩基編集体に組み込まれたデアミナーゼは、APOBEC3Bデアミナーゼの全部または一部を含む。いくつかの実施形態では、塩基編集体に組み込まれたデアミナーゼは、APOBEC3Cデアミナーゼの全部または一部を含む。いくつかの実施形態では、塩基編集体に組み込まれたデアミナーゼは、APOBEC3Dデアミナーゼの全部または一部を含む。いくつかの実施形態では、塩基編集体に組み込まれたデアミナーゼは、APOBEC3Eデアミナーゼの全部または一部を含む。いくつかの実施形態では、塩基編集体に組み込まれたデアミナーゼは、APOBEC3Fデアミナーゼの全部または一部を含む。いくつかの実施形態では、塩基編集体に組み込まれたデアミナーゼは、APOBEC3Gデアミナーゼの全部または一部を含む。いくつかの実施形態では、塩基編集体に組み込まれたデアミナーゼは、APOBEC3Hデアミナーゼの全部または一部を含む。いくつかの実施形態では、塩基編集体に組み込まれたデアミナーゼは、APOBEC4デアミナーゼの全部または一部を含む。いくつかの実施形態では、塩基編集体に組み込まれたデアミナーゼは、活性誘導デアミナーゼ(AID)の全部または一部を含む。いくつかの実施形態では、塩基編集体に組み込まれたデアミナーゼは、シチジンデアミナーゼ1 (CDA1)の全部または一部を含む。塩基編集体は、任意の適切な生物(例えば、ヒトまたはラット)由来のデアミナーゼを含み得ることを理解すべきである。いくつかの実施形態では、塩基編集体のデアミナーゼドメインは、ヒト、チンパンジー、ゴリラ、サル、ウシ、イヌ、ラット、またはマウスに由来する。いくつかの実施形態では、塩基編集体のデアミナーゼドメインは、ラット(例えば、ラットAPOBEC1)に由来する。いくつかの実施形態では、塩基編集体のデアミナーゼドメインは、ヒトAPOBEC1である。いくつかの実施形態では、塩基編集体のデアミナーゼドメインは、pmCDA1である。
PmCDA1のアミノ酸配列及び核酸配列を以下に示す:
>tr|A5H718|A5H718_PETMAシトシンデアミナーゼ OS=Petromyzon marinus OX=7757 PE=2 SV=1 アミノ酸配列:
MTDAEYVRIHEKLDIYTFKKQFFNNKKSVSHRCYVLFELKRRGERRACFWGYAVNKPQSGTERGIHAEIFSIRKVEEYLRDNPGQFTINWYSSWSPCADCAEKILEWYNQELRGNGHTLKIWACKLYYEKNARNQIGLWNLRDNGVGLNVMVSEHYQCCRKIFIQSSHNQLNENRWLEKTLKRAEKRRSELSIMIQVKILHTTKSPAV
核酸配列:>EF094822.1 Petromyzon marinus分離株 PmCDA.21シトシンデアミナーゼmRNA、完全コード配列:
TGACACGACACAGCCGTGTATATGAGGAAGGGTAGCTGGATGGGGGGGGGGGGAATACGTTCAGAGAGGACATTAGCGAGCGTCTTGTTGGTGGCCTTGAGTCTAGACACCTGCAGACATGACCGACGCTGAGTACGTGAGAATCCATGAGAAGTTGGACATCTACACGTTTAAGAAACAGTTTTTCAACAACAAAAAATCCGTGTCGCATAGATGCTACGTTCTCTTTGAATTAAAACGACGGGGTGAACGTAGAGCGTGTTTTTGGGGCTATGCTGTGAATAAACCACAGAGCGGGACAGAACGTGGAATTCACGCCGAAATCTTTAGCATTAGAAAAGTCGAAGAATACCTGCGCGACAACCCCGGACAATTCACGATAAATTGGTACTCATCCTGGAGTCCTTGTGCAGATTGCGCTGAAAAGATCTTAGAATGGTATAACCAGGAGCTGCGGGGGAACGGCCACACTTTGAAAATCTGGGCTTGCAAACTCTATTACGAGAAAAATGCGAGGAATCAAATTGGGCTGTGGAACCTCAGAGATAACGGGGTTGGGTTGAATGTAATGGTAAGTGAACACTACCAATGTTGCAGGAAAATATTCATCCAATCGTCGCACAATCAATTGAATGAGAATAGATGGCTTGAGAAGACTTTGAAGCGAGCTGAAAAACGACGGAGCGAGTTGTCCATTATGATTCAGGTAAAAATACTCCACACCACTAAGAGTCCTGCTGTTTAAGAGGCTATGCGGATGGTTTTC
ヒト活性化誘導シチジンデアミナーゼ(AID)のコード配列(CDS)のアミノ酸配列及び核酸配列を以下に示す。
>tr|Q6QJ80|Q6QJ80_HUMAN活性化誘導シチジンデアミナーゼ OS=ホモサピエンス OX=9606 GN=AICDA PE=2 SV=1 アミノ酸配列:
MDSLLMNRRKFLYQFKNVRWAKGRRETYLCYVVKRRDSATSFSLDFGYLRNKNGCHVELL
FLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGNPNLSLRIFTARLYFCEDRK
AEPEGLRRLHRAGVQIAIMTFKAPV
ヒト活性化誘導シチジンデアミナーゼ(AID)のコード配列(CDS)のアミノ酸配列及び核酸配列を以下に示す。
>tr|Q6QJ80|Q6QJ80_HUMAN活性化誘導シチジンデアミナーゼ OS=ホモサピエンス OX=9606 GN=AICDA PE=2 SV=1 アミノ酸配列:
MDSLLMNRRKFLYQFKNVRWAKGRRETYLCYVVKRRDSATSFSLDFGYLRNKNGCHVELL
FLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGNPNLSLRIFTARLYFCEDRK
AEPEGLRRLHRAGVQIAIMTFKAPV
核酸配列:>NG_011588.1:5001-15681 ホモサピエンス活性化誘導シチジンデアミナーゼ(AICDA)、染色体12のRefSeqGene (LRG_17):
AGAGAACCATCATTAATTGAAGTGAGATTTTTCTGGCCTGAGACTTGCAGGGAGGCAAGAAGACACTCTGGACACCACTATGGACAGGTAAAGAGGCAGTCTTCTCGTGGGTGATTGCACTGGCCTTCCTCTCAGAGCAAATCTGAGTAATGAGACTGGTAGCTATCCCTTTCTCTCATGTAACTGTCTGACTGATAAGATCAGCTTGATCAATATGCATATATATTTTTTGATCTGTCTCCTTTTCTTCTATTCAGATCTTATACGCTGTCAGCCCAATTCTTTCTGTTTCAGACTTCTCTTGATTTCCCTCTTTTTCATGTGGCAAAAGAAGTAGTGCGTACAATGTACTGATTCGTCCTGAGATTTGTACCATGGTTGAAACTAATTTATGGTAATAATATTAACATAGCAAATCTTTAGAGACTCAAATCATGAAAAGGTAATAGCAGTACTGTACTAAAAACGGTAGTGCTAATTTTCGTAATAATTTTGTAAATATTCAACAGTAAAACAACTTGAAGACACACTTTCCTAGGGAGGCGTTACTGAAATAATTTAGCTATAGTAAGAAAATTTGTAATTTTAGAAATGCCAAGCATTCTAAATTAATTGCTTGAAAGTCACTATGATTGTGTCCATTATAAGGAGACAAATTCATTCAAGCAAGTTATTTAATGTTAAAGGCCCAATTGTTAGGCAGTTAATGGCACTTTTACTATTAACTAATCTTTCCATTTGTTCAGACGTAGCTTAACTTACCTCTTAGGTGTGAATTTGGTTAAGGTCCTCATAATGTCTTTATGTGCAGTTTTTGATAGGTTATTGTCATAGAACTTATTCTATTCCTACATTTATGATTACTATGGATGTATGAGAATAACACCTAATCCTTATACTTTACCTCAATTTAACTCCTTTATAAAGAACTTACATTACAGAATAAAGATTTTTTAAAAATATATTTTTTTGTAGAGACAGGGTCTTAGCCCAGCCGAGGCTGGTCTCTAAGTCCTGGCCCAAGCGATCCTCCTGCCTGGGCCTCCTAAAGTGCTGGAATTATAGACATGAGCCATCACATCCAATATACAGAATAAAGATTTTTAATGGAGGATTTAATGTTCTTCAGAAAATTTTCTTGAGGTCAGACAATGTCAAATGTCTCCTCAGTTTACACTGAGATTTTGAAAACAAGTCTGAGCTATAGGTCCTTGTGAAGGGTCCATTGGAAATACTTGTTCAAAGTAAAATGGAAAGCAAAGGTAAAATCAGCAGTTGAAATTCAGAGAAAGACAGAAAAGGAGAAAAGATGAAATTCAACAGGACAGAAGGGAAATATATTATCATTAAGGAGGACAGTATCTGTAGAGCTCATTAGTGATGGCAAAATGACTTGGTCAGGATTATTTTTAACCCGCTTGTTTCTGGTTTGCACGGCTGGGGATGCAGCTAGGGTTCTGCCTCAGGGAGCACAGCTGTCCAGAGCAGCTGTCAGCCTGCAAGCCTGAAACACTCCCTCGGTAAAGTCCTTCCTACTCAGGACAGAAATGACGAGAACAGGGAGCTGGAAACAGGCCCCTAACCAGAGAAGGGAAGTAATGGATCAACAAAGTTAACTAGCAGGTCAGGATCACGCAATTCATTTCACTCTGACTGGTAACATGTGACAGAAACAGTGTAGGCTTATTGTATTTTCATGTAGAGTAGGACCCAAAAATCCACCCAAAGTCCTTTATCTATGCCACATCCTTCTTATCTATACTTCCAGGACACTTTTTCTTCCTTATGATAAGGCTCTCTCTCTCTCCACACACACACACACACACACACACACACACACACACACACACACAAACACACACCCCGCCAACCAAGGTGCATGTAAAAAGATGTAGATTCCTCTGCCTTTCTCATCTACACAGCCCAGGAGGGTAAGTTAATATAAGAGGGATTTATTGGTAAGAGATGATGCTTAATCTGTTTAACACTGGGCCTCAAAGAGAGAATTTCTTTTCTTCTGTACTTATTAAGCACCTATTATGTGTTGAGCTTATATATACAAAGGGTTATTATATGCTAATATAGTAATAGTAATGGTGGTTGGTACTATGGTAATTACCATAAAAATTATTATCCTTTTAAAATAAAGCTAATTATTATTGGATCTTTTTTAGTATTCATTTTATGTTTTTTATGTTTTTGATTTTTTAAAAGACAATCTCACCCTGTTACCCAGGCTGGAGTGCAGTGGTGCAATCATAGCTTTCTGCAGTCTTGAACTCCTGGGCTCAAGCAATCCTCCTGCCTTGGCCTCCCAAAGTGTTGGGATACAGTCATGAGCCACTGCATCTGGCCTAGGATCCATTTAGATTAAAATATGCATTTTAAATTTTAAAATAATATGGCTAATTTTTACCTTATGTAATGTGTATACTGGCAATAAATCTAGTTTGCTGCCTAAAGTTTAAAGTGCTTTCCAGTAAGCTTCATGTACGTGAGGGGAGACATTTAAAGTGAAACAGACAGCCAGGTGTGGTGGCTCACGCCTGTAATCCCAGCACTCTGGGAGGCTGAGGTGGGTGGATCGCTTGAGCCCTGGAGTTCAAGACCAGCCTGAGCAACATGGCAAAACGCTGTTTCTATAACAAAAATTAGCCGGGCATGGTGGCATGTGCCTGTGGTCCCAGCTACTAGGGGGCTGAGGCAGGAGAATCGTTGGAGCCCAGGAGGTCAAGGCTGCACTGAGCAGTGCTTGCGCCACTGCACTCCAGCCTGGGTGACAGGACCAGACCTTGCCTCAAAAAAATAAGAAGAAAAATTAAAAATAAATGGAAACAACTACAAAGAGCTGTTGTCCTAGATGAGCTACTTAGTTAGGCTGATATTTTGGTATTTAACTTTTAAAGTCAGGGTCTGTCACCTGCACTACATTATTAAAATATCAATTCTCAATGTATATCCACACAAAGACTGGTACGTGAATGTTCATAGTACCTTTATTCACAAAACCCCAAAGTAGAGACTATCCAAATATCCATCAACAAGTGAACAAATAAACAAAATGTGCTATATCCATGCAATGGAATACCACCCTGCAGTACAAAGAAGCTACTTGGGGATGAATCCCAAAGTCATGACGCTAAATGAAAGAGTCAGACATGAAGGAGGAGATAATGTATGCCATACGAAATTCTAGAAAATGAAAGTAACTTATAGTTACAGAAAGCAAATCAGGGCAGGCATAGAGGCTCACACCTGTAATCCCAGCACTTTGAGAGGCCACGTGGGAAGATTGCTAGAACTCAGGAGTTCAAGACCAGCCTGGGCAACACAGTGAAACTCCATTCTCCACAAAAATGGGAAAAAAAGAAAGCAAATCAGTGGTTGTCCTGTGGGGAGGGGAAGGACTGCAAAGAGGGAAGAAGCTCTGGTGGGGTGAGGGTGGTGATTCAGGTTCTGTATCCTGACTGTGGTAGCAGTTTGGGGTGTTTACATCCAAAAATATTCGTAGAATTATGCATCTTAAATGGGTGGAGTTTACTGTATGTAAATTATACCTCAATGTAAGAAAAAATAATGTGTAAGAAAACTTTCAATTCTCTTGCCAGCAAACGTTATTCAAATTCCTGAGCCCTTTACTTCGCAAATTCTCTGCACTTCTGCCCCGTACCATTAGGTGACAGCACTAGCTCCACAAATTGGATAAATGCATTTCTGGAAAAGACTAGGGACAAAATCCAGGCATCACTTGTGCTTTCATATCAACCATGCTGTACAGCTTGTGTTGCTGTCTGCAGCTGCAATGGGGACTCTTGATTTCTTTAAGGAAACTTGGGTTACCAGAGTATTTCCACAAATGCTATTCAAATTAGTGCTTATGATATGCAAGACACTGTGCTAGGAGCCAGAAAACAAAGAGGAGGAGAAATCAGTCATTATGTGGGAACAACATAGCAAGATATTTAGATCATTTTGACTAGTTAAAAAAGCAGCAGAGTACAAAATCACACATGCAATCAGTATAATCCAAATCATGTAAATATGTGCCTGTAGAAAGACTAGAGGAATAAACACAAGAATCTTAACAGTCATTGTCATTAGACACTAAGTCTAATTATTATTATTAGACACTATGATATTTGAGATTTAAAAAATCTTTAATATTTTAAAATTTAGAGCTCTTCTATTTTTCCATAGTATTCAAGTTTGACAATGATCAAGTATTACTCTTTCTTTTTTTTTTTTTTTTTTTTTTTTTGAGATGGAGTTTTGGTCTTGTTGCCCATGCTGGAGTGGAATGGCATGACCATAGCTCACTGCAACCTCCACCTCCTGGGTTCAAGCAAAGCTGTCGCCTCAGCCTCCCGGGTAGATGGGATTACAGGCGCCCACCACCACACTCGGCTAATGTTTGTATTTTTAGTAGAGATGGGGTTTCACCATGTTGGCCAGGCTGGTCTCAAACTCCTGACCTCAGAGGATCCACCTGCCTCAGCCTCCCAAAGTGCTGGGATTACAGATGTAGGCCACTGCGCCCGGCCAAGTATTGCTCTTATACATTAAAAAACAGGTGTGAGCCACTGCGCCCAGCCAGGTATTGCTCTTATACATTAAAAAATAGGCCGGTGCAGTGGCTCACGCCTGTAATCCCAGCACTTTGGGAAGCCAAGGCGGGCAGAACACCCGAGGTCAGGAGTCCAAGGCCAGCCTGGCCAAGATGGTGAAACCCCGTCTCTATTAAAAATACAAACATTACCTGGGCATGATGGTGGGCGCCTGTAATCCCAGCTACTCAGGAGGCTGAGGCAGGAGGATCCGCGGAGCCTGGCAGATCTGCCTGAGCCTGGGAGGTTGAGGCTACAGTAAGCCAAGATCATGCCAGTATACTTCAGCCTGGGCGACAAAGTGAGACCGTAACAAAAAAAAAAAAATTTAAAAAAAGAAATTTAGATCAAGATCCAACTGTAAAAAGTGGCCTAAACACCACATTAAAGAGTTTGGAGTTTATTCTGCAGGCAGAAGAGAACCATCAGGGGGTCTTCAGCATGGGAATGGCATGGTGCACCTGGTTTTTGTGAGATCATGGTGGTGACAGTGTGGGGAATGTTATTTTGGAGGGACTGGAGGCAGACAGACCGGTTAAAAGGCCAGCACAACAGATAAGGAGGAAGAAGATGAGGGCTTGGACCGAAGCAGAGAAGAGCAAACAGGGAAGGTACAAATTCAAGAAATATTGGGGGGTTTGAATCAACACATTTAGATGATTAATTAAATATGAGGACTGAGGAATAAGAAATGAGTCAAGGATGGTTCCAGGCTGCTAGGCTGCTTACCTGAGGTGGCAAAGTCGGGAGGAGTGGCAGTTTAGGACAGGGGGCAGTTGAGGAATATTGTTTTGATCATTTTGAGTTTGAGGTACAAGTTGGACACTTAGGTAAAGACTGGAGGGGAAATCTGAATATACAATTATGGGACTGAGGAACAAGTTTATTTTATTTTTTGTTTCGTTTTCTTGTTGAAGAACAAATTTAATTGTAATCCCAAGTCATCAGCATCTAGAAGACAGTGGCAGGAGGTGACTGTCTTGTGGGTAAGGGTTTGGGGTCCTTGATGAGTATCTCTCAATTGGCCTTAAATATAAGCAGGAAAAGGAGTTTATGATGGATTCCAGGCTCAGCAGGGCTCAGGAGGGCTCAGGCAGCCAGCAGAGGAAGTCAGAGCATCTTCTTTGGTTTAGCCCAAGTAATGACTTCCTTAAAAAGCTGAAGGAAAATCCAGAGTGACCAGATTATAAACTGTACTCTTGCATTTTCTCTCCCTCCTCTCACCCACAGCCTCTTGATGAACCGGAGGAAGTTTCTTTACCAATTCAAAAATGTCCGCTGGGCTAAGGGTCGGCGTGAGACCTACCTGTGCTACGTAGTGAAGAGGCGTGACAGTGCTACATCCTTTTCACTGGACTTTGGTTATCTTCGCAATAAGGTATCAATTAAAGTCGGCTTTGCAAGCAGTTTAATGGTCAACTGTGAGTGCTTTTAGAGCCACCTGCTGATGGTATTACTTCCATCCTTTTTTGGCATTTGTGTCTCTATCACATTCCTCAAATCCTTTTTTTTATTTCTTTTTCCATGTCCATGCACCCATATTAGACATGGCCCAAAATATGTGATTTAATTCCTCCCCAGTAATGCTGGGCACCCTAATACCACTCCTTCCTTCAGTGCCAAGAACAACTGCTCCCAAACTGTTTACCAGCTTTCCTCAGCATCTGAATTGCCTTTGAGATTAATTAAGCTAAAAGCATTTTTATATGGGAGAATATTATCAGCTTGTCCAAGCAAAAATTTTAAATGTGAAAAACAAATTGTGTCTTAAGCATTTTTGAAAATTAAGGAAGAAGAATTTGGGAAAAAATTAACGGTGGCTCAATTCTGTCTTCCAAATGATTTCTTTTCCCTCCTACTCACATGGGTCGTAGGCCAGTGAATACATTCAACATGGTGATCCCCAGAAAACTCAGAGAAGCCTCGGCTGATGATTAATTAAATTGATCTTTCGGCTACCCGAGAGAATTACATTTCCAAGAGACTTCTTCACCAAAATCCAGATGGGTTTACATAAACTTCTGCCCACGGGTATCTCCTCTCTCCTAACACGCTGTGACGTCTGGGCTTGGTGGAATCTCAGGGAAGCATCCGTGGGGTGGAAGGTCATCGTCTGGCTCGTTGTTTGATGGTTATATTACCATGCAATTTTCTTTGCCTACATTTGTATTGAATACATCCCAATCTCCTTCCTATTCGGTGACATGACACATTCTATTTCAGAAGGCTTTGATTTTATCAAGCACTTTCATTTACTTCTCATGGCAGTGCCTATTACTTCTCTTACAATACCCATCTGTCTGCTTTACCAAAATCTATTTCCCCTTTTCAGATCCTCCCAAATGGTCCTCATAAACTGTCCTGCCTCCACCTAGTGGTCCAGGTATATTTCCACAATGTTACATCAACAGGCACTTCTAGCCATTTTCCTTCTCAAAAGGTGCAAAAAGCAACTTCATAAACACAAATTAAATCTTCGGTGAGGTAGTGTGATGCTGCTTCCTCCCAACTCAGCGCACTTCGTCTTCCTCATTCCACAAAAACCCATAGCCTTCCTTCACTCTGCAGGACTAGTGCTGCCAAGGGTTCAGCTCTACCTACTGGTGTGCTCTTTTGAGCAAGTTGCTTAGCCTCTCTGTAACACAAGGACAATAGCTGCAAGCATCCCCAAAGATCATTGCAGGAGACAATGACTAAGGCTACCAGAGCCGCAATAAAAGTCAGTGAATTTTAGCGTGGTCCTCTCTGTCTCTCCAGAACGGCTGCCACGTGGAATTGCTCTTCCTCCGCTACATCTCGGACTGGGACCTAGACCCTGGCCGCTGCTACCGCGTCACCTGGTTCACCTCCTGGAGCCCCTGCTACGACTGTGCCCGACATGTGGCCGACTTTCTGCGAGGGAACCCCAACCTCAGTCTGAGGATCTTCACCGCGCGCCTCTACTTCTGTGAGGACCGCAAGGCTGAGCCCGAGGGGCTGCGGCGGCTGCACCGCGCCGGGGTGCAAATAGCCATCATGACCTTCAAAGGTGCGAAAGGGCCTTCCGCGCAGGCGCAGTGCAGCAGCCCGCATTCGGGATTGCGATGCGGAATGAATGAGTTAGTGGGGAAGCTCGAGGGGAAGAAGTGGGCGGGGATTCTGGTTCACCTCTGGAGCCGAAATTAAAGATTAGAAGCAGAGAAAAGAGTGAATGGCTCAGAGACAAGGCCCCGAGGAAATGAGAAAATGGGGCCAGGGTTGCTTCTTTCCCCTCGATTTGGAACCTGAACTGTCTTCTACCCCCATATCCCCGCCTTTTTTTCCTTTTTTTTTTTTTGAAGATTATTTTTACTGCTGGAATACTTTTGTAGAAAACCACGAAAGAACTTTCAAAGCCTGGGAAGGGCTGCATGAAAATTCAGTTCGTCTCTCCAGACAGCTTCGGCGCATCCTTTTGGTAAGGGGCTTCCTCGCTTTTTAAATTTTCTTTCTTTCTCTACAGTCTTTTTTGGAGTTTCGTATATTTCTTATATTTTCTTATTGTTCAATCACTCTCAGTTTTCATCTGATGAAAACTTTATTTCTCCTCCACATCAGCTTTTTCTTCTGCTGTTTCACCATTCAGAGCCCTCTGCTAAGGTTCCTTTTCCCTCCCTTTTCTTTCTTTTGTTGTTTCACATCTTTAAATTTCTGTCTCTCCCCAGGGTTGCGTTTCCTTCCTGGTCAGAATTCTTTTCTCCTTTTTTTTTTTTTTTTTTTTTTTTTTTAAACAAACAAACAAAAAACCCAAAAAAACTCTTTCCCAATTTACTTTCTTCCAACATGTTACAAAGCCATCCACTCAGTTTAGAAGACTCTCCGGCCCCACCGACCCCCAACCTCGTTTTGAAGCCATTCACTCAATTTGCTTCTCTCTTTCTCTACAGCCCCTGTATGAGGTTGATGACTTACGAGACGCATTTCGTACTTTGGGACTTTGATAGCAACTTCCAGGAATGTCACACACGATGAAATATCTCTGCTGAAGACAGTGGATAAAAAACAGTCCTTCAAGTCTTCTCTGTTTTTATTCTTCAACTCTCACTTTCTTAGAGTTTACAGAAAAAATATTTATATACGACTCTTTAAAAAGATCTATGTCTTGAAAATAGAGAAGGAACACAGGTCTGGCCAGGGACGTGCTGCAATTGGTGCAGTTTTGAATGCAACATTGTCCCCTACTGGGAATAACAGAACTGCAGGACCTGGGAGCATCCTAAAGTGTCAACGTTTTTCTATGACTTTTAGGTAGGATGAGAGCAGAAGGTAGATCCTAAAAAGCATGGTGAGAGGATCAAATGTTTTTATATCAACATCCTTTATTATTTGATTCATTTGAGTTAACAGTGGTGTTAGTGATAGATTTTTCTATTCTTTTCCCTTGACGTTTACTTTCAAGTAACACAAACTCTTCCATCAGGCCATGATCTATAGGACCTCCTAATGAGAGTATCTGGGTGATTGTGACCCCAAACCATCTCTCCAAAGCATTAATATCCAATCATGCGCTGTATGTTTTAATCAGCAGAAGCATGTTTTTATGTTTGTACAAAAGAAGATTGTTATGGGTGGGGATGGAGGTATAGACCATGCATGGTCACCTTCAAGCTACTTTAATAAAGGATCTTAAAATGGGCAGGAGGACTGTGAACAAGACACCCTAATAATGGGTTGATGTCTGAAGTAGCAAATCTTCTGGAAACGCAAACTCTTTTAAGGAAGTCCCTAATTTAGAAACACCCACAAACTTCACATATCATAATTAGCAAACAATTGGAAGGAAGTTGCTTGAATGTTGGGGAGAGGAAAATCTATTGGCTCTCGTGGGTCTCTTCATCTCAGAAATGCCAATCAGGTCAAGGTTTGCTACATTTTGTATGTGTGTGATGCTTCTCCCAAAGGTATATTAACTATATAAGAGAGTTGTGACAAAACAGAATGATAAAGCTGCGAACCGTGGCACACGCTCATAGTTCTAGCTGCTTGGGAGGTTGAGGAGGGAGGATGGCTTGAACACAGGTGTTCAAGGCCAGCCTGGGCAACATAACAAGATCCTGTCTCTCAAAAAAAAAAAAAAAAAAAAGAAAGAGAGAGGGCCGGGCGTGGTGGCTCACGCCTGTAATCCCAGCACTTTGGGAGGCCGAGCCGGGCGGATCACCTGTGGTCAGGAGTTTGAGACCAGCCTGGCCAACATGGCAAAACCCCGTCTGTACTCAAAATGCAAAAATTAGCCAGGCGTGGTAGCAGGCACCTGTAATCCCAGCTACTTGGGAGGCTGAGGCAGGAGAATCGCTTGAACCCAGGAGGTGGAGGTTGCAGTAAGCTGAGATCGTGCCGTTGCACTCCAGCCTGGGCGACAAGAGCAAGACTCTGTCTCAGAAAAAAAAAAAAAAAAGAGAGAGAGAGAGAAAGAGAACAATATTTGGGAGAGAAGGATGGGGAAGCATTGCAAGGAAATTGTGCTTTATCCAACAAAATGTAAGGAGCCAATAAGGGATCCCTATTTGTCTCTTTTGGTGTCTATTTGTCCCTAACAACTGTCTTTGACAGTGAGAAAAATATTCAGAATAACCATATCCCTGTGCCGTTATTACCTAGCAACCCTTGCAATGAAGATGA

GCAGATCCACAGGAAAACTTGAATGCACAACTGTCTTATTTTAATCTTATTGTACATAAGTTTGTAAAAGAGTTAAAAATTGTTACTTCATGTATTCATTTATATTTTATATTATTTTGCGTCTAATGATTTTTTATTAACATGATTTCCTTTTCTGATATATTGAAATGGAGTCTCAAAGCTTCATAAATTTATAACTTTAGAAATGATTCTAATAACAACGTATGTAATTGTAACATTGCAGTAATGGTGCTACGAAGCCATTTCTCTTGATTTTTAGTAAACTTTTATGACAGCAAATTTGCTTCTGGCTCACTTTCAATCAGTTAAATAAATGATAAATAATTTTGGAAGCTGTGAAGATAAAATACCAAATAAAATAATATAAAAGTGATTTATATGAAGTTAAAATAAAAAATCAGTATGATGGAATAAACTTG
本開示の態様に従ってCas9に融合することができる他の例示的なデアミナーゼを以下に示す。実施形態では、デアミナーゼは活性化誘導デアミナーゼ(AID)である。いくつかの実施形態では、それぞれの配列の活性ドメイン、例えば、局在化シグナル(核外輸送シグナルのない核局在化配列、細胞質局在化シグナル)を含まないドメインを使用することができることを理解すべきである。
ヒトAID:
Figure 2022532139000033
マウスAID:
Figure 2022532139000034
イヌAID:
Figure 2022532139000035
ウシAID:
Figure 2022532139000036
ラットAID:
Figure 2022532139000037
clAID (Canis lupus familiaris):
MDSLLMKQRKFLYHFKNVRWAKGRHETYLCYVVKRRDSATSFSLDFGHLRNKSGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGYPNLSLRIFAARLYFCEDRKAEPEGLRRLHRAGVQIAIMTFKDYFYCWNTFVENREKTFKAWEGLHENSVRLSRQLRRILLPLYEVDDLRDAFRTLGL
btAID (Bos Taurus):
MDSLLKKQRQFLYQFKNVRWAKGRHETYLCYVVKRRDSPTSFSLDFGHLRNKAGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGYPNLSLRIFTARLYFCDKERKAEPEGLRRLHRAGVQIAIMTFKDYFYCWNTFVENHERTFKAWEGLHENSVRLSRQLRRILLPLYEVDDLRDAFRTLGL
mAID (Mus musculus):
MDSLLMNRRKFLYQFKNVRWAKGRRETYLCYVVKRRDSATSFSLDFGYLRNKNGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGNPNLSLRIFTARLYFCEDRKAEPEGLRRLHRAGVQIAIMTFKDYFYCWNTFVENHERTFKAWEGLHENSVRLSRQLRRILLPLYEVDDLRDAFRTLGL
rAPOBEC-1 (Rattus norvegicus):
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLK
maAPOBEC-1 (Mesocricetus auratus):
MSSETGPVVVDPTLRRRIEPHEFDAFFDQGELRKETCLLYEIRWGGRHNIWRHTGQNTSRHVEINFIEKFTSERYFYPSTRCSIVWFLSWSPCGECSKAITEFLSGHPNVTLFIYAARLYHHTDQRNRQGLRDLISRGVTIRIMTEQEYCYCWRNFVNYPPSNEVYWPRYPNLWMRLYALELYCIHLGLPPCLKIKRRHQYPLTFFRLNLQSCHYQRIPPHILWATGFI
ppAPOBEC-1 (Pongo pygmaeus):
MTSEKGPSTGDPTLRRRIESWEFDVFYDPRELRKETCLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERRFHSSISCSITWFLSWSPCWECSQAIREFLSQHPGVTLVIYVARLFWHMDQRNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLAFFRLHLQNCHYQTIPPHILLATGLIHPSVTWR
ocAPOBEC1 (Oryctolagus cuniculus):
MASEKGPSNKDYTLRRRIEPWEFEVFFDPQELRKEACLLYEIKWGASSKTWRSSGKNTTNHVEVNFLEKLTSEGRLGPSTCCSITWFLSWSPCWECSMAIREFLSQHPGVTLIIFVARLFQHMDRRNRQGLKDLVTSGVTVRVMSVSEYCYCWENFVNYPPGKAAQWPRYPPRWMLMYALELYCIILGLPPCLKISRRHQKQLTFFSLTPQYCHYKMIPPYILLATGLLQPSVPWR
mdAPOBEC-1 (Monodelphis domestica):
MNSKTGPSVGDATLRRRIKPWEFVAFFNPQELRKETCLLYEIKWGNQNIWRHSNQNTSQHAEINFMEKFTAERHFNSSVRCSITWFLSWSPCWECSKAIRKFLDHYPNVTLAIFISRLYWHMDQQHRQGLKELVHSGVTIQIMSYSEYHYCWRNFVDYPQGEEDYWPKYPYLWIMLYVLELHCIILGLPPCLKISGSHSNQLALFSLDLQDCHYQKIPYNVLVATGLVQPFVTWR
ppAPOBEC-2 (Pongo pygmaeus):
MAQKEEAAAATEAASQNGEDLENLDDPEKLKELIELPPFEIVTGERLPANFFKFQFRNVEYSSGRNKTFLCYVVEAQGKGGQVQASRGYLEDEHAAAHAEEAFFNTILPAFDPALRYNVTWYVSSSPCAACADRIIKTLSKTKNLRLLILVGRLFMWEELEIQDALKKLKEAGCKLRIMKPQDFEYVWQNFVEQEEGESKAFQPWEDIQENFLYYEEKLADILK
btAPOBEC-2 (Bos Taurus):
MAQKEEAAAAAEPASQNGEEVENLEDPEKLKELIELPPFEIVTGERLPAHYFKFQFRNVEYSSGRNKTFLCYVVEAQSKGGQVQASRGYLEDEHATNHAEEAFFNSIMPTFDPALRYMVTWYVSSSPCAACADRIVKTLNKTKNLRLLILVGRLFMWEEPEIQAALRKLKEAGCRLRIMKPQDFEYIWQNFVEQEEGESKAFEPWEDIQENFLYYEEKLADILK
mAPOBEC-3-(1)(Mus musculus):
MQPQRLGPRAGMGPFCLGCSHRKCYSPIRNLISQETFKFHFKNLGYAKGRKDTFLCYEVTRKDCDSPVSLHHGVFKNKDNIHAEICFLYWFHDKVLKVLSPREEFKITWYMSWSPCFECAEQIVRFLATHHNLSLDIFSSRLYNVQDPETQQNLCRLVQEGAQVAAMDLYEFKKCWKKFVDNGGRRFRPWKRLLTNFRYQDSKLQEILRPCYISVPSSSSSTLSNICLTKGLPETRFWVEGRRMDPLSEEEFYSQFYNQRVKHLCYYHRMKPYLCYQLEQFNGQAPLKGCLLSEKGKQHAEILFLDKIRSMELSQVTITCYLTWSPCPNCAWQLAAFKRDRPDLILHIYTSRLYFHWKRPFQKGLCSLWQSGILVDVMDLPQFTDCWTNFVNPKRPFWPWKGLEIISRRTQRRLRRIKESWGLQDLVNDFGNLQLGPPMS
マウスAPOBEC-3-(2):
Figure 2022532139000038
ラットAPOBEC-3:
Figure 2022532139000039
hAPOBEC-3A (Homo sapiens):
MEASPASGPRHLMDPHIFTSNFNNGIGRHKTYLCYEVERLDNGTSVKMDQHRGFLHNQAKNLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFISWSPCFSWGCAGEVRAFLQENTHVRLRIFAARIYDYDPLYKEALQMLRDAGAQVSIMTYDEFKHCWDTFVDHQGCPFQPWDGLDEHSQALSGRLRAILQNQGN
hAPOBEC-3F (Homo sapiens):
MKPHFRNTVERMYRDTFSYNFYNRPILSRRNTVWLCYEVKTKGPSRPRLDAKIFRGQVYSQPEHHAEMCFLSWFCGNQLPAYKCFQITWFVSWTPCPDCVAKLAEFLAEHPNVTLTISAARLYYYWERDYRRALCRLSQAGARVKIMDDEEFAYCWENFVYSEGQPFMPWYKFDDNYAFLHRTLKEILRNPMEAMYPHIFYFHFKNLRKAYGRNESWLCFTMEVVKHHSPVSWKRGVFRNQVDPETHCHAERCFLSWFCDDILSPNTNYEVTWYTSWSPCPECAGEVAEFLARHSNVNLTIFTARLYYFWDTDYQEGLRSLSQEGASVEIMGYKDFKYCWENFVYNDDEPFKPWKGLKYNFLFLDSKLQEILE
Rhesus macaque APOBEC-3G:
Figure 2022532139000040
チンパンジーAPOBEC-3G:
Figure 2022532139000041
ミドリザルAPOBEC-3G:
Figure 2022532139000042
ヒトAPOBEC-3G:
Figure 2022532139000043
ヒトAPOBEC-3F:
Figure 2022532139000044
ヒトAPOBEC-3B:
Figure 2022532139000045
ラットAPOBEC-3B:
MQPQGLGPNAGMGPVCLGCSHRRPYSPIRNPLKKLYQQTFYFHFKNVRYAWGRKNNFLCYEVNGMDCALPVPLRQGVFRKQGHIHAELCFIYWFHDKVLRVLSPMEEFKVTWYMSWSPCSKCAEQVARFLAAHRNLSLAIFSSRLYYYLRNPNYQQKLCRLIQEGVHVAAMDLPEFKKCWNKFVDNDGQPFRPWMRLRINFSFYDCKLQEIFSRMNLLREDVFYLQFNNSHRVKPVQNRYYRRKSYLCYQLERANGQEPLKGYLLYKKGEQHVEILFLEKMRSMELSQVRITCYLTWSPCPNCARQLAAFKKDHPDLILRIYTSRLYFWRKKFQKGLCTLWRSGIHVDVMDLPQFADCWTNFVNPQRPFRPWNELEKNSWRIQRRLRRIKESWGL
ウシAPOBEC-3B:
DGWEVAFRSGTVLKAGVLGVSMTEGWAGSGHPGQGACVWTPGTRNTMNLLREVLFKQQFGNQPRVPAPYYRRKTYLCYQLKQRNDLTLDRGCFRNKKQRHAERFIDKINSLDLNPSQSYKIICYITWSPCPNCANELVNFITRNNHLKLEIFASRLYFHWIKSFKMGLQDLQNAGISVAVMTHTEFEDCWEQFVDNQSRPFQPWDKLEQYSASIRRRLQRILTAPI
チンパンジーAPOBEC-3B:
MNPQIRNPMEWMYQRTFYYNFENEPILYGRSYTWLCYEVKIRRGHSNLLWDTGVFRGQMYSQPEHHAEMCFLSWFCGNQLSAYKCFQITWFVSWTPCPDCVAKLAKFLAEHPNVTLTISAARLYYYWERDYRRALCRLSQAGARVKIMDDEEFAYCWENFVYNEGQPFMPWYKFDDNYAFLHRTLKEIIRHLMDPDTFTFNFNNDPLVLRRHQTYLCYEVERLDNGTWVLMDQHMGFLCNEAKNLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFISWSPCFSWGCAGQVRAFLQENTHVRLRIFAARIYDYDPLYKEALQMLRDAGAQVSIMTYDEFEYCWDTFVYRQGCPFQPWDGLEEHSQALSGRLRAILQVRASSLCMVPHRPPPPPQSPGPCLPLCSEPPLGSLLPTGRPAPSLPFLLTASFSFPPPASLPPLPSLSLSPGHLPVPSFHSLTSCSIQPPCSSRIRETEGWASVSKEGRDLG
ヒトAPOBEC-3C:
Figure 2022532139000046
ゴリラAPOBEC-3C
Figure 2022532139000047
ヒトAPOBEC-3A:
Figure 2022532139000048
Rhesus macaque APOBEC-3A:
Figure 2022532139000049
ウシAPOBEC-3A:
Figure 2022532139000050
ヒトAPOBEC-3H:
Figure 2022532139000051
Rhesus macaque APOBEC-3H:
MALLTAKTFSLQFNNKRRVNKPYYPRKALLCYQLTPQNGSTPTRGHLKNKKKDHAEIRFINKIKSMGLDETQCYQVTCYLTWSPCPSCAGELVDFIKAHRHLNLRIFASRLYYHWRPNYQEGLLLLCGSQVPVEVMGLPEFTDCWENFVDHKEPPSFNPSEKLEELDKNSQAIKRRLERIKSRSVDVLENGLRSLQLGPVTPSSSIRNSR
ヒトAPOBEC-3D:
Figure 2022532139000052
ヒトAPOBEC-1:
MTSEKGPSTGDPTLRRRIEPWEFDVFYDPRELRKEACLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERDFHPSMSCSITWFLSWSPCWECSQAIREFLSRHPGVTLVIYVARLFWHMDQQNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLTFFRLHLQNCHYQTIPPHILLATGLIHPSVAWR
マウスAPOBEC-1:
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSVWRHTSQNTSNHVEVNFLEKFTTERYFRPNTRCSITWFLSWSPCGECSRAITEFLSRHPYVTLFIYIARLYHHTDQRNRQGLRDLISSGVTIQIMTEQEYCYCWRNFVNYPPSNEAYWPRYPHLWVKLYVLELYCIILGLPPCLKILRRKQPQLTFFTITLQTCHYQRIPPHLLWATGLK
ラットAPOBEC-1:
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLK
ヒトAPOBEC-2:
MAQKEEAAVATEAASQNGEDLENLDDPEKLKELIELPPFEIVTGERLPANFFKFQFRNVEYSSGRNKTFLCYVVEAQGKGGQVQASRGYLEDEHAAAHAEEAFFNTILPAFDPALRYNVTWYVSSSPCAACADRIIKTLSKTKNLRLLILVGRLFMWEEPEIQAALKKLKEAGCKLRIMKPQDFEYVWQNFVEQEEGESKAFQPWEDIQENFLYYEEKLADILK
マウスAPOBEC-2:
MAQKEEAAEAAAPASQNGDDLENLEDPEKLKELIDLPPFEIVTGVRLPVNFFKFQFRNVEYSSGRNKTFLCYVVEVQSKGGQAQATQGYLEDEHAGAHAEEAFFNTILPAFDPALKYNVTWYVSSSPCAACADRILKTLSKTKNLRLLILVSRLFMWEEPEVQAALKKLKEAGCKLRIMKPQDFEYIWQNFVEQEEGESKAFEPWEDIQENFLYYEEKLADILK
ラットAPOBEC-2:
MAQKEEAAEAAAPASQNGDDLENLEDPEKLKELIDLPPFEIVTGVRLPVNFFKFQFRNVEYSSGRNKTFLCYVVEAQSKGGQVQATQGYLEDEHAGAHAEEAFFNTILPAFDPALKYNVTWYVSSSPCAACADRILKTLSKTKNLRLLILVSRLFMWEEPEVQAALKKLKEAGCKLRIMKPQDFEYLWQNFVEQEEGESKAFEPWEDIQENFLYYEEKLADILK
ウシAPOBEC-2:
MAQKEEAAAAAEPASQNGEEVENLEDPEKLKELIELPPFEIVTGERLPAHYFKFQFRNVEYSSGRNKTFLCYVVEAQSKGGQVQASRGYLEDEHATNHAEEAFFNSIMPTFDPALRYMVTWYVSSSPCAACADRIVKTLNKTKNLRLLILVGRLFMWEEPEIQAALRKLKEAGCRLRIMKPQDFEYIWQNFVEQEEGESKAFEPWEDIQENFLYYEEKLADILK
Petromyzon marinus CDA1 (pmCDAl):
MTDAEYVRIHEKLDIYTFKKQFFNNKKSVSHRCYVLFELKRRGERRACFWGYAVNKPQSGTERGIHAEIFSIRKVEEYLRDNPGQFTINWYSSWSPCADCAEKILEWYNQELRGNGHTLKIWACKLYYEKNARNQIGLWNLRDNGVGLNVMVSEHYQCCRKIFIQSSHNQ LNENRWLEKTLKRAEKRRSELSFMIQVKILHTTKSPAV
ヒトAPOBEC3G D316R D317R:
MKPHFRNTVERMYRDTFSYNFYNRPILSRRNTVWLCYEVKTKGPSRPPLDAKIFRGQVYSELKYHPEMRFFHWFSKWRKLHRDQEYEVTWYISWSPCTKCTRDMATFLAEDPKVTLTIFVARLYYFWDPDYQEALRSLCQKRDGPRATMKFNYDEFQHCWSKFVYSQRELFEPWNNLPKYYILLHFMLGEILRHSMDPPTFTFNFNNEPWVRGRHETYLCYEVERMHNDTWVLLNQRRGFLCNQAPHKHGFLEGRHAELCFLDVIPFWKLDLDQDYRVTCFTSWSPCFSCAQEMAKFISKKHVSLCIFTARIYRRQGRCQEGLRTLAEAGAKISFTYSEFKHCWDTFVDHQGCPFQPWDGLDEHSQDLSGRLRAILQNQEN
ヒトAPOBEC3G A鎖:
MDPPTFTFNFNNEPWWGRHETYLCYEVERMHNDTWVLLNQRRGFLCNQAPHKHGFLEGRHAELCFLDVIPFWKLDLDQDYRVTCFTSWSPCFSCAQEMAKFISKNKHVSLCIFTARIYDDQGRCQEGLRTLAEAGAKISFTYSEFKHCWDTFVDHQGCPFQPWDGLD EHSQDLSGRLRAILQ
ヒトAPOBEC3G A鎖 D120R D121R:
MDPPTFTFNFNNEPWVRGRHETYLCYEVERMHNDTWVLLNQRRGFLCNQAPHKHGFLEGRHAELCFLDVIPFWKLDLDQDYRVTCFTSWSPCFSCAQEMAKFISKNKHVSLCIFTARIYRRQGRCQEGLRTLAEAGAKISFMTYSEFKHCWDTFVDHQGCPFQPWDGLDEHSQDLSGRLRAILQ
hAPOBEC-4 (Homo sapiens):
MEPIYEEYLANHGTIVKPYYWLSFSLDCSNCPYHIRTGEEARVSLTEFCQIFGFPYGTTFPQTKHLTFYELKTSSGSLVQKGHASSCTGNYIHPESMLFEMNGYLDSAIYNNDSIRHIILYSNNSPCNEANHCCISKMYNFLITYPGITLSIYFSQLYHTEMDFPASAWNREALRSLASLWPRVVLSPISGGIWHSVLHSFISGVSGSHVFQPILTGRALADRHNAYEINAITGVKPYFTDVLLQTKRNPNTKAQEALESYPLNNAFPGQFFQMPSGQLQPNLPPDLRAPVVFVLVPLRDLPPMHMGQNPNKPRNIVRHLNMPQMSFQETKDLGRLPTGRSVEIVEITEQFASSKEADEKKKKKGKK
mAPOBEC-4 (Mus musculus):
MDSLLMKQKKFLYHFKNVRWAKGRHETYLCYVVKRRDSATSCSLDFGHLRNKSGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVAEFLRWNPNLSLRIFTARLYFCEDRKAEPEGLRRLHRAGVQIGIMTFKDYFYCWNTFVENRERTFKAWEGLHENSVRLTRQLRRILLPLYEVDDLRDAFRMLGF
rAPOBEC-4 (Rattus norvegicus):
MEPLYEEYLTHSGTIVKPYYWLSVSLNCTNCPYHIRTGEEARVPYTEFHQTFGFPWSTYPQTKHLTFYELRSSSGNLIQKGLASNCTGSHTHPESMLFERDGYLDSLIFHDSNIRHIILYSNNSPCDEANHCCISKMYNFLMNYPEVTLSVFFSQLYHTENQFPTSAWNREALRGLASLWPQVTLSAISGGIWQSILETFVSGISEGLTAVRPFTAGRTLTDRYNAYEINCITEVKPYFTDALHSWQKENQDQKVWAASENQPLHNTTPAQWQPDMSQDCRTPAVFMLVPYRDLPPIHVNPSPQKPRTVVRHLNTLQLSASKVKALRKSPSGRPVKKEEARKGSTRSQEANETNKSKWKKQTLFIKSNICHLLEREQKKIGILSSWSV
mfAPOBEC-4 (Macaca fascicularis):
MEPTYEEYLANHGTIVKPYYWLSFSLDCSNCPYHIRTGEEARVSLTEFCQIFGFPYGTTYPQTKHLTFYELKTSSGSLVQKGHASSCTGNYIHPESMLFEMNGYLDSAIYNNDSIRHIILYCNNSPCNEANHCCISKVYNFLITYPGITLSIYFSQLYHTEMDFPASAWNREALRSLASLWPRVVLSPISGGIWHSVLHSFVSGVSGSHVFQPILTGRALTDRYNAYEINAITGVKPFFTDVLLHTKRNPNTKAQMALESYPLNNAFPGQSFQMTSGIPPDLRAPVVFVLLPLRDLPPMHMGQDPNKPRNIIRHLNMPQMSFQETKDLERLPTRRSVETVEITERFASSKQAEEKTKKKKGKK
pmCDA-1 (Petromyzon marinus):
MAGYECVRVSEKLDFDTFEFQFENLHYATERHRTYVIFDVKPQSAGGRSRRLWGYIINNPNVCHAELILMSMIDRHLESNPGVYAMTWYMSWSPCANCSSKLNPWLKNLLEEQGHTLTMHFSRIYDRDREGDHRGLRGLKHVSNSFRMGVVGRAEVKECLAEYVEASRRTLTWLDTTESMAAKMRRKLFCILVRCAGMRESGIPLHLFTLQTPLLSGRVVWWRV
pmCDA-2 (Petromyzon marinus):
MELREVVDCALASCVRHEPLSRVAFLRCFAAPSQKPRGTVILFYVEGAGRGVTGGHAVNYNKQGTSIHAEVLLLSAVRAALLRRRRCEDGEEATRGCTLHCYSTYSPCRDCVEYIQEFGASTGVRVVIHCCRLYELDVNRRRSEAEGVLRSLSRLGRDFRLMGPRDAIALLLGGRLANTADGESGASGNAWVTETNVVEPLVDMTGFGDEDLHAQVQRNKQIREAYANYASAVSLMLGELHVDPDKFPFLAEFLAQTSVEPSGTPRETRGRPRGASSRGPEIGRQRPADFERALGAYGLFLHPRIVSREADREEIKRDLIVVMRKHNYQGP
pmCDA-5 (Petromyzon marinus):
MAGDENVRVSEKLDFDTFEFQFENLHYATERHRTYVIFDVKPQSAGGRSRRLWGYIINNPNVCHAELILMSMIDRHLESNPGVYAMTWYMSWSPCANCSSKLNPWLKNLLEEQGHTLMMHFSRIYDRDREGDHRGLRGLKHVSNSFRMGVVGRAEVKECLAEYVEASRRTLTWLDTTESMAAKMRRKLFCILVRCAGMRESGMPLHLFT
yCD (Saccharomyces cerevisiae):
MVTGGMASKWDQKGMDIAYEEAALGYKEGGVPIGGCLINNKDGSVLGRGHNMRFQKGSATLHGEISTLENCGRLEGKVYKDTTLYTTLSPCDMCTGAIIMYGIPRCVVGENVNFKSKGEKYLQTRGHEVVVVDDERCKKIMKQFIDERPQDWFEDIGE
rAPOBEC-1 (Δ177-186):
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLK
rAPOBEC-1 (Δ202-213):
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQHYQRLPPHILWATGLK
マウスAPOBEC-3:
Figure 2022532139000053
本開示のいくつかの態様は、例えば、デアミナーゼドメインに点変異を起こすことによって、本明細書に記載の融合タンパク質のいずれかのデアミナーゼドメイン触媒活性を調節することが、融合タンパク質(例えば、塩基編集体)の処理能力に影響を与えるという認識に基づく。例えば、塩基編集融合タンパク質内のデアミナーゼドメインの触媒活性を低下させるが排除しない変異は、デアミナーゼドメインが標的残基に隣接する残基の脱アミノ化を触媒する可能性を低くし、それにより、脱アミノ化ウィンドウを狭める場合がある。脱アミノ化ウィンドウを狭める能力は、特定の標的残基に隣接する残基の不要な脱アミノ化を防止することができ、オフターゲット効果を低減または防止することができる。
例えば、いくつかの実施形態では、塩基編集体に組み込まれるAPOBECデアミナーゼは、rAPOBEC1のH121X、H122X、R126X、R126X、R118X、W90X、W90X、及びR132Xからなる群から選択される1つ以上の変異、または別のAPOBECデアミナーゼの1つ以上の対応する変異を含み得、Xは任意のアミノ酸である。いくつかの実施形態では、塩基編集体に組み込まれるAPOBECデアミナーゼは、rAPOBEC1のH121R、H122R、R126A、R126E、R118A、W90A、W90Y、及びR132Eからなる群から選択される1つ以上の変異、または別のAPOBECデアミナーゼの1つ以上の対応する変異を含み得る。
いくつかの実施形態では、塩基編集体に組み込まれるAPOBECデアミナーゼは、hAPOBEC3GのD316X、D317X、R320X、R320X、R313X、W285X、W285X、R326Xからなる群から選択される1つ以上の変異、または別のAPOBECデアミナーゼの1つ以上の対応する変異を含み得、Xは任意のアミノ酸である。いくつかの実施形態では、本明細書中で提供する融合タンパク質のいずれかは、hAPOBEC3GのD316R、D317R、R320A、R320E、R313A、W285A、W285Y、R326Eからなる群から選択される1つ以上の変異、または別のAPOBECデアミナーゼの1つ以上の対応する変異を含むAPOBECデアミナーゼを含む。
いくつかの実施形態では、塩基編集体に組み込まれるAPOBECデアミナーゼは、rAPOBEC1のH121R及びH122R変異、または別のAPOBECデアミナーゼの1つ以上の対応する変異を含み得る。いくつかの実施形態では、塩基編集体に組み込まれるAPOBECデアミナーゼには、rAPOBEC1のR126A変異、または別のAPOBECデアミナーゼの1つ以上の対応する変異を含むAPOBECデアミナーゼが含まれ得る。いくつかの実施形態では、塩基編集体に組み込まれるAPOBECデアミナーゼには、rAPOBEC1のR126E変異、または別のAPOBECデアミナーゼの1つ以上の対応する変異を含むAPOBECデアミナーゼが含まれ得る。いくつかの実施形態では、塩基編集体に組み込まれるAPOBECデアミナーゼには、rAPOBEC1のR118A変異、または別のAPOBECデアミナーゼの1つ以上の対応する変異を含むAPOBECデアミナーゼが含まれ得る。いくつかの実施形態では、塩基編集体に組み込まれるAPOBECデアミナーゼには、rAPOBEC1のW90A変異、または別のAPOBECデアミナーゼの1つ以上の対応する変異を含むAPOBECデアミナーゼが含まれ得る。いくつかの実施形態では、塩基編集体に組み込まれるAPOBECデアミナーゼには、rAPOBEC1のW90Y変異、または別のAPOBECデアミナーゼの1つ以上の対応する変異を含むAPOBECデアミナーゼが含まれ得る。いくつかの実施形態では、塩基編集体に組み込まれるAPOBECデアミナーゼには、rAPOBEC1のR132E変異、または別のAPOBECデアミナーゼの1つ以上の対応する変異を含むAPOBECデアミナーゼが含まれ得る。いくつかの実施形態では、塩基編集体に組み込まれるAPOBECデアミナーゼには、rAPOBEC1のW90Y及びR126E変異、または別のAPOBECデアミナーゼの1つ以上の対応する変異を含むAPOBECデアミナーゼが含まれ得る。いくつかの実施形態では、塩基編集体に組み込まれるAPOBECデアミナーゼには、rAPOBEC1のR126E及びR132E変異、または別のAPOBECデアミナーゼの1つ以上の対応する変異を含むAPOBECデアミナーゼが含まれ得る。いくつかの実施形態では、塩基編集体に組み込まれるAPOBECデアミナーゼには、rAPOBEC1のW90Y及びR132E変異、または別のAPOBECデアミナーゼの1つ以上の対応する変異を含むAPOBECデアミナーゼが含まれ得る。いくつかの実施形態では、塩基編集体に組み込まれるAPOBECデアミナーゼには、rAPOBEC1のW90Y、R126E、及びR132E変異、または別のAPOBECデアミナーゼの1つ以上の対応する変異を含むAPOBECデアミナーゼが含まれ得る。
いくつかの実施形態では、塩基編集体に組み込まれるAPOBECデアミナーゼには、hAPOBEC3GのD316R及びD317R変異、または別のAPOBECデアミナーゼの1つ以上の対応する変異を含むAPOBECデアミナーゼが含まれ得る。いくつかの実施形態では、本明細書中で提供する融合タンパク質のいずれかは、hAPOBEC3GのR320A変異、または別のAPOBECデアミナーゼの1つ以上の対応する変異を含むAPOBECデアミナーゼを含む。いくつかの実施形態では、塩基編集体に組み込まれるAPOBECデアミナーゼには、hAPOBEC3GのR320E変異、または別のAPOBECデアミナーゼの1つ以上の対応する変異を含むAPOBECデアミナーゼが含まれ得る。いくつかの実施形態では、塩基編集体に組み込まれるAPOBECデアミナーゼには、hAPOBEC3GのR313A変異、または別のAPOBECデアミナーゼの1つ以上の対応する変異を含むAPOBECデアミナーゼが含まれ得る。いくつかの実施形態では、塩基編集体に組み込まれるAPOBECデアミナーゼには、hAPOBEC3GのW285A変異、または別のAPOBECデアミナーゼの1つ以上の対応する変異を含むAPOBECデアミナーゼが含まれ得る。いくつかの実施形態では、塩基編集体に組み込まれるAPOBECデアミナーゼには、hAPOBEC3GのW285Y変異、または別のAPOBECデアミナーゼの1つ以上の対応する変異を含むAPOBECデアミナーゼが含まれ得る。いくつかの実施形態では、塩基編集体に組み込まれるAPOBECデアミナーゼには、hAPOBEC3GのR326E変異、または別のAPOBECデアミナーゼの1つ以上の対応する変異を含むAPOBECデアミナーゼが含まれ得る。いくつかの実施形態では、塩基編集体に組み込まれるAPOBECデアミナーゼには、hAPOBEC3GのW285Y及びR320E変異、または別のAPOBECデアミナーゼの1つ以上の対応する変異を含むAPOBECデアミナーゼが含まれ得る。いくつかの実施形態では、塩基編集体に組み込まれるAPOBECデアミナーゼには、hAPOBEC3GのR320E及びR326E変異、または別のAPOBECデアミナーゼの1つ以上の対応する変異を含むAPOBECデアミナーゼが含まれ得る。いくつかの実施形態では、塩基編集体に組み込まれるAPOBECデアミナーゼには、hAPOBEC3GのW285Y及びR326E変異、または別のAPOBECデアミナーゼの1つ以上の対応する変異を含むAPOBECデアミナーゼが含まれ得る。いくつかの実施形態では、塩基編集体に組み込まれるAPOBECデアミナーゼには、hAPOBEC3GのW285Y、R320E、及びR326E変異、または別のAPOBECデアミナーゼの1つ以上の対応する変異を含むAPOBECデアミナーゼが含まれ得る。
SaBE3、SaKKH-BE3、VQR-BE3、EQR-BE3、VRER-BE3、YE1-BE3、EE-BE3、YE2-BE3、及びYEE-BE3を含むがこれらに限定されない多くの改変シチジンデアミナーゼが市販されており、Addgeneから入手可能である(プラスミド85169、85170、85171、85172、85173、85174、85175、85176、85177)。いくつかの実施形態では、塩基編集体に組み込まれたデアミナーゼは、APOBEC1デアミナーゼの全部または一部を含む。
CからTへの核酸塩基編集タンパク質の詳細は、国際PCT出願第PCT/US2016/058344号(WO2017/070632)及びKomor, A.C., et al., ”Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533,420-424 (2016)に記載されており;その全内容は参照により本明細書に援用される。
シチジンデアミナーゼ
本明細書中で提供する融合タンパク質は、1つ以上のシチジンデアミナーゼを含む。いくつかの実施形態では、本明細書中で提供するシチジンデアミナーゼは、シトシンまたは5-メチルシトシンをウラシルまたはチミンに脱アミノ化することができる。いくつかの実施形態では、本明細書中で提供するシチジンデアミナーゼは、DNA中のシトシンを脱アミノ化することができる。シチジンデアミナーゼは、任意の適切な生物に由来し得る。いくつかの実施形態では、シチジンデアミナーゼは、本明細書中で提供する変異のいずれかに対応する1つ以上の変異を含む天然のシチジンデアミナーゼである。当業者であれば、任意の相同タンパク質の対応する残基を、例えば、配列アラインメント及び相同残基の決定によって同定することができる。したがって、当業者であれば、本明細書に記載の変異のいずれかに対応する、任意の天然のシチジンデアミナーゼに変異を生成することができるであろう。いくつかの実施形態では、シチジンデアミナーゼは、原核生物由来である。いくつかの実施形態では、シチジンデアミナーゼは、細菌由来である。いくつかの実施形態では、シチジンデアミナーゼは、哺乳類(例えば、ヒト)由来である。
いくつかの実施形態では、シチジンデアミナーゼは、本明細書に記載するシチジンデアミナーゼのアミノ酸配列のいずれか1つに対して、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。本明細書中で提供するシチジンデアミナーゼは、1つ以上の変異(例えば、本明細書中で提供する変異のいずれか)を含み得ることを理解すべきである。本開示は、特定割合の同一性に加えて、本明細書に記載の変異のいずれか、またはそれらの組み合わせを含む任意のデアミナーゼドメインを提供する。いくつかの実施形態では、シチジンデアミナーゼは、参照配列、または本明細書中で提供するシチジンデアミナーゼのいずれかと比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50またはそれ以上の変異を有するアミノ酸配列を含む。いくつかの実施形態では、シチジンデアミナーゼは、当技術分野で公知の、または本明細書に記載のアミノ酸配列のいずれか1つと比較して、少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも110、少なくとも120、少なくとも130、少なくとも140、少なくとも150、少なくとも160、または少なくとも170個の同一の連続アミノ酸残基を有するアミノ酸配列を含む。
本発明の融合タンパク質は、2つ以上の核酸編集ドメインを含む。いくつかの実施形態では、核酸編集ドメインは、CからUへの塩基変化を触媒することができる。いくつかの実施形態では、核酸編集ドメインは、デアミナーゼドメインである。いくつかの実施形態では、デアミナーゼは、シチジンデアミナーゼまたはアデノシンデアミナーゼである。いくつかの実施形態では、デアミナーゼは、アポリポタンパク質B mRNA編集複合体(APOBEC)ファミリーデアミナーゼである。いくつかの実施形態では、デアミナーゼは、APOBEClデアミナーゼである。いくつかの実施形態では、デアミナーゼは、APOBEC2デアミナーゼである。いくつかの実施形態では、デアミナーゼは、APOBEC3デアミナーゼである。いくつかの実施形態では、デアミナーゼは、APOBEC3Aデアミナーゼである。いくつかの実施形態では、デアミナーゼは、APOBEC3Bデアミナーゼである。いくつかの実施形態では、デアミナーゼは、APOBEC3Cデアミナーゼである。いくつかの実施形態では、デアミナーゼは、APOBEC3Dデアミナーゼである。いくつかの実施形態では、デアミナーゼは、APOBEC3Eデアミナーゼである。いくつかの実施形態では、デアミナーゼは、APOBEC3Fデアミナーゼである。いくつかの実施形態では、デアミナーゼは、APOBEC3Gデアミナーゼである。いくつかの実施形態では、デアミナーゼは、APOBEC3Hデアミナーゼである。いくつかの実施形態では、デアミナーゼは、APOBEC4デアミナーゼである。いくつかの実施形態では、デアミナーゼは、活性化誘導デアミナーゼ(AID)である。いくつかの実施形態では、デアミナーゼは、脊椎動物デアミナーゼである。いくつかの実施形態では、デアミナーゼは、無脊椎動物デアミナーゼである。いくつかの実施形態では、デアミナーゼは、ヒト、チンパンジー、ゴリラ、サル、ウシ、イヌ、ラット、またはマウスデアミナーゼである。いくつかの実施形態では、デアミナーゼは、ヒトデアミナーゼである。いくつかの実施形態では、デアミナーゼは、ラットデアミナーゼ、例えば、rAPOBEClである。いくつかの実施形態では、デアミナーゼは、Petromyzon marinusシチジンデアミナーゼ1 (pmCDAl)である。いくつかの実施形態では、デアミナーゼは、ヒトAPOBEC3Gである。いくつかの実施形態では、デアミナーゼは、ヒトAPOBEC3Gの断片である。いくつかの実施形態では、デアミナーゼは、D316R D317R変異を含むヒトAPOBEC3Gバリアントである。いくつかの実施形態では、デアミナーゼは、ヒトAPOBEC3Gの断片であり、D316R D317R変異に対応する変異を含む。いくつかの実施形態では、核酸編集ドメインは、本明細書に記載の任意のデアミナーゼのデアミナーゼドメインと、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも92%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%)、または少なくとも99.5%の同一性である。
特定の実施形態では、本明細書中で提供する融合タンパク質は、融合タンパク質の塩基編集活性を向上させる1つ以上の特性を含む。例えば、本明細書中で提供する融合タンパク質のいずれかは、ヌクレアーゼ活性が低下したCas9ドメインを含み得る。いくつかの実施形態では、本明細書中で提供する融合タンパク質のいずれかは、ヌクレアーゼ活性を有さないCas9ドメイン(dCas9)、またはCas9ニッカーゼ(nCas9)と呼ばれる二本鎖DNA分子の1本の鎖を切断するCas9ドメインを有し得る。
ガイドRNAとのCas9複合体
本開示のいくつかの態様は、本明細書中で提供する融合タンパク質のいずれか、及び融合タンパク質のCas9ドメイン(例えば、dCas9、ヌクレアーゼ活性Cas9、またはCas9ニッカーゼ)に結合したガイドRNAを含む複合体を提供する。いくつかの実施形態では、ガイド核酸(例えば、ガイドRNA)は、15~100ヌクレオチド長であり、標的配列に相補的である少なくとも10個の連続ヌクレオチドの配列を含む。いくつかの実施形態では、ガイドRNAは、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、または50ヌクレオチド長である。いくつかの実施形態では、ガイドRNAは、標的配列に相補的な15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、または40個の連続ヌクレオチドの配列を含む。いくつかの実施形態では、標的配列はDNA配列である。いくつかの実施形態では、標的配列は、細菌、酵母、真菌、昆虫、植物、または動物のゲノム内の配列である。いくつかの実施形態では、標的配列は、ヒトのゲノム内の配列である。いくつかの実施形態では、標的配列の3’末端は、標準PAM配列(NGG)に直接隣接している。いくつかの実施形態では、標的配列の3’末端は、非標準PAM配列(例えば、表1に記載の配列または5’-NAA-3’)に直接隣接している。いくつかの実施形態では、ガイド核酸(例えば、ガイドRNA)は、目的の遺伝子(例えば、HBVゲノム内の遺伝子)の配列に相補的である。
本開示のいくつかの態様は、本明細書中で提供する融合タンパク質または複合体の使用方法を提供する。例えば、本開示のいくつかの態様は、DNA分子を、本明細書中で提供する融合タンパク質のいずれか、及び少なくとも1つのガイドRNAと接触させることを含む方法を提供し、ガイドRNAは、約15~100ヌクレオチド長であり、標的配列に相補的な少なくとも10個の連続ヌクレオチドの配列を含む。いくつかの実施形態では、標的配列の3’末端は、AGC、GAG、TTT、GTG、またはCAA配列に直接隣接している。いくつかの実施形態では、標的配列の3’末端は、NGA、NGCG、NGN、NNGRRT、NNNRRT、NGCG、NGCN、NGTN、NGTN、NGTN、または5’(TTTV)配列に直接隣接している。
それぞれの配列における特定の位置または残基の付番は、使用する特定のタンパク質及び付番スキームに依存することが理解されよう。付番は、例えば、成熟タンパク質の前駆体と成熟タンパク質自体で異なる場合があり、種ごとの配列の違いが付番に影響を与える可能性がある。当業者であれば、当技術分野で周知の方法、例えば、配列アラインメント及び相同残基の決定によって、任意の相同タンパク質及びそれぞれのコード核酸中のそれぞれの残基を同定することができるであろう。
本明細書に開示する融合タンパク質のいずれかを、標的部位、例えば、変異を含む編集しようとする部位に標的指向化するために、一般的に、ガイドRNAと一緒に融合タンパク質を共発現することが必要であることは当業者には明らかであろう。本明細書の他の場所でより詳細に説明するように、ガイドRNAは、通常、Cas9結合を可能にするtracrRNAフレームワーク、及びCas9:核酸編集酵素/ドメイン融合タンパク質に配列特異性を与えるガイド配列を含む。あるいは、ガイドRNA及びtracrRNAを、2つの核酸分子として別々に提供してもよい。いくつかの実施形態では、ガイドRNAは、標的配列に相補的な配列をガイド配列が含む構造を含む。ガイド配列は、通常、20ヌクレオチド長である。Cas9:核酸編集酵素/ドメイン融合タンパク質を、特定のゲノム標的部位に標的指向化するための適切なガイドRNAの配列は、本開示に基づいて当業者には明らかであろう。そのような適切なガイドRNA配列は、通常、編集しようとする標的ヌクレオチドの上流または下流の50ヌクレオチド内の核酸配列に相補的なガイド配列を含む。本明細書において、提供する融合タンパク質のいずれかを特定の標的配列に標的指向化するのに適したいくつかの例示的なガイドRNA配列を提供する。
追加のドメイン
本明細書に記載の塩基編集体は、ポリヌクレオチドの核酸塩基の修飾または改変である核酸塩基編集を促進するのに役立つ任意のドメインを含み得る。いくつかの実施形態では、塩基編集体は、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン(例えば、Cas9)、核酸塩基編集ドメイン(例えば、デアミナーゼドメイン)、及び1つ以上の追加のドメインを含む。いくつかの場合では、追加のドメインは、塩基編集体の酵素的または触媒的機能、塩基編集体の結合機能を促進するか、または所望の塩基編集結果を妨害する可能性のある細胞機構(例えば、酵素)の阻害因子となり得る。いくつかの実施形態では、塩基編集体は、ヌクレアーゼ、ニッカーゼ、リコンビナーゼ、デアミナーゼ、メチルトランスフェラーゼ、メチラーゼ、アセチラーゼ、アセチルトランスフェラーゼ、転写活性化因子、または転写リプレッサードメインを含み得る。
いくつかの実施形態では、塩基編集体は、ウラシルグリコシラーゼ阻害(UGI)ドメインを含み得る。UGIドメインは、例えば、Cの脱アミノ化によって形成されるUから核酸塩基Cに転換して戻ることを阻害することにより、シチジンデアミナーゼドメインを含む塩基編集体の効率を向上させることができる。いくつかの場合では、U:Gヘテロ二本鎖DNAが存在することに対する細胞のDNA修復応答が、細胞内の核酸塩基編集効率の低下の原因であり得る。そのような場合、ウラシルDNAグリコシラーゼ(UDG)は、細胞内のDNAからのUの除去を触媒することができ、塩基除去修復(BER)を開始し、主にU:GペアをC:Gペアに戻すことができる。そのような場合、BERは、一本鎖に結合し、編集された塩基を遮断し、UGIを阻害し、BERを阻害し、編集された塩基を保護し、及び/または非編集鎖の修復を促進する1つ以上のドメインを含む塩基編集体において阻害することができる。したがって、本開示は、UGIドメインを含む塩基編集体融合タンパク質を企図している。
いくつかの実施形態では、塩基編集体は、ドメインとして、二本鎖切断(DSB)結合タンパク質の全部または一部を含む。例えば、DSB結合タンパク質は、DSBの末端に結合し、それらを分解から保護することができるバクテリオファージMuのGamタンパク質を含み得る。Komor, A.C., et al., ”Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao 4774 (2017)を参照されたい(その全内容は、参照により本明細書に援用される)
さらに、いくつかの実施形態では、Gamタンパク質を、塩基編集体のN末端に融合させることができる。いくつかの実施形態では、Gamタンパク質を、塩基編集体のC末端に融合させることができる。バクテリオファージMuのGamタンパク質は、二本鎖切断(DSB)の末端に結合し、それらを分解から保護することができる。いくつかの実施形態では、Gamを使用してDSBの自由端を結合することにより、塩基編集のプロセス中のインデル形成を低減することができる。いくつかの実施形態では、174残基のGamタンパク質を、塩基編集体のN末端に融合させる。Komor, A.C., et al., ”Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao 4774 (2017)を参照されたい。いくつかの実施形態では、1つ以上の変異は、野生型ドメインと比較して、塩基編集体ドメインの長さを変えることができる。例えば、少なくとも1つのドメインの少なくとも1つのアミノ酸を欠失させることにより、塩基編集体の長さを短くすることができる。別の場合では、1つの変異または複数の変異は、野生型ドメインと比較して、ドメインの長さを変化させない。例えば、任意のドメインにおける置換(複数可)は、塩基編集体の長さを変化させない。
いくつかの実施形態では、塩基編集体は、ドメインとして、核酸ポリメラーゼ(NAP)の全部または一部を含み得る。例えば、塩基編集体は、真核生物のNAPの全部または一部を含み得る。いくつかの実施形態では、塩基編集体に組み込まれるNAPまたはその一部は、DNAポリメラーゼである。いくつかの実施形態では、塩基編集体に組み込まれるNAPまたはその一部は、損傷乗り越えポリメラーゼ活性を有する。いくつかの場合では、塩基編集体に組み込まれるNAPまたはその一部は、損傷乗り越えDNAポリメラーゼである。いくつかの実施形態では、塩基編集体に組み込まれるNAPまたはその一部は、Rev7、Rev1複合体、ポリメラーゼι、ポリメラーゼκ、またはポリメラーゼηである。いくつかの実施形態では、塩基編集体に組み込まれるNAPまたはその一部は、真核生物のポリメラーゼα、β、γ、δ、ε、γ、η、ι、κ、λ、μ、またはν成分である。いくつかの実施形態では、塩基編集体に組み込まれるNAPまたはその一部は、核酸ポリメラーゼ(例えば、損傷乗り越えDNAポリメラーゼ)と、少なくとも75%、80%、85%、90%、95%、96%、97%、98%、99%、または99.5%の同一性であるアミノ酸配列を含む。
塩基編集系
本明細書中で提供する塩基編集系は: (a)対象のポリヌクレオチド(例えば、二本鎖DNAまたはRNA、一本鎖DNAまたはRNA)の標的ヌクレオチド配列を、アデノシンデアミナーゼドメインまたはシチジンデアミナーゼドメインを含む塩基編集系と接触させるステップであって、前述のドメインを、ポリヌクレオチド結合ドメインに融合させ、それにより、本明細書に記載の核酸分子内の1つ以上の塩基及び少なくとも1つのガイドポリ核酸(例えば、gRNA)において、変化を誘導することができる核酸塩基編集体を形成し、標的ヌクレオチド配列が標的核酸塩基対を含む、ステップ;(b)標的領域の鎖分離を誘導するステップ;(c)標的領域の一本鎖中の標的核酸塩基対の第1の核酸塩基を第2の核酸塩基に転換させるステップ、及び(d)標的領域の1本以下の鎖を切断するステップであって、第1の核酸塩基塩基に相補的な第3の核酸塩基を、第2の核酸塩基に相補的な第4の核酸塩基によって置き換える、ステップを含む。いくつかの実施形態では、ステップ(b)が省略されることを理解すべきである。いくつかの実施形態では、標的化された核酸塩基対は、1つ以上の遺伝子における複数の核酸塩基対である。いくつかの実施形態では、本明細書中で提供する塩基編集系は、1つ以上の遺伝子における複数の核酸塩基対の多重編集が可能である。いくつかの実施形態では、複数の核酸塩基対が同じ遺伝子に位置する。いくつかの実施形態では、複数の核酸塩基対が1つ以上の遺伝子に位置し、少なくとも1つの遺伝子が異なる遺伝子座に位置する。
いくつかの実施形態では、切断された一本鎖(ニックの入った鎖)を、ガイド核酸にハイブリダイズさせる。いくつかの実施形態では、切断された一本鎖は、第1の核酸塩基を含む鎖の反対側である。いくつかの実施形態では、塩基編集体は、Cas9ドメインを含む。いくつかの実施形態では、第1の塩基はアデニンであり、第2の塩基はG、C、A、またはTではない。いくつかの実施形態では、第2の塩基はイノシンである。
本明細書中で提供する塩基編集系は、触媒的に欠損を有するStreptococcus pyogenes Cas9、シチジンデアミナーゼ、及び塩基除去修復の阻害因子を含む融合タンパク質を使用して、二本鎖DNA切断を生成せず、ドナーDNAテンプレートを必要とせず、また、過剰な確率的挿入及び欠失を誘発せずに、DNA中にプログラム可能な単一ヌクレオチド(C→TまたはA→G)変化を誘導する、ゲノム編集への新規アプローチを提供する。
本明細書において、塩基編集系を使用して核酸塩基を編集するための系、組成物、及び方法を提供する。いくつかの実施形態では、塩基編集系は、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン及び核酸塩基を編集するための核酸塩基編集ドメイン(例えば、デアミナーゼドメイン);ならびにポリヌクレオチドプログラム可能なヌクレオチド結合ドメインと組み合わせたガイドポリヌクレオチド(例えば、ガイドRNA)を含む塩基編集体(BE)を含む。いくつかの実施形態では、塩基編集系は、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン及び核酸塩基を編集するための核酸塩基編集ドメイン(例えば、デアミナーゼドメイン)、ならびにポリヌクレオチドプログラム可能なヌクレオチド結合ドメインと組み合わせたガイドポリヌクレオチド(例えば、ガイドRNA)を含む塩基編集体(BE)を含む。いくつかの実施形態では、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、ポリヌクレオチドプログラム可能なDNA結合ドメインである。いくつかの実施形態では、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、ポリヌクレオチドプログラム可能なRNA結合ドメインである。いくつかの場合では、デアミナーゼドメインは、シトシンデアミナーゼまたはシチジンデアミナーゼ、アデニンデアミナーゼまたはアデノシンデアミナーゼであり得る。いくつかの実施形態では、用語「シトシンデアミナーゼ」及び「シチジンデアミナーゼ」は、同じ意味で用いられ得る。いくつかの実施形態では、用語「アデニンデアミナーゼ」及び「アデノシンデアミナーゼ」は、同じ意味で用いられ得る。いくつかの場合では、デアミナーゼドメインは、シトシンデアミナーゼまたはシチジンデアミナーゼであり得る。いくつかの場合では、デアミナーゼドメインは、アデニンデアミナーゼまたはアデノシンデアミナーゼであり得る。
核酸塩基編集タンパク質の詳細は、国際PCT出願第PCT/2017/045381号(WO2018/027078)及び第PCT/US2016/058344号(WO2017/070632)に記載されており、これらのそれぞれは、その全体が参照により本明細書に援用される。また、Komor, A.C., et al., ”Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533,420-424 (2016);Gaudelli, N.M., et al., ”Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551,464-471 (2017)、及びKomor, A.C., et al., ”Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao 4774 (2017)も参照されたい(その全内容は、参照により本明細書に援用される)
いくつかの実施形態では、単一のガイドポリヌクレオチドを利用して、デアミナーゼを標的核酸配列に標的指向化することができる。いくつかの実施形態では、ガイドポリヌクレオチドの単一のペアを利用して、異なるデアミナーゼを標的核酸配列に標的指向化することができる。塩基編集系の核酸塩基成分及びポリヌクレオチドプログラム可能なヌクレオチド結合成分は、共有結合または非共有結合で互いに会合し得る。例えば、いくつかの実施形態では、デアミナーゼドメインを、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインによって標的ヌクレオチド配列に標的指向化することができる。いくつかの実施形態では、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインを、デアミナーゼドメインに融合または連結することができる。いくつかの実施形態では、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、デアミナーゼドメインと非共有結合的に相互作用させるか、または会合させることによって、デアミナーゼドメインを標的ヌクレオチド配列に標的指向化することができる。例えば、いくつかの実施形態では、核酸塩基編集成分、例えば、デアミナーゼ成分は、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインの一部である追加の異種部分またはドメインと相互作用するか、会合するか、または複合体を形成することができる追加の異種部分またはドメインを含み得る。いくつかの実施形態では、追加の異種部分は、ポリペプチドと結合するか、相互作用するか、会合するか、または複合体を形成することができてもよい。いくつかの実施形態では、追加の異種部分は、ポリヌクレオチドと結合するか、相互作用するか、会合するか、または複合体を形成することができてもよい。いくつかの実施形態では、追加の異種部分は、ガイドポリヌクレオチドと結合することができてもよい。いくつかの実施形態では、追加の異種部分は、ポリペプチドリンカーと結合することができてもよい。いくつかの実施形態では、追加の異種部分は、ポリヌクレオチドリンカーと結合することができてもよい。追加の異種部分は、タンパク質ドメインであり得る。いくつかの実施形態では、追加の異種部分は、Kホモロジー(KH)ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、ステライルαモチーフ、テロメラーゼKu結合モチーフ及びKuタンパク質、テロメラーゼSm7結合モチーフ及びSm7タンパク質、またはRNA認識モチーフであり得る。
塩基編集系は、ガイドポリヌクレオチド成分をさらに含み得る。塩基編集系の成分は、共有結合、非共有結合相互作用、またはそれらの会合及び相互作用の任意の組み合わせを介して互いに会合し得ることを理解すべきである。いくつかの実施形態では、デアミナーゼドメインを、ガイドポリヌクレオチドによって標的ヌクレオチド配列に標的指向化することができる。例えば、いくつかの実施形態では、塩基編集系の核酸塩基編集成分、例えば、デアミナーゼ成分は、ガイドポリヌクレオチドの一部またはセグメント(例えば、ポリヌクレオチドモチーフ)と相互作用するか、会合するか、または複合体を形成することができる追加の異種部分またはドメイン(例えば、RNAまたはDNA結合タンパク質などのポリヌクレオチド結合ドメイン)を含み得る。いくつかの実施形態では、追加の異種部分またはドメイン(例えば、RNAまたはDNA結合タンパク質などのポリヌクレオチド結合ドメイン)を、デアミナーゼドメインに融合または連結することができる。いくつかの実施形態では、追加の異種部分は、ポリペプチドと結合するか、相互作用するか、会合するか、または複合体を形成することができてもよい。いくつかの実施形態では、追加の異種部分は、ポリヌクレオチドと結合するか、相互作用するか、会合するか、または複合体を形成することができてもよい。いくつかの実施形態では、追加の異種部分は、ガイドポリヌクレオチドと結合することができてもよい。いくつかの実施形態では、追加の異種部分は、ポリペプチドリンカーと結合することができてもよい。いくつかの実施形態では、追加の異種部分は、ポリヌクレオチドリンカーと結合することができてもよい。追加の異種部分は、タンパク質ドメインであり得る。いくつかの実施形態では、追加の異種部分は、Kホモロジー(KH)ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、ステライルαモチーフ、テロメラーゼKu結合モチーフ及びKuタンパク質、テロメラーゼSm7結合モチーフ及びSm7タンパク質、またはRNA認識モチーフであり得る。
いくつかの実施形態では、塩基編集系は、塩基除去修復(BER)成分の阻害因子をさらに含み得る。塩基編集系の成分は、共有結合、非共有結合相互作用、またはそれらの会合及び相互作用の任意の組み合わせを介して互いに会合し得ることを理解すべきである。BER成分の阻害因子は、塩基除去修復阻害因子を含み得る。いくつかの実施形態では、塩基除去修復の阻害因子は、ウラシルDNAグリコシラーゼ阻害因子(UGI)であり得る。いくつかの実施形態では、塩基除去修復の阻害因子は、イノシン塩基除去修復阻害因子であり得る。いくつかの実施形態では、塩基除去修復の阻害因子は、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインによって標的ヌクレオチド配列に標的指向化することができる。いくつかの実施形態では、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインを、塩基除去修復の阻害因子に融合または連結することができる。いくつかの実施形態では、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインを、デアミナーゼドメイン及び塩基除去修復の阻害因子に融合または連結することができる。いくつかの実施形態では、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、塩基除去修復の阻害因子と非共有結合的に相互作用するか、または会合することによって、塩基除去修復の阻害因子を標的ヌクレオチド配列に標的指向化することができる。例えば、いくつかの実施形態では、塩基除去修復成分の阻害因子は、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインの一部である追加の異種部分またはドメインと相互作用するか、会合するか、または複合体を形成することができる追加の異種部分またはドメインを含み得る。いくつかの実施形態では、塩基除去修復の阻害因子は、ガイドポリヌクレオチドによって標的ヌクレオチド配列に標的指向化することができる。例えば、いくつかの実施形態では、塩基除去修復の阻害因子は、ガイドポリヌクレオチドの一部またはセグメント(例えば、ポリヌクレオチドモチーフ)と相互作用するか、会合するか、または複合体を形成することができる追加の異種部分またはドメイン(例えば、RNAまたはDNA結合タンパク質などのポリヌクレオチド結合ドメイン)を含み得る。いくつかの実施形態では、ガイドポリヌクレオチドの追加の異種部分またはドメイン(例えば、RNAまたはDNA結合タンパク質などのポリヌクレオチド結合ドメイン)を、塩基除去修復の阻害因子に融合または連結することができる。いくつかの実施形態では、追加の異種部分は、ポリヌクレオチドと結合するか、相互作用するか、会合するか、または複合体を形成することができてもよい。いくつかの実施形態では、追加の異種部分は、ガイドポリヌクレオチドと結合することができてもよい。いくつかの実施形態では、追加の異種部分は、ポリペプチドリンカーと結合することができてもよい。いくつかの実施形態では、追加の異種部分は、ポリヌクレオチドリンカーと結合することができてもよい。追加の異種部分は、タンパク質ドメインであり得る。いくつかの実施形態では、追加の異種部分は、Kホモロジー(KH)ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、ステライルαモチーフ、テロメラーゼKu結合モチーフ及びKuタンパク質、テロメラーゼSm7結合モチーフ及びSm7タンパク質、またはRNA認識モチーフであり得る。
いくつかの実施形態では、塩基編集体は、編集鎖の塩基除去修復を阻害する。いくつかの実施形態では、塩基編集体は、非編集鎖を保護または結合する。いくつかの実施形態では、塩基編集体は、UGI活性を含む。いくつかの実施形態では、塩基編集体は、触媒的に不活性なイノシン特異的ヌクレアーゼを含む。いくつかの実施形態では、塩基編集体は、ニッカーゼ活性を含む。いくつかの実施形態では、意図する塩基対の編集は、PAM部位の上流である。いくつかの実施形態では、意図する塩基対の編集は、PAM部位の、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド上流である。いくつかの実施形態では、意図する塩基対の編集は、PAM部位の下流である。いくつかの実施形態では、意図する塩基対の編集は、PAM部位の、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド下流である。
いくつかの実施形態では、方法は、標準(例えば、NGG)PAM部位を必要としない。いくつかの実施形態では、核酸塩基編集体は、リンカーまたはスペーサーを含む。いくつかの実施形態では、リンカーまたはスペーサーは、1~25アミノ酸長である。いくつかの実施形態では、リンカーまたはスペーサーは、5~20アミノ酸長である。いくつかの実施形態では、リンカーまたはスペーサーは、10、11、12、13、14、15、16、17、18、19、または20アミノ酸長である。
いくつかの実施形態では、標的領域は、標的ウィンドウを含み、標的ウィンドウは、標的核酸塩基対を含む。いくつかの実施形態では、標的ウィンドウは、1~10ヌクレオチドを含む。いくつかの実施形態では、標的ウィンドウは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド長である。いくつかの実施形態では、意図する塩基対の編集は、標的ウィンドウ内である。いくつかの実施形態では、標的ウィンドウは、意図する塩基対の編集を含む。いくつかの実施形態では、方法を、本明細書中で提供する塩基編集体のいずれかを使用して実施する。いくつかの実施形態では、標的ウィンドウは脱アミノ化ウィンドウである。
いくつかの実施形態では、非限定的な例示的なシチジン塩基編集体(CBE)として、BE1 (APOBEC1-XTEN-dCas9)、BE2 (APOBEC1-XTEN-dCas9-UGI)、BE3 (APOBEC1-XTEN-dCas9 (A840H)-UGI)、BE3-Gam、saBE3、saBE4-Gam、BE4、BE4-Gam、saBE4、またはsaB4E-Gamが挙げられる。BE4は、APOBEC1-Cas9n (D10A)リンカーを32アミノ酸に、Cas9n-UGIリンカーを9アミノ酸に拡張し、UGIの第2のコピーを別の9アミノ酸のリンカーと共に構築物のC末端に付加して単一の塩基編集構築物とする。塩基編集体saBE3及びsaBE4では、S. pyogenes Cas9n (D10A)が、より小さいS. aureus Cas9n (D10A)に置き換えられている。BE3-Gam、saBE3-Gam、BE4-Gam、及びsaBE4-Gamは、16アミノ酸のXTENリンカーを介して、BE3、saBE3、BE4、及びsaBE4のN末端に融合した174残基のGamタンパク質を有する。
いくつかの実施形態では、アデノシン塩基編集体(ABE)は、DNA中のアデニンを脱アミノ化することができる。いくつかの実施形態では、ABEは、BE3のAPOBEC1成分を、天然または改変E. coli TadA、ヒトADAR2、マウスADA、またはヒトADAT2で置き換えることによって生成される。いくつかの実施形態では、ABEは、進化されたTadAバリアントを含む。いくつかの実施形態では、ABEは、ABE 1.2 (TadA*-XTEN-nCas9-NLS)である。いくつかの実施形態では、TadA*は、A106V及びD108N変異を含む。
いくつかの実施形態では、ABEは、第2世代のABEである。いくつかの実施形態では、ABEはABE2.1であり、これは、TadA*に追加の変異D147Y及びE155Vを含む(TadA*2.1)。いくつかの実施形態では、ABEはABE2.2であり、これは、触媒的に不活性化されたバージョンのヒトアルキルアデニンDNAグリコシラーゼ(E125Q変異を含むAAG)と融合させたABE2.1である。いくつかの実施形態では、ABEはABE2.3であり、これは、E. coli Endo Vの触媒的に不活性化されたバージョン(D35A変異で不活化した)に融合させたABE2.1である。いくつかの実施形態では、ABEはABE2.6であり、これは、ABE2.1のリンカーの2倍の長さのリンカー(32アミノ酸、(SGGS)2-XTEN-(SGGS)2)を有する。いくつかの実施形態では、ABEはABE2.7であり、これは、追加の野生型TadA単量体でつながれたABE2.1である。いくつかの実施形態では、ABEはABE2.8であり、これは、追加のTadA*2.1単量体でつながれたABE2.1である。いくつかの実施形態では、ABEは、ABE2.9であり、これは、ABE2.1のN末端への進化されたTadA (TadA*2.1)の直接融合体である。いくつかの実施形態では、ABEはABE2.10であり、ABE2.1のN末端への野生型TadAの直接融合体である。いくつかの実施形態では、ABEはABE2.11であり、これは、TadA*単量体のN末端に不活性化E59A変異を有するABE2.9である。いくつかの実施形態では、ABEはABE2.12であり、内部TadA*単量体に不活性化E59A変異を有するABE2.9である。
いくつかの実施形態では、ABEは、第3世代のABEである。いくつかの実施形態では、ABEはABE3.1であり、これは、3つの追加のTadA変異(L84F、H123Y、及びI157F)を有するABE2.3である。
いくつかの実施形態では、ABEは、第4世代のABEである。いくつかの実施形態では、ABEはABE4.3であり、これは、追加のTadA変異A142N (TadA*4.3)を有するABE3.1である。
いくつかの実施形態では、ABEは、第5世代のABEである。いくつかの実施形態では、ABEはABE5.1であり、これは、生存クローン由来の変異のコンセンサスセット(H36L、R51L、S146C、及びK157N)を、ABE3.1に取り入れることによって生成される。いくつかの実施形態では、ABEは、進化されたTadA*に内部で融合させた野生型E. coli TadAを含むヘテロ二量体構築物を有するABE5.3である。いくつかの実施形態では、ABEは、以下の表7に示すように、ABE5.2、ABE5.4、ABE5.5、ABE5.6、ABE5.7、ABE5.8、ABE5.9、ABE5.10、ABE5.11、ABE5.12、ABE5.13、またはABE5.14である。いくつかの実施形態では、ABEは、第6世代ABEである。いくつかの実施形態では、ABEは、以下の表7に示suように、ABE6.1、ABE6.2、ABE6.3、ABE6.4、ABE6.5、またはABE6.6である。いくつかの実施形態では、ABEは、第7世代のABEである。いくつかの実施形態では、ABEは、以下の表7に示すように、ABE7.1、ABE7.2、ABE7.3、ABE7.4、ABE7.5、ABE7.6、ABE7.7、ABE7.8、ABE7.9、またはABE7.10である。
Figure 2022532139000054
Figure 2022532139000055
いくつかの実施形態では、塩基編集体は、第8世代のABE (ABE8)である。いくつかの実施形態では、ABE8は、TadA*8バリアントを含む。いくつかの実施形態では、ABE8は、TadA*8バリアント(「ABE8.x-m」)を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8.1-mであり、これは、Y147T変異を有するTadA*7.10 (TadA*8.1)を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8.2-mであり、これは、Y147R変異を有するTadA*7.10 (TadA*8.2)を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8.3-mであり、これは、Q154S変異を有するTadA*7.10 (TadA*8.3)を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8.4-mであり、これは、Y123H変異を有するTadA*7.10 (TadA*8.4)を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8.5-mであり、これは、V82S変異を有するTadA*7.10 (TadA*8.5)を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8.6-mであり、これは、T166R変異を有するTadA*7.10 (TadA*8.6)を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8.7-mであり、これは、Q154R変異を有するTadA*7.10 (TadA*8.7)を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8.8-mであり、これは、Y147R、Q154R、及びY123H変異を有するTadA*7.10 (TadA*8.8)を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8.9-mであり、これは、Y147R、Q154R、及びI76Y変異を有するTadA*7.10 (TadA*8.9)を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8.10-mであり、これは、Y147R、Q154R、及びT166R変異を有するTadA*7.10 (TadA*8.10)を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8.11-mであり、これは、Y147T及びQ154R変異を有するTadA*7.10 (TadA*8.11)を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8.12-mであり、これは、Y147T及びQ154S変異を有するTadA*7.10 (TadA*8.12)を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8.13-mであり、これは、Y123H (H123Yから逆戻りしたY123H)、Y147R、Q154R及びI76Y変異を有するTadA*7.10 (TadA*8.13)を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8.14-mであり、これは、I76Y及びV82S変異を有するTadA*7.10 (TadA*8.14)を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8.15-mであり、これは、V82S及びY147R変異を有するTadA*7.10 (TadA*8.15)を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8.16-mであり、これは、V82S、Y123H (H123Yから逆戻りしたY123H)及びY147R変異を有するTadA*7.10 (TadA*8.16)を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8.17-mであり、これは、V82S及びQ154R変異を有するTadA*7.10 (TadA*8.17)を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8.18-mであり、これは、V82S、Y123H (H123Yから逆戻りしたY123H)及びQ154R変異を有するTadA*7.10 (TadA*8.18)を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8.19-mであり、これは、V82S、Y123H (H123Yから逆戻りしたY123H)、Y147R及びQ154R変異を有するTadA*7.10 (TadA*8.19)を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8.20-mであり、これは、I76Y、V82S、Y123H (H123Yから逆戻りしたY123H)、Y147R及びQ154R変異を有するTadA*7.10 (TadA*8.20)を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8.21-mであり、これは、Y147R及びQ154S変異を有するTadA*7.10 (TadA*8.21)を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8.22-mであり、これは、V82S及びQ154S変異を有するTadA*7.10 (TadA*8.22)を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8.23-mであり、これは、V82S及びY123H (H123Yから逆戻りしたY123H)変異を有するTadA*7.10 (TadA*8.23)を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8.24-mであり、これは、V82S、Y123H (H123Yから逆戻りしたY123H)、及びY147T変異を有するTadA*7.10 (TadA*8.24)を含む単量体構築物を有する。
いくつかの実施形態では、ABE8は、TadA*8バリアントに融合させた野生型E. coli TadAを含むヘテロ二量体構築物(「ABE8.x-d」)を有する。いくつかの実施形態では、ABE8はABE8.1-dであり、これは、Y147T変異を有するTadA*7.10 (TadA*8.1)に融合させた野生型E. coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.2-dであり、これは、Y147R変異を有するTadA*7.10 (TadA*8.2)に融合させた野生型E. coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.3-dであり、これは、Q154S変異を有するTadA*7.10 (TadA*8.3)に融合させた野生型E. coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.4-dであり、これは、Y123H変異を有するTadA*7.10 (TadA*8.4)に融合させた野生型E. coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.5-dであり、これは、V82S変異を有するTadA*7.10 (TadA*8.5)に融合させた野生型E. coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.6-dであり、これは、T166R変異を有するTadA*7.10 (TadA*8.6)に融合させた野生型E. coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.7-dであり、これは、Q154R変異を有するTadA*7.10 (TadA*8.7)に融合させた野生型E. coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.8-dであり、これは、Y147R、Q154R、及びY123H変異を有するTadA*7.10 (TadA*8.8)に融合させた野生型E. coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.9-dであり、これは、Y147R、Q154R及びI76Y変異を有するTadA*7.10 (TadA*8.9)に融合させた野生型E. coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.10-dであり、これは、Y147R、Q154R、及びT166R変異を有するTadA*7.10 (TadA*8.10)に融合させた野生型E. coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.11-dであり、これは、Y147T及びQ154R変異を有するTadA*7.10 (TadA*8.11)に融合させた野生型E. coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.12-dであり、これは、Y147T及びQ154S変異を有するTadA*7.10 (TadA*8.12)に融合させた野生型E. coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.13-dであり、これは、Y123H (H123Yから逆戻りしたY123H)、Y147R、Q154R及びI76Y変異を有するTadA*7.10 (TadA*8.13)に融合させた野生型E. coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.14-dであり、これは、I76Y及びV82S変異を有するTadA*7.10 (TadA*8.14)に融合させた野生型E. coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.15-dであり、これは、V82S及びY147R変異を有するTadA*7.10 (TadA*8.15)に融合させた野生型E. coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.16-dであり、これは、V82S、Y123H (H123Yから逆戻りしたY123H)及びY147R変異を有するTadA*7.10 (TadA*8.16)に融合させた野生型E. coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.17-dであり、これは、V82S及びQ154R変異を有するTadA*7.10 (TadA*8.17)に融合させた野生型E. coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.18-dであり、これは、V82S、Y123H (H123Yから逆戻りしたY123H)及びQ154R変異を有するTadA*7.10 (TadA*8.18)に融合させた野生型E. coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.19-dであり、これは、V82S、Y123H (H123Yから逆戻りしたY123H)、Y147R及びQ154R変異を有するTadA*7.10 (TadA*8.19)に融合させた野生型E. coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.20-dであり、これは、I76Y、V82S、Y123H (H123Yから逆戻りしたY123H)、Y147R及びQ154R変異を有するTadA*7.10 (TadA*8.20)に融合させた野生型E. coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.21-dであり、これは、Y147T及びQ154S変異を有するTadA*7.10 (TadA*8.21)に融合させた野生型E. coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.22-dであり、これは、V82S及びQ154S変異を有するTadA*7.10 (TadA*8.22)に融合させた野生型E. coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.23-dであり、これは、V82S及びY123H (H123Yから逆戻りしたY123H)変異を有するTadA*7.10 (TadA*8.23)に融合させた野生型E. coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.24-dであり、これは、V82S、Y123H (H123Yから逆戻りしたY123H)、及びY147T変異を有するTadA*7.10 (TadA*8.24)に融合させた野生型E. coli TadAを含むヘテロ二量体構築物を有する。
いくつかの実施形態では、ABE8は、TadA*8バリアントに融合させたTadA*7.10を含むヘテロ二量体構築物(「ABE8.x-7」)を有する。いくつかの実施形態では、ABE8はABE8.1-7であり、これは、Y147T変異を有するTadA*7.10 (TadA*8.1)に融合させたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.2-7であり、これは、Y147R変異を有するTadA*7.10 (TadA*8.2)に融合させたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.3-7であり、これは、Q154S変異を有するTadA*7.10 (TadA*8.3)に融合させたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.4-7であり、これは、Y123H変異を有するTadA*7.10 (TadA*8.4)に融合させたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.5-7であり、これは、V82S変異を有するTadA*7.10 (TadA*8.5)に融合させたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.6-7であり、これは、T166R変異を有するTadA*7.10 (TadA*8.6)に融合させたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.7-7であり、これは、Q154R変異を有するTadA*7.10 (TadA*8.7)に融合させたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.8-7であり、これは、Y147R、Q154R、及びY123H変異を有するTadA*7.10 (TadA*8.8)に融合させたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.9-7であり、これは、Y147R、Q154R及びI76Y変異を有するTadA*7.10 (TadA*8.9)に融合させたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.10-7であり、これは、Y147R、Q154R、及びT166R変異を有するTadA*7.10 (TadA*8.10)に融合させたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.11-7であり、これは、Y147T及びQ154R変異を有するTadA*7.10 (TadA*8.11)に融合させたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.12-7であり、これは、Y147T及びQ154S変異を有するTadA*7.10 (TadA*8.12)に融合させたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.13-7であり、これは、Y123H (H123Yから逆戻りしたY123H)、Y147R、Q154R及びI76Y変異を有するTadA*7.10 (TadA*8.13)に融合させたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.14-7であり、これは、I76Y及びV82S変異を有するTadA*7.10 (TadA*8.14)に融合させたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.15-7であり、これは、V82S及びY147R変異を有するTadA*7.10 (TadA*8.15)に融合させたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.16-7であり、これは、V82S、Y123H (H123Yから逆戻りしたY123H)及びY147R変異を有するTadA*7.10 (TadA*8.16)に融合させたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.17-7であり、これは、V82S及びQ154R変異を有するTadA*7.10 (TadA*8.17)に融合させたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.18-7であり、これは、V82S、Y123H (H123Yから逆戻りしたY123H)及びQ154R変異を有するTadA*7.10 (TadA*8.18)に融合させたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.19-7であり、これは、V82S、Y123H (H123Yから逆戻りしたY123H)、Y147R及びQ154R変異を有するTadA*7.10 (TadA*8.19)に融合させたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.20-7であり、これは、I76Y、V82S、Y123H (H123Yから逆戻りしたY123H)、Y147R及びQ154R変異を有するTadA*7.10 (TadA*8.20)に融合させたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.21-7であり、これは、Y147R及びQ154S変異を有するTadA*7.10 (TadA*8.21)に融合させたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.22-7であり、これは、V82S及びQ154S変異を有するTadA*7.10 (TadA*8.22)に融合させたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.23-7であり、これは、V82S及びY123H (H123Yから逆戻りしたY123H)変異を有するTadA*7.10 (TadA*8.23)に融合させたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.24-7であり、これは、V82S、Y123H (H123Yから逆戻りしたY123H)、及びY147T変異を有するTadA*7.10 (TadA*8.24)に融合させたTadA*7.10を含むヘテロ二量体構築物を有する。
いくつかの実施形態では、ABEは、以下の表8に示すように、ABE8.1-m、ABE8.2-m、ABE8.3-m、ABE8.4-m、ABE8.5-m、ABE8.6-m、ABE8.7-m、ABE8.8-m、ABE8.9-m、ABE8.10-m、ABE8.11-m、ABE8.12-m、ABE8.13-m、ABE8.14-m、ABE8.15-m、ABE8.16-m、ABE8.17-m、ABE8.18-m、ABE8.19-m、ABE8.20-m、ABE8.21-m、ABE8.22-m、ABE8.23-m、ABE8.24-m、ABE8.1-d、ABE8.2-d、ABE8.3-d、ABE8.4-d、ABE8.5-d、ABE8.6-d、ABE8.7-d、ABE8.8-d、ABE8.9-d、ABE8.10-d、ABE8.11-d、ABE8.12-d、ABE8.13-d、ABE8.14-d、ABE8.15-d、ABE8.16-d、ABE8.17-d、ABE8.18-d、ABE8.19-d、ABE8.20-d、ABE8.21-d、ABE8.22-d、ABE8.23-d、またはABE8.24-dである。
Figure 2022532139000056
Figure 2022532139000057
いくつかの実施形態では、塩基編集体(例えば、ABE8)は、アデノシンデアミナーゼバリアント(例えば、TadA*8)を、円順列変異体Cas9 (例えば、CP5またはCP6)及び二連の核局在化配列を含む骨格にクローニングすることによって生成される。いくつかの実施形態では、塩基編集体(例えば、ABE7.9、ABE7.10、またはABE8)は、NGC PAM CP5バリアント(S. pyrogenes Cas9またはspVRQR Cas9)である。いくつかの実施形態では、塩基編集体(例えば、ABE7.9、ABE7.10、またはABE8)は、AGA PAM CP5バリアント(S. pyrogenes Cas9またはspVRQR Cas9)である。いくつかの実施形態では、塩基編集体(例えば、ABE7.9、ABE7.10、またはABE8)は、NGC PAM CP6バリアント(S. pyrogenes Cas9またはspVRQR Cas9)である。いくつかの実施形態では、塩基編集体(例えば、ABE7.9、ABE7.10、またはABE8)は、AGA PAM CP6バリアント(S. pyrogenes Cas9またはspVRQR Cas9)である。
いくつかの実施形態では、ABEは、以下の表9に示すような遺伝子型を有する。
Figure 2022532139000058
以下の表10に示すように、40種類のABE8の遺伝子型を記載する。ABEの進化させたE. coli TadA部分における残基位置を示す。ABE7.10の変異と異なる場合のABE8における変異の変化を示している。いくつかの実施形態では、ABEは、以下の表10に示すようなABEのうちの1つの遺伝子型を有する。
Figure 2022532139000059
Figure 2022532139000060
いくつかの実施形態では、塩基編集体はABE8.1であり、アデノシンデアミナーゼ活性を有する以下の配列もしくはその断片を含むか、または本質的にそれらからなる:
ABE8.1_Y147T_CP5_NGC PAM_単量体
Figure 2022532139000061
上記の配列中、平文はアデノシンデアミナーゼ配列を示し、太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線が引かれた配列は二連の核局在化配列を示す。
いくつかの実施形態では、塩基編集体はABE8.1であり、アデノシンデアミナーゼ活性を有する以下の配列もしくはその断片を含むか、または本質的にそれらからなる:
pNMG-B335 ABE8.1_Y147T_CP5_NGC PAM_単量体
Figure 2022532139000062
上記の配列中、平文はアデノシンデアミナーゼ配列を示し、太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線が引かれた配列は二連の核局在化配列を示す。
いくつかの実施形態では、塩基編集体はABE8.14であり、アデノシンデアミナーゼ活性を有する以下の配列もしくはその断片を含むか、または本質的にそれらからなる:
NGC PAM CP5を有するpNMG-357_ABE8.14
Figure 2022532139000063
上記の配列中、平文はアデノシンデアミナーゼ配列を示し、太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線が引かれた配列は二連の核局在化配列を示す。
いくつかの実施形態では、塩基編集体はABE8.8-mであり、アデノシンデアミナーゼ活性を有する以下の配列もしくはその断片を含むか、または本質的にそれらからなる:
ABE8.8-m
Figure 2022532139000064
上記の配列中、平文はアデノシンデアミナーゼ配列を示し、太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線が引かれた配列は二連の核局在化配列を示し、二重下線の配列は変異を示す。
いくつかの実施形態では、塩基編集体はABE8.8-dであり、アデノシンデアミナーゼ活性を有する以下の配列もしくはその断片を含むか、または本質的にそれらからなる:
ABE8.8-d
Figure 2022532139000065
上記の配列中、平文はアデノシンデアミナーゼ配列を示し、太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線が引かれた配列は二連の核局在化配列を示し、二重下線の配列は変異を示す。
いくつかの実施形態では、塩基編集体はABE8.13-mであり、アデノシンデアミナーゼ活性を有する以下の配列もしくはその断片を含むか、または本質的にそれらからなる:
ABE8.13-m
Figure 2022532139000066
上記の配列中、平文はアデノシンデアミナーゼ配列を示し、太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線が引かれた配列は二連の核局在化配列を示し、二重下線の配列は変異を示す。
いくつかの実施形態では、塩基編集体はABE8.13-dであり、アデノシンデアミナーゼ活性を有する以下の配列もしくはその断片を含むか、または本質的にそれらからなる:
ABE8.13-d
Figure 2022532139000067
上記の配列中、平文はアデノシンデアミナーゼ配列を示し、太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線が引かれた配列は二連の核局在化配列を示し、二重下線の配列は変異を示す。
いくつかの実施形態では、塩基編集体はABE8.17-mであり、アデノシンデアミナーゼ活性を有する以下の配列もしくはその断片を含むか、または本質的にそれらからなる:
ABE8.17-m
Figure 2022532139000068
上記の配列中、平文はアデノシンデアミナーゼ配列を示し、太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線が引かれた配列は二連の核局在化配列を示し、二重下線の配列は変異を示す。
いくつかの実施形態では、塩基編集体はABE8.17-dであり、アデノシンデアミナーゼ活性を有する以下の配列もしくはその断片を含むか、または本質的にそれらからなる:
ABE8.17-d
Figure 2022532139000069
上記の配列中、平文はアデノシンデアミナーゼ配列を示し、太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線が引かれた配列は二連の核局在化配列を示し、二重下線の配列は変異を示す。
いくつかの実施形態では、塩基編集体はABE8.20-mであり、アデノシンデアミナーゼ活性を有する以下の配列もしくはその断片を含むか、または本質的にそれらからなる:
ABE8.20-m
Figure 2022532139000070
上記の配列中、平文はアデノシンデアミナーゼ配列を示し、太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線が引かれた配列は二連の核局在化配列を示し、二重下線の配列は変異を示す。
いくつかの実施形態では、塩基編集体はABE8.20-dであり、アデノシンデアミナーゼ活性を有する以下の配列もしくはその断片を含むか、または本質的にそれらからなる:
ABE8.20-d
Figure 2022532139000071
上記の配列中、平文はアデノシンデアミナーゼ配列を示し、太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線が引かれた配列は二連の核局在化配列を示し、二重下線の配列は変異を示す。
いくつかの実施形態では、本発明のABE8は、以下の配列から選択される:
01.monoABE8.1_bpNLS + Y147T
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
02.monoABE8.1_bpNLS + Y147R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCRFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
03.monoABE8.1_bpNLS + Q154S
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRSVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
04.monoABE8.1_bpNLS + Y123H
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
05.monoABE8.1_bpNLS + V82S
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYSTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
06.monoABE8.1_bpNLS + T166R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSRDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
07.monoABE8.1_bpNLS + Q154R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
08.monoABE8.1_bpNLS + Y147R_Q154R_Y123H
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
09.monoABE8.1_bpNLS + Y147R_Q154R_I76Y
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
10.monoABE8.1_bpNLS + Y147R_Q154R_T166R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSRDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
11.monoABE8.1_bpNLS + Y147T_Q154R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
12.monoABE8.1_bpNLS + Y147T_Q154S
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRSVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
13.monoABE8.1_bpNLS + H123Y123H_Y147R_Q154R_I76Y
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
14.monoABE8.1_bpNLS + V82S + Q154R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYSTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
いくつかの実施形態では、塩基編集体は、ウラシルグリコシラーゼ阻害因子(UGI)の全部または一部を含むドメインをさらに含む。いくつかの実施形態では、塩基編集体は、ウラシルDNAグリコシラーゼ(UDG)などのウラシル結合タンパク質(UBP)の全部または一部を含むドメインを含む。いくつかの実施形態では、塩基編集体は、核酸ポリメラーゼの全部または一部を含むドメインを含む。いくつかの実施形態では、塩基編集体に組み込まれる核酸ポリメラーゼまたはその一部は、損傷乗り越えDNAポリメラーゼである。
いくつかの実施形態では、塩基編集体のドメインは、複数のドメインを含み得る。例えば、Cas9に由来するポリヌクレオチドプログラム可能なヌクレオチド結合ドメインを含む塩基編集体は、野生型すなわち天然のCas9のRECローブ及びNUCローブに対応するRECローブ及びNUCローブを含み得る。別の例では、塩基編集体は、RuvCIドメイン、BHドメイン、REC1ドメイン、REC2ドメイン、RuvCIIドメイン、L1ドメイン、HNHドメイン、L2ドメイン、RuvCIIIドメイン、WEDドメイン、TOPOドメインまたはCTDドメインのうちの1つ以上を含み得る。いくつかの実施形態では、塩基編集体の1つ以上のドメインは、ドメインを含むポリペプチドの野生型バージョンと比較して、変異(例えば、置換、挿入、欠失)を含む。例えば、ポリヌクレオチドプログラム可能なDNA結合ドメインのHNHドメインは、H840A置換を含み得る。別の例では、ポリヌクレオチドプログラム可能なDNA結合ドメインのRuvCIドメインは、D10A置換を含み得る。
本明細書に開示する塩基編集体の異なるドメイン(例えば、隣接するドメイン)を、1つ以上のリンカードメイン(例えば、XTENリンカードメイン)を使用して、または使用せずに、互いに接続することができる。いくつかの実施形態では、リンカードメインは、2つの分子または部分、例えば、第1のドメイン(例えば、Cas9由来ドメイン)と第2のドメイン(例えば、アデノシンデアミナーゼドメインまたはシチジンデアミナーゼドメイン)などの融合タンパク質の2つのドメインを連結する結合(例えば、共有結合)、化学基、または分子であり得る。いくつかの実施形態では、リンカーは、共有結合(例えば、炭素-炭素結合、ジスルフィド結合、炭素-ヘテロ原子結合など)である。特定の実施形態では、リンカーは、アミド結合の炭素窒素結合である。特定の実施形態では、リンカーは、環状または非環状、置換または非置換、分岐または非分岐脂肪族またはヘテロ脂肪族リンカーである。特定の実施形態では、リンカーは重合体である(例えば、ポリエチレン、ポリエチレングリコール、ポリアミド、ポリエステルなど)。特定の実施形態では、リンカーは、アミノアルカン酸の単量体、二量体、または重合体を含む。いくつかの実施形態では、リンカーは、アミノアルカン酸(例えば、グリシン、エタン酸、アラニン、βアラニン、3-アミノプロパン酸、4-アミノブタン酸、5-ペンタン酸など)を含む。いくつかの実施形態では、リンカーは、アミノヘキサン酸(Ahx)の単量体、二量体、または重合体を含む。特定の実施形態では、リンカーは、炭素環部分(例えば、シクロペンタン、シクロヘキサン)に基づく。他の実施形態では、リンカーは、ポリエチレングリコール部分(PEG)を含む。特定の実施形態では、リンカーは、アリールまたはヘテロアリール部分を含む。特定の実施形態では、リンカーは、フェニル環に基づく。リンカーは、ペプチドからリンカーへの求核試薬(例えば、チオール、アミノ)の結合を容易にするための官能化部分を含み得る。任意の求電子試薬をリンカーの一部として使用することができる。例示的な求電子試薬として、活性化エステル、活性化アミド、マイケルアクセプター、ハロゲン化アルキル、ハロゲン化アリール、ハロゲン化アシル、及びイソチオシアネートが挙げられるが、これらに限定されない。いくつかの実施形態では、リンカーは、Cas9ヌクレアーゼドメインを含む、RNAプログラム可能なヌクレアーゼのgRNA結合ドメインと、核酸編集タンパク質の触媒ドメインを結合する。いくつかの実施形態では、リンカーは、dCas9と第2のドメイン(例えば、UGI、シチジンデアミナーゼなど)を結合する。
通常、リンカーは、2つの基、分子、または他の部分の間に位置するか、それらに隣接し、共有結合を介してそれぞれに接続し、したがって2つを接続する。いくつかの実施形態では、リンカーは、1つのアミノ酸または複数のアミノ酸(例えば、ペプチドまたはタンパク質)である。いくつかの実施形態では、リンカーは、有機分子、基、重合体、または化学部分である。いくつかの実施形態では、リンカーは、長さが約2~100アミノ酸、例えば、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24,25、26、27、28、29、30、30~35、35~40、40~45、45~50、50~60、60~70、70~80、80~90、90~100、100~150、または150~200アミノ酸の長さであり得る。いくつかの実施形態では、リンカーは、長さが約3~約104 (例えば、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、55、60、65、70、75、80、85、90、95、または100)アミノ酸である。より長いかまたはより短いリンカーもまた企図される。いくつかの実施形態では、リンカードメインは、アミノ酸配列SGSETPGTSESATPESを含み、この配列はXTENリンカーとも呼ばれる場合がある。融合タンパク質ドメインを連結するための任意の方法を使用することができる(例えば、核酸塩基編集体の活性にとって最適な長さを達成するための、(SGGS)n、(GGGS)n、(GGGGS)n、及び(G)nの形態の非常に柔軟なリンカーから、(EAAAK)n、(GGS)n、SGSETPGTSESATPES(例えば、Guilinger JP,Thompson DB,Liu DR.Fusion of catalytically inactive Cas9 to FokI nuclease improves the specificity of genome modification.Nat.Biotechnol.2014;32 (6):577-82を参照されたい;その全内容は、参照により本明細書に援用される)、または(XP)nモチーフの形態のより強固なリンカーまでの範囲で)。いくつかの実施形態では、nは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、または15である。いくつかの実施形態では、リンカーは、(GGS)nモチーフを含み、nは、1、3、または7である。いくつかの実施形態では、本明細書中で提供する融合タンパク質のCas9ドメインを、アミノ酸配列SGSETPGTSESATPESを含むリンカーを介して融合させる。いくつかの実施形態では、リンカーは、複数のプロリン残基を含み、長さが5~21、5~14、5~9、5~7アミノ酸であり、例えば、PAPAP、PAPAPA、PAPAPAP、PAPAPAPA、P(AP)4、P(AP)7、P(AP)10 (例えば、Tan J,Zhang F,Karcher D,Bock R. Engineering of high-precision base editors for site-specific single nucleotide replacement.Nat Commun.2019 Jan 25;10 (1):439を参照されたい;全内容は参照により本明細書に援用される)。そのようなプロリンリッチなリンカーは、「強固な」リンカーとも呼ばれる。
リンカー
特定の実施形態では、リンカーを使用して、本発明のペプチドまたはペプチドドメインのいずれかを連結してもよい。リンカーは、共有結合のように単純であってもよく、または数原子の長さの高分子リンカーであってもよい。特定の実施形態では、リンカーは、ポリペプチドであるか、またはアミノ酸に基づく。他の実施形態では、リンカーはペプチド様ではない。他の実施形態では、リンカーは、共有結合(例えば、炭素-炭素結合、ジスルフィド結合、炭素-ヘテロ原子結合など)である。特定の実施形態では、リンカーは、アミド結合の炭素窒素結合である。特定の実施形態では、リンカーは、環状または非環状、置換または非置換、分岐または非分岐脂肪族またはヘテロ脂肪族リンカーである。特定の実施形態では、リンカーは重合体である(例えば、ポリエチレン、ポリエチレングリコール、ポリアミド、ポリエステルなど)。特定の実施形態では、リンカーは、アミノアルカン酸の単量体、二量体、または重合体を含む。特定の実施形態では、リンカーは、アミノアルカン酸(例えば、グリシン、エタン酸、アラニン、βアラニン、3-アミノプロパン酸、4-アミノブタン酸、5-ペンタン酸など)を含む。特定の実施形態では、リンカーは、アミノヘキサン酸(Ahx)の単量体、二量体、または重合体を含む。特定の実施形態では、リンカーは、炭素環部分(例えば、シクロペンタン、シクロヘキサン)に基づく。他の実施形態では、リンカーは、ポリエチレングリコール部分(PEG)を含む。他の実施形態では、リンカーは、アミノ酸を含む。特定の実施形態では、リンカーはペプチドを含む。特定の実施形態では、リンカーは、アリールまたはヘテロアリール部分を含む。特定の実施形態では、リンカーは、フェニル環に基づく。リンカーは、ペプチドからリンカーへの求核試薬(例えば、チオール、アミノ)の結合を容易にするための官能化部分を含み得る。任意の求電子試薬をリンカーの一部として使用してもよい。例示的な求電子試薬として、活性化エステル、活性化アミド、マイケルアクセプター、ハロゲン化アルキル、ハロゲン化アリール、ハロゲン化アシル、及びイソチオシアネートが挙げられるが、これらに限定されない。
いくつかの実施形態では、リンカーは、1つのアミノ酸または複数のアミノ酸(例えば、ペプチドまたはタンパク質)である。いくつかの実施形態では、リンカーは、結合(例えば、共有結合)、有機分子、基、重合体、または化学部分である。いくつかの実施形態では、リンカーは、長さが約3~約104 (例えば、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、55、60、65、70、75、80、85、90、95、または100)アミノ酸である。
いくつかの実施形態では、シチジンデアミナーゼ及びアデノシンデアミナーゼ、ならびにnapDNAbpを、4、16、32、または104アミノ酸の長さのリンカーを介して融合させる。いくつかの実施形態では、リンカーは、3~104アミノ酸長である。いくつかの実施形態では、本明細書中で提供する融合タンパク質のいずれかは、リンカーを介して互いに融合したシチジンデアミナーゼ、アデノシンデアミナーゼ、及びCas9ドメインを含む。デアミナーゼドメイン(例えば、改変ecTadA)とCas9ドメインの間の様々なリンカーの長さ及び柔軟性を使用することができる(例えば、核酸塩基編集体の活性にとって最適な長さを達成するための、(GGGS)n、(GGGGS)n、及び(G)nの形態の非常に柔軟なリンカーから、(EAAAK)n、(SGGS)n、SGSETPGTSESATPES (例えば、Guilinger JP,Thompson DB,Liu DR.Fusion of catalytically inactive Cas9 to FokI nuclease improves the specificity of genome modification. Nat.Biotechnol.2014;32 (6):577-82を参照されたい;その全内容は、参照により本明細書に援用される)、及び(XP)nの形態のより強固なリンカーまでの範囲で)。いくつかの実施形態では、nは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、または15である。いくつかの実施形態では、リンカーは、(GGS)nモチーフを含み、nは、1、3、または7である。いくつかの実施形態では、本明細書中で提供する融合タンパク質のいずれかのシチジンデアミナーゼ及びアデノシンデアミナーゼならびにCas9ドメインを、アミノ酸配列SGSETPGTSESATPESを含むリンカー(例えば、XTENリンカー)を介して融合させる。
いくつかの実施形態では、標的領域は、標的ウィンドウを含み、標的ウィンドウは、標的核酸塩基対を含む。いくつかの実施形態では、標的ウィンドウは、1~10ヌクレオチドを含む。いくつかの実施形態では、標的ウィンドウは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド長である。いくつかの実施形態では、意図する塩基対の編集は、標的ウィンドウ内である。いくつかの実施形態では、標的ウィンドウは、意図する塩基対の編集を含む。いくつかの実施形態では、方法を、本明細書中で提供する塩基編集体のいずれかを使用して実施する。いくつかの実施形態では、標的ウィンドウは脱アミノ化ウィンドウである。
さらに、いくつかの場合では、Gamタンパク質を、塩基編集体のN末端に融合させることができる。いくつかの場合では、Gamタンパク質を、塩基編集体のC末端に融合させることができる。バクテリオファージMuのGamタンパク質は、二本鎖切断(DSB)の末端に結合し、それらを分解から保護することができる。いくつかの実施形態では、Gamを使用してDSBの自由端を結合することにより、塩基編集のプロセス中のインデル形成を低減することができる。いくつかの実施形態では、174残基のGamタンパク質を、塩基編集体のN末端に融合させる。Komor, A.C., et al., ”Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao 4774 (2017)を参照されたい。いくつかの場合では、1つ以上の変異は、野生型ドメインと比較して、塩基編集体ドメインの長さを変えることができる。例えば、少なくとも1つのドメインの少なくとも1つのアミノ酸を欠失させることにより、塩基編集体の長さを短くすることができる。別の場合では、1つの変異または複数の変異は、野生型ドメインと比較して、ドメインの長さを変化させない。例えば、任意のドメインにおける置換(複数可)は、塩基編集体の長さを変化させない。
いくつかの実施形態では、本明細書中で提供する塩基編集融合タンパク質は、正確な位置、例えば、定義された領域(例えば、「脱アミノ化ウィンドウ」)内の標的塩基が位置する場所に配置される必要がある。いくつかの場合では、標的は、4塩基領域内にあり得る。いくつかの場合では、そのような定義された標的領域は、PAMのおよそ15塩基上流にあり得る。Komor, A.C., et al., ”Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533,420-424 (2016);Gaudelli, N.M., et al., ”Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551,464-471 (2017);Komor, A.C., et al., ”Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao 4774 (2017)も参照されたい(その全内容は、参照により本明細書に援用される)。
定義された標的領域は、脱アミノ化ウィンドウで有り得る。脱アミノ化ウィンドウは、塩基編集体が標的ヌクレオチドに作用して脱アミノ化する定義された領域であり得る。いくつかの実施形態では、脱アミノ化ウィンドウは、2、3、4、5、6、7、8、9、または10塩基領域内である。いくつかの実施形態では、脱アミノ化ウィンドウは、PAMの5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、または25塩基上流である。
本開示の塩基編集体は、標的ポリヌクレオチド配列の編集を容易にする任意のドメイン、特性、またはアミノ酸配列を含み得る。例えば、いくつかの実施形態では、塩基編集体は、核局在化配列(NLS)を含む。いくつかの実施形態では、塩基編集体のNLSを、デアミナーゼドメインとポリヌクレオチドプログラム可能なヌクレオチド結合ドメインの間に局在させる。いくつかの実施形態では、塩基編集体のNLSを、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインのC末端に局在させる。
本明細書に開示するように、塩基編集体に存在し得る他の例示的な特性は、細胞質局在化配列、核外輸送配列などの輸出配列、または他の局在化配列などの局在化配列、ならびに融合タンパク質の可溶化、精製、または検出に有用な配列タグである。本明細書中で提供する適切なタンパク質タグとして、ビオチンカルボキシラーゼキャリアタンパク質(BCCP)タグ、mycタグ、カルモジュリンタグ、FLAGタグ、ヘマグルチニン(HA)タグ、ヒスチジンタグまたはHisタグとも呼ばれるポリヒスチジンタグ、マルトース結合タンパク質(MBP)タグ、nusタグ、グルタチオン-S-トランスフェラーゼ(GST)タグ、緑色蛍光タンパク質(GFP)タグ、チオレドキシンタグ、Sタグ、Softag (例えば、Softag1、Softag3)、strepタグ、ビオチンリガーゼタグ、FlAsHタグ、V5タグ、及びSBPタグが挙げられるが、これらに限定されない。追加の適切な配列は当業者には明らかであろう。いくつかの実施形態では、融合タンパク質は、1つ以上のHisタグを含む。
融合タンパク質に含めることができるタンパク質ドメインの非限定的な例として、デアミナーゼドメイン(例えば、シチジンデアミナーゼ、アデノシンデアミナーゼ)、ウラシルグリコシラーゼ阻害因子(UGI)ドメイン、エピトープタグ、及びレポーター遺伝子配列が挙げられる。
エピトープタグの非限定的な例として、ヒスチジン(His)タグ、V5タグ、FLAGタグ、インフルエンザヘマグルチニン(HA)タグ、Mycタグ、VSV-Gタグ、及びチオレドキシン(Trx)タグが挙げられる。レポーター遺伝子の例として、グルタチオン-5-トランスフェラーゼ(GST)、セイヨウワサビペルオキシダーゼ(HRP)、クロラムフェニコールアセチルトランスフェラーゼ(CAT)βガラクトシダーゼ、βグルクロニダーゼ、ルシフェラーゼ、緑色蛍光タンパク質(GFP)、HcRed、DsRed、シアン蛍光タンパク質(CFP)、黄色蛍光タンパク質(YFP)、及び青色蛍光タンパク質(BFP)を含む自己蛍光タンパク質が挙げられるが、これらに限定されない。追加のタンパク質配列として、マルトース結合タンパク質(MBP)、Sタグ、Lex A DNA結合ドメイン(DBD)融合体、GAL4 DNA結合ドメイン融合体、及び単純ヘルペスウイルス(HSV)BP16タンパク質融合体を含むがこれらに限定されない、DNA分子または他の細胞分子に結合するアミノ酸配列が挙げられ得る。
塩基編集体の効率
CRISPR-Cas9ヌクレアーゼは、標的ゲノム編集を媒介するために広く使用されている。多くのゲノム編集用途では、Cas9はガイドポリヌクレオチド(例えば、単一のガイドRNA (sgRNA))と複合体を形成し、sgRNA配列で指定された標的部位で二本鎖DNA切断(DSB)を誘導する。細胞は主に、非相同末端結合(NHEJ)修復経路を介してこのDSBに応答し、これにより、遺伝子を破壊するフレームシフト変異を引き起こし得る確率的挿入または欠失(インデル)が生じる。DSBに隣接する配列と高度な相同性を有するドナーDNAテンプレートが存在する場合、相同組換え修復(HDR)として知られる代替経路を介して遺伝子改変を達成することができる。残念ながら、ほとんどの非摂動条件下では、HDRは非効率的であり、細胞の状態及び細胞型に依存し、より高頻度のインデルの方が優先する。本明細書中で提供する塩基編集系は、二本鎖DNA切断を生成することなく、ドナーDNAテンプレートを必要とせず、そして過剰な確率的挿入及び欠失を誘発することなく、ゲノム編集を提供する新規方法を提供する。
本明細書中で提供する塩基編集体は、有意な割合のインデルを生成することなく、特定のヌクレオチド塩基を改変することができる。本明細書中で使用する場合、用語「インデル(複数可)」とは、核酸内のヌクレオチド塩基の挿入または欠失を指す。そのような挿入または欠失は、遺伝子のコード領域内のフレームシフト変異を生じさせ得る。いくつかの実施形態では、標的ヌクレオチド配列に多数の挿入または欠失(すなわち、インデル)を生成することなく、核酸内の特定のヌクレオチドを効率的に改変(例えば、変異または脱アミノ化)する塩基編集体を生成することが望ましい。特定の実施形態では、本明細書中で提供する塩基編集体のいずれも、意図する改変(例えば、点変異または脱アミノ化)を、インデルに比べてより大きな割合で生成することができる。
いくつかの実施形態では、本明細書中で提供する塩基編集系のいずれかは、標的ポリヌクレオチド配列に、50%未満、40%未満、30%未満、20%未満、19%未満、18%未満、17%未満、16%未満、15%未満、14%未満、13%未満、12%未満、11%未満、10%未満、9%未満、8%未満、7%未満、6%未満、5%未満、4%未満、3%未満、2%未満、1%未満、0.9%未満、0.8%未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.09%未満、0.08%未満、0.07%未満、0.06%未満、0.05%未満、0.04%未満、0.03%未満、0.02%未満、または0.01%未満のインデル形成をもたらす。
いくつかの実施形態では、本明細書に記載のABE8塩基編集体バリアントのうちの1つを含む塩基編集系のいずれかは、標的ポリヌクレオチド配列に、50%未満、40%未満、30%未満、20%未満、19%未満、18%未満、17%未満、16%未満、15%未満、14%未満、13%未満、12%未満、11%未満、10%未満、9%未満、8%未満、7%未満、6%未満、5%未満、4%未満、3%未満、2%未満、1%未満、0.9%未満、0.8%未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.09%未満、0.08%未満、0.07%未満、0.06%未満、0.05%未満、0.04%未満、0.03%未満、0.02%未満、または0.01%未満のインデル形成をもたらす。
いくつかの実施形態では、本明細書に記載のABE8塩基編集体バリアントの1つを含む塩基編集系のいずれかは、標的ポリヌクレオチド配列に0.8%未満のインデル形成をもたらす。いくつかの実施形態では、本明細書に記載のABE8塩基編集体バリアントの1つを含む塩基編集系のいずれかは、標的ポリヌクレオチド配列に多くとも0.8%のインデル形成をもたらす。いくつかの実施形態では、本明細書に記載のABE8塩基編集体バリアントの1つを含む塩基編集系のいずれかは、標的ポリヌクレオチド配列に0.3%未満のインデル形成をもたらす。いくつかの実施形態では、記載するABE8塩基編集体バリアントの1つを含む塩基編集系のいずれかは、ABE7塩基編集体の1つを含む塩基編集系と比較して、標的ポリヌクレオチド配列に、より低いインデル形成をもたらす。いくつかの実施形態では、本明細書に記載のABE8塩基編集体バリアントの1つを含む塩基編集系のいずれかは、ABE7.10を含む塩基編集系と比較して、標的ポリヌクレオチド配列に、より低いインデル形成をもたらす。
いくつかの実施形態では、本明細書に記載のABE8塩基編集体バリアントの1つを含む塩基編集系のいずれも、ABE7塩基編集体の1つを含む塩基編集系と比較して、インデル頻度が低下している。いくつかの実施形態では、本明細書に記載のABE8塩基編集体バリアントの1つを含む塩基編集系のいずれかは、ABE7塩基編集体の1つを含む塩基編集系と比較して、インデル頻度が少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、または少なくとも95%低下している。いくつかの実施形態では、本明細書に記載のABE8塩基編集体バリアントの1つを含む塩基編集系は、ABE7.10を含む塩基編集系と比較して、インデル頻度が少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、または少なくとも95%低下している。
本開示は、効率及び特異性が向上したアデノシンデアミナーゼバリアント(例えば、ABE8バリアント)を提供する。特に、本明細書に記載のアデノシンデアミナーゼバリアントは、ポリヌクレオチド内の所望の塩基を編集する可能性は高く、改変することを意図していない塩基(例えば、「バイスタンダー」)を編集する可能性は低い。
いくつかの実施形態では、本明細書に記載のABE8塩基編集体バリアントの1つを含む塩基編集系のいずれかは、バイスタンダーの編集または変異が低下している。いくつかの実施形態では、意図しない編集または変異は、バイスタンダー変異またはバイスタンダー編集、例えば、標的ヌクレオチド配列の標的ウィンドウ内の意図しないまたは非標的位置での標的塩基(例えば、AまたはC)の塩基編集である。いくつかの実施形態では、本明細書に記載のABE8塩基編集体バリアントの1つを含む塩基編集系のいずれかは、ABE7塩基編集体、例えば、ABE7.10を含む塩基編集系と比較して、バイスタンダー編集または変異が低下している。いくつかの実施形態では、本明細書に記載のABE8塩基編集体バリアントの1つを含む塩基編集系のいずれかは、ABE7塩基編集体、例えば、ABE7.10を含む塩基編集系と比較して、バイスタンダー編集または変異が、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%低下している。いくつかの実施形態では、本明細書に記載のABE8塩基編集体バリアントの1つを含む塩基編集系のいずれかは、ABE7塩基編集体、例えば、ABE7.10を含む塩基編集系と比較して、バイスタンダー編集または変異が、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、または少なくとも3.0倍低下している。
いくつかの実施形態では、本明細書に記載のABE8塩基編集体バリアントの1つを含む塩基編集系のいずれかは、目的外編集が低下している。いくつかの実施形態では、意図しない編集または変異とは、目的外変異または目的外編集、例えば、ゲノムの意図しないかまたは非標的領域における標的塩基(例えば、AまたはC)の非特異的編集またはガイド非依存的編集である。いくつかの実施形態では、本明細書に記載のABE8塩基編集体バリアントの1つを含む塩基編集系のいずれかは、ABE7塩基編集体、例えば、ABE7.10を含む塩基編集系と比較して、目的外編集が低下している。いくつかの実施形態では、本明細書に記載のABE8塩基編集体バリアントの1つを含む塩基編集系のいずれかは、ABE7塩基編集体、例えば、ABE7.10を含む塩基編集系と比較して、目的外編集が、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%低下している。いくつかの実施形態では、本明細書に記載のABE8塩基編集体バリアントの1つを含む塩基編集系のいずれかは、ABE7塩基編集体、例えば、ABE7.10を含む塩基編集系と比較して、目的外編集が、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、または少なくとも3.0倍低下している。
本開示のいくつかの態様は、本明細書中で提供する塩基編集体のいずれかが、核酸(例えば、対象のゲノム内の核酸)において、有意な数の意図しない変異、例えば、意図しない点変異(すなわち、バイスタンダー変異)を生成することなく、点変異などの意図する変異を効率的に生成することができるという認識に基づく。いくつかの実施形態では、本明細書中で提供する塩基編集体のいずれかは、意図する変異を少なくとも0.01%生成することができる(すなわち、少なくとも0.01%の塩基編集効率で)。いくつかの実施形態では、本明細書中で提供する塩基編集体のいずれかは、意図する変異を、少なくとも0.01%、1%、2%、3%、4%、5%、10%、15%、20%、25%、30%、40%、45%、50%、60%、70%、80%、90%、95%、または99%生成することができる。
いくつかの実施形態では、本明細書に記載のABE8塩基編集体バリアントのいずれかは、少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%の塩基編集効率を有する。いくつかの実施形態では、塩基編集効率は、細胞集団内の編集された核酸塩基の割合を計算することによって測定してもよい。いくつかの実施形態では、本明細書に記載のABE8塩基編集体バリアントのいずれかは、細胞集団内の編集された核酸塩基の測定で、少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%の塩基編集効率を有する。
いくつかの実施形態では、本明細書に記載のABE8塩基編集体バリアントのいずれかは、ABE7塩基編集体と比較して、より高い塩基編集効率を有する。いくつかの実施形態では、本明細書に記載のABE8塩基編集体バリアントのいずれかは、ABE7塩基編集体、例えば、ABE7.10と比較して、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも99%、少なくとも100%、少なくとも105%、少なくとも110%、少なくとも115%、少なくとも120%、少なくとも125%、少なくとも130%、少なくとも135%、少なくとも140%、少なくとも145%、少なくとも150%、少なくとも155%、少なくとも160%、少なくとも165%、少なくとも170%、少なくとも175%、少なくとも180%、少なくとも185%、少なくとも190%、少なくとも195%、少なくとも200%、少なくとも210%、少なくとも220%、少なくとも230%、少なくとも240%、少なくとも250%、少なくとも260%、少なくとも270%、少なくとも280%、少なくとも290%、少なくとも300%、少なくとも310%、少なくとも320%、少なくとも330%、少なくとも340%、少なくとも350%、少なくとも360%、少なくとも370%、少なくとも380%、少なくとも390%、少なくとも400%、少なくとも450%、または少なくとも500%高い塩基編集効率を有する。
いくつかの実施形態では、本明細書に記載のABE8塩基編集体バリアントのいずれかは、ABE7塩基編集体、例えば、ABE7.10と比較して、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、少なくとも3.0倍、少なくとも3.1倍、少なくとも3.2、少なくとも3.3倍、少なくとも3.4倍、少なくとも3.5倍、少なくとも3.6倍、少なくとも3.7倍、少なくとも3.8倍、少なくとも3.9倍、少なくとも4.0倍、少なくとも4.1倍、少なくとも4.2倍、少なくとも4.3倍、少なくとも4.4倍、少なくとも4.5倍、少なくとも4.6倍、少なくとも4.7倍、少なくとも4.8倍、少なくとも4.9倍、または少なくとも5.0倍高い塩基編集効率を有する。
いくつかの実施形態では、本明細書に記載のABE8塩基編集体バリアントのいずれかは、少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%のオンターゲット塩基編集効率を有する。いくつかの実施形態では、本明細書に記載のABE8塩基編集体バリアントのいずれかは、細胞集団内の編集された標的核酸塩基の測定で、少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%のオンターゲット塩基編集効率を有する。
いくつかの実施形態では、本明細書に記載のABE8塩基編集体バリアントのいずれかは、ABE7塩基編集体と比較して、より高いオンターゲット塩基編集効率を有する。いくつかの実施形態では、本明細書に記載のABE8塩基編集体バリアントのいずれかは、ABE7塩基編集体、例えば、ABE7.10と比較して、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも99%、少なくとも100%、少なくとも105%、少なくとも110%、少なくとも115%、少なくとも120%、少なくとも125%、少なくとも130%、少なくとも135%、少なくとも140%、少なくとも145%、少なくとも150%、少なくとも155%、少なくとも160%、少なくとも165%、少なくとも170%、少なくとも175%、少なくとも180%、少なくとも185%、少なくとも190%、少なくとも195%、少なくとも200%、少なくとも210%、少なくとも220%、少なくとも230%、少なくとも240%、少なくとも250%、少なくとも260%、少なくとも270%、少なくとも280%、少なくとも290%、少なくとも300%、少なくとも310%、少なくとも320%、少なくとも330%、少なくとも340%、少なくとも350%、少なくとも360%、少なくとも370%、少なくとも380%、少なくとも390%、少なくとも400%、少なくとも450%、または少なくとも500%高いオンターゲット塩基編集効率を有する。
いくつかの実施形態では、本明細書に記載のABE8塩基編集体バリアントのいずれかは、ABE7塩基編集体、例えば、ABE7.10と比較して、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、少なくとも3.0倍、少なくとも3.1倍、少なくとも3.2倍、少なくとも3.3倍、少なくとも3.4倍、少なくとも3.5倍、少なくとも3.6倍、少なくとも3.7倍、少なくとも3.8倍、少なくとも3.9倍、少なくとも4.0倍、少なくとも4.1倍、少なくとも4.2倍、少なくとも4.3倍、少なくとも4.4倍、少なくとも4.5倍、少なくとも4.6倍、少なくとも4.7倍、少なくとも4.8倍、少なくとも4.9倍、または少なくとも5.0倍高いオンターゲット塩基編集効率を有する。
本明細書に記載のABE8塩基編集体バリアントは、プラスミド、ベクター、LNP複合体、またはmRNAを介して宿主細胞に送達してもよい。いくつかの実施形態では、本明細書に記載のABE8塩基編集体バリアントのいずれかを、mRNAとして宿主細胞に送達する。いくつかの実施形態では、核酸ベースの送達系、例えば、mRNAを介して送達されるABE8塩基編集体は、編集された核酸塩基の測定で、少なくとも少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%のオンターゲット編集効率を有する。いくつかの実施形態では、mRNA系によって送達されるABE8塩基編集体は、プラスミドまたはベクター系によって送達されるABE8塩基編集体と比較して、より高い塩基編集効率を有する。いくつかの実施形態では、本明細書に記載のABE8塩基編集体バリアントのいずれかは、mRNA系で送達される場合、プラスミドもしくはベクター系で送達される場合と比較して、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも99%、少なくとも100%、少なくとも105%、少なくとも110%、少なくとも115%、少なくとも120%、少なくとも125%、少なくとも130%、少なくとも135%、少なくとも140%、少なくとも145%、少なくとも150%、少なくとも155%、少なくとも160%、少なくとも165%、少なくとも170%、少なくとも175%、少なくとも180%、少なくとも185%、少なくとも190%、少なくとも195%、少なくとも200%、少なくとも210%、少なくとも220%、少なくとも230%、少なくとも240%、少なくとも250%、少なくとも260%、少なくとも270%、少なくとも280%、少なくとも290%、少なくとも300%高い、少なくとも310%、少なくとも320%、少なくとも330%、少なくとも340%、少なくとも350%、少なくとも360%、少なくとも370%、少なくとも380%、少なくとも390%、少なくとも400%、少なくとも450%、または少なくとも500%のオンターゲット編集効率を有する。いくつかの実施形態では、本明細書に記載のABE8塩基編集体バリアントのいずれかは、mRNA系で送達される場合、プラスミドもしくはベクター系で送達される場合と比較して、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、少なくとも3.0倍、少なくとも3.1倍、少なくとも3.2倍、少なくとも3.3倍、少なくとも3.4倍、少なくとも3.5倍、少なくとも3.6倍、少なくとも3.7倍、少なくとも3.8倍、少なくとも3.9倍、少なくとも4.0倍、少なくとも4.1倍、少なくとも4.2倍、少なくとも4.3倍、少なくとも4.4倍、少なくとも4.5倍、少なくとも4.6倍、少なくとも4.7倍、少なくとも4.8倍、少なくとも4.9倍、または少なくとも5.0倍高いオンターゲット編集効率を有する。
いくつかの実施形態では、本明細書に記載のABE8塩基編集体バリアントのうちの1つを含む塩基編集系のいずれかは、標的ポリヌクレオチド配列に、50%未満、40%未満、30%未満、20%未満、19%未満、18%未満、17%未満、16%未満、15%未満、14%未満、13%未満、12%未満、11%未満、10%未満、9%未満、8%未満、7%未満、6%未満、5%未満、4%未満、3%未満、2%未満、1%未満、0.9%未満、0.8%未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.09%未満、0.08%未満、0.07%未満、0.06%未満、0.05%未満、0.04%未満、0.03%未満、0.02%未満、または0.01%未満のオフターゲット編集をもたらす。
いくつかの実施形態では、本明細書に記載のABE8塩基編集体バリアントのいずれかは、mRNA系で送達される場合、プラスミドまたはベクター系で送達される場合と比較して、ガイドされるオフターゲット編集効率が低い。いくつかの実施形態では、本明細書に記載のABE8塩基編集体バリアントのいずれかは、mRNA系で送達される場合、プラスミドまたはベクター系で送達される場合と比較して、ガイドされるオフターゲット編集効率が、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%低い。いくつかの実施形態では、本明細書に記載のABE8塩基編集体バリアントのいずれかは、mRNA系で送達される場合、プラスミドまたはベクター系で送達される場合と比較して、ガイドされるオフターゲット編集効率が、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、または少なくとも3.0倍低い。いくつかの実施形態では、本明細書に記載のABE8塩基編集体バリアントのいずれかは、mRNA系で送達される場合、プラスミドまたはベクター系で送達される場合と比較して、ガイドされるオフターゲット編集効率が、少なくとも約2.2倍低い。
いくつかの実施形態では、本明細書に記載のABE8塩基編集体バリアントのいずれかは、mRNA系で送達される場合、プラスミドまたはベクター系で送達される場合と比較して、ガイド非依存的なオフターゲット編集効率が低い。いくつかの実施形態では、本明細書に記載のABE8塩基編集体バリアントのいずれかは、mRNA系で送達される場合、プラスミドまたはベクター系で送達される場合と比較して、ガイド非依存的なオフターゲット編集効率が、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%低い。いくつかの実施形態では、本明細書に記載のABE8塩基編集体バリアントのいずれかは、mRNA系で送達される場合、プラスミドまたはベクター系で送達される場合と比較して、ガイド非依存的なオフターゲット編集効率が、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、少なくとも3.0倍、少なくとも5.0倍、少なくとも10.0倍、少なくとも20.0倍、少なくとも50.0倍、少なくとも70.0倍、少なくとも100.0倍、少なくとも120.0倍、少なくとも130.0倍、または少なくとも150.0倍低い。いくつかの実施形態では、本明細書に記載のABE8塩基編集体バリアントは、mRNA系で送達される場合、プラスミドまたはベクター系で送達される場合と比較して、ガイド非依存的なオフターゲット編集効率(例えば、目的外RNA脱アミノ化)が134.0倍低下する。いくつかの実施形態では、本明細書に記載のABE8塩基編集体バリアントは、ゲノム全体でのガイド非依存的な変異率を増加させない。
本開示のいくつかの態様は、本明細書中で提供する塩基編集体のいずれかが、核酸(例えば、対象のゲノム内の核酸)において、有意な数の意図しない変異、例えば、意図しない点変異を生成することなく、点変異などの意図する変異を効率的に生成することができるという認識に基づく。いくつかの実施形態では、本明細書中で提供する塩基編集体のいずれかは、意図する変異を少なくとも0.01%生成することができる(例えば、目的外オフターゲット編集またはバイスタンダー編集)。いくつかの実施形態では、意図される変異は、標的遺伝子における変異を改変または修正するように特別に設計された、gRNAに結合した特定の塩基編集体によって生成される変異である。本開示のいくつかの態様は、本明細書中で提供する塩基編集体のいずれかが、核酸(例えば、対象のゲノム内の核酸)において、有意な数の意図しない変異を生成することなく、意図する変異を効率的に生成することができるという認識に基づく。いくつかの実施形態では、意図される変異は、意図される変異を改変または修正するように特別に設計された、gRNAに結合した特定の塩基編集体によって生成される変異である。いくつかの実施形態では、意図する変異は、終止コドン、例えば、遺伝子のコード領域内の未成熟終止コドンを生成する変異である。いくつかの実施形態では、意図する変異は、終止コドンを排除する変異である。いくつかの実施形態では、意図する変異は、遺伝子のスプライシングを改変する変異である。いくつかの実施形態では、意図する変異は、遺伝子の調節配列(例えば、遺伝子プロモーターまたは遺伝子リプレッサー)を改変する変異である。いくつかの実施形態では、本明細書中で提供する塩基編集体は、意図する点変異とインデルとの1:1を上回る比を生成し得る。いくつかの実施形態では、本明細書中で提供する塩基編集体は、意図する点変異とインデルとの、少なくとも1.5:1、少なくとも2:1、少なくとも2.5:1、少なくとも3:1、少なくとも3.5:1、少なくとも4:1、少なくとも4.5:1、少なくとも5:1、少なくとも5.5:1、少なくとも6:1、少なくとも6.5:1、少なくとも7:1、少なくとも7.5:1、少なくとも8:1、少なくとも8.5:1、少なくとも9:1、少なくとも10:1、少なくとも11:1、少なくとも12:1、少なくとも13:1、少なくとも14:1、少なくとも15:1、少なくとも20:1、少なくとも25:1、少なくとも30:1、少なくとも40:1、少なくとも50:1、少なくとも100:1、少なくとも200:1、少なくとも300:1、少なくとも400:1、少なくとも500:1、少なくとも600:1、少なくとも700:1、少なくとも800:1、少なくとも900:1、もしくは少なくとも1000:1、またはそれ以上の比率を生成し得る。
意図する変異及びインデルの数は、例えば、国際PCT出願第PCT/2017/045381 (WO2018/027078)及びPCT/US2016/058344 (WO2017/070632);Komor, A.C., et al., ”Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533,420-424 (2016);Gaudelli, N.M., et al., ”Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551,464-471 (2017)、及びKomor, A.C., et al., ”Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao 4774 (2017)に記載されているように、任意の適切な方法を使用して決定することができ;その全内容は、参照により本明細書に援用される。
いくつかの実施形態では、インデル頻度を計算するために、インデルが生じ得るウィンドウの両側に隣接する2つの10bp配列に対する完全一致について、配列決定リードをスキャンする。完全一致が見つからない場合、読み取り結果を分析から除外する。このインデルウィンドウの長さが参照配列と完全に一致する場合、読み取り結果を、インデルを含まないものとして分類する。インデルウィンドウが参照配列より2塩基以上長いかまたは短い場合、配列の読み取り結果を、それぞれ挿入または欠失として分類する。いくつかの実施形態では、本明細書中で提供する塩基編集体は、核酸の領域におけるインデルの形成を制限することができる。いくつかの実施形態では、領域は、塩基編集体によって標的とされるヌクレオチドにあるか、または塩基編集体によって標的とされるヌクレオチドから2、3、4、5、6、7、8、9、または10ヌクレオチド以内の領域にある。
標的ヌクレオチド領域で形成されるインデルの数は、核酸(例えば、細胞のゲノム内の核酸)を塩基編集体に曝露する時間の量に依存し得る。いくつかの実施形態では、インデルの数または割合を、標的ヌクレオチド配列(例えば、細胞のゲノム内の核酸)を塩基編集体に曝露してから、少なくとも1時間、少なくとも2時間、少なくとも6時間、少なくとも12時間、少なくとも24時間、少なくとも36時間、少なくとも48時間、少なくとも3日、少なくとも4日、少なくとも5日、少なくとも7日、少なくとも10日、または少なくとも14日後に決定する。本明細書に記載の塩基編集体の特徴は、任意の融合タンパク質、または本明細書中で提供する融合タンパク質を使用する方法に適用することができることを理解すべきである。
いくつかの実施形態では、本明細書中で提供する塩基編集体は、核酸の領域におけるインデルの形成を制限することができる。いくつかの実施形態では、領域は、塩基編集体によって標的とされるヌクレオチドにあるか、または塩基編集体によって標的とされるヌクレオチドから2、3、4、5、6、7、8、9、または10ヌクレオチド以内の領域にある。いくつかの実施形態では、本明細書中で提供する塩基編集体のいずれかは、核酸の領域でのインデルの形成を、1%未満、1.5%未満、2%未満、2.5%未満、3%未満、3.5%未満、4%未満、4.5%未満、5%未満、6%未満、7%未満、8%未満、9%未満、10%未満、12%未満、15%未満、または20%未満にまで制限することができる。核酸領域で形成されるインデルの数は、核酸(例えば、細胞のゲノム内の核酸)を塩基編集体に曝露する時間の量に依存し得る。いくつかの実施形態では、インデルの任意の数または割合を、核酸(例えば、細胞のゲノム内の核酸)を塩基編集体に曝露してから、少なくとも1時間、少なくとも2時間、少なくとも6時間、少なくとも12時間、少なくとも24時間、少なくとも36時間、少なくとも48時間、少なくとも3日、少なくとも4日、少なくとも5日、少なくとも7日、少なくとも10日、または少なくとも14日後に決定する。
多重編集
いくつかの実施形態では、本明細書中で提供する塩基編集系は、1つ以上の遺伝子における複数の核酸塩基対の多重編集が可能である。いくつかの実施形態では、複数の核酸塩基対は、同じ遺伝子に位置する。いくつかの実施形態では、複数の核酸塩基対が1つ以上の遺伝子に位置し、少なくとも1つの遺伝子が異なる遺伝子座に位置する。いくつかの実施形態では、多重編集は、1つ以上のガイドポリヌクレオチドを含み得る。いくつかの実施形態では、多重編集は、1つ以上の塩基編集系を含み得る。いくつかの実施形態では、多重編集は、単一のガイドポリヌクレオチドと共に、1つ以上の塩基編集系を含み得る。いくつかの実施形態では、多重編集は、複数のガイドポリヌクレオチドと共に、1つ以上の塩基編集系を含み得る。いくつかの実施形態では、多重編集は、単一の塩基編集系と共に、1つ以上のガイドポリヌクレオチドを含み得る。いくつかの実施形態では、多重編集は、標的ポリヌクレオチド配列への標的結合にPAM配列を必要としない少なくとも1つのガイドポリヌクレオチドを含み得る。いくつかの実施形態では、多重編集は、標的ポリヌクレオチド配列への標的結合にPAM配列を必要とする少なくとも1つのガイドポリヌクレオチドを含み得る。いくつかの実施形態では、多重編集は、標的ポリヌクレオチド配列への標的結合にPAM配列を必要としない少なくとも1つのガイドポリヌクレオチドと、標的ポリヌクレオチド配列への標的結合にPAM配列を必要とする少なくとも1つのガイドポリヌクレオチドとの混合物を含み得る。本明細書に記載の塩基編集体のいずれかを使用する多重編集の特徴は、本明細書中で提供する塩基編集体のいずれかを使用する方法の任意の組み合わせに適用し得ることを理解すべきである。本明細書に記載の塩基編集体のいずれかを使用する多重編集は、複数の核酸塩基対の連続的な編集を含み得ることもまた、理解すべきである。
いくつかの実施形態では、複数の核酸塩基対が1つ以上の遺伝子内にある。いくつかの実施形態では、複数の核酸塩基対が同じ遺伝子内にある。いくつかの実施形態では、1つ以上の遺伝子の少なくとも1つの遺伝子が、異なる遺伝子座に位置している。
いくつかの実施形態では、編集は、少なくとも1つのタンパク質コード領域における複数の核酸塩基対の編集である。いくつかの実施形態では、編集は、少なくとも1つのタンパク質非コード領域における複数の核酸塩基対の編集である。いくつかの実施形態では、編集は、少なくとも1つのタンパク質コード領域及び少なくとも1つのタンパク質非コード領域における複数の核酸塩基対の編集である。
いくつかの実施形態では、編集を、1つ以上のガイドポリヌクレオチドと組み合わせる。いくつかの実施形態では、塩基編集系は、1つ以上の塩基編集系を含み得る。いくつかの実施形態では、塩基編集系は、1つ以上の塩基編集系を、単一のガイドポリヌクレオチドと組み合わせて含み得る。いくつかの実施形態では、塩基編集系は、1つ以上の塩基編集系を、複数のガイドポリヌクレオチドと組み合わせて含み得る。いくつかの実施形態では、編集を、単一の塩基編集系と共に、1つ以上のガイドポリヌクレオチドと組み合わせる。いくつかの実施形態では、編集を、標的ポリヌクレオチド配列への標的結合にPAM配列を必要としない少なくとも1つのガイドポリヌクレオチドと組み合わせる。いくつかの実施形態では、編集を、標的ポリヌクレオチド配列への標的結合にPAM配列を必要とする少なくとも1つのガイドポリヌクレオチドと組み合わせる。いくつかの実施形態では、編集を、標的ポリヌクレオチド配列への標的結合にPAM配列を必要としない少なくとも1つのガイドポリヌクレオチドと、標的ポリヌクレオチド配列への標的結合にPAM配列を必要とする少なくとも1つのガイドポリヌクレオチドとの混合物と組み合わせる。本明細書に記載の塩基編集体のいずれかを使用する多重編集の特徴は、本明細書中で提供する塩基編集体のいずれかを使用する方法の任意の組み合わせに適用し得ることを理解すべきである。編集は、複数の核酸塩基対の連続的な編集を含み得ることもまた、理解すべきである。
塩基編集体の使用方法
HBVゲノムを編集して、治療法及び基礎研究のための新規戦略を立ち上げる。
本開示は、HBV感染症と診断された対象の治療方法を提供する。例えば、いくつかの実施形態では、そのような疾患、例えば、HBV感染によって引き起こされる疾患を有する対象に、HBVゲノム内の核酸塩基を変化させる有効量の核酸塩基編集体(例えば、アデノシンデアミナーゼ塩基編集体またはシチジンデアミナーゼ塩基編集体)を投与することを含む方法を提供する。
特定の態様では、HBV感染症の治療方法を提供し、この疾患は、HBV遺伝子の少なくとも1つのデアミナーゼ媒介性遺伝子編集によって治療することができる。
それぞれの配列、例えば、それぞれ、疾患関連遺伝子またはそれがコードするタンパク質のポリヌクレオチド配列またはアミノ酸配列における特定の位置または残基の付番は、使用する特定のタンパク質及び付番スキームに依存することが理解されよう。付番は、例えば、成熟タンパク質の前駆体と成熟タンパク質自体で異なり得、種ごとの配列の違いが付番に影響を与え得る。当業者であれば、当技術分野で周知の方法、例えば、配列アラインメント及び相同残基の決定によって、任意の相同タンパク質及びそれぞれのコード核酸中のそれぞれの残基を同定することができるであろう。
本明細書において、HBVゲノム中の標的ヌクレオチド配列中の核酸塩基を編集するための塩基編集体または塩基編集系の使用方法を提供する。いくつかの実施形態では、塩基編集体(例えば、アデノシンデアミナーゼ及びCas9ドメインを含む)の活性は、HBVゲノムにおける核酸塩基の改変をもたらす。いくつかの実施形態では、標的DNA配列を、G→A点変異を含むように改変し、その場合、A塩基の脱アミノ化は、HBV機能を低減または排除する配列をもたらす。いくつかの実施形態では、標的DNA配列を、T→C点変異を含むように改変し、その場合、変異型C塩基の脱アミノ化は、HBV機能を低減または排除する配列をもたらす。
いくつかの実施形態では、標的DNA配列は、タンパク質(例えば、ポリメラーゼまたは表面抗原などのHBVタンパク質)をコードし、その改変は、野生型コドンによってコードされるアミノ酸の変化をもたらす。いくつかの実施形態では、Aヌクレオチドの脱アミノ化は、野生型コドンによってコードされるアミノ酸の変化をもたらす。いくつかの実施形態では、野生型Aの脱アミノ化は、変異型アミノ酸をコードするコドンを生じさせる。いくつかの実施形態では、野生型Cの脱アミノ化は、野生型コドンによってコードされるアミノ酸に変化を生じさせる。いくつかの実施形態では、野生型Cの脱アミノ化は、変異型アミノ酸をコードするコドンを生じさせる。いくつかの実施形態では、対象は、HBV感染症を有するか、または有すると診断されている。
いくつかの実施形態では、本明細書中で提供するアデノシンデアミナーゼは、DNAのデオキシアデノシン残基のアデニンを脱アミノ化することができる。本開示の他の態様は、アデノシンデアミナーゼ(例えば、本明細書に記載のDNA中のデオキシアデノシンを脱アミノ化するアデノシンデアミナーゼ)及び特定のヌクレオチド配列に結合することができるドメイン(例えば、Cas9またはCpf1タンパク質)を含む融合タンパク質を提供する。例えば、アデノシンをイノシン残基に転換させることができ、これは通常、シトシン残基と塩基対を形成する。そのような融合タンパク質は、とりわけ、核酸配列の標的化編集に有用である。そのような融合タンパク質は、in vitroでHBV DNAを標的化編集するために;標的化変異を導入するために、例えば、ex vivoでの細胞内のHBVゲノムを改変するために;そしてin vivoで標的化変異を導入するために、例えば、HBVに感染した対象の細胞におけるHBVゲノムを改変するために使用することができる。本開示は、デアミナーゼ及び核酸塩基編集体を利用するデアミナーゼ、融合タンパク質、核酸、ベクター、細胞、組成物、方法、キット、系などを提供する。
意図する変異の生成
本明細書中で提供する核酸塩基編集タンパク質を、例えば、感染症またはその症状を低減または排除する改変をHBVゲノムに導入することによる、in vitroでの遺伝子編集に基づくヒト治療について検証することができる。当業者であれば、本明細書中で提供する核酸塩基編集タンパク質、例えば、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン(例えば、Cas9)及び核酸塩基編集ドメイン(例えば、アデノシンデアミナーゼドメインまたはシチジンデアミナーゼドメイン)を含む融合タンパク質が、AからGまたはCからTへ改変するために使用することができることを理解するであろう。前者の場合、AからIへの脱アミノ化により、HBVゲノム配列が改変され、後者の場合、HBVゲノム中でTと塩基対を形成するAの脱アミノ化と、それに続く1ラウンドの複製により、変異が導入される。
いくつかの実施形態では、本開示は、対象のゲノム内に有意な数の意図しない変異、例えば、意図しない点変異を生成することなく、核酸(例えば、対象のゲノム内の核酸)内に、意図する変異を効率的に生成することができる塩基編集体を提供する。いくつかの実施形態では、意図される変異は、意図される変異を生成するように特別に設計されたガイドポリヌクレオチド(例えば、gRNA)に結合した特定の塩基編集体(例えば、シチジン塩基編集体またはアデノシン塩基編集体)によって生成される変異である。いくつかの実施形態では、意図される変異は、アデニン(A)からグアニン(G)への点変異である。いくつかの実施形態では、意図される変異は、シトシン(C)からチミン(T)への点変異である。いくつかの実施形態では、意図される変異は、遺伝子のコード領域または非コード領域内のアデニン(A)からグアニン(G)への点変異である。いくつかの実施形態では、意図される変異は、遺伝子のコード領域または非コード領域内のシトシン(C)からチミン(T)への点変異である。いくつかの実施形態では、意図される変異は、終止コドン、例えば、遺伝子のコード領域内の未成熟終止コドンを生成する点変異である。いくつかの実施形態では、意図される変異は、終止コドンを排除する変異である。
いくつかの実施形態では、本明細書中で提供する塩基編集体のいずれかは、意図される変異と意図しない変異(例えば、意図される点変異:意図しない点変異)の1:1を上回る比を生成することができる。いくつかの実施形態では、本明細書中で提供する塩基編集体のいずれかは、意図される変異と意図しない変異(例えば、意図される点変異:意図しない点変異)の、少なくとも1.5:1、少なくとも2:1、少なくとも2.5:1、少なくとも3:1、少なくとも3.5:1、少なくとも4:1、少なくとも4.5:1、少なくとも5:1、少なくとも5.5:1、少なくとも6:1、少なくとも6.5:1、少なくとも7:1、少なくとも7.5:1、少なくとも8:1、少なくとも10:1、少なくとも12:1、少なくとも15:1、少なくとも20:1、少なくとも25:1、少なくとも30:1、少なくとも40:1、少なくとも50:1、少なくとも100:1、少なくとも150:1、少なくとも200:1、少なくとも250:1、少なくとも500:1、または少なくとも1000:1、またはそれ以上である比を生成することができる。
塩基編集体の効率の詳細は、国際PCT出願第PCT/2017/045381号(WO2018/027078)及び第PCT/US2016/058344号(WO2017/070632)に記載されており、これらのそれぞれは、その全体が参照により本明細書に援用される。また、Komor, A.C., et al., ”Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533,420-424 (2016);Gaudelli, N.M., et al., ”Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551,464-471 (2017)、及びKomor, A.C., et al., ”Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao 4774 (2017)も参照されたい(その全内容は、参照により本明細書に援用される)
いくつかの実施形態では、1つ以上の遺伝子における複数の核酸塩基対の編集は、少なくとも1つの意図される変異の形成をもたらす。いくつかの実施形態では、少なくとも1つの意図される変異の形成は、HBVゲノムの改変をもたらす。本明細書に記載の塩基編集体の多重編集の特徴は、本明細書中で提供する塩基編集体を使用する方法の任意の組み合わせに適用し得ることを理解すべきである。
HBV遺伝子の改変
いくつかの実施形態では、HBV遺伝子を精密に改変することにより、ウイルスの毒性を低下させ、及び/またはウイルスがin vitroで増殖する能力を低下させる。改変は、HBVタンパク質の活性を欠損させるか、さもなければ低下させる未成熟終止コドンまたは他の変異であり得る。いくつかの実施形態では、改変の標的とされるHBV遺伝子は、pol、X、S、pre-S1、pre-S2、またはプレコア(pre-core)遺伝子のコア、またはそれらの組み合わせである。
宿主細胞における融合タンパク質の発現
アデノシンデアミナーゼバリアントを含む本開示の融合タンパク質は、当業者に公知の通常の方法を使用して、細菌、酵母、真菌、昆虫、植物、及び動物細胞を含むがこれらに限定されない、実質上、任意の目的の宿主細胞で発現させ得る。例えば、本開示のアデノシンデアミナーゼをコードするDNAは、cDNA配列に基づいてCDSの上流及び下流に適切なプライマーを設計することによってクローニングすることができる。クローニングしたDNAは、直接、または所望により制限酵素で消化した後、または適切なリンカー及び/または核局在化シグナルを付加した後、塩基編集系の1つ以上の追加の成分をコードするDNAに連結してもよい。塩基編集系は、宿主細胞内で翻訳されて複合体を形成する。
本明細書に記載のタンパク質ドメインをコードするDNAは、DNAを化学的に合成するか、またはPCR法及びギブソンアセンブリ法を利用して合成された部分的に重複するオリゴDNA短鎖を接続してその全長をコードするDNAを構築することによって得ることができる。化学合成またはPCR法の組み合わせまたはギブソンアセンブリ法によって全長DNAを構築する利点は、DNAを導入する宿主に応じて、使用するコドンを全長CDSで設計することができる点である。異種DNAの発現においては、そのDNA配列を、宿主生物で非常に頻繁に使用されるコドンに変換することにより、タンパク質の発現レベルが上昇すると予想される。使用する宿主におけるコドン使用頻度のデータとして、例えば、Kazusa DNA Research Instituteのホームページに公開されている遺伝暗号使用頻度データベース(http://www.kazusa.or.jp/codon/index.html)を使用することができ、または各宿主でのコドン使用頻度を示す文書を参照してもよい。得られたデータ及び導入するDNA配列を参照することにより、DNA配列に使用されるコドンのうち、宿主において使用頻度が低いコドンを、同じアミノ酸をコードし、使用頻度が高いコドンに転換させてもよい。
核酸配列認識モジュール及び/または核酸塩基変換酵素をコードするDNAを含む発現ベクターを、例えば、適切な発現ベクターにおいてプロモーターの下流にDNAを連結することによって生成することができる。
発現ベクターがEscherichia coli由来のプラスミドである場合(例えば、pBR322、pBR325、pUC12、pUC13);Bacillus subtilis由来のプラスミド(例えば、pUB110、pTP5、pC194);酵母由来プラスミド(例えば、pSH19、pSH15);昆虫細胞発現プラスミド(例えば、pFast-Bac);動物細胞発現プラスミド(例えば、pA1-11、pXT1、pRc/CMV、pRc/RSV、pcDNAI/Neo);λファージなどのバクテリオファージ;バキュロウイルスなどの昆虫ウイルスベクター(例えば、BmNPV、AcNPV);レトロウイルス、ワクシニアウイルス、アデノウイルスなどの動物ウイルスベクターを使用する。
いくつかの実施形態では、遺伝子発現に使用する宿主に適切な任意のプロモーターを使用することができる。DSBを用いた従来の方法では、毒性により宿主細胞の生存率が著しく低下することがあるため、誘導性プロモーターを用いて誘導開始までに細胞数を増やすことが望ましい。しかしながら、本開示の核酸改変酵素複合体を発現させることによっても十分な細胞増殖をもたらすことができることから、構成プロモーターも制限なく使用することができる。
例えば、宿主が動物細胞の場合、SRαプロモーター、SV40プロモーター、LTRプロモーター、CMV (サイトメガロウイルス)プロモーター、RSV (ラウス肉腫ウイルス)プロモーター、MoMuLV (モロニーマウス白血病ウイルス)LTR、HSV-TK (単純ヘルペスウイルスチミジンキナーゼ)プロモーターなどを使用する。これらのうち、CMVプロモーター、SRαプロモーターなどが好ましい。
宿主がEscherichia coliの場合、trpプロモーター、lacプロモーター、recAプロモーター、λPLプロモーター、lppプロモーター、T7プロモーターなどが好ましい。
宿主がBacillus属の場合、SPO1プロモーター、SPO2プロモーター、penPプロモーターなどが好ましい。
宿主が酵母の場合、Gal1/10プロモーター、PHO5プロモーター、PGKプロモーター、GAPプロモーター、ADHプロモーターなどが好ましい。
宿主が昆虫細胞である場合、ポリヘドリンプロモーター、P10プロモーターなどが好ましい。
宿主が植物細胞の場合、CaMV35Sプロモーター、CaMV19Sプロモーター、NOSプロモーターなどが好ましい。
発現ベクターとしては、上記以外にも、エンハンサー、スプライシングシグナル、ターミネーター、ポリA付加シグナル、薬剤耐性遺伝子、栄養要求性相補遺伝子などの選択マーカー、複製起点などを必要に応じて含むものを使用することができる。
本明細書に記載のタンパク質ドメインをコードするRNAは、例えば、上記の核酸配列認識モジュール及び/または核酸塩基転換酵素をコードするDNAをコードするベクターをテンプレートとして使用することにより、それ自体が公知のin vitro転写系において、mRNAへ転写することによって調製することができる。
本開示の融合タンパク質は、核酸配列認識モジュール及び/または核酸塩基転換酵素をコードするDNAを含む発現ベクターを宿主細胞に導入し、宿主細胞を培養することにより、細胞内で発現させることができる。
宿主として、Escherichia属、Bacillus属、酵母、昆虫細胞、昆虫、動物細胞などが用いられる。
Escherichia属として、Escherichia coli K12.cndot.DH1 (Proc.Natl.Acad.Sci.USA,60,160 (1968)), Escherichia coli JM103 (Nucleic Acids Research,9,309 (1981)), Escherichia coli JA221 (Journal of Molecular Biology,120,517 (1978)), Escherichia coli HB101 (Journal of Molecular Biology,41,459 (1969)), Escherichia coli C600 (Genetics,39,440 (1954))などが用いられる。
Bacillus属として、Bacillus subtilis M1114 (Gene,24,255 (1983))、Bacillus subtilis 207-21 (Journal of Biochemistry,95,87 (1984))などが用いられる。
酵母として、Saccharomyces cerevisiae AH22、AH22R-、NA87-11A、DKD-5D、20B-12、Schizosaccharomyces pombe NCYC1913、NCYC2036、Pichia pastoris KM71などが用いられる。
ウイルスがAcNPVの場合の昆虫細胞として、ヨトウガ幼虫由来の樹立系統(Spodopterafrugiperda細胞;Sf細胞)の細胞、Trichoplusia niの中腸由来MG1細胞、Trichoplusia niの卵由来HighFive (商標)細胞、Mamestra brassicae由来細胞、Estigmena acrea由来細胞などが用いられる。ウイルスがBmNPVの場合、Bombyx mori由来の樹立系統(Bombyx mori N細胞;BmN細胞)の細胞などを昆虫細胞として使用する。Sf細胞として、例えば、Sf9細胞(ATCC CRL1711)、Sf21細胞(すべて上記、In Vivo,13,213-217 (1977))などが用いられる。
昆虫として、例えばBombyx mori、Drosophila、コオロギの幼虫などが用いられる(Nature,315,592 (1985))。
動物細胞として、サルCOS-7細胞、サルVero細胞、チャイニーズハムスター卵巣(CHO)細胞、dhfr遺伝子欠損CHO細胞、マウスL細胞、マウスAtT-20細胞、マウス骨髄腫細胞、ラットGH3細胞、ヒトFL細胞などの細胞株、ヒト及び他の哺乳類のiPS細胞、ES細胞などの多能性幹細胞、ならびに様々な組織から調製される初代培養細胞が用いられる。さらに、ゼブラフィッシュ胚、Xenopus卵母細胞なども使用することができる。
植物細胞として、様々な植物(例えば、コメ、コムギ、トウモロコシなどの穀物、トマト、キュウリ、ナスなどの製品作物、カーネーション、トルコギキョウなどの園芸植物、タバコ、シロイヌナズナなどの実験植物など)から調製される浮遊培養細胞、カルス、プロトプラスト、葉セグメント、根セグメントなどが用いられる。
上記のすべての宿主細胞は、半数体(一倍体)、または倍数体(例えば、二倍体、三倍体、四倍体など)であり得る。従来の変異導入法では、原則として、1つの相同染色体にのみ変異を導入してヘテロ遺伝子型を生成する。したがって、優性変異が生じない限り、所望の表現型は発現せず、ホモ接合性は不便なことに労力と時間を必要とする。対照的に、本開示によれば、ゲノム内の相同染色体上の任意の対立遺伝子に変異を導入することができるため、劣性変異の場合でも、所望の表現型を単一世代で発現させることができ、これは、従来の方法の問題点を解決することができるため、極めて有用である。
発現ベクターは、宿主の種類に従って、既知の方法(例えば、リゾチーム法、コンピテント法、PEG法、CaCl2共沈法、エレクトロポレーション法、マイクロインジェクション法、パーティクルガン法、リポフェクション法、アグロバクテリウム法など)によって導入することができる。
Escherichia coliは、例えば、Proc.Natl.Acad.Sci.USA,69,2110 (1972),Gene,17,107 (1982)などに記載されている方法に従って形質転換することができる。
Bacillus属は、例えば、Molecular & General Genetics,168,111 (1979)などに記載されている方法に従ってベクター導入することができる。
酵母は、例えば、Methods in Enzymology,194,182-187 (1991),Proc.Natl.Acad.Sci.USA,75,1929 (1978)などに記載されている方法に従ってベクター導入することができる。
昆虫細胞及び昆虫は、例えば、Bio/Technology,6,47-55 (1988)などに記載されている方法に従って、ベクター導入することができる。
動物細胞は、例えば、Cell Engineering additional volume 8,New Cell Engineering Experiment Protocol,263-267 (1995)(Shujunsha発行)、及びVirology,52,456 (1973)に記載されている方法に従ってベクター導入することができる。
ベクターを導入した細胞は、宿主の種類に応じた既知の方法で培養することができる。
例えば、Escherichia coliまたはBacillus属を培養する場合、培養に使用する培地としては液体培地が好ましい。培地は、形質転換体の増殖に必要な炭素源、窒素源、無機物質などを含むことが好ましい。炭素源の例として、グルコース、デキストリン、可溶性デンプン、スクロースなどが挙げられ;窒素源の例として、アンモニウム塩、硝酸塩、コーンスティープリカー、ペプトン、カゼイン、肉抽出物、ダイズケーキ、ジャガイモ抽出物などの無機または有機物質が挙げられ;無機物質の例として、塩化カルシウム、リン酸二水素ナトリウム、塩化マグネシウムなどが挙げられる。培地は、酵母エキス、ビタミン、成長促進因子などを含み得る。培地のpHは、好ましくは約5~約8である。
Escherichia coliを培養するための培地として、例えば、グルコース、カザミノ酸を含有するM9培地(Journal of Experiments in Molecular Genetics,431-433,Cold Spring Harbor Laboratory,New York 1972)が好ましい。必要に応じて、例えば、3β-インドリルアクリル酸などの薬剤を培地に添加して、プロモーターの効率的な機能を確保してもよい。Escherichia coliは、一般的に、約15~約43℃で培養する。必要に応じて、曝気と撹拌を実施してもよい。
Bacillus属は、一般的に約30℃~約40℃で培養する。必要に応じて、曝気と撹拌を実施してもよい。
酵母を培養するための培地の例として、Burkholder最小培地(Proc.Natl.Acad.Sci.USA,77,4505 (1980))、0.5%カザミノ酸を含有するSD培地(Proc.Natl.Acad.Sci.USA,81,5330 (1984))などが挙げられる。培地のpHは、好ましくは約5~約8である。培養は、一般的に約20℃~約35℃で実施する。必要に応じて、曝気と撹拌を実施してもよい。
昆虫細胞または昆虫を培養するための培地として、例えば、不活化10%ウシ血清などの添加物を適宜含有するグレース昆虫培地(Nature,195,788 (1962))が用いられる。培地のpHは、好ましくは約6.2~約6.4である。培養は、一般的に約27℃で実施する。必要に応じて、曝気と撹拌を実施してもよい。
動物細胞を培養するための培地として、例えば、ウシ胎仔血清を約5~約20%含む最小必須培地(MEM)(Science,122,501 (1952))、ダルベッコ改変イーグル培地(DMEM)(Virology,8,396 (1959))、RPMI1640培地(The Journal of the American Medical Association,199,519 (1967))、199培地(Proceeding of the Society for the Biological Medicine,73,1 (1950))などが用いられる。培地のpHは、好ましくは約6~約8である。培養は、一般的に約30℃~約40℃で実施する。必要に応じて、曝気と撹拌を実施してもよい。
植物細胞を培養するための培地として、例えば、MS培地、LS培地、B5培地などが用いられる。培地のpHは、好ましくは約5~約8である。培養は、一般的に約20℃~約30℃で実施する。必要に応じて、曝気と撹拌を実施してもよい。
動物細胞、昆虫細胞、植物細胞などの高等真核細胞を宿主細胞として使用する場合、本開示の塩基編集系(例えば、アデノシンデアミナーゼバリアントを含む)をコードするDNAを、誘導性プロモーター(例えば、メタロチオネインプロモーター(重金属イオンによって誘導される)、熱ショックタンパク質プロモーター(熱ショックによって誘導される)、Tet-ON/Tet-OFF系プロモーター(テトラサイクリンまたはその誘導体の添加または除去によって誘導される)、ステロイド応答性プロモーター(ステロイドホルモンまたはその誘導体によって誘導される)など)の制御下にある宿主細胞に導入し、誘導物質を、適切な段階で培地に添加して(または培地から除去して)、核酸改変酵素複合体の発現を誘導し、一定期間培養して塩基編集を行い、標的遺伝子に変異を導入することで、塩基編集系の一過性発現を実現することができる。
Escherichia coliなどの原核細胞は、誘導性プロモーターを利用することができる。誘導性プロモーターの例として、lacプロモーター(IPTGによって誘導される)、cspAプロモーター(コールドショックによって誘導される)、araBADプロモーター(アラビノースによって誘導される)などが挙げられるが、これらに限定されない。
あるいは、上記の誘導性プロモーターは、動物細胞、昆虫細胞、植物細胞などの高等真核細胞を宿主細胞として使用する場合のベクター除去機構としても利用することができる。すなわち、ベクターは、宿主細胞で機能する複製起点、及び複製に必要なタンパク質をコードする核酸(例えば、動物細胞の場合、SV40オン及びラージT抗原、oriP及びEBNA-1など)を保有しており、そのタンパク質をコードする核酸の発現は、上記の誘導性プロモーターによって調節される。その結果、誘導物質の存在下でベクターは自律的に複製可能であるが、誘導物質が除去されると、自律複製は利用できず、ベクターは細胞分裂と共に自然に脱落する(Tet-OFF系ベクターにおけるテトラサイクリン及びドキシサイクリンの添加による自律複製は不可能である)。
送達系
本明細書に開示する塩基編集体は、ウイルスベクターに含まれる核酸上にコードされ得る。ウイルスベクターとして、レンチウイルス、アデノウイルス、レトロウイルス、及びアデノ随伴ウイルス(AAV)が挙げられ得る。ウイルスベクターは、用途に基づいて選択することができる。例えば、AAVは免疫原性が穏やかなため、in vivoでの遺伝子送達に一般的に使用される。アデノウイルスは、それらが誘発する強力な免疫原性応答のために、ワクチンとして一般的に使用されている。ウイルスベクターのパッケージング容量は、ベクターにパッケージ化できる塩基編集体のサイズを制限し得る。例えば、AAVのパッケージング容量は、2つの145塩基の逆位末端配列(ITR)を含めて約4.5kbである。
AAVは、パルボウイルスファミリーに属する小さな一本鎖DNA依存性ウイルスである。4.7kbの野生型(wt)AAVゲノムは、それぞれ4つの複製タンパク質と3つのキャプシドタンパク質をコードする2つの遺伝子で構成され、両側に145bpの逆位末端配列(ITR)が隣接する。ビリオンは、3つのキャプシドタンパク質Vp1、Vp2、及びVp3からなり、同じオープンリーディングフレームから、ただし選択的スプライシング(Vp1)及び選択的翻訳開始部位(それぞれVp2及びVp3)から1:1:10の比率で生成される。Vp3は、ビリオンで最も豊富なサブユニットであり、ウイルスの向性を規定する細胞表面での受容体認識に関与している。ウイルス感染性で機能するホスホリパーゼドメインは、Vp1のユニークなN末端で同定されている。
wt AAVと同様に、組換えAAV (rAAV)は、シス作用性145bp ITRを利用してベクター導入遺伝子カセットに隣接し、外来DNAのパッケージングに最大4.5kbを提供する。感染後、rAAVは本発明の融合タンパク質を発現し、環状ヘッドトゥーテール型コンカテマーにエピソーム的に存在することにより、宿主ゲノムに組み込まれることなく存続することができる。この系を使用したrAAVの成功例は、in vitro及びin vivoで多数存在するが、パッケージング容量が限られるため、遺伝子のコード配列の長さがwt AAVゲノムと同じかそれ以上のサイズである場合、AAVを介した遺伝子送達の使用は限定的である。
AAVベクターのパッケージング容量が小さいため、このサイズを超える多数の遺伝子の送達及び/または大きな生理学的調節エレメントの使用が困難なものとなっている。これらの課題は、例えば、送達するタンパク質(複数可)を2つ以上の断片に分割することによって対処することができ、N末端断片をスプリットインテイン-Nに融合し、C末端断片をスプリットインテイン-Cに融合する。これらの断片は、次いで2つ以上のAAVベクターにパッケージングされる。本明細書中で使用する場合、「インテイン」とは、隣接するN末端及びC末端のエクステイン(例えば、結合する断片)を連結する自己スプライシングタンパク質イントロン(例えば、ペプチド)を指す。異種タンパク質断片を結合するための特定のインテインの使用は、例えば、Wood et al., J.Biol.Chem.289 (21);14512-9 (2014)に記載されている。例えば、別々のタンパク質断片に融合されると、インテインIntNとIntCは互いに認識し合い、インテイン自身をスプライスアウトし、同時に融合したタンパク質断片の隣接するN末端とC末端のエクステインを連結し、それによって2つのタンパク質断片から全長タンパク質を再構成する。他の適切なインテインは、当業者には明らかであろう。
本発明の融合タンパク質の断片は、長さが様々に異なり得る。いくつかの実施形態では、タンパク質断片は、2アミノ酸~約1000アミノ酸の長さの範囲である。いくつかの実施形態では、タンパク質断片は、約5アミノ酸~約500アミノ酸の長さの範囲である。いくつかの実施形態では、タンパク質断片は、約20アミノ酸~約200アミノ酸の長さの範囲である。いくつかの実施形態では、タンパク質断片は、約10アミノ酸~約100アミノ酸の長さの範囲である。他の長さの適切なタンパク質断片は、当業者には明らかであろう。
いくつかの実施形態では、ヌクレアーゼ(例えば、Cas9)の一部または断片を、インテインに融合させる。ヌクレアーゼは、インテインのN末端またはC末端に融合させることができる。いくつかの実施形態では、融合タンパク質の一部または断片を、インテインに融合し、そしてAAVキャプシドタンパク質に融合させる。インテイン、ヌクレアーゼ及びキャプシドタンパク質は、任意の配置で一緒に融合することができる(例えば、ヌクレアーゼ-インテイン-キャプシド、インテイン-ヌクレアーゼ-キャプシド、キャプシド-インテイン-ヌクレアーゼなど)。いくつかの実施形態では、インテインのN末端を、融合タンパク質のC末端に融合し、インテインのC末端を、AAVキャプシドタンパク質のN末端に融合する。
一実施形態では、デュアルAAVベクターは、大きな導入遺伝子発現カセットを2つの別々の半体(5’及び3’末端、またはヘッドトゥーテール)に分割することによって生成され、カセットの各半体は、単一のAAVベクター(<5kb)にパッケージングされる。次いで、全長の導入遺伝子発現カセットの再構築は、両方のデュアルAAVベクターによる同じ細胞への同時感染と、その後の: (1)5’及び3’ゲノム間の相同組換え(HR)(デュアルAAV重複ベクター);(2)5’及び3’ゲノムのITRを介したテールトゥーヘッド型コンカテマー化(デュアルAAVトランススプライシングベクター);または(3)これら2つの機構の組み合わせ(デュアルAAVハイブリッドベクター)によって達成される。in vivoでデュアルAAVベクターを使用することにより、全長タンパク質が発現する。デュアルAAVベクタープラットフォームの使用は、サイズが4.7kbを超える導入遺伝子に対する、効率的で実行可能な遺伝子導入戦略を表している。
塩基編集体を設計するための本開示の戦略は、ウイルスベクターにパッケージングすることができる塩基編集体を生成するために有用であり得る。塩基編集体の送達にRNAまたはDNAウイルスベースの系を使用することにより、ウイルスを培養中または宿主内の特定の細胞に標的指向化し、ウイルスペイロードを核または宿主細胞ゲノムに輸送するための高度に進化したプロセスを利用する。ウイルスベクターは、直接、培養物中の細胞、患者に投与し得る(in vivo)か、またはそれらを用いて細胞をin vitroで治療することができ、そして改変された細胞を任意選択で患者に投与することができる(ex vivo)。従来のウイルスベースの系は、遺伝子導入のために、レトロウイルス、レンチウイルス、アデノウイルス、アデノ随伴ウイルス、及び単純ヘルペスウイルスベクターを含み得る。宿主ゲノムにおける組み込みは、レトロウイルス、レンチウイルス、及びアデノ随伴ウイルス遺伝子導入方法を用いて可能となり、多くの場合、挿入された導入遺伝子の長期発現をもたらす。さらに、高い導入効率が、多くの異なる細胞型及び標的組織において観察されている。
外来のエンベロープタンパク質を組み込むことによってレトロウイルスの向性を改変して、標的細胞の可能性のある標的集団を拡大することができる。レンチウイルスベクターは、非分裂細胞に対して形質導入するか、または感染させることができ、また、一般的には高いウイルス力価を生成するレトロウイルスベクターである。したがって、レトロウイルス遺伝子導入系の選択は、標的組織に依存するであろう。レトロウイルスベクターは、最大6~10kbの外来配列をパッケージングする能力を有するシス作用性末端反復配列からなる。ベクターの複製とパッケージングに最小限のシス作用性LTRで十分であり、これを使用して治療遺伝子を標的細胞に組み込み、永続的な導入遺伝子の発現を提供する。広く使用されているレトロウイルスベクターには、マウス白血病ウイルス(MuLV)、テナガザル白血病ウイルス(GaLV)、サル免疫不全ウイルス(SIV)、ヒト免疫不全ウイルス(HIV)、及びそれらの組み合わせに基づくベクターが含まれる(例えば、Buchscher et al., J.Virol.66:2731-2739 (1992);Johann et al., J.Virol.66:1635-1640 (1992);Sommnerfelt et al., Virol.176:58-59 (1990);Wilson et al., J.Virol.63:2374-2378 (1989);Miller et al., J.Virol.65:2220-2224 (1991);PCT/US94/05700)を参照されたい)。
レトロウイルスベクター、特にレンチウイルスベクターは、標的細胞への効率的な組み込みのために、所与の長さよりも小さいポリヌクレオチド配列を必要とし得る。例えば、長さが9kbを超えるレトロウイルスベクターは、サイズが小さいレトロウイルスベクターと比較してウイルス力価が低くなり得る。いくつかの態様では、本開示の塩基編集体は、レトロウイルスベクターを介した標的細胞への効率的なパッケージング及び送達を可能にするのに十分なサイズである。いくつかの場合では、塩基編集体は、ガイド核酸及び/または標的指向化可能なヌクレアーゼ系の他の成分と一緒に発現させた場合でさえ、効率的なパッキング及び送達を可能にするようなサイズである。
一過性の発現が好ましい用途では、アデノウイルスベースの系を使用することができる。アデノウイルスベースのベクターは、多くの細胞型で非常に高い形質導入効率が可能であり、細胞分裂を必要としない。そのようなベクターにより、高い力価と発現レベルが得られる。このベクターは、比較的単純な系で大量に生成することができる。アデノ随伴ウイルス(「AAV」)ベクターも、細胞を標的核酸で形質導入するために、例えば、核酸及びペプチドをin vitroで産生するために、ならびにin vivo及びex vivo遺伝子治療手順のために用いられる(例えば、West et al., Virology 160:38-47 (1987);米国特許第4,797,368号、WO93/24641、Kotin, Human Gene Therapy 5:793-801 (1994);Muzyczka,J.Clin.Invest.94:1351 (1994)を参照されたい)。組換えAAVベクターの構築は、米国特許第5,173,414号;Tratschin et al., Mol. Cell.Biol.5:3251-3260 (1985);Tratschin, et al., Mol.Cell.Biol.4:2072-2081 (1984);Hermonat & Muzyczka, PNAS 81:6466-6470 (1984)、及びSamulski et al., J.Virol.63:03822-3828 (1989)を含む、複数の文献に記載されている。
したがって、本明細書に記載の塩基編集体を、ウイルスベクターと共に送達することができる。塩基編集系の1つ以上の成分を、1つ以上のウイルスベクターにコードすることができる。例えば、塩基編集体とガイド核酸を、単一のウイルスベクター上にコードすることができる。他の場合では、塩基編集体とガイド核酸を、異なるウイルスベクターにコードする。いずれの場合も、塩基編集体とガイド核酸を、それぞれ、プロモーターとターミネーターに作動可能に連結することができる。
ウイルスベクターにコードされる成分の組み合わせは、選択したウイルスベクターのカーゴサイズの制約によって決定され得る。
塩基編集体の非ウイルス送達
塩基編集体のための非ウイルス送達アプローチも利用可能である。非ウイルス性核酸ベクターの重要なカテゴリーの1つはナノ粒子であり、有機または無機であり得る。ナノ粒子は当技術分野で周知である。任意の適切なナノ粒子設計を使用して、ゲノム編集系成分またはそのような成分をコードする核酸を送達することができる。例えば、有機(例えば、脂質及び/または重合体)ナノ粒子は、本開示の特定の実施形態における送達ビヒクルとしての使用に適し得る。ナノ粒子製剤及び/または遺伝子導入に使用するための例示的な脂質を表11 (下記)に示す。
Figure 2022532139000072
Figure 2022532139000073
表12に、遺伝子導入及び/またはナノ粒子製剤で使用するための例示的な重合体を示す。
Figure 2022532139000074
表13は、本明細書に記載の融合タンパク質をコードするポリヌクレオチドの送達方法の概要である。
Figure 2022532139000075
別の態様では、ゲノム編集系成分またはそのような成分をコードする核酸、例えば、Cas9またはそのバリアントなどの核酸結合タンパク質、及び目的のゲノム核酸配列を標的とするgRNAの送達は、リボヌクレオタンパク質(RNP)を細胞に送達することによって達成してもよい。RNPは、標的化gRNAと複合体を形成した核酸結合タンパク質、例えば、Cas9を含む。RNPは、Zuris, J.A.et al., 2015,Nat.Biotechnology,33 (1):73-80に報告されているように、エレクトロポレーション、ヌクレオフェクション、またはカチオン性脂質を介した方法などの既知の方法を使用して細胞に送達してもよい。RNPは、CRISPR塩基編集系での使用、特に初代細胞などのトランスフェクションが困難な細胞での使用に有利である。さらに、RNPは、特にCRISPRプラスミドで使用され得るCMVまたはEF1Aなどの真核生物プロモーターが十分に発現されない場合に、細胞内のタンパク質発現で生じ得る問題を軽減することもできる。利点として、RNPの使用は、細胞への外来DNAの送達を必要としない。さらに、核酸結合タンパク質とgRNA複合体を含むRNPは時間の経過と共に分解されるため、RNPの使用はオフターゲット効果を制限する可能性がある。プラスミドベースの技術と同様の方法で、RNPを使用して結合タンパク質(例えば、Cas9バリアント)を送達し、相同組換え修復(HDR)を指示することができる。
核酸分子の発現をコードする塩基編集体を駆動するために使用されるプロモーターには、AAV ITRが含まれ得る。これは、ベクター内のスペースを占め得る追加のプロモーターエレメントの必要性を排除するために有効であり得る。解放される追加のスペースを使用して、ガイド核酸や選択可能なマーカーなどの追加のエレメントの発現を駆動することができる。ITR活性は比較的弱いため、これを用いて、選択したヌクレアーゼの過剰発現による潜在的な毒性を軽減することができる。
任意の適切なプロモーターを使用して、塩基編集体及び適切な場合にはガイド核酸の発現を駆動することができる。ユビキタス発現の場合、使用できるプロモーターとして、CMV、CAG、CBh、PGK、SV40、フェリチン重鎖または軽鎖などが挙げられる。脳または他のCNS細胞発現の場合、適切なプロモーターとして:すべてのニューロンに対してシナプシンI、興奮性ニューロンに対してCaMKIIα、GABA作動性ニューロンに対してGAD67もしくはGAD65またはVGATなどが挙げられ得る。肝細胞発現の場合、適切なプロモーターとしてアルブミンプロモーターが挙げられる。肺細胞発現の場合、適切なプロモーターとしてSP-Bが挙げられ得る。内皮細胞の場合、適切なプロモーターとしてICAMが挙げられ得る。造血細胞の場合、適切なプロモーターとしてIFNβまたはCD45が挙げられ得る。骨芽細胞の場合、適切なプロモーターとしてOG-2が挙げられ得る。
いくつかの場合では、本開示の塩基編集体は、別個のプロモーターが同じ核酸分子内の塩基編集体及び適合性ガイド核酸の発現を駆動することを可能にするのに十分に小さいサイズである。例えば、ベクターまたはウイルスベクターは、塩基編集体をコードする核酸に作動可能に連結された第1のプロモーターと、ガイド核酸に作動可能に連結された第2のプロモーターとを含み得る。
ガイド核酸の発現を駆動するために使用されるプロモーターとして:U6またはH1などのPolIIIプロモーター、gRNAアデノ随伴ウイルス(AAV)を発現するためのPolIIプロモーター及びイントロンカセットの使用が挙げられ得る。
1つ以上のガイド核を伴うまたは伴わない本明細書に記載の塩基編集体は、アデノ随伴ウイルス(AAV)、レンチウイルス、アデノウイルスまたは他のプラスミドまたはウイルスベクタータイプを使用して、特に、例えば、米国特許第8,454,972号(製剤、アデノウイルスの用量)、米国特許第8,404,658号(製剤、AAVの用量)及び米国特許第5,846,946号(製剤、DNAプラスミドの用量)ならびにレンチウイルス、AAV及びアデノウイルスを含む臨床試験に関する臨床試験及び刊行物に基づく製剤及び用量を使用して送達することができる。例えば、AAVの場合、投与経路、製剤及び用量は、米国特許第8,454,972号及びAAVに関する臨床試験の通りにすることができる。アデノウイルスの場合、投与経路、製剤及び用量は、米国特許第8,404,658号及びアデノウイルスに関する臨床試験の通りにすることができる。プラスミド送達の場合、投与経路、製剤及び用量は、米国特許第5,846,946号及びプラスミドに関する臨床試験の通りにすることができる。用量は、平均70kgの個体(例えば、ヒト成人男性)に基づき、または外挿することができ、異なる体重及び種の患者、対象、哺乳類に合わせて調整することができる。投与の頻度は、年齢、性別、健康全般、患者または対象の他の状態、及び対処しようとする特定の病態または症状を含む通常の要因に応じて、医療または獣医の開業医(例えば、医師、獣医)の範囲内である。ウイルスベクターは、目的の組織に注入することができる。細胞型特異的塩基編集の場合、塩基編集体及び任意選択のガイド核酸の発現を、細胞型特異的プロモーターによって駆動することができる。
in vivo送達の場合、AAVは他のウイルスベクターよりも有利であり得る。いくつかの場合では、AAVは低毒性を可能にし、これは、免疫応答を活性化することができる細胞粒子の超遠心分離を必要としない精製方法が原因であり得る。いくつかの場合では、AAVは宿主ゲノムに組み込まれないため、挿入変異を引き起こす可能性が低くなり得る。
AAVのパッケージ制限は4.5または4.75Kbである。これは、開示する塩基編集体、ならびにプロモーター及び転写ターミネーターが単一のウイルスベクターに適合できることを意味する。4.5または4.75Kbを超える構築物は、ウイルスの生成を大幅に低下させ得る。例えば、SpCas9は非常に大きく、遺伝子自体は4.1Kbを超えているため、AAVにパッキングするのは困難である。したがって、本開示の実施形態は、従来の塩基編集体よりも長さが短い、本開示の塩基編集体を利用することを含む。いくつかの例では、塩基編集体は4kb未満である。本開示の塩基編集体は、4.5kb、4.4kb、4.3kb、4.2kb、4.1kb、4kb、3.9kb、3.8kb、3.7kb、3.6kb、3.5kb、3.4kb、3.3kb、3.2kb、3.1kb、3kb、2.9kb、2.8kb、2.7kb、2.6kb、2.5kb、2kb、または1.5kb未満であり得る。いくつかの場合では、本開示の塩基編集体の長さは4.5kb以下である。
AAVは、AAV1、AAV2、AAV5またはそれらの任意の組み合わせであり得る。標的化する細胞に関してAAVのタイプを選択することができ;例えば、脳または神経細胞を標的とするために、AAV血清型1、2、5またはハイブリッドキャプシドAAV1、AAV2、AAV5またはそれらの任意の組み合わせを選択することができ;心臓組織を標的とするためにAAV4を選択することができる。AAV8は、肝臓への送達に役立つ。これらの細胞に関する特定のAAV血清型の表は、Grimm, D.et al,J.Virol.82:5887-5911 (2008))で見出すことができる。
レンチウイルスは、有糸分裂細胞と有糸分裂後細胞の両方で遺伝子に感染して発現する能力を有する複雑なレトロウイルスである。最も一般的に知られているレンチウイルスは、他のウイルスのエンベロープ糖タンパク質を使用して広範囲の細胞型を標的とするヒト免疫不全ウイルス(HIV)である。
レンチウイルスは、以下のように調製することができる。pCasES10 (レンチウイルス転移プラスミドバックボーンを含む)をクローニングした後、低継代(p=5)のHEK293FTをT-75フラスコに播種し、トランスフェクションの前日に抗生物質を含まない10%ウシ胎仔血清を含むDMEMで50%コンフルエントにした。20時間後、培地をOptiMEM (無血清)培地に交換し、4時間後にトランスフェクションを実施した。細胞に10μgのレンチウイルス転移プラスミド(pCasES10)と以下のパッケージングプラスミドをトランスフェクトする:5μgのpMD2.G (VSV-g疑似型)及び7.5μgのpsPAX2 (gag/pol/rev/tat)。トランスフェクションは、カチオン性脂質送達剤(50μl Lipofectamine2000及び100ul Plus試薬)を含む4mL OptiMEMで行うことができる。6時間後、培地を10%ウシ胎仔血清を含む抗生物質フリーのDMEMに交換する。これらの方法では細胞培養中に血清を使用するが、無血清法が好ましい。
レンチウイルスは、以下のように精製することができる。ウイルスの上清を48時間後に回収する。上清から最初に破片を取り除き、0.45μmの低タンパク質結合(PVDF)フィルターで濾過する。次いで、それらを24,000rpmで2時間、超遠心分離に供する。ウイルスペレットを50μlのDMEMに4℃で一晩再懸濁する。次いでそれらを分注し、すぐに-80℃で凍結する。
別の実施形態では、ウマ伝染性貧血ウイルス(EIAV)に基づく最小の非霊長類レンチウイルスベクターもまた企図される。別の実施形態では、血管新生抑制タンパク質エンドスタチン及びアンギオスタチンを発現する、馬伝染性貧血ウイルスベースのレンチウイルス遺伝子治療ベクターであるRETINOSTAT (登録商標)を、網膜下注射を介して送達することが企図される。別の実施形態では、自己不活化レンチウイルスベクターの使用が企図される。
系の任意のRNA、例えばガイドRNAまたは塩基編集体をコードするmRNAは、RNAの形態で送達することができる。塩基編集体をコードするmRNAは 、in vitro転写を使用して生成することができる。例えば、ヌクレアーゼmRNAは、以下のエレメント:T7プロモーター、任意選択のkozak配列(GCCACC)、ヌクレアーゼ配列、及び3’UTR、例えば、βグロビン-ポリAテール由来の3’UTRを含むPCRカセットを使用して合成することができる。カセットは、T7ポリメラーゼによる転写に使用することができる。ガイドポリヌクレオチド(例えば、gRNA)は、T7プロモーターとそれに続く配列「GG」及びガイドポリヌクレオチド配列を含むカセットからのin vitro転写を使用して転写することもできる。
発現を増強し、生じ得る毒性を低減するために、塩基編集体コード配列及び/またはガイド核酸を、例えば、シュードUまたは5-メチル-Cを使用して、1つ以上の修飾ヌクレオシドを含むように修飾することができる。
いくつかの実施形態における開示は、細胞または生物を改変する方法を包含する。細胞は、原核細胞または真核細胞であり得る。細胞は、哺乳類細胞であり得る。哺乳類の細胞の多くは、非ヒト霊長類、ウシ、ブタ、げっ歯類、またはマウスの細胞である。本開示の塩基編集体、組成物及び方法によって細胞に導入される改変は、抗体、デンプン、アルコールまたは他の所望の細胞出力などの生物学的産物の産生を向上させるために、細胞及び細胞の子孫を改変するようなものであり得る。本開示の方法によって細胞に導入される改変は、細胞及び細胞の子孫が、産生される生物学的産物を変化させる改変を含むようなものであり得る。
系は、1つ以上の異なるベクターを含み得る。一態様では、塩基編集体は、所望の細胞型、優先的には真核細胞、好ましくは哺乳類細胞またはヒト細胞の発現のためにコドン最適化される。
一般的に、コドン最適化とは、天然のアミノ酸配列を維持する一方で、天然の配列の少なくとも1つのコドン(例えば、約1、2、3、4、5、10、15、20、25、50、またはそれ以上のコドン)を、その宿主細胞の遺伝子でより頻繁にまたは最も頻繁に使用されるコドンに置換することによって、目的の宿主細胞における発現を増強するために核酸配列を改変するプロセスを指す。様々な種が、特定のアミノ酸の特定のコドンに対して特定のバイアスを示す。コドンバイアス(生物間のコドン使用の違い)は、メッセンジャーRNA (mRNA)の翻訳効率と相関することが多く、これは、とりわけ、翻訳されるコドンの特性及び特定の転移RNA (tRNA)分子の利用可能性に依存すると考えられている。選択されるtRNAが細胞内で優勢であることは、一般的に、ペプチド合成で最も頻繁に使用されるコドンを反映している。したがって、遺伝子は、コドン最適化に基づいて、所与の生物における最適な遺伝子発現のために調整することができる。コドン使用頻度表は、例えば、www.kazusa.orjp/codon/(2002年7月9日閲覧)の「コドン使用頻度データベース」で容易に入手することができ、これらの表は様々な方法に適合させることができる。Nakamura, Y., et al. ”Codon usage tabulated from the international DNA sequence databases: status for the year 2000”Nucl.Acids Res.28:292 (2000)を参照されたい。特定の宿主細胞での発現のために特定の配列を最適化するコドンのためのコンピューターアルゴリズム、例えば、Gene Forge (Aptagen;Jacobus,Pa.)も利用可能である。いくつかの実施形態では、改変されたヌクレアーゼをコードする配列中の1つ以上のコドン(例えば、1、2、3、4、5、10、15、20、25、50、もしくはそれ以上、またはすべてのコドン)は、特定のアミノ酸に対して最も頻繁に使用されるコドンに対応する。
パッケージング細胞は、通常、宿主細胞を感染させることができるウイルス粒子を形成するために使用される。そのような細胞には、アデノウイルスをパッケージングする293細胞、及びレトロウイルスをパッケージングするpsi.2細胞またはPA317細胞が含まれる。遺伝子治療で使用されるウイルスベクターは、通常、核酸ベクターをウイルス粒子にパッケージングする細胞株を産生することによって生成される。ベクターは、通常、パッケージング及びその後の宿主への組み込みに必要な最小限のウイルス配列を含み、他のウイルス配列は、発現させるポリヌクレオチド(複数可)の発現カセットによって置き換えられる。不足しているウイルス機能は、通常、パッケージング細胞株によってトランスで供給される。例えば、遺伝子治療で使用されるAAVベクターは、通常、パッケージング及び宿主ゲノムへの組み込みに必要とされるAAVゲノム由来のITR配列のみを有する。ウイルスDNAは、他のAAV遺伝子、すなわち、rep及びcapをコードするがITR配列を欠如するヘルパープラスミドを含有する細胞株内でパッケージングされ得る。この細胞株を、ヘルパーとしてのアデノウイルスにも感染させることができる。ヘルパーウイルスは、AAVベクターの複製とヘルパープラスミドからのAAV遺伝子の発現を促進することができる。いくつかの場合では、ヘルパープラスミドは、ITR配列が不足しているために大量にパッケージングされない。例えば、AAVよりもアデノウイルスの方が感受性の高い熱処理によって、アデノウイルスによる汚染を減少させることができる。
インテイン
いくつかの実施形態では、ヌクレアーゼ(例えば、Cas9)の一部または断片を、インテインに融合させる。ヌクレアーゼは、インテインのN末端またはC末端に融合させることができる。いくつかの実施形態では、融合タンパク質の一部または断片を、インテインに融合し、そしてAAVキャプシドタンパク質に融合させる。インテイン、ヌクレアーゼ及びキャプシドタンパク質は、任意の配置で一緒に融合することができる(例えば、ヌクレアーゼ-インテイン-キャプシド、インテイン-ヌクレアーゼ-キャプシド、キャプシド-インテイン-ヌクレアーゼなど)。いくつかの実施形態では、インテインのN末端を、融合タンパク質のC末端に融合し、インテインのC末端を、AAVキャプシドタンパク質のN末端に融合する。
インテイン(介在タンパク質)は、様々な多様な生物において認められる自動プロセシングドメインであり、タンパク質スプライシングとして知られるプロセスを実行する。タンパク質スプライシングは、ペプチド結合の切断と形成の両方からなる多段階の生化学反応である。タンパク質スプライシングの内在性基質はインテイン含有生物に認められるタンパク質であるが、インテインは事実上すべてのポリペプチド骨格を化学的に操作するためにも使用することができる。
タンパク質スプライシングでは、インテインは2つのペプチド結合を切断することによって前駆体ポリペプチドからそれ自体を切除し、それによって新規ペプチド結合の形成を介して隣接するエクステイン(外部タンパク質)配列を連結する。この再配置は、翻訳後に(または場合によっては同時翻訳的に)生じる。インテインを介したタンパク質のスプライシングは自発的に起こり、インテインドメインのフォールディングのみが必要である。
インテインの約5%はスプリットインテインであり、2つの別々のポリペプチド、N-インテインとC-インテインとして転写及び翻訳され、それぞれを1つのエクステインに融合させる。翻訳時に、インテイン断片は自発的かつ非共有結合的に標準的なインテイン構造に集合し、トランスでタンパク質スプライシングを実行する。タンパク質スプライシングの機構は、一連のアシル転移反応を伴い、その結果、インテイン-エクステイン接合部で2つのペプチド結合が切断され、N末端とC-エクステインの間に新しいペプチド結合が形成される。このプロセスは、N-エクステインとインテインのN末端を結合するペプチド結合の活性化によって開始される。事実上すべてのインテインは、C末端のN-エクステイン残基のカルボニル炭素を攻撃するシステインまたはセリンをN末端に有する。このNからO/Sへのアシルシフトは、保存されたスレオニンとヒスチジン(TXXHモチーフと呼ばれる)、及び一般的に認められるアスパラギン酸によって促進され、その結果、直鎖状(チオ)エステル中間体が形成される。次に、この中間体を、システイン、セリン、またはスレオニンである第1のC-エクステイン残基(+1)の求核攻撃によるトランス-(チオ)エステル化に供する。得られた分岐(チオ)エステル中間体は、インテインの高度に保存されたC末端アスパラギンの環化というユニークな転換によって分解される。このプロセスは、ヒスチジン(高度に保存されたHNFモチーフに見出される)と最後から2番目のヒスチジンによって促進され、アスパラギン酸も関与している可能性がある。このスクシンイミド形成反応は、反応性複合体からインテインを切除し、非ペプチド結合を介して結合したエクステインを残す。この構造は、インテインに非依存的な方式で安定したペプチド結合に急速に再配置される。
いくつかの実施形態では、塩基編集体のN末端断片(例えば、ABE、CBE)を、スプリットインテイン-Nに融合し、C末端断片を、スプリットインテイン-Cに融合する。これらの断片を、次いで2つ以上のAAVベクターにパッケージングする。異種タンパク質断片を結合するための特定のインテインの使用は、例えば、Wood et al., J.Biol.Chem.289 (21);14512-9 (2014)に記載されている。例えば、別々のタンパク質断片に融合されると、インテインIntNとIntCは互いに認識し合い、インテイン自身をスプライスアウトし、同時に融合したタンパク質断片の隣接するN末端とC末端のエクステインを連結し、それによって2つのタンパク質断片から全長タンパク質を再構成する。他の適切なインテインは、当業者には明らかであろう。
いくつかの実施形態では、ABEを、SpCas9の選択された領域内のAla、Ser、Thr、またはCys残基でN末端断片及びC末端断片に分割した。これらの領域は、Cas9結晶構造分析によって同定されたループ領域に対応する。各断片のN末端をインテイン-Nに融合し、各断片のC末端をアミノ酸位置S303、T310、T313、S355、A456、S460、A463、T466、S469、T472、T474、C574、S577、A589、及びS590でインテイン-Cに融合し、これらを、以下の配列に太字の大文字で示す。
Figure 2022532139000076
医薬組成物
本開示の他の態様は、本明細書に記載の塩基編集体、融合タンパク質、または融合タンパク質-ガイドポリヌクレオチド複合体のいずれかを含む医薬組成物に関する。本明細書中で使用する場合、用語「医薬組成物」とは、医薬用途のために製剤化された組成物を指す。いくつかの実施形態では、医薬組成物は、薬学的に許容される担体をさらに含む。いくつかの実施形態では、医薬組成物は、追加の薬剤(例えば、特異的送達、半減期の増加、または他の治療化合物のための)を含む。
本明細書中で使用する場合、用語「薬学的に許容される担体」とは、薬学的に許容される材料、組成物、またはビヒクル、例えば、液体または固体充填剤、希釈剤、賦形剤、製造用助剤(例えば、滑沢剤、タルクマグネシウム、ステアリン酸カルシウムもしくはステアリン酸亜鉛、またはステアリン酸)、または、身体のある部分(例えば、送達部位)から別の部位(例えば、臓器、組織または身体の部分)への化合物の担持もしくは輸送に関与する溶媒カプセル化材料を意味する。薬学的に許容される担体は、製剤の他の成分と適合性があり、対象の組織に有害ではない(例えば、生理学的な適合性、無菌、生理学的pHなど)という意味で「許容可能」である。
薬学的に許容される担体として機能し得る物質のいくつかの非限定的な例として: (1)糖、例えば、ラクトース、グルコース、及びスクロース;(2)澱粉、例えば、トウモロコシ澱粉及び馬鈴薯澱粉;(3)セルロース、及びその誘導体、例えば、カルボキシメチルセルロースナトリウム、メチルセルロース、エチルセルロース、微結晶セルロース、及び酢酸セルロース;(4)粉末トラガカント;(5)麦芽;(6)ゼラチン;(7)潤滑剤、例えば、ステアリン酸マグネシウム、ラウリル硫酸ナトリウム、及びタルク;(8)賦形剤、例えば、カカオバター及び坐剤用ワックス;(9)油類、例えば、ピーナッツ油、綿実油、ベニバナ油、ゴマ油、オリーブ油、トウモロコシ油、及びダイズ油;(10)グリコール、例えば、プロピレングリコール;(11)ポリオール、例えば、グリセリン、ソルビトール、マンニトール、及びポリエチレングリコール(PEG);(12)エステル、例えば、オレイン酸エチル及びラウリン酸エチル;(13)寒天;(14)緩衝剤、例えば、水酸化マグネシウム及び水酸化アルミニウム;(15)アルギン酸;(16)無発熱物質水;(17)等張食塩水;(18)リンゲル液;(19)エチルアルコール;(20)pH緩衝液;(21)ポリエステル、ポリカーボネート、及び/またはポリ無水物;(22)増量剤、例えば、ポリペプチド及びアミノ酸;(23)血清アルコール、例えば、エタノール;ならびに(23)薬学的製剤に用いられる他の非毒性で適合性の物体が挙げられる。湿潤剤、着色剤、離型剤、コーティング剤、甘味剤、香味剤、芳香剤、防腐剤及び抗酸化剤もまた、製剤中に存在させることができる。「賦形剤」、「担体」、「薬学的に許容される担体」、「ビヒクル」などの用語は、本明細書中では同じ意味で使用される。
医薬組成物は、1つ以上のpH緩衝化合物を含み、製剤のpHを、生理学的pH、例えば、約5.0~約8.0の範囲を反映する所定のレベルに維持することができる。水性液体製剤で使用されるpH緩衝化合物は、ヒスチジンなどのアミノ酸またはアミノ酸の混合物、あるいはヒスチジン及びグリシンなどのアミノ酸の混合物であり得る。あるいは、pH緩衝化合物は、好ましくは、製剤のpHを所定のレベル、例えば、約5.0~約8.0の範囲に維持し、カルシウムイオンをキレート化しない薬剤である。そのようなpH緩衝化合物の例示的な例として、イミダゾール及び酢酸イオンが挙げられるが、これらに限定されない。pH緩衝化合物は、製剤のpHを所定のレベルに維持するのに適した任意の量で存在させてよい。
医薬組成物はまた、1つ以上の浸透圧調節剤、すなわち、製剤の浸透圧特性(例えば、等張性、重量オスモル濃度、及び/または浸透圧)をレシピエント個体の血流及び血球に許容可能なレベルに調節する化合物を含み得る。浸透圧調節剤は、カルシウムイオンをキレート化しない薬剤であり得る。浸透圧調節剤は、製剤の浸透圧特性を調節する当業者に公知のまたは利用可能な任意の化合物であり得る。当業者であれば、本発明の製剤で使用するための所与の浸透圧調節剤の適合性を経験的に決定し得る。適切なタイプの浸透圧調節剤の例示的な例として:塩化ナトリウム及び酢酸ナトリウムなどの塩;ショ糖、ブドウ糖、マンニトールなどの糖;グリシンなどのアミノ酸;ならびにこれらの薬剤及び/または薬剤の種類の1つ以上の混合物が挙げられるが、これらに限定されない。浸透圧調節剤(複数可)は、製剤の浸透圧特性を調節するのに十分な任意の濃度で存在させてよい。
いくつかの実施形態では、医薬組成物を、対象へ送達するために、例えば、遺伝子編集用に製剤化する。本明細書に記載の医薬組成物を投与する適切な経路として、限定されないが:局所、皮下、経皮、皮内、病変内、関節内、腹腔内、膀胱内、経粘膜、歯肉内、歯内、蝸牛内、鼓室内、臓器内、硬膜外、髄腔内、筋肉内、静脈内、血管内、骨内、眼周囲、腫瘍内、脳内、及び脳室内投与が挙げられる。
いくつかの実施形態では、本明細書に記載の医薬組成物を、局所的に投与する。いくつかの実施形態では、本明細書に記載の医薬組成物を、注射、カテーテル、坐剤、またはインプラントによって対象に投与し、インプラントは、シラスティック膜(sialastic membrane)などの膜、または繊維を含む、多孔性、非多孔性、またはゼラチン状の物質である。
他の実施形態では、本明細書に記載の医薬組成物を、徐放系で送達する。一実施形態では、ポンプを使用することができる(例えば、Langer,1990,Science 249:1527-1533;Sefton,1989,CRC Crit.Ref.Biomed.Eng.14:201;Buchwald et al., 1980,Surgery 88:507;Saudek et al., 1989,N.Engl.J.Med.321:574を参照されたい)。別の実施形態では、重合物質を使用することができる。(例えば、Medical Applications of Controlled Release (Langer and Wise eds., CRC Press, Boca Raton, Fla., 1974);Controlled Drug Bioavailability, Drug Product Design and Performance (Smolen and Ball eds., Wiley, New York,1984);Ranger and Peppas,1983,Macromol.Sci.Rev.Macromol.Chem.23:61を参照されたい。Levy et al., 1985,Science 228:190;During et al., 1989,Ann.Neurol.25:351;Howard et ah,1989,J.Neurosurg.71:105も参照されたい)。他の徐放系は、例えば、Langer (上記)で議論されている。
いくつかの実施形態では、医薬組成物を、対象、例えば、ヒトへの静脈内または皮下投与に適合した組成物として、通常の手順に従って製剤化する。いくつかの実施形態では、注射による投与のための医薬組成物は、可溶化剤としての無菌等張使用の溶液、及び注射部位の痛みを和らげるためのリグノカインなどの局所麻酔薬である。一般的に、成分は、単位剤形で、例えば、活性薬剤の量を示すアンプルもしくはサシェなどの気密封止容器内に乾燥させた凍結乾燥粉末または水不含濃縮物として、別々に供給するか、あるいは一緒に混合して供給される。本薬剤は、点滴によって投与する場合、無菌の医薬グレードの水または食塩水を含む点滴ボトルで分注することができる。医薬組成物を注射によって投与する場合、成分が投与前に混合され得るように、注射用の滅菌水または食塩水のアンプルを提供してもよい。
全身投与用の医薬組成物は、液体、例えば、滅菌生理食塩水、乳酸リンゲル液またはハンクス溶液であり得る。さらに、医薬組成物を固体形態とし、使用直前に再溶解または懸濁することができる。凍結乾燥形態もまた、企図される。医薬組成物は、リポソームまたは微結晶などの脂質粒子または小胞内に含むことができ、これは非経口投与にも適している。粒子は、組成物がその中に含まれている限り、単層または複数層などの任意の適切な構造のものとすることができる。化合物を、融合性脂質ジオレオイルホスファチジルエタノールアミン(DOPE)、低レベル(5~10mol%)のカチオン性脂質を含む「安定化プラスミド-脂質粒子」(SPLP)に封入し、ポリエチレングリコール(PEG)コーティングによって安定化させることができる(Zhang Y.P.et ah,Gene Ther.1999,6:1438-47)。N-[1-(2,3-ジオレオイルオキシ)プロピル]-N,N,N-トリメチル-アンモニウムメチルサルフェート、または「DOTAP」などの正に帯電した脂質は、そのような粒子及び小胞にとって特に好ましい。そのような脂質粒子の調製は周知である。例えば、米国特許第4,880,635号;第4,906,477号;第4,911,928号;第4,917,951号;第4,920,016号、及び第4,921,757号を参照されたい;これらのそれぞれは、参照により本明細書に援用される。
本明細書に記載の医薬組成物は、例えば、単位用量として投与またはパッケージングすることができる。本開示の医薬組成物に関して使用する場合の用語「単位用量」とは、対象にとっての単位用量として適切な物理的に別個の単位を指し、各単位は、必要な希釈剤;すなわち、担体またはビヒクルと共に所望の治療効果を生み出すように計算された所定量の活性物質を含む。
さらに、医薬組成物は、(a)凍結乾燥形態の本発明の化合物を含む容器、及び(b)薬学的に許容される希釈剤(例えば、本発明の凍結乾燥化合物の再構成または希釈に使用される滅菌剤)を含む第2の容器を含む医薬キットとして提供することができる。医薬品または生物学的製品の製造、使用、または販売を規制する政府機関が定めた形式の通知を、任意選択でそのような容器(複数可)に付属させることができ、この通知は、ヒトへの投与に対する製造、使用、または販売の政府機関による承認を表す。
別の態様では、上記の疾患の治療に有用な物質を含む製品が含まれる。いくつかの実施形態では、製品は、容器及びラベルを含む。好適な容器として、例えば、ボトル、バイアル、シリンジ、及び試験管が挙げられる。容器は、ガラスまたはプラスチックなどの多様な材料から形成され得る。いくつかの実施形態では、容器は、本明細書に記載の疾患を治療するのに有効な組成物を保持し、滅菌アクセスポートを有し得る。例えば、容器は、皮下注射針によって貫通可能なストッパーを有する静脈内溶液バッグまたはバイアルであり得る。組成物中の活性薬剤は、本発明の化合物である。いくつかの実施形態では、容器上の、または容器に付随するラベルは、選択される疾患を治療するために組成物を使用することを示す。製品は、薬学的に許容される緩衝液、例えば、リン酸緩衝食塩水、リンゲル溶液、またはブドウ糖液を含む第2の容器をさらに含み得る。製品は、他の緩衝液、希釈剤、フィルター、針、シリンジ、及び使用に関する指示を有する添付文書を含む、商業的観点及び使用者の観点から望ましい他の物質をさらに含み得る。
いくつかの実施形態では、本明細書に記載の融合タンパク質、gRNA、及び/または複合体のいずれかを、医薬組成物の一部として提供する。いくつかの実施形態では、医薬組成物は、本明細書中で提供する融合タンパク質のいずれかを含む。いくつかの実施形態では、医薬組成物は、本明細書中で提供する複合体のいずれかを含む。いくつかの実施形態では、医薬組成物は、gRNA及びカチオン性脂質と複合体を形成するRNAガイドヌクレアーゼ(例えば、Cas9)を含むリボヌクレオタンパク質複合体を含む。いくつかの実施形態では、医薬組成物は、gRNA、核酸プログラム可能なDNA結合タンパク質、カチオン性脂質、及び薬学的に許容される賦形剤を含む。医薬組成物は、任意選択で、1つ以上の追加の治療的に活性な物質を含む。
HBV ORFのヌクレオチドを標的とするための核酸塩基編集体の使用 HBV ORFのヌクレオチドを標的とする核酸塩基編集体の適合性は、本明細書に記載のように評価する。一実施形態では、レポーター(例えば、GFP)をコードする少量のベクターと共に、核酸分子または本明細書に記載の核酸塩基編集体をコードする分子で、目的の単一の細胞(例えば、HBVに感染させた動物細胞)をトランスフェクトするか、形質導入するか、さもなければ改変する。これらの細胞は、293T、K562またはU20Sなどの不死化ヒト細胞株であり得る。あるいは、初代ヒト細胞を使用してもよい。そのような細胞は、最終的な細胞標的にとって適切であり得る。
送達は、ウイルスベクターを使用して実施してもよい。一実施形態では、トランスフェクションは、脂質トランスフェクション(LipofectamineまたはFugeneなど)を使用して、またはエレクトロポレーションによって実施してもよい。トランスフェクション後、GFPの発現は、蛍光顕微鏡またはフローサイトメトリーのいずれかによって測定し、一貫した高レベルのトランスフェクションを確認することができる。これらの予備的なトランスフェクションは、編集体のどの組み合わせが最大の活性を与えるかを判定するために、異なる核酸塩基編集体を含み得る。
核酸塩基編集体の活性は、本明細書に記載のように、すなわち、HBVのゲノムまたはORFを配列決定して、標的配列の改変を検出することによって評価する。サンガーシーケンシングでは、精製したPCRアンプリコンをプラスミドバックボーンにクローニングし、形質転換し、ミニプレップし、単一のプライマーでシーケンシングする。配列決定は、次世代シーケンシング技術を使用して実施してもよい。次世代シーケンシングを使用する場合、アンプリコンは、300~500bpであり、目的の切断部位が非対称に配置されていてもよい。PCRに続いて、例えば、ハイスループットシーケンシング(例えば、Illumina MiSeq)で使用するために、次世代シーケンシングアダプター及びバーコード(例えば、Illuminaマルチプレックスアダプター及びインデックス)をアンプリコンの端に付加してもよい。
初期試験で最大レベルの標的特異的改変を誘発する融合タンパク質を、さらなる評価のために選択することができる。
特定の実施形態では、核酸塩基編集体を使用して、目的のポリヌクレオチドを標的化する。一実施形態では、本発明の核酸塩基編集体を、HBVゲノム内の核酸配列を標的化するために使用するガイドRNAと併せて細胞(例えば、肝臓)に送達し、それによってHBV遺伝子を改変する。
いくつかの実施形態では、ガイドRNAによって塩基編集体を標的指向化し、HBVゲノムのポリメラーゼ(pol)遺伝子に1つ以上のミスセンス変異または未成熟終止コドンを導入する。いくつかの実施形態では、塩基編集体によってpol遺伝子に導入される1つ以上の変異は、E24G、L25F、P26F、R27C、V48A、V48I、S382F、V378I、V378A、V379I、V379A、L377F、D380G、D380N、F381P、R376G、A422T、F423P、A432V、M433V、P434S、D540G、A688V、D689G、A717T、E718K、P713S、P713L、及びL719Pをコードする。いくつかの実施形態では、pol遺伝子に導入される1つ以上の変異は、E24G、L25F、P26F、R27C、V48A、V48I、S382F、V378I、V378A、V379I、V379A、L377F、D380G、D380N、F381P、R376G、A422T、F423P、A432V、M433V、P434S、D540G、A688V、D689G、A717T、E718K、P713S、P713L、及びL719Pからなる群から選択される変異である。
いくつかの実施形態では、ガイドRNAによって本明細書に記載の塩基編集体を標的指向化し、HBVゲノムのコア遺伝子に1つ以上のミスセンス変異または未成熟終止コドンを導入する。いくつかの実施形態では、コア遺伝子に導入される1つ以上の変異には、T160A、T160A、P161F、S162L、C183R、及び/または*(STOP)184Qが含まれる。いくつかの実施形態では、コア遺伝子に導入される1つ以上の変異は、T160A、T160A、P161F、S162L、C183R、及び*(STOP)184Qからなる群から選択される。
いくつかの実施形態では、ガイドRNAによって本明細書に記載の塩基編集体を標的指向化し、HBVゲノムのX遺伝子内に1つ以上のミスセンス変異または未成熟終止コドンを導入する。いくつかの実施形態では、X遺伝子に導入される1つ以上の変異には、H86Y、R87*(STOP)、H86R、W120R、W120STOP、E122K、E121K、及び/またはL141Pが含まれる。いくつかの実施形態では、コア遺伝子に導入される1つ以上の変異は、H86Y、R87*(STOP)、H86R、W120R、W120STOP、E122K、E121K、及びL141Pからなる群から選択される。
いくつかの実施形態では、ガイドRNAによって本明細書に記載の塩基編集体を標的指向化し、HBVゲノムのS遺伝子内に1つ以上のミスセンス変異または未成熟終止コドンを導入する。いくつかの実施形態では、1つ以上の変異には、S38F、L39F、W35STOP、W35R、W36STOP、W36R、T37I、T37A、R78Q、S34L、F80P、及び/またはD33Gが含まれる。いくつかの実施形態では、S遺伝子に導入される1つ以上の変異は、S38F、L39F、W35*(STOP)、W35R、W36*(STOP)、W36R、T37I、T37A、R78Q、S34L、F80P、及びD33Gからなる群から選択される。
キット
本開示の様々な態様は、塩基編集系を含むキットを提供する。一実施形態では、キットは、核酸塩基編集体融合タンパク質をコードするヌクレオチド配列を含む核酸構築物を含む。融合タンパク質は、デアミナーゼ(例えば、シチジンデアミナーゼまたはアデニンデアミナーゼ)及び核酸プログラム可能なDNA結合タンパク質(napDNAbp)を含む。いくつかの実施形態では、キットは、HBV遺伝子を標的化することができる少なくとも1つのガイドRNAを含む。いくつかの実施形態では、キットは、少なくとも1つのガイドRNAをコードするヌクレオチド配列を含む核酸構築物を含む。
キットは、いくつかの実施形態では、HBVゲノム中の1つ以上の遺伝子を編集するための、キットを使用するための説明書を提供する。説明書には、一般的に、核酸、特にウイルス核酸を編集するためのキットの使用に関する情報が含まれる。他の実施形態では、説明書は、以下のうちの少なくとも1つを含む:注意書き;警告;臨床試験、及び/または参考文献。説明書は、容器(存在する場合)に直接印刷するか、もしくは容器に貼付されたラベルとして、または容器に供給されるかもしくは付属される別個のシート、パンフレット、カード、またはフォルダとして印刷され得る。さらなる実施形態では、キットは、適切な動作パラメータのためのラベルまたは別個の挿入物(添付文書)の形態の説明書を含み得る。さらに別の実施形態では、キットは、検出、較正、または正規化のための標準(複数可)として使用される、適切な陽性及び陰性対照または対照試料を含む1つ以上の容器を含み得る。
特定の実施形態では、キットは、HBV感染症を有する対象の治療に有用である。
HBV感染症の治療法
本発明は、本明細書に記載の塩基編集系(例えば、塩基編集体及びgRNA)をコードするポリヌクレオチドを含む治療有効量の医薬組成物を対象(例えば、ヒトなどの哺乳類)に投与することを含む、HBV感染症またはその症状の治療方法を提供する。いくつかの実施形態では、塩基編集体は、ポリヌクレオチドプログラム可能なDNA結合ドメイン及びアデノシンデアミナーゼドメインまたはシチジンデアミナーゼドメインを含む融合タンパク質である。対象の細胞に、塩基編集体及び塩基編集体を標的指向化する1つ以上のガイドポリヌクレオチドで形質導入し、HBVポリペプチドをコードする核酸配列のA・TからG・Cへの改変(細胞をアデノシンデアミナーゼドメインで形質導入する場合)またはC・GからU・Aへの改変(細胞をシチジンデアミナーゼドメインで形質導入する場合)を生じさせる。
いくつかの実施形態では、慢性B型肝炎の治療は、アプローチの組み合わせを含む。例えば、HBVに感染した対象に、HBV cccDNAを標的とし改変する上記の治療有効量の薬剤の組み合わせを投与することができる。例えば、UGIドメインを有さないBE4塩基編集体は、HBVゲノムの領域を標的とするgRNAと共に使用することができる。理論に拘泥することを望むものではないが、阻害因子を省略すると、CからUへの脱アミノ化がウラシルグリコシラーゼの影響を受けやすくなり、HBV cccDNAが損傷し、不安定になる。この処置は、HBsAg発現(組み込まれたHBV DNAからの発現を含む)を低減または阻害する処置、例えば、本明細書に記載の塩基編集体及びガイドRNAを使用してHBVゲノムのS遺伝子またはpol遺伝子を標的化することと組み合わせることができる。処置はまた、免疫系を刺激することを含み得る。いくつかの実施形態では、これらの3つの異なる治療目標のそれぞれは、本明細書に記載の塩基編集試薬及び技術を使用して達成することができる。
本明細書の方法は、対象(そのような治療を必要としていると特定された対象を含む)に、本明細書に記載の有効量の組成物を投与することを含む。そのような治療を必要とする対象の特定は、対象または医療専門家の判断で行うことができ、主観的(例えば、意見)または客観的(例えば、試験または診断方法によって測定可能な)であり得る。
本発明の治療方法は、一般的に、例えば、塩基編集体及び目的のHBV遺伝子を標的とするgRNAをコードするベクターを含む治療有効量の医薬組成物を、それを必要とする対象(例えば、ヒト)に投与することを含む。そのような治療は、HBV感染症に罹患しているか、有しているか、感受性があるか、またはそのリスクがある対象、特にヒトに適切に投与されるであろう。本明細書の組成物はまた、HBV感染症が関係している可能性がある他の任意の障害の治療に使用してもよい。
一実施形態では、本発明は、治療の進行をモニタリングする方法を提供する。この方法は、HBV感染症に関連する障害もしくはその症状に罹患しているか、または罹患しやすい対象における診断マーカー(マーカー)(例えば、ウイルス量)または診断測定(例えば、スクリーニング、アッセイ)のレベルを測定するステップを含み、対象は、疾患またはその症状を治療するのに十分な治療量の本明細書の組成物を投与されている。この方法で測定されたマーカーのレベルは、健康な正常な対照または他の罹患患者のいずれかにおける既知のマーカーのレベルと比較して、対象の疾患状態を確立することができる。好ましい実施形態では、対象におけるマーカーの第2のレベルを、第1のレベルの測定より後の時点で測定し、2つのレベルを比較して、疾患の経過または治療の有効性をモニタリングする。特定の好ましい実施形態では、対象におけるマーカーの治療前レベルを、本発明による治療を開始する前に測定し;次いで、このマーカーの治療前のレベルを、治療開始後の対象のマーカーのレベルと比較して、治療の有効性を判定することができる。
本発明の実施は、別途示されない限り、分子生物学(組換え技術を含む)、微生物学、細胞生物学、生化学及び免疫学の従来の技術を使用し、これらは十分に当業者の範囲内である。そのような技術は、”Molecular Cloning:A Laboratory Manual”,second edition (Sambrook,1989);”Oligonucleotide Synthesis” (Gait,1984);”Animal Cell Culture” (Freshney,1987);”Methods in Enzymology” ”Handbook of Experimental Immunology” (Weir,1996);”Gene Transfer Vectors for Mammalian Cells” (Miller and Calos,1987);”Current Protocols in Molecular Biology” (Ausubel,1987);”PCR:The Polymerase Chain Reaction”, (Mullis,1994);”Current Protocols in Immunology” (Coligan,1991)などの文献で完全に説明されている。これらの技術は、本発明のポリヌクレオチド及びポリペプチドの製造に適用可能であり、したがって、本発明を作成及び実施する際に考慮され得る。特定の実施形態に特に有用な技術については、以下の節で説明する。
以下の実施例は、当業者に対して、本発明のアッセイ、スクリーニング、及び治療法を行いかつ使用する方法の完全な開示ならびに説明を提供するために提示されており、本発明者らが自身の発明と見なすものの範囲を限定することを意図しない。
実施例1:HBVゲノムの標的化塩基編集は、ウイルス遺伝子における未成熟終止コドンまたは機能的置換をもたらした。
塩基編集体(図4A、4B)を、HBVゲノムを編集する能力について評価した。塩基編集体を標的指向化し、HBV遺伝子の保存領域に終止コドンまたは機能的置換が導入されるように、ガイドRNAを設計した(図5)。HBV遺伝子型D、遺伝子亜型aywを、Benchlingソフトウェアで利用可能なCRISPRデザインツールを使用して分析し、潜在的なガイドRNAを同定し、すべてのHBV遺伝子型にわたる配列保存のレベルを各ガイドRNAについて測定した。塩基編集体を標的指向化し、編集ウィンドウのシトシン位置に基づいてHBV遺伝子に終止コドンまたは機能変化を導入する97個のガイドRNAを、試験のために選択した(表14)。これらのガイドRNAは、NGG、NAG、及びNNNRRT (NNGRRTを含む)PAM配列に隣接または近接していた。
Figure 2022532139000077
Figure 2022532139000078
Figure 2022532139000079
Figure 2022532139000080
Figure 2022532139000081
Figure 2022532139000082
遺伝子編集効率は以下のように評価した。プラスミドトランスフェクションでは、ガイドRNAをコードするベクターと塩基編集体をコードするベクターを、HBVゲノムを含むレンチウイルスベクターで事前に形質導入したHEK293T細胞に一過性にトランスフェクトした。試験した塩基編集体には、ABE、BE4 (図4B)、または以下の中からのBE4バリアントが含まれていた:
A3A-BE4は、APOBEC-1をAPOBEC-3Aの配列に置き換えたBE4のバリアントを示し;APOBEC-3A (A3A)は、例えば、Gehrke et al., Nature Biotechnology volume 36,pages 977-982 (2018)に記載されており;
A3A-BE4-VRQRは、APOBEC-1をAPOBEC-3Aの配列に置き換え、Cas9を、V1134、R1217、Q1334、及びR1336 (SpCas9-VRQRと呼ばれる)を含むCas9バリアントに置き換えたBE4のバリアントを示しており;そして
BE4-VRQRは、Cas9を、V1134、R1217、Q1334、及びR1336 (SpCas9-VRQRと呼ばれる)を含むCas9バリアントに置き換えたBE4バリアントを示している。
特定のガイドで使用される塩基編集体の概要を表13に示す。
トランスフェクションは、Hek293またはHepG2-NTCP細胞用に最適化された高効率で低毒性のDNAトランスフェクション試薬(MirusTransIT293またはLipofectamine2000)を使用し、250ngのgRNAプラスミドと750ngの塩基編集体プラスミドを使用して3:1の比率で実施した。mRNAトランスフェクションでは、HepG2-NTCP細胞に、lipofectamin Messengermaxを使用して、in vitroで転写した塩基編集体mRNAと合成gRNAを3:1の比率でトランスフェクトした。プラスミドトランスフェクションで4日間、RNAトランスフェクションで2日間の後、ゲノムDNAを0.05%SDS、25μg/mlプロテイナーゼK、10mM Tris pH8.0のシンプルな溶解緩衝液で抽出し、85℃で熱失活させた。ゲノム部位をPCR増幅し、MiSeqで配列決定した。試験したガイドRNAのおよそ60%がHBVゲノムに終止コドンを導入した。試験した97個のガイドRNAのうち、12個は全HBVゲノムにわたって20%超のオンターゲット塩基編集と15%超の保存を示した(図6、表15 (M81及びM189は表に含まれているが、陰性対照として使用した)。
Figure 2022532139000083
これらの12個のガイドRNAのうち、M94は、HBVポリメラーゼの触媒ドメインに機能変化変異を導入した(D540G置換)。この位置での変異は、ポリメラーゼのプライミング及び伸長活性を阻害することが知られている。
実施例2:異なる塩基編集体がHBVゲノムに改変を導入した
様々な塩基編集体(すなわち、BE4、BE4-VRQR、A3A-BE4-VRQR、及びABE (TadA7.10)を、効率及び特異性について比較した。塩基編集効率とは、編集された配列を有する配列リードの数を、分析した配列リードの総数で割ったものを指す。塩基編集の特異性とは、意図される塩基編集とバイスタンダー塩基編集との比率を指す。上記のように、塩基編集体とガイドRNAを細胞に導入した。具体的には、少なくとも20%のオンターゲット塩基編集を有していた12個のガイドRNAのサブセットを、BE4及びA3ABE4塩基編集体で試験した。BE4は、APOBECシチジンデアミナーゼ、Cas9ドメイン、及び2つのウラシルDNAグリコシラーゼ阻害因子(UGI)ドメインを含み、一方、A3A-BE4は、APOBEC3Aシチジンデアミナーゼ、Cas9ドメイン、及び2つのUGIドメインを含む。図7に示すように、BE4塩基編集体は、APOBEC3Aシチジンデアミナーゼを含む塩基編集体(A3ABE4)と比較して、各ガイドRNAについてより良好な効率を、そしてガイドRNAの大部分についてより良好な特異性を有していた。
BE4塩基編集体をコードするDNA及びRNA構築物を、ガイドRNAと共にHepG2-NTCP-lenti-HBV細胞株に導入した。具体的には、DNA構築物、野生型RNA構築物、及びN1部分で修飾されたシュードウラシルを含むRNA構築物が試験された。2つの異なる量(400ng及び800ng)の修飾RNA構築物を試験した。各構築物は塩基編集を生成したが、シュードウラシルを含むRNA構築物は、DNA構築物または野生型RNA構築物よりも高い塩基編集効率を示したと見られた(図8及び9)。
ガイドRNAを、BE4、BE4-VRQR、及びABE塩基編集体でさらに試験した。N1部分で修飾されたシュードウラシルを含み、塩基編集体をコードするRNA構築物を、ガイドRNAと共にHepG2-NTCP-lenti-HBV細胞株に導入した。図10に示すように、各塩基編集体は、40%超の機能的編集を示した。表16及び17は、BE4及びABE塩基編集系の潜在的な塩基編集結果を示す。
Figure 2022532139000084
Figure 2022532139000085
Figure 2022532139000086
実施例3:塩基編集体を使用して、HBVゲノムの保存領域を標的とした。
塩基編集体を、HBVゲノムの保存領域を編集する能力について評価した(図11)。表18は、HBV A及びD遺伝子型の80%超で保存されている領域(「超保存」)を標的とし、オフターゲット効果を最小限に抑えるように設計された(すなわち、ヒトゲノム領域を標的とする)126個のガイドRNAを特定する。これらのガイドRNAは、HBVゲノム間の高度な保存に基づいて機能的な変化を導入すると考えられる。理論に拘泥するものではないが、塩基編集体(UGIのない塩基編集体を含む)を使用してデアミナーゼをHBV cccDNAに標的指向化すると、脱ピリミジン部位の形成とcccDNAの損傷及び/または分解が促進される可能性がある。表18に、塩基編集体をHBVゲノムの保存領域に標的指向化するガイドRNAの配列のリストを示す。これらのガイドRNAは、HBV遺伝子型A、B、C、及びD間で50%を超える保存があり、ヒトゲノムhg38の最も類似した配列と少なくとも1つのミスマッチがある配列を標的とし、それによってオフターゲット効果を最小限に抑える。
Figure 2022532139000087
Figure 2022532139000088
Figure 2022532139000089
Figure 2022532139000090
Figure 2022532139000091
Figure 2022532139000092
Figure 2022532139000093
Figure 2022532139000094
試験したガイド核酸を表18Aに記載する(図11も参照されたい)。
Figure 2022532139000095
50,000個のHBV感染細胞(pBtx693:X及びコアHBV遺伝子をコードするHBV配列で形質導入した細胞株、ならびにpBtx536:Pol及びS HBV遺伝子をコードするHBV配列で形質導入した細胞株)を、ガイドRNA及び塩基編集体(pBtx448(BE4)、pBtx543(VRQR-BE4)、またはpBTx546(sa-Cas9)でトランスフェクションする1日前にプレーティングした。250ngのガイドRNAと塩基編集体をコードする750ngの構築物を細胞にトランスフェクトした。トランスフェクションの1日後と3日後に培地を交換した。採取した細胞からDNAを単離し、編集した領域を10μMプライマーを使用したPCRで増幅した。表の各セルは、増幅反応で使用するプライマー(例えば、1058/ES86)、ガイドRNA (例えば、E1)、及び塩基編集体(例えば、546)を識別する。PCR反応の条件は以下の通りであった:98℃で30秒間の初期ステップ、続いて98℃で10秒間、60℃で20秒間、72℃で20秒間を30ラウンド、その後の72℃で5分間の最終ステップ。
続いて、増幅産物を配列決定して、ガイドRNAの標的となったいずれのヌクレオチドが編集されたか(すなわち、編集の特異性)、及び編集の効率を特定した。表19は、表20に記載されている各ガイドRNAの塩基編集効率と特異性の要約である。
Figure 2022532139000096
Figure 2022532139000097
Figure 2022532139000098
表19及び20は、アミノ酸の置換とその頻度を特定しており、これは、HBVゲノムの超保存領域を標的とするように設計されたガイドRNAを使用したBE4及びABEを介した編集の結果である。
Figure 2022532139000099
Figure 2022532139000100
Figure 2022532139000101
Figure 2022532139000102
Figure 2022532139000103
実施例4:HBVを標的とするための追加のgRNAが企図された
表22は、ABE塩基編集体を使用してHBVゲノムにミスセンス変異を導入するように設計されたガイドRNAの標的となる配列のリストを示す。ガイドRNAの標的となる配列は、HBV遺伝子型AとDの間で少なくとも50%保存されていた。gRNAとABEの適用によって生じるアミノ酸置換をin silicoで分析し、さらに、既知の配列決定されたHBV遺伝子の0.05%未満で生じるアミノ酸置換を生成するであろうgRNAを選択した。これは、選択したgRNAを使用した塩基編集により、HBVタンパク質の機能が低下するであろうことを意味する。
Figure 2022532139000104
Figure 2022532139000105
Figure 2022532139000106
Figure 2022532139000107
Figure 2022532139000108
Figure 2022532139000109
Figure 2022532139000110
表23は、BE4塩基編集体を使用してHBVゲノムにミスセンス変異を導入するガイドRNAのリストを示す。ガイドRNAの配列は、HBV遺伝子型AとDの間で少なくとも50%保存されていた。gRNAとBE4の適用によって生じるアミノ酸置換をin silicoで分析し、さらに、既知の配列決定されたHBV遺伝子の0.05%未満で生じるアミノ酸置換を生成するであろうgRNAを選択した。これは、選択したgRNAを使用した塩基編集により、HBVタンパク質の機能が低下するであろうことを意味する。
Figure 2022532139000111
Figure 2022532139000112
Figure 2022532139000113
Figure 2022532139000114
Figure 2022532139000115
Figure 2022532139000116
表24は、HBV遺伝子に未成熟終止コドンを導入するガイドRNAの標的となる配列のリストを示す。
Figure 2022532139000117
Figure 2022532139000118
Figure 2022532139000119
Figure 2022532139000120
Figure 2022532139000121
Figure 2022532139000122
Figure 2022532139000123
表25は、HBVゲノムのガイドRNAが標的とする配列のリストである。
Figure 2022532139000124
Figure 2022532139000125
Figure 2022532139000126
Figure 2022532139000127
Figure 2022532139000128
Figure 2022532139000129
Figure 2022532139000130
Figure 2022532139000131
Figure 2022532139000132
Figure 2022532139000133
Figure 2022532139000134
Figure 2022532139000135
Figure 2022532139000136
Figure 2022532139000137
Figure 2022532139000138
Figure 2022532139000139
Figure 2022532139000140
Figure 2022532139000141
Figure 2022532139000142
Figure 2022532139000143
Figure 2022532139000144
Figure 2022532139000145
Figure 2022532139000146
Figure 2022532139000147
Figure 2022532139000148
Figure 2022532139000149
Figure 2022532139000150
Figure 2022532139000151
Figure 2022532139000152
Figure 2022532139000153
Figure 2022532139000154
Figure 2022532139000155
Figure 2022532139000156
Figure 2022532139000157
Figure 2022532139000158
Figure 2022532139000159
Figure 2022532139000160
Figure 2022532139000161
Figure 2022532139000162
Figure 2022532139000163
Figure 2022532139000164
Figure 2022532139000165
Figure 2022532139000166
Figure 2022532139000167
Figure 2022532139000168
Figure 2022532139000169
Figure 2022532139000170
Figure 2022532139000171
Figure 2022532139000172
Figure 2022532139000173
Figure 2022532139000174
Figure 2022532139000175
Figure 2022532139000176
Figure 2022532139000177
Figure 2022532139000178
Figure 2022532139000179
Figure 2022532139000180
Figure 2022532139000181
Figure 2022532139000182
Figure 2022532139000183
Figure 2022532139000184
Figure 2022532139000185
Figure 2022532139000186
Figure 2022532139000187
Figure 2022532139000188
Figure 2022532139000189
Figure 2022532139000190
Figure 2022532139000191
実施例5:HBVに感染した初代ヒト肝細胞(PHH)系の確立及び検証
HBVに感染した初代ヒト肝細胞(PHH)を含む系を、自己組織化初代肝細胞共培養系における30日を超える持続的なHBV感染によって確立した(図12A)。共培養系を生成するために、初代ヒト肝細胞(PHH)(BioIVT)をI型コラーゲンコーティング24ウェルプレート(Corning,354408)にウェルあたり350k細胞でプレーティングし、37℃、5%CO2でインキュベートして、接着細胞単層を生成した。プレーティングの4時間後、プレーティングした肝細胞をCP培地(BioIVT)で洗浄し、非接着細胞をすべて除去した。3T3-J2マウス胚性線維芽細胞(Kerafast (Howard Green (Harvard),Bostonから配布)をウェルあたり95%肝細胞:5%線維芽細胞の比率で播種し、37℃、5%CO2でさらに12時間培養して共培養物を形成した。継続的なメンテナンスのために、培地を2日ごとに交換した(ウェルあたり500μL)。図12Cに示すのは、2つの異なるヒト肝臓から単離された、2つのヒト肝細胞ドナー、RSE及びTVR由来の形質導入された初代肝細胞の画像である。それらが単離され、凍結保存され、BioIVT (Maryland,US)によって研究目的用に販売された。
肝細胞共培養形成後の2日目に、レンチウイルスを、ウェルあたりMOI500で培地に滴下した。共培養物を16時間形質導入した後、培地を新鮮なCP培地(BioIVT)に交換した。継続的なメンテナンスのために、培地を2日ごとに交換した(ウェルあたり500μL)。タンパク質の発現は、肝臓の共培養物中で7日間にわたって生じる。形質導入後7日目に、gRNA及び塩基編集体mRNAと共に製剤化されたリポフェクションベースの試薬を使用して共培養物をトランスフェクトした。トランスフェクションの48時間後に細胞を溶解し、gDNA用に回収した。図12Bは、肝細胞単層または肝細胞共培養物のいずれかにおけるin vitro形質導入スケジュールのタイムラインを示し、代表的な時点を示している。重要なことに、感染中にポリエチレングリコール(PEG)で処理していないPHH培養物は、HBVに感染したPHH細胞の割合が非常に低い傾向がある。
系が初代肝細胞の生理学的環境を再現するかどうかを判断するために、HBV感染及び非感染培養PHH細胞を、複製を阻害してcccDNAを減少させるインターフェロン、または複製を阻害するがcccDNAレベルを低下させないテノホビルで処理し、HBVマーカーを測定した(図13A)。感染した細胞は、HBVマーカーで測定すると、処理に対して期待どおりに反応する。図13Bに示すように、ゴールドスタンダードのHBV複製マーカーである細胞外HBV DNAは、感染後7日目までに、未処理のHBV感染対照細胞と比較して有意に低下した。処理したPHH培養物で検出された細胞外HBV DNAの量は、陰性対照細胞培養物で観察された量と同様であった。さらに、処理細胞と対照細胞は、感染後5~13日の間に細胞外HBV DNAのほぼベースラインレベルを示したが、未処理のHBV感染細胞培養物中の細胞外HBV DNAの濃度は、観察期間全体にわたって増加していた(すなわち、感染後5~13日)。
HBV感染に関連する他のマーカーとして、HBV表面抗原(HBsAg)、細胞内HBV DNA、全HBV RNA、及びプレゲノムRNA (pgRNA)が挙げられる。インターフェロンまたはテノホビルで処理した培養物は、陰性対照と比較して、HBV表面抗原(HBsAg)、細胞内HBV DNA、全HBV RNA、及びプレゲノムRNA (pgRNA)のレベルが低い(それぞれ図13C、13D、13E、及び13F)。これらの結果は、HBVマーカーが期待通りに処理に反応することを示している。また、PHH系が生理学的に適切であり、HBV複製とcccDNA活性を評価するのに役立つことも立証している。
実施例6:BE4及びgRNAでのトランスフェクションは、HBV感染PHHにおけるHBVマーカーレベルの低下をもたらす
本発明の塩基編集体及びガイドRNAを使用して、PHH細胞におけるHBVゲノムを塩基編集することの有効性を、上記の系を使用して評価した。具体的には、細胞にBE4塩基編集体(UGIドメイン有りまたはなしの)及びgRNAをコードする構築物をトランスフェクトした。M52及びM190ガイドRNAを選択した。これらのgRNAは、HBVゲノムのpol及びX遺伝子領域にそれぞれ塩基編集体を誘導し、これらの遺伝子に未成熟終止コドンをもたらす塩基変化を促進する。図14に示すように、BE4 (UGIドメインを有さない)及びHBV標的化gRNAで処理した細胞は、インターフェロン処理で観察された結果と同様に、試験したすべてのHBVマーカーレベルの有意な減少を一貫してもたらした。UGIドメインのないBE4塩基編集体は、UGIドメインのあるBE4よりもパフォーマンスが優れている。理論に拘泥することを望むものではないが、UGIドメインを省略すると、CからUへの脱アミノ化がウラシルグリコシラーゼの影響を受けやすくなり、HBV cccDNAが損傷し、その分解が促進される。
実施例7:HBV-PHHのHBsAgレベル(cccDNAの代理マーカー)に基づくスクリーニングにより、機能的なgRNAが同定される
リード機能的ガイドRNAは、実施例5に記載の系を使用して同定した。候補ガイドRNAを、BE4塩基編集体と共にHBV感染PHHに導入し、HBsAgのレベルを測定した。機能的ガイドRNAで処理した細胞で観察されたHBsAgレベルは、未処理の細胞で観察されたものよりも低く(図15)、インターフェロンで処理した細胞で観察されたレベルに幾分近づいた。プレコア、pol、及びX遺伝子を標的とする機能的ガイドRNAで処理した細胞におけるHBsAgレベルを図15に示す。UGIドメインのないBE4塩基編集体は、HBV標的化gRNAと組み合わせた場合、UGIドメインのあるBE4塩基編集体よりもHBsAgレベルが低いことから明らかなように、パフォーマンスが優れていた。このスクリーニングの結果に基づいて、最良のgRNA (X遺伝子を標的とするgRNA191、及びpol遺伝子を標的とするgRNA12)を選択した。gRNA191及びBE4_noUGIで処理した細胞のHBsAg (cccDNAの代理マーカー)のレベルは、インターフェロン処理の結果として得られたHBsAgのレベルと同等であった。
実施例8:HBVでの塩基編集作用の機構的態様
HBVに感染したPHH細胞は、BE4塩基編集体、UGIドメインを欠損したBE4塩基編集体、ニッカーゼ活性を欠損し(すなわち、「不活性な」)、さらにUGIドメインを欠損したBE4塩基編集体、Cas9、及び不活性Cas9をコードするmRNAを、それぞれ単独で、またはgRNA191もしくはgRNA12と組み合わせてトランスフェクトした。gRNA191は、塩基編集体を標的指向化し、未成熟終止コドンをX遺伝子に導入し、gRNA12は、塩基編集体をHBV Pol/S遺伝子の保存領域に標的指向化する。
HBVのマーカーであるHBsAg及びHBV細胞外DNAは、塩基編集体及びgRNAでのトランスフェクションに応答して有意に減少した(図16A及び16B)。HBsAgレベルは、未処理のHBV感染細胞(HBVと呼ばれる)に対して正規化している。ヌクレアーゼ活性はCas9活性に必要であったが、塩基編集活性には必要ではなかった。興味深いことに、Cas9 mRNAのみの導入は、ガイドRNAなしでウイルスパラメータを減少させた。理論に拘泥することを望むものではないが、mRNAは細胞性免疫応答を誘発する可能性があり、これがHBV阻害に寄与する。HBVはエピソーム的に存在し得るが、宿主細胞のゲノムにも組み込まれ得る。gRNAと共に投与したUGIドメインを欠損したBE4塩基編集体は、gRNAと共に投与したCas9と同等の活性を示した。ニッカーゼ活性を欠損した塩基編集体(例えば、不活性BE4)は、変換されたC→Uに対するウラシルグリコシラーゼの活性によって脱塩基部位が形成される場合に、ゲノム二本鎖切断が生成する可能性を低下させるため、有利である(図3Bを参照されたい)。理論に拘泥することを望むものではないが、慢性B型肝炎を治療するには、以下を含む複雑なアプローチが有利な場合がある:1)cccDNAを標的化し;2)HBsAg合成を阻害し(組み込まれたHBV DNAからの合成を含む);3)免疫系を刺激する。これらの特性は、塩基編集に使用される試薬に見出すことができる。
実施例9:HBV-lenti-HepG2とHBVに感染したPHHにおける塩基編集の比較
HEPG2-NTCPLenti-HBV及びHBVに感染したPHH細胞で、塩基編集効率を比較した。HEPG2-NTCP Lenti-HBV細胞と比較して、HBV感染PHH細胞では有意に低い編集率が観察された(図17A及び17B)。さらに、gRNAの有効性の異なるパターンが2つの異なる細胞型で観察された。HEPG2-NTCP Lenti-HBV細胞は、gRNA190を使用した場合、PHH-HBV細胞と比較して高い塩基編集効率を示した(図18)。興味深いことに、PHH-HBV細胞ではインデルまたはトランスバージョンは観察されなかった(図18)。予想通り、gRNA190とBE4_noUGIで編集されたLenti-HBV細胞では、かなりの数のインデルとトランスバージョンが観察された。BE4_noUGIを使用したPHH-HBVにインデルまたはトランスバージョンがなかったことは、組み込まれたHBV DNAと比較して編集されたcccDNAの運命が異なることを示している。
実施例10:塩基編集試薬の抗ウイルス活性を評価するための臨床的に適切な系としてのHBVウイルスに感染させた初代肝細胞共培養物(PHH)。
本明細書に記載のHBV感染初代ヒト肝細胞(PHH)培養物を使用する塩基編集アプローチが、既知のHBV抗ウイルス薬(エンテカビル)及び/または他の対照の活性と比較して、いくつかの異なるウイルスパラメータを低減するのにより効率的であるかどうかを判定するために実験を行った。
実験は、HBVに感染したPHH培養系を使用するアプローチと、図19に示すような塩基編集系の成分(塩基編集体)によるPHHのトランスフェクションを採用した。塩基編集体の抗ウイルス効果を試験するために、初代肝細胞(PHH)共培養物をHBVに感染させた。塩基編集試薬または成分(塩基編集体mRNA及び合成gRNA)を、2週間の間に2回リポフェクションを介してトランスフェクトした。最初のトランスフェクションを感染の3日後に行い、トランスフェクション時にウイルスの共有結合による閉環状DNA (cccDNA)を完全に形成させた。細胞外パラメータ(HBsAg、HBeAg、及びHBV DNA)を、実験の過程でモニタリングし、細胞内パラメータ(HBV DNA、ウイルスRNA、及び編集)を、実験の最後にモニタリングした。簡潔に述べると、0日目にPHHをHBVに感染させた(MOI=500)。HBV感染後3日目に、細胞を、塩基編集成分、例えば、BE及びgRNA、または対照(複数可)でトランスフェクトした。10日目に、PHHを、別のトランスフェクションのラウンドに供した。実験の終了時、例えば、17日目以上、例えば、25日目に、PHHを溶解し、HBsAg、HBeAg、及びHBV DNAの細胞外量を評価した。また、HBV DNA、ウイルスRNAの細胞内量、及び対照(複数可)に対する塩基編集系の成分の塩基編集の効力も評価した。トランスフェクションの詳細:RNAフォーマット、24ウェルプレート(600ng塩基編集体+200ng gRNA)中に、ウェルあたり800ngの全RNAを、ベンダーのプロトコルに従ってリポフェクション(lipofectamin messengerMax、Thermofisher Scientific)を介してトランスフェクトする。
本明細書に記載の塩基編集試薬を使用して、HBVライフサイクルのいずれのステップ(複数可)が標的にされたかを判定するために、4つの異なるウイルスパラメータ(HBsAg、HBeAg、HBV DNA、及びcccDNAから生成されるプレゲノムRNA (pgRNA)を評価した。cccDNAから生成されるプレゲノムRNA (pgRNA)は、ウイルスゲノムの増幅と複製に重要な役割を果たす。肝臓のpgRNA及びcccDNAの発現レベルは、感染細胞におけるウイルスの持続性と複製活性を示す。
14日間のPHH共培養実験(図19)(コンパレータとして一般的なHBV抗ウイルス薬エンテカビルを含んでいた)において、HBVに感染したPHHを、塩基編集体BE4またはBE4_noUGIとgRNA、すなわち、HBVポリメラーゼとS遺伝子の交差部分を標的とするgRNA12でトランスフェクトした。エンテカビルはウイルスポリメラーゼを不活性化し、それによって複製を阻害するが、cccDNA活性を妨害しない。当技術分野での使用に基づいて、エンテカビル処理はHBV DNAを減少させるが、HBsAg及びpgRNAの発現には影響を与えない。この結果は、確立された系がHBV抗ウイルス試薬の有効性を評価するために臨床的に適切であることを示している。この実験の所見は、エンテカビルと比較して、HBVに感染したPHHをBE4_noUGI及びgRNA12で処理すると、評価したHBVマーカーパラメータの4つすべて、すなわち、HBV DNA、HBsAg、HBeAg、及びpgRNAが減少することを示し、本明細書に記載の成分を使用した塩基編集は、HBV複製を阻害し、cccDNA活性を破壊したことを示した。(図20)。特に、塩基編集体BE4_noUGI+gRNAは、塩基編集体BE4_UGI及びエンテカビルと比較してすべてのHBVマーカーの大幅な低下を示した。(図20)。
実施例11:塩基編集は、既知のHBV抗ウイルス薬(エンテカビル)と比較して、HBVを阻害し、HBVウイルスパラメータを減少させるのに効果的である
HBV感染PHH培養物における異なるgRNAの組み合わせ(多重化gRNA)が、HBV阻害の改善につながるかどうかを評価するために、単一のgRNAをHBV cccDNAの異なる領域を標的とする最大4つのgRNAの組み合わせと比較する包括的な実験を実施した。実験は、BE4とBE4_noUGIの両方の塩基編集体に対して実施し、実験の終了時に4つのウイルスパラメータ(HBsAg、HBeAg、HBV全DNA、pgRNA)について結果を評価した。以前の結果と一致して、個々のgRNA及びBE4によるPHHのトランスフェクションは、特定のウイルスパラメータの小さいが有意な減少をもたらし;阻害のレベルはgRNAに依存していた。評価したすべてのパラメータについて、BE+gRNA19は、試験した他のgRNAよりもわずかに優れたパフォーマンスを示した。HBV阻害のわずかな改善が、gRNA多重化(gRNA19+gRNA190)及びBEを使用して検出され、BEと4つのgRNA (190+12+40+52)の組み合わせが、HBVの阻害において比較的最良に機能した(図21、22、23及び24)。
表26は、本明細書に記載の実験で使用するgRNA及び対応するポリヌクレオチド配列を示す(例えば、図21~27)。表26では、a、c、g、u:2’-O-メチル残基;s:ホスホロチオエート;A、C、G、U:RNA核酸塩基残基である。
Figure 2022532139000192
Figure 2022532139000193
図22は、HBV感染PHHから精製された全DNA、及びExoI/ExoIII消化によってcccDNAを濃縮させた同試料に対して実施した次世代シーケンシング(NGS)の結果を示している。図22は、異なる条件(個々のgRNAまたはgRNAの組み合わせのいずれか)を用いて、特定のHBV標的部位でBE4を使用した塩基編集の結果を示している。HBV cccDNAを濃縮させた試料では、塩基編集の大幅な増加(編集(%)の増加)が観察され、これは、cccDNA編集が成功したことを示していた。HBV-PHHから精製された全DNA (ゲノム及びウイルスDNA)の編集(%)が低いという発見は、編集されたcccDNAが複製能力のあるウイルス粒子に増殖できないことを示している。
塩基編集体BE4_noUGI及び異なるgRNAによるトランスフェクションは、BE4 (すなわち、BE4-UGI)と比較して4つのウイルスパラメータのより大きな阻害をもたらしたが、この結果は以前の実験と一致していた。(図23)。gRNA19は、実験で試験した4つのgRNA (gRNA12、gRNA19、gRNA191、及びgRNA40)と比較して、HBVの阻害に最も効果的であることがわかった。BE4_noUGI及びgRNA19によるトランスフェクションは、強力な抗ウイルス応答をもたらし、試験したすべてのウイルスパラメータ(HBsAg、HBeAg、pgRNA、及びHBV全DNA)の低下をもたらした。BE4_noUGIとgRNAの多重化を使用しても、抗ウイルス効果の向上は検出されなかった。BE4_noUGIとgRNA19によるトランスフェクションは、gRNAの組み合わせでBE4_noUGIを使用した場合と比較して、ウイルスパラメータの同レベルの低下をもたらした。(図23)。
HBV感染PHHから精製された全DNA、及びExoI/ExoIII消化によってcccDNAを濃縮させた同試料に対して、NGS配列決定も実施した。図24は、異なる条件(個別またはgRNAの組み合わせ)の特定のHBV標的部位でのBE4_noUGIを使用した塩基編集を示している。HBV cccDNAを濃縮させた試料では、塩基編集の大幅な増加(編集(%)の増加)が観察され、これは、cccDNA編集が成功したことを示していた。HBV-PHHから精製された全DNA (ゲノム及びウイルスDNA)の編集(%)が低いという発見は、編集されたcccDNAが複製能力のあるウイルス粒子に増殖できないことを示している。(図24)。
実施例12:ニッカーゼ活性を有さない塩基編集体は、感染のHBVパラメータを低下させるのに効果的である
塩基編集体BE4_noUGIは、標的DNA部位で二本鎖切断(dsbreak)を引き起こし得るニッカーゼ活性を有する(Komor AC et al., 2016)。cccDNAの二本鎖切断はさらに、HBV DNAのヒトゲノムへの組み込みをもたらし得るが、これは避けるべきである。塩基編集プロセス中にdsbreakが生成される可能性を最小限に抑えるために、変異型BE4_noUGI (H840A)、すなわちニッカーゼ活性を有さず、デアミナーゼ活性のみを有するdBE4_noUGIを生成して評価した。dBE4_noUGIの塩基編集活性を、長期(25日間)実験でHBVに感染させたPHHを使用して、gRNA12 (Pol/S)と組み合わせて評価した。塩基編集体のみ(gRNAなし)のトランスフェクションは、評価したウイルスパラメータの有意な低下をもたらさなかったが、dBE4_noUGI及びgRNA12のトランスフェクションは、ウイルスパラメータHBsAg、HBV DNA、及びHBeAgのレベルを測定することによって決定されるように、ロバストなHBV阻害をもたらした。(図25A~25C)。
さらに、HBVの治療に使用することが知られているインターフェロンの抗ウイルス活性を、HBVに感染したPHHを使用した長期実験において、HBVの阻害における塩基編集体dBE4_noUGI及びgRNAの塩基編集活性と比較した。インターフェロンは一部の患者のHBVを効果的に治療することができるが、この薬剤は毒性があることも知られており、多くの有害な副作用を引き起こし得る。実験の結果は、dBE4_noUGI+gRNA12を使用したインターフェロンと塩基の編集の両方が、HBVウイルスパラメータを同等のレベルに低下させたことを示した。(図25A~25C)。細胞生存率及び代謝活性は、実験の最後に細胞培地に分泌されたアルブミンのレベルを試験することによっても評価した。インターフェロン治療は、分泌されたアルブミンの有意な減少をもたらしたが、これは、インターフェロン治療の毒性を示している。インターフェロン治療とは対照的に、dBE4_noUGI及びgRNA (例えば、gRNA12)による塩基編集は、分泌されたアルブミンレベルの減少を最小限に抑えたが、したがって、塩基編集アプローチの使用に関連する毒性がないことを示している。(図25D)。
実施例13:塩基編集は、HBVに感染したPHHにおける遺伝子型D及びCのHBVのウイルスパラメータを低下させる(長期実験)
塩基編集アプローチが異なる遺伝子型のHBVに対して同様の抗ウイルス効果をもたらすかどうかを判定するために実験を行った。したがって、PHHを遺伝子型D (Gen.D)のHBVまたは遺伝子型C (Gen.C)のHBVのいずれかで感染させた並行実験において、HBVに感染させたPHHの共培養物中で、dBE4_noUGIとgRNA12 (HBVポリメラーゼとS遺伝子(P/S)の交差点を標的とする)を評価した。遺伝子型CのHBVによるPHHの感染(処理条件なし)は、実験の終了時に高いウイルス量をもたらした。実験で評価したウイルスパラメータのレベルが高いにもかかわらず、塩基編集体dBE4_no UGI及びgRNA12によるトランスフェクションは、対照と比較してHBV Gen.D及びHBV Gen.Cの両方のロバストなHBV阻害を示した。(図26A~26C)。この結果は、異なる遺伝子型のHBVによって引き起こされる感染症の治療のための本明細書に記載の塩基編集及び塩基編集系の使用を支持するものである。
実施例14:HBVポリメラーゼ活性部位を標的とするABE7.10及びHBV特異的gRNAでのトランスフェクションは、HBV感染PHHにおけるHBVマーカーを低下させる
アデニン塩基編集体(ABE)は、最小限のオフターゲット効果を示す一方で、ロバストな塩基編集活性を有する。(Gaudelli, N.M., et al., ”Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551,464-471 (2017)。内在性シチジンデアミナーゼは、cccDNAを脱アミノ化することが報告されているが、アデニンデアミナーゼについてはそのような機構や活性は示されていない。ABEによるHBV編集がHBV感染初代肝細胞におけるウイルス複製の阻害をもたらすかどうかを判定するために、本明細書に記載のアデニンデアミナーゼ含有塩基編集体ABE7.10を、HBV感染したPHH共培養系の使用を含む実験においてgRNAと組み合わせて評価した。したがって、HBVに感染したPHH培養物を、上記の実施例10及び図19に記載のように、HBVポリメラーゼ活性部位にサイレント変異を導入するように設計されたABE7.10 mRNA及びgRNA94でトランスフェクトした。実験結果の分析により、ウイルスパラメータの低下を引き起こさなかった単独使用のABE7.10 mRNAと比較して、ウイルスパラメータHBsAg、HBeAg、pgRNA、及びHBV全DNAのロバストな低下が、塩基編集体ABE7.10 mRNAとgRNA94 (HBVポリメラーゼ活性部位を標的とする)を組み合わせて使用することにより検出されたことが示された(図27A)。HBV感染PHHから精製された全DNA、及びExoI/ExoIII消化によってcccDNAを濃縮させた同試料に対して、次世代シーケンシング(NGS)を実施した。cccDNAを濃縮させた試料において、ABE7.10 mRNA及びgRNA94によるおよそ50%の塩基編集が検出されたが、これは、cccDNA編集が成功したことを示していた。HBV-PHHから精製した全DNAにおいて塩基編集が欠如していることは、編集されたcccDNAが複製能力のあるウイルス粒子に増殖できないことを示している。(図27B)。これらのデータを組み合わせることにより、ABEが、HBVウイルス量を低下させるための効率的な抗ウイルス試薬として機能することが示されている。
他の実施形態
前述の記載から、様々な使用法及び条件に用いるために、本明細書に記載の発明に変更及び修正を加え得ることは明らかであろう。そのような実施形態もまた、以下の特許請求の範囲内である。
本明細書中での変数の任意の定義における要素のリストの列挙には、記載する要素の任意の単一要素または組み合わせ(または部分組み合わせ)としてのその変数の定義が含まれる。本明細書における実施形態の列挙は、その実施形態を、任意の単一の実施形態として、または任意の他の実施形態もしくはその一部との組み合わせで含む。
本明細書中で言及されるすべての特許及び刊行物は、各個別の特許及び刊行物が、具体的かつ個々に参照により組み込まれることが示されているのと同程度に、参照により本明細書に援用される。

Claims (126)

  1. B型肝炎ウイルス(HBV)ゲノムの核酸塩基の編集方法であって、前記方法が、前記HBVゲノムを、1つ以上のガイドRNA、及びポリヌクレオチドプログラム可能なDNA結合ドメインとアデノシンデアミナーゼまたはシチジンデアミナーゼドメインとを含む塩基編集体と接触させることを含み、前記ガイドRNAが、前記塩基編集体を標的指向化して前記HBVゲノムの前記核酸塩基の改変をもたらす、前記編集方法。
  2. 前記核酸塩基が、HBVタンパク質をコードするポリヌクレオチド中にある、請求項1に記載の方法。
  3. 前記接触を、真核細胞、哺乳類細胞、またはヒト細胞において行う、請求項1または2に記載の方法。
  4. 前記細胞が、in vivoまたはex vivoである、請求項1~3のいずれか一項に記載の方法。
  5. 前記シチジンデアミナーゼが、前記HBVゲノム中の標的CをUに転換させる、請求項1~4のいずれか一項に記載の方法。
  6. 前記シチジンデアミナーゼが、前記HBVタンパク質をコードする前記ポリヌクレオチド内の標的C・GをT・Aに転換させる、請求項1~4のいずれか一項に記載の方法。
  7. 前記アデノシンデアミナーゼが、前記HBVタンパク質をコードする前記ポリヌクレオチド内の標的A・TをG・Cに転換させる、請求項1~4のいずれか一項に記載の方法。
  8. 前記HBVタンパク質をコードする前記ポリヌクレオチド中の前記核酸塩基の改変が、未成熟終止コドンを生じさせる、請求項2~7のいずれか一項に記載の方法。
  9. 前記核酸塩基の前記改変が、HBV Xタンパク質において、R87*またはW120*終結を生じさせる、請求項8に記載の方法。
  10. 前記核酸塩基の前記改変が、HBV Sタンパク質において、W35*またはW36*を生じさせる、請求項8に記載の方法。
  11. 前記HBVポリヌクレオチドの前記改変がミスセンス変異である、請求項2~7のいずれか一項に記載の方法。
  12. 前記ミスセンス変異が、HBV pol遺伝子にある、請求項11に記載の方法。
  13. 前記ミスセンス変異が、前記HBV pol遺伝子によってコードされるHBVポリメラーゼタンパク質中のE24G、L25F、P26F、R27C、V48A、V48I、S382F、V378I、V378A、V379I、V379A、L377F、D380G、D380N、F381P、R376G、A422T、F423P、A432V、M433V、P434S、D540G、A688V、D689G、A717T、E718K、P713S、P713L、またはL719Pを生じさせる、請求項12に記載の方法。
  14. 前記ミスセンス変異が、HBVコア遺伝子にある、請求項11に記載の方法。
  15. 前記ミスセンス変異が、前記HBVコア遺伝子によってコードされるHBVコアタンパク質において、T160A、T160A、P161F、S162L、C183R、または*184Qを生じさせる、請求項14に記載の方法。
  16. 前記ミスセンス変異が、HBV X遺伝子にある、請求項11に記載の方法。
  17. 前記ミスセンス変異が、前記HBV X遺伝子によってコードされるHBV Xタンパク質において、H86R、W120R、E122K、E121K、またはL141Pを生じさせる、請求項16に記載の方法。
  18. 前記ミスセンス変異が、HBV S遺伝子にある、請求項11に記載の方法。
  19. 前記ミスセンス変異が、前記HBV S遺伝子によってコードされるHBV Sタンパク質において、S38F、L39F、W35R、W36R、T37I、T37A、R78Q、S34L、F80P、またはD33Gを生じさせる、請求項18に記載の方法。
  20. 前記ポリヌクレオチドプログラム可能なDNA結合ドメインが、Streptococcus pyogenes Cas9 (SpCas9)、Staphylococcus aureus Cas9 (SaCas9)、Streptococcus thermophilus 1 Cas9 (St1Cas9)、Steptococcus canis Cas9 (ScCas9)、またはそのバリアントから選択されるCas9である、請求項1~19のいずれか一項に記載の方法。
  21. 前記Cas9が、5’-NGG-3’、5’-NAG-3’、5’-NGA-3’、5’-NAA-3’、5’-NNAGGA-3’、または5’-NNACCA-3’から選択される核酸配列に対するプロトスペーサー隣接モチーフ(PAM)特異性を有する、請求項18に記載の方法。
  22. 前記ポリヌクレオチドプログラム可能なDNA結合ドメインが、改変されたプロトスペーサー隣接モチーフ(PAM)特異性を有する改変されたCas9を含む、請求項1~20のいずれか一項に記載の方法。
  23. 前記改変されたPAMの核酸配列が、5’-NNNRRT-3’、NGA-3’、5’-NGCG-3’、5’-NGN-3’、NGCN-3’、5’-NGTN-3’、または5’-NAA-3’から選択される、請求項19に記載の方法。
  24. 前記ポリヌクレオチドプログラム可能なDNA結合ドメインが、ヌクレアーゼ不活性バリアントまたはニッカーゼバリアントである、請求項1~23のいずれか一項に記載の方法。
  25. 前記ヌクレアーゼ不活性バリアントまたはニッカーゼバリアントが、アミノ酸置換D10Aまたはそれに対応するアミノ酸置換を含むヌクレアーゼ不活性化Cas9(dCas9)である、請求項24に記載の方法。
  26. 前記アデノシンデアミナーゼドメインが、デオキシリボ核酸(DNA)中のアデニンを脱アミノ化することができる、請求項1~25のいずれか一項に記載の方法。
  27. 前記アデノシンデアミナーゼが、TadAデアミナーゼである、請求項1~26のいずれか一項に記載の方法。
  28. 前記TadAデアミナーゼが、TadA*7.10、TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23、またはTadA*8.24である、請求項27に記載の方法。
  29. 前記シチジンデアミナーゼドメインが、DNA中のシチジンを脱アミノ化することができる、請求項1~25のいずれか一項に記載の方法。
  30. 前記シチジンデアミナーゼが、APOBECまたはその誘導体である、請求項29に記載の方法。
  31. 前記塩基編集体が、1つ以上のウラシルグリコシラーゼ阻害因子(UGI)をさらに含む、請求項1~30のいずれか一項に記載の方法。
  32. 前記1つ以上のガイドRNAが、CRISPR RNA(crRNA)及びトランスコードされた低分子RNA(tracrRNA)を含み、前記crRNAが、HBV核酸配列に相補的な核酸配列を含む、請求項1~31のいずれか一項に記載の方法。
  33. 前記塩基編集体が、HBV核酸配列に相補的な核酸配列を含む単一のガイドRNA(sgRNA)と複合体を形成している、請求項1~32のいずれか一項に記載の方法。
  34. 前記HBVタンパク質が、S、pol、コアまたはXタンパク質である、請求項2~33のいずれか一項に記載の方法。
  35. 1つ以上の核酸塩基を編集することを含む、請求項1~34のいずれか一項に記載の方法。
  36. 2つ以上のHBV核酸配列を標的とする2つ以上のガイドRNAを含む、請求項1~35のいずれか一項に記載の方法。
  37. 前記ガイドRNAが、5’から3’にかけて、
    UCAAUCCCAACAAGGACACC;GGGAACAAGAUCUACAGCAU;
    AAGCCCAGGAUGAUGGGAUG;CUGCCAACUGGAUCCUGCGC;
    GACACAUCCAGCGAUAACCA;GCUGCCAACUGGAUCCUGCG;
    UAUGGAUGAUGUGGUAUUGG;CCAUGCCCCAAAGCCACCCA;
    AAGCCACCCAAGGCACAGCU;GAGAAGUCCACCACGAGUCU;
    CUUCUCUCAAUUUUCUAGGG;GACGACGAGGCAGGUCCCCU;
    CCCAACAAGGACACCUGGCC;UGCCAACUGGAUCCUGCGCG;
    AGGAGUUCCGCAGUAUGGAU;CCGCAGUAUGGAUCGGCAGA;
    CCUCUGCCGAUCCAUACUGC;CGCCCACCGAAUGUUGCCCA;
    GACUUCUCUCAAUUUUCUAG;GUUCCGCAGUAUGGAUCGGC;
    UACUAACAUUGAGGUUCCCG;UCCGCAGUAUGGAUCGGCAG;
    UCCUCUGCCGAUCCAUACUG;GUAGCUCCAAAUUCUUUAUA;もしくはAAUCCACACUCCGAAAGACAの1つ以上から選択される配列またはその1、2、3、4、もしくは5ヌクレオチドの5’短縮断片を含む、請求項1~36のいずれか一項に記載の方法。
  38. 対象におけるB型肝炎ウイルス(HBV)感染症の治療方法であって、前記方法が、それを必要とする対象に、ポリヌクレオチドプログラム可能なDNA結合ドメインとアデノシンデアミナーゼまたはシチジンデアミナーゼドメインである塩基編集体ドメインとを含む融合タンパク質または前記融合タンパク質をコードするポリヌクレオチド、ならびに、前記塩基編集体ドメインを標的指向化して、HBVポリペプチドをコードする核酸配列のA・TからG・C、C・GからT・A、またはC・GからU・Aへの改変をもたらす1つ以上のガイドポリヌクレオチドを投与することを含む、前記治療方法。
  39. 対象におけるB型肝炎ウイルス(HBV)感染症の治療方法であって、前記方法が、それを必要とする対象に、ポリヌクレオチドプログラム可能なDNA結合ドメインとアデノシンデアミナーゼまたはシチジンデアミナーゼドメインである塩基編集体ドメインとをコードする1つ以上のポリヌクレオチド、ならびに、前記塩基編集体ドメインを標的指向化して、HBVポリペプチドをコードする前記核酸配列のA・TからG・C、C・GからT・A、またはC・GからU・Aへの改変をもたらす1つ以上のガイドポリヌクレオチドを投与することを含む、前記治療方法。
  40. 前記対象が、哺乳類またはヒトである、請求項38または39に記載の方法。
  41. 前記融合タンパク質、前記融合タンパク質をコードするポリヌクレオチド、またはポリヌクレオチドプログラム可能なDNA結合ドメインと前記塩基編集体ドメインとをコードする前記1つ以上のポリヌクレオチド、ならびに前記1つ以上のガイドポリヌクレオチドを、前記対象の細胞に送達することを含む、請求項38~40のいずれか一項に記載の方法。
  42. 前記細胞が肝細胞である、請求項38~41のいずれか一項に記載の方法。
  43. 前記ポリヌクレオチドプログラム可能なDNA結合ドメインが、Streptococcus pyogenes Cas9 (SpCas9)、Staphylococcus aureus Cas9 (SaCas9)、Streptococcus thermophilus 1 Cas9 (St1Cas9)、Steptococcus canis Cas9 (ScCas9)、またはそのバリアントから選択されるCas9である、請求項38~42のいずれか一項に記載の方法。
  44. 前記Cas9が、5’-NGG-3’、5’-NAG-3’、5’-NGA-3’、5’-NAA-3’、5’-NNAGGA-3’、または5’-NNACCA-3’から選択される核酸配列に対するプロトスペーサー隣接モチーフ(PAM)特異性を有する、請求項43に記載の方法。
  45. 前記ポリヌクレオチドプログラム可能なDNA結合ドメインが、改変されたプロトスペーサー隣接モチーフ(PAM)特異性を有する改変されたCas9を含む、請求項38~44のいずれか一項に記載の方法。
  46. 前記改変されたPAMの核酸配列が、5’-NNNRRT-3’、NGA-3’、5’-NGCG-3’、5’-NGN-3’、NGCN-3’、5’-NGTN-3’、または5’-NAA-3’から選択される、請求項45に記載の方法。
  47. 前記ポリヌクレオチドプログラム可能なDNA結合ドメインが、ヌクレアーゼ不活性バリアントまたはニッカーゼバリアントである、請求項38~46のいずれか一項に記載の方法。
  48. 前記ヌクレアーゼ不活性バリアントまたはニッカーゼバリアントが、アミノ酸置換D10Aまたはそれに対応するアミノ酸置換を含むヌクレアーゼ不活性化Cas9(dCas9)である、請求項47に記載の方法。
  49. 前記アデノシンデアミナーゼドメインが、デオキシリボ核酸(DNA)中のアデニンを脱アミノ化することができる、請求項38~48のいずれか一項に記載の方法。
  50. 前記アデノシンデアミナーゼが、TadAデアミナーゼである、請求項49に記載の方法。
  51. 前記TadAデアミナーゼが、TadA*7.10、TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23、またはTadA*8.24である、請求項50に記載の方法。
  52. 前記シチジンデアミナーゼドメインが、DNA中のシチジンを脱アミノ化することができる、請求項38~48のいずれか一項に記載の方法。
  53. 前記シチジンデアミナーゼが、APOBECまたはその誘導体である、請求項52に記載の方法。
  54. 前記塩基編集体が、1つ以上のウラシルグリコシラーゼ阻害因子(UGI)をさらに含む、請求項52~54のいずれか一項に記載の方法。
  55. 前記塩基編集体が、ウラシルグリコシラーゼ阻害因子(UGI)を含まない、請求項52~54のいずれか一項に記載の方法。
  56. 前記1つ以上のガイドRNAが、CRISPR RNA(crRNA)及びトランスコードされた低分子RNA(tracrRNA)を含み、前記crRNAが、HBV核酸配列に相補的な核酸配列を含む、請求項38~55のいずれか一項に記載の方法。
  57. 前記塩基編集体が、HBV核酸配列に相補的な核酸配列を含む単一のガイドRNA(sgRNA)と複合体を形成している、請求項38~56のいずれか一項に記載の方法。
  58. 前記sgRNAが、前記HBV核酸配列に相補的な少なくとも10個の連続ヌクレオチドを含む核酸配列を含む、請求項57に記載の方法。
  59. 前記sgRNAが、前記HBV核酸配列に相補的な15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、または40個の連続ヌクレオチドを含む核酸配列を含む、請求項58に記載の方法。
  60. 1つ以上の核酸塩基を編集することを含む、請求項38~59のいずれか一項に記載の方法。
  61. 2つ以上のHBV核酸配列を標的とする2つ以上のガイドRNAを含む、請求項38~60のいずれか一項に記載の方法。
  62. 3、4、または5つのHBV核酸配列を標的とする2つ以上のガイドRNAを含む、請求項61に記載の方法。
  63. 前記HBV核酸配列が、HBVポリメラーゼ、HBVコアタンパク質、HBV Sタンパク質、HBV Xタンパク質、またはそれらの組み合わせから選択される1つ以上のHBVタンパク質をコードする、請求項61または請求項62に記載の方法。
  64. 前記1つ以上のガイドRNAが、5’から3’にかけて、
    UCAAUCCCAACAAGGACACC;GGGAACAAGAUCUACAGCAU;
    AAGCCCAGGAUGAUGGGAUG;CUGCCAACUGGAUCCUGCGC;
    GACACAUCCAGCGAUAACCA;GCUGCCAACUGGAUCCUGCG;
    UAUGGAUGAUGUGGUAUUGG;CCAUGCCCCAAAGCCACCCA;
    AAGCCACCCAAGGCACAGCU;GAGAAGUCCACCACGAGUCU;
    CUUCUCUCAAUUUUCUAGGG;GACGACGAGGCAGGUCCCCU;
    CCCAACAAGGACACCUGGCC;UGCCAACUGGAUCCUGCGCG;
    AGGAGUUCCGCAGUAUGGAU;CCGCAGUAUGGAUCGGCAGA;
    CCUCUGCCGAUCCAUACUGC;CGCCCACCGAAUGUUGCCCA;
    GACUUCUCUCAAUUUUCUAG;GUUCCGCAGUAUGGAUCGGC;
    UACUAACAUUGAGGUUCCCG;UCCGCAGUAUGGAUCGGCAG;
    UCCUCUGCCGAUCCAUACUG;GUAGCUCCAAAUUCUUUAUA;もしくは
    AAUCCACACUCCGAAAGACAの1つ以上から選択される配列、またはその1、2、3、4、もしくは5ヌクレオチドの5’短縮断片を含む、請求項38~63のいずれか一項に記載の方法。
  65. 前記HBVタンパク質をコードする前記ポリヌクレオチドの改変が、未成熟終止コドンである、請求項38~64のいずれか一項に記載の方法。
  66. 前記核酸配列の改変が、前記核酸にコードされるHBV Xタンパク質において、R87*またはW120*を生じさせる、請求項38~65のいずれか一項に記載の方法。
  67. 前記核酸配列の改変が、前記核酸にコードされるHBV Sタンパク質において、W35*またはW36*を生じさせる、請求項66に記載の方法。
  68. 前記HBVをコードする前記ポリヌクレオチドの前記改変がミスセンス変異である、請求項38~64の請求項に記載の方法。
  69. 前記ミスセンス変異が、HBV pol遺伝子にある、請求項68に記載の方法。
  70. 前記HBV pol遺伝子内の前記ミスセンス変異が、前記HBV pol遺伝子によってコードされるHBVポリメラーゼ中にE24G、L25F、P26F、R27C、V48A、V48I、S382F、V378I、V378A、V379I、V379A、L377F、D380G、D380N、F381P、R376G、A422T、F423P、A432V、M433V、P434S、D540G、A688V、D689G、A717T、E718K、P713S、P713L、またはL719Pを生じさせる、請求項69に記載の方法。
  71. 前記ミスセンス変異が、HBVコア遺伝子にある、請求項68に記載の方法。
  72. 前記HBVコア遺伝子内の前記ミスセンス変異が、前記HBVコア遺伝子によってコードされるHBVコアタンパク質において、T160A、T160A、P161F、S162L、C183R、または*184Qを生じさせる、請求項71に記載の方法。
  73. 前記ミスセンス変異が、HBV X遺伝子にある、請求項68に記載の方法。
  74. 前記HBV X遺伝子内の前記ミスセンス変異が、前記HBV X遺伝子によってコードされるHBV Xタンパク質において、H86R、W120R、E122K、E121K、またはL141Pを生じさせる、請求項73に記載の方法。
  75. 前記ミスセンス変異が、HBV S遺伝子にある、請求項68に記載の方法。
  76. 前記HBV S遺伝子内の前記ミスセンス変異が、前記HBV S遺伝子によってコードされるHBV Sタンパク質において、S38F、L39F、W35R、W36R、T37I、T37A、R78Q、S34L、F80P、またはD33Gを生じさせる、請求項75に記載の方法。
  77. 前記塩基編集体が、BE4またはBE4のバリアントであり、APOBEC-1がAPOBEC-3Aの配列で置き換えられており、及び/またはCas9が、V1134、R1217、Q1334、及びR1336を含むCas9バリアント(SpCas9-VRQRと呼ばれる)で置き換えられている、請求項1~76のいずれか一項に記載の方法。
  78. ガイドRNAに結合した塩基編集体を含む組成物であって、前記ガイドRNAが、HBV遺伝子に相補的な核酸配列を含む、前記組成物。
  79. 前記塩基編集体が、アデノシンデアミナーゼまたはシチジンデアミナーゼを含む、請求項78に記載の組成物。
  80. 前記アデノシンデアミナーゼドメインが、デオキシリボ核酸(DNA)中のアデニンを脱アミノ化することができる、請求項79に記載の組成物。
  81. 前記アデノシンデアミナーゼが、TadAデアミナーゼである、請求項80に記載の組成物。
  82. 前記TadAデアミナーゼが、TadA*7.10、TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23、またはTadA*8.24である、請求項81に記載の組成物。
  83. 前記シチジンデアミナーゼドメインが、DNA中のシチジンを脱アミノ化することができる、請求項79に記載の組成物。
  84. 前記シチジンデアミナーゼが、APOBECまたはその誘導体である、請求項83に記載の組成物。
  85. 前記塩基編集体が、1つ以上のウラシルグリコシラーゼ阻害因子(UGI)をさらに含む、請求項83または請求項84に記載の組成物。
  86. 前記塩基編集体が、ウラシルグリコシラーゼ阻害因子(UGI)を含まない、請求項83または請求項84に記載の組成物。
  87. 前記塩基編集体が、
    (i) Cas9ニッカーゼを含むか;
    (ii) ヌクレアーゼ不活性Cas9を含むか;
    (iii) UGIドメインを含まないか;
    (iv) APOBEC-1もしくはAPOBEC-3Aシチジンデアミナーゼを含むか;
    (v)
    MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLKSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSGGSKRTADGSEFESPKKKRKVEに対して少なくとも80%、85%、90%、95%、96%、97%、98%、99%、もしくは100%の同一性であるアミノ酸配列を含むか;または
    (vi)
    MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLKSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSGGSKRTADGSEFESPKKKRKVEに対して少なくとも80%、85%、90%、95%、96%、97%、98%、99%、もしくは100%の同一性であるアミノ酸配列を含む、
    請求項78~86のいずれか一項に記載の組成物。
  88. 前記ガイドRNAが、HBVポリメラーゼ、HBVコアタンパク質、HBV Sタンパク質、またはHBV Xタンパク質をコードするHBV遺伝子に相補的な核酸配列を含む、請求項78~87のいずれか一項に記載の組成物。
  89. 前記ガイドRNAが、HBV Xタンパク質をコードするHBV遺伝子に完全に相補的である15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30個の連続ヌクレオチドを含む、請求項78~88のいずれか一項に記載の組成物。
  90. 前記ガイドRNAが、HBV Sタンパク質をコードするHBV遺伝子に完全に相補的である15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30個の連続ヌクレオチドを含む、請求項78~88のいずれか一項に記載の組成物。
  91. 前記ガイドRNAが、HBVポリメラーゼをコードするHBV遺伝子に完全に相補的である15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30個の連続ヌクレオチドを含む、請求項78~8888のいずれか一項に記載の組成物。
  92. 前記ガイドRNAが、HBVコアタンパク質をコードするHBV遺伝子に完全に相補的である15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30個の連続ヌクレオチドを含む、請求項78~88のいずれか一項に記載の組成物。
  93. 前記ガイドRNAが、5’から3’にかけて、
    UCAAUCCCAACAAGGACACC;GGGAACAAGAUCUACAGCAU;
    AAGCCCAGGAUGAUGGGAUG;CUGCCAACUGGAUCCUGCGC;
    GACACAUCCAGCGAUAACCA;GCUGCCAACUGGAUCCUGCG;
    UAUGGAUGAUGUGGUAUUGG;CCAUGCCCCAAAGCCACCCA;
    AAGCCACCCAAGGCACAGCU;GAGAAGUCCACCACGAGUCU;
    CUUCUCUCAAUUUUCUAGGG;GACGACGAGGCAGGUCCCCU;
    CCCAACAAGGACACCUGGCC;UGCCAACUGGAUCCUGCGCG;
    AGGAGUUCCGCAGUAUGGAU;CCGCAGUAUGGAUCGGCAGA;
    CCUCUGCCGAUCCAUACUGC;CGCCCACCGAAUGUUGCCCA;
    GACUUCUCUCAAUUUUCUAG;GUUCCGCAGUAUGGAUCGGC;
    UACUAACAUUGAGGUUCCCG;UCCGCAGUAUGGAUCGGCAG;
    UCCUCUGCCGAUCCAUACUG;GUAGCUCCAAAUUCUUUAUA、及び
    AAUCCACACUCCGAAAGACAからなる群から選択される核酸の5’末端からの1、2、3、4、または5個の核酸のトランケーションを含む、請求項78~92のいずれか一項に記載の組成物。
  94. 前記ガイドRNAが、5’から3’にかけて、
    UCAAUCCCAACAAGGACACC;GGGAACAAGAUCUACAGCAU;
    AAGCCCAGGAUGAUGGGAUG;CUGCCAACUGGAUCCUGCGC;
    GACACAUCCAGCGAUAACCA;GCUGCCAACUGGAUCCUGCG;
    UAUGGAUGAUGUGGUAUUGG;CCAUGCCCCAAAGCCACCCA;
    AAGCCACCCAAGGCACAGCU;GAGAAGUCCACCACGAGUCU;
    CUUCUCUCAAUUUUCUAGGG;GACGACGAGGCAGGUCCCCU;
    CCCAACAAGGACACCUGGCC;UGCCAACUGGAUCCUGCGCG;
    AGGAGUUCCGCAGUAUGGAU;CCGCAGUAUGGAUCGGCAGA;
    CCUCUGCCGAUCCAUACUGC;CGCCCACCGAAUGUUGCCCA;
    GACUUCUCUCAAUUUUCUAG;GUUCCGCAGUAUGGAUCGGC;
    UACUAACAUUGAGGUUCCCG;UCCGCAGUAUGGAUCGGCAG;
    UCCUCUGCCGAUCCAUACUG;GUAGCUCCAAAUUCUUUAUA、及び
    AAUCCACACUCCGAAAGACAからなる群から選択される核酸を含む、請求項78~92のいずれか一項に記載の組成物。
  95. 脂質をさらに含み、任意選択で前記脂質がカチオン性脂質である、請求項78~94のいずれか一項に記載の組成物。
  96. 薬学的に許容される賦形剤をさらに含む、請求項78~95のいずれか一項に記載の組成物。
  97. HBV感染症の治療のための医薬組成物であって、
    (i) 薬学的に許容される賦形剤中に、塩基編集体、または前記塩基編集体をコードする核酸、ならびにHBV遺伝子に相補的な核酸配列を含む1つ以上のガイドRNA(gRNA)を含む、前記医薬組成物。
  98. 前記塩基編集体が、
    (i) Cas9ニッカーゼを含むか;
    (ii) ヌクレアーゼ不活性Cas9を含むか;
    (iii) UGIドメインを含まないか;
    (iv) APOBEC-1もしくはAPOBEC-3Aシチジンデアミナーゼを含むか;
    (v)
    MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLKSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSGGSKRTADGSEFESPKKKRKVEに対して少なくとも80%、85%、90%、95%、96%、97%、98%、99%、もしくは100%の同一性であるアミノ酸配列を含むか;または
    (vi)
    MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLKSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSGGSKRTADGSEFESPKKKRKVEに対して少なくとも80%、85%、90%、95%、96%、97%、98%、99%、もしくは100%の同一性であるアミノ酸配列を含む、
    請求項97に記載の医薬組成物。
  99. 前記塩基編集体が、Cas9、またはV1134、R1217、Q1334、及びR1336を含むCas9バリアント(SpCas9-VRQR)を含む、請求項97または請求項98に記載の医薬組成物。
  100. 前記gRNA及び前記塩基編集体を一緒にまたは別々に製剤化する、請求項97~99のいずれか一項に記載の医薬組成物。
  101. 前記gRNAが、5’から3’にかけて、
    UCAAUCCCAACAAGGACACC;GGGAACAAGAUCUACAGCAU
    AAGCCCAGGAUGAUGGGAUG;CUGCCAACUGGAUCCUGCGC
    GACACAUCCAGCGAUAACCA;GCUGCCAACUGGAUCCUGCG
    UAUGGAUGAUGUGGUAUUGG;CCAUGCCCCAAAGCCACCCA
    AAGCCACCCAAGGCACAGCU;GAGAAGUCCACCACGAGUCU
    CUUCUCUCAAUUUUCUAGGG;GACGACGAGGCAGGUCCCCU
    CCCAACAAGGACACCUGGCC;UGCCAACUGGAUCCUGCGCG
    AGGAGUUCCGCAGUAUGGAU;CCGCAGUAUGGAUCGGCAGA
    CCUCUGCCGAUCCAUACUGC;CGCCCACCGAAUGUUGCCCA
    GACUUCUCUCAAUUUUCUAG;GUUCCGCAGUAUGGAUCGGC
    UACUAACAUUGAGGUUCCCG;UCCGCAGUAUGGAUCGGCAG
    UCCUCUGCCGAUCCAUACUG;GUAGCUCCAAAUUCUUUAUA;もしくはAAUCCACACUCCGAAAGACAの1つ以上から選択される核酸配列、またはその1、2、3、4、もしくは5ヌクレオチドの5’短縮断片を含む、請求項97~100のいずれか一項に記載の医薬組成物。
  102. 哺乳類細胞での発現に適したベクターをさらに含み、前記ベクターが、前記塩基編集体をコードするポリヌクレオチドを含む、請求項97~101のいずれか一項に記載の医薬組成物。
  103. 前記ベクターがウイルスベクターである、請求項102に記載の医薬組成物。
  104. 前記ウイルスベクターが、レトロウイルスベクター、アデノウイルスベクター、レンチウイルスベクター、ヘルペスウイルスベクター、またはアデノ随伴ウイルスベクター(AAV)である、請求項103に記載の医薬組成物。
  105. 哺乳類細胞での発現に適したリボ核粒子をさらに含む、請求項97~101のいずれか一項に記載の医薬組成物。
  106. HBV感染症の治療方法であって、それを必要とする対象に請求項96に記載の組成物を投与することを含む、前記治療方法。
  107. HBV感染症の治療方法であって、それを必要とする対象に請求項97~105のいずれか一項に記載の医薬組成物を投与することを含む、前記治療方法。
  108. X遺伝子にR87STOPまたはW120STOPを導入する未成熟終止コドン;
    S遺伝子にW35STOPまたはW36STOPを導入する未成熟終止コドン;
    HBVポリメラーゼに、E24G、L25F、P26F、R27C、V48A、V48I、S382F、V378I、V378A、V379I、V379A、L377F、D380G、D380N、F381P、R376G、A422T、F423P、A432V、M433V、P434S、D540G、A688V、D689G、A717T、E718K、P713S、P713L、またはL719Pを導入するHBV pol遺伝子内のミスセンス変異;
    HBVコアポリペプチドに、T160A、T160A、P161F、S162L、C183R、またはSTOP184Qを導入するHBVコア遺伝子内のミスセンス変異;
    HBV Xポリペプチドに、H86R、W120R、E122K、E121K、またはL141Pを導入するX遺伝子内のミスセンス変異;及び
    HBV Sポリペプチドに、S38F、L39F、W35R、W36R、T37I、T37A、R78Q、S34L、F80P、またはD33Gを導入するS遺伝子内のミスセンス変異
    からなる群から選択される改変を含む、HBVゲノム。
  109. 前記ゲノムが、前記改変のうちの2つ以上を含む、請求項108に記載のHBVゲノム。
  110. 前記HBVが、遺伝子型Cまたは遺伝子型Dのものである、請求項1~77のいずれか一項に記載の方法、または請求項108もしくは請求項109に記載のHBVゲノム。
  111. 対象におけるHBV感染症の治療における請求項78~96のいずれか一項に記載の組成物の使用。
  112. 対象におけるHBV感染症の治療における請求項97~105のいずれか一項に記載の医薬組成物の使用。
  113. 前記対象が哺乳類である、請求項111または請求項112に記載の使用。
  114. 前記対象がヒトである、請求項111~113のいずれか一項に記載の使用。
  115. 前記1つ以上のガイドRNAが表26に記載されたものである、請求項1~77のいずれか一項に記載の方法、請求項97~100のいずれか一項に記載の医薬組成物。
  116. HBV遺伝子に相補的な核酸配列を含む、ガイドRNA。
  117. 前記ガイドRNAが、HBVポリメラーゼ、HBVコアタンパク質、HBV Sタンパク質、またはHBV Xタンパク質をコードするHBV遺伝子に相補的な核酸配列を含む、請求項116に記載のガイドRNA。
  118. HBV Xタンパク質をコードするHBV遺伝子に完全に相補的である15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30個の連続ヌクレオチドを含む、請求項116または117に記載のガイドRNA。
  119. HBV Sタンパク質をコードするHBV遺伝子に完全に相補的である15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30個の連続ヌクレオチドを含む、請求項116または117に記載のガイドRNA。
  120. HBVポリメラーゼをコードするHBV遺伝子に完全に相補的である15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30個の連続ヌクレオチドを含む、請求項116または117に記載のガイドRNA。
  121. HBVコアタンパク質をコードするHBV遺伝子に完全に相補的である15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30個の連続ヌクレオチドを含む、請求項116または117に記載のガイドRNA。
  122. 5’から3’にかけて、
    UCAAUCCCAACAAGGACACC;GGGAACAAGAUCUACAGCAU;
    AAGCCCAGGAUGAUGGGAUG;CUGCCAACUGGAUCCUGCGC;
    GACACAUCCAGCGAUAACCA;GCUGCCAACUGGAUCCUGCG;
    UAUGGAUGAUGUGGUAUUGG;CCAUGCCCCAAAGCCACCCA;
    AAGCCACCCAAGGCACAGCU;GAGAAGUCCACCACGAGUCU;
    CUUCUCUCAAUUUUCUAGGG;GACGACGAGGCAGGUCCCCU;
    CCCAACAAGGACACCUGGCC;UGCCAACUGGAUCCUGCGCG;
    AGGAGUUCCGCAGUAUGGAU;CCGCAGUAUGGAUCGGCAGA;
    CCUCUGCCGAUCCAUACUGC;CGCCCACCGAAUGUUGCCCA;
    GACUUCUCUCAAUUUUCUAG;GUUCCGCAGUAUGGAUCGGC;
    UACUAACAUUGAGGUUCCCG;UCCGCAGUAUGGAUCGGCAG;
    UCCUCUGCCGAUCCAUACUG;GUAGCUCCAAAUUCUUUAUA、及び
    AAUCCACACUCCGAAAGACAからなる群から選択される核酸の5’末端からの1、2、3、4、または5個の核酸のトランケーションを含む、請求項116または117に記載のガイドRNA。
  123. 5’から3’にかけて、
    UCAAUCCCAACAAGGACACC;GGGAACAAGAUCUACAGCAU;
    AAGCCCAGGAUGAUGGGAUG;CUGCCAACUGGAUCCUGCGC;
    GACACAUCCAGCGAUAACCA;GCUGCCAACUGGAUCCUGCG;
    UAUGGAUGAUGUGGUAUUGG;CCAUGCCCCAAAGCCACCCA;
    AAGCCACCCAAGGCACAGCU;GAGAAGUCCACCACGAGUCU;
    CUUCUCUCAAUUUUCUAGGG;GACGACGAGGCAGGUCCCCU;
    CCCAACAAGGACACCUGGCC;UGCCAACUGGAUCCUGCGCG;
    AGGAGUUCCGCAGUAUGGAU;CCGCAGUAUGGAUCGGCAGA;
    CCUCUGCCGAUCCAUACUGC;CGCCCACCGAAUGUUGCCCA;
    GACUUCUCUCAAUUUUCUAG;GUUCCGCAGUAUGGAUCGGC;
    UACUAACAUUGAGGUUCCCG;UCCGCAGUAUGGAUCGGCAG;
    UCCUCUGCCGAUCCAUACUG;GUAGCUCCAAAUUCUUUAUA、及び
    AAUCCACACUCCGAAAGACAからなる群から選択される核酸を含む、請求項116または117に記載のガイドRNA。
  124. (i) 塩基編集体をコードする核酸、及び(ii) 請求項116~123のいずれか一項に記載のガイドRNAを含む、医薬組成物。
  125. 脂質をさらに含む、請求項124に記載の医薬組成物。
  126. 前記塩基編集体をコードする前記核酸がmRNAである、請求項124または125に記載の医薬組成物。
JP2021566276A 2019-05-10 2020-05-08 B型肝炎を治療するための組成物及び方法 Pending JP2022532139A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962846422P 2019-05-10 2019-05-10
US62/846,422 2019-05-10
US201962927585P 2019-10-29 2019-10-29
US62/927,585 2019-10-29
PCT/US2020/032226 WO2020231863A1 (en) 2019-05-10 2020-05-08 Compositions and methods for treating hepatitis b

Publications (2)

Publication Number Publication Date
JP2022532139A true JP2022532139A (ja) 2022-07-13
JPWO2020231863A5 JPWO2020231863A5 (ja) 2023-05-16

Family

ID=73289231

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021566276A Pending JP2022532139A (ja) 2019-05-10 2020-05-08 B型肝炎を治療するための組成物及び方法

Country Status (8)

Country Link
US (1) US20230070861A1 (ja)
EP (1) EP3965832A4 (ja)
JP (1) JP2022532139A (ja)
KR (1) KR20220019685A (ja)
CN (1) CN114929287A (ja)
AU (1) AU2020276218A1 (ja)
CA (1) CA3139324A1 (ja)
WO (1) WO2020231863A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4143315A1 (en) 2020-04-28 2023-03-08 The Broad Institute Inc. <smallcaps/>? ? ?ush2a? ? ? ? ?targeted base editing of thegene
EP4301395A1 (en) * 2021-03-12 2024-01-10 Massachusetts Institute of Technology Compositions and methods for dominant antiviral therapy
KR20240087635A (ko) * 2021-07-22 2024-06-19 에멘도바이오 인코포레이티드 B형 간염 바이러스(hbv) 녹아웃
WO2023049935A1 (en) * 2021-09-27 2023-03-30 Beam Therapeutics Inc. Compositions and methods for treating hepatitis b virus infection
WO2024103051A2 (en) * 2022-11-11 2024-05-16 The United States Government As Represented By The Department Of Veterans Affairs Hiv specific exosomes and uses thereof

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2014281028B2 (en) * 2013-06-17 2020-09-10 Massachusetts Institute Of Technology Delivery and use of the CRISPR-Cas systems, vectors and compositions for hepatic targeting and therapy
WO2017070284A1 (en) * 2015-10-21 2017-04-27 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating hepatitis b virus
WO2018027078A1 (en) * 2016-08-03 2018-02-08 President And Fellows Of Harard College Adenosine nucleobase editors and uses thereof
EP3565608A4 (en) * 2017-01-05 2020-12-16 Rutgers, The State University of New Jersey TARGETED GENEDITATION PLATFORM INDEPENDENT OF DNA DOUBLE STRAND BREAKAGE AND USES THEREOF
WO2019005886A1 (en) * 2017-06-26 2019-01-03 The Broad Institute, Inc. CRISPR / CAS-CYTIDINE DEAMINASE COMPOSITIONS, SYSTEMS AND METHODS FOR TARGETED EDITING OF NUCLEIC ACIDS
US11732274B2 (en) * 2017-07-28 2023-08-22 President And Fellows Of Harvard College Methods and compositions for evolving base editors using phage-assisted continuous evolution (PACE)

Also Published As

Publication number Publication date
CN114929287A (zh) 2022-08-19
US20230070861A1 (en) 2023-03-09
EP3965832A4 (en) 2024-02-07
KR20220019685A (ko) 2022-02-17
EP3965832A1 (en) 2022-03-16
AU2020276218A1 (en) 2021-12-02
CA3139324A1 (en) 2020-11-19
WO2020231863A1 (en) 2020-11-19

Similar Documents

Publication Publication Date Title
US11155803B2 (en) Adenosine deaminase base editors and methods of using same to modify a nucleobase in a target sequence
US20210380955A1 (en) Methods of editing single nucleotide polymorphism using programmable base editor systems
US20210277379A1 (en) Multi-effector nucleobase editors and methods of using same to modify a nucleic acid target sequence
US20210371858A1 (en) Methods of suppressing pathogenic mutations using programmable base editor systems
US20220136012A1 (en) Nucleobase editors having reduced off-target deamination and methods of using same to modify a nucleobase target sequence
US20230140953A1 (en) Methods of editing a disease-associated gene using adenosine deaminase base editors, including for the treatment of genetic disease
US20230017979A1 (en) Compositions and methods for non-toxic conditioning
JP2022532139A (ja) B型肝炎を治療するための組成物及び方法
US20220098593A1 (en) Splice acceptor site disruption of a disease-associated gene using adenosine deaminase base editors, including for the treatment of genetic disease
US20220313799A1 (en) Compositions and methods for editing a mutation to permit transcription or expression
JP2024095696A (ja) マルチエフェクター核酸塩基エディターおよびそれを用いて核酸標的配列を改変する方法
WO2023049935A1 (en) Compositions and methods for treating hepatitis b virus infection

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230508

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230508

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240528