JP2022545950A - 転写または発現を可能にするように変異を編集するための組成物および方法 - Google Patents

転写または発現を可能にするように変異を編集するための組成物および方法 Download PDF

Info

Publication number
JP2022545950A
JP2022545950A JP2022513443A JP2022513443A JP2022545950A JP 2022545950 A JP2022545950 A JP 2022545950A JP 2022513443 A JP2022513443 A JP 2022513443A JP 2022513443 A JP2022513443 A JP 2022513443A JP 2022545950 A JP2022545950 A JP 2022545950A
Authority
JP
Japan
Prior art keywords
tada
spcas9
base editor
polynucleotide
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022513443A
Other languages
English (en)
Other versions
JPWO2021041885A5 (ja
Inventor
ジェイソン マイケル ゲールケ、
ルイス バレラ、
アンジェリカ メッサーナ、
Original Assignee
ビーム セラピューティクス インク.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ビーム セラピューティクス インク. filed Critical ビーム セラピューティクス インク.
Publication of JP2022545950A publication Critical patent/JP2022545950A/ja
Publication of JPWO2021041885A5 publication Critical patent/JPWO2021041885A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K35/00Medicinal preparations containing materials or reaction products thereof with undetermined constitution
    • A61K35/12Materials from mammals; Compositions comprising non-specified tissues or cells; Compositions comprising non-embryonic stem cells; Genetically modified cells
    • A61K35/28Bone marrow; Haematopoietic stem cells; Mesenchymal stem cells of any origin, e.g. adipose-derived stem cells
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K35/00Medicinal preparations containing materials or reaction products thereof with undetermined constitution
    • A61K35/12Materials from mammals; Compositions comprising non-specified tissues or cells; Compositions comprising non-embryonic stem cells; Genetically modified cells
    • A61K35/48Reproductive organs
    • A61K35/54Ovaries; Ova; Ovules; Embryos; Foetal cells; Germ cells
    • A61K35/545Embryonic stem cells; Pluripotent stem cells; Induced pluripotent stem cells; Uncharacterised stem cells
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/43Enzymes; Proenzymes; Derivatives thereof
    • A61K38/46Hydrolases (3)
    • A61K38/50Hydrolases (3) acting on carbon-nitrogen bonds, other than peptide bonds (3.5), e.g. asparaginase
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04005Cytidine deaminase (3.5.4.5)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Medicinal Chemistry (AREA)
  • Biochemistry (AREA)
  • Public Health (AREA)
  • Microbiology (AREA)
  • Veterinary Medicine (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Cell Biology (AREA)
  • Developmental Biology & Embryology (AREA)
  • Immunology (AREA)
  • Epidemiology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Reproductive Health (AREA)
  • Virology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Hematology (AREA)
  • Gynecology & Obstetrics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Mycology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本発明は、シュワックマン・ダイアモンド症候群(SDS)に関連する遺伝子が転写可能となって機能性遺伝子産物を生成するように、プログラマブル核酸塩基エディターを用いてこの遺伝子を編集する(例えば、スプライス部位を与えるおよび/またはナンセンス変異を変更する)ための、組成物および方法を特徴として備える。【選択図】なし

Description

関連出願の相互参照
本出願は、その内容が参照によりその全体をここに組み込まれる、2019年8月29日出願の米国仮特許出願第62/893,638号の優先権および利益を主張する国際PCT出願である。
シュワックマン・ダイアモンド症候群(SDS)は、外分泌性膵不全、造血障害、および白血病素因という特徴を有する稀少性の常染色体劣性多系統疾患である。SDSに罹患している患者は、骨髄不全を呈する。他の臨床像としては、骨格障害、免疫障害、肝臓障害、および心臓障害が挙げられる。SDSの臨床像を伴う患者の約90%が、7番染色体上に位置する進化的に保存されたシュワックマン・ボディアン・ダイアモンド症候群(SBDS)遺伝子に、二対立遺伝子性の変異を有する。SDBSタンパク質は、その精確な分子機能が依然として不明であるものの、リボソームの新生および有糸分裂時紡錘体の安定化に役割を担う。現在、SDSの治療法はなく、この障害を有する患者は、典型的には、合併症のために入院を繰り返し、平均的には約35歳までしか生存しない。したがって、SDSを治療するための方法および治療薬の改善が差し迫って求められている。
下記に記載されるように、本発明は、シュワックマン・ダイアモンド症候群(SDS)に関連する遺伝子がスプライシングされて機能性遺伝子産物を生成するように、プログラマブル核酸塩基エディターを用いてこの遺伝子を編集するための製品、組成物、および方法を特徴として備える。
一態様では、転写を可能にするようにポリヌクレオチドを編集する方法が提供され、本方法は、1つまたは複数のガイドポリヌクレオチドとの複合体中の塩基エディターにポリヌクレオチドを接触させることを含み、塩基エディターは、ポリヌクレオチドプログラマブルDNA結合ドメインとデアミナーゼドメインとを含み、1つまたは複数のガイドポリヌクレオチドは、塩基エディターを標的に向けて、転写を可能にする変異を導入する変更をもたらす。一実施形態では、転写を可能にする変異とは、終止コドンを変更する変異、スプライスアクセプターもしくはスプライスドナー部位を導入する変異、またはスプライスアクセプターもしくはスプライスドナー部位を修正する変異である。
一態様では、シュワックマン・ダイアモンド症候群(SDS)に関連する変異を含むSBDSポリヌクレオチドを編集する方法が提供され、本方法は、1つまたは複数のガイドポリヌクレオチドとの複合体中の塩基エディターにSBDSポリヌクレオチドを接触させることを含み、前記塩基エディターは、ポリヌクレオチドプログラマブルDNA結合ドメインとデアミナーゼドメインとを含み、1つまたは複数のガイドポリヌクレオチドは、塩基エディターを標的に向けて、シュワックマン・ダイアモンド症候群(SDS)に関連する変異の変更をもたらす。本方法またはその実施形態のうち一実施形態では、シュワックマン・ダイアモンド症候群(SDS)に関連する変異は、遺伝子変換に起因する。本方法またはその実施形態のうち一実施形態では、シュワックマン・ダイアモンド症候群(SDS)に関連する変異は、その遺伝子の終止コドンを誘発するか、またはスプライシングを変更する。本方法またはその実施形態のうち一実施形態では、シュワックマン・ダイアモンド症候群(SDS)に関連する変異は、切詰を有するSBDSポリペプチドをコードする。
任意の上述の方法およびその実施形態のうち一実施形態では、デアミナーゼは、シチジンデアミナーゼまたはアデノシンデアミナーゼである。一実施形態では、デアミナーゼはアデノシンデアミナーゼである。複数の実施形態では、アデノシンデアミナーゼは、本明細書で表7Aまたは表7Bなどに挙げられたABE8またはABE8バリアントから選択される。上述の方法およびその実施形態のうち別の実施形態では、デアミナーゼはシチジンデアミナーゼである。一実施形態では、シトシンデアミナーゼは、BE4、rAPOBEC1、PpAPOBEC1、H122A置換を含有するPpAPOBEC1、AmAPOBEC1、SsAPOBEC2、RrA3F、F130L置換を含有するRrA3F、APOBEC-1がrAPOBEC1の配列に置き換えられたBE4のバリアント、APOBEC-1がAmAPOBEC1の配列に置き換えられたBE4のバリアント、APOBEC-1がSsAPOBEC2の配列に置き換えられたBE4のバリアント、APOBEC-1がPpAPOBEC1の配列に置き換えられたBE4のバリアント、またはAPOBEC-1がH122A置換を含有するPpAPOBEC1の配列に置き換えられたBE4のバリアントのうち、1つまたは複数から選択される。一実施形態では、H122A置換を含有するPpAPOBEC1、またはAPOBEC-1がH122A置換を含有するPpAPOBEC1の配列に置き換えられたBE4のバリアントは、R33A、W90F、K34A、R52A、H121A、またはY120Fから選択される1つまたは複数のアミノ酸変異をさらに含む。上述の方法およびその実施形態のうちの複数の実施形態では、2つ以上のガイドポリヌクレオチドは、塩基エディターを標的に向けて、シュワックマン・ダイアモンド症候群(SDS)に関連する2つ以上の変異の変更をもたらす。
別の態様では、シュワックマン・ダイアモンド症候群(SDS)に関連する変異を含むSBDSポリヌクレオチドを編集する方法が提供され、本方法は、1つまたは複数のガイドポリヌクレオチドとの複合体中のアデノシン塩基エディター(ABE)にSBDSポリヌクレオチドを接触させることを含み、前記塩基エディターは、ポリヌクレオチドプログラマブルDNA結合ドメインとデアミナーゼドメインとを含み、1つまたは複数のガイドポリヌクレオチドは、塩基エディターを標的に向けて、183~184TA>CT Rs113993991のA・TからG・Cへの変更をもたらし、ミスセンス変異を生成する。一実施形態では、1つまたは複数のガイドポリヌクレオチドは、以下の配列のうち1つを標的とする:TGTAAATGTTTCCTAAGGTCまたはAATGTTTCCTAAGGTCAGGT。一実施形態では、1つまたは複数のsgRNAは、以下の配列のうち1つを含む:UGUAAAUGUUUCCUAAGGUCまたはAAUGUUUCCUAAGGUCAGGU。一実施形態では、ABEは、5’-NGC-3’または5’-NGG-3’のPAM特異性を有する。
別の態様では、シュワックマン・ダイアモンド症候群(SDS)に関連する変異を含むSBDSポリヌクレオチドを編集する方法であって、本方法は、1つまたは複数のガイドポリヌクレオチドとの複合体中のシチジン塩基エディターにSBDSポリヌクレオチドを接触させることを含み、シチジン塩基エディター(CBE)は、ポリヌクレオチドプログラマブルDNA結合ドメインとシチジンデアミナーゼドメインとを含み、1つまたは複数のガイドポリヌクレオチドは、塩基エディターを標的に向けて、rs113993993 258+2T>CのC・GからT・Aへの変更をもたらす。一実施形態では、CBEは、5’-NGC-3’PAMへの特異性または5’-NGC-3’を含むPAMに対する特異性を有する。一実施形態では、ガイドポリヌクレオチドは、GTAAGCAGGCGGGTAACAGCTGC、AGCAGGCGGGTAACAGCTGCAGC、GCGGGTAACAGCTGCAGCATAGC、GTAAGCAGGCGGGTAACAGC、AGCAGGCGGGTAACAGCTGC、GCGGGTAACAGCTGCAGCAT、GCAGGCGGGTAACAGCTGC、CAGGCGGGTAACAGCTGC、AGGCGGGTAACAGCTGC、またはAAGCAGGCGGGTAACAGCTGCから選択されるポリヌクレオチド標的配列を標的とする。一実施形態では、sgRNAは、以下の配列のうち1つを含む:GUAAGCAGGCGGGUAACAGC;AGCAGGCGGGUAACAGCUGC;GCGGGUAACAGCUGCAGCA;GCAGGCGGGUAACAGCUGC、CAGGCGGGUAACAGCUGC、AGGCGGGUAACAGCUGC、またはAAGCAGGCGGGUAACAGCUGC。
任意の上述の方法とその実施形態の他の実施形態では、上記接触は細胞内にあり、細胞は真核細胞、哺乳類細胞、またはヒト細胞である。一実施形態では、細胞はin vivoまたはex vivoである。任意の上述の方法およびその実施形態のうち一実施形態では、塩基エディターは、ミスセンス変異を導入し、新しいスプライスアクセプターまたはスプライスドナー部位を挿入し、および/または変異を含むスプライスアクセプター部位もしくはスプライスドナー部位を修正する。任意の上述の方法およびその実施形態のうち一実施形態では、ポリヌクレオチドプログラマブルDNA結合ドメインは、ストレプトコッカス・ピロゲネスCas9(SpCas9)、スタフィロコッカス・アウレウスCas9(SaCas9)、ストレプトコッカス・サーモフィルス1Cas9(St1Cas9)、ストレプトコッカス・カニスCas9(ScCas9)、またはそれらのバリアントから選択されるCas9である。一実施形態では、ポリヌクレオチドプログラマブルDNA結合ドメインは、野生型もしくは改変型のストレプトコッカス・ピロゲネスCas9(SpCas9)、またはそのバリアントである。一実施形態では、ポリヌクレオチドプログラマブルDNA結合ドメインは、改変型SpCas9またはSpCas9バリアントである。一実施形態では、ポリヌクレオチドプログラマブルDNA結合ドメインは、プロトスペーサー隣接モチーフ(PAM)特異性を変更された改変型SpCas9またはSpCas9バリアントを含む。一実施形態では、SpCas9は、PAM核酸配列の5’-NGC-3’または5’-NGG-3’に対する特異性を有する。一実施形態では、SpCas9は、PAM核酸配列5’-NGC-3’または5’-NGC-3’を含むPAM核酸配列に対する特異性を有する改変型SpCas9またはSpCas9バリアントである。一実施形態では、改変型SpCas9またはSpCas9バリアントは、表1に挙げられたアミノ酸配列を含む。一実施形態では、改変型SpCas9は、spCas9-MQKFRAERである。一実施形態では、改変型SpCas9またはSpCas9バリアントは、図3A~図3C、または図10に示されるアミノ酸置換の組合せを含む。一実施形態では、改変されたSpCas9またはSpCas9バリアントは、以下から選択されるアミノ酸配列置換の組合せを含む:
D1135M、S1136Q、G1218K、E1219F、A1322R、D1332、R1335E、およびT1337R(224 SpCas9);D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、およびT1337R(225 SpCas9);
D1135M、S1136Q、G1218K、E1219F、A1322R、D1332K、R1335E、およびT1337R(226 SpCas9);
D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、およびT1337Q(227 Cas9);
D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335Q、およびT1337Q(230 SpCas9);
D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335D、およびT1337Q(235 SpCas9);D1135Q、S1136、G1218T、E1219W、A1322R、D1332、R1335N、およびT1337(237 SpCas9);D1135H、S1136、G1218S、E1219W、A1322R、D1332、R1335V、およびT1337(242 SpCas9);D1135C、S1136W、G1218N、E1219W、A1322R、D1332、R1335N、およびT1337(244 SpCas9);D113LM、S1136W、G1218R、E1219S、A1322R、D1332、R1335E、およびT1337(245 SpCas9);D1135G、S1136W、G1218S、E1219M、A1322R、D1332、R1335Q、およびT1337R(259 SpCas9);L111R、D1135V、S1136Q、G1218K、E1219F、A1322R、D1332、R1335A、およびT1337R(Nureki SpCas9);D1135M、S1136、S1216G、G1218、E1219、A1322、D1332A、R1335Q、およびT1337(NGCRd1 SpCas9);または
D1135G、S1136、S1216G、G1218、E1219、A1322R、D1332A、R1335E、およびT1337R(267 (NGCRd2SpCas9)。
任意の上述の方法およびその実施形態の他の実施形態では、ポリヌクレオチドプログラマブルDNA結合ドメインは、ヌクレアーゼ不活性のまたはニッカーゼのバリアントである。一実施形態では、ニッカーゼバリアントは、アミノ酸置換D10Aまたはその対応するアミノ酸置換を含む。一実施形態では、デアミナーゼドメインは、デオキシリボ核酸(DNA)中のアデノシンまたはシトシンを脱アミノ化することができる。一実施形態では、アデノシンデアミナーゼまたはシチジンデアミナーゼは、天然には発生しない改変型アデノシンデアミナーゼまたはシチジンデアミナーゼである。一実施形態では、アデノシンデアミナーゼはTadAデアミナーゼである。一実施形態では、TadAデアミナーゼは、TadA*7.10、TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23、またはTadA*8.24である。一実施形態では、TadA*7.10は、以下の変更のうち1つまたは複数を含む:Y147T、Y147R、Q154S、Y123H、V82S、T166R、Q154R。
一実施形態では、TadA*7.10は、Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y147T+Q154R;Y147T+Q154S;V82S+Q154S;およびY123H+Y147R+Q154R+I76Yからなる群から選択される変更の組合せを含む。
任意の上述の方法およびその実施形態の別の実施形態では、1つまたは複数のガイドRNAは、CRISPR RNA(crRNA)とトランスコード化低分子RNA(tracrRNA)とを含み、crRNAは、SDSに関連する変更を含むSBDS核酸配列に相補的な核酸配列を含む。任意の上述の方法およびその実施形態の別の実施形態では、塩基エディターは、SDSに関連する変更を含むSBDS核酸配列に相補的な核酸配列を含む単一ガイドRNA(sgRNA)との複合体の状態にある。
別の態様では、ポリヌクレオチドプログラマブルDNA結合ドメインとデアミナーゼドメインとを含む塩基エディター、上記塩基エディターをコードするポリヌクレオチド、細胞に;および塩基エディターを標的に向けて異常なスプライシングに関連する変更をもたらす1つまたは複数のガイドポリヌクレオチドを、細胞内またはその前駆体内に導入することによって産生される細胞が提供される。一実施形態では、細胞またはその前駆体は、胚性幹細胞、誘導多能性幹細胞、または造血幹細胞である。一実施形態では、細胞はSBDSタンパク質を発現する。一実施形態では、細胞は、シュワックマン・ダイアモンド症候群(SDS)に罹っている対象に由来する。一実施形態では、細胞は、哺乳類細胞またはヒト細胞である。細胞の一実施形態では、変異または変更は、異常なスプライシングにより生じる終止コドンおよび/または変異を含む遺伝子変換に起因する。一実施形態では、細胞は、SDSに関連する遺伝子変換について選択される。一実施形態では、ポリヌクレオチドプログラマブルDNA結合ドメインは、野生型もしくは改変型のストレプトコッカス・ピロゲネスCas9(SpCas9)、またはそのバリアントである。一実施形態では、ポリヌクレオチドプログラマブルDNA結合ドメインは、プロトスペーサー隣接モチーフ(PAM)特異性を変更された野生型SpCas9または改変型SpCas9バリアントを含む。一実施形態では、改変型SpCas9は、核酸配列5’-NGC-3’またはまたは5’-NGC-3’を含むPAM核酸配列に対する特異性を有する。一実施形態では、改変型SpCas9は、表1に挙げられるCas9バリアントである。一実施形態では、改変型SpCas9は、spCas9-MQKFRAERである。上記細胞の一実施形態では、改変型SpCas9は、図3A~図3Cまたは図10に示されるアミノ酸置換の組合せを含むSpCas9バリアントである。上記細胞の一実施形態では、SpCas9バリアントは、以下から選択されるアミノ酸配列/置換の組合せを含む:
D1135M、S1136Q、G1218K、E1219F、A1322R、D1332、R1335E、およびT1337R(224 SpCas9);D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、およびT1337R(225 SpCas9);
D1135M、S1136Q、G1218K、E1219F、A1322R、D1332K、R1335E、およびT1337R(226 SpCas9);
D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、およびT1337Q(227 Cas9);
D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335Q、およびT1337Q(230 SpCas9);
D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335D、およびT1337Q(235 SpCas9);D1135Q、S1136、G1218T、E1219W、A1322R、D1332、R1335N、およびT1337(237 SpCas9);D1135H、S1136、G1218S、E1219W、A1322R、D1332、R1335V、およびT1337(242 SpCas9);D1135C、S1136W、G1218N、E1219W、A1322R、D1332、R1335N、およびT1337(244 SpCas9);D113LM、S1136W、G1218R、E1219S、A1322R、D1332、R1335E、およびT1337(245 SpCas9);D1135G、S1136W、G1218S、E1219M、A1322R、D1332、R1335Q、およびT1337R(259 SpCas9);L111R、D1135V、S1136Q、G1218K、E1219F、A1322R、D1332、R1335A、およびT1337R(Nureki SpCas9);D1135M、S1136、S1216G、G1218、E1219、A1322、D1332A、R1335Q、およびT1337(NGCRd1 SpCas9);または
D1135G、S1136、S1216G、G1218、E1219、A1322R、D1332A、R1335E、およびT1337R(267 (NGC Rd2 SpCas9)。上記細胞の実施形態では、プログラマブルポリヌクレオチド結合ドメインは、ヌクレアーゼ不活性のバリアントまたはニッカーゼバリアントである。一実施形態では、ニッカーゼバリアントは、アミノ酸置換D10Aまたはその対応するアミノ酸置換を含む。上記細胞の一実施形態では、デアミナーゼドメインは、デオキシリボ核酸(DNA)内のシチジンを脱アミノ化することができるシチジンデアミナーゼドメインであるか、またはDNA内のアデノシンを脱アミノ化することができるアデノシンデアミナーゼドメインである。一実施形態では、アデノシンデアミナーゼまたはシチジンデアミナーゼは、天然には発生しない改変型アデノシンデアミナーゼまたはシチジンデアミナーゼである。上記細胞の別の実施形態では、アデノシンデアミナーゼはTadAデアミナーゼである。一実施形態では、TadAデアミナーゼは、TadA*7.10、TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23、またはTadA*8.24である。一実施形態では、TadA*7.10は、以下の変更のうち1つまたは複数を含む:Y147T、Y147R、Q154S、Y123H、V82S、T166R、Q154R。一実施形態では、TadA*7.10は、Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y147T+Q154R;Y147T+Q154S;V82S+Q154Sからなる群から選択される変更の組合せを含む。上記細胞の別の実施形態では、シトシンデアミナーゼは、BE4;rAPOBEC1、PpAPOBEC1、H122A置換を含有するPpAPOBEC1、AmAPOBEC1、SsAPOBEC2、RrA3F、F130L置換を含有するRrA3F、APOBEC-1がrAPOBEC1の配列に置き換えられたBE4のバリアント、APOBEC-1がAmAPOBEC1の配列に置き換えられたBE4のバリアント、APOBEC-1がSsAPOBEC2の配列に置き換えられたBE4のバリアント、APOBEC-1がPpAPOBEC1の配列に置き換えられたBE4のバリアント、またはAPOBEC-1がH122A置換を含有するPpAPOBEC1の配列に置き換えられたBE4のバリアントのうち、1つまたは複数から選択される。一実施形態では、H122A置換を含有するPpAPOBEC1、またはAPOBEC-1がH122A置換を含有するPpAPOBEC1の配列に置き換えられたBE4のバリアントは、R33A、W90F、K34A、R52A、H121A、またはY120Fから選択される1つまたは複数のアミノ酸変異をさらに含む。上記細胞の別の実施形態では、1つまたは複数のガイドRNAは、CRISPR RNA(crRNA)とトランスコード化低分子RNA(tracrRNA)とを含み、crRNAは、SDSに関連する変更を含むSBDS核酸配列に相補的な核酸配列を含む。上記細胞の一実施形態では、塩基エディターおよび1つまたは複数のガイドポリヌクレオチドは、細胞内で複合体を形成する。一実施形態では、塩基エディターは、SDSに関連付けられた遺伝子変換を含むSBDS核酸配列に相補的な核酸配列を含む単一ガイドRNA(sgRNA)との複合体の状態にある。
別の態様では、シュワックマン・ダイアモンド症候群(SDS)または異常なスプライシングに関連する疾患を、それを必要とする対象において治療する方法が提供され、本方法は、上述の態様およびその記述された実施形態による細胞を対象に投与することを含む。本方法の一実施形態では、細胞は、自己由来であるか、対象と同種異系または異種である。
別の態様では、上述の態様およびその記述された実施形態による細胞から増殖または拡大された、単離された細胞または細胞集団が提供される。
別の態様では、対象におけるシュワックマン・ダイアモンド症候群(SDS)の治療方法が提供され、本方法は、ポリヌクレオチドプログラマブルDNA結合ドメインとデアミナーゼドメインとを含む塩基エディター、または塩基エディターをコードするポリヌクレオチド;および塩基エディターを標的に向けてSDSに関連する変異の変更をもたらす1つまたは複数のガイドポリヌクレオチドを、それを必要とする対象に投与することを含む。
別の態様では、対象における異常なスプライシングに関連する遺伝子疾患の治療方法を提供し、本方法は、ポリヌクレオチドプログラマブルDNA結合ドメインとデアミナーゼドメインとを含む塩基エディター、または塩基エディターをコードするポリヌクレオチド;および塩基エディターを標的に向けてスプライシングを変更する病原性変異の変更をもたらす1つまたは複数のガイドポリヌクレオチドを、それを必要とする対象に投与することを含む。
対象においてシュワックマン・ダイアモンド症候群(SDS)を治療する上述の方法、または対象において異常なスプライシングに関連する遺伝子疾患を治療する上述の方法の一実施形態では、対象は哺乳動物またはヒトである。一実施形態では、上述の方法は、塩基エディターまたは塩基エディターをコードするポリヌクレオチドと、1つまたは複数のガイドポリヌクレオチドとを、対象の細胞に送達することを含む。一実施形態では、細胞は、切詰型ポリペプチドを発現する。上述の方法の一実施形態では、変更は、SBDSポリヌクレオチド中、TAA終止をTGGに変換する。本方法の別の実施形態では、変更は、SDSに関連するSBDSポリペプチドにおいてK62Xを変える。本方法の別の実施形態では、SDSに関連する遺伝子変換は、切詰されたSBDSポリペプチドの発現を結果として生じる。本方法の別の実施形態では、塩基エディターの修正は、アミノ酸62位でリジン(K)をトリプトファン(W)に置き換える。本方法の別の実施形態では、ポリヌクレオチドプログラマブルDNA結合ドメインは、改変型ストレプトコッカス・ピロゲネスCas9(SpCas9)またはそのバリアントを含む。本方法の別の実施形態では、ポリヌクレオチドプログラマブルDNA結合ドメインは、プロトスペーサー隣接モチーフ(PAM)特異性を変更された改変型SpCas9を含む。一実施形態では、改変型SpCas9は、PAM核酸配列5’-NGC-3’または5’-NGC-3’を含むPAM核酸配列に対する特異性を有する。一実施形態では、改変型SpCas9は、表1に挙げられるCas9バリアントである。一実施形態では、改変型SpCas9は、spCas9-MQKFRAERである。これらの方法の別の実施形態では、改変型SpCas9は、図3A~図3Cまたは図10に示されるアミノ酸置換の組合せを含むSpCas9バリアントである。一実施形態では、SpCas9バリアントは、以下から選択されるアミノ酸配列置換の組合せを含む:
D1135M、S1136Q、G1218K、E1219F、A1322R、D1332、R1335E、およびT1337R(224 SpCas9);D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、およびT1337R(225 SpCas9);
D1135M、S1136Q、G1218K、E1219F、A1322R、D1332K、R1335E、およびT1337R(226 SpCas9);
D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、およびT1337Q(227 Cas9);
D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335Q、およびT1337Q(230 SpCas9);
D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335D、およびT1337Q(235 SpCas9);D1135Q、S1136、G1218T、E1219W、A1322R、D1332、R1335N、およびT1337(237 SpCas9);D1135H、S1136、G1218S、E1219W、A1322R、D1332、R1335V、およびT1337(242 SpCas9);D1135C、S1136W、G1218N、E1219W、A1322R、D1332、R1335N、およびT1337(244 SpCas9);D113LM、S1136W、G1218R、E1219S、A1322R、D1332、R1335E、およびT1337(245 SpCas9);D1135G、S1136W、G1218S、E1219M、A1322R、D1332、R1335Q、およびT1337R(259 SpCas9);L111R、D1135V、S1136Q、G1218K、E1219F、A1322R、D1332、R1335A、およびT1337R(Nureki SpCas9);D1135M、S1136、S1216G、G1218、E1219、A1322、D1332A、R1335Q、およびT1337(NGCRd1 SpCas9);または
D1135G、S1136、S1216G、G1218、E1219、A1322R、D1332A、R1335E、およびT1337R(267 (NGC Rd2 SpCas9)。上記方法およびその実施形態の他の実施形態では、ポリヌクレオチドプログラマブルDNA結合ドメインは、ヌクレアーゼ不活性のバリアントである。上述の方法の一実施形態では、ポリヌクレオチドプログラマブルDNA結合ドメインは、ニッカーゼバリアントである。一実施形態では、ニッカーゼバリアントは、アミノ酸置換D10Aまたはその対応するアミノ酸置換を含む。上記方法の一実施形態では、デアミナーゼドメインは、デオキシリボ核酸(DNA)中のアデノシンまたはシチジンを脱アミノ化することができる。一実施形態では、デアミナーゼドメインは、天然には発生しない改変型アデノシンデアミナーゼまたはシチジンデアミナーゼである。一実施形態では、アデノシンデアミナーゼはTadAデアミナーゼである。一実施形態では、TadAデアミナーゼは、TadA*7.10、TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23、またはTadA*8.24である。一実施形態では、TadA*7.10は、1つまたは複数の以下の変更:Y147T、Y147R、Q154S、Y123H、V82S、T166R、Q154Rを含むか;または、TadA*7.10は、Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y147T+Q154R;Y147T+Q154S;V82S+Q154S;およびY123H+Y147R+Q154R+I76Yからなる群から選択される変更の組合せを含む。上述の方法およびその実施形態の別の実施形態では、デアミナーゼドメインは、BE4、rAPOBEC1、PpAPOBEC1、H122A置換を含有するPpAPOBEC1、AmAPOBEC1、SsAPOBEC2、RrA3F、F130L置換を含有するRrA3F、APOBEC-1がrAPOBEC1の配列に置き換えられたBE4のバリアント、APOBEC-1がAmAPOBEC1の配列に置き換えられたBE4のバリアント、APOBEC-1がSsAPOBEC2の配列に置き換えられたBE4のバリアント、APOBEC-1がPpAPOBEC1の配列に置き換えられたBE4のバリアント、またはAPOBEC-1がH122A置換を含有するPpAPOBEC1の配列に置き換えられたBE4のバリアントのうち1つまたは複数から選択されるシチジンデアミナーゼである。一実施形態では、H122A置換を含有するPpAPOBEC1、またはAPOBEC-1がH122A置換を含有するPpAPOBEC1の配列に置き換えられたBE4のバリアントは、R33A、W90F、K34A、R52A、H121A、またはY120Fから選択される1つまたは複数のアミノ酸変異をさらに含む。上述の方法およびその実施形態の実施形態では、塩基エディターは、SBDSポリヌクレオチド配列中のSNPのrs113993993 258+2T>Cを標的として、正しいスプライシングを回復させる。上記方法の一実施形態では、1つまたは複数のガイドポリヌクレオチドは、CRISPR RNA(crRNA)とトランスコード化低分子RNA(tracrRNA)とを含み、crRNAは、遺伝子変換を含むSBDS核酸配列に相補的な核酸配列を含む。一実施形態では、塩基エディターは、SDSに関連付けられた遺伝子変換を含むSBDS核酸配列に相補的な核酸配列を含む単一ガイドRNA(sgRNA)との複合体の状態にある。
別の態様では、細胞またはその前駆体を産生する方法が提供され、本方法は:
(a)シュワックマン・ダイアモンド症候群(SDS)に関連する遺伝子変換を含む誘導多能性幹細胞内に、
ポリヌクレオチド-プログラマブルヌクレオチド-結合ドメインとシチジンデアミナーゼドメインまたはアデノシンデアミナーゼドメインとを含む塩基エディターまたは塩基エディターをコードするポリヌクレオチド;および
塩基エディターを標的に向けてSDSに関連する変異に変更をもたらす1つまたは複数のガイドポリヌクレオチド
を導入すること;ならびに
(b)誘導多能性幹細胞または前駆体を所望の細胞型に分化させること
を含む。本方法の一実施形態では、変異はSDSに関連する遺伝子変換である。一実施形態では、細胞または前駆体は、SDSに罹っている対象から得られる。一実施形態では、細胞または前駆体は、哺乳類細胞またはヒト細胞である。本方法の別の実施形態では、ポリヌクレオチドプログラマブルDNA結合ドメインは、ストレプトコッカス・ピロゲネスCas9(SpCas9)、改変型ストレプトコッカス・ピロゲネスCas9(SpCas9)、またはそれらのバリアントを含む。別の実施形態では、ポリヌクレオチドプログラマブルDNA結合ドメインは、プロトスペーサー隣接モチーフ(PAM)特異性を変更された改変型SpCas9を含む。本方法の一実施形態では、SpCas9は、核酸配列5’-NGG-3’に対する特異性を有し、改変型SpCas9は、核酸配列5’-NGC-3’または5’-NGC-3’を含むPAM核酸配列に対する特異性を有する。本方法の一実施形態では、改変型SpCas9は、表1に挙げられたCas9バリアントであるか、または改変型SpCas9はspCas9-MQKFRAERである。本方法の別の実施形態では、改変型SpCas9は、図3A~図3Cまたは図10に示されるアミノ酸置換の組合せを含むSpCas9バリアントである。本方法の一実施形態では、SpCas9バリアントは、以下から選択されるアミノ酸配列置換の組合せを含む:
D1135M、S1136Q、G1218K、E1219F、A1322R、D1332、R1335E、およびT1337R(224 SpCas9);D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、およびT1337R(225 SpCas9);
D1135M、S1136Q、G1218K、E1219F、A1322R、D1332K、R1335E、およびT1337R(226 SpCas9);
D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、およびT1337Q(227 Cas9);
D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335Q、およびT1337Q(230 SpCas9);
D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335D、およびT1337Q(235 SpCas9);D1135Q、S1136、G1218T、E1219W、A1322R、D1332、R1335N、およびT1337(237 SpCas9);D1135H、S1136、G1218S、E1219W、A1322R、D1332、R1335V、およびT1337(242 SpCas9);D1135C、S1136W、G1218N、E1219W、A1322R、D1332、R1335N、およびT1337(244 SpCas9);D113LM、S1136W、G1218R、E1219S、A1322R、D1332、R1335E、およびT1337(245 SpCas9);D1135G、S1136W、G1218S、E1219M、A1322R、D1332、R1335Q、およびT1337R(259 SpCas9);L111R、D1135V、S1136Q、G1218K、E1219F、A1322R、D1332、R1335A、およびT1337R(Nureki SpCas9);D1135M、S1136、S1216G、G1218、E1219、A1322、D1332A、R1335Q、およびT1337(NGCRd1 SpCas9);または
D1135G、S1136、S1216G、G1218、E1219、A1322R、D1332A、R1335E、およびT1337R(267 (NGC Rd2 SpCas9)。本方法の一実施形態では、ポリヌクレオチドプログラマブルDNA結合ドメインは、ヌクレアーゼ不活性のまたはニッカーゼのバリアントである。一実施形態では、ニッカーゼバリアントは、アミノ酸置換D10Aまたはその対応するアミノ酸置換を含む。本方法の一実施形態では、アデノシンデアミナーゼドメインは、デオキシリボ核酸(DNA)内のアデノシンを脱アミノ化することができ、シチジンデアミナーゼは、デオキシリボ核酸(DNA)内のシトシンを脱アミノ化することができる。一実施形態では、アデノシンデアミナーゼは、天然には発生しない改変型アデノシンデアミナーゼである。一実施形態では、アデノシンデアミナーゼは、TadA*7.10、TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23、またはTadA*8.24から選択されるTadAデアミナーゼである。本方法の別の実施形態では、デアミナーゼドメインは、BE4、rAPOBEC1、PpAPOBEC1、H122A置換を含有するPpAPOBEC1、AmAPOBEC1、SsAPOBEC2、RrA3F、F130L置換を含有するRrA3F、APOBEC-1がrAPOBEC1の配列に置き換えられたBE4のバリアント、APOBEC-1がAmAPOBEC1の配列に置き換えられたBE4のバリアント、APOBEC-1がSsAPOBEC2の配列に置き換えられたBE4のバリアント、APOBEC-1がPpAPOBEC1の配列に置き換えられたBE4のバリアント、またはAPOBEC-1がH122A置換を含有するPpAPOBEC1の配列に置き換えられたBE4のバリアントのうち、1つまたは複数から選択されるシチジンデアミナーゼである。一実施形態では、H122A置換を含有するPpAPOBEC1、またはAPOBEC-1がH122A置換を含有するPpAPOBEC1の配列に置き換えられたBE4のバリアントは、R33A、W90F、K34A、R52A、H121A、またはY120Fから選択される1つまたは複数のアミノ酸変異をさらに含む。本方法の一実施形態では、1つまたは複数のガイドポリヌクレオチドは、CRISPR RNA(crRNA)とトランスコード化低分子RNA(tracrRNA)とを含み、crRNAは、SDSに関連する遺伝子変換を含むSBDS核酸配列に相補的な核酸配列を含む。本方法の一実施形態では、塩基エディターおよび1つまたは複数のガイドポリヌクレオチドは、細胞内で複合体を形成する。本方法の一実施形態では、塩基エディターは、SDSに関連する遺伝子変換を含むSBDS核酸配列に相補的な核酸配列を含む単一ガイドRNA(sgRNA)との複合体の状態にある。
別の態様では、以下のうち1つまたは複数から選択される5’から3’の核酸配列、またはその1、2、3、4、もしくは5ヌクレオチドの5’切詰断片を含む、ガイドRNAが提供される:GUAAGCAGGCGGGUAACAGC;AGCAGGCGGGUAACAGCUGC;GCGGGUAACAGCUGCAGCAU;UGUAAAUGUUUCCUAAGGUC;AAUGUUUCCUAAGGUCAGGU、GCAGGCGGGUAACAGCUGC、CAGGCGGGUAACAGCUGC、AGGCGGGUAACAGCUGC、およびAAGCAGGCGGGUAACAGCUGC。
別の態様では、SBDS遺伝子内の病原性変異を編集するための塩基エディターシステムが提供され、塩基エディターシステムは:
(a)(i)ポリヌクレオチドプログラマブルDNA結合ドメインと、
(ii)SBDS遺伝子変換に存在するポリヌクレオチドまたはその相補的な核酸塩基を脱アミノ化することができるデアミナーゼドメインと
を含む塩基エディター;および
(b)ポリヌクレオチドプログラマブルDNA結合ドメインと連係するガイドポリヌクレオチドであって、少なくとも一部がSBDS遺伝子、SBDS偽遺伝子、またはそのリバース相補鎖に位置する標的ポリヌクレオチド配列を標的として塩基エディターを向けるガイドポリヌクレオチド
を含み;
ポリヌクレオチドまたはその相補的な核酸塩基を脱アミノ化することにより、SBDS遺伝子の転写が可能となる。
別の態様では、異常なスプライシングを結果として生じる遺伝子内の変異を編集するための塩基エディターシステムが提供され、塩基エディターシステムは:
(a)(i)ポリヌクレオチドプログラマブルDNA結合ドメインと、
(ii)異常なスプライシングを結果として生じる変異またはその相補的な核酸塩基を脱アミノ化することができるデアミナーゼドメイン;および
(b)ポリヌクレオチドプログラマブルDNA結合ドメインと連係するガイドポリヌクレオチドであって、少なくとも一部が上記遺伝子、またはそのリバース相補鎖に位置する標的ポリヌクレオチド配列を標的として塩基エディターを向けるガイドポリヌクレオチド
を含み;
変異またはその相補的な核酸塩基を脱アミノ化することにより、転写が可能となる。
別の態様では、異常なスプライシングを結果として生じる遺伝子内の病原性変異を編集するための方法が提供され、本方法は:
少なくとも一部が上記遺伝子またはそのリバース相補鎖に位置する標的ヌクレオチド配列を、
(i)少なくとも一部が上記遺伝子またはそのリバース相補鎖に位置する標的ポリヌクレオチド配列を標的として塩基エディターを向けるガイドポリヌクレオチドと連係する、ポリヌクレオチドプログラマブルDNA結合ドメインと、
(ii)異常なスプライシングを結果として生じる病原性変異またはその相補的な核酸塩基を脱アミノ化することができるデアミナーゼドメインと
を含む塩基エディターに接触させること;ならびに
標的ヌクレオチド配列を標的として塩基エディターを向けた際に病原性変異またはその相補的な核酸塩基を脱アミノ化することによって、病原性変異を編集すること
を含み、
病原性変異またはその相補的な核酸塩基を脱アミノ化することにより、結果として、スプライシングを可能にする配列への病原性変異の変換が生じ、それによって病原性変異が修正される。
別の態様では、SBDS遺伝子内の病原性変異を編集する方法が提供され、本方法は:
少なくとも一部が上記遺伝子またはそのリバース相補鎖に位置する標的ヌクレオチド配列を、
(i)少なくとも一部が上記遺伝子またはそのリバース相補鎖に位置する標的ポリヌクレオチド配列を標的として塩基エディターを向けるガイドポリヌクレオチドと連係する、ポリヌクレオチドプログラマブルDNA結合ドメインと、
(ii)病原性変異またはその相補的な核酸塩基を脱アミノ化することができるデアミナーゼドメインと
を含む塩基エディターに接触させること;ならびに
標的ヌクレオチド配列を標的として塩基エディターを向けると病原性変異またはその相補的な核酸塩基を脱アミノ化することによって、病原性変異を編集すること
を含み、
病原性変異またはその相補的な核酸塩基を脱アミノ化することは、スプライシングを可能とし、それによってSBDS遺伝子の病原性変異を編集する。病原性変異を編集する上述の方法の一実施形態では、SBDS内の病原性変異は、結果として遺伝子変換を生じる。一実施形態では、病原性変異は、上記遺伝子の終止コドンを導入するかまたはスプライシングを変更する。一実施形態では、病原性変異は、切詰を有するポリペプチドをコードする。一実施形態では、塩基エディターは、ミスセンス変異を導入するか、新しいスプライスアクセプター部位またはスプライスドナー部位を挿入するか、または変異を含むスプライスアクセプター部位もしくはスプライスドナー部位を修正する。一実施形態では、塩基エディターは、SBDS遺伝子内のrs113993993 C→Tの変異を含むスプライスドナーSNP部位を修正する。
別の態様では、SBDS遺伝子内の病原性変異を編集することによって対象においてSDSを治療する方法が提供され、本方法は:
塩基エディターまたは塩基エディターをコードするポリヌクレオチドを、それを必要とする対象に投与することであって、塩基エディターは:
(i)ポリヌクレオチドプログラマブルDNA結合ドメインと
(ii)病原性変異またはその相補的な核酸塩基内の核酸塩基を脱アミノ化することができるデアミナーゼドメインと
を含む、投与すること;ならびに
ガイドポリヌクレオチドを対象に投与することであって、ガイドポリヌクレオチドが、少なくとも一部が上記遺伝子またはそのリバース相補鎖に位置する標的ヌクレオチド配列を標的として塩基エディターを向ける、投与すること;ならびに
標的ヌクレオチド配列を標的として塩基エディターを向けた際にSBDS遺伝子内の病原性変異またはその相補的な核酸塩基を脱アミノ化することによって、上記病原性変異を編集すること
を含み、
病原性変異またはその相補的な核酸塩基を脱アミノ化することにより、転写が可能となるか、または病原性変異が修正される。
別の態様では、細胞、組織、または器官のSBDS遺伝子内の病原性変異を修正することによって、それを必要とする対象においてSDSを治療するための細胞、組織、または器官を産生する方法が提供され、本方法は:
細胞、組織、または器官を、
(i)ポリヌクレオチドプログラマブルDNA結合ドメインと、
(ii)病原性変異またはその相補的な核酸塩基を脱アミノ化することができるデアミナーゼドメインと
を含む塩基エディターに接触させること;ならびに
細胞、組織、または器官をガイドポリヌクレオチドに接触させることであって、ガイドポリヌクレオチドが、少なくとも一部が上記遺伝子またはそのリバース相補鎖に位置する標的ヌクレオチド配列を標的として塩基エディターを向ける、接触させること;ならびに
標的ヌクレオチド配列を標的として塩基エディターを向けると病原性変異またはその相補的な核酸塩基を脱アミノ化することによって、上記変異を編集すること
を含み、
病原性変異またはその相補的な核酸塩基を脱アミノ化することによって、スプライシングが可能となり、それによってSDSを治療するための細胞、組織、または器官が産生される。一実施形態では、変異は遺伝子変換に起因する。別の実施形態では、シュワックマン・ダイアモンド症候群に関連する変異は、その遺伝子の終止コドンを誘発するか、またはスプライシングを変更する。別の実施形態では、シュワックマン・ダイアモンド症候群(SDS)に関連する変異は、切詰を有するSBDSポリペプチドをコードする。別の実施形態では、塩基エディターは、ミスセンス変異を導入するか、新しいスプライスアクセプター部位またはスプライスドナー部位を挿入するか、または変異を含むスプライスアクセプター部位もしくはスプライスドナー部位を修正する。別の実施形態では、本方法は、細胞、組織、または器官を対象に投与することを含む。本方法の一実施形態では、細胞、組織、または器官は、自己由来であるか、対象と同種異系または異種である。本方法の別の実施形態では、デアミナーゼドメインは、シチジンデアミナーゼドメインまたはアデノシンデアミナーゼドメインである。一実施形態では、アデノシンデアミナーゼドメインは、デオキシリボ核酸(DNA)中のアデニンを脱アミノ化することができ、シチジンデアミナーゼは、DNA中のシトシンを脱アミノ化することができる。
上述の塩基エディターシステム、または編集する方法、または治療する方法、およびその実施形態のいずれかの一実施形態では、ガイドポリヌクレオチドは、リボ核酸(RNA)またはデオキシリボ核酸(DNA)を含む。上述の塩基エディターシステム、または編集する方法、または治療する方法、およびその実施形態のいずれかの一実施形態では、ガイドポリヌクレオチドは、CRISPR RNA(crRNA)配列、トランス活性化CRISPR RNA(tracrRNA)配列、またはそれらの組合せを含み、crRNAは、SDSに関連する変更を含むSBDS核酸配列に相補的な核酸配列を含む。上述の塩基エディターシステム、または編集する方法、または治療する方法、およびその実施形態のいずれかの一実施形態では、塩基エディターシステムまたは方法は、第2のガイドポリヌクレオチドをさらに含む。一実施形態では、第2のガイドポリヌクレオチドは、リボ核酸(RNA)またはデオキシリボ核酸(DNA)を含む。別の実施形態では、第2のガイドポリヌクレオチドは、CRISPR RNA(crRNA)配列、トランス活性化CRISPR RNA(tracrRNA)配列、またはそれらの組合せを含む。上述の塩基エディターシステム、または編集する方法、または治療する方法、およびその実施形態のいずれかの一実施形態では、ポリヌクレオチドプログラマブルDNA結合ドメインは、ヌクレアーゼ活性がないかまたはニッカーゼである。上述の塩基エディターシステム、または編集する方法、または治療する方法、およびその実施形態のいずれかの一実施形態では、ポリヌクレオチドプログラマブルDNA結合ドメインは、Cas9ドメインを含む。一実施形態では、Cas9ドメインは、ヌクレアーゼ活性のないCas9(dCas9)、Cas9ニッカーゼ(nCas9)、またはヌクレアーゼ活性のCas9を含む。一実施形態では、Cas9ドメインは、Cas9ニッカーゼを含む。上述の塩基エディターシステム、または編集する方法、または治療する方法、およびその実施形態のいずれかの一実施形態では、ポリヌクレオチドプログラマブルDNA結合ドメインは、工学的に作製されるか改変されたポリヌクレオチドプログラマブルDNA結合ドメインである。上述の塩基エディターシステム、または編集する方法、または治療する方法、およびその実施形態のいずれかの一実施形態では、編集することにより、結果として20%未満のインデル形成、15%未満のインデル形成、10%未満のインデル形成、5%未満のインデル形成、4%未満のインデル形成、3%未満のインデル形成、2%未満のインデル形成、1%未満のインデル形成、0.5%未満のインデル形成、または0.1%未満のインデル形成を生じる。上述の塩基エディターシステム、または編集する方法、または治療する方法、およびその実施形態のいずれかの一実施形態では、編集することにより結果として転位を生じない。上述の塩基エディターシステム、または編集する方法、または治療する方法、およびその実施形態のいずれかの一実施形態では、塩基エディターは、SBDS遺伝子内のrs113993993 C→Tの変異を含むスプライスドナーSNP部位を修正する。
別の態様では、シュワックマン・ダイアモンド症候群(SDS)を、それを必要とする対象において治療する方法が提供され、本方法は、上述の態様およびその記述された実施形態の細胞を対象に投与することを含む。
上述の方法およびその実施形態、上述の細胞およびその実施形態、または上述の塩基エディターシステムおよびその実施形態、または編集、治療、細胞や組織などを産生する上述の方法およびその実施形態のうちいずれかの一実施形態では、塩基エディターならびに/またはその構成成分は、mRNAによってコードされる。上述の方法およびその実施形態、上述の細胞およびその実施形態、または上述の塩基エディターシステムおよびその実施形態、または編集、治療、細胞や組織などを産生する上述の方法およびその実施形態のうちいずれかの別の実施形態では、請求項126~157のいずれか1項に記載の塩基エディターシステムまたは方法であって、塩基エディターは、SBDS核酸配列に相補的な核酸配列を含む単一ガイドRNA(sgRNA)との複合体の状態にある。一実施形態では、sgRNAは、SBDS核酸配列に相補的な少なくとも10個の隣接したヌクレオチドを含む核酸配列を含む。別の実施形態では、sgRNAは、SBDS核酸配列に相補的な15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、または40個の隣接したヌクレオチドを含む核酸配列を含む。別の実施形態では、sgRNAは、SBDS核酸配列に相補的な18、19、または20個の隣接したヌクレオチドを含む核酸配列を含む。
別の態様では、ガイドRNAに結合している塩基エディターを含む組成物が提供され、ガイドRNAは、シュワックマン・ダイアモンド症候群(SDS)に関連するSBDS遺伝子に相補的な核酸配列を含む。一実施形態では、塩基エディターは、アデノシンデアミナーゼまたはシチジンデアミナーゼを含む。一実施形態では、アデノシンデアミナーゼは、デオキシリボ核酸(DNA)中のアデノシンを脱アミノ化することができる。一実施形態では、アデノシンデアミナーゼは、TadA*7.10、TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23、またはTadA*8.24のうち1つまたは複数から選択されるTadAデアミナーゼである。一実施形態では、シチジンデアミナーゼは、デオキシリボ核酸(DNA)中のシチジンを脱アミノ化することができる。別の実施形態では、シチジンデアミナーゼは、APOBEC、A3F、またはその誘導体である。組成物の一実施形態では、塩基エディターは、
(i)Cas9ニッカーゼを含み;
(ii)ヌクレアーゼ不活性のCas9を含み;
(iii)図3A~3Cもしくは図10に示されるアミノ酸置換の組合せを含むSpCas9バリアントを含み;
(iv)以下から選択されるアミノ酸配列置換の組合せを含むSpCas9バリアントを含み:
D1135M、S1136Q、G1218K、E1219F、A1322R、D1332、R1335E、およびT1337R(224 SpCas9);D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、およびT1337R(225 SpCas9);
D1135M、S1136Q、G1218K、E1219F、A1322R、D1332K、R1335E、およびT1337R(226 SpCas9);
D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、およびT1337Q(227 Cas9);
D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335Q、およびT1337Q(230 SpCas9);
D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335D、およびT1337Q(235 SpCas9);D1135Q、S1136、G1218T、E1219W、A1322R、D1332、R1335N、およびT1337(237 SpCas9);D1135H、S1136、G1218S、E1219W、A1322R、D1332、R1335V、およびT1337(242 SpCas9);D1135C、S1136W、G1218N、E1219W、A1322R、D1332、R1335N、およびT1337(244 SpCas9);D113LM、S1136W、G1218R、E1219S、A1322R、D1332、R1335E、およびT1337(245 SpCas9);D1135G、S1136W、G1218S、E1219M、A1322R、D1332、R1335Q、およびT1337R(259 SpCas9);L111R、D1135V、S1136Q、G1218K、E1219F、A1322R、D1332、R1335A、およびT1337R(Nureki SpCas9);D1135M、S1136、S1216G、G1218、E1219、A1322、D1332A、R1335Q、およびT1337(NGCRd1 SpCas9);または
D1135G、S1136、S1216G、G1218、E1219、A1322R、D1332A、R1335E、およびT1337R(267 (NGC Rd2 SpCas9)。
(v)UGIドメインを含まず;ならびに/または
(vi)BE4、rAPOBEC1、PpAPOBEC1、H122A置換を含有するPpAPOBEC1、AmAPOBEC1、SsAPOBEC2、RrA3F、F130L置換を含有するRrA3F、APOBEC-1がrAPOBEC1の配列に置き換えられたBE4のバリアント、APOBEC-1がAmAPOBEC1の配列に置き換えられたBE4のバリアント、APOBEC-1がSsAPOBEC2の配列に置き換えられたBE4のバリアント、APOBEC-1がPpAPOBEC1の配列に置き換えられたBE4のバリアント、もしくはAPOBEC-1がH122A置換を含有するPpAPOBEC1の配列に置き換えられたBE4のバリアントから選択される、シチジンデアミナーゼを含む。組成物の一実施形態では、(vi)では、H122A置換を含有するPpAPOBEC1、またはAPOBEC-1がH122A置換を含有するPpAPOBEC1の配列に置き換えられたBE4のバリアントは、R33A、W90F、K34A、R52A、H121A、またはY120Fから選択される1つまたは複数のアミノ酸変異をさらに含む。一実施形態では、組成物は、医薬的に許容可能な賦形剤、希釈剤、または担体をさらに含む。
別の態様では、シュワックマン・ダイアモンド症候群(SDS)の治療のための医薬組成物が提供され、医薬組成物は、上述の態様および実施形態の組成物を含み、医薬的に許容可能な賦形剤、希釈剤、または担体を含む。医薬組成物の一実施形態では、gRNAおよび塩基エディターは、共にまたは別々に製剤化される。医薬組成物の一実施形態では、gRNAは、以下のうち1つまたは複数から選択される5’から3’までの核酸配列またはその1、2、3、4、もしくは5個のヌクレオチドの5’切詰断片を含む:
GCGGGUAACAGCUGCAGCAU;UGUAAAUGUUUCCUAAGGUC;AAUGUUUCCUAAGGUCAGGU、GCAGGCGGGUAACAGCUGC、CAGGCGGGUAACAGCUGC、AGGCGGGUAACAGCUGC、およびAAGCAGGCGGGUAACAGCUGC。一実施形態では、医薬組成物は、哺乳類細胞での発現に適したベクターをさらに含み、ベクターは、塩基エディターをコードするポリヌクレオチドを含む。医薬組成物の一実施形態では、塩基エディターをコードするポリヌクレオチドはmRNAである。医薬組成物の一実施形態では、ベクターはウイルスベクターである。一実施形態では、ウイルスベクターは、レトロウイルスベクター、アデノウイルスベクター、レンチウイルスベクター、ヘルペスウイルスベクター、またはアデノ随伴ウイルスベクター(AAV)である。一実施形態では、医薬組成物は、哺乳類細胞での発現に適したリボ核粒子をさらに含む。
一態様では、(i)塩基エディターをコードする核酸と;(ii)上述の態様のガイドRNAであって、例えば以下のうち1つまたは複数から選択される5’から3’までの核酸配列またはその1、2、3、4、もしくは5個のヌクレオチドの5’切詰断片を含むガイドRNAなどとを含む、医薬組成物が提供される:GUAAGCAGGCGGGUAACAGC;AGCAGGCGGGUAACAGCUGC;GCGGGUAACAGCUGCAGCAU;UGUAAAUGUUUCCUAAGGUC;AAUGUUUCCUAAGGUCAGGU、GCAGGCGGGUAACAGCUGC、CAGGCGGGUAACAGCUGC、AGGCGGGUAACAGCUGC、およびAAGCAGGCGGGUAACAGCUGC。上述の態様またはその実施形態のいずれかの医薬組成物の一実施形態では、医薬組成物は脂質をさらに含む。
一態様では、シュワックマン・ダイアモンド症候群(SDS)を治療する方法が提供され、本方法は、上述の態様およびその実施形態のいずれかの医薬組成物を、それを必要とする対象に投与することを含む。
一態様では、対象でのシュワックマン・ダイアモンド症候群(SDS)の治療における上述の態様およびその実施形態のいずれかの医薬組成物の使用が提供される。使用の一実施形態では、対象はヒトである。
定義
以下の定義は当技術分野のそれを補うものであり、本願に向けられており、任意の関連または無関連の案件、例えば、任意の共同所有の特許または出願に帰属されるものではない。本明細書に記載されるものに類似のまたは等しい任意の方法および材料を、本開示を試すために実践に用いることができるが、好適な材料および方法が本明細書に記載される。したがって、本明細書に用いられる用語は、具体的な実施形態を記載することのみを目的としており、限定することを意図されていない。
別段に定義されない限り、本明細書に用いられる全ての技術用語および科学用語は、本明細書の属する技術分野の当業者に一般に理解されている意味を有する。以下の参照文献は、本発明に用いられる数多くの用語の一般的な定義を当業者に与える:Singleton et al., Dictionary of Microbiology and Molecular Biology (2nd ed. 1994);The Cambridge Dictionary of Science and Technology (Walker ed., 1988);The Glossary of Genetics, 5th Ed., R. Rieger et al. (eds.), Springer Verlag (1991);およびHale & Marham, The Harper Collins Dictionary of Biology (1991)。本明細書に用いられるように、以下の用語は、別段に指定のない限り下記に帰する意味を有する。
本願では、別段に具体的な記述のない限り、単数形の使用は複数形を含む。なお、本明細書に用いられる際に、単数形「a」、「an」、および「the」は、別段にコンテクストが明確に記述しない限り、複数形の言及を含む。本願では、「または」の使用は、別段に記述のない限り「および/または」を意味する。さらに、用語「含むこと(including)」ならびに他の形式、例えば「含む(include)」、「含む(includes)」、および「含まれる(included)」の使用は限定的ではない。
本明細書および特許請求の範囲に用いられる際に、文言「含むこと(comprising)」(および含むことの任意の形、例えば「含む(comprise)」および「含む(comprises)」など)、「有すること(having)」(および有することの任意の形、例えば「有する(have)」および「有する(has)」など)、「含むこと(including)」(および含むことの任意の形、例えば「含む(includes)」および「含む(include)」など、または「含有すること(containing)」(および含有することの任意の形、例えば「含有する(contains)」および「含有する(contain)」など)は、包括的またはオープンエンドであり、追加の記載されていない要素または方法ステップを除外しない。本明細書に論じられた任意の実施形態が本開示の任意の方法または組成物に関して実行され得、その逆もまたあり得ることが考えられる。さらに、本開示の組成物を用いて、本開示の方法を実現することができる。
用語「約」または「およそ」とは、当業者によって決定される場合の特定の値について許容可能な誤差範囲内を意味し、その範囲は、その値がどのように測定または決定されたか、すなわち測定システムの限界に、部分的に依存するものとなる。例えば、「約」とは、当技術分野の実践あたり1以内または1を超える標準偏差を意味し得る。あるいは、「約」とは、所与の値の最大20%、最大10%、最大5%、または最大1%の範囲を意味し得る。あるいは、具体的には生物学的なシステムまたはプロセスに関して、この用語は、ある値の1桁以内、例えば5倍以内、2倍以内を意味し得る。具体的な値が本願または特許請求の範囲に記載される場合、別段に記述のない限り、用語「約」とは、その具体的な値について許容可能な誤差範囲内を意味するものと考えられるべきである。
本明細書における「一部の実施形態」、「実施形態」、「一実施形態」、または「他の実施形態」への言及は、その実施形態と関連して記載されるある具体的な特色、構造、または特徴が本開示の少なくともいくつかの実施形態に含まれるが必ずしも全ての実施形態を含む訳ではないことを意味する。
「アデノシンデアミナーゼ」とは、アデニンまたはアデノシンの加水分解性脱アミノ化を触媒することができるポリペプチドまたはその断片を意味する。一部の実施形態では、デアミナーゼまたはデアミナーゼドメインは、アデノシンからイノシンまたはデオキシアデノシンからデオキシイノシンへの加水分解性脱アミノ化を触媒するアデノシンデアミナーゼである。一部の実施形態では、アデノシンデアミナーゼは、デオキシリボ核酸(DNA)中のアデニンまたはアデノシンの加水分解性脱アミノ化を触媒する。本明細書に示されるアデノシンデアミナーゼ(例えば、工学的に改変されたアデノシンデアミナーゼ、進化型アデノシンデアミナーゼ)は、細菌などのどの生物に由来していてもよい。
一部の実施形態では、デアミナーゼまたはデアミナーゼドメインは、生物由来の天然のデアミナーゼのバリアントである。一部の実施形態では、デアミナーゼまたはデアミナーゼドメインは、天然に発生しない。例えば、一部の実施形態では、デアミナーゼまたはデアミナーゼドメインは、天然のデアミナーゼに少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一である。一部の実施形態では、アデノシンデアミナーゼは、大腸菌、スタフィロコッカス・アウレウス、サルモネラ・ティフィムリウム、シェワネラ・プトレファシエンス、ヘモフィルス・インフルエンザ、またはカウロバクター・クレセンタスなどの細菌由来である。一部の実施形態では、アデノシンデアミナーゼはTadAデアミナーゼである。一部の実施形態では、TadAデアミナーゼは、大腸菌TadA(ecTadA)デアミナーゼまたはその断片である。
一部の実施形態では、アデノシンデアミナーゼは、以下の配列内の変更を含む:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
(TadA*7.10とも称する)。
一部の実施形態では、TadA*7.10は、アミノ酸82または166での変更を含む。具体的な実施形態では、上記の参照配列のバリアントは、下記の変更のうち1つまたは複数を含む:Y147T、Y147R、Q154S、Y123H、V82S、T166R、およびQ154R。変更Y123Hとは、Y123H TadA(野生型)に戻ったTadA*7.10内の変更H123Yを指す。他の実施形態では、TadA*7.10配列のバリアントは、Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y147T+Q154R;Y147T+Q154S;V82S+Q154S;およびY123H+Y147R+Q154R+I76Yからなる群から選択される変更の組合せを含む。
他の実施形態では、本発明は、欠失を含むアデノシンデアミナーゼバリアント、例えば、残基149、150、151、152、153、154、155、156、または157で始まるC末端の欠失を含むTadA*8を提供する。他の実施形態では、アデノシンデアミナーゼバリアントは、以下の変更のうち1つまたは複数を含むTadA単量体(例えばTadA*8)である:Y147T、Y147R、Q154S、Y123H、V82S、T166R、Q154R。他の実施形態では、アデノシンデアミナーゼバリアントは、以下の変更を含む単量体である:Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y147T+Q154R;Y147T+Q154S;V82S+Q154S;およびY123H+Y147R+Q154R+I76Y。さらに他の実施形態では、アデノシンデアミナーゼバリアントは、2つのアデノシンデアミナーゼドメインを含むホモ二量体であって、各ドメインは、1つまたは複数の以下の変更を有する:Y147T、Y147R、Q154S、Y123H、V82S、T166R、Q154R。他の実施形態では、アデノシンデアミナーゼバリアントは、野生型アデノシンデアミナーゼドメインまたはTadA*7.10ドメインと、1つまたは複数の以下の変更を含むTadA*7.10のアデノシンデアミナーゼバリアントドメイン(例えば、TadA*8)とを含む、ヘテロ二量体である:Y147T、Y147R、Q154S、Y123H、V82S、T166R、Q154R。他の実施形態では、アデノシンデアミナーゼバリアントは、TadA*7.10ドメインと、以下の変更を含むTadA*7.10のアデノシンデアミナーゼバリアント(例えば、TadA*8)とを含む、ヘテロ二量体である:Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y147T+Q154R;Y147T+Q154S;V82S+Q154S;およびY123H+Y147R+Q154R+I76Y。
一実施形態では、アデノシンデアミナーゼは、アデノシンデアミナーゼ活性を有する以下の配列またはその断片を含むかまたはそれから実質的になるTadA*8である:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD。
一部の実施形態では、TadA*8は切詰型である。一部の実施形態では、切詰型TadA*8は、完全長TadA*8に比べて1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のN末端アミノ酸残基を欠いている。一部の実施形態では、切詰型TadA*8は、完全長TadA*8に比べて1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のC末端アミノ酸残基を欠いている。一部の実施形態では、アデノシンデアミナーゼバリアントは完全長TadA*8である。
具体的な実施形態では、アデノシンデアミナーゼヘテロ二量体は、TadA*8ドメインと以下のうち1つから選択されるアデノシンデアミナーゼドメインとを含む:
スタフィロコッカス・アウレウス(S.アウレウス)TadA:
MGSHMTNDIYFMTLAIEEAKKAAQLGEVPIGAIITKDDEVIARAHNLRETLQQPTAH AEHIAIERAAKVLGSWRLEGCTLYVTLEPCVMCAGTIVMSRIPRVVYGADDPKGGCSGS LMNLLQQSNFNHRAIVDKGVLKEACSTLLTTFFKNLRANKKSTN
バチルス・サブチルス(B.サブチルス)TadA:
MTQDELYMKEAIKEAKKAEEKGEVPIGAVLVINGEIIARAHNLRETEQRSIAHAEML VIDEACKALGTWRLEGATLYVTLEPCPMCAGAVVLSRVEKVVFGAFDPKGGCSGTLMN LLQEERFNHQAEVVSGVLEEECGGMLSAFFRELRKKKKAARKNLSE
サルモネラ・ティフィムリウム(S.ティフィムリウム)TadA:
MPPAFITGVTSLSDVELDHEYWMRHALTLAKRAWDEREVPVGAVLVHNHRVIGEG WNRPIGRHDPTAHAEIMALRQGGLVLQNYRLLDTTLYVTLEPCVMCAGAMVHSRIG RVVFGARDAKTGAAGSLIDVLHHPGMNHRVEIIEGVLRDECATLLSDFFRMRRQEIK ALKKADRAEGAGPAV
シェワネラ・プトレファシエンス(S.プトレファシエンス)TadA:
MDEYWMQVAMQMAEKAEAAGEVPVGAVLVKDGQQIATGYNLSISQHDPTAHAEI LCLRSAGKKLENYRLLDATLYITLEPCAMCAGAMVHSRIARVVYGARDEKTGAAGT VVNLLQHPAFNHQVEVTSGVLAEACSAQLSRFFKRRRDEKKALKLAQRAQQGIE
ヘモフィルス・インフルエンザF3031(H.インフルエンザ)TadA:
MDAAKVRSEFDEKMMRYALELADKAEALGEIPVGAVLVDDARNIIGEGWNLSIVQSDPTΑΗ AEIIALRNGAKNIQNYRLLNSTLYVTLEPCTMCAGAILHSRIKRLVFGASDYK TGAIGSRFHFFDDYKMNHTLEITSGVLAEECSQKLSTFFQKRREEKKIEKALLKSLSDK
カウロバクター・クレセンタス(C.クレセンタス)TadA:
MRTDESEDQDHRMMRLALDAARAAAEAGETPVGAVILDPSTGEVIATAGNGPIAAH DPTAHAEIAAMRAAAAKLGNYRLTDLTLVVTLEPCAMCAGAISHARIGRVVFGADD PKGGAVVHGPKFFAQPTCHWRPEVTGGVLADESADLLRGFFRARRKAKI
ジオバクター・スルフレデュセンス(G.スルフレデュセンス)TadA:
MSSLKKTPIRDDAYWMGKAIREAAKAAARDEVPIGAVIVRDGAVIGRGHNLREGSN DPSAHAEMIAIRQAARRSANWRLTGATLYVTLEPCLMCMGAIILARLERVVFGCYDP KGGAAGSLYDLSADPRLNHQVRLSPGVCQEECGTMLSDFFRDLRRRKKAKATPALF IDERKVPPEP
TadA*7.10
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD.
「投与すること」とは、本明細書では、本明細書に記載される1つまたは複数の組成物を患者または対象に与えることと呼ばれる。例としておよび限定はないが、組成物の投与、例えば注射は、静脈内(i.v.)注射、皮下(s.c.)注射、皮内(i.d.)注射、腹腔内(i.p.)注射、または筋肉内(i.m.)注射により実施することができる。1つまたは複数のそのような経路を採用することができる。非経口投与は、例えば、ボーラス注射によって、または経時的な漸次灌流によって行うことができる。あるいは、または同時に、投与を経口により行うことができる。
「剤」とは、任意の低分子化合物、抗体、核酸分子、またはポリペプチド、またはそれらの断片を意味する。
「変更」とは、本明細書に記載されるものなど標準的な技術の公知の方法によって検出される際の遺伝子またはポリペプチドの配列、発現レベル、または活性の変化(増加または減少)を意味する。本明細書に用いられるように、変更は、10%の発現レベルの変化、25%の変化、40%の変化、および50%以上の発現レベルの変化を含む。
「寛解する」とは、疾患の発達または進行を減少、抑制、減弱、漸減、抑止、または安定化することを意味する。
「類似体」とは、同一でないが類似の機能的または構造的な特性を有する分子を意味する。例えば、ポリペプチド類似体は、対応する天然のポリペプチドの生物活性を保持するとともに、天然のポリペプチドに比べてその類似体の機能を増強するある特定の生化学的な修飾を有する。そのような生化学的な修飾は、類似体のプロテアーゼ抵抗性、膜透過性、または半減期を、例えばリガンド結合を変えることなく増加し得る。類似体は非天然アミノ酸を含むことがある。
「塩基エディター(BE)」または「核酸塩基エディター(NBE)」とは、ポリヌクレオチドに結合して核酸塩基修飾活性を有する剤を意味する。様々な実施形態では、塩基エディターは、核酸塩基修飾ポリペプチド(例えばデアミナーゼ)と、ガイドポリヌクレオチド(例えばガイドRNA)と連係するポリヌクレオチドプログラマブルヌクレオチド結合ドメインとを含む。様々な実施形態では、上記剤は、塩基編集活性を有するタンパク質ドメイン、すなわち、核酸分子(例えばDNA)内で塩基(例えばA、T、C、G、またはU)を修飾することができるドメインを含む、生体分子複合体である。一部の実施形態では、ポリヌクレオチドプログラマブルDNA結合ドメインは、デアミナーゼドメインに融合または連結されている。一実施形態では、上記剤は、塩基編集活性を有する1つまたは複数のドメインを含む融合タンパク質である。別の実施形態では、塩基編集活性を有するタンパク質ドメインは、ガイドRNAに(例えば、ガイドRNA上のRNA結合モチーフおよびデアミナーゼに融合されたRNA結合ドメインを介して)連結される。一部の実施形態では、塩基編集活性を有するドメインは、核酸分子内の塩基を脱アミノ化することができる。一部の実施形態では、塩基エディターは、DNA分子内の1つまたは複数の塩基を脱アミノ化することができる。一部の実施形態では、塩基エディターは、DNA内のシトシン(C)またはアデノシン(A)を脱アミノ化することができる。一部の実施形態では、塩基エディターは、DNA内のシトシン(C)およびアデノシン(A)を脱アミノ化することができる。一部の実施形態では、塩基エディターはシチジン塩基エディター(CBE)である。一部の実施形態では、塩基エディターはアデノシン塩基エディター(ABE)である。一部の実施形態では、塩基エディターは、アデノシン塩基エディター(ABE)およびシチジン塩基エディター(CBE)である。一部の実施形態では、塩基エディターは、アデノシンデアミナーゼに融合されたヌクレアーゼ不活性のCas9(dCas9)である。一部の実施形態では、Cas9は、循環置換体Cas9(例えば、spCas9またはsaCas9)である。循環置換体Cas9は、当技術分野に公知であり、例えばOakes et al., Cell 176, 254-267, 2019に記載されている。一部の実施形態では、塩基エディターは、塩基除去修復の阻害物質、例えば、UGIドメインまたはdISNドメインに融合されている。一部の実施形態では、融合タンパク質は、デアミナーゼに融合されたCas9ニッカーゼと、UGIまたはdISNドメインなどの塩基除去修復の阻害物質とを含む。他の実施形態では、塩基エディターは、脱塩基性塩基エディターである。
一部の実施形態では、アデノシンデアミナーゼは、TadAからの進化型である。一部の実施形態では、ポリヌクレオチドプログラマブルDNA結合ドメインは、CRISPR関連(例えばCasまたはCpf1)酵素である。一部の実施形態では、塩基エディターは、デアミナーゼドメインに融合された触媒として活性のないCas9(dCas9)である。一部の実施形態では、塩基エディターは、デアミナーゼドメインに融合されたCas9ニッカーゼ(nCas9)である。一部の実施形態では、塩基エディターは、塩基除去修復(BER)の阻害物質に融合されている。一部の実施形態では、塩基除去修復の阻害物質は、ウラシルDNAグリコシラーゼ阻害物質(UGI)である。一部の実施形態では、塩基除去修復の阻害物質は、イノシン塩基除去修復の阻害物質である。塩基エディターの詳細は、国際PCT出願PCT/2017/045381(WO2018/027078)およびPCT/US2016/058344(WO2017/070632)に記載されており、そのどちらも本明細書に参照によりその全体が組み込まれている。また、全ての内容が参照によりここに組み込まれるKomor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016);Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017);Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017)、およびRees, H.A., et al., “Base editing: precision chemistry on the genome and transcriptome of living cells.” Nat Rev Genet. 2018 Dec;19(12):770-788. doi: 10.1038/s41576-018-0059-1も参照されたい。
一部の実施形態では、塩基エディター(例えばABE8)は、循環置換体Cas9(例えばspCAS9)と二分核定位配列とを含むスキャフォールド内にアデノシンデアミナーゼバリアント(例えばTadA*8)をクローニングすることによって生成される。循環置換体Cas9sは、当技術分野に公知であり、例えばOakes et al., Cell 176, 254-267, 2019に記載されている。例示的な循環置換体配列は下記に記載されるが、ボールド体の配列がCas9由来の配列を標示し、イタリック体の配列がリンカー配列を示し、下線部の配列が二分核定位配列を示す。
CP5(MSP「NGC=変異を含むPamバリアント 通常のCas9はNGGを選好」PID=タンパク質相互作用ドメインおよび「D10A」ニッカーゼ):
Figure 2022545950000002
一部の実施形態では、ABE8は、下記の表7由来の塩基エディターから選択される。一部の実施形態では、ABE8は、TadAからの進化型であるアデノシンデアミナーゼを含有する。一部の実施形態では、ABE8のアデノシンデアミナーゼバリアントは、下記の表7に記載されるようなTadA*8バリアントである。一部の実施形態では、アデノシンデアミナーゼバリアントは、Y147T、Y147R、Q154S、Y123H、V82S、T166R、Q154Rからなる群から選択される変更の1つまたは複数を含むTadA*7.10である。様々な実施形態では、ABE8は、Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y147T+Q154R;Y147T+Q154S;V82S+Q154S;およびY123H+Y147R+Q154R+I76Yからなる群から選択される変更を有するTadA*7.10を含む。一部の実施形態では、ABE8は単量体構築物である。
一部の実施形態では、ABE8はヘテロ二量体構築物である。一部の実施形態では、ABE8塩基エディターは以下の配列を含む:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD
例として、本明細書に記載される塩基編集組成物、システム、および方法に用いられるアデニン塩基エディターABEは、下記に記載されるように核酸配列(8877塩基対)を有する(Addgene, Watertown, MA.; Gaudelli NM, et al., Nature. 2017 Nov 23;551(7681):464-471. doi: 10.1038/nature24644;Koblan LW, et al., Nat Biotechnol. 2018 Oct;36(9):843-846. doi: 10.1038/nbt.4172)。ABE核酸配列と少なくとも95%以上の同一性を有するポリヌクレオチド配列も包含される。
ATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACAT
GACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGG
TTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTG
ACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCC
ATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACCGT
CAGATCCGCTAGAGATCCGCGGCCGCTAATACGACTCACTATAGGGAGAGCCGCCACCATGAAACGGACA
GCCGACGGAAGCGAGTTCGAGTCACCAAAGAAGAAGCGGAAAGTCTCTGAAGTCGAGTTTAGCCACGAGT
ATTGGATGAGGCACGCACTGACCCTGGCAAAGCGAGCATGGGATGAAAGAGAAGTCCCCGTGGGCGCCGT
GCTGGTGCACAACAATAGAGTGATCGGAGAGGGATGGAACAGGCCAATCGGCCGCCACGACCCTACCGCA
CACGCAGAGATCATGGCACTGAGGCAGGGAGGCCTGGTCATGCAGAATTACCGCCTGATCGATGCCACCC
TGTATGTGACACTGGAGCCATGCGTGATGTGCGCAGGAGCAATGATCCACAGCAGGATCGGAAGAGTGGT
GTTCGGAGCACGGGACGCCAAGACCGGCGCAGCAGGCTCCCTGATGGATGTGCTGCACCACCCCGGCATG
AACCACCGGGTGGAGATCACAGAGGGAATCCTGGCAGACGAGTGCGCCGCCCTGCTGAGCGATTTCTTTA
GAATGCGGAGACAGGAGATCAAGGCCCAGAAGAAGGCACAGAGCTCCACCGACTCTGGAGGATCTAGCGG
AGGATCCTCTGGAAGCGAGACACCAGGCACAAGCGAGTCCGCCACACCAGAGAGCTCCGGCGGCTCCTCC
GGAGGATCCTCTGAGGTGGAGTTTTCCCACGAGTACTGGATGAGACATGCCCTGACCCTGGCCAAGAGGG
CACGCGATGAGAGGGAGGTGCCTGTGGGAGCCGTGCTGGTGCTGAACAATAGAGTGATCGGCGAGGGCTG
GAACAGAGCCATCGGCCTGCACGACCCAACAGCCCATGCCGAAATTATGGCCCTGAGACAGGGCGGCCTG
GTCATGCAGAACTACAGACTGATTGACGCCACCCTGTACGTGACATTCGAGCCTTGCGTGATGTGCGCCG
GCGCCATGATCCACTCTAGGATCGGCCGCGTGGTGTTTGGCGTGAGGAACGCAAAAACCGGCGCCGCAGG
CTCCCTGATGGACGTGCTGCACTACCCCGGCATGAATCACCGCGTCGAAATTACCGAGGGAATCCTGGCA
GATGAATGTGCCGCCCTGCTGTGCTATTTCTTTCGGATGCCTAGACAGGTGTTCAATGCTCAGAAGAAGG
CCCAGAGCTCCACCGACTCCGGAGGATCTAGCGGAGGCTCCTCTGGCTCTGAGACACCTGGCACAAGCGA
GAGCGCAACACCTGAAAGCAGCGGGGGCAGCAGCGGGGGGTCAGACAAGAAGTACAGCATCGGCCTGGCC
ATCGGCACCAACTCTGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGG
TGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGAGCCCTGCTGTTCGACAGCGGCGA
AACAGCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAGAACCGGATCTGC
TATCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGT
CCTTCCTGGTGGAAGAGGATAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGACGAGGTGGC
CTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGAC
CTGCGGCTGATCTATCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACC
TGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGA
GGAAAACCCCATCAACGCCAGCGGCGTGGACGCCAAGGCCATCCTGTCTGCCAGACTGAGCAAGAGCAGA
CGGCTGGAAAATCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAATGGCCTGTTCGGAAACCTGATTGCCC
TGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAG
CAAGGACACCTACGACGACGACCTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTT
CTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGACATCCTGAGAGTGAACACCGAGATCACCA
AGGCCCCCCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGACCTGACCCTGCTGAAAGC
TCTCGTGCGGCAGCAGCTGCCTGAGAAGTACAAAGAGATTTTCTTCGACCAGAGCAAGAACGGCTACGCC
GGCTACATTGACGGCGGAGCCAGCCAGGAAGAGTTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGG
ACGGCACCGAGGAACTGCTCGTGAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAA
CGGCAGCATCCCCCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGCGGCAGGAAGATTTTTAC
CCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCCGCATCCCCTACTACGTGGGCC
CTCTGGCCAGGGGAAACAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACCCCCTGGAA
CTTCGAGGAAGTGGTGGACAAGGGCGCTTCCGCCCAGAGCTTCATCGAGCGGATGACCAACTTCGATAAG
AACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTATAACGAGC
TGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTCCTGAGCGGCGAGCAGAAAAAGGC
CATCGTGGACCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAG
AAAATCGAGTGCTTCGACTCCGTGGAAATCTCCGGCGTGGAAGATCGGTTCAACGCCTCCCTGGGCACAT
ACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAATGAGGAAAACGAGGACATTCTGGA
AGATATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACCTATGCC
CACCTGTTCGACGACAAAGTGATGAAGCAGCTGAAGCGGCGGAGATACACCGGCTGGGGCAGGCTGAGCC
GGAAGCTGATCAACGGCATCCGGGACAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGG
CTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAA
GCCCAGGTGTCCGGCCAGGGCGATAGCCTGCACGAGCACATTGCCAATCTGGCCGGCAGCCCCGCCATTA
AGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTCGTGAAAGTGATGGGCCGGCACAAGCCCGA
GAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACCCAGAAGGGACAGAAGAACAGCCGCGAGAGA
ATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACA
CCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGGCGGGATATGTACGTGGACCAGGA
ACTGGACATCAACCGGCTGTCCGACTACGATGTGGACCATATCGTGCCTCAGAGCTTTCTGAAGGACGAC
TCCATCGACAACAAGGTGCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCTCCGAAG
AGGTCGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATTACCCAGAGAAAGTT
CGACAATCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAG
CTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATCCTGGACTCCCGGATGAACACTAAGTACG
ACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTGATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCG
GAAGGATTTCCAGTTTTACAAAGTGCGCGAGATCAACAACTACCACCACGCCCACGACGCCTACCTGAAC
GCCGTCGTGGGAACCGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACA
AGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAAATCGGCAAGGCTACCGCCAAGTACTT
CTTCTACAGCAACATCATGAACTTTTTCAAGACCGAGATTACCCTGGCCAACGGCGAGATCCGGAAGCGG
CCTCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCCGGGATTTTGCCACCGTGC
GGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAAAAGACCGAGGTGCAGACAGGCGGCTTCAGCAA
AGAGTCTATCCTGCCCAAGAGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAG
TACGGCGGCTTCGACAGCCCCACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGT
CCAAGAAACTGAAGAGTGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAA
TCCCATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTGCCTAAG
TACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCCGGCGAACTGCAGAAGGGAA
ACGAACTGGCCCTGCCCTCCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGG
CTCCCCCGAGGATAATGAGCAGAAACAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATC
GAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAATCTGGACAAAGTGCTGTCCGCCT
ACAACAAGCACCGGGATAAGCCCATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAA
TCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAA
GAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTC
AGCTGGGAGGTGACTCTGGCGGCTCAAAAAGAACCGCCGACGGCAGCGAATTCGAGCCCAAGAAGAAGAG
GAAAGTCTAACCGGTCATCATCACCATCACCATTGAGTTTAAACCCGCTGATCAGCCTCGACTGTGCCTT
CTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCAC
TGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGT
GGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCT
CTATGGCTTCTGAGGCGGAAAGAACCAGCTGGGGCTCGATACCGTCGACCTCTAGCTAGAGCTTGGCGTA
ATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGA
AGCATAAAGTGTAAAGCCTAGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGC
CCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGG
TTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGA
GCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACA
TGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCT
CCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAA
AGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGAT
ACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTC
GGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTA
TCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTA
ACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTA
CACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGC
TCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCA
GAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACACTCAGTGGAACGAAAACTC
ACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGA
AGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGG
CACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTAC
GATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCA
GATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCT
CCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGT
TGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCC
CAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGA
TCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTAC
TGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGT
ATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAA
AAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAG
TTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGA
GCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATAC
TCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATG
TATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCGACGGA
TCGGGAGATCGATCTCCCGATCCCCTAGGGTCGACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAA
GCCAGTATCTGCTCCCTGCTTGTGTGTTGGAGGTCGCTGAGTAGTGCGCGAGCAAAATTTAAGCTACAAC
AAGGCAAGGCTTGACCGACAATTGCATGAAGAATCTGCTTAGGGTTAGGCGTTTTGCGCTGCTTCGCGAT
GTACGGGCCAGATATACGCGTTGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCAT
TAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCC
CAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCAT
TGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATC
例として、本明細書に記載される塩基編集組成物、システム、および方法に用いられるシチジン塩基エディター(CBE)は、下記に記載されるように以下の核酸配列(8877塩基対)を有する(Addgene, Watertown, MA.; Komor AC, et al., 2017, Sci Adv., 30;3(8):eaao4774. doi: 10.1126/sciadv.aao4774)。BE4核酸配列と少なくとも95%以上の同一性を有するポリヌクレオチド配列も包含される。
1 ATATGCCAAG TACGCCCCCT ATTGACGTCA ATGACGGTAA ATGGCCCGCC TGGCATTATG
61 CCCAGTACAT GACCTTATGG GACTTTCCTA CTTGGCAGTA CATCTACGTA TTAGTCATCG
121 CTATTACCAT GGTGATGCGG TTTTGGCAGT ACATCAATGG GCGTGGATAG CGGTTTGACT
181 CACGGGGATT TCCAAGTCTC CACCCCATTG ACGTCAATGG GAGTTTGTTT TGGCACCAAA
241 ATCAACGGGA CTTTCCAAAA TGTCGTAACA ACTCCGCCCC ATTGACGCAA ATGGGCGGTA
301 GGCGTGTACG GTGGGAGGTC TATATAAGCA GAGCTGGTTT AGTGAACCGT CAGATCCGCT
361 AGAGATCCGC GGCCGCTAAT ACGACTCACT ATAGGGAGAG CCGCCACCAT GAGCTCAGAG
421 ACTGGCCCAG TGGCTGTGGA CCCCACATTG AGACGGCGGA TCGAGCCCCA TGAGTTTGAG
481 GTATTCTTCG ATCCGAGAGA GCTCCGCAAG GAGACCTGCC TGCTTTACGA AATTAATTGG
541 GGGGGCCGGC ACTCCATTTG GCGACATACA TCACAGAACA CTAACAAGCA CGTCGAAGTC
601 AACTTCATCG AGAAGTTCAC GACAGAAAGA TATTTCTGTC CGAACACAAG GTGCAGCATT
661 ACCTGGTTTC TCAGCTGGAG CCCATGCGGC GAATGTAGTA GGGCCATCAC TGAATTCCTG
721 TCAAGGTATC CCCACGTCAC TCTGTTTATT TACATCGCAA GGCTGTACCA CCACGCTGAC
781 CCCCGCAATC GACAAGGCCT GCGGGATTTG ATCTCTTCAG GTGTGACTAT CCAAATTATG
841 ACTGAGCAGG AGTCAGGATA CTGCTGGAGA AACTTTGTGA ATTATAGCCC GAGTAATGAA
901 GCCCACTGGC CTAGGTATCC CCATCTGTGG GTACGACTGT ACGTTCTTGA ACTGTACTGC
961 ATCATACTGG GCCTGCCTCC TTGTCTCAAC ATTCTGAGAA GGAAGCAGCC ACAGCTGACA
1021 TTCTTTACCA TCGCTCTTCA GTCTTGTCAT TACCAGCGAC TGCCCCCACA CATTCTCTGG
1081 GCCACCGGGT TGAAATCTGG TGGTTCTTCT GGTGGTTCTA GCGGCAGCGA GACTCCCGGG
1141 ACCTCAGAGT CCGCCACACC CGAAAGTTCT GGTGGTTCTT CTGGTGGTTC TGATAAAAAG
1201 TATTCTATTG GTTTAGCCAT CGGCACTAAT TCCGTTGGAT GGGCTGTCAT AACCGATGAA
1261 TACAAAGTAC CTTCAAAGAA ATTTAAGGTG TTGGGGAACA CAGACCGTCA TTCGATTAAA
1321 AAGAATCTTA TCGGTGCCCT CCTATTCGAT AGTGGCGAAA CGGCAGAGGC GACTCGCCTG
1381 AAACGAACCG CTCGGAGAAG GTATACACGT CGCAAGAACC GAATATGTTA CTTACAAGAA
1441 ATTTTTAGCA ATGAGATGGC CAAAGTTGAC GATTCTTTCT TTCACCGTTT GGAAGAGTCC
1501 TTCCTTGTCG AAGAGGACAA GAAACATGAA CGGCACCCCA TCTTTGGAAA CATAGTAGAT
1561 GAGGTGGCAT ATCATGAAAA GTACCCAACG ATTTATCACC TCAGAAAAAA GCTAGTTGAC
1621 TCAACTGATA AAGCGGACCT GAGGTTAATC TACTTGGCTC TTGCCCATAT GATAAAGTTC
1681 CGTGGGCACT TTCTCATTGA GGGTGATCTA AATCCGGACA ACTCGGATGT CGACAAACTG
1741 TTCATCCAGT TAGTACAAAC CTATAATCAG TTGTTTGAAG AGAACCCTAT AAATGCAAGT
1801 GGCGTGGATG CGAAGGCTAT TCTTAGCGCC CGCCTCTCTA AATCCCGACG GCTAGAAAAC
1861 CTGATCGCAC AATTACCCGG AGAGAAGAAA AATGGGTTGT TCGGTAACCT TATAGCGCTC
1921 TCACTAGGCC TGACACCAAA TTTTAAGTCG AACTTCGACT TAGCTGAAGA TGCCAAATTG
1981 CAGCTTAGTA AGGACACGTA CGATGACGAT CTCGACAATC TACTGGCACA AATTGGAGAT
2041 CAGTATGCGG ACTTATTTTT GGCTGCCAAA AACCTTAGCG ATGCAATCCT CCTATCTGAC
2101 ATACTGAGAG TTAATACTGA GATTACCAAG GCGCCGTTAT CCGCTTCAAT GATCAAAAGG
2161 TACGATGAAC ATCACCAAGA CTTGACACTT CTCAAGGCCC TAGTCCGTCA GCAACTGCCT
2221 GAGAAATATA AGGAAATATT CTTTGATCAG TCGAAAAACG GGTACGCAGG TTATATTGAC
2281 GGCGGAGCGA GTCAAGAGGA ATTCTACAAG TTTATCAAAC CCATATTAGA GAAGATGGAT
2341 GGGACGGAAG AGTTGCTTGT AAAACTCAAT CGCGAAGATC TACTGCGAAA GCAGCGGACT
2401 TTCGACAACG GTAGCATTCC ACATCAAATC CACTTAGGCG AATTGCATGC TATACTTAGA
2461 AGGCAGGAGG ATTTTTATCC GTTCCTCAAA GACAATCGTG AAAAGATTGA GAAAATCCTA
2521 ACCTTTCGCA TACCTTACTA TGTGGGACCC CTGGCCCGAG GGAACTCTCG GTTCGCATGG
2581 ATGACAAGAA AGTCCGAAGA AACGATTACT CCATGGAATT TTGAGGAAGT TGTCGATAAA
2641 GGTGCGTCAG CTCAATCGTT CATCGAGAGG ATGACCAACT TTGACAAGAA TTTACCGAAC
2701 GAAAAAGTAT TGCCTAAGCA CAGTTTACTT TACGAGTATT TCACAGTGTA CAATGAACTC
2761 ACGAAAGTTA AGTATGTCAC TGAGGGCATG CGTAAACCCG CCTTTCTAAG CGGAGAACAG
2821 AAGAAAGCAA TAGTAGATCT GTTATTCAAG ACCAACCGCA AAGTGACAGT TAAGCAATTG
2881 AAAGAGGACT ACTTTAAGAA AATTGAATGC TTCGATTCTG TCGAGATCTC CGGGGTAGAA
2941 GATCGATTTA ATGCGTCACT TGGTACGTAT CATGACCTCC TAAAGATAAT TAAAGATAAG
3001 GACTTCCTGG ATAACGAAGA GAATGAAGAT ATCTTAGAAG ATATAGTGTT GACTCTTACC
3061 CTCTTTGAAG ATCGGGAAAT GATTGAGGAA AGACTAAAAA CATACGCTCA CCTGTTCGAC
3121 GATAAGGTTA TGAAACAGTT AAAGAGGCGT CGCTATACGG GCTGGGGACG ATTGTCGCGG
3181 AAACTTATCA ACGGGATAAG AGACAAGCAA AGTGGTAAAA CTATTCTCGA TTTTCTAAAG
3241 AGCGACGGCT TCGCCAATAG GAACTTTATG CAGCTGATCC ATGATGACTC TTTAACCTTC
3301 AAAGAGGATA TACAAAAGGC ACAGGTTTCC GGACAAGGGG ACTCATTGCA CGAACATATT
3361 GCGAATCTTG CTGGTTCGCC AGCCATCAAA AAGGGCATAC TCCAGACAGT CAAAGTAGTG
3421 GATGAGCTAG TTAAGGTCAT GGGACGTCAC AAACCGGAAA ACATTGTAAT CGAGATGGCA
3481 CGCGAAAATC AAACGACTCA GAAGGGGCAA AAAAACAGTC GAGAGCGGAT GAAGAGAATA
3541 GAAGAGGGTA TTAAAGAACT GGGCAGCCAG ATCTTAAAGG AGCATCCTGT GGAAAATACC
3601 CAATTGCAGA ACGAGAAACT TTACCTCTAT TACCTACAAA ATGGAAGGGA CATGTATGTT
3661 GATCAGGAAC TGGACATAAA CCGTTTATCT GATTACGACG TCGATCACAT TGTACCCCAA
3721 TCCTTTTTGA AGGACGATTC AATCGACAAT AAAGTGCTTA CACGCTCGGA TAAGAACCGA
3781 GGGAAAAGTG ACAATGTTCC AAGCGAGGAA GTCGTAAAGA AAATGAAGAA CTATTGGCGG
3841 CAGCTCCTAA ATGCGAAACT GATAACGCAA AGAAAGTTCG ATAACTTAAC TAAAGCTGAG
3901 AGGGGTGGCT TGTCTGAACT TGACAAGGCC GGATTTATTA AACGTCAGCT CGTGGAAACC
3961 CGCCAAATCA CAAAGCATGT TGCACAGATA CTAGATTCCC GAATGAATAC GAAATACGAC
4021 GAGAACGATA AGCTGATTCG GGAAGTCAAA GTAATCACTT TAAAGTCAAA ATTGGTGTCG
4081 GACTTCAGAA AGGATTTTCA ATTCTATAAA GTTAGGGAGA TAAATAACTA CCACCATGCG
4141 CACGACGCTT ATCTTAATGC CGTCGTAGGG ACCGCACTCA TTAAGAAATA CCCGAAGCTA
4201 GAAAGTGAGT TTGTGTATGG TGATTACAAA GTTTATGACG TCCGTAAGAT GATCGCGAAA
4261 AGCGAACAGG AGATAGGCAA GGCTACAGCC AAATACTTCT TTTATTCTAA CATTATGAAT
4321 TTCTTTAAGA CGGAAATCAC TCTGGCAAAC GGAGAGATAC GCAAACGACC TTTAATTGAA
4381 ACCAATGGGG AGACAGGTGA AATCGTATGG GATAAGGGCC GGGACTTCGC GACGGTGAGA
4441 AAAGTTTTGT CCATGCCCCA AGTCAACATA GTAAAGAAAA CTGAGGTGCA GACCGGAGGG
4501 TTTTCAAAGG AATCGATTCT TCCAAAAAGG AATAGTGATA AGCTCATCGC TCGTAAAAAG
4561 GACTGGGACC CGAAAAAGTA CGGTGGCTTC GATAGCCCTA CAGTTGCCTA TTCTGTCCTA
4621 GTAGTGGCAA AAGTTGAGAA GGGAAAATCC AAGAAACTGA AGTCAGTCAA AGAATTATTG
4681 GGGATAACGA TTATGGAGCG CTCGTCTTTT GAAAAGAACC CCATCGACTT CCTTGAGGCG
4741 AAAGGTTACA AGGAAGTAAA AAAGGATCTC ATAATTAAAC TACCAAAGTA TAGTCTGTTT
4801 GAGTTAGAAA ATGGCCGAAA ACGGATGTTG GCTAGCGCCG GAGAGCTTCA AAAGGGGAAC
4861 GAACTCGCAC TACCGTCTAA ATACGTGAAT TTCCTGTATT TAGCGTCCCA TTACGAGAAG
4921 TTGAAAGGTT CACCTGAAGA TAACGAACAG AAGCAACTTT TTGTTGAGCA GCACAAACAT
4981 TATCTCGACG AAATCATAGA GCAAATTTCG GAATTCAGTA AGAGAGTCAT CCTAGCTGAT
5041 GCCAATCTGG ACAAAGTATT AAGCGCATAC AACAAGCACA GGGATAAACC CATACGTGAG
5101 CAGGCGGAAA ATATTATCCA TTTGTTTACT CTTACCAACC TCGGCGCTCC AGCCGCATTC
5161 AAGTATTTTG ACACAACGAT AGATCGCAAA CGATACACTT CTACCAAGGA GGTGCTAGAC
5221 GCGACACTGA TTCACCAATC CATCACGGGA TTATATGAAA CTCGGATAGA TTTGTCACAG
5281 CTTGGGGGTG ACTCTGGTGG TTCTGGAGGA TCTGGTGGTT CTACTAATCT GTCAGATATT
5341 ATTGAAAAGG AGACCGGTAA GCAACTGGTT ATCCAGGAAT CCATCCTCAT GCTCCCAGAG
5401 GAGGTGGAAG AAGTCATTGG GAACAAGCCG GAAAGCGATA TACTCGTGCA CACCGCCTAC
5461 GACGAGAGCA CCGACGAGAA TGTCATGCTT CTGACTAGCG ACGCCCCTGA ATACAAGCCT
5521 TGGGCTCTGG TCATACAGGA TAGCAACGGT GAGAACAAGA TTAAGATGCT CTCTGGTGGT
5581 TCTGGAGGAT CTGGTGGTTC TACTAATCTG TCAGATATTA TTGAAAAGGA GACCGGTAAG
5641 CAACTGGTTA TCCAGGAATC CATCCTCATG CTCCCAGAGG AGGTGGAAGA AGTCATTGGG
5701 AACAAGCCGG AAAGCGATAT ACTCGTGCAC ACCGCCTACG ACGAGAGCAC CGACGAGAAT
5761 GTCATGCTTC TGACTAGCGA CGCCCCTGAA TACAAGCCTT GGGCTCTGGT CATACAGGAT
5821 AGCAACGGTG AGAACAAGAT TAAGATGCTC TCTGGTGGTT CTCCCAAGAA GAAGAGGAAA
5881 GTCTAACCGG TCATCATCAC CATCACCATT GAGTTTAAAC CCGCTGATCA GCCTCGACTG
5941 TGCCTTCTAG TTGCCAGCCA TCTGTTGTTT GCCCCTCCCC CGTGCCTTCC TTGACCCTGG
6001 AAGGTGCCAC TCCCACTGTC CTTTCCTAAT AAAATGAGGA AATTGCATCG CATTGTCTGA
6061 GTAGGTGTCA TTCTATTCTG GGGGGTGGGG TGGGGCAGGA CAGCAAGGGG GAGGATTGGG
6121 AAGACAATAG CAGGCATGCT GGGGATGCGG TGGGCTCTAT GGCTTCTGAG GCGGAAAGAA
6181 CCAGCTGGGG CTCGATACCG TCGACCTCTA GCTAGAGCTT GGCGTAATCA TGGTCATAGC
6241 TGTTTCCTGT GTGAAATTGT TATCCGCTCA CAATTCCACA CAACATACGA GCCGGAAGCA
6301 TAAAGTGTAA AGCCTAGGGT GCCTAATGAG TGAGCTAACT CACATTAATT GCGTTGCGCT
6361 CACTGCCCGC TTTCCAGTCG GGAAACCTGT CGTGCCAGCT GCATTAATGA ATCGGCCAAC
6421 GCGCGGGGAG AGGCGGTTTG CGTATTGGGC GCTCTTCCGC TTCCTCGCTC ACTGACTCGC
6481 TGCGCTCGGT CGTTCGGCTG CGGCGAGCGG TATCAGCTCA CTCAAAGGCG GTAATACGGT
6541 TATCCACAGA ATCAGGGGAT AACGCAGGAA AGAACATGTG AGCAAAAGGC CAGCAAAAGG
6601 CCAGGAACCG TAAAAAGGCC GCGTTGCTGG CGTTTTTCCA TAGGCTCCGC CCCCCTGACG
6661 AGCATCACAA AAATCGACGC TCAAGTCAGA GGTGGCGAAA CCCGACAGGA CTATAAAGAT
6721 ACCAGGCGTT TCCCCCTGGA AGCTCCCTCG TGCGCTCTCC TGTTCCGACC CTGCCGCTTA
6781 CCGGATACCT GTCCGCCTTT CTCCCTTCGG GAAGCGTGGC GCTTTCTCAT AGCTCACGCT
6841 GTAGGTATCT CAGTTCGGTG TAGGTCGTTC GCTCCAAGCT GGGCTGTGTG CACGAACCCC
6901 CCGTTCAGCC CGACCGCTGC GCCTTATCCG GTAACTATCG TCTTGAGTCC AACCCGGTAA
6961 GACACGACTT ATCGCCACTG GCAGCAGCCA CTGGTAACAG GATTAGCAGA GCGAGGTATG
7021 TAGGCGGTGC TACAGAGTTC TTGAAGTGGT GGCCTAACTA CGGCTACACT AGAAGAACAG
7081 TATTTGGTAT CTGCGCTCTG CTGAAGCCAG TTACCTTCGG AAAAAGAGTT GGTAGCTCTT
7141 GATCCGGCAA ACAAACCACC GCTGGTAGCG GTGGTTTTTT TGTTTGCAAG CAGCAGATTA
7201 CGCGCAGAAA AAAAGGATCT CAAGAAGATC CTTTGATCTT TTCTACGGGG TCTGACGCTC
7261 AGTGGAACGA AAACTCACGT TAAGGGATTT TGGTCATGAG ATTATCAAAA AGGATCTTCA
7321 CCTAGATCCT TTTAAATTAA AAATGAAGTT TTAAATCAAT CTAAAGTATA TATGAGTAAA
7381 CTTGGTCTGA CAGTTACCAA TGCTTAATCA GTGAGGCACC TATCTCAGCG ATCTGTCTAT
7441 TTCGTTCATC CATAGTTGCC TGACTCCCCG TCGTGTAGAT AACTACGATA CGGGAGGGCT
7501 TACCATCTGG CCCCAGTGCT GCAATGATAC CGCGAGACCC ACGCTCACCG GCTCCAGATT
7561 TATCAGCAAT AAACCAGCCA GCCGGAAGGG CCGAGCGCAG AAGTGGTCCT GCAACTTTAT
7621 CCGCCTCCAT CCAGTCTATT AATTGTTGCC GGGAAGCTAG AGTAAGTAGT TCGCCAGTTA
7681 ATAGTTTGCG CAACGTTGTT GCCATTGCTA CAGGCATCGT GGTGTCACGC TCGTCGTTTG
7741 GTATGGCTTC ATTCAGCTCC GGTTCCCAAC GATCAAGGCG AGTTACATGA TCCCCCATGT
7801 TGTGCAAAAA AGCGGTTAGC TCCTTCGGTC CTCCGATCGT TGTCAGAAGT AAGTTGGCCG
7861 CAGTGTTATC ACTCATGGTT ATGGCAGCAC TGCATAATTC TCTTACTGTC ATGCCATCCG
7921 TAAGATGCTT TTCTGTGACT GGTGAGTACT CAACCAAGTC ATTCTGAGAA TAGTGTATGC
7981 GGCGACCGAG TTGCTCTTGC CCGGCGTCAA TACGGGATAA TACCGCGCCA CATAGCAGAA
8041 CTTTAAAAGT GCTCATCATT GGAAAACGTT CTTCGGGGCG AAAACTCTCA AGGATCTTAC
8101 CGCTGTTGAG ATCCAGTTCG ATGTAACCCA CTCGTGCACC CAACTGATCT TCAGCATCTT
8161 TTACTTTCAC CAGCGTTTCT GGGTGAGCAA AAACAGGAAG GCAAAATGCC GCAAAAAAGG
8221 GAATAAGGGC GACACGGAAA TGTTGAATAC TCATACTCTT CCTTTTTCAA TATTATTGAA
8281 GCATTTATCA GGGTTATTGT CTCATGAGCG GATACATATT TGAATGTATT TAGAAAAATA
8341 AACAAATAGG GGTTCCGCGC ACATTTCCCC GAAAAGTGCC ACCTGACGTC GACGGATCGG
8401 GAGATCGATC TCCCGATCCC CTAGGGTCGA CTCTCAGTAC AATCTGCTCT GATGCCGCAT
8461 AGTTAAGCCA GTATCTGCTC CCTGCTTGTG TGTTGGAGGT CGCTGAGTAG TGCGCGAGCA
8521 AAATTTAAGC TACAACAAGG CAAGGCTTGA CCGACAATTG CATGAAGAAT CTGCTTAGGG
8581 TTAGGCGTTT TGCGCTGCTT CGCGATGTAC GGGCCAGATA TACGCGTTGA CATTGATTAT
8641 TGACTAGTTA TTAATAGTAA TCAATTACGG GGTCATTAGT TCATAGCCCA TATATGGAGT
8701 TCCGCGTTAC ATAACTTACG GTAAATGGCC CGCCTGGCTG ACCGCCCAAC GACCCCCGCC
8761 CATTGACGTC AATAATGACG TATGTTCCCA TAGTAACGCC AATAGGGACT TTCCATTGAC
8821 GTCAATGGGT GGAGTATTTA CGGTAAACTG CCCACTTGGC AGTACATCAA GTGTATC
一部の実施形態では、シチジン塩基エディターは、以下のうち1つから選択される核酸配列を有するBE4である:
本来のBE4核酸配列:
ATGagctcagagactggcccagtggctgtggaccccacattgagacggcggatcgagccccatgagtttgaggtattcttcgatccgagagagctccgcaaggagacctgcctgctttacgaaattaattgggggggccggcactccatttggcgacatacatcacagaacactaacaagcacgtcgaagtcaacttcatcgagaagttcacgacagaaagatatttctgtccgaacacaaggtgcagcattacctggtttctcagctggagccgcgaatgtagtagggccatcactgaattcctgtcaaggtatccccacgtcactctgtttatttacatcgcaaggctgtaccaccacgctgacccccgcaatcgacaaggcctgcgggatttgatctcttcaggtgtgactatccaaattatgactgagcaggagtcaggatactgctggagaaactttgtgaattatagcccgagtaatgaagcccactggcctaggtatccccatctgtgggtacgactgtacgttcttgaactgtactgcatcatactgggcctgcctccttgtctcaacattctgagaaggaagcagccacagctgacattctttaccatcgctcttcagtcttgtcattaccagcgactgcccccacacattctctgggccaccgggttgaaatctggtggttcttctggtggttctagcggcagcgagactcccgggacctcagagtccgccacacccgaaagttctggtggttcttctggtggttctgataaaaagtattctattggtttagccatcggcactaattccgttggatgggctgtcataaccgatgaatacaaagtaccttcaaagaaatttaaggtgttggggaacacagaccgtcattcgattaaaaagaatcttatcggtgccctcctattcgatagtggcgaaacggcagaggcgactcgcctgaaacgaaccgctcggagaaggtatacacgtcgcaagaaccgaatatgttacttacaagaaatttttagcaatgagatggccaaagttgacgattctttctttcaccgtttggaagagtccttccttgtcgaagaggacaagaaacatgaacggcaccccatctttggaaacatagtagatgaggtggcatatcatgaaaagtacccaacgatttatcacctcagaaaaaagctagttgactcaactgataaagcggacctgaggttaatctacttggctcttgcccatatgataaagttccgtgggcactttctcattgagggtgatctaaatccggacaactcggatgtcgacaaactgttcatccagttagtacaaacctataatcagttgtttgaagagaaccctataaatgcaagtggcgtggatgcgaaggctattcttagcgcccgcctctctaaatcccgacggctagaaaacctgatcgcacaattacccggagagaagaaaaatgggttgttcggtaaccttatagcgctctcactaggcctgacaccaaattttaagtcgaacttcgacttagctgaagatgccaaattgcagcttagtaaggacacgtacgatgacgatctcgacaatctactggcacaaattggagatcagtatgcggacttatttttggctgccaaaaaccttagcgatgcaatcctcctatctgacatactgagagttaatactgagattaccaaggcgccgttatccgcttcaatgatcaaaaggtacgatgaacatcaccaagacttgacacttctcaaggccctagtccgtcagcaactgcctgagaaatataaggaaatattctttgatcagtcgaaaaacgggtacgcaggttatattgacggcggagcgagtcaagaggaattctacaagtttatcaaacccatattagagaagatggatgggacggaagagttgcttgtaaaactcaatcgcgaagatctactgcgaaagcagcggactttcgacaacggtagcattccacatcaaatccacttaggcgaattgcatgctatacttagaaggcaggaggatttttatccgttcctcaaagacaatcgtgaaaagattgagaaaatcctaacctttcgcataccttactatgtgggacccctggcccgagggaactctcggttcgcatggatgacaagaaagtccgaagaaacgattactccatggaattttgaggaagttgtcgataaaggtgcgtcagctcaatcgttcatcgagaggatgaccaactttgacaagaatttaccgaacgaaaaagtattgcctaagcacagtttactttacgagtatttcacagtgtacaatgaactcacgaaagttaagtatgtcactgagggcatgcgtaaacccgcctttctaagcggagaacagaagaaagcaatagtagatctgttattcaagaccaaccgcaaagtgacagttaagcaattgaaagaggactactttaagaaaattgaatgcttcgattctgtcgagatctccggggtagaagatcgatttaatgcgtcacttggtacgtatcatgacctcctaaagataattaaagataaggacttcctggataacgaagagaatgaagatatcttagaagatatagtgttgactcttaccctctttgaagatcgggaaatgattgaggaaagactaaaaacatacgctcacctgttcgacgataaggttatgaaacagttaaagaggcgtcgctatacgggctggggacgattgtcgcggaaacttatcaacgggataagagacaagcaaagtggtaaaactattctcgattttctaaagagcgacggcttcgccaataggaactttatgcagctgatccatgatgactctttaaccttcaaagaggatatacaaaaggcacaggtttccggacaaggggactcattgcacgaacatattgcgaatcttgctggttcgccagccatcaaaaagggcatactccagacagtcaaagtagtggatgagctagttaaggtcatgggacgtcacaaaccggaaaacattgtaatcgagatggcacgcgaaaatcaaacgactcagaaggggcaaaaaaacagtcgagagcggatgaagagaatagaagagggtattaaagaactgggcagccagatcttaaaggagcatcctgtggaaaatacccaattgcagaacgagaaactttacctctattacctacaaaatggaagggacatgtatgttgatcaggaactggacataaaccgtttatctgattacgacgtcgatcacattgtaccccaatcctttttgaaggacgattcaatcgacaataaagtgcttacacgctcggataagaaccgagggaaaagtgacaatgttccaagcgaggaagtcgtaaagaaaatgaagaactattggcggcagctcctaaatgcgaaactgataacgcaaagaaagttcgataacttaactaaagctgagaggggtggcttgtctgaacttgacaaggccggatttattaaacgtcagctcgtggaaacccgccaaatcacaaagcatgttgcacagatactagattcccgaatgaatacgaaatacgacgagaacgataagctgattcgggaagtcaaagtaatcactttaaagtcaaaattggtgtcggacttcagaaaggattttcaattctataaagttagggagataaataactaccaccatgcgcacgacgcttatcttaatgccgtcgtagggaccgcactcattaagaaatacccgaagctagaaagtgagtttgtgtatggtgattacaaagtttatgacgtccgtaagatgatcgcgaaaagcgaacaggagataggcaaggctacagccaaatacttcttttattctaacattatgaatttctttaagacggaaatcactctggcaaacggagagatacgcaaacgacctttaattgaaaccaatggggagacaggtgaaatcgtatgggataagggccgggacttcgcgacggtgagaaaagttttgtccatgccccaagtcaacatagtaaagaaaactgaggtgcagaccggagggttttcaaaggaatcgattcttccaaaaaggaatagtgataagctcatcgctcgtaaaaaggactgggacccgaaaaagtacggtggcttcgatagccctacagttgcctattctgtcctagtagtggcaaaagttgagaagggaaaatccaagaaactgaagtcagtcaaagaattattggggataacgattatggagcgctcgtcttttgaaaagaaccccatcgacttccttgaggcgaaaggttacaaggaagtaaaaaaggatctcataattaaactaccaaagtatagtctgtttgagttagaaaatggccgaaaacggatgttggctagcgccggagagcttcaaaaggggaacgaactcgcactaccgtctaaatacgtgaatttcctgtatttagcgtcccattacgagaagttgaaaggttcacctgaagataacgaacagaagcaactttttgttgagcagcacaaacattatctcgacgaaatcatagagcaaatttcggaattcagtaagagagtcatcctagctgatgccaatctggacaaagtattaagcgcatacaacaagcacagggataaacccatacgtgagcaggcggaaaatattatccatttgtttactcttaccaacctcggcgctccagccgcattcaagtattttgacacaacgatagatcgcaaacgatacacttctaccaaggaggtgctagacgcgacactgattcaccaatccatcacgggattatatgaaactcggatagatttgtcacagcttgggggtgactctggtggttctggaggatctggtggttctactaatctgtcagatattattgaaaaggagaccggtaagcaactggttatccaggaatccatcctcatgctcccagaggaggtggaagaagtcattgggaacaagccggaaagcgatatactcgtgcacaccgcctacgacgagagcaccgacgagaatgtcatgcttctgactagcgacgcccctgaatacaagccttgggctctggtcatacaggatagcaacggtgagaacaagattaagatgctctctggtggttctggaggatctggtggttctactaatctgtcagatattattgaaaaggagaccggtaagcaactggttatccaggaatccatcctcatgctcccagaggaggtggaagaagtcattgggaacaagccggaaagcgatatactcgtgcacaccgcctacgacgagagcaccgacgagaatgtcatgcttctgactagcgacgcccctgaatacaagccttgggctctggtcatacaggatagcaacggtgagaacaagattaagatgctctctggtggttctAAAAGGACGGCGGACGGATCAGAGTTCGAGAGTCCGAAAAAAAAACGAAAGGTCGAAtaa
BE4コドン最適化1核酸配列:
ATGTCATCCGAAACCGGGCCAGTGGCCGTAGACCCAACACTCAGGAGGCGGATAGAACCCCATGAGTTTGAAGTGTTCTTCGACCCCAGAGAGCTGCGCAAAGAGACTTGCCTCCTGTATGAAATAAATTGGGGGGGTCGCCATTCAATTTGGAGGCACACTAGCCAGAATACTAACAAACACGTGGAGGTAAATTTTATCGAGAAGTTTACCACCGAAAGATACTTTTGCCCCAATACACGGTGTTCAATTACCTGGTTTCTGTCATGGAGTCCATGTGGAGAATGTAGTAGAGCGATAACTGAGTTCCTGTCTCGATATCCTCACGTCACGTTGTTTATATACATCGCTCGGCTTTATCACCATGCGGACCCGCGGAACAGGCAAGGTCTTCGGGACCTCATATCCTCTGGGGTGACCATCCAGATAATGACGGAGCAAGAGAGCGGATACTGCTGGCGAAACTTTGTTAACTACAGCCCAAGCAATGAGGCACACTGGCCTAGATATCCGCATCTCTGGGTTCGACTGTATGTCCTTGAACTGTACTGCATAATTCTGGGACTTCCGCCATGCTTGAACATTCTGCGGCGGAAACAACCACAGCTGACCTTTTTCACGATTGCTCTCCAAAGTTGTCACTACCAGCGATTGCCACCCCACATCTTGTGGGCTACTGGACTCAAGTCTGGAGGAAGTTCAGGCGGAAGCAGCGGGTCTGAAACGCCCGGAACCTCAGAGAGCGCAACGCCCGAAAGCTCTGGAGGGTCAAGTGGTGGTAGTGATAAGAAATACTCCATCGGCCTCGCCATCGGTACGAATTCTGTCGGTTGGGCCGTTATCACCGATGAGTACAAGGTCCCTTCTAAGAAATTCAAGGTTTTGGGCAATACAGACCGCCATTCTATAAAAAAAAACCTGATCGGCGCCCTTTTGTTTGACAGTGGTGAGACTGCTGAAGCGACTCGCCTGAAGCGAACTGCCAGGAGGCGGTATACGAGGCGAAAAAACCGAATTTGTTACCTCCAGGAGATTTTCTCAAATGAAATGGCCAAGGTAGATGATAGTTTTTTTCACCGCTTGGAAGAAAGTTTTCTCGTTGAGGAGGACAAAAAGCACGAGAGGCACCCAATCTTTGGCAACATAGTCGATGAGGTCGCATACCATGAGAAATATCCTACGATCTATCATCTCCGCAAGAAGCTGGTCGATAGCACGGATAAAGCTGACCTCCGGCTGATCTACCTTGCTCTTGCTCACATGATTAAATTCAGGGGCCATTTCCTGATAGAAGGAGACCTCAATCCCGACAATTCTGATGTCGACAAACTGTTTATTCAGCTCGTTCAGACCTATAATCAACTCTTTGAGGAGAACCCCATCAATGCTTCAGGGGTGGACGCAAAGGCCATTTTGTCCGCGCGCTTGAGTAAATCACGACGCCTCGAGAATTTGATAGCTCAACTGCCGGGTGAGAAGAAAAACGGGTTGTTTGGGAATCTCATAGCGTTGAGTTTGGGACTTACGCCAAACTTTAAGTCTAACTTTGATTTGGCCGAAGATGCCAAATTGCAGCTGTCCAAAGATACCTATGATGACGACTTGGATAACCTTCTTGCGCAGATTGGTGACCAATACGCGGATCTGTTTCTTGCCGCAAAAAATCTGTCCGACGCCATACTCTTGTCCGATATACTGCGCGTCAATACTGAGATAACTAAGGCTCCCCTCAGCGCGTCCATGATTAAAAGATACGATGAGCACCACCAAGATCTCACTCTGTTGAAAGCCCTGGTTCGCCAGCAGCTTCCAGAGAAGTATAAGGAGATATTTTTCGACCAATCTAAAAACGGCTATGCGGGTTACATTGACGGTGGCGCCTCTCAAGAAGAATTCTACAAGTTTATAAAGCCGATACTTGAGAAAATGGACGGTACAGAGGAATTGTTGGTTAAGCTCAATCGCGAGGACTTGTTGAGAAAGCAGCGCACATTTGACAATGGTAGTATTCCACACCAGATTCATCTGGGCGAGTTGCATGCCATTCTTAGAAGACAAGAAGATTTTTATCCGTTTCTGAAAGATAACAGAGAAAAGATTGAAAAGATACTTACCTTTCGCATACCGTATTATGTAGGTCCCCTGGCTAGAGGGAACAGTCGCTTCGCTTGGATGACTCGAAAATCAGAAGAAACAATAACCCCCTGGAATTTTGAAGAAGTGGTAGATAAAGGTGCGAGTGCCCAATCTTTTATTGAGCGGATGACAAATTTTGACAAGAATCTGCCTAACGAAAAGGTGCTTCCCAAGCATTCCCTTTTGTATGAATACTTTACAGTATATAATGAACTGACTAAAGTGAAGTACGTTACCGAGGGGATGCGAAAGCCAGCTTTTCTCAGTGGCGAGCAGAAAAAAGCAATAGTTGACCTGCTGTTCAAGACGAATAGGAAGGTTACCGTCAAACAGCTCAAAGAAGATTACTTTAAAAAGATCGAATGTTTTGATTCAGTTGAGATAAGCGGAGTAGAGGATAGATTTAACGCAAGTCTTGGAACTTATCATGACCTTTTGAAGATCATCAAGGATAAAGATTTTTTGGACAACGAGGAGAATGAAGATATCCTGGAAGATATAGTACTTACCTTGACGCTTTTTGAAGATCGAGAGATGATCGAGGAGCGACTTAAGACGTACGCACATCTCTTTGACGATAAGGTTATGAAACAATTGAAACGCCGGCGGTATACTGGCTGGGGCAGGCTTTCTCGAAAGCTGATTAATGGTATCCGCGATAAGCAGTCTGGAAAGACAATCCTTGACTTTCTGAAAAGTGATGGATTTGCAAATAGAAACTTTATGCAGCTTATACATGATGACTCTTTGACGTTCAAGGAAGACATCCAGAAGGCACAGGTATCCGGCCAAGGGGATAGCCTCCATGAACACATAGCCAACCTGGCCGGCTCACCAGCTATTAAAAAGGGAATATTGCAAACCGTTAAGGTTGTTGACGAACTCGTTAAGGTTATGGGCCGACACAAACCAGAGAATATCGTGATTGAGATGGCTAGGGAGAATCAGACCACTCAAAAAGGTCAGAAAAATTCTCGCGAAAGGATGAAGCGAATTGAAGAGGGAATCAAAGAACTTGGCTCTCAAATTTTGAAAGAGCACCCGGTAGAAAACACTCAGCTGCAGAATGAAAAGCTGTATCTGTATTATCTGCAGAATGGTCGAGATATGTACGTTGATCAGGAGCTGGATATCAATAGGCTCAGTGACTACGATGTCGACCACATCGTTCCTCAATCTTTCCTGAAAGATGACTCTATCGACAACAAAGTGTTGACGCGATCAGATAAGAACCGGGGAAAATCCGACAATGTACCCTCAGAAGAAGTTGTCAAGAAGATGAAAAACTATTGGAGACAATTGCTGAACGCCAAGCTCATAACACAACGCAAGTTCGATAACTTGACGAAAGCCGAAAGAGGTGGGTTGTCAGAATTGGACAAAGCTGGCTTTATTAAGCGCCAATTGGTGGAGACCCGGCAGATTACGAAACACGTAGCACAAATTTTGGATTCACGAATGAATACCAAATACGACGAAAACGACAAATTGATACGCGAGGTGAAAGTGATTACGCTTAAGAGTAAGTTGGTTTCCGATTTCAGGAAGGATTTTCAGTTTTACAAAGTAAGAGAAATAAACAACTACCACCACGCCCATGATGCTTACCTCAACGCGGTAGTTGGCACAGCTCTTATCAAAAAATATCCAAAGCTGGAAAGCGAGTTCGTTTACGGTGACTATAAAGTATACGACGTTCGGAAGATGATAGCCAAATCAGAGCAGGAAATTGGGAAGGCAACCGCAAAATACTTCTTCTATTCAAACATCATGAACTTCTTTAAGACGGAGATTACGCTCGCGAACGGCGAAATACGCAAGAGGCCCCTCATAGAGACTAACGGCGAAACCGGGGAGATCGTATGGGACAAAGGACGGGACTTTGCGACCGTTAGAAAAGTACTTTCAATGCCACAAGTGAATATTGTTAAAAAGACAGAAGTACAAACAGGGGGGTTCAGTAAGGAATCCATTTTGCCCAAGCGGAACAGTGATAAATTGATAGCAAGGAAAAAAGATTGGGACCCTAAGAAGTACGGTGGTTTCGACTCTCCTACCGTTGCATATTCAGTCCTTGTAGTTGCGAAAGTGGAAAAGGGGAAAAGTAAGAAGCTTAAGAGTGTTAAAGAGCTTCTGGGCATAACCATAATGGAACGGTCTAGCTTCGAGAAAAATCCAATTGACTTTCTCGAGGCTAAAGGTTACAAGGAGGTAAAAAAGGACCTGATAATTAAACTCCCAAAGTACAGTCTCTTCGAGTTGGAGAATGGGAGGAAGAGAATGTTGGCATCTGCAGGGGAGCTCCAAAAGGGGAACGAGCTGGCTCTGCCTTCAAAATACGTGAACTTTCTGTACCTGGCCAGCCACTACGAGAAACTCAAGGGTTCTCCTGAGGATAACGAGCAGAAACAGCTGTTTGTAGAGCAGCACAAGCATTACCTGGACGAGATAATTGAGCAAATTAGTGAGTTCTCAAAAAGAGTAATCCTTGCAGACGCGAATCTGGATAAAGTTCTTTCCGCCTATAATAAGCACCGGGACAAGCCTATACGAGAACAAGCCGAGAACATCATTCACCTCTTTACCCTTACTAATCTGGGCGCGCCGGCCGCCTTCAAATACTTCGACACCACGATAGACAGGAAAAGGTATACGAGTACCAAAGAAGTACTTGACGCCACTCTCATCCACCAGTCTATAACAGGGTTGTACGAAACGAGGATAGATTTGTCCCAGCTCGGCGGCGACTCAGGAGGGTCAGGCGGCTCCGGTGGATCAACGAATCTTTCCGACATAATCGAGAAAGAAACCGGCAAACAGTTGGTGATCCAAGAATCAATCCTGATGCTGCCTGAAGAAGTAGAAGAGGTGATTGGCAACAAACCTGAGTCTGACATTCTTGTCCACACCGCGTATGACGAGAGCACGGACGAGAACGTTATGCTTCTCACTAGCGACGCCCCTGAGTATAAACCATGGGCGCTGGTCATCCAAGATTCCAATGGGGAAAACAAGATTAAGATGCTTAGTGGTGGGTCTGGAGGGAGCGGTGGGTCCACGAACCTCAGCGACATTATTGAAAAAGAGACTGGTAAACAACTTGTAATACAAGAGTCTATTCTGATGTTGCCTGAAGAGGTGGAGGAGGTGATTGGGAACAAACCGGAGTCTGATATACTTGTTCATACCGCCTATGACGAATCTACTGATGAGAATGTGATGCTTTTaACGTCAGACGCTCCCGAGTACAAACCCTGGGCTCTGGTGATTCAGGACAGCAATGGTGAGAATAAGATTAAAATGTTGAGTGGGGGCTCAAAGCGCACGGCTGACGGTAGCGAATTTGAGAGCCCCAAAAAAAAACGAAAGGTCGAAtaa
BE4コドン最適化2核酸配列:
ATGAGCAGCGAGACAGGCCCTGTGGCTGTGGATCCTACACTGCGGAGAAGAATCGAGCCCCACGAGTTCGAGGTGTTCTTCGACCCCAGAGAGCTGCGGAAAGAGACATGCCTGCTGTACGAGATCAACTGGGGCGGCAGACACTCTATCTGGCGGCACACAAGCCAGAACACCAACAAGCACGTGGAAGTGAACTTTATCGAGAAGTTTACGACCGAGCGGTACTTCTGCCCCAACACCAGATGCAGCATCACCTGGTTTCTGAGCTGGTCCCCTTGCGGCGAGTGCAGCAGAGCCATCACCGAGTTTCTGTCCAGATATCCCCACGTGACCCTGTTCATCTATATCGCCCGGCTGTACCACCACGCCGATCCTAGAAATAGACAGGGACTGCGCGACCTGATCAGCAGCGGAGTGACCATCCAGATCATGACCGAGCAAGAGAGCGGCTACTGCTGGCGGAACTTCGTGAACTACAGCCCCAGCAACGAAGCCCACTGGCCTAGATATCCTCACCTGTGGGTCCGACTGTACGTGCTGGAACTGTACTGCATCATCCTGGGCCTGCCTCCATGCCTGAACATCCTGAGAAGAAAGCAGCCTCAGCTGACCTTCTTCACAATCGCCCTGCAGAGCTGCCACTACCAGAGACTGCCTCCACACATCCTGTGGGCCACCGGACTTAAGAGCGGAGGATCTAGCGGCGGCTCTAGCGGATCTGAGACACCTGGCACAAGCGAGTCTGCCACACCTGAGAGTAGCGGCGGATCTTCTGGCGGCTCCGACAAGAAGTACTCTATCGGACTGGCCATCGGCACCAACTCTGTTGGATGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGGTGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAATCTGATCGGCGCCCTGCTGTTCGACTCTGGCGAAACAGCCGAAGCCACCAGACTGAAGAGAACCGCCAGGCGGAGATACACCCGGCGGAAGAACCGGATCTGCTACCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGACAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGATGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGAGACTGATCTACCTGGCTCTGGCCCACATGATCAAGTTCCGGGGCCACTTTCTGATCGAGGGCGATCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCTCTGGCGTGGACGCCAAGGCTATCCTGTCTGCCAGACTGAGCAAGAGCAGAAGGCTGGAAAACCTGATCGCCCAGCTGCCTGGCGAGAAGAAGAATGGCCTGTTCGGCAACCTGATTGCCCTGAGCCTGGGACTGACCCCTAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAGCAAGGACACCTACGACGACGACCTGGACAATCTGCTGGCCCAGATCGGCGATCAGTACGCCGACTTGTTTCTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGATATCCTGAGAGTGAACACCGAGATCACAAAGGCCCCTCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGATCTGACCCTGCTGAAGGCCCTCGTTAGACAGCAGCTGCCAGAGAAGTACAAAGAGATTTTCTTCGATCAGTCCAAGAACGGCTACGCCGGCTACATTGATGGCGGAGCCAGCCAAGAGGAATTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGGACGGCACCGAGGAACTGCTGGTCAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAATGGCTCTATCCCTCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGAGACAAGAGGACTTTTACCCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCAGGATCCCCTACTACGTGGGACCACTGGCCAGAGGCAATAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACACCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCCAGCGCTCAGTCCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCTAACGAGAAGGTGCTGCCCAAGCACTCCCTGCTGTATGAGTACTTCACCGTGTACAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTTCTGAGCGGCGAGCAGAAAAAGGCCATTGTGGATCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACAGCGTGGAAATCAGCGGCGTGGAAGATCGGTTCAATGCCAGCCTGGGCACATACCACGACCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAACGAAGAGAACGAGGACATTCTCGAGGACATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACATACGCCCACCTGTTCGACGACAAAGTGATGAAGCAACTGAAGCGGAGGCGGTACACAGGCTGGGGCAGACTGTCTCGGAAGCTGATCAACGGCATCCGGGATAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAAGCCCAGGTGTCCGGCCAAGGCGATTCTCTGCACGAGCACATTGCCAACCTGGCCGGATCTCCCGCCATTAAGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTTGTGAAAGTGATGGGCAGACACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACACAGAAGGGCCAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGACGGGATATGTACGTGGACCAAGAGCTGGACATCAACCGGCTGAGCGACTACGATGTGGACCATATCGTGCCCCAGAGCTTTCTGAAGGACGACTCCATCGATAACAAGGTCCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGATAACGTGCCCTCCGAAGAGGTGGTCAAGAAGATGAAGAACTACTGGCGACAGCTGCTGAACGCCAAGCTGATTACCCAGCGGAAGTTCGATAACCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTTGATAAGGCCGGCTTCATTAAGCGGCAGCTGGTGGAAACCCGGCAGATCACCAAACACGTGGCACAGATTCTGGACTCCCGGATGAACACTAAGTACGACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTCATCACCCTGAAGTCTAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTCTACAAAGTGCGGGAAATCAACAACTACCATCACGCCCACGACGCCTACCTGAATGCCGTTGTTGGAACAGCCCTGATCAAGAAGTATCCCAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAACAAGAGATCGGCAAGGCTACCGCCAAGTACTTTTTCTACAGCAACATCATGAACTTTTTCAAGACAGAGATCACCCTGGCCAACGGCGAGATCCGGAAAAGACCCCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCAGAGATTTTGCCACAGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAGAAAACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCTAAGCGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAGTACGGCGGCTTCGATAGCCCTACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAAAAGCTCAAGAGCGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTTGAGAAGAACCCGATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTCAAGAAGGACCTCATCATCAAGCTCCCCAAGTACAGCCTGTTCGAGCTGGAAAATGGCCGGAAGCGGATGCTGGCCTCAGCAGGCGAACTGCAGAAAGGCAATGAACTGGCCCTGCCTAGCAAATACGTCAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCAGCCCCGAGGACAATGAGCAAAAGCAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAACCTGGATAAGGTGCTGTCTGCCTATAACAAGCACCGGGACAAGCCTATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAACCTGGGAGCCCCTGCCGCCTTCAAGTACTTCGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAAGAGGTGCTGGACGCCACACTGATCCACCAGTCTATCACCGGCCTGTACGAAACCCGGATCGACCTGTCTCAGCTCGGCGGCGATTCTGGTGGTTCTGGCGGAAGTGGCGGATCCACCAATCTGAGCGACATCATCGAAAAAGAGACAGGCAAGCAGCTCGTGATCCAAGAATCCATCCTGATGCTGCCTGAAGAGGTTGAGGAAGTGATCGGCAACAAGCCTGAGTCCGACATCCTGGTGCACACCGCCTACGATGAGAGCACCGATGAGAACGTCATGCTGCTGACAAGCGACGCCCCTGAGTACAAGCCTTGGGCTCTCGTGATTCAGGACAGCAATGGGGAGAACAAGATCAAGATGCTGAGCGGAGGTAGCGGAGGCAGTGGCGGAAGCACAAACCTGTCTGATATCATTGAAAAAGAAACCGGGAAGCAACTGGTCATTCAAGAGTCCATTCTCATGCTCCCGGAAGAAGTCGAGGAAGTCATTGGAAACAAACCCGAGAGCGATATTCTGGTCCACACAGCCTATGACGAGTCTACAGACGAAAACGTGATGCTCCTGACCTCTGACGCTCCCGAGTATAAGCCCTGGGCACTTGTTATCCAGGACTCTAACGGGGAAAACAAAATCAAAATGTTGTCCGGCGGCAGCAAGCGGACAGCCGATGGATCTGAGTTCGAGAGCCCCAAGAAGAAACGGAAGGTgGAGtaa
「塩基編集活性」とは、ポリヌクレオチド内で塩基を化学的に変更するよう作用することを意味する。一実施形態では、第1の塩基が第2の塩基に変換される。一実施形態では、塩基編集活性とは、例えば、標的C・GをT・Aに変換するシチジンデアミナーゼ活性である。別の実施形態では、塩基編集活性とは、例えば、A・TをG・Cに変換するアデノシンまたはアデニンデアミナーゼ活性である。別の実施形態では、塩基編集活性とは、例えば、標的C・GをT・Aに変換するシチジンデアミナーゼ活性であり、例えば、A・TをG・Cに変換するアデノシンまたはアデニンデアミナーゼ活性である。
用語「塩基エディターシステム」とは、標的ヌクレオチド配列の核酸塩基を編集するためのシステムを指す。様々な実施形態では、塩基エディター(BE)システムは、(1)ポリヌクレオチドプログラマブルヌクレオチド結合ドメイン、標的ヌクレオチド配列中の核酸塩基を脱アミノ化するためのデアミナーゼドメインおよびシチジンデアミナーゼドメインと;(2)ポリヌクレオチドプログラマブルヌクレオチド結合ドメインに連係する1つまたは複数ガイドポリヌクレオチド(例えばガイドRNA)とを含む。様々な実施形態では、塩基エディター(BE)システムは、アデノシンデアミナーゼまたはシチジンデアミナーゼから選択される核酸塩基エディタードメインと、核酸配列特異的な結合活性を有するドメインとを含む。一部の実施形態では、塩基エディターシステムは、(1)ポリヌクレオチドプログラマブルDNA結合ドメインと、標的ヌクレオチド配列中の1つまたは複数の核酸塩基を脱アミノ化するためのデアミナーゼドメインとを含む塩基エディター(BE);および(2)ポリヌクレオチドプログラマブルDNA結合ドメインに連係する1つまたは複数のガイドRNAを含む。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、ポリヌクレオチドプログラマブルDNA結合ドメインである。一部の実施形態では、塩基エディターはシチジン塩基エディター(CBE)である。一部の実施形態では、塩基エディターはアデニンまたはアデノシン塩基エディター(ABE)である。一部の実施形態では、塩基エディターは、アデニンもしくはアデノシン塩基エディター(ABE)またはシチジン塩基エディター(CBE)である。
用語「Cas9」または「Cas9ドメイン」とは、Cas9タンパク質またはその断片(例えば、Cas9の活性の、不活性の、または部分的に活性のDNA切断ドメインを含むタンパク質、および/またはCas9のgRNA結合ドメイン)を含むRNAガイド型ヌクレアーゼである。Cas9ヌクレアーゼはまた、casnlヌクレアーゼまたはCRISPR(クラスターを形成する規則的な間隔の短いパリンドロームリピート)関連ヌクレアーゼと呼ばれることもある。例示的なCas9は、ストレプトコッカス・ピロゲネスCas9(spCas9)であり、そのアミノ酸配列は下記に示される:
Figure 2022545950000003
(単下線:HNHドメイン;二重下線:RuvCドメイン)
用語「保存的アミノ酸置換」または「保存的変異」とは、1アミノ酸を、共通の特性を有する別のアミノ酸に置換することを指す。個々のアミノ酸間の共通の特性を規定する機能的な方法は、相同性のある生物の対応するタンパク質間のアミノ酸変化の正規化頻度を分析することである(Schulz, G. E. and Schirmer, R. H., Principles of Protein Structure, Springer-Verlag, New York (1979))。そのような分析に従って、アミノ酸群を規定することができるが、その場合、群内のアミノ酸は互いに選好的に交換し、それゆえにタンパク質構造全体にそれらが及ぼす影響という点では互いに最もよく似ている(Schulz, G. E. and Schirmer, R. H.、前掲)。保存的変異の非限定的な例としては、アミノ酸のアミノ酸置換、例えば、正電荷を維持できるようにアルギニンをリジンに、およびその逆に;負電荷を維持できるようにアスパラギン酸をグルタミン酸に、およびその逆に;フリーの-OHを維持できるようにスレオニンをセリンに;ならびにフリーのNHを維持できるようにアスパラギンをグルタミンにすることが挙げられる。
本明細書に互換的に用いられる際の用語「コード配列」または「タンパク質コード配列」とは、タンパク質をコードするポリヌクレオチドのセグメントを指す。この領域または配列は、開始コドンにより5’端近くで、および終止コドンにより3’3’端近くで仕切られている。本明細書に記載の塩基エディターに有益な終止コドンとしては、以下が挙げられる:
グルタミン CAG→TAG 終止コドン
CAA→TAA
アルギニン CGA→TGA
トリプトファン TGG→TGA
TGG→TAG
TGG→TAA
コード配列は、オープンリーディングフレームとも呼ぶことができる。
「シチジンデアミナーゼ」とは、アミノ基をカルボニル基に変換する脱アミノ化反応を触媒することのできる、ポリペプチドまたはその断片を意味する。一実施形態では、シチジンデアミナーゼは、シトシンからウラシルにまたは5-メチルシトシンからチミンに変換する。ウミヤツメ(Petromyzon marinus)由来のPmCDA1(ウミヤツメシトシンデアミナーゼ1、「PmCDA1」)、哺乳動物、または異なる種の哺乳動物(例えば、ヒト、ブタ、ウシ、ウマ、サルなど)、および非哺乳動物、例えばアリゲーターに由来するAID(活性化誘発性シチジンデアミナーゼ;AICDA)、ならびにAPOBECが、例示的なシチジンデアミナーゼである。
本明細書に用いられる用語「デアミナーゼ」または「デアミナーゼドメイン」は、脱アミノ化反応を触媒するタンパク質または酵素を指す。一部の実施形態では、デアミナーゼまたはデアミナーゼドメインは、シチジンまたはデオキシシチジンからそれぞれウリジンまたはデオキシウリジンへの加水分解性脱アミノ化を触媒するシチジンデアミナーゼである。一部の実施形態では、デアミナーゼまたはデアミナーゼドメインは、シトシンからウラシルへの加水分解性脱アミノ化を触媒するシトシンデアミナーゼである。一部の実施形態では、デアミナーゼは、アデニンからヒポキサンチンへの加水分解性脱アミノ化を触媒するアデノシンデアミナーゼである。一部の実施形態では、デアミナーゼは、アデノシンまたはアデニン(A)からイノシン(I)への加水分解性脱アミノ化を触媒するアデノシンデアミナーゼである。一部の実施形態では、デアミナーゼまたはデアミナーゼドメインは、アデノシンまたはデオキシアデノシンからそれぞれイノシンまたはデオキシイノシンへの加水分解性脱アミノ化を触媒するアデノシンデアミナーゼである。一部の実施形態では、アデノシンデアミナーゼは、デオキシリボ核酸(DNA)中のアデノシンの加水分解性脱アミノ化を触媒する。本明細書に示されるアデノシンデアミナーゼ(例えば、工学的に改変されたアデノシンデアミナーゼ、進化型アデノシンデアミナーゼ)は、細菌などの任意の生物に由来し得る。一部の実施形態では、アデノシンデアミナーゼは、大腸菌、スタフィロコッカス・アウレウス、サルモネラ・ティフィリウム、シェワネラ・プトレファシエンス、ヘモフィルス・インフルエンザ、またはカウロバクター・クレセンタスなどの細菌由来である。一部の実施形態では、アデノシンデアミナーゼはTadAデアミナーゼである。一部の実施形態では、デアミナーゼまたはデアミナーゼドメインは、ヒト、チンパンジー、ゴリラ、サル、ウシ、イヌ、ラット、またはマウスなどの生物由来の天然のデアミナーゼのバリアントである。一部の実施形態では、デアミナーゼまたはデアミナーゼドメインは、天然に発生しない。例えば、一部の実施形態では、デアミナーゼまたはデアミナーゼドメインは、天然のデアミナーゼと少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、少なくとも99.1%、少なくとも99.2%、少なくとも99.3%、少なくとも99.4%、少なくとも99.5%、少なくとも99.6%、少なくとも99.7%、少なくとも99.8%、または少なくとも99.9%同一である。
「直接的」とは、存在、不在、または検出される分析物の量を特定することを指す。一実施形態では、ポリヌクレオチドまたはポリペプチド中の配列変更が検出される。別の実施形態では、インデルの存在が検出される。
「検出可能な標識」とは、目的の分子に連結された際に分光学的、光化学的、生化学的、免疫化学的、または化学的な手段を介して後者を検出可能にする組成物を意味する。例えば、有用な標識としては、放射性同位元素、磁性ビーズ、金属ビーズ、コロイド粒子、蛍光色素、高電子密度試薬、(例えば酵素連結免疫吸着アッセイ(ELISA)に一般に用いられるような)酵素、ビオチン、ジゴキシゲニン、またはハプテンが挙げられる。
「疾患」とは、細胞、組織、または器官の正常な機能を損傷または妨害する任意の状態または障害を意味する。具体的な実施形態では、本発明の組成物を用いる治療に適用可能な疾患は、異常なスプライシングに関連する。具体的な一実施形態では、疾患とはシュワックマン・ダイアモンド症候群(SDS)である。
「異常なスプライシングに関連する疾患」とは、スプライシングに影響を及ぼす遺伝子配列中の変更、例えばスプライスアクセプター部位またはスプライスドナー部位内の変更などに起因する転写の中断に関連する、任意の状態または障害を意味する。
「有効量」とは、無治療の患者または疾患のない個体、すなわち健康な個体に比べて疾患の症状を寛解させるのに必要な剤または活性化合物、例えば、本明細書に記載されるような塩基エディターの量を意味するか、または所望の生物学的応答を惹起するのに十分な剤または活性化合物の量である。疾患の治療的処置のために本発明を実践するのに用いられる活性化合物の有効量は、投与様式、対象の年齢、体重、および全身の健康状態に応じて様々である。最終的には、担当する医師または獣医師が適正な量および投与レジメンを決定するものとなる。そのような量が「有効な」量と呼ばれる。一実施形態では、有効量とは、細胞(例えばin vitroまたはin vivoの細胞)内の目的の遺伝子に変更を導入するのに十分な本発明の塩基エディターの量である。一実施形態では、有効量とは、治療効果を達成するのに必要な塩基エディターの量である。そのような治療効果は、対象、組織、器官の全ての細胞において病原性遺伝子を変更するのに十分である必要はないが、対象、組織、または器官内に存在する細胞の約1%、5%、10%、25%、50%、75%以上の病原性遺伝子を変更すればよい。一実施形態では、有効量は、疾患の1つまたは複数の症状を寛解させるのに十分である。
一部の実施形態では、本明細書に示される融合タンパク質の形態であり得るnCas9ドメインとデアミナーゼドメイン(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ)とを含む核酸塩基エディター、またはnCas9ドメインとデアミナーゼドメイン(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ)とを含む核酸塩基エディターを含む剤もしくは組成物の有効量とは、本明細書に記載の核酸塩基エディターにより特異的に結合され編集される標的部位の編集を誘導するのに十分な量を指す。当業者によって理解されるように、剤、例えば、融合タンパク質の有効量は、様々な要因に応じて、例えば、所望の生物学的反応に応じて、例えば、編集される特異的な対立遺伝子、ゲノム、もしくは標的部位に応じて、標的となっている細胞もしくは組織に応じて、および/または用いられている剤に応じて、変わり得る。
一部の実施形態では、融合タンパク質の形態であり得る剤、例えば、nCas9ドメインとデアミナーゼドメインとを含む融合タンパク質の有効量とは、融合タンパク質によって特異的に結合され編集される標的部位の編集を誘導するのに十分な剤、例えば、融合タンパク質の量を指し得る。当業者によって理解されるように、剤、例えば融合タンパク質、ヌクレアーゼ、ハイブリッドタンパク質、タンパク質二量体、タンパク質の複合体(またはタンパク質二量体)、およびポリヌクレオチド、またはポリヌクレオチドの有効量は、様々な要因に応じて、例えば、所望の生物学的反応に応じて、例えば、編集される特異的な対立遺伝子、ゲノム、もしくは標的部位に応じて、標的となっている細胞もしくは組織に応じて、および/または用いられている剤に応じて、変わり得る。
「断片」とは、ポリペプチドまたは核酸分子の一部分を意味する。この一部分は、参照の核酸分子またはポリペプチドの全長の少なくとも約10%、20%、30%、40%、50%、60%、70%、80%、または90%を含有する。断片は、10、20、30、40、50、60、70、80、90、または100、200、300、400、500、600、700、800、900、または1000個のヌクレオチドまたはアミノ酸を含有し得る。
「ガイドRNA」または「gRNA」とは、標的配列に特異的であって、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインタンパク質(例えば、Cas9またはCpf1)との複合体を形成することのできるポリヌクレオチドを意味する。一実施形態では、ガイドポリヌクレオチドとは、ガイドRNA(gRNA)である。gRNAは、2つ以上のRNAの複合体として、または単一RNA分子として存在することができる。単一RNA分子として存在するgRNAは、単一ガイドRNA(sgRNA)とも呼ばれることがあるが、尤も、「gRNA」は、単一分子としてまたは2つ以上の分子の複合体として存在するガイドRNAを指すために互換的に用いられる。典型的には、単一RNA種として存在するgRNAは、2つのドメイン:(1)標的核酸との相同性(および例えばCas9複合体の標的との直接的な結合)を共有するドメインと;(2)Cas9タンパク質に結合するドメインとを含む。一部の実施形態では、ドメイン(2)は、tracrRNAとして公知の配列に対応し、ステムループ構造を有する。例えば、一部の実施形態では、ドメイン(2)は、その全体の内容が本明細書に参照により組み込まれるJinek et al., Science 337:816-821(2012)に記載されるようなtracrRNAに一致するかまたは相同である。gRNAの他の例(例えばドメイン2を含むもの)は、「Switchable Cas9 Nucleases and Uses Thereof」と題された米国特許出願公開第20160208288号、および「Delivery System For Functional Nucleases」と題された米国特許第9,737,604号に見出すことができ、それぞれの全体の内容は、ここに参照によりその全体を組み込まれる。一部の実施形態では、gRNAは、2つ以上のドメイン(1)および(2)を含み、「延長型gRNA」とも呼ばれることがある。延長型gRNAは、本明細書に記載されるように、2つ以上のCas9タンパク質を結合し、2つ以上の異なる領域で標的核酸を結合するものとなる。gRNAは、標的部位を相補するヌクレオチド配列を含み、この配列は、ヌクレアーゼ/RNA複合体の標的部位との結合を媒介し、ヌクレアーゼ:RNA複合体の配列特異性をもたらす。
「ハイブリダイゼーション」とは、相補的な核酸塩基間の水素結合を意味し、この結合は、ワトソン・クリック水素結合、フーグスティーン水素結合、または逆フーグスティーン水素結合であり得る。例えば、アデニンとチミンとは、水素結合の形成を通じて対を成す相補的な核酸塩基である。
「増加する」とは、少なくとも10%、25%、50%、75%、または100%の正の変更を意味する。
用語「塩基修復の阻害物質」、「塩基修復阻害物質」、「IBR」、またはそれらの文法的に等価な語は、核酸修復酵素、例えば塩基除去修復酵素の活性を阻害することのできるタンパク質を指す。一部の実施形態では、IBRは、イノシン塩基除去修復の阻害物質である。塩基修復の例示的な阻害物質としては、APE1、EndoIII、EndoIV、EndoV、EndoVIII、Fpg、hOGGl、hNEILl、T7Endol、T4PDG、UDG、hSMUGl、およびhAAGの阻害物質が挙げられる。一部の実施形態では、塩基修復阻害物質は、EndoVまたはhAAGの阻害物質である。一部の実施形態では、IBRは、EndoVまたはhAAGの阻害物質である。一部の実施形態では、IBRは、触媒として不活性のEndoVまたは触媒として不活性のhAAGである。一部の実施形態では、塩基修復阻害物質は、触媒として不活性のEndoVまたは触媒として不活性のhAAGである。一部の実施形態では、塩基修復阻害物質はウラシルグリコシラーゼ阻害物質(UGI)である。UGIとは、ウラシルDNAグリコシラーゼ塩基除去修復酵素を阻害することのできるタンパク質を指す。一部の実施形態では、UGIドメインは、野生型UGIまたは野生型UGIの断片を含む。一部の実施形態では、本明細書に示されるUGIタンパク質には、UGIの断片と、UGIまたはUGI断片に相同なタンパク質とが含まれる。一部の実施形態では、塩基修復阻害物質は、イノシン塩基除去修復の阻害物質である。一部の実施形態では、塩基修復阻害物質は、「触媒として不活性のイノシン特異的ヌクレアーゼ」または「活性のないイノシン特異的ヌクレアーゼ」である。特定の理論に拘束されることを望むものではないが、触媒として不活性のイノシングリコシラーゼ(例えば、アルキルアデニングリコシラーゼ(AAG))は、イノシンに結合することができるが、脱塩基部位を作り出すこともイノシンを除去することもできず、それによって、新しく形成されたイノシン部分をDNA損傷/修復機構から立体的に遮断する。一部の実施形態では、触媒として不活性のイノシン特異的ヌクレアーゼは、核酸内でイノシンの結合を可能とすることができるが、核酸を切断しない。非制限的で例示的な触媒として不活性のイノシン特異的ヌクレアーゼとしては、触媒として不活性のアルキルアデノシングリコシラーゼ(AAGヌクレアーゼ)であって例えばヒト由来のもの、および触媒として不活性のエンドヌクレアーゼV(EndoVヌクレアーゼ)であって例えば大腸菌由来のものが挙げられる。一部の実施形態では、触媒として不活性のAAGヌクレアーゼは、E125Q変異または別のAAGヌクレアーゼ中の対応する変異を含む。
「インテイン」とは、タンパク質スプライシングとして知られる過程において、それ自体を切除して残りの断片(エクステイン)をペプチド結合に接合することのできるタンパク質の断片である。インテインはまた、「タンパク質イントロン」とも呼ばれる。「それ自体を切除しそのタンパク質の残りの部分を接合するインテインの過程」は、本明細書では「タンパク質スプライシング」または「インテイン媒介性タンパク質スプライシング」と称される。一部の実施形態では、前駆体タンパク質のインテイン(インテイン媒介性タンパク質スプライシングの前のインテイン含有タンパク質)は、2つの遺伝子に由来する。そのようなインテインは、本明細書ではスプリットインテイン(例えば、スプリットインテイン-Nおよびスプリットインテイン-C)と称される。例えば、シアノバクテリアでは、DNAポリメラーゼIIIの触媒サブユニットであるDnaEは、2つの別々の遺伝子dnaE-nおよびdnaE-cによりコードされる。dnaE-n遺伝子によりコードされるインテインは、本明細書では「インテイン-N」と称されることがある。dnaE-c遺伝子によりコードされるインテインは、本明細書では「インテイン-C」と称されることがある。
他のインテインシステムも用いられてもよい。例えば、dnaEインテインをベースとした合成インテイン、Cfa-N(例えばスプリットインテイン-N)およびCfa-C(例えばスプリットインテイン-C)のインテイン対が記載されている(例えば、本明細書に参照により組み込まれるStevens et al., J Am Chem Soc. 2016 Feb. 24; 138(7):2162-5)。本開示にしたがって用いられ得るインテイン対の非限定的な例としては、Cfa DnaEインテイン、Ssp GyrBインテイン、Ssp DnaXインテイン、Ter DnaE3インテイン、Ter ThyXインテイン、Rma DnaBインテイン、およびCne Prp8インテイン(本明細書に参照により組み込まれる米国特許第8,394,604号に記載されるようなものが挙げられる。
インテインの例示的なヌクレオチドおよびアミノ酸配列が示される。
DnaEインテイン-N DNA:TGCCTGTCATACGAAACCGAGATACTGACAGTAGAATATGGCCTTCTGCCAATCGGGAAGATTGTGGAGAAACGGATAGAATGCACAGTTTACTCTGTCGATAACAATGGTAACATTTATACTCAGCCAGTTGCCCAGTGGCACGACCGGGGAGAGCAGGAAGTATTCGAATACTGTCTGGAGGATGGAAGTCTCATTAGGGCCACTAAGGACCACAAATTTATGACAGTCGATGGCCAGATGCTGCCTATAGACGAAATCTTTGAGCGAGAGTTGGACCTCATGCGAGTTGACAACCTTCCTAAT
DnaEインテイン-N タンパク質: CLSYETEILTVEYGLLPIGKIVEKRIECTVYSVDNNGNIYTQPVAQWHDR GEQEVFEYCLEDGSLIRATKDHKFMTVDGQMLPIDEIFERELDLMRVDNL PN
DnaE インテイン-C DNA:ATGATCAAGATAGCTACAAGGAAGTATCTTGGCAAACAAAACGTTTATGA TATTGGAGTCGAAAGAGATCACAACTTTGCTCTGAAGAACGGATTCATAG CTTCTAAT
インテイン-C: MIKIATRKYLGKQNVYDIGVERDHNFALKNGFIASN
Cfa-N DNA:TGCCTGTCTTATGATACCGAGATACTTACCGTTGAATATGGCTTCTTGCCTATTGGAAAGATTGTCGAAGAGAGAATTGAATGCACAGTATATACTGTAGACAAGAATGGTTTCGTTTACACACAGCCCATTGCTCAATGGCACAATCGCGGCGAACAAGAAGTATTTGAGTACTGTCTCGAGGATGGAAGCATCATACGAGCAACTAAAGATCATAAATTCATGACCACTGACGGGCAGATGTTGCCAATAGATGAGATATTCGAGCGGGGCTTGGATCTCAAACAAGTGGATGGATTGCCA
Cfa-N タンパク質:
CLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGLDLKQVDGLP
Cfa-C DNA:ATGAAGAGGACTGCCGATGGATCAGAGTTTGAATCTCCCAAGAAGAAGAGGAAAGTAAAGATAATATCTCGAAAAAGTCTTGGTACCCAAAATGTCTATGATATTGGAGTGGAGAAAGATCACAACTTCCTTCTCAAGAACGGTCTCGTAGCCAGCAAC
Cfa-C タンパク質:MKRTADGSEFESPKKKRKVKIISRKSLGTQNVYDIGVEKDHNFLLKNGLVASN
インテイン-Nおよびインテイン-Cは、スプリットCas9のN末端部分およびスプリットCas9のC末端部分の接合のために、スプリットCas9のN末端部分およびスプリットCas9のC末端部分にそれぞれ融合されていてもよい。例えば、一部の実施形態では、インテイン-Nは、スプリットCas9のN末端部分のC末端に融合され、すなわち、N-[スプリットCas9のN末端部分]-[インテイン-N]-Cの構造を形成する。一部の実施形態では、インテイン-Cは、スプリットCas9のC末端部分のN末端に融合され、すなわち、N-[インテイン-C]-[スプリットCas9のC末端部分]-Cの構造を形成する。インテインの融合されるタンパク質(例えば、スプリットCas9)を接合するためのインテイン媒介性タンパク質スプライシングの機構は、当技術分野に公知であり、例えば、本明細書に参照により組み込まれるShah et al., Chem Sci. 2014; 5(1):446-461に記載される。インテインを設計し使用するための方法は、当技術分野に公知であり、例えば、WO2014004336、WO2017132580、米国特許出願公開第20150344549号、および米国特許出願公開第20180127780号に記載され、これらはいずれも本明細書に参照によりその全体を組み込まれる。
用語「単離される」、「精製される」、または「生物学的に純粋な」とは、物質がその本来の状態に見出される際に通常付随する構成成分を様々な程度で含まないことを指す。「単離する」とは、元来の供給源または環境からの分離の程度を指す。「精製する」とは、単離よりも高度な分離の程度を指す。「精製された」または「生物学的に純粋な」タンパク質は、いかなる不純物もタンパク質の生物学的特性に物質的に影響を及ぼさないかまたは他の有害な結果を生じない程度に、他の物質を含まない。換言すれば、本発明の核酸またはペプチドは、細胞由来物質、ウイルス由来物質、または組換えDNA手法により生産された際の培養培地、または化学合成された際の化学前駆体もしくは他の化学物質を実質的に含まない場合に、精製されている。純度および均一性は、典型的には分析化学手法、例えば、ポリアクリルアミドゲル電気泳動または高性能液体クロマトグラフィーを用いて決定される。用語「精製される」とは、核酸またはタンパク質が電気泳動ゲルにおいて本質的に1つのバンドを生じることを指し得る。修飾、例えば、リン酸化またはグリコシル化に供され得るタンパク質については、異なる修飾により異なる単離タンパク質が生じることがあり、それらは別々に精製することができる。
「単離されたポリヌクレオチド」とは、本発明の核酸分子の由来する生物の天然のゲノムにおいて、その遺伝子の側面に位置する遺伝子を含まない核酸(例えばDNA)を意味する。そのためこの用語は、例えば、ベクター内、自律的に複製するプラスミドまたはウイルス内、または原核生物もしくは真核生物のゲノムDNA内に組み込まれるか、または他の配列とは独立して別々の分子(例えば、PCRもしくは制限エンドヌクレアーゼ消化により生じるcDNAまたはゲノムDNA断片またはcDNA断片)として存在する、組換えDNAを含む。さらに、この用語は、DNA分子から転写されるRNA分子、ならびに追加のポリペプチド配列をコードするハイブリッド遺伝子の一部である組換えDNAを含む。
「単離されたポリペプチド」とは、天然に付随する構成成分から分離されている本発明のポリペプチドを意味する。典型的には、ポリペプチドは、天然に付随するタンパク質および天然有機分子を重量で少なくとも60%含まない場合に、単離されている。好ましくは、調製物は、重量で少なくとも75%、さらに好ましくは少なくとも90%、最も好ましくは少なくとも99%の本発明のポリペプチドである。本発明の単離されたポリペプチドは、例えば、天然の供給源からの抽出によって、そのようなポリペプチドをコードする組換え核酸の発現によって、またはタンパク質の化学合成によって、取得されてもよい。純度は、任意の適切な方法、例えば、カラムクロマトグラフィー、ポリアクリルアミドゲル電気泳動によって、またはHPLC分析によって、測定することができる。
用語「リンカー」とは、本明細書に用いられる際には、2つの分子もしくは部分、例えば、タンパク質複合体もしくはリボ核複合体の2つの構成成分、または融合タンパク質の2つのドメイン、例えば、ポリヌクレオチドプログラマブルDNA結合ドメイン(例えばdCas9)およびデアミナーゼドメイン((例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、もしくはアデノシンデアミナーゼおよびシチジンデアミナーゼ)を連結している共有結合性リンカー(例えば共有結合)、非共有結合性リンカー、化学基、または分子を指し得る。リンカーは、塩基エディターシステムの異なる構成成分または構成成分の異なる部分を接合することができる。例えば、一部の実施形態では、リンカーは、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインのガイドポリヌクレオチド結合ドメインとデアミナーゼの触媒ドメインとを接合することができる。一部の実施形態では、リンカーは、CRISPRポリペプチドとデアミナーゼとを接合することができる。一部の実施形態では、リンカーは、Cas9とデアミナーゼとを接合することができる。一部の実施形態では、リンカーは、dCas9とデアミナーゼとを接合することができる。一部の実施形態では、リンカーは、nCas9とデアミナーゼとを接合することができる。一部の実施形態では、リンカーは、ガイドポリヌクレオチドとデアミナーゼとを接合することができる。一部の実施形態では、リンカーは、塩基エディターシステムの脱アミノ化構成成分とポリヌクレオチドプログラマブルヌクレオチド結合構成成分とを接合することができる。一部の実施形態では、リンカーは、塩基エディターシステムの脱アミノ化構成成分のRNA結合部分とポリヌクレオチドプログラマブルヌクレオチド結合構成成分とを接合することができる。一部の実施形態では、リンカーは、塩基エディターシステムの脱アミノ化構成成分のRNA結合部分とポリヌクレオチドプログラマブルヌクレオチド結合構成成分のRNA結合部分とを接合することができる。リンカーは、2つの基、分子、または他の部分の間に位置するかまたはそれらを側面に配し、共有結合または非共有結合を介してそれぞれ接続され、ゆえに上記2つを接続することができる。一部の実施形態では、リンカーは、有機分子、基、ポリマー、または化学部分とすることができる。一部の実施形態では、リンカーはポリヌクレオチドとすることができる。一部の実施形態では、リンカーはDNAリンカーとすることができる。一部の実施形態では、リンカーはRNAリンカーとすることができる。一部の実施形態では、リンカーは、リガンドへの結合が可能なアプタマーを含むことができる。一部の実施形態では、リガンドは、炭水化物、ペプチド、タンパク質、または核酸であってもよい。一部の実施形態では、リンカーは、リボスイッチに由来し得るアプタマーを含んでいてもよい。アプタマーの由来するリボスイッチは、テオフィリンリボスイッチ、チアミンピロリン酸(TPP)リボスイッチ、アデノシンコバラミン(AdoCbl)リボスイッチ、S-アデノシルメチオニン(SAM)リボスイッチ、SAHリボスイッチ、フラビンモノヌクレオチド(FMN)リボスイッチ、テトラヒドロ葉酸リボスイッチ、リジンリボスイッチ、グリシンリボスイッチ、プリンリボスイッチ、GlmSリボスイッチ、またはプレクオシン1(PreQ1)リボスイッチから選択され得る。一部の実施形態では、リンカーは、ポリペプチドまたはタンパク質ドメイン、例えばポリペプチドリガンドなどに結合されたアプタマーを含んでいてもよい。一部の実施形態では、ポリペプチドリガンドは、Kホモロジー(KH)ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、滅菌アルファモチーフ、テロメラーゼKu結合モチーフおよびKuタンパク質、テロメラーゼSm7結合モチーフおよびSm7タンパク質、またはRNA認識モチーフであり得る。一部の実施形態では、ポリペプチドリガンドは、塩基エディターシステム構成成分の一部分としてもよい。例えば、核酸塩基編集構成成分は、デアミナーゼドメインとRNA認識モチーフとを含んでいてもよい。
一部の実施形態では、リンカーは、1アミノ酸または複数のアミノ酸(例えば、ペプチドもしくはタンパク質)とすることができる。一部の実施形態では、リンカーは、約5~100アミノ酸の長さ、例えば、約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、20~30、30~40、40~50、50~60、60~70、70~80、80~90、または90~100アミノ酸の長さとすることができる。一部の実施形態では、リンカーは、約100~150、150~200、200~250、250~300、300~350、350~400、400~450、または450~500アミノ酸の長さとすることができる。さらに長いかまたは短いリンカーも想定される。
一部の実施形態では、リンカーは、Cas9ヌクレアーゼドメインを含めたRNAプログラマブルヌクレアーゼのgRNA結合ドメインと、核酸編集タンパク質の触媒ドメイン(例えば、シチジンまたはアデノシンデアミナーゼ)とを接合する。一部の実施形態では、リンカーは、dCas9と核酸編集タンパク質とを接合する。例えば、リンカーは、2つの基、分子、または他の部分の間に配置されるかまたはそれらの側面に配され、共有結合を介してそれぞれ接続され、ゆえに上記2つを接続する。一部の実施形態では、リンカーは、1アミノ酸または複数のアミノ酸(例えば、ペプチドもしくはタンパク質)である。一部の実施形態では、リンカーは、有機分子、基、ポリマー、または化学部分である。一部の実施形態では、リンカーは、5~200アミノ酸の長さであり、例えば、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、35、45、50、55、60、60、65、70、70、75、80、85、90、90、95、100、101、102、103、104、105、110、120、130、140、150、160、175、180、190、または200アミノ酸の長さである。
一部の実施形態では、塩基エディターのドメインは、SGGSSGSETPGTSESATPESSGGS、SGGSSGGSSGSETPGTSESATPESSGGSSGGS、またはGGSGGSPGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGSEPATSGGSGGSのアミノ酸配列を含むリンカーを介して融合されている。一部の実施形態では、塩基エディターのドメインは、XTENリンカーと呼ばれることがあるアミノ酸配列SGSETPGTSESATPESを含むリンカーを介して融合されている。一部の実施形態では、リンカーは24アミノ酸の長さである。一部の実施形態では、リンカーは、アミノ酸配列SGGSSGGSSGSETPGTSESATPESを含む。一部の実施形態では、リンカーは40アミノ酸の長さである。一部の実施形態では、リンカーは、アミノ酸配列SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGGSSGGSを含む。一部の実施形態では、リンカーは64アミノ酸の長さである。一部の実施形態では、リンカーは、アミノ酸配列SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGGSSGGSSGSETPGTSESATPESSGGSSGGSを含む。一部の実施形態では、リンカーは92アミノ酸の長さである。一部の実施形態では、リンカーは、アミノ酸配列PGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGSEPATSを含む。
「マーカー」とは、疾患または障害に関連する発現レベルまたは活性の変更を含む任意のタンパク質またはポリヌクレオチドを意味する。
用語「変異」とは、本明細書に用いられる際には、配列内、例えば、核酸配列もしくはアミノ酸配列内の残基の置換、別の残基への残基の置換、または配列内の1つまたは複数残基の欠失もしくは挿入を指す。一部の実施形態では、挿入とは、野生型配列の全部または一部を置き換える遺伝子変換である。変異は、典型的には、本来の残基、続いて配列内のその残基の位置、および新たに置換される残基のアイデンティティを特定することによって、本明細書に記載される。本明細書に示されるアミノ酸置換(変異)を作製するための様々な方法が、当技術分野に周知されており、例えば、Green and Sambrook, Molecular Cloning: A Laboratory Manual (4th ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (2012))により示されている。
一部の実施形態では、ここに開示される塩基エディターは、かなりの数の目的外の変異、例えば目的外の点変異などを生成することなく、核酸(例えば、対象のゲノム内の核酸)内の「目的の変異」、例えば点変異などを効率的に生成することができる。一部の実施形態では、目的の変異とは、目的の変異を生成するように特異的に設計されたガイドポリヌクレオチド(例えばgRNA)に結合されている特異的塩基エディター(例えば、シチジン塩基エディターまたはアデノシン塩基エディター)によって生成される変異である。
概して、配列(例えば、本明細書に記載のアミノ酸配列)中に作製または特定された変異は、参照(または野生型)配列、すなわち、その変異を含有しない配列に関連して付番される。当業者は、参照配列に比較してアミノ酸配列および核酸配列変異の位置をどのように決定するのかを容易に理解するものとなる。
用語「非保存的な変異」とは、異なる群の間、例えば、トリプトファンからリジンへ、またはセリンからフェニルアラニンへなどのアミノ酸置換を含む。この場合、非保存的なアミノ酸置換が、機能性バリアントの生物活性に干渉しないかまたはそれを阻害しないことが好ましい。非保存的なアミノ酸置換は、機能性バリアントの生物活性が野生型タンパク質に比べて増加するように、機能性バリアントの生物活性を増強することができる。
用語「核局在化配列」、「核局在化シグナル」、または「NLS」とは、細胞核内へのタンパク質の移入を促進するアミノ酸配列を指す。核局在化配列は、当技術分野に公知であり、例えば、Plankら、2000年11月23日出願の国際PCT出願PCT/EP2000/011690、2001年5月31日公開のWO/2001/038547に記載されており、その内容は、例示的な核局在化配列の開示について参照により本明細書に組み込まれている。他の実施形態では、NLSとは、最適化されたNLSであり、例えば、Koblan et al., Nature Biotech. 2018 doi:10.1038/nbt.4172.に記載されている。本発明の方法に有用な最適化された配列は、図8A~図8E(Koblan et al., 前掲)に示されている。一部の実施形態では、NLSは、アミノ酸配列KRTADGSEFESPKKKRKV、KRPAATKKAGQAKKKK、KKTELQTTNAENKTKKL、KRGINDRNFWRGENGRKTR、RKSGKIAAIVVKRPRK、PKKKRKV、またはMDSLLMNRRKFLYQFKNVRWAKGRRETYLCを含む。
本明細書に互換的に用いられる用語「核酸塩基」、「含窒塩基」、または「塩基」とは、ヌクレオシド、さらにはヌクレオチドの構成成分を形成する、窒素を含有する生体化合物を指す。核酸塩基が塩基対を形成し、1つを別の1つに積み重ねる能力によって、リボ核酸(RNA)およびデオキシリボ核酸(DNA)などの長鎖の螺旋構造が直接的に生じる。5つの核酸塩基、すなわちアデニン(A)、シトシン(C)、グアニン(G)、チミン(T)、およびウラシル(U)は、主要または規準的と呼ばれる。アデニンおよびグアニンはプリンに由来し、シトシン、ウラシル、およびチミンはピリミジンに由来する。DNAおよびRNAは、修飾された他の(主要ではない)塩基も含有することができる。非制限的で例示的な修飾された核酸塩基としては、ヒポキサンチン、キサンチン、7-メチルグアニン、5,6-ジヒドロウラシル、5-メチルシトシン(m5C)、および5-ヒドロメチルシトシンを挙げることができる。ヒポキサンチンおよびキサンチンは、変異原の存在を通じて、どちらも脱アミノ化(アミン基からカルボニル基への置換)を通じて、作り出すことができる。ヒポキサンチンはアデニンから修飾することができる。キサンチンはグアニンから修飾することができる。ウラシルは、シトシンの脱アミノ化の結果として生じ得る。「ヌクレオシド」は、核酸塩基と5炭糖(リボースまたはデオキシリボースのどちらか)とから成る。ヌクレオシドの例としては、アデノシン、グアノシン、ウリジン、シチジン、5-メチルウリジン(m5U)、デオキシアデノシン、デオキシグアノシン、チミジン、デオキシウリジン、およびデオキシシチジンが挙げられる。修飾された核酸塩基を含むヌクレオシドの例としては、イノシン(I)、キサントシン(X)、7-メチルグアノシン(m7G)、ジヒドロウリジン(D)、5-メチルシチジン(m5C)、およびシュードウリジン(Ψ)が挙げられる。「ヌクレオチド」は、核酸塩基、5炭糖(リボースまたはデオキシリボのどちらか)、および少なくとも1つのリン酸基から成る。
用語「核酸」および「核酸分子」とは、本明細書に用いられる際には、核酸塩基と酸性部分を含む化合物、例えば、ヌクレオシド、ヌクレオチド、またはヌクレオチドのポリマーを指す。典型的には、ポリマー核酸、例えば、3つ以上のヌクレオチドを含む核酸分子は、直鎖状の分子であり、その中では、隣接するヌクレオチドが、ホスホジエステル結合を介して互いに連結されている。一部の実施形態では、「核酸」とは、個別の核酸残基(例えばヌクレオチドおよび/またはヌクレオシド)を指す。一部の実施形態では、「核酸」とは、3つ以上の個別のヌクレオチド残基を含むオリゴヌクレオチド鎖を指す。本明細書に用いられる際には、用語「オリゴヌクレオチド」および「ポリヌクレオチド」は、ヌクレオチドのポリマー(例えば、一続きの少なくとも3つのヌクレオチド)を指すために互換的に用いることができる。一部の実施形態では、「核酸」とは、RNAならびに一本鎖および/または二本鎖のDNAを包含する。核酸は、例えば、ゲノム、転写物、mRNA、tRNA、rRNA、siRNA、snRNA、プラスミド、コスミド、染色体、染色分体、または他の天然の核酸分子という状況において天然に発生したものとしてよい。一方、核酸分子は、非天然の分子、例えば、組換えDNAもしくはRNA、人工染色体、工学的に改変されたゲノム、またはそれらの断片、または合成のDNA、RNA、DNA/RNAハイブリッドであってもよいし、非天然のヌクレオチドまたはヌクレオシドを含んでいてもよい。さらに、用語「核酸」、「DNA」、「RNA」、および/または類似の用語は、核酸類似体、例えば、ホスホジエステル骨格以外のものを有する類似体を含む。核酸は、天然の供給源から精製する、組換え発現システムを用いて生産し任意選択的に精製する、化学合成するなどできる。適切であれば、例えば、化学的に合成される分子の場合、核酸は、ヌクレオシド類似体、例えば化学的に修飾された塩基または糖を有する類似体などと、骨格の修飾とを含むことができる。核酸配列は、別段に標示のない限り、5’から3’の方向で存在する。一部の実施形態では、核酸は、天然のヌクレオシド(例えばアデノシン、チミジン、グアノシン、シチジン、ウリジン、デオキシアデノシン、デオキシチミジン、デオキシグアノシン、およびデオキシシチジン);ヌクレオシド類似体(例えば、2-アミノアデノシン、2-チオチミジン、イノシン、ピロロ-ピリミジン、3-メチルアデノシン、5-メチルシチジン、2-アミノアデノシン、C5-ブロモウリジン、C5-フルオロウリジン、C5-ヨードウリジン、C5-プロピニル-ウリジン、C5-プロピニル-シチジン、C5-メチルシチジン、2-アミノアデノシン、7-デアザアデノシン、7-デアザグアノシン、8-オキソアデノシン、8-オキソグアノシン、O(6)-メチルグアニン、および2-チオシチジン);化学修飾塩基;生物学的に修飾された塩基(例えばメチル化塩基);インターカレーション塩基;修飾糖(2’-例えば、フルオロリボース、リボース、2’-デオキシリボース、アラビノース、およびヘキソース);ならびに/または修飾リン酸基(例えば、ホスホロチオエートおよび5’-N-ホスホロアミダイト結合)であるかまたはそれを含む。
用語「核酸プログラマブルDNA結合タンパク質」または「napDNAbp」は、napDNAbpを特異的な核酸配列にガイドする核酸(例えばDNAまたはRNA)、例えばガイド核酸またはガイドポリヌクレオチド(例えばgRNA)などに付随するタンパク質を指すために、「ポリヌクレオチドプログラマブルヌクレオチド結合ドメイン」と互換的に用いられることがある。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、ポリヌクレオチドプログラマブルDNA結合ドメインである。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、ポリヌクレオチドプログラマブルRNA結合ドメインである。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、Cas9タンパク質である。Cas9タンパク質は、ガイドRNAに相補的な特異的なDNA配列にCas9タンパク質をガイドするガイドRNAに付随し得る。一部の実施形態では、napDNAbpとはCas9ドメインであり、例えばヌクレアーゼ活性のCas9、Cas9ニッカーゼ(nCas9)、またはヌクレアーゼ不活性のCas9(dCas9)である。核酸プログラマブルDNA結合タンパク質の非限定的な例としては、Cas9(例えば、dCas9およびnCas9)、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、ならびにCas12iが挙げられる。Cas酵素の非限定的な例としては、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5d、Cas5t、Cas5h、Cas5a、Cas6、Cas7、Cas8、Cas8a、Cas8b、Cas8c、Cas9(Csn1またはCsx12としても公知である)、Cas10、Cas10d、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i、Csy1、Csy2、Csy3、Csy4、Cse1、Cse2、Cse3、Cse4、Cse5e、Csc1、Csc2、Csa5、Csn1、Csn2、Csm1、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx1S、Csx11、Csf1、Csf2、CsO、Csf4、Csd1、Csd2、Cst1、Cst2、Csh1、Csh2、Csa1、Csa2、Csa3、Csa4、Csa5、II型Casエフェクタータンパク質、V型Casエフェクタータンパク質、VI型Casエフェクタータンパク質、CARF、DinG、それらの相同体、またはそれらの改変型もしくは工学的に改変されたバージョンが挙げられる。他の核酸プログラマブルDNA結合タンパク質も、本開示に具体的に挙げられていないことがあるとはいえ本開示の範囲内にある。例えば、それぞれの内容の全てが参照によりここに組み込まれているMakarova et al. “Classification and Nomenclature of CRISPR-Cas Systems: Where from Here?” CRISPR J. 2018 Oct;1:325-336. doi: 10.1089/crispr.2018.0033; Yan et al., “Functionally diverse type V CRISPR-Cas systems” Science. 2019 Jan 4;363(6422):88-91. doi: 10.1126/science.aav7271を参照されたい。
用語「核酸塩基編集ドメイン」または「核酸塩基編集タンパク質」とは、本明細書に用いられる際には、RNAまたはDNA中の核酸塩基の修飾、例えばシトシン(もしくはシチジン)からウラシル(もしくはウリジン)またはチミン(もしくはチミジン)への、およびアデニン(またはアデノシン)からヒポキサンチン(またはイノシン)への脱アミノ化、ならびに非鋳型ヌクレオチドの付加および挿入などを触媒することのできるタンパク質または酵素を指す。一部の実施形態では、核酸塩基編集ドメインは、デアミナーゼドメイン(例えば、アデニンデアミナーゼもしくはアデノシンデアミナーゼ;またはシチジンデアミナーゼもしくはシトシンデアミナーゼ)である。一部の実施形態では、核酸塩基編集ドメインは1つ以上のデアミナーゼドメイン(例えば、アデニンデアミナーゼまたはアデノシンデアミナーゼ、およびシチジンまたはシトシンデアミナーゼ)である。一部の実施形態では、核酸塩基編集ドメインを天然の核酸塩基編集ドメインとすることができる。一部の実施形態では、核酸塩基編集ドメインは、天然の核酸塩基編集ドメインから工学的に改変されているかまたは進化型の核酸塩基編集ドメインである。核酸塩基編集ドメインは、任意の生物、例えば細菌、ヒト、チンパンジー、ゴリラ、サル、ウシ、イヌ、ラット、またはマウスを由来とすることができる。
本明細書に用いられる際に、「剤を得ること」にあるような「得ること」とは、剤を合成すること、単離すること、取り出すこと、購入すること、またはその他獲得することを含む。
本明細書に用いられる際の「患者」または「対象」とは、疾患または障害であるものと診断されたか、その発症のリスクがあるか、またはその発症の疑いのある哺乳類の対象または個体を指す。一部の実施形態では、SDSPをコードする遺伝子内に変異を有する対象は、シュワックマン・ダイアモンド症候群(SDS)に罹っているかまたはその発症のリスクがあるものと識別される。一部の実施形態では、用語「患者」とは、疾患または障害の発症の可能性が平均よりも高い哺乳類の対象を指す。例示的な患者は、本明細書に開示される療法の恩恵を得ることのできるヒト、非ヒト霊長類、ネコ、イヌ、ブタ、ウシ、ネコ、ウマ、ラクダ、ラマ、ヤギ、ヒツジ、齧歯類(例えば、マウス、ウサギ、ラット、アレチネズミ、またはモルモット)、および他の哺乳動物である。例示的なヒト患者は男性および/または女性とすることができる。
「それを必要とする患者」または「それを必要とする対象」とは、本明細書では、疾患または障害、例えばSDSであるものと診断されたか、その罹患のリスクがあるか、その罹患が予め定められているか、または罹患の疑いのある患者として参照される。
用語「病原性変異」、「病原性のバリアント」、「疾患を引き起こす変異」、「疾患を引き起こすバリアント」、「有害な変異」、または「素因となる変異」とは、ある特定の疾患または障害に対する個体の感受性または素因を増加させる遺伝子上の変更または変異を指す。一部の実施形態では、病原性変異は、SBDSタンパク質をコードするポリヌクレオチド中のスプライスアクセプター部位またはスプライスドナー部位内の変更を含む。一部の実施形態では、病原性変異は、SBDSタンパク質をコードするポリヌクレオチドのスプライシングを変更し、結果として、例えば、タンパク質の切詰またはその他SBDSタンパク質の発現または活性への負の影響を生じる。
用語「タンパク質」、「ペプチド」、「ポリペプチド」、およびそれらの文法的な等価物は、本明細書に互換的に用いられ、ペプチド(アミド)結合により合わせて連結されたアミノ酸残基のポリマーを指す。この用語は、任意のサイズ、構造、または機能のタンパク質、ペプチド、またはポリペプチドを指す。典型的には、タンパク質、ペプチド、またはポリペプチドは、少なくとも3アミノ酸の長さとなる。タンパク質、ペプチド、またはポリペプチドは、個々のタンパク質またはタンパク質のコレクションを指すことができる。タンパク質、ペプチド、またはポリペプチド中の1つまたは複数のアミノ酸は、コンジュゲーション、官能化、または他の修飾のための化学実体、例えば、炭水化物基、ヒドロキシル基、リン酸基、ファルネシル基、イソファルネシル基、脂肪酸基、リンカーなどによって、修飾することができる。タンパク質、ペプチド、またはポリペプチドは、単一の分子とすることもできるし、多分子の複合体とすることもできる。タンパク質、ペプチド、またはポリペプチドは、天然のタンパク質またはペプチドの断片のみとすることができる。タンパク質、ペプチド、またはポリペプチドは、天然、組換え、もしくは合成、またはそれらの任意の組合せとすることができる。本明細書に用いられる際の用語「融合タンパク質」とは、少なくとも2つの異なるタンパク質由来のタンパク質ドメインを含むハイブリッドポリペプチドを指す。1つのタンパクが、融合タンパク質のアミノ末端(N末端)部分またはカルボキシ末端(C末端)タンパク質に位置し、それゆえに、アミノ末端融合タンパク質またはカルボキシ末端融合タンパク質をそれぞれ形成することができる。タンパク質は、異なるドメイン、例えば、核酸編集タンパク質の核酸結合ドメイン(例えば、タンパク質と標的部位との結合を方向付けるCas9のgRNA結合ドメイン)と、核酸切断ドメインまたは触媒ドメインとを含むことができる。一部の実施形態では、タンパク質は、タンパク質性部分、例えば、核酸結合ドメインを構成するアミノ酸配列と、有機化合物、例えば、核酸切断剤として働くことのできる化合物とを含む。一部の実施形態では、タンパク質は、核酸、例えば、RNAまたはDNAと複合体を形成しているかまたは会合している。本明細書に示される任意のタンパク質は、当技術分野に公知の任意の方法によって生産することができる。例えば、本明細書に示されるタンパク質は、ペプチドリンカーを含む融合タンパク質に特に適した組換えタンパク質の発現および精製を介して生産することができる。組換えタンパク質の発現および精製のための方法は周知されており、Green and Sambrook, Molecular Cloning: A Laboratory Manual (4th ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (2012))により記載されたものが挙げられ、その全体の内容は本明細書に参照により組み込まれる。
本明細書に開示されたポリペプチドおよびタンパク質(機能性部分とその機能性バリアントを含む)は、1つまたは複数の天然のアミノ酸の代わりに合成アミノ酸を含むことができる。そのような合成アミノ酸は、当技術分野に公知であり、例えば、アミノシクロヘキサンカルボン酸、ノルロイシン、α-アミノn-デカン酸、ホモセリン、S-アセチルアミノメチル-システイン、トランス-3-およびトランス-4-ヒドロキシプロリン、4-アミノフェニルアラニン、4-ニトロフェニルアラニン、4-クロロフェニルアラニン、4-カルボキシフェニルアラニン、β-フェニルセリンβ-ヒドロキシフェニルアラニン、フェニルグリシン、α-ナフチルアラニン、シクロヘキシルアラニン、シクロヘキシルグリシン、インドリン-2-カルボン酸、1,2,3,4-テトラヒドロイソキノリン-3-カルボン酸、アミノマロン酸、アミノマロン酸モノアミド、N’-ベンジル-N’-メチル-リジン、N’,N’-ジベンジル-リジン、6-ヒドロキシリジン、オルニチン、α-アミノシクロペンタンカルボン酸、α-アミノシクロヘキサンカルボン酸、α-アミノシクロヘプタンカルボン酸、α-(2-アミノ-2-ノルボルナン)-カルボン酸、α,γ-ジアミノ酪酸、α,β-ジアミノプロピオン酸、ホモフェニルアラニン、およびα-tert-ブチルグリシンが挙げられる。ポリペプチドおよびタンパク質は、ポリペプチド構築物の1つまたは複数のアミノ酸の翻訳後修飾を付随し得る。翻訳後修飾の非限定的な例としては、リン酸化、アセチル化およびホルミル化を含むアシル化、グリコシル化(N-結合型およびO-結合型を含む)、アミド化、ヒドロキシル化、メチル化およびエチル化を含むアルキル化、ユビキチン化、ピロリドンカルボン酸の付加、ジスルフィド架橋の形成、硫酸化、ミリストイル化、パルミトイル化、イソプレニル化、ファルネシル化、ゲラニル化、グリピエーション、リポイル化、およびヨウ素化が挙げられる。
タンパク質または核酸のコンテクストで本明細書に用いられる際の用語「組換え」とは、自然に発生しないが人間工学の産物であるタンパク質または核酸を指す。例えば、一部の実施形態では、組換えタンパク質または核酸分子は、任意の天然の配列に比べて、少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、少なくとも5つ、少なくとも6つ、または少なくとも7つの変異を含むアミノ酸配列またはヌクレオチド配列を含む。
「低減する」とは、少なくとも10%、25%、50%、75%、または100%の負の変更を意味する。
「参照」とは、標準的なまたは対照の状態を意味する。一実施形態では、参照は、野生型のまたは健康な細胞である。例えば、野生型のまたは健康な細胞は、健康であるおよび/または疾患のない対象に由来することもあるしまたはそれから得られることもある。具体的な実施形態では、野生型のまたは健康な細胞は、野生型SBDSタンパク質(すなわち、野生型スプライシングを呈する野生型SBDS遺伝子の産物であるSBDSタンパク質)を発現する細胞である。他の実施形態では、かつ限定はないが、参照は、試験条件に供されないか、またはプラセボもしくは通常の生理食塩水、培地、緩衝液、および/または目的のポリヌクレオチドを持たない対照ベクターに供される、無処理の細胞である。
「参照配列」とは、配列比較のための基準として用いられる規定された配列である。参照配列は、指定された配列のサブセットまたは全体としてもよく、例えば、完全長のcDNAもしくは遺伝子の配列のセグメント、または完全なcDNAもしくは遺伝子の配列である。ポリペプチドについて、参照ポリペプチド配列の長さは、概して少なくとも約16アミノ酸、少なくとも約20アミノ酸、少なくとも約25アミノ酸、約35アミノ酸、約50アミノ酸、または約100アミノ酸となる。核酸について、参照核酸配列の長さは、概して、少なくとも約50ヌクレオチド、少なくとも約60ヌクレオチド、少なくとも約75ヌクレオチド、約100ヌクレオチド、もしくは約300ヌクレオチド、またはその前後もしくはその間の任意の整数である。一部の実施形態では、参照配列は、目的のタンパク質の野生型配列である。他の実施形態では、参照配列は、野生型タンパク質をコードするポリヌクレオチド配列である。
用語「RNAプログラマブルヌクレアーゼ」、および「RNAガイド型ヌクレアーゼ」は、切断のための標的ではない1つまたは複数のRNAと共に用いられる(例えば、そのようなRNAに結合または会合する)。一部の実施形態では、RNAプログラマブルヌクレアーゼは、RNAとの複合体中では、ヌクレアーゼ:RNA複合体と呼ばれることがある。典型的には、結合されるRNAは、ガイドRNA(gRNA)と呼ばれる。一部の実施形態では、RNAプログラマブルヌクレアーゼは、(CRISPR関連システム)Cas9エンドヌクレアーゼであり、例えば、ストレプトコッカス・ピロゲネス由来のCas9(Csnl)である(例えば "Complete genome sequence of an Ml strain of Streptococcus pyogenes." Ferretti J.J., McShan W.M., Ajdic D.J., Savic D.J., Savic G., Lyon K., Primeaux C, Sezate S., Suvorov A.N., Kenton S., Lai H.S., Lin S.P., Qian Y., Jia H.G., Najar F.Z., Ren Q., Zhu H., Song L., White J., Yuan X., Clifton S.W., Roe B.A., McLaughlin R.E., Proc. Natl. Acad. Sci. U.S.A. 98:4658-4663(2001);"CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III." Deltcheva E., Chylinski K., Sharma CM., Gonzales K., Chao Y., Pirzada Z.A., Eckert M.R., Vogel J., Charpentier E., Nature 471:602-607(2011)を参照されたい。
「シュワックマン・ボディアン・ダイアモンド症候群(SBDS)タンパク質」とは、NCBI受入番号NP_057122.2と少なくとも約85%のアミノ酸配列同一性を有し、SBDSの生物活性を有する、ポリペプチドまたはその断片を意味する。様々な実施形態では、SBDSの生物活性は、RNAプロセッシング、リボソームの生成、またはSBDSタンパク質に特異的に結合する抗体との結合において役割を果たすことを指す。
SBDSタンパク質のアミノ酸配列の一例を下記に示す:
MSIFTPTNQI RLTNVAVVRM KRAGKRFEIA CYKNKVVGWR SGVEKDLDEV LQTHSVFVNV SKGQVAKKED LISAFGTDDQ TEICKQILTK GEVQVSDKER HTQLEQMFRD IATIVADKCV NPETKRPYTV ILIERAMKDI HYSVKTNKST KQQALEVIKQ LKEKMKIERA HMRLRFILPV NEGKKLKEKL KPLIKVIESE DYGQQLEIVC LIDPGCFREI DELIKKETKG KGSLEVLNLK DVEEGDEKFE.
具体的な実施形態では、SBDSタンパク質はタンパク質切詰を含む。
「シュワックマン・ボディアン・ダイアモンド症候群(SBDS)ポリヌクレオチド」とは、SBDSタンパク質をコードする核酸配列を意味する。SBDSポリヌクレオチド配列の一例は、下記に複写されているNM_016038.2に示されている。SBDSポリヌクレオチドのオープンリーディングフレーム(ORF)は、ヌクレオチド185から937に延びている(下線部に示す)。
GTAAGTAAGC CTGCCAGACA CACTGTGACG GCTGCCTGAA GCTAGTGAGT CGCGGCGCCG CGCACTGGTG GTTGGGTCAG TGCCGCGCGC CGATCGGTCG TTACCGCGAG GCGCTGGTGG CCTTCAGGCT GGACGGCGCG GGTCAGCCCT GGTTCGCCGG CTTCTGGGTC TTTGAACAGC CGCGATGTCG ATCTTCACCC CCACCAACCA GATCCGCCTA ACCAATGTGG CCGTGGTACG GATGAAGCGT GCCGGGAAGC GCTTCGAAAT CGCCTGCTAC AAAAACAAGG TCGTCGGCTG GCGGAGCGGC GTGGAAAAAG ACCTCGATGA AGTTCTGCAG ACCCACTCAG TGTTTGTAAA TGTTTCTAAA GGTCAGGTTG CCAAAAAGGA AGATCTCATC AGTGCGTTTG GAACAGATGA CCAAACTGAA ATCTGTAAGC AGATTTTGAC TAAAGGAGAA GTTCAAGTAT CAGATAAAGA AAGACACACA CAACTGGAGC AGATGTTTAG GGACATTGCA ACTATTGTGG CAGACAAATG TGTGAATCCT GAAACAAAGA GACCATACAC CGTGATCCTT ATTGAGAGAG CCATGAAGGA CATCCACTAT TCGGTGAAAA CCAACAAGAG TACAAAACAG CAGGCTTTGG AAGTGATAAA GCAGTTAAAA GAGAAAATGA AGATAGAACG TGCTCACATG AGGCTTCGGT TCATCCTTCC AGTCAATGAA GGCAAGAAGC TGAAAGAAAA GCTCAAGCCA CTGATCAAGG TCATAGAAAG TGAAGATTAT GGCCAACAGT TAGAAATCGT ATGTCTGATT GACCCGGGCT GCTTCCGAGA AATTGATGAG CTAATAAAAA AGGAAACTAA AGGCAAAGGT TCTTTGGAAG TACTCAATCT GAAAGATGTA GAAGAAGGAG ATGAGAAATT TGAATGACAC CCATCAATCT CTTCACCTCT AAAACACTAA AGTGTTTCCG TTTCCGACGG CACTGTTTCA TGTCTGTGGT CTGCCAAATA CTTGCTTAAA CTATTTGACA TTTTCTATCT TTGTGTTAAC AGTGGACACA GCAAGGCTTT CCTACATAAG TATAATAATG TGGGAATGAT TTGGTTTTAA TTATAAACTG GGGTCTAAAT CCTAAAGCAA AATTGAAACT CCAAGATGCA AAGTCCAGAG TGGCATTTTG CTACTCTGTC TCATGCCTTG ATAGCTTTCC AAAATGAAAG TTACTTGAGG CAGCTCTTGT GGGTGAAAAG TTATTTGTAC AGTAGAGTAA GATTATTAGG GGTATGTCTA TACAACAAAA GGGGGGGTCT TTCCTAAAAA AGAAAACATA TGATGCTTCA TTTCTACTTA ATGGAACTTG TGTTCTGAGG GTCATTATGG TATCGTAATG TAAAGCTTGG ATGATGTTCC TGATTATCTG AGAAACAGAT ATAGAAAAAT TGTGCCGGAC TTACCTTTCA TTGAACATGC TGCCATAACT TAGATTATTC TTGGTTAAAA AATAAAAGTC ACTTATTTCT AATTCTTAAA GTTTATAATA TATATTAATA TAGCTAAAAT TGTATGTAAT CAATAAAACC ACTCTTATGT
TTATT
一部の実施形態では、シュワックマン・ボディアン・ダイアモンド症候群(SBDS)ポリヌクレオチドは、SBDS偽遺伝子に由来するポリヌクレオチドを含む。一部の実施形態では、SBDSポリヌクレオチドは、SDSに関連する遺伝子変換に起因する変異(例えば、258+2T>Cおよび/または183~184TA>CT変異)を、単独でまたはSBDS偽遺伝子中の他の変更との組合せで含む。
「シュワックマン・ボディアン・ダイアモンド症候群(SBDS)偽遺伝子」とは、SBDSポリヌクレオチドに少なくとも約85%の核酸配列同一性を有する核酸配列を意味する。一実施形態では、例示的な偽遺伝子は、以下のその断片を含む。
>NR_024109.1 ヒト(Homo sapiens)SBDS偽遺伝子1(SBDSP1)、転写物バリアント4、非コードRNA
CCTTTTTGGGCGTGGAAAGATGGCGGTAAAAGCCACAATGCGCAGGCGTCATCGCTCACTTCTCCCCTCC CGGCTTCTGCTCCACCTGACGCCTGCGCAGTAAGTAAGCCTGCCAGACACGCTGTGGCGGCTGCCTGAAG CTAGTGAGTCGCGGCGCCGCGCACTTGTGGTTGGGTCAGTGCCGCGCGCCGCTCGGTCGTTACCGCGAGG CGCTGGTGGCCTTCAGGCTGGACGGCGCGGGTCAGCCCTGGTTTGCCGGCTTCTGGGTCTTTGAACAGCC GCGATGTCGATCTTCACCCCCACCAACCAGATCCGCCTAACCAATGTGGCCGTGGTACGGATGAAGCGCG CCAGGAAGCGCTTCGAAATCGCCTGCTACAGAAACAAGGTCGTCGGCTGGCGGAGCGGCTTATTTTGACT AAAGGAGAAGTTCAAGTATCAGATAAAGACACACACAACTGGAGCAGATGTTTAGGGACATTGCAATTAT TGTGGCAGACAAATGTGTGACTCCTGAAACAAAGAGACCATACACCGTGATCCTTATTGAGAGAGCCATG AAGGACATCCACTATTTGGTGAAAACCAACAGGAGTACAAAACAGCAGGCTTTGGAAGTGATAAAGCAGT TAAAAGAGAAAATGAAGATAGAACGTGCTCACATGAGGCTTCAGTTCATCCTTCCAGTGAATGAAGGCAA GAAGCTGAAAGAAAAGCTCAAGCCACTGATCAAGGTCATAGAAAGTAAAGATTATGGCCAACAGTTAGAA ATCGTAAGAGTCAAATATTTTCTTTGCTTCATGTTACCTAAATATTGTATTCTCTAGTAATAAATTTGTA GCAAACATTCAAAAAAAAAAAAAAAAAAAA
>NR_024110.1 ヒトSBDS偽遺伝子1(SBDSP1)、転写物バリアント1、非コードRNA
CCTTTTTGGGCGTGGAAAGATGGCGGTAAAAGCCACAATGCGCAGGCGTCATCGCTCACTTCTCCCCTCC CGGCTTCTGCTCCACCTGACGCCTGCGCAGTAAGTAAGCCTGCCAGACACGCTGTGGCGGCTGCCTGAAG CTAGTGAGTCGCGGCGCCGCGCACTTGTGGTTGGGTCAGTGCCGCGCGCCGCTCGGTCGTTACCGCGAGG CGCTGGTGGCCTTCAGGCTGGACGGCGCGGGTCAGCCCTGGTTTGCCGGCTTCTGGGTCTTTGAACAGCC GCGATGTCGATCTTCACCCCCACCAACCAGATCCGCCTAACCAATGTGGCCGTGGTACGGATGAAGCGCG CCAGGAAGCGCTTCGAAATCGCCTGCTACAGAAACAAGGTCGTCGGCTGGCGGAGCGGCTTGGAAAAAGA CCTTGATGAAGTTCTGCAGACCCACTCAGTGTTTGTAAATGTTTCCTAAGGTCAGGTTGCCAAGAAGGAA GATCTCATCAGTGCGTTTGGAACAGATGACCAAACTGAAATCTATTTTGACTAAAGGAGAAGTTCAAGTA TCAGATAAAGACACACACAACTGGAGCAGATGTTTAGGGACATTGCAATTATTGTGGCAGACAAATGTGT GACTCCTGAAACAAAGAGACCATACACCGTGATCCTTATTGAGAGAGCCATGAAGGACATCCACTATTTG GTGAAAACCAACAGGAGTACAAAACAGCAGGCTTTGGAAGTGATAAAGCAGTTAAAAGAGAAAATGAAGA TAGAACGTGCTCACATGAGGCTTCAGTTCATCCTTCCAGTGAATGAAGGCAAGAAGCTGAAAGAAAAGCT CAAGCCACTGATCAAGGTCATAGAAAGTAAAGATTATGGCCAACAGTTAGAAATCGTATGTCTGATTGAC CTGGGCTGCTTCCGAGAAATTGATGAGCTAATAAAAAAGGAAACCAAAGGCAAAGGTTCTTTGGAAGTAC TCAATCTGAAAGATTTGAAGAAGGAGATGAGAAATTTGAATGACACCCATCAGTCTCTTCACCTCTAAAA CACTAAAGTGTTTTCGTTTCCAACAGCACTGTTTCATGTCTGTGGTCTGCCAAATACTTGCTCAAACTAT TTGACATTTTCTATCTTTGTGTTAACAGTGGACACAGCAAGGCTTTCCTACATAAGTATAATAATGTGGG AATGATTTGGTTTTAATTATAAACTGGGGTCTAAATCCTAAAGCAAAATTGAAACTCCAGGATGCAAAAT CCAGAGTGGCATTTTGCTACTCTGTCTCATGCCTTGATAGCTTTCCAAAATGAAAGTTACTTGAGGCAGC TCTTGTGGGTGAAAAGTTTTTTGTACAGTAGAGTAAGATTATTAGGGGTATGTCTATACGACAAAAGGGG GGTCTTTCCTAAAAAAGAAAACATGATGCTTCATTTCTACTTAATGGAACTTGTGTTCTGAGGGTCATTA TGGTATCGTAATATAAAGCTTGGATGATGTTCCTGATTATCTGAGAAACAGATATAGAAAAATTGTGTCG GACTTAAATAATTTTCGTTGAACATGCTGCCATAACTTAGATTATTCTTGGTTAAAAAATAAAAGTCACT TATTTCTAATTCTTAAAGTTTATAATATATATTAATATAGCTAAAATTGTATGTAATCAATAAAACCACT CTTATGTTTATTAAACTATGGCTTGTGTTTCTAGACAAAAAAAAAAAAAAAAAA
>NR_024111.1 ヒトSBDS偽遺伝子1(SBDSP1)、転写物バリアント2、非コードRNA
CCTTTTTGGGCGTGGAAAGATGGCGGTAAAAGCCACAATGCGCAGGCGTCATCGCTCACTTCTCCCCTCC CGGCTTCTGCTCCACCTGACGCCTGCGCAGTAAGTAAGCCTGCCAGACACGCTGTGGCGGCTGCCTGAAG CTAGTGAGTCGCGGCGCCGCGCACTTGTGGTTGGGTCAGTGCCGCGCGCCGCTCGGTCGTTACCGCGAGG CGCTGGTGGCCTTCAGGCTGGACGGCGCGGGTCAGCCCTGGTTTGCCGGCTTCTGGGTCTTTGAACAGCC GCGATGTCGATCTTCACCCCCACCAACCAGATCCGCCTAACCAATGTGGCCGTGGTACGGATGAAGCGCG CCAGGAAGCGCTTCGAAATCGCCTGCTACAGAAACAAGGTCGTCGGCTGGCGGAGCGGCTTATTTTGACT AAAGGAGAAGTTCAAGTATCAGATAAAGACACACACAACTGGAGCAGATGTTTAGGGACATTGCAATTAT TGTGGCAGACAAATGTGTGACTCCTGAAACAAAGAGACCATACACCGTGATCCTTATTGAGAGAGCCATG AAGGACATCCACTATTTGGTGAAAACCAACAGGAGTACAAAACAGCAGGCTTTGGAAGTGATAAAGCAGT TAAAAGAGAAAATGAAGATAGAACGTGCTCACATGAGGCTTCAGTTCATCCTTCCAGTGAATGAAGGCAA GAAGCTGAAAGAAAAGCTCAAGCCACTGATCAAGGTCATAGAAAGTAAAGATTATGGCCAACAGTTAGAA ATCGTATGTCTGATTGACCTGGGCTGCTTCCGAGAAATTGATGAGCTAATAAAAAAGGAAACCAAAGGCA AAGGTTCTTTGGAAGTACTCAATCTGAAAGATTTGAAGAAGGAGATGAGAAATTTGAATGACACCCATCA GTCTCTTCACCTCTAAAACACTAAAGTGTTTTCGTTTCCAACAGCACTGTTTCATGTCTGTGGTCTGCCA AATACTTGCTCAAACTATTTGACATTTTCTATCTTTGTGTTAACAGTGGACACAGCAAGGCTTTCCTACA TAAGTATAATAATGTGGGAATGATTTGGTTTTAATTATAAACTGGGGTCTAAATCCTAAAGCAAAATTGA AACTCCAGGATGCAAAATCCAGAGTGGCATTTTGCTACTCTGTCTCATGCCTTGATAGCTTTCCAAAATG AAAGTTACTTGAGGCAGCTCTTGTGGGTGAAAAGTTTTTTGTACAGTAGAGTAAGATTATTAGGGGTATG TCTATACGACAAAAGGGGGGTCTTTCCTAAAAAAGAAAACATGATGCTTCATTTCTACTTAATGGAACTT GTGTTCTGAGGGTCATTATGGTATCGTAATATAAAGCTTGGATGATGTTCCTGATTATCTGAGAAACAGA TATAGAAAAATTGTGTCGGACTTAAATAATTTTCGTTGAACATGCTGCCATAACTTAGATTATTCTTGGT TAAAAAATAAAAGTCACTTATTTCTAATTCTTAAAGTTTATAATATATATTAATATAGCTAAAATTGTAT GTAATCAATAAAACCACTCTTATGTTTATTAAACTATGGCTTGTGTTTCTAGACAAAAAAAAAAAAAAAA AA
>NR_001588.2 ヒトSBDS偽遺伝子1(SBDSP1)、転写物バリアント3、非コードRNA
CCTTTTTGGGCGTGGAAAGATGGCGGTAAAAGCCACAATGCGCAGGCGTCATCGCTCACTTCTCCCCTCC CGGCTTCTGCTCCACCTGACGCCTGCGCAGTAAGTAAGCCTGCCAGACACGCTGTGGCGGCTGCCTGAAG CTAGTGAGTCGCGGCGCCGCGCACTTGTGGTTGGGTCAGTGCCGCGCGCCGCTCGGTCGTTACCGCGAGG CGCTGGTGGCCTTCAGGCTGGACGGCGCGGGTCAGCCCTGGTTTGCCGGCTTCTGGGTCTTTGAACAGCC GCGATGTCGATCTTCACCCCCACCAACCAGATCCGCCTAACCAATGTGGCCGTGGTACGGATGAAGCGCG CCAGGAAGCGCTTCGAAATCGCCTGCTACAGAAACAAGGTCGTCGGCTGGCGGAGCGGCTTGGAAAAAGA CCTTGATGAAGTTCTGCAGACCCACTCAGTGTTTGTAAATGTTTCCTAAGGTCAGGTTGCCAAGAAGGAA GATCTCATCAGTGCGTTTGGAACAGATGACCAAACTGAAATCTATTTTGACTAAAGGAGAAGTTCAAGTA TCAGATAAAGACACACACAACTGGAGCAGATGTTTAGGGACATTGCAATTATTGTGGCAGACAAATGTGT GACTCCTGAAACAAAGAGACCATACACCGTGATCCTTATTGAGAGAGCCATGAAGGACATCCACTATTTG GTGAAAACCAACAGGAGTACAAAACAGCAGGCTTTGGAAGTGATAAAGCAGTTAAAAGAGAAAATGAAGA TAGAACGTGCTCACATGAGGCTTCAGTTCATCCTTCCAGTGAATGAAGGCAAGAAGCTGAAAGAAAAGCT CAAGCCACTGATCAAGGTCATAGAAAGTAAAGATTATGGCCAACAGTTAGAAATCGTAAGAGTCAAATAT TTTCTTTGCTTCATGTTACCTAAATATTGTATTCTCTAGTAATAAATTTGTAGCAAACATTCAAAAAAAA
AAAAAAAAAAAA
用語「一塩基多型(SNP)」とは、ゲノム内の特異的な位置で起こる単一ヌクレオチドのバリエーションであり、各バリエーションは、いくらかそれと分かる程度に集団内に存在する(例えば、>1%)。例えば、ヒトゲノム内の特異的な塩基位置では、Cヌクレオチドは大部分の個体に現れる可能性があるが、少数の個体ではこの位置をAが占める。このことは、SNPがこの特異的な位置にあることを意味し、このあり得る2つのヌクレオチドのバリエーションCまたはAは、この位置について対立遺伝子であると言う。SNPは、疾患に対する感受性の差の根底を成す。また、病気の重症度と、我々の身体が治療に応答する道筋も、遺伝子バリエーションの現れである。SNPは、遺伝子のコード領域内、遺伝子の非コード領域内、または遺伝子間領域(遺伝子間の領域)中の範囲にあり得る。一部の実施形態では、コード配列内のSNPは、遺伝子コードの縮重ゆえに、産生されるタンパク質のアミノ酸配列を必ずしも変えない。コード領域中のSNPは、2つのタイプ、すなわち同義SNPと非同義SNPとがある。同義SNPはタンパク質配列に影響を及ぼさないのに対し、非同義SNPはタンパク質のアミノ酸配列を変える。非同義SNPには2つのタイプ、すなわちミスセンスとナンセンスとがある。タンパク質コード領域中にないSNPもやはり、遺伝子のスプライシング、転写因子の結合、メッセンジャーRNAの分解、または非コードRNAの配列に影響を及ぼし得る。このタイプのSNPにより影響を受ける遺伝子発現は、eSNP(発現SNP)と呼ばれ、遺伝子から上流または下流であり得る。一塩基バリアント(SNV)は、何ら頻度の限定のない単一ヌクレオチドのバリエーションであり、体細胞に起こり得る。体細胞の一塩基バリエーションもまた、単一ヌクレオチドの変更であり得る。
「特異的に結合する」とは、本発明のポリペプチドおよび/または核酸分子を認識し結合するが、試料中、例えば生体試料中の他の分子を実質的に認識し結合しない、核酸分子、ポリペプチド、またはそれらの複合体(例えば、核酸プログラマブルDNA結合タンパク質およびガイド核酸)、化合物、または分子を意味する。
本発明の方法において有用な核酸分子としては、本発明のポリペプチドまたはその断片をコードする任意の核酸分子が挙げられる。そのような核酸分子は、内因性の核酸配列と100%同一である必要はないが、典型的には実質的な同一性を呈するものとなる。内因性の配列に「実質的な同一性」を有するポリヌクレオチドは、典型的には、二本鎖核酸分子のうち少なくとも一本鎖にハイブリダイズすることができる。本発明の方法で有用な核酸分子としては、本発明のポリペプチドまたはその断片をコードする任意の核酸分子が挙げられる。そのような核酸分子は、内因性の核酸配列と100%同一である必要はないが、典型的には実質的な同一性を呈するものとなる。内因性の配列に「実質的な同一性」を有するポリヌクレオチドは、典型的には、二本鎖核酸分子のうち少なくとも一本鎖にハイブリダイズすることができる。「ハイブリダイズする」とは、様々なストリンジェンシーの条件下で相補的なポリヌクレオチド配列(例えば、本明細書に記載の遺伝子)またはその一部分の間を対合させて二本鎖分子を形成することを指す (例えば、Wahl, G. M. and S. L. Berger (1987) Methods Enzymol. 152:399; Kimmel, A. R. (1987) Methods Enzymol. 152:507を参照されたい)。
例えば、ストリンジェントな塩濃度は、通常、約750mM NaClおよび75mM クエン酸三ナトリウムを超えず、好ましくは約500mM NaClおよび50mMクエン酸三ナトリウムを超えず、さたに好ましくは約250mM NaClおよび25mMクエン酸三ナトリウムを超えないものとなる。ストリンジェンシーの低いハイブリダイゼーションは、有機溶媒、例えばホルムアミドの不在下で得ることができるのに対して、ストリンジェンシーの高いハイブリダイゼーションは、少なくとも約35%ホルムアミド、さらに好ましくは少なくとも約50%ホルムアミドの存在下で得ることができる。ストリンジェントな温度条件は、通常、少なくとも約30℃、さらに好ましくは少なくとも約37℃、最も好ましくは少なくとも約42℃の温度を含むものとなる。様々な追加的なパラメーター、例えば、ハイブリダイゼーション時間、洗浄剤、例えばドデシル硫酸ナトリウム(SDS)の濃度、および担体DNAの含有もしくは除外などは、当技術分野に周知されている。様々なレベルのストリンジェンシーは、必要に応じてこれらの様々な条件を組み合わせることによって達成される。好適な実施形態では、ハイブリダイゼーションは、750mM NaCl、75mMクエン酸三ナトリウム、および1%SDS中、30℃で起こるものとなる。さらに好適な実施形態では、ハイブリダイゼーションは、500mM NaCl、50mMクエン酸三ナトリウム、1%SDS、35%ホルムアミド、および100μg/mL変性サケ精子DNA(ssDNA)中、37℃で起こるものとなる。最も好適な実施形態では、ハイブリダイゼーションは、250mM NaCl、25mMクエン酸三ナトリウム、1%SDS、50%ホルムアミド、および200μg/mL ssDNA中、42℃で起こるものとなる。これらの条件に関する有用なバリエーションは、当業者に容易に明らかになるものとなる。
大部分の適用では、ハイブリダイゼーションに続く洗浄ステップも、ストリンジェンシーの点で異なるものとなる。洗浄のストリンジェンシーの条件は、塩濃度によって、および温度によって、規定され得る。上記のように、洗浄のストリンジェンシーは、塩濃度を減少させることによって、または温度を増加させることによって、増加させることができる。例えば、洗浄ステップのためのストリンジェントな塩濃度は、好ましくは約30mM NaClおよび3mMクエン酸三ナトリウムを超えず、最も好ましくは約15mM NaClおよび1.5mMクエン酸三ナトリウムを超えないものとなる。洗浄ステップのためのストリンジェントな温度条件は、通常、少なくとも約25℃、さらに好ましくは少なくとも約42℃、いっそうさらに好ましくは少なくとも約68℃の温度を含むものとなる。一実施形態では、洗浄ステップは、30mM NaCl、3mMクエン酸三ナトリウム、および0.1%SDS中、25℃で起こるものとなる。別の実施形態では、洗浄ステップは、15mM NaCl、1.5mMクエン酸三ナトリウム、および0.1%SDS中、42℃で起こるものとなる。さらに好適な実施形態では、洗浄ステップは、15mM NaCl、1.5mMクエン酸三ナトリウム、および0.1%SDS中、68℃で起こるものとなる。これらの条件に関する追加のバリエーションは、当業者に容易に明らかになるものとなる。ハイブリダイゼーション手法は、当業者に周知されており、例えば、Benton and Davis (Science 196:180, 1977);Grunstein and Hogness (Proc. Natl. Acad. Sci., USA 72:3961, 1975);Ausubel et al. (Current Protocols in Molecular Biology, Wiley Interscience, New York, 2001);Berger and Kimmel (Guide to Molecular Cloning Techniques, 1987, Academic Press, New York);およびSambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, New Yorkに記載されている。
「スプリット」とは、2つ以上の断片に分けることを意味する。
「スプリットCas9タンパク質」または「スプリットCas9」とは、2つの別々のヌクレオチド配列によりコードされるN末端断片およびC末端断片として与えられるCas9タンパク質を指す。Cas9タンパク質のN末端部分およびC末端部分に対応するポリペプチドは、分けられて、「再構成された」Cas9タンパク質を形成してもよい。具体的な実施形態では、Cas9タンパク質は、例えば、そのそれぞれが参照により本明細書に組み込まれるNishimasu et al., Cell, Volume 156, Issue 5, pp. 935-949, 2014に記載されるかまたはJiang et al. (2016) Science 351: 867-871. PDB file: 5F9Rに記載されるように、タンパク質の障害領域内で2つの断片に分けられる。一部の実施形態では、タンパク質は、SpCas9の領域内の任意のC、T、A、またはSで、おおよそアミノ酸A292~G364、F445~K483、もしくはE565~T637の間で、または任意の他のCas9、Cas9バリアント(例えば、nCas9、dCas9)、もしくは他のnapDNAbpの対応する位置で、2つの断片に分けられる。一部の実施形態では、タンパク質は、SpCas9T310、T313、A456、S469、またはC574で2つの断片に分けられる。一部の実施形態では、このタンパク質を2つの断片に分ける過程は、タンパク質をスプリットすると呼ばれる。
他の実施形態では、Cas9タンパク質のN末端部分は、S.ピロゲネスCas9野生型(SpCas9)(NCBI参照配列:NC_002737.2、Uniprot参照配列:Q99ZW2)のアミノ酸1~573または1~637を含み、Cas9タンパク質のC末端部分は、SpCas9野生型のアミノ酸574~1368または638~1368の部分を含む。
スプリットCas9のC末端部分は、スプリットCas9のN末端部分に接合して、完全なCas9タンパク質を形成することができる。一部の実施形態では、Cas9タンパク質のC末端部分は、Cas9タンパク質のN末端部分の終わるところから開始する。このように、一部の実施形態では、スプリットCas9のC末端部分は、spCas9のアミノ酸(551~651)~1368の部分を含む。「(551~651)~1368」とは、アミノ酸551~651(全て含む)の間のアミノ酸で開始し、アミノ酸1368で終わることを意味する。例えば、スプリットCas9のC末端部分は、spCas9のアミノ酸551~1368、552~1368、553~1368、554~1368、555~1368、556~1368、557~1368、558~1368、559~1368、560~1368、561~1368、562~1368、563~1368、564~1368、565~1368、566~1368、567~1368、568~1368、569~1368、570~1368、571~1368、572~1368、573~1368、574~1368、575~1368、576~1368、577~1368、578~1368、579~1368、580~1368、581~1368、582~1368、583~1368、584~1368、585~1368、586~1368、587~1368、588~1368、589~1368、590~1368、591~1368、592~1368、593~1368、594~1368、595~1368、596~1368、597~1368、598~1368、599~1368、600~1368、601~1368、602~1368、603~1368、604~1368、605~1368、606~1368、607~1368、608~1368、609~1368、610~1368、611~1368、612~1368、613~1368、614~1368、615~1368、616~1368、617~1368、618~1368、619~1368、620~1368、621~1368、622~1368、623~1368、624~1368、625~1368、626~1368、627~1368、628~1368、629~1368、630~1368、631~1368、632~1368、633~1368、634~1368、635~1368、636~1368、637~1368、638~1368、639~1368、640~1368、641~1368、642~1368、643~1368、644~1368、645~1368、646~1368、647~1368、648~1368、649~1368、650~1368、または651~1368のうちいずれか1つの一部を含み得る。一部の実施形態では、スプリットCas9タンパク質のC末端部分は、SpCas9のアミノ酸574~1368または638~1368の一部を含む。
「対象」とは、哺乳動物を意味し、そのようなものとしては、以下に限定されないが、ヒトまたは非ヒト哺乳動物、例えば非ヒト霊長類(サル)、ウシ、ウマ、イヌ、ヒツジ、またはネコが挙げられる。一部の実施形態では、本明細書に記載の対象は、SDSを有するかまたはSDSを発症する傾向を有するものとして対象を識別する、SBDSタンパク質をコードするSDSポリヌクレオチド配列内の病原性変異を含む。
「実質的に同一である」とは、ポリペプチドまたは核酸分子が、参照のアミノ酸配列(例えば、本明細書に記載のアミノ酸配列のいずれか1つ)または核酸配列(例えば、本明細書に記載の核酸配列のいずれか1つ)と少なくとも50%の同一性を示すことを意味する。一実施形態では、そのような配列は、アミノ酸レベルまたは核酸レベルで、比較に用いられる配列と少なくとも60%、65%、70%、75%、80%もしくは85%、90%、95%、または99%さえ同一である。
配列同一性は、典型的には、配列解析ソフトウェア(例えば、ジェネティクス・コンピュータ・グループの配列解析ソフトウェアパッケージ、ウィスコンシン大学バイオテクノロジーセンター、1710ユニバーシティ・アベニュー、マディソン、ウィスコンシン州53705、BLAST、BESTFIT、GAP、またはPILEUP/PRETTYBOXプログラム)を用いて測定される。そのようなソフトウェアは、様々な置換、欠失、および/または他の修飾との相同性の程度を対応付けることによって、同一または類似の配列を照合する。保存的な置換は、典型的には、以下:グリシン、アラニン;バリン、イソロイシン、ロイシン;アスパラギン酸、グルタミン酸、アスパラギン、グルタミン;セリン、スレオニン;リジン、アルギニン;およびフェニルアラニン、チロシンの群内の置換を含む。同一性の程度を決定する例示的な一アプローチでは、密接に関連する配列であることを標示するe-3とe-100との間の確率スコアを伴うBLASTプログラムを用いてもよい。
COBALTを、例えば、以下のパラメーターを用いて使用する:
a)アラインメントパラメーター:Gapペナルティー-11、-1およびEnd-Gapペナルティー-5、-1、
b)CDDパラメーター:RPS BLASTを使用;Blast E-value 0.003;保存されたカラムを見つけて再演算、ならびに
c)クエリクラスタリングパラメーター: クエリクラスターを使用;ワードサイズ4;最大クラスター距離0.8;アルファベット レギュラー。
EMBOSS Needleを例えば、以下のパラメーターを用いて使用する:
a)マトリックス:BLOSUM62;
b)GAP OPEN:10;
c)GAP EXTEND:0.5;
d)OUTPUT FORMAT:pair;
e)END GAP PENALTY:false;
f)END GAP OPEN:10;および
g)END GAP EXTEND:0.5。
用語「標的部位」とは、デアミナーゼまたはデアミナーゼを含む融合タンパク質(例えば、dCas9-アデノシンデアミナーゼ融合タンパク質または本明細書に開示の塩基エディター)によって脱アミノ化される核酸分子内の配列を指す。
RNAプログラマブルヌクレアーゼ(例えば、Cas9)は、RNA:DNAハイブリダイゼーションを用いてDNA切断部位を標的とするため、これらのタンパク質は、原理上は、ガイドRNAにより指定された任意の配列を標的とすることが可能である。Cas9などのRNAプログラマブルヌクレアーゼを部位特異的切断のために(例えば、ゲノムを改変するために)用いる方法は、当技術分野に公知である(例えば、それぞれの全体の内容を本明細書に参照により組み込まれるCong, L. et ah, Multiplex genome engineering using CRISPR/Cas systems. Science 339, 819-823 (2013);Mali, P. et ah, RNA-guided human genome engineering via Cas9. Science 339, 823-826 (2013);Hwang, W.Y. et ah, Efficient genome editing in zebrafish using a CRISPR-Cas system. Nature biotechnology 31, 227-229 (2013);Jinek, M. et ah, RNA-programmed genome editing in human cells. eLife 2, e00471 (2013);Dicarlo, J.E. et ah, Genome engineering in Saccharomyces cerevisiae using CRISPR-Cas systems. Nucleic acids research (2013);Jiang, W. et ah RNA-guided editing of bacterial genomes using CRISPR-Cas systems. Nature biotechnology 31, 233-239 (2013)を参照)。
本明細書に用いられる際に、用語「治療する」、「治療すること」、「治療」などは、疾患もしくは障害および/またはそれに伴う症状を低減すること、減少させること、減じること、漸減すること、軽減すること、または寛解させること、または所望の薬学的および/または生理学的な効果を得ることを指す。除外するものではないが、障害または状態を治療することは、障害、状態、またはそれに伴う症状を完全に排除することを必要とはしないことが理解されよう。一部の実施形態では、この効果は治療的であり、すなわち、限定はないがこの効果は、部分的または完全に、疾患および/またはその疾患に起因する有害な症状の強度を低減するか、漸減するか、阻止するか、減じるか、寛解させるか、減少させるか、または治癒させる。一部の実施形態では、この効果は予防的であり、すなわち、この効果は、疾患または状態の発生および再発を防御または予防する。この目的に向けて、ここに開示された方法は、本明細書に記載されるように治療有効量の組成物を投与することを含む。一実施形態では、本発明はSDSの治療を提供する。
「ウラシルグリコシラーゼ阻害物質」または「UGI」とは、ウラシル除去修復システムを阻害する剤を意味する。一実施形態では、この剤は、宿主のウラシルDNAグリコシラーゼに結合してDNAからのウラシル残基の除去を防止するタンパク質またはその断片である。一実施形態では、UGIは、ウラシルDNAグリコシラーゼ塩基除去修復酵素を阻害することのできるタンパク質またはその断片またはドメインである。一部の実施形態では、UGIドメインは、野生型UGIまたはその改変型バージョンを含む。一部の実施形態では、UGIドメインは、下記に規定される例示的なアミノ酸配列の断片を含む。一部の実施形態では、UGI断片は、下記に示される例示的なUGI配列の少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%を含むアミノ酸配列を含む。一部の実施形態では、UGIは、下記に規定されるような例示的なUGIアミノ酸配列またはその断片に相同なアミノ酸配列を含む。一部の実施形態では、このUGIまたはその一部は、野生型UGIまたは下記に規定されるようなUGI配列もしくはその一部と少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、少なくとも99.5%、少なくとも99.9%、または100%同一である。例示的なUGIは、以下のようなアミノ酸配列を含む。
>splP14739IUNGI_BPPB2 ウラシルDNAグリコシラーゼ阻害物質
MTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLT S D APE YKPW ALVIQDS NGENKIKML.
本明細書に示される範囲は、範囲内の全ての値についての簡略表現であるものと理解される。例えば、1から50の範囲は、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、または50からなる群に由来する任意の数、数の組合せ、または部分範囲を含むものと理解される。
本明細書中の変動要素の任意の定義における化学基の列挙の記載は、その変動要素の定義を、挙げられた基のうち任意の単一の基または組合せとして含む。本明細書中の変動要素または態様についての一実施形態の記載は、その実施形態を、任意の単一の実施形態または任意の他の実施形態もしくはその一部との組合せとして含む。
本明細書に示される任意の組成物または方法は、本明細書に示される他の組成物および方法のうちいずれか1つまたは複数と組み合わせることができる。
本明細書の記載および実施例は、本開示の実施形態を詳細に説明する。本開示は本明細書に記載の具体的な実施形態に限定されず、それゆえに変わり得ることが理解されよう。当業者は、その範囲内に包含され得る本開示の数多くのバリエーションおよび修飾があることを認識するものとなる。
全ての用語は、当業者によって理解されるものとして理解されることが意図されている。別段に定義のない限り、本明細書に用いられる全ての技術用語および科学用語は、本開示の属する技術分野の当業者によって一般に理解されるものと同じ意味を有する。
本明細書に開示される一部の実施形態の実践では、別段に指示のない限り、当技術分野の技能の範囲内にある免疫学、生化学、化学、分子生物学、微生物学、細胞生物学、ゲノミクスおよび組換えDNAの従来の手法が採用される。例えば、Sambrook and Green, Molecular Cloning: A Laboratory Manual, 4th Edition (2012);the series Current Protocols in Molecular Biology (F. M. Ausubel, et al. eds.);the series Methods In Enzymology (Academic Press, Inc.), PCR 2: A Practical Approach (M.J. MacPherson, B.D. Hames and G.R. Taylor eds. (1995)), Harlow and Lane, eds. (1988) Antibodies, A Laboratory Manual, and Culture of Animal Cells: A Manual of Basic Technique and Specialized Applications, 6th Edition (R.I. Freshney, ed. (2010))を参照されたい。
本開示の様々な特徴は、単一の実施形態のコンテクストで記載することができるが、この特徴は別々に、または任意の適した組合せで示すこともできる。逆に、本開示は、明確にするために、別々の実施形態のコンテクストで本明細書に記載することができるが、本開示は、単一の実施形態に実装することもできる。本明細書に用いられる項目見出しは、構成の目的があるに過ぎず、記載された主題を限定するものと解釈されることはない。
本開示の特徴は、添付の特許請求の範囲に具体的に規定される。ここでの特徴および利点のより良い理解は、本明細書で下記に記載されるような添付の図面の観点で、本開示の原理の利用される例証となる実施形態を規定する以下の詳細な記載を参照することによって得られるものとなる。
図1Aおよび図1Bは、SDSを引き起こすSBDS内の変異を示す。図1Aは、SBDS(明るい陰影内のコード領域、暗い陰影内の非コード領域)のマップおよびSBDSのエクソン2領域とSBDSタンパク質との配列アラインメントを示す図であり、遺伝子特異的(灰色;上部)配列と偽遺伝子特異的(灰色;下部)配列とを標示している。SBDSに比べると、変換事象の結果生じるSBDSPのエクソン2は、タンパク質の切詰(下線部)を生じるものと予想される配列変化を含有する。これらは、184位にインフレーム終止コドンを、および250+10にT→C変化(SBDS中の258+2にあるドナースプライス部位の不変のTに対応する)を含み、後者の変化は、代替ドナースプライス部位の使用を250+1(不変のスプライス部位の位置がボックスで囲まれている)に生じる。 図1Bは、SBDSのエクソン2領域に由来するクローニングされたセグメントについての配列リードを示す図であり、ここでは、SBDSとその偽遺伝子との間の遺伝子変換事象から得られたSDSに罹っている個体における配列変化を標示しており、3つの変換された対立遺伝子が示されている。これらには、183~184TA→CT、258+2T→C、および拡張変換変異である183~184TA→CT+201A→G+258+2T→Cが含まれる。それぞれの場合に、情報を与える側面位置は、141と258+124とを含めて、変換されていなかった(緑色)。 同上。 図2A~図2Dは、1つまたは複数の病原性変異を含むSBDS遺伝子において転写を回復させるためのストラテジーを説明する概略図である。図2Aは、終止コドンを排除し、代替のアミノ酸(例えば、Trp(W))をアミノ酸62位(例えば、(K62X))に含むSBDSタンパク質の発現をもたらす、変異を導入するためのストラテジーを説明する図である。図2Bおよび図2Dは、ヌクレオチド258位(標的SNP rs113993993 C→T)でスプライス部位を修正するためのストラテジーを説明する図である。図2Cは、スプライスドナー位置を説明する図であり、この位置では、規準的なスプライスドナーが回復してSNP変異を修正する。 同上。 同上。 同上。 図3A~図3Cは、変更型PAM5’-NGC-3’またはPAMを含有する5’-NGC-3’に対する特異性を有するCas9バリアントを産生するCas9タンパク質中、例えば、改変型SpCas9などの改変型Cas9中で置換の発生するアミノ酸位置と、SpCas9バリアント配列をコードするプラスミド構築物とを示す表を提示している。記載されるような少なくとも1つのシチジンデアミナーゼと少なくとも1つのCas9バリアントとを含むシチジン塩基エディター(CBE)は、実施例3に記載されるようなSDSに関連するSBDS遺伝子内の変異を修正するのに用いられる。図3Aは、NGC PAMに結合可能であったCas9バリアント(左カラムの番号により称される)を生産するためにCas9タンパク質中の野生型から変えられた、アミノ酸位置を提示する。これらのCas9バリアントは、本明細書に記載の塩基編集試験で評価されるCBEの構成成分である。図3Bは、試験でバイスタンダー効果が限定的であった特に良好かつ高いオンターゲット編集をもたらす、Cas9バリアントのサブセットを提示する。図3Bにまた示されるのは、Cas9タンパク質ドメインの模式図とCas9タンパク質配列内のそれらの位置である。図3Cは、本明細書に記載されるような変更型PAM 5’-NGC-3’に対し特異性を有する、SpCas9バリアントをコードするプラスミドベクター構成成分とその中の配列変異とを図説する。 同上。 同上。 同上。 同上。 同上。 同上。 図4は、横座標に示す異なるシチジンデアミナーゼを含むCBEによって達成される塩基編集の相対変異速度を比較したグラフを図示する。 図5は、本明細書に記載の試験で評価されたCBEと共に用いたガイドRNA(gRNA)を示す表である。実施形態では、gRNA配列は、実施例に記載の塩基編集試験で用いられたプラスミド構築物の構成成分とした。 図6A~図6Cは、本明細書に記載されるようなNGC CBEバリアントと19merおよび20merのgRNA、例えばG88およびG44によって達成される、編集(例えばオンターゲット編集)パーセントとバイスタンダー編集のパーセントとの対比を示す。図6Aの右手のグラフならびに図6Bでは、「PV226」および「PV230」は、試験に用いられたプラスミドを指す。PV226プラスミドは、Cas9バリアント#226をコードするポリヌクレオチドを含有し、その配列は図3A~図3Cに示されており、PV230プラスミドは、Cas9バリアント#230をコードするポリヌクレオチドを含有し、その配列は図3A~図3Cに示されている。配列を図3A~図3Cに記載された異なるCas9バリアントを含有する他のNGC CBEと、20merのgRNAであるG44とによって発揮される編集のパーセントは、図6Cに示されている。 同上。 同上。 図7Aおよび図7Bは、本明細書の実施例4に記載される19merのgRNA(G88)および20merのgRNA(G44)に連係されて用いられる表13に示すシチジンデアミナーゼとCas9バリアントとを含むNGC CBEによる編集のパーセントのグラフを示す。 同上。 図8A~8Jは、SBDSポリヌクレオチド配列内のスプライス部位のSNPを修正する細胞ベース(HEK293)のアッセイで評価した際に、19merまたは20merのどちらかのgRNAと併せて、異なるシチジンデアミナーゼと、図3A~図3Cまたは表13に提示されるようなCas9アミノ酸配列内に変異の特異的な組合せを有するCas9(例えば、SpCas9)バリアントポリペプチドとを含むNGC CBEによって達成される、塩基編集(オンターゲット編集およびバイスタンダー編集)のパーセントのグラフを示す。図8Aは、19mer(ガイド88)gRNAと共に用いて、Cas9バリアント225とPpAPOBEC1とを含有するNGC CBEによって、およびPpAPOBEC1とCas9バリアント226および244(図3A~3C)とをそれぞれ含有するNGC CBE454および459(表13)によって発揮される、オンターゲット編集とバイスタンダー編集との対比を示す。図8Bは、20mer(Guide44)のgRNAと共に用いて、Cas9バリアント225とPpAPOBEC1とを含有するNGC CBEによって、およびPpAPOBEC1とCas9バリアント226および244とをそれぞれ含有するNGC CBEs454および459(表13)によって発揮される、オンターゲット編集とバイスタンダー編集との対比のパーセントを示す。図8Cおよび図8Dは、19mer(Guide88)または20mer(Guide44)のどちらかのgRNAを共に用いた、AmAPOBEC1シチジンデアミナーゼとCas9バリアント225、226、および244(図3A~図3C)とを含むNGC CBEのオンターゲット塩基編集およびバイスタンダー塩基編集のパーセンテージを示す。図8Eおよび図8Fは、19mer(Guide88)または20mer(Guide44)のどちらかのgRNAを共に用いた、PmCDA1シチジンデアミナーゼとCas9バリアント225、453、および458(表13)とを含むNGC CBEのオンターゲット塩基編集およびバイスタンダー塩基編集のパーセンテージを示す。図8Gおよび図8Hは、19mer(Guide88)または20mer(Guide44)のどちらかのgRNAと共に用いた、RRA3FシチジンデアミナーゼとCas9バリアント225、455、および460(表13)とを含むNGC CBEのオンターゲット塩基編集およびバイスタンダー塩基編集のパーセンテージを示す。図8Iおよび図8Jは、19mer(Guide88)または20mer(Guide44)のどちらかのgRNAを共に用いたSsAPOBEC2シチジンデアミナーゼとCas9バリアント225、456、および461(表13)とを含むNGC CBEのオンターゲット塩基編集およびバイスタンダー塩基編集のパーセンテージを示す。図8A~図8Jでは、Cas9バリアント225(またはPV225)は、代替的に「ビームシャッフル」と呼ばれる。 同上。 同上。 同上。 同上。 同上。 同上。 同上。 同上。 同上。 図9A~図9Dは、19merのgRNA(図9A)または20merのgRNA(図9B)を共に用いた、実施例4に記載されるような様々な変異、例えば、H122A変異のみ、ならびにアミノ酸変異R33A、W90F、K34A、R52A、H121A、およびY120Fとの組合せなどを含有するPpAPOBEC1シチジンデアミナーゼポリペプチド配列を含むNGC CBEによる編集のパーセントのグラフおよびドットプロットを示す。オンターゲット編集とバイスタンダー編集との対比のパーセンテージは、in vitroの細胞ベースのアッセイで評価された。図9Cおよび図9Dは、それぞれ図9Aおよび図9Bのデータをドットプロットの形式で提示している。 同上。 同上。 同上。 図10は、示されるような変異の組合せを有するSpCas9バリアントを作り出すためにSpCas9タンパク質内に作製された、変異および変異の組合せを図示する表を提示しており、このような変異としては、その内容が参照により本明細書にその全体を組み込まれるS. Miller et al., April, 2020, “Continuous evolution of SpCas9 variants compatible with non-G PAMs,” Nature Biotechnology, 38(4):471-481(2020年2月10日にオンラインにて公開 doi: 10.1038/s41587-020-0412-8)に記載されるような「NRCH」変異が挙げられる。NRCH変異(アミノ酸置換)の組合せをいくつかの異なるSpCas9バリアントに含めて、SDSに関連するSBDS遺伝子中のスプライス部位のSNPを高いオンターゲット塩基編集とバイスタンダー塩基編集との対比で修正する際に使用するためのNGC CBEのSpCas9バリアント構成成分を産生するものを決定した(実施例6)。図10では、暗い方の陰影のアミノ酸は、野生型の無変異のCas9(SpCas9)タンパク質の配列と比べた際のCas9(SpCas9)アミノ酸配列中のアミノ酸置換を反映する。明るい方の陰影のアミノ酸は、野生型の無変異のCas9(SpCas9)タンパク質のアミノ酸残基を反映する。 同上。 図11Aおよび図11Bは、細胞ベースアッセイにおいて、19merのgRNAまたは20merのgRNAのどちらかと連係されて用いられた、シチジンデアミナーゼを含むNGC CBE(例えば、PpAPOBEC1)と、図10および実施例5に規定される1つまたは複数のNRCH変異を含むSpCas9バリアントとによる、編集のパーセントを説明するグラフを示し、アッセイは、これらのCBEがSDSに関連するSBDS遺伝子中のスプライス部位のSNPを修正するためのオンターゲット編集効率およびバイスタンダー編集効率を評価する。NGC CBE 468および469(図10)は、19merまたは20merのどちらかのgRNAと連係されて用いられた際に、高いレベルのオンターゲット対オフターゲット塩基編集を示した。 同上。 図12A~図12Cは、異なる長さ(17mer、18mer、19mer、20mer、または21mer)のgRNAと併せた実施例6に記載のmRNAによってコードされるNGC CBEの塩基編集効率、およびオンターゲット編集のパーセンテージとバイスタンダー編集のパーセンテージとの対比を評価するために実行される、in vitroの細胞ベースのアッセイの結果を説明するグラフを示す。観察されるように、18merおよび20merのgRNAを有するmRNA342は、mRNA340またはmRNA341に比べて、CからAまたはCからGへの遷移が最も少ない。 同上。 同上。
本発明は、プログラマブル核酸塩基エディターを用いて、遺伝子内で異常なスプライシングを引き起こす病原性遺伝子変異を編集し、転写を可能にして治療効果を達成する、組成物および方法の特徴を述べる。一部の実施形態では、編集することは、終止コドンから転写を可能にするコドンに変換することを含む。一部の実施形態では、編集することは、スプライスアクセプター部位またはスプライスドナー部位を提供し修正すること、または代替のスプライスアクセプター部位またはスプライスドナー部位を提供することを含む。一部の実施形態では、異常なスプライシングに起因する1つ以上の変異が修正される。
本発明は、少なくとも部分的には、アデノシン塩基エディターまたはシチジン塩基エディター(ABE、CBE)を用いて、シュワックマン・ダイアモンド症候群(SDS)に関連する遺伝子内の病原性変異(例えば、遺伝子変換に起因する変異)を編集するストラテジーに基づく。したがって、本発明は、SDSの治療または予防に有用なABEまたはCBEを含む塩基エディターシステムを提供する。
シュワックマン・ダイアモンド症候群(SDS)
シュワックマン・ダイアモンド症候群(SDS)は、常染色体劣性障害である。SDSの臨床的な診断基準を満たす患者のおよそ90%が、シュワックマン・ボディアン・ダイアモンド症候群(SBDS)遺伝子に変異を有する。この変異の保因者の頻度は、おおよそ110人に1人と推定されている。この高度に保存された遺伝子は5つのエクソンを有し、それらは7.9kbを包含し、7番染色体の7q11セントロメア領域にマッピングされる。SDBS遺伝子は、既知のタンパク質機能性ドメインとの相同性に欠いた新規の250アミノ酸タンパク質をコードする。隣接する偽遺伝子であるSBDSPは、SBDSと97%の相同性を共有するが、機能性タンパク質の生成を妨げる欠失およびヌクレオチド変化を有する。SDSの患者のほぼ75%が、この偽遺伝子を伴う遺伝子変換事象に起因する変異を有する。遺伝子変換は、異なるゲノム遺伝子座に存在する相同配列(パラロガス配列)間で組換えが発生した際に生じる。SBDS偽(SBDSPとも呼ばれる)遺伝子の存在は、過去の遺伝子重複に起因する可能性がある。SBDSのmRNAおよびタンパク質は、mRNAおよびタンパク質の両方のレベルで、ヒト組織の至る所に広く発現している。早期に切詰の生じたSBDS変異183TA>CTは、SDSの患者間に共通するが、この変異がホモ接合性である患者は同定されておらず、このことは、SBDS発現の完全な欠落がヒト患者では致死的である可能性があることを示唆している。
SDSに関連する共通の配列変化としては、183~184位のTA→CTジヌクレオチド変化またはエクソン2終端の8bpの欠失が挙げられる。SBDSのゲノム配列の解析により、欠失転写物を発現するSDSに罹っている個人に、183~184TA→CT変化の存在が確認され、258+2T→C変化が特定された。変異258+2T→Cは、イントロン2のドナースプライス部位を中断させるものと予測されており、8bpの欠失は、251~252位にある上流の潜在的なスプライスドナー部位の使用に整合する。ジヌクレオチド変更183~184TA→CTは、インフレームの終止コドン(K62X)を導入し、258+2T→Cおよび結果として生じる8bpの欠失は、フレームシフトにより、コードされたタンパク質の未熟な切詰を引き起こす(84Cfs3)。
本発明は、異常なスプライシングを結果として生じる1つまたは複数の変更(例えば遺伝子変換)を有するポリヌクレオチドの転写を可能として、それによって機能性SBDSタンパク質(例えば、SBDS遺伝子変換の影響を軽減させるのに十分な活性を有するタンパク質)の発現をもたらす、組成物および方法を提供する。具体的な実施形態では、本発明は、183~184TA→CTを含むSBDS遺伝子内に、TAA終止からTrpをコードするTGGに変換して転写を可能にする変更を導入することをもたらす。他の実施形態では、本発明は、生物活性を有するタンパク質をコードするポリヌクレオチドのスプライシングを可能にするスプライスドナー部位またはエフェクター部位を導入する、ポリヌクレオチド配列の変更を導入する。一部の実施形態では、本発明は、SBDS遺伝子のエクソン2内の部位を、(例えば、図2Bに示されるようにヌクレオチド位置1495のシトシンを編集することによって)修正する。
核酸塩基エディター
本明細書に開示されるのは、ポリヌクレオチドの標的ヌクレオチド配列を編集、改変、または変更するための塩基エディターまたは核酸塩基エディターである。本明細書に記載されるのは、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインと核酸塩基編集ドメイン(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ)とを含む核酸塩基エディターまたは塩基エディターである。ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、結合ガイドポリヌクレオチド(例えばgRNA)に連結されている際に、標的ポリヌクレオチド配列に特異的に(すなわち、結合されたガイド核酸の塩基と標的ポリヌクレオチド配列の塩基との間の相補的な塩基対形成を介して)結合し、それによって、編集の目標とする核酸配列を標的とするように塩基エディターを局在化させることができる。一部の実施形態では、標的ポリヌクレオチド配列は、一本鎖DNAまたは二本鎖DNAを含む。一部の実施形態では、標的ポリヌクレオチド配列はRNAを含む。一部の実施形態では、標的ポリヌクレオチド配列はDNA-RNAハイブリッドを含む。
ポリヌクレオチドプログラマブルヌクレオチド結合ドメイン
ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、RNAを結合する核酸プログラマブルタンパク質も含み得ることを理解するべきである。例えば、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインをRNAにガイドする核酸を付随し得る。他の核酸プログラマブルDNA結合タンパク質もまた、本開示に具体的に挙げられないとはいえ、本開示の範囲内にある。
塩基エディターのポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、それ自体で1つまたは複数のドメインを含み得る。例えば、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、1つまたは複数のヌクレアーゼドメインを含み得る。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインのヌクレアーゼドメインは、エンドヌクレアーゼまたはエキソヌクレアーゼを含み得る。本明細書では、用語「エキソヌクレアーゼ」とは、核酸(例えば、RNAまたはDNA)をフリーな末端から消化することのできるタンパク質またはポリペプチドを指し、用語「エンドヌクレアーゼ」とは、核酸(例えば、DNAまたはRNA)の内部領域を触媒する(例えば、切断する)ことのできるタンパク質またはポリペプチドを指す。一部の実施形態では、エンドヌクレアーゼは、二本鎖核酸のうち一本鎖を切断することができる。一部の実施形態では、エンドヌクレアーゼは、二本鎖核酸分子の両鎖を切断することができる。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインをデオキシリボヌクレアーゼとし得る。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインをリボヌクレアーゼとし得る。
一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインのヌクレアーゼドメインは、標的ポリヌクレオチドの0本、1本、または2本の鎖を切断し得る。一部の場合では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、ニッカーゼドメインを含み得る。本明細書では、用語「ニッカーゼ」とは、二重鎖核酸分子(例えばDNA)中の二本鎖のうち一本鎖のみを切断することができるヌクレアーゼドメインを含む、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインを指す。一部の実施形態では、ニッカーゼは、1つまたは複数の変異を活性のポリヌクレオチドプログラマブルヌクレオチド結合ドメインに導入することによって、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインの完全に触媒として活性の(例えば天然の)形態から得ることができる。例えば、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインが、Cas9由来のニッカーゼドメインを含む場合に、このCas9由来ニッカーゼドメインは、D10A変異と840位のヒスチジンとを含み得る。そのような場合、残基H840は、触媒活性を保持し、それによって核酸二重鎖のうち一本鎖を切断し得る。別の例では、Cas9由来ニッカーゼドメインは、H840A変異を含むことができるのに対し、10位のアミノ酸残基はDのままである。一部の実施形態では、ニッカーゼは、ニッカーゼ活性に必要ではないヌクレアーゼドメインの全部または一部を除去することによって、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインの完全に触媒として活性の(例えば天然の)形態から得ることができる。例えば、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインが、Cas9由来のニッカーゼドメインを含む場合に、このCas9由来ニッカーゼドメインは、RuvCドメインまたはHNHドメインの全部または一部の欠失を含み得る。
例示的な触媒として活性のCas9のアミノ酸配列は以下の通りである:
MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD。
ゆえに、ニッカーゼドメインを含むポリヌクレオチドプログラマブルヌクレオチド結合ドメインを含む塩基エディターは、特異的なポリヌクレオチド標的配列(例えば、結合されたガイド核酸の相補的な配列によって決定される)に一本鎖DNA切断(ニック)を生成することができる。一部の実施形態では、ニッカーゼドメイン(例えば、Cas9由来ニッカーゼドメイン)を含む塩基エディターによって切断される核酸二重鎖標的ポリヌクレオチド配列の鎖は、塩基エディターによって編集されない鎖である(すなわち、塩基エディターによって切断される鎖が、編集される塩基を含む鎖とは逆である)。他の実施形態では、ニッカーゼドメイン(例えば、Cas9由来ニッカーゼドメイン)を含む塩基エディターは、編集のために標的となっているDNA分子の鎖を切断し得る。そのような場合に、標的とされていない鎖は切断されない。
また本明細書に提供されるのは、触媒として活性のない(すなわち、標的ポリヌクレオチド配列を切断できない)ポリヌクレオチドプログラマブルヌクレオチド結合ドメインを含む塩基エディターである。本明細書では、用語「触媒として活性のない」および「ヌクレアーゼ活性のない」は、結果として核酸の鎖を切断不能とする1つまたは複数の変異および/または欠失を有するポリヌクレオチドプログラマブルヌクレオチド結合ドメインを指すために、互換的に用いられる。一部の実施形態では、触媒として活性のないポリヌクレオチドプログラマブルヌクレオチド結合ドメイン塩基エディターは、1つまたは複数のヌクレアーゼドメイン内の特異的な点変異の結果として、ヌクレアーゼ活性を欠いていることがある。例えば、Cas9ドメインを含む塩基エディターの場合に、Cas9は、D10A変異とH840A変異との療法を含み得る。そのような変異は、両方のヌクレアーゼドメインを不活化し、それによってヌクレアーゼ活性の欠損を生じる。他の実施形態では、触媒として活性のないポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、触媒ドメイン(例えば、RuvC1および/またはHNHドメイン)の全部または一部の1つまたは複数の欠失を含み得る。さらに別の実施形態では、触媒として活性のないポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、点変異(例えば、D10AまたはH840A)ならびにヌクレアーゼドメインの全部または一部の欠失を含む。
また本明細書に想定されるのは、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインの従来は機能的なバージョンから、触媒として活性のないポリヌクレオチドプログラマブルヌクレオチド結合ドメインを生成することのできる変異である。例えば、触媒として活性のないCas9(「dCas9」)の場合に、ヌクレアーゼ不活化Cas9を生じるD10AおよびH840A以外の変異を有するバリアントが提供される。そのような変異には、例えば、D10およびH840での他のアミノ酸置換、またはCas9のヌクレアーゼドメイン内の他の置換(例えば、HNHヌクレアーゼサブドメインおよび/またはRuvC1サブドメイン内の置換)が含まれる。追加の適したヌクレアーゼ不活性のdCas9ドメインは、本開示と当技術分野の知識に基づき、当業者に明らかとなり得、本開示の範囲内にある。そのような追加の例示的な適したヌクレアーゼ-不活性のCas9ドメインとしては、以下に限定されないが、D10A/H840A変異体ドメイン、D10A/D839A/H840A変異体ドメイン、およびD10A/D839A/H840A/N863A変異体ドメインが挙げられる(例えば、その全体の内容を参照により本明細書に組み込まれるPrashant et al., CAS9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering. Nature Biotechnology. 2013; 31(9): 833-838を参照)。
塩基エディターに組み込まれ得るポリヌクレオチドプログラマブルヌクレオチド結合ドメインの非限定的な例としては、CRISPRタンパク質由来ドメイン、制限ヌクレアーゼ、メガヌクレアーゼ、TALヌクレアーゼ(TALEN)、およびジンクフィンガーヌクレアーゼ(ZFN)が挙げられる。一部の場合では、塩基エディターは、核酸のCRISPR(すなわち、クラスターを形成する規則的な間隔の短いパリンドロームリピート)媒介性改変の間に、結合されたガイド核酸を介して核酸配列に結合することができる、天然または改変型のタンパク質またはその一部を含むポリヌクレオチドプログラマブルヌクレオチド結合ドメインを含む。そのようなタンパク質は、本明細書では「CRISPRタンパク質」と呼ばれる。したがって、本明細書に開示されるのは、CRISPRタンパク質の全部または一部を含むポリヌクレオチドプログラマブルヌクレオチド結合ドメインを含む塩基エディター(すなわち、塩基エディターの「CRISPRタンパク質由来ドメイン」とも呼ばれる、CRISPRタンパク質の全部または一部のドメインを含む塩基エディター)である。塩基エディターに組み込まれたCRISPRタンパク質由来ドメインは、CRISPRタンパク質の野生型または天然のバージョンと比べて改変することができる。例えば、下記に記載されるように、CRISPRタンパク質由来ドメインは、CRISPRタンパク質の野生型または天然のバージョンに比べて、1つまたは複数の変異、挿入、欠失、再配列、および/または組換えを含み得る。
CRISPRは、可動遺伝因子(ウイルス、転位因子、および接合性プラスミド)に対する保護を与える適応免疫システムである。CRISPRクラスターは、スペーサー、前例の可動因子に相補的な配列、および標的進入核酸を含有する。CRISPRクラスターは、転写されたCRISPR RNA(crRNA)にプロセッシングされる。II型CRISPRシステムでは、crRNA前駆体の正しいプロセッシングは、トランスにコードされた低分子RNA(tracrRNA)と、内因性のリボヌクレアーゼ3(rnc)と、Cas9タンパク質とを必要とする。tracrRNAは、crRNA前駆体のリボヌクレアーゼ3支援型プロセッシングのためのガイドとして役割を果たす。続いて、Cas9/crRNA/tracrRNAは、スペーサーに相補的な線状または環状のdsDNA標的をエンドヌクレアーゼ的に切断する。crRNAに相補的ではない標的鎖は、まず、エンドヌクレアーゼ的に切断され、次いで、3’-5’エキソヌクレアーゼ的に刈り込まれる。本来は、DNAの結合および切断は、典型的には、タンパク質と両RNAとを必要とする。しかし、crRNAとtracrRNAとの両方の態様を単一RNA種に取り込むように、単一ガイドRNA(「sgRNA」または単純に「gNRA」)を工学的に改変することができる。例えば、その全体の内容を参照によりここに組み込まれるJinek M., Chylinski K., Fonfara I., Hauer M., Doudna J. A., Charpentier E. Science 337:816-821(2012)を参照されたい。Cas9は、CRISPRリピート配列内の短いモチーフ(PAMまたはプロトスペーサー隣接モチーフ)を認識して、自己と非自己とを区別する一助となる。
一部の実施形態では、本明細書に記載される方法は、工学的に改変されたCasタンパク質を利用することができる。ガイドRNA(gRNA)は、Cas結合に必要なスキャフォールド配列と、改変されるゲノム標的を画定するユーザにより規定される約20ヌクレオチドのスペーサーとから構成される、短い合成RNAである。そのため、当業者は、gRNAに存在する標的配列を変えることによって、Casタンパク質のゲノムまたはポリヌクレオチドの標的を変えることができる。ゲノムポリヌクレオチド標的配列に対しgRNA標的化配列がゲノムの残り部分に比べてどれほど特異的であるかによって、Casタンパク質の特異性は部分的に決定される。
一部の実施形態では、gRNAスキャフォールド配列は以下の通りである:GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU。
一実施形態では、RNAスキャフォールドはステムループを含む。一実施形態では、RNAスキャフォールドは以下の核酸配列を含む:GUUUUUGUACUCUCAAGAUUUAAGUAACUGUACAACGAAACUUACACAGUUACUUAAAUCUUGCAGAAGCUACAAAGAUAAGGCUUCAUGCCGAAAUCAACACCCUGUCAUUUUAUGGCAGGGUG。
一実施形態では、RNAスキャフォールドは以下の核酸配列を含む:GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU。
一実施形態では、S.ピロゲネスのsgRNAスキャフォールドポリヌクレオチド配列は以下の通りである:
GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC。
一実施形態では、S.アウレウスのsgRNAスキャフォールドポリヌクレオチド配列は以下の通りである:
GUUUUAGUACUCUGUAAUGAAAAUUACAGAAUCUACUAAAACAAGGCAAAAUGCCGUGUUUAUCUCGUCAACUUGUUGGCGAGA。
一実施形態では、BhCas12bのsgRNAスキャフォールドは、以下のポリヌクレオチド配列を有する:
GUUCUGTCUUUUGGUCAGGACAACCGUCUAGCUAUAAGUGCUGCAGGGUGUGAGAAACUCCUAUUGCUGGACGAUGUCUCUUACGAGGCAUUAGCAC。
一実施形態では、BvCas12bのsgRNAスキャフォールドは、以下のポリヌクレオチド配列を有する:GACCUAUAGGGUCAAUGAAUCUGUGCGUGUGCCAUAAGUAAUUAAAAAUUACCCACCACAGGAGCACCUGAAAACAGGUGCUUGGCAC。
一部の実施形態では、塩基エディターに組み込まれたCRISPRタンパク質由来ドメインは、結合ガイド核酸に連係されている際に標的ポリヌクレオチドに結合することの可能なエンドヌクレアーゼ(例えば、デオキシリボヌクレアーゼまたはリボヌクレアーゼ)である。一部の実施形態では、塩基エディターに組み込まれたCRISPRタンパク質由来ドメインは、結合ガイド核酸に連係されている際に標的ポリヌクレオチドに結合することの可能なニッカーゼである。一部の実施形態では、塩基エディターに組み込まれたCRISPRタンパク質由来ドメインは、結合ガイド核酸に連係されている際に標的ポリヌクレオチドに結合することの可能な、触媒として活性のないドメインである。一部の実施形態では、塩基エディターのCRISPRタンパク質由来ドメインによって結合される標的ポリヌクレオチドは、DNAである。一部の実施形態では、塩基エディターのCRISPRタンパク質由来ドメインによって結合される標的ポリヌクレオチドは、RNAである。
本明細書に用いることのできるCasタンパク質には、クラス1およびクラス2のCasタンパク質が含まれる。Casタンパク質の非限定的な例としては、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5d、Cas5t、Cas5h、Cas5a、Cas6、Cas7、Cas8、Cas9(Csn1またはCsx12としても知られる)、Cas10、Csy1、Csy2、Csy3、Csy4、Cse1、Cse2、Cse3、Cse4、Cse5e、Csc1、Csc2、Csa5、Csn1、Csn2、Csm1、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx1S、Csf1、Csf2、CsO、Csf4、Csd1、Csd2、Cst1、Cst2、Csh1、Csh2、Csa1、Csa2、Csa3、Csa4、Csa5、Cas12a/Cpf1、Cas12b/C2c1、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、およびCas12i、CARF、DinG、それらのホモログ、またはそれらの改変バージョンが挙げられる。未改変のCRISPR酵素は、DNA切断活性を有し得るが、例えばCas9があり、2つの機能性エンドヌクレアーゼドメイン:RuvCおよびHNHを有する。CRISPR酵素は、標的配列の一方または両方の切断を、例えば、標的配列内および/または標的配列の相補部内などに導くことができる。例えば、CRISPR酵素は、一方または両方の切断を、標的配列の最初または最後のヌクレオチドから約1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、200、500、またはそれを超える数の塩基対内に導くことができる。
標的配列を含有する標的ポリヌクレオチドの一方または両方の鎖を切断する能力を変異型CRISPR酵素が失うように対応の野生型酵素について変異を入れた、CRISPR酵素をコードするベクターを用いることができる。Cas9は、野生型の例示的なCas9ポリペプチド(例えば、S.ピロゲネス由来のCas9)に対し少なくとも50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%または少なくとも約50%、約60%、約70%、約80%、約90%、約91%、約92%、約93%、約94%、約95%、約96%、約97%、約98%、約99%、または約100%の配列同一性および/または配列相同性を備えるポリペプチドを指し得る。Cas9は、野生型の例示的なCas9ポリペプチド(例えば、S.ピロゲネス由来)に対し最大50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%または最大約50%、約60%、約70%、約80%、約90%、約91%、約92%、約93%、約94%、約95%、約96%、約97%、約98%、約99%、または約100%の配列同一性および/または配列相同性を備えるポリペプチドを指し得る。Cas9は、アミノ酸変化、例えば欠失、挿入、置換、バリアント、変異、融合、キメラ、またはそれらの任意の組合せなどを含み得る、Cas9タンパク質の野生体または改変体を指し得る。
一部の実施形態では、塩基エディターのCRISPRタンパク質由来ドメインは、コリネバクテリウム・ウルセランス(NCBI参照番号:NC_015683.1、NC_017317.1);コリネバクテリウム・ジフテリア(NCBI参照番号:NC_016782。1、NC_016786。1);スピロプラズマ・シルフィディコーラ(NCBI参照番号:NC_021284。1);プレボテラ・インターメディア(NCBI参照番号:NC_017861。1);スピロプラズマ・タイワネンス(NCBI参照番号:NC_021846。1);ストレプトコッカス・イニエ(NCBI参照番号:NC_021314。1);ベリエラ・バルティカ(NCBI参照番号:NC_018010.1);サイクロフレクサス・トルキス(NCBI参照番号:NC_018721。1);ストレプトコッカス・サーモフィルス(NCBI参照番号:YP_820832。1);リステリア・イノキュア(NCBI参照番号:NP_472073。1);カンピロバクター・ジェジュニ(NCBI参照番号:YP_002344900.1);ナイセリア・メニンギティディス(NCBI参照番号:YP_002342100.1)、ストレプトコッカス・ピロゲネス、またはスタフィロコッカス・アウレウスに由来するCas9の全部または一部を含み得る。
核酸塩基エディターのCas9ドメイン
Cas9ヌクレアーゼの配列および構造は、当業者に周知されている(例えば、そのそれぞれの全体の内容を参照により本明細書に組み込まれる“Complete genome sequence of an Ml strain of Streptococcus pyogenes.” Ferretti et al., J.J., McShan W.M., Ajdic D.J., Savic D.J., Savic G., Lyon K., Primeaux C, Sezate S., Suvorov A.N., Kenton S., Lai H.S., Lin S.P., Qian Y., Jia H.G., Najar F.Z., Ren Q., Zhu H., Song L., White J., Yuan X., Clifton S.W., Roe B.A., McLaughlin R.E., Proc. Natl. Acad. Sci. U.S.A. 98:4658-4663(2001);“CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III.” Deltcheva E., Chylinski K., Sharma C.M., Gonzales K., Chao Y., Pirzada Z.A., Eckert M.R., Vogel J., Charpentier E., Nature 471:602-607(2011);および “A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.” Jinek M., Chylinski K., Fonfara I., Hauer M., Doudna J.A., Charpentier E. Science 337:816-821(2012)を参照)。Cas9オルソログは、様々な種に記載されており、そのようなものとしては、以下に限定されないが、S.ピロゲネスおよびS.サーモフィルスが挙げられる。追加の適したCas9ヌクレアーゼおよび配列は、本開示に基づき当業者に明らかになるものとなり、そのようなCas9ヌクレアーゼおよび配列としては、その全体の内容が参照により本明細書に組み込まれるChylinski, Rhun, and Charpentier, “The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems” (2013) RNA Biology 10:5, 726-737に開示される、生物由来のCas9配列および遺伝子座が挙げられる。
一部の態様では、核酸プログラマブルDNA結合タンパク質(napDNAbp)はCas9ドメインである。非制限的かつ例示的なCas9ドメインは本明細書に示されている。Cas9ドメインは、ヌクレアーゼ活性のCas9ドメイン、ヌクレアーゼ不活性のCas9ドメイン、またはCas9ニッカーゼとしてよい。一部の実施形態では、Cas9ドメインはヌクレアーゼ活性ドメインである。例えば、Cas9ドメインは、二重鎖核酸(例えば、二重鎖DNA分子の両鎖)の両鎖を切断するCas9ドメインとしてよい。一部の実施形態では、Cas9ドメインは、本明細書に規定されるようなアミノ酸配列のうち任意の1つを含む。一部の実施形態では、Cas9ドメインは、本明細書に規定されたアミノ酸配列のうちいずれか1つに少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。一部の実施形態では、Cas9ドメインは、本明細書に規定されたアミノ酸配列のうちいずれか1つに比べて1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、またはそれを超える個数の変異を有するアミノ酸配列を含む。一部の実施形態では、Cas9ドメインは、本明細書に規定されたアミノ酸配列のうちいずれか1つに比べて少なくとも10、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも150、少なくとも200、少なくとも250、少なくとも300、少なくとも350、少なくとも400、少なくとも500、少なくとも600、少なくとも700、少なくとも800、少なくとも900、少なくとも1000、少なくとも1100、または少なくとも1200個同一の隣接したアミノ酸残基を有するアミノ酸配列を含む。
一部の実施形態では、Cas9の断片を含むタンパク質が提供される。例えば、一部の実施形態では、タンパク質は、以下の2つのCas9ドメインのうち1つを含む:(1)Cas9のgRNA結合ドメイン;または(2)Cas9のDNA切断ドメイン。一部の実施形態では、Cas9またはその断片を含むタンパク質は、「Cas9バリアント」と呼ばれる。Cas9バリアントは、Cas9またはその断片と相同性を共有する。例えば、Cas9バリアントは、野生型Cas9と少なくとも約70%相同であるか、少なくとも約80%相同であるか、少なくとも約90%相同であるか、少なくとも約95%相同であるか、少なくとも約96%相同であるか、少なくとも約97%相同であるか、少なくとも約98%相同であるか、少なくとも約99%相同であるか、少なくとも約99.5%相同であるか、または少なくとも約99.9%相同である。一部の実施形態では、Cas9バリアントは、野生型Cas9に比べて1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、またはそれを超える数のアミノ酸変化を有することがある。一部の実施形態では、Cas9バリアントは、Cas9の断片(例えば、gRNA結合ドメインまたはDNA切断ドメイン)が、野生型Cas9の対応する断片と少なくとも約70%相同であるか、少なくとも約80%相同であるか、少なくとも約90%相同であるか、少なくとも約95%相同であるか、少なくとも約96%相同であるか、少なくとも約97%相同であるか、少なくとも約98%相同であるか、少なくとも約99%相同であるか、少なくとも約99.5%相同であるか、または少なくとも約99.9%相同であるように、この断片を有する。一部の実施形態では、断片は、対応する野生型Cas9の少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%同一の、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%のアミノ酸長である。一部の実施形態では、この断片は少なくとも100アミノ酸の長さである。一部の実施形態では、この断片は、少なくとも100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、または少なくとも1300個のアミノ酸の長さである。
一部の実施形態では、本明細書に提供されるようなCas9融合タンパク質は、Cas9タンパク質の完全長アミノ酸配列、例えば、本明細書に提供されるCas9配列の1つを含む。しかし、他の実施形態では、本明細書に提供されるような融合タンパク質は、完全長Cas9配列を含まないが、それらの1つまたは複数の断片のみを含む。適したCas9ドメインおよびCas9断片の例示的なアミノ酸配列は、本明細書に示されており、Cas9ドメインおよび断片の追加の適した配列は、当業者に明らかになるものとなる。
Cas9タンパク質は、ガイドRNAに相補性を有する特異的なDNA配列にCas9タンパク質をガイドするガイドRNAに付随することがある。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインとはCas9ドメインであり、例えばヌクレアーゼ活性のCas9、Cas9ニッカーゼ(nCas9)、またはヌクレアーゼ不活性のCas9(dCas9)である。核酸プログラマブルDNA結合タンパク質の例としては、限定はないが、Cas9(例えば、dCas9およびnCas9)、CasX、CasY、Cpf1、Cas12b/C2C1、ならびにCas12c/C2C3が挙げられる。
一部の実施形態では、野生型Cas9は、ストレプトコッカス・ピロゲネス(NCBI参照配列:NC_017053.1、下記の通りのヌクレオチドおよびアミノ酸配列)由来のCas9に対応する。
ATGGATAAGAAATACTCAATAGGCTTAGATATCGGCACAAATAGCGTCGGATGGGCGGTGATCACTGATGATTATAAGGTTCCGTCTAAAAAGTTCAAGGTTCTGGGAAATACAGACCGCCACAGTATCAAAAAAAATCTTATAGGGGCTCTTTTATTTGGCAGTGGAGAGACAGCGGAAGCGACTCGTCTCAAACGGACAGCTCGTAGAAGGTATACACGTCGGAAGAATCGTATTTGTTATCTACAGGAGATTTTTTCAAATGAGATGGCGAAAGTAGATGATAGTTTCTTTCATCGACTTGAAGAGTCTTTTTTGGTGGAAGAAGACAAGAAGCATGAACGTCATCCTATTTTTGGAAATATAGTAGATGAAGTTGCTTATCATGAGAAATATCCAACTATCTATCATCTGCGAAAAAAATTGGCAGATTCTACTGATAAAGCGGATTTGCGCTTAATCTATTTGGCCTTAGCGCATATGATTAAGTTTCGTGGTCATTTTTTGATTGAGGGAGATTTAAATCCTGATAATAGTGATGTGGACAAACTATTTATCCAGTTGGTACAAATCTACAATCAATTATTTGAAGAAAACCCTATTAACGCAAGTAGAGTAGATGCTAAAGCGATTCTTTCTGCACGATTGAGTAAATCAAGACGATTAGAAAATCTCATTGCTCAGCTCCCCGGTGAGAAGAGAAATGGCTTGTTTGGGAATCTCATTGCTTTGTCATTGGGATTGACCCCTAATTTTAAATCAAATTTTGATTTGGCAGAAGATGCTAAATTACAGCTTTCAAAAGATACTTACGATGATGATTTAGATAATTTATTGGCGCAAATTGGAGATCAATATGCTGATTTGTTTTTGGCAGCTAAGAATTTATCAGATGCTATTTTACTTTCAGATATCCTAAGAGTAAATAGTGAAATAACTAAGGCTCCCCTATCAGCTTCAATGATTAAGCGCTACGATGAACATCATCAAGACTTGACTCTTTTAAAAGCTTTAGTTCGACAACAACTTCCAGAAAAGTATAAAGAAATCTTTTTTGATCAATCAAAAAACGGATATGCAGGTTATATTGATGGGGGAGCTAGCCAAGAAGAATTTTATAAATTTATCAAACCAATTTTAGAAAAAATGGATGGTACTGAGGAATTATTGGTGAAACTAAATCGTGAAGATTTGCTGCGCAAGCAACGGACCTTTGACAACGGCTCTATTCCCCATCAAATTCACTTGGGTGAGCTGCATGCTATTTTGAGAAGACAAGAAGACTTTTATCCATTTTTAAAAGACAATCGTGAGAAGATTGAAAAAATCTTGACTTTTCGAATTCCTTATTATGTTGGTCCATTGGCGCGTGGCAATAGTCGTTTTGCATGGATGACTCGGAAGTCTGAAGAAACAATTACCCCATGGAATTTTGAAGAAGTTGTCGATAAAGGTGCTTCAGCTCAATCATTTATTGAACGCATGACAAACTTTGATAAAAATCTTCCAAATGAAAAAGTACTACCAAAACATAGTTTGCTTTATGAGTATTTTACGGTTTATAACGAATTGACAAAGGTCAAATATGTTACTGAGGGAATGCGAAAACCAGCATTTCTTTCAGGTGAACAGAAGAAAGCCATTGTTGATTTACTCTTCAAAACAAATCGAAAAGTAACCGTTAAGCAATTAAAAGAAGATTATTTCAAAAAAATAGAATGTTTTGATAGTGTTGAAATTTCAGGAGTTGAAGATAGATTTAATGCTTCATTAGGCGCCTACCATGATTTGCTAAAAATTATTAAAGATAAAGATTTTTTGGATAATGAAGAAAATGAAGATATCTTAGAGGATATTGTTTTAACATTGACCTTATTTGAAGATAGGGGGATGATTGAGGAAAGACTTAAAACATATGCTCACCTCTTTGATGATAAGGTGATGAAACAGCTTAAACGTCGCCGTTATACTGGTTGGGGACGTTTGTCTCGAAAATTGATTAATGGTATTAGGGATAAGCAATCTGGCAAAACAATATTAGATTTTTTGAAATCAGATGGTTTTGCCAATCGCAATTTTATGCAGCTGATCCATGATGATAGTTTGACATTTAAAGAAGATATTCAAAAAGCACAGGTGTCTGGACAAGGCCATAGTTTACATGAACAGATTGCTAACTTAGCTGGCAGTCCTGCTATTAAAAAAGGTATTTTACAGACTGTAAAAATTGTTGATGAACTGGTCAAAGTAATGGGGCATAAGCCAGAAAATATCGTTATTGAAATGGCACGTGAAAATCAGACAACTCAAAAGGGCCAGAAAAATTCGCGAGAGCGTATGAAACGAATCGAAGAAGGTATCAAAGAATTAGGAAGTCAGATTCTTAAAGAGCATCCTGTTGAAAATACTCAATTGCAAAATGAAAAGCTCTATCTCTATTATCTACAAAATGGAAGAGACATGTATGTGGACCAAGAATTAGATATTAATCGTTTAAGTGATTATGATGTCGATCACATTGTTCCACAAAGTTTCATTAAAGACGATTCAATAGACAATAAGGTACTAACGCGTTCTGATAAAAATCGTGGTAAATCGGATAACGTTCCAAGTGAAGAAGTAGTCAAAAAGATGAAAAACTATTGGAGACAACTTCTAAACGCCAAGTTAATCACTCAACGTAAGTTTGATAATTTAACGAAAGCTGAACGTGGAGGTTTGAGTGAACTTGATAAAGCTGGTTTTATCAAACGCCAATTGGTTGAAACTCGCCAAATCACTAAGCATGTGGCACAAATTTTGGATAGTCGCATGAATACTAAATACGATGAAAATGATAAACTTATTCGAGAGGTTAAAGTGATTACCTTAAAATCTAAATTAGTTTCTGACTTCCGAAAAGATTTCCAATTCTATAAAGTACGTGAGATTAACAATTACCATCATGCCCATGATGCGTATCTAAATGCCGTCGTTGGAACTGCTTTGATTAAGAAATATCCAAAACTTGAATCGGAGTTTGTCTATGGTGATTATAAAGTTTATGATGTTCGTAAAATGATTGCTAAGTCTGAGCAAGAAATAGGCAAAGCAACCGCAAAATATTTCTTTTACTCTAATATCATGAACTTCTTCAAAACAGAAATTACACTTGCAAATGGAGAGATTCGCAAACGCCCTCTAATCGAAACTAATGGGGAAACTGGAGAAATTGTCTGGGATAAAGGGCGAGATTTTGCCACAGTGCGCAAAGTATTGTCCATGCCCCAAGTCAATATTGTCAAGAAAACAGAAGTACAGACAGGCGGATTCTCCAAGGAGTCAATTTTACCAAAAAGAAATTCGGACAAGCTTATTGCTCGTAAAAAAGACTGGGATCCAAAAAAATATGGTGGTTTTGATAGTCCAACGGTAGCTTATTCAGTCCTAGTGGTTGCTAAGGTGGAAAAAGGGAAATCGAAGAAGTTAAAATCCGTTAAAGAGTTACTAGGGATCACAATTATGGAAAGAAGTTCCTTTGAAAAAAATCCGATTGACTTTTTAGAAGCTAAAGGATATAAGGAAGTTAAAAAAGACTTAATCATTAAACTACCTAAATATAGTCTTTTTGAGTTAGAAAACGGTCGTAAACGGATGCTGGCTAGTGCCGGAGAATTACAAAAAGGAAATGAGCTGGCTCTGCCAAGCAAATATGTGAATTTTTTATATTTAGCTAGTCATTATGAAAAGTTGAAGGGTAGTCCAGAAGATAACGAACAAAAACAATTGTTTGTGGAGCAGCATAAGCATTATTTAGATGAGATTATTGAGCAAATCAGTGAATTTTCTAAGCGTGTTATTTTAGCAGATGCCAATTTAGATAAAGTTCTTAGTGCATATAACAAACATAGAGACAAACCAATACGTGAACAAGCAGAAAATATTATTCATTTATTTACGTTGACGAATCTTGGAGCTCCCGCTGCTTTTAAATATTTTGATACAACAATTGATCGTAAACGATATACGTCTACAAAAGAAGTTTTAGATGCCACTCTTATCCATCAATCCATCACTGGTCTTTATGAAACACGCATTGATTTGAGTCAGCTAGGAGGTGACTGA

Figure 2022545950000004
(単下線:HNHドメイン;二重下線:RuvCドメイン)
一部の実施形態では、野生型Cas9は、以下のヌクレオチドおよび/またはアミノ酸配列に対応するかまたはそれを含む:
ATGGATAAAAAGTATTCTATTGGTTTAGACATCGGCACTAATTCCGTTGGATGGGCTGTCATAACCGATGAATACAAAGTACCTTCAAAGAAATTTAAGGTGTTGGGGAACACAGACCGTCATTCGATTAAAAAGAATCTTATCGGTGCCCTCCTATTCGATAGTGGCGAAACGGCAGAGGCGACTCGCCTGAAACGAACCGCTCGGAGAAGGTATACACGTCGCAAGAACCGAATATGTTACTTACAAGAAATTTTTAGCAATGAGATGGCCAAAGTTGACGATTCTTTCTTTCACCGTTTGGAAGAGTCCTTCCTTGTCGAAGAGGACAAGAAACATGAACGGCACCCCATCTTTGGAAACATAGTAGATGAGGTGGCATATCATGAAAAGTACCCAACGATTTATCACCTCAGAAAAAAGCTAGTTGACTCAACTGATAAAGCGGACCTGAGGTTAATCTACTTGGCTCTTGCCCATATGATAAAGTTCCGTGGGCACTTTCTCATTGAGGGTGATCTAAATCCGGACAACTCGGATGTCGACAAACTGTTCATCCAGTTAGTACAAACCTATAATCAGTTGTTTGAAGAGAACCCTATAAATGCAAGTGGCGTGGATGCGAAGGCTATTCTTAGCGCCCGCCTCTCTAAATCCCGACGGCTAGAAAACCTGATCGCACAATTACCCGGAGAGAAGAAAAATGGGTTGTTCGGTAACCTTATAGCGCTCTCACTAGGCCTGACACCAAATTTTAAGTCGAACTTCGACTTAGCTGAAGATGCCAAATTGCAGCTTAGTAAGGACACGTACGATGACGATCTCGACAATCTACTGGCACAAATTGGAGATCAGTATGCGGACTTATTTTTGGCTGCCAAAAACCTTAGCGATGCAATCCTCCTATCTGACATACTGAGAGTTAATACTGAGATTACCAAGGCGCCGTTATCCGCTTCAATGATCAAAAGGTACGATGAACATCACCAAGACTTGACACTTCTCAAGGCCCTAGTCCGTCAGCAACTGCCTGAGAAATATAAGGAAATATTCTTTGATCAGTCGAAAAACGGGTACGCAGGTTATATTGACGGCGGAGCGAGTCAAGAGGAATTCTACAAGTTTATCAAACCCATATTAGAGAAGATGGATGGGACGGAAGAGTTGCTTGTAAAACTCAATCGCGAAGATCTACTGCGAAAGCAGCGGACTTTCGACAACGGTAGCATTCCACATCAAATCCACTTAGGCGAATTGCATGCTATACTTAGAAGGCAGGAGGATTTTTATCCGTTCCTCAAAGACAATCGTGAAAAGATTGAGAAAATCCTAACCTTTCGCATACCTTACTATGTGGGACCCCTGGCCCGAGGGAACTCTCGGTTCGCATGGATGACAAGAAAGTCCGAAGAAACGATTACTCCATGGAATTTTGAGGAAGTTGTCGATAAAGGTGCGTCAGCTCAATCGTTCATCGAGAGGATGACCAACTTTGACAAGAATTTACCGAACGAAAAAGTATTGCCTAAGCACAGTTTACTTTACGAGTATTTCACAGTGTACAATGAACTCACGAAAGTTAAGTATGTCACTGAGGGCATGCGTAAACCCGCCTTTCTAAGCGGAGAACAGAAGAAAGCAATAGTAGATCTGTTATTCAAGACCAACCGCAAAGTGACAGTTAAGCAATTGAAAGAGGACTACTTTAAGAAAATTGAATGCTTCGATTCTGTCGAGATCTCCGGGGTAGAAGATCGATTTAATGCGTCACTTGGTACGTATCATGACCTCCTAAAGATAATTAAAGATAAGGACTTCCTGGATAACGAAGAGAATGAAGATATCTTAGAAGATATAGTGTTGACTCTTACCCTCTTTGAAGATCGGGAAATGATTGAGGAAAGACTAAAAACATACGCTCACCTGTTCGACGATAAGGTTATGAAACAGTTAAAGAGGCGTCGCTATACGGGCTGGGGACGATTGTCGCGGAAACTTATCAACGGGATAAGAGACAAGCAAAGTGGTAAAACTATTCTCGATTTTCTAAAGAGCGACGGCTTCGCCAATAGGAACTTTATGCAGCTGATCCATGATGACTCTTTAACCTTCAAAGAGGATATACAAAAGGCACAGGTTTCCGGACAAGGGGACTCATTGCACGAACATATTGCGAATCTTGCTGGTTCGCCAGCCATCAAAAAGGGCATACTCCAGACAGTCAAAGTAGTGGATGAGCTAGTTAAGGTCATGGGACGTCACAAACCGGAAAACATTGTAATCGAGATGGCACGCGAAAATCAAACGACTCAGAAGGGGCAAAAAAACAGTCGAGAGCGGATGAAGAGAATAGAAGAGGGTATTAAAGAACTGGGCAGCCAGATCTTAAAGGAGCATCCTGTGGAAAATACCCAATTGCAGAACGAGAAACTTTACCTCTATTACCTACAAAATGGAAGGGACATGTATGTTGATCAGGAACTGGACATAAACCGTTTATCTGATTACGACGTCGATCACATTGTACCCCAATCCTTTTTGAAGGACGATTCAATCGACAATAAAGTGCTTACACGCTCGGATAAGAACCGAGGGAAAAGTGACAATGTTCCAAGCGAGGAAGTCGTAAAGAAAATGAAGAACTATTGGCGGCAGCTCCTAAATGCGAAACTGATAACGCAAAGAAAGTTCGATAACTTAACTAAAGCTGAGAGGGGTGGCTTGTCTGAACTTGACAAGGCCGGATTTATTAAACGTCAGCTCGTGGAAACCCGCCAAATCACAAAGCATGTTGCACAGATACTAGATTCCCGAATGAATACGAAATACGACGAGAACGATAAGCTGATTCGGGAAGTCAAAGTAATCACTTTAAAGTCAAAATTGGTGTCGGACTTCAGAAAGGATTTTCAATTCTATAAAGTTAGGGAGATAAATAACTACCACCATGCGCACGACGCTTATCTTAATGCCGTCGTAGGGACCGCACTCATTAAGAAATACCCGAAGCTAGAAAGTGAGTTTGTGTATGGTGATTACAAAGTTTATGACGTCCGTAAGATGATCGCGAAAAGCGAACAGGAGATAGGCAAGGCTACAGCCAAATACTTCTTTTATTCTAACATTATGAATTTCTTTAAGACGGAAATCACTCTGGCAAACGGAGAGATACGCAAACGACCTTTAATTGAAACCAATGGGGAGACAGGTGAAATCGTATGGGATAAGGGCCGGGACTTCGCGACGGTGAGAAAAGTTTTGTCCATGCCCCAAGTCAACATAGTAAAGAAAACTGAGGTGCAGACCGGAGGGTTTTCAAAGGAATCGATTCTTCCAAAAAGGAATAGTGATAAGCTCATCGCTCGTAAAAAGGACTGGGACCCGAAAAAGTACGGTGGCTTCGATAGCCCTACAGTTGCCTATTCTGTCCTAGTAGTGGCAAAAGTTGAGAAGGGAAAATCCAAGAAACTGAAGTCAGTCAAAGAATTATTGGGGATAACGATTATGGAGCGCTCGTCTTTTGAAAAGAACCCCATCGACTTCCTTGAGGCGAAAGGTTACAAGGAAGTAAAAAAGGATCTCATAATTAAACTACCAAAGTATAGTCTGTTTGAGTTAGAAAATGGCCGAAAACGGATGTTGGCTAGCGCCGGAGAGCTTCAAAAGGGGAACGAACTCGCACTACCGTCTAAATACGTGAATTTCCTGTATTTAGCGTCCCATTACGAGAAGTTGAAAGGTTCACCTGAAGATAACGAACAGAAGCAACTTTTTGTTGAGCAGCACAAACATTATCTCGACGAAATCATAGAGCAAATTTCGGAATTCAGTAAGAGAGTCATCCTAGCTGATGCCAATCTGGACAAAGTATTAAGCGCATACAACAAGCACAGGGATAAACCCATACGTGAGCAGGCGGAAAATATTATCCATTTGTTTACTCTTACCAACCTCGGCGCTCCAGCCGCATTCAAGTATTTTGACACAACGATAGATCGCAAACGATACACTTCTACCAAGGAGGTGCTAGACGCGACACTGATTCACCAATCCATCACGGGATTATATGAAACTCGGATAGATTTGTCACAGCTTGGGGGTGACGGATCCCCCAAGAAGAAGAGGAAAGTCTCGAGCGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGGCTGCAGGA

Figure 2022545950000005
(単下線:HNHドメイン;二重下線:RuvCドメイン)
一部の実施形態では、野生型Cas9は、ストレプトコッカス・ピロゲネス(NCBI参照配列:NC_002737.2(下記の通りのヌクレオチド配列);およびUniprot参照配列:Q99ZW2(下記の通りのアミノ酸配列)由来のCas9に対応する:
ATGGATAAGAAATACTCAATAGGCTTAGATATCGGCACAAATAGCGTCGGATGGGCGGTGATCACTGATGAATATAAGGTTCCGTCTAAAAAGTTCAAGGTTCTGGGAAATACAGACCGCCACAGTATCAAAAAAAATCTTATAGGGGCTCTTTTATTTGACAGTGGAGAGACAGCGGAAGCGACTCGTCTCAAACGGACAGCTCGTAGAAGGTATACACGTCGGAAGAATCGTATTTGTTATCTACAGGAGATTTTTTCAAATGAGATGGCGAAAGTAGATGATAGTTTCTTTCATCGACTTGAAGAGTCTTTTTTGGTGGAAGAAGACAAGAAGCATGAACGTCATCCTATTTTTGGAAATATAGTAGATGAAGTTGCTTATCATGAGAAATATCCAACTATCTATCATCTGCGAAAAAAATTGGTAGATTCTACTGATAAAGCGGATTTGCGCTTAATCTATTTGGCCTTAGCGCATATGATTAAGTTTCGTGGTCATTTTTTGATTGAGGGAGATTTAAATCCTGATAATAGTGATGTGGACAAACTATTTATCCAGTTGGTACAAACCTACAATCAATTATTTGAAGAAAACCCTATTAACGCAAGTGGAGTAGATGCTAAAGCGATTCTTTCTGCACGATTGAGTAAATCAAGACGATTAGAAAATCTCATTGCTCAGCTCCCCGGTGAGAAGAAAAATGGCTTATTTGGGAATCTCATTGCTTTGTCATTGGGTTTGACCCCTAATTTTAAATCAAATTTTGATTTGGCAGAAGATGCTAAATTACAGCTTTCAAAAGATACTTACGATGATGATTTAGATAATTTATTGGCGCAAATTGGAGATCAATATGCTGATTTGTTTTTGGCAGCTAAGAATTTATCAGATGCTATTTTACTTTCAGATATCCTAAGAGTAAATACTGAAATAACTAAGGCTCCCCTATCAGCTTCAATGATTAAACGCTACGATGAACATCATCAAGACTTGACTCTTTTAAAAGCTTTAGTTCGACAACAACTTCCAGAAAAGTATAAAGAAATCTTTTTTGATCAATCAAAAAACGGATATGCAGGTTATATTGATGGGGGAGCTAGCCAAGAAGAATTTTATAAATTTATCAAACCAATTTTAGAAAAAATGGATGGTACTGAGGAATTATTGGTGAAACTAAATCGTGAAGATTTGCTGCGCAAGCAACGGACCTTTGACAACGGCTCTATTCCCCATCAAATTCACTTGGGTGAGCTGCATGCTATTTTGAGAAGACAAGAAGACTTTTATCCATTTTTAAAAGACAATCGTGAGAAGATTGAAAAAATCTTGACTTTTCGAATTCCTTATTATGTTGGTCCATTGGCGCGTGGCAATAGTCGTTTTGCATGGATGACTCGGAAGTCTGAAGAAACAATTACCCCATGGAATTTTGAAGAAGTTGTCGATAAAGGTGCTTCAGCTCAATCATTTATTGAACGCATGACAAACTTTGATAAAAATCTTCCAAATGAAAAAGTACTACCAAAACATAGTTTGCTTTATGAGTATTTTACGGTTTATAACGAATTGACAAAGGTCAAATATGTTACTGAAGGAATGCGAAAACCAGCATTTCTTTCAGGTGAACAGAAGAAAGCCATTGTTGATTTACTCTTCAAAACAAATCGAAAAGTAACCGTTAAGCAATTAAAAGAAGATTATTTCAAAAAAATAGAATGTTTTGATAGTGTTGAAATTTCAGGAGTTGAAGATAGATTTAATGCTTCATTAGGTACCTACCATGATTTGCTAAAAATTATTAAAGATAAAGATTTTTTGGATAATGAAGAAAATGAAGATATCTTAGAGGATATTGTTTTAACATTGACCTTATTTGAAGATAGGGAGATGATTGAGGAAAGACTTAAAACATATGCTCACCTCTTTGATGATAAGGTGATGAAACAGCTTAAACGTCGCCGTTATACTGGTTGGGGACGTTTGTCTCGAAAATTGATTAATGGTATTAGGGATAAGCAATCTGGCAAAACAATATTAGATTTTTTGAAATCAGATGGTTTTGCCAATCGCAATTTTATGCAGCTGATCCATGATGATAGTTTGACATTTAAAGAAGACATTCAAAAAGCACAAGTGTCTGGACAAGGCGATAGTTTACATGAACATATTGCAAATTTAGCTGGTAGCCCTGCTATTAAAAAAGGTATTTTACAGACTGTAAAAGTTGTTGATGAATTGGTCAAAGTAATGGGGCGGCATAAGCCAGAAAATATCGTTATTGAAATGGCACGTGAAAATCAGACAACTCAAAAGGGCCAGAAAAATTCGCGAGAGCGTATGAAACGAATCGAAGAAGGTATCAAAGAATTAGGAAGTCAGATTCTTAAAGAGCATCCTGTTGAAAATACTCAATTGCAAAATGAAAAGCTCTATCTCTATTATCTCCAAAATGGAAGAGACATGTATGTGGACCAAGAATTAGATATTAATCGTTTAAGTGATTATGATGTCGATCACATTGTTCCACAAAGTTTCCTTAAAGACGATTCAATAGACAATAAGGTCTTAACGCGTTCTGATAAAAATCGTGGTAAATCGGATAACGTTCCAAGTGAAGAAGTAGTCAAAAAGATGAAAAACTATTGGAGACAACTTCTAAACGCCAAGTTAATCACTCAACGTAAGTTTGATAATTTAACGAAAGCTGAACGTGGAGGTTTGAGTGAACTTGATAAAGCTGGTTTTATCAAACGCCAATTGGTTGAAACTCGCCAAATCACTAAGCATGTGGCACAAATTTTGGATAGTCGCATGAATACTAAATACGATGAAAATGATAAACTTATTCGAGAGGTTAAAGTGATTACCTTAAAATCTAAATTAGTTTCTGACTTCCGAAAAGATTTCCAATTCTATAAAGTACGTGAGATTAACAATTACCATCATGCCCATGATGCGTATCTAAATGCCGTCGTTGGAACTGCTTTGATTAAGAAATATCCAAAACTTGAATCGGAGTTTGTCTATGGTGATTATAAAGTTTATGATGTTCGTAAAATGATTGCTAAGTCTGAGCAAGAAATAGGCAAAGCAACCGCAAAATATTTCTTTTACTCTAATATCATGAACTTCTTCAAAACAGAAATTACACTTGCAAATGGAGAGATTCGCAAACGCCCTCTAATCGAAACTAATGGGGAAACTGGAGAAATTGTCTGGGATAAAGGGCGAGATTTTGCCACAGTGCGCAAAGTATTGTCCATGCCCCAAGTCAATATTGTCAAGAAAACAGAAGTACAGACAGGCGGATTCTCCAAGGAGTCAATTTTACCAAAAAGAAATTCGGACAAGCTTATTGCTCGTAAAAAAGACTGGGATCCAAAAAAATATGGTGGTTTTGATAGTCCAACGGTAGCTTATTCAGTCCTAGTGGTTGCTAAGGTGGAAAAAGGGAAATCGAAGAAGTTAAAATCCGTTAAAGAGTTACTAGGGATCACAATTATGGAAAGAAGTTCCTTTGAAAAAAATCCGATTGACTTTTTAGAAGCTAAAGGATATAAGGAAGTTAAAAAAGACTTAATCATTAAACTACCTAAATATAGTCTTTTTGAGTTAGAAAACGGTCGTAAACGGATGCTGGCTAGTGCCGGAGAATTACAAAAAGGAAATGAGCTGGCTCTGCCAAGCAAATATGTGAATTTTTTATATTTAGCTAGTCATTATGAAAAGTTGAAGGGTAGTCCAGAAGATAACGAACAAAAACAATTGTTTGTGGAGCAGCATAAGCATTATTTAGATGAGATTATTGAGCAAATCAGTGAATTTTCTAAGCGTGTTATTTTAGCAGATGCCAATTTAGATAAAGTTCTTAGTGCATATAACAAACATAGAGACAAACCAATACGTGAACAAGCAGAAAATATTATTCATTTATTTACGTTGACGAATCTTGGAGCTCCCGCTGCTTTTAAATATTTTGATACAACAATTGATCGTAAACGATATACGTCTACAAAAGAAGTTTTAGATGCCACTCTTATCCATCAATCCATCACTGGTCTTTATGAAACACGCATTGATTTGAGTCAGCTAGGAGGTGACTGA

Figure 2022545950000006
(単下線:HNHドメイン;二重下線:RuvCドメイン)
一部の実施形態では、Cas9は、コリネバクテリウム・ウルセランス(NCBI参照番号:NC_015683.1、NC_017317.1);コリネバクテリウム・ジフテリア(NCBI参照番号:NC_016782.1、NC_016786.1);スピロプラズマ・シルフィディコーラ(NCBI参照番号:NC_021284.1);プレボテラ・インターメディア(NCBI参照番号:NC_017861.1);スピロプラズマ・タイワネンス(NCBI参照番号:NC_021846.1);トレプトコッカス・イニエ(NCBI参照番号:NC_021314.1);ベリエラ・バルティカ(NCBI参照番号:NC_018010.1);サイクロフレクサス・トルキス(NCBI参照番号:NC_018721.1);ストレプトコッカス・サーモフィルス(NCBI参照番号:YP_820832.1)、リステリア・イノキュア(NCBI参照番号:NP_472073.1)、カンピロバクター・ジェジュニ(NCBI参照番号:YP_002344900.1)、またはナイセリア・メニンギティディス(NCBI参照番号:YP_002342100.1)に由来するCas9を指すか、または任意の他の生物に由来するCas9を指す。
追加のCas9タンパク質(例えば、ヌクレアーゼ活性のないCas9(dCas9)、Cas9ニッカーゼ(nCas9)、またはヌクレアーゼ活性Cas9)は、それらのバリアントおよびホモログを含めて、本開示の範囲内にあることを認識すべきである。例示的なCas9タンパク質としては、下記に示されるものが挙げられるがこれに限定されない。一部の実施形態では、Cas9タンパク質は、ヌクレアーゼ活性のないCas9(dCas9)である。一部の実施形態では、Cas9タンパク質はCas9ニッカーゼ(nCas9)である。一部の実施形態では、Cas9タンパク質はヌクレアーゼ活性のCas9である。
一部の実施形態では、Cas9ドメインはヌクレアーゼ不活性のCas9ドメイン(dCas9)である。例えば、dCas9ドメインは、二重鎖の核酸分子のどちらも切断することなく、二重鎖の核酸分子に(例えば、gRNA分子を介して)結合し得る。一部の実施形態では、ヌクレアーゼ不活性のdCas9ドメインは、本明細書に規定されるアミノ酸配列のD10X変異およびH840X変異、または本明細書に示されるいずれかのアミノ酸配列中の対応する変異を含み、表記中、Xは任意のアミノ酸変化である。一部の実施形態では、ヌクレアーゼ不活性のdCas9ドメインは、本明細書に規定されるアミノ酸配列のD10A変異およびH840A変異、または本明細書に示されるいずれかのアミノ酸配列中の対応する変異を含む。一例として、ヌクレアーゼ-不活性のCas9ドメインは、規定されるアミノ酸配列をクローニングベクターpPlatTET-gRNA2(受入番号BAV54124)に含む。
例示的な触媒として不活性のCas9(dCas9)のアミノ酸配列は以下の通りである:MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
(例えば、その全体の内容が本明細書に参照により組み込まれるQi et al., “Repurposing CRISPR as an RNA-guided platform for sequence-specific control of gene expression.” Cell. 2013; 152(5):1173-83を参照)。
一部の実施形態では、Cas9ヌクレアーゼは、不活性の(例えば、不活化された)DNA切断ドメインを有する、すなわち、Cas9はニッカーゼであり、「nCas9」タンパク質(「ニッカーゼ」Cas9)とも呼ばれる。ヌクレアーゼ不活化Cas9タンパク質は、互換的に「dCas9」タンパク質(ヌクレアーゼ「活性のない」Cas9)または触媒として不活性のCas9とも呼ばれることがある。不活性のDNA切断ドメインを有するCas9タンパク質(またはその断片)を生成する方法は公知である(例えば、そのそれぞれの全体の内容が参照により本明細書に組み込まれるJinek et al., Science. 337:816-821(2012); Qi et al., “Repurposing CRISPR as an RNA-Guided Platform for Sequence-Specific Control of Gene Expression” (2013) Cell. 28;152(5):1173-83を参照)。例えば、Cas9のDNA切断ドメインは、2つのサブドメイン、すなわちHNHヌクレアーゼサブドメインとRuvC1サブドメインとを含むことが知られる。HNHサブドメインがgRNAに相補的な鎖を切断するのに対し、RuvC1サブドメインは非相補的な鎖を切断する。これらのサブドメイン内の変異は、Cas9のヌクレアーゼ活性を封じることができる。例えば、変異D10AおよびH840Aは、S.ピロゲネスCas9のヌクレアーゼ活性を完全に不活化する(Jinek et al., Science. 337:816-821(2012); Qi et al., Cell. 28;152(5):1173-83 (2013))。
一部の実施形態では、dCas9ドメインは、本明細書に示されるdCas9ドメインのうちいずれか1つに少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。一部の実施形態では、Cas9ドメインは、本明細書に規定されたアミノ酸配列のうちいずれか1つに比べて1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、またはそれを超えるまたはそれを超える個数の変異を有するアミノ酸配列を含む。一部の実施形態では、Cas9ドメインは、本明細書に規定されたアミノ酸配列のうちいずれか1つに比べて少なくとも10、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも150、少なくとも200、少なくとも250、少なくとも300、少なくとも350、少なくとも400、少なくとも500、少なくとも600、少なくとも700、少なくとも800、少なくとも900、少なくとも1000、少なくとも1100、または少なくとも1200個同一の隣接したアミノ酸残基を有するアミノ酸配列を含む。
一部の実施形態では、dCas9は、部分的または全体的に、Cas9ヌクレアーゼ活性を不活化する1つまたは複数の変異を有するCas9アミノ酸配列に対応するか、またはそれを含む。例えば、一部の実施形態では、dCas9ドメインは、D10AおよびH840A変異、または別のCas9中の対応する変異を含む。
一部の実施形態では、dCas9は、dCas9(D10AおよびH840A)のアミノ酸配列を含む:
Figure 2022545950000007
(単下線:HNHドメイン;二重下線:RuvCドメイン)
一部の実施形態では、Cas9ドメインはD10A変異を含むとともに、840位の残基は、上記に示されるアミノ酸配列において、または本明細書に示されるアミノ酸配列のうちいずれかの対応する位置で、ヒスチジンのままである。
他の実施形態では、D10AおよびH840A以外の変異を有するdCas9バリアントが提供され、それらは例えば、ヌクレアーゼ不活化Cas9(dCas9)を結果として生じる。そのような変異には、例えば、D10およびH840での他のアミノ酸置換、またはCas9のヌクレアーゼドメイン内の他の置換(例えば、HNHヌクレアーゼサブドメインおよび/またはRuvC1サブドメイン内の置換)が含まれる。一部の実施形態では、少なくとも約70%同一の、少なくとも約80%同一の、少なくとも約90%同一の、少なくとも約95%同一の、少なくとも約98%同一の、少なくとも約99%同一の、少なくとも約99.5%同一の、または少なくとも約99.9%同一のdCas9のバリアントまたはホモログが提供される。一部の実施形態では、約5アミノ酸、約10アミノ酸、約15アミノ酸、約20アミノ酸、約25アミノ酸、約30アミノ酸、約40アミノ酸、約50アミノ酸、約75アミノ酸、約100アミノ酸、またはそれを超えて短いかまたは長いアミノ酸配列を有する、dCas9のバリアントが提供される。
一部の実施形態では、Cas9ドメインはCas9ニッカーゼである。Cas9ニッカーゼは、二重鎖の核酸分子(例えば、二重鎖のDNA分子)のうち一本鎖のみを切断することのできるCas9タンパク質とし得る。一部の実施形態では、Cas9ニッカーゼは、二重鎖の核酸分子の標的鎖を切断し、このことは、Cas9に結合するgRNA(例えばsgRNA)と塩基対を形成する(と相補的な)鎖を、Cas9ニッカーゼが切断することを意味する。一部の実施形態では、Cas9ニッカーゼは、D10A変異を含み、ヒスチジンを840位に有する。一部の実施形態では、Cas9ニッカーゼは、二重鎖の核酸分子のうち標的ではなく塩基編集されない鎖を切断し、このことは、Cas9に結合するgRNA(例えばsgRNA)と塩基対を形成しない鎖を、Cas9ニッカーゼが切断することを意味する。一部の実施形態では、Cas9ニッカーゼは、H840A変異を含み、アスパラギン酸残基を10位に有するか、または対応する変異を有する。一部の実施形態では、Cas9ニッカーゼは、本明細書に提供されるいずれか1つのCas9ニッカーゼに少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一のアミノ酸配列を含む。追加の適したCas9ニッカーゼは、本開示および当技術分野の知識に基づき当業者に明らかになるものとなり、本開示の範囲内にある。
例示的な触媒としてのCas9(nCas9)のアミノ酸配列は以下の通りである:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
一部の実施形態では、Cas9とは、単細胞の原核微生物のドメインと界を構成する古細菌(例えば、ナノ古細菌)由来のCas9を指す。一部の実施形態では、プログラマブルヌクレオチド結合タンパク質は、CasXまたはCasYタンパク質としてもよく、これは例えば、その全体の内容がここに参照により組み込まれるBurstein et al., "New CRISPR-Cas systems from uncultivated microbes." Cell Res. 2017 Feb 21. doi: 10.1038/cr.2017.21に記載されている。ゲノム解読メタゲノミクスを用いて複数のCRISPR-Casシステムが特定されたが、そのようなものとしては、古細菌1の生命ドメインで最初に報告されたCas9が挙げられる。この多様なCas9タンパク質は、殆ど研究されていないナノ古細菌に活性のCRISPR-Casシステムの一環として見出された。細菌では、以前には未知であった2つのシステムCRISPR-CasXおよびCRISPR-CasYが発見されたが、これらはこれまで発見された最もコンパクトなシステムである。一部の実施形態では、本明細書に記載の塩基エディターシステムにおいて、Cas9は、CasXまたはCasXのバリアントによって置き換えられる。一部の実施形態では、本明細書に記載の塩基エディターシステムにおいて、Cas9はCasYまたはCasYのバリアントによって置き換えられる。他のRNAガイド型DNA結合タンパク質が核酸プログラマブルDNA結合タンパク質(napDNAbp)として用いられることがあり、本開示の範囲内にあることを理解するべきである。
一部の実施形態では、本明細書に提供される任意の融合タンパク質の核酸プログラマブルDNA結合タンパク質(napDNAbp)は、CasXまたはCasYタンパク質としてもよい。一部の実施形態では、napDNAbpはCasXタンパク質である。一部の実施形態では、napDNAbpはCasYタンパク質である。一部の実施形態では、napDNAbpは、天然のCasXまたはCasYタンパク質と少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または楽に99.5%同一であるアミノ酸配列を含む。一部の実施形態では、プログラマブルヌクレオチド結合タンパク質は、天然のCasXまたはCasYタンパク質である。一部の実施形態では、プログラマブルヌクレオチド結合タンパク質は、本明細書に記載される任意のCasXまたはCasYタンパク質と少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または楽に99.5%同一であるアミノ酸配列を含む。他の細菌種由来のCasXおよびCasYも本開示に従って用いられることを認識するべきである。
例示的なCasX((uniprot.org/uniprot/F0NN87; uniprot.org/uniprot/F0NH53) tr|F0NN87|F0NN87_SULIH CRISPR関連CasXタンパク質 OS = スルフォロブス・ イスランディカス (HVE10/4 株) GN = SiH_0402 PE=4 SV=1)のアミノ酸配列は以下の通りである:
MEVPLYNIFGDNYIIQVATEAENSTIYNNKVEIDDEELRNVLNLAYKIAKNNEDAAAERRGKAKKKKGEEGETTTSNIILPLSGNDKNPWTETLKCYNFPTTVALSEVFKNFSQVKECEEVSAPSFVKPEFYEFGRSPGMVERTRRVKLEVEPHYLIIAAAGWVLTRLGKAKVSEGDYVGVNVFTPTRGILYSLIQNVNGIVPGIKPETAFGLWIARKVVSSVTNPNVSVVRIYTISDAVGQNPTTINGGFSIDLTKLLEKRYLLSERLEAIARNALSISSNMRERYIVLANYIYEYLTGSKRLEDLLYFANRDLIMNLNSDDGKVRDLKLISAYVNGELIRGEG。
例示的なCasX(>tr|F0NH53|F0NH53_SULIR CRISPR関連タンパク質、CasX OS = スルフォロブス・ イスランディカス(REY15A株)GN=SiRe_0771 PE=4 SV=1)のアミノ酸配列は以下の通りである:
MEVPLYNIFGDNYIIQVATEAENSTIYNNKVEIDDEELRNVLNLAYKIAKNNEDAAAERRGKAKKKKGEEGETTTSNIILPLSGNDKNPWTETLKCYNFPTTVALSEVFKNFSQVKECEEVSAPSFVKPEFYKFGRSPGMVERTRRVKLEVEPHYLIMAAAGWVLTRLGKAKVSEGDYVGVNVFTPTRGILYSLIQNVNGIVPGIKPETAFGLWIARKVVSSVTNPNVSVVSIYTISDAVGQNPTTINGGFSIDLTKLLEKRDLLSERLEAIARNALSISSNMRERYIVLANYIYEYLTGSKRLEDLLYFANRDLIMNLNSDDGKVRDLKLISAYVNGELIRGEG。
デルタプロテオバクテリアCasX
MEKRINKIRKKLSADNATKPVSRSGPMKTLLVRVMTDDLKKRLEKRRKKPEVMPQVISNNAANNLRMLLDDYTKMKEAILQVYWQEFKDDHVGLMCKFAQPASKKIDQNKLKPEMDEKGNLTTAGFACSQCGQPLFVYKLEQVSEKGKAYTNYFGRCNVAEHEKLILLAQLKPVKDSDEAVTYSLGKFGQRALDFYSIHVTKESTHPVKPLAQIAGNRYASGPVGKALSDACMGTIASFLSKYQDIIIEHQKVVKGNQKRLESLRELAGKENLEYPSVTLPPQPHTKEGVDfAYNEVIARVRMWVNLNLWQKLKLSRDDAKPLLRLKGFPSFPVVERRENEVDWWNTINEVKKLIDAKRDMGRVFWSGVTAEKRNTILEGYNYLPNENDHKKREGSLENPKKPAKRQFGDLLLYLEKKYAGDWGKVFDEAWERIDKKIAGLTSHIEREEARNAEDAQSKAVLTDWLRAKASFVLERLKEMDEKEFYACEIQLQKWYGDLRGNPFAVEAENRVVDISGFSIGSDGHSIQYRNLLAWKYLENGKREFYLLMNYGKKGRIRFTDGTDIKKSGKWQGLLYGGGKAKVIDLTFDPDDEQLIILPLAFGTRQGREFIWNDLLSLETGLIKLANGRVIEKTIYNKKIGRDEPALFVALTFERREVVDPSNIKPVNLIGVARGENIPAVIALTDPEGCPLPEFKDSSGGPTDILRIGEGYKEKQRAIQAAKEVEQRRAGGYSRKFASKSRNLADDMVRNSARDLFYHAVTHDAVLVFANLSRGFGRQGKRTFMTERQYTKMEDWLTAKLAYEGLTSKTYLSKTLAQYTSKTCSNCGFTITYADMDVMLVRLKKTSDGWATTLNNKELKAEYQITYYNRYKRQTVEKELSAELDRLSEESGNNDISKWTKGRRDEALFLLKKRFSHRPVQEQFVCLDCGHEVHAAEQAALNIARSWLFLNSNSTEFKSYKSGKQPFVGAWQAFYKRRLKEVWKPNA
例示的なCasY((ncbi.nlm.nih.gov/protein/APG80656.1) >APG80656.1 CRISPR関連タンパク質CasY[未培養のパークバクテリア群細菌])のアミノ酸配列は以下の通りである:
MSKRHPRISGVKGYRLHAQRLEYTGKSGAMRTIKYPLYSSPSGGRTVPREIVSAINDDYVGLYGLSNFDDLYNAEKRNEEKVYSVLDFWYDCVQYGAVFSYTAPGLLKNVAEVRGGSYELTKTLKGSHLYDELQIDKVIKFLNKKEISRANGSLDKLKKDIIDCFKAEYRERHKDQCNKLADDIKNAKKDAGASLGERQKKLFRDFFGISEQSENDKPSFTNPLNLTCCLLPFDTVNNNRNRGEVLFNKLKEYAQKLDKNEGSLEMWEYIGIGNSGTAFSNFLGEGFLGRLRENKITELKKAMMDITDAWRGQEQEEELEKRLRILAALTIKLREPKFDNHWGGYRSDINGKLSSWLQNYINQTVKIKEDLKGHKKDLKKAKEMINRFGESDTKEEAVVSSLLESIEKIVPDDSADDEKPDIPAIAIYRRFLSDGRLTLNRFVQREDVQEALIKERLEAEKKKKPKKRKKKSDAEDEKETIDFKELFPHLAKPLKLVPNFYGDSKRELYKKYKNAAIYTDALWKAVEKIYKSAFSSSLKNSFFDTDFDKDFFIKRLQKIFSVYRRFNTDKWKPIVKNSFAPYCDIVSLAENEVLYKPKQSRSRKSAAIDKNRVRLPSTENIAKAGIALARELSVAGFDWKDLLKKEEHEEYIDLIELHKTALALLLAVTETQLDISALDFVENGTVKDFMKTRDGNLVLEGRFLEMFSQSIVFSELRGLAGLMSRKEFITRSAIQTMNGKQAELLYIPHEFQSAKITTPKEMSRAFLDLAPAEFATSLEPESLSEKSLLKLKQMRYYPHYFGYELTRTGQGIDGGVAENALRLEKSPVKKREIKCKQYKTLGRGQNKIVLYVRSSYYQTQFLEWFLHRPKNVQTDVAVSGSFLIDEKKVKTRWNYDALTVALEPVSGSERVFVSQPFTIFPEKSAEEEGQRYLGIDIGEYGIAYTALEITGDSAKILDQNFISDPQLKTLREEVKGLKLDQRRGTFAMPSTKIARIRESLVHSLRNRIHHLALKHKAKIVYELEVSRFEEGKQKIKKVYATLKKADVYSEIDADKNLQTTVWGKLAVASEISASYTSQFCGACKKLWRAEMQVDETITTQELIGTVRVIKGGTLIDAIKDFMRPPIFDENDTPFPKYRDFCDKHHISKKMRGNSCLFICPFCRANADADIQASQTIALLRYVKEEKKVEDYFERFRKLKNIKVLGQMKKI。
一部の実施形態では、核酸プログラマブルDNA結合タンパク質(napDNAbp)は、微生物CRISPR-Casシステムの単一エフェクターである。微生物CRISPR-Casシステムの単一エフェクターとしては、限定はないが、Cas9、Cpf1、Cas12b/C2c1、およびCas12c/C2c3が挙げられる。典型的には、微生物CRISPR-Casシステムは、クラス1とクラス2とのシステムに分けられる。クラス1システムは、マルチサブユニットのエフェクター複合体を有するのに対し、クラス2システムは、単一タンパク質のエフェクターを有する。例えば、Cas9およびCpf1は、クラス2エフェクターである。Cas9およびCpf1に加えて、3つの別個のクラス2のCRISPR-Casシステム(Cas12b/C2c1、およびCas12c/C2c3)が、Shmakov et al., “Discovery and Functional Characterization of Diverse Class 2 CRISPR Cas Systems”, Mol. Cell, 2015 Nov. 5; 60(3): 385-397によって記載されており、その全体の内容はここに参照により組み込まれる。2つのシステムのエフェクターであるCas12b/C2c1およびCas12c/C2c3は、Cpf1に関連するRuvC-likeエンドヌクレアーゼドメインを含有する。第3のシステムは、2つの推定HEPN RNaseドメインを有するエフェクターを含有する。成熟CRISPR RNAの産生は、Cas12b/C2c1によるCRISPR RNAとは異なり、tracrRNA依存的である。Cas12b/C2c1は、DNA切断にはCRISPR RNAとtracrRNAとの両方に依存する。
アリシクロバチルス・アシドテレストリスCas12b/C2c1(AacC2c1)の結晶構造が、キメラ一本鎖分子ガイドRNA(sgRNA)との複合体において報告されている。例えば、その全体の内容がここに参照により組み込まれるLiu et al., “C2c1-sgRNA Complex Structure Reveals RNA-Guided DNA Cleavage Mechanism”, Mol. Cell, 2017 Jan. 19; 65(2):310-322を参照されたい。この結晶構造は、標的DNAに三次複合体として結合されたアリシクロバチルス・アシドテレストリスC2c1において報告されている。例えば、その全体の内容がここに参照により組み込まれるYang et al., “PAM-dependent Target DNA Recognition and Cleavage by C2C1 CRISPR-Cas endonuclease”, Cell, 2016 Dec. 15; 167(7):1814-1828を参照されたい。標的および非標的の両方のDNA鎖とのAacC2c1の触媒能を有する立体配座が、単一のRuvC触媒ポケット内に独立して配置されて捕捉されており、Cas12b/C2c1媒介性切断の結果として標的DNAの7ヌクレオチドの互い違いの切断が生じる。Cas12b/C2c1三次複合体と過去に特定されたCas9およびCpf1のカウンターパートとの構造比較では、CRISPR-Cas9システムにより用いられる機構の多様性が実証されている。
一部の実施形態では、本明細書に提供される任意の融合タンパク質の核酸プログラマブルDNA結合タンパク質(napDNAbp)は、Cas12b/C2c1またはCas12c/C2c3タンパク質としてもよい。一部の実施形態では、napDNAbpはCas12b/C2c1タンパク質である。一部の実施形態では、napDNAbpはCas12c/C2c3タンパク質である。一部の実施形態では、napDNAbpは、天然のCas12b/C2c1またはCas12c/C2c3タンパク質と少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または楽に99.5%同一であるアミノ酸配列を含む。一部の実施形態では、napDNAbpは、天然のCas12b/C2c1またはCas12c/C2c3タンパク質である。一部の実施形態では、napDNAbpは、本明細書に示されるいずれか1つのnapDNAbp配列と少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または楽に99.5%同一であるアミノ酸配列を含む。他の細菌種由来のCas12b/C2c1またはCas12c/C2c3も本開示に従って用いられることを認識するべきである。
Cas12b/C2c1((uniprot.org/uniprot/T0D7A2#2)sp|T0D7A2|C2C1_ALIAG CRISPR関連エンドヌクレアーゼC2c1 OS=アリシクロバチルス・アシドテレストリス(ATCC49025/DSM3922/CIP106132/NCIMB13137/GD3B株) GN=c2c1 PE=1 SV=1)のアミノ酸配列は以下の通りである:
MAVKSIKVKLRLDDMPEIRAGLWKLHKEVNAGVRYYTEWLSLLRQENLYRRSPNGDGEQECDKTAEECKAELLERLRARQVENGHRGPAGSDDELLQLARQLYELLVPQAIGAKGDAQQIARKFLSPLADKDAVGGLGIAKAGNKPRWVRMREAGEPGWEEEKEKAETRKSADRTADVLRALADFGLKPLMRVYTDSEMSSVEWKPLRKGQAVRTWDRDMFQQAIERMMSWESWNQRVGQEYAKLVEQKNRFEQKNFVGQEHLVHLVNQLQQDMKEASPGLESKEQTAHYVTGRALRGSDKVFEKWGKLAPDAPFDLYDAEIKNVQRRNTRRFGSHDLFAKLAEPEYQALWREDASFLTRYAVYNSILRKLNHAKMFATFTLPDATAHPIWTRFDKLGGNLHQYTFLFNEFGERRHAIRFHKLLKVENGVAREVDDVTVPISMSEQLDNLLPRDPNEPIALYFRDYGAEQHFTGEFGGAKIQCRRDQLAHMHRRRGARDVYLNVSVRVQSQSEARGERRPPYAAVFRLVGDNHRAFVHFDKLSDYLAEHPDDGKLGSEGLLSGLRVMSVDLGLRTSASISVFRVARKDELKPNSKGRVPFFFPIKGNDNLVAVHERSQLLKLPGETESKDLRAIREERQRTLRQLRTQLAYLRLLVRCGSEDVGRRERSWAKLIEQPVDAANHMTPDWREAFENELQKLKSLHGICSDKEWMDAVYESVRRVWRHMGKQVRDWRKDVRSGERPKIRGYAKDVVGGNSIEQIEYLERQYKFLKSWSFFGKVSGQVIRAEKGSRFAITLREHIDHAKEDRLKKLADRIIMEALGYVYALDERGKGKWVAKYPPCQLILLEELSEYQFNNDRPPSENNQLMQWSHRGVFQELINQAQVHDLLVGTMYAAFSSRFDARTGAPGIRCRRVPARCTQEHNPEPFPWWLNKFVVEHTLDACPLRADDLIPTGEGEIFVSPFSAEEGDFHQIHADLNAAQNLQQRLWSDFDISQIRLRCDWGEVDGELVLIPRLTGKRTADSYSNKVFYTNTGVTYYERERGKKRRKVFAQEKLSEEEAELLVEADEAREKSVVLMRDPSGIINRGNWTRQKEFWSMV NQRIEGYLVKQIRSRVPLQDSACENTGDI。
BhCas12b(バチルス・ヒサシイ)NCBI参照配列:WP_095142515
MAPKKKRKVGIHGVPAAATRSFILKIEPNEEVKKGLWKTHEVLNHGIAYYMNILKLIRQEAIYEHHEQDPKNPKKVSKAEIQAELWDFVLKMQKCNSFTHEVDKDEVFNILRELYEELVPSSVEKKGEANQLSNKFLYPLVDPNSQSGKGTASSGRKPRWYNLKIAGDPSWEEEKKKWEEDKKKDPLAKILGKLAEYGLIPLFIPYTDSNEPIVKEIKWMEKSRNQSVRRLDKDMFIQALERFLSWESWNLKVKEEYEKVEKEYKTLEERIKEDIQALKALEQYEKERQEQLLRDTLNTNEYRLSKRGLRGWREIIQKWLKMDENEPSEKYLEVFKDYQRKHPREAGDYSVYEFLSKKENHFIWRNHPEYPYLYATFCEIDKKKKDAKQQATFTLADPINHPLWVRFEERSGSNLNKYRILTEQLHTEKLKKKLTVQLDRLIYPTESGGWEEKGKVDIVLLPSRQFYNQIFLDIEEKGKHAFTYKDESIKFPLKGTLGGARVQFDRDHLRRYPHKVESGNVGRIYFNMTVNIEPTESPVSKSLKIHRDDFPKVVNFKPKELTEWIKDSKGKKLKSGIESLEIGLRVMSIDLGQRQAAAASIFEVVDQKPDIEGKLFFPIKGTELYAVHRASFNIKLPGETLVKSREVLRKAREDNLKLMNQKLNFLRNVLHFQQFEDITEREKRVTKWISRQENSDVPLVYQDELIQIRELMYKPYKDWVAFLKQLHKRLEVEIGKEVKHWRKSLSDGRKGLYGISLKNIDEIDRTRKFLLRWSLRPTEPGEVRRLEPGQRFAIDQLNHLNALKEDRLKKMANTIIMHALGYCYDVRKKKWQAKNPACQIILFEDLSNYNPYEERSRFENSKLMKWSRREIPRQVALQGEIYGLQVGEVGAQFSSRFHAKTGSPGIRCSVVTKEKLQDNRFFKNLQREGRLTLDKIAVLKEGDLYPDKGGEKFISLSKDRKCVTTHADINAAQNLQKRFWTRTHGFYKVYCKAYQVDGQTVYIPESKDQKQKIIEEFGEGYFILKDGVYEWVNAGKLKIKKGSSKQSSSELVDSDILKDSFDLASELKGEKLMLYRDPSGNVFPSDKWMAAGVFFGKLERILISKLTNQYSISTIEDDSSKQSMKRPAATKKAGQAKKKK
一部の実施形態では、Cas12bはBvCas12Bであり、BvCas12BはBhCas12bのバリアントであり、BhCas12Bに関して以下の変化を含む:S893R、K846R、およびE837G。
BvCas12b(バチルス属V3-13)NCBI参照配列:WP_101661451.1
MAIRSIKLKMKTNSGTDSIYLRKALWRTHQLINEGIAYYMNLLTLYRQEAIGDKTKEAYQAELINIIRNQQRNNGSSEEHGSDQEILALLRQLYELIIPSSIGESGDANQLGNKFLYPLVDPNSQSGKGTSNAGRKPRWKRLKEEGNPDWELEKKKDEERKAKDPTVKIFDNLNKYGLLPLFPLFTNIQKDIEWLPLGKRQSVRKWDKDMFIQAIERLLSWESWNRRVADEYKQLKEKTESYYKEHLTGGEEWIEKIRKFEKERNMELEKNAFAPNDGYFITSRQIRGWDRVYEKWSKLPESASPEELWKVVAEQQNKMSEGFGDPKVFSFLANRENRDIWRGHSERIYHIAAYNGLQKKLSRTKEQATFTLPDAIEHPLWIRYESPGGTNLNLFKLEEKQKKNYYVTLSKIIWPSEEKWIEKENIEIPLAPSIQFNRQIKLKQHVKGKQEISFSDYSSRISLDGVLGGSRIQFNRKYIKNHKELLGEGDIGPVFFNLVVDVAPLQETRNGRLQSPIGKALKVISSDFSKVIDYKPKELMDWMNTGSASNSFGVASLLEGMRVMSIDMGQRTSASVSIFEVVKELPKDQEQKLFYSINDTELFAIHKRSFLLNLPGEVVTKNNKQQRQERRKKRQFVRSQIRMLANVLRLETKKTPDERKKAIHKLMEIVQSYDSWTASQKEVWEKELNLLTNMAAFNDEIWKESLVELHHRIEPYVGQIVSKWRKGLSEGRKNLAGISMWNIDELEDTRRLLISWSKRSRTPGEANRIETDEPFGSSLLQHIQNVKDDRLKQMANLIIMTALGFKYDKEEKDRYKRWKETYPACQIILFENLNRYLFNLDRSRRENSRLMKWAHRSIPRTVSMQGEMFGLQVGDVRSEYSSRFHAKTGAPGIRCHALTEEDLKAGSNTLKRLIEDGFINESELAYLKKGDIIPSQGGELFVTLSKRYKKDSDNNELTVIHADINAAQNLQKRFWQQNSEVYRVPCQLARMGEDKLYIPKSQTETIKKYFGKGSFVKNNTEQEVYKWEKSEKMKIKTDTTFDLQDLDGFEDISKTIELAQEQQKKYLTMFRDPSGYFFNNETWRPQKEYWSIVNNIIKSCLKKKILSNKVEL
Cas9ヌクレアーゼは、2つの機能性エンドヌクレアーゼドメイン:RuvCおよびHNHを有する。Cas9は、標的が結合すると立体変化を生じ、この立体変化は、標的DNAの反対の鎖を切断するようにヌクレアーゼドメインを配置する。Cas9媒介性DNA切断の最終的な結果は、標的DNA(PAM配列の約3~4ヌクレオチド上流)内の二本鎖切断(DSB)である。この結果として生じるDSBは、次いで、2つの一般的な修復経路:(1)効率は良いが誤りが生じやすい非相同末端結合(NHEJ)経路、または(2)効率は低いが忠実度が高い相同性指向型修復(HDR)経路のうちの1つにより修復される。
非相同性末端結合(NHEJ)および/または相同性指向型修復(HDR)の「効率」は、任意の簡便な方法によって計算することができる。例えば、一部の場合では、効率は、成功したHDRのパーセンテージの観点から表現することができる。例えば、サーベイヤーヌクレアーゼアッセイを用いて切断産物を生成することができ、基質に対する産物の比率を用いてパーセンテージを計算することができる。例えば、サーベイヤーヌクレアーゼ酵素を用いることができるが、この酵素は、HDRの成功した結果として新たに組み込まれた制限配列を含有するDNAを直接的に切断する。切断された基質の多さは、HDRのパーセントが大きいこと(HDR効率が大きいこと)を標示する。説明となる例として、HDRの割合(パーセンテージ)は、以下の式:[(切断産物)/(基質+切断産物)]を用いて計算することができる(例えば、(b+c)/(a+b+c)であって、式中、「a」はDNA基質のバンド強度であり、「b」および「c」は切断産物である)。
一部の場合では、効率は、成功したNHEJのパーセンテージの観点から表現することができる。例えば、T7ヌクレアーゼアッセイIを用いて切断産物を生成することができ、基質に対する産物の比率を用いてパーセンテージNHEJを計算することができる。T7エンドヌクレアーゼIは、野生型DNA鎖と変異体DNA鎖とのハイブリダイゼーションから起こるミスマッチヘテロ二重鎖DNAを切断する(NHEJは、小さなランダムな挿入または欠失(インデル)を元の切断の部位に生成する)。切断の多さは、NHEJのパーセントが大きいこと(NHEJ効率が大きいこと)を標示する。説明となる例として、NHEJの割合(パーセンテージ)は、以下の式:(1-(1-(b+c)/(a+b+c))1/2)×100を用いて計算することができ、式中、「a」はDNA基質のバンド強度であり、「b」および「c」は切断産物である(Ran et. al., Cell. 2013 Sep. 12; 154(6):1380-9; and Ran et al., Nat Protoc. 2013 Nov.; 8(11): 2281-2308)。
NHEJ修復経路は、最も活性のある修復機構であり、頻繁に小さなヌクレオチド挿入または欠失(インデル)をDSB部位に引き起こす。NHEJ媒介性DSB修復のランダム性は、重大な実用上の意味があるが、なぜなら、Cas9とgRNAまたはガイドポリヌクレオチドとを発現している細胞集団が、一連の様々な変異を結果として生じかねないためである。殆どの場合に、NHEJは、標的DNAに小さなインデルを生じ、その結果、アミノ酸欠失、挿入、または標的遺伝子のオープンリーディングフレーム(ORF)内の未熟な終止コドンをもたらすフレームシフト変異を生じる。理想的な最終的な結果は、標的遺伝子内の機能欠損変異である。
NHEJ媒介性DSB修復が、多くの場合に遺伝子のオープンリーディングフレームを中断させるのに対し、相同性指向型修復(HDR)は、単一のヌクレオチドの変化から蛍光体またはタグの追加のような大きな挿入まで、特異的なヌクレオチド変化を生成するために用いることができる。遺伝子編集にHDRを利用するために、所望の配列を含有するDNA修復の鋳型を、gRNAとCas9またはCas9ニッカーゼとにより、目的の細胞型の中に送達することができる。修復の鋳型は、所望の編集の配列ならびに追加の相同な配列を、標的のすぐ上流および下流に含有することができる(左側&右側相同性アームとも呼ばれる)。各相同性アームの長さは、導入されている変化のサイズに依存し得るが、挿入が大きいほど長い相同性アームを要する。修復の鋳型は、一本鎖オリゴヌクレオチド、二本鎖オリゴヌクレオチド、または二本鎖DNAプラスミドとすることができる。HDRの効率は一般的に低く(改変された対立遺伝子で<10%)、Cas9、gRNA、および外因性の修復の鋳型を発現する細胞であっても低い。HDRは細胞周期S期およびG2期に起こることから、HDRの効率は、同調させた細胞によって高めることができる。NHEJに関与する遺伝子を化学的または遺伝子的に阻害することによっても、HDRの効率を増加させることができる。
一部の実施形態では、Cas9は改変型Cas9である。所与のgRNA標的配列は、部分的な相同性の存在する追加の部位を、ゲノム全体にわたって有し得る。これらの部位は、オフターゲットと呼ばれ、gRNAを設計する際に考慮される必要がある。gRNAの設計を最適化することに加えて、CRISPRの特異性もCas9への改変を介して増加させることができる。Cas9は、2つのヌクレアーゼドメインRuvCおよびHNHの活性の組合せを介して、二本鎖切断(DSB)を生成する。SpCas9のD10A変異体であるCas9ニッカーゼは、ヌクレアーゼドメインを1つ保持し、DSBではなくDNAニックを生成する。このニッカーゼシステムは、特異的な遺伝子編集のためのHDR媒介性遺伝子編集と組み合わせることもできる。
一部の場合では、Cas9はバリアントCas9タンパク質である。バリアントCas9ポリペプチドは、野生型Cas9タンパク質のアミノ酸配列と比べた場合に1アミノ酸異なる(例えば、欠失、挿入、置換、融合を有する)アミノ酸配列を有する。一部の例では、バリアントCas9ポリペプチドは、Cas9ポリペプチドのヌクレアーゼ活性を低減するアミノ酸変化(例えば、欠失、挿入、または置換)を有する。例えば、一部の場合では、バリアントCas9ポリペプチドは、対応する野生型Cas9タンパク質のヌクレアーゼ活性の50%未満、40%未満、30%未満、20%未満、10%未満、5%未満、または1%未満を有する。一部の場合では、バリアントCas9タンパク質は、実質的なヌクレアーゼ活性を持たない。対象のCas9タンパク質が、実質的なヌクレアーゼ活性を持たないバリアントCas9タンパク質である場合には、「dCas9」と呼ばれることがある。
一部の場合では、バリアントCas9タンパク質は、ヌクレアーゼ活性を低減している。例えば、バリアントCas9タンパク質は、野生型Cas9タンパク質、例えば野生型Cas9タンパク質のエンドヌクレアーゼ活性の約20%未満、約15%未満、約10%未満、約5%未満、約1%未満、または約0.1%未満を呈する。
一部の場合では、バリアントCas9タンパク質は、ガイド標的配列の相補鎖を切断することができるが、二本鎖ガイド標的配列の非相補鎖を切断する能力が低減されている。例えば、バリアントCas9タンパク質は、RuvCドメインの機能を低減する変異(アミノ酸置換)を有する。非制限的な一例として、一部の実施形態では、バリアントCas9タンパク質は、D10A(アミノ酸10位のアスパラギン酸からアラニン)を有し、それゆえに二本鎖ガイド標的配列の相補鎖を切断することができるが、二本鎖ガイド標的配列の非相補鎖を切断する能力が低減されている(その結果、バリアントCas9タンパク質が二本鎖標的核酸を切断する際に、二本鎖切断(DSB)の代わりに一本鎖切断(SSB)を生じる)(例えば、Jinek et al., Science. 2012 Aug. 17; 337(6096):816-21を参照)。
一部の場合では、バリアントCas9タンパク質は、二本鎖ガイド標的配列の非相補鎖を切断することができるが、ガイド標的配列の相補鎖を切断する能力が低減されている。例えば、バリアントCas9タンパク質は、HNHドメイン(RuvC/HNH/RuvCドメインモチーフ)の機能を低減する変異(アミノ酸置換)を有し得る。非制限的な一例として、一部の実施形態では、バリアントCas9タンパク質は、H840A(アミノ酸840位のヒスチジンからアラニン)変異を有し、それゆえにガイド標的配列の非相補鎖を切断することができるが、ガイド標的配列の相補鎖を切断する能力が低減されている(その結果、バリアントCas9タンパク質が二本鎖ガイド標的配列を切断する際に、DSBの代わりにSSBを生じる)。そのようなCas9タンパク質は、ガイド標的配列(例えば、一本鎖ガイド標的配列)を切断する能力が低減されているが、ガイド標的配列(例えば、一本鎖ガイド標的配列)に結合する能力を保持する。
一部の場合では、バリアントCas9タンパク質は、二本鎖標的DNAの相補鎖および非相補鎖の両方を切断する能力が低減されている。非制限的な一例として、一部の場合では、バリアントCas9タンパク質は、D10AおよびH840Aの両方の変異を担持し、それゆえにポリペプチドは、二本鎖標的DNAの相補鎖および非相補鎖の両方を切断する能力が低減されている。そのようなCas9タンパク質は、標的DNA(例えば、一本鎖標的DNA)を切断する能力が低減されているが、標的DNA(例えば、一本鎖標的DNA)に結合する能力を保持する。
別の非制限的な例として、一部の場合では、バリアントCas9タンパク質は、W476AおよびW1126A変異を担持し、それゆえにポリペプチドは、標的DNAを切断する能力が低減されている。そのようなCas9タンパク質は、標的DNA(例えば、一本鎖標的DNA)を切断する能力が低減されているが、標的DNA(例えば、一本鎖標的DNA)に結合する能力を保持する。
別の非制限的な例として、一部の場合では、バリアントCas9タンパク質は、P475A、W476A、N477A、D1125A、W1126A、およびD1127A変異を担持し、それゆえにポリペプチドは、標的DNAを切断する能力が低減されている。そのようなCas9タンパク質は、標的DNA(例えば、一本鎖標的DNA)を切断する能力が低減されているが、標的DNA(例えば、一本鎖標的DNA)に結合する能力を保持する。
別の非制限的な例として、一部の場合では、バリアントCas9タンパク質は、H840A、W476A、およびW1126A変異を担持し、それゆえにポリペプチドは、標的DNAを切断する能力が低減されている。そのようなCas9タンパク質は、標的DNA(例えば、一本鎖標的DNA)を切断する能力が低減されているが、標的DNA(例えば、一本鎖標的DNA)に結合する能力を保持する。別の非制限的な例として、一部の場合では、バリアントCas9タンパク質は、H840A、D10A、W476A、およびW1126A変異を担持し、それゆえにポリペプチドは、標的DNAを切断する能力が低減されている。そのようなCas9タンパク質は、標的DNA(例えば、一本鎖標的DNA)を切断する能力が低減されているが、標的DNA(例えば、一本鎖標的DNA)に結合する能力を保持する。一部の実施形態では、バリアントCas9は、Cas9 HNHドメインの840位に触媒活性のHis残基が戻されている(A840H)。
別の非制限的な例として、一部の場合では、バリアントCas9タンパク質は、H840A、P475A、W476A、N477A、D1125A、W1126A、およびD1127A変異を担持し、それゆえにポリペプチドは、標的DNAを切断する能力が低減されている。そのようなCas9タンパク質は、標的DNA(例えば、一本鎖標的DNA)を切断する能力が低減されているが、標的DNA(例えば、一本鎖標的DNA)に結合する能力を保持する。別の非制限的な例として、一部の場合では、バリアントCas9タンパク質は、D10A、H840A、P475A、W476A、N477A、D1125A、W1126A、およびD1127A変異を担持し、それゆえにポリペプチドは、標的DNAを切断する能力が低減されている。そのようなCas9タンパク質は、標的DNA(例えば、一本鎖標的DNA)を切断する能力が低減されているが、標的DNA(例えば、一本鎖標的DNA)に結合する能力を保持する。一部の場合では、バリアントCas9タンパク質がW476AおよびW1126A変異を担持する場合、またはバリアントCas9タンパク質がP475A、W476A、N477A、D1125A、W1126A、およびD1127A変異を担持する場合は、バリアントCas9タンパク質は、効率良くPAM配列に結合しない。そのため、一部のこのような場合では、そのようなバリアントCas9タンパク質が結合方法で用いられる際に、その方法は、PAM配列を必要としない。言い換えれば、一部の場合では、そのようなバリアントCas9タンパク質が結合方法で用いられる際に、その方法はガイドRNAを含み得るが、方法は、PAM配列の不在下で実施することができる(そしてそれゆえに、結合の特異性は、ガイドRNAの標的化セグメントによってもたらされる)。他の残基を変異させて、上記の効果を達成する(すなわち、一方または他方のヌクレアーゼ部分を不活化する)ことができる。非限定的な例として、残基D10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D986、および/またはA987を変更(すなわち置換)することができる。アラニン置換以外の変異も適している。
一部の実施形態では、触媒活性が低減されたバリアントCas9タンパク質(例えば、Cas9タンパク質がD10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D986、および/またはA987変異、例えば、D10A、G12A、G17A、E762A、H840A、N854A、N863A、H982A、H983A、A984A、および/またはD986Aを有する場合)、このバリアントCas9タンパク質は、ガイドRNAと相互作用する能力を保持する限り、部位特異的な様式でやはり標的DNAに結合することができる(なぜなら、やはりそれがガイドRNAによって標的DNA配列にガイドされるためである)。
一部の実施形態では、バリアントCasタンパク質は、spCas9、spCas9-VRQR、spCas9-VRER、xCas9(sp)、saCas9、saCas9-KKH、SpCas9-MQKFRAER、spCas9-MQKSER、spCas9-LRKIQK、またはspCas9-LRVSQLとすることができる。
具体的な一実施形態では、アミノ酸置換D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、およびT1337R(SpCas9-MQKFRAER)を含みかつ変更されたPAM5’-NGC-3’への特異性を有する、改変型SpCas9が用いられる。
S.ピロゲネスCas9の代替としては、哺乳類細胞で切断活性を呈示するCpf1ファミリー由来のRNAガイド型エンドヌクレアーゼを挙げることができる。プレボテラおよびフランシセラ1由来CRISPR(CRISPR/Cpf1)は、CRISPR/Cas9システムに類似したDNA編集技術である。Cpf1は、クラスIIのCRISPR/CasシステムのRNAガイド型エンドヌクレアーゼである。この獲得免疫機構は、プレボテラ細菌およびフランシセラ細菌に見出された。Cpf1遺伝子は、CRISPR遺伝子座に関連付いており、この遺伝子座は、ガイドRNAを用いてウイルスDNAを見つけ出して切断するエンドヌクレアーゼをコードする。Cpf1は、Cas9よりも小さくかつ単純なエンドヌクレアーゼであり、CRISPR/Cas9システムの制約の一部を克服する。Cas9ヌクレアーゼとは異なり、Cpf1媒介性DNA切断の結果は、短い3’突出部を有する二本鎖切断である。Cpf1の互い違いの切断パターンは、旧来の制限酵素クローニングに類似した指向型の遺伝子移送の可能性を拓き得るものであり、それにより遺伝子編集の効率が増加し得る。上記のCas9バリアントおよびオルソログのように、Cpf1は、CRISPRにより標的とし得る部位の数を、SpCas9により選好されるNGG PAM部位に乏しいATリッチな領域またはATリッチなゲノムにまで拡張することもできる。Cpf1遺伝子座は、アルファ/ベータドメインの混合と、RuvC-Iおよびそれに続くヘリックス領域と、RuvC-IIと、ジンクフィンガー様ドメインとを含有する。Cpf1タンパク質は、Cas9のRuvCドメインに類似したRuvC様エンドヌクレアーゼドメインを有する。さらに、Cpf1は、HNHエンドヌクレアーゼドメインを持たず、Cpf1のN末端は、Cas9のアルファ-ヘリックス認識ローブを持たない。Cpf1 CRISPR-Casドメインの構造は、Cpf1が機能的にユニークであり、クラス2のV型CRISPRシステムに分類されることを示している。Cpf1遺伝子座は、II型システムよりもI型およびIII型に類似したCas1、Cas2、およびCas4タンパク質をコードする。機能性のCpf1は、トランス活性化CRISPR RNA(tracrRNA)を必要とせず、それゆえにCRISPR(crRNA)のみが必要とされる。このことはゲノム編集に恩恵をもたらすものであり、それはなぜなら、Cpf1がCas9よりも小さいだけでなく、より小さなsgRNA分子(Cas9のほぼ半分のヌクレオチド数)を有するためである。Cpf1-crRNA複合体は、Cas9により標的とされるGリッチなPAMと対照的にプロトスペーサー隣接モチーフ5’-YTN-3’を識別することによって、標的DNAまたはRNAを切断する。PAMを識別した後、Cpf1は、4ヌクレオチドまたは5ヌクレオチドの突出部の付着末端様のDNA二本鎖切断を導入する。
本開示の一部の態様は、核酸プログラマブルDNA結合タンパク質ドメインとデアミナーゼドメインとを提供する。本開示の一部の態様は、核酸プログラマブルDNA結合タンパク質として役割を果たすドメインを含む融合タンパク質を提供し、このドメインは、塩基エディターなどのタンパク質を特異的な核酸(例えば、DNAまたはRNA)配列にガイドするのに用いられ得る。具体的な実施形態では、融合タンパク質は、核酸プログラマブルDNA結合タンパク質ドメインとデアミナーゼドメインとを含む。DNA結合タンパク質としては、限定はないが、Cas9(例えば、dCas9およびnCas9)、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、およびCas12iが挙げられる。Cas9とは異なるPAM特異性を有するプログラマブルポリヌクレオチド結合タンパク質の一例は、プレボテラおよびフランシセラ1由来のクラスターを形成する規則的な間隔の短いパリンドロームリピート(Cpf1)である。Cas9と同様に、Cpf1もまたクラス2のCRISPRエフェクターである。Cpf1はCas9とは異なる特徴により堅牢なDNA干渉を媒介することが示されている。Cpf1は、tracrRNAを欠いた単一RNAガイド型エンドヌクレアーゼであり、Tリッチなプロトスペーサー隣接モチーフ(TTN、TTTN、またはYTN)を利用する。さらに、Cpf1は、互い違いのDNA二本鎖切断を介してDNAを切断する。16個のCpf1ファミリータンパク質以外に、アシドアミノコッカスおよびラクノスピラ科由来の2つの酵素が、ヒト細胞で効率の良いゲノム編集活性を有することが示されている。Cpf1タンパク質は、当技術分野に公知であり、以前に記載されており、例えば、その全体の内容をここに参照により組み込まれるYamano et al., “Crystal structure of Cpf1 in complex with guide RNA and target DNA.” Cell (165) 2016, p. 949-962である。
またここでの組成物および方法で有用なのは、ガイドヌクレオチド配列プログラマブルポリヌクレオチド結合タンパク質ドメインとして用いられ得るヌクレアーゼ不活性のCpf1(dCpf1)バリアントである。Cpf1タンパク質は、Cas9のRuvCドメインに類似したRuvC様エンドヌクレアーゼドメインを有するが、HNHエンドヌクレアーゼドメインを有さず、Cpf1のN末端は、Cas9のアルファ-ヘリックス認識ローブを有さない。Zetsche et al., Cell, 163, 759-771, 2015(本明細書に参照により組み込まれる)では、Cpf1のRuvC様ドメインが、両方のDNA鎖の切断を担うこと、ならびにRuvC様ドメインの不活化がCpf1ヌクレアーゼ活性を不活化することが示された。例えば、フランシセラ・ノビシダCpf1中のD917A、E1006A、またはD1255Aに対応する変異は、Cpf1ヌクレアーゼ活性を不活化する。一部の実施形態では、本開示のdCpf1は、D917A、E1006A、D1255A、D917A/E1006A、D917A/D1255A、E1006A/D1255A、またはD917A/E1006A/D1255Aに対応する変異を含む。Cpf1のRuvCドメインを不活化する任意の変異、例えば、置換変異、欠失、または挿入が本開示に従って用いられてもよいことが理解されよう。
一部の実施形態では、本明細書に示される任意の融合タンパク質の核酸プログラマブルヌクレオチド結合タンパク質は、Cpf1タンパク質とし得る。一部の実施形態では、Cpf1タンパク質はCpf1ニッカーゼ(nCpf1)である。一部の実施形態では、Cpf1タンパク質は、ヌクレアーゼ不活性のCpf1(dCpf1)である。一部の実施形態では、Cpf1、nCpf1、またはdCpf1は、本明細書に開示されるCpf1配列と少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一のアミノ酸配列を含む。一部の実施形態では、dCpf1は、本明細書に開示されるCpf1配列と少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または楽に99.5%同一のアミノ酸配列を含み、D917A、E1006A、D1255A、D917A/E1006A、D917A/D1255A、E1006A/D1255A、またはD917A/E1006A/D1255A内に対応する変異を含む。他の細菌種由来のCpf1も本開示に従って用いられることを認識するべきである。
野生型フランシセラ・ノビシダCpf1のアミノ酸配列は以下である。D917、E1006、およびD1255にはボールド体および下線を付した。
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIDRGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFEDLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDADANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN.
フランシセラ・ノビシダCpf1 D917Aのアミノ酸配列は以下である。(A917、E1006、およびD1255にはボールド体および下線を付した。)
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIARGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFEDLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDADANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN.
フランシセラ・ノビシダCpf1 E1006Aのアミノ酸配列は以下である。(D917、A1006、およびD1255にはボールド体および下線を付した。)
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIDRGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFADLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDADANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN.
フランシセラ・ノビシダCpf1 D1255Aのアミノ酸配列は以下である。(D917、E1006、およびA1255の変異位置にはボールド体および下線を付した。)
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIDRGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFEDLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDAAANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN.
フランシセラ・ノビシダCpf1 D917A/E1006Aのアミノ酸配列は以下である。(A917、A1006、およびD1255にはボールド体および下線を付した。)
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIARGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFADLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDADANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN.
フランシセラ・ノビシダCpf1 D917A/D1255Aのアミノ酸配列は以下である。(A917、E1006、およびA1255にはボールド体および下線を付した。)
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIARGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFEDLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDAAANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN.
フランシセラ・ノビシダCpf1 E1006A/D1255Aのアミノ酸配列は以下である。(D917、A1006、およびA1255にはボールド体および下線を付した。)
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIDRGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFADLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDAAANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN.
フランシセラ・ノビシダCpf1 D917/E1006A/D1255Aのアミノ酸配列は以下である。(A917、A1006、およびA1255にはボールド体および下線を付した。)
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIARGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFADLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDAAANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN.
一部の実施形態では、融合タンパク質に存在するCas9ドメインの1つは、PAM配列の必要のないガイドヌクレオチド配列プログラマブルDNA結合タンパク質ドメインに置き換えられてもよい。
一部の実施形態では、Casドメインは、スタフィロコッカス・アウレウス由来のCas9ドメイン(SaCas9)である。一部の実施形態では、SaCas9ドメインは、ヌクレアーゼ活性のSaCas9、ヌクレアーゼ不活性のSaCas9(SaCas9d)、またはSaCas9ニッカーゼ(SaCas9n)である。一部の実施形態では、SaCas9ドメインは、N579A変異、または本明細書に示されるいずれかのアミノ酸配列の対応する変異を含む。
一部の実施形態では、SaCas9ドメイン、SaCas9dドメイン、またはSaCas9nドメインは、非規準のPAMを有する核酸配列に結合することができる。一部の実施形態では、SaCas9ドメイン、SaCas9dドメイン、またはSaCas9nドメインは、NNGRRTまたはNNGRRT PAM配列を有する核酸配列に結合することができる。一部の実施形態では、SaCas9ドメインは、E781X、N967X、R1014X変異、または本明細書に示されるいずれかのアミノ酸配列の対応する変異のうちの1つまたは複数を含み、上式で、Xは任意のアミノ酸である。一部の実施形態では、SaCas9ドメインは、E781K、N967K、およびR1014H変異、または本明細書に示されるいずれかのアミノ酸配列中の1つもしくは複数の対応する変異のうちの1つまたは複数を含む。一部の実施形態では、SaCas9ドメインは、E781K、N967K、もしくはR1014H変異、または本明細書に示されるいずれかのアミノ酸配列中の対応する変異を含む。
例示的なSaCas9のアミノ酸配列は以下の通りである。
MKRNYILGLDIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG.この配列では、下線およびボールド体で示した残基N579が(例えば、A579に)変異されて、SaCas9ニッカーゼを産生してもよい。
例示的なSaCas9nのアミノ酸配列は以下の通りである。
KRNYILGLDIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEEASKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG.
この配列では、残基A579は、N579から変異されてSaCas9ニッカーゼを産生することができ、下線およびボールド体で示されている。
例示的なSaKKH Cas9のアミノ酸配列は以下の通りである。
Figure 2022545950000008
上記の残基A579は、N579から変異されてSaCas9ニッカーゼを産生することができ、下線およびボールド体で示されている。上記の残基K781、K967、およびH1014は、E781、N967、およびR1014から変異されてSaKKH Cas9を産生することができ、下線およびイタリックで示されている。
忠実度の高いCas9ドメイン
本開示の一部の実施形態は、忠実度の高いCas9ドメインを提供する。一部の実施形態では、忠実度の高いCas9ドメインは、対応する野生型Cas9ドメインに比べてCas9ドメインとDNAの糖リン酸骨格との間の静電相互作用を減少させる1つまたは複数の変異を含む、工学的に改変されたCas9ドメインである。DNAの糖リン酸骨格との静電相互作用を減少させる忠実度の高いCas9ドメインは、オフターゲット効果が少なくなり得る。一部の実施形態では、Cas9ドメイン(例えば、野生型Cas9ドメイン)は、Cas9ドメインとDNAの糖リン酸骨格との会合を減少させる1つまたは複数の変異を含む。一部の実施形態では、Cas9ドメインは、Cas9ドメインとDNAの糖リン酸骨格との会合を少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、または少なくとも70%減少させる1つまたは複数の変異を含む。
一部の実施形態では、本明細書に示されるいずれかのCas9融合タンパク質は、N497X、R661X、Q695X、および/もしくはQ926X変異のうち1つまたは複数、または本明細書に示されるいずれかのアミノ酸配列中の対応する変異を含み、式中、Xは任意のアミノ酸である。一部の実施形態では、本明細書に示されるいずれかのCas9融合タンパク質は、N497A、R661A、Q695A、および/もしくはQ926A変異のうち1つまたは複数、または対応する変異本明細書に示されるいずれかのアミノ酸配列中の対応する変異を含む。一部の実施形態では、Cas9ドメインは、D10A変異、または本明細書に示されるいずれかのアミノ酸配列中の対応する変異を含む。忠実度の高いCas9ドメインは、当技術分野に公知であり、当業者に明らかになるものとなる。例えば、忠実度の高いCas9ドメインは、それぞれの全体の内容を本明細書に参照により組み込まれるKleinstiver, B.P., et al. “High-fidelity CRISPR-Cas9 nucleases with no detectable genome-wide off-target effects.” Nature 529, 490-495 (2016);およびSlaymaker, I.M., et al. “Rationally engineered Cas9 nucleases with improved specificity.” Science 351, 84-88 (2015)に記載されている。
一部の実施形態では、改変型Cas9は、忠実度の高いCas9酵素である。一部の実施形態では、忠実度の高いCas9酵素はSpCas9(K855A)、eSpCas9(1.1)、SpCas9-HF1、または超高精度Cas9バリアント(HypaCas9)である。改変型Cas9eSpCas9(1.1)は、HNH/RuvC溝と非標的DNA鎖との間の相互作用を弱めるアラニン置換を含有し、オフターゲット部位における鎖の分離および切断を防止する。同様に、SpCas9-HF1は、Cas9とDNAリン酸骨格との相互作用を分断するアラニン置換により、オフターゲット編集を低下させる。HypaCas9は、Cas9の校正および標的識別を高める変異(SpCas9 N692A/M694A/Q695A/H698A)をREC3ドメインに含有する。忠実度の高い3つ全ての酵素が、野生型Cas9よりも少なくオフターゲット編集を生成する。
例示的な忠実度の高いCas9が以下に示される。
Cas9に比べて忠実度の高いCas9ドメイン変異は、ボールド体および下線で示されている。
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTAFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGALSRKLINGIRDKQSGKTILDFLKSDGFANRNFMALIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRAITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD.
ガイドポリヌクレオチド
一実施形態では、ガイドポリヌクレオチドはガイドRNAである。RNA/Cas複合体は、Casタンパク質を標的DNAに「ガイドする」のを支援することができる。Cas9/crRNA/tracrRNAは、スペーサーに相補的な線状または環状のdsDNA標的をエンドヌクレアーゼ的に切断する。crRNAに相補的ではない標的鎖は、まず、エンドヌクレアーゼ的に切断され、次いで、3’-5’エキソヌクレアーゼ的に刈り込まれる。本来は、DNAの結合および切断は、典型的には、タンパク質と両RNAとを必要とする。しかし、crRNAとtracrRNAとの両方の態様を単一RNA種に取り込むように、単一ガイドRNA(「sgRNA」または単純に「gNRA」)を工学的に改変することができる。例えば、その全体の内容をここに参照により組み込まれるJinek M. et al., Science 337:816-821(2012)を参照されたい。Cas9は、CRISPRリピート配列内の短いモチーフ(PAMまたはプロトスペーサー隣接モチーフ)を認識して、自己と非自己とを区別する一助となる。Cas9ヌクレアーゼの配列および構造は、当業者に周知されている(例えば、そのそれぞれの全体の内容を本明細書に参照により組み込まれる“Complete genome sequence of an M1 strain of Streptococcus pyogenes.” Ferretti, J.J. et al., Natl. Acad. Sci. U.S.A. 98:4658-4663(2001);“CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III.” Deltcheva E. et al., Nature 471:602-607(2011);および“Programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.” Jinek M.et al, Science 337:816-821(2012)を参照されたい)。Cas9オルソログは、様々な種に記載されており、そのようなものとしては、以下に限定されないが、S.ピロゲネスおよびS.サーモフィルスが挙げられる。追加の適したCas9ヌクレアーゼおよび配列は、本開示に基づき当業者に明らかになり得るが、そのようなCas9ヌクレアーゼおよび配列としては、その全体の内容を参照により本明細書に組み込まれるChylinski, Rhun, and Charpentier, “The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems” (2013) RNA Biology 10:5, 726-737に開示される、生物由来のCas9配列および遺伝子座が挙げられる。一部の実施形態では、Cas9ヌクレアーゼは、不活性の(例えば、不活化された)DNA切断ドメインを有する、すなわち、Cas9はニッカーゼである。
一部の実施形態では、ガイドポリヌクレオチドは、少なくとも1つの単一ガイドRNA(「sgRNA」または「gNRA」)である。一部の実施形態では、ガイドポリヌクレオチドは、少なくとも1つのtracrRNAである。一部の実施形態では、ガイドポリヌクレオチドは、ポリヌクレオチドプログラマブルDNA結合ドメイン(例えば、Cas9またはCpf1)を標的ヌクレオチド配列にガイドするためにPAM配列を必要としない。
本明細書に開示される塩基エディターのポリヌクレオチドプログラマブルヌクレオチド結合ドメイン(例えば、CRISPR由来ドメイン)は、ガイドポリヌクレオチドに会合することによって、標的ポリヌクレオチド配列を認識することができる。ガイドポリヌクレオチド(例えばgRNA)は、典型的には一本鎖であり、部位特異的に(すなわち、相補的な塩基対形成を介して)ポリヌクレオチドの標的配列に結合して、それによって、ガイド核酸に連係されている塩基エディターを標的配列に向けるように、プログラムすることができる。ガイドポリヌクレオチドはDNAとすることができる。ガイドポリヌクレオチドはRNAとすることができる。一部の場合では、ガイドポリヌクレオチドは、天然のヌクレオチド(例えばアデノシン)を含む。一部の場合では、ガイドポリヌクレオチドは、天然でない(または非天然の)ヌクレオチド(例えば、ペプチド核酸またはヌクレオチド類似体)を含む。一部の場合では、ガイド核酸配列の標的化領域は、少なくとも15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30ヌクレオチドの長さとすることができる。ガイド核酸の標的化領域は、10~30ヌクレオチドの間の長さ、または15~25ヌクレオチドの間の長さ、または15~20ヌクレオチドの間の長さとすることができる。
一部の実施形態では、ガイドポリヌクレオチドは、2つ以上の個別のポリヌクレオチドを含み、それらは互いに、例えば、相補的な塩基対形成(例えば、二重ガイドポリヌクレオチド)を介して、相互作用し得る。例えば、ガイドポリヌクレオチドは、CRISPR RNA(crRNA)とトランス活性化CRISPR RNA(tracrRNA)とを含み得る。例えば、ガイドポリヌクレオチドは、1つまたは複数のトランス活性化CRISPR RNA(tracrRNA)を含み得る。
II型CRISPRシステムでは、CRISPRタンパク質(例えばCas9)による核酸の標的化は、典型的には、標的配列を認識する配列を含む第1のRNA分子(crRNA)と、ガイドRNA-CRISPRタンパク質複合体を安定化させるスキャフォールド領域を形成する反復配列を含む第2のRNA分子(trRNA)との間に、相補的な塩基対を形成することを必要とする。そのような二連ガイドRNAシステムは、本明細書に開示の塩基エディターを標的ポリヌクレオチド配列に向けるガイドポリヌクレオチドとして採用され得る。
一部の実施形態では、本明細書に提供される塩基エディターは、単一ガイドポリヌクレオチド(例えばgRNA)を利用する。一部の実施形態では、本明細書に提供される塩基エディターは、二重ガイドポリヌクレオチド(例えば、二連gRNA)を利用する。一部の実施形態では、本明細書に提供される塩基エディターは、1つまたは複数のガイドポリヌクレオチド(例えば、多連gRNA)を利用する。一部の実施形態では、単一ガイドポリヌクレオチドは、本明細書に記載される異なる塩基エディターに利用される。例えば、単一ガイドポリヌクレオチドは、シチジン塩基エディターおよびアデノシン塩基エディターに利用され得る。
他の実施形態では、ガイドポリヌクレオチドは、核酸のポリヌクレオチド標的化部分と核酸のスキャフォールド部分との両方を単一分子(すなわち、単一分子ガイド核酸)に含むことができる。例えば、単一分子ガイドポリヌクレオチドは、単一ガイドRNA(sgRNAまたはgRNA)とされ得る。本明細書では、ガイドポリヌクレオチド配列という用語は、標的ポリヌクレオチド配列と相互作用し、かつ標的ポリヌクレオチド配列に塩基エディターを方向付けることができる、任意の単一分子の、二連分子の、または多連分子の核酸を想定している。
典型的には、ガイドポリヌクレオチド(例えば、crRNA/trRNA複合体またはgRNA)は、標的ポリヌクレオチド配列を認識し結合することができる配列を含む「ポリヌクレオチド標的化セグメント」と、塩基エディターのポリヌクレオチドプログラマブルヌクレオチド結合ドメイン構成成分内でガイドポリヌクレオチドを安定化させる「タンパク質結合セグメント」とを含む。一部の実施形態では、ガイドポリヌクレオチドのポリヌクレオチド標的化セグメントは、DNAポリヌクレオチドを認識して結合し、それによってDNA内の塩基の編集を促進する。他の場合では、ガイドポリヌクレオチドのポリヌクレオチド標的化セグメントは、RNAポリヌクレオチドを認識して結合し、それによってRNA内の塩基の編集を促進する。本明細書では、「セグメント」とは、分子の区画または領域、例えば、ガイドポリヌクレオチド内のヌクレオチドの連続的な広がりを指す。また、セグメントは、複合体の領域/区画も指し、それゆえにセグメントは、1つを超える分子の領域を含み得る。例えば、ガイドポリヌクレオチドが複数の核酸分子を含む場合、タンパク質結合セグメントは、相補性領域に沿って例えばハイブリダイズされている複数の別々の分子の全部または一部を含み得る。一部の実施形態では、2つの別々の分子を含むDNA標的化RNAのタンパク質結合セグメントは、(i)長さ100塩基対の第1のRNA分子の塩基対40~75個と、(ii)長さ50塩基対の第2のRNA分子の塩基対10~25個とを含み得る。「セグメント」の定義は、具体的なコンテクストで別段に特定して定義のない限り、特定の数の総塩基対に限定されず、所与のRNA分子由来の任意の具体的な数の塩基対に限定されず、複合体内の具体的な数の別々の分子に限定されず、任意の全長を有し他の分子との相補性を有する領域を含み得るRNA分子の領域を含むことができる。
ガイドRNAまたはガイドポリヌクレオチドは、2つ以上のRNA、例えば、CRISPR RNA(crRNA)とトランス活性化crRNA(tracrRNA)とを含み得る。ガイドRNAまたはガイドポリヌクレオチドは、時には、crRNAおよびtracrRNAの一部分(例えば、機能性部分)を融合することによって形成される一本鎖RNA、または単一ガイドRNA(sgRNA)を含み得る。ガイドRNAまたはガイドポリヌクレオチドはまた、crRNAとtracrRNAとを含む二連RNAとすることもできる。さらに、crRNAは、標的DNAとハイブリダイズすることもできる。
上記に考察したように、ガイドRNAまたはガイドポリヌクレオチドは、発現産物とすることができる。例えば、ガイドRNAをコードするDNAは、ガイドRNAをコードする配列を含むベクターとすることができる。ガイドRNAまたはガイドポリヌクレオチドは、ガイドRNAおよびプロモーターをコードする配列を含む単離されたガイドRNAまたはプラスミドDNAを用いて、細胞をトランスフェクトすることによって、細胞内に移送することができる。ガイドRNAまたはガイドポリヌクレオチドは、ウイルス媒介性遺伝子送達などの他の方法で細胞内に移送することができる。
ガイドRNAまたはガイドポリヌクレオチドは単離することができる。例えば、ガイドRNAは、単離されたRNAの形態で、細胞内または生体内にトランスフェクトすることができる。ガイドRNAは、当技術分野に公知の任意のin vitro転写システムを用いて、in vitro転写によって調製することができる。ガイドRNAは、ガイドRNAのコード配列を含むプラスミドの形態ではなく単離されたRNAの形態で、細胞にトランスフェクトすることができる。
ガイドRNAまたはガイドポリヌクレオチドは、3つの領域:染色体配列内の標的部位に相補的とされ得る5’末端の第1の領域と、ステムループ構造を形成し得る第2の中間領域と、一本鎖とされ得る第3の3’領域とを含み得る。また、各ガイドRNAの第1の領域は、各ガイドRNAが融合タンパク質を特異的な標的部位にガイドするように、異なるものとすることもできる。さらに、各ガイドRNAの第2および第3の領域は、全てのガイドRNAで同一とすることができる。
ガイドRNAまたはガイドポリヌクレオチドの第1の領域は、ガイドRNAの第1の領域が標的部位と塩基対を形成できるように、染色体配列内の標的部位における配列に相補的とすることができる。一部の場合では、ガイドRNAの第1の領域は、10ヌクレオチドから25ヌクレオチドまでもしくは約10ヌクレオチドから約25ヌクレオチドまで(すなわち、10ヌクレオチドからヌクレオチドまで;もしくは約10ヌクレオチドから約25ヌクレオチドまで;もしくは10ヌクレオチドから約25ヌクレオチドまで;もしくは約10ヌクレオチドから25ヌクレオチドまで)またはそれを超えるものを含むことができる。例えば、ガイドRNAの第1の領域と染色体配列中の標的部位との間の塩基対形成の領域は、10、11、12、13、14、15、16、17、18、19、20、22、23、24、25、もしくは約10、約11、約12、約13、約14、約15、約16、約17、約18、約19、約20、約22、約23、約24、約25、またはそれを超えるヌクレオチド数の長さとすることができる。時として、ガイドRNAの第1の領域は、19、20、もしくは21ヌクレオチド、または約19、約20、もしくは約21ヌクレオチドの長さとすることができる。
ガイドRNAまたはガイドポリヌクレオチドは、二次構造を形成する第2の領域を含み得る。例えば、ガイドRNAによって形成される二次構造は、ステム(またはヘアピン)およびループを含み得る。ループおよびステムの長さは変わり得る。例えば、ループは、3から10までまたは約3から10までに及ぶヌクレオチド数の長さとすることができ、ステムは、6から20までまたは約6から約20までの塩基対数の長さとすることができる。ステムは、1から10ヌクレオチドまたは約10ヌクレオチドの1つまたは複数の膨らみを含み得る。第2の領域の全体の長さは、16から60ヌクレオチドまでまたは約16から約60ヌクレオチドに及ぶ長さとすることができる。例えば、ループは、4ヌクレオチドまたは約4ヌクレオチドの長さとすることができ、ステムは、12塩基対または約12塩基対とすることができる。
ガイドRNAまたはガイドポリヌクレオチドはまた、本質的に一本鎖であり得る第3の領域を3’末端に含むこともできる。例えば、第3の領域は、目的の細胞内で任意の染色体配列に相補的ではない時もあれば、ガイドRNAの残り部分に相補的でない時もある。さらに、第3の領域の長さは変わり得る。第3の領域は、4ヌクレオチドを超えるかまたは約4ヌクレオチドを超える長さとすることができる。例えば、第3の領域の長さは、5から60または約5から60のヌクレオチド数に及ぶ長さとすることができる。
ガイドRNAまたはガイドポリヌクレオチドは、遺伝子標的の任意のエクソンまたはイントロンを標的とすることができる。一部の場合では、ガイドは、遺伝子のエクソン1または2を標的とすることができ、他の場合では、ガイドは、遺伝子のエクソン3または4を標的とすることができる。組成物は、同じエクソンを全てが標的とする複数のガイドRNAを含み得るが、または一部の場合では、異なるエクソンを標的とし得る複数のガイドRNAを含み得る。遺伝子のエクソンおよびイントロンが標的とされ得る。
ガイドRNAまたはガイドポリヌクレオチドは、20ヌクレオチドまたは約20ヌクレオチドの核酸配列を標的とし得る。標的核酸は、20ヌクレオチド未満または約20ヌクレオチド未満とされ得る。標的核酸は、少なくとも5、10、15、16、17、18、19、20、21、22、23、24、25、30、または少なくとも約5、約10、約15、約16、約17、約18、約19、約20、約21、約22、約23、約24、約25、約30、または1~100の間のいずれかのヌクレオチド数の長さとされ得る。標的核酸は、最大5、10、15、16、17、18、19、20、21、22、23、24、25、30、40、50、または最大約5、約10、約15、約16、約17、約18、約19、約20、約21、約22、約23、約24、約25、約30、約40、約50、または1~100の間のいずれかのヌクレオチド数の長さとし得る。標的核酸配列は、AMの最初のヌクレオチドのすぐ5’側の20塩基または約20塩基とされ得る。ガイドRNAは、核酸配列を標的とし得る。標的核酸は、少なくとも1~10、1~20、1~30、1~40、1~50、1~60、1~70、1~80、1~90、もしくは1~100ヌクレオチド、または少なくとも約1~10、約1~20、約1~30、約1~40、約1~50、約1~60、約1~70、約1~80、約1~90、もしくは約1~100ヌクレオチドとされ得る。
ガイドポリヌクレオチド、例えば、ガイドRNAとは、別の核酸、例えば、細胞のゲノム中の標的核酸またはプロトスペーサーにハイブリダイズすることができる核酸を指し得る。ガイドポリヌクレオチドはRNAとすることができる。ガイドポリヌクレオチドはDNAとすることができる。ガイドポリヌクレオチドは、核酸の配列に部位特異的に結合するようプログラムまたは設計され得る。ガイドポリヌクレオチドは、ポリヌクレオチド鎖を含むことがあり、単一ガイドポリヌクレオチドと呼ばれることがある。ガイドポリヌクレオチドは、2つのポリヌクレオチド鎖を含むことがあり、二連ガイドポリヌクレオチドと呼ばれることがある。ガイドRNAは、細胞内または胚内にRNA分子として導入することができる。例えば、RNA分子は、in vitroで転写することができるおよび/または化学合成することができる。RNAは、合成DNA分子、例えば、gBlocks(登録商標)遺伝子断片から転写することができる。次いで、ガイドRNAは、細胞内または胚内にRNA分子として導入することができる。ガイドRNAはまた、細胞内または胚内に非RNA核酸分子、例えばDNA分子の形態で導入することができる。例えば、ガイドRNAをコードするDNAは、目的の細胞または胚におけるガイドRNAの発現のために、プロモーター制御配列に動作可能に連結することができる。RNAコード配列は、RNAポリメラーゼIII(PolIII)によって認識されるプロモーター配列に、動作可能に連結することができる。ガイドRNAを発現するために用いることのできるプラスミドベクターとしては、以下に限定されないが、px330ベクターおよびpx333ベクターが挙げられる。一部の場合では、プラスミドベクター(例えば、px333ベクター)は、少なくとも2つのガイドRNAコードDNA配列を含み得る。
ガイドポリヌクレオチド、例えばガイドRNAと標的配列とを選択、設計、および検証する方法は、本明細書に記載されており、当業者に公知である。例えば、核酸塩基エディターシステム内のデアミナーゼドメイン(例えば、AIDドメイン)の潜在的な基質の混乱の影響を最小限にするために、意図なく脱アミノ化の標的となり得る残基(例えば、標的核酸遺伝子座内のssDNA上に潜在的に存在し得るオフターゲットC残基)の数は、最小限とされることがある。さらに、ソフトウェアツールを用いて、例えば、ゲノム全体の総オフターゲット活性を最小限にするように、標的核酸配列に対応するgRNAを最適化することができる。例えば、S.ピロゲネスCas9を用いたあり得る標的化ドメインの選択のそれぞれについて、ある特定の数(例えば、1、2、3、4、5、6、7、8、9、または10)までのミスマッチ塩基対を含有する全てのオフターゲット配列(選択されたPAM、例えば、NAGまたはNGGに先行する)が、ゲノム中にわたって特定されてもよい。標的部位に相補的なgRNAの第1の領域が特定され得るが、全ての第1の領域(例えば、crRNA)は、その総予測オフターゲットスコアに従ってランク付けされ得る。すなわち、最上位にランク付けされた標的化ドメインは、最大のオンターゲット活性と最小のオフターゲット活性とを有する可能性のあるものを表す。標的化gRNAの候補は、当技術分野に公知のおよび/または本明細書に規定の方法を用いることによって、機能面で評価することができる。
非限定的な例として、Cas9と共に用いるためのガイドRNAのcrRNA中の標的DNAハイブリダイズ配列は、DNA配列探索アルゴリズムを用いて特定してもよい。gRNAの設計は、Bae S., Park J., & Kim J.-S. Cas-OFFinder: A fast and versatile algorithm that searches for potential off-target sites of Cas9 RNA-guided endonucleases. Bioinformatics 30, 1473-1475 (2014)に記載されるような公開ツールcas-offinderに基づき、カスタムgRNA設計ソフトウェアを用いて行ってもよい。このソフトウェアは、ガイドに対し、そのゲノムワイドなオフターゲット傾向を計算した後、スコアリングする。典型的には、長さ17から24に及ぶガイドについて、完全マッチから7ミスマッチに及ぶマッチが考慮される。オフターゲット部位が演算により決定されると、各ガイドについて合計スコアが計算され、ウェブインターフェースを用いて表形式の出力にまとめられる。PAM配列に隣接する潜在的な標的部位の特定に加えて、ソフトウェアは、選択された標的部位と1、2、3、または3以上のヌクレオチド数が異なる、全てのPAM隣接配列も特定する。標的核酸配列、例えば標的遺伝子に用いるゲノムDNA配列が得られ、公的に利用可能なツール、例えば、RepeatMaskerプログラムを用いて反復エレメントがスクリーニングされ得る。RepeatMaskerは、反復エレメントと複雑度の低い領域とに用いるインプットDNA配列を探索する。出力は、所与のクエリ配列に存在する反復の詳細なアノテーションである。
特定後、ガイドRNAの第1の領域、例えばcrRNAは、標的部位とのそれらの距離、それらの直交性、および関連のPAM配列と密接にマッチするための5’ヌクレオチドの存在(例えば、関連のPAM、例えばS.ピロゲネスのNGG PAM、S.アウレウスのNNGRRTまたはNNGRRV PAMを含有する、ヒトゲノムにおける密接なマッチの特定に基づく5’G)に基づいて、階級をランク付けする。本明細書に用いられる際に、直交性とは、標的配列との最小限の数のミスマッチを含有する、ヒトゲノムにおける配列の数を指す。「高レベルの直交性」または「良好な直交性」とは、例えば、ヒトゲノム内に目的の標的の他に同一配列を持たず、標的配列内に1つまたは2つのミスマッチを含有する配列も持たない、20merの標的化ドメインを指し得る。良好な直交性を有する標的化ドメインは、オフターゲットDNA切断を最小限にするように選択され得る。
一部の実施形態では、レポーターシステムが、塩基編集活性を検出するために、およびガイドポリヌクレオチドの候補を試験するために、用いられることがある。一部の実施形態では、レポーターシステムは、レポーター遺伝子ベースアッセイを含み得るが、このアッセイでは、塩基編集活性がレポーター遺伝子の発現を生じる。例えば、レポーターシステムは、不活化された開始コドン、例えば、鋳型鎖上の3’-TAC-5’から3’-CAC-5’への変異を含む、レポーター遺伝子を含む。標的Cの脱アミノ化が成功すると、対応するmRNAは、5’-GUG-3’の代わりに5’-AUG-3’として転写され、レポーター遺伝子の翻訳が可能となる。適したレポーター遺伝子は、当業者に明らかになるものとなる。レポーター遺伝子の非限定的な例としては、緑色蛍光タンパク質(GFP)、赤色蛍光タンパク質(RFP)、ルシフェラーゼ、分泌型アルカリホスファターゼ(SEAP)をコードする遺伝子、または発現が検出可能であり当業者に明らかな他の遺伝子が挙げられる。レポーターシステムを用いて、例えば、標的DNA配列に関するどの残基をそれぞれのデアミナーゼが標的とするのかを判定するために、数多くの異なるgRNAを供試することができる、非鋳型鎖を標的とするsgRNAもまた、特異的な塩基編集タンパク質、例えば、Cas9デアミナーゼ融合タンパク質のオフターゲット効果を評価するために、供試することができる。一部の実施形態では、変異型開始コドンがgRNAと塩基対を形成しないように、そのようなgRNAを設計することができる。ガイドポリヌクレオチドは、標準的なリボヌクレオチド、修飾リボヌクレオチド(例えば、シュードウリジン)、リボヌクレオチド異性体、および/またはリボヌクレオチド類似体を含み得る。一部の実施形態では、ガイドポリヌクレオチドは、少なくとも1つの検出可能な標識を含み得る。検出可能な標識は、蛍光体(例えば、FAM、TMR、Cy3、Cy5、テキサスレッド、オレゴングリーン、Alexa Fluors、Haloタグ、または適切な蛍光色素)、検出タグ(例えば、ビオチン、ジゴキシゲニンなど)、量子ドット、または金粒子とすることができる。
ガイドポリヌクレオチドは、化学的に合成することも、酵素により合成することも、またはそれらの組合せとすることもできる。例えば、ガイドRNAは、標準的なホスホロアミダイトベースの固相合成法を用いて合成することができる。あるいは、ガイドRNAは、ガイドRNAをコードするDNAを、ファージRNAポリメラーゼにより認識されるプロモーター制御配列に動作可能に連結することによって、in vitroで合成することができる。適したファージプロモーター配列の例としては、T7、T3、SP6プロモーター配列、またはそれらのバリエーションが挙げられる。ガイドRNAが2つの別々の分子(例えば、crRNAおよびtracrRNA)を含む実施形態では、crRNAは化学的に合成することができ、tracrRNAは酵素により合成することができる。
一部の実施形態では、塩基エディターシステムは、複数のガイドポリヌクレオチド、例えばgRNAを含んでいてもよい。例えば、gRNAは、塩基エディターシステムに含まれる1つまたは複数の標的遺伝子座を標的としてもよい(例えば、少なくとも1つのgRNA、少なくとも2つのgRNA、少なくとも5つのgRNA、少なくとも10個のgRNA、少なくとも20個のgRNA、少なくとも30個のgRNA、少なくとも50個のgRNA)。複数のgRNA配列は、直列に配置することができ、好ましくは直接的な反復によって分離される。
ガイドRNAまたはガイドポリヌクレオチドをコードするDNA配列は、ベクターの一部分とすることもできる。さらに、ベクターは、追加の発現制御配列(例えば、エンハンサー配列、Kozak配列、ポリアデニル化配列、転写終結配列など)、選択マーカー配列(例えば、GFPまたは抗生物質耐性遺伝子、例えばピューロマイシンなど)、複製起点などを含み得る。ガイドRNA(gRNA)をコードするDNA分子は、線状とすることもできる。ガイドRNA(gRNA)またはガイドポリヌクレオチドをコードするDNA分子は、環状とすることもできる。
一部の実施形態では、塩基エディターシステムの1つまたは複数の構成成分は、DNA配列によってコードされていてもよい。そのようなDNA配列は、発現システム内、例えば細胞内に、共にまたは別々に導入されてもよい。例えば、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインとガイドRNAとをコードするDNA配列は、細胞内に導入されてもよく、各DNA配列は、別々の分子の一部分(例えば、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインコード配列を含有する1つのベクターと、ガイドRNAコード配列を含有する第2のベクター)とすることもできるし、またはどちらも、同じ分子(例えば、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインおよびガイドRNAの両方のためのコード(および調節)配列を含有する1つのベクター)の一部分とすることもできる。
ガイドポリヌクレオチドは、核酸に新しいまたは増強された特徴を付与するために1つまたは複数の修飾を含み得る。ガイドポリヌクレオチドは、核酸親和性タグを含み得る。ガイドポリヌクレオチドは、合成ヌクレオチド、合成ヌクレオチド類似体、ヌクレオチド誘導体、および/または修飾ヌクレオチドを含み得る。
一部の場合では、gRNAまたはガイドポリヌクレオチドは、改変を含み得る。改変は、gRNAまたはガイドポリヌクレオチドの任意の場所で作製することができる。1つ以上の改変を、単一gRNAまたはガイドポリヌクレオチドに作製することができる。gRNAまたはガイドポリヌクレオチドは、改変後に品質管理を受けることができる。一部の場合では、品質管理は、PAGE、HPLC、MS、またはそれらの組合せを含み得る。
gRNAまたはガイドポリヌクレオチドの改変は、置換、挿入、欠失、化学修飾、物理的修飾、安定化、精製、またはそれらの任意の組合せとされ得る。
gRNAまたはガイドポリヌクレオチドはまた、5’アデニレート、5’グアノシン-三リン酸キャップ、5’N7-メチルグアノシン-三リン酸キャップ、5’三リン酸キャップ、3’リン酸、3’チオリン酸、5’リン酸、5’チオリン酸、Cis-Synチミジン二量体、三量体、C12スペーサー、C3スペーサー、C6スペーサー、dスペーサー、PCスペーサー、rスペーサー、スペーサー18、スペーサー9、3’-3’修飾、5’-5’修飾、脱塩基、アクリジン、アゾベンゼン、ビオチン、ビオチンBB、ビオチンTEG、コレステリルTEG、デスチオビオチンTEG、DNPTEG、DNP-X、DOTA、dT-ビオチン、デュアルビオチン、PCビオチン、ソラレンC2、ソラレンC6、TINA、3’DABCYL、ブラックホールクエンチャー1、ブラックホールクエンチャー2、DABCYLSE、dT-DABCYL、IRDyeQC-1、QSY-21、QSY-35、QSY-7、QSY-9、カルボキシルリンカー、チオ―ルリンカー、2’-デオキシリボヌクレオシド類似体プリン、2’-デオキシリボヌクレオシド類似体ピリミジン、リボヌクレオシド類似体、2’-O-メチルリボヌクレオシド類似体、糖修飾類似体、wobble/ユニバーサル塩基、蛍光色素標識、2’-フルオロRNA、2’-O-メチルRNA、メチルホスホネート、ホスホジエステルDNA、ホスホジエステルRNA、ホスホロチオエートDNA、ホスホロチオエートRNA、UNA、シュードウリジン-5’-三リン酸、5’-メチルシチジン-5’-三リン酸、またはそれらの任意の組合せによって修飾することができる。
一部の場合では、修飾は永続的である。他の場合では、修飾は一時的である。一部の場合では、複数の修飾がgRNAまたはガイドポリヌクレオチドに行われる。gRNAまたはガイドポリヌクレオチドの修飾は、ヌクレオチドの物理化学的性質、例えばその立体配座、極性、疎水性、化学的反応性、塩基対形成相互作用、またはそれらの任意の組合せなどを変更し得る。
PAM配列は、当技術分野に公知の任意のPAM配列とすることができる。適したPAM配列としては、以下に限定されないが、NGG、NGA、NGC、NGN、NGT、NGCG、NGAG、NGAN、NGNG、NGCN、NGCG、NGTN、NNGRRT、NNNRRT、NNGRR(N)、TTTV、TYCV、TYCV、TATV、NNNNGATT、NNAGAAW、またはNAAAACが挙げられる。Yはピリミジンであり、Nは任意のヌクレオチド塩基であり、WはAまたはTである。
また、修飾は、ホスホロチオエート置換とすることができる。一部の場合では、天然のホスホジエステル結合を、細胞性ヌクレアーゼによる速やかな分解に対して感受性があるものとすることができ、ホスホロチオエート(PS)結合置換を用いたヌクレオチド間結合修飾を、細胞性分解による加水分解に対してより安定なものとすることができる。修飾は、gRNAまたはガイドポリヌクレオチドにおける安定性を増加させることができる。また、修飾は、生物活性を増強することができる。一部の場合では、ホスホロチオエート増強型RNA gRNAは、RNaseA、RNaseT1、ウシ血清ヌクレアーゼ、またはそれらの任意の組合せを阻害することができる。これらの性質は、in vivoまたはin vitroでヌクレアーゼに曝露される可能性が高い場合の適用に用いられるPS-RNA gRNAの使用を可能にする。例えば、ホスホロチオエート(PS)結合は、gRNAの5’-または’’-末端の最後の3~5ヌクレオチド間に導入することができ、エキソヌクレアーゼ分解を阻害することができる。一部の場合では、ホスホロチオエート結合は、エンドヌクレアーゼによる攻撃を低減するためにgRNA全体にわたって追加することができる。
プロトスペーサー隣接モチーフ
用語「プロトスペーサー隣接モチーフ(PAM)」またはPAM様モチーフとは、CRISPR細菌適応免疫システムにおいてCas9ヌクレアーゼにより標的とされるDNA配列にすぐ続く2~6塩基対のDNA配列を指す。一部の実施形態では、PAMを5’PAM(すなわち、プロトスペーサーの5’末端の上流に位置する)とすることができる。他の実施形態では、PAMを3’PAM(すなわち、プロトスペーサーの5’末端の下流に位置する)とすることができる。
PAM配列は標的結合に不可欠であるが、正確な配列はCasタンパク質のタイプに依存する。
本明細書に提供される塩基エディターは、規準または非規準のプロトスペーサー隣接モチーフ(PAM)配列を含有するヌクレオチド配列を結合することができるCRISPRタンパク質由来ドメインを含み得る。PAM部位は、標的ポリヌクレオチド配列に近接したヌクレオチド配列である。本開示の一部の態様は、異なるPAM特異性を有するCRISPRタンパク質の全部または一部を含む塩基エディターを提供する。例えば、典型的には、S.ピロゲネス由来のCas9(spCas9)などのCas9タンパク質は、特定の核酸領域に結合する規準のNGG PAM配列を必要とするが、この配列では、「NGG」の「N」は、アデニン(A)、チミン(T)、グアニン(G)、またはシトシン(C)であり、Gはグアニンである。PAMは、CRISPRタンパク質特異的となり得、異なるCRISPRタンパク質由来ドメインを含む異なる塩基エディター間で異なるものとなり得る。PAMは、標的配列の5’または3’とされ得る。PAMは、標的配列の上流または下流とされ得る。PAMは、1、2、3、4、5、6、7、8、9、10、またはそれを超えるヌクレオチド数の長さとされ得る。多くの場合、PAMは、2~6の間のヌクレオチド数の長さである。複数のPAMバリアントが下記の表1に記載されている。
Figure 2022545950000009
一部の実施形態では、PAMはNGCである。一部の実施形態では、NGC PAMは、Cas9バリアントによって認識される。一部の実施形態では、NGC PAMバリアントは、D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、およびT1337R(まとめて「MQKFRAER」と呼ばれる)から選択される1つまたは複数のアミノ酸置換を含む。
一部の実施形態では、PAMはNGTである。一部の実施形態では、NGT PAMはバリアントである。一部の実施形態では、NGT PAMバリアントは、1つまたは複数の残基1335、1337、1135、1136、1218、および/または1219での標的変異を介して作製される。一部の実施形態では、NGT PAMバリアントは、1つまたは複数の残基1219、1335、1337、1218での標的変異を介して作製される。一部の実施形態では、NGT PAMバリアントは、1つまたは複数の残基1135、1136、1218、1219、および1335で標的とされた変異を介して作製される。一部の実施形態では、NGT PAMバリアントは、下記の表2および表3に示された一連の標的変異から選択される。
Figure 2022545950000010

Figure 2022545950000011
一部の実施形態では、NGT PAMバリアントは、表2および表3のバリアント5、7、28、31、または36から選択される。一部の実施形態では、バリアントは、NGT PAM認識が高められている。
一部の実施形態では、NGT PAMバリアントは、残基1219、1335、1337、および/または1218に変異を有する。一部の実施形態では、NGT PAMバリアントは、下記の表4に示されるバリアントから、認識を高めるための変異を有して選択される。
Figure 2022545950000012
一部の実施形態では、NGT PAMは、下記の表5に示されるバリアントから選択される。
Figure 2022545950000013
一部の実施形態では、Cas9ドメインは、ストレプトコッカス・ピロゲネス由来のCas9ドメイン(SpCas9)である。一部の実施形態では、SpCas9ドメインは、ヌクレアーゼ活性のSpCas9、ヌクレアーゼ不活性のSpCas9(SpCas9d)、またはSpCas9ニッカーゼ(SpCas9n)である。一部の実施形態では、SpCas9は、D9X変異、または本明細書に提供されるいずれかのアミノ酸配列中の対応する変異を含み、式中、XはDを除く任意のアミノ酸である。一部の実施形態では、SpCas9は、D9A変異、または本明細書に提供されるいずれかのアミノ酸配列中の対応する変異を含む。一部の実施形態では、SpCas9ドメイン、SpCas9dドメイン、またはSpCas9nドメインは、非規準のPAMを有する核酸配列に結合することができる。一部の実施形態では、SpCas9ドメイン、SpCas9dドメイン、またはSpCas9nドメインは、NGG、NGA、またはNGCG PAM配列を有する核酸配列に結合することができる。
一部の実施形態では、SpCas9ドメインは、D1135X、R1335X、およびT1336X変異のうち1つまたは複数、または本明細書に提供されるいずれかのアミノ酸配列中の対応する変異を含み、式中、Xは任意のアミノ酸である。一部の実施形態では、SpCas9ドメインは、D1135E、R1335Q、およびT1336R変異のうち1つまたは複数、または本明細書に提供されるいずれかのアミノ酸配列中の対応する変異を含む。一部の実施形態では、SpCas9ドメインは、D1135E、R1335Q、およびT1336R変異、または本明細書に提供されるいずれかのアミノ酸配列中の対応する変異を含む。一部の実施形態では、SpCas9ドメインは、D1135X、R1335X、およびT1336X変異のうち1つまたは複数、または本明細書に提供されるいずれかのアミノ酸配列中の対応する変異を含み、式中、Xは任意のアミノ酸である。一部の実施形態では、SpCas9ドメインは、D1135V、R1335Q、およびT1336R変異のうち1つまたは複数、または本明細書に提供されるいずれかのアミノ酸配列中の対応する変異を含む。一部の実施形態では、SpCas9ドメインは、D1135V、R1335Q、およびT1336R変異、または本明細書に提供されるいずれかのアミノ酸配列中の対応する変異を含む。一部の実施形態では、SpCas9ドメインは、D1135X、G1217X、R1335X、およびT1336X変異のうち1つまたは複数、または本明細書に提供されるいずれかのアミノ酸配列中の対応する変異を含み、式中、Xは任意のアミノ酸である。一部の実施形態では、SpCas9ドメインは、D1135V、G1217R、R1335Q、およびT1336R変異のうち1つまたは複数、または本明細書に提供されるいずれかのアミノ酸配列中の対応する変異を含む。一部の実施形態では、SpCas9ドメインは、D1135V、G1217R、R1335Q、およびT1336R変異、または本明細書に提供されるいずれかのアミノ酸配列中の対応する変異を含む。一部の実施形態では、SpCas9ドメインは、図3A~図3Cおよび図10のアミノ酸置換のうち1つまたは複数を含む。
一部の実施形態では、本明細書に提供されるいずれかの融合タンパク質のCas9ドメインは、本明細書に記載のCas9ポリペプチドと少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一のアミノ酸配列を含む。一部の実施形態では、本明細書に提供されるいずれかの融合タンパク質のCas9ドメインは、本明細書に記載されるいずれかのCas9ポリペプチドのアミノ酸配列を含む。一部の実施形態では、本明細書に提供されるいずれかの融合タンパク質のCas9ドメインは、本明細書に記載されるいずれかのCas9ポリペプチドのアミノ酸配列からなる。
一部の例では、本明細書に開示される塩基エディターのCRISPRタンパク質由来ドメインによって認識されかつ細胞に対するPAMは、塩基エディターをコードするインサート(例えば、AAVインサート)への別々のオリゴヌクレオチド上に付与され得る。そのような実施形態では、PAMを別々のオリゴヌクレオチド上に付与することによって、そうしなければ切断できない標的配列の切断を可能にし得るが、なぜなら、隣接PAMが、同じポリヌクレオチド上に標的配列として存在しないためである。
一実施形態では、S.ピロゲネスCas9(SpCas9)を、ゲノム工学のためのCRISPRエンドヌクレアーゼとして用いることができる。しかし、他のものを用いることができる。一部の実施形態では、異なるエンドヌクレアーゼを用いて、ある特定のゲノム標的を標的とすることができる。一部の実施形態では、非NGG PAM配列を有する合成SpCas9由来バリアントを用いることができる。さらに、様々な種由来の他のCas9オルソログが同定されており、これらの「非SpCas9」は、本開示にやはり有用となり得る種々のPAM配列を結合することができる。例えば、比較的大きなサイズのSpCas9(およそ4kbのコード配列)は、細胞で効率的に発現できないSpCas9 cDNAを含むプラスミドをもたらすことがある。逆に、スタフィロコッカス・アウレウスCas9(SaCas9)のコード配列は、SpCas9よりもおよそ1キロベース短く、細胞で効率的に発現することを可能にする可能性がある。SpCas9と同様に、SaCas9エンドヌクレアーゼは、in vitroでは哺乳類細胞で、in vivoではマウスで、標的遺伝子を改変することができる。一部の実施形態では、Casタンパク質は、異なるPAM配列を標的とすることができる。一部の実施形態では、標的遺伝子は、例えば、Cas9 PAMである5’-NGGに隣接し得る。一部の実施形態では、標的遺伝子は、例えば、Cas9 PAMである5’-NGCまたは5’-NGCを含むCas9 PAMに隣接し得る。他の実施形態では、他のCas9オルソログは、異なるPAMの要求性を有する。例えば、S.サーモフィルス(CRISPR1のための5’-NNAGAAおよびCRISPR3のための5’-NGGNG)およびナイセリア・メニンギティディス(5’-NNNNGATT)のものなどの他のPAMも、標的遺伝子に隣接して見出され得る。
一部の実施形態では、S.ピロゲネスシステムについて、標的遺伝子配列は、5’-NGGPAMに先行する(すなわち、その5’側にある)ことがあり、20ntのガイドRNA配列は、PAMに隣接したCas9切断を媒介するための反対の鎖を有する塩基対であることがある。一部の実施形態では、隣接の切断は、PAMの上流の3塩基対または約3塩基対であり得る。一部の実施形態では、隣接の切断は、PAMの上流の10塩基対または約10塩基対であり得る。一部の実施形態では、隣接の切断は、PAMの上流の0~20塩基対または約0~20塩基対であり得る。例えば、隣接の切断は、PAMの上流の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30塩基対隣りであり得る。また、隣接の切断は、PAMの下流1から30塩基対であり得る。PAM配列を結合することができる例示的なSpCas9タンパク質の配列は以下の通りである。
例示的なPAM結合SpCas9アミノ酸配列は以下の通りである:
MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD。
例示的なPAM結合SpCas9nアミノ酸配列は以下の通りである:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD。
例示的なPAM結合SpEQR Cas9アミノ酸配列は以下の通りである:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFESPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGD.この配列では、残基E1135、Q1335、およびR1337は、D1135、R1335、およびT1337から変異されてSpEQR Cas9を産生することができ、下線およびボールド体で示されている。
例示的なPAM結合SpVQR Cas9アミノ酸配列は以下の通りである:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGD.この配列では、残基V1135、Q1335、およびR1336は、D1135、R1335、およびT1336から変異されてSpVQRCas9を産生することができ、下線およびボールド体で示されている。
例示的なPAM結合SpVRER Cas9アミノ酸配列は以下の通りである:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKEYRSTKEVLDATLIHQSITGLYETRIDLSQLGGD.
一部の実施形態では、Cas9ドメインは組換えCas9ドメインである。一部の実施形態では、組換えCas9ドメインは、SpyMacCas9ドメインである。一部の実施形態では、SpyMacCas9ドメインは、ヌクレアーゼ活性のSpyMacCas9、ヌクレアーゼ不活性のSpyMacCas9(SpyMacCas9d)、またはSpyMacCas9ニッカーゼ(SpyMacCas9n)である。一部の実施形態では、SaCas9ドメイン、SaCas9dドメイン、またはSaCas9nドメインは、非規準のPAMを有する核酸配列に結合することができる。一部の実施形態では、SpyMacCas9ドメイン、SpCas9dドメイン、またはSpCas9nドメインは、NAA PAM配列を有する核酸配列に結合することができる。
例示的なSpyMacCas9
MDKKYSIGLDIGTNSVGWAVITDDYKVPSKKFKVLGNTDRHSIKKNLIGALLFGSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLADSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQIYNQLFEENPINASRVDAKAILSARLSKSRRLENLIAQLPGEKRNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNSEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGAYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDRGMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGHSLHEQIANLAGSPAIKKGILQTVKIVDELVKVMGHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFIKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEIQTVGQNGGLFDDNPKSPLEVTPSKLVPLKKELNPKKYGGYQKPTTAYPVLLITDTKQLIPISVMNKKQFEQNPVKFLRDRGYQQVGKNDFIKLPKYTLVDIGDGIKRLWASSKEIHKGNQLVVSKKSQILLYHAHHLDSDLSNDYLQNHNQQFDVLFNEIISFSKKCKLGKEHIQKIENVYSNKKNSASIEELAESFIKLLGFTQLGATSPFNFLGVKLNQKQYKGKKDYILPCTEGTLIRQSITGLYETRVDLSKIGED.
一部の場合では、バリアントCas9タンパク質は、H840A、P475A、W476A、N477A、D1125A、W1126A、およびD1218A変異を担持し、それゆえにポリペプチドは、標的DNAまたはRNAを切断する能力が低減されている。そのようなCas9タンパク質は、標的DNA(例えば、一本鎖標的DNA)を切断する能力が低減されているが、標的DNA(例えば、一本鎖標的DNA)に結合する能力を保持する。別の非制限的な例として、一部の場合では、バリアントCas9タンパク質は、D10A、H840A、P475A、W476A、N477A、D1125A、W1126A、およびD1218A変異を担持し、それゆえにポリペプチドは、標的DNAを切断する能力が低減されている。そのようなCas9タンパク質は、標的DNA(例えば、一本鎖標的DNA)を切断する能力が低減されているが、標的DNA(例えば、一本鎖標的DNA)に結合する能力を保持する。一部の場合では、バリアントCas9タンパク質がW476AおよびW1126A変異を担持する場合、またはバリアントCas9タンパク質がP475A、W476A、N477A、D1125A、W1126A、およびD1218A変異を担持する場合は、バリアントCas9タンパク質は、効率良くPAM配列に結合しない。そのため、一部のこのような場合では、そのようなバリアントCas9タンパク質が結合方法で用いられる際に、その方法は、PAM配列を必要としない。言い換えれば、一部の場合では、そのようなバリアントCas9タンパク質が結合方法で用いられる際に、その方法はガイドRNAを含み得るが、方法は、PAM配列の不在下で実施され得る(そしてそれゆえに、結合の特異性は、ガイドRNAの標的化セグメントによってもたらされる)。上記の効果を達成する(すなわち、一方または他方のヌクレアーゼ部分を不活化する)ために、他の残基が変異され得る。非限定的な例として、残基D10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D986、および/またはA987を変更(すなわち置換)することができる。アラニン置換以外の変異も適している。
一部の実施形態では、塩基エディターのCRISPRタンパク質由来ドメインは、規準のPAM配列(NGG)を有するCas9タンパク質の全部または一部を含み得る。他の実施形態では、塩基エディターのCas9由来ドメインは、非規準のPAM配列を採用し得る。そのような配列は、当技術分野に記載されており、当業者に明らかになるものとなる。例えば、非規準のPAM配列を結合するCas9ドメインは、Kleinstiver, B. P., et al., “Engineered CRISPR-Cas9 nucleases with altered PAM specificities” Nature 523, 481-485 (2015);およびKleinstiver, B. P., et al., “Broadening the targeting range of Staphylococcus aureus CRISPR-Cas9 by modifying PAM recognition” Nature Biotechnology 33, 1293-1298 (2015)に記載されており、それぞれの全体の内容はここに参照により組み込まれる。
Cas9ドメインとシチジンデアミナーゼおよび/またはアデノシンデアミナーゼとを含む融合タンパク質
本開示の一部の態様は、Cas9ドメインまたは他の核酸プログラマブルDNA結合タンパク質と1つまたは複数のアデノシンデアミナーゼドメイン、シチジンデアミナーゼドメイン、および/またはDNAグリコシラーゼドメインとを含む融合タンパク質を提供する。Cas9ドメインは本明細書に提供されるいずれかのCas9ドメインまたはCas9タンパク質(例えば、dCas9またはnCas9)であることを認識するべきである。一実施形態では、Cas9ドメインは、本明細書に記載されるようなSpCas9ドメインまたはSpCas9バリアントドメインである。一部の実施形態では、本明細書に提供されるいずれかのCas9ドメインまたはCas9タンパク質(例えば、dCas9またはnCas9)は、本明細書に提供されるいずれかのシチジンデアミナーゼおよびアデノシンデアミナーゼに融合されていてもよい。本明細書に開示される塩基エディターのドメインは、任意の順番で配置することができる。
例えば、限定はないが、一部の実施形態では、融合タンパク質は以下の構造を含む:
NH-[シチジンデアミナーゼ]-[Cas9ドメイン]-[アデノシンデアミナーゼ]-COOH;
NH-[アデノシンデアミナーゼ]-[Cas9ドメイン]-[シチジンデアミナーゼ]-COOH;
NH-[アデノシンデアミナーゼ]-[シチジンデアミナーゼ]-[Cas9ドメイン]-COOH;
NH-[シチジンデアミナーゼ]-[アデノシンデアミナーゼ]-[Cas9ドメイン]-COOH;
NH-[Cas9ドメイン]-[アデノシンデアミナーゼ]-[シチジンデアミナーゼ]-COOH;または
NH-[Cas9ドメイン]-[シチジンデアミナーゼ]-[アデノシンデアミナーゼ]-COOH。
一部の実施形態では、融合タンパク質のアデノシンデアミナーゼは、TadA*8およびシチジンデアミナーゼを含む。一部の実施形態では、TadA*8は、TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23、またはTadA*8.24である。
例示的な融合タンパク質構造は以下を含む:
NH-[アデノシンデアミナーゼ]-[Cas9]-[シチジンデアミナーゼ]-COOH;
NH-[シチジンデアミナーゼ]-[Cas9]-[アデノシンデアミナーゼ]-COOH;
NH-[TadA*8]-[Cas9]-[シチジンデアミナーゼ]-COOH;または
NH-[シチジンデアミナーゼ]-[Cas9]-[TadA*8]-COOH。
一部の実施形態では、シチジンデアミナーゼ、脱塩基性エディター、とアデノシンデアミナーゼとnapDNAbp(例えば、Cas9ドメイン)とを含む融合タンパク質は、リンカー配列を含まない。一部の実施形態では、リンカーは、シチジンデアミナーゼドメインとアデノシンデアミナーゼドメインとnapDNAbpとの間に存在する。一部の実施形態では、上記の一般構造に用いられる「-」は、任意選択的なリンカーの存在を標示する。一部の実施形態では、シチジンデアミナーゼとアデノシンデアミナーゼとnapDNAbpは、本明細書に提供されるいずれかのリンカーを介して融合される。例えば、一部の実施形態では、シチジンデアミナーゼとアデノシンデアミナーゼとnapDNAbpとは、下記に「リンカー」という題の項にて示されるいずれかのリンカーを介して融合される。
一部の実施形態では、シチジンデアミナーゼ、アデノシンデアミナーゼ、およびCas9ドメインまたはCas12ドメインを有する例示的なCas9またはCas12の融合タンパク質の一般構造は、以下の構造のいずれかを含み、式中、NLSは核局在化配列(例えば、本明細書に提供されるいずれかのNLS)であり、NHは融合タンパク質のN末端であり、COOHは融合タンパク質のC末端である。
NH-NLS-[シチジンデアミナーゼ]-[Cas9ドメイン]-[アデノシンデアミナーゼ]-COOH;
NH-NLS-[アデノシンデアミナーゼ]-[Cas9ドメイン]-[シチジンデアミナーゼ]-COOH;
NH-NLS-[アデノシンデアミナーゼ][シチジンデアミナーゼ]-[Cas9ドメイン]-COOH;
NH-NLS-[シチジンデアミナーゼ]-[アデノシンデアミナーゼ]-[Cas9ドメイン]-COOH;
NH-NLS-[Cas9ドメイン]-[アデノシンデアミナーゼ]-[シチジンデアミナーゼ]-COOH;
NH-NLS-[Cas9ドメイン]-[シチジンデアミナーゼ]-[アデノシンデアミナーゼ]-COOH;
NH-[シチジンデアミナーゼ]-[Cas9ドメイン]-[アデノシンデアミナーゼ]-NLS-COOH;
NH-[アデノシンデアミナーゼ]-[Cas9ドメイン]-[シチジンデアミナーゼ]-NL2-COOH;
NH-[アデノシンデアミナーゼ][シチジンデアミナーゼ]-[Cas9ドメイン]-NLS-COOH;
NH-[シチジンデアミナーゼ]-[アデノシンデアミナーゼ]-[Cas9ドメイン]-NLS-COOH;
NH-[Cas9ドメイン]-[アデノシンデアミナーゼ]-[シチジンデアミナーゼ]-NLS-COOH;または
NH-[Cas9ドメイン]-[シチジンデアミナーゼ]-[アデノシンデアミナーゼ]-NLS-COOH。
一部の実施形態では、NLSはリンカーに存在するか、または、NLSは、例えば本明細書に記載のリンカーの側面に位置する。一部の実施形態では、N末端またはC末端NLSは、二部分構成のNLSである。二部分構成のNLSは、2つの塩基性アミノ酸クラスターを含み、それらは比較的短いスペーサー配列によって分離されている(そのため、一部分構成のNLSではなく、二部分構成-2部分である)。ヌクレオプラスミンのNLSであるKR[PAATKKAGQA]KKKKは、遍在性の二部分構成のシグナルのプロトタイプ、すなわち約10アミノ酸のスペーサーによって分離された塩基性アミノ酸の2つのクラスターである。例示的な二部分構成のNLSの配列は以下である:PKKKRKVEGADKRTADGSEFESPKKKRKV。
一部の実施形態では、シチジンデアミナーゼ、アデノシンデアミナーゼ、Cas9ドメイン、およびNLSを含む融合タンパク質は、リンカー配列を含まない。一部の実施形態では、1つまたは複数のドメインまたはタンパク質(例えば、シチジンデアミナーゼ、アデノシンデアミナーゼ、Cas9ドメイン、またはNLS)の間のリンカー配列が存在する。
本開示の融合タンパク質が1つまたは複数の追加の特徴を含み得ることを認識するべきである。例えば、一部の実施形態では、融合タンパク質は、阻害物質、細胞質局在化配列、核輸送配列などの輸送配列、または他の局在化配列、ならびに融合タンパク質の可溶化、精製、または検出に有用な配列タグを含んでいてもよい。本明細書に提供される適したタンパク質タグとしては、以下に限定されないが、ビオチンカルボキシラーゼ担体タンパク質(BCCP)タグ、mycタグ、カルモジュリンタグ、FLAGタグ、ヘマグルチニン(HA)タグ、ヒスチジンタグまたはHisタグとも呼ばれるポリヒスチジンタグ、マルトース結合タンパク質(MBP)-タグ、nusタグ、グルタチオン-S-トランスフェラーゼ(GST)タグ、緑色蛍光タンパク質(GFP)タグ、チオレドキシンタグ、Sタグ、Sofタグ(例えば、Sofタグ1、Sofタグ3)、strepタグ、ビオチンリガーゼタグ、FlAsHタグ、V5タグ、およびSBPタグが挙げられる。追加の適した配列は当業者に明らかになるものとなる。一部の実施形態では、融合タンパク質は、1つまたは複数のHisタグを含む。
例示的でさらに非制限的な融合タンパク質は、それぞれが本明細書に参照によりその全体を本明細書に組み込まれる国際PCT出願PCT/2017/044935およびPCT/US2020/016288に記載されている。
核局在化配列(NLS)を含む融合タンパク質
一部の実施形態では、本明細書に提供される融合タンパク質は、1つまたは複数(例えば、2個、3個、4個、5個)の核標的化配列、例えば核局在化配列(NLS)をさらに含む。一実施形態では、二部分構成のNLSが用いられる。一部の実施形態では、NLSは、NLSを含むタンパク質が(例えば、核輸送によって)細胞核内へ移入するのを促進するアミノ酸配列を含む。一部の実施形態では、本明細書に提供されるいずれかの融合タンパク質は、核局在化配列(NLS)をさらに含む。一部の実施形態では、NLSは、融合タンパク質のN末端に融合される。一部の実施形態では、NLSは、融合タンパク質のC末端に融合される。一部の実施形態では、NLSは、Cas9ドメインのN末端に融合される。一部の実施形態では、NLSは、nCas9ドメインまたはdCas9ドメインのC末端に融合される。一部の実施形態では、NLSは、デアミナーゼのN末端に融合される。一部の実施形態では、NLSは、デアミナーゼのC末端に融合される。一部の実施形態では、NLSは、1つまたは複数のリンカーを介して融合タンパク質に融合される。一部の実施形態では、NLSは、リンカーなく融合タンパク質に融合される。一部の実施形態では、NLSは、本明細書に記載または参照されるいずれか1つのNLS配列のアミノ酸配列を含む。追加の核局在化配列は、当技術分野に公知であり、当業者に明らかとなる。例えば、NLS配列は、その内容が例示的な核局在化配列の開示について本明細書に参照により組み込まれるPlankらのPCT/EP2000/011690に記載されている。一部の実施形態では、NLSは、アミノ酸配列PKKKRKVEGADKRTADGSEFESPKKKRKV、KRTADGSEFESPKKKRKV、KRPAATKKAGQAKKKK、KKTELQTTNAENKTKKL、KRGINDRNFWRGENGRKTR、RKSGKIAAIVVKRPRKPKKKRKV、またはMDSLLMNRRKFLYQFKNVRWAKGRRETYLCを含む。一部の実施形態では、NLSはリンカーに存在するか、またはNLSはリンカー、例えば、本明細書に記載のリンカーの側面に位置する。一部の実施形態では、N末端またはC末端NLSは、二部分構成のNLSである。二部分構成のNLSは、2つの塩基性アミノ酸クラスターを含み、それらは比較的短いスペーサー配列によって分離されている(そのため、一部分構成のNLSではなく、二部分構成-2部分である)。ヌクレオプラスミンのNLSであるKR[PAATKKAGQA]KKKKは、遍在性の二部分構成のシグナルのプロトタイプ、すなわち約10アミノ酸のスペーサーによって分離された塩基性アミノ酸の2つのクラスターである。例示的な二部分構成のNLSの配列は以下である:PKKKRKVEGADKRTADGSEFES PKKKRKV。
一部の実施形態では、本発明の融合タンパク質はリンカー配列を含まない。一部の実施形態では、1つまたは複数のドメインまたはタンパク質の間のリンカー配列が存在する。一部の実施形態では、アデノシンデアミナーゼまたはシチジンデアミナーゼおよびCas9ドメインを有する例示的なCas9融合タンパク質の一般構造は、以下の構造のいずれか1つを含み、式中、NLSは核局在化配列(例えば、本明細書に提供されるいずれかのNLS)であり、NHは、融合タンパク質のN末端であり、COOHは、融合タンパク質のC末端である。
NH-NLS-[アデノシンデアミナーゼ]-[Cas9ドメイン]-COOH;
NH-NLS[Cas9ドメイン]-[アデノシンデアミナーゼ]-COOH;
NH-[アデノシンデアミナーゼ]-[Cas9ドメイン]-NLS-COOH;
NH-[Cas9ドメイン]-[アデノシンデアミナーゼ]-NLS-COOH;
NH-NLS-[シチジンデアミナーゼ]-[Cas9ドメイン]-COOH;
NH-NLS[Cas9ドメイン]-[シチジンデアミナーゼ]-COOH;
NH-[シチジンデアミナーゼ]-[Cas9ドメイン]-NLS-COOH;または
NH-[Cas9ドメイン]-[シチジンデアミナーゼ]-NLS-COOH。.
本開示の融合タンパク質が1つまたは複数の追加の特徴を含み得ることを認識するべきである。例えば、一部の実施形態では、融合タンパク質は、阻害物質、細胞質局在化配列、核輸送配列などの輸送配列、または他の局在化配列、ならびに融合タンパク質の可溶化、精製、または検出に有用な配列タグを含んでいてもよい。本明細書に提供される適したタンパク質タグとしては、以下に限定されないが、ビオチンカルボキシラーゼ担体タンパク質(BCCP)タグ、mycタグ、カルモジュリンタグ、FLAGタグ、ヘマグルチニン(HA)タグ、ヒスチジンタグまたはHisタグとも呼ばれるポリヒスチジンタグ、マルトース結合タンパク質(MBP)タグ、nusタグ、グルタチオン-S-トランスフェラーゼ(GST)タグ、緑色蛍光タンパク質(GFP)タグ、チオレドキシンタグ、Sタグ、Sofタグ(例えば、Sofタグ1、Sofタグ3)、strepタグ、ビオチンリガーゼタグ、FlAsHタグ、V5タグ、およびSBPタグが挙げられる。追加の適した配列は当業者に明らかになるものとなる。一部の実施形態では、融合タンパク質は、1つまたは複数のHisタグを含む。
1つまたは複数の核局在化配列(NLS)を含むCRISPR酵素をコードするベクターを用いることができる。例えば、用いられる1、2、3、4、5、6、7、8、9、10個または約1、2、3、4、5、6、7、8、9、10個のNLSがあり得る。CRISPR酵素は、アンモ末端にもしくはその近くにNLSを、カルボキシ末端にもしくはその近くに約1、2、3、4、5、6、7、8、9、10もしくは約1、2、3、4、5、6、7、8、9、10を超えるNLSを、またはこれらの任意の組合せ(例えば、アンモ末端に1つまたは複数のNLS、およびカルボキシ末端に1つまたは複数NLS)を含む。1つを超えるNLSが存在する場合、それぞれを他とは独立して選択することができ、それゆえに、1コピーを超えておよび/または1つまたは複数のコピーに存在する1つまたは複数の他のNLSとの組合せで、単一のNLSが存在し得る。
本方法に用いられるCRISPR酵素は、約6個のNLSを含み得る。NLSに最も近いアミノ酸が、N末端またはC末端からポリペプチド鎖に沿って約50アミノ酸以内である場合、例えば、1、2、3、4、5、10、15、20、25、30、40、または50アミノ酸以内である場合、NLSは、N末端またはC末端の近くにあると考えられる。
内部挿入を含む融合タンパク質
本明細書に提供されるのは、核酸プログラマブル核酸結合タンパク質、例えば、napDNAbpに融合されている異種ポリペプチドを含む融合タンパク質である。異種ポリペプチドは、天然または野生型のnapDNAbpポリペプチド配列には見られないポリペプチドとすることができる。異種ポリペプチドは、napDNAbpのC末端、napDNAbpのN末端でnapDNAbpに融合することができるか、またはnapDNAbp内部位置で挿入することができる。一部の実施形態では、異種ポリペプチドは、napDNAbpの内部位置で挿入される。
一部の実施形態では、異種ポリペプチドは、デアミナーゼまたはその機能性断片である。例えば、融合タンパク質は、Cas9またはCas12(例えば、Cas12b/C2c1)のN末端断片およびC末端断片の側面に位置するデアミナーゼのポリペプチドを含み得る。融合タンパク質内のデアミナーゼは、アデノシンデアミナーゼとすることができる。一部の実施形態では、アデノシンデアミナーゼはTadA(例えば、TadA7.10またはTadA*8)である。一部の実施形態では、TadAはTadA*8である。本明細書に記載されるようなTadA配列(例えば、TadA7.10またはTadA*8)は、上記の融合タンパク質に適したデアミナーゼである。
デアミナーゼは、循環置換型デアミナーゼとすることができる。例えば、デアミナーゼは、循環置換型アデノシンデアミナーゼとすることができる。一部の実施形態では、デアミナーゼは、循環置換体TadAであり、TadA参照配列で付番してアミノ酸残基116で循環置換されている。一部の実施形態では、デアミナーゼは循環置換型TadAであり、TadA参照配列で付番してアミノ酸残基136で循環置換されている。一部の実施形態では、デアミナーゼは循環置換型TadAであり、TadA参照配列で付番してアミノ酸残基65で循環置換されている。
融合タンパク質は、1つを超えるデアミナーゼを含み得る。融合タンパク質は、例えば、1個、2個、3個、4個、5個、またはそれを超えるデアミナーゼを含み得る。一部の実施形態では、融合タンパク質は1つのデアミナーゼを含む。一部の実施形態では、融合タンパク質は2つのデアミナーゼを含む。融合タンパク質内の2つ以上のデアミナーゼは、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはそれらの組合せとされ得る。2つ以上のデアミナーゼはホモ二量体とされ得る。2つ以上のデアミナーゼはヘテロ二量体とされ得る。2つ以上のデアミナーゼは、直列でnapDNAbpに挿入され得る。一部の実施形態では、2つ以上のデアミナーゼは、napDNAbpに直列で存在しなくてもよい。
一部の実施形態では、融合タンパク質内のnapDNAbpは、Cas9ポリペプチドまたはその断片である。Cas9ポリペプチドは、バリアントCas9ポリペプチドとされ得る。一部の実施形態では、Cas9ポリペプチドは、Cas9ニッカーゼ(nCas9)ポリペプチドまたはその断片である。一部の実施形態では、Cas9ポリペプチドは、ヌクレアーゼ活性のないCas9(dCas9)ポリペプチドまたはその断片である。融合タンパク質内のCas9ポリペプチドは、完全長Cas9ポリペプチドとされ得る。一部の場合では、融合タンパク質内のCas9ポリペプチドは、完全長Cas9ポリペプチドでなくてもよい。Cas9ポリペプチドは、天然のCas9タンパク質に比べて、例えば、N末端またはC末端で、切詰され得る。Cas9ポリペプチドは、循環置換型Cas9タンパク質とされ得る。Cas9ポリペプチドは、標的ポリヌクレオチドおよびガイド核酸配列をやはり結合することができるCas9ポリペプチドの断片、部分、またはドメインとされ得る。
一部の実施形態では、Cas9ポリペプチドは、ストレプトコッカス・ピロゲネスCas9(SpCas9)、スタフィロコッカス・アウレウスCas9(SaCas9)、ストレプトコッカス・サーモフィルス1Cas9(St1Cas9)、またはそれらの断片もしくはバリアントである。
融合タンパク質のCas9ポリペプチドは、天然に発生したCas9ポリペプチドと少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一のアミノ酸配列を含み得る。
融合タンパク質のCas9ポリペプチドは、下記に規定されるCas9アミノ酸配列(下記に「Cas9参照配列」と呼ばれる)と少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一のアミノ酸配列を含み得る:
Figure 2022545950000014
(単下線:HNHドメイン;二重下線:RuvCドメイン)。
Cas9ポリペプチドのN末端断片およびC末端断片の側面に配置された異種の触媒ドメインを含む融合タンパク質も、本明細書に記載されるような方法における塩基編集に有用である。Cas9および1つまたは複数のデアミナーゼドメイン、例えば、アデノシンデアミナーゼを含むか、またはCas9配列の側面に配置されたアデノシンデアミナーゼドメインを含む融合タンパク質も、特異性および効率性の高い標的配列の塩基編集に有用である。一実施形態では、キメラCas9融合タンパク質は、Cas9ポリペプチド内に挿入された異種の触媒ドメイン(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)を含有する。一部の実施形態では、融合タンパク質は、Cas9内に挿入されたアデノシンデアミナーゼドメインとシチジンデアミナーゼドメインとを含む。一部の実施形態では、アデノシンデアミナーゼはCas9内に融合され、シチジンデアミナーゼはC末端に融合される。一部の実施形態では、アデノシンデアミナーゼはCas9内に融合され、シチジンデアミナーゼはN末端に融合される。一部の実施形態では、シチジンデアミナーゼはCas9内に融合され、アデノシンデアミナーゼはC末端に融合される。一部の実施形態では、シチジンデアミナーゼはCas9内に融合され、アデノシンデアミナーゼはN末端に融合される。
アデノシンデアミナーゼとシチジンデアミナーゼとCas9とを有する融合タンパク質の例示的な構造は、以下のように示される:
NH-[Cas9(アデノシンデアミナーゼ)]-[シチジンデアミナーゼ]-COOH;
NH-[シチジンデアミナーゼ]-[Cas9(アデノシンデアミナーゼ)]-COOH;
NH-[Cas9(シチジンデアミナーゼ)]-[アデノシンデアミナーゼ]-COOH;または
NH-[アデノシンデアミナーゼ]-[Cas9(シチジンデアミナーゼ)]-COOH。
一部の実施形態では、上記の一般構造に用いられる「-」は、任意選択的なリンカーの存在を標示する。
様々な実施形態では、触媒ドメインは、DNA修飾活性(例えば、デアミナーゼ活性)、例えばアデノシンデアミナーゼ活性などを有する。一部の実施形態では、アデノシンデアミナーゼはTadA(例えば、TadA7.10)である。一部の実施形態では、TadAはTadA*8である。一部の実施形態では、TadA*8はCas9内に融合され、シチジンデアミナーゼはC末端に融合される。一部の実施形態では、TadA*8はCas9内に融合され、シチジンデアミナーゼはN末端に融合される。一部の実施形態では、シチジンデアミナーゼはCas9内に融合され、TadA*8はC末端に融合される。一部の実施形態では、シチジンデアミナーゼはCas9内に融合され、TadA*8はN末端に融合される。TadA*8とシチジンデアミナーゼとCas9とを有する融合タンパク質の例示的な構造は、以下のように示される:
NH-[Cas9(TadA*8)]-[シチジンデアミナーゼ]-COOH;
NH-[シチジンデアミナーゼ]-[Cas9(TadA*8)]-COOH;
NH-[Cas9(シチジンデアミナーゼ)]-[TadA*8]-COOH;または
NH-[TadA*8]-[Cas9(シチジンデアミナーゼ)]-COOH。
一部の実施形態では、上記の一般構造に用いられる「-」は、任意選択的なリンカーの存在を標示する。
異種ポリペプチド(例えば、デアミナーゼ)は、適した場所でnapDNAbp(例えば、Cas9またはCas12(例えば、Cas12b/C2c1))に挿入することができ、それゆえに例えば、napDNAbpは、標的ポリヌクレオチドとガイド核酸とを結合する能力を保持する。デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、デアミナーゼの機能(例えば、塩基編集活性)またはnapDNAbpの機能(例えば、標的核酸およびガイド核酸に結合する能力)を損なうことなくnapDNAbp内に挿入することができる。デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、例えば、障害のある領域または結晶解析により示されるような高温因子もしくはB因子を含む領域で、napDNAbpに挿入することができる。あまり整列されていないか、乱雑であるか、または構造化されていないタンパク質の領域、例えば、溶媒曝露領域およびループは、構造または機能を損なうことなく挿入するために用いることができる。デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、可撓性ループ領域または溶媒曝露領域でnapDNAbpに挿入することができる。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、Cas9またはCas12b/C2c1ポリペプチドの可撓性ループに挿入される。
一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)の挿入場所は、Cas9ポリペプチドの結晶構造のB因子解析によって決定される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、平均よりも高いB因子(例えば、総タンパク質または乱雑な領域を含むタンパク質ドメインに比べて高いB因子)を備えるCas9ポリペプチドの領域に挿入される。B因子または温度因子は、原子の揺らぎをそれらの平均的な位置から(例えば、温度依存的な原子振動または結晶格子の静的無秩序性の結果として)標示することができる。骨格原子についてB因子が高い(例えば、平均B因子よりも高い)ことは、局所移動性の比較的高い領域であることを標示し得る。そのような領域は、構造または機能を損なうことなくデアミナーゼを挿入するために用いることができる。デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、総タンパク質の平均B因子よりも50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、または200%超の高いB因子を備えるCα原子を有する残基を含む場所で、挿入することができる。デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、ある残基を含むCas9タンパク質ドメインの平均B因子よりも50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、または200%超の高いB因子を備えるCα原子を有する当該残基を含む場所で、挿入することができる。平均よりも高いB因子を備えるCas9ポリペプチド位置としては、例えば、上記Cas9参照配列で付番した際の残基768、792、1052、1015、1022、1026、1029、1067、1040、1054、1068、1246、1247、および1248を挙げることができる。平均よりも高いB因子を備えるCas9ポリペプチド領域としては、例えば、上記のCas9参照配列で付番した際の残基792~872、792~906、および2~791が挙げられる。
異種ポリペプチド(例えば、デアミナーゼ)は、上記のCas9参照配列で付番した際の768、791、792、1015、1016、1022、1023、1026、1029、1040、1052、1054、1067、1068、1069、1246、1247、および1248からなる群から選択されるアミノ酸残基、または別のCas9ポリペプチド中の対応するアミノ酸残基でnapDNAbpに挿入することができる。一部の実施形態では、異種ポリペプチドは、上記のCas9参照配列で付番した際のアミノ酸768~769位、791~792位、792~793位、1015~1016位、1022~1023位、1026~1027位、1029~1030位、1040~1041位、1052~1053位、1054~1055位、1067~1068位、1068~1069位、1247~1248位、もしくは1248~1249位、またはその対応するアミノ酸位置の間に挿入される。一部の実施形態では、異種ポリペプチドは、上記のCas9参照配列で付番した際のアミノ酸769~770位、792~793位、793~794位、1016~1017位、1023~1024位、1027~1028位、1030~1031位、1041~1042位、1053~1054位、1055~1056位、1068~1069位、1069~1070位、1248~1249位、もしくは1249~1250位、またはその対応するアミノ酸位置の間に挿入される。一部の実施形態では、異種ポリペプチドは、上記のCas9参照配列で付番した際の768、791、792、1015、1016、1022、1023、1026、1029、1040、1052、1054、1067、1068、1069、1246、1247、および1248からなる群から選択されるアミノ酸残基、または別のCas9ポリペプチド中の対応するアミノ酸残基を置換される。挿入位置に関する上記Cas9参照配列への言及は、説明の目的のためであることを理解するべきである。本明細書に考察されるような挿入は、上記Cas9参照配列のCas9ポリペプチド配列に限定されないが、バリアントCas9ポリペプチド、例えばCas9ニッカーゼ(nCas9)、ヌクレアーゼ活性のないCas9(dCas9)、ヌクレアーゼドメインを欠いたCas9バリアント、切詰型Cas9、またはHNHドメインを部分的もしくは完全に欠いたCas9ドメインの対応する場所での挿入を含む。
異種ポリペプチド(例えば、デアミナーゼ)は、上記のCas9参照配列で付番した際の768、792、1022、1026、1040、1068、および1247からなる群から選択されるアミノ酸残基、または別のCas9ポリペプチド中の対応するアミノ酸残基で、napDNAbpに挿入することができる。一部の実施形態では、異種ポリペプチドは、上記のCas9参照配列で付番した際のアミノ酸768~769位、792~793位、1022~1023位、1026~1027位、1029~1030位、1040~1041位、1068~1069位、もしくは1247~1248位、またはそれらの対応するアミノ酸位置の間に挿入される。一部の実施形態では、異種ポリペプチドは、上記のCas9参照配列で付番した際のアミノ酸769~770位、793~794位、1023~1024位、1027~1028位、1030~1031位、1041~1042位、1069~1070位、もしくは1248~1249位、またはそれらの対応するアミノ酸位置の間に挿入される。一部の実施形態では、異種ポリペプチドは、上記のCas9参照配列で付番した際の768、792、1022、1026、1040、1068、および1247からなる群から選択されるアミノ酸残基、または別のCas9ポリペプチド中の対応するアミノ酸残基を置き換える。
異種ポリペプチド(例えば、デアミナーゼ)は、本明細書に記載されるようなアミノ酸残基、または別のCas9ポリペプチド中の対応するアミノ酸残基で、napDNAbpに挿入することができる。一実施形態では、異種ポリペプチド(例えば、デアミナーゼ)は、上記のCas9参照配列で付番した際の1002、1003、1025、1052~1056、1242~1247、1061~1077、943~947、686~691、569~578、530~539、および1060~1077からなる群から選択されるアミノ酸残基、または別のCas9ポリペプチド中の対応するアミノ酸残基で、napDNAbpに挿入することができる。デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、その残基のN末端またはC末端で挿入するか、またはその残基を置き換えることができる。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、残基のC末端で挿入される。
一部の実施形態では、アデノシンデアミナーゼ(例えば、TadA)は、上記のCas9参照配列で付番した際の1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052、および1246からなる群から選択されるアミノ酸残基、または別のCas9ポリペプチド中の対応するアミノ酸残基に挿入される。一部の実施形態では、アデノシンデアミナーゼ(例えば、TadA)は、上記のCas9参照配列で付番した際の残基792~872、792~906、もしくは2~791、または別のCas9ポリペプチド中の対応するアミノ酸残基の代わりに挿入される。一部の実施形態では、アデノシンデアミナーゼは、上記のCas9参照配列で付番した際の1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052、および1246からなる群から選択されるアミノ酸、または別のCas9ポリペプチド中の対応するアミノ酸残基のN末端で挿入される。一部の実施形態では、アデノシンデアミナーゼは、上記のCas9参照配列で付番した際の1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052、および1246からなる群から選択されるアミノ酸、または別のCas9ポリペプチド中の対応するアミノ酸残基のC末端で挿入される。一部の実施形態では、アデノシンデアミナーゼは、上記のCas9参照配列で付番した際の1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052、および1246からなる群から選択されるアミノ酸、または別のCas9ポリペプチド中の対応するアミノ酸残基を置き換えるように挿入される。
一部の実施形態では、CBE(例えば、APOBEC1)は、上記のCas9参照配列で付番した際の1016、1023、1029、1040、1069、および1247からなる群から選択されるアミノ酸残基、または別のCas9ポリペプチド中の対応するアミノ酸残基で挿入される。一部の実施形態では、ABEは、上記のCas9参照配列で付番した際の1016、1023、1029、1040、1069、および1247からなる群から選択されるアミノ酸、または別のCas9ポリペプチド中の対応するアミノ酸残基のN末端で挿入される。一部の実施形態では、ABEは、上記のCas9参照配列で付番した際の1016、1023、1029、1040、1069、および1247からなる群から選択されるアミノ酸、または別のCas9ポリペプチド中の対応するアミノ酸残基のC末端で挿入される。一部の実施形態では、ABEは、上記のCas9参照配列で付番した際の1016、1023、1029、1040、1069、および1247からなる群から選択されるアミノ酸、または別のCas9ポリペプチド中の対応するアミノ酸残基を置き換えるように挿入される。
一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列で付番した際のアミノ酸残基768、または別のCas9ポリペプチド中の対応するアミノ酸残基で挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列で付番した際のアミノ酸残基768または別のCas9ポリペプチド中の対応するアミノ酸残基のN末端で挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列で付番した際のアミノ酸残基768または別のCas9ポリペプチド中の対応するアミノ酸残基のC末端で挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列で付番した際のアミノ酸残基768または別のCas9ポリペプチド中の対応するアミノ酸残基を置き換えるように挿入される。
一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列で付番した際のアミノ酸残基791で挿入されるか、またはアミノ酸残基792または別のCas9ポリペプチド中の対応するアミノ酸残基で挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列で付番した際のアミノ酸残基791のN末端で挿入されるか、またはアミノ酸792または別のCas9ポリペプチド中の対応するアミノ酸残基のN末端で挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列で付番した際のアミノ酸791のC末端で挿入されるか、アミノ酸792または別のCas9ポリペプチド中の対応するアミノ酸残基のN末端で挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列で付番した際のアミノ酸791を置き換えるように挿入されるか、またはアミノ酸792、または別のCas9ポリペプチド中の対応するアミノ酸残基を置き換えるように挿入される。
一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列で付番した際のアミノ酸残基1016、または別のCas9ポリペプチド中の対応するアミノ酸残基で挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列で付番した際のアミノ酸残基1016または別のCas9ポリペプチド中の対応するアミノ酸残基のN末端で挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列で付番した際のアミノ酸残基1016または別のCas9ポリペプチド中の対応するアミノ酸残基のC末端で挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列で付番した際のアミノ酸残基1016または別のCas9ポリペプチド中の対応するアミノ酸残基を置き換えるように挿入される。
一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列で付番した際のアミノ酸残基1022で挿入されるか、またはアミノ酸残基1023または別のCas9ポリペプチド中の対応するアミノ酸残基で挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列で付番した際のアミノ酸残基1022のN末端で挿入されるか、またはアミノ酸1023または別のCas9ポリペプチド中の対応するアミノ酸残基のN末端で挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列で付番した際のアミノ酸残基1022のC末端で挿入されるか、またはアミノ酸1023または別のCas9ポリペプチド中の対応するアミノ酸残基のC末端で挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列で付番した際のアミノ酸残基1022を置き換えるように挿入されるか、またはアミノ酸残基1023、または別のCas9ポリペプチド中の対応するアミノ酸残基を置き換えるように挿入される。
一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列で付番した際のアミノ酸残基1026で挿入されるか、またはアミノ酸残基1029または別のCas9ポリペプチド中の対応するアミノ酸残基で挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列で付番した際のアミノ酸残基1026のN末端で挿入されるか、またはアミノ酸1029または別のCas9ポリペプチド中の対応するアミノ酸残基のN末端で挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列で付番した際のアミノ酸残基1026のC末端で挿入されるか、またはアミノ酸1029または別のCas9ポリペプチド中の対応するアミノ酸残基のC末端で挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列で付番した際のアミノ酸残基1026を置き換えるように挿入されるか、またはアミノ酸残基1029、または別のCas9ポリペプチド中の対応するアミノ酸残基を置き換えるように挿入される。
一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列で付番した際のアミノ酸残基1040、または別のCas9ポリペプチド中の対応するアミノ酸残基で挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列で付番した際のアミノ酸残基1040または別のCas9ポリペプチド中の対応するアミノ酸残基のN末端で挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列で付番した際のアミノ酸残基1040または別のCas9ポリペプチド中の対応するアミノ酸残基のC末端で挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列で付番した際のアミノ酸残基1040または別のCas9ポリペプチド中の対応するアミノ酸残基を置き換えるように挿入される。
一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列で付番した際のアミノ酸残基1052で挿入されるか、またはアミノ酸残基1054または別のCas9ポリペプチド中の対応するアミノ酸残基で挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列で付番した際のアミノ酸残基1052のN末端で挿入されるか、またはアミノ酸1054または別のCas9ポリペプチド中の対応するアミノ酸残基のN末端で挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列で付番した際のアミノ酸残基1052のC末端で挿入されるか、またはアミノ酸1054または別のCas9ポリペプチド中の対応するアミノ酸残基のC末端で挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列で付番した際のアミノ酸残基1052を置き換えるように挿入されるか、またはアミノ酸残基1054、または別のCas9ポリペプチド中の対応するアミノ酸残基を置き換えるように挿入される。
一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列で付番した際のアミノ酸残基1067で挿入されるか、またはアミノ酸残基1068で挿入されるか、またはアミノ酸残基1069または別のCas9ポリペプチド中の対応するアミノ酸残基で挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列で付番した際のアミノ酸残基1067のN末端で挿入されるか、またはアミノ酸残基1068のN末端で挿入されるか、またはアミノ酸残基1069または別のCas9ポリペプチド中の対応するアミノ酸残基のN末端で挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列で付番した際のアミノ酸残基1067のC末端で挿入されるか、またはアミノ酸残基1068のC末端で挿入されるか、またはアミノ酸残基1069または別のCas9ポリペプチド中の対応するアミノ酸残基のC末端で挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列で付番した際のアミノ酸残基1067を置き換えるように挿入されるか、またはアミノ酸残基1068を置き換えるように挿入されるか、またはアミノ酸残基1069または別のCas9ポリペプチド中の対応するアミノ酸残基を置き換えるように挿入される。
一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列で付番した際のアミノ酸残基1246で挿入されるか、またはアミノ酸残基1247で挿入されるか、またはアミノ酸残基1248または別のCas9ポリペプチド中の対応するアミノ酸残基で挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列で付番した際のアミノ酸残基1246のN末端で挿入されるか、またはアミノ酸残基1247のN末端で挿入されるか、またはアミノ酸残基1248または別のCas9ポリペプチド中の対応するアミノ酸残基のN末端で挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列で付番した際のアミノ酸残基1246のC末端で挿入されるか、またはアミノ酸残基1247のC末端で挿入されるか、またはアミノ酸残基1248または別のCas9ポリペプチド中の対応するアミノ酸残基のC末端で挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、上記のCas9参照配列で付番した際のアミノ酸残基1246を置き換えるように挿入されるか、またはアミノ酸残基1247を置き換えるように挿入されるか、またはアミノ酸残基1248または別のCas9ポリペプチド中の対応するアミノ酸残基を置き換えるように挿入される。
一部の実施形態では、異種ポリペプチド(例えば、デアミナーゼ)は、Cas9ポリペプチドの可撓性ループに挿入される。可撓性ループ部分は、上記のCas9参照配列で付番した際の530~537、569~570、686~691、943~947、1002~1025、1052~1077、1232~1247、もしくは1298~1300、または別のCas9ポリペプチド中の対応するアミノ酸残基からなる群から選択することができる。可撓性ループ部分は、上記のCas9参照配列で付番した際の1~529、538~568、580~685、692~942、948~1001、1026~1051、1078~1231、もしくは1248~1297、または別のCas9ポリペプチド中の対応するアミノ酸残基からなる群から選択することができる。
異種ポリペプチド(例えば、アデニンデアミナーゼ)は、上記のCas9参照配列で付番した際のアミノ酸残基:1017~1069、1242~1247、1052~1056、1060~1077、1002~1003、943~947、530~537、568~579、686~691、1242~1247、1298~1300、1066~1077、1052~1056、もしくは1060~1077、または別のCas9ポリペプチド中の対応するアミノ酸残基に相当するCas9ポリペプチド領域内に挿入することができる。
異種ポリペプチド(例えば、アデニンデアミナーゼ)は、Cas9ポリペプチドの欠失領域の代わりに挿入することができる。欠失領域は、Cas9ポリペプチドのN末端またはC末端部分に相当し得る。一部の実施形態では、欠失領域は、上記のCas9参照配列で付番した際の残基792~872、または別のCas9ポリペプチド中の対応するアミノ酸残基に相当する。一部の実施形態では、欠失領域は、上記のCas9参照配列で付番した際の残基792~906、または別のCas9ポリペプチド中の対応するアミノ酸残基に相当する。一部の実施形態では、欠失領域は、上記のCas9参照配列で付番した際の残基2~791、または別のCas9ポリペプチド中の対応するアミノ酸残基に相当する。一部の実施形態では、欠失領域は、上記のCas9参照配列で付番した際の残基1017~1069、またはその対応するアミノ酸残基に相当する。
例示的な内部融合塩基エディターを下記の表Aに示す:
Figure 2022545950000015
異種ポリペプチド(例えば、デアミナーゼ)は、Cas9ポリペプチドの構造ドメインまたは機能ドメイン内に挿入することができる。異種ポリペプチド(例えば、デアミナーゼ)は、Cas9ポリペプチドの2つの構造ドメインまたは機能ドメインの間に挿入することができる。異種ポリペプチド(例えば、デアミナーゼ)は、Cas9ポリペプチドの構造ドメインまたは機能ドメインの代わりに、例えば、Cas9ポリペプチドからそのドメインを欠失させた後に、挿入することができる。Cas9ポリペプチドの構造ドメインまたは機能ドメインとしては、例えば、RuvCI、RuvCII、RuvCIII、Rec1、Rec2、PI、またはHNHを挙げることができる。
一部の実施形態では、Cas9ポリペプチドは、RuvCI、RuvCII、RuvCIII、Rec1、Rec2、PI、またはHNHドメインからなる群から選択される1つまたは複数のドメインを欠いている。一部の実施形態では、Cas9ポリペプチドはヌクレアーゼドメインを欠いている。一部の実施形態では、Cas9ポリペプチドはHNHドメインを欠いている。一部の実施形態では、Cas9ポリペプチドはHNHドメインの一部を欠き、それゆえにCas9ポリペプチドは、HNH活性が低減されているかまたは無効にされている。一部の実施形態では、Cas9ポリペプチドは、ヌクレアーゼドメインの欠失を含み、デアミナーゼは、ヌクレアーゼドメインを置き換えるように挿入されている。一部の実施形態では、HNHドメインは欠失され、デアミナーゼがその代わりに挿入されている。一部の実施形態では、1つまたは複数のRuvCドメインが欠失され、デアミナーゼが代わりに挿入されている。
異種ポリペプチドを含む融合タンパク質は、napDNAbpのN末端およびC末端断片の側面に配置され得る。一部の実施形態では、融合タンパク質は、Cas9ポリペプチドのN末端断片およびC末端断片の側面に配置されたデアミナーゼを含む。N末端断片またはC末端断片は、標的ポリヌクレオチド配列を結合することができる。N末端断片のC末端またはC末端断片のN末端は、Cas9ポリペプチドの可撓性ループの一部を含み得る。N末端断片のC末端またはC末端断片のN末端は、Cas9ポリペプチドのアルファ-ヘリックス構造の一部を含み得る。N末端断片またはC末端断片は、DNA結合ドメインを含み得る。N末端断片またはC末端断片は、RuvCドメインを含み得る。N末端断片またはC末端断片は、HNHドメインを含み得る。一部の実施形態では、N末端断片とC末端断片のどちらも、HNHドメインを含まない。
一部の実施形態では、融合タンパク質が標的核酸塩基を脱アミノ化する際に、N末端Cas9断片のC末端は、標的核酸塩基に近接するアミノ酸を含む。一部の実施形態では、融合タンパク質が標的核酸塩基を脱アミノ化する際に、C末端Cas9断片のN末端は、標的核酸塩基に近接するアミノ酸を含む。標的核酸塩基とN末端Cas9断片のC末端内またはC末端Cas9断片のN末端内のアミノ酸との間を近接させるために、異なるデアミナーゼの挿入場所は異なり得る。例えば、ABEの挿入位置は、上記のCas9参照配列で付番した際の1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052、および1246からなる群から選択されるアミノ酸残基または別のCas9ポリペプチド中の対応するアミノ酸残基とすることができる。
融合タンパク質のN末端Cas9断片(すなわち、融合タンパク質中のデアミナーゼの側面に配置されたN末端Cas9断片)は、Cas9ポリペプチドのN末端を含み得る。融合タンパク質のN末端Cas9断片は、少なくとも約100、200、300、400、500、600、700、800、900、1000、1100、1200、または1300アミノ酸の長さを含み得る。融合タンパク質のN末端Cas9断片は、上記のCas9参照配列で付番した際のアミノ酸残基:1~56、1~95、1~200、1~300、1~400、1~500、1~600、1~700、1~718、1~765、1~780、1~906、1~918、もしくは1~1100、または別のCas9ポリペプチド中の対応するアミノ酸残基に対応する配列を含み得る。N末端Cas9断片は、上記のCas9参照配列で付番した際のアミノ酸残基:1~56、1~95、1~200、1~300、1~400、1~500、1~600、1~700、1~718、1~765、1~780、1~906、1~918、もしくは1~1100、または別のCas9ポリペプチド中の対応するアミノ酸残基と少なくとも:85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の配列同一性を備える配列を含み得る。
融合タンパク質のC末端Cas9断片(すなわち、融合タンパク質中のデアミナーゼの側面に配置されたC末端Cas9断片)は、Cas9ポリペプチドのC末端を含み得る。融合タンパク質のC末端Cas9断片は、少なくとも約100、200、300、400、500、600、700、800、900、1000、1100、1200、または1300アミノ酸の長さを含み得る。融合タンパク質のC末端Cas9断片は、上記のCas9参照配列で付番した際のアミノ酸残基:1099~1368、918~1368、906~1368、780~1368、765~1368、718~1368、94~1368、もしくは56~1368、または別のCas9ポリペプチド中の対応するアミノ酸残基に対応する配列を含み得る。N末端Cas9断片は、上記のCas9参照配列で付番した際のアミノ酸残基:1099~1368、918~1368、906~1368、780~1368、765~1368、718~1368、94~1368、もしくは56~1368、または別のCas9ポリペプチド中の対応するアミノ酸残基と少なくとも:85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の配列同一性を備える配列を含み得る。
融合タンパク質のN末端Cas9断片およびC末端Cas9断片は、まとめて、完全長の天然のCas9ポリペプチド配列、例えば、上記のCas9参照配列に規定されたようなものに対応していなくてもよい。
本明細書に記載の融合タンパク質は、非標的部位(例えば、オフターゲット部位)での脱アミノ化を低減されて、例えば、ゲノムワイドな偽の脱アミノ化を低減されるなど、標的化された脱アミノ化をもたらすことができる。本明細書に記載の融合タンパク質はまた、非標的部位でのバイスタンダーの脱アミノ化を低減されて、標的化された脱アミノ化をもたらすことができる。望まない脱アミノ化またはオフターゲットの脱アミノ化は、例えば、Cas9ポリペプチドのN末端またはC末端に融合されたデアミナーゼを含む末端融合タンパク質に比べて、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%、または少なくとも99%低減され得る。望まない脱アミノ化またはオフターゲットの脱アミノ化は、例えば、Cas9ポリペプチドのN末端またはC末端に融合されたデアミナーゼを含む末端融合タンパク質に比べて、少なくとも1倍、少なくとも2倍、少なくとも3倍、少なくとも4倍、少なくとも5倍、少なくとも10倍、少なくとも15倍、少なくとも20倍、少なくとも30倍、少なくとも40倍、少なくとも50倍、少なくとも60倍、少なくとも70倍、少なくとも80倍、少なくとも90倍、または少なくとも100倍低減され得る。
一部の実施形態では、融合タンパク質のデアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)は、Rループの範囲内で2つ以下の核酸塩基を脱アミノ化する。一部の実施形態では、融合タンパク質のデアミナーゼは、Rループの範囲内で3つ以下の核酸塩基を脱アミノ化する。一部の実施形態では、融合タンパク質のデアミナーゼは、Rループの範囲内で2、3、4、5、6、7、8、9、または10個以下の核酸塩基を脱アミノ化する。Rループは、DNA:RNAハイブリッド、DNA:DNAまたはRNA:RNAの相補的な構造と一本鎖DNAとの会合とを含む三本鎖の核酸構造である。本明細書に用いられる際に、標的ポリヌクレオチドがCRISPR複合体または塩基編集複合体に接触する際にRループが形成され得るが、その場合、ガイドポリヌクレオチド、例えばガイドRNAの一部は、標的ポリヌクレオチド、例えば標的DNAの一部にハイブリダイズし置き換わる。一部の実施形態では、Rループは、スペーサー配列と標的DNA相補的な配列とのハイブリダイズ領域を含む。Rループ領域は、約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、または50個の核酸塩基対の長さである。一部の実施形態では、Rループ領域は約20核酸塩基対の長さである。本明細書に用いられる際に、Rループ領域はガイドポリヌクレオチドにハイブリダイズする標的DNA鎖に限定されないことを理解するべきである。例えば、Rループ領域内の標的核酸塩基の編集は、ガイドRNAに対する相補的な鎖を含むDNA鎖に対するものとしてもよいし、ガイドRNAに相補的な鎖の反対鎖であるDNA鎖に対するものとしてもよい。一部の実施形態では、Rループの領域での編集は、標的DNA配列においてガイドRNAとは非相補的な鎖(プロトスペーサー鎖)上で核酸塩基を編集することを含む。
本明細書に記載される融合タンパク質は、規準の塩基編集とは異なり、編集の枠内で、標的の脱アミノ化をもたらすことができる。一部の実施形態では、標的核酸塩基は、標的ポリヌクレオチド配列中のPAM配列より約1から約20塩基上流である。一部の実施形態では、標的核酸塩基は、標的ポリヌクレオチド配列中のPAM配列より約2から約12塩基上流である。一部の実施形態では、標的核酸塩基は、PAM配列より約1から9塩基対、約2から10塩基対、約3から11塩基対、約4から12塩基対、約5から13塩基対、約6から14塩基対、約7から15塩基対、約8から16塩基対、約9から17塩基対、約10から18塩基対、約11から19塩基対、約12から20塩基対、約1から7塩基対、約2から8塩基対、約3から9塩基対、約4から10塩基対、約5から11塩基対、約6から12塩基対、約7から13塩基対、約8から14塩基対、約9から15塩基対、約10から16塩基対、約11から17塩基対、約12から18塩基対、約13から19塩基対、約14から20塩基対、約1から5塩基対、約2から6塩基対、約3から7塩基対、約4から8塩基対、約5から9塩基対、約6から10塩基対、約7から11塩基対、約8から12塩基対、約9から13塩基対、約10から14塩基対、約11から15塩基対、約12から16塩基対、約13から17塩基対、約14から18塩基対、約15から19塩基対、約16から20塩基対、約1から3塩基対、約2から4塩基対、約3から5塩基対、約4から6塩基対、約5から7塩基対、約6から8塩基対、約7から9塩基対、約8から10塩基対、約9から11塩基対、約10から12塩基対、約11から13塩基対、約12から14塩基対、約13から15塩基対、約14から16塩基対、約15から17塩基対、約16から18塩基対、約17から19塩基対、約18から20塩基対離れているかまたは上流である。一部の実施形態では、標的核酸塩基は、PAM配列から約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、またはそれを超える数の塩基対離れているかまたは上流である。一部の実施形態では、標的核酸塩基は、PAM配列から約1、2、3、4、5、6、7、8、または9塩基対上流である。一部の実施形態では、標的核酸塩基は、PAM配列から約2、3、4、または6塩基対上流である。
融合タンパク質は、1つを超える異種ポリペプチドを含み得る。例えば、融合タンパク質は、1つもしくは複数のUGIドメインおよび/または1つもしくは複数の核局在化シグナルを追加的に含み得る。2つ以上の異種ドメインは、直列に挿入され得る。2つ以上の異種ドメインは、NapDNAbp内で直列とはならないような場所に挿入され得る。
融合タンパク質は、デアミナーゼとnapDNAbpポリペプチドとの間にリンカーを含み得る。リンカーは、ペプチドまたは非ペプチドのリンカーとし得る。例えば、リンカーは、XTEN、(GGGS)n、(GGGGS)n、(G)n、(EAAAK)n、(GGS)n、SGSETPGTSESATPESとし得る。一部の実施形態では、融合タンパク質は、N末端Cas9断片とデアミナーゼとの間にリンカーを含む。一部の実施形態では、融合タンパク質は、C末端Cas9断片とデアミナーゼとの間にリンカーを含む。一部の実施形態では、napDNAbpのN末端断片とC末端断片とは、リンカーによりデアミナーゼに接続される。一部の実施形態では、N末端断片とC末端断片とは、リンカーを用いることなくデアミナーゼドメインに接合される。一部の実施形態では、融合タンパク質は、N末端Cas9断片とデアミナーゼとの間にリンカーを含むが、C末端Cas9断片とデアミナーゼとの間にはリンカーを含まない。一部の実施形態では、融合タンパク質は、C末端Cas9断片とデアミナーゼとの間にリンカーを含むが、N末端Cas9断片とデアミナーゼとの間にリンカーを含まない。
一部の実施形態では、融合タンパク質中のnapDNAbpは、Cas12ポリペプチド、例えばCas12b/C2c1、またはその断片である。Cas12ポリペプチドは、バリアントCas12ポリペプチドとし得る。他の実施形態では、Cas12ポリペプチドのN末端断片またはC末端断片は、核酸プログラマブルDNA結合ドメインまたはRuvCドメインを含む。他の実施形態では、融合タンパク質は、Cas12ポリペプチドと触媒ドメインとの間にリンカーを含有する。他の実施形態では、リンカーのアミノ酸配列は、GGSGGSまたはGSSGSETPGTSESATPESSGである。他の実施形態では、リンカーは剛性のリンカーである。上記の態様の他の実施形態では、リンカーは、GGAGGCTCTGGAGGAAGCまたはGGCTCTTCTGGATCTGAAACACCTGGCACAAGCGAGAGCGCCACCCCTGAGAGCTCTGGCによってコードされる。
Cas12ポリペプチドのN末端断片およびC末端断片の側面に配置された異種の触媒ドメインを含む融合タンパク質も、本明細書に記載されるような方法における塩基編集に有用である。Cas12および1つまたは複数のデアミナーゼドメイン、例えば、アデノシンデアミナーゼを含むか、またはCas12配列の側面に配置されたアデノシンデアミナーゼドメインを含む融合タンパク質も、特異性および効率性の高い標的配列の塩基編集に有用である。一実施形態では、キメラCas12融合タンパク質は、Cas12ポリペプチド内に挿入された異種の触媒ドメイン(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼおよびシチジンデアミナーゼ)を含有する。一部の実施形態では、融合タンパク質は、Cas12内に挿入されたアデノシンデアミナーゼドメインとシチジンデアミナーゼドメインとを含む。一部の実施形態では、アデノシンデアミナーゼはCas12内に融合され、シチジンデアミナーゼはC末端に融合される。一部の実施形態では、アデノシンデアミナーゼはCas12内に融合され、シチジンデアミナーゼはN末端に融合される。一部の実施形態では、シチジンデアミナーゼはCas12内に融合され、アデノシンデアミナーゼはC末端に融合される。一部の実施形態では、シチジンデアミナーゼはCas12内に融合され、アデノシンデアミナーゼはN末端に融合される。アデノシンデアミナーゼとシチジンデアミナーゼとCas12とを有する融合タンパク質の例示的な構造は、以下のように示される:
NH-[Cas12(アデノシンデアミナーゼ)]-[シチジンデアミナーゼ]-COOH;
NH-[シチジンデアミナーゼ]-[Cas12(アデノシンデアミナーゼ)]-COOH;
NH-[Cas12(シチジンデアミナーゼ)]-[アデノシンデアミナーゼ]-COOH;または
NH-[アデノシンデアミナーゼ]-[Cas12(シチジンデアミナーゼ)]-COOH。
一部の実施形態では、上記の一般構造に用いられる「-」は、任意選択的なリンカーの存在を標示する。
様々な実施形態では、触媒ドメインは、DNA修飾活性(例えば、デアミナーゼ活性)、例えばアデノシンデアミナーゼ活性などを有する。一部の実施形態では、アデノシンデアミナーゼはTadA(例えば、TadA7.10)である。一部の実施形態では、TadAはTadA*8である。一部の実施形態では、TadA*8はCas12内に融合され、シチジンデアミナーゼはC末端に融合される。一部の実施形態では、TadA*8はCas12内に融合され、シチジンデアミナーゼはN末端に融合される。一部の実施形態では、シチジンデアミナーゼはCas12内に融合され、TadA*8はC末端に融合される。一部の実施形態では、シチジンデアミナーゼはCas12内に融合され、TadA*8はN末端に融合される。TadA*8とシチジンデアミナーゼとCas12とを有する融合タンパク質の例示的な構造は、以下のように示される:
N-[Cas12(TadA*8)]-[シチジンデアミナーゼ]-C;
N-[シチジンデアミナーゼ]-[Cas12(TadA*8)]-C;
N-[Cas12(シチジンデアミナーゼ)]-[TadA*8]-C;または
N-[TadA*8]-[Cas12(シチジンデアミナーゼ)]-C。
一部の実施形態では、上記の一般構造に用いられる「-」は、任意選択的なリンカーの存在を標示する。
他の実施形態では、融合タンパク質は、1つまたは複数の触媒ドメインを含有する。他の実施形態では、1つまたは複数の触媒ドメインのうち少なくとも1つが、Cas12ポリペプチド内に挿入されるか、またはCas12のN末端またはC末端で融合される。他の実施形態では、1つまたは複数の触媒ドメインのうち少なくとも1つが、Cas12ポリペプチドのループ内、アルファヘリックス領域内、非構造化部分内、または溶媒アクセス可能部分内に挿入される。他の実施形態では、Cas12ポリペプチドは、Cas12a、Cas12b、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、またはCas12iである。他の実施形態では、Cas12ポリペプチドは、バチルス・ヒサシイCas12b、バチルス・サーモアミロボランスCas12b、バチルス属V3-13Cas12b、またはアリシクロバチルス・アシディフィラスCas12bと少なくとも約85%のアミノ酸配列同一性を有する。他の実施形態では、Cas12ポリペプチドは、バチルス・ヒサシイCas12b、バチルス・サーモアミロボランスCas12b、バチルス属V3-13Cas12b、またはアリシクロバチルス・アシディフィラスCas12bと少なくとも約90%のアミノ酸配列同一性を有する。他の実施形態では、Cas12ポリペプチドは、バチルス・ヒサシイCas12b、バチルス・サーモアミロボランスCas12b、バチルス属V3-13Cas12b、またはアリシクロバチルス・アシディフィラスCas12bと少なくとも約95%のアミノ酸配列同一性を有する。他の実施形態では、Cas12ポリペプチドは、バチルス・ヒサシイCas12b、バチルス・サーモアミロボランスCas12b、バチルス属V3-13Cas12b、またはアリシクロバチルス・アシディフィラスCas12bの断片を含有するか、または本質的に成る。
他の実施形態では、触媒ドメインは、BhCas12bのアミノ酸153~154位、255~256位、306~307位、980~981位、1019~1020位、534~535位、604~605位、もしくは344~345位の間、またはCas12a、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、もしくはCas12iの対応するアミノ酸残基の間に挿入される。他の実施形態では、触媒ドメインは、BhCas12bのアミノ酸P153とS154との間に挿入される。他の実施形態では、触媒ドメインは、BhCas12bのアミノ酸K255とE256との間に挿入される。他の実施形態では、触媒ドメインは、BhCas12bのアミノ酸D980とG981との間に挿入される。他の実施形態では、触媒ドメインは、BhCas12bのアミノ酸K1019とL1020との間に挿入される。他の実施形態では、触媒ドメインは、BhCas12bのアミノ酸F534とP535との間に挿入される。他の実施形態では、触媒ドメインは、BhCas12bのアミノ酸K604とG605との間に挿入される。他の実施形態では、触媒ドメインは、BhCas12bのアミノ酸H344とF345との間に挿入される。他の実施形態では、触媒ドメインは、BvCas12bのアミノ酸147位と148位との間、248位と249位との間、299位と300位との間、991位と992位との間、もしくは1031位と1032位との間、またはCas12a、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、もしくはCas12iの対応するアミノ酸残基の間に挿入される。他の実施形態では、触媒ドメインは、BvCas12bのアミノ酸P147とD148との間に挿入される。他の実施形態では、触媒ドメインは、BvCas12bのアミノ酸G248とG249との間に挿入される。他の実施形態では、触媒ドメインは、BvCas12bのアミノ酸P299とE300との間に挿入される。他の実施形態では、触媒ドメインは、BvCas12bのアミノ酸G991とE992との間に挿入される。他の実施形態では、触媒ドメインは、BvCas12bのアミノ酸K1031とM1032との間に挿入される。他の実施形態では、触媒ドメインは、AaCas12bのアミノ酸157位と158位との間、258位と259位との間、310位と311位との間、1008位と1009位との間、もしくは1044位と1045位との間、またはCas12a、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、もしくはCas12iの対応するアミノ酸残基に挿入される。他の実施形態では、触媒ドメインは、AaCas12bのアミノ酸P157とG158との間に挿入される。他の実施形態では、触媒ドメインは、AaCas12bのアミノ酸V258とG259との間に挿入される。他の実施形態では、触媒ドメインは、AaCas12bのアミノ酸D310とP311との間に挿入される。他の実施形態では、触媒ドメインは、AaCas12bのアミノ酸G1008とE1009との間に挿入される。他の実施形態では、触媒ドメインは、AaCas12bのアミノ酸G1044とK1045との間に挿入される。
他の実施形態では、融合タンパク質は、核局在化シグナル(例えば、二部分構成の核局在化シグナル)を含有する。他の実施形態では、核局在化シグナルのアミノ酸配列は、MAPKKKRKVGIHGVPAAである。上記の態様の他の実施形態では、核局在化シグナルは、以下の配列によってコードされる:
ATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCC。他の実施形態では、Cas12bポリペプチドは、RuvCドメインの触媒活性を封じる変異を含有する。他の実施形態では、Cas12bポリペプチドは、D574A、D829Aおよび/またはD952A変異を含有する。他の実施形態では、融合タンパク質は、タグ(例えば、インフルエンザヘマグルチニンタグ)をさらに含有する。
一部の実施形態では、融合タンパク質は、内部に融合された核酸塩基編集ドメイン(例えば、デアミナーゼドメイン、例えばアデノシンデアミナーゼドメインの全部または一部)を有するnapDNAbpドメイン(例えば、Cas12由来ドメイン)を含む。一部の実施形態では、napDNAbpはCas12bである。一部の実施形態では、塩基エディターは、内部に融合されたTadA*8ドメインを下記の表Bに示される遺伝子座に挿入されて有する、BhCas12bドメインを含む。
Figure 2022545950000016
非制限的な例として、アデノシンデアミナーゼ(例えば、ABE8.13)は、BhCas12bに挿入されて、核酸配列を効果的に編集する融合タンパク質(例えば、ABE8.13-BhCas12b)を生じ得る。一部の実施形態では、本明細書に記載の塩基編集システムは、Cas9に挿入されたTadAを有するABEを含む。
PAMの排他性を低減されたCas9ドメイン
典型的には、S.ピロゲネス由来のCas9(spCas9)などのCas9タンパク質は、特定の核酸領域に結合する規準のNGG PAM配列を必要とするが、この配列では、「NGG」の「N」は、アデノシン(A)、チミジン(T)、またはシトシン(C)であり、Gはグアノシンである。これによりゲノム内の所望の塩基を編集する能力が限定され得る。一部の実施形態では、本明細書に提供される塩基編集融合タンパク質は、精確な場所、例えば、PAMの上流である標的塩基を含む領域に配される必要があることがある。例えば、その全体の内容をここに参照により組み込まれるKomor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016)を参照されたい。したがって、一部の実施形態では、本明細書に提供されるいずれかの融合タンパク質は、規準の(例えばNGG)PAM配列を含有しないヌクレオチド配列を結合することができるCas9ドメインを含有し得る。非規準のPAM配列に結合するCas9ドメインは、当技術分野に記載されており、当業者に明らかになるものとなる。例えば、非規準のPAM配列を結合するCas9ドメインは、Kleinstiver, B. P., et al., “Engineered CRISPR-Cas9 nucleases with altered PAM specificities” Nature 523, 481-485 (2015);およびKleinstiver, B. P., et al., “Broadening the targeting range of Staphylococcus aureus CRISPR-Cas9 by modifying PAM recognition” Nature Biotechnology 33, 1293-1298 (2015);Nishimasu, H., et al., “Engineered CRISPR-Cas9 nuclease with expanded targeting space” Science. 2018 Sep 21;361(6408):1259-1262, Chatterjee, P., et al., Minimal PAM specificity of a highly similar SpCas9 ortholog” Sci Adv. 2018 Oct 24;4(10):eaau0766. doi: 10.1126/sciadv.aau0766に記載されており、それぞれの全体の内容はここに参照により組み込まれる。
核酸塩基編集ドメイン
本明細書に記載されるのは、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインと核酸塩基編集ドメイン(例えば、デアミナーゼドメイン)とを含む融合タンパク質を含む塩基エディターである。塩基エディターは、標的配列を認識することのできるガイドポリヌクレオチドと相互作用することによって、標的ポリヌクレオチド配列中の1つまたは複数の塩基を編集するようにプログラムすることができる。標的配列が認識されていると、塩基エディターは、ポリヌクレオチド上に繋留され、そこでは、編集が発生するものとなり、次いで、塩基エディターのデアミナーゼドメイン構成成分は、標的塩基を編集することができる。
一部の実施形態では、核酸塩基編集ドメインは、デアミナーゼドメインを含む。本明細書に具体的に記載されるように、デアミナーゼドメインは、シトシンデアミナーゼまたはアデノシンデアミナーゼを含む。実施形態では、塩基エディターは、標的C・G塩基対をT・Aに変換するシチジン塩基エディター(例えばBE4)と、A・TをG・Cに変換するアデニン塩基エディター(例えば、ABE7.10など)とを含む。一部の実施形態では、用語「シトシンデアミナーゼ」および「シチジンデアミナーゼ」は、互換的に用いることができる。一部の実施形態では、用語「アデニンデアミナーゼ」および「アデノシンデアミナーゼ」は、互換的に用いられる。核酸塩基編集タンパク質の詳細は、国際PCT出願PCT/2017/045381(WO2018/027078)およびPCT/US2016/058344(WO2017/070632)に記載されており、そのどちらも本明細書に参照によりその全体が組み込まれている。また、全体の内容が参照によりここに組み込まれる、Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016);Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017);およびKomor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017)も参照されたい。
AからGへの編集
一部の実施形態では、本明細書に記載の塩基エディターは、アデノシンデアミナーゼを含めたデアミナーゼドメインを含み得る。そのような塩基エディターのアデノシンデアミナーゼドメインは、アデニン(A)を脱アミノ化して、グアニン(G)の塩基対形成特性を示すイノシン(I)を形成することによって、A核酸塩基からG核酸塩基への編集を促進することができる。アデノシンデアミナーゼは、デオキシリボ核酸(DNA)中でデオキシアデノシン残基のアデニンを脱アミノ化する(すなわち、アミン基を除去する)ことが可能である。
一部の実施形態では、本明細書に提供される核酸塩基エディターは、1つまたは複数のタンパク質ドメインを合わせて融合することによって作製され、それによって融合タンパク質を生成することができる。ある特定の実施形態では、本明細書に提供される融合タンパク質は、融合タンパク質の塩基編集活性を高める1つまたは複数の特徴(例えば、効率、選択性、および特異性)を含む。例えば、本明細書に提供される融合タンパク質は、ヌクレアーゼ活性の低減されたCas9ドメインを含み得る。一部の実施形態では、本明細書に提供される融合タンパク質は、ヌクレアーゼ活性を持たないCas9ドメイン(dCas9)、またはCas9ニッカーゼ(nCas9)と呼ばれる二重鎖DNA分子の一方の鎖を切断するCas9ドメインを有し得る。いかなる特定の理論に拘束されることを望む訳ではないが、触媒残基(例えば、H840)の存在により、Cas9の活性が維持されて、標的とされたAの反対のTを含有する非編集(例えば、非脱アミノ化)鎖を切断する。Cas9の触媒残基の変異(例えば、D10からA10)は、標的とされたA残基を含有する編集鎖の切断を防止する。そのようなCas9バリアントは、gRNAにより規定された標的配列に基づき、特異的な場所で一本鎖DNA切断(ニック)を生成することができ、非編集鎖の修復に繋がり、最終的な結果として非編集鎖の上でTからCへの変化を生じる。一部の実施形態では、AからGへの塩基エディターは、イノシン塩基除去修復の阻害物質、例えば、ウラシルグリコシラーゼ阻害物質(UGI)ドメインまたは触媒として不活性のイノシン特異的ヌクレアーゼをさらに含む。いかなる特定の理論に拘束されることを望む訳ではないが、UGIドメインまたは触媒として不活性のイノシン特異的ヌクレアーゼは、脱アミノ化されたアデノシン残基(例えば、イノシン)の塩基除去修復を阻害または防止することができ、塩基エディターの活性または効率を高めることができる。
アデノシンデアミナーゼを含む塩基エディターは、DNA、RNA、およびDNA-RNAハイブリッドを含む、任意のポリヌクレオチドに作用し得る。ある特定の実施形態では、アデノシンデアミナーゼを含む塩基エディターは、RNAを含むポリヌクレオチドの標的Aを脱アミノ化することができる。例えば、塩基エディターは、RNAポリヌクレオチドおよび/またはDNA-RNAハイブリッドポリヌクレオチドの標的Aを脱アミノ化することのできるアデノシンデアミナーゼドメインを含み得る。一実施形態では、塩基エディターに組み込まれたアデノシンデアミナーゼは、RNAに作用するアデノシンデアミナーゼ(ADAR、例えば、ADAR1またはADAR2)の全部または一部を含む。別の実施形態では、塩基エディターに組み込まれたアデノシンデアミナーゼは、tRNAに作用するアデノシンデアミナーゼ(ADAT)の全部または一部を含む。アデノシンデアミナーゼドメインを含む塩基エディターはまた、DNAポリヌクレオチドのA核酸塩基を脱アミノ化することを可能とし得る。一実施形態では、塩基エディターのアデノシンデアミナーゼドメインは、ADATがDNA中の標的Aを脱アミノ化することを可能にする1つまたは複数の変異を含む、ADATの全部または一部を含む。例えば、塩基エディターは、以下の変異:D108N、A106V、D147Y、E155V、L84F、H123Y、I157Fのうち1つもしくは複数を含む大腸菌由来のADAT(EcTadA)、または別のアデノシンデアミナーゼの対応する変異を含み得る。
アデノシンデアミナーゼは、任意の適した生物(例えば、大腸菌)由来とすることができる。一部の実施形態では、アデニンデアミナーゼは、本明細書に提供されるいずれかの変異(例えば、ecTadA内の変異)に対応する1つまたは複数の変異を含む天然のアデノシンデアミナーゼである。任意の相同なタンパク質内の対応する残基は、例えば、配列のアラインメントおよび相同な残基の決定によって特定することができる。本明細書に記載される任意の変異(例えば、ecTadA内に特定された任意の変異)に対応する任意の天然の(例えば、ecTadAとの相同性を有する)アデノシンデアミナーゼ内の変異が、それゆえに生成され得る。
TadA
具体的な実施形態では、TadAは、本明細書に参照によりその全体を組み込まれるPCT/US2017/045381(WO2018/027078)に記載されるTadAのうちいずれか1つである。
具体的な実施形態では、融合タンパク質は、単一の(例えば、単量体として提供される)TadA*8バリアントである。一部の実施形態では、TadA*8は、Cas9ニッカーゼに連結されている。一部の実施形態では、本発明の融合タンパク質は、ヘテロ二量体として、TadA*8バリアントに連結されている野生型TadA(TadA(wt))を含む。他の実施形態では、本発明の融合タンパク質は、ヘテロ二量体として、TadA*8バリアントに連結されているTadA*7.10を含む。一部の実施形態では、塩基エディターは、TadA*8バリアント単量体を含むABE8である。一部の実施形態では、塩基エディターは、TadA*8バリアントとTadA(wt)とのヘテロ二量体を含むABE8である。一部の実施形態では、塩基エディターは、TadA*8バリアントとTadA*7.10とのヘテロ二量体を含むABE8である。一部の実施形態では、塩基エディターは、TadA*8バリアントのヘテロ二量体を含むABE8である。一部の実施形態では、TadA*8バリアントは、表7から選択される。一部の実施形態では、ABE8は、表7から選択される。関連の配列は以下の通りである:
野生型TadA(TadA(wt))または「TadA参照配列」
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKKAQSSTD
TadA*7.10:
MSEVEFSHEYW MRHALTLAKR ARDEREVPVG AVLVLNNRVI GEGWNRAIGL HDPTAHAEIM ALRQGGLVMQ NYRLIDATLY VTFEPCVMCA GAMIHSRIGR VVFGVRNAKT GAAGSLMDVL HYPGMNHRVE ITEGILADEC AALLCYFFRM PRQVFNAQKK AQSSTD
一部の実施形態では、アデノシンデアミナーゼは、本明細書に示されるいずれかのアデノシンデアミナーゼに規定されたいずれか1つのアミノ酸配列と少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。本明細書に示されるアデノシンデアミナーゼが、1つまたは複数の変異(例えば、本明細書に示されるいずれかの変異)を含み得ることを認識するべきである。本開示は、ある特定のパーセント同一性に加えて、本明細書に記載されるいずれかの変異またはそれらの組合せを有する、任意のデアミナーゼドメインを提供する。一部の実施形態では、アデノシンデアミナーゼは、参照配列または本明細書に示されるいずれかのアデノシンデアミナーゼに比べて、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50個、またはそれを超える変異を有するアミノ酸配列を含む。一部の実施形態では、アデノシンデアミナーゼは、当技術分野に公知のまたは本明細書に記載されるいずれか1つのアミノ酸配列と比べて、少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも110、少なくとも120、少なくとも130、少なくとも140、少なくとも150、少なくとも160、または少なくとも170個同一の隣接したアミノ酸残基を有するアミノ酸配列を含む。
一部の実施形態では、TadAデアミナーゼは、完全長の大腸菌TadAデアミナーゼである。例えば、ある特定の実施形態では、アデノシンデアミナーゼは、以下のアミノ酸配列を含む:
MRRAFITGVFFLSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEI KAQKKAQSSTD。
しかし、本願において有用な追加のアデノシンデアミナーゼが当業者に明らかとなり、かつ本開示の範囲内にあることを認識するべきである。例えば、アデノシンデアミナーゼは、tRNAに作用するアデノシンデアミナーゼ(ADAT)のホモログであってもよい。限定はないが、例示的なADATホモログのアミノ酸配列は、以下の通りである:
スタフィロコッカス・アウレウスTadA:
MGSHMTNDIYFMTLAIEEAKKAAQLGEVPIGAIITKDDEVIARAHNLRETLQQPTAHAEHIAIERAAKVLGSWRLEGCTLYVTLEPCVMCAGTIVMSRIPRVVYGADDPKGGCSGS LMNLLQQSNFNHRAIVDKGVLKEACSTLLTTFFKNLRANKKSTN
バチルス・サブチリスTadA:
MTQDELYMKEAIKEAKKAEEKGEVPIGAVLVINGEIIARAHNLRETEQRSIAHAEMLVIDEACKALGTWRLEGATLYVTLEPCPMCAGAVVLSRVEKVVFGAFDPKGGCSGTLMNLLQEERFNHQAEVVSGVLEEECGGMLSAFFRELRKKKKAARKNLSE
サルモネラ・ティフィムリウム(S.ティフィムリウム)TadA:
MPPAFITGVTSLSDVELDHEYWMRHALTLAKRAWDEREVPVGAVLVHNHRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVLQNYRLLDTTLYVTLEPCVMCAGAMVHSRIGRVVFGARDAKTGAAGSLIDVLHHPGMNHRVEIIEGVLRDECATLLSDFFRMRRQEIKALKKADRAEGAGPAV
シェワネラ・プトレファシエンス(S.プトレファシエンス)TadA:
MDEYWMQVAMQMAEKAEAAGEVPVGAVLVKDGQQIATGYNLSISQHDPTAHAEILCLRSAGKKLENYRLLDATLYITLEPCAMCAGAMVHSRIARVVYGARDEKTGAAGTVVNLLQHPAFNHQVEVTSGVLAEACSAQLSRFFKRRRDEKKALKLAQRAQQGIE
ヘモフィルス・インフルエンザF3031(H.インフルエンザ)TadA:
MDAAKVRSEFDEKMMRYALELADKAEALGEIPVGAVLVDDARNIIGEGWNLSIVQSDPTΑΗAEIIALRNGAKNIQNYRLLNSTLYVTLEPCTMCAGAILHSRIKRLVFGASDYKTGAIGSRFHFFDDYKMNHTLEITSGVLAEECSQKLSTFFQKRREEKKIEKALLKSLSDK
カウロバクター・クレセンタス(C.クレセンタス)TadA:
MRTDESEDQDHRMMRLALDAARAAAEAGETPVGAVILDPSTGEVIATAGNGPIAAHDPTAHAEIAAMRAAAAKLGNYRLTDLTLVVTLEPCAMCAGAISHARIGRVVFGADDPKGGAVVHGPKFFAQPTCHWRPEVTGGVLADESADLLRGFFRARRKAKI
ジオバクター・スルフレデュセンス(G.スルフレデュセンス)TadA:
MSSLKKTPIRDDAYWMGKAIREAAKAAARDEVPIGAVIVRDGAVIGRGHNLREGSNDPSAHAEMIAIRQAARRSANWRLTGATLYVTLEPCLMCMGAIILARLERVVFGCYDPKGGAAGSLYDLSADPRLNHQVRLSPGVCQEECGTMLSDFFRDLRRRKKAKATPALF IDERKVPPEP
大腸菌TadA(ecTadA)の一実施形態は以下を含む:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
一部の実施形態では、アデノシンデアミナーゼは原核生物由来である。一部の実施形態では、アデノシンデアミナーゼは細菌由来である。一部の実施形態では、アデノシンデアミナーゼは、大腸菌、スタフィロコッカス・アウレウス、サルモネラ・ティフィムリウム、シェワネラ・プトレファシエンス、ヘモフィルス・インフルエンザ、カウロバクター・クレセンタス、またはバチルス・サブチリス由来である。一部の実施形態では、アデノシンデアミナーゼは大腸菌由来である。
一実施形態では、本発明の融合タンパク質は、TadA7.10に連結されている野生型TadAを含み、TadA7.10は、Cas9ニッカーゼに連結されている。具体的な実施形態では、融合タンパク質は、(例えば、単量体として提供される)単一のTadA7.10ドメインを含む。他の実施形態では、ABE7.10エディターは、TadA7.10とTadA(wt)とを含み、これらはヘテロ二量体を形成することができる。
一部の実施形態では、アデノシンデアミナーゼは、アミノ酸配列を含む。本明細書に示されるいずれかのアデノシンデアミナーゼに規定されたいずれか1つのアミノ酸配列と少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一である。本明細書に示されるアデノシンデアミナーゼが、1つまたは複数の変異(例えば、本明細書に示されるいずれかの変異)を含み得ることを認識するべきである。本開示は、ある特定のパーセント同一性に加えて、本明細書に記載されるいずれかの変異またはそれらの組合せを有する、任意のデアミナーゼドメインを提供する。一部の実施形態では、アデノシンデアミナーゼは、参照配列または本明細書に示されるいずれかのアデノシンデアミナーゼに比べて、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50個、またはそれを超える変異を有するアミノ酸配列を含む。一部の実施形態では、アデノシンデアミナーゼは、当技術分野に公知のまたは本明細書に記載されるいずれか1つのアミノ酸配列と比べて、少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも110、少なくとも120、少なくとも130、少なくとも140、少なくとも150、少なくとも160、または少なくとも170個同一の隣接したアミノ酸残基を有するアミノ酸配列を含む。
(例えば、TadA参照配列に基づいて)本明細書に提供される任意の変異が、他のアデノシンデアミナーゼ、例えば大腸菌TadA(ecTadA)、S.アウレウスTadA(saTadA)、または他のアデノシンデアミナーゼ(例えば、細菌アデノシンデアミナーゼ)などに導入され得ることを認識するべきである。追加のデアミナーゼを同様にアラインメントして、本明細書に提供されるように変異され得る相同なアミノ酸残基を特定してもよいことが、当業者に明らかとなろう。そのため、TadA参照配列に特定された任意の変異は、相同なアミノ酸残基を有する他のアデノシンデアミナーゼ(例えば、ecTada)に作製され得る。本明細書に提供される任意の変異が、TadA参照配列または別のアデノシンデアミナーゼにおいて個別にまたは任意の組合せで作製され得ることを認識するべきである。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にD108X変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)に対応する変異を含み、式中、Xは、野生型アデノシンデアミナーゼ内の対応するアミノ酸以外の任意のアミノ酸を標示する。一部の実施形態では、アデノシンデアミナーゼは、D108G、D108N、D108V、D108A、もしくはD108Y変異、または別のアデノシンデアミナーゼ中の対応する変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にA106X変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)に対応する変異を含み、式中、Xは、野生型アデノシンデアミナーゼ内の対応するアミノ酸以外の任意のアミノ酸を標示する。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にA106V変異を、または別のアデノシンデアミナーゼ(例えば、野生型TadAまたはecTadA)内に対応する変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にE155X変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)に対応する変異を含み、式中、Xの存在は、野生型アデノシンデアミナーゼ内の対応するアミノ酸以外の任意のアミノ酸を標示する。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にE155D、E155G、もしくはE155V変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に対応する変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にD147X変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)に対応する変異を含み、式中、Xの存在は、野生型アデノシンデアミナーゼ内の対応するアミノ酸以外の任意のアミノ酸を標示する。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にD147Y変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に対応する変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にA106X、E155X、もしくはD147X変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)に対応する変異を含み、式中、Xは、野生型アデノシンデアミナーゼ内の対応するアミノ酸以外の任意のアミノ酸を標示する。一部の実施形態では、アデノシンデアミナーゼは、E155D、E155G、またはE155V変異を含む。一部の実施形態では、アデノシンデアミナーゼはD147Yを含む。
例えば、アデノシンデアミナーゼは、TadA参照配列内にD108N、A106V、E155V、および/もしくはD147Y変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に対応する変異を含有し得る。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内に以下の変異群(変異群を「;」により区分する)を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に対応する変異を含む:D108NおよびA106V;D108NおよびE155V;D108NおよびD147Y;A106VおよびE155V;A106VおよびD147Y;E155VおよびD147Y;D108N、A106V、およびE55V;D108N、A106V、およびD147Y;D108N、E55V、およびD147Y;A106V、E55V、およびD147Y;ならびにD108N、A106V、E155V、およびD147Y。しかし、本明細書に提供される対応する変異の任意の組合せがアデノシンデアミナーゼ(例えば、ecTadA)内に作製され得ることを認識するべきである。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にH8X、T17X、L18X、W23X、L34X、W45X、R51X、A56X、E59X、E85X、M94X、I95X、V102X、F104X、A106X、R107X、D108X、K110X、M118X、N127X、A138X、F149X、M151X、R153X、Q154X、I156X、および/もしくはK157X変異のうち1つもしくは複数を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に1つもしくは複数の対応する変異を含み、式中、Xの存在は、野生型アデノシンデアミナーゼ内の対応するアミノ酸以外の任意のアミノ酸を標示する。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にH8Y、T17S、L18E、W23L、L34S、W45L、R51H、A56E、もしくはA56S、E59G、E85K、もしくはE85G、M94L、1951、V102A、F104L、A106V、R107C、もしくはR107H、もしくはR107P、D108G、もしくはD108N、もしくはD108V、もしくはD108A、もしくはD108Y、K110I、M118K、N127S、A138V、F149Y、M151V、R153C、Q154L、I156D、および/もしくはK157R変異のうち1つもしくは複数を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に1つもしくは複数の対応する変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にH8X、D108X、および/もしくはN127X変異のうち1つもしくは複数を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に1つもしくは複数の対応する変異を含み、式中、Xは、任意のアミノ酸の存在を標示する。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にH8Y、D108N、および/もしくはN127S変異のうち1つもしくは複数を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に1つもしくは複数の対応する変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にH8X、R26X、M61X、L68X、M70X、A106X、D108X、A109X、N127X、D147X、R152X、Q154X、E155X、K161X、Q163X、および/もしくはT166X変異のうち1つもしくは複数を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に対応する変異のうち1つまたは複数を含み、式中、Xは、野生型アデノシンデアミナーゼ内の対応するアミノ酸以外の任意のアミノ酸の存在を標示する。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にH8Y、R26W、M61I、L68Q、M70V、A106T、D108N、A109T、N127S、D147Y、R152C、Q154HもしくはQ154R、E155GもしくはE155VもしくはE155D、K161Q、Q163H、および/もしくはT166P変異のうち1つまたは複数を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に1つまたは複数の対応する変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列中にH8X、D108X、N127X、D147X、R152X、およびQ154Xからなる群から選択される1つ、2つ、3つ、4つ、5つ、もしくは6つの変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に対応する1つもしくは複数の変異を含み、式中、Xは、野生型アデノシンデアミナーゼ内の対応するアミノ酸以外の任意のアミノ酸の存在を標示する。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列中にH8X、M61X、M70X、D108X、N127X、Q154X、E155X、およびQ163Xからなる群から選択される1つ、2つ、3つ、4つ、5つ、6つ、7つ、もしくは8つの変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に対応する1つもしくは複数の変異を含み、式中、Xは、野生型アデノシンデアミナーゼ内の対応するアミノ酸以外の任意のアミノ酸の存在を標示する。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列中にH8X、D108X、N127X、E155X、およびT166Xからなる群から選択される1つ、2つ、3つ、4つ、もしくは5つの変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に対応する1つもしくは複数の変異を含み、式中、Xは、野生型アデノシンデアミナーゼ内の対応するアミノ酸以外の任意のアミノ酸の存在を標示する。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列中にH8X、A106X、D108Xからなる群から選択される1つ、2つ、3つ、4つ、5つ、もしくは6つの変異を、または別のアデノシンデアミナーゼ内に対応する1つもしくは複数変異を含み、式中、Xは、野生型アデノシンデアミナーゼ内の対応するアミノ酸以外の任意のアミノ酸の存在を標示する。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列中にH8X、R126X、L68X、D108X、N127X、D147X、およびE155Xからなる群から選択される1つ、2つ、3つ、4つ、5つ、6つ、7つ、もしくは8つの変異を、または別のアデノシンデアミナーゼ内に対応する1つもしくは複数の変異を含み、式中、Xは、野生型アデノシンデアミナーゼ内の対応するアミノ酸以外の任意のアミノ酸の存在を標示する。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列中にH8X、D108X、A109X、N127X、およびE155Xからなる群から選択される1つ、2つ、3つ、4つ、もしくは5つの変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に対応する1つもしくは複数の変異を含み、式中、Xは、野生型アデノシンデアミナーゼ内の対応するアミノ酸以外の任意のアミノ酸の存在を標示する。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にH8Y、D108N、N127S、D147Y、R152C、およびQ154Hからなる群から選択される1つ、2つ、3つ、4つ、5つ、もしくは6つの変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に対応する1つもしくは複数の変異を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にH8Y、M61I、M70V、D108N、N127S、Q154R、E155G、およびQ163Hからなる群から選択される1つ、2つ、3つ、4つ、5つ、6つ、7つ、もしくは8つの変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に対応する1つもしくは複数の変異を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列にH8Y、D108N、N127S、E155V、およびT166Pからなる群から選択される1つ、2つ、3つ、4つ、もしくは5つの変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に対応する1つもしくは複数の変異を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列中にH8Y、A106T、D108N、N127S、E155D、およびK161Qからなる群から選択される1つ、2つ、3つ、4つ、5つ、もしくは6つの変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に対応する1つもしくは複数の変異を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にH8Y、R126W、L68Q、D108N、N127S、D147Y、およびE155Vからなる群から選択される1つ、2つ、3つ、4つ、5つ、6つ、7つ、もしくは8つの変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に対応する1つもしくは複数の変異を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にH8Y、D108N、A109T、N127S、およびE155Gからなる群から選択される1つ、2つ、3つ、4つ、もしくは5つの変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に対応する1つもしくは複数の変異を含む。
本明細書に提供される任意の変異および任意の追加の変異(例えば、ecTadAアミノ酸配列に基づく)は、任意の他のアデノシンデアミナーゼ内に導入され得る。本明細書に提供される任意の変異が、TadA参照配列または別のアデノシンデアミナーゼ(例えばecTadA)において個別にまたは任意の組合せで作製され得る。
AからGへの核酸塩基編集タンパク質の詳細は、国際PCT出願PCT/2017/045381(WO2018/027078)およびGaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature, 551, 464-471 (2017)に記載されており、それらの全体の内容はここに参照により組み込まれる。
一部の実施形態では、アデノシンデアミナーゼは、別のアデノシンデアミナーゼ(例えば、ecTadA)内に1つまたは複数の対応する変異を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にD108N、D108G、もしくはD108V変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に対応する変異を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にA106VおよびD108N変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に対応する変異を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にR107CおよびD108N変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に対応する変異を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にH8Y、D108N、N127S、D147Y、およびQ154H変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に対応する変異を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にH8Y、R24W、D108N、N127S、D147Y、およびE155V変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に対応する変異を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にD108N、D147Y、およびE155V変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に対応する変異を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にH8Y、D108N、およびN127S変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に対応する変異を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にA106V、D108N、D147Y、およびE155V変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に対応する変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にS2X、H8X、I49X、L84X、H123X、N127X、I156Xおよび/もしくはK160X変異のうち1つもしくは複数を、または別のアデノシンデアミナーゼに1つもしくは複数の対応する変異を含み、式中、Xの存在は、野生型アデノシンデアミナーゼ内の対応するアミノ酸以外の任意のアミノ酸を標示する。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列にS2A、H8Y、I49F、L84F、H123Y、N127S、I156Fおよび/もしくはK160S変異の1つもしくは複数を、または別のアデノシンデアミナーゼに1つもしくは複数の対応する変異(例えば、ecTadA)を含む。
一部の実施形態では、アデノシンデアミナーゼは、L84X変異アデノシンデアミナーゼを含み、式中、Xは、野生型アデノシンデアミナーゼ内に対応するアミノ酸以外の任意のアミノ酸を標示する。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にL84F変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に対応する変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にH123X変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)に対応する変異を含み、式中、Xは、野生型アデノシンデアミナーゼ内の対応するアミノ酸以外の任意のアミノ酸を標示する。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にH123Y変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に対応する変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にI157X変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)に対応する変異を含み、式中、Xは、野生型アデノシンデアミナーゼ内の対応するアミノ酸以外の任意のアミノ酸を標示する。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にI157F変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に対応する変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列中にL84X、A106X、D108X、H123X、D147X、E155X、およびI156Xからなる群から選択される1つ、2つ、3つ、4つ、 5つ、6つ、もしくは7つの変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に対応する1つもしくは複数の変異を含み、式中、Xは、野生型アデノシンデアミナーゼ内の対応するアミノ酸以外の任意のアミノ酸の存在を標示する。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列中にS2X、I49X、A106X、D108X、D147X、およびE155Xからなる群から選択される1つ、2つ、3つ、4つ、 5つ、もしくは6つの変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に対応する1つもしくは複数の変異を含み、式中、Xは、野生型アデノシンデアミナーゼ内の対応するアミノ酸以外の任意のアミノ酸の存在を標示する。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列中にH8X、A106X、D108X、N127X、およびK160Xからなる群から選択される1つ、2つ、3つ、4つ、もしくは5つの変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に対応する1つもしくは複数の変異を含み、式中、Xは、野生型アデノシンデアミナーゼ内の対応するアミノ酸以外の任意のアミノ酸の存在を標示する。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列にL84F、A106V、D108N、H123Y、D147Y、E155V、およびI156Fからなる群から選択される1つ、2つ、3つ、4つ、 5つ、6つ、もしくは7つの変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に対応する1つもしくは複数の変異を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列にS2A、I49F、A106V、D108N、D147Y、およびE155Vからなる群から選択される1つ、2つ、3つ、4つ、 5つ、もしくは6つの変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にH8Y、A106T、D108N、N127S、およびK160Sからなる群から選択される1つ、2つ、3つ、4つ、もしくは5つの変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に対応する1つもしくは複数の変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にE25X、R26X、R107X、A142X、および/もしくはA143X変異のうち1つもしくは複数を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に対応する変異のうち1つまたは複数を含み、式中、Xは、野生型アデノシンデアミナーゼ内の対応するアミノ酸以外の任意のアミノ酸の存在を標示する。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にE25M、E25D、E25A、E25R、E25V、E25S、E25Y、R26G、R26N、R26Q、R26C、R26L、R26K、R107P、R07K、R107A、R107N、R107W、R107H、R107S、A142N、A142D、A142G、A143D、A143G、A143E、A143L、A143W、A143M、A143S、A143Qおよび/またはA143R変異のうち1つまたは複数を、または別のアデノシンデアミナーゼに1つもしくは複数の対応する変異(例えば、ecTadA)を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内に対応する本明細書に記載の変異のうち1つもしくは複数を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に1つもしくは複数の対応する変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にE25X変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)に対応する変異を含み、式中、Xは、野生型アデノシンデアミナーゼ内の対応するアミノ酸以外の任意のアミノ酸を標示する。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にE25M、E25D、E25A、E25R、E25V、E25S、もしくはE25Y変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に対応する変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にR26X変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)に対応する変異を含み、式中、Xは、野生型アデノシンデアミナーゼ内の対応するアミノ酸以外の任意のアミノ酸を標示する。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にR26G、R26N、R26Q、R26C、R26L、もしくはR26K変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に対応する変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にR107X変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)に対応する変異を含み、式中、Xは、野生型アデノシンデアミナーゼ内の対応するアミノ酸以外の任意のアミノ酸を標示する。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にR107P、R07K、R107A、R107N、R107W、R107H、もしくはR107S変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に対応する変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にA142X変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)に対応する変異を含み、式中、Xは、野生型アデノシンデアミナーゼ内の対応するアミノ酸以外の任意のアミノ酸を標示する。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にA142N、A142D、A142G変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に対応する変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にA143X変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)に対応する変異を含み、式中、Xは、野生型アデノシンデアミナーゼ内の対応するアミノ酸以外の任意のアミノ酸を標示する。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にA143D、A143G、A143E、A143L、A143W、A143M、A143S、A143Qおよび/もしくはA143R変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に対応する変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にH36X、N37X、P48X、I49X、R51X、M70X、N72X、D77X、E134X、S146X、Q154X、K157X、および/もしくはK161X変異のうち1つもしくは複数を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に対応する変異のうち1つまたは複数を含み、式中、Xの存在は、野生型アデノシンデアミナーゼ内の対応するアミノ酸以外の任意のアミノ酸の存在を標示する。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列にH36L、N37T、N37S、P48T、P48L、I49V、R51H、R51L、M70L、N72S、D77G、E134G、S146R、S146C、Q154H、K157N、および/もしくはK161T変異の1つもしくは複数を、または別のアデノシンデアミナーゼに1つもしくは複数の対応する変異(例えば、ecTadA)を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にH36X変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)に対応する変異を含み、式中、Xは、野生型アデノシンデアミナーゼ内の対応するアミノ酸以外の任意のアミノ酸を標示する。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にH36L変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に対応する変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にN37X変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)に対応する変異を含み、式中、Xは、野生型アデノシンデアミナーゼ内の対応するアミノ酸以外の任意のアミノ酸を標示する。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にN37TもしくはN37S変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に対応する変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にP48X変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)に対応する変異を含み、式中、Xは、野生型アデノシンデアミナーゼ内の対応するアミノ酸以外の任意のアミノ酸を標示する。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にP48TもしくはP48L変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に対応する変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にR51X変異を、または別のアデノシンデアミナーゼに対応する変異を含み、式中、Xは、野生型アデノシンデアミナーゼ内の対応するアミノ酸以外の任意のアミノ酸を標示する。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にR51HもしくはR51L変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に対応する変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にS146X変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)に対応する変異を含み、式中、Xは、野生型アデノシンデアミナーゼ内の対応するアミノ酸以外の任意のアミノ酸を標示する。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にS146RもしくはS146C変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に対応する変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にK157X変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)に対応する変異を含み、式中、Xは、野生型アデノシンデアミナーゼ内の対応するアミノ酸以外の任意のアミノ酸を標示する。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にK157N変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に対応する変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にP48X変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)に対応する変異を含み、式中、Xは、野生型アデノシンデアミナーゼ内の対応するアミノ酸以外の任意のアミノ酸を標示する。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にP48S、P48T、もしくはP48A変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に対応する変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にA142X変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)に対応する変異を含み、式中、Xは、野生型アデノシンデアミナーゼ内の対応するアミノ酸以外の任意のアミノ酸を標示する。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にA142N変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に対応する変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にW23X変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)に対応する変異を含み、式中、Xは、野生型アデノシンデアミナーゼ内の対応するアミノ酸以外の任意のアミノ酸を標示する。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にW23RもしくはW23L変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に対応する変異を含む。
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にR152X変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)に対応する変異を含み、式中、Xは、野生型アデノシンデアミナーゼ内の対応するアミノ酸以外の任意のアミノ酸を標示する。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列内にR152PもしくはR52H変異を、または別のアデノシンデアミナーゼ(例えば、ecTadA)内に対応する変異を含む。
一実施形態では、アデノシンデアミナーゼは、変異H36L、R51L、L84F、A106V、D108N、H123Y、S146C、D147Y、E155V、I156F、およびK157Nを含み得る。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列に比して以下の変異の組合せを含み、組合せの各変異は「_」により区分され、変異の各組合せは丸括弧の間にある:
(A106V_D108N)、
(R107C_D108N)、
(H8Y_D108N_N127S_D147Y_Q154H)、
(H8Y_R24W_D108N_N127S_D147Y_E155V)、
(D108N_D147Y_E155V)、
(H8Y_D108N_N127S)、
(H8Y_D108N_N127S_D147Y_Q154H)、
(A106V_D108N_D147Y_E155V)、
(D108Q_D147Y_E155V)、
(D108M_D147Y_E155V)、
(D108L_D147Y_E155V)、
(D108K_D147Y_E155V)、
(D108I_D147Y_E155V)、
(D108F_D147Y_E155V)、
(A106V_D108N_D147Y)、
(A106V_D108M_D147Y_E155V)、
(E59A_A106V_D108N_D147Y_E155V)、
(E59A触媒活性無し_A106V_D108N_D147Y_E155V)、
(L84F_A106V_D108N_H123Y_D147Y_E155V_I156Y)、
(L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(D103A_D104N)、
(G22P_D103A_D104N)、
(G22P_D103A_D104N_S138A)、
(D103A_D104N_S138A)、
(R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F)、
(E25G_R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V
_I156F)、(E25D_R26G_L84F_A106V_R107K_D108N_H123Y_A142N_A143G_D147Y_E155V_
I156F)、
(R26Q_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F)、
(E25M_R26G_L84F_A106V_R107P_D108N_H123Y_A142N_A143D_D147Y_E155V
_I156F)、
(R26C_L84F_A106V_R107H_D108N_H123Y_A142N_D147Y_E155V_I156F)、(L84F_A106V_D108N_H123Y_A142N_A143L_D147Y_E155V_I156F)、
(R26G_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F)、
(E25A_R26G_L84F_A106V_R107N_D108N_H123Y_A142N_A143E_D147Y_E155V
_I156F)、
(R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F)、
(A106V_D108N_A142N_D147Y_E155V)、
(R26G_A106V_D108N_A142N_D147Y_E155V)、
(E25D_R26G_A106V_R107K_D108N_A142N_A143G_D147Y_E155V)、
(R26G_A106V_D108N_R107H_A142N_A143D_D147Y_E155V)、
(E25D_R26G_A106V_D108N_A142N_D147Y_E155V)、
(A106V_R107K_D108N_A142N_D147Y_E155V)、
(A106V_D108N_A142N_A143G_D147Y_E155V)、
(A106V_D108N_A142N_A143L_D147Y_E155V)、
(H36L_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N)、
(N37T_P48T_M70L_L84F_A106V_D108N_H123Y_D147Y_I49V_E155V_I156F)、
(N37S_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_K161T)、
(H36L_L84F_A106V_D108N_H123Y_D147Y_Q154H_E155V_I156F)、
(N72S_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F)、
(H36L_P48L_L84F_A106V_D108N_H123Y_E134G_D147Y_E155V_I156F)、
(H36L_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_K157N)、(H36L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F)、
(L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F_K161T)、
(N37S_R51H_D77G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(R51L_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_K157N)、
(D24G_Q71R_L84F_H96L_A106V_D108N_H123Y_D147Y_E155V_I156F_K160E)、
(H36L_G67V_L84F_A106V_D108N_H123Y_S146T_D147Y_E155V_I156F)、
(Q71L_L84F_A106V_D108N_H123Y_L137M_A143E_D147Y_E155V_I156F)、
(E25G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_Q159L)、
(L84F_A91T_F104I_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(N72D_L84F_A106V_D108N_H123Y_G125A_D147Y_E155V_I156F)、
(P48S_L84F_S97C_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(W23G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(D24G_P48L_Q71R_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_Q159L)、
(L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F)、
(H36L_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_I156F
_K157N)、(N37S_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F_K161T)、
(L84F_A106V_D108N_D147Y_E155V_I156F)、
(R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N_K161T)、
(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K161T)、
(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N_K160E_K161T)、
(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N_K160E)、
(R74Q_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(R74A_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(R74Q_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(L84F_R98Q_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(L84F_A106V_D108N_H123Y_R129Q_D147Y_E155V_I156F)、
(P48S_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F)、
(P48S_A142N)、
(P48T_I49V_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F_L157N)、
(P48T_I49V_A142N)、
(H36L_P48S_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N)、
(H36L_P48S_R51L_L84F_A106V_D108N_H123Y_S146C_A142N_D147Y_E155V_I156F(H36L_P48T_I49V_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N)、
(H36L_P48T_I49V_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_I156F_K157N)、
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N)、
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_I156F_K157N)、
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_A142N_D147Y_E155V_I156F_K157N)、
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N)、
(W23R_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N)、
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F_K161T)、
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152H_E155V_I156F_K157N)、
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V_I156F_K157N)、
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V_I156F_K157N)、
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142A_S146C_D147Y_E155V
_I156F_K157N)、
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142A_S146C_D147Y_R152P_E155V_I156F_K157N)、
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F_K161T)、
(W23R_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V_I156F_K157N)、
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_R152P_E155V_I156F_K157N)。
ある特定の実施形態では、本明細書に提供される融合タンパク質は、融合タンパク質の塩基編集活性を高める1つまたは複数の特徴を含む。例えば、本明細書に提供される任意の融合タンパク質は、ヌクレアーゼ活性の低減されたCas9ドメインを含み得る。一部の実施形態では、本明細書に提供される任意の融合タンパク質は、ヌクレアーゼ活性を持たないCas9ドメイン(dCas9)、またはCas9ニッカーゼ(nCas9)と呼ばれる二重鎖DNA分子の一方の鎖を切断するCas9ドメインを有し得る。
アデノシンデアミナーゼ
一部の実施形態では、本発明の融合タンパク質はアデノシンデアミナーゼを含む。一部の実施形態では、本明細書に提供されるアデノシンデアミナーゼは、アデニンを脱アミノ化することができる。一部の実施形態では、本明細書に提供されるアデノシンデアミナーゼは、DNAのデオキシアデノシン残基中のアデニンを脱アミノ化することができる。アデノシンデアミナーゼは、任意の適した生物(例えば、大腸菌)由来としてよい。一部の実施形態では、アデニンデアミナーゼは、本明細書に提供されるいずれかの変異(例えば、ecTadA内の変異)に対応する1つまたは複数の変異を含む天然のアデノシンデアミナーゼである。当業者は、任意の相同なタンパク質中の対応する残基を、例えば、配列のアラインメントおよび相同な残基の決定によって特定することができるものとなる。したがって、当業者は、本明細書に記載されるいずれかの変異(例えば、ecTadA内に特定されたいずれかの変異)に対応する任意の天然の(例えば、ecTadAとの相同性を有する)アデノシンデアミナーゼ内の変異を生成することができるものとなる。一部の実施形態では、アデノシンデアミナーゼは原核生物由来である。一部の実施形態では、アデノシンデアミナーゼは細菌由来である。一部の実施形態では、アデノシンデアミナーゼは、大腸菌、スタフィロコッカス・アウレウス、サルモネラ・ティフィムリウム、シェワネラ・プトレファシエンス、ヘモフィルス・インフルエンザ、カウロバクター・クレセンタス、またはバチルス・サブチリス由来である。一部の実施形態では、アデノシンデアミナーゼは大腸菌由来である。
また本明細書に提供されるのは、効率(>50~60%)および特異性の増加したアデノシンデアミナーゼバリアントである。具体的には、本明細書に記載されるアデノシンデアミナーゼバリアントは、ポリヌクレオチド内の所望の塩基を編集する可能性が高く、変更を意図されない(すなわち、「バイスタンダー」の)塩基を編集する可能性が低い。一部の実施形態では、本発明の核酸塩基エディターは、以下の配列に変更を含むアデノシンデアミナーゼバリアントである:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
(TadA*7.10とも称する)。具体的な実施形態では、TadA*7.10は、下記の変更のうち1つまたは複数を含む:Y147T、Y147R、Q154S、Y123H、V82S、T166R、およびQ154R。変更Y123Hとは、Y123H TadA(野生型)に戻ったTadA*7.10内の変更H123Yを指す。他の実施形態では、TadA*7.10は、下記の変更を含む:Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y147T+Q154R;Y147T+Q154S;V82S+Q154S;およびY123H+Y147R+Q154R+I76Y。具体的な実施形態では、アデノシンデアミナーゼバリアントは、残基149、150、151、152、153、154、155、156、および157で始まるC末端に欠失を含む。
他の実施形態では、塩基エディターは、以下の変更のうち1つまたは複数を含むアデノシンデアミナーゼバリアント(例えば、TadA*8)を含む単量体である:Y147T、Y147R、Q154S、Y123H、V82S、T166R、Q154R。他の実施形態では、アデノシンデアミナーゼバリアント(TadA*8)は、以下の変更を含む単量体である:Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y147T+Q154R;Y147T+Q154S;V82S+Q154S;およびY123H+Y147R+Q154R+I76Y。他の実施形態では、塩基エディターは、野生型アデノシンデアミナーゼと、1つまたは複数の以下の変更を含むアデノシンデアミナーゼバリアントドメイン(例えば、TadA*8)とを含む、ヘテロ二量体である:Y147T、Y147R、Q154S、Y123H、V82S、T166R、Q154R。他の実施形態では、塩基エディターは、TadA*7.10ドメインと、以下の変更を含むアデノシンデアミナーゼバリアント(例えば、TadA*8)とを含む、ヘテロ二量体である:Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y147T+Q154R;Y147T+Q154S;V82S+Q154S;およびY123H+Y147R+Q154R+I76Y。
一実施形態では、アデノシンデアミナーゼは、アデノシンデアミナーゼ活性を有する以下の配列またはその断片を含むかまたはそれから実質的になるTadA*8である:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD
一部の実施形態では、TadA*8は切詰型である。一部の実施形態では、切詰型TadA*8は、完全長TadA*8に比べて1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のN末端アミノ酸残基を欠いている。一部の実施形態では、切詰型TadA*8は、完全長TadA*8に比べて1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のC末端アミノ酸残基を欠いている。一部の実施形態では、アデノシンデアミナーゼバリアントは完全長TadA*8である。
一部の実施形態では、TadA*8は、TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23、TadA*8.24、TadA*8.25、またはTadA*8.26である。
他の実施形態では、本開示の塩基エディターは、TadA*7.10、TadA参照配列に比べて以下の変更:R26C、V88A、A109S、T111R、D119N、H122N、Y147D、F149Y、T166Iおよび/もしくはD167Nのうち1つもしくは複数、または別のTadA中に対応する変異を含むアデノシンデアミナーゼバリアント(例えば、TadA*8)を含む単量体である。他の実施形態では、アデノシンデアミナーゼバリアント(TadA*8)は、TadA*7.10、TadA参照配列に比べてR26C+A109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167N;V88A+A109S+T111R+D119N+H122N+F149Y+T166I+D167N;R26C+A109S+T111R+D119N+H122N+F149Y+T166I+D167N;V88A+T111R+D119N+F149Y;およびA109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167Nからなる群から選択される変更の組合せ、または別のTadA中の対応する変異を含む、単量体である。
他の実施形態では、塩基エディターは、野生型アデノシンデアミナーゼと、TadA*7.10、TadA参照配列に比べて以下の変更:R26C、V88A、A109S、T111R、D119N、H122N、Y147D、F149Y、T166Iおよび/もしくはD167Nのうち1つもしくは複数、または別のTadA中に対応する変異を含むアデノシンデアミナーゼバリアント(例えば、TadA*8)とを含む、ヘテロ二量体である。他の実施形態では、塩基エディターは、野生型アデノシンデアミナーゼと、TadA*7.10、TadA参照配列に比べてR26C+A109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167N;V88A+A109S+T111R+D119N+H122N+F149Y+T166I+D167N;R26C+A109S+T111R+D119N+H122N+F149Y+T166I+D167N;V88A+T111R+D119N+F149Y;およびA109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167Nからなる群から選択される変更の組合せ、または別のTadA中の対応する変異を含むアデノシンデアミナーゼバリアントドメイン(例えば、TadA*8)とを含む、ヘテロ二量体である。
他の実施形態では、塩基エディターは、TadA*7.10ドメインと、TadA*7.10、TadA参照配列に比べて以下の変更:R26C、V88A、A109S、T111R、D119N、H122N、Y147D、F149Y、T166Iおよび/もしくはD167Nのうち1つもしくは複数、または別のTadA中に対応する変異を含むアデノシンデアミナーゼバリアント(例えば、TadA*8)とを含む、ヘテロ二量体である。他の実施形態では、塩基エディターは、TadA*7.10ドメインと、TadA*7.10、TadA参照配列に比べてR26C+A109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167N;V88A+A109S+T111R+D119N+H122N+F149Y+T166I+D167N;R26C+A109S+T111R+D119N+H122N+F149Y+T166I+D167N;V88A+T111R+D119N+F149Y;およびA109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167Nからなる群から選択される変更の組合せ、または別のTadA中の対応する変異を含むアデノシンデアミナーゼバリアントドメイン(例えば、TadA*8)とを含む、ヘテロ二量体である。
一部の実施形態では、TadA*8は、表5Aに示されるようなバリアントである。表5Aは、TadAアミノ酸配列内のある特定のアミノ酸位置の番号、およびTadA-7.10アデノシンデアミナーゼ内のこれらの位置に存在するアミノ酸を示す。また、表5Aは、その全体の内容を参照により本明細書に組み込まれるM. Richter et al., 2020, Nature Biotechnology, doi.org/10.1038/s41587-020-0453-zに記載されるようなファージ支援型非連続性性進化(PANCE)およびファージ支援型連続性進化(PACE)後の、TadA-7.10に比したTadAバリアント内のアミノ酸変化を示す。一部の実施形態では、TadA*8は、TadA*8a、TadA*8b、TadA*8c、TadA*8d、またはTadA*8eである。一部の実施形態では、TadA*8はTadA*8eである。
Figure 2022545950000017
一部の実施形態では、本明細書に提供されるアデノシンデアミナーゼは、アデニンを脱アミノ化することができる。一部の実施形態では、本明細書に提供されるアデノシンデアミナーゼは、DNAのデオキシアデノシン残基中のアデニンを脱アミノ化することができる。一部の実施形態では、アデニンデアミナーゼは、本明細書に提供されるいずれかの変異(例えば、ecTadA内の変異)に対応する1つまたは複数の変異を含む天然のアデノシンデアミナーゼである。当業者は、任意の相同なタンパク質内の対応する残基を、例えば、配列のアラインメントおよび相同な残基の決定によって特定することができるものとなる。したがって、当業者は、本明細書に記載されるいずれかの変異(例えば、ecTadA内に特定されたいずれかの変異)に対応する任意の天然の(例えば、ecTadAとの相同性を有する)アデノシンデアミナーゼ内の変異を生成することができるものとなる。
一部の実施形態では、NGT PAMへの特異性を有するアデノシンデアミナーゼ塩基エディターが、下記の表5Bに示されるように生成されてもよい。
Figure 2022545950000018
一部の実施形態では、NGTNバリアントはバリアント1である。一部の実施形態では、NGTNバリアントはバリアント2である。一部の実施形態では、NGTNバリアントはバリアント3である。一部の実施形態では、NGTNバリアントはバリアント4である。一部の実施形態では、NGTNバリアントはバリアント5である。一部の実施形態では、NGTNバリアントはバリアント6である。
一実施形態では、本発明の融合タンパク質は、本明細書に記載のアデノシンデアミナーゼバリアント(例えばTadA*8)に連結されている野生型TadAを含み、このバリアントは、Cas9ニッカーゼに連結されている。具体的な実施形態では、融合タンパク質は、(例えば、単量体として提供される)単一のTadA*8ドメインを含む。他の実施形態では、塩基エディターは、TadA*8とTadA(wt)とを含み、これらはヘテロ二量体を形成することができる。例示的なTadAアミノ酸配列は以下を含む:
TadA(wt):
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKKAQSSTD
TadA*7.10:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
TadA*8:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD。
一部の実施形態では、アデノシンデアミナーゼは、本明細書に示されるいずれかのアデノシンデアミナーゼに規定されたいずれか1つのアミノ酸配列と少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。本明細書に示されるアデノシンデアミナーゼが、1つまたは複数の変異(例えば、本明細書に示されるいずれかの変異)を含み得ることを認識するべきである。本開示は、ある特定のパーセント同一性に加えて、本明細書に記載されるいずれかの変異またはそれらの組合せを有する、任意のデアミナーゼドメインを提供する。一部の実施形態では、アデノシンデアミナーゼは、参照配列または本明細書に示されるいずれかのアデノシンデアミナーゼに比べて、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50個、またはそれを超える変異を有するアミノ酸配列を含む。一部の実施形態では、アデノシンデアミナーゼは、当技術分野に公知のまたは本明細書に記載されるいずれか1つのアミノ酸配列と比べて、少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも110、少なくとも120、少なくとも130、少なくとも140、少なくとも150、少なくとも160、または少なくとも170個同一の隣接したアミノ酸残基を有するアミノ酸配列を含む。
具体的な実施形態では、TadA*8は、ボールド体で示される以下の任意の位置に1つまたは複数の変異を含む。他の実施形態では、TadA*8は、下線により示される任意の位置に1つまたは複数の変異を含む:
MSEVEFSHEY WMRHALTLAK RARDEREVPV GAVLVLNNRV IGEGWNRAIG 50
LHDPTAHAEI MALRQGGLVM QNYRLIDATL YVTFEPCVMC AGAMIHSRIG 100
RVVFGVRNAK TGAAGSLMDV LHYPGMNHRV EITEGILADE CAALLCYFFR 150
MPRQVFNAQK KAQSSTD
例えば、TadA*8は、アミノ酸位置82および/または166に変更(例えば、V82S、T166R)を単独で含むか、または以下:Y147T、Y147R、Q154S、Y123H、およびQ154Rのいずれか1つもしくは複数との組合せを含む。具体的な実施形態では、以下の変更が作製される:Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y147T+Q154R;Y147T+Q154S;V82S+Q154S;およびY123H+Y147R+Q154R+I76Y。一部の実施形態では、アデノシンデアミナーゼは、TadA*8であり、以下の配列またはアデノシンデアミナーゼ活性を有するその断片を含むか、またはそれから本質的に成る:
MSEVEFSHEY WMRHALTLAK RARDEREVPV GAVLVLNNRV IGEGWNRAIG
LHDPTAHAEI MALRQGGLVM QNYRLIDATL YVTFEPCVMC AGAMIHSRIG
RVVFGVRNAK TGAAGSLMDV LHYPGMNHRV EITEGILADE CAALLCTFFR
MPRQVFNAQK KAQSSTD
一部の実施形態では、TadA*8は切詰型である。一部の実施形態では、切詰型TadA*8は、完全長TadA*8に比べて1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のN末端アミノ酸残基を欠いている。一部の実施形態では、切詰型TadA*8は、完全長TadA*8に比べて1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のC末端アミノ酸残基を欠いている。一部の実施形態では、アデノシンデアミナーゼバリアントは完全長TadA*8である。
一実施形態では、本発明の融合タンパク質は、本明細書に記載のアデノシンデアミナーゼバリアント(例えばTadA*8)に連結されている野生型TadAを含み、このバリアントは、Cas9ニッカーゼに連結されている。具体的な実施形態では、融合タンパク質は、(例えば、単量体として提供される)単一のTadA*8ドメインを含む。他の実施形態では、塩基エディターは、TadA*8とTadA(wt)とを含み、これらはヘテロ二量体を形成することができる。
CからTへの編集
一部の実施形態では、本明細書に開示される塩基エディターは、ポリヌクレオチドの標的シチジン(C)塩基を脱アミノ化してチミンの塩基対形成特性を有するウリジン(U)を産生することのできるデアミナーゼを含む融合タンパク質を含む。一部の実施形態では、例えば、ポリヌクレオチドが二本鎖(例えば、DNA)である場合、次いで、ウリジン塩基をチミジン塩基に(例えば、細胞性修復機構によって)置換して、C:GからT:Aへの遷移を起こすことができる。他の実施形態では、塩基エディターによる核酸内でのCからUへの脱アミノ化は、UからTへの置換に付随することはない。
Uを生じるためのポリヌクレオチド中の標的Cの脱アミノ化は、本明細書に記載の塩基エディターによって実行され得る塩基編集の一種の非限定的な一例である。別の例では、シチジンデアミナーゼドメインを含む塩基エディターは、シトシン(C)塩基からグアニン(G)塩基への変換を媒介することができる。例えば、塩基エディターのシチジンデアミナーゼドメインによるシチジンの脱アミノ化によって産生されるポリヌクレオチドのUは、脱塩基部位を産生する塩基除去修復機構によって(例えば、ウラシルDNAグリコシラーゼ(UDG)ドメインによって)、ポリヌクレオチドから切除することができる。次いで、脱塩基部位の反対側の核酸塩基を(例えば、塩基修復機構によって)Cなどの別の塩基に、例えば損傷乗り越えポリメラーゼによって置換することができる。脱塩基部位の反対の核酸塩基をCに置き換えるのが典型的ではあるものの、他の置換(例えば、A、G、またはT)も起こり得る。
したがって、一部の実施形態では、本明細書に記載の塩基エディターは、ポリヌクレオチド中で標的CからUに脱アミノ化することができる脱アミノ化ドメイン(例えば、シチジンデアミナーゼドメイン)を含む。さらに、下記に記載されるように、塩基エディターは、脱アミノ化の結果起こるUの変換を促進する追加のドメインを含み得るが、一部の実施形態では、この脱アミノ化は、TまたはGへのものである。例えば、シチジンデアミナーゼドメインを含む塩基エディターは、CからTへの塩基編集事象と競合するUからTへの置換を媒介する、ウラシルグリコシラーゼ阻害物質(UGI)ドメインを含み得る。別の例では、損傷乗り越えポリメラーゼが、脱塩基部位の反対のCの組込みを促進し得ることから(すなわち、CからGへの塩基編集事象と競合する脱塩基部位でのGの組込みを結果として生じる)、塩基エディターは、CからGへの塩基編集の効率を高める損傷乗り越えポリメラーゼを組み込み得る。
シチジンデアミナーゼをドメインとして含む塩基エディターは、DNA、RNA、およびDNA-RNAハイブリッドを含む任意のポリヌクレオチド中の標的Cを、脱アミノ化することができる。典型的には、シチジンデアミナーゼは、ポリヌクレオチドの一本鎖部分の状況に配置されたC核酸塩基を触媒する。一部の実施形態では、標的Cを含む全ポリヌクレオチドは一本鎖とされ得る。例えば、塩基エディター内に組み込まれたシチジンデアミナーゼは、一本鎖RNAポリヌクレオチド内で標的Cを脱アミノ化し得る。他の実施形態では、シチジンデアミナーゼドメインを含む塩基エディターは、二本鎖ポリヌクレオチドに作用し得るが、標的Cは、脱アミノ化反応時に一本鎖状態にあるポリヌクレオチドの一部に配置され得る。例えば、NAGPBドメインがCas9ドメインを含む実施形態では、いくつかのヌクレオチドは、Cas9-gRNA-標的DNA複合体の形成の間に塩基対形成されないままとされ得、結果としてCas9「Rループ複合体」を形成する。これらの塩基対形成されないヌクレオチドは、一本鎖特異的ヌクレオチドデアミナーゼ酵素(例えば、シチジンデアミナーゼ)の基質としての役割を果たす一本鎖DNAのバブルを形成し得る。
一部の実施形態では、塩基エディターのシチジンデアミナーゼは、アポリポタンパク質B mRNA編集複合体(APOBEC)ファミリーデアミナーゼの全部または一部を含み得る。APOBECは、進化的に保存されたシチジンデアミナーゼのファミリーである。このファミリーのメンバーは、CからUへの編集酵素である。APOBEC様タンパク質のN末端ドメインは触媒ドメインであるのに対し、C末端ドメインは疑似触媒ドメインである。さらに具体的には、触媒ドメインは、亜鉛依存性シチジンデアミナーゼドメインであり、シチジンの脱アミノ化に重要である。APOBECファミリーメンバーとしては、APOBEC1、APOBEC2、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D(「APOBEC3E」は今ではこれを指す)、APOBEC3F、APOBEC3G、APOBEC3H、APOBEC4、および活性化誘導型(シチジン)デアミナーゼが挙げられる。一部の実施形態では、APOBECファミリーのメンバーとしては、rAPOBEC1、rAPOBEC1にAPOBEC1配列を置き換えられたBE4、PpAPOBEC1、PpABOBEC1にAPOBEC1配列を置き換えられたBE4、H122A置換を含有するPpAPOBEC1、H122A置換を含有するPpAPOBEC1にAPOBEC1配列を置き換えられたBE4;F130L置換を含有するRrA3FにAPOBEC1配列を置き換えられたBE4;AmAPOBEC1にAPOBEC1配列を置き換えられたBE4;SsAPOBEC2にAPOBEC1配列を置き換えられたBE4が挙げられる。一部の実施形態では、塩基エディターに組み込まれたデアミナーゼは、APOBEC1デアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれたデアミナーゼは、APOBEC2デアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれたデアミナーゼは、APOBEC3デアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれたデアミナーゼは、APOBEC3Aデアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれたデアミナーゼは、APOBEC3Bデアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれたデアミナーゼは、APOBEC3Cデアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれたデアミナーゼは、APOBEC3Dデアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれたデアミナーゼは、APOBEC3Eデアミナーゼの全部または一部を含む。一 部の実施形態では、塩基エディターに組み込まれたデアミナーゼは、APOBEC3Fデアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれたデアミナーゼは、APOBEC3Gデアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれたデアミナーゼは、APOBEC3Hデアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれたデアミナーゼは、APOBEC4デアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれたデアミナーゼは、活性化誘導型デアミナーゼ(AID)の全部または一部を含む。一部の実施形態では塩基エディターに組み込まれたデアミナーゼは、シチジンデアミナーゼ1(CDA1)の全部または一部を含む。塩基エディターが任意の適した生物(例えば、ヒトまたはラット)由来のデアミナーゼを含み得ることを認識するべきである。一部の実施形態では、塩基エディターのデアミナーゼドメインは、ヒト、チンパンジー、ゴリラ、サル、ウシ、イヌ、ラット、またはマウス由来する。一部の実施形態では、塩基エディターのデアミナーゼドメインは、ラットに由来する(例えば、ラットAPOBEC1)。一部の実施形態では、塩基エディターのデアミナーゼドメインはヒトAPOBEC1である。一部の実施形態では、塩基エディターのデアミナーゼドメインはpmCDA1である。
PmCDA1のアミノ酸配列および核酸配列を本明細書中、下記に示す。
>tr|A5H718|A5H718_PETMA シトシン デアミナーゼ OS=ウミヤツメ OX=7757 PE=2 SV=1 アミノ酸配列:
MTDAEYVRIHEKLDIYTFKKQFFNNKKSVSHRCYVLFELKRRGERRACFWGYAVNKPQSGTERGIHAEIFSIRKVEEYLRDNPGQFTINWYSSWSPCADCAEKILEWYNQELRGNGHTLKIWACKLYYEKNARNQIGLWNLRDNGVGLNVMVSEHYQCCRKIFIQSSHNQLNENRWLEKTLKRAEKRRSELSIMIQVKILHTTKSPAV
核酸配列:>EF094822.1 ウミヤツメ単離PmCDA.21シトシンデアミナーゼmRNA、完全コード配列:
TGACACGACACAGCCGTGTATATGAGGAAGGGTAGCTGGATGGGGGGGGGGGGAATACGTTCAGAGAGGACATTAGCGAGCGTCTTGTTGGTGGCCTTGAGTCTAGACACCTGCAGACATGACCGACGCTGAGTACGTGAGAATCCATGAGAAGTTGGACATCTACACGTTTAAGAAACAGTTTTTCAACAACAAAAAATCCGTGTCGCATAGATGCTACGTTCTCTTTGAATTAAAACGACGGGGTGAACGTAGAGCGTGTTTTTGGGGCTATGCTGTGAATAAACCACAGAGCGGGACAGAACGTGGAATTCACGCCGAAATCTTTAGCATTAGAAAAGTCGAAGAATACCTGCGCGACAACCCCGGACAATTCACGATAAATTGGTACTCATCCTGGAGTCCTTGTGCAGATTGCGCTGAAAAGATCTTAGAATGGTATAACCAGGAGCTGCGGGGGAACGGCCACACTTTGAAAATCTGGGCTTGCAAACTCTATTACGAGAAAAATGCGAGGAATCAAATTGGGCTGTGGAACCTCAGAGATAACGGGGTTGGGTTGAATGTAATGGTAAGTGAACACTACCAATGTTGCAGGAAAATATTCATCCAATCGTCGCACAATCAATTGAATGAGAATAGATGGCTTGAGAAGACTTTGAAGCGAGCTGAAAAACGACGGAGCGAGTTGTCCATTATGATTCAGGTAAAAATACTCCACACCACTAAGAGTCCTGCTGTTTAAGAGGCTATGCGGATGGTTTTC
ヒト活性化誘導型シチジンデアミナーゼ(AID)のコード配列(CDS)のアミノ酸および核酸配列を下記に示す。
>tr|Q6QJ80|Q6QJ80_ヒト活性化誘導型シチジンデアミナーゼ OS=ヒト OX=9606 GN=AICDA PE=2 SV=1 アミノ酸配列:
MDSLLMNRRKFLYQFKNVRWAKGRRETYLCYVVKRRDSATSFSLDFGYLRNKNGCHVELL
FLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGNPNLSLRIFTARLYFCEDRK
AEPEGLRRLHRAGVQIAIMTFKAPV
ヒト活性化誘導型シチジンデアミナーゼ(AID)のコード配列(CDS)のアミノ酸配列および核酸配列を下記に示す。
>tr|Q6QJ80|Q6QJ80_ヒト活性化誘導型シチジンデアミナーゼ OS=ヒト(Homo sapiens) OX=9606 GN=AICDA PE=2 SV=1 アミノ酸配列:
MDSLLMNRRKFLYQFKNVRWAKGRRETYLCYVVKRRDSATSFSLDFGYLRNKNGCHVELL
FLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGNPNLSLRIFTARLYFCEDRK
AEPEGLRRLHRAGVQIAIMTFKAPV
核酸配列:>NG_011588.1:5001-15681 ヒト 活性化誘導型シチジンデアミナーゼ(AICDA)、12番染色体上のRefSeqGene(LRG_17):
AGAGAACCATCATTAATTGAAGTGAGATTTTTCTGGCCTGAGACTTGCAGGGAGGCAAGAAGACACTCTGGACACCACTATGGACAGGTAAAGAGGCAGTCTTCTCGTGGGTGATTGCACTGGCCTTCCTCTCAGAGCAAATCTGAGTAATGAGACTGGTAGCTATCCCTTTCTCTCATGTAACTGTCTGACTGATAAGATCAGCTTGATCAATATGCATATATATTTTTTGATCTGTCTCCTTTTCTTCTATTCAGATCTTATACGCTGTCAGCCCAATTCTTTCTGTTTCAGACTTCTCTTGATTTCCCTCTTTTTCATGTGGCAAAAGAAGTAGTGCGTACAATGTACTGATTCGTCCTGAGATTTGTACCATGGTTGAAACTAATTTATGGTAATAATATTAACATAGCAAATCTTTAGAGACTCAAATCATGAAAAGGTAATAGCAGTACTGTACTAAAAACGGTAGTGCTAATTTTCGTAATAATTTTGTAAATATTCAACAGTAAAACAACTTGAAGACACACTTTCCTAGGGAGGCGTTACTGAAATAATTTAGCTATAGTAAGAAAATTTGTAATTTTAGAAATGCCAAGCATTCTAAATTAATTGCTTGAAAGTCACTATGATTGTGTCCATTATAAGGAGACAAATTCATTCAAGCAAGTTATTTAATGTTAAAGGCCCAATTGTTAGGCAGTTAATGGCACTTTTACTATTAACTAATCTTTCCATTTGTTCAGACGTAGCTTAACTTACCTCTTAGGTGTGAATTTGGTTAAGGTCCTCATAATGTCTTTATGTGCAGTTTTTGATAGGTTATTGTCATAGAACTTATTCTATTCCTACATTTATGATTACTATGGATGTATGAGAATAACACCTAATCCTTATACTTTACCTCAATTTAACTCCTTTATAAAGAACTTACATTACAGAATAAAGATTTTTTAAAAATATATTTTTTTGTAGAGACAGGGTCTTAGCCCAGCCGAGGCTGGTCTCTAAGTCCTGGCCCAAGCGATCCTCCTGCCTGGGCCTCCTAAAGTGCTGGAATTATAGACATGAGCCATCACATCCAATATACAGAATAAAGATTTTTAATGGAGGATTTAATGTTCTTCAGAAAATTTTCTTGAGGTCAGACAATGTCAAATGTCTCCTCAGTTTACACTGAGATTTTGAAAACAAGTCTGAGCTATAGGTCCTTGTGAAGGGTCCATTGGAAATACTTGTTCAAAGTAAAATGGAAAGCAAAGGTAAAATCAGCAGTTGAAATTCAGAGAAAGACAGAAAAGGAGAAAAGATGAAATTCAACAGGACAGAAGGGAAATATATTATCATTAAGGAGGACAGTATCTGTAGAGCTCATTAGTGATGGCAAAATGACTTGGTCAGGATTATTTTTAACCCGCTTGTTTCTGGTTTGCACGGCTGGGGATGCAGCTAGGGTTCTGCCTCAGGGAGCACAGCTGTCCAGAGCAGCTGTCAGCCTGCAAGCCTGAAACACTCCCTCGGTAAAGTCCTTCCTACTCAGGACAGAAATGACGAGAACAGGGAGCTGGAAACAGGCCCCTAACCAGAGAAGGGAAGTAATGGATCAACAAAGTTAACTAGCAGGTCAGGATCACGCAATTCATTTCACTCTGACTGGTAACATGTGACAGAAACAGTGTAGGCTTATTGTATTTTCATGTAGAGTAGGACCCAAAAATCCACCCAAAGTCCTTTATCTATGCCACATCCTTCTTATCTATACTTCCAGGACACTTTTTCTTCCTTATGATAAGGCTCTCTCTCTCTCCACACACACACACACACACACACACACACACACACACACACACACAAACACACACCCCGCCAACCAAGGTGCATGTAAAAAGATGTAGATTCCTCTGCCTTTCTCATCTACACAGCCCAGGAGGGTAAGTTAATATAAGAGGGATTTATTGGTAAGAGATGATGCTTAATCTGTTTAACACTGGGCCTCAAAGAGAGAATTTCTTTTCTTCTGTACTTATTAAGCACCTATTATGTGTTGAGCTTATATATACAAAGGGTTATTATATGCTAATATAGTAATAGTAATGGTGGTTGGTACTATGGTAATTACCATAAAAATTATTATCCTTTTAAAATAAAGCTAATTATTATTGGATCTTTTTTAGTATTCATTTTATGTTTTTTATGTTTTTGATTTTTTAAAAGACAATCTCACCCTGTTACCCAGGCTGGAGTGCAGTGGTGCAATCATAGCTTTCTGCAGTCTTGAACTCCTGGGCTCAAGCAATCCTCCTGCCTTGGCCTCCCAAAGTGTTGGGATACAGTCATGAGCCACTGCATCTGGCCTAGGATCCATTTAGATTAAAATATGCATTTTAAATTTTAAAATAATATGGCTAATTTTTACCTTATGTAATGTGTATACTGGCAATAAATCTAGTTTGCTGCCTAAAGTTTAAAGTGCTTTCCAGTAAGCTTCATGTACGTGAGGGGAGACATTTAAAGTGAAACAGACAGCCAGGTGTGGTGGCTCACGCCTGTAATCCCAGCACTCTGGGAGGCTGAGGTGGGTGGATCGCTTGAGCCCTGGAGTTCAAGACCAGCCTGAGCAACATGGCAAAACGCTGTTTCTATAACAAAAATTAGCCGGGCATGGTGGCATGTGCCTGTGGTCCCAGCTACTAGGGGGCTGAGGCAGGAGAATCGTTGGAGCCCAGGAGGTCAAGGCTGCACTGAGCAGTGCTTGCGCCACTGCACTCCAGCCTGGGTGACAGGACCAGACCTTGCCTCAAAAAAATAAGAAGAAAAATTAAAAATAAATGGAAACAACTACAAAGAGCTGTTGTCCTAGATGAGCTACTTAGTTAGGCTGATATTTTGGTATTTAACTTTTAAAGTCAGGGTCTGTCACCTGCACTACATTATTAAAATATCAATTCTCAATGTATATCCACACAAAGACTGGTACGTGAATGTTCATAGTACCTTTATTCACAAAACCCCAAAGTAGAGACTATCCAAATATCCATCAACAAGTGAACAAATAAACAAAATGTGCTATATCCATGCAATGGAATACCACCCTGCAGTACAAAGAAGCTACTTGGGGATGAATCCCAAAGTCATGACGCTAAATGAAAGAGTCAGACATGAAGGAGGAGATAATGTATGCCATACGAAATTCTAGAAAATGAAAGTAACTTATAGTTACAGAAAGCAAATCAGGGCAGGCATAGAGGCTCACACCTGTAATCCCAGCACTTTGAGAGGCCACGTGGGAAGATTGCTAGAACTCAGGAGTTCAAGACCAGCCTGGGCAACACAGTGAAACTCCATTCTCCACAAAAATGGGAAAAAAAGAAAGCAAATCAGTGGTTGTCCTGTGGGGAGGGGAAGGACTGCAAAGAGGGAAGAAGCTCTGGTGGGGTGAGGGTGGTGATTCAGGTTCTGTATCCTGACTGTGGTAGCAGTTTGGGGTGTTTACATCCAAAAATATTCGTAGAATTATGCATCTTAAATGGGTGGAGTTTACTGTATGTAAATTATACCTCAATGTAAGAAAAAATAATGTGTAAGAAAACTTTCAATTCTCTTGCCAGCAAACGTTATTCAAATTCCTGAGCCCTTTACTTCGCAAATTCTCTGCACTTCTGCCCCGTACCATTAGGTGACAGCACTAGCTCCACAAATTGGATAAATGCATTTCTGGAAAAGACTAGGGACAAAATCCAGGCATCACTTGTGCTTTCATATCAACCATGCTGTACAGCTTGTGTTGCTGTCTGCAGCTGCAATGGGGACTCTTGATTTCTTTAAGGAAACTTGGGTTACCAGAGTATTTCCACAAATGCTATTCAAATTAGTGCTTATGATATGCAAGACACTGTGCTAGGAGCCAGAAAACAAAGAGGAGGAGAAATCAGTCATTATGTGGGAACAACATAGCAAGATATTTAGATCATTTTGACTAGTTAAAAAAGCAGCAGAGTACAAAATCACACATGCAATCAGTATAATCCAAATCATGTAAATATGTGCCTGTAGAAAGACTAGAGGAATAAACACAAGAATCTTAACAGTCATTGTCATTAGACACTAAGTCTAATTATTATTATTAGACACTATGATATTTGAGATTTAAAAAATCTTTAATATTTTAAAATTTAGAGCTCTTCTATTTTTCCATAGTATTCAAGTTTGACAATGATCAAGTATTACTCTTTCTTTTTTTTTTTTTTTTTTTTTTTTTGAGATGGAGTTTTGGTCTTGTTGCCCATGCTGGAGTGGAATGGCATGACCATAGCTCACTGCAACCTCCACCTCCTGGGTTCAAGCAAAGCTGTCGCCTCAGCCTCCCGGGTAGATGGGATTACAGGCGCCCACCACCACACTCGGCTAATGTTTGTATTTTTAGTAGAGATGGGGTTTCACCATGTTGGCCAGGCTGGTCTCAAACTCCTGACCTCAGAGGATCCACCTGCCTCAGCCTCCCAAAGTGCTGGGATTACAGATGTAGGCCACTGCGCCCGGCCAAGTATTGCTCTTATACATTAAAAAACAGGTGTGAGCCACTGCGCCCAGCCAGGTATTGCTCTTATACATTAAAAAATAGGCCGGTGCAGTGGCTCACGCCTGTAATCCCAGCACTTTGGGAAGCCAAGGCGGGCAGAACACCCGAGGTCAGGAGTCCAAGGCCAGCCTGGCCAAGATGGTGAAACCCCGTCTCTATTAAAAATACAAACATTACCTGGGCATGATGGTGGGCGCCTGTAATCCCAGCTACTCAGGAGGCTGAGGCAGGAGGATCCGCGGAGCCTGGCAGATCTGCCTGAGCCTGGGAGGTTGAGGCTACAGTAAGCCAAGATCATGCCAGTATACTTCAGCCTGGGCGACAAAGTGAGACCGTAACAAAAAAAAAAAAATTTAAAAAAAGAAATTTAGATCAAGATCCAACTGTAAAAAGTGGCCTAAACACCACATTAAAGAGTTTGGAGTTTATTCTGCAGGCAGAAGAGAACCATCAGGGGGTCTTCAGCATGGGAATGGCATGGTGCACCTGGTTTTTGTGAGATCATGGTGGTGACAGTGTGGGGAATGTTATTTTGGAGGGACTGGAGGCAGACAGACCGGTTAAAAGGCCAGCACAACAGATAAGGAGGAAGAAGATGAGGGCTTGGACCGAAGCAGAGAAGAGCAAACAGGGAAGGTACAAATTCAAGAAATATTGGGGGGTTTGAATCAACACATTTAGATGATTAATTAAATATGAGGACTGAGGAATAAGAAATGAGTCAAGGATGGTTCCAGGCTGCTAGGCTGCTTACCTGAGGTGGCAAAGTCGGGAGGAGTGGCAGTTTAGGACAGGGGGCAGTTGAGGAATATTGTTTTGATCATTTTGAGTTTGAGGTACAAGTTGGACACTTAGGTAAAGACTGGAGGGGAAATCTGAATATACAATTATGGGACTGAGGAACAAGTTTATTTTATTTTTTGTTTCGTTTTCTTGTTGAAGAACAAATTTAATTGTAATCCCAAGTCATCAGCATCTAGAAGACAGTGGCAGGAGGTGACTGTCTTGTGGGTAAGGGTTTGGGGTCCTTGATGAGTATCTCTCAATTGGCCTTAAATATAAGCAGGAAAAGGAGTTTATGATGGATTCCAGGCTCAGCAGGGCTCAGGAGGGCTCAGGCAGCCAGCAGAGGAAGTCAGAGCATCTTCTTTGGTTTAGCCCAAGTAATGACTTCCTTAAAAAGCTGAAGGAAAATCCAGAGTGACCAGATTATAAACTGTACTCTTGCATTTTCTCTCCCTCCTCTCACCCACAGCCTCTTGATGAACCGGAGGAAGTTTCTTTACCAATTCAAAAATGTCCGCTGGGCTAAGGGTCGGCGTGAGACCTACCTGTGCTACGTAGTGAAGAGGCGTGACAGTGCTACATCCTTTTCACTGGACTTTGGTTATCTTCGCAATAAGGTATCAATTAAAGTCGGCTTTGCAAGCAGTTTAATGGTCAACTGTGAGTGCTTTTAGAGCCACCTGCTGATGGTATTACTTCCATCCTTTTTTGGCATTTGTGTCTCTATCACATTCCTCAAATCCTTTTTTTTATTTCTTTTTCCATGTCCATGCACCCATATTAGACATGGCCCAAAATATGTGATTTAATTCCTCCCCAGTAATGCTGGGCACCCTAATACCACTCCTTCCTTCAGTGCCAAGAACAACTGCTCCCAAACTGTTTACCAGCTTTCCTCAGCATCTGAATTGCCTTTGAGATTAATTAAGCTAAAAGCATTTTTATATGGGAGAATATTATCAGCTTGTCCAAGCAAAAATTTTAAATGTGAAAAACAAATTGTGTCTTAAGCATTTTTGAAAATTAAGGAAGAAGAATTTGGGAAAAAATTAACGGTGGCTCAATTCTGTCTTCCAAATGATTTCTTTTCCCTCCTACTCACATGGGTCGTAGGCCAGTGAATACATTCAACATGGTGATCCCCAGAAAACTCAGAGAAGCCTCGGCTGATGATTAATTAAATTGATCTTTCGGCTACCCGAGAGAATTACATTTCCAAGAGACTTCTTCACCAAAATCCAGATGGGTTTACATAAACTTCTGCCCACGGGTATCTCCTCTCTCCTAACACGCTGTGACGTCTGGGCTTGGTGGAATCTCAGGGAAGCATCCGTGGGGTGGAAGGTCATCGTCTGGCTCGTTGTTTGATGGTTATATTACCATGCAATTTTCTTTGCCTACATTTGTATTGAATACATCCCAATCTCCTTCCTATTCGGTGACATGACACATTCTATTTCAGAAGGCTTTGATTTTATCAAGCACTTTCATTTACTTCTCATGGCAGTGCCTATTACTTCTCTTACAATACCCATCTGTCTGCTTTACCAAAATCTATTTCCCCTTTTCAGATCCTCCCAAATGGTCCTCATAAACTGTCCTGCCTCCACCTAGTGGTCCAGGTATATTTCCACAATGTTACATCAACAGGCACTTCTAGCCATTTTCCTTCTCAAAAGGTGCAAAAAGCAACTTCATAAACACAAATTAAATCTTCGGTGAGGTAGTGTGATGCTGCTTCCTCCCAACTCAGCGCACTTCGTCTTCCTCATTCCACAAAAACCCATAGCCTTCCTTCACTCTGCAGGACTAGTGCTGCCAAGGGTTCAGCTCTACCTACTGGTGTGCTCTTTTGAGCAAGTTGCTTAGCCTCTCTGTAACACAAGGACAATAGCTGCAAGCATCCCCAAAGATCATTGCAGGAGACAATGACTAAGGCTACCAGAGCCGCAATAAAAGTCAGTGAATTTTAGCGTGGTCCTCTCTGTCTCTCCAGAACGGCTGCCACGTGGAATTGCTCTTCCTCCGCTACATCTCGGACTGGGACCTAGACCCTGGCCGCTGCTACCGCGTCACCTGGTTCACCTCCTGGAGCCCCTGCTACGACTGTGCCCGACATGTGGCCGACTTTCTGCGAGGGAACCCCAACCTCAGTCTGAGGATCTTCACCGCGCGCCTCTACTTCTGTGAGGACCGCAAGGCTGAGCCCGAGGGGCTGCGGCGGCTGCACCGCGCCGGGGTGCAAATAGCCATCATGACCTTCAAAGGTGCGAAAGGGCCTTCCGCGCAGGCGCAGTGCAGCAGCCCGCATTCGGGATTGCGATGCGGAATGAATGAGTTAGTGGGGAAGCTCGAGGGGAAGAAGTGGGCGGGGATTCTGGTTCACCTCTGGAGCCGAAATTAAAGATTAGAAGCAGAGAAAAGAGTGAATGGCTCAGAGACAAGGCCCCGAGGAAATGAGAAAATGGGGCCAGGGTTGCTTCTTTCCCCTCGATTTGGAACCTGAACTGTCTTCTACCCCCATATCCCCGCCTTTTTTTCCTTTTTTTTTTTTTGAAGATTATTTTTACTGCTGGAATACTTTTGTAGAAAACCACGAAAGAACTTTCAAAGCCTGGGAAGGGCTGCATGAAAATTCAGTTCGTCTCTCCAGACAGCTTCGGCGCATCCTTTTGGTAAGGGGCTTCCTCGCTTTTTAAATTTTCTTTCTTTCTCTACAGTCTTTTTTGGAGTTTCGTATATTTCTTATATTTTCTTATTGTTCAATCACTCTCAGTTTTCATCTGATGAAAACTTTATTTCTCCTCCACATCAGCTTTTTCTTCTGCTGTTTCACCATTCAGAGCCCTCTGCTAAGGTTCCTTTTCCCTCCCTTTTCTTTCTTTTGTTGTTTCACATCTTTAAATTTCTGTCTCTCCCCAGGGTTGCGTTTCCTTCCTGGTCAGAATTCTTTTCTCCTTTTTTTTTTTTTTTTTTTTTTTTTTTAAACAAACAAACAAAAAACCCAAAAAAACTCTTTCCCAATTTACTTTCTTCCAACATGTTACAAAGCCATCCACTCAGTTTAGAAGACTCTCCGGCCCCACCGACCCCCAACCTCGTTTTGAAGCCATTCACTCAATTTGCTTCTCTCTTTCTCTACAGCCCCTGTATGAGGTTGATGACTTACGAGACGCATTTCGTACTTTGGGACTTTGATAGCAACTTCCAGGAATGTCACACACGATGAAATATCTCTGCTGAAGACAGTGGATAAAAAACAGTCCTTCAAGTCTTCTCTGTTTTTATTCTTCAACTCTCACTTTCTTAGAGTTTACAGAAAAAATATTTATATACGACTCTTTAAAAAGATCTATGTCTTGAAAATAGAGAAGGAACACAGGTCTGGCCAGGGACGTGCTGCAATTGGTGCAGTTTTGAATGCAACATTGTCCCCTACTGGGAATAACAGAACTGCAGGACCTGGGAGCATCCTAAAGTGTCAACGTTTTTCTATGACTTTTAGGTAGGATGAGAGCAGAAGGTAGATCCTAAAAAGCATGGTGAGAGGATCAAATGTTTTTATATCAACATCCTTTATTATTTGATTCATTTGAGTTAACAGTGGTGTTAGTGATAGATTTTTCTATTCTTTTCCCTTGACGTTTACTTTCAAGTAACACAAACTCTTCCATCAGGCCATGATCTATAGGACCTCCTAATGAGAGTATCTGGGTGATTGTGACCCCAAACCATCTCTCCAAAGCATTAATATCCAATCATGCGCTGTATGTTTTAATCAGCAGAAGCATGTTTTTATGTTTGTACAAAAGAAGATTGTTATGGGTGGGGATGGAGGTATAGACCATGCATGGTCACCTTCAAGCTACTTTAATAAAGGATCTTAAAATGGGCAGGAGGACTGTGAACAAGACACCCTAATAATGGGTTGATGTCTGAAGTAGCAAATCTTCTGGAAACGCAAACTCTTTTAAGGAAGTCCCTAATTTAGAAACACCCACAAACTTCACATATCATAATTAGCAAACAATTGGAAGGAAGTTGCTTGAATGTTGGGGAGAGGAAAATCTATTGGCTCTCGTGGGTCTCTTCATCTCAGAAATGCCAATCAGGTCAAGGTTTGCTACATTTTGTATGTGTGTGATGCTTCTCCCAAAGGTATATTAACTATATAAGAGAGTTGTGACAAAACAGAATGATAAAGCTGCGAACCGTGGCACACGCTCATAGTTCTAGCTGCTTGGGAGGTTGAGGAGGGAGGATGGCTTGAACACAGGTGTTCAAGGCCAGCCTGGGCAACATAACAAGATCCTGTCTCTCAAAAAAAAAAAAAAAAAAAAGAAAGAGAGAGGGCCGGGCGTGGTGGCTCACGCCTGTAATCCCAGCACTTTGGGAGGCCGAGCCGGGCGGATCACCTGTGGTCAGGAGTTTGAGACCAGCCTGGCCAACATGGCAAAACCCCGTCTGTACTCAAAATGCAAAAATTAGCCAGGCGTGGTAGCAGGCACCTGTAATCCCAGCTACTTGGGAGGCTGAGGCAGGAGAATCGCTTGAACCCAGGAGGTGGAGGTTGCAGTAAGCTGAGATCGTGCCGTTGCACTCCAGCCTGGGCGACAAGAGCAAGACTCTGTCTCAGAAAAAAAAAAAAAAAAGAGAGAGAGAGAGAAAGAGAACAATATTTGGGAGAGAAGGATGGGGAAGCATTGCAAGGAAATTGTGCTTTATCCAACAAAATGTAAGGAGCCAATAAGGGATCCCTATTTGTCTCTTTTGGTGTCTATTTGTCCCTAACAACTGTCTTTGACAGTGAGAAAAATATTCAGAATAACCATATCCCTGTGCCGTTATTACCTAGCAACCCTTGCAATGAAGATGA
GCAGATCCACAGGAAAACTTGAATGCACAACTGTCTTATTTTAATCTTATTGTACATAAGTTTGTAAAAGAGTTAAAAATTGTTACTTCATGTATTCATTTATATTTTATATTATTTTGCGTCTAATGATTTTTTATTAACATGATTTCCTTTTCTGATATATTGAAATGGAGTCTCAAAGCTTCATAAATTTATAACTTTAGAAATGATTCTAATAACAACGTATGTAATTGTAACATTGCAGTAATGGTGCTACGAAGCCATTTCTCTTGATTTTTAGTAAACTTTTATGACAGCAAATTTGCTTCTGGCTCACTTTCAATCAGTTAAATAAATGATAAATAATTTTGGAAGCTGTGAAGATAAAATACCAAATAAAATAATATAAAAGTGATTTATATGAAGTTAAAATAAAAAATCAGTATGATGGAATAAACTTG
本開示の態様によるCas9に融合され得る他の例示的なデアミナーゼを下記に示す。実施形態では、デアミナーゼは活性化誘導型デアミナーゼ(AID)である。一部の実施形態では、デアミナーゼはAPOBECデアミナーゼである。一部の実施形態では、それぞれの配列の活性ドメイン、例えば、局在化シグナルのないドメイン(核輸送シグナル、細胞質局在化シグナルのない核局在化配列)を用いることができることが認識されるべきである。
ヒトAID:
Figure 2022545950000019
(下線:核局在化配列;二重下線:核輸送シグナル)
マウスAID:
Figure 2022545950000020
(下線:核局在化配列;二重下線:核輸送シグナル)
イヌAID:
Figure 2022545950000021
(下線:核局在化配列;二重下線:核輸送シグナル)
ウシAID:
Figure 2022545950000022
(下線:核局在化配列;二重下線:核輸送シグナル)
ラットAID:
Figure 2022545950000023
(下線:核局在化配列;二重下線:核輸送シグナル)
clAID(イヌ(Canis lupus familiaris)):
MDSLLMKQRKFLYHFKNVRWAKGRHETYLCYVVKRRDSATSFSLDFGHLRNKSGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGYPNLSLRIFAARLYFCEDRKAEPEGLRRLHRAGVQIAIMTFKDYFYCWNTFVENREKTFKAWEGLHENSVRLSRQLRRILLPLYEVDDLRDAFRTLGL
btAID(ウシ(Bos Taurus)):
MDSLLKKQRQFLYQFKNVRWAKGRHETYLCYVVKRRDSPTSFSLDFGHLRNKAGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGYPNLSLRIFTARLYFCDKERKAEPEGLRRLHRAGVQIAIMTFKDYFYCWNTFVENHERTFKAWEGLHENSVRLSRQLRRILLPLYEVDDLRDAFRTLGL
mAID(マウス(Mus musculus)):
MDSLLMNRRKFLYQFKNVRWAKGRRETYLCYVVKRRDSATSFSLDFGYLRNKNGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGNPNLSLRIFTARLYFCEDRKAEPEGLRRLHRAGVQIAIMTFKDYFYCWNTFVENHERTFKAWEGLHENSVRLSRQLRRILLPLYEVDDLRDAFRTLGL
RrA3F(キンシコウ(Rhinopithecus roxellana))
MKPQIRDHRPNPMEAMYPHIFYFHFENLEKAYGRNETWLCFTVEIIKQYLPVPWKKGVFRNQVDPETHCHAEKCFLSWFCNNTLSPKKNYQVTWYTSWSPCPECAGEVAEFLAEHSNVKLTIYTARLYYFWDTDYQEGLRSLSEEGASVEIMDYEDFQYCWENFVYDDGEPFKRWKGLKYNFQSLTRRLREILQ
上記のRrA3F配列では、本明細書(例えば、実施例3および実施例4)に記載されるようなロイシン(L)に置換された130位のフェニルアラニン(F)アミノ酸残基、すなわちF130L変異をボールド体および下線で示す:
amAPOBEC-1(アメリカアリゲーター(Alligator mississippiensis))
MADSSEKMRGQYISRDTFEKNYKPIDGTKEAHLLCEIKWGKYGKPWLHWCQNQRMNIHAEDYFMNNIF
KAKKHPVHCYVTWYLSWSPCADCASKIVKFLEERPYLKLTIYVAQLYYHTEEENRKGLRLLRSKKVIIRVMDISDYNYCWKVFVSNQNGNEDYWPLQFDPWVKENYSRLLDIFWESKCRSPNPW
rAPOBEC-1(ラット(Rattus norvegicus)):
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLK
maAPOBEC-1(ゴールデンハムスター(Mesocricetus auratus)):
MSSETGPVVVDPTLRRRIEPHEFDAFFDQGELRKETCLLYEIRWGGRHNIWRHTGQNTSRHVEINFIEKFTSERYFYPSTRCSIVWFLSWSPCGECSKAITEFLSGHPNVTLFIYAARLYHHTDQRNRQGLRDLISRGVTIRIMTEQEYCYCWRNFVNYPPSNEVYWPRYPNLWMRLYALELYCIHLGLPPCLKIKRRHQYPLTFFRLNLQSCHYQRIPPHILWATGFI
ppAPOBEC-1(オランウータン(Pongo pygmaeus)):
MTSEKGPSTGDPTLRRRIESWEFDVFYDPRELRKETCLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERRFHSSISCSITWFLSWSPCWECSQAIREFLSQHPGVTLVIYVARLFWHMDQRNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLAFFRLHLQNCHYQTIPPHILLATGLIHPSVTWR
ppAPOBEC-1H122A(オランウータン)
MTSEKGPSTGDPTLRRRIESWEFDVFYDPRELRKETCLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERRFHSSISCSITWFLSWSPCWECSQAIREFLSQHPGVTLVIYVARLFWAMDQRNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLAFFRLHLQNCHYQTIPPHILLATGLIHPSVTWRLK
上記のppAPOBEC1配列では、122位のアミノ酸残基は、本明細書(例えば、実施例3および実施例4)に記載されるように、上記の非変異型ppAPOBEC1配列中のH122A変異を反映する。
ocAPOBEC1(アナウサギ(Oryctolagus cuniculus)):
MASEKGPSNKDYTLRRRIEPWEFEVFFDPQELRKEACLLYEIKWGASSKTWRSSGKNTTNHVEVNFLEKLTSEGRLGPSTCCSITWFLSWSPCWECSMAIREFLSQHPGVTLIIFVARLFQHMDRRNRQGLKDLVTSGVTVRVMSVSEYCYCWENFVNYPPGKAAQWPRYPPRWMLMYALELYCIILGLPPCLKISRRHQKQLTFFSLTPQYCHYKMIPPYILLATGLLQPSVPWR
mdAPOBEC-1(ハイイロジネズミオポッサム(Monodelphis domestica)):
MNSKTGPSVGDATLRRRIKPWEFVAFFNPQELRKETCLLYEIKWGNQNIWRHSNQNTSQHAEINFMEKFTAERHFNSSVRCSITWFLSWSPCWECSKAIRKFLDHYPNVTLAIFISRLYWHMDQQHRQGLKELVHSGVTIQIMSYSEYHYCWRNFVDYPQGEEDYWPKYPYLWIMLYVLELHCIILGLPPCLKISGSHSNQLALFSLDLQDCHYQKIPYNVLVATGLVQPFVTWR
ppAPOBEC-2(オランウータン):
MAQKEEAAAATEAASQNGEDLENLDDPEKLKELIELPPFEIVTGERLPANFFKFQFRNVEYSSGRNKTFLCYVVEAQGKGGQVQASRGYLEDEHAAAHAEEAFFNTILPAFDPALRYNVTWYVSSSPCAACADRIIKTLSKTKNLRLLILVGRLFMWEELEIQDALKKLKEAGCKLRIMKPQDFEYVWQNFVEQEEGESKAFQPWEDIQENFLYYEEKLADILK
btAPOBEC-2(ウシ):
MAQKEEAAAAAEPASQNGEEVENLEDPEKLKELIELPPFEIVTGERLPAHYFKFQFRNVEYSSGRNKTFLCYVVEAQSKGGQVQASRGYLEDEHATNHAEEAFFNSIMPTFDPALRYMVTWYVSSSPCAACADRIVKTLNKTKNLRLLILVGRLFMWEEPEIQAALRKLKEAGCRLRIMKPQDFEYIWQNFVEQEEGESKAFEPWEDIQENFLYYEEKLADILK
ssAPOBEC-2(イノシシ(Sus scrofa))
MDPQRLRQWPGPGPASRGGYGQRPRIRNPEEWFHELSPRTFSFHFRNLRFASGRNRSYICCQVEGKNCFFQGIFQNQVPPDPPCHAELCFLSWFQSWGLSPDEHYYVTWFISWSPCCECAAKVAQFLEENRNVSLSLSAARLYYFWKSESREGLRRLSDLGAQVGIMSFQDFQHCWNNFVHNLGMPFQPWKKLHKNYQRLVTELKQILREEPATYGSPQAQGKVRIGSTAAGLRHSHSHTRSEAHLRPNHSSRQHRILNPPREARARTCVLVDASWICYR
mAPOBEC-3-(1)(マウス):
MQPQRLGPRAGMGPFCLGCSHRKCYSPIRNLISQETFKFHFKNLGYAKGRKDTFLCYEVTRKDCDSPVSLHHGVFKNKDNIHAEICFLYWFHDKVLKVLSPREEFKITWYMSWSPCFECAEQIVRFLATHHNLSLDIFSSRLYNVQDPETQQNLCRLVQEGAQVAAMDLYEFKKCWKKFVDNGGRRFRPWKRLLTNFRYQDSKLQEILRPCYISVPSSSSSTLSNICLTKGLPETRFWVEGRRMDPLSEEEFYSQFYNQRVKHLCYYHRMKPYLCYQLEQFNGQAPLKGCLLSEKGKQHAEILFLDKIRSMELSQVTITCYLTWSPCPNCAWQLAAFKRDRPDLILHIYTSRLYFHWKRPFQKGLCSLWQSGILVDVMDLPQFTDCWTNFVNPKRPFWPWKGLEIISRRTQRRLRRIKESWGLQDLVNDFGNLQLGPPMS
マウスAPOBEC-3-(2):
Figure 2022545950000024
(イタリック体:核酸編集ドメイン)
ラットAPOBEC-3:
Figure 2022545950000025
(イタリック体:核酸編集ドメイン)
hAPOBEC-3A(ヒト):
MEASPASGPRHLMDPHIFTSNFNNGIGRHKTYLCYEVERLDNGTSVKMDQHRGFLHNQAKNLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFISWSPCFSWGCAGEVRAFLQENTHVRLRIFAARIYDYDPLYKEALQMLRDAGAQVSIMTYDEFKHCWDTFVDHQGCPFQPWDGLDEHSQALSGRLRAILQNQGN
hAPOBEC-3F(ヒト):
MKPHFRNTVERMYRDTFSYNFYNRPILSRRNTVWLCYEVKTKGPSRPRLDAKIFRGQVYSQPEHHAEMCFLSWFCGNQLPAYKCFQITWFVSWTPCPDCVAKLAEFLAEHPNVTLTISAARLYYYWERDYRRALCRLSQAGARVKIMDDEEFAYCWENFVYSEGQPFMPWYKFDDNYAFLHRTLKEILRNPMEAMYPHIFYFHFKNLRKAYGRNESWLCFTMEVVKHHSPVSWKRGVFRNQVDPETHCHAERCFLSWFCDDILSPNTNYEVTWYTSWSPCPECAGEVAEFLARHSNVNLTIFTARLYYFWDTDYQEGLRSLSQEGASVEIMGYKDFKYCWENFVYNDDEPFKPWKGLKYNFLFLDSKLQEILE
アカゲザル(Rhesus macaque)APOBEC-3G:
MVEPMDPRTFVSNFNNRPILSGLNTVWLCCEVKTKDPSGPPLDAKIFQGKVYSKAKYHPEMRFLRWFHKWRQLHHDQEYKVTWYVSWSPCTRCANSVATFLAKDPKVTLTIFVARLYYFWKPDYQQALRILCQKRGGPHATMKIMNYNEFQDCWNKFVDGRGKPFKPRNNLPKHYTLLQATLGELLRHLMDPGTFTSNFNNKPWVSGQHETYLCYKVERLHNDTWVPLNQHRGFLRNQAPNIHGFPKGRHAELCFLDLIPFWKLDGQQYRVTCFTSWSPCFSCAQEMAKFISNNEHVSLCIFAARIYDDQGRYQEGLRALHRDGAKIAMMNYSEFEYCWDTFVDRQGRPFQPWDGLDEHSQALSGRLRAI(イタリック体:核酸編集ドメイン:下線:細胞質局在化シグナル)
チンパンジーAPOBEC-3G:
Figure 2022545950000026
(イタリック体:核酸編集ドメイン:下線:細胞質局在化シグナル)
ミドリサルAPOBEC-3G:
Figure 2022545950000027
(イタリック体:核酸編集ドメイン:下線:細胞質局在化シグナル)
ヒトAPOBEC-3G:
Figure 2022545950000028
(イタリック体:核酸編集ドメイン:下線:細胞質局在化シグナル)
ヒトAPOBEC-3F:
Figure 2022545950000029
(イタリック体:核酸編集ドメイン)
ヒトAPOBEC-3B:
Figure 2022545950000030
(イタリック体:核酸編集ドメイン)
ラットAPOBEC-3B:
MQPQGLGPNAGMGPVCLGCSHRRPYSPIRNPLKKLYQQTFYFHFKNVRYAWGRKNNFLCYEVNGMDCALPVPLRQGVFRKQGHIHAELCFIYWFHDKVLRVLSPMEEFKVTWYMSWSPCSKCAEQVARFLAAHRNLSLAIFSSRLYYYLRNPNYQQKLCRLIQEGVHVAAMDLPEFKKCWNKFVDNDGQPFRPWMRLRINFSFYDCKLQEIFSRMNLLREDVFYLQFNNSHRVKPVQNRYYRRKSYLCYQLERANGQEPLKGYLLYKKGEQHVEILFLEKMRSMELSQVRITCYLTWSPCPNCARQLAAFKKDHPDLILRIYTSRLYFWRKKFQKGLCTLWRSGIHVDVMDLPQFADCWTNFVNPQRPFRPWNELEKNSWRIQRRLRRIKESWGL
ウシAPOBEC-3B:
DGWEVAFRSGTVLKAGVLGVSMTEGWAGSGHPGQGACVWTPGTRNTMNLLREVLFKQQFGNQPRVPAPYYRRKTYLCYQLKQRNDLTLDRGCFRNKKQRHAERFIDKINSLDLNPSQSYKIICYITWSPCPNCANELVNFITRNNHLKLEIFASRLYFHWIKSFKMGLQDLQNAGISVAVMTHTEFEDCWEQFVDNQSRPFQPWDKLEQYSASIRRRLQRILTAPI
チンパンジーAPOBEC-3B:
MNPQIRNPMEWMYQRTFYYNFENEPILYGRSYTWLCYEVKIRRGHSNLLWDTGVFRGQMYSQPEHHAEMCFLSWFCGNQLSAYKCFQITWFVSWTPCPDCVAKLAKFLAEHPNVTLTISAARLYYYWERDYRRALCRLSQAGARVKIMDDEEFAYCWENFVYNEGQPFMPWYKFDDNYAFLHRTLKEIIRHLMDPDTFTFNFNNDPLVLRRHQTYLCYEVERLDNGTWVLMDQHMGFLCNEAKNLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFISWSPCFSWGCAGQVRAFLQENTHVRLRIFAARIYDYDPLYKEALQMLRDAGAQVSIMTYDEFEYCWDTFVYRQGCPFQPWDGLEEHSQALSGRLRAILQVRASSLCMVPHRPPPPPQSPGPCLPLCSEPPLGSLLPTGRPAPSLPFLLTASFSFPPPASLPPLPSLSLSPGHLPVPSFHSLTSCSIQPPCSSRIRETEGWASVSKEGRDLG
ヒトAPOBEC-3C:
Figure 2022545950000031
(イタリック体:核酸編集ドメイン)
ゴリラAPOBEC-3C
Figure 2022545950000032
(イタリック体:核酸編集ドメイン)
ヒトAPOBEC-3A:
Figure 2022545950000033
(イタリック体:核酸編集ドメイン)
アカゲザルAPOBEC-3A:
Figure 2022545950000034
(イタリック体:核酸編集ドメイン)
ウシAPOBEC-3A:
Figure 2022545950000035
(イタリック体:核酸編集ドメイン)
ヒトAPOBEC-3H:
Figure 2022545950000036
(イタリック体:核酸編集ドメイン)
アカゲザルAPOBEC-3H:
MALLTAKTFSLQFNNKRRVNKPYYPRKALLCYQLTPQNGSTPTRGHLKNKKKDHAEIRFINKIKSMGLDETQCYQVTCYLTWSPCPSCAGELVDFIKAHRHLNLRIFASRLYYHWRPNYQEGLLLLCGSQVPVEVMGLPEFTDCWENFVDHKEPPSFNPSEKLEELDKNSQAIKRRLERIKSRSVDVLENGLRSLQLGPVTPSSSIRNSR
ヒトAPOBEC-3D:
Figure 2022545950000037
(イタリック体:核酸編集ドメイン)
ヒトAPOBEC-1:
MTSEKGPSTGDPTLRRRIEPWEFDVFYDPRELRKEACLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERDFHPSMSCSITWFLSWSPCWECSQAIREFLSRHPGVTLVIYVARLFWHMDQQNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLTFFRLHLQNCHYQTIPPHILLATGLIHPSVAWR
マウスAPOBEC-1:
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSVWRHTSQNTSNHVEVNFLEKFTTERYFRPNTRCSITWFLSWSPCGECSRAITEFLSRHPYVTLFIYIARLYHHTDQRNRQGLRDLISSGVTIQIMTEQEYCYCWRNFVNYPPSNEAYWPRYPHLWVKLYVLELYCIILGLPPCLKILRRKQPQLTFFTITLQTCHYQRIPPHLLWATGLK
ラットAPOBEC-1:
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLK
ヒトAPOBEC-2:
MAQKEEAAVATEAASQNGEDLENLDDPEKLKELIELPPFEIVTGERLPANFFKFQFRNVEYSSGRNKTFLCYVVEAQGKGGQVQASRGYLEDEHAAAHAEEAFFNTILPAFDPALRYNVTWYVSSSPCAACADRIIKTLSKTKNLRLLILVGRLFMWEEPEIQAALKKLKEAGCKLRIMKPQDFEYVWQNFVEQEEGESKAFQPWEDIQENFLYYEEKLADILK
マウスAPOBEC-2:
MAQKEEAAEAAAPASQNGDDLENLEDPEKLKELIDLPPFEIVTGVRLPVNFFKFQFRNVEYSSGRNKTFLCYVVEVQSKGGQAQATQGYLEDEHAGAHAEEAFFNTILPAFDPALKYNVTWYVSSSPCAACADRILKTLSKTKNLRLLILVSRLFMWEEPEVQAALKKLKEAGCKLRIMKPQDFEYIWQNFVEQEEGESKAFEPWEDIQENFLYYEEKLADILK
ラットAPOBEC-2:
MAQKEEAAEAAAPASQNGDDLENLEDPEKLKELIDLPPFEIVTGVRLPVNFFKFQFRNVEYSSGRNKTFLCYVVEAQSKGGQVQATQGYLEDEHAGAHAEEAFFNTILPAFDPALKYNVTWYVSSSPCAACADRILKTLSKTKNLRLLILVSRLFMWEEPEVQAALKKLKEAGCKLRIMKPQDFEYLWQNFVEQEEGESKAFEPWEDIQENFLYYEEKLADILK
ウシAPOBEC-2:
MAQKEEAAAAAEPASQNGEEVENLEDPEKLKELIELPPFEIVTGERLPAHYFKFQFRNVEYSSGRNKTFLCYVVEAQSKGGQVQASRGYLEDEHATNHAEEAFFNSIMPTFDPALRYMVTWYVSSSPCAACADRIVKTLNKTKNLRLLILVGRLFMWEEPEIQAALRKLKEAGCRLRIMKPQDFEYIWQNFVEQEEGESKAFEPWEDIQENFLYYEEKLADILK
ウミヤツメ CDA1(pmCDAl):
MTDAEYVRIHEKLDIYTFKKQFFNNKKSVSHRCYVLFELKRRGERRACFWGYAVNKPQSGTERGIHAEIFSIRKVEEYLRDNPGQFTINWYSSWSPCADCAEKILEWYNQELRGNGHTLKIWACKLYYEKNARNQIGLWNLRDNGVGLNVMVSEHYQCCRKIFIQSSHNQ LNENRWLEKTLKRAEKRRSELSFMIQVKILHTTKSPAV
ヒトAPOBEC3G D316R D317R:
MKPHFRNTVERMYRDTFSYNFYNRPILSRRNTVWLCYEVKTKGPSRPPLDAKIFRGQVYSELKYHPEMRFFHWFSKWRKLHRDQEYEVTWYISWSPCTKCTRDMATFLAEDPKVTLTIFVARLYYFWDPDYQEALRSLCQKRDGPRATMKFNYDEFQHCWSKFVYSQRELFEPWNNLPKYYILLHFMLGEILRHSMDPPTFTFNFNNEPWVRGRHETYLCYEVERMHNDTWVLLNQRRGFLCNQAPHKHGFLEGRHAELCFLDVIPFWKLDLDQDYRVTCFTSWSPCFSCAQEMAKFISKKHVSLCIFTARIYRRQGRCQEGLRTLAEAGAKISFTYSEFKHCWDTFVDHQGCPFQPWDGLDEHSQDLSGRLRAILQNQEN
ヒトAPOBEC3G A鎖:
MDPPTFTFNFNNEPWWGRHETYLCYEVERMHNDTWVLLNQRRGFLCNQAPHKHGFLEGRHAELCFLDVIPFWKLDLDQDYRVTCFTSWSPCFSCAQEMAKFISKNKHVSLCIFTARIYDDQGRCQEGLRTLAEAGAKISFTYSEFKHCWDTFVDHQGCPFQPWDGLD EHSQDLSGRLRAILQ
ヒトAPOBEC3G A鎖 D120R D121R:
MDPPTFTFNFNNEPWVRGRHETYLCYEVERMHNDTWVLLNQRRGFLCNQAPHKHGFLEGRHAELCFLDVIPFWKLDLDQDYRVTCFTSWSPCFSCAQEMAKFISKNKHVSLCIFTARIYRRQGRCQEGLRTLAEAGAKISFMTYSEFKHCWDTFVDHQGCPFQPWDGLDEHSQDLSGRLRAILQ
hAPOBEC-4(ヒト):
MEPIYEEYLANHGTIVKPYYWLSFSLDCSNCPYHIRTGEEARVSLTEFCQIFGFPYGTTFPQTKHLTFYELKTSSGSLVQKGHASSCTGNYIHPESMLFEMNGYLDSAIYNNDSIRHIILYSNNSPCNEANHCCISKMYNFLITYPGITLSIYFSQLYHTEMDFPASAWNREALRSLASLWPRVVLSPISGGIWHSVLHSFISGVSGSHVFQPILTGRALADRHNAYEINAITGVKPYFTDVLLQTKRNPNTKAQEALESYPLNNAFPGQFFQMPSGQLQPNLPPDLRAPVVFVLVPLRDLPPMHMGQNPNKPRNIVRHLNMPQMSFQETKDLGRLPTGRSVEIVEITEQFASSKEADEKKKKKGKK
mAPOBEC-4(マウス):
MDSLLMKQKKFLYHFKNVRWAKGRHETYLCYVVKRRDSATSCSLDFGHLRNKSGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVAEFLRWNPNLSLRIFTARLYFCEDRKAEPEGLRRLHRAGVQIGIMTFKDYFYCWNTFVENRERTFKAWEGLHENSVRLTRQLRRILLPLYEVDDLRDAFRMLGF
rAPOBEC-4(ラット):
MEPLYEEYLTHSGTIVKPYYWLSVSLNCTNCPYHIRTGEEARVPYTEFHQTFGFPWSTYPQTKHLTFYELRSSSGNLIQKGLASNCTGSHTHPESMLFERDGYLDSLIFHDSNIRHIILYSNNSPCDEANHCCISKMYNFLMNYPEVTLSVFFSQLYHTENQFPTSAWNREALRGLASLWPQVTLSAISGGIWQSILETFVSGISEGLTAVRPFTAGRTLTDRYNAYEINCITEVKPYFTDALHSWQKENQDQKVWAASENQPLHNTTPAQWQPDMSQDCRTPAVFMLVPYRDLPPIHVNPSPQKPRTVVRHLNTLQLSASKVKALRKSPSGRPVKKEEARKGSTRSQEANETNKSKWKKQTLFIKSNICHLLEREQKKIGILSSWSV
mfAPOBEC-4(カニクイザル(Macaca fascicularis)):
MEPTYEEYLANHGTIVKPYYWLSFSLDCSNCPYHIRTGEEARVSLTEFCQIFGFPYGTTYPQTKHLTFYELKTSSGSLVQKGHASSCTGNYIHPESMLFEMNGYLDSAIYNNDSIRHIILYCNNSPCNEANHCCISKVYNFLITYPGITLSIYFSQLYHTEMDFPASAWNREALRSLASLWPRVVLSPISGGIWHSVLHSFVSGVSGSHVFQPILTGRALTDRYNAYEINAITGVKPFFTDVLLHTKRNPNTKAQMALESYPLNNAFPGQSFQMTSGIPPDLRAPVVFVLLPLRDLPPMHMGQDPNKPRNIIRHLNMPQMSFQETKDLERLPTRRSVETVEITERFASSKQAEEKTKKKKGKK
pmCDA-1(ウミヤツメ):
MAGYECVRVSEKLDFDTFEFQFENLHYATERHRTYVIFDVKPQSAGGRSRRLWGYIINNPNVCHAELILMSMIDRHLESNPGVYAMTWYMSWSPCANCSSKLNPWLKNLLEEQGHTLTMHFSRIYDRDREGDHRGLRGLKHVSNSFRMGVVGRAEVKECLAEYVEASRRTLTWLDTTESMAAKMRRKLFCILVRCAGMRESGIPLHLFTLQTPLLSGRVVWWRV
pmCDA-2(ウミヤツメ):
MELREVVDCALASCVRHEPLSRVAFLRCFAAPSQKPRGTVILFYVEGAGRGVTGGHAVNYNKQGTSIHAEVLLLSAVRAALLRRRRCEDGEEATRGCTLHCYSTYSPCRDCVEYIQEFGASTGVRVVIHCCRLYELDVNRRRSEAEGVLRSLSRLGRDFRLMGPRDAIALLLGGRLANTADGESGASGNAWVTETNVVEPLVDMTGFGDEDLHAQVQRNKQIREAYANYASAVSLMLGELHVDPDKFPFLAEFLAQTSVEPSGTPRETRGRPRGASSRGPEIGRQRPADFERALGAYGLFLHPRIVSREADREEIKRDLIVVMRKHNYQGP
pmCDA-5(ウミヤツメ):
MAGDENVRVSEKLDFDTFEFQFENLHYATERHRTYVIFDVKPQSAGGRSRRLWGYIINNPNVCHAELILMSMIDRHLESNPGVYAMTWYMSWSPCANCSSKLNPWLKNLLEEQGHTLMMHFSRIYDRDREGDHRGLRGLKHVSNSFRMGVVGRAEVKECLAEYVEASRRTLTWLDTTESMAAKMRRKLFCILVRCAGMRESGMPLHLFT
yCD(サッカロマイセス・セレビジエ(Saccharomyces cerevisiae)):
MVTGGMASKWDQKGMDIAYEEAALGYKEGGVPIGGCLINNKDGSVLGRGHNMRFQKGSATLHGEISTLENCGRLEGKVYKDTTLYTTLSPCDMCTGAIIMYGIPRCVVGENVNFKSKGEKYLQTRGHEVVVVDDERCKKIMKQFIDERPQDWFEDIGE
rAPOBEC-1(デルタ177~186):
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLK
rAPOBEC-1(デルタ202~213):
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQHYQRLPPHILWATGLK
マウスAPOBEC-3:
Figure 2022545950000038
(イタリック体:核酸編集ドメイン)
本開示の一部の態様は、本明細書に記載されるいずれかの融合タンパク質のデアミナーゼドメイン触媒活性を、例えばデアミナーゼドメイン中に点変異を作製することによって調節することが、融合タンパク質(例えば、塩基エディター)の処理能力に影響を及ぼすという認識に基づく。例えば、塩基編集融合タンパク質内のデアミナーゼドメインの触媒活性を低減するが除外しない変異によって、標的残基に隣接する残基の脱アミノ化をデアミナーゼドメインが触媒する機会が起こりにくいものとなり、それによって脱アミノ化の枠が狭まるものとなる。この脱アミノ化の枠を狭める能力によって、特異的な標的残基に隣接する残基の望まない脱アミノ化を防止することができ、これにより、オフターゲット効果を減少させるかまたは防止することができる。
例えば、一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、rAPOBEC1のH121X、H122X、R126X、R126X、R118X、W90X、W90X、およびR132Xからなる群から選択される1つまたは複数の変異、または別のAPOBECデアミナーゼ中の1つもしくは複数の対応する変異を含み得るが、式中、Xは任意のアミノ酸である。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、rAPOBEC1のH121R、H122R、R126A、R126E、R118A、W90A、W90Y、およびR132Eからなる群から選択される1つもしくは複数の変異、または別のAPOBECデアミナーゼ中の1つもしくは複数の対応する変異を含み得る。
一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、hAPOBEC3GのD316X、D317X、R320X、R320X、R313X、W285X、W285X、R326Xからなる群から選択される1つもしくは複数の変異、または別のAPOBECデアミナーゼ内の1つもしくは複数の対応する変異を含み得るが、式中、Xは任意のアミノ酸である。一部の実施形態では、本明細書に提供される任意の融合タンパク質は、hAPOBEC3GのD316R、D317R、R320A、R320E、R313A、W285A、W285Y、R326Eからなる群から選択される1つもしくは複数の変異、または別のAPOBECデアミナーゼ内の1つもしくは複数の対応する変異を含むAPOBECデアミナーゼを含む。
一部の実施形態では、塩基エディターに組み込まれたAPOBECデアミナーゼは、rAPOBEC1のH121RおよびH122R変異、または別のAPOBECデアミナーゼ内の1つもしくは複数の対応する変異を含み得る。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、rAPOBEC1のR126A変異、または別のAPOBECデアミナーゼ中の1つもしくは複数の対応する変異を含む、APOBECデアミナーゼを含み得る。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、rAPOBEC1のR126E変異、または別のAPOBECデアミナーゼ中の1つもしくは複数の対応する変異を含む、APOBECデアミナーゼを含み得る。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、rAPOBEC1のR118A変異、または別のAPOBECデアミナーゼ中の1つもしくは複数の対応する変異を含む、APOBECデアミナーゼを含み得る。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、rAPOBEC1のW90A変異、または別のAPOBECデアミナーゼ中の1つもしくは複数の対応する変異を含む、APOBECデアミナーゼを含み得る。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、rAPOBEC1のW90Y変異、または別のAPOBECデアミナーゼ中の1つもしくは複数の対応する変異を含む、APOBECデアミナーゼを含み得る。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、rAPOBEC1のR132E変異、または別のAPOBECデアミナーゼ中の1つもしくは複数の対応する変異を含む、APOBECデアミナーゼを含み得る。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、rAPOBEC1のW90YおよびR126E変異、または別のAPOBECデアミナーゼ中の1つもしくは複数の対応する変異を含む、APOBECデアミナーゼを含み得る。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、rAPOBEC1のR126EおよびR132E変異、または別のAPOBECデアミナーゼ中の1つもしくは複数の対応する変異を含む、APOBECデアミナーゼを含み得る。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、rAPOBEC1のW90YおよびR132E変異、または別のAPOBECデアミナーゼ中の1つもしくは複数の対応する変異を含む、APOBECデアミナーゼを含み得る。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、rAPOBEC1のW90Y、R126E、およびR132E変異、または別のAPOBECデアミナーゼ中の1つもしくは複数の対応する変異を含む、APOBECデアミナーゼを含み得る。
一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、hAPOBEC3GのD316RおよびD317R変異、または別のAPOBECデアミナーゼ中の1つもしくは複数の対応する変異を含む、APOBECデアミナーゼを含み得る。一部の実施形態では、本明細書に提供される任意の融合タンパク質は、hAPOBEC3GのR320A変異、または別のAPOBECデアミナーゼ中の1つもしくは複数の対応する変異を含む、APOBECデアミナーゼを含む。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、hAPOBEC3GのR320E変異、または別のAPOBECデアミナーゼ中の1つもしくは複数の対応する変異を含む、APOBECデアミナーゼを含み得る。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、hAPOBEC3GのR313A変異、または別のAPOBECデアミナーゼ中の1つもしくは複数の対応する変異を含む、APOBECデアミナーゼを含み得る。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、hAPOBEC3GのW285A変異、または別のAPOBECデアミナーゼ中の1つもしくは複数の対応する変異を含む、APOBECデアミナーゼを含み得る。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、hAPOBEC3GのW285Y変異、または別のAPOBECデアミナーゼ中の1つもしくは複数の対応する変異を含む、APOBECデアミナーゼを含み得る。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、hAPOBEC3GのR326E変異、または別のAPOBECデアミナーゼ中の1つもしくは複数の対応する変異を含む、APOBECデアミナーゼを含み得る。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、hAPOBEC3GのW285YおよびR320E変異、または別のAPOBECデアミナーゼ中の1つもしくは複数の対応する変異を含む、APOBECデアミナーゼを含み得る。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、hAPOBEC3GのR320EおよびR326E変異、または別のAPOBECデアミナーゼ中の1つもしくは複数の対応する変異を含む、APOBECデアミナーゼを含み得る。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、hAPOBEC3GのW285YおよびR326E変異、または別のAPOBECデアミナーゼ中の1つもしくは複数の対応する変異を含む、APOBECデアミナーゼを含み得る。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、hAPOBEC3GのW285Y、R320E、およびR326E変異、または別のAPOBECデアミナーゼ中の1つもしくは複数の対応する変異を含む、APOBECデアミナーゼを含み得る。
複数の改変型シチジンデアミナーゼが商業的に利用可能であり、そのようなものとしては、以下に限定されないが、SaBE3、SaKKH-BE3、VQR-BE3、EQR-BE3、VRER-BE3、YE1-BE3、EE-BE3、YE2-BE3、およびYEE-BE3が挙げられ、それらはAdd遺伝子(プラスミド85169、85170、85171、85172、85173、85174、85175、85176、85177)から入手可能である。一部の実施形態では、塩基エディターに組み込まれたデアミナーゼは、APOBEC1デアミナーゼの全部または一部を含む。
CからTへの核酸塩基編集タンパク質の詳細は、国際PCT出願PCT/US2016/058344(WO2017/070632)およびKomor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016)に記載されており、それらの全体の内容はここに参照により組み込まれる。
本明細書に提供される融合タンパク質は、シチジンデアミナーゼを含む。一部の実施形態では、本明細書に提供されるシチジンデアミナーゼは、シトシンまたは5-メチルシトシンからウラシルまたはチミンに脱アミノ化することができる。一部の実施形態では、本明細書に提供されるシチジンデアミナーゼは、DNA中でシトシンを脱アミノ化することができる。シチジンデアミナーゼは、任意の適した生物を由来としてもよい。一部の実施形態では、シチジンデアミナーゼは、本明細書に提供される任意の変異に対応する1つまたは複数の変異を含む天然のシチジンデアミナーゼである。一部の実施形態では、シチジンデアミナーゼは、5’-NGC-3’PAMへの特異性を有し、本明細書の実施例4および実施例5に記載されるような変異を含むことがある。一部の実施形態では、記載されるような5’-NGC-3’PAMへの特異性を有するシチジンデアミナーゼを含む塩基エディターが提供される。当業者は、任意の相同なタンパク質内の対応する残基を、例えば、配列のアラインメントおよび相同な残基の決定によって特定することができるものとなる。したがって、当業者は、本明細書に記載されるいずれかの変異に対応する任意の天然のシチジンデアミナーゼ内の変異を生成することができるものとなる。一部の実施形態では、シチジンデアミナーゼは原核生物由来である。一部の実施形態では、シチジンデアミナーゼは細菌由来である。一部の実施形態では、シチジンデアミナーゼは哺乳動物(例えばヒト)由来である。
一部の実施形態では、シチジンデアミナーゼは、本明細書に規定されたシチジンデアミナーゼのアミノ酸配列のうちいずれか1つに少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。本明細書に示されるシチジンデアミナーゼが、1つまたは複数の変異(例えば、本明細書に示されるいずれかの変異)を含み得ることを認識するべきである。本開示は、ある特定のパーセント同一性に加えて、本明細書に記載されるいずれかの変異またはそれらの組合せを有する、任意のデアミナーゼドメインを提供する。一部の実施形態では、シチジンデアミナーゼは、参照配列または本明細書に示されるいずれかのシチジンデアミナーゼに比べて、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50個、またはそれを超える変異を有するアミノ酸配列を含む。一部の実施形態では、シチジンデアミナーゼは、当技術分野に公知のまたは本明細書に記載されるいずれか1つのアミノ酸配列と比べて、少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも110、少なくとも120、少なくとも130、少なくとも140、少なくとも150、少なくとも160、または少なくとも170個同一の隣接したアミノ酸残基を有するアミノ酸配列を含む。
本発明の融合タンパク質は、2つ以上の核酸編集ドメインを含む。一部の実施形態では、核酸編集ドメインは、CからUへの塩基変化を触媒し得る。一部の実施形態では、核酸編集ドメインはデアミナーゼドメインである。一部の実施形態では、デアミナーゼは、シチジンデアミナーゼまたはアデノシンデアミナーゼである。一部の実施形態では、デアミナーゼは、アポリポタンパク質B mRNA編集複合体(APOBEC)ファミリーデアミナーゼである。一部の実施形態では、デアミナーゼはAPOBEC1デアミナーゼである。一部の実施形態では、デアミナーゼはAPOBEC2デアミナーゼである。一部の実施形態では、デアミナーゼはAPOBEC3デアミナーゼである。一部の実施形態では、デアミナーゼはAPOBEC3Aデアミナーゼである。一部の実施形態では、デアミナーゼはAPOBEC3Bデアミナーゼである。一部の実施形態では、デアミナーゼはAPOBEC3Cデアミナーゼである。一部の実施形態では、デアミナーゼはAPOBEC3Dデアミナーゼである。一部の実施形態では、デアミナーゼはAPOBEC3Eデアミナーゼである。一部の実施形態では、デアミナーゼはAPOBEC3Fデアミナーゼである。一部の実施形態では、デアミナーゼはAPOBEC3Gデアミナーゼである。一部の実施形態では、デアミナーゼはAPOBEC3Hデアミナーゼである。一部の実施形態では、デアミナーゼはAPOBEC4デアミナーゼである。一部の実施形態では、デアミナーゼは活性化誘導型デアミナーゼ(AID)である。一部の実施形態では、デアミナーゼは脊椎動物デアミナーゼである。一部の実施形態では、デアミナーゼは無脊椎動物デアミナーゼである。一部の実施形態では、デアミナーゼはヒト、チンパンジー、ゴリラ、サル、ウシ、イヌ、ラット、またはマウスのデアミナーゼである。一部の実施形態では、デアミナーゼはヒトデアミナーゼである。一部の実施形態では、デアミナーゼはラットデアミナーゼであり、例えば、rAPOBEClである。一部の実施形態では、デアミナーゼは、ウミヤツメ(Petromyzon marinus)シチジンデアミナーゼ1(pmCDAl)である。一部の実施形態では、デアミナーゼはヒトAPOBEC3Gである。一部の実施形態では、デアミナーゼはヒトAPOBEC3Gの断片である。一部の実施形態では、デアミナーゼは、D316R D317R変異を含むヒトAPOBEC3Gバリアントである。一部の実施形態では、デアミナーゼは、ヒトAPOBEC3Gの断片であり、D316R D317R変異に対応する変異を含む。一部の実施形態では、核酸編集ドメインは、本明細書に記載される任意のデアミナーゼのデアミナーゼドメインと少なくとも80%、少なくとも85%、少なくとも90%、少なくとも92%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%)、または少なくとも99.5%同一である。
ある特定の実施形態では、本明細書に提供される融合タンパク質は、融合タンパク質の塩基編集活性を高める1つまたは複数の特徴を含む。例えば、本明細書に提供される任意の融合タンパク質は、ヌクレアーゼ活性の低減されたCas9ドメインを含み得る。一部の実施形態では、本明細書に提供される任意の融合タンパク質は、ヌクレアーゼ活性を持たないCas9ドメイン(dCas9)、またはCas9ニッカーゼ(nCas9)と呼ばれる二重鎖DNA分子の一方の鎖を切断するCas9ドメインを有し得る。
ガイドRNAを含むCas9複合体
本開示の一部の態様は、本明細書に提供される任意の融合タンパク質と、融合タンパク質のCas9ドメイン(例えば、dCas9、ヌクレアーゼ活性のCas9、またはCas9ニッカーゼ)に結合されているガイドRNAとを含む、複合体を提供する。一部の実施形態では、ガイド核酸(例えば、ガイドRNA)は、15~100ヌクレオチドの長さであり、標的配列に相補的な少なくとも10個の隣接したヌクレオチドの配列を含む。一部の実施形態では、ガイドRNAは、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、または50ヌクレオチドの長さである。一部の実施形態では、ガイドRNAは、標的配列に相補的な15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、または40個の隣接したヌクレオチドの配列を含む。一部の実施形態では、標的配列はDNA配列である。一部の実施形態では、標的配列は、細菌、酵母、真菌、昆虫、植物、または動物のゲノム内の配列である。一部の実施形態では、標的配列は、ヒトのゲノム内の配列である。一部の実施形態では、標的配列の3’端は、規準のPAM配列(NGG)のすぐ隣である。一部の実施形態では、標的配列の3’端は、非規準のPAM配列(例えば、表1に挙げられた配列または5’-NAA-3’)のすぐ隣である。一部の実施形態では、ガイド核酸(例えば、ガイドRNA)は、目的の遺伝子(例えば、疾患または障害に関連する遺伝子)内の配列に相補的である。
本開示の一部の態様は、本明細書に提供される融合タンパク質または複合体を用いる方法を提供する。例えば、本開示の一部の態様は、本明細書に提供されるいずれかの融合タンパク質に、および少なくとも1つのガイドRNAに、DNA分子を接触することを含む方法を提供し、この場合、ガイドRNAは、約15~100ヌクレオチドの長さであり、標的配列に相補的な少なくとも10個の隣接したヌクレオチドの配列を含む。一部の実施形態では、標的配列の3’端は、AGC、GAG、TTT、GTG、またはCAA配列のすぐ隣である。一部の実施形態では、標的配列の3’端は、NGA、NGCG、NGN、NNGRRT、NNNRRT、NGCG、NGCN、NGTN、NGTN、NGTN、または5’(TTTV)配列のすぐ隣である。
それぞれの配列内の特異的な位置または残基の数が具体的なタンパク質および用いる付番スキームに依存することが理解されよう。付番は、例えば、成熟タンパク質の前駆体と成熟タンパク質自体とで異なる可能性があり、種間の配列の差異は、付番に影響を及ぼすことがある。当業者は、当技術分野に周知される方法によって、例えば、配列のアラインメントおよび相同な残基の決定によって、任意の相同なタンパク質およびその各コード核酸の各残基を特定することができるものとなる。
標的部位、例えば、編集する変異を含む部位を標的として本明細書に開示される任意の融合タンパク質を向けるために、典型的には、融合タンパク質をガイドRNAと併せて共発現することが必要であることが、当業者に明らかとなろう。本明細書の他の箇所にさらに詳細に説明されているように、ガイドRNAは、典型的にはCas9の結合を可能にするtracrRNAフレームワークと、Cas9:核酸編集酵素/ドメイン融合タンパク質に配列特異性を付与するガイド配列とを含む。あるいは、ガイドRNAとtracrRNAとは、2つの核酸分子として別々に提供されてもよい。一部の実施形態では、ガイドRNAは、ガイド配列が標的配列に相補的な配列を含むという構造を含む。ガイド配列は、典型的には、20ヌクレオチドの長さである。特異的なゲノム標的部位を標的としてCas9:核酸編集酵素/ドメイン融合タンパク質を向けるのに適したガイドRNAの配列は、本開示に基づき当業者に明らかになろう。そのような適したガイドRNA配列は、典型的には、編集する標的ヌクレオチドの上流または下流50ヌクレオチド以内の核酸配列に相補的なガイド配列を含む。適した特異的な標的配列を標的として任意の所与の融合タンパク質を向けるのに適した一部の例示的なガイドRNA配列は、本明細書に提供されている。
追加のドメイン
本明細書に記載の塩基エディターは、核酸塩基編集、ポリヌクレオチドの核酸塩基の修飾または変更を促進する一助となる、任意のドメインを含み得る。一部の実施形態では、塩基エディターは、ポリヌクレオチドプログラマブルヌクレオチド結合ドメイン(例えば、Cas9)、核酸塩基編集ドメイン(例えば、デアミナーゼドメイン)、および1つまたは複数の追加のドメインを含む。一部の場合では、追加のドメインは、塩基エディターの酵素機能もしくは触媒機能、塩基エディターの結合機能を促進し得るか、または所望の塩基編集の結果に干渉する可能性のある細胞性機構(例えば酵素)の阻害物質となり得る。
一部の実施形態では、塩基エディターは、ウラシルグリコシラーゼ阻害物質(UGI)ドメインを含み得る。UGIドメインは、例えば、Cの脱アミノ化によって形成されたUをC核酸塩基に戻す変換を阻害することによって、シチジンデアミナーゼドメインを含む塩基エディターの効率を高めることができる。一部の場合では、U:Gヘテロ二重DNAの存在に対する細胞性DNA修復応答は、細胞における核酸塩基編集の効率の減少の原因となりかねない。そのような場合、ウラシルDNAグリコシラーゼ(UDG)は、細胞におけるDNAからのUの除去を触媒し得るが、この除去は、塩基除去修復(BER)を開始し、殆どの場合には結果として、U:G対からC:G対への反転を生じ得る。そのような場合、BERは、単鎖に結合し、編集された塩基をブロックし、UGIを阻害し、BERを阻害し、編集された塩基を保護し、および/または非編集の鎖の修復を促す、1つまたは複数のドメインを含む塩基エディターにより阻害され得る。そのため、本開示は、UGIドメインを含む塩基エディター融合タンパク質を想定している。
一部の実施形態では、塩基エディターは、二本鎖切断(DSB)結合タンパク質の全部または一部をドメインとして含む。例えば、DSB結合タンパク質としては、DSBの端に結合することができ、分解から保護することができる、バクテリオファージMuのGamタンパク質を挙げることができる。その全体の内容をここに参照により組み込まれるKomor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017)を参照されたい。
一部の実施形態では、塩基エディターは、核酸ポリメラーゼ(NAP)の全部または一部をドメインとして含み得る。例えば、塩基エディターは、真核NAPを全部または一部を含み得る。一部の実施形態では、塩基エディターに組み込まれるNAPまたはその一部は、DNAポリメラーゼである。一部の実施形態では、塩基エディターに組み込まれるNAPまたはその一部は、損傷乗り越えポリメラーゼ活性を有する。一部の場合では、塩基エディターに組み込まれるNAPまたはその一部は、損傷乗り越えDNAポリメラーゼである。一部の実施形態では、塩基エディターに組み込まれるNAPまたはその一部は、Rev7、Rev1複合体、ポリメラーゼイオタ、ポリメラーゼカッパ、またはポリメラーゼエータである。一部の実施形態では、塩基エディターに組み込まれるNAPまたはその一部は、真核ポリメラーゼアルファ、ベータ、ガンマ、デルタ、イプシロン、ガンマ、エータ、イオタ、カッパ、ラムダ、ミュー、またはニュー構成成分である。一部の実施形態では、塩基エディターに組み込まれるNAPまたはその一部は、核酸ポリメラーゼ(例えば、損傷乗り越えDNAポリメラーゼ)と少なくとも75%、80%、85%、90%、95%、96%、97%、98%、99%、または99.5%同一のアミノ酸配列を含む。
塩基エディターシステム
本明細書に提供される塩基エディターシステムは、(a)対象のポリヌクレオチド(例えば、二本鎖DNAまたはRNA、一本鎖DNAまたはRNA)の標的ヌクレオチド配列を、アデノシンデアミナーゼドメインまたはシチジンデアミナーゼドメインを含む塩基エディターシステムと、少なくとも1つのガイドポリ核酸(例えば、gRNA)に接触させることであって、上述のドメインが、ポリヌクレオチド結合ドメインに融合され、それによって、本明細書に記載されるような核酸分子内の1つまたは複数の塩基に変化を誘導することができる核酸塩基エディターを形成し、上記標的ヌクレオチド配列が、標的とされた核酸塩基対を含むこと;(b)標的領域の鎖の分離を誘導すること;(c)標的領域の単鎖中、標的核酸塩基対の第1の核酸塩基を第2の核酸塩基に変換すること;および(d)標的領域の1本以下の鎖を切断することであって、第1の核酸塩基塩基に相補的な第3の核酸塩基が、第2の核酸塩基に相補的な第4の核酸塩基に置き換えられることを含む。一部の実施形態では、ステップ(b)は省略されることを認識するべきである。一部の実施形態では、標的とされた核酸塩基対は、1つまたは複数の遺伝子中の複数の核酸塩基対である。一部の実施形態では、本明細書に提供される塩基エディターシステムは、1つまたは複数の遺伝子における複数の核酸塩基対の多重編集が可能である。一部の実施形態では、複数の核酸塩基対は、同じ遺伝子に位置する。一部の実施形態では、複数の核酸塩基対は、1つまたは複数の遺伝子に位置し、少なくとも1つの遺伝子は、異なる遺伝子座に位置する。
一部の実施形態では、切断された単鎖(ニック鎖)は、ガイド核酸にハイブリダイズされる。一部の実施形態では、切断された単鎖は、第1の核酸塩基を含む鎖の反対にある。一部の実施形態では、塩基エディターはCas9ドメインを含む。一部の実施形態では、第1の塩基はアデニンであり、第2の塩基はG、C、A、またはTではない。一部の実施形態では、第2の塩基はイノシンである。
本明細書に提供されるような塩基編集システムは、ゲノム編集に新しいアプローチを提供し、このアプローチは、触媒として欠損のあるストレプトコッカス・ピロゲネスCas9と、シチジンデアミナーゼと、塩基除去修復の阻害物質とを含有する融合タンパク質を用いて、二本鎖DNA切断を生成することなく、ドナーDNA鋳型を要することなく、ならびに確率論的な挿入および欠失を過剰に誘導することなく、プログラマブルな単一ヌクレオチド(C→TまたはA→G)の変化をDNAに誘導する。
本明細書に提供されるのは、塩基エディターシステムを用いて核酸塩基を編集するためのシステム、組成物、および方法である。一部の実施形態では、塩基エディターシステムは、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインと核酸塩基を編集するための核酸塩基編集ドメイン(例えば、デアミナーゼドメイン)とを含む塩基エディター(BE);およびポリヌクレオチドプログラマブルヌクレオチド結合ドメインに連係するガイドポリヌクレオチド(例えば、ガイドRNA)を含む。一部の実施形態では、塩基エディターシステムは、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインと核酸塩基を編集するための核酸塩基編集ドメイン(例えば、デアミナーゼドメイン)とを含む塩基エディター(BE);およびポリヌクレオチドプログラマブルヌクレオチド結合ドメインに連係するガイドポリヌクレオチド(例えば、ガイドRNA)を含む。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、ポリヌクレオチドプログラマブルDNA結合ドメインである。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、ポリヌクレオチドプログラマブルRNA結合ドメインである。一部の場合では、デアミナーゼドメインは、シトシンデアミナーゼまたはシチジンデアミナーゼ、アデニンデアミナーゼまたはアデノシンデアミナーゼとされ得る。一部の実施形態では、用語「シトシンデアミナーゼ」および「シチジンデアミナーゼ」は、互換的に用いられ得る。一部の実施形態では、用語「アデニンデアミナーゼ」および「アデノシンデアミナーゼ」は、互換的に用いられ得る。一部の場合では、デアミナーゼドメインは、シトシンデアミナーゼまたはシチジンデアミナーゼとされ得る。一部の場合では、デアミナーゼドメインは、アデニンデアミナーゼまたはアデノシンデアミナーゼとされ得る。核酸塩基編集タンパク質の詳細は、国際PCT出願PCT/2017/045381(WO2018/027078)、およびPCT/US2016/058344(WO2017/070632)に記載されており、そのそれぞれは本明細書に参照によりその全体を本明細書に組み込まれる。また、全体の内容が参照によりここに組み込まれる、Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016);Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017);およびKomor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017)も参照されたい。
一部の実施形態では、単一ガイドポリヌクレオチドを利用して、標的核酸配列を標的としてデアミナーゼを向けてもよい。一部の実施形態では、単一の対のガイドポリヌクレオチドを利用して、標的核酸配列を標的として異なるデアミナーゼを向けてもよい。
塩基エディターシステムの核酸塩基構成成分およびポリヌクレオチドプログラマブルヌクレオチド結合構成成分は、共有結合または非共有結合により互いに会合している。例えば、一部の実施形態では、デアミナーゼドメインは、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインによって、標的ヌクレオチド配列を標的とすることができる。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、デアミナーゼドメインに融合または連結することができる。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、非共有結合によりデアミナーゼドメインと相互作用するかまたは会合することによって、標的ヌクレオチド配列を標的としてデアミナーゼドメインを向けることができる。例えば、一部の実施形態では、核酸塩基編集構成成分、例えば、デアミナーゼ構成成分は、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインの一部である追加の異種部分またはドメインと相互作用するか、会合するか、または複合体を形成することができる、追加の異種部分またはドメインを含み得る。一部の実施形態では、追加の異種部分は、ポリペプチドと相互作用するか、会合するか、または複合体を形成することが可能であり得る。一部の実施形態では、追加の異種部分は、ポリヌクレオチドと結合するか、相互作用するか、会合するか、または複合体を形成することが可能であり得る。一部の実施形態では、追加の異種部分は、ガイドポリヌクレオチドと結合することが可能であり得る。一部の実施形態では、追加の異種部分は、ポリペプチドリンカーと結合することが可能であり得る。一部の実施形態では、追加の異種部分は、ポリヌクレオチドリンカーと結合することが可能であり得る。追加の異種部分はタンパク質ドメインであり得る。一部の実施形態では、追加の異種部分は、K相同性(KH)ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、滅菌アルファモチーフ、テロメラーゼKu結合モチーフおよびKuタンパク質、テロメラーゼSm7結合モチーフおよびSm7タンパク質、またはRNA認識モチーフであり得る。
塩基エディターシステムは、ガイドポリヌクレオチド構成成分をさらに含んでいてもよい。塩基エディターシステムの構成成分が、共有結合、非共有結合相互作用、またはそれらの会合および相互作用の任意の組合せを介して、互いに会合し得ることを認識するべきである。一部の実施形態では、デアミナーゼドメインは、ガイドポリヌクレオチドによって、標的ヌクレオチド配列を標的とすることができる。例えば、一部の実施形態では、塩基エディターシステムの核酸塩基編集構成成分、例えば、デアミナーゼ構成成分は、ガイドポリヌクレオチドの部分またはセグメント(例えば、ポリヌクレオチドモチーフ)と相互作用もしくは会合することができるかまたは複合体を形成することができる、追加の異種部分またはドメイン(例えば、RNAまたはDNA結合タンパク質などのポリヌクレオチド結合ドメイン)を含み得る。一部の実施形態では、追加の異種部分またはドメイン(例えば、RNAまたはDNA結合タンパク質などのポリヌクレオチド結合ドメイン)は、デアミナーゼドメインと融合または連結され得る。一部の実施形態では、追加の異種部分は、ポリペプチドと相互作用するか、会合するか、または複合体を形成することが可能であり得る。一部の実施形態では、追加の異種部分は、ポリヌクレオチドと結合するか、相互作用するか、会合するか、または複合体を形成することが可能であり得る。一部の実施形態では、追加の異種部分は、ガイドポリヌクレオチドと結合することが可能であり得る。一部の実施形態では、追加の異種部分は、ポリペプチドリンカーと結合することが可能であり得る。一部の実施形態では、追加の異種部分は、ポリヌクレオチドリンカーと結合することが可能であり得る。追加の異種部分はタンパク質ドメインであり得る。一部の実施形態では、追加の異種部分は、K相同性(KH)ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、滅菌アルファモチーフ、テロメラーゼKu結合モチーフおよびKuタンパク質、テロメラーゼSm7結合モチーフおよびSm7タンパク質、またはRNA認識モチーフであり得る。
一部の実施形態では、塩基エディターシステムは、塩基除去修復(BER)構成成分の阻害物質をさらに含み得る。塩基エディターシステムの構成成分が、共有結合、非共有結合相互作用、またはそれらの会合および相互作用の任意の組合せを介して、互いに会合し得ることを認識するべきである。BER構成成分の阻害物質は、塩基除去修復阻害物質を含むことがある。一部の実施形態では、塩基除去修復の阻害物質は、ウラシルDNAグリコシラーゼ阻害物質(UGI)とされ得る。一部の実施形態では、塩基除去修復の阻害物質は、イノシン塩基除去修復の阻害物質とされ得る。一部の実施形態では、塩基除去修復の阻害物質は、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインによって、標的ヌクレオチド配列を標的とすることができる。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、塩基除去修復の阻害物質に融合または連結することができる。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、デアミナーゼドメインおよび塩基除去修復の阻害物質に融合または連結することができる。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、非共有結合により塩基除去修復の阻害物質と相互作用するかまたは会合することによって、標的ヌクレオチド配列を標的として塩基除去修復の阻害物質を向けることができる。例えば、一部の実施形態では、塩基除去修復構成成分の阻害物質は、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインの一部である追加の異種部分またはドメインと相互作用するか、会合するか、または複合体を形成することができる、追加の異種部分またはドメインを含み得る。一部の実施形態では、塩基除去修復の阻害物質は、ガイドポリヌクレオチドによって、標的ヌクレオチド配列を標的とすることができる。例えば、一部の実施形態では、塩基除去修復の阻害物質は、ガイドポリヌクレオチドの部分またはセグメント(例えば、ポリヌクレオチドモチーフ)と相互作用もしくは会合することができるかまたは複合体を形成することができる、追加の異種部分またはドメイン(例えば、RNAまたはDNA結合タンパク質などのポリヌクレオチド結合ドメイン)を含み得る。一部の実施形態では、ガイドポリヌクレオチドの追加の異種部分またはドメイン(例えば、RNAまたはDNA結合タンパク質などのポリヌクレオチド結合ドメイン)は、塩基除去修復の阻害物質と融合または連結され得る。一部の実施形態では、追加の異種部分は、ポリヌクレオチドと結合するか、相互作用するか、会合するか、または複合体を形成することが可能であり得る。一部の実施形態では、追加の異種部分は、ガイドポリヌクレオチドと結合することが可能であり得る。一部の実施形態では、追加の異種部分は、ポリペプチドリンカーと結合することが可能であり得る。一部の実施形態では、追加の異種部分は、ポリヌクレオチドリンカーと結合することが可能であり得る。追加の異種部分はタンパク質ドメインであり得る。一部の実施形態では、追加の異種部分は、K相同性(KH)ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、滅菌アルファモチーフ、テロメラーゼKu結合モチーフおよびKuタンパク質、テロメラーゼSm7結合モチーフおよびSm7タンパク質、またはRNA認識モチーフであり得る。
一部の実施形態では、塩基エディターは、編集された鎖の塩基除去修復を阻害する。一部の実施形態では、塩基エディターは、非編集の鎖を保護または結合する。一部の実施形態では、塩基エディターはUGI活性を有する。一部の実施形態では、塩基エディターは、触媒として不活性のイノシン特異的ヌクレアーゼを含む。一部の実施形態では、塩基エディターは、ニッカーゼ活性を含む。一部の実施形態では、塩基対の意図される編集は、PAM部位の上流である。一部の実施形態では、塩基対の意図される編集は、PAM部位の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド上流である。一部の実施形態では、塩基対の意図される編集は、PAM部位の下流である。一部の実施形態では、塩基対の意図される編集は、PAM部位の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド下流である。
一部の実施形態では、方法は、規準の(例えば、NGG)PAM部位を必要としない。一部の実施形態では、核酸塩基エディターは、リンカーまたはスペーサーを含む。一部の実施形態では、リンカーまたはスペーサーは、1~25アミノ酸の長さである。一部の実施形態では、リンカーまたはスペーサーは、5~20アミノ酸の長さである。一部の実施形態では、リンカーまたはスペーサーは、10、11、12、13、14、15、16、17、18、19、または20アミノ酸の長さである。
一部の実施形態では、標的領域は、標的の枠を含み、標的の枠は、標的核酸塩基対を含む。一部の実施形態では、標的の枠は、1~10ヌクレオチドを含む。一部の実施形態では、標的の枠は1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチドの長さである。一部の実施形態では、塩基対の意図される編集は、標的の枠内である。一部の実施形態では、標的の枠は、塩基対の意図される編集を含む。一部の実施形態では、方法は、本明細書に提供される任意の塩基エディターを用いて実行される。一部の実施形態では、標的の枠は、脱アミノ化の枠である。
一部の実施形態では、非制限的で例示的なシチジン塩基エディター(CBE)としては、BE1(APOBEC1-XTEN-dCas9)、BE2(APOBEC1-XTEN-dCas9-UGI)、BE3(APOBEC1-XTEN-dCas9(A840H)-UGI)、BE3-Gam、saBE3、saBE4-Gam、BE4、BE4-Gam、saBE4、またはsaB4E-Gamが挙げられる。BE4は、APOBEC1-Cas9n(D10A)リンカーを32アミノ酸に、Cas9n-UGIリンカーを9アミノ酸に延ばし、UGIの第2のコピーを、別の9-アミノ酸リンカーを有する構築物のC末端に添加して単一の塩基エディター構築物とする。塩基エディターsaBE3およびsaBE4は、S.ピロゲネスCas9n(D10A)をより小さなS.アウレウスCas9n(D10A)に置き換えられて有する。BE3-Gam、saBE3-Gam、BE4-Gam、およびsaBE4-Gamでは、174残基のGamタンパク質が16アミノ酸のXTENリンカーを介して、BE3、saBE3、BE4、およびsaBE4のN末端に融合されている。
一部の実施形態では、アデノシン塩基エディター(ABE)は、DNAにおいてアデニンを脱アミノ化することができる。一部の実施形態では、ABEは、BE3のAPOBEC1構成成分を天然のまたは工学的に改変された大腸菌TadA、ヒトADAR2、マウスADA、またはヒトADAT2に置き換えることによって生成される。一部の実施形態では、ABEは、進化型のTadAバリアントを含む。一部の実施形態では、ABEはABE1.2(TadA*-XTEN-nCas9-NLS)である。一部の実施形態では、TadA*は、A106VおよびD108N変異を含む。
一部の実施形態では、ABEは第2世代のABEである。一部の実施形態では、ABEはABE2.1であり、これは追加の変異D147YおよびE155VをTadA*(TadA*2.1)に含む。一部の実施形態では、ABEはABE2.2であり、これはヒトアルキルアデニンDNAグリコシラーゼ(E125Q変異を有するAAG)の触媒として不活化されたバージョンに融合されているABE2.1である。一部の実施形態では、ABEはABE2.3であり、これは大腸菌EndoVの触媒として不活化されたバージョン(D35A変異により不活化)に融合されているABE2.1である。一部の実施形態では、ABEはABE2.6であり、これはリンカーをABE2.1内のリンカーのように長く2倍有する(32アミノ酸、(SGGS)-XTEN-(SGGS))。一部の実施形態では、ABEはABE2.7であり、これは追加の野生型TadA単量体に繋留されたABE2.1である。一部の実施形態では、ABEはABE2.8であり、これは追加のTadA*2.1単量体に繋留されたABE2.1である。一部の実施形態では、ABEはABE2.9であり、これは進化型TadA(TadA*2.1)とABE2.1のN末端との直接的な融合対である。一部の実施形態では、ABEはABE2.10であり、これは野生型TadAとABE2.1のN末端との直接的な融合体である。一部の実施形態では、ABEはABE2.11であり、これはTadA*単量体のN末端に不活性化型のE59A変異を有するABE2.9である。一部の実施形態では、ABEはABE2.12であり、これは内部TadA*単量体に不活性化型のE59A変異を有するABE2.9である。
一部の実施形態では、ABEは第3世代のABEである。一部の実施形態では、ABEはABE3.1であり、これは3つの追加のTadA変異(L84F、H123Y、およびI157F)を有するABE2.3である。
一部の実施形態では、ABEは第4世代のABEである。一部の実施形態では、ABEはABE4.3であり、これは追加のTadA変異A142N(TadA*4.3)を有するABE3.1である。
一部の実施形態では、ABEは第5世代のABEである。一部の実施形態では、ABEはABE5.1であり、これは、生き残ったクローン(H36L、R51L、S146C、およびK157N)由来のコンセンサス変異セットをABE3.1に取り込むことによって生成される。一部の実施形態では、ABEはABE5.3であり、これは、内部進化型TadA*に融合された野生型大腸菌TadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABEは、下記の表6に示されるようなABE5.2、ABE5.4、ABE5.5、ABE5.6、ABE5.7、ABE5.8、ABE5.9、ABE5.10、ABE5.11、ABE5.12、ABE5.13、またはABE5.14である。一部の実施形態では、ABEは第6世代のABEである。一部の実施形態では、ABEは、下記の表6に示されるようなABE6.1、ABE6.2、ABE6.3、ABE6.4、ABE6.5、またはABE6.6である。一部の実施形態では、ABEは第7世代のABEである。一部の実施形態では、ABEは、下記の表6に示されるようなABE7.1、ABE7.2、ABE7.3、ABE7.4、ABE7.5、ABE7.6、ABE7.7、ABE7.8、ABE7.9、またはABE7.10である。
Figure 2022545950000039
Figure 2022545950000040
一部の実施形態では、アデノシン塩基エディターは第8世代のABE(ABE8)である。一部の実施形態では、ABE8はTadA*8バリアントを含有する。一部の実施形態では、ABE8は、TadA*8バリアントを含有する単量体構築物である。一部の実施形態では、ABE8はABE8.1であり、これは、Y147T変異(TadA*8.1)を有するTadA*7.10を含有する単量体構築物を有する。一部の実施形態では、ABE8はABE8.2であり、これは、Y147R変異(TadA*8.2)を有するTadA*7.10を含有する単量体構築物を有する。一部の実施形態では、ABE8はABE8.3であり、これは、Q154S変異(TadA*8.2)を有するTadA*7.10を含有する単量体構築物を有する。一部の実施形態では、ABE8はABE8.4であり、これは、Y123H変異(TadA*8.3)を有するTadA*7.10を含有する単量体構築物を有する。一部の実施形態では、ABE8はABE8.5であり、これは、V82S変異(TadA*8.4)を有するTadA*7.10を含有する単量体構築物を有する。一部の実施形態では、ABE8はABE8.6であり、これは、T166R変異(TadA*8.6)を有するTadA*7.10を含有する単量体構築物を有する。一部の実施形態では、ABE8はABE8.7であり、これは、Q154R変異(TadA*8.7)を有するTadA*7.10を含有する単量体構築物を有する。一部の実施形態では、ABE8はABE8.8であり、これは、Y147R、Q154R、およびY123H変異(TadA*8.8)を有するTadA*7.10を含有する単量体構築物を有する。一部の実施形態では、ABE8はABE8.9であり、これは、Y147R、Q154RおよびI76Y変異(TadA*8.9)を有するTadA*7.10を含有する単量体構築物を有する。一部の実施形態では、ABE8はABE8.10であり、これは、Y147R、Q154R、およびT166R変異(TadA*8.10)を有するTadA*7.10を含有する単量体構築物を有する。一部の実施形態では、ABE8はABE8.11であり、これは、Y147TおよびQ154R変異(TadA*8.11)を有するTadA*7.10を含有する単量体構築物を有する。一部の実施形態では、ABE8はABE8.12であり、これは、Y147TおよびQ154S変異(TadA*8.12)を有するTadA*7.10を含有する単量体構築物を有する。一部の実施形態では、ABE8はABE8.13であり、これは、Y123H、Y147R、およびI76Y変異(TadA*8.13)を有するTadA*7.10を含有する単量体構築物を有する。
一部の実施形態では、ABE8は、TadA*8バリアントに融合された野生型大腸菌TadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.14であり、これは、Y147T変異(TadA*8.14)を有するTadA*7.10に融合された野生型大腸菌TadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.15であり、これは、Y147R変異(TadA*8.15)を有するTadA*7.10に融合された野生型大腸菌TadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.16であり、これは、Q154S変異(TadA*8.16)を有するTadA*7.10に融合された野生型大腸菌TadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.17であり、これは、Y123H変異(TadA*8.17)を有するTad*7.10に融合された野生型大腸菌TadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.18であり、これは、V82S変異(TadA*8.18)を有するTadA*7.10に融合された野生型大腸菌TadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.19であり、これは、T166R変異(TadA*8.19)を有するTadA*7.10に融合された野生型大腸菌TadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.20であり、これは、Q154R変異(TadA*8.20)を有するTadA*7.10に融合された野生型大腸菌TadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.21であり、これは、Y147R、Q154R、およびY123H変異(TadA*8.21)を有するTadA*7.10に融合された野生型大腸菌TadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.22であり、これは、Y147R、Q154R、およびI76Y変異(TadA*8.22)を有するTadA*7.10に融合された野生型大腸菌TadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.23であり、これは、Y147R、Q154R、およびT166R変異(TadA*8.23)を有するTadA*7.10に融合された野生型大腸菌TadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.24であり、これは、Y147TおよびQ154R変異(TadA*8.24)を有するTadA*7.10に融合された野生型大腸菌TadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.25であり、これは、Y147TおよびQ154S変異(TadA*8.25)を有するTadA*7.10に融合された野生型大腸菌TadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8.26であり、これは、Y123H、Y147R、およびI76Y変異(TadA*8.26)を有するTadA*7.10に融合された野生型大腸菌TadAを含有するヘテロ二量体構築物を有する。
一部の実施形態ではABEは、下記の表7Aに示されるABE8.1、ABE8.2、ABE8.3、ABE8.4、ABE8.5、ABE8.6、ABE8.6、ABE8.7、ABE8.8、ABE8.9、ABE8.10、ABE8.11、ABE8.12、ABE8.13、ABE8.14、ABE8.15、ABE8.16、ABE8.17、ABE8.18、ABE8.19、ABE8.20、ABE8.21、ABE8.22、ABE8.23、ABE8.24、ABE8.25、またはABE8.26である。
Figure 2022545950000041
一部の実施形態では、ABEは、下記の表7A-1に示されるジェノタイプを有する:
Figure 2022545950000042
下記の表7A-2に示すように、40個のABE8のジェノタイプを記載する。ABEの進化型大腸菌TadA部分における残基の位置を標示する。ABE8における変異による変化を、ABE7.10変異とは異なる場合に示す。一部の実施形態では、ABEは、下記の表7A-2に示されるABEのうち1つのジェノタイプを有する。
Figure 2022545950000043
Figure 2022545950000044
一部の実施形態では、塩基エディター(例えば、ABE8)は、循環置換体Cas9(例えば、CP5)と二部分構成の核局在化配列とを含むスキャフォールドにアデノシンデアミナーゼバリアント(例えば、TadA*8)をクローニングすることによって生成される。一部の実施形態では、塩基エディター(例えば、ABE7.9、ABE7.10、またはABE8)は、NGC PAMCP5バリアント(S.ピロゲネスCas9またはspVRQR Cas9)である。一部の実施形態では、塩基エディター(例えば、ABE7.9、ABE7.10、またはABE8)は、AGA PAM CP5バリアント(S.ピロゲネスCas9またはspVRQR Cas9)である。
一部の実施形態では、塩基エディターは、ABE8.1であり、以下の配列またはアデノシンデアミナーゼ活性を有するその断片を含むか、またはそれから本質的に成る:
ABE8.1_Y147T_CP5_NGC PAM_単量体
Figure 2022545950000045
上記の配列では、標準文字がアデノシンデアミナーゼの配列を示し、ボールド体の配列がCas9由来の配列を標示し、イタリック体の配列がリンカー配列を示し、下線部の配列が二分核定位配列を示す。
一部の実施形態では、塩基エディターは、ABE8.1であり、以下の配列またはアデノシンデアミナーゼ活性を有するその断片を含むか、またはそれから本質的に成る:
pNMG-B335 ABE8.1_Y147T_CP5_NGC PAM_単量体:
Figure 2022545950000046
上記の配列では、標準文字がアデノシンデアミナーゼの配列を示し、ボールド体の配列がCas9由来の配列を標示し、イタリック体の配列がリンカー配列を示し、下線部の配列が二分核定位配列を示す。
一部の実施形態では、塩基エディターは、ABE8.14であり、以下の配列またはアデノシンデアミナーゼ活性を有するその断片を含むか、またはそれから本質的に成る:
NGC PAM CP5を有するpNMG-357_ABE8.14
Figure 2022545950000047
上記の配列では、標準文字がアデノシンデアミナーゼの配列を示し、ボールド体の配列がCas9由来の配列を標示し、イタリック体の配列がリンカー配列を示し、下線部の配列が二分核定位配列を示す。
一部の実施形態では、本発明のABE8は、以下の配列から選択される:
01. monoABE8.1_bpNLS + Y147T
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
02. monoABE8.1_bpNLS + Y147R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCRFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
03. monoABE8.1_bpNLS + Q154S
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRSVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
04. monoABE8.1_bpNLS + Y123H
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
05. monoABE8.1_bpNLS + V82S
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYSTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
06. monoABE8.1_bpNLS + T166R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSRDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
07. monoABE8.1_bpNLS + Q154R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
08. monoABE8.1_bpNLS + Y147R_Q154R_Y123H
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
09. monoABE8.1_bpNLS + Y147R_Q154R_I76Y
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
10. monoABE8.1_bpNLS + Y147R_Q154R_T166R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSRDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
11. monoABE8.1_bpNLS + Y147T_Q154R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
12. monoABE8.1_bpNLS + Y147T_Q154S
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRSVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
13. monoABE8.1_bpNLS + H123Y123H_Y147R_Q154R_I76Y
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
14. monoABE8.1_bpNLS + V82S + Q154R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYSTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
一部の実施形態では、ABE8はABE8a-mであり、これは、R26C、A109S、T111R、D119N、H122N、Y147D、F149Y、T166I、およびD167N変異(TadA*8a)を有するTadA*7.10を含有する単量体構築物を有する。一部の実施形態では、ABE8はABE8b-mであり、これは、V88A、A109S、T111R、D119N、H122N、F149Y、T166I、およびD167N変異(TadA*8b)を有するTadA*7.10を含有する単量体構築物を有する。一部の実施形態では、ABE8はABE8c-mであり、これは、R26C、A109S、T111R、D119N、H122N、F149Y、T166I、およびD167N変異(TadA*8c)を有するTadA*7.10を含有する単量体構築物を有する。一部の実施形態では、ABE8はABE8d-mであり、これは、V88A、T111R、D119N、およびF149Y変異(TadA*8d)を有するTadA*7.10を含有する単量体構築物を有する。一部の実施形態では、ABE8はABE8e-mであり、これは、A109S、T111R、D119N、H122N、Y147D、F149Y、T166I、およびD167N変異(TadA*8e)を有するTadA*7.10を含有する単量体構築物を有する。
一部の実施形態では、ABE8はABE8a-d、これは、R26C、A109S、T111R、D119、H122N、Y147D、F149Y、T166I、およびD167N変異(TadA*8a)を有するTadA*7.10に融合された野生型大腸菌TadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8b-dであり、これは、V88A、A109S、T111R、D119N、H122N、F149Y、T166I、およびD167N変異(TadA*8b)を有するTadA*7.10に融合された野生型大腸菌TadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8c-dであり、これは、R26C、A109S、T111R、D119N、H122N、F149Y、T166I、およびD167N変異(TadA*8c)を有するTadA*7.10に融合された野生型大腸菌TadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8d-dであり、これは、V88A、T111R、D119N、およびF149Y変異(TadA*8d)を有するTadA*7.10に融合された野生型大腸菌TadAを含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8e-dであり、これは、A109S、T111R、D119N、H122N、Y147D、F149Y、T166I、およびD167N変異(TadA*8e)を有するTadA*7.10に融合された野生型大腸菌TadAを含有するヘテロ二量体構築物を有する。
一部の実施形態では、ABE8はABE8a-7であり、これは、R26C、A109S、T111R、D119、H122N、Y147D、F149Y、T166I、およびD167N変異(TadA*8a)を有するTadA*7.10に融合されたTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8b-7であり、これは、V88A、A109S、T111R、D119N、H122N、F149Y、T166I、およびD167N変異(TadA*8b)を有するTadA*7.10に融合されたTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8c-7であり、これは、R26C、A109S、T111R、D119N、H122N、F149Y、T166I、およびD167N変異(TadA*8c)を有するTadA*7.10に融合されたTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8d-7であり、これは、V88A、T111R、D119N、およびF149Y変異(TadA*8d)を有するTadA*7.10に融合されたTadA*7.10を含有するヘテロ二量体構築物を有する。一部の実施形態では、ABE8はABE8e-7であり、これは、A109S、T111R、D119N、H122N、Y147D、F149Y、T166I、およびD167N変異(TadA*8e)を有するTadA*7.10に融合されたTadA*7.10を含有するヘテロ二量体構築物を有する。
一部の実施形態では、ABEは、下記の表7Bに示されるようなABE8a-m、ABE8b-m、ABE8c-m、ABE8d-m、ABE8e-m、ABE8a-d、ABE8b-d、ABE8c-d、ABE8d-d、またはABE8e-dである。一部の実施形態では、ABEは、ABE8e-mまたはABE8e-dである。ABE8eは、SpCas9以外のCasホモログ、例えば、SaCas9、SaCas9-KKH、Cas12aホモログ、例えば、LbCas12a、enAs-Cas12a、SpCas9-NG、ならびに循環置換型CP1028-SpCas9およびCP1041-SpCas9と共に用いた場合に、効率的なアデニン塩基編集活性と少ないインデル形成とを示す。表XでABE8eに対し示された変異に加えて、V106W置換をTadAドメインに導入することによって、オフターゲットRNAおよびDNA編集が低減された(M. Richter et al., 2020, Nature Biotechnology, doi.org/10.1038/s41587-020-0453-zに記載されており、その全体の内容は参照により本明細書に組み込まれる)。
Figure 2022545950000048
一部の実施形態では、塩基エディターは、ウラシルグリコシラーゼ阻害物質(UGI)の全部または一部を含むドメインをさらに含む。一部の実施形態では、塩基エディターは、ウラシルDNAグリコシラーゼ(UDG)などのウラシル結合タンパク質(UBP)の全部または一部を含むドメインを含む。一部の実施形態では、塩基エディターは、核酸ポリメラーゼの全部または一部を含むドメインを含む。一部の実施形態では、塩基エディターに組み込まれた核酸ポリメラーゼまたはその一部は、損傷乗り越えDNAポリメラーゼである。
一部の実施形態では、塩基エディターのドメインは、多重ドメインを含み得る。例えば、Cas9に由来するポリヌクレオチドプログラマブルヌクレオチド結合ドメインを含む塩基エディターは、野生型または天然のCas9のRECローブおよびNUCローブに対応するRECローブおよびNUCローブを含み得る。別の例では、塩基エディターは、RuvCIドメイン、BHドメイン、REC1ドメイン、REC2ドメイン、RuvCIIドメイン、L1ドメイン、HNHドメイン、L2ドメイン、RuvCIIIドメイン、WEDドメイン、TOPOドメイン、またはCTDドメインのうち1つまたは複数を含み得る。一部の実施形態では、塩基エディターの1つまたは複数のドメインは、そのドメインを含むポリペプチドの野生型バージョンに対する変異(例えば、置換、挿入、欠失)を含む。例えば、ポリヌクレオチドプログラマブルDNA結合ドメインのHNHドメインは、H840A置換を含み得る。別の例では、ポリヌクレオチドプログラマブルDNA結合ドメインのRuvCIドメインは、D10A置換を含み得る。
本明細書に開示される塩基エディターの異なるドメイン(例えば、隣接ドメイン)が、1つまたは複数のリンカードメイン(例えば、XTENリンカードメイン)を用いてまたは用いずに、互いに接続され得る。一部の実施形態では、リンカードメインは、結合(例えば、共有結合)とされ得るか、化学基とされ得るか、または2つの分子もしくは部分、例えば、融合タンパク質の2つのドメイン、例えば、第1のドメイン(例えば、Cas9由来ドメイン)と第2のドメイン(例えば、アデノシンデアミナーゼドメインまたはシチジンデアミナーゼドメイン)とを連結する分子とされ得る。一部の実施形態では、リンカーは共有結合(例えば、炭素-炭素結合、ジスルフィド結合、炭素-ヘテロ原子結合など)である。ある特定の実施形態では、リンカーは、アミド連結の炭素窒素結合である。ある特定の実施形態では、リンカーは、環式または非環式の、置換または非置換の、分岐または非分岐の脂肪族またはヘテロ脂肪族のリンカーである。ある特定の実施形態では、リンカーはポリマー性(例えば、ポリエチレン、ポリエチレングリコール、ポリアミド、ポリエステルなど)である。ある特定の実施形態では、リンカーは、アミノアルカン酸の単量体、二量体、またはポリマーを含む。一部の実施形態では、リンカーは、アミノアルカン酸(例えば、グリシン、エタン酸、アラニン、ベータ-アラニン、3-アミノプロパン酸、4-アミノブタン酸、5-ペンタン酸など)を含む。一部の実施形態では、リンカーは、アミノヘキサン酸(Ahx)の単量体、二量体、またはポリマーを含む。ある特定の実施形態では、リンカーは、炭素環部分(例えば、シクロペンタン、シクロヘキサン)をベースとする。他の実施形態では、リンカーは、ポリエチレングリコール部分(PEG)を含む。ある特定の実施形態では、リンカーは、アリール部分またはヘテロアリール部分を含む。ある特定の実施形態では、リンカーはフェニル環をベースとする。リンカーは、ペプチドからリンカーへの求核基(例えば、チオール、アミノ)の付加を促進する官能化部分を含み得る。任意の求電子基がリンカーの一部として用いられ得る。例示的な求電子基としては、以下に限定されないが、活性化エステル、活性化アミド、マイケルアクセプター、ハロゲン化アルキル、ハロゲン化アリール、ハロゲン化アシル、およびイソチオシアネートが挙げられる。一部の実施形態では、リンカーは、Cas9ヌクレアーゼドメインと核酸編集タンパク質の触媒ドメインとを含むRNAプログラマブルヌクレアーゼのgRNA結合ドメインに接合する。一部の実施形態では、リンカーは、dCas9および第2のドメイン(例えば、UGI、シチジンデアミナーゼ、など)に接合する。
典型的には、リンカーは、2つの基、分子、または他の部分の間に位置するかまたはそれらを側面に配し、共有結合を介してそれぞれ接続され、ゆえに上記2つを接続する。一部の実施形態では、リンカーは、1アミノ酸または複数のアミノ酸(例えば、ペプチドもしくはタンパク質)である。一部の実施形態では、リンカーは、有機分子、基、ポリマー、または化学部分である。一部の実施形態では、リンカーは、2~100アミノ酸の長さであり、例えば、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30~35、35~40、40~45、45~50、50~60、60~70、70~80、80~90、90~100、100~150、または150~200アミノ酸の長さである。一部の実施形態では、リンカーは、約3から約104(例えば、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、55、60、65、70、75、80、85、90、95、または100)アミノ酸の長さである。さらに長いかまたは短いリンカーも想定される。一部の実施形態では、リンカードメインは、XTENリンカーとも呼ばれることがあるアミノ酸配列SGSETPGTSESATPESを含む。核酸塩基エディターの活性のために最適な長さを達成するために、融合タンパク質ドメインを連結するための任意の方法が採用され得る(例えば、高可撓性のリンカーである形態(SGGS)n、(GGGS)n、(GGGGS)n、および(G)nから、より剛性のリンカーである形態(EAAAK)n、(GGS)n、SGSETPGTSESATPESに及ぶ(例えば、全体の内容を本明細書に参照により組み込まれるGuilinger JP, Thompson DB, Liu DR. Fusion of catalytically inactive Cas9 to FokI nuclease improves the specificity of genome modification. Nat. Biotechnol. 2014; 32(6): 577-82を参照)、または(XP)nモチーフ。一部の実施形態では、nは1、2、3、4、5、6、7、8、9、10、11、12、13、14、または15である。一部の実施形態では、リンカーは、(GGS)nモチーフを含み、式中、nは1、3、または7である。一部の実施形態では、本明細書に記載される融合タンパク質のCas9ドメインは、アミノ酸配列SGSETPGTSESATPESを含むリンカーを介して融合される。一部の実施形態では、リンカーは、複数のプロリン残基を含み、5~21、5~14、5~9、5~7アミノ酸の長さであり、例えば、PAPAP、PAPAPA、PAPAPAP、PAPAPAPA、P(AP)4、P(AP)7、P(AP)10である(例えば、全体の内容を本明細書に参照により組み込まれるTan J, Zhang F, Karcher D, Bock R. Engineering of high-precision base editors for site-specific single nucleotide replacement. Nat Commun. 2019 Jan 25;10(1):439を参照)。そのようなプロリンリッチリンカーは、「剛性」リンカーとも呼ばれる。
リンカー
ある特定の実施形態では、リンカーを用いて、本発明の任意のペプチドまたはペプチドドメインに連結してもよい。リンカーは、共有結合のように単純でもよいし、ポリマーリンカーの多数の原子の長さとしてもよい。ある特定の実施形態では、リンカーは、ポリペプチドであるか、またはアミノ酸をベースとしている。他の実施形態では、リンカーはペプチド様ではない。一部の実施形態では、リンカーは共有結合(例えば、炭素-炭素結合、ジスルフィド結合、炭素-ヘテロ原子結合など)である。ある特定の実施形態では、リンカーは、アミド連結の炭素-窒素結合である。ある特定の実施形態では、リンカーは、環式または非環式の、置換または非置換の、分岐または非分岐の脂肪族またはヘテロ脂肪族のリンカーである。ある特定の実施形態では、リンカーはポリマー性(例えば、ポリエチレン、ポリエチレングリコール、ポリアミド、ポリエステルなど)である。ある特定の実施形態では、リンカーは、アミノアルカン酸の単量体、二量体、またはポリマーを含む。ある特定の実施形態では、リンカーは、アミノアルカン酸(例えば、グリシン、エタン酸、アラニン、ベータ-アラニン、3-アミノプロパン酸、4-アミノブタン酸、5-ペンタン酸など)を含む。ある特定の実施形態では、リンカーは、アミノヘキサン酸(Ahx)の単量体、二量体、またはポリマーを含む。ある特定の実施形態では、リンカーは、炭素環部分(例えば、シクロペンタン、シクロヘキサン)をベースとする。他の実施形態では、リンカーは、ポリエチレングリコール部分(PEG)を含む。他の実施形態では、リンカーはアミノ酸を含む。ある特定の実施形態では、リンカーはペプチドを含む。ある特定の実施形態では、リンカーは、アリール部分またはヘテロアリール部分を含む。ある特定の実施形態では、リンカーはフェニル環をベースとする。リンカーは、ペプチドからリンカーへの求核基(例えば、チオール、アミノ)の付加を促進する官能化部分を含んでいてもよい。任意の求電子基がリンカーの一部として用いられてもよい。例示的な求電子基としては、以下に限定されないが、活性化エステル、活性化アミド、マイケルアクセプター、ハロゲン化アルキル、ハロゲン化アリール、ハロゲン化アシル、およびイソチオシアネートが挙げられる。
一部の実施形態では、リンカーは、1アミノ酸または複数のアミノ酸(例えば、ペプチドもしくはタンパク質)である。一部の実施形態では、リンカーは、結合(例えば共有結合)、有機分子、基、ポリマー、または化学部分である。一部の実施形態では、リンカーは、約3から約104(例えば、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、55、60、65、70、75、80、85、90、95、または100)アミノ酸の長さである。
一部の実施形態では、シチジンデアミナーゼとアデノシンデアミナーゼとnapDNAbpとは、4、16、32、または104アミノ酸の長さのリンカーを介して融合される。一部の実施形態では、リンカーは、約3から約104アミノ酸の長さである。一部の実施形態では、本明細書に記載の任意の融合タンパク質は、リンカーを介して互いに融合されているシチジンデアミナーゼとアデノシンデアミナーゼとCas9ドメインとを含む。核酸塩基エディターの活性のために最適な長さを達成するために、デアミナーゼドメイン(例えば、工学的に改変されたecTadA)とCas9ドメインとの間の様々なリンカーの長さおよび可撓性が採用され得る(例えば、高可撓性のリンカーである形態(GGGS)、(GGGGS)、および(G)から、より剛性のリンカーである形態(EAAAK)、(SGGS)、SGSETPGTSESATPESに及ぶ(例えば、全体の内容を本明細書に参照により組み込まれるGuilinger JP, Thompson DB, Liu DR. Fusion of catalytically inactive Cas9 to FokI nuclease improves the specificity of genome modification. Nat. Biotechnol. 2014; 32(6): 577-82を参照)、および(XP))。一部の実施形態では、nは1、2、3、4、5、6、7、8、9、10、11、12、13、14、または15である。一部の実施形態では、リンカーは、(GGS)モチーフを含み、式中、nは1、3、または7である。一部の実施形態では、本明細書に記載される任意の融合タンパク質のシチジンデアミナーゼとアデノシンデアミナーゼとCas9ドメインとは、アミノ酸配列SGSETPGTSESATPESを含むリンカー(例えば、XTENリンカー)を介して融合される。
一部の実施形態では、標的領域は、標的の枠を含み、標的の枠は、標的核酸塩基対を含む。一部の実施形態では、標的の枠は、1~10ヌクレオチドを含む。一部の実施形態では、標的の枠は、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチドの長さである。一部の実施形態では、塩基対の意図される編集は、標的の枠内である。一部の実施形態では、標的の枠は、塩基対の意図される編集を含む。一部の実施形態では、方法は、本明細書に提供される任意の塩基エディターを用いて実行される。一部の実施形態では、標的の枠は、脱アミノ化の枠である。
さらに、一部の場合では、Gamタンパク質は、塩基エディターのN末端に融合され得る。一部の場合では、Gamタンパク質は、塩基エディターのC末端に融合され得る。バクテリオファージMuのGamタンパク質は、二本鎖切断(DSB)の末端に結合して、それらを分解から保護することができる。一部の実施形態では、Gamを用いてDSBのフリーな末端に結合することによって、塩基編集の過程の間のインデル形成を低減することができる。一部の実施形態では、174残基のGamタンパク質は、塩基エディターのN末端に融合される。Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017)を参照されたい。一部の場合では、1つまたは複数の変異は、野生型ドメインに比べて塩基エディタードメインの長さを変えることができる。例えば、少なくとも1つのドメイン内の少なくとも1つのアミノ酸の欠失は、塩基エディターの長さを低減し得る。別の場合では、1つまたは複数の変異は、野生型ドメインに比べてドメインの長さを変えない。例えば、任意のドメイン内の置換は、塩基エディターの長さを変える/変えない。
一部の実施形態では、本明細書に示される塩基編集融合タンパク質は、精確な場所に配置される必要があり、例えば、そこでは、画定された領域(例えば、「脱アミノ化の枠」)内に標的塩基が配される。一部の場合では、標的は、4塩基領域内とすることができる。一部の場合では、そのような画定された標的領域は、PAMのおよそ15塩基上流とすることができる。全体の内容が参照によりここに組み込まれる、Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016);Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017);およびKomor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017)も参照されたい。
画定された標的領域は、脱アミノ化の枠とされ得る。脱アミノ化の枠は、塩基エディターが標的ヌクレオチドに作用して脱アミノ化する画定された領域とされ得る。一部の実施形態では、脱アミノ化の枠は、2、3、4、5、6、7、8、9、または10塩基の領域内である。一部の実施形態では、脱アミノ化の枠は、PAMの5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、または25塩基上流である。
本開示の塩基エディターは、標的ポリヌクレオチド配列の編集を促進する任意のドメイン、特徴、またはアミノ酸配列を含み得る。例えば、一部の実施形態では、塩基エディターは、核局在化配列(NLS)を含む。一部の実施形態では、塩基エディターのNLSは、デアミナーゼドメインとポリヌクレオチドプログラマブルヌクレオチド結合ドメインとの間に局在化する。一部の実施形態では、塩基エディターのNLSは、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインに対しC末端に局在化する。
本明細書に開示される塩基エディターに存在し得る他の例示的な特徴は、局在化配列、例えば、細胞質局在化配列、核輸送配列などの輸送配列、または他の局在化配列、ならびに融合タンパク質の可溶化、精製、または検出に有用な配列である。本明細書に提供される適したタンパク質タグとしては、以下に限定されないが、ビオチンカルボキシラーゼ担体タンパク質(BCCP)タグ、mycタグ、カルモジュリンタグ、FLAGタグ、ヘマグルチニン(HA)タグ、ヒスチジンタグまたはHisタグとも呼ばれるポリヒスチジンタグ、マルトース結合タンパク質(MBP)タグ、nusタグ、グルタチオン-S-トランスフェラーゼ(GST)タグ、緑色蛍光タンパク質(GFP)タグ、チオレドキシンタグ、Sタグ、Sofタグ(例えば、Sofタグ1、Sofタグ3)、strepタグ、ビオチンリガーゼタグ、FlAsHタグ、V5タグ、およびSBPタグが挙げられる。追加の適した配列は当業者に明らかになるものとなる。一部の実施形態では、融合タンパク質は、1つまたは複数のHisタグを含む。
融合タンパク質に含まれ得るタンパク質ドメインの非限定的な例としては、デアミナーゼドメイン(例えば、シチジンデアミナーゼ、アデノシンデアミナーゼ)、ウラシルグリコシラーゼ阻害物質(UGI)ドメイン、エピトープタグ、およびレポーター遺伝子配列が挙げられる。
エピトープタグの非限定的な例としては、ヒスチジン(His)タグ、V5タグ、FLAGタグ、インフルエンザヘマグルチニン(HA)タグ、Mycタグ、VSV-Gタグ、およびチオレドキシン(Trx)タグが挙げられる。レポーター遺伝子の例としては、以下に限定されないが、グルタチオン-5-トランスフェラーゼ(GST)、セイヨウワサビペルオキシダーゼ(HRP)、クロラムフェニコールアセチルトランスフェラーゼ(CAT)、ベータ-ガラクトシダーゼ、ベータ-グルクロニダーゼ、ルシフェラーゼ、緑色蛍光タンパク質(GFP)、HcRed、DsRed、シアン蛍光タンパク質(CFP)、黄色蛍光タンパク質(YFP)、および青色蛍光タンパク質(BFP)を含めた自家蛍光タンパク質が挙げられる。追加のタンパク質配列としては、DNA分子を結合するかまたは他の細胞性分子に結合するアミノ酸配列を挙げることができ、そのようなものとしては、以下に限定されないが、マルトース結合タンパク質(MBP)、Sタグ、LexA DNA結合ドメイン(DBD)融合体、GAL4 DNA結合ドメイン融合体、および単純ヘルペスウイルス(HSV)BP16タンパク質融合体が挙げられる。
塩基エディター効率
CRISPR-Cas9ヌクレアーゼは、標的化ゲノム編集を媒介するのに広く用いられている。殆どのゲノム編集の適用では、Cas9は、ガイドポリヌクレオチド(例えば、単一ガイドRNA(sgRNA))と複合体を形成し、sgRNA配列により指定された標的部位で二本鎖DNA切断(DSB)を誘導する。細胞は、主に非相同末端結合(NHEJ)修復経路を介してこのDSBに応答するが、NHEJ修復経路は結果として、遺伝子を中断させるフレームシフト変異を引き起こす確率論的な挿入または欠失(インデル)を生じる。DSBの側面に位置する配列と高度の相同性を有するドナーDNA鋳型の存在下では、遺伝子編集は、相同性指向型修復(HDR)として知られる代替の経路を介して達成され得る。都合の悪いことに、殆どの非摂動論的な条件下では、HDRは効率が悪く、細胞の状態および細胞のタイプに依存し、より大きなインデルの頻度に凌駕される。ヒトの疾患に関連する公知の遺伝子バリエーションの殆どが点変異であることから、精確な点変異をより高い効率で難なく作製することのできる方法が求められている。本明細書に示される塩基編集システムは、二本鎖DNA切断を生成することなく、ドナーDNA鋳型を要することなく、確率論的な挿入および欠失を過剰に誘導することなく、ゲノム編集をもたらす新しい方法を提供する。
本明細書に示される塩基エディターは、著しく大きな割合のインデルを生成することなく、特異的ヌクレオチド塩基を改変することができる。用語「インデル」とは、本明細書に用いられる際には、核酸内のヌクレオチド塩基の挿入または欠失を指す。そのような挿入または欠失は、遺伝子のコード領域内のフレームシフト変異に繋がることがある。一部の実施形態では、標的ヌクレオチド配列中に数多くの挿入または欠失(すなわちインデル)を生成することなく核酸内で特異的なヌクレオチドを効率的に改変する(例えば、変異または脱アミノ化する)、塩基エディターを生成することが望ましい。ある特定の実施形態では、本明細書に示される任意の塩基エディターは、インデルに比べてより大きな割合の目的の改変(例えば、点変異または脱アミノ化)を生成することができる。
一部の実施形態では、本明細書に示される任意の塩基エディターシステムは、結果として標的ポリヌクレオチド配列に50%未満、40%未満、30%未満、20%未満、19%未満、18%未満、17%未満、16%未満、15%未満、14%未満、13%未満、12%未満、11%未満、10%未満、9%未満、8%未満、7%未満、6%未満、5%未満、4%未満、3%未満、2%未満、1%未満、0.9%未満、0.8%未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.09%未満、0.08%未満、0.07%未満、0.06%未満、0.05%未満、0.04%未満、0.03%未満、0.02%、または0.01%未満のインデル形成を生じる。
本開示の一部の態様は、本明細書に示される任意の塩基エディターが、著しく数多くの目的外の変異、例えば目的外の点変異などを生成することなく、点変異などの目的の変異を核酸(例えば、対象のゲノム内の核酸)中で効率的に生成することができるという認識に基づく。一部の実施形態では、本明細書に示される任意の塩基エディターは、少なくとも0.01%の目的の変異(すなわち、少なくとも0.01%の塩基編集効率)を生成することができる。一部の実施形態では、本明細書に示される任意の塩基エディターは、少なくとも0.01%、1%、2%、3%、4%、5%、10%、15%、20%、25%、30%、40%、45%、50%、60%、70%、80%、90%、95%、または99%の目的の変異を生成することができる。
一部の実施形態では、本明細書に示される塩基エディターは、1:1を超える目的の点変異とインデルとの比率を生成することができる。一部の実施形態では、本明細書に示される塩基エディターは、少なくとも1.5:1、少なくとも2:1、少なくとも2.5:1、少なくとも3:1、少なくとも3.5:1、少なくとも4:1、少なくとも4.5:1、少なくとも5:1、少なくとも5.5:1、少なくとも6:1、少なくとも6.5:1、少なくとも7:1、少なくとも7.5:1、少なくとも8:1、少なくとも8.5:1、少なくとも9:1、少なくとも10:1、少なくとも11:1、少なくとも12:1、少なくとも13:1、少なくとも14:1、少なくとも15:1、少なくとも20:1、少なくとも25:1、少なくとも30:1、少なくとも40:1、少なくとも50:1、少なくとも100:1、少なくとも200:1、少なくとも300:1、少なくとも400:1、少なくとも500:1、少なくとも600:1、少なくとも700:1、少なくとも800:1、少なくとも900:1、もしくは少なくとも1000:1、またはそれを超える目的の点変異とインデルとの比率を生成することができる。
目的の変異およびインデルの数は、例えば、その全体の内容をここに参照により組み込まれる国際PCT出願PCT/2017/045381(WO2018/027078)およびPCT/US2016/058344(WO2017/070632);Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016);Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017);およびKomor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017)に記載されるような適した方法を用いて決定することができる。
一部の実施形態では、インデルの頻度を計算するために、配列解析のリードが、インデルの発生し得る枠の両側に位置する2つの10bp配列との正確な一致について走査される。正確な一致が位置しない場合には、リードは解析から除外される。このインデル枠の長さが参照配列と正確に一致する場合には、リードは、インデルを含有しないものとして分類される。インデル枠が参照配列よりも長いかまたは短い2つ以上の塩基である場合には、次いで、配列解析のリードは、それぞれ挿入または欠失として分類される。一部の実施形態では、本明細書に示される塩基エディターは、核酸の領域中のインデルの形成を制限し得る。一部の実施形態では、この領域は、塩基エディターによって標的とされたヌクレオチドにあるか、または塩基エディターによって標的とされる2、3、4、5、6、7、8、9、または10ヌクレオチドのヌクレオチド内の領域である。
標的ヌクレオチド領域に形成されるインデルの数は、核酸(例えば、細胞のゲノム内の核酸)が塩基エディターに曝露される回数の量に依存し得る。一部の実施形態では、インデルの数または割合は、標的ヌクレオチド配列(例えば、細胞のゲノム内の核酸)を塩基エディターに曝露してから少なくとも1時間後、少なくとも2時間後、少なくとも6時間後、少なくとも12時間後、少なくとも24時間後、少なくとも36時間後、少なくとも48時間後、少なくとも3日後、少なくとも4日後、少なくとも5日後、少なくとも7日後、少なくとも10日後、または少なくとも14日後に決定される。本明細書に記載される塩基エディターの特性が、本明細書に示される任意の融合タンパク質、または融合タンパク質を用いる方法に適用され得ることを認識するべきである。
多重編集
一部の実施形態では、本明細書に提供される塩基エディターシステムは、1つまたは複数の遺伝子における複数の核酸塩基対の多重編集が可能である。一部の実施形態では、複数の核酸塩基対は、同じ遺伝子に位置する。一部の実施形態では、複数の核酸塩基対は、1つまたは複数の遺伝子に位置し、少なくとも1つの遺伝子は、異なる遺伝子座に位置する。一部の実施形態では、多重編集は、1つまたは複数のガイドポリヌクレオチドを含み得る。一部の実施形態では、多重編集は、1つまたは複数の塩基エディターシステムを含み得る。一部の実施形態では、多重編集は、単一ガイドポリヌクレオチドを有する1つまたは複数の塩基エディターシステムを含み得る。一部の実施形態では、多重編集は、複数のガイドポリヌクレオチドを含む1つまたは複数の塩基エディターシステムを含み得る。一部の実施形態では、多重編集は、単一の塩基エディターシステムを伴う1つまたは複数のガイドポリヌクレオチドを含み得る。一部の実施形態では、多重編集は、標的ポリヌクレオチド配列への結合を標的とするためのPAM配列を必要としない、少なくとも1つのガイドポリヌクレオチドを含み得る。一部の実施形態では、多重編集は、標的ポリヌクレオチド配列への結合を標的とするためのPAM配列を必要とする、少なくとも1つのガイドポリヌクレオチドを含み得る。一部の実施形態では、多重編集は、標的ポリヌクレオチド配列への結合を標的とするためのPAM配列を必要としない少なくとも1つのガイドポリヌクレオチドと、標的ポリヌクレオチド配列への結合を標的とするためのPAM配列を必要とする少なくとも1つのガイドポリヌクレオチドとの混合物を含み得る。本明細書に記載される任意の塩基エディターを用いる多重編集の特性が、本明細書に示される任意の塩基エディターを用いる方法の任意の組合せに適用され得ることを理解するべきである。また、本明細書に記載される任意の塩基エディターを用いる多重編集が、複数の核酸塩基対を順次編集することを含み得ることも理解するべきである。
一部の実施形態では、上記複数の核酸塩基対は、1つを超える遺伝子にある。一部の実施形態では、上記複数の核酸塩基対は、同じ遺伝子にある。一部の実施形態では、上記1つを超える遺伝子のうち少なくとも1つの遺伝子は、異なる遺伝子座に位置する。
一部の実施形態では、編集とは、少なくとも1つのタンパク質コード領域中の複数の核酸塩基対の編集である。一部の実施形態では、編集とは、少なくとも1つのタンパク質非コード領域中の複数の核酸塩基対の編集である。一部の実施形態では、編集とは、少なくとも1つのタンパク質コード領域および少なくとも1つのタンパク質非コード領域中の複数の核酸塩基対の編集である。
一部の実施形態では、編集は、1つまたは複数のガイドポリヌクレオチドに連係する。一部の実施形態では、塩基エディターシステムは、1つまたは複数の塩基エディターシステムを含み得る。一部の実施形態では、塩基エディターシステムは、単一ガイドポリヌクレオチドに連係する1つまたは複数の塩基エディターシステムを含み得る。一部の実施形態では、塩基エディターシステムは、複数のガイドポリヌクレオチドに連係する1つまたは複数の塩基エディターシステムを含み得る。一部の実施形態では、編集は、単一の塩基エディターシステムを伴う1つまたは複数のガイドポリヌクレオチドに連係する。一部の実施形態では、編集は、標的ポリヌクレオチド配列への結合を標的とするためのPAM配列を必要としない、少なくとも1つのガイドポリヌクレオチドに連係する。一部の実施形態では、編集は、標的ポリヌクレオチド配列への結合を標的とするためのPAM配列を必要とする、少なくとも1つのガイドポリヌクレオチドに連係する。一部の実施形態では、編集は、標的ポリヌクレオチド配列への結合を標的とするためのPAM配列を必要としない少なくとも1つのガイドポリヌクレオチドと、標的ポリヌクレオチド配列への結合を標的とするためのPAM配列を必要とする少なくとも1つのガイドポリヌクレオチドとの混合物に連係する。本明細書に記載される任意の塩基エディターを用いる多重編集の特性が、本明細書に示される任意の塩基エディターを用いる方法の任意の組合せに適用され得ることを理解するべきである。また、編集が、複数の核酸塩基対を順次編集することを含み得ることも理解するべきである。
塩基エディターを用いる方法
転写を可能にするSDS関連遺伝子の編集は、治療および基礎研究における遺伝子編集の新しいストラテジーを開拓する。
本開示は、遺伝子変換に関連するか、または遺伝子変換ならびに点変異に起因する疾患(例えばSDS)であると診断された対象の治療のための方法を提供し、上記点変異は、スプライシングに影響し(例えば、スプライスドナーまたはアクセプター部位を変える)、このスプライシングは、本明細書に示される塩基エディターシステムによって修正することができる。例えば、一部の実施形態では、そのような疾患、例えば、遺伝子変換または他の遺伝子変異に起因する疾患に罹っている対象に、有効量の核酸塩基エディター(例えば、アデノシンデアミナーゼ塩基エディターまたはシチジンデアミナーゼ塩基エディター)を投与することを含む方法が提供され、核酸塩基エディターは、スプライシングが可能になるように遺伝子変換を編集するか、または疾患関連遺伝子中の別の変異を編集する(例えば、ストップコドンをミスセンス変異に変換するか、スプライスアクセプターまたはドナー部位を挿入するか、または変異を含むスプライスドナーまたはアクセプター部位を修正する)。
ある特定の態様では、異常な遺伝子スプライシングおよび/または未熟なタンパク質切詰を結果として生じるSBDSタンパク質をコードするSBDS(SBDSPを含む)遺伝子中の変異(例えば、遺伝子変換)に関連または起因する、SDSの治療のための方法が提供される。遺伝子変換の影響は、デアミナーゼ媒介性遺伝子編集によって改善し、この遺伝子編集は、例えば、転写を可能にするかまたは正常なスプライシングを可能にする点変異を導入する。
それぞれの配列、例えば、疾患関連遺伝子またはそのコードされるタンパク質のポリヌクレオチド配列またはアミノ酸配列における特定の位置または残基の付番は、それぞれ、具体的なタンパク質および用いられる付番スキームに依存することが理解されよう。付番は、例えば、成熟タンパク質の前駆体と成熟タンパク質自体とで異なることがあり、種間の配列の差異は、付番に影響を及ぼすことがある。当業者は、当技術分野に周知される方法によって、例えば、配列のアラインメントおよび相同な残基の決定によって、任意の相同なタンパク質およびその各コード核酸の各残基を特定することができるものとなる。
本明細書に示されるのは、疾患または障害に関連する標的ヌクレオチド配列中の核酸塩基を編集するための塩基エディターまたは塩基エディターシステムを用いる方法である。一部の実施形態では、塩基エディター(例えば、アデノシンデアミナーゼおよびCas9ドメインを含む)の活性は、遺伝子変換の編集または点変異(例えば、スプライスアクセプターまたはドナー部位を変更する変異)の修正を結果として生じる。一部の実施形態では、標的DNA配列は、疾患または障害に関連するG→A点変異を含み、その場合、変異体A塩基の脱アミノ化は、疾患または障害に関連しない配列を結果として生じる。一部の実施形態では、標的DNA配列は、疾患または障害に関連するT→C点変異を含み、その場合、変異体C塩基の脱アミノ化は、疾患または障害に関連しない配列を結果として生じる。他の実施形態では、標的DNA配列は、スプライシングを中断する遺伝子変換事象によって変更されており、遺伝子変換内の部位の脱アミノ化によって、転写およびスプライシングが可能になる。
一部の実施形態では、標的DNA配列は、タンパク質(例えば、SBDSタンパク質)をコードし、点変異はコドン内にあり、野生型コドンに比べると変異体コドンによりコードされるアミノ酸の変化を結果として生じる。一部の実施形態では、変異体Aの脱アミノ化は、変異体コドンによりコードされるアミノ酸の変化を結果として生じる。一部の実施形態では、変異体Aの脱アミノ化は、野生型アミノ酸をコードするコドンを結果として生じる。一部の実施形態では、変異体Cの脱アミノ化は、変異体コドンによりコードされるアミノ酸の変化を結果として生じる。一部の実施形態では、変異体Cの脱アミノ化は、野生型アミノ酸をコードするコドンを結果として生じる。一部の実施形態では、対象は、疾患もしくは障害があるか、またはそれがあると診断されている。
一部の実施形態では、本明細書に示されるアデノシンデアミナーゼは、DNAのデオキシアデノシン残基のアデニンを脱アミノ化することができる。本開示の他の態様は、アデノシンデアミナーゼ(例えば、本明細書に記載されるようにDNA中でデオキシアデノシンを脱アミノ化するアデノシンデアミナーゼ)と、特異的なヌクレオチド配列に結合できるドメイン(例えば、Cas9またはCpf1タンパク質)とを含む融合タンパク質を提供する。例えば、アデノシンはイノシン残基に変換され得るが、このイノシン残基は、典型的にはシトシン残基と塩基対を形成する。そのような融合タンパク質は、核酸配列の標的化編集にとりわけ有用である。そのような融合タンパク質は、in vitroでのDNAの標的化編集、例えば、変異体細胞または動物の生成;標的化変異の導入、例えば、ex vivoでの細胞における、例えば、続いて同じまたは別の対象内に再導入される対象から得られる細胞における、遺伝子的な欠陥の修正または編集;およびin vivoでの標的化変異の導入に使用することができ、例えば、転写を可能にする遺伝子的な欠陥の編集が本明細書に示される核酸塩基エディターを用いて処置され得る。本開示は、デアミナーゼ、デアミナーゼおよび核酸塩基エディターを利用する融合タンパク質、核酸、ベクター、細胞、組成物、方法、キット、システムなどを提供する。
目的の変異の生成
一部の実施形態では、本明細書に示される方法の目的は、遺伝子編集を介して機能不全遺伝子の機能を回復させることである。一部の実施形態では、機能不全遺伝子の機能は、スプライシングを可能にする目的の変異を導入することによって回復される。本明細書に示される核酸塩基編集タンパク質は、in vitroでの遺伝子編集ベースのヒトの治療について、例えば、ヒト細胞培養において疾患関連変異(例えば、遺伝子変換)を編集することによって検証することができる。本明細書に示される核酸塩基編集タンパク質、例えば、ポリヌクレオチドプログラマブルヌクレオチド結合ドメイン(例えば、Cas9)と核酸塩基編集ドメイン(例えば、アデノシンデアミナーゼドメインまたはシチジンデアミナーゼドメイン)とを含む融合タンパク質を用いて、任意の単一の点AからGまたはCからTの変異を修正し得ることが、当業者により認識されるものとなる。前者の場合では、変異体AからIへの脱アミノ化により変異が修正され、後者の場合では、変異体Tと塩基対形成されているAの脱アミノ化とそれに続く1ラウンドの複製により変異が修正される。一部の実施形態では、編集は修正を生じないが、転写を可能にする変更を導入する。
一部の実施形態では、本開示は、かなりの数の目的外の変異、例えば目的外の点変異などを生成することなく、核酸(例えば、対象のゲノム内の核酸)内の「目的の変異」、例えば点変異などを効率的に生成することができる、塩基エディターを提供する。一部の実施形態では、目的の変異は、目的の変異を生成するように特異的に設計されたガイドポリヌクレオチド(例えばgRNA)に結合されている特異的塩基エディター(例えば、シチジン塩基エディターまたはアデノシン塩基エディター)によって生成される変異である。一部の実施形態では、目的の変異は、疾患または障害に関連する変異である。一部の実施形態では、目的の変異は、疾患または障害に関連するアデニン(A)からグアニン(G)への点変異である。一部の実施形態では、目的の変異は、疾患または障害に関連するシトシン(C)からチミン(T)への点変異である。一部の実施形態では、目的の変異は、遺伝子のコード領域または非コード領域内のアデニン(A)からグアニン(G)への点変異である。一部の実施形態では、目的の変異は、遺伝子のコード領域または非コード領域内のシトシン(C)からチミン(T)への点変異である。一部の実施形態では、目的の変異は、ストップコドン、例えば、遺伝子のコード領域内の未熟なストップコドンを生成する点変異である。一部の実施形態では、目的の変異は、ストップコドンを排除する変異である。
一部の実施形態では、本明細書に示される任意の塩基エディターは、1:1を超える目的の変異と目的外の変異との比率(例えば、目的の点変異:目的外の点変異)を生成することができる。一部の実施形態では、本明細書に示される任意の塩基エディターは、少なくとも1.5:1、少なくとも2:1、少なくとも2.5:1、少なくとも3:1、少なくとも3.5:1、少なくとも4:1、少なくとも4.5:1、少なくとも5:1、少なくとも5.5:1、少なくとも6:1、少なくとも6.5:1、少なくとも7:1、少なくとも7.5:1、少なくとも8:1、少なくとも10:1、少なくとも12:1、少なくとも15:1、少なくとも20:1、少なくとも25:1、少なくとも30:1、少なくとも40:1、少なくとも50:1、少なくとも100:1、少なくとも150:1、少なくとも200:1、少なくとも250:1、少なくとも500:1、もしくは少なくとも1000:1、またはそれを超える目的の変異と目的外の変異との比率(例えば、目的の点変異:目的外の点変異)を生成することができる。
塩基エディターの効率の詳細は、国際PCT出願PCT/2017/045381(WO2018/027078)およびPCT/US2016/058344(WO2017/070632)に記載されており、そのどちらも本明細書に参照によりその全体が組み込まれている。また、全体の内容が参照によりここに組み込まれる、Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016);Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017);およびKomor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017)も参照されたい。
一部の実施形態では、1つまたは複数の遺伝子における複数の核酸塩基対の編集は、少なくとも1つの目的の変異の形成を結果として生じる。一部の実施形態では、少なくとも1つの目的の変異の形成は、変異に起因する疾患の精確な修正を結果として生じる。他の実施形態では、編集は、標的遺伝子の転写を可能にする変更を導入する。そのような変更としては、スプライスドナーまたはアクセプター部位の挿入、ストップコドンを変更して転写を可能にするミスセンス変異の導入、またはスプライスコドンの修正もしくは導入が挙げられる。本明細書に記載される塩基エディターの多重編集の特性が、本明細書に示される塩基エディターを用いる方法の任意の組合せに適用され得ることが理解されるべきである。
SBDSポリヌクレオチドにおける病原性変異の編集
一実施形態では、目的の変異は、遺伝子変換事象によって導入されたストップコドンを変更し、ストップコドンは、SBDSポリペプチドの未熟な切詰を結果として生じ、転写を可能にする点変異を導入する。点変異は、遺伝子変換を受けているかまたは異常なスプライシングを引き起こす点変異を含むSBDS遺伝子のスプライシングを回復させる、新しいスプライスアクセプターまたはスプライスドナー部位を導入する。一部の実施形態では、新しいスプライスアクセプターまたはスプライスドナー部位の挿入は、正常なスプライシングを回復させないが、しかし、野生型活性を有するかまたはSDSを有するもしくは発症するリスクがある対象の細胞で発現された際に治療効果を有するのに十分な活性を有する、SBDS タンパク質の発現を可能にする。
一部の実施形態では、目的の変異は、SDSに関連するSBDS遺伝子中のスプライス部位(例えば、ドナーまたはアクセプター)における、病原性変異または疾患原因変異の精確な修正である。一部の実施形態では、病原性変異は、疾患または障害に関連するG→A点変異であり、この場合、AからGへの塩基エディター(ABE)による変異体A塩基の脱アミノ化は、疾患または障害に関連しない配列を結果として生じる。一部の実施形態では、病原性変異はC→T点変異である。C→T点変異は、例えば、AからGへの塩基エディター(ABE)を反対鎖に標的として向け、病原性のT核酸塩基の相補的なAを編集することによって、修正することができる。一部の実施形態では、病原性変異は、疾患または障害に関連するT→C点変異であり、この場合、CからTへの塩基エディター(BEまたはCBE)による変異体C塩基の脱アミノ化は、疾患または障害に関連しない配列を結果として生じる。一部の実施形態では、病原性変異はA→G点変異である。A→G点変異は、例えば、CBEを反対鎖に標的として向け、病原性のG核酸塩基の相補的なCを編集することによって、修正することができる。一部の実施形態では、変異は、異常なスプライシングおよび/またはフレームシフトを引き起こすSBDS遺伝子内の258+2T>C変異である。他の実施形態では、変異は、異常なスプライシングおよび/またはフレームシフトを引き起こすSBDS遺伝子内の83~184TA>CT変異である。
送達システム
本明細書に開示される塩基エディターは、ウイルスベクターに含有される核酸にコードされ得る。ウイルスベクターとしては、レンチウイルス、アデノウイルス、レトロウイルス、およびアデノ随伴ウイルス(AAV)を挙げることができる。ウイルスベクターは、適用に基づき選択することができる。例えば、AAVは、その穏やかな免疫原性ゆえに、in vivoでの遺伝子送達に一般的に用いられる。アデノウイルスは、強力な免疫原性応答を誘導することから、ワクチンとして一般的に用いられる。ウイルスベクターのパッケージング能により、ベクター内にパッケージング可能な塩基エディターのサイズが制限されることがある。例えば、AAVのパッケージング能は、2つの145塩基の末端逆位反復配列(ITR)を含む約4.5kbである。
AAVは、パルボウイルスファミリーに属する小さな一本鎖DNA依存性ウイルスである。4.7kbの野生型(wt)AAVゲノムは、4つの複製タンパク質と3つのカプシドタンパク質とをそれぞれコードする2つの遺伝子から成り、両側面に145bpの末端逆位反復配列(ITR)が配置されている。ビリオンは、3つのカプシドタンパク質Vp1、Vp2、およびVp3から構成され、これらは、同じオープンリーディングフレームから、しかし異なるスプライシング(Vp1)および選択的翻訳開始部位(Vp2およびVp3のそれぞれ)により1:1:10の比率で産生される。Vp3は、ビリオン中で最も豊富なサブユニットであり、ウイルスの向性を規定する細胞表面での受容体の認識に関与する。ウイルスの伝染性において機能するホスホリパーゼドメインが、Vp1の固有のN末端に同定されている。
wt AAVと同様に、組換えAAV(rAAV)は、ベクターの導入遺伝子カセットの側面に配置するためにシス作用性の145bpのITRを利用し、最大4.5kbを外来DNAのパッケージングに与える。感染に続いて、rAAVは、本発明の融合タンパク質を発現し、環状のヘッド・トゥ・テールコンカテマーとしてエピゾーマルに存在することによって、宿主ゲノム内に組み込まれることなく残り続けることができる。このシステムを用いたrAAVの成功例はin vitroおよびin vivoで数多くあるものの、遺伝子のコード配列の長さがwt AAVゲノム以上のサイズである場合、このパッケージング能の制約ゆえに、AAV媒介性遺伝子送達の使用が制限されている。
上記のAAVベクターのパッケージング能の低さは、このサイズを超える数多くの遺伝子の送達および/または大きな生理学的調節因子の使用を難題としている。これらの難題には、例えば、送達されるタンパク質を2つ以上の断片に分けることによって対処することができ、その場合、N末端断片は、分割されたインテイン-Nに融合され、C末端断片は、分割されたインテイン-Cに融合される。これらの断片は、次いで、2つ以上のAAVベクター内にパッケージングされる。本明細書に用いられる際に、「インテイン」とは、側面に位置するN末端エクステインおよびC末端エクステイン(例えば、接合される断片)を連結する、自己スプライシングタンパク質イントロン(例えば、ペプチド)を指す。異種タンパク質断片を接合するためのある特定のインテインの使用は、例えば、Wood et al., J. Biol. Chem. 289(21); 14512-9 (2014)に記載されている。例えば、別々のタンパク質断片に融合される場合に、インテインIntNおよびIntCは、互いに認識し、それらをスプライスアウトすると同時にそれらの融合されていた側面に位置するタンパク質断片のN末端エクステインとC末端エクステインとを連結し、それによって2つのタンパク質断片から完全長のタンパク質を再構成する。他の適したインテインは、当業者に明らかとなろう。
本発明の融合タンパク質の断片は、長さが様々となり得る。一部の実施形態では、タンパク質断片は、長さが2アミノ酸から約1000アミノ酸に及ぶ。一部の実施形態では、タンパク質断片は、長さが約5アミノ酸から約500アミノ酸に及ぶ。一部の実施形態では、タンパク質断片は、長さが約20アミノ酸から約200アミノ酸に及ぶ。一部の実施形態では、タンパク質断片は、長さが約10アミノ酸から約100アミノ酸に及ぶ。他の長さの適したタンパク質断片は、当業者に明らかになるものとなる。
一部の実施形態では、ヌクレアーゼ(例えば、Cas9)の一部または断片は、インテインに融合される。ヌクレアーゼは、インテインのN末端またはC末端に融合される。一部の実施形態では、融合タンパク質の一部または断片は、インテインに融合され、AAVカプシドタンパク質に融合される。インテイン、ヌクレアーゼ、およびカプシドタンパク質は、任意の配置(例えば、ヌクレアーゼ-インテイン-カプシド、インテイン-ヌクレアーゼ-カプシド、カプシド-インテイン-ヌクレアーゼなど)で併せて融合することができる。一部の実施形態では、インテインのN末端は、融合タンパク質のC末端に融合され、インテインのC末端は、AAVカプシドタンパク質のN末端に融合される。
一実施形態では、デュアルAAVベクターが、大きな導入遺伝子発現カセットを2つの別々の半片(5’端および3’端、またはヘッドおよびテール)に分割することによって生成され、カセットの半片はそれぞれ単一のAAVベクター(<5kb)にパッケージングされる。次いで、両方のデュアルAAVベクターが同じ細胞に共感染し、その後:(1)5’ゲノムと3’ゲノムとの間の相同組換え(HR)(デュアルAAV重複ベクター);(2)5’ゲノムと3’ゲノムとのITR-媒介性テイル・トゥ・ヘッドコンカテマー化(デュアルAAVトランス-スプライシングベクター);または(3)これらの2つの機構の組合せ(デュアルAAVハイブリッドベクター)が起こると、完全長の導入遺伝子の発現カセットの再組立てが達成される。in vivoでデュアルAAVベクターを使用する結果、完全長タンパク質の発現が生じる。デュアルAAVベクターのプラットフォームの使用は、>4.7kbのサイズの導入遺伝子の効率的かつ実行可能な遺伝子導入ストラテジーを代表するものである。
塩基エディターを設計するための開示されたストラテジーは、ウイルスベクター内にパッケージングできる塩基エディターを生成するために有用であり得る。塩基エディターの送達のためのRNAまたはDNAウイルスベースのシステムの使用は、培養または宿主において特異的な細胞を標的としてウイルスを向け、ウイルス性のペイロードを核または宿主細胞ゲノムと遣り取りするための、高度に進化した過程を利用する。ウイルスベクターは、培養内の細胞、患者(in vivo)に直接的に投与することもできるし、細胞をin vitroで処置するのに用いることもでき、改変された細胞は、任意選択的に患者(ex vivo)に投与することができる。従来のウイルスベースのシステムは、遺伝子移入に用いるレトロウイルス、レンチウイルス、アデノウイルス、アデノ随伴、および単純ヘルペスウイルスのベクターを含む。宿主ゲノム内の組み込みは、レトロウイルス、レンチウイルス、およびアデノ随伴ウイルスの遺伝子移入方法を用いて可能であり、多くの場合に、挿入された導入遺伝子の長期の発現をもたらす。さらに、数多くの異なる細胞タイプおよび標的組織で高い形質導入効率が観察されている。
レトロウイルスの向性は、外来エンベロープタンパク質を組み込み、標的細胞の潜在的な標的集団を拡大することによって、変更することができる。レンチウイルスベクターは、非分裂性細胞に形質導入するかまたは感染させることのできるレトロウイルスベクターであり、典型的には高いウイルス力価を生じる。そのため、レトロウイルス遺伝子移入システムの選択は、標的組織に依存するものとなる。レトロウイルスベクターは、最大6~10kbの外来配列のパッケージング能を有する、シス作用性の長い末端反復配列から構成される。最小限のシス作用性LTRが、複製およびベクターのパッケージングに充分であり、次いで、ベクターが、標的細胞内に治療遺伝子を組み込んで永続的な導入遺伝子の発現をもたらすために用いられる。広く使用されるレトロウイルスベクターとしては、マウス白血病ウイルス(MuLV)、テナガザル白血病ウイルス(GaLV)、サル免疫不全ウイルス(SIV)、ヒト免疫不全ウイルス(HIV)、およびそれらの組合せに基づくものが挙げられる(例えば、Buchscher et al., J. Virol. 66:2731-2739 (1992);Johann et al., J. Virol. 66:1635-1640 (1992);Sommnerfelt et al., Virol. 176:58-59 (1990);Wilson et al., J. Virol. 63:2374-2378 (1989);Miller et al., J. Virol. 65:2220-2224 (1991);PCT/US94/05700を参照)。
レトロウイルスベクター、特にレンチウイルスベクターは、標的細胞内への効率的な組み込みのための所与の長さよりも小さなポリヌクレオチド配列を要する。例えば、9kb超の長さのレトロウイルスベクターは、結果として、より小さなサイズのものに比べて低いウイルス力価を生じることがある。一部の態様では、本開示の塩基エディターは、レトロウイルスベクターを介して効率的なパッケージングと標的細胞内への送達とを可能にするのに十分なサイズである。一部の場合では、塩基エディターは、ガイド核酸および/または標的化可能なヌクレアーゼシステムの他の構成成分と併せて発現される場合であっても効率的なパッキングと送達とを可能にするようなサイズである。
一過性発現が好適である適用では、アデノウイルスベースのシステムを使用することができる。アデノウイルスベースのベクターは、数多くの細胞のタイプで非常に高い形質導入効率を可能とし、細胞分裂を必要としない。このようなベクターを用いて、高い力価と発現レベルとが得られている。このベクターは、比較的単純なシステムで大量に生産することができる。また、アデノ随伴ウイルス(「AAV」)ベクターも、例えば、核酸およびペプチドのin vitro生産において、ならびにin vivoおよびex vivoの遺伝子治療手順のために、標的核酸により細胞を形質導入するために用いることができる(例えば、West et al., Virology 160:38-47 (1987);米国特許第4,797,368号;WO 93/24641;Kotin, Human Gene Therapy 5:793-801 (1994);Muzyczka, J. Clin. Invest. 94:1351 (1994)を参照。組換えAAVベクターの構築物は複数の刊行物に記載され、そのようなものとしては、米国特許第5,173,414号;Tratschin et al., Mol. Cell. Biol. 5:3251-3260 (1985);Tratschin, et al., Mol. Cell. Biol. 4:2072-2081 (1984);Hermonat & Muzyczka, PNAS 81:6466-6470 (1984);およびSamulski et al., J. Virol. 63:03822-3828 (1989)が挙げられる。
そのため、本明細書に記載される塩基エディターは、ウイルスベクターを用いて送達され得る。塩基エディターシステムの1つまたは複数の構成成分は、1つまたは複数のウイルスベクターにコードされ得る。例えば、塩基エディターおよびガイド核酸は、単一のウイルスベクター上にコードされ得る。他の場合では、塩基エディターおよびガイド核酸は、異なるウイルスベクター上にコードされる。どちらの場合も、塩基エディターおよびガイド核酸はそれぞれ、プロモーターおよびターミネーターに動作可能に連結され得る。
ウイルスベクター上にコードされる構成成分の組合せは、選ばれたウイルスベクターのカーゴサイズの制約によって決定され得る。
塩基エディターの非ウイルス性送達
塩基エディターに用いる非ウイルス性送達のアプローチも利用可能である。非ウイルス性核酸ベクターの重要なカテゴリーの1つはナノ粒子であり、これは有機物とすることも無機物とすることもできる。ナノ粒子は当技術分野に周知されている。任意の適したナノ粒子設計を用いて、ゲノム編集システムの構成成分またはそのような構成成分をコードする核酸を送達することができる。例として、有機(例えば、脂質および/またはポリマー)ナノ粒子が、本開示のある特定の実施形態における送達ビヒクルとしての使用に適することがある。ナノ粒子製剤での使用のための例示的な脂質および/または遺伝子移入を表8(下記)に示す。
Figure 2022545950000049
Figure 2022545950000050
表9では、遺伝子移入および/またはナノ粒子製剤における使用のための例示的なポリマーを挙げる。
Figure 2022545950000051
表10は、本明細書に記載される融合タンパク質をコードするポリヌクレオチドのための送達方法の概要を示す。
Figure 2022545950000052
別の態様では、ゲノム編集システム構成成分またはそのような構成成分をコードする核酸、例えば、Cas9またはそのバリアントなどの核酸結合タンパク質と、目的のゲノム核酸配列を標的とするgRNAとの送達は、リボ核タンパク質(RNP)を細胞に送達することによって達成されてもよい。RNPは、核酸結合タンパク質、例えば、Cas9を標的化gRNAとの複合体に含む。RNPは、公知の方法、例えば、エレクトロポレーション、ヌクレオフェクション、またはカチオン性脂質により媒介される方法、例えば、Zuris, J.A. et al., 2015, Nat. Biotechnology, 33(1):73-80に報告されるものなどを用いて、細胞に送達されてもよい。RNPは、CRISPR塩基編集システムでの使用に有利であり、特にトランスフェクトの難しい細胞、例えば初代細胞などに有利である。さらに、RNPは、細胞でのタンパク質発現に伴って起こり得る困難も軽減することができ、特に、CRISPRプラスミド内に用いられ得る真核プロモーター、例えばCMVまたはEF1Aがあまり発現されない場合に軽減することができる。有利なことに、RNPの使用では、細胞内への外来DNAの送達が必要とされない。しかも、核酸結合タンパク質とgRNAとの複合体を含むRNPは経時的に分解されるため、RNPの使用は、オフターゲット効果を制限する可能性がある。プラスミドベースの手法と同様の様式で、RNPを用いて結合タンパク質(例えば、Cas9バリアント)を送達し、相同性指向型修復(HDR)に方向付けることができる。
塩基エディターをコードする核酸分子の発現を駆動するのに用いられるプロモーターは、AAV ITRを含み得る。このことは、ベクター内でスペースを取りかねない追加のプロモーター因子の必要性を排除するのに有利となり得る。この空いた追加のスペースは、追加の因子、例えばガイド核酸または選択マーカーなどの発現を駆動するために用いることができる。ITR活性は比較的弱いため、選ばれたヌクレアーゼの過剰発現に起因する潜在的な毒性を低減するのに用いることができる。
任意の適したプロモーターを用いて、塩基エディターと、適切であればガイド核酸との発現を駆動することができる。遍在性の発現のために、使用可能なプロモーターとしては、CMV、CAG、CBh、PGK、SV40、フェリチン重鎖または軽鎖などが挙げられる。脳細胞または他のCNS細胞での発現のために、適したプロモーターとしては、全てのニューロンにシナプシンI、興奮ニューロンにCaMKIIアルファ、GABA作動性ニューロンにGAD67またはGAD65またはVGATなどを挙げることができる。肝細胞での発現のために、適したプロモーターとしては、アルブミンプロモーターが挙げられる。肺細胞での発現のために、適したプロモーターとしてはSP-Bを挙げることができる。内皮細胞のために、適したプロモーターとしてはICAMを挙げることができる。造血細胞のために、適したプロモーターとしては、IFNベータまたはCD45を挙げることができる。骨芽細胞のために、適したプロモーターとしてはOG-2を挙げることができる。
一部の場合では、本開示の塩基エディターは、同じ核酸分子内で塩基エディターとその適合するガイド核酸との別々のプロモーターに発現を駆動させるには充分に小さなサイズである。例として、ベクターまたはウイルスベクターは、塩基エディターをコードする核酸に動作可能に連結された第1のプロモーターと、ガイド核酸に動作可能に連結された第2のプロモーターとを含み得る。
ガイド核酸の発現を駆動するのに用いられるプロモーターとしては、U6またはH1などのPolIIIプロモーター、gRNAアデノ随伴ウイルス(AAV)の発現のためのPolIIプロモーターおよびイントロンカセットの使用を挙げることができる。
1つまたは複数のガイド核酸を伴うかまたは伴わない本明細書に記載される塩基エディターは、アデノ随伴ウイルス(AAV)、レンチウイルス、アデノウイルス、または他のプラスミドもしくはウイルスベクターのタイプを用いて、具体的には、例えば、米国特許第8,454,972(アデノウイルスについての製剤、投与量)、米国特許第8,404,658(AAVについての製剤、投与量)、および米国特許第5,846,946(DNAプラスミドについての製剤、投与量)から、ならびにレンチウイルス、AAV、およびアデノウイルスの関与する臨床試験および臨床試験に関する刊行物から得られる製剤または投与量を用いて、送達され得る。例えば、AAVについては、投与経路、製剤、および投与量を、米国特許第8,454,972号のように、およびAAVの関与する臨床試験のようにすることができる。アデノウイルスについては、投与経路、製剤、および投与量は、米国特許第8,404,658号のように、およびアデノウイルスの関与する臨床試験のようにすることができる。プラスミド送達については、投与経路、製剤、および投与量は、米国特許第5,846,946号のように、およびプラスミドの関与する臨床試験のようにすることができる。投与量は、平均70kgの個体(例えば成人男性)に基づくかまたは外挿することができ、異なる体重および種の患者、対象、哺乳動物に調整することができる。投与の頻度は、年齢、性別、全身の健康状態を含む通常の要因、患者または対象の他の状態、および対処中の特定の状態および症状に応じて、医療従事者または獣医療従事者(例えば、医師、獣医師)の裁量内にある。ウイルスベクターは、目的の組織に注入することができる。細胞型特異的な塩基編集については、塩基エディターおよび任意選択的なガイド核酸の発現は、細胞型特異的プロモーターによって駆動させることができる。
in vivo送達のために、AAVは、他のウイルスベクターを超えて有利となり得る。一部の場合では、AAVは低い毒性を可能とし、それは、免疫応答を活性化し得る細胞粒子の超遠心分離を必要としない精製方法に起因する。一部の場合では、AAVは、宿主ゲノム内に組み込まれないため、挿入型変異を引き起こす可能性を低減することを可能にする。
AAVは、4.5または4.75Kbのパッケージングの限界がある。このことは、開示された塩基エディターならびにプロモーターおよび転写ターミネーターを、単一のウイルスベクター内に合わせることができることを意味する。4.5または4.75Kbを超える構築物は、ウイルス産物の大幅な低減に繋がり得る。例えば、SpCas9は非常に大きく、遺伝子自体は4.1Kb超であり、AAV内へのパッキングが困難となっている。そのため、本開示の実施形態は、従来の塩基エディターよりも長さの短い、開示された塩基エディターを利用することを含む。一部の例では、塩基エディターは4kb未満である。開示された塩基エディターは、4.5kb、4.4kb、4.3kb、4.2kb、4.1kb、4kb、3.9kb、3.8kb、3.7kb、3.6kb、3.5kb、3.4kb、3.3kb、3.2kb、3.1kb、3kb、2.9kb、2.8kb、2.7kb、2.6kb、2.5kb、2kb、または1.5kb未満とすることができる。一部の場合では、本開示の塩基エディターは4.5kb以下の長さである。
AAVは、AAV1、AAV2、AAV5、またはそれらの組合せとすることができる。標的とされる細胞に関してAAVのタイプを選択することができ、例えば、脳細胞または神経細胞を標的とするために、AAVセロタイプ1、2、5、またはハイブリッドカプシドAAV1、AAV2、AAV5、またはそれらの任意の組合せを選択することができ、心臓組織を標的とするためにAAV4を選択することができる。AAV8は、肝臓への送達に有用である。これらの細胞に関するある特定のAAVセロタイプの一覧は、Grimm, D. et al, J. Virol. 82: 5887-5911 (2008))に見ることができる。
レンチウイルスは、有糸分裂細胞と有糸分裂後細胞の両方に感染し自身の遺伝子を発現する能力を有する、複合レトロウイルスである。最も一般に知られるレンチウイルスは、ヒト免疫不全ウイルス(HIV)であり、このウイルスは、他のウイルスのエンベロープ糖タンパク質を用いて広範な細胞タイプを標的とする。
レンチウイルスは以下のように調製することができる。pCasES10(レンチウイルス移入プラスミド骨格を含有)をクローニングした後、継代の浅い(p=5)HEK293FTを、トランスフェクションの前日にT75フラスコにて、10%ウシ胎児血清を含み抗生物質を含まないDMEM中に播種して集密度50%とした。20時間後、培地をOptiMEM(無血清)培地に交換し、トランスフェクションを4時間後に行った。10μgのレンチウイルス移入プラスミド(pCasES10)と以下のパッケージングプラスミド:5μgのpMD2.G(VSV-gシュードタイプ)および7.5μgのpsPAX2(gag/pol/rev/tat)とを用いて、細胞をトランスフェクトする。トランスフェクションは、カチオン性脂質送達剤(50μLのリポフェクタミン2000および100uLのPlus試薬)を含む4mLのOptiMEM中で行うことができる。6時間後、10%ウシ胎児血清を含む抗生物質不含のDMEMに培地を交換する。これらの方法は、細胞培養の間に血清を用いるが、血清不含の方法が好適である。
レンチウイルスは、以下のように精製することができる。ウイルス上清を48時間後に採取する。上清をまず残骸除去し、0.45μmの低タンパク質結合(PVDF)フィルターを通して濾過する。次いで、超遠心機で2時間、24,000rpmでスピンする。ウイルスペレットを50μLのDMEMに4℃で一晩再懸濁する。次いで、等分してすぐに-80℃で凍結する。
別の実施形態では、ウマ伝染性貧血ウイルス(EIAV)をベースとした最小限の非霊長類レンチウイルスベクターも想定される。別の実施形態では、RetinoStat.RTM、すなわち、網膜下注射を介して送達されるものと想定される血管新生抑制タンパク質エンドスタチンおよびアンジオスタチンを発現するウマ伝染性貧血ウイルスベースのレンチウイルス遺伝子治療ベクターである。別の実施形態では、自己不活性化レンチウイルスベクターの使用が想定される。
本システムの任意のRNA、例えば、ガイドRNAまたは塩基エディターコードmRNAは、RNAの形態で送達される。塩基エディターコードmRNAは、in vitro転写を用いて生成され得る。例えば、ヌクレアーゼmRNAは、以下の因子:T7プロモーター、任意選択的なkozak配列(GCCACC)、ヌクレアーゼ配列、および3’UTR、例えばベータグロビン-ポリAテール由来の3’UTRなどを含有するPCRカセットを用いて合成され得る。カセットは、T7ポリメラーゼによる転写に用いられ得る。ガイドポリヌクレオチド(例えば、gRNA)はまた、T7プロモーターを含有するカセットとそれに続く配列「GG」およびガイドポリヌクレオチド配列から、in vitro転写を用いて転写され得る。
発現を亢進しあり得る毒性を低減するために、塩基エディターコード配列および/またはガイド核酸は、1つまたは複数の改変ヌクレオシドを含むように、例えばシュード-Uまたは5-メチル-Cを用いて、改変することができる。
一部の実施形態の開示は、細胞または生物を改変する方法を包含する。細胞は、原核細胞または真核細胞とし得る。細胞は哺乳類細胞とし得る。哺乳類細胞は、非ヒト霊長類、ウシ、ブタ、齧歯類、またはマウスの細胞としてよい。本開示の塩基エディター、組成物、および方法によって細胞に導入される改変は、細胞および細胞の子孫が、例えば抗体、デンプン、アルコール、または他の所望の細胞性産生物などの生体産物の産生の向上のために変更されるようにすることができる。本開示の方法によって細胞に導入される改変は、生産される生物製品を変える変更を細胞および細胞の子孫が含むようにすることができる。
システムは、1つまたは複数の異なるベクターを含み得る。一態様では、塩基エディターは、所望の細胞タイプ、優先的には真核細胞、好ましくは哺乳類細胞またはヒト細胞での発現のために、コドン最適化されている。
概して、コドン最適化とは、生得の配列の少なくとも1つのコドン(例えば、約または約を超える1、2、3、4、5、10、15、20、25、50個、またはそれを超えるコドン)を、その生得のアミノ酸配列を維持しながら目的の宿主細胞の遺伝子内でより高頻度でまたは最も高頻度で用いられるコドンに置き換えることによって、その宿主細胞における発現の増強のために核酸配列を改変する過程を指す。様々な種が、特定のアミノ酸の或るコドンについて特定のバイアスを示す。コドンバイアス(生物間のコドン使用の差異)は、多くの場合、メッセンジャーRNA(mRNA)の翻訳の効率に相関し、次いで、中でも、翻訳されているコドンの性質と特定の転移RNA(tRNA)分子の利用可能性に依存するものと考えられている。細胞における選択されるtRNAの優位性は、概して、ペプチド合成において最も高頻度で使用されるコドンの反映である。したがって、遺伝子を、コドン最適化に基づいて、所与の生物における最適な遺伝子発現に合わせることができる。コドン使用表は、例えば、www.kazusa.orjp/codon/(2002年7月9日に閲覧)で入手可能な「コドン使用データベース」で容易に入手可能であり、これらの表は、複数の方法で適応させることができる。Nakamura, Y., et al. "Codon usage tabulated from the international DNA sequence databases: status for the year 2000" Nucl. Acids Res. 28:292 (2000)を参照されたい。特定の宿主細胞における発現のために特定の配列のコドンを最適化するコンピュータアルゴリズムも利用可能であり、例えばGeneForge(アプタジェン(Aptagen);ジェイコバス、ペンシルバニア州)なども利用可能である。一部の実施形態では、工学的に改変されたヌクレアーゼをコードする配列内の1つまたは複数のコドン(例えば、1、2、3、4、5、10、15、20、25、50個、もしくはそれを超えるかまたは全てのコドン)は、特定のアミノ酸に対し最も高頻度で用いられるコドンに対応する。
パッケージング細胞は、典型的には、宿主細胞に感染することのできるウイルス粒子を形成するために用いられる。そのような細胞としては、アデノウイルスをパッケージングする293細胞、およびレトロウイルスをパッケージングするpsi.2細胞またはPA317細胞が挙げられる。遺伝子治療に用いられるウイルスベクターは、通常は、核酸ベクターをウイルス粒子内にパッケージングする細胞株を生産することによって生成される。ベクターは、典型的には、パッケージングとその後の宿主内への組込みに必要な最小限のウイルス配列を含有し、他のウイルス配列は、発現するポリヌクレオチドのための発現カセットに置き換えられている。欠けているウイルス機能は、典型的には、パッケージング細胞株によってトランスに供給される。例えば、遺伝子治療に用いられるAAVベクターは、典型的には、パッケージングと宿主ゲノム内への組込みに必要なAAVゲノム由来のITR配列のみを有する。ウイルスDNAは、他のAAV遺伝子、すなわちrepおよびcapをコードするがITR配列を欠いたヘルパープラスミドを含有する細胞株に、パッケージングすることができる。また、この細胞株には、アデノウイルスをヘルパーとして感染させることができる。ヘルパーウイルスは、AAVベクターの複製とヘルパープラスミドからのAAV遺伝子の発現とを促進することができる。一部の場合のヘルパープラスミドは、ITR配列を欠いているために、顕著な量ではパッケージングされない。アデノウイルスによる汚染は、例えば、AAVよりも感受性のあるアデノウイルスに対し加熱処理することによって、低減させることができる。
医薬組成物
本開示の他の態様は、本明細書に記載される塩基エディター、融合タンパク質、または融合タンパク質-ガイドポリヌクレオチド複合体のいずれかを含む医薬組成物に関する。用語「医薬組成物」とは、本明細書に用いられる際には、医薬用途に製剤化された組成物を指す。一部の実施形態では、医薬組成物は、医薬的に許容可能な担体をさらに含む。一部の実施形態では、医薬組成物は、追加の剤(例えば、特異的な送達、半減期の延長、または他の治療化合物)を含む。
ここで用いられる際に、用語「医薬的に許容可能な担体」とは、身体のある1つの部位(例えば、送達部位)から別の部位(例えば、器官、組織、または身体の一部)への化合物の搬送または輸送に関与する医薬的に許容可能な材料、組成物、またはビヒクル、例えば液体または固体フィルターなど、希釈剤、賦形剤、製造補助剤(例えば、潤滑剤、タルクマグネシウム、ステアリン酸カルシウムもしくは亜鉛、もしくは立体酸)、または溶媒被包材を意味する。医薬的に許容可能な担体は、製剤の他の成分に親和性がある(例えば、生理学的に親和性がある、滅菌されている、生理学的なpHであるなど)が対象の組織を損なわないという意味で「許容可能」である。
医薬的に許容可能な担体として役割を果たす材料の非制限的な一部の例としては:(1)糖、例えば、ラクトース、グルコース、およびスクロースなど;(2)デンプン、例えば、トウモロコシデンプンおよびジャガイモデンプンなど;(3)セルロースおよびその誘導体、例えば、カルボキシメチルセルロースナトリウム、メチルセルロース、エチルセルロース、微結晶セルロース、および酢酸セルロース;(4)粉末トラガカント;(5)麦芽;(6)ゼラチン;(7)潤滑剤、例えば、ステアリン酸マグネシウム、ラウリル硫酸ナトリウム、およびタルクなど;(8)賦形剤、例えば、カカオバターおよび坐剤ワックスなど;(9)油、例えば、ピーナツ油、綿実油、ベニバナ油、ゴマ油、オリーブ油、トウモロコシ油、およびダイズ油など;(10)グリコール、例えば、プロピレングリコール;(11)ポリオール、例えば、グリセリン、ソルビトール、マンニトール、およびポリエチレングリコール(PEG)など;(12)エステル、例えば、オレイン酸エチルおよびラウリル酸エチルなど;(13)寒天;(14)緩衝剤、例えば、水酸化マグネシウムおよび水酸化アルミニウムなど;(15)アルギン酸;(16)パイロジェン不含水;(17)等張食塩水;(18)リンゲル溶液;(19)エチルアルコール;(20)pH緩衝剤;(21)ポリエステル、ポリカーボネートおよび/またはポリ無水物;(22)充填剤、例えば、ポリペプチドおよびアミノ酸など、(23)血清アルコール、例えばエタノールなど;ならびに(23)医薬製剤に採用される他の非毒性の親和性物質が挙げられる。また、湿潤剤、着色剤、離型剤、被覆剤、甘味剤、着香剤、芳香剤、保存剤、および抗酸化剤も製剤中に存在する。「賦形剤」、「担体」、「医薬的に許容可能な担体」、「ビヒクル」などの用語は、本明細書に互換的に用いられる。
医薬組成物は、生理学的pHを反映する所定のレベルで、例えば、約5.0から約8.0の範囲で製剤のpHを維持するための、1つまたは複数のpH緩衝化合物を含み得る。水性液体製剤に用いられるpH緩衝化合物は、アミノ酸またはアミノ酸の混合物、例えば、ヒスチジンまたはヒスチジンとグリシンなどのアミノ酸の混合物などとすることができる。あるいは、pH緩衝化合物は、好ましくは、製剤のpHを所定レベルで、例えば、約5.0から約8.0の範囲などで維持し、カルシウムイオンをキレートしない剤である。pH緩衝化合物の説明的な例としては、以下に限定されないが、イミダゾールおよび酢酸イオンが挙げられる。pH緩衝化合物は、所定のレベルで製剤のpHを維持するのに適した任意の量で存在し得る。
また、医薬組成物は、1つまたは複数の浸透調整剤、すなわち、製剤の浸透特性(例えば、張性、重量オスモル濃度、および/または浸透圧)をレシピエント個体の血流および血液細胞で許容可能なレベルに調整する化合物も含有する。浸透調整剤は、カルシウムイオンをキレートしない剤とすることができる。浸透調整剤は、製剤の浸透特性を調整する当業者に公知または利用可能な任意の化合物とすることができる。当業者は、本発明の製剤の使用に対する所与の浸透調整剤の適合性を、経験的に決定し得る。適した浸透調整剤のタイプの説明的な例としては、以下に限定されないが:塩、例えば、塩化ナトリウムおよび酢酸ナトリウムなど;糖、例えば、スクロース、デキストロース、およびマンニトールなど;アミノ酸、例えば、グリシンなど;ならびに1つまたは複数のこれらの剤および/またはタイプの剤の混合物が挙げられる。浸透調整剤は、製剤の浸透特性を調整するのに十分な任意の濃度で存在し得る。
一部の実施形態では、医薬組成物は、対象への送達のために、例えば、遺伝子編集のために製剤化される。本明細書に記載される医薬組成物を投与する適した経路としては、限定はないが:局所的、皮下、経皮、皮内、病巣内、関節内、腹腔内、膀胱内、経粘膜、歯肉、歯内、蝸牛内、経鼓膜、器官内、硬膜外、くも膜下腔内、筋肉内、静脈内、血管内、骨内、眼周囲、腫瘍内、脳内、および脳室内の投与が挙げられる。
一部の実施形態では、本明細書に記載される医薬組成物は、疾患部位(例えば、腫瘍部位)に局所的に投与される。一部の実施形態では、本明細書に記載される医薬組成物は、注射によって、カテーテルによって、坐剤によって、または例えばシアラスティック膜などの膜、もしくは繊維などを含めた多孔性、非多孔性、もしくはゼリー状の材料であるインプラントによって、対象に投与される。
他の実施形態では、本明細書に記載される医薬組成物は、徐放性システムで送達される。一実施形態では、ポンプを用いることができる(例えば、Langer, 1990, Science 249: 1527-1533; Sefton, 1989, CRC Crit. Ref. Biomed. Eng. 14:201;Buchwald et al., 1980, Surgery 88:507;Saudek et al., 1989, N. Engl. J. Med. 321:574を参照)。別の実施形態では、ポリマー材を用いることができる(例えば、Medical Applications of Controlled Release (Langer and Wise eds., CRC Press, Boca Raton, Fla., 1974); Controlled Drug Bioavailability, Drug Product Design and Performance (Smolen and Ball eds., Wiley, New York, 1984); Ranger and Peppas, 1983, Macromol. Sci. Rev. Macromol. Chem. 23:61. See also Levy et al., 1985, Science 228: 190; During et al., 1989, Ann. Neurol. 25:351; Howard et ah, 1989, J. Neurosurg. 71: 105)。他の徐放性システムは、例えば、前出のLangerに考察されている。
一部の実施形態では、医薬組成物は、対象、例えばヒトへの静脈内投与または皮下投与に適応された組成物として、定型的な手順に従って製剤化される。一部の実施形態では、注射による投与のための医薬組成物は、可溶化剤、および注射の部位での痛みを和らげるためのリグノカインなどの局所麻酔剤としての、滅菌等張使用における溶液である。概して、成分は、別々とするかまたは合わせて混合するかのどちらかで、例えば、ある量の活性剤を標示する密封された容器、例えばアンプルまたはサシェなどの中の凍結乾燥粉末または水分不含の濃縮物として、単位剤形で供給される。医薬が注入によって投与される場合、滅菌の医薬グレードの水または生理食塩水を含有する注入ボトルを用いて分注することができる。医薬組成物が注射によって投与される場合、投与前に成分を混合できるように、アンプルの注射用滅菌水または生理食塩水を付与することがある。
全身投与に用いる医薬組成物は、液体、例えば、滅菌生理食塩水、乳酸リンゲルまたはハンクス溶液とし得る。さらに、医薬組成物は、固形とし、使用の直前に再溶解または懸濁することができる。凍結乾燥形態も想定される。医薬組成物は、脂質粒子または小胞、例えば、リポソームまたは微結晶などの中に含有させることができ、それらもまた非経口の投与に適している。この粒子は、組成物が中に含有される限り、単層または複層などの任意の適した構造とすることができる。化合物は、融合性脂質ジオレオイルホスファチジルエタノールアミン(DOPE)、低レベル(5~10モル%)のカチオン性脂質を含有する「安定化プラスミド-脂質粒子」(SPLP)中に捕捉され、ポリエチレングリコール(PEG)被覆によって安定化され得る(Zhang Y. P. et ah, Gene Ther. 1999, 6: 1438-47)。正電荷の脂質、例えば、N-[l-(2,3-ジオレオイロキシ)プロピル]-N,N,N-トリメチル-アンモニウムメチルサルフェートまたは「DOTAP」などは、そのような粒子および小胞に特に好適である。そのような脂質粒子の調製は周知されている。例えば、そのそれぞれを本明細書に参照により組み込まれる米国特許第4,880,635号;第4,906,477号;第4,911,928号;第4,917,951号;第4,920,016号;および第4,921,757号を参照されたい。
本明細書に記載される医薬組成物は、例えば、単位容量として投与またはパッケージングすることができる。用語「単位容量」とは、本開示の医薬組成物を参照して用いられる際に、対象に用いる単一の投与量として適した物理的に別個の単位を指し、各単位は、必要な希釈剤;すなわち、担体またはビヒクルに関連して所望の治療効果を生じるように計算された、ある所定量の活性材を含有している。
さらに、医薬組成物は、(a)凍結乾燥形態の本発明の化合物を含有する容器と、(b)医薬的に許容可能な希釈剤を含有する第2の容器(例えば、本発明の凍結乾燥された化合物の再構成または希釈に滅菌的に用いられる とを含む医薬キットとして提供され得る。任意選択的にそのような容器に付随するのは、医薬品または生物由来製品の製造、使用、または販売を規制する行政機関によって規定された様式の通知書であり、この通知書は、ヒトへの投与についての製造、使用、または販売の当局による認可を反映する。
別の態様では、上記の疾患の治療に有用な材料を含有する製品が含まれている。一部の実施形態では、製品は、容器およびラベルを含む。適した容器としては、例えば、ボトル、バイアル、シリンジ、および試験管が挙げられる。容器は、ガラスまたはプラスチックなどの種々の材料から形成することができる。一部の実施形態では、容器は、本明細書に記載される疾患を治療するのに有効な組成物を保持し、滅菌されたアクセスポートを有し得る。例えば、容器は、静脈内溶液バッグ、または皮下注射針によって貫通可能なストッパーを有するバイアルとし得る。組成物中の活性剤は、本発明の化合物である。一部の実施形態では、容器上のまたは容器に付随するラベルは、選ばれた疾患を治療するためにその組成物が用いられることを標示する。製品は、医薬的に許容可能な緩衝液、例えば、リン酸緩衝生理食塩水、リンゲル溶液、またはデキストロース溶液などを含む、第2の容器をさらに含み得る。それは商業的な観点およびユーザの観点から望ましい他の材料をさらに含み得るが、そのようなものとしては、他の緩衝液、希釈剤、フィルター、針、シリンジ、および使用のための指示を含むパッケージ添付文書が挙げられる。
一部の実施形態では、本明細書に記載される任意の融合タンパク質、gRNA、および/または複合体は、医薬組成物の一部として提供される。一部の実施形態では、医薬組成物は、本明細書に示される任意の融合タンパク質を含む。一部の実施形態では、医薬組成物は、本明細書に示される任意の複合体を含む。一部の実施形態では、医薬組成物は、gRNAおよびカチオン性脂質との複合体を形成するRNAガイド型ヌクレアーゼ(例えば、Cas9)を含むリボ核タンパク質複合体を含む。一部の実施形態では、医薬組成物は、gRNA、核酸プログラマブルDNA結合タンパク質、カチオン性脂質、および医薬的に許容可能な賦形剤を含む。医薬組成物は、1つまたは複数の追加の治療活性物質を任意選択的に含み得る。
SDSを治療する方法
また、提供されるのは、SDSおよび/またはSDSを引き起こすSBDS遺伝子変換もしくはSBDSPに関連する遺伝子変異を治療する方法である。本方法は、本明細書に記載の塩基エディターシステム(例えば、塩基エディターおよびgRNA)をコードするポリヌクレオチドを含む治療有効量の医薬組成物を、対象(例えば、ヒトなどの哺乳動物)に投与することを含む。一部の実施形態では、塩基エディターは、ポリヌクレオチドプログラマブルDNA結合ドメインとアデノシンデアミナーゼドメインまたはシチジンデアミナーゼドメインとを含む。一部の実施形態では、塩基エディターは、ポリヌクレオチドプログラマブルDNA結合ドメインとアデノシンデアミナーゼドメインまたはシチジンデアミナーゼドメインとを含む組成物を含む。一実施形態では、塩基エディターは、ポリヌクレオチドプログラマブルDNA結合ドメインとシチジンデアミナーゼドメインとを含む。一実施形態では、塩基エディターは、ポリヌクレオチドプログラマブルDNA結合ドメインとシチジンデアミナーゼドメインとを含む組成物を含む。一部の実施形態では、塩基エディターは、ポリヌクレオチドプログラマブルDNA結合ドメインとアデノシンデアミナーゼドメインまたはシチジンデアミナーゼドメインとを含む融合タンパク質である。対象の細胞には、塩基エディターと1つまたは複数のガイドポリヌクレオチドとが形質導入され、このガイドポリヌクレオチドは、塩基エディターを標的に向けて、1つまたは複数の変異をSBDS(例えばSBDSP)遺伝子内に含有する核酸配列のA・TからG・Cへの変更(細胞にアデノシンデアミナーゼドメインが形質導入される場合)またはC・GからU・Aへの変更(細胞にシチジンデアミナーゼドメインが形質導入される場合)をもたらす。
本明細書の方法は、対象(そのような治療を必要とするものと特定された対象、または疾患のリスクがあるものと疑われそのような治療を必要とする対象を含む)に、有効量の本明細書に記載の組成物を投与することを含む。そのような治療を必要とする対象の特定は、対象または医療従事者の判断の範疇であり、主観的(例えば主張)でも客観的(例えば、試験または診断方法によって測定可能)でもあり得る。
治療方法は、概して、例えば、塩基エディターとそれを必要とする対象(例えば、ヒト患者)のSBDSまたはSBDSP遺伝子を標的とするgRNAとをコードするベクターを含む、治療有効量の医薬組成物の投与を含む。そのような治療は、SDSを患っているか、SDSに罹っているか、罹りやすいか、またはSDSのリスクがある対象、具体的にはヒト対象に、適切に投与されるものとなる。また、本明細書の組成物は、SBDSまたはSBDSをコードする遺伝子の変異が関与し得る任意の他の障害の治療に用いられてもよい。
一実施形態では、治療の進捗をモニタリングする方法が提供される。本方法は、SDSに関連する障害またはその症状を患っているかまたはそれに罹りやすい対象における診断マーカー(マーカー)(例えば、SDSに関連するSNP)または診断測定値(例えば、スクリーニング、アッセイ)のレベルを決定するステップを含み、その場合、対象は、疾患またはその症状を治療するのに十分な治療量の本明細書の組成物を投与されている。本方法で決定されるマーカーのレベルを、健康で正常な対照または他の罹患者のどちらかにおける既知のマーカーのレベルと比較して、対象の疾患の状態を確定することができる。好適な実施形態では、対象におけるマーカーの第2のレベルを、第1のレベルの決定よりも後の時点で決定し、この2つのレベルを比較して、疾患のコースまたは療法の効能をモニタリングする。ある好適な実施形態では、対象におけるマーカーの治療前レベルを、本発明による治療を始める前に決定する。そして、このマーカーの治療前レベルを、次いで治療開始後の対象におけるマーカーのレベルに比較して、治療の効能を決定することができる。
一部の実施形態では、本明細書に示される組成物は、標的化されたゲノム改変を対象内でもたらすために、対象、例えばヒト対象に投与される。一部の実施形態では、細胞を対象から取得して、本明細書に示される任意の医薬組成物に接触させる。一部の実施形態では、対象から取り出されてex vivoで医薬組成物に接触された細胞は、任意選択的に所望のゲノム改変が細胞にもたらされて検出された後に、対象内に再導入される。ヌクレアーゼを含む医薬組成物を送達する方法は公知であり、例えば、米国特許第6,453,242号;第6,503,717号;第6,534,261号;第6,599,692号;第6,607,882号;第6,689,558号;第6,824,978号;第6,933,113号;第6,979,539号;第7,013,219号;および第7,163,824号に記載されており、これらの全ての開示は、参照により本明細書にその全体を組み込まれている。本明細書に示される医薬組成物の記載は、主にヒトへの投与に適した医薬組成物に向けられているとはいえ、そのような組成物が概ね、あらゆる動物または生物への投与、例えば獣医学的な用途に適していることが、当業者により理解されよう。
組成物を様々な動物への投与に適するものとするための、ヒトへの投与に適した医薬組成物の修飾はよく理解されており、熟練の獣医学の薬理学者は、常法のみで、もしあれば実験により、そのような修飾を設計および/または実施することができる。医薬組成物の投与が想定される対象としては、以下に限定されないが、ヒトおよび/または他の霊長類;哺乳動物、家畜動物、ペット、および商業的に妥当な哺乳動物、例えば、ウシ、ブタ、ウマ、ヒツジ、ネコ、イヌ、マウス、および/もしくはラットなど;ならびに/または商業的に妥当な鳥類を含めた鳥類、例えば、ニワトリ、アヒル、ガチョウ、および/もしくはシチメンチョウが挙げられる。
本明細書に記載される医薬組成物の製剤は、薬学分野で公知のまたは今後開発される任意の方法によって調製することができる。概して、そのような調製方法は、活性成分を賦形剤および/または1つもしくは複数の他の付帯的な成分との会合に至らせるステップ、ならびに次いで、必要であればおよび/または望ましければ、生産物を所望の単回または複数回の用量単位に成型および/またはパッケージングするステップを含む。医薬製剤は、医薬的に許容可能な賦形剤をさらに含み得るが、そのようなものとしては、本明細書に用いられる際には、所望の具体的な剤形に適した任意のおよび全ての溶媒、分散媒、希釈剤、または他の液体ビヒクル、分散助剤もしくは懸濁助剤、界面活性剤、等張剤、増粘剤、または乳化剤、保存剤、固体結合剤、潤滑剤などが挙げられる。RemingtonのThe Science and Practice of Pharmacy, 21st Edition, A. R. Gennaro(Lippincott, Williams & Wilkins, Baltimore, MD, 2006;本明細書に参照によりその全体を組み込まれる)は、医薬組成物を製剤化する際に用いられる様々な賦形剤とその調製のための公知の手法とを開示している。ヌクレアーゼを含む医薬組成物を生産するための追加の適した方法、試薬、賦形剤、および溶媒については、その全体を本明細書に参照により組み込まれるPCT出願PCT/US2010/055131(公開番号WO2011/053982 A8、2010年11月2日出願)を参照されたい。
任意の従来の賦形媒体が、例えば、任意の望まない生物学的効果を生じるか、またはその他、医薬組成物の任意の他の構成成分と有害な様式で相互作用するなど、物質またはその誘導体に非親和性である場合を除いて、その使用は、本開示の範囲内にあるものと想定される。
上記に記載されるような組成物は、有効量で投与することができる。有効量は、投与様式、治療されている具体的な状態、および所望のアウトカムに依存するものとなる。また、それは状態のステージ、対象の年齢および物理的な状態、もしあれば併用している療法の性質、および医療従事者によく知られた同様の要因にも依存することがある。治療適用に対しては、それは医学的に望ましい結果を達成するのに十分な量である。
キット
本開示の様々な態様は、塩基エディターシステムを含むキットを提供する。一実施形態では、キットは、核酸塩基エディター融合タンパク質をコードするヌクレオチド配列を含む核酸構築物を含む。融合タンパク質は、デアミナーゼ(例えば、シチジンデアミナーゼまたはアデニンデアミナーゼ)と核酸プログラマブルDNA結合タンパク質(napDNAbp)とを含む。一部の実施形態では、キットは、目的の核酸分子、例えば、SDS関連変異を標的とすることのできる少なくとも1つのガイドRNAを含む。一部の実施形態では、キットは、少なくとも1つのガイドRNAをコードするヌクレオチド配列を含む核酸構築物を含む。
キットは、一部の実施形態では、キットを用いて1つまたは複数のSDS関連変異を編集するための指示書を与える。指示書は、概して、核酸分子を編集するためのキットの使用に関する情報を含むものとなる。他の実施形態では、指示書は、以下のうち少なくとも1つを含む:事前対策、警告、臨床研究、および/または参考文献。指示書は、容器(存在すれば)上に直接的に、または容器に貼付されたラベルとして、または容器中または容器と共に供給される別々のシート、パンフレット、カード、またはフォルダとして、印刷されていてもよい。さらに別の実施形態では、キットは、指示書を、適した操作パラメーターについてラベルまたは別々の添付文書(パッケージ添付文書)の形で含み得る。さらに別の実施形態では、キットは、検出、較正、または正規化のための標品として用いられる適切な陽性および陰性の対照または対照試料と共に、1つまたは複数の容器を含み得る。キットは、医薬的に許容可能な緩衝液、例えば(滅菌の)リン酸緩衝生理食塩水、リンゲル溶液、またはデキストロース溶液などを含む第2の容器を、さらに含み得る。それは商業的な観点およびユーザの観点から望ましい他の材料をさらに含み得るが、そのようなものとしては、他の緩衝液、希釈剤、フィルター、針、シリンジ、および使用のための指示を含むパッケージ添付文書が挙げられる。
ある特定の実施形態では、キットは、シュワックマン・ダイアモンド症候群(SDS)に罹っている対象の治療に有用である。
以下の実施例は、説明のみの目的で提供され、本明細書に示される特許請求の範囲の範囲を限定することを意図されていない。
実施例1 塩基エディターにおけるPAMバリアントの検証
新規のCRISPRシステムおよびPAMバリアントは、塩基エディター(例えば、PV1-PV28)がSBDSポリヌクレオチド(例えば、SBDSPポリヌクレオチド)内の変異(例えば、スプライシングを中断させる遺伝子変換)を編集することを可能にする。いくつかの新規のPAMバリアントが評価および検証されている。PAMの評価および塩基エディターの詳細は、例えば、国際PCT出願PCT/2017/045381(WO2018/027078)およびPCT/US2016/058344(WO2017/070632)に記載されており、これらのそれぞれは本明細書に参照によりその全体を組み込まれている。また、それぞれの全体の内容がここに参照により組み込まれるKomor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016);Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017);およびKomor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017)も参照されたい。
実施例2 シュワックマン・ダイアモンド症候群(SDS)に関連する異常なスプライシングを修正するための遺伝子編集
SDSに関連する変異としては、183~184位のTA→CTジヌクレオチド変化および258+2T→C変化(図1Aおよび図1B)が挙げられる。変異258+2T→Cは、イントロン2のドナースプライス部位を中断させると予測されており、観察された8bpの欠失は、251~252位にある上流の潜在的なスプライスドナー部位の使用に整合する。ジヌクレオチド変更183~184TA→CTは、インフレームの終止コドン(K62X)を導入し、258+2T→Cおよび結果として生じる8bpの欠失は、フレームシフトにより、コードされたタンパク質の未熟な切詰を引き起こす(84Cfs3)。
異常なスプライシングを結果として生じるSBDS遺伝子内の病原性変異は、シュワックマン・ダイアモンド症候群に関連する。図2Aおよび図2Bに示すように、異常なスプライシング変異は、表11のgRNAを用いて、アデノシンデアミナーゼ活性またはシチジンデアミナーゼ活性と必要なPAM特異性とを有する塩基エディターを用いて修正される。
Figure 2022545950000053
183~184TA>CT RS113993991は、図2Aに示されるように、結果としてストップコドン(TAA)を生じる。PV1~14の中から選択されたABEは、TAAからトリプトファンをコードするTGGへの変換を導入するために用いられる。そのような変換は、アミノ酸62位でLYS(K)の代わりにTRP(W)を有するタンパク質の転写を可能にするものとなる。
塩基エディター(PV1~14)は、変更(例えば、遺伝子変換)を含むSBDS遺伝子を編集するために、図2Aに図示されるgRNAに連係して用いられる。エディターPV1~14は、任意の以下の配列を有するガイドRNAを用いてSBDS遺伝子を編集するために用いられる:
5’-UGUAAAUGUUUCCUAAGGUC-3’
5’-AAUGUUUCCUAAGGUCAGGU-3’。
SDS関連変異(例えば、遺伝子変換)の修正に有用なエディター(PV1-14)の記載は以下である:
PV1. pCMV_monoABE8.1_bpNLS + Y147T
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD
PV2. pCMV_monoABE8.1_bpNLS + Y147R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCRFFRMPRQVFNAQKKAQSSTD
PV3 pCMV_monoABE8.1_bpNLS + Q154S
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRSVFNAQKKAQSSTD
PV4 pCMV_monoABE8.1_bpNLS + Y123H
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
PV5 pCMV_monoABE8.1_bpNLS + V82S
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYSTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
PV6 pCMV_monoABE8.1_bpNLS + T166R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSRD
PV7 (pCMV_monoABE8.1_bpNLS + Q154R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRRVFNAQKKAQSSTD
PV8 pCMV_monoABE8.1_bpNLS + Y147R_Q154R_Y123H
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTD
PV9 pCMV_monoABE8.1_bpNLS + Y147R_Q154R_I76Y
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTD
PV10 pCMV_monoABE8.1_bpNLS + Y147R_Q154R_T166R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSRD
PV11 pCMV_monoABE8.1_bpNLS + Y147T_Q154R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRRVFNAQKKAQSSTD
PV12 pCMV_monoABE8.1_bpNLS + Y147T_Q154S
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRSVFNAQKKAQSSTD
PV13 pCMV_monoABE8.1_bpNLS + H123Y123H_Y147R_Q154R_I76Y
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTD
PV14 pCMV_monoABE8.1_bpNLS + V82S + Q154R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYSTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRRVFNAQKKAQSSTD
以下の中から選択されるガイドRNA(gRNA)は、rs113993993258+2T>Cを標的とするために用いられる。図2Bに示すように、以下のgRNA配列は、スプライス部位に存在するシトシンを脱アミノ化するために、シチジン塩基エディターに連係して用いられ、このシトシンは、チミジンに変換され、それによってスプライシングが復活する:
5’-GUAAGCAGGCGGGUAACAGC-3’
5’-AGCAGGCGGGUAACAGCUGC-3’
5’-GCGGGUAACAGCUGCAGCAU-3’
一実施形態では、シチジン塩基エディターはBE4であるか、またはAPOBECもしくはAIDを含む。アミノ酸置換D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、およびT1337Rを含みかつ変更されたPAM 5’-NGC-3’への特異性を有する改変されたSpCas9は、SDSに関連する変異の修正のために用いられる。変更されたPAM 5’-NGG-3”に対する特異性を有する野生型SpCas9が、一部の実施形態で用いられてもよい。
スプライシングに影響を及ぼす他の病原性変異は、図2Aおよび図2Bに図示されたものと同様のストラテジーを用いて修正される。
実施例3 SDSを治療するオンターゲット編集活性が高いシチジン塩基エディター(CBE)
上記に述べたように、シュワックマン・ダイアモンド症候群(SDS)は、骨髄不全および臨床的に意味のある造血異常という特徴がある、常染色体劣性のパターンで遺伝する疾患である。SDSは、集団で1/77,000(複合ヘテロ接合体)の発生率を有し、RNAプロセッシングの欠陥をもたらすSBDS遺伝子の点変異(SNP)に起因する。SDS患者は、造血幹細胞療法(HSCT)の拒絶のリスクがより高い。1/3の患者が慢性の好中球減少を有し、そして、骨髄異形成症候群(MDS)および急性白血病が最大1/3の患者に発生する。今日まで、臨床表現型および治療は、多様性および患者特異性が高い。SDS患者に対する治療および医学的介入としては、赤血球輸血、再発および重篤な感染の管理、骨髄移植、および関連の管理が挙げられる。
例えば、本明細書に記載されるように、塩基編集を採用して、SDS疾患に関連するSNPを標的とすることによって、正しいスプライシングを回復させることによる、SDSに対する治療処置を提供する解決策。実施例2に記載されるものに加えて、変異の精確な修正のために、SBDS遺伝子中のよく見られるスプライス部位のSNPを標的とするために開発されたシチジン塩基エディター(CBE)を用いて、実験を実施した。具体的には、SBDS中の標的とした変異はrs113993993 C→Tである(図2Cおよび図2Bおよび図2D)。一実施形態では、自己由来のCD34+細胞を含むHSCTが、SBDS遺伝子内のSNP変異を標的とすることによって正しいスプライシングを回復させるためのCBE塩基編集に連係して用いられてもよい。
新しい塩基エディターを、SBDS遺伝子内のスプライス部位のSNP(例えば、SNP rs113993993258+2T>C)を標的とするために生産し評価した(図2A~図2D)。塩基エディターを、シチジンデアミナーゼ構成成分とCas9構成成分とを含むシチジン塩基エディターとし、このCas9構成成分は、(非変異型の野生型Cas9(例えば、SpCas9)ポリペプチド配列に比べて)標的ポリヌクレオチド(DNA)配列(または標的遺伝子)内の非規準のPAM配列、すなわちNGC PAMまたはNGC含有PAM、例えば、NGCC、NGCT、NGCGに結合するためのCas9の能力を付与する変異の組合せを、Cas9アミノ酸配列内に含有していた。記載された変異の組合せを含有するCas9タンパク質は、「Cas9バリアント」と称する。シチジンデアミナーゼとCas9バリアントとを含むシチジン塩基エディターは、本明細書では「NGC CBEバリアント」と称する。
図3A~図3Cは、変更型PAM5’-NGC-3’に対する特異性を有する改変型Cas9バリアント、例えば改変型SpCas9などを生じるアミノ酸置換が発生する、Cas9ポリペプチド配列内のアミノ酸位置を示す。具体的なしかも非制限的な例として、図3A~図3Cに「224」と称される改変型Cas9(SpCas9)バリアントポリペプチドは、以下のアミノ酸配列/置換の組合せD1135M、S1136Q、G1218K、E1219F、A1322R、D1332、R1335E、およびT1337Rを含み;図3A~図3Cに「225」と称される改変型Cas9(SpCas9)バリアントポリペプチドは、以下のアミノ酸配列/置換の組合せD1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、およびT1337Rを含み;図3A~図3Cに「226」と称される改変型Cas9(SpCas9)バリアントポリペプチドは、アミノ酸置換D1135M、S1136Q、G1218K、E1219F、A1322R、D1332K、R1335E、およびT1337Rを含み;図3A~図3Cに「227」と称される改変型Cas9(SpCas9)バリアントポリペプチドは、アミノ酸置換D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、およびT1337Qを含み;図3A~図3Cに「230」と称される改変型Cas9(SpCas9)バリアントポリペプチドは、アミノ酸置換D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335Q、およびT1337Qを含み;図3A~図3Cに「235」と称される改変型Cas9(SpCas9)バリアントポリペプチドは、アミノ酸置換D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335D、およびT1337Qを含み;図3A~図3Cに「237」と称される改変型Cas9(SpCas9)バリアントポリペプチドは、アミノ酸置換D1135Q、S1136、G1218T、E1219W、A1322R、D1332、R1335N、およびT1337を含み;図3A~図3Cに「242」と称される改変型Cas9(SpCas9)バリアントポリペプチドは、アミノ酸置換D1135H、S1136、G1218S、E1219W、A1322R、D1332、R1335V、およびT1337を含み;図3A~図3Cに「244」と称される改変型Cas9(SpCas9)バリアントポリペプチドは、アミノ酸置換D1135C、S1136W、G1218N、E1219W、A1322R、D1332、R1335N、およびT1337を含み;図3A~図3Cに「245」と称される改変型Cas9(SpCas9)バリアントポリペプチドは、アミノ酸置換D113LM、S1136W、G1218R、E1219S、A1322R、D1332、R1335E、およびT1337を含み;図3A~図3Cに「259」と称される改変型Cas9(SpCas9)バリアントポリペプチドは、アミノ酸置換D1135G、S1136W、G1218S、E1219M、A1322R、D1332、R1335Q、およびT1337Rを含み;図3A~図3Cに「Nureki」と称される改変型Cas9(SpCas9)バリアントポリペプチドは、アミノ酸置換L111R、D1135V、S1136Q、G1218K、E1219F、A1322R、D1332、R1335A、およびT1337Rを含み;図3A~図3Cに「NGCRd1」と称される改変型Cas9(SpCas9)バリアントポリペプチドは、アミノ酸置換D1135M、S1136、S1216G、G1218、E1219、A1322、D1332A、R1335Q、およびT1337を含み;図3A~図3Cに「267(NGCRd2)」と称される改変型Cas9(SpCas9)バリアントポリペプチドは、アミノ酸置換D1135G、S1136、S1216G、G1218、E1219、A1322R、D1332A、R1335E、およびT1337Rを含み、これらは、変更型PAM5’-NGC-3’(または5’-NGC-3’を含むPAM)に対する特異性を有し、SDSに関連する変異の修正に用いられる。これらのCas9バリアント、ならびに図3A~図3Cに示される他のものは、同じ術語、例えば、PV225、PV226、およびPV230をそれぞれ有するプラスミドが含有するポリヌクレオチドによってコードされる。これらのプラスミドを、細胞ベース(例えば、HEK293細胞)のin vitroアッセイに利用して、SBDS遺伝子内の変異型SNPを標的とするNGC CBE塩基エディターの塩基編集効率を評価する。当業者に認識されることになるように、そのようなプラスミド(プラスミドベクター)は、適したプロモーター、例えばCMVプロモーターと、シチジンデアミナーゼ構成成分およびヌクレアーゼ、例えばCas9(SpCas9)バリアントの構成成分をコードする動作可能に連結されたポリヌクレオチド配列とを含む 。一部の場合では、標的ポリヌクレオチド配列を含有するSBDSポリヌクレオチド配列の全てまたは関連部分がプラスミドに含まれていてもよいし、別々のプラスミドに含まれていてもよい。一部の実施形態では、適したプロモーター配列と、CBE構成成分のポリヌクレオチド配列および/またはSBDSポリヌクレオチド配列の全てもしくは関連部分とを含有するウイルスベクターが用いられる。一実施形態では、ベクターはレンチウイルスベクターである。一部の場合では、HEK293細胞に、標的スプライス部位のSNPを含有するSBDSポリヌクレオチド配列の全てまたは関連部分を担持するベクター、例えば、レンチウイルスベクターがトランスフェクトされる。
本明細書に記載のバリアントNGC CBEのシチジンデアミナーゼ構成成分としては、限定はないが、シチジンデアミナーゼBE4、またはAPOBEC1配列が本明細書に記載の別のAPOBECシチジンデアミナーゼ配列に置き換えられているBE4;または上記もしくは下記に記載される様々なAPOBECシチジンデアミナーゼが挙げられる。シチジンデアミナーゼrAPOBEC1、BE4-rAPOBEC1、PpAPOBEC1、BE4-PpABOBEC1、H122A置換を含有するPpAPOBEC1、H122A置換を含有するBE4-PpAPOBEC1、F130L置換を含有するBE4-RrA3F、BE4-AmAPOBEC1、およびBE4-SsAPOBEC2は、本明細書に記載のCas9バリアントおよびガイドRNAに連係して用いられた際に、塩基編集活性をもたらす。異なる代表的なシチジンデアミナーゼ含有するCBEの相対変異速度を図4に示す。
スプライス部位のSNP(SNP rs113993993258+2T>C)を含有するSBDS標的ポリヌクレオチド配列を標的として正しいスプライシングを回復させるためにNGC CBEバリアントに連係して用いられるガイドRNA(gRNA)および標的gRNAを、下記の図5および表12に示す。
Figure 2022545950000054

本明細書に記載される試験で用いられたgRNAのためのスキャフォールド配列は以下の通りである:GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU(UUU)。
例として、本明細書に記載されるようなNGC CBEバリアント、例えば、シチジンデアミナーゼBE4とCas9バリアント226および230とに連係して用いられる19merのgRNA(G88)と20merのgRNA(G44)は、高いパーセンテージのオンターゲット編集と限定的なパーセンテージのバイスタンダー編集、ならびに高度のC→Tオンターゲット編集を示した (図6Aおよび図6B)。図6Cでは、シチジンデアミナーゼ、例えばBE4とCBE中の複数の異なるCas9バリアント(例えば、SpCas9バリアント)とを含むCBEに連係して用いられた20merのgRNA(G44)が、高いパーセンテージのオンターゲット塩基編集と低いパーセンテージのバイスタンダー(非特異的)編集とを明示した。標的配列およびSNP部位は、配列の7位にボールド体の「C」によって示され、配列の3位の「C」は、標的配列内のバイスタンダーヌクレオチドを表す。「226」と称するSpCas9バリアント(図3A~図3C)を含むCBEをコードするプラスミドは、図中で「PV226」と呼ばれる。
本明細書に記載されるNGC CBEバリアントは、修正のスプライシングを回復させる高いパーセンテージのオンターゲット編集を最適に示し、一方で同時に、低いもしくは限定的なバイスタンダー編集および/またはオフターゲット編集活性を示した。当業者によって理解されるものとなるように、本明細書に記載のシチジン塩基エディターの示した限定的なバイスタンダー編集活性は、塩基編集の枠内で核酸塩基編集が低いパーセンテージであるかまたは限定的に活性であることを指す。
実施例4 SDSを治療する高いオンターゲット編集活性のために生成されたNGCシチジン塩基エディター(CBE)
いくつかの異なるシチジンデアミナーゼに連係する、図3A~図3Cに示される配列を有する本明細書に記載のCas9バリアント、例えば、225、226、および244などと相互作用するNGC PAMを含む、追加のシチジン塩基エディターを生成した。Cas9バリアント225、226、および244をコードするプラスミド、すなわちそれぞれ、PV225、およびPV244を生成した。さらに、共にまたは別々にのどちらかでCas9バリアントとシチジンデアミナーゼとの両方をコードするポリヌクレオチドを含有するプラスミドを構築した。下記の表13は、SBDS遺伝子内のrs113993993 C→T変異を標的として正しいスプライシングを復活させる能力を評価する研究において作製し用いた、NGC CBE(Cas9バリアントとシチジンデアミナーゼポリペプチドとを含む)を示す。
Figure 2022545950000055
NGC CBE(シチジンデアミナーゼと、NGCを含むPAMに結合する能力を有するCas9タンパク質をもたらすアミノ酸変異の組合せを含有するCas9バリアント(例えば、SpCas9バリアント)とを含有する、シチジン塩基エディター)を、1つまたは複数のgRNA、具体的には19merおよび20merのgRNA、例えばそれぞれG88およびG44と併せて、SBDS遺伝子を担持するHEK293細胞において、SBDS遺伝子内のSNP変異のオンターゲット塩基編集についてアッセイを行った。図7Aおよび図7Bは、19merおよび20merのgRNA、例えばG88およびG44と併せて用いられた表13に記載される様々なNGC CBEの塩基編集活性のパーセントを示している。シチジンデアミナーゼPpAPOBEC1と図3A~図3Cに示されるCas9配列の特異的な変異の組合せを有するCas9バリアント225、454、および459とから構成されるCBEを、19merまたは20merのどちらかのgRNAと併せて用いて、さらに別の実験を実施し、SBDSポリヌクレオチド配列内のスプライス部位のSNPを修正する細胞ベース(HEK293)アッセイにおける編集/オンターゲットのパーセンテージおよびバイスタンダー編集活性を決定した(図8Aおよび図8B)。図8Aおよび図8Bに示されるように、高いオンターゲット編集が、PpAPOBEC1シトジンデアミナーゼとCas9バリアント226および244(図3A~図3C)それぞれとを含有するNGC CBE454および459(表13)により示された。図8Cおよび図8Dは、SBDSポリヌクレオチド配列のスプライス部位のSNPを修正する細胞ベース(HEK293)アッセイにおける、19mer(Guide88)または20mer(Guide44)のどちらかのgRNAを併せて用いた、AmAPOBEC1シチジンデアミナーゼとCas9バリアント225、226、および244(図3A~図3C)とを含むNGC CBEのオンターゲットおよびバイスタンダー塩基編集のパーセンテージを示す。図8Eおよび図8Fは、SBDSポリヌクレオチド配列のスプライス部位のSNPを修正する細胞ベース(HEK293)アッセイにおける、19mer(Guide88)または20mer(Guide44)のどちらかのgRNAを併せて用いた、PmCDA1シチジンデアミナーゼとCas9バリアント225、453、および458(表13)とを含むNGC CBEのオンターゲットおよびバイスタンダー塩基編集のパーセンテージを示す。図8Gおよび図8Hは、SBDSポリヌクレオチド配列のスプライス部位のSNPを修正する細胞ベース(HEK293)アッセイにおける、19mer(Guide88)または20mer(Guide44)のどちらかのgRNAを併せて用いた、RRA3FシチジンデアミナーゼとCas9バリアント225、455、および460(表13)とを含むNGC CBEのオンターゲットおよびバイスタンダー塩基編集のパーセンテージを示す。図8Iおよび図8Jは、SBDSポリヌクレオチド配列のスプライス部位のSNPを修正する細胞ベース(HEK293)アッセイにおける、19mer(Guide88)または20mer(Guide44)のどちらかのgRNAを併せて用いた、SsAPOBEC2シチジンデアミナーゼとCas9バリアント225、456、および461(表13)とを含むNGC CBEのオンターゲットおよびバイスタンダー塩基編集のパーセンテージを示す。図8A~図8Jでは、Cas9バリアント225(またはPV225)は、代替的に「ビームシャッフル」と呼ばれる。
さらに別の研究では、シチジンデアミナーゼポリペプチドに追加のアミノ酸変異を、例えば、PpAPOBEC1ポリペプチド配列にH122A変異を作製して、SBDS遺伝子中のスプライス部位のSNPのオンターゲット塩基編集およびスプライス部位の修正がより好発したか否かを決定した。H122A変異のみに加えて、H122A変異とアミノ酸変異R33A、W90F、K34A、R52A、H121A、およびY120FもPpAPOBEC1アミノ酸配列に作製して、塩基編集効率(すなわち、オンターゲット編集とバイスタンダー編集とを比べたパーセンテージ)を決定するためのNGC CBEを作出した。さらに変異したNGC CBEバリアントを19merまたは20merのgRNAと併せて、in vitroの細胞ベースアッセイに供試した。図9Aおよび図9Bに示されるように、19merまたは20merのどちらかのgRNAでは、PpAPOBEC1シチジンデアミナーゼポリペプチドに作製された追加の変異は、結果として、それらを含有するNGC CBEによる塩基編集効率の大幅な増加を生じなかった。図9Cおよび図9Dは、図9Aおよび図9Bにそれぞれ示されるデータをドットブロットの形式で提示している。
実施例5 SDSを治療する5’-NGC-3’PAMへの活性を有するSpCas9バリアントを含有する他のNGCシチジン塩基エディター(CBE)
SDSを治療する際の使用のための5’-NGC-3’PAMへの活性を有するSpCas9バリアントを含有する他のNGCシチジン塩基エディターを取得し評価するために、さらに別の変異を有する追加のSpCas9バリアントを作出した。SpCas9バリアント(PV225およびPV244(図3A~図3C)および他のアミノ酸置換を含有)を含有するこれらのNGC CBEは、「NRCH」エディターバリアントと称するが、なぜなら、これらのSpCas9バリアントに含有されたアミノ酸置換が、その内容が参照により本明細書にその全体を組み込まれるS. Miller et al., April, 2020, “Continuous evolution of SpCas9 variants compatible with non-G PAMs,” Nature Biotechnology, 38(4):471-481 (published online 2020 Feb 10. doi: 10.1038/s41587-020-0412-8)に記載されるような「NRCH」PAMを認識することのできるSpCas9バリアント(すなわち、NRCH SpCas9)について記載されたものに類似するためであり、式中、R=AまたはGであり、H=A、C、またはTである。Miller et al.に記載されるように、シチジンデアミナーゼとNRCH SpCas9バリアントとを含有するシチジン塩基エディターは、PAM中の第3の位置のC核酸塩基に対する明瞭に進化した選好性を有する。
図10は、NRCHベースのSpCas9バリアントを作出するためにSpCas9タンパク質内に作製された変異および変異の組合せを図示する表を呈示している。図10に示されるNRCH変異の組合せを、いくつかの異なるSpCas9バリアントに含めて、SDSに関連するSBDS遺伝子内のスプライス部位のSNPを修正するために用いられるNGC CBE内のSpCas9バリアント構成成分に最も有益となる変異の組合せを決定した。具体的な例では、所与のシチジンデアミナーゼ、例えばPpAPOBEC1などと、ある特定の変異を含むSpCas9バリアント(図3A~図3C)とを含有するNGC CBEは、上記のMiller et al.に記載されるような、および下記に例示されるようなNRCH変異の組合せと併せると、高いパーセンテージのオンターゲット編集と低いパーセンテージのバイスタンダー編集とを提供し得る。具体的な実施形態では、NGC PAM変異を結合する能力の最も高いSpCas9バリアントを、PpAPOBEC H122Aシチジンデアミナーゼと組み合わせて、バイスタンダー効果に比べて高いオンターゲット塩基編集を明示するCBEを特定してもよい。関連する実施形態では、NGC PAMを結合する能力を明示する例えば、図3A~図3C、表13、または図10に示されるようなSpCas9バリアントと、シチジンデアミナーゼ、例えばPpAPOBEC H122Aとをコードするポリヌクレオチドを含む、NGC CBEプラスミドまたはウイルスベクター構築物が、本明細書に記載されるような細胞ベースのシステムにおいて最も高いオンターゲット編集と最も低いバイスタンダー編集とをもたらす最適な組合せを評価するために含まれる。
具体的な例として、225および244のSpCas9バリアント内の追加のアミノ酸置換は、A10T、I322V、S409I、E427G、R645L、R753G、R1114G、Q1221H、Y1336、S1338T、およびH1349Rのうち1つまたは複数(例えば、SpCas9のNRCH変異)を含んでいた。上記の実施例に記載された実験で用いたような19merまたは20merのgRNAを併せて用いた、NRCH SpCas9バリアントとシチジンデアミナーゼとを含有するNGC CBEによるオンターゲットおよびバイスタンダーの核酸塩基編集を、細胞ベース(HEK293)アッセイで評価して、SBDSポリヌクレオチド配列(図11Aおよび11B)内のスプライス部位のSNPの修正を評定した。図11Aおよび図11Bに観察されるように、塩基エディター468および469(表10)は、19merまたは20merのどちらかのgRNAに連係して用いられた際に、高いパーセンテージのオンターゲット塩基編集を示した。
実施例6 NGC CBEをコードし送達するmRNA
代表的なNGC CBEエディターをクローニングして、これらの塩基エディターをコードするmRNAを作り出した。塩基エディターをコードするmRNAは、細胞中の標的DNA、例えばSBDS遺伝子における塩基編集を達成するのに最適な送達システムであり、また、診療所での治療用途に特に適している。熟練の実務者が認識するものとなるように、mRNAは、編集の枠を転じて編集の効率を増やし得る。より高いパーセンテージのC→T遷移と低いかまたは限定的なパーセンテージのC→AまたはC→G遷移を有する塩基エディターは、mRNA送達に特に有用であるかまたは適している。そのため、高いパーセンテージのオンターゲット塩基編集を示したNGC CBEのいくつか(例えば、NGC CBE454、459、および449、表13)をコードするmRNAを、異なる長さのgRNAにより評価した。in vitroの細胞ベースアッセイを実施して、mRNAによりコードされたNGC CBEの塩基編集効率およびオンターゲット編集とバイスタンダー編集とを比べたパーセンテージを評価した(図12A~図12C)。図12A~図12Cでは、mRNA340は、SpCas9バリアント225(またはPV225)とシチジンデアミナーゼPPAPOBEC1 H122Aとを含むCBE#449(表13)をコードするmRNAを指し;mRNA341は、SpCas9バリアント226(またはPV226)と、図3A~図3C、上記に配列が示されるシチジンデアミナーゼPPAPOBEC1 H122Aとを含むCBE#454(表13)をコードするmRNAを指し;mRNA342は、SpCas9バリアント244(またはPV244)とシチジンデアミナーゼPPAPOBEC1 H122Aとを含むCBE#459(表13)をコードするmRNAを指す。図12A~12Cに示されるように、mRNA342は、最も少ないCからAまたはCからGへの遷移を示し、特に18merおよび20merのgRNAを用いて使用した際に少なかった。
上記の実施例3~6に記載される実験の結果は、Cas9バリアント、すなわち、NGC PAM(すなわち、5’-NGC-3’PAMバリアント)を結合する能力を付与する変異の組合せを含有するSpCas9バリアントが、低いパーセンテージのオフターゲット効果(バイスタンダー編集)と高いパーセンテージのオンターゲット塩基編集とを達成する塩基編集のための実行可能な選択肢であることを明示する。この結果はさらに、本明細書に記載のNGC CBEを用いることにより、バイスタンダー編集を制限するとともに40%超のオンターゲット効率がもたらされることを明示している。これらのNGC CBEは、mRNAによってコードすることができ、細胞ベースのシステムでアッセイした際に効率的な塩基編集を示した。具体的には、ある長さのgRNA、例えば18mer(例えば、Gおよび20merのgRNAは、バイスタンダー(オフターゲット)編集をさらに減少させることができる。したがって、本明細書に記載されるNGC CBE、ならびにその組成物および方法は、SDSの治療に有益かつ有用な治療をもたらす。
実施例7 材料および方法
本明細書に記載される実施例により与えられた結果は、以下の材料および方法を用いて得た。
クローニング
用いた標的ポリヌクレオチドおよびgRNAおよびプライマーのDNA配列は、本明細書に記載されている。以下のスキャフォールドオリヌクレオチド配列を本明細書に記載される実験に採用した:GTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT。gRNAについて、スキャフォールド配列は以下のように提示され、式中、ウラシル(U)はRNA中でチミジン(T)に置き換わる:GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU(UUU)。
gRNAは、本明細書に記載されているかまたは当業者の知識に基づき決定されかつ当業者に理解されるものとなるような病原性変異を含むSDS遺伝子に対する、スキャフォールド配列およびスペーサー配列(標的配列)を包含する。
塩基編集の方法は当技術分野に公知である。例えば、Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016);Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017);Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017)、およびRees, H.A., et al., “Base editing: precision chemistry on the genome and transcriptome of living cells.” Nat Rev Genet. 2018 Dec;19(12):770-788. doi: 10.1038/s41576-018-0059-1を参照されたい。
PCRは、VeraSeq ULtraDNAポリメラーゼ(エンズマティクス)、またはQ5 Hot Start High-Fidelity DNAポリメラーゼ(ニューイングランドバイオラボ)を用いて実施した。塩基エディター(BE)プラスミドは、USERクローニング(ニューイングランドバイオラボ)を用いて構築した。デアミナーゼ遺伝子は、gBlocks Gene Fragments(インテグレーテッドDNAテクノロジーズ)として合成した。本発明に有用なCas9遺伝子は、下記に列挙され、本明細書に記載されている。Cas9遺伝子は、既に報告されているプラスミドから取得した。デアミナーゼおよび融合遺伝子は、pCMV(哺乳類コドン最適化)骨格またはpET28b(大腸菌コドン最適化)骨格内にクローニングした。sgRNA発現プラスミドは、部位特異的変異誘発を用いて構築した。
簡潔に述べれば、本発明に有用なプライマーを、製造業者の指示書に従ってT4ポリヌクレオチドキナーゼ(ニューイングランドバイオラボ)を用いて、5’リン酸化した。次に、上記リン酸化プライマーと、鋳型として目的の遺伝子をコードするプラスミドとを併せて、製造業者の指示書に従ってQ5 Hot Start High-Fidelityポリメラーゼ(ニューイングランドバイオラボ)を用いて、PCRを実施した。PCR産物をDpnI(20U、ニューイングランドバイオラボ)と共に37℃で1時間インキュベートし、QIAprepスピンカラム(キアゲン)にて精製し、製造業者の指示書に従ってQuickLigase(ニューイングランドバイオラボ)を用いて連結した。DNAベクターの増幅は、Mach1コンピテントセル(サーモフィッシャーサイエンティフィク)を用いて行った。
ssDNAのin vitroデアミナーゼアッセイ
全てのssDNA基質の配列は、標準的な方法を用いて取得した。全てのCy3標識基質は、インテグレーテッドDNAテクノロジーズ(IDT)から入手した。デアミナーゼは、製造業者の指示書に従ってTNT T7 Quick Coupled転写/翻訳キット(プロメガ)を用いて、1μgのプラスミドを用いてin vitroで発現した。タンパク質発現の後、5μLのリアーゼを、35μLのCutSmart緩衝液(ニューイングランドバイオラボ)(50mM酢酸カリウム、29mMトリス-酢酸、10mM酢酸マグネシウム、100μgmL-1 BSA、pH7.9)中のssDNA(1.8μM)およびUSER酵素(1ユニット)と合わせて、37℃で2時間インキュベートした。切断したU含有基質を、10%TBE-尿素ゲル(バイオラッド)上で完全長の未改変基質から分離した。
塩基エディターの発現および精製
大腸菌BL21 STAR(DE3)コンピテントセル(サーモフィッシャーサイエンティフィック)を、プラスミド(例えばpET28b-His6-PV1-14またはpET28b-His6-APOBEC-リンカー-dCas9をコードするプラスミド)を用いて形質転換した。結果として得られた発現株を、100μgmL-1のカナマイシンを含有するルリア-ベルターニ(LB)ブロス中、37℃で一晩増殖させた。細胞を同じ増殖培地内で1:100に希釈し、37℃でOD600=約0.6まで増殖させた。培養物を4℃で2時間超冷却し、イソプロピル-β-d-1-チオガラクトピラノシド(IPTG)を0.5mMで添加してタンパク質発現を誘導した。約16時間後、4,000gの遠心分離により細胞を収集して、溶解緩衝液(50mMトリス(ヒドロキシメチル)-アミノメタン(トリス)-HCl(pH7.5)、1M NaCl、20%グリセロール、10mMトリス(2-カルボキシエチル)ホスフィン(TCEP、ソルテックベンチャーズ))に再懸濁した。細胞を超音波処理(出力6Wで計8分間の20秒のパルスオンと20秒のパルスオフ)によって溶解し、15分間の25,000gの遠心分離の後に、溶解上清を単離した。溶解物を、His-Purニッケル-ニトリロ酢酸(ニッケル-NTA)樹脂(サーモフィッシャーサイエンティフィック)と共に4℃で1時間インキュベートし、Hisタグ化融合タンパク質を捕捉した。樹脂をカラムに移して、40mLの溶解緩衝液で洗浄した。Hisタグ化融合タンパク質を、285mMイミダゾールを補充した溶解緩衝液に溶出させて、限外濾過(アミコン-ミリポア、分子量100kDaをカットオフ)により1mLの総体積に濃縮した。タンパク質を、50mMトリス(ヒドロキシメチル)-アミノメタン(トリス)-HCl(pH7.0)、0.1M NaCl、20%グリセロール、10mM TCEPを含有する低塩濃度精製緩衝液にて20mLに希釈し、SPセファロースファストフロー樹脂(GEライフサイエンシズ)上にロードした。樹脂を40mLのこの低塩濃度緩衝液により洗浄し、50mMトリス(ヒドロキシメチル)-アミノメタン(トリス)-HCl(pH7.0)、0.5M NaCl、20%グリセロール、10mM TCEPを含有する5mLの活性緩衝液によりタンパク質を溶出した。溶出タンパク質をSDS-PAGEにより定量した。
sgRNAのin vitro転写
T7プロモーターとそれに続く20bpのsgRNA標的配列とを含有する線状DNA断片を、製造業者の指示書に従ってTranscriptAid T7高収率転写キット(サーモフィッシャーサイエンティフィック)を用いて、in vitroで転写した。sgRNA産物を、製造業者の指示書に従ってMEGAclearキット(サーモフィッシャーサイエンティフィック)を用いて精製し、UV吸光度により定量した。
Cy3コンジュゲートdsDNA基質の調製
典型的には、非標識の配列鎖(例えば、80ntの非標識鎖の配列)を、PAGE精製オリゴヌクレオチドとしてIDTに発注した。各80ntの基質の3’端に相補的な25ntのCy3標識プライマーを、HPLC精製オリゴヌクレオチドとしてIDTに発注した。Cy3標識dsDNA基質を生成するために、80ntの鎖(5μLの100μM溶液)を、dNTPs(0.75μLの100mM溶液)を含むNEBuffer2(38.25μLの50mM NaCl、10mMトリス-HCl、10mM MgCl、1mM DTT、pH7.9溶液、ニューイングランドバイオラボ)中のCy3標識プライマー(5μLの100μM溶液)と合一して、95℃で5分間加熱した後、秒当たり0.1℃の速度で徐々に45℃に冷却した。このアニーリング期間の後、Klenow exo-(5U、ニューイングランドバイオラボ)を添加して、反応物を37℃で1時間インキュベートした。溶液を緩衝液PB(250μL、キアゲン)およびイソプロパノール(50μL)により希釈し、QIAprepスピンカラム(キアゲン)上で精製して、50μLのトリス緩衝液により溶出した。
dsDNAへのデアミナーゼアッセイ
精製した融合タンパク質(活性緩衝液中1.9μMを20μL)を、1当量の適切なsgRNAと合わせて、周囲温度で5分間インキュベートした。Cy3標識dsDNA基質を、終濃度125nMとなるように添加し、結果として得られた溶液を、37℃で2時間インキュベートした。緩衝液PB(100μL、キアゲン)およびイソプロパノール(25μL)を添加することによって、dsDNAを融合物から分離し、EconoSpinマイクロスピンカラム(エポックライフサイエンス)上で精製し、20μLのCutSmart緩衝液(ニューイングランドバイオラボ)を用いて溶出する。USER酵素(1U、ニューイングランドバイオラボ)を、精製した編集済みdsDNAに添加して、37℃で1時間インキュベートした。Cy3標識鎖を、5μLの反応溶液と15μLのDMSOベースのローディング緩衝液(5mMトリス、0.5mM EDTA、12.5%グリセロール、0.02%ブロモフェノールブルー、0.02%キシレンシアン、80%DMSO)とを合わせることによって、その片割れから充分に変性した。完全長のC含有基質を、10%TBE-尿素ゲル(バイオラッド)上で任意の切断された編集済みのU含有基質から分離し、GE Amersham Typhoonイメージャー上でイメージングした。
ハイスループットシークエンシングのためのin vitro編集dsDNAの調製
オリゴヌクレオチドをIDTから入手した。相補的な配列をトリス緩衝液中で合一し(5μLの100μM溶液)、95℃で5分間加熱することによってアニーリングした後、秒当たり0.1℃の速度で徐々に45℃に冷却して、60bpのdsDNA基質を生成した。精製した融合タンパク質(活性緩衝液中1.9μMを20μL)を、1当量の適切なsgRNAと合一し、周囲温度で5分間インキュベートした。60merのdsDNA基質を、終濃度125nMとなるように添加し、結果として得られた溶液を、37℃で2時間インキュベートした。緩衝液PB(100μL、キアゲン)およびイソプロパノール(25μL)を添加することによって、dsDNAを融合物から分離し、EconoSpinマイクロスピンカラム(エポックライフサイエンス)上で精製し、20μLのトリス緩衝液を用いて溶出した。結果として得られた編集済みDNA(1μLを鋳型として使用)を、製造業者の指示書に従って、ハイスループットシークエンシング用プライマー対とVeraSeq Ultra(エンズマティクス)とを用いたPCRにより13サイクルの増幅で増幅した。PCR反応産物を、RapidTips(ディフィニティゲノミクス)を用いて精製し、精製したDNAを、シークエンシングアダプターを含有するプライマーを用いたPCRにより増幅し、精製し、以前に記載されたようにMiSeqハイスループットDNAシークエンサー(イルミナ)にてシークエンシングした。
細胞培養
野生型SDSPまたは変異体SDSPを発現するHEK293T(ATCC CRL-3216)およびU2OS(ATCC HTB-96)は、10%(v/v)ウシ胎児血清(FBS)を補充したダルベッコ改変イーグル培地プラスGlutaMax(サーモフィッシャー)中、37℃、5%CO2で維持した。HCC1954細胞(ATCC CRL-2338)は、上記に記載されるようにRPMI-1640培地(サーモフィッシャーサイエンティフィック)中で維持した。SDSP)(タコニックバイオサイエンシズ)を含有する不死化細胞を、10%(v/v)ウシ胎児血清(FBS)と200μgmL-1ジェネティシン(サーモフィッシャーサイエンティフィック)とを補充したダルベッコ改変イーグル培地プラスGlutaMax(サーモフィッシャーサイエンティフィック)中で培養した。
トランスフェクション
10%(v/v)FBSを補充したダルベッコ改変イーグル培地プラスGlutaMax(サーモフィッシャーサイエンティフィック)中、37℃、5%COで維持されたHEK293T細胞(ATCC CRL-3216)を、48ウェルのコラーゲン被覆BioCoatプレート(Corning)上に播種し、およそ80~85%の集密度でトランスフェクトした。簡潔に述べれば、750ngのBEまたは他のシチジンデアミナーゼおよび/または200ngのSpCas9、および250ngのsgRNA発現プラスミドを、製造業者の指示書に従って、ウェル当たり1.5μLのリポフェクタミン2000(サーモフィッシャーサイエンティフィック)を用いてトランスフェクトした。HEK293T細胞を、製造業者の指示書に従って適切なAmaxa Nucleofector IIプログラムを用いて(HEK293T細胞に対するプログラムQ-001を用いたVキット)トランスフェクトした。一部の場合では、細胞をトランスフェクション後に3日間培養してから培地を除去した。細胞を1×PBS溶液(サーモフィッシャーサイエンティフィック)で洗浄し、30μLの溶解緩衝液(10mMトリス-HCl、pH7.0、0.05%SDS、25μg/mLプロテアーゼK(サーモフィッシャーサイエンティフィック)を添加することによってゲノムDNAを抽出した。ゲノムDNAは使用するまで-20℃で保管した。
ゲノムDNA試料のハイスループットDNAシークエンシング
トランスフェクトした細胞を3日後に採集し、製造業者の指示書に従ってAgencourt DNAdvanceゲノムDNA単離キット(ベックマンコールター)を用いて、ゲノムDNAを単離した。目的のオンターゲットゲノム領域およびオフターゲットゲノム領域を、側面に位置するハイスループットシークエンシングプライマー対を用いたPCRにより増幅した。PCR増幅は、製造業者の指示書に従ってPhusion high-fidelity DNAポリメラーゼ(サーモフィッシャー)により、5ngのゲノムDNAを鋳型として用いて行った。サイクル数は、確実に反応が増幅の直線範囲内で停止するように、各プライマー対に対し別々に決定した。PCR産物を、RapidTips(ディフィニティゲノミクス)を用いて精製した。精製したDNAを、シークエンシングアダプターを含有するプライマーを用いたPCRにより増幅した。産物をゲル精製し、Quant-iT PicoGreen dsDNAアッセイキット(サーモフィッシャー)およびKAPAライブラリー定量キット-イルミナ(KAPAバイオシステムズ)を用いて定量した。試料を、以前に記載されたように(Pattanayak, Nature Biotechnol. 31, 839-843 (2013))イルミナMiSeqにてシークエンシングした。
データ解析
シークエンシングのリードを、MiSeqレポーター(イルミナ)を用いて自動的にデマルチプレックスし、個々のFASTQファイルを、カスタムMatlabにより解析した。スミス-ウォーターマンアルゴリズムを用いて、各リードを対毎に適切な参照配列にアラインメントした。31未満のQスコアを有するベースコールは、Nに置き換えられため、ヌクレオチド頻度の計算の際には除外された。この処理により、MiSeqベースコーリングエラー率がおよそ1,000分の1であったものと予想される。リードおよび参照配列がギャップを含んでいなかったアラインメント配列は、アラインメントテーブルに格納され、このテーブルから塩基頻度を各遺伝子座について表に表すことができた。インデル頻度を、以前に記載された基準(Zuris, et al., Nature Biotechnol. 33, 73-80 (2015)を用いてカスタムMatlabスクリプトにより定量化した。インデルが発生し得る枠の両側に位置する2つの10bpの配列に正確に合致するかについて、シークエンシングのリードをスキャンした。正確な合致が位置しなければ、そのリードを解析から除外した。このインデル枠の長さが参照配列に正確に合致すれば、インデルを含有しないものとしてそのリードを分類した。インデル枠が、参照配列よりも長いかまたは短い2つ以上の塩基であれば、そのシークエンシングのリードを、それぞれ挿入または欠失として分類した。
他の実施形態
前出の記載から、様々な使用および条件に採用するように本明細書に記載される本発明にバリエーションおよび改変が行われ得ることが明らかになろう。そのような実施形態はまた、以下の特許請求の範囲の範疇内にある。
本明細書における可変要素の任意の定義の中にある要素の列挙の記載は、その可変要素の定義を任意の単一の要素または列挙した要素の組合せ(または部分的組合せ)として含む。本明細書における一実施形態の記載は、その実施形態を任意の単一の実施形態として、または任意の他の実施形態またはその一部との組合せとして含む。
参照による組込み
本明細書に言及された全ての刊行物、特許、および特許出願は、参照により本明細書に組み込まれるが、それは、個々の刊行物、特許、または特許出願が参照により組み込まれることを特にかつ個々に標示しているのと同じ程度である。別段になんらかの標示がなければ、本明細書に言及された刊行物、特許、および特許出願は、本明細書に参照によりその全体を組み込まれる。

Claims (185)

  1. 転写を可能にするようにポリヌクレオチドを編集する方法であって、1つまたは複数のガイドポリヌクレオチドとの複合体中の塩基エディターに前記ポリヌクレオチドを接触させることを含み、前記塩基エディターが、ポリヌクレオチドプログラマブルDNA結合ドメインとデアミナーゼドメインとを含み、1つまたは複数の前記ガイドポリヌクレオチドが、前記塩基エディターを標的に向けて、転写を可能にする変異を導入する変更をもたらす、方法。
  2. 転写を可能にする前記変異が、終止コドンを変更する変異、スプライスアクセプターもしくはスプライスドナー部位を導入する変異、またはスプライスアクセプターもしくはスプライスドナー部位を修正する変異である、請求項1に記載の方法。
  3. シュワックマン・ダイアモンド症候群(SDS)に関連する変異を含むSBDSポリヌクレオチドを編集する方法であって、1つまたは複数のガイドポリヌクレオチドとの複合体中の塩基エディターに前記SBDSポリヌクレオチドを接触させることを含み、前記塩基エディターが、ポリヌクレオチドプログラマブルDNA結合ドメインとデアミナーゼドメインとを含み、1つまたは複数の前記ガイドポリヌクレオチドが、前記塩基エディターを標的に向けて、シュワックマン・ダイアモンド症候群(SDS)に関連する変異の変更をもたらす、方法。
  4. 前記デアミナーゼが、シチジンデアミナーゼまたはアデノシンデアミナーゼである、請求項1~3のいずれか1項に記載の方法。
  5. 前記デアミナーゼがアデノシンデアミナーゼである、請求項4に記載の方法。
  6. 前記アデノシンデアミナーゼは、表7Aまたは表7Bに挙げられたABE8またはABE8バリアントから選択される、請求項5に記載の方法。
  7. 前記デアミナーゼがシチジンデアミナーゼである、請求項4に記載の方法。
  8. 前記シトシンデアミナーゼが、BE4、rAPOBEC1、PpAPOBEC1、H122A置換を含有するPpAPOBEC1、AmAPOBEC1、SsAPOBEC2、RrA3F;F130L置換を含有するRrA3F、APOBEC-1がrAPOBEC1の配列に置き換えられたBE4のバリアント、APOBEC-1がAmAPOBEC1の配列に置き換えられたBE4のバリアント、APOBEC-1がSsAPOBEC2の配列に置き換えられたBE4のバリアント、APOBEC-1がPpAPOBEC1の配列に置き換えられたBE4のバリアント、またはAPOBEC-1がH122A置換を含有するPpAPOBEC1の配列に置き換えられたBE4のバリアントのうち1つまたは複数から選択される、請求項7に記載の方法。
  9. H122A置換を含有するPpAPOBEC1、またはAPOBEC-1がH122A置換を含有するPpAPOBEC1の配列に置き換えられたBE4のバリアントが、R33A、W90F、K34A、R52A、H121A、またはY120Fから選択される1つまたは複数のアミノ酸変異をさらに含む、請求項8に記載の方法。
  10. 2つ以上のガイドポリヌクレオチドが、塩基エディターを標的に向けて、シュワックマン・ダイアモンド症候群に関連する2つ以上の変異の変更をもたらす、請求項1~3のいずれか1項に記載の方法。
  11. シュワックマン・ダイアモンド症候群(SDS)に関連する変異を含むSBDSポリヌクレオチドを編集する方法であって、1つまたは複数のガイドポリヌクレオチドとの複合体中のアデノシン塩基エディター(ABE)にSBDSポリヌクレオチドを接触させることを含み、前記塩基エディターは、ポリヌクレオチドプログラマブルDNA結合ドメインとデアミナーゼドメインとを含み、1つまたは複数のガイドポリヌクレオチドは、塩基エディターを標的に向けて、183~184TA>CT Rs113993991のA・TからG・Cへの変更をもたらし、ミスセンス変異を生成する、方法。
  12. 前記ガイドポリヌクレオチドが、以下の配列のうち1つを標的とする、請求項4に記載の方法:TGTAAATGTTTCCTAAGGTCまたはAATGTTTCCTAAGGTCAGGT。
  13. 前記ABEが、5’-NGC-3’または5’-NGG-3’PAM特異性を有する、請求項7に記載の方法。
  14. シュワックマン・ダイアモンド症候群(SDS)に関連する変異を含むSBDSポリヌクレオチドを編集する方法であって、1つまたは複数のガイドポリヌクレオチドとの複合体中のシチジン塩基エディターに前記SBDSポリヌクレオチドを接触させることを含み、前記シチジン塩基エディター(CBE)が、ポリヌクレオチドプログラマブルDNA結合ドメインとシチジンデアミナーゼドメインとを含み、1つまたは複数の前記ガイドポリヌクレオチドが、前記塩基エディターを標的に向けて、rs113993993 258+2T>CのC・GからT・Aへの変更をもたらす、方法。
  15. 前記CBEが、5’-NGC-3’PAM特異性または5’-NGC-3’を含むPAMへの特異性を有する、請求項14に記載の方法。
  16. 前記ガイドポリヌクレオチドが、GTAAGCAGGCGGGTAACAGCTGC、AGCAGGCGGGTAACAGCTGCAGC、GCGGGTAACAGCTGCAGCATAGC、GTAAGCAGGCGGGTAACAGC、AGCAGGCGGGTAACAGCTGC、GCGGGTAACAGCTGCAGCAT、GCAGGCGGGTAACAGCTGC、CAGGCGGGTAACAGCTGC、AGGCGGGTAACAGCTGC、またはAAGCAGGCGGGTAACAGCTGCから選択されるポリヌクレオチド標的配列を標的とする、請求項14または請求項15に記載の方法。
  17. 前記接触させることが、細胞、真核細胞、哺乳類細胞、またはヒト細胞内である、請求項1~16のいずれか1項に記載の方法。
  18. 前記細胞がin vivoまたはex vivoである、請求項17に記載の方法。
  19. シュワックマン・ダイアモンド症候群(SDS)に関連する前記変異が、遺伝子変換に起因する、請求項3~18のいずれか1項に記載の方法。
  20. シュワックマン・ダイアモンド症候群(SDS)に関連する前記変異が、前記遺伝子の終止コドンを誘発するか、またはスプライシングを変更する、請求項3~19のいずれか1項に記載の方法。
  21. シュワックマン・ダイアモンド症候群(SDS)に関連する前記変異が、切詰を有するSBDSポリペプチドをコードする、請求項3~20のいずれか1項に記載の方法。
  22. 前記塩基エディターが、ミスセンス変異を導入するか、新しいスプライスアクセプター部位またはスプライスドナー部位を挿入するか、および/または変異を含むスプライスアクセプター部位もしくはスプライスドナー部位を修正する、請求項1~21のいずれか1項に記載の方法。
  23. 前記ポリヌクレオチドプログラマブルDNA結合ドメインが、ストレプトコッカス・ピロゲネスCas9(SpCas9)、スタフィロコッカス・アウレウスCas9(SaCas9)、ストレプトコッカス・サーモフィルス1Cas9(St1Cas9)、ストレプトコッカス・カニスCas9(ScCas9)、またがそれらのバリアントから選択されるCas9である、請求項1~22のいずれか1項に記載の方法。
  24. 前記ポリヌクレオチドプログラマブルDNA結合ドメインが、野生型もしくは改変型のストレプトコッカス・ピロゲネスCas9(SpCas9)、またはそのバリアントである、請求項23に記載の方法。
  25. 前記ポリヌクレオチドプログラマブルDNA結合ドメインが、改変型SpCas9またはSpCas9バリアントである、請求項24に記載の方法。
  26. 前記ポリヌクレオチドプログラマブルDNA結合ドメインが、プロトスペーサー隣接モチーフ(PAM)特異性を変更された改変型SpCas9またはSpCas9バリアントを含む、請求項24または25に記載の方法。
  27. 前記SpCas9が、PAM核酸配列の5’-NGC-3’または5’-NGG-3’に対する特異性を有する、請求項26に記載の方法。
  28. 前記SpCas9が、PAM核酸配列5’-NGC-3’または5’-NGC-3’を含むPAM核酸配列に対する特異性を有する改変型SpCas9またはSpCas9バリアントである、請求項27に記載の方法。
  29. 前記改変型SpCas9またはSpCas9バリアントが、表1に挙げられたアミノ酸配列を含む、請求項26~28のいずれか1項に記載の方法。
  30. 前記改変型SpCas9がspCas9-MQKFRAERである、請求項29に記載の方法。
  31. 前記改変型SpCas9またはSpCas9バリアントが、図3A~図3Cまたは図10に示されるアミノ酸置換の組合せを含む、請求項26~28のいずれか1項に記載の方法。
  32. 前記改変されたSpCas9またはSpCas9バリアントが、以下から選択されるアミノ酸配列置換の組合せを含む、請求項31に記載の方法:
    D1135M、S1136Q、G1218K、E1219F、A1322R、D1332、R1335E、およびT1337R(224 SpCas9);D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、およびT1337R(225 SpCas9);
    D1135M、S1136Q、G1218K、E1219F、A1322R、D1332K、R1335E、およびT1337R(226 SpCas9);
    D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、およびT1337Q(227 Cas9);
    D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335Q、およびT1337Q(230 SpCas9);
    D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335D、およびT1337Q(235 SpCas9);D1135Q、S1136、G1218T、E1219W、A1322R、D1332、R1335N、およびT1337(237 SpCas9);D1135H、S1136、G1218S、E1219W、A1322R、D1332、R1335V、およびT1337(242 SpCas9);D1135C、S1136W、G1218N、E1219W、A1322R、D1332、R1335N、およびT1337(244 SpCas9);D113LM、S1136W、G1218R、E1219S、A1322R、D1332、R1335E、およびT1337(245 SpCas9);D1135G、S1136W、G1218S、E1219M、A1322R、D1332、R1335Q、およびT1337R(259 SpCas9);L111R、D1135V、S1136Q、G1218K、E1219F、A1322R、D1332、R1335A、およびT1337R(Nureki SpCas9);D1135M、S1136、S1216G、G1218、E1219、A1322、D1332A、R1335Q、およびT1337(NGCRd1 SpCas9);または
    D1135G、S1136、S1216G、G1218、E1219、A1322R、D1332A、R1335E、およびT1337R(267 (NGC Rd2 SpCas9)。
  33. ポリヌクレオチドプログラマブルDNA結合ドメインが、ヌクレアーゼ不活性のまたはニッカーゼのバリアントである、請求項1~32のいずれか1項に記載の方法。
  34. 前記ニッカーゼバリアントが、アミノ酸置換D10Aまたはその対応するアミノ酸置換を含む、請求項33に記載の方法。
  35. 前記デアミナーゼドメインが、デオキシリボ核酸(DNA)中のアデノシンまたはシトシンを脱アミノ化することができる、請求項1~34のいずれか1項に記載の方法。
  36. 前記アデノシンデアミナーゼまたはシチジンデアミナーゼが、天然には発生しない改変型アデノシンデアミナーゼまたはシチジンデアミナーゼである、請求項16に記載の方法。
  37. 前記アデノシンデアミナーゼがTadAデアミナーゼである、請求項36に記載の方法。
  38. 前記TadAデアミナーゼが、TadA*7.10、TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23、またはTadA*8.24である、請求項37に記載の方法。
  39. 前記TadA*7.10が、以下の変更のうち1つまたは複数を含む、請求項38に記載の方法:Y147T、Y147R、Q154S、Y123H、V82S、T166R、Q154R。
  40. 前記TadA*7.10が、Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y147T+Q154R;Y147T+Q154S;V82S+Q154S;およびY123H+Y147R+Q154R+I76Yからなる群から選択される変更の組合せを含む、請求項39に記載の方法:
  41. 前記1つまたは複数のガイドRNAが、CRISPR RNA(crRNA)とトランスコード化低分子RNA(tracrRNA)とを含み、前記crRNAが、SDSに関連する前記変更を含むSBDS核酸配列に相補的な核酸配列を含む、請求項1~40のいずれか1項に記載の方法。
  42. 前記塩基エディターが、SDSに関連付けられた変更を含むSBDS核酸配列に相補的な核酸配列を含む単一ガイドRNA(sgRNA)との複合体の状態にある、請求項1~41のいずれか1項に記載の方法。
  43. 前記sgRNAが、以下の配列のうち1つを含む、請求項12に記載の方法:UGUAAAUGUUUCCUAAGGUCまたはAAUGUUUCCUAAGGUCAGGU。
  44. 前記sgRNAが、以下の配列のうち1つを含む、請求項16に記載の方法:
    GUAAGCAGGCGGGUAACAGC;AGCAGGCGGGUAACAGCUGC;GCGGGUAACAGCUGCAGCA;GCAGGCGGGUAACAGCUGC、CAGGCGGGUAACAGCUGC、AGGCGGGUAACAGCUGC、またはAAGCAGGCGGGUAACAGCUGC。
  45. 細胞内またはその前駆体内に、
    細胞に、ポリヌクレオチドプログラマブルDNA結合ドメインとデアミナーゼドメインとを含む塩基エディター、前記塩基エディターをコードするポリヌクレオチド;および
    前記塩基エディターを標的に向けて異常なスプライシングに関連する変更をもたらす、1つまたは複数のガイドポリヌクレオチドを、
    導入することによって産生される細胞。
  46. 前記細胞またはその前駆体が、胚性幹細胞、誘導多能性幹細胞、または造血幹細胞である、請求項45に記載の細胞。
  47. SBDSタンパク質を発現する、請求項46に記載の細胞。
  48. シュワックマン・ダイアモンド症候群(SDS)に罹っている対象に由来する、請求項45~47のいずれか1項に記載の細胞。
  49. 哺乳類細胞またはヒト細胞である、請求項45~48のいずれか1項に記載の細胞。
  50. 前記変異が、異常なスプライシングにより生じる終止コドンおよび/または変異を含む遺伝子変換に起因する、請求項45~49のいずれか1項に記載の細胞。
  51. SDSに関連する遺伝子変換について選択される、請求項50に記載の細胞。
  52. 前記ポリヌクレオチドプログラマブルDNA結合ドメインが、野生型もしくは改変型のストレプトコッカス・ピロゲネスCas9(SpCas9)、またはそのバリアントである、請求項45~51のいずれか1項に記載の細胞。
  53. 前記ポリヌクレオチドプログラマブルDNA結合ドメインが、プロトスペーサー隣接モチーフ(PAM)特異性を変更された野生型SpCas9または改変型SpCas9バリアントを含む、請求項45~52のいずれか1項に記載の細胞。
  54. 前記改変型SpCas9が、核酸配列5’-NGC-3’またはまたは5’-NGC-3’を含むPAM核酸配列に対する特異性を有する、請求項53に記載の細胞。
  55. 前記改変型SpCas9が、表1に挙げられたCas9である、請求項53に記載の細胞。
  56. 前記改変型SpCas9がspCas9-MQKFRAERである、請求項55に記載の細胞。
  57. 前記改変型SpCas9が、図3A~図3Cまたは図10に示されるアミノ酸置換の組合せを含むSpCas9バリアントである、請求項52に記載の細胞。
  58. 前記SpCas9バリアントが、以下から選択されるアミノ酸配列/置換の組合せを含む、請求項57に記載の細胞:
    D1135M、S1136Q、G1218K、E1219F、A1322R、D1332、R1335E、およびT1337R(224 SpCas9);D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、およびT1337R(225 SpCas9);
    D1135M、S1136Q、G1218K、E1219F、A1322R、D1332K、R1335E、およびT1337R(226 SpCas9);
    D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、およびT1337Q(227 Cas9);
    D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335Q、およびT1337Q(230 SpCas9);
    D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335D、およびT1337Q(235 SpCas9);D1135Q、S1136、G1218T、E1219W、A1322R、D1332、R1335N、およびT1337(237 SpCas9);D1135H、S1136、G1218S、E1219W、A1322R、D1332、R1335V、およびT1337(242 SpCas9);D1135C、S1136W、G1218N、E1219W、A1322R、D1332、R1335N、およびT1337(244 SpCas9);D113LM、S1136W、G1218R、E1219S、A1322R、D1332、R1335E、およびT1337(245 SpCas9);D1135G、S1136W、G1218S、E1219M、A1322R、D1332、R1335Q、およびT1337R(259 SpCas9);L111R、D1135V、S1136Q、G1218K、E1219F、A1322R、D1332、R1335A、およびT1337R(Nureki SpCas9);D1135M、S1136、S1216G、G1218、E1219、A1322、D1332A、R1335Q、およびT1337(NGCRd1 SpCas9);または
    D1135G、S1136、S1216G、G1218、E1219、A1322R、D1332A、R1335E、およびT1337R(267 (NGC Rd2 SpCas9)。
  59. 前記プログラマブルポリヌクレオチドDNA結合ドメインが、ヌクレアーゼ不活性のバリアントである、請求項45~58のいずれか1項に記載の細胞。
  60. 前記プログラマブルポリヌクレオチドDNA結合ドメインが、ニッカーゼバリアントである、請求項45~59のいずれか1項に記載の細胞。
  61. 前記ニッカーゼバリアントが、アミノ酸置換D10Aまたはその対応するアミノ酸置換を含む、請求項60に記載の細胞。
  62. 前記デアミナーゼドメインが、デオキシリボ核酸(DNA)内のシチジンを脱アミノ化することができるシチジンデアミナーゼドメインであるか、またはDNA内のアデノシンを脱アミノ化することができるアデノシンデアミナーゼドメインである、請求項45~61のいずれか1項に記載の細胞。
  63. 前記アデノシンデアミナーゼまたはシチジンデアミナーゼが、天然には発生しない改変型アデノシンデアミナーゼまたはシチジンデアミナーゼである、請求項62に記載の細胞。
  64. 前記アデノシンデアミナーゼがTadAデアミナーゼである、請求項63に記載の細胞。
  65. 前記TadAデアミナーゼが、TadA*7.10、TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23、またはTadA*8.24である、請求項63に記載の細胞。
  66. 前記TadA*7.10が、以下の変更のうち1つまたは複数を含む、請求項65に記載の細胞:Y147T、Y147R、Q154S、Y123H、V82S、T166R、Q154R。
  67. 前記TadA*7.10が、Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y147T+Q154R;Y147T+Q154S;V82S+Q154Sからなる群から選択される変更の組合せを含む、請求項66に記載の細胞。
  68. 前記シトシンデアミナーゼが、BE4、rAPOBEC1、PpAPOBEC1、H122A置換を含有するPpAPOBEC1、AmAPOBEC1、SsAPOBEC2、RrA3F、F130L置換を含有するRrA3F、APOBEC-1がrAPOBEC1の配列に置き換えられたBE4のバリアント、APOBEC-1がAmAPOBEC1の配列に置き換えられたBE4のバリアント、APOBEC-1がSsAPOBEC2の配列に置き換えられたBE4のバリアント、APOBEC-1がPpAPOBEC1の配列に置き換えられたBE4のバリアント、またはAPOBEC-1がH122A置換を含有するPpAPOBEC1の配列に置き換えられたBE4のバリアントのうち1つまたは複数から選択される、請求項63に記載の細胞。
  69. H122A置換を含有するPpAPOBEC1、またはAPOBEC-1がH122A置換を含有するPpAPOBEC1の配列に置き換えられたBE4のバリアントが、R33A、W90F、K34A、R52A、H121A、またはY120Fから選択される1つまたは複数のアミノ酸変異をさらに含む、請求項68に記載の細胞。
  70. 前記1つまたは複数のガイドRNAが、CRISPR RNA(crRNA)とトランスコード化低分子RNA(tracrRNA)とを含み、前記crRNAが、SDSに関連する変更を含むSBDS核酸配列に相補的な核酸配列を含む、請求項45~69のいずれか1項に記載の細胞。
  71. 上記塩基エディターおよび1つまたは複数のガイドポリヌクレオチドが、細胞内で複合体を形成する、請求項45~70のいずれか1項に記載の細胞。
  72. 前記塩基エディターが、SDSに関連付けられた前記遺伝子変換を含むSBDS核酸配列に相補的な核酸配列を含む単一ガイドRNA(sgRNA)との複合体の状態にある、請求項71に記載の細胞。
  73. シュワックマン・ダイアモンド症候群(SDS)または異常なスプライシングに関連する疾患を、それを必要とする対象において治療する方法であって、請求項45~72のいずれか1項に記載の細胞を前記対象に投与することを含む方法。
  74. 前記細胞が、自己由来であるか、前記対象と同種異系または異種である、請求項73に記載の方法。
  75. 請求項45~72のいずれか1項に記載の細胞から増殖または拡大された、単離された細胞または細胞の集団。
  76. シュワックマン・ダイアモンド症候群(SDS)を対象において治療する方法であって、それを必要とする対象に、
    ポリヌクレオチドプログラマブルDNA結合ドメインとデアミナーゼドメインとを含む塩基エディター、または前記塩基エディターをコードするポリヌクレオチド;および
    前記塩基エディターを標的に向けてSDSに関連する変更をもたらす、1つまたは複数のガイドポリヌクレオチド
    を投与することを含む方法。
  77. 異常なスプライシングに関連する遺伝子疾患を対象において治療する方法であって、それを必要とする対象に
    ポリヌクレオチドプログラマブルDNA結合ドメインとデアミナーゼドメインとを含む塩基エディター、または前記塩基エディターをコードするポリヌクレオチド;および
    前記塩基エディターを標的に向けて、スプライシングを変更する病原性変異の変更をもたらす、1つまたは複数のガイドポリヌクレオチド
    を投与することを含む方法。
  78. 前記対象が哺乳動物またはヒトである、請求項76または77に記載の方法。
  79. 前記塩基エディターまたは前記塩基エディターをコードするポリヌクレオチドと、前記1つまたは複数のガイドポリヌクレオチドとを、前記対象の細胞に送達することを含む、請求項76または77に記載の方法。
  80. 前記細胞が、切詰型ポリペプチドを発現する、請求項76または77に記載の方法。
  81. 前記変更が、SBDSポリヌクレオチド中でTAA終止をTGGに変換する、請求項76または77に記載の方法。
  82. 前記変更が、SDSに関連する前記SBDSポリペプチド中のK62Xを変える、請求項76~81のいずれか1項に記載の方法。
  83. SDSに関連する前記遺伝子変換は、切詰型のSBDSポリペプチドの発現を結果として生じる、請求項76~82のいずれか1項に記載の方法。
  84. 前記塩基エディターの修正は、アミノ酸62位でリジン(K)をトリプトファン(W)に置き換える、請求項76~58のいずれか1項に記載の方法。
  85. 前記ポリヌクレオチドプログラマブルDNA結合ドメインが、改変型のストレプトコッカス・ピロゲネスCas9(SpCas9)、またはそのバリアントを含む、請求項76~84のいずれか1項に記載の方法。
  86. 前記ポリヌクレオチドプログラマブルDNA結合ドメインが、プロトスペーサー隣接モチーフ(PAM)特異性を変更された改変型SpCas9を含む、請求項76~85のいずれか1項に記載の方法。
  87. 前記改変型SpCas9が、核酸配列5’-NGC-3’または5’-NGC-3’を含むPAM核酸配列に対する特異性を有する、請求項86に記載の方法。
  88. 前記改変型SpCas9が、表1に挙げられたCas9である、請求項85~87に記載の方法。
  89. 前記改変型SpCas9がspCas9-MQKFRAERである、請求項88に記載の方法。
  90. 前記改変型SpCas9が、図3A~図3Cまたは図10に示されるアミノ酸置換の組合せを含むSpCas9バリアントである、請求項85~87のいずれか1項に記載の方法。
  91. 前記SpCas9バリアントが、以下から選択されるアミノ酸配列置換の組合せを含む、請求項90に記載の方法:
    D1135M、S1136Q、G1218K、E1219F、A1322R、D1332、R1335E、およびT1337R(224 SpCas9);D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、およびT1337R(225 SpCas9);
    D1135M、S1136Q、G1218K、E1219F、A1322R、D1332K、R1335E、およびT1337R(226 SpCas9);
    D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、およびT1337Q(227 Cas9);
    D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335Q、およびT1337Q(230 SpCas9);
    D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335D、およびT1337Q(235 SpCas9);D1135Q、S1136、G1218T、E1219W、A1322R、D1332、R1335N、およびT1337(237 SpCas9);D1135H、S1136、G1218S、E1219W、A1322R、D1332、R1335V、およびT1337(242 SpCas9);D1135C、S1136W、G1218N、E1219W、A1322R、D1332、R1335N、およびT1337(244 SpCas9);D113LM、S1136W、G1218R、E1219S、A1322R、D1332、R1335E、およびT1337(245 SpCas9);D1135G、S1136W、G1218S、E1219M、A1322R、D1332、R1335Q、およびT1337R(259 SpCas9);L111R、D1135V、S1136Q、G1218K、E1219F、A1322R、D1332、R1335A、およびT1337R(Nureki SpCas9);D1135M、S1136、S1216G、G1218、E1219、A1322、D1332A、R1335Q、およびT1337(NGCRd1 SpCas9);または
    D1135G、S1136、S1216G、G1218、E1219、A1322R、D1332A、R1335E、およびT1337R(267 (NGC Rd2 SpCas9)。
  92. ポリヌクレオチドプログラマブルDNA結合ドメインが、ヌクレアーゼ不活性のバリアントである、請求項76~91のいずれか1項に記載の方法。
  93. ポリヌクレオチドプログラマブルDNA結合ドメインが、ニッカーゼのバリアントである、請求項76~91のいずれか1項に記載の方法。
  94. 前記ニッカーゼバリアントが、アミノ酸置換D10Aまたはその対応するアミノ酸置換を含む、請求項93に記載の方法。
  95. 前記デアミナーゼドメインが、デオキシリボ核酸(DNA)中のアデノシンまたはシチジンを脱アミノ化することができる、請求項76~94のいずれか1項に記載の方法。
  96. 前記デアミナーゼドメインが、天然には発生しない改変型アデノシンデアミナーゼまたはシチジンデアミナーゼである、請求項95に記載の方法。
  97. 前記アデノシンデアミナーゼがTadAデアミナーゼである、請求項96に記載の方法。
  98. 前記TadAデアミナーゼが、TadA*7.10、TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23、またはTadA*8.24である、請求項70に記載の方法。
  99. 前記TadA*7.10が、以下の変更:Y147T、Y147R、Q154S、Y123H、V82S、T166R、Q154Rのうち1つまたは複数を含むか、または前記TadA*7.10が、Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y147T+Q154R;Y147T+Q154S;V82S+Q154S;およびY123H+Y147R+Q154R+I76Yからなる群から選択される変更の組合せを含む、請求項98に記載の方法。
  100. 前記デアミナーゼドメインが、BE4、rAPOBEC1、PpAPOBEC1、H122A置換を含有するPpAPOBEC1、AmAPOBEC1、SsAPOBEC2、RrA3F、F130L置換を含有するRrA3F、APOBEC-1がrAPOBEC1の配列に置き換えられたBE4のバリアント、APOBEC-1がAmAPOBEC1の配列に置き換えられたBE4のバリアント、APOBEC-1がSsAPOBEC2の配列に置き換えられたBE4のバリアント、APOBEC-1がPpAPOBEC1の配列に置き換えられたBE4のバリアント、またはAPOBEC-1がH122A置換を含有するPpAPOBEC1の配列に置き換えられたBE4のバリアントのうち1つまたは複数から選択されるシチジンデアミナーゼである、請求項96に記載の方法。
  101. H122A置換を含有するPpAPOBEC1、またはAPOBEC-1がH122A置換を含有するPpAPOBEC1の配列に置き換えられたBE4のバリアントが、R33A、W90F、K34A、R52A、H121A、またはY120Fから選択される1つまたは複数のアミノ酸変異をさらに含む、請求項100に記載の方法。
  102. 前記塩基エディターが、前記SBDSポリヌクレオチド配列中のSNP rs113993993 258+2T>Cを標的として正しいスプライシングを回復させる、請求項100または101に記載の方法。
  103. 前記1つまたは複数のガイドポリヌクレオチドが、CRISPR RNA(crRNA)とトランスコード化低分子RNA(tracrRNA)とを含み、前記crRNAが、遺伝子変換を含むSBDS核酸配列に相補的な核酸配列を含む、請求項76~102のいずれか1項に記載の方法。
  104. 前記塩基エディターが、SDSに関連付けられた遺伝子変換を含むSBDS核酸配列に相補的な核酸配列を含む単一ガイドRNA(sgRNA)との複合体の状態にある、請求項76~103のいずれか1項に記載の方法。
  105. 細胞またはその前駆体を産生する方法であって、
    (a)シュワックマン・ダイアモンド症候群(SDS)に関連する遺伝子変換を含む誘導多能性幹細胞内に、
    ポリヌクレオチド-プログラマブルヌクレオチド-結合ドメインとシチジンデアミナーゼドメインまたはアデノシンデアミナーゼドメインとを含む塩基エディターまたは塩基エディターをコードするポリヌクレオチド;および
    塩基エディターを標的に向けてSDSに関連する変異に変更をもたらす1つまたは複数のガイドポリヌクレオチド
    を導入すること;ならびに
    (b)前記誘導多能性幹細胞または前駆体を所望の細胞型に分化させること
    を含む方法。
  106. 前記変異が、SDSに関連する遺伝子変換である、請求項105に記載の方法。
  107. 前記細胞または前駆体は、SDSに罹っている対象から得られる、請求項105または106に記載の方法。
  108. 前記細胞または前駆体が、哺乳類細胞またはヒト細胞である、請求項105~107のいずれか1項に記載の方法。
  109. 前記ポリヌクレオチドプログラマブルDNA結合ドメインが、ストレプトコッカス・ピロゲネスCas9(SpCas9)、改変型ストレプトコッカス・ピロゲネスCas9(SpCas9)、またはそれらのバリアントを含む、請求項105~108のいずれか1項に記載の方法。
  110. 前記ポリヌクレオチドプログラマブルDNA結合ドメインが、プロトスペーサー隣接モチーフ(PAM)特異性を変更された改変型SpCas9を含む、請求項105~109のいずれか1項に記載の方法。
  111. 前記SpCas9が、核酸配列5’-NGG-3’に対する特異性を有し、前記改変型SpCas9が、核酸配列5’-NGC-3’または5’-NGC-3’を含むPAM核酸配列に対する特異性を有する、請求項105~110のいずれか1項に記載の方法。
  112. 前記改変型SpCas9が表1に挙げられたCas9バリアントであるか、または前記改変型SpCas9がspCas9-MQKFRAERである、請求項110に記載の方法。
  113. 前記改変型SpCas9が、図3A~図3Cまたは図10に示されるアミノ酸置換の組合せを含むSpCas9バリアントである、請求項109~111のいずれか1項に記載の方法。
  114. 前記SpCas9バリアントが、以下から選択されるアミノ酸配列置換の組合せを含む、請求項113に記載の方法:
    D1135M、S1136Q、G1218K、E1219F、A1322R、D1332、R1335E、およびT1337R(224 SpCas9);D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、およびT1337R(225 SpCas9);
    D1135M、S1136Q、G1218K、E1219F、A1322R、D1332K、R1335E、およびT1337R(226 SpCas9);
    D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、およびT1337Q(227 Cas9);
    D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335Q、およびT1337Q(230 SpCas9);
    D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335D、およびT1337Q(235 SpCas9);D1135Q、S1136、G1218T、E1219W、A1322R、D1332、R1335N、およびT1337(237 SpCas9);D1135H、S1136、G1218S、E1219W、A1322R、D1332、R1335V、およびT1337(242 SpCas9);D1135C、S1136W、G1218N、E1219W、A1322R、D1332、R1335N、およびT1337(244 SpCas9);D113LM、S1136W、G1218R、E1219S、A1322R、D1332、R1335E、およびT1337(245 SpCas9);D1135G、S1136W、G1218S、E1219M、A1322R、D1332、R1335Q、およびT1337R(259 SpCas9);L111R、D1135V、S1136Q、G1218K、E1219F、A1322R、D1332、R1335A、およびT1337R(Nureki SpCas9);D1135M、S1136、S1216G、G1218、E1219、A1322、D1332A、R1335Q、およびT1337(NGCRd1 SpCas9);または
    D1135G、S1136、S1216G、G1218、E1219、A1322R、D1332A、R1335E、およびT1337R(267 (NGC Rd2 SpCas9)。
  115. ポリヌクレオチドプログラマブルDNA結合ドメインが、ヌクレアーゼ不活性のまたはニッカーゼのバリアントである、請求項105~114のいずれか1項に記載の方法。
  116. 前記ニッカーゼバリアントが、アミノ酸置換D10Aまたはその対応するアミノ酸置換を含む、請求項115に記載の方法。
  117. 前記アデノシンデアミナーゼドメインが、デオキシリボ核酸(DNA)内のアデノシンを脱アミノ化することができ、シチジンデアミナーゼは、デオキシリボ核酸(DNA)内のシトシンを脱アミノ化することができる、請求項105~116のいずれか1項に記載の方法。
  118. 前記アデノシンデアミナーゼが、天然には発生しない改変型アデノシンデアミナーゼである、請求項117に記載の方法。
  119. 前記アデノシンデアミナーゼが、TadA*7.10、TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23、またはTadA*8.24から選択されるTadAデアミナーゼである、請求項117または118に記載の方法。
  120. 前記デアミナーゼドメインが、BE4、rAPOBEC1、PpAPOBEC1、H122A置換を含有するPpAPOBEC1、AmAPOBEC1、SsAPOBEC2、RrA3F、F130L置換を含有するRrA3F、APOBEC-1がrAPOBEC1の配列に置き換えられたBE4のバリアント、APOBEC-1がAmAPOBEC1の配列に置き換えられたBE4のバリアント、APOBEC-1がSsAPOBEC2の配列に置き換えられたBE4のバリアント、APOBEC-1がPpAPOBEC1の配列に置き換えられたBE4のバリアント、またはAPOBEC-1がH122A置換を含有するPpAPOBEC1の配列に置き換えられたBE4のバリアントのうち1つまたは複数から選択されるシチジンデアミナーゼである、請求項117に記載の方法。
  121. H122A置換を含有するPpAPOBEC1、またはAPOBEC-1がH122A置換を含有するPpAPOBEC1の配列に置き換えられたBE4のバリアントが、R33A、W90F、K34A、R52A、H121A、またはY120Fから選択される1つまたは複数のアミノ酸変異をさらに含む、請求項120に記載の方法。
  122. 前記1つまたは複数のガイドポリヌクレオチドが、CRISPR RNA(crRNA)とトランスコード化低分子RNA(tracrRNA)とを含み、前記crRNAが、SDSに関連する前記遺伝子変換を含むSBDS核酸配列に相補的な核酸配列を含む、請求項105~121のいずれか1項に記載の方法。
  123. 上記塩基エディターおよび1つまたは複数のガイドポリヌクレオチドが、細胞内で複合体を形成する、請求項105~122のいずれか1項に記載の方法。
  124. 前記塩基エディターが、SDSに関連付けられた前記遺伝子変換を含むSBDS核酸配列に相補的な核酸配列を含む単一ガイドRNA(sgRNA)との複合体の状態にある、請求項123に記載の方法。
  125. 以下のうち1つまたは複数から選択される5’から3’の核酸配列、またはその1、2、3、4、もしくは5ヌクレオチドの5’切詰断片を含むガイドRNA:GUAAGCAGGCGGGUAACAGC;AGCAGGCGGGUAACAGCUGC;GCGGGUAACAGCUGCAGCAU;UGUAAAUGUUUCCUAAGGUC;AAUGUUUCCUAAGGUCAGGU、GCAGGCGGGUAACAGCUGC、CAGGCGGGUAACAGCUGC、AGGCGGGUAACAGCUGC、およびAAGCAGGCGGGUAACAGCUGC。
  126. SBDS遺伝子内の病原性変異を編集するための塩基エディターシステムであって、
    (a)(i)ポリヌクレオチドプログラマブルDNA結合ドメインと
    (ii)前記SBDS遺伝子変換に存在するポリヌクレオチドまたはその相補的な核酸塩基を脱アミノ化することができるデアミナーゼドメインと
    を含む塩基エディター;および
    (b)ポリヌクレオチドプログラマブルDNA結合ドメインと連係するガイドポリヌクレオチドであって、少なくとも一部がSBDS遺伝子、SBDS偽遺伝子、またはそのリバース相補鎖に位置する標的ポリヌクレオチド配列を標的として前記塩基エディターを向けるガイドポリヌクレオチド
    を含み;
    ポリヌクレオチドまたはその相補的な核酸塩基を脱アミノ化することによって、SBDS遺伝子の転写が可能になる、塩基エディターシステム。
  127. 異常なスプライシングを結果として生じる遺伝子内の変異を編集するための塩基エディターシステムであって、
    (a)(i)ポリヌクレオチドプログラマブルDNA結合ドメインと
    (ii)異常なスプライシングを結果として生じる変異またはその相補的な核酸塩基を脱アミノ化することができるデアミナーゼドメインと
    を含む塩基エディター;および
    (b)ポリヌクレオチドプログラマブルDNA結合ドメインと連係するガイドポリヌクレオチドであって、少なくとも一部が上記遺伝子、またはそのリバース相補鎖に位置する標的ポリヌクレオチド配列を標的として前記塩基エディターを向けるガイドポリヌクレオチド
    を含み;
    前記変異またはその相補的な核酸塩基を脱アミノ化することによって、転写が可能になる、塩基エディターシステム。
  128. 異常なスプライシングを結果として生じる遺伝子内の病原性変異を編集するための方法であって、
    少なくとも一部が上記遺伝子またはそのリバース相補鎖に位置する標的ヌクレオチド配列を、
    (i)少なくとも一部が上記遺伝子またはそのリバース相補鎖に位置する標的ポリヌクレオチド配列を標的として塩基エディターを向けるガイドポリヌクレオチドと連係する、ポリヌクレオチドプログラマブルDNA結合ドメインと、
    (ii)異常なスプライシングを結果として生じる病原性変異またはその相補的な核酸塩基を脱アミノ化することができるデアミナーゼドメインと
    を含む塩基エディターに接触させること;ならびに
    標的ヌクレオチド配列を標的として塩基エディターを向けると病原性変異またはその相補的な核酸塩基を脱アミノ化することによって、病原性変異を編集すること
    を含み、
    病原性変異またはその相補的な核酸塩基を脱アミノ化することは、結果として、スプライシングを可能にする配列へ病原性変異を変換し、それによって病原性変異を修正する、方法。
  129. SBDS遺伝子内の病原性変異を編集する方法であって、
    少なくとも一部が上記遺伝子またはそのリバース相補鎖に位置する標的ヌクレオチド配列を、
    (i)少なくとも一部が上記遺伝子またはそのリバース相補鎖に位置する標的ポリヌクレオチド配列を標的として塩基エディターを向けるガイドポリヌクレオチドと連係する、ポリヌクレオチドプログラマブルDNA結合ドメインと、
    (ii)病原性変異またはその相補的な核酸塩基を脱アミノ化することができるデアミナーゼドメインと
    を含む塩基エディターに接触させること;ならびに
    標的ヌクレオチド配列を標的として前記塩基エディターを向けると病原性変異またはその相補的な核酸塩基を脱アミノ化することによって、病原性変異を編集すること
    を含み、
    病原性変異またはその相補的な核酸塩基を脱アミノ化することによって、スプライシングが可能になり、それによってSBDS遺伝子の病原性変異を編集する、方法。
  130. SBDS中の前記病原性変異が遺伝子変換に起因する、請求項129に記載の方法。
  131. 前記病原性変異が、前記遺伝子の終止コドンを導入するかまたはスプライシングを変更する、請求項128または129に記載の方法。
  132. 前記病原性変異が、切詰を有するポリペプチドをコードする、請求項128または129に記載の方法。
  133. 前記塩基エディターが、ミスセンス変異を導入するか、新しいスプライスアクセプター部位またはスプライスドナー部位を挿入するか、または変異を含むスプライスアクセプター部位もしくはスプライスドナー部位を修正する、請求項128または129に記載の方法。
  134. 前記塩基エディターは、SBDS遺伝子内のrs113993993 C→Tの変異を含むスプライスドナーSNP部位を修正する、請求項133に記載の方法。
  135. SBDS遺伝子内の病原性変異を編集することによって対象においてSDSを治療する方法であって、
    塩基エディターまたは塩基エディターをコードするポリヌクレオチドを、それを必要とする対象に投与することであって、塩基エディターが:
    (i)ポリヌクレオチドプログラマブルDNA結合ドメインと
    (ii)病原性変異またはその相補的な核酸塩基内の核酸塩基を脱アミノ化することができるデアミナーゼドメインと
    を含む、投与すること;ならびに
    ガイドポリヌクレオチドを対象に投与することであって、前記ガイドポリヌクレオチドが、少なくとも一部が上記遺伝子またはそのリバース相補鎖に位置する標的ヌクレオチド配列を標的として前記塩基エディターを向ける、投与すること;ならびに
    前記標的ヌクレオチド配列を標的として前記塩基エディターを向けた際にSBDS遺伝子内の病原性変異またはその相補的な核酸塩基を脱アミノ化することによって、前記病原性変異を編集すること
    を含み、
    前記病原性変異またはその相補的な核酸塩基を脱アミノ化することにより、転写が可能になるか、または前記病原性変異が修正される、方法。
  136. 細胞、組織、または器官のSBDS遺伝子内の病原性変異を修正することによって、それを必要とする対象においてSDSを治療するための細胞、組織、または器官を産生する方法であって、
    前記細胞、組織、または器官を、
    (i)ポリヌクレオチドプログラマブルDNA結合ドメインと
    (ii)病原性変異またはその相補的な核酸塩基を脱アミノ化することができるデアミナーゼドメインと
    を含む塩基エディターに接触させること;ならびに
    前記細胞、組織、または器官をガイドポリヌクレオチドに接触させることであって、ガイドポリヌクレオチドが、少なくとも一部が上記遺伝子またはそのリバース相補鎖に位置する標的ヌクレオチド配列を標的として塩基エディターを向ける、接触させること;ならびに
    前記標的ヌクレオチド配列を標的として塩基エディターを向けた際に病原性変異またはその相補的な核酸塩基を脱アミノ化することによって、前記変異を編集すること
    を含み、
    前記病原性変異またはその相補的な核酸塩基を脱アミノ化することによって、スプライシングが可能となり、それによってSDSを治療するための前記細胞、組織、または器官が産生される、方法。
  137. 前記変異が遺伝子変換に起因する、請求項136に記載の方法。
  138. シュワックマン・ダイアモンド症候群に関連する前記変異が、前記遺伝子の終止コドンを誘発するか、またはスプライシングを変更する、請求項136に記載の方法。
  139. シュワックマン・ダイアモンド症候群(SDS)に関連する前記変異が、切詰を有するSBDSポリペプチドをコードする、請求項136に記載の方法。
  140. 前記塩基エディターが、ミスセンス変異を導入するか、新しいスプライスアクセプター部位またはスプライスドナー部位を挿入するか、または変異を含むスプライスアクセプター部位もしくはスプライスドナー部位を修正する、請求項136に記載の方法。
  141. 前記細胞、組織、または器官を前記対象に投与することをさらに含む、請求項136に記載の方法。
  142. 前記細胞、組織、または器官が、自己由来であるか、前記対象と同種異系または異種である、請求項136に記載の方法。
  143. 前記デアミナーゼドメインが、シチジンデアミナーゼドメインまたはアデノシンデアミナーゼドメインである、請求項136に記載の方法。
  144. 前記アデノシンデアミナーゼドメインが、デオキシリボ核酸(DNA)中のアデニンを脱アミノ化することができ、前記シチジンデアミナーゼが、DNA中のシトシンを脱アミノ化することができる、請求項143に記載の方法。
  145. 前記ガイドポリヌクレオチドが、リボ核酸(RNA)またはデオキシリボ核酸(DNA)を含む、請求項126~144のいずれか1項に記載の塩基エディターシステムまたは方法。
  146. 前記ガイドポリヌクレオチドが、CRISPR RNA(crRNA)配列、トランス活性化CRISPR RNA(tracrRNA)配列、またはそれらの組合せを含み、前記crRNAが、SDSに関連する前記変更を含むSBDS核酸配列に相補的な核酸配列を含む、請求項126~145のいずれか1項に記載の塩基エディターシステムまたは方法。
  147. 第2のガイドポリヌクレオチドをさらに含む、請求項126~146のいずれか1項に記載の塩基エディターシステムまたは方法。
  148. 前記第2のガイドポリヌクレオチドが、リボ核酸(RNA)またはデオキシリボ核酸(DNA)を含む、請求項126~147のいずれか1項に記載の塩基エディターシステムまたは方法。
  149. 前記第2のガイドポリヌクレオチドが、CRISPR RNA(crRNA)配列、トランス活性化CRISPR RNA(tracrRNA)配列、またはそれらの組合せを含む、請求項126~147のいずれか1項に記載の塩基エディターシステムまたは方法。
  150. 前記ポリヌクレオチドプログラマブルDNA結合ドメインが、ヌクレアーゼ活性がないかまたはニッカーゼである、請求項126~149のいずれか1項に記載の塩基エディターシステムまたは方法。
  151. 前記ポリヌクレオチドプログラマブルDNA結合ドメインが、Cas9ドメインを含む、請求項126~150のいずれか1項に記載の塩基エディターシステムまたは方法。
  152. 前記Cas9ドメインが、ヌクレアーゼ活性のないCas9(dCas9)、Cas9ニッカーゼ(nCas9)、またはヌクレアーゼ活性のCas9である、請求項126~151のいずれか1項に記載の塩基エディターシステムまたは方法。
  153. 前記Cas9ドメインがCas9ニッカーゼを含む、請求項152に記載の塩基エディターシステムまたは方法。
  154. 前記ポリヌクレオチドプログラマブルDNA結合ドメインが、工学的に改変されたかまたは改変型のポリヌクレオチドプログラマブルDNA結合ドメインである、請求項126~153のいずれか1項に記載の塩基エディターシステムまたは方法。
  155. 前記編集により、結果として20%未満のインデル形成、15%未満のインデル形成、10%未満のインデル形成、5%未満のインデル形成、4%未満のインデル形成、3%未満のインデル形成、2%未満のインデル形成、1%未満のインデル形成、0.5%未満のインデル形成、または0.1%未満のインデル形成を生じる、請求項126~154のいずれか1項に記載の塩基エディターシステムまたは方法。
  156. 前記編集が、結果として転位を生じない、請求項126~155のいずれか1項に記載の塩基エディターシステムまたは方法。
  157. 前記塩基エディターは、SBDS遺伝子内のrs113993993 C→Tの変異を含むスプライスドナーSNP部位を修正する、請求項126~155のいずれか1項に記載の塩基エディターまたは方法。
  158. シュワックマン・ダイアモンド症候群(SDS)を、それを必要とする対象において治療する方法であって、請求項45~72のいずれか1項に記載の細胞を前記対象に投与することを含む方法。
  159. 前記塩基エディターおよび/またはその構成成分が、mRNAによってコードされる、請求項1~44もしくは76~124のいずれか1項に記載の方法、または請求項45~72のいずれか1項に記載の細胞、または請求項126~157のいずれか1項に記載の塩基エディターシステムもしくは方法。
  160. 前記塩基エディターが、SBDS核酸配列に相補的な核酸配列を含む単一ガイドRNA(sgRNA)との複合体の状態にある、請求項1~44もしくは76~124のいずれか1項に記載の方法、または請求項126~157のいずれか1項に記載の塩基エディターシステムもしくは方法。
  161. 前記sgRNAが、前記SBDS核酸配列に相補的な少なくとも10個の隣接したヌクレオチドを含む核酸配列を含む、請求項160に記載の方法または塩基エディターシステム。
  162. 前記sgRNAが、前記SBDS核酸配列に相補的な15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、または40個の隣接したヌクレオチドを含む核酸配列を含む、請求項161に記載の方法または塩基エディターシステム。
  163. 前記sgRNAが、前記SBDS核酸配列に相補的な18、19、または20個の隣接したヌクレオチドを含む核酸配列を含む、請求項162に記載の方法または塩基エディターシステム。
  164. ガイドRNAに結合している塩基エディターを含む組成物であって、前記ガイドRNAが、シュワックマン・ダイアモンド症候群(SDS)に関連するSBDS遺伝子に相補的な核酸配列を含む、組成物。
  165. 前記塩基エディターが、アデノシンデアミナーゼまたはシチジンデアミナーゼを含む、請求項164に記載の組成物。
  166. 前記アデノシンデアミナーゼは、デオキシリボ核酸(DNA)中のアデニンを脱アミノ化することができる、請求項165に記載の組成物。
  167. 前記アデノシンデアミナーゼが、TadA*7.10、TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23、またはTadA*8.24のうち1つまたは複数から選択されるTadAデアミナーゼである、請求項166に記載の組成物。
  168. 前記シチジンデアミナーゼは、デオキシリボ核酸(DNA)中のシチジンを脱アミノ化することができる、請求項165に記載の組成物。
  169. 前記シチジンデアミナーゼは、APOBEC、A3F、またはそれらの誘導体である、請求項168に記載の組成物。
  170. 前記塩基エディターが、
    (i)Cas9ニッカーゼを含み;
    (ii)ヌクレアーゼ不活性のCas9を含み;
    (iii)図3A~3Cもしくは図10に示されるアミノ酸置換の組合せを含むSpCas9バリアントを含み;
    (iv)以下から選択されるアミノ酸配列置換の組合せを含むSpCas9バリアントを含み:
    D1135M、S1136Q、G1218K、E1219F、A1322R、D1332、R1335E、およびT1337R(224 SpCas9);D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、およびT1337R(225 SpCas9);
    D1135M、S1136Q、G1218K、E1219F、A1322R、D1332K、R1335E、およびT1337R(226 SpCas9);
    D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、およびT1337Q(227 Cas9);
    D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335Q、およびT1337Q(230 SpCas9);
    D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335D、およびT1337Q(235 SpCas9);D1135Q、S1136、G1218T、E1219W、A1322R、D1332、R1335N、およびT1337(237 SpCas9);D1135H、S1136、G1218S、E1219W、A1322R、D1332、R1335V、およびT1337(242 SpCas9);D1135C、S1136W、G1218N、E1219W、A1322R、D1332、R1335N、およびT1337(244 SpCas9);D113LM、S1136W、G1218R、E1219S、A1322R、D1332、R1335E、およびT1337(245 SpCas9);D1135G、S1136W、G1218S、E1219M、A1322R、D1332、R1335Q、およびT1337R(259 SpCas9);L111R、D1135V、S1136Q、G1218K、E1219F、A1322R、D1332、R1335A、およびT1337R(Nureki SpCas9);D1135M、S1136、S1216G、G1218、E1219、A1322、D1332A、R1335Q、およびT1337(NGCRd1 SpCas9);または
    D1135G、S1136、S1216G、G1218、E1219、A1322R、D1332A、R1335E、およびT1337R(267 (NGC Rd2 SpCas9);
    (v)UGIドメインを含まず;ならびに/または
    (vi)BE4、rAPOBEC1、PpAPOBEC1、H122A置換を含有するPpAPOBEC1、AmAPOBEC1、SsAPOBEC2、RrA3F、F130L置換を含有するRrA3F、APOBEC-1がrAPOBEC1の配列に置き換えられたBE4のバリアント、APOBEC-1がAmAPOBEC1の配列に置き換えられたBE4のバリアント、APOBEC-1がSsAPOBEC2の配列に置き換えられたBE4のバリアント、APOBEC-1がPpAPOBEC1の配列に置き換えられたBE4のバリアント、もしくはAPOBEC-1がH122A置換を含有するPpAPOBEC1の配列に置き換えられたBE4のバリアントから選択されるシチジンデアミナーゼを含む、
    請求項164~169のいずれか1項に記載の組成物。
  171. (vi)で、H122A置換を含有するPpAPOBEC1、またはAPOBEC-1がH122A置換を含有するPpAPOBEC1の配列に置き換えられたBE4のバリアントは、R33A、W90F、K34A、R52A、H121A、またはY120Fから選択される1つまたは複数のアミノ酸変異をさらに含む、請求項170に記載の組成物。
  172. 医薬的に許容可能な賦形剤、希釈剤、または担体をさらに含む、請求項164~171のいずれか1項に記載の組成物。
  173. 請求項172の組成物を含む、シュワックマン・ダイアモンド症候群(SDS)の治療のための医薬組成物。
  174. 前記gRNAおよび塩基エディターが、共にまたは別々に製剤化される、請求項173に記載の医薬組成物。
  175. 前記gRNAは、以下のうち1つまたは複数から選択される5’から3’までの核酸配列またはその1、2、3、4、もしくは5個のヌクレオチドの5’切詰断片を含む、請求項173または174に記載の医薬組成物:GCGGGUAACAGCUGCAGCAU;UGUAAAUGUUUCCUAAGGUC;AAUGUUUCCUAAGGUCAGGU、GCAGGCGGGUAACAGCUGC、CAGGCGGGUAACAGCUGC、AGGCGGGUAACAGCUGC、およびAAGCAGGCGGGUAACAGCUGC。
  176. 哺乳類細胞での発現に適したベクターをさらに含み、前記ベクターは、前記塩基エディターをコードするポリヌクレオチドを含む、請求項173~175のいずれか1項に記載の医薬組成物。
  177. 前記塩基エディターをコードする前記ポリヌクレオチドはmRNAである、請求項176に記載の医薬組成物。
  178. 前記ベクターはウイルスベクターである、請求項176または177に記載の医薬組成物。
  179. 前記ウイルスベクターは、レトロウイルスベクター、アデノウイルスベクター、レンチウイルスベクター、ヘルペスウイルスベクター、またはアデノ随伴ウイルスベクター(AAV)である、請求項178に記載の医薬組成物。
  180. 哺乳類細胞での発現に適したリボ核粒子をさらに含む、請求項173~179のいずれか1項に記載の医薬組成物。
  181. (i)塩基エディターをコードする核酸と(ii)請求項125のガイドRNAとを含む医薬組成物。
  182. 脂質をさらに含む、請求項173~181のいずれか1項に記載の医薬組成物。
  183. シュワックマン・ダイアモンド症候群(SDS)を治療する方法であって、請求項173~182のいずれか1項に記載の医薬組成物を、それを必要とする対象に投与することを含む方法。
  184. 対象のシュワックマン・ダイアモンド症候群(SDS)の治療における、請求項173~182のいずれか1項に記載の医薬組成物の使用。
  185. 前記対象がヒトである、請求項184に記載の使用。
JP2022513443A 2019-08-29 2020-08-28 転写または発現を可能にするように変異を編集するための組成物および方法 Pending JP2022545950A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962893638P 2019-08-29 2019-08-29
US62/893,638 2019-08-29
PCT/US2020/048510 WO2021041885A2 (en) 2019-08-29 2020-08-28 Compositions and methods for editing a mutation to permit transcription or expression

Publications (2)

Publication Number Publication Date
JP2022545950A true JP2022545950A (ja) 2022-11-01
JPWO2021041885A5 JPWO2021041885A5 (ja) 2023-09-05

Family

ID=74684607

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022513443A Pending JP2022545950A (ja) 2019-08-29 2020-08-28 転写または発現を可能にするように変異を編集するための組成物および方法

Country Status (8)

Country Link
US (1) US20220313799A1 (ja)
EP (1) EP4022050A2 (ja)
JP (1) JP2022545950A (ja)
KR (1) KR20220066289A (ja)
CN (1) CN114641567A (ja)
AU (1) AU2020336953A1 (ja)
CA (1) CA3152861A1 (ja)
WO (1) WO2021041885A2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4143315A1 (en) 2020-04-28 2023-03-08 The Broad Institute Inc. <smallcaps/>? ? ?ush2a? ? ? ? ?targeted base editing of thegene
WO2022194224A1 (zh) * 2021-03-16 2022-09-22 上海驯鹿生物技术有限公司 通用型嵌合抗原受体t细胞及其应用
WO2023102550A2 (en) 2021-12-03 2023-06-08 The Broad Institute, Inc. Compositions and methods for efficient in vivo delivery
KR20230166378A (ko) 2022-05-30 2023-12-07 현대자동차주식회사 차량의 제동 방법 및 장치

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004020658A1 (en) * 2002-08-30 2004-03-11 The Hospital For Sick Children Diagnosis of shwachman-diamond syndrome
WO2009061442A1 (en) * 2007-11-06 2009-05-14 Children's Medical Center Corporation Method to produce induced pluripotent stem (ips) cells form non-embryonic human cells
EP3365357B1 (en) * 2015-10-23 2024-02-14 President and Fellows of Harvard College Evolved cas9 proteins for gene editing
US11840711B2 (en) * 2017-04-12 2023-12-12 The Broad Institute, Inc. Type VI CRISPR orthologs and systems
CN109306361B (zh) * 2018-02-11 2022-06-28 华东师范大学 一种新的a/t到g/c碱基定点转换的基因编辑系统

Also Published As

Publication number Publication date
WO2021041885A2 (en) 2021-03-04
US20220313799A1 (en) 2022-10-06
CN114641567A (zh) 2022-06-17
EP4022050A2 (en) 2022-07-06
CA3152861A1 (en) 2021-03-04
AU2020336953A1 (en) 2022-03-03
WO2021041885A3 (en) 2021-03-25
KR20220066289A (ko) 2022-05-24

Similar Documents

Publication Publication Date Title
US11155803B2 (en) Adenosine deaminase base editors and methods of using same to modify a nucleobase in a target sequence
US20210380955A1 (en) Methods of editing single nucleotide polymorphism using programmable base editor systems
US20210371858A1 (en) Methods of suppressing pathogenic mutations using programmable base editor systems
US20210277379A1 (en) Multi-effector nucleobase editors and methods of using same to modify a nucleic acid target sequence
US20220136012A1 (en) Nucleobase editors having reduced off-target deamination and methods of using same to modify a nucleobase target sequence
US20230140953A1 (en) Methods of editing a disease-associated gene using adenosine deaminase base editors, including for the treatment of genetic disease
US20230017979A1 (en) Compositions and methods for non-toxic conditioning
US20220098593A1 (en) Splice acceptor site disruption of a disease-associated gene using adenosine deaminase base editors, including for the treatment of genetic disease
US20220313799A1 (en) Compositions and methods for editing a mutation to permit transcription or expression
US20230070861A1 (en) Compositions and methods for treating hepatitis b
JP2022533673A (ja) プログラム可能塩基エディターシステムを用いた一塩基多型編集法
US20240132867A1 (en) Adenosine deaminase base editors and methods of using same to modify a nucleobase in a target sequence
AU2021360919A1 (en) Compositions and methods for treating glycogen storage disease type 1a
CN117729931A (zh) 用于治疗转甲状腺素蛋白淀粉样变性的组合物和方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230828

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230828