JP2022546608A - 新規核酸塩基エディター及びその使用方法 - Google Patents

新規核酸塩基エディター及びその使用方法 Download PDF

Info

Publication number
JP2022546608A
JP2022546608A JP2022514994A JP2022514994A JP2022546608A JP 2022546608 A JP2022546608 A JP 2022546608A JP 2022514994 A JP2022514994 A JP 2022514994A JP 2022514994 A JP2022514994 A JP 2022514994A JP 2022546608 A JP2022546608 A JP 2022546608A
Authority
JP
Japan
Prior art keywords
adenosine deaminase
mutations
cas9
fusion protein
domain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022514994A
Other languages
English (en)
Other versions
JPWO2021050571A5 (ja
Inventor
ニコル ゴーデッリ、
マイケル パッカー、
Original Assignee
ビーム セラピューティクス インク.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from PCT/US2020/018195 external-priority patent/WO2020168135A1/en
Application filed by ビーム セラピューティクス インク. filed Critical ビーム セラピューティクス インク.
Publication of JP2022546608A publication Critical patent/JP2022546608A/ja
Publication of JPWO2021050571A5 publication Critical patent/JPWO2021050571A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04004Adenosine deaminase (3.5.4.4)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • A61K31/7088Compounds having three or more nucleosides or nucleotides
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P1/00Drugs for disorders of the alimentary tract or the digestive system
    • A61P1/16Drugs for disorders of the alimentary tract or the digestive system for liver or gallbladder disorders, e.g. hepatoprotective agents, cholagogues, litholytics
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Abstract

本発明は、アデノシンデアミナーゼドメインを含む新規のプログラム可能な核酸塩基エディター、及びポリヌクレオチド編集のためのその使用方法を特徴とする。いくつかの実施形態では、プログラム可能な核酸塩基エディターは、遺伝性疾患に関連する病原性変異を編集する。【選択図】なし

Description

関連出願の相互参照
本出願は、2019年9月9日に出願された米国仮出願第62/897,777号の優先権及び利益を主張する国際PCT出願であり、2020年2月13日に出願された国際PCT出願第PCT/US2020/018195号の優先権を主張し、その全内容は、その全体が参照により本明細書に援用される。
核酸配列の標的化編集、例えば、ゲノムDNAへの標的化切断または特定の修飾(改変)の標的化導入は、遺伝子機能の研究にとって非常に有望なアプローチであり、ヒトの遺伝性疾患に対する新規治療法を提供し得る。現在利用可能な塩基エディターとして、標的C・G塩基対をT・Aに変換するシチジン塩基エディター(BE4など)、及びA・TをG・Cに変換するアデニン塩基エディター(ABE7.10など)が挙げられる。当技術分野において、より高い特異性及び効率で標的配列内に修飾を誘導し得る改良された塩基エディターが必要とされている。
以下に記載するように、本発明は、アデノシンデアミナーゼドメイン(例えば、TadA*9またはABE9)を含む新規のプログラム可能な核酸塩基エディター、及びポリヌクレオチド編集のためのその使用方法を特徴とする。いくつかの実施形態では、本発明のABE9は、ポリヌクレオチド、例えば、遺伝性疾患に関連する病原性変異を含むポリヌクレオチドを編集する。
一態様では、配列番号1の21、23、25、38、51、54、70、71、72、73、94、124、133、139、146、及び158からなる群から選択されるアミノ酸位置での改変、または別のアデノシンデアミナーゼにおける対応する改変を含むアデノシンデアミナーゼ:
Figure 2022546608000001
を提供する。一実施形態では、アデノシンデアミナーゼは、配列番号1のR21N、R23H、E25F、N38G、L51W、P54C、M70V、Q71M、N72K、Y73S、M94V、P124W、T133K、D139L、D139M、C146R、及びA158Kからなる群から選択される改変、または別のアデノシンデアミナーゼにおける対応する改変を含む。一実施形態では、アデノシンデアミナーゼは、配列番号1のV82T改変、または別のアデノシンデアミナーゼにおける対応する改変をさらに含む。一実施形態では、アデノシンデアミナーゼは、配列番号1の21、23、25、38、51、54、70、71、72、73、94、124、133、139、146、及び158からなる群から選択されるアミノ酸位置での改変、または別のアデノシンデアミナーゼにおける対応する改変を含む。一実施形態では、この態様及びその実施形態のアデノシンデアミナーゼは、2つ以上の改変を含む。一実施形態では、この態様及びその実施形態のアデノシンデアミナーゼは、3つ以上の前記改変を含む。一実施形態では、この態様及びその実施形態のアデノシンデアミナーゼは、以下の改変のうちの1つ以上をさらに含む:Y147T、Y147R、Q154S、Y123H、及びQ154R。一実施形態では、この態様及びその実施形態のアデノシンデアミナーゼは、以下の改変の群のいずれか1つを含む:
E25F+V82S+Y123H;
T133K+Y147R+Q154R;
E25F+V82S+Y123H+Y147R+Q154R;
L51W+V82S+Y123H+C146R+Y147R+Q154R;
Y73S+V82S+Y123H+Y147R+Q154R;
P54C+V82S+Y123H+Y147R+Q154R;
N38G+V82T+Y123H+Y147R+Q154R;
N72K+V82S+Y123H+D139L+Y147R+Q154R;
E25F+V82S+Y123H+D139M+Y147R+Q154R;
Q71M+V82S+Y123H+Y147R+Q154R;
E25F+V82S+Y123H+T133K+Y147R+Q154R;
E25F+V82S+Y123H+Y147R+Q154R;
V82S+Y123H+P124W+Y147R+Q154R;
L51W+V82S+Y123H+C146R+Y147R+Q154R;
P54C+V82S+Y123H+Y147R+Q154R;
Y73S+V82S+Y123H+Y147R+Q154R;
N38G+V82T+Y123H+Y147R+Q154R;
R23H+V82S+Y123H+Y147R+Q154R;
R21N+V82S+Y123H+Y147R+Q154R;
V82S+Y123H+Y147R+Q154R+A158K;
N72K+V82S+Y123H+D139L+Y147R+Q154R;
E25F+V82S+Y123H+D139M+Y147R+Q154R;
M70V+V82S+M94V+Y123H+Y147R+Q154R;
Q71M+V82S+Y123H+Y147R+Q154R;
E25F+I76Y+V82S+Y123H+Y147R+Q154R;
I76Y+V82T+Y123H+Y147R+Q154R;
N38G+I76Y+V82S+Y123H+Y147R+Q154R;
R23H+I76Y+V82S+Y123H+Y147R+Q154R;
P54C+I76Y+V82S+Y123H+Y147R+Q154R;
R21N+I76Y+V82S+Y123H+Y147R+Q154R;
I76Y+V82S+Y123H+D139M+Y147R+Q154R;
Y73S+I76Y+V82S+Y123H+Y147R+Q154R;
E25F+I76Y+V82S+Y123H+Y147R+Q154R;
I76Y+V82T+Y123H+Y147R+Q154R;
N38G+I76Y+V82S+Y123H+Y147R+Q154R;
R23H+I76Y+V82S+Y123H+Y147R+Q154R;
P54C+I76Y+V82S+Y123H+Y147R+Q154R;
R21N+I76Y+V82S+Y123H+Y147R+Q154R;
I76Y+V82S+Y123H+D139M+Y147R+Q154R;
Y73S+I76Y+V82S+Y123H+Y147R+Q154R;
V82S+Q154R;
N72K+V82S+Y123H+Y147R+Q154R;
Q71M+V82S+Y123H+Y147R+Q154R;
V82S+Y123H+T133K+Y147R+Q154R;
V82S+Y123H+T133K+Y147R+Q154R+A158K;
M70V+Q71M+N72K+V82S+Y123H+Y147R+Q154R;
N72K_V82S+Y123H+Y147R+Q154R;
Q71M_V82S+Y123H+Y147R+Q154R;
M70V+V82S+M94V+Y123H+Y147R+Q154R;
V82S+Y123H+T133K+Y147R+Q154R;
V82S+Y123H+T133K+Y147R+Q154R+A158K; または
M70V+Q71M+N72K+V82S+Y123H+Y147R+Q154R。
一実施形態では、アデノシンデアミナーゼバリアントは、表14または18に記載の任意の改変または改変の群を含む。一実施形態では、この態様及びその実施形態のアデノシンデアミナーゼは、149、150、151、152、153、154、155、156、及び157からなる群から選択される残基で始まるC末端の欠失を含む。一実施形態では、この態様及びその実施形態のアデノシンデアミナーゼは、Y147T、Y147R、Q154S、Y123H、V82S、T166R、及びQ154Rからなる群から選択される改変をさらに含む。一実施形態では、この態様及びその実施形態のアデノシンデアミナーゼは、表14、表18、または図3A~3Cに記載されているアデノシンデアミナーゼバリアントである。
別の態様では、融合タンパク質を提供し、融合タンパク質は、ポリヌクレオチドプログラム可能なDNA結合ドメインと、以下の配列番号1の21、23、25、38、51、54、70、71、72、73、94、124、133、139、146、及び158からなる群から選択されるアミノ酸位置での改変、または別のアデノシンデアミナーゼにおける対応する改変を含むアデノシンデアミナーゼバリアントである少なくとも1つの塩基エディタードメインと、を含む:
Figure 2022546608000002
一実施形態では、アデノシンデアミナーゼバリアントは、配列番号1のR21N、R23H、E25F、N38G、L51W、P54C、M70V、Q71M、N72K、Y73S、M94V、P124W、T133K、D139L、D139M、C146R、及びA158Kからなる群から選択される改変、または別のアデノシンデアミナーゼにおける対応する改変を含む。
別の態様では、融合タンパク質を提供し、融合タンパク質は、ポリヌクレオチドプログラム可能なDNA結合ドメインと、配列番号1のR21N、R23H、E25F、N38G、L51W、P54C、M70V、Q71M、N72K、Y73S、M94V、P124W、T133K、D139L、D139M、C146R、及びA158Kからなる群から選択される改変、または別のアデノシンデアミナーゼにおける対応する改変を含むアデノシンデアミナーゼバリアントである少なくとも1つの塩基エディタードメインと、を含む。
上記の態様及びその実施形態のいずれかの融合タンパク質のいずれかの実施形態において、アデノシンデアミナーゼバリアントは、配列番号1のV82T改変、または別のアデノシンデアミナーゼにおける対応する改変をさらに含む。
別の態様では、融合タンパク質を提供し、融合タンパク質は、ポリヌクレオチドプログラム可能なDNA結合ドメインと、改変V82T及び配列番号1のR21N、R23H、E25F、N38G、L51W、P54C、M70V、Q71M、N72K、Y73S、M94V、P124W、T133K、D139L、D139M、C146R、及びA158Kからなる群から選択される1つ以上の改変、または別のアデノシンデアミナーゼにおける対応する改変を含むアデノシンデアミナーゼバリアントである少なくとも1つの塩基エディタードメインと、を含む。
上記の態様及びその実施形態のいずれかの融合タンパク質の実施形態において、アデノシンデアミナーゼバリアントは、配列番号1の21、23、25、38、51、54、70、71、72、73、94、124、133、139、146、及び158からなる群から選択される2つ以上のアミノ酸位置での改変、または別のアデノシンデアミナーゼにおける対応する改変を含む。一実施形態では、アデノシンデアミナーゼバリアントは、2つ以上の改変を含む。一実施形態では、アデノシンデアミナーゼバリアントは、3つ以上の改変を含む。一実施形態では、アデノシンデアミナーゼバリアントは、以下の改変のうちの1つ以上をさらに含む:Y147T、Y147R、Q154S、Y123H、及びQ154R。一実施形態では、アデノシンデアミナーゼバリアントは、149、150、151、152、153、154、155、156、及び157からなる群から選択される残基で始まるC末端の欠失を含む。
上記の融合タンパク質及びその実施形態の実施形態において、塩基エディタードメインは、アデノシンデアミナーゼバリアント単量体を含み、アデノシンデアミナーゼ単量体は、配列番号1のR21N、R23H、E25F、N38G、L51W、P54C、M70V、Q71M、N72K、Y73S、V82T、M94V、P124W、T133K、D139L、D139M、C146R、及びA158Kからなる群から選択される1つ以上の改変を含む。一実施形態では、塩基エディタードメインは、野生型アデノシンデアミナーゼドメインとアデノシンデアミナーゼバリアントを含むアデノシンデアミナーゼヘテロ二量体を含む。一実施形態では、アデノシンデアミナーゼバリアントは、Y147T、Y147R、Q154S、Y123H、V82S、T166R、及びQ154Rからなる群から選択される改変をさらに含む。一実施形態では、塩基エディタードメインは、TadA*7.10ドメイン及びアデノシンデアミナーゼバリアントドメインを含むアデノシンデアミナーゼヘテロ二量体を含む。一実施形態では、アデノシンデアミナーゼバリアントは、2つ以上の改変を含む。
上記の態様及びその実施形態のいずれかの融合タンパク質の別の実施形態では、アデノシンデアミナーゼバリアントは、表14、表18、または図3A~3Cに記載のABE9(TadA*9デアミナーゼバリアント)である。
上記の態様及びその実施形態のいずれかの融合タンパク質の別の実施形態では、アデノシンデアミナーゼバリアントは、全長ABE9と比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のC末端アミノ酸残基が欠失した短縮型ABE8またはABE9である。
上記の態様及びその実施形態のいずれかの融合タンパク質の別の実施形態では、ポリヌクレオチドプログラム可能なDNA結合ドメインは、Cas9、Cas12a/Cpf1、Cas12b/C2c1、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i、またはCas12j/CasΦドメインである。
別の態様では、融合タンパク質を提供し、融合タンパク質は、以下の配列を含むポリヌクレオチドプログラム可能なDNA結合ドメインを含む:
Figure 2022546608000003
該配列中、太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線が引かれた配列はバイパータイト(二部分)核局在化配列を示し、少なくとも1つの塩基エディタードメインは、配列番号1の21、23、25、38、51、54、70、71、72、73、94、124、133、138、139、146、及び158からなる群から選択されるアミノ酸位置に改変を含むアデノシンデアミナーゼバリアントを含む。一実施形態では、アデノシンデアミナーゼバリアントは、配列番号1のR21N、R23H、E25F、N38G、L51W、P54C、M70V、Q71M、N72K、Y73S、M94V、P124W、T133K、D138M、D139L、D139M、C146R、及びA158Kからなる群から選択される改変を含む。別の実施形態では、アデノシンデアミナーゼバリアントは、配列番号1の改変V82Tを含む。一実施形態では、アデノシンデアミナーゼバリアントは、2つ以上の前記改変を含む。一実施形態では、アデノシンデアミナーゼバリアントは、3つ以上の前記改変を含む。一実施形態では、アデノシンデアミナーゼバリアントは、Y147T、Y147R、Q154S、Y123H、V82S、T166R、及びQ154Rからなる群から選択される改変をさらに含む。一実施形態では、アデノシンデアミナーゼバリアントは、以下の改変のうちの2つ以上を含む:Y147T、Y147R、Q154S、Y123H、及びQ154R。
上記の融合タンパク質及びその実施形態のいずれかの実施形態では、アデノシンデアミナーゼバリアントは、以下の改変の群のいずれか1つを含む:
E25F+V82S+Y123H;
T133K+Y147R+Q154R;
E25F+V82S+Y123H+Y147R+Q154R;
L51W+V82S+Y123H+C146R+Y147R+Q154R;
Y73S+V82S+Y123H+Y147R+Q154R;
P54C+V82S+Y123H+Y147R+Q154R;
N38G+V82T+Y123H+Y147R+Q154R;
N72K+V82S+Y123H+D139L+Y147R+Q154R;
E25F+V82S+Y123H+D139M+Y147R+Q154R;
Q71M+V82S+Y123H+Y147R+Q154R;
E25F+V82S+Y123H+T133K+Y147R+Q154R;
E25F+V82S+Y123H+Y147R+Q154R;
V82S+Y123H+P124W+Y147R+Q154R;
L51W+V82S+Y123H+C146R+Y147R+Q154R;
P54C+V82S+Y123H+Y147R+Q154R;
Y73S+V82S+Y123H+Y147R+Q154R;
N38G+V82T+Y123H+Y147R+Q154R;
R23H+V82S+Y123H+Y147R+Q154R;
R21N+V82S+Y123H+Y147R+Q154R;
V82S+Y123H+Y147R+Q154R+A158K;
N72K+V82S+Y123H+D139L+Y147R+Q154R;
E25F+V82S+Y123H+D139M+Y147R+Q154R;
M70V+V82S+M94V+Y123H+Y147R+Q154R;
Q71M+V82S+Y123H+Y147R+Q154R;
E25F+I76Y+V82S+Y123H+Y147R+Q154R;
I76Y+V82T+Y123H+Y147R+Q154R;
N38G+I76Y+V82S+Y123H+Y147R+Q154R;
R23H+I76Y+V82S+Y123H+Y147R+Q154R;
P54C+I76Y+V82S+Y123H+Y147R+Q154R;
R21N+I76Y+V82S+Y123H+Y147R+Q154R;
I76Y+V82S+Y123H+D139M+Y147R+Q154R;
Y73S+I76Y+V82S+Y123H+Y147R+Q154R;
E25F+I76Y+V82S+Y123H+Y147R+Q154R;
I76Y+V82T+Y123H+Y147R+Q154R;
N38G+I76Y+V82S+Y123H+Y147R+Q154R;
R23H+I76Y+V82S+Y123H+Y147R+Q154R;
P54C+I76Y+V82S+Y123H+Y147R+Q154R;
R21N+I76Y+V82S+Y123H+Y147R+Q154R;
I76Y+V82S+Y123H+D139M+Y147R+Q154R;
Y73S+I76Y+V82S+Y123H+Y147R+Q154R;
V82S+Q154R;
N72K+V82S+Y123H+Y147R+Q154R;
Q71M+V82S+Y123H+Y147R+Q154R;
V82S+Y123H+T133K+Y147R+Q154R;
V82S+Y123H+T133K+Y147R+Q154R+A158K;
M70V+Q71M+N72K+V82S+Y123H+Y147R+Q154R;
N72K+V82S+Y123H+Y147R+Q154R;
Q71M+V82S+Y123H+Y147R+Q154R;
M70V+V82S+M94V+Y123H+Y147R+Q154R;
V82S+Y123H+T133K+Y147R+Q154R;
V82S+Y123H+T133K+Y147R+Q154R+A158K;
M70V+Q71M+N72K+V82S+Y123H+Y147R+Q154R
一実施形態では、アデノシンデアミナーゼバリアントは、表14もしくは18、または図3A~3Cに記載の他の任意の改変または改変の群を含む。
上記の態様及びその実施形態のいずれかの融合タンパク質の実施形態では、ポリヌクレオチドプログラム可能なDNA結合ドメインは、Staphylococcus aureus Cas9 (SaCas9)、Streptococcus thermophilus 1 Cas9 (St1Cas9)、Streptococcus pyogenes Cas9 (SpCas9)またはそのバリアントである。
上記の態様及びその実施形態のいずれかの融合タンパク質の実施形態では、ポリヌクレオチドプログラム可能なDNA結合ドメインは、改変されたプロトスペーサー隣接モチーフ(PAM)特異性を有する改変SaCas9を含む。一実施形態では、改変SaCas9は、アミノ酸置換E782K、N968K、及びR1015H、またはそれらに対応するアミノ酸置換を含む。
上記の態様及びその実施形態のいずれかの融合タンパク質の実施形態では、ポリヌクレオチドプログラム可能なDNA結合ドメインは、改変されたプロトスペーサー隣接モチーフ(PAM)特異性を有するSpCas9のバリアントを含む。一実施形態では、改変されたPAMは、核酸配列5’-NGA-3’、5’-NGC-3’、5’-NGG-3’、5’-NGT-3’、または5’’-NGN-3’に対して特異性を有する。一実施形態では、バリアントSpCas9は、以下:D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、及びT1337Rから選択されるアミノ酸置換、もしくはそれらに対応するアミノ酸置換; I322V、S409I、E427G、R654L、R753G(MQKFRAER)もしくはそれらに対応するアミノ酸置換; I322V、S409I、E427G、R654L、R753G、R1114G、もしくはそれらに対応するアミノ酸置換;または図3A~3Cに記載のアミノ酸置換を含む。
上記の態様及びその実施形態のいずれかの融合タンパク質の実施形態では、ポリヌクレオチドプログラム可能なDNA結合ドメインは、ヌクレアーゼ不活性またはニッカーゼバリアントである。一実施形態では、ニッカーゼバリアントは、アミノ酸置換D10Aまたはそれに対応するアミノ酸置換を含む。
上記の態様及びその実施形態のいずれかの融合タンパク質の実施形態では、アデノシンデアミナーゼドメインは、デオキシリボ核酸(DNA)中のアデニンを脱アミノ化することができる。
上記の態様及びその実施形態のいずれかの融合タンパク質の実施形態では、アデノシンデアミナーゼは、自然界には存在しない改変アデノシンデアミナーゼである。
上記の態様及びその実施形態のアデノシンデアミナーゼの実施形態では、アデノシンデアミナーゼは、TadAデアミナーゼである。上記の態様及びその実施形態のいずれかの融合タンパク質の実施形態では、アデノシンデアミナーゼは、TadAデアミナーゼである。一実施形態では、TadAデアミナーゼは、TadA*7.10バリアントである。
上記の態様及びその実施形態のいずれかの融合タンパク質の実施形態では、融合タンパク質は、ポリヌクレオチドプログラム可能なDNA結合ドメインとアデノシンデアミナーゼドメインとの間にリンカーを含む。一実施形態では、リンカーは、アミノ酸配列:SGGSSGGSSGSETPGTSESATPESを含む。
上記の態様及びその実施形態のいずれかの融合タンパク質の実施形態では、融合タンパク質は、1つ以上の核局在化シグナルを含む。一実施形態では、核局在化シグナルは、バイパータイト核局在化シグナルである。
上記の態様及びその実施形態のいずれかの融合タンパク質の実施形態では、Cas9は、StCas9である。
上記の態様及びその実施形態のいずれかの融合タンパク質の実施形態では、Cas9は、SaCas9またはSpCas9である。
上記の態様及びその実施形態のいずれかの融合タンパク質の実施形態では、Cas9は、改変SaCas9または改変SpCas9である。一実施形態では、改変SaCas9は、アミノ酸置換E782K、N968K、及びR1015H、またはそれらに対応するアミノ酸置換を含む。一実施形態では、改変SaCas9は、以下のアミノ酸配列を含む:
KRNYILGLAIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRKLINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYKNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPHIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG。
別の態様では、上記の態様及びその実施形態のいずれか1つの融合タンパク質をコードするポリヌクレオチドを提供する。
別の態様では、細胞を提供し、その細胞は、上記の態様及びその実施形態のいずれか1つの融合タンパク質をコードするポリヌクレオチドと、塩基エディターを標的指向化して、遺伝性疾患に関連するSNPのA・TからG・Cへの変化をもたらす、1つ以上のガイドポリヌクレオチドとを、細胞、またはその前駆細胞に導入することによって産生される。一実施形態では、細胞はヒト細胞である。一実施形態では、細胞はin vitroまたはin vivoである。一実施形態では、遺伝性疾患は、α-1アンチトリプシン欠乏症(A1AD)である。一実施形態では、融合タンパク質及び1つ以上のガイドポリヌクレオチドは、細胞内で複合体を形成する。
別の態様では、上記の態様及びその実施形態の細胞から増殖または拡張させた単離された細胞または細胞の集団を提供する。
一態様では、遺伝性疾患の治療を必要とする対象における遺伝性疾患の治療方法を提供し、方法は、上記の態様及びその実施形態のいずれか1つの細胞、単離細胞、または細胞集団を対象に投与することを含む。方法の一実施形態では、細胞、単離された細胞、または細胞の集団は、対象に対して自家、同種異系、または異種である。
一態様では、塩基エディターシステムを提供し、塩基エディターシステムは、ポリヌクレオチドプログラム可能なDNA結合ドメインと、以下の配列番号1の21、23、25、38、51、54、70、71、72、73、82、94、124、133、139、146、及び158からなる群から選択されるアミノ酸位置での改変、別のアデノシンデアミナーゼにおける対応する改変を含むアデノシンデアミナーゼバリアントである少なくとも1つの塩基エディタードメインと、を含む:
Figure 2022546608000004
塩基エディターシステムの実施形態において、アデノシンデアミナーゼバリアントは、配列番号1のR21N、R23H、E25F、N38G、L51W、P54C、M70V、Q71M、N72K、Y73S、V82T、M94V、P124W、T133K、D139L、D139M、C146R、及びA158Kからなる群から選択される改変、または別のアデノシンデアミナーゼにおける対応する改変を含む。一実施形態では、塩基エディターシステムは、塩基エディタードメインを標的指向化して、遺伝性疾患に関連するSNPのA・TからG・Cへの変化をもたらす、1つ以上のガイドポリヌクレオチドをさらに含む。塩基エディターシステムの一実施形態では、アデノシンデアミナーゼバリアントは、デオキシリボ核酸(DNA)中のアデニンを脱アミノ化することができる。塩基エディターシステムの一実施形態では、ガイドポリヌクレオチドは、リボ核酸(RNA)、またはデオキシリボ核酸(DNA)を含む。塩基エディターシステムの一実施形態では、ガイドポリヌクレオチドは、CRISPR RNA(crRNA)配列、トランス活性化CRISPR RNA(tracrRNA)配列、またはそれらの組み合わせを含む。一実施形態では、塩基エディターシステムは、第2のガイドポリヌクレオチドをさらに含む。一実施形態では、第2のガイドポリヌクレオチドは、リボ核酸(RNA)、またはデオキシリボ核酸(DNA)を含む。一実施形態では、第2のガイドポリヌクレオチドは、CRISPR RNA(crRNA)配列、トランス活性化CRISPR RNA(tracrRNA)配列、またはそれらの組み合わせを含む。上記の塩基エディターシステム及びその実施形態の実施形態では、ポリヌクレオチドプログラム可能なDNA結合ドメインは、Cas9、Cas12a/Cpf1、Cas12b/C2c1、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i、またはCas12j/CasΦドメインを含む。一実施形態では、ポリヌクレオチドプログラム可能なDNA結合ドメインは、ヌクレアーゼ不活性である。一実施形態では、ポリヌクレオチドプログラム可能なDNA結合ドメインはニッカーゼである。一実施形態では、ポリヌクレオチドプログラム可能なDNA結合ドメインは、Cas9ドメインを含む。一実施形態では、Cas9ドメインは、ヌクレアーゼ不活性(dead)Cas9(dCas9)、Cas9ニッカーゼ(nCas9)、またはヌクレアーゼ活性Cas9を含む。一実施形態では、Cas9ドメインは、Cas9ニッカーゼを含む。一実施形態では、ポリヌクレオチドプログラム可能なDNA結合ドメインは、改変された、または修飾されたポリヌクレオチドプログラム可能なDNA結合ドメインである。上記の塩基エディターシステム及びその実施形態の実施形態では、遺伝性疾患は、α-1アンチトリプシン欠乏症(A1AD)である。
別の態様では、ポリヌクレオチド中の一塩基多型(SNP)の修正方法を提供し、方法は、標的ヌクレオチド配列(その少なくとも一部がポリヌクレオチドまたはその逆相補体に位置する)を、上記の態様及びその実施形態のいずれか1つの融合タンパク質、または上記の態様及びその実施形態のいずれか1つの塩基エディターシステムと接触させること; 塩基エディターを標的ヌクレオチド配列に標的指向化する際に、SNPまたはその相補核酸塩基を脱アミノ化することによってSNPを編集することを含み、SNPまたはその相補核酸塩基を脱アミノ化することにより、SNPが修正される。一実施形態では、SNPは、α-1アンチトリプシン欠乏症(A1AD)に関連している。一実施形態では、SNPは、SERPINA1遺伝子にあり、修正は、E342K(PiZアリール)の改変を含む。
一態様では、ポリヌクレオチドの編集方法を提供し、方法は、標的ヌクレオチド配列を、上記の態様及びその実施形態のいずれか1つの融合タンパク質、または上記の態様及びその実施形態のいずれか1つの塩基エディターシステムと接触させ、それによりポリヌクレオチドを編集することを含む。方法の一実施形態では、編集は、20%未満のインデル(indel)形成、15%未満のインデル形成、10%未満のインデル形成; 5%未満のインデル形成; 4%未満のインデル形成; 3%未満のインデル形成; 2%未満のインデル形成; 1%未満のインデル形成; 0.5%未満のインデル形成;または0.1%未満のインデル形成をもたらす。方法の一実施形態では、編集は、転座をもたらさない。
別の態様では、以下から選択される、TadA*7.10アデノシンデアミナーゼバリアントドメインを含むABE9(TadA*9デアミナーゼバリアント)及びCas9エンドヌクレアーゼドメイン:
配列番号1の変異I76Y+V82T+Y147T+Q154S+A109Sを有するmonoTadA*7.10、及び変異I322V、S409I、E427G、R654L、R753Gを有するspCas9(MQKFRAER);
配列番号1の変異I76Y+V82T+Y147T+Q154S+T111Rを有するmonoTadA*7.10、及び変異I322V、S409I、E427G、R654L、R753Gを有するspCas9(MQKFRAER);
配列番号1の変異I76Y+V82T+Y147T+Q154S+D119Nを有するmonoTadA*7.10、及び変異I322V、S409I、E427G、R654L、R753Gを有するspCas9(MQKFRAER);
配列番号1の変異I76Y+V82T+Y147T+Q154S+H122Nを有するmonoTadA*7.10、及び変異I322V、S409I、E427G、R654L、R753Gを有するspCas9(MQKFRAER);
配列番号1の変異I76Y+V82T+Y147d+Q154Sを有するmonoTadA*7.10、及び変異I322V、S409I、E427G、R654L、R753Gを有するspCas9(MQKFRAER);
配列番号1の変異I76Y+V82T+Y147T+Q154S+F149Yを有するmonoTadA*7.10、及び変異I322V、S409I、E427G、R654L、R753Gを有するspCas9(MQKFRAER);
配列番号1の変異I76Y+V82T+Y147T+Q154S+T166Iを有するmonoTadA*7.10、及び変異I322V、S409I、E427G、R654L、R753Gを有するspCas9(MQKFRAER);ならびに
配列番号1の変異I76Y+V82T+Y147T+Q154S+D167Nを有するmonoTadA*7.10、及び変異I322V、S409I、E427G、R654L、R753Gを有するspCas9(MQKFRAER)。
配列番号1の変異I76Y+V82T+Y147T+Q154S+L36H+N157Kを有するmonoTadA*7.10、及び変異I322V、S409I、E427G、R654L、R753G、R1114Gを有するspCas9(MQKFRAER);
配列番号1の変異I76Y+V82T+Y147D+Q154S+F149Y+D167N+L36H+N157Kを有するmonoTadA*7.10、及び変異I322V、S409I、E427G、R654L、R753G、R1114Gを有するSpCas9(MQKFRAER);
配列番号1の変異I76Y+V82T+Y147D+Q154S+F149Y+D167N+L36H+N157K+V106Wを有するmonoTadA*7.10、及び変異I322V、S409I、E427G、R654L、R753G、R1114Gを有するSpCas9(MQKFRAER);
配列番号1の変異A109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167Nを有するmonoTadA*7.10、及び変異I322V、S409I、E427G、R654L、R753G、R1114Gを有するSpCas9、MQKFRAER;ならびに
配列番号1の変異A109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167N+V106Wを有するmonoTadA*7.10、及び変異I322V、S409I、E427G、R654L、R753G、R1114Gを有するSpCas9(MQKFRAER);ならびに、アデノシンデアミナーゼバリアントドメインを標的指向化して、遺伝性疾患に関連するSNPのA・TからG・Cへの変化をもたらす、1つ以上のガイドポリヌクレオチド
を含む、塩基エディターを提供する。塩基エディターの一実施形態では、SNPは、α-1アンチトリプシン欠乏症(A1AD)に関連するものである。
別の態様では、以下から選択されるTadAアデノシンデアミナーゼドメイン及びSpCas9エンドヌクレアーゼドメインを含むABE9塩基エディターをコードする1つ以上のポリヌクレオチドを含むベクターを提供する。
変異I76Y+V82T+Y147T+Q154S+A109Sを有するmonoTadA*7.10及び変異I322V、S409I、E427G、R654L、R753Gを有するspCas9(MQKFRAER);
変異I76Y+V82T+Y147T+Q154S+T111Rを有するmonoTadA*7.10及び変異I322V、S409I、E427G、R654L、R753Gを有するspCas9(MQKFRAER);
変異I76Y+V82T+Y147T+Q154S+D119Nを有するmonoTadA*7.10及び変異I322V、S409I、E427G、R654L、R753Gを有するspCas9(MQKFRAER);
変異I76Y+V82T+Y147T+Q154S+H122Nを有するmonoTadA*7.10及び変異I322V、S409I、E427G、R654L、R753Gを有するspCas9(MQKFRAER);
変異I76Y+V82T+Y147d+Q154Sを有するmonoTadA*7.10及び変異I322V、S409I、E427G、R654L、R753Gを有するspCas9(MQKFRAER);
変異I76Y+V82T+Y147T+Q154S+F149Yを有するmonoTadA*7.10及び変異I322V、S409I、E427G、R654L、R753Gを有するspCas9(MQKFRAER);
変異I76Y+V82T+Y147T+Q154S+T166Iを有するmonoTadA*7.10及び変異I322V、S409I、E427G、R654L、R753Gを有するspCas9(MQKFRAER);ならびに
変異I76Y+V82T+Y147T+Q154S+D167Nを有するmonoTadA*7.10及び変異I322V、S409I、E427G、R654L、R753Gを有するspCas9(MQKFRAER)。
変異I76Y+V82T+Y147T+Q154S+L36H+N157Kを有するmonoTadA*7.10、変異I322V、S409I、E427G、R654L、R753G、R1114Gを有するspCas9(MQKFRAER);
変異I76Y+V82T+Y147D+Q154S+F149Y+D167N+L36H+N157Kを有するmonoTadA*7.10及び変異I322V、S409I、E427G、R654L、R753G、R1114Gを有するSpCas9(MQKFRAER);
変異I76Y+V82T+Y147D+Q154S+F149Y+D167N+L36H+N157K+V106Wを有するmonoTadA*7.10及び変異I322V、S409I、E427G、R654L、R753G、R1114Gを有するSpCas9(MQKFRAER);
変異A109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167Nを有するmonoTadA*7.10及び変異I322V、S409I、E427G、R654L、R753G、R1114Gを有するSpCas9(MQKFRAER);ならびに
変異A109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167N+V106Wを有するmonoTadA*7.10、変異I322V、S409I、E427G、R654L、R753G、R1114Gを有するSpCas9(MQKFRAER)。一実施形態では、ベクターは、プラスミド、ウイルス、またはmRNAベクターである。
別の態様では、上記の態様及びその実施形態のいずれか1つの融合タンパク質、または上記の態様及びその実施形態のいずれか1つの塩基エディターシステムを含む組成物を提供する。一実施形態では、組成物は、薬学的に許容される賦形剤、希釈剤、または担体をさらに含む。
別の態様では、ガイドRNAに結合した上記の態様及びその実施形態のいずれか1つの融合タンパク質を含む組成物を提供し、ガイドRNAは、α-1アンチトリプシン欠乏症(A1AD)に関連するSERPINA1遺伝子に相補的な核酸配列を含む。
別の態様では、ガイドRNAに結合した上記の態様及びその実施形態のいずれか1つの塩基エディターシステムを含む組成物を提供し、ガイドRNAは、α-1アンチトリプシン欠乏症(A1AD)に関連するSERPINA1遺伝子に相補的な核酸配列を含む。
上記の態様及びその実施形態のいずれか1つの組成物の実施形態では、アデノシンデアミナーゼバリアントは、デオキシリボ核酸(DNA)中のアデニンを脱アミノ化することができる。
上記の態様及びその実施形態のいずれか1つの組成物の実施形態では、融合タンパク質または塩基エディターシステムは、
(i)Cas9ニッカーゼを含み;
(ii)ヌクレアーゼ不活性Cas9を含み;
(iii)図3A~3Cに示すアミノ酸置換の組み合わせを含むSpCas9バリアントを含み; または(iv)I322V、S409I、E427G、R654L、R753G(MQKFRAER); またはI322V、S409I、E427G、R654L、R753G、R1114G(MQKFRAER)から選択されるアミノ酸配列置換の組み合わせを含むSpCas9バリアントを含む。
上記の態様及びその実施形態のいずれか1つの組成物の実施形態では、組成物は、薬学的に許容される賦形剤、希釈剤、または担体をさらに含む、すなわち医薬組成物である。
一態様では、薬学的に許容される賦形剤、希釈剤、または担体をさらに含む組成物を含む、疾患または障害の治療のための医薬組成物を提供する。医薬組成物の一実施形態では、疾患または障害は、α-1アンチトリプシン欠乏症(A1AD)である。医薬組成物の一実施形態では、融合タンパク質または塩基エディターシステムはガイドRNAに結合され、ガイドRNAは、α-1アンチトリプシン欠乏症(A1AD)に関連するSERPINA1遺伝子に相補的な核酸配列を含む。医薬組成物の一実施形態では、gRNA及び塩基エディターを、一緒にまたは別々に製剤化する。上記の医薬組成物及びその実施形態の実施形態では、gRNAは、5’から3’に、
5’-ACCAUCGACAAGAAAGGGACUGA GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU-3’;
5’-CCAUCGACAAGAAAGGGACUGA GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU-3’;
5’-CAUCGACAAGAAAGGGACUGA GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU-3’;
5’-AUCGACAAGAAAGGGACUGA GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU-3’;
5’-UCGACAAGAAAGGGACUGA GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU-3’;または
5’-CGACAAGAAAGGGACUGA GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU-3’の1つ以上から選択される核酸配列、またはその1、2、3、4、もしくは5ヌクレオチドの5’短縮型断片を含む。上記の医薬組成物及びその実施形態の実施形態では、医薬組成物は、哺乳類細胞における発現に適したベクターをさらに含み、ベクターは、塩基エディターをコードするポリヌクレオチドを含む。医薬組成物の一実施形態では、塩基エディターをコードするポリヌクレオチドはmRNAである。医薬組成物の一実施形態では、ベクターはウイルスベクターである。医薬組成物の一実施形態では、ウイルスベクターは、レトロウイルスベクター、アデノウイルスベクター、レンチウイルスベクター、ヘルペスウイルスベクター、またはアデノ随伴ウイルスベクター(AAV)である。上記の態様及びその実施形態のいずれか1つの医薬組成物の実施形態では、医薬組成物は、哺乳類細胞における発現に適したリボヌクレオ粒子をさらに含む。上記の態様及びその実施形態のいずれか1つの医薬組成物の実施形態において、医薬組成物は、脂質をさらに含む。
別の態様では、α-1アンチトリプシン欠乏症(A1AD)の治療方法を提供し、方法は、それを必要とする対象に、上記の態様及びその実施形態のいずれか1つの医薬組成物を投与することを含む。
別の態様では、対象におけるα-1アンチトリプシン欠乏症(A1AD)の治療における上記の態様及びその実施形態のいずれか1つの医薬組成物の使用を提供する。
上記の方法または使用の実施形態では、対象はヒトである。
上記の態様及びその実施形態のいずれか1つの融合タンパク質または塩基エディターシステムの実施形態では、アデノシンデアミナーゼバリアントは、以下の改変の群のいずれか1つを含む:
E25F+V82S+Y123H;
T133K+Y147R+Q154R;
E25F+V82S+Y123H+Y147R+Q154R;
L51W+V82S+Y123H+C146R+Y147R+Q154R;
Y73S+V82S+Y123H+Y147R+Q154R;
P54C+V82S+Y123H+Y147R+Q154R;
N38G+V82T+Y123H+Y147R+Q154R;
N72K+V82S+Y123H+D139L+Y147R+Q154R;
E25F+V82S+Y123H+D139M+Y147R+Q154R;
Q71M+V82S+Y123H+Y147R+Q154R;
E25F+V82S+Y123H+T133K+Y147R+Q154R;
E25F+V82S+Y123H+Y147R+Q154R;
V82S+Y123H+P124W+Y147R+Q154R;
L51W+V82S+Y123H+C146R+Y147R+Q154R;
P54C+V82S+Y123H+Y147R+Q154R;
Y73S+V82S+Y123H+Y147R+Q154R;
N38G+V82T+Y123H+Y147R+Q154R;
R23H+V82S+Y123H+Y147R+Q154R;
R21N+V82S+Y123H+Y147R+Q154R;
V82S+Y123H+Y147R+Q154R+A158K;
N72K+V82S+Y123H+D139L+Y147R+Q154R;
E25F+V82S+Y123H+D139M+Y147R+Q154R;
M70V+V82S+M94V+Y123H+Y147R+Q154R;
Q71M+V82S+Y123H+Y147R+Q154R;
E25F+I76Y+V82S+Y123H+Y147R+Q154R;
I76Y+V82T+Y123H+Y147R+Q154R;
N38G+I76Y+V82S+Y123H+Y147R+Q154R;
R23H+I76Y+V82S+Y123H+Y147R+Q154R;
P54C+I76Y+V82S+Y123H+Y147R+Q154R;
R21N+I76Y+V82S+Y123H+Y147R+Q154R;
I76Y+V82S+Y123H+D139M+Y147R+Q154R;
Y73S+I76Y+V82S+Y123H+Y147R+Q154R;
E25F+I76Y+V82S+Y123H+Y147R+Q154R;
I76Y+V82T+Y123H+Y147R+Q154R;
N38G+I76Y+V82S+Y123H+Y147R+Q154R;
R23H+I76Y+V82S+Y123H+Y147R+Q154R;
P54C+I76Y+V82S+Y123H+Y147R+Q154R;
R21N+I76Y+V82S+Y123H+Y147R+Q154R;
I76Y+V82S+Y123H+D139M+Y147R+Q154R;
Y73S+I76Y+V82S+Y123H+Y147R+Q154R;
V82S+Q154R;
N72K+V82S+Y123H+Y147R+Q154R;
Q71M+V82S+Y123H+Y147R+Q154R;
V82S+Y123H+T133K+Y147R+Q154R;
V82S+Y123H+T133K+Y147R+Q154R+A158K;
M70V+Q71M+N72K+V82S+Y123H+Y147R+Q154R;
N72K+V82S+Y123H+Y147R+Q154R;
Q71M+V82S+Y123H+Y147R+Q154R;
M70V+V82S+M94V+Y123H+Y147R+Q154R;
V82S+Y123H+T133K+Y147R+Q154R;
V82S+Y123H+T133K+Y147R+Q154R+A158K;
M70V+Q71M+N72K+V82S+Y123H+Y147R+Q154R。
一実施形態では、アデノシンデアミナーゼバリアント、例えば、TadA*9デアミナーゼバリアントは、表14または18に記載の任意の改変または改変の群を含む。
上記の態様及びその実施形態のアデノシンデアミナーゼに関連して当業者によって理解されるように、配列番号1に記載のアミノ酸改変に対応する、他のアデノシンデアミナーゼにおけるアミノ酸改変は、通常の配列アラインメントを実行し、配列番号1のアミノ酸配列と、上記のようにTadAデアミナーゼなどの他のアデノシンデアミナーゼ(複数可)の配列またはその関連するタンパク質部分との関連性及び/または同一性を評価することによって容易に決定され得る。一実施形態では、別のアデノシンデアミナーゼのアミノ酸配列は、配列番号1に対して少なくとも85%の配列同一性を有する。一実施形態では、別のアデノシンデアミナーゼのアミノ酸配列は、配列番号1に対して少なくとも90%の配列同一性を有する。一実施形態では、別のアデノシンデアミナーゼのアミノ酸配列は、配列番号1に対して少なくとも95%の配列同一性を有する。一実施形態では、別のアデノシンデアミナーゼのアミノ酸配列は、配列番号1に対して少なくとも98%の配列同一性を有する。一実施形態では、別のアデノシンデアミナーゼのアミノ酸配列は、配列番号1に対して少なくとも99%の配列同一性を有する。
別の態様では、アデノシンデアミナーゼ、または以下のアミノ酸改変もしくは改変の群のいずれか1つを含むTadA*7.10バリアントであるアデノシンデアミナーゼバリアントを含む、上記のアデノシンデアミナーゼ、融合タンパク質、塩基エディター、または塩基エディターシステム及びそれらの実施形態を提供する: V82T; I76Y+V82T;またはI76Y+V82T+Y147T+Q154S。
別の態様では、以下のアミノ酸改変または改変の群のいずれか1つを含むTadA*7.10バリアントであるアデノシンデアミナーゼバリアントを提供する: V82T; I76Y+V82T;またはI76Y+V82T+Y147T+Q154S。
別の態様では、融合タンパク質を提供し、融合タンパク質は、ポリヌクレオチドプログラム可能なDNA結合ドメインと、以下のアミノ酸改変または改変の群のいずれか1つを含むTadA*7.10アデノシンデアミナーゼバリアントである少なくとも1つの塩基エディタードメインを含む: V82T; I76Y+V82T;またはI76Y+V82T+Y147T+Q154S。融合タンパク質の一実施形態では、ポリヌクレオチドプログラム可能なDNA結合ドメインは、Cas9エンドヌクレアーゼドメインを含む。融合タンパク質の一実施形態では、Cas9エンドヌクレアーゼドメインは、変異I322V、S409I、E427G、R654L、R753Gを有するspCas9(MQKFRAER)を含む。
上記のアデノシンデアミナーゼバリアント及びその実施形態、または上記の融合タンパク質及びその実施形態の実施形態では、TadA7*10は単量体である。
別の態様では、核酸塩基エディターを提供し、核酸塩基エディターは、以下から選択されるTadA*7.10アデノシンデアミナーゼバリアントドメイン及びCas9エンドヌクレアーゼドメインを含む:
変異V82Tを有するmonoTadA*7.10及び変異I322V、S409I、E427G、R654L、R753Gを有するspCas9(MQKFRAER);
変異I76Y+V82Tを有するmonoTadA*7.10及び変異I322V、S409I、E427G、R654L、R753Gを有するspCas9(MQKFRAER); または
変異I76Y+V82T+Y147T+Q154Sを有するmonoTadA*7.10及び変異I322V、S409I、E427G、R654L、R753Gを有するspCas9(MQKFRAER)。
定義
以下の定義は、当技術分野の定義を補足するものであり、本出願を対象としており、例えば共通所有に係る特許または出願のような関連するまたは関連しないケースに帰属するものではない。本明細書に記載の方法及び材料と同様または均等な方法及び材料を、本開示の実施または試験において使用することができるものの、好ましい材料及び方法を本明細書に記載する。したがって、本明細書中で使用する用語は、特定の実施形態を説明することのみを目的とし、限定することを意図していない。
別途定義されない限り、本明細書中で使用するすべての技術用語及び科学用語は、本発明が属する技術分野の当業者によって一般に理解されている意味を有する。以下の参考文献は、本発明において使用する多くの用語の一般的な定義を含む技術の1つを提供する:Singleton et al., Dictionary of Microbiology and Molecular Biology (2nd ed.1994); The Cambridge Dictionary of Science and Technology (Walker ed., 1988); The Glossary of Genetics, 5th Ed., R. Rieger et al. (eds.), Springer Verlag (1991); 及びHale & Marham, The Harper Collins Dictionary of Biology (1991)。本明細書中で使用する場合、以下の用語は、特に明記しない限り、以下でそれらに帰する意味を有する。
本出願において、単数形の使用は、別途明確に記述されない限り、複数形を含む。本明細書中で使用する場合、単数形「a」、「an」、及び「the」は、文脈上、別途明確に指示されない限り、複数形の指示対象を含むことに留意しなければならない。本出願において、「または」の使用は、別途記載のない限り、「及び/または」を意味する。さらに、用語「含むこと(including)」、ならびに「含む(include)」、「含む(includes)」、及び「含まれる(included)」などの他の形態の使用は、限定的でない。
本明細書及びクレーム(複数可)において使用する場合、単語「含む(comprising)」(及び「含む(comprise)」及び「含む(comprises)」などの任意の形式の含む(comprising))、「有する(having)」(及び「有する(have)」及び「有する(has)」などの任意の形式の有する(having))、「含む(including)」(及び「含む(includes)」及び「含む(include)」などの任意の形式の含む(including)または「含む(containing)」(及び「含む(contains)」及び「含む(contain)」などの任意の形式の含む(containing)は、包括的または非制限的であり、引用していない追加の要素または方法ステップを除外しない。本明細書中で言及する任意の実施形態は、本開示の任意の方法または組成物に関して実施することができ、逆もまた同様であることが企図される。さらに、本開示の組成物を使用して、本開示の方法を達成することができる。
用語「約」または「およそ」とは、当業者が測定する特定の値についての許容可能な誤差範囲内であることを意味し、値がどのように測定または決定されるか、すなわち、測定系の制約に部分的に依存する。例えば、「約」は、当技術分野における慣例に従い、1または1を上回る標準偏差以内を意味し得る。あるいは、「約」は、所与の値の20%、10%、5%、または1%までの範囲を意味し得る。あるいは、特に生物学的システムまたはプロセスに関して、この用語は、例えば、値の5倍以内、2倍以内のように、同じ桁以内を意味し得る。別途記載のない限り、本出願及び特許請求の範囲に特定の値が記載される場合、用語「約」は、その特定の値について許容可能な誤差範囲内にあることを意味するものとみなされるべきである。
本明細書中での言及「いくつかの実施形態」、「実施形態」、「一実施形態」または「他の実施形態」は、実施形態に関連して記載される特定の特性、構造、または特徴が、少なくともいくつかの実施形態には含まれるが、本開示のすべての実施形態に含まれる必要はないことを意味する。
「アデノシンデアミナーゼ」とは、アデニンまたはアデノシンの加水分解性脱アミノ化を触媒することができるポリペプチドまたはその断片を意味する。いくつかの実施形態では、デアミナーゼまたはデアミナーゼドメインは、アデノシンからイノシンへの、またはデオキシアデノシンからデオキシイノシンへの加水分解的脱アミノ化を触媒するアデノシンデアミナーゼである。いくつかの実施形態では、アデノシンデアミナーゼは、デオキシリボ核酸(DNA)中のアデニンまたはアデノシンの加水分解的な脱アミノ化を触媒する。本明細書中で提供するアデノシンデアミナーゼ(例えば、改変されたアデノシンデアミナーゼ、進化されたアデノシンデアミナーゼ)は、細菌などの任意の生物に由来し得る。
いくつかの実施形態では、デアミナーゼまたはデアミナーゼドメインは、ヒト、チンパンジー、ゴリラ、サル、ウシ、イヌ、ラット、またはマウスなどの生物に由来する天然デアミナーゼのバリアントである。いくつかの実施形態では、デアミナーゼまたはデアミナーゼドメインは、自然界には存在しない。例えば、いくつかの実施形態では、デアミナーゼまたはデアミナーゼドメインは、天然デアミナーゼに対して、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性である。いくつかの実施形態では、アデノシンデアミナーゼは、E. coli、S. aureus、S. typhi、S. putrefaciens、H. influenzae、またはC. crescentusなどの細菌に由来する。いくつかの実施形態では、アデノシンデアミナーゼは、TadAデアミナーゼである。いくつかの実施形態では、TadAデアミナーゼは、E. coli TadA(ecTadA)デアミナーゼまたはその断片である。
例えば、デアミナーゼドメインは、国際PCT出願第PCT/2017/045381号(WO2018/027078)及び第PCT/US2016/058344号(WO2017/070632)に記載されており、これらのそれぞれは、その全体が参照により本明細書に援用される。また、Komor, A. C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N. M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017); Komor, A. C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3:eaao4774 (2017))、及びRees, H. A., et al., “Base editing: precision chemistry on the genome and transcriptome of living cells.” Nat Rev Genet. 2018 Dec; 19 (12): 770-788. doi: 10.1038/s41576-018-0059-1も参照されたい(その全内容は参照により本明細書に援用される)。
野生型TadA (wt)アデノシンデアミナーゼは、以下の配列(TadA参照配列とも呼ばれる)を有する:
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKKAQSSTD。
いくつかの実施形態では、アデノシンデアミナーゼは、以下の配列の改変を含む:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
(TadA*7.10とも呼ばれる)。
本発明は、TadA*7.10参照配列に対して改変が加えられている新規核酸塩基エディターを特徴とする。
いくつかの実施形態では、TadA*7.10は、少なくとも1つの改変を含む。いくつかの実施形態では、TadA*7.10は、アミノ酸82及び/または166に改変を含む。特定の実施形態では、上記の参照配列のバリアントは、以下の改変のうちの1つ以上を含む: Y147T、Y147R、Q154S、Y123H、V82S、T166R、及び/またはQ154R。改変Y123Hとは、TadA*7.10の改変H123Yが、Y123H TadA (wt)に戻されたことを指す。他の実施形態では、TadA*7.10配列のバリアントは、配列番号1の以下の改変R21N、R23H、E25F、N38G、L51W、P54C、M70V、Q71M、N72K、Y73S、M94V、P124W、T133K、D139L、D139M、C146R、及びA158Kのうちの1つ以上を含む。いくつかの実施形態では、TadA*7.10配列のバリアントは、以下からなる群から選択される改変の組み合わせを含む:Y147T+Q154R; Y147T+Q154S; Y147R+Q154S; V82S+Q154S; V82S+Y147R; V82S+Q154R; V82S+Y123H; I76Y+V82S; V82S+Y123H+Y147T; V82S+Y123H+Y147R; V82S+Y123H+Q154R; Y147R+Q154R+Y123H; Y147R+Q154R+I76Y; Y147R+Q154R+T166R; Y123H+Y147R+Q154R+I76Y; V82S+Y123H+Y147R+Q154R;及びI76Y+V82S+Y123H+Y147R+Q154R。
他の実施形態では、本発明は、TadA*7.10、TadA参照配列、または別のTadAにおける対応する変異と比較して残基149、150、151、152、153、154、155、156、または157で始まるC末端の欠失を含む、欠失を含むアデノシンデアミナーゼバリアント、例えばTadA*8を提供する。
さらに他の実施形態では、アデノシンデアミナーゼバリアントは、TadA*7.10、TadA参照配列、または別のTadAの対応する変異と比較して、それぞれが、以下の改変:Y147T、Y147R、Q154S、Y123H、V82S、T166R、及び/またはQ154Rのうちの1つ以上を有する2つのアデノシンデアミナーゼドメインを含むホモ二量体である。他の実施形態では、アデノシンデアミナーゼバリアントは、TadA*7.10、TadA参照配列、または別のTadAの対応する変異と比較して、それぞれが:Y147T+Q154R; Y147T+Q154S; Y147R+Q154S; V82S+Q154S; V82S+Y147R; V82S+Q154R; V82S+Y123H; I76Y+V82S; V82S+Y123H+Y147T; V82S+Y123H+Y147R; V82S+Y123H+Q154R; Y147R+Q154R+Y123H; Y147R+Q154R+I76Y; Y147R+Q154R+T166R; Y123H+Y147R+Q154R+I76Y; V82S+Y123H+Y147R+Q154R; 及びI76Y+V82S+Y123H+Y147R+Q154Rの群から選択される改変の組み合わせを有する、2つのアデノシンデアミナーゼドメイン(例えば、TadA*8)を含むホモ二量体である。
他の実施形態では、アデノシンデアミナーゼバリアントは、野生型TadAアデノシンデアミナーゼドメイン、及びTadA*7.10、TadA参照配列、または別のTadAの対応する変異と比較して、以下の改変、すなわち、Y147T、Y147R、Q154S、Y123H、V82S、T166R、及び/またはQ154Rのうちの1つ以上を含むアデノシンデアミナーゼバリアントドメイン(例えば、TadA*8)を含むヘテロ二量体である。他の実施形態では、アデノシンデアミナーゼバリアントは、野生型TadAアデノシンデアミナーゼドメイン、及びTadA*7.10、TadA参照配列、または別のTadAの対応する変異と比較して:Y147T+Q154R; Y147T+Q154S; Y147R+Q154S; V82S+Q154S; V82S+Y147R; V82S+Q154R; V82S+Y123H; I76Y+V82S; V82S+Y123H+Y147T; V82S+Y123H+Y147R; V82S+Y123H+Q154R; Y147R+Q154R+Y123H; Y147R+Q154R+I76Y; Y147R+Q154R+T166R; Y123H+Y147R+Q154R+I76Y; V82S+Y123H+Y147R+Q154R; 及びI76Y+V82S+Y123H+Y147R+Q154Rの群から選択される改変の組み合わせを含むアデノシンデアミナーゼバリアントドメイン(例えば、TadA*8)を含む、ヘテロ二量体である。
他の実施形態では、アデノシンデアミナーゼバリアントは、TadA*7.10ドメイン、及びTadA*7.10、TadA参照配列、または別のTadAの対応する変異と比較して、以下の改変、すなわち、Y147T、Y147R、Q154S、Y123H、V82S、T166R、及び/またはQ154Rのうちの1つ以上を含むアデノシンデアミナーゼバリアントドメイン(例えば、TadA*8)を含む、ヘテロ二量体である。他の実施形態では、アデノシンデアミナーゼバリアントは、TadA*7.10ドメイン、及びTadA*7.10、TadA参照配列、または別のTadAの対応する変異と比較して、以下の改変の組み合わせ:Y147T+Q154R; Y147T+Q154S; Y147R+Q154S; V82S+Q154S; V82S+Y147R; V82S+Q154R; V82S+Y123H; I76Y+V82S; V82S+Y123H+Y147T; V82S+Y123H+Y147R; V82S+Y123H+Q154R; Y147R+Q154R+Y123H; Y147R+Q154R+I76Y; Y147R+Q154R+T166R; Y123H+Y147R+Q154R+I76Y; V82S+Y123H+Y147R+Q154R; またはI76Y+V82S+Y123H+Y147R+Q154Rを含むアデノシンデアミナーゼバリアントドメイン(例えば、TadA*8)を含む、ヘテロ二量体である。一実施形態では、アデノシンデアミナーゼは、アデノシンデアミナーゼ活性を有する以下の配列またはその断片を含むか、または本質的にそれらからなるTadA*8である:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD。
いくつかの実施形態では、TadA*8は、短縮(切詰)されている。いくつかの実施形態では、短縮型TadA*8は、全長TadA*8に対して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のN末端アミノ酸残基を欠失している。いくつかの実施形態では、短縮型TadA*8は、全長TadA*8に対して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のC末端アミノ酸残基を欠失している。いくつかの実施形態では、アデノシンデアミナーゼバリアントは、全長TadA*8である。
特定の実施形態では、アデノシンデアミナーゼヘテロ二量体は、TadA*8ドメイン、及び以下のうちの1つから選択されるアデノシンデアミナーゼドメインを含む:
Staphylococcus aureus (S. aureus) TadA:
MGSHMTNDIYFMTLAIEEAKKAAQLGEVPIGAIITKDDEVIARAHNLRETLQQPTAH AEHIAIERAAKVLGSWRLEGCTLYVTLEPCVMCAGTIVMSRIPRVVYGADDPKGGCSGS LMNLLQQSNFNHRAIVDKGVLKEACSTLLTTFFKNLRANKKSTN
Bacillus subtilis (B.subtilis) TadA:
MTQDELYMKEAIKEAKKAEEKGEVPIGAVLVINGEIIARAHNLRETEQRSIAHAEML VIDEACKALGTWRLEGATLYVTLEPCPMCAGAVVLSRVEKVVFGAFDPKGGCSGTLMN LLQEERFNHQAEVVSGVLEEECGGMLSAFFRELRKKKKAARKNLSE
Salmonella typhimurium (S. typhimurium) TadA:
MPPAFITGVTSLSDVELDHEYWMRHALTLAKRAWDEREVPVGAVLVHNHRVIGEG WNRPIGRHDPTAHAEIMALRQGGLVLQNYRLLDTTLYVTLEPCVMCAGAMVHSRIG RVVFGARDAKTGAAGSLIDVLHHPGMNHRVEIIEGVLRDECATLLSDFFRMRRQEIK ALKKADRAEGAGPAV
Shewanella putrefaciens (S. putrefaciens) TadA:
MDEYWMQVAMQMAEKAEAAGEVPVGAVLVKDGQQIATGYNLSISQHDPTAHAEI LCLRSAGKKLENYRLLDATLYITLEPCAMCAGAMVHSRIARVVYGARDEKTGAAGT VVNLLQHPAFNHQVEVTSGVLAEACSAQLSRFFKRRRDEKKALKLAQRAQQGIE
Haemophilus influenzae F3031 (H. influenzae) TadA:
MDAAKVRSEFDEKMMRYALELADKAEALGEIPVGAVLVDDARNIIGEGWNLSIVQSDPTΑΗ AEIIALRNGAKNIQNYRLLNSTLYVTLEPCTMCAGAILHSRIKRLVFGASDYK TGAIGSRFHFFDDYKMNHTLEITSGVLAEECSQKLSTFFQKRREEKKIEKALLKSLSDK
Caulobacter crescentus (C. crescentus) TadA:
Figure 2022546608000005
Geobacter sulfurreducens (G. sulfurreducens) TadA:
MSSLKKTPIRDDAYWMGKAIREAAKAAARDEVPIGAVIVRDGAVIGRGHNLREGSN DPSAHAEMIAIRQAARRSANWRLTGATLYVTLEPCLMCMGAIILARLERVVFGCYDP KGGAAGSLYDLSADPRLNHQVRLSPGVCQEECGTMLSDFFRDLRRRKKAKATPALF IDERKVPPEP
TadA*7.10
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD。
「アデノシンデアミナーゼ塩基エディター8 (ABE8)ポリヌクレオチド」とは、ABE8をコードするポリヌクレオチドを意味する。
「アデノシンデアミナーゼ塩基エディター9(ABE9)ポリペプチド」または「ABE9」は、以下に示す配列のsssssssの位置に1つ以上の改変を含むアデノシンデアミナーゼバリアント(TadA*9)を含む、本明細書中で定義される塩基エディターを意味する。一実施形態では、アデノシンデアミナーゼバリアント(TadA*9)は、以下の改変を含む:以下の参照配列中の、R21N、R23H、E25F、N38G、L51W、P54C、M70V、Q71M、N72K、Y73S、V82T、M94V、P124W、T133K、D139L、D139M、C146R、及びA158K:
Figure 2022546608000006
参照配列中の改変される関連する塩基を、下線と太字で示す。いくつかの実施形態では、ABE9は、参照配列と比較して、本明細書に記載するように、さらなる改変を含む。
「アデノシンデアミナーゼ塩基エディター9(ABE9)ポリヌクレオチド」とは、ABE9をコードするポリヌクレオチドを意味する。
「α-1アンチトリプシン(A1AT)タンパク質」とは、UniProt登録番号P01009に対して少なくとも約95%のアミノ酸配列同一性を有するポリペプチドまたはその断片を意味する。特定の実施形態では、A1ATタンパク質は、以下の参照配列と比較して1つ以上の改変を含む。特定の一実施形態では、A1ADに関連するA1ATタンパク質は、E342K変異を含む。例示的なA1ATアミノ酸配列は、>sp|P01009|A1AT_HUMANα-1-アンチトリプシンOS=Homo sapiens OX=9606 GN=SERPINA1 PE=1 SV=3であり、以下のアミノ酸配列を有する:
Figure 2022546608000007
このA1ATタンパク質配列では、最初の24アミノ酸がシグナルペプチドを構成する(下線付き)。A1ADにおいて変異している配列の位置342(すなわち、E342K)は、シグナル配列に続くアミノ酸残基「E」をアミノ酸「1」として設定することに基づいて決定される。
「投与する」とは、本明細書に記載の1つ以上の組成物を患者または対象に提供することとして、本明細書中では言及される。例として、限定されないが、組成物の投与、例えば注射を、静脈内(i.v.)注射、皮下(s.c.)注射、皮内(i.d.)注射、腹腔内(i.p.)注射、または筋肉内(i.m.)注射によって実施することができる。1つ以上のそのような経路を使用することができる。非経口投与は、例えば、ボーラス注射または経時的な漸進的灌流によって行うことができる。あるいは、または同時に、投与は経口経路によって行うことができる。
「薬剤」とは、任意の小分子化学化合物、抗体、核酸分子、もしくはポリペプチド、またはその断片を意味する。
「改変」とは、当技術分野で公知の標準的な方法、例えば、本明細書に記載の方法によって検出される、遺伝子またはポリペプチドの配列、発現レベルまたは活性の変化(増加または減少)を意味する。本明細書中で使用する場合、改変には、発現レベルの10%の変化、発現レベルの25%の変化、40%の変化、及び50%以上の変化が含まれる。
「寛解する」とは、例えば、疾患の発症または進行を、低下、抑制、減弱化、減少、抑止、または安定化することを意味する。
「類似体」とは、同一ではないが類似した機能的または構造的特徴を有する分子を意味する。例えば、ポリペプチド類似体は、対応する天然ポリペプチドの生物活性を保持する一方で、類似体の機能を天然ポリペプチドに対して高める特定の生化学的修飾を有する。そのような生化学的修飾は、類似体のプロテアーゼ耐性、膜透過性、または半減期を、例えば、リガンド結合を変化させることなく増加させ得る。類似体は、非天然アミノ酸を含んでいてもよい。
「塩基エディター(BE)」または「核酸塩基エディター(NBE)」とは、ポリヌクレオチドに結合し、核酸塩基修飾活性を有する薬剤を意味する。様々な実施形態において、塩基エディターは、核酸塩基修飾ポリペプチド(例えば、デアミナーゼ)及びガイドポリヌクレオチド(例えば、ガイドRNA)と組み合わせたポリヌクレオチドプログラム可能なヌクレオチド結合ドメインを含む。様々な実施形態において、薬剤は、塩基編集活性を有するタンパク質ドメイン、すなわち、核酸分子(例えば、DNA)内の塩基(例えば、A、T、C、G、またはU)を修飾することができるドメインを含む生体分子複合体である。いくつかの実施形態では、ポリヌクレオチドプログラム可能なDNA結合ドメインは、デアミナーゼドメインに融合または連結される。一実施形態では、薬剤は、塩基編集活性を有する1つ以上のドメインを含む融合タンパク質である。別の実施形態では、塩基編集活性を有するタンパク質ドメインは、ガイドRNAに連結される(例えば、ガイドRNA上のRNA結合モチーフ及びデアミナーゼに融合させたRNA結合ドメインを介して)。いくつかの実施形態では、塩基編集活性を有するドメインは、核酸分子内の塩基を脱アミノ化することができる。いくつかの実施形態では、塩基エディターは、DNA分子内の1つ以上の塩基を脱アミノ化することができる。いくつかの実施形態では、塩基エディターは、DNA内のシトシン(C)またはアデノシン(A)を脱アミノ化することができる。いくつかの実施形態では、塩基エディターは、DNA内のシトシン(C)及びアデノシン(A)を脱アミノ化することができる。いくつかの実施形態では、塩基エディターは、シチジン塩基エディター(CBE)である。いくつかの実施形態では、塩基エディターは、アデノシン塩基エディター(ABE)である。いくつかの実施形態では、塩基エディターは、アデノシン塩基エディター(ABE)及びシチジン塩基エディター(CBE)である。いくつかの実施形態では、塩基エディターは、アデノシンデアミナーゼに融合させたヌクレアーゼ不活性Cas9(dCas9)である。いくつかの実施形態では、Cas9は、循環(環状)置換体(circular permutant)Cas9(例えば、spCas9またはsaCas9)である。循環置換体Cas9は、当技術分野で公知であり、例えば、Oakes et al., Cell 176, 254-267, 2019に記載されている。いくつかの実施形態では、塩基エディターを、塩基除去修復の阻害剤、例えば、UGIドメイン、またはdISNドメインに融合させる。いくつかの実施形態では、融合タンパク質は、デアミナーゼに融合させたCas9ニッカーゼ、及びUGIまたはdISNドメインなどの塩基除去修復の阻害剤を含む。他の実施形態では、塩基エディターは、塩基脱落の塩基エディターである。
いくつかの実施形態では、アデノシンデアミナーゼは、TadAから進化される。いくつかの実施形態では、ポリヌクレオチドプログラム可能なDNA結合ドメインは、CRISPR関連(例えば、CasまたはCpf1)酵素である。いくつかの実施形態では、塩基エディターは、デアミナーゼドメインに融合させた触媒的に不活性のCas9(dCas9)である。いくつかの実施形態では、塩基エディターは、デアミナーゼドメインに融合させたCas9ニッカーゼ(nCas9)である。いくつかの実施形態では、塩基エディターを、塩基除去修復(BER)の阻害剤に融合させる。いくつかの実施形態では、塩基除去修復の阻害剤は、ウラシルDNAグリコシラーゼ阻害剤(UGI)である。いくつかの実施形態では、塩基除去修復の阻害剤は、イノシン塩基除去修復阻害剤である。塩基エディターの詳細は、国際PCT出願第PCT/2017/045381号(WO2018/027078)及び第PCT/US2016/058344号(WO2017/070632)に記載されており、これらのそれぞれは、その全体が参照により本明細書に援用される。また、Komor, A. C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533,420-424 (2016); Gaudelli, N. M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017); Komor, A. C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3: eaao 4774 (2017),及びRees, H. A., et al., “Base editing: precision chemistry on the genome and transcriptome of living cells.” Nat Rev Genet. 2018 Dec; 19 (12): 770-788. doi: 10.1038/s41576-018-0059-1も参照されたい(その全内容は参照により本明細書に援用される)。
いくつかの実施形態では、塩基エディターは、アデノシンデアミナーゼバリアント(例えば、TadA*8)を、循環置換体Cas9(例えば、spCAS9)及びバイパータイト核局在化配列を含む骨格にクローニングすることによって生成される(例えば、ABE8またはABE9)。循環置換体Cas9は、当技術分野で公知であり、例えば、Oakes et al., Cell 176, 254-267, 2019に記載されている。例示的な循環置換体の配列を以下に記載し、太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線が引かれた配列はバイパータイト核局在化配列を示す。
CP5(MSP「NGC=変異を有するPamバリアント、通常のCas9はNGGを好む」PID=タンパク質相互作用ドメイン及び「D10A」ニッカーゼを有する):
Figure 2022546608000008
いくつかの実施形態では、ABE8は、以下の表10、11または13の塩基エディターから選択される。いくつかの実施形態では、ABE8は、TadAから進化されたアデノシンデアミナーゼバリアントを含む。いくつかの実施形態では、ABE8のアデノシンデアミナーゼバリアントは、以下の表8、10、11、または13に記載するようなTadA*8バリアントである。いくつかの実施形態では、アデノシンデアミナーゼバリアントは、Y147T、Y147R、Q154S、Y123H、V82S、T166R、及び/またはQ154Rからなる群から選択される1つ以上の改変を含むTadA*7.10バリアント(例えば、TadA*8)である。様々な実施形態において、ABE8は、Y147T+Q154R; Y147T+Q154S; Y147R+Q154S; V82S+Q154S; V82S+Y147R; V82S+Q154R; V82S+Y123H; I76Y+V82S; V82S+Y123H+Y147T; V82S+Y123H+Y147R; V82S+Y123H+Q154R; Y147R+Q154R+Y123H; Y147R+Q154R+I76Y; Y147R+Q154R+T166R; Y123H+Y147R+Q154R+I76Y; V82S+Y123H+Y147R+Q154R;及びI76Y+V82S+Y123H+Y147R+Q154Rの群から選択される改変の組み合わせを含むTadA*7.10バリアント(例えば、TadA*8)を含む。
いくつかの実施形態では、ABE8は、TadAデアミナーゼの1つのコピー、例えば、1つのTadA*8バリアントを含む単量体構築物である。いくつかの実施形態では、ABE8は、同じまたは異なるTadAデアミナーゼ、例えば、野生型TadA及びTadA*8バリアントの複数、例えば2つのコピーを含む二量体またはヘテロ二量体構築物である。
いくつかの実施形態では、ABE9は、以下の表14の塩基エディターから選択される。いくつかの実施形態では、ABE9は、TadAから進化されたアデノシンデアミナーゼバリアントを含む。いくつかの実施形態では、ABE9のアデノシンデアミナーゼバリアントは、表14に記載のTadA*7.10バリアントである。いくつかの実施形態では、アデノシンデアミナーゼバリアントは、Y147T、Y147R、Q154S、Y123H、V82S、T166R、Q154Rからなる群から選択される1つ以上の改変を含むTadA*7.10である。様々な実施形態において、ABE9は、表14に記載されているものに加えて、以下から選択される改変を有するTadA*7.10を含む:Y147R+Q154R+Y123H; Y147R+Q154R+I76Y; Y147R+Q154R+T166R; Y147T+Q154R; Y147T+Q154S; V82S+Q154S; V82T+Q154S及びY123H+Y147R+Q154R+I76Y。いくつかの実施形態では、ABE9は、TadAデアミナーゼの1つのコピー、例えば、TadA*9バリアントを含む単量体構築物である。いくつかの実施形態では、ABE9は、同じまたは異なるTadAデアミナーゼ、例えば、野生型TadA及びTadA*9バリアントの複数、例えば2つのコピーを含む二量体またはヘテロ二量体構築物である。
いくつかの実施形態では、ABE9塩基エディターは、以下の配列を含む:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD。
例として、本明細書に記載の塩基編集組成物、系及び方法において使用するアデニン塩基エディターABEは、以下に示す核酸配列(8877塩基対)を有する(Addgene, Watertown, MA.; Gaudelli N M, et al., Nature. 2017 Nov 23; 551 (7681): 464-471. doi: 10.1038/nature 24644; Koblan LW, et al., Nat Biotechnol. 2018 Oct; 36 (9): 843-846. doi: 10.1038/nbt.4172.)。該ABE核酸配列に対して少なくとも95%以上の同一性を有するポリヌクレオチド配列もまた、包含される。
ATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACAT
GACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGG
TTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTG
ACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCC
ATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTGGTTTAGTGAACCGT
CAGATCCGCTAGAGATCCGCGGCCGCTAATACGACTCACTATAGGGAGAGCCGCCACCATGAAACGGACA
GCCGACGGAAGCGAGTTCGAGTCACCAAAGAAGAAGCGGAAAGTCTCTGAAGTCGAGTTTAGCCACGAGT
ATTGGATGAGGCACGCACTGACCCTGGCAAAGCGAGCATGGGATGAAAGAGAAGTCCCCGTGGGCGCCGT
GCTGGTGCACAACAATAGAGTGATCGGAGAGGGATGGAACAGGCCAATCGGCCGCCACGACCCTACCGCA
CACGCAGAGATCATGGCACTGAGGCAGGGAGGCCTGGTCATGCAGAATTACCGCCTGATCGATGCCACCC
TGTATGTGACACTGGAGCCATGCGTGATGTGCGCAGGAGCAATGATCCACAGCAGGATCGGAAGAGTGGT
GTTCGGAGCACGGGACGCCAAGACCGGCGCAGCAGGCTCCCTGATGGATGTGCTGCACCACCCCGGCATG
AACCACCGGGTGGAGATCACAGAGGGAATCCTGGCAGACGAGTGCGCCGCCCTGCTGAGCGATTTCTTTA
GAATGCGGAGACAGGAGATCAAGGCCCAGAAGAAGGCACAGAGCTCCACCGACTCTGGAGGATCTAGCGG
AGGATCCTCTGGAAGCGAGACACCAGGCACAAGCGAGTCCGCCACACCAGAGAGCTCCGGCGGCTCCTCC
GGAGGATCCTCTGAGGTGGAGTTTTCCCACGAGTACTGGATGAGACATGCCCTGACCCTGGCCAAGAGGG
CACGCGATGAGAGGGAGGTGCCTGTGGGAGCCGTGCTGGTGCTGAACAATAGAGTGATCGGCGAGGGCTG
GAACAGAGCCATCGGCCTGCACGACCCAACAGCCCATGCCGAAATTATGGCCCTGAGACAGGGCGGCCTG
GTCATGCAGAACTACAGACTGATTGACGCCACCCTGTACGTGACATTCGAGCCTTGCGTGATGTGCGCCG
GCGCCATGATCCACTCTAGGATCGGCCGCGTGGTGTTTGGCGTGAGGAACGCAAAAACCGGCGCCGCAGG
CTCCCTGATGGACGTGCTGCACTACCCCGGCATGAATCACCGCGTCGAAATTACCGAGGGAATCCTGGCA
GATGAATGTGCCGCCCTGCTGTGCTATTTCTTTCGGATGCCTAGACAGGTGTTCAATGCTCAGAAGAAGG
CCCAGAGCTCCACCGACTCCGGAGGATCTAGCGGAGGCTCCTCTGGCTCTGAGACACCTGGCACAAGCGA
GAGCGCAACACCTGAAAGCAGCGGGGGCAGCAGCGGGGGGTCAGACAAGAAGTACAGCATCGGCCTGGCC
ATCGGCACCAACTCTGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGG
TGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGAGCCCTGCTGTTCGACAGCGGCGA
AACAGCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAGAACCGGATCTGC
TATCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGT
CCTTCCTGGTGGAAGAGGATAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGACGAGGTGGC
CTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGAC
CTGCGGCTGATCTATCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACC
TGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGA
GGAAAACCCCATCAACGCCAGCGGCGTGGACGCCAAGGCCATCCTGTCTGCCAGACTGAGCAAGAGCAGA
CGGCTGGAAAATCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAATGGCCTGTTCGGAAACCTGATTGCCC
TGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAG
CAAGGACACCTACGACGACGACCTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTT
CTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGACATCCTGAGAGTGAACACCGAGATCACCA
AGGCCCCCCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGACCTGACCCTGCTGAAAGC
TCTCGTGCGGCAGCAGCTGCCTGAGAAGTACAAAGAGATTTTCTTCGACCAGAGCAAGAACGGCTACGCC
GGCTACATTGACGGCGGAGCCAGCCAGGAAGAGTTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGG
ACGGCACCGAGGAACTGCTCGTGAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAA
CGGCAGCATCCCCCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGCGGCAGGAAGATTTTTAC
CCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCCGCATCCCCTACTACGTGGGCC
CTCTGGCCAGGGGAAACAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACCCCCTGGAA
CTTCGAGGAAGTGGTGGACAAGGGCGCTTCCGCCCAGAGCTTCATCGAGCGGATGACCAACTTCGATAAG
AACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTATAACGAGC
TGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTCCTGAGCGGCGAGCAGAAAAAGGC
CATCGTGGACCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAG
AAAATCGAGTGCTTCGACTCCGTGGAAATCTCCGGCGTGGAAGATCGGTTCAACGCCTCCCTGGGCACAT
ACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAATGAGGAAAACGAGGACATTCTGGA
AGATATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACCTATGCC
CACCTGTTCGACGACAAAGTGATGAAGCAGCTGAAGCGGCGGAGATACACCGGCTGGGGCAGGCTGAGCC
GGAAGCTGATCAACGGCATCCGGGACAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGG
CTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAA
GCCCAGGTGTCCGGCCAGGGCGATAGCCTGCACGAGCACATTGCCAATCTGGCCGGCAGCCCCGCCATTA
AGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTCGTGAAAGTGATGGGCCGGCACAAGCCCGA
GAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACCCAGAAGGGACAGAAGAACAGCCGCGAGAGA
ATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACA
CCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGGCGGGATATGTACGTGGACCAGGA
ACTGGACATCAACCGGCTGTCCGACTACGATGTGGACCATATCGTGCCTCAGAGCTTTCTGAAGGACGAC
TCCATCGACAACAAGGTGCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCTCCGAAG
AGGTCGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATTACCCAGAGAAAGTT
CGACAATCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAG
CTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATCCTGGACTCCCGGATGAACACTAAGTACG
ACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTGATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCG
GAAGGATTTCCAGTTTTACAAAGTGCGCGAGATCAACAACTACCACCACGCCCACGACGCCTACCTGAAC
GCCGTCGTGGGAACCGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACA
AGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAAATCGGCAAGGCTACCGCCAAGTACTT
CTTCTACAGCAACATCATGAACTTTTTCAAGACCGAGATTACCCTGGCCAACGGCGAGATCCGGAAGCGG
CCTCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCCGGGATTTTGCCACCGTGC
GGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAAAAGACCGAGGTGCAGACAGGCGGCTTCAGCAA
AGAGTCTATCCTGCCCAAGAGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAG
TACGGCGGCTTCGACAGCCCCACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGT
CCAAGAAACTGAAGAGTGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAA
TCCCATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTGCCTAAG
TACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCCGGCGAACTGCAGAAGGGAA
ACGAACTGGCCCTGCCCTCCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGG
CTCCCCCGAGGATAATGAGCAGAAACAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATC
GAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAATCTGGACAAAGTGCTGTCCGCCT
ACAACAAGCACCGGGATAAGCCCATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAA
TCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAA
GAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTC
AGCTGGGAGGTGACTCTGGCGGCTCAAAAAGAACCGCCGACGGCAGCGAATTCGAGCCCAAGAAGAAGAG
GAAAGTCTAACCGGTCATCATCACCATCACCATTGAGTTTAAACCCGCTGATCAGCCTCGACTGTGCCTT
CTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCAC
TGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGT
GGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCT
CTATGGCTTCTGAGGCGGAAAGAACCAGCTGGGGCTCGATACCGTCGACCTCTAGCTAGAGCTTGGCGTA
ATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGA
AGCATAAAGTGTAAAGCCTAGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGC
CCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGG
TTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGA
GCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACA
TGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCT
CCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAA
AGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGAT
ACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTC
GGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTA
TCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTA
ACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTA
CACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGC
TCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCA
GAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACACTCAGTGGAACGAAAACTC
ACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGA
AGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGG
CACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTAC
GATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCA
GATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCT
CCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGT
TGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCC
CAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGA
TCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTAC
TGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGT
ATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAA
AAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAG
TTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGA
GCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATAC
TCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATG
TATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCGACGGA
TCGGGAGATCGATCTCCCGATCCCCTAGGGTCGACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAA
GCCAGTATCTGCTCCCTGCTTGTGTGTTGGAGGTCGCTGAGTAGTGCGCGAGCAAAATTTAAGCTACAAC
AAGGCAAGGCTTGACCGACAATTGCATGAAGAATCTGCTTAGGGTTAGGCGTTTTGCGCTGCTTCGCGAT
GTACGGGCCAGATATACGCGTTGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCAT
TAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCC
CAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCAT
TGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATC
「塩基編集活性」とは、ポリヌクレオチド内の塩基を化学的に変化させるように作用することを意味する。一実施形態では、第1の塩基を、第2の塩基に変換する。一実施形態では、塩基編集活性とは、シチジンデアミナーゼ活性、例えば、標的C・GからT・Aへの変換である。別の実施形態では、塩基編集活性は、アデノシンまたはアデニンデアミナーゼ活性、例えば、A・TからG・Cへの変換である。別の実施形態では、塩基編集活性とは、シチジンデアミナーゼ活性、例えば、標的C・GからT・Aへの変換、及びアデノシンまたはアデニンデアミナーゼ活性、例えば、A・TからG・Cへの変換である。
用語「塩基エディターシステム」とは、標的ヌクレオチド配列の核酸塩基を編集するための系を指す。様々な実施形態において、塩基編集(BE)系は、(1)標的ヌクレオチド配列中の核酸塩基を脱アミノ化するための、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン、デアミナーゼドメイン(例えば、シチジンデアミナーゼまたはアデノシンデアミナーゼ);ならびに(2)ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインと組み合わせた1つ以上のガイドポリヌクレオチド(例えば、ガイドRNA)を含む。様々な実施形態において、塩基編集(BE)系は、アデノシンデアミナーゼまたはシチジンデアミナーゼから選択される核酸塩基エディタードメイン、及び核酸配列特異的結合活性を有するドメインを含む。いくつかの実施形態では、塩基エディターシステムは、(1)標的ヌクレオチド配列中の1つ以上の核酸塩基を脱アミノ化するための、ポリヌクレオチドプログラム可能なDNA結合ドメイン及びデアミナーゼドメインを含む塩基エディター(BE);ならびに(2)ポリヌクレオチドプログラム可能なDNA結合ドメインと組み合わせた1つ以上のガイドRNAを含む。いくつかの実施形態では、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、ポリヌクレオチドプログラム可能なDNA結合ドメインである。いくつかの実施形態では、塩基エディターは、シチジン塩基エディター(CBE)である。いくつかの実施形態では、塩基エディターは、アデニンまたはアデノシン塩基エディター(ABE)である。いくつかの実施形態では、塩基エディターは、アデニンもしくはアデノシン塩基エディター(ABE)またはシチジン塩基エディター(CBE)である。
用語「Cas9」または「Cas9ドメイン」とは、Cas9タンパク質またはその断片(例えば、Cas9及び/またはCas9のgRNA結合ドメインの活性、不活性、または部分的に活性なDNA切断ドメインを含むタンパク質)を含むRNAガイドヌクレアーゼを指す。Cas9ヌクレアーゼは、casnlヌクレアーゼまたはCRISPR(clustered regularly interspaced short palindromic repeat)関連ヌクレアーゼと呼ばれることもある。例示的なCas9は、Streptococcus pyogenes Cas9 (spCas9)であり、そのアミノ酸配列を以下に示す:
Figure 2022546608000009
用語「Cas12b」または「Cas12bドメイン」とは、Cas12b/C2c1タンパク質またはその断片を含むRNAガイドヌクレアーゼ(例えば、Cas12bの活性、不活性、または部分的に活性なDNA切断ドメイン、及び/またはCas12bのgRNA結合ドメインを含むタンパク質)を指し、それぞれの内容は、参照により本明細書に援用される)。Cas12bオルソログは、Alicyclobacillus acidoterrestris、Alicyclobacillus acidophilus(Teng et al., Cell Discov. 2018 Nov 27; 4: 63)、Bacillus hisashi、及びBacillus種V3-13を含むがこれらに限定されない様々な種において示されている。追加の適切なCas12bヌクレアーゼ及び配列は、本開示に基づいて当業者には明らかであろう。
いくつかの実施形態では、Cas12bまたはその断片を含むタンパク質は、「Cas12bバリアント」と呼ばれる。Cas12bバリアントは、Cas12bまたはその断片と相同性を共有する。例えば、Cas12bバリアントは、野生型Cas12bと、少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一である。いくつかの実施形態では、Cas12bバリアントは、野生型Cas12bと比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50またはそれ以上のアミノ酸変化を有し得る。いくつかの実施形態では、Cas12bバリアントは、Cas12bの断片(例えば、gRNA結合ドメインまたはDNA切断ドメイン)を、その断片が、野生型Cas12bの対応する断片と、少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一であるように含む。いくつかの実施形態では、断片は、対応する野生型Cas12bのアミノ酸長の、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%同一、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%である。例示的なCas12bポリペプチドを以下に記載する。
Cas12b/C2c1(uniprot.org/uniprot/T0D7A2#2)sp|T0D7A2|C2C1_ALIAG CRISPR関連エンドヌクレアーゼC2c1 OS=Alicyclobacillus acido-terrestris (株ATCC49025/DSM3922/CIP106132/NCIMB13137/GD3B) GN=c2c1 PE=1 SV=1
MAVKSIKVKLRLDDMPEIRAGLWKLHKEVNAGVRYYTEWLSLLRQENLYRRSPNGDGEQECDKTAEECKAELLERLRARQVENGHRGPAGSDDELLQLARQLYELLVPQAIGAKGDAQQIARKFLSPLADKDAVGGLGIAKAGNKPRWVRMREAGEPGWEEEKEKAETRKSADRTADVLRALADFGLKPLMRVYTDSEMSSVEWKPLRKGQAVRTWDRDMFQQAIERMMSWESWNQRVGQEYAKLVEQKNRFEQKNFVGQEHLVHLVNQLQQDMKEASPGLESKEQTAHYVTGRALRGSDKVFEKWGKLAPDAPFDLYDAEIKNVQRRNTRRFGSHDLFAKLAEPEYQALWREDASFLTRYAVYNSILRKLNHAKMFATFTLPDATAHPIWTRFDKLGGNLHQYTFLFNEFGERRHAIRFHKLLKVENGVAREVDDVTVPISMSEQLDNLLPRDPNEPIALYFRDYGAEQHFTGEFGGAKIQCRRDQLAHMHRRRGARDVYLNVSVRVQSQSEARGERRPPYAAVFRLVGDNHRAFVHFDKLSDYLAEHPDDGKLGSEGLLSGLRVMSVDLGLRTSASISVFRVARKDELKPNSKGRVPFFFPIKGNDNLVAVHERSQLLKLPGETESKDLRAIREERQRTLRQLRTQLAYLRLLVRCGSEDVGRRERSWAKLIEQPVDAANHMTPDWREAFENELQKLKSLHGICSDKEWMDAVYESVRRVWRHMGKQVRDWRKDVRSGERPKIRGYAKDVVGGNSIEQIEYLERQYKFLKSWSFFGKVSGQVIRAEKGSRFAITLREHIDHAKEDRLKKLADRIIMEALGYVYALDERGKGKWVAKYPPCQLILLEELSEYQFNNDRPPSENNQLMQWSHRGVFQELINQAQVHDLLVGTMYAAFSSRFDARTGAPGIRCRRVPARCTQEHNPEPFPWWLNKFVVEHTLDACPLRADDLIPTGEGEIFVSPFSAEEGDFHQIHADLNAAQNLQQRLWSDFDISQIRLRCDWGEVDGELVLIPRLTGKRTADSYSNKVFYTNTGVTYYERERGKKRRKVFAQEKLSEEEAELLVEADEAREKSVVLMRDPSGIINRGNWTRQKEFWSMVNQRIEGYLVKQIRSRVPLQDSACENTGDI
AacCas12b (Alicyclobacillus acidiphilus)-WP_067623834
MAVKSMKVKLRLDNMPEIRAGLWKLHTEVNAGVRYYTEWLSLLRQENLYRRSPNGDGEQECYKTAEECKAELLERLRARQVENGHCGPAGSDDELLQLARQLYELLVPQAIGAKGDAQQIARKFLSPLADKDAVGGLGIAKAGNKPRWVRMREAGEPGWEEEKAKAEARKSTDRTADVLRALADFGLKPLMRVYTDSDMSSVQWKPLRKGQAVRTWDRDMFQQAIERMMSWESWNQRVGEAYAKLVEQKSRFEQKNFVGQEHLVQLVNQLQQDMKEASHGLESKEQTAHYLTGRALRGSDKVFEKWEKLDPDAPFDLYDTEIKNVQRRNTRRFGSHDLFAKLAEPKYQALWREDASFLTRYAVYNSIVRKLNHAKMFATFTLPDATAHPIWTRFDKLGGNLHQYTFLFNEFGEGRHAIRFQKLLTVEDGVAKEVDDVTVPISMSAQLDDLLPRDPHELVALYFQDYGAEQHLAGEFGGAKIQYRRDQLNHLHARRGARDVYLNLSVRVQSQSEARGERRPPYAAVFRLVGDNHRAFVHFDKLSDYLAEHPDDGKLGSEGLLSGLRVMSVDLGLRTSASISVFRVARKDELKPNSEGRVPFCFPIEGNENLVAVHERSQLLKLPGETESKDLRAIREERQRTLRQLRTQLAYLRLLVRCGSEDVGRRERSWAKLIEQPMDANQMTPDWREAFEDELQKLKSLYGICGDREWTEAVYESVRRVWRHMGKQVRDWRKDVRSGERPKIRGYQKDVVGGNSIEQIEYLERQYKFLKSWSFFGKVSGQVIRAEKGSRFAITLREHIDHAKEDRLKKLADRIIMEALGYVYALDDERGKGKWVAKYPPCQLILLEELSEYQFNNDRPPSENNQLMQWSHRGVFQELLNQAQVHDLLVGTMYAAFSSRFDARTGAPGIRCRRVPARCAREQNPEPFPWWLNKFVAEHKLDGCPLRADDLIPTGEGEFFVSPFSAEEGDFHQIHADLNAAQNLQRRLWSDFDISQIRLRCDWGEVDGEPVLIPRTTGKRTADSYGNKVFYTKTGVTYYERERGKKRRKVFAQEELSEEEAELLVEADEAREKSVVLMRDPSGIINRGDWTRQKEFWSMVNQRIEGYLVKQIRSRVRLQESACENTGDI
BhCas12b (Bacillus hisashii)NCBI参照配列:WP_095142515
Figure 2022546608000010
BvCas12b V4と呼ばれるバリアントは、上記の野生型配列と比較して、S893R、K846R、及びE837Gの変化を含む。
BvCas12b (Bacillus種V3-13) NCBI参照配列: WP_101661451.1
MAIRSIKLKMKTNSGTDSIYLRKALWRTHQLINEGIAYYMNLLTLYRQEAIGDKTKEAYQAELINIIRNQQRNNGSSEEHGSDQEILALLRQLYELIIPSSIGESGDANQLGNKFLYPLVDPNSQSGKGTSNAGRKPRWKRLKEEGNPDWELEKKKDEERKAKDPTVKIFDNLNKYGLLPLFPLFTNIQKDIEWLPLGKRQSVRKWDKDMFIQAIERLLSWESWNRRVADEYKQLKEKTESYYKEHLTGGEEWIEKIRKFEKERNMELEKNAFAPNDGYFITSRQIRGWDRVYEKWSKLPESASPEELWKVVAEQQNKMSEGFGDPKVFSFLANRENRDIWRGHSERIYHIAAYNGLQKKLSRTKEQATFTLPDAIEHPLWIRYESPGGTNLNLFKLEEKQKKNYYVTLSKIIWPSEEKWIEKENIEIPLAPSIQFNRQIKLKQHVKGKQEISFSDYSSRISLDGVLGGSRIQFNRKYIKNHKELLGEGDIGPVFFNLVVDVAPLQETRNGRLQSPIGKALKVISSDFSKVIDYKPKELMDWMNTGSASNSFGVASLLEGMRVMSIDMGQRTSASVSIFEVVKELPKDQEQKLFYSINDTELFAIHKRSFLLNLPGEVVTKNNKQQRQERRKKRQFVRSQIRMLANVLRLETKKTPDERKKAIHKLMEIVQSYDSWTASQKEVWEKELNLLTNMAAFNDEIWKESLVELHHRIEPYVGQIVSKWRKGLSEGRKNLAGISMWNIDELEDTRRLLISWSKRSRTPGEANRIETDEPFGSSLLQHIQNVKDDRLKQMANLIIMTALGFKYDKEEKDRYKRWKETYPACQIILFENLNRYLFNLDRSRRENSRLMKWAHRSIPRTVSMQGEMFGLQVGDVRSEYSSRFHAKTGAPGIRCHALTEEDLKAGSNTLKRLIEDGFINESELAYLKKGDIIPSQGGELFVTLSKRYKKDSDNNELTVIHADINAAQNLQKRFWQQNSEVYRVPCQLARMGEDKLYIPK SQTETIKKYFGKGSFVKNNTEQEVYKWEKSEKMKIKTDTTFDLQDLDGFEDISKTIELAQEQQKKYLTMFRDPSGYFFNNETWRPQKEYWSIVNNIIKSCLKKKILSNKVEL
用語「保存的アミノ酸置換」または「保存的変異」とは、あるアミノ酸を、共通の特性を有する別のアミノ酸に置き換えることを指す。個々のアミノ酸間の共通の特性を定義する機能的な方法は、相同生物の対応するタンパク質間のアミノ酸変化の正規化された頻度を分析することである(Schulz, G. E. and Schirmer, R. H., Principles of Protein Structure, Springer-Verlag, New York (1979))。そのような分析によれば、そのグループ内のアミノ酸が互いに優先的に交換され、したがって全体的なタンパク質構造への影響が互いに最も類似している場合に、アミノ酸のグループを定義することができる(Schulz, G. E. and Schirmer, R. H.、上記)。保存的変異の非限定的な例として、アミノ酸置換、例えば、正電荷を維持することができるような、アルギニンからリジンへの置換、及びその逆; 負電荷を維持することができるように、アスパラギン酸からグルタミン酸へ、及びその逆; 遊離-OHを維持できるように、スレオニンからセリンへ;ならびに遊離の-NH2を維持できるような、アスパラギンからグルタミンへの置換が挙げられる。
本明細書中で互換的に使用する用語「コード配列」または「タンパク質コード配列」とは、タンパク質をコードするポリヌクレオチドのセグメントを指す。コード配列は、オープンリーディングフレームとも呼ばれ得る。該領域または配列は、5’末端の近くで開始コドンで境界付けられ、3’末端の近くで終止コドンで境界付けられる。本明細書に記載の塩基エディターで有用な終止コドンとして、以下が挙げられる:
Figure 2022546608000011
「シチジンデアミナーゼ」とは、アミノ基をカルボニル基に変換する脱アミノ化反応を触媒することができるポリペプチドまたはその断片を意味する。一実施形態では、シチジンデアミナーゼは、シトシンをウラシルに、または5-メチルシトシンをチミンに変換する。Petromyzon marinus (Petromyzon marinusシトシンデアミナーゼ1、「PmCDA1」)に由来するPmCDA1、哺乳類(例えば、ヒト、ブタ、ウシ、ウマ、サルなど)に由来するAID(活性化誘導シチジンデアミナーゼ; AICDA)、及びAPOBECは例示的なシチジンデアミナーゼである。
本明細書中で使用する用語「デアミナーゼ」または「デアミナーゼドメイン」とは、脱アミノ化反応を触媒するタンパク質または酵素を指す。いくつかの実施形態では、デアミナーゼまたはデアミナーゼドメインは、シチジンまたはデオキシシチジンから、それぞれ、ウリジンまたはデオキシウリジンへの加水分解的脱アミノ化を触媒するシチジンデアミナーゼである。いくつかの実施形態では、デアミナーゼまたはデアミナーゼドメインは、シトシンからウラシルへの加水分解的脱アミノ化を触媒するシトシンデアミナーゼである。いくつかの実施形態では、デアミナーゼは、アデニンからヒポキサンチンへの加水分解的脱アミノ化を触媒するアデノシンデアミナーゼである。いくつかの実施形態では、デアミナーゼは、アデノシンまたはアデニン(A)からイノシン(I)への加水分解的脱アミノ化を触媒するアデノシンデアミナーゼである。いくつかの実施形態では、デアミナーゼまたはデアミナーゼドメインは、アデノシンまたはデオキシアデノシンから、それぞれ、イノシンまたはデオキシイノシンへの加水分解的脱アミノ化を触媒するアデノシンデアミナーゼである。いくつかの実施形態では、アデノシンデアミナーゼは、デオキシリボ核酸(DNA)中のアデノシンの加水分解的な脱アミノ化を触媒する。本明細書中で提供するアデノシンデアミナーゼ(例えば、改変されたアデノシンデアミナーゼ、進化されたアデノシンデアミナーゼ)は、細菌などの任意の生物に由来し得る。いくつかの実施形態では、アデノシンデアミナーゼは、E. coli、S. aureus、S. typhi、S. putrefaciens、H. influenzae、またはC. crescentusなどの細菌に由来する。いくつかの実施形態では、アデノシンデアミナーゼは、TadAデアミナーゼである。いくつかの実施形態では、デアミナーゼまたはデアミナーゼドメインは、ヒト、チンパンジー、ゴリラ、サル、ウシ、イヌ、ラット、またはマウスなどの生物に由来する天然デアミナーゼのバリアントである。いくつかの実施形態では、デアミナーゼまたはデアミナーゼドメインは、自然界には存在しない。例えば、いくつかの実施形態では、デアミナーゼまたはデアミナーゼドメインは、天然デアミナーゼと、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、少なくとも99.1%、少なくとも99.2%、少なくとも99.3%、少なくとも99.4%、少なくとも99.5%、少なくとも99.6%、少なくとも99.7%、少なくとも99.8%、または少なくとも99.9%同一である。
「検出」とは、検出される分析物の存在、不在、または量を同定することを指す。一実施形態では、ポリヌクレオチドまたはポリペプチドの配列の変化を検出する。別の実施形態では、インデルの存在を検出する。
「検出可能な標識」とは、目的の分子に連結した場合に、分光学的、光化学的、生化学的、免疫化学的、または化学的手段を介して、目的の分子を検出可能にする組成物を意味する。例えば、有用な標識として、放射性同位元素、磁気ビーズ、金属ビーズ、コロイド粒子、蛍光色素、高電子密度試薬、酵素(例えば、酵素結合免疫吸着測定法(ELISA)で一般的に使用される酵素)、ビオチン、ジゴキシゲニン、またはハプテンが挙げられる。
「疾患」とは、細胞、組織、または臓器の正常な機能を損傷または妨害する病態または障害を意味する。
「有効量」とは、未処置の患者もしくは疾患を有さない個体、すなわち健康な個体と比較して、疾患の症状を寛解するのに必要とされる薬剤もしくは活性化合物、例えば、本明細書に記載の塩基エディターの量、または所望の生物学的応答を誘発するのに十分な薬剤または活性化合物の量を意味する。疾患の治療的処置のために、本発明を実施するために使用する活性化合物(複数可)の有効量は、投与様式、対象の年齢、体重、及び一般的健康によって異なる。最終的には、担当医師または獣医が、適切な量及び投薬レジメンを決定するだろう。そのような量は、「有効」量と呼ばれる。一実施形態では、有効量は、細胞(例えば、in vitroまたはin vivoの細胞)内の目的の遺伝子に変化を導入するのに十分な本発明の塩基エディターの量である。一実施形態では、有効量は、治療効果を達成するために必要とされる塩基エディターの量である。そのような治療効果は、対象、組織または器官のすべての細胞内の病原遺伝子を変化させるのに十分である必要はなく、対象、組織または器官に存在する約1%、5%、10%、25%、50%、75%またはそれ以上の細胞内の病原遺伝子を変化させるのに十分であればよい。一実施形態では、有効量は、疾患の1つ以上の症状を改善するのに十分である。
いくつかの実施形態では、本明細書中で提供する融合タンパク質、例えば、nCas9ドメイン及びデアミナーゼドメイン(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ)を含む核酸塩基エディターの有効量とは、本明細書に記載の核酸塩基エディターが特異的に結合し編集するところの標的部位の、編集を誘導するのに十分な量を指す。当業者であれば理解するように、薬剤、例えば、融合タンパク質の有効量は、例えば、所望の生物学的応答、例えば、編集しようとする特定の対立遺伝子、ゲノムまたは標的部位、標的とする細胞または組織、及び/または使用する薬剤などの様々な要因に応じて変化し得る。
いくつかの実施形態では、本明細書中で提供する融合タンパク質、例えば、nCas9ドメイン及びデアミナーゼドメインを含む融合タンパク質の有効量は、融合タンパク質が特異的に結合し編集するところの標的部位の、編集を誘導するのに十分な融合タンパク質の量を指し得る。当業者であれば理解するように、薬剤、例えば、融合タンパク質、ヌクレアーゼ、ハイブリッドタンパク質、タンパク質二量体、タンパク質(もしくはタンパク質二量体)とポリヌクレオチドの複合体、またはポリヌクレオチドの有効量は、例えば、所望の生物学的応答、例えば、編集しようとする特定の対立遺伝子、ゲノムまたは標的部位、標的とする細胞または組織、及び/または使用する薬剤などの様々な要因に応じて変化し得る。
「断片」とは、ポリペプチドまたは核酸分子の一部分を意味する。この部分は、好ましくは、参照核酸分子またはポリペプチドの全長の少なくとも約10%、20%、30%、40%、50%、60%、70%、80%、または90%を含有する。断片は、10、20、30、40、50、60、70、80、90、または100、200、300、400、500、600、700、800、900、または1000ヌクレオチドまたはアミノ酸を含有し得る。
「ガイドRNA」または「gRNA」とは、標的配列に特異的であり、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインタンパク質(例えば、Cas9またはCpf1)と複合体を形成することができるポリヌクレオチドを意味する。一実施形態では、ガイドポリヌクレオチドはガイドRNA(gRNA)である。gRNAは、2つ以上のRNAの複合体として、または単一のRNA分子として存在し得る。単一のRNA分子として存在するgRNAは、単一ガイドRNA(sgRNA)と呼ばれる場合があるが、「gRNA」は、単一分子として、または2つ以上の分子の複合体として存在するガイドRNAを指すために交換可能に使用される。通常、単一のRNA種として存在するgRNAは、2つのドメイン:(1)標的核酸と相同性を共有するドメイン(例えば、Cas9複合体の標的への結合を誘導するドメイン);及び(2)Cas9タンパク質に結合するドメインを含む。いくつかの実施形態では、ドメイン(2)は、tracrRNAとして知られる配列に対応し、ステムループ構造を含む。例えば、いくつかの実施形態では、ドメイン(2)は、Jinek et al., Science 337: 816-821 (2012)に記載されているように、tracrRNAと同一または相同であり、その全内容は、参照により本明細書に援用される。gRNAの他の例(例えば、ドメイン2を含むもの)は、「Switchable Cas9 Nucleases and Uses Thereof」と題されたUS20160208288、及び「Delivery System For Functional Nucleases」と題されたUS 9,737,604に見出すことができ、それぞれの全内容は、全体が参照により本明細書に援用される。いくつかの実施形態では、gRNAは、2つ以上のドメイン(1)及び(2)を含み、「拡張gRNA」と呼ばれ得る。拡張(extended)gRNAは、本明細書に記載するように、2つ以上のCas9タンパク質に結合し、2つ以上の異なる領域で標的核酸に結合する。gRNAは、標的部位に相補的なヌクレオチド配列を含み、この配列は、標的部位へのヌクレアーゼ/RNA複合体の結合を媒介し、ヌクレアーゼ:RNA複合体の配列特異性を提供する。
「ヘテロ二量体」とは、野生型TadAドメイン及びTadAドメインのバリアント(例えば、TadA*8またはTadA*9)または2つのバリアントTadAドメイン(例えば、TadA*7.10及びTadA*8もしくは2つのTadA*8ドメイン;またはTadA*7.10及びTadA*9もしくは2つのTadA*9ドメイン)などの2つのドメインを含む融合タンパク質を意味する。
「ハイブリダイゼーション」とは水素結合していることを意味し、それは、相補的な核酸塩基間のワトソン・クリック型、フーグスティーン型、または逆フーグスティーン型の水素結合であってもよい。例えば、アデニンとチミンは、水素結合の形成を通じて対になる相補的な核酸塩基である。
「増加」とは、少なくとも10%、25%、50%、75%、または100%の正の変化を意味する。
用語「塩基修復の阻害剤」、「塩基修復阻害剤」、「IBR」またはそれらの文法上の同等物は、核酸修復酵素、例えば塩基除去修復酵素の活性を阻害することができるタンパク質を指す。いくつかの実施形態では、IBRは、イノシン塩基除去修復の阻害剤である。塩基修復の例示的な阻害剤として、APE1、Endo III、Endo IV、Endo V、Endo VIII、Fpg、hOGG1、hNEIL1、T7 Endol、T4PDG、UDG、hSMUG1、及びhAAGの阻害剤が挙げられる。いくつかの実施形態では、塩基修復阻害剤は、Endo VまたはhAAGの阻害剤である。いくつかの実施形態では、IBRは、Endo VまたはhAAGの阻害剤である。いくつかの実施形態では、IBRは、触媒的に不活性なEndoVまたは触媒的に不活性なhAAGである。いくつかの実施形態では、塩基修復阻害剤は、触媒的に不活性なEndoVまたは触媒的に不活性なhAAGである。いくつかの実施形態では、塩基修復阻害剤は、ウラシルグリコシラーゼ阻害剤(UGI)である。UGIとは、ウラシルDNAグリコシラーゼの塩基除去修復酵素を阻害することができるタンパク質のことである。いくつかの実施形態では、UGIドメインは、野生型UGIまたは野生型UGIの断片を含む。いくつかの実施形態では、本明細書中で提供するUGIタンパク質には、UGIの断片、及びUGIまたはUGI断片に相同なタンパク質が含まれる。いくつかの実施形態では、塩基修復阻害剤は、イノシン塩基除去修復の阻害剤である。いくつかの実施形態では、塩基修復阻害剤は、「触媒的に不活性なイノシン特異的ヌクレアーゼ」または「不活性イノシン特異的ヌクレアーゼ」である。特定の理論に拘泥することを望むものではないが、触媒的に不活性なイノシングリコシラーゼ(例えば、アルキルアデニングリコシラーゼ(AAG))はイノシンに結合することができるが、脱塩基部位を作成したりイノシンを除去したりすることはできず、その結果、新たに形成されるイノシン部分は、DNA損傷/修復機構から立体的に遮断される。いくつかの実施形態では、触媒的に不活性なイノシン特異的ヌクレアーゼは、核酸中のイノシンに結合することができるが、核酸を切断しない。非限定的な例示的な触媒的に不活性なイノシン特異的ヌクレアーゼとして、例えば、ヒト由来の触媒的に不活性なアルキルアデノシングリコシラーゼ(AAGヌクレアーゼ)、及び例えば、E. coli由来の触媒的に不活性なエンドヌクレアーゼV(EndoVヌクレアーゼ)が挙げられる。いくつかの実施形態では、触媒的に不活性なAAGヌクレアーゼは、E125Q変異または別のAAGヌクレアーゼにおける対応する変異を含む。
「インテイン」とは、タンパク質スプライシングと呼ばれるプロセスにおいて、それ自身を切除し、残りの断片(エクステイン)をペプチド結合で結合することができるタンパク質の断片である。インテインは「タンパク質イントロン」とも呼ばれる。インテインがそれ自身を切除し、タンパク質の残りの部分を結合するプロセスは、本明細書中では「タンパク質スプライシング」または「インテイン媒介タンパク質スプライシング」と呼ばれる。いくつかの実施形態では、前駆体タンパク質のインテイン(インテイン媒介タンパク質スプライシング前のインテイン含有タンパク質)は、2つの遺伝子に由来する。そのようなインテインは、本明細書中ではスプリット(分割)インテイン(例えば、スプリットインテイン-N及びスプリットインテイン-C)と呼ばれる。例えば、シアノバクテリアでは、DNAポリメラーゼIIIの触媒サブユニットaであるDnaEは、2つの別々の遺伝子dnaE-n及びdnaE-cによってコードされる。dnaE-n遺伝子によってコードされるインテインは、本明細書中では「インテイン-N」と呼ばれ得る。dnaE-c遺伝子によってコードされるインテインは、本明細書中では「インテイン-C」と呼ばれ得る。
他のインテイン系もまた、使用することができる。例えば、dnaEインテインに基づく合成インテイン、Cfa-N(例えば、スプリットインテイン-N)及びCfa-C(例えば、スプリットインテイン-C)インテインペアが記載されている(例えば、参照により本明細書に援用されるStevens et al., J Am Chem Soc. 2016 Feb. 24; 138 (7): 2162-5)。本開示に従って使用され得るインテインペアの非限定的な例として: Cfa DnaEインテイン、Spp GyrBインテイン、Spp DnaXインテイン、Ter DnaE3インテイン、Ter ThyXインテイン、Rma DnaBインテイン及びCne Prp8インテイン(例えば、参照により本明細書に援用される米国特許第8,394,604号に記載されている)が挙げられる。
インテインの例示的なヌクレオチド配列及びアミノ酸配列を示す。
DnaEインテイン-N DNA:
TGCCTGTCATACGAAACCGAGATACTGACAGTAGAATATGGCCTTCTGCCAATCGGGAAGATTGTGGAGAAACGGATAGAATGCACAGTTTACTCTGTCGATAACAATGGTAACATTTATACTCAGCCAGTTGCCCAGTGGCACGACCGGGGAGAGCAGGAAGTATTCGAATACTGTCTGGAGGATGGAAGTCTCATTAGGGCCACTAAGGACCACAAATTTATGACAGTCGATGGCCAGATGCTGCCTATAGACGAAATCTTTGAGCGAGAGTTGGACCTCATGCGAGTTGACAACCTTCCTAAT
DnaEインテイン-Nタンパク質:
CLSYETEILTVEYGLLPIGKIVEKRIECTVYSVDNNGNIYTQPVAQWHDR GEQEVFEYCLEDGSLIRATKDHKFMTVDGQMLPIDEIFERELDLMRVDNL PN
DnaEインテイン-CDNA:
ATGATCAAGATAGCTACAAGGAAGTATCTTGGCAAACAAAACGTTTATGA TATTGGAGTCGAAAGAGATCACAACTTTGCTCTGAAGAACGGATTCATAG CTTCTAAT
インテイン-C:
MIKIATRKYLGKQNVYDIGVERDHNFALKNGFIASN
Cfa-N DNA:
TGCCTGTCTTATGATACCGAGATACTTACCGTTGAATATGGCTTCTTGCCTATTGGAAAGATTGTCGAAGAGAGAATTGAATGCACAGTATATACTGTAGACAAGAATGGTTTCGTTTACACACAGCCCATTGCTCAATGGCACAATCGCGGCGAACAAGAAGTATTTGAGTACTGTCTCGAGGATGGAAGCATCATACGAGCAACTAAAGATCATAAATTCATGACCACTGACGGGCAGATGTTGCCAATAGATGAGATATTCGAGCGGGGCTTGGATCTCAAACAAGTGGATGGATTGCCA
Cfa-Nタンパク質:
CLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGLDLKQVDGLP
Cfa-C DNA:
ATGAAGAGGACTGCCGATGGATCAGAGTTTGAATCTCCCAAGAAGAAGAGGAAAGTAAAGATAATATCTCGAAAAAGTCTTGGTACCCAAAATGTCTATGATATTGGAGTGGAGAAAGATCACAACTTCCTTCTCAAGAACGGTCTCGTAGCCAGCAAC
Cfa-Cタンパク質:
MKRTADGSEFESPKKKRKVKIISRKSLGTQNVYDIGVEKDHNFLLKNGLVASN
スプリットCas9のN末端部分とスプリットCas9のC末端部分とを結合させるために、インテイン-N及びインテイン-Cを、それぞれ、スプリットCas9のN末端部分及びスプリットCas9のC末端部分に融合させてもよい。例えば、いくつかの実施形態では、インテイン-Nを、スプリットCas9のN末端部分のC末端に融合させ、すなわち、N--[スプリットCas9のN末端部分]-[インテイン-N]--Cの構造を形成させる。いくつかの実施形態では、インテイン-Cを、スプリットCas9のC末端部分のN末端に融合させ、すなわち、N-[インテイン-C]--[スプリットCas9のC末端部分]-Cの構造を形成させる。インテインを融合させるタンパク質(例えば、スプリットCas9)を結合するための、インテイン媒介性のタンパク質スプライシング機構は、例えば、参照により本明細書に援用されるShah et al., Chem Sci. 2014; 5 (1): 446-461に記載されているように、当技術分野で公知である。インテインを設計し、使用するための方法は当技術分野で公知であり、例えば、WO2014004336、WO2017132580、US20150344549、及びUS20180127780に記載されており、これらのそれぞれは、その全体が参照により本明細書に援用される。
用語「単離された」、「精製された」、または「生物学的に純粋な」とは、天然状態で認められるように通常それに付随する成分から、様々な程度において除かれている物質を指す。「単離する」とは、元の供給源または周囲からの分離の程度を示す。「精製する」とは、単離よりも高い分離度を示す。「精製された」または「生物学的に純粋な」タンパク質は、不純物がタンパク質の生物学的特性に実質的に影響を与えたり、他の悪影響を引き起こしたりすることはないほど十分に、他の物質が除かれている。すなわち、本発明の核酸またはペプチドは、組換えDNA技術によって生成される場合、細胞物質、ウイルス物質、もしくは培養培地を実質的に含まず、または化学的に合成される場合、化学前駆体もしくは他の化学物質を実質的に含まなければ、精製されている。純度及び均一性は、通常、分析化学技術、例えば、ポリアクリルアミドゲル電気泳動または高速液体クロマトグラフィーを使用して測定される。用語「精製された」とは、核酸またはタンパク質が電気泳動ゲルにおいて本質的に1つのバンドを生じさせることを示し得る。リン酸化またはグリコシル化などの修飾に供され得るタンパク質の場合、異なる修飾は、別々に精製することができる異なる単離されたタンパク質を生じさせ得る。
「単離されたポリヌクレオチド」とは、本発明の核酸分子が由来する生物の天然ゲノムにおいて遺伝子に隣接する遺伝子を、含まない核酸(例えば、DNA)を意味する。したがって、この用語には、例えば、ベクターに組み込まれる組換えDNA; 自律的に複製するプラスミドまたはウイルスに組み込まれる組換えDNA; または原核生物もしくは真核生物のゲノムDNAに組み込まれる組換えDNA; または、他の配列とは独立した別個の分子(例えば、PCRまたは制限エンドヌクレアーゼ消化によって生成されるcDNAまたはゲノム断片もしくはcDNA断片)として存在する組換えDNAが含まれる。さらに、この用語には、DNA分子から転写されるRNA分子、及び追加のポリペプチド配列をコードするハイブリッド遺伝子の一部である組換えDNAが含まれる。
「単離されたポリペプチド」とは、それに天然に付随する成分から分離された本発明のポリペプチドを意味する。一般的には、ポリペプチドは、それが天然に付随するところのタンパク質及び天然の有機分子が少なくとも60重量%除去されている場合に、単離されている。好ましくは、製剤は、少なくとも75重量%、より好ましくは少なくとも90重量%、最も好ましくは少なくとも99重量%の本発明のポリペプチドである。本発明の単離されたポリペプチドを、例えば、天然の供給源からの抽出によって、そのようなポリペプチドをコードする組換え核酸の発現によって; またはタンパク質を化学的に合成することによって取得してもよい。純度は、適切な方法、例えば、カラムクロマトグラフィー、ポリアクリルアミドゲル電気泳動、またはHPLC分析によって測定することができる。
本明細書中で使用する用語「リンカー」とは、2つの分子もしくは部分、例えば、タンパク質複合体もしくはリボヌクレオ複合体の2つの成分、または融合タンパク質の2つのドメイン、例えば、ポリヌクレオチドプログラム可能なDNA結合ドメイン(例えば、dCas9)及びデアミナーゼドメイン((例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)を連結する、共有結合性リンカー(例えば共有結合)、非共有結合リンカー、化学基、あるいは分子を指し得る。リンカーは、塩基エディターシステムの様々な成分または成分の異なる部分を結合することができる。例えば、いくつかの実施形態では、リンカーは、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインのガイドポリヌクレオチド結合ドメインとデアミナーゼの触媒ドメインを結合することができる。いくつかの実施形態では、リンカーは、CRISPRポリペプチドとデアミナーゼを結合することができる。いくつかの実施形態では、リンカーは、Cas9とデアミナーゼを結合することができる。いくつかの実施形態では、リンカーは、dCas9とデアミナーゼを結合することができる。いくつかの実施形態では、リンカーは、nCas9とデアミナーゼを結合することができる。いくつかの実施形態では、リンカーは、ガイドポリヌクレオチドとデアミナーゼを結合することができる。いくつかの実施形態では、リンカーは、塩基エディターシステムの脱アミノ化成分とポリヌクレオチドプログラム可能なヌクレオチド結合成分を結合することができる。いくつかの実施形態では、リンカーは、塩基エディターシステムの脱アミノ化成分のRNA結合部分とポリヌクレオチドプログラム可能なヌクレオチド結合成分を結合することができる。いくつかの実施形態では、リンカーは、塩基エディターシステムの脱アミノ化成分のRNA結合部分とポリヌクレオチドプログラム可能なヌクレオチド結合成分のRNA結合部分を結合することができる。リンカーは、2つの基、分子、または他の部分の間に位置するか、それらに隣接し、共有結合または非共有結合相互作用を介してそれぞれに接続し、したがって2つを接続することができる。いくつかの実施形態では、リンカーは、有機分子、基、重合体、または化学部分であり得る。いくつかの実施形態では、リンカーは、ポリヌクレオチドであり得る。いくつかの実施形態では、リンカーは、DNAリンカーであり得る。いくつかの実施形態では、リンカーは、RNAリンカーであり得る。いくつかの実施形態では、リンカーは、リガンドに結合することができるアプタマーを含み得る。いくつかの実施形態では、リガンドは、炭水化物、ペプチド、タンパク質、または核酸であり得る。いくつかの実施形態では、リンカーは、リボスイッチに由来し得るアプタマーを含み得る。アプタマーが由来するリボスイッチは、テオフィリンリボスイッチ、チアミンピロリン酸(TPP)リボスイッチ、アデノシンコバラミン(AdoCbl)リボスイッチ、S-アデノシルメチオニン(SAM)リボスイッチ、SAHリボスイッチ、フラビンモノヌクレオチド(FMN)リボスイッチ、テトラヒドロ葉酸リボスイッチ、リジンリボスイッチ、グリシンリボスイッチ、プリンリボスイッチ、GlmSリボスイッチ、またはプレクオシン1(PreQ1)リボスイッチから選択され得る。いくつかの実施形態では、リンカーは、ポリペプチドリガンドなどのポリペプチドまたはタンパク質ドメインに結合したアプタマーを含み得る。いくつかの実施形態では、ポリペプチドリガンドは、Kホモロジー(KH)ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、ステライルαモチーフ、テロメラーゼKu結合モチーフ及びKuタンパク質、テロメラーゼSm7結合モチーフ及びSm7タンパク質、またはRNA認識モチーフであり得る。いくつかの実施形態では、ポリペプチドリガンドは、塩基エディターシステム成分の一部であり得る。例えば、核酸塩基編集成分は、デアミナーゼドメイン及びRNA認識モチーフを含み得る。
いくつかの実施形態では、リンカーは、1つのアミノ酸または複数のアミノ酸(例えば、ペプチドまたはタンパク質)であり得る。いくつかの実施形態では、リンカーは、長さが約5~100アミノ酸、例えば、約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、20~30、30~40、40~50、50~60、60~70、70~80、80~90、または90~100アミノ酸の長さであり得る。いくつかの実施形態では、リンカーは、長さが約100~150、150~200、200~250、250~300、300~350、350~400、400~450、または450~500アミノ酸であり得る。より長いかまたはより短いリンカーもまた使用され得る。より長いかまたはより短いリンカーもまた企図される。いくつかの実施形態では、リンカーは、アミノ酸配列SGSETPGTSESATPESを含み、これはXTENリンカーとも呼ばれ得る。いくつかの実施形態では、リンカーは、アミノ酸配列SGGSを含む。いくつかの実施形態では、リンカーは、(SGGS)n、(GGGS)n、(GGGGS)n、(G)n、(EAAAK)n、(GGS)n、SGSETPGTSESATPES、もしくは(XP)nモチーフ、またはこれらのいずれかの組み合わせを含み、配列中、nは、独立して1~30の整数であり、Xは、任意のアミノ酸である。いくつかの実施形態では、nは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、または15である。いくつかの実施形態では、リンカーは、複数のプロリン残基を含み、長さは5~21、5~14、5~9、5~7アミノ酸であり、例えば、PAPAP、PAPAPA、PAPAPAP、PAPAPAPA、P(AP)4、P(AP)7、P(AP)10である。そのようなプロリンリッチリンカーは、「リジッド」リンカーとも呼ばれる。
いくつかの実施形態では、リンカーは、Cas9ヌクレアーゼドメインを含む、RNAプログラム可能なヌクレアーゼのgRNA結合ドメインと、核酸編集タンパク質(例えば、シチジンデアミナーゼまたはアデノシンデアミナーゼ)の触媒ドメインを結合する。いくつかの実施形態では、リンカーは、dCas9と核酸編集タンパク質を結合する。例えば、リンカーは、2つの基、分子、または他の部分の間に位置するか、それらに隣接し、共有結合を介してそれぞれに接続し、したがって2つを接続する。いくつかの実施形態では、リンカーは、1つのアミノ酸または複数のアミノ酸(例えば、ペプチドまたはタンパク質)である。いくつかの実施形態では、リンカーは、有機分子、基、重合体、または化学部分である。いくつかの実施形態では、リンカーは、長さが5~200アミノ酸、例えば、長さが5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、35、45、50、55、60、60、65、70、70、75、80、85、90、90、95、100、101、102、103、104、105、110、120、130、140、150、160、175、180、190、または200アミノ酸である。
いくつかの実施形態では、塩基エディターのドメインを、SGGSSGSETPGTSESATPESSGGS、SGGSSGGSSGSETPGTSESATPESSGGSSGGS、またはGGSGGSPGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTE PSEGSAPGTSTEPSEGSAPGTSESATPESGPGSEPATSGGSGGSのアミノ酸配列を含むリンカーを介して融合させる。いくつかの実施形態では、塩基エディターのドメインを、XTENリンカーとも呼ばれ得るアミノ酸配列SGSETPGTSESATPESを含むリンカーを介して融合させる。いくつかの実施形態では、リンカーは、24アミノ酸の長さである。いくつかの実施形態では、リンカーは、アミノ酸配列SGGSSGGSSGSETPGTSESATPESを含む。いくつかの実施形態では、リンカーは、40アミノ酸の長さである。いくつかの実施形態では、リンカーは、アミノ酸配列SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGGSSGGSを含む。いくつかの実施形態では、リンカーは、64アミノ酸の長さである。いくつかの実施形態では、リンカーは、アミノ酸配列SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGGSSGGSSGSETPGTSESATPESSGGS SGGSを含む。いくつかの実施形態では、リンカーは、92アミノ酸の長さである。いくつかの実施形態では、リンカーは、アミノ酸配列PGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGSEPATSを含む。
「マーカー」とは、疾患または障害に関連して発現レベルまたは活性が変化する任意のタンパク質またはポリヌクレオチドを意味する。
本明細書中で使用する用語「変異」とは、配列(例えば核酸またはアミノ酸配列)内の残基の、別の残基による置換、または配列内の1つ以上の残基の欠失もしくは挿入を指す。変異は、通常、元の残基を明らかにし、続いて配列内の残基の位置を明らかにし、そして新たに置換された残基を明らかにすることによって、本明細書に記載される。本明細書中で提供されるアミノ酸置換(変異)を行うための様々な方法は当技術分野で周知であり、例えば、Green and Sambrook, Molecular Cloning: A Laboratory Manual (4th ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (2012))に記載されている。いくつかの実施形態では、本開示の塩基エディターは、有意な数の意図しない変異、例えば、意図しない点変異を生成することなく、核酸(例えば、対象のゲノム内の核酸)内に、点変異などの「意図する変異」を効率的に生成することができる。いくつかの実施形態では、意図される変異は、その意図される変異を生成するように特別に設計されたガイドポリヌクレオチド(例えば、gRNA)に結合した特定の塩基エディター(例えば、シチジン塩基エディターまたはアデノシン塩基エディター)によって生成される変異である。
一般的に、配列(例えば、本明細書に記載のアミノ酸配列)内で作成または同定される変異は、参照(または野生型)配列、すなわち、変異を含まない配列に関連して付番される。当業者であれば、参照配列に対するアミノ酸配列及び核酸配列の変異の位置を決定する方法を容易に理解するであろう。
用語「非保存的変異」には、例えば、トリプトファンからリジン、セリンからフェニルアラニンなど、異なるグループ間のアミノ酸置換が含まれる。この場合、非保存的アミノ酸置換は、機能的バリアントの生物学的活性を妨害したり阻害したりしないことが好ましい。非保存的アミノ酸置換は、機能的バリアントの生物学的活性を増強し得、その結果、機能的バリアントの生物学的活性は、野生型タンパク質に比べて増加する。
用語「核局在化配列」、「核局在化シグナル」、または「NLS」とは、細胞核へのタンパク質の輸入を促進するアミノ酸配列を指す。核局在化配列は当技術分野で公知であり、例えば、2000年11月23日に出願され、2001年5月31日にWO/2001/038547として公開されたPlank et al.,国際PCT出願、PCT/EP2000/011690に記載されており、その内容は、例示的な核局在化配列を開示するために参照により本明細書に援用される。他の実施形態では、NLSは、例えば、Koblan et al., Nature Biotech. 2018 doi: 10.1038/nbt.4172によって記載された最適化されたNLSである。いくつかの実施形態では、NLSは、アミノ酸配列KRTADGSEFESPKKKRKV、KRPAATKKAGQAKKKK、KKTELQTTNAENKTKKL、KRGINDRNFWRGENGRKTR、RKSGKIAAIVVKRPRK、PKKKRKV、またはMDSLLMNRRKFLYQFKNVRWAKGRRETYLCを含む。
本明細書中で同じ意味で使用される用語「核酸塩基」、「窒素塩基」、または「塩基」とは、ヌクレオチドの成分であるヌクレオシドを形成する窒素含有生体化合物を指す。核酸塩基が塩基対を形成し、互いに積み重なる能力は、リボ核酸(RNA)やデオキシリボ核酸(DNA)などの長鎖らせん構造を直接的に生じさせる。5つの核酸塩基(アデニン(A)、シトシン(C)、グアニン(G)、チミン(T)、及びウラシル(U))は、一次核酸塩基または標準核酸塩基と呼ばれる。アデニンとグアニンはプリンに由来し、シトシン、ウラシル、及びチミンはピリミジンに由来する。DNA及びRNAには、修飾された他の(非一次)塩基を含めることもできる。非限定的な例示的な修飾核酸塩基には、ヒポキサンチン、キサンチン、7-メチルグアニン、5,6-ジヒドロウラシル、5-メチルシトシン(m5C)、及び5-ヒドロメチルシトシンが含まれ得る。ヒポキサンチンとキサンチンは、変異原物質の存在によって生成され、どちらも脱アミノ化(アミン基のカルボニル基への置換)によって生成され得る。ヒポキサンチンは、アデニンから修飾することができる。キサンチンは、グアニンから修飾することができる。ウラシルは、シトシンの脱アミノ化から生じ得る。「ヌクレオシド」は、核酸塩基と五炭素糖(リボースまたはデオキシリボースのいずれか)からなる。ヌクレオシドの例として、アデノシン、グアノシン、ウリジン、シチジン、5-メチルウリジン(m5U)、デオキシアデノシン、デオキシグアノシン、チミジン、デオキシウリジン、及びデオキシシチジンが挙げられる。核酸塩基が修飾されたヌクレオシドの例として、イノシン(I)、キサントシン(X)、7-メチルグアノシン(m7G)、ジヒドロウリジン(D)、5-メチルシチジン(m5C)、及びシュードウリジン(Ψ)が挙げられる。「ヌクレオチド」は、核酸塩基、五炭素糖(リボースまたはデオキシリボースのいずれか)、及び少なくとも1つのリン酸基からなる。
本明細書中で使用する用語「核酸」及び「核酸分子」とは、核酸塩基及び酸性部分を含む化合物、例えば、ヌクレオシド、ヌクレオチド、またはヌクレオチドの重合体を指す。通常、高分子核酸、例えば、3つ以上のヌクレオチドを含む核酸分子は直鎖状分子であり、隣接するヌクレオチドがホスホジエステル結合を介して互いに連結されている。いくつかの実施形態では、「核酸」は、個々の核酸残基(例えば、ヌクレオチド及び/またはヌクレオシド)を指す。いくつかの実施形態では、「核酸」は、3つ以上の個々のヌクレオチド残基を含むオリゴヌクレオチド鎖を指す。本明細書中で使用する場合、用語「オリゴヌクレオチド」及び「ポリヌクレオチド」とは、ヌクレオチドの重合体(例えば、少なくとも3つのヌクレオチドのストリング)を指すために同じ意味で用いられ得る。いくつかの実施形態では、「核酸」は、RNAならびに一本鎖及び/または二本鎖DNAを包含する。核酸は、例えば、ゲノム、転写産物、mRNA、tRNA、rRNA、siRNA、snRNA、プラスミド、コスミド、染色体、クロマチド、または他の天然の核酸分子の状況下で、天然に生じ得る。一方、核酸分子は、非天然の分子、例えば、組換えDNAもしくはRNA、人工染色体、改変されたゲノム、またはその断片、あるいは合成DNA、RNA、DNA/RNAハイブリッドであり得るか、または非天然のヌクレオチドもしくはヌクレオシドを含み得る。さらに、「核酸」、「DNA」、「RNA」、及び/または同様の用語には、核酸類似体、例えば、ホスホジエステル骨格以外を有する類似体が含まれる。核酸は、天然の供給源から精製することができ、組換え発現系を使用して生成し、例えば、任意選択で精製したり化学合成したりすることができる。必要に応じて、例えば、化学的に合成された分子の場合、核酸は、化学的に修飾された塩基または糖を有する類似体などのヌクレオシド類似体、及び骨格修飾を含み得る。核酸配列は、特に明記しない限り、5’から3’方向に提示される。いくつかの実施形態では、核酸は、天然のヌクレオシド(例えば、アデノシン、チミジン、グアノシン、シチジン、ウリジン、デオキシアデノシン、デオキシチミジン、デオキシグアノシン、及びデオキシシチジン); ヌクレオシド類似体(例えば、2-アミノアデノシン、2-チオチミジン、イノシン、ピロロ-ピリミジン、3-メチルアデノシン、5-メチルシチジン、2-アミノアデノシン、C5-ブロモウリジン、C5-フルオロウリジン、C5-ヨードウリジン、C5-プロピニル-ウリジン、C5-プロピニル-シチジン、C5-メチルシチジン、2-アミノアデノシン、7-デアザアデノシン、7-デアザグアノシン、8-オキソアデノシン、8-オキソグアノシン、O(6)-メチルグアニン、及び2-チオシチジン); 化学的に修飾された塩基; 生物学的に修飾された塩基(例えば、メチル化された塩基); インターカレートされた塩基; 修飾された糖(2’-例えば、フルオロリボース、リボース、2’-デオキシリボース、アラビノース、及びヘキソース);及び/または修飾されたリン酸基(例えば、ホスホロチオエート及び5’-N-ホスホルアミダイト結合)であるか、またはそれらを含む。
用語「核酸プログラム可能なDNA結合タンパク質」または「napDNAbp」は、「ポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン」と同じ意味で用いられる場合があり、napDNAbpを特定の核酸配列に誘導するガイド核酸またはガイドポリヌクレオチド(例えば、gRNA)などの核酸(例えば、DNAまたはRNA)と結合するタンパク質を指す。いくつかの実施形態では、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、ポリヌクレオチドプログラム可能なDNA結合ドメインである。いくつかの実施形態では、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインはポリヌクレオチドプログラム可能なRNA結合ドメインである。いつかの実施形態では、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインはCas9タンパク質である。Cas9タンパク質は、ガイドRNAに相補的な特定のDNA配列にCas9タンパク質をガイドするガイドRNAと結合することができる。いくつかの実施形態では、napDNAbpは、Cas9ドメイン、例えば、ヌクレアーゼ活性Cas9、Cas9ニッカーゼ(nCas9)、またはヌクレアーゼ不活性Cas9(dCas9)である。核酸プログラム可能なDNA結合タンパク質の非限定的な例として、Cas9(例えば、dCas9及びnCas9)、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i、及びCas12j/CasΦが挙げられる。Cas酵素の非限定的な例として、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5d、Cas5t、Cas5h、Cas5a、Cas6、Cas7、Cas8、Cas8a、Cas8b、Cas8c、Cas9(Csn1またはCsx12としても知られる)、Cas10、Cas10d、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i、Cas12j/CasΦ、Csy1、Csy2、Csy3、Csy4、Cse1、Cse2、Cse3、Cse4、Cse5e、Csc1、Csc2、Csa5、Csn1、Csn2、Csm1、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx1S、Csx11、Csf1、Csf2、CsO、Csf4、Csd1、Csd2、Cst1、Cst2、Csh1、Csh2、Csa1、Csa2、Csa3、Csa4、Csa5、II型Casエフェクタータンパク質、V型Casエフェクタータンパク質、VI型Casエフェクタータンパク質、CARF、DinG、その相同体、またはその修飾もしくは改変バージョンが挙げられる。他の核酸プログラム可能なDNA結合タンパク質もまた、本開示の範囲内であるが、それらは、本開示に具体的に記載されていない可能性がある。例えば、Makarova et al. “Classification and Nomenclature of CRISPR-Cas Systems: Where from Here?” CRISPR J.2018 Oct; 1:325-336. doi: 10.1089/crispr.2018.0033; Yan et al., “Functionally diverse type V CRISPR-Cas systems” Science.2019 Jan 4; 363 (6422): 88-91. doi:10.1126/science.aav7271を参照されたい(それぞれの全内容が参照により本明細書に援用される)。
本明細書中で使用する用語「核酸塩基編集ドメイン」または「核酸塩基編集タンパク質」とは、RNAまたはDNAにおける核酸塩基修飾、例えば、シトシン(またはシチジン)からウラシル(またはウリジン)またはチミン(またはチミジン)へ、及びアデニン(またはアデノシン)からヒポキサンチン(またはイノシン)への脱アミノ化、ならびに鋳型不在でヌクレオチドの付加及び挿入を触媒することができるタンパク質または酵素を指す。いくつかの実施形態では、核酸塩基編集ドメインは、デアミナーゼドメイン(例えば、アデニンデアミナーゼまたはアデノシンデアミナーゼ; またはシチジンデアミナーゼまたはシトシンデアミナーゼ)である。いくつかの実施形態では、核酸塩基編集ドメインは、複数のデアミナーゼドメイン(例えば、アデニンデアミナーゼもしくはアデノシンデアミナーゼまたはシチジンデアミナーゼもしくはシトシンデアミナーゼ)である。いくつかの実施形態では、核酸塩基編集ドメインは、天然の核酸塩基編集ドメインであり得る。いくつかの実施形態では、核酸塩基編集ドメインは、天然の核酸塩基編集ドメインから改変するか、または進化させた核酸塩基編集ドメインであり得る。核酸塩基編集ドメインは、細菌、ヒト、チンパンジー、ゴリラ、サル、ウシ、イヌ、ラット、またはマウスなどの任意の生物に由来し得る。
本明細書中で使用する場合、「薬剤の入手」における「入手」には、薬剤の合成、購入、または他の方法での入手が含まれる。
本明細書中で使用する「患者」または「対象」は、疾患もしくは障害を有するか、または発症するリスクがあるか、または罹患もしくは発症する疑いがあると診断された哺乳類対象または個体を指す。いくつかの実施形態では、用語「患者」とは、疾患または障害を発症する可能性が平均よりも高い哺乳類対象を指す。例示的な患者は、本明細書に開示する療法から恩恵を得ることができる、ヒト、非ヒト霊長類、ネコ、イヌ、ブタ、ウシ、ネコ、ウマ、ラクダ、ラマ、ヤギ、ヒツジ、げっ歯類(例えば、マウス、ウサギ、ラット、またはモルモット)及び他の哺乳類であり得る。例示的なヒト患者は、男性及び/または女性であり得る。
「それを必要とする患者」または「それを必要とする対象」とは、本明細書中では、疾患もしくは障害を有するか、リスクがあるか、または有していると診断されたか、有すると予め決定されたか、あるいは有すると疑われる患者を指す。
用語「病原性変異」、「病原性バリアント」、「病原変異」、「病原バリアント」、「有害変異」、または「素因となる変異」とは、特定の疾患または障害に対する個体の感受性または素因を増加させる遺伝的変化または変異を指す。いくつかの実施形態では、病原性変異は、遺伝子によってコードされるタンパク質において少なくとも1つの野生型アミノ酸が少なくとも1つの病原性アミノ酸によって置換されたものを含む。
用語「タンパク質」、「ペプチド」、「ポリペプチド」、及びそれらの文法上の同等物は、本明細書中では同じ意味で使用され、ペプチド(アミド)結合によって一緒に連結されたアミノ酸残基の重合体を指す。これらの用語は、任意のサイズ、構造、または機能のタンパク質、ペプチド、またはポリペプチドを指す。通常、タンパク質、ペプチド、またはポリペプチドは、長さが少なくとも3アミノ酸である。タンパク質、ペプチド、またはポリペプチドは、個々のタンパク質またはタンパク質の集合を指し得る。タンパク質、ペプチド、またはポリペプチド中の1つ以上のアミノ酸は、化学実体、例えば、炭水化物基、ヒドロキシル基、リン酸基、ファルネシル基、イソファルネシル基、脂肪酸基、結合、官能化、または他の修飾のためのリンカーなどの付加により修飾することができる。タンパク質、ペプチド、またはポリペプチドはまた、単一分子であり得るか、または多分子複合体であり得る。タンパク質、ペプチド、またはポリペプチドは、天然のタンパク質またはペプチドの単なる断片であり得る。タンパク質、ペプチド、またはポリペプチドは、天然の、組換え、もしくは合成、またはそれらの任意の組み合わせであり得る。本明細書中で使用する用語「融合タンパク質」とは、少なくとも2つの異なるタンパク質に由来するタンパク質ドメインを含むハイブリッドポリペプチドを指す。1つのタンパク質を、融合タンパク質のアミノ末端(N末端)部分またはカルボキシ末端(C末端)タンパク質に配置し、したがって、それぞれ、アミノ末端融合タンパク質またはカルボキシ末端融合タンパク質を形成することができる。タンパク質は、異なるドメイン、例えば、核酸結合ドメイン(例えば、タンパク質の標的部位への結合を誘導するCas9のgRNA結合ドメイン)及び核酸切断ドメイン、または核酸編集タンパク質の触媒ドメインを含み得る。いくつかの実施形態では、タンパク質は、タンパク質性部分、例えば、核酸結合ドメインを構成するアミノ酸配列、及び有機化合物、例えば、核酸切断剤として作用することができる化合物を含む。いくつかの実施形態では、タンパク質は、核酸、例えば、RNAまたはDNAと複合体を形成しているか、またはそれらと会合している。本明細書中で提供するタンパク質のいずれも、当技術分野で公知の任意の方法によって生成することができる。例えば、本明細書中で提供するタンパク質を、組換えタンパク質の発現及び精製を介して生成することができ、これは、ペプチドリンカーを含む融合タンパク質に特に適している。組換えタンパク質の発現及び精製の方法は周知であり、Green and Sambrook, Molecular Cloning: A Laboratory Manual (4th ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.(2012))に記載されている方法が含まれ、その全内容は、参照により本明細書に援用される。
本明細書に開示するポリペプチド及びタンパク質(その機能的部分及び機能的バリアントを含む)は、1つ以上の天然アミノ酸の代わりに合成アミノ酸を含むことができる。そのような合成アミノ酸は当技術分野で公知であり、例えば、アミノシクロヘキサンカルボン酸、ノルロイシン、α-アミノn-デカン酸、ホモセリン、S-アセチルアミノメチル-システイン、トランス-3-及びトランス-4-ヒドロキシプロリン、4-アミノフェニルアラニン、4-ニトロフェニルアラニン、4-クロロフェニルアラニン、4-カルボキシフェニルアラニン、β-フェニルセリンβ-ヒドロキシフェニルアラニン、フェニルグリシン、α-ナフチルアラニン、シクロヘキシルアラニン、シクロヘキシルグリシン、インドリン-2-カルボン酸、1,2,3,4-テトラヒドロイソキノリン-3-カルボン酸、アミノマロン酸、アミノマロン酸モノアミド、N’-ベンジル-N’-メチル-リジン、N’,N’-ジベンジル-リジン、6-ヒドロキシリジン、オルニチン、α-アミノシクロペンタンカルボン酸、α-アミノシクロヘキサンカルボン酸、α-アミノシクロヘプタンカルボン酸、α-(2-アミノ-2-ノルボルナン)-カルボン酸、α,γ-ジアミノ酪酸、α,β-ジアミノプロピオン酸、ホモフェニルアラニン、及びα-tert-ブチルグリシンが挙げられる。ポリペプチド及びタンパク質は、ポリペプチド構築物の1つ以上のアミノ酸の翻訳後修飾を伴うことができる。翻訳後修飾の非限定的な例として、リン酸化、アセチル化及びホルミル化を含むアシル化、グリコシル化(N-結合及びO-結合を含む)、アミド化、ヒドロキシル化、メチル化及びエチル化を含むアルキル化、ユビキチン化、ピロリドンカルボン酸の付加、ジスルフィド架橋の形成、硫酸化、ミリストイル化、パルミトイル化、イソプレニル化、ファルネシル化、ゲラニル化、グリピエーション、リポイル化及びヨウ素化が挙げられる。
タンパク質または核酸に関して本明細書中で使用する用語「組換え」とは、自然界には存在しないが、人間工学の産物であるタンパク質または核酸を指す。例えば、いくつかの実施形態では、組換えタンパク質または核酸分子は、任意の天然の配列と比較して、少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、少なくとも5つ、少なくとも6つ、または少なくとも7つの変異を含むアミノ酸またはヌクレオチド配列を含む。
「減少」とは、少なくとも10%、25%、50%、75%、または100%の負の変化を意味する。
「参照」とは、標準または対照の条件を意味する。一実施形態では、参照は、野生型または健常な細胞である。他の実施形態では、限定されないが、参照は、試験条件に供されないか、またはプラセボもしくは通常の生理食塩水、培地、緩衝液、及び/または目的のポリヌクレオチドを有さない対照ベクターに供される未処理の細胞である。
「参照配列」とは、配列比較の基礎として使用される規定の配列である。参照配列は、指定の配列のサブセットまたは全体; 例えば、全長のcDNAもしくは遺伝子配列のセグメント、または完全なcDNAもしくは遺伝子配列であってもよい。ポリペプチドの場合、参照ポリペプチド配列の長さは、一般的に、少なくとも約16アミノ酸、少なくとも約20アミノ酸、少なくとも約25アミノ酸、約35アミノ酸、約50アミノ酸、または約100アミノ酸である。核酸の場合、参照核酸配列の長さは、一般的に、少なくとも約50ヌクレオチド、少なくとも約60ヌクレオチド、少なくとも約75ヌクレオチド、約100ヌクレオチド、または約300ヌクレオチド、またはその周辺またはそれらの間の任意の整数である。いくつかの実施形態では、参照配列は、目的のタンパク質の野生型配列である。他の実施形態では、参照配列は、野生型タンパク質をコードするポリヌクレオチド配列である。
用語「RNAプログラム可能なヌクレアーゼ」及び「RNAガイドヌクレアーゼ」は、切断の標的ではない1つ以上のRNA(複数可)と共に使用される(例えば、結合または会合させる)。いくつかの実施形態では、RNAプログラム可能なヌクレアーゼは、RNAとの複合体にある場合、ヌクレアーゼ:RNA複合体と呼ばれ得る。通常、結合したRNAはガイドRNA(gRNA)と呼ばれる。いくつかの実施形態では、RNAプログラム可能なヌクレアーゼは、(CRISPR会合系)Cas9エンドヌクレアーゼ、例えば、Streptococcus pyogenes由来のCas9(Csn1)である(例えば、“Complete genome sequence of an M1 strain of Streptococcus pyogenes.” Ferretti J. J. et al., Proc. Natl. Acad. Sci. U.S.A. 98: 4658-4663 (2001); “CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III.” Deltcheva E.et al., Nature 471: 602-607 (2011)を参照のこと)。
RNAプログラム可能なヌクレアーゼ(例えば、Cas9)は、RNA:DNAハイブリダイゼーションを使用してDNA切断部位を標的化するため、これらのタンパク質は、原則として、ガイドRNAで指定される任意の配列を標的とすることができる。部位特異的切断(例えば、ゲノムを改変するための)のために、Cas9などのRNAプログラム可能なヌクレアーゼを使用する方法は、当技術分野で公知である(例えば、Cong, L. et al, Multiplex genome engineering using CRISPR/Cas systems. Science 339, 819-823 (2013); Mali, P. et al, RNA-guided human genome engineering via Cas9. Science 339,823-826(2013); Hwang, W.Y. et al, Efficient genome editing in zebrafish using a CRISPR-Cas system. Nature biotechnology 31, 227-229 (2013); Jinek, M. et al, RNA-programmed genome editing in human cells. eLife 2, e00471(2013); Dicarlo, J. E. et al, Genome engineering in Saccharomyces cerevisiae using CRISPR-Cas systems. Nucleic acids research (2013); Jiang, W. et al RNA-guided editing of bacterial genomes using CRISPR-Cas systems. Nature biotechnology 31, 233-239 (2013)を参照されたい(それぞれの全内容が参照により本明細書に援用される))。
用語「一塩基多型(SNP)」とは、ゲノムの特定の位置で生じる単一ヌクレオチドのバリエーションであり、各バリエーションは、集団内にかなりの程度(例えば、>1%)存在する。例えば、ヒトゲノムの特定の塩基位置では、Cヌクレオチドが多くの個体に出現し得るが、少数の個体では、その位置がAで占められている。これは、この特定の位置にSNPが存在することを意味し、2つの可能なヌクレオチドのバリエーション、CまたはAは、この位置のアリールであると称される。SNPは、疾患に対する感受性の違いの根底にある。疾患の重症度及び体が治療に応答する態様も、遺伝的バリエーションの現れである。SNPは、遺伝子のコード領域、遺伝子の非コード領域、または遺伝子間領域(遺伝子間の領域)に存在し得る。いくつかの実施形態では、コード配列内のSNPは、遺伝暗号の縮重のために、生成されるタンパク質のアミノ酸配列を必ずしも変化させない。コード領域のSNPには、同義SNPと非同義SNPの2種類がある。同義SNPはタンパク質配列に影響を与えないが、非同義SNPはタンパク質のアミノ酸配列を変化させる。非同義SNPには、ミスセンスとナンセンスの2つのタイプがある。タンパク質コード領域にないSNPはさらに、遺伝子スプライシング、転写因子結合、メッセンジャーRNA分解、または非コードRNAの配列に影響を及ぼし得る。このタイプのSNPの影響を受ける遺伝子発現は、eSNP(発現SNP)と呼ばれ、遺伝子の上流または下流に存在し得る。単一ヌクレオチドバリアント(SNV)は、頻度の制限のない単一ヌクレオチドのバリエーションであり、体細胞で生じ得る。体細胞の単一ヌクレオチドバリエーションは、単一ヌクレオチド改変とも呼ばれる。
「特異的に結合する」とは、本発明のポリペプチド及び/または核酸分子を認識して結合するが、試料(例えば生物学的試料)中の他の分子を実質的に認識及び結合しない、核酸分子、ポリペプチド、もしくはその複合体(例えば、核酸プログラム可能なDNA結合ドメイン及びガイド核酸)、化合物、または分子を意味する。
本発明の方法において有用な核酸分子には、本発明のポリペプチドまたはその断片をコードする任意の核酸分子が含まれる。そのような核酸分子は、内在性核酸配列と100%同一である必要はないが、一般的には実質的な同一性を示す。内在性配列に対して「実質的な同一性」を有するポリヌクレオチドは、一般的には、二本鎖核酸分子の少なくとも1本の鎖とハイブリダイズすることができる。本発明の方法において有用な核酸分子には、本発明のポリペプチドまたはその断片をコードする任意の核酸分子が含まれる。そのような核酸分子は、内在性核酸配列と100%同一である必要はないが、一般的には実質的な同一性を示す。内在性配列に対して「実質的な同一性」を有するポリヌクレオチドは、一般的には、二本鎖核酸分子の少なくとも1本の鎖とハイブリダイズすることができる。
「ハイブリダイズさせる」とは、様々なストリンジェンシーの条件下で、相補的なポリヌクレオチド配列(例えば、本明細書に記載の遺伝子)、またはその一部との間で二本鎖分子を形成するように対合させることを意味する。(例えば、Wahl, G. M. and S. L. Berger (1987) Methods Enzymol. 152: 399; Kimmel, A. R. (1987) Methods Enzymol. 152: 507を参照のこと)。
例えば、ストリンジェントな塩濃度は、通常、約750mM NaCl及び75mMクエン酸三ナトリウム未満、好ましくは約500mM NaCl及び50mMクエン酸三ナトリウム未満、より好ましくは約250mM NaCl及び25mMクエン酸三ナトリウム未満である。有機溶媒、例えば、ホルムアミドの非存在下では、低いストリンジェンシーのハイブリダイゼーションを得ることができる一方で、少なくとも約35%のホルムアミド、より好ましくは少なくとも約50%のホルムアミドの存在下では、高いストリンジェンシーのハイブリダイゼーションを得ることができる。ストリンジェントな温度条件には、通常は、少なくとも約30℃、より好ましくは少なくとも約37℃、最も好ましくは少なくとも約42℃の温度が含まれる。ハイブリダイゼーション時間、界面活性剤(例えば、ドデシル硫酸ナトリウム(SDS))の濃度、及びキャリアDNAの包含または除外などの様々な付加的パラメータは、当業者には周知である。必要に応じて、これらの様々な条件を組み合わせることによって、様々なレベルのストリンジェンシーが達成される。好ましい実施形態では、ハイブリダイゼーションを、750 mM NaCl、75mMクエン酸三ナトリウム、及び1% SDS中にて30℃で実施する。より好ましい実施形態では、ハイブリダイゼーションを、500 mM NaCl、50 mMクエン酸三ナトリウム、1% SDS、35%ホルムアミド、及び100 μg/ml変性サケ精子DNA(ssDNA)中にて37℃で実施する。最も好ましい実施形態では、ハイブリダイゼーションを、250mM NaCl、25mMクエン酸三ナトリウム、1%SDS、50%ホルムアミド、及び200 μg/ml ssDNA中にて42℃で実施する。これらの条件の有用な変形は、当業者には容易に明らかであろう。
ほとんどのアプリケーションでは、ハイブリダイゼーションに続く洗浄ステップのストリンジェンシーも様々に異なる。洗浄のストリンジェンシーの条件は、塩濃度と温度によって定義することができる。上記のように、洗浄のストリンジェンシーは、塩濃度を下げるか、温度を上げることによって高めることができる。例えば、洗浄ステップのストリンジェントな塩濃度は、好ましくは約30mM NaCl及び3mMクエン酸三ナトリウム未満、最も好ましくは約15mM NaCl及び1.5mMクエン酸三ナトリウム未満である。洗浄ステップのストリンジェントな温度条件には、通常、少なくとも約25℃、より好ましくは少なくとも約42℃、さらにより好ましくは少なくとも約68℃の温度が含まれる。一実施形態では、洗浄ステップを、30mM NaCl、3mMクエン酸三ナトリウム、及び0.1%SDS中にて25℃で実施する。別の実施形態では、洗浄ステップを、15mM NaCl、1.5mMクエン酸三ナトリウム、及び0.1%SDS中にて42℃で実施する。より好ましい実施形態では、洗浄ステップを、15mM NaCl、1.5mMクエン酸三ナトリウム、及び0.1%SDS中にて68℃で実施する。これらの条件の追加のバリエーションは、当業者には容易に明らかであろう。ハイブリダイゼーション技術は当業者に周知であり、例えば、Benton and Davis (Science 196: 180, 1977); Grunstein and Hogness (Proc. Natl. Acad. Sci., USA 72: 3961, 1975); Ausubel et al. (Current Protocols in Molecular Biology, Wiley Interscience, New York, 2001); Berger and Kimmel (Guide to Molecular Cloning Techniques, 1987, Academic Press, New York);及びSambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, New Yorkに記載されている。
「スプリット」とは、2つ以上の断片に分割されることを意味する。
「スプリットCas9タンパク質」または「スプリットCas9」は、2つの別個のヌクレオチド配列によってコードされるN末端断片及びC末端断片として提供されるCas9タンパク質を指す。Cas9タンパク質のN末端部分及びC末端部分に対応するポリペプチドは、スプライシングされて「再構成された」Cas9タンパク質を形成し得る。特定の実施形態では、Cas9タンパク質は、例えば、Nishimasu et al., Cell, Volume 156, Issue 5, pp. 935-949, 2014に記載されているように、またはJiang et al. (2016) Science 351: 867-871に記載されているように、タンパク質の非秩序的(disordered)領域内で2つの断片に分割される。PDBファイル:5F9R、それぞれが参照により本明細書に援用される。いくつかの実施形態では、タンパク質は、およそアミノ酸A292~G364、F445~K483、もしくはE565~T637の間のSpCas9の領域内の任意のC、T、A、もしくはSで、または任意の他のCas9、Cas9バリアント(例えば、nCas9、dCas9)、もしくは他のnapDNAbpの対応する位置で、2つの断片に分割される。いくつかの実施形態では、タンパク質は、SpCas9 T310、T313、A456、S469、またはC574で2つの断片に分割される。いくつかの実施形態では、タンパク質を2つの断片に分割するプロセスは、タンパク質の「分割」と呼ばれる。
他の実施形態では、Cas9タンパク質のN末端部分は、S. pyogenes Cas9野生型(SpCas9)(NCBI参照配列: NC_002737.2、Uniprot参照配列: Q99ZW2)のアミノ酸1~573または1~637を含み、Cas9タンパク質のC末端部分は、SpCas9野生型のアミノ酸574~1368または638~1368の部分を含む。
スプリットCas9のC末端部分をスプリットCas9のN末端部分と結合させて、完全なCas9タンパク質を形成することができる。いくつかの実施形態では、Cas9タンパク質のC末端部分は、Cas9タンパク質のN末端部分が終結する位置から開始する。したがって、いくつかの実施形態では、スプリットCas9のC末端部分は、spCas9のアミノ酸(551~651)~1368の一部を含む。「(551~651)~1368」とは、アミノ酸551~651(両端を含む)の間のアミノ酸で開始し、アミノ酸1368で終結することを意味する。例えば、スプリットCas9のC末端部分は、spCas9のアミノ酸551~1368、552~1368、553~1368、554~1368、555~1368、556~1368、557~1368、558~1368、559~1368、560~1368、561~1368、562~1368、563~1368、564~1368、565~1368、566~1368、567~1368、568~1368、569~1368、570~1368、571~1368、572~1368、573~1368、574~1368、575~1368、576~1368、577~1368、578~1368、579~1368、580~1368、581~1368、582~1368、583~1368、584~1368、585~1368、586~1368、587~1368、588~1368、589~1368、590~1368、591~1368、592~1368、593~1368、594~1368、595~1368、596~1368、597~1368、598~1368、599~1368、600~1368、601~1368、602~1368、603~1368、604~1368、605~1368、606~1368、607~1368、608~1368、609~1368、610~1368、611~1368、612~1368、613~1368、614~1368、615~1368、616~1368、617~1368、618~1368、619~1368、620~1368、621~1368、622~1368、623~1368、624~1368、625~1368、626~1368、627~1368、628~1368、629~1368、630~1368、631~1368、632~1368、633~1368、634~1368、635~1368、636~1368、637~1368、638~1368、639~1368、640~1368、641~1368、642~1368、643~1368、644~1368、645~1368、646~1368、647~1368、648~1368、649~1368、650~1368、または651~1368のうちのいずれか1つの一部を含み得る。いくつかの実施形態では、スプリットCas9タンパク質のC末端部分は、SpCas9のアミノ酸574~1368または638~1368の部分を含む。
「対象」とは、ヒトまたは非ヒト哺乳類、例えば、非ヒト霊長類(サル)、ウシ、ウマ、イヌ、ヒツジ、またはネコを含むが、これらに限定されない哺乳類を意味する。いくつかの実施形態では、本明細書に記載の対象は、ポリヌクレオチド配列中に病原性変異を含む。
「実質的に同一」とは、ポリペプチドまたは核酸分子が、参照アミノ酸配列(例えば、本明細書に記載のアミノ酸配列のいずれか1つ)または核酸配列(例えば、本明細書に記載の核酸配列のいずれか1つ)に対して少なくとも50%の同一性を示すことを意味する。一実施形態では、そのような配列は、比較に使用される配列に対して、アミノ酸レベルで、または核酸レベルで、少なくとも60%、80%または85%、90%、95%、またはさらに99%の同一性である。
配列同一性は、通常、配列分析ソフトウェア(例えば、Genetics Computer Group, University of Wisconsin Biotechnology Center, 1710 University Avenue, Madison,Wis. 53705の配列分析ソフトウェアパッケージ、BLAST、BESTFIT、COBALT、EMBOSS Needle、GAP、またはPILEUP/PRETTYBOXプログラム)を使用して測定する。そのようなソフトウェアは、様々な置換、欠失、及び/または他の改変に相同性の程度を割り当てることによって、同一または類似の配列をマッチさせる。保存的置換は、通常、以下の群、すなわち、グリシン、アラニン、バリン、イソロイシン、ロイシン、アスパラギン酸、グルタミン酸、アスパラギン、グルタミン、セリン、スレオニン、リジン、アルギニン、及びフェニルアラニン、チロシン内の置換を含む。同一性の程度を測定する例示的な方法では、e-3~e-100の確率スコアが密接に関連した配列を示すBLASTプログラムが使用され得る。COBALTは、例えば、以下のパラメータで使用する:
a) アラインメントパラメータ:Gap penalties -11、-1及びEnd-Gap penalties -5、-1、
b) CDDパラメータ:Use RPS BLAST on; Blast E-value 0.003; Find Conserved columns and Recompute on、及び
c) クエリクラスタリングパラメータ:Use query clusters on; Word Size 4; Max cluster distance 0.8; Alphabet Regular。
EMBOSS Needleは、例えば、以下のパラメータで使用する:
a) Matrix: BLOSUM62、
b) GAP OPEN: 10、
c) GAP EXTEND: 0.5、
d) OUTPUT FORMAT: pair、
e) END GAP PENALTY: false、
f) END GAP OPEN: 10、及び
g) END GAP EXTEND:0.5。
用語「標的部位」とは、デアミナーゼ(例えば、シチジンデアミナーゼもしくはアデニンデアミナーゼ)またはデアミナーゼを含む融合タンパク質(例えば、dCas9-アデノシンデアミナーゼ融合タンパク質もしくは本明細書に開示する塩基エディター)によって脱アミノ化される核酸分子内の配列を指す。
本明細書中で使用する場合、用語「治療する」、「治療すること」、及び「治療」などは、障害及び/またはそれに関連する症状を低減または寛解させるか、または所望の薬理学的及び/または生理学的な効果を得ることを指す。障害または病態を治療することは、障害、病態、またはそれらに関連する症状が完全に排除されることを、除外はしないものの、必ずしも必要としないことが理解されるだろう。いくつかの実施形態では、効果は治療的であり、すなわち、効果は、非限定的に、疾患及び/または疾患に起因する有害な症状を、部分的または完全に、減少、低減、抑止、軽減、緩和、強度を低下させるか、または治癒する。いくつかの実施形態では、効果は予防的であり、すなわち、効果は、疾患または病態の発症または再発を防御または予防する。この目的のために、本明細書に開示する方法は、本明細書に記載するような治療有効量の組成物を投与することを含む。
「ウラシルグリコシラーゼ阻害剤」または「UGI」とは、ウラシル除去修復系を阻害する薬剤を意味する。一実施形態では、薬剤は、宿主のウラシルDNAグリコシラーゼに結合し、DNAからのウラシル残基の除去を防止するタンパク質またはその断片である。一実施形態では、UGIとは、ウラシルDNAグリコシラーゼの塩基除去修復酵素を阻害することができるタンパク質、その断片、またはドメインのことである。いくつかの実施形態では、UGIドメインは、野生型UGIまたはその改変バージョンを含む。いくつかの実施形態では、UGIドメインは、以下に記載する例示的なアミノ酸配列の断片を含む。いくつかの実施形態では、UGI断片は、以下に示す例示的なUGI配列の少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%を含むアミノ酸配列を含む。いくつかの実施形態では、UGIは、以下に記載するように、例示的なUGIアミノ酸配列またはその断片に相同であるアミノ酸配列を含む。いくつかの実施形態では、UGIまたはその一部は、以下に記載するように、野生型UGIもしくはUGI配列、またはその一部に対して、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、少なくとも99.5%、少なくとも99.9%、または100%の同一性である。例示的なUGIは、以下のようなアミノ酸配列を含む:
>splP14739IUNGI_BPPB2ウラシル-DNAグリコシラーゼ阻害剤
MTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSD APEYKPWALVIQDSNGENKIKML。
本明細書において提供される範囲は、その範囲内のすべての値の簡略表記であることが理解される。例えば、1~50の範囲は、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、または50からなる群からの任意の数、数の組み合わせ、または下位範囲を含むことが理解される。
本明細書の変数の任意の定義の中の化学基のリストの列挙は、任意の単一の基または列挙した基の組み合わせとしてその可変要素の定義を含む。本明細書における可変要素または態様についての実施形態の列挙は、任意の単一の実施形態として、または任意の他の実施形態もしくはその一部と組み合わせてその実施形態を含む。
本明細書中で提供する任意の組成物または方法は、本明細書中で提供する任意の他の組成物及び方法のうちの1つ以上と組み合わせることができる。
本明細書の説明及び実施例は、本開示の実施形態を詳細に示す。本開示は、本明細書に記載する特定の実施形態に限定されず、したがって、様々に異なり得ることを理解されたい。当業者であれば、本開示の多くの変形及び修正が存在し、それらが本開示の範囲内に含まれることを認識するであろう。
すべての用語は、当業者によって理解されるであろうように理解されることを意図している。別段の定義がない限り、本明細書中で使用するすべての技術用語及び科学用語は、本開示が関与する当業者によって一般に理解される意味と同じ意味を有する。
本明細書に開示するいくつかの実施形態の実施は、別途示されない限り、当技術分野の技術の範囲内である免疫学、生化学、化学、分子生物学、微生物学、細胞生物学、ゲノミクス及び組換えDNAの従来技術を使用する。例えば、Sambrook and Green, Molecular Cloning: A Laboratory Manual, 4th Edition (2012); the series Current Protocols in Molecular Biology (F. M. Ausubel, et al. eds.); the series Methods In Enzymology (Academic Press, Inc.), PCR 2: A Practical Approach (M. J. MacPherson, B. D. Hames and G. R. Taylor eds. (1995)), Harlow and Lane, eds. (1988) Antibodies, A Laboratory Manual, and Culture of Animal Cells: A Manual of Basic Technique and Specialized Applications, 6th Edition (R. I. Freshney, ed. (2010))を参照されたい。
本開示の様々な特徴は、単一の実施形態の文脈で記述され得るが、それらの特徴を、別個に、または任意の適切な組み合わせで提供することもできる。逆に、本開示は、明確さのために別個の実施形態の文脈で本明細書に記述され得るが、本開示はまた、単一の実施形態で実施することもできる。本明細書で使用される節の見出しは、単に構成目的のものであり、記載される主題を限定するものと解釈されるべきではない。
本開示の特徴は、添付の特許請求の範囲において、特に記載される。本明細書の特徴及び利点のより良い理解は、本開示の原理を利用する例示的な実施形態を記載する以下の詳細な説明を参照することによって、及び以下に記載する添付の図面を考慮して得られる。
指定されたアデノシン塩基エディターのA>G編集活性のパーセントを示す一連のグラフを示す。各エディターは番号で参照され、例えば、433は、ABE8.32であるpNMG-B433を示す。グラフ中に参照されている各エディターは、gRNA HRB03、HRB04、HRB08、HRB12、及びng-424のそれぞれを伴って試験された。gRNA配列は実施例3に提供されている。 表14に記載の指定のアデノシン塩基エディター(ABE8及びABE9)のA>G編集活性のパーセントを灰色陰影で示したヒートマップを示す。図中に記載されている各エディターは、異なるgRNA、HRB03、HRB04、HRB08、HRB12、及びng-424を伴って試験された。 本明細書に記載のアデノシン塩基エディターのTadAデアミナーゼバリアント(例えば、TadA*9; ABE9)及びCas9(例えば、SpCas9)バリアント成分を示す表を示す。これらのABE9塩基エディターはA>G編集活性を有しており、SERPINA1遺伝子におけるPiZ変異など、α-1アンチトリプシン疾患(A1AD)に関連するSNP変異を修正するのに有用である。いくつかの場合では、SpCas9バリアントは、5’-NGC-3’PAMに対して特異性を有する。図3Aは、アデノシン塩基エディターを、それらのプラスミド番号によって示す。図3B及び3Cは、様々なTadAデアミナーゼバリアント及びTad*7.10アミノ酸配列に含まれるアミノ酸変異、ならびにPAMバリアント及びそれらに含まれるアミノ酸変異を示す。 塩基エディター改変を介した核酸塩基修正の生成の割合の向上に関連する、核酸配列、表及びグラフを示す。図4A及び4Bは、図4C及び4Dに記載するような塩基エディター改変を介した初代PiZZ線維芽細胞における核酸塩基修正の生成の割合の向上に関連する、及び下記の図5A及び5Bに記載するようなNSG-PiZトランスジェニックマウスにおける脂質ナノ粒子(LNP)を介した送達及び塩基編集によって生成される血清α-1アンチトリプシン(A1AT)の増加に関連する、核酸配列及び表を示す。特に、図4Aは、A1ADに関連するPiZZ変異をコードする、標的部位(標的DNA配列の7位のA)を含む標的DNA配列を示す。この配列は、20ヌクレオチドのプロトスペーサーと非標準spCas9 NGC PAMを含む。位置A7=野生型(WT)での有益な編集、ならびに位置A5及びA7=WT+D341Gでの編集も示す。図4Bは、PiZ変異を修正するために使用される様々な塩基エディターのTadAデアミナーゼバリアント及びCas9PAMバリアントの成分を説明する表を示す。表は、図4C、4D、5A及び5Bに示す結果を得るために使用されたバリアント(例えば、バリアント(Var)1~9)を示す。この表では、SpCas9(SpCas9バリアント)のアミノ酸変異を表の右端の列(PAMバリアント)に示す。「RVRFRAR」SpCas9バリアントは、以下の変異を含む:L1111R+D1135V+G1218R+E1219F+A1322R+R1335A+T1337R。図4C及び4Dは、Neonエレクトロポレーションシステムを使用して塩基編集試薬でトランスフェクトした患者由来PiZZ線維芽細胞(GM11423 Corriel Biorepository)で観察された編集率を示す棒グラフを示す。各処理は、70,000個の線維芽細胞、塩基エディターをコードする100ngのmRNA、及び50ngのα-1修正gRNAを含む10 μlのエレクトロポレーション緩衝液からなっていた。回復の48時間後、細胞を溶解し、目的の遺伝子座を標的化アンプリコン配列決定によって調べた。データは2つの独立した実験から取得した。これらのデータと結果は、NGC PAM認識の最適化(バリアント1~3、図4B及び4C)と、TadAデアミナーゼ(例えばABE9)に変異を組み込むことによるTadAデアミナーゼの最適化(バリアント4~9、図4B~4D)の両方によって、標的塩基の編集効率が向上することを示す。 図5A及び5Bは、NSG-PiZトランスジェニックマウスにおける脂質ナノ粒子(LNP)媒介送達及び塩基編集によって生成される血清A1ATの増加に関連するグラフを示す。PiZ変異を修正するために使用された様々なエディターの標的部位DNA配列ならびにTadAデアミナーゼバリアント及びCas9PAMバリアント成分の表は、上記の図4A及び4Bに記載されている通りである。図5Aは、1:1の重量比のgRNA及び塩基エディターをコードするmRNAを含む1.5mg/kgのLNPでの処置の7日後のNSG-PiZトランスジェニックマウスモデル由来の全肝臓gDNAで観察された編集率を示すグラフを示す。市販のNSG-PiZマウス(The Jackson Laboratory, Mount Desert Island, ME)は、免疫不全NOD-SCIDγ(NSG)バックグラウンド(部分肝切除後のヒト肝細胞に安定したバックグラウンドを提供する)において変異型ヒトSERPINA1(Glu342Lys変異)を発現する。結果は、ngcABEvar9(図4B)が以前のバージョンのバリアント8よりも高い編集率をもたらしたことを示している。図5Bは、MSDサンドイッチイムノアッセイによって測定されるところの血清α-1アンチトリプシン(A1AT)(採血後)が、前処理試料(採血前)と比較して増加することが、編集率と相関していることを示すグラフを示す。これらの結果に基づくと、本明細書に記載のTadAデアミナーゼバリアントを用いた塩基編集は、α-1アンチトリプシンの欠乏及びその潜在的な肺後遺症に対処することができる。
本発明は、標的配列を編集するための新規アデニン塩基エディター(例えば、ABE9)及びそれらのアデノシンデアミナーゼバリアントの使用方法を特徴とする。
核酸塩基エディター
本明細書において、ポリヌクレオチドの標的ヌクレオチド配列を編集、修飾、または改変するための新規塩基エディター(例えば、ABE8及びABE9)または核酸塩基エディターを開示する。特に、新規ABE9塩基エディター及びその成分であるアデノシンデアミナーゼを、以下の表14及び18に記載する。本明細書において、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン及び核酸塩基編集ドメイン(例えば、アデノシンデアミナーゼ)を含む核酸塩基エディターまたは塩基エディターを記載する。ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、結合したガイドポリヌクレオチド(例えば、gRNA)と組み合わせられた場合、標的ポリヌクレオチド配列に特異的に結合し(すなわち、結合したガイド核酸の塩基と標的ポリヌクレオチド配列の塩基との間の相補的塩基対形成を介して)、それにより、編集することが望まれる標的核酸配列に塩基エディターを局在化させることができる。いくつかの実施形態では、標的ポリヌクレオチド配列は、一本鎖DNAまたは二本鎖DNAを含む。いくつかの実施形態では、標的ポリヌクレオチド配列は、RNAを含む。いくつかの実施形態では、標的ポリヌクレオチド配列は、DNA-RNAハイブリッドを含む。
ポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン
ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインはまた、RNAに結合する核酸プログラム可能なタンパク質を含み得ることが理解されるべきである。例えば、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、それをRNAへとガイドする核酸と会合され得る。他の核酸プログラム可能なDNA結合タンパク質もまた、本開示の範囲内であるが、それらは、本開示に具体的に記載されていない。
塩基エディターのポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、それ自体が1つ以上のドメインを含み得る。例えば、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、1つ以上のヌクレアーゼドメインを含み得る。いくつかの実施形態では、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインのヌクレアーゼドメインは、エンドヌクレアーゼまたはエキソヌクレアーゼを含み得る。本明細書において、用語「エキソヌクレアーゼ」とは、遊離末端から核酸(例えば、RNAまたはDNA)を消化することができるタンパク質またはポリペプチドを指し、用語「エンドヌクレアーゼ」とは、核酸(例えば、DNAまたはRNA)の内部領域を触媒する(例えば、切断する)ことができるタンパク質またはポリペプチドを指す。いくつかの実施形態では、エンドヌクレアーゼは、二本鎖核酸の単一の鎖を切断することができる。いくつかの実施形態では、エンドヌクレアーゼは、二本鎖核酸分子の両方の鎖を切断することができる。いくつかの実施形態では、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、デオキシリボヌクレアーゼであり得る。いくつかの実施形態では、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、リボヌクレアーゼであり得る。
いくつかの実施形態では、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインのヌクレアーゼドメインは、標的ポリヌクレオチドの0、1、または2本の鎖を切断することができる。いくつかの場合では、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、ニッカーゼドメインを含み得る。本明細書において、用語「ニッカーゼ」とは、二本鎖核酸分子(例えば、DNA)中の2本の鎖のうちの1本の鎖のみを切断することができるヌクレアーゼドメインを含むポリヌクレオチドプログラム可能なヌクレオチド結合ドメインを指す。いくつかの実施形態では、ニッカーゼは、活性なポリヌクレオチドプログラム可能なヌクレオチド結合ドメインに1つ以上の変異を導入することによって、完全に触媒的に活性な(例えば、天然の)形態のポリヌクレオチドプログラム可能なヌクレオチド結合ドメインから誘導され得る。例えば、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインがCas9に由来するニッカーゼドメインを含む場合、Cas9由来のニッカーゼドメインは、D10A変異及び840位のヒスチジンを含み得る。そのような場合、残基H840は触媒活性を保持し、それによって核酸二本鎖の一本鎖を切断することができる。別の例では、Cas9由来のニッカーゼドメインは、H840A変異を含むことができ、一方、10位のアミノ酸残基はDのままである。いくつかの実施形態では、ニッカーゼは、完全に触媒的に活性な(例えば、天然)形態のポリヌクレオチドプログラム可能なヌクレオチド結合ドメインから、ニッカーゼ活性に必要とされないヌクレアーゼドメインの全部または一部を除去することにより、誘導され得る。例えば、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインがCas9に由来するニッカーゼドメインを含む場合、Cas9由来のニッカーゼドメインは、RuvCドメインまたはHNHドメインの全部または一部の欠失を含み得る。
例示的な触媒活性Cas9のアミノ酸配列は以下の通りである:
MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD。
触媒的に不活性の(すなわち、標的ポリヌクレオチド配列を切断することができない)ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインを含む塩基エディターもまた、本明細書において提供される。本明細書において、用語「触媒的に不活性」及び「ヌクレアーゼ不活性」は、核酸の鎖を切断することができないという結果をもたらす1つ以上の変異及び/または欠失を有するポリヌクレオチドプログラム可能なヌクレオチド結合ドメインを指すために同じ意味で用いられる。いくつかの実施形態では、触媒的に不活性なポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン塩基エディターは、1つ以上のヌクレアーゼドメインにおける特定の点変異の結果として、ヌクレアーゼ活性を欠き得る。例えば、Cas9ドメインを含む塩基エディターの場合、Cas9は、D10A変異とH840A変異の両方を含み得る。そのような変異は、両方のヌクレアーゼドメインを不活性化し、それによってヌクレアーゼ活性の喪失をもたらす。他の実施形態では、触媒的に不活性なポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、触媒ドメイン(例えば、RuvC1及び/またはHNHドメイン)の全部または一部の1つ以上の欠失を含み得る。さらなる実施形態では、触媒的に不活性なポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、点変異(例えば、D10AまたはH840A)、及びヌクレアーゼドメインの全部または一部の欠失を含む。
また、本明細書では、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインの以前の機能的バージョンから、触媒的に不活性なポリヌクレオチドプログラム可能なヌクレオチド結合ドメインを生成することができる変異が企図される。例えば、触媒的に不活性なCas9(「dCas9」)の場合、D10A及びH840A以外の変異を有する変異体が提供され、その結果、ヌクレアーゼ不活性化Cas9が生じる。そのような変異は、例として、D10及びH840での他のアミノ酸置換、またはCas9のヌクレアーゼドメイン内の他の置換(例えば、HNHヌクレアーゼサブドメイン及び/またはRuvC1サブドメインでの置換)を含む。追加の適切なヌクレアーゼ不活性dCas9ドメインは、本開示及び当技術分野の知識に基づいて当業者には明らかであり得、そして本開示の範囲内である。そのような追加の例示的な適切なヌクレアーゼ不活性Cas9ドメインには、D10A/H840A、D10A/D839A/H840A、及びD10A/D839A/H840A/N863A変異ドメインが含まれるが、これらに限定されない(例えば、Prashant et al., CAS9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering. Nature Biotechnology. 2013; 31 (9): 833-838を参照のこと(それぞれの全内容は、参照により本明細書に援用される)。
塩基エディターに組み込むことができるポリヌクレオチドプログラム可能なヌクレオチド結合ドメインの非限定的な例として、CRISPRタンパク質由来ドメイン、制限ヌクレアーゼ、メガヌクレアーゼ、TALヌクレアーゼ(TALEN)、及びジンクフィンガーヌクレアーゼ(ZFN)が挙げられる。いくつかの場合では、塩基エディターは、天然もしくは修飾タンパク質またはその一部を含むポリヌクレオチドプログラム可能なヌクレオチド結合ドメインを含み、結合したガイド核酸を介して、CRISPR(すなわち、Clustered Regularly Interspaced Short Palindromic Repeats)媒介性核酸修飾の際に核酸配列に結合することができる。そのようなタンパク質は、本明細書中では「CRISPRタンパク質」と呼ばれる。したがって、本明細書において、CRISPRタンパク質の全部または一部を含むポリヌクレオチドプログラム可能なヌクレオチド結合ドメインを含む塩基エディター(すなわち、塩基エディターの「CRISPRタンパク質由来ドメイン」とも呼ばれる、CRISPRタンパク質の全部または一部をドメインとして含む塩基エディター)を開示する。塩基エディターに組み込まれるCRISPRタンパク質由来のドメインは、野生型または天然バージョンのCRISPRタンパク質と比較して改変され得る。例えば、以下に記載するように、CRISPRタンパク質由来ドメインは、CRISPRタンパク質の野生型または天然バージョンと比較して、1つ以上の変異、挿入、欠失、再配列及び/または組換えを含み得る。
CRISPRは、可動性遺伝子エレメント(ウイルス、転移因子、及び接合プラスミド)に対する防御を提供する適応免疫系である。CRISPRクラスターには、スペーサー、前述の可動性エレメントに相補的な配列、及び標的侵入核酸が含まれる。CRISPRクラスターは、転写され、プロセシングされてCRISPR RNA(crRNA)になる。II型CRISPR系では、プレcrRNAを正しくプロセシングするには、トランスコードされた低分子RNA(tracrRNA)、内在性リボヌクレアーゼ3(rnc)及びCas9タンパク質が必要である。tracrRNAは、プレcrRNAのリボヌクレアーゼ3支援プロセシングのガイドとして機能する。続いて、Cas9/crRNA/tracrRNAは、スペーサーに相補的な直鎖または環状のdsDNA標的をエンドヌクレアーゼ的に切断する。crRNAに相補的でない標的鎖は、最初にエンドヌクレアーゼ的に切断され、次いで3’-5’エキソヌクレアーゼ的にトリミングされる。自然界では、DNAの結合及び切断には、通常、タンパク質と両方のRNAが必要である。しかしながら、crRNA及びtracrRNAの両方の態様を単一のRNA種に組み込むように単一ガイドRNA(「sgRNA」、または単に「gNRA」)を作製することができる。例えば、Jinek M., Chylinski K., Fonfara I., Hauer M., Doudna J. A., Charpentier E. Science 337: 816-821 (2012)を参照されたい(これらの全内容は、参照により本明細書に援用される)。Cas9は、CRISPRリピート配列の短いモチーフ(PAMまたはプロトスペーサー隣接モチーフ)を認識して、自己と非自己を区別するのに役立つ。
いくつかの実施形態では、本明細書に記載の方法は、改変されたCasタンパク質を利用することができる。ガイドRNA(gRNA)は、Cas結合に必要な足場配列と、修飾されるべきゲノム(またはポリヌクレオチド、例えば、DNAもしくはRNA)標的を定義するユーザー定義の約20ヌクレオチドスペーサーとからなる短い合成RNAである。したがって、当業者は、gRNAに存在する標的配列を変更することにより、Casタンパク質のゲノムまたはポリヌクレオチド標的を変更することができる。Casタンパク質の特異性は、gRNA標的指向化配列が、ゲノムの他の部分と比較してゲノムのポリヌクレオチド標的配列に対してどれほど特異的であるかによって部分的に決定される。一実施形態では、Casタンパク質はSpCas9である。
いくつかの実施形態では、gRNA足場配列は以下の通りである: GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU。
いくつかの実施形態では、gRNA足場配列は以下の通りである: GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGGACCGAGUCGGUGCUUUU。
一実施形態では、上記のgRNA足場の末端ウラシル(U)は、任意選択で「mU*mU*mU*U」を含み得、これらは2’OMeを示し、ホスホロチオエート結合を有する。
一実施形態では、RNA足場は、ステムループを含む。一実施形態では、RNA足場は、核酸配列: GUUUUUGUACUCUCAAGAUUUAAGUAACUGUACAACGAAACUUACACAGUUACUUAAAUCUUGCAGAAGCUACAAAGAUAAGGCUUCAUGCCGAAAUCAACACCCUGUCAUUUUAUGGCAGGGUGを含む。
一実施形態では、S. pyrogenesのsgRNA足場ポリヌクレオチド配列は以下の通りである:
GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC。
一実施形態では、S. aureusのsgRNA足場ポリヌクレオチド配列は以下の通りである:
GUUUUAGUACUCUGUAAUGAAAAUUACAGAAUCUACUAAAACAAGGCAAAAUGCCGUGUUUAUCUCGUCAACUUGUUGGCGAGA。
一実施形態では、BhCas12bのsgRNA足場は、以下のポリヌクレオチド配列を有する:
GUUCUGTCUUUUGGUCAGGACAACCGUCUAGCUAUAAGUGCUGCAGGGUGUGAGAAACUCCUAUUGCUGGACGAUGUCUCUUACGAGGCAUUAGCAC。
一実施形態では、BvCas12b sgRNA足場は、以下のポリヌクレオチド配列を有する:
GACCUAUAGGGUCAAUGAAUCUGGGCGUGUGCCAUAAGUAAUUAAAAAUUACCCACCACAGGAGCACCUGAAAACAGGUGCUUGGCAC。
いくつかの実施形態では、塩基エディターに組み込まれるCRISPRタンパク質由来ドメインは、結合したガイド核酸と組み合わせられた場合に標的ポリヌクレオチドに結合することができるエンドヌクレアーゼ(例えば、デオキシリボヌクレアーゼまたはリボヌクレアーゼ)である。いくつかの実施形態では、塩基エディターに組み込まれるCRISPRタンパク質由来ドメインは、結合したガイド核酸と組み合わせられた場合に標的ポリヌクレオチドに結合することができるニッカーゼである。いくつかの実施形態では、塩基エディターに組み込まれるCRISPRタンパク質由来ドメインは、結合したガイド核酸と組み合わせられた場合に標的ポリヌクレオチドに結合することができる触媒的に不活性なドメインである。いくつかの実施形態では、塩基エディターのCRISPRタンパク質由来ドメインが結合する標的ポリヌクレオチドは、DNAである。いくつかの実施形態では、塩基エディターのCRISPRタンパク質由来ドメインが結合する標的ポリヌクレオチドは、RNAである。
本明細書中で使用し得るCasタンパク質には、クラス1及びクラス2が含まれる。Casタンパク質の非限定的な例として、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5d、Cas5t、Cas5h、Cas5a、Cas6、Cas7、Cas8、Cas9(Csn1またはCsx12としても知られる)、Cas10、Csy1、Csy2、Csy3、Csy4、Cse1、Cse2、Cse3、Cse4、Cse5e、Csc1、Csc2、Csa5、Csn1、Csn2、Csm1、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx1S、Csf1、Csf2、CsO、Csf4、Csd1、Csd2、Cst1、Cst2、Csh1、Csh2、Csa1、Csa2、Csa3、Csa4、Csa5、Cas12a/Cpf1、Cas12b/C2c1、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i、及びCas12j/CasΦ、CARF、DinG、その相同体、またはその修飾もしくは改変バージョンが挙げられる。2つの機能的なエンドヌクレアーゼドメインRuvC及びHNHを有する、Cas9などの未改変のCRISPR酵素は、DNA切断活性を有し得る。CRISPR酵素は、標的配列で、例えば、標的配列内及び/または標的配列の相補鎖配列内で、一方または両方の鎖の切断を誘導することができる。例えば、CRISPR酵素は、標的配列の最初または最後のヌクレオチドから、約1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、200、500、またはそれより多い塩基対以内にある一方または両方の鎖の切断を誘導することができる。
変異型CRISPR酵素が、標的配列を含む標的ポリヌクレオチドの一方または両方の鎖を切断する能力を欠くように、対応する野生型酵素に関して変異導入したCRISPR酵素をコードするベクターを使用することができる。Cas9は、野生型の例示的なCas9ポリペプチド(例えば、S. pyogenes由来のCas9)に対して、少なくとも(または少なくとも約)50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性及び/または配列相同性を有するポリペプチドを指し得る。Cas9は、野生型の例示的なCas9ポリペプチド(例えば、S. pyogenes由来のもの)に対して、多くとも(または多くとも約)50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性及び/または配列相同性を有するポリペプチドを指し得る。Cas9は、欠失、挿入、置換、バリアント、変異、融合、キメラ、またはそれらの任意の組み合わせなどのアミノ酸変化を含み得るCas9タンパク質の野生型または改変形態を指し得る。
いくつかの実施形態では、塩基エディターのCRISPRタンパク質由来ドメインは、Corynebacterium ulcerans (NCBI Refs: NC_015683.1, NC_017317.1); Corynebacterium diphtheria (NCBI Refs: NC_016782.1, NC_016786.1); Spiroplasma syrphidicola (NCBI Ref: NC_021284.1); Prevotella intermedia (NCBI Ref: NC_017861.1); Spiroplasma taiwanense (NCBI Ref: NC_021846.1); Streptococcus iniae (NCBI Ref: NC_021314.1); Belliella baltica (NCBI Ref: NC_018010.1); Psychroflexus torquis (NCBI Ref: NC_018721.1); Streptococcus thermophilus (NCBI Ref: YP_820832.1); Listeria innocua (NCBI Ref: NP_472073.1); Campylobacter jejuni (NCBI Ref: YP_002344900.1); Neisseria meningitidis (NCBI Ref: YP_002342100.1), Streptococcus pyogenes、またはStaphylococcus aureus由来のCas9の全部または一部を含み得る。
核酸塩基エディターのCas9ドメイン
Cas9ヌクレアーゼの配列及び構造は当業者に周知である(例えば、“Complete genome sequence of an M1 strain of Streptococcus pyogenes.”.Ferretti et al., Proc. Natl. Acad. Sci. U.S.A. 98: 4658-4663 (2001); “CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III.” Deltcheva E. et al., Nature 471: 602-607 (2011); 及び“A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.” Jinek M. et al., Science 337: 816-821 (2012)を参照されたい(これらのそれぞれの全内容は、参照により本明細書に援用される))。Cas9オルソログは、S. pyogenes及びS. thermophilusを含むがこれらに限定されない、様々な種で記載されている。追加の適切なCas9ヌクレアーゼ及び配列は、本開示に基づいて当業者には明らかであり、そのようなCas9ヌクレアーゼ及び配列として、Chylinski, Rhun, and Charpentier, “The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems” (2013) RNA Biology 10: 5, 726-737に開示されている生物及び遺伝子座に由来するCas9配列が挙げられ; その全内容は、参照により本明細書に援用される。
いくつかの態様では、核酸プログラム可能なDNA結合タンパク質(napDNAbp)はCas9ドメインである。本明細書において、非限定的な例示的なCas9ドメインを提供する。Cas9ドメインは、ヌクレアーゼ活性Cas9ドメイン、ヌクレアーゼ不活性Cas9ドメイン、またはCas9ニッカーゼであり得る。いくつかの実施形態では、Cas9ドメインは、ヌクレアーゼ活性ドメインである。例えば、Cas9ドメインは、二本鎖核酸の両方の鎖(例えば、二本鎖DNA分子の両方の鎖)を切断するCas9ドメインであり得る。いくつかの実施形態では、Cas9ドメインは、本明細書に記載のアミノ酸配列のいずれか1つを含む。いくつかの実施形態では、Cas9ドメインは、本明細書に記載するアミノ酸配列のいずれか1つに対して、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。いくつかの実施形態では、Cas9ドメインは、本明細書に記載のアミノ酸配列のいずれか1つと比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50またはそれ以上の変異を有するアミノ酸配列を含む。いくつかの実施形態では、Cas9ドメインは、本明細書に記載のアミノ酸配列のいずれか1つと比較して、少なくとも10、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも150、少なくとも200、少なくとも250、少なくとも300、少なくとも350、少なくとも400、少なくとも500、少なくとも600、少なくとも700、少なくとも800、少なくとも900、少なくとも1000、少なくとも1100、または少なくとも1200の同一の連続アミノ酸残基を有するアミノ酸配列を含む。
いくつかの実施形態では、Cas9の断片を含むタンパク質を提供する。例えば、いくつかの実施形態では、タンパク質は、(1)Cas9のgRNA結合ドメイン; または(2)Cas9のDNA切断ドメインという2つのCas9ドメインのうちの1つを含む。いくつかの実施形態では、Cas9またはその断片を含むタンパク質は、「Cas9バリアント」と呼ばれる。Cas9バリアントは、Cas9またはその断片と相同性を共有する。例えば、Cas9バリアントは、野生型Cas9と、少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一である。いくつかの実施形態では、Cas9バリアントは、野生型Cas9と比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50またはそれ以上のアミノ酸変化を有し得る。いくつかの実施形態では、Cas9バリアントは、Cas9の断片(例えば、gRNA結合ドメインまたはDNA切断ドメイン)を含み、その結果、断片は、野生型Cas9の対応する断片と、少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一である。いくつかの実施形態では、断片は、対応する野生型Cas9の、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%同一、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%のアミノ酸長である。いくつかの実施形態では、断片は、少なくとも100アミノ酸長である。いくつかの実施形態では、断片は、少なくとも100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、または少なくとも1300アミノ酸長である。
いくつかの実施形態では、本明細書中で提供するCas9融合タンパク質は、Cas9タンパク質の全長アミノ酸配列、例えば、本明細書中で提供するCas9配列の1つを含む。しかしながら、他の実施形態では、本明細書中で提供する融合タンパク質は、全長のCas9配列を含まず、1つ以上のその断片のみを含む。本明細書において、適切なCas9ドメイン及びCas9断片の例示的なアミノ酸配列を提供し、Cas9ドメイン及び断片のさらなる適切な配列は、当業者には明らかであろう。
Cas9タンパク質は、そのガイドRNAに相補性を有する特定のDNA配列にCas9タンパク質をガイドする、ガイドRNAと結合され得る。いくつかの実施形態では、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、Cas9ドメイン、例えば、ヌクレアーゼ活性Cas9、Cas9ニッカーゼ(nCas9)、またはヌクレアーゼ不活性Cas9(dCas9)である。核酸プログラム可能なDNA結合タンパク質の例として、Cas9(例えば、dCas9及びnCas9)、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i、及びCas12j/CasΦが挙げられるが、これらに限定されない。Cas酵素の非限定的な例として、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5d、Cas5t、Cas5h、Cas5a、Cas6、Cas7、Cas8、Cas8a、Cas8b、Cas8c、Cas9(Csn1またはCsx12としても知られる)、Cas10、Cas10d、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i、Cas12j/CasΦ、Csy1、Csy2、Csy3、Csy4、Cse1、Cse2、Cse3、Cse4、Cse5e、Csc1、Csc2、Csa5、Csn1、Csn2、Csm1、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx1S、Csx11、Csf1、Csf2、CsO、Csf4、Csd1、Csd2、Cst1、Cst2、Csh1、Csh2、Csa1、Csa2、Csa3、Csa4、Csa5、II型Casエフェクタータンパク質、V型Casエフェクタータンパク質、VI型Casエフェクタータンパク質、CARF、DinG、それらの相同体、またはそれらの修飾または改変バージョンが挙げられる。
いくつかの実施形態では、野生型Cas9は、Streptococcus pyogenes由来のCas9(NCBI参照配列:NC_017053.1、以下のヌクレオチド及びアミノ酸配列)に対応する。
Figure 2022546608000012
Figure 2022546608000013
Figure 2022546608000014
Figure 2022546608000015
いくつかの実施形態では、野生型Cas9は、以下のヌクレオチド配列及び/またはアミノ酸配列に対応するか、またはそれらを含む:
ATGGATAAAAAGTATTCTATTGGTTTAGACATCGGCACTAATTCCGTTGGATGGGCTGTCATAACCGATGAATACAAAGTACCTTCAAAGAAATTTAAGGTGTTGGGGAACACAGACCGTCATTCGATTAAAAAGAATCTTATCGGTGCCCTCCTATTCGATAGTGGCGAAACGGCAGAGGCGACTCGCCTGAAACGAACCGCTCGGAGAAGGTATACACGTCGCAAGAACCGAATATGTTACTTACAAGAAATTTTTAGCAATGAGATGGCCAAAGTTGACGATTCTTTCTTTCACCGTTTGGAAGAGTCCTTCCTTGTCGAAGAGGACAAGAAACATGAACGGCACCCCATCTTTGGAAACATAGTAGATGAGGTGGCATATCATGAAAAGTACCCAACGATTTATCACCTCAGAAAAAAGCTAGTTGACTCAACTGATAAAGCGGACCTGAGGTTAATCTACTTGGCTCTTGCCCATATGATAAAGTTCCGTGGGCACTTTCTCATTGAGGGTGATCTAAATCCGGACAACTCGGATGTCGACAAACTGTTCATCCAGTTAGTACAAACCTATAATCAGTTGTTTGAAGAGAACCCTATAAATGCAAGTGGCGTGGATGCGAAGGCTATTCTTAGCGCCCGCCTCTCTAAATCCCGACGGCTAGAAAACCTGATCGCACAATTACCCGGAGAGAAGAAAAATGGGTTGTTCGGTAACCTTATAGCGCTCTCACTAGGCCTGACACCAAATTTTAAGTCGAACTTCGACTTAGCTGAAGATGCCAAATTGCAGCTTAGTAAGGACACGTACGATGACGATCTCGACAATCTACTGGCACAAATTGGAGATCAGTATGCGGACTTATTTTTGGCTGCCAAAAACCTTAGCGATGCAATCCTCCTATCTGACATACTGAGAGTTAATACTGAGATTACCAAGGCGCCGTTATCCGCTTCAATGATCAAAAGGTACGATGAACATCACCAAGACTTGACACTTCTCAAGGCCCTAGTCCGTCAGCAACTGCCTGAGAAATATAAGGAAATATTCTTTGATCAGTCGAAAAACGGGTACGCAGGTTATATTGACGGCGGAGCGAGTCAAGAGGAATTCTACAAGTTTATCAAACCCATATTAGAGAAGATGGATGGGACGGAAGAGTTGCTTGTAAAACTCAATCGCGAAGATCTACTGCGAAAGCAGCGGACTTTCGACAACGGTAGCATTCCACATCAAATCCACTTAGGCGAATTGCATGCTATACTTAGAAGGCAGGAGGATTTTTATCCGTTCCTCAAAGACAATCGTGAAAAGATTGAGAAAATCCTAACCTTTCGCATACCTTACTATGTGGGACCCCTGGCCCGAGGGAACTCTCGGTTCGCATGGATGACAAGAAAGTCCGAAGAAACGATTACTCCATGGAATTTTGAGGAAGTTGTCGATAAAGGTGCGTCAGCTCAATCGTTCATCGAGAGGATGACCAACTTTGACAAGAATTTACCGAACGAAAAAGTATTGCCTAAGCACAGTTTACTTTACGAGTATTTCACAGTGTACAATGAACTCACGAAAGTTAAGTATGTCACTGAGGGCATGCGTAAACCCGCCTTTCTAAGCGGAGAACAGAAGAAAGCAATAGTAGATCTGTTATTCAAGACCAACCGCAAAGTGACAGTTAAGCAATTGAAAGAGGACTACTTTAAGAAAATTGAATGCTTCGATTCTGTCGAGATCTCCGGGGTAGAAGATCGATTTAATGCGTCACTTGGTACGTATCATGACCTCCTAAAGATAATTAAAGATAAGGACTTCCTGGATAACGAAGAGAATGAAGATATCTTAGAAGATATAGTGTTGACTCTTACCCTCTTTGAAGATCGGGAAATGATTGAGGAAAGACTAAAAACATACGCTCACCTGTTCGACGATAAGGTTATGAAACAGTTAAAGAGGCGTCGCTATACGGGCTGGGGACGATTGTCGCGGAAACTTATCAACGGGATAAGAGACAAGCAAAGTGGTAAAACTATTCTCGATTTTCTAAAGAGCGACGGCTTCGCCAATAGGAACTTTATGCAGCTGATCCATGATGACTCTTTAACCTTCAAAGAGGATATACAAAAGGCACAGGTTTCCGGACAAGGGGACTCATTGCACGAACATATTGCGAATCTTGCTGGTTCGCCAGCCATCAAAAAGGGCATACTCCAGACAGTCAAAGTAGTGGATGAGCTAGTTAAGGTCATGGGACGTCACAAACCGGAAAACATTGTAATCGAGATGGCACGCGAAAATCAAACGACTCAGAAGGGGCAAAAAAACAGTCGAGAGCGGATGAAGAGAATAGAAGAGGGTATTAAAGAACTGGGCAGCCAGATCTTAAAGGAGCATCCTGTGGAAAATACCCAATTGCAGAACGAGAAACTTTACCTCTATTACCTACAAAATGGAAGGGACATGTATGTTGATCAGGAACTGGACATAAACCGTTTATCTGATTACGACGTCGATCACATTGTACCCCAATCCTTTTTGAAGGACGATTCAATCGACAATAAAGTGCTTACACGCTCGGATAAGAACCGAGGGAAAAGTGACAATGTTCCAAGCGAGGAAGTCGTAAAGAAAATGAAGAACTATTGGCGGCAGCTCCTAAATGCGAAACTGATAACGCAAAGAAAGTTCGATAACTTAACTAAAGCTGAGAGGGGTGGCTTGTCTGAACTTGACAAGGCCGGATTTATTAAACGTCAGCTCGTGGAAACCCGCCAAATCACAAAGCATGTTGCACAGATACTAGATTCCCGAATGAATACGAAATACGACGAGAACGATAAGCTGATTCGGGAAGTCAAAGTAATCACTTTAAAGTCAAAATTGGTGTCGGACTTCAGAAAGGATTTTCAATTCTATAAAGTTAGGGAGATAAATAACTACCACCATGCGCACGACGCTTATCTTAATGCCGTCGTAGGGACCGCACTCATTAAGAAATACCCGAAGCTAGAAAGTGAGTTTGTGTATGGTGATTACAAAGTTTATGACGTCCGTAAGATGATCGCGAAAAGCGAACAGGAGATAGGCAAGGCTACAGCCAAATACTTCTTTTATTCTAACATTATGAATTTCTTTAAGACGGAAATCACTCTGGCAAACGGAGAGATACGCAAACGACCTTTAATTGAAACCAATGGGGAGACAGGTGAAATCGTATGGGATAAGGGCCGGGACTTCGCGACGGTGAGAAAAGTTTTGTCCATGCCCCAAGTCAACATAGTAAAGAAAACTGAGGTGCAGACCGGAGGGTTTTCAAAGGAATCGATTCTTCCAAAAAGGAATAGTGATAAGCTCATCGCTCGTAAAAAGGACTGGGACCCGAAAAAGTACGGTGGCTTCGATAGCCCTACAGTTGCCTATTCTGTCCTAGTAGTGGCAAAAGTTGAGAAGGGAAAATCCAAGAAACTGAAGTCAGTCAAAGAATTATTGGGGATAACGATTATGGAGCGCTCGTCTTTTGAAAAGAACCCCATCGACTTCCTTGAGGCGAAAGGTTACAAGGAAGTAAAAAAGGATCTCATAATTAAACTACCAAAGTATAGTCTGTTTGAGTTAGAAAATGGCCGAAAACGGATGTTGGCTAGCGCCGGAGAGCTTCAAAAGGGGAACGAACTCGCACTACCGTCTAAATACGTGAATTTCCTGTATTTAGCGTCCCATTACGAGAAGTTGAAAGGTTCACCTGAAGATAACGAACAGAAGCAACTTTTTGTTGAGCAGCACAAACATTATCTCGACGAAATCATAGAGCAAATTTCGGAATTCAGTAAGAGAGTCATCCTAGCTGATGCCAATCTGGACAAAGTATTAAGCGCATACAACAAGCACAGGGATAAACCCATACGTGAGCAGGCGGAAAATATTATCCATTTGTTTACTCTTACCAACCTCGGCGCTCCAGCCGCATTCAAGTATTTTGACACAACGATAGATCGCAAACGATACACTTCTACCAAGGAGGTGCTAGACGCGACACTGATTCACCAATCCATCACGGGATTATATGAAACTCGGATAGATTTGTCACAGCTTGGGGGTGACGGATCCCCCAAGAAGAAGAGGAAAGTCTCGAGCGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGGCTGCAGGA
Figure 2022546608000016
いくつかの実施形態では、野生型Cas9は、Streptococcus pyogenes由来のCas9(NCBI参照配列: NC_002737.2(以下のヌクレオチド配列); 及びUniprot参照配列:Q99ZW2(以下のアミノ酸配列)に対応する:
ATGGATAAGAAATACTCAATAGGCTTAGATATCGGCACAAATAGCGTCGGATGGGCGGTGATCACTGATGAATATAAGGTTCCGTCTAAAAAGTTCAAGGTTCTGGGAAATACAGACCGCCACAGTATCAAAAAAAATCTTATAGGGGCTCTTTTATTTGACAGTGGAGAGACAGCGGAAGCGACTCGTCTCAAACGGACAGCTCGTAGAAGGTATACACGTCGGAAGAATCGTATTTGTTATCTACAGGAGATTTTTTCAAATGAGATGGCGAAAGTAGATGATAGTTTCTTTCATCGACTTGAAGAGTCTTTTTTGGTGGAAGAAGACAAGAAGCATGAACGTCATCCTATTTTTGGAAATATAGTAGATGAAGTTGCTTATCATGAGAAATATCCAACTATCTATCATCTGCGAAAAAAATTGGTAGATTCTACTGATAAAGCGGATTTGCGCTTAATCTATTTGGCCTTAGCGCATATGATTAAGTTTCGTGGTCATTTTTTGATTGAGGGAGATTTAAATCCTGATAATAGTGATGTGGACAAACTATTTATCCAGTTGGTACAAACCTACAATCAATTATTTGAAGAAAACCCTATTAACGCAAGTGGAGTAGATGCTAAAGCGATTCTTTCTGCACGATTGAGTAAATCAAGACGATTAGAAAATCTCATTGCTCAGCTCCCCGGTGAGAAGAAAAATGGCTTATTTGGGAATCTCATTGCTTTGTCATTGGGTTTGACCCCTAATTTTAAATCAAATTTTGATTTGGCAGAAGATGCTAAATTACAGCTTTCAAAAGATACTTACGATGATGATTTAGATAATTTATTGGCGCAAATTGGAGATCAATATGCTGATTTGTTTTTGGCAGCTAAGAATTTATCAGATGCTATTTTACTTTCAGATATCCTAAGAGTAAATACTGAAATAACTAAGGCTCCCCTATCAGCTTCAATGATTAAACGCTACGATGAACATCATCAAGACTTGACTCTTTTAAAAGCTTTAGTTCGACAACAACTTCCAGAAAAGTATAAAGAAATCTTTTTTGATCAATCAAAAAACGGATATGCAGGTTATATTGATGGGGGAGCTAGCCAAGAAGAATTTTATAAATTTATCAAACCAATTTTAGAAAAAATGGATGGTACTGAGGAATTATTGGTGAAACTAAATCGTGAAGATTTGCTGCGCAAGCAACGGACCTTTGACAACGGCTCTATTCCCCATCAAATTCACTTGGGTGAGCTGCATGCTATTTTGAGAAGACAAGAAGACTTTTATCCATTTTTAAAAGACAATCGTGAGAAGATTGAAAAAATCTTGACTTTTCGAATTCCTTATTATGTTGGTCCATTGGCGCGTGGCAATAGTCGTTTTGCATGGATGACTCGGAAGTCTGAAGAAACAATTACCCCATGGAATTTTGAAGAAGTTGTCGATAAAGGTGCTTCAGCTCAATCATTTATTGAACGCATGACAAACTTTGATAAAAATCTTCCAAATGAAAAAGTACTACCAAAACATAGTTTGCTTTATGAGTATTTTACGGTTTATAACGAATTGACAAAGGTCAAATATGTTACTGAAGGAATGCGAAAACCAGCATTTCTTTCAGGTGAACAGAAGAAAGCCATTGTTGATTTACTCTTCAAAACAAATCGAAAAGTAACCGTTAAGCAATTAAAAGAAGATTATTTCAAAAAAATAGAATGTTTTGATAGTGTTGAAATTTCAGGAGTTGAAGATAGATTTAATGCTTCATTAGGTACCTACCATGATTTGCTAAAAATTATTAAAGATAAAGATTTTTTGGATAATGAAGAAAATGAAGATATCTTAGAGGATATTGTTTTAACATTGACCTTATTTGAAGATAGGGAGATGATTGAGGAAAGACTTAAAACATATGCTCACCTCTTTGATGATAAGGTGATGAAACAGCTTAAACGTCGCCGTTATACTGGTTGGGGACGTTTGTCTCGAAAATTGATTAATGGTATTAGGGATAAGCAATCTGGCAAAACAATATTAGATTTTTTGAAATCAGATGGTTTTGCCAATCGCAATTTTATGCAGCTGATCCATGATGATAGTTTGACATTTAAAGAAGACATTCAAAAAGCACAAGTGTCTGGACAAGGCGATAGTTTACATGAACATATTGCAAATTTAGCTGGTAGCCCTGCTATTAAAAAAGGTATTTTACAGACTGTAAAAGTTGTTGATGAATTGGTCAAAGTAATGGGGCGGCATAAGCCAGAAAATATCGTTATTGAAATGGCACGTGAAAATCAGACAACTCAAAAGGGCCAGAAAAATTCGCGAGAGCGTATGAAACGAATCGAAGAAGGTATCAAAGAATTAGGAAGTCAGATTCTTAAAGAGCATCCTGTTGAAAATACTCAATTGCAAAATGAAAAGCTCTATCTCTATTATCTCCAAAATGGAAGAGACATGTATGTGGACCAAGAATTAGATATTAATCGTTTAAGTGATTATGATGTCGATCACATTGTTCCACAAAGTTTCCTTAAAGACGATTCAATAGACAATAAGGTCTTAACGCGTTCTGATAAAAATCGTGGTAAATCGGATAACGTTCCAAGTGAAGAAGTAGTCAAAAAGATGAAAAACTATTGGAGACAACTTCTAAACGCCAAGTTAATCACTCAACGTAAGTTTGATAATTTAACGAAAGCTGAACGTGGAGGTTTGAGTGAACTTGATAAAGCTGGTTTTATCAAACGCCAATTGGTTGAAACTCGCCAAATCACTAAGCATGTGGCACAAATTTTGGATAGTCGCATGAATACTAAATACGATGAAAATGATAAACTTATTCGAGAGGTTAAAGTGATTACCTTAAAATCTAAATTAGTTTCTGACTTCCGAAAAGATTTCCAATTCTATAAAGTACGTGAGATTAACAATTACCATCATGCCCATGATGCGTATCTAAATGCCGTCGTTGGAACTGCTTTGATTAAGAAATATCCAAAACTTGAATCGGAGTTTGTCTATGGTGATTATAAAGTTTATGATGTTCGTAAAATGATTGCTAAGTCTGAGCAAGAAATAGGCAAAGCAACCGCAAAATATTTCTTTTACTCTAATATCATGAACTTCTTCAAAACAGAAATTACACTTGCAAATGGAGAGATTCGCAAACGCCCTCTAATCGAAACTAATGGGGAAACTGGAGAAATTGTCTGGGATAAAGGGCGAGATTTTGCCACAGTGCGCAAAGTATTGTCCATGCCCCAAGTCAATATTGTCAAGAAAACAGAAGTACAGACAGGCGGATTCTCCAAGGAGTCAATTTTACCAAAAAGAAATTCGGACAAGCTTATTGCTCGTAAAAAAGACTGGGATCCAAAAAAATATGGTGGTTTTGATAGTCCAACGGTAGCTTATTCAGTCCTAGTGGTTGCTAAGGTGGAAAAAGGGAAATCGAAGAAGTTAAAATCCGTTAAAGAGTTACTAGGGATCACAATTATGGAAAGAAGTTCCTTTGAAAAAAATCCGATTGACTTTTTAGAAGCTAAAGGATATAAGGAAGTTAAAAAAGACTTAATCATTAAACTACCTAAATATAGTCTTTTTGAGTTAGAAAACGGTCGTAAACGGATGCTGGCTAGTGCCGGAGAATTACAAAAAGGAAATGAGCTGGCTCTGCCAAGCAAATATGTGAATTTTTTATATTTAGCTAGTCATTATGAAAAGTTGAAGGGTAGTCCAGAAGATAACGAACAAAAACAATTGTTTGTGGAGCAGCATAAGCATTATTTAGATGAGATTATTGAGCAAATCAGTGAATTTTCTAAGCGTGTTATTTTAGCAGATGCCAATTTAGATAAAGTTCTTAGTGCATATAACAAACATAGAGACAAACCAATACGTGAACAAGCAGAAAATATTATTCATTTATTTACGTTGACGAATCTTGGAGCTCCCGCTGCTTTTAAATATTTTGATACAACAATTGATCGTAAACGATATACGTCTACAAAAGAAGTTTTAGATGCCACTCTTATCCATCAATCCATCACTGGTCTTTATGAAACACGCATTGATTTGAGTCAGCTAGGAGGTGACTGA
Figure 2022546608000017
いくつかの実施形態では、Cas9とは、Corynebacterium ulcerans (NCBI Refs: NC_015683.1, NC_017317.1); Corynebacterium diphtheria (NCBI Refs: NC_016782.1, NC_016786.1); Spiroplasma syrphidicola (NCBI Ref: NC_021284.1); Prevotella intermedia (NCBI Ref: NC_017861.1); Spiroplasma taiwanense (NCBI Ref: NC_021846.1); Streptococcus iniae (NCBI Ref: NC_021314.1); Belliella baltica (NCBI Ref: NC_018010.1); Psychroflexus torquisI (NCBI Ref: NC_018721.1); Streptococcus thermophilus (NCBI Ref: YP_820832.1); Listeria innocua (NCBI Ref: NP_472073.1); Campylobacter jejuni (NCBI Ref: YP_002344900.1); もしくはNeisseria meningitidis(NCBI Ref: YP_002342100.1)に由来するCas9または任意の他の生物に由来するCas9を指す。
バリアント及び相同体を含む、追加のCas9タンパク質(例えば、ヌクレアーゼ不活性Cas9(dCas9)、Cas9ニッカーゼ(nCas9)、またはヌクレアーゼ活性Cas9)が、本開示の範囲内にあることを理解されたい。例示的なCas9タンパク質として、以下に示すタンパク質が挙げられるが、これらに限定されない。いくつかの実施形態では、Cas9タンパク質は、ヌクレアーゼ不活性Cas9(dCas9)である。いくつかの実施形態では、Cas9タンパク質は、Cas9ニッカーゼ(nCas9)である。いくつかの実施形態では、Cas9タンパク質は、ヌクレアーゼ活性Cas9である。
いくつかの実施形態では、Cas9ドメインは、ヌクレアーゼ不活性Cas9ドメイン(dCas9)である。例えば、dCas9ドメインは、二本鎖核酸分子のいずれかの鎖を切断することなく、二本鎖核酸分子に(例えば、gRNA分子を介して)結合し得る。いくつかの実施形態では、ヌクレアーゼ不活性dCas9ドメインは、本明細書に記載のアミノ酸配列のD10X変異及びH840X変異、または本明細書中で提供する任意のアミノ酸配列における対応する変異を含み、Xは任意のアミノ酸変化である。いくつかの実施形態では、ヌクレアーゼ不活性dCas9ドメインは、本明細書に記載のアミノ酸配列のD10A変異及びH840A変異、または本明細書中で提供する任意のアミノ酸配列における対応する変異を含む。一例として、ヌクレアーゼ不活性Cas9ドメインは、クローニングベクターpPlatTET-gRNA2(登録番号BAV54124)に記載されているアミノ酸配列を含む。
例示的な触媒的に不活性なCas9(dCas9)のアミノ酸配列は以下の通りである:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
(例えば、Qi et al., “Repurposing CRISPR as an RNA-guided platform for sequence-specific control of gene expression.” Cell.2013; 152(5): 1173-83を参照のこと; その全内容は、参照により本明細書に援用される)。
追加の適切なヌクレアーゼ不活性dCas9ドメインは、本開示及び当技術分野の知見に基づいて当業者には明らかであり、本開示の範囲内にある。そのような追加の例示的な適切なヌクレアーゼ不活性Cas9ドメインとして、D10A/H840A、D10A/D839A/H840A、及びD10A/D839A/H840A/N863A変異ドメインが挙げられるが、これらに限定されない(例えば、Prashant et al., CAS9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering. Nature Biotechnology. 2013; 31 (9): 833-838を参照のこと(その全内容は参照により本明細書に援用される))。
いくつかの実施形態では、Cas9ヌクレアーゼは、不活性(例えば、不活性化)DNA切断ドメインを有し、すなわち、Cas9は、「nCas9」タンパク質(「ニッカーゼ」Cas9)と呼ばれるニッカーゼである。ヌクレアーゼ不活性化Cas9タンパク質は、「dCas9」タンパク質(ヌクレアーゼ「不活性な」Cas9)または触媒的に不活性なCas9として、同じ意味で呼ばれ得る。不活性なDNA切断ドメインを有するCas9タンパク質(またはその断片)の生成方法は公知である(例えば、Jinek et al., Science. 337: 816-821 (2012); Qi et al., “Repurposing CRISPR as an RNA-Guided Platform for Sequence-Specific Control of Gene Expression” (2013) Cell. 28; 152 (5): 1173-83を参照されたい(それぞれの全内容は参照により本明細書に援用される))。例えば、Cas9のDNA切断ドメインには、HNHヌクレアーゼサブドメインとRuvC1サブドメインの2つのサブドメインが含まれることが知られている。HNHサブドメインはgRNAに相補的な鎖を切断し、一方、RuvC1サブドメインは非相補的な鎖を切断する。これらのサブドメイン内の変異は、Cas9のヌクレアーゼ活性をサイレンシングし得る。例えば、変異D10A及びH840Aは、S. pyogenes Cas9のヌクレアーゼ活性を完全に不活性化する(Jinek et al., Science. 337: 816-821 (2012); Qi et al., Cell. 28; 152 (5): 1173-83 (2013))。
いくつかの実施形態では、dCas9ドメインは、本明細書中で提供するdCas9ドメインのいずれか1つに対して、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。いくつかの実施形態では、Cas9ドメインは、本明細書に記載のアミノ酸配列のいずれか1つと比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50以上またはそれ以上の変異を有するアミノ酸配列を含む。いくつかの実施形態では、Cas9ドメインは、本明細書に記載のアミノ酸配列のいずれか1つと比較して、少なくとも10、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも150、少なくとも200、少なくとも250、少なくとも300、少なくとも350、少なくとも400、少なくとも500、少なくとも600、少なくとも700、少なくとも800、少なくとも900、少なくとも1000、少なくとも1100、または少なくとも1200の同一の連続アミノ酸残基を有するアミノ酸配列を含む。
いくつかの実施形態では、dCas9は、Cas9ヌクレアーゼ活性を不活性化する1つ以上の変異を有するCas9アミノ酸配列に対応するか、または部分的または全体的にそれを含む。いくつかの実施形態では、ヌクレアーゼ不活性dCas9ドメインは、本明細書に記載のアミノ酸配列のD10X変異及びH840X変異、または本明細書中で提供するアミノ酸配列のいずれかにおける対応する変異を含み、Xは任意のアミノ酸変化である。いくつかの実施形態では、ヌクレアーゼ不活性dCas9ドメインは、本明細書に記載のアミノ酸配列のD10A変異及びH840A変異、または本明細書中で提供するアミノ酸配列のいずれかにおける対応する変異を含む。いくつかの実施形態では、ヌクレアーゼ不活性Cas9ドメインは、クローニングベクターpPlatTET-gRNA2(登録番号BAV54124)に記載のアミノ酸配列を含む。
いくつかの実施形態では、dCas9は、dCas9のアミノ酸配列(D10A及びH840A)を含む:
Figure 2022546608000018
いくつかの実施形態では、例示的な触媒的に不活性なCas9(dCas9)のアミノ酸配列は、以下の通りである:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
(例えば、Qi et al., “Repurposing CRISPR as an RNA-guided platform for sequence-specific control of gene expression.” Cell. 2013; 152 (5): 1173-83を参照のこと(その全内容は参照により本明細書に援用される))。
いくつかの実施形態では、例示的な触媒的に不活性なCas9(dCas9)のアミノ酸配列は、以下の通りである:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
いくつかの実施形態では、Cas9ドメインは、D10A変異を含み、一方、位置840の残基は、上記で提供したアミノ酸配列中のヒスチジンのままであるか、または本明細書中で提供するアミノ酸配列のいずれかの対応する位置にある。
他の実施形態では、D10A及びH840A以外の変異を有するdCas9バリアントを提供し、これは、例えば、ヌクレアーゼ不活性化Cas9(dCas9)をもたらす。そのような変異は、例として、D10及びH840での他のアミノ酸置換、またはCas9のヌクレアーゼドメイン内の他の置換(例えば、HNHヌクレアーゼサブドメイン及び/またはRuvC1サブドメインでの置換)を含む。いくつかの実施形態では、少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一であるdCas9のバリアントまたは相同体を提供する。いくつかの実施形態では、約5アミノ酸、約10アミノ酸、約15アミノ酸、約20アミノ酸、約25アミノ酸、約30アミノ酸、約40アミノ酸、約50アミノ酸、約75アミノ酸、約100アミノ酸またはそれ以上、短いかまたは長いアミノ酸配列を有するdCas9のバリアントを提供する。
追加の適切なヌクレアーゼ不活性dCas9ドメインは、本開示及び当技術分野の知見に基づいて当業者には明らかであり、本開示の範囲内にある。そのような追加の例示的な適切なヌクレアーゼ不活性Cas9ドメインとして、D10A/H840A、D10A/D839A/H840A、及びD10A/D839A/H840A/N863A変異ドメインが挙げられるが、これらに限定されない(例えば、Prashant et al., CAS9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering. Nature Biotechnology. 2013; 31 (9): 833-838を参照のこと(その全内容は参照により本明細書に援用される))。
いくつかの実施形態では、Cas9ドメインは、Cas9ニッカーゼである。Cas9ニッカーゼは、二本鎖核酸分子(例えば、二本鎖DNA分子)の1本の鎖のみを切断することができるCas9タンパク質であり得る。いくつかの実施形態では、Cas9ニッカーゼは、二本鎖核酸分子の標的鎖を切断するが、これは、Cas9ニッカーゼが、Cas9に結合するgRNA(例えば、sgRNA)と塩基対形成する(相補的である)鎖を切断することを意味する。いくつかの実施形態では、Cas9ニッカーゼは、D10A変異を含み、そして840位にヒスチジンを有する。いくつかの実施形態では、Cas9ニッカーゼは、二本鎖核酸分子の非標的非塩基編集鎖を切断するが、これは、Cas9ニッカーゼが、Cas9に結合するgRNA(例えば、sgRNA)と塩基対形成しない鎖を切断することを意味する。いくつかの実施形態では、Cas9ニッカーゼは、H840A変異を含みかつ10位にアスパラギン酸残基を有し、または対応する変異を有する。いくつかの実施形態では、Cas9ニッカーゼは、本明細書中で提供するCas9ニッカーゼのいずれか1つに対して、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。さらなる適切なCas9ニッカーゼは、本開示及び当技術分野の知識に基づいて当業者には明らかであり、そして本開示の範囲内である。
例示的な触媒性Cas9ニッカーゼ(nCas9)のアミノ酸配列は以下の通りである:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
いくつかの実施形態では、Cas9は、単細胞原核微生物のドメイン及び界を構成する古細菌(例えば、ナノ古細菌)由来のCas9を指す。いくつかの実施形態では、プログラム可能なヌクレオチド結合タンパク質は、例えば、Burstein et al., “New CRISPR-Cas systems from uncultivated microbes.” Cell Res. 2017 Feb 21. doi: 10.1038/cr.2017.21に記載されているCasXまたはCasYタンパク質であってもよく、その全内容は、参照により本明細書に援用される。ゲノム分解メタゲノミクスを使用して、古細菌の生命領域で最初に報告されたCas9を含め複数のCRISPR-Cas系が同定された。この多様なCas9タンパク質は、活性CRISPR-Cas系の一部として、ほとんど研究されていないナノ古細菌で発見された。細菌では、これまで知られていなかった2つの系、CRISPR-CasXとCRISPR-CasYが発見され、これらは、これまでに発見された中で最もコンパクトな系の1つである。いくつかの実施形態では、本明細書に記載の塩基エディターシステムにおいて、Cas9は、CasX、またはCasXのバリアントによって置き換えられる。いくつかの実施形態では、本明細書に記載の塩基エディターシステムにおいて、Cas9は、CasY、またはCasYのバリアントによって置き換えられる。他のRNAガイドDNA結合タンパク質を、核酸プログラム可能なDNA結合タンパク質(napDNAbp)として使用してもよく、そして本開示の範囲内にあることが理解されるべきである。
いくつかの実施形態では、本明細書中で提供する融合タンパク質のいずれかの核酸プログラム可能なDNA結合タンパク質(napDNAbp)は、CasXまたはCasYタンパク質であり得る。いくつかの実施形態では、napDNAbpはCasXタンパク質である。いくつかの実施形態では、napDNAbpはCasYタンパク質である。いくつかの実施形態では、napDNAbpは、天然のCasXまたはCasYタンパク質に対して、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。いくつかの実施形態では、プログラム可能なヌクレオチド結合タンパク質は、天然のCasXまたはCasYタンパク質である。いくつかの実施形態では、プログラム可能なヌクレオチド結合タンパク質は、本明細書に記載する任意のCasXまたはCasYタンパク質に対して、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。他の細菌種由来のCasX及びCasYもまた、本開示に従って使用してもよいことが理解されるべきである。
例示的なCasX((uniprot.org/uniprot/F0NN87; uniprot.org/uniprot/F0NH53)tr|F0NN87|F0NN87_SULIHCRISPR関連Casxタンパク質OS=Sulfolobus islandicus(HVE10/4株)GN=SiH_0402 PE=4 SV=1)アミノ酸配列は以下の通りである:
MEVPLYNIFGDNYIIQVATEAENSTIYNNKVEIDDEELRNVLNLAYKIAKNNEDAAAERRGKAKKKKGEEGETTTSNIILPLSGNDKNPWTETLKCYNFPTTVALSEVFKNFSQVKECEEVSAPSFVKPEFYEFGRSPGMVERTRRVKLEVEPHYLIIAAAGWVLTRLGKAKVSEGDYVGVNVFTPTRGILYSLIQNVNGIVPGIKPETAFGLWIARKVVSSVTNPNVSVVRIYTISDAVGQNPTTINGGFSIDLTKLLEKRYLLSERLEAIARNALSISSNMRERYIVLANYIYEYLTGSKRLEDLLYFANRDLIMNLNSDDGKVRDLKLISAYVNGELIRGEG。
例示的なCasX(>tr|F0NH53|F0NH53_SULIR CRISPR関連タンパク質、Casx OS=Sulfolobus islandicus(REY15A株)GN=SiRe_0771 PE=4 SV=1)アミノ酸配列は以下の通りである:
MEVPLYNIFGDNYIIQVATEAENSTIYNNKVEIDDEELRNVLNLAYKIAKNNEDAAAERRGKAKKKKGEEGETTTSNIILPLSGNDKNPWTETLKCYNFPTTVALSEVFKNFSQVKECEEVSAPSFVKPEFYKFGRSPGMVERTRRVKLEVEPHYLIMAAAGWVLTRLGKAKVSEGDYVGVNVFTPTRGILYSLIQNVNGIVPGIKPETAFGLWIARKVVSSVTNPNVSVVSIYTISDAVGQNPTTINGGFSIDLTKLLEKRDLLSERLEAIARNALSISSNMRERYIVLANYIYEYLTGSKRLEDLLYFANRDLIMNLNSDDGKVRDLKLISAYVNGELIRGEG。
デルタプロテオバクテリア(Deltaproteobacteria)CasX
MEKRINKIRKKLSADNATKPVSRSGPMKTLLVRVMTDDLKKRLEKRRKKPEVMPQVISNNAANNLRMLLDDYTKMKEAILQVYWQEFKDDHVGLMCKFAQPASKKIDQNKLKPEMDEKGNLTTAGFACSQCGQPLFVYKLEQVSEKGKAYTNYFGRCNVAEHEKLILLAQLKPVKDSDEAVTYSLGKFGQRALDFYSIHVTKESTHPVKPLAQIAGNRYASGPVGKALSDACMGTIASFLSKYQDIIIEHQKVVKGNQKRLESLRELAGKENLEYPSVTLPPQPHTKEGVDfAYNEVIARVRMWVNLNLWQKLKLSRDDAKPLLRLKGFPSFPVVERRENEVDWWNTINEVKKLIDAKRDMGRVFWSGVTAEKRNTILEGYNYLPNENDHKKREGSLENPKKPAKRQFGDLLLYLEKKYAGDWGKVFDEAWERIDKKIAGLTSHIEREEARNAEDAQSKAVLTDWLRAKASFVLERLKEMDEKEFYACEIQLQKWYGDLRGNPFAVEAENRVVDISGFSIGSDGHSIQYRNLLAWKYLENGKREFYLLMNYGKKGRIRFTDGTDIKKSGKWQGLLYGGGKAKVIDLTFDPDDEQLIILPLAFGTRQGREFIWNDLLSLETGLIKLANGRVIEKTIYNKKIGRDEPALFVALTFERREVVDPSNIKPVNLIGVARGENIPAVIALTDPEGCPLPEFKDSSGGPTDILRIGEGYKEKQRAIQAAKEVEQRRAGGYSRKFASKSRNLADDMVRNSARDLFYHAVTHDAVLVFANLSRGFGRQGKRTFMTERQYTKMEDWLTAKLAYEGLTSKTYLSKTLAQYTSKTCSNCGFTITYADMDVMLVRLKKTSDGWATTLNNKELKAEYQITYYNRYKRQTVEKELSAELDRLSEESGNNDISKWTKGRRDEALFLLKKRFSHRPVQEQFVCLDCGHEVHAAEQAALNIARSWLFLNSNSTEFKSYKSGKQPFVGAWQAFYKRRLKEVWKPNA
例示的なCasY((ncbi.nlm.nih.gov/protein/APG80656.1)>APG80656.1CRISPR関連タンパク質CasY[未培養パークバクテリア(Parcubacteria)群細菌])アミノ酸配列は以下の通りである:
MSKRHPRISGVKGYRLHAQRLEYTGKSGAMRTIKYPLYSSPSGGRTVPREIVSAINDDYVGLYGLSNFDDLYNAEKRNEEKVYSVLDFWYDCVQYGAVFSYTAPGLLKNVAEVRGGSYELTKTLKGSHLYDELQIDKVIKFLNKKEISRANGSLDKLKKDIIDCFKAEYRERHKDQCNKLADDIKNAKKDAGASLGERQKKLFRDFFGISEQSENDKPSFTNPLNLTCCLLPFDTVNNNRNRGEVLFNKLKEYAQKLDKNEGSLEMWEYIGIGNSGTAFSNFLGEGFLGRLRENKITELKKAMMDITDAWRGQEQEEELEKRLRILAALTIKLREPKFDNHWGGYRSDINGKLSSWLQNYINQTVKIKEDLKGHKKDLKKAKEMINRFGESDTKEEAVVSSLLESIEKIVPDDSADDEKPDIPAIAIYRRFLSDGRLTLNRFVQREDVQEALIKERLEAEKKKKPKKRKKKSDAEDEKETIDFKELFPHLAKPLKLVPNFYGDSKRELYKKYKNAAIYTDALWKAVEKIYKSAFSSSLKNSFFDTDFDKDFFIKRLQKIFSVYRRFNTDKWKPIVKNSFAPYCDIVSLAENEVLYKPKQSRSRKSAAIDKNRVRLPSTENIAKAGIALARELSVAGFDWKDLLKKEEHEEYIDLIELHKTALALLLAVTETQLDISALDFVENGTVKDFMKTRDGNLVLEGRFLEMFSQSIVFSELRGLAGLMSRKEFITRSAIQTMNGKQAELLYIPHEFQSAKITTPKEMSRAFLDLAPAEFATSLEPESLSEKSLLKLKQMRYYPHYFGYELTRTGQGIDGGVAENALRLEKSPVKKREIKCKQYKTLGRGQNKIVLYVRSSYYQTQFLEWFLHRPKNVQTDVAVSGSFLIDEKKVKTRWNYDALTVALEPVSGSERVFVSQPFTIFPEKSAEEEGQRYLGIDIGEYGIAYTALEITGDSAKILDQNFISDPQLKTLREEVKGLKLDQRRGTFAMPSTKIARIRESLVHSLRNRIHHLALKHKAKIVYELEVSRFEEGKQKIKKVYATLKKADVYSEIDADKNLQTTVWGKLAVASEISASYTSQFCGACKKLWRAEMQVDETITTQELIGTVRVIKGGTLIDAIKDFMRPPIFDENDTPFPKYRDFCDKHHISKKMRGNSCLFICPFCRANADADIQASQTIALLRYVKEEKKVEDYFERFRKLKNIKVLGQMKKI。
Cas9ヌクレアーゼは、RuvCとHNHの2つの機能的なエンドヌクレアーゼドメインを有する。Cas9は、標的結合時にコンフォメーション変化を起こし、それにより、標的DNAの反対側の鎖を切断するようにヌクレアーゼドメインが配置される。Cas9を介したDNA切断の最終結果は、標的DNA内の二本鎖切断(DSB)である(PAM配列の約3~4ヌクレオチド上流)。結果として得られるDSBは、以下の2つの一般的な修復経路のいずれかによって修復される: (1)効率的であるがエラーが発生しやすい非相同末端結合(NHEJ)経路; または(2)効率は低いが、忠実度の高い相同組換え修復(HDR)経路。
非相同末端結合(NHEJ)及び/または相同組換え修復(HDR)の「効率」は、任意の簡便な方法で計算することができる。例えば、いくつかの場合では、効率を、成功したHDRの割合で表すことができる。例えば、サーベイヤーヌクレアーゼアッセイを使用して切断産物を生成することができ、基質に対する産物の比率を使用して割合を計算することができる。例えば、HDRが成功した結果として新たに組み込まれた制限酵素配列を含むDNAを直接切断する、サーベイヤーヌクレアーゼ酵素を使用することができる。切断される基質が多いほど、HDRの割合が高いこと(HDRの効率が高いこと)を示す。説明のための例として、HDRの割合(百分率)は、以下の式を使用して計算することができる[(切断産物)/(基質と切断産物)](例えば、(b+c)/(a+b+c)、式中、「a」はDNA基質のバンド強度、「b」及び「c」は切断産物である)。
いくつかの場合では、効率を、成功したNHEJの割合で表すことができる。例えば、T7エンドヌクレアーゼIアッセイを使用して切断産物を生成し、基質に対する産物の比率を使用してNHEJの割合を計算することができる。T7エンドヌクレアーゼIは、野生型と変異型のDNA鎖のハイブリダイゼーションから生じるミスマッチのヘテロ二本鎖DNAを切断する(NHEJは、元の切断部位に小さなランダムな挿入(insertions)または欠失(deletions)(インデル:indel)を生成する)。切断が多いほど、NHEJの割合が高いこと(NHEJの効率が高いこと)を示す。説明のための例として、NHEJの割合(百分率)は、以下の式を使用して計算することができる: (1-(1-(b+c)/(a+b+c))1/2)×100、式中、「a」はDNA基質のバンド強度であり、「b」及び「c」は切断産物である(Ran et. al., Cell. 2013 Sep. 12; 154 (6): 1380-9;及びRan et al., Nat Protoc. 2013 Nov.; 8 (11): 2281-2308)。
NHEJ修復経路は最も活発な修復機構であり、DSB部位で小さなヌクレオチドの挿入または削除(インデル)を頻繁に引き起こす。Cas9とgRNAまたはガイドポリヌクレオチドを発現する細胞の集団は多様な変異を生じ得るため、NHEJを介したDSB修復のランダム性は重要な実用上の意味を有している。ほとんどの場合、NHEJは、標的DNAに小さなインデルを生じさせ、その結果、アミノ酸の欠失、挿入、またはフレームシフト変異が生じ、標的遺伝子のオープンリーディングフレーム(ORF)内で未成熟終止コドンを生じさせる。理想的な最終結果は、標的遺伝子内の機能喪失型変異である。
NHEJを介したDSB修復は遺伝子のオープンリーディングフレームを破壊することがよくあるが、相同組換え修復(HDR)を使用して、単一ヌクレオチドの変化からフルオロフォアやタグの付加などの大きな挿入までの特定のヌクレオチド変化を生成することができる。HDRを遺伝子編集に利用するために、目的の配列を含むDNA修復テンプレートを、gRNA(複数可)及びCas9またはCas9ニッカーゼと共に目的の細胞型に送達することができる。修復テンプレートには、所望の編集、ならびに標的のすぐ上流及び下流の追加の相同配列(左右の相同性アームと呼ばれる)を含めることができる。各相同性アームの長さは、導入する変化のサイズに依存し得、挿入が大きいほど、より長い相同性アームが必要になる。修復テンプレートは、一本鎖オリゴヌクレオチド、二本鎖オリゴヌクレオチド、または二本鎖DNAプラスミドであり得る。また、Cas9、gRNA、及び外来性修復テンプレートを発現する細胞でも、HDRの効率は一般に低い(改変される対立遺伝子の10%未満)。HDRは、細胞周期のS期とG2期に発生するため、細胞を同期させることでHDRの効率を高めることができる。NHEJに関与する遺伝子を化学的または遺伝的に阻害することも、HDR頻度を増加させ得る。
いくつかの実施形態では、Cas9は、改変されたCas9である。所与のgRNA標的化配列は、ゲノム全体にわたり部分的な相同性が存在するところに追加の部位を有し得る。これらの部位はオフターゲットと呼ばれ、gRNAを設計する際に考慮する必要がある。gRNA設計の最適化に加えて、Cas9の改変を通じてCRISPRの特異性を高めることもできる。Cas9は、RuvCとHNHの2つのヌクレアーゼドメインの複合活性を介して二本鎖切断(DSB)を生成する。SpCas9のD10A変異体であるCas9ニッカーゼは、1つのヌクレアーゼドメインを保持し、DSBではなくDNAニックを生成する。ニッカーゼ系は、特定の遺伝子編集のためにHDRを介した遺伝子編集と組み合わせることもできる。
いくつかの場合では、Cas9は、バリアントCas9タンパク質である。バリアントCas9ポリペプチドは、野生型Cas9タンパク質のアミノ酸配列と比較した場合、1つのアミノ酸が異なっている(例えば、欠失、挿入、置換、融合を有する)アミノ酸配列を有する。いくつかの場合では、バリアントCas9ポリペプチドは、Cas9ポリペプチドのヌクレアーゼ活性を低下させるアミノ酸変化(例えば、欠失、挿入、または置換)を有する。例えば、いくつかの場合では、バリアントCas9ポリペプチドは、対応する野生型Cas9タンパク質のヌクレアーゼ活性の50%未満、40%未満、30%未満、20%未満、10%未満、5%未満、または1%未満を有する。いくつかの場合では、バリアントCas9タンパク質は、実質的なヌクレアーゼ活性を有さない。対象のCas9タンパク質が、実質的なヌクレアーゼ活性を有さないバリアントCas9タンパク質である場合、それは「dCas9」と呼ばれ得る。
いくつかの場合では、バリアントCas9タンパク質は、低いヌクレアーゼ活性を有する。例えば、バリアントCas9タンパク質は、野生型Cas9タンパク質(例えば野生型Cas9タンパク質)のエンドヌクレアーゼ活性の約20%未満、約15%未満、約10%未満、約5%未満、約1%未満、または約0.1%未満を示す。
いくつかの場合では、バリアントCas9タンパク質は、ガイド標的配列の相補鎖を切断することができるが、二本鎖ガイド標的配列の非相補鎖を切断する能力が低下している。例えば、バリアントCas9タンパク質は、RuvCドメインの機能を低下させる変異(アミノ酸置換)を有し得る。非限定的な例として、いくつかの実施形態では、バリアントCas9タンパク質は、D10A(アミノ酸位置10でアスパラギン酸からアラニンへ)を有し、したがって二本鎖ガイド標的配列の相補鎖を切断することができるが、二本鎖ガイド標的配列の非相補鎖を切断する能力が低下している(したがって、バリアントCas9タンパク質が二本鎖標的核酸を切断するときに二本鎖切断(DSB)の代わりに一本鎖切断(SSB)を生じさせる)(例えば、Jinek et al., Science. 2012 Aug. 17; 337 (6096): 816-21を参照のこと)。
いくつかの場合では、バリアントCas9タンパク質は、二本鎖ガイド標的配列の非相補鎖を切断することができるが、ガイド標的配列の相補鎖を切断する能力が低下している。例えば、バリアントCas9タンパク質は、HNHドメイン(RuvC/HNH/RuvCドメインモチーフ)の機能を低下させる変異(アミノ酸置換)を有し得る。非限定的な例として、いくつかの実施形態では、バリアントCas9タンパク質は、H840A(アミノ酸位置840でヒスチジンからアラニンへの)変異を有し、したがってガイド標的配列の非相補鎖を切断することができるが、ガイド標的配列の相補鎖を切断する能力が低下している(したがって、バリアントCas9タンパク質が二本鎖ガイド標的配列を切断するときに、DSBではなくSSBを生じさせる)。そのようなCas9タンパク質は、ガイド標的配列(例えば、一本鎖ガイド標的配列)を切断する能力が低下しているが、ガイド標的配列(例えば、一本鎖ガイド標的配列)に結合する能力は保持している。
いくつかの場合では、バリアントCas9タンパク質は、二本鎖標的DNAの相補鎖と非相補鎖の両方を切断する能力が低下している。非限定的な例として、いくつかの場合では、バリアントCas9タンパク質は、D10A及びH840A変異の両方を含み、それにより、このポリペプチドは、二本鎖標的DNAの相補鎖及び非相補鎖の両方を切断する能力が低下している。そのようなCas9タンパク質は、標的DNA(例えば、一本鎖標的DNA)を切断する能力が低下しているが、標的DNA(例えば、一本鎖標的DNA)に結合する能力は保持している。
別の非限定的な例として、いくつかの場合では、バリアントCas9タンパク質は、W476A及びW1126A変異を有し、それにより、このポリペプチドは、標的DNAを切断する能力が低下している。そのようなCas9タンパク質は、標的DNA(例えば、一本鎖標的DNA)を切断する能力が低下しているが、標的DNA(例えば、一本鎖標的DNA)に結合する能力は保持している。
別の非限定的な例として、いくつかの場合では、バリアントCas9タンパク質は、P475A、W476A、N477A、D1125A、W1126A、及びD1127A変異を有し、それにより、このポリペプチドは、標的DNAを切断する能力が低下している。そのようなCas9タンパク質は、標的DNA(例えば、一本鎖標的DNA)を切断する能力が低下しているが、標的DNA(例えば、一本鎖標的DNA)に結合する能力は保持している。
別の非限定的な例として、いくつかの場合では、バリアントCas9タンパク質は、H840A、W476A、及びW1126A変異を有し、それにより、このポリペプチドは、標的DNAを切断する能力が低下している。そのようなCas9タンパク質は、標的DNA(例えば、一本鎖標的DNA)を切断する能力が低下しているが、標的DNA(例えば、一本鎖標的DNA)に結合する能力は保持している。別の非限定的な例として、いくつかの場合では、バリアントCas9タンパク質は、H840A、D10A、W476A、及びW1126A変異を有し、それにより、このポリペプチドは、標的DNAを切断する能力が低下している。そのようなCas9タンパク質は、標的DNA(例えば、一本鎖標的DNA)を切断する能力が低下しているが、標的DNA(例えば、一本鎖標的DNA)に結合する能力は保持している。いくつかの実施形態では、バリアントCas9は、Cas9 HNHドメイン(A840H)の840位に触媒的His残基を回復させている。
別の非限定的な例として、いくつかの場合では、バリアントCas9タンパク質は、H840A、P475A、W476A、N477A、D1125A、W1126A、及びD1127A変異を有し、それにより、このポリペプチドは、標的DNAを切断する能力が低下している。そのようなCas9タンパク質は、標的DNA(例えば、一本鎖標的DNA)を切断する能力が低下しているが、標的DNA(例えば、一本鎖標的DNA)に結合する能力は保持している。別の非限定的な例として、いくつかの場合では、バリアントCas9タンパク質は、D10A、H840A、P475A、W476A、N477A、D1125A、W1126A、及びD1127A変異を有し、それにより、このポリペプチドは、標的DNAを切断する能力が低下している。そのようなCas9タンパク質は、標的DNA(例えば、一本鎖標的DNA)を切断する能力が低下しているが、標的DNA(例えば、一本鎖標的DNA)に結合する能力は保持している。いくつかの場合では、バリアントCas9タンパク質がW476A及びW1126A変異を含む場合、またはバリアントCas9タンパク質がP475A、W476A、N477A、D1125A、W1126A、及びD1127A変異を含む場合、バリアントCas9タンパク質はPAM配列に効率的に結合しない。したがって、いくつかのそのような場合、そのようなバリアントCas9タンパク質を結合方法で使用する場合、方法はPAM配列を必要としない。言い換えれば、いくつかの場合では、そのようなバリアントCas9タンパク質を結合方法で使用する場合、方法はガイドRNAを含むことができるが、方法はPAM配列がなくても実施することができる(そして結合の特異性はしたがって、ガイドRNAの標的化セグメントによって提供される)。上記の効果を達成するために他の残基を変異させることができる(すなわち、1つまたは他のヌクレアーゼ部分を不活性化する)。非限定的な例として、残基D10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D986、及び/またはA987を改変する(すなわち、置換する)ことができる。また、アラニン置換以外の変異も適している。
いくつかの実施形態では、触媒活性が低下したバリアントCas9タンパク質(例えば、Cas9タンパク質が、D10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D986、及び/またはA987変異、例えば、D10A、G12A、G17A、E762A、H840A、N854A、N863A、H982A、H983A、A984A、及び/またはD986Aを有する場合)、バリアントCas9タンパク質は、ガイドRNAと相互作用する能力を保持している限り、依然として部位特異的な方法で標的DNAに結合することができる(ガイドRNAによって標的DNA配列にガイドされるため)。
いくつかの実施形態では、バリアントCasタンパク質は、spCas9、spCas9-VRQR、spCas9-VRER、xCas9(sp)、saCas9、saCas9-KKH、SpCas9-MQKFRAER、spCas9-MQKSER、spCas9-LRKIQK、またはspCas9-LRVSQLであり得る。
いくつかの実施形態では、アミノ酸置換D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、及びT1337R(SpCas9-MQKFRAER)を含み、改変PAM5’-NGC-3’に対する特異性を有する改変SpCas9を使用する。
S. pyogenes Cas9の代替物は、哺乳類細胞で切断活性を示すCpf1ファミリーのRNAガイドエンドヌクレアーゼを含み得る。Prevotella及びFrancisella 1由来のCRISPR(CRISPR/Cpf1)は、CRISPR/Cas9系に類似したDNA編集技術である。Cpf1は、クラスII CRISPR/Cas系のRNAガイドエンドヌクレアーゼである。この獲得免疫機構は、Prevotella菌及びFrancisella菌において認められる。Cpf1遺伝子は、CRISPR遺伝子座に関連付けられており、ガイドRNAを使用してウイルスDNAを見つけて切断するエンドヌクレアーゼをコードする。Cpf1は、Cas9よりも小さくて単純なエンドヌクレアーゼであり、CRISPR/Cas9系の制限のいくつかを克服している。Cas9ヌクレアーゼとは異なり、Cpf1を介したDNA切断の結果は、短い3’オーバーハングを伴う二本鎖切断である。Cpf1の互い違いの切断パターンは、従来の制限酵素クローニングと同様に、方向性のある遺伝子導入を利用可能とすることができ、遺伝子編集の効率を高めることができる。上記のCas9バリアント及びオルソログと同様に、Cpf1もまた、CRISPRによって標的とすることができる部位の数を、SpCas9が選好するNGG PAM部位を欠くATリッチ領域またはATリッチゲノムにまで拡張することができる。Cpf1遺伝子座には、混合α/βドメイン、RuvC-Iとそれに続くヘリカル領域、RuvC-II、及びジンクフィンガー様ドメインが含まれている。Cpf1タンパク質は、Cas9のRuvCドメインに類似したRuvC様エンドヌクレアーゼドメインを有する。さらに、Cpf1は、HNHエンドヌクレアーゼドメインを有さず、Cpf1のN末端にはCas9のαヘリカル認識ローブがない。Cpf1 CRISPR-Casドメインアーキテクチャは、Cpf1が機能的にユニークであり、クラス2、V型CRISPR系として分類されることを示している。Cpf1遺伝子座は、II型系よりもI型及びIII型に類似したCas1、Cas2、及びCas4タンパク質をコードする。機能的Cpf1は、トランス活性化CRISPR RNA(tracrRNA)を必要とせず、したがってCRISPR(crRNA)のみが必要である。これは、Cpf1がCas9よりも小さいだけでなく、より小さいsgRNA分子(Cas9の約半分のヌクレオチド)を有することから、ゲノム編集に有効である。Cpf1-crRNA複合体は、Cas9が標的とするGリッチPAMとは対照的に、プロトスペーサー隣接モチーフ5’-YTN-3’を同定することにより、標的DNAまたはRNAを切断する。PAMの同定後、Cpf1は4または5ヌクレオチドのオーバーハングの粘着末端様DNA二本鎖切断を導入する。
いくつかの実施形態では、Cas9は、改変されたPAM配列に対する特異性を有するCas9バリアントである。いくつかの実施形態では、追加のCas9バリアント及びPAM配列は、Miller, S. M. et al. Continuous evolution of SpCas9 variants compatible with non-G PAMs, Nat.Biotechnol. (2020)に記載されており、その全体が参照により本明細書に援用される。いくつかの実施形態では、Cas9バリアントは、特定のPAM要件を有さない。いくつかの実施形態では、Cas9バリアント、例えば、SpCas9バリアントは、NRNH PAM(配列中、Rは、AまたはGであり、Hは、A、C、またはTである)に対して特異性を有する。いくつかの実施形態では、SpCas9バリアントは、PAM配列AAA、TAA、CAA、GAA、TAT、GAT、またはCACに対して特異性を有する。いくつかの実施形態では、SpCas9バリアントは、位置1114、1134、1135、1137、1339、1151、1180、1188、1211、1218、1219、1221、1249、1256、1264、1290、1318、1317、1320、1321、1323、1332、1333、1335、1337、もしくは1339またはそれらに対応する位置にアミノ酸置換を有する。いくつかの実施形態では、SpCas9バリアントは、位置1114、1135、1218、1219、1221、1249、1320、1321、1323、1332、1333、1335、もしくは1337、またはそれらに対応する位置にアミノ酸置換を含む。いくつかの実施形態では、SpCas9バリアントは、位置1114、1134、1135、1137、1339、1151、1180、1188、1211、1219、1221、1256、1264、1290、1318、1317、1320、1323、1333またはそれに対応する位置にアミノ酸置換を有する。いくつかの実施形態では、SpCas9バリアントは、位置1114、1131、1135、1150、1156、1180、1191、1218、1219、1221、1227、1249、1253、1286、1293、1320、1321、1332、1335、1339またはそれに対応する位置にアミノ酸置換を有する。いくつかの実施形態では、SpCas9バリアントは、位置1114、1227、1135、1180、1207、1219、1234、1286、1301、1332、1335、1337、1338、1349またはそれに対応する位置にアミノ酸置換を含む。SpCas9バリアントの例示的なアミノ酸置換及びPAM特異性を表1A~1Dに示す。
Figure 2022546608000019

Figure 2022546608000020

Figure 2022546608000021

Figure 2022546608000022
いくつかの実施形態では、Cas9は、Neisseria meningitidis Cas9(NmeCas9)またはそのバリアントである。いくつかの実施形態では、NmeCas9は、NNNNGAYW PAMに対する特異性を有し、配列中、Yは、CまたはTであり、Wは、AまたはTである。いくつかの実施形態では、NmeCas9は、NNNNGYTT PAMに対する特異性を有し、配列中、Yは、CまたはTである。いくつかの実施形態では、NmeCas9は、NNNNGTCT PAMに対する特異性を有する。いくつかの実施形態では、NmeCas9は、Nme1 Cas9である。いくつかの実施形態では、NmeCas9は、NNNNGATT PAM、NNNNCCTA PAM、NNNNCCTC PAM、NNNNCCTT PAM、NNNNCCTG PAM、NNNNCCGT PAM、NNNNCCGGPAM、NNNNCCCA PAM、NNNNCCCT PAM、NNNNCCCC PAM、NNNNCCAT PAM、NNNNCCAG PAM、NNNNCCAT PAM、またはNNNGATT PAMに対する特異性を有する。いくつかの実施形態では、Nme1Cas9は、NNNNGATT PAM、NNNNCCTA PAM、NNNNCCTC PAM、NNNNCCTT PAM、またはNNNNCCTG PAMに対する特異性を有する。いくつかの実施形態では、NmeCas9は、CAA PAM、CAAA PAM、またはCCA PAMに対して特異性を有する。いくつかの実施形態では、NmeCas9はNme2 Cas9である。いくつかの実施形態では、NmeCas9は、NNNNCC(N4CC)PAMに対する特異性を有し、配列中、Nは、A、G、C、またはTのいずれか1つである。いくつかの実施形態では、NmeCas9は、NNNNCCGT PAM、NNNNCCGGPAM、NNNNCCCA PAM、NNNNCCCT PAM、NNNNCCCC PAM、NNNNCCAT PAM、NNNNCCAG PAM、NNNNCCAT PAM、またはNNNGATT PAMに対する特異性を有する。いくつかの実施形態では、NmeCas9はNme3Cas9である。いくつかの実施形態では、NmeCas9は、NNNNCAAA PAM、NNNNCC PAM、またはNNNNCNNN PAMに対して特異性を有する。Edraki et al. Mol. Cell. (2019) 73 (4): 714-726に記載されている追加のNmeCas9の特性及びPAM配列は、その全体が参照により本明細書に援用される。
Nme1Cas9の例示的なアミノ酸配列を以下に示す:
II型CRISPR RNAガイドエンドヌクレアーゼCas9[Neisseria meningitidis]WP_002235162.1
Figure 2022546608000023
Nme2Cas9の例示的なアミノ酸配列を以下に示す:
II型CRISPR RNAガイドエンドヌクレアーゼCas9[Neisseria meningitidis]WP_002230835.1
Figure 2022546608000024
核酸塩基エディターのCas12ドメイン
通常、微生物CRISPR-Cas系はクラス1系とクラス2系に分けられる。クラス1系は、マルチサブユニットエフェクター複合体を有し、クラス2系は、単一のタンパク質エフェクターを有する。例えば、Cas9とCpf1は、タイプは異なるが(それぞれ、II型及びV型)、クラス2エフェクターである。Cpf1に加えて、クラス2のV型CRISPR-Cas系には、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i、及びCas12j/CasΦも含まれる。例えば、Shmakov et al., “Discovery and Functional Characterization of Diverse Class 2 CRISPR Cas Systems,” Mol. Cell, 2015 Nov. 5; 60 (3): 385-397; Makarova et al., “Classification and Nomenclature of CRISPR-Cas Systems: Where from Here?” CRISPR Journal, 2018, 1 (5): 325-336;及びYan et al., “Functionally Diverse Type V CRISPR-Cas Systems, “Science, 2019 Jan. 4; 363: 88-91を参照のこと(それぞれの全内容は、参照により本明細書に援用される)。V型Casタンパク質は、RuvC(またはRuvC様)エンドヌクレアーゼドメインを有する。成熟CRISPR RNA(crRNA)の生成は、一般的にtracrRNA非依存的であるが、例えば、Cas12b/C2c1は、crRNAの生成にtracrRNAを必要とする。Cas12b/C2c1は、DNA切断をcrRNAとtracrRNAの両方に依存する。
本発明で企図される核酸プログラム可能なDNA結合タンパク質には、クラス2のV型として分類されるCasタンパク質(Cas12タンパク質)が含まれる。Casクラス2、V型タンパク質の非限定的な例として、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i、及びCas12j/CasΦ相同体、またはその改変バージョンが挙げられる。本明細書中で使用する場合、Cas12タンパク質は、Cas12ヌクレアーゼ、Cas12ドメイン、またはCas12タンパク質ドメインと呼ばれ得る。いくつかの実施形態では、本発明のCas12タンパク質は、デアミナーゼドメインなどの内部的に融合したタンパク質ドメインによって中断されたアミノ酸配列を含む。
いくつかの実施形態では、Cas12ドメインは、ヌクレアーゼ不活性なCas12ドメインまたはCas12ニッカーゼである。いくつかの実施形態では、Cas12ドメインは、ヌクレアーゼ活性ドメインである。例えば、Cas12ドメインは、二本鎖核酸(例えば、二本鎖DNA分子)の一本鎖にニックを入れるCas12ドメインであり得る。いくつかの実施形態では、Cas12ドメインは、本明細書に記載のアミノ酸配列のいずれか1つを含む。いくつかの実施形態では、Cas12ドメインは、本明細書に記載のアミノ酸配列のいずれか1つに対して、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。いくつかの実施形態では、Cas12ドメインは、本明細書に記載のアミノ酸配列のいずれか1つと比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50またはそれ以上の変異を有するアミノ酸配列を含む。いくつかの実施形態では、Cas12ドメインは、本明細書に記載のアミノ酸配列のいずれか1つと比較して、少なくとも10、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも150、少なくとも200、少なくとも250、少なくとも300、少なくとも350、少なくとも400、少なくとも500、少なくとも600、少なくとも700、少なくとも800、少なくとも900、少なくとも1000、少なくとも1100、または少なくとも1200の同一の連続アミノ酸残基を有するアミノ酸配列を含む。
いくつかの実施形態では、Cas12の断片を含むタンパク質を提供する。例えば、いくつかの実施形態では、タンパク質は、(1)Cas12のgRNA結合ドメイン; または(2)Cas12のDNA切断ドメインという2つのCas12ドメインのうちの1つを含む。いくつかの実施形態では、Cas12またはその断片を含むタンパク質は、「Cas12バリアント」と呼ばれる。Cas12バリアントは、Cas12またはその断片と相同性を共有する。例えば、Cas12バリアントは、野生型Cas12と、少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一である。いくつかの実施形態では、Cas12バリアントは、野生型Cas12と比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50またはそれ以上のアミノ酸変化を有し得る。いくつかの実施形態では、Cas12バリアントは、Cas12の断片(例えば、gRNA結合ドメインまたはDNA切断ドメイン)を含み、その結果、断片は、野生型Cas12の対応する断片に対して、少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくとも約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一である。いくつかの実施形態では、断片は、対応する野生型Cas12のアミノ酸長の、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%同一、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%である。いくつかの実施形態では、断片は、少なくとも100アミノ酸長である。いくつかの実施形態では、断片は、少なくとも100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、または少なくとも1300アミノ酸長である。
いくつかの実施形態では、Cas12は、Cas12ヌクレアーゼ活性を変化させる1つ以上の変異を有するCas12アミノ酸配列に対応するか、またはその一部もしくは全体を含む。そのような変異には、例えば、Cas12のRuvCヌクレアーゼドメイン内のアミノ酸置換が含まれる。いくつかの実施形態では、野生型Cas12に対して、少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少なくとも約99.9%同一であるCas12のバリアントまたは相同体を提供する。いくつかの実施形態では、約5アミノ酸、約10アミノ酸、約15アミノ酸、約20アミノ酸、約25アミノ酸、約30アミノ酸、約40アミノ酸、約50アミノ酸、約75アミノ酸、約100アミノ酸またはそれ以上短いか、または長いアミノ酸配列を有するCas12のバリアントを提供する。
いくつかの実施形態では、本明細書中で提供するCas12融合タンパク質は、Cas12タンパク質の全長アミノ酸配列、例えば、本明細書中で提供するCas12配列の1つを含む。しかしながら、他の実施形態では、本明細書中で提供する融合タンパク質は、全長のCas12配列を含まず、その1つ以上の断片のみを含む。本明細書において、適切なCas12ドメインの例示的なアミノ酸配列を提供し、Cas12ドメイン及び断片の追加の適切な配列は、当業者には明らかであろう。
一般的に、クラス2のV型Casタンパク質は、単一の機能的なRuvCエンドヌクレアーゼドメインを有する(例えば、Chen et al., “CRISPR-Cas12a target binding unleashes indiscriminate single-stranded DNase activity,” Science 360: 436-439 (2018)を参照のこと)。いくつかの場合では、Cas12タンパク質は、バリアントCas12bタンパク質である。(Strecker et al., Nature Communications, 2019, 10 (1): Art. No.: 212を参照のこと)。一実施形態では、バリアントCas12ポリペプチドは、野生型Cas12タンパク質のアミノ酸配列と比較した場合に、1、2、3、4、5またはそれ以上のアミノ酸が異なる(例えば、欠失、挿入、置換、融合を有する)アミノ酸配列を有する。いくつかの例では、バリアントCas12ポリペプチドは、Cas12ポリペプチドの活性を低下させるアミノ酸変化(例えば、欠失、挿入、または置換)を有する。例えば、いくつかの例では、バリアントCas12は、対応する野生型Cas12bタンパク質のニッカーゼ活性の50%未満、40%未満、30%未満、20%未満、10%未満、5%未満、または1%未満を有するCas12bポリペプチドである。いくつかの場合では、バリアントCas12bタンパク質は、実質的なニッカーゼ活性を有さない。
いくつかの場合では、バリアントCas12bタンパク質は、低下したニッカーゼ活性を有する。例えば、バリアントCas12bタンパク質は、野生型Cas12bタンパク質のニッカーゼ活性の約20%未満、約15%未満、約10%未満、約5%未満、約1%未満、または約0.1%未満を示す。
いくつかの実施形態では、Cas12タンパク質は、哺乳類細胞において活性を示すCas12a/Cpf1ファミリー由来のRNAガイドエンドヌクレアーゼを含む。Prevotella及びFrancisella 1由来のCRISPR (CRISPR/Cpf1)は、CRISPR/Cas9系に類似したDNA編集技術である。Cpf1は、クラスII CRISPR/Cas系のRNAガイドエンドヌクレアーゼである。この獲得免疫機構は、Prevotella及びFrancisella 1菌に見出される。Cpf1遺伝子は、CRISPR遺伝子座に関連付けられており、ガイドRNAを使用してウイルスDNAを見つけて切断するエンドヌクレアーゼをコードしている。Cpf1はCas9よりも小さくて単純なエンドヌクレアーゼであり、CRISPR/Cas9系の制限のいくつかを克服している。Cas9ヌクレアーゼとは異なり、Cpf1を介したDNA切断の結果は、短い3’オーバーハングを伴う二本鎖切断である。Cpf1の付着端型の切断パターンは、従来の制限酵素クローニングと同様に、定方向性の遺伝子導入の可能性を広げ、遺伝子編集の効率を高めることができる。上記のCas9バリアント及びオルソログと同様に、Cpf1は、CRISPRによって標的とすることができる部位の数を、SpCas9が好むNGG PAM部位を欠くATリッチ領域またはATリッチゲノムに拡張することもできる。Cpf1遺伝子座には、混合α/βドメイン、RuvC-Iとそれに続くヘリカル領域、RuvC-II、及びジンクフィンガー様ドメインが含まれる。Cpf1タンパク質は、Cas9のRuvCドメインに類似したRuvC様エンドヌクレアーゼドメインを有する。さらに、Cpf1はCas9とは異なり、HNHエンドヌクレアーゼドメインを有さず、Cpf1のN末端にはCas9のαヘリカル認識ローブがない。Cpf1 CRISPR-Casドメインアーキテクチャは、Cpf1が機能的にユニークであり、クラス2、V型CRISPR系として分類されていることを示す。Cpf1遺伝子座は、Cas1、Cas2、及びCas4タンパク質をコードし、II型系よりもI型及びIII型に類似している。機能的Cpf1は、トランス活性化CRISPR RNA (tracrRNA)を必要とせず、したがってCRISPR (crRNA)のみが必要である。これは、Cpf1がCas9よりも小さいだけでなく、sgRNA分子も小さい(Cas9のおよそ半分のヌクレオチド数)ため、ゲノム編集に有用である。Cpf1-crRNA複合体は、Cas9が標的とするGリッチPAMとは対照的に、プロトスペーサー隣接モチーフ5’-YTN-3’または5’-TTTN-3’を識別することにより、標的DNAまたはRNAを切断する。PAMの識別後、Cpf1は、4または5ヌクレオチドのオーバーハングを有する粘着末端様のDNA二本鎖切断を導入する。
本発明のいくつかの態様では、対応する野生型酵素に対して変異導入されたCRISPR酵素をコードする(その結果、変異導入されたCRISPR酵素が、標的配列を含む標的ポリヌクレオチドの一方または両方の鎖を切断する能力を欠く)ベクターを使用することができる。Cas12は、野生型の例示的なCas12ポリペプチド(例えば、Bacillus hisashii由来のCas12)に対して、少なくとも(または少なくとも約)50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、もしくは100%の配列同一性及び/または配列相同性を有するポリペプチドを指し得る。Cas12は、野生型の例示的なCas12ポリペプチド(例えば、Bacillus hisashii (BhCas12b)、Bacillus種V3-13 (BvCas12b)、及びAlicyclobacillus acidiphilus (AaCas12b)由来)に対して、最大または最大約50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、もしくは100%の配列同一性及び/または配列相同性を有するポリペプチドを指し得る。Cas12は、欠失、挿入、置換、バリアント、変異、融合、キメラ、またはそれらの任意の組み合わせなどのアミノ酸変化を含み得るCas12タンパク質の野生型または改変形態を指し得る。
いくつかの実施形態では、BhCas12bガイドポリヌクレオチドは、以下の配列を有する:
BhCas12b sgRNA足場(下線付き)+20nt~23ntのガイド配列(Nnで示す)
Figure 2022546608000025
いくつかの実施形態では、BvCas12b及びAaCas12bガイドポリヌクレオチドは、以下の配列を有する:
BvCas12b sgRNA足場(下線付き)+20nt~23ntのガイド配列(Nnで示す)
Figure 2022546608000026
AaCas12b sgRNA足場(下線付き)+20nt~23ntのガイド配列(Nnで示す)
Figure 2022546608000027
核酸プログラム可能なDNA結合タンパク質
本開示のいくつかの態様は、核酸プログラム可能なDNA結合タンパク質として作用するドメインを含む融合タンパク質を提供し、これは、塩基エディターなどのタンパク質を特定の核酸(例えば、DNAまたはRNA)配列にガイドするために使用され得る。特定の実施形態では、融合タンパク質は、核酸プログラム可能なDNA結合タンパク質ドメイン及びデアミナーゼドメインを含む。核酸プログラム可能なDNA結合タンパク質の非限定的な例として、Cas9(例えば、dCas9及びnCas9)、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i及びCas12j/CasΦが挙げられる。Cas酵素の非限定的な例として、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5d、Cas5t、Cas5h、Cas5a、Cas6、Cas7、Cas8、Cas8a、Cas8b、Cas8c、Cas9(Csn1またはCsx12としても知られる)、Cas10、Cas10d、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i、Cas12j/CasΦ、Csy1、Csy2、Csy3、Csy4、Cse1、Cse2、Cse3、Cse4、Cse5e、Csc1、Csc2、Csa5、Csn1、Csn2、Csm1、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx1S、Csx11、Csf1、Csf2、CsO、Csf4、Csd1、Csd2、Cst1、Cst2、Csh1、Csh2、Csa1、Csa2、Csa3、Csa4、Csa5、II型Casエフェクタータンパク質、V型Casエフェクタータンパク質、VI型Casエフェクタータンパク質、CARF、DinG、それらの相同体、またはそれらの修飾もしくは改変バージョンが挙げられる。他の核酸プログラム可能なDNA結合タンパク質もまた、本開示の範囲内であるが、それらは、本開示に具体的に記載されていない場合がある。例えば、Makarova et al. “Classification and Nomenclature of CRISPR-Cas Systems: Where from Here?” CRISPR J. 2018 Oct; 1: 325-336. doi: 10.1089/crispr.2018.0033; Yan et al., “Functionally diverse type V CRISPR-Cas systems” Science. 2019 Jan 4; 363 (6422): 88-91. doi: 10.1126/science.aav7271を参照のこと(それぞれの全内容は、参照により本明細書に援用される)。
Cas9とは異なるPAM特異性を有する核酸プログラム可能なDNA結合タンパク質の一例は、Prevotella及び Francisella 1 (Cpf1)由来のClustered Regularly Interspaced Short Palindromic Repeatである。Cas9と同様に、Cpf1もまた、クラス2CRISPRエフェクターである。Cpf1は、Cas9とは異なる機能を備えてロバストなDNA干渉を媒介することが示されている。Cpf1は、tracrRNAを欠く単一のRNAガイドエンドヌクレアーゼであり、Tリッチなプロトスペーサー隣接モチーフ(TTN、TTTN、またはYTN)を利用する。さらに、Cpf1は、互い違いのDNA二本鎖切断を介してDNAを切断する。16種類のCpf1ファミリータンパク質のうち、Acidaminococcus及びLachnospiraceae由来の2つの酵素は、ヒト細胞で効率的なゲノム編集活性を有していることが示されている。Cpf1タンパク質は、当技術分野で公知であり、以前に、例えば、Yamano et al., “Crystal structure of Cpf1 in complex with guide RNA and target DNA.” Cell (165) 2016, p. 949-962に記載されており、その全内容は、参照により本明細書に援用される。
ガイドヌクレオチド配列でプログラム可能なDNA結合タンパク質ドメインとして使用され得るヌクレアーゼ不活性Cpf1(dCpf1)バリアントは、本組成物及び方法において有用である。Cpf1タンパク質は、Cas9のRuvCドメインに類似したRuvC様エンドヌクレアーゼドメインを有するが、HNHエンドヌクレアーゼドメインはなく、Cpf1のN末端にはCas9のαヘリカル認識ローブがない。Zetsche et al., Cell, 163, 759-771, 2015(参照により本明細書に援用される)において、Cpf1のRuvC様ドメインが両方のDNA鎖の切断に関与し、RuvC様ドメインの不活性化がCpf1ヌクレアーゼ活性を不活性化することを示している。例えば、Francisella novicida Cpf1のD917A、E1006A、またはD1255Aに対応する変異は、Cpf1ヌクレアーゼ活性を不活性化する。いくつかの実施形態では、本開示のdCpf1は、D917A、E1006A、D1255A、D917A/E1006A、D917A/D1255A、E1006A/D1255A、またはD917A/E1006A/D1255Aに対応する変異を含む。Cpf1のRuvCドメインを不活性化する任意の変異、例えば、置換変異、欠失、または挿入を、本開示に従って使用し得ることを理解されたい。
いくつかの実施形態では、本明細書中で提供する融合タンパク質のいずれかの核酸プログラム可能なDNA結合タンパク質(napDNAbp)は、Cpf1タンパク質であり得る。いくつかの実施形態では、Cpf1タンパク質は、Cpf1ニッカーゼ(nCpf1)である。いくつかの実施形態では、Cpf1タンパク質は、ヌクレアーゼ不活性Cpf1(dCpf1)である。いくつかの実施形態では、Cpf1、nCpf1、またはdCpf1は、本明細書に開示するCpf1配列に対して、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。いくつかの実施形態では、dCpf1は、本明細書に開示するCpf1配列に対して、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含み、D917A、E1006A、D1255A、D917A/E1006A、D917A/D1255A、E1006A/D1255A、またはD917A/E1006A/D1255Aに対応する変異を含む。他の細菌種由来のCpf1もまた、本開示に従って使用してもよいことが理解されるべきである。
野生型Francisella novicida Cpf1(D917、E1006、及びD1255には、太字で下線が引かれている)
Figure 2022546608000028
Francisella novicida Cpf1 D917A(A917、E1006、及びD1255には、太字で下線が引かれている)
Figure 2022546608000029
Francisella novicida Cpf1 E1006A(D917、A1006、及びD1255には、太字で下線が引かれている)
Figure 2022546608000030
Francisella novicida Cpf1 D1255A(D917、E1006、及びA1255には、太字で下線が引かれている)
Figure 2022546608000031
Francisella novicida Cpf1 D917A/E1006A(A917、A1006、及びD1255には、太字で下線が引かれている)
Figure 2022546608000032
Francisella novicida Cpf1 D917A/D1255A(A917、E1006、及びA1255には、太字で下線が引かれている)
Figure 2022546608000033
Francisella novicida Cpf1 E1006A/D1225A(D917、A1006、及びA1255には、太字で下線が引かれている)
Figure 2022546608000034
Francisella novicida Cpf1 D917A/E1006A/D1255A(A917、A1006、及びA1255には、太字で下線が引かれている)
Figure 2022546608000035
いくつかの実施形態では、融合タンパク質に存在するCas9ドメインの1つを、PAM配列を必要としないガイドヌクレオチド配列でプログラム可能なDNA結合タンパク質ドメインで置き換えてもよい。
いくつかの実施形態では、Cas9ドメインは、Staphylococcus aureus (SaCas9)由来のCas9ドメインである。いくつかの実施形態では、SaCas9ドメインは、ヌクレアーゼ活性SaCas9、ヌクレアーゼ不活性SaCas9 (SaCas9d)、またはSaCas9ニッカーゼ(SaCas9n)である。いくつかの実施形態では、SaCas9は、N579A変異、または本明細書中で提供するアミノ酸配列のいずれかにおける対応する変異を含む。
いくつかの実施形態では、SaCas9ドメイン、SaCas9dドメイン、またはSaCas9nドメインは、非標準PAMを有する核酸配列に結合することができる。いくつかの実施形態では、SaCas9ドメイン、SaCas9dドメイン、またはSaCas9nドメインは、NNGRRTまたはNNGRRT PAM配列を有する核酸配列に結合することができる。いくつかの実施形態では、SaCas9ドメインは、E781X、N967X、及びR1014X変異のうちの1つ以上、または本明細書中で提供するアミノ酸配列のいずれかにおける対応する変異を含み、Xは任意のアミノ酸である。いくつかの実施形態では、SaCas9ドメインは、E781K、N967K、及びR1014H変異のうちの1つ以上、または本明細書中で提供するアミノ酸配列のいずれかにおける1つ以上の対応する変異を含む。いくつかの実施形態では、SaCas9ドメインは、E781K、N967K、もしくはR1014H変異、または本明細書中で提供するアミノ酸配列のいずれかにおける対応する変異を含む。
例示的なSaCas9配列
Figure 2022546608000036
下線が引かれ太字で示されている上記の残基N579を変異させて(例えば、A579に)、SaCas9ニッカーゼを得てもよい。
例示的なSaCas9n配列
Figure 2022546608000037
残基N579から変異させてSaCas9ニッカーゼを得ることができる上記の残基A579には、下線が引かれ、太字で示されている。
例示的なSaKKH Cas9
Figure 2022546608000038
残基N579から変異させてSaCas9ニッカーゼを得ることができる上記の残基A579には、下線が引かれ、太字で示されている。E781、N967、及びR1014から変異させてSaKKH Cas9を得ることができる上記の残基K781、K967、及びH1014には、下線が引かれ、斜体で示されている。
いくつかの実施形態では、napDNAbpは循環置換体(circular permutant)である。以下の配列において、平文はアデノシンデアミナーゼ配列を示し、太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線が引かれた配列はバイパータイト核局在化配列を示し、二重下線が引かれた配列は変異を示す。
CP5(MSP「NGC」PID及び「D10A」ニッカーゼを有する):
Figure 2022546608000039
いくつかの実施形態では、核酸プログラム可能なDNA結合タンパク質(napDNAbp)は、微生物のCRISPR-Cas系の単一のエフェクターである。微生物CRISPR-Cas系の単一エフェクターには、限定されないが、Cas9、Cpf1、Cas12b/C2c1、及びCas12c/C2c3が含まれる。通常、微生物CRISPR-Cas系はクラス1系とクラス2系に分けられる。クラス1系はマルチサブユニットエフェクター複合体を有し、クラス2系は単一のタンパク質エフェクターを有する。例えば、Cas9及びCpf1は、クラス2エフェクターである。Cas9とCpf1に加えて、3つの異なるクラス2 CRISPR-Cas系(Cas12b/C2c1及びCas12c/C2c3)が、Shmakov et al., “Discovery and Functional Characterization of Diverse Class 2 CRISPR Cas Systems”, Mol. Cell, 2015 Nov. 5; 60 (3): 385-397に記載されている(その全内容は参照により本明細書に援用される)。系の2つのエフェクター、Cas12b/C2c1及びCas12c/C2c3は、Cpf1に関連するRuvC様のエンドヌクレアーゼドメインを含んでいる。第3の系は、2つの予測HEPN RNaseドメインを有するエフェクターを含む。成熟CRISPR RNAの生成は、Cas12b/C2c1によるCRISPR RNAの生成とは異なり、tracrRNAに依存しない。Cas12b/C2c1は、DNA切断に関して、CRISPR RNAとtracrRNAの両方に依存する。
キメラ単一分子ガイドRNA(sgRNA)と複合体を形成しているAlicyclobaccillus acidoterrastris Cas12b/C2c1(AacC2c1)の結晶構造が報告されている。例えば、Liu et al., “C2c1-sgRNA Complex Structure Reveals RNA-Guided DNA Cleavage Mechanism”, Mol. Cell, 2017 Jan. 19; 65 (2): 310-322を参照されたい(その全内容は参照により本明細書に援用される)。結晶構造は、三元複合体として標的DNAに結合したAlicyclobacillus acidoterrestris C2c1でも報告されている。例えば、Yang et al., “PAM-dependent Target DNA Recognition and Cleavage by C2C1 CRISPR-Cas endonuclease”, Cell, 2016 Dec. 15; 167 (7): 1814-1828を参照されたい(その全内容は参照により本明細書に援用される)。標的DNA鎖と非標的DNA鎖の両方で、単一のRuvC触媒ポケット内に独立して配置された、AacC2c1の触媒能力のあるコンフォメーションが捕捉されており、そこではCas12b/C2c1を介した切断が、標的DNAの7ヌクレオチド互い違いの切断をもたらす。Cas12b/C2c1三元複合体と以前に同定されたCas9及びCpf1の対応物との構造比較は、CRISPR-Cas9系で使用されるメカニズムの多様性を示している。
いくつかの実施形態では、本明細書中で提供する融合タンパク質のいずれかの核酸プログラム可能なDNA結合タンパク質(napDNAbp)は、Cas12b/C2c1またはCas12c/C2c3タンパク質であり得る。いくつかの実施形態では、napDNAbpはCas12b/C2c1タンパク質である。いくつかの実施形態では、napDNAbpはCas12c/C2c3タンパク質である。いくつかの実施形態では、napDNAbpは、天然のCas12b/C2c1またはCas12c/C2c3タンパク質に対して、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。いくつかの実施形態では、napDNAbpは、天然のCas12b/C2c1またはCas12c/C2c3タンパク質である。いくつかの実施形態では、napDNAbpは、本明細書中で提供するnapDNAbp配列のいずれか1つに対して、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。他の細菌種由来のCas12b/C2c1またはCas12c/C2c3もまた、本開示に従って使用してもよいことが理解されるべきである。
Cas12b/C2c1((uniprot.org/uniprot/T0D7A2#2)sp|T0D7A2|C2C1_ALIAG CRISPR関連エンドヌクレアーゼC2c1 OS=Alicyclobacillus acido-terrestris(株ATCC49025/DSM3922/CIP106132/NCIMB13137/GD3B)GN=c2c1 PE=1 SV=1)アミノ酸配列は以下の通りである:
MAVKSIKVKLRLDDMPEIRAGLWKLHKEVNAGVRYYTEWLSLLRQENLYRRSPNGDGEQECDKTAEECKAELLERLRARQVENGHRGPAGSDDELLQLARQLYELLVPQAIGAKGDAQQIARKFLSPLADKDAVGGLGIAKAGNKPRWVRMREAGEPGWEEEKEKAETRKSADRTADVLRALADFGLKPLMRVYTDSEMSSVEWKPLRKGQAVRTWDRDMFQQAIERMMSWESWNQRVGQEYAKLVEQKNRFEQKNFVGQEHLVHLVNQLQQDMKEASPGLESKEQTAHYVTGRALRGSDKVFEKWGKLAPDAPFDLYDAEIKNVQRRNTRRFGSHDLFAKLAEPEYQALWREDASFLTRYAVYNSILRKLNHAKMFATFTLPDATAHPIWTRFDKLGGNLHQYTFLFNEFGERRHAIRFHKLLKVENGVAREVDDVTVPISMSEQLDNLLPRDPNEPIALYFRDYGAEQHFTGEFGGAKIQCRRDQLAHMHRRRGARDVYLNVSVRVQSQSEARGERRPPYAAVFRLVGDNHRAFVHFDKLSDYLAEHPDDGKLGSEGLLSGLRVMSVDLGLRTSASISVFRVARKDELKPNSKGRVPFFFPIKGNDNLVAVHERSQLLKLPGETESKDLRAIREERQRTLRQLRTQLAYLRLLVRCGSEDVGRRERSWAKLIEQPVDAANHMTPDWREAFENELQKLKSLHGICSDKEWMDAVYESVRRVWRHMGKQVRDWRKDVRSGERPKIRGYAKDVVGGNSIEQIEYLERQYKFLKSWSFFGKVSGQVIRAEKGSRFAITLREHIDHAKEDRLKKLADRIIMEALGYVYALDERGKGKWVAKYPPCQLILLEELSEYQFNNDRPPSENNQLMQWSHRGVFQELINQAQVHDLLVGTMYAAFSSRFDARTGAPGIRCRRVPARCTQEHNPEPFPWWLNKFVVEHTLDACPLRADDLIPTGEGEIFVSPFSAEEGDFHQIHADLNAAQNLQQRLWSDFDISQIRLRCDWGEVDGELVLIPRLTGKRTADSYSNKVFYTNTGVTYYERERGKKRRKVFAQEKLSEEEAELLVEADEAREKSVVLMRDPSGIINRGNWTRQKEFWSMVNQRIEGYLVKQIRSRVPLQDSACENTGDI
AacCas12b (Alicyclobacillus acidiphilus)-WP_067623834
MAVKSMKVKLRLDNMPEIRAGLWKLHTEVNAGVRYYTEWLSLLRQENLYRRSPNGDGEQECYKTAEECKAELLERLRARQVENGHCGPAGSDDELLQLARQLYELLVPQAIGAKGDAQQIARKFLSPLADKDAVGGLGIAKAGNKPRWVRMREAGEPGWEEEKAKAEARKSTDRTADVLRALADFGLKPLMRVYTDSDMSSVQWKPLRKGQAVRTWDRDMFQQAIERMMSWESWNQRVGEAYAKLVEQKSRFEQKNFVGQEHLVQLVNQLQQDMKEASHGLESKEQTAHYLTGRALRGSDKVFEKWEKLDPDAPFDLYDTEIKNVQRRNTRRFGSHDLFAKLAEPKYQALWREDASFLTRYAVYNSIVRKLNHAKMFATFTLPDATAHPIWTRFDKLGGNLHQYTFLFNEFGEGRHAIRFQKLLTVEDGVAKEVDDVTVPISMSAQLDDLLPRDPHELVALYFQDYGAEQHLAGEFGGAKIQYRRDQLNHLHARRGARDVYLNLSVRVQSQSEARGERRPPYAAVFRLVGDNHRAFVHFDKLSDYLAEHPDDGKLGSEGLLSGLRVMSVDLGLRTSASISVFRVARKDELKPNSEGRVPFCFPIEGNENLVAVHERSQLLKLPGETESKDLRAIREERQRTLRQLRTQLAYLRLLVRCGSEDVGRRERSWAKLIEQPMDANQMTPDWREAFEDELQKLKSLYGICGDREWTEAVYESVRRVWRHMGKQVRDWRKDVRSGERPKIRGYQKDVVGGNSIEQIEYLERQYKFLKSWSFFGKVSGQVIRAEKGSRFAITLREHIDHAKEDRLKKLADRIIMEALGYVYALDDERGKGKWVAKYPPCQLILLEELSEYQFNNDRPPSENNQLMQWSHRGVFQELLNQAQVHDLLVGTMYAAFSSRFDARTGAPGIRCRRVPARCAREQNPEPFPWWLNKFVAEHKLDGCPLRADDLIPTGEGEFFVSPFSAEEGDFHQIHADLNAAQNLQRRLWSDFDISQIRLRCDWGEVDGEPVLIPRTTGKRTADSYGNKVFYTKTGVTYYERERGKKRRKVFAQEELSEEEAELLVEADEAREKSVVLMRDPSGIINRGDWTRQKEFWSMVNQRIEGYLVKQIRSRVRLQESACENTGDI
BhCas12b (Bacillus hisashii) NCBI参照配列: WP_095142515
MAPKKKRKVGIHGVPAAATRSFILKIEPNEEVKKGLWKTHEVLNHGIAYYMNILKLIRQEAIYEHHEQDPKNPKKVSKAEIQAELWDFVLKMQKCNSFTHEVDKDEVFNILRELYEELVPSSVEKKGEANQLSNKFLYPLVDPNSQSGKGTASSGRKPRWYNLKIAGDPSWEEEKKKWEEDKKKDPLAKILGKLAEYGLIPLFIPYTDSNEPIVKEIKWMEKSRNQSVRRLDKDMFIQALERFLSWESWNLKVKEEYEKVEKEYKTLEERIKEDIQALKALEQYEKERQEQLLRDTLNTNEYRLSKRGLRGWREIIQKWLKMDENEPSEKYLEVFKDYQRKHPREAGDYSVYEFLSKKENHFIWRNHPEYPYLYATFCEIDKKKKDAKQQATFTLADPINHPLWVRFEERSGSNLNKYRILTEQLHTEKLKKKLTVQLDRLIYPTESGGWEEKGKVDIVLLPSRQFYNQIFLDIEEKGKHAFTYKDESIKFPLKGTLGGARVQFDRDHLRRYPHKVESGNVGRIYFNMTVNIEPTESPVSKSLKIHRDDFPKVVNFKPKELTEWIKDSKGKKLKSGIESLEIGLRVMSIDLGQRQAAAASIFEVVDQKPDIEGKLFFPIKGTELYAVHRASFNIKLPGETLVKSREVLRKAREDNLKLMNQKLNFLRNVLHFQQFEDITEREKRVTKWISRQENSDVPLVYQDELIQIRELMYKPYKDWVAFLKQLHKRLEVEIGKEVKHWRKSLSDGRKGLYGISLKNIDEIDRTRKFLLRWSLRPTEPGEVRRLEPGQRFAIDQLNHLNALKEDRLKKMANTIIMHALGYCYDVRKKKWQAKNPACQIILFEDLSNYNPYEERSRFENSKLMKWSRREIPRQVALQGEIYGLQVGEVGAQFSSRFHAKTGSPGIRCSVVTKEKLQDNRFFKNLQREGRLTLDKIAVLKEGDLYPDKGGEKFISLSKDRKCVTTHADINAAQNLQKRFWTRTHGFYKVYCKAYQVDGQTVYIPESKDQKQKIIEEFGEGYFILKDGVYEWVNAGKLKIKKGSSKQSSSELVDSDILKDSFDLASELKGEKLMLYRDPSGNVFPSDKWMAAGVFFGKLERILISKLTNQYSISTIEDDSSKQSMKRPAATKKAGQAKKKK
いくつかの実施形態では、Cas12bは、BhCas12bのバリアントであり、BhCas12bと比較して以下の変化を含むBvCas12b (V4)である: S893R、K846R、及びE837G。BhCas12b (V4)は、以下のように表される: 5’mRNA Cap---5’UTR---bhCas12b---STOP配列---3’UTR---120polyAテール。
5’UTR:
GGGAAATAAGAGAGAAAAGAAGAGTAAGAAGAAATATAAGAGCCACC
3’UTR(TriLink標準UTR)
GCTGGAGCCTCGGTGGCCATGCTTCTTGCCCCTTGGGCCTCCCCCCAGCCCCTCCTCCCCTTCCTGCACCCGTACCCCCGTGGTCTTTGAATAAAGTCTGA
bhCas12b (V4)の核酸配列
ATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCCGCCACCAGATCCTTCATCCTGAAGATCGAGCCCAACGAGGAAGTGAAGAAAGGCCTCTGGAAAACCCACGAGGTGCTGAACCACGGAATCGCCTACTACATGAATATCCTGAAGCTGATCCGGCAAGAGGCCATCTACGAGCACCACGAGCAGGACCCCAAGAATCCCAAGAAGGTGTCCAAGGCCGAGATCCAGGCCGAGCTGTGGGATTTCGTGCTGAAGATGCAGAAGTGCAACAGCTTCACACACGAGGTGGACAAGGACGAGGTGTTCAACATCCTGAGAGAGCTGTACGAGGAACTGGTGCCCAGCAGCGTGGAAAAGAAGGGCGAAGCCAACCAGCTGAGCAACAAGTTTCTGTACCCTCTGGTGGACCCCAACAGCCAGTCTGGAAAGGGAACAGCCAGCAGCGGCAGAAAGCCCAGATGGTACAACCTGAAGATTGCCGGCGATCCCTCCTGGGAAGAAGAGAAGAAGAAGTGGGAAGAAGATAAGAAAAAGGACCCGCTGGCCAAGATCCTGGGCAAGCTGGCTGAGTACGGACTGATCCCTCTGTTCATCCCCTACACCGACAGCAACGAGCCCATCGTGAAAGAAATCAAGTGGATGGAAAAGTCCCGGAACCAGAGCGTGCGGCGGCTGGATAAGGACATGTTCATTCAGGCCCTGGAACGGTTCCTGAGCTGGGAGAGCTGGAACCTGAAAGTGAAAGAGGAATACGAGAAGGTCGAGAAAGAGTACAAGACCCTGGAAGAGAGGATCAAAGAGGACATCCAGGCTCTGAAGGCTCTGGAACAGTATGAGAAAGAGCGGCAAGAACAGCTGCTGCGGGACACCCTGAACACCAACGAGTACCGGCTGAGCAAGAGAGGCCTTAGAGGCTGGCGGGAAATCATCCAGAAATGGCTGAAAATGGACGAGAACGAGCCCTCCGAGAAGTACCTGGAAGTGTTCAAGGACTACCAGCGGAAGCACCCTAGAGAGGCCGGCGATTACAGCGTGTACGAGTTCCTGTCCAAGAAAGAGAACCACTTCATCTGGCGGAATCACCCTGAGTACCCCTACCTGTACGCCACCTTCTGCGAGATCGACAAGAAAAAGAAGGACGCCAAGCAGCAGGCCACCTTCACACTGGCCGATCCTATCAATCACCCTCTGTGGGTCCGATTCGAGGAAAGAAGCGGCAGCAACCTGAACAAGTACAGAATCCTGACCGAGCAGCTGCACACCGAGAAGCTGAAGAAAAAGCTGACAGTGCAGCTGGACCGGCTGATCTACCCTACAGAATCTGGCGGCTGGGAAGAGAAGGGCAAAGTGGACATTGTGCTGCTGCCCAGCCGGCAGTTCTACAACCAGATCTTCCTGGACATCGAGGAAAAGGGCAAGCACGCCTTCACCTACAAGGATGAGAGCATCAAGTTCCCTCTGAAGGGCACACTCGGCGGAGCCAGAGTGCAGTTCGACAGAGATCACCTGAGAAGATACCCTCACAAGGTGGAAAGCGGCAACGTGGGCAGAATCTACTTCAACATGACCGTGAACATCGAGCCTACAGAGTCCCCAGTGTCCAAGTCTCTGAAGATCCACCGGGACGACTTCCCCAAGGTGGTCAACTTCAAGCCCAAAGAACTGACCGAGTGGATCAAGGACAGCAAGGGCAAGAAACTGAAGTCCGGCATCGAGTCCCTGGAAATCGGCCTGAGAGTGATGAGCATCGACCTGGGACAGAGACAGGCCGCTGCCGCCTCTATTTTCGAGGTGGTGGATCAGAAGCCCGACATCGAAGGCAAGCTGTTTTTCCCAATCAAGGGCACCGAGCTGTATGCCGTGCACAGAGCCAGCTTCAACATCAAGCTGCCCGGCGAGACACTGGTCAAGAGCAGAGAAGTGCTGCGGAAGGCCAGAGAGGACAATCTGAAACTGATGAACCAGAAGCTCAACTTCCTGCGGAACGTGCTGCACTTCCAGCAGTTCGAGGACATCACCGAGAGAGAGAAGCGGGTCACCAAGTGGATCAGCAGACAAGAGAACAGCGACGTGCCCCTGGTGTACCAGGATGAGCTGATCCAGATCCGCGAGCTGATGTACAAGCCTTACAAGGACTGGGTCGCCTTCCTGAAGCAGCTCCACAAGAGACTGGAAGTCGAGATCGGCAAAGAAGTGAAGCACTGGCGGAAGTCCCTGAGCGACGGAAGAAAGGGCCTGTACGGCATCTCCCTGAAGAACATCGACGAGATCGATCGGACCCGGAAGTTCCTGCTGAGATGGTCCCTGAGGCCTACCGAACCTGGCGAAGTGCGTAGACTGGAACCCGGCCAGAGATTCGCCATCGACCAGCTGAATCACCTGAACGCCCTGAAAGAAGATCGGCTGAAGAAGATGGCCAACACCATCATCATGCACGCCCTGGGCTACTGCTACGACGTGCGGAAGAAGAAATGGCAGGCTAAGAACCCCGCCTGCCAGATCATCCTGTTCGAGGATCTGAGCAACTACAACCCCTACGAGGAAAGGTCCCGCTTCGAGAACAGCAAGCTCATGAAGTGGTCCAGACGCGAGATCCCCAGACAGGTTGCACTGCAGGGCGAGATCTATGGCCTGCAAGTGGGAGAAGTGGGCGCTCAGTTCAGCAGCAGATTCCACGCCAAGACAGGCAGCCCTGGCATCAGATGTAGCGTCGTGACCAAAGAGAAGCTGCAGGACAATCGGTTCTTCAAGAATCTGCAGAGAGAGGGCAGACTGACCCTGGACAAAATCGCCGTGCTGAAAGAGGGCGATCTGTACCCAGACAAAGGCGGCGAGAAGTTCATCAGCCTGAGCAAGGATCGGAAGTGCGTGACCACACACGCCGACATCAACGCCGCTCAGAACCTGCAGAAGCGGTTCTGGACAAGAACCCACGGCTTCTACAAGGTGTACTGCAAGGCCTACCAGGTGGACGGCCAGACCGTGTACATCCCTGAGAGCAAGGACCAGAAGCAGAAGATCATCGAAGAGTTCGGCGAGGGCTACTTCATTCTGAAGGACGGGGTGTACGAATGGGTCAACGCCGGCAAGCTGAAAATCAAGAAGGGCAGCTCCAAGCAGAGCAGCAGCGAGCTGGTGGATAGCGACATCCTGAAAGACAGCTTCGACCTGGCCTCCGAGCTGAAAGGCGAAAAGCTGATGCTGTACAGGGACCCCAGCGGCAATGTGTTCCCCAGCGACAAATGGATGGCCGCTGGCGTGTTCTTCGGAAAGCTGGAACGCATCCTGATCAGCAAGCTGACCAACCAGTACTCCATCAGCACCATCGAGGACGACAGCAGCAAGCAGTCTATGAAAAGGCCGGCGGCCACGAAAAAGGCCGGCCAGGCAAAAAAGAAAAAG
いくつかの実施形態では、Cas12bはBvCas12Bである。いくつかの実施形態では、Cas12bは、以下に示すBvCas12bの例示的な配列において付番されたアミノ酸置換S893R、K846R、及びE837Gを含む。
BvCas12b(Bacillus種V3-13)NCBI参照配列: WP_101661451.1
MAIRSIKLKMKTNSGTDSIYLRKALWRTHQLINEGIAYYMNLLTLYRQEAIGDKTKEAYQAELINIIRNQQRNNGSSEEHGSDQEILALLRQLYELIIPSSIGESGDANQLGNKFLYPLVDPNSQSGKGTSNAGRKPRWKRLKEEGNPDWELEKKKDEERKAKDPTVKIFDNLNKYGLLPLFPLFTNIQKDIEWLPLGKRQSVRKWDKDMFIQAIERLLSWESWNRRVADEYKQLKEKTESYYKEHLTGGEEWIEKIRKFEKERNMELEKNAFAPNDGYFITSRQIRGWDRVYEKWSKLPESASPEELWKVVAEQQNKMSEGFGDPKVFSFLANRENRDIWRGHSERIYHIAAYNGLQKKLSRTKEQATFTLPDAIEHPLWIRYESPGGTNLNLFKLEEKQKKNYYVTLSKIIWPSEEKWIEKENIEIPLAPSIQFNRQIKLKQHVKGKQEISFSDYSSRISLDGVLGGSRIQFNRKYIKNHKELLGEGDIGPVFFNLVVDVAPLQETRNGRLQSPIGKALKVISSDFSKVIDYKPKELMDWMNTGSASNSFGVASLLEGMRVMSIDMGQRTSASVSIFEVVKELPKDQEQKLFYSINDTELFAIHKRSFLLNLPGEVVTKNNKQQRQERRKKRQFVRSQIRMLANVLRLETKKTPDERKKAIHKLMEIVQSYDSWTASQKEVWEKELNLLTNMAAFNDEIWKESLVELHHRIEPYVGQIVSKWRKGLSEGRKNLAGISMWNIDELEDTRRLLISWSKRSRTPGEANRIETDEPFGSSLLQHIQNVKDDRLKQMANLIIMTALGFKYDKEEKDRYKRWKETYPACQIILFENLNRYLFNLDRSRRENSRLMKWAHRSIPRTVSMQGEMFGLQVGDVRSEYSSRFHAKTGAPGIRCHALTEEDLKAGSNTLKRLIEDGFINESELAYLKKGDIIPSQGGELFVTLSKRYKKDSDNNELTVIHADINAAQNLQKRFWQQNSEVYRVPCQLARMGEDKLYIPKSQTETIKKYFGKGSFVKNNTEQEVYKWEKSEKMKIKTDTTFDLQDLDGFEDISKTIELAQEQQKKYLTMFRDPSGYFFNNETWRPQKEYWSIVNNIIKSCLKKKILSNKVEL
いくつかの実施形態では、Cas12bは、BTCas12bである。BTCas12b(Bacillus thermoamylovorans)NCBI参照配列: WP_041902512
MATRSFILKIEPNEEVKKGLWKTHEVLNHGIAYYMNILKLIRQEAIYEHHEQDPKNPKKV
SKAEIQAELWDFVLKMQKCNSFTHEVDKDVVFNILRELYEELVPSSVEKKGEANQLSNKF
LYPLVDPNSQSGKGTASSGRKPRWYNLKIAGDPSWEEEKKKWEEDKKKDPLAKILGKLAE
YGLIPLFIPFTDSNEPIVKEIKWMEKSRNQSVRRLDKDMFIQALERFLSWESWNLKVKEE
YEKVEKEHKTLEERIKEDIQAFKSLEQYEKERQEQLLRDTLNTNEYRLSKRGLRGWREII
QKWLKMDENEPSEKYLEVFKDYQRKHPREAGDYSVYEFLSKKENHFIWRNHPEYPYLYAT
FCEIDKKKKDAKQQATFTLADPINHPLWVRFEERSGSNLNKYRILTEQLHTEKLKKKLTV
QLDRLIYPTESGGWEEKGKVDIVLLPSRQFYNQIFLDIEEKGKHAFTYKDESIKFPLKGT
LGGARVQFDRDHLRRYPHKVESGNVGRIYFNMTVNIEPTESPVSKSLKIHRDDFPKFVNF
KPKELTEWIKDSKGKKLKSGIESLEIGLRVMSIDLGQRQAAAASIFEVVDQKPDIEGKLF
FPIKGTELYAVHRASFNIKLPGETLVKSREVLRKAREDNLKLMNQKLNFLRNVLHFQQFE
DITEREKRVTKWISRQENSDVPLVYQDELIQIRELMYKPYKDWVAFLKQLHKRLEVEIGK
EVKHWRKSLSDGRKGLYGISLKNIDEIDRTRKFLLRWSLRPTEPGEVRRLEPGQRFAIDQ
LNHLNALKEDRLKKMANTIIMHALGYCYDVRKKKWQAKNPACQIILFEDLSNYNPYEERS
RFENSKLMKWSRREIPRQVALQGEIYGLQVGEVGAQFSSRFHAKTGSPGIRCSVVTKEKL
QDNRFFKNLQREGRLTLDKIAVLKEGDLYPDKGGEKFISLSKDRKLVTTHADINAAQNLQ
KRFWTRTHGFYKVYCKAYQVDGQTVYIPESKDQKQKIIEEFGEGYFILKDGVYEWGNAGK
LKIKKGSSKQSSSELVDSDILKDSFDLASELKGEKLMLYRDPSGNVFPSDKWMAAGVFFG
KLERILISKLTNQYSISTIEDDSSKQSM
いくつかの実施形態では、napDNAbpとはCas12cを指す。いくつかの実施形態では、Cas12cタンパク質は、Cas12c1またはCas12c1のバリアントである。いくつかの実施形態では、Cas12タンパク質は、Cas12c2またはCas12c2のバリアントである。いくつかの実施形態では、Cas12タンパク質は、Oleiphilus種HI0009由来のCas12cタンパク質(すなわち、OspCas12c)またはOspCas12cのバリアントである。これらのCas12c分子は、Yan et al., “Functionally Diverse Type V CRISPR-Cas Systems,” Science, 2019 Jan. 4; 363: 88-91に記載されており; その全内容は、参照により本明細書に援用される。いくつかの実施形態では、napDNAbpは、天然のCas12c1、Cas12c2、またはOspCas12cタンパク質に対して、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。いくつかの実施形態では、napDNAbpは、天然のCas12c1、Cas12c2、またはOspCas12cタンパク質である。いくつかの実施形態では、napDNAbpは、本明細書に記載の任意のCas12c1、Cas12c2、またはOspCas12cタンパク質に対して、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。他の細菌種由来のCas12c1、Cas12c2、またはOspCas12cもまた、本開示に従って使用され得ることが理解されるべきである。
Cas12c1
MQTKKTHLHLISAKASRKYRRTIACLSDTAKKDLERRKQSGAADPAQELSCLKTIKFKLEVPEGSKLPSFDRISQIYNALETIEKGSLSYLLFALILSGFRIFPNSSAAKTFASSSCYKNDQFASQIKEIFGEMVKNFIPSELESILKKGRRKNNKDWTEENIKRVLNSEFGRKNSEGSSALFDSFLSKFSQELFRKFDSWNEVNKKYLEAAELLDSMLASYGPFDSVCKMIGDSDSRNSLPDKSTIAFTNNAEITVDIESSVMPYMAIAALLREYRQSKSKAAPVAYVQSHLTTTNGNGLSWFFKFGLDLIRKAPVSSKQSTSDGSKSLQELFSVPDDKLDGLKFIKEACEALPEASLLCGEKGELLGYQDFRTSFAGHIDSWVANYVNRLFELIELVNQLPESIKLPSILTQKNHNLVASLGLQEAEVSHSLELFEGLVKNVRQTLKKLAGIDISSSPNEQDIKEFYAFSDVLNRLGSIRNQIENAVQTAKKDKIDLESAIEWKEWKKLKKLPKLNGLGGGVPKQQELLDKALESVKQIRHYQRIDFERVIQWAVNEHCLETVPKFLVDAEKKKINKESSTDFAAKENAVRFLLEGIGAAARGKTDSVSKAAYNWFVVNNFLAKKDLNRYFINCQGCIYKPPYSKRRSLAFALRSDNKDTIEVVWEKFETFYKEISKEIEKFNIFSQEFQTFLHLENLRMKLLLRRIQKPIPAEIAFFSLPQEYYDSLPPNVAFLALNQEITPSEYITQFNLYSSFLNGNLILLRRSRSYLRAKFSWVGNSKLIYAAKEARLWKIPNAYWKSDEWKMILDSNVLVFDKAGNVLPAPTLKKVCEREGDLRLFYPLLRQLPHDWCYRNPFVKSVGREKNVIEVNKEGEPKVASALPGSLFRLIGPAPFKSLLDDCFFNPLDKDLRECMLIVDQEISQKVEAQKVEASLESCTYSIAVPIRYHLEEPKVSNQFENVLAIDQGEAGLAYAVFSLKSIGEAETKPIAVGTIRIPSIRRLIHSVSTYRKKKQRLQNFKQNYDSTAFIMRENVTGDVCAKIVGLMKEFNAFPVLEYDVKNLESGSRQLSAVYKAVNSHFLYFKEPGRDALRKQLWYGGDSWTIDGIEIVTRERKEDGKEGVEKIVPLKVFPGRSVSARFTSKTCSCCGRNVFDWLFTEKKAKTNKKFNVNSKGELTTADGVIQLFEADRSKGPKFYARRKERTPLTKPIAKGSYSLEEIERRVRTNLRRAPKSKQSRDTSQSQYFCVYKDCALHFSGMQADENAAINIGRRFLTALRKNRRSDFPSNVKISDRLLDN
Cas12c2
MTKHSIPLHAFRNSGADARKWKGRIALLAKRGKETMRTLQFPLEMSEPEAAAINTTPFAVAYNAIEGTGKGTLFDYWAKLHLAGFRFFPSGGAATIFRQQAVFEDASWNAAFCQQSGKDWPWLVPSKLYERFTKAPREVAKKDGSKKSIEFTQENVANESHVSLVGASITDKTPEDQKEFFLKMAGALAEKFDSWKSANEDRIVAMKVIDEFLKSEGLHLPSLENIAVKCSVETKPDNATVAWHDAPMSGVQNLAIGVFATCASRIDNIYDLNGGKLSKLIQESATTPNVTALSWLFGKGLEYFRTTDIDTIMQDFNIPASAKESIKPLVESAQAIPTMTVLGKKNYAPFRPNFGGKIDSWIANYASRLMLLNDILEQIEPGFELPQALLDNETLMSGIDMTGDELKELIEAVYAWVDAAKQGLATLLGRGGNVDDAVQTFEQFSAMMDTLNGTLNTISARYVRAVEMAGKDEARLEKLIECKFDIPKWCKSVPKLVGISGGLPKVEEEIKVMNAAFKDVRARMFVRFEEIAAYVASKGAGMDVYDALEKRELEQIKKLKSAVPERAHIQAYRAVLHRIGRAVQNCSEKTKQLFSSKVIEMGVFKNPSHLNNFIFNQKGAIYRSPFDRSRHAPYQLHADKLLKNDWLELLAEISATLMASESTEQMEDALRLERTRLQLQLSGLPDWEYPASLAKPDIEVEIQTALKMQLAKDTVTSDVLQRAFNLYSSVLSGLTFKLLRRSFSLKMRFSVADTTQLIYVPKVCDWAIPKQYLQAEGEIGIAARVVTESSPAKMVTEVEMKEPKALGHFMQQAPHDWYFDASLGGTQVAGRIVEKGKEVGKERKLVGYRMRGNSAYKTVLDKSLVGNTELSQCSMIIEIPYTQTVDADFRAQVQAGLPKVSINLPVKETITASNKDEQMLFDRFVAIDLGERGLGYAVFDAKTLELQESGHRPIKAITNLLNRTHHYEQRPNQRQKFQAKFNVNLSELRENTVGDVCHQINRICAYYNAFPVLEYMVPDRLDKQLKSVYESVTNRYIWSSTDAHKSARVQFWLGGETWEHPYLKSAKDKKPLVLSPGRGASGKGTSQTCSCCGRNPFDLIKDMKPRAKIAVVDGKAKLENSELKLFERNLESKDDMLARRHRNERAGMEQPLTPGNYTVDEIKALLRANLRRAPKNRRTKDTTVSEYHCVFSDCGKTMHADENAAVNIGGKFIADIEK
OspCas12c
MTKLRHRQKKLTHDWAGSKKREVLGSNGKLQNPLLMPVKKGQVTEFRKAFSAYARATKGEMTDGRKNMFTHSFEPFKTKPSLHQCELADKAYQSLHSYLPGSLAHFLLSAHALGFRIFSKSGEATAFQASSKIEAYESKLASELACVDLSIQNLTISTLFNALTTSVRGKGEETSADPLIARFYTLLTGKPLSRDTQGPERDLAEVISRKIASSFGTWKEMTANPLQSLQFFEEELHALDANVSLSPAFDVLIKMNDLQGDLKNRTIVFDPDAPVFEYNAEDPADIIIKLTARYAKEAVIKNQNVGNYVKNAITTTNANGLGWLLNKGLSLLPVSTDDELLEFIGVERSHPSCHALIELIAQLEAPELFEKNVFSDTRSEVQGMIDSAVSNHIARLSSSRNSLSMDSEELERLIKSFQIHTPHCSLFIGAQSLSQQLESLPEALQSGVNSADILLGSTQYMLTNSLVEESIATYQRTLNRINYLSGVAGQINGAIKRKAIDGEKIHLPAAWSELISLPFIGQPVIDVESDLAHLKNQYQTLSNEFDTLISALQKNFDLNFNKALLNRTQHFEAMCRSTKKNALSKPEIVSYRDLLARLTSCLYRGSLVLRRAGIEVLKKHKIFESNSELREHVHERKHFVFVSPLDRKAKKLLRLTDSRPDLLHVIDEILQHDNLENKDRESLWLVRSGYLLAGLPDQLSSSFINLPIITQKGDRRLIDLIQYDQINRDAFVMLVTSAFKSNLSGLQYRANKQSFVVTRTLSPYLGSKLVYVPKDKDWLVPSQMFEGRFADILQSDYMVWKDAGRLCVIDTAKHLSNIKKSVFSSEEVLAFLRELPHRTFIQTEVRGLGVNVDGIAFNNGDIPSLKTFSNCVQVKVSRTNTSLVQTLNRWFEGGKVSPPSIQFERAYYKKDDQIHEDAAKRKIRFQMPATELVHASDDAGWTPSYLLGIDPGEYGMGLSLVSINNGEVLDSGFIHINSLINFASKKSNHQTKVVPRQQYKSPYANYLEQSKDSAAGDIAHILDRLIYKLNALPVFEALSGNSQSAADQVWTKVLSFYTWGDNDAQNSIRKQHWFGASHWDIKGMLRQPPTEKKPKPYIAFPGSQVSSYGNSQRCSCCGRNPIEQLREMAKDTSIKELKIRNSEIQLFDGTIKLFNPDPSTVIERRRHNLGPSRIPVADRTFKNISPSSLEFKELITIVSRSIRHSPEFIAKKRGIGSEYFCAYSDCNSSLNSEANAAANVAQKFQKQLFFEL
いくつかの実施形態では、napDNAbpは、Cas12g、Cas12h、またはCas12iを指し、これらは、例えば、Yan et al., “Functionally Diverse Type V CRISPR-Cas Systems,” Science, 2019 Jan. 4; 363: 88-91に記載されており; それぞれの全内容は、参照により本明細書に援用される。10テラバイトを超える配列データを集約することにより、Cas12g、Cas12h、及びCas12iを含む、以前に特徴付けられたクラスVタンパク質との弱い類似性を示すV型Casタンパク質の新規分類が同定された。いくつかの実施形態では、Cas12タンパク質は、Cas12gまたはCas12gのバリアントである。いくつかの実施形態では、Cas12タンパク質は、Cas12hまたはCas12hのバリアントである。いくつかの実施形態では、Cas12タンパク質は、Cas12iまたはCas12iのバリアントである。他のRNAガイドDNA結合タンパク質をnapDNAbpとして使用してもよく、そして本開示の範囲内にあることを理解されたい。いくつかの実施形態では、napDNAbpは、天然のCas12g、Cas12h、またはCas12iタンパク質に対して、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。いくつかの実施形態では、napDNAbpは、天然のCas12g、Cas12h、またはCas12iタンパク質である。いくつかの実施形態では、napDNAbpは、本明細書に記載の任意のCas12g、Cas12h、またはCas12iタンパク質に対して、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。他の細菌種由来のCas12g、Cas12h、またはCas12iもまた、本開示に従って使用され得ることが理解されるべきである。いくつかの実施形態では、Cas12iは、Cas12i1またはCas12i2である。
Cas12g1
MAQASSTPAVSPRPRPRYREERTLVRKLLPRPGQSKQEFRENVKKLRKAFLQFNADVSGVCQWAIQFRPRYGKPAEPTETFWKFFLEPETSLPPNDSRSPEFRRLQAFEAAAGINGAAALDDPAFTNELRDSILAVASRPKTKEAQRLFSRLKDYQPAHRMILAKVAAEWIESRYRRAHQNWERNYEEWKKEKQEWEQNHPELTPEIREAFNQIFQQLEVKEKRVRICPAARLLQNKDNCQYAGKNKHSVLCNQFNEFKKNHLQGKAIKFFYKDAEKYLRCGLQSLKPNVQGPFREDWNKYLRYMNLKEETLRGKNGGRLPHCKNLGQECEFNPHTALCKQYQQQLSSRPDLVQHDELYRKWRREYWREPRKPVFRYPSVKRHSIAKIFGENYFQADFKNSVVGLRLDSMPAGQYLEFAFAPWPRNYRPQPGETEISSVHLHFVGTRPRIGFRFRVPHKRSRFDCTQEELDELRSRTFPRKAQDQKFLEAARKRLLETFPGNAEQELRLLAVDLGTDSARAAFFIGKTFQQAFPLKIVKIEKLYEQWPNQKQAGDRRDASSKQPRPGLSRDHVGRHLQKMRAQASEIAQKRQELTGTPAPETTTDQAAKKATLQPFDLRGLTVHTARMIRDWARLNARQIIQLAEENQVDLIVLESLRGFRPPGYENLDQEKKRRVAFFAHGRIRRKVTEKAVERGMRVVTVPYLASSKVCAECRKKQKDNKQWEKNKKRGLFKCEGCGSQAQVDENAARVLGRVFWGEIELPTAIP
Cas12h1
MKVHEIPRSQLLKIKQYEGSFVEWYRDLQEDRKKFASLLFRWAAFGYAAREDDGATYISPSQALLERRLLLGDAEDVAIKFLDVLFKGGAPSSSCYSLFYEDFALRDKAKYSGAKREFIEGLATMPLDKIIERIRQDEQLSKIPAEEWLILGAEYSPEEIWEQVAPRIVNVDRSLGKQLRERLGIKCRRPHDAGYCKILMEVVARQLRSHNETYHEYLNQTHEMKTKVANNLTNEFDLVCEFAEVLEEKNYGLGWYVLWQGVKQALKEQKKPTKIQIAVDQLRQPKFAGLLTAKWRALKGAYDTWKLKKRLEKRKAFPYMPNWDNDYQIPVGLTGLGVFTLEVKRTEVVVDLKEHGKLFCSHSHYFGDLTAEKHPSRYHLKFRHKLKLRKRDSRVEPTIGPWIEAALREITIQKKPNGVFYLGLPYALSHGIDNFQIAKRFFSAAKPDKEVINGLPSEMVVGAADLNLSNIVAPVKARIGKGLEGPLHALDYGYGELIDGPKILTPDGPRCGELISLKRDIVEIKSAIKEFKACQREGLTMSEETTTWLSEVESPSDSPRCMIQSRIADTSRRLNSFKYQMNKEGYQDLAEALRLLDAMDSYNSLLESYQRMHLSPGEQSPKEAKFDTKRASFRDLLRRRVAHTIVEYFDDCDIVFFEDLDGPSDSDSRNNALVKLLSPRTLLLYIRQALEKRGIGMVEVAKDGTSQNNPISGHVGWRNKQNKSEIYFYEDKELLVMDADEVGAMNILCRGLNHSVCPYSFVTKAPEKKNDEKKEGDYGKRVKRFLKDRYGSSNVRFLVASMGFVTVTTKRPKDALVGKRLYYHGGELVTHDLHNRMKDEIKYLVEKEVLARRVSLSDSTIKSYKSFAHV
Cas12i1
MSNKEKNASETRKAYTTKMIPRSHDRMKLLGNFMDYLMDGTPIFFELWNQFGGGIDRDIISGTANKDKISDDLLLAVNWFKVMPINSKPQGVSPSNLANLFQQYSGSEPDIQAQEYFASNFDTEKHQWKDMRVEYERLLAELQLSRSDMHHDLKLMYKEKCIGLSLSTAHYITSVMFGTGAKNNRQTKHQFYSKVIQLLEESTQINSVEQLASIILKAGDCDSYRKLRIRCSRKGATPSILKIVQDYELGTNHDDEVNVPSLIANLKEKLGRFEYECEWKCMEKIKAFLASKVGPYYLGSYSAMLENALSPIKGMTTKNCKFVLKQIDAKNDIKYENEPFGKIVEGFFDSPYFESDTNVKWVLHPHHIGESNIKTLWEDLNAIHSKYEEDIASLSEDKKEKRIKVYQGDVCQTINTYCEEVGKEAKTPLVQLLRYLYSRKDDIAVDKIIDGITFLSKKHKVEKQKINPVIQKYPSFNFGNNSKLLGKIISPKDKLKHNLKCNRNQVDNYIWIEIKVLNTKTMRWEKHHYALSSTRFLEEVYYPATSENPPDALAARFRTKTNGYEGKPALSAEQIEQIRSAPVGLRKVKKRQMRLEAARQQNLLPRYTWGKDFNINICKRGNNFEVTLATKVKKKKEKNYKVVLGYDANIVRKNTYAAIEAHANGDGVIDYNDLPVKPIESGFVTVESQVRDKSYDQLSYNGVKLLYCKPHVESRRSFLEKYRNGTMKDNRGNNIQIDFMKDFEAIADDETSLYYFNMKYCKLLQSSIRNHSSQAKEYREEIFELLRDGKLSVLKLSSLSNLSFVMFKVAKSLIGTYFGHLLKKPKNSKSDVKAPPITDEDKQKADPEMFALRLALEEKRLNKVKSKKEVIANKIVAKALELRDKYGPVLIKGENISDTTKKGKKSSTNSFLMDWLARGVANKVKEMVMMHQGLEFVEVNPNFTSHQDPFVHKNPENTFRARYSRCTPSELTEKNRKEILSFLSDKPSKRPTNAYYNEGAMAFLATYGLKKNDVLGVSLEKFKQIMANILHQRSEDQLLFPSRGGMFYLATYKLDADATSVNWNGKQFWVCNADLVAAYNVGLVDIQKDFKKK
Cas12i2
MSSAIKSYKSVLRPNERKNQLLKSTIQCLEDGSAFFFKMLQGLFGGITPEIVRFSTEQEKQQQDIALWCAVNWFRPVSQDSLTHTIASDNLVEKFEEYYGGTASDAIKQYFSASIGESYYWNDCRQQYYDLCRELGVEVSDLTHDLEILCREKCLAVATESNQNNSIISVLFGTGEKEDRSVKLRITKKILEAISNLKEIPKNVAPIQEIILNVAKATKETFRQVYAGNLGAPSTLEKFIAKDGQKEFDLKKLQTDLKKVIRGKSKERDWCCQEELRSYVEQNTIQYDLWAWGEMFNKAHTALKIKSTRNYNFAKQRLEQFKEIQSLNNLLVVKKLNDFFDSEFFSGEETYTICVHHLGGKDLSKLYKAWEDDPADPENAIVVLCDDLKNNFKKEPIRNILRYIFTIRQECSAQDILAAAKYNQQLDRYKSQKANPSVLGNQGFTWTNAVILPEKAQRNDRPNSLDLRIWLYLKLRHPDGRWKKHHIPFYDTRFFQEIYAAGNSPVDTCQFRTPRFGYHLPKLTDQTAIRVNKKHVKAAKTEARIRLAIQQGTLPVSNLKITEISATINSKGQVRIPVKFDVGRQKGTLQIGDRFCGYDQNQTASHAYSLWEVVKEGQYHKELGCFVRFISSGDIVSITENRGNQFDQLSYEGLAYPQYADWRKKASKFVSLWQITKKNKKKEIVTVEAKEKFDAICKYQPRLYKFNKEYAYLLRDIVRGKSLVELQQIRQEIFRFIEQDCGVTRLGSLSLSTLETVKAVKGIIYSYFSTALNASKNNPISDEQRKEFDPELFALLEKLELIRTRKKKQKVERIANSLIQTCLENNIKFIRGEGDLSTTNNATKKKANSRSMDWLARGVFNKIRQLAPMHNITLFGCGSLYTSHQDPLVHRNPDKAMKCRWAAIPVKDIGDWVLRKLSQNLRAKNIGTGEYYHQGVKEFLSHYELQDLEEELLKWRSDRKSNIPCWVLQNRLAEKLGNKEAVVYIPVRGGRIYFATHKVATGAVSIVFDQKQVWVCNADHVAAANIALTVKGIGEQSSDEENPDGSRIKLQLTS
塩基エディターの代表的な核酸及びタンパク質配列は、以下の通りである:
BhCas12b GGSGGS-ABE8-Xten20 (P153)
Figure 2022546608000040
Figure 2022546608000041
Figure 2022546608000042
BhCas12b GGSGGS-ABE8-Xten20 (K255)
Figure 2022546608000043
Figure 2022546608000044
Figure 2022546608000045
Figure 2022546608000046
BhCas12b GGSGGS-ABE8-Xten20 (D306)
Figure 2022546608000047
Figure 2022546608000048
Figure 2022546608000049
Figure 2022546608000050
BhCas12b GGSGGS-ABE8-Xten20 (D980)
Figure 2022546608000051
Figure 2022546608000052
Figure 2022546608000053
BhCas12b GGSGGS-ABE8-Xten20 (K1019)
Figure 2022546608000054
Figure 2022546608000055
Figure 2022546608000056
上記の配列では、コザック配列には太字で下線を引いており; 一点鎖線は、コザック配列に続くN末端核局在化シグナル(NLS)を示し; 小文字は、GGGSGGSリンカーを示し; 破線は、ABE8をエンコードする配列を示し; 修飾されていない配列は、BhCas12bをコードし; 二重下線は、Xten20リンカーを示し; 単一の下線は、C末端NLSを示し; 点線下線のGGATCCは、GSリンカーを示し; そして斜体の文字は、3×ヘマグルチニン(HA)タグのコード配列を表す。
いくつかの実施形態では、本明細書中で提供する融合タンパク質のいずれかの核酸プログラム可能なDNA結合タンパク質(napDNAbp)は、Cas12j/CasΦタンパク質であってもよい。Cas12j/CasΦは、Pausch et al., “CRISPR-CasΦ from huge phages is a hypercompact genome editor,” Science, 17 July 2020, Vol. 369, Issue 6501, pp. 333-337に記載されており、これはその全体が参照により本明細書に援用される。いくつかの実施形態では、napDNAbpは、天然のCas12j/CasΦタンパク質に対して、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性のアミノ酸配列を含む。いくつかの実施形態では、napDNAbpは、天然のCas12j/CasΦタンパク質である。いくつかの実施形態では、napDNAbpは、ヌクレアーゼ不活性(「dead」)Cas12j/CasΦタンパク質である。他の種由来のCas12j/CasΦもまた、本開示に従って使用され得ることが理解されるべきである。
例示的なCas12j/CasΦアミノ酸配列は、以下の通りである:
>CasΦ-1
MADTPTLFTQFLRHHLPGQRFRKDILKQAGRILANKGEDATIAFLRGKSEESPPDFQPPVKCPIIACSRPLTEWPIYQASVAIQGYVYGQSLAEFEASDPGCSKDGLLGWFDKTGVCTDYFSVQGLNLIFQNARKRYIGVQTKVTNRNEKRHKKLKRINAKRIAEGLPELTSDEPESALDETGHLIDPPGLNTNIYCYQQVSPKPLALSEVNQLPTAYAGYSTSGDDPIQPMVTKDRLSISKGQPGYIPEHQRALLSQKKHRRMRGYGLKARALLVIVRIQDDWAVIDLRSLLRNAYWRRIVQTKEPSTITKLLKLVTGDPVLDATRMVATFTYKPGIVQVRSAKCLKNKQGSKLFSERYLNETVSVTSIDLGSNNLVAVATYRLVNGNTPELLQRFTLPSHLVKDFERYKQAHDTLEDSIQKTAVASLPQGQQTEIRMWSMYGFREAQERVCQELGLADGSIPWNVMTATSTILTDLFLARGGDPKKCMFTSEPKKKKNSKQVLYKIRDRAWAKMYRTLLSKETREAWNKALWGLKRGSPDYARLSKRKEELARRCVNYTISTAEKRAQCGRTIVALEDLNIGFFHGRGKQEPGWVGLFTRKKENRWLMQALHKAFLELAHHRGYHVIEVNPAYTSQTCPVCRHCDPDNRDQHNREAFHCIGCGFRGNADLDVATHNIAMVAITGESLKRARGSVASKTPQPLAAE*
>CasΦ-2
MPKPAVESEFSKVLKKHFPGERFRSSYMKRGGKILAAQGEEAVVAYLQGKSEEEPPNFQPPAKCHVVTKSRDFAEWPIMKASEAIQRYIYALSTTERAACKPGKSSESHAAWFAATGVSNHGYSHVQGLNLIFDHTLGRYDGVLKKVQLRNEKARARLESINASRADEGLPEIKAEEEEVATNETGHLLQPPGINPSFYVYQTISPQAYRPRDEIVLPPEYAGYVRDPNAPIPLGVVRNRCDIQKGCPGYIPEWQREAGTAISPKTGKAVTVPGLSPKKNKRMRRYWRSEKEKAQDALLVTVRIGTDWVVIDVRGLLRNARWRTIAPKDISLNALLDLFTGDPVIDVRRNIVTFTYTLDACGTYARKWTLKGKQTKATLDKLTATQTVALVAIDLGQTNPISAGISRVTQENGALQCEPLDRFTLPDDLLKDISAYRIAWDRNEEELRARSVEALPEAQQAEVRALDGVSKETARTQLCADFGLDPKRLPWDKMSSNTTFISEALLSNSVSRDQVFFTPAPKKGAKKKAPVEVMRKDRTWARAYKPRLSVEAQKLKNEALWALKRTSPEYLKLSRRKEELCRRSINYVIEKTRRRTQCQIVIPVIEDLNVRFFHGSGKRLPGWDNFFTAKKENRWFIQGLHKAFSDLRTHRSFYVFEVRPERTSITCPKCGHCEVGNRDGEAFQCLSCGKTCNADLDVATHNLTQVALTGKTMPKREEPRDAQGTAPARKTKKASKSKAPPAEREDQTPAQEPSQTS
>CasΦ-3
MEKEITELTKIRREFPNKKFSSTDMKKAGKLLKAEGPDAVRDFLNSCQEIIGDFKPPVKTNIVSISRPFEEWPVSMVGRAIQEYYFSLTKEELESVHPGTSSEDHKSFFNITGLSNYNYTSVQGLNLIFKNAKAIYDGTLVKANNKNKKLEKKFNEINHKRSLEGLPIITPDFEEPFDENGHLNNPPGINRNIYGYQGCAAKVFVPSKHKMVSLPKEYEGYNRDPNLSLAGFRNRLEIPEGEPGHVPWFQRMDIPEGQIGHVNKIQRFNFVHGKNSGKVKFSDKTGRVKRYHHSKYKDATKPYKFLEESKKVSALDSILAIITIGDDWVVFDIRGLYRNVFYRELAQKGLTAVQLLDLFTGDPVIDPKKGVVTFSYKEGVVPVFSQKIVPRFKSRDTLEKLTSQGPVALLSVDLGQNEPVAARVCSLKNINDKITLDNSCRISFLDDYKKQIKDYRDSLDELEIKIRLEAINSLETNQQVEIRDLDVFSADRAKANTVDMFDIDPNLISWDSMSDARVSTQISDLYLKNGGDESRVYFEINNKRIKRSDYNISQLVRPKLSDSTRKNLNDSIWKLKRTSEEYLKLSKRKLELSRAVVNYTIRQSKLLSGINDIVIILEDLDVKKKFNGRGIRDIGWDNFFSSRKENRWFIPAFHKAFSELSSNRGLCVIEVNPAWTSATCPDCGFCSKENRDGINFTCRKCGVSYHADIDVATLNIARVAVLGKPMSGPADRERLGDTKKPRVARSRKTMKRKDISNSTVEAMVTA*
>CasΦ-4
MYSLEMADLKSEPSLLAKLLRDRFPGKYWLPKYWKLAEKKRLTGGEEAACEYMADKQLDSPPPNFRPPARCVILAKSRPFEDWPVHRVASKAQSFVIGLSEQGFAALRAAPPSTADARRDWLRSHGASEDDLMALEAQLLETIMGNAISLHGGVLKKIDNANVKAAKRLSGRNEARLNKGLQELPPEQEGSAYGADGLLVNPPGLNLNIYCRKSCCPKPVKNTARFVGHYPGYLRDSDSILISGTMDRLTIIEGMPGHIPAWQREQGLVKPGGRRRRLSGSESNMRQKVDPSTGPRRSTRSGTVNRSNQRTGRNGDPLLVEIRMKEDWVLLDARGLLRNLRWRESKRGLSCDHEDLSLSGLLALFSGDPVIDPVRNEVVFLYGEGIIPVRSTKPVGTRQSKKLLERQASMGPLTLISCDLGQTNLIAGRASAISLTHGSLGVRSSVRIELDPEIIKSFERLRKDADRLETEILTAAKETLSDEQRGEVNSHEKDSPQTAKASLCRELGLHPPSLPWGQMGPSTTFIADMLISHGRDDDAFLSHGEFPTLEKRKKFDKRFCLESRPLLSSETRKALNESLWEVKRTSSEYARLSQRKKEMARRAVNFVVEISRRKTGLSNVIVNIEDLNVRIFHGGGKQAPGWDGFFRPKSENRWFIQAIHKAFSDLAAHHGIPVIESDPQRTSMTCPECGHCDSKNRNGVRFLCKGCGASMDADFDAACRNLERVALTGKPMPKPSTSCERLLSATTGKVCSDHSLSHDAIEKAS*
>CasΦ-5
MSSLPTPLELLKQKHADLFKGLQFSSKDNKMAGKVLKKDGEEAALAFLSERGVSRGELPNFRPPAKTLVVAQSRPFEEFPIYRVSEAIQLYVYSLSVKELETVPSGSSTKKEHQRFFQDSSVPDFGYTSVQGLNKIFGLARGIYLGVITRGENQLQKAKSKHEALNKKRRASGEAETEFDPTPYEYMTPERKLAKPPGVNHSIMCYVDISVDEFDFRNPDGIVLPSEYAGYCREINTAIEKGTVDRLGHLKGGPGYIPGHQRKESTTEGPKINFRKGRIRRSYTALYAKRDSRRVRQGKLALPSYRHHMMRLNSNAESAILAVIFFGKDWVVFDLRGLLRNVRWRNLFVDGSTPSTLLGMFGDPVIDPKRGVVAFCYKEQIVPVVSKSITKMVKAPELLNKLYLKSEDPLVLVAIDLGQTNPVGVGVYRVMNASLDYEVVTRFALESELLREIESYRQRTNAFEAQIRAETFDAMTSEEQEEITRVRAFSASKAKENVCHRFGMPVDAVDWATMGSNTIHIAKWVMRHGDPSLVEVLEYRKDNEIKLDKNGVPKKVKLTDKRIANLTSIRLRFSQETSKHYNDTMWELRRKHPVYQKLSKSKADFSRRVVNSIIRRVNHLVPRARIVFIIEDLKNLGKVFHGSGKRELGWDSYFEPKSENRWFIQVLHKAFSETGKHKGYYIIECWPNWTSCTCPKCSCCDSENRHGEVFRCLACGYTCNTDFGTAPDNLVKIATTGKGLPGPKKRCKGSSKGKNPKIARSSETGVSVTESGAPKVKKSSPTQTSQSSSQSAP*
>CasΦ-6
MNKIEKEKTPLAKLMNENFAGLRFPFAIIKQAGKKLLKEGELKTIEYMTGKGSIEPLPNFKPPVKCLIVAKRRDLKYFPICKASCEIQSYVYSLNYKDFMDYFSTPMTSQKQHEEFFKKSGLNIEYQNVAGLNLIFNNVKNTYNGVILKVKNRNEKLKKKAIKNNYEFEEIKTFNDDGCLINKPGINNVIYCFQSISPKILKNITHLPKEYNDYDCSVDRNIIQKYVSRLDIPESQPGHVPEWQRKLPEFNNTNNPRRRRKWYSNGRNISKGYSVDQVNQAKIEDSLLAQIKIGEDWIILDIRGLLRDLNRRELISYKNKLTIKDVLGFFSDYPIIDIKKNLVTFCYKEGVIQVVSQKSIGNKKSKQLLEKLIENKPIALVSIDLGQTNPVSVKISKLNKINNKISIESFTYRFLNEEILKEIEKYRKDYDKLELKLINEA
>CasΦ-7
MSNTAVSTREHMSNKTTPPSPLSLLLRAHFPGLKFESQDYKIAGKKLRDGGPEAVISYLTGKGQAKLKDVKPPAKAFVIAQSRPFIEWDLVRVSRQIQEKIFGIPATKGRPKQDGLSETAFNEAVASLEVDGKSKLNEETRAAFYEVLGLDAPSLHAQAQNALIKSAISIREGVLKKVENRNEKNLSKTKRRKEAGEEATFVEEKAHDERGYLIHPPGVNQTIPGYQAVVIKSCPSDFIGLPSGCLAKESAEALTDYLPHDRMTIPKGQPGYVPEWQHPLLNRRKNRRRRDWYSASLNKPKATCSKRSGTPNRKNSRTDQIQSGRFKGAIPVLMRFQDEWVIIDIRGLLRNARYRKLLKEKSTIPDLLSLFTGDPSIDMRQGVCTFIYKAGQACSAKMVKTKNAPEILSELTKSGPVVLVSIDLGQTNPIAAKVSRVTQLSDGQLSHETLLRELLSNDSSDGKEIARYRVASDRLRDKLANLAVERLSPEHKSEILRAKNDTPALCKARVCAALGLNPEMIAWDKMTPYTEFLATAYLEKGGDRKVATLKPKNRPEMLRRDIKFKGTEGVRIEVSPEAAEAYREAQWDLQRTSPEYLRLSTWKQELTKRILNQLRHKAAKSSQCEVVVMAFEDLNIKMMHGNGKWADGGWDAFFIKKRENRWFMQAFHKSLTELGAHKGVPTIEVTPHRTSITCTKCGHCDKANRDGERFACQKCGFVAHADLEIATDNIERVALTGKPMPKPESERSGDAKKSVGARKAAFKPEEDAEAAE*
>CasΦ-8
MIKPTVSQFLTPGFKLIRNHSRTAGLKLKNEGEEACKKFVRENEIPKDECPNFQGGPAIANIIAKSREFTEWEIYQSSLAIQEVIFTLPKDKLPEPILKEEWRAQWLSEHGLDTVPYKEAAGLNLIIKNAVNTYKGVQVKVDNKNKNNLAKINRKNEIAKLNGEQEISFEEIKAFDDKGYLLQKPSPNKSIYCYQSVSPKPFITSKYHNVNLPEEYIGYYRKSNEPIVSPYQFDRLRIPIGEPGYVPKWQYTFLSKKENKRRKLSKRIKNVSPILGIICIKKDWCVFDMRGLLRTNHWKKYHKPTDSINDLFDYFTGDPVIDTKANVVRFRYKMENGIVNYKPVREKKGKELLENICDQNGSCKLATVDVGQNNPVAIGLFELKKVNGELTKTLISRHPTPIDFCNKITAYRERYDKLESSIKLDAIKQLTSEQKIEVDNYNNNFTPQNTKQIVCSKLNINPNDLPWDKMISGTHFISEKAQVSNKSEIYFTSTDKGKTKDVMKSDYKWFQDYKPKLSKEVRDALSDIEWRLRRESLEFNKLSKSREQDARQLANWISSMCDVIGIENLVKKNNFFGGSGKREPGWDNFYKPKKENRWWINAIHKALTELSQNKGKRVILLPAMRTSITCPKCKYCDSKNRNGEKFNCLKCGIELNADIDVATENLATVAITAQSMPKPTCERSGDAKKPVRARKAKAPEFHDKLAPSYTVVLREAV*
>CasΦ-9
MRSSREIGDKILMRQPAEKTAFQVFRQEVIGTQKLSGGDAKTAGRLYKQGKMEAAREWLLKGARDDVPPNFQPPAKCLVVAVSHPFEEWDISKTNHDVQAYIYAQPLQAEGHLNGLSEKWEDTSADQHKLWFEKTGVPDRGLPVQAINKIAKAAVNRAFGVVRKVENRNEKRRSRDNRIAEHNRENGLTEVVREAPEVATNADGFLLHPPGIDPSILSYASVSPVPYNSSKHSFVRLPEEYQAYNVEPDAPIPQFVVEDRFAIPPGQPGYVPEWQRLKCSTNKHRRMRQWSNQDYKPKAGRRAKPLEFQAHLTRERAKGALLVVMRIKEDWVVFDVRGLLRNVEWRKVLSEEAREKLTLKGLLDLFTGDPVIDTKRGIVTFLYKAEITKILSKRTVKTKNARDLLLRLTEPGEDGLRREVGLVAVDLGQTHPIAAAIYRIGRTSAGALESTVLHRQGLREDQKEKLKEYRKRHTALDSRLRKEAFETLSVEQQKEIVTVSGSGAQITKDKVCNYLGVDPSTLPWEKMGSYTHFISDDFLRRGGDPNIVHFDRQPKKGKVSKKSQRIKRSDSQWVGRMRPRLSQETAKARMEADWAAQNENEEYKRLARSKQELARWCVNTLLQNTRCITQCDEIVVVIEDLNVKSLHGKGAREPGWDNFFTPKTENRWFIQILHKTFSELPKHRGEHVIEGCPLRTSITCPACSYCDKNSRNGEKFVCVACGATFHADFEVATYNLVRLATTGMPMPKSLERQGGGEKAGGARKARKKAKQVEKIVVQANANVTMNGASLHSP*
>CasΦ-10
MDMLDTETNYATETPAQQQDYSPKPPKKAQRAPKGFSKKARPEKKPPKPITLFTQKHFSGVRFLKRVIRDASKILKLSESRTITFLEQAIERDGSAPPDVTPPVHNTIMAVTRPFEEWPEVILSKALQKHCYALTKKIKIKTWPKKGPGKKCLAAWSARTKIPLIPGQVQATNGLFDRIGSIYDGVEKKVTNRNANKKLEYDEAIKEGRNPAVPEYETAYNIDGTLINKPGYNPNLYITQSRTPRLITEADRPLVEKILWQMVEKKTQSRNQARRARLEKAAHLQGLPVPKFVPEKVDRSQKIEIRIIDPLDKIEPYMPQDRMAIKASQDGHVPYWQRPFLSKRRNRRVRAGWGKQVSSIQAWLTGALLVIVRLGNEAFLADIRGALRNAQWRKLLKPDATYQSLFNLFTGDPVVNTRTNHLTMAYREGVVNIVKSRSFKGRQTREHLLTLLGQGKTVAGVSFDLGQKHAAGLLAAHFGLGEDGNPVFTPIQACFLPQRYLDSLTNYRNRYDALTLDMRRQSLLALTPAQQQEFADAQRDPGGQAKRACCLKLNLNPDEIRWDLVSGISTMISDLYIERGGDPRDVHQQVETKPKGKRKSEIRILKIRDGKWAYDFRPKIADETRKAQREQLWKLQKASSEFERLSRYKINIARAIANWALQWGRELSGCDIVIPVLEDLNVGSKFFDGKGKWLLGWDNRFTPKKENRWFIKVLHKAVAELAPHRGVPVYEVMPHRTSMTCPACHYCHPTNREGDRFECQSCHVVKNTDRDVAPYNILRVAVEGKTLDRWQAEKKPQAEPDRPMILIDNQES*
上記の配列のアスタリスク(*)は、STOPコドンを示す。あるいは、CasΦ-1は、Cas12jオルソログ1とも呼ばれる。したがって、CasΦ-1-CasΦ-10は、それぞれCas12jオルソログ1-10と呼ばれ得る。
ガイドポリヌクレオチド
一実施形態では、ガイドポリヌクレオチドはガイドRNAである。本明細書中で使用する場合、用語「ガイドRNA(gRNA)」及びその文法的同等物は、標的DNAに特異的であることができ、Casタンパク質と複合体を形成することができるRNAを指し得る。RNA/Cas複合体は、Casタンパク質を標的DNAに「ガイド」するのを支援することができる。Cas9/crRNA/tracrRNAが、スペーサーに相補的な直鎖または環状のdsDNA標的をエンドヌクレアーゼ的に切断する。crRNAに相補的でない標的鎖は、最初にエンドヌクレアーゼ的に切断され、次いで3’-5’エキソヌクレアーゼ的にトリミングされる。自然界では、DNAの結合及び切断には、通常、タンパク質と両方のRNAが必要である。しかしながら、単一ガイドRNA(「sgRNA」、または単に「gRNA」)は、crRNA及びtracrRNAの両方の態様を単一のRNA種に組み込むように改変することができる。例えば、Jinek M.et al, Science 337: 816-821 (2012)を参照されたい(その全内容は、参照により本明細書に援用される)。Cas9は、CRISPRリピート配列内の短いモチーフ(PAMあるいはプロトスペーサー隣接モチーフ)を認識して、自己と非自己を区別することを支援する。Cas9ヌクレアーゼの配列及び構造は当業者によく知られている(例えば、“Complete genome sequence of an M1 strain of Streptococcus pyogenes.” Ferretti, J. J. et al., Proc. Natl. Acad. Sci. U.S.A. 98: 4658-4663 (2001); “CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III.” Deltcheva E.et al., Nature 471: 602-607 (2011);及び“Programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.” Jinek M. et al, Science 337: 816-821 (2012)を参照されたい(これらのそれぞれの全内容は、参照により本明細書に援用される))。Cas9オルソログは、S. pyogenes及びS. thermophilusを含むがこれらに限定されない、様々な種で記載されている。追加の適切なCas9ヌクレアーゼ及び配列は、本開示に基づいて当業者に明らかであり得、そのようなCas9ヌクレアーゼ及び配列には、Chylinski, Rhun, and Charpentier, “The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems” (2013) RNA Biology 10: 5, 726-737に開示されている生物及び遺伝子座からのCas9配列が含まれ; その全内容は、参照により本明細書に組み込まれる。いくつかの実施形態では、Cas9ヌクレアーゼは、不活性(例えば、不活性化)DNA切断ドメインを有し、すなわち、Cas9はニッカーゼである。
いくつかの実施形態では、ガイドポリヌクレオチドは、少なくとも1つの単一のガイドRNA(「sgRNA」または「gRNA」)である。いくつかの実施形態では、ガイドポリヌクレオチドは、少なくとも1つのtracrRNAである。いくつかの実施形態では、ガイドポリヌクレオチドは、ポリヌクレオチドプログラム可能なDNA結合ドメイン(例えば、Cas9またはCpf1)を標的ヌクレオチド配列にガイドするためにPAM配列を必要としない。
本明細書に開示する塩基エディターのポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン(例えば、CRISPR由来ドメイン)は、ガイドポリヌクレオチドと会合することによって標的ポリヌクレオチド配列を認識することができる。ガイドポリヌクレオチド(例えば、gRNA)は、一般的には一本鎖であり、ポリヌクレオチドの標的配列に部位特異的に結合するように(すなわち、相補的塩基対を介して)プログラムされ、それにより、ガイド核酸と組み合わされた塩基エディターを標的配列へ向かわせることができる。ガイドポリヌクレオチドはDNAであり得る。ガイドポリヌクレオチドはRNAであり得る。当業者であれば理解するように、配列中のチミン(T)は、ガイドポリヌクレオチド配列においてウラシル(U)に置き換えられる。いくつかの場合では、ガイドポリヌクレオチドは、天然ヌクレオチド(例えば、アデノシン)を含む。いくつかの場合では、ガイドポリヌクレオチドは、非天然(non-natural)(または非自然(unnatural))ヌクレオチド(例えば、ペプチド核酸またはヌクレオチド類似体)を含む。いくつかの場合では、ガイド核酸配列の標的領域は、長さが少なくとも15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30ヌクレオチドであり得る。ガイド核酸の標的領域は、長さが10~30ヌクレオチドの間、または長さが15~25ヌクレオチドの間、または長さが15~20ヌクレオチドの間であり得る。いくつかの実施形態では、ガイドポリヌクレオチドは、特に5’末端において、1、2、3、4などのヌクレオチド分、短縮され得る。非限定的な例として、長さが20ヌクレオチドのガイドポリヌクレオチドは、特に5’末端において、1、2、3、4などのヌクレオチド分、短縮され得る。
いくつかの実施形態では、ガイドポリヌクレオチドは、2つ以上の個々のポリヌクレオチドを含み、これは、例えば、相補的塩基対形成を介して互いに相互作用することができる(例えば、二重ガイドポリヌクレオチド)。例えば、ガイドポリヌクレオチドは、CRISPR RNA(crRNA)及びトランス活性化CRISPR RNA(tracrRNA)を含み得る。例えば、ガイドポリヌクレオチドは、1つ以上のトランス活性化CRISPR RNA(tracrRNA)を含み得る。
II型CRISPR系では、CRISPRタンパク質(Cas9など)による核酸の標的化には、通常、標的配列を認識する配列を含む第1のRNA分子(crRNA)と、ガイドRNA-CRISPRタンパク質複合体を安定化する足場領域を形成する反復配列を含む第2のRNA分子(trRNA)の間の相補的な塩基対形成が必要である。そのようなデュアルガイドRNA系をガイドポリヌクレオチドとして使用して、本明細書に開示する塩基エディターを標的ポリヌクレオチド配列に向かわせることができる。
いくつかの実施形態では、本明細書中で提供する塩基エディターは、単一のガイドポリヌクレオチド(例えば、sgRNA)を利用する。いくつかの実施形態では、本明細書中で提供する塩基エディターは、二重ガイドポリヌクレオチド(例えば、二重gRNA)を利用する。いくつかの実施形態では、本明細書中で提供する塩基エディターは、1つ以上のガイドポリヌクレオチド(例えば、多重gRNA)を利用する。いくつかの実施形態では、単一のガイドポリヌクレオチドを、本明細書に記載する異なる塩基エディターのために利用する。例えば、単一のガイドポリヌクレオチドを、シチジン塩基エディター及びアデノシン塩基エディターに利用することができる。
他の実施形態では、ガイドポリヌクレオチドは、核酸のポリヌクレオチド標的化部分及び核酸の足場部分の両方を単一分子(すなわち、単一分子ガイド核酸)に含むことができる。例えば、単一分子ガイドポリヌクレオチドは、単一ガイドRNA(sgRNAまたはgRNA)であり得る。本明細書において、ガイドポリヌクレオチド配列という用語は、塩基エディターと相互作用し、それを標的ポリヌクレオチド配列に向かわせることができる任意の単一、二重、または多重分子核酸を企図する。
通常、ガイドポリヌクレオチド(例えば、crRNA/trRNA複合体またはgRNA)は、標的ポリヌクレオチド配列を認識して結合することができる配列を含む「ポリヌクレオチド標的化セグメント」、及び塩基エディターのポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン成分内でガイドポリヌクレオチドを安定化する「タンパク質結合セグメント」を含む。いくつかの実施形態では、ガイドポリヌクレオチドのポリヌクレオチド標的化セグメントは、DNAポリヌクレオチドを認識して結合し、それにより、DNA中の塩基の編集を促進する。他の場合では、ガイドポリヌクレオチドのポリヌクレオチド標的化セグメントは、RNAポリヌクレオチドを認識して結合し、それにより、RNA中の塩基の編集を促進する。本明細書において、「セグメント」とは、分子のセクションまたは領域、例えば、ガイドポリヌクレオチド中のヌクレオチドの連続ストレッチを指す。セグメントはまた、複合体の領域/セクションを表し得、したがってセグメントは複数の分子の複数領域を含み得る。例えば、ガイドポリヌクレオチドが複数の核酸分子を含む場合、タンパク質結合セグメントは、例えば、相補性の領域に沿ってハイブリダイズされる複数の別個の分子の全部または一部を含み得る。いくつかの実施形態では、2つの別個の分子を含むDNA標的化RNAのタンパク質結合セグメントは、(i)長さが100塩基対である第1のRNA分子の塩基対40~75及び; (ii)長さが50塩基対である第2のRNA分子の10~25塩基対を含み得る。「セグメント」の定義は、特定の文脈で特に定義されていない限り、特定の数の総塩基対に限定されず、所与のRNA分子に由来する特定の数の塩基対に限定されず、複合体内の別々の分子の特定の数に限定されず、任意の全長のRNA分子の領域を含み得、他の分子と相補的な領域を含み得る。
ガイドRNAまたはガイドポリヌクレオチドは、2つ以上のRNA、例えば、CRISPR RNA(crRNA)及びトランス活性化RNA(tracrRNA)を含み得る。ガイドRNAまたはガイドポリヌクレオチドは、場合により、crRNAの一部(例えば、機能部分)とtracrRNAとの融合によって形成される一本鎖RNA、または単一のガイドRNA(sgRNA)を含み得る。ガイドRNAまたはガイドポリヌクレオチドはまた、crRNA及びtracrRNAを含む二重RNAであり得る。さらに、crRNAは標的DNAとハイブリダイズすることができる。
上記のように、ガイドRNAまたはガイドポリヌクレオチドは、発現産物であり得る。例えば、ガイドRNAをコードするDNAは、ガイドRNAをコードする配列を含むベクターであり得る。ガイドRNAまたはガイドポリヌクレオチドは、単離されたガイドRNAによって、またはガイドRNA及びプロモーターをコードする配列を含むプラスミドDNAによって細胞をトランスフェクトすることにより、細胞中に移行させることができる。ガイドRNAまたはガイドポリヌクレオチドは、ウイルスを介した遺伝子送達を使用するなど、他の方法で細胞に移行させることもできる。
ガイドRNAまたはガイドポリヌクレオチドは、単離され得る。例えば、ガイドRNAは、単離されたRNAの形態で細胞または生物にトランスフェクトすることができる。ガイドRNAは、当技術分野で公知の任意のin vitro転写系を使用するin vitro転写によって調製することができる。ガイドRNAは、ガイドRNAのコード配列を含むプラスミドの形態ではなく、単離されたRNAの形態で細胞中に移行させることができる。
ガイドRNAまたはガイドポリヌクレオチドは、染色体配列の標的部位に相補的であり得る5’末端の第1の領域、ステムループ構造を形成することができる第2の内部領域、及び一本鎖であり得る第3の3’領域という、3つの領域を含み得る。各ガイドRNAが融合タンパク質を特定の標的部位にガイドするように、各ガイドRNAの第1の領域は異なっていてもよい。さらに、各ガイドRNAの第2及び第3の領域は、すべてのガイドRNAにおいて同一であり得る。
ガイドRNAまたはガイドポリヌクレオチドの第1の領域は、ガイドRNAの第1の領域が標的部位と塩基対を形成することができるように、染色体配列中の標的部位における配列に相補的であり得る。いくつかの場合では、ガイドRNAの第1の領域は、約10ヌクレオチド~25ヌクレオチド(すなわち、10ヌクレオチド~ヌクレオチド;または約10ヌクレオチド~約25ヌクレオチド;または10ヌクレオチド~約25ヌクレオチド;または約10ヌクレオチド~25ヌクレオチド)またはそれ以上を含み得る。例えば、ガイドRNAの第1の領域と染色体配列中の標的部位との間の塩基対形成の領域は、約10、11、12、13、14、15、16、17、18、19、20、22、23、24、25、またはそれ以上のヌクレオチド長であり得る。いくつかの実施形態では、ガイドRNAの第1の領域は、19、20、または21ヌクレオチド長であり得るか、または約19、20、または21ヌクレオチド長とすることができる。
ガイドRNAまたはガイドポリヌクレオチドはまた、二次構造を形成する第2の領域を含み得る。例えば、ガイドRNAによって形成される二次構造は、ステム(またはヘアピン)及びループを含み得る。ループとステムの長さは様々に異なる。例えば、ループは、長さが約3~10ヌクレオチドの範囲であり得、ステムは、長さが約6~20塩基対の範囲であり得る。ステムは、1~10または約10ヌクレオチドの1つ以上のバルジを含み得る。第2の領域の全長は、長さが約16~60ヌクレオチドの範囲であり得る。例えば、ループは、長さが4ヌクレオチドであり得るか、または約4ヌクレオチドであり得、ステムは、12塩基対であり得るか、または約12塩基対であり得る。
ガイドRNAまたはガイドポリヌクレオチドはまた、3’末端に、本質的に一本鎖であり得る第3の領域を含み得る。例えば、第3の領域は、場合により、目的の細胞内の染色体配列に対して相補性ではなく、場合により、ガイドRNAの残りの部分に対して相補性ではない。さらに、第3の領域の長さは様々に異なり得る。第3の領域は、4ヌクレオチド超または約4ヌクレオチド超の長さであり得る。例えば、第3の領域の長さは、約5~60ヌクレオチド長の範囲であり得る。
ガイドRNAまたはガイドポリヌクレオチドは、遺伝子標的の任意のエクソンまたはイントロンを標的とすることができる。いくつかの場合では、ガイドは、遺伝子のエクソン1または2を標的とすることができ、他の場合では、ガイドは、遺伝子のエクソン3または4を標的とすることができる。組成物は、すべてが同じエクソンを標的とする多重ガイドRNA、またはいくつかの場合では、異なるエクソンを標的とすることができる多重ガイドRNAを含み得る。遺伝子のエクソン及びイントロンが標的となり得る。
ガイドRNAまたはガイドポリヌクレオチドは、20ヌクレオチドまたは約20ヌクレオチドの核酸配列を標的とすることができる。標的核酸は、20ヌクレオチド未満または約20ヌクレオチド未満であり得る。標的核酸は、少なくともまたは少なくとも約5、10、15、16、17、18、19、20、21、22、23、24、25、30、または1~100ヌクレオチドの長さのいずれかであり得る。標的核酸は、多くとも5、10、15、16、17、18、19、20、21、22、23、24、25、30、40、50、もしくは多くとも約5、10、15、16、17、18、19、20、21、22、23、24、25、30、40、50、または1~100ヌクレオチドの長さのいずれかであり得る。標的核酸配列は、PAMの第1のヌクレオチドのすぐ5’側の20塩基であるか、または約20塩基であり得る。ガイドRNAは、核酸配列を標的化することができる。標的核酸は、少なくとも(または少なくとも約)1~10、1~20、1~30、1~40、1~50、1~60、1~70、1~80、1~90、または1~100ヌクレオチドであり得る。
ガイドポリヌクレオチド、例えば、ガイドRNAとは、別の核酸、例えば、細胞のゲノム中の標的核酸またはプロトスペーサーにハイブリダイズすることができる核酸を指し得る。ガイドポリヌクレオチドはRNAであり得る。ガイドポリヌクレオチドはDNAであり得る。ガイドポリヌクレオチドは、核酸の配列に部位特異的に結合するようにプログラムまたは設計することができる。ガイドポリヌクレオチドは、一ポリヌクレオチド鎖を含み得、単一のガイドポリヌクレオチドと呼ばれ得る。ガイドポリヌクレオチドは、2つのポリヌクレオチド鎖を含み得、二重ガイドポリヌクレオチドと呼ばれ得る。ガイドRNAは、RNA分子として細胞または胚に導入することができる。例えば、RNA分子を、in vitroで転写することができ、及び/または化学的に合成することができる。RNAは、合成DNA分子、例えば、gBlocks(登録商標)遺伝子断片から転写させることができる。次いで、ガイドRNAを、RNA分子として細胞または胚に導入することができる。ガイドRNAはまた、非RNA核酸分子、例えば、DNA分子の形態で細胞または胚に導入することもできる。例えば、ガイドRNAをコードするDNAを、目的の細胞または胚内でガイドRNAを発現させるためのプロモーター制御配列に作動可能に連結することができる。RNAコード配列は、RNAポリメラーゼIII(Pol III)によって認識されるプロモーター配列に作動可能に連結することができる。ガイドRNAを発現させるために使用することができるプラスミドベクターとして、px330ベクター及びpx333ベクターが挙げられるが、これらに限定されない。いくつかの場合では、プラスミドベクター(例えば、px333ベクター)は、少なくとも2つのガイドRNAをコードするDNA配列を含み得る。
ガイドポリヌクレオチド、例えば、ガイドRNA及び標的化配列を選択、設計、及び検証するための方法は、本明細書に記載されており、当業者に公知である。例えば、核酸塩基エディター系におけるデアミナーゼドメイン(例えば、AIDドメイン)の潜在的な基質非特異性の影響を最小限にするために、意図せずに脱アミノ化の標的となる可能性のある残基の数(例えば、標的核酸遺伝子座内のssDNAに潜在的に存在し得るオフターゲットC残基)を最小限に抑え得る。さらに、ソフトウェアツールを使用して、標的核酸配列に対応するgRNAを最適化し、例えば、ゲノム全体のオフターゲット活性の合計を最小限に抑えることができる。例えば、S. pyogenes Cas9を使用した可能な標的化ドメインの選択ごとに、最大で特定数(例えば、1、2、3、4、5、6、7、8、9、または10個)のミスマッチ塩基対を含むすべてのオフターゲット配列(例えば、NAGまたはNGGなどの、先行する選択されたPAM)を、ゲノム全体で同定することができる。標的部位に相補的なgRNAの第1の領域を同定することができ、すべての第1の領域(例えば、crRNA)を、その予測されたオフターゲットスコアの合計に従ってランク付けすることができ; 上位の標的化ドメインは、オンターゲット活性が最大でオフターゲット活性が最小である可能性が高いドメインを表す。候補標的化gRNAは、当技術分野で公知の方法及び/または本明細書に記載の方法を使用することによって機能的に評価することができる。
非限定的な例として、Cas9と共に使用するためのガイドRNAのcrRNA中の標的DNAハイブリダイズ配列を、DNA配列検索アルゴリズムを使用して同定してもよい。gRNA設計は、Bae S., Park J., & Kim J.-S. Cas-OFFinder: A fast and versatile algorithm that searches for potential off-target sites of Cas9 RNA-guided endonucleases. Bioinformatics 30, 1473-1475 (2014)に記載されているように、パブリックツールcas-offinderに基づくカスタムgRNA設計ソフトウェアを使用して実施してもよい。このソフトウェアは、ゲノム全体のオフターゲット傾向を計算した後、ガイドをスコアリングする。17~24の長さの範囲のガイドに対して、通常、完全一致~7か所の不一致の範囲の一致を考慮する。オフターゲット部位を計算によって決定した後、ガイドごとに集計スコアを計算し、Webインターフェイスを使用して表形式の出力にまとめる。PAM配列に隣接する潜在的な標的部位を同定することに加えて、ソフトウェアは、選択された標的部位から1、2、3または3ヌクレオチド超異なるすべてのPAM隣接配列も同定する。標的核酸配列(例えば標的遺伝子)についてのゲノムDNA配列を取得し得、そして反復エレメントを、公的に利用可能なツール、例えば、RepeatMaskerプログラムを使用してスクリーニングし得る。RepeatMaskerは、入力DNA配列を、反復エレメント及び複雑度の低い領域について検索する。出力は、所与のクエリ配列に存在する反復の詳細なアノテーションである。
同定に続いて、ガイドRNA、例えば、crRNAの第1の領域を、標的部位までの距離、それらの直交性(orthogonality)、及び関連するPAM配列との密接な一致のための5’ヌクレオチドの存在(例えば、関連するPAM(例えば、S. pyogenesの場合はNGG PAM、S. aureusの場合はNNGRRTまたはNNGRRV PAM))を含有するヒトゲノム内の密接な一致の同定に基づく5’G)に基づいて階層にランク付けし得る。本明細書中で使用する場合、直交性とは、標的配列に対する最小数のミスマッチを含むヒトゲノム中の配列の数を指す。「高レベルの直交性」または「良好な直交性」とは、例えば、意図した標的以外にヒトゲノムに同一の配列を有さない、または標的配列内に1つもしくは2つのミスマッチを含む配列を有さない、20merの標的化ドメインを指し得る。オフターゲットDNA切断を最小限に抑えるために、良好な直交性を有する標的化ドメインを選択し得る。
いくつかの実施形態では、塩基編集活性を検出し、候補ガイドポリヌクレオチドを試験するために、レポーター系を使用してもよい。いくつかの実施形態では、レポーター系は、塩基編集活性がレポーター遺伝子の発現をもたらすレポーター遺伝子ベースのアッセイを含み得る。例えば、レポーター系は、テンプレート鎖上で不活性化された開始コドン、例えば、3’-TAC-5’から3’-CAC-5’への変異を含むレポーター遺伝子を含み得る。標的Cの脱アミノ化が成功すると、対応するmRNAは5’-GUG-3’ではなく5’-AUG-3’として転写され、レポーター遺伝子の翻訳が可能になる。適切なレポーター遺伝子は、当業者には明らかであろう。レポーター遺伝子の非限定的な例として、緑色蛍光タンパク質(GFP)、赤色蛍光タンパク質(RFP)、ルシフェラーゼ、分泌型アルカリホスファターゼ(SEAP)をコードする遺伝子、またはその発現が検出可能で当業者に明らかな任意の他の遺伝子が挙げられる。レポーター系を使用して、例えば、標的DNA配列に関して、それぞれのデアミナーゼがどの残基(複数可)を標的とするかを決定するために、多くの異なるgRNAを試験することができる。Cas9デアミナーゼ融合タンパク質などの特定の塩基編集タンパク質のオフターゲット効果を評価するために、非テンプレート鎖を標的とするsgRNAを試験することもできる。いくつかの実施形態では、そのようなgRNAを、変異した開始コドンがgRNAと塩基対を形成しないように設計することができる。ガイドポリヌクレオチドは、標準的なリボヌクレオチド、修飾されたリボヌクレオチド(例えば、シュードウリジン)、リボヌクレオチド異性体、及び/またはリボヌクレオチド類似体を含み得る。いくつかの実施形態では、ガイドポリヌクレオチドは、少なくとも1つの検出可能な標識を含み得る。検出可能な標識は、フルオロフォア(例えば、FAM、TMR、Cy3、Cy5、Texas Red、Oregon Green、Alexa Fluors、Haloタグ、または適切な蛍光色素)、検出タグ(例えば、ビオチン、ジゴキシゲニンなど)、量子ドット、または金粒子であり得る。
ガイドポリヌクレオチドは、化学的に合成するか、酵素的に合成するか、またはそれらの組み合わせであり得る。例えば、ガイドRNAは、標準的なホスホルアミダイト系の固相合成法を使用して合成することができる。あるいは、ガイドRNAをコードするDNAを、ファージRNAポリメラーゼによって認識されるプロモーター制御配列に作動可能に連結することによって、ガイドRNAをin vitroで合成することができる。適切なファージプロモーター配列の例として、T7、T3、SP6プロモーター配列、またはそれらのバリアントが挙げられる。ガイドRNAが2つの別個の分子(例えば、crRNA及びtracrRNA)を含む実施形態では、crRNAは化学的に合成することができ、tracrRNAは酵素的に合成することができる。
いくつかの実施形態では、塩基エディターシステムは、複数のガイドポリヌクレオチド、例えば、gRNAを含み得る。例えば、gRNAは、塩基エディターシステムに含まれる1つ以上の標的遺伝子座(例えば、少なくとも1つのgRNA、少なくとも2つのgRNA、少なくとも5つのgRNA、少なくとも10個のgRNA、少なくとも20個のgRNA、少なくとも30個のgRNA、少なくとも50個のgRNA)を標的とし得る。多重gRNA配列はタンデムに配置することができ、好ましくは直接反復によって分離される。
ガイドRNAまたはガイドポリヌクレオチドをコードするDNA配列もまた、ベクターの一部であり得る。さらに、ベクターは、追加の発現制御配列(例えば、エンハンサー配列、コザック配列、ポリアデニル化配列、転写終結配列など)、選択可能なマーカー配列(例えば、GFPまたはピューロマイシンなどの抗生物質耐性遺伝子)、複製起点などを含み得る。ガイドRNAをコードするDNA分子はまた、直鎖状とすることもできる。ガイドRNAまたはガイドポリヌクレオチドをコードするDNA配列はまた、環状とすることもできる。
いくつかの実施形態では、塩基エディターシステムの1つ以上の成分は、DNA配列によってコードされ得る。そのようなDNA配列を、一緒にまたは別々に、発現系、例えば、細胞に導入してもよい。例えば、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン及びガイドRNAをコードするDNA配列を細胞に導入することができ、各DNA配列は別個の分子(例えば、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインコード配列を含む1つのベクターと、ガイドRNAコード配列を含む第2のベクター)の一部とすることができ、あるいは両方を同じ分子の一部にすることができる(例えば、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインとガイドRNAの両方のコード(及び調節)配列を含む1つのベクター)。
ガイドポリヌクレオチドに1つ以上の修飾を含めて、核酸に新しいまたは強化された特徴を提供することができる。ガイドポリヌクレオチドは、核酸親和性タグを含み得る。ガイドポリヌクレオチドは、合成ヌクレオチド、合成ヌクレオチド類似体、ヌクレオチド誘導体、及び/または修飾ヌクレオチドを含み得る。
いくつかの場合では、gRNAまたはガイドポリヌクレオチドは修飾を含み得る。修飾は、gRNAまたはガイドポリヌクレオチドの任意の位置で行うことができる。単一のgRNAまたはガイドポリヌクレオチドに複数の修飾を加えることができる。修飾後に、gRNAまたはガイドポリヌクレオチドを品質管理に供することができる。いくつかの場合では、品質管理には、PAGE、HPLC、MS、またはそれらの任意の組み合わせが含まれる。
gRNAまたはガイドポリヌクレオチドの修飾は、置換、挿入、欠失、化学的修飾、物理的修飾、安定化、精製、またはそれらの任意の組み合わせであり得る。
gRNAまたはガイドポリヌクレオチドはまた、5’アデニレート、5’グアノシン-三リン酸cap、5’N7-メチルグアノシン-三リン酸cap、5’三リン酸cap、3’リン酸、3’チオリン酸、5’リン酸、5’チオリン酸、シス-Synチミジン二量体、三量体、C12スペーサー、C3スペーサー、C6スペーサー、dSpacer、PCスペーサー、rSpacer、Spacer 18、Spacer 9、3’-3’修飾、5’-5’修飾、脱塩基、アクリジン、アゾベンゼン、ビオチン、ビオチンBB、ビオチンTEG、コレステリルTEG、デスチオビオチンTEG、DNP TEG、DNP-X、DOTA、dT-ビオチン、デュアルビオチン、PCビオチン、ソラレンC2、ソラレンC6、TINA、3’DABCYL、ブラックホールクエンチャー1、ブラックホールクエンチャー2、DABCYL SE、dT-DABCYL、IRDye QC-1、QSY-21、QSY-35、QSY-7、QSY-9、カルボキシルリンカー、チオールリンカー、2’-デオキシリボヌクレオシド類似体プリン、2’-デオキシリボヌクレオシド類似体ピリミジン、リボヌクレオシド類似体、2’-O-メチルリボヌクレオシド類似体、糖修飾類似体、ウォブル/ユニバーサル塩基、蛍光色素標識、2’-フルオロRNA、2’-O-メチルRNA、ホスホン酸メチル、ホスホジエステルDNA、ホスホジエステルRNA、ホスホチオエートDNA、ホスホロチオエートRNA、UNA、シュードウリジン-5’-三リン酸、5’-メチルシチジン-5’-三リン酸、またはそれらの任意の組み合わせによって修飾され得る。
いくつかの場合では、修飾は永続的である。他の場合では、修飾は一時的である。いくつかの場合では、gRNAまたはガイドポリヌクレオチドに対して、複数の修飾を行う。gRNAまたはガイドポリヌクレオチド修飾は、それらのコンフォメーション、極性、疎水性、化学反応性、塩基対相互作用、またはそれらの任意の組み合わせなどのヌクレオチドの物理化学的特性を変えることができる。
修飾はまた、ホスホロチオエート置換体であり得る。いくつかの場合では、天然のホスホジエステル結合は、細胞のヌクレアーゼによる急速な分解を受けやすい可能性があり; ホスホロチオエート(PS)結合置換体を使用したヌクレオチド間結合の修飾は、細胞分解による加水分解に対してより安定している可能性がある。修飾は、gRNAまたはガイドポリヌクレオチドの安定性を高めることができる。修飾はまた、生物学的活性を高めることができる。いくつかの場合では、ホスホロチオエートで強化されたRNA gRNAは、RNase A、RNase T1、ウシ血清ヌクレアーゼ、またはそれらの任意の組み合わせを阻害することができる。これらの特性により、ヌクレアーゼへの曝露がin vivoまたはin vitroで高確率で行われる用途において、PS-RNA gRNAを使用することができる。例えば、ホスホロチオエート(PS)結合をgRNAの5’-または’’-末端の最後の3~5ヌクレオチドの間に導入することができ、エキソヌクレアーゼ分解を阻害することができる。いくつかの場合では、ホスホロチオエート結合をgRNA全体に付加してエンドヌクレアーゼによる攻撃を減らすことができる。
プロトスペーサー隣接モチーフ
用語「プロトスペーサー隣接モチーフ(PAM)」またはPAM様モチーフとは、CRISPR細菌適応免疫系のCas9ヌクレアーゼが標的とするDNA配列の直後にある2~6塩基対のDNA配列を指す。いくつかの実施形態では、PAMは5’PAM(すなわち、プロトスペーサーの5’末端の上流に位置する)であり得る。他の実施形態では、PAMは3’PAM(すなわち、プロトスペーサーの5’末端の下流に位置する)であり得る。
PAM配列は標的結合に不可欠であるが、正確な配列はCasタンパク質の種類によって異なる。PAM配列は、当技術分野で公知の任意のPAM配列であり得る。適切なPAM配列として、NGG、NGA、NGC、NGN、NGT、NGTT、NGCG、NGAG、NGAN、NGNG、NGCN、NGCG、NGTN、NNGRRT、NNNRRT、NNGRR(N)、TTTV、TYCV、TYCV、TATV、NNNNGATT、NNAGAAW、またはNAAAACが挙げられるが、これらに限定されない。Yはピリミジンであり; Nは任意のヌクレオチド塩基であり; WはAまたはTである。
本明細書中で提供する塩基エディターは、標準または非標準プロトスペーサー隣接モチーフ(PAM)配列を含むヌクレオチド配列に結合することができるCRISPRタンパク質由来ドメインを含み得る。PAM部位は、標的ポリヌクレオチド配列に近接するヌクレオチド配列である。本開示のいくつかの態様は、異なるPAM特異性を有するCRISPRタンパク質の全部または一部を含む塩基エディターを提供する。例えば、通常、Cas9タンパク質、例えば、S. pyogenes由来のCas9(spCas9)は、特定の核酸領域に結合するために標準的なNGG PAM配列を必要とし、「NGG」の「N」は、アデニン(A)、チミン(T)、グアニン(G)、またはシトシン(C)であり、Gはグアニンである。PAMはCRISPRタンパク質特異的であり、異なるCRISPRタンパク質由来ドメインを含む異なる塩基エディター間で異なり得る。PAMは、標的配列の5’または3’にあり得る。PAMは、標的配列の上流または下流であり得る。PAMは、1、2、3、4、5、6、7、8、9、10ヌクレオチド以上の長さであり得る。多くの場合、PAMの長さは2~6ヌクレオチドである。
いくつかの実施形態では、例えば、R. T. Walton et al., 2020, Science, 10.1126/science.aba8853 (2020)(その全内容は参照により本明細書に援用される)に記載のように、PAMは、「NRN」PAMであり、「NRN」の「N」が、アデニン(A)、チミン(T)、グアニン(G)、もしくはシトシン(C)であり、Rが、アデニン(A)もしくはグアニン(G)であるか;または、PAMは「NYN」PAMであり、NYNの「N」が、アデニン(A)、チミン(T)、グアニン(G)、もしくはシトシン(C)であり、Yが、シチジン(C)もしくはチミン(T)である。
いくつかのPAMバリアントを表1Eに示す。
Figure 2022546608000057
いくつかの実施形態では、PAMはNGCである。いくつかの実施形態では、NGC PAMは、Cas9バリアント、例えば、SpCas9バリアントによって認識される。いくつかの実施形態では、NGC PAMバリアントは、D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、及びT1337R(「MQKFRAER」と総称される)から選択される1つ以上のアミノ酸置換を含む。
いくつかの実施形態では、PAMはNGTである。いくつかの実施形態では、NGT PAMはCas9バリアントによって認識される。いくつかの実施形態では、NGT PAMバリアントは、1つ以上の残基1335、1337、1135、1136、1218、及び/または1219での標的変異によって生成される。いくつかの実施形態では、NGT PAMバリアントは、1つ以上の残基1219、1335、1337、1218での標的変異によって作成される。いくつかの実施形態では、NGT PAMバリアントは、1つ以上の残基1135、1136、1218、1219、及び1335での標的変異によって作成される。いくつかの実施形態では、NGT PAMバリアントは、以下の表2及び3に示す標的変異のセットから選択される。
Figure 2022546608000058

Figure 2022546608000059
いくつかの実施形態では、NGT PAMバリアントは、表2及び3のバリアント5、7、28、31、または36から選択される。いくつかの実施形態では、バリアントは、NGT PAM認識が向上している。
いくつかの実施形態では、NGT PAMバリアントは、残基1219、1335、1337、及び/または1218で変異を有する。いくつかの実施形態では、NGT PAMバリアントは、以下の表4に示すバリアントからの認識を向上させるための変異を用いて選択される。
Figure 2022546608000060
いくつかの実施形態では、NGT PAMは、以下の表5に示すバリアントから選択される。
Figure 2022546608000061
いくつかの実施形態では、NGTNバリアントは、バリアント1である。いくつかの実施形態では、NGTNバリアントは、バリアント2である。いくつかの実施形態では、NGTNバリアントは、バリアント3である。いくつかの実施形態では、NGTNバリアントは、バリアント4である。いくつかの実施形態では、NGTNバリアントはバリアント5である。いくつかの実施形態では、NGTNバリアントはバリアント6である。
いくつかの実施形態では、Cas9ドメインは、Streptococcus pyogenes(SpCas9)由来のCas9ドメインである。いくつかの実施形態では、SpCas9ドメインは、ヌクレアーゼ活性SpCas9、ヌクレアーゼ不活性SpCas9(SpCas9d)、またはSpCas9ニッカーゼ(SpCas9n)である。いくつかの実施形態では、SpCas9は、D9X変異、または本明細書中で提供するアミノ酸配列のいずれかにおける対応する変異を含み、Xは、Dを除く任意のアミノ酸である。いくつかの実施形態では、SpCas9は、D9A変異、または本明細書中で提供するアミノ酸配列のいずれかにおける対応する変異を含む。いくつかの実施形態では、SpCas9ドメイン、SpCas9dドメイン、またはSpCas9nドメインは、非標準PAMを有する核酸配列に結合することができる。いくつかの実施形態では、SpCas9ドメイン、SpCas9dドメイン、またはSpCas9nドメインは、NGG、NGA、またはNGCG PAM配列を有する核酸配列に結合することができる。
いくつかの実施形態では、SpCas9ドメインは、D1135X、R1335X、及びT1337X変異のうちの1つ以上、または本明細書中で提供するアミノ酸配列のいずれかにおける対応する変異を含み、Xは任意のアミノ酸である。いくつかの実施形態では、SpCas9ドメインは、D1135E、R1335Q、及びT1337R変異のうちの1つ以上、または本明細書中で提供するアミノ酸配列のいずれかにおける対応する変異を含む。いくつかの実施形態では、SpCas9ドメインは、D1135E、R1335Q、及びT1337R変異、または本明細書中で提供するアミノ酸配列のいずれかにおける対応する変異を含む。いくつかの実施形態では、SpCas9ドメインは、D1135X、R1335X、及びT1337X変異のうちの1つ以上、または本明細書中で提供するアミノ酸配列のいずれかにおける対応する変異を含み、Xは任意のアミノ酸である。いくつかの実施形態では、SpCas9ドメインは、D1135V、R1335Q、及びT1337R変異のうちの1つ以上、または本明細書中で提供するアミノ酸配列のいずれかにおける対応する変異を含む。いくつかの実施形態では、SpCas9ドメインは、D1135V、R1335Q、及びT1337R変異、または本明細書中で提供するアミノ酸配列のいずれかにおける対応する変異を含む。いくつかの実施形態では、SpCas9ドメインは、D1135X、G1218X、R1335X、及びT1337X変異のうちの1つ以上、または本明細書中で提供するアミノ酸配列のいずれかにおける対応する変異を含み、Xは任意のアミノ酸である。いくつかの実施形態では、SpCas9ドメインは、D1135V、G1218R、R1335Q、及びT1337R変異のうちの1つ以上、または本明細書中で提供するアミノ酸配列のいずれかにおける対応する変異を含む。いくつかの実施形態では、SpCas9ドメインは、D1135V、G1218R、R1335Q、及びT1337R変異、または本明細書中で提供するアミノ酸配列のいずれかにおける対応する変異を含む。
いくつかの実施形態では、本明細書中で提供する融合タンパク質のいずれかのCas9ドメインは、本明細書に記載のCas9ポリペプチドに対して、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。いくつかの実施形態では、本明細書中で提供する融合タンパク質のいずれかのCas9ドメインは、本明細書に記載の任意のCas9ポリペプチドのアミノ酸配列を含む。いくつかの実施形態では、本明細書中で提供する融合タンパク質のいずれかのCas9ドメインは、本明細書に記載の任意のCas9ポリペプチドのアミノ酸配列からなる。
いくつかの例では、本明細書に開示する塩基エディターのCRISPRタンパク質由来ドメインによって認識されるPAMを、塩基エディターをコードするインサート(例えば、AAVインサート)とは別個のオリゴヌクレオチド上にて、細胞に提供することができる。そのような実施形態では、別個のオリゴヌクレオチド上にPAMを提供することにより、標的配列と同じポリヌクレオチド上にPAMが隣接して存在しないことから本来切断できないであろう標的配列の切断が可能になり得る。
一実施形態では、S. pyogenes Cas9 (SpCas9)をゲノム改変用のCRISPRエンドヌクレアーゼとして使用することができる。しかしながら、他のものを使用することができる。いくつかの実施形態では、異なるエンドヌクレアーゼを使用して、特定のゲノム標的を標的化することができる。いくつかの実施形態では、非NGG PAM配列を有する合成SpCas9由来バリアントを使用することができる。さらに、様々な種に由来する他のCas9オルソログが同定されており、これらの「非SpCas9」は、本開示にも有用であり得る様々なPAM配列に結合することができる。例えば、比較的大きなサイズのSpCas9(およそ4kbのコード配列)は、細胞内で効率的に発現できないSpCas9 cDNAを保有するプラスミドをもたらし得る。逆に、Staphylococcus aureus Cas9 (SaCas9)のコード配列は、SpCas9よりもおよそ1キロベース短く、細胞内で効率的に発現できる可能性がある。SpCas9と同様に、SaCas9エンドヌクレアーゼは、in vitroで哺乳類細胞において、及びin vivoでマウスにおいて、標的遺伝子を改変することができる。いくつかの実施形態では、Casタンパク質は、異なるPAM配列を標的とすることができる。いくつかの実施形態では、標的遺伝子は、例えば、Cas9 PAM、5’-NGGに隣接し得る。他の実施形態では、他のCas9オルソログは、異なるPAM要件を有し得る。例えば、S. thermophilus(CRISPR1の場合は5’-NNAGAA、CRISPR3の場合は5’-NGGNG)及びNeisseria meningitidis(5’-NNNNGATT)のものなどの他のPAMも標的遺伝子に隣接して見出され得る。
いくつかの実施形態では、S. pyogenes系の場合、標的遺伝子配列は、5’-NGG PAMより先行させることができ(すなわち、5’側へ)、20ntのガイドRNA配列は、反対の鎖と塩基対を形成して、PAMに隣接するCas9切断を媒介することができる。いくつかの実施形態では、隣接するcutは、PAMの3塩基対または約3塩基対上流であり得る。いくつかの実施形態では、隣接するcutは、PAMの10塩基対または約10塩基対上流であり得る。いくつかの実施形態では、隣接するcutは、PAMの0~20塩基対または約0~20塩基対上流であり得る。例えば、隣接するcutは、PAMの、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30塩基対上流に隣接し得る。隣接するcutはまた、PAMの1~30塩基対下流であり得る。PAM配列に結合することができる例示的なSpCas9タンパク質の配列は以下の通りである:
例示的なPAM結合SpCas9のアミノ酸配列は以下の通りである:
MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD.
例示的なPAM結合SpCas9nのアミノ酸配列は以下の通りである:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD.
例示的なPAM結合SpEQR Cas9のアミノ酸配列は以下の通りである:
Figure 2022546608000062
この配列では、D1135、R1335、及びT1337から変異させてSpEQR Cas9を生成し得る残基E1135、Q1335、及びR1337に、下線が引かれ、太字で示されている。
例示的なPAM結合SpVQR Cas9のアミノ酸配列は以下の通りである:
Figure 2022546608000063
この配列では、D1135、R1335、及びT1337から変異させてSpVQR Cas9を生成し得る残基V1135、Q1335、及びR1337に、下線が引かれ、太字で示されている。
例示的なPAM結合SpVRER Cas9のアミノ酸配列は以下の通りである:
Figure 2022546608000064
上記の配列では、D1134、G1218、R1335、及びT1337から変異させてSpVRER Cas9を生成し得る残基V1135、R1218、Q1335、及びR1337に、下線が引かれ、太字で示されている。
いくつかの実施形態では、改変SpCas9バリアントは、3’H(非G PAM)に隣接するプロトスペーサー隣接モチーフ(PAM)配列を認識することができる(表1A~1Eを参照のこと)。いくつかの実施形態では、SpCas9バリアントは、NRNH PAMを認識する(配列中、Rは、AまたはGであり、Hは、A、CまたはTである)。いくつかの実施形態では、非G PAMは、NRRH、NRTH、またはNRCHである(例えば、Miller, S. M., et al. Continuous evolution of SpCas9 variants compatible with non-G PAMs, Nat. Biotechnol. (2020)を参照のこと(その全内容は、参照により本明細書に援用される))。
いくつかの実施形態では、Cas9ドメインは、組換えCas9ドメインである。いくつかの実施形態では、組換えCas9ドメインは、SpyMacCas9ドメインである。いくつかの実施形態では、SpyMacCas9ドメインは、ヌクレアーゼ活性SpyMacCas9、ヌクレアーゼ不活性SpyMacCas9 (SpyMacCas9d)、またはSpyMacCas9ニッカーゼ(SpyMacCas9n)である。いくつかの実施形態では、SaCas9ドメイン、SaCas9dドメイン、またはSaCas9nドメインは、非標準PAMを有する核酸配列に結合することができる。いくつかの実施形態では、SpyMacCas9ドメイン、SpCas9dドメイン、またはSpCas9nドメインは、NAA PAM配列を有する核酸配列に結合することができる。
天然の5’-NAAN-3’PAM特異性を有するStreptococcus macacaeにおける例示的なSpy Cas9のCas9A相同体の配列は、当技術分野で公知であり、例えば、Jakimo et al., (www.biorxiv.org/content/biorxiv/early/2018/09/27/429654.full.pdf)に記載されており、以下に示す。
SpyMacCas9
MDKKYSIGLDIGTNSVGWAVITDDYKVPSKKFKVLGNTDRHSIKKNLIGALLFGSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLADSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQIYNQLFEENPINASRVDAKAILSARLSKSRRLENLIAQLPGEKRNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNSEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGAYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDRGMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGHSLHEQIANLAGSPAIKKGILQTVKIVDELVKVMGHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFIKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEIQTVGQNGGLFDDNPKSPLEVTPSKLVPLKKELNPKKYGGYQKPTTAYPVLLITDTKQLIPISVMNKKQFEQNPVKFLRDRGYQQVGKNDFIKLPKYTLVDIGDGIKRLWASSKEIHKGNQLVVSKKSQILLYHAHHLDSDLSNDYLQNHNQQFDVLFNEIISFSKKCKLGKEHIQKIENVYSNKKNSASIEELAESFIKLLGFTQLGATSPFNFLGVKLNQKQYKGKKDYILPCTEGTLIRQSITGLYETRVDLSKIGED.
いくつかの場合では、バリアントCas9タンパク質は、H840A、P475A、W476A、N477A、D1125A、W1126A、及びD1218A変異を有し、それにより、このポリペプチドは、標的DNAまたは標的RNAを切断する能力が低下している。そのようなCas9タンパク質は、標的DNA(例えば、一本鎖標的DNA)を切断する能力が低下しているが、標的DNA(例えば、一本鎖標的DNA)に結合する能力を保持している。別の非限定的な例として、いくつかの場合では、バリアントCas9タンパク質は、D10A、H840A、P475A、W476A、N477A、D1125A、W1126A、及びD1218A変異を有し、それにより、このポリペプチドは、標的DNAを切断する能力が低下している。そのようなCas9タンパク質は、標的DNA(例えば、一本鎖標的DNA)を切断する能力が低下しているが、標的DNA(例えば、一本鎖標的DNA)に結合する能力を保持している。いくつかの場合では、バリアントCas9タンパク質がW476A及びW1126A変異を含む場合、またはバリアントCas9タンパク質がP475A、W476A、N477A、D1125A、W1126A、及びD1218A変異を含む場合、バリアントCas9タンパク質はPAM配列に効率的に結合しない。したがって、いくつかのそのような場合、そのようなバリアントCas9タンパク質を結合方法で使用する場合、方法はPAM配列を必要としない。言い換えれば、いくつかの場合では、そのようなバリアントCas9タンパク質を結合方法で使用する場合、方法はガイドRNAを含むことができるが、方法はPAM配列がなくても実施することができる(そして結合の特異性はしたがって、ガイドRNAの標的化セグメントによって提供される)。他の残基を、上記の効果を達成する(すなわち、1つまたは他のヌクレアーゼ部分を不活性化する)ために変異させ得る。非限定的な例として、残基D10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D986、及び/またはA987を改変する(すなわち、置換する)ことができる。また、アラニン置換以外の変異も適している。
いくつかの実施形態では、塩基エディターのCRISPRタンパク質由来ドメインは、標準PAM配列(NGG)を有するCas9タンパク質の全部または一部を含み得る。他の実施形態では、塩基エディターのCas9由来ドメインは、非標準PAM配列を使用することができる。そのような配列は当技術分野で説明されており、当業者には明らかであろう。例えば、非標準PAM配列に結合するCas9ドメインは、Kleinstiver, B. P., et al., “Engineered CRISPR-Cas9 nucleases with altered PAM specificities” Nature 523, 481-485 (2015);及びKleinstiver, B. P., et al., “Broadening the targeting range of Staphylococcus aureus CRISPR-Cas9 by modifying PAM recognition” Nature Biotechnology 33, 1293-1298 (2015); R. T. Walton et al. “Unconstrained genome targeting with near-PAMless engineered CRISPR-Cas9 variants” Science 10.1126/science.aba8853 (2020); Hu et al. “Evolved Cas9 variants with broad PAM compatibility and high DNA specificity,” Nature, 2018 Apr. 5, 556 (7699), 57-63; S. Miller et al., “Continuous evolution of SpCas9 variants compatible with non-G PAMs” Nat. Biotechnol., 2020 Apr; 38 (4): 471-481に記載されており; それぞれの全内容は、参照により本明細書に援用される。例として、S.Miller et al.(2020、同書)は、NRNH PAM(配列中、Rは、AまたはG、Hは、A、C、またはTである)などの非G PAMを集合的に認識するSpCas9バリアントについて記載している。
Cas9ドメインとシチジンデアミナーゼ及び/またはアデノシンデアミナーゼを含む融合タンパク質
本開示のいくつかの態様は、Cas9ドメインまたは他の核酸プログラム可能なDNA結合タンパク質及び1つ以上のアデノシンデアミナーゼドメイン、シチジンデアミナーゼドメイン、及び/またはDNAグリコシラーゼドメインを含む融合タンパク質を提供する。Cas9ドメインは、本明細書中で提供するCas9ドメインまたはCas9タンパク質(例えば、dCas9またはnCas9)のいずれかであり得ることが理解されるべきである。いくつかの実施形態では、本明細書中で提供するCas9ドメインまたはCas9タンパク質(例えば、dCas9またはnCas9)のいずれかを、本明細書中に記載のアデノシンデアミナーゼ及びシチジンデアミナーゼのいずれかと融合させてもよい。本明細書に開示する塩基エディターのドメインは、任意の順序で配置することができる。
いくつかの実施形態では、融合タンパク質は、以下のドメインA~C、A~D、またはA~Eを含む:
NH2-[A-B-C]-COOH;
NH2-[A-B-C-D]-COOH;または
NH2-[A-B-C-D-E]-COOH;
式中、A及びCまたはA、C、及びEは、それぞれ、以下の1つ以上を含む:
アデノシンデアミナーゼドメインまたはその活性断片、
シチジンデアミナーゼドメインまたはその活性断片、
DNAグリコシラーゼドメインまたはその活性断片;及び
BまたはB及びDは、それぞれ、核酸配列特異的結合活性を有する1つ以上のドメインを含む。
いくつかの実施形態では、融合タンパク質は、以下の構造を含む:
NH2-[An-Bo-Cn]-COOH;
NH2-[An-Bo-Cn-Do]-COOH;または
NH2-[An-Bo-Cp-Do-Eq]-COOH;
式中、A及びCまたはA、C、及びEは、それぞれ、以下の1つ以上を含む。
アデノシンデアミナーゼドメインまたはその活性断片、
シチジンデアミナーゼドメインまたはその活性断片、
DNAグリコシラーゼドメインまたはその活性断片;及び
nは、整数:1、2、3、4、または5であり、pは、整数:0、1、2、3、4、または5であり; qは、整数0、1、2、3、4、または5であり; BまたはB及びDは、それぞれ、核酸配列特異的結合活性を有するドメインを含み; oは、整数:1、2、3、4、または5である。
例えば、限定されないが、いくつかの実施形態では、融合タンパク質は、以下の構造を含む:
NH2-[アデノシンデアミナーゼ]-[Cas9ドメイン]-COOH;
NH2-[Cas9ドメイン]-[アデノシンデアミナーゼ]-COOH;
NH2-[シチジンデアミナーゼ]-[Cas9ドメイン]-COOH;
NH2-[Cas9ドメイン]-[シチジンデアミナーゼ]-COOH;
NH2-[シチジンデアミナーゼ]-[Cas9ドメイン]-[アデノシンデアミナーゼ]-COOH;
NH2-[アデノシンデアミナーゼ]-[Cas9ドメイン]-[シチジンデアミナーゼ]-COOH;
NH2-[アデノシンデアミナーゼ]-[シチジンデアミナーゼ]-[Cas9ドメイン]-COOH;
NH2-[シチジンデアミナーゼ]-[アデノシンデアミナーゼ]-[Cas9ドメイン]-COOH;
NH2-[Cas9ドメイン]-[アデノシンデアミナーゼ]-[シチジンデアミナーゼ]-COOH;または
NH2-[Cas9ドメイン]-[シチジンデアミナーゼ]-[アデノシンデアミナーゼ]-COOH。
いくつかの実施形態では、本明細書中で提供するCas12ドメインまたはCas12タンパク質のいずれかを、本明細書中で提供するシチジンデアミナーゼまたはアデノシンデアミナーゼのいずれかと融合させてもよい。例えば、限定されないが、いくつかの実施形態では、融合タンパク質は、以下の構造を含む:
NH2-[アデノシンデアミナーゼ]-[Cas12ドメイン]-COOH;
NH2-[Cas12ドメイン]-[アデノシンデアミナーゼ]-COOH;
NH2-[シチジンデアミナーゼ]-[Cas12ドメイン]-COOH;
NH2-[Cas12ドメイン]-[シチジンデアミナーゼ]-COOH;
NH2-[シチジンデアミナーゼ]-[Cas12ドメイン]-[アデノシンデアミナーゼ]-COOH;
NH2-[アデノシンデアミナーゼ]-[Cas12ドメイン]-[シチジンデアミナーゼ]-COOH;
NH2-[アデノシンデアミナーゼ]-[シチジンデアミナーゼ]-[Cas12ドメイン]-COOH;
NH2-[シチジンデアミナーゼ]-[アデノシンデアミナーゼ]-[Cas12ドメイン]-COOH;
NH2-[Cas12ドメイン]-[アデノシンデアミナーゼ]-[シチジンデアミナーゼ]-COOH;または
NH2-[Cas12ドメイン]-[シチジンデアミナーゼ]-[アデノシンデアミナーゼ]-COOH。
いくつかの実施形態では、融合タンパク質のアデノシンデアミナーゼは、TadA*8及びシチジンデアミナーゼを含む。いくつかの実施形態では、TadA*8は、TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23、またはTadA*8.24である。いくつかの実施形態では、融合タンパク質のアデノシンデアミナーゼは、TadA*9及びシチジンデアミナーゼを含む。
例示的な融合タンパク質構造には、以下が含まれる:
NH2-[TadA*8]-[Cas9ドメイン]-COOH;
NH2-[Cas9ドメイン]-[TadA*8]-COOH;
NH2-[TadA*8]-[Cas12ドメイン]-COOH;
NH2-[Cas12ドメイン]-[TadA*8]-COOH;
NH2-[TadA*9]-[Cas9ドメイン]-COOH;
NH2-[Cas9ドメイン]-[TadA*9]-COOH;
NH2-[TadA*9]-[Cas12ドメイン]-COOH;
NH2-[Cas12ドメイン]-[TadA*9]-COOH;
NH2-[アデノシンデアミナーゼ]-[Cas9/12]-[シチジンデアミナーゼ]-COOH;
NH2-[シチジンデアミナーゼ]-[Cas9/12]-[アデノシンデアミナーゼ]-COOH;
NH2-[TadA*8]-[Cas9/12]-[シチジンデアミナーゼ]-COOH;
NH2-[シチジンデアミナーゼ]-[Cas9/12]-[TadA*8]-COOH;
NH2-[TadA*9]-[Cas9/12]-[シチジンデアミナーゼ]-COOH;または
NH2-[シチジンデアミナーゼ]-[Cas9/12]-[TadA*9]-COOH。
いくつかの実施形態では、シチジンデアミナーゼ、脱塩基エディター、及び/またはアデノシンデアミナーゼならびにnapDNAbp(例えば、Cas9ドメイン)を含む融合タンパク質は、リンカー配列を含まない。いくつかの実施形態では、シチジンデアミナーゼドメイン及びアデノシンデアミナーゼドメインとnapDNAbpとの間にリンカーが存在する。いくつかの実施形態では、上記の一般的なアーキテクチャで使用される「-」は、任意選択のリンカーの存在を示す。いくつかの実施形態では、シチジンデアミナーゼ及びアデノシンデアミナーゼならびにnapDNAbpを、本明細書中で提供するリンカーのいずれかを介して融合させる。例えば、いくつかの実施形態では、シチジンデアミナーゼ及びアデノシンデアミナーゼならびにnapDNAbpを、本明細書中で提供するリンカーのいずれかを介して融合させる。
本開示の融合タンパク質は、1つ以上の追加の特性を含み得ることが理解されるべきである。例えば、いくつかの実施形態では、融合タンパク質は、阻害剤、細胞質局在化配列、核外輸送配列などの輸出配列、または他の局在化配列、ならびに融合タンパク質の可溶化、精製、または検出に有用な配列タグを含み得る。本明細書中で提供する適切なタンパク質タグとして、ビオチンカルボキシラーゼキャリアタンパク質(BCCP)タグ、mycタグ、カルモジュリンタグ、FLAGタグ、ヘマグルチニン(HA)タグ、ヒスチジンタグまたはHisタグとも呼ばれるポリヒスチジンタグ、マルトース結合タンパク質(MBP)タグ、nusタグ、グルタチオン-S-トランスフェラーゼ(GST)タグ、緑色蛍光タンパク質(GFP)タグ、チオレドキシンタグ、Sタグ、Softag(例えば、Softag1、Softag3)、strepタグ、ビオチンリガーゼタグ、FlAsHタグ、V5タグ、及びSBPタグが挙げられるが、これらに限定されない。追加の適切な配列は当業者には明らかであろう。いくつかの実施形態では、融合タンパク質は、1つ以上のHisタグを含む。
例示的であるが非限定的な融合タンパク質は、国際PCT出願第PCT/2017/044935、PCT/US2019/044935及びPCT/US2020/016288に記載されており、これらのそれぞれは、その全体が参照により本明細書に援用される。
核局在化配列(NLS)を含む融合タンパク質
いくつかの実施形態では、本明細書中で提供する融合タンパク質は、1つ以上(例えば、2、3、4、5)の核標的化配列、例えば、核局在化配列(NLS)をさらに含む。一実施形態では、バイパータイトNLSを使用する。いくつかの実施形態では、NLSは、NLSを含むタンパク質の細胞核への(例えば、核輸送による)輸入を促進するアミノ酸配列を含む。いくつかの実施形態では、本明細書中で提供する融合タンパク質のいずれかは、核局在化配列(NLS)をさらに含む。いくつかの実施形態では、NLSを、融合タンパク質のN末端に融合させる。いくつかの実施形態では、NLSを、融合タンパク質のC末端に融合させる。いくつかの実施形態では、NLSを、Cas9ドメインのN末端に融合させる。いくつかの実施形態では、NLSを、nCas9ドメインまたはdCas9ドメインのC末端に融合させる。いくつかの実施形態では、NLSを、デアミナーゼのN末端に融合させる。いくつかの実施形態では、NLSを、デアミナーゼのC末端に融合させる。いくつかの実施形態では、NLSを、1つ以上のリンカーを介して融合タンパク質に融合させる。いくつかの実施形態では、NLSを、リンカーを用いずに融合タンパク質に融合させる。いくつかの実施形態では、NLSは、本明細書中で提供するか、または参照するNLS配列のいずれか1つのアミノ酸配列を含む。追加の核局在化配列は当技術分野で公知であり、当業者には明らかであろう。例えば、NLS配列はPlank et al., PCT/EP2000/011690に記載されており、その内容は、例示的な核局在化配列を開示するために参照により本明細書に援用される。いくつかの実施形態では、NLSは、アミノ酸配列PKKKRKVEGADKRTADGSEFESPKKKRKV、KRTADGSEFESPKKKRKV、KRPAATKKAGQAKKKK、KKTELQTTNAENKTKKL、KRGINDRNFWRGENGRKTR、RKSGKIAAIVVKRPRKPKKKRKV、またはMDSLLMNRRKFLYQFKNVRWAKGRRETYLCを含む。
いくつかの実施形態では、シチジンまたはアデノシンデアミナーゼ、Cas9ドメイン、及びNLSを含む融合タンパク質は、リンカー配列を含まない。いくつかの実施形態では、1つ以上のドメインまたはタンパク質(例えば、シチジンデアミナーゼまたはアデノシンデアミナーゼ、Cas9ドメインまたはNLS)間に、リンカー配列が存在する。いくつかの実施形態では、リンカーは、シチジンデアミナーゼドメイン及びアデノシンデアミナーゼドメインとnapDNAbpとの間に存在する。いくつかの実施形態では、以下の一般的なアーキテクチャで使用される「-」は、任意選択のリンカーの存在を示す。いくつかの実施形態では、シチジンデアミナーゼ及びアデノシンデアミナーゼならびにnapDNAbpを、本明細書中で提供するリンカーのいずれかを介して融合させる。例えば、いくつかの実施形態では、シチジンデアミナーゼ及びアデノシンデアミナーゼならびにnapDNAbpを、本明細書中で提供するリンカーのいずれかを介して融合させる。
いくつかの実施形態では、シチジンデアミナーゼまたはアデノシンデアミナーゼならびにnapDNAbp(例えば、Cas9またはCas12)ドメインを有する例示的なnapDNAbp(例えば、Cas9またはCas12)融合タンパク質の一般的なアーキテクチャは、以下の構造のいずれか1つを含み、式中、NLSは核局在化配列(例えば、本明細書中で提供する任意のNLS)であり、NH2は融合タンパク質のN末端であり、COOHは融合タンパク質のC末端である:
NH2-NLS-[シチジンデアミナーゼ]-[napDNAbpドメイン]-COOH;
NH2-NLS[napDNAbpドメイン]-[シチジンデアミナーゼ]-COOH;
NH2-[シチジンデアミナーゼ]-[napDNAbpドメイン]-NLS-COOH;
NH2-[napDNAbpドメイン]-[シチジンデアミナーゼ]-NLS-COOH;
NH2-NLS-[アデノシンデアミナーゼ]-[napDNAbpドメイン]-COOH;
NH2-NLS[napDNAbpドメイン]-[アデノシンデアミナーゼ]-COOH;
NH2-[アデノシンデアミナーゼ]-[napDNAbpドメイン]-NLS-COOH;
NH2-[napDNAbpドメイン]-[アデノシンデアミナーゼ]-NLS-COOH;
NH2-NLS-[シチジンデアミナーゼ]-[napDNAbpドメイン]-[アデノシンデアミナーゼ]-COOH;
NH2-NLS-[アデノシンデアミナーゼ]-[napDNAbpドメイン]-[シチジンデアミナーゼ]-COOH;
NH2-NLS-[アデノシンデアミナーゼ][シチジンデアミナーゼ]-[napDNAbpドメイン]-COOH;
NH2-NLS-[シチジンデアミナーゼ]-[アデノシンデアミナーゼ]-[napDNAbpドメイン]-COOH;
NH2-NLS-[napDNAbpドメイン]-[アデノシンデアミナーゼ]-[シチジンデアミナーゼ]-COOH;
NH2-NLS-[napDNAbpドメイン]-[シチジンデアミナーゼ]-[アデノシンデアミナーゼ]-COOH;
NH2-[シチジンデアミナーゼ]-[napDNAbpドメイン]-[アデノシンデアミナーゼ]-NLS-COOH;
NH2-[アデノシンデアミナーゼ]-[napDNAbpドメイン]-[シチジンデアミナーゼ]-NLS-COOH;
NH2-[アデノシンデアミナーゼ][シチジンデアミナーゼ]-[napDNAbpドメイン]-NLS-COOH;
NH2-[シチジンデアミナーゼ]-[アデノシンデアミナーゼ]-[napDNAbpドメイン]-NLS-COOH;
NH2-[napDNAbpドメイン]-[アデノシンデアミナーゼ]-[シチジンデアミナーゼ]-NLS-COOH;または
NH2-[napDNAbpドメイン]-[シチジンデアミナーゼ]-[アデノシンデアミナーゼ]-NLS-COOH。
いくつかの実施形態では、NLSはリンカー内に存在するか、またはNLSは、リンカー、例えば本明細書に記載のリンカーに隣接している。いくつかの実施形態では、N末端またはC末端NLSは、バイパータイトNLSである。バイパータイトNLSは、比較的短いスペーサー配列によって分離された2つの塩基性アミノ酸クラスターを含む(したがって、バイパータイトすなわち2部分であるが、モノパータイトNLSはそうではない)。ヌクレオプラスミンのNLSであるKR[PAATKKAGQA]KKKKは、ユビキタスなバイパータイトシグナルのプロトタイプであり; 塩基性アミノ酸の2つのクラスターが、約10アミノ酸のスペーサーで分離されている。例示的なバイパータイトNLSの配列は以下の通りである:
PKKKRKVEGADKRTADGSEFESPKKKRKV。
1つ以上の核局在化配列(NLS)を含むCRISPR酵素をコードするベクターを使用することができる。例えば、1、2、3、4、5、6、7、8、9、10個または約1、2、3、4、5、6、7、8、9、10個のNLSを使用することができる。CRISPR酵素は、アミノ末端またはその近位にNLSを、カルボキシ末端またはその近位に約1、2、3、4、5、6、7、8、9、10個またはそれを上回るNLSを、またはこれらの任意の組み合わせで(例えば、アミノ末端に1つ以上のNLS及びカルボキシ末端に1つ以上のNLSを)含み得る。複数のNLSが存在する場合、それぞれを他のNLSとは独立して選択できるため、単一のNLSが複数のコピーで、及び/または1つ以上のコピーに存在する1つ以上の他のNLSと組み合わせて存在し得る。
この方法で使用するCRISPR酵素は、約6個のNLSを含むことができる。NLSに最も近位のアミノ酸がN末端またはC末端からポリペプチド鎖に沿って約50アミノ酸以内、例えば、1、2、3、4、5、10、15、20、25、30、40、または50アミノ酸以内にある場合、NLSは、N末端またはC末端の近位にあると見なされる。
内部挿入を伴う融合タンパク質
本明細書において、核酸プログラム可能な核酸結合タンパク質、例えば、napDNAbpに融合させた異種ポリペプチドを含む融合タンパク質を提供する。異種ポリペプチドは、天然型すなわち野生型のnapDNAbpポリペプチド配列には見出されないポリペプチドであり得る。異種ポリペプチドは、napDNAbpのC末端、napDNAbpのN末端でnapDNAbpに融合するか、またはnapDNAbpの内部位置に挿入することができる。いくつかの実施形態では、異種ポリペプチドを、napDNAbpの内部位置に挿入する。
いくつかの実施形態では、異種ポリペプチドは、デアミナーゼまたはその機能的断片である。例えば、融合タンパク質は、Cas9またはCas12(例えば、Cas12b/C2c1)ポリペプチドのN末端断片及びC末端断片に隣接するデアミナーゼを含み得る。融合タンパク質内のデアミナーゼは、アデノシンデアミナーゼであり得る。いくつかの実施形態では、アデノシンデアミナーゼは、TadA(例えば、TadA*7.10、TadA*8またはTadA*9)である。いくつかの実施形態では、TadAは、TadA*8である。本明細書に記載のTadA配列(例えば、TadA7.10、TadA*8またはTadA*9)は、上記の融合タンパク質に適したデアミナーゼである。
デアミナーゼは、循環置換体デアミナーゼであり得る。例えば、デアミナーゼは、循環置換体アデノシンデアミナーゼであり得る。いくつかの実施形態では、デアミナーゼは、TadA参照配列において付番されたアミノ酸残基116で循環的に置換された循環置換体TadAである。いくつかの実施形態では、デアミナーゼは、TadA参照配列において付番されたアミノ酸残基136で循環的に置換された循環置換体TadAである。いくつかの実施形態では、デアミナーゼは、TadA参照配列において付番されたアミノ酸残基65で循環的に置換された循環置換体TadAである。
融合タンパク質は、複数のデアミナーゼを含み得る。融合タンパク質は、例えば、1、2、3、4、5またはそれ以上のデアミナーゼを含み得る。いくつかの実施形態では、融合タンパク質は、1つのデアミナーゼを含む。いくつかの実施形態では、融合タンパク質は、2つのデアミナーゼを含む。融合タンパク質の2つ以上のデアミナーゼは、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはそれらの組み合わせであり得る。2つ以上のデアミナーゼは、ホモ二量体であり得る。2つ以上のデアミナーゼは、ヘテロ二量体であり得る。2つ以上のデアミナーゼは、napDNAbpにタンデムに挿入することができる。いくつかの実施形態では、2つ以上のデアミナーゼは、napDNAbpにタンデムに存在していなくてもよい。
いくつかの実施形態では、融合タンパク質内のnapDNAbpは、Cas9ポリペプチドまたはその断片である。Cas9ポリペプチドは、バリアントCas9ポリペプチドであり得る。いくつかの実施形態では、Cas9ポリペプチドは、Cas9ニッカーゼ(nCas9)ポリペプチドまたはその断片である。いくつかの実施形態では、Cas9ポリペプチドは、ヌクレアーゼ不活性Cas9(dCas9)ポリペプチドまたはその断片である。融合タンパク質内のCas9ポリペプチドは、全長のCas9ポリペプチドであり得る。いくつかの場合では、融合タンパク質内のCas9ポリペプチドは、全長のCas9ポリペプチドでなくてもよい。Cas9ポリペプチドは、例えば、天然のCas9タンパク質と比較して、N末端またはC末端で短縮され得る。Cas9ポリペプチドは、循環置換体Cas9タンパク質であり得る。Cas9ポリペプチドは、Cas9ポリペプチドの断片、一部、またはドメインであり得るが、それは依然として標的ポリヌクレオチド及びガイド核酸配列に結合することができる。
いくつかの実施形態では、Cas9ポリペプチドは、Streptococcus pyogenes Cas9 (SpCas9)、Staphylococcus aureus Cas9 (SaCas9)、Streptococcus thermophilus 1 Cas9 (St1Cas9)、またはその断片もしくはバリアントである。
融合タンパク質のCas9ポリペプチドは、天然のCas9ポリペプチドに対して、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含み得る。
融合タンパク質のCas9ポリペプチドは、以下に記載するCas9アミノ酸配列(以下で「Cas9参照配列」と呼ばれる)に対して、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含み得る。
Figure 2022546608000065
Cas9ポリペプチドのN末端及びC末端断片に隣接する異種触媒ドメインを含む融合タンパク質もまた、本明細書に記載の方法における塩基編集に有用である。Cas9と1つ以上のデアミナーゼドメイン、例えば、アデノシンデアミナーゼを含むか、またはCas9配列に隣接するアデノシンデアミナーゼドメインを含む融合タンパク質もまた、標的配列の高度に特異的かつ効率的な塩基編集に有用である。一実施形態では、キメラCas9融合タンパク質は、Cas9ポリペプチド内に挿入された異種触媒ドメイン(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を含む。いくつかの実施形態では、融合タンパク質は、Cas9内に挿入されたアデノシンデアミナーゼドメイン及びシチジンデアミナーゼドメインを含む。いくつかの実施形態では、アデノシンデアミナーゼを、Cas9内で融合させ、シチジンデアミナーゼを、C末端に融合させる。いくつかの実施形態では、アデノシンデアミナーゼを、Cas9内で融合させ、シチジンデアミナーゼを、N末端に融合させる。いくつかの実施形態では、シチジンデアミナーゼを、Cas9内で融合させ、アデノシンデアミナーゼを、C末端に融合させる。いくつかの実施形態では、シチジンデアミナーゼを、Cas9内で融合させ、アデノシンデアミナーゼを、N末端に融合させる。
アデノシンデアミナーゼ及びシチジンデアミナーゼ及びCas9の融合タンパク質の例示的な構造を以下に示す:
NH2-[Cas9(アデノシンデアミナーゼ)]-[シチジンデアミナーゼ]-COOH;
NH2-[シチジンデアミナーゼ]-[Cas9(アデノシンデアミナーゼ)]-COOH;
NH2-[Cas9(シチジンデアミナーゼ)]-[アデノシンデアミナーゼ]-COOH; または
NH2-[アデノシンデアミナーゼ]-[Cas9(シチジンデアミナーゼ)]-COOH。
いくつかの実施形態では、上記の一般的なアーキテクチャで使用される「-」は、任意選択のリンカーの存在を示す。
様々な実施形態において、触媒ドメインは、アデノシンデアミナーゼ活性などのDNA修飾活性(例えば、デアミナーゼ活性)を有する。いくつかの実施形態では、アデノシンデアミナーゼは、TadA(例えば、TadA*7.10)である。いくつかの実施形態では、TadAはTadA*8またはTadA*9である。いくつかの実施形態では、TadA*8またはTadA*9をCas9内で融合させ、シチジンデアミナーゼをC末端に融合させる。いくつかの実施形態では、TadA*8またはTadA*9をCas9内で融合させ、シチジンデアミナーゼをN末端に融合させる。いくつかの実施形態では、シチジンデアミナーゼをCas9内で融合させ、TadA*8またはTadA*9をC末端に融合させる。いくつかの実施形態では、シチジンデアミナーゼをCas9内で融合させ、TadA*8またはTadA*9をN末端に融合させる。TadA*8またはTadA*9及びシチジンデアミナーゼ及びCas9の融合タンパク質の例示的な構造を以下に示す:
NH2-[Cas9(TadA*8またはTadA*9)]-[シチジンデアミナーゼ]-COOH;
NH2-[シチジンデアミナーゼ]-[Cas9(TadA*8またはTadA*9)]-COOH;
NH2-[Cas9(シチジンデアミナーゼ)]-[TadA*8またはTadA*9]-COOH;または
NH2-[TadA*8またはTadA*9]-[Cas9(シチジンデアミナーゼ)]-COOH。
いくつかの実施形態では、上記の一般的なアーキテクチャで使用される「-」は、任意選択のリンカーの存在を示す。
異種ポリペプチド(例えば、デアミナーゼ)を、適切な位置で、napDNAbp(例えば、Cas9またはCas12(例えば、Cas12b/C2c1))に挿入することができ、それにより、napDNAbpは、標的ポリヌクレオチド及びガイド核酸に結合する能力を保持する。デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、デアミナーゼの機能(例えば、塩基編集活性)またはnapDNAbp(例えば、標的核酸及びガイド核酸に結合する能力)を損なうことなく、napDNAbpに挿入することができる。デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)は、例えば、結晶学的研究に示されるように、非秩序的領域または高温因子またはB因子を含む領域でnapDNAbpに挿入することができる。あまり秩序化されていない、非秩序的、または不定形のタンパク質の領域、例えば、溶媒に曝された領域及びループを、構造または機能を損なうことなく挿入に使用することができる。デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)は、柔軟なループ領域または溶媒に曝された領域においてnapDNAbpに挿入することができる。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、Cas9またはCas12b/C2c1ポリペプチドの柔軟なループに挿入する。
いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)の挿入位置を、Cas9ポリペプチドの結晶構造のB因子分析によって決定する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、平均よりも高いB因子(例えば、全タンパク質または非秩序的領域を含むタンパク質ドメインと比較して、より高いB因子)を有するCas9ポリペプチドの領域に挿入する。B因子または温度因子は、原子のそれらの平均位置からの変動を示すことができる(例えば、温度依存性の原子振動または結晶格子の静的無秩序性の結果として)。バックボーン原子の高いB因子(例えば、平均よりも高いB因子)は、比較的高い局所移動度を有する領域を示し得る。そのような領域は、構造や機能を損なうことなくデアミナーゼを挿入するために使用することができる。デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、全タンパク質についての平均B因子よりも、50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、または200%超高いB因子のCα原子を有する残基の位置に、挿入することができる。デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、該残基を含むCas9タンパク質ドメインについての平均B因子よりも、50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、または200%超高いB因子のCα原子を有する残基の位置に、挿入することができる。平均よりも高いB因子を有するCas9ポリペプチドの位置として、例えば、上記のCas9参照配列における付番で、残基768、792、1052、1015、1022、1026、1029、1067、1040、1054、1068、1246、1247、及び1248が挙げられ得る。平均よりも高いB因子を有するCas9ポリペプチド領域として、例えば、上記のCas9参照配列における付番で、残基792~872、792~906、及び2~791が挙げられ得る。
異種ポリペプチド(例えば、デアミナーゼ)は、上記のCas9参照配列における付番で768、791、792、1015、1016、1022、1023、1026、1029、1040、1052、1054、1067、1068、1069、1246、1247、及び1248からなる群から選択されるアミノ酸残基、または別のCas9ポリペプチドの対応するアミノ酸残基において、napDNAbpに挿入することができる。いくつかの実施形態では、異種ポリペプチドを、上記のCas9参照配列における付番で、アミノ酸位置768~769、791~792、792~793、1015~1016、1022~1023、1026~1027、1029~1030、1040~1041、1052~1053、1054~1055、1067~1068、1068~1069、1247~1248、もしくは1248~1249、またはそれに対応するアミノ酸位置の間に挿入する。いくつかの実施形態では、異種ポリペプチドを、上記のCas9参照配列における付番で、アミノ酸位置769~770、792~793、793~794、1016~1017、1023~1024、1027~1028、1030~1031、1041~1042、1053~1054、1055~1056、1068~1069、1069~1070、1248~1249、もしくは1249~1250、またはそれに対応するアミノ酸位置の間に挿入する。いくつかの実施形態では、異種ポリペプチドで、上記のCas9参照配列における付番で768、791、792、1015、1016、1022、1023、1026、1029、1040、1052、1054、1067、1068、1069、1246、1247、及び1248からなる群から選択されるアミノ酸残基、または別のCas9ポリペプチドの対応するアミノ酸残基を置換する。挿入位置に関する上記のCas9参照配列への参照は、例示を目的としていることが理解されるべきである。本明細書中で論じる挿入は、上記のCas9参照配列のCas9ポリペプチド配列に限定されず、バリアントCas9ポリペプチド、例えば、Cas9ニッカーゼ(nCas9)、ヌクレアーゼ不活性Cas9(dCas9)、ヌクレアーゼドメイン欠損型Cas9バリアント、短縮型Cas9、または部分的もしくは完全にHNHドメインを欠損したCas9ドメインの対応する位置での挿入を含む。
異種ポリペプチド(例えば、デアミナーゼ)は、上記のCas9参照配列における付番で768、792、1022、1026、1040、1068、及び1247からなる群から選択されるアミノ酸残基、または別のCas9ポリペプチドの対応するアミノ酸残基において、napDNAbpに挿入することができる。いくつかの実施形態では、異種ポリペプチドを、上記のCas9参照配列における付番で、アミノ酸位置768~769、792~793、1022~1023、1026~1027、1029~1030、1040~1041、1068~1069、もしくは1247~1248、またはそれに対応するアミノ酸位置の間に挿入する。いくつかの実施形態では、異種ポリペプチドを、上記のCas9参照配列における付番で、アミノ酸位置769~770、793~794、1023~1024、1027~1028、1030~1031、1041~1042、1069~1070、もしくは1248~1249、またはそれに対応するアミノ酸位置の間に挿入する。いくつかの実施形態では、異種ポリペプチドで、上記のCas9参照配列における付番で768、792、1022、1026、1040、1068、及び1247からなる群から選択されるアミノ酸残基、または別のCas9ポリペプチドの対応するアミノ酸残基を置換する。
異種ポリペプチド(例えば、デアミナーゼ)は、本明細書に記載のアミノ酸残基、または別のCas9ポリペプチドの対応するアミノ酸残基において、napDNAbpに挿入することができる。一実施形態では、異種ポリペプチド(例えば、デアミナーゼ)は、上記のCas9参照配列における付番で1002、1003、1025、1052~1056、1242~1247、1061~1077、943~947、686~691、569~578、530~539、及び1060~1077からなる群から選択されるアミノ酸残基、または別のCas9ポリペプチドの対応するアミノ酸残基において、napDNAbpに挿入することができる。デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)は、残基のN末端もしくはC末端に挿入されるか、または残基を置き換えることができる。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、残基のC末端に挿入する。
いくつかの実施形態では、アデノシンデアミナーゼ(例えば、TadA)を、上記のCas9参照配列における付番で1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052、及び1246からなる群から選択されるアミノ酸残基、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入する。いくつかの実施形態では、アデノシンデアミナーゼ(例えば、TadA)を、上記のCas9参照配列における付番で、残基792~872、792~906、もしくは2~791、または別のCas9ポリペプチドの対応するアミノ酸残基の代わりに挿入する。いくつかの実施形態では、アデノシンデアミナーゼを、上記のCas9参照配列における付番で1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052、及び1246からなる群から選択されるアミノ酸、または別のCas9ポリペプチドの対応するアミノ酸残基のN末端に挿入する。いくつかの実施形態では、アデノシンデアミナーゼを、上記のCas9参照配列における付番で1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052、及び1246からなる群から選択されるアミノ酸、または別のCas9ポリペプチドの対応するアミノ酸残基のC末端に挿入する。いくつかの実施形態では、アデノシンデアミナーゼを、上記のCas9参照配列における付番で1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052、及び1246からなる群から選択されるアミノ酸、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入して置換する。
いくつかの実施形態では、アデノシンデアミナーゼ(例えば、TadA*9)を、上記のCas9参照配列における付番で1016、1023、1029、1040、1069、及び1247からなる群から選択されるアミノ酸残基、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入する。いくつかの実施形態では、アデノシンデアミナーゼ(例えば、TadA*9)を、上記のCas9参照配列における付番で1016、1023、1029、1040、1069、及び1247からなる群から選択されるアミノ酸、または別のCas9ポリペプチドの対応するアミノ酸残基のN末端に挿入する。いくつかの実施形態では、アデノシンデアミナーゼ(例えば、TadA*9)を、上記のCas9参照配列における付番で1016、1023、1029、1040、1069、及び1247からなる群から選択されるアミノ酸、または別のCas9ポリペプチドの対応するアミノ酸残基のC末端に挿入する。いくつかの実施形態では、アデノシンデアミナーゼ(例えば、TadA*9)を、上記のCas9参照配列における付番で1016、1023、1029、1040、1069、及び1247からなる群から選択されるアミノ酸、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入して置換する。
いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基768、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基768、または別のCas9ポリペプチドの対応するアミノ酸残基のN末端に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基768、または別のCas9ポリペプチドの対応するアミノ酸残基のC末端に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基768、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入して置換する。
いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基791に挿入するか、もしくはアミノ酸残基792に挿入するか、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基791のN末端に挿入するか、もしくはアミノ酸792のN末端に挿入するか、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸791のC末端に挿入するか、もしくはアミノ酸792のN末端に挿入するか、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸791に挿入して置換するか、もしくはアミノ酸792に挿入して置換するか、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入して置換する。
いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1016、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1016、または別のCas9ポリペプチドの対応するアミノ酸残基のN末端に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1016、または別のCas9ポリペプチドの対応するアミノ酸残基のC末端に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1016、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入して置換する。
いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1022に挿入するか、もしくはアミノ酸残基1023に挿入するか、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1022のN末端に挿入するか、もしくはアミノ酸残基1023のN末端に挿入するか、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1022のC末端に挿入するか、もしくはアミノ酸残基1023のC末端に挿入するか、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1022に挿入して置換するか、もしくはアミノ酸残基1023に挿入して置換するか、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入して置換する。
いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1026に挿入するか、もしくはアミノ酸残基1029に挿入するか、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1026のN末端に挿入するか、もしくはアミノ酸残基1029のN末端に挿入するか、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1026のC末端に挿入するか、もしくはアミノ酸残基1029のC末端に挿入するか、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1026に挿入して置換するか、もしくはアミノ酸残基1029に挿入して置換するか、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入して置換する。
いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1040、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1040、または別のCas9ポリペプチドの対応するアミノ酸残基のN末端に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1040、または別のCas9ポリペプチドの対応するアミノ酸残基のC末端に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1040、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入して置換する。
いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1052に挿入するか、もしくはアミノ酸残基1054に挿入するか、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1052のN末端に挿入するか、もしくはアミノ酸残基1054のN末端に挿入するか、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1052のC末端に挿入するか、もしくはアミノ酸残基1054のC末端に挿入するか、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1052に挿入して置換するか、もしくはアミノ酸残基1054に挿入して置換するか、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入して置換する。
いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1067に挿入するか、もしくはアミノ酸残基1068に挿入するか、もしくはアミノ酸残基1069に挿入するか、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1067のN末端に挿入するか、もしくはアミノ酸残基1068のN末端に挿入するか、もしくはアミノ酸残基1069のN末端に挿入するか、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1067のC末端に挿入するか、もしくはアミノ酸残基1068のC末端に挿入するか、もしくはアミノ酸残基1069のC末端に挿入するか、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1067に挿入して置換するか、もしくはアミノ酸残基1068に挿入して置換するか、もしくはアミノ酸残基1069に挿入して置換するか、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入して置換する。
いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1246に挿入するか、もしくはアミノ酸残基1247に挿入するか、もしくはアミノ酸残基1248に挿入するか、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1246のN末端に挿入するか、もしくはアミノ酸残基1247のN末端に挿入するか、もしくはアミノ酸残基1248のN末端に挿入するか、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1246のC末端に挿入するか、もしくはアミノ酸残基1247のC末端に挿入するか、もしくはアミノ酸残基1248のC末端に挿入するか、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入する。いくつかの実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を、上記のCas9参照配列における付番で、アミノ酸残基1246に挿入して置換するか、もしくはアミノ酸残基1247に挿入して置換するか、もしくはアミノ酸残基1248に挿入して置換するか、または別のCas9ポリペプチドの対応するアミノ酸残基に挿入して置換する。
いくつかの実施形態では、異種ポリペプチド(例えば、デアミナーゼ)を、Cas9ポリペプチドの柔軟なループに挿入する。柔軟なループ部分は、上記のCas9参照配列における付番で、530~537、569~570、686~691、943~947、1002~1025、1052~1077、1232~1247、もしくは1298~1300、または別のCas9ポリペプチドの対応するアミノ酸残基からなる群から選択することができる。柔軟なループ部分は、上記のCas9参照配列における付番で、1~529、538~568、580~685、692~942、948~1001、1026~1051、1078~1231、もしくは1248~1297、または別のCas9ポリペプチドの対応するアミノ酸残基からなる群から選択することができる。
異種ポリペプチド(例えば、アデニンデアミナーゼ)は、上記のCas9参照配列における付番で、アミノ酸残基:1017~1069、1242~1247、1052~1056、1060~1077、1002~1003、943~947、530~537、568~579、686~691、1242~1247、1298~1300、1066~1077、1052~1056、もしくは1060~1077、または別のCas9ポリペプチドの対応するアミノ酸残基に対応するCas9ポリペプチド領域に挿入することができる。
異種ポリペプチド(例えば、アデニンデアミナーゼ)は、Cas9ポリペプチドの欠失領域の代わりに挿入することができる。欠失領域は、Cas9ポリペプチドのN末端またはC末端部分に対応し得る。いくつかの実施形態では、欠失領域は、上記のCas9参照配列における付番で、残基792~872、または別のCas9ポリペプチドの対応するアミノ酸残基に対応する。いくつかの実施形態では、欠失領域は、上記のCas9参照配列における付番で、残基792~906、または別のCas9ポリペプチドの対応するアミノ酸残基に対応する。いくつかの実施形態では、欠失領域は、上記のCas9参照配列における付番で、残基2~791、または別のCas9ポリペプチドの対応するアミノ酸残基に対応する。いくつかの実施形態では、欠失領域は、上記のCas9参照配列における付番で、残基1017~1069、またはそれに対応するアミノ酸残基に対応する。
例示的な内部融合塩基エディターを、以下の表6に示す:
Figure 2022546608000066
異種ポリペプチド(例えば、デアミナーゼ)は、Cas9ポリペプチドの構造的または機能的ドメイン内に挿入することができる。異種ポリペプチド(例えば、デアミナーゼ)は、Cas9ポリペプチドの2つの構造的または機能的ドメインの間に挿入することができる。異種ポリペプチド(例えば、デアミナーゼ)は、例えば、Cas9ポリペプチドからそのドメインを欠失させた後、Cas9ポリペプチドの構造的または機能的ドメインの代わりに挿入することができる。Cas9ポリペプチドの構造的または機能的ドメインは、例えば、RuvC I、RuvC II、RuvC III、Rec1、Rec2、PI、またはHNHを含み得る。
いくつかの実施形態では、Cas9ポリペプチドは、RuvC I、RuvC II、RuvC III、Rec1、Rec2、PI、またはHNHドメインからなる群から選択される1つ以上のドメインを欠失している。いくつかの実施形態では、Cas9ポリペプチドは、ヌクレアーゼドメインを欠失している。いくつかの実施形態では、Cas9ポリペプチドは、HNHドメインを欠失している。いくつかの実施形態では、Cas9ポリペプチドは、HNHドメインの一部を欠失しており、それにより、Cas9ポリペプチドは、HNH活性が低下または無効化している。いくつかの実施形態では、Cas9ポリペプチドは、ヌクレアーゼドメインの欠失を含み、ヌクレアーゼドメインを置換するためにデアミナーゼが挿入されている。いくつかの実施形態では、HNHドメインを欠失させ、その場所にデアミナーゼを挿入する。いくつかの実施形態では、1つ以上のRuvCドメインを欠失させ、その場所にデアミナーゼを挿入する。
異種ポリペプチドを含む融合タンパク質を、napDNAbpのN末端及びC末端断片に隣接させることができる。いくつかの実施形態では、融合タンパク質は、Cas9ポリペプチドのN末端断片及びC末端断片に隣接するデアミナーゼを含む。N末端断片またはC末端断片は、標的ポリヌクレオチド配列に結合することができる。N末端断片のC末端またはC末端断片のN末端は、Cas9ポリペプチドの柔軟なループの一部を含み得る。N末端断片のC末端またはC末端断片のN末端は、Cas9ポリペプチドのαヘリックス構造の一部を含み得る。N末端断片またはC末端断片は、DNA結合ドメインを含み得る。N末端断片またはC末端断片は、RuvCドメインを含み得る。N末端断片またはC末端断片は、HNHドメインを含み得る。いくつかの実施形態では、N末端断片及びC末端断片のいずれも、HNHドメインを含まない。
いくつかの実施形態では、N末端Cas9断片のC末端は、融合タンパク質が標的核酸塩基を脱アミノ化する際に標的核酸塩基に近接しているアミノ酸を含む。いくつかの実施形態では、C末端Cas9断片のN末端は、融合タンパク質が標的核酸塩基を脱アミノ化する際に標的核酸塩基に近接しているアミノ酸を含む。標的核酸塩基と、N末端Cas9断片のC末端またはC末端Cas9断片のN末端のアミノ酸との間の近接性を得るために、異なるデアミナーゼの挿入位置は、異なり得る。例えば、アデノシンデアミナーゼの挿入位置は、上記のCas9参照配列における付番で:1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052、及び1246からなる群から選択されるアミノ酸残基、または別のCas9ポリペプチドの対応するアミノ酸残基であり得る。
融合タンパク質のN末端Cas9断片(すなわち、融合タンパク質のデアミナーゼに隣接するN末端Cas9断片)は、Cas9ポリペプチドのN末端を含み得る。融合タンパク質のN末端Cas9断片は、少なくとも約100、200、300、400、500、600、700、800、900、1000、1100、1200、または1300アミノ酸の長さを含み得る。融合タンパク質のN末端Cas9断片は、上記のCas9参照配列における付番で、アミノ酸残基:1~56、1~95、1~200、1~300、1~400、1~500、1~600、1~700、1~718、1~765、1~780、1~906、1~918、もしくは1~1100、または別のCas9ポリペプチドの対応するアミノ酸残基に対応する配列を含み得る。N末端Cas9断片は、上記のCas9参照配列における付番で、アミノ酸残基:1~56、1~95、1~200、1~300、1~400、1~500、1~600、1~700、1~718、1~765、1~780、1~906、1~918、もしくは1~1100、または別のCas9ポリペプチドの対応するアミノ酸残基に対して、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の配列同一性を有する配列を含み得る。
融合タンパク質のC末端Cas9断片(すなわち、融合タンパク質のデアミナーゼに隣接するC末端Cas9断片)は、Cas9ポリペプチドのC末端を含み得る。融合タンパク質のC末端Cas9断片は、少なくとも約100、200、300、400、500、600、700、800、900、1000、1100、1200、または1300アミノ酸の長さを含み得る。融合タンパク質のC末端Cas9断片は、上記のCas9参照配列における付番で、アミノ酸残基:1099~1368、918~1368、906~1368、780~1368、765~1368、718~1368、94~1368、もしくは56~1368、または別のCas9ポリペプチドの対応するアミノ酸残基に対応する配列を含み得る。N末端Cas9断片は、上記のCas9参照配列における付番で、アミノ酸残基:1099~1368、918~1368、906~1368、780~1368、765~1368、718~1368、94~1368、もしくは56~1368、または別のCas9ポリペプチドの対応するアミノ酸残基に対して、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の配列同一性を有する配列を含み得る。
融合タンパク質のN末端Cas9断片及びC末端Cas9断片は一緒になっても、例えば、上記のCas9参照配列に記載されているように、全長の天然Cas9ポリペプチド配列には対応しない場合がある。
本明細書に記載の融合タンパク質は、ゲノム全体のスプリアス(目的外)脱アミノ化の減少などの、非標的部位(例えば、オフターゲット部位)での脱アミノ化の減少を伴う標的化脱アミノ化をもたらすことができる。本明細書に記載の融合タンパク質は、非標的部位でのバイスタンダー脱アミノ化を低減して、標的化脱アミノ化をもたらすことができる。望ましくない脱アミノ化またはオフターゲット脱アミノ化を、例えば、Cas9ポリペプチドのN末端またはC末端に融合したデアミナーゼを含む末端融合タンパク質に比べて、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%、または少なくとも99%減少させることができる。望ましくない脱アミノ化またはオフターゲット脱アミノ化を、例えば、Cas9ポリペプチドのN末端またはC末端に融合したデアミナーゼを含む末端融合タンパク質に比べて、少なくとも1倍、少なくとも2倍、少なくとも3倍、少なくとも4倍、少なくとも5倍、少なくとも10倍、少なくとも15倍、少なくとも20倍、少なくとも30倍、少なくとも40倍、少なくとも50倍、少なくとも60倍、少なくとも70倍、少なくとも80倍、少なくとも90倍、または少なくとも100倍減少させることができる。
いくつかの実施形態では、融合タンパク質のデアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)は、Rループの範囲内で2つ以下の核酸塩基を脱アミノ化する。いくつかの実施形態では、融合タンパク質のデアミナーゼは、Rループの範囲内で3つ以下の核酸塩基を脱アミノ化する。いくつかの実施形態では、融合タンパク質のデアミナーゼは、Rループの範囲内で2、3、4、5、6、7、8、9、または10個以下の核酸塩基を脱アミノ化する。Rループは、DNA:RNAハイブリッド、DNA:DNA、またはRNA:RNA相補構造を含み、一本鎖DNAと会合する三本鎖核酸構造である。本明細書中で使用する場合、Rループは、標的ポリヌクレオチドをCRISPR複合体または塩基編集複合体と接触させる場合に形成され得、その場合、ガイドポリヌクレオチドの一部、例えば、ガイドRNAは、標的ポリヌクレオチド、例えば、標的DNAの一部とハイブリダイズし、置き換わる。いくつかの実施形態では、Rループは、スペーサー配列及び標的DNA相補配列のハイブリダイズした領域を含む。Rループ領域は、約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、または50核酸塩基対の長さであり得る。いくつかの実施形態では、Rループ領域は、長さが約20核酸塩基対である。本明細書中で使用する場合、Rループ領域は、ガイドポリヌクレオチドとハイブリダイズする標的DNA鎖に限定されないことが理解されるべきである。例えば、Rループ領域内の標的核酸塩基の編集は、ガイドRNAに対する相補鎖を含むDNA鎖に対する編集であり得るか、またはガイドRNAに相補的な鎖の反対側の鎖であるDNA鎖に対する編集であり得る。いくつかの実施形態では、Rループの領域での編集は、標的DNA配列中のガイドRNAに対する非相補鎖(プロトスペーサー鎖)上の核酸塩基を編集することを含む。
本明細書に記載の融合タンパク質は、標準的な塩基編集とは異なる編集ウィンドウで標的の脱アミノ化をもたらすことができる。いくつかの実施形態では、標的核酸塩基は、標的ポリヌクレオチド配列中のPAM配列の約1~約20塩基上流である。いくつかの実施形態では、標的核酸塩基は、標的ポリヌクレオチド配列中のPAM配列の約2~約12塩基上流である。いくつかの実施形態では、標的核酸塩基は、PAM配列から、約1~9塩基対、約2~10塩基対、約3~11塩基対、約4~12塩基対、約5~13塩基対、約6~14塩基対、約7~15塩基対、約8~16塩基対、約9~17塩基対、約10~18塩基対、約11~19塩基対、約12~20塩基対、約1~7塩基対、約2~8塩基対、約3~9塩基対、約4~10塩基対、約5~11塩基対、約6~12塩基対、約7~13塩基対、約8~14塩基対、約9~15塩基対、約10~16塩基対、約11~17塩基対、約12~18塩基対、約13~19塩基対、約14~20塩基対、約1~5塩基対、約2~6塩基対、約3~7塩基対、約4~8塩基対、約5~9塩基対、約6~10塩基対、約7~11塩基対、約8~12塩基対、約9~13塩基対、約10~14塩基対、約11~15塩基対、約12~16塩基対、約13~17塩基対、約14~18塩基対、約15~19塩基対、約16~20塩基対、約1~3塩基対、約2~4塩基対、約3~5塩基対、約4~6塩基対、約5~7塩基対、約6~8塩基対、約7~9塩基対、約8~10塩基対、約9~11塩基対、約10~12塩基対、約11~13塩基対、約12~14塩基対、約13~15塩基対、約14~16塩基対、約15~17塩基対、約16~18塩基対、約17~19塩基対、約18~20塩基対、離れているか、または上流である。いくつかの実施形態では、標的核酸塩基は、PAM配列から、約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20塩基対、またはそれ以上離れているか、または上流にある。いくつかの実施形態では、標的核酸塩基は、PAM配列から、約1、2、3、4、5、6、7、8、または9塩基対、上流にある。いくつかの実施形態では、標的核酸塩基は、PAM配列から、約2、3、4、または6塩基対、上流にある。
融合タンパク質は、複数の異種ポリペプチドを含み得る。例えば、融合タンパク質は、1つ以上のUGIドメイン及び/または1つ以上の核局在化シグナルをさらに含み得る。2つ以上の異種ドメインをタンデムに挿入することができる。2つ以上の異種ドメインは、NapDNAbp内でタンデムにならないような位置に挿入することができる。
融合タンパク質は、デアミナーゼとnapDNAbpポリペプチドとの間にリンカーを含み得る。リンカーは、ペプチドリンカーまたは非ペプチドリンカーであり得る。例えば、リンカーは、XTEN、(GGGS)n、(GGGGS)n、(G)n、(EAAAK)n、(GGS)n、SGSETPGTSESATPESであり得る。いくつかの実施形態では、融合タンパク質は、N末端Cas9断片とデアミナーゼとの間にリンカーを含む。いくつかの実施形態では、融合タンパク質は、C末端Cas9断片とデアミナーゼとの間にリンカーを含む。いくつかの実施形態では、napDNAbpのN末端及びC末端断片を、リンカーでデアミナーゼに接続する。いくつかの実施形態では、N末端及びC末端断片を、リンカーを用いずにデアミナーゼに結合する。いくつかの実施形態では、融合タンパク質は、N末端Cas9断片とデアミナーゼとの間にリンカーを含むが、C末端Cas9断片とデアミナーゼとの間にリンカーを含まない。いくつかの実施形態では、融合タンパク質は、C末端Cas9断片とデアミナーゼとの間にリンカーを含むが、N末端Cas9断片とデアミナーゼとの間にリンカーを含まない。
いくつかの実施形態では、融合タンパク質内のnapDNAbpは、Cas12ポリペプチド、例えば、Cas12b/C2c1またはその断片である。Cas12ポリペプチドは、バリアントCas12ポリペプチドであり得る。他の実施形態では、Cas12ポリペプチドのN末端またはC末端断片は、核酸プログラム可能なDNA結合ドメインまたはRuvCドメインを含む。他の実施形態では、融合タンパク質は、Cas12ポリペプチドと触媒ドメインとの間にリンカーを含む。他の実施形態では、リンカーのアミノ酸配列は、GGSGGSまたはGSSGSETPGTSESATPESSGである。他の実施形態では、リンカーは、強固なリンカーである。上記の態様の他の実施形態では、リンカーは、GGAGGCTCTGGAGGAAGCまたはGGCTCTTCTGGATCTGAAACACCTGGCACAAGCGAGAGCGCCACCCCTGAGAGCTCTGGCによってコードされる。
Cas12ポリペプチドのN末端及びC末端断片に隣接する異種触媒ドメインを含む融合タンパク質もまた、本明細書に記載の方法における塩基編集に有用である。Cas12と1つ以上のデアミナーゼドメイン、例えば、アデノシンデアミナーゼを含むか、またはCas12配列に隣接するアデノシンデアミナーゼドメインを含む融合タンパク質もまた、標的配列の高度に特異的かつ効率的な塩基編集に有用である。一実施形態では、キメラCas12融合タンパク質は、Cas12ポリペプチド内に挿入された異種触媒ドメイン(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼとシチジンデアミナーゼ)を含む。いくつかの実施形態では、融合タンパク質は、Cas12内に挿入されたアデノシンデアミナーゼドメイン及びシチジンデアミナーゼドメインを含む。いくつかの実施形態では、アデノシンデアミナーゼを、Cas12内で融合させ、シチジンデアミナーゼを、C末端に融合させる。いくつかの実施形態では、アデノシンデアミナーゼを、Cas12内で融合させ、シチジンデアミナーゼを、N末端に融合させる。いくつかの実施形態では、シチジンデアミナーゼを、Cas12内で融合させ、アデノシンデアミナーゼを、C末端に融合させる。いくつかの実施形態では、シチジンデアミナーゼを、Cas12内で融合させ、アデノシンデアミナーゼを、N末端に融合させる。アデノシンデアミナーゼ及びシチジンデアミナーゼ及びCas12の融合タンパク質の例示的な構造を以下に示す:
NH2-[Cas12(アデノシンデアミナーゼ)]-[シチジンデアミナーゼ]-COOH;
NH2-[シチジンデアミナーゼ]-[Cas12(アデノシンデアミナーゼ)]-COOH;
NH2-[Cas12(シチジンデアミナーゼ)]-[アデノシンデアミナーゼ]-COOH;または
NH2-[アデノシンデアミナーゼ]-[Cas12(シチジンデアミナーゼ)]-COOH;
いくつかの実施形態では、上記の一般的なアーキテクチャで使用される「-」は、任意選択のリンカーの存在を示す。
様々な実施形態において、触媒ドメインは、アデノシンデアミナーゼ活性などのDNA修飾活性(例えば、デアミナーゼ活性)を有する。いくつかの実施形態では、アデノシンデアミナーゼは、TadA(例えば、TadA*7.10)である。いくつかの実施形態では、TadAは、TadA*8またはTadA*9である。いくつかの実施形態では、TadA*8またはTadA*9をCas12内で融合させ、シチジンデアミナーゼをC末端に融合させる。いくつかの実施形態では、TadA*8またはTadA*9をCas12内で融合させ、シチジンデアミナーゼをN末端に融合させる。いくつかの実施形態では、シチジンデアミナーゼをCas12内で融合させ、TadA*8またはTadA*9をC末端に融合させる。いくつかの実施形態では、シチジンデアミナーゼをCas12内で融合させ、TadA*8またはTadA*9をN末端に融合させる。TadA*8またはTadA*9及びシチジンデアミナーゼ及びCas12の融合タンパク質の例示的な構造を以下に示す:
N-[Cas12(TadA*8またはTadA*9)]-[シチジンデアミナーゼ]-C;
N-[シチジンデアミナーゼ]-[Cas12(TadA*8またはTadA*9)]-C;
N-[Cas12(シチジンデアミナーゼ)]-[TadA*8またはTadA*9]-C;または
N-[TadA*8またはTadA*9]-[Cas12(シチジンデアミナーゼ)]-C。
いくつかの実施形態では、上記の一般的なアーキテクチャで使用される「-」は、任意選択のリンカーの存在を示す。
他の実施形態では、融合タンパク質は、1つ以上の触媒ドメインを含む。他の実施形態では、1つ以上の触媒ドメインの少なくとも1つを、Cas12ポリペプチド内に挿入するか、またはCas12のN末端またはC末端に融合させる。他の実施形態では、1つ以上の触媒ドメインの少なくとも1つを、Cas12ポリペプチドのループ、αヘリックス領域、不定形部分、または溶媒にアクセス可能な部分内に挿入する。他の実施形態では、Cas12ポリペプチドは、Cas12a、Cas12b、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、Cas12i、またはCas12j/CasΦである。他の実施形態では、Cas12ポリペプチドは、Bacillus hisashii Cas12b、Bacillus thermoamylovorans Cas12b、Bacillus種V3-13 Cas12b、またはAlicyclobacillus acidiphilus Cas12bに対して、少なくとも約85%のアミノ酸配列同一性を有する。他の実施形態では、Cas12ポリペプチドは、Bacillus hisashii Cas12b、Bacillus thermoamylovorans Cas12b、Bacillus種V3-13 Cas12b、またはAlicyclobacillus acidiphilus Cas12bに対して、少なくとも約90%のアミノ酸配列同一性を有する。他の実施形態では、Cas12ポリペプチドは、Bacillus hisashii Cas12b、Bacillus thermoamylovorans Cas12b、Bacillus種V3-13 Cas12b、またはAlicyclobacillus acidiphilus Cas12bに対して、少なくとも約95%のアミノ酸配列同一性を有する。他の実施形態では、Cas12ポリペプチドは、Bacillus hisashii Cas12b、Bacillus thermoamylovorans Cas12b、Bacillus種V3-13 Cas12b、または Alicyclobacillus acidiphilus Cas12bの断片を含むか、または本質的にそれらからなる。
他の実施形態では、触媒ドメインを、BhCas12bのアミノ酸位置153~154、255~256、306~307、980~981、1019~1020、534~535、604~605、もしくは344~345またはCas12a、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、Cas12i、もしくはCas12j/CasΦの対応するアミノ酸残基の間に挿入する。他の実施形態では、触媒ドメインを、BhCas12bのアミノ酸P153とS154の間に挿入する。他の実施形態では、触媒ドメインを、BhCas12bのアミノ酸K255とE256の間に挿入する。他の実施形態では、触媒ドメインを、BhCas12bのアミノ酸D980とG981の間に挿入する。他の実施形態では、触媒ドメインを、BhCas12bのアミノ酸K1019とL1020の間に挿入する。他の実施形態では、触媒ドメインを、BhCas12bのアミノ酸F534とP535の間に挿入する。他の実施形態では、触媒ドメインを、BhCas12bのアミノ酸K604とG605の間に挿入する。他の実施形態では、触媒ドメインを、BhCas12bのアミノ酸H344とF345の間に挿入する。他の実施形態では、触媒ドメインを、BvCas12bのアミノ酸位置147と148、248と249、299と300、991と992、もしくは1031と1032、またはCas12a、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、Cas12i、もしくはCas12j/CasΦの対応するアミノ酸残基の間に挿入する。他の実施形態では、触媒ドメインを、BvCas12bのアミノ酸P147とD148の間に挿入する。他の実施形態では、触媒ドメインを、BvCas12bのアミノ酸G248とG249の間に挿入する。他の実施形態では、触媒ドメインを、BvCas12bのアミノ酸P299とE300の間に挿入する。他の実施形態では、触媒ドメインを、BvCas12bのアミノ酸G991とE992の間に挿入する。他の実施形態では、触媒ドメインを、BvCas12bのアミノ酸K1031とM1032の間に挿入する。他の実施形態では、触媒ドメインを、AaCas12bのアミノ酸位置157と158、258と259、310と311、1008と1009、または1044と1045、またはCas12a、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、Cas12i、もしくはCas12j/CasΦの対応するアミノ酸残基の間に挿入する。他の実施形態では、触媒ドメインを、AaCas12bのアミノ酸P157とG158の間に挿入する。他の実施形態では、触媒ドメインを、AaCas12bのアミノ酸V258とG259の間に挿入する。他の実施形態では、触媒ドメインを、AaCas12bのアミノ酸D310とP311の間に挿入する。他の実施形態では、触媒ドメインを、AaCas12bのアミノ酸G1008とE1009の間に挿入する。他の実施形態では、触媒ドメインを、AaCas12bのアミノ酸G1044とK1045の間に挿入する。
他の実施形態では、融合タンパク質は、核局在化シグナル(例えば、バイパータイト核局在化シグナル)を含む。他の実施形態では、核局在化シグナルのアミノ酸配列は、MAPKKKRKVGIHGVPAAである。上記の態様の他の実施形態では、核局在化シグナルは、以下の配列によってコード化される:
ATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCC。他の実施形態では、Cas12bポリペプチドは、RuvCドメインの触媒活性をサイレンシングする変異を含む。他の実施形態では、Cas12bポリペプチドは、D574A、D829A及び/またはD952A変異を含む。他の実施形態では、融合タンパク質は、タグ(例えば、インフルエンザヘマグルチニンタグ)をさらに含む。
いくつかの実施形態では、融合タンパク質は、内部的に融合させた核酸塩基編集ドメイン(例えば、アデノシンデアミナーゼドメインなどのデアミナーゼドメインの全部または一部)を有するnapDNAbpドメイン(例えば、Cas12由来ドメイン)を含む。いくつかの実施形態では、napDNAbpはCas12bである。いくつかの実施形態では、塩基エディターは、以下の表7に示す遺伝子座に挿入された内部的に融合させたTadA*8ドメインを有するBhCas12bドメインを含む。
Figure 2022546608000067

非限定的な例として、アデノシンデアミナーゼ(例えば、ABE8.13)をBhCas12bに挿入して、核酸配列を効果的に編集する融合タンパク質(例えば、ABE8.13-BhCas12b)を生成してもよい。
いくつかの実施形態では、本明細書に記載の塩基エディターシステムは、Cas9にTadAが挿入されたABEを含む。Cas9タンパク質に挿入されたTadAを有するABEの例示的な配列は、2020年8月28日に出願された国際PCT出願第PCT/US2020/048586号に記載されており、その内容は、その全体が参照により本明細書に援用される。
排他性が低下したCas9ドメイン
通常、Cas9タンパク質、例えば、S. pyogenes由来のCas9(spCas9)は、特定の核酸領域に結合するために標準的なNGG PAM配列を必要とし、「NGG」の「N」は、アデノシン(A)、チミジン(T)、またはシトシン(C)であり、Gはグアノシンである。これにより、ゲノム内の目的の塩基を編集する機能が制限され得る。いくつかの実施形態では、本明細書中で提供する塩基編集融合タンパク質は、正確な位置、例えば、PAMの上流にある標的塩基を含む領域に配置される必要がある場合がある。例えば、Komor, A. C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016)を参照のこと(その全内容は、参照により本明細書に援用される)。したがって、いくつかの実施形態では、本明細書中で提供する融合タンパク質のいずれかは、標準的な(例えば、NGG)PAM配列を含まないヌクレオチド配列に結合することができるCas9ドメインを含み得る。非標準PAM配列に結合するCas9ドメインは当技術分野で説明されており、当業者には明らかであろう。例えば、非標準PAM配列に結合するCas9ドメインは、Kleinstiver, B. P., et al., “Engineered CRISPR-Cas9 nucleases with altered PAM specificities” Nature 523, 481-485 (2015);及びKleinstiver, B. P., et al., “Broadening the targeting range of Staphylococcus aureus CRISPR-Cas9 by modifying PAM recognition” Nature Biotechnology 33, 1293-1298 (2015); Nishimasu, H., et al., “Engineered CRISPR-Cas9 nuclease with expanded targeting space” Science.2018 Sep 21; 361 (6408): 1259-1262, Chatterjee, P., et al., Minimal PAM specificity of a highly similar SpCas9 ortholog” Sci Adv. 2018 Oct 24; 4 (10): eaau0766. doi: 10.1126/sciadv.aau0766に記載されており、それぞれの全内容は参照により本明細書に援用される。
核酸塩基編集ドメイン
本明細書において、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン及び核酸塩基編集ドメイン(例えば、デアミナーゼドメイン)を含む融合タンパク質を含む塩基エディターを記載する。塩基エディターは、標的配列を認識することができるガイドポリヌクレオチドと相互作用することによって、標的ポリヌクレオチド配列中の1つ以上の塩基を編集するようにプログラムすることができる。標的配列が認識されると、塩基エディターは編集を行うポリヌクレオチドに固定され、次いで塩基エディターのデアミナーゼドメイン成分が、標的塩基を編集することができる。
いくつかの実施形態では、核酸塩基編集ドメインは、デアミナーゼドメインを含む。いくつかの実施形態では、塩基エディターは、標的C・G塩基対をT・Aに変換するシチジン塩基エディター(例えば、BE4)を含む。いくつかの実施形態では、塩基エディターは、A・TをG・Cに変換するアデニン塩基エディター(例えば、ABE7.10)を含む。本明細書に特に記載するように、デアミナーゼドメインは、アデノシンデアミナーゼを含む。いくつかの実施形態では、用語「アデニンデアミナーゼ」及び「アデノシンデアミナーゼ」は、同じ意味で用いられ得る。核酸塩基編集タンパク質の詳細は、国際PCT出願第PCT/2017/045381号(WO2018/027078)及び第PCT/US2016/058344号(WO2017/070632)に記載されており、これらのそれぞれは、その全体が参照により本明細書に援用される。また、Komor, A. C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N. M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017)、及びKomor, A. C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3: eaao4774 (2017)も参照されたい(その全内容は、参照により本明細書に援用される)。
AからGへの編集
いくつかの実施形態では、本明細書に記載の塩基エディターは、アデノシンデアミナーゼを含むデアミナーゼドメインを含み得る。そのような塩基エディターのアデノシンデアミナーゼドメインは、アデニン(A)を脱アミノ化して、グアニン(G)の塩基対形成特性を示すイノシン(I)を形成することにより、核酸塩基Aから核酸塩基Gへの編集を促進する。アデノシンデアミナーゼは、デオキシリボ核酸(DNA)中のデオキシアデノシン残基のアデニンを脱アミノ化(すなわち、アミン基を除去)することができる。
いくつかの実施形態では、本明細書中で提供する核酸塩基エディターは、1つ以上のタンパク質ドメインを一緒に融合することによって作製することができ、それにより、融合タンパク質が生成される。特定の実施形態では、本明細書中で提供する融合タンパク質は、融合タンパク質の塩基編集活性(例えば、効率、選択性、及び特異性)を向上させる1つ以上の特性を含む。例えば、本明細書中で提供する融合タンパク質は、ヌクレアーゼ活性が低下したCas9ドメインを含み得る。いくつかの実施形態では、本明細書中で提供する融合タンパク質は、ヌクレアーゼ活性を有さないCas9ドメイン(dCas9)、またはCas9ニッカーゼ(nCas9)と呼ばれる二本鎖DNA分子の1本の鎖を切断するCas9ドメインを有し得る。特定の理論に拘泥することを望むものではないが、触媒残基(例えば、H840)の存在は、標的Aの反対側のTを含む非編集(例えば、非脱アミノ化)鎖を切断するCas9の活性を維持する。Cas9の触媒残基の変異(例えば、D10からA10への)は、標的A残基を含む編集された鎖の切断を防止する。そのようなCas9バリアントは、gRNAで規定された標的配列に基づいて特定の場所で一本鎖DNA切断(ニック)を生成し、非編集鎖の修復をもたらし、最終的には非編集鎖上のTからCへの変化を生じさせることができる。いくつかの実施形態では、AからGへの塩基エディターは、イノシン塩基除去修復の阻害剤、例えば、ウラシルグリコシラーゼ阻害剤(UGI)ドメインまたは触媒的に不活性なイノシン特異的ヌクレアーゼをさらに含む。特定の理論に拘泥することを望むものではないが、UGIドメインまたは触媒的に不活性なイノシン特異的ヌクレアーゼは、脱アミノ化アデノシン残基(例えば、イノシン)の塩基除去修復を阻害または防止することができ、これにより、塩基エディターの活性または効率を向上させることができる。
アデノシンデアミナーゼを含む塩基エディターは、DNA、RNA、及びDNA-RNAハイブリッドを含む任意のポリヌクレオチドに作用することができる。特定の実施形態では、アデノシンデアミナーゼを含む塩基エディターは、RNAを含むポリヌクレオチドの標的Aを脱アミノ化することができる。例えば、塩基エディターは、RNAポリヌクレオチド及び/またはDNA-RNAハイブリッドポリヌクレオチドの標的Aを脱アミノ化することができるアデノシンデアミナーゼドメインを含み得る。一実施形態では、塩基エディターに組み込まれたアデノシンデアミナーゼは、RNA(ADAR、例えば、ADAR1またはADAR2)に作用するアデノシンデアミナーゼの全部または一部を含む。別の実施形態では、塩基エディターに組み込まれたアデノシンデアミナーゼは、tRNA(ADAT)に作用するアデノシンデアミナーゼの全部または一部を含む。アデノシンデアミナーゼドメインを含む塩基エディターはまた、DNAポリヌクレオチドのA核酸塩基を脱アミノ化することができる可能性がある。一実施形態では、塩基エディターのアデノシンデアミナーゼドメインは、ADATがDNA中の標的Aを脱アミノ化することを可能にする1つ以上の変異を含む、ADATの全部または一部を含む。例えば、塩基エディターは、変異:D108N、A106V、D147Y、E155V、L84F、H123Y、I156F、または別のアデノシンデアミナーゼにおける対応する変異の1つ以上を含むEscherichia coli由来のADAT(EcTadA)の全部または一部を含み得る。
アデノシンデアミナーゼは、任意の適切な生物(例えば、E. coli)に由来し得る。いくつかの実施形態では、アデニンデアミナーゼは、本明細書中で提供する変異のいずれかに対応する1つ以上の変異(例えば、ecTadAにおける変異)を含む天然のアデノシンデアミナーゼである。任意の相同タンパク質の対応する残基は、例えば、配列アラインメント及び相同残基の決定によって同定することができる。本明細書に記載の変異のいずれかに対応する任意の天然のアデノシンデアミナーゼ(例えば、ecTadAと相同性を有する)の変異(例えば、ecTadAで同定された変異のいずれか)を、それに応じて生成することができる。
アデノシンデアミナーゼ
いくつかの実施形態では、本明細書に記載の融合タンパク質は、アデノシンデアミナーゼを含むデアミナーゼドメインを含み得る。そのような塩基エディターのアデノシンデアミナーゼドメインは、アデニン(A)を脱アミノ化して、グアニン(G)の塩基対形成特性を示すイノシン(I)を形成することにより、核酸塩基Aから核酸塩基Gへの編集を促進する。アデノシンデアミナーゼは、デオキシリボ核酸(DNA)中のデオキシアデノシン残基のアデニンを脱アミノ化(すなわち、アミン基を除去)することができる。
いくつかの実施形態では、本明細書中で提供するアデノシンデアミナーゼは、アデニンを脱アミノ化することができる。いくつかの実施形態では、本明細書中で提供するアデノシンデアミナーゼは、DNAのデオキシアデノシン残基のアデニンを脱アミノ化することができる。いくつかの実施形態では、アデニンデアミナーゼは、本明細書中で提供する変異のいずれかに対応する1つ以上の変異(例えば、ecTadAにおける変異)を含む天然のアデノシンデアミナーゼである。当業者であれば、任意の相同タンパク質の対応する残基を、例えば、配列アラインメント及び相同残基の決定によって同定することができる。したがって、当業者であれば、本明細書に記載の変異のいずれかに対応する任意の天然のアデノシンデアミナーゼ(例えば、ecTadAと相同性を有する)の変異(例えば、ecTadAで同定された変異のいずれか)を、それに応じて生成することができる。いくつかの実施形態では、アデノシンデアミナーゼは、原核生物由来である。いくつかの実施形態では、アデノシンデアミナーゼは、細菌由来である。いくつかの実施形態では、アデノシンデアミナーゼは、Escherichia coli、Staphylococcus aureus、Salmonella typhi、Shewanella putrefaciens、Haemophilus influenzae、Caulobacter crescentus、またはBacillus subtilis由来である。いくつかの実施形態では、アデノシンデアミナーゼは、E. coli由来である。
本開示は、効率が向上し(>50~60%)、特異性が向上したアデノシンデアミナーゼバリアントを提供する。特に、本明細書に記載のアデノシンデアミナーゼバリアントは、ポリヌクレオチド内の所望の塩基を編集する可能性が高く、改変することを意図していない塩基(すなわち、「バイスタンダー」)を編集する可能がは低い。
特定の実施形態では、TadAは、PCT/US2017/045381(WO2018/027078)に記載されているTadAのいずれか1つであり、その全体が参照により本明細書に援用される。野生型TadA(TadA(wt))または「TadA参照配列」は以下の通りである:
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKKAQSSTD
いくつかの実施形態では、本開示の核酸塩基エディターは、以下の配列の変化を含むアデノシンデアミナーゼバリアントである:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD(TadA*7.10とも呼ばれる)。
特定の実施形態では、融合タンパク質は、単一の(例えば、単量体として提供される)TadA*8バリアントを含む。いくつかの実施形態では、TadA*8を、Cas9ニッカーゼに連結する。いくつかの実施形態では、本開示の融合タンパク質は、ヘテロ二量体として、TadA*8バリアントに連結された野生型TadA(TadA(wt))を含む。他の実施形態では、本開示の融合タンパク質は、ヘテロ二量体として、TadA*8バリアントに連結されたTadA*7.10を含む。いくつかの実施形態では、塩基エディターは、TadA*8バリアント単量体を含むABE8である。いくつかの実施形態では、塩基エディターは、TadA*8バリアントとTadA(wt)のヘテロ二量体を含むABE8である。いくつかの実施形態では、塩基エディターは、TadA*8バリアントとTadA*7.10のヘテロ二量体を含むABE8である。いくつかの実施形態では、塩基エディターは、TadA*8バリアントのヘテロ二量体を含むABE8である。いくつかの実施形態では、TadA*8バリアントは表8、10、11、12または13のうちの1つ以上から選択される。
いくつかの実施形態では、塩基エディターは、TadA*9バリアントを含むABE9である。いくつかの実施形態では、塩基エディターは、TadA*9バリアント単量体を含むABE9である。いくつかの実施形態では、塩基エディターは、TadA*9バリアント及びTadA(wt)のヘテロ二量体を含むABE9である。いくつかの実施形態では、塩基エディターは、TadA*9バリアント及び別のTadAバリアント(例えば、TadA*7.10)のヘテロ二量体を含むABE9である。いくつかの実施形態では、塩基エディターは、TadA*9バリアントのホモ二量体を含むABE9である。いくつかの実施形態では、TadA*9バリアントは、本明細書の表14及び18に示す通りである。いくつかの実施形態では、TadA*9バリアントは、以下に記載するバリアントから、及び以下の配列(TadA*7.10と呼ばれる)を参照して選択される:
Figure 2022546608000068
いくつかの実施形態では、アデノシンデアミナーゼ(例えば、TadA*9)は、配列番号1の21、23、25、38、51、54、70、71、72、73、94、124、133、139、146、及び158からなる群から選択されるアミノ酸位置での改変、または別のアデノシンデアミナーゼにおける対応する改変を含む。いくつかの実施形態では、アデノシンデアミナーゼ(例えば、TadA*9)は、以下の改変のうちの1つ以上を含む: R21N、R23H、E25F、N38G、L51W、P54C、M70V、Q71M、N72K、Y73S、V82T、M94V、P124W、T133K、D139L、D139M、C146R、及びA158K、または別のアデノシンデアミナーゼにおける対応する改変。参照配列中の改変される関連塩基を、下線と太字で示す。
いくつかの実施形態では、アデノシンデアミナーゼは、以下の改変の組み合わせのうちの1つ以上を含む: V82S+Q154R+Y147R; V82S+Q154R+Y123H; V82S+Q154R+Y147R+Y123H; Q154R+Y147R+Y123H+I76Y+V82S; V82S+I76Y; V82S+Y147R; V82S+Y147R+Y123H; V82S+Q154R+Y123H; Q154R+Y147R+Y123H+I76Y; V82S+Y147R; V82S+Y147R+Y123H; V82S+Q154R+Y123H; V82S+Q154R+Y147R; V82S+Q154R+Y147R; Q154R+Y147R+Y123H+I76Y; Q154R+Y147R+Y123H+I76Y+V82S; I76Y_V82S_Y123H_Y147R_Q154R; Y147R+Q154R+H123H; 及びV82S+Q154R。
いくつかの実施形態では、アデノシンデアミナーゼは、以下の改変の組み合わせのうちの1つ以上を含む: E25F+V82S+Y123H、T133K+Y147R+Q154R; E25F+V82S+Y123H+Y147R+Q154R; L51W+V82S+Y123H+C146R+Y147R+Q154R; Y73S+V82S+Y123H+Y147R+Q154R; P54C+V82S+Y123H+Y147R+Q154R; N38G+V82T+Y123H+Y147R+Q154R; N72K+V82S+Y123H+D139L+Y147R+Q154R; E25F+V82S+Y123H+D139M+Y147R+Q154R; Q71M+V82S+Y123H+Y147R+Q154R; E25F+V82S+Y123H+T133K+Y147R+Q154R; E25F+V82S+Y123H+Y147R+Q154R; V82S+Y123H+P124W+Y147R+Q154R; L51W+V82S+Y123H+C146R+Y147R+Q154R; P54C+V82S+Y123H+Y147R+Q154R; Y73S+V82S+Y123H+Y147R+Q154R; N38G+V82T+Y123H+Y147R+Q154R; R23H+V82S+Y123H+Y147R+Q154R; R21N+V82S+Y123H+Y147R+Q154R; V82S+Y123H+Y147R+Q154R+A158K; N72K+V82S+Y123H+D139L+Y147R+Q154R; E25F+V82S+Y123H+D139M+Y147R+Q154R; 及びM70V+V82S+M94V+Y123H+Y147R+Q154R。
いくつかの実施形態では、アデノシンデアミナーゼは、以下の改変の組み合わせのうちの1つ以上を含む: Q71M+V82S+Y123H+Y147R+Q154R; E25F+I76Y+V82S+Y123H+Y147R+Q154R; I76Y+V82T+Y123H+Y147R+Q154R; N38G+I76Y+V82S+Y123H+Y147R+Q154R; R23H+I76Y+V82S+Y123H+Y147R+Q154R; P54C+I76Y+V82S+Y123H+Y147R+Q154R; R21N+I76Y+V82S+Y123H+Y147R+Q154R; I76Y+V82S+Y123H+D139M+Y147R+Q154R; Y73S+I76Y+V82S+Y123H+Y147R+Q154R; E25F+I76Y+V82S+Y123H+Y147R+Q154R; I76Y+V82T+Y123H+Y147R+Q154R; N38G+I76Y+V82S+Y123H+Y147R+Q154R; R23H+I76Y+V82S+Y123H+Y147R+Q154R; P54C+I76Y+V82S+Y123H+Y147R+Q154R; R21N+I76Y+V82S+Y123H+Y147R+Q154R; I76Y+V82S+Y123H+D139M+Y147R+Q154R; Y73S+I76Y+V82S+Y123H+Y147R+Q154R; V82S+Q154R; N72K_V82S+Y123H+Y147R+Q154R; Q71M_V82S+Y123H+Y147R+Q154R; V82S+Y123H+T133K+Y147R+Q154R; V82S+Y123H+T133K+Y147R+Q154R+A158K; M70V+Q71M+N72K+V82S+Y123H+Y147R+Q154R; N72K+V82S+Y123H+Y147R+Q154R; Q71M_V82S+Y123H+Y147R+Q154R; M70V+V82S+M94V+Y123H+Y147R+Q154R; V82S+Y123H+T133K+Y147R+Q154R; V82S+Y123H+T133K+Y147R+Q154R+A158K; 及びM70V+Q71M+N72K+V82S+Y123H+Y147R+Q154R。いくつかの実施形態では、アデノシンデアミナーゼは、単量体として発現する。他の実施形態では、アデノシンデアミナーゼは、ヘテロ二量体として発現する。いくつかの実施形態では、デアミナーゼまたは他のポリペプチド配列は、例えば、融合タンパク質の成分として含まれる場合、メチオニンを欠く。これにより、位置の番号が変わり得る。しかしながら、当業者は、そのような対応する変異が同じ変異を指すことを理解するであろう(例えば、Y73SとY72S、及びD139MとD138M)。
いくつかの実施形態では、アデノシンデアミナーゼは、本明細書中で提供するアデノシンデアミナーゼのいずれかに記載のアミノ酸配列のいずれか1つに対して、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。本明細書中で提供するアデノシンデアミナーゼは、1つ以上の変異(例えば、本明細書中で提供する変異のいずれか)を含み得ることが理解されるべきである。本開示は、特定割合の同一性に加えて、本明細書に記載の変異のいずれか、またはそれらの組み合わせを含む任意のデアミナーゼドメインを提供する。いくつかの実施形態では、アデノシンデアミナーゼは、参照配列、または本明細書中で提供するアデノシンデアミナーゼのいずれかと比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50またはそれ以上の変異を有するアミノ酸配列を含む。いくつかの実施形態では、アデノシンデアミナーゼは、当技術分野で公知の、または本明細書に記載のアミノ酸配列のいずれか1つと比較して、少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも110、少なくとも120、少なくとも130、少なくとも140、少なくとも150、少なくとも160、または少なくとも170個の同一の連続アミノ酸残基を有するアミノ酸配列を含む。
いくつかの実施形態では、TadAデアミナーゼは、全長E. coli TadAデアミナーゼである。例えば、特定の実施形態では、アデノシンデアミナーゼは、アミノ酸配列:
MRRAFITGVFFLSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKKAQSSTDを含む。
しかしながら、本出願において有用な追加のアデノシンデアミナーゼは、当業者には明らかであり、本開示の範囲内にあることが理解されるべきである。例えば、アデノシンデアミナーゼは、tRNA(ADAT)に作用するアデノシンデアミナーゼの相同体であり得る。限定されないが、例示的なAD AT相同体のアミノ酸配列として、以下が挙げられる:
Staphylococcus aureus TadA:
MGSHMTNDIYFMTLAIEEAKKAAQLGEVPIGAIITKDDEVIARAHNLRETLQQPTAHAEHIAIERAAKVLGSWRLEGCTLYVTLEPCVMCAGTIVMSRIPRVVYGADDPKGGCSGS LMNLLQQSNFNHRAIVDKGVLKEACSTLLTTFFKNLRANKKSTN
Bacillus subtilis TadA:
MTQDELYMKEAIKEAKKAEEKGEVPIGAVLVINGEIIARAHNLRETEQRSIAHAEMLVIDEACKALGTWRLEGATLYVTLEPCPMCAGAVVLSRVEKVVFGAFDPKGGCSGTLMNLLQEERFNHQAEVVSGVLEEECGGMLSAFFRELRKKKKAARKNLSE
Salmonella typhimurium (S. typhimurium) TadA:
MPPAFITGVTSLSDVELDHEYWMRHALTLAKRAWDEREVPVGAVLVHNHRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVLQNYRLLDTTLYVTLEPCVMCAGAMVHSRIGRVVFGARDAKTGAAGSLIDVLHHPGMNHRVEIIEGVLRDECATLLSDFFRMRRQEIKALKKADRAEGAGPAV
Shewanella putrefaciens (S. putrefaciens) TadA:
MDEYWMQVAMQMAEKAEAAGEVPVGAVLVKDGQQIATGYNLSISQHDPTAHAEILCLRSAGKKLENYRLLDATLYITLEPCAMCAGAMVHSRIARVVYGARDEKTGAAGTVVNLLQHPAFNHQVEVTSGVLAEACSAQLSRFFKRRRDEKKALKLAQRAQQGIE
Haemophilus influenzae F3031 (H. influenzae) TadA:
MDAAKVRSEFDEKMMRYALELADKAEALGEIPVGAVLVDDARNIIGEGWNLSIVQSDPTΑΗAEIIALRNGAKNIQNYRLLNSTLYVTLEPCTMCAGAILHSRIKRLVFGASDYKTGAIGSRFHFFDDYKMNHTLEITSGVLAEECSQKLSTFFQKRREEKKIEKALLKSLSDK
Caulobacter crescentus (C. crescentus) TadA:
MRTDESEDQDHRMMRLALDAARAAAEAGETPVGAVILDPSTGEVIATAGNGPIAAHDPTAHAEIAAMRAAAAKLGNYRLTDLTLVVTLEPCAMCAGAISHARIGRVVFGADDPKGGAVVHGPKFFAQPTCHWRPEVTGGVLADESADLLRGFFRARRKAKI
Geobacter sulfurreducens (G. sulfurreducens) TadA:
MSSLKKTPIRDDAYWMGKAIREAAKAAARDEVPIGAVIVRDGAVIGRGHNLREGSNDPSAHAEMIAIRQAARRSANWRLTGATLYVTLEPCLMCMGAIILARLERVVFGCYDPKGGAAGSLYDLSADPRLNHQVRLSPGVCQEECGTMLSDFFRDLRRRKKAKATPALFIDERKVPPEP
E. coli TadA (ecTadA)の実施形態として、以下が挙げられる。
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
いくつかの実施形態では、アデノシンデアミナーゼは、原核生物由来である。いくつかの実施形態では、アデノシンデアミナーゼは、細菌由来である。いくつかの実施形態では、アデノシンデアミナーゼは、Escherichia coli、Staphylococcus aureus、Salmonella typhi、Shewanella putrefaciens、Haemophilus influenzae、Caulobacter crescentus、またはBacillus subtilis由来である。いくつかの実施形態では、アデノシンデアミナーゼは、E. coli由来である。
一実施形態では、本開示の融合タンパク質は、Cas9ニッカーゼに連結されたTadA*7.10に連結された野生型TadAを含む。特定の実施形態では、融合タンパク質は、単一の(例えば、単量体として提供される)TadA*7.10ドメインを含む。他の実施形態では、ABE7.10エディターは、ヘテロ二量体を形成することができるTadA*7.10及びTadA(wt)を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、本明細書中で提供するアデノシンデアミナーゼのいずれかに記載のアミノ酸配列のいずれか1つに対して、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。本明細書中で提供するアデノシンデアミナーゼは、1つ以上の変異(例えば、本明細書中で提供する変異のいずれか)を含み得ることが理解されるべきである。本開示は、特定割合の同一性に加えて、本明細書に記載の変異のいずれか、またはそれらの組み合わせを含む任意のデアミナーゼドメインを提供する。いくつかの実施形態では、アデノシンデアミナーゼは、参照配列、または本明細書中で提供するアデノシンデアミナーゼのいずれかと比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50またはそれ以上の変異を有するアミノ酸配列を含む。いくつかの実施形態では、アデノシンデアミナーゼは、当技術分野で公知の、または本明細書に記載のアミノ酸配列のいずれか1つと比較して、少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも110、少なくとも120、少なくとも130、少なくとも140、少なくとも150、少なくとも160、または少なくとも170個の同一の連続アミノ酸残基を有するアミノ酸配列を含む。
本明細書中で提供する変異(例えば、TadA参照配列に基づく)のいずれかを、他のアデノシンデアミナーゼ、例えば、E. coli TadA (ecTadA)、S. aureus TadA (saTadA)、または他のアデノシンデアミナーゼ(例えば、細菌性アデノシンデアミナーゼ)に導入することができることが理解されるべきである。追加のデアミナーゼを同様にアラインメントして、本明細書中で提供するように変異させることができる相同アミノ酸残基を同定することができることは、当業者には明らかであろう。したがって、TadA参照配列で同定された変異はいずれも、相同アミノ酸残基を有する他のアデノシンデアミナーゼ(例えば、ecTada)で行うことができる。本明細書中で提供する変異のいずれも、TadA参照配列または別のアデノシンデアミナーゼにおいて個別に、または任意の組み合わせで行うことができることも理解されるべきである。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるD108X変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、D108G、D108N、D108V、D108A、もしくはD108Y変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA106X変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA106V変異、または別のアデノシンデアミナーゼ(例えば、野生型TadAまたはecTadA)における対応する変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるE155X変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含み、Xの存在は、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるE155D、E155G、またはE155V変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるD147X変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含み、Xの存在は、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるD147Y変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA106X、E155X、もしくはD147X変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、E155D、E155G、またはE155V変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは、D147Yを含む。
例えば、アデノシンデアミナーゼは、TadA参照配列におけるD108N、A106V、E155V、及び/またはD147Y変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列における以下の変異のグループ(変異のグループは「;」によって分けられる)、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む:D108N及びA106V; D108N及びE155V; D108N及びD147Y; A106V及びE155V; A106V及びD147Y; E155V及びD147Y; D108N、A106V、及びE155V; D108N、A106V、及びD147Y; D108N、E155V、及びD147Y; A106V、E155V、及びD147Y;ならびにD108N、A106V、E155V、及びD147Y。しかしながら、本明細書中で提供する対応する変異の任意の組み合わせを、アデノシンデアミナーゼ(例えば、ecTadA)において行い得ることが理解されるべきである。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列における、H8X、T17X、L18X、W23X、L34X、W45X、R51X、A56X、E59X、E85X、M94X、I95X、V102X、F104X、A106X、R107X、D108X、K110X、M118X、N127X、A138X、F149X、M151X、R153X、Q154X、I156X、及び/またはK157X変異の1つ以上、または別のアデノシンデアミナーゼ(例えば、ecTadA)の1つ以上の対応する変異を含み、Xの存在は、野生型アデノシンデアミナーゼの対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列における、H8Y、T17S、L18E、W23L、L34S、W45L、R51H、A56E、またはA56S、E59G、E85K、またはE85G、M94L、I95L、V102A、F104L、A106V、R107C、またはR107H、またはR107P、D108G、またはD108N、またはD108V、またはD108A、またはD108Y、K110I、M118K、N127S、A138V、F149Y、M151V、R153C、Q154L、I156D、及び/またはK157R変異の1つ以上、あるいは別のアデノシンデアミナーゼ(例えば、ecTadA)の1つ以上の対応する変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8X、D108X、及び/またはN127X変異の1つ以上、または別のアデノシンデアミナーゼ(例えば、ecTadA)における1つ以上の対応する変異を含み、Xは任意のアミノ酸の存在を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、及び/またはN127S変異の1つ以上、または別のアデノシンデアミナーゼ(例えば、ecTadA)における1つ以上の対応する変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列における、H8X、R26X、M61X、L68X、M70X、A106X、D108X、A109X、N127X、D147X、R152X、Q154X、E155X、K161X、Q163X、及び/またはT166X変異の1つ以上、または別のアデノシンデアミナーゼ(例えば、ecTadA)の1つ以上の対応する変異を含み、Xは、野生型アデノシンデアミナーゼの対応するアミノ酸以外の任意のアミノ酸の存在を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、R26W、M61I、L68Q、M70V、A106T、D108N、A109T、N127S、D147Y、R152C、Q154HまたはQ154R、E155GまたはE155VまたはE155D、K161Q、Q163H、及び/またはT166P変異の1つ以上、あるいは別のアデノシンデアミナーゼ(例えば、ecTadA)における1つ以上の対応する変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列における、H8X、D108X、N127X、D147X、R152X、及びQ154Xからなる群から選択される1、2、3、4、5、もしくは6つの変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)の対応する1つの変異もしくは複数の変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8X、M61X、M70X、D108X、N127X、Q154X、E155X、及びQ163Xからなる群から選択される1、2、3、4、5、6、7、もしくは8つの変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)の対応する1つの変異もしくは複数の変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列における、H8X、D108X、N127X、E155X、及びT166Xからなる群から選択される1、2、3、4、もしくは5つの変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)の対応する1つの変異もしくは複数の変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す。
いくつかの実施形態では、アデノシンデアミナーゼは、H8X、A106X、及びD108Xからなる群から選択される1、2、3、4、5、もしくは6つの変異、または別のアデノシンデアミナーゼの対応する1つの変異もしくは複数の変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す。いくつかの実施形態では、アデノシンデアミナーゼは、H8X、R26X、L68X、D108X、N127X、D147X、及びE155Xからなる群から選択される1、2、3、4、5、6、7、もしくは8つの変異、または別のアデノシンデアミナーゼの対応する1つの変異もしくは複数の変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列における、H8X、R126X、L68X、D108X、N127X、D147X、及びE155Xからなる群から選択される1、2、3、4、5、6、もしくは7つの変異、または別のアデノシンデアミナーゼの対応する1つの変異もしくは複数の変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列における、H8X、D108X、A109X、N127X、及びE155Xからなる群から選択される1、2、3、4、もしくは5つの変異、または別のアデノシンデアミナーゼの対応する1つの変異もしくは複数の変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列における、H8Y、D108N、N127S、D147Y、R152C、及びQ154Hからなる群から選択される1、2、3、4、5、もしくは6つの変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)の対応する1つの変異もしくは複数の変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列における、H8Y、M61I、M70V、D108N、N127S、Q154R、E155G及びQ163Hからなる群から選択される1、2、3、4、5、6、7、もしくは8つの変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)の対応する1つの変異もしくは複数の変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列における、H8Y、D108N、N127S、E155V、及びT166Pからなる群から選択される1、2、3、4、もしくは5つの変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)の対応する1つの変異もしくは複数の変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列における、H8Y、A106T、D108N、N127S、E155D、及びK161Qからなる群から選択される1、2、3、4、5、もしくは6つの変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)の対応する1つの変異もしくは複数の変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列における、H8Y、R26W、L68Q、D108N、N127S、D147Y、及びE155Vからなる群から選択される1、2、3、4、5、6、7、もしくは8つの変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)の対応する1つの変異もしくは複数の変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列における、H8Y、D108N、A109T、N127S、及びE155Gからなる群から選択される1、2、3、4、もしくは5つの変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)の対応する1つの変異もしくは複数の変異を含む。
本明細書中で提供する変異のいずれか、及び任意の追加の変異(例えば、ecTadAアミノ酸配列に基づく)は、他の任意のアデノシンデアミナーゼに導入することができる。本明細書中で提供する変異のいずれも、TadA参照配列または別のアデノシンデアミナーゼ(例えば、ecTadA)において個別に、または任意の組み合わせで行うことができる。
AからGへの核酸塩基編集タンパク質の詳細は、国際PCT出願第PCT/2017/045381(WO2018/027078)及びGaudelli, N. M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature, 551, 464-471 (2017)に記載されており、その全内容は参照により本明細書に援用される。
いくつかの実施形態では、アデノシンデアミナーゼは、別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異の1つ以上を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるD108N、D108G、もしくはD108V変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA106V及びD108N変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR107C及びD108N変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、N127S、D147Y、及びQ154H変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、N127S、D147Y、及びE155V変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるD108N、D147Y、及びE155V変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、及びN127S変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA106V、D108N、D147Y、及びE155V変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列における、S2X、H8X、I49X、L84X、H123X、N127X、I156X及び/またはK160X変異の1つ以上、または別のアデノシンデアミナーゼの対応する変異の1つ以上を含み、Xの存在は、野生型アデノシンデアミナーゼの対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるS2A、H8Y、I49F、L84F、H123Y、N127S、I156F及び/またはK160S変異の1つ以上、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異の1つ以上を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、L84X変異型アデノシンデアミナーゼを含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるL84F変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH123X変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH123Y変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるI156X変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるI156F変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列における、L84X、A106X、D108X、H123X、D147X、E155X、及びI156Xからなる群から選択される1、2、3、4、5、6、もしくは7つの変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)の対応する1つの変異もしくは複数の変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列における、S2X、I49X、A106X、D108X、D147X、及びE155Xからなる群から選択される1、2、3、4、5、もしくは6つの変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)の対応する1つの変異もしくは複数の変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列における、H8X、A106X、D108X、N127X、及びK160Xからなる群から選択される1、2、3、4、もしくは5つの変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)の対応する1つの変異もしくは複数の変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列における、L84F、A106V、D108N、H123Y、D147Y、E155V、及びI156Fからなる群から選択される1、2、3、4、5、6、もしくは7つの変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)の対応する1つの変異もしくは複数の変異を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列における、S2A、I49F、A106V、D108N、D147Y、及びE155Vからなる群から選択される1、2、3、4、5、もしくは6つの変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列における、H8Y、A106T、D108N、N127S、及びK160Sからなる群から選択される1、2、3、4、もしくは5つの変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)の対応する1つの変異もしくは複数の変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列における、E25X、R26X、R107X、A142X、及び/またはA143X変異の1つ以上、または別のアデノシンデアミナーゼ(例えば、ecTadA)の対応する変異の1つ以上を含み、Xの存在は、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列における、E25M、E25D、E25A、E25R、E25V、E25S、E25Y、R26G、R26N、R26Q、R26C、R26L、R26K、R107P、R107K、R107A、R107N、R107W、R107H、R107S、A142N、A142D、A142G、A143D、A143G、A143E、A143L、A143W、A143M、A143S、A143Q及び/またはA143R変異の1つ以上、または別のアデノシンデアミナーゼ(例えば、ecTadA)の対応する変異の1つ以上を含む。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列に対応する本明細書に記載の変異の1つ以上、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異の1つ以上を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるE25X変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるE25M、E25D、E25A、E25R、E25V、E25S、またはE25Y変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR26X変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR26G、R26N、R26Q、R26C、R26L、もしくはR26K変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR107X変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR107P、R107K、R107A、R107N、R107W、R107H、もしくはR107S変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA142X変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA142N、A142D、A142G変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA143X変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA143D、A143G、A143E、A143L、A143W、A143M、A143S、A143Q及び/またはA143R変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列における、H36X、N37X、P48X、I49X、R51X、M70X、N72X、D77X、E134X、S146X、Q154X、K157X、及び/またはK161X変異の1つ以上、または別のアデノシンデアミナーゼ(例えば、ecTadA)の対応する変異の1つ以上を含み、Xの存在は、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH36L、N37T、N37S、P48T、P48L、I49V、R51H、R51L、M70L、N72S、D77G、E134G、S146R、S146C、Q154H、K157N、及び/またはK161T変異の1つ以上、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異の1つ以上を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH36X変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH36L変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるN37X変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるN37T、もしくはN37S変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるP48X変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるP48T、もしくはP48L変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR51X変異、または別のアデノシンデアミナーゼにおける対応する変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR51H、もしくはR51L変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるS146X変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるS146R、もしくはS146C変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるK157X変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるK157N変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるP48X変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるP48S、P48T、もしくはP48A変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA142X変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA142N変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるW23X変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるW23R、もしくはW23L変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。
いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR152X変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR152P、もしくはR52H変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含む。
一実施形態では、アデノシンデアミナーゼは、変異H36L、R51L、L84F、A106V、D108N、H123Y、S146C、D147Y、E155V、I156F、及びK157Nを含み得る。いくつかの実施形態では、アデノシンデアミナーゼは、TadA参照配列に関連する以下の変異の組み合わせを含み、組み合わせの各変異は、「_」によって区切られ、変異の各組み合わせは、括弧の間にある。
(A106V_D108N)、
(R107C_D108N)、
(H8Y_D108N_N127S_D147Y_Q154H)、
(H8Y_D108N_N127S_D147Y_E155V)、
(D108N_D147Y_E155V)、
(H8Y_D108N_N127S)、
(H8Y_D108N_N127S_D147Y_Q154H)、
(A106V_D108N_D147Y_E155V)、
(D108Q_D147Y_E155V)、
(D108M_D147Y_E155V)、
(D108L_D147Y_E155V)、
(D108K_D147Y_E155V)、
(D108I_D147Y_E155V)、
(D108F_D147Y_E155V)、
(A106V_D108N_D147Y)、
(A106V_D108M_D147Y_E155V)、
(E59A_A106V_D108N_D147Y_E155V)、
(E59A cat 不活性_A106V_D108N_D147Y_E155V)、
(L84F_A106V_D108N_H123Y_D147Y_E155V_I156Y)、
(L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(D103A_D104N)、
(G22P_D103A_D104N)、
(D103A_D104N_S138A)、
(R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F)、
(E25G_R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V
_I156F)、(E25D_R26G_L84F_A106V_R107K_D108N_H123Y_A142N_A143G_D147Y_E155V_
I156F)、
(R26Q_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F)、
(E25M_R26G_L84F_A106V_R107P_D108N_H123Y_A142N_A143D_D147Y_E155V
_I156F)、
(R26C_L84F_A106V_R107H_D108N_H123Y_A142N_D147Y_E155V_I156F)、(L84F_A106V_D108N_H123Y_A142N_A143L_D147Y_E155V_I156F)、
(R26G_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F)、
(E25A_R26G_L84F_A106V_R107N_D108N_H123Y_A142N_A143E_D147Y_E155V
_I156F)、
(R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F)、
(A106V_D108N_A142N_D147Y_E155V)、
(R26G_A106V_D108N_A142N_D147Y_E155V)、
(E25D_R26G_A106V_R107K_D108N_A142N_A143G_D147Y_E155V)、
(R26G_A106V_D108N_R107H_A142N_A143D_D147Y_E155V)、
(E25D_R26G_A106V_D108N_A142N_D147Y_E155V)、
(A106V_R107K_D108N_A142N_D147Y_E155V)、
(A106V_D108N_A142N_A143G_D147Y_E155V)、
(A106V_D108N_A142N_A143L_D147Y_E155V)、
(H36L_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N)、
(N37T_P48T_M70L_L84F_A106V_D108N_H123Y_D147Y_I49V_E155V_I156F)、
(N37S_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_K161T)、
(H36L_L84F_A106V_D108N_H123Y_D147Y_Q154H_E155V_I156F)、
(N72S_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F)、
(H36L_P48L_L84F_A106V_D108N_H123Y_E134G_D147Y_E155V_I156F)、
(H36L_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_K157N)、(H36L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F)、
(L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F_K161T)、
(N37S_R51H_D77G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(R51L_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_K157N)、
(D24G_Q71R_L84F_H96L_A106V_D108N_H123Y_D147Y_E155V_I156F_K160E)、
(H36L_G67V_L84F_A106V_D108N_H123Y_S146T_D147Y_E155V_I156F)、
(Q71L_L84F_A106V_D108N_H123Y_L137M_A143E_D147Y_E155V_I156F)、
(E25G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_Q159L)、
(L84F_A91T_F104I_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(N72D_L84F_A106V_D108N_H123Y_G125A_D147Y_E155V_I156F)、
(P48S_L84F_S97C_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(W23G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(D24G_P48L_Q71R_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_Q159L)、
(L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F)、
(H36L_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_I156F
_K157N)、(N37S_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F_K161T)、
(L84F_A106V_D108N_D147Y_E155V_I156F)、
(R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N_K161T)、
(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K161T)、
(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N_K160E_K161T)、
(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N_K160E)、
(R74Q_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(R74A_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(R74Q_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(L84F_R98Q_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(L84F_A106V_D108N_H123Y_R129Q_D147Y_E155V_I156F)、
(P48S_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F)、
(P48S_A142N)、
(P48T_I49V_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F_L157N)、
(P48T_I49V_A142N)、
(H36L_P48S_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N)、
(H36L_P48S_R51L_L84F_A106V_D108N_H123Y_S146C_A142N_D147Y_E155V_I156F(H36L_P48T_I49V_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N)、
(H36L_P48T_I49V_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_I156F_K157N)、
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N)、
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_I156F_K157N)、
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_A142N_D147Y_E155V_I156F_K157N)、
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N)、
(W23R_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N)、
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F_K161T)、
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152H_E155V_I156F_K157N)、
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V_I156F_K157N)、
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V_I156F_K157N)、
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142A_S146C_D147Y_E155V
_I156F_K157N)、
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142A_S146C_D147Y_R152P_E155V_I156F_K157N)、
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F_K161T)、
(W23R_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V_I156F_K157N)、
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_R152P_E155V
_I156F_K157N)。
特定の実施形態では、本明細書中で提供する融合タンパク質は、融合タンパク質の塩基編集活性を向上させる1つ以上の特性を含む。例えば、本明細書中で提供する融合タンパク質のいずれかは、ヌクレアーゼ活性が低下したCas9ドメインを含み得る。いくつかの実施形態では、本明細書中で提供する融合タンパク質のいずれかは、ヌクレアーゼ活性を有さないCas9ドメイン(dCas9)、またはCas9ニッカーゼ(nCas9)と呼ばれる二本鎖DNA分子の1本の鎖を切断するCas9ドメインを有し得る。
いくつかの実施形態では、アデノシンデアミナーゼはTadA*7.10である。いくつかの実施形態では、TadA*7.10は、少なくとも1つの改変を含む。特定の実施形態では、TadA*7.10は、以下の改変のうちの1つ以上を含む:Y147T、Y147R、Q154S、Y123H、V82S、T166R、及びQ154R。改変Y123Hとは、本明細書中では、H123Hとも呼ばれる(Y123H(wt)に逆戻りしたTadA*7.10の改変H123Y)。他の実施形態では、TadA*7.10は、Y147T+Q154R; Y147T+Q154S; Y147R+Q154S; V82S+Q154S; V82S+Y147R; V82S+Q154R; V82S+Y123H; I76Y+V82S; V82S+Y123H+Y147T; V82S+Y123H+Y147R; V82S+Y123H+Q154R; Y147R+Q154R+Y123H; Y147R+Q154R+I76Y; Y147R+Q154R+T166R; Y123H+Y147R+Q154R+I76Y; V82S+Y123H+Y147R+Q154R; 及びI76Y+V82S+Y123H+Y147R+Q154Rの群から選択される改変の組み合わせを含む。特定の実施形態では、アデノシンデアミナーゼバリアントは、TadA*7.10、TadA参照配列、または別のTadAにおける対応する変異と比較して、残基149、150、151、152、153、154、155、156、または157で始まるC末端の欠失を含む。
他の実施形態では、本開示の塩基エディターは、TadA*7.10、TadA参照配列、または別のTadAの対応する変異と比較して、以下の改変:Y147T、Y147R、Q154S、Y123H、V82S、T166R、及び/またはQ154Rのうちの1つ以上を含むアデノシンデアミナーゼバリアント(例えば、TadA*8)を含む単量体である。他の実施形態では、アデノシンデアミナーゼバリアント(TadA*8)は、TadA*7.10、TadA参照配列、または別のTadAの対応する変異と比較して、Y147T+Q154R; Y147T+Q154S; Y147R+Q154S; V82S+Q154S; V82S+Y147R;V82S+Q154R;V82S+Y123H;I76Y+V82S;V82S+Y123H+Y147T;V82S+Y123H+Y147R;V82S+Y123H+Q154R;Y147R+Q154R+Y123H;Y147R+Q154R+I76Y;Y147R+Q154R+T166R;Y123H+Y147R+Q154R+I76Y;V82S+Y123H+Y147R+Q154R; 及びI76Y+V82S+Y123H+Y147R+Q154Rの群から選択される改変の組み合わせを含む単量体である。
他の実施形態では、塩基エディターは、野生型アデノシンデアミナーゼと、TadA*7.10、TadA参照配列、または別のTadAの対応する変異と比較して、以下の改変の1つ以上を含むアデノシンデアミナーゼバリアント(例えば、TadA*8)を含むヘテロ二量体である:Y147T、Y147R、Q154S、Y123H、V82S、T166R、及び/またはQ154R。他の実施形態では、塩基エディターは、野生型アデノシンデアミナーゼドメインと、TadA*7.10、TadA参照配列、または別のTadAの対応する変異と比較して、以下の群から選択される改変の組み合わせを含むアデノシンデアミナーゼバリアントドメイン(例えば、TadA*8)とのヘテロ二量体を含む: Y147T+Q154R; Y147T+Q154S; Y147R+Q154S; V82S+Q154S; V82S+Y147R; V82S+Q154R; V82S+Y123H; I76Y+V82S; V82S+Y123H+Y147T; V82S+Y123H+Y147R; V82S+Y123H+Q154R; Y147R+Q154R+Y123H; Y147R+Q154R+I76Y; Y147R+Q154R+T166R; Y123H+Y147R+Q154R+I76Y; V82S+Y123H+Y147R+Q154R; 及びI76Y+V82S+Y123H+Y147R+Q154R。
他の実施形態では、塩基エディターは、TadA*7.10ドメインと、TadA*7.10、TadA参照配列、または別のTadAの対応する変異と比較して、以下の改変、すなわち、Y147T、Y147R、Q154S、Y123H、V82S、T166R、及び/またはQ154Rのうちの1つ以上を含むアデノシンデアミナーゼバリアントドメイン(例えば、TadA*8)とのヘテロ二量体を含む。他の実施形態では、塩基エディターは、野生型アデノシンデアミナーゼと、TadA*7.10、TadA参照配列、または別のTadAの対応する変異と比較して、以下の群から選択される改変の組み合わせを含むアデノシンデアミナーゼバリアントドメイン(例えば、TadA*8)を含むヘテロ二量体である: Y147T+Q154R; Y147T+Q154S; Y147R+Q154S; V82S+Q154S; V82S+Y147R; V82S+Q154R; V82S+Y123H; I76Y+V82S; V82S+Y123H+Y147T; V82S+Y123H+Y147R; V82S+Y123H+Q154R; Y147R+Q154R+Y123H; Y147R+Q154R+I76Y; Y147R+Q154R+T166R; Y123H+Y147R+Q154R+I76Y; V82S+Y123H+Y147R+Q154R; 及びI76Y+V82S+Y123H+Y147R+Q154R。
他の実施形態では、塩基エディターは、TadA*7.10ドメインと、TadA*7.10、TadA参照配列、または別のTadAの対応する変異と比較して、以下の改変、すなわちY147T、Y147R、Q154S、Y123H、V82S、T166R、及び/またはQ154Rのうちの1つ以上を含むアデノシンデアミナーゼバリアント(例えば、TadA*8)とを含むヘテロ二量体である。他の実施形態では、塩基エディターは、TadA*7.10ドメイン、及びTadA*7.10、TadA参照配列、または別のTadAの対応する変異と比較して: Y147T+Q154R; Y147T+Q154S; Y147R+Q154S; V82S+Q154S; V82S+Y147R; V82S+Q154R; V82S+Y123H; I76Y+V82S; V82S+Y123H+Y147T; V82S+Y123H+Y147R; V82S+Y123H+Q154R; Y147R+Q154R+Y123H; Y147R+Q154R+I76Y; Y147R+Q154R+T166R; Y123H+Y147R+Q154R+I76Y; V82S+Y123H+Y147R+Q154R; 及びI76Y+V82S+Y123H+Y147R+Q154Rの群から選択される改変の組み合わせを含むアデノシンデアミナーゼバリアントドメイン(例えば、TadA*8)を含むヘテロ二量体である。
一実施形態では、アデノシンデアミナーゼは、アデノシンデアミナーゼ活性を有する以下の配列またはその断片を含むか、または本質的にそれらからなるTadA*8である:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD
いくつかの実施形態では、TadA*8は、短縮(切詰)されている。いくつかの実施形態では、短縮されたTadA*8は、全長TadA*8と比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のN末端アミノ酸残基を欠失している。いくつかの実施形態では、短縮されたTadA*8は、全長TadA*8と比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のC末端アミノ酸残基を欠失している。いくつかの実施形態では、アデノシンデアミナーゼバリアントは全長TadA*8である。
いくつかの実施形態では、TadA*8は、TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23、またはTadA*8.24である。
他の実施形態では、本開示の塩基エディターは、TadA*7.10、TadA参照配列、または別のTadAの対応する変異と比較して、以下の改変のうちの1つ以上を含むアデノシンデアミナーゼバリアント(例えば、TadA*8)を含む単量体である:R26C、V88A、A109S、T111R、D119N、H122N、Y147D、F149Y、T166I及び/またはD167N。他の実施形態では、アデノシンデアミナーゼバリアント(TadA*8)は、TadA*7.10、TadA参照配列、または別のTadAの対応する変異と比較して、以下の群から選択される改変の組み合わせを含む単量体である: R26C+A109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167N; V88A+A109S+T111R+D119N+H122N+F149Y+T166I+D167N; R26C+A109S+T111R+D119N+H122N+F149Y+T166I+D167N; V88A+T111R+D119N+F149Y; 及びA109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167N。
他の実施形態では、塩基エディターは、野生型アデノシンデアミナーゼと、TadA*7.10、TadA参照配列、または別のTadAの対応する変異と比較して、以下の改変、すなわち、R26C、V88A、A109S、T111R、D119N、H122N、Y147D、F149Y、T166I及び/またはD167Nのうちの1つ以上を含むアデノシンデアミナーゼバリアント(例えば、TadA*8)とを含むヘテロ二量体である。他の実施形態では、塩基エディターは、野生型アデノシンデアミナーゼと、TadA*7.10、TadA参照配列、または別のTadAの対応する変異と比較して、以下の群から選択される改変の組み合わせを含むアデノシンデアミナーゼバリアントドメイン(例えば、TadA*8)とを含むヘテロ二量体である: R26C+A109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167N; V88A+A109S+T111R+D119N+H122N+F149Y+T166I+D167N; R26C+A109S+T111R+D119N+H122N+F149Y+T166I+D167N; V88A+T111R+D119N+F149Y; 及びA109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167N。
他の実施形態では、塩基エディターは、TadA*7.10ドメインと、TadA*7.10、TadA参照配列、または別のTadAの対応する変異と比較して、以下の改変、すなわち、R26C、V88A、A109S、T111R、D119N、H122N、Y147D、F149Y、T166I及び/またはD167Nのうちの1つ以上を含むアデノシンデアミナーゼバリアント(例えば、TadA*8)とを含むヘテロ二量体である。他の実施形態では、塩基エディターは、TadA*7.10ドメインと、TadA*7.10、TadA参照配列、または別のTadAの対応する変異と比較して、以下の群から選択される改変の組み合わせを含むアデノシンデアミナーゼバリアントドメイン(例えば、TadA*8)とを含むヘテロ二量体である: R26C+A109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167N; V88A+A109S+T111R+D119N+H122N+F149Y+T166I+D167N; R26C+A109S+T111R+D119N+H122N+F149Y+T166I+D167N; V88A+T111R+D119N+F149Y; 及びA109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167N。
いくつかの実施形態では、TadA*8は、表8に示すバリアントである。表8は、TadAアミノ酸配列における特定のアミノ酸位置番号及びTadA-7.10アデノシンデアミナーゼにおけるそれらの位置に存在するアミノ酸を示す。表8はまた、M. Richter et al., 2020, Nature Biotechnology, doi.org/10.1038/s41587-020-0453-z(その全内容は参照により本明細書に援用される)に記載されているように、ファージを介した非連続的進化法(PANCE)及びファージを介した連続的進化法(PACE)後の、TadA*7.10と比較したTadAバリアントのアミノ酸変化も示す。いくつかの実施形態では、TadA*8は、TadA*8a、TadA*8b、TadA*8c、TadA*8d、またはTadA*8eである。いくつかの実施形態では、TadA*8はTadA*8eである。
Figure 2022546608000069
一実施形態では、本開示の融合タンパク質は、Cas9ニッカーゼに連結された本明細書に記載のアデノシンデアミナーゼバリアント(例えば、TadA*8)に連結された野生型TadAを含む。特定の実施形態では、融合タンパク質は、単一の(例えば、単量体として提供される)TadA*8バリアントを含む。他の実施形態では、塩基エディターは、ヘテロ二量体を形成することができるTadA*8及びTadA(wt)を含む。例示的な配列は以下の通りである:
TadA(wt)または「TadA参照配列」:
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKKAQSSTD
TadA*7.10:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
TadA*8:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD。
いくつかの実施形態では、アデノシンデアミナーゼは、本明細書中で提供するアデノシンデアミナーゼのいずれかに記載のアミノ酸配列のいずれか1つに対して、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。本明細書中で提供するアデノシンデアミナーゼは、1つ以上の変異(例えば、本明細書中で提供する変異のいずれか)を含み得ることが理解されるべきである。本開示は、特定割合の同一性に加えて、本明細書に記載の変異のいずれか、またはそれらの組み合わせを含む任意のデアミナーゼドメインを提供する。いくつかの実施形態では、アデノシンデアミナーゼは、参照配列、または本明細書中で提供するアデノシンデアミナーゼのいずれかと比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50またはそれ以上の変異を有するアミノ酸配列を含む。いくつかの実施形態では、アデノシンデアミナーゼは、当技術分野で公知の、または本明細書に記載のアミノ酸配列のいずれか1つと比較して、少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも110、少なくとも120、少なくとも130、少なくとも140、少なくとも150、少なくとも160、または少なくとも170個の同一の連続アミノ酸残基を有するアミノ酸配列を含む。
特定の実施形態では、TadA*8は、太字で示す以下の位置のいずれかに1つ以上の変異を含む。他の実施形態では、TadA*8は、下線付きで示す位置のいずれかに1つ以上の変異を含む:
Figure 2022546608000070
例えば、TadA*8は、TadA*7.10、TadA参照配列、または別のTadAの対応する変異と比較して、アミノ酸位置82及び/または166(例えば、V82S、T166R)において改変を、単独で、またはY147T、Y147R、Q154S、Y123H、及び/またはQ154Rのいずれか1つ以上と組み合わせて含む。特定の実施形態では、改変の組み合わせは、TadA*7.10、TadA参照配列、または別のTadAの対応する変異と比較して、Y147T+Q154R; Y147T+Q154S; Y147R+Q154S; V82S+Q154S; V82S+Y147R; V82S+Q154R; V82S+Y123H; I76Y+V82S; V82S+Y123H+Y147T; V82S+Y123H+Y147R; V82S+Y123H+Q154R; Y147R+Q154R+Y123H; Y147R+Q154R+I76Y; Y147R+Q154R+T166R; Y123H+Y147R+Q154R+I76Y;V82S+Y123H+Y147R+Q154R; 及びI76Y+V82S+Y123H+Y147R+Q154Rの群から選択される。
いくつかの実施形態では、アデノシンデアミナーゼは、アデノシンデアミナーゼ活性を有する以下の配列またはその断片を含むか、または本質的にそれらからなるTadA*8である:
MSEVEFSHEY WMRHALTLAK RARDEREVPV GAVLVLNNRV IGEGWNRAIG
LHDPTAHAEI MALRQGGLVM QNYRLIDATL YVTFEPCVMC AGAMIHSRIG
RVVFGVRNAK TGAAGSLMDV LHYPGMNHRV EITEGILADE CAALLCTFFR
MPRQVFNAQK KAQSSTD
いくつかの実施形態では、TadA*8は、短縮されている。いくつかの実施形態では、短縮されたTadA*8は、全長TadA*8と比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のN末端アミノ酸残基を欠失している。いくつかの実施形態では、短縮されたTadA*8は、全長TadA*8と比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のC末端アミノ酸残基を欠失している。いくつかの実施形態では、アデノシンデアミナーゼバリアントは全長TadA*8である。
一実施形態では、本開示の融合タンパク質は、Cas9ニッカーゼに連結された本明細書に記載のアデノシンデアミナーゼバリアント(例えば、TadA*8)に連結された野生型TadAを含む。特定の実施形態では、融合タンパク質は、単一の(例えば、単量体として提供される)TadA*8ドメインを含む。他の実施形態では、塩基エディターは、ヘテロ二量体を形成することができるTadA*8及びTadA(wt)を含む。
ガイドRNAとのCas9複合体
本開示のいくつかの態様は、本明細書中で提供する融合タンパク質のいずれか、及び融合タンパク質のCas9ドメイン(例えば、dCas9、ヌクレアーゼ活性Cas9、またはCas9ニッカーゼ)に結合されたガイドRNAを含む複合体を提供する。いくつかの実施形態では、ガイド核酸(例えば、ガイドRNA)は、15~100ヌクレオチド長であり、標的配列に相補的である少なくとも10個の連続ヌクレオチドの配列を含む。いくつかの実施形態では、ガイドRNAは、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、または50ヌクレオチド長である。いくつかの実施形態では、ガイドRNAは、標的配列に相補的な15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、または40個の連続ヌクレオチドの配列を含む。いくつかの実施形態では、標的配列はDNA配列である。いくつかの実施形態では、標的配列は、細菌、酵母、真菌、昆虫、植物、または動物のゲノム内の配列である。いくつかの実施形態では、標的配列は、ヒトのゲノム内の配列である。いくつかの実施形態では、標的配列の3’末端は、標準PAM配列(NGG)に直接隣接している。いくつかの実施形態では、標的配列の3’末端は、非標準PAM配列(例えば、表1に記載の配列または5’-NAA-3’)に直接隣接している。いくつかの実施形態では、ガイド核酸(例えば、ガイドRNA)は、目的の遺伝子(例えば、疾患または障害に関連する遺伝子)の配列に相補的である。
本開示のいくつかの態様は、本明細書中で提供する融合タンパク質または複合体の使用方法を提供する。例えば、本開示のいくつかの態様は、DNA分子を、本明細書中で提供する融合タンパク質のいずれか、及び少なくとも1つのガイドRNAと接触させることを含む方法を提供し、ガイドRNAは、約15~100ヌクレオチド長であり、標的配列に相補的な少なくとも10個の連続ヌクレオチドの配列を含む。いくつかの実施形態では、標的配列の3’末端は、AGC、GAG、TTT、GTG、またはCAA配列に直接隣接している。いくつかの実施形態では、標的配列の3’末端は、NGA、NGC、NGCG、NGN、NNGRRT、NNNRRT、NGCG、NGCN、NGTN、NGTN、NGTN、または5’(TTTV)配列に直接隣接している。
それぞれの配列における特定の位置または残基の付番は、使用する特定のタンパク質及び付番スキームに依存することが理解されよう。付番は、例えば、成熟タンパク質の前駆体と成熟タンパク質自体で異なる場合があり、種ごとの配列の違いが付番に影響を与える可能性がある。当業者であれば、当技術分野で周知の方法、例えば、配列アラインメント及び相同残基の決定によって、任意の相同タンパク質及び対応するコード核酸中の対応する残基を同定することができるであろう。
本明細書に開示する融合タンパク質のいずれかを、標的部位、例えば、変異を含む編集しようとする部位に標的指向化するために、典型的には、ガイドRNAと一緒に融合タンパク質を共発現することが必要であることは当業者には明らかであろう。本明細書の他の場所でより詳細に説明するように、ガイドRNAは、通常、Cas9結合を可能にするtracrRNAフレームワーク、及びCas9: 核酸編集酵素/ドメイン融合タンパク質に配列特異性を与えるガイド配列を含む。あるいは、ガイドRNA及びtracrRNAを、2つの核酸分子として別々に提供してもよい。いくつかの実施形態では、ガイドRNAは、標的配列に相補的な配列をガイド配列が含む構造を含む。ガイド配列は、通常、20ヌクレオチド長である。Cas9: 核酸編集酵素/ドメイン融合タンパク質を、特定のゲノム標的部位に標的化するための適切なガイドRNAの配列は、本開示に基づいて当業者には明らかであろう。そのような適切なガイドRNA配列は、通常、編集しようとする標的ヌクレオチドの上流または下流の50ヌクレオチド内の核酸配列に相補的なガイド配列を含む。本明細書において、提供する融合タンパク質のいずれかを特定の標的配列に標的化するのに適したいくつかの例示的なガイドRNA配列を提供する。
追加のドメイン
本明細書に記載の塩基エディターは、ポリヌクレオチドの核酸塩基の修飾または改変である核酸塩基編集を促進するのに役立つ任意のドメインを含み得る。いくつかの実施形態では、塩基エディターは、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン(例えば、Cas9)、核酸塩基編集ドメイン(例えば、デアミナーゼドメイン)、及び1つ以上の追加のドメインを含む。いくつかの場合では、追加のドメインは、塩基エディターの酵素的または触媒的機能、塩基エディターの結合機能を促進するか、または所望の塩基編集結果を妨害する可能性のある細胞機構(例えば、酵素)の阻害剤となり得る。いくつかの実施形態では、塩基エディターは、ヌクレアーゼ、ニッカーゼ、リコンビナーゼ、デアミナーゼ、メチルトランスフェラーゼ、メチラーゼ、アセチラーゼ、アセチルトランスフェラーゼ、転写活性化因子、または転写リプレッサードメインを含み得る。
いくつかの実施形態では、塩基エディターは、ウラシルグリコシラーゼ阻害(UGI)ドメインを含み得る。UGIドメインは、例えば、Cの脱アミノ化によって形成されるUから核酸塩基Cに転換して戻ることを阻害することにより、シチジンデアミナーゼドメインを含む塩基エディターの効率を向上させることができる。いくつかの場合では、U:Gヘテロ二本鎖DNAが存在することに対する細胞のDNA修復応答が、細胞内の核酸塩基編集効率の低下の原因であり得る。そのような場合、ウラシルDNAグリコシラーゼ(UDG)は、細胞内のDNAからのUの除去を触媒することができ、塩基除去修復(BER)を開始し、主にU:GペアをC:Gペアに戻すことができる。そのような場合、BERは、一本鎖に結合し、編集された塩基を遮断し、UGIを阻害し、BERを阻害し、編集された塩基を保護し、及び/または非編集鎖の修復を促進する1つ以上のドメインを含む塩基エディターにおいて阻害することができる。したがって、本開示は、UGIドメインを含む塩基エディター融合タンパク質を企図している。
いくつかの実施形態では、塩基エディターは、ドメインとして、二本鎖切断(DSB)結合タンパク質の全部または一部を含む。例えば、DSB結合タンパク質は、DSBの末端に結合し、それらを分解から保護することができるバクテリオファージMuのGamタンパク質を含み得る。Komor, A. C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3: eaao4774 (2017)を参照されたい(その全内容は、参照により本明細書に援用される)
さらに、いくつかの実施形態では、Gamタンパク質を、塩基エディターのN末端に融合させることができる。いくつかの実施形態では、Gamタンパク質を、塩基エディターのC末端に融合させることができる。バクテリオファージMuのGamタンパク質は、二本鎖切断(DSB)の末端に結合し、それらを分解から保護することができる。いくつかの実施形態では、Gamを使用してDSBの自由端に結合させることにより、塩基編集のプロセス中のインデル形成を低減することができる。いくつかの実施形態では、174残基のGamタンパク質を、塩基エディターのN末端に融合させる。Komor, A. C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3: eaao4774 (2017)を参照されたい。いくつかの実施形態では、1つ以上の変異は、野生型ドメインと比較して、塩基エディタードメインの長さを変えることができる。例えば、少なくとも1つのドメインの少なくとも1つのアミノ酸を欠失させることにより、塩基エディターの長さを短くすることができる。別の場合では、1つの変異または複数の変異は、野生型ドメインと比較して、ドメインの長さを変化させない。例えば、任意のドメインにおける置換(複数可)は、塩基エディターの長さを変化させない。
いくつかの実施形態では、塩基エディターは、ドメインとして、核酸ポリメラーゼ(NAP)の全部または一部を含み得る。例えば、塩基エディターは、真核生物のNAPの全部または一部を含み得る。いくつかの実施形態では、塩基エディターに組み込まれるNAPまたはその一部は、DNAポリメラーゼである。いくつかの実施形態では、塩基エディターに組み込まれるNAPまたはその一部は、損傷乗り越えポリメラーゼ活性を有する。いくつかの場合では、塩基エディターに組み込まれるNAPまたはその一部は、損傷乗り越えDNAポリメラーゼである。いくつかの実施形態では、塩基エディターに組み込まれるNAPまたはその一部は、Rev7、Rev1複合体、ポリメラーゼι、ポリメラーゼκ、またはポリメラーゼηである。いくつかの実施形態では、塩基エディターに組み込まれるNAPまたはその一部は、真核生物のポリメラーゼα、β、γ、δ、ε、γ、η、ι、κ、λ、μ、またはν成分である。いくつかの実施形態では、塩基エディターに組み込まれるNAPまたはその一部は、核酸ポリメラーゼ(例えば、損傷乗り越えDNAポリメラーゼ)に対して、少なくとも75%、80%、85%、90%、95%、96%、97%、98%、99%、または99.5%の同一性であるアミノ酸配列を含む。
塩基エディターシステム
本明細書中で提供する塩基エディターシステムは:(a)対象のポリヌクレオチド(例えば、二本鎖DNAまたはRNA、一本鎖DNAまたはRNA)の標的ヌクレオチド配列を、アデノシンデアミナーゼドメイン及び少なくとも1つのガイドポリ核酸(例えば、gRNA)を含む塩基エディターシステムと接触させるステップであって、前述のドメインは、ポリヌクレオチド結合ドメインに融合されており、それにより、本明細書に記載の核酸分子内の1つ以上の塩基において変化を誘導することができる核酸塩基エディターを形成し、標的ヌクレオチド配列が標的核酸塩基対を含む、ステップ; (b)標的領域の鎖分離を誘導するステップ; (c)標的領域の一本鎖における、標的核酸塩基対の第1の核酸塩基を第2の核酸塩基に転換させるステップ、及び(d)標的領域の、1本を超えない数の鎖を切断するステップであって、第1の核酸塩基塩基に相補的な第3の核酸塩基を、第2の核酸塩基に相補的な第4の核酸塩基によって置き換える、ステップを含む。いくつかの実施形態では、ステップ(b)が省略されることが理解されるべきである。いくつかの実施形態では、標的化される核酸塩基対は、1つ以上の遺伝子における複数の核酸塩基対である。いくつかの実施形態では、本明細書中で提供する塩基エディターシステムは、1つ以上の遺伝子における複数の核酸塩基対の多重編集が可能である。いくつかの実施形態では、複数の核酸塩基対は同じ遺伝子に位置する。いくつかの実施形態では、複数の核酸塩基対は1つ以上の遺伝子に位置し、少なくとも1つの遺伝子が異なる遺伝子座に位置する。
いくつかの実施形態では、切断された一本鎖(ニックの入った鎖)が、ガイド核酸にハイブリダイズされる。いくつかの実施形態では、切断された一本鎖は、第1の核酸塩基を含む鎖の反対側である。いくつかの実施形態では、塩基エディターは、Cas9ドメインを含む。いくつかの実施形態では、第1の塩基はアデニンであり、第2の塩基はG、C、A、またはTではない。いくつかの実施形態では、第2の塩基はイノシンである。
本明細書において、塩基エディターシステムを使用して核酸塩基を編集するための系、組成物、及び方法を提供する。いくつかの実施形態では、塩基エディターシステムは、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン及び核酸塩基を編集するための核酸塩基編集ドメイン(例えば、デアミナーゼドメイン)を含む、塩基エディター(BE); ならびにポリヌクレオチドプログラム可能なヌクレオチド結合ドメインと組み合わされたガイドポリヌクレオチド(例えば、ガイドRNA)を含む。いくつかの実施形態では、塩基エディターシステムは、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン及び核酸塩基を編集するための核酸塩基編集ドメイン(例えば、デアミナーゼドメイン)を含む塩基エディター(BE)、ならびにポリヌクレオチドプログラム可能なヌクレオチド結合ドメインと組み合わされたガイドポリヌクレオチド(例えば、ガイドRNA)を含む。いくつかの実施形態では、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、ポリヌクレオチドプログラム可能なDNA結合ドメインである。いくつかの実施形態では、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、ポリヌクレオチドプログラム可能なRNA結合ドメインである。いくつかの場合では、デアミナーゼドメインは、アデニンデアミナーゼまたはアデノシンデアミナーゼであり得る。いくつかの実施形態では、用語「アデニンデアミナーゼ」及び「アデノシンデアミナーゼ」は、同じ意味で用いられ得る。いくつかの場合では、デアミナーゼドメインは、アデニンデアミナーゼまたはアデノシンデアミナーゼであり得る。
核酸塩基編集タンパク質の詳細は、国際PCT出願第PCT/2017/045381号(WO2018/027078)及び第PCT/US2016/058344号(WO2017/070632)に記載されており、これらのそれぞれは、その全体が参照により本明細書に援用される。また、Komor, A. C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533,420-424(2016); Gaudelli, N. M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017)、及びKomor, A. C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3: eaao4774 (2017)も参照されたい(その全内容は、参照により本明細書に援用される)
いくつかの実施形態では、単一のガイドポリヌクレオチドを利用して、デアミナーゼを標的核酸配列に標的指向化することができる。いくつかの実施形態では、ガイドポリヌクレオチドの単一のペアを利用して、異なるデアミナーゼを標的核酸配列に標的指向化することができる。
塩基エディターシステムの核酸塩基成分及びポリヌクレオチドプログラム可能なヌクレオチド結合成分は、共有結合または非共有結合で互いに会合し得る。例えば、いくつかの実施形態では、デアミナーゼドメインを、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインによって標的ヌクレオチド配列に標的指向化することができる。いくつかの実施形態では、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインを、デアミナーゼドメインに融合または連結することができる。いくつかの実施形態では、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、デアミナーゼドメインと非共有結合的に相互作用させるか、または会合させることによって、デアミナーゼドメインを標的ヌクレオチド配列に標的指向化することができる。例えば、いくつかの実施形態では、核酸塩基編集成分、例えば、デアミナーゼ成分は、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインの一部である追加の異種部分またはドメインと相互作用するか、会合するか、または複合体を形成することができる追加の異種部分またはドメインを含み得る。いくつかの実施形態では、追加の異種部分は、ポリペプチドと結合するか、相互作用するか、会合するか、または複合体を形成することができてもよい。いくつかの実施形態では、追加の異種部分は、ポリヌクレオチドと結合するか、相互作用するか、会合するか、または複合体を形成することができてもよい。いくつかの実施形態では、追加の異種部分は、ガイドポリヌクレオチドと結合することができてもよい。いくつかの実施形態では、追加の異種部分は、ポリペプチドリンカーと結合することができてもよい。いくつかの実施形態では、追加の異種部分は、ポリヌクレオチドリンカーと結合することができてもよい。追加の異種部分は、タンパク質ドメインであり得る。いくつかの実施形態では、追加の異種部分は、Kホモロジー(KH)ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、ステライルαモチーフ、テロメラーゼKu結合モチーフ及びKuタンパク質、テロメラーゼSm7結合モチーフ及びSm7タンパク質、またはRNA認識モチーフであり得る。
塩基エディターシステムは、ガイドポリヌクレオチド成分をさらに含み得る。塩基エディターシステムの成分は、共有結合、非共有結合相互作用、またはそれらの会合及び相互作用の任意の組み合わせを介して互いに会合し得ることが理解されるべきである。いくつかの実施形態では、デアミナーゼドメインを、ガイドポリヌクレオチドによって標的ヌクレオチド配列に標的指向化することができる。例えば、いくつかの実施形態では、塩基エディターシステムの核酸塩基編集成分、例えば、デアミナーゼ成分は、ガイドポリヌクレオチドの一部またはセグメント(例えば、ポリヌクレオチドモチーフ)と相互作用するか、会合するか、または複合体を形成することができる追加の異種部分またはドメイン(例えば、RNAまたはDNA結合タンパク質などのポリヌクレオチド結合ドメイン)を含み得る。いくつかの実施形態では、追加の異種部分またはドメイン(例えば、RNAまたはDNA結合タンパク質などのポリヌクレオチド結合ドメイン)を、デアミナーゼドメインに融合または連結することができる。いくつかの実施形態では、追加の異種部分は、ポリペプチドと結合するか、相互作用するか、会合するか、または複合体を形成することができてもよい。いくつかの実施形態では、追加の異種部分は、ポリヌクレオチドと結合するか、相互作用するか、会合するか、または複合体を形成することができてもよい。いくつかの実施形態では、追加の異種部分は、ガイドポリヌクレオチドと結合することができてもよい。いくつかの実施形態では、追加の異種部分は、ポリペプチドリンカーと結合することができてもよい。いくつかの実施形態では、追加の異種部分は、ポリヌクレオチドリンカーと結合することができてもよい。追加の異種部分は、タンパク質ドメインであり得る。いくつかの実施形態では、追加の異種部分は、Kホモロジー(KH)ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、ステライルαモチーフ、テロメラーゼKu結合モチーフ及びKuタンパク質、テロメラーゼSm7結合モチーフ及びSm7タンパク質、またはRNA認識モチーフであり得る。
いくつかの実施形態では、塩基エディターシステムは、塩基除去修復(BER)成分の阻害剤をさらに含み得る。塩基エディターシステムの成分は、共有結合、非共有結合相互作用、またはそれらの会合及び相互作用の任意の組み合わせを介して互いに会合し得ることが理解されるべきである。BER成分の阻害剤は、塩基除去修復阻害剤を含み得る。いくつかの実施形態では、塩基除去修復の阻害剤は、ウラシルDNAグリコシラーゼ阻害剤(UGI)であり得る。いくつかの実施形態では、塩基除去修復の阻害剤は、イノシン塩基除去修復阻害剤であり得る。いくつかの実施形態では、塩基除去修復の阻害剤は、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインによって標的ヌクレオチド配列に標的指向化することができる。いくつかの実施形態では、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインを、塩基除去修復の阻害剤に融合または連結することができる。いくつかの実施形態では、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインを、デアミナーゼドメイン及び塩基除去修復の阻害剤に融合または連結することができる。いくつかの実施形態では、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、塩基除去修復の阻害剤と非共有結合的に相互作用するか、または会合することによって、塩基除去修復の阻害剤を標的ヌクレオチド配列に標的指向化することができる。例えば、いくつかの実施形態では、塩基除去修復成分の阻害剤は、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインの一部である追加の異種部分またはドメインと相互作用するか、会合するか、または複合体を形成することができる追加の異種部分またはドメインを含み得る。いくつかの実施形態では、塩基除去修復の阻害剤は、ガイドポリヌクレオチドによって標的ヌクレオチド配列に標的指向化することができる。例えば、いくつかの実施形態では、塩基除去修復の阻害剤は、ガイドポリヌクレオチドの一部またはセグメント(例えば、ポリヌクレオチドモチーフ)と相互作用するか、会合するか、または複合体を形成することができる追加の異種部分またはドメイン(例えば、RNAまたはDNA結合タンパク質などのポリヌクレオチド結合ドメイン)を含み得る。いくつかの実施形態では、ガイドポリヌクレオチドの追加の異種部分またはドメイン(例えば、RNAまたはDNA結合タンパク質などのポリヌクレオチド結合ドメイン)を、塩基除去修復の阻害剤に融合または連結することができる。いくつかの実施形態では、追加の異種部分は、ポリヌクレオチドと結合するか、相互作用するか、会合するか、または複合体を形成することができてもよい。いくつかの実施形態では、追加の異種部分は、ガイドポリヌクレオチドと結合することができてもよい。いくつかの実施形態では、追加の異種部分は、ポリペプチドリンカーと結合することができてもよい。いくつかの実施形態では、追加の異種部分は、ポリヌクレオチドリンカーと結合することができてもよい。追加の異種部分は、タンパク質ドメインであり得る。いくつかの実施形態では、追加の異種部分は、Kホモロジー(KH)ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、ステライルαモチーフ、テロメラーゼKu結合モチーフ及びKuタンパク質、テロメラーゼSm7結合モチーフ及びSm7タンパク質、またはRNA認識モチーフであり得る。
いくつかの実施形態では、塩基エディターは、編集鎖の塩基除去修復を阻害する。いくつかの実施形態では、塩基エディターは、非編集鎖を保護または結合する。いくつかの実施形態では、塩基エディターは、UGI活性を含む。いくつかの実施形態では、塩基エディターは、触媒的に不活性なイノシン特異的ヌクレアーゼを含む。いくつかの実施形態では、塩基エディターは、ニッカーゼ活性を含む。いくつかの実施形態では、意図する塩基対の編集は、PAM部位の上流である。いくつかの実施形態では、意図する塩基対の編集は、PAM部位の、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド上流である。いくつかの実施形態では、意図する塩基対の編集は、PAM部位の下流である。いくつかの実施形態では、意図する塩基対の編集は、PAM部位の、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド下流である。
いくつかの実施形態では、方法は、標準(例えば、NGG)PAM部位を必要としない。いくつかの実施形態では、核酸塩基エディターは、リンカーまたはスペーサーを含む。いくつかの実施形態では、リンカーまたはスペーサーは、1~25アミノ酸長である。いくつかの実施形態では、リンカーまたはスペーサーは、5~20アミノ酸長である。いくつかの実施形態では、リンカーまたはスペーサーは、10、11、12、13、14、15、16、17、18、19、または20アミノ酸長である。
いくつかの実施形態では、標的領域は、標的ウィンドウを含み、標的ウィンドウは、標的核酸塩基対を含む。いくつかの実施形態では、標的ウィンドウは、1~10ヌクレオチドを含む。いくつかの実施形態では、標的ウィンドウは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド長である。いくつかの実施形態では、意図する塩基対の編集は、標的ウィンドウ内である。いくつかの実施形態では、標的ウィンドウは、意図する塩基対の編集を含む。いくつかの実施形態では、方法を、本明細書中で提供する塩基エディターのいずれかを使用して実施する。いくつかの実施形態では、標的ウィンドウは脱アミノ化ウィンドウである。
いくつかの実施形態では、アデノシン塩基エディター(ABE)は、DNA中のアデニンを脱アミノ化することができる。いくつかの実施形態では、ABEは、BE3のAPOBEC1成分を、天然または改変E. coli TadA、ヒトADAR2、マウスADA、またはヒトADAT2で置き換えることによって生成される。いくつかの実施形態では、ABEは、進化されたTadAバリアントを含む。いくつかの実施形態では、ABEは、ABE1.2(TadA*-XTEN-nCas9-NLS)である。いくつかの実施形態では、TadA*は、A106V及びD108N変異を含む。
いくつかの実施形態では、ABEは、第2世代のABEである。いくつかの実施形態では、ABEはABE2.1であり、これは、TadA*に追加の変異D147Y及びE155Vを含む(TadA*2.1)。いくつかの実施形態では、ABEはABE2.2であり、これは、触媒的に不活性化されたバージョンのヒトアルキルアデニンDNAグリコシラーゼ(E125Q変異を含むAAG)と融合させたABE2.1である。いくつかの実施形態では、ABEはABE2.3であり、これは、E. coli Endo Vの触媒的に不活性化されたバージョン(D35A変異で不活化した)に融合させたABE2.1である。いくつかの実施形態では、ABEはABE2.6であり、これは、ABE2.1のリンカーの2倍の長さのリンカー(32アミノ酸、(SGGS)2-XTEN-(SGGS)2)を有する。いくつかの実施形態では、ABEはABE2.7であり、これは、追加の野生型TadA単量体でつながれたABE2.1である。いくつかの実施形態では、ABEはABE2.8であり、これは、追加のTadA*2.1単量体でつながれたABE2.1である。いくつかの実施形態では、ABEは、ABE2.9であり、これは、ABE2.1のN末端への、進化されたTadA (TadA*2.1)の直接融合体である。いくつかの実施形態では、ABEはABE2.10であり、ABE2.1のN末端への野生型TadAの直接融合体である。いくつかの実施形態では、ABEはABE2.11であり、これは、TadA*単量体のN末端に不活性化E59A変異を有するABE2.9である。いくつかの実施形態では、ABEはABE2.12であり、内部TadA*単量体に不活性化E59A変異を有するABE2.9である。
いくつかの実施形態では、ABEは、第3世代のABEである。いくつかの実施形態では、ABEはABE3.1であり、これは、3つの追加のTadA変異(L84F、H123Y、及びI156F)を有するABE2.3である。
いくつかの実施形態では、ABEは、第4世代のABEである。いくつかの実施形態では、ABEはABE4.3であり、これは、追加のTadA変異A142N(TadA*4.3)を有するABE3.1である。
いくつかの実施形態では、ABEは、第5世代のABEである。いくつかの実施形態では、ABEはABE5.1であり、これは、生存クローン由来の変異のコンセンサスセット(H36L、R51L、S146C、及びK157N)を、ABE3.1に取り入れることによって生成される。いくつかの実施形態では、ABEは、進化されたTadA*に内部で融合させた野生型E. coli TadAを含むヘテロ二量体構築物を有するABE5.3である。いくつかの実施形態では、ABEは、以下の表9に示すように、ABE5.2、ABE5.4、ABE5.5、ABE5.6、ABE5.7、ABE5.8、ABE5.9、ABE5.10、ABE5.11、ABE5.12、ABE5.13、またはABE5.14である。いくつかの実施形態では、ABEは、第6世代ABEである。いくつかの実施形態では、ABEは、以下の表9に示すように、ABE6.1、ABE6.2、ABE6.3、ABE6.4、ABE6.5、またはABE6.6である。いくつかの実施形態では、ABEは、第7世代のABEである。いくつかの実施形態では、ABEは、以下の表9に示すように、ABE7.1、ABE7.2、ABE7.3、ABE7.4、ABE7.5、ABE7.6、ABE7.7、ABE7.8、ABE7.9、またはABE7.10である。
Figure 2022546608000071

Figure 2022546608000072
いくつかの実施形態では、塩基エディターは、第8世代のABE (ABE8)である。いくつかの実施形態では、ABE8は、TadA*8バリアントを含む。いくつかの実施形態では、ABE8は、TadA*8バリアント(「ABE8.x-m」)を含む単量体構築物を含む。いくつかの実施形態では、ABE8はABE8.1-mであり、これは、Y147T変異を有するTadA*7.10 (TadA*8.1)を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8.2-mであり、これは、Y147R変異を有するTadA*7.10 (TadA*8.2)を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8.3-mであり、これは、Q154S変異を有するTadA*7.10 (TadA*8.3)を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8.4-mであり、これは、Y123H変異を有するTadA*7.10 (TadA*8.4)を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8.5-mであり、これは、V82S変異を有するTadA*7.10 (TadA*8.5)を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8.6-mであり、これは、T166R変異を有するTadA*7.10 (TadA*8.6)を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8.7-mであり、これは、Q154R変異を有するTadA*7.10 (TadA*8.7)を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8.8-mであり、これは、Y147R、Q154R、及びY123H変異を有するTadA*7.10 (TadA*8.8)を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8.9-mであり、これは、Y147R、Q154R、及びI76Y変異を有するTadA*7.10 (TadA*8.9)を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8.10-mであり、これは、Y147R、Q154R、及びT166R変異を有するTadA*7.10 (TadA*8.10)を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8.11-mであり、これは、Y147T及びQ154R変異を有するTadA*7.10 (TadA*8.11)を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8.12-mであり、これは、Y147T及びQ154S変異を有するTadA*7.10 (TadA*8.12)を含む単量体構築物を有する。
いくつかの実施形態では、ABE8はABE8.13-mであり、これは、Y123H(H123Yから逆戻りしたY123H)、Y147R、Q154R及びI76Y変異を有するTadA*7.10 (TadA*8.13)を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8.14-mであり、これは、I76Y及びV82S変異を有するTadA*7.10 (TadA*8.14)を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8.15-mであり、これは、V82S及びY147R変異を有するTadA*7.10 (TadA*8.15)を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8.16-mであり、これは、V82S、Y123H(H123Yから逆戻りしたY123H)及びY147R変異を有するTadA*7.10 (TadA*8.16)を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8.17-mであり、これは、V82S及びQ154R変異を有するTadA*7.10 (TadA*8.17)を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8.18-mであり、これは、V82S、Y123H(H123Yから逆戻りしたY123H)及びQ154R変異を有するTadA*7.10 (TadA*8.18)を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8.19-mであり、これは、V82S、Y123H(H123Yから逆戻りしたY123H)、Y147R及びQ154R変異を有するTadA*7.10 (TadA*8.19)を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8.20-mであり、これは、I76Y、V82S、Y123H(H123Yから逆戻りしたY123H)、Y147R及びQ154R変異を有するTadA*7.10 (TadA*8.20)を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8.21-mであり、これは、Y147R及びQ154S変異を有するTadA*7.10 (TadA*8.21)を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8.22-mであり、これは、V82S及びQ154S変異を有するTadA*7.10 (TadA*8.22)を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8.23-mであり、これは、V82S及びY123H(H123Yから逆戻りしたY123H)変異を有するTadA*7.10 (TadA*8.23)を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8.24-mであり、これは、V82S、Y123H(H123Yから逆戻りしたY123H)、及びY147T変異を有するTadA*7.10 (TadA*8.24)を含む単量体構築物を有する。
いくつかの実施形態では、ABE8は、TadA*8バリアントに融合させた野生型E. coli TadAを含むヘテロ二量体構築物(「ABE8.x-d」)を有する。いくつかの実施形態では、ABE8はABE8.1-dであり、これは、Y147T変異を有するTadA*7.10 (TadA*8.1)に融合させた野生型E. coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.2-dであり、これは、Y147R変異を有するTadA*7.10 (TadA*8.2)に融合させた野生型E. coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.3-dであり、これは、Q154S変異を有するTadA*7.10 (TadA*8.3)に融合させた野生型E. coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.4-dであり、これは、Y123H変異を有するTadA*7.10 (TadA*8.4)に融合させた野生型E. coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.5-dであり、これは、V82S変異を有するTadA*7.10 (TadA*8.5)に融合させた野生型E. coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.6-dであり、これは、T166R変異を有するTadA*7.10 (TadA*8.6)に融合させた野生型E. coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.7-dであり、これは、Q154R変異を有するTadA*7.10 (TadA*8.7)に融合させた野生型E. coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.8-dであり、これは、Y147R、Q154R、及びY123H変異を有するTadA*7.10 (TadA*8.8)に融合させた野生型E. coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.9-dであり、これは、Y147R、Q154R及びI76Y変異を有するTadA*7.10 (TadA*8.9)に融合させた野生型E. coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.10-dであり、これは、Y147R、Q154R、及びT166R変異を有するTadA*7.10 (TadA*8.10)に融合させた野生型E. coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.11-dであり、これは、Y147T及びQ154R変異を有するTadA*7.10 (TadA*8.11)に融合させた野生型E. coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.12-dであり、これは、Y147T及びQ154S変異を有するTadA*7.10 (TadA*8.12)に融合させた野生型E. coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.13-dであり、これは、Y123H(H123Yから逆戻りしたY123H)、Y147R、Q154R及びI76Y変異を有するTadA*7.10 (TadA*8.13)に融合させた野生型E. coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.14-dであり、これは、I76Y及びV82S変異を有するTadA*7.10 (TadA*8.14)に融合させた野生型E. coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.15-dであり、これは、V82S及びY147R変異を有するTadA*7.10 (TadA*8.15)に融合させた野生型E. coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.16-dであり、これは、V82S、Y123H(H123Yから逆戻りしたY123H)及びY147R変異を有するTadA*7.10 (TadA*8.16)に融合させた野生型E. coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.17-dであり、これは、V82S及びQ154R変異を有するTadA*7.10 (TadA*8.17)に融合させた野生型E. coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.18-dであり、これは、V82S、Y123H(H123Yから逆戻りしたY123H)及びQ154R変異を有するTadA*7.10 (TadA*8.18)に融合させた野生型E. coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.19-dであり、これは、V82S、Y123H(H123Yから逆戻りしたY123H)、Y147R及びQ154R変異を有するTadA*7.10 (TadA*8.19)に融合させた野生型E. coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.20-dであり、これは、I76Y、V82S、Y123H(H123Yから逆戻りしたY123H)、Y147R及びQ154R変異を有するTadA*7.10 (TadA*8.20)に融合させた野生型E. coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.21-dであり、これは、Y147T及びQ154S変異を有するTadA*7.10 (TadA*8.21)に融合させた野生型E. coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.22-dであり、これは、V82S及びQ154S変異を有するTadA*7.10 (TadA*8.22)に融合させた野生型E. coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.23-dであり、これは、V82S及びY123H(H123Yから逆戻りしたY123H)変異を有するTadA*7.10 (TadA*8.23)に融合させた野生型E. coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.24-dであり、これは、V82S、Y123H(H123Yから逆戻りしたY123H)、及びY147T変異を有するTadA*7.10 (TadA*8.24)に融合させた野生型E. coli TadAを含むヘテロ二量体構築物を有する。
いくつかの実施形態では、ABE8は、TadA*8バリアントに融合させたTadA*7.10を含むヘテロ二量体構築物(「ABE8.x-7」)を有する。いくつかの実施形態では、ABE8はABE8.1-7であり、これは、Y147T変異を有するTadA*7.10 (TadA*8.1)に融合させたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.2-7であり、これは、Y147R変異を有するTadA*7.10 (TadA*8.2)に融合させたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.3-7であり、これは、Q154S変異を有するTadA*7.10 (TadA*8.3)に融合させたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.4-7であり、これは、Y123H変異を有するTadA*7.10 (TadA*8.4)に融合させたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.5-7であり、これは、V82S変異を有するTadA*7.10 (TadA*8.5)に融合させたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.6-7であり、これは、T166R変異を有するTadA*7.10 (TadA*8.6)に融合させたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.7-7であり、これは、Q154R変異を有するTadA*7.10 (TadA*8.7)に融合させたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.8-7であり、これは、Y147R、Q154R、及びY123H変異を有するTadA*7.10 (TadA*8.8)に融合させたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.9-7であり、これは、Y147R、Q154R及びI76Y変異を有するTadA*7.10 (TadA*8.9)に融合させたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.10-7であり、これは、Y147R、Q154R、及びT166R変異を有するTadA*7.10 (TadA*8.10)に融合させたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.11-7であり、これは、Y147T及びQ154R変異を有するTadA*7.10 (TadA*8.11)に融合させたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.12-7であり、これは、Y147T及びQ154S変異を有するTadA*7.10 (TadA*8.12)に融合させたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.13-7であり、これは、Y123H(H123Yから逆戻りしたY123H)、Y147R、Q154R及びI76Y変異を有するTadA*7.10 (TadA*8.13)に融合させたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.14-7であり、これは、I76Y及びV82S変異を有するTadA*7.10 (TadA*8.14)に融合させたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.15-7であり、これは、V82S及びY147R変異を有するTadA*7.10 (TadA*8.15)に融合させたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.16-7であり、これは、V82S、Y123H(H123Yから逆戻りしたY123H)及びY147R変異を有するTadA*7.10 (TadA*8.16)に融合させたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.17-7であり、これは、V82S及びQ154R変異を有するTadA*7.10 (TadA*8.17)に融合させたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.18-7であり、これは、V82S、Y123H(H123Yから逆戻りしたY123H)及びQ154R変異を有するTadA*7.10 (TadA*8.18)に融合させたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.19-7であり、これは、V82S、Y123H(H123Yから逆戻りしたY123H)、Y147R及びQ154R変異を有するTadA*7.10 (TadA*8.19)に融合させたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.20-7であり、これは、I76Y、V82S、Y123H(H123Yから逆戻りしたY123H)、Y147R及びQ154R変異を有するTadA*7.10 (TadA*8.20)に融合させたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.21-7であり、これは、Y147R及びQ154S変異を有するTadA*7.10 (TadA*8.21)に融合させたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.22-7であり、これは、V82S及びQ154S変異を有するTadA*7.10 (TadA*8.22)に融合させたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.23-7であり、これは、V82S及びY123H(H123Yから逆戻りしたY123H)変異を有するTadA*7.10 (TadA*8.23)に融合させたTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8.24-7であり、これは、V82S、Y123H(H123Yから逆戻りしたY123H)、及びY147T変異を有するTadA*7.10 (TadA*8.24)に融合させたTadA*7.10を含むヘテロ二量体構築物を有する。
いくつかの実施形態では、ABEは、以下の表10に示すように、ABE8.1-m、ABE8.2-m、ABE8.3-m、ABE8.4-m、ABE8.5-m、ABE8.6-m、ABE8.7-m、ABE8.8-m、ABE8.9-m、ABE8.10-m、ABE8.11-m、ABE8.12-m、ABE8.13-m、ABE8.14-m、ABE8.15-m、ABE8.16-m、ABE8.17-m、ABE8.18-m、ABE8.19-m、ABE8.20-m、ABE8.21-m、ABE8.22-m、ABE8.23-m、ABE8.24-m、ABE8.1-d、ABE8.2-d、ABE8.3-d、ABE8.4-d、ABE8.5-d、ABE8.6-d、ABE8.7-d、ABE8.8-d、ABE8.9-d、ABE8.10-d、ABE8.11-d、ABE8.12-d、ABE8.13-d、ABE8.14-d、ABE8.15-d、ABE8.16-d、ABE8.17-d、ABE8.18-d、ABE8.19-d、ABE8.20-d、ABE8.21-d、ABE8.22-d、ABE8.23-d、またはABE8.24-dである。
Figure 2022546608000073

Figure 2022546608000074
いくつかの実施形態では、ABE8はABE8a-mであり、これは、R26C、A109S、T111R、D119N、H122N、Y147D、F149Y、T166I、及びD167N変異を有するTadA*7.10 (TadA*8a)を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8b-mであり、これは、V88A、A109S、T111R、D119N、H122N、F149Y、T166I、及びD167N変異を有するTadA*7.10 (TadA*8b)を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8c-mであり、これは、R26C、A109S、T111R、D119N、H122N、F149Y、T166I、及びD167N変異を有するTadA*7.10 (TadA*8c)を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8d-mであり、これは、V88A、T111R、D119N、及びF149Y変異を有するTadA*7.10 (TadA*8d)を含む単量体構築物を有する。いくつかの実施形態では、ABE8はABE8e-mであり、これは、A109S、T111R、D119N、H122N、Y147D、F149Y、T166I、及びD167N変異を有するTadA*7.10 (TadA*8e)を含む単量体構築物を有する。
いくつかの実施形態では、ABE8はABE8a-dであり、これは、R26C、A109S、T111R、D119、H122N、Y147D、F149Y、T166I、及びD167N変異を有するTadA*7.10 (TadA*8a)に融合した野生型E. coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8b-dであり、これは、V88A、A109S、T111R、D119N、H122N、F149Y、T166I、及びD167N変異を有するTadA*7.10 (TadA*8b)に融合した野生型E. coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8c-dであり、これは、R26C、A109S、T111R、D119N、H122N、F149Y、T166I、及びD167N変異を有するTadA*7.10 (TadA*8c)に融合した野生型E. coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8d-dであり、これは、V88A、T111R、D119N、及びF149Y変異を有するTadA*7.10 (TadA*8d)に融合した野生型E. coli TadAを含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8e-dであり、これは、A109S、T111R、D119N、H122N、Y147D、F149Y、T166I、及びD167N変異を有するTadA*7.10 (TadA*8e)に融合した野生型E. coli TadAを含むヘテロ二量体構築物を有する。
いくつかの実施形態では、ABE8は、ABE8a-7であり、これは、R26C、A109S、T111R、D119、H122N、Y147D、F149Y、T166I、及びD167N変異を有するTadA*7.10 (TadA*8a)に融合したTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8b-7であり、これは、V88A、A109S、T111R、D119N、H122N、F149Y、T166I、及びD167N変異を有するTadA*7.10 (TadA*8b)に融合したTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8c-7であり、これは、R26C、A109S、T111R、D119N、H122N、F149Y、T166I、及びD167N変異を有するTadA*7.10 (TadA*8c)に融合したTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8d-7であり、これは、V88A、T111R、D119N、及びF149Y変異を有するTadA*7.10 (TadA*8d)に融合したTadA*7.10を含むヘテロ二量体構築物を有する。いくつかの実施形態では、ABE8はABE8e-7であり、これは、A109S、T111R、D119N、H122N、Y147D、F149Y、T166I、及びD167N変異を有するTadA*7.10 (TadA*8e)に融合したTadA*7.10を含むヘテロ二量体構築物を有する。
いくつかの実施形態では、ABEは、以下の表11に示すように、ABE8a-m、ABE8b-m、ABE8c-m、ABE8d-m、ABE8e-m、ABE8a-d、ABE8b-d、ABE8c-d、ABE8d-d、またはABE8e-dである。いくつかの実施形態では、ABEは、ABE8e-mまたはABE8e-dである。ABE8eは、SpCas9以外のCas相同体、例えば、SaCas9、SaCas9-KKH、Cas12a相同体、例えば、LbCas12a、enAs-Cas12a、SpCas9-NG及び循環置換CP1028-SpCas9及びCP1041-SpCas9と共に使用する場合、効率的なアデニン塩基編集活性及び低いインデル形成を示す。表11のABE8eに示されている変異に加えて、TadAドメインにV106W置換を導入することにより、オフターゲットRNA及びDNA編集が減少した(M. Richter et al., 2020, Nature Biotechnology, doi.org/10.1038/s41587-020-0453-zに記載されているように(その全内容は参照により本明細書に援用される))。
Figure 2022546608000075
いくつかの実施形態では、塩基エディター(例えば、ABE9)は、アデノシンデアミナーゼバリアント(例えば、TadA*9)を、循環置換体Cas9(例えば、CP5またはCP6)及びバイパータイト核局在化配列を含む骨格にクローニングすることによって生成される。いくつかの実施形態では、塩基エディター(例えば、ABE7.9、ABE7.10、ABE8、またはABE9)は、NGC PAM CP5バリアント(S. pyrogenes Cas9またはspVRQR Cas9)である。いくつかの実施形態では、塩基エディター(例えば、ABE7.9、ABE7.10、ABE8、またはABE9)は、AGA PAM CP5バリアント(S. pyrogenes Cas9またはspVRQR Cas9)である。いくつかの実施形態では、塩基エディター(例えば、ABE7.9、ABE7.10、またはABE8)は、NGC PAM CP6バリアント(S. pyrogenes Cas9またはspVRQR Cas9)である。いくつかの実施形態では、塩基エディター(例えば、ABE7.9、ABE7.10、またはABE8)は、AGA PAM CP6バリアント(S. pyrogenes Cas9またはspVRQR Cas9)である。
いくつかの実施形態では、ABEは、以下の表12に示すような遺伝子型を有する。
Figure 2022546608000076
以下の表13に示すように、40種類のABE8の遺伝子型を記載する。ABEの進化されたE. coli TadA部分における残基位置を示す。ABE7.10の変異と異なる場合のABE8における変異の変化を示している。いくつかの実施形態では、ABEは、以下の表13に示すようなABEのうちの1つの遺伝子型を有する。
Figure 2022546608000077

Figure 2022546608000078
いくつかの実施形態では、塩基エディターはABE8.1であり、アデノシンデアミナーゼ活性を有する以下の配列もしくはその断片を含むか、または本質的にそれらからなる:
ABE8.1_Y147T_CP5_NGC PAM_単量体
Figure 2022546608000079
上記の配列中、平文はアデノシンデアミナーゼ配列を示し、太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線が引かれた配列はバイパータイト核局在化配列を示す。
いくつかの実施形態では、塩基エディターはABE8.1であり、アデノシンデアミナーゼ活性を有する以下の配列もしくはその断片を含むか、または本質的にそれらからなる:
pNMG-B335 ABE8.1_Y147T_CP5_NGC PAM_単量体
Figure 2022546608000080
上記の配列中、平文はアデノシンデアミナーゼ配列を示し、太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線が引かれた配列はバイパータイト核局在化配列を示す。
いくつかの実施形態では、塩基エディターはABE8.14であり、アデノシンデアミナーゼ活性を有する以下の配列もしくはその断片を含むか、または本質的にそれらからなる:
NGC PAM CP5を有するpNMG-357_ABE8.14
Figure 2022546608000081
上記の配列中、平文はアデノシンデアミナーゼ配列を示し、太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線が引かれた配列はバイパータイト核局在化配列を示す。
いくつかの実施形態では、塩基エディターはABE8.8-mであり、アデノシンデアミナーゼ活性を有する以下の配列もしくはその断片を含むか、または本質的にそれらからなる:
ABE8.8-m
Figure 2022546608000082
上記の配列中、平文はアデノシンデアミナーゼ配列を示し、太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線が引かれた配列はバイパータイト核局在化配列を示し、二重下線の配列は変異を示す。
いくつかの実施形態では、塩基エディターはABE8.8-dであり、アデノシンデアミナーゼ活性を有する以下の配列もしくはその断片を含むか、または本質的にそれらからなる:
ABE8.8-d
Figure 2022546608000083
上記の配列中、平文はアデノシンデアミナーゼ配列を示し、太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線が引かれた配列はバイパータイト核局在化配列を示し、二重下線の配列は変異を示す。
いくつかの実施形態では、塩基エディターはABE8.13-mであり、アデノシンデアミナーゼ活性を有する以下の配列もしくはその断片を含むか、または本質的にそれらからなる:
ABE8.13-m
Figure 2022546608000084
上記の配列中、平文はアデノシンデアミナーゼ配列を示し、太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線が引かれた配列はバイパータイト核局在化配列を示し、二重下線の配列は変異を示す。
いくつかの実施形態では、塩基エディターはABE8.13-dであり、アデノシンデアミナーゼ活性を有する以下の配列もしくはその断片を含むか、または本質的にそれらからなる:
ABE8.13-d
Figure 2022546608000085
上記の配列中、平文はアデノシンデアミナーゼ配列を示し、太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線が引かれた配列はバイパータイト核局在化配列を示し、二重下線の配列は変異を示す。
いくつかの実施形態では、塩基エディターはABE8.17-mであり、アデノシンデアミナーゼ活性を有する以下の配列もしくはその断片を含むか、または本質的にそれらからなる:
ABE8.17-m
Figure 2022546608000086
上記の配列中、平文はアデノシンデアミナーゼ配列を示し、太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線が引かれた配列はバイパータイト核局在化配列を示し、二重下線の配列は変異を示す。
いくつかの実施形態では、塩基エディターはABE8.17-dであり、アデノシンデアミナーゼ活性を有する以下の配列もしくはその断片を含むか、または本質的にそれらからなる:
ABE8.17-d
Figure 2022546608000087
上記の配列中、平文はアデノシンデアミナーゼ配列を示し、太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線が引かれた配列はバイパータイト核局在化配列を示し、二重下線の配列は変異を示す。
いくつかの実施形態では、塩基エディターはABE8.20-mであり、アデノシンデアミナーゼ活性を有する以下の配列もしくはその断片を含むか、または本質的にそれらからなる:
ABE8.20-m
Figure 2022546608000088
上記の配列中、平文はアデノシンデアミナーゼ配列を示し、太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線が引かれた配列はバイパータイト核局在化配列を示し、二重下線の配列は変異を示す。
いくつかの実施形態では、塩基エディターはABE8.20-dであり、アデノシンデアミナーゼ活性を有する以下の配列もしくはその断片を含むか、または本質的にそれらからなる:
ABE8.20-d
Figure 2022546608000089
上記の配列中、平文はアデノシンデアミナーゼ配列を示し、太字の配列はCas9に由来する配列を示し、斜体の配列はリンカー配列を示し、下線が引かれた配列はバイパータイト核局在化配列を示し、二重下線の配列は変異を示す。
いくつかの実施形態では、ABE8は、以下の配列から選択される:
01. monoABE8.1_bpNLS + Y147T
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
02. monoABE8.1_bpNLS + Y147R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCRFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
03. monoABE8.1_bpNLS + Q154S
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRSVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
04. monoABE8.1_bpNLS + Y123H
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
05. monoABE8.1_bpNLS + V82S
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYSTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
06. monoABE8.1_bpNLS + T166R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSRDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
07. monoABE8.1_bpNLS + Q154R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
08. monoABE8.1_bpNLS + Y147R_Q154R_Y123H
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
09. monoABE8.1_bpNLS + Y147R_Q154R_I76Y
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
10. monoABE8.1_bpNLS + Y147R_Q154R_T166R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSRDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
11. monoABE8.1_bpNLS + Y147T_Q154R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
12. monoABE8.1_bpNLS + Y147T_Q154S
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRSVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
13. monoABE8.1_bpNLS + H123Y123H_Y147R_Q154R_I76Y
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
14. monoABE8.1_bpNLS + V82S + Q154R
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYSTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
ABE9
本明細書において、アデノシンデアミナーゼバリアントを含む第9世代の塩基エディターを提供する。本明細書の表14及び18は、新規ABE9核酸塩基エディターを提示し、アデノシンデアミナーゼバリアント(TadA*9)は、本明細書に記載のABE7*10参照配列と比較して、改変を含むアミノ酸配列を含む。表14及び18で使用される用語「単量体」とは、表14及び18に記載の改変を含むTadA*7.10の単量体形態を指す。表14及び18で使用される用語「ヘテロ二量体」とは、表14及び18に記載され、本明細書に記載されるような改変を含む、TadA*7.10に融合した特定の野生型E. coli TadAアデノシンデアミナーゼを指す。
Figure 2022546608000090

Figure 2022546608000091

Figure 2022546608000092

Figure 2022546608000093

Figure 2022546608000094

Figure 2022546608000095
いくつかの実施形態では、塩基エディターは、ウラシルグリコシラーゼ阻害剤(UGI)の全部または一部を含むドメインをさらに含む。いくつかの実施形態では、塩基エディターは、ウラシルDNAグリコシラーゼ(UDG)などのウラシル結合タンパク質(UBP)の全部または一部を含むドメインを含む。いくつかの実施形態では、塩基エディターは、核酸ポリメラーゼの全部または一部を含むドメインを含む。いくつかの実施形態では、塩基エディターに組み込まれる核酸ポリメラーゼまたはその一部は、損傷乗り越えDNAポリメラーゼである。
いくつかの実施形態では、塩基エディターのドメインは、複数のドメインを含み得る。例えば、Cas9に由来するポリヌクレオチドプログラム可能なヌクレオチド結合ドメインを含む塩基エディターは、野生型すなわち天然のCas9のRECローブ及びNUCローブに対応するRECローブ及びNUCローブを含み得る。別の例では、塩基エディターは、RuvCIドメイン、BHドメイン、REC1ドメイン、REC2ドメイン、RuvCIIドメイン、L1ドメイン、HNHドメイン、L2ドメイン、RuvCIIIドメイン、WEDドメイン、TOPOドメインまたはCTDドメインのうちの1つ以上を含み得る。いくつかの実施形態では、塩基エディターの1つ以上のドメインは、ドメインを含むポリペプチドの野生型バージョンと比較して、変異(例えば、置換、挿入、欠失)を含む。例えば、ポリヌクレオチドプログラム可能なDNA結合ドメインのHNHドメインは、H840A置換を含み得る。別の例では、ポリヌクレオチドプログラム可能なDNA結合ドメインのRuvCIドメインは、D10A置換を含み得る。
本明細書に開示する塩基エディターの異なるドメイン(例えば、隣接するドメイン)を、1つ以上のリンカードメイン(例えば、XTENリンカードメイン)を使用して、または使用せずに、互いに接続することができる。いくつかの実施形態では、リンカードメインは、2つの分子または部分、例えば、第1のドメイン(例えば、Cas9由来ドメイン)と第2のドメイン(例えば、アデノシンデアミナーゼドメイン)などの融合タンパク質の2つのドメインを連結する結合(例えば、共有結合)、化学基、または分子であり得る。いくつかの実施形態では、リンカーは、共有結合(例えば、炭素-炭素結合、ジスルフィド結合、炭素-ヘテロ原子結合など)である。特定の実施形態では、リンカーは、アミド結合の炭素窒素結合である。特定の実施形態では、リンカーは、環状または非環状、置換または非置換、分岐または非分岐脂肪族またはヘテロ脂肪族リンカーである。特定の実施形態では、リンカーは重合体である(例えば、ポリエチレン、ポリエチレングリコール、ポリアミド、ポリエステルなど)。特定の実施形態では、リンカーは、アミノアルカン酸の単量体、二量体、または重合体を含む。いくつかの実施形態では、リンカーは、アミノアルカン酸(例えば、グリシン、エタン酸、アラニン、βアラニン、3-アミノプロパン酸、4-アミノブタン酸、5-ペンタン酸など)を含む。いくつかの実施形態では、リンカーは、アミノヘキサン酸(Ahx)の単量体、二量体、または重合体を含む。特定の実施形態では、リンカーは、炭素環部分(例えば、シクロペンタン、シクロヘキサン)に基づく。他の実施形態では、リンカーは、ポリエチレングリコール部分(PEG)を含む。特定の実施形態では、リンカーは、アリールまたはヘテロアリール部分を含む。特定の実施形態では、リンカーは、フェニル環に基づく。リンカーは、ペプチドからリンカーへの求核試薬(例えば、チオール、アミノ)の結合を容易にするための官能化部分を含み得る。任意の求電子試薬をリンカーの一部として使用することができる。例示的な求電子試薬として、活性化エステル、活性化アミド、マイケルアクセプター、ハロゲン化アルキル、ハロゲン化アリール、ハロゲン化アシル、及びイソチオシアネートが挙げられるが、これらに限定されない。いくつかの実施形態では、リンカーは、Cas9ヌクレアーゼドメインを含む、RNAプログラム可能なヌクレアーゼのgRNA結合ドメインと、核酸編集タンパク質の触媒ドメインを結合する。いくつかの実施形態では、リンカーは、dCas9と第2のドメイン(例えば、UGI、シチジンデアミナーゼなど)を結合する。
通常、リンカーは、2つの基、分子、または他の部分の間に位置するか、それらに隣接し、共有結合を介してそれぞれに接続し、したがって2つを接続する。いくつかの実施形態では、リンカーは、1つのアミノ酸または複数のアミノ酸(例えば、ペプチドまたはタンパク質)である。いくつかの実施形態では、リンカーは、有機分子、基、重合体、または化学部分である。いくつかの実施形態では、リンカーは、長さが2~100アミノ酸、例えば、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30~35、35~40、40~45、45~50、50~60、60~70、70~80、80~90、90~100、100~150、または150~200アミノ酸の長さであり得る。いくつかの実施形態では、リンカーは、長さが約3~約104(例えば、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、55、60、65、70、75、80、85、90、95、または100)アミノ酸である。より長いかまたはより短いリンカーもまた企図される。いくつかの実施形態では、リンカードメインは、アミノ酸配列SGSETPGTSESATPESを含み、この配列はXTENリンカーとも呼ばれる場合がある。融合タンパク質ドメインを連結するための任意の方法を使用することができる(例えば、核酸塩基エディターの活性にとって最適な長さを達成するための、(SGGS)n、(GGGS)n、(GGGGS)n、及び(G)nの形態の非常に柔軟なリンカーから、(EAAAK)n、(GGS)n、SGSETPGTSESATPES(例えば、Guilinger JP, Thompson DB, Liu DR. Fusion of catalytically inactive Cas9 to FokI nuclease improves the specificity of genome modification. Nat. Biotechnol. 2014; 32 (6): 577-82を参照されたい。その全内容は、参照により本明細書に援用される)、または(XP)nモチーフの形態のより強固なリンカーまでの範囲で)。いくつかの実施形態では、nは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、または15である。いくつかの実施形態では、リンカーは、(GGS)nモチーフを含み、nは、1、3、または7である。いくつかの実施形態では、本明細書中で提供する融合タンパク質のCas9ドメインを、アミノ酸配列SGSETPGTSESATPESを含むリンカーを介して融合させる。いくつかの実施形態では、リンカーは、複数のプロリン残基を含み、長さが5~21、5~14、5~9、5~7アミノ酸であり、例えば、PAPAP、PAPAPA、PAPAPAP、PAPAPAPA、P(AP)4、P(AP)7、P(AP)10(例えば、Tan J, Zhang F, Karcher D, Bock R. Engineering of high-precision base editors for site-specific single nucleotide replacement. Nat Commun. 2019 Jan 25; 10 (1): 439を参照されたい; 全内容は参照により本明細書に援用される)。そのようなプロリンリッチなリンカーは、「強固な」リンカーとも呼ばれる。
別の実施形態では、塩基エディターシステムは、デアミナーゼ(DNAデアミナーゼ)、例えば、アデノシンまたはシチジンデアミナーゼと非共有結合的に相互作用し、バイスタンダーまたは標的隣接効果を最小化または低減した特異的編集のために、標的ポリヌクレオチド配列内の標的核酸塩基にアデノシンまたはシチジンデアミナーゼを一時的に引き付ける成分(タンパク質)を含む。デアミナーゼ相互作用タンパク質を含むそのような非共有結合系及び方法は、DNAデアミナーゼを特定のゲノム標的核酸塩基に引き付けるのに役立ち、オンターゲット編集と標的隣接編集の事象を切り離し、したがって、より正確な単一塩基置換変異の達成を強化する。一実施形態では、デアミナーゼ相互作用タンパク質は、デアミナーゼの活性(触媒)部位が標的核酸塩基(例えば、それぞれアデノシンまたはシチジン)に結合するのを遮断または妨害することなく、デアミナーゼ(例えば、アデノシンデアミナーゼまたはシチジンデアミナーゼ)に結合する。「MagnEdit」と呼ばれるそのような系は、Cas9とgRNAの複合体につながれた相互作用タンパク質を含み、共発現するアデノシンデアスミナーゼまたはシチジンデアスミナーゼ(外来性または内在性)を引き付けて特定のゲノム標的部位を編集することができ、これは、McCann, J. et al., 2020, “MagnEdit - interacting factors that recruit DNA-editing enzymes to single base targets,” Life-Science-Alliance, Vol.3, No.4 (e201900606), (doi 10.26508/Isa.201900606)に記載されており、その内容は、その全体が参照により本明細書に援用される。一実施形態では、DNAデアミナーゼは、本明細書に記載されるようなABE9アデノシンデアミナーゼバリアントである。別の実施形態では、「Suntag」と呼ばれる系は、例えば、Tanenbaum, M. E. et al., “A protein tagging system for signal amplification in gene expression and fluorescence imaging,” Cell. 2014 October 23; 159 (3): 635-646. doi:10.1016/j.cell.2014.09.039、及びHuang, Y.-H. et al., 2017, “DNA epigenome editing using CRISPR-Cas SunTag-directed DNMT3A,” Genome Biol 18:176. doi: 10.1186/s13059-017-1306-zに記載されているように(それぞれの内容は、その全体が参照により本明細書に援用される)、塩基エディターのタンパク質(例えば、アデノシンデアミナーゼまたはシチジンデアミナーゼ)成分、またはその複数のコピーを、ポリヌクレオチド標的部位へ動員して、隣接標的編集を低減しながら、その部位での塩基編集を達成するために使用する非共有結合的な相互作用成分を含む。一実施形態では、DNAデアミナーゼは、本明細書に記載されるようなABE9アデノシンデアミナーゼバリアントである。
リンカー
特定の実施形態では、リンカーを使用して、本発明のペプチドまたはペプチドドメインのいずれかを連結してもよい。リンカーは、共有結合のように単純であってもよく、または数原子の長さの高分子リンカーであってもよい。特定の実施形態では、リンカーは、ポリペプチドであるか、またはアミノ酸に基づく。他の実施形態では、リンカーはペプチド様ではない。他の実施形態では、リンカーは、共有結合(例えば、炭素-炭素結合、ジスルフィド結合、炭素-ヘテロ原子結合など)である。特定の実施形態では、リンカーは、アミド結合の炭素窒素結合である。特定の実施形態では、リンカーは、環状または非環状、置換または非置換、分岐または非分岐脂肪族またはヘテロ脂肪族リンカーである。特定の実施形態では、リンカーは重合体である(例えば、ポリエチレン、ポリエチレングリコール、ポリアミド、ポリエステルなど)。特定の実施形態では、リンカーは、アミノアルカン酸の単量体、二量体、または重合体を含む。特定の実施形態では、リンカーは、アミノアルカン酸(例えば、グリシン、エタン酸、アラニン、βアラニン、3-アミノプロパン酸、4-アミノブタン酸、5-ペンタン酸など)を含む。特定の実施形態では、リンカーは、アミノヘキサン酸(Ahx)の単量体、二量体、または重合体を含む。特定の実施形態では、リンカーは、炭素環部分(例えば、シクロペンタン、シクロヘキサン)に基づく。他の実施形態では、リンカーは、ポリエチレングリコール部分(PEG)を含む。他の実施形態では、リンカーは、アミノ酸を含む。特定の実施形態では、リンカーはペプチドを含む。特定の実施形態では、リンカーは、アリールまたはヘテロアリール部分を含む。特定の実施形態では、リンカーは、フェニル環に基づく。リンカーは、ペプチドからリンカーへの求核試薬(例えば、チオール、アミノ)の結合を容易にするための官能化部分を含み得る。任意の求電子試薬をリンカーの一部として使用してもよい。例示的な求電子試薬として、活性化エステル、活性化アミド、マイケルアクセプター、ハロゲン化アルキル、ハロゲン化アリール、ハロゲン化アシル、及びイソチオシアネートが挙げられるが、これらに限定されない。
いくつかの実施形態では、リンカーは、1つのアミノ酸または複数のアミノ酸(例えば、ペプチドまたはタンパク質)である。いくつかの実施形態では、リンカーは、結合(例えば、共有結合)、有機分子、基、重合体、または化学部分である。いくつかの実施形態では、リンカーは、長さが約3~約104(例えば、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、55、60、65、70、75、80、85、90、95、または100)アミノ酸である。
いくつかの実施形態では、アデノシンデアミナーゼ、ならびにnapDNAbpを、4、16、32、または104アミノ酸の長さのリンカーを介して融合させる。いくつかの実施形態では、リンカーは、約3~約104アミノ酸長である。いくつかの実施形態では、本明細書中で提供する融合タンパク質のいずれかは、リンカーを介して互いに融合したアデノシンデアミナーゼ及びCas9ドメインを含む。デアミナーゼドメイン(例えば、改変ecTadA)とCas9ドメインの間の様々なリンカーの長さ及び柔軟性を使用することができる(例えば、核酸塩基エディターの活性にとって最適な長さを達成するための、(GGGS)n、(GGGGS)n、及び(G)nの形態の非常に柔軟なリンカーから、(EAAAK)n、(SGGS)n、SGSETPGTSESATPES(例えば、Guilinger JP, Thompson DB, Liu DR. Fusion of catalytically inactive Cas9 to FokI nuclease improves the specificity of genome modification. Nat .Biotechnol. 2014; 32 (6): 577-82を参照されたい; その全内容は、参照により本明細書に援用される)、及び(XP)nの形態のより強固なリンカーまでの範囲で)。いくつかの実施形態では、nは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、または15である。いくつかの実施形態では、リンカーは、(GGS)nモチーフを含み、nは、1、3、または7である。いくつかの実施形態では、本明細書中で提供する融合タンパク質のいずれかのシチジンデアミナーゼ及びアデノシンデアミナーゼならびにCas9ドメインを、アミノ酸配列SGSETPGTSESATPESを含むリンカー(例えば、XTENリンカー)を介して融合させる。
いくつかの実施形態では、標的領域は、標的ウィンドウを含み、標的ウィンドウは、標的核酸塩基対を含む。いくつかの実施形態では、標的ウィンドウは、1~10ヌクレオチドを含む。いくつかの実施形態では、標的ウィンドウは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド長である。いくつかの実施形態では、意図する塩基対の編集は、標的ウィンドウ内である。いくつかの実施形態では、標的ウィンドウは、意図する塩基対の編集を含む。いくつかの実施形態では、方法を、本明細書中で提供する塩基エディターのいずれかを使用して実施する。いくつかの実施形態では、標的ウィンドウは脱アミノ化ウィンドウである。
さらに、いくつかの場合では、Gamタンパク質を、塩基エディターのN末端に融合させることができる。いくつかの場合では、Gamタンパク質を、塩基エディターのC末端に融合させることができる。バクテリオファージMuのGamタンパク質は、二本鎖切断(DSB)の末端に結合し、それらを分解から保護することができる。いくつかの実施形態では、Gamを使用してDSBの自由端に結合させることにより、塩基編集のプロセス中のインデル形成を低減することができる。いくつかの実施形態では、174残基のGamタンパク質を、塩基エディターのN末端に融合させる。Komor, A. C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3: eaao4774 (2017)を参照されたい。いくつかの場合では、1つ以上の変異は、野生型ドメインと比較して、塩基エディタードメインの長さを変えることができる。例えば、少なくとも1つのドメインの少なくとも1つのアミノ酸を欠失させることにより、塩基エディターの長さを短くすることができる。別の場合では、1つの変異または複数の変異は、野生型ドメインと比較して、ドメインの長さを変化させない。例えば、任意のドメインにおける置換(複数可)は、塩基エディターの長さを変化させない。
いくつかの実施形態では、本明細書中で提供する塩基編集融合タンパク質は、正確な位置、例えば、定義された領域(例えば、「脱アミノ化ウィンドウ」)内の標的塩基が位置する場所に配置される必要がある。いくつかの場合では、標的は、4塩基領域内にあり得る。いくつかの場合では、そのような定義された標的領域は、PAMのおよそ15塩基上流にあり得る。Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533,420-424(2016); Gaudelli, N. M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017); Komor, A. C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3: eaao4774 (2017)も参照されたい(その全内容は、参照により本明細書に援用される)
定義された標的領域は、脱アミノ化ウィンドウで有り得る。脱アミノ化ウィンドウは、塩基エディターが標的ヌクレオチドに作用して脱アミノ化する定義された領域であり得る。いくつかの実施形態では、脱アミノ化ウィンドウは、2、3、4、5、6、7、8、9、または10塩基領域内である。いくつかの実施形態では、脱アミノ化ウィンドウは、PAMの5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、または25塩基上流である。
本開示の塩基エディターは、標的ポリヌクレオチド配列の編集を容易にする任意のドメイン、特性、またはアミノ酸配列を含み得る。例えば、いくつかの実施形態では、塩基エディターは、核局在化配列(NLS)を含む。いくつかの実施形態では、塩基エディターのNLSを、デアミナーゼドメインとポリヌクレオチドプログラム可能なヌクレオチド結合ドメインの間に局在させる。いくつかの実施形態では、塩基エディターのNLSを、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインのC末端に局在させる。
本明細書に開示するように、塩基エディターに存在し得る他の例示的な特性は、細胞質局在化配列、核外輸送配列などの輸出配列、または他の局在化配列などの局在化配列、ならびに融合タンパク質の可溶化、精製、または検出に有用な配列タグである。本明細書中で提供する適切なタンパク質タグとして、ビオチンカルボキシラーゼキャリアタンパク質(BCCP)タグ、mycタグ、カルモジュリンタグ、FLAGタグ、ヘマグルチニン(HA)タグ、ヒスチジンタグまたはHisタグとも呼ばれるポリヒスチジンタグ、マルトース結合タンパク質(MBP)タグ、nusタグ、グルタチオン-S-トランスフェラーゼ(GST)タグ、緑色蛍光タンパク質(GFP)タグ、チオレドキシンタグ、Sタグ、Softag(例えば、Softag1、Softag3)、strepタグ、ビオチンリガーゼタグ、FlAsHタグ、V5タグ、及びSBPタグが挙げられるが、これらに限定されない。追加の適切な配列は当業者には明らかであろう。いくつかの実施形態では、融合タンパク質は、1つ以上のHisタグを含む。
融合タンパク質に含めることができるタンパク質ドメインの非限定的な例として、デアミナーゼドメイン(例えば、アデノシンデアミナーゼ)、ウラシルグリコシラーゼ阻害剤(UGI)ドメイン、エピトープタグ、及びレポーター遺伝子配列が挙げられる。
エピトープタグの非限定的な例として、ヒスチジン(His)タグ、V5タグ、FLAGタグ、インフルエンザヘマグルチニン(HA)タグ、Mycタグ、VSV-Gタグ、及びチオレドキシン(Trx)タグが挙げられる。レポーター遺伝子の例として、グルタチオン-5-トランスフェラーゼ(GST)、セイヨウワサビペルオキシダーゼ(HRP)、クロラムフェニコールアセチルトランスフェラーゼ(CAT)βガラクトシダーゼ、βグルクロニダーゼ、ルシフェラーゼ、緑色蛍光タンパク質(GFP)、HcRed、DsRed、シアン蛍光タンパク質(CFP)、黄色蛍光タンパク質(YFP)、及び青色蛍光タンパク質(BFP)を含む自己蛍光タンパク質が挙げられるが、これらに限定されない。追加のタンパク質配列として、マルトース結合タンパク質(MBP)、Sタグ、Lex A DNA結合ドメイン(DBD)融合体、GAL4 DNA結合ドメイン融合体、及び単純ヘルペスウイルス(HSV)BP16タンパク質融合体を含むがこれらに限定されない、DNA分子または他の細胞分子に結合するアミノ酸配列が挙げられ得る。
アデノシンデアミナーゼまたはシチジンデアミナーゼとCas9ドメインを含む融合タンパク質の使用方法
本開示のいくつかの態様は、本明細書中で提供する融合タンパク質または複合体の使用方法を提供する。例えば、本開示のいくつかの態様は、DNA分子を、本明細書中で提供する融合タンパク質のいずれかと、及び少なくとも1つのガイドRNAと接触させることを含む方法を提供し、ガイドRNAは、約15~100ヌクレオチド長であり、標的配列に相補的な少なくとも10連続ヌクレオチドの配列を含む。いくつかの実施形態では、標的配列の3’末端は、標準PAM配列(NGG)に直接隣接している。いくつかの実施形態では、標的配列の3’末端は、標準PAM配列(NGG)に直接隣接していない。いくつかの実施形態では、標的配列の3’末端は、AGC、GAG、TTT、GTG、またはCAA配列に直接隣接している。いくつかの実施形態では、標的配列の3’末端は、NGA、NGCG、NGN、NNGRRT、NNNRRT、NGCG、NGCN、NGTN、NGTN、NGTN、または5’(TTTV)配列に直接隣接している。
いくつかの実施形態では、本発明の融合タンパク質を、目的の標的を変異誘発するために使用する。特に、本明細書に記載のアデノシンデアミナーゼ核酸塩基エディター(またはシチジンデアミナーゼ核酸塩基エディター)は、標的配列内で複数の変異導入を行うことができる。これらの変異は、標的の機能に影響を与え得る。例えば、アデノシンデアミナーゼ核酸塩基エディターを使用して調節領域を標的化すると、調節領域の機能が変化し、下流のタンパク質の発現が低下または排除される。
それぞれの配列における特定の位置または残基の付番は、使用する特定のタンパク質及び付番スキームに依存することが理解されよう。付番は、例えば、成熟タンパク質の前駆体と成熟タンパク質自体で異なる場合があり、種ごとの配列の差異が付番に影響を与え得る。当業者であれば、当技術分野で周知の方法、例えば、配列アラインメント及び相同残基の決定によって、任意の相同タンパク質及びそれぞれのコード核酸中のそれぞれの残基を同定することができるであろう。
本明細書に開示するようなCas9ドメイン及びアデノシンデアミナーゼ(またはシチジンデアミナーゼ)を含む融合タンパク質のいずれかを、標的部位、例えば、編集しようとする変異を含む部位に標的化するために、典型的には、融合タンパク質をガイドRNA、例えばsgRNAと一緒に共発現させる必要があることは、当業者には明らかであろう。本明細書の他の場所でより詳細に説明されるように、ガイドRNAは、通常、Cas9結合を可能にするtracrRNAフレームワーク、及びCas9:核酸編集酵素/ドメイン融合タンパク質に配列特異性を与えるガイド配列を含む。あるいは、ガイドRNAとtracrRNAを、2つの核酸分子として別々に提供してもよい。いくつかの実施形態では、ガイドRNAは、ガイド配列が、標的配列に相補的な配列を含む構造を有する。ガイド配列は通常20ヌクレオチド長である。Cas9:核酸編集酵素/ドメイン融合タンパク質を特定のゲノム標的部位に標的化するための適切なガイドRNAの配列は、本開示に基づいて当業者には明らかであろう。そのような適切なガイドRNA配列は、通常、編集しようとする標的ヌクレオチドの上流または下流の50ヌクレオチド内の核酸配列に相補的なガイド配列を含む。本明細書において、提供される融合タンパク質のいずれかを特定の標的配列に標的化するのに適したいくつかの例示的なガイドRNA配列を提供する。
塩基エディターの効率
CRISPR-Cas9ヌクレアーゼは、標的ゲノム編集を媒介するために広く使用されている。多くのゲノム編集用途では、Cas9はガイドポリヌクレオチド(例えば、単一のガイドRNA(sgRNA))と複合体を形成し、sgRNA配列で指定された標的部位で二本鎖DNA切断(DSB)を誘導する。細胞は主に、非相同末端結合(NHEJ)修復経路を介してこのDSBに応答し、これにより、遺伝子を破壊するフレームシフト変異を引き起こし得る確率的挿入または欠失(インデル)が生じる。DSBに隣接する配列と高度な相同性を有するドナーDNAテンプレートが存在する場合、相同組換え修復(HDR)として知られる代替経路を介して遺伝子修正を達成することができる。残念ながら、ほとんどの非干渉条件下では、HDRは非効率的であり、細胞の状態及び細胞型に依存し、より高頻度のインデルの方が優先する。ヒトの疾患に関連する既知の遺伝的変異のほとんどは点変異であるため、より効率的かつクリーンに正確な点変異導入を行うことができる方法が必要である。本明細書中で提供する塩基エディターシステムは、二本鎖DNA切断を生成することなく、ドナーDNAテンプレートを必要とせず、そして過剰な確率的挿入及び欠失を誘発することなく、ゲノム編集を提供する新規方法を提供する。
本明細書中で提供する塩基エディターは、有意な割合のインデルを生成することなく、特定のヌクレオチド塩基を改変することができる。本明細書中で使用する場合、用語「インデル(複数可)」とは、核酸内のヌクレオチド塩基の挿入または欠失を指す。そのような挿入または欠失は、遺伝子のコード領域内のフレームシフト変異を生じさせ得る。いくつかの実施形態では、標的ヌクレオチド配列に多数の挿入または欠失(すなわち、インデル)を生成することなく、核酸内の特定のヌクレオチドを効率的に改変(例えば、変異または脱アミノ化)する塩基エディターを生成することが望ましい。特定の実施形態では、本明細書中で提供する塩基エディターのいずれも、意図する改変(例えば、点変異または脱アミノ化)を、インデルに比べてより大きな割合で生成することができる。
いくつかの実施形態では、本明細書中で提供する塩基エディターシステムのいずれかは、標的ポリヌクレオチド配列に、50%未満、40%未満、30%未満、20%未満、19%未満、18%未満、17%未満、16%未満、15%未満、14%未満、13%未満、12%未満、11%未満、10%未満、9%未満、8%未満、7%未満、6%未満、5%未満、4%未満、3%未満、2%未満、1%未満、0.9%未満、0.8%未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.09%未満、0.08%未満、0.07%未満、0.06%未満、0.05%未満、0.04%未満、0.03%未満、0.02%未満、または0.01%未満のインデル形成をもたらす。
いくつかの実施形態では、本明細書に記載のABE8またはABE9塩基エディターバリアントのうちの1つを含む塩基エディターシステムのいずれかは、標的ポリヌクレオチド配列に、50%未満、40%未満、30%未満、20%未満、19%未満、18%未満、17%未満、16%未満、15%未満、14%未満、13%未満、12%未満、11%未満、10%未満、9%未満、8%未満、7%未満、6%未満、5%未満、4%未満、3%未満、2%未満、1%未満、0.9%未満、0.8%未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.09%未満、0.08%未満、0.07%未満、0.06%未満、0.05%未満、0.04%未満、0.03%未満、0.02%未満、または0.01%未満のインデル形成をもたらす。
いくつかの実施形態では、本明細書に記載のABE8またはABE9塩基エディターバリアントの1つを含む塩基エディターシステムのいずれかは、標的ポリヌクレオチド配列に0.8%未満のインデル形成をもたらす。いくつかの実施形態では、本明細書に記載のABE8塩基エディターバリアントの1つを含む塩基エディターシステムのいずれかは、標的ポリヌクレオチド配列に多くとも0.8%のインデル形成をもたらす。いくつかの実施形態では、本明細書に記載のABE8またはABE9塩基エディターバリアントの1つを含む塩基エディターシステムのいずれかは、標的ポリヌクレオチド配列に0.3%未満のインデル形成をもたらす。いくつかの実施形態では、記載するABE8またはABE9塩基エディターバリアントの1つを含む塩基エディターシステムのいずれかは、ABE7塩基エディターの1つを含む塩基エディターシステムと比較して、標的ポリヌクレオチド配列に、より低いインデル形成をもたらす。いくつかの実施形態では、本明細書に記載のABE8またはABE9塩基エディターバリアントの1つを含む塩基エディターシステムのいずれかは、ABE7.10を含む塩基エディターシステムと比較して、標的ポリヌクレオチド配列に、より低いインデル形成をもたらす。
いくつかの実施形態では、本明細書に記載のABE8またはABE9塩基エディターバリアントの1つを含む塩基エディターシステムのいずれも、ABE7塩基エディターの1つを含む塩基エディターシステムと比較して、インデル頻度が低下している。いくつかの実施形態では、本明細書に記載のABE8またはABE9塩基エディターバリアントの1つを含む塩基エディターシステムのいずれかは、ABE7塩基エディターの1つを含む塩基エディターシステムと比較して、インデル頻度が少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、または少なくとも95%低下している。いくつかの実施形態では、本明細書に記載のABE8塩基エディターバリアントの1つを含む塩基エディターシステムは、ABE7.10を含む塩基エディターシステムと比較して、インデル頻度が少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、または少なくとも95%低下している。
本開示は、効率及び特異性が向上したアデノシンデアミナーゼバリアント(例えば、ABE8またはABE9バリアント)を提供する。特に、本明細書に記載のアデノシンデアミナーゼバリアントは、ポリヌクレオチド内の所望の塩基を編集する可能性は高く、改変することを意図していない塩基(例えば、「バイスタンダー」)を編集する可能性は低い。
いくつかの実施形態では、本明細書に記載のABE8またはABE9塩基エディターバリアントの1つを含む塩基エディターシステムのいずれかは、バイスタンダーの編集または変異が低下している。いくつかの実施形態では、意図しない編集または変異は、バイスタンダー変異またはバイスタンダー編集、例えば、標的ヌクレオチド配列の標的ウィンドウ内の意図しないまたは非標的位置での標的塩基(例えば、AまたはC)の塩基編集である。いくつかの実施形態では、本明細書に記載のABE8またはABE9塩基エディターバリアントの1つを含む塩基エディターシステムのいずれかは、ABE7塩基エディター、例えば、ABE7.10を含む塩基エディターシステムと比較して、バイスタンダー編集または変異が低下している。いくつかの実施形態では、本明細書に記載のABE8またはABE9塩基エディターバリアントの1つを含む塩基エディターシステムのいずれかは、ABE7塩基エディター、例えば、ABE7.10を含む塩基エディターシステムと比較して、バイスタンダー編集または変異が、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%低下している。いくつかの実施形態では、本明細書に記載のABE8またはABE9塩基エディターバリアントの1つを含む塩基エディターシステムのいずれかは、ABE7塩基エディター、例えば、ABE7.10を含む塩基エディターシステムと比較して、バイスタンダー編集または変異が、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、または少なくとも3.0倍低下している。
いくつかの実施形態では、本明細書に記載のABE8またはABE9塩基エディターバリアントの1つを含む塩基エディターシステムのいずれかは、スプリアス編集が低下している。いくつかの実施形態では、意図しない編集または変異とは、スプリアス変異またはスプリアス編集、例えば、ゲノムの意図しないかまたは非標的領域における標的塩基(例えば、AまたはC)の非特異的編集またはガイド非依存的編集である。いくつかの実施形態では、本明細書に記載のABE8またはABE9塩基エディターバリアントの1つを含む塩基エディターシステムのいずれかは、ABE7塩基エディター、例えば、ABE7.10を含む塩基エディターシステムと比較して、スプリアス編集が低下している。いくつかの実施形態では、本明細書に記載のABE8またはABE9塩基エディターバリアントの1つを含む塩基エディターシステムのいずれかは、ABE7塩基エディター、例えば、ABE7.10を含む塩基エディターシステムと比較して、スプリアス編集が、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%低下している。いくつかの実施形態では、本明細書に記載のABE8またはABE9塩基エディターバリアントの1つを含む塩基エディターシステムのいずれかは、ABE7塩基エディター、例えば、ABE7.10を含む塩基エディターシステムと比較して、スプリアス編集が、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、または少なくとも3.0倍低下している。
本開示のいくつかの態様は、本明細書中で提供する塩基エディターが、核酸(例えば、対象のゲノム内の核酸)において、有意な数の意図しない変異、例えば、意図しない点変異(すなわち、バイスタンダー変異)を生成することなく、点変異などの意図する変異を効率的に生成することができるという認識に基づく。いくつかの実施形態では、本明細書中で提供する塩基エディターのいずれかは、意図する変異を少なくとも0.01%生成することができる(すなわち、少なくとも0.01%の塩基編集効率で)。いくつかの実施形態では、本明細書中で提供する塩基エディターのいずれかは、意図する変異を、少なくとも0.01%、1%、2%、3%、4%、5%、10%、15%、20%、25%、30%、40%、45%、50%、60%、70%、80%、90%、95%、または99%生成することができる。
いくつかの実施形態では、本明細書に記載のABE8またはABE9塩基エディターバリアントのいずれかは、少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%の塩基編集効率を有する。いくつかの実施形態では、塩基編集効率は、細胞集団内の編集された核酸塩基の割合を計算することによって測定してもよい。いくつかの実施形態では、本明細書に記載のABE8またはABE9塩基エディターバリアントのいずれかは、細胞集団内の編集された核酸塩基の測定で、少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%の塩基編集効率を有する。
いくつかの実施形態では、本明細書に記載のABE8またはABE9塩基エディターバリアントのいずれかは、ABE7塩基エディターと比較して、より高い塩基編集効率を有する。いくつかの実施形態では、本明細書に記載のABE8またはABE9塩基エディターバリアントのいずれかは、ABE7塩基エディター、例えば、ABE7.10と比較して、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも99%、少なくとも100%、少なくとも105%、少なくとも110%、少なくとも115%、少なくとも120%、少なくとも125%、少なくとも130%、少なくとも135%、少なくとも140%、少なくとも145%、少なくとも150%、少なくとも155%、少なくとも160%、少なくとも165%、少なくとも170%、少なくとも175%、少なくとも180%、少なくとも185%、少なくとも190%、少なくとも195%、少なくとも200%、少なくとも210%、少なくとも220%、少なくとも230%、少なくとも240%、少なくとも250%、少なくとも260%、少なくとも270%、少なくとも280%、少なくとも290%、少なくとも300%、少なくとも310%、少なくとも320%、少なくとも330%、少なくとも340%、少なくとも350%、少なくとも360%、少なくとも370%、少なくとも380%、少なくとも390%、少なくとも400%、少なくとも450%、または少なくとも500%高い塩基編集効率を有する。
いくつかの実施形態では、本明細書に記載のABE8またはABE9塩基エディターバリアントのいずれかは、ABE7塩基エディター、例えば、ABE7.10と比較して、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、少なくとも3.0倍、少なくとも3.1倍、少なくとも3.2、少なくとも3.3倍、少なくとも3.4倍、少なくとも3.5倍、少なくとも3.6倍、少なくとも3.7倍、少なくとも3.8倍、少なくとも3.9倍、少なくとも4.0倍、少なくとも4.1倍、少なくとも4.2倍、少なくとも4.3倍、少なくとも4.4倍、少なくとも4.5倍、少なくとも4.6倍、少なくとも4.7倍、少なくとも4.8倍、少なくとも4.9倍、または少なくとも5.0倍高い塩基編集効率を有する。
いくつかの実施形態では、本明細書に記載のABE8またはABE9塩基エディターバリアントのいずれかは、少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%のオンターゲット塩基編集効率を有する。いくつかの実施形態では、本明細書に記載のABE8またはABE9塩基エディターバリアントのいずれかは、細胞集団内の編集された標的核酸塩基の測定で、少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%のオンターゲット塩基編集効率を有する。
いくつかの実施形態では、本明細書に記載のABE8またはABE9塩基エディターバリアントのいずれかは、ABE7塩基エディターと比較して、より高いオンターゲット塩基編集効率を有する。いくつかの実施形態では、本明細書に記載のABE8またはABE9塩基エディターバリアントのいずれかは、ABE7塩基エディター、例えば、ABE7.10と比較して、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも99%、少なくとも100%、少なくとも105%、少なくとも110%、少なくとも115%、少なくとも120%、少なくとも125%、少なくとも130%、少なくとも135%、少なくとも140%、少なくとも145%、少なくとも150%、少なくとも155%、少なくとも160%、少なくとも165%、少なくとも170%、少なくとも175%、少なくとも180%、少なくとも185%、少なくとも190%、少なくとも195%、少なくとも200%、少なくとも210%、少なくとも220%、少なくとも230%、少なくとも240%、少なくとも250%、少なくとも260%、少なくとも270%、少なくとも280%、少なくとも290%、少なくとも300%、少なくとも310%、少なくとも320%、少なくとも330%、少なくとも340%、少なくとも350%、少なくとも360%、少なくとも370%、少なくとも380%、少なくとも390%、少なくとも400%、少なくとも450%、または少なくとも500%高いオンターゲット塩基編集効率を有する。
いくつかの実施形態では、本明細書に記載のABE8またはABE9塩基エディターバリアントのいずれかは、ABE7塩基エディター、例えば、ABE7.10と比較して、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、少なくとも3.0倍、少なくとも3.1倍、少なくとも3.2倍、少なくとも3.3倍、少なくとも3.4倍、少なくとも3.5倍、少なくとも3.6倍、少なくとも3.7倍、少なくとも3.8倍、少なくとも3.9倍、少なくとも4.0倍、少なくとも4.1倍、少なくとも4.2倍、少なくとも4.3倍、少なくとも4.4倍、少なくとも4.5倍、少なくとも4.6倍、少なくとも4.7倍、少なくとも4.8倍、少なくとも4.9倍、または少なくとも5.0倍高いオンターゲット塩基編集効率を有する。
本明細書に記載のABE8またはABE9塩基エディターバリアントは、プラスミド、ベクター、LNP複合体、またはmRNAを介して宿主細胞に送達してもよい。いくつかの実施形態では、本明細書に記載のABE8またはABE9塩基エディターバリアントのいずれかを、mRNAとして宿主細胞に送達する。いくつかの実施形態では、核酸ベースの送達系、例えば、mRNAを介して送達されるABE8またはABE9塩基エディターは、編集された核酸塩基の測定で、少なくとも少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%のオンターゲット編集効率を有する。いくつかの実施形態では、mRNA系によって送達されるABE8またはABE9塩基エディターは、プラスミドまたはベクター系によって送達されるABE8またはABE9塩基エディターと比較して、より高い塩基編集効率を有する。いくつかの実施形態では、本明細書に記載のABE8またはABE9塩基エディターバリアントのいずれかは、mRNA系で送達される場合、プラスミドもしくはベクター系で送達される場合と比較して、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも99%、少なくとも100%、少なくとも105%、少なくとも110%、少なくとも115%、少なくとも120%、少なくとも125%、少なくとも130%、少なくとも135%、少なくとも140%、少なくとも145%、少なくとも150%、少なくとも155%、少なくとも160%、少なくとも165%、少なくとも170%、少なくとも175%、少なくとも180%、少なくとも185%、少なくとも190%、少なくとも195%、少なくとも200%、少なくとも210%、少なくとも220%、少なくとも230%、少なくとも240%、少なくとも250%、少なくとも260%、少なくとも270%、少なくとも280%、少なくとも290%、少なくとも300%高い、少なくとも310%、少なくとも320%、少なくとも330%、少なくとも340%、少なくとも350%、少なくとも360%、少なくとも370%、少なくとも380%、少なくとも390%、少なくとも400%、少なくとも450%、または少なくとも500%のオンターゲット編集効率を有する。いくつかの実施形態では、本明細書に記載のABE8またはABE9塩基エディターバリアントのいずれかは、mRNA系で送達される場合、プラスミドもしくはベクター系で送達される場合と比較して、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、少なくとも3.0倍、少なくとも3.1倍、少なくとも3.2倍、少なくとも3.3倍、少なくとも3.4倍、少なくとも3.5倍、少なくとも3.6倍、少なくとも3.7倍、少なくとも3.8倍、少なくとも3.9倍、少なくとも4.0倍、少なくとも4.1倍、少なくとも4.2倍、少なくとも4.3倍、少なくとも4.4倍、少なくとも4.5倍、少なくとも4.6倍、少なくとも4.7倍、少なくとも4.8倍、少なくとも4.9倍、または少なくとも5.0倍高いオンターゲット編集効率を有する。
いくつかの実施形態では、本明細書に記載のABE8またはABE9塩基エディターバリアントのうちの1つを含む塩基エディターシステムのいずれかは、標的ポリヌクレオチド配列に、50%未満、40%未満、30%未満、20%未満、19%未満、18%未満、17%未満、16%未満、15%未満、14%未満、13%未満、12%未満、11%未満、10%未満、9%未満、8%未満、7%未満、6%未満、5%未満、4%未満、3%未満、2%未満、1%未満、0.9%未満、0.8%未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.09%未満、0.08%未満、0.07%未満、0.06%未満、0.05%未満、0.04%未満、0.03%未満、0.02%未満、または0.01%未満のオフターゲット編集をもたらす。
いくつかの実施形態では、本明細書に記載のABE8またはABE9塩基エディターバリアントのいずれかは、mRNA系で送達される場合、プラスミドまたはベクター系で送達される場合と比較して、ガイドされるオフターゲット編集効率が低い。いくつかの実施形態では、本明細書に記載のABE8またはABE9塩基エディターバリアントのいずれかは、mRNA系で送達される場合、プラスミドまたはベクター系で送達される場合と比較して、ガイドされるオフターゲット編集効率が、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%低い。いくつかの実施形態では、本明細書に記載のABE8またはABE9塩基エディターバリアントのいずれかは、mRNA系で送達される場合、プラスミドまたはベクター系で送達される場合と比較して、ガイドされるオフターゲット編集効率が、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、または少なくとも3.0倍低い。いくつかの実施形態では、本明細書に記載のABE8またはABE9塩基エディターバリアントのいずれかは、mRNA系で送達される場合、プラスミドまたはベクター系で送達される場合と比較して、ガイドされるオフターゲット編集効率が、少なくとも約2.2倍低い。
いくつかの実施形態では、本明細書に記載のABE8またはABE9塩基エディターバリアントのいずれかは、mRNA系で送達される場合、プラスミドまたはベクター系で送達される場合と比較して、ガイド非依存的なオフターゲット編集効率が低い。いくつかの実施形態では、本明細書に記載のABE8またはABE9塩基エディターバリアントのいずれかは、mRNA系で送達される場合、プラスミドまたはベクター系で送達される場合と比較して、ガイド非依存的なオフターゲット編集効率が、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%低い。いくつかの実施形態では、本明細書に記載のABE8またはABE9塩基エディターバリアントのいずれかは、mRNA系で送達される場合、プラスミドまたはベクター系で送達される場合と比較して、ガイド非依存的なオフターゲット編集効率が、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、少なくとも3.0倍、少なくとも5.0倍、少なくとも10.0倍、少なくとも20.0倍、少なくとも50.0倍、少なくとも70.0倍、少なくとも100.0倍、少なくとも120.0倍、少なくとも130.0倍、または少なくとも150.0倍低い。いくつかの実施形態では、本明細書に記載のABE8またはABE9塩基エディターバリアントは、mRNA系で送達される場合、プラスミドまたはベクター系で送達される場合と比較して、ガイド非依存的なオフターゲット編集効率(例えば、スプリアスRNA脱アミノ化)が134.0倍低下する。いくつかの実施形態では、本明細書に記載のABE8またはABE9塩基エディターバリアントは、ゲノム全体でのガイド非依存的な変異率を増加させない。
本開示のいくつかの態様は、本明細書中で提供する塩基エディターが、核酸(例えば、対象のゲノム内の核酸)において、有意な数の意図しない変異、例えば、意図しない点変異を生成することなく、点変異などの意図する変異を効率的に生成することができるという認識に基づく。いくつかの実施形態では、本明細書中で提供する塩基エディターのいずれかは、意図する変異を少なくとも0.01%生成することができる(例えば、スプリアスオフターゲット編集またはバイスタンダー編集)。いくつかの実施形態では、意図される変異は、標的遺伝子における変異を改変または修正するように特別に設計された、gRNAに結合した特定の塩基エディターによって生成される変異である。本開示のいくつかの態様は、本明細書中で提供する塩基エディターが、核酸(例えば、対象のゲノム内の核酸)において、有意な数の意図しない変異を生成することなく、意図する変異を効率的に生成することができるという認識に基づく。いくつかの実施形態では、意図される変異は、意図される変異を改変または修正するように特別に設計された、gRNAに結合した特定の塩基エディターによって生成される変異である。いくつかの実施形態では、意図する変異は、終止コドン、例えば、遺伝子のコード領域内の未成熟終止コドンを生成する変異である。いくつかの実施形態では、意図する変異は、終止コドンを排除する変異である。いくつかの実施形態では、意図する変異は、遺伝子のスプライシングを改変する変異である。いくつかの実施形態では、意図する変異は、遺伝子の調節配列(例えば、遺伝子プロモーターまたは遺伝子リプレッサー)を改変する変異である。
いくつかの実施形態では、本明細書中で提供する塩基エディターは、意図する点変異とインデルとの1:1を上回る比を生成し得る。いくつかの実施形態では、本明細書中で提供する塩基エディターは、意図する点変異とインデルとの、少なくとも1.5:1、少なくとも2:1、少なくとも2.5:1、少なくとも3:1、少なくとも3.5:1、少なくとも4:1、少なくとも4.5:1、少なくとも5:1、少なくとも5.5:1、少なくとも6:1、少なくとも6.5:1、少なくとも7:1、少なくとも7.5:1、少なくとも8:1、少なくとも8.5:1、少なくとも9:1、少なくとも10:1、少なくとも11:1、少なくとも12:1、少なくとも13:1、少なくとも14:1、少なくとも15:1、少なくとも20:1、少なくとも25:1、少なくとも30:1、少なくとも40:1、少なくとも50:1、少なくとも100:1、少なくとも200:1、少なくとも300:1、少なくとも400:1、少なくとも500:1、少なくとも600:1、少なくとも700:1、少なくとも800:1、少なくとも900:1、もしくは少なくとも1000:1、またはそれ以上の比率を生成し得る。
意図する変異及びインデルの数は、例えば、国際PCT出願第PCT/2017/045381 (WO2018/027078)及びPCT/US2016/058344 (WO2017/070632); Komor, A. C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N. M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017)、及びKomor, A. C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3: eaao4774 (2017)に記載されているように、任意の適切な方法を使用して決定することができ; その全内容は、参照により本明細書に援用される。
いくつかの実施形態では、インデル頻度を計算するために、インデルが生じ得るウィンドウの両側に隣接する2つの10bp配列に対する完全一致について、配列決定リードをスキャンする。完全一致が見つからない場合、読み取り結果を分析から除外する。このインデルウィンドウの長さが参照配列と完全に一致する場合、読み取り結果を、インデルを含まないものとして分類する。インデルウィンドウが参照配列より2塩基以上長いかまたは短い場合、配列の読み取り結果を、それぞれ挿入または欠失として分類する。いくつかの実施形態では、本明細書中で提供する塩基エディターは、核酸の領域におけるインデルの形成を制限することができる。いくつかの実施形態では、領域は、塩基エディターによって標的とされるヌクレオチドにあるか、または塩基エディターによって標的とされるヌクレオチドから2、3、4、5、6、7、8、9、または10ヌクレオチド以内の領域にある。
標的ヌクレオチド領域で形成されるインデルの数は、核酸(例えば、細胞のゲノム内の核酸)を塩基エディターに曝露する時間の量に依存し得る。いくつかの実施形態では、インデルの数または割合を、標的ヌクレオチド配列(例えば、細胞のゲノム内の核酸)を塩基エディターに曝露してから、少なくとも1時間、少なくとも2時間、少なくとも6時間、少なくとも12時間、少なくとも24時間、少なくとも36時間、少なくとも48時間、少なくとも3日、少なくとも4日、少なくとも5日、少なくとも7日、少なくとも10日、または少なくとも14日後に決定する。本明細書に記載の塩基エディターの特徴は、任意の融合タンパク質、または本明細書中で提供する融合タンパク質を使用する方法に適用することができることが理解されるべきである。
いくつかの実施形態では、本明細書中で提供する塩基エディターは、核酸の領域におけるインデルの形成を制限することができる。いくつかの実施形態では、領域は、塩基エディターによって標的とされるヌクレオチドにあるか、または塩基エディターによって標的とされるヌクレオチドから2、3、4、5、6、7、8、9、または10ヌクレオチド以内の領域にある。いくつかの実施形態では、本明細書中で提供する塩基エディターのいずれかは、核酸の領域でのインデルの形成を、1%未満、1.5%未満、2%未満、2.5%未満、3%未満、3.5%未満、4%未満、4.5%未満、5%未満、6%未満、7%未満、8%未満、9%未満、10%未満、12%未満、15%未満、または20%未満にまで制限することができる。核酸領域で形成されるインデルの数は、核酸(例えば、細胞のゲノム内の核酸)を塩基エディターに曝露する時間の量に依存し得る。いくつかの実施形態では、インデルの任意の数または割合を、核酸(例えば、細胞のゲノム内の核酸)を塩基エディターに曝露してから、少なくとも1時間、少なくとも2時間、少なくとも6時間、少なくとも12時間、少なくとも24時間、少なくとも36時間、少なくとも48時間、少なくとも3日、少なくとも4日、少なくとも5日、少なくとも7日、少なくとも10日、または少なくとも14日後に決定する。
塩基エディターの効率の詳細は、国際PCT出願第PCT/2017/045381号(WO2018/027078)及び第PCT/US2016/058344号(WO2017/070632)に記載されており、それぞれは、その全体が参照により本明細書に援用される。Komor, A. C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N. M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551,464-471(2017)、及びKomor, A. C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3: eaao4774 (2017)も参照のこと(その全内容は、参照により本明細書に援用される)。いくつかの実施形態では、本明細書中で提供する方法を使用する1つ以上の遺伝子内の複数の核酸塩基対の編集は、少なくとも1つの意図された変異の形成をもたらす。いくつかの実施形態では、前記少なくとも1つの意図された変異の前記形成は、遺伝子の正常な機能の破壊をもたらす。いくつかの実施形態では、前記少なくとも1つの意図された変異の結果の前記形成は、遺伝子によってコードされるタンパク質の発現を減少または排除する。マルチプレックス編集は、本明細書中で提供する任意の方法または方法の組み合わせを使用して達成し得ることが理解されるべきである。
多重編集
いくつかの実施形態では、本明細書中で提供する塩基エディターシステムは、1つ以上の遺伝子における複数の核酸塩基対の多重編集が可能である。いくつかの実施形態では、複数の核酸塩基対は、同じ遺伝子に位置する。いくつかの実施形態では、複数の核酸塩基対が1つ以上の遺伝子に位置し、少なくとも1つの遺伝子が異なる遺伝子座に位置する。いくつかの実施形態では、多重編集は、1つ以上のガイドポリヌクレオチドを含み得る。いくつかの実施形態では、多重編集は、1つ以上の塩基エディターシステムを含み得る。いくつかの実施形態では、多重編集は、単一のガイドポリヌクレオチドと共に、1つ以上の塩基エディターシステムを含み得る。いくつかの実施形態では、多重編集は、複数のガイドポリヌクレオチドと共に、1つ以上の塩基エディターシステムを含み得る。いくつかの実施形態では、多重編集は、単一の塩基エディターシステムと共に、1つ以上のガイドポリヌクレオチドを含み得る。いくつかの実施形態では、多重編集は、標的ポリヌクレオチド配列への標的結合にPAM配列を必要としない少なくとも1つのガイドポリヌクレオチドを含み得る。いくつかの実施形態では、多重編集は、標的ポリヌクレオチド配列への標的結合にPAM配列を必要とする少なくとも1つのガイドポリヌクレオチドを含み得る。いくつかの実施形態では、多重編集は、標的ポリヌクレオチド配列への標的結合にPAM配列を必要としない少なくとも1つのガイドポリヌクレオチドと、標的ポリヌクレオチド配列への標的結合にPAM配列を必要とする少なくとも1つのガイドポリヌクレオチドとの混合物を含み得る。本明細書に記載の塩基エディターのいずれかを使用する多重編集の特徴は、本明細書中で提供する塩基エディターのいずれかを使用する方法の任意の組み合わせに適用し得ることが理解されるべきである。本明細書に記載の塩基エディターのいずれかを使用する多重編集は、複数の核酸塩基対の連続的な編集を含み得ることもまた、理解されるべきである。
いくつかの実施形態では、複数の核酸塩基対が1つ以上の遺伝子内にある。いくつかの実施形態では、複数の核酸塩基対が同じ遺伝子内にある。いくつかの実施形態では、1つ以上の遺伝子の少なくとも1つの遺伝子が、異なる遺伝子座に位置している。
いくつかの実施形態では、編集は、少なくとも1つのタンパク質コード領域における複数の核酸塩基対の編集である。いくつかの実施形態では、編集は、少なくとも1つのタンパク質非コード領域における複数の核酸塩基対の編集である。いくつかの実施形態では、編集は、少なくとも1つのタンパク質コード領域及び少なくとも1つの非コードタンパク質領域における複数の核酸塩基対の編集である。
いくつかの実施形態では、編集を、1つ以上のガイドポリヌクレオチドと組み合わせる。いくつかの実施形態では、塩基エディターシステムは、1つ以上の塩基エディターシステムを含み得る。いくつかの実施形態では、塩基エディターシステムは、1つ以上の塩基エディターシステムを、単一のガイドポリヌクレオチドと組み合わせて含み得る。いくつかの実施形態では、塩基エディターシステムは、1つ以上の塩基エディターシステムを、複数のガイドポリヌクレオチドと組み合わせて含み得る。いくつかの実施形態では、編集を、単一の塩基エディターシステムと共に、1つ以上のガイドポリヌクレオチドと組み合わせる。いくつかの実施形態では、編集を、標的ポリヌクレオチド配列への標的結合にPAM配列を必要としない少なくとも1つのガイドポリヌクレオチドと組み合わせる。いくつかの実施形態では、編集を、標的ポリヌクレオチド配列への標的結合にPAM配列を必要とする少なくとも1つのガイドポリヌクレオチドと組み合わせる。いくつかの実施形態では、編集を、標的ポリヌクレオチド配列への標的結合にPAM配列を必要としない少なくとも1つのガイドポリヌクレオチドと、標的ポリヌクレオチド配列への標的結合にPAM配列を必要とする少なくとも1つのガイドポリヌクレオチドとの混合物と組み合わせる。本明細書に記載の塩基エディターのいずれかを使用する多重編集の特徴は、本明細書中で提供する塩基エディターのいずれかを使用する方法の任意の組み合わせに適用し得ることが理解されるべきである。編集は、複数の核酸塩基対の連続的な編集を含み得ることもまた、理解されるべきである。
塩基エディターの使用方法
遺伝子と対立遺伝子の塩基編集は、治療法と基礎研究のための新規かつ有益な戦略を提供する。
本開示は、本明細書中で提供する塩基エディターまたは塩基エディターシステムによって修正することができる、点変異に付随するかまたはそれによって引き起こされる疾患と診断された対象の治療方法を提供する。例えば、いくつかの実施形態では、そのような疾患、例えば、遺伝子変異、例えば、一塩基多型(SNP)によって引き起こされる疾患を有する対象に、疾患関連遺伝子の点変異を修正する有効量の核酸塩基エディター(例えば、アデノシンデアミナーゼ塩基エディター)を投与することを含む方法を提供する。特定の態様では、変異に付随するか、またはそれによって引き起こされる疾患の治療方法を提供する。一実施形態では、疾患は、SERPINA1遺伝子の変異に関連するα-1アンチトリプシン欠乏症(A1AD)である。一実施形態では、A1ADに関連する病原性変異は、例えば、本明細書の実施例3に記載されているように、E342Kである。
それぞれの配列、例えば、それぞれ、疾患関連遺伝子またはそれがコードするタンパク質のポリヌクレオチド配列またはアミノ酸配列における特定の位置または残基の付番は、使用する特定のタンパク質及び付番スキームに依存することが理解されよう。付番は、例えば、成熟タンパク質の前駆体と成熟タンパク質自体で異なり得、種ごとの配列の違いが付番に影響を与え得る。当業者であれば、当技術分野で周知の方法、例えば、配列アラインメント及び相同残基の決定によって、任意の相同タンパク質及びそれぞれのコード核酸中のそれぞれの残基を同定することができるであろう。
本明細書において、疾患または障害に関連する標的ヌクレオチド配列中の核酸塩基を編集するための塩基エディターまたは塩基エディターシステムの使用方法を提供する。いくつかの実施形態では、塩基エディター(例えば、アデノシンデアミナーゼ及びCas9ドメインを含む)の活性は、点変異の修正をもたらす。一実施形態では、塩基エディターの活性は、スプライスアクセプター部位またはドナー部位を変化させる変異の修正をもたらす。いくつかの実施形態では、標的DNA配列は、疾患または障害に関連するG→A点変異を含み、その場合、変異A塩基の脱アミノ化は、疾患または障害に関連しない配列をもたらす。
いくつかの実施形態では、標的DNA配列は、タンパク質をコードし、点変異はコドン内にあり、野生型コドンと比較した、変異型コドンによってコードされるアミノ酸の変化をもたらす。いくつかの実施形態では、変異型Aの脱アミノ化は、変異型コドンによってコードされるアミノ酸の変化をもたらす。いくつかの実施形態では、変異型Aの脱アミノ化は、野生型アミノ酸をコードするコドンを生じさせる。いくつかの実施形態では、対象は、疾患または障害を有するか、または有すると診断されている。
いくつかの実施形態では、本明細書中で提供するアデノシンデアミナーゼは、DNAのデオキシアデノシン残基のアデニンを脱アミノ化することができる。本開示の他の態様は、アデノシンデアミナーゼ(例えば、本明細書に記載のDNA中のデオキシアデノシンを脱アミノ化するアデノシンデアミナーゼ)及び特定のヌクレオチド配列に結合することができるドメイン(例えば、Cas9またはCpf1タンパク質)を含む融合タンパク質を提供する。例えば、アデノシンをイノシン残基に転換させることができ、これは通常、シトシン残基と塩基対を形成する。そのような融合タンパク質は、とりわけ、核酸配列の標的化編集に有用である。そのような融合タンパク質は、in vitroでDNAを標的化編集するために、例えば、変異型細胞または変異型動物を生成するために; 標的化変異を導入するために、例えば、ex vivoでの細胞内、例えば、対象から採取し、続いて同じかまたは別の対象に再導入する細胞内の遺伝的欠損を修正するために; そしてin vivoで標的化変異を導入するために使用することができる。本開示は、デアミナーゼ及び核酸塩基エディターを利用するデアミナーゼ、融合タンパク質、核酸、ベクター、細胞、組成物、方法、キット、系などを提供する。
意図する変異の生成
いくつかの実施形態では、本明細書中で提供する方法の目的は、遺伝子編集を介して機能不全の遺伝子の機能を回復させることである。いくつかの実施形態では、機能不全の遺伝子の機能を、意図する変異を導入することによって回復させる。本明細書中で提供する核酸塩基編集タンパク質を、in vitroでの遺伝子編集に基づくヒト治療について、例えば、ヒト細胞培養における疾患関連の変異を修正することによって、検証することができる。当業者であれば、本明細書中で提供する核酸塩基編集タンパク質、例えば、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン(例えば、Cas9)及び核酸塩基編集ドメイン(例えば、アデノシンデアミナーゼドメイン)を含む融合タンパク質を、AからGまたはCからTへの単一の点変異を修正するために使用することができることを理解するであろう。前者の場合、変異AからIへの脱アミノ化により、変異が修正され、後者の場合、変異Tと塩基対を形成するAの脱アミノ化と、それに続く1ラウンドの複製により、変異が修正される。
いくつかの実施形態では、本開示は、有意な数の意図しない変異、例えば、意図しない点変異を生成することなく、核酸(例えば、対象のゲノム内の核酸)内に、意図する変異、例えば、点変異を効率的に生成することができる塩基エディターを提供する。いくつかの実施形態では、意図される変異は、意図される変異を生成するように特別に設計されたガイドポリヌクレオチド(例えば、gRNA)に結合した特定の塩基エディター(例えば、アデノシン塩基エディター)によって生成される変異である。いくつかの実施形態では、意図される変異は、疾患または障害に関連する変異である。いくつかの実施形態では、意図される変異は、疾患または障害に関連するアデニン(A)からグアニン(G)への点変異である。いくつかの実施形態では、意図される変異は、疾患または障害に関連するシトシン(C)からチミン(T)への点変異である。いくつかの実施形態では、意図される変異は、遺伝子のコード領域または非コード領域内のアデニン(A)からグアニン(G)への点変異である。いくつかの実施形態では、意図される変異は、遺伝子のコード領域または非コード領域内のシトシン(C)からチミン(T)への点変異である。いくつかの実施形態では、意図される変異は、終止コドン、例えば、遺伝子のコード領域内の未成熟終止コドンを生成する点変異である。いくつかの実施形態では、意図される変異は、終止コドンを排除する変異である。
いくつかの実施形態では、本明細書中で提供する塩基エディターのいずれかは、意図される変異と意図しない変異(例えば、意図される点変異:意図しない点変異)の1:1を上回る比を生成することができる。いくつかの実施形態では、本明細書中で提供する塩基エディターのいずれかは、意図される変異と意図しない変異(例えば、意図される点変異:意図しない点変異)の、少なくとも1.5:1、少なくとも2:1、少なくとも2.5:1、少なくとも3:1、少なくとも3.5:1、少なくとも4:1、少なくとも4.5:1、少なくとも5:1、少なくとも5.5:1、少なくとも6:1、少なくとも6.5:1、少なくとも7:1、少なくとも7.5:1、少なくとも8:1、少なくとも10:1、少なくとも12:1、少なくとも15:1、少なくとも20:1、少なくとも25:1、少なくとも30:1、少なくとも40:1、少なくとも50:1、少なくとも100:1、少なくとも150:1、少なくとも200:1、少なくとも250:1、少なくとも500:1、または少なくとも1000:1、またはそれ以上である比を生成することができる。
塩基エディターの効率の詳細は、国際PCT出願第PCT/2017/045381号(WO2018/027078)及び第PCT/US2016/058344号(WO2017/070632)に記載されており、これらのそれぞれは、その全体が参照により本明細書に援用される。また、Komor, A. C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N. M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017)、及びKomor, A. C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3: eaao4774 (2017)も参照されたい(その全内容は、参照により本明細書に援用される)。
いくつかの実施形態では、1つ以上の遺伝子における複数の核酸塩基対の編集は、少なくとも1つの意図される変異の形成をもたらす。いくつかの実施形態では、少なくとも1つの意図される変異の形成により、疾患を引き起こす変異が正確に修正される。本明細書に記載の塩基エディターの多重編集の特徴は、本明細書中で提供する塩基エディターを使用する方法の任意の組み合わせに適用し得ることが理解されるべきである。
宿主細胞における融合タンパク質の発現
アデノシンデアミナーゼバリアントを含む本開示の融合タンパク質は、当業者に公知の通常の方法を使用して、細菌、酵母、真菌、昆虫、植物、及び動物細胞を含むがこれらに限定されない、実質上、任意の目的の宿主細胞で発現させ得る。例えば、本開示のアデノシンデアミナーゼをコードするDNAは、cDNA配列に基づいてCDSの上流及び下流に適切なプライマーを設計することによってクローニングすることができる。クローニングしたDNAは、直接、または所望により制限酵素で消化した後、または適切なリンカー及び/または核局在化シグナルを付加した後、塩基エディターシステムの1つ以上の追加の成分をコードするDNAに連結してもよい。塩基エディターシステムは、宿主細胞内で翻訳されて複合体を形成する。
本明細書に記載のタンパク質ドメインをコードするDNAは、DNAを化学的に合成するか、またはPCR法及びギブソンアセンブリ法を利用して合成された部分的に重複するオリゴDNA短鎖を接続してその全長をコードするDNAを構築することによって得ることができる。化学合成またはPCR法の組み合わせまたはギブソンアセンブリ法によって全長DNAを構築する利点は、DNAを導入する宿主に応じて、使用するコドンを全長CDSで設計することができる点である。異種DNAの発現においては、そのDNA配列を、宿主生物で非常に頻繁に使用されるコドンに変換することにより、タンパク質の発現レベルが上昇すると予想される。使用する宿主におけるコドン使用頻度のデータとして、例えば、Kazusa DNA Research Instituteのホームページに公開されている遺伝暗号使用頻度データベース(http://kazusa.or.jp/codon/index.html)を使用することができ、または各宿主でのコドン使用頻度を示す文書を参照してもよい。得られたデータ及び導入するDNA配列を参照することにより、DNA配列に使用されるコドンのうち、宿主において使用頻度が低いコドンを、同じアミノ酸をコードし、使用頻度が高いコドンに転換させてもよい。
核酸配列認識モジュール及び/または核酸塩基変換酵素をコードするDNAを含む発現ベクターを、例えば、適切な発現ベクターにおいてプロモーターの下流にDNAを連結することによって生成することができる。
いくつかの実施形態では、動物細胞発現プラスミド(例えば、pA1-11、pXT1、pRc / CMV、pRc / RSV、pcDNAI / Neo)、及びレトロウイルス、ワクシニアウイルス、アデノウイルスなどの動物ウイルスベクターを使用する。他の実施形態では、Escherichia coli由来のプラスミド(例えば、pBR322、pBR325、pUC12、pUC13); Bacillus subtilis由来のプラスミド(例えば、pUB110、pTP5、pC194); 酵母由来プラスミド(例えば、pSH19、pSH15); 昆虫細胞発現プラスミド(例えば、pFast-Bac); λファージなどのバクテリオファージ; バキュロウイルスなどの昆虫ウイルスベクター(例えば、BmNPV、AcNPV)などを使用する。
いくつかの実施形態では、所与の宿主内での遺伝子発現に適切な任意のプロモーターを使用することができる。DSBを用いた従来の方法では、毒性により宿主細胞の生存率が著しく低下することがあるため、誘導性プロモーターを用いて誘導開始までに細胞数を増やすことが望ましい。しかしながら、本開示の核酸修飾酵素複合体を発現させることによっても十分な細胞増殖をもたらすことができることから、構成的プロモーターも制限なく使用することができる。
例えば、限定されないが、宿主が動物細胞の場合、SRαプロモーター、SV40プロモーター、LTRプロモーター、CMV(サイトメガロウイルス)プロモーター、RSV(ラウス肉腫ウイルス)プロモーター、MoMuLV(モロニーマウス白血病ウイルス)LTR、HSV-TK(単純ヘルペスウイルスチミジンキナーゼ)プロモーターなどを使用する。これらのうち、CMVプロモーター、SRαプロモーターなどが使用に適切である。宿主がEscherichia coliの場合、trpプロモーター、lacプロモーター、recAプロモーター、λPLプロモーター、lppプロモーター、T7プロモーターなどが使用に適切である。宿主がBacillus属の場合、SPO1プロモーター、SPO2プロモーター、penPプロモーターなどが使用に適切である。宿主が酵母の場合、Gal1/10プロモーター、PHO5プロモーター、PGKプロモーター、GAPプロモーター、ADHプロモーターなどが使用に適切である。宿主が昆虫細胞である場合、ポリヘドリンプロモーター、P10プロモーターなどが使用に適切である。宿主が植物細胞の場合、CaMV35Sプロモーター、CaMV19Sプロモーター、NOSプロモーターなどが使用に適切である。
上記のベクターに加えて、エンハンサー、スプライシングシグナル、ターミネーター、ポリA付加シグナル、薬剤耐性遺伝子、栄養要求性相補遺伝子などの選択マーカー、複製起点などを必要に応じて含む発現ベクターを使用することができる。
本明細書に記載のタンパク質ドメインをコードするRNAは、例えば、上記の核酸配列認識モジュール及び/または核酸塩基転換酵素をコードするDNAをコードするベクターをテンプレートとして使用することにより、それ自体が公知のin vitro転写系において、mRNAへ転写することによって調製することができる。
本開示の融合タンパク質は、核酸配列認識モジュール及び/または核酸塩基転換酵素をコードするDNAを含む発現ベクターを宿主細胞に導入し、宿主細胞を培養することにより、細胞内で発現させることができる。
動物細胞として、サルCOS-7細胞、サルVero細胞、チャイニーズハムスター卵巣(CHO)細胞、dhfr遺伝子欠損CHO細胞、マウスL細胞、マウスAtT-20細胞、マウス骨髄腫細胞、ラットGH3細胞、ヒトFL細胞などの細胞株、ヒト及び他の哺乳類のiPS細胞、ES細胞などの多能性幹細胞、ならびに様々な組織から調製される初代培養細胞が用いられる。さらに、ゼブラフィッシュ胚、Xenopus卵母細胞なども使用することができる。
Escherichia属については、Bacillus属、酵母、昆虫細胞、昆虫、動物細胞などを宿主細胞として使用することができる。
Escherichia属については、Escherichia coli K12.cndot.DH1 (Proc. Natl. Acad. Sci. USA, 60, 160 (1968)), Escherichia coli JM103 (Nucleic Acids Research, 9, 309 (1981)), Escherichia coli JA221 (Journal of Molecular Biology, 120, 517 (1978)), Escherichia coli HB101 (Journal of Molecular Biology, 41, 459 (1969)), Escherichia coli C600 (Genetics, 39, 440 (1954))などを使用することができる。
Bacillus属については、Bacillus subtilis M1114 (Gene, 24, 255 (1983))、Bacillus subtilis 207-21 (Journal of Biochemistry, 95, 87 (1984))などを使用することができる。
酵母については、Saccharomyces cerevisiae AH22、AH22R.sup.-、NA87-11A、DKD-5D、20B-12、Schizosaccharomyces pombe NCYC1913、NCYC2036、Pichia pastoris KM71などを使用することができる。
ウイルスがAcNPVの場合の昆虫細胞については、ヨトウガ幼虫由来の樹立系統(Spodopterafrugiperda細胞; Sf細胞)の細胞、Trichoplusia niの中腸由来MG1細胞、Trichoplusia niの卵由来HighFive(商標)細胞、Mamestra brassicae由来細胞、Estigmena acrea由来細胞などを使用することができる。BmNPVウイルスについては、Bombyx mori由来の樹立系統(Bombyx mori N細胞; BmN細胞)の細胞などを昆虫細胞として使用する。Sf細胞については、例えば、Sf9細胞(ATCC CRL1711)、Sf21細胞[すべて上記、In Vivo, 13, 213-217 (1977)]などを使用することができる。
昆虫については、例えば、Bombyx mori、Drosophila、コオロギの幼虫などを使用することができる(Nature, 315, 592 (1985))。
植物細胞については、様々な植物(例えば、コメ、コムギ、トウモロコシ(corn)(トウモロコシ(maize))などの穀物、トマト、キュウリ、ナスなどの製品作物、カーネーション、トルコギキョウなどの園芸植物、タバコ、Arabidopsis thalianaなどの実験植物など)から調製される浮遊培養細胞、カルス、プロトプラスト、葉セグメント、根セグメントなどを使用することができる。
上記のすべての宿主細胞は、半数体(一倍体)、または倍数体(例えば、二倍体、三倍体、四倍体など)であり得る。
従来の変異導入法では、原則として、1つの相同染色体にのみ変異を導入してヘテロ遺伝子型を生成する。したがって、優性変異が生じない限り、所望の表現型は発現せず、ホモ接合性は不便なことに労力と時間を必要とする。対照的に、本開示によれば、ゲノム内の相同染色体上の任意の対立遺伝子に変異を導入することができるため、劣性変異の場合でも、所望の表現型を単一世代で発現させることができ、これは、従来の方法の問題点を解決することができるため、極めて有用である。
発現ベクターは、宿主の種類に従って、既知の方法(例えば、リゾチーム法、コンピテント法、PEG法、CaCl2共沈法、エレクトロポレーション法、マイクロインジェクション法、パーティクルガン法、リポフェクション法、アグロバクテリウム法など)によって導入することができる。
Escherichia coliは、例えば、Proc. Natl. Acad. Sci. USA, 69, 2110 (1972), Gene, 17, 107 (1982)などに記載されている方法に従って形質転換することができる。
Bacillus属は、例えば、Molecular & General Genetics, 168, 111 (1979)などに記載されている方法に従ってベクター導入することができる。
酵母は、例えば、Methods in Enzymology, 194, 182-187 (1991), Proc. Natl. Acad. Sci. USA, 75, 1929 (1978)などに記載されている方法に従ってベクター導入することができる。
昆虫細胞及び昆虫は、例えば、Bio/Technology, 6, 47-55 (1988)などに記載されている方法に従って、ベクター導入することができる。
動物細胞は、例えば、Cell Engineering additional volume 8, New Cell Engineering Experiment Protocol, 263-267 (1995)(Shujunsha発行)、及びVirology, 52,456 (1973)に記載されている方法に従ってベクター導入することができる。ベクターを導入した細胞は、宿主の種類に応じた既知の方法で培養することができる。
例えば、Escherichia coliまたはBacillus属を培養する場合、液体培地が培養に好適に使用される。培地は、通常、形質転換体の増殖に必要な炭素源、窒素源、無機物質などを含む。炭素源の例として、グルコース、デキストリン、可溶性デンプン、スクロースなどが挙げられ; 窒素源の例として、アンモニウム塩、硝酸塩、コーンスティープリカー、ペプトン、カゼイン、肉抽出物、ダイズケーキ、ジャガイモ抽出物などの無機または有機物質が挙げられ; 無機物質の例として、塩化カルシウム、リン酸二水素ナトリウム、塩化マグネシウムなどが挙げられる。培地は、酵母エキス、ビタミン、成長促進因子などを含み得る。培地のpHは、約5~約8である。
Escherichia coliを培養するための培地として、例えば、グルコース、カザミノ酸を含有するM9培地(Journal of Experiments in Molecular Genetics, 431-433, Cold Spring Harbor Laboratory, New York 1972)を使用してもよい。必要に応じて、例えば、3-β-インドリルアクリル酸などの薬剤を培地に添加して、プロモーターの効率的な機能を確保してもよい。一般的に、Escherichia coliは、約15~約43℃で培養する。必要に応じて、曝気と撹拌を実施してもよい。
Bacillus属は、一般的に、約30℃~約40℃で培養する。必要に応じて、曝気と撹拌を実施してもよい。
酵母を培養するための培地の例として、Burkholder最小培地(Proc. Natl. Acad. Sci. USA, 77, 4505 (1980))、0.5%カザミノ酸を含有するSD培地(Proc. Natl. Acad. Sci. USA, 81, 5330 (1984))などが挙げられる。培地のpHは、好ましくは約5~約8である。培養は、一般的に約20℃~約35℃で維持される。必要に応じて、曝気と撹拌を実施してもよい。
昆虫細胞または昆虫を培養するための培地として、例えば、不活化10%ウシ血清などの添加物を適宜含有するグレース昆虫培地(Nature, 195, 788 (1962))が用いられる。培地のpHは、好ましくは約6.2~約6.4である。培養は、一般的に約27℃で維持される。必要に応じて、曝気と撹拌を実施してもよい。
動物細胞を培養するための培地として、例えば、ウシ胎仔血清を約5~約20%含む最小必須培地(MEM)(Science, 122, 501 (1952))、ダルベッコ改変イーグル培地(DMEM)(Virology, 8, 396(1959))、RPMI1640培地(The Journal of the American Medical Association, 199, 519 (1967))、199培地(Proceeding of the Society for the Biological Medicine, 73 ,1 (1950))などが用いられる。培地のpHは、好ましくは約6~約8である。培養は、一般的に約30℃~約40℃で維持される。必要に応じて、曝気と撹拌を実施してもよい。
動物細胞などの高等真核細胞を宿主細胞として使用する場合、本開示の塩基エディターシステム(例えば、アデノシンデアミナーゼバリアントを含む)をコードするDNAを、誘導性プロモーター(例えば、メタロチオネインプロモーター(重金属イオンによって誘導される)、熱ショックタンパク質プロモーター(熱ショックによって誘導される)、Tet-ON/Tet-OFF系プロモーター(テトラサイクリンまたはその誘導体の添加または除去によって誘導される)、ステロイド応答性プロモーター(ステロイドホルモンまたはその誘導体によって誘導される)など)の制御下にある宿主細胞に導入し、誘導物質を、適切な段階で培地に添加して(または培地から除去して)、核酸-修飾酵素複合体の発現を誘導し、一定期間培養して塩基編集を行い、標的遺伝子に変異を導入することで、塩基エディターシステムの一過性発現を実現することができる。
Escherichia coliなどの原核細胞は、誘導性プロモーターを利用することができる。適切な誘導性プロモーターの例として、lacプロモーター(IPTGによって誘導される)、cspAプロモーター(コールドショックによって誘導される)、araBADプロモーター(アラビノースによって誘導される)などが挙げられるが、これらに限定されない。
あるいは、上記の誘導性プロモーターは、動物細胞などの高等真核細胞を宿主細胞として使用する場合のベクター除去機構としても利用することができる。すなわち、ベクターは、宿主細胞で機能する複製起点、及び複製に必要なタンパク質をコードする核酸(例えば、動物細胞の場合、SV40オン及びラージT抗原、oriP及びEBNA-1など)を保有しており、そのタンパク質をコードする核酸の発現は、上記の誘導性プロモーターによって調節される。その結果、誘導物質の存在下でベクターは自律的に複製可能であるが、誘導物質が除去されると、自律複製は利用できず、ベクターは細胞分裂と共に自然に脱落する(Tet-OFF系ベクターにおけるテトラサイクリン及びドキシサイクリンの添加による自律複製は不可能である)。
送達系
本明細書に開示する塩基エディターは、ウイルスベクターに含まれる核酸上にコードされ得る。ウイルスベクターとして、レンチウイルス、アデノウイルス、レトロウイルス、及びアデノ随伴ウイルス(AAV)が挙げられ得る。ウイルスベクターは、用途に基づいて選択することができる。例えば、AAVは免疫原性が穏やかなため、in vivoでの遺伝子送達に一般的に使用される。アデノウイルスは、それらが誘発する強力な免疫原性応答のために、ワクチンとして一般的に使用されている。ウイルスベクターのパッケージング容量は、ベクターにパッケージ化できる塩基エディターのサイズを制限し得る。例えば、AAVのパッケージング容量は、2つの145塩基の逆位末端配列(ITR)を含めて約4.5kbである。
AAVは、パルボウイルスファミリーに属する小さな一本鎖DNA依存性ウイルスである。4.7kbの野生型(wt)AAVゲノムは、それぞれ4つの複製タンパク質と3つのキャプシドタンパク質をコードする2つの遺伝子で構成され、両側に145bpの逆位末端配列(ITR)が隣接する。ビリオンは、3つのキャプシドタンパク質Vp1、Vp2、及びVp3からなり、同じオープンリーディングフレームから、ただし選択的スプライシング(Vp1)及び選択的翻訳開始部位(それぞれVp2及びVp3)から1:1:10の比率で生成される。Vp3は、ビリオンで最も豊富なサブユニットであり、ウイルスの向性を規定する細胞表面での受容体認識に関与している。ウイルス感染性で機能するホスホリパーゼドメインは、Vp1のユニークなN末端で同定されている。
wt AAVと同様に、組換えAAV(rAAV)は、シス作用性145bp ITRを利用してベクター導入遺伝子カセットに隣接し、外来DNAのパッケージングに最大4.5kbを提供する。感染後、rAAVは本発明の融合タンパク質を発現し、環状ヘッドトゥーテール型コンカテマーにエピソーム的に存在することにより、宿主ゲノムに組み込まれることなく存続することができる。この系を使用したrAAVの成功例は、in vitro及びin vivoで多数存在するが、パッケージング容量が限られるため、遺伝子のコード配列の長さがwt AAVゲノムと同じかそれ以上のサイズである場合、AAVを介した遺伝子送達の使用は限定的である。
AAVベクターのパッケージング容量が小さいため、このサイズを超える多数の遺伝子の送達及び/または大きな生理学的調節エレメントの使用が困難なものとなっている。これらの課題は、例えば、送達するタンパク質(複数可)を2つ以上の断片に分割することによって対処することができ、N末端断片をスプリットインテイン-Nに融合し、C末端断片をスプリットインテイン-Cに融合する。これらの断片は、次いで2つ以上のAAVベクターにパッケージングされる。本明細書中で使用する場合、「インテイン」とは、隣接するN末端及びC末端のエクステイン(例えば、結合する断片)を連結する自己スプライシングタンパク質イントロン(例えば、ペプチド)を指す。異種タンパク質断片を結合するための特定のインテインの使用は、例えば、Wood et al., J. Biol. Chem. 289 (21); 14512-9 (2014)に記載されている。例えば、別々のタンパク質断片に融合されると、インテインIntNとIntCは互いに認識し合い、インテイン自身をスプライスアウトし、同時に融合したタンパク質断片の隣接するN末端とC末端のエクステインを連結し、それによって2つのタンパク質断片から全長タンパク質を再構成する。他の適切なインテインは、当業者には明らかであろう。
本発明の融合タンパク質の断片は、長さが様々に異なり得る。いくつかの実施形態では、タンパク質断片は、2アミノ酸~約1000アミノ酸の長さの範囲である。いくつかの実施形態では、タンパク質断片は、約5アミノ酸~約500アミノ酸の長さの範囲である。いくつかの実施形態では、タンパク質断片は、約20アミノ酸~約200アミノ酸の長さの範囲である。いくつかの実施形態では、タンパク質断片は、約10アミノ酸~約100アミノ酸の長さの範囲である。他の長さの適切なタンパク質断片は、当業者には明らかであろう。
いくつかの実施形態では、ヌクレアーゼ(例えば、Cas9)の一部または断片を、インテインに融合させる。ヌクレアーゼは、インテインのN末端またはC末端に融合させることができる。いくつかの実施形態では、融合タンパク質の一部または断片を、インテインに融合し、そしてAAVキャプシドタンパク質に融合させる。インテイン、ヌクレアーゼ及びキャプシドタンパク質は、任意の配置で一緒に融合することができる(例えば、ヌクレアーゼ-インテイン-キャプシド、インテイン-ヌクレアーゼ-キャプシド、キャプシド-インテイン-ヌクレアーゼなど)。いくつかの実施形態では、インテインのN末端を、融合タンパク質のC末端に融合し、インテインのC末端を、AAVキャプシドタンパク質のN末端に融合する。
一実施形態では、デュアルAAVベクターは、大きな導入遺伝子発現カセットを2つの別々の半体(5’及び3’末端、またはヘッドトゥーテール)に分割することによって生成され、カセットの各半体は、単一のAAVベクター(<5kb)にパッケージングされる。次いで、全長の導入遺伝子発現カセットの再構築は、両方のデュアルAAVベクターによる同じ細胞への同時感染と、その後の:(1)5’及び3’ゲノム間の相同組換え(HR)(デュアルAAV重複ベクター); (2)5’及び3’ゲノムのITRを介したテールトゥーヘッド型コンカテマー化(デュアルAAVトランススプライシングベクター);または(3)これら2つの機構の組み合わせ(デュアルAAVハイブリッドベクター)によって達成される。in vivoでデュアルAAVベクターを使用することにより、全長タンパク質が発現する。デュアルAAVベクタープラットフォームの使用は、サイズが4.7kbを超える導入遺伝子に対する、効率的で実行可能な遺伝子導入戦略を表している。
塩基エディターを設計するための本開示の戦略は、ウイルスベクターにパッケージングすることができる塩基エディターを生成するために有用であり得る。塩基エディターの送達にRNAまたはDNAウイルスベースの系を使用することにより、ウイルスを培養中または宿主内の特定の細胞に標的化し、ウイルスペイロードを核または宿主細胞ゲノムに輸送するための高度に進化したプロセスを利用する。ウイルスベクターは、直接、培養物中の細胞、患者に投与し得る(in vivo)か、またはそれらを用いて細胞をin vitroで治療することができ、そして修飾された細胞を任意選択で患者に投与することができる(ex vivo)。従来のウイルスベースの系は、遺伝子導入のために、レトロウイルス、レンチウイルス、アデノウイルス、アデノ随伴ウイルス、及び単純ヘルペスウイルスベクターを含み得る。宿主ゲノムにおける組み込みは、レトロウイルス、レンチウイルス、及びアデノ随伴ウイルス遺伝子導入方法を用いて可能となり、多くの場合、挿入された導入遺伝子の長期発現をもたらす。さらに、高い導入効率が、多くの異なる細胞型及び標的組織において観察されている。
外来のエンベロープタンパク質を組み込むことによってレトロウイルスの向性を改変して、標的細胞の可能性のある標的集団を拡大することができる。レンチウイルスベクターは、非分裂細胞に対して形質導入するか、または感染させることができ、また、一般的には高いウイルス力価を生成するレトロウイルスベクターである。したがって、レトロウイルス遺伝子導入系の選択は、標的組織に依存するであろう。レトロウイルスベクターは、最大6~10kbの外来配列をパッケージングする能力を有するシス作用性末端反復配列からなる。ベクターの複製とパッケージングに最小限のシス作用性LTRで十分であり、これを使用して治療遺伝子を標的細胞に組み込み、永続的な導入遺伝子の発現を提供する。広く使用されているレトロウイルスベクターには、マウス白血病ウイルス(MuLV)、テナガザル白血病ウイルス(GaLV)、サル免疫不全ウイルス(SIV)、ヒト免疫不全ウイルス(HIV)、及びそれらの組み合わせに基づくベクターが含まれる(例えば、Buchscher et al., J. Virol. 66: 2731-2739 (1992); Johann et al., J. Virol. 66: 1635-1640 (1992); Sommnerfelt et al., Virol. 176: 58-59 (1990); Wilson et al., J. Virol. 63: 2374-2378 (1989); Miller et al., J. Virol. 65: 2220-2224 (1991); PCT/US94/05700)を参照されたい)。
レトロウイルスベクター、特にレンチウイルスベクターは、標的細胞への効率的な組み込みのために、所与の長さよりも小さいポリヌクレオチド配列を必要とし得る。例えば、長さが9kbを超えるレトロウイルスベクターは、サイズが小さいレトロウイルスベクターと比較してウイルス力価が低くなり得る。いくつかの態様では、本開示の塩基エディターは、レトロウイルスベクターを介した標的細胞への効率的なパッケージング及び送達を可能にするのに十分なサイズである。いくつかの場合では、塩基エディターは、ガイド核酸及び/または標的化可能なヌクレアーゼ系の他の成分と一緒に発現させた場合でさえ、効率的なパッキング及び送達を可能にするようなサイズである。
一過性の発現が好ましい用途では、アデノウイルスベースの系を使用することができる。アデノウイルスベースのベクターは、多くの細胞型で非常に高い形質導入効率が可能であり、細胞分裂を必要としない。そのようなベクターにより、高い力価と発現レベルが得られる。このベクターは、比較的単純な系で大量に生成することができる。アデノ随伴ウイルス(「AAV」)ベクターも、細胞を標的核酸で形質導入するために、例えば、核酸及びペプチドをin vitroで産生するために、ならびにin vivo及びex vivo遺伝子治療手順のために用いられる(例えば、West et al., Virology 160: 38-47 (1987); 米国特許第4,797,368号、WO93/24641、Kotin, Human Gene Therapy 5: 793-801 (1994); Muzyczka, J. Clin. Invest. 94:1351 (1994)を参照されたい)。組換えAAVベクターの構築は、米国特許第5,173,414号; Tratschin et al., Mol. Cell. Biol. 5: 3251-3260 (1985); Tratschin, et al., Mol. Cell. Biol. 4: 2072-2081 (1984); Hermonat & Muzyczka, PNAS 81:6466-6470 (1984);及びSamulski et al., J. Virol. 63: 03822-3828 (1989)を含む、複数の文献に記載されている。
したがって、本明細書に記載の塩基エディターを、ウイルスベクターと共に送達することができる。塩基エディターシステムの1つ以上の成分を、1つ以上のウイルスベクターにコードすることができる。例えば、塩基エディターとガイド核酸を、単一のウイルスベクター上にコードすることができる。他の場合では、塩基エディターとガイド核酸を、異なるウイルスベクターにコードする。いずれの場合も、塩基エディターとガイド核酸を、それぞれ、プロモーターとターミネーターに作動可能に連結することができる。
ウイルスベクターにコードされる成分の組み合わせは、選択したウイルスベクターのカーゴサイズの制約によって決定され得る。
塩基エディターの非ウイルス送達
塩基エディターのための非ウイルス送達アプローチも利用可能である。非ウイルス性核酸ベクターの重要なカテゴリーの1つはナノ粒子であり、有機または無機であり得る。ナノ粒子は当技術分野で周知である。任意の適切なナノ粒子設計を使用して、ゲノムエディターシステム成分またはそのような成分をコードする核酸を送達することができる。例えば、有機(例えば、脂質及び/または重合体)ナノ粒子は、本開示の特定の実施形態における送達ビヒクルとしての使用に適し得る。ナノ粒子製剤及び/または遺伝子導入に使用するための例示的な脂質を表15(下記)に示す。
Figure 2022546608000096

Figure 2022546608000097
表16に、遺伝子導入及び/またはナノ粒子製剤で使用するための例示的な重合体を示す。
Figure 2022546608000098
表17は、本明細書に記載の融合タンパク質をコードするポリヌクレオチドの送達方法の概要である。
Figure 2022546608000099
別の態様では、ゲノムエディターシステム成分またはそのような成分をコードする核酸、例えば、Cas9またはそのバリアントなどの核酸結合タンパク質、及び目的のゲノム核酸配列を標的とするgRNAの送達は、リボヌクレオタンパク質(RNP)を細胞に送達することによって達成してもよい。RNPは、標的化gRNAと複合体を形成した核酸結合タンパク質、例えば、Cas9を含む。RNPは、Zuris, J. A. et al., 2015, Nat. Biotechnology, 33 (1): 73-80に報告されているように、エレクトロポレーション、ヌクレオフェクション、またはカチオン性脂質を介した方法などの既知の方法を使用して細胞に送達してもよい。RNPは、CRISPR塩基エディターシステムでの使用、特に初代細胞などのトランスフェクションが困難な細胞での使用に有利である。さらに、RNPは、特にCRISPRプラスミドで使用され得るCMVまたはEF1Aなどの真核生物プロモーターが十分に発現されない場合に、細胞内のタンパク質発現で生じ得る問題を軽減することもできる。利点として、RNPの使用は、細胞への外来DNAの送達を必要としない。さらに、核酸結合タンパク質とgRNA複合体を含むRNPは時間の経過と共に分解されるため、RNPの使用はオフターゲット効果を制限する可能性がある。プラスミドベースの技術と同様の方法で、RNPを使用して結合タンパク質(例えば、Cas9バリアント)を送達し、相同組換え修復(HDR)を誘導することができる。
核酸分子の発現をコードする塩基エディターを駆動するために使用されるプロモーターには、AAV ITRが含まれ得る。これは、ベクター内のスペースを占め得る追加のプロモーターエレメントの必要性を排除するために有効であり得る。解放される追加のスペースを使用して、ガイド核酸や選択可能なマーカーなどの追加のエレメントの発現を駆動することができる。ITR活性は比較的弱いため、これを用いて、選択したヌクレアーゼの過剰発現による潜在的な毒性を軽減することができる。
任意の適切なプロモーターを使用して、塩基エディター及び適切な場合にはガイド核酸の発現を駆動することができる。ユビキタス発現の場合、使用できるプロモーターとして、CMV、CAG、CBh、PGK、SV40、フェリチン重鎖または軽鎖などが挙げられる。脳または他のCNS細胞発現の場合、適切なプロモーターとして、すべてのニューロンに対してシナプシンI、興奮性ニューロンに対してCaMKIIα、GABA作動性ニューロンに対してGAD67もしくはGAD65またはVGATなどが挙げられ得る。肝細胞発現の場合、適切なプロモーターとしてアルブミンプロモーターが挙げられる。肺細胞発現の場合、適切なプロモーターとしてSP-Bが挙げられ得る。内皮細胞の場合、適切なプロモーターとしてICAMが挙げられ得る。造血細胞の場合、適切なプロモーターとしてIFNβまたはCD45が挙げられ得る。骨芽細胞の場合、適切なプロモーターとしてOG-2が挙げられ得る。
いくつかの場合では、本開示の塩基エディターは、別個のプロモーターが同じ核酸分子内の塩基エディター及び適合性ガイド核酸の発現を駆動することを可能にするのに十分に小さいサイズである。例えば、ベクターまたはウイルスベクターは、塩基エディターをコードする核酸に作動可能に連結された第1のプロモーターと、ガイド核酸に作動可能に連結された第2のプロモーターと、を含み得る。
ガイド核酸の発現を駆動するために使用されるプロモーターとして、U6またはH1などのPolIIIプロモーター、gRNAアデノ随伴ウイルス(AAV)を発現するためのPolIIプロモーター及びイントロンカセットの使用が挙げられ得る。
1つ以上のガイド核を伴うまたは伴わない本明細書に記載の塩基エディターは、アデノ随伴ウイルス(AAV)、レンチウイルス、アデノウイルスまたは他のプラスミドまたはウイルスベクタータイプを使用して、特に、例えば、米国特許第8,454,972号(製剤、アデノウイルスの用量)、米国特許第8,404,658号(製剤、AAVの用量)及び米国特許第5,846,946号(製剤、DNAプラスミドの用量)ならびにレンチウイルス、AAV及びアデノウイルスを含む臨床試験に関する臨床試験及び刊行物に基づく製剤及び用量を使用して送達することができる。例えば、AAVの場合、投与経路、製剤及び用量は、米国特許第8,454,972号及びAAVに関する臨床試験の通りにすることができる。アデノウイルスの場合、投与経路、製剤及び用量は、米国特許第8,404,658号及びアデノウイルスに関する臨床試験の通りにすることができる。プラスミド送達の場合、投与経路、製剤及び用量は、米国特許第5,846,946号及びプラスミドに関する臨床試験の通りにすることができる。用量は、平均70kgの個体(例えば、ヒト成人男性)に基づき、または外挿することができ、異なる体重及び種の患者、対象、哺乳類に合わせて調整することができる。投与の頻度は、年齢、性別、健康全般、患者または対象の他の状態、及び対処しようとする特定の病態または症状を含む通常の要因に応じて、医療または獣医の開業医(例えば、医師、獣医)の範囲内である。ウイルスベクターは、目的の組織に注入することができる。細胞型特異的塩基編集の場合、塩基エディター及び任意選択のガイド核酸の発現を、細胞型特異的プロモーターによって駆動することができる。
in vivo送達の場合、AAVは他のウイルスベクターよりも有利であり得る。いくつかの場合では、AAVは低毒性を可能にし、これは、免疫応答を活性化し得る細胞粒子の超遠心分離を必要としない精製方法に起因し得る。いくつかの場合では、AAVは宿主ゲノムに組み込まれないため挿入変異を引き起こす可能性を低くし得る。
AAVのパッケージ制限は4.5または4.75Kbである。これは、開示する塩基エディター、ならびにプロモーター及び転写ターミネーターが単一のウイルスベクターに適合できることを意味する。4.5または4.75Kbを超える構築物は、ウイルスの生成を大幅に低下させ得る。例えば、SpCas9は非常に大きく、遺伝子自体は4.1Kbを超えているため、AAVにパッキングするのは困難である。したがって、本開示の実施形態は、従来の塩基エディターよりも長さが短い、本開示の塩基エディターを利用することを含む。いくつかの例では、塩基エディターは4kb未満である。本開示の塩基エディターは、4.5kb、4.4kb、4.3kb、4.2kb、4.1kb、4kb、3.9kb、3.8kb、3.7kb、3.6kb、3.5kb、3.4kb、3.3kb、3.2kb、3.1kb、3kb、2.9kb、2.8kb、2.7kb、2.6kb、2.5kb、2kb、または1.5kb未満であり得る。いくつかの場合では、本開示の塩基エディターの長さは4.5kb以下である。
AAVは、AAV1、AAV2、AAV5またはそれらの任意の組み合わせであり得る。標的化する細胞に関してAAVのタイプを選択することができ; 例えば、脳または神経細胞を標的とするために、AAV血清型1、2、5またはハイブリッドキャプシドAAV1、AAV2、AAV5またはそれらの任意の組み合わせを選択することができ; 心臓組織を標的とするためにAAV4を選択することができる。AAV8は、肝臓への送達に役立つ。これらの細胞に関する特定のAAV血清型の表は、Grimm, D. et al, J. Virol. 82: 5887-5911 (2008))で見出すことができる。
レンチウイルスは、有糸分裂細胞と有糸分裂後細胞の両方で遺伝子に感染して発現する能力を有する複雑なレトロウイルスである。最も一般的に知られているレンチウイルスは、他のウイルスのエンベロープ糖タンパク質を使用して広範囲の細胞型を標的とするヒト免疫不全ウイルス(HIV)である。
レンチウイルスは、以下のように調製することができる。pCasES10(レンチウイルス転移プラスミドバックボーンを含む)をクローニングした後、低継代(p=5)のHEK293FTをT-75フラスコに播種し、トランスフェクションの前日に抗生物質を含まない10%ウシ胎仔血清を含むDMEMで50%コンフルエントにした。20時間後、培地をOptiMEM(無血清)培地に交換し、4時間後にトランスフェクションを実施した。細胞に10 μgのレンチウイルス転移プラスミド(pCasES10)と以下のパッケージングプラスミドをトランスフェクトする:5 μgのpMD2.G(VSV-g疑似型)及び7.5 μgのpsPAX2(gag/pol/rev/tat)。トランスフェクションは、カチオン性脂質送達剤(50 μl Lipofectamine2000及び100ul Plus試薬)を含む4mL OptiMEMで行うことができる。6時間後、培地を10%ウシ胎仔血清を含む抗生物質フリーのDMEMに交換する。これらの方法では細胞培養中に血清を使用するが、無血清法が好ましい。
レンチウイルスは、以下のように精製することができる。ウイルスの上清を48時間後に回収する。上清から最初に破片を取り除き、0.45 μmの低タンパク質結合(PVDF)フィルターで濾過する。次いで、それらを24,000 rpmで2時間、超遠心分離に供する。ウイルスペレットを50 μlのDMEMに4℃で一晩再懸濁する。次いでそれらを分注し、すぐに-80℃で凍結する。
別の実施形態では、ウマ伝染性貧血ウイルス(EIAV)に基づく最小の非霊長類レンチウイルスベクターもまた企図される。別の実施形態では、血管新生抑制タンパク質エンドスタチン及びアンギオスタチンを発現する、馬伝染性貧血ウイルスベースのレンチウイルス遺伝子治療ベクターであるRETINOSTAT(登録商標)を、網膜下注射を介して送達することが企図される。別の実施形態では、自己不活化レンチウイルスベクターの使用が企図される。
系の任意のRNA、例えばガイドRNAまたは塩基エディターをコードするmRNAは、RNAの形態で送達することができる。塩基エディターをコードするmRNAは、in vitro転写を使用して生成することができる。例えば、ヌクレアーゼmRNAは、以下のエレメント:T7プロモーター、任意選択のkozak配列(GCCACC)、ヌクレアーゼ配列、及び3’UTR、例えば、βグロビン-ポリAテール由来の3’UTRを含むPCRカセットを使用して合成することができる。カセットは、T7ポリメラーゼによる転写に使用することができる。ガイドポリヌクレオチド(例えば、gRNA)は、T7プロモーターとそれに続く配列「GG」及びガイドポリヌクレオチド配列を含むカセットからのin vitro転写を使用して転写することもできる。
発現を増強し、生じ得る毒性を低減するために、塩基エディターコード配列及び/またはガイド核酸を、例えば、シュードUまたは5-メチル-Cを使用して、1つ以上の修飾ヌクレオシドを含むように修飾することができる。
いくつかの実施形態における開示は、細胞または生物を改変する方法を包含する。細胞は、原核細胞または真核細胞であり得る。細胞は、哺乳類細胞であり得る。哺乳類細胞の多くは、非ヒト霊長類、ウシ、ブタ、げっ歯類、またはマウスの細胞である。本開示の塩基エディター、組成物及び方法によって細胞に導入される修飾は、抗体、デンプン、アルコールまたは他の所望の細胞出力などの生物学的産物の産生を向上させるために、細胞及び細胞の子孫を改変するようなものであり得る。本開示の方法によって細胞に導入される改変は、細胞及び細胞の子孫が、産生される生物学的産物を変化させる改変を含むようなものであり得る。
系は、1つ以上の異なるベクターを含み得る。一態様では、塩基エディターは、所望の細胞型、優先的には真核細胞、好ましくは哺乳類細胞またはヒト細胞の発現のためにコドン最適化される。
一般的に、コドン最適化とは、天然のアミノ酸配列を維持する一方で、天然の配列の少なくとも1つのコドン(例えば、約1、2、3、4、5、10、15、20、25、50、またはそれ以上のコドン)を、その宿主細胞の遺伝子でより頻繁にまたは最も頻繁に使用されるコドンに置換することによって、目的の宿主細胞における発現を増強するために核酸配列を改変するプロセスを指す。様々な種が、特定のアミノ酸の特定のコドンに対して特定のバイアスを示す。コドンバイアス(生物間のコドン使用の違い)は、メッセンジャーRNA(mRNA)の翻訳効率と相関することが多く、これは、とりわけ、翻訳されるコドンの特性及び特定の転移RNA(tRNA)分子の利用可能性に依存すると考えられている。選択されるtRNAが細胞内で優勢であることは、一般的に、ペプチド合成で最も頻繁に使用されるコドンを反映している。したがって、遺伝子は、コドン最適化に基づいて、所与の生物における最適な遺伝子発現のために調整することができる。コドン使用頻度表は、例えば、www.kazusa.orjp/codon/(2002年7月9日閲覧)の「コドン使用頻度データベース」で容易に入手することができ、これらの表は様々な方法に適合させることができる。Nakamura, Y., et al. “Codon usage tabulated from the international DNA sequence databases: status for the year 2000” Nucl. Acids Res. 28: 292 (2000)を参照されたい。特定の宿主細胞での発現のために特定の配列を最適化するコドンのためのコンピューターアルゴリズム、例えば、Gene Forge (Aptagen; Jacobus, Pa.)も利用可能である。いくつかの実施形態では、改変されたヌクレアーゼをコードする配列中の1つ以上のコドン(例えば、1、2、3、4、5、10、15、20、25、50、もしくはそれ以上、またはすべてのコドン)は、特定のアミノ酸に対して最も頻繁に使用されるコドンに対応する。
パッケージング細胞は、通常、宿主細胞を感染させることができるウイルス粒子を形成するために使用される。そのような細胞には、アデノウイルスをパッケージングする293細胞、及びレトロウイルスをパッケージングするpsi.2細胞またはPA317細胞が含まれる。遺伝子治療で使用されるウイルスベクターは、通常、核酸ベクターをウイルス粒子にパッケージングする細胞株を産生することによって生成される。ベクターは、通常、パッケージング及びその後の宿主への組み込みに必要な最小限のウイルス配列を含み、他のウイルス配列は、発現させるポリヌクレオチド(複数可)の発現カセットによって置き換えられる。不足しているウイルス機能は、通常、パッケージング細胞株によってトランスで供給される。例えば、遺伝子治療で使用されるAAVベクターは、通常、パッケージング及び宿主ゲノムへの組み込みに必要とされるAAVゲノム由来のITR配列のみを有する。ウイルスDNAは、他のAAV遺伝子、すなわち、rep及びcapをコードするがITR配列を欠如するヘルパープラスミドを含有する細胞株内でパッケージングされ得る。この細胞株を、ヘルパーとしてのアデノウイルスにも感染させることができる。ヘルパーウイルスは、AAVベクターの複製とヘルパープラスミドからのAAV遺伝子の発現を促進することができる。いくつかの場合では、ヘルパープラスミドは、ITR配列が不足しているために大量にパッケージングされない。例えば、AAVよりもアデノウイルスの方が感受性の高い熱処理によって、アデノウイルスによる汚染を減少させることができる。
インテイン
いくつかの実施形態では、ヌクレアーゼ(例えば、Cas9)の一部または断片を、インテインに融合させる。ヌクレアーゼは、インテインのN末端またはC末端に融合させることができる。いくつかの実施形態では、融合タンパク質の一部または断片を、インテインに融合し、そしてAAVキャプシドタンパク質に融合させる。インテイン、ヌクレアーゼ及びキャプシドタンパク質は、任意の配置で一緒に融合することができる(例えば、ヌクレアーゼ-インテイン-キャプシド、インテイン-ヌクレアーゼ-キャプシド、キャプシド-インテイン-ヌクレアーゼなど)。いくつかの実施形態では、インテインのN末端を、融合タンパク質のC末端に融合し、インテインのC末端を、AAVキャプシドタンパク質のN末端に融合する。
インテイン(介在タンパク質)は、様々な多様な生物において認められる自動プロセシングドメインであり、タンパク質スプライシングとして知られるプロセスを実行する。タンパク質スプライシングは、ペプチド結合の切断と形成の両方からなる多段階の生化学反応である。タンパク質スプライシングの内在性基質はインテイン含有生物に認められるタンパク質であるが、インテインは事実上あらゆるポリペプチド骨格を化学的に操作するためにも使用することができる。
タンパク質スプライシングでは、インテインは2つのペプチド結合を切断することによって前駆体ポリペプチドからそれ自体を切除し、それによって新規ペプチド結合の形成を介して隣接するエクステイン(外部タンパク質)配列を連結する。この再配置は、翻訳後に(または場合によっては同時翻訳的に)生じる。インテインを介したタンパク質のスプライシングは自発的に起こり、インテインドメインのフォールディングのみが必要である。
インテインの約5%はスプリットインテインであり、2つの別々のポリペプチド、N-インテインとC-インテインとして転写及び翻訳され、それぞれを1つのエクステインに融合させる。翻訳時に、インテイン断片は自発的かつ非共有結合的に標準的なインテイン構造に集合し、トランスでタンパク質スプライシングを実行する。タンパク質スプライシングの機構は、一連のアシル転移反応を伴い、その結果、インテイン-エクステイン接合部で2つのペプチド結合が切断され、N-エクステインとC-エクステインの間に新しいペプチド結合が形成される。このプロセスは、N-エクステインとインテインのN末端を結合するペプチド結合の活性化によって開始される。事実上すべてのインテインは、C末端のN-エクステイン残基のカルボニル炭素を攻撃するシステインまたはセリンをN末端に有する。このNからO/Sへのアシルシフトは、保存されたスレオニンとヒスチジン(TXXHモチーフと呼ばれる)、及び一般的に認められるアスパラギン酸によって促進され、その結果、直鎖状(チオ)エステル中間体が形成される。次に、この中間体を、システイン、セリン、またはスレオニンである第1のC-エクステイン残基(+1)の求核攻撃によるトランス-(チオ)エステル化に供する。得られた分岐(チオ)エステル中間体は、インテインの高度に保存されたC末端アスパラギンの環化というユニークな転換によって分解される。このプロセスは、ヒスチジン(高度に保存されたHNFモチーフに見出される)と最後から2番目のヒスチジンによって促進され、アスパラギン酸も関与している可能性がある。このスクシンイミド形成反応は、反応性複合体からインテインを切除し、非ペプチド結合を介して結合したエクステインを残す。この構造は、インテインに非依存的な方式で安定したペプチド結合に急速に再配置される。
いくつかの実施形態では、塩基エディターのN末端断片(例えば、ABE、CBE)を、スプリットインテイン-Nに融合し、C末端断片を、スプリットインテイン-Cに融合する。これらの断片を、次いで2つ以上のAAVベクターにパッケージングする。異種タンパク質断片を結合するための特定のインテインの使用は、例えば、Wood et al., J. Biol. Chem. 289 (21); 14512-9 (2014)に記載されている。例えば、別々のタンパク質断片に融合されると、インテインIntNとIntCは互いに認識し合い、インテイン自身をスプライスアウトし、同時に融合したタンパク質断片の隣接するN末端とC末端のエクステインを連結し、それによって2つのタンパク質断片から全長タンパク質を再構成する。他の適切なインテインは、当業者には明らかであろう。
いくつかの実施形態では、ABEを、SpCas9の選択された領域内のAla、Ser、Thr、またはCys残基でN末端断片及びC末端断片に分割した。これらの領域は、Cas9結晶構造分析によって同定されたループ領域に対応する。各断片のN末端をインテイン-Nに融合し、各断片のC末端をアミノ酸位置S303、T310、T313、S355、A456、S460、A463、T466、S469、T472、T474、C574、S577、A589、及びS590でインテイン-Cに融合し、これらを、以下の配列に太字の大文字で示す。
Figure 2022546608000100
医薬組成物
本開示の他の態様は、本明細書に記載の塩基エディター、融合タンパク質、融合タンパク質-ガイドポリヌクレオチド複合体、または編集された細胞のいずれかを含む医薬組成物に関する。本明細書中で使用する場合、用語「医薬組成物」とは、医薬用途のために製剤化された組成物を指す。いくつかの実施形態では、医薬組成物は、薬学的に許容される担体をさらに含む。いくつかの実施形態では、医薬組成物は、追加の薬剤(例えば、特異的送達、半減期の増加、または他の治療化合物のための)を含む。
本明細書中で使用する場合、用語「薬学的に許容される担体」とは、薬学的に許容される材料、組成物、またはビヒクル、例えば、液体または固体充填剤、希釈剤、賦形剤、製造用助剤(例えば、滑沢剤、タルクマグネシウム、ステアリン酸カルシウムもしくはステアリン酸亜鉛、またはステアリン酸)、または、身体のある部分(例えば、送達部位)から別の部位(例えば、臓器、組織または身体の部分)への化合物の担持もしくは輸送に関与する溶媒カプセル化材料を意味する。薬学的に許容される担体は、製剤の他の成分と適合性があり、対象の組織に有害ではない(例えば、生理学的な適合性、無菌、生理学的pHなど)という意味で「許容可能」である。
薬学的に許容される担体として機能し得る物質のいくつかの非限定的な例として:(1)糖、例えば、ラクトース、グルコース、及びスクロース; (2)澱粉、例えば、トウモロコシ澱粉及び馬鈴薯澱粉; (3)セルロース、及びその誘導体、例えば、カルボキシメチルセルロースナトリウム、メチルセルロース、エチルセルロース、微結晶セルロース、及び酢酸セルロース; (4)粉末トラガカント; (5)麦芽; (6)ゼラチン; (7)潤滑剤、例えば、ステアリン酸マグネシウム、ラウリル硫酸ナトリウム、及びタルク; (8)賦形剤、例えば、カカオバター及び坐剤用ワックス; (9)油類、例えば、ピーナッツ油、綿実油、ベニバナ油、ゴマ油、オリーブ油、トウモロコシ油、及びダイズ油; (10)グリコール、例えば、プロピレングリコール; (11)ポリオール、例えば、グリセリン、ソルビトール、マンニトール、及びポリエチレングリコール(PEG); (12)エステル、例えば、オレイン酸エチル及びラウリン酸エチル; (13)寒天; (14)緩衝剤、例えば、水酸化マグネシウム及び水酸化アルミニウム; (15)アルギン酸; (16)無発熱物質水; (17)等張食塩水; (18)リンゲル液; (19)エチルアルコール; (20)pH緩衝液; (21)ポリエステル、ポリカーボネート、及び/またはポリ無水物; (22)増量剤、例えば、ポリペプチド及びアミノ酸; (23)血清アルコール、例えば、エタノール;ならびに(23)薬学的製剤に用いられる他の非毒性で適合性の物体が挙げられる。湿潤剤、着色剤、離型剤、コーティング剤、甘味剤、香味剤、芳香剤、防腐剤及び抗酸化剤もまた、製剤中に存在させることができる。「賦形剤」、「担体」、「薬学的に許容される担体」、「ビヒクル」などの用語は、本明細書中では同じ意味で使用される。
医薬組成物は、1つ以上のpH緩衝化合物を含み、製剤のpHを、生理学的pH、例えば、約5.0~約8.0の範囲を反映する所定のレベルに維持することができる。水性液体製剤で使用されるpH緩衝化合物は、ヒスチジンなどのアミノ酸またはアミノ酸の混合物、あるいはヒスチジン及びグリシンなどのアミノ酸の混合物であり得る。あるいは、pH緩衝化合物は、好ましくは、製剤のpHを所定のレベル、例えば、約5.0~約8.0の範囲に維持し、カルシウムイオンをキレート化しない薬剤である。そのようなpH緩衝化合物の例示的な例として、イミダゾール及び酢酸イオンが挙げられるが、これらに限定されない。pH緩衝化合物は、製剤のpHを所定のレベルに維持するのに適した任意の量で存在させてよい。
医薬組成物はまた、1つ以上の浸透圧調節剤、すなわち、製剤の浸透圧特性(例えば、等張性、重量オスモル濃度、及び/または浸透圧)をレシピエント個体の血流及び血球に許容可能なレベルに調節する化合物を含み得る。浸透圧調節剤は、カルシウムイオンをキレート化しない薬剤であり得る。浸透圧調節剤は、製剤の浸透圧特性を調節する当業者に公知のまたは利用可能な任意の化合物であり得る。当業者であれば、本発明の製剤で使用するための所与の浸透圧調節剤の適合性を経験的に決定し得る。適切なタイプの浸透圧調節剤の例示的な例として:塩化ナトリウム及び酢酸ナトリウムなどの塩; ショ糖、ブドウ糖、マンニトールなどの糖; グリシンなどのアミノ酸;ならびにこれらの薬剤及び/または薬剤の種類の1つ以上の混合物が挙げられるが、これらに限定されない。浸透圧調節剤(複数可)は、製剤の浸透圧特性を調節するのに十分な任意の濃度で存在させてよい。
いくつかの実施形態では、医薬組成物を、対象へ送達するために、例えば、遺伝子編集用に製剤化する。本明細書に記載の医薬組成物を投与する適切な経路として、限定されないが:局所、皮下、経皮、皮内、病変内、関節内、腹腔内、膀胱内、経粘膜、歯肉内、歯内、蝸牛内、鼓室内、臓器内、硬膜外、髄腔内、筋肉内、静脈内、血管内、骨内、眼周囲、腫瘍内、脳内、及び脳室内投与が挙げられる。
いくつかの実施形態では、本明細書に記載の医薬組成物を、疾患部位、例えば、腫瘍部位に局所的に投与する。いくつかの実施形態では、本明細書に記載の医薬組成物を、注射、カテーテル、坐剤、またはインプラントによって対象に投与し、インプラントは、シラスティック膜(sialastic membrane)などの膜、または繊維を含む、多孔性、非多孔性、またはゼラチン状の物質である。
他の実施形態では、本明細書に記載の医薬組成物を、徐放系で送達する。一実施形態では、ポンプを使用することができる(例えば、Langer, 1990, Science 249: 1527-1533; Sefton, 1989, CRC Crit. Ref. Biomed. Eng. 14: 201; Buchwald et al., 1980, Surgery 88:507; Saudek et al., 1989, N. Engl. J. Med. 321: 574を参照されたい)。別の実施形態では、重合物質を使用することができる。(例えば、Medical Applications of Controlled Release (Langer and Wise eds., CRC Press, Boca Raton, Fla., 1974); Controlled Drug Bioavailability, Drug Product Design and Performance (Smolen and Ball eds., Wiley, New York, 1984); Ranger and Peppas, 1983, Macromol. Sci. Rev. Macromol. Chem. 23:61を参照されたい。Levy et al., 1985, Science 228: 190; During et al., 1989, Ann. Neurol. 25: 351; Howard et ah, 1989, J. Neurosurg. 71:105も参照されたい)。他の徐放系は、例えば、Langer(上記)で議論されている。
いくつかの実施形態では、医薬組成物を、対象、例えば、ヒトへの静脈内または皮下投与に適合した組成物として、通常の手順に従って製剤化する。いくつかの実施形態では、注射による投与のための医薬組成物は、可溶化剤としての無菌等張使用の溶液、及び注射部位の痛みを和らげるためのリグノカインなどの局所麻酔薬である。一般的に、成分は、単位剤形で、例えば、活性薬剤の量を示すアンプルもしくはサシェなどの気密封止容器内に乾燥させた凍結乾燥粉末または水不含濃縮物として、別々に供給するか、あるいは一緒に混合して供給される。本薬剤は、点滴によって投与する場合、無菌の医薬グレードの水または食塩水を含む点滴ボトルで分注することができる。医薬組成物を注射によって投与する場合、成分が投与前に混合され得るように、注射用の滅菌水または食塩水のアンプルを提供してもよい。
全身投与用の医薬組成物は、液体、例えば、滅菌生理食塩水、乳酸リンゲル液またはハンクス溶液であり得る。さらに、医薬組成物を固体形態とし、使用直前に再溶解または懸濁することができる。凍結乾燥形態もまた、企図される。医薬組成物は、リポソームまたは微結晶などの脂質粒子または小胞内に含むことができ、これは非経口投与にも適している。粒子は、組成物がその中に含まれている限り、単層または複数層などの任意の適切な構造のものとすることができる。化合物を、融合性脂質ジオレオイルホスファチジルエタノールアミン(DOPE)、低レベル(5~10mol%)のカチオン性脂質を含む「安定化プラスミド-脂質粒子」(SPLP)に封入し、ポリエチレングリコール(PEG)コーティングによって安定化させることができる(Zhang Y. P. et ah, Gene Ther. 1999, 6: 1438-47)。N-[1-(2,3-ジオレオイルオキシ)プロピル]-N,N,N-トリメチル-アンモニウムメチルサルフェート、または「DOTAP」などの正に帯電した脂質は、そのような粒子及び小胞にとって特に好ましい。そのような脂質粒子の調製は周知である。例えば、米国特許第4,880,635号;第4,906,477号;第4,911,928号;第4,917,951号;第4,920,016号;及び第4,921,757号を参照されたい; これらのそれぞれは、参照により本明細書に援用される。
本明細書に記載の医薬組成物は、例えば、単位用量として投与またはパッケージングすることができる。本開示の医薬組成物に関して使用する場合の用語「単位用量」とは、対象にとっての単位用量として適切な物理的に別個の単位を指し、各単位は、必要な希釈剤; すなわち、担体またはビヒクルと共に所望の治療効果を生み出すように計算された所定量の活性物質を含む。
さらに、医薬組成物は、(a)凍結乾燥形態の本発明の化合物を含む容器、及び(b)薬学的に許容される希釈剤(例えば、本発明の凍結乾燥化合物の再構成または希釈に使用される滅菌剤)を含む第2の容器を含む医薬キットとして提供することができる。医薬品または生物学的製品の製造、使用、または販売を規制する政府機関が定めた形式の通知を、任意選択でそのような容器(複数可)に付属させることができ、この通知は、ヒトへの投与に対する製造、使用、または販売の政府機関による承認を表す。
別の態様では、上記の疾患の治療に有用な物質を含む製品が含まれる。いくつかの実施形態では、製品は、容器及びラベルを含む。好適な容器として、例えば、ボトル、バイアル、シリンジ、及び試験管が挙げられる。容器は、ガラスまたはプラスチックなどの多様な材料から形成され得る。いくつかの実施形態では、容器は、本明細書に記載の疾患を治療するのに有効な組成物を保持し、滅菌アクセスポートを有し得る。例えば、容器は、皮下注射針によって貫通可能なストッパーを有する静脈内溶液バッグまたはバイアルであり得る。組成物中の活性薬剤は、本発明の化合物である。いくつかの実施形態では、容器上の、または容器に付随するラベルは、選択される疾患を治療するために組成物を使用することを示す。製品は、薬学的に許容される緩衝液、例えば、リン酸緩衝食塩水、リンゲル液、またはブドウ糖液を含む第2の容器をさらに含み得る。製品は、他の緩衝液、希釈剤、フィルター、針、シリンジ、及び使用に関する指示を有する添付文書を含む、商業的観点及び使用者の観点から望ましい他の物質をさらに含み得る。
いくつかの実施形態では、本明細書に記載の融合タンパク質、gRNA、複合体、及び/または細胞のいずれかを、医薬組成物の一部として提供する。いくつかの実施形態では、医薬組成物は、本明細書中で提供する融合タンパク質のいずれかを含む。いくつかの実施形態では、医薬組成物は、本明細書中で提供する複合体のいずれかを含む。いくつかの実施形態では、医薬組成物は、gRNA及びカチオン性脂質と複合体を形成するRNAガイドヌクレアーゼ(例えば、Cas9)を含むリボヌクレオタンパク質複合体を含む。いくつかの実施形態では、医薬組成物は、gRNA、核酸プログラム可能なDNA結合タンパク質、カチオン性脂質、及び薬学的に許容される賦形剤を含む。いくつかの実施形態では、医薬組成物は、本明細書に記載の生成物、系、及び方法によって編集された細胞を含む。医薬組成物は、任意選択で、1つ以上の追加の治療的に活性な物質を含む。
遺伝性疾患の治療法
また、本明細書に記載の塩基エディターシステム(例えば、塩基エディター及びgRNA)をコードするポリヌクレオチドを含む治療有効量の医薬組成物を対象(例えば、ヒトなどの哺乳類)に投与することを含む、遺伝性疾患に関連する病原性変異の治療方法も提供する。一実施形態では、遺伝性疾患は、α-1アンチトリプシン欠乏症(A1AD)である。いくつかの実施形態では、塩基エディターは、ポリヌクレオチドプログラム可能なDNA結合ドメイン及びアデノシンデアミナーゼドメインを含む融合タンパク質である。対象の細胞に、塩基エディター及び塩基エディターを標的とする1つ以上のガイドポリヌクレオチドで形質導入し、野生型配列に対して変異を含む核酸配列のA・TからG・Cへの改変(細胞をアデノシンデアミナーゼドメインで形質導入する場合)を生じさせる。
本明細書の方法は、対象(そのような治療を必要としていると特定された対象、または疾患のリスクを有する疑いがあり、そのような治療を必要としている対象を含む)に、本明細書に記載の有効量の組成物を投与することを含む。そのような治療を必要とする対象の同定は、対象または医療専門家の判断で行うことができ、主観的(例えばオピニオン)または客観的(例えば、試験または診断方法によって測定可能)であり得る。
治療方法は、一般的に、例えば、塩基エディター及び治療を必要とする対象(例えば、ヒト患者)の目的の遺伝子を標的とするgRNAをコードするベクターを含む治療有効量の医薬組成物を投与することを含む。そのような治療は、遺伝性疾患に罹患しているか、有しているか、感受性があるか、またはそのリスクがある対象、特にヒト対象に適切に投与されるであろう。一実施形態では、遺伝性疾患は、α-1アンチトリプシン欠乏症(A1AD)である。
一実施形態では、治療の進行をモニタリングする方法を提供する。この方法は、病原性変異に関連する障害もしくはその症状に罹患しているか、または罹患しやすい対象における診断マーカー(マーカー)(例えば、疾患に関連するSNP)または診断測定(例えば、スクリーニング、アッセイ)のレベルを測定するステップを含み、対象は、疾患またはその症状を治療するのに十分な治療量の本明細書の組成物を投与されている。この方法で測定されたマーカーのレベルは、健康な正常な対照または他の罹患患者のいずれかにおける既知のマーカーのレベルと比較して、対象の疾患状態を確立することができる。好ましい実施形態では、対象におけるマーカーの第2のレベルを、第1のレベルの測定より後の時点で測定し、2つのレベルを比較して、疾患の経過または治療の有効性をモニタリングする。特定の好ましい実施形態では、対象におけるマーカーの治療前レベルを、本発明による治療を開始する前に測定し; 次いで、このマーカーの治療前のレベルを、治療開始後の対象のマーカーのレベルと比較して、治療の有効性を判定することができる。
いくつかの実施形態では、本明細書中で提供する組成物を、対象、例えば、ヒト対象に、その対象内で標的化されたゲノム修飾を行うために投与する。一実施形態では、ゲノム修飾は、本明細書の実施例3に記載されている通りであり、遺伝性疾患は、α-1アンチトリプシン欠乏症(A1AD)である。いくつかの実施形態では、細胞を対象から採取し、本明細書中で提供する医薬組成物のいずれかと接触させる。いくつかの実施形態では、対象から取り出され、ex vivoで医薬組成物と接触させた細胞を、任意選択で、所望のゲノム修飾が細胞において行われるかまたは検出された後に、対象に再導入する。ヌクレアーゼを含む医薬組成物の送達方法は公知であり、例えば、米国特許第6,453,242号;第6,503,717号;第6,534,261号;第6,599,692号;第6,607,882号;第6,689,558号;第6,824,978号;第6,933,113号;第6,979,539号;第7,013,219号;及び第7,163,824号に記載されており、これらすべての開示は、その全体が参照により本明細書に援用される。本明細書中で提供する医薬組成物の説明は、主にヒトへの投与に適した医薬組成物を対象としているが、当業者であれば、そのような組成物が一般にあらゆる種類の動物または生物への投与に、例えば、獣医学用途に適していることを理解している。
組成物を様々な動物への投与に適したものにするためのヒトへの投与に適した医薬組成物の改変は周知であり、獣医薬理学の当業者であれば、通常の実験(存在する場合)のみでそのような改変を設計及び/または実行することができる。医薬組成物の投与が企図される対象には、ヒト及び/または他の霊長類; 哺乳類、家畜動物、ペット、ならびにウシ、ブタ、ウマ、ヒツジ、ネコ、イヌ、マウス、及び/またはラットなどの商業的に適切な哺乳類;及び/またはニワトリ、アヒル、ガチョウ、及び/またはシチメンチョウを含む商業的に適切なトリが含まれるが、これらに限定されない。
本明細書に記載の医薬組成物の製剤は、薬理学の分野で知られているか、または今後開発される任意の方法によって調製することができる。一般的に、そのような調製方法は、活性成分(複数可)を賦形剤及び/または1つ以上の他の付属成分と結合させ、次いで、必要及び/または望ましい場合、製品を望ましい単回投与または複数回投与ユニットに成形及び/または包装するステップを含む。医薬製剤には、薬学的に許容される賦形剤をさらに含ませることができ、これには、本明細書中で使用する場合、所望の特定の剤形に適する任意のすべての溶媒、分散媒体、希釈剤、または他の液体ビヒクル、分散剤または懸濁助剤、界面活性剤、等張剤、増粘剤または乳化剤、保存剤、固体結合剤、潤滑剤などが含まれる。Remington’s The Science and Practice of Pharmacy, 21st Edition, A. R. Gennaro (Lippincott, Williams & Wilkins, Baltimore, MD, 2006;その全体が参照により本明細書に援用される)は、医薬組成物の製剤化に使用する様々な賦形剤及びその調製のための既知の技術を開示している。ヌクレアーゼを含む医薬組成物を製造するための追加の適切な方法、試薬、賦形剤、及び溶媒については、その全体が参照により本明細書に援用されるPCT出願PCT/US2010/055131(公開番号WO2011/053882A8、2010年11月2日出願)も参照されたい。
従来の賦形剤媒体が、例えば、望ましくない生物学的効果を生み出すことによって、または他の態様で医薬組成物の他の成分(複数可)と有害な方法で相互作用することによって、物質またはその誘導体と適合しない場合を除いて、その使用は、本開示の範囲内であるように企図される。
上記のように、組成物は有効量で投与することができる。有効量は、投与方法、治療される特定の病態、及び所望する結果によって異なる。それはまた、病期、対象の年齢及び身体状態、もしあれば同時療法の性質、及び医師に周知の同様の要因に依存し得る。治療用途の場合、有効量は、医学的に望ましい結果を達成するのに十分な量である。
キット
本開示の様々な態様は、塩基エディターシステムを含むキットを提供する。一実施形態では、キットは、核酸塩基エディター融合タンパク質をコードするヌクレオチド配列を含む核酸構築物を含む。融合タンパク質は、デアミナーゼ(例えば、アデニンデアミナーゼ)及び核酸プログラム可能なDNA結合タンパク質(napDNAbp)を含む。いくつかの実施形態では、キットは、目的の核酸分子を標的化することができる少なくとも1つのガイドRNAを含む。いくつかの実施形態では、キットは、少なくとも1つのガイドRNAをコードするヌクレオチド配列を含む核酸構築物を含む。いくつかの実施形態では、キットは、本明細書に記載の塩基エディターの生成物、系、及び方法によって編集された細胞を含む。いくつかの実施形態では、キットは、本明細書に記載の医薬組成物のいずれかを含む。特定の実施形態では、キットは、移植または生着のために対象をコンディショニングするために有用である。
キットは、いくつかの実施形態では、疾患、病状、障害、または病態に関連し得る1つ以上の変異を編集するための、キットを使用するための説明書を提供する。説明書には、通常、核酸分子を編集するためのキットの使用に関する情報が含まれる。他の実施形態では、説明書は、以下のうちの少なくとも1つを含む:注意書き; 警告; 臨床試験; 及び/または参考文献。説明書は、容器(存在する場合)に直接印刷するか、もしくは容器に貼付されたラベルとして、または容器に供給されるかもしくは付属される別個のシート、パンフレット、カード、またはフォルダとして印刷され得る。さらなる実施形態では、キットは、適切な動作パラメータのためのラベルまたは別個の挿入物(添付文書)の形態の説明書を含み得る。さらに別の実施形態では、キットは、検出、較正、または正規化のための標準(複数可)として使用される、適切な陽性及び陰性対照または対照試料を含む1つ以上の容器を含み得る。キットは、(滅菌)リン酸緩衝生理食塩水、リンゲル液、またはデキストロース溶液などの薬学的に許容される緩衝液を含む第2の容器をさらに含み得る。キットは、他の緩衝液、希釈剤、フィルター、針、注射器、及び使用のための説明が記された添付文書を含む、商業的及びユーザーの観点から望ましい他の材料をさらに含み得る。
以下の実施例は、説明のみを目的として提供されており、本明細書中で提供する特許請求の範囲を限定することを意図するものではない。
実施例1.塩基エディターでのPAMバリアントの検証
新規CRISPR系とPAMバリアントにより、塩基エディター(例えば、表14及び18に記載のABE9)は、目的のポリヌクレオチドに存在する変異を編集することができる。いくつかの新規PAMバリアントを評価し、検証した。PAM評価及び塩基エディターの詳細は、例えば、国際PCT出願第PCT/2017/045381(WO2018/027078)及びPCT/US2016/058344(WO2017/070632)に記載されており、それぞれは、その全体が参照により本明細書に援用される。Komor, A. C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N. M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017);及びKomor, A. C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3: eaao4774 (2017)も参照のこと(それぞれの全内容は、参照により本明細書に援用される)。
実施例2.ABE8またはABE9を使用した遺伝子編集
ABE9塩基エディターを生成するために、ABE8.20の多数の位置で可能なすべてのアミノ酸置換を含むテンプレートとして、ABE8.20(ヘテロ二量体_(WT)+(TadA*7.10+Q154R))から始めて合成ライブラリーを生成した。選抜のために、AからGへの塩基編集について4つの部位を一度に標的とし、それによって4つの異なる選択条件下での生存及び増殖を可能にさせた。表14に記載の塩基エディターを以下のgRNAと組み合わせて使用し、ヒトHEK293において、改変を含む標的ポリヌクレオチドを編集した。例示的な標的配列は以下の通りである:
HRB03
GCTGGCAGCAAGGGCGGCGCTGG
HRB04
GCAGCCGCACCCTCAAGCAACGG
HRB08
GTAGCTGACTCACTGCTAGCTGG
HRB12
GAGTCCGAGCAGAAGAAGAAGGG
ng-424
GATGAGAAGGAGAAGTTCTTAGG
以下の中から選択されたガイドRNAを使用して、目的のポリヌクレオチドを標的化した:
HRB03
5’-GCUGGCAGCAAGGGCGGCGCUGG-3’
HRB04
GCAGCCGCACCCUCAAGCAACGG
HRB08
GUAGCUGACUCACUGCUAGCUGG
HRB12
GAGUCCGAGCAGAAGAAGAAGGG
ng-424
GAUGAGAAGGAGAAGUUCUUAGG
上記のgRNAと複合体を形成したアデノシン塩基エディターのA>G編集活性を試験した。ABE9.1-ABE9.58(pNMG-B531-634)の活性のA>G編集活性を図1及び図2に示す。ABE7*10との関係における各ABE9エディターでの改変を、表14及び表18に示す。ABE8.32、ABE8.33、ABE8.39、及びABE8.40の活性も試験した。単量体であるABE8.32は、以下の改変: V82S+Q154R+Y147R+Y123H(pNMG-B433)を含む。単量体であるABE8.33(pNMG-B434)は、以下の改変: Q154R+Y147R+Y123H+I76Y V82Sを含み、二量体であるABE8.39(pNMG-B440)は、以下の改変: V82S+Q154R+Y147R+Y123Hを含み、二量体であるABE8.40(pNMG-B441)は、以下の改変: Q154R+Y147R+Y123H+I76Y+V82Sを含んでいた。この試験の結果は、図1及び2に定量化されており、プラスミド番号によってアデノシン塩基エディターを示している。
実施例3.ABE9によるα-1アンチトリプシン欠乏(A1AD)変異の修正
α-1アンチトリプシン欠乏症(A1AD)は、肝臓(肝細胞)に影響を及ぼす疾患であり、常染色体の共優性の様式で遺伝的に受け継がれる。α-1アンチトリプシン(A1AT)は、ヒト14番染色体上のSERPINA1遺伝子によってコードされる糖タンパク質プロテアーゼ阻害剤である。A1ATは、主に肝臓で合成され、血流に分泌され; 健康な成人におけるA1ATの一般的な血清濃度は1.5~3.0 g/L(20~52 μmol/L)である。血液から、A1ATは肺間質と肺胞内膜液に拡散し、そこで好中球エラスターゼを不活性化し、プロテアーゼを介した損傷から肺組織を保護する。
SERPINA1遺伝子の100を超える遺伝的変異が報告されているが、すべてが疾患に関連しているわけではない。これらの遺伝的変異のアルファベット記号は、それらのゲル電気泳動での移動速度に基づいている。最も一般的なバリアントは、M(中程度の移動性)アリール(PiM)であり、2つの最も高頻度欠損アリールは、PiS及びPiZ(後者は最も遅い移動速度を有する)である。測定可能な血清タンパク質を生成しないいくつかの変異が報告されており、これらは「ヌル」アリールと呼ばれる。最も一般的な遺伝子型はMMであり、これは正常な血清レベルのα-1アンチトリプシンを生成する。重度の欠乏症を有する多くの個体は、Zアリール(ZZ)についてホモ接合である。米国では60,000人超のA1AD患者が、重度のZZ表現型を有している。Zタンパク質は、肝細胞の小胞体内での産生中に誤って折りたたまれ、重合する。これらの異常なポリマーは肝臓に閉じ込められ、A1ATの血清レベルを大幅に低下させる。欠乏または不安定なA1AT産生は、A1ADに罹患している患者の肝臓及び/または肺の病理を引き起こす。A1ADの患者に認められる肝疾患は、肝細胞における異常なA1ATタンパク質の蓄積と、その結果としてのオートファジー、小胞体ストレス応答及びアポトーシスなどの細胞応答によって引き起こされる。A1ATの循環レベルが低下すると、肺の好中球エラスターゼ活性が上昇する。プロテアーゼと抗プロテアーゼの不均衡は、この病理に関連する肺疾患を引き起こす。
A1ADにより、患者は、肝細胞癌にかかりやすくなり得る。肝疾患の発症にはホモ接合性ZZ遺伝子型が必要であるが、ヘテロ接合性Z変異は、C型肝炎感染及び嚢胞性線維症肝疾患など、より重度の肝疾患のリスクを高めることにより、他の疾患の遺伝的修飾因子として作用する。
A1ADの2つの最も一般的な臨床的バリアントは、E264V(PiS)及びE342K(PiZ)アリールである。臨床的な単一ヌクレオチドバリアントE342K(PiZ)は、不安定及び/または不活性なA1ATタンパク質を生じさせ、その結果、肝臓及び肺の毒性を引き起こす。遺伝は、常染色体の共優性である。A1AD患者の半数超が、変異E342Kの少なくとも1つのコピーを有する。
Figure 2022546608000101
本明細書、例えば、表14及び18、ならびに図3A~3Cに記載のABE9を含む塩基エディター及び塩基エディターシステムは、E342K(PiZアリール)などのSERPINA1遺伝子の病原性変異の修正に特に有用である。特定の例では、位置7のAをGに編集して、PiZアリールを野生型アリールに復元する(図4A)。
この実施例では、例えば、図3A~3C及び4Bに示すように、選択されたABE9構築物を、E342K変異(HEK293T-E342K)を含むA1ATを発現するHEK293細胞内での塩基編集活性について評価した。実験では、250ngのgRNAプラスミド及びTadAデアミナーゼバリアント(例えばTadA*9)をコードする750ngのプラスミドを使用して、HEK293細胞用に最適化された高効率で低毒性のDNAトランスフェクション試薬Mirus TransIT293を3μl:1μgの比率で用いて、HEK293T-E342K細胞を一過性にトランスフェクトした(図4B)。HEK293T-E342K細胞を、2.5 μgのABE9 mRNAと、長さが20ヌクレオチド(nt)の1000ngのgRNA[191]を使用したエレクトロポレーション(Neonエレクトロポレーション)によってトランスフェクトした。spCas9塩基エディター用のsgRNAとして提供されるgRNAバックボーン(足場)は以下の通りである: 5’-GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU-3’。spCas9塩基エディター用のsgRNAとして提供される別のgRNA足場は以下の通りである: 5’-GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGGACCGAGU CGGUGCUUUU-3’。一実施形態では、上記のgRNA足場の末端ウラシル(U)は、任意選択で、「mU*mU*mU*U」を有していてもよく、これらは2’OMeを示し、ホスホロチオエート結合を有する。
記載されている方法で有用なガイドRNAには以下が含まれる:
5’-ACCAUCGACAAGAAAGGGACUGA GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU-3’;
5’-CCAUCGACAAGAAAGGGACUGA GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU-3’;
5’-CAUCGACAAGAAAGGGACUGA GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU-3’;
5’-AUCGACAAGAAAGGGACUGA GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU-3’;
5’-UCGACAAGAAAGGGACUGA GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU-3’;
5’-CGACAAGAAAGGGACUGA GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU-3’。
プラスミドトランスフェクション(4日後)及びRNAエレクトロポレーション(2日後)に続いて、ゲノムDNAを0.05% SDS、25 μg/mlプロテイナーゼK、10mM Tris pH8.0のシンプルな溶解緩衝液で抽出し、続いて85℃で加熱不活性化した。ゲノム部位をPCR増幅し、MiSeqで配列決定した。各位置での塩基出現頻度及びインデルの割合について、当業者によって以前に記述され実施されたように結果を分析した。インデル計算の詳細は、国際PCT出願第PCT/2017/045381号及び第PCT/US2016/058344号に記載されており、これらのそれぞれは、その全体が参照により本明細書に援用される。また、Komor, A. C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N. M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature, 551, 464-471 (2017);及びKomor, A. C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3: eaao 4774 (2017)も参照のこと(その全内容は、参照により本明細書に援用される)。
ABE9塩基エディター(図3A~3C及び4B)の塩基編集活性を、19または20ヌクレオチド長のガイドRNAを使用して、HEK293T-E342K細胞においてアッセイした。gRNAは、様々な製造元、すなわちAxoLabs(Germany)及びSynthego(Menlo Park, CA)によって製造された。図4C及び4Dに示すように、V82T変異を含むTadAデアミナーゼバリアントを含む塩基エディターは、対照エディター(AVT686)と比較して高レベルの効率及び特異性を示し、継続的なエディター改変を通じて初代PiZZ線維芽細胞の核酸塩基修正率の向上に関連するデータ及び結果を提供する。図5Aは、図4Bに示すようなTadA*デアミナーゼバリアント、特に、LNPによって送達されるバリアント8及び9を含む塩基エディターを使用した、全肝臓gDNAにおけるバイスタンダー編集に対比される標的アリールの特異的塩基編集を示すグラフを示す。図5Bは、図4Bに示すようなTadA*デアミナーゼバリアント、特にバリアント8及び9を含む塩基エディターを使用した、NSG-PiZトランスジェニックマウスにおける脂質ナノ粒子(LNP)媒介送達及び塩基編集によって生成される血清A1ATの増加に関連するデータ及び結果のグラフを示す。
様々な実験において、本明細書に記載するような特定の変異を含むTadA*9アデノシンデアミナーゼバリアント成分、及びCas9成分(例えば、Cas9タンパク質が5’-NGC-3’PAMに結合する能力を付与するアミノ酸変異を含むSpCas9バリアント成分(例えば、SpCas9))を含むABE9塩基エディターをコードするプラスミド(例えば、mRNAプラスミド)を、図3A~3C、及び以下に示すように使用した:
変異I76Y+V82T+Y147T+Q154S+A109Sを有するmonoTadA*7.10及び変異I322V、S409I、E427G、R654L、R753Gを有するspCas9 (MQKFRAER);
変異I76Y+V82T+Y147T+Q154S+T111Rを有するmonoTadA*7.10及び変異I322V、S409I、E427G、R654L、R753Gを有するspCas9 (MQKFRAER);
変異I76Y+V82T+Y147T+Q154S+D119Nを有するmonoTadA*7.10及び変異I322V、S409I、E427G、R654L、R753Gを有するspCas9 (MQKFRAER);
変異I76Y+V82T+Y147T+Q154S+H122Nを有するmonoTadA*7.10及び変異I322V、S409I、E427G、R654L、R753Gを有するspCas9 (MQKFRAER);
変異I76Y+V82T+Y147d+Q154Sを有するmonoTadA*7.10及び変異I322V、S409I、E427G、R654L、R753Gを有するspCas9 (MQKFRAER);
変異I76Y+V82T+Y147T+Q154S+F149Yを有するmonoTadA*7.10及び変異I322V、S409I、E427G、R654L、R753Gを有するspCas9 (MQKFRAER);
変異I76Y+V82T+Y147T+Q154S+T166Iを有するmonoTadA*7.10及び変異I322V、S409I、E427G、R654L、R753Gを有するspCas9 (MQKFRAER);ならびに
変異I76Y+V82T+Y147T+Q154S+D167Nを有するmonoTadA*7.10及び変異I322V、S409I、E427G、R654L、R753Gを有するspCas9 (MQKFRAER);
変異I76Y+V82T+Y147T+Q154S+L36H+N157Kを有するmonoTadA*7.10、変異I322V、S409I、E427G、R654L、R753G、R1114Gを有するspCas9 (MQKFRAER);
変異I76Y+V82T+Y147D+Q154S+F149Y+D167N+L36H+N157Kを有するmonoTadA*7.10、変異I322V、S409I、E427G、R654L、R753G、R1114Gを有するSpCas9、MQKFRAER;
変異I76Y+V82T+Y147D+Q154S+F149Y+D167N+L36H+N157K+V106Wを有するmonoTadA*7.10及び変異I322V、S409I、E427G、R654L、R753G、R1114Gを有するSpCas9、MQKFRAER
monoABE9e:変異A109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167Nを有するTadA*7.10及び変異I322V、S409I、E427G、R654L、R753G、R1114Gを有するSpCas9、MQKFRAER; ならびに
monoABE9e:変異A109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167N+V106Wを有するTadA*7.10及び変異I322V、S409I、E427G、R654L、R753G、R1114Gを有するSpCas9、MQKFRAER。
ABE9塩基エディターはまた、バイスタンダーのアデニン(A)と対比される、オンターゲットのA塩基の正確な編集(すなわち、A・TからG・Cへの変換)を提供し、A1AD標的部位での非常に効率的で治療に適切な編集を可能にする。例えば、ABE9を使用したE342Kの塩基編集による正確な変異修正は、循環AATレベルを(例えば、5~15 μMを超えるレベルまで)回復させ、A1ADに罹患している対象の肺機能と肝機能の両方を改善させる能力を提供する。実施形態では、ABE9塩基エディターを、細胞に導入するか、または脂質ナノ粒子(LNP)媒介送達によって投与して、例えば、NSG-PiZトランスジェニックマウスにおいて血清A1AT塩基編集を増加させてもよい。
実施例4.材料及び方法
本明細書に記載の実施例で提供される結果は、以下の材料及び方法を使用して得られた。
本発明において有用なABEは、ABE7*10(上記のABE7*10のアミノ酸配列)と比較して、以下のアミノ酸改変のうちの1つ以上を有する:R21N、R23H、E25F、N38G、L51W、P54C、M70V、Q71M、N72K、Y73S、V82T、M94V、P124W、T133K、D139L、D139M、C146R、及びA158K。
本発明において有用なアデノシンデアミナーゼドメインは、以下の改変の組み合わせを含む: V82S+Q154R+Y147R; V82S+Q154R+Y123H; V82S+Q154R+Y147R+Y123H; Q154R+Y147R+Y123H+I76Y+V82S; V82S+I76Y; V82S+Y147R; V82S+Y147R+Y123H; V82S+Q154R+Y123H;Q154R+Y147R+Y123H+I76Y;V82S+Y147R;V82S+Y147R+Y123H;V82S+Q154R+Y123H;V82S+Q154R+Y147R;V82S+Q154R+Y147R;Q154R+Y147R+Y123H+I76Y;Q154R+Y147R+Y123H+I76Y+V82S;I76Y_V82S_Y123H_Y147R_Q154R;Y147R+Q154R+H123H; 及びV82S+Q154R。
本発明において有用な他のアデノシンデアミナーゼドメインは、以下の改変の組み合わせを含む: E25F+V82S+Y123H、T133K+Y147R+Q154R; E25F+V82S+Y123H+Y147R+Q154R; L51W+V82S+Y123H+C146R+Y147R+Q154R; Y73S+V82S+Y123H+Y147R+Q154R; P54C+V82S+Y123H+Y147R+Q154R; N38G+V82T+Y123H+Y147R+Q154R; N72K+V82S+Y123H+D139L+Y147R+Q154R; E25F+V82S+Y123H+D139M+Y147R+Q154R; Q71M+V82S+Y123H+Y147R+Q154R; E25F+V82S+Y123H+T133K+Y147R+Q154R; E25F+V82S+Y123H+Y147R+Q154R; V82S+Y123H+P124W+Y147R+Q154R; L51W+V82S+Y123H+C146R+Y147R+Q154R; P54C+V82S+Y123H+Y147R+Q154R; Y73S+V82S+Y123H+Y147R+Q154R; N38G+V82T+Y123H+Y147R+Q154R; R23H+V82S+Y123H+Y147R+Q154R; R21N+V82S+Y123H+Y147R+Q154R; V82S+Y123H+Y147R+Q154R+A158K; N72K+V82S+Y123H+D139L+Y147R+Q154R; E25F+V82S+Y123H+D139M+Y147R+Q154R; 及びM70V+V82S+M94V+Y123H+Y147R+Q154R
本発明において有用な他のアデノシンデアミナーゼは、以下の改変の組み合わせを含む: Q71M+V82S+Y123H+Y147R+Q154R; E25F+I76Y+V82S+Y123H+Y147R+Q154R; I76Y+V82T+Y123H+Y147R+Q154R; N38G+I76Y+V82S+Y123H+Y147R+Q154R; R23H+I76Y+V82S+Y123H+Y147R+Q154R; P54C+I76Y+V82S+Y123H+Y147R+Q154R; R21N+I76Y+V82S+Y123H+Y147R+Q154R; I76Y+V82S+Y123H+D139M+Y147R+Q154R; Y73S+I76Y+V82S+Y123H+Y147R+Q154R; E25F+I76Y+V82S+Y123H+Y147R+Q154R; I76Y+V82T+Y123H+Y147R+Q154R; N38G+I76Y+V82S+Y123H+Y147R+Q154R; R23H+I76Y+V82S+Y123H+Y147R+Q154R; P54C+I76Y+V82S+Y123H+Y147R+Q154R; R21N+I76Y+V82S+Y123H+Y147R+Q154R; I76Y+V82S+Y123H+D139M+Y147R+Q154R; Y73S+I76Y+V82S+Y123H+Y147R+Q154R; 及びV82S+Q154R; N72K_V82S+Y123H+Y147R+Q154R; Q71M_V82S+Y123H+Y147R+Q154R; V82S+Y123H+T133K+Y147R+Q154R; V82S+Y123H+T133K+Y147R+Q154R+A158K; M70V+Q71M+N72K+V82S+Y123H+Y147R+Q154R; N72K_V82S+Y123H+Y147R+Q154R; Q71M_V82S+Y123H+Y147R+Q154R; M70V+V82S+M94V+Y123H+Y147R+Q154R; V82S+Y123H+T133K+Y147R+Q154R; V82S+Y123H+T133K+Y147R+Q154R+A158K; 及びM70V+Q71M+N72K+V82S+Y123H+Y147R+Q154R。いくつかの実施形態では、アデノシンデアミナーゼを、単量体として発現させる。他の実施形態では、アデノシンデアミナーゼをヘテロ二量体として発現させる。
以下の表は、本発明の方法において有用なベクターの説明を提供する。
Figure 2022546608000102

Figure 2022546608000103

Figure 2022546608000104

Figure 2022546608000105

Figure 2022546608000106

Figure 2022546608000107

Figure 2022546608000108

Figure 2022546608000109

Figure 2022546608000110
表18に、ABE7*10参照配列と比較して改変が加えられた新規ABE9核酸塩基エディターを示す。表18で使用される用語「単量体」とは、表18に記載の改変を含むTadA*7.10の単量体形態を指す。表18で使用される用語「ヘテロ二量体」とは、表18に記載の改変を含むTadA*7.10に融合された特定の野生型E. coli TadAを指す。
クローニング
標的ポリヌクレオチドのDNA配列ならびに使用されたgRNA及びプライマーは本明細書に記載されている。gRNAについては、以下の足場配列が提示される: GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU。gRNAは、本明細書に記載されるように、または当業者の知識に基づいて決定され、当技術分野の当業者に理解されるように、足場配列と、病原性変異を含むポリヌクレオチドについてのスペーサー配列(標的配列)とを包含する。
塩基編集の方法は当技術分野で公知である。例えば、Komor, A. C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016); Gaudelli, N. M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017); Komor, A. C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity” Science Advances 3: eaao4774 (2017)、及びRees, H. A., et al., “Base editing: precision chemistry on the genome and transcriptome of living cells.” Nat Rev Genet. 2018 Dec; 19 (12): 770-788. doi: 10.1038/s41576-018-0059-1を参照のこと。
PCRは、VeraSeq ULtra DNAポリメラーゼ(Enzymatics)、またはQ5 Hot Start High-Fidelity DNAポリメラーゼ(New England Biolabs)を使用して実施する。塩基編集(BE)プラスミドは、USERクローニング(New England Biolabs)を使用して構築した。デアミナーゼ遺伝子は、gBlocks遺伝子断片(Integrated DNA Technologies)として合成した。本発明において有用なCas9遺伝子を以下に記載し、本明細書に記載する。Cas9遺伝子は、以前に報告されたプラスミドから取得した。デアミナーゼ及び融合遺伝子は、上記の表17に記載のベクター(E. coliコドン最適化)にクローニングした。sgRNA発現プラスミドは、部位特異的変異誘発を使用して構築する。
簡潔に述べると、本発明で有用なプライマーを、製造元の指示に従ってT4ポリヌクレオチドキナーゼ(New England Biolabs)を使用して5’リン酸化する。次に、製造元の指示に従って、リン酸化プライマーと共にQ5 Hot Start High-Fidelityポリメラーゼ(New England Biolabs)を使用し、目的の遺伝子をコードするプラスミドをテンプレートとして、PCRを実行した。製造元の指示に従って、PCR産物をDpnI(20U、New England Biolabs)と共に37℃にて1時間インキュベートし、QIAprepスピンカラム(Qiagen)で精製し、Quickリガーゼ(New England Biolabs)を使用してライゲーションした。DNAベクター増幅は、Mach1コンピテントセル(ThermoFisher Scientific)を使用して実施した。
ssDNAについてのin vitroデアミナーゼアッセイ
すべてのssDNA基質の配列は、標準的な方法を使用して取得する。すべてのCy3標識基質は、Integrated DNA Technologies(IDT)から入手する。デアミナーゼは、1 μgのプラスミドを使用して、製造元の指示に従ってTNT T7 Quick Coupled転写/翻訳キット(Promega)を用いてin vitroで発現させる。タンパク質発現後、5 μlのライセートを、CutSmart緩衝液(New England Biolabs)(50mM酢酸カリウム、29mM Tris-酢酸、10mM酢酸マグネシウム、100 μg ml-1 BSA、pH7.9)中で35 μlのssDNA(1.8 μM)及びUSER酵素(1ユニット)と混合し、37℃で2時間インキュベートする。切断されたU含有基質を、10%TBE-尿素ゲル(Bio-Rad)上で全長の未修飾基質から分離する。
塩基エディターの発現及び精製
E. coli BL21 STAR (DE3)コンピテント細胞(ThermoFisher Scientific)を、プラスミド(表17に記載の塩基エディターをコードするプラスミドなど)で形質転換する。得られた発現株を、100 μg ml-1のカナマイシンを含むLuria-Bertani(LB)培地で37℃にて一晩培養する。細胞を同じ増殖培地で1:100に希釈し、37℃にてOD600=約0.6まで増殖させる。培養物を2時間かけて4℃に冷却し、イソプロピル-β-d-1-チオガラクトピラノシド(IPTG)を0.5 mMで添加して、タンパク質の発現を誘導する。約16時間後、4,000 gで遠心分離して細胞を回収し、溶解緩衝液(50 mM トリス(ヒドロキシメチル)-アミノメタン(Tris)-HCl(pH 7.5)、1M NaCl、20%グリセロール、10 mM tris(2-カルボキシエチル)ホスフィン(TCEP、Soltec Ventures))に再懸濁する。細胞を超音波処理(20秒のパルスオン、20秒のパルスオフで合計8分間、6Wの出力)で溶解し、25,000 gで15分間遠心分離した後、ライセートの上清を分離する。ライセートをHis-Purニッケル-ニトリロ酢酸(ニッケル-NTA)樹脂(ThermoFisher Scientific)と4℃にて1時間インキュベートし、Hisタグ融合タンパク質を捕捉する。樹脂をカラムに移し、40mlの溶解緩衝液で洗浄する。Hisタグ融合タンパク質を、285mMイミダゾールを添加した溶解緩衝液で溶出し、限外濾過(Amicon-Millipore、分子量カットオフ100kDa)により総量1 mlに濃縮する。タンパク質を、50 mM tris(ヒドロキシメチル)-アミノメタン(Tris)-HCl (pH7.0)、0.1 M NaCl、20%グリセロール、10 mM TCEPを含む低塩精製緩衝液で20 mlに希釈し、SP SepharoseFast Flow樹脂(GE Life Sciences)にロードする。樹脂をこの低塩緩衝液40mlで洗浄し、タンパク質を50 mM tris(ヒドロキシメチル)-アミノメタン(Tris)-HCl(pH7.0)、0.5 M NaCl、20%グリセロール、10 mM TCEPを含む5 mlの活性緩衝液で溶出する。溶出したタンパク質をSDS-PAGEで定量する。
sgRNAのin vitro転写
T7プロモーターとそれに続く20 bp sgRNA標的配列を含む直鎖状DNA断片を、製造元の指示に従ってTranscriptAid T7 High Yield転写キット(ThermoFisher Scientific)を使用して、in vitroで転写させる。MEGAclearキット(ThermoFisher Scientific)を製造元の指示に従って使用してsgRNA産物を精製し、UV吸光度によって定量化する。
Cy3コンジュゲートdsDNA基質の調製
通常、非標識の配列鎖(例えば、80 ntの非標識鎖の配列)は、IDTからPAGE精製オリゴヌクレオチドとしてオーダーする。各80 ntの基質の3’末端に相補的な25 ntのCy3標識プライマーを、IDTからHPLC精製オリゴヌクレオチドとしてオーダーする。Cy3標識dsDNA基質を生成するために、80 ntの鎖(100 μMの溶液5 μl)を、NEBuffer2(50 mM NaCl、10 mM Tris-HCl、10 mM MgCl2、1 mM DTT、pH 7.9の溶液38.25 μl、New England Biolabs)中で、dNTP(100 mM溶液0.75 μl)と共に、Cy3標識プライマー(100 μMの溶液5 μl)と混合し、95℃で5分間加熱した後、毎秒0.1℃の速度で45℃まで徐々に冷却する。このアニーリング期間の後、Klenow exo-(5U、New England Biolabs)を添加し、反応液を37℃で1時間インキュベートする。溶液を緩衝液PB(250 μl、Qiagen)及びイソプロパノール(50 μl)で希釈し、QIAprepスピンカラム(Qiagen)で精製し、50 μlのTris緩衝液で溶出する。
dsDNAについてのデアミナーゼアッセイ
精製した融合タンパク質(活性緩衝液中で1.9 μM、20 μl)を1当量の適切なsgRNAと混合し、周囲温度で5分間インキュベートする。Cy3標識dsDNA基質を最終濃度125 nMになるように添加し、得られた溶液を37℃で2時間インキュベートする。dsDNAを、緩衝液PB(100 μl、Qiagen)とイソプロパノール(25 μl)を添加して融合体から分離し、EconoSpinマイクロスピンカラム(Epoch Life Science)で精製し、20 μlのCutSmart緩衝液(New England Biolabs)で溶出する。USER酵素(1 U、New England Biolabs)を、精製後の編集されたdsDNAに添加し、37℃で1時間インキュベートする。5 μlの反応溶液を15 μlのDMSO系ローディング緩衝液(5 mM Tris、0.5 mM EDTA、12.5%グリセロール、0.02%ブロモフェノールブルー、0.02%キシレンシアン、80% DMSO)と混合することにより、Cy3標識鎖をその相補体から完全に変性させる。10% TBE-尿素ゲル(Bio-Rad)上で、全長C含有基質を、切断されたU含有編集済み基質から分離し、GE Amersham Typhoonイメージャーで画像化する。
ハイスループットシーケンシングのための、in vitroで編集されたdsDNAの調製
オリゴヌクレオチドはIDTから入手する。Tris緩衝液中で相補配列を混合し(100 μM溶液5 μl)、95℃で5分間加熱した後0.1℃/秒の速度で45℃まで徐々に冷却することによりアニーリングして、60 bpのdsDNA基質を生成する。精製した融合タンパク質(活性緩衝液中で1.9 μM、20 μl)を1当量の適切なsgRNAと混合し、周囲温度で5分間インキュベートする。60 merのdsDNA基質を最終濃度125 nMになるように添加し、得られた溶液を37℃で2時間インキュベートする。緩衝液PB(100 μl、Qiagen)とイソプロパノール(25 μl)を添加して、融合体からdsDNAを分離し、EconoSpinマイクロスピンカラム(Epoch Life Science)で精製し、20 μlのTris緩衝液で溶出する。得られた編集済みDNA(1 μlをテンプレートとして使用)を、製造元の指示に従ってハイスループットシーケンシングプライマーペアとVeraSeq Ultra(Enzymatics)を使用したPCRにより、13サイクルの増幅により増幅させる。PCR反応産物を、RapidTips(Diffinity Genomics)を使用して精製し、精製したDNAを、シーケンスアダプターを含むプライマーを使用したPCRで増幅し、精製して、前述のようにMiSeqハイスループットDNAシーケンサー(Illumina)で配列決定する。
細胞培養
標的ポリヌクレオチドを発現するHEK293T(ATCC CRL-3216)及びU2OS(ATCC HTB-96)は、10%(v/v)ウシ胎仔血清(FBS)を添加したダルベッコ改変イーグル培地及びGlutaMax(ThermoFisher)中で37℃、5%CO2にて維持する。HCC1954細胞(ATCC CRL-2338)は、上記のように添加されたRPMI-1640培地(ThermoFisher Scientific)中で維持する。不死化細胞(Taconic Biosciences)は、10%(v/v)ウシ胎仔血清(FBS)と200 μg ml-1ジェネティシン(ThermoFisher Scientific)を添加したダルベッコ改変イーグル培地及びGlutaMax(ThermoFisher Scientific)中で培養する。
トランスフェクション
HEK293T細胞を48ウェルのコラーゲンコーティングBioCoatプレート(Corning)に播種し、およそ85%のコンフルエンシーでトランスフェクトする。簡潔に述べると、製造元のプロトコルに従ってウェルあたり1.5 μlのLipofectamine2000(ThermoFisher Scientific)を使用して、750 ngのBE及び250 ngのsgRNA発現プラスミドをトランスフェクトした。HEK293T細胞を、製造元の指示に従って適切なAmaxa Nucleofector IIプログラムを使用してトランスフェクトする(HEK293T細胞用のプログラムQ-001を使用するVキット)。
ゲノムDNA試料のハイスループットDNAシーケンシング
トランスフェクトされた細胞を3日後に回収し、Agencourt DNAdvanceゲノムDNA単離キット(Beckman Coulter)を製造元の指示に従って使用して、ゲノムDNAを分離する。目的のオンターゲット及びオフターゲットのゲノム領域を、隣接するハイスループットシーケンシングプライマーペアを使用したPCRによって増幅した。PCR増幅は、5 ngのゲノムDNAをテンプレートとして使用し、製造元の指示に従ってPhusion高忠実度DNAポリメラーゼ(ThermoFisher)を使用して実行する。反応が増幅の直線範囲で停止することを保証するために、サイクル数をプライマーペアごとに別々に決定した。PCR産物を、RapidTips(Diffinity Genomics)を使用して精製した。精製されたDNAを、シーケンシングアダプターを含むプライマーを使用したPCRによって増幅させた。Quant-iT PicoGreen dsDNAアッセイキット(ThermoFisher)及びKAPA Library定量キット-Illumina(KAPA Biosystems)を使用して、生成物をゲル精製し、定量した。試料を、前述のようにIllumina MiSeqで配列決定した(Pattanayak, Nature Biotechnol. 31, 839-843 (2013))。
データ分析
配列の読み取り結果は、MiSeq Reporter(Illumina)を使用して自動的に多重分離され、個々のFASTQファイルを、カスタムMatlabを使用して分析した。各読み取り結果を、Smith-Watermanアルゴリズムを使用して適切な参照配列にペアワイズアラインメントした。Qスコアが31未満の塩基の読み取り結果は、Nに置き換えられたため、ヌクレオチド出現頻度の計算から除外した。この処理により、予想されるMiSeq塩基読み取りエラー率は、およそ1,000分の1となる。アラインメントされた配列(読み取り配列及び参照配列はギャップを含んでいない)をアラインメント表に保存し、この表から各遺伝子座について塩基出現頻度を表にまとめることができた。インデル出現頻度を、前述の基準を使用してカスタムMatlabスクリプトで定量化した(Zuris, et al., Nature Biotechnol. 33, 73-80 (2015))。配列読み取り結果を、インデルが生じ得るウィンドウの両側に隣接する2つの10bpの配列と完全に一致するかスキャンした。完全一致が特定されなかった場合、その読み取り結果を分析から除外した。このインデルウィンドウの長さが参照配列と完全に一致した場合、読み取り結果をインデルを含まないものと分類した。インデルウィンドウが参照配列に比べて2塩基以上長いかまたは短い場合、配列の読み取り結果を、それぞれ挿入または欠失として分類した。
他の実施形態
前述の記載から、様々な使用法及び条件に用いるために、本明細書に記載の発明に変更及び修正を加え得ることは明らかであろう。そのような実施形態もまた、以下の特許請求の範囲内である。
本明細書中での可変要素の定義における要素のリストの列挙には、記載する要素の任意の単一要素または組み合わせ(または部分組み合わせ)としてのその可変要素の定義が含まれる。本明細書における実施形態の列挙は、その実施形態を、任意の単一の実施形態として、または任意の他の実施形態もしくはその一部との組み合わせで含む。
参照による援用
本明細書中で言及されるすべての刊行物、特許、及び特許出願は、各個別の刊行物、特許、または特許出願が具体的かつ個々に参照により援用されることが示されているのと同程度に、参照により本明細書に援用される。特に明記されていない限り、本明細書中で言及される刊行物、特許、及び特許出願は、その全体が参照により本明細書に援用される。

Claims (125)

  1. 配列番号1:
    Figure 2022546608000111
    の21、23、25、38、51、54、70、71、72、73、94、124、133、139、146、及び158からなる群から選択されるアミノ酸位置での改変、または別のアデノシンデアミナーゼにおける対応する改変を含む、アデノシンデアミナーゼ。
  2. 配列番号1のR21N、R23H、E25F、N38G、L51W、P54C、M70V、Q71M、N72K、Y73S、M94V、P124W、T133K、D139L、D139M、C146R、及びA158Kからなる群から選択される改変、または別のアデノシンデアミナーゼにおける対応する改変を含む、請求項1に記載のアデノシンデアミナーゼ。
  3. 配列番号1のV82T改変、または別のアデノシンデアミナーゼにおける対応する改変をさらに含む、請求項1または2に記載のアデノシンデアミナーゼ。
  4. 配列番号1の21、23、25、38、51、54、70、71、72、73、94、124、133、139、146、及び158からなる群から選択される2つ以上のアミノ酸位置での改変、または別のアデノシンデアミナーゼにおける対応する改変を含む、請求項1~3のいずれか一項に記載のアデノシンデアミナーゼ。
  5. 前記改変のうちの2つ以上を含む、請求項1~4のいずれか一項に記載のアデノシンデアミナーゼ。
  6. 前記改変のうちの3つ以上を含む、請求項1~5のいずれか一項に記載のアデノシンデアミナーゼ。
  7. 以下の改変:Y147T、Y147R、Q154S、Y123H、及びQ154Rのうちの1つ以上をさらに含む、請求項1~6のいずれか一項に記載のアデノシンデアミナーゼ。
  8. 前記アデノシンデアミナーゼが、以下の改変の群:
    E25F+V82S+Y123H;
    T133K+Y147R+Q154R;
    E25F+V82S+Y123H+Y147R+Q154R;
    L51W+V82S+Y123H+C146R+Y147R+Q154R;
    Y73S+V82S+Y123H+Y147R+Q154R;
    P54C+V82S+Y123H+Y147R+Q154R;
    N38G+V82T+Y123H+Y147R+Q154R;
    N72K+V82S+Y123H+D139L+Y147R+Q154R;
    E25F+V82S+Y123H+D139M+Y147R+Q154R;
    Q71M+V82S+Y123H+Y147R+Q154R;
    E25F+V82S+Y123H+T133K+Y147R+Q154R;
    E25F+V82S+Y123H+Y147R+Q154R;
    V82S+Y123H+P124W+Y147R+Q154R;
    L51W+V82S+Y123H+C146R+Y147R+Q154R;
    P54C+V82S+Y123H+Y147R+Q154R;
    Y73S+V82S+Y123H+Y147R+Q154R;
    N38G+V82T+Y123H+Y147R+Q154R;
    R23H+V82S+Y123H+Y147R+Q154R;
    R21N+V82S+Y123H+Y147R+Q154R;
    V82S+Y123H+Y147R+Q154R+A158K;
    N72K+V82S+Y123H+D139L+Y147R+Q154R;
    E25F+V82S+Y123H+D139M+Y147R+Q154R;
    M70V+V82S+M94V+Y123H+Y147R+Q154R;
    Q71M+V82S+Y123H+Y147R+Q154R;
    E25F+I76Y+V82S+Y123H+Y147R+Q154R;
    I76Y+V82T+Y123H+Y147R+Q154R;
    N38G+I76Y+V82S+Y123H+Y147R+Q154R;
    R23H+I76Y+V82S+Y123H+Y147R+Q154R;
    P54C+I76Y+V82S+Y123H+Y147R+Q154R;
    R21N+I76Y+V82S+Y123H+Y147R+Q154R;
    I76Y+V82S+Y123H+D139M+Y147R+Q154R;
    Y73S+I76Y+V82S+Y123H+Y147R+Q154R;
    E25F+I76Y+V82S+Y123H+Y147R+Q154R;
    I76Y+V82T+Y123H+Y147R+Q154R;
    N38G+I76Y+V82S+Y123H+Y147R+Q154R;
    R23H+I76Y+V82S+Y123H+Y147R+Q154R;
    P54C+I76Y+V82S+Y123H+Y147R+Q154R;
    R21N+I76Y+V82S+Y123H+Y147R+Q154R;
    I76Y+V82S+Y123H+D139M+Y147R+Q154R;
    Y73S+I76Y+V82S+Y123H+Y147R+Q154R;
    V82S+Q154R;
    N72K+V82S+Y123H+Y147R+Q154R;
    Q71M+V82S+Y123H+Y147R+Q154R;
    V82S+Y123H+T133K+Y147R+Q154R;
    V82S+Y123H+T133K+Y147R+Q154R+A158K;
    M70V+Q71M+N72K+V82S+Y123H+Y147R+Q154R;
    N72K_V82S+Y123H+Y147R+Q154R;
    Q71M_V82S+Y123H+Y147R+Q154R;
    M70V+V82S+M94V+Y123H+Y147R+Q154R;
    V82S+Y123H+T133K+Y147R+Q154R;
    V82S+Y123H+T133K+Y147R+Q154R+A158K;または
    M70V+Q71M+N72K+V82S+Y123H+Y147R+Q154R
    のいずれか1つを含む、請求項1~7のいずれか一項に記載のアデノシンデアミナーゼ。
  9. 149、150、151、152、153、154、155、156、及び157からなる群から選択される残基で始まるC末端の欠失を含む、請求項1~8のいずれか一項に記載のアデノシンデアミナーゼ。
  10. Y147T、Y147R、Q154S、Y123H、V82S、T166R、及びQ154Rからなる群から選択される改変をさらに含む、請求項1~6のいずれか一項に記載のアデノシンデアミナーゼ。
  11. 表14、表18、または図3A~3Cに記載のアデノシンデアミナーゼバリアントである、請求項1~6のいずれか一項に記載のアデノシンデアミナーゼ。
  12. ポリヌクレオチドプログラム可能なDNA結合ドメインと、配列番号1:
    Figure 2022546608000112
    の21、23、25、38、51、54、70、71、72、73、94、124、133、139、146、及び158からなる群から選択されるアミノ酸位置での改変、または別のアデノシンデアミナーゼにおける対応する改変を含むアデノシンデアミナーゼバリアントである少なくとも1つの塩基エディタードメインと、を含む、融合タンパク質。
  13. 前記アデノシンデアミナーゼバリアントが、配列番号1のR21N、R23H、E25F、N38G、L51W、P54C、M70V、Q71M、N72K、Y73S、M94V、P124W、T133K、D139L、D139M、C146R、及びA158Kからなる群から選択される改変、または別のアデノシンデアミナーゼにおける対応する改変を含む、請求項12に記載の融合タンパク質。
  14. ポリヌクレオチドプログラム可能なDNA結合ドメインと、配列番号1のR21N、R23H、E25F、N38G、L51W、P54C、M70V、Q71M、N72K、Y73S、M94V、P124W、T133K、D139L、D139M、C146R、及びA158Kからなる群から選択される改変、または別のアデノシンデアミナーゼにおける対応する改変を含むアデノシンデアミナーゼバリアントである少なくとも1つの塩基エディタードメインと、を含む、融合タンパク質。
  15. 前記アデノシンデアミナーゼバリアントが、配列番号1のV82T改変、または別のアデノシンデアミナーゼにおける対応する改変をさらに含む、請求項12~14のいずれか一項に記載の融合タンパク質。
  16. ポリヌクレオチドプログラム可能なDNA結合ドメインと、配列番号1の改変V82TならびにR21N、R23H、E25F、N38G、L51W、P54C、M70V、Q71M、N72K、Y73S、M94V、P124W、T133K、D139L、D139M、C146R、及びA158Kからなる群から選択される1つ以上の改変、または別のアデノシンデアミナーゼにおける対応する改変を含むアデノシンデアミナーゼバリアントである少なくとも1つの塩基エディタードメインと、を含む、融合タンパク質。
  17. 前記アデノシンデアミナーゼバリアントが、配列番号1の21、23、25、38、51、54、70、71、72、73、94、124、133、139、146、及び158からなる群から選択される2つ以上のアミノ酸位置での改変、または別のアデノシンデアミナーゼにおける対応する改変を含む、請求項12~16のいずれか一項に記載の融合タンパク質。
  18. 前記アデノシンデアミナーゼバリアントが、前記改変のうちの2つ以上を含む、請求項12~17のいずれか一項に記載の融合タンパク質。
  19. 前記アデノシンデアミナーゼバリアントが、前記改変のうちの3つ以上を含む、請求項12~17のいずれか一項に記載の融合タンパク質。
  20. 前記アデノシンデアミナーゼバリアントが、以下の改変:Y147T、Y147R、Q154S、Y123H、及びQ154Rのうちの1つ以上をさらに含む、請求項12~19のいずれか一項に記載の融合タンパク質。
  21. 前記アデノシンデアミナーゼバリアントが、以下の改変の群:
    E25F+V82S+Y123H;
    T133K+Y147R+Q154R;
    E25F+V82S+Y123H+Y147R+Q154R;
    L51W+V82S+Y123H+C146R+Y147R+Q154R;
    Y73S+V82S+Y123H+Y147R+Q154R;
    P54C+V82S+Y123H+Y147R+Q154R;
    N38G+V82T+Y123H+Y147R+Q154R;
    N72K+V82S+Y123H+D139L+Y147R+Q154R;
    E25F+V82S+Y123H+D139M+Y147R+Q154R;
    Q71M+V82S+Y123H+Y147R+Q154R;
    E25F+V82S+Y123H+T133K+Y147R+Q154R;
    E25F+V82S+Y123H+Y147R+Q154R;
    V82S+Y123H+P124W+Y147R+Q154R;
    L51W+V82S+Y123H+C146R+Y147R+Q154R;
    P54C+V82S+Y123H+Y147R+Q154R;
    Y73S+V82S+Y123H+Y147R+Q154R;
    N38G+V82T+Y123H+Y147R+Q154R;
    R23H+V82S+Y123H+Y147R+Q154R;
    R21N+V82S+Y123H+Y147R+Q154R;
    V82S+Y123H+Y147R+Q154R+A158K;
    N72K+V82S+Y123H+D139L+Y147R+Q154R;
    E25F+V82S+Y123H+D139M+Y147R+Q154R;
    M70V+V82S+M94V+Y123H+Y147R+Q154R;
    Q71M+V82S+Y123H+Y147R+Q154R;
    E25F+I76Y+V82S+Y123H+Y147R+Q154R;
    I76Y+V82T+Y123H+Y147R+Q154R;
    N38G+I76Y+V82S+Y123H+Y147R+Q154R;
    R23H+I76Y+V82S+Y123H+Y147R+Q154R;
    P54C+I76Y+V82S+Y123H+Y147R+Q154R;
    R21N+I76Y+V82S+Y123H+Y147R+Q154R;
    I76Y+V82S+Y123H+D139M+Y147R+Q154R;
    Y73S+I76Y+V82S+Y123H+Y147R+Q154R;
    E25F+I76Y+V82S+Y123H+Y147R+Q154R;
    I76Y+V82T+Y123H+Y147R+Q154R;
    N38G+I76Y+V82S+Y123H+Y147R+Q154R;
    R23H+I76Y+V82S+Y123H+Y147R+Q154R;
    P54C+I76Y+V82S+Y123H+Y147R+Q154R;
    R21N+I76Y+V82S+Y123H+Y147R+Q154R;
    I76Y+V82S+Y123H+D139M+Y147R+Q154R;
    Y73S+I76Y+V82S+Y123H+Y147R+Q154R;
    V82S+Q154R;
    N72K+V82S+Y123H+Y147R+Q154R;
    Q71M+V82S+Y123H+Y147R+Q154R;
    V82S+Y123H+T133K+Y147R+Q154R;
    V82S+Y123H+T133K+Y147R+Q154R+A158K;
    M70V+Q71M+N72K+V82S+Y123H+Y147R+Q154R;
    N72K+V82S+Y123H+Y147R+Q154R;
    Q71M+V82S+Y123H+Y147R+Q154R;
    M70V+V82S+M94V+Y123H+Y147R+Q154R;
    V82S+Y123H+T133K+Y147R+Q154R;
    V82S+Y123H+T133K+Y147R+Q154R+A158K;または
    M70V+Q71M+N72K+V82S+Y123H+Y147R+Q154R
    のうちのいずれか1つを含む、請求項12~20のいずれか一項に記載の融合タンパク質。
  22. 前記アデノシンデアミナーゼバリアントが、149、150、151、152、153、154、155、156、及び157からなる群から選択される残基で始まるC末端の欠失を含む、請求項12~20のいずれか一項に記載の融合タンパク質。
  23. 前記塩基エディタードメインが、アデノシンデアミナーゼバリアントの単量体を含み、前記アデノシンデアミナーゼの単量体が、配列番号1のR21N、R23H、E25F、N38G、L51W、P54C、M70V、Q71M、N72K、Y73S、V82T、M94V、P124W、T133K、D139L、D139M、C146R、及びA158Kからなる群から選択される1つ以上の改変を含む、請求項12~20のいずれか一項に記載の融合タンパク質。
  24. 前記塩基エディタードメインが、野生型アデノシンデアミナーゼドメインとアデノシンデアミナーゼバリアントとを含むアデノシンデアミナーゼヘテロ二量体を含む、請求項12~17のいずれか一項に記載の融合タンパク質。
  25. 前記アデノシンデアミナーゼバリアントが、Y147T、Y147R、Q154S、Y123H、V82S、T166R、及びQ154Rからなる群から選択される改変をさらに含む、請求項24に記載の融合タンパク質。
  26. 前記塩基エディタードメインが、TadA*7.10ドメインとアデノシンデアミナーゼバリアントドメインとを含むアデノシンデアミナーゼヘテロ二量体を含む、請求項12~17のいずれか一項に記載の融合タンパク質。
  27. 前記アデノシンデアミナーゼバリアントが、2つ以上の改変を含む、請求項26に記載の融合タンパク質。
  28. 前記塩基エディターが、TadA*7.10ドメインと、以下の改変の群:
    E25F+V82S+Y123H;
    T133K+Y147R+Q154R;
    E25F+V82S+Y123H+Y147R+Q154R;
    L51W+V82S+Y123H+C146R+Y147R+Q154R;
    Y73S+V82S+Y123H+Y147R+Q154R;
    P54C+V82S+Y123H+Y147R+Q154R;
    N38G+V82T+Y123H+Y147R+Q154R;
    N72K+V82S+Y123H+D139L+Y147R+Q154R;
    E25F+V82S+Y123H+D139M+Y147R+Q154R;
    Q71M+V82S+Y123H+Y147R+Q154R;
    E25F+V82S+Y123H+T133K+Y147R+Q154R;
    E25F+V82S+Y123H+Y147R+Q154R;
    V82S+Y123H+P124W+Y147R+Q154R;
    L51W+V82S+Y123H+C146R+Y147R+Q154R;
    P54C+V82S+Y123H+Y147R+Q154R;
    Y73S+V82S+Y123H+Y147R+Q154R;
    N38G+V82T+Y123H+Y147R+Q154R;
    R23H+V82S+Y123H+Y147R+Q154R;
    R21N+V82S+Y123H+Y147R+Q154R;
    V82S+Y123H+Y147R+Q154R+A158K;
    N72K+V82S+Y123H+D139L+Y147R+Q154R;
    E25F+V82S+Y123H+D139M+Y147R+Q154R;
    M70V+V82S+M94V+Y123H+Y147R+Q154R;
    Q71M+V82S+Y123H+Y147R+Q154R;
    E25F+I76Y+V82S+Y123H+Y147R+Q154R;
    I76Y+V82T+Y123H+Y147R+Q154R;
    N38G+I76Y+V82S+Y123H+Y147R+Q154R;
    R23H+I76Y+V82S+Y123H+Y147R+Q154R;
    P54C+I76Y+V82S+Y123H+Y147R+Q154R;
    R21N+I76Y+V82S+Y123H+Y147R+Q154R;
    I76Y+V82S+Y123H+D139M+Y147R+Q154R;
    Y73S+I76Y+V82S+Y123H+Y147R+Q154R;
    E25F+I76Y+V82S+Y123H+Y147R+Q154R;
    I76Y+V82T+Y123H+Y147R+Q154R;
    N38G+I76Y+V82S+Y123H+Y147R+Q154R;
    R23H+I76Y+V82S+Y123H+Y147R+Q154R;
    P54C+I76Y+V82S+Y123H+Y147R+Q154R;
    R21N+I76Y+V82S+Y123H+Y147R+Q154R;
    I76Y+V82S+Y123H+D139M+Y147R+Q154R;
    Y73S+I76Y+V82S+Y123H+Y147R+Q154R;
    V82S+Q154R;
    N72K+V82S+Y123H+Y147R+Q154R;
    Q71M+V82S+Y123H+Y147R+Q154R;
    V82S+Y123H+T133K+Y147R+Q154R;
    V82S+Y123H+T133K+Y147R+Q154R+A158K;
    M70V+Q71M+N72K+V82S+Y123H+Y147R+Q154R;
    N72K+V82S+Y123H+Y147R+Q154R;
    Q71M+V82S+Y123H+Y147R+Q154R;
    M70V+V82S+M94V+Y123H+Y147R+Q154R;
    V82S+Y123H+T133K+Y147R+Q154R;
    V82S+Y123H+T133K+Y147R+Q154R+A158K;または
    M70V+Q71M+N72K+V82S+Y123H+Y147R+Q154R
    のいずれか1つを含むアデノシンデアミナーゼバリアントとを含むヘテロ二量体を含む、請求項12~17のいずれか一項に記載の融合タンパク質。
  29. 前記アデノシンデアミナーゼバリアントが、表14、表18、または図3A~3Cに記載のABE9またはTadA*9デアミナーゼバリアントである、請求項12~17のいずれか一項に記載の融合タンパク質。
  30. 前記アデノシンデアミナーゼバリアントが、全長ABE9と比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のC末端アミノ酸残基を欠いている短縮型ABE8またはABE9である、請求項12~29のいずれか一項に記載の融合タンパク質。
  31. 前記ポリヌクレオチドプログラム可能なDNA結合ドメインが、Cas9、Cas12a/Cpf1、Cas12b/C2c1、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i、またはCas12j/CasΦドメインである、請求項12~30のいずれか一項に記載の融合タンパク質。
  32. 以下の配列:
    Figure 2022546608000113
    を含むポリヌクレオチドプログラム可能なDNA結合ドメインを含む融合タンパク質であって、配列中、太字の配列がCas9に由来する配列を示し、斜体の配列がリンカー配列を示し、下線が引かれた配列がバイパータイト核局在化配列を示し、少なくとも1つの塩基エディタードメインが、配列番号1の21、23、25、38、51、54、70、71、72、73、94、124、133、138、139、146、及び158からなる群から選択されるアミノ酸位置で改変を含むアデノシンデアミナーゼバリアントを含む、前記融合タンパク質。
  33. 前記アデノシンデアミナーゼバリアントが、配列番号1のR21N、R23H、E25F、N38G、L51W、P54C、M70V、Q71M、N72K、Y73S、M94V、P124W、T133K、D138M、D139L、D139M、C146R、及びA158Kからなる群から選択される改変を含む、請求項32に記載の融合タンパク質。
  34. 前記アデノシンデアミナーゼバリアントが、配列番号1の改変V82Tを含む、請求項33に記載の融合タンパク質。
  35. 前記アデノシンデアミナーゼバリアントが、前記改変のうちの2つ以上を含む、請求項33または34に記載の融合タンパク質。
  36. 前記アデノシンデアミナーゼバリアントが、前記改変のうちの3つ以上を含む、請求項33または34に記載の融合タンパク質。
  37. 前記アデノシンデアミナーゼバリアントが、Y147T、Y147R、Q154S、Y123H、V82S、T166R、及びQ154Rからなる群から選択される改変をさらに含む、請求項33または34に記載の融合タンパク質。
  38. 前記アデノシンデアミナーゼバリアントが、以下の改変:Y147T、Y147R、Q154S、Y123H、及びQ154Rのうちの2つ以上を含む、請求項33または34に記載の融合タンパク質。
  39. 前記アデノシンデアミナーゼバリアントが、以下の改変の群:
    E25F+V82S+Y123H;
    T133K+Y147R+Q154R;
    E25F+V82S+Y123H+Y147R+Q154R;
    L51W+V82S+Y123H+C146R+Y147R+Q154R;
    Y73S+V82S+Y123H+Y147R+Q154R;
    P54C+V82S+Y123H+Y147R+Q154R;
    N38G+V82T+Y123H+Y147R+Q154R;
    N72K+V82S+Y123H+D139L+Y147R+Q154R;
    E25F+V82S+Y123H+D139M+Y147R+Q154R;
    Q71M+V82S+Y123H+Y147R+Q154R;
    E25F+V82S+Y123H+T133K+Y147R+Q154R;
    E25F+V82S+Y123H+Y147R+Q154R;
    V82S+Y123H+P124W+Y147R+Q154R;
    L51W+V82S+Y123H+C146R+Y147R+Q154R;
    P54C+V82S+Y123H+Y147R+Q154R;
    Y73S+V82S+Y123H+Y147R+Q154R;
    N38G+V82T+Y123H+Y147R+Q154R;
    R23H+V82S+Y123H+Y147R+Q154R;
    R21N+V82S+Y123H+Y147R+Q154R;
    V82S+Y123H+Y147R+Q154R+A158K;
    N72K+V82S+Y123H+D139L+Y147R+Q154R;
    E25F+V82S+Y123H+D139M+Y147R+Q154R;
    M70V+V82S+M94V+Y123H+Y147R+Q154R;
    Q71M+V82S+Y123H+Y147R+Q154R;
    E25F+I76Y+V82S+Y123H+Y147R+Q154R;
    I76Y+V82T+Y123H+Y147R+Q154R;
    N38G+I76Y+V82S+Y123H+Y147R+Q154R;
    R23H+I76Y+V82S+Y123H+Y147R+Q154R;
    P54C+I76Y+V82S+Y123H+Y147R+Q154R;
    R21N+I76Y+V82S+Y123H+Y147R+Q154R;
    I76Y+V82S+Y123H+D139M+Y147R+Q154R;
    Y73S+I76Y+V82S+Y123H+Y147R+Q154R;
    E25F+I76Y+V82S+Y123H+Y147R+Q154R;
    I76Y+V82T+Y123H+Y147R+Q154R;
    N38G+I76Y+V82S+Y123H+Y147R+Q154R;
    R23H+I76Y+V82S+Y123H+Y147R+Q154R;
    P54C+I76Y+V82S+Y123H+Y147R+Q154R;
    R21N+I76Y+V82S+Y123H+Y147R+Q154R;
    I76Y+V82S+Y123H+D139M+Y147R+Q154R;
    Y73S+I76Y+V82S+Y123H+Y147R+Q154R;
    V82S+Q154R;
    N72K+V82S+Y123H+Y147R+Q154R;
    Q71M+V82S+Y123H+Y147R+Q154R;
    V82S+Y123H+T133K+Y147R+Q154R;
    V82S+Y123H+T133K+Y147R+Q154R+A158K;
    M70V+Q71M+N72K+V82S+Y123H+Y147R+Q154R;
    N72K+V82S+Y123H+Y147R+Q154R;
    Q71M+V82S+Y123H+Y147R+Q154R;
    M70V+V82S+M94V+Y123H+Y147R+Q154R;
    V82S+Y123H+T133K+Y147R+Q154R;
    V82S+Y123H+T133K+Y147R+Q154R+A158K;
    M70V+Q71M+N72K+V82S+Y123H+Y147R+Q154R;
    のうちのいずれか1つ、または表14のいずれかの他の改変もしくはその群を含む、請求項32に記載の融合タンパク質。
  40. 前記ポリヌクレオチドプログラム可能なDNA結合ドメインが、Staphylococcus aureus Cas9 (SaCas9)、Streptococcus thermophilus 1 Cas9 (St1Cas9)、Streptococcus pyogenes Cas9 (SpCas9)、またはそれらのバリアントである、請求項12~39のいずれか一項に記載の融合タンパク質。
  41. 前記ポリヌクレオチドプログラム可能なDNA結合ドメインが、改変されたプロトスペーサー隣接モチーフ(PAM)特異性を有する改変されたSaCas9を含む、請求項12~40のいずれか一項に記載の融合タンパク質。
  42. 前記改変されたSaCas9が、アミノ酸置換E782K、N968K、及びR1015H、またはそれらに対応するアミノ酸置換を含む、請求項41に記載の融合タンパク質。
  43. 前記ポリヌクレオチドプログラム可能なDNA結合ドメインが、改変されたプロトスペーサー隣接モチーフ(PAM)特異性を有するSpCas9のバリアントを含む、請求項12~40のいずれか一項に記載の融合タンパク質。
  44. 前記改変されたPAMが、核酸配列5’-NGA-3’、5’-NGC-3’、5’-NGG-3’、5’-NGT-3’、または5’’-NGN-3’に対する特異性を有する、請求項43に記載の融合タンパク質。
  45. 前記バリアントSpCas9が:
    D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、及びT1337R、またはそれらに対応するアミノ酸置換;
    I322V、S409I、E427G、R654L、R753G(MQKFRAER)またはそれらに対応するアミノ酸置換;
    I322V、S409I、E427G、R654L、R753G、R1114Gまたはそれらに対応するアミノ酸置換;
    または図3A~3Cに記載のアミノ酸置換
    から選択されるアミノ酸置換を含む、請求項43または44に記載の融合タンパク質。
  46. 前記ポリヌクレオチドプログラム可能なDNA結合ドメインが、ヌクレアーゼ不活性またはニッカーゼバリアントである、請求項12~45のいずれか一項に記載の融合タンパク質。
  47. 前記ニッカーゼバリアントが、アミノ酸置換D10Aまたはそれに対応するアミノ酸置換を含む、請求項46に記載の融合タンパク質。
  48. 前記アデノシンデアミナーゼドメインが、デオキシリボ核酸(DNA)中のアデニンを脱アミノ化することができる、請求項12~47のいずれか一項に記載の融合タンパク質。
  49. 前記アデノシンデアミナーゼが、非天然の改変されたアデノシンデアミナーゼである、請求項12~47のいずれか一項に記載の融合タンパク質。
  50. 前記アデノシンデアミナーゼがTadAデアミナーゼである、請求項12~49のいずれか一項に記載の融合タンパク質。
  51. 前記TadAデアミナーゼが、TadA*7.10バリアントである、請求項50に記載の融合タンパク質。
  52. 前記ポリヌクレオチドプログラム可能なDNA結合ドメインと前記アデノシンデアミナーゼドメインとの間にリンカーを含む、請求項12~51のいずれか一項に記載の融合タンパク質。
  53. 前記リンカーが、アミノ酸配列: SGGSSGGSSGSETPGTSESATPESを含む、請求項52に記載の融合タンパク質。
  54. 1つ以上の核局在化シグナルを含む、請求項12~53のいずれか一項に記載の融合タンパク質。
  55. 前記核局在化シグナルがバイパータイト核局在化シグナルである、請求項54に記載の融合タンパク質。
  56. 前記Cas9がStCas9である、請求項12~55のいずれか一項に記載の融合タンパク質。
  57. 前記Cas9が、SaCas9またはSpCas9である、請求項12~55のいずれか一項に記載の融合タンパク質。
  58. 前記Cas9が、改変SaCas9または改変SpCas9である、請求項12~55のいずれか一項に記載の融合タンパク質。
  59. 前記改変SaCas9が、アミノ酸置換E782K、N968K、及びR1015H、またはそれらに対応するアミノ酸置換を含む、請求項58に記載の融合タンパク質。
  60. 前記改変されたSaCas9が、アミノ酸配列:
    KRNYILGLAIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRKLINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYKNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPHIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG
    を含む、請求項59に記載の融合タンパク質。
  61. 請求項12~60のいずれか一項に記載の融合タンパク質をコードする、ポリヌクレオチド。
  62. 請求項12~60のいずれか一項に記載の融合タンパク質をコードするポリヌクレオチドと、
    前記塩基エディターを標的指向化して、遺伝性疾患に関連するSNPのA・TからG・Cへの改変をもたらす、1つ以上のガイドポリヌクレオチドと
    を細胞、またはその前駆細胞に導入することによって生成される、細胞。
  63. 前記細胞がヒト細胞である、請求項62に記載の細胞。
  64. 前記細胞が、in vitroまたはin vivoである、請求項62または63に記載の細胞。
  65. 前記遺伝性疾患がα-1アンチトリプシン欠乏症(A1AD)である、請求項62~64のいずれか一項に記載の細胞。
  66. 前記融合タンパク質及び前記1つ以上のガイドポリヌクレオチドが、前記細胞内で複合体を形成する、請求項62~65のいずれか一項に記載の細胞。
  67. 請求項62~66のいずれか一項に記載の細胞から増殖または拡張させた、単離された細胞または細胞の集団。
  68. 遺伝性疾患の治療を必要とする対象における遺伝性疾患の治療方法であって、請求項62~67のいずれか一項に記載の細胞を前記対象に投与することを含む、前記方法。
  69. 前記細胞が、前記対象に対して、自家、同種異系、または異種である、請求項68に記載の方法。
  70. ポリヌクレオチドプログラム可能なDNA結合ドメインと、配列番号1:
    Figure 2022546608000114
    の21、23、25、38、51、54、70、71、72、73、82、94、124、133、139、146、及び158からなる群から選択されるアミノ酸位置での改変、または別のアデノシンデアミナーゼにおける対応する改変を含むアデノシンデアミナーゼバリアントである少なくとも1つの塩基エディタードメインと、を含む、塩基エディターシステム。
  71. 前記アデノシンデアミナーゼバリアントが、配列番号1のR21N、R23H、E25F、N38G、L51W、P54C、M70V、Q71M、N72K、Y73S、V82T、M94V、P124W、T133K、D139L、D139M、C146R、及びA158Kからなる群から選択される改変、または別のアデノシンデアミナーゼにおける対応する改変を含む、請求項70に記載の塩基エディターシステム。
  72. 前記塩基エディタードメインを標的指向化して、遺伝性疾患に関連するSNPのA・TからG・Cへの改変をもたらす、1つ以上のガイドポリヌクレオチドをさらに含む、請求項70または71に記載の塩基エディターシステム。
  73. 前記アデノシンデアミナーゼバリアントが、デオキシリボ核酸(DNA)中のアデニンを脱アミノ化することができる、請求項70~72のいずれか一項に記載の塩基エディターシステム。
  74. 前記ガイドポリヌクレオチドが、リボ核酸(RNA)またはデオキシリボ核酸(DNA)を含む、請求項73に記載の塩基エディターシステム。
  75. 前記ガイドポリヌクレオチドが、CRISPR RNA(crRNA)配列、トランス活性化CRISPR RNA (tracrRNA)配列、またはそれらの組み合わせを含む、請求項74に記載の塩基エディターシステム。
  76. 第2のガイドポリヌクレオチドをさらに含む、請求項72に記載の塩基エディターシステム。
  77. 前記第2のガイドポリヌクレオチドが、リボ核酸(RNA)またはデオキシリボ核酸(DNA)を含む、請求項76に記載の塩基エディターシステム。
  78. 前記第2のガイドポリヌクレオチドが、CRISPR RNA (crRNA)配列、トランス活性化CRISPR RNA (tracrRNA)配列、またはそれらの組み合わせを含む、請求項76に記載の塩基エディターシステム。
  79. 前記ポリヌクレオチドプログラム可能なDNA結合ドメインが、Cas9、Cas12a/Cpf1、Cas12b/C2c1、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i、またはCas12j/CasΦドメインを含む、請求項70~78のいずれか一項に記載の塩基エディターシステム。
  80. 前記ポリヌクレオチドプログラム可能なDNA結合ドメインが、ヌクレアーゼ不活性である、請求項79に記載の塩基エディターシステム。
  81. 前記ポリヌクレオチドプログラム可能なDNA結合ドメインがニッカーゼである、請求項79に記載の塩基エディターシステム。
  82. 前記ポリヌクレオチドプログラム可能なDNA結合ドメインが、Cas9ドメインを含む、請求項79に記載の塩基エディターシステム。
  83. 前記Cas9ドメインが、ヌクレアーゼ不活性Cas9 (dCas9)、Cas9ニッカーゼ (nCas9)、またはヌクレアーゼ活性Cas9を含む、請求項82に記載の塩基エディターシステム。
  84. 前記Cas9ドメインが、Cas9ニッカーゼを含む、請求項83に記載の塩基エディターシステム。
  85. 前記ポリヌクレオチドプログラム可能なDNA結合ドメインが、改変された、または修飾されたポリヌクレオチドプログラム可能なDNA結合ドメインである、請求項70~84のいずれか一項に記載の塩基エディターシステム。
  86. 前記遺伝性疾患がα-1アンチトリプシン欠乏症(A1AD)である、請求項72に記載の塩基エディターシステム。
  87. ポリヌクレオチドにおける一塩基多型(SNP)の修正方法であって:
    少なくとも一部が前記ポリヌクレオチドまたはその逆相補鎖に位置する標的ヌクレオチド配列を、請求項12~60のいずれか一項に記載の融合タンパク質または請求項70~85のいずれか一項に記載の塩基エディターシステムと接触させ; 前記塩基エディターを前記標的ヌクレオチド配列に標的指向化する際に前記SNPまたはその相補核酸塩基を脱アミノ化することによって前記SNPを編集し、前記SNPまたはその相補核酸塩基の脱アミノ化が、前記SNPを修正する、前記方法。
  88. 前記SNPが、α-1アンチトリプシン欠乏症(A1AD)に関連するものである、請求項87に記載の方法。
  89. 前記SNPが、SERPINA1遺伝子にあり、前記修正がE342K(PiZアリール)の改変を含む、請求項87または88に記載の方法。
  90. ポリヌクレオチドの編集方法であって、前記方法が、標的ヌクレオチド配列を請求項12~60のいずれか一項に記載の融合タンパク質または請求項70~85のいずれか一項に記載の塩基エディターシステムと接触させ、それにより前記ポリヌクレオチドを編集することを含む、前記方法。
  91. 前記編集が、20%未満のインデル形成、15%未満のインデル形成、10%未満のインデル形成; 5%未満のインデル形成; 4%未満のインデル形成; 3%未満のインデル形成; 2%未満のインデル形成; 1%未満のインデル形成; 0.5%未満のインデル形成;または0.1%未満のインデル形成をもたらす、請求項90に記載の方法。
  92. 前記編集が、転座をもたらさない、請求項91に記載の方法。
  93. 以下から選択される、TadA*7.10アデノシンデアミナーゼバリアントドメインを含むABE9及びCas9エンドヌクレアーゼドメイン:
    配列番号1の変異I76Y+V82T+Y147T+Q154S+A109Sを有するmonoTadA*7.10、及び変異I322V、S409I、E427G、R654L、R753Gを有するspCas9 (MQKFRAER);
    配列番号1の変異I76Y+V82T+Y147T+Q154S+T111Rを有するmonoTadA*7.10、及び変異I322V、S409I、E427G、R654L、R753Gを有するspCas9 (MQKFRAER);
    配列番号1の変異I76Y+V82T+Y147T+Q154S+D119Nを有するmonoTadA*7.10、及び変異I322V、S409I、E427G、R654L、R753Gを有するspCas9 (MQKFRAER);
    配列番号1の変異I76Y+V82T+Y147T+Q154S+H122Nを有するmonoTadA*7.10、及び変異I322V、S409I、E427G、R654L、R753Gを有するspCas9 (MQKFRAER);
    配列番号1の変異I76Y+V82T+Y147d+Q154Sを有するmonoTadA*7.10、及び変異I322V、S409I、E427G、R654L、R753Gを有するspCas9 (MQKFRAER);
    配列番号1の変異I76Y+V82T+Y147T+Q154S+F149Yを有するmonoTadA*7.10、及び変異I322V、S409I、E427G、R654L、R753Gを有するspCas9 (MQKFRAER);
    配列番号1の変異I76Y+V82T+Y147T+Q154S+T166Iを有するmonoTadA*7.10、及び変異I322V、S409I、E427G、R654L、R753Gを有するspCas9 (MQKFRAER);ならびに
    配列番号1の変異I76Y+V82T+Y147T+Q154S+D167Nを有するmonoTadA*7.10、及び変異I322V、S409I、E427G、R654L、R753Gを有するspCas9 (MQKFRAER);
    配列番号1の変異I76Y+V82T+Y147T+Q154S+L36H+N157Kを有するmonoTadA*7.10、及び変異I322V、S409I、E427G、R654L、R753G、R1114Gを有するspCas9 (MQKFRAER);
    配列番号1の変異I76Y+V82T+Y147D+Q154S+F149Y+D167N+L36H+N157Kを有するmonoTadA*7.10、及び変異I322V、S409I、E427G、R654L、R753G、R1114Gを有するSpCas9(MQKFRAER);
    配列番号1の変異I76Y+V82T+Y147D+Q154S+F149Y+D167N+L36H+N157K+V106Wを有するmonoTadA*7.10、及び変異I322V、S409I、E427G、R654L、R753G、R1114Gを有するSpCas9(MQKFRAER);
    配列番号1の変異A109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167Nを有するmonoTadA*7.10、及び変異I322V、S409I、E427G、R654L、R753G、R1114Gを有するSpCas9、MQKFRAER;ならびに
    配列番号1の変異A109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167N+V106Wを有するmonoTadA*7.10、及び変異I322V、S409I、E427G、R654L、R753G、R1114Gを有するSpCas9(MQKFRAER);ならびに
    前記アデノシンデアミナーゼバリアントドメインを標的指向化して、遺伝性疾患に関連するSNPのA・TからG・Cへの改変をもたらす、1つ以上のガイドポリヌクレオチド
    を含む、塩基エディター。
  94. 前記SNPが、α-1アンチトリプシン欠乏症(A1AD)に関連するものである、請求項93に記載の塩基エディター。
  95. 変異I76Y+V82T+Y147T+Q154S+A109Sを有するmonoTadA*7.10及び変異I322V、S409I、E427G、R654L、R753Gを有するspCas9 (MQKFRAER);
    変異I76Y+V82T+Y147T+Q154S+T111Rを有するmonoTadA*7.10及び変異I322V、S409I、E427G、R654L、R753Gを有するspCas9 (MQKFRAER);
    変異I76Y+V82T+Y147T+Q154S+D119Nを有するmonoTadA*7.10及び変異I322V、S409I、E427G、R654L、R753Gを有するspCas9 (MQKFRAER);
    変異I76Y+V82T+Y147T+Q154S+H122Nを有するmonoTadA*7.10及び変異I322V、S409I、E427G、R654L、R753Gを有するspCas9 (MQKFRAER);
    変異I76Y+V82T+Y147d+Q154Sを有するmonoTadA*7.10及び変異I322V、S409I、E427G、R654L、R753Gを有するspCas9 (MQKFRAER);
    変異I76Y+V82T+Y147T+Q154S+F149Yを有するmonoTadA*7.10及び変異I322V、S409I、E427G、R654L、R753Gを有するspCas9 (MQKFRAER);
    変異I76Y+V82T+Y147T+Q154S+T166Iを有するmonoTadA*7.10及び変異I322V、S409I、E427G、R654L、R753Gを有するspCas9 (MQKFRAER);ならびに
    変異I76Y+V82T+Y147T+Q154S+D167Nを有するmonoTadA*7.10及び変異I322V、S409I、E427G、R654L、R753Gを有するspCas9 (MQKFRAER);
    変異I76Y+V82T+Y147T+Q154S+L36H+N157Kを有するmonoTadA*7.10、変異I322V、S409I、E427G、R654L、R753G、R1114Gを有するspCas9 (MQKFRAER);
    変異I76Y+V82T+Y147D+Q154S+F149Y+D167N+L36H+N157Kを有するmonoTadA*7.10及び変異I322V、S409I、E427G、R654L、R753G、R1114Gを有するSpCas9 (MQKFRAER);
    変異I76Y+V82T+Y147D+Q154S+F149Y+D167N+L36H+N157K+V106Wを有するmonoTadA*7.10及び変異I322V、S409I、E427G、R654L、R753G、R1114Gを有するSpCas9 (MQKFRAER)
    変異A109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167Nを有するmonoTadA*7.10及び変異I322V、S409I、E427G、R654L、R753G、R1114Gを有するSpCas9 (MQKFRAER); ならびに
    変異A109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167N+V106Wを有するmonoTadA*7.10、及び変異I322V、S409I、E427G、R654L、R753G、R1114Gを有するSpCas9 (MQKFRAER)
    から選択されるTadAアデノシンデアミナーゼドメイン及びSpCas9エンドヌクレアーゼドメインを含むABE9塩基エディターをコードする1つ以上のポリヌクレオチドを含む、ベクター。
  96. プラスミド、ウイルス、またはmRNAベクターである、請求項95に記載のベクター。
  97. 請求項12~60のいずれか一項に記載の融合タンパク質、または請求項70~85のいずれか一項に記載の塩基エディターシステムを含む、組成物。
  98. 薬学的に許容される賦形剤、希釈剤、または担体をさらに含む、請求項97に記載の組成物。
  99. ガイドRNAに結合された請求項12~60のいずれか一項に記載の融合タンパク質を含む組成物であって、前記ガイドRNAが、α-1アンチトリプシン欠乏症(A1AD)に関連するSERPINA1遺伝子に相補的な核酸配列を含む、前記組成物。
  100. ガイドRNAに結合された請求項70~85のいずれか一項に記載の塩基エディターシステムを含む組成物であって、前記ガイドRNAが、α-1アンチトリプシン欠乏症(A1AD)に関連するSERPINA1遺伝子に相補的な核酸配列を含む、前記組成物。
  101. 前記アデノシンデアミナーゼバリアントが、デオキシリボ核酸(DNA)中のアデニンを脱アミノ化することができる、請求項97~100のいずれか一項に記載の組成物。
  102. 前記融合タンパク質または塩基エディターシステムが、
    (i)Cas9ニッカーゼを含むか;
    (ii)ヌクレアーゼ不活性Cas9を含むか;
    (iii)図3A~3Cに示すアミノ酸置換の組み合わせを含むSpCas9バリアントを含むか; または
    (iv)I322V、S409I、E427G、R654L、R753G (MQKFRAER); もしくはI322V、S409I、E427G、R654L、R753G、R1114G (MQKFRAER)から選択されるアミノ酸配列置換の組み合わせを含むSpCas9バリアントを含む、
    請求項97~101のいずれか一項に記載の組成物。
  103. 薬学的に許容される賦形剤、希釈剤、または担体をさらに含む、請求項99~102のいずれか一項に記載の組成物。
  104. 請求項98に記載の組成物を含む、疾患または障害の治療のための医薬組成物。
  105. 前記疾患または障害がα-1アンチトリプシン欠乏症(A1AD)である、請求項104に記載の医薬組成物。
  106. 前記融合タンパク質または前記塩基エディターシステムがガイドRNAに結合されており、前記ガイドRNAが、α-1アンチトリプシン欠乏症(A1AD)に関連するSERPINA1遺伝子に相補的である核酸配列を含む、請求項105に記載の医薬組成物。
  107. 前記gRNA及び前記塩基エディターは一緒にまたは別々に製剤化されている、請求項106に記載の医薬組成物。
  108. 前記gRNAが、5’から3’へ、
    5’-ACCAUCGACAAGAAAGGGACUGA GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU-3’;
    5’-CCAUCGACAAGAAAGGGACUGA GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU-3’;
    5’-CAUCGACAAGAAAGGGACUGA GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU-3’;
    5’-AUCGACAAGAAAGGGACUGA GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU-3’;
    5’-UCGACAAGAAAGGGACUGA GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU-3’; または
    5’-CGACAAGAAAGGGACUGA GUUUUAGAGC UAGAAAUAGC AAGUUAAAAU AAGGCUAGUC CGUUAUCAAC UUGAAAAAGU GGCACCGAGU CGGUGCUUUU-3’
    のうちの1つ以上から選択される核酸配列、またはその1、2、3、4、もしくは5ヌクレオチドの5’短縮断片を含む、請求項98または103~107のいずれか一項に記載の医薬組成物。
  109. 哺乳類細胞での発現に適したベクターをさらに含む、請求項98または103~108のいずれか一項に記載の医薬組成物であって、前記ベクターが、前記塩基エディターをコードするポリヌクレオチドを含む、前記医薬組成物。
  110. 前記塩基エディターをコードするポリヌクレオチドがmRNAである、請求項109に記載の医薬組成物。
  111. 前記ベクターがウイルスベクターである、請求項109に記載の医薬組成物。
  112. 前記ウイルスベクターが、レトロウイルスベクター、アデノウイルスベクター、レンチウイルスベクター、ヘルペスウイルスベクター、またはアデノ随伴ウイルスベクター(AAV)である、請求項111に記載の医薬組成物。
  113. 哺乳類細胞での発現に適したリボヌクレオ粒子をさらに含む、請求項98または103~108のいずれか一項に記載の医薬組成物。
  114. 脂質をさらに含む、請求項98または103~108のいずれか一項に記載の医薬組成物。
  115. α-1アンチトリプシン欠乏症(A1AD)の治療方法であって、前記方法が、それを必要とする対象に、請求項98または103~114のいずれか一項に記載の医薬組成物を投与することを含む、前記治療方法。
  116. 対象におけるα-1アンチトリプシン欠乏症(A1AD)の治療における請求項98または103~114のいずれか一項に記載の医薬組成物の使用。
  117. 前記対象がヒトである、請求項115に記載の方法または請求項116に記載の使用。
  118. 前記アデノシンデアミナーゼバリアントが、以下の改変の群:
    E25F+V82S+Y123H;
    T133K+Y147R+Q154R;
    E25F+V82S+Y123H+Y147R+Q154R;
    L51W+V82S+Y123H+C146R+Y147R+Q154R;
    Y73S+V82S+Y123H+Y147R+Q154R;
    P54C+V82S+Y123H+Y147R+Q154R;
    N38G+V82T+Y123H+Y147R+Q154R;
    N72K+V82S+Y123H+D139L+Y147R+Q154R;
    E25F+V82S+Y123H+D139M+Y147R+Q154R;
    Q71M+V82S+Y123H+Y147R+Q154R;
    E25F+V82S+Y123H+T133K+Y147R+Q154R;
    E25F+V82S+Y123H+Y147R+Q154R;
    V82S+Y123H+P124W+Y147R+Q154R;
    L51W+V82S+Y123H+C146R+Y147R+Q154R;
    P54C+V82S+Y123H+Y147R+Q154R;
    Y73S+V82S+Y123H+Y147R+Q154R;
    N38G+V82T+Y123H+Y147R+Q154R;
    R23H+V82S+Y123H+Y147R+Q154R;
    R21N+V82S+Y123H+Y147R+Q154R;
    V82S+Y123H+Y147R+Q154R+A158K;
    N72K+V82S+Y123H+D139L+Y147R+Q154R;
    E25F+V82S+Y123H+D139M+Y147R+Q154R;
    M70V+V82S+M94V+Y123H+Y147R+Q154R;
    Q71M+V82S+Y123H+Y147R+Q154R;
    E25F+I76Y+V82S+Y123H+Y147R+Q154R;
    I76Y+V82T+Y123H+Y147R+Q154R;
    N38G+I76Y+V82S+Y123H+Y147R+Q154R;
    R23H+I76Y+V82S+Y123H+Y147R+Q154R;
    P54C+I76Y+V82S+Y123H+Y147R+Q154R;
    R21N+I76Y+V82S+Y123H+Y147R+Q154R;
    I76Y+V82S+Y123H+D139M+Y147R+Q154R;
    Y73S+I76Y+V82S+Y123H+Y147R+Q154R;
    E25F+I76Y+V82S+Y123H+Y147R+Q154R;
    I76Y+V82T+Y123H+Y147R+Q154R;
    N38G+I76Y+V82S+Y123H+Y147R+Q154R;
    R23H+I76Y+V82S+Y123H+Y147R+Q154R;
    P54C+I76Y+V82S+Y123H+Y147R+Q154R;
    R21N+I76Y+V82S+Y123H+Y147R+Q154R;
    I76Y+V82S+Y123H+D139M+Y147R+Q154R;
    Y73S+I76Y+V82S+Y123H+Y147R+Q154R;
    V82S+Q154R;
    N72K+V82S+Y123H+Y147R+Q154R;
    Q71M+V82S+Y123H+Y147R+Q154R;
    V82S+Y123H+T133K+Y147R+Q154R;
    V82S+Y123H+T133K+Y147R+Q154R+A158K;
    M70V+Q71M+N72K+V82S+Y123H+Y147R+Q154R;
    N72K+V82S+Y123H+Y147R+Q154R;
    Q71M+V82S+Y123H+Y147R+Q154R;
    M70V+V82S+M94V+Y123H+Y147R+Q154R;
    V82S+Y123H+T133K+Y147R+Q154R;
    V82S+Y123H+T133K+Y147R+Q154R+A158K; または
    M70V+Q71M+N72K+V82S+Y123H+Y147R+Q154R
    のうちのいずれか1つを含む、請求項70~86のいずれか一項に記載の塩基エディターシステム。
  119. 前記アデノシンデアミナーゼまたはアデノシンデアミナーゼバリアントが、以下のアミノ酸改変または改変の群:
    V82T;
    I76Y+V82T; または
    I76Y+V82T+Y147T+Q154S
    のうちのいずれか1つを含むTadA*7.10バリアントである、先行請求項のいずれか一項に記載のアデノシンデアミナーゼ、融合タンパク質、塩基エディター、または塩基エディターシステム。
  120. 以下のアミノ酸改変または改変の群:
    V82T;
    I76Y+V82T; または
    I76Y+V82T+Y147T+Q154S
    のうちのいずれか1つを含むTadA*7.10バリアントである、アデノシンデアミナーゼバリアント。
  121. ポリヌクレオチドプログラム可能なDNA結合ドメインと、以下のアミノ酸改変または改変の群:
    V82T;
    I76Y+V82T; または
    I76Y+V82T+Y147T+Q154S
    のうちのいずれか1つを含むTadA*7.10アデノシンデアミナーゼバリアントである少なくとも1つの塩基エディタードメインとを含む、融合タンパク質。
  122. 前記ポリヌクレオチドプログラム可能なDNA結合ドメインが、Cas9エンドヌクレアーゼドメインを含む、請求項121に記載の融合タンパク質。
  123. 前記Cas9エンドヌクレアーゼドメインが、変異I322V、S409I、E427G、R654L、R753Gを有するspCas9(MQKFRAER)を含む、請求項122に記載の融合タンパク質。
  124. 前記TadA7*10が単量体である、請求項121に記載のアデノシンデアミナーゼバリアントまたは請求項121~123に記載のいずれか一項に記載の融合タンパク質。
  125. 以下から選択されるTadA*7.10アデノシンデアミナーゼバリアントドメイン及びCas9エンドヌクレアーゼドメインを含む、核酸塩基エディター:
    変異V82Tを有するmonoTadA*7.10及び変異I322V、S409I、E427G、R654L、R753Gを有するspCas9 (MQKFRAER);
    変異I76Y+V82Tを有するmonoTadA*7.10及び変異I322V、S409I、E427G、R654L、R753Gを有するspCas9 (MQKFRAER); または
    変異I76Y+V82T+Y147T+Q154Sを有するmonoTadA*7.10及び変異I322V、S409I、E427G、R654L、R753Gを有するspCas9 (MQKFRAER)。
JP2022514994A 2019-09-09 2020-09-09 新規核酸塩基エディター及びその使用方法 Pending JP2022546608A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962897777P 2019-09-09 2019-09-09
US62/897,777 2019-09-09
USPCT/US2020/018195 2020-02-13
PCT/US2020/018195 WO2020168135A1 (en) 2019-02-13 2020-02-13 Compositions and methods for treating alpha-1 antitrypsin deficiency
PCT/US2020/049975 WO2021050571A1 (en) 2019-09-09 2020-09-09 Novel nucleobase editors and methods of using same

Publications (2)

Publication Number Publication Date
JP2022546608A true JP2022546608A (ja) 2022-11-04
JPWO2021050571A5 JPWO2021050571A5 (ja) 2023-09-19

Family

ID=74867196

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022514994A Pending JP2022546608A (ja) 2019-09-09 2020-09-09 新規核酸塩基エディター及びその使用方法

Country Status (8)

Country Link
US (1) US20230075877A1 (ja)
EP (1) EP4028026A4 (ja)
JP (1) JP2022546608A (ja)
KR (1) KR20220076467A (ja)
CN (1) CN114667149A (ja)
AU (1) AU2020344547A1 (ja)
CA (1) CA3153624A1 (ja)
WO (1) WO2021050571A1 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230101597A1 (en) * 2019-02-13 2023-03-30 Beam Therapeutics Inc. Compositions and methods for treating alpha-1 antitrypsin deficiency
WO2022240858A1 (en) 2021-05-10 2022-11-17 Mammoth Biosciences, Inc. Effector proteins and methods of use
WO2023052366A1 (en) 2021-09-28 2023-04-06 INSERM (Institut National de la Santé et de la Recherche Médicale) Base editing approaches for the treatment of beta-hemoglobinopathies
WO2023099591A1 (en) 2021-12-01 2023-06-08 INSERM (Institut National de la Santé et de la Recherche Médicale) Methods for increasing fetal hemoglobin content by editing the +55-kb region of the erythroid-specific bcl11a enhancer
WO2023144104A1 (en) 2022-01-25 2023-08-03 INSERM (Institut National de la Santé et de la Recherche Médicale) Base editing approaches for the treatment of βeta-thalassemia
WO2023196802A1 (en) 2022-04-04 2023-10-12 The Broad Institute, Inc. Cas9 variants having non-canonical pam specificities and uses thereof
WO2023212715A1 (en) 2022-04-28 2023-11-02 The Broad Institute, Inc. Aav vectors encoding base editors and uses thereof
WO2023217904A1 (en) 2022-05-10 2023-11-16 Institut National de la Santé et de la Recherche Médicale Syncitin-1 fusion proteins and uses thereof for cargo delivery into target cells
WO2023217888A1 (en) 2022-05-10 2023-11-16 Institut National de la Santé et de la Recherche Médicale Base editing approaches for correcting the cd39 (cag>tag) mutation in patients suffering from βeta-thalassemia
WO2024018056A1 (en) 2022-07-22 2024-01-25 Institut National de la Santé et de la Recherche Médicale Base editing approaches for correcting the ivs2-1 (g>a) mutation in patients suffering from βeta-thalassemia
CN115820691B (zh) * 2022-07-25 2023-08-22 安徽农业大学 一种基于LbCpf1变体的水稻碱基编辑系统和应用
WO2024040083A1 (en) 2022-08-16 2024-02-22 The Broad Institute, Inc. Evolved cytosine deaminases and methods of editing dna using same
CN115975986B (zh) * 2022-08-22 2023-08-08 山东舜丰生物科技有限公司 突变的Cas12j蛋白及其应用
WO2024063273A1 (en) * 2022-09-23 2024-03-28 Institute For Basic Science Novel adenine deaminase variants and a method for base editing using the same
CN116836962B (zh) * 2023-06-28 2024-04-05 微光基因(苏州)有限公司 工程化的腺苷脱氨酶及碱基编辑器

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2753391T3 (es) * 2014-10-14 2020-04-08 Halozyme Inc Composiciones de adenosina desaminasa 2 (ADA2), variantes de la misma y métodos de uso de las mismas
WO2018027078A1 (en) * 2016-08-03 2018-02-08 President And Fellows Of Harard College Adenosine nucleobase editors and uses thereof
GB2573062A (en) * 2016-10-14 2019-10-23 Harvard College AAV delivery of nucleobase editors
WO2018089664A1 (en) * 2016-11-11 2018-05-17 The Regents Of The University Of California Variant rna-guided polypeptides and methods of use
WO2019079347A1 (en) * 2017-10-16 2019-04-25 The Broad Institute, Inc. USES OF BASIC EDITORS ADENOSINE
AR114014A1 (es) * 2017-12-22 2020-07-08 Inst Genetics & Developmental Biology Cas Sistema de edición de bases y método basado en proteína cpf1
CN109295186B (zh) * 2018-09-30 2023-10-03 中山大学 一种基于全基因组测序检测腺嘌呤单碱基编辑系统脱靶效应的方法及其在基因编辑中的应用

Also Published As

Publication number Publication date
EP4028026A1 (en) 2022-07-20
CA3153624A1 (en) 2021-03-18
EP4028026A4 (en) 2023-09-06
WO2021050571A1 (en) 2021-03-18
KR20220076467A (ko) 2022-06-08
AU2020344547A1 (en) 2022-03-24
CN114667149A (zh) 2022-06-24
US20230075877A1 (en) 2023-03-09

Similar Documents

Publication Publication Date Title
JP2022546608A (ja) 新規核酸塩基エディター及びその使用方法
US20220401530A1 (en) Methods of substituting pathogenic amino acids using programmable base editor systems
AU2019266327A1 (en) Methods of editing single nucleotide polymorphism using programmable base editor systems
AU2019265018A1 (en) Methods of suppressing pathogenic mutations using programmable base editor systems
CN114096666A (zh) 治疗血红素病变的组合物和方法
US20220387622A1 (en) Methods of editing a single nucleotide polymorphism using programmable base editor systems
US20230101597A1 (en) Compositions and methods for treating alpha-1 antitrypsin deficiency
AU2020336953A1 (en) Compositions and methods for editing a mutation to permit transcription or expression
EP3965832A1 (en) Compositions and methods for treating hepatitis b
CN114026237A (zh) 用于治疗1a型糖原贮积病的组成物和方法
US20220290164A1 (en) Recombinant rabies viruses for gene therapy
US20230270840A1 (en) Viral guide rna delivery
AU2022353130A1 (en) Compositions and methods for treating hepatitis b virus infection
CA3219628A1 (en) Compositions and methods for the self-inactivation of base editors
CA3198671A1 (en) Compositions and methods for treating glycogen storage disease type 1a

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230908

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230908