JP2019526271A - シトシンデアミナーゼによるdnaでの塩基編集確認方法 - Google Patents

シトシンデアミナーゼによるdnaでの塩基編集確認方法 Download PDF

Info

Publication number
JP2019526271A
JP2019526271A JP2019514036A JP2019514036A JP2019526271A JP 2019526271 A JP2019526271 A JP 2019526271A JP 2019514036 A JP2019514036 A JP 2019514036A JP 2019514036 A JP2019514036 A JP 2019514036A JP 2019526271 A JP2019526271 A JP 2019526271A
Authority
JP
Japan
Prior art keywords
target
dna
cytosine deaminase
endonuclease
encoding gene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019514036A
Other languages
English (en)
Inventor
キム,デシク
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toolgen Inc
SNU R&DB Foundation
Original Assignee
Toolgen Inc
Seoul National University R&DB Foundation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toolgen Inc, Seoul National University R&DB Foundation filed Critical Toolgen Inc
Publication of JP2019526271A publication Critical patent/JP2019526271A/ja
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04001Cytosine deaminase (3.5.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/02Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2) hydrolysing N-glycosyl compounds (3.2.2)
    • C12Y302/02027Uracil-DNA glycosylase (3.2.2.27)
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/30Phosphoric diester hydrolysing, i.e. nuclease
    • C12Q2521/301Endonuclease
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/50Other enzymatic activities
    • C12Q2521/531Glycosylase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/50Other enzymatic activities
    • C12Q2521/539Deaminase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04004Adenosine deaminase (3.5.4.4)

Abstract

(1)シトシンデアミナーゼおよび不活性化された標的特異的エンドヌクレアーゼ、(2)ガイドRNA、および(3)ウラシル−特異的除去試薬(Uracil−Specific Excision Reagent;USER)を含む、DNA二重鎖切断(double strand breaks;DSBs)用組成物、これを用いたシトシンデアミナーゼによるDNA二重鎖切断(double strand break)生成方法、シトシンデアミナーゼによって塩基編集(base editing)が導入されたDNAの核酸配列分析方法、およびシトシンデアミナーゼの塩基編集部位、標的(on−target)部位での塩基編集効率、非標的位置(off−target site)、および/または標的特異性を確認(または測定または検出)する方法が提供される。【選択図】 図4a

Description

(1)シトシンデアミナーゼおよび不活性化された標的特異的エンドヌクレアーゼ、(2)ガイドRNA、および(3)ウラシル−特異的除去試薬(Uracil−Specific Excision Reagent;USER)を含む、DNA二重鎖切断(double strand breaks;DSBs)用組成物、これを用いたシトシンデアミナーゼによるDNA二重鎖切断(double strand break)生成方法、シトシンデアミナーゼによって塩基編集(base editing)が導入されたDNAの核酸配列分析方法、およびシトシンデアミナーゼの塩基編集部位、標的(on−target)部位での塩基編集効率、非標的位置(off−target site)、および/または標的特異性を確認(または測定または検出)する方法に関するものである。
Cas9−連結されたデアミナーゼ(Cas9−linked deaminase)は、遺伝的障害を誘発する点突然変異を矯正するか、人間および他の真核細胞に目的とする単一ヌクレオチド変異を導入するように標的化された方式(targeted manner)で単一ヌクレオチド転換を可能にする。しかし、このようなRNA−プログラム可能な(programmable)デアミナーゼのゲノム全般(genome−wide)にかけた標的特異性はまだ多く知られていない。
プログラム可能な(programmable)デアミナーゼは、以下の4種類が報告されている:
1)ストレプトコッカス・ピオゲネス(S.pyogenes)に由来する触媒的に欠乏したCas9(catalytically−deficient Cas9;dCas9)またはD10A Cas9ニッカーゼ(nCas9)と、ラットのシチジンデアミナーゼであるrAPOBEC1を含む塩基エディター(Base Editors;BEs);2)dCas9またはnCas9と、ウミヤツメウナギ(sea lamprey)の活性化誘導シチジンデアミナーゼ(activation−induced cytidine deaminase;AID)オーソログ(ortholog)であるPmCDA1または人間AIDを含むTarget−AID;3)MS2−結合タンパク質に融合された過活性化されたAID変異体を募集するためにMS2 RNAヘアピンに連結されたsgRNAsとdCas9を含むCRISPR−X;および4)ジンク−フィンガータンパク質またはTALエフェクター(transcription activator−like effectors;TALEs)がシチジンデアミナーゼに融合されたもの。
DNA結合モジュールとシチジンデアミナーゼ(cytidine deaminase)から構成されたプログラム可能な(programmable)デアミナーゼはDNA二重鎖切断(DSBs)を生成せず、ゲノムで標的化されたヌクレオチド置換または塩基編集(base editing)を可能にする。標的部位に小さい挿入または欠失(indels)を誘導するCRISPR−Cas9およびZFNsのようなプログラム可能な(programmable)ヌクレアーゼとは異なり、プログラム可能な(programmable)デアミナーゼは、標的部位での数個のヌクレオチド(window of several nucleotides)内で、CをT(U)に(またはより低い頻度で、CをGまたはAに変換)変換させる。プログラム可能な(programmable)デアミナーゼは人間の細胞、動物および植物で遺伝疾患を誘発する点突然変異を矯正するか、単一塩基多型性(SNP)を生成することができる。
プログラム可能な(programmable)デアミナーゼによる塩基編集(base editing)に対する広範囲な関心にもかかわらず、プログラム可能な(programmable)デアミナーゼのゲノム全体に対する標的特異性を分析することができる手段が開発されたことがない。したがって、プログラム可能な(programmable)デアミナーゼのゲノム全体に対する標的特異性を分析して、プログラム可能な(programmable)デアミナーゼの塩基編集効率、非標的サイト(off−target site)、非標的効果(off−target effect)などを分析することができる手段の開発が必要である。
本明細書ではプログラム可能な(programmable)デアミナーゼのゲノム全体に対する標的特異性を分析することができる手段、およびこれを通じてプログラム可能な(programmable)デアミナーゼの塩基編集効率、非標的サイト、非標的効果などを分析することができる手段が提供される。
一例は、(1)シトシンデアミナーゼおよび不活性化された標的特異的エンドヌクレアーゼ、またはシトシンデアミナーゼコード遺伝子および不活性化された標的特異的エンドヌクレアーゼコード遺伝子、シトシンデアミナーゼコード遺伝子および不活性化された標的特異的エンドヌクレアーゼコード遺伝子を含むプラスミド、(2)ガイドRNA、および(3)ウラシル−特異的除去試薬(Uracil−Specific Excision Reagent;USER)を含む、DNA二重鎖切断(double strand breaks;DSBs)用組成物を提供する。
他の例は、
(i)(a)シトシンデアミナーゼおよび不活性化された標的特異的エンドヌクレアーゼ、または(b)シトシンデアミナーゼコード遺伝子および不活性化された標的特異的エンドヌクレアーゼコード遺伝子、または(c)シトシンデアミナーゼコード遺伝子および不活性化された標的特異的エンドヌクレアーゼコード遺伝子を含むプラスミドをガイドRNAと共に細胞に導入するか、細胞から分離されたDNAに接触させる段階;および
(ii)ウラシル−特異的除去試薬(Uracil−Specific Excision Reagent;USER)を処理する段階
を含む、DNA二重鎖切断(double strand break)生成方法を提供する。
他の例は、
(i)(a)シトシンデアミナーゼおよび不活性化された標的特異的エンドヌクレアーゼ、または(b)シトシンデアミナーゼコード遺伝子および不活性化された標的特異的エンドヌクレアーゼコード遺伝子、または(c)シトシンデアミナーゼコード遺伝子および不活性化された標的特異的エンドヌクレアーゼコード遺伝子を含むプラスミドをガイドRNAと共に細胞に導入するか、細胞から分離されたDNAに接触させる段階;
(ii)ウラシル−特異的除去試薬(Uracil−Specific Excision Reagent;USER)を処理してDNAに二重鎖切断を生成する段階;および
(iii)前記切断されたDNA断片の核酸配列を分析する段階
を含む、前記シトシンデアミナーゼによって塩基編集(base editing)が導入されたDNAの核酸配列分析方法を提供する。
他の例は、
(i)(a)シトシンデアミナーゼおよび不活性化された標的特異的エンドヌクレアーゼ、または(b)シトシンデアミナーゼコード遺伝子および不活性化された標的特異的エンドヌクレアーゼコード遺伝子、または(c)シトシンデアミナーゼコード遺伝子および不活性化された標的特異的エンドヌクレアーゼコード遺伝子を含むプラスミドをガイドRNAと共に細胞に導入するか、細胞から分離されたDNAに接触させる段階;
(ii)ウラシル−特異的除去試薬(Uracil−Specific Excision Reagent;USER)を処理してDNAに二重鎖切断を生成する段階;
(iii)前記切断されたDNA断片の核酸配列を分析する段階;および
(iv)前記分析によって得られた核酸配列データ(sequence read)で前記二重鎖切断部位を確認する段階
を含む、シトシンデアミナーゼの塩基編集部位、標的(on−target)部位での塩基編集効率、非標的位置(off−target site)、および/または標的特異性を確認(または測定または検出)する方法を提供する。
本明細書ではDigenome−seqを修正して人間ゲノムでCas9ニッカーゼ(nickase)とデアミナーゼ(deaminase)から構成された塩基エディター(例えば、Base Editor3;BE3)の特異性を評価した。ゲノムDNAをDNA修飾酵素(DNA−modifying enzymes)の混合物およびBE3で試験管内で処理してウラシル含有部位でDNA二重鎖切断(DNA double−strand breaks;DSBs)を生成することを確認した。本明細書で提供されるデアミナーゼを用いたDNA二重鎖切断方法およびこれを用いた核酸配列分析方法によって、BE3非標的サイトを全体ゲノムシークエンシングデータを用いて計算的に確認することができる。また、前記方法によって、BE3は高度に特異的であり、人間ゲノムでただ18±9位置のみでシトシン−ウラシル転換を誘導するのを確認することができる。一方、本明細書で提供されるDigenome−seq(digested−genome sequencing)方法によるデアミナーゼを用いたDNA二重鎖切断方法およびこれを用いた核酸配列分析方法は0.1%の置換頻度でBE3非標的サイトを捕捉するに十分に敏感である。その結果、BE3およびCas9の非標的部位は多くの場合に異なるため、ゲノム全般的な特異性に対する独立的な評価が必要であるのが分かる。
まず、DNAに二重鎖切断を誘発しないシトシンデアミナーゼを用いてDNAに二重鎖切断を生成する技術が提供される。
一例は、(1)シトシンデアミナーゼおよび不活性化された標的特異的エンドヌクレアーゼ、またはシトシンデアミナーゼコード遺伝子および不活性化された標的特異的エンドヌクレアーゼコード遺伝子、シトシンデアミナーゼコード遺伝子および不活性化された標的特異的エンドヌクレアーゼコード遺伝子を含むプラスミド、(2)ガイドRNA、および(3)ウラシル−特異的除去試薬(Uracil−Specific Excision Reagent;USER)を含む、DNA二重鎖切断(double strand breaks;DSBs)用組成物を提供する。前記組成物は、シトシンデアミナーゼを使用してDNA二重鎖切断を誘導するのに使用できる。
前記シトシンデアミナーゼは、ヌクレオチドに存在する塩基であるシトシン(例えば、二重鎖DNAまたはRNAに存在するシトシン)をウラシルに変換(C−to−U conversion or C−to−U editing)させる活性を有する全ての酵素を意味するものであって、標的部位の配列(標的配列)のPAM配列が存在する鎖に位置するシトシンをウラシルに変換させる。一例で、前記シトシンデアミナーゼは人間、猿などの霊長類、ラット、マウスなどのげっ歯類などのような哺乳類に由来したものであり得るが、これに制限されるわけではない。例えば、前記シトシンデアミナーゼはAPOBEC(“apolipoprotein B mRNA editing enzyme、catalytic polypeptide−like”)ファミリーに属する酵素のうちから1種以上選択されてもよく、例えば、下記からなる群より1種以上選択されてもよいが、これに制限されるわけではない:
APOBEC1:人間(Homo sapiens)APOBEC1(タンパク質:GenBank Accession Nos.NP_001291495.1、NP_001635.2、NP_005880.2など;遺伝子(前に記載されたタンパク質順にこれをコードする遺伝子を記載する):GenBank Accession Nos.NM_001304566.1、NM_001644.4、NM_005889.3など)、マウス(Mus musculus)APOBEC1(タンパク質:GenBank Accession Nos.NP_001127863.1、NP_112436.1など;遺伝子(前に記載されたタンパク質順にこれをコードする遺伝子を記載する):GenBank Accession Nos.NM_001134391.1、NM_031159.3など);
APOBEC2:人間APOBEC2(タンパク質:GenBank Accession No.NP_006780.1など;遺伝子:GenBank Accession No.NM_006789.3など)、マウスAPOBEC2(タンパク質:GenBank Accession No.NP_033824.1など;遺伝子:GenBank Accession No.NM_009694.3など);
APOBEC3B:人間APOBEC3B(タンパク質:GenBank Accession Nos.NP_001257340.1、NP_004891.4など;遺伝子(mRNA or cDNA、以下、同一)(前に記載されたタンパク質順にこれをコードする遺伝子を記載する):GenBank Accession Nos.NM_001270411.1、NM_004900.4など)、マウス(Mus musculus)APOBEC3B(タンパク質:GenBank Accession Nos.NP_001153887.1、NP_001333970.1、NP_084531.1など;遺伝子(前に記載されたタンパク質順にこれをコードする遺伝子を記載する):GenBank Accession Nos.NM_001160415.1、NM_001347041.1、NM_030255.3など);
APOBEC3C:人間APOBEC3C(タンパク質:GenBank Accession No.NP_055323.2など;遺伝子:GenBank Accession No.NM_014508.2など);
APOBEC3D(including APOBEC3E):人間APOBEC3D(タンパク質:GenBank Accession No.NP_689639.2など;遺伝子:GenBank Accession No.NM_152426.3など);
APOBEC3F:人間APOBEC3F(タンパク質:GenBank Accession Nos.NP_660341.2、NP_001006667.1など;遺伝子(前に記載されたタンパク質順にこれをコードする遺伝子を記載する):NM_145298.5、NM_001006666.1など);
APOBEC3G:人間APOBEC3G(タンパク質:GenBank Accession Nos.NP_068594.1、NP_001336365.1、NP_001336366.1、NP_001336367.1など;遺伝子(前に記載されたタンパク質順にこれをコードする遺伝子を記載する):NM_021822.3、NM_001349436.1、NM_001349437.1、NM_001349438.1など);
APOBEC3H:人間APOBEC3H(タンパク質:GenBank Accession Nos.NP_001159474.2、NP_001159475.2、NP_001159476.2、NP_861438.3など;遺伝子(前に記載されたタンパク質順にこれをコードする遺伝子を記載する):NM_001166002.2、NM_001166003.2、NM_001166004.2、NM_181773.4など);
APOBEC4(including APOBEC3E):人間APOBEC4(タンパク質:GenBank Accession No.NP_982279.1など;遺伝子:GenBank Accession No.NM_203454.2など);マウスAPOBEC4(タンパク質:GenBank Accession No.NP_001074666.1など;遺伝子:GenBank Accession No.NM_001081197.1など);および
活性化誘導シチジンデアミナーゼ(Activation−induced cytidine deaminase;AICDAまたはAID):人間AID(タンパク質:GenBank Accession Nos.NP_001317272.1、NP_065712.1など;遺伝子(前に記載されたタンパク質順にこれをコードする遺伝子を記載する):GenBank Accession Nos.NM_001330343.1、NM_020661.3など);マウスAID(タンパク質:GenBank Accession No.NP_033775.1など;遺伝子:GenBank Accession No.NM_009645.2など)など。
本明細書に使用されたものとして、標的特異的ヌクレアーゼは、遺伝子はさみ(programmable nuclease)とも呼ばれ、目的とするゲノムDNA上の特定位置を認識して切断することができる全ての形態のエンドヌクレアーゼをひっくるめて称する。
例えば、前記標的特異的ヌクレアーゼは、標的遺伝子の特定配列を認識しヌクレオチド切断活性を有して標的遺伝子でインデル(insertion and/or deletion、Indel)を引き起こすことができる全てのヌクレアーゼから選択された1種以上であり得る。
例えば、前記標的特異的ヌクレアーゼは、
ゲノム上の特定標的配列を認識するドメインである植物病原性遺伝子に由来したTALエフェクター(transcription activator−like effector)ドメインと切断ドメインが融合されたTALEN(transcription activator−like effector nuclease);
ジンク−フィンガーヌクレアーゼ(zinc−finger nuclease);
メガヌクレアーゼ(meganuclease);
微生物免疫系であるCRISPRに由来したRGEN(RNA−guided engineered nuclease;例えば、Cas9、Cpf1、など);
Agoホモログ(Ago homolog、DNA−guided endonuclease)
などからなる群より選択された1種以上であってもよいが、これに制限されるわけではない。
一具体例で、前記標的特異的ヌクレアーゼは、Casタンパク質(例えば、Cas9タンパク質(CRISPR(Clustered regularly interspaced short palindromic repeats)associated protein 9)、Cpf1タンパク質(CRISPR from Prevotella and Francisella 1)などのようなタイプIIおよび/またはタイプVのCRISPRシステムに伴うエンドヌクレアーゼからなる群より選択された1種以上であってもよい。この場合、前記標的特異的ヌクレアーゼは、ゲノムDNAの標的部位に案内するための標的DNA特異的ガイドRNAを追加的に含んでもよい。前記ガイドRNAは生体外(in vitro)で転写された(transcribed)ものであってもよく、例えばオリゴヌクレオチド二重鎖またはプラスミド鋳型から転写されたものであってもよいが、これに制限されない。前記標的特異的ヌクレアーゼは、ガイドRNAに結合されたリボ核酸−タンパク質複合体を形成(RNA−Guided Engineered Nuclease)してリボ核酸タンパク質(RNP)形態で作用できる。
Cas9タンパク質はCRISPR/Casシステムの主要タンパク質構成要素であって、活性化されたエンドヌクレアーゼまたはニッカーゼ(nickase)を形成することができるタンパク質である。
Cas9タンパク質または遺伝子情報はNCBI(National Center for Biotechnology Information)のGenBankのような公知のデータベースから得ることができる。例えば、前記Cas9タンパク質は、
ストレプトコッカスsp.(Streptococcus sp.)、例えば、ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)由来のCas9タンパク質(例えば、SwissProt Accession number Q99ZW2(NP_269215.1)(コード遺伝子:配列番号229);
カンピロバクター属、例えば、カンピロバクター・ジェジュニ(Campylobacter jejuni)由来のCas9タンパク質;
ストレプトコッカス属、例えば、ストレプトコッカス・サーモフィルス(Streptococcus thermophiles)またはストレプトコッカス・アウレウス(Streptocuccus aureus)由来のCas9タンパク質;
ナイセリア・メニンギチジス(Neisseria meningitidis)由来のCas9タンパク質;
パスツレラ(Pasteurella)属、例えば、パスツレラ・ムルトシダ(Pasteurella multocida)由来のCas9タンパク質;
フランシセラ(Francisella)属、例えば、フランシセラ・ノビシダ(Francisella novicida)由来の例えばCas9タンパク質
などからなる群より選択された一つ以上であってもよいが、これに制限されるわけではない。
Cpf1タンパク質は前記CRISPR/Casシステムとは区別される新たなCRISPRシステムのエンドヌクレアーゼであって、Cas9に比べて相対的に大きさが小さくtracrRNAが必要なく、単一ガイドRNAによって作用できる。また、チミン(thymine)が豊富なPAM(protospacer−adjacent motif)配列を認識しDNAの二重鎖を切断して 粘着末端(cohesive end;cohesive double−strand break)を生成する。
例えば、前記Cpf1タンパク質はカンジダツス(Candidatus)属、ラクノスピラ(Lachnospira)属、ブチリビブリオ(Butyrivibrio)属、ペレグリニバクテリア(Peregrinibacteria)、アシドミノコッカス(Acidominococcus)属、ポルフィロモナス(Porphyromonas)属、プレボテラ(Prevotella)属、フランシセラ(Francisella)属、カンジダツスメタノプラズマ(Candidatus Methanoplasma)、またはユバクテリウム(Eubacterium)属由来のものであってもよく、例えば、Parcubacteria bacterium(GWC2011_GWC2_44_17)、Lachnospiraceae bacterium(MC2017)、Butyrivibrio proteoclasiicus、Peregrinibacteria bacterium(GW2011_GWA_33_10)、Acidaminococcus sp.(BV3L6)、Porphyromonas macacae、Lachnospiraceae bacterium(ND2006)、Porphyromonas crevioricanis、Prevotella disiens、Moraxella bovoculi(237)、Smiihella sp.(SC_KO8D17)、Leptospira inadai、Lachnospiraceae bacterium(MA2020)、Francisella novicida(U112)、Candidatus Methanoplasma termitum、Candidatus Paceibacter、Eubacterium eligensなどの微生物由来のものであってもよいが、これに制限されるわけではない。
前記標的特異的エンドヌクレアーゼは、微生物から分離されたものまたは組換え的方法または合成的方法などのように人為的または非自然的生産されたもの(non−naturally occurring)であってもよい。一例で、前記標的特異的エンドヌクレアーゼ(例えば、Cas9、Cpf1、など)は、組換えDNAによって作られた組換えタンパク質であってもよい。組換えDAN(Recombinant DNA;rDNA)は多様な有機体から得られた異種または同種遺伝物質を含むために分子クローニングのような遺伝子組換え方法によって人工的に作られたDNA分子を意味する。例えば、組換えDNAを適切な有機体で発現させて標的特異的エンドヌクレアーゼを生産(in vivoまたはin vitro)する場合、組換えDNAは、製造しようとするタンパク質をコードするコドンのうちから前記有機体に発現するに最適化されたコドンを選択して再構成されたヌクレオチド配列を有するものであり得る。
前記不活性化された標的特異的エンドヌクレアーゼはDNA二重鎖を切断するエンドヌクレアーゼ活性を喪失した標的特異的エンドヌクレアーゼを意味するものであって、例えば、エンドヌクレアーゼ活性を喪失しニッカーゼ活性を有する不活性化された標的特異的エンドヌクレアーゼおよびエンドヌクレアーゼ活性とニッカーゼ活性を全て喪失した不活性化された標的特異的エンドヌクレアーゼのうちから選択された1種以上であってもよい。前記不活性化された標的特異的エンドヌクレアーゼがニッカーゼ活性を有するものである場合、前記シトシンがウラシルに変換されると同時または順序と関係なく順次に、シトシンがウラシルに変換された鎖またはその反対鎖(例えば、反対鎖)で切断(nick)が導入される(例えば、PAM配列の5’末端方向に3番目のヌクレオチドと4番目のヌクレオチドの間に切断(nick)が導入される)。このような標的特異的エンドヌクレアーゼの改変(突然変異)は少なくとも触媒活性を有するアスパラギン酸残基(catalytic aspartate residue;例えば、ストレプトコッカス・ピオゲネス由来Cas9タンパク質の場合、10番目位置のアスパラギン酸(D10)残基など)が任意の他のアミノ酸で置換されたCas9の突然変異を含むものであってもよく、前記他のアミノ酸はアラニン(alanine)であってもよいが、これに制限されない。
本明細書に使用されたものとして、前記‘他のアミノ酸’は、アラニン、イソロイシン、ロイシン、メチオニン、フェニルアラニン、プロリン、トリプトファン、バリン、 アスパラギン、システイン、グルタミン、グリシン、セリン、トレオニン、チロシン、 アスパラギン酸、グルタミン酸、アルギニン、ヒスチジン、ライシン、前記アミノ酸の公知された全ての改変体のうち、野生型タンパク質が元来変異位置に有するアミノ酸を除いたアミノ酸のうちから選択されたアミノ酸を意味する。
一例で、前記不活性化された標的特異的エンドヌクレアーゼが改変Cas9タンパク質である場合、改変Cas9タンパク質は、ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)由来のCas9タンパク質(例えば、SwissProt Accession number Q99ZW2(NP_269215.1))にD10位置での突然変異(例えば、他のアミノ酸で置換)が導入されエンドヌクレアーゼ活性が喪失されニッカーゼ活性を有する改変Cas9、ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)由来のCas9タンパク質にD10位置での突然変異(例えば、他のアミノ酸で置換)とH840位置に突然変異(例えば、他のアミノ酸で置換)が全て導入されエンドヌクレアーゼ活性およびニッカーゼ活性を全て喪失した改変Cas9タンパク質などからなる群より選択された1種以上であってもよい。例えば、前記CAs9タンパク質のD10位置での突然変異は、D10A突然変異(Cas9タンパク質のアミノ酸のうちの10番目のアミノ酸であるDがAで置換された突然変異を意味する;以下、Cas9に導入された突然変異は同様な方法で表記される)であってもよく、前記H840位置での突然変異はH840A突然変異であってもよい。
前記シトシンデアミナーゼと不活性化された標的特異的エンドヌクレアーゼは直接またはペプチドリンカーを通じて互いに融合された融合タンパク質(例えば、N−末端からC−末端方向にシトシンデアミナーゼ−不活性化された標的特異的エンドヌクレアーゼの順に位置するか(即ち、シトシンデアミナーゼのC−末端に不活性化された標的特異的エンドヌクレアーゼが融合される)、不活性化された標的特異的エンドヌクレアーゼ−シトシンデアミナーゼの順に位置が配置(即ち、不活性化された標的特異的エンドヌクレアーゼのC−末端にシトシンデアミナーゼが融合される)されてもよい)形態で使用(または前記組成物に含まれる)されるか、精製されたシトシンデアミナーゼと不活性化された標的特異的エンドヌクレアーゼの混合物形態で使用(または前記組成物に含まれる)されるか、シトシンデアミナーゼコード遺伝子と不活性化された標的特異的エンドヌクレアーゼコード遺伝子が全て含まれた(例えば、前記二つの遺伝子は前述の融合タンパク質をコードするように含まれる)一つのプラスミド形態で使用(または前記組成物に含まれる)されるか、シトシンデアミナーゼコード遺伝子と不活性化された標的特異的エンドヌクレアーゼコード遺伝子をそれぞれ別個のプラスミドに含まれているシトシンデアミナーゼ発現プラスミドと不活性化された標的特異的エンドヌクレアーゼ発現プラスミドの混合物形態で使用(または前記組成物に含まれる)されてもよい。一具体例ではN−末端からC−末端方向にシトシンデアミナーゼ−不活性化された標的特異的エンドヌクレアーゼの順に位置する融合タンパク質、または不活性化された標的特異的エンドヌクレアーゼ−シトシンデアミナーゼの順に位置する融合タンパク質、または前記融合タンパク質をコードするようにシトシンデアミナーゼコード遺伝子と不活性化された標的特異的エンドヌクレアーゼコード遺伝子が一つのプラスミドに含まれている形態で使用されてもよい。
前記プラスミドは、前記シトシンデアミナーゼコード遺伝子および/または不活性化された標的特異的エンドヌクレアーゼコード遺伝子を挿入し、これを宿主細胞内で発現させることができる発現システムを含む全てのプラスミドであり得る。前記プラスミドは目的遺伝子発現のための要素(elements)を含むものであって、複製原点(replication origin)、プロモーター、作動遺伝子(operator)、転写終結配列(terminator)などを含むことができ、宿主細胞のゲノム内への導入のための適切な酵素部位(例えば、制限酵素部位)および/または任意に宿主細胞内への成功的な導入を確認するための選別マーカおよび/またはタンパク質への翻訳のためのリボソーム結合部位(ribosome binding site;RBS)および/または転写調節因子などを追加的に含むことができる。前記プラスミドは当業界で使用されるプラスミド、例えば、pcDNAシリーズ、pSC101、pGV1106、pACYC177、ColE1、pKT230、pME290、pBR322、pUC8/9、pUC6、pBD9、pHC79、pIJ61、pLAFR1、pHV14、pGEXシリーズ、pETシリーズ、pUC19などからなる群より選択された1種以上であってもよいが、これに制限されるわけではない。前記宿主細胞は、前記シトシンデアミナーゼによって塩基編集または二重鎖切断を導入しようとする細胞(例えば、人間細胞などのような哺乳類細胞を含む真核細胞)または前記シトシンデアミナーゼコード遺伝子および/または不活性化された標的特異的エンドヌクレアーゼコード遺伝子を発現してシトシンデアミナーゼおよび不活性化された標的特異的エンドヌクレアーゼを発現することができる全ての細胞(例えば、E.coliなど)のうちから選択され得る。
前記ガイドRNAは前記シトシンデアミナーゼと不活性化された標的特異的エンドヌクレアーゼの混合物または融合タンパク質を標的部位に案内する役割を果たすものであって、CRISPR RNA(crRNA)、trans−activating crRNA(tracrRNA)、および単一ガイドRNA(single guide RNA;sgRNA)からなる群より選択された1種以上であってもよく、具体的にcrRNAとtracrRNAが互いに結合された二重鎖crRNA:tracrRNA複合体、またはcrRNAまたはその一部とtracrRNAまたはその一部がオリゴヌクレオチドリンカーで連結された単一鎖ガイドRNA(sgRNA)であってもよい。
前記ガイドRNAの具体的配列は使用された標的特異的エンドヌクレアーゼの種類またはその由来微生物などによって適切に選択することができ、これはこの発明の属する技術分野における通常の知識を有する者が容易に分かる事項である。
標的特異的エンドヌクレアーゼとしてストレプトコッカス・ピオゲネス(Streptococcus pyogenes)由来のCas9タンパク質を使用する場合、crRNAは下記の一般式1で表され得る:
5’−(Ncas9−(GUUUUAGAGCUA)−(Xcas9−3’(一般式1)
上記一般式1中、
cas9は標的化配列、即ち、標的遺伝子(target gene)の標的部位(target site)の配列によって決定される部位(即ち、標的部位の配列と混成化可能な配列である)であり、lは前記標的化配列に含まれているヌクレオチド数を示すものであって、17〜23または18〜22の整数、例えば、20であってもよく;
前記標的配列の3’方向に隣接して位置する連続する12個のヌクレオチド(GUUUUAGAGCUA;配列番号230)を含む部位はcrRNAの必須的部分であり、
cas9はcrRNAの3’末端側に位置する(即ち、前記crRNAの必須的部分の3’方向に隣接して位置する)m個のヌクレオチドを含む部位であって、mは8〜12の整数、例えば、11であってもよく、前記m個のヌクレオチドは互いに同じであるか異なってもよく、それぞれ独立してA、U、CおよびGからなる群より選択され得る。
一例で、前記Xcas9はUGCUGUUUUG(配列番号231)を含むことができるが、これに制限されない。
また、前記tracrRNAは下記の一般式2で表され得る:
5’−(Ycas9−(UAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC)−3’(一般式2)
上記一般式2中、
60個のヌクレオチド(UAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC;配列番号232)で表された部位はtracrRNAの必須的部分であり、
cas9は前記tracrRNAの必須的部分の5’末端に隣接して位置するp個のヌクレオチドを含む部位であって、pは6〜20の整数、例えば8〜19の整数であってもよく、前記p個のヌクレオチドは互いに同じであるかまたは異なってもよく、A、U、CおよびGからなる群よりそれぞれ独立して選択され得る。
また、sgRNAは前記crRNAの標的化配列と必須的部位を含むcrRNA部分と前記tracrRNAの必須的部分(60個ヌクレオチド)を含むtracrRNA部分がオリゴヌクレオチドリンカーを通じてヘアピン構造(stem−loop構造)を形成するものであってもよい(この時、オリゴヌクレオチドリンカーがループ構造に該当する)。より具体的に、前記sgRNAはcrRNAの標的化配列と必須的部分を含むcrRNA部分とtracrRNAの必須的部分を含むtracrRNA部分が互いに結合された二重鎖RNA分子で、crRNA部位の3’末端とtracrRNA部位の5’末端がオリゴヌクレオチドリンカーを通じて連結されたヘアピン構造を有するものであってもよい。
一例で、sgRNAは、下記の一般式3で表され得る:
5’−(Ncas9−(GUUUUAGAGCUA)−(オリゴヌクレオチドリンカー)−(UAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC)−3’(一般式3)
上記一般式3中、(Ncas9は標的化配列であって、前記一般式1で説明したとおりである。
前記sgRNAに含まれるオリゴヌクレオチドリンカーは3〜5個、例えば4個のヌクレオチドを含むものであってもよく、前記ヌクレオチドは互いに同じであるかまたは異なってもよく、A、U、CおよびGからなる群よりそれぞれ独立して選択され得る。
前記crRNAまたはsgRNAは、5’末端(即ち、crRNAのターゲティング配列部位の5’末端)に1〜3個のグアニン(G)を追加的に含んでもよい。
前記tracrRNAまたはsgRNAは、tracrRNAの必須的部分(60nt)の3’末端に5個〜7個のウラシル(U)を含む終結部位を追加的に含んでもよい。
前記ガイドRNAの標的配列は、標的DNA上のPAM(Protospacer Adjacent Motif配列(S.pyogenes Cas9の場合、5’−NGG−3’(NはA、T、G、またはCである))の5’に隣接して位置する約17個〜約23個または約18個〜約22個、例えば20個の連続する核酸配列であってもよい。
前記ガイドRNAの標的配列と混成化可能なガイドRNAの標的化配列は前記標的配列が位置するDNA鎖(即ち、PAM配列(5’−NGG−3’(NはA、T、G、またはCである)が位置するDNA鎖)の相補的な鎖のヌクレオチド配列と50%以上、60%以上、70%以上、80%以上、90%以上、95%以上、99%以上、または100%の配列相補性を有するヌクレオチド配列を意味するものであって、前記相補的鎖のヌクレオチド配列と相補的結合が可能である。
本明細書で、標的部位の核酸配列は、標的遺伝子の該当遺伝子部位の二つのDNA鎖のうちのPAM配列が位置する鎖の核酸配列で表示される。この時、実際にガイドRNAが結合するDNA鎖はPAM配列が位置する鎖の相補的鎖であるので、前記ガイドRNAに含まれている標的化配列は、RNA特性上TをUに変更することを除いて、標的部位の配列と同一な核酸配列を有するようになる。したがって、本明細書で、ガイドRNAの標的化配列と標的部位の配列(または切断部位の配列)はTとUが相互変更されることを除いて同一な核酸配列で表示される。
前記ガイドRNAは、RNA形態で使用(または前記組成物に含まれる)されるか、これをコードするDNAを含むプラスミド形態で使用(または前記組成物に含まれる)されてもよい。
前記ウラシル−特異的除去試薬(Uracil−Specific Excision Reagent;USER)は、前記シトシンデアミナーゼによってシトシンから変換されたウラシルを除去し、および/または前記ウラシルが除去された位置にDNA切断を導入する役割を果たす全ての物質を含むことができる。
一例で、前記ウラシル−特異的除去試薬(Uracil−Specific Excision Reagent;USER)は、ウラシルDNAグリコシラーゼ(Uracil DNA glycosylase;UDG)、エンドヌクレアーゼVIII、およびこれらの組み合わせを含む。一例で、前記ウラシル−特異的除去試薬は、エンドヌクレアーゼVIIIまたはウラシルDNAグリコシラーゼとエンドヌクレアーゼVIIIの組み合わせを含むものであってもよい。
ウラシルDNAグリコシラーゼ(Uracil DNA glycosylase;UDG)はDNAに存在するウラシル(U)を除去してDNAの突然変異誘発(mutagenesis)を防止する作用を果たす酵素であって、ウラシルのN−グリコシル結合(N−glycosylic bond)を切断することによって塩基除去修復経路(base−excision repair(BER) pathway)を開始するようにする役割を果たす全ての酵素のうちから1種以上選択され得る。例えば、前記ウラシルDNAグリコシラーゼは、Escherichia coliウラシルDNAグリコシラーゼ(例えば、GenBank Accession Nos.ADX49788.1、ACT28166.1、EFN36865.1、BAA10923.1、ACA76764.1、ACX38762.1、EFU59768.1、EFU53885.1、EFJ57281.1、EFU47398.1、EFK71412.1、EFJ92376.1、EFJ79936.1、EFO59084.1、EFK47562.1、KXH01728.1、ESE25979.1、ESD99489.1、ESD73882.1、ESD69341.1など)、人間ウラシルDNAグリコシラーゼ(例えば、GenBank Accession Nos.NP_003353.1、NP_550433.1など)、マウスウラシルDNAグリコシラーゼ(例えば、GenBank Accession Nos.NP_001035781.1、NP_035807.2など)などからなる群より選択された1種以上であってもよいが、これに制限されるわけではない。
前記エンドヌクレアーゼVIIIは前記ウラシルが除去されたヌクレオチドを除去する役割を果たすものであって、前記ウラシルDNAグリコシラーゼによって損傷されたウラシルを二重鎖DNAから除去するN−グリコシラーゼ(N−glycosylase)活性と前記損傷されたウラシル除去から発生した脱プリン部位(apurinic site;AP site)の3’および5’末端を切断するAP−リアーゼ(AP−lyase)活性を全て有する全ての酵素のうちから1種以上選択され得る。例えば、前記エンドヌクレアーゼVIIIは、人間エンドヌクレアーゼVIII(例えば、GenBank Accession Nos.BAC06476.1、NP_001339449.1、NP_001243481.1、NP_078884.2、NP_001339448.1など)、マウスエンドヌクレアーゼVIII(例えば、GenBank Accession Nos.BAC06477.1、NP_082623.1など)、大腸菌(Escherichia coli)エンドヌクレアーゼVIII(例えば、GenBank Accession Nos.OBZ49008.1、OBZ43214.1、OBZ42025.1、ANJ41661.1、KYL40995.1、KMV55034.1、KMV53379.1、KMV50038.1、KMV40847.1、AQW72152.1など)などからなる群より選択された1種以上であってもよいが、これに制限されるわけではない。
他の例で、不活性化された標的特異的エンドヌクレアーゼとしてストレプトコッカス・ピオゲネス(Streptococcus pyogenes)由来のCas9タンパク質にD10A突然変異とH840A突然変異が全て導入された改変Cas9タンパク質のようにエンドヌクレアーゼ活性だけでなくニッカーゼ活性も喪失された不活性化された標的特異的エンドヌクレアーゼを使用する場合、二重鎖切断のために、一側鎖のウラシルが除去されて単一鎖として存在するDNAの単一鎖領域を特異的に分解(単一鎖部位の両末端のホスホジエステル結合を切断)するエンドヌクレアーゼを追加的に含んでもよい。前記DNAの単一鎖領域を特異的に分解するエンドヌクレアーゼは、S1ヌクレアーゼ(アスペルギルス・オリゼー(Aspergillus oryzae)由来;例えば、Catalog number M5791(Promega)など)、マングビーンヌクレアーゼ(Mung bean nuclease)などからなる群より選択された1種以上であってもよい。
このようなシトシンデアミナーゼおよび不活性化された標的特異的エンドヌクレアーゼおよびウラシル−特異的除去試薬の処理によってシトシンデアミナーゼによってシトシンからウラシルに塩基変換(塩基編集)が起こった部位に二重鎖切断が生成される(図4a参照)。このように生成されたDNA切断断片は互いに延長された末端(staggered end)を有する。その後、任意に末端修復(end repair)過程が起こってもよく、これによってblunted ended DNA断片(二重鎖)が生成されてもよい(図4a参照)。
他の例は、
(i)(a)シトシンデアミナーゼおよび不活性化された標的特異的エンドヌクレアーゼ、または(b)シトシンデアミナーゼコード遺伝子および不活性化された標的特異的エンドヌクレアーゼコード遺伝子、または(c)シトシンデアミナーゼコード遺伝子および不活性化された標的特異的エンドヌクレアーゼコード遺伝子を含むプラスミドをガイドRNAと共に細胞に導入するか、細胞から分離されたDNAに接触させる段階;および
(ii)ウラシル−特異的除去試薬(Uracil−Specific Excision Reagent;USER)を処理する段階
を含む、シトシンデアミナーゼを使用してDNAに二重鎖切断(double strand break)を生成する方法を提供する。
このようにシトシンデアミナーゼを使用してDNAに二重鎖切断を生成(または導入)することによって、ゲノムDNAまたはDNAの標的部位でシトシンデアミナーゼによって塩基編集(base editing、即ち、CからUへの変換)が起こった位置、シトシンデアミナーゼの塩基編集効率などを分析することができ、これを通じて、シトシンデアミナーゼの標的(on−target)部位での塩基編集効率、標的(on−target)配列に対する特異性、非標的(off−target)配列などを確認(または測定)することができる。
他の例は、
(i)(a)シトシンデアミナーゼおよび不活性化された標的特異的エンドヌクレアーゼ、または(b)シトシンデアミナーゼコード遺伝子および不活性化された標的特異的エンドヌクレアーゼコード遺伝子、または(c)シトシンデアミナーゼコード遺伝子および不活性化された標的特異的エンドヌクレアーゼコード遺伝子を含むプラスミドをガイドRNAと共に細胞に導入するか細胞から分離されたDNAに接触させる段階;
(ii)ウラシル−特異的除去試薬(Uracil−Specific Excision Reagent;USER)を処理してDNAに二重鎖切断を生成する段階;および
(iii)前記切断されたDNA断片の核酸配列を分析する段階
を含む、シトシンデアミナーゼによって塩基編集(base editing)が導入されたDNAの核酸配列分析方法を提供する。
他の例は、
(i)(a)シトシンデアミナーゼおよび不活性化された標的特異的エンドヌクレアーゼ、または(b)シトシンデアミナーゼコード遺伝子および不活性化された標的特異的エンドヌクレアーゼコード遺伝子、または(c)シトシンデアミナーゼコード遺伝子および不活性化された標的特異的エンドヌクレアーゼコード遺伝子を含むプラスミドをガイドRNAと共に細胞に導入するか、細胞から分離されたDNAに接触させる段階;
(ii)ウラシル−特異的除去試薬(Uracil−Specific Excision Reagent;USER)を処理してDNAに二重鎖切断を生成する段階;
(iii)前記切断されたDNA断片の核酸配列を分析する段階;および
(iv)前記分析によって得られた核酸配列データで前記二重鎖切断部位を確認する段階
を含む、シトシンデアミナーゼの塩基編集部位、標的(on−target)部位での塩基編集効率、非標的位置(off−target site)、および/または標的特異性を確認(または測定または検出)する方法を提供する。
前記シトシンデアミナーゼ、不活性化された標的特異的エンドヌクレアーゼ、プラスミド、ガイドRNAおよびウラシル−特異的除去試薬は前述のとおりである。
前記方法は細胞内または試験管内(in vitro)で行われるものであってもよく、例えば、試験管内で行われるものであってもよい。より具体的に、前記方法の全ての段階が試験管内(in vitro)で行われるか、前記段階(i)は細胞内で行われ、前記段階(ii)以後の段階は前記段階(i)が行われた細胞から抽出されたDNA(例えば、ゲノムDNA)を使用して試験管内(in vitro)で行われるものであってもよい。
前記段階(i)はシトシンデアミナーゼおよび不活性化された標的特異的エンドヌクレアーゼ(またはこれらのコード遺伝子)とガイドRNAを細胞に形質感染させるか、または前記細胞から抽出されたDNAに接触(例えば、共に培養)させ、ガイドRNAによって標的化される標的部位内でシトシンからウラシルへの変換およびDNA切断(nick)発生を誘導する段階である。前記細胞はシトシンデアミナーゼによる塩基編集を導入しようとする全ての真核細胞のうちから選択されたものであってもよく、例えば、人間細胞を含むほ乳動物細胞のうちから選択され得る。前記形質感染はシトシンデアミナーゼおよび不活性化された標的特異的エンドヌクレアーゼをコードする遺伝子を含むプラスミドを通常の全ての手段によって細胞に導入させることによって行われ、例えば、前記プラスミドの細胞への導入は電気穿孔(electroporation)、リポフェクションなどによって行われ得るが、これに制限されるわけではない。
一具体例で、前記段階(i)は、前記細胞(シトシンデアミナーゼによる塩基編集(塩基編集部位、塩基編集効率など)を確認しようとする細胞から抽出されたDNAをシトシンデアミナーゼおよび不活性化された標的特異的エンドヌクレアーゼ(例えば、シトシンデアミナーゼおよび不活性化された標的特異的エンドヌクレアーゼを含む融合タンパク質)およびガイドRNAと共に培養することによって行われ得る(in vitro)。前記細胞から抽出されたDNAは、ゲノムDNA(genome DNA)または標的遺伝子または標的部位を含むPCR(polymerase chain reaction)増幅産物であってもよい。
前記段階(ii)は、前記段階(i)でウラシルに改変された塩基を除去してDNA二重鎖切断を生成する段階である。より具体的に、前記段階(ii)は、前記段階(i)で得られた反応物にウラシルDNAグリコシラーゼ(Uracil DNA glycosylase;UDG)、エンドヌクレアーゼVIII、およびこれらの組み合わせを処理(接触)する段階によって行われ得る。ウラシルDNAグリコシラーゼとエンドヌクレアーゼVIIIを全て処理(接触)する場合、同時に処理するか、順序に関係なく順次に処理してもよい。前記処理(接触)する段階は、前記段階(i)で得られた反応物をウラシルDNAグリコシラーゼおよび/またはエンドヌクレアーゼVIIIと共に培養する段階によって行われ得る。
前記段階(ii)の反応物は、前記段階(i)が細胞内で行われた場合(即ち、細胞を形質感染させて行われた場合)、前記形質感染された細胞から分離されたDNAを含むものであってもよく、前記段階(i)が細胞から抽出(分離)されたDNAに対して試験管内(in vitro)行われたものである場合、前記シトシンデアミナーゼおよび不活性化された標的特異的エンドヌクレアーゼおよびガイドRNA処理された分離されたDNAを含むものであってもよい。
他の例で、前記段階(i)で不活性化された標的特異的エンドヌクレアーゼとしてストレプトコッカス・ピオゲネス(Streptococcus pyogenes)由来のCas9タンパク質にD10A突然変異とH840A突然変異が全て導入された不活性化された標的特異的エンドヌクレアーゼを使用する場合、前記不活性化された標的特異的エンドヌクレアーゼはエンドヌクレアーゼ活性だけでなくニッカーゼ活性も喪失したので、二重鎖切断のために、前記段階(ii)以後および段階(iii)以前に、一側鎖のウラシルが除去されて単一鎖として存在するDNAの単一鎖領域を特異的に分解(単一鎖部位の両末端を切断)するエンドヌクレアーゼを処理する段階(段階(ii−1))を追加的に含んでもよい(図22のa参照)。前記DNAの単一鎖領域を特異的に分解するエンドヌクレアーゼはS1ヌクレアーゼであってもよいが、これに制限されるわけではない。
任意に、前記段階(i)遂行(または完了)後段階(ii)遂行前に、段階(i)で使用されたシトシンデアミナーゼ、不活性化された標的特異的エンドヌクレアーゼ、および/またはガイドRNAを除去する段階を追加的に含んでもよい。
前記シチジンデアミナーゼおよび不活性化された標的特異的エンドヌクレアーゼはガイドRNAと共に使用されて配列特異性(specificity)を有するので大部分標的位置(on−target)に作用するが、標的配列以外の部位に標的配列と類似の配列がどの程度存在するかによって非標的位置(off−target site)に作用する副作用が発生することもある。本明細書で、非標的位置(off−target site)とは、シチジンデアミナーゼおよび不活性化された標的特異的エンドヌクレアーゼの標的部位ではないが、シチジンデアミナーゼおよび不活性化された標的特異的エンドヌクレアーゼが活性を有する位置をいう。即ち、標的位置以外の、シチジンデアミナーゼおよび不活性化された標的特異的エンドヌクレアーゼによって塩基編集および/または切断される位置をいう。一例で、前記非標的位置はシチジンデアミナーゼおよび不活性化された標的特異的エンドヌクレアーゼに対する実際非標的位置だけでなく非標的位置になる可能性がある位置まで含む概念として使用され得る。前記非標的位置はこれに制限されるわけではないが、試験管内(in vitro)でシチジンデアミナーゼおよび不活性化された標的特異的エンドヌクレアーゼによって切断される標的位置以外の全ての位置を意味することができる。
シチジンデアミナーゼおよび不活性化された標的特異的エンドヌクレアーゼが標的位置以外の位置でも活性を有することは多様な原因によって引き起こされ得る。例えば、標的部位に対して設計された標的配列とヌクレオチドミスマッチ(mismatch)水準が低くて、標的配列と配列相同性の高い標的配列以外の配列(非標的配列)の場合、シチジンデアミナーゼおよび不活性化された標的特異的エンドヌクレアーゼが作動する可能性がある。前記非標的配列はこれに制限されるわけではないが、標的配列と1個〜6個、1個〜5個、1個〜4個、1個〜3個、1個〜2個、または1個のヌクレオチドミスマッチ(mismatch)を有する配列(遺伝子部位)であってもよい。
ミスマッチ配列でシチジンデアミナーゼおよび不活性化された標的特異的エンドヌクレアーゼが作動する場合、ゲノム内で望まない遺伝子の突然変異を引き起こすことがあって、深刻な問題が引き起こされることがある。よって、シチジンデアミナーゼおよび不活性化された標的特異的エンドヌクレアーゼの標的位置での活性に劣らず非標的配列を正確に検出して分析する過程も非常に重要であると言え、これは非標的効果なく標的位置にのみ特異的に作動するシチジンデアミナーゼおよび不活性化された標的特異的エンドヌクレアーゼを開発することに有用に使用され得る。
本発明の目的上、前記シチジンデアミナーゼおよび不活性化された標的特異的エンドヌクレアーゼは生体内(in vivo)および試験管内(in vitro)で活性を有することができるので、試験管内でDNA(例えば、ゲノムDNA)の非標的位置を検出することに使用でき、これを生体内で適用した時、前記検出された非標的位置(非標的配列を含む遺伝子上位置(部位))と同一な位置にも活性を有するのを予想することができる。
前記段階(iii)は前記段階(ii)で切断されたDNA断片の核酸配列を分析する段階であって、通常の全ての核酸配列分析方法によって行われ得る。例えば、前記段階(i)で使用された分離されたDNAがゲノムDNAである場合、前記核酸配列分析は全体ゲノムシークエンシング(whole genome sequencing)によって行われ得る。全体ゲノムシークエンシングを行う場合、標的部位の配列と相同性を有する配列を探して非標的位置であると予測する間接的な方法と異なり、全体ゲノム水準で実質的に標的特異的ヌクレアーゼによって切断される非標的位置を検出することができるので、より正確に非標的位置を検出することができる。
本明細書に使用されたものとして、“全体ゲノムシークエンシング(whole genome sequencing;WGS)”は、次世代シークエンシング(next generation sequencing)による全長ゲノムシークエンシングを10X、20X、40Xの形式で様々な倍数でゲノムを読む方法を意味する。“次世代シークエンシング”はチップ(Chip)基盤およびPCR基盤ペアードエンド(paired end)形式で全長ゲノムを断片化し、前記断片を化学的な反応(hybridization)に基づいて超高速でシークエンシングを行う技術を意味する。
前記段階(iv)は前記段階(iii)で得られた塩基配列データ(sequence read)でDNAが切断された位置を確認(または決定)する段階であって、シークエンシングデータを分析して標的位置(on−target site)と非標的位置(off−target site)を簡便に検出することができる。前記塩基配列データからDNAが切断された特定位置を決定することは多様な接近方法で行うことができ、本明細書では前記位置を決定するための様々な合理的な方法を提供する。しかし、これは本発明の技術的思想に含まれる例示に過ぎず、本発明の範囲がこれら方法によって制限されるわけではない。
例えば、前記切断された位置を決定するための一例として、全体ゲノムシークエンシングを通じて得られた塩基配列データをゲノム上の位置によって整列した場合、5’末端がまっすぐに整列された位置がDNAが切断された位置を意味するものであり得る。前記塩基配列データをゲノム上の位置によって整列する段階は、分析プログラム(例えば、BWA/GATKまたはISAACなど)を用いて行うことができる。本明細書に使用されたものとして、前記用語“まっすぐな整列”とは、BWA/GATKまたはISAACなどのプログラムで全体ゲノムシークエンシング結果を分析する時、隣接したワトソン鎖(Watson strand)とクリック鎖(Crick strand)のそれぞれに対して、2つ以上の塩基配列データの5’末端がゲノム上の同一な位置(nucleotide position)で始まる配列をいう。これによって、前記段階(ii)で切断されて同一な5’末端を有するようになるDNA断片がそれぞれシークエンシングされて表されるようになる。
即ち、前記段階(ii)での切断が標的位置および非標的位置で起こる場合、塩基配列データを整列すれば、共通的に切断された部位はそれぞれその位置が5’末端で始まるのでまっすぐに整列されるが、切断されていない部位には5’末端が存在しないので、整列時、スタッガード(staggered)方式で配列され得る。したがって、まっすぐに整列された位置を前記段階(ii)で切断された部位と見ることができ、これは即ちシチジンデアミナーゼおよび不活性化された標的特異的エンドヌクレアーゼの標的位置または非標的位置を意味するものであり得る。
前記“整列”は、標準塩基配列(reference genome)で塩基配列データをマッピングした後、ゲノムで同一位置を有する塩基を各位置に合うように配列することを意味する。したがって、塩基配列データを前記のような方式で整列することができればいかなるコンピュータプログラムも用いることができ、これは当業界に既に知られた公知のプログラムまたは目的に合うように製作されたプログラムのうちから選択され得る。一実施形態ではISAACを用いて整列を行ったが、これに制限されるわけではない。
整列の結果、前述のように5’末端がまっすぐ整列された位置を探すなどの方法を通じてシチジンデアミナーゼおよび不活性化された標的特異的エンドヌクレアーゼによってDNAが切断された位置を決定することができ、前記切断された位置が標的位置(on−target site)でなければ、非標的位置(off−target site)と判断することができる。言い換えれば、シチジンデアミナーゼおよび不活性化された標的特異的エンドヌクレアーゼの標的位置として設計した塩基配列と同一な配列は標的位置であり、前記塩基配列と同一でない配列は非標的位置と見ることができる。これは前述の非標的位置の定義上自明なのである。前記非標的位置は特に、標的位置の配列と相同性を有する配列から構成されたものであってもよく、具体的に標的位置と1つ以上のヌクレオチドミスマッチ(mismatch)を有する配列、さらに具体的に標的位置(標的配列)と1個〜6個、1個〜5個、1個〜4個、1個〜3個、1個〜2個、または1個のヌクレオチドミスマッチを有するものであってもよいが、これに特に制限されるわけではなく、シチジンデアミナーゼおよび不活性化された標的特異的エンドヌクレアーゼが切断できる位置であれば本発明の範囲に含まれ得る。
他の例で、5’末端がまっすぐに整列された位置を探す方法以外にも、5’末端プロットで二重ピークパターンを示す場合、その位置が標的位置でなければ非標的位置と判断することができる。ゲノムDNA内の各位置に対して同一な塩基の5’末端を構成しているヌクレオチド数を数えてグラフを描く場合、特定位置で二重ピークパターンが示されるようになり、前記二重ピークはシチジンデアミナーゼおよび不活性化された標的特異的エンドヌクレアーゼによって切断された二重鎖のそれぞれの鎖によって示されるものであるためである。
したがって、前記非標的位置確認方法は、前記段階(iv)以後に、前記切断された位置が標的位置(on−target site)でない場合、非標的位置(off−target site)と判断する段階を追加的に含んでもよい。
一実施形態で、ゲノムDNAに対して前記段階(i)および(ii)を行って二重鎖切断した後、全体ゲノム分析(段階(iii))遂行後、これをISAACで整列して切断された位置ではまっすぐに整列、切断されていない位置ではスタッガード方式で整列されるパターンを確認して、これを5’末端プロットで示した時、切断部位で二重ピークの独特なパターンが示され得る。
さらに、これに制限されるわけではないが、具体的な一例としてワトソン鎖(Watson strand)とクリック鎖(Crick strand)に該当する塩基配列データ(sequence read)がそれぞれ二つ以上ずつまっすぐに整列される位置を非標的位置であると判断することができ、また20%以上の塩基配列データがまっすぐに整列され、それぞれのワトソン鎖およびクリック鎖で同一な5’末端を有する塩基配列データの数が10以上である位置が非標的位置、即ち、切断される位置であると判断することができる。
前記方法は段階(iii)および(iv)の過程はDigenome−seq(digested−genome sequencing)であってもよく、より具体的な内容は韓国特許公開第10−2016−0058703号に記載されている(前記文献は本発明に参照として含まれる)。
前述の方法によって、シトシンデアミナーゼの塩基編集部位(即ち、二重鎖切断部位)、標的(on−target)部位での塩基編集効率または標的特異性(即ち、標的(on−target)部位での塩基編集頻度/全体塩基編集頻度)、および/または非標的位置(off−target site;シトシンデアミナーゼの塩基編集部位として確認された位置のうちの標的(on−target)位置でない位置)を確認(または測定または検出)することができる。
前記非標的位置確認(検出)は、試験管内(in vitro)でシチジンデアミナーゼおよび不活性化された標的特異的エンドヌクレアーゼをゲノムDNAに処理して行われ得る。よって、前記方法を通じて確認(検出)された非標的位置に対して実質的に生体内(in vivo)でも非標的効果が現れるか確認してみることができる。但し、これは追加的な検証過程に過ぎないので、本発明の範囲に必須的に伴う段階ではなく、必要によって追加的に行われる段階に過ぎない。
本明細書に使用されたものとして、用語“非標的効果(off−target effect)”は、非標的位置(off−target site)で塩基編集および/または二重鎖切断が起こる水準を意味するためのものであり得る。用語“インデル(Insertion and/or deletion;Indel)”は、DNAの塩基配列で一部塩基が中間に挿入されるか(insertion)および/または欠失された(deletion)変異を総称する。
他の例で、シトシンデアミナーゼの塩基編集部位、標的(on−target)部位での塩基編集効率、非標的位置(off−target site)、および/または標的特異性を確認(または測定または検出)する方法は、前述のDigenome−seq方法以外の方法で行うことができる。
例えば、シトシンデアミナーゼの塩基編集部位、標的(on−target)部位での塩基編集効率、非標的位置(off−target site)、および/または標的特異性を確認(または測定または検出)する方法はcircle−seq方法によって行われてもよく、具体的に、下記の段階を含んでもよい(図20a参照):
(i)細胞から抽出されたゲノムDNAを断片化および環状化させる段階
(ii)前記環状化されたDNA断片にシトシンデアミナーゼおよび不活性化された標的特異的エンドヌクレアーゼを処理した後、ウラシル−特異的除去試薬(Uracil−Specific Excision Reagent;USER)を処理して、環状化されたDNA断片に二重鎖切断を生成する段階;および
(iii)前記二重鎖切断が生成されたDNA断片を用いてライブラリーを構築し、次世代ゲノムシークエンシング(NGS)を行う段階
を含んでもよい。前記段階(ii)のシトシンデアミナーゼおよび不活性化された標的特異的エンドヌクレアーゼは、ガイドRNAと共に使用され得る。
他の例で、シトシンデアミナーゼの塩基編集部位、標的(on−target)部位での塩基編集効率、非標的位置(off−target site)、および/または標的特異性を確認(または測定または検出)する方法はBless方法によって行われてもよく、具体的に、下記の段階を含んでもよい(図20b参照):
(i)(a)シトシンデアミナーゼおよび不活性化された標的特異的エンドヌクレアーゼ、または(b)シトシンデアミナーゼコード遺伝子および不活性化された標的特異的エンドヌクレアーゼコード遺伝子、または(c)シトシンデアミナーゼコード遺伝子および不活性化された標的特異的エンドヌクレアーゼコード遺伝子を含むプラスミドを細胞または細胞から分離されたゲノムDNAに接触させる段階;
(ii)ウラシル−特異的除去試薬(Uracil−Specific Excision Reagent;USER)を処理してDNAに二重鎖切断を生成する段階;
(iii)前記切断されたDNA断片末端に標識した後、これを捕獲する段階;
(iv)前記捕獲されたDNA断片を増幅し、次世代ゲノムシークエンシング(NGS)を行う段階
を含んでもよい。前記段階(i)のシトシンデアミナーゼおよび不活性化された標的特異的エンドヌクレアーゼ、またはこれをコードする遺伝子またはこれを含むプラスミドは、ガイドRNAまたはガイドRNAをコードするDNAを含むプラスミドと共に使用され得る。
他の例で、シトシンデアミナーゼの塩基編集部位、標的(on−target)部位での塩基編集効率、非標的位置(off−target site)、および/または標的特異性を確認(または測定または検出)する方法はDSBCapture方法によって行われてもよく、具体的に、下記の段階を含んでもよい(図20c参照):
(i)(a)シトシンデアミナーゼおよび不活性化された標的特異的エンドヌクレアーゼ、または(b)シトシンデアミナーゼコード遺伝子および不活性化された標的特異的エンドヌクレアーゼコード遺伝子、または(c)シトシンデアミナーゼコード遺伝子および不活性化された標的特異的エンドヌクレアーゼコード遺伝子を含むプラスミドを細胞または細胞から分離されたゲノムDNAに接触させる段階;
(ii)ウラシル−特異的除去試薬(Uracil−Specific Excision Reagent;USER)を処理してDNAに二重鎖切断を生成する段階;
(iii)前記切断されたDNA断片に対して末端修復(end repair)およびアダプターライゲーション(adaptor ligation)を行う段階;
(iv)前記(iii)で得られたDNA断片を増幅し、次世代ゲノムシークエンシング(NGS)を行う段階
を含んでもよい。前記段階(i)のシトシンデアミナーゼおよび不活性化された標的特異的エンドヌクレアーゼ、またはこれをコードする遺伝子またはこれを含むプラスミドはガイドRNAまたはガイドRNAをコードするDNAを含むプラスミドと共に使用され得る。
本明細書で提供されるシチジンデアミナーゼを用いたDNA二重鎖切断方法およびこれを用いた核酸配列分析技術によって、シチジンデアミナーゼの塩基編集部位、標的(on−target)部位での塩基編集効率または標的特異性、および/または非標的位置をより正確で効率的に確認することができる。
HEK293T細胞の7個の内在的標的部位(EMX1、FANCF、HEK2、RNF2、HEK3、HEK4、HBB)でBE1(APOBEC1−dCas9)、BE2(APOBEC1−dCas9−UGI)およびBE3(APOBEC1−nCas9−UGI)(参考例1参照)で得られた塩基編集効率を示す。 HEK293T細胞内の7個の内在的標的部位で標的深層シークエンシングによって測定されたCas9ヌクレアーゼ−誘導突然変異頻度を示す。 7個の内在的標的部位でインデル(indel)頻度または塩基編集効率の順位を代表的に示すグラフである。 標的部位およびこれと1〜4個のミスマッチを有するsgRNAおよび、BE3またはCas9をコードするプラスミドをHEK293T細胞に共同形質感染させ、3個の内在的部位(endogenous sites;EMX1)での突然変異頻度を測定した結果である(記載された核酸配列はグラフ上で下方向に配列番号1から配列番号31まで順次に番号が付けられる)。 標的部位およびこれと1〜4個のミスマッチを有するsgRNAおよび、BE3またはCas9をコードするプラスミドをHEK293T細胞に共同形質感染させ、3個の内在的部位(endogenous sites;HBB)での突然変異頻度を測定した結果である(記載された核酸配列はグラフ上で下方向に配列番号32から配列番号62まで順次に番号付けられる)。 標的部位およびこれと1〜4個のミスマッチを有するsgRNAおよび、BE3またはCas9をコードするプラスミドをHEK293T細胞に共同形質感染させ、3個の内在的部位(endogenous sites;RNF2)での突然変異頻度を測定した結果である(記載された核酸配列はグラフ上で下方向に配列番号63から配列番号93まで順次に番号付けられる)。 EMX1部位でのCas9ヌクレアーゼに関連するインデル(indel)頻度とBE3に関連する塩基編集頻度を示すグラフである。 HBB部位でのCas9ヌクレアーゼに関連するインデル(indel)頻度とBE3に関連する塩基編集頻度を示すグラフである。 RNF2部位でのCas9ヌクレアーゼに関連するインデル(indel)頻度とBE3に関連する塩基編集頻度を示すグラフである。 BE3のDigenome−seqの概要を模式的に示す。 BE3および/またはUSERを処理した場合、切断されたPCR産物を示す電気泳動写真である。 B3によるC対U転換およびUSERによるDNA切断結果を示すサンガー(Sanger)シークエンシング結果である。 EMX1の標的サイトでの配列リード(sequence read)の直線整列を示すIGVイメージである。 6個の他の標的サイトでの配列リード(sequence read)の直線整列を示すIGVイメージである。 図6a(EMX1)および6b(HBB):損傷していないゲノムDNA(灰色;中央部から一番目の層(layer))とBE3およびUSER(青色;中央部から2番目の層(layer))またはCas9(赤色;中央部から3番目の層(layer);図6bのみにある)に分解されたゲノムDNAで得られたDNA切断点数を示すゲノムワイドサーカスプロット(Genome−wide circus plot)であって、矢印はターゲットサイトを示す。 図6a(EMX1)および6b(HBB):損傷していないゲノムDNA(灰色;中央部から一番目の層(layer))とBE3およびUSER(青色;中央部から2番目の層(layer))またはCas9(赤色;中央部から3番目の層(layer);図6bのみにある)に分解されたゲノムDNAで得られたDNA切断点数を示すゲノムワイドサーカスプロット(Genome−wide circus plot)であって、矢印はターゲットサイトを示す。 図6c(EMX1)および6d(HBB):Digenome−捕獲されたサイト(Digenome−capture sites)(表2−8)でDNA配列を使用してWebLogoを通じて得られた配列ロゴ(DNA分解点数>2.5)を示す。 図6c(EMX1)および6d(HBB):Digenome−捕獲されたサイト(Digenome−capture sites)(表2−8)でDNA配列を使用してWebLogoを通じて得られた配列ロゴ(DNA分解点数>2.5)を示す。 図6e(EMX1)および6f(HBB):標的深部シークエンシングを用いて決定されたCas9媒介インデル(indel)頻度とBE3媒介置換頻度の散布図(Scatter plot)を示すものであって、円で表示された点はBE3によって確認されたがCas9によって有効な効果がない非標的サイトを示す。 図6e(EMX1)および6f(HBB):標的深部シークエンシングを用いて決定されたCas9媒介インデル(indel)頻度とBE3媒介置換頻度の散布図(Scatter plot)を示すものであって、円で表示された点はBE3によって確認されたがCas9によって有効な効果がない非標的サイトを示す。 図6g(EMX1)および6h(HBB):標的深部シークエンシングによってHEK293T細胞で確認されたBE3非標的サイトを示すものであって、PAM配列は3’末端の最後の3個のヌクレオチドであり、ミスマッチ塩基(mismatched base)は小文字で表わし、ダッシュ(−)はRNA bulgesを示す(Error bars indicate s.e.m.(n=3))。 図6g(EMX1)および6h(HBB):標的深部シークエンシングによってHEK293T細胞で確認されたBE3非標的サイトを示すものであって、PAM配列は3’末端の最後の3個のヌクレオチドであり、ミスマッチ塩基(mismatched base)は小文字で表わし、ダッシュ(−)はRNA bulgesを示す(Error bars indicate s.e.m.(n=3))。 Cas9ヌクレアーゼ−および塩基エディター(base editor)−処理ゲノムDNAのDigenome−seqによって確認されたDNA切断点数が2.5以上である部位の数を示すベンダイヤグラムである。 DNA切断点数の範囲に対する総サイト数(■)と10個以下のミスマッチ(mismatches)(□)があるPAM含有サイト数を示すグラフである。 Cas9ヌクレアーゼ−および塩基エディター(Base editor)−処理ゲノムDNAのDigenome−seqによって確認された0.1以上のDNA切断点数を有するPAM−含む相同性部位の数を示すベンダイヤグラムである。 Digenome−seqによって捕獲された相同性部位の比率を示すものであって、棒は標的(標的)部位と6ntまで異なる相同性部位の数を示し、四角形(BE3)と三角形(Cas9)はミスマッチ数の範囲に対してDigenome−seq捕獲サイトの比率を示す。 Digenome1.0(11a)およびDigenome2.0(11b)によって確認されたBE3−とCas9−関連サイトの数の間の相関関係を示すグラフである。 Digenome1.0(11a)およびDigenome2.0(11b)によって確認されたBE3−とCas9−関連サイトの数の間の相関関係を示すグラフである。 Digenome1.0(a)またはDigenome2.0(b)によって確認されたBE3関連サイトの数と6個以下のミスマッチがあるサイトの数の間の相関関係を示すグラフである。 Digenome1.0(a)またはDigenome2.0(b)によって確認されたBE3関連サイトの数と6個以下のミスマッチがあるサイトの数の間の相関関係を示すグラフである。 positions4−9にシトシンがないCas9のみに関連するDigenome−捕獲された非標的サイトを例示的に示す。 3個の他のCas9ヌクレアーゼに関連するDigenome−捕獲された(Digenome−captured)サイトの塩基編集効率を示す。 3個の他のCas9ヌクレアーゼに関連するDigenome−捕獲された(Digenome−captured)サイトの塩基編集効率を示す。 3個の他のCas9ヌクレアーゼに関連するDigenome−捕獲された(Digenome−captured)サイトの塩基編集効率を示す。 Digenome−陰性サイトで3個の互いに異なるBE3デアミナーゼの塩基編集効率を示す。 Digenome−陰性サイトで3個の互いに異なるBE3デアミナーゼの塩基編集効率を示す。 Digenome−陰性サイトで3個の互いに異なるBE3デアミナーゼの塩基編集効率を示す。 既存のsgRNA(gX19 sgRNA)、切断された(truncated)sgRNA(gX18またはgX17 sgRNA)および延長(extended)sgRNA(gX20またはggX20 sgRNA)を図式的に示す。 HEK293T細胞のHBB標的サイトおよび非標的サイトの塩基編集頻度を標的深部シークエンシングで測定した結果を示す。 改変されたsgRNAを使用してBE3非標的効果を減少させることができるのを示すものであって、17aは既存のsgRNA(GX19 sgRNA)と改変されたsgRNA(GX17 sgRNA、gX18 sgRNA、gX20 sgRNAおよびggX20 sgRNA)の概略的に示す。 改変されたsgRNAを使用してBE3非標的効果を減少させることができるのを示すものであって、図17bはHEK293T細胞で標的深層シークエンシングによってEMX1標的サイトおよび非標的サイトで測定された塩基編集効率(頻度)を示す。 プラスミドrAPOBEC1−XTEN−dCas9−NLSの開裂地図である。 プラスミドrAPOBEC1−XTEN−dCas9−UGI−NLSの開裂地図である。 プラスミドrAPOBEC1−XTEN−Cas9n−UGI−NLSの開裂地図である。 Cas9発現プラスミド(expression plasmid)の開裂地図である。 His6−rAPOBEC1−XTEN−dCas9をコーディングするプラスミドpET28b−BE1の開裂地図である。 Digenome−seq以外の方法で全体ゲノムでの塩基エディターの非標的サイトをプロファイリングする方法を模式的に示すものであって、21aはcircle−seqを用いた方法をそれぞれ示す。 Digenome−seq以外の方法で全体ゲノムでの塩基エディターの非標的サイトをプロファイリングする方法を模式的に示すものであって、21bはBlessを用いた方法をそれぞれ示す。 Digenome−seq以外の方法で全体ゲノムでの塩基エディターの非標的サイトをプロファイリングする方法を模式的に示すものであって、21cはDSBCaptureを用いた方法をそれぞれ示す。 BE1(rAPOBEC1−dCas9)−媒介二重鎖切断(double strand breaks;DSBs)過程および結果を示すものであって、(a)はBE1(rAPOBEC1−dCas9)、USER酵素、およびS1ヌクレアーゼを用いてDSBを導入する過程を模式的に示し、(b)はBE1/sgRNA、USER酵素、およびS1ヌクレアーゼ処理後のPCR増幅産物でのBE1−媒介DSB結果を示す電気泳動写真である。
以下、本発明を下記の実施例によってより具体的に説明する。しかし、これらは本発明を例示するためのものに過ぎず、本発明の範囲がこれら実施例によって制限されるわけではない。
[参考例]
1.細胞培養および形質感染
HEK293T細胞(ATCC CRL−11268)を10%(w/v)FBSおよび1%(w/v)ペニシリン/ストレプトマイシン(Welgene)で補充されたDMEM(Dulbecco Modified Eagle Medium)培地で維持させた。HEK293T細胞(1.5×10)を24−ウェルプレートに接種し、Lipofectamine 2000(Invitrogen)を使用してsgRNAプラスミド(500ng)と、塩基エディタープラスミド(Base Editor plasmid)(Addgene plasmid #73019(Expresses BE1 with C−terminal NLS in mammalian cells;rAPOBEC1−XTEN−dCas9−NLS;図18a)、#73020(Expresses BE2 in mammalian cells;rAPOBEC1−XTEN−dCas9−UGI−NLS;図18b)、#73021(Expresses BE3 in mammalian cells;rAPOBEC1−XTEN−Cas9n−UGI−NLS;図18c))(1.5μg)またはCas9発現プラスミド(Addgene plasmid #43945;図19)を形質感染させた(at〜80% confluency)。形質感染後72時間後に、DNeasy Blood & Tissue Kit(Qiagen)を使用してゲノムDNAを分離した。前記細胞に対してマイコプラズマ汚染の有無をテストしなかった。
下記の実施例に使用されたsgRNAは標的部位配列(標的配列;on−target配列;表1−8参照)の中の5’末端のPAM配列(5’−NGG−3’(NはA、T、G、またはCである))を除いた配列でTをUに変えた配列を下記の一般式3の標的化配列‘(Ncas9’にして製作されたものを使用した:
5’−(Ncas9−(GUUUUAGAGCUA)−(GAAA)−(UAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC)−3’(一般式3;オリゴヌクレオチドリンカー:GAAA)。
2.タンパク質精製
His6−rAPOBEC1−XTEN−dCas9タンパク質をコーディングするプラスミド(pET28b−BE1;Expresses BE1 with N−terminal His6 tag in E.Coli;図20)はDavid Liu(Addgene plasmid #73018)から提供を受けた。また、前記His6−rAPOBEC1−XTEN−dCas9タンパク質をコーディングするプラスミドpET28b−BE1で部位特異的変異導入法(site directed mutagenesis)を用いてdCas9のA840をH840で置換して、His6−rAPOBEC1−nCas9タンパク質(BE3 delta UGI;UGIドメインを欠如したBE3変異型)をコーディングするプラスミド(pET28b−BE3 delta UGI)を製作した。
Rosetta発現細胞(Novagen、catalog number:70954−3CN)を前記準備されたpET28b−BE1またはpET28b−BE3 delta UGIで形質転換させ、100μg/mlカナマイシン(kanamycin)と50mg/mlカルベニシリン(carbenicilin)を含むLuria−Bertani(LB)brothで37℃条件で一晩培養した。pET28b−BE1またはpET28b−BE3 delta UGIを含有するRosetta細胞を一晩培養した培養物10mlを100μg/mlカナマイシン(kanamycin)および50mg/mlカルベニシリン(carbenicilin)を含有する400mlのLB brothに接種し、OD600が0.5−0.6に到達するまで30℃条件で培養した。前記培養された細胞を1時間16℃に冷却させ、0.5mM IPTG(Isopropyl β−D−1−thiogalactopyranoside)を補充して、14−18時間培養した。
タンパク質精製のために、細胞を4℃で10分間5000xgで遠心分離して収穫し、リゾチーム(Sigma)およびプロテアーゼ抑制剤(Roche complete、EDTA−free)補充された溶解緩衝液(50mM NaH2PO4、300mM NaCl、1mM DTTおよび10mMイミダゾール、pH8.0)5mlで超音波処理して溶解させた。前記得られた細胞反応物を4℃で13,000rpmで30分間遠心分離して得られた溶解性細胞溶解物をNi−NTAアガロースレジン(Qiagen)と共に4℃で1時間培養した。細胞溶解物/Ni−NTA混合物をカラムに適用して緩衝液(50mM NaH2PO4、300mM NaClおよび20mMイミダゾール、pH8.0)で洗浄した。BE3タンパク質を溶出緩衝液(50mM NaH2PO4、300mM NaClおよび250mMイミダゾール、pH8.0)で溶出させた。溶出されたタンパク質を貯蔵緩衝液(20mM HEPES−KOH(pH7.5)、150mM KCl、1mM DTTおよび20%グリセロール)でバッファー交替して貯蔵し、遠心分離フィルターユニット(Millipore)を使用して濃縮させ、rAPOBEC1−XTEN−dCas9タンパク質とrAPOBEC1−nCas9を精製した。
3.PCR増幅産物の脱アミン化およびUSER処理
まず、EMX1サイトを含むPCR増幅産物(10μg)を37℃で1時間100μlの反応体積で精製されたrAPOBEC1−nCas9タンパク質(4μg)とEMX1特異性sgRNA(3μg)と共に培養した。その後、前記培養物を37℃で30分間USER(Uracil−Specific Excision Reagent)(6units)(New England Biolabs;https://www.neb.com/products/m5505−user−enzyme;ウラシルDNAグリコシラーゼ(Uracil DNA glycosylase;UDG)およびDNAグリコシラーゼ−リアーゼエンドヌクレアーゼ(DNA glycosylase−lyase Endonuclease)VIII混合物と50mM KCl、5mM NaCl、10mM Tris−HCl(pH7.4)、0.1mM EDTA、1mM DTT、175mg/ml BSAおよび50%(w/v)グリセロール含む)と共に培養した後、アガロースゲル電気泳動を行った。
4.ゲノムDNAの脱アミン化およびUSER処理
ゲノムDNAは製造者の指示によってDNeasy Blood & Tissue Kit(Qiagen)を使用してHEK293T細胞から精製(抽出)した。ゲノムDNA(10μg)を前記参考例2で精製されたrAPOBEC1−nCas9タンパク質(300nM)とsgRNA(900nM)と共に500μlの反応容量で37℃で8時間緩衝液(100mM NaCl、40mM)Hris−HCl、10mM MgCl2、および100μg/ml BSA、pH7.9)で培養した。RNase A(50μg/mL)を使用してsgRNAを除去した後、ウラシル含有ゲノムDNAをDNeasy Blood & Tissue Kit(Qiagen)で精製した。精製されたゲノムDNA(genomic DNA)(2μg)をUSER(6Unit)と共に37℃で100μlの反応容量で3時間培養した後、DNeasy Blood & Tissue Kit(Qiagen)で再び精製した。標的部位をSUN−PCRブレンドを使用してPCR増幅させ、サンガー(Sanger)配列分析を行ってBE3−媒介シトシン脱アミン化およびUSER−媒介DNA切断を確認した。
5.全体ゲノムおよびdigenomeのシークエンシング
Covarisシステム(Life Technologies)を使用して400−500bp範囲でゲノムDNA(1μg)を断片化し、End Repair Mix(Thermo Fischer)を使用して平滑末端化(blunt−ended)させた。断片化されたDNAをアダプターで連結してライブラリーを生成した後、MacrogenでHiSeq X Ten Sequencer(Illumina)を使用してWGS(whole genome sequencing)を行った。
6.標的深層シークエンシング(Targeted deep sequencing)
深層シークエンシング(deep sequencing)ライブラリー生成のために、標的と潜在的な非標的部位をKAPA HiFi HotStart PCRキット(KAPA Biosystems # KK2501)で増幅させた。プーリングされたPCR増幅物をTruSeq HT Dual Indexシステム(Illumina)が装着されたMiniSeq(Illumina)またはIllumina Miseq(LAS Inc.韓国)を使用してシークエンシングした。
実施例1.人間細胞でBE3−関連塩基編集効率とCas9−関連インデル(indel)頻度の比較
HEK293T細胞の7個のゲノム遺伝子座(EMX1、FANCF、HEK2、RNF2、HEK3、HEK4、HBB)で、三つの異なる形態のBEの単一塩基置換頻度によって定義された塩基編集(base editing)効率を求めて、Cas9ヌクレアーゼの標的部位でのインデル(indel)頻度によって定義されたゲノム編集効率と比較した(図1a、b)。図1aは、HEK293T細胞の7個の内在的標的部位(EMX1、FANCF、HEK2、RNF2、HEK3、HEK4、HBB)でBE1(APOBEC1−dCas9)、BE2(APOBEC−dCas9−UGI)およびBE3(APOBEC−nCas9−UGI)(参考例1参照)で得られた塩基編集効率を示す。塩基編集効率は、標的深層シークエンシング(targeted deep sequencing)で測定した(参考例6参照)。BE3[APOBEC−nCas9−UGI(uracil DNA glycosylase inhibitor)、29±6%]がBE1(APOBEC1−dCas9、5±1%)とBE2(APOBEC−dCas9−UGI、8±2%)より優れた効率を示した。図1bは、HEK293T細胞内の7個の内在的標的部位で標的深層シークエンシングによって測定されたCas9ヌクレアーゼ−誘導突然変異頻度を示す(参考例1のCas9発現プラスミド(Addgene plasmid #43945;図19)を使用して得られた結果である)。このような結果は、BE3活性がCas9ヌクレアーゼ活性と独立的であるのを確認させてくれるものである。
図1cは、7個の内在的標的地点(on target site;表2−8参照)でインデル(indel)頻度または塩基編集効率の順位を代表的に示すグラフである。図1cで示されているように、活性順位分析の結果、特定sgRNAはCas9と共に作用する時は活性が低いが、BE3と共に作用する時は高い活性を示す一方、その反対の相関性を示すsgRNAも存在した。
実施例2.mismatched sgRNAsに対するBE3とCas9の寛容(tolerance)
BE3デアミナーゼの特異性を評価するために、BE3がsmall guide RNA(sgRNAs)でのミスマッチ(mismatch)を寛容可能か否かを細胞内で調査した。このために、1〜4個のミスマッチを有するsgRNAおよび、BE3またはCas9をコードするプラスミド(参考例1参照)をHEK293T細胞に共同形質感染させ、3個の内在的部位(endogenous sites;EMX1、HBB、RNF2)での突然変異頻度を測定した。
使用された1〜4個のミスマッチを有するsgRNAの標的部位(PAM配列(太字)含む)を下記の表1に整理した:
前記表1のミスマッチ配列および標的配列から得られた結果(インデル(indel)頻度とシトシン転換頻度)を図2a〜2cに示した(2a:EMX1、2b:HBBおよび2c:RNF2;Error bars indicate s.e.m.(n=3))。図2a〜2cで‘Cn’で表されたものはミスマッチ配列または標的配列で5’末端からn番目に位置するシトシン(C)の変異(他の塩基で置換または欠失)比率を示す。インデル(indel)頻度とシトシン転換頻度(base editing frequency)は標的深層シークエンシング(参考例6)を使用して測定した。前記標的深層シークエンシングに使用されたプライマーは下記の通りである:
EMX1
1st PCR
Forward(5'→3'):
AGTGTTGAGGCCCCAGTG (配列番号94);
Reverse(5'→3'):
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCAGCAGCAAGCAGCACTCT (配列番号95);
2nd PCR
Forward(5'→3'):
ACACTCTTTCCCTACACGACGCTCTTCCGATCTGGGCCTCCTGAGTTTCTCAT (配列番号96);
Reverse(5'→3')
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCAGCAGCAAGCAGCACTCT (配列番号97);
HBB
1st PCR
Forward(5'→3'):
GGCAGAGAGAGTCAGTGCCTA (配列番号98);
Reverse(5'→3'):
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCAGGGCTGGGCATAAAAGT (配列番号99);
2nd PCR
Forward(5'→3'):
ACACTCTTTCCCTACACGACGCTCTTCCGATCTGTCTCCACATGCCCAGTTTC (配列番号100);
Reverse(5'→3')
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCAGGGCTGGGCATAAAAGT (配列番号101);
RNF2
1st PCR
Forward(5'→3'):
CCATAGCACTTCCCTTCCAA (配列番号102);
Reverse(5'→3'):
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGCCAACATACAGAAGTCAGGAA (配列番号103);
2nd PCR
Forward(5'→3'):
ACACTCTTTCCCTACACGACGCTCTTCCGATCTATTTCCAGCAATGTCTCAGG (配列番号104);
Reverse(5'→3')
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGCCAACATACAGAAGTCAGGAA (配列番号105).
また、EMX1(図3a)部位、HBB部位(図3b)、およびRNF2部位(図3c)でのCas9ヌクレアーゼに関連するインデル(indel)頻度とBE3に関連する塩基編集頻度をミスマッチsgRNAs(mismatched sgRNAs)(表1参照)を使用して測定し、その結果を図3a〜3cに示した。図3a〜3cで示されるように、全般的に、Cas9誘導インデル(indel)頻度とBE3誘導置換頻度の間に統計的に有意味な相関関係(3個の部位でそれぞれR=0.70、0.83、および0.72)がある。
BE3デアミナーゼとCas9ヌクレアーゼはほとんど全ての位置での1個のヌクレオチド(1−nt)のミスマッチおよびPAM−遠位領域(protospacer−adjacent motif(PAM)−distal region)での2個のヌクレオチド(2−nt)ミスマッチに対しては寛容を示したが、PAM−近位領域またはPAM−遠位領域での3−ntまたは4−ntミスマッチに対しては寛容を示さない。しかし、2個または3個のミスマッチを有する一部sgRNA(図2a−2cで星印で表示)はBE3と共に使用する場合、高い活性を示す反面、Cas9と共に使用する場合には活性が優れなく、その反対も同様であった。例えば、EMX1部位で、完全に一致(マッチ)するsgRNAまたは3−ntミスマッチsgRNAをBE3と共に使用する場合、比較可能な程度の頻度差(33%vs.14%)で置換を誘導する反面、同一な完全一致または3−ntミスマッチsgRNAをCas9と共に使用する場合には広範囲に異なるインデル(indel)頻度を示した(50%vs.2%)(図2a)。反対に、2個の2−ntミスマッチを有するsgRNAをBE3と共に使用する場合に活性が低い反面(置換頻度<1%)、同一なミスマッチを有するsgRNAをCas9と共に使用する場合には活性が高かった(インデル(indel)頻度>10%)(図2a)。このような結果はミスマッチを有するsgRNAに対するCas9ヌクレアーゼとBE3デアミナーゼの耐性が異なり、BE3とCas9がゲノム内で分離されたセットの非標的部位を有することができるのを暗示する。したがって、RNA−プログラム可能な(programmable)デアミナーゼのゲノム−全体特異性をプロファイリングする方法が必要である。
実施例3.人間ゲノムでBE3非標的sitesを確認するためのDigenome−seq
ゲノム全体にかけてCas9ヌクレアーゼがDSBを誘導する非標的位置を確認するための方法として、GUIDE−seq(Tsai、S.Q.et al.GUIDE−seq enables genome−wide profiling of off−target cleavage by CRISPR−Cas nucleases. Nature biotechnology 33、187−197(2015))、HTGTS(Frock、R.L.et al.Genome−wide detection of DNA double−stranded breaks induced by engineered nucleases.Nature biotechnology(2014))、BLESS(Ran、F.A.et al.In vivo genome editing using Staphylococcus aureus Cas9.Nature 520、186−191(2015))、およびIDLV capture(Wang、X.et al.Unbiased detection of off−target cleavage by CRISPR−Cas9 and TALENs using integrase−defective lentiviral vectors.Nature biotechnology 33、175−178(2015))などのようないくつかの異なる細胞基盤方法が開発された。デアミナーゼがDSBを生成しないため、少なくとも現在の形態では、前記方法の中のいずれもプログラム可能な(programmable)デアミナーゼのゲノム全体特異性(genome−wide specificities)を評価するのに適しない。適切な酵素を使用して試験管内(in vitro)で脱アミン化された、ウラシル含有位置(deaminated、uracil−containing sites)でDSBを生成することができ、この時発生したDNA切断位置はCas9とCpf1ヌクレアーゼのゲノム全体特異性を評価するのに使用される試験管内方法であるDigenome−seq(digested−genome sequencing;参照文献:Kim、D.、Kim、S.、Kim、S.、Park、J.& Kim、J.S.Genome−wide target specificities of CRISPR−Cas9 nucleases revealed by multiplex Digenome−seq.Genome research 26、406−415(2016);Kim、D.et al.Genome−wide analysis reveals specificities of Cpf1 endonucleases in human cells.Nature biotechnology 34、863−868(2016);Kim、D.et al.Digenome−seq:genome−wide profiling of CRISPR−Cas9 off−target effects in human cells.Nature methods12、237−243、231p following 243(2015))を通じて確認できると予測される。
このような予測を確認するために、標的配列を含むPCR増幅産物(amplicon)を、試験管内で、(1)UGIドメインがないBE3の誘導体である組換えrAPOBEC1−nCas9タンパク質(参考例2)とそのsgRNAと共に培養して、CからUへの転換(C−to−U conversions)およびWatson and Crick strandsでの切断(nick)をそれぞれ誘導した後、(2)E.coliウラシルDNAグリコシラーゼ(UracilDNAglycosylase;UDG)とDNAグリコシラーゼ−リアーゼエンドヌクレアーゼ(DNA glycosylase−lyase Endonuclease)VIIIの混合物であるUSER(Uracil−Specific Excision Reagent)と共に培養してウラシル位置でのスキ間(gap)を生成してcomposite DSBを発生させた(図4a参照)。その次に、Digenome−seqを使用してBE3デアミナーゼのゲノム全体標的特異性を評価することができるか否かを調査した。HEK293T細胞から精製された人間ゲノムDNAを7時間それぞれ3回のBE3リボヌクレオチド(RNP)(300nM rAPOBEC1−nCas9タンパク質(参考例2)および900nM sgRNA)と共に培養した後、3時間使用者と共に培養した(図4a参照)。
図4aは、このようなBE3Digenome−seqの概要を示す。E.coliウラシルDNAグリコシラーゼ(Uracil DNA glycosylase;UDG)とDNAグリコシラーゼ−リアーゼエンドヌクレアーゼ(DNA glycosylase−lyase Endonuclease)VIIIの混合物であるUSERによってBE3−媒介ウラシル含有部位が切断されるのを確認することができる。図4bは、BE3および/またはUSERを処理した場合、切断されたPCR産物を示す電気泳動写真である。図4bに示されているように、PCR増幅産物はBE3とUSERと共に培養する時に切断されるのを確認することができる。
BE3によって誘導されたC対U転換およびUSERによるウラシル除去はサンガー(Sanger)シークエンシングによって確認した(図4c参照)。図4cはB3によるC対U転換およびUSERによるDNA切断結果を示すサンガー(Sanger)シークエンシング結果である。各ゲノムDNAサンプルを末端修復(end repair)およびアダプターライゲーション(adaptor ligation)した後、全体ゲノムシークエンシング(WGS)を行った(図4a参照)。
人間参照ゲノム(human reference genome;hg19)に対する配列整列(sequence alignment)後、統合ゲノムビューアー(Integrative Genomics Viewer;IGV)を使用して標的位置での整列パターンをモニターしてその結果を図4dおよび図5に示した。図4dはEMX1の標的サイトでの配列リード(sequence read)の直線整列を示すIGVイメージであり、図5は6個の他の標的サイトでの配列リード(sequence read)の直線整列を示すIGVイメージである。図4dおよび図5に示されているように、試験管内で生成されたDSBに関連するシグネチャーパターンが7個の標的位置の全てで観察された。
実施例4.Digenome−seqによって明らかになったゲノム全体のBE3非標的サイト
人間ゲノムでBE3非標的位置を確認するために、5’末端が定められた位置に整列された配列リードの個数(number of sequence reads)を基盤にしてDNA切断点数をゲノムの各nt位置に割り当て、発明者らの以前の研究(Kim、D.、Kim、S.、Kim、S.、Park、J.& Kim、J.S.Genome−wide target specificities of CRISPR−Cas9 nucleases revealed by multiplex Digenome−seq.Genome research 26、406−415(2016))で同一な7sgRNAセットと共に使用されるCas9ヌクレアーゼの非標的位置を確認するために使用されたカットオフ値である2.5以上の点数を有する位置を全て羅列した(図6a−dおよび表2−8).
各ヌクレオチドの位置i(即ち、ゲノムDNA上のヌクレオチド位置)にDNA切断点数を下記の数式で算出した:
前記数式で、塩基配列データの数はヌクレオチドリード数を意味し、シークエンシング深さは特定位置でのシークエンシングリード数を意味し、C値は1にした。
Digenome−捕獲されたサイト( Digenome−captured sites)(切断部位(cleavage site)+PAM)およびDNA切断スコア(DNA cleavage score)を下記の表2〜8に示した:
図6aおよび6bは損傷していないゲノムDNA(灰色;中央部から一番目層)とBE3およびUSER(青色;中央部から2番目層)またはCas9(赤色;中央部から3番目層;図6bのみにある)に分解されたゲノムDNAで得られたDNA切断点数を示すGenome−wide circus plotであって、矢印は標的サイトを示す。図6cおよび6dはDigenome−捕獲されたサイト(Digenome−capture sites)(表2−8)でDNA配列を使用してWebLogoを通じて得られた配列ロゴ(DNA分解点数>2.5)を示し、図6eおよび6fは標的深部シークエンシングを用いて決定されたCas9媒介インデル(indel)頻度とBE3媒介置換頻度の散布図(Scatter plot)を示すものであって、円で表された点はBE3によって確認されたがCas9によって有効な効果がない非標的サイトを示す。図6gおよび6hは標的深部シークエンシングによってHEK293T細胞で確認されたBE3非標的サイトを示すものであって、PAM配列は3’末端の最後の3個のヌクレオチドであり、ミスマッチ塩基(mismatched base)は小文字で表わし、ダッシュ(−)はRNA bulgesを示す(Error bars indicates.e.m.(n=3))。
前記深部シークエンシングに使用されたプライマ−を下記の表9〜表15に整理した:
図7はCas9ヌクレアーゼ−および塩基エディター(base editor)−処理ゲノムDNAのDigenome−seqによって確認されたDNA切断点数が2.5以上である部位の数を示すベンダイヤグラムである。
前記結果から分かるように、7個の標的遺伝子に対してBE3デアミナーゼとUSERを共に使用する場合、試験管内で、ただ1−24(8±3)位置で人間ゲノムDNAを切断し、これは多重Digenome−seq分析(Kim、D.、Kim、S.、Kim、S.、Park、J.& Kim、J.S.Genome−wide target specificities of CRISPR−Cas9 nucleases revealed by multiplex Digenome−seq.Genome research 26、406−415(2016))で同一なsgRNAセットと共に使用されるCas9ヌクレアーゼの切断位置(70±30位置)よりはるかに少ない水準である(図7)。即ち、BE3はCas9より非標的サイトを切断する潜在性が低いと言える。Digenomeで確認された位置を比較して得られた配列ロゴ(Sequence logos)はPAM−遠位領域とPAM−近位領域の全てBE3デアミナーゼの特異性に寄与すると確認された(図6c、d)。
潜在的な非標的位置をより包括的に識別するためにコンピュータプログラムを改善した(Digenome 2.0という)。これをより詳しく説明すれば次の通りである:DNA切断点数が0.0001から10の間のカットオフ値以上である位置の個数と、前記カットオフ値以上の点数を有する位置の中で、標的位置と比較した、10以下のミスマッチを有しPAM(5’−NGN−3’または5’−NNG−3’)を有している候補群の個数を計算した(図8).図8はDNA切断点数の範囲に対する総サイト数(■)と10個以下のミスマッチ(□)があるPAM含有サイト数を示すグラフである。これは損傷していない人間ゲノムDNA(左側)とBE3およびUSER(右側)によって分解されたゲノムDNAに対して全体ゲノムシークエンシング(whole genome sequencing)を行って得られた結果である。図8に示されているように、BE3とUSERで処理されなくて損傷していないゲノムDNAを陰性対照群として使用して得られたWGSデータがカットオフ点数が0.1である場合、 偽陽性サイト(false−positive sites)を生成しなかったので、カットオフ点数0.1を選択した(図8)。このような結果に基づいて、Digenome2.0による非標的位置決定ではDNA切断点数(DNA cleavage score)が0.1以上であり10以下のミスマッチを有しPAM(5’−NGN−3’または5’−NNG−3’)を有しているサイト(site)を非標的位置と決定する。一方、Digenome1.0による非標的位置決定ではDNA切断点数(DNA cleavage score)が2.5以上であるサイト(site)を非標的位置候補群と決定する。
Digenome2.0を使用し、以前の研究(Kim、D.、Kim、S.、Kim、S.、Park、J.& Kim、J.S.Genome−wide target specificities of CRISPR−Cas9 nucleases revealed by multiplex Digenome−seq.Genome Res(2016))では逃がしたが、EMX1に特異的なCas9を使用してHTGTSおよびGUIDE−seqによってキャプチャーされた二つのサイトを含んで、追加的なBE3−およびCas9−関連DNA切断位置を確認することができる。図9は、Cas9ヌクレアーゼ−および塩基エディター(Base editor)−処理ゲノムDNAのDigenome−seqによって確認された0.1以上のDNA切断点数を有するPAM−含み相同性部位の数を示すベンダイヤグラムである。BE3デアミナーゼは試験管内(in vitro)で1−67(18±9)位置で塩基転換を誘導する反面、Cas9ヌクレアーゼは30−241(90±30)位置でゲノムDNAを切断した。
実施例5.Digenome−seqによって捕獲された相同性部位(homologous sites)の比率
図7および図9に示されたBE3−関連位置およびCas9−関連位置をより詳しく調査した。図10はDigenome−seqによって捕獲された相同性部位の比率を示すものであって、棒は標的(標的)部位と6ntまで異なる相同性部位の数を示し、四角形(BE3)と三角形(Cas9)はミスマッチ数の範囲に対してDigenome−seq捕獲サイトの比率を示す。図10に示されているように、ミスマッチ(mismatch)の個数と関係なく、Cas9を使用する場合と比較して、BE3を使用する場合にDigenome−seqによって確認される相同性部位(homologous sites)がさらに少なかった。
図11aおよび11bは、Digenome1.0(11a)およびDigenome2.0(11b)によって確認されたBE3−とCas9−関連サイトの数の間の相関関係を示すグラフである。図11aおよび11bに示されているように、Cas9−関連位置とBE3−関連位置の個数の間に統計的に有意な相関関係が確認された(R=0.97(Score>2.5、Digenome1.0)または0.86(Digenome2.0))。このような結果はsgRNAがCas9特異性とBE3特異性の全ての1次的決定因子(primary determinants)であるのを提案する。
また、図12aおよび12bは、Digenome1.0(a)またはDigenome2.0(b)によって確認されたBE3関連サイトの数と6個以下のミスマッチがあるサイトの数の間の相関関係を示す。図12aおよび12bに示されているように、BE3関連Digenome捕獲部位の数と人間ゲノムで6以下のミスマッチを有する相同性部位(homologous sites)(“orthogonality”)の数の間に強い相関関係[R2=0.94(Digenome1.0)または0.95(Digenome2.0)]があるのを確認した。特に興味深いことはBE3単独またはCas9単独と関連があるということである。興味深く、DNA−gRNA境界面でそれぞれRNAまたはDNA bulgeを生産するそれぞれの標的サイトと比較した時、BE3単独に関連するサイトの69%(=18/26)が一部が欠失されるか延長されたヌクレオチド(missing or extra nucleotides)を有している(表1)。対照的に、このようなbulge−type非標的サイトはCas9関連部位では珍しい場合である。Cas9に関連したサイトの4%(=25/647)のみ一部欠失されるか延長されたヌクレオチドを有することが確認された。
図13は、positions 4−9にシトシンがないCas9のみに関連するDigenome−捕獲された非標的サイトの例を示す。Cas9単独に関連するサイトの13%(=73/548)はBE3媒介脱アミン化(deamination)の窓(window)(図13)である、positions4−8(5’から3’方向に1−20と番号が付けられる)の位置にシトシンを有さない。
Digenome−seqによって確認されたBE3−関連サイトで非標的効果を確認するために、HEK293T細胞で標的深部シークエンシング(targeted deep sequencing)を行いBE3誘導置換頻度とCas9誘導インデル(indel)頻度を測定して、前述の図6e〜6hおよび下記の表16に示した。
7個のsgRNAを使用して確認された総75個のサイトを分析し、7個の標的サイトの全てを含んで、シークエンシングエラー(一般に0.1〜2%の範囲内)によるノイズ水準を超過する頻度を有する50個サイトでBE3誘導点突然変異を観察した(有効性検査比率は67%)。BE3は暗騒音(background noise)水準より低い頻度を有する他のBE3−関連Digenome−陽性部位で依然として突然変異を誘導することができる。重要な点は、塩基編集(base editing)が0.1%の頻度で検出されるBE3非標的サイトを確認することができ、これはDigenome−seqは非常に敏感な方法であるというのを示す。Cas9ヌクレアーゼはCas9とBE3の全てに関連したサイトの70%(=44/63)でインデル(indels)を検出可能な程度に誘導するが、BE3単独に関連する12個のそれぞれのサイトではこのような活性を示さなかった(表2−8)。
図14a〜14cは、3個の他のCas9ヌクレアーゼに関連するDigenome−捕獲された(Digenome−captured)サイトの塩基編集効率を示す。図14a〜14cに示されているように、BE3は3個の相異なるCas9ヌクレアーゼ単独に関連する24個のDigenome−陽性部位で検出可能な置換を引き起こさなかった。また、図15a〜15cは、Digenome−陰性サイトで3個の互いに異なるBE3デアミナーゼの塩基編集効率を示す。図15a〜15cに示されているように、前記3個のBE3デアミナーゼはCas−OFFinder(Bae、S.、Park、J.& Kim、J.S.Cas−OFFinder:A fast and versatile algorithm that searches for potential 非標的 sites of Cas9 RNA−guided endonucleases。Bioinformatics(2014))を使用して識別された≦3個のミスマッチを有する28個のDigenome陰性サイトで塩基編集(base editing)を誘導しなかった(図15a−15c)。BE3誘導置換の頻度はCas9媒介インデル(indels)頻度と高い相関性を示した[R=0.92(EMX1)または0.89(HBB)](図6e、f)。それにもかかわらず、BE3によって検証されるが、Cas9によっては検証されない非標的サイトが複数存在する。このような有効性が確認されたBE3独占オフターゲットサイト(BE3−exclusive off−target site)の中の64%(=7/11)はこれらそれぞれの標的サイトと比較して一部欠失されたヌクレオチドを有する。このような結果は、Cas9とBE3の非標的サイトが多くの部位で互いに重畳するが、Cas9単独またはBE3単独とは互いに排他的に関連する非標的サイトがあるということを示す(図10)。
実施例6.改変sgRNAを通じたBE3非標的効果の減少
BE3非標的効果を減らすために、既存のsgRNA(gX19またはGX19;gおよびGはそれぞれミスマッチ(mismatched)およびマッチ(matched)グアニンを意味する)を切断された(truncated)sgRNAs(gX18またはgX17で終結する)または5’末端に一つまたは2個のグアニンを追加的に含む延長(extended)sgRNA(gX20またはggX20と称する)で代替し、HEK293T細胞での標的および非標的塩基編集(base−editing)頻度を測定してその結果を図16〜図17および表17に示した。
図16aは、既存のsgRNA(gX19 sgRNA)、切断された(truncated)sgRNA(gX18またはgX17 sgRNA)および延長(extended)sgRNA(gX20またはggX20 sgRNA)を図式的に示す。図16bは、HEK293T細胞のHBB標的サイトおよび非標的サイトの塩基編集頻度を標的深層シークエンシングで測定した結果を示す。特異性比率(specificity ratio)は、標的(on−target)位置での塩基編集頻度を非標的(off−target)位置での塩基編集頻度で割って計算した。ヒートマップ(heatmap)は既存のsgRNAと比較して改変されたsgRNAの相対的特異性を示す。
図17は改変されたsgRNAを使用してBE3非標的効果を減少させることができるのを示すものであって、17aは既存のsgRNA(GX19 sgRNA)と改変されたsgRNA(GX17 sgRNA、gX18 sgRNA、gX20 sgRNAおよびggX20 sgRNA)を概略的に示し、図17bはHEK293T細胞で標的深層シークエンシングによってEMX1標的サイトおよび非標的サイトで測定された塩基編集効率(頻度)を示す結果である。
図16a、16b、17a、および17bに示されているように、切断された(Truncated)sgRNAsは多くの位置で非標的効果を減少させたが、5’末端にミスマッチを有するサイトでは非標的効果が悪化された(図16bおよび図17bで星印で表される)。延長sgRNAは標的効果は維持しながらほとんど全てのサイトで非標的効果を減少させた。興味深く、延長されたsgRNAのうちの一部は既存のsgRNAより標的部位でより高い活性を示した(表17)。減衰された(attenuated)Cas9変異体の使用、またはプラスミドよりはBE3 RNPを伝達することによって塩基編集(base editing)のゲノム−全体特異性をより向上させることができる。
要約すれば、ミスマッチsgRNAs、Digenome−seqおよび標的深層シークエンシングを使用して得られた結果は、BE3デアミナーゼが高度に特異的に試験管内(in vitro)でのC−U転換および人間細胞で人間ゲノムの制限された個数の位置での塩基編集(base editing)を触媒することが確認された。また、BE3およびCas9の非標的サイトがいつも一致するのではなく、したがって各遺伝子編集ツールに対して独立的な評価が行なわれなければならないのを確認した。私たちは私たちの結果と方法が研究および医学でRNA誘導プログラム可能なデアミナーゼの広範囲な使用を促進することと期待する。
実施例7.BE1(rAPOBEC1−dCas9)−媒介二重鎖切断(DSBs)
標的配列(ENX1標的(on−target)配列;配列番号31)を含有するPCRアンプリコン(PCR amplicon)を試験管内(in vitro)でBE1(rAPOBEC1−dCas9;実施例2)とsgRNA(配列番号31を標的化するsgRNA)と共に培養して標的配列内のシトシンをウラシルに変換させた。rAPOBEC1によって変換されたウラシル(Uracil)はUSER(Uracil−Specific Excision Reagent)Enzyme(New England Biolabs)を処理して除去した。その後、S1ヌクレアーゼ(Catalog #M5761;Promega)を処理して単一鎖DNA部位のホスホジエステル(phosphodiester)結合を切断してシトシンが除去された部位でDSBを生成した(図22のa)。
前記反応が完了したPCRアンプリコン(PCR amplicon)を電気泳動した結果、BE1/sgRNA、USERおよびS1ヌクレアーゼ処理によって切断生成されたのが確認された(図22のb)。
以上の説明から、本発明の属する技術分野の当業者は本発明がその技術的な思想や必須的特徴を変更せずに他の具体的な形態で実施できるということを理解することができるはずである。これに関連して、以上で述べた実施例は全ての面で例示的なものであり、限定的なものではないと理解しなければならない。本発明の範囲は前記詳細な説明よりは後述する特許請求範囲の意味および範囲、そしてその等価概念から導出される全ての変更または改変された形態が本発明の範囲に含まれると解釈されなければならない。

Claims (23)

  1. (1)シトシンデアミナーゼおよび不活性化された標的特異的エンドヌクレアーゼ、またはシトシンデアミナーゼコード遺伝子および不活性化された標的特異的エンドヌクレアーゼコード遺伝子、またはシトシンデアミナーゼコード遺伝子および不活性化された標的特異的エンドヌクレアーゼコード遺伝子を含むプラスミド、(2)ガイドRNA、および(3)ウラシル−特異的除去試薬(USER)を含む、シトシンデアミナーゼを使用するDNA二重鎖切断(DSB)用組成物であって、
    前記不活性化された標的特異的エンドヌクレアーゼは、エンドヌクレアーゼ活性を喪失した不活性化された標的特異的エンドヌクレアーゼであり、
    前記ウラシル−特異的除去試薬は、ウラシルDNAグリコシラーゼ、エンドヌクレアーゼVIII、またはこれらの組み合わせを含むものである、前記組成物。
  2. 前記不活性化された標的特異的エンドヌクレアーゼは、DNA二重鎖を切断するエンドヌクレアーゼ活性を喪失したCas9タンパク質またはCpf1タンパク質である、請求項1に記載の組成物。
  3. 前記不活性化された標的特異的エンドヌクレアーゼは、ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)由来のCas9タンパク質にアミノ酸残基D10が他のアミノ酸で置換された突然変異が導入されたものである、請求項2に記載の組成物。
  4. シトシンデアミナーゼおよび不活性化された標的特異的エンドヌクレアーゼは融合タンパク質形態であるか、または
    前記シトシンデアミナーゼコード遺伝子および不活性化された標的特異的エンドヌクレアーゼコード遺伝子は、シトシンデアミナーゼおよび不活性化された標的特異的エンドヌクレアーゼを含む融合タンパク質をコードする遺伝子である、請求項1に記載の組成物。
  5. 前記不活性化された標的特異的エンドヌクレアーゼは、ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)由来のCas9タンパク質にアミノ酸残基D10が他のアミノ酸で置換された突然変異とアミノ酸残基H840が他のアミノ酸で置換された突然変異が全て導入されたものであり、
    前記組成物は、DNAの単一鎖領域を特異的に切断するエンドヌクレアーゼを追加的に含むものである、請求項1に記載の組成物。
  6. 前記ガイドRNAは、crRNAとtracrRNAが互いに結合された二重鎖crRNA:tracrRNA複合体、または単一鎖ガイドRNA(sgRNA)である、請求項1〜5のいずれか一項に記載の組成物。
  7. (i)(a)シトシンデアミナーゼおよび不活性化された標的特異的エンドヌクレアーゼ、または(b)シトシンデアミナーゼコード遺伝子および不活性化された標的特異的エンドヌクレアーゼコード遺伝子、または(c)シトシンデアミナーゼコード遺伝子および不活性化された標的特異的エンドヌクレアーゼコード遺伝子を含むプラスミド、をガイドRNAと共に細胞に導入するか、または細胞から分離されたDNAに接触させる段階;および
    (ii)ウラシル−特異的除去試薬(Uracil−Specific Excision Reagent;USER)で処理する段階
    を含む、シトシンデアミナーゼを使用してDNAに二重鎖切断(double strand break)を生成する方法。
  8. (i)(a)シトシンデアミナーゼおよび不活性化された標的特異的エンドヌクレアーゼ、または(b)シトシンデアミナーゼコード遺伝子および不活性化された標的特異的エンドヌクレアーゼコード遺伝子、または(c)シトシンデアミナーゼコード遺伝子および不活性化された標的特異的エンドヌクレアーゼコード遺伝子を含むプラスミド、をガイドRNAと共に細胞に導入するか、または細胞から分離されたDNAに接触させる段階;
    (ii)ウラシル−特異的除去試薬(Uracil−Specific Excision Reagent;USER)で処理してDNAに二重鎖切断を生成する段階;および
    (iii)前記切断されたDNA断片の核酸配列を分析する段階
    を含む、シトシンデアミナーゼによって塩基編集(base editing)が導入されたDNAの核酸配列分析方法。
  9. (i)(a)シトシンデアミナーゼおよび不活性化された標的特異的エンドヌクレアーゼ、または(b)シトシンデアミナーゼコード遺伝子および不活性化された標的特異的エンドヌクレアーゼコード遺伝子、または(c)シトシンデアミナーゼコード遺伝子および不活性化された標的特異的エンドヌクレアーゼコード遺伝子を含むプラスミド、をガイドRNAと共に細胞に導入するか、または細胞から分離されたDNAに接触させる段階;
    (ii)ウラシル−特異的除去試薬(Uracil−Specific Excision Reagent;USER)で処理してDNAに二重鎖切断を生成する段階;
    (iii)前記切断されたDNA断片の核酸配列を分析する段階;および
    (iv)前記分析によって得られた核酸配列データで前記二重鎖切断部位を確認する段階
    を含む、シトシンデアミナーゼの塩基編集部位確認方法。
  10. (i)(a)シトシンデアミナーゼおよび不活性化された標的特異的エンドヌクレアーゼ、または(b)シトシンデアミナーゼコード遺伝子および不活性化された標的特異的エンドヌクレアーゼコード遺伝子、または(c)シトシンデアミナーゼコード遺伝子および不活性化された標的特異的エンドヌクレアーゼコード遺伝子を含むプラスミド、をガイドRNAと共に細胞に導入するか、または細胞から分離されたDNAに接触させる段階;
    (ii)ウラシル−特異的除去試薬(Uracil−Specific Excision Reagent;USER)で処理してDNAに二重鎖切断を生成する段階;
    (iii)前記切断されたDNA断片の核酸配列を分析する段階;および
    (iv)前記分析によって得られた核酸配列データで前記二重鎖切断部位を確認する段階
    を含む、シトシンデアミナーゼの非標的位置(off−target site)確認方法。
  11. 前記不活性化された標的特異的エンドヌクレアーゼは、DNA二重鎖を切断するエンドヌクレアーゼ活性を喪失したCas9タンパク質またはCpf1タンパク質である、請求項7〜10のいずれか一項に記載の方法。
  12. 前記不活性化された標的特異的エンドヌクレアーゼは、ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)由来のCas9タンパク質にアミノ酸残基D10が他のアミノ酸で置換された突然変異が導入されたものである、請求項7〜10のいずれか一項に記載の方法。
  13. シトシンデアミナーゼおよび不活性化された標的特異的エンドヌクレアーゼは、融合タンパク質形態であるか、または
    前記シトシンデアミナーゼコード遺伝子および不活性化された標的特異的エンドヌクレアーゼコード遺伝子は、シトシンデアミナーゼおよび不活性化された標的特異的エンドヌクレアーゼを含む融合タンパク質をコードする、請求項7〜10のいずれか一項に記載の方法。
  14. 前記不活性化された標的特異的エンドヌクレアーゼは、ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)由来のCas9タンパク質にアミノ酸残基D10が他のアミノ酸で置換された突然変異とアミノ酸残基H840が他のアミノ酸で置換された突然変異が全て導入されたものであり、
    前記段階(ii)以後に、DNAの単一鎖領域を特異的に切断するエンドヌクレアーゼで処理する段階を追加的に含む、請求項7〜10のいずれか一項に記載の方法。
  15. 前記ガイドRNAは、crRNAとtracrRNAが互いに結合された二重鎖crRNA:tracrRNA複合体、または単一鎖ガイドRNA(sgRNA)である、請求項7〜10のいずれか一項に記載の方法。
  16. 試験管内(in vitro)で行われるものである、請求項7〜10のいずれか一項に記載の方法。
  17. 前記段階(i)の細胞から分離されたDNAは、ゲノムDNAである、請求項7〜10のいずれか一項に記載の方法。
  18. 段階(i)の細胞から分離されたDNAは、ゲノムDNAであり、
    段階(iii)の核酸配列分析は、全体ゲノムシークエンシングによって行われるものである、請求項8〜10のいずれか一項に記載の方法。
  19. 前記段階(iv)以後に、
    前記切断位置が標的部位(on−target site)でない場合、非標的部位(off−target site)と判断する段階を追加的に含む、請求項10に記載の方法。
  20. 前記段階(iv)で確認された切断部位は、得られた塩基配列データを整列して5’末端がまっすぐに整列された位置、または5’末端プロットで二重ピークパターンを示す位置である、請求項10に記載の方法。
  21. 前記整列は、標準ゲノム(reference genome)で配列データをマッピングした後、BWA/GATKまたはISAACを用いて行われる、請求項20に記載の方法。
  22. ワトソン鎖(Watson strand)とクリック鎖(Crick strand)に該当する配列データ(sequence read)がそれぞれ二つ以上ずつまっすぐに整列される部位を非標的部位であると判断する段階を追加的に含む、請求項20に記載の方法。
  23. 20%以上の配列データがまっすぐに整列され、それぞれのワトソン鎖およびクリック鎖で同一な5’末端を有する配列データの数が10以上である部位が非標的部位であると判断する段階を追加的に含む、請求項20に記載の方法。
JP2019514036A 2016-09-13 2017-09-13 シトシンデアミナーゼによるdnaでの塩基編集確認方法 Pending JP2019526271A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201662393682P 2016-09-13 2016-09-13
US62/393,682 2016-09-13
US201762445310P 2017-01-12 2017-01-12
US62/445,310 2017-01-12
PCT/KR2017/010056 WO2018052247A1 (ko) 2016-09-13 2017-09-13 시토신 디아미나제에 의한 dna에서의 염기 교정 확인 방법

Publications (1)

Publication Number Publication Date
JP2019526271A true JP2019526271A (ja) 2019-09-19

Family

ID=61620065

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019514036A Pending JP2019526271A (ja) 2016-09-13 2017-09-13 シトシンデアミナーゼによるdnaでの塩基編集確認方法

Country Status (5)

Country Link
US (1) US11920151B2 (ja)
EP (1) EP3530737A4 (ja)
JP (1) JP2019526271A (ja)
KR (1) KR102026421B1 (ja)
WO (1) WO2018052247A1 (ja)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2963820A1 (en) 2014-11-07 2016-05-12 Editas Medicine, Inc. Methods for improving crispr/cas-mediated genome-editing
EP3294896A1 (en) 2015-05-11 2018-03-21 Editas Medicine, Inc. Optimized crispr/cas9 systems and methods for gene editing in stem cells
WO2016201047A1 (en) 2015-06-09 2016-12-15 Editas Medicine, Inc. Crispr/cas-related methods and compositions for improving transplantation
CA3000816A1 (en) 2015-09-11 2017-03-16 The General Hospital Corporation Full interrogation of nuclease dsbs and sequencing (find-seq)
WO2017053879A1 (en) 2015-09-24 2017-03-30 Editas Medicine, Inc. Use of exonucleases to improve crispr/cas-mediated genome editing
EP3433363A1 (en) 2016-03-25 2019-01-30 Editas Medicine, Inc. Genome editing systems comprising repair-modulating enzyme molecules and methods of their use
EP3443086B1 (en) 2016-04-13 2021-11-24 Editas Medicine, Inc. Cas9 fusion molecules, gene editing systems, and methods of use thereof
KR102084186B1 (ko) * 2017-01-17 2020-03-03 기초과학연구원 Dna 단일가닥 절단에 의한 염기 교정 비표적 위치 확인 방법
EP3615672A1 (en) 2017-04-28 2020-03-04 Editas Medicine, Inc. Methods and systems for analyzing guide rna molecules
MX2019014640A (es) 2017-06-09 2020-10-05 Editas Medicine Inc Nucleasas de repeticiones palíndromicas agrupadas y regularmente interespaciadas de proteina asociada 9 (cas9) genomanipuladas.
WO2019014564A1 (en) 2017-07-14 2019-01-17 Editas Medicine, Inc. SYSTEMS AND METHODS OF TARGETED INTEGRATION AND GENOME EDITING AND DETECTION THEREOF WITH INTEGRATED PRIMING SITES
JP2020532967A (ja) 2017-08-23 2020-11-19 ザ ジェネラル ホスピタル コーポレイション 変更されたPAM特異性を有する遺伝子操作されたCRISPR−Cas9ヌクレアーゼ
EP3694993A4 (en) 2017-10-11 2021-10-13 The General Hospital Corporation METHOD OF DETECTING A SITE-SPECIFIC AND UNDESIRED GENOMIC DESAMINATION INDUCED BY BASE EDITING TECHNOLOGIES
EP3781585A4 (en) 2018-04-17 2022-01-26 The General Hospital Corporation SENSITIVE IN VITRO TESTS FOR SUBSTRATE PREFERENCES AND SITE FOR NUCLEIC ACID BINDERS, MODIFIERS AND CLEAVAGE AGENTS
CN110938658B (zh) * 2018-09-21 2023-02-07 中国科学院分子细胞科学卓越创新中心 一种抗体进化方法及其应用
JP2022526695A (ja) * 2019-02-02 2022-05-26 シャンハイテック ユニバーシティ 遺伝子編集における非意図的な変異の阻害
CN110804628B (zh) * 2019-02-28 2023-05-12 中国科学院脑科学与智能技术卓越创新中心 高特异性无脱靶单碱基基因编辑工具
CN111748546B (zh) * 2019-03-26 2023-05-09 复旦大学附属中山医院 一种产生基因点突变的融合蛋白及基因点突变的诱导方法
US20220228133A1 (en) * 2019-05-22 2022-07-21 Toolgen Incorporated Single base substitution protein, and composition comprising same
US20230295710A1 (en) * 2020-03-04 2023-09-21 Suzhou Qi Biodesign Biotechnology Company Limited Method for detecting random off-target effect of single-base editing system
WO2022060185A1 (ko) * 2020-09-18 2022-03-24 기초과학연구원 표적화된 탈아미노효소 및 이를 이용한 염기 교정
WO2022059928A1 (ko) * 2020-09-21 2022-03-24 고려대학교 산학협력단 신규의 개량된 염기 편집 또는 교정용 융합단백질 및 이의 용도
KR102399035B1 (ko) 2020-10-21 2022-05-17 성균관대학교산학협력단 산업 균주 내 온-타겟 효율의 감소 없이 오프-타겟이 없는 사이토신 염기 편집기를 발현하는 벡터 및 이의 용도
CN112553243B (zh) * 2020-12-11 2022-07-22 中国农业科学院棉花研究所 CRISPR/xCas9基因编辑系统在棉花中的应用
CN114317601A (zh) * 2021-11-22 2022-04-12 安徽大学 一种基于SviCas3的碱基编辑方法
WO2023169410A1 (zh) * 2022-03-08 2023-09-14 中国科学院遗传与发育生物学研究所 胞嘧啶脱氨酶及其在碱基编辑中的用途

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9840699B2 (en) * 2013-12-12 2017-12-12 President And Fellows Of Harvard College Methods for nucleic acid editing
JP6747974B2 (ja) 2014-01-08 2020-08-26 プレジデント アンド フェローズ オブ ハーバード カレッジ Rna誘導型遺伝子ドライブ
TW201531569A (zh) * 2014-02-12 2015-08-16 Taiwan Sugar Corp 雙股核酸分子與s1核酸酶於檢測核酸修復酵素活性的用途
US20160369258A1 (en) 2014-03-11 2016-12-22 University Of Washington Restricting nuclear protein to specific phases of the cell cycle
WO2016022363A2 (en) * 2014-07-30 2016-02-11 President And Fellows Of Harvard College Cas9 proteins including ligand-dependent inteins
JP6621820B2 (ja) 2014-11-14 2019-12-18 インスティチュート フォー ベーシック サイエンスInstitute For Basic Science ゲノムでプログラマブルヌクレアーゼの非標的位置を検出する方法
US20190225955A1 (en) * 2015-10-23 2019-07-25 President And Fellows Of Harvard College Evolved cas9 proteins for gene editing

Also Published As

Publication number Publication date
EP3530737A1 (en) 2019-08-28
KR102026421B1 (ko) 2019-09-27
KR20180029937A (ko) 2018-03-21
WO2018052247A1 (ko) 2018-03-22
US20200131536A1 (en) 2020-04-30
US11920151B2 (en) 2024-03-05
EP3530737A4 (en) 2020-04-29

Similar Documents

Publication Publication Date Title
JP2019526271A (ja) シトシンデアミナーゼによるdnaでの塩基編集確認方法
JP2020505062A (ja) Dna一本鎖切断による塩基編集非標的位置確認方法
JP6621820B2 (ja) ゲノムでプログラマブルヌクレアーゼの非標的位置を検出する方法
US20220145275A1 (en) Engineered CRISPR-Cas9 nucleases with Altered PAM Specificity
US20230407341A1 (en) Using Truncated Guide RNAs (tru-gRNAs) to Increase Specificity for RNA-Guided Genome Editing
JP7038079B2 (ja) Crisprハイブリッドdna/rnaポリヌクレオチドおよび使用方法
JP6784601B2 (ja) シークエンシングによって評価されるゲノムワイドでバイアスのないDSBの同定(GUIDE−Seq)
US10676734B2 (en) Compositions and methods for detecting nucleic acid regions
CN108350449B (zh) 工程化的CRISPR-Cas9核酸酶
US8507239B2 (en) Restriction endonucleases and their applications
JP7460539B2 (ja) 核酸を結合、修飾、および切断する物質の基質選択性および部位のためのin vitroでの高感度アッセイ
KR102210700B1 (ko) 아데노신 디아미나아제를 이용한 염기 교정 확인 방법
EP3694993A1 (en) Methods for detecting site-specific and spurious genomic deamination induced by base editing technologies
Huang et al. Engineered Cas12a-Plus nuclease enables gene editing with enhanced activity and specificity
Wei et al. Closely related type II-C Cas9 orthologs recognize diverse PAMs
KR102067810B1 (ko) 크로마틴 dna를 이용한 유전체 서열분석 방법 및 유전체 교정 확인 방법
US11352666B2 (en) Method for detecting off-target sites of programmable nucleases in a genome
JP2024501892A (ja) 新規の核酸誘導型ヌクレアーゼ

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190426

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200602

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20210105