JP2018522249A - Cas9分子/ガイドrna分子複合体の評価 - Google Patents

Cas9分子/ガイドrna分子複合体の評価 Download PDF

Info

Publication number
JP2018522249A
JP2018522249A JP2018506818A JP2018506818A JP2018522249A JP 2018522249 A JP2018522249 A JP 2018522249A JP 2018506818 A JP2018506818 A JP 2018506818A JP 2018506818 A JP2018506818 A JP 2018506818A JP 2018522249 A JP2018522249 A JP 2018522249A
Authority
JP
Japan
Prior art keywords
molecule
cas9
grna
complex
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018506818A
Other languages
English (en)
Inventor
ジャヤラム、ハリハラン
セレック、ウィリアム・ジュニア
Original Assignee
エディタス・メディシン、インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by エディタス・メディシン、インコーポレイテッド filed Critical エディタス・メディシン、インコーポレイテッド
Publication of JP2018522249A publication Critical patent/JP2018522249A/ja
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6811Selection methods for production or design of target specific oligonucleotides or binding molecules
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • G01N21/6486Measuring fluorescence of biological material, e.g. DNA, RNA, cells
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/483Physical analysis of biological material
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/10Applications; Uses in screening processes
    • C12N2320/11Applications; Uses in screening processes for the determination of target sites, i.e. of active nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/90Enzymes; Proenzymes
    • G01N2333/914Hydrolases (3)
    • G01N2333/916Hydrolases (3) acting on ester bonds (3.1), e.g. phosphatases (3.1.3), phospholipases C or phospholipases D (3.1.4)
    • G01N2333/922Ribonucleases (RNAses); Deoxyribonucleases (DNAses)
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2500/00Screening for compounds of potential therapeutic value

Abstract

本明細書では、Cas9分子/gRNA分子複合体を評価、選択、最適化、および設計する方法が開示される。

Description

関連出願の相互参照
本出願は、2015年4月24日に出願された米国仮特許出願第62/152,473号明細書の優先権を主張する。
本発明は、Cas9分子/ガイドRNA(gRNA)分子複合体の評価、選択、および設計に関する。
Cas9リボ核タンパク質(RNP)複合体の直接送達は、細胞内のCas9タンパク質の迅速な代謝回転のおかげで、オフターゲット活性を最小化しながら効率的な遺伝子編集を可能にする。遺伝子編集は、生体外転写されたまたは化学的に合成されたガイドRNA(gRNA)と複合体形成する、精製Cas9タンパク質のカチオン性脂質送達によって、様々な哺乳類細胞において達成され得る。RNP送達によって媒介される遺伝子編集の効率は、遺伝子座によって変動し、gRNAの長さ、ならびに送達されるCas9タンパク質およびgRNAの量および比率に左右される。RNP複合体の二成分性質を考慮すると、Cas9タンパク質とgRNAとの間の完全かつ生産的な複合体形成を得るための正確な条件が必要である。タンパク質およびRNAの量は、例えば、ブラッドフォード色素結合アッセイなどの色素結合アッセイ、またはRiboQuant RNAアッセイによって定量化できるものの、これらの技術は、遺伝子編集活性に必要な生産的RNP複合体の定量化を提供しない。
Cas9/gRNA複合体の構造的および生物物理学的特性決定により、大きな接触面積および高い親和性が明らかにされた。熱溶融曲線は、タンパク質−リガンド複合体の安定性および結合を特徴付けるのに有用な特性である。示差走査熱量計(DSF)は、例えばSYPRO(登録商標)Orangeなどの小分子染料の蛍光の変化を用いて、タンパク質の熱変性をモニターし、その熱融解温度()を判定する、生物物理学的技術である。タンパク質へのリガンドの結合は、タンパク質を異なる程度に安定化して、そのTを変化させる傾向がある。異なるリガンド濃度でタンパク質のTを測定することで、そのリガンドに対するタンパク質の親和性の測定ができるようになる。幅広い熱融解シグネチャを用いて、信号対雑音比の高い高ハイスループットで、RNP複合体の品質が迅速にアッセイされ得る。
したがって、それを用いて、例えば、RNP媒介遺伝子編集の必要条件である生産的複合体形成を定量化するなど、Cas9分子/gRNA分子複合体の質を評価し得る、DSFなどのアッセイを開発する必要性が依然として存在する。
本明細書では、(a)Cas9分子と複数のgRNA分子の1つとを組み合わせることによって作製されるCas9分子/gRNA分子複合体を各サンプルが含んでなる、複数のサンプルを作製するステップと;(b)複数のサンプルのそれぞれにおけるCas9分子/gRNA分子複合体の融解温度(T)値を検出するステップと;(c)(i)複数のサンプルにおけるT値と、参照Cas9分子/gRNA分子複合体のT値との、または所定の閾値T値との比較、または(ii)複数のサンプルのT値の相対的な順序付けの1つまたは複数に基づいて、複数のサンプルから少なくとも1つのサンプルを選択するステップとを含む、対象に投与するためのCas9分子/gRNA分子複合体をスクリーニングする方法が提供される。特定の実施形態では、複数のサンプルの各サンプル中のCas9分子/gRNA分子複合体のT値を検出するステップは、複数のサンプル中の各サンプルを示差走査型蛍光定量法(DSF)によって評価するステップを含んでもよい。特定の実施形態では、gRNAは、キメラgRNAであってもよい。特定の実施形態では、gRNAは、モジュラーgRNAであってもよい。特定の実施形態では、サンプルは、添加剤、小分子、安定化試薬、緩衝液、pH、塩濃度、グリセロール濃度、またはその他の緩衝液成分を含んでなる構成要素を含んでなってもよい。特定の実施形態では、gRNA分子を含まないCas9分子のT値より少なくとも8℃高いTを有するCas9分子/gRNA分子複合体を含んでなる、サンプルが選択されてもよい。
本明細書の特定の実施形態では、本明細書で提供される方法に従って選択されるgRNA分子を含まないCas9分子のT値よりも少なくとも8℃高いTを有する、単離されたCas9分子とgRNA分子との複合体が提供される。
本明細書の特定の実施形態では、本明細書で提供される方法に従って選択されたgRNA分子を含まないCas9分子のT値よりも少なくとも8℃高いTを有する、単離されたCas9分子とgRNA分子との複合体を含む組成物が提供される。特定の実施形態では、Cas9分子とgRNA分子との非天然複合体のTと、gRNA分子を含まないCas9分子のTとの差は、DSFによって評価されてもよい。特定の実施形態では、gRNAは、キメラまたはモジュラーgRNAであってもよい。
本明細書の特定の実施形態では、(a)Cas9分子と複数のgRNA分子の1つとを組み合わせることによって作製されるCas9分子/gRNA分子複合体をそれぞれが含んでなる、複数のCas9分子/gRNA分子複合体を作製するステップと;(b)複数のCas9分子/gRNA分子複合体の各Cas9分子/gRNA分子複合体のT値を検出するステップと;(c)Cas9分子/gRNA分子複合体のT値が、参照分子のT値よりまたはT参照値より高ければ、複数のCas9分子/gRNA分子複合体の1つまたは複数が安定していると判定するステップとを含む、Cas9分子/gRNA分子複合体の安定性を判定する方法が提供される。
本明細書の方法の特定の実施形態では、複数のgRNA分子は、候補gRNA分子のライブラリーであってもよい。特定の実施形態では、候補gRNA分子のライブラリーは、tracrRNA分子または配列のライブラリーを含んでなってもよい。特定の実施形態では、tracrRNA分子または配列のライブラリーは、異なる長さであってもよい。
本明細書の特定の実施形態では、(a)サンプル中でCas9分子とgRNA分子とを組み合わせて、Cas9分子/gRNA分子複合体を形成するステップと;(b)Cas9分子/gRNA分子複合体のT値を検出するステップと;(c)Cas9分子/gRNA分子複合体のT値が、参照分子のT値よりまたはT参照値より高ければ、複数のCas9分子/gRNA分子複合体が安定していると判定するステップとを含む、安定なCas9分子/gRNA分子複合体を促進する条件を判定する方法が提供される。
本明細書の特定の実施形態では、(a)DSFを通じてCas9分子/gRNA分子複合体のT値を検出するステップと;(b)Cas9分子/gRNA分子複合体のT値が、参照分子のT値よりまたはT参照値より高ければ、複数のCas9分子/gRNA分子複合体が安定していると判定するステップとを含む、安定なCas9分子/gRNA分子複合体をスクリーニングする方法が提供される。
本明細書の特定の実施形態では、(a)サンプル中でCas9分子とgRNA分子とを組み合わせて、Cas9分子/gRNA分子複合体を形成するステップと;(b)Cas9分子/gRNA分子複合体のT値を検出するステップと;(c)Cas9分子/gRNA分子複合体のT値が、参照分子のT値よりまたはT参照値より少なくとも8℃高ければ、複数のCas9分子/gRNA分子複合体が安定していると判定するステップとを含む、安定なCas9分子/gRNA分子複合体を形成するのに最適なgRNAを同定する方法が提供される。
本明細書の特定の実施形態では、(a)サンプル中でCas9分子とgRNA分子とを組み合わせて、Cas9分子/gRNA分子複合体を形成するステップと;(b)Cas9分子/gRNA分子複合体のT値を検出するステップと;(c)Cas9分子/gRNA分子複合体の活性値を測定するステップと;(d)(i)Cas9分子/gRNA分子複合体のT値が、参照分子のT値よりまたはT参照値より高く(ii)Cas9分子/gRNA分子複合体の活性値が、参照分子の活性値よりまたは活性参照値より高ければ、Cas9分子/gRNA分子複合体が安定していると判定するステップとを含む、Cas9分子/gRNA分子複合体の安定性を判定する方法が提供される。
本明細書の特定の実施形態では、(a)サンプル中でCas9分子とgRNA分子とを組み合わせて、Cas9分子/gRNA分子複合体を形成するステップと;(b)Cas9分子/gRNA分子複合体のT値を検出するステップと;(c)Cas9分子/gRNA分子複合体のT値と、参照分子のT値とのまたはT参照値との間のδ値を判定するステップと;(d)δ値が少なくとも8℃であり、Cas9分子/gRNA分子複合体のT値が、参照分子のT値よりまたはT参照値より高ければ、Cas9分子/gRNA分子複合体が安定していると判定するステップとを含む、gRNA分子のCas9分子への結合を最適化して、安定なCas9分子/gRNA分子複合体を形成するする方法が提供される。
本明細書の特定の実施形態では、(a)参照分子の熱安定性値を検出するステップと;(b)サンプル中でCas9分子とgRNA分子とを組み合わせて、Cas9分子/gRNA分子複合体を形成するステップと;(c)Cas9分子/gRNA分子複合体の熱安定性値を測定するステップと;(d)Cas9分子/gRNA分子複合体の熱安定性値が、参照分子の熱安定性値より高ければ、Cas9分子/gRNA分子複合体が安定していると判定するステップとを含む、安定なCas9分子/gRNA分子複合体をスクリーニングする方法が提供される。
本明細書の方法の特定の実施形態では、熱安定性値は変性温度値であってもよく、熱安定性参照値は変性温度参照値であってもよい。本明細書の方法の特定の実施形態では、熱安定性値はT値であってもよく、熱安定性参照値はT参照値であってもよい。
本明細書の方法の特定の実施形態では、Cas9分子/gRNA分子複合体のT値が、参照分子のT値よりまたはT参照値より、少なくとも1℃、少なくとも2℃、少なくとも3℃、少なくとも4℃、少なくとも5℃、少なくとも6℃、少なくとも7℃、少なくとも8℃、少なくとも9℃、少なくとも10℃、少なくとも11℃、少なくとも12℃、少なくとも13℃、少なくとも14℃、少なくとも15℃、少なくとも16℃、少なくとも17℃、少なくとも18℃、少なくとも19℃、または少なくとも20℃高ければ、Cas9分子/gRNA分子複合体は安定していてもよい。例えば、特定の実施形態では、Cas9分子/gRNA分子複合体のT値が、参照分子のT値よりまたはT参照値より少なくとも8℃高ければ、Cas9分子/gRNA分子複合体は安定している。
本明細書の方法の特定の実施形態では、Cas9分子/gRNA分子複合体のT値が、参照分子のT値よりまたはT参照値より、約1℃、約2℃、約3℃、約4℃、約5℃、約6℃、約7℃、約8℃、約9℃、約10℃、約11℃、約12℃、約13℃、約14℃、約15℃、約16℃、約17℃、約18℃、約19℃、または約20℃高ければ、Cas9分子/gRNA分子複合体は安定していてもよい。例えば、特定の実施形態では、Cas9分子/gRNA分子複合体のT値が、参照分子のT値よりまたはT参照値より約8℃高ければ、Cas9分子/gRNA分子複合体は安定している。
本明細書の方法の特定の実施形態では、Cas9分子/gRNA分子複合体のT値が、参照分子のT値よりまたはT参照値より約1℃〜5℃、約6℃〜10℃、約11℃〜15℃、または約16℃〜20℃高ければ、Cas9分子/gRNA分子複合体は安定していてもよい。例えば、特定の実施形態では、Cas9分子/gRNA分子複合体のT値が、参照分子のT値よりまたはT参照値より約6℃〜10℃高ければ、Cas9分子/gRNA分子複合体は安定している。
本明細書の方法の特定の実施形態では、T値は、熱シフトアッセイを用いて検出されてもよい。特定の実施形態では、熱シフトアッセイは、DSF、示差走査熱量測定(DSC)、または等温滴定熱量測定(ITC)から選択されてもよい。
本明細書の方法の特定の実施形態では、gRNA分子は、キメラgRNA分子を含んでなってもよい。特定の実施形態では、gRNA分子は、モジュラーgRNA分子を含んでなってもよい。
本明細書の方法の特定の実施形態では、Cas9分子は、本明細書で開示されるCas9分子のいずれかであってもよい。例えば、Cas9分子は、表1から選択されるCas9分子であってもよい。特定の実施形態では、Cas9分子は、キメラCas9分子、または合成または遺伝子操作Cas9分子であってもよい。例えば、Cas9分子は、1つの消去部分またはいくつかの消去部分を有するCas9分子であってもよい。特定の実施形態では、Cas9分子は、S.ピオゲネス(S.pyogenes)またはS.アウレウス(S.aureus)Cas9分子を含んでなってもよい。
本明細書の方法の特定の実施形態では、参照分子は、(a)gRNA分子の非存在下の参照Cas9分子;(b)第2のgRNA分子(すなわち、評価される複合体中のもの以外のgRNA)と複合体形成する、標準Cas9分子(例えば、評価される複合体中のCas9分子と同じCas9分子);および(c)参照Cas9分子/gRNA分子複合体から選択されてもよく、その中で参照Cas9分子/gRNA分子は、例えば、Cas9分子/gRNA分子複合体とは異なる比率のCas9分子およびgRNA分子などの異なる条件下で形成され、または異なる緩衝液中で形成された。特定の実施形態では、参照Cas9分子は、評価される複合体のCas9分子と同一であってもよい。特定の実施形態では、標準Cas9分子は、評価される複合体のCas9分子と異なってもよい。特定の実施形態では、参照Cas9分子は、評価される複合体のCas9分子とは一次配列が異なってもよい。特定の実施形態では、参照Cas9分子/gRNA分子複合体のgRNA分子は、評価される複合体のgRNA分子と同一であってもよい。特定の実施形態では、参照Cas9分子/gRNA分子複合体のgRNA分子は、評価される複合体のgRNA分子と異なってもよい。特定の実施形態では、参照Cas9分子/gRNA分子複合体のgRNA分子は、評価される複合体のgRNA分子と配列が異なってもよく、または修飾のために異なってもよい。
本明細書の方法の特定の実施形態では、T参照値は、予め選択されたTの数値を含んでなってもよい。特定の実施形態では、T参照値は、本明細書に記載される参照分子のいずれかのTと相関する値を含んでなってもよい。
特定の実施形態では、本明細書で開示される方法は、Cas9分子/gRNA分子複合体の活性を検出するステップと;Cas9分子/gRNA分子複合体の活性値を測定するステップと;Cas9分子/gRNA分子複合体の活性値が、参照分子の活性値よりまたは活性参照値より高ければ、Cas9分子/gRNA分子複合体が安定していると判定するステップとをさらに含んでもよい。特定の実施形態では、活性は、インデルを誘導する能力;標的DNAを修飾する能力;予め選択された修復方法の傾向;gRNA分子がDNA標的にハイブリダイズしたまま留まる能力;およびgRNA分子がCas9分子/gRNA分子複合体のCas9分子に結合する能力の1つまたは複数を含んでなってもよい。特定の実施形態では、活性値は結合値であってもよく、活性は、(a)サンプル中でgRNA分子とCas9分子とを組み合わせて、Cas9分子/gRNA分子複合体を形成するステップと;(b)Cas9分子/gRNA分子複合体の結合値を測定するステップと;(c)Cas9分子/gRNA分子複合体の結合値が、参照分子の結合値よりまたは結合参照値より高ければ、Cas9分子/gRNA分子複合体が安定していると判定するステップとを含んでなる、gRNA分子がCas9分子に結合する能力であってもよい。特定の実施形態では、結合値は、動態アッセイを用いて測定されてもよい。特定の実施形態では、動態アッセイは、表面プラズモン共鳴(SPR)アッセイ、バイオレイヤー干渉法(BLI)アッセイ、またはゲルバンドシフトアッセイから選択されてもよい。特定の実施形態では、予め選択された修復方法の傾向は、HDRまたはNHEJであってもよい。特定の実施形態では、Cas9分子/gRNA分子複合体の活性は、試験管内システム;生体外システム;生体内システム;細胞アッセイ;または動物モデルを用いて試験されてもよい。
特定の実施形態では、参照分子は、本明細書で提供される参照分子のいずれかから選択される。特定の実施形態では、参照Cas9分子/gRNA分子複合体は、Cas9分子/gRNA分子複合体とは異なる比率のCas9分子およびgRNA分子で形成され、またはCas9分子/gRNA分子複合体とは異なる緩衝液中で形成される。
本明細書の特定の実施形態では、本明細書に記載の方法のいずれかを用いて作製される、合成Cas9分子/gRNA分子複合体が提供される。
本明細書の特定の実施形態では、本明細書に記載の方法のいずれかを用いて作製されるCas9分子/gRNA分子複合体を含んでなる、組成物が提供される。
本明細書の特定の実施形態では、本明細書に記載の方法のいずれかを用いて作製される、1つまたは複数のCas9分子/gRNA分子複合体をコードする核酸を含んでなるベクター系が提供される。
本明細書の特定の実施形態では、本明細書に記載されるCas9分子/gRNA分子複合体のいずれかを標的細胞に送達するステップを含んでなる、Cas9分子/gRNA分子複合体を標的細胞に送達する方法が提供される。特定の実施形態では、Cas9分子/gRNA分子複合体は、RNPカチオン性脂質トランスフェクション、ウイルスベクター、またはRNAトランスフェクションによって細胞に送達されてもよい。特定の実施形態では、ウイルスベクターは、AAVベクターであってもよい。
特定の実施形態では、本明細書で提供される方法、組成物、または配合物中のgRNA分子は、単分子またはキメラgRNAであってもよい。その他の実施形態では、gRNA分子は、モジュラーgRNAであってもよい。
特定の実施形態では、本明細書で提供される方法、組成物、または配合物中のCas9分子は、S.ピオゲネス(S.pyogenes)、S.アウレウス(S.aureus)、またはS.サーモフィルス(S.thermophilus)Cas9分子であってもよく、またはS.ピオゲネス(S.pyogenes)、S.アウレウス(S.aureus)に由来するCas9分子、またはS.サーモフィルス(S.thermophilus)Cas9分子であってもよい。特定の実施形態では、Cas9分子は標識されてもよく、これらの実施形態のうちのあるものでは、標識は蛍光染料であってもよい。
本発明の他の特徴および利点は、詳細な説明、図面、および特許請求の範囲から明らかになるであろう。
図1A−1Iは、いくつかの例示的gRNAの描写である。
部分的にストレプトコッカス・ピオゲネス(Streptococcuspyogenes)(S.ピオゲネス(S.pyogenes)に由来する(または部分的に配列をモデルにしている)、モジュラーgRNA分子を二重鎖構造として描写する(それぞれ出現順に配列番号39および40); S.ピオゲネス(S.pyogenes)に部分的に由来する単分子gRNA分子を二重鎖構造として描写する(配列番号41); S.ピオゲネス(S.pyogenes)に部分的に由来する単分子gRNA分子を二重鎖構造として描写する(配列番号42); S.ピオゲネス(S.pyogenes)に部分的に由来する単分子gRNA分子を二重鎖構造として描写する(配列番号43); S.ピオゲネス(S.pyogenes)に部分的に由来する単分子gRNA分子を二重鎖構造として描写する(配列番号44); ストレプトコッカス・サーモフィルス(Streptococcus thermophilus)(S.サーモフィルス(S.thermophilus)に部分的に由来するモジュラーgRNA分子を二重鎖構造として描写する(それぞれ出現順に配列番号45および46); S.ピオゲネス(S.pyogenes)およびS.サーモフィルス(S.thermophilus)のモジュラーgRNA分子のアライメントを描写する(それぞれ出現順に配列番号39、45、47、および46)。 単分子gRNA分子の追加的な例示的構造を描写する。二重鎖構造(配列番号42)としてのS.ピオゲネス(S.pyogenes)に部分的に由来する、単分子gRNA分子の例示的構造を示す。 単分子gRNA分子の追加的な例示的構造を描写する。二重鎖構造(配列番号38)としてのS.アウレウス(S.aureus)に部分的に由来する、単分子gRNA分子の例示的構造を示す。 Cas9配列のアライメントを描写する(Chylinski 2013)。N末端RuvC様ドメインは、枠内に「Y」で示される。他の2つのRuvC様ドメインは、枠内に「B」で示される。HNH様ドメインは、枠内に「G」で示される。Sm:S.ミュータンス(S.mutans)(配列番号1);Sp:S.ピオゲネス(S.pyogenes)(配列番号2);St:S.サーモフィルス(S.thermophilus)(配列番号4);およびLi:L.イノキュア(L.innocua)(配列番号5)。「モチーフ」(配列番号14)は、4つの配列に基づくコンセンサス配列である。全ての4つの配列中で保存される残基は、一文字アミノ酸略号によって示され;「」は、4つの配列のいずれかの対応する位置に見られる任意のアミノ酸を示し;「−」は、存在しないことを示す。 上記図2Aの説明と同じ。 上記図2Aの説明と同じ。 上記図2Aの説明と同じ。 上記図2Aの説明と同じ。 上記図2Aの説明と同じ。 上記図2Aの説明と同じ。 Chylinski 2013で開示された、Cas9分子に由来するN末端RuvC様ドメインのアライメントを示す(配列番号52〜95、120〜123)。 上記図3Aの説明と同じ。図3Bの最後の行は、4つの高度に保存された残基を特定する。 Chylinski 2013で開示されたCas9分子に由来するN末端RuvC様ドメインの配列外れ値が除外された、アライメントを示す(配列番号52〜123)。 上記図4Aの説明と同じ。図3Bの最後の行は、4つの高度に保存された残基を特定する。図4Bの最後の行は、3つの高度に保存された残基を特定する。 Chylinski 2013で開示されたCas9分子に由来するHNH様ドメインのアライメントを示す(配列番号124〜198)。 上記図5Aの説明と同じ。 上記図5Aの説明と同じ。図5Cの最後の行は、保存残基を特定する。 Chylinski 2013で開示されたCas9分子に由来するHNH様ドメインの配列外れ値が除外された、アライメントを示す(配列番号124〜141、148、149、151〜153、162、163、166〜174、177〜187、194〜198)。 上記図6Aの説明と同じ。図6Bの最後の行は、3つの高度に保存された残基を特定する。 例示的gRNA配列(配列番号42)を用いて、gRNAドメイン命名法を例示する。 S.ピオゲネス(S.pyogenes)Cas9のドメイン構成の概略図を提供する。図8Aは、Cas9の2つのローブ(認識(REC)およびヌクレアーゼ(NUC)ローブ)に関する、アミノ酸位置を含めたCas9ドメインの構成を示す。 上記図8Aの説明と同じ。図8Bは、83個のCas9オルソログにわたる、各ドメインのパーセント相同性を示す。 DSFによって判定された、gRNAの非存在下でのS.アウレウス(S.aureus)Cas9の熱安定性を描写する。 DSFによって判定された、gRNAの非存在下でのS.ピオゲネス(S.pyogenes)Cas9の熱安定性を描写する。 DSFによって判定された、(1)S.ピオゲネス(S.pyogenes)Cas9、(2)S.ピオゲネス(S.pyogenes)gRNAの存在下におけるS.ピオゲネス(S.pyogenes)Cas9、および(3)S.アウレウス(S.aureus)gRNAの存在下におけるS.ピオゲネス(S.pyogenes)Cas9の熱安定性を描写する。 DSFによって判定された、(1)S.アウレウス(S.aureus)Cas9および(2)CD3を標的とするgRNAと合わせたS.アウレウス(S.aureus)Cas9の熱安定性を描写する。 S.アウレウス(S.aureus)Cas9 CD3を標的とするgRNAのJurkatT細胞への送達後における、CD3陰性集団の生成(generation CD3 negative population)を示す例示的FACS分析を描写する。
定義
特に断りのない限り、本明細書で使用される全ての技術的および科学的用語は、本発明が属する技術分野の当業者によって一般に理解されるのと同じ意味を有する。本明細書に記載されるものと同様のまたは同等の方法および材料が、本発明でまたは本発明の試験で用いられ得るが、適切な方法および材料は下述のとおりである。本明細書で言及される、全ての刊行物、特許出願、特許、およびその他の参考文献は、その内容全体を参照により援用する。これに加えて、材料、方法、および実施例は、例証のみを意図し、制限は意図されない。
「alt−HDR」、「代替相同指向修復」、または「代替HDR」は、本明細書の用法では、相同核酸(例えば、内因性相同配列、例えば、姉妹染色分体、または外因性核酸、例えば、鋳型核酸)を用いてDNA損傷を修復するプロセスを指す。alt−HDRは、プロセスが、標準HDRとは異なる経路を利用し、標準HDR媒介物であるRAD51およびBRCA2によって阻害され得るという点で、標準HDRと異なる。また、alt−HDRは、破損の修復のために一本鎖またはニックの入った相同核酸を使用する。
「標準HDR」または標準相同指向修復は、本明細書の用法では、相同核酸(例えば、内因性相同配列、例えば、姉妹染色分体、または外因性核酸、例えば、鋳型核酸)を用いてDNA損傷を修復するプロセスを指す。標準HDRは、二本鎖切断で顕著な切除があって少なくとも1つのDNAの一本鎖部分が形成する場合に、典型的に機能する。正常細胞では、HDR典型的に、切断の認識、切断の安定化、切除、一本鎖DNAの安定化、DNAクロスオーバー中間体の形成、クロスオーバー中間体の分解、およびライゲーションなどの一連の工程を伴う。プロセスはRAD51およびBRCA2を必要とし、相同核酸は典型的に二本鎖である。
特に断りのない限り、「HDR」という用語は、本明細書の用法では標準HDRおよびalt−HDRの双方を包含する。
「非相同末端結合」または「NHEJ」は、本明細書の用法では、標準NHEJ(cNHEJ)、代替NHEJ(altNHEJ)、マイクロホモロジー媒介末端結合(MMEJ)、一本鎖アニーリング(SSA)、および合成依存性マイクロホモロジー媒介末端結合(SD−MMEJ)をはじめとする、ライゲーション媒介修復および/または非鋳型媒介修復を指す。
本明細書で使用される「取得する」または「得る」という用語は、物理的実態または値を「直接取得する」、「間接的に取得する」、または値の場合には、「計算によって取得する」の1つまたは複数または全てによって物理的実態または例えば数値などの値の所有を得ることを指す。
「直接取得する」は、プロセスを実施して(例えば、合成法または分析法を実施して)、物理的実体または値を取得することを意味する。「物理的実体を直接取得することは、例えば、出発原料などの物理的実体に物理的変化を含むプロセスを実施することを含む。例示的な変化としては、2つ以上の出発材料から物理的実体を作製すること、実体を剪断または断片化すること、実体を分離または精製すること、2つ以上の別個の実体を合わせて混合物にすること、共有結合または非共有結合の破壊または成形をはじめとする化学反応を実施することが挙げられる。値を直接取得することは、例えば、サンプル、分析物、または試薬などの実体の物理的変化を含む分析プロセス(本明細書では「物理的分析」と称されることもある)を実施するステップなどの、サンプルまたは別の実体の物理的変化をはじめとするプロセスを実施する、例えば、例えば、分析物、またはその断片もしくはその他の誘導体などの実体を別の実体から分離または精製すること、分析物、またはその断片もしくはその他の誘導体を、例えば、緩衝液、溶媒、または反応物質などの別の実体と組み合わせること、例えば、分析物の第1の原子と第2の原子との間の共有結合または非共有結合を切断しまたは形成することによって、分析物またはその断片もしくはその他の誘導体の構造を変化させること;例えば、試薬の第1の原子と第2の原子との間の共有結合または非共有結合を切断しまたは形成することによって、試薬またはその断片もしくはその他の誘導体の構造を変化させることの1つまたは複数を含む方法などの分析法を実施することを含む。
「間接的に取得する」とは、別の当事者または出典(例えば、物理的実体または値を直接取得した第三者研究所)から、物理的実体または値を受け取ることを指す。例えば、第1の当事者は、第2の当事者が直接取得した、または計算によって取得した値を第2の当事者から取得(間接的に取得)し得る。
「計算によって取得する」とは、例えば、コンピュータなどの機械上で実施されるように、計算または演算によって値を取得することを指す。
「ドメイン」は、本明細書の用法では、タンパク質または核酸部分を記述するために使用される。特に断りのない限り、ドメインは、任意の特定の機能特性を有する必要はない。
2つの配列間の「相同性」または「配列同一性」(用語は本明細書で同義的に使用される)の計算は、次のようにして実施される。配列は、最適な比較目的で整列され(例えば、最適アライメントのために、第1および第2のアミノ酸または核酸配列の片方または双方にギャップが装入され得て、非相同配列は比較目的で無視され得る)。最適アライメントは、Blossum62重み行列による、ギャップペナルティ12、ギャップ延長ペナルティ4、およびフレームシフトギャップペナルティ5で、GCGソフトウェアパッケージのGAPプログラムを使用して、最高スコアとして評価される。次に対応するアミノ酸位置またはヌクレオチド配列部位にある、アミノ酸残基またはヌクレオチドを比較する。第1の配列中の位置が、第2の配列中の対応する位置と同一のアミノ酸残基またはヌクレオチドによって占有される場合、分子は、その位置において同一である。2つの配列間の同一性百分率は、配列によって共有される同一の位置数の関数である。
「ポリペプチド」は、本明細書の用法では、100個未満のアミノ酸残基を有するアミノ酸のポリマーを指す。特定の実施形態では、それは50、20、または10個未満のアミノ酸残基を有する。
「参照分子」は、本明細書の用法では、修飾または候補分子がそれに対して比較される分子を指す。例えば、参照Cas9分子は、修飾または候補Cas9分子がそれに対して比較されるCas9分子を指す。同様に、標準gRNAは、修飾または候補gRNA分子がそれに対して比較されるgRNA分子を指す。さらに、参照Cas9分子/gRNA分子複合体は、Cas9分子/gRNA分子複合体がそれに対して比較される、Cas9分子/gRNA分子複合体を指す。修飾または候補分子は、配列(例えば、修飾または候補分子は、参照分子とX%の配列同一性または相同性を有してもよい)、熱安定性、または活性(例えば、修飾または候補分子は、参照分子のX%の活性を有してもよい)に基づいて、参照分子と比較されてもよい。例えば、w参照分子がCas9分子である場合、修飾または候補分子は、参照Cas9分子の10%以下のヌクレアーゼ活性を有することで特徴付けられてもよい。標準Cas9分子の例としては、例えば、S.ピオゲネス(S.pyogenes)、S.アウレウス(S.aureus)、S.サーモフィルス(S.thermophilus)、またはN.メニンジチディス(N.meningitidis)に由来する天然のCas9分子などの天然の未修飾Cas9分子が挙げられる。特定の実施形態では、参照Cas9分子は、それが比較される修飾または候補Cas9分子と、最も近い配列同一性または相同性を有する天然Cas9分子である。特定の実施形態では、参照Cas9分子は、修飾または候補Cas9分子に達するように変異が加えられた、天然または既知の配列を有する親分子である。
「参照値」は、本明細書の用法では予め選択された数値である参照値を指す。予め選択された数値は、単一の値または範囲であり得る。特定の実施形態では、参照値は、参照分子の値と相関する値を含んでなってもよい。特定の実施形態では、参照値は、熱安定性参照値であってもよい。特定の実施形態では、熱安定性参照値は、熱安定性の予め選択された数値である。特定の実施形態では、熱安定性参照値は、参照分子の熱安定性値と相関する値を含んでなってもよい。特定の実施形態では、熱安定性参照値は、熱安定性と相関するパラメータを含んでなってもよい。特定の実施形態では、熱安定性参照値は、変性温度参照値または融解温度(T)参照値であってもよい。特定の実施形態では、変性温度参照値は、変性の予め選択された値である。特定の実施形態では、変性温度参照値は、参照分子の変性温度値と相関する値を含んでなってもよい。特定の実施形態では、変性温度参照値は、変性と相関するパラメータを含んでなってもよい。特定の実施形態では、T参照値は、Tの予め選択された数値であってもよい。特定の実施形態では、T参照値は、所定の閾値Tであってもよい。特定の実施形態では、T参照値は、参照分子のT値と相関する値を含んでなってもよい。特定の実施形態では、T参照値は、Tと相関するパラメータを含んでなってもよい。特定の実施形態では、参照値は、活性参照値であってもよい。特定の実施形態では、活性参照値は、参照分子の活性値と相関する値を含んでなってもよい。特定の実施形態では、活性参照値は、活性と相関するパラメータを含んでなってもよい。特定の実施形態では、活性参照値は、切断参照値または結合参照値であってもよい。特定の実施形態では、切断参照値は、核酸切断の予め選択された数値であってもよい。特定の実施形態では、結合参照値は、2つ以上の分子の結合の予め選択された数値であってもよい。特定の実施形態では、参照値は、δ参照値であってもよい。特定の実施形態では、δ値参照値は、δ値の予め選択された数値であってもよい。
「δ値」は、本明細書の用法では、2つの値の間の差またはシフトを表す値である。例えば、特定の実施形態では、δ値は、評価されるCas9分子/gRNA分子複合体の熱安定性値と、参照分子の熱安定性値との、または熱安定性参照値との間の差を表す値であってもよい。特定の実施形態では、δ値は、評価されるCas9分子/gRNA分子複合体の活性値と、参照分子の活性値との、または活性参照値との間の差を表す値であってもよい。
「置換」または「交換された」は、分子修飾に関連した本明細書の用法では、プロセスの制限は必要でなく、置換実体が存在することのみを示唆する。
「対象」は、本明細書の用法では、ヒトまたは非ヒト動物のどちらを意味してもよい。用語は、哺乳類(例えば、ヒト、その他の霊長類、ブタ、齧歯類(例えば、マウスおよびラットまたはハムスター)、ウサギ、モルモット、ウシ、ウマ、ネコ、イヌ、ヒツジ、およびヤギ)を含むが、これに限定されるものではない。特定の実施形態では、対象はヒトである。別の実施形態では、対象は家禽である。特定の実施形態では、対象はヒトであり、これらの実施形態のうちのあるものでは、ヒトは、乳児、小児、若年成人、または成人である。
「X」は、アミノ酸配列の文脈で、本明細書の用法では、特に断りのない限り、任意のアミノ酸(例えば、20個の天然アミノ酸のいずれか)を指す。
「約」は、本明細書の用法では、記述される値または値の範囲の10%以内を意味する。
「Cas9分子」または「Cas9ポリペプチド」は、本明細書の用法では、gRNA分子と相互作用し得て、gRNA分子と協調して、標的ドメインを(および特定の実施形態ではPAM配列を)含んでなる部位に局在化する、分子またはポリペプチドをそれぞれ指す。Cas9分子およびCas9ポリペプチドとしては、天然のCas9分子およびCas9ポリペプチドと、遺伝子操作、改変、または修飾Cas9分子またはCas9ポリペプチドとの双方が挙げられ、後者は、例えば、最も類似した天然のCas9分子などの参照配列と、少なくとも1つのアミノ酸残基が異なる。
概要
本発明者らは、DSFによって判定されたCas9分子/gRNA分子複合体の安定性が、Cas9分子/gRNA分子複合体の様々な特性と相関することを発見した。したがって、安定性の判定を用いて、例えば、標的を切断する能力;例えば、HDRまたはNHEJなどの特定の経路によって分解されるCas9分子/gRNA分子複合体によって媒介される切断事象の傾向;標的を調節する能力;または予め選択された送達方法の適合性などの様々な特性について、Cas9分子/gRNA分子複合体(またはその構成要素)を評価することができる。安定性の決定はまた、Cas9分子、gRNA分子、複合体を調製する方法(例えば、構成要素の比率または化学量論)、または例えば、Cas9分子/gRNA分子複合体の有効性または堅固さに対する、および一般にCas9分子/gRNA分子複合体への組み入れのための追加的な構成要素の添加を評価するためにも用いられ得る。
開示される実験結果に基づいて、本明細書では、Cas9/分子gRNA分子複合体の熱安定性を測定するステップを含む方法が、提供される。タンパク質の熱安定性は、例えばgRNAなどの結合RNA分子の添加などの、好ましい条件下で増加させ得る。したがって、Cas9/gRNA複合体の熱安定性に関する情報は、複合体が安定しているかどうかを判定するのに有用である。方法は、Cas9分子/gRNA分子複合体の安定性を判定する方法、安定なCas9分子/gRNA分子複合体を促進する条件を判定する方法、安定なCas9分子/gRNA分子複合体をスクリーニングする方法、安定なCas9分子/gRNA分子複合体を形成するのに最適なgRNAを同定する方法、対象に投与するためのCas9/gRNA複合体スクリーニングする方法、および対象に投与するためのCas9/gRNA複合体を選択する方法をはじめとするが、これに限定されるものではない、Cas9/分子gRNA分子複合体の熱安定性を測定するステップを含んでもよい。特定の実施形態では、Cas9分子/gRNA分子複合体の熱安定性値が測定されてもよい。さらに、特定の実施形態では、参照分子の熱安定性値もまた測定されてもよい。特定の実施形態では、Cas9分子/gRNA分子複合体の熱安定性値が、本明細書に記載される参照分子の熱安定性値よりまたは熱安定性参照値より高ければ、Cas9分子/gRNA分子複合体は安定していると判定されてもよい。特定の実施形態では、参照分子は、gRNA分子を含まないCas9分子であってもよい。特定の実施形態では、測定される熱安定性値は、変性温度値であってもよい。これらの実施形態では、熱安定性参照値は、変性温度参照値である。特定の実施形態では、測定される熱安定性値は、T値であってもよい。これらの実施形態では、熱安定性参照値は、T参照値であってもよい。特定の実施形態では、熱安定性値は、熱シフトアッセイを用いて測定されてもよい。本明細書で開示されるように、DSFは、タンパク質の熱安定性を測定するのに用いられてもよい技術である。特定の実施形態では、熱安定性を測定するために用いられる熱シフトアッセイは、DSF、示差走査熱量測定(DSC)または等温滴定熱量測定(ITC)であってもよい。特定の実施形態では、Cas9分子/gRNA分子複合体の熱安定性値が、参照分子の熱安定性値よりまたは熱安定性参照値より高ければ、Cas9分子/gRNA分子複合体は安定していると判定されてもよい。例えば、特定の実施形態では、Cas9分子/gRNA分子複合体の熱安定性値が、参照分子の熱安定性値よりまたは熱安定性参照値より少なくとも8℃高ければ、Cas9分子/gRNA分子複合体は安定していると判定されてもよい。特定の実施形態では、参照分子は、gRNA分子の非存在下の参照Cas9分子であってもよい。特定の実施形態では、熱安定性値を測定するステップを含む方法は、本明細書に記載されるCas9分子/gRNA分子複合体の活性値を測定することを含むステップをさらに含んでなってもよい。
開示される実験結果に基づいて、本明細書では、Cas9/分子gRNA分子複合体の活性を測定するステップを含む方法もまた提供され、それは複合体の安定性を判定するのに有用であり得る。方法は、Cas9分子/gRNA分子複合体の安定性を判定する方法、安定なCas9分子/gRNA分子複合体を促進する条件を判定する方法、安定なCas9分子/gRNA分子複合体をスクリーニングする方法、安定なCas9分子/gRNA分子複合体を形成するのに最適なgRNAを同定する方法、対象に投与するためのCas9分子/gRNA分子複合体をスクリーニングする方法、および対象に投与するためのCas9分子/gRNA分子複合体を選択する方法をはじめとするが、これに限定されるものではない、Cas9/分子gRNA分子複合体の活性を測定するステップを含んでもよい。特定の実施形態では、Cas9分子/gRNA分子複合体の活性値が検出されてもよい。さらに、特定の実施形態では、参照分子の活性値が、検出されてもよい。特定の実施形態では、Cas9分子/gRNA分子複合体の活性値が、参照分子の活性値よりまたは活性参照値より高ければ、Cas9分子/gRNA分子複合体は安定していると判定されてもよい。特定の実施形態では、検出される活性は、結合活性であってもよい。特定の実施形態では、結合活性としては、gRNA分子がDNA標的にハイブリダイズしたまま留まる能力;gRNA分子がCas9分子/gRNA分子複合体のCas9分子に結合する能力またはgRNA分子がCas9分子/gRNA分子複合体のCas9分子に結合する能力が挙げられるが、これに限定されるものではない。特定の実施形態では、分子の結合値が測定されてもよい。特定の実施形態では、評価される分子の結合値が、参照分子の結合値より、または結合参照値より高ければ、Cas9分子/gRNA分子複合体は選択されてもよく、または安定していると判定されてもよい。特定の実施形態では、活性は、切断活性である。切断活性のいくつかの例としては、Cas9分子/gRNA分子複合体が標的を切断する能力、例えばHDRまたはNHEJなどの特定の経路によって分解されるCas9分子/gRNA分子複合体によって媒介される、切断事象の傾向Cas9分子/gRNA分子複合体が標的を調節する能力のいずれか1つまたは複数が挙げられるが、これに限定されるものではない。特定の実施形態では、Cas9分子/gRNA分子複合体の切断値が測定されてもよい。特定の実施形態では、Cas9分子/gRNA分子複合体の切断値が、参照分子の切断値よりまたは切断参照値より高ければ、Cas9分子/gRNA分子複合体は選択されてもよく、または安定していると判定されてもよい。
本明細書で開示される方法、であっ複数のサンプルで実施されてもよい。例えば、特定の実施形態では、方法は、Cas9分子と複数のgRNA分子の1つとを組み合わせることによって作製されるCas9分子/gRNA分子複合体を各サンプルが含んでなる、複数のサンプルを作製するステップを含んでなってもよい。特定の実施形態では、Cas9分子/gRNA分子複合体の熱安定性値および/または活性値は、複数のサンプルのそれぞれで検出されてもよい。特定の実施形態では、Cas9分子/gRNA分子複合体を含んでなる少なくとも1つのサンプルは、複数のサンプルから選択されてもよい。特定の実施形態では、Cas9分子/gRNA分子複合体を含んでなるサンプルが、(i)複数のサンプルのTと参照複合体のTとの、または所定の閾値Tとの比較、または(ii)複数のサンプルのT値の相対的な順序付けの1つまたは複数に基づいて選択されてもよい。
特定の実施形態では、方法は、Cas9分子と複数のgRNA分子の1つとを組み合わせることによって作製されるCas9分子/gRNA分子複合体をそれぞれが含んでなる、複数のCas9分子/gRNA分子複合体を作製するステップを含んでなってもよい。特定の実施形態では、Cas9分子/gRNA分子複合体の熱安定性値は、複数のCas9分子/gRNA分子複合体のそれぞれについて検出されてもよい。特定の実施形態では、Cas9分子/gRNA分子複合体の熱安定性値が、参照分子の熱安定性値よりまたは熱安定性参照値より高ければ、Cas9分子/gRNA分子複合体は安定していると判定されてもよい。特定の実施形態では、Cas9分子/gRNA分子複合体の活性値は、複数のCas9分子/gRNA分子複合体のそれぞれについて検出されてもよい。特定の実施形態では、Cas9分子/gRNA分子複合体の活性値が、参照分子の活性値よりまたは活性参照値より高れば、Cas9分子/gRNA分子複合体は安定していると判定されてもよい。
本明細書では、本明細書で開示される方法のいずれかを用いて作製される、非天然Cas9分子/gRNA分子複合体もまた、提供される。
本明細書では、本明細書に記載の方法を用いて作製されるCas9分子/gRNA分子複合体のいずれかを含んでなってもよい組成物が、提供される。例えば、本明細書の組成物は、本明細書で提供される方法に従って選択される、参照分子のTよりまたはT参照値より、少なくとも8℃高いTを有する、単離されたCas9分子およびgRNA分子の複合体を含んでなってもよい。
本明細書では、本明細書に記載の方法のいずれかを用いて作製される、Cas9分子/gRNA分子複合体をコードする核酸を含んでなるベクター系もまた、提供される。
本明細書では、本明細書に記載の方法のいずれかを用いて作製されるCas9分子/gRNA分子複合体を送達するステップを含んでなる、Cas9分子/gRNA分子複合体を標的細胞に送達する方法が提供される。
開示される実験結果に基づいて、本明細書では、Cas9分子/gRNA分子複合体またはその構成要素を評価、選択、最適化、または設計する方法が提供される。特定の実施形態では、これらの方法は、Cas9分子/gRNA分子複合体またはその調製物中のCas9分子の安定性値(すなわち、安定性と相関する値(例えば、熱安定性値または活性値))を取得するまたは判定するステップを含んでなる。特定の実施形態では、安定性値は、Cas9分子/gRNA分子複合体またはその調製物におけるCas9分子の熱安定性値または活性値であってもよい。特定の実施形態では、熱安定性値は、T価値または変性温度値であってもよく、特定の実施形態では、熱安定性値は、取得されまたはDSFを用いて判定される。特定の実施形態では、安定性値は、gRNA分子と複合体形成するCas9分子について取得される。その他の実施形態では、安定性値は、gRNA分子の存在下のCas9分子について取得される。特定の実施形態では、安定性値は、例えば、T参照値などの熱安定性参照値(すなわち、熱安定性と相関するパラメータ)または例えば、標的DNAを切断する能力のような切断活性などの活性参照値(すなわち、活性と相関するパラメータ)と比較される。例えば、安定性値がT値である場合、T値がT参照値と同一であるか、より高いか、またはそれ未満であるかどうかを判定するために、T値がT参照値と比較されてもよい。
特定の実施形態では、本明細書で開示される方法を用いて、例えば、最大安定性を有する、または所望の標的範囲内の安定性を有する対合形成などの、最適なCas9分子/gRNA対合形成が選択または設計される。特定の実施形態では、方法を用いて、例えば、最大安定性で特定のCas9分子と複合体形成するgRNA分子を同定するなど、特定のCas9分子との対合形成ための1つまたは複数のgRNAが選択または設計される。その他の実施形態では、方法を用いて、例えば、最大安定性で特定のgRNAと複合体形成するCas9分子を同定するなど、特定のgRNAとのまたはgRNAのセットとの対合形成のためのCas9分子が選択される。なおも別の実施形態では、方法を用いて、Cas9分子/gRNA分子複合体における対合形成のためのCas9分子とgRNAまたはgRNAのセットとの双方が選択される。
本明細書の特定の実施形態では、複合体中のCas9分子の安定性と相関する所望の値を示す、Cas9分子/gRNA複合体またはそれらの構成要素、ならびにこれらの複合体またはそれらの構成要素を含んでなる組成物および医薬製剤が提供される。特定の実施形態では、この値は、Tまたは変性温度であってもよく、特定の実施形態では、値は、取得されまたはDSFを用いて判定される。これらの実施形態のうちのあるものでは、複合体は、本明細書で提供される方法を用いて作製される。
本明細書の特定の実施形態では、熱安定性値を比較するステップを含んでなる方法が提供される。特定の実施形態では、方法は、熱安定性値を熱安定性参照値と比較するステップを含んでなる。特定の実施形態では、熱安定性参照値は、例えば、T値などの熱安定性の予め選択された数値などの、予め選択された数値を含んでなる(その中で値は、単一の値または範囲であり得る)。特定の実施形態では、熱安定性参照値は、a)gRNA分子の非存在下の、例えば、評価される複合体中のCas9分子と同じCas9分子(または異なるCas9分子)などの参照Cas9分子;b)第2のgRNA分子(すなわち、評価される複合体中のもの以外のgRNA)と複合体形成する、標準Cas9分子(例えば、評価される複合体中のCas9分子と同じCas9分子);またはc)参照Cas9分子/gRNA分子複合体の熱安定性と相関する値であってもよく、その中で参照Cas9分子/gRNA分子は、例えば、Cas9分子/gRNA分子複合体とは異なる比率のCas9分子およびgRNA分子などの異なる条件下で形成され、または異なる緩衝液中で形成された。
本明細書の特定の実施形態では、標準Cas9分子が提供される。特定の実施形態では、参照Cas9分子は、評価される複合体のCas9分子と同一であってもよい。特定の実施形態では、参照Cas9分子は、例えば、評価される複合体のCas9分子と一次配列が異なるなど、異なってもよい。特定の実施形態では、参照Cas9分子/gRNA分子複合体のgRNA分子は、評価される複合体のgRNA分子と同一であってもよい。特定の実施形態では、参照Cas9分子/gRNA分子複合体のgRNA分子は、例えば、配列が異なるまたは修飾のために異なるなど、gRNA分子と異なってもよい。
本明細書の特定の実施形態では、δ値(例えばδ値は2つの値の間の差またはシフトである)が取得され、例えば、判定されてもよい。特定の実施形態では、δ値は、評価されるCas9分子/gRNA分子複合体の安定性と、参照値との差と相関する値を含んでもよい。特定の実施形態では、δ値は、例えば、評価されるCas9分子/gRNA分子複合体の変性温度またはTと;例えば、参照Cas9分子/gRNA分子複合体の値などの参照値の変性温度またはTなどの安定性との安定性の差と相関する値を含んでもよい。
本明細書の特定の実施形態では、方法は、δ値をδ参照値(例えば、δ値の参照値)と比較するステップを含んでもよい。特定の実施形態では、これは、δ値がδ参照値以下;δ参照値以上;またはδ参照値の所定の範囲内であるかどうかを評価するステップを含んでもよい。
本明細書の特定の実施形態では、方法は、Cas9分子/gRNA分子複合体(またはその構成要素)を選択するステップを含んでもよい。特定の実施形態では、方法は、Cas9分子/gRNA分子複合体の値(例えば、熱安定性値(例えば、T値をはじめとするが、これに限定されるものではない)、活性値、またはδ値と、参照値との比較に基づいて、Cas9分子/gRNA分子複合体(またはその構成要素)を選択するステップを含んでもよい。特定の実施形態では、参照値は、これに限定されるものではないが、所定の閾値、上限値、目標値を含んでもよい。特定の実施形態では、値は、δ値であってもよい。特定の実施形態では、参照値は、δ参照値であってもよい。
特定の実施形態では、方法は、δ値がδ参照値以下;δ参照値以上;δ参照値の所定の範囲内であるかどうかを評価するステップを含んでもよい。
特定の実施形態では、方法はまた、選択されCas9分子/gRNA分子複合体(またはその構成要素)の活性または特性評価または測定するステップを含んでもよい。特定の実施形態では、活性は、例えば、切断する能力などの切断活性であってもよい。特定の実施形態において、活性は、成功裏に送達される能力であってもよい。特定の実施形態では、活性は、例えば、gRNA分子がDNA標的にハイブリダイズしたまま留まる能力などの結合活性であってもよい。
特定の実施形態では、評価するステップは、試験管内システム、生体外システム、または生体内システムなどのシステム内において、細胞アッセイなどのアッセイで、または細胞または動物モデルなどのモデルで、選択されたCas9分子/gRNA分子複合体(またはその構成要素)の活性を評価または測定するステップを含んでもよい。
特定の実施形態では、評価するステップは、選択されCas9分子/gRNA分子複合体(またはその構成要素)の活性を評価または測定するステップを含んでもよい。特定の実施形態では、活性は、インデルを誘導する能力;標的DNAを修飾する能力;Cas9分子/gRNA分子複合体によって触媒される切断事象を媒介するための例えば、本明細書に記載される経路など、例えば、HDRまたはNHEJなどの予め選択された修復方法の傾向などの切断活性であってもよい。特定の実施形態では、活性は、gRNA分子がDNA標的にハイブリダイズしたまま留まる能力などの結合活性であってもよい。
特定の実施形態では、方法は、活性についてCas9分子/gRNA分子複合体(またはその構成要素)を選択するステップを含んでもよい。例えば、活性は、インデルを誘導する能力;標的DNAを修飾する能力;Cas9分子/gRNA分子複合体によって触媒される切断事象を媒介するための例えば、本明細書に記載される経路など、例えば、HDRまたはNHEJなどの予め選択された修復方法の傾向などの切断活性であってもよい。特定の実施形態では、活性は、gRNA分子がDNA標的にハイブリダイズしたまま留まる能力などの結合活性であってもよい。
特定の実施形態では、方法は、活性についてCas9分子/gRNA分子複合体(またはその構成要素)を設計または最適化するステップを含んでもよい。例えば、活性は、インデルを誘導する能力;標的DNAを修飾する能力;Cas9分子/gRNA分子複合体によって触媒される切断事象を媒介するための例えば、本明細書に記載される経路など、例えば、HDRまたはNHEJなどの予め選択された修復方法の傾向などの切断活性であってもよい。特定の実施形態では、活性は、gRNA分子がDNA標的にハイブリダイズしたまま留まる能力などの結合活性であってもよい。
特定の実施形態では、方法は、少なくともX個のCas9分子/gRNA分子複合体のCas9分子の安定性を判定するステップを含んでもよい。特定の実施形態では、Xは、2、3、4、5、10、20、30、40、50、100、500、または1,000に等しくてもよい。特定の実施形態では、安定性を判定するステップは、Cas9分子の安定性値を測定するステップを含んでもよい。特定の実施形態では、安定性値は、熱安定性値であってもよい。特定の実施形態では、熱安定性値は、T値であってもよい。特定の実施形態では、T値は、DSFによって判定されてもよい。
特定の実施形態では、安定性を判定するステップは、例えば、T値を判定するなど、Cas9分子/gRNA分子複合体のCas9分子が変性する温度を判定するステップを含んでなってもよい。特定の実施形態では、T値は、DSFによって判定されてもよい。
特定の実施形態では、方法は、例えば、第1のCas9分子/gRNA分子複合体および第2のCas9分子/gRNA分子複合体について、T値を判定するなど、Cas9分子/gRNA分子複合体のCas9分子が変性する温度をDSFによって判定するステップを含んでなってもよい。
特定の実施形態では、少なくともX個のCas9分子/gRNA分子複合体の第1のCas9分子/gRNA分子複合体と、第2のCas9分子/gRNA分子複合体とは、異なる配列のCas9分子を有する;配列が異なる、または修飾、キャッピングまたはテーリングによって異なるgRNA分子を有する;例えば、異なる化学量論などの異なる条件下で形成されたことで異なる。
特定の実施形態では、例えば、送達が、RNPカチオン性脂質トランスフェクション、ウイルスベクター(例えば、AAV)、またはRNAトランスフェクションによる送達を含んでなる場合など、安定性の判定に応答して、最適化されたまたは予め選択された送達特性について、Cas9分子/gRNA分子複合体(またはその(there of)構成要素)が選択されてもよい。
特定の実施形態では、安定性の判定に応答して、品質管理基準との最適化されたまたは予め選択された関係について、Cas9分子/gRNA分子複合体(またはその(there of)構成要素)が選択される。
特定の実施形態では、Cas9分子/gRNA分子複合体(またはその構成要素)は、安定性の判定に応答して、品質管理または放出基準を満たすように選択されてもよい。
特定の実施形態では、例えば、T値または変性温度値、またはδ値などの熱安定性値が、参照値またはδ参照値との予め選択された関係性を有する場合に、本明細書の方法は、Cas9分子/gRNA分子複合体(またはその構成要素)を選択するステップを含んでなってもよい。
特定の実施形態では、Cas9分子/gRNA分子複合体(またはその構成要素)は、安定性の判定に応答して、例えば、切断特性などの最適化されたまたは予め選択された特性について選択される。
特定の実施形態では、Cas9分子/gRNA分子複合体の熱安定性値と、例えば、gRNA分子の非存在下のCas9分子などの参照分子の熱安定性値との間のδ値の評価に応答して、Cas9分子/gRNA分子複合体(またはその(there of)構成要素)が選択される。
特定の実施形態では、Cas9分子/gRNA分子複合体の活性値と、例えば、gRNA分子の非存在下のCas9分子などの参照分子の活性値との間のδ値の評価に応答して、Cas9分子/gRNA分子複合体(またはその(there of)構成要素)が選択される。
特定の実施形態では、本明細書の方法は、例えば、Cas9分子と複合体形成して、Cas9分子/候補gRNA分子複合体の安定性の判定に応答する、tracrRNA分子または配列のライブラリーなどの候補gRNA分子のライブラリー(または単一候補gRNA分子)を評価するステップと、例えば、候補tracrgRNA分子または配列などの候補gRNA分子または配列を選択するステップとを含んでなってもよい。
特定の実施形態では、ライブラリーは、例えば、異なる長さ、異なる配列などの異なる構造の、または例えば、追加的なリン酸基または代替5’キャップ構造を有するなどの異なる修飾を有する、tracrRNA分子または配列を含んでなってもよい。
特定の実施形態では、tracrRNA分子または配列は、キメラgRNA上に配置されてもよい。
特定の実施形態では、本明細書の方法は、構成要素を含んでなる調製物において、Cas9分子/gRNA分子複合体のCas9分子の安定性を評価するステップを含んでなる、Cas9分子/gRNA分子調製物への組み入れのために構成要素を評価するステップを含んでなってもよい。特定の実施形態では、構成要素は、添加剤、小分子、安定化試薬、緩衝液、pH、塩濃度、グリセロール濃度、またはその他の緩衝液成分を含んでなってもよい。
特定の実施形態では、本明細書の方法は、Cas9分子/gRNA分子複合体のCas9分子の安定性を評価するステップを含んでなる、Cas9分子/gRNA分子複合体への組み入れのために候補Cas9分子を評価するステップを含んでなってもよい。特定の実施形態では、候補Cas9分子は、例えば、1つの消去部分またはいくつかの消去部分を有するCas9分子などのキメラCas9分子、または合成または遺伝子操作Cas9分子を含んでなってもよい。
特定の実施形態では、安定性を判定するステップは、示差走査型蛍光定量法(DSF)によって、例えば、Cas9分子のTなど、Cas9分子/gRNA分子複合体のCas9分子が変性する温度を判定するステップを含んでなってもよい。
本明細書では、反応混合物が提供される。反応混合物は、例えば、本明細書に記載されるCas9分子/gRNA分子複合体などのCas9分子/gRNA分子複合体;および例えば、シグナル放出がCas9分子の変性に相関する、色素などのシグナル放出化合物を含んでなってもよい。
本明細書では、その中にCas9分子/gRNA分子複合体;および例えば、シグナル放出がCas9分子の変性に相関する、色素などのシグナル放出化合物が配置される、示差走査型蛍光光度計が提供される。
本明細書では、本明細書に記載の方法によって評価、選択、最適化、または設計される、Cas9分子/gRNA分子複合体が提供される。
本明細書では、本明細書に記載の方法によって選択または設計される、Cas9分子/gRNA分子複合体を含んでなる組成物が提供される。特定の実施形態では、組成物は、医薬組成物であってもよい。特定の実施形態では、Cas9分子/gRNA分子複合体は、薬学的に許容できる担体中に調合されてもよい。
本明細書で考察されるように、本明細書で開示される方法を用いて、製剤または送達のために最適化された複合体が評価、選択または設計されてもよい。例えば、本明細書に記載の方法は、RNPカチオン性脂質トランスフェクション、ウイルスベクター(例えば、AAV)、またはRNAトランスフェクションなどであるが、これに限定されるものではない、任意の送達方法を用いて、キメラgRNAまたはtracrRNAのCas9分子(例えば、Cas9タンパク質)との複合体形成を改善するために、複数の様式で用いられ得る。
本明細書で考察される方法は、品質管理のために、または放出基準がタンパク質構成要素およびRNA校正用をの両方について満たされているかどうかを判定するために、用いられ得る。例えば、例えば、Cas9タンパク質をRNAと共にインキュベートした際に熱シフトがないなど、熱シフトの基準が満たされなければ、不十分な品質のCas9分子またはagRNA分子が示唆される。一実施形態では、この方法は、例えば、不純物の検出および除去によって、このような問題に対処するための目安または工程管理として使用される。
本明細書に記載の方法は、Cas9/gRNA複合体において使用するための候補Cas9分子または候補gRNA分子ライブラリーを評価するために用いられ得る。一実施形態では、方法は、最適化結合のための構成要素を同定する。これにより、最適化された標的切断またはその他の特性のための候補のスクリーニングを可能にし得る。本明細書に記載の方法はまた、gRNAの長さおよび組成の修飾を評価するためにも用いられ得る。例えば、変異Cas9タンパク質を精製した後、gRNA分子(例えば、tracrRNA分子)または配列のライブラリーを、例えば、少なくとも1:1のRNA:タンパク質比の予め選択された比で、タンパク質と共にインキュベートし得る。gRNA分子の非存在下のCas9タンパク質と比較した際に観察される熱シフトの出現は、例えば、試験管内、生体外、または生体内で、1つまたは複数のCRISPR/Cas関連活性を媒介できるgRNA分子などの有効なgRNA分子の指標となる。
本明細書に記載の方法を用いて、異なるリンカー配列と融合したコグネイトガイド配列と組み合わされて、DSFを用いて結合についてアッセイされた、異なる長さのtracr領域を有する、gRNA分子(例えば、tracrRNA分子)または配列のライブラリーがスクリーニングされ得る。良好に結合した複合体は、生体外での切断活性についてスクリーニングされ得た。本明細書に記載の方法は、本明細書で考察される、切断に対する効果、送達適合性、またはその他の特徴について、RNAの化学修飾、追加的なリン酸基、または代案の5’キャップ構造を評価できるようにする。
本明細書に記載の方法を用いて、Cas9分子とgRNA分子との互作用安定化するための、添加剤、小分子安定化試薬、緩衝液、例えば塩モル濃度などの塩、グリセロール濃度、およびその他の緩衝液成分などの構成要素のライブラリーがスクリーニングされ得る。
本明細書に記載の方法を用いて、例えば、Cas9分子とgRNA分子との相互作用を安定化するためのキメラまたは遺伝子操作Cas9分子などのキメラ、遺伝子操作、または合成Cas9分子のライブラリーがスクリーニングされ得る。不十分な熱シフトは、RNA結合が最適以下であるか、または中断されたことの徴候である。部分的な熱熱シフトは、RNAが生産的に結合していることを暗示する。DSFTを有しないキメラまたは遺伝子操作Cas9分子では、gRNA分子(例えば、tracrRNA分子)または配列ライブラリーは、DSFによる測定で結合回復についてスクリーニングされ得る。
不活性と認識されたCas9分子は、例えば、ランダム化核酸ライブラリーなどの核酸分子ライブラリーに対する熱安定性アッセイにおいて用いられ得る。これにより、tracrRNAの役割を果たし得る新規分子のスクリーニングが可能になる。この新たに発見された核酸分子(例えば、tracrRNA分子)を用いて、侵入性生物およびウイルスに由来する、ゲノムDNA、生体内RNA、および/または遺伝物質を標的化する、新たなgRNAが開発され得る。
本明細書に記載の方法は、Cas9分子の任意の変異型およびキメラ型に適用され得る。本明細書に記載の方法は、例えば本明細書に記載の他のCas分子などのその他のCas分子にも適用され得ることも理解される。
ガイドRNA(gRNA)分子
gRNA分子は、本明細書での用法では、gRNA分子/Cas9分子複合体の標的核酸への特定の標的化または自動誘導を促進する核酸を指す。gRNA分子は、本明細書で「キメラ」gRNAと称されることもある単分子(単一RNA分子を有する)、またはモジュラー(2つ以上、典型的に2つの別々のRNA分子を含んでなる)であり得る。本明細書で提供されるgRNA分子は、標的核酸配列と完全にまたは部分的に相補的な核酸配列を含んでなる、それからなる、またはそれから本質的になる、標的化ドメインを含んでなる。特定の実施形態では、gRNA分子は、例えば、第1の相補的ドメイン、連結ドメイン、第2の相補的ドメイン、隣接ドメイン、尾部ドメインおよび/または5’伸長ドメインをはじめとする1つまたは複数の追加的なドメインをさらに含んでなる。これらのドメインのそれぞれは、以下で詳細に考察される。特定の実施形態では、gRNA分子中のドメインの1つまたは複数は、例えば、S.ピオゲネス(S.pyogenes)、S.アウレウス(S.aureus)、またはS.サーモフィルス(S.thermophilus)に由来する、天然の配列と同一でありまたは配列相同性を共有する、アミノ酸配列を含んでなる。
いくつかの例示的gRNA構造が、図1A〜1Iに提供される。gRNAの三次元形態、または活性型の鎖内または鎖間相互作用に関して、相補性の高い領域は、図1A〜1I中、および本明細書で提供されるその他の描写中で、二本鎖として示されることもある。図7は、tracrRNA由来領域に1つのヘアピンループを含有する配列番号42のgRNA配列を用いて、gRNAドメイン命名法を例証する。特定の実施形態では、gRNAは、この領域に2つ以上(例えば、2つ、3つ以上)のヘアピンループを含有してもよい(例えば、図1H〜1Iを参照されたい)。
特定の実施形態では、単分子gRNAまたはキメラgRNAは、好ましくは、5’から3’方向に、
標的核酸配列と完全にまたは部分的に相補的な核酸配列を含んでなる、それからなる、またはそれから本質的になる標的化ドメイン;
第1の相補的ドメイン;
連結ドメイン;
(第1の相補的ドメインと相補的な)第2の相補的ドメイン;
隣接ドメイン;および
任意選択的に、尾部ドメイン
を含んでなる。
特定の実施形態では、モジュラーgRNAは、
好ましくは、5’から3’方向に、
標的核酸配列と完全にまたは部分的に相補的な核酸配列を含んでなる、それからなる、またはそれから本質的になる標的化ドメイン;および
第1の相補的ドメイン
を含んでなる第1の鎖、および
好ましくは、5’から3’方向に、
任意選択的に、5’伸長ドメイン;
第2の相補的ドメイン;
隣接ドメイン;および
任意選択的に、尾部ドメイン
を含んでなる第2の鎖
を含んでなる。
標的化ドメイン
標的化ドメイン(時に、ガイド配列または相補性領域と称されることもある)は、標的核酸と相補的なまたは部分的に相補的な核酸配列を含んでなり、それからなり、またはそれから本質的になる。標的化ドメインの全部または一部が、それに対して相補的なまたはある程度相補的な核酸配列は、本明細書で標的ドメインと称される。標的化ドメインを選択する方法は、当該技術分野で公知である(例えば、Fu 2014;Sternberg 2014を参照されたい)。
標的ドメインを含んでなる標的核酸の鎖は、標的化ドメイン配列と相補的であることから、本明細書で相補鎖と称される。標的化ドメインはgRNA分子の一部であるため、それは塩基のチミン(T)でなくウラシル(U)を含み;反対に、gRNA分子をコードする任意のDNA分子は、ウラシルでなくチミンを含む。標的化ドメイン/標的ドメイン対において、標的化ドメイン中のウラシル塩基は、標的ドメイン中のアデニン塩基と対合する。特定の実施形態では、標的化ドメインと標的ドメインとの間の相補性の程度は、gRNA分子/Cas9分子複合体の標的核酸への標的化を可能にするのに十分である。
特定の実施形態では、標的化ドメインは、コアドメインおよび任意選択の二次ドメインを含んでなる。これらの実施形態のうちのあるものでは、コアドメインは二次ドメインの3’側に位置し、これらの実施形態のうちのあるものでは、コアドメインは標的化ドメインの3’末端またはその付近にある。これらの実施形態のうちのあるものでは、コアドメインは、標的化ドメインの3’末端の約8〜約13ヌクレオチドからなりまたはそれから本質的になる。特定の実施形態では、コアドメインのみが、標的ドメインの対応する部分と相補的または部分的に相補的であり、これらの実施形態のうちのあるものでは、コアドメインは、標的ドメインの対応する部分と完全に相補的である。その他の実施形態では、二次ドメインもまた、標的ドメインの一部と相補的または部分的に相補的である。特定の実施形態では、コアドメインは、標的ドメイン中のコアドメイン標的と相補的または部分的に相補的である一方で、二次ドメインは、標的ドメイン中の二次ドメイン標的と相補的または部分的に相補的である。特定の実施形態では、コアドメインおよび二次ドメインは、標的ドメインのそれぞれ対応する部分について、同程度の相補性を有する。その他の実施形態では、コアドメインとその標的の間の相補性程度、および二次ドメインとその標的の間の相補性程度は、異なってもよい。これらの実施形態のうちのあるものでは、コアドメインが二次ドメインより高度なその標的との相補性を有してもよい一方で、その他の実施形態では、二次ドメインがコアドメインより高度な相補性を有してもよい。
特定の実施形態では、標的化ドメインおよび/または標的化ドメイン内コアドメインは、3〜100、5〜100、10〜100、または20〜100ヌクレオチド長であり、これらの実施形態のうちのあるものでは、標的化ドメインまたはコアドメインは3〜15、3〜20、5〜20、10〜20、15〜20、5〜50、10〜50、または20〜50ヌクレオチド長である。特定の実施形態では、標的化ドメインおよび/または標的化ドメイン内コアドメインは、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、または26ヌクレオチド長である。特定の実施形態では、標的化ドメインおよび/または標的化ドメイン内コアドメインは、6+/−2、7+/−2、8+/−2、9+/−2、10+/−2、10+/−4、10+/−5、11+/−2、12+/−2、13+/−2、14+/−2、15+/−2、または16+−2、20+/−5、30+/−5、40+/−5、50+/−5、60+/−5、70+/−5、80+/−5、90+/−5、または100+/−5ヌクレオチド長である。
標的化ドメインがコアドメインを含む特定の実施形態では、コアドメインは、3〜20ヌクレオチド長であり、これらの実施形態のうちのあるものでは、コアドメインは、5〜15または8〜13ヌクレオチド長である。標的化ドメインが二次ドメインを含む特定の実施形態では、二次ドメインは、0、1、2、3、4、5、6、7、8、9、10、11、12、13、14または15ヌクレオチド長である。標的化ドメインが8〜13ヌクレオチド長のコアドメインを含んでなる特定の実施形態では、それぞれ、標的化ドメインは、26、25、24、23、22、21、20、19、18、17、または16ヌクレオチド長であり、二次ドメインは、13〜18、12〜17、11〜16、10〜15、9〜14、8〜13、7〜12、6〜11、5〜10、4〜9、または3〜8ヌクレオチド長である。
特定の実施形態では、標的化ドメインは、標的ドメインと完全に相補的である。同様に、標的化ドメインが、コアドメインおよび/または二次ドメインを含んでなる特定の実施形態では、コアドメインおよび二次ドメインの片方または双方が、標的ドメインの対応する部分と完全に相補的である。その他の実施形態では、標的化ドメインは標的ドメインと部分的に相補的であり、標的化ドメインがコアドメインおよび/または二次ドメインを含んでなる実施形態のいくつかでは、コアドメインおよび二次ドメインの片方または双方が、標的ドメインの対応する部分と部分的に相補的である。これらの実施形態のうちのあるものでは、標的化ドメイン、または標的化ドメイン内のコアドメインまたは標的化ドメインの核酸配列は、標的ドメインとまたは標的ドメインの対応する部分と、少なくとも80、85、90、または95%相補的である。特定の実施形態では、標的化ドメインおよび/または標的化ドメイン内コアドメインまたは二次ドメインは、標的ドメインまたはその一部と相補的でない1つまたは複数のヌクレオチドを含み、これらの実施形態のうちのあるものでは、標的化ドメインおよび/または標的化ドメイン内コアドメインまたは二次ドメインは、標的ドメインと相補的でない1、2、3、4、5、6、7、または8ヌクレオチドを含む。特定の実施形態では、コアドメインは、標的ドメインの対応する部分と相補的でない1、2、3、4、または5ヌクレオチドを含む。標的化ドメインが、標的ドメインと相補的でない1つまたは複数のヌクレオチドを含む特定の実施形態では、前記非相補的ヌクレオチドの1つまたは複数は、標的化ドメインの5’または3’末端の5ヌクレオチド以内に位置する。これらの実施形態のうちのあるものでは、標的化ドメインは、その5’末端、3’末端、またはその5’および3’末端の双方の5ヌクレオチド以内に、標的ドメインと相補的でない1、2、3、4、または5ヌクレオチドを含む。標的ドメインが標的ドメインと相補的でない2つ以上のヌクレオチドを含む特定の実施形態では、2つ以上の前記非相補的ヌクレオチドは互いに隣接し、これらの実施形態のあるものでは、2つ以上の連続的非相補的ヌクレオチドは、標的化ドメインの5’または3’末端の5ヌクレオチド以内に位置する。その他の実施形態では、2つ以上の連続的非相補的ヌクレオチドは、どちらも標的化ドメインの5’または3’末端から5ヌクレオチドを超えて位置する。
特定の実施形態では、標的化ドメイン、コアドメイン、および/または二次ドメインは、いかなる修飾も含まない。その他の実施形態では、標的化ドメイン、コアドメイン、および/または二次ドメイン、またはその中の1つまたは複数のヌクレオチドは下記の修飾をはじめとするが、これに限定されるものではない修飾を有する。特定の実施形態では、標的化ドメイン、コアドメイン、および/または二次ドメインの1つまたは複数のヌクレオチドは、例えば、2’メチル化など、例えば、2−アセチル化などの2’修飾(例えば、リボース上の2’位の修飾)を含んでなってもよい。特定の実施形態では、標的化ドメインの骨格は、ホスホロチオエートで修飾され得る。特定の実施形態では、標的化ドメイン、コアドメイン、および/または二次ドメインの1つまたは複数のヌクレオチドの修飾は、標的化ドメインおよび/または標的化ドメインを含むgRNAを分解されにくくして、例えば、より低い免疫原性など、より生体適合性にする。特定の実施形態では、標的化ドメインおよび/またはコアドメインまたは二次ドメインは、1、2、3、4、5、6、7、または8つ以上の修飾を含み、これらの実施形態のうちのあるものでは、標的化ドメインおよび/またはコアドメインまたは二次ドメインは、それらの各5’末端の5ヌクレオチド以内に、1、2、3、または4つの修飾を含み、および/または3’末端の5ヌクレオチド以内に、1、2、3、または4つの修飾を含む。特定の実施形態では、標的化ドメインおよび/またはコアドメインまたは二次ドメインは、2つ以上の連続ヌクレオチドに修飾を含んでなる。
標的化ドメインがコアドメインおよび二次ドメインを含む特定の実施形態では、コアドメインおよび二次ドメインは同数の修飾を含有する。これらの実施形態のうちのあるものでは、どちらのドメインも修飾を含まない。その他の実施形態では、コアドメインは、二次ドメインより多くの修飾を含み、もしくは逆もまた然りである。
特定の実施形態では、コアドメインまたは二次ドメインをはじめとする標的化ドメイン内の1つまたは複数のヌクレオチド修飾は、下記のシステムを用いて候補修飾を試験することで評価され得る標的化効率に、干渉しないように選択される。gRNAは、下記のシステムを用いて評価され得る、選択された長さ、配列、相補性の程度、または修飾の程度を有する、候補標的化ドメインを有する。候補標的化ドメインは、選択された標的について機能的であることが知られているgRNA分子/Cas9分子システム中に、単独で配置され、または1つまたは複数のその他の候補変化と共に配置されて、評価され得る。
特定の実施形態では、全ての修飾ヌクレオチドは、標的ドメイン中に存在する対応するヌクレオチドと相補的であり、ハイブリダイズできる。別の実施形態では、1、2、3、4、5、6、7または8つ以上の修飾ヌクレオチドは、標的ドメイン中に存在する対応するヌクレオチドと相補的でなくまたはハイブリダイズできない。
図1A〜1Iは、gRNA分子内の標的化ドメイン配置の例を提供する。
第1および第2の相補的ドメイン
第1および第2の相補性(あるいは、それぞれcrRNA由来ヘアピン配列およびtracrRNA由来ヘアピン配列と称されることもある)ドメインは、完全にまたは部分的に互いに相補的である。特定の実施形態では、相補性程度は、少なくともいくつかの生理的条件において、2つのドメインが二本鎖領域を形成するのに十分である。モジュラーgRNA分子中では、相補的ドメインのハイブリダイゼーションによって、2つの分子が結合される(例えば、図1Aを参照されたい)。特定の実施形態では、第1と第2の相補的ドメインとの間の相補性の程度は、gRNAのその他の特性と共に、Cas9分子の標的核酸への標的化を可能にするのに十分である。第1および第2の相補的ドメインの例は、図1A〜1Gに記載される。
特定の実施形態では(例えば、図1A〜1Bを参照されたい)、第1および/または第2の相補的ドメインは、対応する相補的ドメインとの相補性を欠く1つまたは複数のヌクレオチドを含む。特定の実施形態では、第1および/または第2の相補的ドメインは、対応する相補的ドメインを補完しない、1、2、3、4、5、または6ヌクレオチドを含む。例えば、第2の相補的ドメインは、第1の相補的ドメイン中の対応するヌクレオチドと対合しない、1、2、3、4、5、または6ヌクレオチドを含有してもよい。特定の実施形態では、対応する相補的ドメインを補完しない、第1または第2の相補的ドメイン上のヌクレオチドは、第1および第2の相補的ドメイン間に形成される二本鎖からループアウトする。これらの実施形態のうちのあるものでは、不対ループアウトは第2の相補的ドメイン上に位置し、これらの実施形態のうちのあるものでは、不対領域は、第2の相補的ドメインの5’末端から1、2、3、4、5、または6ヌクレオチドで始まる。
特定の実施形態では、第1の相補的ドメインは、5〜30、5〜25、7〜25、5〜24、5〜23、7〜22、5〜22、5〜21、5〜20、7〜18、7〜15、9〜16、または10〜14ヌクレオチド長であり、これらの実施形態のうちのあるものでは第1の相補的ドメインは、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、または25ヌクレオチド長である。特定の実施形態では、第2の相補的ドメインは、5〜27、7〜27、7〜25、5〜24、5〜23、5〜22、5〜21、7〜20、5〜20、7〜18、7〜17、9〜16、または10〜14ヌクレオチド長であり、これらの実施形態のうちのあるものでは、第2の相補的ドメインは、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、または26ヌクレオチド長である。特定の実施形態では、第1および第2の相補的ドメインは、それぞれ独立して6+/−2、7+/−2、8+/−2、9+/−2、10+/−2、11+/−2、12+/−2、13+/−2、14+/−2、15+/−2、16+/−2、17+/−2、18+/−2、19+/−2、または20+/−2、21+/−2、22+/−2、23+/−2、または24+/−2ヌクレオチド長である。特定の実施形態では、第2の相補的ドメインは第1の相補的ドメインより長く、例えば、2、3、4、5、または6ヌクレオチド長い。
特定の実施形態では、第1および/または第2の相補的ドメインは、それぞれ独立して、5’から3’方向に向けて、5’サブドメイン、中心サブドメイン、および3’サブドメインの3つのサブドメインを含んでなる。特定の実施形態では、第1の相補的ドメインの5’サブドメインおよび3’サブドメインは、それぞれ、第2の相補的ドメインの3’サブドメインおよび5’サブドメインと完全にまたは部分的に相補的である。
特定の実施形態では、第1の相補的ドメインの5’サブドメインは、4〜9ヌクレオチド長であり、これらの実施形態のうちのあるものでは、5’ドメインは4、5、6、7、8、または9ヌクレオチド長である。特定の実施形態では、第2の相補的ドメインの5’サブドメインは、3〜25、4〜22、4〜18、または4〜10ヌクレオチド長であり、これらの実施形態のうちのあるものでは、5’ドメインは、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、または25ヌクレオチド長である。特定の実施形態では、第1の相補的ドメインの中心サブドメインは、1、2、または3ヌクレオチド長である。特定の実施形態では、第2の相補的ドメインの中心サブドメインは、1、2、3、4、または5ヌクレオチド長である。特定の実施形態では、第1の相補的ドメインの3’サブドメインは、3〜25、4〜22、4〜18、または4〜10ヌクレオチド長であり、これらの実施形態のうちのあるものでは、3’サブドメインは、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、または25ヌクレオチド長である。特定の実施形態では、第2の相補的ドメインの3’サブドメインは、例えば、4、5、6、7、8、または9など、4〜9ヌクレオチド長である。
第1および/または第2の相補的ドメインは、天然または参照の第1および/または第2の相補的ドメインと相同性を共有し得て、またはそれに由来し得る。これらの実施形態のうちのあるものでは、第1および/または第2の相補的ドメインは、天然または参照の第1および/または第2の相補的ドメインと、少なくとも50%、60%、70%、80%、85%、90%、または95%の相同性を有し、または1、2、3、4、5、または6ヌクレオチド以下が異なる。これらの実施形態のうちのあるものでは、第1および/または第2の相補的ドメインは、S.ピオゲネス(S.pyogenes)またはS.アウレウス(S.aureus)に由来する第1および/または第2の相補的ドメインと、少なくとも50%、60%、70%、80%、85%、90%、または95%の相同性を(homology with homology with)有してもよい。
特定の実施形態では、第1および/または第2の相補的ドメインは、いかなる修飾も含まない。その他の実施形態では、第1および/または第2の相補的ドメインまたはその中の1つまたは複数のヌクレオチドは、下記の修飾をはじめとするが、これに限定されるものではない修飾を有する。特定の実施形態では、第1および/または第2の相補的ドメインの1つまたは複数のヌクレオチドは、例えば、2’メチル化など、例えば、2−アセチル化などの2’修飾(例えば、リボース上の2’位の修飾)を含んでなってもよい。特定の実施形態では、標的化ドメインの骨格は、ホスホロチオエートで修飾され得る。特定の実施形態では、第1および/または第2の相補的ドメインの1つまたは複数のヌクレオチドの修飾は、第1および/または第2の相補的ドメインおよび/または第1および/または第2の相補性を含んでなるgRNAを分解されにくくして、または例えば、より低い免疫原性など、より生体適合性にする。特定の実施形態では、第1および/または第2の相補的ドメインは、それぞれ独立して、1、2、3、4、5、6、7、または8つ以上の修飾を含み、これらの実施形態のうちのあるものでは、第1および/または第2の相補的ドメインは、それぞれ独立して、それらの各5’末端、3’末端、またはそれらの5’および3’末端の双方の5ヌクレオチド以内に、1、2、3、または4つの修飾を含む。その他の実施形態では、第1および/または第2の相補的ドメインは、それぞれ独立して、それらの各5’末端、3’末端、またはそれらの5’および3’末端の双方の5ヌクレオチド内に修飾を含有しない。特定の実施形態では、第1および第2の相補的ドメインの片方または双方は、2つ以上連続ヌクレオチドに修飾を含んでなる。
特定の実施形態では、第1および/または第2の相補的ドメイン中の1つまたは複数のヌクレオチドの修飾は、下記のシステムにおいて候補修飾を試験することで評価され得る標的化効率に、干渉しないように選択される。gRNAは、下記のシステムを用いて評価され得る、選択された長さ、配列、相補性の程度、または修飾の程度を有する、候補第1または第2のドメインを有する。候補相補的ドメインは、選択された標的について機能的であることが知られているgRNA分子/Cas9分子システム中に、単独で配置され、または1つまたは複数のその他の候補変化と共に配置されて、評価され得る。
特定の実施形態では、第1および第2の相補的ドメインによって形成される二重鎖領域は、あらゆるループアウトまたは不対ヌクレオチドを除いて、例えば、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、または22塩基対長である。
特定の実施形態では、第1および第2の相補的ドメインは、二重鎖化に際し、11個の対合ヌクレオチドを含んでなる(例えば、配列番号48のgRNAを参照されたい)。特定の実施形態では、第1および第2の相補的ドメインは、二重鎖化に際し、15個の対合ヌクレオチドを含んでなる(例えば、配列番号50のgRNAを参照されたい)。特定の実施形態では、第1および第2の相補的ドメインは、二重鎖化に際し、16個の対合ヌクレオチドを含んでなる(例えば、配列番号51のgRNAを参照されたい)。特定の実施形態では、第1および第2の相補的ドメインは、二重鎖化に際し、21個の対合ヌクレオチドを含んでなる(例えば、配列番号29のgRNAを参照されたい)。
特定の実施形態では、1つまたは複数のヌクレオチドは、第1および第2の相補的ドメインの間で交換されて、ポリU配列が除去される。例えば、配列番号48のgRNAのヌクレオチド23および48またはヌクレオチド26および45が交換されて、それぞれ配列番号49または31のgRNAが作製されてもよい。同様に、配列番号29のgRNAのヌクレオチド23および39が、ヌクレオチド50および68で交換されて、配列番号30のgRNAが作製されてもよい。
連結ドメイン
連結ドメインは、第1および第2の相補的ドメインの間に配置されて、それらを連結して単分子またはキメラgRNAにするのに役立つ。図1B〜1Eは、連結ドメインの例を提供する。特定の実施形態では、連結ドメインの一部はcrRNA由来領域に由来して、別の部分はtracrRNA由来領域に由来する。
特定の実施形態では、連結ドメインは、第1および第2の相補的ドメインを共有結合的に連結する。これらの実施形態のうちのあるものでは、連結ドメインは、共有結合からなり、またはそれを含んでなる。その他の実施形態では、連結ドメインは、第1および第2の相補的ドメインを非共有結合的に連結する。特定の実施形態では、連結ドメインは、例えば、1、2、3、4、5、6、7、8、9、または10ヌクレオチドなどの10以下のヌクレオチド長である。その他の実施形態では、連結ドメインは、例えば、11、12、13、14、15、16、17、18、19、20、21、22、23、24、または25以上など、10を超えるヌクレオチド長である。特定の実施形態では、連結ドメインは、2〜50、2〜40、2〜30、2〜20、2〜10、2〜5、10〜100、10〜90、10〜80、10〜70、10〜60、10〜50、10〜40、10〜30、10〜20、10〜15、20〜100、20〜90、20〜80、20〜70、20〜60、20〜50、20〜40、20〜30、または20〜25ヌクレオチド長である。特定の実施形態では、連結ドメインは、10+/−5、20+/−5、20+/−10、30+/−5、30+/−10、40+/−5、40+/−10、50+/−5、50+/−10、60+/−5、60+/−10、70+/−5、70+/−10、80+/−5、80+/−10、90+/−5、90+/−10、100+/−5、または100+/−10ヌクレオチド長である。
特定の実施形態では、連結ドメインは、例えば、第2の相補的ドメインに対して5’側であるtracrRNAの配列などの天然配列と相同性を共有し、またはそれに由来する。特定の実施形態では、連結ドメインは、例えば、図1B〜1Eの連結ドメインなどの本明細書で開示される連結ドメインと、少なくとも50%、60%、70%、80%、90%、または95%の相同性を有し、または1、2、3、4、5、または6ヌクレオチド以下が異なる。
特定の実施形態では、連結ドメインは、いかなる修飾も含まない。その他の実施形態では、連結ドメインまたはその中の1つまたは複数のヌクレオチドは、下記の修飾をはじめとするが、これに限定されるものではない修飾を有する。特定の実施形態では、連結ドメインの1つまたは複数のヌクレオチドは、例えば、2’メチル化など、例えば、2−アセチル化などの2’修飾(例えば、リボース上の2’位の修飾)を含んでなってもよい。特定の実施形態では、連結ドメインの骨格は、ホスホロチオエートで修飾され得る。特定の実施形態では、連結ドメインの1つまたは複数のヌクレオチドの修飾は、連結ドメインおよび/または連結ドメインを含んでなるgRNAを分解されにくくして、または例えば、より低い免疫原性など、より生体適合性にする。特定の実施形態では、連結ドメインは、1、2、3、4、5、6、7、または8つ以上の修飾を含み、これらの実施形態のうちのあるものでは連結ドメインは、その5’および/または3’末端の5ヌクレオチド以内に、1、2、3、または4つの修飾を含む。特定の実施形態では、連結ドメインは、2つ以上の連続ヌクレオチドに修飾を含んでなる。
特定の実施形態では、連結ドメイン中の1つまたは複数のヌクレオチドの修飾は、下記のシステムを用いて候補修飾を試験することで評価され得る標的化効率に、干渉しないように選択される。gRNAは、下記のシステムにおいて評価され得る、選択された長さ、配列、相補性の程度、または修飾の程度を有する、候補連結ドメインを有する。候補連結ドメインは、選択された標的について機能的であることが知られているgRNA分子/Cas9分子システム中に、単独で配置され、または1つまたは複数のその他の候補変化と共に配置されて、評価され得る。
特定の実施形態では、連結ドメインは、典型的に、第1の相補的ドメインの3’末端、および/または第2の相補的ドメインの5−末端に隣接する、またはそれから1、2、または3ヌクレオチド以内である、二重鎖領域を含んでなる。これらの実施形態のうちのあるものでは、連結領域の二重鎖領域は、10+/−5、15+/−5、20+/−5、20+/−10、または30+/−5塩基対長である。特定の実施形態では、連結ドメインの二重鎖領域は、1、2、3、4、5、6、7、8、9、10、11、12、13、14、または15塩基対長である。特定の実施形態では、連結ドメインの二本鎖領域を形成する配列は、完全に相補的である。その他の実施形態では、二本鎖領域を形成する配列の片方または双方は、他方の二本鎖配列と相補的でない、1つまたは複数のヌクレオチド(例えば、1、2、3、4、5、6、7、または8ヌクレオチド)を含有する。
5’伸長ドメイン
特定の実施形態では、本明細書で開示されるようなモジュラーgRNAは、5’伸長ドメイン、すなわち、第2の相補的ドメインの5’側の1つまたは複数の追加的なヌクレオチドを含んでなる(例えば、図1Aを参照されたい)。特定の実施形態では、5’伸長ドメインは、2〜10以上、2〜9、2〜8、2〜7、2〜6、2〜5、または2〜4ヌクレオチド長であり、これらの実施形態のうちのあるものでは、5’伸長ドメインは、2、3、4、5、6、7、8、9、または10ヌクレオチド長以上である。
特定の実施形態では、5’伸長ドメインヌクレオチドは、例えば、以下で提供されるタイプの修飾などの修飾を含まない。しかし、特定の実施形態では、5’伸長ドメインは、例えば、分解の影響を受けにくくする、または例えば、より低い免疫原性などより生体適合性にする修飾などの1つまたは複数の修飾を含んでなる。一例として、5’伸長ドメインの骨格は、ホスホロチオエートで、または以下に記載されるその他の修飾で、修飾され得る。特定の実施形態では、5’伸長ドメインのヌクレオチドは、例えば、2−アセチル化、例えば、2’メチル化、または以下に記載されるその他の修飾などの2’修飾(例えば、リボース上の2’位における修飾)を含んでなり得る。
特定の実施形態では、5’伸長ドメインは、1、2、3、4、5、6、7または8程度の数の修飾を含んでなり得る。特定の実施形態では、5’伸長ドメインは、例えば、モジュラーgRNA分子中などのその5’末端の5ヌクレオチド以内に、1、2、3、または4程度の数の修飾を含んでなる。特定の実施形態では、5’伸長ドメインは、例えば、モジュラーgRNA分子中などのその3’末端の5ヌクレオチド以内に、1、2、3、または4程度の数の修飾を含んでなる。
特定の実施形態では、5’伸長ドメインは、例えば、5’伸長ドメインの5’末端の5ヌクレオチド以内にあり、5’伸長ドメインの3’末端の5ヌクレオチド以内にあり、または5’伸長ドメインの片方または双方の末端から5ヌクレオチドを超えて離れた2連続ヌクレオチドなどの2連続ヌクレオチドに、修飾を含んでなる。特定の実施形態では、5’伸長ドメインの5’末端の5ヌクレオチド以内にあり、5’伸長ドメインの3’末端の5ヌクレオチド以内にあり、または5’伸長ドメインの片方または双方の末端から5ヌクレオチドを超えて離れた2連続ヌクレオチドは、修飾されていない。特定の実施形態では、5’伸長ドメインの5’末端の5ヌクレオチド以内にあり、5’伸長ドメインの3’末端の5ヌクレオチド以内にあり、または5’伸長ドメインの片方または双方の末端から5ヌクレオチドを超えて離れたクレオチドは、修飾されていない。
5’伸長ドメイン中の修飾は、以下に記載されるシステム中で候補修飾を試験することで評価されるgRNA分子効率を妨げないように、選択され得る。選択された長さ、配列、相補性程度、または修飾程度を有する候補5’伸長ドメインを有するgRNAは、以下に記載されるシステム中で評価され得る。候補5’伸長ドメインは、選択された標的について機能的であることが知られているgRNA分子/Cas9分子システム中に、単独で配置され、または1つまたは複数のその他の候補変化と共に配置されて、評価され得る。
特定の実施形態では、5’伸長ドメインは、例えば、S.ピオゲネス(S.pyogenes)、またはS.サーモフィルス(S.thermophilus)などの天然起源の5’伸長ドメインと、例えば、図1A〜1Gで本明細書に記載される5’伸長ドメインなどの参照5’伸長ドメインと、少なくとも60、70、80、85、90または95%の相同性を有し、またはそれと1、2、3、4、5、または6個以下のヌクレオチドが異なる。
隣接ドメイン
図1A〜1Gは、隣接ドメインの例を提供する。
特定の実施形態では、隣接ドメインは、例えば、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、または26ヌクレオチド長など、5〜20ヌクレオチド長以上である。これらの実施形態のうちのあるものでは、隣接ドメインは、6+/−2、7+/−2、8+/−2、9+/−2、10+/−2、11+/−2、12+/−2、13+/−2、14+/−2、14+/−2、16+/−2、17+/−2、18+/−2、19+/−2、または20+/−2ヌクレオチド長である。特定の実施形態では、隣接ドメインは、5〜20、7〜18、9〜16、または10〜14ヌクレオチド長である。
特定の実施形態では、隣接ドメインは、天然隣接ドメインと相同性を共有し、またはそれに由来し得る。これらの実施形態のうちのあるものでは、隣接ドメインは、例えば、図1A〜1Gに記載されるものをはじめとする、S.ピオゲネス(S.pyogenes)、S.アウレウス(S.aureus)、またはS.サーモフィルス(S.thermophilus)隣接ドメインなどの本明細書で開示される隣接ドメインと、少なくとも50%、60%、70%、80%、85%、90%、または95%の相同性を有し、または1、2、3、4、5、または6ヌクレオチド以下が異なる。
特定の実施形態では、隣接ドメインはいかなる修飾も含まない。その他の実施形態では、隣接ドメインまたはその中の1つまたは複数のヌクレオチドは、本明細書に記載される修飾をはじめとするが、これに限定されるものではない修飾を有する。特定の実施形態では、隣接ドメインの1つまたは複数のヌクレオチドは、例えば、2’メチル化など、例えば、2−アセチル化などの2’修飾(例えば、リボース上の2’位の修飾)を含んでなってもよい。特定の実施形態では、隣接ドメインの骨格は、ホスホロチオエートで修飾され得る。特定の実施形態では、隣接ドメインの1つまたは複数のヌクレオチドの修飾は、隣接ドメインおよび/または隣接ドメインを含んでなるgRNAを分解されにくくして、または例えば、より低い免疫原性など、より生体適合性にする。特定の実施形態では、隣接ドメインは、1、2、3、4、5、6、7、または8つ以上の修飾を含み、これらの実施形態のうちのあるものでは隣接ドメインは、その5’および/または3’末端の5ヌクレオチド以内に、1、2、3、または4つの修飾を含む。特定の実施形態では、隣接ドメインは、2つ以上の連続ヌクレオチドに修飾を含んでなる。
特定の実施形態では、隣接ドメイン中の1つまたは複数のヌクレオチドの修飾は、下記のシステムにおいて候補修飾を試験することで評価され得る標的化効率に、干渉しないように選択される。gRNAは、下記のシステムにおいて評価され得る、選択された長さ、配列、相補性の程度、または修飾の程度を有する、候補隣接ドメインを有する。候補隣接ドメインは、選択された標的について機能的であることが知られているgRNA分子/Cas9分子システム中に、単独で配置され、または1つまたは複数のその他の候補変化と共に配置されて、評価され得る。
尾部ドメイン
広範囲の尾部ドメインが、本明細書で開示されるgRNA分子で使用するのに適する。図1Aおよび1C〜1Gは、このような尾部ドメインの例を提供する。
特定の実施形態では、尾部ドメインは存在しない。その他の実施形態では、尾部ドメインは、例えば、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、または100ヌクレオチド長など、1〜100ヌクレオチド長以上である。特定の実施形態では、尾部ドメインは、1〜5、1〜10、1〜15、1〜20、1〜50、10〜100、20〜100、10〜90、20〜90、10〜80、20〜80、10〜70、20〜70、10〜60、20〜60、10〜50、20〜50、10〜40、20〜40、10〜30、20〜30、20〜25、10〜20、または10〜15ヌクレオチド長である。特定の実施形態では、尾部ドメインは、5+/−5、10+/−5、20+/−10、20+/−5、25+/−10、30+/−10、30+/−5、40+/−10、40+/−5、50+/−10、50+/−5、60+/−10、60+/−5、70+/−10、70+/−5、80+/−10、80+/−5、90+/−10、90+/−5、100+/−10、または100+/−5ヌクレオチド長である。
特定の実施形態では、尾部ドメインは、天然尾部ドメインまたは天然尾部ドメイン5’末端と相同性を共有し得て、またはそれに由来し得る。これらの実施形態のうちのあるものでは、隣接ドメインは、例えば、図1Aおよび1C〜1Gに記載されるものをはじめとする、S.ピオゲネス(S.pyogenes)、S.アウレウス(S.aureus)、またはS.サーモフィルス(S.thermophilus)隣接ドメインなどの本明細書で開示される天然尾部ドメインと、少なくとも50%、60%、70%、80%、85%、90%、または95%の相同性を有し、または1、2、3、4、5、または6ヌクレオチド以下が異なる。
特定の実施形態では、尾部ドメインは、互いに相補的で、少なくともいくつかの生理的条件下では、二重鎖領域を形成する配列を含む。これらの実施形態のうちのあるものでは、尾部ドメインは、尾部二重鎖領域を形成し得る尾部二本鎖ドメインを含んでなる。特定の実施形態では、尾部二重鎖領域は、3、4、5、6、7、8、9、10、11、または12塩基対長である。特定の実施形態では、尾部ドメインは、二本鎖を形成しない尾部二本鎖ドメインの3’側の一本鎖ドメインを含んでなる。これらの実施形態のうちのあるものでは、一本鎖ドメインは、例えば、3、4、5、6、7、8、9、10、または4〜6ヌクレオチド長など、3〜10ヌクレオチド長である。
特定の実施形態では、尾部ドメインはいかなる修飾も含まない。その他の実施形態では、尾部ドメインまたはその中の1つまたは複数のヌクレオチドは、本明細書に記載される修飾をはじめとするが、これに限定されるものではない修飾を有する。特定の実施形態では、尾部ドメインの1つまたは複数のヌクレオチドは、例えば、2’メチル化など、例えば、2−アセチル化などの2’修飾(例えば、リボース上の2’位の修飾)を含んでなってもよい。特定の実施形態では、尾部ドメインの骨格は、ホスホロチオエートで修飾され得る。特定の実施形態では、尾部ドメインの1つまたは複数のヌクレオチドの修飾は、尾部ドメインおよび/または尾部ドメインを含んでなるgRNAを分解されにくくして、または例えば、より低い免疫原性など、より生体適合性にする。特定の実施形態では、尾部ドメインは、1、2、3、4、5、6、7、または8つ以上の修飾を含み、これらの実施形態のうちのあるものでは尾部ドメインは、その5’および/または3’末端の5ヌクレオチド以内に、1、2、3、または4つの修飾を含む。特定の実施形態では、尾部ドメインは、2つ以上の連続ヌクレオチドに修飾を含んでなる。
特定の実施形態では、尾部ドメイン中の1つまたは複数のヌクレオチドの修飾は、下記のように候補修飾を試験することで評価され得る標的化効率に、干渉しないように選択される。gRNAは、下記のシステムを用いて評価され得る、選択された長さ、配列、相補性の程度、または修飾の程度を有する、候補尾部ドメインを有する。候補尾部ドメインは、選択された標的について機能的であることが知られているgRNA分子/Cas9分子システム中に、単独で配置され、または1つまたは複数のその他の候補変化と共に配置されて、評価され得る。
特定の実施形態では、尾部ドメインは、生体外または生体内転写法に関連する、3’末端のヌクレオチドを含む。T7プロモーターがgRNAの生体外転写に使用される場合、これらのヌクレオチドは、DNA鋳型の3’末端の前に存在する、任意のヌクレオチドであってもよい。U6プロモーターが生体内転写に使用される場合、これらのヌクレオチドはUUUUUU配列であってもよい。H1プロモーターが転写に使用される場合、これらのヌクレオチドはUUUU配列であってもよい。代替のpol−IIIプロモーターが使用される場合、これらのヌクレオチドは、例えば、pol−IIIプロモーターの終結シグナル次第で、様々な数のウラシル塩基であり得て、またはそれらは代替の塩基を含んでもよい。
特定の実施形態では、隣接および尾部ドメインは、一緒になって、配列番号32、33、34、35、36、または37に記載される配列を含んでなり、それからなり、またはそれから本質的になる。
例示的単分子/キメラgRNA
特定の実施形態では、本明細書で開示されるような単分子またはキメラgRNAは、5’[標的化ドメイン]−[第1の相補的ドメイン]−[連結ドメイン]−[第2の相補的ドメイン]−[隣接ドメイン]−[尾部ドメイン]−3’の構造を有し、その中で、
標的化ドメインは、コアドメインおよび任意選択的に二次ドメインを含んでなり、10〜50ヌクレオチド長であり;
第1の相補的ドメインは、5〜25ヌクレオチド長であり、特定の実施形態では、本明細書で開示される参照の第1の相補的ドメインと、少なくとも50、60、70、80、85、90、または95%の相同性を有し;
連結ドメインは、1〜5ヌクレオチド長であり;
第2の相補的ドメインは、5〜27ヌクレオチド長であり、特定の実施形態では、本明細書で開示される参照の第2の相補的ドメインと、少なくとも50、60、70、80、85、90、または95%の相同性を有し;
隣接ドメインは、5〜20ヌクレオチド長であり、特定の実施形態では、本明細書で開示される参照隣接相補的ドメインと、少なくとも50、60、70、80、85、90、または95%の相同性を有し;
尾部ドメインは存在せず、またはヌクレオチド配列は、1〜50ヌクレオチド長であり、特定の実施形態では、本明細書で開示される参照テールドメインと、少なくとも50、60、70、80、85、90または95%の相同性を有する。
特定の実施形態では、本明細書に開示されるような単分子gRNAは、好ましくは5’から3’に向けて以下を含んでなる:
例えば、10〜50ヌクレオチドを含んでなる、標的化ドメイン;
例えば、15、16、17、18、19、20、21、22、23、24、25、または26ヌクレオチドを含んでなる、第1の相補的ドメイン;
連結ドメイン;
第2の相補的ドメイン;
隣接ドメイン;および
尾部ドメイン
式中、
(a)隣接およびテールドメインは、一緒になって、少なくとも15、18、20、25、30、31、35、40、45、49、50、または53ヌクレオチドを含んでなり;
(b)第2の相補的ドメインの最後のヌクレオチドに対して3’側に、少なくとも15、18、20、25、30、31、35、40、45、49、50、または53ヌクレオチドがあり;または
(c)第1の相補的ドメインのその対応するヌクレオチドと相補的な第2の相補的ドメインの最後のヌクレオチドに対して3’側に、少なくとも16、19、21、26、31、32、36、41、46、50、51、または54ヌクレオチドがある。
特定の実施形態では、(a)、(b)、および/または(c)からの配列は、天然gRNAの対応する配列と、または本明細書に記載されるgRNAと、少なくとも50%、60%、70%、75%、80%、85%、90%、95%、または99%の相同性を有する。
特定の実施形態では、隣接および尾部ドメインは、一緒になって、少なくとも15、18、20、25、30、31、35、40、45、49、50、または53ヌクレオチドを含んでなる。
特定の実施形態では、第2の相補的ドメインの最後のヌクレオチドに対して3’側に、少なくとも15、18、20、25、30、31、35、40、45、49、50、または53ヌクレオチドがある。
特定の実施形態では、第1の相補的ドメインと対応するヌクレオチドと相補的である、第2の相補的ドメイン最後のヌクレオチドの3’側に少なくとも16、19、21、26、31、32、36、41、46、50、51、または54ヌクレオチドがある。
特定の実施形態では、標的化ドメインは、標的ドメインまたはその一部と相補的または部分的に相補的である、16、17、18、19、20、21、22、23、24、25、または26ヌクレオチド(例えば、16、17、18、19、20、21、22、23、24、25、または26連続ヌクレオチド)からなり、それから本質的になり、またはそれを含んでなり、例えば、標的化ドメインは、16、17、18、19、20、21、22、23、24、25、または26ヌクレオチド長である。これらの実施形態のうちのあるものでは、標的化ドメインは、標的化ドメイン全長にわたり、標的ドメイン全長にわたり、またはその双方にわたり、標的ドメインと相補的である。
特定の実施形態では、本明細書で開示される単分子またはキメラgRNA分子(標的化ドメイン、第1の相補的ドメイン、連結ドメイン、第2の相補的ドメイン、隣接ドメイン、および必要に応じて、尾部ドメインを含んでなる)は、配列番号42に記載されるアミノ酸配列を含んでなり、その中で、標的化ドメインは20N(残基1〜20)として列挙されるが、長さが16〜26ヌクレオチドの範囲であってもよく、最後の6つの残基(残基97〜102)は、U6プロモーターの終結シグナルに相当するが、存在しなくてもよく、または少数であってもよい。特定の実施形態では、単分子またはキメラgRNA分子は、S.ピオゲネス(S.pyogenes)gRNA分子である。
特定の実施形態では、本明細書で開示される単分子またはキメラgRNA分子(標的化ドメイン、第1の相補的ドメイン、連結ドメイン、第2の相補的ドメイン、隣接ドメイン、および必要に応じて、尾部ドメインを含んでなる)は、配列番号38に記載されるアミノ酸配列を含んでなり、その中で標的化ドメインは20N(残基1〜20)として列挙されるが、長さが16〜26ヌクレオチドの範囲であってもよく、最後の6つの残基(残基97〜102)は、U6プロモーターの終結シグナルに相当するが、存在しなくてもよく、または少数であってもよい。特定の実施形態では、単分子またはキメラgRNA分子は、S.アウレウス(S.aureus)gRNA分子である。
例示的なキメラgRNAの配列および構造が、1H〜1Iにもまた示される。
例示的なモジュラーgRNA
特定の実施形態では、本明細書で開示されるモジュラーgRNAは、
好ましくは、5’から3’方向に、
例えば、15、16、17、18、19、20、21、22、23、24、25、または26ヌクレオチドを含んでなる、標的化ドメイン;
第1の相補的ドメイン
を含んでなる第1の鎖;および
好ましくは、5’から3’方向に、
任意選択的に、5’伸長ドメイン;
第2の相補的ドメイン;
隣接ドメイン;および
尾部ドメイン
を含んでなる第2の鎖
を含んでなり、その中で、
(a)隣接および尾部ドメインは、一緒になって、少なくとも15、18、20、25、30、31、35、40、45、49、50、または53ヌクレオチドを含んでなり;
(b)第2の相補的ドメインの最後のヌクレオチドに対して3’側に、少なくとも15、18、20、25、30、31、35、40、45、49、50、または53ヌクレオチドがあり;
(c)第1の相補的ドメインのその対応するヌクレオチドと相補的な第2の相補的ドメインの最後のヌクレオチドに対して3’側に、少なくとも16、19、21、26、31、32、36、41、46、50、51、または54ヌクレオチドがある。
特定の実施形態では、(a)、(b)、または(c)からの配列は、天然gRNAの対応する配列と、または本明細書に記載されるgRNAと、少なくとも60、75、80、85、90、95、または99%の相同性を有する。
特定の実施形態では、隣接および尾部ドメインは、一緒になって、少なくとも15、18、20、25、30、31、35、40、45、49、50、または53ヌクレオチドを含んでなる。
特定の実施形態では、第2の相補的ドメインの最後のヌクレオチドに対して3’側に、少なくとも15、18、20、25、30、31、35、40、45、49、50、または53ヌクレオチドがある。
特定の実施形態では、第1の相補的ドメインのその対応するヌクレオチドと相補的な第2の相補的ドメインの最後のヌクレオチドに対して3’側に、少なくとも16、19、21、26、31、32、36、41、46、50、51、または54ヌクレオチドがある。
特定の実施形態では、標的化ドメインは、標的ドメインとの相補性を有する、16、17、18、19、20、21、22、23、24、25、または26ヌクレオチド(例えば、16、17、18、19、20、21、22、23、24、25、または26連続ヌクレオチド)を含んでなり、それを有し、またはそれからなり、例えば、標的化ドメインは、16、17、18、19、20、21、22、23、24、25、または26ヌクレオチド長である。
特定の実施形態では、標的化ドメインは、標的ドメインまたはその一部と相補的な、16、17、18、19、20、21、22、23、24、25、または26ヌクレオチド(例えば、16、17、18、19、20、21、22、23、24、25、または26連続ヌクレオチド)からなる、それから本質的になる、またはそれを含んでなる。これらの実施形態のうちのあるものでは、標的化ドメインは、標的化ドメイン全長にわたり、標的ドメイン全長にわたり、またはその双方にわたり、標的ドメインと相補的である。
特定の実施形態では、標的化ドメインは、標的ドメインとの相補性を有する、16ヌクレオチド(例えば、16連続ヌクレオチド)を含んでなり、それからなり、またはそれから本質的になり、例えば、標的化ドメインは、16ヌクレオチド長である。これらの実施形態の特定の実施形態では、(a)隣接および尾部ドメインは、一緒になって、少なくとも15、18、20、25、30、31、35、40、45、49、50、または53ヌクレオチドを含んでなり;(b)第2の相補的ドメインの最後のヌクレオチドに対して3’側に、少なくとも15、18、20、25、30、31、35、40、45、49、50、または53ヌクレオチドがあり;および/または(c)第1の相補的ドメインのその対応するヌクレオチドと相補的な第2の相補的ドメインの最後のヌクレオチドに対して3’側に、少なくとも16、19、21、26、31、32、36、41、46、50、51、または54ヌクレオチドがある。
特定の実施形態では、標的化ドメインは、標的ドメインとの相補性を有する、17ヌクレオチド(例えば、17連続ヌクレオチド)を含んでなり、それからなり、またはそれから本質的になり、例えば、標的化ドメインは、17ヌクレオチド長である。これらの実施形態のうちのあるものでは、(a)隣接および尾部ドメインは、一緒になって、少なくとも15、18、20、25、30、31、35、40、45、49、50、または53ヌクレオチドを含んでなり;(b)第2の相補的ドメインの最後のヌクレオチドに対して3’側に、少なくとも15、18、20、25、30、31、35、40、45、49、50、または53ヌクレオチドがあり;および/または(c)第1の相補的ドメインのその対応するヌクレオチドと相補的な第2の相補的ドメインの最後のヌクレオチドに対して3’側に、少なくとも16、19、21、26、31、32、36、41、46、50、51、または54ヌクレオチドがある。
特定の実施形態では、標的化ドメインは、標的ドメインとの相補性を有する、18ヌクレオチド(例えば、18連続ヌクレオチド)を含んでなり、それからなり、またはそれから本質的になり、例えば、標的化ドメインは、18ヌクレオチド長である。これらの実施形態のうちのあるものでは、(a)隣接および尾部ドメインは、一緒になって、少なくとも15、18、20、25、30、31、35、40、45、49、50、または53ヌクレオチドを含んでなり;(b)第2の相補的ドメインの最後のヌクレオチドに対して3’側に、少なくとも15、18、20、25、30、31、35、40、45、49、50、または53ヌクレオチドがあり;および/または(c)第1の相補的ドメインのその対応するヌクレオチドと相補的な第2の相補的ドメインの最後のヌクレオチドに対して3’側に、少なくとも16、19、21、26、31、32、36、41、46、50、51、または54ヌクレオチドがある。
特定の実施形態では、標的化ドメインは、標的ドメインとの相補性を有する、19ヌクレオチド(例えば、19連続ヌクレオチド)を含んでなり、それからなり、またはそれから本質的になり、例えば、標的化ドメインは、19ヌクレオチド長である。これらの実施形態のうちのあるものでは、(a)隣接および尾部ドメインは、一緒になって、少なくとも15、18、20、25、30、31、35、40、45、49、50、または53ヌクレオチドを含んでなり;(b)第2の相補的ドメインの最後のヌクレオチドに対して3’側に、少なくとも15、18、20、25、30、31、35、40、45、49、50、または53ヌクレオチドがあり;および/または(c)第1の相補的ドメインのその対応するヌクレオチドと相補的な第2の相補的ドメインの最後のヌクレオチドに対して3’側に、少なくとも16、19、21、26、31、32、36、41、46、50、51、または54ヌクレオチドがある。
特定の実施形態では、標的化ドメインは、標的ドメインとの相補性を有する、20ヌクレオチド(例えば、20連続ヌクレオチド)を含んでなり、それからなり、またはそれから本質的になり、例えば、標的化ドメインは、20ヌクレオチド長である。これらの実施形態のうちのあるものでは、(a)隣接および尾部ドメインは、一緒になって、少なくとも15、18、20、25、30、31、35、40、45、49、50、または53ヌクレオチドを含んでなり;(b)第2の相補的ドメインの最後のヌクレオチドに対して3’側に、少なくとも15、18、20、25、30、31、35、40、45、49、50、または53ヌクレオチドがあり;および/または(c)第1の相補的ドメインのその対応するヌクレオチドと相補的な第2の相補的ドメインの最後のヌクレオチドに対して3’側に、少なくとも16、19、21、26、31、32、36、41、46、50、51、または54ヌクレオチドがある。
特定の実施形態では、標的化ドメインは、標的ドメインとの相補性を有する、21ヌクレオチド(例えば、21連続ヌクレオチド)を含んでなり、それからなり、またはそれから本質的になり、例えば、標的化ドメインは、21ヌクレオチド長である。これらの実施形態のうちのあるものでは、(a)隣接および尾部ドメインは、一緒になって、少なくとも15、18、20、25、30、31、35、40、45、49、50、または53ヌクレオチドを含んでなり;(b)第2の相補的ドメインの最後のヌクレオチドに対して3’側に、少なくとも15、18、20、25、30、31、35、40、45、49、50、または53ヌクレオチドがあり;および/または(c)第1の相補的ドメインのその対応するヌクレオチドと相補的な第2の相補的ドメインの最後のヌクレオチドに対して3’側に、少なくとも16、19、21、26、31、32、36、41、46、50、51、または54ヌクレオチドがある。
特定の実施形態では、標的化ドメインは、標的ドメインとの相補性を有する、22ヌクレオチド(例えば、22連続ヌクレオチド)を含んでなり、それからなり、またはそれから本質的になり、例えば、標的化ドメインは、22ヌクレオチド長である。これらの実施形態のうちのあるものでは、(a)隣接および尾部ドメインは、一緒になって、少なくとも15、18、20、25、30、31、35、40、45、49、50、または53ヌクレオチドを含んでなり;(b)第2の相補的ドメインの最後のヌクレオチドに対して3’側に、少なくとも15、18、20、25、30、31、35、40、45、49、50、または53ヌクレオチドがあり;および/または(c)第1の相補的ドメインのその対応するヌクレオチドと相補的な第2の相補的ドメインの最後のヌクレオチドに対して3’側に、少なくとも16、19、21、26、31、32、36、41、46、50、51、または54ヌクレオチドがある。
特定の実施形態では、標的化ドメインは、標的ドメインとの相補性を有する、23ヌクレオチド(例えば、23連続ヌクレオチド)を含んでなり、それからなり、またはそれから本質的になり、例えば、標的化ドメインは、23ヌクレオチド長である。これらの実施形態のうちのあるものでは、(a)隣接および尾部ドメインは、一緒になって、少なくとも15、18、20、25、30、31、35、40、45、49、50、または53ヌクレオチドを含んでなり;(b)第2の相補的ドメインの最後のヌクレオチドに対して3’側に、少なくとも15、18、20、25、30、31、35、40、45、49、50、または53ヌクレオチドがあり;および/または(c)第1の相補的ドメインのその対応するヌクレオチドと相補的な第2の相補的ドメインの最後のヌクレオチドに対して3’側に、少なくとも16、19、21、26、31、32、36、41、46、50、51、または54ヌクレオチドがある。
特定の実施形態では、標的化ドメインは、標的ドメインとの相補性を有する、24ヌクレオチド(例えば、24連続ヌクレオチド)を含んでなり、それからなり、またはそれから本質的になり、例えば、標的化ドメインは、24ヌクレオチド長である。これらの実施形態のうちのあるものでは、(a)隣接および尾部ドメインは、一緒になって、少なくとも15、18、20、25、30、31、35、40、45、49、50、または53ヌクレオチドを含んでなり;(b)第2の相補的ドメインの最後のヌクレオチドに対して3’側に、少なくとも15、18、20、25、30、31、35、40、45、49、50、または53ヌクレオチドがあり;および/または(c)第1の相補的ドメインのその対応するヌクレオチドと相補的な第2の相補的ドメインの最後のヌクレオチドに対して3’側に、少なくとも16、19、21、26、31、32、36、41、46、50、51、または54ヌクレオチドがある。
特定の実施形態では、標的化ドメインは、標的ドメインとの相補性を有する、25ヌクレオチド(例えば、25連続ヌクレオチド)を含んでなり、それからなり、またはそれから本質的になり、例えば、標的化ドメインは、25ヌクレオチド長である。これらの実施形態のうちのあるものでは、(a)隣接および尾部ドメインは、一緒になって、少なくとも15、18、20、25、30、31、35、40、45、49、50、または53ヌクレオチドを含んでなり;(b)第2の相補的ドメインの最後のヌクレオチドに対して3’側に、少なくとも15、18、20、25、30、31、35、40、45、49、50、または53ヌクレオチドがあり;および/または(c)第1の相補的ドメインのその対応するヌクレオチドと相補的な第2の相補的ドメインの最後のヌクレオチドに対して3’側に、少なくとも16、19、21、26、31、32、36、41、46、50、51、または54ヌクレオチドがある。
特定の実施形態では、標的化ドメインは、標的ドメインとの相補性を有する、26ヌクレオチド(例えば、26連続ヌクレオチド)を含んでなり、それからなり、またはそれから本質的になり、例えば、標的化ドメインは、26ヌクレオチド長である。これらの実施形態のうちのあるものでは、(a)隣接および尾部ドメインは、一緒になって、少なくとも15、18、20、25、30、31、35、40、45、49、50、または53ヌクレオチドを含んでなり;(b)第2の相補的ドメインの最後のヌクレオチドに対して3’側に、少なくとも15、18、20、25、30、31、35、40、45、49、50、または53ヌクレオチドがあり;および/または第1の相補的ドメインのその対応するヌクレオチドと相補的な第2の相補的ドメインの最後のヌクレオチドに対して3’側に、少なくとも16、19、21、26、31、32、36、41、46、50、51、または54ヌクレオチドがある。
gRNAをデザインする方法
本明細書に記載されるgRNAにおける使用のための標的化ドメインを選択し、設計し、検証する方法をはじめとする、gRNAを設計する方法が本明細書に記載される。gRNAへの組み込みのための例示的標的化ドメインもまた本明細書で提供される。特定の実施形態では、標的化ドメインは、相補的塩基対形成を通じて標的ドメインにハイブリダイズすることが、本明細書において検討される。
標的配列の選択および妥当性検証ならびにオフターゲット分析のための方法は、以前に記載されている(例えば、Mali 2013;Hsu 2013;Fu 2014;Heigwer 2014;Bae 2014;Xiao 2014を参照されたい)。例えば、ソフトウェアツールが利用されて、例えば、ゲノム全体にわたる総オフターゲット活性の最小化など、使用者の標的配列に対応する潜在的標的化ドメインの選択が最適化され得る。オフターゲット活性は、切断以外であってもよい。可能な標的化ドメイン選択肢について、S.ピオゲネス(S.pyogenes)Cas9を使用して、ツールは、最高いくつかの数の(例えば、1、2、3、4、5、6、7、8、9、または10個)のミスマッチ塩基対を含有する、(例えば、NAGまたはNGGPAMのどちらかに先行する)ゲノム全体にわたる全てのオフターゲット配列を同定し得る。各オフターゲット配列における切断効率は、例えば、実験的に誘導される重みづけスキームを使用して予測され得る。次に、それぞれの可能な標的化ドメインが、その予測されたオフターゲット切断の合計に従って各付けされ;最高位の標的化ドメインは、最大のオンターゲット切断と最小のオフターゲット切断を有する可能性が高いものに相当する。例えば、CRISPR構築のための自動化された試薬デザイン、オンターゲットサーベイヤーアッセイ用のプライマーデザイン、および次世代シーケンシングを介したオフターゲット切断のハイスループット検出と定量化のためのプライマーデザインなどのその他の機能もまた、ツールに含め得る。候補標的化ドメインおよびこれらの標的化ドメインを含んでなるgRNAは、当該技術分野で公知の方法、および/または本明細書に記載される方法を使用して、機能的に評価され得る。
非限定的例として、S.ピオゲネス(S.pyogenes)およびS.アウレウス(S.aureus)Cas9と共に使用するためのgRNAで使用するための標的化ドメインが、DNA配列検索アルゴリズムを用いて同定された。gRNA設計は、公共ツールcas−offinderに基づくカスタムgRNA設計ソフトウェアを用いて行われた(Bae 2014)。このソフトウェアは、ゲノム全体のオフターゲット傾向を計算した後に、ガイドを格付けする。典型的に、長さが17〜24の範囲のガイドについて、完全一致から7つのミスマッチまでのマッチが検討される。ひとたびオフターゲット部位が計算で判定されたら、各ガイドについて集計スコアが計算され、ウェブインタフェースを用いて表形式の出力に要約される。PAM配列に隣接する潜在的標的部位を同定することに加えて、ソフトウェアはまた、選択された標的部位と1、2、3つまたは3つを超えて異なる、PAM隣接配列を同定する。各遺伝子のゲノムDNA配列は、UCSCゲノムブラウザから得られ、配列は、公的に利用可能なRepeaTaskerを用いて、反復要素についてスクリーニングされた。RepeaTaskerは、反復要素および低複雑度について、入力DNA配列を検索する。結果は、所与のクエリー配列中に存在する反復の詳細な注釈である。
同定に続いて、標的化ドメインは、それらの直交性および5’Gの存在に基づいて階層に格付けされた(例えば、S.ピオゲネス(S.pyogenes)ではNGGPAM、またはS.アウレウス(S.aureus)ではNNGRRT(配列番号204)またはNNGRRV(配列番号205)PAMなどの関連PAMを含有するヒトゲノムにおける、近似一致の同定に基づいて)。直交性は、標的配列に対する最小数のミスマッチを含有するヒトゲノム中の配列数を指す。「高レベルの直交性」または「優れた直交性」は、例えば、ヒトゲノム中に意図される標的以外の同一配列を有さず、または標的配列中に1つまたは2つのミスマッチを含有する任意の配列を有さない、20量体標的化ドメインを指してもよい。優れた直交性を有する標的化ドメインが選択されて、オフターゲットDNA切断が最小化される。
標的化ドメインは、単一gRNAヌクレアーゼ切断および二重gRNA対合「ニッカーゼ」ストラテジーの両方について同定された。標的化ドメインを選択するための基準、そしていずれの標的化ドメインが二重gRNA対合「ニッカーゼ」ストラテジーに使用され得るかの判定は、2つの考察事項に基づく:
(1)標的ドメイン対は、PAMが外側を向いてD10ACas9ニッカーゼで切断すると5’オーバーハングを生じるように、DNA上に配向されるべきである;および
(2)二重ニッカーゼ対で切断することは、合理的な頻度で介在配列全体を欠失させるという仮説。しかし、二重ニッカーゼ対を使用した切断はまた、gRNAの1つのみの部位に、インデル変異をもたらし得る。候補対メンバーは、1つの標的化ドメインの標的部位でインデル突然変異を引き起こすのと対比して、配列全体をいかに効率的に除去するかについて試験され得る。
Cas9分子
多様な生物種のCas9分子が、本明細書に記載される方法および組成物で使用され得る。S.ピオゲネス(S.pyogenes)、S.アウレウス(S.aureus)およびS.サーモフィルス(S.thermophilus)Cas9分子が、本明細書の開示の多くの対象である一方で、本明細書で列挙されるその他の生物種からの、それに由来する、またはそのCas9タンパク質をベースとする、Cas9分子もまた使用され得る。これらは、例えば、アシドボラクス・アベナエ(Acidovorax avenae)、アクチノバチルス・プルロニューモニアエ(Actinobacillus pleuropneumoniae)、アクチノバチルス・サクシノゲネス(Actinobacillus succinogenes)、アクチノバチルス・スイス(Actinobacillus suis)、アクチノミセス属(Actinomyces)種、アリシクリフィルス・デニトリフィカンス(Alicycliphilus denitrificans)(cycliphilus denitrificans)、アミノモナス・パウシボランス(Aminomonas paucivorans)、バチルス・セレウス(Bacillus cereus)、バチルス・スミシイ(Bacillus smithii)、バチルス・チューリンギエンシス(Bacillus thuringiensis)、バクテロイデス属(Bacteroides)種、ブラストピレルラ・マリナ(Blastopirellula marina)、ブラディリゾビウム属(Bradyrhizobium)種、ブレビバチルス・ラテロスポラス(Brevibacillus laterosporus)、カンピロバクター・コリ(Campylobacter coli)、カンピロバクター・ジェジュニ(Campylobacter jejuni)、カンピロバクター・ラリ(Campylobacter lari)、カンジダツス・プニセイスピリルム(Candidatus puniceispirillum)、クロストリジウム・セルロリチカム(Clostridium cellulolyticum)、クロストリジウム・パーフリンゲンス(Clostridium perfringens)、コリネバクテリウム・アクコレンス(Corynebacterium accolens)、コリネバクテリウム・ジフテリア(Corynebacterium diphtheria)、コリネバクテリウム・マトルコチイ(Corynebacterium matruchotii)、ディノロセオバクター・シバエ(Dinoroseobacter shibae)、ユウバクテリウム・ドリクム(Eubacterium dolichum)、ガンマプロテオバクテリア綱(gamma proteobacterium)、グルコンアセトバクター・ジアゾトロフィクス(Gluconacetobacter diazotrophicus)、ヘモフィルス・パラインフルエンザエ(Haemophilus parainfluenzae)、ヘモフィルス・スプトラム(Haemophilus sputorum)、ヘリコバクター・カナデンシス(Helicobacter canadensis)、ヘリコバクター・シナエディ(Helicobacter cinaedi)、ヘリコバクター・ムステラエ(Helicobacter mustelae)、イリオバクター・ポリトロパス(Ilyobacter polytropus)、キンゲラ・キンガエ(Kingella kingae)、ラクトバチルス・クリスパータス(Lactobacillus crispatus)、リステリア・イバノビイ(Listeria ivanovii)、リステリア・モノサイトゲネス(Listeria monocytogenes)、リステリア科(Listeriaceae)細菌、メチロシスチス科(Methylocystis)種、メチロシナス・トリコスポリウム(Methylosinus trichosporium)、モビルンカス・ムリエリス(Mobiluncus mulieris)、ナイセリア・バシリフォルミス(Neisseria bacilliformis)、ナイセリア・シネレア(Neisseria cinerea)、ナイセリア・フラベッセンス(Neisseria flavescens)、ナイセリア・ラクタミカ(Neisseria lactamica)、ナイセリア属(Neisseria)種、ナイセリア・ワズワーシイ(Neisseria wadsworthii)、ニトロソモナス属(Nitrosomonas)種、パルビバクラム・ラバメンチボランス(Parvibaculum lavamentivorans)、パスツレラ・ムルトシダ(Pasteurella multocida)、ファスコラークトバクテリウム・スクシナテュテンス(Phascolarctobacterium succinatutens)、ラルストニア・シジジイ(Ralstonia syzygii)、ロドシュードモナス・パルストリス(Rhodopseudomonas palustris)、ロドブラム属(Rhodovulum)種、シモンシエラ・ムエレリ(Simonsiella muelleri)、スフィンゴモナス属(Sphingomonas)種、スポロラクトバチルス・ビネア(Sporolactobacillus vineae)、スタフィロコッカス・ルグドゥネンシス(Staphylococcus lugdunensis)、ストレプトコッカス属(Streptococcus)種、サブドリグラヌルム属(Subdoligranulum)種、チストレラ・モビリス(Tistrella mobilis)、トレポネーマ属(Treponema)種、またはベルミネフロバクター・エイセニア(Verminephrobacter eiseniae)からのCas9分子を含む。
Cas9ドメイン
結晶構造は、ガイドRNA(例えば、crRNAとtracrRNAの合成融合体)を用いて、2つの異なる天然の細菌Cas9分子(Jinek 2014)、およびS.ピオゲネス(S.pyogenes)Cas9(Nishimasu 2014;Anders 2014)について、判定されている。
天然のCas9分子は、認識(REC)ローブおよびヌクレアーゼ(NUC)ローブの2つのローブを含んでなり、そのそれぞれが、本明細書に記載されるドメインをさらに含んでなる。図8A〜8Bは、一次構造中の重要Cas9ドメイン構成の概略図を提供する。本開示全体を通じて使用される、各ドメインによって包含されるアミノ酸の命名法およびアミノ酸残基の番号付けは、以前記載されたとおりである(Nishimasu 2014)。アミノ酸残基の番号付与は、S.ピオゲネス(S.pyogenes)に由来するCas9を参照する。
RECローブは、アルギニンに富む架橋らせん(BH)、REC1ドメイン、およびREC2ドメインを含んでなる。RECローブは、その他の既知のタンパク質と構造的類似性を共有せず、Cas9特異的機能ドメインであることが示唆される。BHドメインは長いαらせんおよびアルギニン富化領域であり、S.ピオゲネス(S.pyogenes)Cas9(配列番号2)のアミノ酸60〜93を含んでなる。REC1ドメインは、例えば、gRNAまたはtracrRNAなどのリピート:アンチリピート二本鎖の認識にとって重要であり、したがって標的配列を認識することによって、Cas9活性にとって重要である。REC1ドメインは、S.ピオゲネス(S.pyogenes)Cas9(配列番号2)のアミノ酸94〜179および308〜717に2つのREC1モチーフを含んでなる。これらの2つのREC1ドメインは、直線一次構造中ではREC2ドメインによって隔離されているが、三次構造中では、組み立てられてREC1ドメインを形成する。REC2ドメイン、またはその部分は、リピート:アンチリピート二本鎖の認識における役割もまた果たしてもよい。REC2ドメインは、S.ピオゲネス(S.pyogenes)Cas9(配列番号2)のアミノ酸180〜307を含んでなる。
NUCローブは、RuvCドメイン、HNHドメイン、およびPAM−相互作用(PI)ドメインを含んでなる。RuvCドメインは、レトロウイルスインテグラーゼスーパーファミリーメンバーとの構造類似性を共有し、例えば、標的核酸分子の非相補鎖などの一本鎖を切断する。RuvCドメインは、それぞれS.ピオゲネス(S.pyogenes)Cas9(配列番号2)のアミノ酸1〜59、718〜769、および909〜1098において、3つの分割RuvCモチーフ(当該技術分野で一般に、それぞれRuvCIドメインまたはN末端RuvCドメイン、RuvCIIドメイン、およびRuvCIIIドメインと称されることが多い、RuvCI、RuvCII、およびRuvCIII)から組み立てられる。REC1ドメインと同様に、3つのRuvCモチーフは、一次構造中でその他のドメインによって直線的に隔てられる。しかし、三次構造中では、3つのRuvCモチーフは組み立てられてRuvCドメインを形成する。HNHドメインは、HNHエンドヌクレアーゼとの構造類似性を共有して、例えば、標的核酸分子の相補鎖などの一本鎖を切断する。HNHドメインは、RuvCII−IIIモチーフ間にあり、S.ピオゲネス(S.pyogenes)Cas9(配列番号2)のアミノ酸775〜908を含んでなる。PIドメインは、標的核酸分子のPAMと相互作用して、S.ピオゲネス(S.pyogenes)Cas9(配列番号2)のアミノ酸1099〜1368を含んでなる。
RuvC様ドメインおよびHNH様ドメイン
特定の実施形態では、Cas9分子またはCas9ポリペプチドは、HNH様ドメインおよびRuvC様ドメインを含んでなり、これらの実施形態のうちのあるものでは、切断活性は、RuvC様ドメインおよびHNH様ドメインに依存する。Cas9分子またはCas9ポリペプチドは、RuvC様ドメインおよびHNH様ドメインの1つまたは複数を含んでなり得る。特定の実施形態では、Cas9分子またはCas9ポリペプチドは、例えば、下に記載されるRuvC様ドメインなどのRuvC様ドメイン、および/または、例えば、下に記載されるHNH様ドメインなどのHNH様ドメインを含んでなる。
RuvC様ドメイン
特定の実施形態では、RuvC様ドメインは、例えば、標的核酸分子の非相補鎖などの一本鎖を切断する。Cas9分子またはCas9ポリペプチドは、2つ以上のRuvC様ドメイン(例えば、1つ、2つ、3つ以上のRuvC様ドメイン)を含み得る。特定の実施形態では、RuvC様ドメインは、少なくとも5、6、7、8アミノ酸長であるが、20、19、18、17、16または15アミノ酸長以下である。特定の実施形態では、Cas9分子またはCas9ポリペプチドは、例えば、約15アミノ酸長など約10〜20アミノ酸のN末端RuvC様ドメインを含んでなる。
N末端RuvC様ドメイン
いくつかの天然Cas9分子は、2つ以上のRuvC様ドメインを含んでなり、切断はN末端RuvC様ドメインに依存する。したがって、Cas9分子またはCas9ポリペプチドは、N末端RuvC様ドメインを含んでなり得る。代表的なN末端RuvC様ドメインは、以下に記載される。
特定の実施形態では、Cas9分子またはCas9ポリペプチドは、式I、
D−X−G−X−X−X−X−G−X−X−X−X(配列番号20)
のアミノ酸配列を含んでなるN末端RuvC様ドメインを含んでなり、
式中、
は、I、V、M、L、およびTから選択され(例えば、I、V、およびLから選択され);
は、T、I、V、S、N、Y、E、およびLから選択され(例えば、T、V、およびIから選択され);
は、N、S、G、A、D、T、R、M、およびF(例えば、AまたはN)から選択され;
は、S、Y、N、およびF(例えば、S)から選択され;
は、V、I、L、C、T、およびFから選択され(例えば、V、I、およびLから選択され);
は、W、F、V、Y、S、およびL(例えば、W)から選択され;
は、A、S、C、V、およびGから選択され(例えば、AおよびSから選択され);
は、V、I、L、A、M、およびHから選択され(例えば、V、I、M、およびLから選択され);
は、任意のアミノ酸から選択され、または存在しなかった(例えば、T、V、I、L、Δ、F、S、A、Y、M、およびRから選択され、または例えば、T、V、I、L、およびΔから選択される)。
特定の実施形態では、N末端RuvC様ドメインは、配列番号20の配列と、1と程度であるが、2、3、4、または5以下の残基が異なる。
特定の実施形態では、N末端RuvC様ドメインは、切断可能である。その他の実施形態では、N末端RuvC様ドメインは、切断不能である。
特定の実施形態では、Cas9分子またはCas9ポリペプチドは、式II、
D−X−G−X−X−S−X−G−X−X−X−X、(配列番号21)
のアミノ酸配列を含んでなるN末端RuvC様ドメインを含んでなり、
式中、
は、I、V、M、L、およびTから選択され(例えば、I、V、およびLから選択され);
は、T、I、V、S、N、Y、E、およびLから選択され(例えば、T、V、およびIから選択され);
は、N、S、G、A、D、T、R、M、およびF(例えば、AまたはN)から選択され;
は、V、I、L、C、T、およびFから選択され(例えば、V、I、およびLから選択され);
は、W、F、V、Y、S、およびL(例えば、W)から選択され;
は、A、S、C、V、およびGから選択され(例えば、AおよびSから選択され);
は、V、I、L、A、M、およびHから選択され(例えば、V、I、M、およびLから選択され);
は、任意のアミノ酸から選択され、または存在しなかった(例えば、T、V、I、L、Δ、F、S、A、Y、M、およびRから選択され、または例えば、T、V、I、L、およびΔから選択される)。
特定の実施形態では、N末端RuvC様ドメインは、配列番号21の配列と、1と程度であるが、2、3、4、または5以下の残基が異なる。
特定の実施形態では、N末端RuvC様ドメインは、式III、
D−I−G−X−X−S−V−G−W−A−X−X(配列番号22)
のアミノ酸配列を含んでなり、
式中、
は、T、I、V、S、N、Y、E、およびLから選択され(例えば、T、V、およびIから選択され);
は、N、S、G、A、D、T、R、M、およびF(例えば、AまたはN)から選択され;
は、V、I、L、A、M、およびHから選択され(例えば、V、I、M、およびLから選択され);
は、任意のアミノ酸から選択され、または存在しなかった(例えば、T、V、I、L、Δ、F、S、A、Y、M、およびRから選択され、または例えば、T、V、I、L、およびΔから選択される)。
特定の実施形態では、N末端RuvC様ドメインは、配列番号22の配列と、1と程度であるが、2、3、4、または5以下の残基が異なる。
特定の実施形態では、N末端RuvC様ドメインは、式IV、
D−I−G−T−N−S−V−G−W−A−V−X(配列番号23)
のアミノ酸配列を含んでなり、
式中、
Xは、非極性アルキルアミノ酸またはヒドロキシルアミノ酸であり、例えば、Xは、V、I、L、およびTから選択される(例えば、Cas9分子は、図2A〜2Gに示されるN末端RuvC様ドメインを含んでなり得る(Yとして示される))。
特定の実施形態では、N末端RuvC様ドメインは、配列番号23の配列と、1と程度であるが、2、3、4、または5以下の残基が異なる。
特定の実施形態では、N末端RuvC様ドメインは、例えば、本明細書の図3A〜3Bで開示されるN末端RuvC様ドメインの配列と、1程度であるが、2、3、4、または5以下の数の残基が異なる。一実施形態では、図3A〜3Bで同定された高度に保存された残基の1つ、2つ、3つまたは全てが存在する。
特定の実施形態では、N末端RuvC様ドメインは、例えば、本明細書の図4A〜4Bで開示されるN末端RuvC様ドメインの配列と、1程度であるが、2、3、4、または5以下の数の残基が異なる。一実施形態では、図4A〜4Bで同定された高度に保存された残基の1つ、2つまたは全てが存在する。
追加的なRuvC様ドメイン
N末端RuvC様ドメインに加えて、Cas9分子またはCas9ポリペプチドは、1つまたは複数の追加的なRuvC様ドメインを含んでなり得る。特定の実施形態では、Cas9分子またはCas9ポリペプチドは、2つの追加的なRuvC様ドメインを含んでなり得る。好ましくは、追加的なRuvC様ドメインは、例えば、15未満のアミノ酸長、例えば、5〜10アミノ酸長、例えば、8アミノ酸長などの少なくとも5アミノ酸長である。
追加的なRuvC様ドメインは、式V、
I−X−X−E−X−A−R−E(配列番号15)
のアミノ酸配列を含んでなり得て、
式中、
はVまたはHであり;
はI、LまたはV(例えば、IまたはVであり);
はMまたはTである。
特定の実施形態では、追加的なRuvC様ドメインは、式VI、
I−V−X−E−M−A−R−E(配列番号16)
のアミノ酸配列を含んでなり、
式中、
はI、LまたはV(例えば、IまたはV)である(例えば、Cas9分子またはCas9ポリペプチドは、図2A〜2Gに示される追加的なRuvC様ドメインを含んでなり得る(Bとして示される))。
追加的なRuvC様ドメインは、式VII、
H−H−A−X−D−A−X−X(配列番号17)
のアミノ酸配列を含んでなり得て、
式中、
はHまたはLであり;
はRまたはVであり;
はEまたはVである。
特定の実施形態では、追加的なRuvC様ドメインは、アミノ酸配列H−H−A−H−D−A−Y−L(配列番号18)を含んでなる。
特定の実施形態では、相加的RuvC様ドメインは、配列番号15〜18の配列と、1と程度であるが、2、3、4、または5以下の残基が異なる。
特定の実施形態では、N末端RuvC様ドメイン側方の配列は、式VIII、
K−X’−Y−X’−X’−X’−Z−T−D−X’−Y(配列番号19)
のアミノ酸配列を有し、
式中、
’は、KおよびPから選択され;
’は、V、L、I、およびF(例えば、V、I、およびL)から選択され;
’は、G、A、およびS(例えば、G)から選択され;
’は、L、I、V、およびF(例えば、L)から選択され;
’は、D、E、N、およびQから選択され;
Zは、例えば、上述されるようなN末端RuvC様ドメインである。
HNH様ドメイン
特定の実施形態では、HNH様ドメインは、例えば、二本鎖核酸分子の相補鎖などの一本鎖相補的ドメインを切断する。特定の実施形態では、HNH様ドメインは、少なくとも15、20、または25アミノ酸長であるが、40、35、または30以下のアミノ酸長であり、例えば、20〜35アミノ酸長、例えば、25〜30アミノ酸長である。代表的なHNH様ドメインは、以下に記載される。
一実施形態では、Cas9分子またはCas9ポリペプチドは、式IX、
−X−X−H−X−X−P−X−X−X−X−X10−X11−X12−X13−X14−X15−N−X16−X17−X18−X19−X20−X21−X22−X23−N(配列番号25)
のアミノ酸配列を有するHNH様ドメインを含んでなり、
式中、
はD、E、Q、およびN(例えば、DおよびE)から選択され;
は、L、I、R、Q、V、M、およびKから選択され;
は、DおよびEから選択され;
は、I、V、T、A、およびL(例えば、A、I、およびV)から選択され;
は、V、Y、I、L、F、およびW(例えば、V、I、およびL)から選択され;
は、Q、H、R、K、Y、I、L、F、およびWから選択され;
は、S、A、D、T、およびK(例えば、SおよびA)から選択され;
は、F、L、V、K、Y、M、I、R、A、E、D、およびQ(例えば、F)から選択され;
は、L、R、T、I、V、S、C、Y、K、F、およびGから選択され;
10は、K、Q、Y、T、F、L、W、M、A、E、G、およびSから選択され;
11は、D、S、N、R、L、およびT(例えば、D)から選択され;
12は、D、N、およびSから選択され;
13は、S、A、T、G、およびR(例えば、S)から選択され;
14は、I、L、F、S、R、Y、Q、W、D、K、およびH(例えば、I、L、およびF)から選択され;
15は、D、S、I、N、E、A、H、F、L、Q、M、G、Y、およびVから選択され;
16は、K、L、R、M、T、およびF(例えば、L、R、およびK)から選択され;
17は、V、L、I、A、およびTから選択され;
18は、L、I、V、およびA(例えば、LおよびI)から選択され;
19は、T、V、C、E、S、およびA(例えば、TおよびV)から選択され;
20は、R、F、T、W、E、L、N、C、K、V、S、Q、I、Y、H、およびAから選択され;
21は、S、P、R、K、N、A、H、Q、G、およびLから選択され;
22は、D、G、T、N、S、K、A、I、E、L、Q、R、およびYから選択され;
23は、K、V、A、E、Y、I、C、L、S、T、G、K、M、D、およびFから選択される。
特定の実施形態では、HNH様ドメインは、少なくとも1つであるが2、3、4、または5つ以下の残基が、配列番号25の配列と異なる。
特定の実施形態では、HNH様ドメインは切断可能である。その他の実施形態では、HNH様ドメインは切断不能である。
特定の実施形態では、Cas9分子またはCas9ポリペプチドは、式X、
−X−X−H−X−X−P−X−S−X−X−X10−D−D−S−X14−X15−N−K−V−L−X19−X20−X21−X22−X23−N(配列番号26)
のアミノ酸配列を含んでなるHNH様ドメインを含んでなり、
式中、
は、DおよびEから選択され;
は、L、I、R、Q、V、M、およびKから選択され;
は、DおよびEから選択され;
は、I、V、T、A、およびL(例えば、A、I、およびV)から選択され;
は、V、Y、I、L、F、およびW(例えば、V、I、およびL)から選択され;
は、Q、H、R、K、Y、I、L、F、およびWから選択され;
は、F、L、V、K、Y、M、I、R、A、E、D、およびQ(例えば、F)から選択され;
は、L、R、T、I、V、S、C、Y、K、F、およびGから選択され;
10は、K、Q、Y、T、F、L、W、M、A、E、G、およびSから選択され;
14は、I、L、F、S、R、Y、Q、W、D、K、およびH(例えば、I、L、およびF)から選択され;
15は、D、S、I、N、E、A、H、F、L、Q、M、G、Y、およびVから選択され;
19は、T、V、C、E、S、およびA(例えば、TおよびV)から選択され;
20は、R、F、T、W、E、L、N、C、K、V、S、Q、I、Y、H、およびAから選択され;
21は、S、P、R、K、N、A、H、Q、G、およびLから選択され;
22は、D、G、T、N、S、K、A、I、E、L、Q、R、およびYから選択され;
23は、K、V、A、E、Y、I、C、L、S、T、G、K、M、D、およびFから選択される。
特定の実施形態では、HNH様ドメインは、配列番号26の配列と、1、2、3、4、または5個の残基が異なる。
特定の実施形態では、Cas9分子またはCas9ポリペプチドは、式XI、
−V−X−H−I−V−P−X−S−X−X−X10−D−D−S−X14−X15−N−K−V−L−T−X20−X21−X22−X23−N(配列番号27)
のアミノ酸配列を含んでなるHNH様ドメインを含んでなり、
式中、
は、DおよびEから選択され;
は、DおよびEから選択され;
は、Q、H、R、K、Y、I、L、およびWから選択され;
は、F、L、V、K、Y、M、I、R、A、E、D、およびQ(例えば、F)から選択され;
は、L、R、T、I、V、S、C、Y、K、F、およびGから選択され;
10は、K、Q、Y、T、F、L、W、M、A、E、G、およびSから選択され;
14は、I、L、F、S、R、Y、Q、W、D、K、およびH(例えば、I、L、およびF)から選択され;
15は、D、S、I、N、E、A、H、F、L、Q、M、G、Y、およびVから選択され;
20は、R、F、T、W、E、L、N、C、K、V、S、Q、I、Y、H、およびAから選択され;
21は、S、P、R、K、N、A、H、Q、G、およびLから選択され;
22は、D、G、T、N、S、K、A、I、E、L、Q、R、およびYから選択され;
23は、K、V、A、E、Y、I、C、L、S、T、G、K、M、D、およびFから選択される。
特定の実施形態では、HNH様ドメインは、配列番号27の配列と、1、2、3、4、または5個の残基が異なる。
特定の実施形態では、Cas9分子またはCas9ポリペプチドは、式XII、
D−X−D−H−I−X−P−Q−X−F−X−X10−D−X12−S−I−D−N−X16−V−L−X19−X20−S−X22−X23−N(配列番号28)
のアミノ酸配列を有するHNH様ドメインを含んでなり、
式中、
は、IおよびVから選択され;
は、IおよびVから選択され;
は、AおよびSから選択され;
は、IおよびLから選択され;
10は、KおよびTから選択され;
12は、DおよびNから選択され;
16は、R、K、およびLから選択され;
19は、TおよびVから選択され;
20は、S、およびRから選択され;
22は、K、D、およびAから選択され;
23は、E、K、G、およびNから選択される(例えば、Cas9分子またはCas9ポリペプチドは、本明細書に記載されるHNH様ドメインを含んでなり得る)。
一実施形態では、HNH様ドメインは、配列番号28の配列と、1程度であるが、2、3、4、または5以下の残基が異なる。
特定の実施形態では、Cas9分子またはCas9ポリペプチドは、式XIII、
L−Y−Y−L−Q−N−G−X’−D−M−Y−X’−X’−X’−X’−L−D−I−X’−X’−L−S−X’−Y−Z−N−R−X’−K−X10’−D−X11’−V−P(配列番号24)
のアミノ酸配列を含んでなり、
式中、
’は、KおよびRから選択され;
’は、VおよびTから選択され;
’は、GおよびDから選択され;
’は、E、Q、およびDから選択され;
’は、EおよびDから選択され;
’は、D、N、およびHから選択され;
’は、Y、R、およびNから選択され;
’は、Q、D、およびNから選択され;
’は、GおよびEから選択され;
10’は、SおよびGから選択され;
11’は、DおよびNから選択され;
Zは、例えば、上述されるようなHNH様ドメインである。
特定の実施形態では、Cas9分子またはCas9ポリペプチドは、配列番号24の配列と、1程度であるが、2、3、4、または5以下の残基が異なるアミノ酸配列を含んでなる。
特定の実施形態では、HNH様ドメインとは、例えば、図5A〜5Cなどの本明細書で開示されるHNH様ドメインの配列と、1程度であるが、2、3、4、または5以下の残基が異なる。特定の実施形態では、図5A〜5Cにおいて同定された高度に保存された残基の1つまたは双方が存在する。
特定の実施形態では、HNH様ドメインとは、例えば、図6A〜6Bなどの本明細書で開示されるHNH様ドメインの配列と、1程度であるが、2、3、4、または5以下の残基が異なる。一実施形態では、図6A〜6Bで同定された高度に保存された残基の1つ、2つ、3つまたは全てが存在する。
Cas9活性
特定の実施形態では、Cas9分子またはCas9ポリペプチドは、標的核酸分子を切断する能力がある。典型的に、野生型Cas9分子は、標的核酸分子の双方の鎖を切断する。Cas9分子およびCas9ポリペプチドは、遺伝子操作されて、ヌクレアーゼ切断(またはその他の特性)が改変され得て、例えば、ニッカーゼである、または標的核酸を切断する能力を欠く、Cas9分子またはCas9ポリペプチドが提供される。標的核酸分子を切断する能力があるCas9分子またはCas9ポリペプチドは、本明細書で、eaCas9(酵素的に活性なCas9)分子またはeaCas9ポリペプチドと称される。
特定の実施形態では、eaCas9分子またはeaCas9ポリペプチドは、以下の酵素活性の1つまたは複数を含んでなる:
(1)ニッカーゼ活性、すなわち、例えば、核酸分子の非相補鎖または相補鎖などの一本鎖を切断する能力;
(2)一実施形態では2つのニッカーゼ活性の存在である、二本鎖ヌクレアーゼ活性、すなわち、二本鎖核酸の双方の鎖を切断して、二本鎖切断を生成する能力;
(3)エンドヌクレアーゼ活性;
(4)エキソヌクレアーゼ活性;および
(5)ヘリカーゼ活性、すなわち、二本鎖核酸のらせん構造を巻き戻す能力。
特定の実施形態では、eaCas9分子またはeaCas9ポリペプチドは、双方のDNA鎖を切断して二本鎖切断をもたらす。特定の実施形態では、eaCas9分子またはeaCas9ポリペプチドは、例えば、それに対してgRNAがハイブリダイズする鎖、またはgRNAとハイブリダイズする鎖と相補的な鎖などの1本の鎖のみを切断する。一実施形態では、eaCas9分子またはeaCas9ポリペプチドは、HNHドメインに関連する切断活性を含んでなる。一実施形態では、eaCas9分子またはeaCas9ポリペプチドは、RuvCドメインに関連する切断活性を含んでなる。一実施形態では、eaCas9分子またはeaCas9ポリペプチドは、HNHドメインに関連する切断活性と、RuvCドメインに関連する切断活性とを含んでなる。一実施形態では、eaCas9分子またはeaCas9ポリペプチドは、活性なまたは切断可能なHNHドメインと、不活性なまたは切断不能なRuvCドメインとを含んでなる。一実施形態では、eaCas9分子またはeaCas9ポリペプチドは、不活性なまたは切断不能なHNHドメインと、活性なまたは切断可能なRuvCドメインとを含んでなる。
いくつかのCas9分子またはCas9ポリペプチドはgRNA分子と相互作用する能力を有し、gRNA分子と連携してコア標的ドメインに局在化するが、標的核酸を切断できず、または効率的な速度で切断できない。切断活性を有さない、または実質的に有さないCas9分子は、本明細書で、eiCas9分子またはeiCas9ポリペプチドと称される。例えば、eiCas9分子またはeiCas9ポリペプチドは、切断活性を欠き、または本明細書に記載されるアッセイによる測定で、例えば、参照Cas9分子またはeiCas9ポリペプチドの切断活性の20%、10%、5%、1%、または0.1%未満である、実質的により低い切断活性を有し得る。
標的化およびPAM
Cas9分子またはCas9はgRNA分子と相互作用して、gRNA分子と協調し、標的ドメインを含んでなるそして特定の実施形態ではPAM配列を含んでなる、部位に局在化し得る。
特定の実施形態では、標的核酸と相互作用して切断する、eaCas9分子またはeaCas9ポリペプチドの能力は、PAM配列依存性である。PAM配列は、標的核酸中の配列である。一実施形態では、標的核酸の切断は、PAM配列の上流で起こる。異なる細菌種からのeaCas9分子は、異なる配列モチーフ(例えば、PAM配列)を認識し得る。一実施形態では、S.ピオゲネス(S.pyogenes)のeaCas9分子は、配列モチーフNGGを認識して、その配列から、例えば、3〜5塩基対などの1〜10塩基対上流で、標的核酸配列の切断を誘導する(例えば、Mali 2013を参照されたい)。一実施形態では、S.サーモフィルス(S.thermophilus)のeaCas9分子は、配列モチーフNGGNG(配列番号199)および/またはNNAGAAW(W=AまたはT)(配列番号200)を認識して、例えば、これらの配列の3〜5塩基対などの1〜10塩基対上流で、標的核酸配列の切断を誘導する(例えば、Horvath 2010;Deveau 2008を参照されたい)。一実施形態では、S.ミュータンス(S.mutans)のeaCas9分子は、配列モチーフNGGおよび/またはNAAR(R=AまたはG)(配列番号201)を認識して、例えば、この配列の3〜5塩基対などの1〜10塩基対上流で、標的核酸配列の切断を誘導する(例えば、Deveau 2008を参照されたい)。一実施形態では、S.アウレウス(S.aureus)のeaCas9分子は、配列モチーフNNGRR(R=AまたはG)(配列番号202)を認識して、例えば、その配列の3〜5塩基対などの1〜10塩基対上流で、標的核酸配列の切断を誘導する。一実施形態では、S.アウレウス(S.aureus)のeaCas9分子は、配列モチーフNNGRRN(R=AまたはG)(配列番号203)を認識して、例えば、その配列の3〜5塩基対などの1〜10塩基対上流で、標的核酸配列の切断を誘導する。一実施形態では、S.アウレウス(S.aureus)のeaCas9分子は、配列モチーフNNGRRT(R=AまたはG)(配列番号204)を認識して、例えば、その配列の3〜5塩基対などの1〜10塩基対上流で、標的核酸配列の切断を誘導する。一実施形態では、S.アウレウス(S.aureus)のeaCas9分子は、配列モチーフNNGRRV(R=AまたはG、V=A、G、またはC)(配列番号205)を認識して、例えば、その配列の3〜5塩基対などの1〜10塩基対上流で、標的核酸配列の切断を誘導する。Cas9分子が、PAM配列を認識する能力は、例えば、(Jinek 2012)に記載される形質転換アッセイを使用して判定され得る。前述の実施形態のそれぞれ(すなわち、配列番号199〜205)で、Nは、例えば、A、G、C、またはTのいずれかなどの任意のヌクレオチド残基であり得る。
本明細書で考察されるように、Cas9分子は遺伝子操作されて、Cas9分子のPAM特異性が改変され得る。
代表的な天然起源Cas9分子は、以前に記載されている(例えば、Chylinski 2013を参照されたい)。このようなCas9分子としては、クラスター1細菌科、クラスター2細菌科、クラスター3細菌科、クラスター4細菌科、クラスター5細菌科、クラスター6細菌科、クラスター7細菌科、クラスター8細菌科、クラスター9細菌科、クラスター10細菌科、クラスター11細菌科、クラスター12細菌科、クラスター13細菌科、クラスター14細菌科、クラスター15細菌科、クラスター16細菌科、クラスター17細菌科、クラスター18細菌科、クラスター19細菌科、クラスター20細菌科、クラスター21細菌科、クラスター22細菌科、クラスター23細菌科、クラスター24細菌科、クラスター25細菌科、クラスター26細菌科、クラスター27細菌科、クラスター28細菌科、クラスター29細菌科、クラスター30細菌科、クラスター31細菌科、クラスター32細菌科、クラスター33細菌科、クラスター34細菌科、クラスター35細菌科、クラスター36細菌科、クラスター37細菌科、クラスター38細菌科、クラスター39細菌科、クラスター40細菌科、クラスター41細菌科、クラスター42細菌科、クラスター43細菌科、クラスター44細菌科、クラスター45細菌科、クラスター46細菌科、クラスター47細菌科、クラスター48細菌科、クラスター49細菌科、クラスター50細菌科、クラスター51細菌科、クラスター52細菌科、クラスター53細菌科、クラスター54細菌科、クラスター55細菌科、クラスター56細菌科、クラスター57細菌科、クラスター58細菌科、クラスター59細菌科、クラスター60細菌科、クラスター61細菌科、クラスター62細菌科、クラスター63細菌科、クラスター64細菌科、クラスター65細菌科、クラスター66細菌科、クラスター67細菌科、クラスター68細菌科、クラスター69細菌科、クラスター70細菌科、クラスター71細菌科、クラスター72細菌科、クラスター73細菌科、クラスター74細菌科、クラスター75細菌科、クラスター76細菌科、クラスター77細菌科、またはクラスター78細菌科のCas9分子が挙げられる。
代表的な天然起源Cas9分子としては、クラスター1細菌科のCas9分子が挙げられる。例としては、S.アウレウス(S.aureus)、S.ピオゲネス(S.pyogenes)(例えば、SF370、MGAS10270、MGAS10750、MGAS2096、MGAS315、MGAS5005、MGAS6180、MGAS9429、NZ131、SSI−1株)、S.サーモフィルス(S.thermophilus)(例えば、LMD−9株)、S.シュードポルシヌス(S.pseudoporcinus)(例えば、SPIN 20026株)、S.ミュータンス(S.mutans)(例えば、UA159、NN2025株)、S.マカカエ(S.macacae)(例えば、NCTC11558株)、S.ガロリチカス(S.gallolyticus)(例えば、UCN34、ATCCBAA−2069株)、S.エクイヌス(S.equinus)(S.equines)(例えば、ATCC9812、MGCS124株)、S.ディスガラクチアエ(S.dysgalactiae)(S.dysdalactiae)(例えば、GGS124株)、S.ボビス(S.bovis)(例えば、ATCC700338株)、S.アンギノーサス(S.anginosus)(例えば、F0211株)、S.アガラクチアエ(S.agalactiae)(例えば、NEM316、A909株)、リステリア・モノサイトゲネス(Listeria monocytogenes)(例えば、F6854株)、リステリア・イノキュア(Listeria innocua)(L.イノキュア(L.innocua))、例えば、Clip11262株)、エンテロコッカス・イタリクス(Enterococcus italicus)(例えば、DSM 15952株)、またはエンテロコッカス・フェシウム(Enterococcus faecium)(例えば、1,231,408株)のCas9分子が挙げられる。
特定の実施形態では、例えば、Cas9分子またはCas9ポリペプチドは、
本明細書に記載される任意のCas9分子配列、または例えば、本明細書で列挙され(例えば、配列番号1、2、4〜6、または12)、またはChylinski 2013に記載される、生物種からのCas9分子などの天然起源Cas9分子配列と比較すると、
60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、または99%の相同性を有し;
2、5、10、15、20、30、または40%以下のアミノ酸残基が異なり;
少なくとも1、2、5、10または20個のアミノ酸であるが、100、80、70、60、50、40または30個以下のアミノ酸が異なり;または
同一である、
アミノ酸配列を含んでなる。一実施形態では、Cas9分子は、以下の機能の1つまたは複数を含んでなる:ニッカーゼ活性;二本鎖切断活性(例えば、エンドヌクレアーゼおよび/またはエキソヌクレアーゼ活性);ヘリカーゼ活性;またはgRNA分子と一緒に、標的核酸に局在化する能力。
特定の実施形態では、Cas9分子またはCas9ポリペプチドは、図2A〜2Gのコンセンサス配列のアミノ酸配列のいずれかを含んでなり、図中、「」は、S.ピオゲネス(S.pyogenes)、S.サーモフィルス(S.thermophilus)、S.ミュータンス(S.mutans)、またはL.イノキュア(L.innocua)のCas9分子のアミノ酸配列中の対応する位置に見られる任意のアミノ酸を示し、「−」は、任意のアミノ酸を示す。一実施形態では、Cas9分子またはCas9ポリペプチドは、図2A〜2Gで開示されるコンセンサス配列の配列と、少なくとも1個であるが、2、3、4、5、6、7、8、9、または10個以下のアミノ酸残基が異なる。特定の実施形態では、Cas9分子またはCas9ポリペプチドは、配列番号2のアミノ酸配列を含んでなる。他の実施形態では、Cas9分子またはCas9ポリペプチドは、配列番号2の配列と、少なくとも1個であるが、2、3、4、5、6、7、8、9、または10個以下のアミノ酸残基が異なる。
いくつかのCas9分子の配列の比較は、特定領域が保存されていることを示唆する。これらは、次のように同定される。
領域1(残基1〜180、または領域1’の場合は残基120〜180)
領域2(残基360〜480);
領域3(残基660〜720);
領域4(残基817〜900);および
領域5(残基900〜960)。
特定の実施形態では、Cas9分子またはCas9ポリペプチドは、領域1〜5を含んでなり、十分な追加的なCas9分子配列と共に、例えば、本明細書に記載される少なくとも1つの活性を有するCas9分子などの生物活性分子を提供する。特定の実施形態では、領域1〜5は、それぞれ独立して、例えば、図2A〜2Gからの配列(配列番号1、2、4、5、14)などの、本明細書に記載されるCas9分子またはCas9ポリペプチドの対応する残基と、50%、60%、70%、80%、85%、90%、95%、96%、97%、98%、または99%の相同性を有する。
特定の実施形態では、Cas9分子またはCas9ポリペプチドは、
S.ピオゲネス(S.pyogenes)のCas9(配列番号2)のアミノ酸配列のアミノ酸1〜180(番号付けは図2のモチーフ配列に従う;図2A〜2Gの4つのCas9配列中の52%の残基は保存的である)と、50%、60%、70%、80%、85%、90%、95%、96%、97%、98%または99%の相同性を有し;
S.ピオゲネス(S.pyogenes)、S.サーモフィルス(S.thermophilus)、S.ミュータンス(S.mutans)、またはリステリア・イノキュア(Listeria innocua)のCas9のアミノ酸配列(それぞれ、配列番号2、4、1、および5)のアミノ酸1〜180と、少なくとも1、2、5、10または20アミノ酸であるが、90、80、70、60、50、40、または30以下のアミノ酸が異なり;または
S.ピオゲネス(S.pyogenes)、S.サーモフィルス(S.thermophilus)、S.ミュータンス(S.mutans)、またはL.イノキュア(L.innocua)のCas9のアミノ酸配列(それぞれ、配列番号2、4、1、および5)のアミノ酸1〜180と同一である、
領域1と称されるアミノ酸配列を含んでなる。
特定の実施形態では、Cas9分子またはCas9ポリペプチドは、
S.ピオゲネス(S.pyogenes)、S.サーモフィルス(S.thermophilus)、S.ミュータンス(S.mutans)または、L.イノキュア(L.innocua)のCas9のアミノ酸配列(それぞれ、配列番号2、4、1、および5)のアミノ酸120〜180(図2の4つのCas9配列中の55%の残基は保存的である)と、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%または99%の相同性を有し;
S.ピオゲネス(S.pyogenes)、S.サーモフィルス(S.thermophilus)、S.ミュータンス(S.mutans)、またはL.イノキュア(L.innocua)のCas9のアミノ酸配列(それぞれ、配列番号2、4、1、および5)のアミノ酸120〜180と、少なくとも1、2、または5アミノ酸であるが、35、30、25、20、または10以下のアミノ酸が異なり;または
S.ピオゲネス(S.pyogenes)、S.サーモフィルス(S.thermophilus)、S.ミュータンス(S.mutans)、またはL.イノキュア(L.innocua)のCas9のアミノ酸配列(それぞれ、配列番号2、4、1、および5)のアミノ酸120〜180と同一である、
領域1’と称されるアミノ酸配列を含んでなる。
特定の実施形態では、Cas9分子またはCas9ポリペプチドは、
S.ピオゲネス(S.pyogenes)、S.サーモフィルス(S.thermophilus)、S.ミュータンス(S.mutans)または、L.イノキュア(L.innocua)のCas9のアミノ酸配列(それぞれ、配列番号2、4、1、および5)のアミノ酸360〜480(図2の4つのCas9配列中の52%の残基は保存的である)と、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、または99%の相同性を有し;
S.ピオゲネス(S.pyogenes)、S.サーモフィルス(S.thermophilus)、S.ミュータンス(S.mutans)、またはL.イノキュア(L.innocua)のCas9のアミノ酸配列(それぞれ、配列番号2、4、1、および5)のアミノ酸360〜480と、少なくとも1、2、または5アミノ酸であるが、35、30、25、20、または10以下のアミノ酸が異なり;または
S.ピオゲネス(S.pyogenes)、S.サーモフィルス(S.thermophilus)、S.ミュータンス(S.mutans)、またはL.イノキュア(L.innocua)のCas9のアミノ酸配列(それぞれ、配列番号2、4、1、および5)のアミノ酸360〜480と同一である、
領域2と称されるアミノ酸配列を含んでなる。
特定の実施形態では、Cas9分子またはCas9ポリペプチドは、
S.ピオゲネス(S.pyogenes)、S.サーモフィルス(S.thermophilus)、S.ミュータンス(S.mutans)または、L.イノキュア(L.innocua)のCas9のアミノ酸配列(それぞれ、配列番号2、4、1、および5)のアミノ酸660〜720(図2の4つのCas9配列中の56%の残基は保存的である)と、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、または99%の相同性を有し;
S.ピオゲネス(S.pyogenes)、S.サーモフィルス(S.thermophilus)、S.ミュータンス(S.mutans)、またはL.イノキュア(L.innocua)のCas9のアミノ酸配列(それぞれ、配列番号2、4、1、および5)のアミノ酸660〜720と、少なくとも1、2、または5アミノ酸であるが、35、30、25、20、または10以下のアミノ酸が異なり;または
S.ピオゲネス(S.pyogenes)、S.サーモフィルス(S.thermophilus)、S.ミュータンス(S.mutans)、またはL.イノキュア(L.innocua)のCas9のアミノ酸配列(それぞれ、配列番号2、4、1、および5)のアミノ酸660〜720と同一である、
領域3と称されるアミノ酸配列を含んでなる。
特定の実施形態では、Cas9分子またはCas9ポリペプチドは、
S.ピオゲネス(S.pyogenes)、S.サーモフィルス(S.thermophilus)、S.ミュータンス(S.mutans)または、L.イノキュア(L.innocua)のCas9のアミノ酸配列(それぞれ、配列番号2、4、1、および5)のアミノ酸817〜900(図2の4つのCas9配列中の55%の残基は保存的である)と、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、または99%の相同性を有し;
S.ピオゲネス(S.pyogenes)、S.サーモフィルス(S.thermophilus)、S.ミュータンス(S.mutans)、またはL.イノキュア(L.innocua)のCas9のアミノ酸配列(それぞれ、配列番号2、4、1、および5)のアミノ酸817〜900と、少なくとも1、2、または5アミノ酸であるが、35、30、25、20、または10以下のアミノ酸が異なり;または
S.ピオゲネス(S.pyogenes)、S.サーモフィルス(S.thermophilus)、S.ミュータンス(S.mutans)、またはL.イノキュア(L.innocua)のCas9のアミノ酸配列(それぞれ、配列番号2、4、1、および5)のアミノ酸817〜900と同一である、
領域4と称されるアミノ酸配列を含んでなる。
特定の実施形態では、Cas9分子またはCas9ポリペプチドは、
S.ピオゲネス(S.pyogenes)、S.サーモフィルス(S.thermophilus)、S.ミュータンス(S.mutans)または、L.イノキュア(L.innocua)のCas9のアミノ酸配列(それぞれ、配列番号2、4、1、および5)のアミノ酸900〜960(図2の4つのCas9配列中の60%の残基は保存的である)と、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、または99%の相同性を有し;
S.ピオゲネス(S.pyogenes)、S.サーモフィルス(S.thermophilus)、S.ミュータンス(S.mutans)、またはL.イノキュア(L.innocua)のCas9のアミノ酸配列(それぞれ、配列番号2、4、1、および5)のアミノ酸900〜960と、少なくとも1、2、または5アミノ酸であるが、35、30、25、20、または10以下のアミノ酸が異なり;または
S.ピオゲネス(S.pyogenes)、S.サーモフィルス(S.thermophilus)、S.ミュータンス(S.mutans)、またはL.イノキュア(L.innocua)のCas9のアミノ酸配列(それぞれ、配列番号2、4、1、および5)のアミノ酸900〜960と同一である、
領域5と称されるアミノ酸配列を含んでなる。
遺伝子操作または改変Cas9
本明細書に記載されるCas9分子およびCas9ポリペプチドは、ヌクレアーゼ活性(例えば、エンドヌクレアーゼおよび/またはエキソヌクレアーゼ活性);ヘリカーゼ活性;gRNA分子と機能的に結合する能力;および核酸上の部位を標的化する(またはそれに局在化する)能力(例えば、PAM認識および特異性)をはじめとする、いくつかの特性のいずれかを有し得る。特定の実施形態では、Cas9分子またはCas9ポリペプチドは、これらの特性の全部または一部を含み得る。典型的な実施形態では、Cas9分子またはCas9ポリペプチドはgRNA分子と相互作用し、gRNA分子と協調して、核酸中の部位に局在化する能力を有する。例えば、PAM特異性、切断活性、またはヘリカーゼ活性などのその他の活性は、Cas9分子およびCas9ポリペプチド中でより幅広く変動し得る。
Cas9分子としては、遺伝子操作Cas9分子および遺伝子操作Cas9ポリペプチドが挙げられる(遺伝子操作は、この文脈の用法では、Cas9分子またはCas9ポリペプチドが参照配列と異なることを単に意味し、プロセスまたは起源の制限は暗示しない)。遺伝子操作Cas9分子またはCas9ポリペプチドは、例えば、改変されたヌクレアーゼ活性(天然のまたはその他の参照Cas9分子と比較して)または改変されたヘリカーゼ活性などの改変された酵素特性を含んでなり得る。本明細書中で考察されるように、遺伝子操作Cas9分子またはCas9ポリペプチドは、(二本鎖ヌクレアーゼ活性とは対照的に)ニッカーゼ活性を有し得る。特定の実施形態では、遺伝子操作Cas9分子またはCas9ポリペプチドは、例えば、1つまたは複数のCas9活性に顕著な影響を及ぼさずに、例えば、その大きさを減少させるアミノ酸配列の欠失などのその大きさを変化させる改変を有し得る。特定の実施形態では、遺伝子操作Cas9分子またはCas9ポリペプチドは、PAM認識に影響を及ぼす改変を含んでなり得て、例えば、遺伝子操作Cas9分子は、内因性野生型PIドメインによって認識されるもの以外のPAM配列を認識するように改変され得る。特定の実施形態では、Cas9分子またはCas9ポリペプチドは、天然のCas9分子と配列が異なり得るが、1つまたは複数のCas9活性に顕著な改変を有しない。
所望の特性を有するCas9分子またはCas9ポリペプチドは、例えば、天然の親Cas9分子または親Cas9ポリペプチドなどの改変などによっていくつかの様式で作製されて、所望の特性を有する改変Cas9分子またはCas9ポリペプチドが提供され得る。例えば、天然または改変Cas9分子などの親Cas9分子と比較して、1つまたは複数の変異または差異が導入され得る。このような変異および差異は、置換(例えば、非必須アミノ酸の保存的置換または置換);挿入;または欠失を含んでなる。一実施形態では、Cas9分子またはCas9ポリペプチドは、例えば、親Cas9分子などの参照Cas9分子と比較して、例えば、少なくとも1、2、3、4、5、10、15、20、30、40または50の変異であるが、200、100または80未満の変異などの1つまたは複数の変異または差異を含んでなり得る。
特定の実施形態では、単数の変異または複数の変異は、例えば、本明細書に記載されるCas9活性などのCas9活性に対する実質的効果を有しない。その他の実施形態では、単数の変異または複数の変異は、例えば、本明細書に記載されるCas9活性などのCas9活性に対する実質的効果を有する。
非切断および修飾切断Cas9分子
一実施形態では、Cas9分子またはCas9ポリペプチドは、天然Cas9分子と異なる切断特性を含んでなり、例えば、それは最も近い相同性を有する天然Cas9分子と異なる。例えば、Cas9分子またはCas9ポリペプチドは、S.ピオゲネス(S.pyogenes)Cas9分子などの天然起源Cas9分子と、例えば、次のように異なり得る:例えば、天然起源Cas9分子(例えば、S.ピオゲネス(S.pyogenes)Cas9分子)と比較して、二本鎖核酸(エンドヌクレアーゼおよび/またはエキソヌクレアーゼ活性)を調節する能力が、例えば、低下または増大され;例えば、天然起源Cas9分子(例えば、S.ピオゲネス(S.pyogenes)Cas9分子)と比較して、核酸分子の非相補鎖または核酸分子の相補鎖などの核酸の一本鎖の切断(ニッカーゼ活性)を調節する能力が、例えば、低下または増大され;または例えば、二本鎖または一本鎖核酸分子などの核酸分子を切断する能力が、排除され得る。
特定の実施形態では、eaCas9分子またはeaCas9ポリペプチドは、以下の機能の1つまたは複数を含んでなる:N末端RuvC様ドメインに関連した切断活性;HNH様ドメインに関連した切断活性;HNH様ドメインに関連した切断活性およびN末端RuvC様ドメインに関連した切断活性。
特定の実施形態ではeaCas9分子またはeaCas9ポリペプチドは、活性のまたは切断能力があるHNH様ドメイン(例えば、配列番号24〜28などの本明細書に記載されるHNH様ドメイン)と、不活性なまたは切断能力がないN末端RuvC様ドメインとを含んでなる。代表的な不活性のまたは切断能力がないN末端RuvC様ドメインは、N末端RuvC様ドメイン中にアスパラギン酸の変異を有し得て、例えば、図2A〜2Gで開示されるコンセンサス配列の9位のアスパラギン酸、または配列番号2の10位のアスパラギン酸が、例えば、アラニンで置換され得る。一実施形態では、eaCas9分子またはeaCas9ポリペプチドは、N末端RuvC様ドメインにおいて野性型と異なり、標的核酸を切断せず、または例えば、本明細書に記載されるアッセイによる測定で、参照Cas9分子の切断活性の20、10、5、1または0.1%未満の有意により低い効率で切断する。参照Cas9分子は、例えば、S.ピオゲネス(S.pyogenes)、またはS.サーモフィルス(S.thermophilus)のCas9分子のような、天然起源Cas9分子などの天然起源未修飾Cas9分子であり得る。一実施形態では、参照Cas9分子は、最も近い配列同一性または相同性を有する天然起源Cas9分子である。
一実施形態では、eaCas9分子またはeaCas9ポリペプチドは、不活性のまたは切断能力がないHNHドメインと、活性のまたは切断能力がある、N末端RuvC様ドメイン(例えば、配列番号15〜23などの本明細書に記載されるRuvC様ドメイン)とを含んでなる。代表的な不活性のまたは切断能力がないHNH様ドメインは、以下の1つまたは複数の変異を有し得る:例えば、図2A〜2Gで開示されるコンセンサス配列の856位のヒスチジンなどのHNH様ドメイン中のヒスチジンが、例えば、アラニンで置換され得る;例えば、図2A〜2Gで開示されるコンセンサス配列の870位のアスパラギン、および/または図2A〜2Gで開示されるコンセンサス配列の879位のアスパラギンなどのHNH様ドメイン中の1つまたは複数のアスパラギンが、例えば、アラニンで置換され得る。一実施形態では、eaCas9は、HNH様ドメインにおいて野性型と異なり、標的核酸を切断せず、または例えば、本明細書に記載されるアッセイによる測定で、参照Cas9分子の切断活性の20、10、5、1または0.1%未満の有意により低い効率で切断する。参照Cas9分子は、例えば、S.ピオゲネス(S.pyogenes)、またはS.サーモフィルス(S.thermophilus)のCas9分子のような、天然起源Cas9分子などの天然起源未修飾Cas9分子であり得る。一実施形態では、参照Cas9分子は、最も近い配列同一性または相同性を有する天然起源Cas9分子である。
特定の実施形態では、例示的Cas9活性は、PAM特異性、切断活性、およびヘリカーゼ活性の1つまたは複数を含んでなる。変異は、例えば、N末端RuvCドメイン;HNHドメイン;RuvCドメインおよびHNHドメイン外の領域などの1つまたは複数のRuvCドメインに存在し得る。一実施形態では、変異は、RuvCドメインに存在する。一実施形態では、変異は、HNHドメイン内に存在する。一実施形態では、変異は、RuvCドメインおよびHNHドメインの双方に存在する。
S.ピオゲネス(S.pyogenes)の配列に関して、RuvCドメインまたはHNHドメインに加えられてもよい例示的な変異としては、D10A、E762A、H840A、N854A、N863A、および/またはD986Aが挙げられる。
特定の実施形態では、Cas9分子は、参照Cas9分子と比較して、RuvCドメインおよび/またはHNHドメインに1つまたは複数の差異を含んでなるeiCas9分子であってもよく、その中では、eiCas9分子は、核酸を切断せず、または例えば、本明細書に記載される切断アッセイにおいて、eiCas9分子は、対応する野生型Cas9分子などの参照Cas9分子よりも、50%、25%、10%、または1%低い効率で切断するなど、参照Cas9分子よりも有意に低い効率で切断する。
例えば、置換などの特定の配列が、標的化活性、切断活性などの1つまたは複数の活性に影響を及ぼすか否かは、例えば、変異が保存的であるかどうかを評価することで評価または予測され得る。一実施形態では、Cas9分子の文脈で使用されるような「非必須」アミノ酸残基は、Cas9活性(例えば、切断活性)を無効化することなく、またはより好ましくは、実質的に改変することなく、例えば、eaCas9分子のような天然Cas9分子などのCas9分子の野生型配列から改変され得る残基である一方で、「必須」アミノ酸残基の変更は、実質的な活性(例えば、切断活性)喪失をもたらす。
一実施形態では、Cas9分子は、天然Cas9分子と異なる切断特性を含んでなり、例えば、それは最も近い相同性を有する天然Cas9分子と異なる。例えば、Cas9分子は、S.アウレウス(S.aureus)、S.ピオゲネス(S.pyogenes)、またはC.ジェジュニ(C.jejuni)のCas9分子などの天然Cas9分子と、次のように異なり得る:例えば、天然Cas9分子(例えば、S.アウレウス(S.aureus)、S.ピオゲネス(S.pyogenes)、またはC.ジェジュニ(C.jejuni)のCas9分子)と比較して、二本鎖切断(エンドヌクレアーゼおよび/またはエキソヌクレアーゼ活性)を調節する能力が、例えば、低下または増大され;例えば、天然Cas9分子(例えば、S.アウレウス(S.aureus)、S.ピオゲネス(S.pyogenes)、またはC.ジェジュニ(C.jejuni)のCas9分子)と比較して、核酸分子の非相補(non−complimentary)鎖または核酸分子の相補鎖などの核酸の一本鎖の切断(ニッカーゼ活性)を調節する能力が、例えば、低下または増大され;または例えば、二本鎖または一本鎖核酸分子などの核酸分子を切断する能力が、排除され得る。
一実施形態では、改変Cas9分子は、以下の活性の1つまたは複数を含むeaCas9分子である:RuvCドメインに関連する切断活性;HNHドメインに関連する切断活性;HNHドメインに関連する切断活性およびRuvCドメインに関連する切断活性。
特定の実施形態では、改変Cas9分子は、核酸分子(二本鎖のまたは一本鎖核酸分子のいずれも)を切断せず、または例えば、本明細書に記載されるアッセイによる測定で、参照Cas9分子の切断活性の20%、10%、5%、1%または0.1%未満の有意により低い効率で核酸分子を切断する、eiCas9分子である。参照Cas9分子は、例えば、S.ピオゲネス(S.pyogenes)、S.サーモフィルス(S.thermophilus)、S.アウレウス(S.aureus)、C.ジェジュニ(C.jejuni)またはN.メニンジチディス(N.meningitidis)のCas9分子のような、天然起源Cas9分子などの天然起源未修飾Cas9分子であり得る。特定の実施形態では、参照Cas9分子は、最も近い配列同一性または相同性を有する天然起源Cas9分子である。特定の実施形態では、eiCas9分子は、RuvCドメインに関連した実質的な切断活性、および/またはHNHドメインに関連した切断活性を欠く。
特定の実施形態では、改変Cas9分子またはCas9ポリペプチドは、その中で、図2A〜2Gで開示されるコンセンサス配列の固定配列に対応して、固定残基の1、2、3、4、5、10、15、または20%以下が、図2A〜2Gで開示されるコンセンサス配列と異なる配列;および図2A〜2Gで開示されるコンセンサス配列中の「」によって同定される残基に対応して、「」残基の1、2、3、4、5、10、15、20、25、30、35、または40%以下が、例えば、S.サーモフィルス(S.thermophilus)、S.ミュータンス(S.mutans)、S.ピオゲネス(S.pyogenes)、またはL.イノキュア(L.innocua)Cas9分子などの天然のCas9分子の対応する配列と異なる配列を含んでなる。
一実施形態では、改変Cas9分子またはCas9ポリペプチドは、図2A〜2Gで開示されるコンセンサス配列(配列番号14)中の「」によって表示される1つまたは複数の残基(例えば、2、3、5、10、15、20、30、50、70、80、90、100、または200アミノ酸残基)に、S.サーモフィルス(S.thermophilus)の配列と異なる1つまたは複数のアミノ酸(例えば、置換)を有する、図2A〜2Gで開示されるS.サーモフィルス(S.thermophilus)Cas9のアミノ酸配列(配列番号4)を含んでなる、eaCas9分子またはeaCas9ポリペプチドである。
一実施形態では、改変Cas9分子またはCas9ポリペプチドは、図2A〜2Gで開示されるコンセンサス配列(配列番号14)中の「」によって表示される1つまたは複数の残基(例えば、2、3、5、10、15、20、30、50、70、80、90、100、または200アミノ酸残基)に、S.ミュータンス(S.mutans)の配列と異なる1つまたは複数のアミノ酸(例えば、置換)を有する、図2A〜2Gで開示されるS.ミュータンス(S.mutans)Cas9のアミノ酸配列(配列番号1)を含んでなる、eaCas9分子またはeaCas9ポリペプチドである。
一実施形態では、改変Cas9分子またはCas9ポリペプチドは、図2A〜2Gで開示されるコンセンサス配列(配列番号14)中の「」によって表示される1つまたは複数の残基(例えば、2、3、5、10、15、20、30、50、70、80、90、100、または200アミノ酸残基)に、S.ピオゲネス(S.pyogenes)の配列と異なる1つまたは複数のアミノ酸(例えば、置換)を有する、図2A〜2Gで開示されるS.ピオゲネス(S.pyogenes)Cas9のアミノ酸配列(配列番号2)を含んでなる、eaCas9分子またはeaCas9ポリペプチドである。
一実施形態では、改変Cas9分子またはCas9ポリペプチドは、図2A〜2Gで開示されるコンセンサス配列(配列番号14)中の「」によって表示される1つまたは複数の残基(例えば、2、3、5、10、15、20、30、50、70、80、90、100、または200アミノ酸残基)に、L.イノキュア(L.innocua)の配列と異なる1つまたは複数のアミノ酸(例えば、置換)を有する、図2A〜2Gで開示されるL.イノキュア(L.innocua)Cas9のアミノ酸配列(配列番号5)を含んでなる、eaCas9分子またはeaCas9ポリペプチドである。
特定の実施形態では、例えば、eaCas9分子またはeaCas9ポリペプチドなどの改変Cas9分子またはCas9ポリペプチドは、例えば、異なる生物種の2つ以上の天然のCas9分子などの2つ以上の(two of more)異なるCas9分子などの融合体であり得る。例えば、1つの生物種の天然Cas9分子断片が、第2の生物種のCas9分子断片に融合され得る。一例として、N末端RuvC様ドメインを含んでなるS.ピオゲネス(S.pyogenes)Cas9分子の断片が、HNH様ドメインを含んでなるS.ピオゲネス(S.pyogenes)以外の生物種(例えば、S.サーモフィルス(S.thermophilus)のCas9分子の断片に融合され得る。
PAM認識が改変されているか全くないCas9
天然のCas9分子は、例えば、上でS.ピオゲネス(S.pyogenes)、S.サーモフィルス(S.thermophilus)、S.ミュータンス(S.mutans)、およびS.アウレウス(S.aureus)について記載される、PAM認識配列などの特定のPAM配列を認識し得る。
特定の実施形態では、Cas9分子またはCas9ポリペプチドは、天然Cas9分子と同じPAM特異性を有する。その他の実施形態では、Cas9分子またはCas9ポリペプチドは、天然Cas9分子と関連しないPAM特異性を有し、またはそれが最も近い配列相同性を有する天然Cas9分子と関連しないPAM特異性を有する。例えば、天然Cas9分子は改変され得て、例えば、PAM認識が改変されて、例えば、オフターゲット部位が減少されおよび/または特異性が改善されるように、Cas9分子またはCas9ポリペプチドが認識するPAM配列が改変され;またはPAM認識要求が排除される。特定の実施形態では、Cas9分子またはCas9ポリペプチドは改変され得て、例えば、PAM認識配列の長さを増加させ、および/またはCas9特異性を高レベルの同一性に向上させ(例えば、gRNAとPAM配列との間の98%、99%、または100%一致)、例えば、オフターゲット部位が低減され、および/または特異性が増加される。特定の実施形態では、PAM認識配列の長さは、少なくとも4、5、6、7、8、9、10または15アミノ酸長である。一実施形態では、Cas9特異性は、gRNAとPAM配列との間の少なくとも90%、95%、96%、97%、98%、99%以上の相同性を必要とする。異なるPAM配列を認識する、および/またはオフターゲット活性の低下を有するCas9分子またはCas9ポリペプチドは、指向性進化を使用して作製され得る。Cas9分子の指向性進化のために使用され得る代表的な方法およびシステムは、記載されている(例えば、Esvelt 2011を参照されたい)。候補Cas9分子は、例えば、本明細書に記載される方法によって評価され得る。
サイズ最適化Cas9
本明細書に記載の遺伝子操作Cas9分子および遺伝子操作Cas9ポリペプチドとしては、例えば、本質的に天然立体配座、Cas9ヌクレアーゼ活性、および/または標的核酸分子認識などの所望のCas9特性をなおも保つ一方で、分子サイズを低下させる欠失を含んでなる、Cas9分子またはCas9ポリペプチドが挙げられる。本明細書では、1つまたは複数の欠失と場合により1つまたは複数のリンカーとを含んでなる、Cas9分子またはCas9ポリペプチドが提供され、その中では、欠失の側面に位置するアミノ酸残基の間にリンカーが配置される。参照Cas9分子中の適切な欠失を同定する方法、欠失およびリンカーを有するCas9分子を作製する方法、およびこのようなCas9分子を使用する方法は、この文献を検討することにより、当業者には明らかであろう。
例えば、欠失を有する、S.アウレウス(S.aureus)、S.ピオゲネス(S.pyogenes)、またはC.ジェジュニ(C.jejuni)のCas9分子などのCas9分子は、例えば、対応する天然Cas9分子よりもアミノ酸数が減少するなど、より小型である。Cas9分子のより小さなサイズによって、送達方法の融通性が増し、それによってゲノム編集の有用性が増す。Cas9分子は、1つまたは複数の欠失を含んでなり得て、それは、本明細書に記載される得られたCas9分子の活性に実質的に影響を及ぼさず、またはそれを低下させない。本明細書に記載される欠失を含んでなるCas9分子に保持される活性としては、
ニッカーゼ活性、すなわち、例えば、核酸分子の非相補鎖または相補鎖などの一本鎖を切断する能力;
一実施形態では2つのニッカーゼ活性の存在である、二本鎖ヌクレアーゼ活性、すなわち、二本鎖核酸の双方の鎖を切断して、二本鎖切断を生成する能力;
エンドヌクレアーゼ活性;
エキソヌクレアーゼ活性;
ヘリカーゼ活性、すなわち、二本鎖核酸のらせん構造を巻き戻す能力;
および例えば、標的核酸またはagRNAなどの核酸分子の認識活性
の1つまたは複数が挙げられる。
本明細書に記載されるCas9分子の活性は、本明細書または当技術分野で記載される活性アッセイを使用して評価され得る。
欠失に適する領域を同定する
欠失のためのCas9分子の適切な領域は、多様な方法によって同定され得る。例えば、表1に記載されるもののいずれかなどの様々な細菌種に由来する天然オルソロガスCas9分子をS.ピオゲネス(S.pyogenes)Cas9の結晶構造上にモデル化して(Nishimasu 2014)、タンパク質の三次元立体構造に関して、選択されたCas9オルソログ全体にわたる保存レベルを調べ得る。例えば、標的核酸分子および/またはgRNAとの界面などの、Cas9活性に関与する領域から離れて空間的に位置する、保存性が低いまたは非保存領域は、Cas9活性に実質的に影響を及ぼさずまたは低減させない欠失候補である、領域またはドメインに相当する。
Cas9分子をコードする核酸
例えば、eaCas9分子またはeaCas9ポリペプチドなどのCas9分子またはCas9ポリペプチドをコードする核酸が、本明細書で提供される。例示的Cas9分子をコードする核酸またはCas9ポリペプチドは、以前記載されている(例えば、Cong 2013;Wang 2013;Mali 2013;Jinek 2012を参照されたい)。
一実施形態では、Cas9分子またはCas9ポリペプチドをコードする核酸は、合成核酸配列であり得る。例えば、合成核酸分子は、例えば、本明細書に記載されるようにして、化学修飾され得る。一実施形態では、Cas9 mRNAは、例えば、以下の全てなどの、以下の1つまたは複数の特性を有する:それは、キャッピングされ、ポリアデニル化され、5−メチルシチジンおよび/またはプソイドウリジンで置換される。
それに加えてまたは代案としては、合成核酸配列は、コドン最適化され得て、例えば、少なくとも1つの一般的でないコドンまたはあまり一般的でないコドンは、一般的コドンによって置換されている。例えば、合成核酸は、例えば、本明細書に記載される哺乳類発現系内での発現のために最適化された、最適化メッセンジャーmRNAの合成を誘導し得る。
それに加えて、または代案としては、Cas9分子またはCas9ポリペプチドをコードする核酸は、核局在化配列(NLS)を含んでなってもよい。核局在化配列は、当該技術分野で公知である。
S.ピオゲネス(S.pyogenes)Cas9分子をコードする代表的なコドン最適化核酸配列は、配列番号3に記載される。S.ピオゲネス(S.pyogenes)Cas9分子の対応するアミノ酸配列は、配列番号2に記載される。
S.アウレウス(S.aureus)のCas9分子をコードする例示的なコドン最適化核酸配列は、配列番号7に記載される。S.アウレウス(S.aureus)Cas9分子のアミノ酸配列は、配列番号6に記載される。
以下に提供されるのは、S.アウレウス(S.aureus)Cas9のCas9分子をコードする代表的なコドン最適化核酸配列である。
上記Cas9配列のいずれかが、C末端でペプチドまたはポリペプチドと融合する場合、停止コドンは除外されるものと理解される。
その他のCas分子およびCasポリペプチド
様々な型のCas分子またはCasポリペプチドを使用して、本明細書で開示された発明を実施し得る。いくつかの実施形態では、II型CasシステムのCas分子が使用される。その他の実施形態では、その他のCasシステムのCas分子が使用される。例えば、I型またはIII型Cas分子が使用されてもよい。例示的Cas分子(およびCasシステム)は、以前記載されている(例えば、Haft 2005およびMakarova 2011を参照されたい)。代表的なCas分子(およびCasシステム)は、表2にもまた示される。
候補分子の機能分析
候補Cas9分子、候補gRNA分子、および候補Cas9分子/gRNA分子複合体は、当該技術分野で周知の技術によって、または本明細書に記載されるように評価され得る。本明細書に記載される各技術は、単独で、または1つまたは複数の技術と組み合わせて用いられて、候補分子が評価されてもよい。本明細書で開示される技術は、限定されるものではないが、Cas9分子/gRNA分子複合体の安定性を判定する方法、安定なCas9分子/gRNA分子複合体を促進する条件を判定する方法、安定なCas9分子/gRNA分子複合体をスクリーニングする方法、安定なCas9分子/gRNA分子複合体を形成するのに最適なgRNAを同定する方法、対象に投与するためのCas9分子/gRNA分子複合体をスクリーニングする方法、および対象に投与するためのCas9分子/gRNA分子複合体を選択する方法をはじめとする様々な方法のために用いられてもよい。
Cas9/gRNA複合体の熱安定性を測定するための技術
Cas9−gRNAリボ核タンパク質(RNP)複合体の熱安定性は、示差走査型蛍光定量法(DSF)およびその他の技術によって検出され得る。タンパク質の熱安定性は、例えばgRNAなどの結合RNA分子の添加などの、好ましい条件下で増加させ得る。したがって、Cas9/gRNA複合体の熱安定性に関する情報は、複合体が安定しているかどうかを判定するのに有用である。
示差走査型蛍光定量法(DSF)
DSFは、タンパク質の熱安定性を測定するために用いられる技術である。アッセイは、いくつかの方法で適用され得る。代表的プロトコルとしては、RNP形成のための所望の溶液条件を判定するためのプロトコル(アッセイ1、下記参照)、gRNA:Cas9タンパク質の所望の化学量論比を試験するためのプロトコル(アッセイ2、下記参照)、例えば、野生型または変異Cas9分子などのCas9分子のための有効なgRNA分子をスクリーニングするためのプロトコル(アッセイ3、下記参照)、および標的DNAの存在下におけるRNP形成を調べるためのプロトコル(アッセイ4)が挙げられるが、これに限定されるものではない。
アッセイ1
RNP複合体を形成するための所望の溶液を判定するために、10×SYPRO Orange(登録商標)(Life Technologiesカタログ番号S−6650)と共にCas9の2μM水溶液を作製し、384ウェルプレートに分注する。次に、様々なpHおよび塩を有する溶液中に希釈された、等モル量のgRNAを添加する。室温で10分間インキュベートし、2000rpmで遠心分離してあらゆる気泡を除去した後、Bio−Rad CFXマネージャーソフトウエアと共に、Bio−Rad CFX384(商標)リアルタイムシステムC1000 Touch(商標)サーマルサイクラーを用いて、20℃から90℃まで、10秒毎に1℃の増分で勾配を実行した。
アッセイ2
第2のアッセイは、様々な濃度のgRNA分子と、上記アッセイ1からの緩衝液中の2μMのCas9とを混合し、384ウェルプレート内において室温で10分間インキュベートするステップを含む。10×SYPRO Orange(登録商標)(Life Technologiesカタログ番号S−6650)を含む等容積の最適緩衝液を添加して、プレートをMicroseal(登録商標)B接着剤(MSB−1001)で密封する。あらゆる気泡を除去するための2000rpmでの遠心分離に続いて、Bio−Rad CFXマネージャーソフトウエアと共に、Bio−Rad CFX384(商標)リアルタイムシステムC1000 Touch(商標)サーマルサイクラーを用いて、20℃から90℃まで、10秒毎に1℃の増分で勾配を実行した。
アッセイ3
第3のアッセイでは、目的のCas9分子(例えば、Cas9変異タンパク質などのCas9タンパク質)を精製する。変異gRNA分子のライブラリーを合成して、20μMの濃度に再懸濁する。Cas9分子を、5×SYPRO Orange(登録商標)(Life Technologiesカタログ番号S−6650)の存在下で、所定の緩衝液中でそれぞれ1μAの最終濃度でgRNA分子と共にインキュベートする。室温で10分間インキュベートし、2000rpmで2分間遠心分離してあらゆる気泡を除去した後、Bio−Rad CFXマネージャーソフトウエアと共に、Bio−Rad CFX384(商標)リアルタイムシステムC1000 Touch(商標)サーマルサイクラーを用いて、20℃から90℃まで、10秒毎に1℃の増分で勾配を実行した。
アッセイ4
第4のアッセイでは、以下のサンプルに対してDSF実験を実施する:Cas9タンパク質単独、Cas9タンパク質とgRNA、Cas9タンパク質とgRNAおよび標的DNA、およびCas9タンパク質と標的DNA。構成要素を混合する順序は、反応液、Cas9タンパク質、gRNA、DNA、およびSYPRO Orangeである。反応溶液は、MgClの非存在在下または存在下で、10mM HEPES pH7.5、100mM NaClを含有する。あらゆる気泡を除去するための2000rpmで2分間の遠心分離に続いて、Bio−Rad CFXマネージャーソフトウエアと共に、Bio−Rad CFX384(商標)リアルタイムシステムC1000 Touch(商標)サーマルサイクラーを用いて、20℃から90℃まで、10秒毎に1度の増分で勾配を実行した。
本明細書に記載される実施例1および2は、Cas9分子およびCas9/gRNA複合体の安定性を評価および判定するためのDSFを用いた例示的な結果を開示する。本明細書に示されるように、Cas9/gRNA複合体のより高いT値は、gRNA分子の非存在下でのCas9分子のT値と比較して、Cas9とgRNAとの間のより密接な複合体の指標となる。したがって、Cas9分子およびCas9/gRNA複合体のTに関する情報は、Cas9/gRNA複合体が安定かどうかを判定するために有用である。
DSFに加えて、Cas9分子/gRNA分子複合体またはその調製物におけるCas9分子の安定性を決定するために用いられてもよい、当技術分野で公知のいくつかの追加的な技術が存在する。これらとしては、示差走査熱量測定(DSC)および等温滴定熱量測定(ITC)をはじめとするが、これに限定されるものではない、熱安定性を測定するDSFの代替方法が挙げられる。
DSC
DSCは、異なる緩衝液中の材料、ならびにapoと対比した複合体の熱安定性を測定する非常に正確な技術である。DSCの利点は、サンプル間における、遷移のエンタルピーの差もまた提供し得ることである。しかし、DSCは、DSFよりも顕著に多量の(>50倍)試験材料を必要とする。DSCは、一度に1つのサンプルしか試験できないため、処理能力がより低い。
ITC
ITCは、2つの分子の相互作用の熱安定性および動態速度の双方を測定し得る。その他の技術と対比したITCの利点は、それがより正確な測定値および動的情報を提供することである。しかし、それはより低い処理量とより多くの量の材料を必要とする。
本明細書で開示される熱安定性技術を用いて、結合RNA分子の添加などの好ましい条件下で増加し得る、分子(例えば、Cas9分子)の熱安定性を測定してもよい。さらに、分子の熱安定性は、構成要素の存在などの好ましい条件下で増加してもよい。特定の実施形態では、構成要素は、添加剤、小分子、安定化試薬、緩衝液、pH、塩濃度、グリセロール濃度、またはその他の緩衝液成分を含んでなってもよい。
特定の実施形態では、分子の熱安定性値が、参照分子の熱安定性値より、または熱安定性参照値より高ければ、分子(例えば、Cas9/gRNA複合体)は選択されてもよく、または安定していると判定されてもよい。特定の実施形態では、測定される熱安定性値は、分子の変性温度値である。例えば、特定の実施形態では、分子の変性温度値が参照分子の変性温度値より、または変性温度参照値より高ければ、分子(例えば、Cas9/gRNA複合体)は選択されもよく、または安定していると判定されてもよい。特定の実施形態では、測定される熱安定性値は、分子のT値である。例えば、特定の実施形態では、分子のT値が、参照分子のT値よりまたはT参照値より高ければ、分子(例えば、Cas9/gRNA複合体)は選択されてもよく、または安定していると判定されてもよい。特定の実施形態では、参照分子は、gRNA分子の非存在下のCas9分子であってもよい。
特定の実施形態では、分子のT値が、参照分子のT値よりまたはT参照値より、少なくとも1℃、少なくとも2℃、少なくとも3℃、少なくとも4℃、少なくとも5℃、少なくとも6℃、少なくとも7℃、少なくとも8℃、少なくとも9℃、少なくとも10℃、少なくとも11℃、少なくとも12℃、少なくとも13℃、少なくとも14℃、少なくとも15℃、少なくとも16℃、少なくとも17℃、少なくとも18℃、少なくとも19℃、少なくとも20℃、少なくとも21℃、少なくとも22℃、少なくとも23℃、少なくとも24℃、少なくとも25℃、少なくとも26℃、少なくとも27℃、少なくとも28℃、少なくとも29℃、少なくとも30℃、少なくとも31℃、少なくとも32℃、少なくとも33℃、少なくとも34℃、少なくとも35℃、少なくとも36℃、少なくとも37℃、少なくとも38℃、少なくとも39℃、少なくとも40℃、少なくとも41℃、少なくとも42℃、少なくとも43℃、少なくとも44℃、少なくとも45℃、少なくとも46℃、少なくとも47℃、少なくとも48℃、少なくとも49℃、または少なくとも50℃高ければ、評価される分子は選択されてもよく、または安定していると判定されてもよい。例えば、分子のT値が、参照分子よりまたはT参照値より少なくとも8℃高ければ、評価される分子は選択されてもよく、または安定していると判定されてもよい。
特定の実施形態では、分子のT値が、参照分子のT値よりまたはT参照値より、約1℃、約2℃、約3℃、約4℃、約5℃、約6℃、約7℃、約8℃、約9℃、約10℃、約11℃、約12℃、約13℃、約14℃、約15℃、約16℃、約17℃、約18℃、約19℃、約20℃、約21℃、約22℃、約23℃、約24℃、約25℃、約26℃、約27℃、約28℃、約29℃、約30℃、約31℃、約32℃、約33℃、約34℃、約35℃、約36℃、約37℃、約38℃、約39℃、約40℃、約41℃、約42℃、約43℃、約44℃、約45℃、約46℃、約47℃、約48℃、約49℃、または約50℃高ければ、評価される分子は選択されてもよく、または安定していると判定されてもよい。例えば、分子のT値が、参照分子よりまたはT参照値より約8℃高ければ、評価される分子は選択されてもよく、または安定していると判定されてもよい。
特定の実施形態では、分子のT値が、参照分子のT値よりまたはT参照値より、約1℃〜約5℃、約6℃〜約10℃、約11℃〜約15℃、約16℃〜約20℃、約21℃〜約25℃、約26℃〜約30℃、約31℃〜約35℃、約36℃〜約40℃、約41℃〜約45℃、約46℃〜約50℃高ければ、評価される分子は選択されてもよく、または安定していると判定されてもよい。例えば、分子のT値が、参照分子よりまたはT参照値より約6℃〜約10℃高ければ、評価される分子は選択されてもよく、または安定していると判定されてもよい。特定の実施形態では、分子のT値が、参照分子よりまたはT参照値より約8℃〜約9℃高ければ、評価される分子は選択されてもよく、または安定していると判定されてもよい。
本明細書の特定の実施形態では、本明細書の方法は、Cas9分子/gRNA分子複合体のT値を検出するステップと、Cas9分子/gRNA分子複合体のT値と、参照分子のT値とのまたはT参照値との間のδ値を判定するステップと、δ値が少なくとも8℃であり、Cas9分子/gRNA分子複合体のT値が、参照分子のT値よりまたはT参照値より高ければ、Cas9分子/gRNA分子複合体が安定していると判定するステップとを含んでもよい。特定の実施形態では、参照分子は、gRNA分子を含まないCas9分子であってもよい。
特定の実施形態では、評価される分子のT値と、参照分子のT値との、またはT参照値との間のδ値が、少なくとも1℃、少なくとも2℃、少なくとも3℃、少なくとも4℃、少なくとも5℃、少なくとも6℃、少なくとも7℃、少なくとも8℃、少なくとも9℃、少なくとも10℃、少なくとも11℃、少なくとも12℃、少なくとも13℃、少なくとも14℃、少なくとも15℃、少なくとも16℃、少なくとも17℃、少なくとも18℃、少なくとも19℃、少なくとも20℃、少なくとも21℃、少なくとも22℃、少なくとも23℃、少なくとも24℃、少なくとも25℃、少なくとも26℃、少なくとも27℃、少なくとも28℃、少なくとも29℃、少なくとも30℃、少なくとも31℃、少なくとも32℃、少なくとも33℃、少なくとも34℃、少なくとも35℃、少なくとも36℃、少なくとも37℃、少なくとも38℃、少なくとも39℃、少なくとも40℃、少なくとも41℃、少なくとも42℃、少なくとも43℃、少なくとも44℃、少なくとも45℃、少なくとも46℃、少なくとも47℃、少なくとも48℃、少なくとも49℃、または少なくとも50℃であり、評価される分子のT値が、参照分子のT価値よりまたはT参照値より高ければ、特定の実施形態では、評価される分子は選択されてもよく、または安定していると判定されてもよい。特定の実施形態では、評価される分子はCA9分子/gRNA分子複合体であってもよく、参照分子はgRNA分子を含まないCas9分子であってもよい。
特定の実施形態では、評価される分子のT値と、参照分子のT値との、またはT参照値との間のδ値が、評価される分子のT値が、参照分子のT価値よりまたはT参照値より、約1℃、約2℃、約3℃、約4℃、約5℃、約6℃、約7℃、約8℃、約9℃、約10℃、約11℃、約12℃、約13℃、約14℃、約15℃、約16℃、約17℃、約18℃、約19℃、約20℃、約21℃、約22℃、約23℃、約24℃、約25℃、約26℃、約27℃、約28℃、約29℃、約30℃、約31℃、約32℃、約33℃、約34℃、約35℃、約36℃、約37℃、約38℃、約39℃、約40℃、約41℃、約42℃、約43℃、約44℃、約45℃、約46℃、約47℃、約48℃、約49℃、または約50℃高ければ、特定の実施形態では、評価される分子は選択されてもよく、または安定していると判定されてもよい。例えば、δ値が約8℃であり、Cas9分子/gRNA分子複合体のT値が、参照分子のT値よりまたはT参照値より高ければ、Cas9分子/gRNA分子複合体は選択されてもよく、または安定していると判定されてもよい。特定の実施形態では、参照分子は、gRNA分子を含まないCas9分子であってもよい。
特定の実施形態では、評価される分子のT値と、参照分子のT値との、またはT参照値との間のδ値が、評価される分子のT値が、参照分子のT価値よりまたはT参照値より、約1℃〜約5℃、約6℃〜約10℃、約11℃〜約15℃、約16℃〜約20℃、約21℃〜約25℃、約26℃〜約30℃、約31℃〜約35℃、約36℃〜約40℃、約41℃〜約45℃、約46℃〜約50℃高ければ、特定の実施形態では、評価される分子は選択されてもよく、または安定していると判定されてもよい。例えば、δ値が約6℃〜約10℃であり、Cas9分子/gRNA分子複合体のT値が参照分子のT価値よりまたはT参照値より高ければ、Cas9分子/gRNA分子複合体は選択されてもよく、または安定していると判定されてもよい。特定の実施形態では、参照分子は、gRNA分子を含まないCas9分子であってもよい。
特定の実施形態では、本明細書で使用される方法を用いて、Cas9分子と複合体形成する異なる長さを有する複数のgRNAが評価されて、どのCas9/gRNA複合体が安定なCas9/gRNA複合体を形成するかが判定されてもよい。これらの方法はまた、異なる化学量論のCas9分子およびgRNA分子を評価して、どのCas9/gRNA複合体が安定なCas9/gRNA複合体を形成するかを判定するために使用されてもよい。
特定の実施形態では、Cas9分子と、複数のgRNA分子の1つとを組み合わせることで、各サンプルがCas9/gRNA複合体を含んでなる、複数のサンプルが作製されてもよい。特定の実施形態では、Cas9/gRNA複合体のT値は、複数のサンプルのそれぞれで検出されてもよい。特定の実施形態では、(i)複数のサンプルにおけるT値と、参照Cas9/gRNA複合体のT値との、または所定の閾値T値との比較、または(ii)複数のサンプルのT値の相対的な順序付けの1つまたは複数に基づいて、少なくとも1つのサンプルが複数のサンプルから選択されてもよい。特定の実施形態では、T値は、DSFによって検出されてもよい。特定の実施形態では、Cas9分子/gRNA分子複合体のT値が、gRNA分子を含まないCas9分子のT値よりも少なくとも8℃高い場合に、少なくとも1つのサンプルが選択されてもよい。
Cas9およびCas9/gRNA複合体の活性を測定するための技術
熱安定性技術に加えて、本明細書中の方法と共に用いられてもよい、当該技術分野で公知の様々なその他の技術がある。例えば、Cas9分子/gRNA分子複合体またはその分子の特定の活性を測定して、Cas9分子/gRNA分子複合体またはその分子が安定しているかどうかが選択または決定され得る。これらの技術は、Cas9分子/gRNA分子複合体またはその分子が安定しているかどうかを判定するために、単独で、または本明細書に記載される熱安定性技術と併せて用いられてもよい。本明細書で開示される技術は、評価される分子(例えば、Cas9分子/gRNA分子複合体中のCas9分子、Cas9分子/gRNA分子複合体中のgRNA分子、またはCas9分子/gRNA分子複合体またはその調製物)の活性を検出するために用いられてもよい。特定の実施形態では、評価される分子の活性値が測定されてもよい。特定の実施形態では、評価される分子の活性値が、参照分子の活性値よりまたは活性参照値より高ければ、評価される分子は選択されてもよく、または安定していると判定されてもよい。
評価される分子の検出されてもよい様々な活性としては、分子の結合活性および切断活性が挙げられる。評価される分子の結合活性および切断活性は、本明細書に記載される技術を用いて検出されてもよい。
分子の結合活性のいくつかの例としては、gRNA分子がDNA標的にハイブリダイズしたまま留まる能力、gRNA分子がCas9分子/gRNA分子複合体のCas9分子に結合する能力、またはgRNA分子がCas9分子/gRNA分子複合体のCas9分子に結合する能力が挙げられるが、これに限定されるものではない。特定の実施形態では、分子の結合活性が検出される場合、結合値が測定されてもよい。特定の実施形態では、評価される分子の結合値が、参照分子の結合値よりまたは結合参照値より高ければ、評価される分子は選択されてもよく、または安定していると判定されてもよい。
切断活性のいくつかの例としては、インデルを誘導する能力、標的DNAを修飾する能力、および予め選択された修復方法の傾向が挙げられるが、これに限定されるものではない。特定の実施形態では、切断活性が検出される場合、切断値が測定されてもよい。特定の実施形態では、評価される分子の切断値が、参照分子の切断値よりまたは切断参照値より高ければ、評価される分子は選択されてもよく、または安定していると判定されてもよい。
Cas9およびCas9/gRNA複合体の結合活性(動態)を測定するための技術
評価される分子の結合活性(例えば、Cas9分子/gRNA分子複合体中のCas9分子、Cas9分子/gRNA分子複合体中のgRNA分子、またはCas9分子/gRNA分子複合体またはその調製物)は、様々な技術を用いて検出され得る。2つの分子間の結合の動態は、構成要素の存在などの特定の条件下でより好ましくあってもよい。特定の実施形態では、構成要素は、添加剤、小分子、安定化試薬、緩衝液、pH、塩濃度、グリセロール濃度、またはその他の緩衝液成分、または特定構成要素の添加を含んでなってもよい。
Cas9/gRNA複合体の結合活性の検出を含む方法としては、限定されるものではないが、gRNA分子がCas9分子/gRNA分子複合体のCas9分子に結合する能力の検出、およびCas9分子およびCas9/gRNA複合体が標的DNAに結合する能力の検出が挙げられる。これらの方法は、評価される分子の結合に関する生物物理学的情報を提供する、動態アッセイなどの技術を用いて実施されてもよい。用いられてもよい動態アッセイのいくつかの例は、限定されるものではないが、下述される、表面プラズモン共鳴(SPR)、BioLayer干渉法(BLI)、およびゲルバンドシフトアッセイである。
SPR
SPRは、BiaCoreまたはProteOn XPRシステムのどちらかの使用を必要とする。この技術では、1つの分子がチップの表面に、共有結合的に、またはアフィニティ法を通じてのどちらかで付着される。第2の分子がフローセルに注入され、緩衝液を介して押し出される。反射光の角度の変化は、プラズモン共鳴の量の変化を引き起こす。これから、動態結合および解離を測定することができる。
BLI
BLIは、forteBio製のOctetと称される装置を必要とする。BLIは、SPRと同様に、2つの分子間の相互作用の動態速度を判定できる。
ゲルバンドシフト解析
ゲルバンドシフト解析(例えば、電気泳動移動度シフト解析)は、2つの相互作用分子のKを判定する別の方法である。この測定は、その他の利用可能な技術よりも洗練されていないが、比較的安価な試薬を用いて実施され得るという利点がある。
結合アッセイ:Cas9分子およびCas9/gRNA複合体の標的DNAへの結合を試験する
Cas9分子の標的DNAへの結合を評価するための例示的方法は、以前記載されている(Jinek 2012)。SPR、BLIおよびゲルバンドシフト解析などの本明細書に記載される技術を用いて、例えば、gRNA分子がCas9分子/gRNA分子複合体のCas9分子に結合する能力、またはCas9分子およびCas9/gRNA複合体が標的DNAに結合する能力が測定されてもよい。
例えば、電気泳動移動度シフト解析では、脱イオン水中で各鎖(10nmol)を混合して、95℃で3分間加熱し、室温に緩慢に冷却することで、標的DNA二本鎖が形成される。全てのDNAは、1×TBEを含有する8%天然ゲル上で精製される。DNAバンドは、UVシャドーイングによって視覚化され、切除されて、ゲル小片をDEPC処理HOに浸漬することで溶出される。溶出されDNAは、エタノール沈殿されて、DEPC処理HOに溶解される。DNAサンプルは、[γ−32P]−ATPを使用して、T4ポリヌクレオチドキナーゼで37℃で30分間にわたり5’末端標識される。ポリヌクレオチドキナーゼは、65℃で20分間加熱変性され、カラムを使用して、組み込まれていない放射性標識が除去される。結合アッセイは、20mMのHEPES pH7.5、100mMのKCl、5mMのMgCl、1mMのDTT、および10%グリセロールを含有する緩衝液中で、総容積10μLで実施される。Cas9タンパク質分子は、等モル量のプレアニールgRNA分子でプログラムされて、100pMから1μMに滴定される。放射性標識DNAが、20pMの最終濃度に添加される。サンプルは、37℃で1時間インキュベートされ、1×TBEおよび5mMのMgClを含有する8%天然ポリアクリルアミドゲル上で、4℃で分離される。ゲルは乾燥されて、DNAはホスホロイメージングによって視覚化される。
Cas9/gRNA複合体の切断活性を測定するための技術
本明細書に記載の方法は、Cas9/gRNA複合体の切断活性を検出するステップを含んでもよい。これは、例えば、Cas9/gRNA複合体が標的核酸を切断する能力などの、Cas9/gRNA複合体が標的DNAを修飾する能力を検出するステップを含んでもよい。Cas9/gRNA複合体の切断活性を検出するために用いられてもよい技術のいくつかの例が、本明細書に記載される。
切断アッセイ:Cas9分子/gRNA分子複合体のエンドヌクレアーゼ活性を試験する
Cas9/gRNA複合体の安定性を判定するために試験され得る追加的な活性としては、例えば、Cas9/gRNA複合体が標的核酸を切断する能力などの、Cas9/gRNA複合体が標的DNAを修飾する能力が挙げられる。Cas9/gRNA複合体のエンドヌクレアーゼ活性は、本明細書中に開示されるように測定されてもよい。例えば、Cas9分子のエンドヌクレアーゼ活性を評価する例示的方法が、以前記載されている(Jinek 2012)。
Cas9分子/gRNA分子複合体が、標的核酸を結合および切断する能力は、プラスミド切断アッセイで評価され得る。このアッセイでは、合成または生体外転写gRNA分子が、95℃に加熱して緩慢に室温に冷却することで、反応に先だってプレアニールされる。天然または制限消化直線化プラスミドDNA(300ng(約8nM))が、10mMのMgCl存在下または不在下において、Cas9プラスミド切断緩衝液(20mMのHEPES pH7.5、150mMのKCl、0.5mMのDTT、0.1mMのEDTA)中の精製Cas9タンパク質分子(50〜500nM)およびgRNA(50〜500nM、1:1)と共に、37℃で60分間インキュベートされる。反応は、5×DNAローディングバッファー(30%グリセロール、1.2%SDS、250mMのEDTA)によって停止され、0.8または1%アガロースゲル電気泳動法によって分離され、臭化エチジウム染色によって視覚化される。得られた分解産物は、Cas9分子が、双方のDNA鎖を切断するか、または二本鎖の1本のみを切断するかどうかを示す。例えば、直鎖DNA生成物が、双方のDNA鎖の切断を示す一方で、ニックの入った開環状生成物は、二本鎖の1本のみが切断されていることを示す。
代案としては、Cas9分子/gRNA分子複合体が、標的核酸に結合して切断する能力は、オリゴヌクレオチドDNA切断アッセイで評価され得る。このアッセイでは、DNAオリゴヌクレオチド(10pmol)が、1×T4ポリヌクレオチドキナーゼ反応緩衝液中の5単位のT4ポリヌクレオチドキナーゼおよび約3〜6pmol(約20〜40mCi)[γ−32P]−ATPと、50μLの反応物中で37℃で30分間インキュベートすることで、放射性標識される。加熱不活性化(65℃で20分間)後、カラムに通して反応物が精製され、組み込まれていない標識が除去される。標識オリゴヌクレオチドと、等モル量の未標識相補的オリゴヌクレオチドとの95℃で3分間のアニーリングによって、二本鎖基質(100nM)が生成し、室温への緩慢な冷却がそれに続く。切断アッセイでは、95℃で30秒間加熱することでgRNA分子がアニールされ、室温への緩慢な冷却がそれに続く。Cas9(500nM最終濃度)が、切断アッセイ緩衝液(20mMのHEPES pH7.5、100mMのKCl、5mMのMgCl2、1mMのDTT、5%グリセロール)中のアニールされたgRNA分子(500nM)と共に、総容積9μLでプレインキュベートされる。1μLの標的DNA(10nM)の添加によって反応が開始され、37℃で1時間インキュベートされる。20μLのローディング色素(ホルムアミド中の5mMのEDTA、0.025%SDS、5%グリセロール)の添加によって反応がクエンチされ、95℃で5分間加熱される。分解産物は、7M尿素を含有する12%変性ポリアクリルアミドゲル上で分離され、ホスホロイメージングによって視覚化される。得られた分解産物は、相補鎖、非相補鎖、またはその双方が切断されたかどうかを示す。
これらのアッセイの片方または双方を用いて、Cas9/gRNA複合体の安定性を判定し、候補gRNA分子または候補Cas9分子の適合性を評価し得る。
ゲノム編集アプローチ
本明細書に記載の方法を用いて、Cas9分子/gRNA分子複合体を評価し得る。これらのCas9分子/gRNA分子複合体を使用して、本明細書で考察される1つまたは複数のアプローチまたは経路を用いて、遺伝子を標的化し得る。特定の実施形態では、標的遺伝子の変異は、外因的に提供される鋳型核酸を用いて、HDRによって修正される。その他の実施形態では、標的遺伝子の変異は、外因的に提供される鋳型核酸を用いることなく、HDRによって修正される。特定の実施形態では、標的遺伝子の片方または双方の対立遺伝子が、NHEJを用いてノックアウトされる。特定の実施形態では、標的遺伝子の発現がノックダウンされる。本明細書に記載の方法を用いて、Cas9分子/gRNA分子複合体が、本明細書で考察されるアプローチまたは経路の1つまたは複数に望ましいかどうかが評価され得る。
HDR修復および鋳型核酸
本明細書に記載されるように、ヌクレアーゼ誘導HDRを用いて、標的配列内の標的位置が改変され得る(例えば、ゲノム中の変異の修復または編集などの修正)。
特定の実施形態では、標的位置を改変させるためのHDRベースの方法は、外因的に提供される鋳型核酸(本明細書では、ドナーコンストラクトまたはドナー鋳型とも称される)を利用する。理論による拘束は望まないが、外因的に提供されるドナー鋳型または鋳型核酸を用いて、HDRによって標的位置の改変が起こると考えられている。プラスミドドナー鋳型は、相同組換えのための鋳型として利用され得ることが検討される。一本鎖ドナー鋳型が、標的配列およびドナー鋳型間で、代案のHDR(例えば、一本鎖アニーリング)方法による標的位置改変のための鋳型として、使用され得ることがさらに検討される。ドナー鋳型がもたらす標的位置の改変は、Cas9分子による切断に依存する。Cas9による切断は、二本鎖切断または2つの一本鎖切断を含んでなり得る。
その他の実施形態では、標的位置を改変するためのHDRベースの方法は、外因的に提供される鋳型核酸を利用しない。理論による拘束は望まないが、標的位置の改変は、内因性ゲノムドナー配列を有するHDRによって起こると考えられる。特定の実施形態では、内因性ゲノムドナー配列は、標的位置と同じ染色体上に位置する。その他の実施形態では、内因性ゲノムドナー配列は、標的配列と異なる染色体上に位置する。内因性ゲノムドナー配列による標的位置の改変は、Cas9分子による切断に依存する。Cas9による切断は、二本鎖切断または2つの一本鎖切断を含んでなり得る。
鋳型核酸を用いて、または内因性ゲノムドナー配列を用いて、HDRによって修正され得る変異としては、点変異が挙げられる。特定の実施形態では、点変異は、1つの二本鎖切断または2つの一本鎖切断のどちらかを用いて修正され得る。特定の実施形態では、点変異は、(1)1つの二本鎖切断、(2)2つの一本鎖切断、(3)切断が標的位置の両側で起こる2つの二本鎖切断、(4)二本鎖切断および2つの一本鎖切断が標的位置の両側で起こる1つの二本鎖切断および2つの一本鎖切断、(5)1対の一本鎖切断が標的位置の両側で起こる4つの一本鎖切断、または(6)1つの一本鎖切断によって修正され得る。
一本鎖鋳型核酸が用いられる特定の実施形態では、標的位置は、代替HDRによって改変され得る。
ドナー鋳型がもたらす標的位置の改変は、Cas9分子による切断に依存する。Cas9による切断は、ニック、二本鎖切断、または例えば、標的核酸の各鎖の上にある、2つの一本鎖切断を含んでなり得る。標的核酸に切断を導入した後、切断端で切除が起こり、一本鎖オーバーハングDNA領域が生じる。
標準HDRでは、標的核酸に直接的に組み込まれるか、または標的核酸の配列を修正するための鋳型として使用される、標的核酸に対する相同配列を含んでなる、二本鎖ドナー鋳型が導入される。切断点での切除後、修復は、例えば、二重Holliday接合モデル(または二本鎖切断修復、DSBR、経路)または合成依存性鎖アニーリング(SDSA)経路などの異なる経路によって進行し得る。二重Holliday接合モデルでは、標的核酸の2つの一本鎖オーバーハングによって、ドナー鋳型内の相同配列への鎖侵入が起こり、2つのHolliday接合部を有する中間体の形成がもたらされる。接合部は、侵入鎖の末端から新たなDNAが合成される際に移動して、切除の結果生じるギャップを充填する。新たに合成されたDNAの末端は、切除された末端にライゲートされて接合部が分解され、例えば、対応する標的位置へのドナー鋳型の正しい配列の組み込みなどの標的核酸の修正がもたらされる。ドナー鋳型との乗換えが、接合部の分解の際に起こってもよい。SDSA経路では、ただ1つの一本鎖オーバーハングのみがドナー鋳型に侵入し、侵入鎖の末端から新たなDNAが合成され、切除の結果生じるギャップを充填する。次に、新たに合成されたDNAは残りの一本鎖オーバーハングにアニーリングされ、新しいDNAが合成されてギャップを充填し、鎖がライゲートされて修正DNA二重鎖が生成される。
代替HDRでは、例えば鋳型核酸などの一本鎖ドナー鋳型が導入される。所望のA1AT標的位置を変更するための、標的核酸におけるニック、一本鎖切断または二本鎖切断は、例えば本明細書に記載されるCas9分子によって媒介され、切断点で切除が起こり、一本鎖オーバーハングを曝露する。標的核酸の標的位置を修正または変更するための鋳型核酸の配列の組み込みは、典型的には、上記のようにSDSA経路によって起こる。
鋳型核酸に関する追加的な詳細は、国際出願PCT/US2014/057905号明細書の「鋳型核酸」と題されたセクションIVに提供される。
遺伝子標的化のためのNHEJアプローチ
本明細書に記載されるように、ヌクレアーゼ誘導NHEJを使用して、標的遺伝子特異的ノックアウトを実施することができ、そして対象遺伝子中の配列を除去す(例えば、欠失させ)る。
理論による拘束は望まないが、特定の実施形態では、本明細書に記載される方法に関連するゲノムの改変は、ヌクレアーゼ誘導NHEJと、NHEJ修復経路の誤りがちな性質とに依存すると考えられる。NHEJは、2つの末端を共に連結することで、DNA中の二本鎖切断を修復する;しかし、通常、元の配列は、それらが二本鎖切断によって形成された真にその通りの2つの適合性末端が、完璧にライゲートされた場合に限り、復元される。二本鎖切断のDNA末端は、しばしば酵素的プロセッシングの対象であり、末端の再結合に先だって、片方または双方の鎖に、ヌクレオチドの付加または除去がもたらされる。これは、NHEJ修復部位におけるDNA配列の挿入および/または欠失(インデル)変異の存在をもたらす。これらの変異の3分の2は、典型的に、読み枠を改変し、したがって、非機能性タンパク質が生じる。それに加えて、読み枠を維持するが、顕著な量の配列を挿入または欠失させる変異は、タンパク質の機能性を破壊し得る。タンパク質の重要な機能ドメインの変異は、重要でない領域の変異よりもおそらく許容性が低いので、これは遺伝子座依存性である。
NHEJによって生成されるインデル変異は、自然界では予測不可能である;しかし、所与の切断部位では、おそらく小規模なマイクロホモロジー領域のために、特定のインデル配列が好まれ、母集団中で大きな比率を占める。欠失の長さは、幅広く変動し得て;それらは最も一般的には、1〜50bpの範囲であるが、100〜200bpを超える範囲に容易に達し得る。挿入はより短い傾向があり、多くの場合、切断部位に隣接して取り囲む、短い配列重複を含む。しかし、大きな挿入を得ることが可能であり、これらの場合、挿入配列は、多くの場合、ゲノムのその他の領域に、または細胞内に存在するプラスミドDNAにトレースされている。
NHEJは変異誘発プロセスであることから、特定の最終配列の作製が必要でない限り、それを用いて小さな配列モチーフ(例えば、50ヌクレオチド長以下のモチーフ)を欠失させ得る。二本鎖切断が、標的配列の近くで標的化される場合、NHEJによって引き起こされる修復欠失変異は、望まれないヌクレオチドに及ぶことが多く、その結果それを除去する。より大型のDNA断片の欠失では、配列の両側に1つずつ2つの二本鎖切断が導入されて、介在配列全体が除去され、末端の間にNHEJがもたらされ得る。このようにして、数百キロベース程度に大きいDNAセグメントが削除され得る。これらのアプローチの双方を使用して、特定のDNA配列が欠失され得る;しかし、NHEJの誤りがちな性質は、修復部位にインデル変異をなおも生じてもよい。
二本鎖切断eaCas9分子と、一本鎖、またはニッカーゼ、eaCas9分子との双方を本明細書に記載される方法および組成物で使用して、NHEJ媒介インデルが生成され得る。例えば、対象遺伝子の早期コード領域のようなコード領域などの遺伝子に標的化されるNHEJ媒介インデルを使用して、対象遺伝子がノックアウト(すなわち発現排除)され得る。例えば、対象遺伝子の早期コード領域は、コード配列の第1のエクソン内の、または開始コドンの500bp以内(例えば、500、450、400、350、300、250、200、150、100または50bp未満)の開始コドン直後の配列を含む。
標的化ノックダウン
遺伝子をDNAレベルで変異させることで発現を恒久的に排除するCRISPR/Cas媒介遺伝子ノックアウトとは異なり、CRISPR/Casノックダウンは、人工転写因子の使用を通じて、一時的な遺伝子発現低下を可能にする。Cas9タンパク質の双方のDNA切断ドメインで重要な残基を変異させることは(例えば、D10AおよびH840A変異)、酵素的に不活性なCas9(eiCas9、死滅Cas9またはdCas9としてもまた知られている)分子の生成をもたらす。eiCas9分子はgRNAと複合体形成し、そのgRNAの標的化ドメインによって規定されるDNA配列に局在するが、標的DNAは切断しない。eiCas9と、例えば、転写抑制ドメインなどのエフェクタードメインとの融合は、gRNAによって特定化された任意のDNA部位へのエフェクターの動員を可能にする。eiCas9分子それ自体は、コード配列の初期領域に動員された場合に転写を阻止し得るが、より堅固な抑制は、転写抑制ドメイン(例えば、KRAB、SID、またはERD)をeiCas9に融合させ、それを例えば、開始コドンの3’側の1000bp配列内、または遺伝子開始コドンの5’側のプロモーター領域500bp内にある、標的ノックダウン位置に動員することで達成され得る。プロモーターのDNAseI高感受性部位(DHS)は、Cas9タンパク質にアクセスできる可能性が高く、また内因性転写因子のための部位を保有するする可能性も高いので、これらの領域を標的化することで、おそらくより効率的な遺伝子抑制または活性化がもたらされてもよい。特に遺伝子抑制については、内因性転写因子の結合部位をブロックすることで、遺伝子発現の下方制御を助けることが、本明細書で検討される。特定の実施形態では、1つまたは複数のeiCas9分子を使用して、1つまたは複数の内因性転写因子の結合を阻止してもよい。その他の実施形態では、eiCas9分子はクロマチンに融合されて、タンパク質を改変し得る。クロマチン状態を改変することは、標的遺伝子の発現低下をもたらし得る。1つまたは複数のクロマチン修飾タンパク質に融合した1つまたは複数のeiCas9分子を使用して、クロマチン状態が改変されてもよい。
特定の実施形態では、gRNA分子は、公知の転写応答要素(例えば、プロモーター、エンハンサーなど)、既知の上流活性化配列(UAS)、および/または標的DNAの発現を抑制できることが疑われる未知または既知の機能の配列を標的化し得る。
CRISPR/Cas媒介遺伝子ノックダウンを使用して、望まれない対立遺伝子または転写物の発現を低下させ得る。本明細書で検討されるのは、遺伝子の恒久的な破壊が、理想的でない筋書きである。これらの筋書きでは、部位特異的抑制を使用して、発現が一時的に低下または排除されてもよい。ヌクレアーゼが任意のDNA配列を切断して変異を引き起こし得るのに対し、Casリプレッサーは、活発に転写される遺伝子のプロモーター領域に標的化された場合にのみ効果を有してもよいので、Casリプレッサーのオフターゲット効果が、Casヌクレアーゼのものよりも重篤性が低いこともまた本明細書で検討される。しかし、ヌクレアーゼ媒介ノックアウトが恒久的である一方で、抑制は、Casリプレッサーが細胞内に存在する場合に限り持続してもよい。リプレッサーがもはや存在しなくなると、内在性転写因子および遺伝子制御要素は、発現をその天然状態に復元する可能性が高い。
一本鎖アニーリング
一本鎖アニーリング(SSA)は、標的核酸中に存在する2つの反復配列間の二本鎖切断を修復する、もう一つのDNA修復プロセスである。SSA経路によって使用される反復配列は、一般に30ヌクレオチド長を超える。切断末端に切除が生じて、標的核酸の双方の鎖上の反復配列が曝露される。切除後、反復配列を含有する一本鎖オーバーハングをRPAタンパク質で被覆して、反復配列が、例えばそれ自体などと不適切にアニーリングするのを妨げる。RAD52は、オーバーハング上の反復配列のそれぞれと結合し、配列を整列させて、相補的反復配列のアニーリングを可能にする。アニーリング後、オーバーハングの一本鎖フラップは切断される。新しいDNA合成があらゆるギャップを充填して、ライゲーションがDNA二本鎖を回復させる。プロセッシングの結果として、2つの反復間のDNA配列が欠失する。欠失の長さは、使用される2つの反復の位置、および切除の経路または処理能力をはじめとする、多くの要素に左右され得る。
HDR経路とは対照的に、SSAは、標的核酸配列を変更または修正するために鋳型核酸を必要としない。それに代えて、相補的反復配列が使用される。
その他DNA修復経路
SSBR(一本鎖切断修復)
ゲノム内の一本鎖切断(SSB)は、上で論じたDSB修復機序とは別個の機序であるSSBR経路によって修復される。SSBR経路は、SSB検出、DNA末端プロセッシング、DNAギャップ充填、およびDNAライゲーションの4つの主要な段階を有する。より詳細な説明は、Caldecott 2008に記載され、概要は本明細書に記載される。
SSBが形成する第1段階では、PARP1および/またはPARP2は、切断を認識して修復機構を動員する。DNA切断におけるPARP1の結合および活性は一過性であり、損傷におけるSSBRタンパク質複合体の巣状滞留または安定性を促進することで、SSBRを加速するようである。議論の余地はあるが、これらのSSBRタンパク質中で最重要であるのはXRCC1であり、これは、DNAの3’および5’末端のクリーニングに関与するタンパク質をはじめとする、SSBRプロセスの複数の酵素的構成要素と相互作用して、安定化し刺激する分子スキャフォールドとして機能する。例えば、XRCC1は、末端プロセッシングを促進するいくつかのタンパク質(DNAポリメラーゼβ、PNK、および3つのヌクレアーゼ、APE1、APTX、およびAPLF)と相互作用する。APE1は、エンドヌクレアーゼ活性を有する。APLFは、エンドヌクレアーゼおよび3’から5’方向のエキソヌクレアーゼ活性を示す。APTXは、エンドヌクレアーゼおよび3’から5’方向のエキソヌクレアーゼ活性を有する。
全部ではないとしても大多数のSSBの3’および/または5’末端は「損傷を受け」ているため、この末端プロセッシングはSSBRの重要な段階である。末端プロセッシングは、一般に、末端がライゲーションできるように、損傷を受けた3’末端をヒドロキシル化状態に回復させ、およびおよび/または(and and/or)損傷を受けた5’末端をリン酸部分に回復させることを伴う。損傷を受けた3’末端をプロセスできる酵素としては、PNKP、APE1、およびTDP1が挙げられる。損傷を受けた5’末端をプロセスできる酵素としては、PNKP、DNAポリメラーゼβ、およびAPTXが挙げられる。LIG3(DNAリガーゼIII)はまた、末端プロセッシングにも関与する。ひとたび末端がクリーニングされたら、ギャップ充填が起こり得る。
DNAギャップ充填段階では、典型的に存在するタンパク質は、PARP1、DNAポリメラーゼβ、XRCC1、FEN1(フラップエンドヌクレアーゼ1)、DNAポリメラーゼδ/ε、PCNA、およびLIG1である。短いパッチ修復および長いパッチ修復の2つのギャップ充填様式がある。短いパッチ修復は、欠損している単一ヌクレオチドを挿入することを伴う。いくつかのSSBでは、「ギャップ充填」は、2つ以上のヌクレオチドを転置し続けるかもしれない(最高12塩基の転置が報告されている)。FEN1は、転置された5’残基を除去するエンドヌクレアーゼである。Polβをはじめとする複数のDNAポリメラーゼは、SSBの修復に関与し、DNAポリメラーゼの選択は、SSBの起源とタイプによって影響を受ける。
第4段階では、LIG1(リガーゼI)またはLIG3(リガーゼIII)などのDNAリガーゼが、末端の連結を触媒する。短いパッチ修復はリガーゼIIIを利用して、長いパッチ修復はリガーゼIを利用する。
時に、SSBRは、複製共役型である。この経路には、CtIP、MRN、ERCC1、およびFEN1の1つまたは複数が関与し得る。SSBRを促進してもよい追加的な要素としては、aPARP、PARP1、PARP2、PARG、XRCC1、DNAポリメラーゼb、DNAポリメラーゼd、DNAポリメラーゼe、PCNA、LIG1、PNK、PNKP、APE1、APTX、APLF、TDP1、LIG3、FEN1、CtIP、MRN、およびERCC1が挙げられる。
MMR(ミスマッチ修復)
細胞は、MMR、BER、およびNERの3つの切除修復経路を含有する。切除修復経路は、典型的に、DNAの1本鎖上の損傷を認識して、次にエキソ/エンドヌクレアーゼが損傷を除去し、DNAポリメラーゼによって順次充填され、最終的にリガーゼによってシールされる、1〜30ヌクレオチドのギャップを残すという共通の特徴を有する。より詳細な全体像はLi 2008に記載され、概要は本明細書で提供される。
ミスマッチ修復(MMR)は、誤対合DNA塩基上で機能する。
MSH2/6またはMSH2/3複合体は、どちらもミスマッチ認識および修復開始に重要な役割を果たすATPアーゼ活性を有する。MSH2/6が、塩基−塩基ミスマッチを優先的に認識して、1または2ヌクレオチドの誤対合を同定する一方で、MSH2/3は、より大型のID誤対合を優先的に認識する。
hMLH1は、hMutLαとヘテロ二量体化して、ATPアーゼ活性を有しMMRの複数の段階で重要であるhMutLαを形成する。これは、EXO1が関与する3’ニック誘導MMRにおいて重要な役割を果たす、PCNA/複製因子C(RFC)依存性エンドヌクレアーゼ活性を有する(EXO1は、HRおよびMMRの双方に参加する)。これは、ミスマッチが誘発する切除の終了を調節する。リガーゼIは、この経路の関連リガーゼである。MMRを促進してもよい追加的な要素としては、EXO1、MSH2、MSH3、MSH6、MLH1、PMS2、MLH3、DNA Pold、RPA、HMGB1、RFC、およびDNAリガーゼIが挙げられる。
塩基切除修復(BER)
塩基切除修復(BER)経路は、細胞周期全体を通じて活性であり;それは、ゲノムからの小型非らせん歪み塩基損傷を除去する主な原因となる。対照的に、関連ヌクレオチド切除修復経路(次のセクションで考察される)は、嵩高いらせん歪み損傷を修復する。より詳細な説明は、Caldecott 2008に記載され、概要は本明細書に記載される。
DNA塩基損傷に際して、塩基切除修復(BER)が開始されて、プロセスは、5つの主要な段階に簡略化され得る:(a)損傷を受けたDNA塩基の除去;(b)後続の塩基部位の切開;(c)DNA末端のクリーンアップ;(d)修復ギャップ内への修正ヌクレオチド挿入;および(e)DNA骨格内の残りのニックのライゲーション。これらの最終段階は、SSBRと類似する。
第1段階では、損傷特異的DNAグリコシラーゼが、塩基を糖リン酸骨格に結合するNグリコシド連結の切断を通じて、損傷を受けた塩基を切除する。次に、関連リアーゼ活性があるAPエンドヌクレアーゼ−1(APE1)または二機能性DNAグリコシラーゼがリン酸ジエステル骨格を切開して、DNA一本鎖切断(SSB)を生じた。BERの第3段階は、DNA末端のクリーンアップを伴う。BERの第4段階は、新規相補的ヌクレオチドを修復ギャップ内に付加するPolβによって実施され、最終段階で、XRCC1/リガーゼIIIがDNA骨格内の残りのニックをシールする。これで、損傷を受けたDNA塩基の大部分(約80%)が修復される、短いパッチBER経路が完了する。しかし、第3段階の5’末端が、末端プロセッシング活性に対して抵抗性であれば、Polβによる1つのヌクレオチド挿入に続いて、ポリメラーゼは複製的DNAポリメラーゼであるPolδ/εに切り替わり、次にそれは、DNA修復ギャップに約2〜8ヌクレオチドを付加する。これは、5’フラップ構造を作り出し、それは、処理能力要素である増殖性細胞核抗原(PCNA)に結合する、フラップエンドヌクレアーゼ−1(FEN−1)によって認識され切除される。次にDNAリガーゼIが、DNA骨格内の残りのニックをシールして、長いパッチBERを完了する。BER経路を促進してもよい追加的な要素としては、DNAグリコシラーゼ、APE1、Polb、Pold、Pole、XRCC1、リガーゼIII、FEN−1、PCNA、RECQL4、WRN、MYH、PNKP、およびAPTXが挙げられる。
ヌクレオチド切除修復(NER)
ヌクレオチド切除修復(NER)は、DNAから嵩高いらせん歪み損傷を除去する重要な切除機序である。NERに関する追加的な詳細はMarteijn 2014にあり、概要は本明細書に記載される。広域経路NERは、2つのより小型の経路である、全ゲノムNER(GG−NER)と、転写と共役する修復NER(TC−NER)とを包含する。GG−NERおよびTC−NERは、DNA損傷を認識するために異なる要素を使用する。しかし、それらは、損傷切開、修復、およびライゲーションのための同一機構を利用する。
ひとたび障害が認識されたら、細胞は、損傷を含有する短い一本鎖DNA断片を除去する。エンドヌクレアーゼXPF/ERCC1およびXPG(ERCC5によってコードされる)は、損傷のどちらかの側で損傷を受けた鎖を切断し、22〜30ヌクレオチドの一本鎖ギャップを生成することで、損傷を除去する。次に、細胞は、DNAギャップ充填合成およびライゲーションを実行する。このプロセスに関与するのは、PCNA、RFC、DNA Polδ、DNA PolεまたはDNA Polκ、およびDNAリガーゼIまたはXRCC1/リガーゼIIIである。ライゲーションステップを行うために、自己複製細胞が、DNA PolεおよびDNAリガーゼIを使用する傾向がある一方で、非自己複製細胞は、DNA Polδ、DNA Polκ、およびXRCC1/リガーゼIII複合体を使用する傾向がある。
NERは、XPA−G、POLH、XPF、ERCC1、XPA−G、およびLIG1の要素を伴い得る。転写共役NER(TC−NER)は、CSA、CSB、XPB、XPD、XPG、ERCC1、およびTTDAの要素を伴い得る。追加的な要素は、XPA−G、POLH、XPF、ERCC1、XPA−G、LIG1、CSA、CSB、XPA、XPB、XPC、XPD、XPF、XPG、TTDA、UVSSA、USP7、CETN2、RAD23B、UV−DDB、CAK部分複合体、RPA、およびPCNAをはじめとする、NER修復経路を促進してもよい。
鎖間架橋(ICL)
ICL修復経路と称される専用経路が、鎖間架橋を修復する。異なるDNA鎖中の塩基間の鎖間架橋、または共有結合架橋が、複製または転写中に起こり得る。ICL修復は、具体的には、核酸分解活性、損傷乗り越え合成(TLS)、およびHDRである、複数の修復プロセスの協調を伴う。ヌクレアーゼが、架橋塩基のどちらかの側のICLを切除するように動員される一方で、TLSおよびHDRは、協調して切断された鎖を修復する。ICL修復は、以下の要素を伴い得る:例えば、XPFおよびRAD51Cなどのエンドヌクレアーゼ、RAD51などのエンドヌクレアーゼ、例えば、DNAポリメラーゼζおよびRev1)などの損傷乗り越えポリメラーゼ、および例えば、FancJなどのファンコーニ貧血(FA)タンパク質。
その他の経路
哺乳類には、いくつかのその他のDNA修復経路が存在する。
損傷乗り越え合成(TLS)は、欠陥複製事象後に残される一本鎖切断の修復経路であり、例えば、DNA PolβおよびRev1などの損傷乗り越えポリメラーゼが関与する。
誤りのない複製後修復(PRR)は、欠陥複製事象後に残される一本鎖切断修復の別の経路である。
標的細胞
例えば、Cas9分子/gRNA分子複合体などのCas9分子およびgRNA分子を使用して、多種多様な細胞内の標的核酸を改変(例えば、変異を導入)し得る。この改変は、試験管内、生体外、または生体内で実施されてもよい。特定の実施形態では、この改変は、遺伝子発現の調節をもたらす。
本明細書に記載されるCas9およびgRNA分子は、標的細胞に送達され得る。例示的標的細胞としては、血液細胞、神経細胞、免疫細胞、筋肉細胞、腎臓細胞、乳腺細胞、消化管細胞、血管細胞、肺細胞、骨細胞、膵臓細胞、皮膚細胞、脂肪細胞、ホルモン分泌する細胞、肝細胞、上皮細胞、および線維芽細胞が挙げられるが、これに限定されるものではない。特定の実施形態では、標的細胞は正常細胞である。その他の実施形態では、標的細胞は罹患細胞である。これらの実施形態のうちのあるものでは、標的細胞はがん細胞である。
適切な細胞としては、例えば、胚性幹細胞、誘導多能性幹細胞、造血幹細胞、神経細胞幹細胞、または間葉系幹細胞などの幹細胞が挙げられる。特定の実施形態では、細胞は、誘導多能性幹(iPS)細胞であり、または例えば、対象から生成され、変異を修正するように修飾されて、例えば、肝細胞、マクロファージ、単核貪食細胞、肺胞マクロファージ、骨髄性前駆細胞、肺上皮細胞、または造血幹細胞などの臨床的に関連する細胞に分化されたiPS細胞などの、iPS細胞に由来する細胞である。特定の実施形態では、AAVが使用されて標的細胞が形質導入される。
本明細書に記載の方法によって産生された細胞は、即剤に使用されてもよい。代案としては、細胞は、(例えば、液体窒素中で)冷凍され、後で使用するために保管されてもよい。細胞は、通常、10%ジメチルスルホキシド(DMSO)、50%血清、40%緩衝化培地中で、またはこのような凍結温度で細胞を保存する技術分野で一般に使用されるその他のこのような溶液中で凍結され、凍結培養細胞を解凍する技術分野で一般に知られている様式で解凍される。
送達、調合、および投与経路
例えば、Cas9分子、gRNA分子(例えば、Cas9分子/gRNA分子複合体)、ドナー鋳型核酸、または3つ全てなどのCasシステム構成要素は、様々な形態で送達、調合、または投与され得て、例えば、表3および4を参照されたい。表3は、構成要素がどのように調合、送達、または投与されるかの例を提供する。表4は、例えば、本明細書に記載されるCas9分子構成要素およびgRNA分子構成要素などのCasシステムの構成要素の様々な送達方法を要約する。
Cas9、gRNA、および/またはドナー鋳型のDNAベースの送達
Cas9分子(例えば、eaCas9分子)またはgRNA分子をコードするDNA、ドナー鋳型、またはそれらの任意の組み合わせ(例えば、2つまたは全て)は、当該技術分野で周知の方法によって、または本明細書に記載されるようにして、対象に投与され得て、または細胞に送達され得る。例えば、Cas9および/またはgRNAをコードするDNA、ならびにドナー鋳型は、例えば、ベクター(例えば、ウイルスまたは非ウイルスベクター)、非ベクターベースの方法(例えば、裸のDNAまたはDNA複合体を用いる)、またはそれらの組み合わせによって送達され得る。同様に、ドナー鋳型は、例えば、ベクター(例えば、ウイルスまたは非ウイルスベクター)、非ベクターベースの方法(例えば、裸のDNAまたはDNA複合体を用いる)、またはそれらの組み合わせによって送達され得る。
Cas9分子(例えば、eaCas9分子)および/またはgRNA分子をコードするDNAは、標的細胞(例えば、本明細書に記載される標的細胞)による取り込みを促進する分子(例えば、N−アセチルガラクトサミン)にコンジュゲートされ得る。ドナー鋳型は同様に、標的細胞(例えば、本明細書に記載される標的細胞)による取り込みを促進する分子(例えば、N−アセチルガラクトサミン)にコンジュゲートされ得る。
特定の実施形態では、Cas9および/またはgRNAをコードするDNAは、ベクター(例えば、ウイルスベクター/ウイルスまたはプラスミド)によって送達される。
特定の実施形態では、ベクターは、Cas9分子および/またはgRNA分子をコードするDNA配列を含んでなってもよい。特定の実施形態では、ベクターは、標的化される領域(例えば、標的配列)に対して高い相同性を有する、ドナー鋳型を含んでなってもよい。これらの実施形態のうちのあるものでは、ドナー鋳型は、標的配列の全部または一部を含んでなる。例示的ドナー鋳型は、例えば遺伝子修正鋳型などの修復鋳型、または例えば点変異(例えば、単一ヌクレオチド(nt)置換)鋳型)などの遺伝子変異鋳型である。
特定の実施形態では、ベクターは、例えばCas9分子配列に融合された、シグナルペプチド(例えば、核局在化、核小体局化在、またはミトコンドリア局在化)をコードする配列を含んでなってもよい。特定の実施形態では、ベクターは、例えば、プロモーター、エンハンサー、イントロン、ポリアデニル化シグナル、コザックコンセンサス配列、内部リボソーム進入部位(IRES)、2A配列、および/またはスプライスアクセプターまたはドナーなどの1つまたは複数の調節/制御要素を含んでなってもよい。ベクターがプロモーターを含んでなる実施形態のうちのあるものでは、プロモーターは、RNAポリメラーゼII(例えば、CMVプロモーター)によって認識される。その他の実施形態では、プロモーターは、RNAポリメラーゼIII(例えば、U6プロモーター)によって認識される。
特定の実施形態では、ベクターは、ウイルスベクター(例えば、組換えウイルス作製のため)である。これらの実施形態のうちのあるものでは、ウイルスは、DNAウイルス(例えば、dsDNAまたはssDNAウイルス)である。その他の実施形態では、ウイルスは、RNAウイルス(例えば、ssRNAウイルス)である。代表的なウイルスベクター/ウイルスとしては、例えば、レトロウイルス、レンチウイルス、アデノウイルス、アデノ随伴ウイルス(AAV)、ワクシニアウイルス、ポックスウイルス、および単純ヘルペスウイルスが挙げられる。特定の実施形態では、Cas9および/またはgRNAをコードするDNAは、組換えAAVによって送達される。特定の実施形態では、ドナーテンプレート核酸は、組換えAAVによって送達される。特定の実施形態では、ウイルスベクターは、細胞型および/または組織型を認識できる。特定の実施形態では、ウイルスベクターは、細胞型特異的発現を達成する。特定の実施形態では、ウイルスベクターは、ウイルスベクターと標的細胞膜との融合効率の増大を有する。
特定の実施形態では、Cas9および/またはgRNAをコードするDNAは、非ベクターベースの方法(例えば、裸のDNAまたはDNA複合体を用いる)によって送達される。例えば、DNAは、例えば、有機修飾シリカまたはケイ酸塩(オルモシル)、電気穿孔、一過性細胞圧縮または圧搾(例えば、Lee 2012を参照されたい)、遺伝子銃、ソノポレーション、マグネトフェクション、脂質媒介トランスフェクション、デンドリマー、無機ナノ粒子、カルシウムリン酸塩、またはそれらの組み合わせによって送達され得る。
特定の実施形態では、Cas9および/またはgRNAをコードするDNAは、ベクターおよび非ベクターベースの方法の組み合わせによって送達される。特定の実施形態では、ドナー鋳型は、ベクターおよび非ベクターベースの方法の組み合わせによって送達される。
遺伝子移入のための例示的脂質は、下で表1に示される。遺伝子移入のための例示的ポリマーは、下で表5に示される。
特定の実施形態では、非ベクター送達ビヒクルは、例えば、細胞特異的抗原、モノクローナル抗体、一本鎖抗体、アプタマー、ポリマー、糖類(例えば、N−アセチルガラクトサミン(GalNAc))、および細胞透過性ペプチドなどのナノ粒子およびリポソームの標的細胞更新を増加させるための標的化修飾を有する。特定の実施形態では、ビヒクルは、融合誘導性およびエンドソーム不安定化ペプチド/ポリマーを使用する。特定の実施形態では、ビヒクルは、酸誘導性立体構造変化(例えば、カーゴのエンドソーム漏出を加速するための)を受ける。特定の実施形態では、例えば、細胞内区画内の放出のために、刺激切断可能なポリマーが使用される。特定の実施形態では、送達ビヒクルは、生物学的非ウイルス送達ビヒクルである。
特定の実施形態では、Casシステム構成要素以外の(すなわち、Cas9分子および/またはgRNA分子をコードするDNAまたはドナー鋳型以外の)1つまたは複数の核酸分子(例えば、DNA分子)が送達される。これらの実施形態のうちのあるものでは、これらの他の核酸分子は、Casシステム構成要素の1つまたは複数と同時に送達される。その他の実施形態では、これらの他の核酸分子は、Casシステムの構成要素の1つまたは複数が送達される(例えば、約30分間、1時間、2時間、3時間、6時間、9時間、12時間、1日、2日間、3日間、1週間、2週間、または4週間未満)前または後に送達される。特定の実施形態では、これらの他の核酸分子は、Casシステムの構成要素の1つまたは複数とは異なる手段によって送達される。その他の核酸分子は、本明細書に記載される送達方法のいずれかによって送達され得る。
Cas9および/またはgRNAのRNAベースの送達
Cas9分子をコードするgRNA分子および/またはRNA分子は、当該技術分野で周知の方法によって、または本明細書に記載されるようにして、例えば、本明細書に記載される標的細胞などの細胞に送達され得る。例えば、gRNA分子および/またはCas9分子をコードするRNA分子は、例えば、マイクロインジェクション、電気穿孔、一過性細胞圧縮または圧搾(例えば、Lee 2012を参照されたい)、脂質媒介トランスフェクション、ペプチド媒介送達、またはそれらの組み合わせによって送達され得る。gRNA分子および/またはCas9分子をコードするRNA分子は、標的細胞(例えば、本明細書に記載される標的細胞)による取り込みを促進する分子に、コンジュゲートされ得る。
特定の実施形態では、電気穿孔を通じた送達は、カートリッジ、チャンバー、またはキュベット内において、ドナー鋳型核酸分子の存在下または非存在下で、細胞をgRNA分子および/またはCas9分子をコードするRNA分子と混合するステップと、1回または複数回の規定の長さおよび振幅の電気インパルスを適用するステップとを含んでなる。特定の実施形態では、混合物をカートリッジ、チャンバー、またはキュベットに供給する装置(例えば、ポンプ)に接続された容器内において、ドナー鋳型核酸分子の存在下または非存在下で、細胞がgRNA分子および/またはCas9分子をコードするRNA分子と混合され、1回または複数回の規定の長さおよび振幅の電気インパルスが適用され、その後、細胞が第2の容器に送達されるシステムを用いて、電気穿孔を通じた送達が実施される。gRNA分子および/またはCas9分子をコードするRNA分子は、標的細胞(例えば、本明細書に記載される標的細胞)による取り込みを促進する分子に、コンジュゲートされ得る。
Cas9分子の送達
Cas9分子は、当該技術分野で周知の方法によって、または本明細書に記載されるようにして、細胞に送達され得る。例えば、Cas9タンパク質分子は、例えば、マイクロインジェクション、電気穿孔、一過性細胞圧縮または圧搾(例えば、Lee 2012を参照されたい)、脂質媒介トランスフェクション、ペプチド媒介送達、またはそれらの組み合わせによって送達され得る。送達は、gRNAをコードするDNA、またはgRNAを伴い得る。Cas9タンパク質は、標的細胞(例えば、本明細書に記載される標的細胞)による取り込みを促進する分子に、コンジュゲートされ得る。
特定の実施形態では、Cas9タンパク質をgRNA分子と組み合わせて、当該技術分野で周知の方法によって、または本明細書に記載されるようにして、対象に投与するまたは細胞に送達するための、リボ核タンパク質(RNP)複合体を形成してもよい。Cas9/gRNARNP複合体の細胞への直接送達は、核酸から発現させる必要性(例えば、Cas9およびgRNAをコードするプラスミドのトランスフェクション)を排除する。それはまた、核酸送達(例えば、Cas9およびgRNAをコードするプラスミドのトランスフェクション)に由来するDNA断片望まれない組み込みも排除する。したがってそれは、迅速な作用、高速な代謝回転、高いオンターゲット修飾率、低いオフターゲット効果、および細胞に対するより低い毒性を提供する、代案の送達アプローチである。それはまた、トランスフェクトするのが困難なCas9/gRNA複合体(例えば、トランスフェクトするのが困難な初代および多能性幹細胞)を細胞に送達するためにも使用され得る。特定の実施形態では、Cas9/gRNARNP複合体が投与前に形成(すなわち、予備成形)されてもよい。特定の実施形態では、複数の(例えば、2つ以上の)Cas9/gRNARNP複合体が、同時にまたは順次送達(例えば、投与)されてもよい。特定の実施形態では、Cas9/gRNARNP複合体は、電気穿孔によって細胞に送達されてもよい。
特定の実施形態では、電気穿孔を通じた送達は、カートリッジ、チャンバー、またはキュベット内において、gRNA分子および/またはドナー鋳型核酸の存在下または非存在下で、細胞をCas9分子と混合するステップと、1回または複数回の規定の長さおよび振幅の電気インパルスを適用するステップとを含んでなる。特定の実施形態では、混合物をカートリッジ、チャンバー、またはキュベットに供給する装置(例えば、ポンプ)に接続された容器内において、gRNAおよび/またはドナー鋳型核酸存在下または非存在下で、細胞がCas9分子と混合され、1回または複数回の規定の長さおよび振幅の電気インパルスが適用され、その後、細胞が第2の容器に送達されるシステムを用いて、電気穿孔を通じた送達が実施される。
Casシステム構成要素の投与経路
全身性の投与法としては、経口および非経口経路が挙げられる。非経口経路としては、一例として、静脈内、動脈内(intrarterial)、筋肉内、皮内、皮下、鼻腔内、および腹腔内経路が挙げられる。全身投与される構成成分は、構成要素を血液細胞および骨髄細胞に標的化するように、改変または調合されてもよい。
局所投与法としては、一例として、骨髄内、クモ膜下腔内、および脳室内経路が挙げられる。特定の実施形態では、全身投与(例えば、静脈内投与)された場合と比較して、局所的に投与された場合に、有意により少量の構成要素(全身性アプローチと比較して)が効果を発揮してもよい。局所投与法は、治療有効量の構成要素が全身投与された場合に起こることもある、潜在的に毒性の副作用の発生を低下させまたは排除し得る。
加えて、構成要素は、長時間にわたって放出されるように調合されてもよい。
Casシステム構成要素の生体外送達
特定の実施形態では、表3に記載されるCasシステム構成要素が細胞に導入され、それは、次に、例えば、対象から除去された細胞などの対象に導入されて、生体外で操作され、対象に再導入される。構成要素を導入する方法としては、例えば、表4に記載される送達方法のいずれかが挙げられる。
X.修飾ヌクレオシド、ヌクレオチド、および核酸
修飾ヌクレオシドおよび修飾ヌクレオチドは、例えば、特にgRNAなどの核酸中に存在し得るが、例えば、mRNA、RNAi、またはsiRNAなどのその他の形態のRNAにもまた存在し得る。本明細書に記載される「ヌクレオシド」は、5つの炭素砂糖分子(ペントースまたはリボース)またはその誘導体と、1つの有機塩基、プリンまたはピリミジン、またはその誘導体とを含有する化合物と定義される。本明細書に記載される「ヌクレオチド」は、リン酸基をさらに含んでなるヌクレオシドと定義される。
修飾ヌクレオシドおよびヌクレオチドは、以下の1つまたは複数を含み得る:
(i)例えば、リン酸ジエステル骨格結合中の非結合リン酸酸素の片方または双方および/または結合リン酸酸素の1つまたは複数の置換などの改変;
(ii)例えば、リボース糖上の2’ヒドロキシルなどのリボース糖の構成要素の置換などの改変;
(iii)リン酸部分の「デホスホ」リンカーによる徹底的な置換;
(iv)天然起源核酸塩基の修飾または置換;
(v)リボースリン酸骨格の置換または修飾;
(vi)例えば、末端リン酸基の除去、修飾または置換または部分のコンジュゲーションなどのオリゴヌクレオチドの3’末端または5’末端の修飾;および
(vii)糖の修飾。
上に列挙される修飾を混合して、2、3、4つ以上の修飾を有し得る、修飾ヌクレオシドおよびヌクレオチドが提供され得る。例えば、修飾ヌクレオシドまたはヌクレオチドは、修飾糖および修飾核酸塩基を有し得る。一実施形態では、gRNAの各塩基は修飾され、例えば、全ての塩基が、例えば、全てホスホロチオエート基であるなど、修飾リン酸基を有する。一実施形態では、単分子またはモジュラーgRNA分子の全ての、または実質的に全てのリン酸基は、ホスホロチオエート基で置換される。
一実施形態では、例えば、本明細書に記載されるような修飾を有するヌクレオチドなどの修飾ヌクレオチドが、例えば、「修飾核酸」などの核酸に組み込まれ得る。一実施形態では、修飾核酸は、1、2、3つ以上の修飾ヌクレオチドを含んでなる。一実施形態では、修飾核酸内の位置の少なくとも5%(例えば、少なくとも約5%、少なくとも約10%、少なくとも約15%、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、または約100%)は、修飾ヌクレオチドである。
未修飾核酸は、例えば、細胞ヌクレアーゼによって分解され易くあり得る。例えば、ヌクレアーゼは、核酸リン酸ジエステル結合を加水分解し得る。したがって、一態様では、本明細書に記載される修飾核酸は、1つまたは複数の修飾ヌクレオシドまたはヌクレオチドを含有し得て、例えば、ヌクレアーゼに安定性が導入される。
一実施形態では、本明細書に記載される修飾ヌクレオシド、修飾ヌクレオチド、および修飾核酸は、生体内および生体外の双方で細胞集団内に導入されると、先天性免疫応答の低下を示し得る。「先天性免疫応答」という用語は、一般にウイルス性または細菌起源である、一本鎖核酸をはじめとする外来性核酸に対する細胞性応答を含み、それは、具体的にはインターフェロンであるサイトカインの発現と放出の誘導、および細胞死を内包する。一実施形態では、本明細書に記載される修飾ヌクレオシド、修飾ヌクレオチド、および修飾核酸は、主溝相互作用パートナーの核酸との結合を妨害し得る。一実施形態では、本明細書に記載される修飾ヌクレオシド、修飾ヌクレオチド、および修飾核酸は、生体内および生体外の双方で、細胞集団内に導入されると、先天性免疫応答の低下を示して、そしてまた主溝相互作用パートナーの核酸との結合も妨害し得る。
化学基の定義
本明細書の用法では、「アルキル」は、直鎖または分枝鎖の飽和炭化水素基を指すことが意図される。アルキル基の例としては、メチル(Me)、エチル(Et)、プロピル(例えば、n−プロピルおよびイソプロピル)、ブチル(例えば、n−ブチル、イソブチル、t−ブチル)、ペンチル(例えば、n−ペンチル、イソペンチル、ネオペンチル)などが挙げられる。アルキル基は、1〜約20個、2〜約20個、1〜約12個、1〜約8個、1〜約6個、1〜約4個、または1〜約3個の炭素原子を含有し得る。
本明細書の用法では、「アリール」は、例えば、フェニル、ナフチル、アントラセニル、フェナントレニル、インダニル、インデニルなどの単環または多環(例えば、2、3または4つの融合環を有する)芳香族炭化水素を指す。一実施形態では、アリール基は、6〜約20個の炭素原子を有する。
本明細書の用法では、「アルケニル」は、少なくとも1つの二重結合を含有する脂肪族基を指す。
本明細書の用法では、「アルキニル」は、2〜12個の炭素原子を含有し、1つまたは複数の三重結合を有することで特徴付けられる、直鎖または分枝炭化水素鎖を指す。アルキニル基の例としては、エチニル、プロパルギル、および3−ヘキシニルが挙げられるが、これに限定されるものではない。
本明細書の用法では、「アリールアルキル」または「アラルキル」は、アルキル水素原子がアリール基で置換された、アルキル部分を指す。アラルキルは、2つ以上の水素原子がアリール基で置換されている基を含む。「アリールアルキル」または「アラルキル」の例としては、ベンジル、2−フェニルエチル、3−フェニルプロピル、9−フルオレニル、ベンズヒドリル、およびトリチル基が挙げられる。
本明細書の用法では、「シクロアルキル」は、3〜12個の炭素を有する環式、二環式、三環式、または多環式非芳香族炭化水素基を指す。シクロアルキル部分の例としては、シクロプロピル、シクロペンチル、およびシクロヘキシルが挙げられるが、これに限定されるものではない。
本明細書の用法では、「ヘテロシクリル」は、複素環系の一価の基を指す。典型的なヘテロシクリルとしては、制限なしに、テトラヒドロフラニル、テトラヒドロチエニル、ピロリジニル、ピロリドニル、ピペリジニル、ピロリニル、ピペラジニル、ジオキサニル、ジオキソラニル、ジアゼピニル、オキサゼピニル、チアゼピニル、およびモルホリニルが挙げられる。
本明細書の用法では、「ヘテロアリール」は、複素環式芳香族環系の一価の基を指す。ヘテロアリール部分の例としては、イミダゾリル、オキサゾリル、チアゾリル、トリアゾリル、ピロリル、フラニル、インドリル、チオフェニルピラゾリル、ピリジニル、ピラジニル、ピリダジニル、ピリミジニル、インドリジニル、プリニル、ナフチリジニル、キノリル、およびプテリジニルが挙げられる、が、これに限定されるものではない。
リン酸塩骨格修飾
リン酸基
一実施形態では、修飾ヌクレオチドのリン酸基は、異なる置換基による、1つまたは複数の酸素の置換によって修飾され得る。さらに、例えば、内修飾核酸に存在する修飾ヌクレオチドなどの修飾ヌクレオチドは、本明細書に記載されるような修飾リン酸塩による、未修飾リン酸部分の徹底的な置換を含み得る。一実施形態では、リン酸骨格の修飾は、非荷電リンカーまたは非相称の電荷分布がある荷電リンカーのどちらかをもたらす改変を含み得る。
修飾リン酸基の例としては、ホスホロチオエート、ホスホロセレネート、ボラノリン酸、ボラノリン酸エステル、ホスホン酸水素、ホスホロアミデート、アルキルまたはアリールホスホネートおよびホスホトリエステルが挙げられる。一実施形態では、リン酸骨格部分中の非架橋リン酸酸素原子の1つが、以下の基のいずれかによって置換され得る:イオウ(S)、セレン(Se)、BR(式中、Rは、例えば、水素、アルキル、またはアリールであり得る)、C(例えば、アルキル基、アリール基など)、H、NR(式中、Rは、例えば、水素、アルキル、またはアリールであり得る)、またはOR(式中、Rは、例えば、アルキルまたはアリールであり得る)。未修飾リン酸基中の亜リン酸原子は、アキラルである。しかし、上の原子または原子群の1つによる非架橋酸素の1つの置換は、亜リン酸原子をキラルにし得て;すなわち、このようにして修飾されたリン酸基中の亜リン酸原子が、立体中心である。ステレオジェン亜リン酸原子は、「R」構造(本明細書のRp)または「S」構造(本明細書のSp)のどちらかを有し得る。
ホスホロジチオエートは、双方の非架橋酸素がイオウで置換されている。ホスホロジチオエートのリン中心はアキラルであり、それは、オリゴリボヌクレオチドジアステレオマーの形成を排除する。一実施形態では、非架橋酸素の片方または双方の修飾はまた、S、Se、B、C、H、N、およびOR(Rは、例えば、アルキルまたはアリールであり得る)から独立して選択される基による、非架橋酸素の置換も含み得る。
リン酸塩リンカーはまた、窒素(架橋ホスホロアミデート)、イオウ(架橋ホスホロチオエート)、および炭素(架橋メチレンホスホネート)による、架橋酸素(すなわち、リン酸をヌクレオシドに連結する酸素)の置換によって修飾され得る。置換は、どちらかの連結酸素で、または双方の連結酸素で起こり得る。
リン酸基の置換
リン酸基は、リン非含有コネクターによって置換され得る。一実施形態では、荷電リン酸基は、中性部分によって置換され得る。
リン酸基を置換し得る部分の例としては、制限なしに、例えば、メチルホスホネート、ヒドロキシルアミノ、シロキサン、炭酸塩、カルボキシメチル、カルバメート、アミド、チオエーテル、酸化エチレンリンカー、スルホネート、スルホンアミド、チオホルムアセタール、ホルムアセタール、オキシム、メチレンイミノ、メチレンメチルイミノ、メチレンヒドラゾ、メチレンジメチルヒドラゾ、およびメチレンオキシメチルイミノが挙げられる。
リボリン酸骨格の置換
核酸を模倣し得るスキャフォールドもまた構築され得て、その中では、リン酸リンカーおよびリボース糖が、ヌクレアーゼ耐性ヌクレオシドまたはヌクレオチドサロゲートによって置換される。一実施形態では、核酸塩基は、サロゲート骨格によって係留され得る。例としては、制限なしに、モルホリノ、シクロブチル、ピロリジン、およびペプチド核酸(PNA)ヌクレオシドサロゲートが挙げられる。
糖修飾
修飾ヌクレオシドおよび修飾ヌクレオチドは、糖類に1つまたは複数の修飾を含み得る。例えば、2’ヒドロキシル基(OH)は、いくつかの異なる「オキシ」または「デオキシ」置換基で、修飾または置換され得る。一実施形態では、2’ヒドロキシル基の修飾は核酸の安定性を高め得るが、それは、ヒドロキシルが、もはや脱プロトン化して、2’−アルコキシドイオンを形成し得ないためである。2’−アルコキシドは、リンカーリン原子上の分子内求核攻撃によって、分解を触媒し得る。
「オキシ」−2’ヒドロキシル基修飾の例としては、アルコキシまたはアリールオキシ(OR、式中、「R」は、例えば、アルキル、シクロアルキル、アリール、アラルキル、ヘテロアリールまたは糖であり得る);ポリエチレングリコール(PEG)、O(CHCHO)CHCHOR(式中、Rは、例えば、Hまたは任意選択的に置換されたアルキルであり得て、nは、0〜20(例えば、0〜4、0〜8、0〜10、0〜16、1〜4、1〜8、1〜10、1〜16、1〜20、2〜4、2〜8、2〜10、2〜16、2〜20、4〜8、4〜10、4〜16、および4〜20)の整数であり得る)が挙げられる。一実施形態では、「オキシ」−2’ヒドロキシル基修飾は、「ロックド」核酸(LNA)を含み得て、その中では、2’ヒドロキシルが、例えば、C1〜6アルキレンまたはC1〜6ヘテロアルキレン架橋によって同一リボース糖の4’炭素に連結され得て、代表的な架橋としては、メチレン、プロピレン、エーテル、またはアミノ架橋;O−アミノ(式中、アミノは、例えば、NH;アルキルアミノ、ジアルキルアミノ、ヘテロシクリル、アリールアミノ、ジアリールアミノ、ヘテロアリールアミノ、またはジヘテロアリールアミノ、エチレンジアミン、またはポリアミノであり得る)、およびアミノアルコキシ、O(CH−アミノ、(式中、アミノは、例えば、NH;アルキルアミノ、ジアルキルアミノ、ヘテロシクリル、アリールアミノ、ジアリールアミノ、ヘテロアリールアミノ、またはジヘテロアリールアミノ、エチレンジアミン、またはポリアミノであり得る)が挙げられる。一実施形態では、「オキシ」−2’ヒドロキシル基修飾としては、メトキシエチル基(MOE)、(OCHCHOCH、例えば、PEG誘導体)が挙げられる。
「デオキシ」修飾としては、水素(すなわち、例えば、部分的dsRNAのオーバーハング部分のデオキシリボース糖);ハロ(例えば、ブロモ、クロロ、フルオロ、またはヨード);アミノ(式中、アミノは、例えば、NH;アルキルアミノ、ジアルキルアミノ、ヘテロシクリル、アリールアミノ、ジアリールアミノ、ヘテロアリールアミノ、ジヘテロアリールアミノ、またはアミノ酸であり得る);NH(CHCHNH)CHCH−アミノ(式中、アミノは、例えば、本明細書に記載されるようであり得る)、−NHC(O)R(式中、Rは、例えば、アルキル、シクロアルキル、アリール、アラルキル、ヘテロアリールまたは糖であり得る)、シアノ;メルカプト;アルキル−チオ−アルキル;チオアルコキシ;および本明細書に記載されるようなアミノで任意選択的に置換されてもよい、アルキル、シクロアルキル、アリール、アルケニル、およびアルキニルが挙げられる。
糖類は、リボース中の対応する炭素と逆の立体化学的配置を有する、1つまたは複数の炭素もまた含有し得る。したがって、修飾核酸としては、例えば、糖としてアラビノースを含有するヌクレオチドが挙げられる。ヌクレオチド「単量体」は、例えば、αヌクレオシドなど、糖の1’位にα結合を有し得る。修飾核酸としては、C−1’の核酸塩基を欠失している「脱塩基」糖もまた挙げられる。これらの脱塩基糖はまた、構成糖原子の1つまたは複数でさらに修飾され得る。修飾核酸はとしてはまた、例えばL−ヌクレオシドなどのL形態の1つまたは複数の糖も挙げられる。
一般に、RNAは、酸素を有する5員環である糖類リボースを含む。代表的な修飾ヌクレオシドおよび修飾ヌクレオチドとしては、制限なしに、リボース中の酸素の置換(例えば、イオウ(S)、セレン(Se)、または例えば、メチレンまたはエチレンなどのアルキレンによる);二重結合の付加(例えば、リボースをシクロペンテニルまたはシクロヘキセニルで置換する);リボース環縮小(例えば、シクロブタンまたはオキセタンの4員環を形成する);リボース環拡大(例えば、アンヒドロヘキシトール、アルトリトール、マンニトール、シクロヘキサニル、シクロヘキセニル、ホスホロアミダート骨格もまた有するモルホリノなどの追加的な炭素またはヘテロ原子を有する6または7員環を形成する)が挙げられる。一実施形態では、修飾ヌクレオチドとしては、多環形態(例えば、トリシクロ;および(例えば、リボースがリン酸ジエステル結合に付着するグリコール単位で置換されるR−GNAまたはS−GNAなどの)グリコール核酸(GNA)などの「アンロックド」形態、トレオース核酸(TNA、リボースがα−L−トレオフラノシル−(3’→2’)で置換される)が挙げられる。
核酸塩基上の修飾
修飾核酸に組み込まれ得る、本明細書に記載される修飾ヌクレオシドおよび修飾ヌクレオチドは、修飾核酸塩基を含み得る。核酸塩基の例としては、アデニン(A)、グアニン(G)、シトシン(C)、およびウラシル(U)が挙げられるが、これに限定されるものではない。これらの核酸塩基は、修飾または完全に置換されて、修飾核酸に組み込まれ得る、修飾ヌクレオシドおよび修飾ヌクレオチドを提供し得る。ヌクレオチドの核酸塩基は、プリン、ピリミジン、プリンまたはピリミジンアナログから独立して選択され得る。一実施形態では、核酸塩基としては、例えば、天然に存在する塩基の合成誘導体が挙げられる。
ウラシル
一実施形態では、修飾核酸塩基は、修飾ウラシルである。修飾ウラシルを有する代表的な核酸塩基およびヌクレオシドとしては、制限なしに、プソイドウリジン(ψ)、ピリジン−4−オンリボヌクレオシド、5−アザ−ウリジン、6−アザ−ウリジン、2−チオ−5−アザ−ウリジン、2−チオ−ウリジン(s2U)、4−チオ−ウリジン(s4U)、4−チオ−プソイドウリジン、2−チオ−プソイドウリジン、5−ヒドロキシ−ウリジン(hoU)、5−アミノアリル−ウリジン、5−ハロ−ウリジン(例えば、5−ヨード−ウリジンまたは5−ブロモ−ウリジン)、3−メチル−ウリジン(mU)、5−メトキシ−ウリジン(moU)、ウリジン5−オキシ酢酸(cmoU)、ウリジン5−オキシ酢酸メチルエステル(mcmoU)、5−カルボキシメチル−ウリジン(cmU)、1−カルボキシメチル−プソイドウリジン、5−カルボキシヒドロキシメチル−ウリジン(chmU)、5−カルボキシヒドロキシメチル−ウリジンメチルエステル(mchmU)、5−メトキシカルボニルメチル−ウリジン(mcmU)、5−メトキシカルボニルメチル−2−チオ−ウリジン(mcms2U)、5−アミノメチル−2−チオ−ウリジン(nms2U)、5−メチルアミノメチル−ウリジン(mnmU)、5−メチルアミノメチル−2−チオ−ウリジン(mnms2U)、5−メチルアミノメチル−2−セレン含有−ウリジン(mnmseU)、5−カルバモイルメチル−ウリジン(ncmU)、5−カルボキシメチルアミノメチル−ウリジン(cmnmU)、5−カルボキシメチルアミノメチル−2−チオ−ウリジン(cmnms2U)、5−プロピニル−ウリジン、1−プロピニル−プソイドウリジン、5−タウリノメチル−ウリジン(τcmU)、1−タウリノメチル−プソイドウリジン、5−タウリノメチル−2−チオ−ウリジン(τms2U)、1−タウリノメチル−4−チオ−プソイドウリジン、5−メチル−ウリジン(mU、すなわち、核酸塩基デオキシチミジン(deoxythymine)を有する)、1−メチル−プソイドウリジン(mψ)、5−メチル−2−チオ−ウリジン(ms2U)、1−メチル−4−チオ−プソイドウリジン(mψ)、4−チオ−1−メチル−プソイドウリジン、3−メチル−プソイドウリジン(mψ)、2−チオ−1−メチル−プソイドウリジン、1−メチル−1−デアザ−プソイドウリジン、2−チオ−1−メチル−1−デアザ−プソイドウリジン、ジヒドロウリジン(D)、ジヒドロプソイドウリジン、5,6−ジヒドロウリジン、5−メチル−ジヒドロウリジン(mD)、2−チオ−ジヒドロウリジン、2−チオ−ジヒドロプソイドウリジン、2−メトキシ−ウリジン、2−メトキシ−4−チオ−ウリジン、4−メトキシ−プソイドウリジン、4−メトキシ−2−チオ−プソイドウリジン、N1−メチル−プソイドウリジン、3−(3−アミノ−3−カルボキシプロピル)ウリジン(acpU)、1−メチル−3−(3−アミノ−3−カルボキシプロピル)プソイドウリジン(acpψ)、5−(イソペンテニルアミノメチル)ウリジン(inmU)、5−(イソペンテニルアミノメチル)−2−チオ−ウリジン(inms2U)、α−チオ−ウリジン、2’−O−メチル−ウリジン(Um)、5,2’−O−ジメチル−ウリジン(mUm)、2’−O−メチル−プソイドウリジン(ψm)、2−チオ−2’−O−メチル−ウリジン(s2Um)、5−メトキシカルボニルメチル−2’−O−メチル−ウリジン(mcmUm)、5−カルバモイルメチル−2’−O−メチル−ウリジン(ncmUm)、5−カルボキシメチルアミノメチル−2’−O−メチル−ウリジン(cmnmUm)、3,2’−O−ジメチル−ウリジン(mUm)、5−(イソペンテニルアミノメチル)−2’−O−メチル−ウリジン(inmUm)、1−チオ−ウリジン、デオキシチミジン、2’−F−アラ−ウリジン、2’−F−ウリジン、2’−OH−アラ−ウリジン、5−(2−カルボメトキシビニル)ウリジン、5−[3−(1−E−プロペニルアミノ)ウリジン、ピラゾロ[3,4−d]ピリミジン、キサンチン、およびヒポキサンチンが挙げられる。
シトシン
一実施形態では、修飾核酸塩基は、修飾シトシンである。修飾シトシンを有する代表的な核酸塩基およびヌクレオシドとしては、制限なしに、5−アザ−シチジン、6−アザ−シチジン、プソイドイソシチジン、3−メチル−シチジン(mC)、N4−アセチル−シチジン(act)、5−ホルミル−シチジン(fC)、N4−メチル−シチジン(mC)、5−メチル−シチジン(mC)、5−ハロ−シチジン(例えば、5−ヨード−シチジン)、5−ヒドロキシメチル−シチジン(hmC)、1−メチル−プソイドイソシチジン、ピロロ−シチジン、ピロロ−プソイドイソシチジン、2−チオ−シチジン(s2C)、2−チオ−5−メチル−シチジン、4−チオ−プソイドイソシチジン、4−チオ−1−メチル−プソイドイソシチジン、4−チオ−1−メチル−1−デアザ−プソイドイソシチジン、1−メチル−1−デアザ−プソイドイソシチジン、ゼブラリン、5−アザ−ゼブラリン、5−メチル−ゼブラリン、5−アザ−2−チオ−ゼブラリン、2−チオ−ゼブラリン、2−メトキシ−シチジン、2−メトキシ−5−メチル−シチジン、4−メトキシ−プソイドイソシチジン、4−メトキシ−1−メチル−プソイドイソシチジン、リシジン(kC)、α−チオ−シチジン、2’−O−メチル−シチジン(Cm)、5,2’−O−ジメチル−シチジン(mCm)、N4−アセチル−2’−O−メチル−シチジン(acCm)、N4,2’−O−ジメチル−シチジン(mCm)、5−ホルミル−2’−O−メチル−シチジン(fCm)、N4,N4,2’−O−トリメチル−シチジン(m Cm)、1−チオ−シチジン、2’−F−アラ−シチジン、2’−F−シチジン、および2’−OH−アラ−シチジンが挙げられる。
アデニン
一実施形態では、修飾核酸塩基は、修飾アデニンである。修飾アデニンを有する代表的な核酸塩基およびヌクレオシドとしては、制限なしに、2−アミノ−プリン、2,6−ジアミノプリン、2−アミノ−6−ハロ−プリン(例えば、2−アミノ−6−クロロ−プリン)、6−ハロ−プリン(例えば、6−クロロ−プリン)、2−アミノ−6−メチル−プリン、8−アジド−アデノシン、7−デアザ−アデノシン、7−デアザ−8−アザ−アデノシン、7−デアザ−2−アミノ−プリン、7−デアザ−8−アザ−2−アミノ−プリン、7−デアザ−2,6−ジアミノプリン、7−デアザ−8−アザ−2,6−ジアミノプリン、1−メチル−アデノシン(mA)、2−メチル−アデノシン(mA)、N6−メチル−アデノシン(mA)、2−メチルチオ−N6−メチル−アデノシン(ms2mA)、N6−イソペンテニル−アデノシン(iA)、2−メチルチオ−N6−イソペンテニル−アデノシン(msA)、N6−(シス−ヒドロキシイソペンテニル)アデノシン(ioA)、2−メチルチオ−N6−(シス−ヒドロキシイソペンテニル)アデノシン(ms2ioA)、N6−グリシジルカルバモイル(glycinylcarbamoyl)−アデノシン(gA)、N6−スレオニルカルバモイル−アデノシン(tA)、N6−メチル−N6−スレオニルカルバモイル−アデノシン(mA)、2−メチルチオ−N6−スレオニルカルバモイル−アデノシン(msA)、N6,N6−ジメチル−アデノシン(m A)、N6−ヒドロキシノルバリルカルバモイル−アデノシン(hnA)、2−メチルチオ−N6−ヒドロキシノルバリルカルバモイル−アデノシン(ms2hnA)、N6−アセチル−アデノシン(acA)、7−メチル−アデノシン、2−メチルチオ−アデノシン、2−メトキシ−アデノシン、α−チオ−アデノシン、2’−O−メチル−アデノシン(Am)、N,2’−O−ジメチル−アデノシン(mAm)、N−メチル−2’−デオキシアデノシン、N6,N6,2’−O−トリメチル−アデノシン(m Am)、1,2’−O−ジメチル−アデノシン(mAm)、2’−O−リボシルアデノシン(リン酸塩)(Ar(p))、2−アミノ−N6−メチル−プリン、1−チオ−アデノシン、8−アジド−アデノシン、2’−F−アラ−アデノシン、2’−F−アデノシン、2’−OH−アラ−アデノシン、およびN6−(19−アミノ−ペンタオキサノンアデシル)−アデノシンが挙げられる。
グアニン
一実施形態では、修飾核酸塩基は、修飾グアニンである。修飾グアニンを有する代表的な核酸塩基およびヌクレオシドとしては、制限なしに、イノシン(I)、1−メチル−イノシン(mI)、ワイオシン(imG)、メチルワイオシン(mimG)、4−デメチル−ワイオシン(imG−14)、イソワイオシン(imG2)、ウィブトシン(yW)、ペルオキシウィブトシン(oyW)、ヒドロキシウィブトシン(OHyW)、低修飾ヒドロキシウィブトシン(OHyW)、7−デアザ−グアノシン、クエオシン(Q)、エポキシクエオシン(oQ)、ガラクトシル−クエオシン(galQ)、マンノシル−クエオシン(manQ)、7−シアノ−7−デアザ−グアノシン(preQ)、7−アミノメチル−7−デアザ−グアノシン(preQ)、アルカエオシン(G)、7−デアザ−8−アザ−グアノシン、6−チオ−グアノシン、6−チオ−7−デアザ−グアノシン、6−チオ−7−デアザ−8−アザ−グアノシン、7−メチル−グアノシン(mG)、6−チオ−7−メチル−グアノシン、7−メチル−イノシン、6−メトキシ−グアノシン、1−メチル−グアノシン(m’G)、N2−メチル−グアノシン(mG)、N2,N2−ジメチル−グアノシン(m G)、N2,7−ジメチル−グアノシン(m,7G)、N2、N2,7−ジメチル−グアノシン(m,2,7G)、8−オキソ−グアノシン、7−メチル−8−オキソ−グアノシン、1−メチル−6−チオ−グアノシン、N2−メチル−6−チオ−グアノシン、N2,N2−ジメチル−6−チオ−グアノシン、α−チオ−グアノシン、2’−O−メチル−グアノシン(Gm)、N2−メチル−2’−O−メチル−グアノシン(mGm)、N2,N2−ジメチル−2’−O−メチル−グアノシン(m Gm)、1−メチル−2’−O−メチル−グアノシン(m’Gm)、N2,7−ジメチル−2’−O−メチル−グアノシン(m,7Gm)、2’−O−メチル−イノシン(Im)、1,2’−O−ジメチル−イノシン(m’Im)、O−フェニル−2’−デオキシイノシン、2’−O−リボシルグアノシン(リン酸塩)(Gr(p))、1−チオ−グアノシン、O−メチル−グアノシン、O−メチル−2’−デオキシグアノシン、2’−F−アラ−グアノシン、および2’−F−グアノシンが挙げられる。
例示的修飾gRNA
特定の実施形態では、本明細書に記載される修飾核酸は、修飾gRNAであり得る。本明細書中に記載されるgRNAのいずれでも、本明細書に記載されるように修飾され得るものと理解される。
実験(結果は示さず)を通じて、CRISPR/CasシステムのgRNA構成要素は、gRNAがその5’末端またはその付近で修飾された場合に、T細胞の遺伝子を編集する上で、より効率的であることが見出された(例えば、gRNAの5’末端が真核生物mRNAキャップ構造またはキャップ類似体の包含によって修飾された場合。理論による拘束は望まないが、本明細書に記載されるこれらおよび他の改変gRNAは、特定の循環細胞型(例えば、T細胞)に由来する先天性免疫応答の低下を引き起こし、この低下した応答が、観察された改善の原因であってもよいと考えられる。本発明は、gRNAに対する循環細胞(例えば、T細胞)の先天性免疫応答を最小化することが、gRNAを使用して循環細胞(生体外または生体内を問わない)を編集する場合に有利であり得て、また例えば、gRNAが生体内遺伝子編集目的のために全身的にまたは局所的に投与される場合など、gRNAを使用して非循環細胞を編集する場合にも有益であり得る、という認識を包含する。本発明はまた、5’キャップドgRNAで観察された改善が、同じタイプの構造的または機能的結果を達成するために、その他の様式で修飾されたgRNAに拡張され得るという認識も包含する(例えば、修飾されたヌクレオシドまたはヌクレオチドを含めることで、または生体内転写されたgRNAが、仔ウシ腸アルカリホスファターゼなどのホスファターゼでの処理によって、5’三リン酸基が除去されることで修飾される場合など)。理論による拘束は望まないが、特定の実施形態では、本明細書に記載される修飾gRNAは、1つまたは複数の修飾(例えば、修飾されたヌクレオシドまたはヌクレオチド)を含有してもよく、それはヌクレアーゼに安定性を導入する(例えば、修飾されたヌクレオシドまたはヌクレオチドおよび/または3’ポリA配列を含めることで)。
したがって、特定の実施形態では、本明細書で提供される組成物および方法は、本明細書に記載されるような1つまたは複数の修飾されたヌクレオシドまたはヌクレオチドを含む、gRNAを使用する。これらの実施形態のあるものでは、1つ以上の修飾されたヌクレオシドまたはヌクレオチドの包含は、特定の循環細胞型(例えば、T細胞、マクロファージ、樹状細胞、および/またはB細胞)において、その他の未修飾gRNAと比較して、gRNAに低下した先天性免疫応答を誘発させる。
特定の実施形態では、本明細書で提供される組成物および方法で使用するためのgRNAは、その5’末端またはその付近(例えば、その5’末端の1〜10、1〜5または1〜2ヌクレオチド内)で修飾される。特定の実施形態では、gRNAは、真核生物mRNAキャップ構造またはキャップ類似体(例えば、G(5’)ppp(5’)Gキャップ類似体、m7G(5’)ppp(5’)Gキャップ類似体、または3’−O−Me−m7G(5’)ppp(5’)Gアンチリバースキャップ類似体(ARCA))の包含によって修飾される。キャップまたはキャップ類似体は、gRNAの化学合成または生体外転写中に組み込まれ得る。特定の実施形態では、生体外転写gRNAは、ホスファターゼ(例えば、仔ウシ腸アルカリホスファターゼ)での処理によって修飾されて、5’三リン酸基が除去される。
特定の実施形態では、本明細書で提供される組成物および方法で使用するためのgRNAは、その3’末端またはその付近(例えば、その3’末端の1〜10、1〜5または1〜2ヌクレオチド内)で修飾される。
一実施形態では、gRNAの3’末端は、1つまたは複数(例えば、25〜200個)のアデニン(A)残基の添加によって修飾される。ポリA配列は、gRNAをコードする核酸(例えば、プラスミド、PCR産物、ウイルスゲノム)に含有され得て、またはポリアデノシンポリメラーゼ(例えば、大腸菌(E.coli)ポリ(A)ポリメラーゼ)を用いて、化学合成中にまたは生体外転写に続いてgRNAに付加され得る。
特定の実施形態では、本明細書で提供される組成物および方法で使用するためのgRNAは、その5’末端またはその付近の修飾と、その3’末端またはその付近の修飾との双方を含んでなる。
特定の実施形態では、生体外転写gRNAは、5’キャップ構造またはキャップ類似体と、3’ポリA配列との双方を含有する。一実施形態では、生体外転写gRNAは、ホスファターゼ(例えば、仔ウシ腸アルカリホスファターゼ)での処理によって修飾されて5’三リン酸基が除去され、3’ポリA配列を含んでなる。
いくつかの実施形態では、gRNAsは、3’末端Uリボースで修飾され得る。例えば、Uリボースの2つの末端ヒドロキシル基が、アルデヒド基に酸化され得て、同時のリボース環の開環が、下に示される修飾ヌクレオシドをもたらす:
式中、「U」は、未修飾または修飾ウリジンであり得る。
別の実施形態では、3’末端Uが、下で示されるように2’3’環状リン酸エステルで修飾され得る:
式中、「U」は、未修飾または修飾ウリジンであり得る。
いくつかの実施形態では、gRNA分子は、例えば、本明細書に記載される修飾ヌクレオチドの1つまたは複数を組み込むことで、分解に対して安定化され得る、3’ヌクレオチドを含有してもよい。この実施形態では、例えば、ウリジンは、例えば、5−(2−アミノ)プロピルウリジン、および5−ブロモウリジンで、または本明細書に記載される修飾ウリジンのいずれかなどの修飾ウリジンで置換され得て;アデノシンおよびグアノシンは、例えば、8−ブロモグアノシンなどの例えば、8位の修飾によって、修飾アデノシンおよびグアノシンで、または本明細書に記載される修飾アデノシンまたはグアノシンのいずれかによって、置換され得る。
いくつかの実施形態では、糖修飾リボヌクレオチドがgRNAに組み込まれ得て、例えば、2’OH基が、H、−OR、−R(式中、Rは、例えば、アルキル、シクロアルキル、アリール、アラルキル、ヘテロアリールまたは糖であり得る)、ハロ、−SH、−SR(式中、Rは、例えば、アルキル、シクロアルキル、アリール、アラルキル、ヘテロアリールまたは糖であり得る)、アミノ(式中、アミノは、例えば、NH;アルキルアミノ、ジアルキルアミノ、ヘテロシクリル、アリールアミノ、ジアリールアミノ、ヘテロアリールアミノ、ジヘテロアリールアミノ、またはアミノ酸であり得る);またはシアノ(−CN)から選択される基によって置換される。いくつかの実施形態では、リン酸骨格は、例えば、ホスホロチオエート(phosphothioate)基で、本明細書に記載されるように修飾され得る。いくつかの実施形態では、gRNAのヌクレオチドの1つまたは複数は、それぞれ独立して、2’−O−メチル、2’−O−メトキシエチルなどの2’糖修飾、または例えば、2’−Fまたは2’−O−メチル、アデノシン(A)、2’−Fまたは2’−O−メチル、シチジン(C)、2’−Fまたは2’−O−メチル、ウリジン(U)、2’−Fまたは2’−O−メチル、チミジン(T)、2’−Fまたは2’−O−メチル、グアノシン(G)をはじめとする2’フルオロ修飾、2’−O−メトキシエチル−5−メチルウリジン(Teo)、2’−O−メトキシエチルアデノシン(Aeo)、2’−O−メトキシエチル−5−メチルシチジン(m5Ceo)、およびそれらの任意の組み合わせをはじめとするが、これに限定されるものではない、修飾または未修飾ヌクレオチドであり得る。
いくつかの実施形態では、gRNAは、「ロックド」核酸(LNA)を含み得て、その中で、2’OH基は、例えば、同一リボース糖の4’炭素へのC1−6アルキレンまたはC1−6ヘテロアルキレン架橋によって結合され得て、例示的架橋としては、メチレン、プロピレン、エーテル、またはアミノ架橋;Oアミノ(その中で、アミノは、例えば、NH;アルキルアミノ、ジアルキルアミノ、ヘテロシクリル、アリールアミノ、ジアリールアミノ、ヘテロアリールアミノ、またはジヘテロアリールアミノ、エチレンジアミン、またはポリアミノであり得る)およびアミノアルコキシまたはO(CHアミノ(その中で、アミノは、例えば、NH;アルキルアミノ、ジアルキルアミノ、ヘテロシクリル、アリールアミノ、ジアリールアミノ、ヘテロアリールアミノ、またはジヘテロアリールアミノ、エチレンジアミン、またはポリアミノであり得る)が挙げられる。
いくつかの実施形態では、gRNAは、多環である修飾ヌクレオチド(例えば、トリシクロ;およびグリコール核酸(GNA)などの「アンロックド」形態(例えば、その中でリボースがリン酸ジエステル結合に付着するグリコール単位で置換される、R−GNAまたはS−GNA)、またはトレオース核酸(その中でリボースがα−L−トレオフラノシル−(3’→2’)で置換される、TNA)を含み得る。
一般に、gRNA分子は、酸素を有する5員環の糖類であるリボースを含む。代表的な修飾gRNAとしては、制限なしに、リボース中の酸素の置換(例えば、イオウ(S)、セレン(Se)、または例えば、メチレンまたはエチレンなどのアルキレンによる);二重結合の付加(例えば、リボースをシクロペンテニルまたはシクロヘキセニルで置換する);リボース環縮小(例えば、シクロブタンまたはオキセタンの4員環を形成する);リボース環拡大(例えば、アンヒドロヘキシトール、アルトリトール、マンニトール、シクロヘキサニル、シクロヘキセニル、例えば、ホスホロアミダート骨格もまた有するモルホリノなどの追加的な炭素またはヘテロ原子を有する6または7員環を形成する)が挙げられる。糖類似体改変の大部分は2’位に局在するが、4’位をはじめとするその他の部位も修飾を受け入れやすい。一実施形態では、gRNAは、4’−S、4’−Seまたは4’−C−アミノメチル−2’−O−Me修飾を含んでなる。
いくつかの実施形態では、例えば、7−デアザ−アデノシンなどのデアザヌクレオチドが、gRNAに組み込まれ得る。いくつかの実施形態では、O−およびN−アルキル化ヌクレオチド、例えば、N6−メチルアデノシンが、gRNAに組み込まれ得る。いくつかの実施形態では、gRNA分子中の1つまたは複数のまたは全てのヌクレオチドが、デオキシリボヌクレオチドである。
miRNA結合部位
マイクロRNA(またはmiRNA)は、天然の19〜25ヌクレオチド長の非コードRNAである。それらは、例えばmRNAの3’UTRなどの適切なmiRNA結合部位を有する核酸分子に結合し、遺伝子発現を下方制御する。理論による拘束は望まないが、この下方制御は、核酸分子の安定性を低下させるか、または翻訳を阻害することで生じると考えられる。例えば、Cas9をコードするmRNAなどの本明細書で開示されるRNA種は、例えばその3’UTRにmiRNA結合部位を含んでなり得る。miRNA結合部位は、選択された細胞型における(is)発現の下方制御を促進するように選択され得る。
以下の実施例は単なる例示であり、本発明の範囲または内容をどのようにも限定することは意図されない。
実施例1:Cas9リボ核タンパク質複合体の生物物理学的特性決定および直接送達
Cas9リボ核タンパク質(RNP)複合体の直接送達は、細胞内のCas9タンパク質の迅速な代謝回転のおかげで、オフターゲット活性を最小化しながら効率的な遺伝子編集を可能にする。RNP送達によって媒介される遺伝子編集の効率は遺伝子座によって異なり、gRNAの長さおよび送達されるCas9タンパク質およびgRNAの量および比率に依存する。
Cas9のgRNAとの複合体の構造的および生物物理学的特性決定は、大きな接触面積および高い親和性を明らかにした。熱溶融曲線は、複合体の結合および安定性を検出するのに有用な特性である。apo−Cas9分子(すなわち、gRNA分子の非存在下のCas9分子)からgRNAと複合体形性したCas9分子への融解温度の大幅な上昇を用いて、Cas9のgRNAに対する親和性を特徴付けた。異なる長さの複数のgRNAをCas9と異なる化学量論で複合体形成させ、熱シフト(例えば、融解温度のシフト)を用いて相互作用を測定した。次に、これらの生物物理学的に特徴付けられた複合体を293T細胞にトランスフェクトし、生成されたインデルの効率を測定した。gRNAの長さおよび塩基組成のわずかな差異は、RNP複合体の結合および形成に影響を及ぼすことが示された。結合親和性をゲノム編集の効率と相関させることにより、例えば、カチオン性脂質介在直接送達のためのRNPの最適組成の設計が可能になる。
DSFによるCas9分子およびCas9分子/gRNA分子複合体の評価
S.アウレウス(S.aureus)およびS.ピオゲネス(S.pyogenes)Cas9分子を組換え的に発現させて、Niアフィニティクロマトグラフィー、SPセファロース、およびSuperdex 200を用いて精製した。
DSFを用いて、gRNA分子の非存在下での精製されたS.アウレウス(S.aureus)およびS.ピオゲネス(S.pyogenes)Cas9分子の安定性を調べた。反応混合物は、10μL容量中に5μMのCas9分子および5×SYPRO Orange(登録商標)(Life Technologiesカタログ番号S−6650)を含有した。勾配は、20℃で1分間、次に20℃から95℃まで、10秒毎に1℃の増分で実行した。蛍光シグナルの導関数を温度に対してプロットし、アンフォールディング転移の温度中点(T)を判定した。図9Aおよび9Bに示されるように、S.アウレウス(S.aureus)Cas9分子(T=36℃)は、S.ピオゲネス(S.pyogenes)Cas9分子(T=40℃)よりも不安定であった。
DSFを用いて、Cas9分子/gRNA分子複合体もまた調べた。S.ピオゲネス(S.pyogenes)Cas9単独、S.ピオゲネス(S.pyogenes)Cas9と1μMのS.ピオゲネス(S.pyogenes)gRNA、およびS.ピオゲネス(S.pyogenes)Cas9と1μMのS.アウレウス(S.aureus)gRNAをH150(10mM HEPES pH7.5、150mM NaCl)中で試験した。これらの実験で使用されたgRNA分子をコードするDNA配列は、次のとおりであった:
S.ピオゲネス(S.pyogenes)gRNA:
;および
S.アウレウス(S.aureus)gRNA:
図10に示されるように、S.ピオゲネス(S.pyogenes)Cas9の熱変性は42℃であり、同時のgRNA分子の存在下において、50℃への熱シフトが観察された。しかし、S.ピオゲネス(S.pyogenes)Cas9を外来gRNA分子と共にインキュベートした場合には、シフトは観察されなかった。これらの結果は、Cas9分子/gRNA分子複合体形成が、熱シフトと相関してもよいことを示唆する。
JurkatT細胞へのCas9分子/gRNA分子複合体の送達
Cas9およびgRNAは、1:25の比率であった。gRNA構築物を、PCRプロトコルを用いて作製した。gRNAを生体外転写し、キャッピングし(例えば、5’アンチリバースキャップアナログ(ARCA)キャップ)、テール付加した(例えば、3’ポリAテール)。図11Aに示すように、gRNA結合はTを32℃から46℃にシフトさせた。Cas9/gRNA複合体は、JurkatT細胞に送達された。図11Bは、約20%の細胞がCD3マーカーを喪失した(loss)ことを示している。
実施例2:生体外転写または化学合成からのgRNA分子の比較
DSFを用いて、Cas9分子/gRNA分子複合体の成功裏の形成をアッセイし、3つの方法または供給業者から得られたgRNA分子の品質および完全性を比較した。
表6の配列に対応する配列を有するgRNA分子を、15〜50μgの規模で得た。
4μMの精製Cas9タンパク質を、H150緩衝液(10mM HEPES pH7.5,150mM NaCl)中で、室温において等モル量のgRNAと複合体形成させた。次に、Cas9分子/gRNA分子複合体(RNP)を含有するこの反応物の一部を、リポフェクタミン2000トランスフェクション試薬を使用して、HEK293FT細胞にトランスフェクトした。ガイド起源に関わりなく、100nMのRNPを全例で使用した。いずれの場合にも、RNPの残りをH150緩衝液中で1μMに希釈し、SYPRO Orangeを5000×ストックから5×の最終濃度まで加え、本明細書に記載されるアッセイ1にしたがってDSFアッセイを実施した。インデル定量化は、本明細書に記載のプロトコルに従って実施した。
実験結果は、表6に要約される。δTを42℃で融解するCas9タンパク質と比較した。結果は、8〜9℃のδTによって証明される完全なRNP複合体形成を示唆したサンプルが、全て、HEK293FT細胞において良好なNHEJ活性を示したことを示した。
会社2からの化学的に合成されたgRNAは、極小のδTmとより低いNHEJ活性(11%インデル)とを有して、不十分であることが判明した。
MEGAshortscript T7キットによる生体外転写gRNAおよび会社1から購入されたgRNAは、7〜8℃のTおよび22〜27℃の範囲のNHEJ活性によって実証されたように、十分な品質と完全性を有していた。
実施例3:gRNAのクローニングおよび最初のスクリーニング
本実施例は、キメラgRNAを評価する方法を開示する。同一アプローチはまた、モジュラーgRNAを評価するのに用いられてもよい。
gRNAをベクターにクローニングする
各gRNAについて、重複するオリゴヌクレオチドの対が設計されて得られる。オリゴヌクレオチドは、アニールされて、長いキメラgRNAの上流U6プロモーターおよび残りの配列を含有する、消化ベクター骨格にライゲートされる。プラスミドは配列確認されて、十分な量の形質移入品質のDNAを生成するために準備される。特定の実施形態では、U6プロモーターは代替のプロモーターで置換されて、生体内転写(例えば、H1プロモーター)または生体外転写(例えば、aT7プロモーター)を駆動してもよい。
gRNAを線状dsDNA分子(STITCHR)にクローニングする
各gRNAについて、1つのオリゴヌクレオチドが設計されて得られる。U6プロモーターおよびgRNAスキャフォールド(例えば、第1の相補的ドメイン;連結ドメイン;第2の相補的ドメイン;隣接ドメイン;およびテールドメインをはじめとする、crRNAおよびtracrRNAに由来する配列をはじめとする、標的化ドメイン以外の全てを含む)は、別々にPCR増幅されて、dsDNA分子として精製される。gRNA特異的オリゴヌクレオチドがPCR反応で使用されて、オリゴヌクレオチド中で特定化された標的化ドメインによって連結する、U6およびgRNAスキャフォールドを縫い合わせる。得られたdsDNA分子(STITCHR産物)をトランスフェクションのために精製する。任意のgRNAスキャフォールドを使用して、任意の細菌種に由来するCas9と適合性のgRNAが生成されてもよい。特定の実施形態では、U6プロモーターは代替のプロモーターで置換されて、生体内転写(例えば、H1プロモーター)または生体外転写(例えば、T7プロモーター)を駆動してもよい。
初期gRNAスクリーニング
試験される各gRNAは、プラスミド発現Cas9および小量のGFP発現プラスミドと共に、ヒト細胞に形質移入される。予備実験では、これらの細胞は、293T、K562またはU2OSなどの不死化ヒト細胞株であり得る。代案としては、初代ヒト細胞が使用されてもよい。スクリーニングに使用される細胞は、最終的な治療用細胞標的(例えば、赤血球系細胞)に関連してもよい。可能な治療標的細胞集団と類似した初代細胞の使用は、内因性クロマチンおよび遺伝子発現の文脈で、遺伝子標的化比率に関する重要な情報を提供してもよい。
形質移入は、(リポフェクタミンまたはFuGENEなどの)脂質移入を使用して、または(Lonzaヌクレオフェクションなどの)電気穿孔によって実施されてもよい。形質移入に続いて、GFP発現は、蛍光顕微鏡検査またはフローサイトメトリーのどちらかによって判定され、一貫した高レベルの形質移入が確認され得る。予備形質移入は、異なるgRNAおよび異なる標的化アプローチ(例えば、17量体、20量体、ヌクレアーゼ、二重ニッカーゼなど)を含んでなり、いずれのgRNA/gRNA組み合わせが最大活性を与えるかが判定され得る。
各gRNAによる切断の効率は、T7E1エンドヌクレアーゼアッセイによって標的遺伝子座でNHEJ誘導性インデル形成を測定することで評価されてもよい。このアッセイでは、PCRアンプリコンは、およそ500〜700bpであり、意図される切断部位は、アンプリコン中に非対称的に配置される。PCR産物の増幅、精製、およびサイズ検証に続いて、95℃に加熱して、次に、緩慢に冷却することで、DNAは変性され再ハイブリダイズされる。ハイブリダイズPCR産物は、次に、非完全にマッチするDNAを認識して切断する、T7エンドヌクレアーゼI(またはその他のミスマッチ感受性酵素)で消化される。インデルが元の鋳型DNA中に存在する場合、アンプリコンの変性および再アニーリングは、異なるインデルを保有するDNA鎖のハイブリダイゼーションをもたらし、完全に一致しない二本鎖DNAがもたらされる。消化産物は、ゲル電気泳動またはキャピラリー電気泳動法によって視覚化されてもよい。切断されたDNAの割合(切断および比切断密度で除した分解産物密度)を使用して、次の方程式を使用して、パーセントNHEJが推定されてもよい:%NHEJ=(1−(1−切断割合)1/2)。T7E1アッセイは、約2〜5%NHEJに至るまで感受性である。
特定の実施形態では、例えば、CelI/Surveyorヌクレアーゼなどのミスマッチ感受性酵素の配列決定と使用をはじめとするその他の方法が、切断効率を評価するために用いられてもよい。サンガー配列決定では、精製PCRアンプリコンがプラスミド骨格にクローン化され、形質転換されて、単一プライマーでミニプレップされて配列決定される。T7E1によってNHEJ比率を判定した後に、サンガー配列決定を使用して、インデルの正確な性質が判定されてもよい。次世代配列決定では、アンプリコンは300〜500bpであってもよく、意図される切断部位は非対称的に配置される。PCRに続いて、例えば、(例えば、Illumina MiSeq上の)ハイスループット配列決定で使用される次世代配列決定アダプターおよびバーコード(例えばIllumina多重アダプターおよびインデクス)が、アンプリコンの末端に付加されてもよい。この方法は、非常に低いNHEJ比率の検出を可能にする。
実施例4:NHEJによる遺伝子標的化の評価
遺伝子標的化効率のさらなる評価のために、最初の試験で最大レベルのNHEJを誘導するgRNAが選択され得る。この場合、細胞は疾病対象に由来し、したがって関連変異を有する。
形質移入に続いて(通常は形質移入の2〜3日後)、ゲノムDNAが形質移入細胞の混合集団から単離されてもよく、PCRを使用して標的領域が増幅されてもよい。PCRに続いて、所望の変異体(標的遺伝子のノックアウトまたは標的配列モチーフの除去のどちらか)を生成する遺伝子標的化効率が、配列決定によって判定されてもよい。サンガー配列決定では、PCRアンプリコンは、500〜700bp長であってもよい。次世代配列決定では、PCRアンプリコンは、300〜500bp長であってもよい。遺伝子機能のノックアウトが目的である場合、配列決定を使用して、遺伝子機能を破壊することが予期されるフレームシフトまたは大規模な欠失または挿入をもたらすNHEJ誘導インデルを、対立遺伝子の何パーセントが受けたかが評価されてもよい。特定の配列モチーフの除去が目的であれば、配列決定を用いて、この配列に広がる対立遺伝子の何パーセントが、NHEJ誘導欠失を受けたかが評価されてもよい。
実施例5:HDRによる遺伝子標的化の評価
遺伝子標的化効率のさらなる評価のために、最初の試験で最大レベルのNHEJを誘導するgRNAが選択され得る。この場合、細胞は疾病対象に由来し、したがって関連変異を有する。
形質移入に続いて(通常は形質移入の2〜3日後)、ゲノムDNAが形質移入細胞の混合集団から単離されてもよく、PCRを使用して標的領域が増幅されてもよい。PCRに続いて、遺伝子標的効率は、いくつかの方法によって決定され得る。
遺伝子標的化頻度の判定は、外因的に提供されたドナー鋳型または内因性ゲノムドナー配列による相同指向修復(homologous directed repair)(HDR)を受け、その結果所望の修正が組み込まれた立遺伝子の百分率を測定することを伴う。所望のHDR事象が、制限酵素部位を生成または破壊する場合、遺伝子標的化の頻度は、RFLPアッセイによって判定されてもよい。制限部位が生成せずあるいは破壊されない場合、遺伝子標的化頻度は、配列決定を用いて決定されてもよい。RFLPアッセイを用いる場合でも、配列決定をなおも用いて、所望のHDR事象を確認し、その他の変異が存在しないことを確認してもよい。外因的に提供されたドナー鋳型を用いる場合、プライマーの少なくとも1つは、相同性アームに含まれる領域外の内因性遺伝子配列中に配置され、細胞になおも存在するドナー鋳型の増幅を妨げる。したがって、ドナー鋳型中に存在する相同性アームの長さは、PCRアンプリコンの長さに影響を及ぼしてもよい。PCRアンプリコンは、ドナー領域全体(相同性アームの外側に配置された双方のプライマー)に広がり得て、またはそれらは、ドナー領域の一部、およびドナーと内因性DNAの間の単一接合部(1つの内部プライマーおよび1つの外部プライマー)のみに広がり得る。アンプリコンがドナー領域全体よりも小さい場合、2つの異なるPCRを用いて、5’および3’接合の双方を増幅および配列決定する必要がある。
PCRアンプリコンが短い(600bp未満)場合、次世代配列決定を使用することが可能である。PCRに続いて、例えば、(例えば、Illumina MiSeq上の)ハイスループット配列決定で使用される次世代配列決定アダプターおよびバーコード(例えばIllumina多重アダプターおよびインデクス)が、アンプリコンの末端に付加されてもよい。この方法は、非常に低い遺伝子標的化率の検出を可能にする。
PCRアンプリコンが次世代配列決定には長すぎる場合、サンガー配列決定が実施され得る。サンガー配列決定では、精製されたPCRアンプリコンをプラスミド骨格にクローン化し(例えば、LifeTech Zero Blunt(登録商標)TOPO(登録商標)クローニングキットを使用してTOPOクローン化し)、形質転換し、ミニプレップして配列決定する。
上述の同一または同様のアッセイを用いて、内因性ゲノムドナー配列によるHDRを受け、その結果所望の修正が組み込まれた対立遺伝子の百分率を測定し得た。
参照による援用
全本明細書で言及されるての文献、特許、および特許出願は、あたかも個々の出版物、特許または特許出願が、具体的にそして個別に、参照により援用されると示されるかのように、その内容全体を参照により本明細書に援用する。矛盾する場合は、本明細書の任意の定義をはじめとして、本出願が優先される。
同等物
当業者は、単に通例の実験法を用いて、本明細書に記載される本発明の特定の実施形態の多くの同等物を認識し、または見極めることができるであろう。このような同等物は、以下の特許請求の範囲に包含されることが意図される。
参考文献
Anders et al.Nature 513(7519):569−573(2014)
Bae et al.Bioinformatics 30(10):1473−1475(2014)
Caldecott Nat Rev Genet 9(8):619−631(2008)
Chylinski et al.RNA Biol 10(5):726−737(2013)
Cong et al.Science 399(6121):819−823(2013)
Deveau et al.J Bacterial 190(4):1390−1400(2008)
Esvelt et al.Nature 472(7344):499−503(2011)
Fu et al.Nat Biotechnol 32:279−284(2014)
Haft PLoS Comput Biol 1(6):e60(2005)
Heigwer Nat Methods 11(2):122−123(2014)
Horvath & Barrangou Science 327(5962):167−170(2010)
Hsu et al.Nat Biotechnol 31(9):827−832(2013)
Jinek et al.Science 337(6096):816−821(2012)
Jinek et al.Science 343(6176):1247997(2014)
Lee et al.Nano Lett 12(12):6322−6327(2012)
Li Cell Res 18(1):85−98(2008)
Makarova et al.Nat Rev Microbiol 9(6):467−477(2011)
Mali et al.Science 339(6121):823−826(2013)
Marteijn et al.Nat Rev Mol Cell Biol 15(7):465−481(2014)
Nishimasu et al.Cell 156(5):935−949(2014)
Sternberg et al.Nature 507(7490):62−67(2014)
Wang et al.Cell 153(4):910−918(2013)
Xiao et al.“CasOT: a genome−wide Cas9/gRNA off−target searching tool.”Bioinformatics(epub Jan.21,2014)

Claims (57)

  1. (a)Cas9分子と複数のgRNA分子の1つとを組み合わせることによって作製されるCas9分子/gRNA分子複合体を各サンプルが含んでなる、複数のサンプルを作製するステップと;
    (b)前記複数のサンプルのそれぞれにおけるCas9分子/gRNA分子複合体の融解温度(T)値を検出するステップと;
    (c)(i)前記複数のサンプルにおけるT値と、参照Cas9分子/gRNA分子複合体のT値との、または所定の閾値T値との比較、または(ii)前記複数のサンプルのT値の相対的な順序付けの1つまたは複数に基づいて、前記複数のサンプルから少なくとも1つのサンプルを選択するステップと
    を含んでなる、対象に投与するためのCas9分子/gRNA分子複合体をスクリーニングする方法。
  2. 前記複数のサンプル中の各サンプルの前記Cas9分子/gRNA分子複合体のT値を検出するステップが、前記複数のサンプル中の各サンプルを示差走査型蛍光定量法(DSF)によって評価するステップを含む、請求項1に記載の方法。
  3. 前記gRNAがキメラgRNAである、請求項1に記載の方法。
  4. 前記gRNAがモジュラーgRNAである、請求項1に記載の方法。
  5. 請求項1〜2の1つの方法に従って選択された、前記gRNA分子の非存在下での前記Cas9分子のT値より少なくとも8℃高い融解温度(T)を有する、単離されたCas9分子とgRNA分子との複合体。
  6. 請求項1〜2の1つの方法に従って選択された、前記gRNA分子の非存在下での前記Cas9分子のTより少なくとも8℃高い融解温度(T)を有する、単離されたCas9分子とgRNA分子との複合体を含んでなる組成物。
  7. 前記Cas9分子と前記gRNA分子の非天然複合体の融解温度(T)と、前記gRNA分子の非存在下での前記Cas9分子の融解温度(T)との差が、示差走査型蛍光定量法(DSF)によって評価される、請求項6に記載の組成物。
  8. 前記gRNAがキメラまたはモジュラーgRNAである、請求項6に記載の組成物。
  9. (a)Cas9分子と複数のgRNA分子の1つとを組み合わせることによって作製されるCas9分子/gRNA分子複合体をそれぞれが含んでなる、複数のCas9分子/gRNA分子複合体を作製するステップと;
    (b)前記複数のCas9分子/gRNA分子複合体の各Cas9分子/gRNA分子複合体の融解温度(T)値を検出するステップと;
    (c)前記Cas9分子/gRNA分子複合体のT値が、参照分子のT値よりまたはT参照値より高ければ、前記複数のCas9分子/gRNA分子複合体の1つまたは複数が安定していると判定するステップと
    を含んでなる、Cas9分子/gRNA分子複合体の安定性を判定する方法。
  10. (a)サンプル中でCas9分子とgRNA分子とを組み合わせて、Cas9分子/gRNA分子複合体を形成するステップと;
    (b)前記Cas9分子/gRNA分子複合体の融解温度(T)値を検出するステップと;
    (c)前記Cas9分子/gRNA分子複合体のT値が、参照分子のT値よりまたはT参照値より高ければ、前記Cas9分子/gRNA分子複合体が安定していると判定するステップと
    を含んでなる、安定なCas9分子/gRNA分子複合体を促進する条件を判定する方法。
  11. (a)Cas9分子/gRNA分子複合体の融解温度(T)値を示差走査型蛍光定量法(DSF)によって検出するステップと;
    (b)前記Cas9分子/gRNA分子複合体のT値が、参照分子のT値よりまたはT参照値より高ければ、前記Cas9分子/gRNA分子複合体が安定していると判定するステップとを含んでなる、安定なCas9分子/gRNA分子複合体をスクリーニングする方法。
  12. (a)サンプル中でCas9分子とgRNA分子とを組み合わせて、Cas9分子/gRNA分子複合体を形成するステップと;
    (b)前記Cas9分子/gRNA分子複合体の融解温度(T)値を検出するステップと;
    (c)前記Cas9分子/gRNA分子複合体のT値が、参照分子のT値よりまたはT参照値より少なくとも8℃高ければ、前記Cas9分子/gRNA分子複合体が安定していると判定するステップと
    を含んでなる、安定なCas9分子/gRNA分子複合体を形成するのに最適なgRNAを同定する方法。
  13. (a)サンプル中でCas9分子とgRNA分子とを組み合わせて、Cas9分子/gRNA分子複合体を形成するステップと;
    (b)前記Cas9分子/gRNA分子複合体の融解温度(T)値を検出するステップと;
    (c)前記Cas9分子/gRNA分子複合体の活性値を測定するステップと;
    (d)(i)前記Cas9分子/gRNA分子複合体のT値が、参照分子のT値よりまたはT参照値より高く(ii)前記Cas9分子/gRNA分子複合体の活性値が、参照分子の活性値よりまたは活性参照値より高ければ、前記Cas9分子/gRNA分子複合体が安定していると判定するステップと
    を含んでなる、Cas9分子/gRNA分子複合体の安定性を判定する方法。
  14. (a)サンプル中でCas9分子とgRNA分子とを組み合わせて、Cas9分子/gRNA分子複合体を形成するステップと;
    (b)前記Cas9分子/gRNA分子複合体の融解温度(T)を検出するステップと;
    (c)前記Cas9分子/gRNA分子複合体のT値と、参照分子のT値とのまたはT参照値との間のδ値を判定するステップと;
    (d)δ値が少なくとも8℃であり、前記Cas9分子/gRNA分子複合体のT値が、参照分子のT値よりまたはT参照値より高ければ、前記Cas9分子/gRNA分子複合体が安定していると判定するステップと
    を含んでなる、安定なCas9分子/gRNA分子複合体を形成するgRNA分子のCas9分子への結合を最適化する方法。
  15. (a)参照分子の熱安定性値を検出するステップと;
    (b)サンプル中でCas9分子とgRNA分子とを組み合わせて、Cas9分子/gRNA分子複合体を形成するステップと;
    (c)Cas9分子/gRNA分子複合体の熱安定性値を測定するステップと;(d)前記Cas9分子/gRNA分子複合体の熱安定性値が、参照分子の熱安定性値より高ければ、前記Cas9分子/gRNA分子複合体が安定していると判定するステップと
    を含んでなる、安定なCas9分子/gRNA分子複合体を検出する方法。
  16. 前記熱安定性値が変性温度値であり、前記熱安定性参照値が変性温度参照値である、請求項15に記載の方法。
  17. 前記熱安定性値が、融解温度(T)価値であり、前記熱安定性参照値がT参照値である、請求項15に記載の方法。
  18. 前記Cas9分子/gRNA分子複合体のT値が、参照分子のT値よりまたはT参照値より、少なくとも1℃、少なくとも2℃、少なくとも3℃、少なくとも4℃、少なくとも5℃、少なくとも6℃、少なくとも7℃、少なくとも8℃、少なくとも9℃、少なくとも10℃、少なくとも11℃、少なくとも12℃、少なくとも13℃、少なくとも14℃、少なくとも15℃、少なくとも16℃、少なくとも17℃、少なくとも18℃、少なくとも19℃、または少なくとも20℃高ければ、前記Cas9分子/gRNA分子複合体が安定している、請求項9〜11、13、および17のいずれか一項に記載の方法。
  19. 前記Cas9分子/gRNA分子複合体のTが、参照分子のTよりまたはT参照値より少なくとも8℃高ければ、前記Cas9分子/gRNA分子複合体が安定している、請求項18に記載の方法。
  20. 前記Cas9分子/gRNA分子複合体のT値が、参照分子のT値よりまたはT参照値より、約1℃、約2℃、約3℃、約4℃、約5℃、約6℃、約7℃、約8℃、約9℃、約10℃、約11℃、約12℃、約13℃、約14℃、約15℃、約16℃、約17℃、約18℃、約19℃、または約20℃高ければ、前記Cas9分子/gRNA分子複合体が安定している、請求項9〜11、13、および17のいずれか一項に記載の方法。
  21. 前記Cas9分子/gRNA分子複合体のT値が、参照分子のT値よりまたはT参照値より約1℃〜5℃、約6℃〜10℃、約11℃〜15℃、または約16℃〜20℃高ければ、前記Cas9分子/gRNA分子複合体が安定している、請求項9〜11、13、および17のいずれか一項に記載の方法。
  22. 前記Cas9分子/gRNA分子複合体のTが、参照分子のTよりまたはT参照値より約6℃〜10℃高ければ、前記Cas9分子/gRNA分子複合体が安定している、請求項21に記載の方法。
  23. 値が、熱シフトアッセイを用いて検出される、請求項9〜10、12〜14、および17〜22のいずれか一項に記載の方法。
  24. 前記熱シフトアッセイが、示差走査型蛍光定量法(DSF)、示差走査熱量測定(DSC)、または等温滴定熱量測定(ITC)から選択される、請求項23に記載の方法。
  25. 前記gRNA分子が、キメラgRNA分子を含んでなる、請求項9〜24のいずれか一項に記載の方法。
  26. 前記gRNA分子が、モジュラーgRNA分子を含んでなる、請求項9〜24のいずれか一項に記載の方法。
  27. 前記Cas9分子が、表1から選択されるCas9分子である、請求項1〜4および9〜26のいずれか一項に記載の方法。
  28. 前記Cas9分子が、例えば、1つの消去部分またはいくつかの消去部分を有するCas9分子などの、キメラCas9分子、または合成または遺伝子操作Cas9分子である、請求項1〜4および9〜26のいずれか一項に記載の方法。
  29. 前記Cas9分子が、S.ピオゲネス(S.pyogenes)またはS.アウレウス(S.aureus)Cas9分子を含んでなる、請求項1〜4および9〜26のいずれか一項に記載の方法。
  30. 前記参照分子が、
    (a)前記gRNA分子の非存在下の参照Cas9分子;
    (b)第2のgRNA分子(すなわち、評価される前記複合体中のもの以外のgRNA)と複合体形成する、標準Cas9分子(例えば、評価される前記複合体中のCas9分子と同じCas9分子);および
    (c)参照Cas9分子/gRNA分子複合体
    から選択され、ここで前記参照Cas9分子/gRNA分子が、例えば、前記Cas9分子/gRNA分子複合体とは異なる比率のCas9分子およびgRNA分子などの異なる条件下で形成され、または異なる緩衝液中で形成される、請求項9〜29のいずれか一項に記載の方法。
  31. 前記参照Cas9分子が、前記評価される複合体の前記Cas9分子と同一である、請求項30に記載の方法。
  32. 前記参照Cas9分子が、前記評価される複合体の前記Cas9分子と異なる、請求項30に記載の方法。
  33. 前記参照Cas9分子が、前記評価される複合体の前記Cas9分子と一次配列が異なる、請求項32に記載の方法。
  34. 前記参照Cas9分子/gRNA分子複合体の前記gRNA分子が、前記評価される複合体の前記gRNA分子と同一である、請求項30〜33のいずれか一項に記載の方法。
  35. 前記参照Cas9分子/gRNA分子複合体の前記gRNA分子が、前記評価される複合体の前記gRNA分子と異なる、請求項30〜33のいずれか一項に記載の方法。
  36. 前記参照Cas9分子/gRNA分子複合体の前記gRNA分子が、前記評価される複合体の前記gRNA分子と配列が異なるか、または修飾のために異なる、請求項35に記載の方法。
  37. 前記T参照値が、Tの予め選択された数値を含んでなる、請求項9〜14および17〜36のいずれか一項に記載の方法。
  38. 前記T参照値が、請求項22〜27の前記参照分子のいずれかの前記Tと相関する値を含んでなる、請求項9〜14および17〜36のいずれか一項に記載の方法。
  39. 前記Cas9分子/gRNA分子複合体の活性を検出するステップと;
    前記Cas9分子/gRNA分子複合体の活性値を測定するステップと;
    前記Cas9分子/gRNA分子複合体の活性値が、参照分子の活性値よりまたは活性参照値より高ければ、前記Cas9分子/gRNA分子複合体が安定していると判定するステップと
    をさらに含んでなる、請求項1〜4、9〜12、および14〜38のいずれか一項に記載の方法。
  40. 前記活性が、
    インデルを誘導する能力;
    標的DNAを修飾する能力;
    予め選択された修復方法の傾向;
    前記gRNA分子が前記DNA標的にハイブリダイズしたまま留まる能力;および
    前記gRNA分子が前記Cas9分子/gRNA分子複合体の前記Cas9分子に結合する能力
    の1つまたは複数を含んでなる、請求項13および39のいずれか一項に記載の方法。
  41. 前記活性値が結合値であり、前記活性が、
    サンプル中で前記gRNA分子と前記Cas9分子とを組み合わせて、前記Cas9分子/gRNA分子複合体を形成するステップと;
    前記Cas9分子/gRNA分子複合体の結合値を測定するステップと;
    前記Cas9分子/gRNA分子複合体の結合値が、参照分子の前記結合値よりまたは前記結合参照値より高ければ、前記Cas9分子/gRNA分子複合体が安定していると判定するステップと
    を含んでなる、前記gRNA分子が前記Cas9分子に結合する能力である、請求項40に記載の方法。
  42. 前記結合値が、動態アッセイを用いて測定される、請求項41に記載の方法。
  43. 前記動態アッセイが、表面プラズモン共鳴(SPR)アッセイ、バイオレイヤー干渉法(BLI)アッセイ、またはゲルバンドシフトアッセイから選択される、請求項42に記載の方法。
  44. 前記予め選択された修復方法の傾向が、HDRまたはNHEJである、請求項40に記載の方法。
  45. 前記Cas9分子/gRNA分子複合体の活性が、
    試験管内システム;
    生体外システム;
    生体内システム;
    細胞アッセイ;または
    動物モデル
    を用いて試験される、請求項13および39〜44のいずれか一項に記載の方法。
  46. 前記参照分子が、請求項30〜33の参照分子のいずれか1つから選択される、請求項41〜45のいずれか一項に記載の方法。
  47. 前記参照Cas9分子/gRNA分子複合体が、前記Cas9分子/gRNA分子複合体とは異なる比率のCas9分子およびgRNA分子で形成され、または前記Cas9分子/gRNA分子複合体とは異なる緩衝液中で形成される、請求項41〜45のいずれか一項に記載の方法。
  48. 前記サンプルが、添加剤、小分子、安定化試薬、緩衝液、pH、塩濃度、グリセロール濃度、またはその他の緩衝液成分を含んでなる、構成要素を含んでなる、請求項10に記載の方法。
  49. 請求項1〜4および9〜48のいずれか一項に記載の方法を用いて作製される、合成Cas9分子/gRNA分子複合体。
  50. 請求項1〜3および9〜48のいずれか一項に記載の方法を用いて作製される、安定なCas9分子/gRNA分子複合体を含んでなる、組成物。
  51. 請求項1〜4および9〜48のいずれか一項に記載の方法を用いて作製される、安定なCas9分子/gRNA分子複合体をコードする核酸を含んでなる、ベクター系。
  52. 請求項9〜48のいずれか一項に記載の前記安定なCas9分子/gRNA分子複合体を標的細胞に送達するステップを含んでなる、前記Cas9分子/gRNA分子複合体を標的細胞に送達する方法。
  53. 前記安定なCas9分子/gRNA分子複合体が、RNPカチオン性脂質トランスフェクション、ウイルスベクター、またはRNAトランスフェクションによって前記細胞に送達される、請求項52に記載の方法。
  54. 前記ウイルスベクターがAAVベクターである、請求項53に記載の方法。
  55. 前記複数のgRNA分子が、候補gRNA分子のライブラリーである、請求項1および9のいずれか一項に記載の方法。
  56. 前記候補gRNA分子のライブラリーが、tracrRNA分子または配列のライブラリーを含んでなる、請求項55に記載の方法。
  57. 前記tracrRNA分子または配列のライブラリーが、異なる長さである、請求項56に記載の方法。
JP2018506818A 2015-04-24 2016-04-25 Cas9分子/ガイドrna分子複合体の評価 Pending JP2018522249A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562152473P 2015-04-24 2015-04-24
US62/152,473 2015-04-24
PCT/US2016/029252 WO2016172727A1 (en) 2015-04-24 2016-04-25 Evaluation of cas9 molecule/guide rna molecule complexes

Publications (1)

Publication Number Publication Date
JP2018522249A true JP2018522249A (ja) 2018-08-09

Family

ID=55967433

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018506818A Pending JP2018522249A (ja) 2015-04-24 2016-04-25 Cas9分子/ガイドrna分子複合体の評価

Country Status (11)

Country Link
US (2) US11180793B2 (ja)
EP (2) EP3286571B1 (ja)
JP (1) JP2018522249A (ja)
KR (1) KR102535217B1 (ja)
CN (1) CN107690480B (ja)
AU (1) AU2016253150B2 (ja)
CA (1) CA2982966C (ja)
IL (1) IL255125A0 (ja)
SG (1) SG11201708653RA (ja)
WO (1) WO2016172727A1 (ja)
ZA (1) ZA201707018B (ja)

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6261500B2 (ja) 2011-07-22 2018-01-17 プレジデント アンド フェローズ オブ ハーバード カレッジ ヌクレアーゼ切断特異性の評価および改善
WO2013163628A2 (en) 2012-04-27 2013-10-31 Duke University Genetic correction of mutated genes
US20150044192A1 (en) 2013-08-09 2015-02-12 President And Fellows Of Harvard College Methods for identifying a target site of a cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9388430B2 (en) 2013-09-06 2016-07-12 President And Fellows Of Harvard College Cas9-recombinase fusion proteins and uses thereof
US9340799B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College MRNA-sensing switchable gRNAs
US9526784B2 (en) 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
US9840699B2 (en) 2013-12-12 2017-12-12 President And Fellows Of Harvard College Methods for nucleic acid editing
WO2016022363A2 (en) 2014-07-30 2016-02-11 President And Fellows Of Harvard College Cas9 proteins including ligand-dependent inteins
US10093967B2 (en) 2014-08-12 2018-10-09 The Regents Of The University Of Michigan Detection of nucleic acids
EP3294896A1 (en) 2015-05-11 2018-03-21 Editas Medicine, Inc. Optimized crispr/cas9 systems and methods for gene editing in stem cells
WO2016201047A1 (en) 2015-06-09 2016-12-15 Editas Medicine, Inc. Crispr/cas-related methods and compositions for improving transplantation
US20190225955A1 (en) 2015-10-23 2019-07-25 President And Fellows Of Harvard College Evolved cas9 proteins for gene editing
WO2017139354A1 (en) * 2016-02-10 2017-08-17 The Regents Of The University Of Michigan Detection of nucleic acids
KR102547316B1 (ko) 2016-08-03 2023-06-23 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 아데노신 핵염기 편집제 및 그의 용도
AU2017308889B2 (en) 2016-08-09 2023-11-09 President And Fellows Of Harvard College Programmable Cas9-recombinase fusion proteins and uses thereof
US11542509B2 (en) 2016-08-24 2023-01-03 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
KR20240007715A (ko) 2016-10-14 2024-01-16 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 핵염기 에디터의 aav 전달
US10745677B2 (en) 2016-12-23 2020-08-18 President And Fellows Of Harvard College Editing of CCR5 receptor gene to protect against HIV infection
EP3565895A1 (en) * 2016-12-30 2019-11-13 Editas Medicine, Inc. Synthetic guide molecules, compositions and methods relating thereto
US11898179B2 (en) 2017-03-09 2024-02-13 President And Fellows Of Harvard College Suppression of pain by gene editing
EP3592777A1 (en) 2017-03-10 2020-01-15 President and Fellows of Harvard College Cytosine to guanine base editor
US11268082B2 (en) 2017-03-23 2022-03-08 President And Fellows Of Harvard College Nucleobase editors comprising nucleic acid programmable DNA binding proteins
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
WO2018231955A2 (en) 2017-06-13 2018-12-20 Genetics Research, Llc, D/B/A Zs Genetics, Inc. Isolation of target nucleic acids
US10081829B1 (en) 2017-06-13 2018-09-25 Genetics Research, Llc Detection of targeted sequence regions
US20180355380A1 (en) * 2017-06-13 2018-12-13 Genetics Research, Llc, D/B/A Zs Genetics, Inc. Methods and kits for quality control
US10527608B2 (en) 2017-06-13 2020-01-07 Genetics Research, Llc Methods for rare event detection
US10947599B2 (en) 2017-06-13 2021-03-16 Genetics Research, Llc Tumor mutation burden
WO2019014564A1 (en) 2017-07-14 2019-01-17 Editas Medicine, Inc. SYSTEMS AND METHODS OF TARGETED INTEGRATION AND GENOME EDITING AND DETECTION THEREOF WITH INTEGRATED PRIMING SITES
WO2019023680A1 (en) 2017-07-28 2019-01-31 President And Fellows Of Harvard College METHODS AND COMPOSITIONS FOR EVOLUTION OF BASIC EDITORS USING PHAGE-ASSISTED CONTINUOUS EVOLUTION (PACE)
WO2019139645A2 (en) 2017-08-30 2019-07-18 President And Fellows Of Harvard College High efficiency base editors comprising gam
US11795443B2 (en) 2017-10-16 2023-10-24 The Broad Institute, Inc. Uses of adenosine base editors
US20210309995A1 (en) * 2018-04-27 2021-10-07 Seattle Children's Hospital (dba Seattle Children's Research Institute) Homology-directed repair template design and delivery to edit hemoglobin-related mutations
WO2020081438A1 (en) 2018-10-16 2020-04-23 Blueallele, Llc Methods for targeted insertion of dna in genes
CA3130488A1 (en) 2019-03-19 2020-09-24 David R. Liu Methods and compositions for editing nucleotide sequences
GB2614813A (en) 2020-05-08 2023-07-19 Harvard College Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence

Family Cites Families (92)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7150982B2 (en) 1991-09-09 2006-12-19 Third Wave Technologies, Inc. RNA detection assays
US6203986B1 (en) 1998-10-22 2001-03-20 Robert H. Singer Visualization of RNA in living cells
ES2315598T3 (es) 1999-10-21 2009-04-01 Alcon, Inc. Dispositivo para la administracion de farmacos.
EP1387671A1 (en) 2001-05-03 2004-02-11 MASSACHUSETTS EYE & EAR INFIRMARY Implantable drug delivery device and use thereof
AU2003219847A1 (en) 2002-02-21 2003-09-09 The Wistar Institute Of Anatomy And Biology Methods and compositions for reversibly controlling expression of target genes in cells
AU2003274404A1 (en) 2002-06-11 2003-12-22 The Scripps Research Institute Artificial transcription factors
DE10324912A1 (de) * 2003-05-30 2005-01-05 Siemens Ag Verfahren zur Detektion von DNA-Punktmutationen (SNP-Analyse) sowie zugehörige Anordnung
WO2007014181A2 (en) 2005-07-25 2007-02-01 Johns Hopkins University Site-specific modification of the human genome using custom-designed zinc finger nucleases
US9677123B2 (en) 2006-03-15 2017-06-13 Siemens Healthcare Diagnostics Inc. Degenerate nucleobase analogs
CN104531672B (zh) 2007-03-02 2020-01-10 杜邦营养生物科学有限公司 具有改善的噬菌体抗性的培养物
US8546553B2 (en) 2008-07-25 2013-10-01 University Of Georgia Research Foundation, Inc. Prokaryotic RNAi-like system and methods of use
US20100076057A1 (en) 2008-09-23 2010-03-25 Northwestern University TARGET DNA INTERFERENCE WITH crRNA
US9115386B2 (en) 2008-09-26 2015-08-25 Children's Medical Center Corporation Selective oxidation of 5-methylcytosine by TET-family proteins
WO2010054108A2 (en) 2008-11-06 2010-05-14 University Of Georgia Research Foundation, Inc. Cas6 polypeptides and methods of use
US8889394B2 (en) 2009-09-07 2014-11-18 Empire Technology Development Llc Multiple domain proteins
US10087431B2 (en) 2010-03-10 2018-10-02 The Regents Of The University Of California Methods of generating nucleic acid fragments
CN103038338B (zh) 2010-05-10 2017-03-08 加利福尼亚大学董事会 核糖核酸内切酶组合物及其使用方法
WO2011146121A1 (en) 2010-05-17 2011-11-24 Sangamo Biosciences, Inc. Novel dna-binding proteins and uses thereof
GB201013153D0 (en) 2010-08-04 2010-09-22 Touchlight Genetics Ltd Primer for production of closed linear DNA
US9499592B2 (en) 2011-01-26 2016-11-22 President And Fellows Of Harvard College Transcription activator-like effectors
LT3693025T (lt) 2011-04-22 2022-02-10 The Regents Of The University Of California Adeno-asocijuoto viruso virionai su variantine kapside ir jų panaudojimo būdai
WO2012164565A1 (en) 2011-06-01 2012-12-06 Yeda Research And Development Co. Ltd. Compositions and methods for downregulating prokaryotic genes
WO2013012674A1 (en) 2011-07-15 2013-01-24 The General Hospital Corporation Methods of transcription activator like effector assembly
JP6261500B2 (ja) 2011-07-22 2018-01-17 プレジデント アンド フェローズ オブ ハーバード カレッジ ヌクレアーゼ切断特異性の評価および改善
US8450107B1 (en) 2011-11-30 2013-05-28 The Broad Institute Inc. Nucleotide-specific recognition sequences for designer TAL effectors
GB201122458D0 (en) 2011-12-30 2012-02-08 Univ Wageningen Modified cascade ribonucleoproteins and uses thereof
MX359327B (es) 2012-02-29 2018-09-25 Sangamo Biosciences Inc Composiciones y sus usos para tratar y prevenir la enfermedad de huntington.
WO2013141680A1 (en) 2012-03-20 2013-09-26 Vilnius University RNA-DIRECTED DNA CLEAVAGE BY THE Cas9-crRNA COMPLEX
US9637739B2 (en) 2012-03-20 2017-05-02 Vilnius University RNA-directed DNA cleavage by the Cas9-crRNA complex
WO2013163628A2 (en) 2012-04-27 2013-10-31 Duke University Genetic correction of mutated genes
PE20190844A1 (es) 2012-05-25 2019-06-17 Emmanuelle Charpentier Modulacion de transcripcion con arn de direccion a adn generico
US9890364B2 (en) 2012-05-29 2018-02-13 The General Hospital Corporation TAL-Tet1 fusion proteins and methods of use thereof
KR20230065381A (ko) 2012-07-25 2023-05-11 더 브로드 인스티튜트, 인코퍼레이티드 유도 dna 결합 단백질 및 게놈 교란 도구 및 이의 적용
WO2014022702A2 (en) 2012-08-03 2014-02-06 The Regents Of The University Of California Methods and compositions for controlling gene expression by rna processing
IN2015DN01480A (ja) 2012-08-29 2015-07-03 Sangamo Biosciences Inc
WO2014059255A1 (en) 2012-10-12 2014-04-17 The General Hospital Corporation Transcription activator-like effector (tale) - lysine-specific demethylase 1 (lsd1) fusion proteins
KR101706085B1 (ko) 2012-10-23 2017-02-14 주식회사 툴젠 표적 DNA에 특이적인 가이드 RNA 및 Cas 단백질을 암호화하는 핵산 또는 Cas 단백질을 포함하는, 표적 DNA를 절단하기 위한 조성물 및 이의 용도
KR102145760B1 (ko) 2012-12-06 2020-08-19 시그마-알드리치 컴퍼니., 엘엘씨 Crispr-기초된 유전체 변형과 조절
WO2014093479A1 (en) 2012-12-11 2014-06-19 Montana State University Crispr (clustered regularly interspaced short palindromic repeats) rna-guided control of gene regulation
ES2701749T3 (es) 2012-12-12 2019-02-25 Broad Inst Inc Métodos, modelos, sistemas y aparatos para identificar secuencias diana para enzimas Cas o sistemas CRISPR-Cas para secuencias diana y transmitir resultados de los mismos
EP2931898B1 (en) 2012-12-12 2016-03-09 The Broad Institute, Inc. Engineering and optimization of systems, methods and compositions for sequence manipulation with functional domains
CN114634950A (zh) 2012-12-12 2022-06-17 布罗德研究所有限公司 用于序列操纵的crispr-cas组分系统、方法以及组合物
EP3045537A1 (en) 2012-12-12 2016-07-20 The Broad Institute, Inc. Engineering and optimization of systems, methods and compositions for sequence manipulation with functional domains
WO2014093635A1 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Engineering and optimization of improved systems, methods and enzyme compositions for sequence manipulation
EP4299741A3 (en) 2012-12-12 2024-02-28 The Broad Institute, Inc. Delivery, engineering and optimization of systems, methods and compositions for sequence manipulation and therapeutic applications
CN113528577A (zh) 2012-12-12 2021-10-22 布罗德研究所有限公司 用于序列操纵的系统、方法和优化的指导组合物的工程化
WO2014093694A1 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Crispr-cas nickase systems, methods and compositions for sequence manipulation in eukaryotes
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
KR20150095861A (ko) 2012-12-17 2015-08-21 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 Rna-가이드된 인간 게놈 조작
AU2014214719B2 (en) 2013-02-07 2020-02-13 The General Hospital Corporation Tale transcriptional activators
DK3620534T3 (da) 2013-03-14 2021-12-06 Caribou Biosciences Inc Crispr-cas sammensætninger af nucleinsyre-targeting nucleinsyrer
WO2014204578A1 (en) 2013-06-21 2014-12-24 The General Hospital Corporation Using rna-guided foki nucleases (rfns) to increase specificity for rna-guided genome editing
EP3741868A1 (en) 2013-03-15 2020-11-25 The General Hospital Corporation Rna-guided targeting of genetic and epigenomic regulatory proteins to specific genomic loci
US9828582B2 (en) 2013-03-19 2017-11-28 Duke University Compositions and methods for the induction and tuning of gene expression
JP2016521975A (ja) 2013-05-15 2016-07-28 サンガモ バイオサイエンシーズ, インコーポレイテッド 遺伝的状態の処置のための方法および組成物
KR20230042154A (ko) 2013-06-04 2023-03-27 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 Rna-가이드된 전사 조절
EP3417880A1 (en) 2013-06-05 2018-12-26 Duke University Rna-guided gene editing and gene regulation
EP4245853A3 (en) 2013-06-17 2023-10-18 The Broad Institute, Inc. Optimized crispr-cas double nickase systems, methods and compositions for sequence manipulation
AU2014287393B2 (en) 2013-07-09 2020-10-22 President And Fellows Of Harvard College Multiplex RNA-guided genome engineering
JP2016528890A (ja) 2013-07-09 2016-09-23 プレジデント アンド フェローズ オブ ハーバード カレッジ CRISPR/Cas系を用いるゲノム編集の治療用の使用
CA2917639C (en) 2013-07-10 2024-01-02 President And Fellows Of Harvard College Orthogonal cas9 proteins for rna-guided gene regulation and editing
US11306328B2 (en) 2013-07-26 2022-04-19 President And Fellows Of Harvard College Genome engineering
US20150044192A1 (en) 2013-08-09 2015-02-12 President And Fellows Of Harvard College Methods for identifying a target site of a cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9340799B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College MRNA-sensing switchable gRNAs
US9388430B2 (en) 2013-09-06 2016-07-12 President And Fellows Of Harvard College Cas9-recombinase fusion proteins and uses thereof
US9526784B2 (en) 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
US10531378B2 (en) 2013-09-27 2020-01-07 Kyocera Corporation User equipment detection for energy saving cell activation
WO2015048690A1 (en) * 2013-09-27 2015-04-02 The Regents Of The University Of California Optimized small guide rnas and methods of use
US20160237455A1 (en) 2013-09-27 2016-08-18 Editas Medicine, Inc. Crispr-related methods and compositions
LT3066201T (lt) 2013-11-07 2018-08-10 Editas Medicine, Inc. Su crispr susiję būdai ir kompozicijos su valdančiomis grnr
EP3071695A2 (en) 2013-11-18 2016-09-28 Crispr Therapeutics AG Crispr-cas system materials and methods
US9074199B1 (en) 2013-11-19 2015-07-07 President And Fellows Of Harvard College Mutant Cas9 proteins
US10787684B2 (en) 2013-11-19 2020-09-29 President And Fellows Of Harvard College Large gene excision and insertion
US9840699B2 (en) 2013-12-12 2017-12-12 President And Fellows Of Harvard College Methods for nucleic acid editing
ES2765481T3 (es) 2013-12-12 2020-06-09 Broad Inst Inc Administración, uso y aplicaciones terapéuticas de los sistemas crispr-cas y composiciones para la edición genómica
JP6721508B2 (ja) 2013-12-26 2020-07-15 ザ ジェネラル ホスピタル コーポレイション 多重ガイドrna
WO2015188065A1 (en) 2014-06-05 2015-12-10 Sangamo Biosciences, Inc. Methods and compositions for nuclease design
BR112016029178A2 (pt) 2014-06-16 2017-10-17 Univ Johns Hopkins composições e métodos para a expressão de rnas guia de crispr usando o promotor h1
WO2016022363A2 (en) 2014-07-30 2016-02-11 President And Fellows Of Harvard College Cas9 proteins including ligand-dependent inteins
CA2963820A1 (en) 2014-11-07 2016-05-12 Editas Medicine, Inc. Methods for improving crispr/cas-mediated genome-editing
WO2016154579A2 (en) 2015-03-26 2016-09-29 Editas Medicine, Inc. Crispr/cas-mediated gene conversion
US20160324987A1 (en) 2015-04-15 2016-11-10 Cedars-Sinai Medical Center Use of crispr/cas9 as in vivo gene therapy to generate targeted genomic disruptions in genes bearing dominant mutations for retinitis pigmentosa
EP3294896A1 (en) 2015-05-11 2018-03-21 Editas Medicine, Inc. Optimized crispr/cas9 systems and methods for gene editing in stem cells
PT3298134T (pt) 2015-05-16 2023-08-18 Genzyme Corp Edição génica de mutações intrónicas profundas
CA3012607A1 (en) 2015-06-18 2016-12-22 The Broad Institute Inc. Crispr enzymes and systems
EP3325018A4 (en) 2015-07-22 2019-04-24 Duke University HIGH EFFICIENCY SCREENING OF REGULATORY ELEMENT FUNCTION USING EPIGENOUS EDITING TECHNOLOGIES
EP3341727B1 (en) 2015-08-25 2022-08-10 Duke University Compositions and methods of improving specificity in genomic engineering using rna-guided endonucleases
US10526590B2 (en) 2015-08-31 2020-01-07 Agilent Technologies, Inc. Compounds and methods for CRISPR/Cas-based genome editing by homologous recombination
AU2016321244B2 (en) 2015-09-08 2020-09-24 Precision Biosciences, Inc. Treatment of retinitis pigmentosa using engineered meganucleases
SG10202010311SA (en) 2016-04-19 2020-11-27 Broad Inst Inc Novel Crispr Enzymes and Systems
EP3565895A1 (en) 2016-12-30 2019-11-13 Editas Medicine, Inc. Synthetic guide molecules, compositions and methods relating thereto

Also Published As

Publication number Publication date
IL255125A0 (en) 2017-12-31
US11180793B2 (en) 2021-11-23
AU2016253150B2 (en) 2022-04-21
WO2016172727A1 (en) 2016-10-27
US20220325326A1 (en) 2022-10-13
ZA201707018B (en) 2024-02-28
CN107690480B (zh) 2022-03-22
KR20180037139A (ko) 2018-04-11
EP3286571A1 (en) 2018-02-28
SG11201708653RA (en) 2017-11-29
EP3286571B1 (en) 2021-08-18
US20180135109A1 (en) 2018-05-17
CA2982966A1 (en) 2016-10-27
CN107690480A (zh) 2018-02-13
CA2982966C (en) 2024-02-20
AU2016253150A1 (en) 2017-11-09
KR102535217B1 (ko) 2023-05-19
EP4019975A1 (en) 2022-06-29

Similar Documents

Publication Publication Date Title
US20220325326A1 (en) Evaluation of cas9 molecule/guide rna molecule complexes
US20230026726A1 (en) Crispr/cas-related methods and compositions for treating sickle cell disease
US20230018543A1 (en) Crispr/cas-mediated gene conversion
US20210324382A1 (en) Chimeric DNA:RNA Guide for High Accuracy Cas9 Genome Editing
JP7030522B2 (ja) 幹細胞における遺伝子編集のための最適化crispr/cas9システムおよび方法
AU2015342749B2 (en) Methods for improving CRISPR/Cas-mediated genome-editing
EP3132030B1 (en) Crispr-cas-related methods, compositions and components for cancer immunotherapy
US20190062734A1 (en) Grna fusion molecules, gene editing systems, and methods of use thereof
JP2023075166A (ja) β異常ヘモグロビン症を治療するためのCRISPR/CAS関連方法および組成物