JP2021503279A - Cas9ベースノックイン方針の効力を改善するための組成物及び方法 - Google Patents

Cas9ベースノックイン方針の効力を改善するための組成物及び方法 Download PDF

Info

Publication number
JP2021503279A
JP2021503279A JP2020526198A JP2020526198A JP2021503279A JP 2021503279 A JP2021503279 A JP 2021503279A JP 2020526198 A JP2020526198 A JP 2020526198A JP 2020526198 A JP2020526198 A JP 2020526198A JP 2021503279 A JP2021503279 A JP 2021503279A
Authority
JP
Japan
Prior art keywords
cas9
sequence
endonuclease
guide
polynucleotide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020526198A
Other languages
English (en)
Other versions
JP7423520B2 (ja
Inventor
マルチェッロ・マレスカ
アミル・タヘリ−ガーファロキ
フレデリク・カールソン
モハマド・ボールーリー−イェガネー
ロレンツ・マルティン・マイヤー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AstraZeneca AB
Original Assignee
AstraZeneca AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AstraZeneca AB filed Critical AstraZeneca AB
Publication of JP2021503279A publication Critical patent/JP2021503279A/ja
Priority to JP2024005210A priority Critical patent/JP2024050637A/ja
Application granted granted Critical
Publication of JP7423520B2 publication Critical patent/JP7423520B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • C12Y301/21Endodeoxyribonucleases producing 5'-phosphomonoesters (3.1.21)
    • C12Y301/21004Type II site-specific deoxyribonuclease (3.1.21.4)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/22Vectors comprising a coding region that has been codon optimised for expression in a respective host
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/24Vectors characterised by the absence of particular element, e.g. selectable marker, viral origin of replication
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2810/00Vectors comprising a targeting moiety
    • C12N2810/40Vectors comprising a peptide as targeting moiety, e.g. a synthetic peptide, from undefined source
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/30Phosphoric diester hydrolysing, i.e. nuclease
    • C12Q2521/301Endonuclease

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本開示は、粘着末端を生成し得るCas9エフェクタータンパク質(stiCas9)、及びstiCas9との複合体を形成し、ガイド配列(ガイド配列は、真核細胞中の標的配列とハイブリダイズするが、細菌細胞中の配列にハイブリダイズしない)を含むガイドポリヌクレオチドを含み、複合体は天然に生じない非天然発生CRISPR−Cas系を提供する。本開示はまた、目的配列を細胞の染色体中に導入する方法を提供する。最後に、本開示は、シームレス突然変異誘発を使用して1つ以上のヌクレオチドを改変する方法を提供する。

Description

配列表
本出願は、ASCIIフォーマットで電子的に提出され、参照により全体として本明細書に組み込まれる配列表を含有する。前記ASCIIコピーは2018年11月16日に作成され、0098−0002WO1_SL.txtと命名され、1,105,014バイトのサイズである。
本開示は、粘着末端を生成し得るCas9エフェクタータンパク質(stiCas9)、及びstiCas9との複合体を形成し、ガイド配列(ガイド配列は、真核細胞中の標的配列とハイブリダイズするが、細菌細胞中の配列にハイブリダイズしない)を含むガイドポリヌクレオチドを含み、複合体は天然に生じない非天然発生CRISPR−Cas系を提供する。
クラスター化された規則的に間隔が空いた短鎖回文反復配列(CRISPR)及びCRISPR関連(Cas)系は、大腸菌(E.coli)中でIshinoにより最初に発見された原核生物免疫系である(非特許文献1、参照により全体として本明細書に組み込まれる)。この免疫系は、ウイルス及びプラスミドの核酸を配列特異的に標的化することによりウイルス及びプラスミドに対する免疫を提供する。参照により全体として本明細書に組み込まれる非特許文献2も参照。CRISPR−Cas系は、3つの主な型:I型、II型、及びIII型に分類されている。別々の型を決定付ける主な特徴は、用いられる種々のcas遺伝子、及びそれらがコードするそれぞれのタンパク質である。cas1及びcas2遺伝子は、3つの主な型にわたりユニバーサルであると思われる一方、cas3、cas9、及びcas10は、それぞれI型、II型、及びIII型の系に特異的と考えられる。例えば、参照により全体として本明細書に組み込まれる非特許文献3参照。
この免疫系に関与する2つの主なステージが存在し、第1のステージは獲得であり、第2のステージは干渉である。第1のステージは、侵入ウイルス及びプラスミドのゲノムの切断並びに生物のCRISPR遺伝子座中へのこのセグメントの組込みを含む。ゲノム中に組み込まれるセグメントは、プロトスペーサーとして公知であり、同一のウイルス又はプラスミドによる後続の攻撃からの生物の保護に役立つ。第2のステージは、侵入ウイルス又はプラスミドへの攻撃を含む。このステージは、RNAに転写されているプロトスペーサーに依存し、このRNAはいくらかのプロセシング後に侵入ウイルス又はプラスミドのDNA中の相補的配列とハイブリダイズする一方、そのDNAを有効に開裂させるタンパク質、又はタンパク質複合体とも会合する。
細菌種に応じて、CRISPR RNAプロセシングは異なって進行する。例えば、細菌の化膿連鎖球菌(Streptococcus pyogenes)において最初に記載されたII型系においては、転写されたRNAはトランス活性化RNA(tracrRNA)と対合してからRNアーゼIIIにより開裂されて個々のCRISPR−RNA(crRNA)が形成される。crRNAは、Cas9ヌクレアーゼによる結合後にさらにプロセシングされて成熟crRNAが産生される。続いて、crRNA/Cas9複合体は捕捉領域(プロトスペーサーと称される)に相補的な配列を含有するDNAに結合する。次いで、Cas9タンパク質は、DNAの両方の鎖を部位特異的に開裂させ、二本鎖分解(DSB)を形成する。これはDNAベースの「記憶」を提供し、反復曝露及び/又は感染時にウイルス又はプラスミドDNAの急速な分解をもたらす。天然CRISPR系は、包括的に概説されている(例えば、非特許文献3参照)。
その最初の発見以降、複数のグループが遺伝子操作、例として、遺伝子編集におけるCRISPR系の潜在的用途に関して集中的な研究を行ってきた(非特許文献4;非特許文献5;及び非特許文献6;それらのそれぞれは参照により全体として本明細書に組み込まれる)。1つの主な開発は、tracrRNAに融合しているCRISPRアレイからの個々の単位前後で設計されたCas9タンパク質を標的化するためのキメラRNAの利用であった。これは、プロトスペーサー領域中の配列の改変がCas9タンパク質を部位特異的に標的化し得る小分子ガイドRNA(gRNA)と呼ばれる単一RNA種を作出する。オフターゲット効果を予測し、評価するために高度に関連するキメラRNAと標的部位との間の塩基対合相互作用の性質、及びミスマッチに対するそのトレランスを理解するためにかなりの作業が行われてきた(例えば、非特許文献7(補助資料を含む)参照、参照により全体として本明細書に組み込まれる)。
CRISPR−Cas9遺伝子編集系は、野生型Cas9タンパク質を使用してDSB形成を誘導するため、又はCas9n/Cas9 D10Aと称される突然変異タンパク質を使用して単一DNA鎖をニッキングするための両方で広範な生物及び細胞系において良好に使用されている(例えば、非特許文献6及び非特許文献8参照、それらのそれぞれは参照により全体として本明細書に組み込まれる)。DSB形成が遺伝子機能を破壊し得る小さい挿入及び欠失(インデル)の作出をもたらす一方、Cas9n/Cas9 D10Aニッカーゼは、内因性相同組換え機構を刺激しながらインデル作出を回避する(非相同末端結合を介する修復の結果)。したがって、Cas9n/Cas9 D10Aニッカーゼを使用してDNA領域をゲノム中に高いフィデリティで挿入することができる。
ゲノム編集に加え、CRISPR系は、複数の他の用途、例として、とりわけ調節遺伝子発現、遺伝子回路構築、及び機能的ゲノミクスを有する(非特許文献8に概説)。
開示が参照により全体として本明細書に組み込まれる種々の刊行物が本明細書に引用される。
Ishino et al.,Journal of Bacteriology 169(12):5429−5433(1987) Soret et al.,"CRISPR−a widespread system that provides acquired resistance against phages in bacteria and archaea",Nature Reviews Microbiology 6(3):181−186(2008) Barrangou and Marraffini,"CRISPR−Cas systems:prokaryotes upgrade to adaptive immunity",Cell 54(2):234−244(2014) Jinek et al.,"A programmable dual−RNA−guided DNA endonuclease in adaptive bacterial immunity",Science 337(6096):816−821(2012) Cong et al.,"Multiplex genome engineering using CRISPR/Cas systems",Science 339(6121):819−823(2013) Mali et al.,"RNA−guided human genome engineering via Cas9",Science 339(6121):823−826(2013) Fu et al.,"Improving CRISPR−Cas nucleases using truncated guide RNAs",Nature Biotechnology 32(3):279−284(2014) Sander and Joung,"CRISPR−Cas systems for editing,regulating and targeting genomes",Nature Biotechnology 32(4):347−355(2014)
一部の実施形態において、本開示は、粘着末端を生成し得るCas9エフェクタータンパク質(stiCas9)、及びstiCas9との複合体を形成し、ガイド配列(ガイド配列は、真核細胞中の標的配列とハイブリダイズするが、細菌細胞中の配列にハイブリダイズしない)を含むガイドポリヌクレオチドを含み、複合体は天然に生じない非天然発生CRISPR−Cas系を提供する。
一部の実施形態において、本開示は、粘着末端を生成し得、核局在化配列(NLS)を含むCas9エフェクタータンパク質(stiCas9)、及びstiCas9との複合体を形成し、ガイド配列を含むガイドポリヌクレオチドを含み、複合体は天然に生じない非天然発生CRISPR−Cas系を提供する。
一部の実施形態において、本開示は、粘着末端を生成し得るCas9エフェクタータンパク質(stiCas9)をコードする1つ以上のヌクレオチド配列、及びstiCas9との複合体を形成し、ガイド配列(ガイド配列は、真核細胞中の標的配列とハイブリダイズするが、細菌細胞中の配列にハイブリダイズしない)を含むガイドポリヌクレオチドをコードするヌクレオチド配列を含み、複合体は天然に生じない非天然発生CRISPR−Cas系を提供する。
一部の実施形態において、本開示は、(a)粘着末端を生成し得るCas9エフェクタータンパク質(stiCas9)をコードする1つ以上のヌクレオチド配列、及び(b)stiCas9との複合体を形成し、ガイド配列を含むガイドポリヌクレオチドをコードするヌクレオチド配列を含み、(a)及び(b)のヌクレオチド配列は、真核生物プロモーターの制御下であり、複合体は天然に生じない非天然発生CRISPR−Cas系を提供する。
一部の実施形態において、本開示のCRISPR−Cas系は、tracrRNA配列を含むポリヌクレオチドをさらに含む。一部の実施形態において、CRISPR−Cas系のガイドポリヌクレオチド、tracrRNA配列及びstiCas9は複合体を形成し得、複合体は天然に生じない。
一部の実施形態において、本開示は、粘着末端を生成し得るCas9エフェクタータンパク質(stiCas9)をコードする1つ以上のヌクレオチド配列に作動可能に結合している調節エレメント、及びstiCas9との複合体を形成し、ガイド配列(ガイド配列は、真核細胞中の標的配列とハイブリダイズするが、細菌細胞中の配列にハイブリダイズしない)を含むガイドポリヌクレオチドを含み、複合体は天然に生じない1つ以上のベクターを含む非天然発生CRISPR−Cas系を提供する。
一部の実施形態において、本開示は、粘着末端を生成し得るCas9エフェクタータンパク質(stiCas9)をコードする1つ以上のヌクレオチド配列に作動可能に結合している調節エレメント(調節エレメントは、真核生物調節エレメントである)、及びstiCas9との複合体を形成し、ガイド配列を含むガイドポリヌクレオチドを含み、複合体は天然に生じない1つ以上のベクターを含む非天然発生CRISPR−Cas系を提供する。
一部の実施形態において、ガイドポリヌクレオチドは、tracrRNA配列をさらに含む。一部の実施形態において、本開示の非天然発生ベクターは、tracrRNA配列を含むヌクレオチド配列をさらに含む。
CRISPR−Cas系の一部の実施形態において、複合体は、プロトスペーサー隣接モチーフ(PAM)の10ヌクレオチド以内の部位において開裂させ得る。CRISPR−Cas系の一部の実施形態において、複合体は、プロトスペーサー隣接モチーフ(PAM)の5ヌクレオチド以内の部位において開裂させ得る。CRISPR−Cas系の一部の実施形態において、複合体は、プロトスペーサー隣接モチーフ(PAM)の3ヌクレオチド以内の部位において開裂させ得る。
CRISPR−Cas系の一部の実施形態において、標的配列は、プロトスペーサー隣接モチーフ(PAM)の5’に存在し、PAMは、3’Gリッチモチーフを含む。CRISPR−Cas系の実施形態において、標的配列は、プロトスペーサー隣接モチーフ(PAM)の5’に存在し、PAM配列は、NGG(Nは、A、C、G、又はTである)である。
CRISPR−Cas系の一部の実施形態において、粘着末端は、3〜40ヌクレオチドの一本鎖ポリヌクレオチドオーバーハングを含む。CRISPR−Cas系の一部の実施形態において、粘着末端は、4〜20ヌクレオチドの一本鎖ポリヌクレオチドオーバーハングを含む。CRISPR−Cas系の一部の実施形態において、粘着末端は、5〜10ヌクレオチドの一本鎖ポリヌクレオチドオーバーハングを含む。
CRISPR−Cas系の一部の実施形態において、stiCas9は、II−B型CRISPR系を有する細菌種に由来する。CRISPR−Cas系の一部の実施形態において、stiCas9は、配列番号10〜97又は192〜195のいずれかと少なくとも80%の同一性、85%の同一性、90%の同一性又は95%の同一性を有するドメインを含む。一部の実施形態において、stiCas9は、1E−5のE値カットオフを用いてTIGR03031タンパク質ファミリーにマッチするドメインを含む。一部の実施形態において、stiCas9は、1E−10のE値カットオフを用いてTIGR03031タンパク質ファミリーにマッチするドメインを含む。
CRISPR−Cas系の一部の実施形態において、stiCas9が由来する細菌種は、レジオネラ・ニューモフィラ(Legionella pneumophila)、フランシセラ・ノビシダ(Francisella novicida)、ガンマプロテオバクテリア(gamma proteobacterium)HTCC5015、パラサテレラ・エキスクレメンティホミニス(Parasutterella excrementihominis)、サテレラ・ワズワーセンシス(Sutterella wadsworthensis)、スルフロスピリラム属種(Sulfurospirillum sp.)SCADC、ルミノバクター属種(Ruminobacter sp.)RM87、バークホルデリア・バクテリウム(Burkholderiales bacterium)1_1_47、バクテロイデス・オーラル・タクソン(Bacteroidetes oral taxon)274株F0058、ウォリネラ・スクシノゲネス(Wolinella succinogenes)、バークホルデリア・バクテリウム(Burkholderiales bacterium)YL45、ルミノバクター・アミロフィラス(Ruminobacter amylophilus)、カンピロバクター属種(Campylobacter sp.)P0111、カンピロバクター属種(Campylobacter sp.)RM9261、カンピロバクター・ラニエナエ(Campylobacter lanienae)株RM8001、カンプリロバクター・ラニエナエ(Camplylobacter lanienae)株P0121、ツリシモナス・ムリス(Turicimonas muris)、レジオネラ・ロンジニエンシス(Legionella londiniensis)、サリニビブリオ・シャルメンシス(Salinivibrio sharmensis)、レプトスピラ属種(Leptospira sp.)単離株FW.030、モリテラ属種(Moritella sp.)単離株NORP46、エンドゾイコモナス属種(Endozoicomonassp.)S−B4−1U、タミルナドゥイバクター・サリナス(Tamilnaduibacter salinus)、ビブリオ・ナトリエゲンス(Vibrio natriegens)、アルコバクター・スキロウイイ(Arcobacter skirrowii)、フランシセラ・フィロミラギア(Francisella philomiragia)、フランシセラ・ヒスパニエンシス(Francisella hispaniensis)、又はパレンドゾイコモナス・ハリクロナエ(Parendozoicomonas haliclonae)である。
CRISPR−Cas系の一部の実施形態において、標的配列は、プロトスペーサー隣接モチーフ(PAM)の5’に存在し、PAM配列は、YG(Yは、ピリミジンである)であり、stiCas9は、細菌種F.ノビシダ(F.novicida)に由来する。
CRISPR−Cas系の一部の実施形態において、stiCas9は、1つ以上の核局在化シグナルを含む。CRISPR−Cas系の一部の実施形態において、真核細胞は、動物又はヒト細胞である。CRISPR−Cas系の一部の実施形態において、真核細胞は、ヒト細胞である。CRISPR−Cas系の一部の実施形態において、真核細胞は、植物細胞である。
CRISPR−Cas系の一部の実施形態において、ガイド配列は、ダイレクトリピート配列に結合している。
一部の実施形態において、送達粒子は、本開示のCRISPR−Cas系を含む。一部の実施形態において、stiCas9及びガイドポリヌクレオチドは、送達粒子内の複合体中に存在する。
一部の実施形態において、ガイドポリヌクレオチドは、tracrRNA配列をさらに含む。一部の実施形態において、送達粒子内の複合体は、tracrRNA配列を含むポリヌクレオチドをさらに含む。
一部の実施形態において、送達粒子は、脂質、糖、金属、又はタンパク質さらに含む。
一部の実施形態において、ベシクルは、本開示のCRISPR−Cas系を含む。
一部の実施形態において、stiCas9及びガイドポリヌクレオチドは、ベシクル内の複合体中に存在する。
一部の実施形態において、ベシクル内の複合体は、tracrRNA配列を含むポリヌクレオチドをさらに含む。一部の実施形態において、ベシクルは、エキソソーム又はリポソームである。
CRISPR−Cas系の一部の実施形態において、stiCas9をコードする1つ以上のヌクレオチド配列は、真核細胞中の発現のためにコドン最適化されている。
CRISPR−Cas系の一部の実施形態において、Cas9エフェクタータンパク質をコードするヌクレオチド及びガイドポリヌクレオチドは、単一ベクター上に存在する。
CRISPR−Cas系の一部の実施形態において、Cas9エフェクタータンパク質をコードするヌクレオチド及びガイドポリヌクレオチドは、単一核酸分子である。
一部の実施形態において、ウイルスベクターは、本開示のCRISPR−Cas系を含む。一部の実施形態において、ウイルスベクターは、アデノウイルス、レンチウイルス、又はアデノ随伴ウイルスのものである。
一部の実施形態において、本開示は、粘着末端を生成し得るCas9エフェクタータンパク質(stiCas9)、及びstiCas9との複合体を形成し、ガイド配列(ガイド配列は、真核細胞中の標的配列とハイブリダイズし得る)を含むガイドポリヌクレオチドを含み、複合体は天然に生じないCRISPR−Cas系を含む真核細胞を提供する。
一部の実施形態において、本開示は、粘着末端を生成し得るCas9エフェクタータンパク質(stiCas9)(Cas9エフェクタータンパク質は、II−B型CRISPR系を有する細菌種に由来する)を含むCRISPR−Cas系を含む真核細胞を提供する。
一部の実施形態において、本開示は、真核細胞中の標的配列の部位特異的改変を提供する方法であって、(1)細胞中に、(a)粘着末端を生成し得るCas9エフェクタータンパク質(stiCas9)、及び(b)stiCas9との複合体を形成し、ガイド配列(ガイド配列は、真核細胞中の標的配列とハイブリダイズし得るが、細菌細胞中の配列にハイブリダイズしない)を含むガイドポリヌクレオチド(複合体は天然に生じない)を導入すること;(2)Cas9エフェクタータンパク質及びガイドポリヌクレオチドにより標的配列中の粘着末端を生成すること;並びに(3)(a)粘着末端を一緒に、又は(b)目的ポリヌクレオチド配列(SoI)を粘着末端にライゲートすることを含み、それにより標的配列を改変する方法を提供する。
一部の実施形態において、本開示は、真核細胞中の標的配列の部位特異的改変を提供する方法であって、(1)細胞中に、(a)粘着末端を生成し得るCas9エフェクタータンパク質(stiCas9)をコードするヌクレオチド配列、及び(b)stiCas9との複合体を形成し、ガイド配列(ガイド配列は、真核細胞中の標的配列とハイブリダイズし得るが、細菌細胞中の配列にハイブリダイズしない)を含むガイドポリヌクレオチド(複合体は天然に生じない)を導入すること;(2)Cas9エフェクタータンパク質及びガイドポリヌクレオチドにより標的配列中の粘着末端を生成すること;並びに(3)(a)粘着末端を一緒に、又は(b)目的ポリヌクレオチド配列(SoI)を粘着末端にライゲートすることを含み、それにより標的配列を改変する方法を提供する。
一部の実施形態において、真核細胞中の標的配列の部位特異的改変を提供する方法は、細胞中に、tracrRNA配列を含むポリヌクレオチドを導入することをさらに含む。
方法の一部の実施形態において、ガイドポリヌクレオチド、tracrRNA配列、及びstiCas9は、複合体を形成し得、複合体は天然に生じない。
方法の一部の実施形態において、複合体は、プロトスペーサー隣接モチーフ(PAM)の10ヌクレオチド以内の部位において開裂させ得る。方法の一部の実施形態において、複合体は、プロトスペーサー隣接モチーフ(PAM)の5ヌクレオチド以内の部位において開裂させ得る。方法の一部の実施形態において、複合体は、プロトスペーサー隣接モチーフ(PAM)の3ヌクレオチド以内の部位において開裂させ得る。
方法の一部の実施形態において、標的配列は、プロトスペーサー隣接モチーフ(PAM)の5’に存在し、PAMは、3’Gリッチモチーフを含む。方法の一部の実施形態において、標的配列は、PAMの5’に存在し、PAM配列は、NGG(Nは、A、C、G、又はTである)である。
方法の一部の実施形態において、粘着末端は、3〜40ヌクレオチドの一本鎖ポリヌクレオチドオーバーハングを含む。方法の一部の実施形態において、粘着末端は、4〜20ヌクレオチドの一本鎖ポリヌクレオチドオーバーハングを含む。方法の一部の実施形態において、粘着末端は、5〜10ヌクレオチドの一本鎖ポリヌクレオチドオーバーハングを含む。
方法の一部の実施形態において、stiCas9は、II−B型CRISPR系を有する細菌種に由来する。
方法の一部の実施形態において、真核細胞は、動物又はヒト細胞である。方法の一部の実施形態において、真核細胞は、ヒト細胞である。方法の一部の実施形態において、真核細胞は、植物細胞である。
方法の一部の実施形態において、改変は、標的配列の少なくとも一部の欠失である。方法の実施形態において、改変は、標的配列の突然変異である。方法の一部の実施形態において、改変は、標的配列中への目的配列の挿入である。
一部の実施形態において、方法は、エキソヌクレアーゼを導入してstiCas9から生成されたオーバーハングを除去することをさらに含む。
方法の一部の実施形態において、エキソヌクレアーゼは、Cas4、Artemis、又はTREX4である。方法の一部の実施形態において、Cas4は、II−B型CRISPR系を有する細菌種に由来する。
方法の一部の実施形態において、複合体の構成成分をコードするポリヌクレオチドは、1つ以上のベクター上に導入する。
一部の実施形態において、本開示は、細胞中の染色体中に目的配列(SoI)を導入する方法であって、染色体は、領域1及び領域2を含む標的配列(TSC)を含み、細胞中に、
(a)標的配列(TSV)を含むベクター(TSVは、領域2及び領域1並びにSoIを含む);
(b)TSC中の粘着末端を生成し得る第1のCas9−エンドヌクレアーゼ二量体(第1のCas9−エンドヌクレアーゼ二量体の第1の単量体は、TSCの領域1において開裂させ、第1のCas9−エンドヌクレアーゼ二量体の第2の単量体は、領域2において開裂させる);及び
(c)TSV中の粘着末端を生成し得る第2のCas9−エンドヌクレアーゼ二量体(第2のCas9−エンドヌクレアーゼ二量体の第1の単量体は、TSVの領域2において開裂させ、第2のCas9−エンドヌクレアーゼ二量体の第2の単量体は、領域1において開裂させる)
を導入することを含み;
(a)のベクター、(b)の第1のCas9−エンドヌクレアーゼ二量体及び(c)の第2のCas9−エンドヌクレアーゼ二量体の導入は、細胞の染色体中へのSoIの挿入をもたらす方法を対象とする。
一部の実施形態において、本開示は、細胞中の染色体中に目的配列(SoI)を導入する方法であって、染色体は、領域1及び領域2を含む標的配列(TSC)を含み、細胞中に、
(a)標的配列(TSV)(TSVは、領域2及び領域1並びにSoIを含む)を含むベクター(ベクターは、粘着末端を含む);
(b)TSC中の粘着末端を生成し得る第1のCas9−エンドヌクレアーゼ二量体(第1のCas9−エンドヌクレアーゼ二量体の第1の単量体は、TSCの領域1において開裂させ、第1のCas9−エンドヌクレアーゼ二量体の第2の単量体は、領域2において開裂させる)
導入することを含み;
(a)のベクター及び(b)の第1のCas9−エンドヌクレアーゼ二量体の導入は、細胞の染色体中へのSoIの挿入をもたらす方法を対象とする。
一部の実施形態において、第1及び第2のCas9−エンドヌクレアーゼ二量体は、同一である。一部の実施形態において、第1及び第2のCas9−エンドヌクレアーゼ二量体は、異なる。
一部の実施形態において、方法は、細胞中に、第1のCas9−エンドヌクレアーゼ二量体の第1の単量体との複合体を形成し、第1のガイド配列(第1のガイド配列は、領域1を含むTSCにハイブリダイズするが、ベクターにハイブリダイズしない)を含む第1のガイドポリヌクレオチドを導入することをさらに含む。
一部の実施形態において、方法は、細胞中に、第1のCas9−エンドヌクレアーゼ二量体の第1の単量体との複合体を形成し、第1のガイド配列(第1のガイド配列は、TSC及びTSVにハイブリダイズする)を含む第1のガイドポリヌクレオチドを導入することをさらに含む。
一部の実施形態において、方法は、細胞中に、第1のCas9−エンドヌクレアーゼ二量体の第2の単量体との複合体を形成し、第2のガイド配列(第2のガイド配列は、領域2を含むTSCにハイブリダイズするが、ベクターにハイブリダイズしない)を含む第2のガイドポリヌクレオチドを導入することをさらに含む。
一部の実施形態において、方法は、細胞中に、第1のCas9−エンドヌクレアーゼ二量体の第2の単量体との複合体を形成し、第2のガイド配列(第2のガイド配列は、TSC及びTSVにハイブリダイズする)を含む第2のガイドポリヌクレオチドを導入することをさらに含む。
一部の実施形態において、方法は、細胞中に、第2のCas9−エンドヌクレアーゼ二量体の第1の単量体との複合体を形成し、第3のガイド配列(第3のガイド配列は、領域2を含むTSVにハイブリダイズするが、染色体にハイブリダイズしない)を含む第3のガイドポリヌクレオチドを導入することをさらに含む。
一部の実施形態において、方法は、細胞中に、第2のCas9−エンドヌクレアーゼ二量体の第1の単量体との複合体を形成し、第3のガイド配列(第3のガイド配列は、TSC及びTSVにハイブリダイズする)を含む第3のガイドポリヌクレオチドを導入することをさらに含む。
一部の実施形態において、方法は、細胞中に、第2のCas9−エンドヌクレアーゼ二量体の第2の単量体との複合体を形成し、第4のガイド配列(第4のガイド配列は、領域1を含むTSVにハイブリダイズするが、染色体にハイブリダイズしない)を含む第4のガイドポリヌクレオチドを導入することをさらに含む。
一部の実施形態において、方法は、細胞中に、第2のCas9−エンドヌクレアーゼ二量体の第2の単量体との複合体を形成し、第4のガイド配列(第4のガイド配列は、TSC及びTSVにハイブリダイズする)を含む第4のガイドポリヌクレオチドを導入することをさらに含む。
一部の実施形態において、方法は、細胞中に、第1、第2、第3、及び第4のガイドポリヌクレオチドを導入することを含む。
一部の実施形態において、方法は、細胞中に、tracrRNA配列を含むポリヌクレオチドを導入することをさらに含む。
一部の実施形態において、第1のCas9−エンドヌクレアーゼ二量体の第1の単量体及び第2の単量体中のエンドヌクレアーゼは、IIS型エンドヌクレアーゼである。一部の実施形態において、第2のCas9−エンドヌクレアーゼ二量体の第1の単量体及び第2の単量体中のエンドヌクレアーゼは、IIS型エンドヌクレアーゼである。
一部の実施形態において、第1のCas9−エンドヌクレアーゼ二量体及び第2のCas9−エンドヌクレアーゼ二量体中のエンドヌクレアーゼは、IIS型エンドヌクレアーゼである。一部の実施形態において、第1のCas9−エンドヌクレアーゼ二量体及び第2のCas9−エンドヌクレアーゼ二量体中のエンドヌクレアーゼは、BbvI、BgcI、BfuAI、BmpI、BspMI、CspCI、FokI、MboII、MmeI、NmeAIII、及びPleIからなる群から独立して選択される。一部の実施形態において、第1のCas9−エンドヌクレアーゼ二量体及び第2のCas9−エンドヌクレアーゼ二量体中のエンドヌクレアーゼは、FokIである。一部の実施形態において、第1及び第2のCas9−エンドヌクレアーゼ二量体は、細胞中に、第1及び第2のCas9−エンドヌクレアーゼ二量体をコードするポリヌクレオチドとして導入する。
一部の実施形態において、第1及び第2のCas9−エンドヌクレアーゼ二量体をコードするポリヌクレオチドは、1つのベクター上に存在する。一部の実施形態において、第1及び第2のCas9−エンドヌクレアーゼ二量体をコードするポリヌクレオチドは、2つ以上のベクター上に存在する。
一部の実施形態において、第1、第2又は両方のCas9−エンドヌクレアーゼ二量体は、改変Cas9を含む。一部の実施形態において、第1、第2又は両方のCas9−エンドヌクレアーゼ二量体は、触媒的に不活性なCas9を含む。一部の実施形態において、第1、第2又は両方のCas9−エンドヌクレアーゼ二量体中のエンドヌクレアーゼは、FokIである。一部の実施形態において、第1、第2又は両方のCas9−エンドヌクレアーゼ二量体は、ニッカーゼ活性を有するCas9を含む。一部の実施形態において、第1、第2又は両方のCas9−エンドヌクレアーゼ二量体中のエンドヌクレアーゼは、FokIである。
一部の実施形態において、Cas9−エンドヌクレアーゼ二量体は、野生型Cas9に対してCas9中の単一アミノ酸置換を含む。一部の実施形態において、第1、第2又は両方のCas9−エンドヌクレアーゼ二量体中のエンドヌクレアーゼは、FokIである。一部の実施形態において、単一アミノ酸置換は、D10A又はH840Aである。一部の実施形態において、単一アミノ酸置換は、D10Aである。一部の実施形態において、単一アミノ酸置換は、H840Aである。一部の実施形態において、Cas9−エンドヌクレアーゼ二量体は、野生型Cas9に対して二重アミノ酸置換を含む。一部の実施形態において、二重アミノ酸置換は、D10A及びH840Aである。
一部の実施形態において、野生型Cas9は、化膿連鎖球菌(Streptococcus pyogenes)、黄色ブドウ球菌(Staphylococcus aureus)、スタフィロコッカス・シュードインターメディウス(Staphylococcus pseudintermedius)、プラノコッカス・アンタルクティカス(Planococcus antarcticus)、ストレプトコッカス・サングイニス(Streptococcus sanguinis)、ストレプトコッカス・サーモフィラス(Streptococcus thermophilus)、ストレプトコッカス・ムタンス(Streptococcus mutans)、コリバクテリウム・グロメランス(Coribacterium glomerans)、ラクトバシラス・ファーシミニス(Lactobacillus farciminis)、カテニバクテリウム・ミツオカイ(Catenibacterium mitsuokai)、ラクトバシラス・ラムノサス(Lactobacillus rhamnosus)、ビフィドバクテリウム・ビフィダム(Bifidobacterium bifidum)、オエノコッカス・キタハラ(Oenococcus kitahara)、フルクトバシラス・フルクトサス(Fructobacillus fructosus)、フィネゴルディア・マグナ(Finegoldia magna)、ベイロネラ・アチピカ(Veillonella atyipca)、ソロバクテリウム・モオレイ(Solobacterium moorei)、アシドアミノコッカス属種(Acidaminococcus sp.)D21、ユーバクテリウム・ユリ(Eubacterium yurri)、コプロコッカス・カタス(Coprococcus catus)、フソバクテリウム・ヌクレアタム(Fusobacterium nucleatum)、フィリファクター・アロシス(Filifactor alocis)、ペプトニフィラス・ドゥエルデニイ(Peptoniphilus duerdenii)、又はトレポネマ・デンティコラ(Treponema denticola)に由来する。
一部の実施形態において、粘着末端は、5オーバーハングを含む。一部の実施形態において、粘着末端は、3オーバーハングを含む。一部の実施形態において、第1、第2又は両方のCas9−エンドヌクレアーゼ二量体は、3〜40ヌクレオチドの一本鎖ポリヌクレオチドを含む粘着末端を生成する。一部の実施形態において、第1、第2又は両方のCas9−エンドヌクレアーゼ二量体は、4〜20ヌクレオチドの一本鎖ポリヌクレオチドを含む粘着末端を生成する。一部の実施形態において、第1、第2又は両方のCas9−エンドヌクレアーゼ二量体は、5〜15ヌクレオチドの一本鎖ポリヌクレオチドを含む粘着末端を生成する。
方法の一部の実施形態において、挿入時、染色体中の標的配列及びプラスミド中の標的配列は、再構成させない。
一部の実施形態において、細胞は、真核細胞である。一部の実施形態において、細胞は、動物又はヒト細胞である。一部の実施形態において、細胞は、植物細胞である。
細胞中の染色体中に目的配列(SoI)を導入する方法の一部の実施形態において、(a)のベクター、(b)の第1のCas9−エンドヌクレアーゼ二量体、(c)の第2のCas9−エンドヌクレアーゼ二量体又はそれらの組合せは、細胞中に、送達粒子、ベシクル、又はウイルスベクターを介して導入する。一部の実施形態において、(a)のベクター、(b)の第1のCas9−エンドヌクレアーゼ二量体、(c)の第2のCas9−エンドヌクレアーゼ二量体又はそれらの組合せは、細胞中に、送達粒子を介して導入する。一部の実施形態において、送達粒子は、脂質、糖、金属、又はタンパク質を含む。
細胞中の染色体中に目的配列(SoI)を導入する方法の一部の実施形態において、(a)のベクター、(b)の第1のCas9−エンドヌクレアーゼ二量体、(c)の第2のCas9−エンドヌクレアーゼ二量体又はそれらの組合せは、細胞中に、ベシクルを介して導入する。一部の実施形態において、ベシクルは、エキソソーム又はリポソームである。
細胞中の染色体中に目的配列(SoI)を導入する方法の一部の実施形態において、(a)のベクター、(b)の第1のCas9−エンドヌクレアーゼ二量体、(c)の第2のCas9−エンドヌクレアーゼ二量体又はそれらの組合せを発現し得るポリヌクレオチドは、細胞中に、ウイルスベクターを介して導入する。一部の実施形態において、(a)のベクターは、ウイルスベクターである。一部の実施形態において、ウイルスベクターは、アデノウイルス、レンチウイルス、又はアデノ随伴ウイルスである。
一部の実施形態において、第1のCas9−エンドヌクレアーゼ二量体の第1の単量体は、第1のガイドポリヌクレオチドとの複合体を形成し、第1のCas9−エンドヌクレアーゼ二量体の第2の単量体は、第2のガイドポリヌクレオチドとの複合体を形成する。一部の実施形態において、第2のCas9−エンドヌクレアーゼ二量体の第1の単量体は、第3のガイドポリヌクレオチドとの複合体を形成し、第2のCas9−エンドヌクレアーゼ二量体の第2の単量体は、第4のガイドポリヌクレオチドとの複合体を形成する。一部の実施形態において、第1のCas9−エンドヌクレアーゼ二量体の第1の単量体は、第1のガイドポリヌクレオチド配列及びtracrRNA配列との複合体を形成し、第1のCas9−エンドヌクレアーゼ二量体の第2の単量体は、第2のガイドポリヌクレオチド配列及びtracrRNA配列との複合体を形成する。一部の実施形態において、第2のCas9−エンドヌクレアーゼ二量体の第1の単量体は、第3のガイドポリヌクレオチド配列及びtracrRNA配列との複合体を形成し、第2のCas9−エンドヌクレアーゼ二量体の第2の単量体は、第4のガイドポリヌクレオチド配列及びtracrRNA配列との複合体を形成する。一部の実施形態において、第1、第2又は両方のCas9−エンドヌクレアーゼ二量体は、核局在化シグナルを含む。
細胞中の染色体中に目的配列(SoI)を導入する方法の一部の実施形態において、細胞は、幹細胞又は幹細胞系を含む。
一部の実施形態において、本開示は、細胞中の標的ポリヌクレオチド配列中の1つ以上のヌクレオチドを改変する方法であって、
(a)細胞中に、挿入カセット(IC)を含むベクター(ICは、5’−3’方向で、
(i)標的ポリヌクレオチド配列の一部と相同である第1の領域、
(ii)1つ以上のヌクレオチドの標的ポリヌクレオチド配列の突然変異を含む第2の領域、
(iii)第1のヌクレアーゼ結合部位、
(iv)マーカー遺伝子をコードするポリヌクレオチド配列、
(v)第2のヌクレアーゼ結合部位、
(vi)1つ以上のヌクレオチドの標的ポリヌクレオチド配列の突然変異を含む第3の領域、及び
(vii)標的ポリヌクレオチド配列の一部と相同である第4の領域を含み、第1の領域及び第4の領域は、標的ポリヌクレオチド配列と95%〜l00%同一である)を導入すること;
(b)相同組換えを介して標的ポリヌクレオチド配列中にICを挿入して第1の改変標的ポリヌクレオチドを生成すること;
(c)マーカー遺伝子を発現する細胞を選択すること;
(d)第1の改変標的ポリヌクレオチドを部位特異的ヌクレアーゼに供して粘着末端を有する第2の改変標的ポリヌクレオチドを生成すること;及び
(e)粘着末端を有する第2の改変標的ポリヌクレオチドをリガーゼ(リガーゼは、第2の領域及び第3の領域において粘着末端をライゲートする)に供して標的ポリヌクレオチド配列と比較して1つ以上の改変ヌクレオチドを含むライゲートされた改変標的核酸を作出すること
を含む方法を対象とする。
細胞中の標的ポリヌクレオチド配列中の1つ以上のヌクレオチドを改変する方法の一部の実施形態において、第1の改変標的核酸は、(c)の後に細胞から単離する。
一部の実施形態において、部位特異的ヌクレアーゼは、細胞に対して外因性である。一部の実施形態において、リガーゼは、細胞に対して外因性である。一部の実施形態において、第1の改変標的タンパク質は、(c)の後に細胞中に存在する。一部の実施形態において、部位特異的ヌクレアーゼは、細胞中に、部位特異的ヌクレアーゼをコードするポリヌクレオチドとして導入する。一部の実施形態において、リガーゼは、細胞中に、リガーゼをコードするポリヌクレオチドとして導入する。
一部の実施形態において、部位特異的ヌクレアーゼは、組換え部位特異的ヌクレアーゼである。一部の実施形態において、リガーゼは、組換えリガーゼである。一部の実施形態において、部位特異的ヌクレアーゼは、Cas9エフェクタータンパク質である。一部の実施形態において、Cas9エフェクタータンパク質は、II−B型Cas9である。一部の実施形態において、部位特異的ヌクレアーゼは、Cas9−エンドヌクレアーゼ融合タンパク質である。一部の実施形態において、Cas9−エンドヌクレアーゼ融合タンパク質中のエンドヌクレアーゼは、IIS型エンドヌクレアーゼである。一部の実施形態において、Cas9−エンドヌクレアーゼ融合タンパク質中のエンドヌクレアーゼは、FokIである。
一部の実施形態において、Cas9−エンドヌクレアーゼ融合タンパク質は、改変Cas9を含む。一部の実施形態において、改変Cas9は、触媒的に不活性なCas9を含む。一部の実施形態において、触媒的に不活性なCas9は、FokIエンドヌクレアーゼに融合している。
一部の実施形態において、Cas9−エンドヌクレアーゼ融合タンパク質は、ニッカーゼ活性を有するCas9を含み、エンドヌクレアーゼは、FokIである。一部の実施形態において、Cas9−エンドヌクレアーゼ融合タンパク質は、D10A置換を有するCas9を含む。一部の実施形態において、Cas9−エンドヌクレアーゼ融合タンパク質は、H840A置換を有するCas9を含む。
一部の実施形態において、部位特異的ヌクレアーゼは、Cpf1エフェクタータンパク質である。一部の実施形態において、部位特異的ヌクレアーゼは、Cas9、Cpf1、又はCas9−FokIである。
細胞中の標的ポリヌクレオチド配列中の1つ以上のヌクレオチドを改変する方法の一部の実施形態において、(d)の第2の改変標的ポリヌクレオチドの粘着末端は、5’オーバーハングを含む。一部の実施形態において、(d)の第2の改変標的ポリヌクレオチドの粘着末端は、3’オーバーハングを含む。一部の実施形態において、部位特異的ヌクレアーゼは、3〜40ヌクレオチドの一本鎖ポリヌクレオチドを含む粘着末端を生成し得る。一部の実施形態において、ヌクレアーゼは、4〜20ヌクレオチドの一本鎖ポリヌクレオチドを含む粘着末端を生成し得る。一部の実施形態において、ヌクレアーゼは、5〜15ヌクレオチドの一本鎖ポリヌクレオチドを含む粘着末端を生成し得る。
細胞中の標的ポリヌクレオチド配列中の1つ以上のヌクレオチドを改変する方法の一部の実施形態において、標的ポリヌクレオチド配列は、プラスミド中に存在する。一部の実施形態において、標的ポリヌクレオチド配列は、染色体中に存在する。
一部の実施形態において、本開示は、stiCas9タンパク質との複合体を形成する遺伝子操作ガイドRNAであって、(a)真核細胞中の標的配列にハイブリダイズし得るガイド配列;及び(b)Cas9タンパク質に結合し得るtracrRNA配列を含み、tracrRNAは、天然発生tracrRNA配列と少なくとも10ヌクレオチドだけ異なり、Cas9タンパク質のヌクレアーゼ効率を改善する遺伝子操作ガイドRNAを対象とする。一部の実施形態において、tracrRNA配列は、天然発生tracrRNAよりも少なくとも10個少ないヌクレオチドを有する。一部の実施形態において、tracrRNA配列は、天然発生tracrRNAよりも少なくとも10個多いヌクレオチドを有する。一部の実施形態において、ガイド配列は、配列番号104〜125又は196〜199のいずれか1つと少なくとも90%の配列同一性を含む。一部の実施形態において、tracrRNA配列は、配列番号148〜171のいずれか1つと少なくとも90%の配列同一性を含む。一部の実施形態において、ガイドRNAは、配列番号172〜191のいずれか1つと少なくとも90%の配列同一性を含む。
一部の実施形態において、本開示は、本明細書に記載の遺伝子操作ガイドRNAを含むCRISPR−Cas系を対象とする。一部の実施形態において、系は、tracrRNA配列を含まない。
一部の実施形態において、本開示は、図40Bに見出されるCas9、ガイド配列、及びtracrRNA配列の任意の組合せを含む遺伝子操作Cas9−ガイドRNA複合体を対象とする。一部の実施形態において、本開示は、Cas9タンパク質に結合する遺伝子操作ガイドRNAを産生する方法であって、(a)真核細胞中の標的配列にハイブリダイズし得るガイド配列を提供すること;(b)天然発生tracrRNA配列を、tracrRNA配列から少なくとも10個のヌクレオチドを除去することにより改変して改変tracrRNA配列を形成すること;及び(c)ガイド配列を改変tracrRNA配列に結合させて遺伝子操作ガイドRNAを生成することを含む方法を対象とする。一部の実施形態において、本開示は、(a)粘着末端を生成し得るCas9エフェクタータンパク質(stiCas9);及び(b)stiCas9との複合体を形成し、ガイド配列を含むガイドRNA(ガイド配列は、真核細胞中の標的配列とハイブリダイズし得るが、細菌細胞中の配列にハイブリダイズしない)を含み;複合体は天然に生じず、tracrRNA配列を含まない非天然発生CRISPR−Cas系を対象とする。
Cas9による異なる修復機序の模式図である。図1aは、遺伝子ノックアウトを表す。図1bは、塩基編集を表す。図1cは、非相同末端結合(NHEJ)経路による遺伝子ノックインを表す。図1dは、相同性配向型組換え(Homology−Directed Recombination)(HDR)経路による遺伝子ノックインを表す。 Cas9による異なる遺伝子挿入機序の模式図である。相同性配向型組換え(HDR)を左側に示す。非相同末端結合(NHEJ)を右側に示す。 異なるCas9エフェクタータンパク質を使用する遺伝子挿入についての模式図及びその結果の表示である。図3a〜bは、平滑末端を生成するCas9により媒介される遺伝子挿入を示す。図3c〜dは、オーバーハング(すなわち、「付着末端」)を生成するCas9により媒介される遺伝子挿入を示す。図3の下段パネルは、相同性非依存的標的化挿入(Homology−Independent Targeted Insertion)(HITI)を使用する3a〜3fにおける異なるCas9タンパク質による遺伝子挿入頻度の表示である。 Shmakov et al.,Nature Reviews Microbiology 15:169−182(2017)により記載されているものである。図4Aは、異なる型のCRISPR系の系統樹及びそれぞれの型のCRISPR系を有する代表的な細菌種である。図4Bは、II型及びV型CRISPR系の拡大図を示し、矢印はcas4遺伝子を含有するオペロンを示す。 Chylinski et al.,Nucleic Acids Research 42(10):6091−6105(2014)により記載されているものである。図5A〜Dは、II型CRISPR系の系統樹を表す。図5Eは、II型CRISPR系のそれぞれのサブファミリーと関連する異なるシグネチャー遺伝子を示す。 図6Aは、フランシセラ・ノビシダ(Francisella novicida)からのCas9タンパク質を使用するDNA開裂について得られた結果を表す。フランシセラ・ノビシダ(Francisella novicida)からのCas9及び化膿連鎖球菌(Streptococcus pyogenes)からのCas9により標的化される遺伝子操作HEK293細胞系中のゲノム遺伝子座についての突然変異シグネチャーを比較する。図6Aは、配列番号204〜205及び284をそれぞれ出現の順に開示する。図6B〜Cは、II型CRISPR系の系統樹である。インビトロバリデーションのために選択されたCas9タンパク質はイタリックで示す。 米国特許第9,567,608号明細書に記載のジンクフィンガーヌクレアーゼ(ZFN)を使用する遺伝子挿入のためのObLiGaRe法の模式的表示である。 Sakuma et al.,Nature Protocols 11(1):118−133(2016)により記載の遺伝子挿入のためのCas9−PiTCH法の模式的表示である。 3つの異なるCas9−FokI融合タンパク質の模式的表示である。図9a:酵素的に不活性なCas9(deadCas9)とFokIとの融合体;図9b:D10A突然変異を有するCas9(Cas9nD10A)とFokIとの融合体;図9c:H840Aを有するCas9(Cas9nH840A)とFokIとの融合体。図9a〜cは、配列番号206を開示する。 図9及び10の異なるCas9−FokI融合タンパク質により生成される異なるDNA分解の模式的表示である。図10は、配列番号206を「TCCCCTCCACCCCACAGTGGGGCCACTAGGGACAGGATTGGTGACAGAAAAGCCCCATCCTTAGGCCT」として開示し、開裂配列を配列番号285〜289としてそれぞれ出現の順に開示する。 Cas9nD10A−FokIにより生成される開裂部位の模式的表示である。図11は、配列番号206を開示する。 Cas9nD10A−FokI.gRNA:ガイドRNA;PAM;プロトスペーサー隣接モチーフを使用する遺伝子挿入法の模式的表示である。図12は、「ゲノム」配列を配列番号206〜208として、「ベクター」配列を配列番号209〜211として、及び「ノックイン」配列を配列番号212として、全てそれぞれ出現の順に開示する。 Cas9nH840A−FokIにより生成される開裂部位の模式的表示である。図13は、配列番号206を開示する。 Cas9nH840A−FokI.gRNA:ガイドRNA;PAM;プロトスペーサー隣接モチーフを使用する遺伝子挿入法の模式的表示である。図14は、「ゲノム」配列を配列番号206及び213〜214として、「ベクター」配列を配列番号215〜217として、及び「ノックイン」配列を配列番号218として、全てそれぞれ出現の順に開示する。 実施例1に記載の実験に関する。図15は、Cas9nD10A−FokI(図15)及びCas9nH840A−FokI(図15)を使用する遺伝子挿入法の模式的表示である。図15a〜bは、配列番号206を開示する。 実施例1に記載の実験に関する。標的部位(AAVS1遺伝子座)を表す。「プランA」はCas9nD10A−FokIを使用する遺伝子挿入法を指し;「プランB」はCas9nH840A−FokIを使用する遺伝子挿入法を指す。図16は、配列番号219を開示する。 実施例1に記載の実験に関する。Cas9nD10A−FokIを使用する遺伝子挿入法から得られた代表的な配列を示す。図17は、配列番号220〜235をそれぞれ出現の順に開示する。 実施例1に記載の実験に関する。Cas9nH840A−FokIを使用する遺伝子挿入法から得られた代表的な配列を示す。図18は、配列番号236〜258をそれぞれ出現の順に開示する。 実施例2に記載の実験に関する。図19は、AAVS1遺伝子座を標的化するために使用される10個のガイドRNA(gRNA)のセットの設計を示す。 実施例2に記載の実験に関する。図20のgRNAを使用してAAVS1遺伝子座中に挿入すべき遺伝子を含有する「ドナー」プラスミドのプラスミドマップである。 実施例2に記載の実験に関する。正確に挿入された遺伝子を含有する細胞(mCherry+細胞)を選択する手順の模式図である。 実施例2に記載の実験に関する。異なる長さのスペーサーを用いる遺伝子挿入頻度の結果を示す。 実施例3に記載の実験に関する。図23は、SERPINA1遺伝子座中に挿入すべき遺伝子を含有する「ドナー」プラスミドのプラスミドマップである。 実施例3に記載の実験に関する。deadCas9−FokIを使用する遺伝子挿入法の模式的表示である。図24は、配列番号206を開示する。 実施例2〜4に記載の標的化遺伝子挿入に使用された様々な方法の効率の比較である。 実施例4に記載の実験に関する。図26は、シームレス突然変異誘発の模式図である。 実施例4に記載の実験に関する。シームレス突然変異誘発の第1のステップ:ホモロジーアームを使用する標的配列中への耐性マーカーを含有するカセットの組換えの模式図である。 実施例4に記載の実験に関する。標的配列中に組み込まれるカセット:ヌクレアーゼ結合部位及びヌクレアーゼ切断部位により両側でフランキングされた耐性マーカーの模式図である。 実施例4に記載の実験に関する。シームレス突然変異誘発の第2のステップ:耐性マーカーの除去及びシームレスに生成された突然変異をもたらす切断部位(図28に示される)におけるヌクレアーゼ消化及び後続のライゲーションの模式図である。 種々のシーケンシングされた種、例として、レジオネラ・ニューモフィラ(Legionella pneumophila)、フランシセラ・ノビシダ(Francisella novicida)、ガンマプロテオバクテリア(gamma proteobacterium)HTCC5015、パラサテレラ・エクスクレメンティホミニス(Parasutterella excrementihominis)、サテレラ・ワズワーセンシス(Sutterella wadsworthensis)、スルフロスピリラム属種(Sulfurospirillum sp.)SCADC、ルミノバクター属種(Ruminobacter sp.)RM87、バークホルデリア・バクテリウム(Burkholderiales bacterium)1_1_47、バクテロイデス・オーラル・タクソン(Bacteroidetes oral taxon)274株F0058、及びウォリネラ・スクシノゲネス(Wolinella succinogenes)からのCas9タンパク質のアミノ酸配列(配列番号10〜80)が含まれる。 種々のシーケンシングされた細菌、例として、バークホルデリア・バクテリウム(Burkholderiales bacterium)、カンピロバクター属種(Campylobacter sp.)、ツリシモナス・ムリス(Turicimonas muris)、サリニビブリオ・シャルメンシス(Salinivibrio sharmensis)、レプトスピラ属種(Leptospira sp.)、モリテラ属種(Moritella sp.)、エンドゾイコモナス属種(Endozoicomonas sp.)、タミルナドゥイバクター・サリナス(Tamilnaduibacter salinus)、ビブリオ・ナトリエゲンス(Vibrio natriegens)、ルミノバクター・アミロフィラス(Ruminobacter amylophilus)、ビブリオ・サガイエンシス(Vibrio sagaiensis)、アルコバクター・ポルシナス(Arcobacter porcinus)、デスルホフスティス属種(Desulfofustis sp.)、及びスクシナティモナス属種(Succinatimonas sp.)からのCas9タンパク質のアミノ酸配列(配列番号81〜97)が含まれる。 MH0245_GL0161830_1からのCas9タンパク質に関して実施例8に記載の実験において使用されたガイドRNA配列、tracrRNA配列、及びcrRNA配列のヌクレオチド配列(配列番号101〜103)が含まれる。 図33Aは、II−B型Cas9タンパク質により生成される例示的な4−ヌクレオチド5’オーバーハングを示す。図33Aは、配列番号259を開示する。図33Bは、例示的なII−B型casオペロンを示す。cas9、cas1、cas2、及びcas4遺伝子を矢印により表す。CRISPRアレイをオペロンの下流に標識する。 実施例7に記載の実験に関する。図34Aは、フランシセラ・ノビシダ(Francisella novicida)からのCas9タンパク質(FnCas9)のインビトロヌクレアーゼ活性を実証する電気泳動ゲル画像を示す。図34Bは、FnCas9が5’オーバーハングを有する粘着末端を生成することを示すサンガーシーケンシングプロットを示す。図34Bは、配列番号204〜205及び284をそれぞれ出現の順に開示する。図34Cは、化膿連鎖球菌(Streptococcus pyogenes)Cas9タンパク質(SpyCas9)及びFnCas9間の突然変異パターンのRIMA比較を示す。 実施例8に記載の実験に関する。図35Aは、配列腸内メタゲノムMH0245からのCas9タンパク質(MHCas9)のインビトロヌクレアーゼ活性を実証する電気泳動ゲル画像を示す。図35Bは、MHCas9が5’オーバーハングを有する粘着末端を生成することを示すサンガーシーケンシングプロットを示す。図35Bは、配列番号260〜262をそれぞれ出現の順に開示する。図35Cは、セル1(Cell1)アッセイによりバリデートされたHEK293−REMINDEL細胞におけるMHCas9活性を実証する電気泳動ゲル画像を示す。 実施例8に記載の実験に関する。図36Aは、MHCas9からのcrRNA及びtracrRNAの配列を示す。図36Aは、配列番号263を開示する。図36Bは、crRNA/tracrRNA二次構造の模式図を示す。図36Cは、スルフロスピリラム属種(Sulfurospirillum sp.)SCADC(ssCas9)、ウォリネラ・スクシノゲネス(Wolinella succinogenes)(WsCas9)、レジオネラ・ニューモフィラ(Legionella pneumophila)(LpCas9)、フランシセラ・ノビシダ(Francisella novicida)(FnCas9)、及びMH0245(MHCas9)からのCas9タンパク質を有する切り取られた系統樹を示す。 本明細書に記載の種々の細菌種からのCas9タンパク質のアミノ酸配列から作成された系統樹を示す。配列アラインメントは、MUSCLEアルゴリズム、CLC Genomics Workbench v.9を使用して実施した。 カンピロバクター(Campylobacter)属の種々の種からのCas9タンパク質のアミノ酸配列から作成された系統樹である。配列アラインメントは、MUSCLEアルゴリズム、CLC Genomics Workbench v.9を使用して実施した。 本明細書に記載の種々のCas9タンパク質のためのcrRNAのヌクレオチド配列(配列番号104〜147)が含まれる。 本明細書に記載の種々のCas9タンパク質のためのtracrRNAのヌクレオチド配列(配列番号148〜171)が含まれる。 Cas9タンパク質、crRNA(+)、crRNA(−)及びtracrRNAの種々の組合せが含まれる。 実施例9に記載の方法により設計された種々のsgRNA(「キメラgRNA」とも称される)、例として、sgRNAの配列(配列番号172〜191)を説明する。図41Aはまたヘアピン配列を配列番号264として開示する。 実施例9に記載のsgRNAの最適化及びトリミング、並びにさらなる改変のために考えられる標的部位を説明する。図42Aは、配列番号265〜266をそれぞれ出現の順に開示する。図42Bは、配列番号267〜268をそれぞれ出現の順に開示する。図42Cは、配列番号269及び173をそれぞれ出現の順に開示する。図42Dは、配列番号270〜271をそれぞれ出現の順に開示する。図42Eは、配列番号178及び272をそれぞれ出現の順に開示する。図42Fは、配列番号179及び273をそれぞれ出現の順に開示する。図42Gは、配列番号180及び274をそれぞれ出現の順に開示する。図42Hは、配列番号176及び275をそれぞれ出現の順に開示する。図42Iは、配列番号174及び276をそれぞれ出現の順に開示する。図42Jは、配列番号191及び277をそれぞれ出現の順に開示する。図42Kは、配列番号184及び278をそれぞれ出現の順に開示する。図42Lは、配列番号279〜280をそれぞれ出現の順に開示する。 II−B型CRISPR−Cas系の二方向性発現構築物を説明する。挿入図に示されるとおり、トップ鎖は、tracrRNAを含まない単一ガイドRNAのためのcrRNA及びスペーサーを発現する。ボトム鎖は、tracrRNAを含む二重ガイドRNAのためのcrRNA及びスペーサーを発現する。図43は、配列番号137、281及び191をそれぞれ出現の順に開示する。 本明細書に記載のCas9タンパク質のための単一ガイドRNA足場の予測二次構造を示す。図44は、配列番号137、139、282、122、110、129、120、124及び104をそれぞれ出現の順に開示する。 4つの異なる遺伝子操作RNA、及びMHCas9によるそれぞれの切断効率を一般に記載する。 3つの異なるCas9系SpyCas9、Cl1Cas9及びMHCas9による長さ19、20、21、22及び23のガイドRNAの切断効率及び機能性を実証する。 種々のシーケンシングされた細菌、例として、アルコバクター・スキロウイイ(Arcobacter skirrowii)、フランシセラ・フィロミラギア(Francisella philomiragia)、フランシセラ・ヒスパニエンシス(Francisella hispaniensis)、及びパレンドゾイコモナス・ハリクロナエ(Parendozoicomonas haliclonae)からのCas9タンパク質のアミノ酸配列(配列番号192〜195)が含まれる。 本明細書に記載の種々のCas9タンパク質のためのcrRNAのヌクレオチド配列(配列番号196〜203)が含まれる。 実施例11に関する。図49Aは、Cas9タンパク質のPAM配列を決定する例示的な方法を示す。図49Aは、配列番号283を開示する。図49Bは、図49Aに示される方法により決定されたSpCas9(上段)及びMHCas9(下段)のための好ましいPAM配列を示す。 実施例12に関する。図50Aは、正確に修復されるCas9切断の模式図を示す。図50Bは、不正確な修復及び改変の増加をもたらすエキソヌクレアーゼ、例えば、TREX2又はArtemisによる末端プロセシングとの組合せのCas9切断の模式図を示す。 実施例12に関する。図51Aは、3つの異なるガイドRNAを用いた、種々のCas9(SpCas9、FnCas9、Cl1Cas9、又はMHCas9)への末端プロセシング酵素(FnCas4又はTREX2)の添加の効果を試験する方法の概要を示す。図51Bは、モック末端プロセシング酵素、FnCas4、又はTREX2のいずれかを用いた、及び3つのガイドRNAのそれぞれを用いたCas9タンパク質のそれぞれについての結果を示す。 実施例13に関する。図52A、52B、及び52Cは、それぞれ、SpCas9、Cl1Cas9、又はMHCas9により生成された異なるタイプの突然変異を、3つ全てのCas9タンパク質が同一配列において切断した場合で示す。図52A〜Cは、配列番号290を開示する。 実施例13に関する。図53Aは、平滑又は単一ヌクレオチドオーバーハングを生成する、ガイドRNAと複合体化している二本鎖DNA配列を切断するII−A型Cas9タンパク質のRuvC及びHNHドメインの模式図を示す。図53Bは、3又は4ヌクレオチドオーバーハングを有する付着末端を生成する、ガイドRNAとの複合体化している二本鎖DNA配列を切断するII−B型Cas9タンパク質のRuvC及びHNHドメインの模式図を示す。
CRISPR−Cas9系は、標的化二本鎖分解を形成するそれらの能力のため、遺伝子編集において広範に使用される。Cas9タンパク質は開裂時に平滑末端を生成し、それが標的配列の挿入及び/又は改変について粘着末端と比較して低い特異性を提供することが公知である。粘着末端を生成し得るCas9タンパク質は、stiCas9とも称され、本明細書に記載される。標的配列の挿入及び/又は改変のためにstiCas9タンパク質を使用する利点は、本明細書に記載される。
本開示は、非天然発生CRISPR−Cas系;CRISPR−Cas系を含む真核細胞;標的配列の部位特異的改変を提供する方法;細胞中の染色体中に目的配列を導入する方法;及び細胞中の標的ポリヌクレオチド配列中の1つ以上のヌクレオチドを改変する方法を提供する。
定義
本明細書において使用される「a」又は「an」は、1つ以上を意味し得る。本明細書及び特許請求の範囲において本明細書において使用され、語「含む(comprising)」と同時に使用される場合、語「a」又は「an」は、1つ又は2つ以上を意味し得る。本明細書において使用される「別の」又は「さらなる」は、少なくとも第2のもの以上を意味し得る。
本出願全体にわたり、用語「約」は、値が、その値を決定するために用いられている方法/装置についての誤差の固有の変動、又は試験対象間で存在する変動を含むことを示すために使用される。典型的には、この用語は、状況に応じておよそ又は1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%又は20%未満の変動性を包含することを意味する。
特許請求の範囲における用語「又は」の使用は、代替物のみを指すと明示されない限り、又はその代替物が相互に排他的でない限り、「及び/又は」を意味するために使用されるが、本開示は、代替物のみ及び「及び/又は」を指す定義を支持する。
本明細書及び特許請求の範囲において使用される語「含む(comprising)」(及び含む(comprising)の任意の形態、例えば、「含む(comprise)」及び「含む(comprises)」)、「有する(having)」(及び有する(having)の任意の形態、例えば、「有する(have)」及び「有する(has)」)、「例として(including)」(及び例として(including)の任意の形態、例えば、「挙げられる(includes)」及び「挙げられる(include)」)又は「含有する(containing)」(及び含有する(containing)の任意の形態、例えば、「含有する(contains)」及び「含有する(contain)」)は、包含的又はオープンエンドであり、追加の引用されない要素も方法ステップも排除するものではない。本明細書において考察される任意の実施形態は、本開示の任意の方法、系、宿主細胞、発現ベクター、及び/又は組成物に関して実行することができることが企図される。さらに、本開示の組成物、系、宿主細胞、及び/又はベクターを使用して本開示の方法及びタンパク質を達成することができる。
用語「例えば」及びその対応する略語「e.g.(イタリックかそうでないかを問わない)」の使用は、引用される規定の用語が、特に明示されない限り、参照され、又は引用される具体例に限定されるものではない本開示の代表例及び実施形態であることを意味する。
「核酸」、「核酸分子」、「ヌクレオチド」、「ヌクレオチド配列」、「オリゴヌクレオチド」、又は「ポリヌクレオチド」は、共有結合ヌクレオチドを含むポリマー化合物を意味する。用語「核酸」には、リボ核酸(RNA)及びデオキシリボ核酸(DNA)が含まれ、その両方とも一本鎖でも二本鎖でもよい。DNAとしては、限定されるものではないが、相補的DNA(cDNA)、ゲノムDNA、プラスミド又はベクターDNA、及び合成DNAが挙げられる。一部の実施形態において、本開示は、本明細書に開示のポリペプチドのいずれか1つをコードするポリヌクレオチドを提供し、例えば、Casタンパク質又はそのバリアントをコードするポリヌクレオチドを対象とする。
「遺伝子」は、ポリペプチドをコードするヌクレオチドの集合体を指し、それにはcDNA及びゲノムDNA核酸分子が含まれる。「遺伝子」は、コード配列に先行(5’非コード配列)及び後行(3’非コード配列)する調節配列として作用し得る核酸断片も指す。
核酸分子は、温度及び溶液イオン強度の適切な条件下で核酸分子の一本鎖形態が他の核酸分子にアニールし得る場合、別の核酸分子、例えば、cDNA、ゲノムDNA、又はRNAに「ハイブリダイズ可能である」又は「ハイブリダイズされる」。ハイブリダイゼーション及び洗浄条件は周知であり、Sambrook et al.,Molecular Cloning:A Laboratory Manual,Second Edition,Cold Spring Harbor Laboratory Press,Cold Spring Harbor(1989)、特にそのChapter 11及びTable 11.1(参照により全体として本明細書に組み込まれる)に例示されている。温度及びイオン強度の条件は、ハイブリダイゼーションの「ストリンジェンシー」を決定する。ストリンジェンシー条件は、中程度に類似する断片、例えば、遠縁生物からの相同配列を、高度に類似する断片、例えば、密接に関連する生物からの機能的酵素を複製する遺伝子に対してスクリーニングするように調整することができる。相同核酸の予備スクリーニングのため、55℃のTに対応する低ストリンジェンシーハイブリダイゼーション条件、例えば、5×SSC、0.1%のSDS、0.25%のミルク、及びホルムアミドなし;又は30%のホルムアミド、5×SSC、0.5%のSDSを使用することができる。中程度のストリンジェンシーハイブリダイゼーション条件は、より高いT、例えば、40%のホルムアミドと5×又は6×SCCに対応する。高いストリンジェンシーハイブリダイゼーション条件は、最大T、例えば、50%のホルムアミド、5×又は6×SCCに対応する。ハイブリダイゼーションは、2つの核酸が相補的配列を含有することを要求するが、ハイブリダイゼーションのストリンジェンシーに応じて塩基間のミスマッチが考えられる。
用語「相補的」は、互いにハイブリダイズし得るヌクレオチド塩基間の関係を記載するために使用される。例えば、DNAに関して、アデノシンはチミンに相補的であり、シトシンはグアニンに相補的である。したがって、本開示には、本明細書に開示され、又は使用される完全配列に相補的な単離核酸断片及びそれらと実質的に類似する核酸配列も含まれる。
DNA「コード配列」は、適切な調節配列の制御下で配置される場合、インビトロ又はインビボで細胞中で転写され、ポリペプチドに翻訳される二本鎖DNA配列である。「好適な調節配列」は、コード配列の上流(5’非コード配列)に、その中に、又はその下流(3’非コード配列)に局在し、転写、RNAプロセシング若しくは安定性、又は関連コード配列の翻訳に影響するヌクレオチド配列を指す。調節配列としては、プロモーター、翻訳リーダー配列、イントロン、ポリアデニル化認識配列、RNAプロセシング部位、エフェクター結合部位及びステムループ構造を挙げることができる。コード配列の境界は、5’(アミノ)末端における開始コドン及び3’(カルボキシル)末端における翻訳終止コドンにより決定される。コード配列としては、限定されるものではないが、原核生物配列、mRNAからのcDNA、ゲノムDNA配列、及びさらには合成DNA配列を挙げることができる。コード配列が真核細胞中の発現を目的とされる場合、ポリアデニル化シグナル及び転写終結配列は、通常、コード配列に対して3’に局在させる。
「オープンリーディングフレーム」は、ORFと略され、翻訳開始シグナル又は開始コドン、例えば、ATG又はAUG、及び終止コドンを含み、ポリペプチド配列に潜在的に翻訳され得る長さの核酸配列、DNA、cDNA又はRNAのいずれかを意味する。
用語「相同組換え」は、外来DNA配列の別のDNA分子中への挿入、例えば、染色体中のベクターの挿入を指す。好ましくは、ベクターは、相同組換えについて特異的な染色体部位を標的化する。特異的相同組換えのため、ベクターは、相補的結合及び染色体中へのベクターの取り込みを可能とするために染色体の配列と相同性の十分に長い領域を含有する。より長い相補性の領域、及びより大きい配列類似性の程度は、相同組換えの効率を増加させ得る。
当分野において公知の方法を使用して本開示によるポリヌクレオチドを伝播させることができる。好適な宿主系及び成長条件を確立したら、組換え発現ベクターを伝播させ、多量に調製することができる。本明細書に記載の、使用することができる発現ベクターとしては、限定されるものではないが、以下のベクター又はそれらの誘導体が挙げられる:ヒト又は動物ウイルス、例えば、ワクシニアウイルス又はアデノウイルス;昆虫ウイルス、例えば、バキュロウイルス;酵母ベクター;バクテリオファージベクター(例えば、ラムダ)、並びにプラスミド及びコスミドDNAベクター。
本明細書において使用される「プロモーター」、「プロモーター配列」、又は「プロモーター領域」は、RNAポリメラーゼに結合し、下流コード又は非コード配列の転写の開始に関与し得るDNA調節領域/配列を指す。本開示の一部の例において、プロモーター配列は、転写開始部位を含み、バックグラウンドを超えて検出可能なレベルにおいて転写を開始するために使用される最小数の塩基又はエレメントを含むように上流に伸びる。一部の実施形態において、プロモーター配列は、転写開始部位、及びRNAポリメラーゼの結合を担うタンパク質結合ドメインを含む。真核生物プロモーターは、常にではないが、「TATA」ボックス及び「CAT」ボックスを含有することが多い。種々のプロモーター、例として、誘導性プロモーターを使用して本開示の種々のベクターをドライブすることができる。
「ベクター」は、宿主細胞中に核酸をクローニングし、及び/又は移行させる任意の手段である。ベクターは、別のDNAセグメントを付着させて付着セグメントの複製を生じさせることができるレプリコンであり得る。「レプリコン」は、インビボでDNA複製の自律的単位として機能する、すなわち、それ自体の制御下で複製し得る任意の遺伝子エレメント(例えば、プラスミド、ファージ、コスミド、染色体、ウイルス)である。本開示の一部の実施形態において、ベクターは、例えば、非対称分配により多数の細胞世代後に細胞の集団から除去/消失されるエピソーマルベクターである。用語「ベクター」には、インビトロ、エクスビボ、又はインビボで細胞中に核酸を導入するためのウイルス及び非ウイルス手段の両方が含まれる。当分野において公知の多数のベクターを使用して核酸を操作し、応答エレメント及びプロモーターを遺伝子中に取り込むことなどができる。考えられるベクターとしては、例えば、プラスミド又は改変ウイルス、例として、例えば、バクテリオファージ、例えば、ラムダ誘導体、又はプラスミド、例えば、PBR322若しくはpUCプラスミド誘導体、又はBluescriptベクターが挙げられる。例えば、好適ベクター中への、応答エレメント及びプロモーターに対応するDNA断片の挿入は、相補的粘着末端を有する選択ベクター中に適切なDNA断片をライゲートすることにより達成することができる。或いは、DNA分子の末端を酵素的に改変することができ、又はヌクレオチド配列(リンカー)をDNA末端中にライゲートすることにより任意の部位を産生することができる。このようなベクターは、細胞ゲノム中にマーカーを取り込んだ細胞の選択を提供する選択マーカー遺伝子を含有するように遺伝子操作することができる。このようなマーカーは、マーカーを取り込み、そのマーカーによりコードされるタンパク質を発現する宿主細胞の同定及び/又は選択を可能とする。
ウイルスベクター、特にレトロウイルスベクターは、細胞、及び生存動物対象における広範な遺伝子送達用途において使用されている。使用することができるウイルスベクターとしては、限定されるものではないが、レトロウイルス、アデノ随伴ウイルス、ポックス、バキュロウイルス、ワクシニア、単純ヘルペス、エプスタインバール、アデノウイルス、ジェミニウイルス、及びカリモウイルスベクターが挙げられる。非ウイルスベクターとしては、限定されるものではないが、プラスミド、リポソーム、荷電脂質(cytofectin)、DNA−タンパク質複合体、及び生体ポリマーが挙げられる。ベクターは、核酸に加え、核酸移行結果(移行する組織、発現の継続期間など)の選択、計測、及びモニタリングにおいて有用な1つ以上の調節領域、及び/又は選択マーカーも含み得る。
ベクターは、周知の方法、例として、限定されるものではないが、形質移入、形質導入、細胞融合、及びリポフェクションにより所望の宿主細胞中に導入することができる。ベクターは、種々の調節エレメント、例として、プロモーターを含み得る。一部の実施形態において、ベクター設計は、Mali et al.,“Cas9 as a versatile tool for engineering biology,”Nature Methods 10:957−63(2013)により設計された構築物をベースとすることができる。一部の実施形態において、本開示は、本明細書に記載のポリヌクレオチドのいずれかを含む発現ベクター、例えば、Casタンパク質又はそのバリアントをコードするポリヌクレオチドを含む発現ベクターを提供する。一部の実施形態において、本開示は、Cas9タンパク質又はそのバリアントをコードするポリヌクレオチドを含む発現ベクターを提供する。
用語「プラスミド」は、細胞の中央代謝の一部でない遺伝子を担持することが多く、通常、環状二本鎖DNA分子の形態である外部染色体エレメントを指す。このようなエレメントは、任意の資源に由来する自律複製配列、ゲノム組込み配列、ファージ又はヌクレオチド配列、線状、環状、又はスーパーコイルドの一本鎖又は二本鎖DNA又はRNAであり得、その中では多数のヌクレオチド配列が、適切な3’非翻訳配列とともに選択遺伝子産物についてのプロモーター断片及びDNA配列を細胞中に導入し得るユニーク構築物中に結合し、又は組換えされている。
本明細書において使用される「形質移入」は、細胞中への外因性核酸分子、例として、ベクターの導入を意味する。「形質移入」細胞は、細胞内部の外因性核酸分子を含み、「形質転換」細胞は、細胞内の外因性核酸分子が細胞の表現型変化を誘導する細胞である。形質移入核酸分子は、宿主細胞のゲノムDNA中に組み込むことができ、及び/又は一時的若しくは長期間にわたり染色体外で細胞により維持させることができる。外因性核酸分子又は断片を発現する宿主細胞又は生物は、「組換え」、「形質転換」、又は「トランスジェニック」生物と称される。一部の実施形態において、本開示は、本明細書に記載の発現ベクターのいずれか、例えば、Casタンパク質又はそのバリアントをコードするポリヌクレオチドを含む発現ベクターを含む宿主細胞を提供する。一部の実施形態において、本開示は、Cas9タンパク質又はそのバリアントをコードするポリヌクレオチドを含む発現ベクターを含む宿主細胞を提供する。
用語「ペプチド」、「ポリペプチド」、及び「タンパク質」は、本明細書において互換的に使用され、任意の長さのアミノ酸のポリマー形態を指し、それとしては、コード及び非コードアミノ酸、化学的若しくは生化学的改変又は誘導体化アミノ酸、並びに改変ペプチド骨格を有するポリペプチドを挙げることができる。
本明細書において使用される「アミノ酸」は、カルボキシル(−COOH)及びアミノ(−NH)基の両方を含有する化合物を指す。「アミノ酸」は、天然及び非天然、すなわち、合成アミノ酸の両方を指す。3文字及び1文字略記を有する天然アミノ酸としては、アラニン(Ala;A);アルギニン(Arg、R);アスパラギン(Asn;N);アスパラギン酸(Asp;D);システイン(Cys;C);グルタミン(Gln;Q);グルタミン酸(Glu;E);グリシン(Gly;G);ヒスチジン(His;H);イソロイシン(Ile;I);ロイシン(Leu;L);リジン(Lys;K);メチオニン(Met;M);フェニルアラニン(Phe;F);プロリン(Pro;P);セリン(Ser;S);トレオニン(Thr;T);トリプトファン(Trp;W);チロシン(Tyr;Y);及びバリン(Val;V)が挙げられる。
「アミノ酸置換」は、野生型又は天然発生アミノ酸の、その野生型又は天然発生アミノ酸に対して異なるアミノ酸によるそのアミノ酸残基における1つ以上の置換を含むポリペプチド又はタンパク質を指す。置換アミノ酸は、合成又は天然発生アミノ酸であり得る。一部の実施形態において、置換アミノ酸は、A、R、N、D、C、Q、E、G、H、I、L、K、M、F、P、S、T、W、Y、及びVからなる群から選択される天然発生アミノ酸である。置換突然変異体は、略記体系を使用して記載することができる。例えば、5番目のアミノ酸残基が置換されている置換突然変異は「X5Y」と略記することができ、「X」は、置き換えられるべき野生型又は天然発生アミノ酸であり、「5」は、タンパク質又はポリペプチドのアミノ酸配列内のアミノ酸残基位置であり、「Y」は、置換、又は非野生型又は非天然発生アミノ酸である。
「単離」ポリペプチド、タンパク質、ペプチド、又は核酸は、その天然環境から取り出された分子である。「単離」ポリペプチド、タンパク質、ペプチド、又は核酸は賦形剤、例えば、希釈剤又は助剤と配合することができ、依然として単離されているとみなされることも理解すべきである。
用語「組換え」は、核酸分子、ペプチド、ポリペプチド、又はタンパク質に関して使用される場合、天然に存在することが公知でない遺伝子材料の新たな組合せのそれら、又はその組合せから生じるそれらを意味する。組換え分子は、組換え技術の分野において利用可能な周知技術のいずれか、例として、限定されるものではないが、ポリメラーゼ連鎖反応(PCR)、遺伝子スプライシング(例えば、制限エンドヌクレアーゼを使用)、及び核酸分子、ペプチド、又はタンパク質の固相合成により産生することができる。
用語「ドメイン」は、ポリペプチド又はタンパク質に関して使用される場合、タンパク質中の区別される機能的及び/又は構造的単位を意味する。ドメインは、タンパク質の全体的な役割に寄与する特定の機能又は相互作用を担う場合がある。ドメインは、種々の生物学的コンテクストで存在し得る。類似のドメインは、異なる機能を有するタンパク質中で見出すことができる。或いは、低い配列同一性(すなわち、約50%未満、約40%未満、約30%未満、約20%未満、約10%未満、約5%未満、又は約1%未満の配列同一性)を有するドメインは、同一の機能を有し得る。一部の実施形態において、Cas9ドメインは、1E−5のE値カットオフを用いてTIGR03031タンパク質ファミリーにマッチする。一部の実施形態において、Cas9ドメインは、1E−10のE値カットオフを用いてTIGR03031タンパク質ファミリーにマッチする。一部の実施形態において、Cas9ドメインは、RuvCドメインである。一部の実施形態において、Cas9ドメインは、HNHドメインである。
本明細書において使用される用語「配列類似性」又は「%類似性」は、核酸配列間又はアミノ酸配列間の同一性又は対応性の程度を指す。本明細書において使用される「配列類似性」は、1つ以上のヌクレオチド塩基の変化が1つ以上のアミノ酸の置換をもたらすが、DNA配列によりコードされるタンパク質の機能的特性に影響しない核酸配列を指す。「配列類似性」は、得られる転写産物の機能的特性に実質的に影響しない核酸の改変、例えば、1つ以上のヌクレオチド塩基の欠失又は挿入も指す。したがって、本開示は、規定の例示的な配列よりも多くのものを包含することが理解される。提案される改変のそれぞれは、コードされる産物の生物学的活性の保持の決定と同様に十分に当分野における定型的な技能の範囲内である。
さらに、当業者は、本開示により包含される類似の配列が、ストリンジェントな条件下で本明細書に例示される配列とハイブリダイズするそれらの能力によっても定義されることを認識する。本開示の類似の核酸配列は、DNA配列が本明細書に開示の核酸のDNA配列と少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%、又は少なくとも99%同一である核酸である。本開示の類似の核酸配列は、DNA配列が本明細書に開示の核酸のDNA配列と約70%、少なくとも約70%、約75%、少なくとも約75%、約80%、少なくとも約80%、約85%、少なくとも約85%、約90%、少なくとも約90%、約95%、少なくとも約95%、約99%、少なくとも約99%、又は約100%同一である核酸である。
本明細書において使用される「配列類似性」は、アミノ酸の約40%超が同一であり、又はアミノ酸の約60%超が機能的に同一である2つ以上のアミノ酸配列を指す。機能的に同一又は機能的に類似のアミノ酸は、化学的に類似の側鎖を有する。例えば、アミノ酸は、機能的類似性に従って以下のようにグループ分けすることができる:
正荷電側鎖:Arg、His、Lys;
負荷電側鎖:Asp、Glu;
極性非荷電側鎖:Ser、Thr、Asn、Gln;
疎水性側鎖:Ala、Val、Ile、Leu、Met、Phe、Tyr、Trp;
その他:Cys、Gly、Pro。
一部の実施形態において、本開示の類似のアミノ酸配列は、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、又は少なくとも99%同一であるアミノ酸を有する。
一部の実施形態において、本開示の類似のアミノ酸配列は、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、又は少なくとも95%機能的に同一であるアミノ酸を有する。一部の実施形態において、本開示の類似のアミノ酸配列は、約40%、少なくとも約40%、約45%、少なくとも約45%、約50%、少なくとも約50%、約55%、少なくとも約55%、約60%、少なくとも約60%、約65%、少なくとも約65%、約70%、少なくとも約70%、約75%、少なくとも約75%、約80%、少なくとも約80%、約85%、少なくとも約85%、約90%、少なくとも約90%、約95%、少なくとも約95%、約97%、少なくとも約97%、約98%、少なくとも約98%、約99%、少なくとも約99%、又は約100%同一であるアミノ酸を有する。
一部の実施形態において、本開示の類似のアミノ酸配列は、約60%、少なくとも約60%、約65%、少なくとも約65%、約70%、少なくとも約70%、約75%、少なくとも約75%、約80%、少なくとも約80%、約85%、少なくとも約85%、約90%、少なくとも約90%、約95%、少なくとも約95%、約97%、少なくとも約97%、約98%、少なくとも約98%、約99%、少なくとも約99%、又は約100%機能的に同一であるアミノ酸を有する。
配列類似性は、当分野における定型的な方法を使用する配列アラインメント、例えば、BLAST、MUSCLE、Clustal(例として、ClustalW及びClustalX)、及びT−Coffee(変種、例えば、M−Coffee、R−Coffee、及びExpressoなどを含む)などにより決定される。
核酸配列又はアミノ酸配列に関する用語「配列同一性」又は「%同一性」は、配列を規定の比較窓にわたりアラインした場合に同一である比較配列中の残基の割合を指す。一部の実施形態において、2つ以上の配列の規定の一部のみをアラインして配列同一性が決定される。一部の実施形態において、2つ以上の配列の規定のドメインのみをアラインして配列類似性が決定される。比較窓は、配列をアラインし、比較することができる少なくとも10個〜1000個超の残基、少なくとも20〜約1000個の残基、又は少なくとも50〜500個の残基のセグメントであり得る。配列同一性の決定のためのアラインメントの方法は周知であり、公的に利用可能なデータベース、例えば、BLASTを使用して実施することができる。「パーセント同一性」又は「%同一性」は、アミノ酸配列を指す場合、当分野において公知の方法により決定することができる。例えば、一部の実施形態において、2つのアミノ酸配列の「パーセント同一性」は、Karlin and Altschul,Proceedings of the National Academy of Sciences USA 90:5873−5877(1993)のとおり修正されたKarlin and Altschul,Proceedings of the National Academy of Sciences USA 87:2264−2268(1990)のアルゴリズムを使用して決定される。このようなアルゴリズムは、BLASTプログラム、例えば、Altschul et al.,Journal of Molecular Biology,215:403−410(1990)に記載のBLAST+又はNBLAST及びXBLASTプログラム中に組み込まれている。BLASTタンパク質検索は、プログラム、例えば、XBLASTプログラム、スコア=50、ワード長さ=3などを用いて実施して本開示のタンパク質分子と相同であるアミノ酸配列を得ることができる。2つの配列間のギャップが存在する場合、Gapped BLASTをAltschul et al.,Nucleic Acids Research 25(17):3389−3402(1997)に記載のとおり利用することができる。BLAST及びGapped BLASTプログラムを利用する場合、それぞれのプログラム(例えば、XBLAST及びNBLAST)のデフォルトパラメータを使用することができる。
一部の実施形態において、ポリペプチド又は核酸分子は、それぞれ参照ポリペプチド又は核酸分子(又は参照ポリペプチド若しくは核酸分子の断片)と70%、少なくとも70%、75%、少なくとも75%、80%、少なくとも80%、85%、少なくとも85%、90%、少なくとも90%、95%、少なくとも95%、97%、少なくとも97%、98%、少なくとも98%、99%、又は少なくとも99%又は100%の配列同一性を有する。一部の実施形態において、ポリペプチド又は核酸分子は、それぞれ参照ポリペプチド又は核酸分子(又は参照ポリペプチド若しくは核酸分子の断片)と約70%、少なくとも約70%、約75%、少なくとも約75%、約80%、少なくとも約80%、約85%、少なくとも約85%、約90%、少なくとも約90%、約95%、少なくとも約95%、約97%、少なくとも約97%、約98%、少なくとも約98%、約99%、少なくとも約99%又は約100%の配列同一性を有する。
CRISPR−Cas系
一部の実施形態において、本開示は、(a)粘着末端を生成し得るCas9エフェクタータンパク質(「付着末端Cas9」又は「stiCas9」);及び(b)stiCas9との複合体を形成し、ガイド配列(ガイド配列は、真核細胞中の標的配列とハイブリダイズするが、細菌細胞中の配列にハイブリダイズしない)を含むガイドポリヌクレオチドを含み;複合体は天然に存在しない非天然発生CRISPR−Cas系を提供する。
一般に、CRISPR又はCRISPR−Cas系は、標的配列の部位におけるCRISPR複合体の形成を促進するエレメント(内因性CRISPR系に関してプロトスペーサーとも称される)により特徴付けされる。CRISPR複合体の形成に関して、「標的配列」は、ガイドポリヌクレオチドが標的化するように、例えば、相補性を有するように設計される配列を指し、標的配列及びガイドポリヌクレオチド間のハイブリダイゼーションがCRISPR複合体の形成を促進する。標的配列に対する相補性が開裂活性に重要であり得るガイドポリヌクレオチドのセクションは、本明細書においてガイド配列と称される。標的配列は、任意のポリヌクレオチド、例えば、DNA又はRNAポリヌクレオチドを含み得、目的標的遺伝子座内に局在し得る。一部の実施形態において、標的配列は、細胞の核又は細胞質中に局在する。一部の実施形態において、標的配列は、染色体上に局在する(TSC)。一部の実施形態において、標的配列は、ベクター上に局在する(TSV)。
本明細書に記載のCasタンパク質は、とりわけ、ゲノム編集、遺伝子調節、遺伝子回路構築、及び機能的ゲノミクスに使用することができるCRISPR−Cas系の構成成分である。Cas1及びCas2タンパク質は現在同定されている全てのCRISPR系にユニバーサルであると考えられている一方、Cas3、Cas9及びCas10タンパク質は、それぞれI型、II型、及びIII型CRISPR系に特異的であると考えられている。
CRISPR−Cas9系(II型系)についての最初の公開後、Cas9バリアントが一連の細菌種において同定され、番号は機能的に特徴付けされた。例えば、Chylinski et al.,“Classification and evolution of type II CRISPR−Cas systems”,Nucleic Acids Research 42(10):6091−6105(2014)、Ran et al.,“In vivo genome editing using Staphylococcus aureus Cas9”,Nature 520(7546):186−91(2015)、及びEsvelt et al.,“Orthogonal Cas9 proteins for RNA−guided gene regulation and editing”,Nature Methods 10(11):1116−1121(2013)参照、それらのそれぞれは参照により全体として本明細書に組み込まれる。
本開示は、II型CRISPR−Cas系の新規エフェクタータンパク質を包含し、そのうちCas9が例示的なエフェクタータンパク質である。したがって、用語「Cas9」、「Cas9タンパク質」及び「Cas9エフェクタータンパク質」は、互換的であり、CRISPR−Cas9系において使用される場合に粘着末端を提供し得るエフェクタータンパク質を記載するために本明細書において使用される。一部の実施形態において、用語Cas9は、II−B型Cas9を指す。一部の実施形態において、用語Cas9は、遺伝子操作Cas9バリアント、例えば、deadCas9−FokI、Cas9nD10A−FokI、及びCas9nH840A−FokIなどを指す。
一部の実施形態において、Cas9エフェクタータンパク質は、インビトロ、インビボ、又はエクスビボ用途において原核又は真核細胞中で機能的である。
用語Cas9エフェクタータンパク質は、一般に、RuvC及びHNHヌクレアーゼドメインの両方を有するCas9様機能を有するエフェクタータンパク質を指し得る。一部の実施形態において、Cas9エフェクタータンパク質のRuvCドメイン及びHNHドメインは、それぞれ、二本鎖標的DNAの一方の鎖を開裂させる。したがって、例えば、RuvCドメイン及びHNHドメインが同一位置におけるそれぞれの鎖を開裂させる場合、開裂の結果は、平滑末端を有する二本鎖標的DNAである。RuvCドメイン及びHNHドメインが異なる位置におけるそれぞれの鎖を開裂させる(すなわち、「オフセット」において切断する)場合、開裂の結果は、オーバーハングを有する二本鎖標的DNAである。一部の実施形態において、stiCas9タンパク質のRuvC及びHNHドメインは、3−ヌクレオチドオフセットにおいて切断する。実施形態において、stiCas9タンパク質のRuvC及びHNHドメインは、4−ヌクレオチドオフセットにおいて切断する。実施形態において、stiCas9タンパク質のRuvC及びHNHドメインは、5−ヌクレオチドオフセットにおいて切断する。実施形態において、stiCas9タンパク質のRuvC及びHNHドメインは、約1、約2、約3、約4、約5、約6、約7、約8、約9、約10、約11、約12、約13、約14、約15、約16、約17、約18、約19、約20、約21、約22、約23、約24、約25、約26、約27、約28、約29、約30、約31、約32、約33、約34、約35、約36、約37、約38、約39、又は約40ヌクレオチドのオフセットにおいて切断する。
一部の実施形態において、用語Cas9エフェクタータンパク質は、RuvCドメイン及びHNHドメインを有するCas9を指し、RuvCドメイン及びHNHドメインは、二本鎖標的DNAのそれぞれの鎖上の異なる位置において開裂させる。一部の実施形態において、Cas9エフェクタータンパク質のRuvCドメインは、PAMから約−10、約−9、約−8、約−7、又は約−6ヌクレオチドにおける二本鎖標的DNAの一方の鎖(例えば、「非標的鎖」と称することができる)を開裂させ、Cas9エフェクタータンパク質のHNHドメインは、PAMから−5、約−4、約−3、約−2、又は約−1ヌクレオチドにおける二本鎖標的DNAの他方の鎖(例えば、「標的鎖」と称することができる)を開裂させる。
一部の実施形態において、RuvCドメインは、PAMから約−8ヌクレオチドにおける二本鎖標的DNAの一方の鎖を開裂させる。一部の実施形態において、RuvCドメインは、PAMから約−7ヌクレオチドにおける二本鎖標的DNAの一方の鎖を開裂させる。一部の実施形態において、RuvCドメインは、PAMから約−6ヌクレオチドにおける二本鎖標的DNAの一方の鎖を開裂させる。一部の実施形態において、HNHドメインは、PAMから約−4ヌクレオチドにおける二本鎖標的DNAの一方の鎖を開裂させる。一部の実施形態において、HNHドメインは、PAMから約−3ヌクレオチドにおける二本鎖標的DNAの一方の鎖を開裂させる。一部の実施形態において、HNHドメインは、PAMから約−2ヌクレオチドにおける二本鎖標的DNAの一方の鎖を開裂させる。
一部の実施形態において、用語Cas9エフェクタータンパク質は、HMMER検索、具体的には、プログラムhmmscan(HMMERバージョン3.1b2)により同定されるTIGR03031タンパク質ファミリーを有するCas9を指す。本開示はまた、II型CRISPR−Cas系と関連するエフェクタータンパク質の同定及び遺伝子操作に関する。一部の実施形態において、エフェクタータンパク質は、単一サブユニットエフェクターモジュールを含む。一部の実施形態において、野生型Cas9エフェクター又はCas9タンパク質の遺伝子操作バージョンは、1つ又は複数の機能ドメイン、例えば、核局在化シグナル(NLS)及びFokIヌクレアーゼなどに融合している。本開示は、新たなII−B型CRISPR−Cas系を予測し、その構成成分を同定するためのコンピュータ計算法及びアルゴリズムを包含する。
一部の実施形態において、新規II−B型CRISPR−Cas遺伝子座を同定するコンピュータ計算法は、下記の、及びShmakov et al.,Nature Reviews Microbiology 15,169−182(2017)に既に記載の方法を含む。所与のヌクレオチド配列中のCRISPR−Cas遺伝子座の存在及び局在は、例えば、0.01のE値カットオフを使用するヌクレオチド配列に対するTBLASTNにおいてシードとして公知のCasタンパク質、例えば、Cas1の1つのタンパク質配列を使用することにより同定することができる。CRISPR−Cas遺伝子座の存在及び局在を同定するための別のアプローチは、プログラム、例えば、デフォルトパラメータを用いるCRISPRfinder又はPILER−CRなどの使用によりヌクレオチド配列中のCRISPRアレイを検索することである。CRISPR−Cas遺伝子座が同定されたら、CRISPR−Cas遺伝子座の上流及び下流の最大10kbpを含む配列を抽出することができる。抽出されたヌクレオチド配列中の遺伝子の存在は、ソフトウェア、例えば、デフォルトパラメータを使用するGeneMark又はMetaGeneMarkを用いて具現化することができる。次いで、同定された遺伝子をタンパク質配列に翻訳させ、アノテートして公知の機能を有するタンパク質(すなわち、Cas1、Cas2、Cas4、Cas9など)のデータベースに対する相同性検索、例えば、RPS−BLAST、BLAST、又はHMMRを使用してそれらの予測機能を示す。
上記方法を用いて同定されたCRISPR−Cas遺伝子座を、同一のCRISPR−Cas遺伝子座中のCas9及びCas4タンパク質の両方の存在について調査した。それというのも、それらはIIB型のCas9を含有する可能性がかなり高いためである。IIB型Cas9の確率をさらに増加させるため、TIGRFAM:TIGR03031ファミリーへの所属についてhmmscanを用いてCas9タンパク質を検索した。
一部の実施形態において、新規II−B型CRISPR−Cas遺伝子座を同定する方法は、Cas4タンパク質と同一の遺伝子座中のCas9タンパク質を同定することを含む。一部の実施形態において、新規II−B型CRISPR−Cas遺伝子座を同定する方法は、公的に利用可能なメタゲノム遺伝子カタログをアミノ酸配列に翻訳させ、TIGR03031タンパク質ファミリープロファイルを有するそれぞれのアミノ酸配列をスキャンして所定のカットオフE値、例えば、1E−5〜1E−10などを超えるマッチを同定することを含む。
TIGRFAMは、配列相同性によるタンパク質の自動化機能同定を支援するために設計された、キュレートされた複数配列アラインメント、隠れマルコフモデル、及び関連情報を特徴とするタンパク質ファミリーのコレクションである。配列アラインメントに適用される隠れマルコフモデル(HMM)は、タンパク質複数配列アラインメントの連続カラムについての統計的モデルを指す。典型的には、タンパク質プロファイルHMMは、キュレートされた複数配列アラインメントから、アミノ酸のそれぞれについての位置に基づくスコアリング、配列の長さにわたる挿入、及び欠失を用いて展開させる。スコアは、情報のビットで、及びE値として報告される。「信頼性のあるカットオフ」又は「信頼性のある限界値」、例えば、0.001未満などのE値は、陽性「ヒット」又は陽性同定と認識される。したがって、低いE値カットオフを用いて同定された配列は、特異的タンパク質ファミリーに属する可能性が高い。一部の実施形態において、E値カットオフは、1E−10である。一部の実施形態において、E値カットオフは、1E−5である。一部の実施形態において、信頼のあるカットオフE値は、少なくとも1E−10、少なくとも1E−9、少なくとも1E−8、少なくとも1E−7、少なくとも1E−6、少なくとも1E−5、少なくとも1E−4、少なくとも1E−3、少なくとも1E−2、又は少なくとも1E−1である。
一部の実施形態において、全ての予測タンパク質コード遺伝子の同定は、同定された遺伝子をCasタンパク質特異的プロファイルと比較し、それらをNCBI Conserved Domain Database(CDD)(古代ドメイン及び全長タンパク質について十分にアノテートされた複数配列アラインメントモデルのコレクションからなるタンパク質アノテーション資源である)に従ってアノテートすることにより実施される。これらは、RPS−BLASTを介するタンパク質配列中の保存ドメインの迅速な同定のための位置特異的スコア行列(PSSM)として利用可能である。CDDコンテンツはNCBIキュレートされたドメインを含み、それは3D構造情報を使用してドメイン境界を明確に定義し、配列/構造/機能の関係、並びに多数の外部資源データベース(Pfam、SMART、COG、PRK、TIGRFAM)からインポートされるドメインモデルに関する洞察を提供する。タンパク質データベースは、例えば、Finn et al.,Nucleic Acids Research Database Issue 44:D279−D285(2016);Letunic et al.,Nucleic Acids Research,doi:gkx922(2017);Tatusov et al.,Science 278(5338):631−637(1997);及びHaft et al.,Nucleic Acids Research Database Issue 41:D387−D395(2013)に記載されており、それらのそれぞれは全体として本明細書に組み込まれる。
一部の実施形態において、新規II−B型CRISPR−Cas遺伝子座は、保存ドメインを検索するためのHMMER(又はHMMERの任意のバージョン、例えば、HMMER2又はHMMER3)を使用して同定される。HMMERは無料であり、配列分析、相同タンパク質又はヌクレオチド配列の同定、及び配列アラインメントに一般に使用されるソフトウェアパッケージである。HMMERは、プロファイル隠れマルコフモデルと呼ばれる確率モデルを実装する。HMMERは、プロファイルデータベース、例えば、Pfam、SMART、COG、PRK、又はTIGRFAMを用いて使用することができる。HMMERは、クエリ配列を用いて、例えば、データベースに対するタンパク質クエリ配列の検索(すなわち、phmmer)又は反復検索(すなわち、jackhmmer)を用いて使用することもできる。一部の実施形態において、新規II−B型CRISPR−Cas遺伝子座は、特異的タンパク質ファミリー中の特異的ドメインの存在を検索することにより同定される。一部の実施形態において、TIGRFAMタンパク質ファミリーは、TIGRFAM:TIGR03031である。一部の実施形態において、特異的ドメインは、少なくとも1E−10、少なくとも1E−9、少なくとも1E−8、少なくとも1E−7、少なくとも1E−6、少なくとも1E−5、少なくとも1E−4、少なくとも1E−3、少なくとも1E−2、又は少なくとも1E−1のE値カットオフを用いてTIGR03031タンパク質ファミリーにマッチする。一部の実施形態において、特異的ドメインは、本明細書に同定されるTIGR03031ドメインのいずれかと少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、又は約100%の配列類似性を有する。一部の実施形態において、特異的ドメインは、配列番号10〜97又は192〜195のいずれか1つと少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、又は約100%の配列類似性を有する。一部の実施形態において、特異的ドメインは、配列番号10〜97又は192〜195のいずれか1つと少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、又は約100%の配列同一性を有する。
一部の実施形態において、stiCas9は、II−B型CRISPR系を有する細菌種に由来する。一部の実施形態において、II−B型CRISPR系は、cas4遺伝子を含む。本明細書において考察されるCRISPR系は、I型、II型、及びIII型と分類されている。全てのII型CRISPR系は、casオペロン上のcas1、cas2、及びcas9遺伝子を含む。II型CRISPR系は、II−A型、II−B型、及びII−C型にさらにカテゴリー化される。一部の実施形態において、II−B型CRISPR系は、casオペロン上のcas4遺伝子の存在により同定される。cas4遺伝子は、II−A型CRISPR系においてもII−C型CRISPR系においても見出されない。
II型CRISPR系は、個々のcas遺伝子の配列、例えば、cas9の配列及び/又はドメインに従って分類することもできる。タンパク質ドメインは、保存配列又は保存モチーフにより同定し、ファミリー、スーパーファミリー、及びサブファミリーに分類することができる。例えば、タンパク質ドメインは、PFAM又はTIGRFAMに従って分類することができる。したがって、Casタンパク質は、タンパク質ドメインにより同定し、分類することができる。例えば、II−A型Cas9タンパク質、例として、化膿連鎖球菌(Streptococcus pyogenes)からのCas9は、TIGR01865 TIGRFAMタンパク質ファミリーのものである。対照的に、II−B型Cas9タンパク質は、TIGR03031 TIGRFAMタンパク質ファミリーのものである。
したがって、一部の実施形態において、本開示のstiCas9は、配列番号10〜97又は192〜195のいずれかと少なくとも95%の配列類似性を有するドメインを含む。一部の実施形態において、本開示のstiCas9は、配列番号10〜97又は192〜195のいずれかと少なくとも10%、少なくとも20%、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、又は約100%の配列類似性を有するドメインを含む。一部の実施形態において、本開示のstiCas9は、少なくとも1E−10、少なくとも1E−9、少なくとも1E−8、少なくとも1E−7、少なくとも1E−6、少なくとも1E−5、少なくとも1E−4、少なくとも1E−3、少なくとも1E−2、又は少なくとも1E−1のE値カットオフを用いてTIGR03031タンパク質ファミリーにマッチするドメインを含む。
一部の実施形態において、II−B型Cas9は、II−B型CRISPR系を有する任意の種に由来する。一部の実施形態において、II−B型Cas9は、以下の細菌種に由来する:レジオネラ・ニューモフィラ(Legionella pneumophila)、フランシセラ・ノビシダ(Francisella novicida)、ガンマプロテオバクテリア(gamma proteobacterium)HTCC5015、パラサテレラ・エキスクレメンティホミニス(Parasutterella excrementihominis)、サテレラ・ワズワーセンシス(Sutterella wadsworthensis)、スルフロスピリラム属種(Sulfurospirillum sp.)SCADC、ルミノバクター属種(Ruminobacter sp.)RM87、バークホルデリア・バクテリウム(Burkholderiales bacterium)1_1_47、バクテロイデス・オーラル・タクソン(Bacteroidetes oral taxon)274株F0058、ウォリネラ・スクシノゲネス(Wolinella succinogenes)、バークホルデリア・バクテリウム(Burkholderiales bacterium)YL45、ルミノバクター・アミロフィラス(Ruminobacter amylophilus)、カンピロバクター属種(Campylobacter sp.)P0111、カンピロバクター属種(Campylobacter sp.)RM9261、カンピロバクター・ラニエナエ(Campylobacter lanienae)株RM8001、カンプリロバクター・ラニエナエ(Camplylobacter lanienae)株P0121、ツリシモナス・ムリス(Turicimonas muris)、レジオネラ・ロンジニエンシス(Legionella londiniensis)、サリニビブリオ・シャルメンシス(Salinivibrio sharmensis)、レプトスピラ属種(Leptospira sp.)単離株FW.030、モリテラ属種(Moritella sp.)単離株NORP46、エンドゾイコモナス属種(Endozoicomonassp.)S−B4−1U、タミルナドゥイバクター・サリナス(Tamilnaduibacter salinus)、ビブリオ・ナトリエゲンス(Vibrio natriegens)、アルコバクター・スキロウイイ(Arcobacter skirrowii)、フランシセラ・フィロミラギア(Francisella philomiragia)、フランシセラ・ヒスパニエンシス(Francisella hispaniensis)、又はパレンドゾイコモナス・ハリクロナエ(Parendozoicomonas haliclonae)。
一部の実施形態において、用語Cas9は、レジオネラ・ニューモフィラ(Legionella pneumophila)Cas9タンパク質のアミノ酸配列を含むポリペプチドを指す。一部の実施形態において、用語Cas9は、フランシセラ・ノビシダ(Francisella novicida)Cas9タンパク質のアミノ酸配列を含むポリペプチドを指す。一部の実施形態において、用語Cas9は、ガンマプロテオバクテリア(gamma proteobacterium)HTCC5015 Cas9タンパク質のアミノ酸配列を含むポリペプチドを指す。一部の実施形態において、用語Cas9は、パラサテレラ・エキスクレメンティホミニス(Parasutterella excrementihominis)Cas9タンパク質のアミノ酸配列を含むポリペプチドを指す。一部の実施形態において、用語Cas9は、サテレラ・ワズワーセンシス(Sutterella wadsworthensis)Cas9タンパク質のアミノ酸配列を含むポリペプチドを指す。一部の実施形態において、用語Cas9は、スルフロスピリラム属種(Sulfurospirillum sp.)SCADC Cas9タンパク質のアミノ酸配列を含むポリペプチドを指す。一部の実施形態において、用語Cas9は、ルミノバクター属種(Ruminobacter sp.)RM87 Cas9タンパク質のアミノ酸配列を含むポリペプチドを指す。一部の実施形態において、用語Cas9は、バークホルデリア・バクテリウム(Burkholderiales bacterium)1_1_47 Cas9タンパク質のアミノ酸配列を含むポリペプチドを指す。一部の実施形態において、用語Cas9は、バクテロイデス・オーラル・タクソン(Bacteroidetes oral taxon)274株F0058 Cas9タンパク質のアミノ酸配列を含むポリペプチドを指す。一部の実施形態において、用語Cas9は、ウォリネラ・スクシノゲネス(Wolinella succinogenes)Cas9タンパク質のアミノ酸配列を含むポリペプチドを指す。一部の実施形態において、用語Cas9は、バークホルデリア・バクテリウム(Burkholderiales bacterium)YL45 Cas9タンパク質のアミノ酸配列を含むポリペプチドを指す。一部の実施形態において、用語Cas9は、ルミノバクター・アミロフィラス(Ruminobacter amylophilus)株DSM1361 Cas9タンパク質のアミノ酸配列を含むポリペプチドを指す。一部の実施形態において、用語Cas9は、カンピロバクター属種(Campylobacter sp.)P0111 Cas9タンパク質のアミノ酸配列を含むポリペプチドを指す。一部の実施形態において、用語Cas9は、カンピロバクター属種(Campylobacter sp.)RM9261 Cas9タンパク質のアミノ酸配列を含むポリペプチドを指す。一部の実施形態において、用語Cas9は、カンピロバクター・ラニエナエ(Campylobacter lanienae)株RM8001 Cas9タンパク質のアミノ酸配列を含むポリペプチドを指す。一部の実施形態において、用語Cas9は、カンプリロバクター・ラニエナエ(Camplylobacter lanienae)株P0121 Cas9タンパク質のアミノ酸配列を含むポリペプチドを指す。一部の実施形態において、用語Cas9は、ツリシモナス・ムリス(Turicimonas muris)Cas9タンパク質のアミノ酸配列を含むポリペプチドを指す。一部の実施形態において、用語Cas9は、レジオネラ・ロンジニエンシス(Legionella londiniensis)Cas9タンパク質のアミノ酸配列を含むポリペプチドを指す。一部の実施形態において、用語Cas9は、サリニビブリオ・シャルメンシス(Salinivibrio sharmensis)Cas9タンパク質のアミノ酸配列を含むポリペプチドを指す。一部の実施形態において、用語Cas9は、レプトスピラ属種(Leptospira sp.)単離株FW.030 Cas9タンパク質のアミノ酸配列を含むポリペプチドを指す。一部の実施形態において、用語Cas9は、モリテラ属種(Moritella sp.)単離株NORP46 Cas9タンパク質のアミノ酸配列を含むポリペプチドを指す。一部の実施形態において、用語Cas9は、エンドゾイコモナス属種(Endozoicomonassp.)S−B4−1U Cas9タンパク質のアミノ酸配列を含むポリペプチドを指す。一部の実施形態において、用語Cas9は、タミルナドゥイバクター・サリナス(Tamilnaduibacter salinus)Cas9タンパク質のアミノ酸配列を含むポリペプチドを指す。一部の実施形態において、用語Cas9は、ビブリオ・ナトリエゲンス(Vibrio natriegens)Cas9タンパク質のアミノ酸配列を含むポリペプチドを指す。一部の実施形態において、用語Cas9は、アルコバクター・スキロウイイ(Arcobacter skirrowii)Cas9のアミノ酸配列を含むポリペプチドを指す。一部の実施形態において、用語Cas9は、フランシセラ・フィロミラギア(Francisella philomiragia)Cas9のアミノ酸配列を含むポリペプチドを指す。一部の実施形態において、用語Cas9は、フランシセラ・ヒスパニエンシス(Francisella hispaniensis)Cas9のアミノ酸配列を含むポリペプチドを指す。一部の実施形態において、用語Cas9は、パレンドゾイコモナス・ハリクロナエ(Parendozoicomonas haliclonae)Cas9のアミノ酸配列を含むポリペプチドを指す。一部の実施形態において、用語Cas9は、メタゲノム配列カタログからのCas9ポリペプチドを指す。一部の実施形態において、用語Cas9は、配列番号10〜97又は192〜195のいずれかを含むポリペプチドを指す。図30、配列番号10〜80;図31、配列番号81〜97;及び図47、配列番号192〜195参照。
一部の実施形態において、stiCas9タンパク質は、配列番号10〜97又は192〜195のいずれか1つのアミノ酸配列と少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、又は約100%の同一性の配列を有するドメインを含む。一部の実施形態において、stiCas9タンパク質は、配列番号10〜97又は192〜195のいずれか1つのアミノ酸配列と少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、又は約100%同一である。
本明細書において使用される用語「粘着末端」、「段違い末端」、又は「付着末端」は、不均等の長さの鎖を有する核酸断片を指す。「平滑末端」と対照的に、粘着末端は、核酸、典型的にはDNA上の段違い切断により産生される。付着又は粘着末端は、非対合ヌクレオチド、又は「オーバーハング」、例えば、3’又は5’オーバーハングを有する突出一本鎖を有する。それぞれのオーバーハングは、別の相補的オーバーハングとアニールして塩基対を形成し得る。2つの相補的粘着末端は、相互作用、例えば、水素結合を介して一緒にアニールし得る。アニールされる粘着末端の安定性は、対合オーバーハングの融解温度に依存する。2つの相補的粘着末端は、化学的又は酵素的ライゲーションにより、例えば、DNAリガーゼにより一緒に結合させることができる。
Cas9タンパク質は、平滑末端で二本鎖DNA分解を生成することが既に公知であった(例えば、Jinek et al.,2012参照)。本開示は、本明細書において「stiCas9」又は「付着Cas9」とも称される粘着末端を生成し得るCas9タンパク質を提供する。粘着末端を有するDNA断片は、さらなる用途、例えば、断片間の核酸の挿入及び全体的な断片の再結合などにおいて、平滑末端と比べて利点を提供する。平滑末端を有するDNA配列は、核酸の挿入についての特異性を提供せず、すなわち、核酸は、いずれかの平滑末端において挿入することができる。他方、粘着末端は、相補的粘着末端とのみ対合し、したがって好ましい方向での導入遺伝子の組込みを可能とする。一部の実施形態において、粘着末端は、非相同末端結合及びマイクロホモロジー媒介末端結合法を介するDNAの挿入を容易にする。
一部の実施形態において、stiCas9により生成される粘着末端は、3〜40ヌクレオチドの一本鎖ポリヌクレオチドオーバーハングを含む。一部の実施形態において、stiCas9により生成される粘着末端は、4〜20ヌクレオチドの一本鎖ポリヌクレオチドオーバーハングを含む。一部の実施形態において、stiCas9により生成される粘着末端は、5〜15ヌクレオチドの一本鎖ポリヌクレオチドオーバーハングを含む。一部の実施形態において、stiCas9により生成される粘着末端は、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、又は40ヌクレオチドの一本鎖ポリヌクレオチドオーバーハングを含む。一部の実施形態において、stiCas9により生成される粘着末端は、5’オーバーハングである。一部の実施形態において、stiCas9により生成される粘着末端は、3’オーバーハングである。
本明細書に記載の組成物及び方法は、ガイドポリヌクレオチドを含み得る。一部の実施形態において、ガイドポリヌクレオチドは、RNA分子である。CRISPR−Cas構成成分に結合し、それらを標的DNA内の特異的局在に標的化するRNA分子は、本明細書において「ガイドRNA」、「gRNA」、又は「小分子ガイドRNA」と称され、本明細書において「DNA標的化RNA」と称することもできる。ガイドポリヌクレオチド、例えば、ガイドRNAは、少なくとも2つのヌクレオチドセグメント:少なくとも1つの「DNA結合セグメント」及び少なくとも1つの「ポリペプチド結合セグメント」を含む。「セグメント」は、分子の一部、セクション、又は領域、例えば、ガイドポリヌクレオチド分子のヌクレオチドの連続ストレッチを意味する。「セグメント」の定義は、特に具体的に定義されない限り、規定数の総塩基対に限定されない。
一部の実施形態において、ガイドポリヌクレオチドのDNA結合セグメントは、真核細胞中の標的配列とハイブリダイズするが、細菌細胞中の配列とハイブリダイズしない。本明細書において使用される細菌細胞中の配列は、細菌生物に由来するポリヌクレオチド配列、すなわち、天然発生細菌ポリヌクレオチド配列、又は細菌由来の配列を指す。例えば、配列は、細菌染色体若しくは細菌プラスミド、又は細菌細胞中で天然に見出される任意の他のポリヌクレオチド配列であり得る。
一部の実施形態において、ガイドポリヌクレオチドのポリペプチド結合セグメントは、Cas9に結合する。一部の実施形態において、ガイドポリヌクレオチドのポリペプチド結合セグメントは、stiCas9に結合する。
一部の実施形態において、ガイドポリヌクレオチドは、10〜150ヌクレオチドである。一部の実施形態において、ガイドポリヌクレオチドは、20〜120ヌクレオチドである。一部の実施形態において、ガイドポリヌクレオチドは、30〜100ヌクレオチドである。一部の実施形態において、ガイドポリヌクレオチドは、40〜80ヌクレオチドである。一部の実施形態において、ガイドポリヌクレオチドは、50〜60ヌクレオチドである。一部の実施形態において、ガイドポリヌクレオチドは、10〜35ヌクレオチドである。一部の実施形態において、ガイドポリヌクレオチドは、15〜30ヌクレオチドである。一部の実施形態において、ガイドポリヌクレオチドは、20〜25ヌクレオチドである。
ガイドポリヌクレオチド、例えば、ガイドRNAは、標的細胞中に、単離分子、例えば、RNA分子として導入することができ、又は細胞中に、ガイドポリヌクレオチド、例えば、ガイドRNAをコードするDNAを含有する発現ベクターを使用して導入する。
ガイドポリヌクレオチド、例えば、ガイドRNAの「DNA結合セグメント」(又は「DNA標的化配列」)は、標的DNA内の特異的配列に相補的なヌクレオチド配列を含む。
本開示のガイドポリヌクレオチド、例えば、ガイドRNAは、ポリペプチド結合配列/セグメントを含み得る。ガイドポリヌクレオチド、例えば、ガイドRNAのポリペプチド結合セグメント(又は「タンパク質結合配列」)は、本開示のCasタンパク質のポリヌクレオチド結合ドメインと相互作用する。このようなポリペプチド結合セグメント又は配列は当業者に公知であり、例えば、それらは米国特許出願公開第2014/0068797号明細書、同第2014/0273037号明細書、同第2014/0273226号明細書、同第2014/0295556号明細書、同第2014/0295557号明細書、同第2014/0349405号明細書、同第2015/0045546号明細書、同第2015/0071898号明細書、同第2015/0071899号明細書、及び同第2015/0071906号明細書に開示されており、それらの開示は全体として本明細書に組み込まれる。
本開示の一部の実施形態において、stiCas9及びガイドポリヌクレオチドは、複合体を形成し得る。「複合体」は、2つ以上の会合している核酸及び/又はポリペプチドの群である。一部の実施形態において、複合体は、複合体の全ての構成成分が一緒に存在する場合に形成され、すなわち、自己集合複合体である。一部の実施形態において、複合体は、複合体の異なる構成成分間の化学的相互作用、例えば、水素結合などを介して形成される。一部の実施形態において、ガイドポリヌクレオチドは、stiCas9によるガイドポリヌクレオチドの二次構造認識を介してstiCas9との複合体を形成する。一部の実施形態において、stiCas9タンパク質は、それがガイドポリヌクレオチドとの複合体を形成するまで不活性であり、すなわち、ヌクレアーゼ活性を示さない。ガイドRNAの結合は、stiCas9の立体構造変化を誘導してstiCas9を不活性形態から活性形態、すなわち、触媒的に活性な形態に変換する。本開示の実施形態において、stiCas9及びガイドポリヌクレオチドの複合体は天然に生じない。
一部の実施形態において、本開示は、粘着末端を生成し得、核局在化シグナル(NLS)を含むCas9エフェクタータンパク質(stiCas9)、及びstiCas9との複合体を形成し、ガイド配列を含むガイドポリヌクレオチドを含み、複合体は天然に生じない非天然発生CRISPR−Cas系を提供する。
一部の実施形態において、stiCas9は、1つ以上の核局在化シグナルを含む。「核局在化シグナル」又は「核局在化配列」(NLS)は、核輸送による細胞核中への輸送のためにタンパク質を「タグ付けする」アミノ酸配列であり、すなわち、NLSを有するタンパク質は、細胞核中に輸送される。典型的には、NLSは、タンパク質表面上で露出される正荷電Lys又はArg残基を含む。例示的な核局在化配列としては、限定されるものではないが、SV40ラージT抗原、w、EGL−13、c−Myc、及びTUSタンパク質からのNLSが挙げられる。一部の実施形態において、NLSは、配列PKKKRKV(配列番号1)を含む。一部の実施形態において、NLSは、配列AVKRPAATKKAGQAKKKKLD(配列番号2)を含む。一部の実施形態において、NLSは、配列PAAKRVKLD(配列番号3)を含む。一部の実施形態において、NLSは、配列MSRRRKANPTKLSENAKKLAKEVEN(配列番号4)を含む。一部の実施形態において、NLSは、配列KLKIKRPVK(配列番号5)を含む。他の核局在化配列としては、限定されるものではないが、hnRNP A1の酸性M9ドメイン、酵母転写抑制因子Matα2中の配列KIPIK(配列番号6)、及びPY−NLSが挙げられる。
一部の実施形態において、本開示は、(a)粘着末端を生成し得るCas9エフェクタータンパク質(stiCas9)をコードする1つ以上のヌクレオチド;及び(b)stiCas9との複合体を形成し、ガイド配列を含むガイドポリヌクレオチドをコードするヌクレオチド配列(ガイド配列は、真核細胞中の標的配列とハイブリダイズするが、細菌細胞中の配列にハイブリダイズしない)を含み、複合体は天然に生じない非天然発生CRISPR−Cas系を提供する。
一部の実施形態において、stiCas9タンパク質は、1つ以上のポリヌクレオチドによりコードされる。一部の実施形態において、ポリヌクレオチドは、DNAである。一部の実施形態において、ポリヌクレオチドは、RNAである。
一部の実施形態において、stiCas9は、レジオネラ・ニューモフィラ(Legionella pneumophila)Cas9タンパク質に由来する1つ以上のポリヌクレオチドによりコードされる。一部の実施形態において、stiCas9は、フランシセラ・ノビシダ(Francisella novicida)Cas9タンパク質に由来する1つ以上のポリヌクレオチドによりコードされる。一部の実施形態において、stiCas9は、ガンマプロテオバクテリア(gamma proteobacterium)HTCC5015 Cas9タンパク質に由来する1つ以上のポリヌクレオチドによりコードされる。一部の実施形態において、stiCas9は、パラサテレラ・エクスクレメンティホミニス(Parasutterella excrementihominis)Cas9タンパク質に由来する1つ以上のポリヌクレオチドによりコードされる。一部の実施形態において、stiCas9は、サテレラ・ワズワーセンシス(Sutterella wasworthensis)Cas9タンパク質に由来する1つ以上のポリヌクレオチドによりコードされる。一部の実施形態において、stiCas9は、スルフロスピリラム属種(Sulfurospirillum sp.)SCADC Cas9タンパク質に由来する1つ以上のポリヌクレオチドによりコードされる。一部の実施形態において、stiCas9は、ルミノバクター属種(Ruminobacter sp.)RM87 Cas9タンパク質に由来する1つ以上のポリヌクレオチドによりコードされる。一部の実施形態において、stiCas9は、バークホルデリア・バクテリウム(Burkholderiales bacterium)1_1_47 Cas9タンパク質に由来する1つ以上のポリヌクレオチドによりコードされる。一部の実施形態において、stiCas9は、バクテロイデス・オーラル・タクソン(Bacteroidetes oral taxon)274株F0058 Cas9タンパク質に由来する1つ以上のポリヌクレオチドによりコードされる。一部の実施形態において、stiCas9は、ウォリネラ・スクシノゲネス(Wolinella succinogenes)Cas9タンパク質に由来する1つ以上のポリヌクレオチドによりコードされる。一部の実施形態において、stiCas9は、バークホルデリア・バクテリウム(Burkholderiales bacterium)YL45 Cas9タンパク質に由来する1つ以上のポリヌクレオチドによりコードされる。一部の実施形態において、stiCas9は、ルミノバクター・アミロフィラス(Ruminobacter amylophilus)株DSM1361 Cas9タンパク質に由来する1つ以上のポリヌクレオチドによりコードされる。一部の実施形態において、stiCas9は、カンピロバクター属種(Campylobacter sp.)P0111 Cas9タンパク質に由来する1つ以上のポリヌクレオチドによりコードされる。一部の実施形態において、stiCas9は、カンピロバクター属種(Campylobacter sp.)RM9261 Cas9タンパク質に由来する1つ以上のポリヌクレオチドによりコードされる。一部の実施形態において、stiCas9は、カンピロバクター・ラニエナエ(Campylobacter lanienae)株RM8001 Cas9タンパク質に由来する1つ以上のポリヌクレオチドによりコードされる。一部の実施形態において、stiCas9は、カンプリロバクター・ラニエナエ(Camplylobacter lanienae)株P0121 Cas9タンパク質に由来する1つ以上のポリヌクレオチドによりコードされる。一部の実施形態において、stiCas9は、ツリシモナス・ムリス(Turicimonas muris)Cas9タンパク質に由来する1つ以上のポリヌクレオチドによりコードされる。一部の実施形態において、stiCas9は、レジオネラ・ロンジニエンシス(Legionella londiniensis)Cas9タンパク質に由来する1つ以上のポリヌクレオチドによりコードされる。一部の実施形態において、stiCas9は、サリニビブリオ・シャルメンシス(Salinivibrio sharmensis)Cas9タンパク質に由来する1つ以上のポリヌクレオチドによりコードされる。一部の実施形態において、stiCas9は、レプトスピラ属種(Leptospira sp.)単離株FW.030 Cas9タンパク質に由来する1つ以上のポリヌクレオチドによりコードされる。一部の実施形態において、stiCas9は、モリテラ属種(Moritella sp.)単離株NORP46 Cas9タンパク質に由来する1つ以上のポリヌクレオチドによりコードされる。一部の実施形態において、stiCas9は、エンドゾイコモナス属種(Endozoicomonassp.)S−B4−1U Cas9タンパク質に由来する1つ以上のポリヌクレオチドによりコードされる。一部の実施形態において、stiCas9は、タミルナドゥイバクター・サリナス(Tamilnaduibacter salinus)Cas9タンパク質に由来する1つ以上のポリヌクレオチドによりコードされる。一部の実施形態において、stiCas9は、ビブリオ・ナトリエゲンス(Vibrio natriegens)Cas9タンパク質に由来する1つ以上のポリヌクレオチドによりコードされる。一部の実施形態において、stiCas9は、アルコバクター・スキロウイイ(Arcobacter skirrowii)Cas9タンパク質に由来する1つ以上のポリヌクレオチドによりコードされる。一部の実施形態において、stiCas9は、フランシセラ・フィロミラギア(Francisella philomiragia)Cas9タンパク質に由来する1つ以上のポリヌクレオチドによりコードされる。一部の実施形態において、stiCas9は、フランシセラ・ヒスパニエンシス(Francisella hispaniensis)Cas9タンパク質に由来する1つ以上のポリヌクレオチドによりコードされる。一部の実施形態において、stiCas9は、パレンドゾイコモナス・ハリクロナエ(Parendozoicomonas haliclonae)Cas9タンパク質に由来する1つ以上のポリヌクレオチドによりコードされる。
一部の実施形態において、本開示のstiCas9は、少なくとも1E−10、少なくとも1E−9、少なくとも1E−8、少なくとも1E−7、少なくとも1E−6、少なくとも1E−5、少なくとも1E−4、少なくとも1E−3、少なくとも1E−2、又は少なくとも1E−1のE値カットオフを用いてTIGR03031タンパク質ファミリーにマッチするドメインを含む。
一部の実施形態において、CRISPR−Cas系のガイドポリヌクレオチドは、ヌクレオチド配列によりコードされる。一部の実施形態において、ヌクレオチド配列は、DNAである。一部の実施形態において、ガイドポリヌクレオチドは、ガイドRNAである。一部の実施形態において、ガイドポリヌクレオチドのガイド配列は、DNA標的化配列である。
一部の実施形態において、stiCas9をコードするヌクレオチド配列は、コドン最適化されている。コドン最適化配列の例は、この例において、真核生物、例えば、ヒト(すなわち、ヒト中の発現のために最適化されている)中の、又は本明細書において考察される別の真核生物、動物、若しくは哺乳動物のための発現のために最適化された配列である;例えば、コドン最適化配列の例として国際公開第2014/093622号パンフレットにおけるSaCas9ヒトコドン最適化配列参照(当分野及び本開示における知識から、特にエフェクタータンパク質(例えば、Cas9)に関する(1つ以上の)コドン最適化コード核酸分子は、当業者の技能の範囲内である)。他の例が考えられ、ヒト以外の宿主種のためのコドン最適化、又は規定の器官のためのコドン最適化が公知である。一部の実施形態において、DNA/RNA標的化Casタンパク質をコードする酵素コード配列は、特定の細胞、例えば、真核細胞中の発現のためにコドン最適化されている。真核細胞は、特定の生物、例えば、植物又は哺乳動物、例として、限定されるものではないが、ヒト、又は本明細書において考察される非ヒト真核生物若しくは動物若しくは哺乳動物、例えば、マウス、ラット、ウサギ、イヌ、家畜、若しくは非ヒト哺乳動物若しくは霊長類の細胞又はそれらに由来する細胞であり得る。一部の実施形態において、ヒト又は動物へのいかなる実質的な医学的利益もなしで苦痛を引き起こす可能性が高いヒトの生殖系列遺伝的同一性を改変する方法及び/又は動物の遺伝的同一性を改変する方法、及びさらにはそのような方法から生じる動物は除外される。一般に、コドン最適化は、天然アミノ酸配列を維持しながら目的宿主細胞の遺伝子においてより高い頻度又は最大頻度で使用されるコドンにより天然配列の少なくとも1つのコドン(例えば、約又は約1、2、3、4、5、10、15、20、25、50個以上を超えるコドン)を置き換えることにより目的宿主細胞中の発現向上のために核酸配列を改変する方法を指す。種々の種は、特定のアミノ酸のあるコドンについての特定のバイアスを示す。コドンバイアス(生物間のコドン頻度の差)は、メッセンジャーRNA(mRNA)の翻訳の効率と相関することが多く、それは同様にとりわけ翻訳されるコドンの特性及び特定のトランスファーRNA(tRNA)分子の利用可能性に依存的であると考えられる。細胞中の選択tRNAの優位性は、一般に、ペプチド合成において最大頻度で使用されるコドンの反映である。したがって、遺伝子は、コドン最適化に基づき所与の生物中の最適な遺伝子発現のためにテーラーメードすることができる。コドン頻度表は、例えば、「Codon Usage Database」(www.kazusa.orjp/codon/)において容易に利用可能であり、それらの表は多数の手法で適合させることができる。Nakamura et al.,“Codon usage tabulated from the international DNA sequence databases:status for the year 2000,”Nucleic Acids Research 28:292(2000)参照。特定の宿主細胞中の発現のための特定の配列のコドン最適化のためのコンピュータアルゴリズムも利用可能である。一部の実施形態において、DNA/RNA標的化Casタンパク質をコードする配列中の1つ以上のコドン(例えば、1、2、3、4、5、10、15、20、25、50個以上又は全てのコドン)は、特定のアミノ酸についての最大頻度で使用されるコドンに対応する。酵母におけるコドン頻度に関しては、オンラインYeast Genomeデータベース(www.yeastgenome.org/community/codon_usage.shtml)、又はBennetzen and Hall,“Codon selection in yeast,”Journal of Biological Chemistry,257(6):3026−31(1982)を参照されたい。植物、例として、藻類におけるコドン頻度に関しては、Campbell and Gowri,“Codon usage in higher plants,green algae,and cyanobacteria,”Plant Physiology 92(1):1−11(1990);及びMurray et al.,“Codon usage in plant genes,”Nucleic Acids Research 17(2):477−98(1989);又はMorton,“Selection on the codon bias of chloroplast and cyanelle genes in different plant and algal lineages,”Molecular Evolution 46(4):449−59(1998)を参照されたい。一部の実施形態において、配列番号10〜97又は192〜195の1つ以上が、コドン最適化されている。
一部の実施形態において、stiCas9をコードするヌクレオチド配列は、真核細胞中の発現のためにコドン最適化されている。一部の実施形態において、stiCas9をコードするヌクレオチド配列は、動物細胞中の発現のためにコドン最適化されている。一部の実施形態において、stiCas9をコードするヌクレオチド配列は、ヒト細胞中の発現のためにコドン最適化されている。stiCas9をコードするヌクレオチド配列は、植物細胞中の発現のためにコドン最適化される。コドン最適化は、組換え又は異種タンパク質発現の収量及び効率を増加させるためにその発現を宿主のtRNA存在量にマッチさせるようにコドンを調整することである。コドン最適化法は当分野において定型であり、ソフトウェアプログラム、例えば、Integrated DNA TechnologiesのCodon Optimizationツール、EntelechonのCodon Usage Table分析ツール、GENEMAKERのBlue Heronソフトウェア、AptagenのGene Forgeソフトウェア、DNA Builder Software、General Codon Usage Analysisソフトウェア、公的に利用可能なOPTIMIZERソフトウェア、及びGenscriptのOptimumGeneアルゴリズムなどを使用して実施することができる。
一部の実施形態において、本開示のCRISPR−Cas系は、tracrRNAをさらに含む。「tracrRNA」又はトランス活性化CRISPR−RNAは、プレcrRNA、又はプレCRISPR−RNAとのRNA二本鎖を形成し、次いでRNA特異的リボヌクレアーゼRNアーゼIIIにより開裂されてcrRNA/tracrRNAハイブリッドが形成される。一部の実施形態において、ガイドRNAは、crRNA/tracrRNAハイブリッドを含む。一部の実施形態において、ガイドRNAのtracrRNA構成成分は、Cas9タンパク質を活性化させる。
本開示の一部の実施形態において、stiCas9、ガイドポリヌクレオチド、及びtracrRNAは、複合体を形成し得る。一部の実施形態において、stiCas9、ガイドポリヌクレオチド、及びtracrRNAの複合体は、天然に生じない。
一部の実施形態において、本開示は、(a)粘着末端を生成し得るCas9エフェクタータンパク質(stiCas9)をコードする1つ以上のヌクレオチド配列に作動可能に結合している調節エレメント;(b)stiCas9との複合体を形成し、ガイド配列(ガイド配列は、真核細胞中の標的配列とハイブリダイズし得るが、細菌細胞中の配列にハイブリダイズしない)を含むガイドポリヌクレオチドを含み、複合体は天然に生じない1つ以上のベクターを含む非天然発生CRISPR−Cas系を提供する。「stiCas9との複合体を形成し、ガイド配列を含むガイドポリヌクレオチド」を含むベクターには、ガイドポリヌクレオチドに転写させることができるポリヌクレオチド配列を含むベクターも含まれることが当業者により理解される。例えば、ガイドRNA配列を生成するようにDNAベクターを転写させることができる。
一部の実施形態において、本開示は、粘着末端を生成し得るCas9エフェクタータンパク質(stiCas9)をコードする1つ以上のヌクレオチド配列に作動可能に結合している調節エレメント(調節エレメントは、真核生物調節エレメントである)、及びstiCas9との複合体を形成し、ガイド配列を含むガイドポリヌクレオチドを含み、複合体は天然に生じない1つ以上のベクターを含む非天然発生CRISPR−Cas系を提供する。
一部の実施形態において、調節エレメントは、プロモーターである。一部の実施形態において、調節エレメントは、細菌プロモーターである。一部の実施形態において、調節エレメントは、ウイルスプロモーターである。一部の実施形態において、調節エレメントは、真核生物調節エレメント、すなわち、真核生物プロモーターである。一部の実施形態において、真核生物調節エレメントは、哺乳動物プロモーターである。
「作動可能に結合している」は、目的ヌクレオチド、すなわち、Cas9タンパク質をコードするヌクレオチドが、ヌクレオチド配列の発現を可能とする様式で調節エレメントに結合していることを意味する。したがって、一部の実施形態において、ベクターは、発現ベクターである。
一部の実施形態において、CRISPR−Cas系を含むベクターのガイドポリヌクレオチドは、ヌクレオチド配列によりコードされる。一部の実施形態において、ヌクレオチド配列は、DNAである。一部の実施形態において、ガイドポリヌクレオチドは、ガイドRNAである。一部の実施形態において、ガイドポリヌクレオチドのガイド配列は、DNA標的化配列である。
一部の実施形態において、stiCas9及びガイドポリヌクレオチドは、複合体を形成し得る。一部の実施形態において、stiCas9及びガイドポリヌクレオチドの複合体は天然に生じない。
一部の実施形態において、ベクターは、tracrRNA配列を含むヌクレオチド配列をさらに含む。一部の実施形態において、ガイドRNAは、crRNA/tracrRNAハイブリッドを含む。一部の実施形態において、ガイドRNAのtracrRNA構成成分は、Cas9タンパク質を活性化させる。
一部の実施形態において、本明細書に記載のCRISPR−Cas系は、プロトスペーサー隣接モチーフの10ヌクレオチド以内の部位において開裂させ得る。プロトスペーサー隣接モチーフ、又はPAMは、ガイドRNAに相補的な領域の1ヌクレオチド以内に局在する2〜6塩基対ヌクレオチド配列である。Cas9タンパク質が活性化される場合(例えば、ガイドポリヌクレオチドとの複合体の形成により)、それはそのPAM配列にマッチする配列との結合により標的DNAを探索する。例えば、Sternberg et al.,“DNA interrogation by the CRISPR RNA−guided endonuclease Cas9,”Nature 507(7490):62−67(2014)参照、それは参照により全体として本明細書に組み込まれる。適切なPAMを有する潜在的な標的配列が認識され、ガイドRNAがその標的領域と適切に対合した場合、Cas9のヌクレアーゼドメイン(すなわち、RuvC及びHNHドメイン)が標的DNAを切断する。
一部の実施形態において、本開示のCas9タンパク質のRuvC及びHNHドメインはそれぞれ、標的DNA配列の一方の鎖を切断する。実施形態において、stiCas9タンパク質のRuvC及びHNHドメインの切断部位は、オフセットであり、すなわち、それぞれのドメインは、標的DNAのそのそれぞれの鎖上の異なる位置において切断し、オーバーハングをもたらす。実施形態において、stiCas9タンパク質のRuvC及びHNHドメインは、3−ヌクレオチドオフセットにおいて切断する。実施形態において、stiCas9タンパク質のRuvC及びHNHドメインは、4−ヌクレオチドオフセットにおいて切断する。実施形態において、stiCas9タンパク質のRuvC及びHNHドメインは、5−ヌクレオチドオフセットにおいて切断する。実施形態において、stiCas9タンパク質のRuvC及びHNHドメインは、約1、約2、約3、約4、約5、約6、約7、約8、約9、約10、約11、約12、約13、約14、約15、約16、約17、約18、約19、約20、約21、約22、約23、約24、約25、約26、約27、約28、約29、約30、約31、約32、約33、約34、約35、約36、約37、約38、約39、又は約40ヌクレオチドのオフセットにおいて切断する。
一部の実施形態において、本開示のCas9エフェクタータンパク質のRuvC及びHNHドメインは、二本鎖標的DNAのそれぞれの鎖上の異なる位置において開裂させる。一部の実施形態において、Cas9エフェクタータンパク質のRuvCドメインは、PAMから約−10、約−9、約−8、約−7、又は約−6ヌクレオチドにおける二本鎖標的DNAの一方の鎖(例えば、「非標的鎖」と称することができる)を開裂させ、Cas9エフェクタータンパク質のHNHドメインは、PAMから−5、約−4、約−3、約−2、又は約−1ヌクレオチドにおける二本鎖標的DNAの他方の鎖(例えば、「標的鎖」と称することができる)を開裂させる。
一部の実施形態において、RuvCドメインは、PAMから約−8ヌクレオチドにおける二本鎖標的DNAの一方の鎖を開裂させる。一部の実施形態において、RuvCドメインは、PAMから約−7ヌクレオチドにおける二本鎖標的DNAの一方の鎖を開裂させる。一部の実施形態において、RuvCドメインは、PAMから約−6ヌクレオチドにおける二本鎖標的DNAの一方の鎖を開裂させる。一部の実施形態において、HNHドメインは、PAMから約−4ヌクレオチドにおける二本鎖標的DNAの一方の鎖を開裂させる。一部の実施形態において、HNHドメインは、PAMから約−3ヌクレオチドにおける二本鎖標的DNAの一方の鎖を開裂させる。一部の実施形態において、HNHドメインは、PAMから約−2ヌクレオチドにおける二本鎖標的DNAの一方の鎖を開裂させる。
本開示の一部の実施形態において、stiCas9及びガイドポリヌクレオチドを含む複合体は、プロトスペーサー隣接モチーフ(PAM)の10ヌクレオチド以内の部位において開裂させ得る。一部の実施形態において、stiCas9及びガイドポリヌクレオチドを含む複合体は、PAMの5ヌクレオチド以内の部位において開裂させ得る。一部の実施形態において、stiCas9及びガイドポリヌクレオチドを含む複合体は、PAMの3ヌクレオチド以内の部位において開裂させ得る。一部の実施形態において、PAMは、標的配列の下流(すなわち、3’方向)に存在する。一部の実施形態において、標的配列の上流(すなわち、5’方向)に存在する。一部の実施形態において、PAMは、標的配列内に局在する。
異なる細菌種は、異なるPAM配列を認識する。本開示のCas9タンパク質に好ましいPAM配列を同定する1つの方法は図49Aに説明され、例えば、標的配列に隣接する種々のPAM配列のプラスミドライブラリーを生成すること、プラスミドライブラリーをCas9タンパク質と接触させること、次いでプラスミドライブラリーをシーケンシングしてどのPAM配列が「枯渇」したか(すなわち、シーケンシング結果において検出されない)を決定することを含む。「枯渇」PAM配列は、Cas9タンパク質により認識され、影響を受ける(すなわち、開裂される)配列である。
例えば、化膿連鎖球菌(Streptococcus pyogenes)のCas9により認識されるPAM配列は、5’−NGG−3’ (Nは、任意のヌクレオチドである)である。異なるPAMは、髄膜炎菌(Neisseria meningitidis)、トレポネマ・デンティコラ(Treponema denticola)、及びストレプトコッカス・サーモフィラス(Streptococcus thermophilus)のCas9タンパク質と会合する。フランシセラ・ノビシダ(Francisella novicida)のCas9タンパク質は、PAM5’−YG−3’(Yは、ピリミジンである)を認識するように遺伝子操作されている。
一部の実施形態において、PAMは、3’Gリッチモチーフを含む。一部の実施形態において、PAM配列は、NGG(Nは、A、C、T、U、又はGである)である。一部の実施形態において、PAM配列は、NGA(Nは、A、C、T、U、又はGである)である。一部の実施形態において、PAM配列は、YG(Yは、ピリミジン(すなわち、C、T、又はU)である)である。
一部の実施形態において、標的配列は、PAMの5’に存在し、PAMは、3’G−リッチモチーフを含む。一部の実施形態において、標的配列は、PAMの5’に存在し、PAM配列は、NGG(Nは、A、C、T、U、又はGである)である。一部の実施形態において、標的配列は、PAMの5’に存在し、PAM配列は、YG(Yは、ピリミジンである)であり、stiCas9は、細菌種フランシセラ・ノビシダ(Francisella novicida)に由来する。
一部の実施形態において、stiCas9は、1つ以上の核局在化シグナルを含む。「核局在化シグナル」又は「核局在化配列」(NLS)は、核輸送による細胞核中への輸送のためにタンパク質を「タグ付けする」アミノ酸配列であり、すなわち、NLSを有するタンパク質は、細胞核中に輸送される。典型的には、NLSは、タンパク質表面上で露出される正荷電Lys又はArg残基を含む。例示的な核局在化配列としては、限定されるものではないが、SV40ラージT抗原、ヌクレオプラスミン、EGL−13、c−Myc、及びTUSタンパク質からのNLSが挙げられる。一部の実施形態において、NLSは、配列PKKKRKV(配列番号1)を含む。一部の実施形態において、NLSは、配列AVKRPAATKKAGQAKKKKLD(配列番号2)を含む。一部の実施形態において、NLSは、配列PAAKRVKLD(配列番号3)を含む。一部の実施形態において、NLSは、配列MSRRRKANPTKLSENAKKLAKEVEN(配列番号4)を含む。一部の実施形態において、NLSは、配列KLKIKRPVK(配列番号5)を含む。他の核局在化配列としては、限定されるものではないが、hnRNP A1の酸性M9ドメイン、酵母転写抑制因子Matα2中の配列KIPIK(配列番号6)、及びPY−NLSが挙げられる。
一部の実施形態において、本開示のガイドポリヌクレオチドは、真核細胞中の標的配列にハイブリダイズするガイド配列を有する。一部の実施形態において、真核細胞は、動物又はヒト細胞である。一部の実施形態において、真核細胞は、ヒト又はげっ歯類又はウシ細胞系又は細胞株である。このような細胞、細胞系、又は細胞株の例としては、限定されるものではないが、マウス骨髄腫(NSO)細胞系、チャイニーズハムスター卵母(CHO)細胞系、HT1080、H9、HepG2、MCF7、MDBK Jurkat、NIH3T3、PC12、BHK(ベビーハムスター腎臓細胞)、VERO、SP2/0、YB2/0、Y0、C127、L細胞、COS、例えば、COS1及びCOS7、QC1−3、HEK−293、VERO、PER.C6、HeLA、EB1、EB2、EB3、腫瘍溶解又はハイブリドーマ細胞系が挙げられる。一部の実施形態において、真核細胞は、CHO細胞系である。一部の実施形態において、真核細胞は、CHO細胞である。一部の実施形態において、細胞は、CHO−K1細胞、CHO−K1 SV細胞、DG44 CHO細胞、DUXB11 CHO細胞、CHOS、CHO GSノックアウト細胞、CHO FUT8 GSノックアウト細胞、CHOZN、又はCHO由来細胞である。CHO GSノックアウト細胞(例えば、GSKO細胞)は、例えば、CHO−K1 SV GSノックアウト細胞である。CHO FUT8ノックアウト細胞は、例えば、Potelligent(登録商標)CHOK1 SV(Lonza Biologics,Inc.)である。真核細胞は、鳥類細胞、細胞系又は細胞株、例えば、EBx(登録商標)細胞、EB14、EB24、EB26、EB66、又はEBvl3などでもよい。
一部の実施形態において、真核細胞は、ヒト細胞である。一部の実施形態において、ヒト細胞は、幹細胞である。幹細胞は、例えば、多能性幹細胞、例として、胚性幹細胞(ESC)、成体幹細胞、誘導多能性幹細胞(iPSC)、組織特異的幹細胞(例えば、造血幹細胞)及び間充織幹細胞(MSC)であり得る。一部の実施形態において、ヒト細胞は、本明細書に記載の細胞のいずれかの分化形態である。一部の実施形態において、真核細胞は、培養下の任意の初代細胞に由来する細胞である。
一部の実施形態において、真核細胞は、肝細胞、例えば、ヒト肝細胞、動物肝細胞、又は非実質細胞である。例えば、真核細胞は、付着型代謝試験用ヒト肝細胞、付着型誘導試験用ヒト肝細胞、付着型Qualyst Transporter Certified(商標)ヒト肝細胞、懸濁液試験用ヒト肝細胞(例として、10−ドナー及び20−ドナープール肝細胞)、ヒト肝臓クッパー細胞、ヒト肝臓星細胞、イヌ肝細胞(例として、単一及びプールビーグル肝細胞)、マウス肝細胞(例として、CD−1及びC57BI/6肝細胞)、ラット肝細胞(例として、Sprague−Dawley、Wistar Han、及びWistar肝細胞)、サル肝細胞(例として、カニクイザル又はアカゲザル肝細胞)、ネコ肝細胞(例として、ドメスティックショートヘア肝細胞)、及びウサギ肝細胞(例として、ニュージーランドホワイト肝細胞)であり得る。
一部の実施形態において、真核細胞は、植物細胞である。例えば、植物細胞は、作物植物、例えば、キャッサバ、トウモロコシ、モロコシ、コムギ、又はイネのものであり得る。植物細胞は、藻類、樹木、又は野菜のものであり得る。植物細胞は、単子葉若しくは双子葉植物のもの、又は作物若しくは穀類植物、生産植物、果実、若しくは野菜のものであり得る。例えば、植物細胞は、樹木、例えば、柑橘樹木、例えば、オレンジ、グレープフルーツ、又はレモン樹木;モモ又はネクタリン樹木;リンゴ又はナシ樹木;ナッツ樹木、例えば、アーモンド又はクルミ又はピスタチオ樹木;ナス科植物、例えば、ジャガイモ、ブラシカ属(Brassica)の植物、ラクツカ属(Lactuca)の植物;スピナシア属(Spinacia)の植物;カプシカム属(Capsicum)の植物;ワタ、タバコ、アスパラガス、ニンジン、キャベツ、ブロッコリー、カリフラワー、トマト、ナス、ショウガ、レタス、ホウレンソウ、イチゴ、ブルーベリー、ラズベリー、ブラックベリー、ブドウ、コーヒー、ココアなどのものであり得る。
一部の実施形態において、CRISPR−Cas系のガイドポリヌクレオチドは、ダイレクトリピート配列に結合している。ダイレクトリピート、又はDR配列は、非反復配列(スペーサー)の短鎖ストレッチが介在しているCRISPR遺伝子座中の反復配列のアレイである。スペーサー配列は、標的配列上のプロトスペーサー隣接モチーフ(PAM)を標的化する。CRISPR遺伝子座の非コード部分(すなわち、ガイドポリヌクレオチド及びtracrRNA)が転写される場合、転写産物は、DR配列において個々のスペーサー配列を含有する短鎖crRNAに開裂され、それがCas9ヌクレアーゼをPAMに指向する。一部の実施形態において、DR配列は、RNAである。一部の実施形態において、DR配列は、核酸によりコードされる。一部の実施形態において、DR配列は、ガイドポリヌクレオチドに結合している。一部の実施形態において、DR配列は、ガイドポリヌクレオチドのガイド配列に結合している。一部の実施形態において、DR配列は、二次構造を含む。一部の実施形態において、DR配列は、ステムループ構造を含む。一部の実施形態において、DR配列は、10〜20ヌクレオチドである。一部の実施形態において、DR配列は、少なくとも16ヌクレオチドである。一部の実施形態において、DR配列は、少なくとも16ヌクレオチドであり、単一ステムループを含む。一部の実施形態において、DR配列は、RNAアプタマーを含む。一部の実施形態において、DRの二次構造又はステムループは、開裂のためのヌクレアーゼにより認識される。一部の実施形態において、ヌクレアーゼは、リボヌクレアーゼである。一部の実施形態において、ヌクレアーゼは、RNアーゼIIIである。
CRISPR−Cas系の送達についての種々の手段が当分野において公知である。一部の実施形態において、本開示のCRISPR−Cas系は、送達粒子により送達する。送達粒子は、粒子を含む生物送達系又は配合物である。本明細書に定義される「粒子」は、約100ミクロン(μm)の最大直径を有する実体である。一部の実施形態において、粒子は、約10μmの最大直径を有する。一部の実施形態において、粒子は、約2000ナノメートル(nm)の最大直径を有する。一部の実施形態において、粒子は、約1000nmの最大直径を有する。一部の実施形態において、粒子は、約900nm、約800nm、約700nm、約600nm、約500nm、約400nm、約300nm、約200nm、又は約100nmの最大直径を有する。一部の実施形態において、粒子は、約25nm〜約200nmの直径を有する。一部の実施形態において、粒子は、約50nm〜150nmの直径を有する。一部の実施形態において、粒子は、約75nm〜約100nmの直径を有する。
送達粒子は、任意の形態、例として、限定されるものではないが、固体、半固体、エマルション、又はコロイド粒子で提供することができる。一部の実施形態において、送達粒子は、脂質ベース系、リポソーム、ミセル、マイクロベシクル、エキソソーム、又は遺伝子銃である。一部の実施形態において、送達粒子は、CRISPR−Cas系を含む。一部の実施形態において、送達粒子は、stiCas9及びガイドポリヌクレオチドを含むCRISPR−Cas系を含む。一部の実施形態において、送達粒子は、stiCas9及びガイドポリヌクレオチドを含むCRISPR−Cas系を含み、stiCas9及びガイドポリヌクレオチドは、複合体中に存在する。一部の実施形態において、送達粒子は、stiCas9、ガイドポリヌクレオチド、及びtracrRNAを含むポリヌクレオチドを含むCRISPR−Cas系を含む。一部の実施形態において、送達粒子は、stiCas9、ガイドポリヌクレオチド、及びtracrRNAを含むCRISPR−Cas系を含む。
一部の実施形態において、送達粒子は、脂質、糖、金属又はタンパク質をさらに含む。一部の実施形態において、送達粒子は、脂質エンベロープである。脂質エンベロープ又は脂質を含む送達粒子を使用するmRNAの送達は、例えば、Su et al.,“In vitro and in vivo mRNA delivery using lipid−enveloped pH−responsive polymer nanoparticles,”Molecular Pharmacology 8(3):774−784(2011)に記載されている。
一部の実施形態において、送達粒子は、糖ベース粒子、例えば、GalNAcである。糖ベース粒子は、国際公開第2014/118272号パンフレット及びNair et al.,Journal of the American Chemical Society 136(49):16958−16961(2014)に記載されており、それらのそれぞれは参照により全体として本明細書に組み込まれる。
一部の実施形態において、送達粒子は、ナノ粒子である。本開示に包含されるナノ粒子は、様々な形態で、例えば、固体ナノ粒子(例えば、金属、例えば、銀、金、鉄、チタン)、非金属、脂質ベース固体、ポリマー、ナノ粒子の懸濁液、又はそれらの組合せとして提供することができる。金属、誘電体、及び半導体ナノ粒子、並びにハイブリッド構造(例えば、コア−シェルナノ粒子)を調製することができる。半導体材料製のナノ粒子は、それらが電子エネルギーレベルの量子化が生じるほど十分に小さい場合(典型的には10nm未満)、標識量子ドットであってもよい。このようなナノスケール粒子は、生物医学用途において薬物担体又はイメージング剤として使用され、本開示における類似の目的に適合させることができる。
送達粒子の調製は、米国特許出願公開第2011/0293703号明細書、同第2012/0251560号明細書、及び同第2013/0302401号明細書;並びに米国特許第5,543,158号明細書、同第5,855,913号明細書、同第5,895,309号明細書、同第6,007,845号明細書、及び同第8,709,843号明細書にさらに記載されており、それらのそれぞれは参照により全体として本明細書に組み込まれる。
一部の実施形態において、ベシクルは、本開示のCRISPR−Cas系を含む。「ベシクル」は、脂質二重層により封入される流体を有する小部屋内の小型構造である。一部の実施形態において、本開示のCRISPR−Cas系は、ベシクルにより送達する。一部の実施形態において、ベシクルは、stiCas9及びガイドポリヌクレオチドを含む。一部の実施形態において、ベシクルは、stiCas9及びガイドポリヌクレオチドを含み、stiCas9及びガイドポリヌクレオチドは、複合体中に存在する。一部の実施形態において、ベシクルは、stiCas9、ガイドポリヌクレオチド、及びtracrRNAを含むポリヌクレオチドを含むCRISPR−Cas系を含む。一部の実施形態において、ベシクルは、stiCas9、ガイドポリヌクレオチド、及びtracrRNAを含むCRISPR−Cas系を含む。
一部の実施形態において、stiCas9及びガイドポリヌクレオチドを含むベシクルは、エキソソーム又はリポソームである。一部の実施形態において、ベシクルは、エキソソームである。一部の実施形態において、エキソソームを使用して本開示のCRISPR−Cas系を送達する。エキソソームは、RNA及びタンパク質を輸送し、RNAを脳及び他の標的器官に送達し得る内因性ナノベシクル(すなわち、約30〜約100nmの直径を有する)である。標的器官中への外因性生物材料の送達用の遺伝子操作エキソソームが、例えば、Alvarez−Erviti et al.,Nature Biotechnology 29:341(2011),El−Andaloussi et al.,Nature Protocols 7:2112−2116(2012)、及びWahlgren et al.,Nucleic Acids Research 40(17):el30(2012)により記載されており、それらのそれぞれは参照により全体として本明細書に組み込まれる。
一部の実施形態において、stiCas9及びガイドポリヌクレオチドを含むベシクルは、リポソームである。一部の実施形態において、リポソームを使用して本開示のCRISPR−Cas系を送達する。リポソームは、少なくとも1つの脂質二重層を有する球状ベシクル構造であり、栄養及び医薬物の投与用ベシクルとして使用することができる。リポソームは、リン脂質、特にホスファチジルコリンから構成されることが多いが、他の脂質、例えば、卵ホスファチジルエタノールアミンからも構成される。リポソームの型としては、限定されるものではないが、マルチラメラベシクル、スモールユニラメラベシクル、ラージユニラメラベシクル、及び渦巻き型ベシクルが挙げられる。例えば、Spuch and Navarro,“Liposomes for Targeted Delivery of Active Agents against Neurodegenerative Diseases(Alzheimer’s Disease and Parkinson’s Disease),Journal of Drug Delivery 2011,Article ID 469679(2011)参照。生物材料、例えば、CRISPR−Cas構成成分の送達用のリポソームは、例えば、Morrissey et al.,Nature Biotechnology 23(8):1002−1007(2005)、Zimmerman et al.,Nature Letters 441:111−114(2006)、及びLi et al.,Gene Therapy 19:775−780(2012)により記載されており、それらのそれぞれは参照により全体として本明細書に組み込まれる。
一部の実施形態において、Cas9をコードするヌクレオチド及びガイドポリヌクレオチドは、単一ベクター上に存在する。一部の実施形態において、Cas9をコードするヌクレオチド、ガイドポリヌクレオチド(又はガイドポリヌクレオチドに転写され得るヌクレオチド)、及びtracrRNAは、単一ベクター上に存在する。一部の実施形態において、Cas9をコードするヌクレオチド、ガイドポリヌクレオチド(又はガイドポリヌクレオチドに転写され得るヌクレオチド)、tracrRNA、及びダイレクトリピート配列は、単一ベクター上に存在する。一部の実施形態において、ベクターは、発現ベクターである。一部の実施形態において、ベクターは、哺乳動物発現ベクターである。一部の実施形態において、ベクターは、ヒト発現ベクターである。一部の実施形態において、ベクターは、植物発現ベクターである。
一部の実施形態において、Cas9をコードするヌクレオチド及びガイドポリヌクレオチドは、単一核酸分子である。一部の実施形態において、Cas9をコードするヌクレオチド、ガイドポリヌクレオチド、及びtracrRNAは、単一核酸分子である。一部の実施形態において、Cas9をコードするヌクレオチド、ガイドポリヌクレオチド、tracrRNA、及びダイレクトリピート配列は、単一核酸分子である。一部の実施形態において、単一核酸分子は、発現ベクターである。一部の実施形態において、単一核酸分子は、哺乳動物発現ベクターである。一部の実施形態において、単一核酸分子は、ヒト発現ベクターである。一部の実施形態において、単一核酸分子は、植物発現ベクターである。
一部の実施形態において、ウイルスベクターは、本開示のCRISPR−Cas系を含む。一部の実施形態において、本開示のCRISPR−Cas系は、ウイルスベクターにより送達する。一部の実施形態において、ウイルスベクターは、stiCas9及びガイドポリヌクレオチドを含む。一部の実施形態において、ウイルスベクターは、stiCas9及びガイドポリヌクレオチドを含み、stiCas9及びガイドポリヌクレオチドは、複合体中に存在する。一部の実施形態において、ウイルスベクターは、stiCas9、ガイドポリヌクレオチド、及びtracrRNAを含むポリヌクレオチドを含むCRISPR−Cas系を含む。一部の実施形態において、ウイルスベクターは、stiCas9、ガイドポリヌクレオチド、及びtracrRNAを含むCRISPR−Cas系を含む。一部の実施形態において、ウイルスベクターは、アデノウイルス、レンチウイルス、又はアデノ随伴ウイルスのものである。ウイルスベクターの例は、本明細書に提供される。
一部の実施形態において、アデノ随伴ウイルス(AAV)及び/又はレンチウイルスは、本明細書に記載のCRISPR−Cas系のエレメントを含むウイルスベクターとして使用することができる。本開示の一部の実施形態において、Casタンパク質は、ウイルスベクターにより形質導入された細胞により細胞内で発現される。
本開示により想定されるものを含む多くの治療方針のため、Casタンパク質発現は、一過的に要求され得るにすぎない。結果として、本開示の一部の実施形態において、細胞中へのCasタンパク質の送達は、非組込みウイルスベクターを使用して達成される。他の実施形態において、CRISPR−Cas系構成成分の発現は、例えば、標的細胞のゲノム中に永久的に組み込まれる遺伝子回路において使用される場合、長期間のために要求される。このような用途は、Agustin−Pavon,et al.,“Synthetic biology and therapeutic strategies for the degenerating brain,”Bioessays 36(10):979−990(2014)により考察されており、それは参照により全体として本明細書に組み込まれる。
一部の実施形態において、本開示のCasタンパク質及び方法は、エクスビボ遺伝子編集、例えば、CAR−T型療法において使用される。これらの実施形態は、ヒトドナーからの細胞の改変を含み得る。これらの例において、ウイルスベクターを使用することもでき;しかしながら、培養細胞中にCasタンパク質を(インビトロ転写ガイドRNA及びドナーDNAとともに)直接形質移入する追加の任意選択が存在する。
一部の実施形態において、本開示は、(a)粘着末端を生成し得るCas9エフェクタータンパク質(stiCas9)、及び(b)stiCas9との複合体を形成し、ガイド配列(ガイド配列は、真核細胞中の標的配列とハイブリダイズし得る)を含むガイドポリヌクレオチドを含み、複合体は天然に生じないCRISPR−Cas系を含む真核細胞を提供する。一部の実施形態において、真核細胞は、本開示のCRISPR−Cas系を含むベクターを含む。
一部の実施形態において、真核細胞は、動物又はヒト細胞である。一部の実施形態において、真核細胞は、動物細胞である。一部の実施形態において、真核細胞は、ヒト細胞、例として、ヒト幹細胞である。一部の実施形態において、真核細胞は、植物細胞である。種々の型の真核細胞の例は、本明細書に提供される。
一部の実施形態において、本開示は、粘着末端を生成し得るCas9エフェクタータンパク質(stiCas9)(Cas9エフェクタータンパク質は、II−B型CRISPR系を有する細菌種に由来する)を含むCRISPR−Cas系を含む真核細胞を提供する。一部の実施形態において、真核細胞は、少なくとも1E−10、少なくとも1E−9、少なくとも1E−8、少なくとも1E−7、少なくとも1E−6、少なくとも1E−5、少なくとも1E−4、少なくとも1E−3、少なくとも1E−2,又は少なくとも1E−1のE値カットオフを用いてTIGR03031タンパク質ファミリーにマッチするドメインを含むstiCas9を含む。一部の実施形態において、真核細胞は、配列番号10〜97又は192〜195のいずれか1つと少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、又は少なくとも99%の配列類似性のポリペプチド配列を含むstiCas9を含む。一部の実施形態において、真核細胞は、配列番号10〜97又は192〜195のいずれか1つと少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、又は100%の同一性を有するポリペプチド配列を含むstiCas9を含む。
一部の実施形態において、本開示のCas9タンパク質は、1つ以上の異種タンパク質ドメイン(例えば、Cas9タンパク質の他に約又は少なくとも約1、2、3、4、5、6、7、8、9、若しくは10個以上のドメイン)を含む融合タンパク質の一部である。Cas9融合タンパク質は、任意の追加のタンパク質配列、及び場合により、任意の2つのドメイン間のリンカー配列を含み得る。Cas9タンパク質に融合させることができるタンパク質ドメインの例としては、限定されるものではないが、エピトープタグ、レポーター遺伝子配列、並びに以下の活性の1つ以上:メチラーゼ活性、デメチラーゼ活性、転写活性化活性、転写抑制活性、転写放出因子活性、ヒストン修飾活性、RNA開裂活性、及び核酸結合活性を有するタンパク質ドメインが挙げられる。エピトープタグの非限定的な例としては、ヒスチジン(His)タグ、V5タグ、FLAGタグ、インフルエンザヘマグルチニン(HA)タグ、Mycタグ、VSV−Gタグ、及びチオレドキシン(Trx)タグが挙げられる。レポーター遺伝子の例としては、限定されるものではないが、グルタチオン−5−トランスフェラーゼ(GST)、セイヨウワサビペルオキシダーゼ(HRP)、クロラムフェニコールアセチルトランスフェラーゼ(CAT)、ベータ−ガラクトシダーゼ、ベータ−グルクロニダーゼ、ルシフェラーゼ、緑色蛍光タンパク質(GFP)、HcRed、DsRed、シアン蛍光タンパク質(CFP)、黄色蛍光タンパク質(YFP)、自己蛍光タンパク質、例として、青色蛍光タンパク質(BFP)、及びmCherryが挙げられる。一部の実施形態において、Cas9タンパク質は、DNA分子に結合し、又は他の細胞分子に結合するタンパク質又はタンパク質の断片、例として、限定されるものではないが、マルトース結合タンパク質(MBP)、S−タグ、Lex A DNA結合ドメイン(DBD)、GAL4 DNA結合ドメイン、及び単純ヘルペスウイルス(HSV)BP16タンパク質に融合している。Cas9タンパク質を含む融合タンパク質の一部を形成し得る追加のドメインは、米国特許出願公開第20110059502号明細書に記載されており、それは参照により全体として本明細書に組み込まれる。一部の実施形態において、タグ付けされたCas9タンパク質を使用して標的配列の局在を同定する。
一部の実施形態において、Cas9タンパク質は、誘導性系の構成成分を形成し得る。系の誘導性質は、エネルギーの形態を使用する遺伝子編集又は遺伝子発現の時空間制御を可能とする。エネルギーの形態としては、限定されるものではないが、電磁放射線、音響エネルギー、化学エネルギー、及び熱エネルギーを挙げることができる。誘導性系の非限定的な例としては、テトラサイクリン誘導性プロモーター(Tet−On又はTet−Off)、小分子ツーハイブリッド転写活性化系(FKBP、ABAなど)、又は光誘導性系(フィトクロム、LOVドメイン、又はクリプトクロム)が挙げられる。一部の実施形態において、Cas9タンパク質は、配列特異的に転写活性の変化を指向するための光誘導性転写エフェクター(LITE)の一部である。光の構成成分は、Cas9タンパク質、光応答性シトクロムヘテロ二量体(例えば、アラビドプシス・タリアナ(Arabidopsis thaliana)からのもの)、及び転写活性化/抑制ドメインを含み得る。誘導性DNA結合タンパク質及びそれらの使用方法のさらなる例は、国際特許出願公開の国際公開第2014/018423号パンフレット及び国際公開第2014/093635号パンフレット;米国特許第8,889,418号明細書及び同第8,895,308号明細書;並びに米国特許出願公開第2014/0186919号明細書、同第2014/0242700号明細書、同第2014/0273234号明細書、及び同第2014/0335620号明細書に提供されており、それらのそれぞれは参照により全体として本明細書に組み込まれる。
部位特異的改変の方法
一部の実施形態において、本開示は、真核細胞中の標的配列の部位特異的改変を提供する方法であって、(1)細胞中に、(a)粘着末端を生成し得るCas9エフェクタータンパク質(stiCas9)、及び(b)stiCas9との複合体を形成し、ガイド配列(ガイド配列は、真核細胞中の標的配列とハイブリダイズし得るが、細菌細胞中の配列にハイブリダイズしない)を含むガイドポリヌクレオチド(複合体は天然に生じない)を導入すること;(2)Cas9エフェクタータンパク質及びガイドポリヌクレオチドにより標的配列中の粘着末端を生成すること;並びに(3)(a)粘着末端を一緒に、又は(b)目的ポリヌクレオチド配列(SoI)を粘着末端にライゲートすることを含み、それにより標的配列を改変する方法を提示する。
標的配列の「改変」は、核酸の単一ヌクレオチド置換、複数ヌクレオチド置換、挿入(すなわち、ノックイン)及び欠失(すなわち、ノックアウト)、フレームシフト突然変異、及び他の核酸改変を包含する。
一部の実施形態において、改変は、標的配列の少なくとも一部の欠失である。標的配列は、2つの異なる部位において開裂させ、相補的粘着末端を生成することができ、相補的粘着末端を再ライゲートさせ、それによりその2つの部位間の配列部分を除去することができる。
一部の実施形態において、改変は、標的配列の突然変異である。真核細胞における部位特異的突然変異誘発は、目的突然変異を含有する外因性ポリヌクレオチドテンプレート(「ドナーポリヌクレオチド」又は「ドナーベクター」とも呼ばれる)の相同組換えを促進する部位特異的ヌクレアーゼの使用により達成される。一部の実施形態において、目的配列(SoI)は、目的突然変異を含む。
一部の実施形態において、改変は、標的配列中への目的配列(SoI)の挿入である。SoIは、外因性ポリヌクレオチドテンプレートとして導入することができる。一部の実施形態において、外因性ポリヌクレオチドテンプレートは、粘着末端を含む。一部の実施形態において、外因性ポリヌクレオチドテンプレートは、標的配列中の粘着末端に相補的な粘着末端を含む。
外因性ポリヌクレオチドテンプレートは、任意の好適な長さ、例えば、約又は少なくとも約10、15、20、25、50、75、100、150、200、250、500若しくは1000以上のヌクレオチド長さのものであり得る。一部の実施形態において、外因性ポリヌクレオチドテンプレートは、標的配列を含むポリヌクレオチドの一部に相補的である。外因性ポリヌクレオチドテンプレートは、最適にアラインされる場合、標的配列の1つ以上のヌクレオチド(例えば、約又は少なくとも約1、5、10、15、20、25、30、35、40、45、50、60、70、80、90、若しくは100以上のヌクレオチド)と重複する。一部の実施形態において、外因性ポリヌクレオチドテンプレート及び標的配列を含むポリヌクレオチドは、最適にアラインされる場合、外因性ポリヌクレオチドテンプレートの最近傍ヌクレオチドは、標的配列から約1、5、10、15、20、25、50、75、100、200、300、400、500、100、1500、2000、2500、5000、10000以上のヌクレオチド以内に存在する。
一部の実施形態において、外因性ポリヌクレオチドは、DNA、例えば、DNAプラスミド、細菌人工染色体(BAC)、酵母人工染色体(YAC)、ウイルスベクター、線状一本鎖又は二本鎖DNA片、オリゴヌクレオチド、PCR断片、ネイキッド核酸、又は送達ビヒクル、例えば、リポソームと複合体化している核酸などである。
一部の実施形態において、外因性ポリヌクレオチドは、細胞の内因性DNA修復経路を使用して標的配列中に挿入される。内因性DNA修復経路としては、非相同末端結合(NHEJ)経路、マイクロホモロジー媒介末端結合(MMEJ)経路、及び相同性配向型修復(HDR)経路が挙げられる。NHEJ、MMEJ、及びHDR経路は、二本鎖DNA分解を修復する。NHEJにおいて、相同テンプレートは、DNAにおける分解の修復に要求されない。NHEJ修復は、エラープローンであり得るが、エラーは、DNA分解が適合性オーバーハングを含む場合に減少する。NHEJ及びMMEJは、それらのそれぞれに関与するDNA修復酵素の異なるサブセットにより機序的に区別されるDNA修復経路である。エラープローンと同程度に正確であり得るNHEJとは異なり、MMEJは、常にエラープローンであり、修復下の部位における欠失及び挿入の両方をもたらす。MMEI関連欠失は、二本鎖分解の両側におけるマイクロホモロジー(2〜10塩基対)に起因する。対照的に、HDRは、修復を指向するための相同テンプレートを要求するが、HDR修復は、典型的には、高いフィデリティであり、低いエラープローンである。一部の実施形態において、NHEJ及びMMEJ修復のエラープローン性質を活用して標的配列中の非特異的ヌクレオチド置換を導入する。一部の実施形態において、stiCas9は、HDR修復を容易にする様式で標的配列を切断する。
修復プロセスの間、SoIを含む外因性ポリヌクレオチドテンプレートを標的配列中に導入することができる。一部の実施形態において、上流配列及び下流配列によりフランキングされたSoIを含む外因性ポリヌクレオチドテンプレートを細胞中に導入し、上流及び下流配列は、標的配列中の組込みの部位のいずれかの側と配列類似性を共有する。一部の実施形態において、SoIを含む外因性ポリヌクレオチドは、例えば、突然変異遺伝子を含む。一部の実施形態において、外因性ポリヌクレオチドは、細胞に対して内因性又は外因性である配列を含む。一部の実施形態において、SoIは、タンパク質をコードするポリヌクレオチド、又は非コード配列、例えば、マイクロRNAなどを含む。一部の実施形態において、SoIは、調節エレメントに作動可能に結合している。一部の実施形態において、SoIは、調節エレメントである。一部の実施形態において、SoIは、耐性カセット、例えば、抗生物質に対する耐性を付与する遺伝子を含む。一部の実施形態において、SoIは、野生型標的配列の突然変異を含む。一部の実施形態において、SoIは、フレームシフト突然変異又はヌクレオチド置換を作出することにより標的配列を破壊し、又は補正する。一部の実施形態において、SoIは、マーカーを含む。標的配列中へのマーカーの導入は、標的化組込みのスクリーニングを容易にし得る。一部の実施形態において、マーカーは、制限部位、蛍光タンパク質、又は選択マーカーである。一部の実施形態において、SoIは、SoIを含むベクターとして導入する。
外因性ポリヌクレオチドテンプレート中の上流及び下流配列は、標的配列及び外因性ポリヌクレオチド間の相同組換えを促進するように選択される。上流配列は、組込みのための標的化部位の上流の配列(すなわち、標的配列)との配列類似性を共有する核酸配列である。同様に、下流配列は、組込みのための標的化部位の下流の配列との配列類似性を共有する核酸配列である。したがって、一部の実施形態において、SoIを含む外因性ポリヌクレオチドテンプレートは、上流及び下流配列において相同組換えにより標的配列中に挿入する。一部の実施形態において、外因性ポリヌクレオチドテンプレート中の上流及び下流配列は、標的化ゲノム配列の上流及び下流配列とそれぞれ少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、又は100%の配列同一性を有する。一部の実施形態において、上流又は下流配列は、約20〜2000塩基対、又は約50〜1750塩基対、又は約100〜1500塩基対、又は約200〜1250塩基対、又は約300〜1000塩基対、又は約400〜約750塩基対、又は約500〜600塩基対を有する。一部の実施形態において、上流又は下流配列は、約50、約100、約250、約500、約100、約1250、約1500、約1750、約2000、約2250、又は約2500塩基対を有する。
一部の実施形態において、標的配列中の改変は、細胞中の標的配列の発現の不活性化である。例えば、標的配列へのCRISPR複合体の結合時、標的配列は不活性化され、その結果、その配列は転写されず、コードされるタンパク質は産生されず、又は配列は、その野生型配列が機能するようには機能しない。例えば、タンパク質又はマイクロRNAコード配列は不活性化され得、その結果、タンパク質は産生されない。
一部の実施形態において、調節配列は、それが調節配列としてもはや機能しないように不活性化させることができる。調節配列の例としては、本明細書に記載のプロモーター、転写終結因子、エンハンサー、及び他の調節エレメントが挙げられる。不活性化標的配列としては、欠失突然変異(すなわち、1つ以上のヌクレオチドの欠失)、挿入突然変異(すなわち、1つ以上のヌクレオチドの挿入)、又はナンセンス突然変異(すなわち、終止コドンが導入されるような別のヌクレオチドでの単一ヌクレオチドの置換)を挙げることができる。一部の実施形態において、標的配列の不活性化は、標的配列の「ノックアウト」をもたらす。
一部の実施形態において、stiCas9及びガイドポリヌクレオチドは複合体を形成し、ガイドポリヌクレオチドは改変すべき標的配列にハイブリダイズする。一部の実施形態において、stiCas9は、ガイドポリヌクレオチドにハイブリダイズされる標的配列中の粘着末端を生成する。
方法の実施形態において、stiCas9により生成される粘着末端は、3〜40ヌクレオチドの一本鎖ポリヌクレオチドオーバーハングを含む。一部の実施形態において、stiCas9により生成される粘着末端は、4〜20ヌクレオチドの一本鎖ポリヌクレオチドオーバーハングを含む。一部の実施形態において、stiCas9により生成される粘着末端は、5〜15ヌクレオチドの一本鎖ポリヌクレオチドオーバーハングを含む。一部の実施形態において、stiCas9により生成される粘着末端は、5’オーバーハングである。
方法の実施形態において、stiCas9は、II−B型CRISPR系を有する細菌種に由来する。本明細書において考察されるII−B型Cas9タンパク質は、TIGR03031 TIGRFAMタンパク質ファミリーに属する。したがって、一部の実施形態において、本開示のstiCas9は、1E−5プロファイルカットオフ値を用いてTIGR03031タンパク質ファミリーにマッチするドメインを含む。一部の実施形態において、本開示のstiCas9は、1E−10プロファイルカットオフ値を用いてTIGR03031タンパク質ファミリーにマッチするドメインを含む。一部の実施形態において、本開示のstiCas9は、少なくとも1E−10、少なくとも1E−9、少なくとも1E−8、少なくとも1E−7、少なくとも1E−6、少なくとも1E−5、少なくとも1E−4、少なくとも1E−3、少なくとも1E−2、又は少なくとも1E−1のE値カットオフを用いてTIGR03031タンパク質ファミリーにマッチするドメインを含む。
方法の実施形態において、II−B型Cas9タンパク質は、II−B型CRISPR系を有する任意の種に由来する。一部の実施形態において、II−B型Cas9は、以下の細菌種に由来する:レジオネラ・ニューモフィラ(Legionella pneumophila)、フランシセラ・ノビシダ(Francisella novicida)、ガンマプロテオバクテリア(gamma proteobacterium)HTCC5015、パラサテレラ・エキスクレメンティホミニス(Parasutterella excrementihominis)、サテレラ・ワズワーセンシス(Sutterella wadsworthensis)、スルフロスピリラム属種(Sulfurospirillum sp.)SCADC、ルミノバクター属種(Ruminobacter sp.)RM87、バークホルデリア・バクテリウム(Burkholderiales bacterium)1_1_47、バクテロイデス・オーラル・タクソン(Bacteroidetes oral taxon)274株F0058、ウォリネラ・スクシノゲネス(Wolinella succinogenes)、バークホルデリア・バクテリウム(Burkholderiales bacterium)YL45、ルミノバクター・アミロフィラス(Ruminobacter amylophilus)、カンピロバクター属種(Campylobacter sp.)P0111、カンピロバクター属種(Campylobacter sp.)RM9261、カンピロバクター・ラニエナエ(Campylobacter lanienae)株RM8001、カンプリロバクター・ラニエナエ(Camplylobacter lanienae)株P0121、ツリシモナス・ムリス(Turicimonas muris)、レジオネラ・ロンジニエンシス(Legionella londiniensis)、サリニビブリオ・シャルメンシス(Salinivibrio sharmensis)、レプトスピラ属種(Leptospira sp.)単離株FW.030、モリテラ属種(Moritella sp.)単離株NORP46、エンドゾイコモナス属種(Endozoicomonassp.)S−B4−1U、タミルナドゥイバクター・サリナス(Tamilnaduibacter salinus)、ビブリオ・ナトリエゲンス(Vibrio natriegens)、アルコバクター・スキロウイイ(Arcobacter skirrowii)、フランシセラ・フィロミラギア(Francisella philomiragia)、フランシセラ・ヒスパニエンシス(Francisella hispaniensis)、又はパレンドゾイコモナス・ハリクロナエ(Parendozoicomonas haliclonae)。
方法の実施形態において、ガイドポリヌクレオチドは、ガイドRNAである。一部の実施形態において、ガイドポリヌクレオチドは、少なくとも2つのヌクレオチドセグメント:少なくとも1つの「DNA結合セグメント」又は「ガイド配列」及び少なくとも1つの「ポリペプチド結合セグメント」を含む。一部の実施形態において、ガイドポリヌクレオチドのDNA結合セグメントは真核細胞中の標的配列とハイブリダイズするが、細菌細胞中の配列とハイブリダイズしない。一部の実施形態において、ガイドポリヌクレオチドのポリペプチド結合セグメントは、Cas9に結合する。一部の実施形態において、ガイドポリヌクレオチドのポリペプチド結合セグメントは、stiCas9に結合する。
方法の実施形態において、ガイドポリヌクレオチドは、10〜35ヌクレオチドである。一部の実施形態において、ガイドポリヌクレオチドは、15〜30ヌクレオチドである。一部の実施形態において、ガイドポリヌクレオチドは、20〜25ヌクレオチドである。
方法の実施形態において、stiCas9及びガイドポリヌクレオチドは、複合体を形成し得る。一部の実施形態において、複合体は、複合体の全ての構成成分が一緒に存在する場合に形成され、すなわち、自己集合複合体である。一部の実施形態において、複合体は、複合体の異なる構成成分間の化学的相互作用、例えば、水素結合などを介して形成される。一部の実施形態において、ガイドポリヌクレオチドは、stiCas9によるガイドポリヌクレオチドの二次構造認識を介してstiCas9との複合体を形成する。一部の実施形態において、stiCas9タンパク質は、それがガイドポリヌクレオチドとの複合体を形成するまで不活性であり、すなわち、ヌクレアーゼ活性を示さない。ガイドRNAの結合は、stiCas9の立体構造変化を誘導してstiCas9を不活性形態から活性、すなわち、触媒的に活性な形態に変換する。方法の実施形態において、stiCas9及びガイドポリヌクレオチドの複合体は天然に生じない。
方法の実施形態において、stiCas9により生成される粘着末端は、一緒にライゲートさせる(すなわち、一緒に化学的に結合させる)。ライゲーションは、例えば、DNAリガーゼ、例えば、T4リガーゼ又はDNAリガーゼIVにより実施することができる。一部の実施形態において、粘着末端は、1つ以上のヌクレオチド置換を導入するエラープローンリガーゼと一緒にライゲートさせる。一部の実施形態において、目的ポリヌクレオチド配列(SoI)を粘着末端にライゲートさせる。一部の実施形態において、SoIは、目的突然変異を含む。
方法の実施形態において、粘着末端は、標的配列中で生成される粘着末端に相補的なSoI中で生成させる。一部の実施形態において、SoI中の粘着末端は、stiCas9により生成させる。一部の実施形態において、SoIは、細胞の内因性DNA修復経路を使用して粘着末端中にライゲートさせる。内因性DNA修復経路は、本明細書に記載される。
一部の実施形態において、本開示は、真核細胞中の標的配列の部位特異的改変を提供する方法であって、(1)細胞中に、(a)粘着末端を生成し得るCas9エフェクタータンパク質(stiCas9)をコードするヌクレオチド配列、及び(b)stiCas9との複合体を形成し、ガイド配列(ガイド配列は、真核細胞中の標的配列とハイブリダイズし得るが、細菌細胞中の配列にハイブリダイズしない)を含むガイドポリヌクレオチド(複合体は天然に生じない)を導入すること;(2)Cas9エフェクタータンパク質及びガイドポリヌクレオチドにより標的配列中の粘着末端を生成すること;並びに(3)(a)粘着末端を一緒に、又は(b)目的ポリヌクレオチド配列(SoI)を粘着末端にライゲートすることを含み、それにより標的配列を改変する方法を提供する。
方法の実施形態においてstiCas9は、ヌクレオチド配列によりコードされる。一部の実施形態において、ヌクレオチドは、DNAである。一部の実施形態において、stiCas9タンパク質は、配列番号10〜97又は192〜195のいずれかのヌクレオチド配列と少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、又は100%の同一性を有する配列を含むドメインを含む。
方法の実施形態において、本開示のCRISPR−Cas系は、tracrRNAをさらに含む。一部の実施形態において、ガイドRNAは、crRNA/tracrRNAハイブリッドを含む。一部の実施形態において、ガイドRNAのtracrRNA構成成分は、Cas9タンパク質を活性化させる。方法の実施形態において、stiCas9、ガイドポリヌクレオチド、及びtracrRNAは、複合体を形成し得る。一部の実施形態において、stiCas9、ガイドポリヌクレオチド、及びtracrRNAの複合体は天然に生じない。
方法の実施形態において、stiCas9及びガイドポリヌクレオチドを含む複合体は、プロトスペーサー隣接モチーフ(PAM)の10ヌクレオチド以内の部位において開裂させ得る。一部の実施形態において、stiCas9及びガイドポリヌクレオチドを含む複合体は、PAMの5ヌクレオチド以内の部位において開裂させ得る。一部の実施形態において、stiCas9及びガイドポリヌクレオチドを含む複合体は、PAMの3ヌクレオチド以内の部位において開裂させ得る。一部の実施形態において、PAMは、標的配列の下流(すなわち、3’方向)に存在する。一部の実施形態において、PAMは、標的配列の上流(すなわち、5’方向)に存在する。一部の実施形態において、PAMは、標的配列内に局在する。
方法の実施形態において、PAMは、3’Gリッチモチーフを含む。一部の実施形態において、PAM配列は、NGG(Nは、A、C、T、U、又はGである)である。一部の実施形態において、PAM配列は、NGA(Nは、A、C、T、U、又はGである)である。一部の実施形態において、PAM配列は、YG(Yは、ピリミジン(すなわち、C、T、又はU)である)である。方法の実施形態において、標的配列は、PAMの5’に存在し、PAMは、3’Gリッチモチーフを含む。一部の実施形態において、標的配列は、PAMの5’に存在し、PAM配列は、NGG(Nは、A、C、T、U、はGである)である。
方法の実施形態において、真核細胞は、動物又はヒト細胞である。一部の実施形態において、真核細胞は、動物細胞である。一部の実施形態において、真核細胞は、ヒト細胞、例として、ヒト幹細胞である。一部の実施形態において、真核細胞は、植物細胞である。種々の型の真核細胞の例は、本明細書に提供される。方法の実施形態において、stiCas9及びガイドポリヌクレオチドは、真核細胞中に、送達粒子を介して導入する。方法の実施形態において、stiCas9及びガイドポリヌクレオチドは、真核細胞中に、ベシクルを介して導入する。方法の実施形態において、stiCas9及びガイドポリヌクレオチドは、真核細胞中に、ベクターを介して導入する。方法の実施形態において、stiCas9及びガイドポリヌクレオチドは、真核細胞中に、ウイルスベクターを介して導入する。方法の実施形態において、stiCas9及びガイドポリヌクレオチドを含む複合体の構成成分をコードするポリヌクレオチドは、1つ以上のベクター上に導入する。ベクター及び細胞中へのベクター送達の方法(例えば、形質移入)の例は、本明細書に提供される。
一部の実施形態において、本開示の方法は、真核細胞中にエキソヌクレアーゼを導入してstiCas9から生成されたオーバーハングを除去することをさらに含む。一部の実施形態において、エキソヌクレアーゼは、5’〜3’エキソヌクレアーゼである。一部の実施形態において、エキソヌクレアーゼは、3’〜5’エキソヌクレアーゼである。一部の実施形態において、エキソヌクレアーゼは、方法のライゲーションステップ前に添加する。一部の実施形態において、エキソヌクレアーゼは、方法のライゲーションステップに代えて添加する。5’〜3’エキソヌクレアーゼの非限定的な例としては、ラムダエキソヌクレアーゼ、RecJ、エキソヌクレアーゼV、エキソヌクレアーゼVIII、T5エキソヌクレアーゼ、T7エキソヌクレアーゼ、Artemis、及びCas4が挙げられる。3’〜5’エキソヌクレアーゼの非限定的な例としては、TREX1、TREX2、ウェルナー症候群(WRN)タンパク質、p53、MRE11、RAD1、RAD9、APE1、及びVDJPタンパク質が挙げられる。一部の実施形態において、エキソヌクレアーゼは、Cas4、Artemis、又はTREX2である。
Cas4、Artemis、TREX2、又は他の類似のエキソヌクレアーゼの導入は、ライゲーションが生じる前の粘着末端の末端プロセシングを可能とし、それにより、正確なライゲーションの機会を減少させ、したがって、突然変異誘発の効率を増加させ、内因性DNA修復酵素と競合して他の修復経路(例えば、NHEJ又はMMEJ)の1つに修復を偏らせ、突然変異パターンをモジュレートする。例えば、Cas4、Artemis、又はTREX2は、内因性末端プロセシング酵素と競合し、したがって、エラープローン修復を促進することにより突然変異誘発の効率を増加させ得る。Cas4、Artemis、又はTREX2は、一本鎖オーバーハングを伸長させることによりHDR修復も容易にし得る。Cas4、Artemis、又はTREX2についてのさらなる役割は、例えば、より望ましいインデルへの突然変異パターンの変化を含み得る。
部位特異的遺伝子挿入の方法(ObLiGaRe 2.0)
一部の実施形態において、本開示は、米国特許第9,567,608号明細書に記載のObLiGaRe法の派生法に基づき細胞中の染色体中に目的配列(SoI)を導入する方法を提供する。ObLiGaRe(偏性ライゲーションゲート型組換え)は、Latin verb obligare(直接ライゲートすること)の語源的意味を反映する。これは、様々な細胞系において広く適用可能であり、遺伝子操作のための追加のアプローチを提供する。米国特許第9,567,608号明細書はジンクフィンガーヌクレアーゼを用いて標的配列を標的化し、開裂させる一方、本明細書の開示は、第1のCas9−エンドヌクレアーゼ二量体、例えば、Cas9−FokI、及び第2のCas9−エンドヌクレアーゼ二量体の使用を提供する。本明細書に記載の部位特異的遺伝子挿入の方法は、米国特許第9,567,608号明細書に記載のObLiGaRe法とそれを区別するために略語として「ObLiGaRe 2.0」と情報的に称される。
一部の実施形態において、本開示は、細胞中の染色体中に目的配列(SoI)を導入する方法であって、染色体は、領域1及び領域2を含む標的配列(TSC)を含み、細胞中に、(a)標的配列(TSV)を含むベクター(TSVは、領域2及び領域1並びにSoIを含む);(b)TSC中の粘着末端を生成し得る第1のCas9−エンドヌクレアーゼ二量体(第1のCas9−エンドヌクレアーゼ二量体の第1の単量体は、TSCの領域1において開裂させ、第1のCas9−エンドヌクレアーゼ二量体の第2の二量体は、領域2において開裂させる);及び(c)TSV中の粘着末端を生成し得る第2のCas9−エンドヌクレアーゼ二量体(第2のCas9−エンドヌクレアーゼ二量体の第1の単量体は、TSVの領域2において開裂させ、第2のCas9−エンドヌクレアーゼ二量体の第2の単量体は、領域1において開裂させる)を導入することを含み、(a)のベクター、(b)の第1のCas9−エンドヌクレアーゼ二量体及び(c)の第2のCas9−エンドヌクレアーゼ二量体の導入は、細胞の染色体中へのSoIの挿入をもたらす方法を提供する。
一部の実施形態において、本開示は、細胞中の染色体中に目的配列(SoI)を導入する方法であって、染色体は、領域1及び領域2を含む標的配列(TSC)を含み、細胞中に、(a)標的配列(TSV)(TSVは、領域2及び領域1並びにSoIを含む)を含むベクター(ベクターは、粘着末端を含む);及び(b)TSC中の粘着末端を生成し得る第1のCas9−エンドヌクレアーゼ二量体(第1のCas9−エンドヌクレアーゼ二量体の第1の単量体は、TSCの領域1において開裂させ、第1のCas9−エンドヌクレアーゼ二量体の第2の単量体は、領域2において開裂させる)を導入することを含み;(a)のベクター及び(b)の第1のCas9−エンドヌクレアーゼ二量体の導入は、細胞の染色体中へのSoIの挿入をもたらす方法を対象とする。
本開示の方法は、ベクター(又は「ドナープラスミド」)中の相同性を用いない効率的及び正確な遺伝子標的化を提供する。本開示の方法は、非相同末端結合(NHEJ)又はマイクロホモロジー媒介末端結合(MMEJ)経路を使用する部位特異的遺伝子挿入の方針を提供する。ベクター中の開裂部位(すなわち、領域1及び領域2)の設計及び局在は、ゲノム部位中の開裂部位(すなわち、領域1及び領域2)、すなわち、細胞の染色体中の標的配列(TSC)中のベクターの正確な末端結合を達成するために十分なものである。
一部の実施形態において、TSVは、環状ベクター、すなわち、プラスミドである。一部の実施形態において、TSVは、線状化ベクター又は線状DNA、例えば、PCR産物、又は開裂後にTSCに相補的な末端を有するアニール化オリゴヌクレオチド二本鎖などである。一部の実施形態において、TSVは、粘着末端を含む。一部の実施形態において、TSV中の粘着末端は、Cas9−エンドヌクレアーゼ二量体により生成される。一部の実施形態において、TSV中の粘着末端は、細胞中へのTSVの導入前に生成される。一部の実施形態において、TSV中の粘着末端は、細胞中へのTSVの導入後に生成される。
一部の実施形態において、染色体上の標的配列(TSC)は、5’−3’様式で領域1及び領域2を含む。本明細書において使用される配列の方向性(例えば、5’−3’)は、二本鎖DNA配列の「コード」鎖又は「センス」鎖(典型的には、二本鎖DNA配列のトップ鎖として提示される)を読み取る場合の方向を指す。
図12は、本開示の実施形態を表す。図12において、TSCは、「ゲノム」枠(左側)中の配列により表され、「コード」鎖(トップ鎖として示される)上の領域1及び領域2(その一部は領域1と重複している)を含む。
図12の「ゲノム」枠に示されるとおり、領域1の上流(すなわち、コード鎖に関して5’)及び「非コード」又は「アンチセンス」DNA鎖(ボトム鎖として示される)上に第1のPAM配列が存在する。非コード鎖は、第1のガイドポリヌクレオチド(「gRNA1」)にハイブリダイズする領域を含む。gRNA1は、第1のPAM配列の上流(すなわち、非コード鎖に関して5’)の配列にハイブリダイズする。このgRNA1ハイブリダイゼーション配列は、領域1の一部及びさらに領域1外側の数ヌクレオチドを含む。矢印の方向により示されるとおり、gRNA1は、標的配列の非コード鎖とハイブリダイズする。
図12の「ゲノム」枠に示されるとおり、領域2の下流(すなわち、コード鎖に関して3’)及びコード鎖上に第2のPAM鎖が存在する。コード鎖は、第2のガイドポリヌクレオチド(「gRNA2」)にハイブリダイズする領域を含む。gRNA2は、第2のPAM配列の上流(すなわち、コード鎖に関して5’)の配列にハイブリダイズする。このgRNA2ハイブリダイゼーション配列は、領域2の一部及びさらに領域2外側の数ヌクレオチドを含む。矢印の方向により示されるとおり、gRNA2は、標的配列のコード鎖とハイブリダイズする。
一部の実施形態において、ベクター上の標的配列(TSV)は、5’−3’様式で領域2、その直後に続く領域1、及びSoIを含む。図12は、本開示の実施形態を表す。図12において、TSVは、「ベクター」枠(右側)中の配列により表され、「コード」鎖上の領域2、それに続く領域1(その2つの領域間にはいかなる重複もない)を含む。
図12の「ベクター」枠に示されるとおり、領域2の上流(すなわち、コード鎖に関して5’)及び「非コード」上に第3のPAM配列が存在する。非コード鎖は、第3のガイドポリヌクレオチド(「gRNA3」)にハイブリダイズする領域を含む。gRNA3は、第3のPAM配列の上流(すなわち、非コード鎖に関して5’)の配列にハイブリダイズする。このgRNA3ハイブリダイゼーション配列は、領域2の一部及びさらに領域2外側の数ヌクレオチドを含む。矢印の方向により示されるとおり、gRNA3は、標的配列の非コード鎖とハイブリダイズする。
図12の「ベクター」枠に示されるとおり、領域1の下流(すなわち、コード鎖に関して3’)及びコード鎖上に第4のPAM配列が存在する。コード鎖は、第4のガイドポリヌクレオチド(「gRNA4」)にハイブリダイズする領域を含む。gRNA4は、第4のPAM配列の上流(すなわち、コード鎖に関して5’)の配列にハイブリダイズする。このgRNA4ハイブリダイゼーション配列は、領域1の一部及びさらに領域1外側の数ヌクレオチドを含む。矢印の方向により示されるとおり、gRNA4は、標的配列のコード鎖とハイブリダイズする。
図14は、本開示の別の実施形態を表す。図14は、図14と類似であるが、TSC上の領域1及び領域2間の数ヌクレオチドのギャップが存在すること、並びにTSV上の領域2及び領域1間の数ヌクレオチドのギャップが存在することを除く。しかしながら、互いに対する領域の配置、及びガイドポリヌクレオチドの方向性は、図14及び図12において同一である。
したがって、一部の実施形態において、染色体上の標的配列(すなわち、TSC)は、領域1及び領域2を含み、領域1の一部は、領域2の一部と重複する。他の実施形態において、TSCは、領域1及び領域2を含み、領域1及び領域2は、1つ以上のヌクレオチドだけ離隔している。一部の実施形態において、領域1及び領域2は、1、2、3、4、5、6、7、8、9、10以上のヌクレオチドだけ重複する。一部の実施形態において、領域1及び領域2は、1、2、3、4、5、6、7、8、9、10以上のヌクレオチドだけ離隔している。
一部の実施形態において、ベクター上の標的配列(すなわち、TSV)は、領域2及び領域1を含み、領域2は、領域1の直前に、それらの間のいかなるヌクレオチドもなしで先行する。他の実施形態において、TSVは、領域2及び領域1を含み、領域2及び領域1は、1つ以上のヌクレオチドだけ離隔している。一部の実施形態において、領域2及び領域1は、1、2、3、4、5、6、7、8、9、10以上のヌクレオチドだけ離隔している。
方法の実施形態において、Cas9−エンドヌクレアーゼ二量体は、標的配列中の粘着末端を生成する。本明細書に記載されるCas9タンパク質は、核酸中の部位特異的分解を生成する。一部の実施形態において、Cas9タンパク質は、DNA中の部位特異的二本鎖分解を生成する。核酸中の特異的配列を標的化するCas9の能力(すなわち、部位特異性)は、規定の配列とハイブリダイズするガイドポリヌクレオチド、例えば、ガイドRNAと複合体化するCas9により達成される。したがって、Cas9及びガイドポリヌクレオチドを含む複合体は、少なくとも2つの区別される機能:(1)核酸配列の特異的標的化、及び(2)標的化される核酸配列又はその近傍における分解を生成するヌクレアーゼ活性を有する。一部の実施形態において、Cas9−ガイドポリヌクレオチド複合体は、それが2つの機能の一方のみを実行するように改変されている。一部の実施形態において、Cas9は、ヌクレアーゼ活性を除去するが、Cas9が依然として特異的核酸配列を標的化し得るようにガイドポリヌクレオチドと複合体化する能力を保持するように改変されている。
本明細書に記載の野生型Cas9は、核酸結合ドメイン(ガイドポリヌクレオチドと相互作用する)及び開裂ドメイン(標的核酸を開裂させる)を含む単量体タンパク質である。ある例において、二量体ヌクレアーゼ、すなわち、二量体の両方の単量体が標的配列において存在するまで活性でないヌクレアーゼを使用してより高度の標的化特異性を達成することが有利である。天然発生ヌクレアーゼ(例えば、Cas9など)の結合ドメイン及び開裂ドメイン、並びにヌクレアーゼ結合特異的標的部位を作出するために融合させることができるモジュラー結合ドメイン及び開裂ドメインは、当業者に周知である。例えば、RNAプログラマブルヌクレアーゼ(例えば、Cas9)の結合ドメイン、又は不活性DNA開裂ドメインを有するCas9タンパク質を、結合ドメイン(例えば、gRNAに結合して標的部位への結合を指向する)として使用して所望の標的部位に特異的に結合させ、開裂ドメイン、例えば、エンドヌクレアーゼFokIの開裂ドメインに融合させ、又はコンジュゲートさせて標的領域を開裂させる遺伝子操作ヌクレアーゼを作出することができる。Cas9−FokI融合タンパク質は、例えば、米国特許出願公開第2015/0071899号明細書及びGuilinger et al.,“Fusion of catalytically inactive Cas9 to FokI nuclease improves the specificity of genome modification,”Nature Biotechnology 32:577−582(2014)にさらに記載されており、それらのそれぞれは参照により全体として本明細書に組み込まれる。
一部の実施形態において、遺伝子操作ヌクレアーゼは、回文二本鎖標的部位、例えば、二本鎖DNA標的部位を認識する。多くの天然発生ヌクレアーゼ、例えば、天然発生DNA制限ヌクレアーゼなどの標的部位は、当業者に周知である。一部の実施形態において、DNAヌクレアーゼ、例えば、EcoRI、HindIII、又はBamHIなどは、4〜10塩基対長さの回文二本鎖DNA標的部位を認識し、2つのDNA鎖のそれぞれを標的部位内の特異的位置において切断する。一部の実施形態において、エンドヌクレアーゼは、二本鎖核酸標的部位を対称的に切断し、すなわち、両方の鎖を同一位置において切断し、その結果、末端は本明細書において平滑末端とも称される塩基対合ヌクレオチドを含む。一部の実施形態において、エンドヌクレアーゼは、二本鎖核酸標的部位を非対称的に切断し、すなわち、それぞれの鎖を異なる位置において切断し、その結果、末端は不対合ヌクレオチド、すなわち、粘着末端又はオーバーハングを含む。一部の実施形態において、オーバーハングは、5’−オーバーハングであり、すなわち、不対合ヌクレオチドは、DNA鎖の5’末端を形成する。一部の実施形態において、オーバーハングは、3’−オーバーハングであり、すなわち、不対合ヌクレオチドは、DNA鎖の3’末端を形成する。オーバーハングは、相補的不対合ヌクレオチドを含む他の二本鎖DNA分子末端に「付着」(すなわち、それと結合)し得る。
一部の実施形態において、2つドメイン:(i)RNAプログラマブルヌクレアーゼ(例えば、Cas9タンパク質、又はその断片)ドメインを(ii)ヌクレアーゼドメインに融合又は結合させて含む融合タンパク質が提供される。例えば、一部の実施形態において、Cas9タンパク質(例えば、融合タンパク質のCas9ドメイン)は、RNA(gRNA)結合活性を保持し、したがってgRNAに相補的な標的部位に結合し得るヌクレアーゼ不活性化Cas9(例えば、DNA開裂活性を欠くCas9;「dCas9」)を含む。一部の実施形態において、ヌクレアーゼ不活性化Cas9ドメインに融合しているヌクレアーゼは、標的核酸(例えば、DNA)を開裂させるために二量体化(例えば、ヌクレアーゼの2つの単量体の一体化)を要求する任意のヌクレアーゼである。一部の実施形態において、ヌクレアーゼ不活性化Cas9に融合しているヌクレアーゼは、FokI DNA開裂ドメインの単量体であり、それによりCas9−FokIと称されるCas9バリアントを産生する。FokI DNA開裂ドメインは公知であり、実施形態において、FokI(NCBIアクセッション番号J04623)のアミノ酸388〜583に対応する。一部の実施形態において、FokI DNA開裂ドメインは、FokIのアミノ酸300〜583、320〜583、340〜583、又は360〜583に対応する。(Wah et al.,“Structure of FokI has implications for DNA cleavage,” Proceedings of the National Academy of Sciences USA 95(18):10564−9(1996);Li et al.,“TAL nucleases(TALNs):hybrid proteins composed of TAL effectors and FokI DNA−cleavage domain,”Nucleic Acids Research 39(1):359−72 (2011);Kim et al.,“Hybrid restriction enzymes:zinc finger fusions to FokI cleavage domain,”Proceedings of the National Academy of Sciences USA 93:1156−1160(1996)も参照;それらのそれぞれは参照により全体として本明細書に組み込まれる)。
一部の実施形態において、Cas9−エンドヌクレアーゼ融合タンパク質の二量体、例えば、Cas9−FokIの二量体が提供される。例えば、一部の実施形態において、Cas9−FokI融合タンパク質は、それ自体との二量体を形成して標的核酸の開裂を媒介する。一部の実施形態において、Cas9−エンドヌクレアーゼ融合タンパク質、又はその二量体は、1つ以上のgRNAと会合している。一部の実施形態において、二量体は、それぞれgRNA結合活性を有するCas9ドメインを有する2つの融合タンパク質を含有するため、標的核酸は、核酸標的の2つの区別される領域と相補性を示す2つの区別されるgRNA配列を使用して標的化される。例えば、図10及び11参照。したがって、一部の実施形態において、標的核酸の開裂は、両方の融合タンパク質が標的核酸に結合し(例えば、gRNA:標的核酸塩基対合により特定される)、ヌクレアーゼドメインが二量体化する(例えば、FokI DNA開裂ドメイン;融合タンパク質のCas9:gRNAドメインの結合に基づくそれらの近接の結果として)まで生じず、例えば、結合Cas9融合タンパク質間の領域中の標的核酸を開裂させる。これは、図10及び11に示される模式図により例示される。このアプローチは、野生型Cas9及び他のCas9バリアント、例えば、核酸を開裂させるためにヌクレアーゼドメインの二量体化を要求しないニッカーゼと比べて顕著な改善を表す(Ran et al,“Double Nicking by RNA−Guided CRISPR Cas9 for Enhanced Genome Editing Specificity,”Cell 154:1380−1389(2013);Mali et al.,“CAS9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering,”Nature Biotechnology 31:833−838(2013))。これらのニッカーゼバリアントは、核酸への単一ニッカーゼの結合時に開裂、又はニッキングを誘導し得、それはオン及びオフターゲット部位において生じ得、ニッキングは突然変異誘発を誘導することが公知である。本明細書に提供されるバリアントは、標的核酸開裂を誘導するために互いに近接する2つのCas9バリアントの結合を要求するため、オフターゲット開裂を誘導する機会が低減される。一部の実施形態において、ヌクレアーゼドメインに融合しているCas9バリアント(例えば、Cas9−FokI)は、野生型Cas9又は他のCas9バリアント(例えば、ニッカーゼ)のオンターゲット:オフターゲット改変比よりも少なくとも2倍、少なくとも5倍、少なくとも10倍、少なくとも20倍、少なくとも30倍、少なくとも40倍、少なくとも50倍、少なくとも60倍、少なくとも70倍、少なくとも80倍、少なくとも90倍、少なくとも100倍、少なくとも110倍、少なくとも120倍、少なくとも130倍、少なくとも140倍、少なくとも150倍、少なくとも175倍、少なくとも200倍、少なくとも250倍以上高いオンターゲット:オフターゲット改変比を有する。一部の実施形態において、ヌクレアーゼドメインに融合しているCas9バリアント(例えば、Cas9−FokI)は、野生型Cas9又は他のCas9バリアントのオンターゲット:オフターゲット改変比よりも約60〜180倍、約80〜160倍、約100〜150倍、又は約120〜140倍高いオンターゲット:オフターゲット改変比を有する。オンターゲット:オフターゲット改変比を決定する方法は、公知である。一部の実施形態において、オンターゲット:オフターゲット改変比は、ある遺伝子中の公知のCas9オフターゲット部位の改変の数又は量を計測することにより決定される。例えば、CLTA、EMX、及びVEGF遺伝子のCas9オフターゲット部位が公知であり、それらの部位における改変を試験タンパク質及び対照間で計測し、比較することができる。標的部位及びその対応する公知のオフターゲット部位は、特定のCas9タンパク質又はバリアントにより処理された細胞(例えば、HEK293)から単離されたゲノムDNAから増幅される。次いで、改変は、ハイスループットシーケンシングにより分析される。潜在的ゲノムオフターゲット部位中の2つ以上の塩基対の挿入又は欠失を含有し、対照gRNA処理試料に対して標的gRNA処理試料中で有意に多い数(p値<0.005、フィッシャーの正確確率検定)で存在する配列は、Cas9ヌクレアーゼ誘導ゲノム改変とみなされる。
一部の実施形態において、本開示の方法は、第1のCas9−エンドヌクレアーゼ単量体及び第2のCas9−エンドヌクレアーゼ単量体を含むCas9−エンドヌクレアーゼの二量体を提供する。方法の実施形態において、Cas9−エンドヌクレアーゼのエンドヌクレアーゼは、IIS型エンドヌクレアーゼである。一部の実施形態において、第1のCas9−エンドヌクレアーゼ二量体中の第1の単量体のエンドヌクレアーゼは、IIS型エンドヌクレアーゼである。一部の実施形態において、第1のCas9−エンドヌクレアーゼ二量体中の第2の単量体のエンドヌクレアーゼは、IIS型エンドヌクレアーゼである。一部の実施形態において、第1のCas9−エンドヌクレアーゼ二量体中の第1の単量体及び第2の単量体のエンドヌクレアーゼは、IIS型エンドヌクレアーゼである。一部の実施形態において、第2のCas9−エンドヌクレアーゼ二量体中の第1の単量体のエンドヌクレアーゼは、IIS型エンドヌクレアーゼである。一部の実施形態において、第2のCas9−エンドヌクレアーゼ二量体中の第2の単量体のエンドヌクレアーゼは、IIS型エンドヌクレアーゼである。一部の実施形態において、第2のCas9−エンドヌクレアーゼ二量体中の第1の単量体及び第2の単量体のエンドヌクレアーゼは、IIS型エンドヌクレアーゼである。一部の実施形態において、第1のCas9−エンドヌクレアーゼ二量体及び第2のCas9−エンドヌクレアーゼ二量体中のエンドヌクレアーゼは、IIS型エンドヌクレアーゼである。
エンドヌクレアーゼ、又は制限酵素は、サブユニット組成、開裂位置、配列特異性、及び補因子条件に基づき4つの型に慣習的に分類される。しかしながら、アミノ酸シーケンシングにより、制限酵素間の莫大な多様性が見出され、分子レベルにおいて4つよりもかない多い異なる型が存在することが明らかになった。
「IIS型」エンドヌクレアーゼは、片側に対してそれらの認識配列の外側を開裂させるFokI及びAlwIなどである。IIS型制限酵素は、中間サイズ、400〜650アミノ酸長さであり、それらは、連続的及び非対称的な配列を認識する。これらは2つの区別されるドメインを含み、一方はDNA結合のため、他方はDNA開裂のためのものである。これらは、大部分、単量体としてDNAに結合するが、隣接酵素分子の開裂ドメインの二量体化を介してDNAを協調的に開裂させることが考えられる。この理由のため、一部のIIS型酵素は、複数の認識部位を含有するDNA分子に対してさらに高い活性を示す。IIS型エンドヌクレアーゼの非限定的な例としては、AcuI、AlwI、BaeI、BbsI、BbvI、BccI、BceAI、BcgI、BciVI、BcoDI、BfuAI、BmrI、BpmI、BpuEI、BsaI、BsaXI、BseRI、BsgI、BsmAI、BsmBI、BsmFI、BsmI、BspCNI、BspMI、BspQI、BsrDI、BsrI、BtgZI、BtsCI、BtsI、CspCI、EarI、EciI、FauI、FokI、HgaI、HphI、HpyAV、MboII、MlyI、MmeI、MnlI、NmeAIII、PleI、SapI、及びSfaNIが挙げられる。一部の実施形態において、第1のCas9−エンドヌクレアーゼ二量体及び第2のCas9−エンドヌクレアーゼ二量体中のエンドヌクレアーゼは、BbvI、BgcI、BfuAI、BmpI、BspMI、CspCI、FokI、MboII、MmeI、NmeAIII、及びPleIからなる群から独立して選択される。一部の実施形態において、第1のCas9−エンドヌクレアーゼ二量体及び第2のCas9−エンドヌクレアーゼ二量体中のエンドヌクレアーゼは、FokIである。FokによるDNA開裂は、2つのFokI単量体の二量体化時にのみ生じる。DNAのFokI開裂は、4塩基対オーバーハングを有する粘着末端を生成する。
Cas9−エンドヌクレアーゼ融合タンパク質中のエンドヌクレアーゼは、遺伝子操作FokIヌクレアーゼ、例えば、遺伝子操作FokI二量体であってもよい。一部の実施形態において、遺伝子操作FokI二量体は、偏性ヘテロ二量体、すなわち、2つの非同一単量体が機能的(触媒的に活性な)二量体を形成するために要求される。
一部の実施形態において、第1及び第2のCas9−エンドヌクレアーゼ二量体は、同一である。一部の実施形態において、第1及び第2のCas9−エンドヌクレアーゼ二量体は、異なる。
一部の実施形態において、本方法は、第1、第2、又は両方のCas9−エンドヌクレアーゼ二量体は、改変Cas9を含むことを提供する。一部の実施形態において、改変Cas9は、触媒的に不活性なCas9(「deadCas9」)である。一部の実施形態において、第1、第2、又は両方のCas9−エンドヌクレアーゼ二量体は、触媒的に不活性なCas9を含む。触媒的に不活性なCas9は、DNAを開裂させ得ず(すなわち、Cas9の開裂ドメインが不活性化している);しかしながら、それらは、ガイドポリヌクレオチド(例えば、ガイドRNA)との複合体を形成することにより核酸配列を標的化する能力を保持する。触媒的な不活性なCas9は、当分野において、例えば、Jinek et al.(2012)及びQi et al.,“Repurposing CRISPR as an RNA−guided platform for sequence−specific control of gene expression,”Cell 152(5):1173−1183(2013)により記載されている。一部の実施形態において、触媒的に不活性なCas9は、野生型Cas9に対して二重アミノ酸置換を含む。一部の実施形態において、Cas9−エンドヌクレアーゼ二量体は、野生型Cas9に対して二重アミノ酸置換を含む。一部の実施形態において、二重アミノ酸置換は、D10A及びH840Aである。一部の実施形態において、第1、第2、又は両方のCas9−エンドヌクレアーゼ二量体中のエンドヌクレアーゼは、FokIであり、第1、第2、又は両方のCas9−エンドヌクレアーゼ二量体中のCas9は、触媒的に不活性なCas9である(「deadCas9−FokI」)。一部の実施形態において、第1、第2、又は両方のCas9−エンドヌクレアーゼ二量体中のエンドヌクレアーゼは、FokIであり、第1、第2、又は両方のCas9−エンドヌクレアーゼ二量体中のCas9は、D10A/H840A二重アミノ酸置換を含む。
一部の実施形態において、改変Cas9は、ニッカーゼ活性を有するCas9(「Cas9ニッカーゼ」又は「Cas9n」)である。一部の実施形態において、第1、第2、又は両方のCas9−エンドヌクレアーゼ二量体は、ニッカーゼ活性を有するCas9を含む。Cas9ニッカーゼは、二本鎖DNAの一方の鎖のみを開裂させ得る(すなわち、DNAを「ニッキングする」)。Cas9ニッカーゼは、例えば、Cho et al.,“Analysis of off−target effects of CRISPR/Cas−derived RNA−guided endonucleases and nickases,”Genome Research 24:132−141(2013)、Ran et al.(Cell 2013)、及びMali et al.(Nature Biotechnology 2013)に記載されている。一部の実施形態において、Cas9ニッカーゼは、野生型Cas9に対して単一アミノ酸置換を含む。一部の実施形態において、Cas9−エンドヌクレアーゼ二量体は、野生型Cas9に対して単一アミノ酸置換を含む。一部の実施形態において、単一アミノ酸置換は、D10Aである(「Cas9n(D10A)」)。一部の実施形態において、単一アミノ酸置換は、H840Aである(「Cas9n(H840A)」)。一部の実施形態において、第1、第2、又は両方のCas9−エンドヌクレアーゼ二量体中のエンドヌクレアーゼは、FokIであり、第1、第2、又は両方のCas9−エンドヌクレアーゼ二量体中のCas9は、Cas9ニッカーゼである。一部の実施形態において、第1、第2、又は両方のCas9−エンドヌクレアーゼ二量体中のエンドヌクレアーゼは、FokIであり、第1、第2、又は両方のCas9−エンドヌクレアーゼ二量体中のCas9は、D10A単一アミノ酸置換を含む(「Cas9n(D10A)−FokI」)。一部の実施形態において、第1、第2、又は両方のCas9−エンドヌクレアーゼ二量体中のエンドヌクレアーゼは、FokIであり、第1、第2、又は両方のCas9−エンドヌクレアーゼ二量体中のCas9は、H8410A単一アミノ酸置換を含む(「Cas9n(H840A)−FokI」)。
一部の実施形態において、野生型Cas9は、化膿連鎖球菌(Streptococcus pyogenes)、黄色ブドウ球菌(Staphylococcus aureus)、スタフィロコッカス・シュードインターメディウス(Staphylococcus pseudintermedius)、プラノコッカス・アンタルクティカス(Planococcus antarcticus)、ストレプトコッカス・サングイニス(Streptococcus sanguinis)、ストレプトコッカス・サーモフィラス(Streptococcus thermophilus)、ストレプトコッカス・ムタンス(Streptococcus mutans)、コリバクテリウム・グロメランス(Coribacterium glomerans)、ラクトバシラス・ファーシミニス(Lactobacillus farciminis)、カテニバクテリウム・ミツオカイ(Catenibacterium mitsuokai)、ラクトバシラス・ラムノサス(Lactobacillus rhamnosus)、ビフィドバクテリウム・ビフィダム(Bifidobacterium bifidum)、オエノコッカス・キタハラ(Oenococcus kitahara)、フルクトバシラス・フルクトサス(Fructobacillus fructosus)、フィネゴルディア・マグナ(Finegoldia magna)、ベイロネラ・アチピカ(Veillonella atyipca)、ソロバクテリウム・モオレイ(Solobacterium moorei)、アシドアミノコッカス属種(Acidaminococcus sp.)D21、ユーバクテリウム・ユリ(Eubacterium yurri)、コプロコッカス・カタス(Coprococcus catus)、フソバクテリウム・ヌクレアタム(Fusobacterium nucleatum)、フィリファクター・アロシス(Filifactor alocis)、ペプトニフィラス・ドゥエルデニイ(Peptoniphilus duerdenii)、又はトレポネマ・デンティコラ(Treponema denticola)に由来する。
一部の実施形態において、Cas9−エンドヌクレアーゼにより生成される粘着末端は、5’オーバーハングを含む。一部の実施形態において、Cas9−エンドヌクレアーゼにより生成される粘着末端は、3’オーバーハングを含む。一部の実施形態において、第1、第2、又は両方のCas9−エンドヌクレアーゼ二量体は、3〜40ヌクレオチドの一本鎖ポリヌクレオチドを含む粘着末端を生成する。一部の実施形態において、第1、第2、又は両方のCas9−エンドヌクレアーゼ二量体は、4〜30ヌクレオチドの一本鎖ポリヌクレオチドを含む粘着末端を生成する。一部の実施形態において、第1、第2、又は両方のCas9−エンドヌクレアーゼ二量体は、5〜20ヌクレオチドの一本鎖ポリヌクレオチドを含む粘着末端を生成する。一部の実施形態において、第1、第2、又は両方のCas9−エンドヌクレアーゼ二量体は、約5ヌクレオチド、約10ヌクレオチド、約15ヌクレオチド、約20ヌクレオチド、約25ヌクレオチド、又は約30ヌクレオチドの一本鎖ポリヌクレオチドを含む粘着末端を生成する。一部の実施形態において、deadCas9−FokI二量体は、4−ヌクレオチド5’オーバーハングを含む粘着末端を生成する。一部の実施形態において、Cas9(D10A)−FokI二量体は、27−ヌクレオチド5’オーバーハングを含む粘着末端を生成する。一部の実施形態において、Cas9(H840A)−FokI二量体は、23−ヌクレオチド3’−オーバーハングを含む粘着末端を生成する。
方法の実施形態において、目的配列(SoI)は、ドナープラスミドにより含まれる。ドナープラスミドは、任意の好適な長さ、例えば、約又は少なくとも約10、15、20、25、50、75、100、150、200、250、500若しくは1000以上のヌクレオチド長さのものであり得る。一部の実施形態において、ドナープラスミドは、TSCを含む染色体の一部に相補的である。ドナープラスミドテンプレートは、最適にアラインされる場合、TSCの1つ以上のヌクレオチド(例えば、約又は少なくとも約1、5、10、15、20、25、30、35、40、45、50、60、70、80、90、若しくは100以上のヌクレオチド)と重複する。一部の実施形態において、ドナープラスミド及びTSCを含む染色体が最適にアラインされる場合、ドナープラスミドの最近傍ヌクレオチドは、TSCから約1、5、10、15、20、25、50、75、100、200、300、400、500、100、1500、2000、2500、5000、10000以上のヌクレオチド以内に存在する。
一部の実施形態において、SoIは、DNA、例えば、DNAプラスミド、細菌人工染色体(BAC)、酵母人工染色体(YAC)、ウイルスベクター、線状DNA片、PCR断片、ネイキッド核酸、又は送達ビヒクル、例えば、リポソームと複合体化している核酸などである。
一部の実施形態において、SoIは、細胞の内因性DNA修復経路を使用してTSC中に挿入される。一部の実施形態において、SoIは、非相同末端結合(NHEJ)修復経路の構成成分を使用してTSC中に挿入される。修復プロセスの間、SoIを含むドナープラスミドをTSC中に導入することができる。
一部の実施形態において、上流配列及び下流配列によりフランキングされたSoIを含むドナープラスミドを細胞中に導入し、上流及び下流配列は、TSC中の組込みの部位のいずれかの側と配列類似性を共有する。一部の実施形態において、SoIを含む外因性ポリヌクレオチドは、例えば、突然変異遺伝子を含む。一部の実施形態において、外因性ポリヌクレオチドは、細胞に対して内因性又は外因性である配列を含む。一部の実施形態において、SoIは、タンパク質をコードするポリヌクレオチド、又は非コード配列、例えば、マイクロRNAなどを含む。一部の実施形態において、SoIは、調節エレメントに作動可能に結合している。一部の実施形態において、SoIは、調節エレメントである。一部の実施形態において、SoIは、耐性カセット、例えば、抗生物質に対する耐性を付与する遺伝子を含む。一部の実施形態において、SoIは、野生型標的配列の突然変異を含む。一部の実施形態において、SoIは、フレームシフト突然変異又はヌクレオチド置換を作出することにより標的配列を破壊する。一部の実施形態において、SoIは、マーカーを含む。標的配列中へのマーカーの導入は、標的化組込みのスクリーニングを容易にし得る。一部の実施形態において、マーカーは、制限部位、蛍光タンパク質、又は選択マーカーである。一部の実施形態において、SoIは、SoIを含むベクターとして導入する。
外因性ポリヌクレオチドテンプレート中の上流及び下流配列は、標的配列及び外因性ポリヌクレオチド間の相同組換えを促進するように選択される。上流配列は、組込みのための標的部位の上流の配列(すなわち、標的配列)との配列類似性を共有する核酸配列である。同様に、下流配列は、組込みのための標的部位の下流の配列との配列類似性を共有する核酸配列である。したがって、一部の実施形態において、Solを含む外因性ポリヌクレオチドテンプレートは、上流及び下流配列において相同組換えにより標的配列中に挿入する。一部の実施形態において、外因性ポリヌクレオチドテンプレート中の上流及び下流配列は、標的化ゲノム配列の上流及び下流配列とそれぞれ少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、又は100%の配列同一性を有する。一部の実施形態において、上流又は下流配列は、約20〜2000塩基対、又は約50〜1750塩基対、又は約100〜1500塩基対、又は約200〜1250塩基対、又は約300〜1000塩基対、又は約400〜約750塩基対、又は約500〜600塩基対を有する。一部の実施形態において、上流又は下流配列は、約50、約100、約250、約500、約100、約1250、約1500、約1750、約2000、約2250、又は約2500塩基対を有する。
一部の実施形態において、SoIの挿入時、染色体中の標的配列及びプラスミド中の標的配列は、再構成させない。すなわち、一部の実施形態において、染色体中の得られた配列(すなわち、SoIの挿入から得られた配列)は、第1、第2、第3、又は第4のガイドポリヌクレオチドのいずれにもハイブリダイズしない。したがって、一部の実施形態において、SoIを含む染色体中の得られた配列は、第1又は第2のCas9−エンドヌクレアーゼ二量体、又は第1若しくは第2のCas9−エンドヌクレアーゼ二量体中の単量体のいずれかによる開裂に感受性でない。図13及び15に例示されるとおり、得られた「ノックイン」配列(「予測5’ジャンクション」)は、「ゲノム」及び「ベクター」配列と異なる配列であり、「ノックイン」配列は、gRNA1、gRNA2、gRNA3、又はgRNA4のいずれにもハイブリダイズ可能な配列を有さない。
一部の実施形態において、本開示の方法は、細胞中に、第1のCas9−エンドヌクレアーゼ二量体の第1の単量体との複合体を形成し、第1のガイド配列(第1のガイド配列は、領域1を含むTSCにハイブリダイズするが、ベクターにハイブリダイズしない)を含む第1のガイドポリヌクレオチドを導入することをさらに含む。図13及び15により例示されるとおり、第1のガイド配列(「gRNA1」として示される)は、ゲノム中の標的DNAの非コード鎖上の領域1の一部及び領域1外側の数ヌクレオチドに結合する。gRNA1は、ゲノム又はベクター中の任意の他の配列にハイブリダイズしない。一部の実施形態において、第1のガイドポリヌクレオチドは、Cas9の結合ドメインとの相互作用により第1のCas9−エンドヌクレアーゼ二量体の第1の単量体との複合体を形成する。
一部の実施形態において、本開示の方法は、細胞中に、第1のCas9−エンドヌクレアーゼ二量体の第2の単量体との複合体を形成し、第2のガイド配列(第2のガイド配列は、領域2を含むTSCにハイブリダイズするが、ベクターにハイブリダイズしない)を含む第2のガイドポリヌクレオチドを導入することをさらに含む。図13及び15により例示されるとおり、第2のガイド配列(「gRNA2」として示される)は、ゲノム中の標的DNAのコード鎖上の領域2の一部に結合する。gRNA2は、ゲノム又はベクター中の任意の他の配列にハイブリダイズしない。一部の実施形態において、第2のガイドポリヌクレオチドは、Cas9の結合ドメインとの相互作用により第1のCas9−エンドヌクレアーゼ二量体の第2の単量体との複合体を形成する。
一部の実施形態において、本開示の方法は、細胞中に、第2のCas9−エンドヌクレアーゼ二量体の第1の単量体との複合体を形成し、第3のガイド配列(第3のガイド配列は、領域2を含むTSVにハイブリダイズするが、ゲノムにハイブリダイズしない)を含む第3のガイドポリヌクレオチドを導入することをさらに含む。図13及び15により例示されるとおり、第3のガイド配列(「gRNA3」として示される)は、ベクター中の標的DNAの非コード鎖上の領域2の一部及び領域2外側の数ヌクレオチドに結合する。gRNA3は、ゲノム又はベクター中の任意の他の配列にハイブリダイズしない。一部の実施形態において、第3のガイドポリヌクレオチドは、Cas9の結合ドメインとの相互作用により第2のCas9−エンドヌクレアーゼ二量体の第1の単量体との複合体を形成する。
一部の実施形態において、本開示の方法は、細胞中に、第2のCas9−エンドヌクレアーゼ二量体の第2の単量体との複合体を形成し、第4のガイド配列(第4のガイド配列は、領域1を含むTSCにハイブリダイズするが、ゲノムにハイブリダイズしない)を含む第4のガイドポリヌクレオチドを導入することをさらに含む。図13及び図15により例示されるとおり、第4のガイド配列(「gRNA4」として示される)は、ベクター中の標的DNAのコード鎖上の領域1の一部に結合する。gRNA4は、ゲノム又はベクター中の任意の他の配列にハイブリダイズしない。一部の実施形態において、第4のガイドポリヌクレオチドは、Cas9の結合ドメインとの相互作用により第2のCas9−エンドヌクレアーゼ二量体の第2の単量体との複合体を形成する。
一部の実施形態において、ガイドポリヌクレオチドは、TSC及びTSVの両方に結合し得る。したがって、一部の実施形態において、方法は、細胞中に、第1のCas9−エンドヌクレアーゼ二量体の第1の単量体との複合体を形成し、第1のガイド配列(第1のガイド配列は、TSC及びTSVにハイブリダイズする)を含む第1のガイドポリヌクレオチドを導入することをさらに含む。
一部の実施形態において、方法は、細胞中に、第1のCas9−エンドヌクレアーゼ二量体の第2の単量体との複合体を形成し、第2のガイド配列(第2のガイド配列は、TSC及びTSVにハイブリダイズする)を含む第2のガイドポリヌクレオチドを導入することをさらに含む。
一部の実施形態において、方法は、細胞中に、第2のCas9−エンドヌクレアーゼ二量体の第1の単量体との複合体を形成し、第3のガイド配列(第3のガイド配列は、TSC及びTSVにハイブリダイズする)を含む第3のガイドポリヌクレオチドを導入することをさらに含む。
一部の実施形態において、方法は、細胞中に、第2のCas9−エンドヌクレアーゼ二量体の第2の単量体との複合体を形成し、第4のガイド配列(第4のガイド配列は、TSC及びTSVにハイブリダイズする)を含む第4のガイドポリヌクレオチドを導入することをさらに含む。
一部の実施形態において、第1、第2、第3、及び/又は第4のガイドポリヌクレオチドは、同一である。一部の実施形態において、第1、第2、第3、及び/又は第4のガイドポリヌクレオチドは、異なる。
一部の実施形態において、本開示の方法は、細胞中に、第1、第2、第3、及び第4のガイドポリヌクレオチドを導入することを含む。一部の実施形態において、第1のCas9−エンドヌクレアーゼ二量体の第1の単量体は、第1のガイドポリヌクレオチドとの複合体を形成し、第1のCas9−エンドヌクレアーゼ二量体の第2の単量体は、第2のガイドポリヌクレオチドとの複合体を形成する。一部の実施形態において、第2のCas9−エンドヌクレアーゼ二量体の第1の単量体は、第3のガイドポリヌクレオチドとの複合体を形成し、第2のCas9−エンドヌクレアーゼ二量体の第2の単量体は、第4のガイドポリヌクレオチドとの複合体を形成する。
一部の実施形態において、第1のCas9−エンドヌクレアーゼ二量体の第1の単量体は、第1のガイドポリヌクレオチドとの複合体を形成し、第1のCas9−エンドヌクレアーゼ二量体の第2の単量体は、第2のガイドポリヌクレオチドとの複合体を形成し、第2のCas9−エンドヌクレアーゼ二量体の第1の単量体は、第3のガイドポリヌクレオチドとの複合体を形成し、第2のCas9−エンドヌクレアーゼ二量体の第2の単量体は、第4のガイドポリヌクレオチドとの複合体を形成する。一部の実施形態において、第1及び第2のガイドポリヌクレオチドは、第1のCas9−エンドヌクレアーゼ二量体を細胞の染色体上の標的配列にガイドし、第3及び第4のガイドポリヌクレオチドは、第2のCas9−エンドヌクレアーゼ二量体を細胞中に導入されたベクター上の標的配列にガイドする。
一部の実施形態において、本開示の方法は、細胞中に、tracrRNAを導入することをさらに含む。一部の実施形態において、ガイドポリヌクレオチドは、crRNA/tracrRNAハイブリッドを含む。一部の実施形態において、ガイドポリヌクレオチドのtracrRNA構成成分は、Cas9−エンドヌクレアーゼのCas9を活性化させる。一部の実施形態において、Cas9−エンドヌクレアーゼ、ガイドポリヌクレオチド、及びtracrRNAは、複合体を形成し得る。一部の実施形態において、複合体は、Cas9−エンドヌクレアーゼ、2つのガイドポリヌクレオチド、及び2つのtracrRNA配列を含む。一部の実施形態において、Cas9−エンドヌクレアーゼ、ガイドポリヌクレオチド、及びtracrRNAの複合体は天然に生じない。
一部の実施形態において、第1のCas9−エンドヌクレアーゼ二量体の第1の単量体は、第1のガイドポリヌクレオチド配列及びtracrRNA配列との複合体を形成し、第1のCas9−エンドヌクレアーゼ二量体の第2の単量体は、第2のガイドポリヌクレオチド配列及びtracrRNA配列との複合体を形成する。一部の実施形態において、第2のCas9−エンドヌクレアーゼ二量体の第1の単量体は、第3のガイドポリヌクレオチド配列及びtracrRNA配列との複合体を形成し、第2のCas9−エンドヌクレアーゼ二量体の第2の単量体は、第4のガイドポリヌクレオチド配列及びtracrRNA配列との複合体を形成する。
一部の実施形態において、第1のCas9−エンドヌクレアーゼ二量体の第1の単量体は、第1のガイドポリヌクレオチド及びtracrRNAとの複合体を形成し、第1のCas9−エンドヌクレアーゼ二量体の第2の単量体は、第2のガイドポリヌクレオチド及びtracrRNAとの複合体を形成し、第2のCas9−エンドヌクレアーゼ二量体の第1の単量体は、第3のガイドポリヌクレオチド及びtracrRNAとの複合体を形成し、第2のCas9−エンドヌクレアーゼ二量体の第2の単量体は、第4のガイドポリヌクレオチド及びtracrRNAとの複合体を形成する。一部の実施形態において、第1のガイドポリヌクレオチド及びtracrRNA並びに第2のガイドポリヌクレオチド及びtracrRNAは、第1のCas9−エンドヌクレアーゼ二量体を細胞の染色体上の標的配列にガイドし、第3のガイドポリヌクレオチド及びtracrRNA並びに第4のガイドポリヌクレオチド及びtracrRNAは、第2のCas9−エンドヌクレアーゼ二量体を細胞中に導入されたベクター上の標的配列にガイドする。
方法の実施形態において、TSV、第1及び/又は第2のCas9−エンドヌクレアーゼ二量体は、細胞中に、第1及び第2のCas9−エンドヌクレアーゼ二量体をコードするポリヌクレオチドとして導入する。一部の実施形態において、TSV、第1及び/又は第2のCas9−エンドヌクレアーゼ二量体をコードするポリヌクレオチドは、真核細胞中の発現のためにコドン最適化されている。一部の実施形態において、TSV、第1及び/又は第2のCas9−エンドヌクレアーゼ二量体をコードするポリヌクレオチドは、哺乳動物細胞中の発現のためにコドン最適化されている。コドン最適化法及び技術は、本明細書に記載される。
一部の実施形態において、TSV、第1及び/又は第2のCas9−エンドヌクレアーゼ二量体は、細胞中に、単一核酸分子として導入する。一部の実施形態において、TSV、第1及び/又は第2のCas9−エンドヌクレアーゼ二量体をコードするポリヌクレオチドは、単一ベクター上に存在する。一部の実施形態において、第1及び/又は第2のCas9−エンドヌクレアーゼ二量体をコードするポリヌクレオチド、1つ以上のガイドポリヌクレオチド、並びに1つ以上のtracrRNA配列は、単一ベクター上に存在する。一部の実施形態において、ベクターは、発現ベクターである。一部の実施形態において、ベクターは、真核生物発現ベクターである。一部の実施形態において、ベクターは、哺乳動物発現ベクターである。一部の実施形態において、ベクターは、ヒト発現ベクターである。一部の実施形態において、ベクターは、植物発現ベクターである。
一部の実施形態において、TSV、第1及び/又は第2のCas9−エンドヌクレアーゼ二量体をコードするポリヌクレオチドは、2つ以上のベクター上に存在する。一部の実施形態において、TSV、第1及び/又は第2のCas9−エンドヌクレアーゼ二量体をコードするポリヌクレオチド、1つ以上のガイドポリヌクレオチド、並びに1つ以上のtracrRNA配列は、2つ以上のベクター上に存在する。一部の実施形態において、ベクターは、発現ベクターである。一部の実施形態において、ベクターは、真核生物発現ベクターである。一部の実施形態において、ベクターは、哺乳動物発現ベクターである。一部の実施形態において、ベクターは、ヒト発現ベクターである。一部の実施形態において、ベクターは、植物発現ベクターである。
方法の実施形態において、細胞は、真核細胞である。一部の実施形態において、真核細胞は、動物又はヒト細胞である。一部の実施形態において、真核細胞は、ヒト又はげっ歯類又はウシ細胞系又は細胞株である。このような細胞、細胞系、又は細胞株の例としては、限定されるものではないが、マウス骨髄腫(NSO)細胞系、チャイニーズハムスター卵母(CHO)細胞系、HT1080、H9、HepG2、MCF7、MDBK Jurkat、NIH3T3、PC12、BHK(ベビーハムスター腎臓細胞)、VERO、SP2/0、YB2/0、Y0、C127、L細胞、COS、例えば、COS1及び COS7、QC1−3、HEK−293、VERO、PER.C6、HeLA、EB1、EB2、EB3、腫瘍溶解又はハイブリドーマ細胞系が挙げられる。一部の実施形態において、真核細胞は、CHO細胞系である。一部の実施形態において、真核細胞は、CHO細胞である。一部の実施形態において、細胞は、CHO−K1細胞、CHO−K1 SV細胞、DG44 CHO細胞、DUXB 11 CHO細胞、CHOS、CHO GSノックアウト細胞、CHO FUT8 GSノックアウト細胞、CHOZN、又はCHO由来細胞である。CHO GSノックアウト細胞(例えば、GSKO細胞)は、例えば、CHO−K1 SV GSノックアウト細胞である。CHO FUT8ノックアウト細胞は、例えば、Potelligent(登録商標)CHOK1 SV(Lonza Biologics,Inc.)である。真核細胞は、鳥類細胞、細胞系又は細胞株、例えば、EBx(登録商標)細胞、EB14、EB24、EB26、EB66、又はEBvl3などでもよい。
一部の実施形態において、真核細胞は、ヒト細胞である。一部の実施形態において、ヒト細胞は、幹細胞である。幹細胞は、例えば、多能性幹細胞、例として、胚性幹細胞、成体幹細胞、誘導多能性幹細胞(iPSC)、組織特異的幹細胞(例えば、造血幹細胞)及び間充織幹細胞(MSC)であり得る。一部の実施形態において、ヒト細胞は、本明細書に記載の細胞のいずれかの分化形態である。一部の実施形態において、真核細胞は、培養下の任意の初代細胞に由来する細胞である。一部の実施形態において、細胞は、幹細胞又は幹細胞系である。
一部の実施形態において、真核細胞は、肝細胞、例えば、ヒト肝細胞、動物肝細胞、又は非実質細胞である。例えば、真核細胞は、付着型代謝試験用ヒト肝細胞、付着型誘導試験用ヒト肝細胞、付着型Qualyst Transporter Certified(商標)ヒト肝細胞、懸濁液試験用ヒト肝細胞(例として、10−ドナー及び20−ドナープール肝細胞)、ヒト肝臓クッパー細胞、ヒト肝臓星細胞、イヌ肝細胞(例として、単一及びプールビーグル肝細胞)、マウス肝細胞(例として、CD−1及びC57BI/6肝細胞)、ラット肝細胞(例として、Sprague−Dawley、Wistar Han、及びWistar肝細胞)、サル肝細胞(例として、カニクイザル又はアカゲザル肝細胞)、ネコ肝細胞(例として、ドメスティックショートヘア肝細胞)、及びウサギ肝細胞(例として、ニュージーランドホワイト肝細胞)であり得る。
一部の実施形態において、真核細胞は、植物発現である。例えば、植物細胞は、作物植物、例えば、キャッサバ、トウモロコシ、モロコシ、コムギ、又はイネのものであり得る。植物細胞は、藻類、樹木、又は野菜のものであり得る。植物細胞は、単子葉若しくは双子葉植物のもの、又は作物若しくは穀類植物、生産植物、果実、若しくは野菜のものであり得る。例えば、植物細胞は、樹木、例えば、柑橘樹木、例えば、オレンジ、グレープフルーツ、又はレモン樹木;モモ又はネクタリン樹木;リンゴ又はナシ樹木;ナッツ樹木、例えば、アーモンド又はクルミ又はピスタチオ樹木;ナス科植物、すなわち、ジャガイモ;ブラシカ属(Brassica)の植物、ラクツカ属(Lactuca)の植物、スピナシア属(Spinacia)の植物;カプシカム属(Capsicum)の植物;ワタ、タバコ、アスパラガス、ニンジン、キャベツ、ブロッコリー、カリフラワー、トマト、ナス、ショウガ、レタス、ホウレンソウ、イチゴ、ブルーベリー、ラズベリー、ブラックベリー、ブドウ、コーヒー、ココアなどのものであり得る。
方法の実施形態において、TSC中の粘着末端を生成し得る第1のCas9−エンドヌクレアーゼ二量体及びTSV中の粘着末端を生成し得る第2のCas9−エンドヌクレアーゼ二量体は、細胞中に、送達粒子、ベシクル、又はウイルスベクターを介して導入する。
一部の実施形態において、TSV、第1及び/又は第2のCas9−エンドヌクレアーゼ二量体は、細胞中に、送達粒子を介して送達する。送達粒子の例は、本明細書に提供される。一部の実施形態において、送達粒子は、脂質ベース系、リポソーム、ミセル、マイクロベシクル、エキソソーム、又は遺伝子銃である。一部の実施形態において、送達粒子は、Cas9−エンドヌクレアーゼ二量体の両方の単量体を含む。一部の実施形態において、送達粒子は、両方のCas9−エンドヌクレアーゼ二量体の両方の単量体を含む。一部の実施形態において、送達粒子は、Cas9−エンドヌクレアーゼ及びガイドポリヌクレオチドを含む。一部の実施形態において、送達粒子は、Cas9−エンドヌクレアーゼ及びガイドポリヌクレオチドを含み、Cas9−エンドヌクレアーゼ及びガイドポリヌクレオチドは、複合体中に存在する。一部の実施形態において、送達粒子は、Cas9−エンドヌクレアーゼをコードするポリヌクレオチド、ガイドポリヌクレオチドをコードするポリヌクレオチド、及びtracrRNAを含むポリヌクレオチドを含む。一部の実施形態において、送達粒子は、Cas9−エンドヌクレアーゼ、ガイドポリヌクレオチド、及びtracrRNAを含む。一部の実施形態において、送達粒子は、第1及び/又は第2のCas9−エンドヌクレアーゼ二量体、第1、第2、第3、及び/又は第4のガイドポリヌクレオチド、並びにtracrRNAを含む。一部の実施形態において、送達粒子は、1つ以上のCas9−エンドヌクレアーゼをコードするポリヌクレオチド、第1、第2、第3、及び/又は第4のガイドポリヌクレオチドをコードするポリヌクレオチド、並びにtracrRNAをコードするポリヌクレオチドを含む。
一部の実施形態において、送達粒子は、脂質、糖、金属又はタンパク質をさらに含む。一部の実施形態において、送達粒子は、脂質エンベロープである。一部の実施形態において、送達粒子は、糖ベース粒子、例えば、GalNAcである。一部の実施形態において、送達粒子は、ナノ粒子である。ナノ粒子の例は、本明細書に記載される。送達粒子の調製は、米国特許出願公開第2011/0293703号明細書、同第2012/0251560号明細書、及び同第2013/0302401号明細書;並びに米国特許第5,543,158号明細書、同第5,855,913号明細書、同第5,895,309号明細書、同第6,007,845号明細書、及び同第8,709,843号明細書にさらに記載されており、それらのそれぞれは参照により全体として本明細書に組み込まれる。
一部の実施形態において、TSV、第1及び/又は第2のCas9−エンドヌクレアーゼ二量体は、細胞中に、ベシクルを介して送達する。「ベシクル」は、脂質二重層により封入される流体を有する小部屋内の小型構造である。ベシクルの例は、本明細書に提供される。一部の実施形態において、ベシクルは、Cas9−エンドヌクレアーゼ二量体の両方の単量体を含む。一部の実施形態において、ベシクルは、両方のCas9−エンドヌクレアーゼ二量体の両方の単量体を含む。一部の実施形態において、ベシクルは、Cas9−エンドヌクレアーゼ及びガイドポリヌクレオチドを含む。一部の実施形態において、ベシクルは、Cas9−エンドヌクレアーゼ及びガイドポリヌクレオチドを含み、Cas9−エンドヌクレアーゼ及びガイドポリヌクレオチドは、複合体中に存在する。一部の実施形態において、ベシクルは、Cas9−エンドヌクレアーゼをコードするポリヌクレオチド、ガイドポリヌクレオチドをコードするポリヌクレオチド、及びtracrRNAを含むポリヌクレオチドを含む。一部の実施形態において、ベシクルは、Cas9−エンドヌクレアーゼ、ガイドポリヌクレオチド、及びtracrRNAを含む。一部の実施形態において、ベシクルは、第1及び/又は第2のCas9−エンドヌクレアーゼ二量体、第1、第2、第3、及び/又は第4のガイドポリヌクレオチド、並びにtracrRNAを含む。一部の実施形態において、ベシクルは、1つ以上のCas9−エンドヌクレアーゼをコードするポリヌクレオチド、第1、第2、第3、及び/又は第4のガイドポリヌクレオチドをコードするポリヌクレオチド、並びにtracrRNAをコードするポリヌクレオチドを含む。
一部の実施形態において、ベシクルは、エキソソーム又はリポソームである。一部の実施形態において、第1及び/又は第2のCas9−エンドヌクレアーゼ二量体は、細胞中に、エキソソームを介して送達する。エキソソームは、RNA及びタンパク質を輸送し、RNAを脳及び他の標的器官に送達し得る内因性ナノベシクル(すなわち、約30〜約100nmの直径を有する)である。標的器官中への外因性生物材料の送達のための遺伝子操作エキソソームが、例えば、Alvarez−Erviti et al.,Nature Biotechnology 29:341(2011)、El−Andaloussi et al.,Nature Protocols 7:2112−2116(2012)、及びWahlgren et al.,Nucleic Acids Research 40(17):e130(2012)により記載されており、それらのそれぞれは参照により全体として本明細書に組み込まれる。
一部の実施形態において、TSV、第1及び/又は第2のCas9−エンドヌクレアーゼ二量体は、細胞中に、リポソームを介して送達する。リポソームは、少なくとも1つの脂質二重層を有する球状ベシクル構造であり、栄養及び医薬物の投与用ベシクルとして使用することができる。リポソームは、リン脂質、特にホスファチジルコリンから構成されることが多いが、他の脂質、例えば、卵ホスファチジルエタノールアミンからも構成される。リポソームの型としては、限定されるものではないが、マルチラメラベシクル、スモールユニラメラベシクル、ラージユニラメラベシクル、及び渦巻き型ベシクルが挙げられる。例えば、Spuch and Navarro,“Liposomes for Targeted Delivery of Active Agents against Neurodegenerative Diseases(Alzheimer’s Disease and Parkinson’s Disease),Journal of Drug Delivery 2011,Article ID 469679(2011)参照。生物材料、例えば、CRISPR−Cas構成成分の送達用のリポソームは、例えば、Morrissey et al.,Nature Biotechnology 23(8):1002−1007(2005)、Zimmerman et al.,Nature Letters 441:111−114(2006)、及びLi et al.,Gene Therapy 19:775−780(2012)により記載されており、それらのそれぞれは参照により全体として本明細書に組み込まれる。
方法の実施形態において、TSV、第1及び/又は第2のCas9−エンドヌクレアーゼ二量体は、細胞中に、ウイルスベクターを介して送達する。一部の実施形態において、ウイルスベクターは、Cas9−エンドヌクレアーゼ二量体の両方の単量体を含む。一部の実施形態において、ウイルスベクターは、両方のCas9−エンドヌクレアーゼ二量体の両方の単量体を含む。一部の実施形態において、ウイルスベクターは、TSVを含む。一部の実施形態において、ウイルスベクターは、Cas9−エンドヌクレアーゼ及びガイドポリヌクレオチドを含む。一部の実施形態において、ウイルスベクターは、Cas9−エンドヌクレアーゼ及びガイドポリヌクレオチドを含み、Cas9−エンドヌクレアーゼ及びガイドポリヌクレオチドは、複合体中に存在する。一部の実施形態において、ウイルスベクターは、Cas9−エンドヌクレアーゼをコードするポリヌクレオチド、ガイドポリヌクレオチドをコードするポリヌクレオチド、及びtracrRNAを含むポリヌクレオチドを含む。一部の実施形態において、ウイルスベクターは、第1及び/又は第2のCas9−エンドヌクレアーゼ二量体、第1、第2、第3、及び/又は第4のガイドポリヌクレオチド、並びにtracrRNAを含む。一部の実施形態において、ウイルスベクターは、1つ以上のCas9−エンドヌクレアーゼをコードするポリヌクレオチド、第1、第2、第3、及び/又は第4のガイドポリヌクレオチドをコードするポリヌクレオチド、並びにtracrRNAをコードするポリヌクレオチドを含む。一部の実施形態において、ウイルスベクターは、TSV、及び1つ以上のCas9−エンドヌクレアーゼをコードするポリヌクレオチド、第1、第2、第3、及び/又は第4のガイドポリヌクレオチドをコードするポリヌクレオチド、並びにtracrRNAをコードするポリヌクレオチドを含む。
一部の実施形態において、ウイルスベクターは、アデノウイルス、レンチウイルス、又はアデノ随伴ウイルスのものである。ウイルスベクターの例は、本明細書に提供される。アデノ随伴ウイルス(AAV)及びレンチウイルスベクターによるウイルス形質移入(投与は、局所性、標的化又は全身性であり得る)が、インビボ遺伝子療法の送達法として使用されている。本開示の実施形態において、Casタンパク質は、形質導入された細胞により細胞内で発現される。
一部の実施形態において、第1、第2、又は両方のCas9−エンドヌクレアーゼ二量体は、核局在化シグナルを含む。一部の実施形態において、第1のCas9−エンドヌクレアーゼ二量体の第1、第2、又は両方の単量体は、核局在化シグナルを含む。一部の実施形態において、第2のCas9−エンドヌクレアーゼ二量体の第1、第2、又は両方の単量体は、核局在化シグナルを含む。一部の実施形態において、第1、第2、又は両方のCas9−エンドヌクレアーゼ二量体の第1、第2、又は両方の単量体は、核局在化シグナルを含む。核局在化シグナル(「NLS」)は、本明細書に記載される。例示的な核局在化配列としては、限定されるものではないが、SV40ラージT抗原、ヌクレオプラスミン、EGL−13、c−Myc、及びTUSタンパク質からのNLSが挙げられる。一部の実施形態において、NLSは、配列PKKKRKV(配列番号1)を含む。一部の実施形態において、NLSは、配列AVKRPAATKKAGQAKKKKLD(配列番号2)を含む。一部の実施形態において、NLSは、配列PAAKRVKLD(配列番号3)を含む。
一部の実施形態において、NLSは、配列MSRRRKANPTKLSENAKKLAKEVEN(配列番号4)を含む。一部の実施形態において、NLSは、配列KLKIKRPVK(配列番号5)を含む。他の核局在化配列としては、限定されるものではないが、hnRNPA1の酸性M9ドメイン、酵母転写抑制因子Matα2中の配列KIPIK(配列番号6)、及びPY−NLSが挙げられる。
シームレス突然変異誘発の方法
一部の実施形態において、本開示は、細胞中の標的ポリヌクレオチド配列中の1つ以上のヌクレオチドをシームレスに改変する方法を提供する。「シームレス突然変異誘発」は、例えば、突然変異を導入するために使用される選択遺伝子の存在下でのいかなる他の隣接変化も伴わない部位特異的突然変異誘発(すなわち、1つ以上のヌクレオチドの置換、欠失、又は挿入)を指す。タンパク質コード領域における突然変異誘発のためのシームレスDNA遺伝子操作は、有利である。それというのも、突然変異誘発ステップの間に導入される任意の外部配列がタンパク質発現を妨害し得るためである。本開示は、2ステップ選択/対抗選択方針を使用するシームレス突然変異誘発であって、選択カセット、例えば、抗生物質耐性遺伝子とそれに伴う対抗選択遺伝子の標的部位における挿入を最初に含むシームレス突然変異誘発を提供する。続いて、カセットは、通常、小分子、例えば、ストレプトマイシン又は糖の投与を含む対抗選択遺伝子に対する選択により所望の配列によりシームレスに置き換える。対抗選択マーカーの通例の任意選択としては、sacB、rpsL、並びに適切な宿主バックグラウンドにおいて選択し、及び対抗して選択することができるマーカー、例として、galK、thyA及びtolCが挙げられる。シームレス突然変異誘発の従来の方法は、例えば、Wang et al.,“Improved seamless mutagenesis by recombineering using ccdB for counterselection,”Nucleic Acids Research 42(5):e37(2014);Zhang et al.,“A new logic for DNA engineering using recombination in Escherichia coli,”Nature Genetics 20(2):123−128(1998);Westenberg et al.,“Counter−selection recombineering of the baculovirus genome:a strategy for seamless modification of repeat−containing BACs,”Nucleic Acids Research 38:e166(2010);Wong et al.,“Efficient and seamless DNA recombineering using a thymidylate synthase A selection system in Escherichia coli,”Nucleic Acids Research 33:e59(2005)に記載され、それらのそれぞれは参照により全体として本明細書に組み込まれる。
一部の実施形態において、本開示は、細胞中の標的ポリヌクレオチド配列中の1つ以上のヌクレオチドを改変する方法であって、(1)細胞中に、挿入カセット(IC)を含むベクター(ICは、5’−3’方向で、(a)標的ポリヌクレオチド配列の一部と相同である第1の領域、(b)標的ポリヌクレオチド配列中の1つ以上のヌクレオチドの突然変異を含む第2の領域、(c)第1のヌクレアーゼ結合部位、(d)マーカー遺伝子をコードするポリヌクレオチド配列、(e)第2のヌクレアーゼ結合部位、(f)標的ポリヌクレオチド配列中の1つ以上の突然変異を含む第3の領域、及び(g)標的ポリヌクレオチド配列の一部と相同である第4の領域を含み、第1の領域及び第4の領域は、標的ポリヌクレオチド配列のそれらのそれぞれの一部と95%〜100%同一である)を導入すること;(2)相同組換えを介して標的ポリヌクレオチド配列中にICを挿入して第1の改変標的ポリヌクレオチドを生成すること;(3)マーカー遺伝子を発現する細胞を選択すること;(4)第1の改変標的ポリヌクレオチドを部位特異的ヌクレアーゼに供して粘着末端を有する第2の改変標的ポリヌクレオチドを生成すること;及び(5)粘着末端を有する第2の改変標的ポリヌクレオチドをリガーゼ(リガーゼは、第2の領域及び第3の領域において粘着末端をライゲートする)に供して標的ポリヌクレオチド配列と比較して1つ以上の改変ヌクレオチドを含むライゲートされた改変標的核酸を作出することを含む方法を提供する。
一部の実施形態において、標的ポリヌクレオチド配列中の1つ以上のヌクレオチドの改変は、ヌクレオチド置換、すなわち、単一ヌクレオチド置換又は複数ヌクレオチド置換である。標的ポリヌクレオチド配列中の1つ以上のヌクレオチドの改変は、ポリヌクレオチドによりコードされるポリペプチド配列の変化をもたらし得る。標的ポリヌクレオチド配列中の1つ以上のヌクレオチドの改変は、細胞中の下流ポリヌクレオチド配列の発現の不活性化ももたらし得る。例えば、下流配列は不活性化され、その結果、その配列は転写されず、コードされるタンパク質は産生されず、又は配列は、その野生型配列が機能するようには機能しない。一部の実施形態において、標的ポリヌクレオチド配列は、調節配列である。一部の実施形態において、調節配列は、それが調節配列としてもはや機能しないように不活性化させることができる。調節配列の例は、本明細書に記載される。
シームレス突然変異誘発を介して細胞中の標的ポリヌクレオチド配列中の1つ以上のヌクレオチドを改変する方法は、挿入カセットを利用する。一部の実施形態において、挿入カセット(IC)は、ベクター上に存在する。ベクターの例は、本明細書に提供される。本明細書に記載のICは、
(i)標的ポリヌクレオチド配列の一部と相同である第1の領域、
(ii)1つ以上のヌクレオチドの標的ポリヌクレオチド配列の突然変異を含む第2の領域、
(iii)第1のヌクレアーゼ結合部位、
(iv)マーカー遺伝子をコードするポリヌクレオチド配列、
(v)第2のヌクレアーゼ結合部位、
(vi)1つ以上のヌクレオチドの標的ポリヌクレオチド配列の突然変異を含む第3の領域、及び
(vii)標的ポリヌクレオチド配列の一部と相同である第4の領域を含み、第1の領域及び第4の領域は、標的ポリヌクレオチド配列のそれらのそれぞれの一部と95%〜l00%同一である。
例示的なICは、図28に示される。図28において、ICは、5’−3’(二本鎖DNAの「トップ」又は「コード」鎖に関して)方向で、第1のヌクレアーゼ切断部位、第1のヌクレアーゼ結合部位、耐性マーカー、第2のヌクレアーゼ結合部位、及び第2のヌクレアーゼ切断部位を含む。第1及び第2のヌクレアーゼ切断部位は、標的ポリヌクレオチド配列内の所望のヌクレオチド突然変異を含む。
図27に示されるとおり、「ホモロジーアーム」(「HA」)は、第1のヌクレアーゼ切断部位の上流及び第2のヌクレアーゼ切断部位の下流に存在する。「ホモロジーアーム」は、標的ポリヌクレオチド配列の一部と相同である領域を含む。一部の実施形態において、標的ポリヌクレオチド配列の一部と相同であるICの第1の領域は、第1のヌクレアーゼ切断部位の上流のHAを含む。一部の実施形態において、標的ポリヌクレオチド配列の一部と相同であるICの第4の領域は、第2のヌクレアーゼ切断部位の下流のHAを含む。
一部の実施形態において、ICは、標的ポリヌクレオチド配列の一部と相同である第1の領域を含む。一部の実施形態において、ICは、標的ポリヌクレオチド配列の一部と相同である第4の領域を含む。一部の実施形態において、IC中の第1及び第4の領域は、標的ポリヌクレオチド配列のそれらのそれぞれの一部と少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、又は100%の配列同一性を有する。一部の実施形態において、IC中の第1及び第4領域のHAは、約10〜5000塩基対、約20〜2000塩基対、又は約50〜1750塩基対、又は約100〜1500塩基対、又は約200〜1250塩基対、又は約300〜1000塩基対、又は約400〜約750塩基対、又は約500〜600塩基対を有する。一部の実施形態において、IC中の第1及び第4の領域のHAは、約5、約10、約20、約30、約40、約50、約100、約250、約500、約100、約1250、約1500、約1750、約2000、約2250、又は約2500塩基対を有する。
一部の実施形態において、ICは、1つ以上のヌクレオチドの標的ポリヌクレオチド配列の突然変異を含む第2の領域を含む。一部の実施形態において、ICは、1つ以上のヌクレオチドの標的ポリヌクレオチド配列の突然変異を含む第3の領域を含む。図28及び29に示されるとおり、ヌクレアーゼ切断部位は、標的ポリヌクレオチド配列内の1つ以上のヌクレオチドの突然変異を含む。一部の実施形態において、ヌクレアーゼ切断部位は、任意の好適なヌクレアーゼの開裂部位である。例えば、ヌクレアーゼ切断部位は、制限酵素、例えば、HindIII、BamHI、EcoRI、BbvI、FokI、MmeIなどの開裂部位であり得る。一部の実施形態において、ICの第2の領域は、所望の突然変異を含む第1のヌクレアーゼ切断部位を含む。一部の実施形態において、ICの第3の領域は、所望の突然変異を含む第2のヌクレアーゼ切断部位を含む。一部の実施形態において、ICの第2及び第3の領域は、同一であり、又は実質的に同一である。
一部の実施形態において、ICは、第1及び第2のヌクレアーゼ結合部位を含む。ヌクレアーゼ結合部位は、任意の好適なヌクレアーゼの結合部位であり得る。例えば、制限酵素、ジンクフィンガーヌクレアーゼ、TALEN(転写活性化因子様エンドヌクレアーゼ)、又はCas9のヌクレアーゼ結合部位である。例えば、ヌクレアーゼがCas9である場合、ガイドRNAは、PAMの上流(すなわち、関連DNA鎖に関して5’)の任意の配列にハイブリダイズするように設計することができる。したがって、一部の実施形態において、ヌクレアーゼ結合部位は、PAMの上流に存在する。一部の実施形態において、第1及び第2のヌクレアーゼ結合部位は、同一であり、又は実質的に同一である。
一部の実施形態において、ICは、マーカー遺伝子をコードするポリヌクレオチドを含む。「マーカー」遺伝子は、核酸配列が標的配列中に良好に挿入されたか否かを決定するために使用する。マーカー遺伝子は、選択マーカー(例えば、耐性又は選択マーカー)又はスクリーニング可能マーカー(例えば、蛍光又は比色マーカー)であり得る。
耐性/選択マーカーの非限定的な例としては、抗生物質耐性遺伝子(例えば、アンピシリン耐性遺伝子、カナマイシン耐性遺伝子など)及び他の抗生物質耐性遺伝子;栄養要求性マーカー(例えば、URA3、HIS3)及び/又は他の宿主細胞選択マーカー;ドナー核酸中への挿入を容易にするための核酸、例えば、マイコプラズマ(Mycoplasma)ゲノム中への転位のための、例えば、トランスポゼース及び逆向き反復配列;宿主細胞中の複製及び分離を支援するための核酸、例えば、自律複製配列(ARS)又はセントロメア配列(CEN)が挙げられる。
スクリーニング可能マーカーは、マーカー遺伝子を含有する細胞を異なる外見とする。スクリーニング可能マーカーの非限定的な例としては、緑色蛍光タンパク質(GFP)及びそのバリアント(例えば、黄色蛍光タンパク質、赤色蛍光タンパク質など);細胞をその青色染色により検出するためにGUSアッセイにおいて使用されるβ−グルクロニダーゼ;及び当業者に周知のブルー/ホワイトスクリーンにおいて使用されるX−galが挙げられる。
マーカー遺伝子を発現する細胞の選択方法は、使用されるマーカーに応じて変動する。例えば、抗生物質耐性マーカーを使用する場合、選択は、抗生物質を含有する培養培地中で細胞の集団を成長させ、生存細胞を回収することを含む。スクリーニング可能マーカー、例えば、GFPを使用する場合、選択は、緑色である細胞を回収することを含む。細胞の回収は、例えば、培養プレートからコロニーを手作業によりピックすることにより、又はフローサイトメトリー装置、例えば、蛍光活性化細胞ソーティング(FACS)を使用してソートすることにより実施することができる。
シームレス突然変異誘発の方法の実施形態において、方法の第1のステップは、細胞中に、ICを含むベクターを導入することを含む。ベクターは、細胞中に、当分野において定型的な方法、例えば、形質移入、形質導入、細胞融合、及びリポフェクションなどを使用して導入することができる。細胞中へのベクターの導入は、本明細書にさらに記載される。
シームレス突然変異誘発の方法の実施形態において、方法の第2のステップは、相同組換えを介して標的ポリヌクレオチド配列中にICを挿入して第1の改変標的ポリヌクレオチドを生成することを含む。図27に例示されるとおり、相同組換えを介して標的ポリヌクレオチド配列中に耐性カセットを挿入する(「GATC」配列のいずれかの側上の交差により示される)。特異的相同組換えについて本明細書に記載のベクターは、染色体中へのベクターの相補的結合及び取り込みを可能とするための染色体の配列と相同性の十分に長い領域(すなわち、IC中の第1及び第4の領域)を含有する。本明細書に記載の、より長い相同性の領域、及びより大きい配列類似性の程度は、相同組換えの効率を増加させ得る。
シームレス突然変異誘発の方法の実施形態において、方法の第3のステップは、マーカー遺伝子を発現する細胞を選択することを含む。本明細書に記載の、マーカー遺伝子を発現する細胞の選択方法は、選択マーカーに依存する。選択方法、及び種々の型のマーカー遺伝子は、本明細書に記載される。
シームレス突然変異誘発の方法の実施形態において、方法の第4のステップは、第1の改変標的ポリヌクレオチド(すなわち、上記ステップ(2)から生成された第1の改変標的ポリヌクレオチド)を部位特異的ヌクレアーゼに供して粘着末端を有する第2の改変標的ポリヌクレオチドを生成することを含む。一部の実施形態において、粘着末端は、ICの第2及び第3の領域に存在する。部位特異的ヌクレアーゼは、粘着末端を生成する任意の部位特異的ヌクレアーゼ、例として、限定されるものではないが、制限酵素、本明細書に記載のCas9−エンドヌクレアーゼ、又は本明細書に記載のstiCas9であり得る。一部の実施形態において、ヌクレアーゼは、粘着末端を含む二本鎖DNA分解を生成する。一部の実施形態において、部位特異的ヌクレアーゼは、細胞に対して外因性であり、すなわち、部位特異的ヌクレアーゼは、細胞中で天然に生じない。一部の実施形態において、部位特異的ヌクレアーゼは、細胞中に導入する。一部の実施形態において、部位特異的ヌクレアーゼは、細胞中に、部位特異的ヌクレアーゼをコードするポリヌクレオチドとして導入する。ポリヌクレオチド(例えば、ベクターなど)を導入する方法は、本明細書に記載され、それとしては、例えば、形質移入、形質導入、細胞融合、及びリポフェクションが挙げられる。一部の実施形態において、部位特異的ヌクレアーゼは、組換え部位特異的ヌクレアーゼである。本明細書に記載の、組換えタンパク質は、それらを産生する細胞に由来しないタンパク質、又は天然で存在することが公知でない遺伝子材料の新たな組合せから生じる配列を有するタンパク質、例えば、細胞中に導入された外因性核酸から発現されるタンパク質などを指す。一部の実施形態において、組換え部位特異的ヌクレアーゼは、細胞に由来しない核酸から発現させる。
一部の実施形態において、部位特異的ヌクレアーゼは、Cas9エフェクタータンパク質である。Cas9タンパク質は、本明細書に記載される。一部の実施形態において、Cas9エフェクタータンパク質は、II−B型Cas9である。II−B型Cas9タンパク質は、本明細書に記載され、粘着末端を生成し得る。本明細書に記載の、II−B型CRISPR系は、とりわけ、casオペロン上のcas4遺伝子の存在により同定され、II−B型Cas9タンパク質は、TIGR03031 TIGRFAMタンパク質ファミリーのものである。したがって、一部の実施形態において、部位特異的ヌクレアーゼは、TIGR03031 TIGRFAMタンパク質ファミリーのものである。一部の実施形態において、部位特異的ヌクレアーゼは、1E−5のE値カットオフを用いてTIGR03031タンパク質ファミリーにマッチするドメインを含む。一部の実施形態において、部位特異的ヌクレアーゼは、1E−10のE値カットオフを用いてTIGR03031タンパク質ファミリーにマッチするドメインを含む。II−B型CRISPR系は、細菌種、例えば、レジオネラ・ニューモフィラ(Legionella pneumophila)、フランシセラ・ノビシダ(Francisella novicida)、ガンマプロテオバクテリア(gamma proteobacterium)HTCC5015、パラサテレラ・エキスクレメンティホミニス(Parasutterella excrementihominis)、サテレラ・ワズワーセンシス(Sutterella wadsworthensis)、スルフロスピリラム属種(Sulfurospirillum sp.)SCADC、ルミノバクター属種(Ruminobacter sp.)RM87、バークホルデリア・バクテリウム(Burkholderiales bacterium)1_1_47、バクテロイデス・オーラル・タクソン(Bacteroidetes oral taxon)274株F0058、ウォリネラ・スクシノゲネス(Wolinella succinogenes)、バークホルデリア・バクテリウム(Burkholderiales bacterium)YL45、ルミノバクター・アミロフィラス(Ruminobacter amylophilus)、カンピロバクター属種(Campylobacter sp.)P0111、カンピロバクター属種(Campylobacter sp.)RM9261、カンピロバクター・ラニエナエ(Campylobacter lanienae)株RM8001、カンプリロバクター・ラニエナエ(Camplylobacter lanienae)株P0121、ツリシモナス・ムリス(Turicimonas muris)、レジオネラ・ロンジニエンシス(Legionella londiniensis)、サリニビブリオ・シャルメンシス(Salinivibrio sharmensis)、レプトスピラ属種(Leptospira sp.)単離株FW.030、モリテラ属種(Moritella sp.)単離株NORP46、エンドゾイコモナス属種(Endozoicomonassp.)S−B4−1U、タミルナドゥイバクター・サリナス(Tamilnaduibacter salinus)、ビブリオ・ナトリエゲンス(Vibrio natriegens)、アルコバクター・スキロウイイ(Arcobacter skirrowii)、フランシセラ・フィロミラギア(Francisella philomiragia)、フランシセラ・ヒスパニエンシス(Francisella hispaniensis)、又はパレンドゾイコモナス・ハリクロナエ(Parendozoicomonas haliclonae)などに見出される。
一部の実施形態において、部位特異的ヌクレアーゼは、Cas9−エンドヌクレアーゼ融合タンパク質である。Cas9−エンドヌクレアーゼタンパク質は、本明細書に記載される。一部の実施形態において、Cas9−エンドヌクレアーゼ融合タンパク質は、Cas9のDNA標的化ドメイン及びエンドヌクレアーゼのヌクレアーゼドメインを含む。一部の実施形態において、Cas9−エンドヌクレアーゼ融合タンパク質中のエンドヌクレアーゼは、IIS型エンドヌクレアーゼである。IIS型エンドヌクレアーゼの例は、本明細書に提供され、それとしては、BbvI、BgcI、BfuAI、BmpI、BspMI、CspCI、FokI、MboII、MmeI、NmeAIII、及びPleIが挙げられる。一部の実施形態において、Cas9−エンドヌクレアーゼ融合タンパク質中のエンドヌクレアーゼは、FokIである。FokIによるDNA開裂は、2つのFokI単量体の二量体化時にのみ生じる。DNAのFokI開裂は、4塩基対オーバーハングを有する粘着末端を生成する。
一部の実施形態において、Cas9−エンドヌクレアーゼ融合タンパク質は、改変Cas9を含む。改変Cas9は、本明細書に記載され、触媒的に不活性なCas9及びニッカーゼ活性を有するCas9を含む。一部の実施形態において、改変Cas9は、触媒的に不活性なCas9(「deadCas9」)である。触媒的に不活性なCas9は、DNAを開裂させ得ず(すなわち、Cas9の開裂ドメインが不活性化されている);しかしながら、それらは、ガイドポリヌクレオチド(例えば、ガイドRNA)との複合体を形成することにより核酸配列を標的化する能力を保持する。触媒的に不活性なCas9は、本明細書に記載される。一部の実施形態において、触媒的に不活性なCas9は、野生型Cas9に対して二重アミノ酸置換を含む。一部の実施形態において、二重アミノ酸置換は、D10A及びH840Aである。一部の実施形態において、Cas9−エンドヌクレアーゼ融合タンパク質は、触媒的に不活性なCas9を含み、エンドヌクレアーゼは、FokIである。
一部の実施形態において、改変Cas9は、ニッカーゼ活性を有するCas9(「Cas9ニッカーゼ」又は「Cas9n」)である。Cas9ニッカーゼは、二本鎖DNAの一方の鎖のみを開裂させ得る(すなわち、DNAを「ニッキングする」)。Cas9ニッカーゼは、本明細書に記載される。一部の実施形態において、Cas9ニッカーゼは、野生型Cas9に対して単一アミノ酸置換を含む。一部の実施形態において、単一アミノ酸置換は、D10A(「Cas9n(D10A)」)である。一部の実施形態において、単一アミノ酸置換は、H840A(「Cas9n(H840A)」)である。一部の実施形態において、Cas9−エンドヌクレアーゼ融合タンパク質は、ニッカーゼ活性を有するCas9を含み、エンドヌクレアーゼは、FokIである。一部の実施形態において、Cas9−エンドヌクレアーゼ融合タンパク質は、D10A突然変異を有するCas9を含み、エンドヌクレアーゼは、FokIである。一部の実施形態において、Cas9−エンドヌクレアーゼ融合タンパク質は、H840A突然変異を有するCas9を含み、エンドヌクレアーゼは、FokIである。
一部の実施形態において、部位特異的ヌクレアーゼは、Cpf1である。Cpf1(セントロメアプロモーター因子1)は、粘着末端を生成し得るCRISPR/Cpf1系に見出される単一RNAガイド型エンドヌクレアーゼである。CRISPR/Cpf1系は、CRISPR/Cas9系と相似である。しかしながら、Cas9及びCpf1間のいくつかの有意差が存在する。Cpf1は、tracrRNAを利用しない。Cpf1タンパク質は、Cas9と異なるPAM配列を認識する。Cpf1のPAM配列は、5’Tリッチモチーフ、例えば、5’−TTTN−3’(Nは、A、T、C、又はGである)などである。Cpf1は、Cas9と異なる部位において開裂させる。Cas9がPAMに隣接する配列において開裂させる一方、Cpf1は、PAMからさらに遠い配列において開裂させる。Cp1タンパク質は、例えば、外国特許出願公開の英国特許出願公開第1506509.7号明細書、米国特許第9,580,701号明細書、米国特許出願公開第2016/0208243号明細書、及びZetsche et al.,“Cpf1 Is a Single RNA−Guided Endonuclease of a Class 2 CRISPR−Cas System,”Cell 163(3):759−771(2015)にさらに記載されており、それらのそれぞれは参照により全体として本明細書に組み込まれる。
一部の実施形態において、部位特異的ヌクレアーゼは、Cas9、Cpf1、又はCas9−FokIである。
一部の実施形態において、部位特異的ヌクレアーゼにより生成される粘着末端は、5’オーバーハングを含む。一部の実施形態において、部位特異的ヌクレアーゼにより生成される粘着末端は、3’オーバーハングを含む。一部の実施形態において、部位特異的ヌクレアーゼは、3〜40ヌクレオチドの一本鎖ポリヌクレオチドを含む粘着末端を生成する。一部の実施形態において、部位特異的ヌクレアーゼは、4〜30ヌクレオチドの一本鎖ポリヌクレオチドを含む粘着末端を生成する。一部の実施形態において、部位特異的ヌクレアーゼは、5〜20ヌクレオチドの一本鎖ポリヌクレオチドを含む粘着末端を生成する。一部の実施形態において、部位特異的ヌクレアーゼは、約5ヌクレオチド、約10ヌクレオチド、約15ヌクレオチド、約20ヌクレオチド、約25ヌクレオチド、又は約30ヌクレオチドの一本鎖ポリヌクレオチドを含む粘着末端を生成する。一部の実施形態において、deadCas9−FokI二量体は、4−ヌクレオチド5’オーバーハングを含む粘着末端を生成する。一部の実施形態において、Cas9n(D10A)−FokI二量体は、27−ヌクレオチド5’オーバーハングを含む粘着末端を含む。一部の実施形態において、Cas9(H840A)−FokI二量体は、23−ヌクレオチド3’オーバーハングを含む粘着末端を生成する。
方法の実施形態において、方法の第5のステップは、粘着末端を有する第2の改変標的ポリヌクレオチドをリガーゼ(リガーゼは、第2の領域及び第3の領域において粘着末端をライゲートする)に供して標的ポリヌクレオチド配列と比較して1つ以上の改変ヌクレオチドを含むライゲートされた改変標的核酸を作出することを含む。リガーゼは、化学結合の形成により2つ以上の核酸断片の結合を触媒する酵素である。一部の実施形態において、リガーゼは、ホスホジエステル結合の形成を触媒することにより2つ以上のDNA断片を一緒に結合させる。任意の好適なリガーゼを使用することができ、好適なリガーゼは当業者により決定することができる。リガーゼの非限定的な例としては、大腸菌(E.coli)リガーゼ、バクテリオファージT4からのT4DNAリガーゼ、DNAリガーゼI、DNAリガーゼII、DNAリガーゼIII、DNAリガーゼIV、及び熱安定性リガーゼ、例えば、Ampligase(登録商標)DNAリガーゼが挙げられる。リガーゼは、平滑末端又は粘着末端をライゲートし得る。一部の実施形態において、リガーゼは、粘着末端をライゲートする。一部の実施形態において、リガーゼは、DNA断片をライゲートするためにATPを要求する。
一部の実施形態において、リガーゼは、細胞に対して外因性であり、すなわち、リガーゼは、細胞中で天然に生じない。一部の実施形態において、リガーゼは、細胞中に導入する。一部の実施形態において、リガーゼは、細胞中に、リガーゼをコードするポリヌクレオチドとして導入する。ポリヌクレオチド(例えば、ベクターなど)を導入する方法は、本明細書に記載される。一部の実施形態において、リガーゼは、組換えリガーゼ、すなわち、細胞に由来しない核酸から発現されるリガーゼである。
一部の実施形態において、ライゲートされた改変標的核酸は、標的ポリヌクレオチド配列と比較して1つ以上の改変ヌクレオチドを含むが、標的ポリヌクレオチド配列の上流又は下流にマーカー遺伝子もいかなる追加のヌクレオチドも含まず、すなわち、標的ポリヌクレオチド配列をシームレスに突然変異させた。
方法の実施形態において、第1の改変標的核酸は、第3のステップ後に細胞から単離する。細胞から核酸を単離する方法は、当分野において十分確立されており、それとしては、例えば、フェノール/クロロホルム抽出、低pH/高塩条件下の沈殿、及び固相抽出が挙げられる。市販の核酸単離用キット、例えば、QIAGEN Miniprep Kit、Bio−Rad Quantum Prep(登録商標)Miniprep Kit、及びZymo Research ZYMOPURE Plasmid Miniprep Kitを使用することができる。
方法の実施形態において、第1の改変標的核酸は、第3のステップ後に細胞中に存在し、すなわち、核酸は、細胞から単離しない。一部の実施形態において、方法のステップ(1)〜(5)は、同一細胞内で実施する。一部の実施形態において、方法の構成成分は、細胞中に導入する。一部の実施形態において、挿入カセットを含むベクター、部位特異的ヌクレアーゼ、及びリガーゼを細胞中に導入する。ベクター及びタンパク質を細胞中に導入する方法は、本明細書に記載され、それとしては、例えば、送達粒子、ベシクル、及び/又はベクター、例として、ウイルスベクターを介する送達が挙げられる。
方法の実施形態において、標的ポリヌクレオチド配列は、プラスミド中に存在する。プラスミド及びその例は、本明細書に記載される。一部の実施形態において、標的ポリヌクレオチド配列を含有するプラスミドは、天然細菌プラスミド(すなわち、細菌細胞中で天然に生じるプラスミド)である。一部の実施形態において、標的ポリヌクレオチド配列を含有するプラスミドは、細胞中に導入される外因性プラスミドである。一部の実施形態において、細胞は、細菌細胞である。一部の実施形態において、プラスミドは、遺伝子操作プラスミドである。一部の実施形態において、プラスミド中の1つ以上のヌクレオチドの改変は、細胞の挙動の改変をもたらす。挙動の改変は、改変タンパク質の発現、より高い又は低いレベルの1つ以上のタンパク質の発現、抗生物質に対する耐性又は感受性の増加、小分子及び/又はタンパク質に対する応答の変更、小分子及び/又はタンパク質の産生の変更などであり得る。
方法の実施形態において、標的ポリヌクレオチド配列は、染色体中に存在する。染色体は、原核生物染色体でも真核生物染色体でもよい。一部の実施形態において、染色体は、真核細胞のものである。一部の実施形態において、染色体は、ヒト細胞のものである。一部の実施形態において、染色体は、動物細胞のものである。一部の実施形態において、染色体は、植物細胞のものである。一部の実施形態において、染色体中の1つ以上のヌクレオチドの改変は、細胞の挙動の改変をもたらす。挙動の改変は、改変タンパク質の発現、より高い又は低いレベルの1つ以上のタンパク質の発現、抗生物質に対する耐性又は感受性の増加、小分子及び/又はタンパク質に対する応答の変更、小分子及び/又はタンパク質の産生の変更などであり得る。
遺伝子操作ガイドRNA(sgRNA)
一部の実施形態において、本開示は、stiCas9タンパク質との複合体を形成する遺伝子操作ガイドRNAであって、(a)真核細胞中の標的配列にハイブリダイズし得るガイド配列;及び(b)Cas9タンパク質に結合し得るtracrRNA配列を含み、tracrRNAは、天然発生tracrRNA配列と少なくとも10ヌクレオチドだけ異なり、Cas9タンパク質のヌクレアーゼ効率を改善する遺伝子操作ガイドRNAを提供する。
一部の実施形態において、本明細書に記載のガイドポリヌクレオチド、例えば、ガイドRNAは、Cas9タンパク質との複合体を形成し、すなわち、一部の実施形態において、ガイドポリヌクレオチドは、Cas9に結合する。一部の実施形態において、ガイドポリヌクレオチドのDNA結合セグメントは、真核細胞中の標的配列とハイブリダイズするが、細菌細胞中の配列とハイブリダイズしない。
一部の実施形態において、ガイドポリヌクレオチドは、10〜150ヌクレオチドである。一部の実施形態において、ガイドポリヌクレオチドは、20〜120ヌクレオチドである。一部の実施形態において、ガイドポリヌクレオチドは、30〜100ヌクレオチドである。一部の実施形態において、ガイドポリヌクレオチドは、40〜80ヌクレオチドである。一部の実施形態において、ガイドポリヌクレオチドは、50〜60ヌクレオチドである。一部の実施形態において、ガイドポリヌクレオチドは、10〜35ヌクレオチドである。一部の実施形態において、ガイドポリヌクレオチドは、15〜30ヌクレオチドである。一部の実施形態において、ガイドポリヌクレオチドは、20〜25ヌクレオチドである。
ガイドポリヌクレオチドは、標的細胞中に、単離分子、例えば、RNA分子として導入することができ、又は細胞中に、ガイドポリヌクレオチドをコードするDNAを含有する発現ベクターを使用して導入する。
天然発生CRISPR系は、標的配列に相補的な領域を含有するcrRNA、及びCas9タンパク質に結合し、crRNAともハイブリダイズするtracrRNAを利用する。crRNA/tracrRNAハイブリッドは、標的配列へのcrRNA部分の結合及びCas9タンパク質へのtracrRNA部分の結合を可能とするRNA二次構造を形成する。RNA二次構造の非限定的な例としては、ヘリックス、ステムループ、及びシュードノットが挙げられる。一部の実施形態において、Cas9タンパク質は、結合のためにcrRNA/tracrRNAハイブリッド中の少なくとも1つのステムループを認識する。
遺伝子操作CRISPR−Cas系、例えば、本開示のCRISPR−Cas系などにおいて、標的配列との相補性及びCas9タンパク質への結合の両方を示し得る単一ガイドポリヌクレオチドを利用することが有利であり得る。したがって、一部の実施形態において、本開示は、粘着末端を生成し得るCas9エフェクタータンパク質(stiCas9);及びstiCas9との複合体を形成し、ガイド配列(ガイド配列は、真核細胞中の標的配列とハイブリダイズし得るが、細菌細胞中の配列にハイブリダイズしない)を含むガイドポリヌクレオチドを含み;複合体は天然に生じず、tracrRNAを含まない非天然発生CRISPR−Cas系を提供する。一部の実施形態において、ガイドポリヌクレオチドは、少なくとも1つの二次構造を形成する。一部の実施形態において、少なくとも1つの二次構造は、ステムループ、ヘリックス、又はシュードノットの1つである。
本明細書に記載の遺伝子操作ガイドポリヌクレオチドを最適化してCas9タンパク質に対する結合親和性を改善し、及び/又は標的配列に対する標的化効率を増加させることが有利であり得る。例えば、Dang et al.,Genome Biology 16:280(2015);Nowak et al.,Nucleic Acids Res 44(20):9555−9564(2016);及びVejnar et al.,Cold Spring Harb Protoc,doi:l0.110l/pdb.top090894(2016)参照。一部の実施形態において、遺伝子操作ガイドポリヌクレオチド、例えば、ガイドRNAは、天然発生crRNA及びtracrRNAの組合せよりも短い。一部の実施形態において、遺伝子操作ガイドRNAは、天然発生crRNA及びtracrRNAの組合せよりも少なくとも5ヌクレオチド短く、少なくとも6ヌクレオチド短く、少なくとも7ヌクレオチド短く、少なくとも8ヌクレオチド短く、少なくとも8ヌクレオチド短く、少なくとも9ヌクレオチド短く、少なくとも10ヌクレオチド短く、少なくとも11ヌクレオチド短く、少なくとも12ヌクレオチド短く、少なくとも13ヌクレオチド短く、少なくとも14ヌクレオチド短く、少なくとも15ヌクレオチド短く、少なくとも16ヌクレオチド短く、少なくとも17ヌクレオチド短く、少なくとも18ヌクレオチド短く、少なくとも19ヌクレオチド短く、少なくとも20ヌクレオチド短く、少なくとも21ヌクレオチド短く、少なくとも22ヌクレオチド短く、少なくとも23ヌクレオチド短く、少なくとも24ヌクレオチド短く、少なくとも25ヌクレオチド短く、少なくとも26ヌクレオチド短く、少なくとも27ヌクレオチド短く、少なくとも28ヌクレオチド短く、少なくとも29ヌクレオチド短く、又は少なくとも30ヌクレオチド短い。
一部の実施形態において、tracrRNA配列は、天然発生tracrRNA配列よりも少なくとも5ヌクレオチド短く、少なくとも6ヌクレオチド短く、少なくとも7ヌクレオチド短く、少なくとも8ヌクレオチド短く、少なくとも8ヌクレオチド短く、少なくとも9ヌクレオチド短く、少なくとも10ヌクレオチド短く、少なくとも11ヌクレオチド短く、少なくとも12ヌクレオチド短く、少なくとも13ヌクレオチド短く、少なくとも14ヌクレオチド短く、少なくとも15ヌクレオチド短く、少なくとも16ヌクレオチド短く、少なくとも17ヌクレオチド短く、少なくとも18ヌクレオチド短く、少なくとも19ヌクレオチド短く、少なくとも20ヌクレオチド短く、少なくとも21ヌクレオチド短く、少なくとも22ヌクレオチド短く、少なくとも23ヌクレオチド短く、少なくとも24ヌクレオチド短く、少なくとも25ヌクレオチド短く、少なくとも26ヌクレオチド短く、少なくとも27ヌクレオチド短く、少なくとも28ヌクレオチド短く、少なくとも29ヌクレオチド短く、又は少なくとも30ヌクレオチド短い。
一部の実施形態において、遺伝子操作ガイドポリヌクレオチドは、天然発生crRNA及びtracrRNAの組合せよりも5ヌクレオチド〜40ヌクレオチド短く、6ヌクレオチド〜40ヌクレオチド短く、7ヌクレオチド〜40ヌクレオチド短く、8ヌクレオチド〜40ヌクレオチド短く、9ヌクレオチド〜40ヌクレオチド短く、10ヌクレオチド〜40ヌクレオチド短く、11ヌクレオチド〜40ヌクレオチド短く、12ヌクレオチド〜40ヌクレオチド短く、13ヌクレオチド〜40ヌクレオチド短く、14ヌクレオチド〜40ヌクレオチド短く、15ヌクレオチド〜40ヌクレオチド短く、16ヌクレオチド〜40ヌクレオチド短く、17ヌクレオチド〜40ヌクレオチド短く、18ヌクレオチド〜40ヌクレオチド短く、19ヌクレオチド〜40ヌクレオチド短く、20ヌクレオチド〜40ヌクレオチド短く、21ヌクレオチド〜40ヌクレオチド短く、22ヌクレオチド〜40ヌクレオチド短く、23ヌクレオチド〜40ヌクレオチド短く、24ヌクレオチド〜40ヌクレオチド短く、25ヌクレオチド〜40ヌクレオチド短く、26ヌクレオチド〜40ヌクレオチド短く、27ヌクレオチド〜40ヌクレオチド短く、28ヌクレオチド〜40ヌクレオチド短く、29ヌクレオチド〜40ヌクレオチド短く、30ヌクレオチド〜40ヌクレオチド短く、31ヌクレオチド〜40ヌクレオチド短く、32ヌクレオチド〜40ヌクレオチド短く、33ヌクレオチド〜40ヌクレオチド短く、34ヌクレオチド〜40ヌクレオチド短く、35ヌクレオチド〜40ヌクレオチド短く、36ヌクレオチド〜40ヌクレオチド短く、37ヌクレオチド〜40ヌクレオチド短く、38ヌクレオチド〜40ヌクレオチド短く、又は39ヌクレオチド〜40ヌクレオチド短い。
一部の実施形態において、遺伝子操作tracrRNAは、天然発生tracrRNAよりも5ヌクレオチド〜40ヌクレオチド短く、6ヌクレオチド〜40ヌクレオチド短く、7ヌクレオチド〜40ヌクレオチド短く、8ヌクレオチド〜40ヌクレオチド短く、9ヌクレオチド〜40ヌクレオチド短く、10ヌクレオチド〜40ヌクレオチド短く、11ヌクレオチド〜40ヌクレオチド短く、12ヌクレオチド〜40ヌクレオチド短く、13ヌクレオチド〜40ヌクレオチド短く、14ヌクレオチド〜40ヌクレオチド短く、15ヌクレオチド〜40ヌクレオチド短く、16ヌクレオチド〜40ヌクレオチド短く、17ヌクレオチド〜40ヌクレオチド短く、18ヌクレオチド〜40ヌクレオチド短く、19ヌクレオチド〜40ヌクレオチド短く、20ヌクレオチド〜40ヌクレオチド短く、21ヌクレオチド〜40ヌクレオチド短く、22ヌクレオチド〜40ヌクレオチド短く、23ヌクレオチド〜40ヌクレオチド短く、24ヌクレオチド〜40ヌクレオチド短く、25ヌクレオチド〜40ヌクレオチド短く、26ヌクレオチド〜40ヌクレオチド短く、27ヌクレオチド〜40ヌクレオチド短く、28ヌクレオチド〜40ヌクレオチド短く、29ヌクレオチド〜40ヌクレオチド短く、30ヌクレオチド〜40ヌクレオチド短く、31ヌクレオチド〜40ヌクレオチド短く、32ヌクレオチド〜40ヌクレオチド短く、33ヌクレオチド〜40ヌクレオチド短く、34ヌクレオチド〜40ヌクレオチド短く、35ヌクレオチド〜40ヌクレオチド短く、36ヌクレオチド〜40ヌクレオチド短く、37ヌクレオチド〜40ヌクレオチド短く、38ヌクレオチド〜40ヌクレオチド短く、又は39ヌクレオチド〜40ヌクレオチド短い。
一部の実施形態において、遺伝子操作ガイドポリヌクレオチド、例えば、ガイドRNAは、天然発生crRNA及びtracrRNAの組合せよりも長い。一部の実施形態において、遺伝子操作ガイドRNAは、天然発生crRNA及びtracrRNAの組合せよりも少なくとも5ヌクレオチド長く、少なくとも6ヌクレオチド長く、少なくとも7ヌクレオチド長く、少なくとも8ヌクレオチド長く、少なくとも8ヌクレオチド長く、少なくとも9ヌクレオチド長く、少なくとも10ヌクレオチド長く、少なくとも11ヌクレオチド長く、少なくとも12ヌクレオチド長く、少なくとも13ヌクレオチド長く、少なくとも14ヌクレオチド長く、少なくとも15ヌクレオチド長く、少なくとも16ヌクレオチド長く、少なくとも17ヌクレオチド長く、少なくとも18ヌクレオチド長く、少なくとも19ヌクレオチド長く、少なくとも20ヌクレオチド長く、少なくとも21ヌクレオチド長く、少なくとも22ヌクレオチド長く、少なくとも23ヌクレオチド長く、少なくとも24ヌクレオチド長く、少なくとも25ヌクレオチド長く、少なくとも26ヌクレオチド長く、少なくとも27ヌクレオチド長く、少なくとも28ヌクレオチド長く、少なくとも29ヌクレオチド長く、又は少なくとも30ヌクレオチド長い。
一部の実施形態において、tracrRNA配列は、天然発生tracrRNA配列よりも少なくとも5ヌクレオチド長く、少なくとも6ヌクレオチド長く、少なくとも7ヌクレオチド長く、少なくとも8ヌクレオチド長く、少なくとも8ヌクレオチド長く、少なくとも9ヌクレオチド長く、少なくとも10ヌクレオチド長く、少なくとも11ヌクレオチド長く、少なくとも12ヌクレオチド長く、少なくとも13ヌクレオチド長く、少なくとも14ヌクレオチド長く、少なくとも15ヌクレオチド長く、少なくとも16ヌクレオチド長く、少なくとも17ヌクレオチド長く、少なくとも18ヌクレオチド長く、少なくとも19ヌクレオチド長く、少なくとも20ヌクレオチド長く、少なくとも21ヌクレオチド長く、少なくとも22ヌクレオチド長く、少なくとも23ヌクレオチド長く、少なくとも24ヌクレオチド長く、少なくとも25ヌクレオチド長く、少なくとも26ヌクレオチド長く、少なくとも27ヌクレオチド長く、少なくとも28ヌクレオチド長く、少なくとも29ヌクレオチド長く、又は少なくとも30ヌクレオチド長い。
一部の実施形態において、遺伝子操作ガイドポリヌクレオチドは、天然発生crRNA及びtracrRNAの組合せよりも5ヌクレオチド〜40ヌクレオチド長く、6ヌクレオチド〜40ヌクレオチド長く、7ヌクレオチド〜40ヌクレオチド長く、8ヌクレオチド〜40ヌクレオチド長く、9ヌクレオチド〜40ヌクレオチド長く、10ヌクレオチド〜40ヌクレオチド長く、11ヌクレオチド〜40ヌクレオチド長く、12ヌクレオチド〜40ヌクレオチド長く、13ヌクレオチド〜40ヌクレオチド長く、14ヌクレオチド〜40ヌクレオチド長く、15ヌクレオチド〜40ヌクレオチド長く、16ヌクレオチド〜40ヌクレオチド長く、17ヌクレオチド〜40ヌクレオチド長く、18ヌクレオチド〜40ヌクレオチド長く、19ヌクレオチド〜40ヌクレオチド長く、20ヌクレオチド〜40ヌクレオチド長く、21ヌクレオチド〜40ヌクレオチド長く、22ヌクレオチド〜40ヌクレオチド長く、23ヌクレオチド〜40ヌクレオチド長く、24ヌクレオチド〜40ヌクレオチド長く、25ヌクレオチド〜40ヌクレオチド長く、26ヌクレオチド〜40ヌクレオチド長く、27ヌクレオチド〜40ヌクレオチド長く、28ヌクレオチド〜40ヌクレオチド長く、29ヌクレオチド〜40ヌクレオチド長く、30ヌクレオチド〜40ヌクレオチド長く、31ヌクレオチド〜40ヌクレオチド長く、32ヌクレオチド〜40ヌクレオチド長く、33ヌクレオチド〜40ヌクレオチド長く、34ヌクレオチド〜40ヌクレオチド長く、35ヌクレオチド〜40ヌクレオチド長く、36ヌクレオチド〜40ヌクレオチド長く、37ヌクレオチド〜40ヌクレオチド長く、38ヌクレオチド〜40ヌクレオチド長く、又は39ヌクレオチド〜40ヌクレオチド長い。
一部の実施形態において、遺伝子操作tracrRNAは、天然発生tracrRNAよりも5ヌクレオチド〜40ヌクレオチド長く、6ヌクレオチド〜40ヌクレオチド長く、7ヌクレオチド〜40ヌクレオチド長く、8ヌクレオチド〜40ヌクレオチド長く、9ヌクレオチド〜40ヌクレオチド長く、10ヌクレオチド〜40ヌクレオチド長く、11ヌクレオチド〜40ヌクレオチド長く、12ヌクレオチド〜40ヌクレオチド長く、13ヌクレオチド〜40ヌクレオチド長く、14ヌクレオチド〜40ヌクレオチド長く、15ヌクレオチド〜40ヌクレオチド長く、16ヌクレオチド〜40ヌクレオチド長く、17ヌクレオチド〜40ヌクレオチド長く、18ヌクレオチド〜40ヌクレオチド長く、19ヌクレオチド〜40ヌクレオチド長く、20ヌクレオチド〜40ヌクレオチド長く、21ヌクレオチド〜40ヌクレオチド長く、22ヌクレオチド〜40ヌクレオチド長く、23ヌクレオチド〜40ヌクレオチド長く、24ヌクレオチド〜40ヌクレオチド長く、25ヌクレオチド〜40ヌクレオチド長く、26ヌクレオチド〜40ヌクレオチド長く、27ヌクレオチド〜40ヌクレオチド長く、28ヌクレオチド〜40ヌクレオチド長く、29ヌクレオチド〜40ヌクレオチド長く、30ヌクレオチド〜40ヌクレオチド長く、31ヌクレオチド〜40ヌクレオチド長く、32ヌクレオチド〜40ヌクレオチド長く、33ヌクレオチド〜40ヌクレオチド長く、34ヌクレオチド〜40ヌクレオチド長く、35ヌクレオチド〜40ヌクレオチド長く、36ヌクレオチド〜40ヌクレオチド長く、37ヌクレオチド〜40ヌクレオチド長く、38ヌクレオチド〜40ヌクレオチド長く、又は39ヌクレオチド〜40ヌクレオチド長い。
一部の実施形態において、遺伝子操作ガイドポリヌクレオチドは、天然発生crRNA及びtracrRNAの組合せと少なくとも1つのヌクレオチドだけ異なり、その結果、遺伝子操作ガイドポリヌクレオチドの結合親和性及び/又は標的化効率は、天然発生crRNA/tracrRNAハイブリッドのものよりも高い。一部の実施形態において、遺伝子操作ガイドポリヌクレオチドは、crRNA/tracrRNAハイブリッドと少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも21、少なくとも22、少なくとも23、少なくとも24、少なくとも25、少なくとも26、少なくとも27、少なくとも28、少なくとも29、又は少なくとも30ヌクレオチドだけ異なる。一部の実施形態において、遺伝子操作tracrRNAは、天然発生tracrRNAと少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも21、少なくとも22、少なくとも23、少なくとも24、少なくとも25、少なくとも26、少なくとも27、少なくとも28、少なくとも29、又は少なくとも30ヌクレオチドだけ異なる。
一部の実施形態において、改変を天然発生tracrRNAに対して行ってCas9タンパク質のヌクレアーゼ効率を改善する。一部の実施形態において、改変は、tracrRNAのステムループ中に存在する。一部の実施形態において、改変は、ステムループの伸長である。一部の実施形態において、改変は、ステムループの短縮である。一部の実施形態において、改変は、ステムループ中の1つ以上のヌクレオチド置換である。一部の実施形態において、改変は、図41に示されるステムループに対するものである。
一部の実施形態において、遺伝子操作ガイドRNAを用いるCas9タンパク質のヌクレアーゼ効率は、少なくとも約30%、少なくとも約40%、少なくとも約50%、少なくとも約60%、少なくとも約70%、少なくとも約80%、少なくとも約90%、又は少なくとも約100%だけ改善する。一部の実施形態において、遺伝子操作ガイドRNAを用いるCas9タンパク質のヌクレアーゼ効率は、少なくとも約2倍、少なくとも約3倍、少なくとも約4倍、少なくとも約5倍、少なくとも約6倍、少なくとも約7倍、少なくとも約8倍、少なくとも約9倍、又は少なくとも約10倍だけ改善する。
Cas9タンパク質のヌクレアーゼ効率を計測して例えば、天然発生ガイドRNAと複合体化しているCas9タンパク質のヌクレアーゼ効率を、本明細書に記載の遺伝子操作ガイドRNAと複合体化しているCas9タンパク質と比較することができる。一部の実施形態において、計測方法は、生化学的アッセイ、例えば、線状又は環状テンプレートに対するインビトロCas9ヌクレアーゼ活性の割合の計測などである。一部の実施形態において、計測方法は、例えば、次世代シーケンシング、T7エンドヌクレアーゼIアッセイ、及び/又はCelIアッセイを使用してCas9タンパク質の標的化効率を計測する。一部の実施形態において、計測方法は、例えば、BIACOREシステムを使用するCas9タンパク質及びtracrRNA間の親和性試験である。
一部の実施形態において、ガイド配列は、配列番号104〜125又は196〜199のいずれか1つと少なくとも90%の配列同一性を含む。一部の実施形態において、tracrRNA配列は、配列番号148〜171のいずれか1つと少なくとも90%の配列同一性を含む。一部の実施形態において、ガイドRNAは、配列番号172〜191のいずれか1つと少なくとも90%の配列同一性を含む。
一部の実施形態において、遺伝子操作ガイドRNA、又はガイドRNAのcrRNA部分は、配列番号104〜125又は196〜199のいずれか1つと少なくとも90%の配列同一性を有する。一部の実施形態において、ガイドRNA、又はガイドRNAのcrRNA部分は、配列番号104〜125又は196〜199のいずれか1つと少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、又は少なくとも99%の配列同一性を有する。
一部の実施形態において、遺伝子操作ガイドポリヌクレオチドのタンパク質結合セグメント、又はtracrRNA配列は、配列番号102及び148〜171のいずれか1つと少なくとも90%の配列同一性を有する。一部の実施形態において、遺伝子操作ガイドポリヌクレオチドのタンパク質結合セグメントは、配列番号102及び148〜171のいずれか1つと少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、又は少なくとも99%の配列同一性を有する。
一部の実施形態において、本開示は、配列番号172〜191のいずれか1つと少なくとも90%の配列同一性を有するCas9タンパク質のための遺伝子操作ガイドポリヌクレオチドを提供する。一部の実施形態において、遺伝子操作ガイドポリヌクレオチドは、配列番号172〜191のいずれか1つと少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、又は少なくとも99%の配列同一性を有する。
本明細書に記載のガイドポリヌクレオチドは、生化学的バリデーションを用いるバイオインフォマティクスツールを使用して設計することができる。ガイドポリヌクレオチドを設計する例示的な方法は、以下のとおりである:(1)タンパク質BLASTを使用して関連CRISPRオペロンを見出し;(2)ゲノム中で既にアノテートされているcrRNAを探索し、又は例えば、CRISPR−Finderを使用してCRISPRをアノテートし;(3)アラインメントツール、例えば、CLC Genomics Workbench(QIAGEN)を使用してtracrRNAの考えられる局在を決定し;(4)crRNAとの類似性を有する領域に近接するTATAAボックスを探索し;(5)アラインメントの間に見出されるcrRNA及び考えられる全てのtracrRNAの二次構造を試験し、所望の二次構造を作製するcrRNA/tracrRNAハイブリッドを選択し;(6)crRNA及びtracrRNAをトリミングして短鎖ガイドRNA(sgRNA)を作出する。例えば、本明細書に記載のcrRNA及びtracrRNA配列を組み合わせてsgRNAを生成することができる。一部の実施形態において、crRNA及びtracrRNA配列は、表1に示されるとおり組み合わせてsgRNAを生成する。
Figure 2021503279
実施例1−AAVS1遺伝子座における標的化遺伝子挿入
本実施例は、本明細書に開示のシームレス突然変異誘発(ObLiGaRe2.0系)を使用するAAVS1遺伝子座中への遺伝子挿入を保証する。
2つのCas9n−FokIバリアント、Cas9nD10A及びCas9nH840Aを図12及び14に示されるとおり生成した。SA−2A−Puro選択カセットの上流のObLiGaRe2.0標的部位(図中、領域2及び領域1と示される)を含有する2つのドナーベクターを図13及び15に示されるとおり生成した。ドナーベクターのサイズは、6kbであった。ObLiGaRe2.0標的部位は、図16に示されるとおりAAVS1遺伝子座に基づき設計した。
Cas9n−FokIバリアントの1つをコードするプラスミド、4つの別個にクローニングされたガイドRNA(gRNA)、及び対応するドナーベクターを、HEK293細胞中に同時形質移入した。ピューロマイシン耐性カセット(ドナープラスミド上の目的遺伝子)のゲノム挿入を、図15に模式的に示した。
ピューロマイシン耐性を有する細胞を選択し、ピューロマイシン耐性細胞のゲノムDNAを回収し、ジャンクションPCRに供した。PCR産物をTOPOクローニングし、サンガーシーケンシングによりシーケンシングしてジャンクションにおける正確性を決定した。
Cas9nD10A−FokIを使用する遺伝子挿入のための5’ジャンクションの配列を、図17に示した。Cas9nH840A−FokIを使用する遺伝子挿入のための5’ジャンクションの配列を、図18に示した。したがって、ObLiGaRe2.0システムを使用して導入遺伝子カセットはAAVS1遺伝子座中に、予測ジャンクションに関して高い正確性で良好にノックインされた。
実施例2−抗生物質選択を用いない標的化挿入の効率、及び遺伝子挿入効率に対するスペーサー長さの影響の評価
本実施例において、抗生物質選択を要求しない実験設定を使用して遺伝子挿入効率に対するスペーサー長さ(2つのgRNAのオフセット配列)の影響を試験した。
標的部位としてAAVS1−エキソン2遺伝子座を選択した。スペーサーの長さが異なる10個の標的部位の標的化に要求されるgRNAを図19に示されるとおり設計し、クローニングした。したがって、設計されたObLiGaRe2.0標的部位及びmCherry(EF1aプロモーターの制御下)を含有する10個のドナーベクターを、図20に示されるとおり生成した。
Cas9nH840A−FokIをコードするプラスミド及び2AGFP、gRNAの2つ、並びにドナーベクターを、HEK293細胞中に同時形質移入した。選択を以下のとおり実施した:細胞を、活性Cas9n−FokIの導入を示すGFP発現についてFACSにより最初にソートした。次いで、細胞を少なくとも10回の継代にわたり継代培養し、次いで標的部位におけるmCherryの挿入を示すmCherry発現についてFACSによりソートした。この模式図を図21に示した。
スペーサー長さ(塩基対で示す)に対するmCherryを有する細胞の割合についての結果を、図22に示した。17bpのスペーサー長さは、mCherry挿入の最大効率を示した(約20%)。したがって、抗生物質選択を適用せずにObLiGaRe2.0を用いて導入遺伝子挿入の高い効率が達成された。
実施例3−異なる遺伝子挿入法の効率の比較
本実施例において、ObLiGaRe(ジンクフィンガーヌクレアーゼを使用する)、及びObLiGaRe2.0を使用する遺伝子挿入を比較した。
ObLiGaRe遺伝子挿入は、AAVS1−int1遺伝子座中への遺伝子挿入に使用した。Cas9n−FokIバリアントを使用するObLiGaRe2.0は、AAVS1−int1及びSERPINA1−イントロン1遺伝子座中の3つの部位を標的化する2又は4つのgRNAと使用した。deadCas9−FokIを使用するObLiGaRe2.0も試験した。実験手順を実施例2に記載のとおり実施した(抗生物質選択なし、及びmCherry陽性細胞のFACS計測に基づく細胞選択)。SERPINA1遺伝子座についてのドナープラスミドを図23に示す。deadCas9−FokIを使用するドナープラスミド上の目的遺伝子のゲノム挿入を、図24に示した。
試験された遺伝子挿入法のそれぞれについて得られた結果を、図25に示した。結果は、1つの実験における3つの独立した生物学的複製物から得た。エラーバーはS.E.M.を示した。AAVS1−int1遺伝子座におけるジンクフィンガーヌクレアーゼベースのObLiGaRe(「AAVS1−int−ZFN」)及びCas9nD10A−FokI(AAVS1−int−C9nF−A」)についての効率は、同等であった。異なる遺伝子座にわたるObLiGaRe2.0効率の変動は、gRNAの効率に起因し得た。高い遺伝子挿入効率の取得は、標的部位及び異なるスペーサー長さの組合せを評価することにより達成される。
実施例4−シームレス突然変異誘発
本実施例において、本明細書の開示に提供されるシームレス突然変異誘発の一般的方法を記載する。シームレス突然変異誘発についての所望の結果を図26に示し、突然変異は標的部位において標的中のいかなる配列の変化もなしで作製する。
方法のステップ1を図27に示す。ホモロジーアームによりフランキングされた耐性カセットを、標的配列を有する細胞中に導入し、相同組換えにより標的領域中に挿入する。耐性カセットを含有する細胞を選択する。
耐性カセットの拡大図を図28に示す。ヌクレアーゼ切断部位及びヌクレアーゼ結合部位は、耐性カセットの両側上に存在する。オーバーハングを生成し得るヌクレアーゼ、例えば、Cpf1又はCas9は、ヌクレアーゼ切断部位において開裂させ、所望の点突然変異を含むオーバーハングを生成する。
方法のステップ2を図29に示す。インビトロ又はインビボライゲーションは、ヌクレアーゼにより生成された適合性オーバーハングを使用して耐性カセットを除去する。したがって、点突然変異は、いかなる「痕跡」も、すなわち、いかなる余分配列も残さずに挿入する。核酸消化及びライゲーションについてのプロトコルを実施例5に記載する。
実施例5−Cpf1を使用するシームレス突然変異誘発についてのプロトコル
本実施例において、核酸消化及びライゲーションを以下のとおり実施する:
消化
1.RNアーゼ不含の0.5mLチューブ中で、
1μLのCas9 10×緩衝液
1μLのCpf1タンパク質(10μg/μL)
1μLのgRNA
10μLまでのRNアーゼ不含HO(この量は、ステップ3において添加されるDNAの量により決定する)
を一緒に添加する。
2.室温において5分間インキュベートする。
3.切断すべき2〜2.5μgのプラスミドDNAを添加する(この容量は濃度に応じて変動し;それに従ってステップ1における水の量を調整する)。
4.37℃において2時間インキュベートする。
5.消化後、150Vにおいて1.5%のアガロースゲルを用いてゲル電気泳動を実施する。
ゲル抽出
6.適切な長さを有するDNAをゲルから切断する。
7.Gel Extraction Kit(例えば、QIAGEN製)を使用してDNAをゲルから抽出する。
8.NANODROP上でDNA濃度を計測する。
ライゲーション
9.PCRチューブ中で、
25〜30ngのプラスミドDNA(この容量は濃度に応じて変動する)
1μLのDTT
1μLの10×T4リガーゼ緩衝液
1μLのT4リガーゼ
10μLまでのH
を一緒に添加する。
10.16℃において2時間インキュベートする。
11.形質転換のために10μlを使用する。
形質転換
12.NEB10β細胞(NEW ENGLAND BIOLABS)を氷上で10分間配置することにより−80℃の冷凍庫から解凍する。それぞれのバイアルは、50μL(3つの形質転換に十分)を含有する。SOC培地を解凍する。
13.10μLのライゲーション反応物を1.5mLのEPPENDORFチューブに添加し、氷上に配置して冷却する。
14.解凍後、15μLのNEB10β細胞をライゲーション反応物に添加する。
15.氷上で30分間放置する。42℃の水浴を加温する。
16.細胞を水浴中で42℃において30秒間配置することにより熱ショック処理し、次いで氷上で2分間配置する。
17.300μLのSOC培地を細胞に添加し、37℃において45分間インキュベートする。
18.100μLの細胞をプレート上の1/3に、又は300μLをプレート上の全体にプレーティングし;プレートは、適切な抗生物質を含有する。
実施例6−Cas9インビトロ消化プロトコル
本実施例において、Cas9による基質DNAのインビトロ消化を以下のとおり実施する(30μLの反応物用):
1.反応物を室温において以下の順:
20μLのヌクレアーゼ不含水
3μLの10×Cas9ヌクレアーゼ反応緩衝液
3μLの300nMのsgRNA(30nMの最終濃度)
1μLの1μMのCas9ヌクレアーゼ(約30nMの最終濃度)
で集め、
25℃において10分間プレインキュベートし、次いで
3μLの30nMの基質DNA
を添加する。
2.十分に混合し、微小遠心管中でパルススピン(pulse−spin)する。
3.37℃において15分間インキュベートする。
4.1μLのプロテイナーゼKをそれぞれの試料に添加する。十分に混合し、微小遠心管中でパルススピンする。
5.室温において10分間インキュベートする。
6.断片分析に移行する。
実施例7−Cas9開裂後のDNA修復プロファイルの分析
本実施例において、コンピュータ計算分析を使用してオペロン中のcas4の存在を検索することによりII−B型Cas9オペロンを同定した。フランシセラ・ノビシダ(Francisella novicida)からのCas9タンパク質(FnCas9)を産生のために選択した。ヌクレアーゼ活性は、図34Aに示されるとおりインビトロ開裂アッセイにおいて実証した。開裂産物のサンガーシーケンシングにより、図34Bに示されるとおりFnCas9がインビトロで5’粘着末端を生成することが明らかになった。タンパク質発現構築物を、HEK293ヒト細胞系中でバリデートした。RIMAを使用して図34Cに示されるとおりFnCas9及び化膿連鎖球菌(Streptococcus pyogenes)からのCas9タンパク質(SpyCas9)における突然変異パターンを比較した。
実施例8−Cas9処理後のDNA切断プロファイルの分析
フランシセラ・ノビシダ(Francisella novicida)からのII−B型Cas9バリアント(FnCas9)は、実施例7に記載のとおり哺乳動物細胞において低い編集効率で粘着末端を形成することが示された。II−B型Cas9ファミリーの他のメンバーを、粘着末端の生成について試験した。シーケンシングされた腸内メタゲノムMH0245からの新たなCas9バリアントが同定された(MHCas9)。MHCas9のために設計されたガイドRNA、tracrRNA、及びcrRNAの配列を図33に示す。インビトロアッセイは、図35Aに示されるとおりMHCas9がDNA断片を開裂させ得ることを示した。サンガーシーケンシングにより、MHCas9が図35Bに示されるとおりインビトロで5’オーバーハングを生成することが明らかになった。さらに、セル1アッセイを実施して図35Cに示されるとおりMHCas9がHEK293−REMINDELヒト細胞系においても機能的であることをバリデートした。
MHCas9からのcrRNA/tracrRNAの配列を図36Aに示す。二次構造を示すcrRNA/tracrRNAの模式図を図36Bに示す。図36Cの切り取られた系統樹は、MHCas9と他のII−B型Cas9、例として、スルフロスピリラム属種(Sulfurospirillum sp.)SCADCh(ssCas9)、ウォリネラ・スクシノゲネス(Wolinella succinogenes)(WsCas9)、レジオネラ・ニューモフィラ(Legionella pneumophila)(LpCas9)からのCas9及びFnCas9とのアラインメントを示す。系統樹により示されるとおり、FnCas9及びMHCas9は、かなりの多様性を示す。しかしながら、実施例7及び本実施例に記載の実験結果は、MHCas9及びFnCas9が同一の開裂機序を共有することを示す。
実施例9−sgRNAの設計
本実施例において、sgRNAの設計方法を記載する:
1.タンパク質BLAST(NCBI、blast.ncbi.nlm.nih.gov/Blast.cgi?PAGE=Proteins)を使用して関連CRISPRオペロンを見出す。検索に現れる種のそれぞれについて、RefSeqの1つをさらなる分析のために選択する。BLASTは、種々の入力及び異なる設定で数回ランする。
2.既にアノテートされたCRISPR RNA(crRNA)を確認する。そうでなければ、CRISPR−Finder(crispr.i2bc.paris−saclay.fr/Server/)を使用してcrRNAをアノテートする。
3.CLC Genomics Workbench v.9.5(QIGEN)の「Create Alignment」を使用してtracrRNAの考えられる局在を見出す。crRNAの両方の鎖をCas4及びCRISPR反復配列間の配列にアラインする。
4.crRNAとの類似性を示す領域に近接するTATAAボックスを探索する。
5.(アラインメントにおいて見出される)全ての考えられるtracrRNAを有するcrRNAの二次構造を試験し、所望の構造を作製するものを選択する。
6.crRNA及びtracrRNAをトリミングして短鎖ガイドRNA(sgRNA)を作製する。
図41A〜Tは、本明細書に記載の方法により設計される種々のsgRNAを説明する。図42A〜Lは、トリミングによるsgRNA(「キメラgRNAとも称される)の最適化、及びさらなる改変にために考えられる標的部位を説明する。
実施例10−改変sgRNAのインビトロ消化アッセイ
図45(ガイド−1、ガイド−2、ガイド−3、ガイド−4)に概略されるとおり種々のヌクレオチドを除去することにより4つの異なるガイドRNAを遺伝子操作した。次いで、インビトロ消化アッセイにおいて改変ガイドRNAを元のガイドRNAと比較した。図45は、一部の改変がMHCas9の消化効率を改善したことを実証する。
ガイドRNA長さを3つの異なるCas9系:SpyCas9、Cl1Cas9及びMHCas9においてさらに調査した。長さ19〜23のガイドRNAを調製し、次いで新たなCas9バリアント及び遺伝子操作ガイドRNAをレポーター細胞系中に形質移入し、Surveyor(商標)ヌクレアーゼアッセイ(Integrated DNA Technologies,Skokie,IL)に供した。図46は、新たなCas9変異型Cl1及びMHのインビトロでの切断効率及び機能性を実証する。
実施例11−MHCas9のためのPAM配列
図49Aに模式的に示される方法を使用してMHCas9に好ましいPAM配列を調査した。種々のPAM配列組合せ及び標的開裂部位をカバーするプールされた64個のプラスミドのライブラリーを生成した。SpCas9及びMHCas9を使用してライブラリーを別個に消化した。プラスミド用のフォワード及びリバースプライマーを使用して標的開裂部位及びPAMを含有する領域を増幅させ、次いで増幅させた領域を次世代シーケンシングによりシーケンシングした。SpCas9又はMHCas9のいずれかに好ましいPAM配列を含有するプラスミドは消化され、したがって、増幅もシーケンシングもされなかった。他方、SpCas9又はMHCas9に好ましくないPAM配列を含有するプラスミドは消化されず、増幅させることができた。
SpCas9及びMHCas9のための「枯渇」PAM配列についての結果を図49Bに示す。SpCas9と比較して、MHCas9は、「NGG」PAM配列についての低いストリンジェントな優先性を有する。
実施例12−Cas9タンパク質とエキソヌクレアーゼとの組合せ
II−B型Cas9タンパク質による開裂を、末端プロセシングエキソヌクレアーゼ酵素と組み合わせて編集効率を増加させた。方法の模式図を図50に説明する。図50Aに示されるとおり、II−B型Cas9による開裂により生成されたオーバーハングは、細胞により正確に修復されて元の配列に戻され、したがって、挿入−欠失又は置換改変が望まれる場合に編集効率が制限され得る。図50Bにおいて、II−B型Cas9による開裂後、末端プロセシングエキソヌクレアーゼ酵素Artemis又はTREX2を導入し、それがII−B型Cas9切断部位における開裂オーバーハングをさらにプロセシングする。これらのプロセシングされた末端の細胞修復は、元の配列に対して不正確な修復(すなわち、挿入−欠失又は置換改変の数の増加)をもたらし、それにより編集効率を増加させる。
Cas9とエキソヌクレアーゼとの組合せの効果を試験するため、末端プロセシング酵素を用いて又は用いずにII−B型Cas9をヒト細胞系における活性について試験した。図51Aは、実験手順の模式的概要を示す。種々のII−B型Cas9タンパク質(FnCas9、Cl1Cas9、MHCas9)及びII−A型SpCas9をコードするプラスミドを、末端プロセシング酵素FnCas4又はTREX2をコードするプラスミド及び3つの異なるガイドRNA配列をコードするプラスミドとともにHEK293細胞中に導入した。HEK293細胞からのゲノムDNAを形質移入の72時間後に回収し、次世代シーケンシングにより分析した。
結果を図51Bに示す。対照プラスミドが形質移入された細胞は、改変のバックグラウンドレベル(シーケンシングにおける自然変異に起因する)のみを示した。FnCas9、MHCas9、及びSpCas9は、全て、末端プロセシング酵素の存在又は不存在下のいずれでも変動量のゲノム改変を示した。一般に、末端プロセシング酵素を用いるCas9の導入は、末端プロセシング酵素を用いない場合に対して改変の数の増加を示した。
実施例13−Cas9タンパク質の突然変異パターン分析
異なるCas9により作製された切断についての突然変異パターン分析を実施した。HEK293細胞にSpCas9、Cl1Cas9、又はMHCas9及びそれらのそれぞれのガイドRNAを形質移入した。72時間後に細胞を溶解させ、ゲノムDNAを抽出し、次世代アンプリコンシーケンシングに供した。バイオインフォマティックツールを使用してシーケンシングリードを分析して検出された改変リード間のそれぞれの突然変異の相対頻度を定量した。
結果を図52に示す。図52A、52B、及び52Cはそれぞれ、SpCas9、Cl1Cas9、及びMHCas9を使用した切断の誘導後の同一標的配列についての突然変異パターンを示す。標的配列をパネルのそれぞれの上段に示す。これらの結果は、異なるCas9タンパク質を使用した切断の誘導後の同一遺伝子座における突然変異パターンが異なることを示し、異なるCas9についての異なる様式のヌクレアーゼ活性を示す。
ヌクレアーゼ活性の差についての1つの非限定的な仮定は、RuvC及びHNHヌクレアーゼドメイン立体構造がII−A型及びII−B型Cas9タンパク質間で異なることであり得る。図53に説明されるとおり、II−A型Cas9(パネルA)は、そのRuvC及びHNHドメインについての同一切断部位(例えば、NGG PAM配列の上流のおよそ3ヌクレオチド)を示し、それが平滑末端又は単一ヌクレオチドオーバーハングをもたらす。他方、II−B型Cas9(パネルB)は、RuvC及びHNHについてのオフセット切断部位(例えば、それぞれ、NGG PAM配列の上流のおよそ7及び3ヌクレオチド)を示し、それが「付着」末端、すなわち、3〜4ヌクレオチドオーバーハングをもたらす。

Claims (172)

  1. a)粘着末端を生成し得るCas9エフェクタータンパク質(stiCas9);及び
    b)前記stiCas9との複合体を形成し、ガイド配列(前記ガイド配列は、真核細胞中の標的配列とハイブリダイズし得るが、細菌細胞中の配列にハイブリダイズしない)を含むガイドポリヌクレオチド
    を含み;
    前記複合体は天然に生じない
    非天然発生CRISPR−Cas系。
  2. a)粘着末端を生成し得、核局在化シグナル(NLS)を含むCas9エフェクタータンパク質(stiCas9);及び
    b)前記stiCas9との複合体を形成し、ガイド配列を含むガイドポリヌクレオチド
    を含み;
    前記複合体は天然に生じない
    非天然発生CRISPR−Cas系。
  3. a)粘着末端を生成し得るCas9エフェクタータンパク質(stiCas9)をコードする1つ以上のヌクレオチド配列;及び
    b)前記stiCas9との複合体を形成し、ガイド配列(前記ガイド配列は、真核細胞中の標的配列とハイブリダイズし得るが、細菌細胞中の配列にハイブリダイズしない)を含むガイドポリヌクレオチドをコードするヌクレオチド配列
    を含み;
    前記複合体は天然に生じない
    非天然発生CRISPR−Cas系。
  4. a)粘着末端を生成し得るCas9エフェクタータンパク質(stiCas9)をコードする1つ以上のヌクレオチド配列;及び
    b)前記stiCas9との複合体を形成し、ガイド配列を含むガイドポリヌクレオチドをコードするヌクレオチド配列
    を含み;
    (a)及び(b)の前記ヌクレオチド配列は、真核生物プロモーターの制御下であり、前記複合体は天然に生じない
    非天然発生CRISPR−Cas系。
  5. 前記ガイドポリヌクレオチドが、tracrRNA配列を含む、請求項1〜4のいずれか一項に記載のCRISPR−Cas系。
  6. tracrRNA配列を含む別個のポリヌクレオチドをさらに含む、請求項1〜4のいずれか一項に記載のCRISPR−Cas系。
  7. 前記ガイドポリヌクレオチド、tracrRNA配列、及び前記stiCas9が、複合体を形成し得、前記複合体は天然に生じない、請求項6に記載のCRISPR−Cas系。
  8. a)粘着末端を生成し得るCas9エフェクタータンパク質(stiCas9)をコードする1つ以上のヌクレオチド配列に作動可能に結合している調節エレメント;及び
    b)前記stiCas9との複合体を形成し、ガイド配列(前記ガイド配列は、真核細胞中の標的配列とハイブリダイズし得るが、細菌細胞中の配列にハイブリダイズしない)を含むガイドポリヌクレオチド
    を含み;
    前記複合体は天然に生じない
    1つ以上のベクターを含む非天然発生CRISPR−Cas系。
  9. a)粘着末端を生成し得るCas9エフェクタータンパク質(stiCas9)をコードする1つ以上のヌクレオチド配列に作動可能に結合している調節エレメント(前記調節エレメントは、真核生物調節エレメントである);及び
    b)前記stiCas9との複合体を形成し、ガイド配列を含むガイドポリヌクレオチド
    を含み;
    前記複合体は天然に生じない
    1つ以上のベクターを含む非天然発生CRISPR−Cas系。
  10. 前記ガイドポリヌクレオチドが、tracrRNA配列をさらに含む、請求項8又は9に記載の非天然発生ベクター。
  11. tracrRNA配列を含むヌクレオチド配列をさらに含む、請求項9又は10に記載の非天然発生ベクター。
  12. 前記複合体が、プロトスペーサー隣接モチーフ(PAM)の10ヌクレオチド以内の部位において開裂させ得る、請求項1〜11のいずれか一項に記載の系。
  13. 前記複合体が、プロトスペーサー隣接モチーフ(PAM)の5ヌクレオチド以内の部位において開裂させ得る、請求項1〜12のいずれか一項に記載の系。
  14. 前記複合体が、プロトスペーサー隣接モチーフ(PAM)の3ヌクレオチド以内の部位において開裂させ得る、請求項1〜13のいずれか一項に記載の系。
  15. 前記標的配列が、プロトスペーサー隣接モチーフ(PAM)の5’に存在し、前記PAMは、3’Gリッチモチーフを含む、請求項1〜14のいずれか一項に記載の系。
  16. 前記標的配列が、プロトスペーサー隣接モチーフ(PAM)の5’に存在し、前記PAM配列は、NGG(Nは、A、C、G、又はTである)である、請求項1〜15のいずれか一項に記載の系。
  17. 前記粘着末端が、3〜40ヌクレオチドの一本鎖ポリヌクレオチドオーバーハングを含む、請求項1〜16のいずれか一項に記載の系。
  18. 前記粘着末端が、4〜20ヌクレオチドの一本鎖ポリヌクレオチドオーバーハングを含む、請求項1〜17のいずれか一項に記載の系。
  19. 前記粘着末端が、5〜15ヌクレオチドの一本鎖ポリヌクレオチドオーバーハングを含む、請求項1〜18のいずれか一項に記載の系。
  20. 前記stiCas9が、II−B型CRISPR系を有する細菌種に由来する、請求項1〜19のいずれか一項に記載の系。
  21. 前記stiCas9が、配列番号10〜97又は192〜195のいずれか1つと少なくとも95%の同一性を有するドメインを含む、請求項1〜20のいずれか一項に記載の系。
  22. 前記stiCas9が、1E−5のE値カットオフを用いてTIGR03031タンパク質ファミリーにマッチするドメインを含む、請求項1〜21のいずれか一項に記載の系。
  23. 前記stiCas9が、1E−10のE値カットオフを用いて前記TIGR03031タンパク質ファミリーにマッチするドメインを含む、請求項1〜22のいずれか一項に記載の系。
  24. 前記細菌種が、レジオネラ・ニューモフィラ(Legionella pneumophila)、フランシセラ・ノビシダ(Francisella novicida)、ガンマプロテオバクテリア(gamma proteobacterium)HTCC5015、パラサテレラ・エキスクレメンティホミニス(Parasutterella excrementihominis)、サテレラ・ワズワーセンシス(Sutterella wadsworthensis)、スルフロスピリラム属種(Sulfurospirillum sp.)SCADC、ルミノバクター属種(Ruminobacter sp.)RM87、バークホルデリア・バクテリウム(Burkholderiales bacterium)1_1_47、バクテロイデス・オーラル・タクソン(Bacteroidetes oral taxon)274株F0058、ウォリネラ・スクシノゲネス(Wolinella succinogenes)、バークホルデリア・バクテリウム(Burkholderiales bacterium)YL45、ルミノバクター・アミロフィラス(Ruminobacter amylophilus)、カンピロバクター属種(Campylobacter sp.)P0111、カンピロバクター属種(Campylobacter sp.)RM9261、カンピロバクター・ラニエナエ(Campylobacter lanienae)株RM8001、カンプリロバクター・ラニエナエ(Camplylobacter lanienae)株P0121、ツリシモナス・ムリス(Turicimonas muris)、レジオネラ・ロンジニエンシス(Legionella londiniensis)、サリニビブリオ・シャルメンシス(Salinivibrio sharmensis)、レプトスピラ属種(Leptospira sp.)単離株FW.030、モリテラ属種(Moritella sp.)単離株NORP46、エンドゾイコモナス属種(Endozoicomonassp.)S−B4−1U、タミルナドゥイバクター・サリナス(Tamilnaduibacter salinus)、ビブリオ・ナトリエゲンス(Vibrio natriegens)、アルコバクター・スキロウイイ(Arcobacter skirrowii)、フランシセラ・フィロミラギア(Francisella philomiragia)、フランシセラ・ヒスパニエンシス(Francisella hispaniensis)、又はパレンドゾイコモナス・ハリクロナエ(Parendozoicomonas haliclonae)である、請求項23に記載の系。
  25. 前記標的配列が、プロトスペーサー隣接モチーフ(PAM)の5’に存在し、前記PAM配列は、YG(Yは、ピリミジンである)であり、前記stiCas9が、細菌種F.ノビシダ(F.novicida)に由来する、請求項24に記載の系。
  26. 前記stiCas9が、1つ以上の核局在化シグナルを含む、請求項1〜25のいずれか一項に記載の系。
  27. 前記真核細胞が、動物又はヒト細胞である、請求項1〜26のいずれか一項に記載の系。
  28. 前記真核細胞が、ヒト細胞である、請求項1〜27のいずれか一項に記載の系。
  29. 前記真核細胞が、植物細胞である、請求項1〜26のいずれか一項に記載の系。
  30. 前記ガイド配列が、ダイレクトリピート配列に結合している、請求項1〜29のいずれか一項に記載の系。
  31. 請求項1〜30のいずれか一項に記載の系を含む送達粒子。
  32. 前記stiCas9及び前記ガイドポリヌクレオチドが、複合体中に存在する、請求項31に記載の送達粒子。
  33. 前記複合体が、tracrRNA配列を含むポリヌクレオチドをさらに含む、請求項32に記載の送達粒子。
  34. 脂質、糖、金属、又はタンパク質をさらに含む、請求項32又は22に記載の送達粒子。
  35. 請求項1〜30のいずれか一項に記載の系を含むベシクル。
  36. 前記stiCas9及び前記ガイドポリヌクレオチドが、複合体中に存在する、請求項35に記載のベシクル。
  37. tracrRNA配列を含むポリヌクレオチドをさらに含む、請求項36に記載のベシクル。
  38. 前記ベシクルが、エキソソーム又はリポソームである、請求項35〜37のいずれか一項に記載のベシクル。
  39. 前記stiCas9をコードする前記1つ以上のヌクレオチド配列が、真核細胞中の発現のためにコドン最適化されている、請求項5〜9のいずれか一項に記載の系。
  40. Cas9エフェクタータンパク質をコードする前記ヌクレオチド配列及び前記ガイドポリヌクレオチドが、単一ベクター上に存在する、請求項5〜30又は39のいずれか一項に記載の系。
  41. Cas9エフェクタータンパク質をコードする前記ヌクレオチド配列及び前記ガイドポリヌクレオチドが、単一核酸分子上に存在する、請求項5〜30又は39のいずれか一項に記載の系。
  42. 請求項5〜30又は39〜41のいずれか一項に記載の系を含むウイルスベクター。
  43. 前記ウイルスベクターが、アデノウイルス、レンチウイルス、又はアデノ随伴ウイルスのものである、請求項42に記載のウイルスベクター。
  44. a)粘着末端を生成し得るCas9エフェクタータンパク質(stiCas9)、及び
    b)前記stiCas9との複合体を形成し、ガイド配列(前記ガイド配列は、真核細胞中の標的配列とハイブリダイズし得る)を含むガイドポリヌクレオチド
    を含み;
    前記複合体は天然に生じない
    CRISPR−Cas系を含む真核細胞。
  45. 粘着末端を生成し得るCas9エフェクタータンパク質(stiCas9)(前記Cas9エフェクタータンパク質は、II−B型CRISPR系を有する細菌種に由来する)を含むCRISPR−Cas系を含む真核細胞。
  46. 真核細胞中の標的配列の部位特異的改変を提供する方法であって、
    a)前記細胞中に、
    i.粘着末端を生成し得るCas9エフェクタータンパク質(stiCas9);及び
    ii.前記stiCas9との複合体を形成し、ガイド配列(前記ガイド配列は、前記真核細胞中の前記標的配列とハイブリダイズし得るが、細菌細胞中の配列にハイブリダイズしない)を含むガイドポリヌクレオチド(前記複合体は天然に生じない)
    を導入すること;並びに
    b)前記Cas9エフェクタータンパク質及び前記ガイドポリヌクレオチドにより前記標的配列中の粘着末端を生成すること;並びに
    c)
    i.前記粘着末端を一緒に、又は
    ii.目的ポリヌクレオチド配列(SoI)を前記粘着末端に
    ライゲートすること
    を含み;
    それにより前記標的配列を改変する方法。
  47. 真核細胞中の標的配列の部位特異的改変を提供する方法であって、
    a)前記細胞中に、
    i.粘着末端を生成し得るCas9エフェクタータンパク質(stiCas9)をコードするヌクレオチド配列;及び
    ii.前記stiCas9との複合体を形成し、ガイド配列(前記ガイド配列は、前記真核細胞中の前記標的配列とハイブリダイズし得るが、細菌細胞中の配列にハイブリダイズしない)を含むガイドポリヌクレオチド(前記複合体は天然に生じない)
    を導入すること;並びに
    b)前記Cas9エフェクタータンパク質及び前記ガイドポリヌクレオチドにより前記標的配列中の粘着末端を生成すること;並びに
    c)
    i.前記粘着末端を一緒に、又は
    ii.目的ポリヌクレオチド配列(SoI)を前記粘着末端に
    ライゲートすること
    を含み;
    それにより前記標的配列を改変する方法。
  48. 前記ガイドポリヌクレオチドが、tracrRNA配列をさらに含む、請求項46又は47に記載の方法。
  49. 前記細胞中に、tracrRNA配列を含むポリヌクレオチドを導入することをさらに含む、請求項46又は47に記載の方法。
  50. 前記ガイドポリヌクレオチド、tracrRNA配列、及び前記stiCas9が、複合体を形成し得、前記複合体は天然に生じない、請求項49に記載の方法。
  51. 前記複合体が、プロトスペーサー隣接モチーフ(PAM)の10ヌクレオチド以内の部位において開裂させ得る、請求項46〜50のいずれか一項に記載の方法。
  52. 前記複合体が、プロトスペーサー隣接モチーフ(PAM)の5ヌクレオチド以内の部位において開裂させ得る、請求項46〜51のいずれか一項に記載の方法。
  53. 前記複合体が、プロトスペーサー隣接モチーフ(PAM)の3ヌクレオチド以内の部位において開裂させ得る、請求項46〜52のいずれか一項に記載の方法。
  54. 前記標的配列が、プロトスペーサー隣接モチーフ(PAM)の5’に存在し、前記PAMは、3’Gリッチモチーフを含む、請求項46〜53のいずれか一項に記載の方法。
  55. 前記標的配列が、PAMの5’に存在し、前記PAM配列は、NGG(Nは、A、C、G、又はTである)である、請求項46〜54のいずれか一項に記載の方法。
  56. 前記粘着末端が、3〜40ヌクレオチドの一本鎖ポリヌクレオチドオーバーハングを含む、請求項46〜55のいずれか一項に記載の方法。
  57. 前記粘着末端が、4〜20ヌクレオチドの一本鎖ポリヌクレオチドオーバーハングを含む、請求項46〜56のいずれか一項に記載の方法。
  58. 前記粘着末端が、5〜15ヌクレオチドの一本鎖ポリヌクレオチドオーバーハングを含む、請求項46〜57のいずれか一項に記載の方法。
  59. 前記stiCas9が、II−B型CRISPR系を有する細菌種に由来する、請求項46〜58のいずれか一項に記載の方法。
  60. 前記真核細胞が、動物又はヒト細胞である、請求項46〜59のいずれか一項に記載の方法。
  61. 前記真核細胞が、ヒト細胞である、請求項46〜60のいずれか一項に記載の方法。
  62. 前記真核細胞が、植物細胞である、請求項46〜59のいずれか一項に記載の方法。
  63. 前記改変が、前記標的配列の少なくとも一部の欠失である、請求項46〜62のいずれか一項に記載の方法。
  64. 前記改変が、前記標的配列の突然変異である、請求項46〜62のいずれか一項に記載の方法。
  65. 前記改変が、前記標的配列中への目的配列の挿入である、請求項46〜62のいずれか一項に記載の方法。
  66. エキソヌクレアーゼを導入して前記stiCas9により生成されたオーバーハングを除去することをさらに含む、請求項46〜65のいずれか一項に記載の方法。
  67. 前記エキソヌクレアーゼが、Cas4、Artemis、又はTREX2である、請求項66に記載の方法。
  68. 前記Cas4が、II−B型CRISPR系を有する細菌種に由来する、請求項67に記載の方法。
  69. 前記複合体の構成成分をコードするポリヌクレオチドを、1つ以上のベクター上に導入する、請求項46〜68のいずれか一項に記載の方法。
  70. 細胞中の染色体中に目的配列(SoI)を導入する方法であって、
    前記染色体は、領域1及び領域2を含む標的配列(TSC)を含み、前記細胞中に、
    a)標的配列(TSV)を含むベクター(前記TSVは、領域2及び領域1並びにSoIを含む);
    b)前記TSC中の粘着末端を生成し得る第1のCas9−エンドヌクレアーゼ二量体(前記第1のCas9−エンドヌクレアーゼ二量体の第1の単量体は、前記TSCの領域1において開裂させ、前記第1のCas9−エンドヌクレアーゼ二量体の第2の単量体は、領域2において開裂させる);及び
    c)前記TSV中の粘着末端を生成し得る第2のCas9−エンドヌクレアーゼ二量体(前記第2のCas9−エンドヌクレアーゼ二量体の第1の単量体は、前記TSVの領域2において開裂させ、前記第2のCas9−エンドヌクレアーゼ二量体の第2の二量体は、領域1において開裂させる)
    を導入することを含み;
    前記細胞中への(a)の前記ベクター、(b)の前記第1のCas9−エンドヌクレアーゼ二量体及び(c)の前記第2のCas9−エンドヌクレアーゼ二量体の導入は、前記細胞の前記染色体中への前記SoIの挿入をもたらす方法。
  71. 細胞中の染色体中に目的配列(SoI)を導入する方法であって、
    前記染色体は、領域1及び領域2を含む標的配列(TSC)を含み;前記細胞中に、
    a)標的配列(TSV)(前記TSVは、領域2及び領域1並びに前記SoIを含む)を含むベクター(前記ベクターは、粘着末端を含む);
    b)前記TSC中の粘着末端を生成し得る第1のCas9−エンドヌクレアーゼ二量体(前記Cas9−エンドヌクレアーゼ二量体の第1の単量体は、前記TSCの領域1において開裂させ、前記Cas9−エンドヌクレアーゼ二量体の第2の単量体は、領域2において開裂させる)
    を導入することを含み;
    前記細胞中への(a)の前記ベクター及び(b)の前記第1のCas9−エンドヌクレアーゼ二量体の導入は、前記細胞の前記染色体中への前記SoIの挿入をもたらす方法。
  72. 前記第1及び第2のCas9−エンドヌクレアーゼ二量体が同一である、請求項70又は71に記載の方法。
  73. 前記第1及び第2のCas9−エンドヌクレアーゼ二量体が異なる、請求項70又は71に記載の方法。
  74. 前記細胞中に、前記第1のCas9−エンドヌクレアーゼ二量体の前記第1の単量体との複合体を形成し、第1のガイド配列(前記第1のガイド配列は、領域1を含む前記TSCにハイブリダイズするが、前記ベクターにハイブリダイズしない)を含む第1のガイドポリヌクレオチドを導入することをさらに含む、請求項70〜73のいずれか一項に記載の方法。
  75. 前記細胞中に、前記第1のCas9−エンドヌクレアーゼ二量体の前記第1の単量体との複合体を形成し、第1のガイド配列(前記第1のガイド配列は、前記TSC及び前記TSVにハイブリダイズする)を含む第1のガイドポリヌクレオチドを導入することをさらに含む、請求項70〜73のいずれか一項に記載の方法。
  76. 前記細胞中に、前記第1のCas9−エンドヌクレアーゼ二量体の前記第2の単量体との複合体を形成し、第2のガイド配列(前記第2のガイド配列は、領域2を含む前記TSCにハイブリダイズするが、前記ベクターにハイブリダイズしない)を含む第2のガイドポリヌクレオチドを導入することをさらに含む、請求項70〜75のいずれか一項に記載の方法。
  77. 前記細胞中に、前記第1のCas9−エンドヌクレアーゼ二量体の前記第2の単量体との複合体を形成し、第2のガイド配列(前記第2のガイド配列は、前記TSC及び前記TSVにハイブリダイズする)を含む第2のガイドポリヌクレオチドを導入することをさらに含む、請求項70〜75のいずれか一項に記載の方法。
  78. 前記細胞中に、前記第2のCas9−エンドヌクレアーゼ二量体の第1の単量体との複合体を形成し、第3のガイド配列(前記第3のガイド配列は、領域2を含む前記TSVにハイブリダイズするが、前記染色体にハイブリダイズしない)を含む第3のガイドポリヌクレオチドを導入することをさらに含む、請求項70〜77のいずれか一項に記載の方法。
  79. 前記細胞中に、前記第2のCas9−エンドヌクレアーゼ二量体の前記第1の単量体との複合体を形成し、第3のガイド配列(前記第3のガイド配列は、前記TSC及び前記TSVにハイブリダイズする)を含む第3のガイドポリヌクレオチドを導入することをさらに含む、請求項70〜78のいずれか一項に記載の方法。
  80. 前記細胞中に、前記第2のCas9−エンドヌクレアーゼ二量体の前記第2の単量体との複合体を形成し、第4のガイド配列(前記第4のガイド配列は、領域1を含む前記TSVにハイブリダイズするが、前記染色体にハイブリダイズしない)を含む第4のガイドポリヌクレオチドを導入することをさらに含む、請求項70〜79のいずれか一項に記載の方法。
  81. 前記細胞中に、前記第2のCas9−エンドヌクレアーゼ二量体の前記第2の単量体との複合体を形成し、第4のガイド配列(前記第4のガイド配列は、前記TSC及び前記TSVにハイブリダイズする)を含む第4のガイドポリヌクレオチドを導入することをさらに含む、請求項70〜80のいずれか一項に記載の方法。
  82. 前記細胞中に、前記第1、第2、第3、及び第4のガイドポリヌクレオチドを導入することを含む、請求項70〜81のいずれか一項に記載の方法。
  83. 前記細胞中に、tracrRNA配列を含むポリヌクレオチドを導入することをさらに含む、請求項70〜82のいずれか一項に記載の方法。
  84. 前記第1のCas9−エンドヌクレアーゼ二量体の前記第1の単量体及び前記第2の単量体中の前記エンドヌクレアーゼが、IIS型エンドヌクレアーゼである、請求項70〜83のいずれか一項に記載の方法。
  85. 前記第2のCas9−エンドヌクレアーゼ二量体の前記第1の単量体及び前記第2の単量体中の前記エンドヌクレアーゼが、IIS型エンドヌクレアーゼである、請求項70〜83のいずれか一項に記載の方法。
  86. 前記第1のCas9−エンドヌクレアーゼ二量体及び前記第2のCas9−エンドヌクレアーゼ二量体中の前記エンドヌクレアーゼが、IIS型エンドヌクレアーゼである、請求項70〜85のいずれか一項に記載の方法。
  87. 前記第1のCas9−エンドヌクレアーゼ二量体及び前記第2のCas9−エンドヌクレアーゼ二量体中の前記エンドヌクレアーゼが、BbvI、BgcI、BfuAI、BmpI、BspMI、CspCI、FokI、MboII、MmeI、NmeAIII、及びPleIからなる群から独立して選択される、請求項70〜86のいずれか一項に記載の方法。
  88. 前記第1のCas9−エンドヌクレアーゼ二量体及び前記第2のCas9−エンドヌクレアーゼ二量体中の前記エンドヌクレアーゼが、FokIである、請求項70〜87のいずれか一項に記載の方法。
  89. 前記第1及び第2のCas9−エンドヌクレアーゼ二量体を、前記細胞中に、前記第1及び第2のCas9−エンドヌクレアーゼ二量体をコードするポリヌクレオチドとして導入する、請求項70〜88のいずれか一項に記載の方法。
  90. 前記第1及び第2のCas9−エンドヌクレアーゼ二量体をコードする前記ポリヌクレオチドが、1つのベクター上に存在する、請求項89に記載の方法。
  91. 前記第1及び第2のCas9−エンドヌクレアーゼ二量体をコードする前記ポリヌクレオチドが、2つ以上のベクター上に存在する、請求項89に記載の方法。
  92. 前記第1、第2又は両方のCas9−エンドヌクレアーゼ二量体が、改変Cas9を含む、請求項70〜91のいずれか一項に記載の方法。
  93. 前記第1、第2又は両方のCas9−エンドヌクレアーゼ二量体が、触媒的に不活性なCas9を含む、請求項92に記載の方法。
  94. 前記第1、第2又は両方のCas9−エンドヌクレアーゼ二量体中の前記エンドヌクレアーゼが、FokIである、請求項93に記載の方法。
  95. 前記第1、第2又は両方のCas9−エンドヌクレアーゼ二量体が、ニッカーゼ活性を有するCas9を含む、請求項92に記載の方法。
  96. 前記第1、第2又は両方のCas9−エンドヌクレアーゼ二量体中の前記エンドヌクレアーゼが、FokIである、請求項95に記載の方法。
  97. 前記Cas9−エンドヌクレアーゼ二量体が、野生型Cas9に対してCas9中の単一アミノ酸置換を含む、請求項92に記載の方法。
  98. 前記第1、第2又は両方のCas9−エンドヌクレアーゼ二量体中の前記エンドヌクレアーゼが、FokIである、請求項97に記載の方法。
  99. 前記単一アミノ酸置換が、D10A又はH840Aである、請求項97又は98に記載の方法。
  100. 前記単一アミノ酸置換が、D10Aである、請求項97又は98に記載の方法。
  101. 前記単一アミノ酸置換が、H840Aである、請求項97又は98に記載の方法。
  102. 前記Cas9−エンドヌクレアーゼ二量体が、野生型Cas9に対して二重アミノ酸置換を含む、請求項92に記載の方法。
  103. 前記二重アミノ酸置換が、D10A及びH840Aである、請求項102に記載の方法。
  104. 前記野生型Cas9が、化膿連鎖球菌(Streptococcus pyogenes)、黄色ブドウ球菌(Staphylococcus aureus)、スタフィロコッカス・シュードインターメディウス(Staphylococcus pseudintermedius)、プラノコッカス・アンタルクティカス(Planococcus antarcticus)、ストレプトコッカス・サングイニス(Streptococcus sanguinis)、ストレプトコッカス・サーモフィラス(Streptococcus thermophilus)、ストレプトコッカス・ムタンス(Streptococcus mutans)、コリバクテリウム・グロメランス(Coribacterium glomerans)、ラクトバシラス・ファーシミニス(Lactobacillus farciminis)、カテニバクテリウム・ミツオカイ(Catenibacterium mitsuokai)、ラクトバシラス・ラムノサス(Lactobacillus rhamnosus)、ビフィドバクテリウム・ビフィダム(Bifidobacterium bifidum)、オエノコッカス・キタハラ(Oenococcus kitahara)、フルクトバシラス・フルクトサス(Fructobacillus fructosus)、フィネゴルディア・マグナ(Finegoldia magna)、ベイロネラ・アチピカ(Veillonella atyipca)、ソロバクテリウム・モオレイ(Solobacterium moorei)、アシドアミノコッカス属種(Acidaminococcus sp.)D21、ユーバクテリウム・ユリ(Eubacterium yurri)、コプロコッカス・カタス(Coprococcus catus)、フソバクテリウム・ヌクレアタム(Fusobacterium nucleatum)、フィリファクター・アロシス(Filifactor alocis)、ペプトニフィラス・ドゥエルデニイ(Peptoniphilus duerdenii)、又はトレポネマ・デンティコラ(Treponema denticola)に由来する、請求項97に記載の方法。
  105. 前記粘着末端が、5’オーバーハングを含む、請求項70〜104のいずれか一項に記載の方法。
  106. 前記粘着末端が、3’オーバーハングを含む、請求項70〜104のいずれか一項に記載の方法。
  107. 前記第1、第2又は両方のCas9−エンドヌクレアーゼ二量体が、3〜40ヌクレオチドの一本鎖ポリヌクレオチドを含む粘着末端を生成する、請求項70〜106のいずれか一項に記載の方法。
  108. 前記第1、第2又は両方のCas9−エンドヌクレアーゼ二量体が、4〜30ヌクレオチドの一本鎖ポリヌクレオチドを含む粘着末端を生成する、請求項70〜106のいずれか一項に記載の方法。
  109. 前記第1、第2又は両方のCas9−エンドヌクレアーゼ二量体が、5〜20ヌクレオチドの一本鎖ポリヌクレオチドを含む粘着末端を生成する、請求項70〜106のいずれか一項に記載の方法。
  110. 前記挿入時、前記染色体中の前記標的配列及び前記プラスミド中の前記標的配列を再構成させない、請求項70〜109のいずれか一項に記載の方法。
  111. 前記細胞が、真核細胞である、請求項70〜110のいずれか一項に記載の方法。
  112. 前記細胞が、動物又はヒト細胞である、請求項70〜111のいずれか一項に記載の方法。
  113. 前記細胞が、植物細胞である、請求項70〜112のいずれか一項に記載の方法。
  114. (a)の前記ベクター、(b)の前記第1のCas9−エンドヌクレアーゼ二量体、(c)の前記第2のCas9−エンドヌクレアーゼ二量体又はそれらの組合せを、前記細胞中に、送達粒子、ベシクル、又はウイルスベクターを介して導入する、請求項70〜113のいずれか一項に記載の方法。
  115. (a)の前記ベクター、(b)の前記第1のCas9−エンドヌクレアーゼ二量体、(c)の前記第2のCas9−エンドヌクレアーゼ二量体又はそれらの組合せを、前記細胞中に、送達粒子を介して導入する、請求項70〜114のいずれか一項に記載の方法。
  116. 前記送達粒子が、脂質、糖、金属、又はタンパク質を含む、請求項115に記載の方法。
  117. (a)の前記ベクター、(b)の前記第1のCas9−エンドヌクレアーゼ二量体、(c)の前記第2のCas9−エンドヌクレアーゼ二量体又はそれらの組合せを、前記細胞中に、ベシクルを介して導入する、請求項70〜114のいずれか一項に記載の方法。
  118. 前記ベシクルが、エキソソーム又はリポソームである、請求項117に記載の方法。
  119. (b)、(c)又はそれらの組合せを発現し得るポリヌクレオチドを、前記細胞中に、ウイルスベクターを介して導入する、請求項70〜113のいずれか一項に記載の方法。
  120. (a)の前記ベクターが、ウイルスベクターである、請求項70〜113のいずれか一項に記載の方法。
  121. 前記ウイルスベクターが、アデノウイルス、レンチウイルス、又はアデノ随伴ウイルスである、請求項119又は120に記載の方法。
  122. 前記第1のCas9−エンドヌクレアーゼ二量体の前記第1の単量体が、前記第1のガイドポリヌクレオチドとの複合体を形成し、前記第1のCas9−エンドヌクレアーゼ二量体の前記第2の単量体が、前記第2のガイドポリヌクレオチドとの複合体を形成する、請求項70〜121のいずれか一項に記載の方法。
  123. 前記第2のCas9−エンドヌクレアーゼ二量体の前記第1の単量体が、前記第3のガイドポリヌクレオチドとの複合体を形成し、前記第2のCas9−エンドヌクレアーゼ二量体の前記第2の単量体が、前記第4のガイドポリヌクレオチドとの複合体を形成する、請求項70〜122のいずれか一項に記載の方法。
  124. 前記第1のCas9−エンドヌクレアーゼ二量体の前記第1の単量体が、前記第1のガイドポリヌクレオチド配列及びtracrRNA配列との複合体を形成し、前記第1のCas9−エンドヌクレアーゼ二量体の前記第2の単量体が、前記第2のガイドポリヌクレオチド配列及びtracrRNA配列との複合体を形成する、請求項70〜121のいずれか一項に記載の方法。
  125. 前記第2のCas9−エンドヌクレアーゼ二量体の前記第1の単量体が、前記第3のガイドポリヌクレオチド配列及びtracrRNA配列との複合体を形成し、前記第2のCas9−エンドヌクレアーゼ二量体の前記第2の単量体が、前記第4のガイドポリヌクレオチド配列及びtracrRNA配列との複合体を形成する、請求項70〜122のいずれか一項に記載の方法。
  126. 前記第1、第2又は両方のCas9−エンドヌクレアーゼ二量体が、核局在化シグナルを含む、請求項70〜125のいずれか一項に記載の方法。
  127. 前記細胞が、幹細胞又は幹細胞系を含む、請求項70〜126のいずれか一項に記載の方法。
  128. 細胞中の標的ポリヌクレオチド配列中の1つ以上のヌクレオチドを改変する方法であって、
    a)前記細胞中に、挿入カセット(IC)を含むベクター(ICは、5’〜3’方向で、
    i.前記標的ポリヌクレオチド配列の一部と相同である第1の領域、
    ii.前記標的ポリヌクレオチド配列中の1つ以上のヌクレオチドの突然変異を含む第2の領域、
    iii.第1のヌクレアーゼ結合部位、
    iv.マーカー遺伝子をコードするポリヌクレオチド配列、
    v.第2のヌクレアーゼ結合部位、
    vi.前記標的ポリヌクレオチド配列中の1つ以上のヌクレオチドの突然変異を含む第3の領域、及び
    vii.前記標的ポリヌクレオチド配列の一部と相同である第4の領域を含み、前記第1の領域及び前記第4の領域は、前記標的ポリヌクレオチド配列のそれらのそれぞれの一部と95%〜l00%同一である)を導入すること;
    b)相同組換えを介して前記標的ポリヌクレオチド配列中に前記ICを挿入して第1の改変標的ポリヌクレオチドを生成すること;
    c)前記マーカー遺伝子を発現する細胞を選択すること;
    d)前記第1の改変標的ポリヌクレオチドを部位特異的ヌクレアーゼに供して粘着末端を有する第2の改変標的ポリヌクレオチドを生成すること;及び
    e)粘着末端を有する前記第2の改変標的ポリヌクレオチドをリガーゼ(前記リガーゼは、前記第2の領域及び前記第3の領域において前記粘着末端をライゲートする)に供して前記標的ポリヌクレオチド配列と比較して1つ以上の改変ヌクレオチドを含むライゲートされた改変標的核酸を作出すること
    を含む方法。
  129. 前記第1の改変標的核酸を、(c)の後に前記細胞から単離する、請求項128に記載の方法。
  130. 前記部位特異的ヌクレアーゼが、前記細胞に対して外因性である、請求項128又は129に記載の方法。
  131. 前記リガーゼが、前記細胞に対して外因性である、請求項128〜130のいずれか一項に記載の方法。
  132. 前記第1の改変標的タンパク質が、(c)の後に前記細胞中に存在する、請求項128に記載の方法。
  133. 前記部位特異的ヌクレアーゼを、前記細胞中に、前記部位特異的ヌクレアーゼをコードするポリヌクレオチドとして導入する、請求項132に記載の方法。
  134. 前記リガーゼを、前記細胞中に、リガーゼをコードするポリヌクレオチドとして導入する、請求項132又は133に記載の方法。
  135. 前記部位特異的ヌクレアーゼが、組換え部位特異的ヌクレアーゼである、請求項128〜134のいずれか一項に記載の方法。
  136. 前記リガーゼが、組換えリガーゼである、請求項128〜135のいずれか一項に記載の方法。
  137. 前記部位特異的ヌクレアーゼが、Cas9エフェクタータンパク質である、請求項128〜136のいずれか一項に記載の方法。
  138. 前記Cas9エフェクタータンパク質が、II−B型Cas9である、請求項137に記載の方法。
  139. 前記部位特異的ヌクレアーゼが、Cas9−エンドヌクレアーゼ融合タンパク質である、請求項128〜131のいずれか一項に記載の方法。
  140. 前記Cas9−エンドヌクレアーゼ融合タンパク質中の前記エンドヌクレアーゼが、IIS型ヌクレアーゼである、請求項139に記載の方法。
  141. 前記Cas9−エンドヌクレアーゼ融合タンパク質中の前記エンドヌクレアーゼが、FokIである、請求項139に記載の方法。
  142. 前記Cas9−エンドヌクレアーゼ融合タンパク質が、改変Cas9を含む、請求項139〜141のいずれか一項に記載の方法。
  143. 前記改変Cas9が、触媒的に不活性なCas9を含む、請求項142に記載の方法。
  144. 前記エンドヌクレアーゼが、FokIである、請求項143に記載の方法。
  145. 前記Cas9−エンドヌクレアーゼ融合タンパク質が、ニッカーゼ活性を有するCas9を含み、前記エンドヌクレアーゼが、FokIである、請求項142に記載の方法。
  146. 前記Cas9−エンドヌクレアーゼ融合タンパク質が、D10A置換を有するCas9を含む、請求項143に記載の方法。
  147. 前記Cas9−エンドヌクレアーゼ融合タンパク質が、H840A置換を有するCas9を含む、請求項143に記載の方法。
  148. 前記部位特異的ヌクレアーゼが、Cas9、Cpf1、又はCas9−FokIである、請求項128に記載の方法。
  149. 前記部位特異的ヌクレアーゼが、Cpf1エフェクタータンパク質である、請求項128に記載の方法。
  150. (d)の前記第2の改変標的ポリヌクレオチドの前記粘着末端が、5’オーバーハングを含む、請求項128〜149のいずれか一項に記載の方法。
  151. (d)の前記第2の改変標的ポリヌクレオチドの前記粘着末端が、3’オーバーハングを含む、請求項128〜149のいずれか一項に記載の方法。
  152. 前記部位特異的ヌクレアーゼが、3〜40ヌクレオチドの一本鎖ポリヌクレオチドを含む粘着末端を生成し得る、請求項128〜151のいずれか一項に記載の方法。
  153. 前記ヌクレアーゼが、4〜30ヌクレオチドの一本鎖ポリヌクレオチドを含む粘着末端を生成し得る、請求項128〜151のいずれか一項に記載の方法。
  154. 前記ヌクレアーゼが、5〜20ヌクレオチドの一本鎖ポリヌクレオチドを含む粘着末端を生成し得る、請求項128〜151のいずれか一項に記載の方法。
  155. 前記標的ポリヌクレオチド配列が、プラスミド中に存在する、請求項128〜154のいずれか一項に記載の方法。
  156. 前記標的ポリヌクレオチド配列が、染色体中に存在する、請求項128〜155のいずれか一項に記載の方法。
  157. stiCas9タンパク質との複合体を形成する遺伝子操作ガイドRNAであって、
    a)真核細胞中の標的配列にハイブリダイズし得るガイド配列;及び
    b)前記Cas9タンパク質に結合し得るtracrRNA配列(前記tracrRNAは、天然発生tracrRNA配列と少なくとも10ヌクレオチドだけ異なる)
    を含み、
    前記Cas9タンパク質のヌクレアーゼ効率を改善する遺伝子操作ガイドRNA。
  158. 前記tracrRNA配列が、天然発生tracrRNAよりも少なくとも10個少ないヌクレオチドを有する、請求項157に記載の遺伝子操作ガイドRNA。
  159. 前記tracrRNA配列が、天然発生tracrRNAよりも少なくとも10個多いヌクレオチドを有する、請求項157に記載の遺伝子操作ガイドRNA。
  160. 前記ガイド配列が、配列番号104〜125又は196〜199のいずれか1つと少なくとも90%の配列同一性を含む、請求項157に記載の遺伝子操作ガイドRNA。
  161. 前記tracrRNA配列が、配列番号148〜171のいずれか1つと少なくとも90%の配列同一性を含む、請求項157に記載の遺伝子操作ガイドRNA。
  162. 前記ガイドRNAが、配列番号172〜191のいずれか1つと少なくとも90%の配列同一性を含む、請求項157に記載の遺伝子操作ガイドRNA。
  163. 前記tracrRNAが、前記tracrRNAのステムループ中の1つ以上の改変を含む、請求項157〜159のいずれか一項に記載の遺伝子操作ガイドRNA。
  164. 前記改変が、前記ステムループの伸長を含む、請求項163に記載の遺伝子操作ガイドRNA。
  165. 前記改変が、前記ステムループの短縮を含む、請求項163に記載の遺伝子操作ガイドRNA。
  166. 前記改変が、前記ステムループ中の1つ以上のヌクレオチド置換を含む、請求項163に記載の遺伝子操作ガイドRNA。
  167. 前記Cas9タンパク質の前記ヌクレアーゼ効率の改善が、生化学的アッセイ、シーケンシングアッセイ、及び/又は親和性試験により決定される、請求項157〜166のいずれか一項に記載の遺伝子操作ガイドRNA。
  168. 請求項157〜163のいずれか一項に記載の遺伝子操作ガイドRNAを含むCRISPR−Cas系。
  169. 図40Bに見出されるCas9、ガイド配列、及びtracrRNA配列の任意の組合せを含む遺伝子操作Cas9−ガイドRNA複合体。
  170. 別個のポリヌクレオチド上のtracrRNA配列を含まない、請求項163に記載のCRISPR−Cas系。
  171. Cas9タンパク質に結合する遺伝子操作ガイドRNAを産生する方法であって、
    a.真核細胞中の標的配列にハイブリダイズし得るガイド配列を提供すること;
    b.天然発生tracrRNA配列を、前記tracrRNA配列から少なくとも10個のヌクレオチドを除去することにより改変して改変tracrRNA配列を形成すること;及び
    c.前記ガイド配列を前記改変tracrRNA配列に結合させて前記遺伝子操作ガイドRNAを生成すること
    を含む方法。
  172. a)粘着末端を生成し得るCas9エフェクタータンパク質(stiCas9);及び
    b)前記stiCas9との複合体を形成し、ガイド配列を含むガイドRNA(前記ガイド配列は、真核細胞中の標的配列とハイブリダイズし得るが、細菌細胞中の配列にハイブリダイズしない);
    を含み;
    前記複合体は天然に生じず、
    別個のポリヌクレオチド上のtracrRNA配列を含まない
    非天然発生CRISPR−Cas系。
JP2020526198A 2017-11-16 2018-11-16 Cas9ベースノックイン方針の効力を改善するための組成物及び方法 Active JP7423520B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2024005210A JP2024050637A (ja) 2017-11-16 2024-01-17 Cas9ベースノックイン方針の効力を改善するための組成物及び方法

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201762587029P 2017-11-16 2017-11-16
US62/587,029 2017-11-16
US201862693690P 2018-07-03 2018-07-03
US62/693,690 2018-07-03
PCT/US2018/061680 WO2019099943A1 (en) 2017-11-16 2018-11-16 Compositions and methods for improving the efficacy of cas9-based knock-in strategies

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2024005210A Division JP2024050637A (ja) 2017-11-16 2024-01-17 Cas9ベースノックイン方針の効力を改善するための組成物及び方法

Publications (2)

Publication Number Publication Date
JP2021503279A true JP2021503279A (ja) 2021-02-12
JP7423520B2 JP7423520B2 (ja) 2024-01-29

Family

ID=64870555

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2020526198A Active JP7423520B2 (ja) 2017-11-16 2018-11-16 Cas9ベースノックイン方針の効力を改善するための組成物及び方法
JP2024005210A Pending JP2024050637A (ja) 2017-11-16 2024-01-17 Cas9ベースノックイン方針の効力を改善するための組成物及び方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2024005210A Pending JP2024050637A (ja) 2017-11-16 2024-01-17 Cas9ベースノックイン方針の効力を改善するための組成物及び方法

Country Status (5)

Country Link
US (1) US20210180059A1 (ja)
EP (1) EP3710583A1 (ja)
JP (2) JP7423520B2 (ja)
CN (1) CN111448313A (ja)
WO (1) WO2019099943A1 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9637739B2 (en) * 2012-03-20 2017-05-02 Vilnius University RNA-directed DNA cleavage by the Cas9-crRNA complex
WO2018201086A1 (en) 2017-04-28 2018-11-01 Editas Medicine, Inc. Methods and systems for analyzing guide rna molecules
AU2018279829B2 (en) 2017-06-09 2024-01-04 Editas Medicine, Inc. Engineered Cas9 nucleases
WO2019014564A1 (en) 2017-07-14 2019-01-17 Editas Medicine, Inc. SYSTEMS AND METHODS OF TARGETED INTEGRATION AND GENOME EDITING AND DETECTION THEREOF WITH INTEGRATED PRIMING SITES
EP3664830A4 (en) 2017-08-07 2020-07-01 The Regents of the University of California PLATFORM FOR GENERATING SAFE CELL THERAPEUTICS
EP3794130A4 (en) 2018-05-16 2022-07-27 Synthego Corporation METHODS AND SYSTEMS FOR DESIGN AND USE OF GUIDE RNA
US11530425B2 (en) 2019-10-09 2022-12-20 Massachusetts Institute Of Technology Systems, methods, and compositions for correction of frameshift mutations
EP4133069A2 (en) 2020-04-08 2023-02-15 Astrazeneca AB Compositions and methods for improved site-specific modification
WO2022006745A1 (en) * 2020-07-07 2022-01-13 Oriengene Biotechnology Ltd Guide rna for hsv-1 gene editing and method thereof
CN114438235A (zh) * 2020-11-04 2022-05-06 深圳市南山区疾病预防控制中心 一种同时检测嗜低温弓形杆菌及斯氏弓形杆菌的引物探针组件、试剂盒及其应用
JP2024513087A (ja) 2021-04-07 2024-03-21 アストラゼネカ・アクチエボラーグ 部位特異的改変のための組成物及び方法
CN117396602A (zh) 2021-05-27 2024-01-12 阿斯利康(瑞典)有限公司 具有增强的稳定性的cas9效应蛋白
CN113481184A (zh) * 2021-08-06 2021-10-08 北京大学 融合蛋白以及其使用方法
WO2023052508A2 (en) 2021-09-30 2023-04-06 Astrazeneca Ab Use of inhibitors to increase efficiency of crispr/cas insertions
WO2023109849A1 (en) * 2021-12-15 2023-06-22 Wuhan University Dna polymerase-mediated genome editing
CN116949012B (zh) * 2023-09-20 2024-01-02 广州瑞风生物科技有限公司 一种融合蛋白及其应用

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016502840A (ja) * 2012-12-06 2016-02-01 シグマ−アルドリッチ・カンパニー・リミテッド・ライアビリティ・カンパニーSigma−Aldrich Co., LLC Crisprに基づくゲノム修飾および制御
WO2016080795A1 (ko) * 2014-11-19 2016-05-26 기초과학연구원 두 개의 벡터로부터 발현된 cas9 단백질을 이용한 유전자 발현 조절 방법
JP2016517276A (ja) * 2013-03-15 2016-06-16 ザ ジェネラル ホスピタル コーポレイション RNA誘導型FokIヌクレアーゼ(RFN)を用いたRNA誘導型ゲノム編集の特異性の増大
JP2016521994A (ja) * 2013-06-17 2016-07-28 ザ・ブロード・インスティテュート・インコーポレイテッド 配列操作のための最適化されたCRISPR−Cas二重ニッカーゼ系、方法および組成物
WO2017189308A1 (en) * 2016-04-19 2017-11-02 The Broad Institute Inc. Novel crispr enzymes and systems
JP2017532001A (ja) * 2013-12-12 2017-11-02 ザ・ブロード・インスティテュート・インコーポレイテッド 最適化機能CRISPR−Cas系による配列操作のための系、方法および組成物

Family Cites Families (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5543158A (en) 1993-07-23 1996-08-06 Massachusetts Institute Of Technology Biodegradable injectable nanoparticles
US6007845A (en) 1994-07-22 1999-12-28 Massachusetts Institute Of Technology Nanoparticles and microparticles of non-linear hydrophilic-hydrophobic multiblock copolymers
US5855913A (en) 1997-01-16 1999-01-05 Massachusetts Instite Of Technology Particles incorporating surfactants for pulmonary drug delivery
US5895309A (en) 1998-02-09 1999-04-20 Spector; Donald Collapsible hula-hoop
JP2008078613A (ja) 2006-08-24 2008-04-03 Rohm Co Ltd 窒化物半導体の製造方法及び窒化物半導体素子
CN104910025B (zh) 2008-11-07 2019-07-16 麻省理工学院 氨基醇类脂质和其用途
US8889394B2 (en) 2009-09-07 2014-11-18 Empire Technology Development Llc Multiple domain proteins
EP2609135A4 (en) 2010-08-26 2015-05-20 Massachusetts Inst Technology POLY (BETA-AMINO ALCOHOLS), THEIR PREPARATION AND USES THEREOF
WO2012135025A2 (en) 2011-03-28 2012-10-04 Massachusetts Institute Of Technology Conjugated lipomers and uses thereof
US9637739B2 (en) 2012-03-20 2017-05-02 Vilnius University RNA-directed DNA cleavage by the Cas9-crRNA complex
PT2800811T (pt) 2012-05-25 2017-08-17 Univ California Métodos e composições para modificação de adn alvo dirigida por arn e para modulação dirigida por arn de transcrição
EP3494997B1 (en) 2012-07-25 2019-09-18 The Broad Institute, Inc. Inducible dna binding proteins and genome perturbation tools and applications thereof
WO2014033644A2 (en) * 2012-08-28 2014-03-06 Novartis Ag Methods of nuclease-based genetic engineering
EP4279588A3 (en) * 2012-12-12 2024-01-17 The Broad Institute, Inc. Engineering of systems, methods and optimized guide compositions for sequence manipulation
SG10201912327SA (en) 2012-12-12 2020-02-27 Broad Inst Inc Engineering and Optimization of Improved Systems, Methods and Enzyme Compositions for Sequence Manipulation
MX2015007550A (es) 2012-12-12 2017-02-02 Broad Inst Inc Suministro, modificación y optimización de sistemas, métodos y composiciones para la manipulación de secuencias y aplicaciones terapéuticas.
WO2014118272A1 (en) 2013-01-30 2014-08-07 Santaris Pharma A/S Antimir-122 oligonucleotide carbohydrate conjugates
US9234213B2 (en) 2013-03-15 2016-01-12 System Biosciences, Llc Compositions and methods directed to CRISPR/Cas genomic engineering systems
EP3778899A1 (en) 2013-05-22 2021-02-17 Northwestern University Rna-directed dna cleavage and gene editing by cas9 enzyme from neisseria meningitidis
US9737604B2 (en) 2013-09-06 2017-08-22 President And Fellows Of Harvard College Use of cationic lipids to deliver CAS9
US9322037B2 (en) 2013-09-06 2016-04-26 President And Fellows Of Harvard College Cas9-FokI fusion proteins and uses thereof
CN106536729A (zh) * 2013-12-12 2017-03-22 布罗德研究所有限公司 使用粒子递送组分靶向障碍和疾病的crispr‑cas系统和组合物的递送、用途和治疗应用
KR20160089530A (ko) * 2013-12-12 2016-07-27 더 브로드 인스티튜트, 인코퍼레이티드 Hbv 및 바이러스 질병 및 질환을 위한 crispr­cas 시스템 및 조성물의 전달,용도 및 치료적 적용
WO2015089364A1 (en) * 2013-12-12 2015-06-18 The Broad Institute Inc. Crystal structure of a crispr-cas system, and uses thereof
EP3186376B1 (en) * 2014-08-27 2019-03-20 Caribou Biosciences, Inc. Methods for increasing cas9-mediated engineering efficiency
WO2016106236A1 (en) * 2014-12-23 2016-06-30 The Broad Institute Inc. Rna-targeting system
ES2955957T3 (es) 2015-01-28 2023-12-11 Caribou Biosciences Inc Polinucleótidos de ADN/ARN híbridos CRISPR y procedimientos de uso
US10392607B2 (en) * 2015-06-03 2019-08-27 The Regents Of The University Of California Cas9 variants and methods of use thereof
US9790490B2 (en) * 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
WO2016205759A1 (en) * 2015-06-18 2016-12-22 The Broad Institute Inc. Engineering and optimization of systems, methods, enzymes and guide scaffolds of cas9 orthologs and variants for sequence manipulation
JPWO2017010543A1 (ja) * 2015-07-14 2018-06-14 国立大学法人 東京大学 改変されたFnCas9タンパク質及びその使用
JP7044373B2 (ja) * 2015-07-15 2022-03-30 ラトガース,ザ ステート ユニバーシティ オブ ニュージャージー ヌクレアーゼ非依存的な標的化遺伝子編集プラットフォームおよびその用途
US10538750B2 (en) * 2016-02-29 2020-01-21 Agilent Technologies, Inc. Methods and compositions for blocking off-target nucleic acids from cleavage by CRISPR proteins
EP3699281A1 (en) * 2016-03-11 2020-08-26 Pioneer Hi-Bred International, Inc. Novel cas9 systems and methods of use
EP3426778A1 (en) * 2016-03-11 2019-01-16 Pioneer Hi-Bred International, Inc. Novel cas9 systems and methods of use
WO2017189336A1 (en) * 2016-04-25 2017-11-02 The Regents Of The University Of California Methods and compositions for genomic editing

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016502840A (ja) * 2012-12-06 2016-02-01 シグマ−アルドリッチ・カンパニー・リミテッド・ライアビリティ・カンパニーSigma−Aldrich Co., LLC Crisprに基づくゲノム修飾および制御
JP2016517276A (ja) * 2013-03-15 2016-06-16 ザ ジェネラル ホスピタル コーポレイション RNA誘導型FokIヌクレアーゼ(RFN)を用いたRNA誘導型ゲノム編集の特異性の増大
JP2016521994A (ja) * 2013-06-17 2016-07-28 ザ・ブロード・インスティテュート・インコーポレイテッド 配列操作のための最適化されたCRISPR−Cas二重ニッカーゼ系、方法および組成物
JP2017532001A (ja) * 2013-12-12 2017-11-02 ザ・ブロード・インスティテュート・インコーポレイテッド 最適化機能CRISPR−Cas系による配列操作のための系、方法および組成物
WO2016080795A1 (ko) * 2014-11-19 2016-05-26 기초과학연구원 두 개의 벡터로부터 발현된 cas9 단백질을 이용한 유전자 발현 조절 방법
WO2017189308A1 (en) * 2016-04-19 2017-11-02 The Broad Institute Inc. Novel crispr enzymes and systems

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
SCIENTIFIC REPORTS, vol. Vol.6:37584, JPN6023000202, 2016, pages 1 - 9, ISSN: 0005124078 *

Also Published As

Publication number Publication date
JP7423520B2 (ja) 2024-01-29
EP3710583A1 (en) 2020-09-23
JP2024050637A (ja) 2024-04-10
US20210180059A1 (en) 2021-06-17
CN111448313A (zh) 2020-07-24
WO2019099943A1 (en) 2019-05-23

Similar Documents

Publication Publication Date Title
JP7423520B2 (ja) Cas9ベースノックイン方針の効力を改善するための組成物及び方法
US20200385697A1 (en) Thermostable cas9 nucleases
US11236327B2 (en) Cell sorting
EP3222728B1 (en) Method for regulating gene expression using cas9 protein expressed from two vectors
JP2023002712A (ja) S.ピオゲネスcas9変異遺伝子及びこれによってコードされるポリペプチド
US20180049412A1 (en) Dna knock-in system
CA3111432A1 (en) Novel crispr enzymes and systems
KR20170027743A (ko) 표적화된 좌를 변형시키는 방법 및 조성물
Javaid et al. CRISPR/Cas system and factors affecting its precision and efficiency
CN113015798B (zh) CRISPR-Cas12a酶和系统
US20190144852A1 (en) Combinatorial Metabolic Engineering Using a CRISPR System
US20200255867A1 (en) Double selection hdr crispr-based editing
EP4159853A1 (en) Genome editing system and method
US20230119375A1 (en) Materials and methods for increasing gene editing frequency
CN111902541A (zh) 增加细胞中感兴趣的核酸分子表达水平的方法
AU2017302657A1 (en) Mice comprising mutations resulting in expression of c-truncated fibrillin-1
US20240182927A1 (en) Methods for genomic integration for kluyveromyces host cells
US20230257799A1 (en) Methods of identifying and characterizing gene editing variations in nucleic acids
WO2023102176A1 (en) Crispr-associated transposases and methods of use thereof
JP2024518793A (ja) 向上した安定性を有するcas9エフェクタータンパク質
JP2024501892A (ja) 新規の核酸誘導型ヌクレアーゼ
JP2008092862A (ja) 組換え開始酵素認識配列の低侵襲染色体導入による減数分裂期組換え分布の制御法
TWI843749B (zh) PaCas9核酸酶
Penewit et al. Recombineering in Staphylococcus aureus
Kianpour Identification of optimal sgRNA candidates for mutagenesis of the ALS1 gene in Ipomoea batatas using in-vitro cleavage assay and CRISPR/Cas9 technology

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211115

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230110

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20230331

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20230609

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230706

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230808

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231106

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231219

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240117

R150 Certificate of patent or registration of utility model

Ref document number: 7423520

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150