JP2023539237A - カーゴヌクレオチド配列を転位させるための系および方法 - Google Patents

カーゴヌクレオチド配列を転位させるための系および方法 Download PDF

Info

Publication number
JP2023539237A
JP2023539237A JP2023513262A JP2023513262A JP2023539237A JP 2023539237 A JP2023539237 A JP 2023539237A JP 2023513262 A JP2023513262 A JP 2023513262A JP 2023513262 A JP2023513262 A JP 2023513262A JP 2023539237 A JP2023539237 A JP 2023539237A
Authority
JP
Japan
Prior art keywords
sequence
seq
identity
complex
variant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023513262A
Other languages
English (en)
Inventor
トーマス,ブライアン
ブラウン,クリストファー
エス.エー. ゴルツマン,ダニエラ
バターフィールド,クリスティーナ
アレクサンダー,リサ
リュー,ジェイソン
Original Assignee
メタゲノミ,インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by メタゲノミ,インコーポレイテッド filed Critical メタゲノミ,インコーポレイテッド
Publication of JP2023539237A publication Critical patent/JP2023539237A/ja
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/09Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Abstract

【解決手段】本開示は、カーゴヌクレオチド配列を標的核酸部位に転位させるための系および方法を提供する。これらの系と方法は、カーゴヌクレオチド配列を含む第1の二本鎖核酸であって、カーゴヌクレオチド配列がリコンビナーゼまたはトランスポザーゼ複合体と相互作用するように構成される、第1の二本鎖核酸と、Casエフェクター、および標的核酸部位にハイブリダイズするように構成された少なくとも1つの操作されたガイドポリヌクレオチドを含むCasエフェクター複合体と、リコンビナーゼまたはトランスポザーゼ複合体であって、カーゴヌクレオチドを前記標的核酸部位に補充するように構成される、リコンビナーゼまたはトランスポザーゼ複合体とを含み得る。【選択図】図3

Description

関連出願
本出願は、2020年8月24日に出願された「SYSTEMS AND METHODS FOR TRANSPOSING CARGO NUCLEOTIDE SEQUENCES」という表題の米国仮特許出願第63/069,703号と、2021年5月10日に出願された「SYSTEMS AND METHODS FOR TRANSPOSING CARGO NUCLEOTIDE SEQUENCES」という表題の米国仮特許出願第63/186,698号、および2021年8月12日に出願された「SYSTEMS AND METHODS FOR TRANSPOSING CARGO NUCLEOTIDE SEQUENCES」という表題の米国仮特許出願第63/232,593号の利益を主張するものであり、これらの各々は引用により本明細書に組み込まれる。
Cas酵素は、それらに関連するClustered Regularly Interspaced Short Palindromic Repeats(クラスター化され、規則的に間隔が空いた短い回文構造の繰り返し)(CRISPR)ガイドリボ核酸(RNA)とともに、原核生物免疫系の広範な(細菌の約45%、古細菌の約84%)成分であると思われ、CRISPR-RNAガイド核酸切断によって感染ウイルスおよびプラスミドなどの非自己核酸に対してその微生物を守る役割を担う。CRISPR RNAエレメントをコードするデオキシリボ核酸(DNA)エレメントは、構造および長さにおいて比較的保存され得る一方で、そのCRISPR関連(Cas)タンパク質は非常に多様であり、様々な核酸相互作用ドメインを含む。CRISPR DNAエレメントは1987年に発見されているが、CRISPR/Cas複合体のプログラム可能なエンドヌクレアーゼ切断能力は比較的最近になって認識され、多様なDNA操作や遺伝子編集用途に組換えCRISPR/Cas系が使用されるようになっている。
配列表
本出願は、ASCIIフォーマットで電子的に提出され、参照により全体として本明細書に組み込まれる配列表を含んでいる。2021年8月20日に作成された上記ASCIIコピーは、55921-714_601_SL.txtという名称であり、488,452バイトのサイズである。
いくつかの態様において、本開示は、カーゴヌクレオチド配列を標的核酸部位に転位させるための系を提供し、前記系は、前記カーゴヌクレオチド配列を含む第1の二本鎖核酸であって、前記カーゴヌクレオチド配列がリコンビナーゼまたはトランスポザーゼ複合体と相互作用するように構成される、第1の二本鎖核酸と、クラスII、タイプIIのCasエフェクター、および前記標的核酸部位にハイブリダイズするように構成された少なくとも1つの操作されたガイドポリヌクレオチドを含むCasエフェクター複合体と、前記リコンビナーゼまたはトランスポザーゼ複合体であって、前記カーゴヌクレオチド配列を前記標的核酸部位に補充するように構成される、前記リコンビナーゼまたはトランスポザーゼ複合体と、を含む。いくつかの実施形態では、前記リコンビナーゼまたはトランスポザーゼ複合体は、前記Casエフェクター複合体に非共有結合する。いくつかの実施形態では、前記リコンビナーゼまたはトランスポザーゼ複合体は、前記Casエフェクター複合体に共有結合する。いくつかの実施形態では、前記リコンビナーゼまたはトランスポザーゼ複合体は、単一のポリペプチドにおいて前記Casエフェクター複合体に融合される。いくつかの実施形態では、前記カーゴヌクレオチド配列は、左側のトランスポザーゼ認識配列および右側のトランスポザーゼ認識配列に隣接している。いくつかの実施形態では、本系は、前記標的核酸部位を含む第2の二本鎖核酸をさらに含む。いくつかの実施形態では、本系は、前記標的核酸部位に隣接する前記Casエフェクター複合体に適合するPAM配列をさらに含む。いくつかの実施形態では、前記PAM配列は、前記標的核酸部位の3’に位置する。いくつかの実施形態では、前記リコンビナーゼまたはトランスポザーゼ複合体は、Tn7タイプのトランスポザーゼ複合体である。いくつかの実施形態では、前記操作されたガイドポリヌクレオチドは、前記クラスII、タイプIIのCasエフェクターに結合するように構成される。いくつかの実施形態では、前記クラスII、タイプIIのCasエフェクターは、配列番号1またはその変異体に対して少なくとも80%の同一性を有する配列を含むポリペプチドを含む。いくつかの実施形態では、前記リコンビナーゼまたはトランスポザーゼ複合体は、配列番号2~5のいずれか1つあるいはその変異体に対して少なくとも80%の同一性を有する配列を含む少なくとも1つ、少なくとも2つ、少なくとも3つ、または4つのポリペプチドを含む。いくつかの実施形態では、前記操作されたガイドポリヌクレオチドは、配列番号12またはその変異体に対して少なくとも80%の同一性を有する少なくとも60~80個の連続したヌクレオチドを含む配列を含む。いくつかの実施形態では、前記操作されたガイドポリヌクレオチドは、配列番号11またはその変異体に対して少なくとも80%の同一性を有する配列を含む。いくつかの実施形態では、前記左側のリコンビナーゼ配列は、配列番号17~18のいずれか1つあるいはその変異体に対して少なくとも80%の同一性を有する配列を含む。いくつかの実施形態では、前記右側のリコンビナーゼ配列は、配列番号19またはその変異体に対して少なくとも80%の同一性を有する配列を含む。いくつかの実施形態では、クラスII、タイプIIのCasエフェクターならびに前記リコンビナーゼまたはトランスポザーゼ複合体は、約10キロベース未満を含むポリヌクレオチド配列によってコードされる。
いくつかの態様において、本開示は、標的ヌクレオチド配列を含む標的核酸部位にカーゴヌクレオチド配列を転位させるための方法を提供し、上記方法は、本明細書に記載される態様または実施形態のいずれかの系を細胞内で発現させる工程、あるいは本明細書に記載される態様または実施形態のいずれかの系を細胞に導入する工程を含む。
いくつかの態様において、本開示は、カーゴヌクレオチド配列を標的核酸部位に転位させるための系を提供し、前記系は、Tn7タイプのトランスポザーゼ複合体と相互作用するように構成されたカーゴヌクレオチド配列を含む第1の二本鎖核酸と、クラスII、タイプVのCasエフェクター、および前記標的ヌクレオチド配列にハイブリダイズするように構成された操作されたガイドポリヌクレオチドを含むCasエフェクター複合体と、前記Casエフェクター複合体に結合するように構成されたTn7タイプのトランスポザーゼ複合体であって、TnsAサブユニットを含む、Tn7タイプのトランスポザーゼ複合体とを含む。いくつかの実施形態では、前記トランスポザーゼ複合体は、前記Casエフェクター複合体に非共有結合する。いくつかの実施形態では、前記トランスポザーゼ複合体は、前記Casエフェクター複合体に共有結合する。いくつかの実施形態では、前記トランスポザーゼ複合体は、単一のポリペプチドにおいて前記Casエフェクター複合体に融合される。いくつかの実施形態では、前記クラスII、タイプVのCasエフェクターは、Cas12kエフェクターではない。いくつかの実施形態では、前記カーゴヌクレオチド配列は、左側のトランスポザーゼ認識配列および右側のトランスポザーゼ認識配列に隣接している。いくつかの実施形態では、本系は、前記標的核酸部位を含む第2の二本鎖核酸をさらに含む。いくつかの実施形態では、本系は、前記標的核酸部位に隣接する前記Casエフェクター複合体に適合するPAM配列をさらに含む。いくつかの実施形態では、前記PAM配列は、前記標的核酸部位の5’に位置する。いくつかの実施形態では、前記操作されたガイドポリヌクレオチドは、前記クラスII、タイプVのCasエフェクターに結合するように構成される。いくつかの実施形態では、前記TnsAサブユニットは、配列番号7またはその変異体に対して少なくとも80%の同一性を有する配列を有するポリペプチドを含む。いくつかの実施形態では、前記Tn7タイプのトランスポザーゼ複合体は、配列番号8~10のいずれか1つあるいはその変異体に対して少なくとも80%の同一性を有する配列を含む少なくとも1つ、少なくとも2つ、または3つのポリペプチドを含む。いくつかの実施形態では、前記操作されたガイドポリヌクレオチドは、配列番号13~16のいずれか1つあるいはその変異体に対して少なくとも80%の同一性を有する少なくとも約46~80個の連続したヌクレオチドを含む配列を含む。いくつかの実施形態では、前記左側のリコンビナーゼ配列は、配列番号20またはその変異体に対して少なくとも80%の同一性を有する配列を含む。いくつかの実施形態では、前記右側のリコンビナーゼ配列は、配列番号21またはその変異体に対して少なくとも80%の同一性を有する配列を含む。いくつかの実施形態では、前記クラスII、タイプVのCasエフェクターは、Cas12kエフェクターではない。いくつかの実施形態では、前記クラスII、タイプVのCasエフェクターおよび前記Tn7タイプのトランスポザーゼ複合体は、約10キロベース未満を含むポリヌクレオチド配列によってコードされる。
いくつかの態様において、本開示は、標的ヌクレオチド配列を含む標的核酸部位にカーゴヌクレオチド配列を転位させるための方法を提供し、上記方法は、本明細書に記載される態様または実施形態のうちのいずれか1つの系を細胞内で発現させる工程、あるいは本明細書に記載される態様または実施形態のいずれか1つの系を細胞に導入する工程を含む。
いくつかの態様において、本開示は、カーゴヌクレオチド配列を標的核酸部位に転位させるための方法を提供し、上記方法は、カーゴヌクレオチド配列を含む第1の二本鎖核酸を、クラスII、タイプIIのCasエフェクター、および前記標的核酸部位にハイブリダイズするように構成された少なくとも1つの操作されたガイドポリヌクレオチドを含むCasエフェクター複合体と、前記標的核酸部位に前記カーゴヌクレオチドを補充するように構成されたリコンビナーゼまたはトランスポザーゼ複合体と、前記標的核酸部位を含む第2の二本鎖核酸と、に接触させる工程を含む。いくつかの実施形態では、前記リコンビナーゼまたはトランスポザーゼ複合体は、前記Casエフェクター複合体に非共有結合する。いくつかの実施形態では、前記リコンビナーゼまたはトランスポザーゼ複合体は、前記Casエフェクター複合体に共有結合する。いくつかの実施形態では、前記リコンビナーゼまたはトランスポザーゼ複合体は、単一のポリペプチドにおいて前記Casエフェクター複合体に融合される。いくつかの実施形態では、前記カーゴヌクレオチド配列は、左側のトランスポザーゼ認識配列および右側のトランスポザーゼ認識配列に隣接している。いくつかの実施形態では、標的核酸は、前記標的核酸部位に隣接する前記Casエフェクター複合体に適合するPAM配列をさらに含む。いくつかの実施形態では、前記PAM配列は、前記標的核酸部位の3’に位置する。いくつかの実施形態では、前記リコンビナーゼまたはトランスポザーゼ複合体は、Tn7タイプのトランスポザーゼ複合体である。いくつかの実施形態では、前記操作されたガイドポリヌクレオチドは、前記クラスII、タイプIIのCasエフェクターに結合するように構成される。いくつかの実施形態では、前記クラスII、タイプIIのCasエフェクターは、配列番号1またはその変異体に対して少なくとも80%の同一性を有する配列を含むポリペプチドを含む。いくつかの実施形態では、前記リコンビナーゼまたはトランスポザーゼ複合体は、配列番号2~5のいずれか1つあるいはその変異体に対して少なくとも80%の同一性を有する配列を含む少なくとも1つ、少なくとも2つ、少なくとも3つ、または4つのポリペプチドを含む。いくつかの実施形態では、前記操作されたガイドポリヌクレオチドは、配列番号12またはその変異体に対して少なくとも80%の同一性を有する少なくとも約60~80個の連続したヌクレオチドを含む配列を含む。いくつかの実施形態では、前記操作されたガイドポリヌクレオチドは、配列番号11またはその変異体に対して少なくとも80%の同一性を有する配列を含む。いくつかの実施形態では、前記左側のリコンビナーゼ配列は、配列番号17~18のいずれか1つあるいはその変異体に対して少なくとも80%の同一性を有する配列を含む。いくつかの実施形態では、前記右側のリコンビナーゼ配列は、配列番号19またはその変異体に対して少なくとも80%の同一性を有する配列を含む。いくつかの実施形態では、前記クラスII、タイプIIのCasエフェクターおよび前記Tn7タイプのトランスポザーゼ複合体は、約10キロベース未満を含むポリヌクレオチド配列によってコードされる。
いくつかの態様において、本開示は、カーゴヌクレオチド配列を標的核酸部位に転位させるための方法を提供し、上記方法は、前記カーゴヌクレオチド配列を含む第1の二本鎖核酸を、クラスII、タイプVのCasエフェクター、および前記標的ヌクレオチド配列にハイブリダイズするように構成された操作された少なくとも1つのガイドポリヌクレオチドを含むCasエフェクター複合体と、前記Casエフェクター複合体に結合するように構成されたTn7タイプのトランスポザーゼ複合体であって、TnsAサブユニットを含む、Tn7タイプのトランスポザーゼ複合体と、前記標的核酸部位を含む第2の二本鎖核酸と、に接触させる工程を含む。いくつかの実施形態では、前記トランスポザーゼ複合体は、前記Casエフェクター複合体に非共有結合する。いくつかの実施形態では、前記トランスポザーゼ複合体は、前記Casエフェクター複合体に共有結合する。いくつかの実施形態では、前記トランスポザーゼ複合体は、単一のポリペプチドにおいて前記Casエフェクター複合体に融合される。いくつかの実施形態では、前記カーゴヌクレオチド配列は、左側のトランスポザーゼ認識配列および右側のトランスポザーゼ認識配列に隣接している。いくつかの実施形態では、前記標的核酸部位は、前記標的核酸部位に隣接する前記Casエフェクター複合体に適合するPAM配列をさらに含む。いくつかの実施形態では、前記PAM配列は、前記標的核酸部位の3’に位置する。いくつかの実施形態では、前記操作されたガイドポリヌクレオチドは、前記クラスII、タイプVのCasエフェクターに結合するように構成される。いくつかの実施形態では、前記TnsAサブユニットは、配列番号7またはその変異体に対して少なくとも80%の同一性を有する配列を有するポリペプチドを含む。いくつかの実施形態では、前記Tn7タイプのトランスポザーゼ複合体は、配列番号8~10のいずれか1つあるいはその変異体に対して少なくとも80%の同一性を有する配列を含む少なくとも1つ、少なくとも2つ、または3つのポリペプチドを含む。いくつかの実施形態では、前記操作されたガイドポリヌクレオチドは、配列番号13~16のいずれか1つあるいはその変異体に対して少なくとも80%の同一性を有する少なくとも約46~80個の連続したヌクレオチドを含む配列を含む。いくつかの実施形態では、前記左側のリコンビナーゼ配列は、配列番号20またはその変異体に対して少なくとも80%の同一性を有する配列を含む。いくつかの実施形態では、前記右側のリコンビナーゼ配列は、配列番号21またはその変異体に対して少なくとも80%の同一性を有する配列を含む。いくつかの実施形態では、前記クラスII、タイプVのCasエフェクターは、Cas12kエフェクターではない。いくつかの実施形態では、前記クラスII、タイプVのCasエフェクターおよび前記Tn7タイプのトランスポザーゼ複合体は、約10キロベース未満を含むポリヌクレオチド配列によってコードされる。
いくつかの態様において、本開示は、カーゴヌクレオチド配列を標的核酸部位に転位させるための系を提供し、前記系は、Tn7タイプのトランスポザーゼ複合体と相互作用するように構成されたカーゴヌクレオチド配列を含む第1の二本鎖核酸と、クラスI、タイプI-FのCasエフェクター、および前記標的ヌクレオチド配列にハイブリダイズするように構成された操作されたガイドポリヌクレオチドを含むCasエフェクター複合体と、前記Casエフェクター複合体に結合するように構成されたTn7タイプのトランスポザーゼ複合体であって、TnsAサブユニットを含む、Tn7タイプのトランスポザーゼ複合体とを含む。いくつかの実施形態では、前記トランスポザーゼ複合体は、前記Casエフェクター複合体に非共有結合する。いくつかの実施形態では、前記トランスポザーゼ複合体は、前記Casエフェクター複合体に共有結合する。いくつかの実施形態では、前記トランスポザーゼ複合体は、単一のポリペプチドにおいて前記Casエフェクター複合体に融合される。いくつかの実施形態では、前記カーゴヌクレオチド配列は、左側のトランスポザーゼ認識配列および右側のトランスポザーゼ認識配列に隣接している。いくつかの実施形態では、本系は、前記標的核酸部位を含む第2の二本鎖核酸をさらに含む。いくつかの実施形態では、本系は、前記標的核酸部位に隣接する前記Casエフェクター複合体に適合するPAM配列をさらに含む。いくつかの実施形態では、前記PAM配列は、前記標的核酸部位の3’に位置する。いくつかの実施形態では、前記PAM配列は、前記標的核酸部位の5’に位置する。いくつかの実施形態では、前記操作されたガイドポリヌクレオチドは、前記クラスI、タイプI-FのCasエフェクターに結合するように構成される。いくつかの実施形態では、前記クラスI、タイプI-FのCasエフェクターは、配列番号41~43または48~50のいずれか1つあるいはその変異体に対して少なくとも80%の同一性を有する配列を含むポリペプチドを含む。いくつかの実施形態では、前記Tn7タイプのトランスポザーゼ複合体は、配列番号44~46または51~53のいずれか1つあるいはその変異体に対して少なくとも80%の同一性を有する配列を含む少なくとも1つ、少なくとも2つ、または3つのポリペプチドを含む。
いくつかの態様において、本開示は、標的ヌクレオチド配列を含む標的核酸部位にカーゴヌクレオチド配列を転位させるための方法を提供し、上記方法は、本明細書に記載される態様または実施形態のうちのいずれか1つの系を細胞内で発現させる工程、あるいは本明細書に記載される態様または実施形態のいずれか1つの系を細胞に導入する工程を含む。
いくつかの態様において、本開示は、カーゴヌクレオチド配列を標的核酸部位に転位させるための系を提供し、前記系は、Tn7タイプのトランスポザーゼ複合体と相互作用するように構成されたカーゴヌクレオチド配列を含む第1の二本鎖核酸と、クラスII、タイプVのCasエフェクター、および前記標的ヌクレオチド配列にハイブリダイズするように構成された操作されたガイドポリヌクレオチドを含むCasエフェクター複合体と、前記Casエフェクター複合体に結合するように構成されたTn7タイプのトランスポザーゼ複合体と、を含み、ここで、前記Tn7タイプのトランスポザーゼ複合体は、TnsB、TnsC、およびTniQ成分を含み、ここで、(a)前記クラスII、タイプVのCasエフェクターは、配列番号22、26、30、34、55~89、104、または147のいずれか1つあるいはその変異体に対して少なくとも80%の配列同一性を有する配列を有するポリペプチドを含み、あるいは、(b)前記Tn7タイプのトランスポザーゼ複合体は、配列番号23~25、27~29、31~33、35~37、101~103、105~107、または148~150のいずれか1つあるいはその変異体に対して少なくとも80%の配列同一性を有する配列を有するTnsB、TnsC、またはTniQ成分を含む。いくつかの実施形態では、前記トランスポザーゼ複合体は、前記Casエフェクター複合体に非共有結合する。いくつかの実施形態では、前記トランスポザーゼ複合体は、前記Casエフェクター複合体に共有結合する。いくつかの実施形態では、前記トランスポザーゼ複合体は、単一のポリペプチドにおいて前記Casエフェクター複合体に融合される。いくつかの実施形態では、前記クラスII、タイプVのCasエフェクターは、配列番号22、26、30、34、55~89、104、または147のいずれか1つあるいはその変異体に対して少なくとも80%の配列同一性を有する配列を含むポリペプチドを含む。いくつかの実施形態では、前記Tn7タイプのトランスポザーゼ複合体は、配列番号23~25、27~29、31~33、35~37、101~103、105~107、もしくは148~150のいずれか1つあるいはその変異体に対して少なくとも80%の配列同一性を有する配列を含むTnsB、TnsC、またはTniQ成分を含む。いくつかの実施形態では、前記クラスII、タイプVのCasエフェクターは、Cas12kエフェクターである。いくつかの実施形態では、前記カーゴヌクレオチド配列は、左側のトランスポザーゼ認識配列および右側のトランスポザーゼ認識配列に隣接している。いくつかの実施形態では、本系は、前記標的核酸部位を含む第2の二本鎖核酸をさらに含む。いくつかの実施形態では、本系は、前記標的核酸部位に隣接する前記Casエフェクター複合体に適合するPAM配列をさらに含む。いくつかの実施形態では、前記PAM配列は、前記標的核酸部位の5’に位置する。いくつかの実施形態では、前記PAM配列は、5’-nGTn-3’または5’-nGTt-3’を含む。いくつかの実施形態では、前記操作されたガイドポリヌクレオチドは、前記クラスII、タイプVのCasエフェクターに結合するように構成される。いくつかの実施形態では、前記TnsB、TnsC、およびTniQ成分は、それぞれ配列番号23~25、27~29、31~33、35~37、101~103、105~107、または148~150のいずれか1つに対して少なくとも80%の同一性を有する配列を有するポリペプチドを含む。いくつかの実施形態では、前記操作されたガイドポリヌクレオチドは、配列番号90、91、92、93、117、151、156~181、または209~234のいずれか1つに対して少なくとも80%の同一性を有する少なくとも約46~80個の連続したヌクレオチドを含む配列を含む。いくつかの実施形態では、前記操作されたガイドポリヌクレオチドは、配列番号111~114または201~206、255、262、256、209、257、263、258、210のいずれか1つあるいはその変異体に対して少なくとも80%の配列同一性を有する配列を含む。いくつかの実施形態では、前記左側のリコンビナーゼ配列は、配列番号125、127、123、129、131、133、153、または134のいずれか1つあるいはその変異体に対して少なくとも80%の同一性を有する配列を含む。いくつかの実施形態では、前記右側のリコンビナーゼ配列は、配列番号126、155、128、124、130、132、または154のいずれか1つあるいはその変異体に対して少なくとも80%の同一性を有する配列を含む。いくつかの実施形態では、前記クラスII、タイプVのCasエフェクターおよび前記Tn7タイプのトランスポザーゼ複合体は、約10キロベース未満を含むポリヌクレオチド配列によってコードされる。いくつかの実施形態では、(a)前記クラスII、タイプVのCasエフェクターは、配列番号22またはその変異体に対して少なくとも80%の配列同一性を有する配列を含み、(b)前記左側のリコンビナーゼ配列は、配列番号125またはその変異体に対して少なくとも80%の配列同一性を有する配列を含み、(c)前記右側のリコンビナーゼ配列は、配列番号126もしくは155またはその変異体に対して少なくとも80%の同一性を有する配列を含み、(d)前記操作されたガイドポリヌクレオチドは、(i)配列番号90の少なくとも約46~60個のヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含み、あるいは、(ii)配列番号94、112、または202のいずれか1つの非縮重ヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含み、あるいは、(e)前記TnsB、TnsC、およびTniQ成分は、配列番号23~25またはその変異体に対して少なくとも80%の配列同一性を有する配列を含む。いくつかの実施形態では、(a)前記クラスII、タイプVのCasエフェクターは、配列番号26またはその変異体に対して少なくとも80%の配列同一性を有する配列を含み、(b)前記左側のリコンビナーゼ配列は、配列番号127またはその変異体に対して少なくとも80%の配列同一性を有する配列を含み、(c)前記右側のリコンビナーゼ配列は、配列番号128またはその変異体に対して少なくとも880%の配列同一性を有する配列を含み、(d)前記操作されたガイドポリヌクレオチドは、(i)配列番号91、156、または209のうちのいずれか1つの少なくとも約46~60個のヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含み、あるいは、(ii)配列番号95、113、または203のいずれか1つの非縮重ヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含み、あるいは、(e)前記TnsB、TnsC、およびTniQ成分は、配列番号27~29またはその変異体に対して少なくとも80%の配列同一性を有する配列を含む。いくつかの実施形態では、(a)前記クラスII、タイプVのCasエフェクターは、配列番号60またはその変異体に対して少なくとも80%の配列同一性を有する配列を含み、(b)前記左側のリコンビナーゼ配列は、配列番号131またはその変異体に対して少なくとも80%の配列同一性を有する配列を含み、(c)前記右側のリコンビナーゼ配列は、配列番号132またはその変異体に対して少なくとも80%の配列同一性を有する配列を含み、(d)前記操作されたガイドポリヌクレオチドは、(i)配列番号117、161、または214のうちのいずれか1つの少なくとも約46~60個のヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含み、あるいは、(ii)配列番号119の非縮重ヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含み、あるいは、(e)前記TnsB、TnsC、およびTniQ成分は、配列番号101~103またはその変異体に対して少なくとも80%の配列同一性を有する配列を含む。いくつかの実施形態では、(a)前記クラスII、タイプVのCasエフェクターは、配列番号147またはその変異体に対して少なくとも80%の配列同一性を有する配列を含み、(b)前記左側のリコンビナーゼ配列は、配列番号153またはその変異体に対して少なくとも80%の配列同一性を有する配列を含み、(c)前記右側のリコンビナーゼ配列は、配列番号154またはその変異体に対して少なくとも880%の配列同一性を有する配列を含み、(d)前記操作されたガイドポリヌクレオチドは、(i)配列番号151、181、または234のうちのいずれか1つの少なくとも約46~60個のヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含み、あるいは、(ii)配列番号152または254の非縮重ヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含み、あるいは、(e)前記TnsB、TnsC、およびTniQ成分は、配列番号148~150またはその変異体に対して少なくとも80%の配列同一性を有する配列を含む。いくつかの実施形態では、(a)前記クラスII、タイプVのCasエフェクターは、配列番号34またはその変異体に対して少なくとも80%の配列同一性を有する配列を含み、(b)前記左側のリコンビナーゼ配列は、配列番号129またはその変異体に対して少なくとも80%の配列同一性を有する配列を含み、(c)前記右側のリコンビナーゼ配列は、配列番号130またはその変異体に対して少なくとも880%の配列同一性を有する配列を含み、(d)前記操作されたガイドポリヌクレオチドは、(i)配列番号93、157、または210のうちのいずれか1つの少なくとも約46~60個のヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含み、あるいは、(ii)配列番号97、114、または204のいずれか1つの非縮重ヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含み、あるいは、(e)前記TnsB、TnsC、およびTniQ成分は、配列番号148~150またはその変異体に対して少なくとも80%の配列同一性を有する配列を含む。いくつかの実施形態において、(a)前記クラスII、タイプVのCasエフェクターは、配列番号30またはその変異体に対して少なくとも80%の配列同一性を有する配列を含み、(b)前記左側のリコンビナーゼ配列は、配列番号123またはその変異体に対して少なくとも80%の配列同一性を有する配列を含み、(c)前記右側のリコンビナーゼ配列は、配列番号124またはその変異体に対して少なくとも80%の同一性を有する配列を含み、(d)前記操作されたガイドポリヌクレオチドは、(i)配列番号92の少なくとも約46~80個のヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含み、あるいは、(ii)配列番号111または201の非縮重ヌクレオチドに対して少なくとも80%の同一性を有する配列を含み、(e)前記TnsB、TnsC、およびTniQ成分は配列番号31、32、および33またはその変異体に対して少なくとも80%の同一性を有する配列を有するポリペプチドを含み、あるいは、(f)前記PAM配列は、5’-nGTn-3’または5’-nGTt-3’を含む。
いくつかの態様において、本開示は、カーゴヌクレオチド配列を標的核酸部位に転位させるための系を提供し、前記系は、Tn7タイプのトランスポザーゼ複合体と相互作用するように構成されたカーゴヌクレオチド配列を含む第1の二本鎖核酸と、クラスII、タイプVのCasエフェクター、および前記標的ヌクレオチド配列にハイブリダイズするように構成された操作されたガイドポリヌクレオチドを含むCasエフェクター複合体と、前記Casエフェクター複合体に結合するように構成されたTn7タイプのトランスポザーゼ複合体と、を含み、前記Tn7タイプのトランスポザーゼ複合体は、TnsBおよびTnsCの成分を含むが、TnsAおよび/またはTniQの成分を含まない。いくつかの実施形態では、前記トランスポザーゼ複合体は、前記Casエフェクター複合体に非共有結合する。いくつかの実施形態では、前記トランスポザーゼ複合体は、前記Casエフェクター複合体に共有結合する。いくつかの実施形態では、前記トランスポザーゼ複合体は、単一のポリペプチドにおいて前記Casエフェクター複合体に融合される。いくつかの実施形態では、前記Tn7タイプのトランスポザーゼ複合体は、配列番号39~40または109~110のいずれか1つに対して少なくとも80%の配列同一性を有する配列を含むポリペプチドを含む。いくつかの実施形態では、前記TnsB成分は、配列番号40または109に対して少なくとも80%の配列同一性を有する配列を含むポリペプチドを含む。いくつかの実施形態では、前記TnsC成分は、配列番号39または110に対して少なくとも80%の配列同一性を有する配列を含むポリペプチドを含む。いくつかの実施形態では、前記クラスII、タイプVのCasエフェクターは、Cas12kエフェクターである。いくつかの実施形態では、前記クラスII、タイプVのCasエフェクターは、配列番号38または配列番号108に対して少なくとも80%の配列同一性を有する配列を含む。いくつかの実施形態では、前記カーゴヌクレオチド配列は、左側のトランスポザーゼ認識配列および右側のトランスポザーゼ認識配列に隣接している。いくつかの実施形態では、本系は、前記標的核酸部位を含む第2の二本鎖核酸をさらに含む。いくつかの実施形態では、前記二本鎖核酸は前記標的核酸部位を含むか、前記系は細胞の内部にある。いくつかの実施形態では、本系は、前記標的核酸部位に隣接する前記Casエフェクター複合体に適合するPAM配列をさらに含む。いくつかの実施形態では、前記PAM配列は、前記標的核酸部位の5’に位置する。いくつかの実施形態では、前記操作されたガイドポリヌクレオチドは、前記クラスII、タイプVのCasエフェクターに結合するように構成される。いくつかの実施形態では、前記TnsBおよびTnsC成分は、それぞれ配列番号40および39、または109および110に対して少なくとも80%の同一性を有する配列を有するポリペプチドを含む。いくつかの実施形態では、前記操作されたガイドポリヌクレオチドは、配列番号118、182、183、235、または236のいずれか1つあるいはその変異体に対して少なくとも80%の同一性を有する少なくとも約46~80個の連続したヌクレオチドを含む配列を含む。いくつかの実施形態では、前記操作されたガイドポリヌクレオチドは、配列番号115、116、205、206、261、235、260、または236のいずれか1つあるいはその変異体の非縮重ヌクレオチドに対して少なくとも80%の同一性を有する配列を含む。いくつかの実施形態では、前記左側のリコンビナーゼ配列は、配列番号134に対して少なくとも80%の同一性を有する配列を含む。いくつかの実施形態では、前記右側のリコンビナーゼ配列は、配列番号135またはその変異体に対して少なくとも80%の同一性を有する配列を含む。いくつかの実施形態では、前記クラスII、タイプVのCasエフェクターおよび前記Tn7タイプのトランスポザーゼ複合体は、約10キロベース未満を含むポリヌクレオチド配列によってコードされる。いくつかの実施形態において、(a)前記クラスII、タイプVのCasエフェクターは、配列番号38またはその変異体に対して少なくとも80%の配列同一性を有する配列を含み、(b)前記左側のリコンビナーゼ配列は、配列番号134またはその変異体に対して少なくとも80%の配列同一性を有する配列を含み、(c)前記右側のリコンビナーゼ配列は、配列番号135またはその変異体に対して少なくとも80%の同一性を有する配列を含み、(d)前記操作されたガイドポリヌクレオチドは、(i)配列番号182または235の少なくとも約46~80個のヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含み、あるいは、(ii)配列番号98、115、116、205、または206の非縮重ヌクレオチドに対して少なくとも80%の同一性を有する配列を含み、あるいは、(e)前記TnsBおよびTnsC成分は、配列番号40および39またはその変異体に対して少なくとも80%の同一性を有する配列を有するポリペプチドを含む。
いくつかの態様において、本開示は、操作されたヌクレアーゼ系を提供し、前記操作されたヌクレアーゼ系は、RuvCドメインとHNHドメインとを含むエンドヌクレアーゼであって、前記エンドヌクレアーゼが未培養の微生物に由来し、前記エンドヌクレアーゼが配列番号1またはその変異体に対して少なくとも80%の同一性を有する配列を含むクラスII、タイプIIのエンドヌクレアーゼである、エンドヌクレアーゼと、操作されたガイドポリヌクレオチドであって、前記操作されたガイドポリヌクレオチドが、前記エンドヌクレアーゼと複合体を形成するように構成され、前記操作されたガイドポリヌクレオチドが、標的核酸配列にハイブリダイズするように構成されたスペーサー配列を含む、操作されたガイドポリヌクレオチドと、を含む。いくつかの実施形態では、前記操作されたガイドポリヌクレオチドは、配列番号12またはその変異体に対して少なくとも80%の同一性を有する少なくとも60~80個の連続したヌクレオチドを含む。いくつかの実施形態では、前記操作されたガイドポリヌクレオチドは、配列番号11またはその変異体に対して少なくとも80%の同一性を有する配列を含む。
いくつかの態様において、本開示は、操作されたヌクレアーゼ系を提供し、前記操作されたヌクレアーゼ系は、RuvCドメインを含むエンドヌクレアーゼであって、前記エンドヌクレアーゼが未培養の微生物に由来し、前記エンドヌクレアーゼが配列番号5に対して少なくとも80%の同一性を有するクラスII、タイプVのエンドヌクレアーゼである、エンドヌクレアーゼと、操作されたガイドポリヌクレオチドであって、前記操作されたガイドポリヌクレオチドが、前記エンドヌクレアーゼと複合体を形成するように構成され、前記操作されたガイドRNAが、標的核酸配列にハイブリダイズするように構成されたスペーサー配列を含む、操作されたガイドポリヌクレオチドと、を含む。いくつかの実施形態では、前記操作されたガイドポリヌクレオチドは、配列番号13~16またはその変異体に対して少なくとも80%の同一性を有する少なくとも約46~80個の連続したヌクレオチドを含む配列を含む。
いくつかの態様において、本開示は、操作されたヌクレアーゼ系を提供し、前記操作されたヌクレアーゼ系は、RuvCドメインを含むエンドヌクレアーゼであって、前記エンドヌクレアーゼが未培養の微生物に由来し、前記エンドヌクレアーゼが配列番号22、26、30、34、55~89、104、または147のいずれか1つあるいはその変異体に対して少なくとも80%の同一性を有するクラスII、タイプV-Kのエンドヌクレアーゼである、エンドヌクレアーゼと、操作されたガイドポリヌクレオチドであって、前記操作されたガイドポリヌクレオチドが、前記エンドヌクレアーゼと複合体を形成するように構成され、前記操作されたガイドRNAが、標的核酸配列にハイブリダイズするように構成されたスペーサー配列を含む、操作されたガイドポリヌクレオチドと、を含む。いくつかの実施形態では、前記操作されたガイドポリヌクレオチドは、配列番号90、91、92、93、117、151、156~181、または209~234のいずれか1つあるいはその変異体に対して少なくとも80%の同一性を有する少なくとも約46~80個の連続したヌクレオチドを含む配列を含む。いくつかの実施形態では、前記操作されたガイドポリヌクレオチドは、配列番号111~114または201~206、255、262、256、209、257、263、258、210のいずれか1つあるいはその変異体の非縮重ヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含む。
いくつかの態様において、本開示は、操作されたヌクレアーゼ系を提供し、前記操作されたヌクレアーゼ系は、RuvCドメインを含むエンドヌクレアーゼであって、前記エンドヌクレアーゼが未培養の微生物に由来し、前記エンドヌクレアーゼが、配列番号38または配列番号108のいずれか1つあるいはその変異体に対して少なくとも80%の同一性を有するクラスII、タイプV-Kのエンドヌクレアーゼである、エンドヌクレアーゼと、操作されたガイドポリヌクレオチドであって、前記操作されたガイドポリヌクレオチドが、前記エンドヌクレアーゼと複合体を形成するように構成され、前記操作されたガイドRNAが、標的核酸配列にハイブリダイズするように構成されたスペーサー配列を含む、操作されたガイドポリヌクレオチドと、を含む。いくつかの実施形態では、前記操作されたガイドポリヌクレオチドは、配列番号118、182、183、235、または236のいずれか1つあるいはその変異体に対して少なくとも80%の同一性を有する少なくとも約46~80個の連続したヌクレオチドを含む配列を含む。いくつかの実施形態では、前記操作されたガイドポリヌクレオチドは、配列番号111-114または201-206、255、262、256、209、257、263、258、210、115、116、205、206、261、235、260、または236、またはその変異体の非縮重ヌクレオチドに対して少なくとも80%の同一性を有する配列を含む。
いくつかの態様において、本開示は、操作されたヌクレアーゼ系を提供し、前記操作されたヌクレアーゼ系は、配列番号41~43または48~50のいずれか1つあるいはその変異体に対して少なくとも80%の同一性を有する配列を含む少なくとも1つのCas6、Cas7、またはCas8ポリペプチドを含むクラスI、タイプI-FのCasエンドヌクレアーゼと、操作されたガイドRNAであって、前記操作されたガイドRNAが、前記エンドヌクレアーゼと複合体を形成するように構成され、前記操作されたガイドRNAが、標的核酸配列にハイブリダイズするように構成されたスペーサー配列を含む、操作されたガイドと、を含む。いくつかの実施形態では、前記操作されたガイドポリヌクレオチドは、配列番号121、122、207、または208の非縮重ヌクレオチドに対して少なくとも80%の同一性を有する配列を含む。
本開示のさらなる態様および利点は、以下の詳細な記載から当業者に容易に明白となり、ここでは、本開示の例示的な実施形態のみが示され、記載されている。理解されるように、本開示は、他の実施形態および異なる実施形態においても可能であり、その様々な詳細は、そのすべてが本開示から逸脱することなく様々な明白な点で修正することができる。したがって、図面および説明は本来、例示的なものとしてみなされ、限定的なものであるとはみなされない。
引用による組み込み
本明細書で言及されるすべての出版物、特許、および特許出願は、あたかも個々の出版物、特許、または特許出願が参照により組み込まれるように具体的かつ個々に指示される程度に、参照により本明細書に組み込まれる。
本発明の新規な特徴は、とりわけ添付の請求項で説明される。本発明の特徴と利点は、本発明の原理が用いられる例示的な実施形態を説明する以下の詳細な説明と、以下の添付図面(本明細書では「図(“Figure”および“FIG.”)」とも称される)とを参照することにより、より良く理解されるであろう。
様々なクラスおよびタイプのCRISPR/Cas遺伝子座の典型的な組織を描く。 天然のクラスII、タイプIIのcrRNA/tracrRNAペアの構造を描いており、crRNAとtracrRNAが連結されたハイブリッドsgRNAと比較している。 Tn7およびTn7様エレメントで見られる2つの経路を描いている。 ファミリーMG36のタイプIIのTn7減少CASTのゲノムコンテクストを描いている。図4のAは、MG36-5 CAST系が、CRISPRアレイ(CRISPRリピート)、RuvCおよびHNHエンドヌクレアーゼドメインを有するタイプIIのヌクレアーゼ、および4つの予測されるトランスポザーゼタンパク質オープンリーディングフレームからなることを示す。触媒トランスポザーゼTnsBは、2つのサブユニットとしてコードされる。図4のBは、MG36-1 CAST系(TIR-1およびTIR-2)に対して2つのトランスポゾン末端が予測されることを示す。図4のCは、予測されたタイプIIのTn7減少CASTトランスポゾン左端(LE)および右端(RE)配列のアラインメントを示し、注釈付き反復を矢印で示す。左端と右端はその配向によって標識された。 ファミリーMG39のタイプVのTn7 CASTのゲノムコンテクストを描いている。図5のAは、MG39-1 CAST系が、タイプVのヌクレアーゼ、4つの予測されたトランスポゾンタンパク質(TnsABCとTniQ)、およびCRISPRアレイからなることを示す。トランスポゾン末端は、MG39-1 CAST系(TIR-1)に対して予測された。図5のBは、予測されたタイプVのTn7 CASTトランスポゾン左端(LE)および右端(RE)配列のアラインメントを示し、注釈付き逆方向反復が矢印で表されている。 本明細書に記載されるCAST系の対応するsgRNAの予測された構造(例えば、実施例3で予測された)を描いている。 本明細書に記載されるCAST系の対応するsgRNAの予測された構造(例えば、実施例3で予測された)を描いている。 本明細書に記載される系であるMG108-1のゲノムコンテクストを描いている。この候補は、TniQを天然に欠くCas12K CASTである。ゲノム断片中の遺伝子は矢印で表される。 Cas12kエフェクター配列の系統発生学的な遺伝子ツリーを描いている。このツリーは、今回回収した64のCas12k配列(オレンジと黒の枝)と、公開データベースからの229の参照Cas12k配列(灰色の枝)の多重配列アラインメントから推論したものである。オレンジの枝は、CASTトランスポゾン成分との関連が確認されたCas12kエフェクターを示す。 MG110カスケードCASTを描いている。A)MG110-1カスケードCASTのゲノムコンテクスト。完全なTn7の組み合わせ(TnsA、TnsB、TnsC/TniB、TniQ)および欠陥のあるカスケードの組み合わせ(Cas6、Cas7、融合Cas5-Cas8)は、オレンジ色の矢印で表される。CASTトランスポゾンに隣接するTIRは、連結した矢印で表される。B)反復二次構造は、crRNAのステムループ構造を示す。C)A.wodanis、コレラ菌(V.cholerae)、およびMG110ファミリーCASTからのCRISPRリピートの配列アラインメントは、crRNAステム-ループ二次構造を示す保存モチーフを示している。 MG64-3 CRISPR遺伝子座を描いている。tracrRNAはCRISPRアレイの上流でコードされ、トランスポゾン末端は下流でコードされる(内側の黒枠)。部分的な3’CRISPRリピートに対応する配列と部分的なスペーサーがトランスポゾン内でコードされる(外側の枠)。自己一致スペーサー(self-matching spacer)は、トランスポゾン末端の外側にコードされる。 本明細書で提供される様々なCASTについてのtracrRNA配列アラインメントを描いている。tracrRNA配列のアラインメントは、保存の領域を示す。とりわけ、配列位置92~98の配列「TGCTTTC」(上枠)は、sgRNAの三次構造にとって、およびcrRNAとの非連続的なリピート-抗-リピートペアリングにとって重要であることが示唆される。さらに、265位-278位のヘアピン「CYCC(n6)GGRG」(下枠)は機能的に重要であり、crRNAペアリングのために下流の配列を位置づけることが可能であることが示唆されている。 例えば、MG64-2、MG64-4、MG64-5、MG64-6、MG64-7、およびMG108-1のファミリーにおける他の重要なリピート-抗-リピート(RAR)モチーフの存在を示す。 MG64-2 sgRNAの予測される構造を描いている。 MG64-4 sgRNAの予測される構造を描いている。 MG64-6 sgRNAの予測される構造を描いている。 MG64-7 sgRNAの予測される構造を描いている。 MG108-1 sgRNAの予測される構造を描いている。 図13は、MG64-6がインビトロで活性であることを実証する、PCR、PAM、およびサンガーシーケンシングデータを描いている。インビトロ標的インテグラーゼ活性について記載したプロトコルを用いて、エフェクタータンパク質とそのTnsB、TnsC、およびTniQタンパク質を、インビトロ転写/翻訳系で発現させた。翻訳後、標的となるDNA、カーゴDNA、およびsgRNAを、反応バッファー中に添加した。インテグレーションは、標的/ドナー接合部にわたってPCRによってアッセイされた。図13のAは、アポ(sgRNAなし)およびsgRNA64-6 sgRNAを有する64-6を示す転位のPCRのゲル画像を描いている。PCR3はPAM遠位のRE接合部を検出する。PCR4はPAM遠位のLE接合部である。PCR5はPAM近位のRE接合部である。PCR6はPAM近位のLE接合部である。PCRは、異なる可能な配向(PCR3と6対PCR4と5)でペアになっている。LE-PAM近位およびRE-PAM遠位の配向が好ましい。図13のBは、PCR5および6を配列決定するインビトロ転位アッセイからのPAMを描いている。 図13は、MG64-6がインビトロで活性であることを実証する、PCR、PAM、およびサンガーシーケンシングデータを描いている。インビトロ標的インテグラーゼ活性について記載したプロトコルを用いて、エフェクタータンパク質とそのTnsB、TnsC、およびTniQタンパク質を、インビトロ転写/翻訳系で発現させた。翻訳後、標的となるDNA、カーゴDNA、およびsgRNAを、反応バッファー中に添加した。インテグレーションは、標的/ドナー接合部にわたってPCRによってアッセイされた。図13のCは、ドナーDNAにおいて切除が起こる転位の接合部を示すサンガーデータを描いている。第1のパネルは、PCR3および5(RE)を示す。第2のパネルは、PCR4と6(LE)を示す。サンガーシーケンシング反応はドナー-標的産物のものであるため、配列決定がドナーDNAと一致しなくなった時点は接合部が生じたときである(配列決定ピークの下の暗いバー)。 挿入部位の好みを明らかにするインビトロ転位産物の次世代シーケンシング(NGS)結果を描いている。NGSリードは、60位に転位を有する参照配列と比較して、CRISPResso2において処理された。これからのインデルは、この任意の参照配列より早いか遅い転位に対応する。 64-2TnsBおよびそのRE DNA配列の電気泳動度移動アッセイ(EMSA)結果を描いている。EMSAの結果は、結合およびTnsB認識を確認する。TnsBタンパク質をインビトロ転写/翻訳系で発現させ、RE配列を含むFAM標識DNAとインキュベートし、天然5%TBEゲル上で分離させた。結合は、標識されたバンドの上方へのシフトとして観察される。複数のTnsB結合部位があるため、EMSAでは複数のシフトがある。レーン1:FAM標識したDNAのみ。レーン2:FAM DNAとインビトロ転写/翻訳系(TnsBタンパク質なし)。レーン3:FAM DNAとTnsB。レーン3の標識バンドのアップシフト(upshift)は、TnsBによるRE配列の結合を示し、それが活性なRE転位配列を含んでいることを示唆している。
配列表の簡単な記載
本明細書とともに提出された配列表は、本開示にかかる方法、組成物、および系において使用するための例示的なポリヌクレオチドおよびポリペプチドの配列を提供する。以下は、その中の配列の例示的な説明である。
MG36
配列番号1は、MG36 Casエフェクターの完全長ペプチド配列を示す。
配列番号2~5は、MG36 Casエフェクターに関連するリコンビナーゼまたはトランスポザーゼ複合体を含み得るMG36転位タンパク質のペプチド配列を示す。標識の末端に対する-B1、-B2、-T1、および-Cの付加は、それぞれTn7様系のTnsB1、TnsB2、TnsT1、およびTniCタンパク質との類似性を示している。
配列番号11は、MG36 Casエフェクターとともに機能するように操作されたsgRNAのヌクレオチド配列を示す。
配列番号12は、MG36 Casエフェクターと同じ遺伝子座に由来するMG36 tracrRNAのヌクレオチド配列を示す。
配列番号17~18は、MG36系に関連する左側のトランスポザーゼ認識配列のヌクレオチド配列を示す。
配列番号19は、MG36系に関連する右側のトランスポザーゼ認識配列のヌクレオチド配列を示す。
MG39
配列番号6は、MG39-1 Casエフェクターの完全長のペプチド配列を示す。
配列番号7~10は、MG39-1Casエフェクターに関連するリコンビナーゼまたはトランスポザーゼ複合体を含み得るMG39-1転位タンパク質のペプチド配列を示す。
配列番号13~16は、MG39 Casエフェクターと同じ遺伝子座に由来するMG39 tracrRNAのヌクレオチド配列を示す。
配列番号20は、MG39系に関連する左側のトランスポザーゼ認識配列のヌクレオチド配列を示す。
配列番号21は、MG39系に関連する右側のトランスポザーゼ認識配列のヌクレオチド配列を示す。
MG64
配列番号22、26、30、34、55~89、104、および147は、MG64 Casエフェクターの完全長ペプチド配列を示す。
配列番号23~25、27~29、31~33、35~37、101~103、105~107、および148~150は、MG64 Casエフェクターに関連するリコンビナーゼまたはトランスポザーゼ複合体を含み得るMG64転位タンパク質のペプチド配列を示す。標識の末端に対する-A、-B、-C、および-Qの付加は、それぞれTn7様系のTnsA、TnsB、TnsC、およびTniQタンパク質との類似性を示している。
配列番号90~93、117、151、156~181、および209~234は、MG64エフェクターと同じ遺伝子座に由来するMG64 tracrRNAのヌクレオチド配列を示す。
配列番号94~97、119、152、および184~200は、MG64標的CRISPRリピートのヌクレオチド配列を示す。
配列番号237~259は、MG64 crRNAsのヌクレオチド配列を示す。
配列番号111~114と201~204は、MG64 Casエフェクターとともに機能するように操作されたシングルガイドRNAのヌクレオチド配列を示す。
配列番号123、125、127、129、131、133、および153は、MG64系に関連する左側のトランスポザーゼ認識配列のヌクレオチド配列を示す。
配列番号124、126、128、130、132、154、および155は、MG64系に関連する右側のトランスポザーゼ認識配列のヌクレオチド配列を示す。
MG108
配列番号38および108は、MG108 Casエフェクターの完全長のペプチド配列を示す。
配列番号39~40および109~110は、MG108 Casエフェクターに関連するリコンビナーゼまたはトランスポザーゼ複合体を含み得るMG108転位タンパク質のペプチド配列を示す。標識の末端に対する-A、-B、-C、および-Qの付加は、それぞれTn7様系のTnsA、TnsB、TnsC、およびTniQタンパク質との類似性を示している。
配列番号98および120は、MG108標的CRISPRリピートのヌクレオチド配列を示す。
配列番号260~261は、MG108 crRNAsのヌクレオチド配列を示す。
配列番号115~116と205~206は、MG108 Casエフェクターとともに機能するように操作されたシングルガイドRNAのヌクレオチド配列を示す。
配列番号118、182~183、および235~236は、MG108エフェクターと同じ遺伝子座に由来するMG108 tracrRNAのヌクレオチド配列を示す。
配列番号134は、MG108系に関連する左側のトランスポザーゼ認識配列のヌクレオチド配列を示す。
配列番号135は、MG108系に関連する右側のトランスポザーゼ認識配列のヌクレオチド配列を示す。
MG110
配列番号41~43および48~50は、MG110 Casエフェクターの完全長のペプチド配列を示す。標識の末端に対する-6、-7、および-8の付加は、それぞれクラスI、タイプI-Fの系cas6、cas7、およびcas8タンパク質との類似性を示している。
配列番号44~47および51~54は、MG110 Casエフェクターに関連するリコンビナーゼまたはトランスポザーゼ複合体を含み得るMG110転位タンパク質のペプチド配列を示す。標識の末端に対する-A、-B、-C、および-Qの付加は、それぞれTn7様系のTnsA、TnsB、TnsC、およびTniQタンパク質との類似性を示している。
配列番号99~100は、MG110標的CRISPRリピートのヌクレオチド配列を示す。
配列番号121~122および207~208は、MG110 crRNAsのヌクレオチド配列を示す。
配列番号136および138は、MG110系に関連する左側のトランスポザーゼ認識配列のヌクレオチド配列を示す。
配列番号137および139は、MG110系に関連する右側のトランスポザーゼ認識配列のヌクレオチド配列を示す。
他の配列
配列番号140~141は、核局在化シグナルのペプチド配列を示す。
配列番号142~143は、リンカーのペプチド配列を示す。
配列番号144~146は、エピトープタグのペプチド配列を示す。
本発明の実施形態が本明細書中で示され、記載されているが、このような実施形態はほんの一例として提供されるものであることは、当業者に明らかであろう。ここで、本発明から逸脱することなく、多数の変更、変化、および置換がなされることが、当業者によって理解され得る。本明細書に記載される本発明の実施形態の様々な代案が利用され得ることを理解されたい。
本明細書で開示されるいくつかの方法の実施は、特段の定めのない限り、免疫学、生化学、化学、分子生物学、微生物学、細胞生物学、ゲノミクス、および組換えDNAの技術を利用する。例えば、Sambrook and Green, Molecular Cloning: A Laboratory Manual, 4th Edition (2012); the series Current Protocols in Molecular Biology (F. M. Ausubel, et al. eds.); the series Methods In Enzymology (Academic Press, Inc.), PCR 2: A Practical Approach (M.J. MacPherson, B.D. Hames and G.R. Taylor eds. (1995)), Harlow and Lane, eds. (1988) Antibodies, A Laboratory Manual, and Culture of Animal Cells: A Manual of Basic Technique and Specialized Applications, 6th Edition (R.I. Freshney, ed. (2010))(引用により本明細書に完全に組み込まれる)を参照。
本明細書で使用されるように、単数形「a」、「an」、および「the」は、文脈が他に明白に示していない限り、複数形を同様に含むことが意図されている。さらに、用語「含んでいる(including)」、「含む(includes)」、「有している(having)」、「有する(has)」、「含んだ(with)」、または、その変異形態が詳細な記載および/または請求項のいずれかで使用される程度には、上記のような用語は「含んでいる(comprising)」との用語に類似する手法で包括的であることを意図している。
「約(about)」または「およそ(approximately)」という用語は、当業者によって決定されるような特定の値の許容可能な誤差範囲内であることを意味し、これは、その値がどのように測定または決定されるか、つまり、測定システムの制限に部分的に依存している。例えば、「約」とは、当該技術分野での実践につき1または1を超える標準偏差を意味し得る。代替的に、「約」は、任意の値の最大20%、最大15%、最大10%、最大5%、または最大1%の範囲を意味することができる。
本明細書で使用されるように、「細胞」は通常、生体細胞を指す。細胞は、生体の基本的な構造的、機能的、および/または生物学的な単位であり得る。細胞は、1つ以上の細胞を有する任意の生物に由来してもよい。いくつかの非限定的な例としては、原核細胞、真核細胞、細菌細胞、古細菌細胞、単細胞真核生物の細胞、原虫細胞、植物からの細胞(例えば、植物作物、果物、野菜、穀物、大豆、トウモロコシ(corn)、トウモロコシ(maize)、小麦、種子、トマト、米、カッサバ、サトウキビ、カボチャ、干し草、ジャガイモ、綿、大麻、タバコ、顕花植物、針葉樹、裸子植物、シダ類、クラブモス類、ツノゴケ類、肝臓植物、コケ類)、藻類細胞、(例えば、ボツリオコッカス・ブラウニー(Botryococcus braunii)、クラミドモナス(Chlamydomonas reinhardtii)、ナンノクロロプシス・ガディタナ(Nannochloropsis gaditana)、クロレラ・ピレノイド(Chlorella pyrenoidosa)、ヤツマタモク(Sargassum patens C. Agardh)など)、海草(例えば、コンブ)、真菌細胞(例えば、酵母細胞、キノコの細胞)、動物細胞、無脊椎動物(例えば、ミバエ、刺胞動物、棘皮動物、線虫など)の細胞、脊椎動物(例えば、魚類、両生類、爬虫類、鳥類、哺乳類など)の細胞、哺乳類(ブタ、ウシ、ヤギ、ヒツジ、齧歯類、ラット、ネズミ、非ヒト霊長類、ヒトなど)の細胞などが挙げられる。細胞は、天然生物に由来しない細胞(例えば、合成的に作られた細胞、しばしば人工細胞と呼ばれることもある)である。
「ヌクレオチド」という用語は、本明細書で使用されるように、一般に、塩基-糖-リン酸の組み合わせを指す。ヌクレオチドは合成ヌクレオチドを含んでいてもよい。ヌクレオチドは合成ヌクレオチドアナログを含んでいてもよい。ヌクレオチドは、核酸配列(例えば、デオキシリボ核酸(DNA)およびリボ核酸(RNA))の単量体単位であり得る。ヌクレオチドという用語は、リボヌクレオシド三リン酸アデノシン三リン酸(ATP)、ウリジン三リン酸(UTP)、シトシン三リン酸(CTP)、グアノシン三リン酸(GTP)、およびデオキシリボヌクレオシド三リン酸、例えば、dATP、dCTP、dITP、dUTP、dGTP、dTTP、またはその誘導体を含み得る。そのような誘導体は、例えば、[αS]dATP、7-デアザ-dGTP、および7-デアザ-dATP、ならびに、それらを含有している核酸分子に対するヌクレアーゼ耐性を与えるヌクレオチド誘導体を含み得る。本明細書に使用されるようなヌクレオチドという用語は、ジデオキシリボヌクレオシド三リン酸(ddNTPs)およびそれらの誘導体を指すこともある。ジデオキシリボヌクレオシド三リン酸の例示的な例としては、限定されないが、ddATP、ddCTP、ddGTP、ddITP、およびddTTPが挙げられ得る。光学的に検出可能な部分(例えば、フルオロフォア)を含む部分を使用するなどして、ヌクレオチドは非標識であり得るか、検出可能なように標識され得る。標識化も量子ドットを用いて行なわれてもよい。検出可能な標識としては、例えば、放射性同位体、蛍光標識、化学発光標識、生物発光標識、および酵素標識が挙げられ得る。ヌクレオチドの蛍光標識は、限定されないが、フルオレセイン、5-カルボキシフルオレセイン(FAM)、2’7’-ジメトキシ-4’5-ジクロロ-6-カルボキシフルオレセイン(JOE)、ローダミン、6-カルボキシルローダミン(R6G)、N,N,N’,N’-テトラメチル-6-カルボキシルローダミン(TAMRA)、 6-カルボキシ-X-ローダミン(ROX)、4-(4’ジメチルアミノフェニルアゾ)安息香酸(DABCYL)、カスケードブルー、オレゴングリーン、テキサスレッド、シアニン、および5-(2’-アミノエチル)アミノナフタレン-1-スルホン酸(EDANS)を含んでもよい。蛍光標識されたヌクレオチドの特定の例は、Perkin Elmer(Foster City, Calif)から利用可能な[R6G]dUTP、[TAMRA]dUTP、[R110]dCTP、[R6G]dCTP、[TAMRA]dCTP、[JOE]ddATP、[R6G]ddATP、[FAM]ddCTP、[R110]ddCTP、[TAMRA]ddGTP、[ROX]ddTTP、[dR6G]ddATP、[dR110]ddCTP、[dTAMRA]ddGTP、および[dROX]ddTTP;Amersham(Arlington Heights, Ill.)から利用可能なFluoroLink DeoxyNucleotides、FluoroLink Cy3-dCTP、FluoroLink Cy5-dCTP、FluoroLink Fluor X-dCTP、FluoroLink Cy3-dUTP、およびFluoroLink Cy5-dUTP;Boehringer(Mannheim, Indianapolis, Ind.)から利用可能なフルオレセイン-15-dATP、フルオレセイン-12-dUTP、テトラメチル-ローダミン-6-dUTP、IR770-9-dATP、フルオレセイン-12-ddUTP、フルオレセイン-12-UTP、およびフルオレセイン-15-2’-dATP;ならびに、Molecular Probes(Eugene, Oreg.)から利用可能な染色体標識されたヌクレオチド、BODIPY-FL-14-UTP、BODIPY-FL-4-UTP、BODIPY-TMR-14-UTP、BODIPY-TMR-14-dUTP、BODIPY-TR-14-UTP、BODIPY-TR-14-dUTP、カスケードブルー-7-UTP、カスケードブルー-7-dUTP、フルオレセイン-12-UTP、フルオレセイン-12-dUTP、オレゴングリーン 488-5-dUTP、ローダミングリーン-5-UTP、ローダミングリーン-5-dUTP、テトラメチルローダミン-6-UTP、テトラメチルローダミン-6-dUTP、テキサスレッド-5-UTP、テキサスレッド-5-dUTP、およびテキサスレッド-12-dUTPを含み得る。ヌクレオチドはさらに化学修飾によって標識またはマークされ得る。化学修飾された単一ヌクレオチドは、ビオチン-dNTPであり得る。ビオチン化dNTPのいくつかの非限定的な例としては、ビオチン-dATP(例えば、バイオ-N6-ddATP、ビオチン-14-dATP)、ビオチン-dCTP(例えば、ビオチン-11-dCTP、ビオチン-14-dCTP)、およびビオチン-dUTP(例えば、ビオチン-11-dUTP、ビオチン-16-dUTP、ビオチン-20-dUTP)を挙げることができる。
「ポリヌクレオチド」、「オリゴヌクレオチド」、および「核酸」という用語は、一般に、一本鎖、二本鎖、または多鎖のいずれかの形態のデオキシリボヌクレオチドまたはリボヌクレオチド、あるいはそれらのアナログの任意の長さのヌクレオチドのポリマー形態を意味するために交換可能に使用される。ポリヌクレオチドは、細胞に対して外来性であっても内因性であってもよい。ポリヌクレオチドは、細胞を含まない環境において存在することができる。ポリヌクレオチドは、遺伝子またはその断片であってもよい。ポリヌクレオチドはDNAであってもよい。ポリヌクレオチドはRNAであってもよい。ポリヌクレオチドは任意の三次元構造を有してもよく、任意の機能を果たしてもよい。ポリヌクレオチドは1つ以上のアナログ(例えば、変化した骨格、糖、または核酸塩基)を含んでいてもよい。存在する場合、ヌクレオチド構造に対する修飾は、ポリマーのアセンブリの前または後で与えられ得る。アナログのいくつかの非限定的な例としては、5-ブロモウラシル、ペプチド核酸、ゼノ核酸、モルホリノ、ロックド核酸、グリコール核酸、トレオース核酸、ジデオキシヌクレオチド、コルジセピン、7-デアザ-GTP、フルオロフォア(例えば、糖に結合したローダミンまたはフルオレセイン)、チオール含有ヌクレオチド、ビオチン結合ヌクレオチド、蛍光塩基アナログ、CpG島、メチル-7-グアノシン、メチル化ヌクレオチド、イノシン、チオウリジン、プソイドウリジン、ジヒドロウリジン、ケオシン、およびワイオシンが挙げられる。ポリヌクレオチドの非限定的な例としては、遺伝子または遺伝子断片のコード領域または非コード領域、連鎖解析から定義される遺伝子座(複数の遺伝子座)、エクソン、イントロン、メッセンジャーRNA(mRNA)、転移RNA(tRNA)、リボソームRNA(rRNA)、低分子干渉RNA(siRNA)、低分子ヘアピン型RNA(shRNA)、マイクロRNA(miRNA)、リボザイム、cDNA、組換えポリヌクレオチド、分岐ポリヌクレオチド、プラスミド、ベクター、任意の配列の単離DNA、任意の配列の単離RNA、無細胞DNA(cfDNA)と無細胞RNA(cfRNA)を含む無細胞ポリヌクレオチド、核酸プローブ、およびプライマーが挙げられる。ヌクレオチドの配列は、非ヌクレオチド構成要素によって中断されてもよい。
「トランスフェクション」または「トランスフェクトされた」という用語は一般に、非ウイルス性またはウイルスベースの方法による細胞への核酸の導入を意味する。核酸分子は、完全なタンパク質またはその機能的部分をコードする遺伝子配列であってもよい。例えば、Sambrook et al., 1989, Molecular Cloning: A Laboratory Manual, 18.1-18.88を参照。
「ペプチド」、「ポリペプチド」、および「タンパク質」という用語は、一般に、ペプチド結合によって結合された少なくとも2つのアミノ酸残基のポリマーを指すために、本明細書で互換的に使用される。この用語は、ポリマーの特定の長さを意味するものではなく、ペプチドが組換え技術、化学的または酵素的な合成を使用して生成されたか、あるいは天然に存在するかを示唆または区別することを意図するものでもない。この用語は、天然に存在するアミノ酸ポリマーだけでなく、少なくとも1つの修飾アミノ酸を含むアミノ酸ポリマーにも適用される。場合によっては、ポリマーは非アミノ酸によって中断されてもよい。この用語は、完全長タンパク質を含む任意の長さのアミノ酸鎖、ならびに、二次構造および/または三次構造(例えば、ドメイン)を有するまたは有していないタンパク質を含んでいる。この用語はさらに、例えば、ジスルフィド結合形成、グリコシル化、脂質化、アセチル化、リン酸化、酸化、および標識成分とのコンジュゲーションなどの任意の他の操作によって修飾されたアミノ酸ポリマーを包含する。「アミノ酸」および「アミノ酸」という用語は一般に、本明細書で使用されるように、限定されないが、修飾アミノ酸およびアミノ酸アナログを含む天然および非天然のアミノ酸を指す。修飾アミノ酸は、アミノ酸上に天然には存在しない基または化学部分を含むように化学修飾された、天然のアミノ酸および非天然のアミノ酸を含み得る。アミノ酸アナログはアミノ酸誘導体を指すこともある。「アミノ酸」という用語は、D-アミノ酸およびL-アミノ酸の両方を含む。
本明細書で使用されるように、「非天然」とは、一般に、天然の核酸またはタンパク質では見られない核酸またはポリペプチドの配列を指すことができる。非天然とはアフィニティタグを指すことがある。非天然とは融合を指すことがある。非天然とは、変異、挿入、および/または欠失を含む天然に存在する核酸またはポリペプチドの配列を指すことがある。非天然配列は、非天然配列が融合された核酸および/またはポリペプチド配列によっても示され得る活性(例えば、酵素活性、メチルトランスフェラーゼ活性、アセチルトランスフェラーゼ活性、キナーゼ活性、ユビキチン化活性など)を示すおよび/またはコードすることができる。非天然核酸またはポリペプチド配列は、キメラ核酸および/またはポリペプチドをコードするキメラ核酸および/またはポリペプチド配列を生成するために、遺伝子操作によって天然に存在する核酸またはポリペプチド配列(またはその変異体)に連結され得る。
「プロモーター」という用語は一般に、本明細書で使用されるように、遺伝子の転写または発現を制御し、RNA転写が開始されるヌクレオチドまたはヌクレオチドの領域に隣接または重複して配置され得る制御性DNA領域を指す。プロモーターは、しばしば転写因子と呼ばれるタンパク質因子に結合する特定のDNA配列を含むことができ、遺伝子の転写につながるDNAへのRNAポリメラーゼの結合を容易にする。「基本プロモーター」は、「コアプロモーター」とも呼ばれ、一般に、動作可能に連結されたポリヌクレオチドの転写発現を促進するために必要なすべての基本的なエレメントを含むプロモーターを指すことがある。真核生物の基本プロモーターは、必ずしもそうではないが、典型的には、TATA-ボックスおよび/またはCAATボックスを含む。
「発現」という用語は一般に、本明細書で使用されるように、核酸配列またはポリヌクレオチドがDNA鋳型から(mRNAまたは他のRNA転写物などに)転写されるプロセス、および/または、転写されたmRNAがその後、ペプチド、ポリペプチド、またはタンパク質に翻訳されるプロセスを指す。転写産物およびコードされたポリペプチドはまとめて「遺伝子産物」と呼ばれることがある。ポリヌクレオチドがゲノムDNAに由来する場合、発現は真核細胞中にmRNAのスプライシングを含むことがある。
本明細書で使用されるように、「動作可能に連結された」、「動作可能な連結」、「作動可能に連結された」、またはその文法的な同等物は一般に、遺伝要素、例えば、プロモーター、エンハンサー、ポリアデニル化配列などの並置を指し、これらのエレメントは、期待される方法で動作することを可能にする関係にある。例えば、プロモーターおよび/またはエンハンサー配列を含み得る調節エレメントは、調節エレメントがコード配列の転写を開始するのを助ける場合に、コード領域と作動可能に連結される。この機能的関係が維持される限り、調節エレメントとコード領域との間に介在する残基が存在してもよい。
「ベクター」は一般に、本明細書で使用されるように、ポリヌクレオチドを含むか、またはポリヌクレオチドと会合する高分子または高分子の会合を指し、ポリヌクレオチドの細胞への送達を媒介するために使用され得る。ベクターの例としては、プラスミド、ウイルスベクター、リポソーム、および他の遺伝子送達ビヒクルが挙げられる。ベクターは一般に、標的における遺伝子の発現を促進するために遺伝子に作動可能に連結された遺伝要素、例えば、調節エレメントを含む。
本明細書で使用されるように、「発現カセット」および「核酸カセット」は、一緒に発現されるか、または発現のために動作可能に連結される核酸配列または要素の組み合わせを指すために一般的に交換可能に使用される。場合によっては、発現カセットは、調節エレメント、およびそれらが発現のために動作可能に連結されている遺伝子または複数の遺伝子の組み合わせを指す。
DNAまたはタンパク質配列の「機能的断片」とは一般に、完全長DNAまたはタンパク質配列の生物学的活性に実質的に類似する生物学的活性(機能的または構造的のいずれか)を保持する断片を指す。DNA配列の生物学的活性は、完全長配列に起因することが知られている方法で発現に影響を及ぼすその能力であり得る。
本明細書で使用されるように、「操作された」物体は一般に、その物体がヒトの介入によって改変されたことを示す。非限定的な例によると、核酸は、その配列を、自然界に存在しない配列に変えることによって修飾されてもよい。核酸は、自然界では会合しない核酸にライゲーションすることで修飾されてもよく、ライゲーションした生成物が元の核酸に存在しない機能を有するようになる。操作された核酸は、自然界に存在しない配列で、インビトロで合成されてもよい。タンパク質は、そのアミノ酸配列を、自然界に存在しない配列に変えることによって、修飾されてもよい。操作されたタンパク質は、新しい機能または特性を獲得することがある。「操作された」系は、少なくとも1つの操作された成分を含んでいる。
本明細書で使用されるように、「合成」および「人工」は、天然に存在するヒトタンパク質に対して低い配列同一性(例えば、50%未満の配列同一性、25%未満の配列同一性、10%未満の配列同一性、5%未満の配列同一性、1%未満の配列同一性)を有するタンパク質またはそのドメインを指すために交換可能に使用される。例えば、VPRおよびVP64ドメインは、合成のトランス活性化ドメインである。
「tracrRNA」または「tracr配列」という用語は一般に、本明細書で使用されるように、野生型の例示的なtracrRNA配列(例えば、S.pyogenes S.aureusなど、または配列番号*_*からのtracrRNA)に対して、少なくとも約5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、または100%の配列同一性および/または配列類似性を有する核酸を指すことができる。tracrRNAは、野生型の例示的なtracrRNA配列(例えば、S.pyogenes S.aureusなどに由来するtracrRNA)に対して最大約5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、または100%の配列同一性および/または配列類似性を有する核酸を指すことができる。tracrRNAは、欠失、挿入、または置換、変異、突然変異、またはキメラなどのヌクレオチド変化を含むことができるtracrRNAの修飾形態を指してもよい。tracrRNAは、少なくとも6個の連続するヌクレオチドのストレッチにわたって、野生型の例示的なtracrRNA(例えば、S.pyogenes S.aureusなどに由来するtracrRNA)配列に対して少なくとも約60%同一であり得る核酸を指してもよい。例えば、tracrRNA配列は、少なくとも6個の連続するヌクレオチドのストレッチにわたって、野生型の例示的なtracrRNA(例えば、S. pyogenes S.aureusなどに由来するtracrRNA)配列に対して少なくとも約60%同一、少なくとも約65%同一、少なくとも約70%同一、少なくとも約75%同一、少なくとも約80%同一、少なくとも約85%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約98%同一、少なくとも約99%同一、または100%同一であり得る。タイプIIのtracrRNA配列は、隣接するCRISPRアレイの反復配列の一部と相補性を有する領域を同定することにより、ゲノム配列上で予測することができる。
本明細書で使用されるように、「ガイド核酸」は一般に、別の核酸にハイブリダイズし得る核酸を指すことができる。ガイド核酸はRNAであってもよい。ガイド核酸はDNAであってもよい。ガイド核酸は核酸の配列に部位特異的に結合するようにプログラムされていてもよい。標的とする核酸、すなわち、標的核酸は、ヌクレオチドを含んでもよい。ガイド核酸はヌクレオチドを含んでもよい。標的核酸の一部はガイド核酸の一部に相補的であってもよい。ガイド核酸に相補的であり、ガイド核酸とハイブリダイズする二本鎖の標的ポリヌクレオチドの鎖を、相補鎖と呼ぶことがある。相補鎖に相補的であり、したがってガイド核酸に相補的ではない可能性のある二本鎖標的ポリヌクレオチドの鎖を、非相補鎖と呼ぶことがある。ガイド核酸はポリヌクレオチド鎖を含んでもよく、「シングルガイド核酸」と呼ばれることがある。ガイド核酸は2つのポリヌクレオチド鎖を含んでも良く、「ダブルガイド核酸」と呼ばれることがある。特に指定がない限り、「ガイド核酸」という用語は、シングルガイド核酸およびダブルガイド核酸の両方を指す、包括的なものであってもよい。ガイド核酸は、「核酸標的化セグメント」または「核酸標的化配列」と呼ぶことができるセグメントを含んでもよい。核酸標的化セグメントは、「タンパク質結合セグメント」または「タンパク質結合配列」または「Casタンパク質結合セグメント」と呼ぶことがあるサブセグメントを含んでもよい。
2つ以上の核酸またはポリペプチド配列の文脈における「配列同一性」または「パーセント同一性」という用語は一般に、配列比較アルゴリズムを使用して測定されるように、局所的または全体的な比較ウインドウにわたって最大の対応について比較しておよび整列させたときに、同じであるか、または同じであるアミノ酸残基または核酸を特定の割合で有する2つの(例えば、ペアワイズアライメントにおいて)または複数の(例えば、多重配列アライメントにおいて)配列を指す。ポリペプチド配列の好適な配列比較アルゴリズムとしては、例えば、ワード長(W)が3、期待値(E)が10、および、イグジステンス11、エクステンション1でのギャップコストを設定するBLOSUM62スコアリングマトリックスのパラメータを使用して、および30残基よりも長いポリペプチド配列の条件付き構成スコアマトリックス調整を使用するBLASTP;wordlength(W)が2、expectation(E)が1000000、30残基未満の配列に対して、ギャップを開くギャップコストを9、ギャップを拡張するギャップコストを1に設定するPAM30スコアリングマトリックスを使用BLASTP(これらは、https://blast.ncbi.nlm.nih.govで利用可能なBLASTスイートのBLASTPのデフォルトパラメータである)、マッチ2、ミスマッチ-1、およびギャップ-1のパラメータを使用するスミス-ウォーターマン相同性検索アルゴリズムのパラメータを使用するCLUSTALW、デフォルトのパラメータを使用するMUSCLE、retree:2、maxiterations:1000のパラメータを使用するMAFFT、デフォルトのパラメータを使用するNovafold、デフォルトのパラメータHMMER hmmalignが挙げられる。
1つ以上の保存的アミノ酸置換を有する、本明細書に記載される酵素のいずれかの変異体変種が本開示に含まれている。そのような保存的置換は、ポリペプチドの三次元構造または機能を破壊することなく、ポリペプチドのアミノ酸配列において行われ得る。保存的置換は、互いに類似する疎水性、極性、およびR鎖長を持つアミノ酸を置換することにより達成することができる。さらにまたは代替的に、異なる種からの相同タンパク質の整列させた配列を比較することにより、保存的置換は、コードされたタンパク質の基本機能を変えることなく、種間で変異したアミノ酸残基(例えば、保存されていない残基)を突き止めることにより特定され得る。このような保存的に置換された変異体は、本明細書に記載される系のいずれか1つ(例えば、本明細書に記載されるMG36またはMG39系)に対して少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する変異体を含み得る。いくつかの実施形態では、そのような保存的に置換された変異体は、機能的変異体である。そのような機能的変異体は、エンドヌクレアーゼの重要な活性部位残基の活性が破壊されないような置換を有する配列を包含することができる。いくつかの実施形態では、本明細書に記載される系のいずれかの機能的変異体は、図4と5において呼び出される保存残基または機能的残基のうちの少なくとも1つの置換を欠いている。いくつかの実施形態では、本明細書に記載される系のいずれかの機能的変異体は、図4および図5において呼び出される保存残基または機能的残基のすべての置換を欠いている。
機能的に類似するアミノ酸を提供する保存的置換表は、様々な文献から入手可能である(例えば、Creighton, Proteins: Structures and Molecular Properties (W H Freeman & Co.; 2nd Edition (December 1993))を参照。以下の8つのグループは、それぞれ互いに保存的な置換であるアミノ酸を含んでいる。
1)アラニン(A)、グリシン(G)、
2)アスパラギン酸(D)、グルタミン酸(E)、
3)アスパラギン(N)、グルタミン(Q)、
4)アルギニン(R)、リジン(K)、
5)イソロイシン(I)、ロイシン(L)、メチオニン(M)、バリン(V)、
6)フェニルアラニン(F)、チロシン(Y)、トリプトファン(W)、
7)セリン(S)、トレオニン(T)、および、
8)システイン(C)、メチオニン(M)。
本明細書で使用されるように、「RuvC_IIIドメイン」という用語は一般に、RuvCエンドヌクレアーゼドメイン(RuvCヌクレアーゼドメインは、RuvC_I、RuvC_II、およびRuvC_IIIという3つの不連続なセグメントで構成される)の第3の不連続セグメントを指す。RuvCドメインまたはそのセグメントは一般に、既知のドメイン配列へのアラインメント、注釈付きドメインを有するタンパク質への構造的アラインメント、または既知のドメイン配列に基づいて構築された隠れマルコフモデル(HMM)(例えば、RuvC_IIIに対するPfam HMM PF18541)との比較によって特定することができる。
本明細書で使用されるように、「HNHドメイン」という用語は一般に、特徴的なヒスチジンおよびアスパラギン残基を有するエンドヌクレアーゼドメインを指す。HNHドメインは一般に、既知のドメイン配列へのアラインメント、注釈付きドメインを有するタンパク質への構造的アラインメント、または既知のドメイン配列に基づいて構築された隠れマルコフモデル(HMM)との比較(例えば、ドメインHNHに対するPfam HMM PF01844)により特定することができる。
本明細書で使用されるように、「リコンビナーゼ」という用語は一般に、リコンビナーゼ認識配列間のDNAの組換えを仲介する部位特異的酵素を指し、結果として、リコンビナーゼ認識配列間のDNA断片の切除、インテグレーション(integration)、反転、または交換(例えば、転座)を生じさせる。
本明細書で使用されるように、核酸修飾(例えば、ゲノム修飾)の文脈における「組み替える」または「組換え」という用語は一般に、2つ以上の核酸分子、または単一の核酸分子の2つ以上の領域がリコンビナーゼタンパク質の作用により修飾されるプロセスを指す。組換えは、特に、例えば、1つ以上の核酸分子の中または間の核酸配列の挿入、反転、切除、または転位をもたらし得る。
本明細書で使用されるように、「トランスポゾン」という用語は一般に、可動要素を指し、これは「カーゴDNA」を伴ってゲノムを出入りする。場合によっては、これらのトランスポゾンは、転位するする核酸の種類、トランスポゾンの末端のリピートの種類、運ばれるカーゴの種類、または転位のモード(すなわち、自己修復または宿主修復)によって異なることがある。本明細書で使用されるように、「トランスポザーゼは一般に、トランスポゾンの末端に結合し、ゲノムの別の部分へのその移動を触媒する酵素を指す。場合によっては、その移動は、カットアンドペースト機構によるものであっても、複製転置によるものであってもよい。
本明細書で使用されるように、「Tn7」または「Tn7様トランスポザーゼ」は一般に、3つの主成分:ヘテロメリックトランスポザーゼ(TnsAおよび/またはTnsB)と調節タンパク質(TnsC)を含むトランスポザーゼのファミリーを指す。TnsABC転位タンパク質に加えて、Tn7エレメントは専用の標的部位選択タンパク質であるTnsDとTnsEをコードすることができる。TnsABCに加えて、配列特異的なDNA結合タンパク質であるTnsDは、「Tn7付着部位」(attTn7)と呼ばれる保存部位への転位を指示する。TnsDは、TniQも含む大きなタンパク質ファミリーのメンバーである。TniQは、プラスミドの分解能部位への転位を標的とすることが示されている。
場合によっては、本明細書に記載されるCAST系は、1つ以上のTn7またはTn7様トランスポザーゼを含んでもよい。特定の例示的な実施形態では、Tn7またはTn7様トランスポザーゼは、多量体タンパク質複合体を含む。特定の例示的な実施形態では、多量体タンパク質複合体は、TnsA、TnsB、TnsC、またはTniQを含む。これらの組み合わせにおいて、トランスポザーゼ(TnsA、TnsB、TnsC、TniQ)は、互いに複合体または融合タンパク質を形成し得る。
本明細書で使用されるように、「Cas12k(代替的に「クラスII、タイプV-K」)という用語は一般に、ヌクレアーゼ活性に欠陥があることが判明しているタイプVのCRISPR系のサブタイプを指す(例えば、それらは、DNA切断に重要な少なくとも一つの触媒残基を欠く少なくとも一つの欠陥RuvCドメインを含み得る)。このようなサブタイプのエフェクターは、一般的にCAST系と関連付けられてきた。
本明細書で使用されるように、「タイプI-F」(代替的に、クラスI、タイプI-FのCRISPR)という用語は一般に、クラスI、タイプIのCRISPR系のサブタイプを指す。このような系は一般に、Cas8、Cas7、およびCas6タンパク質を含む多成分CRISPRエフェクターを含む。場合によっては、このような系は、CAST系と関連していることが見出される。場合によっては、タイプI-FのCRISPR系は、Cas8および/またはCas5結合のための8-nt 5’ハンドル、標的認識のためのCas7の6コピーによって結合される32-ntスペーサー、またはCas6結合とプレcrRNAプロセシングのための20-nt 3’ヘアピンを含むcrRNAを含んでいる。場合によっては、タイプFの系は、標的結合のために非標的鎖上の5’-CC PAMを利用する。
概要
固有の機能性および構造を有する新しいCas酵素の発見は、デオキシリボ核酸(DNA)編集技術をさらに破壊し、速度、特異性、機能性、および使いやすさを改善する可能性を提供することができる。微生物およびまさに多種多様な微生物種におけるCRISPR(Clustered Regularly Interspaced Short Palindromic Repeats)(クラスター化され、規則的に間隔が空いた短い回文構造の繰り返し)系の普及が予測されるなか、文献には機能的に特徴づけられたCRISPR/Cas酵素は比較的少ない。これは、膨大な数の微生物種が実験室での培養が容易ではないことも理由の一つである。多くの微生物種を代表する自然環境ニッチからのメタゲノム配列決定により、新たなCRISPR/Cas系の既知数が飛躍的に増加し、新たなオリゴヌクレオチド編集機能の発見を加速する可能性がある。このようなアプローチの有用性を示す最近の例は、2016年に天然微生物群集のメタゲノム解析からCasX/CasY CRISPR系が発見されたことである。
CRISPR/Cas系は、微生物における適応免疫系として機能することが記載されているRNA指向性ヌクレアーゼ複合体である。その自然の文脈では、CRISPR/Cas系は、CRISPR(clustered regularly interspaced short palindromic repeats)オペロンまたは遺伝子座で起こり、これは一般に2つの部分:(i)RNAベースの標的化エレメントをコードする、同じく短いスペーサー配列で区切られた短い反復配列(30~40bp)のアレイ、および、(ii)アクセサリータンパク質/酵素と一緒にRNAベースの標的化エレメントによって指向されるヌクレアーゼポリペプチドをコードするCasをコードするORFを含む。特定の標的核酸配列の効率的なヌクレアーゼ標的化は一般に、(i)標的の最初の6~8個の核酸(標的シード)とcrRNAガイドとの間の相補的なハイブリダイゼーション、および、(ii)標的シードの定義された近傍にプロトスペーサー隣接モチーフ(PAM)配列が存在すること(PAMは通常、宿主ゲノム内で一般的に表されない配列である)の両方を必要とする。系の正確な機能と組織に応じて、CRISPR-Cas系は一般的に、共有の機能的特徴と進化的類似性に基づいて、2つのクラス、5つのタイプ、および16のサブタイプに整理されている(図1参照)。
クラスI CRISPR-Cas系は、大規模なマルチサブユニットエフェクター複合体を有し、I、III、およびIタイプVを含む。
タイプIのCRISPR-Cas系は、成分の点で中程度の複雑さを有すると考えられる。タイプIのCRISPR-Cas系では、RNA標的化エレメントのアレイは、長い前駆体crRNA(プレcrRNA)として転写され、これは、リピートエレメントで処理されることで、短い成熟したcrRNAを遊離させ、crRNAはプロトスペーサー-隣接モチーフ(PAM)と呼ばれる適切な短いコンセンサス配列が後に続くときに、ヌクレアーゼ複合体を核酸標的に向ける。この処理は、カスケードと呼ばれる大型エンドヌクレアーゼ複合体のエンドリボヌクレアーゼサブユニット(Cas6)を介して生じ、この複合体は、crRNA指向性ヌクレアーゼ複合体のヌクレアーゼ(Cas3)タンパク質成分も含んでいる。Cas Iヌクレアーゼは主にDNAヌクレアーゼとして機能する。
IタイプIIのCRISPR系は、CsmまたはCmrタンパク質サブユニットを含むリピート関連ミステリアスタンパク質(RAMP)と並んで、Cas10として知られる中央ヌクレアーゼの存在によって特徴付けられることがある。タイプI系と同様に、成熟crRNAはCas6様酵素を用いてプレcrRNAから処理される。タイプIおよびタイプIIの系とは異なり、IタイプIIの系は、DNA-RNA二重鎖(RNAポリメラーゼのテンプレートとして使用されているDNA鎖など)を標的として切断すると思われる。
IタイプVのCRISPR-Cas系は、高度に減少した大きなサブユニットヌクレアーゼ(csf1)、Cas5(csf3)とCas7(csf2)のグループのRAMPタンパク質に対する2つの遺伝子、および、場合によっては予測される小さなサブユニットに対する遺伝子からなるエフェクター複合体を有し、このような系は一般的に内因性プラスミド上に存在する。
タイプIIのCRISPR-Cas系は一般に、単一ポリペプチドマルチドメインヌクレアーゼエフェクターを有し、タイプII、タイプV、およびタイプVIを含む。
タイプIIのCRISPR-Cas系は成分の点で最も単純であると考えられている。タイプIIのCRISPR-Cas系では、CRISPRアレイの成熟crRNAへの処理は、特別なエンドヌクレアーゼサブユニットの存在を必要とせず、むしろアレイ反復配列に相補的な領域を有する小さなトランスコードされたcrRNA(tracrRNA)を必要とする。tracrRNAは、対応するエフェクターヌクレアーゼ(Cas9など)および反復配列の両方と相互作用して前駆体dsRNA構造を形成し、これは内因性RNAse IIIによって切断されることで、tracrRNAとcrRNAの両方を負荷した成熟エフェクター酵素が生成される。Cas IIヌクレアーゼは、DNAヌクレアーゼとして知られている。タイプ2のエフェクターは一般に、RNase Hフォールドを採用したRuvC様エンドヌクレアーゼドメインと、RuvC様ヌクレアーゼドメインのフォールド内に挿入された挿入された無関係なHNHヌクレアーゼドメインからなる構造を示す。RuvC様ドメインは標的(例えば、crRNAの相補体)DNA鎖の切断を担い、HNHドメインは変位したDNA鎖の切断を担う。
タイプVのCRISPR-Cas系は、RuvC様ドメインを含むタイプIIのエフェクターと同様のヌクレアーゼエフェクター(例えば、Cas12)構造を特徴とする。タイプIIのと同様に、ほとんどの(すべてではないが)タイプVのCRISPR系は、プレcrRNAを成熟crRNAへと処理するためにtracrRNAを使用する。しかしながら、プレcrRNAを切断して複数のcrRNAにするためにRNAse IIIを必要とするタイプIIの系とは異なり、タイプVの系はプレcrRNAを切断するためにエフェクターヌクレアーゼ自体を使用することができる。タイプIIのCRISPR-Cas系のように、タイプVのCRISPR-Cas系は再度、DNAヌクレアーゼとして知られている。タイプIIのCRISPR-Cas系とは異なり、いくつかのタイプVの酵素(例えば、Cas12a)は、二本鎖標的配列の最初のcrRNA指向切断によって活性化される強固な一本鎖非特異的デオキシリボヌクレアーゼ活性を有すると思われる。
タイプVIのCRIPSR-Cas系は、RNAガイドされたRNAエンドヌクレアーゼを有する。RuvC様ドメインの代わりに、タイプVIの系の単一のポリペプチドエフェクター(例えば、Cas13)は、2つのHEPNリボヌクレアーゼドメインを含む。タイプIIのおよびタイプVの系とは異なり、タイプVIの系も、プレcrRNAをcrRNAへと処理するためにtracrRNAを必要としないと思われる。しかしながら、タイプVの系と同様に、いくつかのタイプVIの系(例えば、C2C2)は、標的RNAの最初のcrRNA指向性切断によって活性化される強固な一本鎖非特異的ヌクレアーゼ(リボヌクレアーゼ)活性を有すると思われる。
より単純なアーキテクチャであることから、クラスII CRISPR-Casは、デザイナーヌクレアーゼ/ゲノム編集用途としての操作および開発のために最も広く採用されている。
インビトロでの使用のためのこのような系の初期の適応の1つは、Jinekら(Science. 2012 Aug 17;337(6096):816-21。参照により本明細書に完全に組み込まれる)。Jinekの研究は、最初に、(i)S.pyogenes SF370から単離した組換え発現した、精製された完全長Cas9(例えば、クラスII、タイプIIのCas酵素)、(ii)切断されることが望ましい標的DNA配列に相補的な約20ntの5’配列と、その後の3’tracr結合配列とを有する精製された成熟した約42nt crRNA(全crRNAはT7プロモーター配列を運ぶ合成DNAテンプレートからインビトロ転写されている)、(iii)T7プロモーター配列を運ぶ合成DNAテンプレートからインビトロ転写された精製tracrRNA、および、(iv)Mg2+を含む系を記載していた。Jinekは後に、(ii)のcrRNAがリンカー(例えば、GAAA)によって(iii)の5’末端に結合されて、それ自体でCas9を標的に導くことができる単一の融合合成ガイドRNA(sgRNA)を形成する、改良型の操作された系を説明した(図2の上部パネルと下部パネルを比較)。
参照により本明細書に完全に組み込まれるMaliら(Science.2013 Feb 15; 339(6121):823-826.)はその後、以下:(i)C末端核局在化配列(例えば、SV40 NLS)および適切なポリアデニル化シグナル(例えば、TK pAシグナル)を有する適切な哺乳類プロモーター下でコドン最適化Cas9(例えば、クラスII、タイプIIのCas酵素)をコードするORF、および、(ii)適切なポリメラーゼIIIプロモーター(例えば、U6プロモーター)下で、sgRNAをコードするORF(Gで始まる5’配列と、その後の、3’tracr結合配列、リンカー、およびtracrRNA配列に連結した20ntの相補的標的核酸配列とを有する)をコードするDNAベクターを提供することにより、哺乳動物細胞で使用するためにこの系を適合させた。
トランスポゾンは、ゲノム内の位置を移動することができる可動要素である。そのようなトランスポゾンは、宿主に及ぼす悪影響を制限するために進化してきた。様々な調節メカニズムが、トランスポゾンを低い頻度で維持し、時にはトランスポゾンを様々な細胞プロセスと調整するために使用されている。原核生物のトランスポゾンの中には、宿主に利益をもたらす機能を動員するか、それ以外の方法でエレメントの維持に役立つことができるものもある。特定のトランスポゾンはさらに、標的部位の選択を厳密に制御するメカニズムを進化させた可能性があり、その最も顕著な例がTn7ファミリーである。
トランスポゾンTn7および類似のエレメントは、自然環境において他の適応的な機能をコードしているだけでなく、臨床環境において抗生物質耐性および病原体機能のリザーバーであり得る。例えば、Tn7系は、重要な宿主遺伝子へのインテグレーションをほぼ完全に回避するメカニズムを進化させたが、宿主細菌間でTn7を移動させることができる移動性プラスミドおよびバクテリオファージを認識することによって、エレメントの分散を最大化させることもできる。
Tn7およびTn7様エレメントは、挿入する場所と時間を制御することができ、細菌ゲノム内の単一の保存位置への挿入を誘導する1つの経路と、細菌間でエレメントを輸送できる移動性プラスミドへの標的化を最大限にするのに適合していると思われる第2の経路を有する(図3参照)。Tn7様トランスポゾンとCRISPR-Cas系との関連は、トランスポゾンがCRISPRエフェクターを乗っ取って標的部位にRループを生成し、プラスミドおよびファージを介してトランスポゾンの拡散を促進した可能性を示唆している。
MG36系
1つの態様において、本開示は、カーゴヌクレオチド配列を標的核酸部位に転位させるための系を提供する。この系は第1の二本鎖核酸を含んでもよい。第1の二本鎖核酸は、カーゴヌクレオチド配列を含んでもよく、カーゴヌクレオチド配列がリコンビナーゼ複合体と相互作用するように構成される。系はCasエフェクター複合体を含んでもよい。Casエフェクター複合体は、クラスII、タイプIIのCasエフェクター、および標的核酸部位にハイブリダイズするように構成された少なくとも1つの操作されたガイドポリヌクレオチドを含み得る。クラスII、タイプIIのCasエフェクターは、RuvCドメインとHNHドメインを含むことができる。系は、リコンビナーゼまたはトランスポザーゼ複合体を含んでもよく、リコンビナーゼまたはトランスポザーゼ複合体はカーゴヌクレオチド配列を標的核酸部位に補充するように構成される。
場合によっては、カーゴヌクレオチド配列は、左側のトランスポザーゼ認識配列に隣接している。場合によっては、カーゴヌクレオチド配列は、右側のトランスポザーゼ認識配列に隣接している。場合によっては、カーゴヌクレオチド配列は、左側のトランスポザーゼ認識配列および右側のトランスポザーゼ認識配列に隣接している。場合によっては、本系は、標的核酸部位を含む第2の二本鎖核酸をさらに含む。場合によっては、本系は、標的核酸部位に隣接するCasエフェクター複合体に適合するPAM配列をさらに含む。場合によっては、PAM配列は、標的核酸部位の3’に位置する。場合によっては、リコンビナーゼまたはトランスポザーゼ複合体は、Tn7タイプのトランスポザーゼ複合体である。場合によっては、操作されたガイドポリヌクレオチドは、クラスII、タイプIIのCasエフェクターに結合するように構成される。場合によっては、クラスII、タイプIIのCasエフェクターは、配列番号1またはその変異体に対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するポリペプチドを含む。場合によっては、クラスII、タイプIIのCasエフェクターは、配列番号1に対して実質的に同一のポリペプチドを含む。
場合によっては、リコンビナーゼまたはトランスポザーゼ複合体は、配列番号2~5のいずれか1つあるいはその変異体に対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含む少なくとも1つのポリペプチドを含む。場合によっては、リコンビナーゼまたはトランスポザーゼ複合体は、配列番号2~5のいずれか1つに対して実質的に同一の配列を含む少なくとも1つのポリペプチドを含む。場合によっては、リコンビナーゼまたはトランスポザーゼ複合体は、配列番号2~5のいずれか1つあるいはその変異体に対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含む少なくとも2つのポリペプチドを含む。場合によっては、リコンビナーゼまたはトランスポザーゼ複合体は、配列番号2~5のいずれか1つあるいはその変異体に対して実質的に同一の配列を含む少なくとも2つのポリペプチドを含む。場合によっては、リコンビナーゼまたはトランスポザーゼ複合体は、配列番号2~5のいずれか1つあるいはその変異体に対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含む少なくとも3つのポリペプチドを含む。場合によっては、リコンビナーゼまたはトランスポザーゼ複合体は、配列番号2~5のいずれか1つあるいはその変異体に対して実質的に同一の配列を含む少なくとも3つのポリペプチドを含む。場合によっては、リコンビナーゼまたはトランスポザーゼ複合体は、配列番号2~5のいずれか1つあるいはその変異体に対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含む少なくとも4つのポリペプチドを含む。場合によっては、リコンビナーゼまたはトランスポザーゼ複合体は、配列番号2~5のいずれか1つあるいはその変異体に対して実質的に同一の配列を含む4つのポリペプチドを含む。場合によっては、リコンビナーゼまたはトランスポザーゼ複合体は、配列番号2のいずれか1つあるいはその変異体に対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含むTnsB1ポリペプチドを含む。場合によっては、リコンビナーゼまたはトランスポザーゼ複合体は、配列番号2またはその変異体に対して実質的に同一の配列を含むTnsB1ポリペプチドを含む。場合によっては、リコンビナーゼまたはトランスポザーゼ複合体は、配列番号3のいずれか1つあるいはその変異体に対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含むTnsB2ポリペプチドを含む。場合によっては、リコンビナーゼまたはトランスポザーゼ複合体は、配列番号3またはその変異体に対して実質的に同一の配列を含むTnsB2ポリペプチドを含む。場合によっては、リコンビナーゼまたはトランスポザーゼ複合体は、配列番号4のいずれか1つあるいはその変異体に対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含むTnsT1ポリペプチドを含む。場合によっては、リコンビナーゼまたはトランスポザーゼ複合体は、配列番号4またはその変異体に対して実質的に同一の配列を含むTnsT1ポリペプチドを含む。場合によっては、リコンビナーゼまたはトランスポザーゼ複合体は、配列番号5のいずれか1つあるいはその変異体に対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含むTnsCポリペプチドを含む。場合によっては、リコンビナーゼまたはトランスポザーゼ複合体は、配列番号5またはその変異体に対して実質的に同一の配列を含むTnsCポリペプチドを含む。
場合によっては、操作されたガイドポリヌクレオチドは、配列番号11またはその変異体に対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する少なくとも60~80個の連続したヌクレオチドを含む配列を含む。
場合によっては、左側のリコンビナーゼ配列は、配列番号17~18のいずれか1つあるいはその変異体に対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含む。場合によっては、右側のリコンビナーゼ配列は、配列番号19またはその変異体に対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含む。
場合によっては、クラスII、タイプIIのCasエフェクター、およびリコンビナーゼまたはトランスポザーゼ複合体は、約20キロベース未満、約15キロベース未満、約10キロベース未満、または約5キロベース未満を含むポリヌクレオチド配列によってコードされる。
1つの態様において、本開示は、標的ヌクレオチド配列を含む標的核酸部位にカーゴヌクレオチド配列を転位させるための方法を提供し、上記方法は、本明細書に記載される系を細胞内で発現させる工程、または本明細書に記載される系を細胞に導入する工程を含む。
MG39系
1つの態様において、本開示は、カーゴヌクレオチド配列を標的核酸部位に転位させるための系を提供する。系は、カーゴヌクレオチド配列を含む第1の二本鎖核酸を含んでもよい。このカーゴヌクレオチド配列は、Tn7タイプのトランスポザーゼ複合体と相互作用するように構成されてもよい。系はCasエフェクター複合体を含んでもよい。Casエフェクター複合体は、クラスII、タイプVのCasエフェクター、および標的ヌクレオチド配列にハイブリダイズするように構成された操作されたガイドポリヌクレオチドを含んでもよい。クラスII、タイプVのCasエフェクターは、RuvCドメインを含むことができる。系は、Casエフェクター複合体に結合するように構成されたTn7タイプのトランスポザーゼ複合体を含んでもよく、Tn7タイプのトランスポザーゼ複合体はTnsAサブユニットを含む。
場合によっては、カーゴヌクレオチド配列は、左側のトランスポザーゼ認識配列に隣接している。場合によっては、カーゴヌクレオチド配列は、右側のトランスポザーゼ認識配列に隣接している。場合によっては、カーゴヌクレオチド配列は、左側のトランスポザーゼ認識配列および右側のトランスポザーゼ認識配列に隣接している。場合によっては、本系は、標的核酸部位を含む第2の二本鎖核酸をさらに含む。場合によっては、本系は、標的核酸部位に隣接するCasエフェクター複合体に適合するPAM配列をさらに含む。場合によっては、PAM配列は、標的核酸部位の3’に位置する。
場合によっては、操作されたガイドポリヌクレオチドは、クラスII、タイプVのCasエフェクターに結合するように構成される。場合によっては、クラスII、タイプVのCasエフェクターは、配列番号5またはその変異体に対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含むポリペプチドを含む。場合によっては、クラスII、タイプVのCasエフェクターは、配列番号5またはその変異体に対して実質的に同一の配列を含むポリペプチドを含む。場合によっては、TnsAサブユニットは、配列番号7またはその変異体に対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する配列を有するポリペプチドを含む。場合によっては、TnsAサブユニットは、配列番号7またはその変異体に対して実質的に同一の配列を有するポリペプチドを含む。
場合によっては、Tn7タイプのトランスポザーゼ複合体は、配列番号8~10のいずれか1つあるいはその変異体に対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含む少なくとも1つのポリペプチドを含む。場合によっては、リコンビナーゼまたはトランスポザーゼ複合体は、配列番号8~10のいずれか1つあるいはその変異体に対して実質的に同一の配列を含む少なくとも1つのポリペプチドを含む。場合によっては、Tn7タイプのトランスポザーゼ複合体は、配列番号8~10のいずれか1つあるいはその変異体に対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含む少なくとも2つのポリペプチドを含む。場合によっては、Tn7タイプのトランスポザーゼ複合体は、配列番号8~10のいずれか1つあるいはその変異体に対して実質的に同一の配列を含む少なくとも2つのポリペプチドを含む。場合によっては、Tn7タイプのトランスポザーゼ複合体は、配列番号8~10のいずれか1つあるいはその変異体に対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含む少なくとも3つのポリペプチドを含む。場合によっては、Tn7タイプのトランスポザーゼ複合体は、配列番号8~10のいずれか1つあるいはその変異体に対して実質的に同一の配列を含む少なくとも3つのポリペプチドを含む。
場合によっては、Tn7タイプのトランスポザーゼ複合体は、配列番号7のいずれか1つあるいはその変異体に対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含むTnsAポリペプチドを含む。場合によっては、Tn7タイプのトランスポザーゼ複合体は、配列番号7のいずれか1つあるいはその変異体に対して実質的に同一の配列を含むTnsAポリペプチドを含む。場合によっては、Tn7タイプのトランスポザーゼ複合体は、配列番号8のいずれか1つあるいはその変異体に対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含むTnsBポリペプチドを含む。場合によっては、Tn7タイプのトランスポザーゼ複合体は、配列番号8のいずれか1つあるいはその変異体に対して実質的に同一の配列を含むTnsBポリペプチドを含む。場合によっては、Tn7タイプのトランスポザーゼ複合体は、配列番号9のいずれか1つあるいはその変異体に対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含むTnsCポリペプチドを含む。場合によっては、Tn7タイプのトランスポザーゼ複合体は、配列番号9のいずれか1つあるいはその変異体に対して実質的に同一の配列を含むTnsCポリペプチドを含む。場合によっては、Tn7タイプのトランスポザーゼ複合体は、配列番号10のいずれか1つあるいはその変異体に対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含むTniQポリペプチドを含む。場合によっては、Tn7タイプのトランスポザーゼ複合体は、配列番号10のいずれか1つあるいはその変異体に対して実質的に同一の配列を含むTniQポリペプチドを含む。
場合によっては、操作されたガイドポリヌクレオチドは、配列番号13~16のいずれか1つあるいはその変異体に対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する少なくとも約46~80個の連続したヌクレオチドを含む配列を含む。場合によっては、操作されたガイドポリヌクレオチドは、配列番号13~16のいずれか1つあるいはその変異体に対して実質的に同一の少なくとも約46~80個の連続したヌクレオチドを含む配列を含む。
場合によっては、左側のリコンビナーゼ配列は、配列番号20またはその変異体に対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含む。場合によっては、左側のリコンビナーゼ配列は、配列番号20またはその変異体に対して実質的に同一の配列を含む。
場合によっては、右側のリコンビナーゼ配列は、配列番号21またはその変異体に対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含む。場合によっては、右側のリコンビナーゼ配列は、配列番号21またはその変異体に対して実質的に同一の配列を含む。
場合によっては、クラスII、タイプVのCasエフェクター、およびTn7タイプのトランスポザーゼ複合体は、約20キロベース未満、約15キロベース未満、約10キロベース未満、または約5キロベース未満を含むポリヌクレオチド配列によってコードされる。
1つの態様において、本開示は、標的ヌクレオチド配列を含む標的核酸部位にカーゴヌクレオチド配列を転位させるための方法を提供し、上記方法は、本明細書に記載される系を細胞内で発現させる工程、または本明細書に記載される系を細胞に導入する工程を含む。
1つの態様において、本開示は、カーゴヌクレオチド配列を標的核酸部位に転位させるための方法を開示し、上記方法は、カーゴヌクレオチド配列を含む第1の二本鎖核酸を、Casエフェクター複合体と接触させる工程を含む。Casエフェクター複合体は、クラスII、タイプIIのCasエフェクター、および標的核酸部位にハイブリダイズするように構成された少なくとも1つの操作されたガイドポリヌクレオチドを含み得る。方法は、カーゴヌクレオチド配列を含む第1の二本鎖核酸を、カーゴヌクレオチドを標的核酸部位に補充するように構成されたリコンビナーゼまたはトランスポザーゼ複合体と接触させる工程を含み得る。方法は、カーゴヌクレオチド配列を含む第1の二本鎖核酸を、標的核酸部位を含む第2の二本鎖核酸と接触させる工程を含み得る。
場合によっては、カーゴヌクレオチド配列は、左側のトランスポザーゼ認識配列に隣接している。場合によっては、カーゴヌクレオチド配列は、右側のトランスポザーゼ認識配列に隣接している。場合によっては、カーゴヌクレオチド配列は、左側のトランスポザーゼ認識配列および右側のトランスポザーゼ認識配列に隣接している。場合によっては、Casエフェクター複合体は、標的核酸部位に隣接するCasエフェクター複合体に適合するPAM配列をさらに含む。場合によっては、PAM配列は、標的核酸部位の3’に位置する。場合によっては、PAM配列は、標的核酸部位の5’に位置する。
MG64系
1つの態様において、本開示は、カーゴヌクレオチド配列を標的核酸部位に転位させるための系を提供する。系は、カーゴヌクレオチド配列を含む第1の二本鎖核酸を含んでもよい。このカーゴヌクレオチド配列は、Tn7タイプのトランスポザーゼ複合体と相互作用するように構成されてもよい。系はCasエフェクター複合体を含んでもよい。Casエフェクター複合体は、クラスII、タイプVのCasエフェクター、および標的ヌクレオチド配列にハイブリダイズするように構成された操作されたガイドポリヌクレオチドを含んでもよい。系は、Casエフェクター複合体に結合するように構成されたTn7タイプのトランスポザーゼ複合体を含んでもよい。クラスII、タイプVのCasエフェクターは、RuvCドメインを含むことができる。
場合によっては、カーゴヌクレオチド配列は、左側のトランスポザーゼ認識配列に隣接している。場合によっては、カーゴヌクレオチド配列は、右側のトランスポザーゼ認識配列に隣接している。場合によっては、カーゴヌクレオチド配列は、左側のトランスポザーゼ認識配列および右側のトランスポザーゼ認識配列に隣接している。場合によっては、本系は、標的核酸部位を含む第2の二本鎖核酸をさらに含む。場合によっては、本系は、標的核酸部位に隣接するCasエフェクター複合体に適合するPAM配列をさらに含む。場合によっては、PAM配列は、標的核酸部位の3’に位置する。場合によっては、PAM配列は、標的核酸部位の5’に位置する。場合によっては、PAM配列は、5’-nGTn-3’または5’-nGTt-3’を含む。
場合によっては、操作されたガイドポリヌクレオチドは、クラスII、タイプVのCasエフェクターに結合するように構成される。場合によっては、クラスII、タイプVのCasエフェクターは、配列番号22、26、30、34、55-89、104、または147のいずれか1つあるいはその変異体に対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含むポリペプチドを含む。場合によっては、クラスII、タイプVのCasエフェクターは、配列番号22、26、30、34、55~89、104、または147のいずれか1つあるいはその変異体に対して実質的に同一の配列を含むポリペプチドを含む。
場合によっては、Tn7タイプのトランスポザーゼ複合体は、配列番号23~25、27~29、31~33、35~37、101~103、105~107、または148~150のいずれか1つあるいはその変異体に対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含む少なくとも1つのポリペプチドを含む。場合によっては、リコンビナーゼまたはトランスポザーゼ複合体は、配列番号23~25、27~29、31~33、35~37、101~103、105~107、または148~150のいずれか1つあるいはその変異体に対して実質的に同一の配列を含む少なくとも1つのポリペプチドを含む。場合によっては、Tn7タイプのトランスポザーゼ複合体は、配列番号23~25、27~29、31~33、35~37、101~103、105~107、または148~150のいずれか1つあるいはその変異体に対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含む少なくとも2つのポリペプチドを含む。場合によっては、Tn7タイプのトランスポザーゼ複合体は、配列番号23~25、27~29、31~33、35~37、101~103、105~107、または148~150のいずれか1つあるいはその変異体に対して実質的に同一の配列を含む少なくとも2つのポリペプチドを含む。場合によっては、Tn7タイプのトランスポザーゼ複合体は、配列番号23~25、27~29、31~33、35~37、101~103、105~107、または148~150のいずれか1つあるいはその変異体に対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含む少なくとも3つのポリペプチドを含む。場合によっては、Tn7タイプのトランスポザーゼ複合体は、配列番号23~25、27~29、31~33、35~37、101~103、105~107、または148~150のいずれか1つあるいはその変異体に対して実質的に同一の配列を含む少なくとも3つのポリペプチドを含む。
場合によっては、Tn7タイプのトランスポザーゼ複合体は、配列番号23~25、27~29、31~33、35~37、101~103、105~107、または148~150のいずれか1つあるいはその変異体に対して、それぞれ、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含むTnsB、TnsC、およびTniQのポリペプチドを含む。場合によっては、Tn7タイプのトランスポザーゼ複合体は、配列番号8のいずれか1つあるいはその変異体に対して実質的に同一の配列を含むTnsBポリペプチドを含む。場合によっては、Tn7タイプのトランスポザーゼ複合体は、配列番号23~25、27~29、31~33、35~37、101~103、105~107、または148~150のいずれか1つあるいはその変異体に対して、それぞれ、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含むTnsB、TnsC、およびTniQのポリペプチドを含む。
場合によっては、操作されたガイドポリヌクレオチドは、配列番号90、91、92、93、117、151、156~181、または209~234のいずれか1つあるいはその変異体に対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する少なくとも約46~80個の連続したヌクレオチドを含む配列を含む。場合によっては、操作されたガイドポリヌクレオチドは、配列番号90、91、92、93、117、151、156~181、または209~234のいずれか1つあるいはその変異体に対して実質的に同一の少なくとも約46~80個の連続したヌクレオチドを含む配列を含む。
場合によっては、操作されたガイドポリヌクレオチドは、配列番号111~114または201~204のいずれか1つあるいはその変異体の非縮重ヌクレオチドに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含む。場合によっては、操作されたガイドポリヌクレオチドは、配列番号111~114または201~204のいずれか1つあるいはその変異体の非縮重ヌクレオチドに対して実質的に同一の少なくとも約46~80個の連続したヌクレオチドを含む配列を含む。
場合によっては、左側のリコンビナーゼ配列は、配列番号125、127、123、129、131、133、153、または134のいずれか1つあるいはその変異体に対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含む。場合によっては、前記左側のリコンビナーゼ配列は、配列番号125、127、123、129、131、133、153、または134のいずれか1つあるいはその変異体に対して実質的に同一の配列を含む。
場合によっては、右側のリコンビナーゼ配列は、配列番号126、155、128、124、130、132、または154のいずれか1つあるいはその変異体に対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含む。場合によっては、右側のリコンビナーゼ配列は、配列番号126、155、128、124、130、132、または154のいずれか1つあるいはその変異体に対して実質的に同一の配列を含む。
場合によっては、クラスII、タイプVのCasエフェクター、およびTn7タイプのトランスポザーゼ複合体は、約20キロベース未満、約15キロベース未満、約10キロベース未満、または約5キロベース未満を含むポリヌクレオチド配列によってコードされる。
MG108系
1つの態様において、本開示は、カーゴヌクレオチド配列を標的核酸部位に転位させるための系を提供する。系は、カーゴヌクレオチド配列を含む第1の二本鎖核酸を含んでもよい。このカーゴヌクレオチド配列は、Tn7タイプのトランスポザーゼ複合体と相互作用するように構成されてもよい。系はCasエフェクター複合体を含んでもよい。Casエフェクター複合体は、クラスII、タイプVのCasエフェクター、および標的ヌクレオチド配列にハイブリダイズするように構成された操作されたガイドポリヌクレオチドを含んでもよい。クラスII、タイプVのCasエフェクターは、RuvCドメインを含むことができる。系は、Casエフェクター複合体に結合するように構成されたTn7タイプのトランスポザーゼ複合体を含んでもよい。場合によっては、Tn7タイプのトランスポザーゼ複合体は、TnsBおよびTnsCの成分を含むが、TnsAおよび/またはTniQの成分を含まない。
場合によっては、カーゴヌクレオチド配列は、左側のトランスポザーゼ認識配列に隣接している。場合によっては、カーゴヌクレオチド配列は、右側のトランスポザーゼ認識配列に隣接している。場合によっては、カーゴヌクレオチド配列は、左側のトランスポザーゼ認識配列および右側のトランスポザーゼ認識配列に隣接している。場合によっては、本系は、標的核酸部位を含む第2の二本鎖核酸をさらに含む。場合によっては、本系は、標的核酸部位に隣接するCasエフェクター複合体に適合するPAM配列をさらに含む。場合によっては、PAM配列は、標的核酸部位の3’に位置する。場合によっては、PAM配列は、標的核酸部位の5’に位置する。
場合によっては、操作されたガイドポリヌクレオチドは、クラスII、タイプVのCasエフェクターに結合するように構成される。場合によっては、クラスII、タイプVのCasエフェクターは、配列番号38または配列番号108あるいはその変異体に対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含むポリペプチドを含む。場合によっては、クラスII、タイプVのCasエフェクターは、配列番号38または配列番号108あるいはその変異体に対して実質的に同一の配列を含むポリペプチドを含む。
場合によっては、Tn7タイプのトランスポザーゼ複合体は、配列番号39~40または109~110のいずれか1つあるいはその変異体に対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含む少なくとも1つのポリペプチドを含む。場合によっては、リコンビナーゼまたはトランスポザーゼ複合体は、配列番号39~40または109~110のいずれか1つあるいはその変異体に対して実質的に同一の配列を含む少なくとも1つのポリペプチドを含む。場合によっては、Tn7タイプのトランスポザーゼ複合体は、配列番号39~40または109~110のいずれか1つあるいはその変異体に対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含む少なくとも2つのポリペプチドを含む。場合によっては、Tn7タイプのトランスポザーゼ複合体は、配列番号39~40または109~110のいずれか1つあるいはその変異体に対して実質的に同一の配列を含む少なくとも2つのポリペプチドを含む。場合によっては、Tn7タイプのトランスポザーゼ複合体は、配列番号39~40または109~110のいずれか1つあるいはその変異体に対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含む少なくとも3つのポリペプチドを含む。場合によっては、Tn7タイプのトランスポザーゼ複合体は、配列番号39~40または109~110のいずれか1つあるいはその変異体に対して実質的に同一の配列を含む少なくとも3つのポリペプチドを含む。
場合によっては、Tn7タイプのトランスポザーゼ複合体は、配列番号40または109のいずれか1つあるいはその変異体に対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含むTnsB成分を含む。場合によっては、リコンビナーゼまたはトランスポザーゼ複合体は、配列番号40または109のいずれか1つあるいはその変異体に対して実質的に同一の配列を含むTnsB成分を含む。
場合によっては、Tn7タイプのトランスポザーゼ複合体は、配列番号39または110あるいはその変異体に対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含むTnsC成分を含む。場合によっては、リコンビナーゼまたはトランスポザーゼ複合体は、配列番号39または110のいずれか1つあるいはその変異体に対して実質的に同一の配列を含むTnsC成分を含む。
場合によっては、Tn7タイプのトランスポザーゼ複合体は、配列番号40と39または109と110あるいはその変異体に対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含むTnsBおよびTnsCの成分を含む。場合によっては、リコンビナーゼまたはトランスポザーゼ複合体は、配列番号40と39または109と110のいずれか1つあるいはその変異体に対して実質的に同一の配列を含むTnsBおよびTnsCの成分を含む。
場合によっては、操作されたガイドポリヌクレオチドは、配列番号118、182、183、235、または236のいずれか1つあるいはその変異体に対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する少なくとも約46~80個の連続したヌクレオチドを含む配列を含む。場合によっては、操作されたガイドポリヌクレオチドは、配列番号118、182、183、235、または236のいずれか1つあるいはその変異体に対して実質的に同一の少なくとも約46~80個の連続したヌクレオチドを含む配列を含む。
場合によっては、操作されたガイドポリヌクレオチドは、配列番号115、116、205、または206のいずれか1つあるいはその変異体の非縮重ヌクレオチドに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含む。場合によっては、操作されたガイドポリヌクレオチドは、配列番号115、116、205、または206のいずれか1つあるいはその変異体の非縮重ヌクレオチドに対して実質的に同一の少なくとも約46~80個の連続したヌクレオチドを含む配列を含む。
場合によっては、左側のリコンビナーゼ配列は、配列番号134またはその変異体に対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含む。場合によっては、左側のリコンビナーゼ配列は、配列番号134またはその変異体に対して実質的に同一の配列を含む。
場合によっては、右側のリコンビナーゼ配列は、配列番号135またはその変異体に対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含む。場合によっては、右側のリコンビナーゼ配列は、配列番号135またはその変異体に対して実質的に同一の配列を含む。
場合によっては、クラスII、タイプVのCasエフェクター、およびTn7タイプのトランスポザーゼ複合体は、約20キロベース未満、約15キロベース未満、約10キロベース未満、または約5キロベース未満を含むポリヌクレオチド配列によってコードされる。
MG110系
1つの態様において、本開示は、カーゴヌクレオチド配列を標的核酸部位に転位させるための系を提供する。系は、カーゴヌクレオチド配列を含む第1の二本鎖核酸を含んでもよい。このカーゴヌクレオチド配列は、Tn7タイプのトランスポザーゼ複合体と相互作用するように構成されてもよい。系はCasエフェクター複合体を含んでもよい。Casエフェクター複合体は、クラスI、タイプIのCasエフェクター、および標的ヌクレオチド配列にハイブリダイズするように構成された操作されたガイドポリヌクレオチドを含んでもよい。系は、Casエフェクター複合体に結合するように構成されたTn7タイプのトランスポザーゼ複合体を含んでもよい。
場合によっては、カーゴヌクレオチド配列は、左側のトランスポザーゼ認識配列に隣接している。場合によっては、カーゴヌクレオチド配列は、右側のトランスポザーゼ認識配列に隣接している。場合によっては、カーゴヌクレオチド配列は、左側のトランスポザーゼ認識配列および右側のトランスポザーゼ認識配列に隣接している。場合によっては、本系は、標的核酸部位を含む第2の二本鎖核酸をさらに含む。場合によっては、本系は、標的核酸部位に隣接するCasエフェクター複合体に適合するPAM配列をさらに含む。場合によっては、PAM配列は、標的核酸部位の3’に位置する。
場合によっては、操作されたガイドポリヌクレオチドは、クラスI、タイプIのCasエフェクターに結合するように構成される。場合によっては、クラスI、タイプIのCasエフェクターは、配列番号41~43または48~50のいずれか1つあるいはその変異体に対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含むポリペプチドを含む。場合によっては、クラスI、タイプIのCasエフェクターは、配列番号41~43または48~50のいずれか1つあるいはその変異体に対して実質的に同一の配列を含むポリペプチドを含む。
場合によっては、操作されたガイドポリヌクレオチドは、クラスI、タイプIのCasエフェクターに結合するように構成される。場合によっては、クラスI、タイプIのCasエフェクターは、配列番号41~43または48~50のいずれか1つあるいはその変異体に対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含むCas6、Cas7、およびCas8のエフェクターを含む。場合によっては、クラスI、タイプIのCasエフェクターは、配列番号41~43または48~50のいずれか1つあるいはその変異体に対して実質的に同一の配列を含むCas6、Cas7、およびCas8のエフェクターを含む。
場合によっては、Tn7タイプのトランスポザーゼ複合体は、配列番号44~47または51~54のいずれか1つあるいはその変異体に対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含む少なくとも1つのポリペプチドを含む。場合によっては、リコンビナーゼまたはトランスポザーゼ複合体は、配列番号44~47または51~54のいずれか1つあるいはその変異体に対して実質的に同一の配列を含む少なくとも1つのポリペプチドを含む。場合によっては、Tn7タイプのトランスポザーゼ複合体は、配列番号44~47または51~54のいずれか1つあるいはその変異体に対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含む少なくとも2つのポリペプチドを含む。場合によっては、Tn7タイプのトランスポザーゼ複合体は、配列番号44~47または51~54のいずれか1つあるいはその変異体に対して実質的に同一の配列を含む少なくとも2つのポリペプチドを含む。場合によっては、Tn7タイプのトランスポザーゼ複合体は、配列番号44~47または51~54のいずれか1つあるいはその変異体に対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含む少なくとも3つのポリペプチドを含む。場合によっては、Tn7タイプのトランスポザーゼ複合体は、配列番号44~47または51~54のいずれか1つあるいはその変異体に対して実質的に同一の配列を含む少なくとも3つのポリペプチドを含む。場合によっては、Tn7タイプのトランスポザーゼ複合体は、配列番号44~47または51~54のいずれか1つあるいはその変異体に対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含む4つのポリペプチドを含む。場合によっては、Tn7タイプのトランスポザーゼ複合体は、配列番号44~47または51~54のいずれか1つあるいはその変異体に対して実質的に同一の配列を含む4つのポリペプチドを含む。
場合によっては、Tn7タイプのトランスポザーゼ複合体は、配列番号44~47または51~54のいずれか1つあるいはその変異体に対して、それぞれ少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含むTnsA、TnsB、TnsC、およびTniQの成分を含む。
場合によっては、操作されたガイドポリヌクレオチドは、配列番号121、122、207、または208のいずれか1つあるいはその変異体の非縮重ヌクレオチドに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含む。場合によっては、操作されたガイドポリヌクレオチドは、配列番号121、122、207、または208のいずれか1つあるいはその変異体の非縮重ヌクレオチドに対して実質的に同一の少なくとも約46~80個の連続したヌクレオチドを含む配列を含む。
場合によっては、左側のリコンビナーゼ配列は、配列番号136または138あるいはその変異体に対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含む。場合によっては、左側のリコンビナーゼ配列は、配列番号136または138あるいはその変異体に対して実質的に同一の配列を含む。
場合によっては、右側のリコンビナーゼ配列は、配列番号137または138あるいはその変異体に対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有する配列を含む。場合によっては、右側のリコンビナーゼ配列は、配列番号137または139あるいはその変異体に対して実質的に同一の配列を含む。
場合によっては、クラスI、タイプIのCasエフェクター、およびTn7タイプのトランスポザーゼ複合体は、約20キロベース未満、約15キロベース未満、約10キロベース未満、または約5キロベース未満を含むポリヌクレオチド配列によってコードされる。
1つの態様において、本開示は、標的ヌクレオチド配列を含む標的核酸部位にカーゴヌクレオチド配列を転位させるための方法を提供し、上記方法は、本明細書に記載される系を細胞内で発現させる工程、または本明細書に記載される系を細胞に導入する工程を含む。
IUPAC協定に合わせて、以下の略語が実施例にわたって使用される。
A=アデニン
C=シトシン
G=グアニン
T=チミン
R=アデニンまたはグアニン
Y=シトシンまたはチミン
S=グアニンまたはシトシン
W=アデニンまたはチミン
K=グアニンまたはチミン
M=アデニンまたはシトシン
B=C、G、またはT
D=A、G、またはT
H=A、C、またはT
V=A、C、またはG
実施例1-(一般的なプロトコル)本明細書に記載される系のためのPAM配列の同定/確認
推定上のエンドヌクレアーゼを、大腸菌溶解液ベースの発現系(myTXTL、Arbor Biosciences)において発現させた。PAM配列は、推定上のヌクレアーゼによって切断され得るランダムに生成された潜在的なPAM配列を含むプラスミドを配列決定することによって決定された。この系では、推定ヌクレアーゼをコードする大腸菌コドン最適化ヌクレオチド配列が、T7プロモーターの制御下でPCR断片からインビトロで転写および翻訳された。T7プロモーターと、その後のリピート-スペーサー-リピート配列で構成される最小限のCRISPRアレイを有する第2のPCR断片も、同じ反応で転写された。TXTL系におけるエンドヌクレアーゼとリピート-スペーサー-リピート配列の発現の成功と、その後のCRISPRアレイプロセシングとにより、活性なインビトロのCRISPRヌクレアーゼ複合体を得た。
8Nの混合塩基(潜在的なPAM配列)が先行している最小限のアレイのスペーサー配列と一致するスペーサー配列を含有する標的プラスミドのライブラリーは、TXTL反応の産出量でインキュベートされた。1~3時間後、反応を停止させ、DNAクリーンアップキット、例えば、Zymo DCC、AMPure XPビーズ、QiaQuickなどを用いてDNAを回収した。アダプター配列は、エンドヌクレアーゼによって切断された活性なPAM配列を有するDNAに平滑末端ライゲーションされたが、切断されなかったDNAはライゲーションにはアクセス不可能である。その後、活性なPAM配列を含むDNAセグメントを、ライブラリーとアダプター配列に特異的なプライマーを用いてPCRで増幅した。PCR増幅産物をゲル上で分解し、切断イベントに対応するアンプリコンを同定した。また、切断反応の増幅セグメントは、NGSライブラリーの調製のためのテンプレートとして、またはサンガーシーケンシングのための基剤として使用された。出発8Nライブラリーのサブセットであるこの得られたライブラリーを配列決定することで、CRISPR複合体に適合するPAM活性を有する配列が明らかになった。プロセシングされたRNA構築物を用いたPAM試験については、インビトロで転写されたRNAがプラスミドライブラリーとともに加えられ、最小限のCRISPRアレイテンプレートが省略されることを除けば、同じ手順を繰り返した。
結合コンピテントであるがヌクレアーゼが欠損しているエンドヌクレアーゼについては、上記の手順の修正によりPAMを決定した。TXTLで発現させた後、sgRNAまたはcrRNAおよびPAMライブラリーを加えた。sgRNA依存的にエフェクターがスペーサー配列に結合すると、スペーサー配列はエフェクタータンパク質内に封じ込められた。スペーサー配列内を標的とする適切な制限酵素を加え、ライブラリー内の保護されていないプラスミドをすべて切断した。PAMを含むライブラリーの切断されていない(エンドヌクレアーゼ結合)メンバーは、PCRとその後のバンドのNGSライブラリー調製によって同定された。
実施例2-インビトロ標的化インテグラーゼ活性
インテグラーゼ活性は、以前に同定されたPAMを用いて優先的にアッセイされたが、その代わりに、PAMライブラリー基質を用いて低効率で実施されることがある。インビトロ試験のための成分の1つの配置は、ドナー配列を含むもの以外の3つのプラスミドを含んでいた:(1)T7プロモーター下のエフェクター(または複数のエフェクター)を有する発現プラスミド、(2)T7プロモーター下のインテグラーゼ遺伝子を有する発現プラスミド;sgRNAまたはcrRNAおよびtracrRNA、(3)スペーサー部位と適切なPAMを含んでいた標的プラスミド、(4)カーゴ遺伝子(例えば、Tet耐性遺伝子などの選択マーカー)の周りでの転位のために必要な左端(LE)および右端(RE)のDNA配列を含んでいたドナープラスミド。インビトロ転写/翻訳(TXTL)系(例えば、大腸菌溶解液ベースまたは網状赤血球抽出液ベースの系)を使用して、エフェクターおよびインテグラーゼ遺伝子を発現させた。発現後、RNA、標的DNA、およびドナーDNAを加え、インキュベートすることで、転位が起こるようにした。標的DNAに1つのプライマー、ドナーDNAに1つのプライマーの状態で、インテグラーゼ部位の接合部においてPCRで転位を検出した。得られたPCR産物をNGSで配列決定し、sgRNA/crRNA標的部位に対する正確な挿入トポロジーを決定した。プライマーは、様々な挿入部位に対応および検出できるように、下流に配置された。プライマーは、インテグレーションの配向が当初不明であったため、カーゴの配向またはスペーサーのいずれかの側でインテグレーションが検出されるように設計された。
インテグレーション効率は、インテグレーションされたカーゴを有する標的DNAの実験的出力の定量的PCR(qPCR)測定により測定され、同じくqPCRにより測定された未修飾の標的DNAの量に対して正規化された。
このアッセイは、溶解物ベースの発現からではなく、精製されたタンパク質成分で実施することができる。この場合、タンパク質は、T7誘導性プロモーター下で、大腸菌プロテアーゼ欠損B株で発現され、超音波処理を用いて細胞を溶解し、AKTA Avant FPLC(GE Lifescience)上でHisTrap FF(GE Lifescience)Ni-NTA親和性クロマトグラフィーを用いて、関心対象のHisタグ付けタンパク質を精製した。純度は、SDS-PAGEおよびInstantBlue Ultrafast(Sigma-Aldrich)クマシー染色アクリルアミドゲル(Bio-Rad)上で分離したタンパク質バンドのImageLabソフトウェア(Bio-Rad)のデンシトメトリーを用いて決定された。タンパク質を、50mMのTris-HCl、300mMのNaCl、1mMのTCEP、5%のグリセロール、pH7.5で構成された貯蔵バッファー(または最大限の安定性を得るために決定された他のバッファー)で脱塩し、-80℃で保存した。精製後、エフェクターとインテグラーゼを、反応バッファー、例えば、26mMのHEPES pH7.5、4.2mMのTRIS pH8、50μg/mLのBSA、2mMのATP、2.1mMのDTT、0.05mMのEDTA、0.2mMのMgCl2、28mMのNaCl、21mMのKCl、1.35%グリセロール(最終pH7.5)に15mMのMg(OAc)を補充したものにおいて、上記のようにsgRNA、標的DNA、およびドナーDNAに加えた。
実施例3-予測されるRNAフォールディング
活性な単一RNA配列の予測されるRNAフォールディングは、Andronescu 2007の方法を用いて37°で計算された。すべてのヘアピンループ二次構造を、構造から単独で欠失させ、より小さいシングルガイドに繰り返しコンパイルした。第2のアプローチでは、MG64-1のtracrRNAを既知のタイプV-kのtracrRNAに整列させ、固有の挿入領域をシングルガイドから変異させ、57塩基最小化した。図12Aは、MG64-2 sgRNA(配列番号202)の予測される構造を描いている。図12Bは、MG64-4 sgRNA(配列番号203)の予測される構造を描いている。図12Cは、MG64-6 sgRNA(配列番号201)の予測される構造を描いている。図12Dは、MG64-7 sgRNA(配列番号204)の予測される構造を描いている。図12Eは、MG108-1 sgRNA(配列番号206)の予測される構造を描いている。塩基の濃淡は、その塩基の塩基ペアリングの確率に対応する。
実施例4-ゲルシフトによるトランスポゾン末端の検証
トランスポゾン末端は、電気泳動移動度シフトアッセイ(EMSA)を介してTnsB結合について試験された。この場合、潜在的なLEまたはREは、DNA断片(100~500bp)として合成され、FAMで標識されたプライマーを用いたPCRを介してFAMで末端標識された。TnsBタンパク質を、インビトロ転写/翻訳系(例えば、PURExpress)で合成した。合成後、1μLのTnsBタンパク質を、結合バッファー(20mMのHEPES pH 7.5、2.5mMのTris pH 7.5、10mMのNaCl、0.0625mMのEDTA、5mMのTCEP、0.005%のBSA、1ug/mLのポリ(dI-dC)、および5%グリセロール)中の10μL反応中の50nMの標識されたREまたはLEに加えた。結合を30°で40分間インキュベートした後、2uLの6Xローディングバッファー(60mMのKCl、10mMのTris pH7,6、50%グリセロール)を添加した。結合反応を5%TBEゲルで分離し、可視化した。TnsBの存在下でのLEまたはREのシフトは、結合の成功に起因するものであり、トランスポザーゼ活性を示した。
図15は、この実験の一例を示しており、MG64-2のRE DNA配列(例えば、配列番号155)を上記の手順によりFAMで末端標識し、対応するMG64-2 TnsB様成分(例えば、配列番号23)とインキュベートした。レーン3の標識バンドのアップシフトは、TnsBによるRE配列の結合を示し、それが活性なRE転位配列を含んでいることを示唆している。
実施例5-大腸菌におけるインテグラーゼ活性(予測的)
大腸菌はゲノムの二本鎖DNA切断を効率的に修復する能力を欠いているため、大腸菌ゲノムにおいて二本鎖切断を引き起こすことができる薬剤による大腸菌の形質転換は、細胞死を引き起こす。この現象を利用して、エンドヌクレアーゼまたはエフェクター支援インテグラーゼ活性は、そのゲノムDNAに組み込まれたスペーサー/標的およびPAM配列を有する標的株において、エンドヌクレアーゼまたはエフェクター支援インテグラーゼとガイドRNA(例えば、実施例3のように決定される)のいずれかを組換え発現させることによって大腸菌において試験される。
その後、操作した株を、シングルガイドRNAを有するヌクレアーゼまたはエフェクターを含むプラスミド、インテグラーゼとアクセサリー遺伝子を発現するプラスミド、および左端(LE)と右端(RE)トランスポゾンモチーフに隣接している選択可能マーカーを有する温度感受性複製起点を含むプラスミドで形質転換して組み込む。これらの遺伝子の発現のために誘導された形質転換体を、プラスミド複製のための制限温度での選択によってゲノム標的へのマーカーの導入についてスクリーニングし、ゲノムへのマーカーのインテグレーションをPCRによって確認する。
オフターゲットのインテグレーションは、不偏的なアプローチを用いてスクリーニングされる。簡潔に言えば、精製したgDNAをTn5インテグラーゼまたはせん断により断片化し、その後、関心対象のDNAを、ライゲーションしたアダプターおよび選択可能マーカーに特異的なプライマーを用いてPCR増幅する。その後、アンプリコンをNGSシーケンシング用に調製する。得られた配列の解析は、トランスポゾン配列をトリミングし、フランキング配列をゲノムにマッピングして挿入位置を決定し、オフターゲット挿入率を決定する。
実施例6-トランスポザーゼ活性のコロニーPCRスクリーニング(予測的)
細菌細胞におけるヌクレアーゼまたはエフェクター支援インテグラーゼ活性の試験のために、MG64_1に特異的な標的および対応するPAM配列を含むように操作されたBL21(DE3)大腸菌細胞から、MGB0032株を構築する。その後、MGB0032大腸菌細胞を、pJL56(MG64_1エフェクターおよびヘルパーの組み合わせを発現するプラスミド、アンピシリン耐性)と、T7プロモーターによって駆動される操作された関心対象標的のシングルガイドRNA配列を発現するクロラムフェニコール耐性プラスミドであるpTCM 64_1 sgとでトランスフェクトする。
次に、両方のプラスミドを含むMGB0032培養物を飽和するまで増殖させ、適切な抗生物質を含む増殖培養物に少なくとも1:10で希釈し、ODが約1になるまで37℃でインキュベートする。この増殖段階からの細胞をエレクトロコンピテントにし、左端(LE)および右端(RE)のトランスポゾンモチーフに隣接しているテトラサイクリン耐性マーカーを有するプラスミドである流線型の64_1 pDonorでトランスフェクトして、組み込む。エレクトロポレーションした細胞を、100μMの最終濃度のIPTGの存在下または非存在下で、LB培地で2時間回収した後、LB-寒天-アンピシリン-クロラムフェニコール-テトラサイクリンにプレーティングし、37℃で4日間インキュベートする。滅菌した爪楊枝を使用して、得られた各CFUをサンプリングし、これを水に混合する。この溶液に、Q5高忠実度PCRマスターミックス(New England Biolabs)とプライマーLA155(5’-GCTCTTCCGATCTNNNNNGATGAGCGCATTGTTAGATTTCAT-3’)およびoJL50(5’-AAACCGACATCGCAGGCTTC-3’)を加える。これらのプライマーは、予測される挿入接合部に隣接している。予測される産物のサイズは609bpである。DNA増幅されたPCR産物は、2%アガロースゲル上で可視化される。PCR産物のサンガーシーケンシングにより、転位事象が確認される。
実施例7-細胞内発現/インビトロアッセイ(予測的)
生理的に関連する環境においてNLS構築物の機能性を試験するために、活性なNLSタグ付きCAST構成要素でクローン化した構築物を、レンチウイルス導入を用いてK562細胞に組み込む。簡潔に言えば、レンチウイルス導入プラスミドにクローン化した構築物を、エンベローププラスミドとパッケージングプラスミドを持つ293T細胞にトランスフェクトし、72時間インキュベート後に、培地からウイルス含有上清を採取する。次に、ウイルスを含む培地を、8μg/mLのポリブレンとともにK562細胞株と72時間インキュベートし、トランスフェクトした細胞を、1μg/mLのピューロマイシンを用いて4日間、大量のインテグレーションのために選択する。選択中の細胞株を4日間の終わりに収集し、核と細胞質画分について区別して溶解する。その後の画分を、インビトロで発現させた成分の相補的なセットで、転位能力について試験する。
1000万個の細胞を遠心分離し、1xPBS pH7.4で1回洗浄する。上清洗浄液を細胞ペレットまで完全に吸引し、-80℃で16時間瞬間冷凍する。氷上で解凍後、細胞ペレットのサイズを質量で測定し、適切な抽出量の細胞分画と核抽出試薬(NE-PER)を用いて、細胞画分のタンパク質を自然に抽出する。簡潔に言えば、細胞質抽出試薬は、細胞の質量対抽出試薬の量が1:10で使用される。細胞懸濁液をボルテックスによって混合し、非イオン性界面活性剤で溶解させる。その後、細胞を16,000xg、4℃で5分間遠心分離する。細胞質抽出上清をデカントし、インビトロ試験のために保存する。次に、核抽出試薬を、元々の細胞質量対核抽出試薬が1:2で添加し、断続的にボルテックスしながら氷上で1時間インキュベートする。その後、核懸濁液を16,000×gで10分間、4℃で遠心分離し、上清の核抽出物をデカントし、インビトロの転位活性について試験する。各条件のそれぞれの細胞および核抽出物4μLを使用して、インビトロ発現タンパク質、ドナーDNA、pTarget、およびバッファーの相補的なセットを用いてインビトロの転位反応を実施する。転位活性の証拠は、ドナー-標的接合部のPCR増幅によってアッセイされる。
実施例8-哺乳動物細胞における活性(予測的)
哺乳動物細胞における標的化および切断活性を示すために、核局在化配列をヌクレアーゼまたはエフェクタータンパク質およびインテグラーゼタンパク質のそれぞれのC末端に融合させ、融合タンパク質を精製する。関心対象のゲノム遺伝子座を標的とするシングルガイドRNAを合成し、ヌクレアーゼ/エフェクタータンパク質とインキュベートすることでリボ核タンパク質複合体を形成する。選択可能なネオマイシン耐性マーカー(NeoR)または左端(LE)および右端(RE)のモチーフに隣接している蛍光マーカーを含むプラスミドで細胞をトランスフェクトし、4~6時間回収し、その後、ヌクレアーゼRNPおよびインテグラーゼタンパク質でエレクトロポレーションする。プラスミドのゲノムへのインテグレーションは、G418耐性コロニーのカウントまたは蛍光活性化細胞の細胞数測定によって定量化される。ゲノムDNAはエレクトロポレーションから72時間後に抽出され、NGS-ライブラリーの調製に使用される。オフターゲット頻度は、ゲノムを断片化し、NGSライブラリー調製のためにトランスポゾンマーカーと隣接するDNAのアンプリコンを調製することによってアッセイされる。各標的化系の活性を試験するために、少なくとも40個の異なる標的部位が選択される。
実施例9-標的とされるヌクレアーゼの活性
インサイチュ発現およびタンパク質配列解析は、いくつかのRNAガイドエフェクターが活性ヌクレアーゼであることを示唆している。それらは、予測されるエンドヌクレアーゼ関連ドメイン(RuvCおよびHNH_エンドヌクレアーゼドメインに一致)および予測されるHNHおよびRuvC触媒残基(例えば、MG36-5エフェクターの予測される触媒残基を示す図4Aを参照)を含む。
候補の活性は、myTXTL系およびインビトロ転写RNAを使用して、操作されたシングルガイドRNA配列で試験される。活性なタンパク質は、アガロースゲル電気泳動でおよそ170bpのバンドを得るためにライブラリーを成功裏に切断するものとして同定される。
実施例10-トランスポゾンの同定
トランスポゾンは、トランスポゾンの左端と右端の間にインテグラーゼおよび/またはインテグラーゼ機能を有する1つ以上のタンパク質配列を含むときに、活性であると予測される。典型的なTn7トランスポゾンは一般に、触媒インテグラーゼTnsBを含むが、TnsA、TnsC、TnsD、TnsE、TniQ、および/または他のインテグラーゼまたはインテグラーゼを含んでいてもよい。トランスポゾン末端は、予測されるインテグラーゼ結合部位を含み、これは、インテグラーゼタンパク質および他の「カーゴ」遺伝子に隣接する15bp~150bpの長さの直接反復および/または逆方向反復を含む。タンパク質配列分析は、インテグラーゼがインテグラーゼドメイン、インテグラーゼドメインおよび/またはインテグラーゼ触媒残基を含むことを示し、それらが活性であることを示唆している(例えば、TnsB要素を含む例示的なMG36-5エフェクターベースCAST系の遺伝子座の図を示す図4Aと、TnsA、TnsB、TnsC、およびTniQ要素を含む例示的MG39-1エフェクターベースCAST系の遺伝子座の図を示す図5A)。
実施例11-CRISPR関連トランスポゾンの同定
推定CRISPR関連トランスポゾン(CAST)は、CRISPR配列の近傍に、DNAおよび/またはRNAを標的とするCRISPRエフェクターと予測されるインテグラーゼ機能を有するタンパク質とを含む。いくつかの系では、エフェクターは、エンドヌクレアーゼ関連触媒ドメインおよび/または触媒残基の存在に基づいてヌクレアーゼ活性を有することが予測される(例えば、TnsB要素を含むCAST系の遺伝子座の文脈におけるMG36-5エフェクターの予測される触媒残基を示す図4A)。インテグラーゼは、CRISPR遺伝子座(CRISPRヌクレアーゼおよびアレイ)およびインテグラーゼタンパク質が予測されるトランスポゾンの左端と右端の間に位置する際に、活性ヌクレアーゼと関連すると予測された(例えば、図4Bおよび4C)。この場合、エフェクターは、ガイドRNAに基づいてDNAのインテグレーションを特定のゲノム位置へと向けることが予測された。
いくつかの系では、エフェクターは、既知のCRISPRエフェクタータンパク質と相同性を有するが、エンドヌクレアーゼドメインおよび/または触媒残基のない状態に基づいて不活性であることが予測された(図5A)。インテグラーゼは、CRISPR遺伝子座(不活性なCRISPRヌクレアーゼおよびアレイ)およびインテグラーゼタンパク質が予測されるトランスポゾンの左端および右端内に位置するとき、エフェクターと関連すると予測される(図5Aおよび5B)。
実施例12-CASTの発見
CRISPR関連トランスポゾン(CAST)は、DNAカーゴの標的としたインテグレーションを促進するためにCRISPR系と相互作用するように進化したトランスポゾンを含む系である。
CASTは、トランスポゾンのシグネチャーの左端および右端内のDNA転位に関与する1つ以上のタンパク質配列をコードするゲノム配列である。典型的なTn7トランスポゾンは一般に、触媒トランスポザーゼTnsBを含むが、触媒トランスポザーゼTnsA、ローダータンパク質TnsCまたはTniB、および標的認識タンパク質TnsD、TnsE、TniQ、および/または他のトランスポゾン関連成分を含むこともある。トランスポゾン末端は、予測されるトランスポザーゼ結合部位を含み、これは、トランスポゾン機構および他の「カーゴ」遺伝子に隣接する15bp~150bpの長さの直接反復および/または逆方向反復を含む。
加えて、CASTはさらに、CRISPRアレイの近傍でDNAおよび/またはRNAを標的とするCRISPRヌクレアーゼまたはエフェクターをコードする。いくつかの系では、エフェクターは、エンドヌクレアーゼ関連触媒ドメインおよび/または触媒残基の存在に基づいて、活性ヌクレアーゼであることが予測される。いくつかの系では、エフェクターは、既知のCRISPRエフェクタータンパク質と配列類似性を有するが、エンドヌクレアーゼドメインおよび/または触媒残基が存在しない状態に基づいて不活性であることが予測された。トランスポゾンは、CRISPR遺伝子座およびトランスポゾン関連タンパク質が予測されるトランスポゾンの左端および右端内に位置する場合に、エフェクターと関連すると予測される。この場合、エフェクターは、ガイドRNAに基づいてDNAのインテグレーションを特定のゲノム位置へと向けることが予測される。
実施例13a-Cas12kCAST
Cas12k CAST系は、ヌクレアーゼ欠損CRISPR Cas12kエフェクター、CRISPRアレイ、tracrRNA、およびTn7様転位タンパク質をコードする(例えば、Cas12kを含むMG108-1 CAST系の遺伝子座組織図を示す図8を参照)。Cas12kエフェクターは系統的に多様であり、CASTとの関連性を確認する特徴がいくつかについて確認されている(例えば、MG64-1、MG64-2、MG64-3、MG64-5、MG64-6、MG64-7、MG64-13、MG64-54、MG64-56、MG108-1、およびMG108-2エフェクターがどのようにしてこのグループの一部であるのかを示している図9を参照)。そのような特徴的な特徴の1つは、MG64-3 CRISPR遺伝子座の文脈で同定されたトランスポゾン末端であった。トランスポゾン左端は、末端の逆方向反復と自己一致スペーサー配列によって示されるように、MG64-3 CRISPR遺伝子座の下流で同定された(図11A)。同定された別のそのような特徴は、保存されたモチーフ5’-GNNGGNNTGAAAG-3’を含むCas12k CAST CRISPRリピート(crRNA)を含む(例えば、MG64-2、MG64-4、MG64-5、MG64-6、MG64-7、およびMG108-1、ならびに図11Bを参照)。crRNAモチーフ内の短いリピート-アンチリピート(RAR)は、tracrRNAの異なる領域と整列し、RARモチーフは、tracrRNAの開始および終了を定義するように思われた。図13Cは、例えば、MG64-2、MG64-4、MG64-5、MG64-6、MG64-7、およびMG108-1のファミリーにおける3つのRARモチーフの存在を示す。
実施例13b-クラスI、タイプI-FのCAST
いくつかのCASTは、ヌクレアーゼ欠損CRISPR タイプI-Fのカスケードエフェクタータンパク質、CRISPRアレイ、およびTn7様転位タンパク質をコードする(例えば、MG110-1エフェクターベースのタイプI-FのCAST系の遺伝子座の組織図を示す図10Aを参照)。タイプI-FのカスケードCASTは、crRNAによってコードされるシングルガイドRNAで機能すると予測され、これは、ステムループ構造の形成に関与すると考えられる保存されたモチーフ5’-CTGCCGNNTAGGNAGC-3’を含む(例えば、MG110-1とMG110-2のファミリーcrRNA 配列番号207および208におけるこの特徴のアラインメントを示す図10B~Cを参照)。これらの同じ特徴を有することに一部基づいて、MG110-2エフェクター含有およびファミリーも、タイプI-FのCAST系として同定された。
実施例14-トランスポゾン末端予測
トランスポゾン末端は、エフェクターとトランスポゾン機構に隣接している遺伝子間領域から推定された。例えば、Cas12k CASTについては、TnsBの上流に直接位置し、かつCRISPR遺伝子座の下流に直接位置する遺伝子間領域が、Tn7トランスポゾン左端および右端(LEおよびRE)を含んでいると予測された(例えば、MG64-3ファミリーCAST遺伝子座図の文脈でLEおよびREの解析を示す図11Aを参照)。
最大2つのミスマッチを伴う、約12bpの直接反復および逆方向反復(DR/IR)がコンティグ上で予測された。加えて、Dotplotアルゴリズムを用いて、CASTトランスポゾンに隣接する短い(約10~20bp)DR/IRを発見した。CASTエフェクターとトランスポゾン遺伝子に隣接する遺伝子間領域に位置するマッチングDR/IRは、トランスポゾン結合部位をコードしていると予測された。推定トランスポゾン結合部位をコードする遺伝子間領域から抽出したLEとREを整列させて、トランスポゾン末端境界を定義した。推定トランスポゾンのLEとRE末端は、a)最初と最後に予測されたトランスポゾンコード遺伝子の上流と下流から400bp以内に位置する領域、b)複数の短い逆方向反復を共有している領域、およびc)65%を超えるヌクレオチドidを共有する領域として同定される。このプロセスを繰り返して、MG36-5(配列番号17~18)、MG39-1(配列番号20~21)、MG64-2(配列番号125~126)、MG64-4(配列番号127~128)、MG64-6(配列番号123~124)、MG64-7(配列番号129~130)、MG64-13(配列番号131~132)、MG64-54(配列番号133)、MG108-1(配列番号134~135)、MG110-1(配列番号136~137)、およびMG110-2(配列番号138~139)のための推定LE/RE配列を同定した。
実施例15-クラスII、タイプVのCAST系用のシングルガイド設計
MG64サブファミリーのCasエフェクターおよびCRISPRアレイを囲む遺伝子間領域の解析により、潜在的なアンチリピート配列と、tracrRNAの配列に対応するアンチリピートに隣接する保存された「CYCC(N6)GGRG」ステムループ構造とが同定された(図11B)。TracrRNAおよびcrRNAリピートをフォールディングし、トリミングし、crRNA-tracrRNA相補配列のステムループ領域を維持するためにGAAAのテトラループ配列を追加して、sgRNAを生成した。これらの配列の概要を以下の表1に示す。
実施例16-標的とされたヌクレアーゼを用いるインビトロでのインテグレーション活性
インサイチュ発現およびタンパク質配列解析は、いくつかのRNAガイドエフェクターが活性ヌクレアーゼであることを示唆した。それらは、予測されるエンドヌクレアーゼ関連ドメイン(RuvCおよびHNH_エンドヌクレアーゼドメインに一致)、および/または予測されるHNHおよびRuvC触媒残基を含む。候補活性は、myTXTL系およびインビトロ転写RNAを使用して、操作されたシングルガイドRNA配列で試験された。活性なタンパク質は、アガロースゲル電気泳動でおよそ170bpのバンドを得るためにライブラリーを成功裏に切断するものとして同定される。
実施例17-プログラム可能なDNAインテグレーション
CAST活性は、1つの反応に5種類の成分:(1)myTXTLまたはPURExpressによって発現されたCasエフェクタータンパク質、(2)Cas酵素に対応する標的配列とPAMを含む標的DNA断片またはプラスミド、(3)DNA断片またはプラスミドにおける、トランスポザーゼ系の予測されるLEおよびREに隣接しているマーカーまたはDNAの断片を含むドナーDNA断片、(4)myTXTLまたはPURExpressを用いて発現されるアレイの一部であると予測される追加のトランスポザーゼタンパク質の任意の組み合わせ、および(5)操作されたインビトロ転写されたシングルガイドRNA配列を組み合わせて試験された。ドナー断片の成功裏に転位させた活性な系は、ドナー-標的接合部のPCR増幅によってアッセイされた。
図13は、予測されたLE/REドナー配列(配列番号123~124)およびインシリコ設計sgRNA(配列番号201)を用いたMG64-6エフェクター、TnsB、TnsC、およびTniQのタンパク質(配列番号30~33)を含むMG64-6系が活性であることを実証する例となるデータを示している。すべてのMG64-6成分を組み合わせることによって転位反応を行った後、接合部のPCR増幅により、適切なドナー-標的形成が起こり、転位反応がsg依存性であることが示された。(図13A)。PCR反応#3および#4における増幅バンドの存在(それぞれLE/REがPAMの遠位に挿入された場合のLE/RE接合部にまたがる)は、標的に対するドナーの両方の配向:LEがPAMに近い場合の配向と、REがPAMに近い場合の配向がなされることを示した。両方の転位配向がなされる一方で、LEがPAMに近い場合の標的におけるドナーのインテグレーションが優先され、反応#4および#5に存在する強力なバンド(それぞれ、PAMの遠位に挿入された場合のLE接合部とPAMの近位に挿入された場合のRE接合部にまたがる)によって表された。
好ましい配向産物のサンガーシーケンシングが行われた。LEをPAMに近い場合に起こるインテグレーションのうち、標的/ドナー接合部にわたって順方向または逆方向のいずれかからの配列決定クロマトグラムシグナルの明らかな劣化があった(図13C)。これは、LEがPAMに近い場合に配向される産物のうち、インテグレーションがヌクレオチドの範囲にわたって起こり、LEがPAMに近い産物の主要な産物は、PAMからの61bpのインテグレーションであることを示した(図14)。ドナー-標的接合部にわたってドナーに由来した配列決定により、LEおよびREの配列の本質的な外側の境界の構成が定義された。LEおよびREのドメインのさらなる調査により、LEおよびREの配列の内部限界、したがって、転位に必須な最小限のLE/REが決定される。LEがPAMに近い産物におけるREの配列決定により、ドナーREの下流に3bpの重複が見られた。これは、ずれた切れ込み(staggered cut)部位でドナー断片を切断およびライゲートするTn7トランスポザーゼインテグレーション事象が一因である。3bpの重複は、他のTn7トランスポザーゼから予想される5bpの重複よりも小さい。
標的プラスミドの8NライブラリーでのPCR増幅産物のサンガーシーケンシングにより、スペーサーの5’末端でのnGTn/nGTtとしてのMG64-6エフェクターのPAM優先度が解明された。PAMライブラリー標的のNGS解析により、5’末端でのnGTnモチーフの優先度が裏付けられた(図13B)。
実施例18-インテグレーションウインドウの決定
上記実施例17で増幅したPAMのPCR接合部をNGSライブラリーについてインデックス付けし、V2 300リードキットを用いてMiSeqで配列決定した。リードは、PAMからのインテグレーション距離が60bpである推定転位配列のアンプリコン配列(guideseq=LEまたはREの20bpの3’末端、ウインドウの中心=0、ウインドウサイズ=20)を用いるCRISPRessoを用いてマッピングし定量化した。インデルヒストグラムは、検出された全インデルリードに対して正規化し、頻度は60bp参照配列と比較してプロットされる(図14)。
PCR反応5(PAMの近位にあるLE、図13a)およびPCR4(PAMの遠位にあるRE、図13b)の両方を、MG64-6について配列およびPAMからの距離上にプロットした(図14)。インテグレーションウインドウの解析により、スペーサーPAM部位で発生したインテグレーションの95%は、PAMから58~68ヌクレオチド離れている10bpのウインドウ内にあることが示された。遠位と近位の頻度間のインテグレーション距離の違いは、インテグレーション部位の重複-インテグレーション時にトランスポザーゼのヌクレアーゼ活性がずれた結果、3~5塩基対の重複-を反映していた。
実施例19-ゲルシフトによるトランスポゾン末端の検証
予測されるトランスポゾン末端配列に対するTnsBの活性を検証するために、MG64-6のREを、FAM標識オリゴを用いて増幅させた。MG64-6 TnsBタンパク質を、無細胞転写/翻訳系を用いて発現させ、RE FAM標識産物とインキュベートした。30分間インキュベートした後、天然の5%TBEゲル上で結合が観察された(図15)。共インキュベートしたレーン(図15、レーン3)内の蛍光産物の複数のバンドは、最低3つのTnsB結合部位を示した。
実施例20-トランスポザーゼ活性のコロニーPCRスクリーニング(予測的)
転写活性は、コロニーPCRスクリーニングを介してアッセイされる。pDonorプラスミドで形質転換した後、大腸菌を、アンピシリン、クロラムフェニコール、およびテトラサイクリンを含むLB-寒天上にプレーティングする。選択したCFUを、挿入接合部に隣接するプライマーとPCR試薬を含む溶液に加えた。
実施例22-LE-RE最小化(予測的)
標的-転位接合部の配列決定は、標的反応に組み込まれるドナープラスミドからの最も外側の配列を同定することにより、末端の逆方向反復の同定に役立つ。変動率10%の14bpの反復解析を行うことで、末端内に含まれる短いリピートが同定され、このリピートを保存するこれらの切断物に含まれる最小限の配列を同定して、余分な配列を除去する。予測とクローニングは何度も繰り返され、それぞれの相互作用はインビトロの転位で試験される。転位は、96bpのRE領域と組み合わせた68bpのLE領域まで活性であると予測される。
実施例23-転位のオーバーハングの影響(予測的)
TnsB結合モチーフの外側の余分な配列が転位に必要かどうかを試験するために、LEとREの両方のTGTACAまたはTGTCGAのモチーフのために設計したオリゴを、0、1、2、3、5、および10bpの余分な塩基対で設計および合成する。これらの合成されたオリゴは、オーバーハングを有するドナーPCR断片の生成に使用され、標的部位へ転位する能力について試験される。
実施例24-CAST NLS設計(予測的)
治療目的の真核生物のゲノム編集は、編集酵素の核への移入に依存している。大きなタンパク質の小さなポリペプチドストレッチは、核膜全体にタンパク質を移入するために細胞成分にシグナルを送る。NLSタグは、それが融合されるタンパク質の機能を維持しながら移入機能を提供する必要があるため、これらのタグの配置は最適化する必要がある。CAST複合体の成分のそれぞれに対するNLSの機能的な配向を試験するために、MG CASTの成分のそれぞれのN末端にヌクレオプラスミンNLSを、C末端にSV40 NLSを融合する構築物を合成する。これらの構築物のタンパク質を無細胞のインビトロ転写/翻訳反応で発現させ、タグなし成分の相補的なセットでインビトロ転位活性について試験する。NLSタグ付き構築物は、PCR 4(RE遠位転位を評価)、および同族の転位事象、PCR 5(LE近位転位を評価)を用いて、ドナー-標的接合部のPCRにより活性の維持について評価される。
実施例25-Cas12kとTniQタンパク質の融合構築物の設計と試験(予測的)
タンパク質成分の発現を単純化/最小化し、これらの成分の細胞への送達を容易にするために、様々なリンカー、リンカー長、およびドメイン境界を有するTniQタンパク質とCas12kエフェクターとの間の融合構築物が設計、合成、および試験される。Cas12kに融合したTniQの両配向は、設計および合成されたC末端融合物、Cas-TniQ、およびN末端融合物、TniQ-Casである。
エフェクター遺伝子とTniQ遺伝子を融合させるために、他に2つのリンカーも採用される。自己停止翻訳配列であるP2Aは、Cas-NLS-P2A-NLS-TniQ構築物において活性であり、MCV Internal Ribosome Entry Sequence(内部リボソーム進入配列)(IRES)mRNAベースのリンカーは、細胞における2つの成分の独立翻訳を可能にする。
実施例26-インビトロ転位試験と連結した細胞内発現(予測的)
生理的に関連する環境においてNLS構築物の機能性を試験するために、活性なNLSタグ付きCAST構成要素でクローン化した構築物を、レンチウイルス導入を用いてK562細胞に組み込む。簡潔に言えば、レンチウイルス導入プラスミドにクローン化した構築物を、エンベローププラスミドとパッケージングプラスミドを持つ293T細胞にトランスフェクトし、72時間インキュベート後に、培地からウイルス含有上清を採取する。次に、ウイルスを含む培地を、8μg/mLのポリブレンとともにK562細胞株と72時間インキュベートし、トランスフェクトした細胞を、1μg/mLのピューロマイシンを用いて4日間、大量のインテグレーションのために選択する。選択中の細胞株を4日間の終わりに収集し、核と細胞質画分について区別して溶解する。その後の画分を、インビトロで発現させた成分の相補的なセットで、転位能力について試験する。
NLS-TnsBとTnsB-NLSの両方が、細胞分画とインビトロ転位によって試験され、転位は、細胞質と核分画の両方にわたって検出される。
細胞内のCas12k融合体は、同様に分画され、転位について試験される。Cas-NLS Cas-NLS-P2A-NLS-TniQは細胞に導入され、分画され、細胞内活性についてインビトロで試験される。Cas-NLS-P2A-NLS-TniQは、反応にシングルガイドを加えることで、細胞質で転位することができる。ホロCasタンパク質(+sgRNA)または追加のTniQをsgRNAで補充することにより、核分画中のCas-NLS-P2A-NLS-TniQ構築物を補完することができる。
本開示の系は、例えば、核酸編集(例えば、遺伝子編集)または核酸分子への結合(例えば、配列特異的結合)などの様々な用途に使用され得る。このような系は、例えば、対象において疾患を引き起こす可能性のある遺伝的に受け継がれた変異を改善(例えば、除去または置換)するために、細胞内の機能を確認するべく遺伝子を不活性化するために、疾患を引き起こす遺伝要素を検出する診断ツールとして(例えば、逆転写されたウイルスRNAまたは疾患を引き起こす変異をコードする増幅DNA配列の切断を介して)、特定のヌクレオチド配列(例えば、細菌内の抗生物質耐性をコードする配列)を標的として検出するために、プローブと組み合わせた不活性化酵素として、ウイルスゲノムを標的とすることによって、ウイルスを不活性化するか、または宿主細胞へ感染できなくするために、価値のある低分子、高分子、または二次代謝産物を生成するために生物を改良するべく、遺伝子を追加したり、代謝経路を変更したりするために、進化的選択のための遺伝子駆動要素を確立し、および/または、バイオセンサーとして外来低分子とヌクレオチドによる細胞障害を検出するために、使用され得る。
本発明の好ましい実施形態が本明細書中で示され、記載されてきたが、このような実施形態はほんの一例として提供されているに過ぎないことが当業者に明らかであろう。本発明が明細書内で提供される特定の例によって制限されることは意図していない。本発明は前述の明細書に関して記載されているが、本明細書中の実施形態の記載および例示は、限定的な意味で解釈されることを意味するものではない。当業者であれば、多くの変更、変化、および置換が、本発明から逸脱することなく思いつくだろう。さらに、本発明のすべての態様は、様々な条件および変数に依存する、本明細書で説明された特定の描写、構成、または相対的な比率に限定されないことが理解されよう。本明細書に記載される本発明の実施形態の様々な代替案が、本発明の実施に際して利用され得ることを理解されたい。したがって、本発明はそのような代替、修正、変形、または同等物を包含するものでもあることが考慮される。以下の請求項は本発明の範囲を定義するものであり、この請求項とその均等物の範囲内の方法、および構造体がそれによって包含されるものであるということが意図されている。

Claims (141)

  1. 標的核酸部位にカーゴヌクレオチド配列を転位させるための系であって、前記系は、
    前記カーゴヌクレオチド配列を含む第1の二本鎖核酸であって、前記カーゴヌクレオチド配列がリコンビナーゼまたはトランスポザーゼ複合体と相互作用するように構成される、第1の二本鎖核酸と、
    クラスII、タイプIIのCasエフェクター、および前記標的核酸部位にハイブリダイズするように構成された少なくとも1つの操作されたガイドポリヌクレオチドを含むCasエフェクター複合体と、
    前記リコンビナーゼまたはトランスポザーゼ複合体であって、前記カーゴヌクレオチド配列を前記標的核酸部位に補充するように構成される、前記リコンビナーゼまたはトランスポザーゼ複合体と、
    を含む、系。
  2. 前記リコンビナーゼまたはトランスポザーゼ複合体は、前記Casエフェクター複合体に非共有結合する、請求項1に記載の系。
  3. 前記リコンビナーゼまたはトランスポザーゼ複合体は、前記Casエフェクター複合体に共有結合する、請求項1に記載の系。
  4. 前記リコンビナーゼまたはトランスポザーゼ複合体は、単一のポリペプチドにおいて前記Casエフェクター複合体に融合される、請求項3に記載の系。
  5. 前記カーゴヌクレオチド配列は、左側のトランスポザーゼ認識配列および右側のトランスポザーゼ認識配列に隣接している、請求項1-4のいずれか1つに記載の系。
  6. 前記標的核酸部位を含む第2の二本鎖核酸をさらに含む、請求項1-5のいずれか1つに記載の系。
  7. 前記標的核酸部位に隣接する前記Casエフェクター複合体に適合するPAM配列をさらに含む、請求項6に記載の系。
  8. 前記PAM配列は、前記標的核酸部位の3’に位置する、請求項7に記載の系。
  9. 前記リコンビナーゼまたはトランスポザーゼ複合体は、Tn7タイプのトランスポザーゼ複合体である、請求項1-8のいずれか1つに記載の系。
  10. 前記操作されたガイドポリヌクレオチドは、前記クラスII、タイプIIのCasエフェクターに結合するように構成される、請求項1-9のいずれか1つに記載の系。
  11. 前記クラスII、タイプIIのCasエフェクターは、配列番号1またはその変異体に対して少なくとも80%の同一性を有する配列を含むポリペプチドを含む、請求項1-10のいずれか1つに記載の系。
  12. 前記リコンビナーゼまたはトランスポザーゼ複合体は、配列番号2~5のいずれか1つまたはその変異体に対して少なくとも80%の同一性を有する配列を含む少なくとも1つ、少なくとも2つ、少なくとも3つ、または4つのポリペプチドを含む、請求項1-11のいずれか1つに記載の系。
  13. 前記操作されたガイドポリヌクレオチドは、配列番号12またはその変異体に対して少なくとも80%の同一性を有する少なくとも60~80個の連続したヌクレオチドを含む配列を含む、請求項1-12のいずれか1つに記載の系。
  14. 前記操作されたガイドポリヌクレオチドは、配列番号11またはその変異体に対して少なくとも80%の同一性を有する配列を含む、請求項1-12のいずれか1つに記載の系。
  15. 前記左側のリコンビナーゼ配列は、配列番号17~18のいずれか1つまたはその変異体に対して少なくとも80%の同一性を有する配列を含む、請求項2-14のいずれか1つに記載の系。
  16. 前記右側のリコンビナーゼ配列は、配列番号19またはその変異体に対して少なくとも80%の同一性を有する配列を含む、請求項2-15のいずれか1つに記載の系。
  17. 前記クラスII、タイプIIのCasエフェクターおよび前記リコンビナーゼまたはトランスポザーゼ複合体は、約10キロベース未満を含むポリヌクレオチド配列によってコードされる、請求項1-16のいずれか1つに記載の系。
  18. 標的ヌクレオチド配列を含む標的核酸部位にカーゴヌクレオチド配列を転位させるための方法であって、前記方法は、請求項1-17のいずれか1つに記載の系を細胞内で発現させる工程、または請求項1-17のいずれか1つに記載の系を細胞に導入する工程を含む、方法。
  19. 標的核酸部位にカーゴヌクレオチド配列を転位させるための系であって、前記系は、
    Tn7タイプのトランスポザーゼ複合体と相互作用するように構成されたカーゴヌクレオチド配列を含む第1の二本鎖核酸と、
    クラスII、タイプVのCasエフェクター、および前記標的ヌクレオチド配列にハイブリダイズするように構成された操作されたガイドポリヌクレオチドを含むCasエフェクター複合体と、
    前記Casエフェクター複合体に結合するように構成されたTn7タイプのトランスポザーゼ複合体であって、TnsAサブユニットを含む、Tn7タイプのトランスポザーゼ複合体と、
    を含む、系。
  20. 前記トランスポザーゼ複合体は、前記Casエフェクター複合体に非共有結合する、請求項19に記載の系。
  21. 前記トランスポザーゼ複合体は、前記Casエフェクター複合体に共有結合する、請求項19に記載の系。
  22. 前記トランスポザーゼ複合体は、単一のポリペプチドにおいて前記Casエフェクター複合体に融合される、請求項21に記載の系。
  23. 前記クラスII、タイプVのCasエフェクターは、Cas12kエフェクターではない、請求項19-22のいずれか1つに記載の系。
  24. 前記カーゴヌクレオチド配列は、左側のトランスポザーゼ認識配列および右側のトランスポザーゼ認識配列に隣接している、請求項19-23のいずれか1つに記載の系。
  25. 前記標的核酸部位を含む第2の二本鎖核酸をさらに含む、請求項19-24のいずれか1つに記載の系。
  26. 前記標的核酸部位に隣接する前記Casエフェクター複合体に適合するPAM配列をさらに含む、請求項19-25のいずれか1つに記載の系。
  27. 前記PAM配列は、前記標的核酸部位の5’に位置する、請求項26に記載の系。
  28. 前記操作されたガイドポリヌクレオチドは、前記クラスII、タイプVのCasエフェクターに結合するように構成される、請求項19-27のいずれか1つに記載の系。
  29. 前記TnsAサブユニットは、配列番号7またはその変異体に対して少なくとも80%の同一性を有する配列を有するポリペプチドを含む、請求項19-28のいずれか1つに記載の系。
  30. 前記Tn7タイプのトランスポザーゼ複合体は、配列番号8~10のいずれか1つあるいはその変異体に対して少なくとも80%の同一性を有する配列を含む少なくとも1つ、少なくとも2つ、または3つのポリペプチドを含む、請求項19-29のいずれか1つに記載の系。
  31. 前記操作されたガイドポリヌクレオチドは、配列番号13~16のいずれか1つあるいはその変異体に対して少なくとも80%の同一性を有する少なくとも約46~80個の連続したヌクレオチドを含む配列を含む、請求項19-30のいずれか1つに記載の系。
  32. 前記左側のリコンビナーゼ配列は、配列番号20またはその変異体に対して少なくとも80%の同一性を有する配列を含む、請求項24-31のいずれか1つに記載の系。
  33. 前記右側のリコンビナーゼ配列は、配列番号21またはその変異体に対して少なくとも80%の同一性を有する配列を含む、請求項24-32のいずれか1つに記載の系。
  34. 前記クラスII、タイプVのCasエフェクターは、Cas12kエフェクターではない、請求項19-33のいずれか1つに記載の系。
  35. 前記クラスII、タイプVのCasエフェクターおよび前記Tn7タイプのトランスポザーゼ複合体は、約10キロベース未満を含むポリヌクレオチド配列によってコードされる、請求項19-34のいずれか1つに記載の系。
  36. 標的ヌクレオチド配列を含む標的核酸部位にカーゴヌクレオチド配列を転位させるための方法であって、前記方法は、請求項19-34のいずれか1つに記載の系を細胞内で発現させる工程、または請求項19-34のいずれか1つに記載の系を細胞に導入する工程を含む、方法。
  37. カーゴヌクレオチド配列を標的核酸部位に転位させるための方法であって、前記方法は、
    カーゴヌクレオチド配列を含む第1の二本鎖核酸を、
    クラスII、タイプIIのCasエフェクター、および前記標的核酸部位にハイブリダイズするように構成された少なくとも1つの操作されたガイドポリヌクレオチドを含むCasエフェクター複合体と、
    前記標的核酸部位に前記カーゴヌクレオチドを補充するように構成されたリコンビナーゼまたはトランスポザーゼ複合体と、
    前記標的核酸部位を含む第2の二本鎖核酸と、
    に接触させる工程を含む、方法。
  38. 前記リコンビナーゼまたはトランスポザーゼ複合体は、前記Casエフェクター複合体に非共有結合する、請求項37に記載の系。
  39. 前記リコンビナーゼまたはトランスポザーゼ複合体は、前記Casエフェクター複合体に共有結合する、請求項37に記載の系。
  40. 前記リコンビナーゼまたはトランスポザーゼ複合体は、単一のポリペプチドにおいて前記Casエフェクター複合体に融合される、請求項39に記載の系。
  41. 前記カーゴヌクレオチド配列は、左側のトランスポザーゼ認識配列および右側のトランスポザーゼ認識配列に隣接している、請求項37-40のいずれか1つに記載の方法。
  42. 前記標的核酸部位に隣接する前記Casエフェクター複合体に適合するPAM配列をさらに含む、請求項37-41のいずれか1つに記載の方法。
  43. 前記PAM配列は、前記標的核酸部位の3’に位置する、請求項42に記載の方法。
  44. 前記リコンビナーゼまたはトランスポザーゼ複合体は、Tn7タイプのトランスポザーゼ複合体である、請求項37-43のいずれか1つに記載の系。
  45. 前記操作されたガイドポリヌクレオチドは、前記クラスII、タイプIIのCasエフェクターに結合するように構成される、請求項37-44のいずれか1つに記載の方法。
  46. 前記クラスII、タイプIIのCasエフェクターは、配列番号1またはその変異体に対して少なくとも80%の同一性を有する配列を含むポリペプチドを含む、請求項37-45のいずれか1つに記載の方法。
  47. 前記リコンビナーゼまたはトランスポザーゼ複合体は、配列番号2~5のいずれか1つあるいはその変異体に対して少なくとも80%の同一性を有する配列を含む少なくとも1つ、少なくとも2つ、少なくとも3つ、または4つのポリペプチドを含む、請求項37-46のいずれか1つに記載の方法。
  48. 前記操作されたガイドポリヌクレオチドは、配列番号12またはその変異体に対して少なくとも80%の同一性を有する少なくとも約60~80個の連続したヌクレオチドを含む配列を含む、請求項37-47のいずれか1つに記載の方法。
  49. 前記操作されたガイドポリヌクレオチドは、配列番号11またはその変異体に対して少なくとも80%の同一性を有する配列を含む、請求項37-48のいずれか1つに記載の方法。
  50. 前記左側のリコンビナーゼ配列は、配列番号17~18のいずれか1つあるいはその変異体に対して少なくとも80%の同一性を有する配列を含む、請求項41-49のいずれか1つに記載の方法。
  51. 前記右側のリコンビナーゼ配列は、配列番号19またはその変異体に対して少なくとも80%の同一性を有する配列を含む、請求項41-50のいずれか1つに記載の方法。
  52. 前記クラスII、タイプIIのCasエフェクターおよび前記Tn7タイプのトランスポザーゼ複合体は、約10キロベース未満を含むポリヌクレオチド配列によってコードされる、請求項37-51のいずれか1つに記載の方法。
  53. カーゴヌクレオチド配列を標的核酸部位に転位させるための方法であって、前記方法は、
    前記カーゴヌクレオチド配列を含む第1の二本鎖核酸を、
    クラスII、タイプVのCasエフェクター、および前記標的ヌクレオチド配列にハイブリダイズするように構成された操作された少なくとも1つのガイドポリヌクレオチドを含むCasエフェクター複合体と、
    前記Casエフェクター複合体に結合するように構成されたTn7タイプのトランスポザーゼ複合体であって、TnsAサブユニットを含む、Tn7タイプのトランスポザーゼ複合体と、
    前記標的核酸部位を含む第2の二本鎖核酸と、
    に接触させる工程を含む、方法。
  54. 前記トランスポザーゼ複合体は、前記Casエフェクター複合体に非共有結合する、請求項53に記載の系。
  55. 前記トランスポザーゼ複合体は、前記Casエフェクター複合体に共有結合する、請求項53に記載の系。
  56. 前記トランスポザーゼ複合体は、単一のポリペプチドにおいて前記Casエフェクター複合体に融合される、請求項55に記載の系。
  57. 前記カーゴヌクレオチド配列は、左側のトランスポザーゼ認識配列および右側のトランスポザーゼ認識配列に隣接している、請求項53-56のいずれか1つに記載の方法。
  58. 前記標的核酸部位に隣接する前記Casエフェクター複合体に適合するPAM配列をさらに含む、請求項53-57のいずれか1つに記載の方法。
  59. 前記PAM配列は、前記標的核酸部位の3’に位置する、請求項58に記載の方法。
  60. 前記操作されたガイドポリヌクレオチドは、前記クラスII、タイプVのCasエフェクターに結合するように構成される、請求項53-59のいずれか1つに記載の方法。
  61. 前記TnsAサブユニットは、配列番号7またはその変異体に対して少なくとも80%の同一性を有する配列を有するポリペプチドを含む、請求項53-60のいずれか1つに記載の方法。
  62. 前記Tn7タイプのトランスポザーゼ複合体は、配列番号8~10のいずれか1つあるいはその変異体に対して少なくとも80%の同一性を有する配列を含む少なくとも1つ、少なくとも2つ、または3つのポリペプチドを含む、請求項53-61のいずれか1つに記載の方法。
  63. 前記操作されたガイドポリヌクレオチドは、配列番号13~16のいずれか1つあるいはその変異体に対して少なくとも80%の同一性を有する少なくとも約46~80個の連続したヌクレオチドを含む配列を含む、請求項53-62のいずれか1つに記載の方法。
  64. 前記左側のリコンビナーゼ配列は、配列番号20またはその変異体に対して少なくとも80%の同一性を有する配列を含む、請求項57-63のいずれか1つに記載の方法。
  65. 前記右側のリコンビナーゼ配列は、配列番号21またはその変異体に対して少なくとも80%の同一性を有する配列を含む、請求項57-64のいずれか1つに記載の方法。
  66. 前記クラスII、タイプVのCasエフェクターは、Cas12kエフェクターではない、請求項53-65のいずれか1つに記載の方法。
  67. 前記クラスII、タイプVのCasエフェクターおよび前記Tn7タイプのトランスポザーゼ複合体は、約10キロベース未満を含むポリヌクレオチド配列によってコードされる、請求項53-66のいずれか1つに記載の方法。
  68. 標的核酸部位にカーゴヌクレオチド配列を転位させるための系であって、前記系は、
    Tn7タイプのトランスポザーゼ複合体と相互作用するように構成されたカーゴヌクレオチド配列を含む第1の二本鎖核酸と、
    クラスI、タイプI-FのCasエフェクター、および前記標的ヌクレオチド配列にハイブリダイズするように構成された操作されたガイドポリヌクレオチドを含むCasエフェクター複合体と、
    前記Casエフェクター複合体に結合するように構成されたTn7タイプのトランスポザーゼ複合体であって、TnsAサブユニットを含む、Tn7タイプのトランスポザーゼ複合体と、
    を含む、系。
  69. 前記トランスポザーゼ複合体は、前記Casエフェクター複合体に非共有結合する、請求項68に記載の系。
  70. 前記トランスポザーゼ複合体は、前記Casエフェクター複合体に共有結合する、請求項68に記載の系。
  71. 前記トランスポザーゼ複合体は、単一のポリペプチドにおいて前記Casエフェクター複合体に融合される、請求項70に記載の系。
  72. 前記カーゴヌクレオチド配列は、左側のトランスポザーゼ認識配列および右側のトランスポザーゼ認識配列に隣接している、請求項68-71のいずれか1つに記載の系。
  73. 前記標的核酸部位を含む第2の二本鎖核酸をさらに含む、請求項68-72のいずれか1つに記載の系。
  74. 前記標的核酸部位に隣接する前記Casエフェクター複合体に適合するPAM配列をさらに含む、請求項68-73のいずれか1つに記載の方法。
  75. 前記PAM配列は、前記標的核酸部位の3’に位置する、請求項74に記載の系。
  76. 前記PAM配列は、前記標的核酸部位の5’に位置する、請求項74に記載の系。
  77. 前記操作されたガイドポリヌクレオチドは、前記クラスI、タイプI-FのCasエフェクターに結合するように構成される、請求項68-76のいずれか1つに記載の系。
  78. 前記クラスI、タイプI-FのCasエフェクターは、配列番号41~43または48~50のいずれか1つあるいはその変異体に対して少なくとも80%の同一性を有する配列を含むポリペプチドを含む、請求項68-77のいずれか1つに記載の系。
  79. 前記Tn7タイプのトランスポザーゼ複合体は、配列番号44~46または51~53のいずれか1つあるいはその変異体に対して少なくとも80%の同一性を有する配列を含む少なくとも1つ、少なくとも2つ、または3つのポリペプチドを含む、請求項68-78のいずれか1つに記載の系。
  80. 標的ヌクレオチド配列を含む標的核酸部位にカーゴヌクレオチド配列を転位させるための方法であって、前記方法は、請求項68-79のいずれか1つに記載の系を細胞内で発現させる工程、または請求項68-79のいずれか1つに記載の系を細胞に導入する工程を含む、方法。
  81. 標的核酸部位にカーゴヌクレオチド配列を転位させるための系であって、前記系は、
    Tn7タイプのトランスポザーゼ複合体と相互作用するように構成されたカーゴヌクレオチド配列を含む第1の二本鎖核酸と、
    クラスII、タイプVのCasエフェクター、および前記標的ヌクレオチド配列にハイブリダイズするように構成された操作されたガイドポリヌクレオチドを含むCasエフェクター複合体と、
    前記Casエフェクター複合体に結合するように構成されたTn7タイプのトランスポザーゼ複合体であって、TnsB、TnsC、およびTniQ成分を含む、Tn7タイプのトランスポザーゼ複合体と、
    を含み、
    (a)前記クラスII、タイプVのCasエフェクターは、配列番号22、26、30、34、55~89、104、または147のいずれか1つあるいはその変異体に対して少なくとも80%の配列同一性を有する配列を有するポリペプチドを含み、あるいは、
    (b)前記Tn7タイプのトランスポザーゼ複合体は、配列番号23~25、27~29、31~33、35~37、101~103、105~107、または148~150のいずれか1つあるいはその変異体に対して少なくとも80%の配列同一性を有する配列を有するTnsB、TnsC、またはTniQ成分を含む、
    系。
  82. 前記トランスポザーゼ複合体は、前記Casエフェクター複合体に非共有結合する、請求項81に記載の系。
  83. 前記トランスポザーゼ複合体は、前記Casエフェクター複合体に共有結合する、請求項81に記載の系。
  84. 前記トランスポザーゼ複合体は、単一のポリペプチドにおいて前記Casエフェクター複合体に融合される、請求項83に記載の系。
  85. 前記クラスII、タイプVのCasエフェクターは、配列番号22、26、30、34、55~89、104、または147のいずれか1つあるいはその変異体に対して少なくとも80%の配列同一性を有する配列を含むポリペプチドを含む、請求項81-84のいずれか1つに記載の系。
  86. 前記Tn7タイプのトランスポザーゼ複合体は、配列番号23~25、27~29、31~33、35~37、101~103、105~107、または148~150のいずれか1つあるいはその変異体に対して少なくとも80%の配列同一性を有する配列を含むTnsB、TnsC、またはTniQ成分を含む、請求項81-85のいずれか1つに記載の系。
  87. 前記クラスII、タイプVのCasエフェクターは、Cas12kエフェクターである、請求項81-86のいずれか1つに記載の系。
  88. 前記カーゴヌクレオチド配列は、左側のトランスポザーゼ認識配列および右側のトランスポザーゼ認識配列に隣接している、請求項81-87のいずれか1つに記載の系。
  89. 前記標的核酸部位を含む第2の二本鎖核酸をさらに含む、請求項81-88のいずれか1つに記載の系。
  90. 前記標的核酸部位に隣接する前記Casエフェクター複合体に適合するPAM配列をさらに含む、請求項81-89のいずれか1つに記載の系。
  91. 前記PAM配列は、前記標的核酸部位の5’に位置する、請求項90に記載の系。
  92. 前記PAM配列は、5’-nGTn-3’または5’-nGTt-3’を含む、請求項91に記載の系。
  93. 前記操作されたガイドポリヌクレオチドは、前記クラスII、タイプVのCasエフェクターに結合するように構成される、請求項81-92のいずれか1つに記載の系。
  94. 前記TnsB、TnsC、およびTniQ成分は、それぞれ配列番号23~25、27~29、31~33、35~37、101~103、105~107、または148~150のいずれか1つに対して少なくとも80%の同一性を有する配列を有するポリペプチドを含む、請求項81-93のいずれか1つに記載の系。
  95. 前記操作されたガイドポリヌクレオチドは、配列番号90、91、92、93、117、151、156~181、または209~234のいずれか1つに対して少なくとも80%の同一性を有する少なくとも約46~80個の連続したヌクレオチドを含む配列を含む、請求項81-94のいずれか1つに記載の系。
  96. 前記操作されたガイドポリヌクレオチドは、配列番号111~114または201~206、255、262、256、209、257、263、258、210のいずれか1つあるいはその変異体に対して少なくとも80%の配列同一性を有する配列を含む、請求項81-95のいずれか1つに記載の系。
  97. 前記左側のリコンビナーゼ配列は、配列番号125、127、123、129、131、133、153、または134のいずれか1つあるいはその変異体に対して少なくとも80%の同一性を有する配列を含む、請求項88-96のいずれか1つに記載の系。
  98. 前記右側のリコンビナーゼ配列は、配列番号126、155、128、124、130、132、または154のいずれか1つあるいはその変異体に対して少なくとも80%の同一性を有する配列を含む、請求項88-97のいずれか1つに記載の系。
  99. 前記クラスII、タイプVのCasエフェクターおよび前記Tn7タイプのトランスポザーゼ複合体は、約10キロベース未満を含むポリヌクレオチド配列によってコードされる、請求項81-97のいずれか1つに記載の系。
  100. (a)前記クラスII、タイプVのCasエフェクターは、配列番号22またはその変異体に対して少なくとも80%の配列同一性を有する配列を含み、
    (b)前記左側のリコンビナーゼ配列は、配列番号125またはその変異体に対して少なくとも80%の配列同一性を有する配列を含み、
    (c)前記右側のリコンビナーゼ配列は、配列番号126もしくは155またはその変異体に対して少なくとも80%の同一性を有する配列を含み、
    (d)前記操作されたガイドポリヌクレオチドは、(i)配列番号90の少なくとも約46~60個のヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含み、あるいは、(ii)配列番号94、112、または202のいずれか1つの非縮重ヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含み、あるいは、
    (e)前記TnsB、TnsC、およびTniQ成分は、配列番号23~25またはその変異体に対して少なくとも80%の配列同一性を有する配列を含む、請求項81および88に記載の系。
  101. (a)前記クラスII、タイプVのCasエフェクターは、配列番号26またはその変異体に対して少なくとも80%の配列同一性を有する配列を含み、
    (b)前記左側のリコンビナーゼ配列は、配列番号127またはその変異体に対して少なくとも80%の配列同一性を有する配列を含み、
    (c)前記右側のリコンビナーゼ配列は、配列番号128またはその変異体に対して少なくとも80%の配列同一性を有する配列を含み、
    (d)前記操作されたガイドポリヌクレオチドは、(i)配列番号91、156、または209のいずれか1つの少なくとも約46~60個のヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含み、あるいは、(ii)配列番号95、113、または203のいずれか1つの非縮重ヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含み、あるいは、
    (e)前記TnsB、TnsC、およびTniQ成分は、配列番号27~29またはその変異体に対して少なくとも80%の配列同一性を有する配列を含む、請求項81および88に記載の系。
  102. (a)前記クラスII、タイプVのCasエフェクターは、配列番号60またはその変異体に対して少なくとも80%の配列同一性を有する配列を含み、
    (b)前記左側のリコンビナーゼ配列は、配列番号131またはその変異体に対して少なくとも80%の配列同一性を有する配列を含み、
    (c)前記右側のリコンビナーゼ配列は、配列番号132またはその変異体に対して少なくとも80%の配列同一性を有する配列を含み、
    (d)前記操作されたガイドポリヌクレオチドは、(i)配列番号117、161、または214のいずれか1つの少なくとも約46~60個のヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含み、あるいは、(ii)配列番号119の非縮重ヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含み、あるいは、
    (e)前記TnsB、TnsC、およびTniQ成分は、配列番号101~103またはその変異体に対して少なくとも80%の配列同一性を有する配列を含む、請求項81および88に記載の系。
  103. (a)前記クラスII、タイプVのCasエフェクターは、配列番号147またはその変異体に対して少なくとも80%の配列同一性を有する配列を含み、
    (b)前記左側のリコンビナーゼ配列は、配列番号153またはその変異体に対して少なくとも80%の配列同一性を有する配列を含み、
    (c)前記右側のリコンビナーゼ配列は、配列番号154またはその変異体に対して少なくとも80%の配列同一性を有する配列を含み、
    (d)前記操作されたガイドポリヌクレオチドは、(i)配列番号151、181、または234のいずれか1つの少なくとも約46~60個のヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含み、あるいは、(ii)配列番号152または254の非縮重ヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含み、あるいは、
    (e)前記TnsB、TnsC、およびTniQ成分は、配列番号148~150またはその変異体に対して少なくとも80%の配列同一性を有する配列を含む、請求項81および88に記載の系。
  104. (a)前記クラスII、タイプVのCasエフェクターは、配列番号34またはその変異体に対して少なくとも80%の配列同一性を有する配列を含み、
    (b)前記左側のリコンビナーゼ配列は、配列番号129またはその変異体に対して少なくとも80%の配列同一性を有する配列を含み、
    (c)前記右側のリコンビナーゼ配列は、配列番号130またはその変異体に対して少なくとも80%の配列同一性を有する配列を含み、
    (d)前記操作されたガイドポリヌクレオチドは、(i)配列番号93、157、または210のいずれか1つの少なくとも約46~60個のヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含み、あるいは、(ii)配列番号97、114、または204のいずれか1つの非縮重ヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含み、
    (e)前記TnsB、TnsC、およびTniQ成分は、配列番号148~150またはその変異体に対して少なくとも80%の配列同一性を有する配列を含む、請求項81および88に記載の系。
  105. (a)前記クラスII、タイプVのCasエフェクターは、配列番号30またはその変異体に対して少なくとも80%の配列同一性を有する配列を含み、
    (b)前記左側のリコンビナーゼ配列は、配列番号123またはその変異体に対して少なくとも80%の配列同一性を有する配列を含み、
    (c)前記右側のリコンビナーゼ配列は、配列番号124またはその変異体に対して少なくとも80%の同一性を有する配列を含み、
    (d)前記操作されたガイドポリヌクレオチドは、(i)配列番号92の少なくとも約46~80個のヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含み、あるいは、(ii)配列番号111または201の非縮重ヌクレオチドに対して少なくとも80%の同一性を有する配列を含み、
    (e)前記TnsB、TnsC、およびTniQ成分は配列番号31、32、および33またはその変異体に対して少なくとも80%の同一性を有する配列を有するポリペプチドを含み、あるいは、
    (f)前記PAM配列は、5’-nGTn-3’または5’-nGTt-3’を含む、請求項81、88、および91に記載の系。
  106. 標的核酸部位にカーゴヌクレオチド配列を転位させるための系であって、前記系は、
    Tn7タイプのトランスポザーゼ複合体と相互作用するように構成されたカーゴヌクレオチド配列を含む第1の二本鎖核酸と、
    クラスII、タイプVのCasエフェクター、および前記標的ヌクレオチド配列にハイブリダイズするように構成された操作されたガイドポリヌクレオチドを含むCasエフェクター複合体と、
    前記Casエフェクター複合体に結合するように構成されたTn7タイプのトランスポザーゼ複合体であって、TnsBおよびTnsCの成分を含むが、TnsAおよび/またはTniQの成分を含まない、トランスポザーゼ複合体と、
    を含む、系。
  107. 前記トランスポザーゼ複合体は、前記Casエフェクター複合体に非共有結合する、請求項106に記載の系。
  108. 前記トランスポザーゼ複合体は、前記Casエフェクター複合体に共有結合する、請求項106に記載の系。
  109. 前記トランスポザーゼ複合体は、単一のポリペプチドにおいて前記Casエフェクター複合体に融合される、請求項108に記載の系。
  110. 前記Tn7タイプのトランスポザーゼ複合体は、配列番号39~40または109~110のいずれか1つに対して少なくとも80%の配列同一性を有する配列を含むポリペプチドを含む、請求項106-109のいずれか1つに記載の系。
  111. 前記TnsB成分は、配列番号40または109に対して少なくとも80%の配列同一性を有する配列を含むポリペプチドを含む、請求項106-110のいずれか1つに記載の系。
  112. 前記TnsC成分は、配列番号39または110に対して少なくとも80%の配列同一性を有する配列を含むポリペプチドを含む、請求項106-111のいずれか1つに記載の系。
  113. 前記クラスII、タイプVのCasエフェクターは、Cas12kエフェクターである、請求項106-112のいずれか1つに記載の系。
  114. 前記クラスII、タイプVのCasエフェクターは、配列番号38または配列番号108に対して少なくとも80%の配列同一性を有する配列を含む、請求項106-112のいずれか1つに記載の系。
  115. 前記カーゴヌクレオチド配列は、左側のトランスポザーゼ認識配列および右側のトランスポザーゼ認識配列に隣接している、請求項106-114のいずれか1つに記載の系。
  116. 前記標的核酸部位を含む第2の二本鎖核酸をさらに含む、請求項106-115のいずれか1つに記載のシステム。
  117. 前記二本鎖核酸は前記標的核酸部位を含むか、前記系は細胞の内部にある、請求項106-116のいずれか1つに記載の系。
  118. 前記標的核酸部位に隣接する前記Casエフェクター複合体に適合するPAM配列をさらに含む、請求項106-117のいずれか1つに記載のシステム。
  119. 前記PAM配列は、前記標的核酸部位の5’に位置する、請求項118に記載の系。
  120. 前記操作されたガイドポリヌクレオチドは、前記クラスII、タイプVのCasエフェクターに結合するように構成される、請求項106-119のいずれか1つに記載の系。
  121. 前記TnsBおよびTnsC成分は、それぞれ配列番号40および39、または109および110に対して少なくとも80%の同一性を有する配列を有するポリペプチドを含む、請求項106-120のいずれか1つに記載の系。
  122. 前記操作されたガイドポリヌクレオチドは、配列番号118、182、183、235、または236のいずれか1つあるいはその変異体に対して少なくとも80%の同一性を有する少なくとも約46~80個の連続したヌクレオチドを含む配列を含む、請求項106-121のいずれか1つに記載の系。
  123. 前記操作されたガイドポリヌクレオチドは、配列番号115、116、205、206、261、235、260、または236のいずれか1つあるいはその変異体の非縮重ヌクレオチドに対して少なくとも80%の同一性を有する配列を含む、請求項106-121のいずれか1つに記載の系。
  124. 前記左側のリコンビナーゼ配列は、配列番号134に対して少なくとも80%の同一性を有する配列を含む、請求項115-123のいずれか1つに記載の系。
  125. 前記右側のリコンビナーゼ配列は、配列番号135またはその変異体に対して少なくとも80%の同一性を有する配列を含む、請求項115-124のいずれか1つに記載の系。
  126. 前記クラスII、タイプVのCasエフェクターおよび前記Tn7タイプのトランスポザーゼ複合体は、約10キロベース未満を含むポリヌクレオチド配列によってコードされる、請求項106-125のいずれか1つに記載の系。
  127. (a)前記クラスII、タイプVのCasエフェクターは、配列番号38またはその変異体に対して少なくとも80%の配列同一性を有する配列を含み、
    (b)前記左側のリコンビナーゼ配列は、配列番号134またはその変異体に対して少なくとも80%の配列同一性を有する配列を含み、
    (c)前記右側のリコンビナーゼ配列は、配列番号135またはその変異体に対して少なくとも80%の同一性を有する配列を含み、
    (d)前記操作されたガイドポリヌクレオチドは、(i)配列番号182または235の少なくとも約46~80個のヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含み、あるいは、(ii)配列番号98、115、116、205、または206の非縮重ヌクレオチドに対して少なくとも80%の同一性を有する配列を含み、あるいは、
    (e)前記TnsBおよびTnsC成分は、配列番号40および39またはその変異体に対して少なくとも80%の同一性を有する配列を有するポリペプチドを含む、請求項106および115に記載の系。
  128. 標的ヌクレオチド配列を含む標的核酸部位にカーゴヌクレオチド配列を転位させるための方法であって、前記方法は、請求項81-127のいずれか1つに記載の系を細胞内で発現させる工程、または請求項81-127のいずれか1つに記載の系を細胞に導入する工程を含む、方法。
  129. 操作されたヌクレアーゼ系であって、
    RuvCドメインとHNHドメインとを含むエンドヌクレアーゼであって、前記エンドヌクレアーゼが未培養の微生物に由来し、前記エンドヌクレアーゼが配列番号1またはその変異体に対して少なくとも80%の同一性を有する配列を含むクラスII、タイプIIのエンドヌクレアーゼである、エンドヌクレアーゼと、
    操作されたガイドポリヌクレオチドであって、前記操作されたガイドRNAが、前記エンドヌクレアーゼと複合体を形成するように構成され、前記操作されたガイドRNAが、標的核酸配列にハイブリダイズするように構成されたスペーサー配列を含む、操作されたガイドポリヌクレオチドと、
    を含む、操作されたヌクレアーゼ系。
  130. 前記操作されたガイドポリヌクレオチドは、配列番号12またはその変異体に対して少なくとも80%の同一性を有する少なくとも60~80個の連続したヌクレオチドを含む、請求項129に記載の操作されたヌクレアーゼ系。
  131. 前記操作されたガイドポリヌクレオチドは、配列番号11またはその変異体に対して少なくとも80%の同一性を有する配列を含む、請求項129と130に記載の操作されたヌクレアーゼ系。
  132. 操作されたヌクレアーゼ系であって、
    RuvCドメインを含むエンドヌクレアーゼであって、前記エンドヌクレアーゼが未培養の微生物に由来し、前記エンドヌクレアーゼが配列番号5に対して少なくとも80%の同一性を有するクラスII、タイプVのエンドヌクレアーゼである、エンドヌクレアーゼと、
    操作されたガイドRNAであって、前記操作されたガイドRNAが、前記エンドヌクレアーゼと複合体を形成するように構成され、前記操作されたガイドRNAが、標的核酸配列にハイブリダイズするように構成されたスペーサー配列を含む、操作されたガイドRNAと、
    を含む、操作されたヌクレアーゼ系。
  133. 前記操作されたガイドポリヌクレオチドは、配列番号13~16またはその変異体に対して少なくとも80%の同一性を有する少なくとも約46~80個の連続したヌクレオチドを含む配列を含む、請求項132に記載の操作されたヌクレアーゼ系。
  134. 操作されたヌクレアーゼ系であって、
    RuvCドメインを含むエンドヌクレアーゼであって、前記エンドヌクレアーゼが未培養の微生物に由来し、前記エンドヌクレアーゼが配列番号22、26、30、34、55~89、104、または147のいずれか1つあるいはその変異体に対して少なくとも80%の同一性を有するクラスII、タイプV-Kのエンドヌクレアーゼである、エンドヌクレアーゼと、
    操作されたガイドRNAであって、前記操作されたガイドRNAが、前記エンドヌクレアーゼと複合体を形成するように構成され、前記操作されたガイドRNAが、標的核酸配列にハイブリダイズするように構成されたスペーサー配列を含む、操作されたガイドRNAと、
    を含む、操作されたヌクレアーゼ系。
  135. 前記操作されたガイドポリヌクレオチドは、配列番号90、91、92、93、117、151、156~181、または209~234のいずれか1つあるいはその変異体に対して少なくとも80%の同一性を有する少なくとも約46~80個の連続したヌクレオチドを含む配列を含む、請求項134に記載の操作されたヌクレアーゼ系。
  136. 前記操作されたガイドポリヌクレオチドは、配列番号111~114または201~206、255、262、256、209、257、263、258、210のいずれか1つあるいはその変異体の非縮重ヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含む、請求項134または135に記載の操作されたヌクレアーゼ系。
  137. 操作されたヌクレアーゼ系であって、
    RuvCドメインを含むエンドヌクレアーゼであって、
    前記エンドヌクレアーゼが未培養の微生物に由来し、前記エンドヌクレアーゼが、配列番号38または配列番号108のいずれか1つあるいはその変異体に対して少なくとも80%の同一性を有するクラスII、タイプV-Kのエンドヌクレアーゼである、エンドヌクレアーゼと、
    操作されたガイドRNAであって、前記操作されたガイドRNAが、前記エンドヌクレアーゼと複合体を形成するように構成され、前記操作されたガイドRNAが、標的核酸配列にハイブリダイズするように構成されたスペーサー配列を含む、操作されたガイドRNAと、
    を含む、操作されたヌクレアーゼ系。
  138. 前記操作されたガイドポリヌクレオチドは、配列番号118、182、183、235、または236のいずれか1つあるいはその変異体に対して少なくとも80%の同一性を有する少なくとも約46~80個の連続したヌクレオチドを含む配列を含む、請求項137に操作された記載の操作されたヌクレアーゼ系。
  139. 前記操作されたガイドポリヌクレオチドは、配列番号111-114または201-206、255、262、256、209、257、263、258、210、115、116、205、206、261、235、260、または236のいずれか1つあるいはその変異体の非縮重ヌクレオチドに対して少なくとも80%の同一性を有する配列を含む、請求項137に記載の操作されたヌクレアーゼ系。
  140. 操作されたヌクレアーゼ系であって、
    配列番号41~43または48~50のいずれか1つあるいはその変異体に対して少なくとも80%の同一性を有する配列を含む少なくとも1つのCas6、Cas7、またはCas8ポリペプチドを含むクラスI、タイプI-FのCasエンドヌクレアーゼと、
    操作されたガイドRNAであって、前記操作されたガイドRNAが、前記エンドヌクレアーゼと複合体を形成するように構成され、前記操作されたガイドRNAが、標的核酸配列にハイブリダイズするように構成されたスペーサー配列を含む、操作されたガイドRNAと、
    を含む、操作されたヌクレアーゼ系。
  141. 前記操作されたガイドポリヌクレオチドは、配列番号121、122、207、または208のいずれか1つの非縮重ヌクレオチドに対して少なくとも80%の同一性を有する配列を含む、請求項140に記載の操作されたヌクレアーゼ系。
JP2023513262A 2020-08-24 2021-08-23 カーゴヌクレオチド配列を転位させるための系および方法 Pending JP2023539237A (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US202063069703P 2020-08-24 2020-08-24
US63/069,703 2020-08-24
US202163186698P 2021-05-10 2021-05-10
US63/186,698 2021-05-10
US202163232593P 2021-08-12 2021-08-12
US63/232,593 2021-08-12
PCT/US2021/047195 WO2022046662A1 (en) 2020-08-24 2021-08-23 Systems and methods for transposing cargo nucleotide sequences

Publications (1)

Publication Number Publication Date
JP2023539237A true JP2023539237A (ja) 2023-09-13

Family

ID=80353933

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023513262A Pending JP2023539237A (ja) 2020-08-24 2021-08-23 カーゴヌクレオチド配列を転位させるための系および方法

Country Status (10)

Country Link
EP (1) EP4200422A1 (ja)
JP (1) JP2023539237A (ja)
KR (1) KR20230054457A (ja)
CN (1) CN116438302A (ja)
AU (1) AU2021333586A1 (ja)
BR (1) BR112023003441A2 (ja)
CA (1) CA3190758A1 (ja)
GB (1) GB2615658A (ja)
MX (1) MX2023002281A (ja)
WO (1) WO2022046662A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023164590A2 (en) * 2022-02-23 2023-08-31 Metagenomi, Inc. Fusion proteins

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201514510D0 (en) * 2015-08-14 2015-09-30 Nemesis Bioscience Ltd Delivery vehicle
CN113544266A (zh) * 2018-12-17 2021-10-22 博德研究所 Crispr相关转座酶系统和其使用方法

Also Published As

Publication number Publication date
AU2021333586A1 (en) 2023-04-27
AU2021333586A9 (en) 2024-02-08
BR112023003441A2 (pt) 2023-05-02
KR20230054457A (ko) 2023-04-24
CA3190758A1 (en) 2022-03-03
GB2615658A (en) 2023-08-16
MX2023002281A (es) 2023-05-16
EP4200422A1 (en) 2023-06-28
WO2022046662A1 (en) 2022-03-03
CN116438302A (zh) 2023-07-14

Similar Documents

Publication Publication Date Title
KR102623312B1 (ko) Ruvc 도메인이 존재하는 효소
US10982200B2 (en) Enzymes with RuvC domains
US20230340481A1 (en) Systems and methods for transposing cargo nucleotide sequences
WO2021178934A1 (en) Class ii, type v crispr systems
CA3177051A1 (en) Class ii, type ii crispr systems
CA3192224A1 (en) Base editing enzymes
WO2021202559A1 (en) Class ii, type ii crispr systems
US20220298494A1 (en) Enzymes with ruvc domains
JP2023539237A (ja) カーゴヌクレオチド配列を転位させるための系および方法
US20220220460A1 (en) Enzymes with ruvc domains
WO2023076952A1 (en) Enzymes with hepn domains
EP4165177A1 (en) Enzymes with ruvc domains
CN116615547A (zh) 用于对货物核苷酸序列转座的系统和方法
GB2617659A (en) Enzymes with RUVC domains
WO2023097262A1 (en) Endonuclease systems
CN116867897A (zh) 碱基编辑酶

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230328