JP2019532644A - Rna誘導型核酸修飾酵素及びその使用方法 - Google Patents

Rna誘導型核酸修飾酵素及びその使用方法 Download PDF

Info

Publication number
JP2019532644A
JP2019532644A JP2019517305A JP2019517305A JP2019532644A JP 2019532644 A JP2019532644 A JP 2019532644A JP 2019517305 A JP2019517305 A JP 2019517305A JP 2019517305 A JP2019517305 A JP 2019517305A JP 2019532644 A JP2019532644 A JP 2019532644A
Authority
JP
Japan
Prior art keywords
casx
activity
polypeptide
seq
nucleic acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019517305A
Other languages
English (en)
Other versions
JP2019532644A5 (ja
Inventor
エー. ダウドナ,ジェニファー
エー. ダウドナ,ジェニファー
エフ. バンフィールド,ジリアン
エフ. バンフィールド,ジリアン
バースタイン,デイビッド
ベンジャミン ハリントン,ルーカス
ベンジャミン ハリントン,ルーカス
シー. ストラット,スティーブン
シー. ストラット,スティーブン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of California
Original Assignee
University of California
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of California filed Critical University of California
Publication of JP2019532644A publication Critical patent/JP2019532644A/ja
Publication of JP2019532644A5 publication Critical patent/JP2019532644A5/ja
Priority to JP2022199477A priority Critical patent/JP2023027277A/ja
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K19/00Hybrid peptides, i.e. peptides covalently bound to nucleic acids, or non-covalently bound protein-protein complexes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/8509Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/88Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation using microencapsulation, e.g. using amphiphile liposome vesicle
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1003Transferases (2.) transferring one-carbon groups (2.1)
    • C12N9/1007Methyltransferases (general) (2.1.1.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1025Acyltransferases (2.3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/02Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/03Fusion polypeptide containing a localisation/targetting motif containing a transmembrane segment
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/06Fusion polypeptide containing a localisation/targetting motif containing a lysosomal/endosomal localisation signal
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/09Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/20Fusion polypeptide containing a tag with affinity for a non-protein ligand
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/13011Gammaretrovirus, e.g. murine leukeamia virus
    • C12N2740/13041Use of virus, viral particle or viral elements as a vector
    • C12N2740/13043Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/16011Human Immunodeficiency Virus, HIV
    • C12N2740/16041Use of virus, viral particle or viral elements as a vector
    • C12N2740/16043Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Veterinary Medicine (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Mycology (AREA)
  • Virology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

本開示は、CasXタンパク質、本CasXタンパク質をコードする核酸、及び本CasXタンパク質及び/またはそれをコードする核酸を含む修飾された宿主細胞を提供する。CasXタンパク質は、提供される様々な用途において有用である。本開示は、本CasXタンパク質に結合し、それに配列特異性を提供するCasXガイドRNA、本CasXガイドRNAをコードする核酸、ならびに本CasXガイドRNA及び/またはそれをコードする核酸を含む修飾された宿主細胞を提供する。CasXガイドRNAは、提供される様々な用途において有用である。本開示は、古細菌Cas9ポリペプチド及びそれをコードする核酸、ならびにそれらの関連古細菌Cas9ガイドRNA及びそれをコードする核酸を提供する。

Description

DNAシーケンシング時代の前に科学的に不明であった経路の例である、CRISPR−Cas系は現在、細菌及び古細菌にファージ及びウイルスに対する後天的免疫を付与することが理解されている。過去数十年にわたる集中的研究は、この系の生化学を明らかにした。CRISPR−Cas系は、外来DNAまたはRNAの取得、標的化、及び切断に関与するCasタンパク質、ならびにCasタンパク質をそれらの標的に誘導する短いスペーサー配列に隣接する直接反復を含むCRISPRアレイからなる。クラス2CRISPR−Casは、RNAに結合した単一のCasタンパク質が、標的配列への結合及びその切断に関与する最新版である。これらの最小系のプログラム可能な性質は、ゲノム操作の分野に革命を起こしている汎用技術としてのそれらの使用を促進した。
現在のCRISPR−Cas技術は、培養された細菌からの系に基づいており、単離されていない生物の大多数が未開発のままである。現在まで、ほんのわずかのクラス2 CRISPR/Cas系が発見されただけである。当該技術分野において、追加のクラス2 CRISPR/Cas系(例えば、Casタンパク質+ガイドRNAの組み合わせ)に対する必要性が存在する。
本開示は、本明細書において「CasX」ポリペプチドと称される(「CasXタンパク質」とも称される)RNA誘導型エンドヌクレアーゼポリペプチド、Casxポリペプチドをコードする核酸、ならびにCasXポリペプチド及び/またはそれをコードする核酸を含む修飾された宿主細胞を提供する。CasXポリペプチドは、提供される様々な用途において有用である。
本開示は、CasXタンパク質に結合し、それに配列特異性を提供するガイドRNA(本明細書では「CasXガイドRNA」と称される)、CasXガイドRNAをコードする核酸、ならびにCasXガイドRNA及び/またはそれをコードする核酸を含む修飾された宿主細胞を提供する。CasXガイドRNAは、提供される様々な用途において有用である。
本開示は、古細菌Cas9ポリペプチド及びそれをコードする核酸、ならびにそれらの関連ガイドRNA(古細菌Cas9ガイドRNA)及びそれをコードする核酸を提供する。
2つの天然に存在するCasXタンパク質配列を示す。 2つの天然に存在するCasXタンパク質配列を示す。 2つの同定された天然に存在するCasXタンパク質配列のアラインメントを示す。 Aは、CasXについての概略的ドメイン表現を示す。また、CasXのホモログの同定を試みた様々な調査からの結果を示す。また、2つの異なる種から同定されたCasXを含有するCRISPR遺伝子座の部分を示す。 Bは、CasXについての概略的ドメイン表現を示す。また、CasXのホモログの同定を試みた様々な調査からの結果を示す。また、2つの異なる種から同定されたCasXを含有するCRISPR遺伝子座の部分を示す。 A及びBは、Escherichia coli中で発現されたCasXによるプラスミド干渉を実証するために行われた実験を示す。 Cは、Escherichia coli中で発現されたCasXによるプラスミド干渉を実証するために行われた実験を示す。 Aは、CasXのPAM配列を決定するために行われた実験(CasXによるPAM依存性プラスミド干渉)を示す。 B及びCは、CasXのPAM配列を決定するために行われた実験(CasXによるPAM依存性プラスミド干渉)を示す。 A及びBは、CasXが、二重誘導型CRISPR−Casエフェクター複合体であることを決定するために行われた実験を示す。 Cは、CasXが、二重誘導型CRISPR−Casエフェクター複合体であることを決定するために行われた実験を示す。 CasX RNA誘導型DNA干渉の概略図を提示する。 CasXを使用したヒト細胞中の編集を実証するための一実施形態についての実験設計の概略図を提示する。 CasXの組み換え発現及び精製を示すデータを提示する。 切断活性について様々な異なるtracrRNA配列(異なる配列長)を使用したデータを提示する。 室温対37℃でのCasX機能に関するデータを提示する。 A及びBは、古細菌Cas9 CRISPR系(ARMAN−1 II型CRISPR−cas系)に関する情報を提示する。 Cは、古細菌Cas9 CRISPR系(ARMAN−1 II型CRISPR−cas系)に関する情報を提示する。 D及びEは、古細菌Cas9 CRISPR系(ARMAN−1 II型CRISPR−cas系)に関する情報を提示する。 古細菌Cas9タンパク質(それぞれARMAN−1及びARMAN−4、配列番号71及び72)の例を提示する。化膿性連鎖球菌(S.pyogene)のD10及びH840に対応する触媒残基は、太字にされ、下線が引かれている。 古細菌Cas9タンパク質(例えば、ARMAN−1 Cas9)と共に使用され得る二重ガイド(上パネル)(上はRNA配列番号73、下はRNA配列番号77)及び単一ガイド(下パネル)(配列番号79)フォーマットの例を提示する。 古細菌Cas9タンパク質(例えば、ARMAN−1 Cas9)と共に使用され得る二重ガイド(上パネル)(上はRNA配列番号73、下はRNA配列番号77)及び単一ガイド(下パネル)(配列番号79)フォーマットの例を提示する。 古細菌Cas9タンパク質(例えば、ARMAN−4 Cas9)と共に使用され得る二重ガイド(上パネル)(上はRNA配列番号74、下はRNA配列番号78)及び単一ガイド(下パネル)(配列番号80)フォーマットの例を提示する。 2つの新たに同定された非古細菌Cas9タンパク質を提示する。 (i)ARMAN−1及びARMAN−4 Cas9タンパク質を有する2つの新たに同定された非古細菌Cas9タンパク質のアラインメント、(ii)ARMAN−1及びARMAN−4からのCas9タンパク質、ならびに構造が解明されている、Actinomyces naeslundii Cas9に対する未培養細菌からの2つの密接に関係するCas9タンパク質のアラインメントを提示する。 (i)ARMAN−1及びARMAN−4 Cas9タンパク質を有する2つの新たに同定された非古細菌Cas9タンパク質のアラインメント、(ii)ARMAN−1及びARMAN−4からのCas9タンパク質、ならびに構造が解明されている、Actinomyces naeslundii Cas9に対する未培養細菌からの2つの密接に関係するCas9タンパク質のアラインメントを提示する。 (i)ARMAN−1及びARMAN−4 Cas9タンパク質を有する2つの新たに同定された非古細菌Cas9タンパク質のアラインメント、(ii)ARMAN−1及びARMAN−4からのCas9タンパク質、ならびに構造が解明されている、Actinomyces naeslundii Cas9に対する未培養細菌からの2つの密接に関係するCas9タンパク質のアラインメントを提示する。 (i)ARMAN−1及びARMAN−4 Cas9タンパク質を有する2つの新たに同定された非古細菌Cas9タンパク質のアラインメント、(ii)ARMAN−1及びARMAN−4からのCas9タンパク質、ならびに構造が解明されている、Actinomyces naeslundii Cas9に対する未培養細菌からの2つの密接に関係するCas9タンパク質のアラインメントを提示する。 (i)ARMAN−1及びARMAN−4 Cas9タンパク質を有する2つの新たに同定された非古細菌Cas9タンパク質のアラインメント、(ii)ARMAN−1及びARMAN−4からのCas9タンパク質、ならびに構造が解明されている、Actinomyces naeslundii Cas9に対する未培養細菌からの2つの密接に関係するCas9タンパク質のアラインメントを提示する。 (i)ARMAN−1及びARMAN−4 Cas9タンパク質を有する2つの新たに同定された非古細菌Cas9タンパク質のアラインメント、(ii)ARMAN−1及びARMAN−4からのCas9タンパク質、ならびに構造が解明されている、Actinomyces naeslundii Cas9に対する未培養細菌からの2つの密接に関係するCas9タンパク質のアラインメントを提示する。 A及びBは、未培養生物からの新規同定されたCRISPR−Cas系を提示する。Aは、Hugら32のデータに基づく、すべての細菌及び古細菌中の代表的なものが単離された、また単離されていない主要な系統の比を示す。これらの結果は、これらのドメインにおいて大規模であるが、未だほとんど調査されていない生物学を強調する。古細菌Cas9及び新規CRISPR−CasYは、代表的なものが単離されていない系統において排他的に見出された。Bは、新たに発見されたCRISPR−Cas系の遺伝子座組織を示す。 A及びBは、ARMAN−1 CRISPRアレイの多様性及びARMAN−1 Cas9 PAM配列の同定を提示する。Aは、異なる15AMD試料から再構成されたCRISPRアレイを示す。白色の四角は、反復を示し、色付きの菱形は、スペーサーを示す(同一のスペーサーは、同様に着色され、固有のスペーサーは黒色である)。アレイの保存領域が強調されている(右側)。最近取得されたスペーサーの多様性(左側)は、系が活性であることを示す。リードデータからのCRISPR断片も含む分析は、図25に提示される。Bでは、AMDメタゲノムデータから再構成された単一の推定ウイルスコンティグは、ARMAN−1 CRISPRアレイからの56プロトスペーサー(赤色の垂直棒)を含有する。 Cでは、配列分析は、非標的鎖上のプロトスペーサーの下流にある保存された「NGG」PAMモチーフを明らかにした。 A及びBは、CasXが、E.coli中のプログラム可能なDNA干渉を媒介することを示すデータを提示する。Aでは、CasXプラスミド干渉アッセイの図最小CasX遺伝子座を発現するE.coliは、CRISPRアレイ中の配列に一致するスペーサーを含有するプラスミド(標的)または非一致スペーサーを含有するプラスミド(非標的)で形質転換される。形質転換された後、培養物を播種し、コロニー形成単位(cfu)を定量化する。Bは、プランクトミセスCasX遺伝子座標的化スペーサー1(sX.1)を発現し、特定された標的で形質転換されたE.coliの段階希釈(sX1、CasXスペーサー1;sX2、CasXスペーサー2;NT、非標的)を示す。 C及びDは、CasXが、E.coli中のプログラム可能なDNA干渉を媒介することを示すデータを提示する。Cは、デルタプロテオバクテリアCasXによるプラスミド干渉を示す。実験は、三連で行った。平均±標準偏差を示す。Dは、E.coli中で発現されたプランクトミセスCasX遺伝子座についてのPAM枯渇アッセイを示す。対照ライブラリと比較して30倍より多く枯渇したPAM配列を使用して、WebLogoを生成した。 A〜Cは、CasXが二重誘導型CRISPR複合体であることを示すデータを提示する。Aは、下に図示されるCasX CRISPR遺伝子座に対する環境RNA配列(メタトランスクリプトームデータ)のマッピング(赤色の矢印、推定tracrRNA;白色の四角、反復配列;緑色の菱形、スペーサー配列)を示す。挿入図は、第1の反復及びスペーサーの詳細図を示す。Bは、CasX二本鎖DNA干渉の図を示す。RNA処理の部位は、黒色の矢印で示される。Cは、CasX遺伝子座からノックアウトされた推定tracrRNA、及びcrRNA単独、短縮したsgRNA、または全長sgRNAと同時発現したCasXを用いたプラスミド干渉アッセイの結果(T、標的;NT、非標的)を示す。実験は、三連で行った。平均±標準偏差を示す。 Aは、E.coli中のCasY遺伝子座の発現が、DNA干渉に十分であることを示すデータを提示し、CasY遺伝子座及び隣接タンパク質の図を示す。 B及びCは、E.coli中のCasY遺伝子座の発現が、DNA干渉に十分であることを示すデータを提示し、Bは、対照ライブラリに対してCasYが3倍より多く枯渇した5′PAM配列のWebLogo。c、CasY.1を発現し、示されたPAMを含有する標的で形質転換されたE.coliによるプラスミド干渉を示す。実験は、三連で行った。平均±標準偏差を示す。 A及びBは、既知の系の文脈における新たに同定されたCRISPR−Casを提示する。Aは、ユニバーサルCas1タンパク質の簡易な系統樹を示す。CRISPR型の既知の系は、くさびと枝の上に記され、新たに記載された系は太線である。詳細なCas1系統発生は、捕捉データ2に提示される。Bは、II−B型遺伝子座とII−C型遺伝子座との間の組み換えの結果として古細菌II型系を生じた提案された進化的シナリオを示す。 ARMAN−4からの古細菌Cas9が、退化CRISPRアレイを有する多くのコンティグ上で見出されることを提示する。ARMAN−4からのCas9は、16の異なるコンティグ上で濃赤色で強調される。推定ドメインまたは機能を有するタンパク質は標識されているが、仮想タンパク質は標識されていない。15のコンティグは、2つの退化直接反復(1つのbpミスマッチ)及び単一の保存されたスペーサーを含有する。残りのコンティグは、1つのみの直接反復を含有する。ARMAN−1とは異なり、ARMAN−4中のCas9に隣接した追加のCasタンパク質は見出されない。 ARMAN−4からの古細菌Cas9が、退化CRISPRアレイを有する多くのコンティグ上で見出されることを提示する。ARMAN−4からのCas9は、16の異なるコンティグ上で濃赤色で強調される。推定ドメインまたは機能を有するタンパク質は標識されているが、仮想タンパク質は標識されていない。15のコンティグは、2つの退化直接反復(1つのbpミスマッチ)及び単一の保存されたスペーサーを含有する。残りのコンティグは、1つのみの直接反復を含有する。ARMAN−1とは異なり、ARMAN−4中のCas9に隣接した追加のCasタンパク質は見出されない。 ARMAN−4からの古細菌Cas9が、退化CRISPRアレイを有する多くのコンティグ上で見出されることを提示する。ARMAN−4からのCas9は、16の異なるコンティグ上で濃赤色で強調される。推定ドメインまたは機能を有するタンパク質は標識されているが、仮想タンパク質は標識されていない。15のコンティグは、2つの退化直接反復(1つのbpミスマッチ)及び単一の保存されたスペーサーを含有する。残りのコンティグは、1つのみの直接反復を含有する。ARMAN−1とは異なり、ARMAN−4中のCas9に隣接した追加のCasタンパク質は見出されない。 ARMAN−4からの古細菌Cas9が、退化CRISPRアレイを有する多くのコンティグ上で見出されることを提示する。ARMAN−4からのCas9は、16の異なるコンティグ上で濃赤色で強調される。推定ドメインまたは機能を有するタンパク質は標識されているが、仮想タンパク質は標識されていない。15のコンティグは、2つの退化直接反復(1つのbpミスマッチ)及び単一の保存されたスペーサーを含有する。残りのコンティグは、1つのみの直接反復を含有する。ARMAN−1とは異なり、ARMAN−4中のCas9に隣接した追加のCasタンパク質は見出されない。 ARMAN−1 CRISPRアレイの完全再構成を提示する。組み立てられた参照配列、ならびに短DNAリードから再構成されたアレイセグメントを含む、CRISPRアレイの再構成。緑色の矢印は、反復を示し、色付きの矢印は、CRISPRスペーサーを示す(同一のスペーサーは、同じ色で着色されているが、固有のスペーサーは、黒色で着色されている)。CRISPR系において、スペーサーは、典型的に一方向に付加されるため、左側の多様なスペーサーは、最近の取得によるものである。 ARMAN−1 CRISPRアレイの完全再構成を提示する。組み立てられた参照配列、ならびに短DNAリードから再構成されたアレイセグメントを含む、CRISPRアレイの再構成。緑色の矢印は、反復を示し、色付きの矢印は、CRISPRスペーサーを示す(同一のスペーサーは、同じ色で着色されているが、固有のスペーサーは、黒色で着色されている)。CRISPR系において、スペーサーは、典型的に一方向に付加されるため、左側の多様なスペーサーは、最近の取得によるものである。 ARMAN−1 CRISPRアレイの完全再構成を提示する。組み立てられた参照配列、ならびに短DNAリードから再構成されたアレイセグメントを含む、CRISPRアレイの再構成。緑色の矢印は、反復を示し、色付きの矢印は、CRISPRスペーサーを示す(同一のスペーサーは、同じ色で着色されているが、固有のスペーサーは、黒色で着色されている)。CRISPR系において、スペーサーは、典型的に一方向に付加されるため、左側の多様なスペーサーは、最近の取得によるものである。 ARMAN−1 CRISPRアレイの完全再構成を提示する。組み立てられた参照配列、ならびに短DNAリードから再構成されたアレイセグメントを含む、CRISPRアレイの再構成。緑色の矢印は、反復を示し、色付きの矢印は、CRISPRスペーサーを示す(同一のスペーサーは、同じ色で着色されているが、固有のスペーサーは、黒色で着色されている)。CRISPR系において、スペーサーは、典型的に一方向に付加されるため、左側の多様なスペーサーは、最近の取得によるものである。 ARMAN−1 CRISPRアレイの完全再構成を提示する。組み立てられた参照配列、ならびに短DNAリードから再構成されたアレイセグメントを含む、CRISPRアレイの再構成。緑色の矢印は、反復を示し、色付きの矢印は、CRISPRスペーサーを示す(同一のスペーサーは、同じ色で着色されているが、固有のスペーサーは、黒色で着色されている)。CRISPR系において、スペーサーは、典型的に一方向に付加されるため、左側の多様なスペーサーは、最近の取得によるものである。 ARMAN−1 CRISPRアレイの完全再構成を提示する。組み立てられた参照配列、ならびに短DNAリードから再構成されたアレイセグメントを含む、CRISPRアレイの再構成。緑色の矢印は、反復を示し、色付きの矢印は、CRISPRスペーサーを示す(同一のスペーサーは、同じ色で着色されているが、固有のスペーサーは、黒色で着色されている)。CRISPR系において、スペーサーは、典型的に一方向に付加されるため、左側の多様なスペーサーは、最近の取得によるものである。 A及びBは、ARMAN−1スペーサーが、古細菌コミュニティメンバーのゲノムにマップすることを示す。Aでは、ARMAN−1からのプロトスペーサー(赤色の矢印)は、同じ環境からのナノ古細菌であるARMAN−2のゲノムにマップする。6つのプロトスペーサーは、両側に2つの長い末端反復(LTR)を有するゲノムの部分に固有にマップし、2つの追加のプロトスペーサーは、LTR内に完全に一致する(青色及び緑色)。この領域は、トランスポゾンである可能性があり、ARMAN−1のCRISPR−Cas系は、この要素の可動化を抑制することにおいて役割を果たすことを示唆する。Bでは、プロトスペーサーはまた、ARMAN生物と同じ試料中で見出されるRichmond Mine生態系の別のメンバーである、サーモプラズマ目古細菌(I−プラズマ)にマップする。プロトスペーサーは、短い仮想タンパク質をコードするゲノムの領域内でクラスタ化し、これもまた可動要素を表し得ることを示唆する。 Aは、ARMAN−1 crRNA及びtracrRNAの予測された二次構造を提示する。Aでは、CRISPR反復及びtracrRNA抗反復は、黒色で示されるが、スペーサー由来の配列は、一連の緑色のNとして示される。遺伝子座から明らかな終結シグナルを予測することはできないため、3つの異なるtracrRNAの長さを、それらの二次構造69、104、及び179(それぞれ赤色、青色、及びピンク色)に基づいて試験した。 Bは、ARMAN−1 crRNA及びtracrRNAの予測された二次構造を提示する。Bは、Aにおける二重ガイドに対応する操作された単一ガイドRNAを示す。 C〜Eは、ARMAN−1 crRNA及びtracrRNAの予測された二次構造を提示する。Cは、c、tracrRNAの3′端部に2つの異なるヘアピン(75及び122)を有するARMAN−4 Cas9の二重ガイドを示す。Dは、Cにおける二重ガイドに対応する操作された単一ガイドRNAを示す。Eは、E.coliインビボ標的アッセイにおいて試験された条件を示す。 A及びBは、インビトロ生化学研究のための精製概要を提示する。Aでは、ARMAN−1(AR1)及びARMAN−4(AR4)Cas9は、補足資料において概説される様々な条件下で発現され、精製された。青色の四角で囲まれたタンパク質は、インビトロで切断活性について試験した。Bでは、AR1−Cas9及びAR4−Cas9精製の分画を、10% SDS−PAGEゲル上で分離した。 既知のタンパク質と比較して新たに同定されたCRISPR−Cas系を提示する。以下の検索に基づく既知のタンパク質に対するCasX及びCasYの類似性を示す。(1)NCBIの非冗長(NR)タンパク質データベースに対するBlast検索、(2)すべての既知のタンパク質のHMMデータベースに対する隠れマルコフモデル(HMM)検索、及び(3)HHpred30を使用する遠隔ホモロジー検索である。 A及びBは、CasXによるプログラムされたDNA干渉に関するデータを提示する。Aは、図20のCから続く、CasX2(プランクトミセス)及びCasX1(デルタプロテオバクテリア)についてのプラスミド干渉アッセイ(sX1、CasXスペーサー1;sX2、CasXスペーサー2;NT、非標的)を示す。実験は、三連で行った。平均±標準偏差を示す。Bは、図20のBから続く、CasX遺伝子座を発現し、特定された標的で形質転換されたE.coliの段階希釈を示す。 Cは、CasXによるプログラムされたDNA干渉に関するデータを提示する。Cは、デルタプロテオバクテリアCasXについてのPAM枯渇アッセイを示す。対照ライブラリと比較して示されたPAM枯渇値閾値(PDVT)よりも多く枯渇したPAM配列を使用して、WebLogoを生成した。 Dは、CasXによるプログラムされたDNA干渉に関するデータを提示する。Dは、E.coli中で発現されたプランクトミセスCasXについてのPAM枯渇アッセイを示す。対照ライブラリと比較して示されたPAM枯渇値閾値(PDVT)よりも多く枯渇したPAM配列を使用して、WebLogoを生成した。 E及びFは、CasXによるプログラムされたDNA干渉に関するデータを提示する。Eは、CasX.1についてのノーザンブロットプローブの位置を示す図であり、Fは、CasX.1遺伝子座を発現するE.coliから抽出された総RNA中のCasX.1 tracrRNAについてのノーザンブロットを示す。 Cas9ホモログの進化樹を提示する。Cas9タンパク質の最大尤度系統樹。それらの型に基づいて着色された以前に記載された系を示す(II−Aは青色、II−Bは緑色、及びII−Cは紫色)。未培養細菌からの2つの新たに記載された細菌Cas9と共に、II−C型CRISPR−Cas系を有するクラスタである、古細菌Cas9。 ARMAN−1及びARMAN−4からのCas9についてアッセイされた切断条件の表を提示する。
本明細書において使用される場合、「異種」とは、それぞれ天然の核酸またはタンパク質中に見出されないヌクレオチドまたはポリペプチド配列を意味する。例えば、CasXポリペプチドに対して、異種ポリペプチドは、CasXポリペプチド以外のタンパク質からのアミノ酸配列を含む。ある場合には、1つの種からのCasXタンパク質の部分が、異なる種からのCasXタンパク質の部分に融合される。各種からのCasX配列は、したがって、互いに対して異種であるとみなされ得る。別の例として、CasXタンパク質(例えば、dCasXタンパク質)は、非CasXタンパク質(例えば、ヒストンデアセチラーゼ)からの活性ドメインに融合され得、活性ドメインの配列は、異種ポリペプチドであるとみなされ得る(それはCasXタンパク質に対して異種である)。
本明細書で同義に使用される「ポリヌクレオチド」及び「核酸」という用語は、リボヌクレオチドまたはデオキシヌクレオチドのいずれかである、任意の長さのヌクレオチドのポリマーを指す。このため、この用語は、一本鎖、二本鎖、もしくは多重鎖DNAもしくはRNA、ゲノムDNA、cDNA、DNA−RNAハイブリッド、あるいはプリン及びピリミジン塩基または他の天然の、化学的もしくは生化学的に修飾された、非天然の、または誘導体化されたヌクレオチド塩基を含むポリマーを含むが、これらに限定されない。「ポリヌクレオチド」及び「核酸」という用語は、記載されている実施形態に適用可能である場合、一本鎖(センスまたはアンチセンスなど)及び二本鎖ポリヌクレオチドを含むことが理解されるべきである。
「ポリペプチド」、「ペプチド」、及び「タンパク質」という用語は、本明細書で同義に使用され、任意の長さのアミノ酸のポリマー形態を指し、これは遺伝的にコードされた、また非遺伝的にコードされたアミノ酸、化学的もしくは生化学的に修飾されたまたは誘導体化されたアミノ酸、及び修飾されたペプチド骨格を有するポリペプチドを含み得る。この用語は、融合タンパク質を含み、異種アミノ酸配列を有する融合タンパク質、N末端メチオニン残基を有するかまたは有しない異種及び同種リーダー配列との融合;免疫学的にタグ付けされたタンパク質等が挙げられるが、これらに限定されない。
本明細書において使用される場合、「天然に存在する」という用語は、核酸、タンパク質、細胞、または生物に適用される場合、天然に見出される核酸、細胞、タンパク質、または生物を指す。
本明細書において使用される場合、「単離された」という用語は、ポリヌクレオチド、ポリペプチド、または細胞が天然に存在する環境とは異なる環境内にあるポリヌクレオチド、ポリペプチド、または細胞を説明することを意味する。単離された遺伝的に修飾された宿主細胞は、遺伝的に修飾された宿主細胞の混合集団中に存在し得る。
本明細書において使用される場合、「外因性核酸」という用語は、自然界の所与の細菌、生物、もしくは細胞において通常もしくは天然に見出されない、及び/またはそれによって産生されない核酸を指す。本明細書において使用される場合、「内因性核酸」という用語は、自然界の所与の細菌、生物、または細胞において通常見出されない、及び/またはそれによって産生される核酸を指す。「内因性核酸」はまた、「天然核酸」または所与の細菌、生物、または細胞に「天然」である核酸とも称される。
本明細書において使用される場合、「組み換え」とは、特定の核酸(DNAまたはRNA)が、自然分類系において見出される内因性核酸から区別可能な構造的コードまたは非コード配列を有する構築物もたらすクローニング、制限、及び/またはライゲーションステップの様々な組み合わせの産物である。一般に、構造的コード配列をコードするDNA配列は、cDNA断片及び短いオリゴヌクレオチドリンカーから、または一連の合成オリゴヌクレオチドから組み立てて、細胞または無細胞転写及び翻訳系に含まれる組み換え転写単位から発現可能な合成核酸を提供することができる。そのような配列は、真核生物遺伝子に典型的に存在する、内部非翻訳配列またはイントロンによって中断されていないオープンリーディングフレームの形態で提供され得る。関連配列を含むゲノムDNAはまた、組み換え遺伝子または転写単位の形成において使用され得る。非翻訳DNAの配列は、そのような配列が、コード領域の操作または発現に干渉しないオープンリーディングフレームから5′または3′に存在し得、実際に様々な機序による所望の産物の生産を変調するように作用し得る(下記の「DNA調節配列」を参照)。
このため、例えば、「組み換え」ポリヌクレオチドまたは「組み換え」核酸という用語は、天然に存在しない、例えば、ヒト介入を通して、配列の2つの他の方法で分離されたセグメントの人工的な組み合わせによって作製されるものを指す。この人工的な組み合わせは、多くの場合、核酸の単離されたセグメントの化学合成手段または人工的な操作のいずれかによって、例えば、遺伝子工学的技法によって達成される。これは通常、典型的に配列認識部位を導入または除去する一方で、コドンを、それをコードする冗長コドンまたは保存アミノ酸と置き換えるために行われる。あるいは、所望の機能の核酸セグメントを一緒に接合して、所望の機能の組み合わせを生成するために行われる。この人工的な組み合わせは、多くの場合、核酸の単離されたセグメントの化学合成手段または人工的な操作のいずれかによって、例えば、遺伝子工学的技法によって達成される。
同様に、「組み換え」ポリペプチドという用語は、天然に存在しない、例えば、ヒト介入を通して、アミノ配列の2つの他の方法で分離されたセグメントの人工的な組み合わせによって作製されるポリペプチドを指す。このため、例えば、異種アミノ酸配列を含むポリペプチドは、組み換えである。
「構築物」または「ベクター」とは、特異的ヌクレオチド配列(複数可)の発現及び/もしくは伝播を目的として生成された、または他の組み換えヌクレオチド配列の構築において使用される組み換え核酸、一般に組み換えDNAを意味する。
本明細書で同義に使用される「DNA調節配列」「制御要素」、及び「調節要素」は、宿主細胞中のコード配列の発現及び/またはコードされたポリペプチドの産生を提供する及び/または調節する、転写及び翻訳制御配列、例えばプロモーター、エンハンサー、ポリアデニル化シグナル、ターミネーター、タンパク質分解シグナル等を指す。
「形質転換」という用語は、本明細書では「遺伝的修飾」と同義に使用され、細胞中に新たな核酸(細胞に外因性のDNA)を導入した後に細胞中で誘導された永久または一過性の遺伝的変化を指す。遺伝的変化(「修飾」)は、宿主細胞のゲノム中への新たな核酸の組み込み、またはエピソーム要素としての新たな核酸の一過性もしくは安定した維持のいずれかによって達成され得る。細胞が真核細胞である場合、永久的遺伝的変化は、一般に細胞のゲノム中への新たなDNAの導入によって達成される。原核細胞において、永久変更は、染色体中に、またはプラスミド及び発現ベクターなどの染色体外要素を介して導入され得、これらは組み換え宿主細胞中のそれらの維持を助けるために1つ以上の選択可能なマーカーを含有し得る。遺伝的修飾の好適な方法としては、ウイルス感染、形質移入、共役、プロトプラスト融合、電気穿孔、粒子ガン技術、リン酸カルシウム沈降、直接マイクロインジェクション等が挙げられる。方法の選択は、一般に、形質転換される細胞の種類、及び形質転換が起こる状況(すなわち、インビトロ、エクスビボ、またはインビボ)に依存する。これらの方法に関する一般的な考察は、Ausubel,et al,Short Protocols in Molecular Biology,3rd ed.,Wiley&Sons,1995に見出され得る。
「動作可能に連結した」は、並立を指し、そのように説明される構成要素は、それらがその意図される様式で機能することを可能する関係にある。例えば、プロモーターは、当該プロモーターがその転写または発現に影響を及ぼす場合、コード配列に動作可能に連結される。本明細書において使用される場合、「異種プロモーター」及び「異種制御領域」という用語は、自然界の特定の核酸に通常は関連しないプロモーター及び他の制御領域を指す。例えば、コード領域に対して異種の「転写制御領域」は、自然界のコード領域に通常は関連しない転写制御領域である。
本明細書において使用される場合、「宿主細胞」は、インビボまたはインビトロの真核細胞、原核細胞、または単細胞実態として培養された多細胞生物からの細胞(例えば、細胞株)を示し、真核または原核細胞は、核酸のレシピエント(例えば、発現ベクター)であり得るか、または核酸のレシピエントとして使用されており、核酸によって遺伝的に修飾された元の細胞の子孫を含む。単一細胞の子孫は、天然の、不慮の、または意図的な突然変異に起因して、形態において、またはゲノムもしくは総DNA相補体において元の親と必ずしも完全に同一でない場合があることが理解される。「組み換え宿主細胞」(「遺伝的に修飾された宿主細胞」とも称される)は、異種核酸、例えば、発現ベクターが中に導入された宿主細胞である。例えば、対象の原核宿主細胞は、異種核酸、例えば、その原核宿主細胞に対して外来である(原核宿主細胞中で通常は天然に見出されない)外因性核酸、または原核宿主細胞中で通常は見出されない組み換え核酸の好適な原核宿主細胞への導入によって遺伝的に修飾された原核宿主細胞(例えば、細菌)であり、対象の真核宿主細胞は、異種核酸、例えば、その真核宿主細胞に対して外来である外因性核酸、または真核宿主細胞中で通常は見出されない組み換え核酸の好適な真核宿主細胞への導入によって遺伝的に修飾された真核宿主細胞である。
「保存アミノ酸置換」という用語は、類似した側鎖を有するアミノ酸残基のタンパク質中の互換性を指す。例えば、脂肪族側鎖を有するアミノ酸の群は、グリシン、アラニン、バリン、ロイシン、及びイソロイシンからなり、脂肪族−ヒドロキシル側鎖を有するアミノ酸の群は、セリン及びスレオニンからなり、アミド含有側鎖を有するアミノ酸の群は、アスパラギン及びグルタミンからなり、芳香族側鎖を有するアミノ酸の群は、フェニルアラニン、チロシン、及びトリプトファンからなり、塩基性側鎖を有するアミノ酸の群は、リジン、アルギニン、及びヒスチジンからなり、硫黄含有側鎖を有するアミノ酸の群は、システイン及びメチオニンからなる。例示的な保存アミノ酸置換基は、バリン−ロイシン−イソロイシン、フェニルアラニン−チロシン、リジン−アルギニン、アラニン−バリン、及びアスパラギン−グルタミンである。
ポリヌクレオチドまたはポリペプチドは、別のポリヌクレオチドまたはポリペプチドに対してある特定の「配列同一性」のパーセントを有し、整列したときに、塩基またはアミノ酸のパーセンテージが、それら2つの配列を比較したときに同一であり、同じ相対位置にあることを意味する。配列類似性を複数の異なる様式で決定することができる。配列同一性を決定するために、ncbi.nlm.nih.gov/BLAST上で利用可能なBLASTを含む方法及びコンピュータプログラムを用いて、配列を整列させることができる。例えば、Altschul et al.(1990),J.Mol.Biol.215:403−10を参照されたい。別のアラインメントアルゴリズムは、Oxford Molecular Group,Inc.の完全所有子会社であるGenetics Computing Group(GCG)パッケージ(Madison,Wisconsin,USA)で入手可能なFASTAである。アラインメントのための他の技法は、Methods in Enzymology,vol.266:Computer Methods for Macromolecular Sequence Analysis(1996),ed.Doolittle,Academic Press,Inc.,a division of Harcourt Brace&Co.,San Diego,California,USA.に記載されている。配列中のギャップを許容するアラインメントプログラムが特に興味深い。Smith−Watermanは、配列アラインメントにおけるギャップを許容する一種のアルゴリズムである。Meth.Mol.Biol.70:173−187(1997)を参照されたい。また、Needleman−Wunschアラインメント方法を使用するGAPプログラムを利用して、配列を整列させることができる。J.Mol.Biol.48:443−453(1970)を参照されたい。
本明細書において使用される場合、「治療」、「治療する」等の用語は、所望の薬理学的及び/または生理学的効果を得ることを指す。その効果は、その疾患もしくは症状を完全にまたは部分的に予防するという観点において予防的であり得、かつ/または疾患及び/もしくはその疾患に起因する副作用の部分的または完全な治癒という観点において治療的であり得る。本明細書において使用される場合、「治療」は、哺乳動物、例えば、ヒトにおける疾患の任意の治療を包含し、(a)その疾患にかかりやすいが、まだそれを有すると診断されていない対象における発病を予防すること、(b)その疾患を阻害すること、すなわち、その発症を阻止すること、及び(c)その疾患を軽減すること、すなわち、その疾患の退行を引き起こすことを含む。
本明細書において同義に使用される「個体」、「対象」、「宿主」、及び「患者」という用語は、個々の生物、例えば、マウス、サル、ヒト、哺乳類家畜動物、哺乳類スポーツ動物、及び哺乳類ペットを含むが、これらに限定されない哺乳動物を指す。
本発明をさらに説明する前に、本発明は、記載される特定の実施形態に限定されず、したがって、言うまでもなく、変化し得ることを理解されたい。本明細書で使用される専門用語は、特定の実施形態を説明するためだけのものであり、本発明の範囲が添付の特許請求の範囲によってのみ限定されるため、限定するよう意図されないことも理解されたい。
値の範囲が提供される場合、文脈が別途明確に指示しない限り、下限値の単位の10分の1までの、その範囲の上限値と下限値との間の各介在値、ならびにその表示範囲の任意の他の表示値または介在値が、本発明に包含されることが理解される。これらのより小さい範囲の上限値及び下限値は、より小さい範囲内に独立して含まれてもよく、また、表示範囲内の任意の具体的な除外限度に従って、本発明に包含される。表示範囲がそれらの限界値のうちの一方または両方を含む場合、それらの包含される限界値のうちのいずれかまたは両方を除外する範囲もまた、本発明に包含される。
別途定義されない限り、本明細書で使用されるすべての技術用語及び科学用語は、本発明が属する当業者に一般に理解される意味と同じ意味を有する。本明細書に記載の方法及び物質と同様もしくは同等の任意の方法及び物質を本発明の実践または試験において使用することもできるが、好ましい方法及び物質は、これから説明される。本明細書で言及されるすべての刊行物は、それらの刊行物が引用されるものに関して方法及び/または物質を開示及び説明するために、参照により本明細書に組み込まれる。
本明細書と添付の特許請求の範囲で使用される場合、文脈上、明らかに別段に解される場合を除き、「a」、「an」及び「the」という単数形には、複数の言及物が含まれることに留意しなければならない。このため、例えば、「CasXポリペプチド」への言及は、複数のそのようなポリペプチドを含み、「ガイドRNA」への言及は、1つ以上のガイドRNA及び当業者に既知のそれらの同等物への言及を含む等である。特許請求の範囲が、いかなる任意の要素も除外するように作成されてもよいことにさらに留意する。したがって、この記述は、特許請求の範囲の要素の列挙に関して「単に」、「のみ」等の排他的な専門用語の使用、または「否定的な」制限の使用のための先行する基準として役立つことが意図される。
明確にするために別個の実施形態の文脈において説明される本発明のある特定の特徴を、単一の実施形態において組み合わせで提供することもできることが理解される。逆に、簡潔にするために単一の実施形態の文脈において説明される本発明の様々な特徴を、別個に、または任意の好適な副組み合わせで提供することもできる。本発明に関連する実施形態のすべての組み合わせは、本発明によって具体的に包含され、ありとあらゆる組み合わせが個々にかつ明確に開示されたかのように本明細書に開示される。加えて、様々な実施形態及びそれらの要素のすべての副組み合わせも本発明によって具体的に包含され、ありとあらゆるそのような副組み合わせが個々にかつ明確に本明細書に開示されたかのように本明細書に開示される。
本明細書で考察される刊行物は、本出願の出願日前のそれらの開示に対してのみ提供される。本明細書におけるいずれの内容も、本発明が先行発明によりそのような刊行物に先行する資格がないことを認めるものと解釈されるべきではない。さらに、提供される刊行物の日付は、実際の刊行日とは異なる場合があり、別々に確認する必要があり得る。
本開示は、本明細書において「CasX」ポリペプチドと称される(「CasXタンパク質」とも称される)RNA誘導型エンドヌクレアーゼポリペプチド、Casxポリペプチドをコードする核酸、ならびにCasXポリペプチド及び/またはそれをコードする核酸を含む修飾された宿主細胞を提供する。CasXポリペプチドは、提供される様々な用途において有用である。
本開示は、CasXタンパク質に結合し、それに配列特異性を提供するガイドRNA(本明細書では「CasXガイドRNA」と称される)、CasXガイドRNAをコードする核酸、ならびにCasXガイドRNA及び/またはそれをコードする核酸を含む修飾された宿主細胞を提供する。CasXガイドRNAは、提供される様々な用途において有用である。
本開示は、古細菌Cas9ポリペプチド及びそれをコードする核酸、ならびにそれらの関連ガイドRNA(古細菌Cas9ガイドRNA)及びそれをコードする核酸を提供する。
組成物
CRISPR/CASXタンパク質及びガイドRNA
CRISPR/Casエンドヌクレアーゼ(例えば、CasXタンパク質)は、対応するガイドRNA(例えば、CasXガイドRNA)と相互作用して(に結合して)、標的核酸分子内のガイドRNAと標的配列との間の塩基対合を介して標的核酸中の特定の部位に標的される、リボヌクレオタンパク質(RNP)複合体を形成する。ガイドRNAは、標的核酸の配列(標的部位)に相補的なヌクレオチド配列(ガイド配列)を含む。このため、CasXタンパク質は、CasXガイドRNAとの複合体を形成し、ガイドRNAは、ガイド配列を介してRNP複合体に配列特異性を提供する。複合体のCasXタンパク質は、部位特異的活性を提供する。換言すれば、CasXタンパク質は、ガイドRNAとのその会合により、標的核酸配列(例えば、染色体配列または染色体外配列、例えば、エピソーム配列、ミニサークル配列、ミトコンドリア配列、葉緑体配列等)内の標的部位に誘導される(例えば、標的部位において安定化される)。
本開示は、CasXポリペプチド(及び/またはCasXポリペプチドをコードする核酸)を含む組成物を提供する(例えば、CasXポリペプチドは、天然に存在するタンパク質、ニッカーゼCasXタンパク質、dCasXタンパク質、キメラCasXタンパク質等であり得る)。本開示は、CasXガイドRNA(及び/またはCasXガイドRNAをコードする核酸)を含む組成物を提供する(例えば、CasXガイドRNAは、二重または単一ガイドフォーマットであり得る)。本開示は、(a)CasXポリペプチド(及び/またはCasXポリペプチドをコードする核酸)(例えば、CasXポリペプチドは、天然に存在するタンパク質、ニッカーゼCasXタンパク質、dCasXタンパク質、キメラCasXタンパク質等であり得る)及び(b)CasXガイドRNA(及び/またはCasXガイドRNAをコードする核酸)(例えば、CasXガイドRNAは、二重または単一ガイドフォーマットであり得る)を含む組成物を提供する。本開示は、以下を含む核酸/タンパク質複合体(RNP複合体)を提供する。(a)本開示のCasXポリペプチド(例えば、CasXポリペプチドは、天然に存在するタンパク質、ニッカーゼCasXタンパク質、dCasXタンパク質、キメラCasXタンパク質等であり得る)及び(b)CasXガイドRNA(例えば、CasXガイドRNAは、二重または単一ガイドフォーマットであり得る)。
CasXタンパク質
CasXポリペプチド(この用語は、「CasXタンパク質」という用語と同義に使用される)は、標的核酸及び/または標的核酸に関連したポリペプチドに結合及び/または修飾し得る(例えば、切断、ニック、メチラート、デメチラート等)(例えば、ヒストンテールのメチル化またはアセチル化)(例えば、ある場合には、CasXタンパク質は、活性を有する融合パートナーを含み、またある場合には、CasXタンパク質は、ヌクレアーゼ活性を提供する)。ある場合には、CasXタンパク質は、天然に存在するタンパク質である(例えば、原核細胞中で天然に存在する)。他の場合には、CasXタンパク質は、天然に存在するポリペプチドではない(例えば、CasXタンパク質は、変異形CasXタンパク質、キメラタンパク質等である)。
所与のタンパク質がCasXガイドRNAと相互作用するかどうかを決定するアッセイは、タンパク質と核酸との間の結合について試験する任意の簡便な結合アッセイであり得る。好適な結合アッセイ(例えば、ゲルシフトアッセイ)は、当業者に既知となる(例えば、CasXガイドRNA及びタンパク質を標的核酸に付加することを含むアッセイ)。タンパク質が活性を有するかどうかを決定する(例えば、タンパク質が、標的核酸を切断するヌクレアーゼ活性及び/またはいくらかの異種活性を有するかどうかを決定する)アッセイは、任意の簡便なアッセイ(例えば、核酸切断について試験する任意の簡便な核酸切断アッセイ)であり得る。好適なアッセイ(例えば、切断アッセイ)は、当業者に既知となる。
天然に存在するCasXタンパク質は、標的二本鎖DNA(dsDNA)中の特定の配列において二本鎖切断を触媒するエンドヌクレアーゼとして機能する。配列特異性は、標的DNA内の標的配列にハイブリダイズする、関連ガイドRNAによって提供される。天然に存在するガイドRNAは、crRNAにハイブリダイズされたtracrRNAを含み、crRNAは、標的DNA中の標的配列にハイブリダイズするガイド配列を含む。
いくつかの実施形態では、対象の方法及び/または組成物のCasXタンパク質は、天然に存在する(野生型)タンパク質である(またはそれに由来する)。天然に存在するCasXタンパク質の例は、図1に示され、配列番号1〜2として記載されている。天然に存在するCasXタンパク質の例は、図1に示され、配列番号1〜3として記載されている。2つの天然に存在するCasXタンパク質のアラインメントは、図2に提示される(「gwa2」は、CasX1であり、「gwc2」は、CasX2である)。シーケンシングデータから(デルタプロテオバクテリア(gwa2足場)から及びプランクトミセス(gwc2足場)から)組み立てられたCRISPR遺伝子座の部分的DNA足場は、それぞれ配列番号51及び52として記載されている。この新たに発見されたタンパク質(CasX)は、以前に同定されたCRISPR−Casエンドヌクレアーゼと比較して短く、またこのため、代替としてのこのタンパク質の使用が、タンパク質をコードするヌクレオチド配列が比較的短いという利点を提供することに留意することが重要である。これは、例えば、CasXタンパク質をコードする核酸が望ましい場合、例えば、研究及び/または臨床用途のために真核細胞(例えば、哺乳動物細胞、ヒト細胞、マウス細胞、インビトロ、エクスビボ、インビボ)などの細胞に送達するために、ウイルスベクター(例えば、AAVベクター)を用いる状況において有用である。また本明細書において、CasX CRISPR遺伝子座を内包する細菌が、低温(例えば、10〜17℃)で収集された環境試料中に存在したことも留意される。このため、CasXは、低温(例えば、10〜14℃、10〜17℃、10〜20℃)で良好に(例えば、現在までに発見された他のCasエンドヌクレアーゼよりも良好に)機能することができると予想される。
ある場合には、(対象の組成物及び/または方法の)CasXタンパク質は、配列番号1として記載されるCasXタンパク質配列と20%以上の配列同一性(例えば、30%以上、40%以上、50%以上、60%以上、70%以上、80%以上、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。例えば、ある場合には、CasXタンパク質は、配列番号1として記載されるCasXタンパク質配列と50%以上の配列同一性(例えば、60%以上、70%以上、80%以上、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、CasXタンパク質は、配列番号1として記載されるCasXタンパク質配列と80%以上の配列同一性(例えば、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、CasXタンパク質は、配列番号1として記載されるCasXタンパク質配列と90%以上の配列同一性(例えば、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、CasXタンパク質は、配列番号1として記載されるCasXタンパク質配列を有するアミノ酸配列を含む。ある場合には、配列が(例えば、以下に記載されるアミノ酸位置において)タンパク質の天然に存在する触媒能を低減するアミノ酸置換(例えば、1、2、または3アミノ酸置換)を含むことを例外として、CasXタンパク質は、配列番号1として記載されるCasXタンパク質配列を有するアミノ酸配列を含む。
ある場合には、CasXタンパク質は、配列番号2として記載されるCasXタンパク質配列と20%以上の配列同一性(例えば、30%以上、40%以上、50%以上、60%以上、70%以上、80%以上、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、CasXタンパク質は、配列番号2として記載されるCasXタンパク質配列と50%以上の配列同一性(例えば、60%以上、70%以上、80%以上、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、CasXタンパク質は、配列番号2として記載されるCasXタンパク質配列と80%以上の配列同一性(例えば、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、CasXタンパク質は、配列番号2として記載されるCasXタンパク質配列と90%以上の配列同一性(例えば、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、CasXタンパク質は、配列番号2として記載されるCasXタンパク質配列を有するアミノ酸配列を含む。ある場合には、配列が(例えば、以下に記載されるアミノ酸位置において)タンパク質の天然に存在する触媒能を低減するアミノ酸置換(例えば、1、2、または3アミノ酸置換)を含むことを例外として、CasXタンパク質は、配列番号2として記載されるCasXタンパク質配列を有するアミノ酸配列を含む。
ある場合には、CasXタンパク質は、配列番号3として記載されるCasXタンパク質配列と20%以上の配列同一性(例えば、30%以上、40%以上、50%以上、60%以上、70%以上、80%以上、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、CasXタンパク質は、配列番号3として記載されるCasXタンパク質配列と50%以上の配列同一性(例えば、60%以上、70%以上、80%以上、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、CasXタンパク質は、配列番号3として記載されるCasXタンパク質配列と80%以上の配列同一性(例えば、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、CasXタンパク質は、配列番号3として記載されるCasXタンパク質配列と90%以上の配列同一性(例えば、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、CasXタンパク質は、配列番号3として記載されるCasXタンパク質配列を有するアミノ酸配列を含む。ある場合には、配列が(例えば、以下に記載されるアミノ酸位置において)タンパク質の天然に存在する触媒能を低減するアミノ酸置換(例えば、1、2、または3アミノ酸置換)を含むことを例外として、CasXタンパク質は、配列番号3として記載されるCasXタンパク質配列を有するアミノ酸配列を含む。
ある場合には、CasXタンパク質は、配列番号1及び2として記載されるCasXタンパク質配列のうちのいずれか1つと20%以上の配列同一性(例えば、30%以上、40%以上、50%以上、60%以上、70%以上、80%以上、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、CasXタンパク質は、配列番号1及び2として記載されるCasXタンパク質配列のうちのいずれか1つと50%以上の配列同一性(例えば、60%以上、70%以上、80%以上、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、CasXタンパク質は、配列番号1及び2として記載されるCasXタンパク質配列のうちのいずれか1つと80%以上の配列同一性(例えば、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、CasXタンパク質は、配列番号1及び2として記載されるCasXタンパク質配列のうちのいずれか1つと90%以上の配列同一性(例えば、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、CasXタンパク質は、配列番号1及び2のうちの1つに記載されるCasXタンパク質配列を有するアミノ酸配列を含む。ある場合には、配列が(例えば、以下に記載されるアミノ酸位置において)タンパク質の天然に存在する触媒能を低減するアミノ酸置換(例えば、1、2、または3アミノ酸置換)を含むことを例外として、CasXタンパク質は、配列番号1及び2のうちのいずれか1つに記載されるCasXタンパク質配列を有するアミノ酸配列を含む。
ある場合には、CasXタンパク質は、配列番号1〜3として記載されるCasXタンパク質配列のうちのいずれか1つと20%以上の配列同一性(例えば、30%以上、40%以上、50%以上、60%以上、70%以上、80%以上、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、CasXタンパク質は、配列番号1〜3として記載されるCasXタンパク質配列のうちのいずれか1つと50%以上の配列同一性(例えば、60%以上、70%以上、80%以上、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、CasXタンパク質は、配列番号1〜3として記載されるCasXタンパク質配列のうちのいずれか1つと80%以上の配列同一性(例えば、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、CasXタンパク質は、配列番号1〜3として記載されるCasXタンパク質配列のうちのいずれか1つと90%以上の配列同一性(例えば、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、CasXタンパク質は、配列番号1〜3のうちの1つに記載されるCasXタンパク質配列を有するアミノ酸配列を含む。ある場合には、配列が(例えば、以下に記載されるアミノ酸位置において)タンパク質の天然に存在する触媒能を低減するアミノ酸置換(例えば、1、2、または3アミノ酸置換)を含むことを例外として、CasXタンパク質は、配列番号1〜3のうちのいずれか1つに記載されるCasXタンパク質配列を有するアミノ酸配列を含む。
CasXタンパク質ドメイン
CasXタンパク質のドメインを図3に示す。図3の概略図に見られるように(アミノ酸は、CasX1タンパク質(配列番号1)に基づいて付番される)、CasXタンパク質は、およそ650アミノ酸長(例えば、CasX1については663、CasX2については650)のN末端ドメインと、CasXタンパク質の一次アミノ酸配列に関して連続しないが、一旦タンパク質が産生され、折り畳まれるとRuvCドメインを形成する3つの部分的RuvCドメイン(本明細書ではサブドメインとも称される、RuvC−I、RuvC−II、及びRuvC−III)を含むC末端ドメインとを含む。このため、ある場合には、(対象の組成物及び/または方法の)CasXタンパク質は、500〜750アミノ酸(例えば、550〜750、600〜750、640〜750、650〜750、500〜700、550〜700、600〜700、640〜700、650〜700、500〜680、550〜680、600〜680、640〜680、650〜680、500〜670、550〜670、600〜670、640〜670、または650〜670アミノ酸)の範囲の長さを有する(例えば、NLS及び/または触媒能のあるドメインなどのいかなる融合異種配列も含まない)N末端ドメインを有するアミノ酸配列を含む。ある場合には、(対象の組成物及び/または方法の)CasXタンパク質は、スプリットRuvCドメイン(例えば、3つの部分的RuvCドメインRuvC−I、RuvC−II、及びRuvC−III)に対するN末端である、500〜750アミノ酸(例えば、550〜750、600〜750、640〜750、650〜750、500〜700、550〜700、600〜700、640〜700、650〜700、500〜680、550〜680、600〜680、640〜680、650〜680、500〜670、550〜670、600〜670、640〜670、または650〜670アミノ酸)の範囲の長さを有する(例えば、NLS及び/または触媒能のあるドメインなどのいかなる融合異種配列も含まない)アミノ酸配列を含む。
ある場合には、(対象の組成物及び/または方法の)CasXタンパク質は、配列番号1として記載されるCasXタンパク質配列のN末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸1〜663として示されるドメイン)と20%以上の配列同一性(例えば、30%以上、40%以上、50%以上、60%以上、70%以上、80%以上、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。例えば、ある場合には、CasXタンパク質は、配列番号1として記載されるCasXタンパク質配列のN末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸1〜663として示されるドメイン)と50%以上の配列同一性(例えば、60%以上、70%以上、80%以上、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、CasXタンパク質は、配列番号1として記載されるCasXタンパク質配列のN末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸1〜663として示されるドメイン)と80%以上の配列同一性(例えば、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、CasXタンパク質は、配列番号1として記載されるCasXタンパク質配列のN末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸1〜663として示されるドメイン)と90%以上の配列同一性(例えば、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、CasXタンパク質は、配列番号1として記載されるCasXタンパク質配列のアミノ酸1〜663を有するアミノ酸配列を含む。
ある場合には、(対象の組成物及び/または方法の)CasXタンパク質は、配列番号2として記載されるCasXタンパク質配列のN末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸1〜663として示されるドメイン)と20%以上の配列同一性(例えば、30%以上、40%以上、50%以上、60%以上、70%以上、80%以上、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。例えば、ある場合には、CasXタンパク質は、配列番号2として記載されるCasXタンパク質配列のN末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸1〜663として示されるドメイン)と50%以上の配列同一性(例えば、60%以上、70%以上、80%以上、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、CasXタンパク質は、配列番号2として記載されるCasXタンパク質配列のN末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸1〜663として示されるドメイン)と80%以上の配列同一性(例えば、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、CasXタンパク質は、配列番号2として記載されるCasXタンパク質配列のN末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸1〜663として示されるドメイン)と90%以上の配列同一性(例えば、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、CasXタンパク質は、配列番号1として記載されるCasXタンパク質配列のアミノ酸1〜663に対応する配列番号2のアミノ酸配列を含む。
ある場合には、(対象の組成物及び/または方法の)CasXタンパク質は、配列番号3として記載されるCasXタンパク質配列のN末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸1〜663として示されるドメイン)と20%以上の配列同一性(例えば、30%以上、40%以上、50%以上、60%以上、70%以上、80%以上、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。例えば、ある場合には、CasXタンパク質は、配列番号3として記載されるCasXタンパク質配列のN末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸1〜663として示されるドメイン)と50%以上の配列同一性(例えば、60%以上、70%以上、80%以上、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、CasXタンパク質は、配列番号3として記載されるCasXタンパク質配列のN末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸1〜663として示されるドメイン)と80%以上の配列同一性(例えば、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、CasXタンパク質は、配列番号3として記載されるCasXタンパク質配列のN末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸1〜663として示されるドメイン)と90%以上の配列同一性(例えば、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、CasXタンパク質は、配列番号1として記載されるCasXタンパク質配列のアミノ酸1〜663に対応する配列番号3のアミノ酸配列を含む。
ある場合には、(対象の組成物及び/または方法の)CasXタンパク質は、配列番号1及び2として記載されるCasXタンパク質配列のうちのいずれか1つのN末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸1〜663として示されるドメイン)と20%以上の配列同一性(例えば、30%以上、40%以上、50%以上、60%以上、70%以上、80%以上、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。例えば、ある場合には、CasXタンパク質は、配列番号1及び2として記載されるCasXタンパク質配列のうちのいずれか1つのN末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸1〜663として示されるドメイン)と50%以上の配列同一性(例えば、60%以上、70%以上、80%以上、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、CasXタンパク質は、配列番号1及び2として記載されるCasXタンパク質配列のうちのいずれか1つのN末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸1〜663として示されるドメイン)と80%以上の配列同一性(例えば、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、CasXタンパク質は、配列番号1及び2として記載されるCasXタンパク質配列のうちのいずれか1つのN末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸1〜663として示されるドメイン)と90%以上の配列同一性(例えば、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、CasXタンパク質は、配列番号1として記載されるCasXタンパク質配列のアミノ酸1〜663に対応するアミノ酸配列を含む。
ある場合には、(対象の組成物及び/または方法の)CasXタンパク質は、配列番号1及び2として記載されるCasXタンパク質配列のうちのいずれか1つのN末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸1〜663として示されるドメイン)と20%以上の配列同一性(例えば、30%以上、40%以上、50%以上、60%以上、70%以上、80%以上、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有する第1のアミノ酸配列と、スプリットRuv Cドメイン(例えば、3つの部分的RuvCドメインRuvC−I、RuvC−II、及びRuvC−III)を含む、第2のアミノ酸配列(第1のアミノ酸配列に対するC末端)とを含む。例えば、ある場合には、CasXタンパク質は、配列番号1及び2として記載されるCasXタンパク質配列のうちのいずれか1つのN末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸1〜663として示されるドメイン)と50%以上の配列同一性(例えば、60%以上、70%以上、80%以上、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有する第1のアミノ酸配列と、スプリットRuv Cドメイン(例えば、3つの部分的RuvCドメインRuvC−I、RuvC−II、及びRuvC−III)を含む、第2のアミノ酸配列(第1のアミノ酸配列に対するC末端)とを含む。ある場合には、CasXタンパク質は、配列番号1及び2として記載されるCasXタンパク質配列のうちのいずれか1つのN末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸1〜663として示されるドメイン)と80%以上の配列同一性(例えば、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有する第1のアミノ酸配列と、スプリットRuv Cドメイン(例えば、3つの部分的RuvCドメインRuvC−I、RuvC−II、及びRuvC−III)を含む、第2のアミノ酸配列(第1のアミノ酸配列に対するC末端)とを含む。ある場合には、CasXタンパク質は、配列番号1及び2として記載されるCasXタンパク質配列のうちのいずれか1つのN末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸1〜663として示されるドメイン)と90%以上の配列同一性(例えば、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有する第1のアミノ酸配列と、スプリットRuv Cドメイン(例えば、3つの部分的RuvCドメインRuvC−I、RuvC−II、及びRuvC−III)を含む、第2のアミノ酸配列(第1のアミノ酸配列に対するC末端)とを含む。ある場合には、CasXタンパク質は、配列番号1として記載されるCasXタンパク質配列のアミノ酸1〜663に対応するアミノ酸配列(例えば、配列番号2として記載されるCasXタンパク質配列のアミノ酸1〜650)と、スプリットRuv Cドメイン(例えば、3つの部分的RuvCドメインRuvC−I、RuvC−II、及びRuvC−III)を含む、第2のアミノ酸配列(第1のアミノ酸配列に対するC末端)とを含む。
ある場合には、(対象の組成物及び/または方法の)CasXタンパク質は、配列番号1〜3として記載されるCasXタンパク質配列のうちのいずれか1つのN末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸1〜663として示されるドメイン)と20%以上の配列同一性(例えば、30%以上、40%以上、50%以上、60%以上、70%以上、80%以上、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。例えば、ある場合には、CasXタンパク質は、配列番号1〜3として記載されるCasXタンパク質配列のうちのいずれか1つのN末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸1〜663として示されるドメイン)と50%以上の配列同一性(例えば、60%以上、70%以上、80%以上、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、CasXタンパク質は、配列番号1〜3として記載されるCasXタンパク質配列のうちのいずれか1つのN末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸1〜663として示されるドメイン)と80%以上の配列同一性(例えば、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、CasXタンパク質は、配列番号1〜3として記載されるCasXタンパク質配列のうちのいずれか1つのN末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸1〜663として示されるドメイン)と90%以上の配列同一性(例えば、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、CasXタンパク質は、配列番号1として記載されるCasXタンパク質配列のアミノ酸1〜663に対応するアミノ酸配列を含む。
ある場合には、(対象の組成物及び/または方法の)CasXタンパク質は、配列番号1〜3として記載されるCasXタンパク質配列のうちのいずれか1つのN末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸1〜663として示されるドメイン)と20%以上の配列同一性(例えば、30%以上、40%以上、50%以上、60%以上、70%以上、80%以上、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有する第1のアミノ酸配列と、スプリットRuv Cドメイン(例えば、3つの部分的RuvCドメインRuvC−I、RuvC−II、及びRuvC−III)を含む、第2のアミノ酸配列(第1のアミノ酸配列に対するC末端)とを含む。例えば、ある場合には、CasXタンパク質は、配列番号1〜3として記載されるCasXタンパク質配列のうちのいずれか1つのN末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸1〜663として示されるドメイン)と50%以上の配列同一性(例えば、60%以上、70%以上、80%以上、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有する第1のアミノ酸配列と、スプリットRuv Cドメイン(例えば、3つの部分的RuvCドメインRuvC−I、RuvC−II、及びRuvC−III)を含む、第2のアミノ酸配列(第1のアミノ酸配列に対するC末端)とを含む。ある場合には、CasXタンパク質は、配列番号1〜3として記載されるCasXタンパク質配列のうちのいずれか1つのN末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸1〜663として示されるドメイン)と80%以上の配列同一性(例えば、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有する第1のアミノ酸配列と、スプリットRuv Cドメイン(例えば、3つの部分的RuvCドメインRuvC−I、RuvC−II、及びRuvC−III)を含む、第2のアミノ酸配列(第1のアミノ酸配列に対するC末端)とを含む。ある場合には、CasXタンパク質は、配列番号1〜3として記載されるCasXタンパク質配列のうちのいずれか1つのN末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸1〜663として示されるドメイン)と90%以上の配列同一性(例えば、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有する第1のアミノ酸配列と、スプリットRuv Cドメイン(例えば、3つの部分的RuvCドメインRuvC−I、RuvC−II、及びRuvC−III)を含む、第2のアミノ酸配列(第1のアミノ酸配列に対するC末端)とを含む。ある場合には、CasXタンパク質は、配列番号1として記載されるCasXタンパク質配列のアミノ酸1〜663に対応するアミノ酸配列(例えば、配列番号2として記載されるCasXタンパク質配列のアミノ酸1〜650)と、スプリットRuv Cドメイン(例えば、3つの部分的RuvCドメインRuvC−I、RuvC−II、及びRuvC−III)を含む、第2のアミノ酸配列(第1のアミノ酸配列に対するC末端)とを含む。
いくつかの実施形態では、(対象の組成物及び/または方法の)CasXタンパク質のスプリットRuvCドメインは、RuvC−IIIサブドメインよりも大きいRuvC−IIとRuvC−IIIとの間の領域を含む。例えば、ある場合には、RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比は、1.1以上(例えば、1.2)である。ある場合には、RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比は、1超である。)。ある場合には、RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比は、1超及び1〜1.3(例えば、1〜1.2)である。
いくつかの実施形態では(対象の組成物及び/または方法のCasXタンパク質について)、RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインの長さの比は、2以下(例えば、1.8以下、1.7以下、1.6以下、1.5以下、または1.4以下)である。例えば、ある場合には、RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインの長さの比は、1.5以下(例えば、1.4以下)である。いくつかの実施形態では、RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインの長さの比は、1〜2(例えば、1.1〜2、1.2〜2、1〜1.8、1.1〜1.8、1.2〜1.8、1〜1.6、1.1〜1.6、1.2〜1.6、1〜14、1.1〜1.4、または1.2〜1.4)の範囲である。
ある場合には(対象の組成物及び/または方法のCasXタンパク質について)、RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比は、1超である。ある場合には、RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比は、1超及び1〜1.3(例えば、1〜1.2)である。
ある場合には(対象の組成物及び/または方法のCasXタンパク質について)、RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域は、少なくとも73アミノ酸長(例えば、少なくとも75、77、80、85、または87アミノ酸長)である。例えば、ある場合には、RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域は、少なくとも78アミノ酸長(例えば、少なくとも80、85、または87アミノ酸長)である。ある場合には、RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域は、少なくとも85アミノ酸長である。ある場合には、RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域は、75〜100アミノ酸の範囲(例えば、75〜95、75〜90、75〜88、78〜100、78〜95、78〜90、78〜88、80〜100、80〜95、80〜90、80〜88、83〜100、83〜95、83〜90、83〜88、85〜100、85〜95、85〜90、または85〜88アミノ酸の範囲)の長さを有する。ある場合には、RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域は、80〜95アミノ酸の範囲(例えば、80〜90、80〜88、83〜95、83〜90、83〜88、85〜95、85〜90、または85〜88アミノ酸の範囲)の長さを有する。
ある場合には、(対象の組成物及び/または方法の)CasXタンパク質は、配列番号1及び2として記載されるCasXタンパク質配列のうちのいずれか1つのN末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸1〜663として示されるドメイン)と20%以上の配列同一性(例えば、30%以上、40%以上、50%以上、60%以上、70%以上、80%以上、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有する第1のアミノ酸配列と、3つの部分的RuvCドメインRuvC−I、RuvC−II、及びRuvC−IIIを含む、第2のアミノ酸配列(第1のアミノ酸配列に対するC末端)とを含み、(i)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1.1以上(例えば、1.2)であるか、(ii)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1超であるか、(iii)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1超及び1〜1.3(例えば、1〜1.2)であるか、(iv)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、2以下(例えば、1.8以下、1.7以下、1.6以下、1.5以下、もしくは1.4以下)であるか、(v)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインの長さの比が、1.5以下(例えば、1.4以下)であるか、(vi)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインの長さの比が、1〜2(例えば、1.1〜2、1.2〜2、1〜1.8、1.1〜1.8、1.2〜1.8、1〜1.6、1.1〜1.6、1.2〜1.6、1〜14、1.1〜1.4、もしくは1.2〜1.4)の範囲であるか、(vii)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1超であるか、(viii)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1超及び1〜1.3(例えば、1〜1.2)であるか、(ix)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、少なくとも73アミノ酸長(例えば、少なくとも75、77、80、85、もしくは87アミノ酸長)であるか、(x)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、少なくとも78アミノ酸長(例えば、少なくとも80、85、もしくは87アミノ酸長)であるか、(xi)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、少なくとも85アミノ酸長であるか、(x)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、75〜100アミノ酸の範囲(例えば、75〜95、75〜90、75〜88、78〜100、78〜95、78〜90、78〜88、80〜100、80〜95、80〜90、80〜88、83〜100、83〜95、83〜90、83〜88、85〜100、85〜95、85〜90、もしくは85〜88アミノ酸の範囲)の長さを有するか、または(xi)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、80〜95アミノ酸の範囲(例えば、80〜90、80〜88、83〜95、83〜90、83〜88、85〜95、85〜90、もしくは85〜88アミノ酸の範囲)の長さを有する。
例えば、ある場合には、CasXタンパク質は、配列番号1及び2として記載されるCasXタンパク質配列のうちのいずれか1つのN末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸1〜663として示されるドメイン)と50%以上の配列同一性(例えば、60%以上、70%以上、80%以上、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有する第1のアミノ酸配列と、3つの部分的RuvCドメインRuvC−I、RuvC−II、及びRuvC−IIIを含む、第2のアミノ酸配列(第1のアミノ酸配列に対するC末端)とを含み、(i)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1.1以上(例えば、1.2)であるか、(ii)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1超であるか、(iii)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1超及び1〜1.3(例えば、1〜1.2)であるか、(iv)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、2以下(例えば、1.8以下、1.7以下、1.6以下、1.5以下、もしくは1.4以下)であるか、(v)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインの長さの比が、1.5以下(例えば、1.4以下)であるか、(vi)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインの長さの比が、1〜2(例えば、1.1〜2、1.2〜2、1〜1.8、1.1〜1.8、1.2〜1.8、1〜1.6、1.1〜1.6、1.2〜1.6、1〜14、1.1〜1.4、もしくは1.2〜1.4)の範囲であるか、(vii)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1超であるか、(viii)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1超及び1〜1.3(例えば、1〜1.2)であるか、(ix)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、少なくとも73アミノ酸長(例えば、少なくとも75、77、80、85、もしくは87アミノ酸長)であるか、(x)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、少なくとも78アミノ酸長(例えば、少なくとも80、85、もしくは87アミノ酸長)であるか、(xi)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、少なくとも85アミノ酸長であるか、(x)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、75〜100アミノ酸の範囲(例えば、75〜95、75〜90、75〜88、78〜100、78〜95、78〜90、78〜88、80〜100、80〜95、80〜90、80〜88、83〜100、83〜95、83〜90、83〜88、85〜100、85〜95、85〜90、もしくは85〜88アミノ酸の範囲)の長さを有するか、または(xi)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、80〜95アミノ酸の範囲(例えば、80〜90、80〜88、83〜95、83〜90、83〜88、85〜95、85〜90、もしくは85〜88アミノ酸の範囲)の長さを有する。
ある場合には、CasXタンパク質は、配列番号1及び2として記載されるCasXタンパク質配列のうちのいずれか1つのN末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸1〜663として示されるドメイン)と80%以上の配列同一性(例えば、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有する第1のアミノ酸配列と、3つの部分的RuvCドメインRuvC−I、RuvC−II、及びRuvC−IIIを含む、第2のアミノ酸配列(第1のアミノ酸配列に対するC末端)とを含み、(i)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1.1以上(例えば、1.2)であるか、(ii)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1超であるか、(iii)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1超及び1〜1.3(例えば、1〜1.2)であるか、(iv)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、2以下(例えば、1.8以下、1.7以下、1.6以下、1.5以下、もしくは1.4以下)であるか、(v)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインの長さの比が、1.5以下(例えば、1.4以下)であるか、(vi)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインの長さの比が、1〜2(例えば、1.1〜2、1.2〜2、1〜1.8、1.1〜1.8、1.2〜1.8、1〜1.6、1.1〜1.6、1.2〜1.6、1〜14、1.1〜1.4、もしくは1.2〜1.4)の範囲であるか、(vii)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1超であるか、(viii)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1超及び1〜1.3(例えば、1〜1.2)であるか、(ix)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、少なくとも73アミノ酸長(例えば、少なくとも75、77、80、85、もしくは87アミノ酸長)であるか、(x)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、少なくとも78アミノ酸長(例えば、少なくとも80、85、もしくは87アミノ酸長)であるか、(xi)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、少なくとも85アミノ酸長であるか、(x)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、75〜100アミノ酸の範囲(例えば、75〜95、75〜90、75〜88、78〜100、78〜95、78〜90、78〜88、80〜100、80〜95、80〜90、80〜88、83〜100、83〜95、83〜90、83〜88、85〜100、85〜95、85〜90、もしくは85〜88アミノ酸の範囲)の長さを有するか、または(xi)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、80〜95アミノ酸の範囲(例えば、80〜90、80〜88、83〜95、83〜90、83〜88、85〜95、85〜90、もしくは85〜88アミノ酸の範囲)の長さを有する。
ある場合には、CasXタンパク質は、配列番号1及び2として記載されるCasXタンパク質配列のうちのいずれか1つのN末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸1〜663として示されるドメイン)と90%以上の配列同一性(例えば、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有する第1のアミノ酸配列と、3つの部分的RuvCドメインRuvC−I、RuvC−II、及びRuvC−IIIを含む、第2のアミノ酸配列(第1のアミノ酸配列に対するC末端)とを含み、(i)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1.1以上(例えば、1.2)であるか、(ii)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1超であるか、(iii)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1超及び1〜1.3(例えば、1〜1.2)であるか、(iv)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、2以下(例えば、1.8以下、1.7以下、1.6以下、1.5以下、もしくは1.4以下)であるか、(v)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインの長さの比が、1.5以下(例えば、1.4以下)であるか、(vi)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインの長さの比が、1〜2(例えば、1.1〜2、1.2〜2、1〜1.8、1.1〜1.8、1.2〜1.8、1〜1.6、1.1〜1.6、1.2〜1.6、1〜14、1.1〜1.4、もしくは1.2〜1.4)の範囲であるか、(vii)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1超であるか、(viii)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1超及び1〜1.3(例えば、1〜1.2)であるか、(ix)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、少なくとも73アミノ酸長(例えば、少なくとも75、77、80、85、もしくは87アミノ酸長)であるか、(x)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、少なくとも78アミノ酸長(例えば、少なくとも80、85、もしくは87アミノ酸長)であるか、(xi)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、少なくとも85アミノ酸長であるか、(x)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、75〜100アミノ酸の範囲(例えば、75〜95、75〜90、75〜88、78〜100、78〜95、78〜90、78〜88、80〜100、80〜95、80〜90、80〜88、83〜100、83〜95、83〜90、83〜88、85〜100、85〜95、85〜90、もしくは85〜88アミノ酸の範囲)の長さを有するか、または(xi)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、80〜95アミノ酸の範囲(例えば、80〜90、80〜88、83〜95、83〜90、83〜88、85〜95、85〜90、もしくは85〜88アミノ酸の範囲)の長さを有する。
ある場合には、(対象の組成物及び/または方法の)CasXタンパク質は、配列番号1〜3として記載されるCasXタンパク質配列のうちのいずれか1つのN末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸1〜663として示されるドメイン)と20%以上の配列同一性(例えば、30%以上、40%以上、50%以上、60%以上、70%以上、80%以上、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有する第1のアミノ酸配列と、3つの部分的RuvCドメインRuvC−I、RuvC−II、及びRuvC−IIIを含む、第2のアミノ酸配列(第1のアミノ酸配列に対するC末端)とを含み、(i)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1.1以上(例えば、1.2)であるか、(ii)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1超であるか、(iii)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1超及び1〜1.3(例えば、1〜1.2)であるか、(iv)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、2以下(例えば、1.8以下、1.7以下、1.6以下、1.5以下、もしくは1.4以下)であるか、(v)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインの長さの比が、1.5以下(例えば、1.4以下)であるか、(vi)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインの長さの比が、1〜2(例えば、1.1〜2、1.2〜2、1〜1.8、1.1〜1.8、1.2〜1.8、1〜1.6、1.1〜1.6、1.2〜1.6、1〜14、1.1〜1.4、もしくは1.2〜1.4)の範囲であるか、(vii)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1超であるか、(viii)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1超及び1〜1.3(例えば、1〜1.2)であるか、(ix)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、少なくとも73アミノ酸長(例えば、少なくとも75、77、80、85、もしくは87アミノ酸長)であるか、(x)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、少なくとも78アミノ酸長(例えば、少なくとも80、85、もしくは87アミノ酸長)であるか、(xi)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、少なくとも85アミノ酸長であるか、(x)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、75〜100アミノ酸の範囲(例えば、75〜95、75〜90、75〜88、78〜100、78〜95、78〜90、78〜88、80〜100、80〜95、80〜90、80〜88、83〜100、83〜95、83〜90、83〜88、85〜100、85〜95、85〜90、もしくは85〜88アミノ酸の範囲)の長さを有するか、または(xi)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、80〜95アミノ酸の範囲(例えば、80〜90、80〜88、83〜95、83〜90、83〜88、85〜95、85〜90、もしくは85〜88アミノ酸の範囲)の長さを有する。
例えば、ある場合には、CasXタンパク質は、配列番号1〜3として記載されるCasXタンパク質配列のうちのいずれか1つのN末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸1〜663として示されるドメイン)と50%以上の配列同一性(例えば、60%以上、70%以上、80%以上、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有する第1のアミノ酸配列と、3つの部分的RuvCドメインRuvC−I、RuvC−II、及びRuvC−IIIを含む、第2のアミノ酸配列(第1のアミノ酸配列に対するC末端)とを含み、(i)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1.1以上(例えば、1.2)であるか、(ii)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1超であるか、(iii)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1超及び1〜1.3(例えば、1〜1.2)であるか、(iv)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、2以下(例えば、1.8以下、1.7以下、1.6以下、1.5以下、もしくは1.4以下)であるか、(v)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインの長さの比が、1.5以下(例えば、1.4以下)であるか、(vi)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインの長さの比が、1〜2(例えば、1.1〜2、1.2〜2、1〜1.8、1.1〜1.8、1.2〜1.8、1〜1.6、1.1〜1.6、1.2〜1.6、1〜14、1.1〜1.4、もしくは1.2〜1.4)の範囲であるか、(vii)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1超であるか、(viii)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1超及び1〜1.3(例えば、1〜1.2)であるか、(ix)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、少なくとも73アミノ酸長(例えば、少なくとも75、77、80、85、もしくは87アミノ酸長)であるか、(x)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、少なくとも78アミノ酸長(例えば、少なくとも80、85、もしくは87アミノ酸長)であるか、(xi)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、少なくとも85アミノ酸長であるか、(x)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、75〜100アミノ酸の範囲(例えば、75〜95、75〜90、75〜88、78〜100、78〜95、78〜90、78〜88、80〜100、80〜95、80〜90、80〜88、83〜100、83〜95、83〜90、83〜88、85〜100、85〜95、85〜90、もしくは85〜88アミノ酸の範囲)の長さを有するか、または(xi)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、80〜95アミノ酸の範囲(例えば、80〜90、80〜88、83〜95、83〜90、83〜88、85〜95、85〜90、もしくは85〜88アミノ酸の範囲)の長さを有する。
ある場合には、CasXタンパク質は、配列番号1〜3として記載されるCasXタンパク質配列のうちのいずれか1つのN末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸1〜663として示されるドメイン)と80%以上の配列同一性(例えば、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有する第1のアミノ酸配列と、3つの部分的RuvCドメインRuvC−I、RuvC−II、及びRuvC−IIIを含む、第2のアミノ酸配列(第1のアミノ酸配列に対するC末端)とを含み、(i)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1.1以上(例えば、1.2)であるか、(ii)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1超であるか、(iii)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1超及び1〜1.3(例えば、1〜1.2)であるか、(iv)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、2以下(例えば、1.8以下、1.7以下、1.6以下、1.5以下、もしくは1.4以下)であるか、(v)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインの長さの比が、1.5以下(例えば、1.4以下)であるか、(vi)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインの長さの比が、1〜2(例えば、1.1〜2、1.2〜2、1〜1.8、1.1〜1.8、1.2〜1.8、1〜1.6、1.1〜1.6、1.2〜1.6、1〜14、1.1〜1.4、もしくは1.2〜1.4)の範囲であるか、(vii)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1超であるか、(viii)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1超及び1〜1.3(例えば、1〜1.2)であるか、(ix)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、少なくとも73アミノ酸長(例えば、少なくとも75、77、80、85、もしくは87アミノ酸長)であるか、(x)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、少なくとも78アミノ酸長(例えば、少なくとも80、85、もしくは87アミノ酸長)であるか、(xi)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、少なくとも85アミノ酸長であるか、(x)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、75〜100アミノ酸の範囲(例えば、75〜95、75〜90、75〜88、78〜100、78〜95、78〜90、78〜88、80〜100、80〜95、80〜90、80〜88、83〜100、83〜95、83〜90、83〜88、85〜100、85〜95、85〜90、もしくは85〜88アミノ酸の範囲)の長さを有するか、または(xi)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、80〜95アミノ酸の範囲(例えば、80〜90、80〜88、83〜95、83〜90、83〜88、85〜95、85〜90、もしくは85〜88アミノ酸の範囲)の長さを有する。
ある場合には、CasXタンパク質は、配列番号1〜3として記載されるCasXタンパク質配列のうちのいずれか1つのN末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸1〜663として示されるドメイン)と90%以上の配列同一性(例えば、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有する第1のアミノ酸配列と、3つの部分的RuvCドメインRuvC−I、RuvC−II、及びRuvC−IIIを含む、第2のアミノ酸配列(第1のアミノ酸配列に対するC末端)とを含み、(i)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1.1以上(例えば、1.2)であるか、(ii)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1超であるか、(iii)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1超及び1〜1.3(例えば、1〜1.2)であるか、(iv)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、2以下(例えば、1.8以下、1.7以下、1.6以下、1.5以下、もしくは1.4以下)であるか、(v)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインの長さの比が、1.5以下(例えば、1.4以下)であるか、(vi)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインの長さの比が、1〜2(例えば、1.1〜2、1.2〜2、1〜1.8、1.1〜1.8、1.2〜1.8、1〜1.6、1.1〜1.6、1.2〜1.6、1〜14、1.1〜1.4、もしくは1.2〜1.4)の範囲であるか、(vii)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1超であるか、(viii)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1超及び1〜1.3(例えば、1〜1.2)であるか、(ix)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、少なくとも73アミノ酸長(例えば、少なくとも75、77、80、85、もしくは87アミノ酸長)であるか、(x)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、少なくとも78アミノ酸長(例えば、少なくとも80、85、もしくは87アミノ酸長)であるか、(xi)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、少なくとも85アミノ酸長であるか、(x)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、75〜100アミノ酸の範囲(例えば、75〜95、75〜90、75〜88、78〜100、78〜95、78〜90、78〜88、80〜100、80〜95、80〜90、80〜88、83〜100、83〜95、83〜90、83〜88、85〜100、85〜95、85〜90、もしくは85〜88アミノ酸の範囲)の長さを有するか、または(xi)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、80〜95アミノ酸の範囲(例えば、80〜90、80〜88、83〜95、83〜90、83〜88、85〜95、85〜90、もしくは85〜88アミノ酸の範囲)の長さを有する。
ある場合には、CasXタンパク質は、配列番号1として記載されるCasXタンパク質配列のアミノ酸1〜663に対応するアミノ酸配列(例えば、配列番号2として記載されるCasXタンパク質配列のアミノ酸1〜650)と、3つの部分的RuvCドメインRuvC−I、RuvC−II、及びRuvC−IIIを含む、第2のアミノ酸配列(第1のアミノ酸配列に対するC末端)とを含み、(i)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1.1以上(例えば、1.2)であるか、(ii)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1超であるか、(iii)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1超及び1〜1.3(例えば、1〜1.2)であるか、(iv)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、2以下(例えば、1.8以下、1.7以下、1.6以下、1.5以下、もしくは1.4以下)であるか、(v)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインの長さの比が、1.5以下(例えば、1.4以下)であるか、(vi)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインの長さの比が、1〜2(例えば、1.1〜2、1.2〜2、1〜1.8、1.1〜1.8、1.2〜1.8、1〜1.6、1.1〜1.6、1.2〜1.6、1〜14、1.1〜1.4、もしくは1.2〜1.4)の範囲であるか、(vii)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1超であるか、(viii)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1超及び1〜1.3(例えば、1〜1.2)であるか、(ix)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、少なくとも73アミノ酸長(例えば、少なくとも75、77、80、85、もしくは87アミノ酸長)であるか、(x)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、少なくとも78アミノ酸長(例えば、少なくとも80、85、もしくは87アミノ酸長)であるか、(xi)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、少なくとも85アミノ酸長であるか、(x)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、75〜100アミノ酸の範囲(例えば、75〜95、75〜90、75〜88、78〜100、78〜95、78〜90、78〜88、80〜100、80〜95、80〜90、80〜88、83〜100、83〜95、83〜90、83〜88、85〜100、85〜95、85〜90、もしくは85〜88アミノ酸の範囲)の長さを有するか、または(xi)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、80〜95アミノ酸の範囲(例えば、80〜90、80〜88、83〜95、83〜90、83〜88、85〜95、85〜90、もしくは85〜88アミノ酸の範囲)の長さを有する。
ある場合には、(対象の組成物及び/または方法の)CasXタンパク質は、500〜750アミノ酸(例えば、550〜750、600〜750、640〜750、650〜750、500〜700、550〜700、600〜700、640〜700、650〜700、500〜680、550〜680、600〜680、640〜680、650〜680、500〜670、550〜670、600〜670、640〜670、または650〜670アミノ酸)の範囲の長さを有するN末端ドメインを有する(例えば、NLS及び/または触媒能のあるドメインなどのいかなる融合異種配列も含まない)第1のアミノ酸配列と、3つの部分的RuvCドメインRuvC−I、RuvC−II、及びRuvC−IIIを有するスプリットRuvCドメインを有する第2のアミノ酸配列(第1に対するC末端)とを含み、(i)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1.1以上(例えば、1.2)であるか、(ii)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1超であるか、(iii)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1超及び1〜1.3(例えば、1〜1.2)であるか、(iv)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメイン長さの比が、2以下(例えば、1.8以下、1.7以下、1.6以下、1.5以下、もしくは1.4以下)であるか、(v)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインの長さの比が、1.5以下(例えば、1.4以下)であるか、(vi)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインの長さの比が、1〜2(例えば、1.1〜2、1.2〜2、1〜1.8、1.1〜1.8、1.2〜1.8、1〜1.6、1.1〜1.6、1.2〜1.6、1〜14、1.1〜1.4、もしくは1.2〜1.4)の範囲であるか、(vii)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1超であるか、(viii)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1超及び1〜1.3(例えば、1〜1.2)であるか、(ix)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、少なくとも73アミノ酸長(例えば、少なくとも75、77、80、85、もしくは87アミノ酸長)であるか、(x)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、少なくとも78アミノ酸長(例えば、少なくとも80、85、もしくは87アミノ酸長)であるか、(xi)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、少なくとも85アミノ酸長であるか、(x)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、75〜100アミノ酸の範囲(例えば、75〜95、75〜90、75〜88、78〜100、78〜95、78〜90、78〜88、80〜100、80〜95、80〜90、80〜88、83〜100、83〜95、83〜90、83〜88、85〜100、85〜95、85〜90、もしくは85〜88アミノ酸の範囲)の長さを有するか、または(xi)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、80〜95アミノ酸の範囲(例えば、80〜90、80〜88、83〜95、83〜90、83〜88、85〜95、85〜90、もしくは85〜88アミノ酸の範囲)の長さを有する。
ある場合には、(対象の組成物及び/または方法の)CasXタンパク質は、3つの部分的RuvCドメインRuvC−I、RuvC−II、及びRuvC−IIIを有するスプリットRuvCドメインに対するN末端である、500〜750アミノ酸(例えば、550〜750、600〜750、640〜750、650〜750、500〜700、550〜700、600〜700、640〜700、650〜700、500〜680、550〜680、600〜680、640〜680、650〜680、500〜670、550〜670、600〜670、640〜670、または650〜670アミノ酸)の範囲の長さを有する(例えば、NLS及び/または触媒能のあるドメインなどのいかなる融合異種配列も含まない)第1のアミノ酸配列を含み、(i)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1.1以上(例えば、1.2)であるか、(ii)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1超であるか、(iii)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1超及び1〜1.3(例えば、1〜1.2)であるか、(iv)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、2以下(例えば、1.8以下、1.7以下、1.6以下、1.5以下、もしくは1.4以下)であるか、(v)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインの長さの比が、1.5以下(例えば、1.4以下)であるか、(vi)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインの長さの比が、1〜2(例えば、1.1〜2、1.2〜2、1〜1.8、1.1〜1.8、1.2〜1.8、1〜1.6、1.1〜1.6、1.2〜1.6、1〜14、1.1〜1.4、もしくは1.2〜1.4)の範囲であるか、(vii)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1超であるか、(viii)RuvC−IIIサブドメインの長さに対するRuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域の長さの比が、1超及び1〜1.3(例えば、1〜1.2)であるか、(ix)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、少なくとも73アミノ酸長(例えば、少なくとも75、77、80、85、もしくは87アミノ酸長)であるか、(x)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、少なくとも78アミノ酸長(例えば、少なくとも80、85、もしくは87アミノ酸長)であるか、(xi)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、少なくとも85アミノ酸長であるか、(x)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、75〜100アミノ酸の範囲(例えば、75〜95、75〜90、75〜88、78〜100、78〜95、78〜90、78〜88、80〜100、80〜95、80〜90、80〜88、83〜100、83〜95、83〜90、83〜88、85〜100、85〜95、85〜90、もしくは85〜88アミノ酸の範囲)の長さを有するか、または(xi)RuvC−IIサブドメインとRuvC−IIIサブドメインとの間の領域が、80〜95アミノ酸の範囲(例えば、80〜90、80〜88、83〜95、83〜90、83〜88、85〜95、85〜90、もしくは85〜88アミノ酸の範囲)の長さを有する。
ある場合には、(対象の組成物及び/または方法の)CasXタンパク質は、配列番号1として記載されるCasXタンパク質配列のC末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸664〜986として示されるドメイン)と20%以上の配列同一性(例えば、30%以上、40%以上、50%以上、60%以上、70%以上、80%以上、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。例えば、ある場合には、CasXタンパク質は、配列番号1として記載されるCasXタンパク質配列のC末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸664〜986として示されるドメイン)と50%以上の配列同一性(例えば、60%以上、70%以上、80%以上、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、CasXタンパク質は、配列番号1として記載されるCasXタンパク質配列のC末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸664〜986として示されるドメイン)と80%以上の配列同一性(例えば、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、CasXタンパク質は、配列番号1として記載されるCasXタンパク質配列のC末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸664〜986として示されるドメイン)と90%以上の配列同一性(例えば、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、CasXタンパク質は、配列番号1として記載されるCasXタンパク質配列のアミノ酸664〜986を有するアミノ酸配列を含む。
ある場合には、(対象の組成物及び/または方法の)CasXタンパク質は、配列番号2として記載されるCasXタンパク質配列のC末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸664〜986として示されるドメイン)と20%以上の配列同一性(例えば、30%以上、40%以上、50%以上、60%以上、70%以上、80%以上、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。例えば、ある場合には、CasXタンパク質は、配列番号2として記載されるCasXタンパク質配列のC末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸664〜986として示されるドメイン)と50%以上の配列同一性(例えば、60%以上、70%以上、80%以上、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、CasXタンパク質は、配列番号2として記載されるCasXタンパク質配列のC末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸664〜986として示されるドメイン)と80%以上の配列同一性(例えば、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、CasXタンパク質は、配列番号2として記載されるCasXタンパク質配列のC末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸664〜986として示されるドメイン)と90%以上の配列同一性(例えば、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、CasXタンパク質は、配列番号1として記載されるCasXタンパク質配列のアミノ酸664〜986に対応する配列番号2のアミノ酸配列を含む。
ある場合には、(対象の組成物及び/または方法の)CasXタンパク質は、配列番号3として記載されるCasXタンパク質配列のC末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸664〜986として示されるドメイン)と20%以上の配列同一性(例えば、30%以上、40%以上、50%以上、60%以上、70%以上、80%以上、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。例えば、ある場合には、CasXタンパク質は、配列番号3として記載されるCasXタンパク質配列のC末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸664〜986として示されるドメイン)と50%以上の配列同一性(例えば、60%以上、70%以上、80%以上、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、CasXタンパク質は、配列番号3として記載されるCasXタンパク質配列のC末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸664〜986として示されるドメイン)と80%以上の配列同一性(例えば、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、CasXタンパク質は、配列番号3として記載されるCasXタンパク質配列のC末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸664〜986として示されるドメイン)と90%以上の配列同一性(例えば、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、CasXタンパク質は、配列番号1として記載されるCasXタンパク質配列のアミノ酸664〜986に対応する配列番号3のアミノ酸配列を含む。
ある場合には、(対象の組成物及び/または方法の)CasXタンパク質は、配列番号1及び2として記載されるCasXタンパク質配列のうちのいずれか1つのC末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸664〜986として示されるドメイン)と20%以上の配列同一性(例えば、30%以上、40%以上、50%以上、60%以上、70%以上、80%以上、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列(例えば、配列番号2として記載されるCasXタンパク質配列のアミノ酸651〜978)を含む。例えば、ある場合には、CasXタンパク質は、配列番号1及び2として記載されるCasXタンパク質配列のうちのいずれか1つのC末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸664〜986として示されるドメイン)と50%以上の配列同一性(例えば、60%以上、70%以上、80%以上、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、CasXタンパク質は、配列番号1及び2として記載されるCasXタンパク質配列のうちのいずれか1つのC末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸664〜986として示されるドメイン)と80%以上の配列同一性(例えば、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、CasXタンパク質は、配列番号1及び2として記載されるCasXタンパク質配列のうちのいずれか1つのC末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸664〜986として示されるドメイン)と90%以上の配列同一性(例えば、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、CasXタンパク質は、配列番号1として記載されるCasXタンパク質配列のアミノ酸664〜986に対応するアミノ酸配列(例えば、配列番号2として記載されるCasXタンパク質配列のアミノ酸651〜978)を含む。
ある場合には、(対象の組成物及び/または方法の)CasXタンパク質は、500〜750アミノ酸(例えば、550〜750、600〜750、640〜750、650〜750、500〜700、550〜700、600〜700、640〜700、650〜700、500〜680、550〜680、600〜680、640〜680、650〜680、500〜670、550〜670、600〜670、640〜670、または650〜670アミノ酸)の範囲の長さを有する第1のアミノ酸配列(N末端ドメイン)(例えば、NLS及び/または触媒能のあるドメインなどのいかなる融合異種配列も含まない)と、配列番号1及び2として記載されるCasXタンパク質配列のうちのいずれか1つのC末端ドメイン(例えば、図3、パネルAにおけるCasX1のアミノ酸664〜986として示されるドメイン)と20%以上の配列同一性(例えば、30%以上、40%以上、50%以上、60%以上、70%以上、80%以上、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有する、第1のアミノ酸配列に対してC末端に位置付けられた第2のアミノ酸配列(例えば、配列番号2として記載されるCasXタンパク質配列のアミノ酸651〜978)とを含む。例えば、ある場合には、CasXタンパク質は、500〜750アミノ酸(例えば、550〜750、600〜750、640〜750、650〜750、500〜700、550〜700、600〜700、640〜700、650〜700、500〜680、550〜680、600〜680、640〜680、650〜680、500〜670、550〜670、600〜670、640〜670、または650〜670アミノ酸)の範囲の長さを有する第1のアミノ酸配列(N末端ドメイン)(例えば、NLS及び/または触媒能のあるドメインなどのいかなる融合異種配列も含まない)と、配列番号1及び2として記載されるCasXタンパク質配列のうちのいずれか1つのC末端ドメイン(例えば、図3、パネルAにおけるCasX1のアミノ酸664〜986として示されるドメイン)と50%以上の配列同一性(例えば、60%以上、70%以上、80%以上、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有する、第1のアミノ酸配列に対してC末端に位置付けられた第2のアミノ酸配列とを含む。ある場合には、CasXタンパク質は、500〜750アミノ酸(例えば、550〜750、600〜750、640〜750、650〜750、500〜700、550〜700、600〜700、640〜700、650〜700、500〜680、550〜680、600〜680、640〜680、650〜680、500〜670、550〜670、600〜670、640〜670、または650〜670アミノ酸)の範囲の長さを有する第1のアミノ酸配列(N末端ドメイン)(例えば、NLS及び/または触媒能のあるドメインなどのいかなる融合異種配列も含まない)と、配列番号1及び2として記載されるCasXタンパク質配列のうちのいずれか1つのC末端ドメイン(例えば、図3、パネルAにおけるCasX1のアミノ酸664〜986として示されるドメイン)と80%以上の配列同一性(例えば、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有する、第1のアミノ酸配列に対してC末端に位置付けられた第2のアミノ酸配列とを含む。ある場合には、CasXタンパク質は、500〜750アミノ酸(例えば、550〜750、600〜750、640〜750、650〜750、500〜700、550〜700、600〜700、640〜700、650〜700、500〜680、550〜680、600〜680、640〜680、650〜680、500〜670、550〜670、600〜670、640〜670、または650〜670アミノ酸)の範囲の長さを有する第1のアミノ酸配列(N末端ドメイン)(例えば、NLS及び/または触媒能のあるドメインなどのいかなる融合異種配列も含まない)と、配列番号1及び2として記載されるCasXタンパク質配列のうちのいずれか1つのC末端ドメイン(例えば、図3、パネルAにおけるCasX1のアミノ酸664〜986として示されるドメイン)と90%以上の配列同一性(例えば、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有する、第1のアミノ酸配列に対してC末端に位置付けられた第2のアミノ酸配列とを含む。ある場合には、CasXタンパク質は、500〜750アミノ酸(例えば、550〜750、600〜750、640〜750、650〜750、500〜700、550〜700、600〜700、640〜700、650〜700、500〜680、550〜680、600〜680、640〜680、650〜680、500〜670、550〜670、600〜670、640〜670、または650〜670アミノ酸)の範囲の長さを有する第1のアミノ酸配列(N末端ドメイン)(例えば、NLS及び/または触媒能のあるドメインなどのいかなる融合異種配列も含まない)と、配列番号1として記載されるCasXタンパク質配列のアミノ酸664〜986に対応するアミノ酸配列(例えば、配列番号2として記載されるCasXタンパク質配列のアミノ酸651〜978)を有する、第1のアミノ酸配列に対してC末端に位置付けられた第2のアミノ酸配列とを含む。
ある場合には、(対象の組成物及び/または方法の)CasXタンパク質は、配列番号1〜3として記載されるCasXタンパク質配列のうちのいずれか1つのC末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸664〜986として示されるドメイン)と20%以上の配列同一性(例えば、30%以上、40%以上、50%以上、60%以上、70%以上、80%以上、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列(配列番号2として記載されるCasXタンパク質配列のアミノ酸651〜978)を含む。例えば、ある場合には、CasXタンパク質は、配列番号1〜3として記載されるCasXタンパク質配列のうちのいずれか1つのC末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸664〜986として示されるドメイン)と50%以上の配列同一性(例えば、60%以上、70%以上、80%以上、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、CasXタンパク質は、配列番号1〜3として記載されるCasXタンパク質配列のうちのいずれか1つのC末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸664〜986として示されるドメイン)と80%以上の配列同一性(例えば、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、CasXタンパク質は、配列番号1〜3として記載されるCasXタンパク質配列のうちのいずれか1つのC末端ドメイン(例えば、図3、パネルAにおいてCasX1のアミノ酸664〜986として示されるドメイン)と90%以上の配列同一性(例えば、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、CasXタンパク質は、配列番号1として記載されるCasXタンパク質配列のアミノ酸664〜986に対応するアミノ酸配(例えば、配列番号2として記載されるCasXタンパク質配列のアミノ酸651〜978)を含む。
ある場合には、(対象の組成物及び/または方法の)CasXタンパク質は、500〜750アミノ酸(例えば、550〜750、600〜750、640〜750、650〜750、500〜700、550〜700、600〜700、640〜700、650〜700、500〜680、550〜680、600〜680、640〜680、650〜680、500〜670、550〜670、600〜670、640〜670、または650〜670アミノ酸)の範囲の長さを有する第1のアミノ酸配列(N末端ドメイン)(例えば、NLS及び/または触媒能のあるドメインなどのいかなる融合異種配列も含まない)と、配列番号1〜3として記載されるCasXタンパク質配列のうちのいずれか1つのC末端ドメイン(例えば、図3、パネルAにおけるCasX1のアミノ酸664〜986として示されるドメイン)と20%以上の配列同一性(例えば、30%以上、40%以上、50%以上、60%以上、70%以上、80%以上、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有する、第1のアミノ酸配列に対してC末端に位置付けられた第2のアミノ酸配列(例えば、配列番号2として記載されるCasXタンパク質配列のアミノ酸651〜978)とを含む。例えば、ある場合には、CasXタンパク質は、500〜750アミノ酸(例えば、550〜750、600〜750、640〜750、650〜750、500〜700、550〜700、600〜700、640〜700、650〜700、500〜680、550〜680、600〜680、640〜680、650〜680、500〜670、550〜670、600〜670、640〜670、または650〜670アミノ酸)の範囲の長さを有する第1のアミノ酸配列(N末端ドメイン)(例えば、NLS及び/または触媒能のあるドメインなどのいかなる融合異種配列も含まない)と、配列番号1〜3として記載されるCasXタンパク質配列のうちのいずれか1つのC末端ドメイン(例えば、図3、パネルAにおけるCasX1のアミノ酸664〜986として示されるドメイン)と50%以上の配列同一性(例えば、60%以上、70%以上、80%以上、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有する、第1のアミノ酸配列に対してC末端に位置付けられた第2のアミノ酸配列とを含む。ある場合には、CasXタンパク質は、500〜750アミノ酸(例えば、550〜750、600〜750、640〜750、650〜750、500〜700、550〜700、600〜700、640〜700、650〜700、500〜680、550〜680、600〜680、640〜680、650〜680、500〜670、550〜670、600〜670、640〜670、または650〜670アミノ酸)の範囲の長さを有する第1のアミノ酸配列(N末端ドメイン)(例えば、NLS及び/または触媒能のあるドメインなどのいかなる融合異種配列も含まない)と、配列番号1〜3として記載されるCasXタンパク質配列のうちのいずれか1つのC末端ドメイン(例えば、図3、パネルAにおけるCasX1のアミノ酸664〜986として示されるドメイン)と80%以上の配列同一性(例えば、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有する、第1のアミノ酸配列に対してC末端に位置付けられた第2のアミノ酸配列とを含む。ある場合には、CasXタンパク質は、500〜750アミノ酸(例えば、550〜750、600〜750、640〜750、650〜750、500〜700、550〜700、600〜700、640〜700、650〜700、500〜680、550〜680、600〜680、640〜680、650〜680、500〜670、550〜670、600〜670、640〜670、または650〜670アミノ酸)の範囲の長さを有する第1のアミノ酸配列(N末端ドメイン)(例えば、NLS及び/または触媒能のあるドメインなどのいかなる融合異種配列も含まない)と、配列番号1〜3として記載されるCasXタンパク質配列のうちのいずれか1つのC末端ドメイン(例えば、図3、パネルAにおけるCasX1のアミノ酸664〜986として示されるドメイン)と90%以上の配列同一性(例えば、95%以上、97%以上、98%以上、99%以上、または100%の配列同一性)を有する、第1のアミノ酸配列に対してC末端に位置付けられた第2のアミノ酸配列とを含む。ある場合には、CasXタンパク質は、500〜750アミノ酸(例えば、550〜750、600〜750、640〜750、650〜750、500〜700、550〜700、600〜700、640〜700、650〜700、500〜680、550〜680、600〜680、640〜680、650〜680、500〜670、550〜670、600〜670、640〜670、または650〜670アミノ酸)の範囲の長さを有する第1のアミノ酸配列(N末端ドメイン)(例えば、NLS及び/または触媒能のあるドメインなどのいかなる融合異種配列も含まない)と、配列番号1として記載されるCasXタンパク質配列のアミノ酸664〜986に対応するアミノ酸配列(例えば、配列番号2として記載されるCasXタンパク質配列のアミノ酸651〜978)を有する、第1のアミノ酸配列に対してC末端に位置付けられた第2のアミノ酸配列とを含む。
CasX変異形
変異形CasXタンパク質は、対応する野生型CasXタンパク質のアミノ酸配列と比較したときに、少なくとも1つのアミノ酸が異なる(例えば、欠失、挿入、置換、融合を有する)アミノ酸配列を有する。二本鎖標的核酸の一方の鎖を切断するが、もう一方は切断しないCasXタンパク質は、本明細書では「ニッカーゼ」(例えば、「ニッカーゼCasX」)と称される。実質的にヌクレアーゼ活性を有しないCasXタンパク質は、本明細書では不活性型CasXタンパク質(「dCasX」)と称される(但し、ヌクレアーゼ活性は、キメラCasXタンパク質の場合、以下でさらに詳述される異種ポリペプチド−融合パートナーによって提供され得る)。本明細書に記載されるCasX変異形タンパク質(例えば、ニッカーゼCasX、dCasX、キメラCasX)のうちのいずれかについて、CasX変異形は、上記と同じパラメータ(例えば、存在するドメイン、同一性のパーセント等)を有するCasXタンパク質配列を含み得る。
変異形−触媒能
ある場合には、CasXタンパク質は、例えば、天然に存在する触媒能のある配列に対して突然変異された変異形CasXタンパク質であり、対応する天然に存在する配列と比較したときに、低減された切断活性を呈する(例えば、90%以下、80%以下、70%以下、60%以下、50%以下、40%以下、または30%以下の切断活性を呈する)。ある場合には、そのような変異形CasXタンパク質は、触媒的に「不活性型」タンパク質であり(実質的に切断活性を有しない)、「dCasX」と称され得る。ある場合には、変異形CasXタンパク質は、ニッカーゼである(二本鎖標的核酸、例えば、二本鎖標的DNAの一本鎖のみを切断する)。本明細書で詳細に記載されるように、ある場合には、CasXタンパク質(ある場合には、野生型切断活性を有するCasXタンパク質、またある場合には、低減した切断活性を有する変異形CasX、例えば、dCasXまたはニッカーゼCasX)は、融合タンパク質(キメラCasXタンパク質)を形成するために関心対象の活性(例えば、関心対象の触媒能)を有する異種ポリペプチドに融合(共役)される。
CasXの保存触媒残基は、CasX1(配列番号1)に従って番号を付けたとき、D672、E769、D935を含み、CasX2(配列番号2)に従って番号を付けたとき、659D、756E、及び922Dを含む(これらの残基は、図1において下線が引かれている)。(図2のアラインメントにおいて、番号付けは、いずれかのCasXを追跡しないが、代わりにアラインメント自体を追跡することに留意されたい。このパラグラフにおいて上記の保存残基は、図にマークされ、CasX2は、上の配列(「gwc2」)であり、CasX1は、下の配列(「gwa2」)である)。
このため、ある場合には、CasXタンパク質は、低減された活性を有し、上記のアミノ酸のうちの1つ以上(または任意のCasXタンパク質の1つ以上の対応するアミノ酸)は、突然変異される(例えば、アラニンで置換される)。ある場合には、変異形CasXタンパク質は、触媒「不活性型」タンパク質であり(触媒能がなく)、「dCasX」と称される。dCasXタンパク質は、活性を提供する融合パートナーに融合され得、ある場合には、dCasX(例えば、触媒能を提供するが、真核細胞中で発現されるとき、NLSを有し得る融合パートナーがないもの)は、標的DNAに結合することができ、RNAポリメラーゼを標的DNAから翻訳するのを遮断することができる。ある場合には、変異形CasXタンパク質は、ニッカーゼである(二本鎖標的核酸、例えば、二本鎖標的DNAの一方の鎖のみを切断する)。
変異形−キメラCasX(すなわち、融合タンパク質)
上記のように、ある場合には、CasXタンパク質(ある場合には、野生型切断活性を有するCasXタンパク質、またある場合には、低減した切断活性を有する変異形CasX、例えば、dCasXまたはニッカーゼCasX)は、融合タンパク質(キメラCasXタンパク質)を形成するために関心対象の活性(例えば、関心対象の触媒能)を有する異種ポリペプチドに融合(共役)される。CasXタンパク質が融合され得る異種ポリペプチドは、本明細書では「融合パートナー」と称される。
ある場合には、融合パートナーは、標的DNAの転写を変調する(例えば、転写を阻害する、転写を増加する)ことができる。例えば、ある場合には、融合パートナーは、転写を阻害するタンパク質(またはタンパク質からのドメイン)(例えば、転写抑制因子、転写阻害剤タンパク質の動員、メチル化などの標的DNAの修飾、DNA修飾因子の動員、標的DNAに関連したヒストンの変調、ヒストンのアセチル化及び/またはメチル化を修飾するものなどのヒストン修飾因子の動員等を介して機能するタンパク質)である。ある場合には、融合パートナーは、転写を増加させるタンパク質(またはタンパク質からのドメイン)(例えば、転写活性化因子、転写活性化因子タンパク質の動員、メチル化などの標的DNAの修飾、DNA修飾因子の動員、標的DNAに関連したヒストンの変調、ヒストンのアセチル化及び/またはメチル化を修飾するものなどのヒストン修飾因子の動員等を介して機能するタンパク質)である。
ある場合には、キメラCasXタンパク質は、標的核酸を修飾する酵素活性(例えば、ヌクレアーゼ活性、メチルトランスフェラーゼ活性、デメチラーゼ活性、DNA修復活性、DNA損傷活性、脱アミノ化活性、ジスムターゼ活性、アルキル化活性、脱プリン化活性、酸化活性、ピリミジン二量体形成活性、インテグラーゼ活性、トランスポザーゼ活性、リコンビナーゼ活性、ポリメラーゼ活性、リガーゼ活性、ヘリカーゼ活性、フォトリアーゼ活性、またはグリコシラーゼ活性)を有する異種ポリペプチドを含む。
ある場合には、キメラCasXタンパク質は、標的核酸に関連したポリペプチド(例えば、ヒストン)を修飾する酵素活性(例えば、メチルトランスフェラーゼ活性、デメチラーゼ活性、アセチルトランスフェラーゼ活性、デアセチラーゼ活性、キナーゼ活性、ホスファターゼ活性、ユビキチンリガーゼ活性、脱ユビキチン化活性、アデニル化活性、脱アデニル化活性、SUMO化活性、脱SUMO化活性、リボシル化活性、脱リボシル化活性、ミリストイル化活性、または脱ミリストイル化活性)を有する異種ポリペプチドを含む。
転写の増加に使用され得るタンパク質(またはその断片)の例としては、VP16、VP64、VP48、VP160、p65サブドメイン(例えば、NFkBから)などの転写活性化因子、ならびにEDLLの活性化ドメイン及び/またはTAL活性化ドメイン(例えば、植物における活性のため);ヒストンリジンメチルトランスフェラーゼ(例えば、SET1A、SET1B、MLL1〜5、ASH1、SYMD2、NSD1等);ヒストンリジンデメチラーゼ(例えば、JHDM2a/b、UTX、JMJD3等);ヒストンアセチルトランスフェラーゼ(例えば、GCN5、PCAF、CBP、p300、TAF1、TIP60/PLIP、MOZ/MYST3、MORF/MYST4、SRC1、ACTR、P160、CLOCK等);ならびにDNAデメチラーゼ(例えば、Ten−Eleven Translocation(TET)ジオキシゲナーゼ1(TET1CD)、TET1、DME、DML1、DML2、ROS1等が挙げられるが、これらに限定されない。
転写の減少に使用され得るタンパク質(またはその断片)の例としては、Kruppel関連ボックス(KRABまたはSKD)などの転写抑制因子;KOX1抑制ドメイン;Mad mSIN3相互作用ドメイン(SID);ERF抑制因子ドメイン(ERD)、SRDX抑制ドメイン(例えば、植物における抑制のため)等;ヒストンリジンメチルトランスフェラーゼ(例えば、Pr−SET7/8、SUV4−20H1、RIZ1等);ヒストンリジンデメチラーゼ(例えば、JMJD2A/JHDM3A、JMJD2B、JMJD2C/GASC1、JMJD2D、JARID1A/RBP2、JARID1B/PLU−1、JARID1C/SMCX、JARID1D/SMCY等);ヒストンリジンデアセチラーゼ(例えば、HDAC1、HDAC2、HDAC3、HDAC8、HDAC4、HDAC5、HDAC7、HDAC9、SIRT1、SIRT2、HDAC11等);DNAメチラーゼ(例えば、HhaI DNA m5c−メチルトランスフェラーゼ(M.HhaI)、DNAメチルトランスフェラーゼ1(DNMT1)、DNAメチルトランスフェラーゼ3a(DNMT3a)、DNAメチルトランスフェラーゼ3b(DNMT3b)、METI、DRM3(植物)、ZMET2、CMT1、CMT2(植物)等);及び末梢動員要素(例えば、Lamin A、Lamin B等)が挙げられるが、これらに限定されない。
ある場合には、融合パートナーは、標的核酸(例えば、ssRNA、dsRNA、ssDNA、dsDNA)を修飾する酵素活性を有する。融合パートナーによって提供され得る酵素活性の例としては、制限酵素(例えば、FokIヌクレアーゼ)によって提供されるものなどのヌクレアーゼ活性、メチルトランスフェラーゼ(例えば、HhaI DNA m5c−メチルトランスフェラーゼ(M.HhaI)、DNAメチルトランスフェラーゼ1(DNMT1)、DNAメチルトランスフェラーゼ3a(DNMT3a)、DNAメチルトランスフェラーゼ3b(DNMT3b)、METI、DRM3(植物)、ZMET2、CMT1、CMT2(植物)等)によって提供されるものなどのメチルトランスフェラーゼ活性;デメチラーゼ(例えば、Ten−Eleven Translocation(TET)ジオキシゲナーゼ1(TET1CD)、TET1、DME、DML1、DML2、ROS1等)によって提供されるものなどのデメチラーゼ活性、DNA修復活性、DNA損傷活性、デアミナーゼ(例えば、ラットAPOBEC1などのシトシンデアミナーゼ酵素)によって提供されるものなどの脱アミン化活性、ジムスターゼ活性、アルキル化活性、脱プリン化活性、酸化活性、ピリミジン二量体形成活性、インテグラーゼ及び/またはレゾルバーゼ(例えば、Ginインベルターゼの超活性突然変異体などのGinインベルターゼ、GinH106Y)によってもたらされるものなどのインテグラーゼ活性;ヒト免疫不全ウイルス1型インテグラーゼ(IN);Tn3レゾルバーゼ等)、トランスポザーゼ活性、レコンビナーゼ(例えば、Ginレコンビナーゼの触媒ドメイン)によって提供されるものなどのレコンビナーゼ活性、ポリメラーゼ活性、リガーゼ活性、ヘリカーゼ活性、フォトリアーゼ活性、及びグリコシラーゼ活性)が挙げられるが、これらに限定されない。
ある場合には、融合パートナーは、標的核酸(例えば、ssRNA、dsRNA、ssDNA、dsDNA)に関連したタンパク質(例えば、ヒストン、RNA結合タンパク質、DNA結合タンパク質等)を修飾する酵素活性を有する。融合パートナーによって提供され得る(標的核酸に関連したタンパク質を修飾する)酵素活性の例としては、ヒストンメチルトランスフェラーゼ(HMT)(例えば、斑入り3〜9ホモログ1の抑圧因子(SUV39H1、KMT1Aとしても知られる)、真性染色質ヒストンリジンメチルトランスフェラーゼ2(G9A、KMT1C及びEHMT2としても知られる)、SUV39H2、ESET/SETDB1等、SET1A、SET1B、MLL1〜5、ASH1、SYMD2、NSD1、DOT1L、Pr−SET7/8、SUV4−20H1、EZH2、RIZ1)によって提供されるものなどのメチルトランスフェラーゼ活性、ヒストンデメチラーゼ(例えば、リジンデメチラーゼ1A(KDM1A、LSD1としても知られる)、JHDM2a/b、JMJD2A/JHDM3A、JMJD2B、JMJD2C/GASC1、JMJD2D、JARID1A/RBP2、JARID1B/PLU−1、JARID1C/SMCX、JARID1D/SMCY、UTX、JMJD3等)によって提供されるものなどのデメチラーゼ活性、ヒストンアセチラーゼトランスフェラーゼ(例えば、ヒトアセチルトランスフェラーゼp300、GCN5、PCAF、CBP、TAF1、TIP60/PLIP、MOZ/MYST3、MORF/MYST4、HBO1/MYST2、HMOF/MYST1、SRC1、ACTR、P160、CLOCK等の触媒コア/断片)によって提供されるものなどのアセチルトランスフェラーゼ活性、ヒストンデアセチラーゼ(例えば、HDAC1、HDAC2、HDAC3、HDAC8、HDAC4、HDAC5、HDAC7、HDAC9、SIRT1、SIRT2、HDAC11等によって提供されるものなどのデアセチラーゼ活性、キナーゼ活性、ホスファターゼ活性、ユビキチンリガーゼ活性、脱ユビキチン化活性、アデニル化活性、脱アデニル化活性、SUMO化活性、脱SUMO化活性、リボシル化活性、脱リボシル化活性、ミリストイル化活性、及び脱ミリストイル化活性が挙げられるが、これらに限定されない。
好適な融合パートナーの追加の例は、ジヒドロ葉酸還元酵素(DHFR)不安定化ドメイン(例えば、化学的に制御可能なキメラCasXタンパク質を生成するため)、及び葉緑体移行ペプチドである。好適な葉緑体移行ペプチドとしては、以下が挙げられるが、これらに限定されない。
MASMISSSAVTTVSRASRGQSAAMAPFGGLKSMTGFPVRKVNTDITSITSNGGRVKCMQVWPPIGKKKFETLSYLPPLTRDSRA(配列番号83)、MASMISSSAVTTVSRASRGQSAAMAPFGGLKSMTGFPVRKVNTDITSITSNGGRVKS(配列番号84)、MASSMLSSATMVASPAQATMVAPFNGLKSSAAFPATRKANNDITSITSNGGRVNCMQVWPPIEKKKFETLSYLPDLTDSGGRVNC(配列番号85)、MAQVSRICNGVQNPSLISNLSKSSQRKSPLSVSLKTQQHPRAYPISSSWGLKKSGMTLIGSELRPLKVMSSVSTAC(配列番号86)、MAQVSRICNGVWNPSLISNLSKSSQRKSPLSVSLKTQQHPRAYPISSSWGLKKSGMTLIGSELRPLKVMSSVSTAC(配列番号87)、MAQINNMAQGIQTLNPNSNFHKPQVPKSSSFLVFGSKKLKNSANSMLVLKKDSIFMQLFCSFRISASVATAC(配列番号88)、MAALVTSQLATSGTVLSVTDRFRRPGFQGLRPRNPADAALGMRTVGASAAPKQSRKPHRFDRRCLSMVV(配列番号89)、MAALTTSQLATSATGFGIADRSAPSSLLRHGFQGLKPRSPAGGDATSLSVTTSARATPKQQRSVQRGSRRFPSVVVC(配列番号90)、MASSVLSSAAVATRSNVAQANMVAPFTGLKSAASFPVSRKQNLDITSIASNGGRVQC(配列番号91)、MESLAATSVFAPSRVAVPAARALVRAGTVVPTRRTSSTSGTSGVKCSAAVTPQASPVISRSAAAA(配列番号92)、及びMGAAATSMQSLKFSNRLVPPSRRLSPVPNNVTCNNLPKSAAPVRTVKCCASSWNSTINGAAATTNGASAASS(配列番号93)。
ある場合には、本開示のCasX融合ポリペプチドは、a)本開示のCasXポリペプチド及びb)葉緑体移行ペプチドを含む。このため、例えば、CRISPR−CasX複合体は、葉緑体に対して標的され得る。ある場合には、この標的化は、葉緑体移行ペプチド(CTP)またはプラスチド移行ペプチドと呼ばれるN末端伸長の存在によって達成され得る。細菌源からの染色体導入遺伝子は、発現されたポリペプチドが、植物プラスチド(例えば、葉緑体)内で区画化される場合、発現されたポリペプチドをコードする配列に融合されたCTP配列をコードする配列を有していなければならない。したがって、葉緑体に対する外因性ポリペプチドの局在は、多くの場合、CTP配列をコードするポリヌクレオチド配列を、その外因性ポリペプチドをコードするポリヌクレオチドの5′領域に動作可能に連結することによって1達成される。CTPは、プラスチドへの転位中の処理ステップにおいて除去される。しかしながら、処理効率は、CTPのアミノ酸配列及びペプチドのNH2末端における付近の配列によって影響され得る。記載された葉緑体に対して標的化するための他のオプションは、トウモロコシcab−m7シグナル配列(米国特許第7,022,896号、WO97/41228)、エンドウグルタチオン還元酵素シグナル配列(WO97/41228)、及びUS2009029861に記載されるCTPである。
ある場合には、本開示のCasX融合ポリペプチドは、a)本開示のCasXポリペプチド、及びb)エンドソーム脱出ペプチドを含み得る。ある場合には、エンドソーム脱出ポリペプチドは、アミノ酸配列GLFXALLXLLXSLWXLLLXA(配列番号94)を含み、各Xは、独立して、リジン、ヒスチジン、及びアルギニンから選択される。ある場合には、エンドソーム脱出ポリペプチドは、アミノ酸配列GLFHALLHLLHSLWHLLLHA(配列番号95)を含む。
Cas9、亜鉛フィンガー、及び/またはTALEタンパク質との融合の文脈において(部位特異的標的核酸修飾、転写の変調、及び/または標的タンパク質修飾、例えば、ヒストン修飾のために)使用される上記融合パートナー(及びその他)のうちのいくつかの例については、例えば、Nomura et al,,J Am Chem Soc.2007 Jul 18;129(28):8676−7、Rivenbark et al.,Epigenetics.2012 Apr;7(4):350−60;Nucleic Acids Res.2016 Jul 8;44(12):5615−28、Gilbert et.al.,Cell.2013 Jul 18;154(2):442−51、Kearns et al.,Nat Methods.2015 May;12(5):401−3、Mendenhall et.al.,Nat Biotechnol.2013 Dec;31(12):1133−6、Hilton et.al.,Nat Biotechnol.2015 May;33(5):510−7、Gordley et.al.,Proc Natl Acad Sci USA.2009 Mar 31;106(13):5053−8、Akopian et.al.,Proc Natl Acad Sci USA.2003 Jul 22;100(15):8688−91、Tan et.,al.,J Virol.2006 Feb;80(4):1939−48、Tan et.al.,Proc Natl Acad Sci USA.2003 Oct 14;100(21):11997−2002、Papworth et.al.,Proc Natl Acad Sci USA.2003 Feb 18;100(4):1621−6、Sanjana et.al.,Nat Protoc.2012 Jan 5;7(1):171−92、Beerli et.al.,Proc Natl Acad Sci USA.1998 Dec 8;95(25):14628−33、Snowden et.al.,Curr Biol.2002 Dec 23;12(24):2159−66、Xu et.al.,Xu et.al.,Cell Discov.2016 May 3;2:16009、Komor et al.,Nature.2016 Apr 20;533(7603):420−4、Chaikind et.al.,Nucleic Acids Res.2016 Aug 11、Choudhury at.al.,Oncotarget.2016 Jun 23、Du et.al.,Cold Spring Harb Protoc.2016 Jan 4、Pham et.al.,Methods Mol Biol.2016;1358:43−57、Balboa et al.,Stem Cell Reports.2015 Sep 8;5(3):448−59、Hara et.al.,Sci Rep.2015 Jun 9;5:11221、Piatek et.al.,Plant BiotechnolJ.2015 May;13(4):578−89、Hu et al.,Nucleic Acids Res.2014 Apr;42(7):4375−90、Cheng et.al.,Cell Res.2013 Oct;23(10):1163−71、cheng et.al.,Cell Res.2013 Oct;23(10):1163−71、及びMaeder et.al.,Nat Methods.2013 Oct;10(10):977−9を参照されたい。
追加の好適な異種ポリペプチドとしては、標的核酸の転写及び/または翻訳の増加を直接的及び/または間接的に提供するポリペプチド(例えば、転写活性化因子もしくはその断片、転写活性化因子を動員するタンパク質もしくはその断片、小分子/薬物応答性転写及び/または翻訳調節因子、翻訳調節タンパク質等)が挙げられるが、これらに限定されない。転写の増加または減少を達成する異種ポリペプチドの非限定例としては、転写活性化因子及び転写抑制因子ドメインが挙げられる。そのようなある場合には、キメラCasXポリペプチドは、ガイド核酸(ガイドRNA)によって標的核酸中の特定の位置(すなわち、配列)に標的化され、プロモーター(転写活性化因子の機能を選択的に阻害する)へのRNAポリメラーゼ結合を遮断する、及び/または局所クロマチン状態を修飾する(標的核酸を修飾する、もしくは標的核酸に関連したポリペプチドを修飾する融合配列が使用される場合)などの遺伝子座特異的調節をもたらす。ある場合には、変化は、一過性である(例えば、転写抑制または活性化)。ある場合には、変化は、遺伝性である(例えば、標的核酸に対して、または標的核酸に関連したタンパク質、例えば、ヌクレオソームヒストンに対して後成的修飾が行われる場合)。
ssRNA標的核酸を標的化するときに使用するための異種ポリペプチドの非限定例としては、スプライシング因子(例えば、RSドメイン);タンパク質翻訳成分(例えば、翻訳開始、延長、及び/または放出因子、例えば、eIF4G);RNAメチラーゼ;RNA編集酵素(例えば、RNAデアミナーゼ、例えば、RNA上で作用するアデノシンデアミナーゼ(ADAR)、A〜I及び/またはC〜U編集酵素を含む);ヘリカーゼ;RNA結合タンパク質等が挙げられる(但しこれらに限定されない)。異種ポリペプチドは、タンパク質全体を含み得るか、またはある場合には、タンパク質の断片(例えば、機能的ドメイン)を含み得る。
対象のキメラCasXポリペプチドの異種ポリペプチドは、ssRNAと相互作用可能な任意のドメイン(この開示の目的のために、分子内及び/または分子間二次構造、例えば、ヘアピン、ステムループ等の二本鎖RNA二体鎖)であり得、一過性または不可逆的、直接的または間接的にかかわらず、エンドヌクレアーゼ(例えば、SMG5及びSMG6などのタンパク質由来のRNase III、CRR22 DYWドメイン、Dicer、及びPIN(PilT N末端)ドメイン;RNA切断を刺激するために関与するタンパク質及びタンパク質ドメイン(例えば、CPSF、CstF、CFIm、及びCFIIm);エキソヌクレアーゼ(例えば、XRN−1またはエキソヌクレアーゼT);デアデニラーゼ(例えば、HNT3);ナンセンス媒介型RNA分解に関与するタンパク質及びタンパク質ドメイン(例えば、UPF1、UPF2、UPF3、UPF3b、RNP S1、Y14、DEK、REF2、及びSRm160);RNAの安定化に関与するタンパク質及びタンパク質ドメイン(例えば、PABP);翻訳の抑制に関与するタンパク質及びタンパク質ドメイン(例えば、Ago2及びAgo4);翻訳の刺激に関与するタンパク質及びタンパク質ドメイン(例えば、Staufen);翻訳の変調に関与する(例えば、可能な)タンパク質及びタンパク質ドメイン(例えば、開始因子、延長因子、放出因子等の翻訳因子、例えば、eIF4G);RNAのポリアデニル化に関与するタンパク質及びタンパク質ドメイン(例えば、PAP1、GLD−2、及びStar−PAP);RNAのポリウリジン化に関与するタンパク質及びタンパク質ドメイン(例えば、CI D1及び末端ウリジレートトランスフェラーゼ);RNA局在に関与するタンパク質及びタンパク質ドメイン(例えば、IMP1、ZBP1、She2p、She3p、及びBicaudal−D由来);RNAの核保持に関与するタンパク質及びタンパク質ドメイン(例えば、Rrp6);RNAの核外搬出に関与するタンパク質及びタンパク質ドメイン(例えば、TAP、NXF1、THO、TREX、REF、及びAly);RNAスプライシングの抑制に関与するタンパク質及びタンパク質ドメイン(例えば、PTB、Sam68、及びhnRNP A1);RNAスプライシングの刺激に関与するタンパク質及びタンパク質ドメイン(例えば、セリン/アルギニンリッチ(SR)ドメイン);転写効率の低減に関与するタンパク質及びタンパク質ドメイン(例えば、FUS(TLS);ならびに転写の刺激に関与するタンパク質及びタンパク質ドメイン(例えば、CDK7及びHIV Tat)を含む群から選択されるエフェクタードメインが挙げられるが、これらに限定されない。あるいは、エフェクタードメインは、エンドヌクレアーゼ;RNA切断を刺激することができるタンパク質及びタンパク質ドメイン;エキソヌクレアーゼ;デアデニラーゼ;ナンセンス媒介型RNA分解活性を有するタンパク質及びタンパク質ドメイン;RNAを安定化することができるタンパク質及びタンパク質ドメイン;翻訳を抑制することができるタンパク質及びタンパク質ドメイン;翻訳を刺激することができるタンパク質及びタンパク質ドメイン;翻訳を変調することができるタンパク質及びタンパク質ドメイン(例えば、開始因子、延長因子、放出因子等の翻訳因子、例えば、eIF4G);RNAのポリアデニル化が可能なタンパク質及びタンパク質ドメイン;RNAのポリウリジン化が可能なタンパク質及びタンパク質ドメイン;RNA局在活性を有するタンパク質及びタンパク質ドメイン;RNAの核保持が可能なタンパク質及びタンパク質ドメイン;RNA核外搬出活性を有するタンパク質及びタンパク質ドメイン;RNAスプライシングが可能なタンパク質及びタンパク質ドメイン;RNAスプライシングの刺激が可能なタンパク質及びタンパク質ドメイン;転写効率の低減が可能なタンパク質及びタンパク質ドメイン;ならびに転写を刺激することができるタンパク質及びタンパク質ドメインを含む群から選択されてもよい。別の好適な異種ポリペプチドは、WO2012068627(参照によりその全体が本明細書に組み込まれる)に詳細に記載されているPUF RNA結合ドメインである。
キメラCasXポリペプチドの異種ポリペプチドとして(全体でまたはその断片として)使用され得るいくつかのRNAスプライシング因子は、別個の配列特異的RNA結合モジュール及びスプライシングエフェクタードメインと共に、モジュール構造化を有する。例えば、セリン/アルギニンリッチ(SR)タンパク質ファミリーのメンバーは、エクソン封入を促進するpre−mRNA及びC末端RSドメインにおいてエクソンスプライシングエンハンサー(ESE)に結合するN末端RNA認識モチーフ(RRM)を含む。別の例として、hnRNPタンパク質hnRNP Alは、そのRRMドメインを通してエクソンスプライシングサイレンサー(ESS)に結合し、C末端グリシンリッチドメインを通してエクソン封入を阻害する。いくつかのスプライシング因子は、2つの代替部位の間の調節配列に結合することによって、スプライス部位(ss)の代替使用を調節することができる。例えば、ASF/SF2は、ESEを認識し、イントロン近位部位の使用を促進することができるが、hnRNP Alは、ESSに結合し、スプライシングをイントロン遠隔部位の使用に変更することができる。そのような因子の1つの用途は、内因性遺伝子、特に疾患関連遺伝子の代替スプライシングを変調するESFを生成することである。例えば、Bcl−x pre−mRNAは、2つの代替5′スプライス部位を有する2つのスプライシングアイソフォームを産生して、反対の機能のタンパク質をコードする。長いスプライシングアイソフォームBcl−xLは、長寿命の分裂終了細胞中で発現された強力なアポトーシス阻害剤であり、多くのがん細胞中で上方調節され、アポトーシスシグナルから細胞を保護する。短いアイソフォームBcl−xSは、アポトーシス促進性アイソフォームであり、高いターンオーバー率で細胞中で高レベルで発現される(例えば、リンパ球を発達させる)。2つのBcl−xスプライシングアイソフォームの比は、コアエクソン領域またはエクソン伸長領域のいずれか(例えば、2つの代替5′スプライス部位の間)に位置する複数のcω要素によって調節される。さらなる例については、WO2010075303(参照によりその全体が本明細書に組み込まれる)を参照されたい。
さらに好適な融合パートナーとしては、境界要素(例えば、CTCF)であるタンパク質(またはその断片)、末梢動員を提供するタンパク質及びその断片(例えば、Lamin A、Lamin B等)、タンパク質ドッキング要素(例えば、FKBP/FRB、Pil1/Aby1等)が挙げられるが、これらに限定されない。
対象のキメラCasXポリペプチドに対する様々な追加の好適な異種ポリペプチド(またはその断片)の例としては、以下の出願に記載されるものが挙げられるが、これらに限定されず(それらの公報は、Cas9などの他のCRISPRエンドヌクレアーゼに関するが、記載される融合パートナーを代わりにCasXと共に使用することもできる)、PCT特許出願:WO2010075303、WO2012068627、及びWO2013155555、また例えば、米国特許及び特許出願第8,906,616号、第8,895,308号、第8,889,418号、第8,889,356号、第8,871,445号、第8,865,406号、第8,795,965号、第8,771,945号、第8,697,359号、第20140068797号、第20140170753号、第20140179006号、第20140179770号、第20140186843号、第20140186919号、第20140186958号、第20140189896号、第20140227787号、第20140234972号、第20140242664号、第20140242699号、第20140242700号、第20140242702号、第20140248702号、第20140256046号、第20140273037号、第20140273226号、第20140273230号、第20140273231号、第20140273232号、第20140273233号、第20140273234号、第20140273235号、第20140287938号、第20140295556号、第20140295557号、第20140298547号、第20140304853号、第20140309487号、第20140310828号、第20140310830号、第20140315985号、第20140335063号、第20140335620号、第20140342456号、第20140342457号、第20140342458号、第20140349400号、第20140349405号、第20140356867号、第20140356956号、第20140356958号、第20140356959号、第20140357523号、第20140357530号、第20140364333号、及び第20140377868号(すべてが参照によりそれらの全体が本明細書に組み込まれる)において見出すことができる。
ある場合には、異種ポリペプチド(融合パートナー)は、亜細胞性局在を提供する。すなわち、異種ポリペプチドは、亜細胞性局在配列を含む(例えば、核に対して標的するための核局在シグナル(NLS)、融合タンパク質を核外に保持する配列、例えば、核外搬出配列(NES)、融合タンパク質を細胞質中に保持したままにする配列、ミトコンドリアに対して標的するためのミトコンドリア局在シグナル、葉緑体に対して標的するための葉緑体局在シグナル、ER保持シグナル等)。いくつかの実施形態では、CasX融合ポリペプチドは、NLSを含まないため、タンパク質は、核に対して標的されない(これは、例えば、標的核酸がサイトゾル中に存在するRNAであるときに有利であり得る)。いくつかの実施形態では、異種ポリペプチドは、追跡及び/または精製を容易にするためのタグを提供することができる(すなわち、異種ポリペプチドは、検出可能なラベルである)(例えば、蛍光タンパク質、例えば、緑色蛍光タンパク質(GFP)、YFP、RFP、CFP、mCherry、tdTomato等;ヒスチジンタグ、例えば、6XHisタグ;ヘマグルチニン(HA)タグ;FLAGタグ;Mycタグ等)。
ある場合には、CasXタンパク質(例えば、野生型CasXタンパク質、変異形CasXタンパク質、キメラCasXタンパク質、dCasXタンパク質、キメラCasXタンパク質(CasX部分は、低減されたヌクレアーゼ活性を有する)、例えば、融合パートナーに融合されたdCasXタンパク質等)は、核局在シグナル(NLS)を含む(に融合される)(例えば、ある場合には、2つ以上、3つ以上、4つ以上、または5つ以上のNLS)。このため、ある場合には、CasXポリペプチドは、1つ以上のNLS(例えば、2つ以上、3つ以上、4つ以上、または5つ以上のNLS)を含む。ある場合には、1つ以上のNLS(2つ以上、3つ以上、4つ以上、または5つ以上のNLS)は、N末端及び/またはC末端またはその付近(例えばその50アミノ酸内)に位置付けられる。ある場合には、1つ以上のNLS(2つ以上、3つ以上、4つ以上、または5つ以上のNLS)は、N末端またはその付近(例えばその50アミノ酸内)に位置付けられる。ある場合には、1つ以上のNLS(2つ以上、3つ以上、4つ以上、または5つ以上のNLS)は、C末端またはその付近(例えばその50アミノ酸内)に位置付けられる。ある場合には、1つ以上のNLS(3つ以上、4つ以上、または5つ以上のNLS)は、N末端及びC末端の両方またはその付近(例えばそれらの50アミノ酸内)に位置付けられる。ある場合には、NLSは、N末端に位置付けられ、NLSは、C末端に位置付けられる。
ある場合には、CasXタンパク質(例えば、野生型CasXタンパク質、変異形CasXタンパク質、キメラCasXタンパク質、dCasXタンパク質、CasX部分が低減したヌクレアーゼ活性を有するキメラCasXタンパク質、例えば融合パートナーに融合されたdCasXタンパク質等)は、1〜10NLS(例えば、1〜9、1〜8、1〜7、1〜6、1〜5、2〜10、2〜9、2〜8、2〜7、2〜6、または2〜5NLS)を含む(に融合される)。ある場合には、CasXタンパク質(例えば、野生型CasXタンパク質、変異形CasXタンパク質、キメラCasXタンパク質、dCasXタンパク質、CasX部分が低減したヌクレアーゼ活性を有するキメラCasXタンパク質、例えば融合パートナーに融合されたdCasXタンパク質等)は、2〜5NLS(例えば、2〜4または2〜3NLS)を含む(に融合される)。
NLSの非限定例としては、アミノ酸配列PKKKRKV(配列番号96)を有するSV40ウイルスラージT抗原のNLS;ヌクレオプラスミン由来のNLS(例えば、配列KRPAATKKAGQAKKKK(配列番号97)を有するヌクレオプラスミン二連NLS;アミノ酸配列PAAKRVKLD(配列番号98)またはRQRRNELKRSP(配列番号99)を有するc−myc NLS;配列NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(配列番号100)を有するhRNPA1 M9 NLS;インポーチン−α由来のIBBドメインの配列RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(配列番号101);筋腫Tタンパク質の配列VSRKRPRP(配列番号102)及びPPKKARED(配列番号103);ヒトp53の配列PQPKKKPL(配列番号104);マウスc−ab1 IVの配列SALIKKKKKMAP(配列番号105);インフルエンザウイルスNS1の配列DRLRR(配列番号106)及びPKQKKRK(配列番号107);肝炎ウイルスΔ抗原の配列RKLKKKIKKL(配列番号108);マウスMx1タンパク質の配列REKKKFLKRR(配列番号109);ヒトポリ(ADP−リボース)ポリメラーゼの配列KRKGDEVDGVDEVAKKKSKK(配列番号110);及びステロイドホルモン受容体(ヒト)糖コルチコイドの配列RKCLQAGMNLEARKTKK(配列番号111)に由来するNLS配列を含む。一般に、NLS(または複数のNLS)は、真核細胞の核中で検出可能な量のCasXの蓄積を駆動するのに十分な強度である。核中の蓄積の検出は、任意の好適な技法によって行われてもよい。例えば、検出可能なマーカーは、CasXタンパク質に融合されてもよく、それにより細胞内の位置が可視化され得る。細胞核はまた、細胞から単離されてもよく、次いで、その内容物を、タンパク質を検出するための任意の好適なプロセス、例えば免疫組織化学、ウェスタンブロット、または酵素活性アッセイによって分析することができる。核中の蓄積はまた、間接的に決定することができる。
ある場合には、CasX融合ポリペプチドは、「タンパク質形質導入ドメイン」またはPTD(CPP−細胞透過性ペプチドとしても知られる)を含み、これはポリペプチド、ポリヌクレオチド、炭水化物、または脂質二層、ミセル、細胞膜、細胞小器官膜、もしくは小胞膜の横断を促進する有機もしくは無機化合物を指す。小さな極性分子から大きな高分子の範囲であり得る別の分子及び/またはナノ粒子に付着したPTDは、例えば、細胞外空間から細胞内空間に、またはサイトゾルから細胞小器官内に移動する分子の膜横断を促進する。いくつかの実施形態では、PTDは、ポリペプチドのアミノ酸末端に共有結合されている(例えば、野生型CasXに連結して融合タンパク質を生成するか、または変異形CasXタンパク質、例えば、dCasX、ニッカーゼCasX、またはキメラCasXタンパク質に連結して融合タンパク質を生成する)。いくつかの実施形態では、PTDは、ポリペプチドのカルボキシル末端に共有結合されている(例えば、野生型CasXに連結して融合タンパク質を生成するか、または変異形CasXタンパク質、例えば、dCasX、ニッカーゼCasX、またはキメラCasXタンパク質に連結して融合タンパク質を生成する)。ある場合には、PTDは、好適な挿入部位でCasX融合ポリペプチドに内的に挿入される(すなわち、CasX融合ポリペプチドのN末端またはC末端においてではない)。ある場合には、対象のCasX融合ポリペプチドは、1つ以上のPTD(例えば、2つ以上、3つ以上、4つ以上のPTD)を含む(に共役される、に融合される)。ある場合には、PTDは、核局在シグナル(NLS)(例えば、ある場合には、2つ以上、3つ以上、4つ以上、または5つ以上のNLS)を含む。このため、ある場合には、CasX融合ポリペプチドは、1つ以上のNLS(例えば、2つ以上、3つ以上、4つ以上、または5つ以上のNLS)を含む。いくつかの実施形態では、PTDは、核酸(例えば、CasXガイド核酸、CasXガイド核酸をコードするポリヌクレオチド、CasX融合ポリペプチドをコードするポリヌクレオチド、ドナーポリヌクレオチド等)に共有結合されている。PTDの例としては、最小ウンデカペプチドタンパク質形質導入ドメイン(YGRKKRRQRRR(配列番号112)を含むHIV−1 TATの残基47〜57に対応する);細胞中への直接侵入に十分な多くのアルギニン(例えば、3、4、5、6、7、8、9、10、または10〜50アルギニン)を含むポリアルギニン配列;VP22ドメイン(Zender et al.(2002)Cancer Gene Ther.9(6):489−96);Drosophila Antennapediaタンパク質形質導入ドメイン(Noguchi et al.(2003)Diabetes 52(7):1732−1737);欠損ヒトカルシトニンペプチド(Trehin et al.(2004)Pharm.Research 21:1248−1256);ポリリジン(Wender et al.(2000)Proc.Natl.Acad.Sci.USA 97:13003−13008);RRQRRTSKLMKR(配列番号113);トランスポータンGWTLNSAGYLLGKINLKALAALAKKIL(配列番号114);KALAWEAKLAKALAKALAKHLAKALAKALKCEA(配列番号115);及びRQIKIWFQNRRMKWKK(配列番号116)が挙げられるが、これらに限定されない。例示的なPTDとしては、YGRKKRRQRRR(配列番号117)、RKKRRQRRR(配列番号118);3アルギニン残基〜50アルギニン残基のアルギニンホモポリマーが挙げられるが、これらに限定されない。例示的なPTDドメインアミノ酸配列としては、以下のうちのいずれかが挙げられるが、これらに限定されない。YGRKKRRQRRR(配列番号119)、RKKRRQRR(配列番号120)、YARAAARQARA(配列番号121)、THRLPRRRRRR(配列番号122)、及びGGRRARRRRRR(配列番号123)。いくつかの実施形態では、PTDは、活性化可能なCPP(ACPP)である(Aguilera et al.(2009)Integr Biol(Camb)June;1(5−6):371−381)。ACPPは、切断可能なリンカーを介して一致するポリアニオン(例えば、Glu9または「E9」)に接続されたポリカチオン性CPP(例えば、Arg9または「R9」)を含み、これが正味電荷をほぼ0に低減し、それにより細胞への付着及び取り込みを阻害する。リンカーの切断時に、ポリアニオンが放出され、ポリアルギニン及びその固有の付着性を局所的にアンマスクし、したがってACPPを「活性化して」膜を横断する。
リンカー(例えば、融合パートナーの場合)
いくつかの実施形態では、対象のCasXタンパク質は、リンカーポリペプチド(例えば、1つ以上のリンカーポリペプチド)を介して融合パートナーに融合され得る。リンカーポリペプチドは、様々なアミノ酸配列のうちのいずれかを有し得る。タンパク質は、一般に可撓性のスペーサーペプチドによって接合され得るが、他の化学結合は除外されない。好適なリンカーとしては、4アミノ酸〜40アミノ酸長、または4アミノ酸〜25アミノ酸長のポリペプチドが挙げられる。これらのリンカーは、合成のリンカーをコードするオリゴヌクレオチドを使用してタンパク質を連結することによって産生され得るか、または融合タンパク質をコードする核酸配列によってコードされ得る。ある程度の可撓性を有するペプチドリンカーを使用することができる。好ましいリンカーが、一般に可撓性のペプチドをもたらす配列を有することに留意して、連結ペプチドは、事実上任意のアミノ酸配列を有し得る。グリシン及びアラニンなどの小アミノ酸の使用は、可撓性ペプチドを創出する際に有用である。そのような配列の創出は、当業者にとって慣例である。様々な異なるリンカーは、商業的に入手可能であり、使用に適していると考えられる。
リンカーポリペプチドの例としては、グリシンポリマー(G)n、グリシン−セリンポリマー(例えば、(GS)n、GSGGSn(配列番号124)、GGSGGSn(配列番号125)、及びGGGSn(配列番号126)を含む、nは、少なくとも1の整数である)、グリシン−アラニンポリマー、アラニン−セリンポリマーが挙げられる。例示的なリンカーは、GGSG(配列番号127)、GGSGG(配列番号128)、GSGSG(配列番号129)、GSGGG(配列番号130)、GGGSG(配列番号131)、GSSSG(配列番号132)等が挙げられるが、これらに限定されないアミノ酸配列を含み得る。熟練者であれば、任意の所望の要素に複合されたペプチドの設計が、すべてまたは部分的に可撓性であるリンカーを含み得、それによりリンカーが、可撓性リンカーならびに可撓性の低い構造を与える1つ以上の部分を含み得ることを認識するであろう。
検出可能な標識
ある場合には、本開示のCasXポリペプチドは、検出可能な標識を含む。検出可能なシグナルを提供し得る好適な検出可能な標識及び/または部分としては、酵素、放射性同位体、特異的結合対のメンバー、蛍光体、蛍光タンパク質、量子ドット等を挙げることができるが、これらに限定されない。
好適な蛍光タンパク質としては、緑色蛍光タンパク質(GFP)またはその変異形、GFPの青色蛍光変異形(BFP)、GFPのシアン蛍光変異形(CFP)、GFPの黄色蛍光変異形(YFP)、強化GFP(EGFP)、強化CFP(ECFP)、強化YFP(EYFP)、GFPS65T、Emerald、Topaz(TYFP)、Venus、Citrine、mCitrine、GFPuv、不安定化EGFP(dEGFP)、不安定化ECFP(dECFP)、不安定化EYFP(dEYFP)、mCFPm、Cerulean、T−Sapphire、CyPet、YPet、mKO、HcRed、t−HcRed、DsRed、DsRed2、DsRed−モノマー、J−Red、二量体2、t−二量体2(12)、mRFP1、pocilloporin、レニラGFP、Monster GFP、paGFP、カエデタンパク質及びキンドリングタンパク質、フィコビリンタンパク質及びB−フィコエリトリン、R−フィコエリトリン、及びアロフィコシアニンを含むフィコビリンタンパク質複合体が挙げられるが、これらに限定されない。蛍光タンパク質の他の例としては、mHoneydew、mBanana、mOrange、dTomato、tdTomato、mTangerine、mStrawberry、mCherry、mGrape1、mRaspberry、mGrape2、mPlum(Shaner et al.(2005)Nat.Methods 2:905−909)等が挙げられる。例えば、Matz et al.(1999)Nature Biotechnol.17:969−973に記載される、花虫類種由来の様々な蛍光及び染色タンパク質のうちのいずれかが使用に適している。
好適な酵素としては、ホースラディッシュペルオキシダーゼ(HRP)、アルカリホスファターゼ(AP)、β−ガラクトシダーゼ(GAL)、グルコース−6−ホスファターゼデヒドロゲナーゼ、β−N−アセチルグルコサミニダーゼ、β−グルクロニダーゼ、転化酵素、キサンチンオキシダーゼ、ホタルルシフェラーゼ、グルコースオキシダーゼ(GO)等が挙げられるが、これらに限定されない。
プロトスペーサー隣接モチーフ(PAM)
CasXタンパク質は、DNA標的RNAと標的DNAとの間の相補性の領域によって定義される標的配列において、標的DNAに結合する。多くのCRISPRエンドヌクレアーゼの場合と同様に、二本鎖標的DNAの部位特異的結合(及び/または切断)は、(i)ガイドRNAと標的DNAとの間の塩基対合相補性、及び(ii)標的DNA中の短いモチーフ[プロトスペーサー隣接モチーフ(PAM)と称される]の両方によって決定される位置において起こる。
いくつかの実施形態では、CasXタンパク質のPAMは、標的DNAの非相補鎖の標的配列の5′の直近である(相補鎖は、ガイドRNAのガイド配列にハイブリダイズするが、非相補鎖は、ガイドRNAと直接ハイブリダイズせず、非相補鎖の逆相補体である)。いくつかの実施形態では(例えば、本明細書に記載されるCasX1が使用される場合)、非相補鎖のPAM配列は、5′−TCN−3′(及びある場合には、TTCN)であり、Nは、任意のDNAヌクレオチドである。例として、図6、パネルC及び図7を参照されたい。ここでPAM(TCN)(非相補鎖上)は、TCAであり(及び図において示されるPAMはTTCAである)、PAMは、標的配列の5′である。
ある場合には、異なるCasXタンパク質(すなわち、様々な種に由来するCasXタンパク質)は、異なるCasXタンパク質の様々な酵素的特徴を利用するために(例えば、異なるPAM配列優先性のため、増加または減少した酵素活性のため、増加または減少したレベルの細胞毒性のため、NHEJ、ホモロジー配向型修復、一本鎖切断、二本鎖切断等の間の均衡を変更するため、短い全配列を利用するため等)、様々な提供される方法における使用に有利であり得る。異なる種に由来するCasXタンパク質は、標的DNA中に異なるPAM配列を必要とし得る。このため、一般に好まれる特定のCasXタンパク質の場合、PAM配列要件は、上記の5′−TCN−3′配列とは異なり得る。適切なPAM配列の同定のための様々な方法(インシリコ及び/またはウェットラボ法を含む)は、当該技術分野において既知であり、ルーチンであり、任意の簡便な方法が使用され得る。本明細書に記載されるTCN PAM配列は、PAM枯渇アッセイを使用して同定された(例えば、下記実施例の図5を参照)。
CasXガイドRNA
CasXタンパク質に結合する、リボヌクレオタンパク質複合体(RNP)を形成する、及びその複合体を標的核酸(例えば、標的DNA)内の特定の位置に標的する核酸分子は、本明細書において「CasXガイドRNA」または単に「ガイドRNA」と称される。ある場合には、CasXガイドRNAが、RNA塩基に加えて、DNA塩基を含むようにハイブリッドDNA/RNAが作製され得るが、「CasXガイドRNA」という用語は、依然として本明細書ではそのような分子を包含するように使用されることを理解されたい。
CasXガイドRNAは、標的化セグメント及びタンパク質結合セグメントの2つのセグメントを含むと言うことができる。CasXガイドRNAの標的化セグメントは、標的核酸(例えば、標的ssRNA、標的ssDNA、二本鎖標的DNAの相補鎖等)内の特定の配列(標的部位)に相補的な(したがってそれとハイブリダイズする)ヌクレオチド配列(ガイド配列)を含む。タンパク質結合セグメント(または「タンパク質結合配列」)は、CasXポリペプチドと相互作用する(に結合する)。対象のCasXガイドRNAのタンパク質結合セグメントは、互いにハイブリダイズして二本鎖RNA二重鎖(dsRNA二重鎖)を形成するヌクレオチドの2つの相補性ストレッチを含む。標的核酸(例えば、ゲノムDNA)の部位特異的結合及び/または切断は、CasXガイドRNA(CasXガイドRNAのガイド配列)と標的核酸との間の塩基対合相補性によって決定される位置(例えば、標的遺伝子座の標的配列)において起こり得る。
CasXガイドRNA及びCasXタンパク質、例えば、融合CasXポリペプチドは、複合体を形成する(例えば、非共有結合相互作用を介して結合する)。CasXガイドRNAは、ガイド配列(標的核酸の配列に相補的なヌクレオチド配列)を含む、標的化セグメントを含めることによって複合体に標的特異性を提供する。複合体のCasXタンパク質は、部位特異的活性(例えば、CasXタンパク質によって提供される切断活性及び/またはキメラCasXタンパク質の場合に融合パートナーによって提供される活性)を提供する。換言すれば、CasXタンパク質は、CasXガイドRNAとのその会合によって、標的核酸配列(例えば、標的配列)に誘導される。
CasXガイドRNAの「標的化配列」とも称される「ガイド配列」は、(例えば、本明細書に記載されるように)PAM配列が考慮され得ることを例外として、CasXガイドRNAが、CasXタンパク質(例えば、天然に存在するCasXタンパク質、融合CasXポリペプチド(キメラCasX)等)を任意の所望の標的核酸の任意の所望の配列に標的し得るように修飾され得る。このため、例えば、CasXガイドRNAは、真核細胞中の核酸、例えば、ウイルス核酸、真核細胞核酸(例えば、真核細胞染色体、染色体配列、真核細胞RNA等)における配列に対する相補性を有するガイド配列を有し得る(例えば、ハイブリダイズし得る)。
対象のCasXガイドRNAはまた、「活性化因子」及び「標的化因子」(例えば、それぞれ「活性化因子−RNA」及び「標的化因子−RNA」を含むと言うこともできる。「活性化因子」及び「標的化因子」が2つの別個の分子である場合、ガイドRNAは、本明細書では「二重ガイドRNA」、「dgRNA」、「二重分子ガイドRNA」、または「二分子ガイドRNA」(例えば、「CasX二重ガイドRNA」)と称される。いくつかの実施形態では、活性化因子及び標的化因子は、互いに共有結合され(例えば、介在ヌクレオチドを介して)、ガイドRNAは、本明細書では「単一ガイドRNA」、「sgRNA」、「単一分子ガイドRNA」、または「一分子ガイドRNA」(例えば、「CasX単一ガイドRNA」)と称される。このため、対象のCasX単一ガイドRNAは、互いに連結され(例えば、介在ヌクレオチドによって)、互いにハイブリダイズして、ガイドRNAのタンパク質結合セグメントの二本鎖RNA二重鎖(dsRNA二重鎖)を形成し、したがってステムループ構造をもたらす、標的化因子(例えば、標的化因子−RNA)及び活性化因子(例えば、活性化因子−RNA)を含む(図6、パネルC)。このため、標的化因子及び活性化因子は各々、二重鎖形成セグメントを有し、標的化因子の二重鎖形成セグメント及び活性化因子の二重鎖形成セグメントは、互いに相補性を有し、互いにハイブリダイズする。
いくつかの実施形態では、CasX単一ガイドRNAのリンカーは、ヌクレオチドのストレッチである(図6、パネルCにおいてGAAAとして示される)。ある場合には、CasX単一ガイドRNAの標的化因子及び活性化因子は、介在ヌクレオチドによって互いに連結され、リンカーは、3〜20ヌクレオチド(nt)(例えば、3〜15、3〜12、3〜10、3〜8、3〜6、3〜5、3〜4、4〜20、4〜15、4〜12、4〜10、4〜8、4〜6、または4〜5nt)の長さを有し得る。いくつかの実施形態では、CasX単一ガイドRNAのリンカーは、3〜100ヌクレオチド(nt)(例えば、3〜80、3〜50、3〜30、3〜25、3〜20、3〜15、3〜12、3〜10、3〜8、3〜6、3〜5、3〜4、4〜100、4〜80、4〜50、4〜30、4〜25、4〜20、4〜15、4〜12、4〜10、4〜8、4〜6、または4〜5nt)の長さを有し得る。いくつかの実施形態では、CasX単一ガイドRNAのリンカーは、3〜10ヌクレオチド(nt)(例えば、3〜9、3〜8、3〜7、3〜6、3〜5、3〜4、4〜10、4〜9、4〜8、4〜7、4〜6、または4〜5nt)の長さを有し得る。
CasXガイドRNAのガイド配列
対象のCasXガイドRNAの標的化セグメントは、標的核酸中の配列(標的部位)に相補的なヌクレオチド配列である、ガイド配列(すなわち、標的化配列)を含む。換言すれば、CasXガイドRNAの標的化セグメントは、ハイブリダイゼーションによる配列特異的方法(すなわち、塩基対合)で標的核酸(例えば、二本鎖DNA(dsDNA)、一本鎖DNA(ssDNA)、一本鎖RNA(ssRNA)、または二本鎖RNA(dsRNA))と相互作用し得る。CasXガイドRNAのガイド配列は、標的核酸(例えば、ゲノムDNAなどの真核細胞標的核酸)内で任意の所望の標的配列にハイブリダイズするように(例えば、遺伝子組み換えによって)修飾/設計され得る(例えば、PAMを考慮に入れて、例えば、dsDNA標的を標的化するとき)。
いくつかの実施形態では、ガイド配列と標的核酸の標的部位との間の相補性のパーセントは、60%以上(例えば、65%以上、70%以上、75%以上、80%以上、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%)である。ある場合には、ガイド配列と標的核酸の標的部位との間の相補性のパーセントは、80%以上(例えば、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%)である。ある場合には、ガイド配列と標的核酸の標的部位との間の相補性のパーセントは、90%以上(例えば、95%以上、97%以上、98%以上、99%以上、または100%)である。ある場合には、ガイド配列と標的核酸の標的部位との間の相補性のパーセントは、100%である。
ある場合には、ガイド配列と標的核酸の標的部位との間の相補性のパーセントは、7つの連続する3′最端ヌクレオチドにわたって100%である。
ある場合には、ガイド配列と標的核酸の標的部位との間の相補性のパーセントは、19以上(例えば、20以上、21以上、22以上)の連続するヌクレオチドにわたって60%以上(例えば、70%以上、75%以上、80%以上、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%)である。ある場合には、ガイド配列と標的核酸の標的部位との間の相補性のパーセントは、19以上(例えば、20以上、21以上、22以上)の連続するヌクレオチドにわたって80%以上(例えば、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%)である。ある場合には、ガイド配列と標的核酸の標的部位との間の相補性のパーセントは、19以上(例えば、20以上、21以上、22以上)の連続するヌクレオチドにわたって90%以上(例えば、95%以上、97%以上、98%以上、99%以上、または100%)である。ある場合には、ガイド配列と標的核酸の標的部位との間の相補性のパーセントは、19以上(例えば、20以上、21以上、22以上)の連続するヌクレオチドにわたって100%である。
ある場合には、ガイド配列と標的核酸の標的部位との間の相補性のパーセントは、19〜25の連続するヌクレオチドにわたって60%以上(例えば、70%以上、75%以上、80%以上、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%)である。ある場合には、ガイド配列と標的核酸の標的部位との間の相補性のパーセントは、19〜25の連続するヌクレオチドにわたって80%以上(例えば、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%)である。ある場合には、ガイド配列と標的核酸の標的部位との間の相補性のパーセントは、19〜25の連続するヌクレオチドにわたって90%以上(例えば、95%以上、97%以上、98%以上、99%以上、または100%)である。ある場合には、ガイド配列と標的核酸の標的部位との間の相補性のパーセントは、19〜25の連続するヌクレオチドにわたって100%である。
ある場合には、ガイド配列は、19〜30ヌクレオチド(nt)(例えば、19〜25、19〜22、19〜20、20〜30、20〜25、または20〜22nt)の範囲の長さを有する。ある場合には、ガイド配列は、19〜25ヌクレオチド(nt)(例えば、19〜22、19〜20、20〜25、20〜25、または20〜22nt)の範囲の長さを有する。ある場合には、ガイド配列は、19以上のnt(例えば、20以上、21以上、または22以上のnt;19nt、20nt、21nt、22nt、23nt、24nt、25nt等)の長さを有する。ある場合には、ガイド配列は、19ntの長さを有する。ある場合には、ガイド配列は、20ntの長さを有する。ある場合には、ガイド配列は、21ntの長さを有する。ある場合には、ガイド配列は、22ntの長さを有する。ある場合には、ガイド配列は、23ntの長さを有する。
CasXガイドRNAのタンパク質結合セグメント
対象のCasXガイドRNAのタンパク質結合セグメントは、CasXタンパク質と相互作用する。CasXガイドRNAは、結合したCasXタンパク質を、上述のガイド配列を介して標的核酸内の特定のヌクレオチド配列に誘導する。CasXガイドRNAのタンパク質結合セグメントは、互いに相補的であり、ハイブリダイズして二本鎖RNA二重鎖(dsRNA二重鎖)を形成するヌクレオチドの2つのストレッチ(活性化因子の二重鎖形成セグメント及び標的化因子の二重鎖形成セグメント)を含む。このため、タンパク質結合セグメントは、dsRNA二重鎖を含む。
ある場合には、活性化因子と標的化因子との間に形成されたdsRNA二重鎖領域(すなわち、活性化因子/標的化因子dsRNA二重鎖)は(例えば、二重または単一ガイドRNAフォーマットで)、8〜25塩基対(bp)の範囲(例えば、8〜22、8〜18、8〜15、8〜12、12〜25、12〜22、12〜18、12〜15、13〜25、13〜22、13〜18、13〜15、14〜25、14〜22、14〜18、14〜15、15〜25、15〜22、15〜18、17〜25、17〜22、または17〜18bp、例えば、15bp、16bp、17bp、18bp、19bp、20bp、21bp等)を含む。ある場合には、二重鎖領域は(例えば、二重または単一ガイドRNAフォーマットで)、8以上のbp(例えば、10以上、12以上、15以上、または17以上のbp)を含む。ある場合には、二重鎖領域のすべてのヌクレオチドが対合されるとは限らないため、二重鎖形成領域は、バルジを含み得る(例えば、図6、パネルC及び図7を参照)。本明細書における「バルジ」という用語は、二本鎖二重鎖に寄与しないが、寄与するヌクレオチドによって5′及び3′が囲まれているヌクレオチド(1つのヌクレオチドであり得る)のストレッチを意味するように使用され、そのようなものとしてバルジは、二重鎖領域の一部とみなされる。ある場合には、活性化因子と標的化因子との間に形成されたdsRNA二重鎖(すなわち、活性化因子/標的化因子dsRNA二重鎖)は、1つ以上のバルジ(例えば、2つ以上、3つ以上、4つ以上のバルジ)を含む。ある場合には、活性化因子と標的化因子との間に形成されたdsRNA二重鎖(すなわち、活性化因子/標的化因子dsRNA二重鎖)は、2つ以上のバルジ(例えば、3つ以上、4つ以上のバルジ)を含む。ある場合には、活性化因子と標的化因子との間に形成されたdsRNA二重鎖(すなわち、活性化因子/標的化因子dsRNA二重鎖)は、1〜5のバルジ(例えば、1〜4、1〜3、2〜5、2〜4、または2〜3のバルジ)を含む。
このため、ある場合には、活性化因子及び標的化因子の二重鎖形成セグメントは、互いに70%〜100%の相補性(例えば、75%〜100%、80%〜10%、85%〜100%、90%〜100%、95%〜100%の相補性)を有する。ある場合には、活性化因子及び標的化因子の二重鎖形成セグメントは、互いに70%〜100%の相補性(例えば、75%〜100%、80%〜10%、85%〜100%、90%〜100%、95%〜100%の相補性)を有する。ある場合には、活性化因子及び標的化因子の二重鎖形成セグメントは、互いに85%〜100%の相補性(例えば、90%〜100%、95%〜100%の相補性)を有する。ある場合には、活性化因子及び標的化因子の二重鎖形成セグメントは、互いに70%〜95%の相補性(例えば、75%〜95%、80%〜95%、85%〜95%、90%〜95%の相補性)を有する。
換言すれば、いくつかの実施形態では、活性化因子と標的化因子との間に形成されたdsRNA二重鎖(すなわち、活性化因子/標的化因子dsRNA二重鎖)は、互いに70%〜100%の相補性(例えば、75%〜100%、80%〜10%、85%〜100%、90%〜100%、95%〜100%の相補性)を有するヌクレオチドの2つのストレッチを含む。ある場合には、活性化因子/標的化因子dsRNA二重鎖は、互いに85%〜100%の相補性(例えば、90%〜100%、95%〜100%の相補性)を有するヌクレオチドの2つのストレッチを含む。ある場合には、活性化因子/標的化因子dsRNA二重鎖は、互いに70%〜95%の相補性(例えば、75%〜95%、80%〜95%、85%〜95%、90%〜95%の相補性)を有するヌクレオチドの2つのストレッチを含む。
対象のCasXガイドRNAの二重鎖領域は(二重ガイドまたは単一ガイドRNAフォーマットで)、天然に存在する二重鎖領域に対して1つ以上(1、2、3、4、5等)の突然変異を含み得る。例えば、ある場合には、塩基対は維持され得るが、各セグメント(標的化因子及び活性化因子)からの塩基対に寄与するヌクレオチドは異なり得る。ある場合には、対象のCasXガイドRNAの二重鎖領域は、(天然に存在するCasXガイドRNAの)天然に存在する二重鎖領域と比較して、より多くの対合塩基、より少ない対合塩基、より小さいバルジ、より大きいバルジ、より少ないバルジ、より多いバルジ、またはそれらの任意の簡便な組み合わせを含む。
ある場合には、対象のCasXガイドRNAの活性化因子(例えば、活性化因子−RNA)は(二重または単一ガイドRNAフォーマットで)、少なくとも2つの内部RNA二重鎖(すなわち、活性化因子/標的化因子dsRNAに加えて2つの内部ヘアピン)を含む。活性化因子の内部RNA二重鎖(ヘアピン)は、活性化因子/標的化因子dsRNA二重鎖の5′に位置付けられ得る(例えば、図6、パネルC及び図7を参照。両方が活性化因子/標的化因子dsRNA二重鎖の5′に位置付けられた2つの内部ヘアピンを有する活性化因子を含む。)ある場合には、活性化因子は、活性化因子/標的化因子dsRNA二重鎖の5′に位置付けられた1つのヘアピンを含む。ある場合には、活性化因子は、活性化因子/標的化因子dsRNA二重鎖の5′に位置付けられた2つのヘアピンを含む。ある場合には、活性化因子は、活性化因子/標的化因子dsRNA二重鎖の5′に位置付けられた3つのヘアピンを含む。ある場合には、活性化因子は、活性化因子/標的化因子dsRNA二重鎖の5′に位置付けられた2つ以上のヘアピン(例えば、3つ以上または4つ以上のヘアピン)を含む。ある場合には、活性化因子は、活性化因子/標的化因子dsRNA二重鎖の5′に位置付けられた2〜5つのヘアピン(例えば、2〜4または2〜3つのヘアピン)を含む。
ある場合には、活性化因子−RNAは(例えば、二重または単一ガイドRNAフォーマットで)、例えば、図6及び図7のtracrRNAに示されるように、5′最端ヘアピンステムの5′に少なくとも2つのヌクレオチド(nt)(例えば、少なくとも3つまたは少なくとも4つのnt)を含む。ある場合には、活性化因子−RNAは(例えば、二重または単一ガイドRNAフォーマットで)、例えば、図6及び図7のtracrRNAに示されるように、5′最端ヘアピンステムの5′に少なくとも4つのntを含む。
ある場合には、活性化因子−RNAは(例えば、二重または単一ガイドフォーマットで)、65ヌクレオチド(nt)以上(例えば、66以上、67以上、68以上、69以上、70以上、または75以上のnt)の長さを有する。ある場合には、活性化因子−RNAは(例えば、二重または単一ガイドフォーマットで)、66nt以上(例えば、67以上、68以上、69以上、70以上、または75以上のnt)の長さを有する。ある場合には、活性化因子−RNAは(例えば、二重または単一ガイドフォーマットで)、67nt以上(例えば、68以上、69以上、70以上、または75以上のnt)の長さを有する。
ある場合には、活性化因子−RNAは(例えば、二重または単一ガイドフォーマットで)、活性化因子と標的化因子との間に形成されたdsRNA二重鎖(活性化因子/標的化因子dsRNA二重鎖)の5′に45以上のヌクレオチド(nt)(例えば、46以上、47以上、48以上、49以上、50以上、51以上、52以上、53以上、54以上、または55以上のnt)を含む。ある場合には、活性化因子は、天然に存在するCasX活性化因子に対して5′末端で短縮されている。ある場合には、活性化因子は、天然に存在するCasX活性化因子に対して5′末端で伸長されている。
様々なCas9ガイドRNAの例は、当該技術分野において見出すことができ、ある場合には、Cas9ガイドRNAに導入されたものと同様の異形もまた、本開示のCasXガイドRNAに導入され得る。例えば、Jinek et al.,Science.2012 Aug 17;337(6096):816−21、Chylinski et al.,RNA Biol.2013 May;10(5):726−37、Ma et al.,Biomed Res Int.2013;2013:270805、Hou et al.,Proc Natl Acad Sci USA.2013 Sep 24;110(39):15644−9、Jinek et al.,Elife.2013;2:e00471、Pattanayak et al.,Nat Biotechnol.2013 Sep;31(9):839−43、Qi et al,Cell.2013 Feb 28;152(5):1173−83、Wang et al.,Cell.2013 May 9;153(4):910−8、Auer et.al.,Genome Res.2013 Oct 31、Chen et.al.,Nucleic Acids Res.2013 Nov 1;41(20):e19、Cheng et.al.,Cell Res.2013 Oct;23(10):1163−71、Cho et.al.,Genetics.2013 Nov;195(3):1177−80、DiCarlo et al.,Nucleic Acids Res.2013 Apr;41(7):4336−43、Dickinson et.al.,Nat Methods.2013 Oct;10(10):1028−34、Ebina et.al.,Sci Rep.2013;3:2510、Fujii et.al,Nucleic Acids Res.2013 Nov 1;41(20):e187、Hu et.al.,Cell Res.2013 Nov;23(11):1322−5、Jiang et.al.,Nucleic Acids Res.2013 Nov 1;41(20):e188、Larson et.al.,Nat Protoc.2013 Nov;8(11):2180−96、Mali et.at.,Nat Methods.2013 Oct;10(10):957−63、Nakayama et.al.,Genesis.2013 Dec;51(12):835−43、Ran et.al.,Nat Protoc.2013 Nov;8(11):2281−308、Ran et.al.,Cell.2013 Sep 12;154(6):1380−9、Upadhyay et.al.,G3(Bethesda).2013 Dec 9;3(12):2233−8、Walsh et.al.,Proc Natl Acad Sci USA.2013 Sep 24;110(39):15514−5、Xie et.al.,Mol Plant.2013 Oct 9、Yang et.al.,Cell.2013 Sep 12;154(6):1370−9、Briner et al.,Mol Cell.2014 Oct 23;56(2):333−9、ならびに米国特許及び特許出願第8,906,616号、第8,895,308号、第8,889,418号、第8,889,356号、第8,871,445号、第8,865,406号、第8,795,965号、第8,771,945号、第8,697,359号、第20140068797号、第20140170753号、第20140179006号、第20140179770号、第20140186843号、第20140186919号、第20140186958号、第20140189896号、第20140227787号、第20140234972号、第20140242664号、第20140242699号、第20140242700号、第20140242702号、第20140248702号、第20140256046号、第20140273037号、第20140273226号、第20140273230号、第20140273231号、第20140273232号、第20140273233号、第20140273234号、第20140273235号、第20140287938号、第20140295556号、第20140295557号、第20140298547号、第20140304853号、第20140309487号、第20140310828号、第20140310830号、第20140315985号、第20140335063号、第20140335620号、第20140342456号、第20140342457号、第20140342458号、第20140349400号、第20140349405号、第20140356867号、第20140356956号、第20140356958号、第20140356959号、第20140357523号、第20140357530号、第20140364333号、及び第20140377868号を参照されたい。これらのすべては参照によりそれらの全体が本明細書に組み込まれる。
「活性化因子」または「活性化因子RNA」という用語は、本明細書では、CasX二重ガイドRNA(及びしたがって、「活性化因子」及び「標的化因子」が、例えば、介在ヌクレオチドによって一緒に連結される場合はCasX単一ガイドRNA)のtracrRNA様分子(tracrRNA:「トランス作用性CRISPR RNA」)を意味するように使用される。このため、例えば、CasXガイドRNA(dgRNAまたはsgRNA)は、活性化因子配列(例えば、tracrRNA配列)を含む。tracr分子(tracrRNA)は、CRISPR RNA分子(crRNA)とハイブリダイズしてCasX二重ガイドRNAを形成する、天然に存在する分子である。「活性化因子」という用語は、本明細書では、天然に存在するtracrRNAを包含するだけでなく、修飾(例えば、短縮、伸長、配列変異、塩基修飾、骨格修飾、連結修飾等)を有するtracrRNAを包含するように使用され、活性化因子は、tracrRNAの少なくとも1つの機能を保持する(例えば、CasXタンパク質が結合するdsRNA二重鎖に寄与する)。ある場合には、活性化因子は、CasXタンパク質と相互作用し得る1つ以上のステムループを提供する。活性化因子は、tracr配列(tracrRNA配列)を有すると称することができ、ある場合には、tracrRNAであるが、「活性化因子」という用語は、天然に存在するtracrRNAに限定されない。
ある場合には(例えば、ガイドRNAが単一ガイドフォーマットである場合には)、活性化因子−RNAは、対応する野生型tracrRNAに対して短縮されている(より短い)。ある場合には(例えば、ガイドRNAが単一ガイドフォーマットである場合には)、活性化因子−RNAは、対応する野生型tracrRNAに対して短縮されていない(より短くない)。ある場合には(例えば、ガイドRNAが単一ガイドフォーマットである場合には)、活性化因子−RNAは、50nt超(例えば、55nt超、60nt超、65nt超、70nt超、75nt超、80nt超)の長さを有する。ある場合には(例えば、ガイドRNAが単一ガイドフォーマットである場合には)、活性化因子−RNAは、80nt超の長さを有する。ある場合には(例えば、ガイドRNAが単一ガイドフォーマットである場合には)、活性化因子−RNAは、51〜90nt(例えば、51〜85、51〜84、55〜90、55〜85、55〜84、60〜90、60〜85、60〜84、65〜90、65〜85、65〜84、70〜90、70〜85、70〜84、75〜90、75〜85、75〜84、80〜90、80〜85、または80〜84nt)の範囲の長さを有する。ある場合には(例えば、ガイドRNAが単一ガイドフォーマットである場合には)、活性化因子−RNAは、80〜90ntの範囲の長さを有する。
「標的化因子」または「標的化因子RNA」という用語は、本明細書では、CasX二重ガイドRNAの(及びしたがって、「活性化因子」及び「標的化因子」が、例えば、介在ヌクレオチドによって一緒に連結される場合は、CasX単一ガイドRNAの)crRNA様分子(crRNA:「CRISPR RNA」)と称される。このため、例えば、CasXガイドRNA(dgRNAまたはsgRNA)は、ガイド配列及び二重鎖形成セグメント(例えば、crRNA反復とも称され得る、crRNAの二重鎖形成セグメント)を含む。標的化因子の標的化セグメント(標的核酸の標的配列とハイブリダイズするセグメント)の配列は、所望の標的核酸とハイブリダイズするために使用者によって修飾されるため、標的化因子の配列は、多くの場合、天然に存在しない配列である。しかしながら、活性化因子の二重鎖形成セグメントとハイブリダイズする(本明細書においてさらに詳細に説明される)標的化因子の二重鎖形成セグメントは、天然に存在する配列を含み得る(例えば、crRNA反復とも称され得る、天然に存在するcrRNAの二重鎖形成セグメントの配列を含み得る)。このため、標的化因子という用語は、本明細書では、標的化因子の一部(例えば、二重鎖形成セグメント)が多くの場合、crRNA由来の天然に存在する配列を含むという事実にもかかわらず、天然に存在するcrRNAと区別するために使用される。しかしながら、「標的化因子」という用語は、天然に存在するcrRNAを包含する。
上記のように、標的化因子は、CasXガイドRNAのガイド配列、及びCasXガイドRNAのタンパク質結合セグメントのdsRNA二重鎖の半分を形成するヌクレオチドのストレッチ(「二重鎖形成セグメント」)の両方を含む。対応するtracrRNA様分子(活性化因子)は、CasXガイドRNAのタンパク質結合セグメントのdsRNA二重鎖の残りの半分を形成するヌクレオチドのストレッチ(二重鎖形成セグメント)を含む。換言すれば、標的化因子のヌクレオチドのストレッチは、活性化因子のヌクレオチドのストレッチに相補的であり、それとハイブリダイズしてCasXガイドRNAのタンパク質結合セグメントのdsRNA二重鎖を形成する。そのようなものとして、各標的化因子は、対応する活性化因子(標的化因子とハイブリダイズする領域を有する)を有すると言うことができる。標的化因子分子は、追加としてガイド配列を提供する。このため、標的化因子及び(対応する対としての)活性化因子がハイブリダイズして、CasXガイドRNAを形成する。所与の天然に存在するcrRNAまたはtracrRNA分子の特定の配列は、RNA分子が見出される種に特徴的であり得る。好適な活性化因子及び標的化因子の例は、本明細書において提供される。
例示的なガイドRNA配列
図6(二重ガイドフォーマット)及び図7(二重ガイドフォーマット)に示されるガイドRNAは、CasX1の天然遺伝子座に由来する。下記のパラグラフで考察される配列について、及び下記の実施例に記載され、試験された配列について、tracrRNA及びcrRNA配列は、CasX1遺伝子座に由来していた。考えられる標的化因子−RNA及び活性化因子−RNAの同じパラメータ及び組が予想され、CasX1遺伝子座の配列をCasX2遺伝子座のものと比較することに由来し得る。例えば、CasX1 tracrRNA配列:UUAUUCCAUUACUUUGGAGCCAGUCCCAGCGACUAUGUCGUAUGGACGAAGCGCUUAUUUAUCGGAGA(配列番号25)及びUUAUUCCAUUACUUUGGAGCCAGUCCCAGCGACUAUGUCGUAUGGACGAAGCGCUUAUUUAUCGG(配列番号23)
を、CasX2 tracrRNA配列:
UUAUCUCAUUACUUUGAGAGCCAUCACCAGCGACUAUGUCGUAUGGGUAAAGCGCUUAUUUAUCGGAGA(配列番号26)及びUUAUCUCAUUACUUUGAGAGCCAUCACCAGCGACUAUGUCGUAUGGGUAAAGCGCUUAUUUAUCGG(配列番号27)と比較することができる。
CasX3遺伝子座について、tracrは、これらの230nt内にある可能性がある(相補性領域には下線が引かれている)。
同様に、CasX1 crRNA配列
CCGAUAAGUAAAACGCAUCAAAGNNNNNNNNNNNNNNNNNNNN(Nを有しない配列番号11、Nを有する配列番号61)は、CasX2 crRNA配列UCUCCGAUAAAUAAGAAGCAUCAAAGNNNNNNNNNNNNNNNNNNNN(Nを有しない配列番号13、Nを有する配列番号69)と比較することができる。
CasX3遺伝子座からのcrRNA反復は、GTTTACACACTCCCTCTCATAGGGT(配列番号54)、GTTTACACACTCCCTCTCATGAGGT(配列番号55)、TTTTACATACCCCCTCTCATGGGAT(配列番号56)、及びGTTTACACACTCCCTCTCATGGGGG(配列番号57)である。したがって、crRNA配列(例えば、CasX3遺伝子座からの)は、GUUUACACACUCCCUCUCAUAGGGUNNNNNNNNNNNNNNNNNNNN(Nを有しない配列番号14、Nを有する配列番号31)、GUUUACACACUCCCUCUCAUGAGGUNNNNNNNNNNNNNNNNNNNN(Nを有しない配列番号15、Nを有する配列番号32)、UUUUACAUACCCCCUCUCAUGGGAUNNNNNNNNNNNNNNNNNNNN(Nを有しない配列番号16、Nを有する配列番号33)、及び/またはGUUUACACACUCCCUCUCAUGGGGGNNNNNNNNNNNNNNNNNNNN(Nを有しない配列番号17、Nを有する配列番号34)を含み得る。
例示的な標的化因子−RNA(例えば、crRNA)配列
ある場合には、標的化因子−RNAは(例えば、二重または単一ガイドRNAフォーマットで)、(例えば、ガイド配列に加えて)crRNA配列CCGAUAAGUAAAACGCAUCAAAG(配列番号11)を含む(例えば、図6、パネルCのsgRNAを参照)。ある場合には、標的化因子−RNAは(例えば、二重または単一ガイドRNAフォーマットで)、crRNA配列CCGAUAAGUAAAACGCAUCAAAG(配列番号11)と80%以上の同一性(例えば、85%以上、90%以上、93%以上、95%以上、97%以上、98%以上、または100%の同一性)を有するヌクレオチド配列を含む。
ある場合には、標的化因子−RNAは、(例えば、ガイド配列に加えて)crRNA配列AUUUGAAGGUAUCUCCGAUAAGUAAAACGCAUCAAAG(配列番号12)を含む。ある場合には、標的化因子−RNAは、crRNA配列AUUUGAAGGUAUCUCCGAUAAGUAAAACGCAUCAAAG(配列番号12)と80%以上の同一性(例えば、85%以上、90%以上、93%以上、95%以上、97%以上、98%以上、または100%の同一性)を有するヌクレオチド配列を含む。
ある場合には、標的化因子−RNAは(例えば、二重または単一ガイドRNAフォーマットで)、(例えば、ガイド配列に加えて)crRNA配列UCUCCGAUAAAUAAGAAGCAUCAAAG(配列番号13)を含む。ある場合には、標的化因子−RNAは(例えば、二重または単一ガイドRNAフォーマットで)、crRNA配列UCUCCGAUAAAUAAGAAGCAUCAAAG(配列番号13)と80%以上の同一性(例えば、85%以上、90%以上、93%以上、95%以上、97%以上、98%以上、または100%の同一性)を有するヌクレオチド配列を含む。
ある場合には、標的化因子−RNAは(例えば、二重または単一ガイドRNAフォーマットで)、(例えば、ガイド配列に加えて)crRNA配列GUUUACACACUCCCUCUCAUAGGGU(配列番号14)を含む。ある場合には、標的化因子−RNAは(例えば、二重または単一ガイドRNAフォーマットで)、crRNA配列GUUUACACACUCCCUCUCAUAGGGU(配列番号14)と80%以上の同一性(例えば、85%以上、90%以上、93%以上、95%以上、97%以上、98%以上、または100%の同一性)を有するヌクレオチド配列を含む。
ある場合には、標的化因子−RNAは(例えば、二重または単一ガイドRNAフォーマットで)、(例えば、ガイド配列に加えて)crRNA配列GUUUACACACUCCCUCUCAUGAGGU(配列番号15)を含む。ある場合には、標的化因子−RNAは(例えば、二重または単一ガイドRNAフォーマットで)、crRNA配列GUUUACACACUCCCUCUCAUGAGGU(配列番号15)と80%以上の同一性(例えば、85%以上、90%以上、93%以上、95%以上、97%以上、98%以上、または100%の同一性)を有するヌクレオチド配列を含む。
ある場合には、標的化因子−RNAは(例えば、二重または単一ガイドRNAフォーマットで)、(例えば、ガイド配列に加えて)crRNA配列UUUUACAUACCCCCUCUCAUGGGAU(配列番号16)を含む。ある場合には、標的化因子−RNAは(例えば、二重または単一ガイドRNAフォーマットで)、crRNA配列UUUUACAUACCCCCUCUCAUGGGAU(配列番号16)と80%以上の同一性(例えば、85%以上、90%以上、93%以上、95%以上、97%以上、98%以上、または100%の同一性)を有するヌクレオチド配列を含む。
ある場合には、標的化因子−RNAは(例えば、二重または単一ガイドRNAフォーマットで)、(例えば、ガイド配列に加えて)crRNA配列GUUUACACACUCCCUCUCAUGGGGG(配列番号17)を含む。ある場合には、標的化因子−RNAは(例えば、二重または単一ガイドRNAフォーマットで)、crRNA配列GUUUACACACUCCCUCUCAUGGGGG(配列番号17)と80%以上の同一性(例えば、85%以上、90%以上、93%以上、95%以上、97%以上、98%以上、または100%の同一性)を有するヌクレオチド配列を含む。
ある場合には、標的化因子−RNAは(例えば、二重または単一ガイドRNAフォーマットで)、(例えば、ガイド配列に加えて)配列番号11及び13のうちのいずれか1つに記載されるcrRNA配列を含む。ある場合には、標的化因子−RNAは(例えば、二重または単一ガイドRNAフォーマットで)、配列番号11及び13のうちのいずれか1つに記載されるcrRNA配列と80%以上の同一性(例えば、85%以上、90%以上、93%以上、95%以上、97%以上、98%以上、または100%の同一性)を有するヌクレオチド配列を含む。
ある場合には、標的化因子−RNAは(例えば、ガイド配列に加えて)、配列番号11〜13のうちのいずれか1つに記載されるcrRNA配列を含む。ある場合には、標的化因子−RNAは、配列番号11〜13のうちのいずれか1つに記載されるcrRNA配列と80%以上の同一性(例えば、85%以上、90%以上、93%以上、95%以上、97%以上、98%以上、または100%の同一性)を有するヌクレオチド配列を含む。
ある場合には、標的化因子−RNAは、(例えば、ガイド配列に加えて)配列番号14〜17のうちのいずれか1つに記載されるcrRNA配列を含む。ある場合には、標的化因子−RNAは、配列番号14〜17のうちのいずれか1つに記載されるcrRNA配列と80%以上の同一性(例えば、85%以上、90%以上、93%以上、95%以上、97%以上、98%以上、または100%の同一性)を有するヌクレオチド配列を含む。
ある場合には、標的化因子−RNAは、(例えば、ガイド配列に加えて)配列番号11〜17のうちのいずれか1つに記載されるcrRNA配列を含む。ある場合には、標的化因子−RNAは、配列番号11〜17のうちのいずれか1つに記載されるcrRNA配列と80%以上の同一性(例えば、85%以上、90%以上、93%以上、95%以上、97%以上、98%以上、または100%の同一性)を有するヌクレオチド配列を含む。
例示的な活性化因子−RNA(例えば、tracrRNA)配列
ある場合には、活性化因子−RNAは(例えば、二重または単一ガイドRNAフォーマットで)、tracrRNA配列ACAUCUGGCGCGUUUAUUCCAUUACUUUGGAGCCAGUCCCAGCGACUAUGUCGUAUGGACGAAGCGCUUAUUUAUCGGAGA(配列番号21)を含む。ある場合には、標的化因子−RNAは(例えば、二重または単一ガイドRNAフォーマットで)、tracrRNA配列ACAUCUGGCGCGUUUAUUCCAUUACUUUGGAGCCAGUCCCAGCGACUAUGUCGUAUGGACGAAGCGCUUAUUUAUCGGAGA(配列番号21)と80%以上の同一性(例えば、85%以上、90%以上、93%以上、95%以上、97%以上、98%以上、99%以上、または100%の同一性)を有するヌクレオチド配列を含む。
ある場合には、活性化因子−RNAは(例えば、二重または単一ガイドRNAフォーマットで)、tracrRNA配列ACAUCUGGCGCGUUUAUUCCAUUACUUUGGAGCCAGUCCCAGCGACUAUGUCGUAUGGACGAAGCGCUUAUUUAUCGG(配列番号22)を含む。ある場合には、標的化因子−RNAは(例えば、二重または単一ガイドRNAフォーマットで)、tracrRNA配列ACAUCUGGCGCGUUUAUUCCAUUACUUUGGAGCCAGUCCCAGCGACUAUGUCGUAUGGACGAAGCGCUUAUUUAUCGG(配列番号22)と80%以上の同一性(例えば、85%以上、90%以上、93%以上、95%以上、97%以上、98%以上、99%以上、または100%の同一性)を有するヌクレオチド配列を含む。
ある場合には、活性化因子−RNAは(例えば、二重または単一ガイドRNAフォーマットで)、tracrRNA配列UUAUUCCAUUACUUUGGAGCCAGUCCCAGCGACUAUGUCGUAUGGACGAAGCGCUUAUUUAUCGG(配列番号23)を含む(例えば、図6のsgRNAを参照)。ある場合には、標的化因子−RNAは(例えば、二重または単一ガイドRNAフォーマットで)、tracrRNA配列UUAUUCCAUUACUUUGGAGCCAGUCCCAGCGACUAUGUCGUAUGGACGAAGCGCUUAUUUAUCGG(配列番号23)と80%以上の同一性(例えば、85%以上、90%以上、93%以上、95%以上、97%以上、98%以上、99%以上、または100%の同一性)を有するヌクレオチド配列を含む。
ある場合には、活性化因子−RNAは(例えば、二重または単一ガイドRNAフォーマットで)、tracrRNA配列AAGUAGUAAAUUACAUCUGGCGCGUUUAUUCCAUUACUUUGGAGCCAGUCCCAGCGACUAUGUCGUAUGGACGAAGCGCUUAUUUAUCGGAGA(配列番号24)を含む(例えば、図6のsgRNAを参照)。ある場合には、標的化因子−RNAは(例えば、二重または単一ガイドRNAフォーマットで)、tracrRNA配列AAGUAGUAAAUUACAUCUGGCGCGUUUAUUCCAUUACUUUGGAGCCAGUCCCAGCGACUAUGUCGUAUGGACGAAGCGCUUAUUUAUCGGAGA(配列番号24)と80%以上の同一性(例えば、85%以上、90%以上、93%以上、95%以上、97%以上、98%以上、99%以上、または100%の同一性)を有するヌクレオチド配列を含む。
ある場合には、活性化因子−RNAは(例えば、二重または単一ガイドRNAフォーマットで)、tracrRNA配列UUAUUCCAUUACUUUGGAGCCAGUCCCAGCGACUAUGUCGUAUGGACGAAGCGCUUAUUUAUCGGAGA(配列番号25)を含む(例えば、図6のsgRNAを参照)。ある場合には、標的化因子−RNAは(例えば、二重または単一ガイドRNAフォーマットで)、tracrRNA配列UUAUUCCAUUACUUUGGAGCCAGUCCCAGCGACUAUGUCGUAUGGACGAAGCGCUUAUUUAUCGGAGA(配列番号25)と80%以上の同一性(例えば、85%以上、90%以上、93%以上、95%以上、97%以上、98%以上、99%以上、または100%の同一性)を有するヌクレオチド配列を含む。
ある場合には、活性化因子−RNAは(例えば、二重または単一ガイドRNAフォーマットで)、tracrRNA配列UUAUCUCAUUACUUUGAGAGCCAUCACCAGCGACUAUGUCGUAUGGGUAAAGCGCUUAUUUAUCGGAGA(配列番号26)を含む。ある場合には、標的化因子−RNAは(例えば、二重または単一ガイドRNAフォーマットで)、tracrRNA配列UUAUCUCAUUACUUUGAGAGCCAUCACCAGCGACUAUGUCGUAUGGGUAAAGCGCUUAUUUAUCGGAGA(配列番号26)と80%以上の同一性(例えば、85%以上、90%以上、93%以上、95%以上、97%以上、98%以上、99%以上、または100%の同一性)を有するヌクレオチド配列を含む。
ある場合には、活性化因子−RNAは(例えば、二重または単一ガイドRNAフォーマットで)、tracrRNA配列UUAUCUCAUUACUUUGAGAGCCAUCACCAGCGACUAUGUCGUAUGGGUAAAGCGCUUAUUUAUCGG(配列番号27)を含む。ある場合には、標的化因子−RNAは(例えば、二重または単一ガイドRNAフォーマットで)、tracrRNA配列UUAUCUCAUUACUUUGAGAGCCAUCACCAGCGACUAUGUCGUAUGGGUAAAGCGCUUAUUUAUCGG(配列番号27)と80%以上の同一性(例えば、85%以上、90%以上、93%以上、95%以上、97%以上、98%以上、99%以上、または100%の同一性)を有するヌクレオチド配列を含む。
ある場合には、活性化因子−RNAは(例えば、二重または単一ガイドRNAフォーマットで)、以下の配列内からのtracrRNA配列を含む。
ある場合には、標的化因子−RNAは(例えば、二重または単一ガイドRNAフォーマットで)、以下の配列内からのtracrRNA配列と80%以上の同一性(例えば、85%以上、90%以上、93%以上、95%以上、97%以上、98%以上、99%以上、または100%の同一性)を有するヌクレオチド配列を含む。
ある場合には、活性化因子−RNAは(例えば、二重または単一ガイドRNAフォーマットで)、配列番号21〜27のうちのいずれか1つに記載されるtracrRNA配列を含む。ある場合には、標的化因子−RNAは(例えば、二重または単一ガイドRNAフォーマットで)、配列番号21〜27のうちのいずれか1つに記載されるtracrRNA配列と80%以上の同一性(例えば、85%以上、90%以上、93%以上、95%以上、97%以上、98%以上、99%以上、または100%の同一性)を有するヌクレオチド配列を含む。
ある場合には、活性化因子−RNAは(例えば、二重または単一ガイドRNAフォーマットで)、配列番号21〜27のうちのいずれか1つに記載されるtracrRNA配列を含む。ある場合には、標的化因子−RNAは(例えば、二重または単一ガイドRNAフォーマットで)、配列番号21〜28のうちのいずれか1つに記載されるtracrRNA配列と80%以上の同一性(例えば、85%以上、90%以上、93%以上、95%以上、97%以上、98%以上、99%以上、または100%の同一性)を有するヌクレオチド配列を含む。
ある場合には、CasX単一ガイドRNAは、配列UUAUUCCAUUACUUUGGAGCCAGUCCCAGCGACUAUGUCGUAUGGACGAAGCGCUUAUUUAUCGGgaaaCCGAUAAGUAAAACGCAUCAAAG(配列番号41)を含む。ある場合には、標的化因子−RNAは、tracrRNA配列UUAUUCCAUUACUUUGGAGCCAGUCCCAGCGACUAUGUCGUAUGGACGAAGCGCUUAUUUAUCGGgaaaCCGAUAAGUAAAACGCAUCAAAG(配列番号41)と80%以上の同一性(例えば、85%以上、90%以上、93%以上、95%以上、97%以上、98%以上、99%以上、または100%の同一性)を有するヌクレオチド配列を含む。
ある場合には、CasX単一ガイドRNAは、配列ACAUCUGGCGCGUUUAUUCCAUUACUUUGGAGCCAGUCCCAGCGACUAUGUCGUAUGGACGAAGCGCUUAUUUAUCGGAGAgaaaCCGAUAAGUAAAACGCAUCAAAG(配列番号42)を含む。ある場合には、標的化因子−RNAは、tracrRNA配列ACAUCUGGCGCGUUUAUUCCAUUACUUUGGAGCCAGUCCCAGCGACUAUGUCGUAUGGACGAAGCGCUUAUUUAUCGGAGAgaaaCCGAUAAGUAAAACGCAUCAAAG(配列番号42)と80%以上の同一性(例えば、85%以上、90%以上、93%以上、95%以上、97%以上、98%以上、99%以上、または100%の同一性)を有するヌクレオチド配列を含む。
ある場合には、CasX単一ガイドRNAは、配列UUAUCUCAUUACUUUGAGAGCCAUCACCAGCGACUAUGUCGUAUGGGUAAAGCGCUUAUUUAUCGGgaaaUCUCCGAUAAAUAAGAAGCAUCAAAG(配列番号43)を含む。ある場合には、標的化因子−RNAは、tracrRNA配列UUAUCUCAUUACUUUGAGAGCCAUCACCAGCGACUAUGUCGUAUGGGUAAAGCGCUUAUUUAUCGGgaaaUCUCCGAUAAAUAAGAAGCAUCAAAG(配列番号43)と80%以上の同一性(例えば、85%以上、90%以上、93%以上、95%以上、97%以上、98%以上、99%以上、または100%の同一性)を有するヌクレオチド配列を含む。
ある場合には、CasX単一ガイドRNAは、配列番号41〜43のうちのいずれか1つに記載される配列を含む。ある場合には、標的化因子−RNAは、配列番号41〜43のうちのいずれか1つに記載されるtracrRNA配列と80%以上の同一性(例えば、85%以上、90%以上、93%以上、95%以上、97%以上、98%以上、99%以上、または100%の同一性)を有するヌクレオチド配列を含む。
CASX系
本開示は、CasX系を提供する。本開示のCasX系は、a)本開示のCasXポリペプチド及びCasXガイドRNA;b)本開示のCasXポリペプチド、CasXガイドRNA、及びドナーテンプレート核酸;c)本開示のCasX融合ポリペプチド及びCasXガイドRNA;d)本開示のCasX融合ポリペプチド、CasXガイドRNA、及びドナーテンプレート核酸;e)本開示のCasXポリペプチドをコードするmRNA、及びCasXガイドRNA;f)本開示のCasXポリペプチドをコードするmRNA、CasXガイドRNA、及びドナーテンプレート核酸;g)本開示のCasX融合ポリペプチドをコードするmRNA、及びCasXガイドRNA;h)本開示のCasX融合ポリペプチドをコードするmRNA、CasXガイドRNA、及びドナーテンプレート核酸;i)本開示のCasXポリペプチドをコードするヌクレオチド配列及びCasXガイドRNAをコードするヌクレオチド配列を含む組み換え発現ベクター;j)本開示のCasXポリペプチドをコードするヌクレオチド配列、CasXガイドRNAをコードするヌクレオチド配列、及びドナーテンプレート核酸をコードするヌクレオチド配列を含む組み換え発現ベクター;k)本開示のCasX融合ポリペプチドをコードするヌクレオチド配列及びCasXガイドRNAをコードするヌクレオチド配列を含む組み換え発現ベクター;l)本開示のCasX融合ポリペプチドをコードするヌクレオチド配列、CasXガイドRNAをコードするヌクレオチド配列、及びドナーテンプレート核酸をコードするヌクレオチド配列を含む組み換え発現ベクター;m)本開示のCasXポリペプチドをコードするヌクレオチド配列を含む第1の組み換え発現ベクター、CasXガイドRNAをコードするヌクレオチド配列を含む第2の組み換え発現ベクター;n)本開示のCasXポリペプチドをコードするヌクレオチド配列を含む第1の組み換え発現ベクター、及びCasXガイドRNAをコードするヌクレオチド配列を含む第2の組み換え発現ベクター、及びドナーテンプレート核酸;o)本開示のCasX融合ポリペプチドをコードするヌクレオチド配列を含む第1の組み換え発現ベクター、及びCasXガイドRNAをコードするヌクレオチド配列を含む第2の組み換え発現ベクター;p)本開示のCasX融合ポリペプチドをコードするヌクレオチド配列を含む第1の組み換え発現ベクター、及びCasXガイドRNAをコードするヌクレオチド配列を含む第2の組み換え発現ベクター、及びドナーテンプレート核酸;q)本開示のCasXポリペプチドをコードするヌクレオチド配列、第1のCasXガイドRNAをコードするヌクレオチド配列、及びCasXガイドRNAをコードするヌクレオチド配列を含む組み換え発現ベクター;もしくはr)本開示のCasX融合ポリペプチドをコードするヌクレオチド配列、第1のCasXガイドRNAをコードするヌクレオチド配列、及び第2のCasXガイドRNAをコードするヌクレオチド配列を含む組み換え発現ベクター;または(a)〜(r)のうちの1つのいくつかの異形を含み得る。
核酸
本開示は、ドナーポリヌクレオチド配列、CasXポリペプチドをコードするヌクレオチド配列(例えば、野生型CasXタンパク質、ニッカーゼCasXタンパク質、dCasXタンパク質、キメラCasXタンパク質等)、CasXガイドRNA、及びCasXガイドRNAをコードするヌクレオチド配列(二重ガイドRNAフォーマットの場合に2つの別個のヌクレオチド配列を含み得るか、または単一ガイドRNAフォーマットの場合に単一ヌクレオチド配列を含み得る)のうちの1つ以上を含む、1つ以上の核酸を提供する。本開示は、CasX融合ポリペプチドをコードするヌクレオチド配列を含む、核酸を提供する。本開示は、CasXポリペプチドをコードするヌクレオチド配列を含む、組み換え発現ベクターを提供する。本開示は、CasX融合ポリペプチドをコードするヌクレオチド配列を含む、組み換え発現ベクターを提供する。本開示は、a)CasXポリペプチドをコードするヌクレオチド配列、及びb)CasXガイドRNA(複数可)をコードするヌクレオチド配列を含む、組み換え発現ベクターを提供する。本開示は、a)CasX融合ポリペプチドをコードするヌクレオチド配列、及びb)CasXガイドRNA(複数可)をコードするヌクレオチド配列を含む、組み換え発現ベクターを提供する。ある場合には、CasXタンパク質をコードするヌクレオチド配列及び/またはCasXガイドRNAをコードするヌクレオチド配列は、一般に好まれる細胞型(例えば、原核細胞、真核細胞、植物細胞、動物細胞、哺乳動物細胞、霊長類細胞、齧歯類細胞、ヒト細胞等)において動作可能なプロモーターに動作可能に連結される。
ある場合には、本開示のCasXポリペプチドをコードするヌクレオチド配列は、コドン最適化される。この種類の最適化は、同じタンパク質をコードしながら、意図した宿主生物または細胞のコドン優先性を模倣するように、CasXをコードするヌクレオチド配列の突然変異を伴い得る。このため、コドンは変更され得るが、コードされたタンパク質は、変更されないままである。例えば、意図した標的細胞がヒト細胞であった場合、ヒトコドンで最適化されたCasXをコードするヌクレオチド配列を使用することができた。別の非限定例として、意図した宿主細胞がマウス細胞であった場合、次いでマウスコドンで最適化されたCasXをコードするヌクレオチド配列を生成することができた。別の非限定例として、意図した宿主細胞が植物細胞であった場合、次いで植物コドンで最適化されたCasXをコードするヌクレオチド配列を生成することができた。別の非限定例として、意図した宿主細胞が昆虫細胞であった場合、次いで昆虫コドンで最適化されたCasXをコードするヌクレオチド配列を生成することができた。
本開示は、(ある場合には、異なる組み換え発現ベクター中、またある場合には、同じ組み換え発現ベクター中に)以下を含む1つ以上の組み換え発現ベクターを提供する。(i)ドナーテンプレート核酸のヌクレオチド配列(ドナーテンプレートは、標的核酸(例えば、標的ゲノム)の標的配列に対する相同性を有するヌクレオチド配列を含む)、(ii)標的ゲノム(例えば、単一または二重ガイドRNA)の標的遺伝子座の標的配列にハイブリダイズするCasXガイドRNAをコードするヌクレオチド配列(例えば、真核細胞などの標的細胞中で動作可能なプロモーターに動作可能に連結される)、及び(iii)CasXタンパク質をコードするヌクレオチド配列(例えば、真核細胞などの標的細胞中で動作可能なプロモーターに動作可能に連結される)。本開示は、(ある場合には、異なる組み換え発現ベクター中、またある場合には、同じ組み換え発現ベクター中に)以下を含む1つ以上の組み換え発現ベクターを提供する。(i)ドナーテンプレート核酸のヌクレオチド配列(ドナーテンプレートは、標的核酸(例えば、標的ゲノム)の標的配列に対する相同性を有するヌクレオチド配列を含む))、及び(ii)標的ゲノム(例えば、単一または二重ガイドRNA)の標的遺伝子座の標的配列にハイブリダイズするCasXガイドRNAをコードするヌクレオチド配列(例えば、真核細胞などの標的細胞中で動作可能なプロモーターに動作可能に連結される)。本開示は、(ある場合には、異なる組み換え発現ベクター中、またある場合には、同じ組み換え発現ベクター中に)以下を含む1つ以上の組み換え発現ベクターを提供する。(i)標的ゲノム(例えば、単一または二重ガイドRNA)の標的遺伝子座の標的配列にハイブリダイズするCasXガイドRNAをコードするヌクレオチド配列(例えば、真核細胞などの標的細胞中で動作可能なプロモーターに動作可能に連結される)、及び(ii)CasXタンパク質をコードするヌクレオチド配列(例えば、真核細胞などの標的細胞中で動作可能なプロモーターに動作可能に連結される)。
好適な発現ベクターとしては、ウイルス発現ベクター(例えば、ワクシニアウイルスに基づくウイルスベクター、ポリオウイルス、アデノウイルス(例えば、Li et al.,Invest Opthalmol Vis Sci 35:2543 2549,1994、Borras et al.,Gene Ther 6:515 524,1999、Li and Davidson,PNAS 92:7700 7704,1995、Sakamoto et al.,H Gene Ther 5:1088 1097,1999、WO94/12649、WO93/03769、WO93/19191、WO94/28938、WO95/11984、及びWO95/00655を参照);アデノ関連ウイルス(AAV)(例えば、Ali et al.,Hum Gene Ther 9:81 86,1998,Flannery et al.,PNAS 94:6916 6921,1997、Bennett et al.,Invest Opthalmol Vis Sci 38:2857 2863,1997、Jomary et al.,Gene Ther 4:683 690,1997、Rolling et al.,Hum Gene Ther 10:641 648,1999、Ali et al.,Hum Mol Genet 5:591 594,1996、Srivastava in WO93/09239、Samulski et al.,J.Vir.(1989)63:3822−3828、Mendelson et al.,Virol.(1988)166:154−165、及びFlotte et al.,PNAS(1993)90:10613−10617を参照);SV40;ヘルペス単純ウイルス;ヒト免疫不全ウイルス(例えば、Miyoshi et al.,PNAS 94:10319 23,1997、Takahashi et al.,J Virol 73:7812 7816,1999を参照);レトロウイルスベクター(例えば、マウス白血病ウイルス、脾壊死ウイルス、及びレトロウイルスに由来するベクター、例えば、ラウス肉腫ウイルス、ハーベイ肉腫ウイルス、トリ白血病ウイルス、レンチウイルス、ヒト免疫不全ウイルス、骨髄増殖性肉腫ウイルス、及び哺乳動物腫瘍ウイルス)等が挙げられる。ある場合には、本開示の組み換え発現ベクターは、組み換えアデノ関連ウイルス(AAV)ベクターである。ある場合には、本開示の組み換え発現ベクターは、組み換えレンチウイルスベクターである。ある場合には、本開示の組み換え発現ベクターは、組み換えレトロウイルスベクターである。
利用される宿主/ベクター系に応じて、複数の好適な転写及び翻訳制御要素(構成的及び誘導的プロモーター、転写エンハンサー要素、転写ターミネーター等を含む)のうちのいずれかが、発現ベクター内で使用され得る。
いくつかの実施形態では、CasXガイドRNAをコードするヌクレオチド配列は、制御要素、例えば、プロモーターなどの転写制御要素に動作可能に連結される。いくつかの実施形態では、CasXタンパク質またはCasX融合ポリペプチドをコードするヌクレオチド配列は、制御要素、例えば、プロモーターなどの転写抑制要素に動作可能に連結される。
転写制御要素は、プロモーターであり得る。ある場合には、プロモーターは、構成的活性型のプロモーターである。ある場合には、プロモーターは、調節可能なプロモーターである。ある場合には、プロモーターは、誘導性プロモーターである。ある場合には、プロモーターは、組織特異的プロモーターである。ある場合には、プロモーターは、細胞型特異的プロモーターである。ある場合には、転写制御要素(例えば、プロモーター)は、標的細胞型または標的細胞集団において機能的である。例えば、ある場合には、転写制御要素は、真核細胞、例えば、造血幹細胞(例えば、動員された末梢血(mPB)CD34(+)細胞、骨髄(BM)CD34(+)細胞等)において機能的であり得る。
真核細胞プロモーター(真核細胞中で機能的なプロモーター)の非限定例としては、EF1α、最初期のサイトメガロウイルス(CMV)由来のもの、単純ヘルペスウイルス(HSV)チミジンキナーゼ、早期及び後期SV40、レトロウイルス由来の長い末端反復(LTR)、及びマウスメタロチオネイン−Iが挙げられる。適切なベクター及びプロモーターの選択は、十分に当業者のレベル内である。発現ベクターはまた、翻訳開始のためのリボソーム結合部位及び転写ターミネーターを含有することができる。発現ベクターはまた、発現を増幅するための適切な配列を含むことができる。発現ベクターはまた、CasXタンパク質に融合され得、したがってキメラCasXポリペプチドをもたらす、タンパク質タグ(例えば、6xHisタグ、ヘマグルチニンタグ、蛍光タンパク質等)をコードするヌクレオチド配列を含み得る。
いくつかの実施形態では、CasXガイドRNA及び/またはCasX融合ポリペプチドをコードするヌクレオチド配列は、誘導性プロモーターに動作可能に連結される。いくつかの実施形態では、CasXガイドRNA及び/またはCasX融合タンパク質をコードするヌクレオチド配列は、構成的プロモーターに動作可能に連結される。
プロモーターは、構成的活性型プロモーター(すなわち、構成的に活性/「ON」状態であるプロモーター)であり得、誘導性プロモーターであってもよく(すなわち、活性/「ON」または不活性/「OFF」状態が外部刺激、例えば、特定の温度、化合物、またはタンパク質の存在によって制御されるプロモーター)、空間的制約のあるプロモーター(すなわち、転写制御要素、エンハンサー等)(例えば、組織特異的プロモーター、細胞型特異的プロモーター等)であってよく、また時間的制約のあるプロモーターであってもよい(すなわち、プロモーターは、胚発達の特定段階中、または生物学的過程の特定段階、例えば、マウスにおける毛包サイクル中に「ON」状態または「OFF」状態である)。
好適なプロモーターは、ウイルスに由来し得るため、ウイルスプロモーターと称され得るか、またはそれらは原核生物もしくは真核生物を含む任意の生物に由来し得る。好適なプロモーターを使用して、任意のRNAポリメラーゼ(例えば、pol I、pol II、pol III)によって発現を駆動することができる。例示的なプロモーターとしては、SV40早期プロモーター、マウス乳腺腫瘍ウイルスの長い末端配列(LTR)プロモーター;アデノウイルス主要後期プロモーター(Ad MLP);単純ヘルペスウイルス(HSV)プロモーター、サイトメガロウイルス(CMV)プロモーター、例えばCMV最初期プロモーター領域(CMVIE)、ラウス肉腫ウイルス(RSV)プロモーター、ヒトU6小核プロモーター(U6)(Miyagishi et al.,Nature Biotechnology 20,497−500(2002)、強化U6プロモーター(例えば、Xia et al.,Nucleic Acids Res.2003 Sep 1;31(17)、ヒトH1プロモーター(H1)等が挙げられるが、これらに限定されない。
ある場合には、CasXガイドRNAをコードするヌクレオチド配列は、真核細胞中で動作可能なプロモーター(例えば、U6プロモーター、強化U6プロモーター、H1プロモーター等)に動作可能に連結される(その制御下にある)。当業者によって理解されるように、U6プロモーター(例えば、真核細胞中)、または別のPolIIIプロモーターを使用して核酸(例えば、発現ベクター)からRNA(例えば、ガイドRNA)を発現するとき、いくつかのTが並んでいる場合にRNAは、突然変異される必要があり得る(RNA中のUをコードする)。これは、DNA中のTの連続(例えば、5つのT)は、ポリメラーゼIII(polIII)のターミネーターとして作用し得る。このため、真核細胞中のガイドRNA(例えば、二重ガイドまたは単一ガイドフォーマットの活性化因子部分及び/または標的化因子部分)の転写を保証するために、時としてガイドRNAをコードする配列を修飾してTの連続を除去する必要性があり得る。ある場合には、CasXタンパク質(例えば、野生型CasXタンパク質、ニッカーゼCasXタンパク質、dCasXタンパク質、キメラCasXタンパク質等)をコードするヌクレオチド配列は、真核細胞中で動作可能なプロモーター(例えば、CMVプロモーター、EF1αプロモーター、エストロゲン受容体調節型プロモーター等)に動作可能に連結される。
誘導性プロモーターの例としては、T7 RNAポリメラーゼプロモーター、T3 RNAポリメラーゼプロモーター、イソプロピル−β−D−チオガラクトピラノシド(IPTG)調節型プロモーター、ラクトース誘導型プロモーター、ヒートショックプロモーター、テトラサイクリン調節型プロモーター、ステロイド調節型プロモーター、金属調節型プロモーター、エストロゲン受容体調節型プロモーター等が挙げられるが、これらに限定されない。したがって、誘導性プロモーターは、ドキシサイクリン;エストロゲン及び/またはエストロゲン類似体;IPTG等が挙げられるが、これらに限定されない分子によって調節され得る。
使用に適した誘導性プロモーターとしては、本明細書に記載されるか、または当業者に既知の任意の誘導性プロモーターが挙げられる。誘導性プロモーターの例としては、無制限に、アルコール調節型プロモーター、テトラサイクリン調節型プロモーターなどの化学的/生化学的調節型及び物理的調節型プロモーター(例えば、アンヒドロテトラサイクリン(aTc)応答性プロモーター及び他のテトラサイクリン応答性プロモーター系(テトラサイクリン抑制因子タンパク質(tetR)、テトラサイクリンオペレーター配列(tetO)、及びテトラサイクリントランス活性化因子融合タンパク質(tTA)を含む)、ステロイド調節型プロモーター(例えば、ラットグルココルチコイド受容体、ヒトエストロゲン受容体、ガエクジソン受容体に基づくプロモーター、及びステロイド/レチノイド/甲状腺受容体スーパーファミリー由来のプロモーター)、金属調節型プロモーター(例えば、酵母、マウス、及びヒトからのメタロチオネイン(金属イオンに結合し、封鎖するタンパク質)に由来するプロモーター、病因調節型プロモーター(例えば、サリチル酸、エチレン、またはベンゾチアジアゾール(BTH)によって誘導される)、温度/熱誘導性プロモーター(例えば、ヒートショックプロモーター)、ならびに光調節型プロモーター(例えば、植物細胞由来の光応答性プロモーター)が挙げられる。
ある場合には、プロモーターは、空間的制約のあるプロモーター(すなわち、細胞型特異的プロモーター、組織特異的プロモーター等)であり、それにより多細胞生物において、プロモーターは、特異的細胞のサブセットにおいて活性(すなわち、「ON」)である。空間的制約のあるプロモーターはまた、エンハンサー、転写制御要素、制御配列等と称され得る。任意の簡便な空間的制約のあるプロモーターは、そのプロモーターが、標的宿主細胞(例えば、真核細胞、原核細胞)中で機能的である限り使用することができる。
ある場合には、プロモーターは、可逆的プロモーターである。可逆的誘導性プロモーターを含む好適な可逆的プロモーターは、当該技術分野において既知である。そのような可逆的プロモーターは、多くの生物、例えば真核生物及び原核生物から単離され、由来し得る。第2の生物において使用するための第1の生物(第1は原核生物及び第2は真核生物、第1は真核生物及び第2は原核生物)に由来する可逆的プロモーターの修飾は、当該技術分野において周知である。そのような可逆的プロモーター、及びそのような可逆的プロモーターに基づくだけでなく、追加の制御タンパク質を含む系としては、アルコール調節型プロモーター(例えば、アルコールデヒドロゲナーゼI(alcA)遺伝子プロモーター、アルコールトランス活性化因子タンパク質(AlcR)に応答性のプロモーター等)、テトラサイクリン調節型プロモーター(例えば、TetActivators、TetON、TetOFF等を含むプロモーター系)、ステロイド調節型プロモーター(例えば、ラットグルココルチコイド受容体プロモーター系、ヒトエストロゲン受容体プロモーター系、レチノイドプロモーター系、甲状腺プロモーター系、エクジソンプロモーター系、ミフェプリストンプロモーター系等)、金属調節型プロモーター(例えば、メタロチオネインプロモーター系等)、病原体関連調節型プロモーター(例えば、サリチル酸調節型プロモーター、エチレン調節型プロモーター、ベンゾチアジアゾール調節型プロモーター等)、温度調節型プロモーター(例えば、ヒートショック誘導性プロモーター(例えば、HSP−70、HSP−90、ダイズヒートショックプロモーター等)、光調節型プロモーター、合成誘導性プロモーター等が挙げられるが、これらに限定されない。
核酸(例えば、ドナーポリヌクレオチド配列を含む核酸、CasXタンパク質及び/またはCasXガイドRNAをコードする1つ以上の核酸等)を宿主細胞に導入する方法は、当該技術分野において既知であり、任意の簡便な方法を使用して、核酸(例えば、発現構築物)を細胞に導入することができる。好適な方法としては、例えば、ウイルス感染、形質移入、リポフェクション、電気穿孔、リン酸カルシウム沈降、ポリエチレンイミン(PEI)媒介型形質移入、DEAE−デキストラン媒介型形質移入、リポソーム媒介型形質移入、粒子ガン技術、リン酸カルシウム沈降、直接マイクロインジェクション、ナノ粒子媒介型核酸送達等が挙げられる。
組み換え発現ベクターを細胞に導入することは、任意の培養培地中、細胞の生存を促進する任意の培養条件下で起こり得る。組み換え発現ベクターを標的細胞に導入することは、インビボまたはエクスビボで実行され得る。組み換え発現ベクターを標的細胞に導入することは、インビトロで実行され得る。
いくつかの実施形態では、CasXタンパク質は、RNAとして提供され得る。RNAは、直接化学合成によって提供され得るか、または(例えば、CasXタンパク質をコードする)DNAからインビトロで転写され得る。一旦合成されると、RNAは、核酸を細胞に導入するための周知の技法(例えば、マイクロインジェクション、電気穿孔、形質移入等)のうちのいずれかによって細胞に導入され得る。
核酸は、十分に開発された形質移入技法(例えばAngel and Yanik(2010)PLoS ONE 5(7):e11756を参照)、及びQiagenから商業的に入手可能なTransMessenger(登録商標)試薬、StemgentからのStemfect(商標)RNA形質移入キット、及びMirus Bio LLCからのTransIT(登録商標)−mRNA形質移入キットを使用して細胞に提供され得る。また、Beumer et al.(2008)PNAS 105(50):19821−19826を参照されたい。
ベクターは、標的宿主細胞に直接提供され得る。換言すれば、細胞は、対象の核酸を含むベクター(例えば、ドナーテンプレート配列を有し、CasXガイドRNAをコードする組み換え発現ベクター、CasXタンパク質をコードする組み換え発現ベクター等)と接触され、それによりベクターが細胞によって取り込まれる。細胞を、プラスミドである核酸ベクターと接触させるための方法としては、当該技術分野において周知の電気穿孔、塩化カルシウム形質移入、マイクロインジェクション、及びリポフェクションが挙げられる。ウイルスベクター送達の場合、細胞は、対象のウイルス発現ベクターを含むウイルス粒子と接触され得る。
レトロウイルス、例えば、レンチウイルスは、本開示の方法における使用に適している。一般に使用されるレトロウイルスベクターは、「欠陥があり」、すなわち、増殖性感染に必要なウイルスタンパク質を産生することが不可能である。むしろ、ベクターの複製は、パッケージング細胞株における成長を必要とする。関心対象の核酸を含むウイルス粒子を生成するために、核酸を含むレトロウイルス核酸は、パッケージング細胞株によってウイルスカプシドにパッケージされる。異なるパッケージング細胞株は、カプシドに組み込まれる異なるエンベロープタンパク質(エコトロピック、アンホトロピック、またはゼノトロピック)を提供し、このエンベロープタンパク質は、細胞に対するウイルス粒子の特異性を決定する(マウス及びラットに対してエコトロピック、ヒト、イヌ、及びマウスを含む大部分の哺乳動物細胞型に対してアンホトロピック、ならびにマウス細胞を除く大部分の哺乳動物細胞に対してゼノトロピック)。適切なパッケージング細胞株を使用して、細胞がパッケージされたウイルス粒子によって標的されることを保証することができる。対象のベクター発現ベクターをパッケージング細胞株に導入する方法及びパッケージング株によって生成されるウイルス粒子を収集する方法は、当該技術分野において周知である。核酸はまた、直接マイクロインジェクション(例えば、RNAのインジェクション)によって導入され得る。
CasXガイドRNA及び/またはCasXポリペプチドをコードする核酸を標的宿主細胞に提供するために使用されるベクターは、関心対象の核酸の発現、つまり転写活性化を駆動するための好適なプロモーターを含み得る。換言すれば、ある場合には、関心対象の核酸は、プロモーターに動作可能に連結される。これは、偏在的に作用するプロモーター、例えば、CMV−β−アクチンプロモーター、または誘導性プロモーター、特定の細胞集団において活性であるか、もしくはテトラサイクリンなどの薬物の存在に応答するプロモーターを含み得る。転写活性化によって、標的細胞中の基底レベルよりも10倍、100倍、より通常は1000倍転写が増加されることが意図される。加えて、CasXガイドRNA及び/またはCasXタンパク質をコードする核酸を細胞に提供するために使用されるベクターは、CasXガイドRNA及び/またはCasXタンパク質を取り込んだ細胞を同定するように、標的細胞中の選択可能なマーカーについてコードする核酸配列を含み得る。
CasXポリペプチドまたはCasX融合ポリペプチドをコードするヌクレオチド配列を含む核酸は、ある場合には、RNAである。このため、CasX融合タンパク質は、RNAとして細胞に導入され得る。RNAを細胞に導入する方法は、当該技術分野において既知であり、例えば、直接注入、形質移入、またはDNAの導入のために使用される任意の他の方法を含み得る。代わりに、CasXタンパク質は、ポリペプチドとして細胞に提供されてもよい。そのようなポリペプチドは、任意に、産生物の溶解性を増加させるポリペプチドドメインに融合され得る。このドメインは、TEVプロテアーゼによって切断される定義されたプロテアーゼ切断部位、例えば、TEV配列を通してポリペプチドに連結され得る。リンカーはまた、1つ以上の可撓性配列、例えば、1〜10個のグリシン残基を含み得る。いくつかの実施形態では、融合タンパク質の切断は、産生物の溶解性を維持する緩衝液中、例えば、0.5〜2M尿素の存在下、溶解性を増加させるポリペプチド及び/またはポリヌクレオチドの存在下等で行われる。関心対象のドメインとしては、エンドソーム不安定化ドメイン、例えば、インフルエンザHAドメイン、及び産生を助ける他のポリペプチド、例えば、IF2ドメイン、GSTドメイン、GRPEドメイン等が挙げられる。ポリペプチドは、改善された安定性のために配合され得る。例えば、ペプチドは、PEG化されてもよく、ポリエチレンオキシ基は、血流中の向上した寿命を提供する。
追加としてまたは代替として、本開示のCasXポリペプチドは、ポリペプチド浸透性ドメインに融合されて、細胞による取り込みを促進することができる。複数の浸透性ドメインが、当該技術分野において既知であり、ペプチド、ペプチド模倣体、及び非ペプチド担体を含む、本開示の非統合ポリペプチドにおいて使用され得る。例えば、浸透性ペプチドは、アミノ酸配列RQIKIWFQNRRMKWKK(配列番号133)を含む、ペネトラチンと称される、キイロショウジョウバエ転写因子アンテナペディアの第3のαらせんに由来し得る。別の例として、浸透性ペプチドは、HIV−1tat塩基性領域アミノ酸配列を含み、これは例えば、天然に存在するtatタンパク質のアミノ酸49〜57を含み得る。他の浸透性ドメインとしては、ポリ−アルギニンモチーフ、例えば、HIV−1 revタンパク質、ノナ−アルギニン、オクタ−アルギニン等のアミノ酸34〜56の領域を含む。(例えば、転位ペプチド及びペプトイドの教示について参照により本明細書に具体的に組み込まれる、Futaki et al.(2003)Curr Protein Pept Sci.2003 Apr; 4(2):87−9 and 446、及びWender et al.(2000)Proc.Natl.Acad.Sci.U.S.A 2000 Nov.21; 97(24):13003−8、公開済み米国特許出願第20030220334号、同第20030083256号、同第20030032593号、及び同第20030022831号を参照されたい)。ノナ−アルギニン(R9)配列は、特徴付けられたより効率的なPTDのうちの1つである(Wender et al.2000、Uemura et al.2002)。融合が行われる部位は、ポリペプチドの生物活性、分泌、または結合特徴を最適化するために選択され得る。最適な部位は、慣例実験によって決定される。
本開示のCasXポリペプチドは、インビトロで、または真核細胞によって、または原核細胞によって産生することができ、それは、アンフォールディング、例えば、熱変性、ジチオスレイトール還元等によってさらに処理することができ、当該技術分野において既知の方法を使用して、さらにリフォールディングすることができる。
一次配列を改変しない関心対象の修飾としては、ポリペプチドの化学誘導体化、例えば、アシル化、アセチル化、カルボキシル化、アミド化等が挙げられる。また、グリコシル化の修飾、例えば、その合成及び処理中またはさらなる処理ステップ中にポリペプチドのグリコシル化パターンを修飾することによって、例えばポリペプチドを、哺乳動物グリコシル化または脱グリコシル化酵素などのグリコシル化に影響を及ぼす酵素に曝露することによって行われるものが含まれる。また、リン酸化アミノ酸残基、例えば、ホスホチロシン、ホスホセリン、またはホスホスレオニンを有する配列が包含される。
また、核酸(例えば、CasXガイドRNAをコードする、CasX融合タンパク質をコードする等)、ならびにタンパク質分解に対するそれらの耐性を改善するか、標的配列の特異性を変えるか、溶解特性を最適化するか、タンパク質活性(例えば、転写調節活性、酵素活性等)を改変するか、またはそれらをより好適にするように、通常の分子生物学的技法及び合成化学を使用して修飾されたタンパク質(例えば、野生型タンパク質または変異形タンパク質に由来するCasX融合タンパク質をコードする)が、本開示の実施形態に包含するのに適している。そのようなポリペプチドの類似体としては、天然に存在するL−アミノ酸以外の残基を含有するもの、例えば、D−アミノ酸または天然に存在しない合成アミノ酸が挙げられる。D−アミノ酸は、アミノ酸残基の一部またはすべてについて置換され得る。
本開示のCasXポリペプチドは、当該技術分野において既知の簡便な方法を使用して、インビトロ合成によって調製され得る。様々な商業的合成装置、例えば、Applied Biosystems,Inc.、Beckman等による自動合成装置が入手可能である。合成装置を使用することによって、天然に存在するアミノ酸は、非天然のアミノ酸で置換されてもよい。特定の配列及び調製方法は、簡便性、経済性、必要とされる純度等によって決定される。
所望される場合、合成中または発現中に、様々な基がペプチドに導入され得、これが他の分子または表面への連結を可能にする。このため、システインを使用して、チオエーテル、金属イオン複合体に連結するためのヒスチジン、アミドまたはエステルを形成するためのカルボキシル基、アミドを形成するためのアミノ基等を作製することができる。
本開示のCasXポリペプチドはまた、組み換え合成の従来方法に従って単離及び精製されてもよい。発現宿主の溶解物が調製され、溶解物は、液体クロマトグラフィ(HPLC)、排除クロマトグラフィ、ゲル電気穿孔、親和性クロマトグラフィ、または他の精製技法を使用して精製され得る。主に、使用される組成物は、産生物の調製及びその精製の方法に関連した汚染物質に関して、所望の産生物の20重量%以上、より通常は75重量%以上、好ましくは95重量%以上、治療目的の場合は通常99.5重量%を占める。通常、パーセンテージは、総タンパク質に基づく。このため、ある場合には、本開示のCasXポリペプチドまたはCasX融合ポリペプチドは、少なくとも80%純粋、少なくとも85%純粋、少なくとも90%純粋、少なくとも95%純粋、少なくとも98%純粋、または少なくとも99%純粋である(例えば、汚染物質、非CasXタンパク質、または他の高分子等を含まない)。
切断もしくは任意の所望の修飾を標的核酸(例えば、ゲノムDNA)に誘導するため、または任意の所望の修飾を標的核酸に関連したポリペプチドに誘導するために、本開示のCasXガイドRNA及び/もしくはCasXポリペプチドならびに/またはドナーテンプレート配列は、それらが核酸として導入されるかまたはポリペプチドとして導入されるかにかかわらず、約30分〜約24時間、例えば、1時間、1.5時間、2時間、2.5時間、3時間、3.5時間、4時間、5時間、6時間、7時間、8時間、12時間、16時間、18時間、20時間、または約30分〜約24時間の任意の他の期間にわたって細胞に提供され、これはほぼ毎日〜約4日毎の頻度、例えば、1.5日毎、2日毎、3日毎、またはほぼ毎日〜約4日毎の任意の他の頻度で繰り返されてもよい。薬剤(複数可)は、対象の細胞に1回以上、例えば、1回、2回、3回、または4回以上提供されてもよく、細胞は、各接触事象に続くいくらかの期間、例えば、16〜24時間にわたって薬剤(複数可)でインキュベートされ、この後に培地を新鮮な培地で置き換え、細胞をさらに培養する。
2つ以上の異なる標的化複合体(例えば、同じまたは異なる標的核酸内の異なる配列に相補的である2つの異なるCasXガイドRNA)が細胞に提供される場合において、複合体は、同時に提供され得るか(例えば、2つのポリペプチド及び/もしくは核酸として)、または同時に送達され得る。代替として、それらは、連続して提供されてもよく、例えば、標的化複合体が最初に提供され、続いて第2の標的化複合体が提供される等、またはその逆も同様である。
標的細胞へのDNAベクターの送達を改善するために、DNAは、例えば、リポプレックス及びポリプレックスを使用することによって促進される損傷及びその細胞への侵入から保護され得る。このため、ある場合には、本開示の核酸(例えば、本開示の組み換え発現ベクター)は、ミセルまたはリポソームのような組織的構造において脂質で被覆され得る。組織的構造がDNAと複合される場合、それはリポプレックスと呼ばれる。3種類の脂質、アニオン性(負電荷)、中性、またはカチオン性(正電荷)が存在する。カチオン性脂質を用いるリポプレックスは、遺伝子移行に対する有用性が証明された。カチオン性脂質は、それらの正電荷に起因して、負電荷DNAと天然に複合する。また、それらは、電荷の結果として、細胞膜と相互作用する。次いで、リポプレックスのエンドサイトーシスが起こり、DNAが細胞質中に放出される。カチオン性脂質はまた、細胞によるDNAの変性に対して保護する。
ポリマーとDNAとの複合体は、ポリプレックスと呼ばれる。ほとんどのポリプレックスは、カチオン性ポリマーからなり、それらの産生は、イオン相互作用によって調節される。ポリプレックスとリポプレックスの作用方法の1つの大きな差異は、ポリプレックスが、それらのDNA負荷を細胞質中に放出できないことであり、このために、不活性化アデノウイルスなどのエンドソーム溶解剤との同時形質移入(エンドサイトーシス中に作製されるエンドソームを溶解する)が起こるに違いない。しかしながら、これは常にそうであるとは限らない。ポリエチレンイミンなどのポリマーは、キトサン及びトリメチルキトサンと同様に、それら独自のエンドソーム崩壊方法を有する。
球形状を有する高度に分岐した高分子であるデンドリマーを使用して、幹細胞を遺伝的に修飾することもできる。デンドリマー粒子の表面を感応化して、その特性を改変することができる。具体的に、カチオン性デンドリマー(すなわち、正の表面電荷を有するもの)を構築することが可能である。DNAプラスミドなどの遺伝子材料の存在下にある場合、電荷相補性は、核酸とカチオン性デンドリマーとの一時的会合につながる。その目的地に到達したとき、デンドリマー核酸複合体は、エンドサイトーシスによって細胞に取り込まれ得る。
ある場合には、開示の核酸(例えば、発現ベクター)は、関心対象のガイド配列に対する挿入部位を含む。例えば、核酸は、関心対象のガイド配列に対する挿入部位を含み得、挿入部位は、ガイド配列が変化して所望の標的配列にハイブリダイズしても変化しないCasXガイドRNAの部分をコードするヌクレオチド配列のすぐ隣にある(例えば、ガイドRNAのCasX結合態様に寄与する配列、例えば、CasXガイドRNAのdsRNA二重鎖(複数可)に寄与する配列。ガイドRNAのこの部分はまた、ガイドRNAの「足場」または「定常領域」とも称され得る)。このため、ある場合には、対象の核酸(例えば、発現ベクター)は、ガイドRNAのガイド配列部分をコードする部分が挿入配列(挿入部位)であることを除いて、CasXガイドRNAをコードするヌクレオチド配列を含む。挿入部位は、所望の配列の挿入のために使用される任意のヌクレオチド配列である。様々な技法で使用するための「挿入部位」は、当業者に既知であり、任意の簡便な挿入部位が使用され得る。挿入部位は、核酸配列を挿入するための任意の方法に対するものであり得る。例えば、ある場合には、挿入部位は、複数クローニング部位(MCS)(例えば、1つ以上の制限酵素認識配列を含む部位)、ライゲーション非依存性クローニングのための部位、組み換えに基づくクローニングのための部位(例えば、att部位に基づく組み換え)、CRISPR/Cas(例えば、Cas9)に基づく技術によって認識されるヌクレオチド配列等である。
挿入部位は、任意の所望の長さであり得、挿入部位の種類に依存し得る(例えば、その部位が1つ以上の制限酵素認識配列を含むかどうか(またその数)、その部位がCRISPR/Casタンパク質に対する標的部位を含むかどうか等に依存し得る)。ある場合には、対象核酸の挿入部位は、3以上のヌクレオチド(nt)長(例えば、5以上、8以上、10以上、15以上、17以上、18以上、19以上、20以上、または25以上、または30以上のnt長)である。ある場合には、対象核酸の挿入部位の長さは、2〜50ヌクレオチド(nt)(例えば、2〜40nt、2〜30nt、2〜25nt、2〜20nt、5〜50nt、5〜40nt、5〜30nt、5〜25nt、5〜20nt、10〜50nt、10〜40nt、10〜30nt、10〜25nt、10〜20nt、17〜50nt、17〜40nt、17〜30nt、17〜25nt)の範囲の長さを有する。ある場合には、対象核酸の挿入部位の長さは、5〜40ntの範囲の長さを有する。
核酸の修飾
いくつかの実施形態では、対象の核酸(例えば、CasXガイドRNA)は、核酸に新たなまたは強化された特徴(例えば、改善された安定性)を提供するために、1つ以上の修飾、例えば、塩基修飾、骨格修飾等を有する。ヌクレオシドは、塩基−糖の組み合わせである。ヌクレオシドの塩基部分は、通常、複素環式塩基である。そのような複素環式塩基の2つの最も一般的なクラスは、プリン及びピリミジンである。ヌクレオチドは、ヌクレオシドの糖部分に共有結合で連結されたリン酸基をさらに含むヌクレオシドである。ペントフラノシル糖を含むヌクレオシドの場合は、リン酸基を糖の2′、3′、または5′ヒドロキシル部分に連結することができる。オリゴヌクレオチドを形成する際に、リン酸基は、隣接するヌクレオシドを共有結合で互いに連結して、線状ポリマー化合物を形成する。順に、この線状ポリマー化合物のそれぞれの末端は、さらに接合して環状化合物を形成することができるが、線状化合物が好適である。加えて、線状化合物は、内部ヌクレオチド塩基相補性を有し得るため、完全にまたは部分的に二本鎖の化合物を産生するような方法で折り畳むことができる。オリゴヌクレオチド内では、リン酸基は一般に、オリゴヌクレオチドのヌクレオシド間骨格を形成しているとみなされている。RNA及びDNAの通常の連結または骨格は、3′〜5′ホスホジエステル連結である。
好適な核酸修飾としては、2′Oメチル修飾ヌクレオチド、2′フルオロ修飾ヌクレオチド、ロックド核酸(LNA)修飾ヌクレオチド、ペプチド核酸(PNA)修飾ヌクレオチド、ホスホロチオエート連結を有するヌクレオチド、及び5′キャップ(例えば、7−メチルグアニレートキャップ(m7G))が挙げられるが、これらに限定されない。追加の詳細及び追加の修飾は、以下に記載される。
2′−O−メチル修飾ヌクレオチド(2′−O−メチルRNAとも称される)は、tRNA中に見出されるRNA及び転写後修飾として生じる他の小RNAの天然に存在する修飾である。2′−O−メチルRNAを含有するオリゴヌクレオチドは、直接合成され得る。この修飾は、RNA:RNA二重鎖のTmを増加させるが、RNA:DNA安定性においてはわずかな変化をもたらすにすぎない。一本鎖リボヌクレアーゼによる攻撃に関して安定しており、典型的にDNAよりもDNaseの影響を5〜10倍受けにくい。一般に、標的メッセージに対する安定性及び結合親和性を増加させる手段として、アンチセンスオリゴにおいて使用される。
2′フルオロ修飾ヌクレオチド(例えば、2′フルオロ塩基)は、結合親和性(Tm)を増加させ、また天然のRNAと比較したときに、いくらかの相対的ヌクレアーゼ耐性を与える、フルオリン修飾リボースを有する。これらの修飾は、一般に、血清または他の生物流体中の安定性を改善するために、リボザイム及びsiRNAにおいて用いられる。
LNA塩基は、RNA A型らせん二重鎖幾何形状を好む、C3′末端位置にある塩基をロックするリボース骨格に対する修飾を有する。この修飾は、Tmを著しく増加させ、また非常にヌクレアーゼ耐性がある。複数のLNA挿入は、3′末端を除く任意の位置にあるオリゴに配置され得る。アンチセンスオリゴからSNP検出及び対立遺伝子特異的PCRに対するハイブリダイゼーションプローブに及ぶ用途が記載されている。LNAによって与えられるTmの大幅な増加に起因して、それらはまた、プライマー二量体形成ならびに自己ヘアピン形成の増加を引き起こし得る。ある場合には、単一のオリゴに組み込まれるLNAの数は、10塩基以下である。
ホスホロチオエート(PS)結合(すなわち、ホスホロチオエート連結)は、核酸(例えば、オリゴ)のリン酸骨格中の非架橋酸素の代わりに硫黄原子を用いる。この修飾は、ヌクレオチド間連結をヌクレアーゼ変性に耐えるようにする。ホスホロチオエート結合は、エクソヌクレアーゼ変性を阻害するために、オリゴの5′または3′末端における最後の3〜5ヌクレオチド間に導入され得る。ホスホロチオエート結合をオリゴ内(例えば、オリゴ全体を通して)に含めることは、エンドヌクレアーゼによる攻撃の低減も同様に助けることができる。
いくつかの実施形態では、対象の核酸は、2′−O−メチル修飾ヌクレオチドである1つ以上のヌクレオチドを有する。いくつかの実施形態では、対象の核酸(例えば、dsRNA、siNA等)は、1つ以上の2′フルオロ修飾ヌクレオチドを有する。いくつかの実施形態では、対象の核酸(例えば、dsRNA、siNA等)は、1つ以上のLNA塩基を有する。いくつかの実施形態では、対象の核酸(例えば、dsRNA、siNA等)は、ホスホロチオエート結合によって連結された1つ以上のヌクレオチドを有する(すなわち、対象の核酸は、1つ以上のホスホロチオエート連結を有する)。いくつかの実施形態では、対象の核酸(例えば、dsRNA、siNA等)は、5′キャップ(例えば、7−メチルグアニレートキャップ(m7G)を有する。いくつかの実施形態では、対象の核酸(例えば、dsRNA、siNA等)は、修飾ヌクレオチドの組み合わせを有する。例えば、対象の核酸(例えば、dsRNA、siNA等)は、他の修飾(例えば、2′−O−メチルヌクレオチド及び/または2′フルオロ修飾ヌクレオチド及び/またはLNA塩基及び/またはホスホロチオエート連結)を有する1つ以上のヌクレオチドを有することに加えて、5′キャップ(例えば、7−メチルグアニレートキャップ(m7G))を有し得る。
修飾骨格及び修飾ヌクレオシド間連結
修飾を含む好適な核酸(例えば、CasXガイドRNA)の例としては、修飾骨格または非天然のヌクレオシド間連結を含む核酸が挙げられる。修飾骨格を有する核酸は、骨格内にリン原子を保持するもの、及び骨格内にリン原子を有しないものを含む。
リン酸原子を中に含む好適な修飾オリゴヌクレオチド骨格としては、例えば、ホスホロチオエート、キラルホスホロチオエート、ホスホロジチオエート、ホスホトリエステル、アミノアルキルホスホトリエステル、メチル及び他のアルキルホスホネート(3′−アルキレンホスホネート、5′−アルキレンホスホネート、及びキラルホスホネート)、ホスフィネート、ホスホルアミダート(3′−アミノホスホルアミダート及びアミノアルキルホスホルアミダートを含む)、ホスホロジアミダート、チオノホスホロアミダート、チオノアルキルホスホネート、チオノアルキルホスホトリエステル、セレノホスフェート、及び通常3′−5′連結を有するボラノホスフェート、それらの2′−5′連結類似体、ならびに1つ以上のヌクレオチド間連結が、3′−3′、5′−5′、または2′−2′連結である、反転極性を有するものが挙げられる。反転極性を有する好適なオリゴヌクレオチドは、単一の3′−3′連結を3′最端ヌクレオチド間連結において、すなわち、塩基性であり得る単一の反転ヌクレオシド残基を含む(核酸塩基が欠失しているか、またはその代わりにヒドロキシル基を有する)。様々な塩(例えば、カリウムまたはナトリウムなど)、混合塩、及び遊離酸形態もまた含まれる。
いくつかの実施形態では、対象の核酸は、1つ以上のホスホロチオエート及び/またはヘテロ原子ヌクレオシド間連結、特に−CH2 −NH−O−CH2 −、−CH2 −N(CH3 )−O−CH2 −(メチレン(メチルイミノまたはMMI骨格として知られる)またはMMI骨格)、−CH2 −O−N(CH3 )−CH2 −、−CH2 −N(CH3 )−N(CH3 )−CH2 −、及び−O−N(CH3 )−CH2 −CH2 −を含む(天然のホスホジエステルヌクレオチド間連結は、−O−P(=O)(OH)−O−CH2 −として表される)。MMI型ヌクレオシド間連結は、上で参照された米国特許第5,489,677号において開示されており、その開示は、参照によりその全体が本明細書に組み込まれる。好適なアミドヌクレオシド間連結は、米国特許第5,602,240号において開示されており、その開示は、参照によりその全体が本明細書に組み込まれる。
例えば、米国特許第5,034,506号に記載されるように、モルホリノ骨格構造を有する核酸もまた好適である。例えば、いくつかの実施形態では、対象の核酸は、リボース環の代わりに6員モルホリノ環を含む。これらの実施形態のうちのいくつかでは、ホスホロジアミダートまたは他の非ホスホジエステルヌクレオシド間連結は、ホスホジエステル連結に代わる。
リン原子を中に含まない好適な修飾ポリヌクレオチド骨格は、短鎖アルキルもしくはシクロアルキルヌクレオシド間連結、混合ヘテロ原子及びアルキルもしくはシクロアルキルヌクレオシド間連結、または1つ以上の短鎖ヘテロ原子もしくは複素環式ヌクレオシド間連結により形成される骨格を有する。これらは、モルホリノ結合、シロキサン骨格、スルフィド、スルホキシド及びスルホン骨格、ホルムアセチル及びチオホルムアセチル骨格、メチレンホルムアセチル及びチオホルムアセチル骨格、リボアセチル骨格、アルケン含有骨格、スルファミン酸塩骨格、メチレンイミノ及びメチレンヒドラジノ骨格、スルホン酸及びスルホンアミド骨格、アミド骨格、ならびに混合N、O、S及びCH2構成部分を有する他のものを有するものを含む。
模倣体
対象の核酸は、核酸模倣体であり得る。「模倣体」という用語は、ポリヌクレオチドに適用される場合、ポリヌクレオチドを含むことが意図され、フラノース環のみまたはフラノース環及びヌクレオチド間連結の両方が、非フラノース基で置き換えられ、フラノース環のみの置換はまた、当該技術分野において代理糖であると称される。複素環式塩基部分または修飾された複素環式塩基部分は、適切な標的核酸とのハイブリダイゼーションのために維持される。1つのそのような核酸、優れたハイブリダイゼーション特性を有することが示されたポリヌクレオチド模倣体は、ペプチド核酸(PNA)と称される。PNAにおいて、ポリヌクレオチドの糖骨格は、骨格、特にアミノエチルグリシン骨格を含有するアミドで置き換えられる。ヌクレオチドは保持され、骨格のアミド部分のアザ窒素原子に直接的または間接的に結合される。
優れたハイブリダイゼーション特性を有することが報告された1つのポリヌクレオチド模倣体は、ペプチド核酸(PNA)である。PNA化合物中の骨格は、PNAにアミド含有骨格を与える2つ以上の結合されたアミノエチルグリシン単位である。複素環式塩基部分は、骨格のアミド部分のアザ窒素原子に直接的または間接的に結合される。PNA化合物の調製について記載する代表的な米国特許としては、米国特許第5,539,082号、同第5,714,331号、及び同第5,719,262号が挙げられるが、これらに限定されない(その開示は、参照によりそれらの全体が本明細書に組み込まれる)。
研究されたポリヌクレオチド模倣体の別のクラスは、モルホリノ環に付着した複素環式塩基を有する連結されたモルホリノ単位(モルホリノ核酸)に基づいている。モルホリノ核酸中のモルホリノモノマー単位を連結する、複数の連結基が報告されている。連結基の1つのクラスを選択して、非イオン性オリゴマー化合物を得た。非イオン性モルホリノ系オリゴマー化合物が、細胞タンパク質との望ましくない相互作用を有する可能性は低い。モルホリノ系ポリヌクレオチドは、細胞タンパク質との望ましくない相互作用を形成する可能性が低いオリゴヌクレオチドの非イオン性模倣体である(Dwaine A.Braasch and David R.Corey,Biochemistry,2002,41(14),4503−4510)。モルホリノ系ポリヌクレオチドは、米国特許第5,034,506号において開示されており、その開示は、参照によりその全体が本明細書に組み込まれる。モノマーサブユニットを接合する様々な異なる連結基を有する、モルホリノクラスのポリヌクレオチド内の様々な化合物が調製された。
ポリヌクレオチド模倣体のさらなるクラスは、シクロヘキセニル核酸(CeNA)と称される。DNA/RNA分子中に通常存在するフラノース環は、シクロヘキセニル環と置き換えられる。CeNA DMT保護ホスホルアミダイトモノマーが調製され、オリゴマー化合物合成に続いて古典的ホスホルアミダイト化学のために使用された。完全に修飾されたCeNAオリゴマー化合物及びCeNAで修飾された特定の位置を有するオリゴヌクレオチドが調製され、研究された(Wang et al.,J.Am.Chem.Soc.,2000,122,8595−8602を参照されたい。その開示は、参照によりその全体が本明細書に組み込まれる)。一般に、DNA鎖へのCeNAモノマーの組み込みは、DNA/RNAハイブリッドのその安定性を増加させる。CeNAオリゴアデニレートは、天然の複合体に対する同様の安定性を有するRNA及びDNA相補体との複合体を形成した。CeNA構造を天然の核酸構造に組み込むことの研究は、NMR及び円二色性によって示され、容易な立体構造適応を進めた。
さらなる修飾は、2′−ヒドロキシル基は、糖環の4′炭素原子に結合され、それによって2′−C、4′−C−オキシメチレン結合を形成し、それによって二環式糖部分を形成するロックド核酸(LNA)を含む。連結は、2′酸素原子及び4′炭素原子を架橋するメチレン(−CH2 −)基であり得、nは、1または2である(Singh et al.,Chem.Commun.,1998,4,455−456、その開示は、参照によりその全体が本明細書に組み込まれる)。LNA及びLNA類似体は、相補的DNA及びRNAとの非常に高い二重鎖熱安定性(Tm=+3〜+10℃)、3′−エクソヌクレアーゼ分解に対する安定性、ならびに良好な溶解特性を示す。LNAを含有する強力かつ非毒性のアンチセンスオリゴヌクレオチドが記載されている(例えば、Wahlestedt et al.,Proc.Natl.Acad.Sci.U.S.A.,2000,97,5633−5638、その開示は、参照によりその全体が本明細書に組み込まれる)。
オリゴマー化及び核酸認識特性と共に、LNAモノマーのアデニン、シトシン、グアニン、5−メチル−シトシン、チミン、及びウラシルの合成及び調製が記載されている(例えば、Koshkin et al.,Tetrahedron,1998,54,3607−3630、その開示は、参照によりその全体が本明細書に組み込まれる)。LNA及びその調製物はまた、WO98/39352及びWO99/14226、ならびに米国出願第20120165514号、同第20100216983号、同第20090041809号、同第20060117410号、同第20040014959号、同第20020094555号、及び同第20020086998号に記載されており、それらの開示は参照によりそれらの全体が本明細書に組み込まれる。
修飾された糖部分
対象の核酸はまた、1つ以上の置換された糖部分を含有し得る。好適なポリヌクレオチドは、OH;F;O−、S−、もしくはN−アルキル;O−、S−、もしくはN−アルケニル;O−、S−、もしくはN−アルキニル;またはO−アルキル−O−アルキルから選択される糖置換基を含み、それらのアルキル、アルケニル、及びアルキニルは、置換または非置換のC.sub.1〜C10アルキルまたはC2〜C10アルケニル及びアルキニルであってもよい。O((CH2n O)m CH3 、O(CH2n OCH3 、O(CH2n NH2 、O(CH2n CH3 、O(CH2n ONH2 、及びO(CH2n ON(CH2n CH32 が特に好適であり、n及びmは、1〜約10である。他の好適なポリヌクレオチドは、C1 〜C10低級アルキル、置換低級アルキル、アルケニル、アルキニル、アルカリル、アラルキル、O−アルカリルもしくはO−アラルキル、SH、SCH3 、OCN、Cl、Br、CN、CF3 、OCF3 、SOCH3 、SO2 CH3 、ONO2 、NO2 、N3 、NH2 、ヘテロシクロアルキル、ヘテロシクロアルカリル、アミノアルキルアミノ、ポリアルキルアミノ、置換シリル、RNA切断基、レポーター基、インターカレーター、オリゴヌクレオチドの薬物動態特性を改善するための基、またはオリゴヌクレオチドの薬理学的特性を改善するための基、及び同様の特性を有する他の置換基から選択される糖置換基を含む。好適な修飾は、2′−メトキシエトキシ(2′−O−CH2 CH2 OCH3 、2′−O−(2−メトキシエチル)または2′−MOEとしても知られる)(Martin et al.,Helv.Chim.Acta,1995,78,486−504、その開示は、参照によりその全体が本明細書に組み込まれる)、すなわち、アルコキシアルコキシ基を含む。さらなる好適な修飾は、2′−ジメチルアミノオキシエトキシ、すなわち、下記の実施例において記載される、O(CH22 ON(CH32 基(2′−DMAOEとしても知られる)、及び2′−ジメチルアミノエトキシエトキシ(当該技術分野では、2′−O−ジメチル−アミノ−エトキシ−エチルまたは2′−DMAEOE)、すなわち、2′−O−CH2 −O−CH2 −N(CH32 を含む。
他の好適な糖置換基としては、メトキシ(−O−CH3 )、アミノプロポキシ(−−OCH2 CH2 CH2 NH2 )、アリル(−CH2 −CH=CH2 )、−O−アリル(−−O−−CH2 −CH=CH2 )、及びフルオロ(F)が挙げられる。2′−糖置換基は、アラビノ(上)位またはリボ(下)位であってもよい。好適な2′−アラビノ修飾は、2′−Fである。同様の修飾が、オリゴマー化合物上の他の位置で、特に3′末端ヌクレオシド上のまたは2′−5′結合オリゴヌクレオチド内の糖の3′位、及び5′末端ヌクレオチドの5′位で行われてもよい。オリゴマー化合物はまた、ペントフラノシル糖の代わりに、シクロブチル部分などの糖模倣体を有してもよい。
塩基修飾及び置換
対象の核酸はまた、核酸塩基(当該技術分野では単に「塩基」と呼ばれることが多い)の修飾または置換を含み得る。本明細書において使用される場合、「非修飾」または「天然の」核酸塩基としては、プリン塩基アデニン(A)及びグアニン(G)、ならびにピリミジン塩基チミン(T)、シトシン(C)、及びウラシル(U)が挙げられる。修飾核酸塩基としては、5−ヒドロキシメチルシトシン(5−me−C)、5−ヒドロキシメチルシトシン、キサンチン、ヒポキサンチン、2−アミノアデニン、アデニン及びグアニンの6−メチル及び他のアルキル誘導体、アデニン及びグアニンの2−プロピル及び他のアルキル誘導体、2−チオウラシル、2−チオチミン及び2−チオシトシン、5−ハロウラシル及びシトシン、5−プロピニル(−C=C−CH3 )ウラシル及びピリミジン塩基のシトシン及び他のアルキニル誘導体、6−アゾウラシル、シトシン及びチミン、5−ウラシル(プソイドウラシル)、4−チオウラシル、8−ハロ、8−アミノ、8−チオール、8−チオアルキル、8−ヒドロキシル及び他の8−置換アデニン及びグアニン、5−ハロ、特に5−ブロモ、5−トリフルオロメチル及び他の5−置換ウラシル及びシトシン、7−メチルグアニン及び7−メチルアデニン、2−F−アデニン、2−アミノ−アデニン、8−アザグアニン及び8−アザアデニン、7−デアザグアニン及び7−デアザアデニン及び3−デアザグアニン及び3−デアザアデニンが挙げられる。さらなる修飾核酸塩基としては、三環式ピリミジン、例えばフェノキサジンシチジン(1H−ピリミド(5,4−b)(1,4)ベンゾキサジン−2(3H)−オン)、フェノチアジンシチジン(1H−ピリミド(5,4−b)(1,4)ベンゾチアジン−2(3H)−オン)、G−クランプ、例えば置換フェノキサジンシチジン(例えば、9−(2−アミノエトキシ)−H−ピリミド(5,4−(b)(1,4)ベンゾキサジン−2(3H)−オン)、カルバゾールシチジン(2H−ピリミド(4,5−b)インドール−2−オン)、ピリドインドールシチジン(H−ピリド(3′,2′:4,5)ピロロ(2,3−d)ピリミジン−2−オン)が挙げられる。
複素環式塩基部分には、プリンまたはピリミジン塩基が、他の複素環、例えば、7−デアザ−アデニン、7−デアザグアノシン、2−アミノピリジン、及び2−ピリドンで置換されるものも含まれ得る。さらなる核酸塩基としては、米国特許第3,687,808号に開示されるもの、The Concise Encyclopedia Of Polymer Science And Engineering,pages 858−859,Kroschwitz,J.I.,ed.John Wiley&Sons,1990に開示されるもの、Englisch et al.,Angewandte Chemie,International Edition,1991,30,613によって開示されるもの、及びSanghvi,Y.S.,Chapter 15,Antisense Research and Applications,pages 289−302,Crooke,S.T.and Lebleu,B.,ed.,CRC Press,1993によって開示されるものが挙げられる(その開示は、参照によりそれらの全体が本明細書に組み込まれる)。これらの核酸塩基の一部は、オリゴマー化合物の結合親和性を増加させるのに有用である。これには、5−置換ピリミジン、6−アザピリミジン、ならびにN−2、N−6、及びO−6置換プリンが含まれ、2−アミノプロピルアデニン、5−プロピニルウラシル、及び5−プロピニルシトシンが挙げられる。5−メチルシトシン置換は、核酸二重鎖安定性を0.6〜1.2℃増加させることが示されており(Sanghvi et al.,eds.,Antisense Research and Applications,CRC Press,Boca Raton,1993,pp.276−278、その開示は、参照によりその全体が本明細書に組み込まれる)、例えば、2′−O−メトキシエチル糖修飾と組み合わされたとき、好適な塩基置換である。
共役体
対象の核酸の別の可能な修飾は、オリゴヌクレオチドの活性、細胞分布、または細胞取り込みを向上させる1つ以上の部分または共役体を、ポリヌクレオチドに化学的に結合させることを伴う。このような部分または共役体は、1級または2級ヒドロキシル基などの官能基と共有結合した共役体基を含むことができる。共役体基としては、インターカレーター、レポーター分子、ポリアミン、ポリアミド、ポリエチレングリコール、ポリエーテル、オリゴマーの薬物力学特性を向上させる基、及びオリゴマーの薬物動態特性を向上させる基が挙げられる。好適な共役体基としては、コレステロール、脂質、リン脂質、ビオチン、フェナジン、葉酸塩、フェナントリジン、アントラキノン、アクリジン、フルオレセイン、ローダミン、クマリン、及び色素が挙げられる。薬力学的特性を向上させる基としては、取り込みを改善する、分解に対する耐性を向上させる、及び/または標的核酸との配列特異的ハイブリダイゼーションを強化する基が挙げられる。薬物動態特性を向上させる基としては、対象の核酸の取り込み、分布、代謝、または排泄を改善する基が挙げられる。
共役体部分としては、コレステロール部分(Letsinger et al.,Proc.Natl.Acad.Sci.USA,1989,86,6553−6556)、コール酸(Manoharan et al.,Bioorg.Med.Chem.Let.,1994,4,1053−1060)、チオエーテル、例えば、ヘキシル−S−トリチルチオール(Manoharan et al.,Ann.N.Y.Acad.Sci.,1992,660,306−309、Manoharan et al.,Bioorg.Med.Chem.Let.,1993,3,2765−2770)、チオコレステロール(Oberhauser et al.,Nucl.Acids Res.,1992,20,533−538)、脂肪族鎖、例えば、ドデカンジオールもしくはウンデシル残基(Saison−Behmoaras et al.,EMBO J.,1991,10,1111−1118、Kabanov et al.,FEBS Lett.,1990,259,327−330、Svinarchuk et al.,Biochimie,1993,75,49−54)、リン脂質、例えば、ジ−ヘキサデシル−rac−グリセロールもしくはトリエチルアンモニウム1,2−ジ−O−ヘキサデシル−rac−グリセロ−3−H−ホスホネート(Manoharan et al.,Tetrahedron Lett.,1995,36,3651−3654、Shea et al.,Nucl.Acids Res.,1990,18,3777−3783)、ポリアミンもしくはポリエチレングリコール鎖(Manoharan et al.,Nucleosides&Nucleotides,1995,14,969−973)、またはアダマンタン酢酸(Manoharan et al.,Tetrahedron Lett.,1995,36,3651−3654)、パルミチル部分(Mishra et al.,Biochim.Biophys.Acta,1995,1264,229−237)、またはオクタデシルアミンもしくはヘキシルアミノ−カルボニル−オキシコレステロール部分(Crooke et al.,J.Pharmacol.Exp.Ther.,1996,277,923−937)などの脂質部分が挙げられるが、これらに限定されない。
共役体は、「タンパク質形質導入ドメイン」またはPTD(CPP−細胞透過性ペプチドとしても知られる)を含んでよく、これはポリペプチド、ポリヌクレオチド、炭水化物、または脂質二層、ミセル、細胞膜、細胞小器官膜、もしくは小胞膜の横断を促進する有機もしくは無機化合物を指し得る。小さな極性分子から大きな高分子の範囲であり得る別の分子に付着したPTDは、例えば、細胞外空間からサイトゾルに、またはサイトゾルから細胞小器官(例えば、核)内に移動する分子の膜横断を促進する。いくつかの実施形態では、PTDは、外因性ポリヌクレオチドの3′末端に共有結合される。いくつかの実施形態では、PTDは、外因性ポリヌクレオチドの5′末端に共有結合される。例示的なPTDとしては、最小ウンデカペプチドタンパク質形質導入ドメイン(YGRKKRRQRRR(配列番号112)を含むHIV−1 TATの残基47〜57に対応する);細胞中への直接侵入に十分な複数のアルギニン(例えば、3、4、5、6、7、8、9、10、または10〜50アルギニン)を含むポリアルギニン配列;VP22ドメイン(Zender et al.(2002)Cancer Gene Ther.9(6):489−96);Drosophila Antennapediaタンパク質形質導入ドメイン(Noguchi et al.(2003)Diabetes 52(7):1732−1737);欠損ヒトカルシトニンペプチド(Trehin et al.(2004)Pharm.Research 21:1248−1256);ポリリジン(Wender et al.(2000)Proc.Natl.Acad.Sci.USA 97:13003−13008);RRQRRTSKLMKR(配列番号113);トランスポータンGWTLNSAGYLLGKINLKALAALAKKIL(配列番号114);KALAWEAKLAKALAKALAKHLAKALAKALKCEA(配列番号115);及びRQIKIWFQNRRMKWKK(配列番号116)が挙げられるが、これらに限定されない。例示的なPTDとしては、YGRKKRRQRRR(配列番号117)、RKKRRQRRR(配列番号118);3アルギニン残基〜50アルギニン残基のアルギニンホモポリマーが挙げられるが、これらに限定されない。例示的なPTDドメインアミノ酸配列としては、以下のうちのいずれかが挙げられるが、これらに限定されない。YGRKKRRQRRR(配列番号119)、RKKRRQRR(配列番号120)、YARAAARQARA(配列番号121)、THRLPRRRRRR(配列番号122)、及びGGRRARRRRRR(配列番号123)。いくつかの実施形態では、PTDは、活性化可能なCPP(ACPP)である(Aguilera et al.(2009)Integr Biol(Camb)June;1(5−6):371−381)。ACPPは、切断可能なリンカーを介して一致するポリアニオン(例えば、Glu9または「E9」)に接続されたポリカチオン性CPP(例えば、Arg9または「R9」)を含み、これが正味電荷をほぼ0に低減し、それにより細胞への付着及び取り込みを阻害する。リンカーの切断時に、ポリアニオンが放出され、ポリアルギニン及びその固有の付着性を局所的にアンマスクし、したがってACPPを「活性化して」膜を横断する。
標的細胞中に構成要素を導入
本開示のCasXガイドRNA(もしくはそれをコードするヌクレオチド配列を含む核酸)及び/またはCasXポリペプチド(もしくはそれをコードするヌクレオチド配列を含む核酸)及び/または本開示のCasX融合ポリペプチド(もしくは本開示のCasX融合ポリペプチドをコードするヌクレオチド配列を含む核酸)及び/またはドナーポリヌクレオチド(ドナーテンプレート)は、様々な周知の方法のうちのいずれかによって宿主細胞に導入され得る。
様々な化合物及び方法のうちのいずれかを使用して、本開示のCasX系を標的細胞に送達することができる(例えば、CasX系は、a)本開示のCasXポリペプチド及びCasXガイドRNA;b)本開示のCasXポリペプチド、CasXガイドRNA、及びドナーテンプレート核酸;c)本開示のCasX融合ポリペプチド及びCasXガイドRNA;d)本開示のCasX融合ポリペプチド、CasXガイドRNA、及びドナーテンプレート核酸;e)本開示のCasXポリペプチドをコードするmRNA、及びCasXガイドRNA;f)本開示のCasXポリペプチドをコードするmRNA、CasXガイドRNA、及びドナーテンプレート核酸;g)本開示のCasX融合ポリペプチドをコードするmRNA、及びCasXガイドRNA;h)本開示のCasX融合ポリペプチドをコードするmRNA、CasXガイドRNA、及びドナーテンプレート核酸;i)本開示のCasXポリペプチドをコードするヌクレオチド配列及びCasXガイドRNAをコードするヌクレオチド配列を含む組み換え発現ベクター;j)本開示のCasXポリペプチドをコードするヌクレオチド配列、CasXガイドRNAをコードするヌクレオチド配列、及びドナーテンプレート核酸をコードするヌクレオチド配列を含む組み換え発現ベクター;k)本開示のCasX融合ポリペプチドをコードするヌクレオチド配列及びCasXガイドRNAをコードするヌクレオチド配列を含む組み換え発現ベクター;l)本開示のCasX融合ポリペプチドをコードするヌクレオチド配列、CasXガイドRNAをコードするヌクレオチド配列、及びドナーテンプレート核酸をコードするヌクレオチド配列を含む組み換え発現ベクター;m)本開示のCasXポリペプチドをコードするヌクレオチド配列を含む第1の組み換え発現ベクター、CasXガイドRNAをコードするヌクレオチド配列を含む第2の組み換え発現ベクター;n)本開示のCasXポリペプチドをコードするヌクレオチド配列を含む第1の組み換え発現ベクター、及びCasXガイドRNAをコードするヌクレオチド配列を含む第2の組み換え発現ベクター、及びドナーテンプレート核酸;o)本開示のCasX融合ポリペプチドをコードするヌクレオチド配列を含む第1の組み換え発現ベクター、及びCasXガイドRNAをコードするヌクレオチド配列を含む第2の組み換え発現ベクター;p)本開示のCasX融合ポリペプチドをコードするヌクレオチド配列を含む第1の組み換え発現ベクター、及びCasXガイドRNAをコードするヌクレオチド配列を含む第2の組み換え発現ベクター、及びドナーテンプレート核酸;q)本開示のCasXポリペプチドをコードするヌクレオチド配列、第1のCasXガイドRNAをコードするヌクレオチド配列、及びCasXガイドRNAをコードするヌクレオチド配列を含む組み換え発現ベクター;もしくはr)本開示のCasX融合ポリペプチドをコードするヌクレオチド配列、第1のCasXガイドRNAをコードするヌクレオチド配列、及び第2のCasXガイドRNAをコードするヌクレオチド配列を含む組み換え発現ベクター;または(a)〜(r)のうちの1つのいくつかの異形を含む。非限定例として、本開示のCasX系は、脂質と組み合わせることができる。別の非限定例として、本開示のCasX系は、粒子と組み合わされ得るか、または粒子中に配合され得る。
核酸を宿主細胞に導入する方法は、当該技術分野において既知であり、任意の簡便な方法を使用して、対象の核酸(例えば、発現構築物/ベクター)を標的細胞(例えば、原核細胞、真核細胞、植物細胞、動物細胞、哺乳動物細胞、ヒト細胞等)に導入することができる。好適な方法としては、例えば、ウイルス感染、形質移入、共役、プロトプラスト融合、リポフェクション、電気穿孔、リン酸カルシウム沈降、ポリエチレンイミン(PEI)媒介型形質移入、DEAE−デキストラン媒介型形質移入、リポソーム媒介型形質移入、粒子ガン技術、リン酸カルシウム沈降、直接マイクロインジェクション、ナノ粒子媒介型核酸送達(例えば、Panyam et.,al Adv Drug Deliv Rev.2012 Sep 13.pii:S0169−409X(12)00283−9.doi:10.1016/j.addr.2012.09.023)等が挙げられる。
ある場合には、本開示のCasXポリペプチドは、CasXポリペプチドをコードする核酸(例えば、mRNA、DNA、プラスミド、発現ベクター、ウイルスベクター等)として提供される。ある場合には、本開示のCasXポリペプチドは、タンパク質として直接提供される(例えば、関連ガイドRNA無しに、または関連ガイドRNAと共に、すなわち、リボヌクレオタンパク質複合体として)。本開示のCasXポリペプチドは、任意の簡便な方法によって細胞に導入(細胞に提供)することができ、そのような方法は、当業者に知られている。例示的な例として、本開示のCasXポリペプチドは、細胞に直接注入され得る(例えば、CasXガイドRNAまたはCasXガイドRNAをコードする核酸と共にまたは無しに、及びドナーポリヌクレオチドと共にまたは無しに)。別の例として、本開示のCasXポリペプチド及びCasXガイドRNA(RNP)の予備形成された複合体は、細胞(例えば、真核細胞)に導入され得る(例えば、注入を介して、ヌクレオフェクションを介して、1つ以上の成分に共役された、例えば、CasXタンパク質に共役された、ガイドRNAに共役された、本開示のCasXポリペプチド及びガイドRNAに共役されたタンパク質形質導入ドメイン(PTD)を介して等)。
ある場合には、本開示のCasX融合ポリペプチド(例えば、融合パートナーに融合されたdCasX、融合パートナーに融合されたニッカーゼCasX等)は、CasX融合ポリペプチドをコードする核酸(例えば、mRNA、DNA、プラスミド、発現ベクター、ウイルスベクター等)として提供される。ある場合には、本開示のCasX融合ポリペプチドは、タンパク質として直接提供される(例えば、関連ガイドRNA無しに、または関連ガイドRNAと共に、すなわち、リボヌクレオタンパク質複合体として)。本開示のCasX融合ポリペプチドは、任意の簡便な方法によって細胞に導入(細胞に提供)することができ、そのような方法は、当業者に知られている。例示的な例として、本開示のCasX融合ポリペプチドは、細胞に直接注入され得る(例えば、CasXガイドRNAをコードする核酸と共にまたは無しに、及びドナーポリヌクレオチドと共にまたは無しに)。別の例として、本開示のCasX融合ポリペプチド及びCasXガイドRNA(RNP)の予備形成された複合体は、細胞に導入され得る(例えば、注入を介して、ヌクレオフェクションを介して、1つ以上の成分に共役された、例えば、CasXタンパク質に共役された、ガイドRNAに共役された、本開示のCasXポリペプチド及びガイドRNAに共役されたタンパク質形質導入ドメイン(PTD)を介して等)。
ある場合には、核酸(例えば、CasXガイドRNA、本開示のCasXポリペプチドをコードするヌクレオチド配列を含む核酸等)は、粒子中の細胞(例えば、標的宿主細胞)及び/またはポリペプチド(例えば、CasXポリペプチド、CasX融合ポリペプチド)に送達されるか、または粒子と会合される。ある場合には、本開示のCasX系は、粒子中の細胞に送達されるか、または粒子と会合される。「粒子」及び「ナノ粒子」という用語は、必要に応じて同義に使用され得る。本開示のCasXポリペプチド及び/またはCasXガイドRNAをコードするヌクレオチド配列を含む組み換え発現ベクター、本開示のCasXポリペプチドをコードするヌクレオチド配列を含むmRNA、及びガイドRNAは、粒子または脂質エンベロープを使用して同時に送達され得る。例えば、CasXポリペプチド及びCasXガイドRNAは、例えば、複合体として(例えば、リボヌクレオタンパク質(RNP)複合体として)は、粒子、例えば、脂質またはリピドイド及び親水性ポリマー、例えば、カチオン性脂質及び親水性ポリマーを含む送達粒子を介して送達され得、例えば、カチオン性脂質は、1,2−ジオレオイル−3−トリメチルアンモニウム−プロパン(DOTAP)もしくは1,2−ジテトラデカノイル−sn−グリセロ−3−ホスホコリン(DMPC)を含み、及び/または親水性ポリマーは、エチレングリコールもしくはポリエチレングリコール(PEG)を含み、及び/または粒子は、コレステロールをさらに含む(例えば、配合物1からの粒子=DOTAP 100、DMPC 0、PEG 0、コレステロール0;配合物番号2=DOTAP 90、DMPC 0、PEG 10、コレステロール0;配合物番号3=DOTAP 90、DMPC 0、PEG 5、コレステロール5)。例えば、粒子は、多段階プロセスを使用して形成することができ、ここでCasXポリペプチド及びCasXガイドRNAは、例えば、1:1モル比で、例えば、室温で、例えば、30分間にわたって、例えば、無菌のヌクレアーゼを含まない1倍リン酸緩衝生理食塩水(PBS)中で一緒に混合され、別個に、DOTAP、DMPC、PEG、及び配合物に必要な場合はコレステロールを、アルコール、例えば、100%エタノールに溶解し、これら2つの溶液を一緒に混合して、複合体を含有する粒子を形成する)。
本開示のCasXポリペプチド(もしくは本開示のCasXポリペプチドをコードするヌクレオチド配列を含むmRNA、または本開示のCasXポリペプチドをコードするヌクレオチド配列を含む組み換え発現ベクター)及び/またはCasXガイドRNA(もしくはCasXガイドRNAをコードする1つ以上の発現ベクターなどの核酸)は、粒子または脂質エンベロープを使用して同時に送達され得る。例えば、リン脂質二層シェルによって封入されたポリ(β−アミノエステル)(PBAE)コアを有する生分解性コアシェル構造ナノ粒子を使用することができる。ある場合には、自己集合生体付着性ポリマーに基づく粒子/ナノ粒子が使用され、そのような粒子/ナノ粒子は、例えば、脳へのペプチドの経口送達、ペプチドの静脈内送達、及びペプチドの経鼻送達に適用され得る。疎水性薬物の経口吸収及び眼内送達などの他の実施形態もまた企図される。保護され、疾患の部位に送達される操作されたポリマーエンベロープを必要とする分子エンベロープ技術を使用することができる。約5mg/kgの用量は、様々な因子、例えば、標的組織に応じて、単回または多回用量で使用され得る。
リピドイド化合物(例えば、米国特許出願第20110293703号に記載される)はまた、ポリヌクレオチドの投与において有用であり、それを使用して、本開示のCasXポリペプチド、本開示のCasX融合ポリペプチド、本開示のRNP、本開示の核酸、または本開示のCasX系を送達することができる(例えば、CasX系は、a)本開示のCasXポリペプチド及びCasXガイドRNA;b)本開示のCasXポリペプチド、CasXガイドRNA、及びドナーテンプレート核酸;c)本開示のCasX融合ポリペプチド及びCasXガイドRNA;d)本開示のCasX融合ポリペプチド、CasXガイドRNA、及びドナーテンプレート核酸;e)本開示のCasXポリペプチドをコードするmRNA、及びCasXガイドRNA;f)本開示のCasXポリペプチドをコードするmRNA、CasXガイドRNA、及びドナーテンプレート核酸;g)本開示のCasX融合ポリペプチドをコードするmRNA、及びCasXガイドRNA;h)本開示のCasX融合ポリペプチドをコードするmRNA、CasXガイドRNA、及びドナーテンプレート核酸;i)本開示のCasXポリペプチドをコードするヌクレオチド配列及びCasXガイドRNAをコードするヌクレオチド配列を含む組み換え発現ベクター;j)本開示のCasXポリペプチドをコードするヌクレオチド配列、CasXガイドRNAをコードするヌクレオチド配列、及びドナーテンプレート核酸をコードするヌクレオチド配列を含む組み換え発現ベクター;k)本開示のCasX融合ポリペプチドをコードするヌクレオチド配列及びCasXガイドRNAをコードするヌクレオチド配列を含む組み換え発現ベクター;l)本開示のCasX融合ポリペプチドをコードするヌクレオチド配列、CasXガイドRNAをコードするヌクレオチド配列、及びドナーテンプレート核酸をコードするヌクレオチド配列を含む組み換え発現ベクター;m)本開示のCasXポリペプチドをコードするヌクレオチド配列を含む第1の組み換え発現ベクター、CasXガイドRNAをコードするヌクレオチド配列を含む第2の組み換え発現ベクター;n)本開示のCasXポリペプチドをコードするヌクレオチド配列を含む第1の組み換え発現ベクター、及びCasXガイドRNAをコードするヌクレオチド配列を含む第2の組み換え発現ベクター、及びドナーテンプレート核酸;o)本開示のCasX融合ポリペプチドをコードするヌクレオチド配列を含む第1の組み換え発現ベクター、及びCasXガイドRNAをコードするヌクレオチド配列を含む第2の組み換え発現ベクター;p)本開示のCasX融合ポリペプチドをコードするヌクレオチド配列を含む第1の組み換え発現ベクター、及びCasXガイドRNAをコードするヌクレオチド配列を含む第2の組み換え発現ベクター、及びドナーテンプレート核酸;q)本開示のCasXポリペプチドをコードするヌクレオチド配列、第1のCasXガイドRNAをコードするヌクレオチド配列、及びCasXガイドRNAをコードするヌクレオチド配列を含む組み換え発現ベクター;もしくはr)本開示のCasX融合ポリペプチドをコードするヌクレオチド配列、第1のCasXガイドRNAをコードするヌクレオチド配列、及び第2のCasXガイドRNAをコードするヌクレオチド配列を含む組み換え発現ベクター;または(a)〜(r)のうちの1つのいくつかの異形を含む。一態様では、アミノアルコールリピドイド化合物は、細胞または対象に送達される薬剤と組み合わされて、マイクロ粒子、ナノ粒子、リポソーム、またはミセルを形成する。アミノアルコールリピドイド化合物は、他のアミノアルコールリピドイド化合物、ポリマー(合成または天然)、界面活性剤、コレステロール、炭水化物、脂質等と組み合わされて、粒子を形成することができる。次いで、これらの粒子は、任意に、薬学的賦形剤と組み合わされて、薬学的組成物を形成することができる。
ポリ(β−アミノアルコール)(PBAA)を使用して、本開示のCasXポリペプチド、本開示のCasX融合ポリペプチド、本開示のRNP、本開示の核酸、または本開示のCasX系を標的細胞に送達することができる。米国特許公開第20130302401号は、コンビナトリアル重合を使用して調製されたポリ(β−アミノアルコール)(PBAA)のクラスに関する。
糖系粒子、例えば、GalNAcは、WO2014118272(参照により本明細書に組み込まれる)及びNair,J K et al.,2014,Journal of the American Chemical Society 136(49),16958−16961)を参照して記載されるように使用することができ、それを使用して、本開示のCasXポリペプチド、本開示のCasX融合ポリペプチド、本開示のRNP、本開示の核酸、または本開示のCasX系を標的細胞に送達することができる。
ある場合には、脂質ナノ粒子(LNP)を使用して、本開示のCasXポリペプチド、本開示のCasX融合ポリペプチド、本開示のRNP、本開示の核酸、または本開示のCasX系を標的細胞に送達する。RNAなどの負電荷ポリマーを、LNP中に低pH値(例えば、pH4)で負荷され得、イオン化脂質は、正電荷を示す。しなしながら、生理学的pH値において、LNPは、より長い循環時間に対応した低表面電荷を呈する。4種のイオン化カチオン脂質、すなわち1,2−ジリネオイル−3−ジメチルアンモニウム−プロパン(DLinDAP)、1,2−ジリノレイルオキシ−3−N,N−ジメチルアミノプロパン(DLinDMA)、1,2−ジリノレイルオキシ−ケト−N,N−ジメチル−3−アミノプロパン(DLinKDMA)、及び1,2−ジリノレイル−4−(2−ジメチルアミノエチル)−[1,3]−ジオキソラン(DLinKC2−DMA)に焦点が当てられている。LNPの調製は、例えば、Rosin et al.(2011)Molecular Therapy 19:1286−2200)に記載されている。カチオン性脂質1,2−ジリネオイル−3−ジメチルアンモニウム−プロパン(DLinDAP)、1,2−ジリノレイルオキシ−3−N,N−ジメチルアミノプロパン(DLinDMA)、1,2−ジリノレイルオキシケト−N,N−ジメチル−3−アミノプロパン(DLinK−DMA)、1,2−ジリノレイル−4−(2−ジメチルアミノエチル)−[1,3]−ジオキソラン(DLinKC2−DMA)、(3−o−[2″−(メトキシポリエチレングリコール2000)スクリノイル]−1,2−ジミリストイル−sn−グリコール(PEG−S−DMG)、及びR−3−[(.omega.−メトキシ−ポリ(エチレングリコール)2000)カルバモイル]−1,2−ジミリストイルオキシルプロピル−3−アミン(PEG−C−DOMG)を使用することができる。核酸(例えば、CasXガイドRNA、本開示の核酸等)は、DLinDAP、DLinDMA、DLinK−DMA、及びDLinKC2−DMAを含有するLNPにカプセル化され得る(カチオン性脂質:DSPC:CHOL:PEGS−DMGまたはPEG−C−DOMGを40:10:40:10モル比で)。ある場合には、0.2%のSP−DiOC18が組み込まれる。
球形核酸(SNA(商標)構築物及び他のナノ粒子(特に金ナノ粒子)を使用して、本開示のCasXポリペプチド、本開示のCasX融合ポリペプチド、本開示のRNP、本開示の核酸、または本開示のCasX系を標的細胞に送達することができる。例えば、Cutler et al.,J.Am.Chem.Soc.2011 133:9254−9257、Hao et al.,Small.2011 7:3158−3162、Zhang et al.,ACS Nano.2011 5:6962−6970、Cutler et al.,J.Am.Chem.Soc.2012 134:1376−1391、Young et al.,Nano Lett.2012 12:3867−71、Zheng et al.,Proc.Natl.Acad.Sci.USA.2012 109:11975−80、Mirkin,Nanomedicine 20127:635−638、Zhang et al.,J.Am.Chem.Soc.2012 134:16488−1691、Weintraub,Nature 2013 495:S14−S16、Choi et al.,Proc.Natl.Acad.Sci.USA.2013 110(19):7625−7630、Jensen et al.,Sci.Transl.″Med.″5,209ra152(2013)、及びMirkin,et al.,Small,10:186−192を参照されたい。
RNAを有する自己集合ナノ粒子は、ポリエチレングリコール(PEG)の遠隔端に付着したArg−Gly−Asp(RGD)でPEG化されるポリエチレンイミン(PEI)で構築され得る。
一般に、「ナノ粒子」は、1000nm未満の直径を有する任意の粒子を指す。ある場合には、本開示のCasXポリペプチド、本開示のCasX融合ポリペプチド、本開示のRNP、本開示の核酸、または本開示のCasX系を標的細胞に送達する際に使用するのに適したナノ粒子は、500nm以下、例えば、25nm〜35nm、35nm〜50nm、50nm〜75nm、75nm〜100nm、100nm〜150nm、150nm〜200nm、200nm〜300nm、300nm〜400nm、または400nm〜500nmの直系を有する。ある場合には、本開示のCasXポリペプチド、本開示のCasX融合ポリペプチド、本開示のRNP、本開示の核酸、または本開示のCasX系を標的細胞に送達する際に使用するのに適したナノ粒子は、25nm〜200nmの直径を有する。ある場合には、本開示のCasXポリペプチド、本開示のCasX融合ポリペプチド、本開示のRNP、本開示の核酸、または本開示のCasX系を標的細胞に送達する際に使用するのに適したナノ粒子は、100nm以下の直径を有する。ある場合には、本開示のCasXポリペプチド、本開示のCasX融合ポリペプチド、本開示のRNP、本開示の核酸、または本開示のCasX系を標的細胞に送達する際に使用するのに適したナノ粒子は、35nm〜60nmの直径を有する。
本開示のCasXポリペプチド、本開示のCasX融合ポリペプチド、本開示のRNP、本開示の核酸、または本開示のCasX系を標的細胞に送達する際に使用するのに適したナノ粒子は、異なる形態で、例えば、固体ナノ粒子(例えば、銀、金、鉄、チタンなどの金属)、非金属、脂質系固体、ポリマー)、ナノ粒子の懸濁液、またはそれらの組み合わせとして提供され得る。金属、絶縁体、及び半導体ナノ粒子、ならびにハイブリッド構造(例えば、コアシェルナノ粒子)が調製され得る。半導体材料で作製されたナノ粒子はまた、それらが電子エネルギーレベルの量子化が起こるのに十分に小さい場合(典型的に、10nm以下)、標識化量子ドットであり得る。そのようなナノスケール粒子は、生物医学的適用において、薬物担体または造影剤として使用され、本開示において同様の目的で適応され得る。
半固体かつ軟質のナノ粒子はまた、本開示のCasXポリペプチド、本開示のCasX融合ポリペプチド、本開示のRNP、本開示の核酸、または本開示のCasX系を標的細胞に送達する際に使用するのに好適である。半固体性質のプロトタイプナノ粒子は、リポソームである。
ある場合には、エキソソームを使用して、本開示のCasXポリペプチド、本開示のCasX融合ポリペプチド、本開示のRNP、本開示の核酸、または本開示のCasX系を標的細胞に送達する。エキソソームは、RNA及びタンパク質を輸送し、RNAを脳及び他の標的器官に送達することができる、内因性ナノベシクル粒子である。
ある場合には、リポソームを使用して、本開示のCasXポリペプチド、本開示のCasX融合ポリペプチド、本開示のRNP、本開示の核酸、または本開示のCasX系を標的細胞に送達する。リポソームは内部水性区画を取り囲む単層または多層脂質二層、及び比較的不透過性の外側親油性リン脂質二層で構成される球形ベシクル構造である。リポソームは、いくつかの異なる種類の脂質から作製され得るが、リポソームを生成するために、リン脂質が最も一般に使用される。リポソーム形成は、脂質膜が水溶液と混合されたときに自然に起こるが、それはまた、ホモジナイザー、ソニケーター、または押出装置を使用することによる振盪の形態で力を印加することによって促進され得る。それらの構造及び特性を修飾するために、いくつかの他の添加剤がリポソームに添加されてもよい。例えば、リポソーム構造の安定化を助けるため、及びリポソーム内部カーゴの漏出を防止するために、コレステロールまたはスフィンゴミエリンのいずれかがリポソーム混合物に添加されてもよい。リポソーム配合物は、主に、天然のリン脂質、ならびに1,2−ジステアロリル−sn−グリセロ−3−ホスファチジルコリン(DSPC)、スフィンゴミエリン、卵ホスファチジルコリン、及びモノシアロガングリオシドなどの脂質で構成され得る。
安定な核酸−脂質粒子(SNALP)を使用して、本開示のCasXポリペプチド、本開示のCasX融合ポリペプチド、本開示のRNP、本開示の核酸、または本開示のCasX系を標的細胞に送達することができる。SNALP配合物は、脂質3−N−[(メトキシポリ(エチレングリコール)2000)カルバモイル]−1,2−ジミリストイルオキシ−プロピルアミン(PEG−C−DMA)、1,2−ジリノレイルオキシ−N,N−ジメチル−3−アミノプロパン(DLinDMA)、1,2−ジステアロイル−sn−グリセロ−3−ホスホコリン(DSPC)、及びコレステロールを、2:40:10:48モル%比で含有し得る。SNALPリポソームは、D−Lin−DMA及びPEG−C−DMAをジステアロイルホスファチジルコリン(DSPC)、コレステロール、及びsiRNAと配合することによって、25:1の脂質/siRNA比及び48/40/10/2モル比のコレステロール/D−Lin−DMA/DSPC/PEG−C−DMAを使用して調製され得る。結果として得られるSNALPリポソームは、約80〜100nmのサイズであり得る。SNALPは、合成コレステロール(Sigma−Aldrich,St Louis,Mo.,USA)、ジパルミトイルホスファチジルコリン(Avanti Polar Lipids,Alabaster,Ala.,USA)、3−N−[(w−メトキシポリ(エチレングリコール)2000)カルバモイル]−1,2−ジミリストイルオキシプロピルアミン、及びカチオン性1,2−ジリノレイルオキシ−3−N,Nジメチルアミノプロパンを含み得る。SNALPは、合成コレステロール(Sigma−Aldrich)、1,2−ジステアロイル−sn−グリセロ−3−ホスホコリン(DSPC、Avanti Polar Lipids Inc.)、PEG−cDMA、及び1,2−ジリノレイルオキシ−3−(N;N−ジメチル)アミノプロパン(DLinDMA)を含み得る。
アミノ脂質2,2−ジリノレイル−4−ジメチルアミノエチル−[1,3]−ジオキソラン(DLin−KC2−DMA)などの他のカチオン性脂質を使用して、本開示のCasXポリペプチド、本開示のCasX融合ポリペプチド、本開示のRNP、本開示の核酸、または本開示のCasX系を標的細胞に送達することができる。以下の脂質組成物、アミノ脂質、ジステアロイルホスファチジルコリン(DSPC)、コレステロール、及び(R)−2,3−ビス(オクタデシルオキシ)プロピル−1−(メトキシポリ(エチレングリコール)2000)プロピルカルバメート(PEG−脂質)をそれぞれ40/10/40/10モル比、及びおよそ0.05(w/w)のFVII siRNA/総脂質比で有する予備形成されたベシクルが企図され得る。70〜90nmの範囲の狭い粒径分布及び0.11±0.04(n=56)の低い多分散指数を保証するために、粒子は、ガイドRNAを付加する前に80nm膜を通して最大3回押し出され得る。非常に強力なアミノ脂質16を含有する粒子が使用されてもよく、ここで4つの脂質成分16、DSPC、コレステロール、及びPEG−脂質(50/10/38.5/1.5)のモル比が、さらに最適化され、インビボ活性を向上させることができる。
脂質は、本開示のCasX系またはその成分(複数可)またはそれをコードする核酸と配合され、脂質ナノ粒子(LNP)を形成することができる。好適な脂質としては、DLin−KC2−DMA4、C12−200、及び共脂質ジステロイルホスファチジルコリン、コレステロールが挙げられるが、これらに限定されず、PEG−DMGは、自発的なベシクル形成手順を使用して、本開示のCasX系またはその成分と配合され得る。成分モル比は、約50/10/38.5/1.5(DLin−KC2−DMAまたはC12−200/ジステロイルホスファチジルコリン/コレステロール/PEG−DMG)であり得る。
本開示のCasX系またはその成分は、米国公開済み出願第20130252281号及び同第20130245107号及び同第20130244279号にさらに記載されるように、PLGA微小球にカプセル化されて送達され得る。
超電荷タンパク質を使用して、本開示のCasXポリペプチド、本開示のCasX融合ポリペプチド、本開示のRNP、本開示の核酸、または本開示のCasX系を標的細胞に送達することができる。超電荷タンパク質は、異常に高い正または負の正味理論的電荷を有する操作されたまたは天然に存在するタンパク質のクラスである。超負及電荷及び超正電荷のタンパク質の両方は、熱的または化学的に誘導された凝集に耐える能力を呈する。超正電荷タンパク質はまた、哺乳動物細胞を透過することができる。カーゴをこれらのタンパク質、例えば、プラスミドDNA、RNA、または他のタンパク質と会合させることは、インビトロ及びインビボの両方で、哺乳動物細胞へのこれらの高分子の機能的送達を促進し得る。
細胞透過性ペプチド(CPP)を使用して、本開示のCasXポリペプチド、本開示のCasX融合ポリペプチド、本開示のRNP、本開示の核酸、または本開示のCasX系を標的細胞に送達することができる。CPPは、典型的に、リジンもしくはアルギニンなどの高い相対的存在量の正電荷アミノ酸を含有するか、または極性/電荷アミノ酸及び非極性疎水性アミノ酸の交互パターンを含有する配列を有するかのいずれかであるアミノ酸組成物を有する。
埋め込み可能なデバイスを使用して、本開示のCasXポリペプチド、本開示のCasX融合ポリペプチド、本開示のRNP、本開示の核酸(例えば、CasXガイドRNA、CasXガイドRNAをコードする核酸、CasXポリペプチドをコードする核酸、ドナーテンプレート等)、または本開示のCasX系を標的細胞に送達することができる(例えば、インビボでの標的細胞、この標的細胞は、循環中の標的細胞、組織中の標的細胞、器官中の標的細胞等である)。本開示のCasXポリペプチド、本開示のCasX融合ポリペプチド、本開示のRNP、本開示の核酸、または本開示のCasX系を標的細胞(例えば、インビボでの標的細胞、この標的細胞は、循環中の標的細胞、組織中の標的細胞、器官中の標的細胞等である)に送達する際に使用するのに適した埋め込み可能なデバイスは、CasXポリペプチド、CasX融合ポリペプチド、RNP、またはCasX系(もしくはその成分、例えば、本開示の核酸)を含む容器(例えば、貯留器、マトリックス等)を含み得る。
好適な埋め込み可能なデバイスは、例えば、デバイス本体として使用されるマトリックスなどのポリマー基質、またある場合には、金属などの追加の足場材料、追加のポリマー、ならびに可視性及び撮像を向上させる材料を含み得る。埋め込み可能な送達デバイスは、局所的かつ長期間にわたる放出を提供することにおいて有利であり得、送達されるポリペプチド及び/または核酸は、標的部位(例えば、細胞外マトリックス(ECM)、腫瘍を取り囲む血管系、罹患組織等)に直接放出される。好適な埋め込み型デバイスとしては、腹腔などの空洞への送達及び/または薬物送達系が係留もしくは付着されていない任意の他の種類の投与において使用するのに適したデバイスが挙げられ、生安定性及び/または生分解性及び/または生体吸収性ポリマー基質(例えば、任意にマトリックスであり得る)を含む。ある場合には、好適な埋め込み型薬物送達デバイスは、分解性ポリマーを含み、主な放出機序は、バルク浸食である。ある場合には、好適な埋め込み可能な薬物送達デバイスは、非分解性または分解の遅いポリマーを含み、主な放出機序は、バルク浸食ではなく拡散であり、それにより外側部分は膜として機能し、その内側部分は、薬物貯留器として機能し、これは実際には長期間(例えば、約1週間〜約数ヶ月間)にわたって周囲に影響されない。異なる放出機序を有する異なるポリマーの組み合わせが、任意に使用されてもよい。濃度勾配は、総放出期間の実質的な期間中、効果的に一定に維持され得るため、拡散速度は効果的に一定である(「ゼロモード」拡散と呼ばれる)。「一定」という用語は、治療効果の低い閾値より上で維持されるが、依然として任意に初期バーストを特徴とし得る、及び/または変動し得る(例えば、ある特定の程度に増加及び減少する)拡散速度を意味する。拡散速度は、長期間にわたってそのように維持され得、治療有効期間(例えば、有効サイレンシング期間)を最適化するために、ある特定のレベルで一定であるとみなされ得る。
ある場合には、埋め込み型送達系は、化学的性質であるか否か、または対象の体内の酵素及び他の因子からの攻撃に起因して、ヌクレオチド系治療剤を分解から遮断するように設計される。
デバイスの埋め込みのための部位、または標的部位が、最大治療効果のために選択され得る。例えば、送達デバイスは、腫瘍環境または腫瘍に関連した血液供給内またはその近位に埋め込まれ得る。標的位置は、例えば、1)基底核、白質、及び灰白質におけるパーキンソン病またはアルツハイマー病のような変性部位での脳、2)筋萎縮性側索硬化症(ALS)の場合のような脊椎、3)子宮頸部、4)活性及び慢性炎症性関節、5)乾癬の場合のような真皮、7)鎮痛効果のための交換及び感覚神経部位、7)骨、8)急性または慢性感染の部位、9)膣内、10)内耳−聴覚系、内耳の迷路、前庭系、11)気管内、12)心臓内、環状部、心外膜、13)尿路または膀胱、14)胆道系、15)腎臓、肝臓、脾臓を含むが、これらに限定されない実質組織、16)リンパ節、17)唾液腺、18)歯肉、19)関節内(関節中)、20)眼内、21)脳組織、22)脳室、23)腹腔を含む空洞(例えば、限定されないが、卵巣癌の場合)、24)食道内、25)直腸内、ならびに26)血管系中であり得る。
埋め込みなどの挿入の方法は、任意に、他の種類の組織埋め込みのため、及び/または挿入のため、及び/または組織採取のため、任意に修飾無しに、あるいは任意にそのような方法において主要でない修飾のみと共に使用されてもよい。そのような方法として、任意に、近接照射療法、生検、超音波を伴う及び/または伴わない内視鏡検査、例えば、脳組織への定位放射線法、関節、腹部器官、膀胱壁、及び体腔中への腹腔鏡の埋め込みを含む腹腔鏡検査が挙げられるが、これらに限定されない。
修飾された宿主細胞
本開示は、本開示のCasXポリペプチド、及び/または本開示のCasXポリペプチドをコードするヌクレオチド配列を含む核酸を含む、修飾された細胞を提供する。本開示は、本開示のCasXポリペプチドを含む修飾された細胞を提供し、修飾された細胞は、通常は本開示のCasXポリペプチドを含まない細胞である。本開示は、本開示のCasXポリペプチドをコードするヌクレオチド配列を含む核酸を含む、修飾された細胞(例えば、遺伝子修飾された細胞)を提供する。本開示は、本開示のCasXポリペプチドをコードするヌクレオチド配列を含むmRNAで遺伝子修飾された、遺伝子修飾された細胞を提供する。本開示は、本開示のCasXポリペプチドをコードするヌクレオチド配列を含む組み換え発現ベクターで遺伝子修飾された、遺伝子修飾された細胞を提供する。本開示は、a)本開示のCasXポリペプチドをコードするヌクレオチド配列、及びb)本開示のCasXガイドRNAをコードするヌクレオチド配列を含む組み換え発現ベクターで遺伝子修飾された、遺伝子修飾された細胞を提供する。本開示は、a)本開示のCasXポリペプチドをコードするヌクレオチド配列、b)本開示のCasXガイドRNAをコードするヌクレオチド配列、及びc)ドナーテンプレートをコードするヌクレオチド配列を含む組み換え発現ベクターで遺伝子修飾された、遺伝子修飾された細胞を提供する。
本開示のCasXポリペプチドのレシピエントとして役立つ細胞、及び/または本開示のCasXポリペプチドをコードするヌクレオチド配列を含む核酸、及び/または本開示のCasXガイドRNAは、例えば、インビトロ細胞、インビボ細胞、エクスビボ細胞、一次細胞、がん細胞、動物細胞、植物細胞、藻類細胞、真菌細胞等を含む様々な細胞のうちのいずれかであり得る。本開示のCasXポリペプチドのレシピエントとして役立つ細胞、及び/または本開示のCasXポリペプチドをコードするヌクレオチド配列を含む核酸、及び/または本開示のCasXガイドRNAは、「宿主細胞」または「標的細胞」と称される。宿主細胞または標的細胞は、本開示のCasX系のレシピエントであり得る。宿主細胞または標的細胞は、本開示のCasX RNPのレシピエントであり得る。宿主細胞または標的細胞は、本開示のCasX系の単一成分のレシピエントであり得る。
細胞(標的細胞)の非限定例としては、原核細胞、真菌細胞、細菌細胞、古細菌細胞、単細胞真核生物の細胞、原生生物細胞、植物由来の細胞(例えば、植物作物、果物、野菜、穀物、大豆、トウモロコシ(corn)、トウモロコシ(maize)、小麦、種、トマト、米、キャッサバ、サトウキビ、カボチャ、乾草、ジャガイモ、綿、カンナビス、タバコ、顕花植物、球果植物、裸子植物、被子植物、シダ類、ヒカゲノカズラ類、ツノゴケ類、苔類コケ植物、苔類、双子葉植物、単子葉植物等由来の細胞)、藻類細胞(例えば、Botryococcus braunii、Chlamydomonas reinhardtii、Nannochloropsis gaditana、Chlorella pyrenoidosa、Sargassum patens、C.agardh等)、海藻類(例えば、昆布)、真菌細胞(例えば、酵母細胞、マッシュルーム由来の細胞)、動物細胞、無脊椎動物(例えば、ミバエ、蠕虫、棘皮動物、線形動物等)由来の細胞、脊椎動物(例えば、魚、両生類、爬虫類、鳥、哺乳動物)由来の細胞、哺乳動物(例えば、有蹄類(例えば、ブタ、ウシ、ヤギ、ヒツジ)、齧歯類(例えば、ラット、マウス)、非ヒト霊長類、ヒト、ネコ科動物(例えば、ネコ)、イヌ科動物(例えば、イヌ)等)由来の細胞等が挙げられる。ある場合には、細胞は、天然の生物を起源としない細胞である(例えば、細胞は、合成的に作製された細胞であり得る。人工細胞とも称される)。
細胞は、インビトロ細胞(例えば、確立された培養細胞株)であり得る。細胞は、エクスビボ細胞(個体からの培養細胞)であり得る。細胞は、インビボ細胞(例えば、個体中の細胞)であり得る。細胞は、単離細胞であり得る。細胞は、生物の体内の細胞であり得る。細胞は、生物であり得る。細胞は、細胞培養物(例えば、インビトロ細胞培養物)中の細胞であり得る。細胞は、細胞の集団のうちの1つであり得る。細胞は、原核細胞であり得るか、または原核細胞に由来し得る。細胞は、細菌細胞であり得るか、または細菌細胞に由来し得る。細胞は、古細菌細胞であり得るか、または古細菌細胞に由来し得る。細胞は、真核細胞であり得るか、または真核細胞に由来し得る。細胞は、植物細胞であり得るか、または植物細胞に由来し得る。細胞は、動物細胞であり得るか、または動物細胞に由来し得る。細胞は、無脊椎動物細胞であり得るか、または無脊椎動物細胞に由来し得る。細胞は、脊椎動物細胞であり得るか、または脊椎動物に由来し得る。細胞は、哺乳動物細胞であり得るか、または哺乳動物細胞に由来し得る。細胞は、齧歯類細胞であり得るか、または齧歯類細胞に由来し得る。細胞は、ヒト細胞であり得るか、またはヒト細胞に由来し得る。細胞は、微生物細胞であり得るか、または微生物細胞に由来し得る。細胞は、真菌細胞であり得るか、または真菌細胞に由来し得る。細胞は、昆虫細胞であり得る。細胞は、節足動物細胞であり得る。細胞は、原生動物細胞であり得る。細胞は、蠕虫細胞であり得る。
好適な細胞としては、幹細胞(例えば、胚幹(ES)細胞、誘導多能性幹(iPS)細胞、生殖細胞(例えば、卵母細胞、精子、卵原細胞、精原細胞等)、体細胞、例えば、線維芽細胞、オリゴデンドロサイト、グリア細胞、造血細胞、ニューロン、筋細胞、骨細胞、肝細胞、膵細胞等が挙げられる。
好適な細胞としては、ヒト胚幹細胞、胎児心筋細胞、筋線維芽細胞、間葉系幹細胞、自家移植拡張心筋細胞、脂肪細胞、全能性細胞、多能性細胞、血液肝細胞、筋芽細胞、成体肝細胞、骨髄細胞、間葉系細胞、胚性幹細胞、実質細胞、上皮細胞、内皮細胞、中皮細胞、線維芽細胞、骨芽細胞、軟骨細胞、外因性細胞、内因性細胞、幹細胞、造血幹細胞、骨髄由来の前駆細胞、心筋細胞、骨格細胞、胎児細胞、未分化細胞、多能性前駆細胞、単能性前駆細胞、単球、心筋芽細胞、骨格筋芽細胞、マクロファージ、毛細血管内皮細胞、異種細胞、同種細胞、及び出生後幹細胞が挙げられる。
ある場合には、細胞は、免疫細胞、ニューロン、上皮細胞、及び内皮細胞、または幹細胞である。ある場合には、免疫細胞は、T細胞、B細胞、単球、天然キラー細胞、樹状細胞、またはマクロファージである。ある場合には、免疫細胞は、細胞毒性T細胞である。ある場合には、免疫細胞は、ヘルパーT細胞である。ある場合には、免疫細胞は、調節性T細胞(Treg)である。
ある場合には、細胞は、幹細胞である。幹細胞は、成体幹細胞を含む。成体幹細胞はまた、体幹細胞と称される。
成体幹細胞は、分化組織中に常駐するが、自己更新の特性及び複数の細胞型、通常は幹細胞が見出される組織に典型的な細胞型を生じる能力を保持する。体幹細胞の多くの例は、当業者に既知であり、筋幹細胞、造血幹細胞、上皮幹細胞、神経幹細胞、間葉系幹細胞、哺乳動物幹細胞、腸幹細胞、中胚葉性幹細胞、内皮幹細胞、嗅官幹細胞、神経堤幹細胞等が挙げられる。
関心対象の幹細胞としては、哺乳動物幹細胞が挙げられ、「哺乳動物」という用語は、ヒト、非ヒト霊長類、飼育動物及び家畜、ならびに動物園、研究室、競技用、または愛玩動物、例えば、イヌ、ウマ、ネコ、ウシ、マウス、ラット、ウサギ等を含む哺乳動物として分類される任意の動物を指す。ある場合には、幹細胞は、ヒト幹細胞である。ある場合には、幹細胞は、齧歯類(例えば、マウス、ラット)幹細胞である。ある場合には、幹細胞は、非ヒト霊長類幹細胞である。
幹細胞は、1つ以上の幹細胞マーカー、例えば、SOX9、KRT19、KRT7、LGR5、CA9、FXYD2、CDH6、CLDN18、TSPAN8、BPIFB1、OLFM4、CDH17、及びPPARGC1Aを発現し得る。
いくつかの実施形態では、幹細胞は、造血幹細胞(HSC)である。HSCは、骨髄、血液、臍帯血、胎児肝臓、及び卵黄嚢から単離され得る中胚葉由来の細胞である。HSCは、CD34+及びCD3−として特徴付けられる。HSCは、赤血球、好中球−マクロファージ、巨核球、及びリンパ球様造血細胞系統をインビボで再配置させることができる。インビトロで、HSCは、少なくともいくらかの自己更新細胞分裂を受けるように誘導され得、インビボで見られるものと同じ系統に分化するように誘導され得る。そのようなものとして、HSCは、赤血球細胞、巨核球、好中球、マクロファージ、及びリンパ球細胞のうちの1つ以上に分化するように誘導され得る。
他の実施形態では、幹細胞は、神経幹細胞(NSC)である。神経幹細胞(NSC)は、ニューロン及びグリア(オリゴデンドロサイト及び星状細胞を含む)に分化することが可能である。神経幹細胞は、多分裂が可能である多能性幹細胞であり、特定の条件下で、神経幹細胞である娘細胞、または神経芽細胞もしくは神経膠芽細胞であり得る神経前駆細胞、ニューロン及びグリア細胞、例えば、それぞれ1種以上のニューロン及びグリア細胞になるように傾倒した細胞を産生し得る。NSCを得る方法は、当該技術分野において既知である。
他の実施形態では、幹細胞は、間葉系幹細胞(MSC)である。本来、胚性中胚葉に由来し、成体骨髄から単離されたMSCは分化して、筋肉、骨、軟骨、脂肪、骨髄基質、及び腱を形成することができる。MSCを単離する方法は、当該技術分野において既知であり、任意の既知の方法を使用して、MSCを得ることができる。例えば、ヒトMSCの単離について記載している米国特許第5,736,396号を参照されたい。
細胞は、ある場合には、植物細胞である。植物細胞は、単子葉植物の細胞であり得る。細胞は、双子葉植物の細胞であり得る。
ある場合には、細胞は、植物細胞である。例えば、細胞は、主要な農業植物、例えば、大麦、豆(乾燥食用)、キャノーラ、トウモロコシ、綿(ピマ)、綿(アプランド)、アマニ、乾草(アルファルファ)、乾草(非アルファルファ)、オーツ麦、ピーナッツ、米、モロコシ、大豆、テンサイ、サトウキビ、ヒマワリ(油)、ヒマワリ(非油)、サツマイモ、タバコ(バーレー)、タバコ(黄色種)、トマト、小麦(ダラム)、小麦(春)、小麦(冬)等の細胞であり得る。別の例として、細胞は、例えば、アルファルファスプラウト、アロエの葉、クズウコン、オモダカ、アーティチョーク、アスパラガス、筍、バナナの花、豆もやし、豆、ビーツトップ(beet tops)、ビーツ、ゴーヤ、チンゲンサイ、ブロッコリー、ブロッコリーレイブ(ラピーニ)、芽キャベツ、キャベツ、キャベツスプラウト、カクタスリーフ(ノパル)、カボチャ、カルドン、ニンジン、カリフラワー、セロリ、ハヤトウリ、チョロギ(クローヌ)、ハクサイ、キンサイ、ニラ、サイシン、シュンギク(tung ho)、カラードグリーン、トウモロコシの茎、スイートコーン、キュウリ、ダイコン、食用タンポポの葉、タロイモ、豆苗(エンドウの葉)、トウキ(冬瓜)、ナス、エンダイブ、エンダイブ、ゼンマイ、グンバイナズナ、フリゼ、カラシナ(チャイニーズマスタード)、gailon、ガランガル(サイアム、タイジンジャー)、ニンニク、ショウガ、ゴボウ、グリーン、ハノーバーサラダグリーン、ウアウソントレ、エルサレムアーティチョーク、ヒカマ、ケールグリーン、コールラビ、アカザ(quilete)、レタス(ビッブ)、レタス(ボストン)、レタス(ボストンレッド)、レタス(グリーンリーフ)、レタス(アイスバーグ)、レタス(lolla rossa)、レタス(オークリーフ・グリーン)、レタス(オークリーフ・レッド)、レタス(加工)、レタス(レッドリーフ)、レタス(ロメイン)、レタス(ルビーロメイン)、レタス(ロシアンレッドマスタード)、linkok、lo bok、ササゲ、レンコン、マーシュ、マゲイ(アガベ)リーフ、ヤムイモ、メスクランミックス、水菜、moap(糸瓜)、moo、モクア(ファジースクオッシュ)、マッシュルーム、マスタード、長芋、オクラ、空芯菜、ネギ、opo(ロングスクオッシュ)、装飾トウモロコシ、装飾ヒョウタン、パセリ、パースニップ、豆、トウガラシ(ベルタイプ)、トウガラシ、カボチャ、ラディッキオ、ラディッシュの芽、ラディッシュ、レイプグリーン、レイプグリーン、ルバーブ、ロメイン(ベビーレッド)、ルタバガ、アッケシソウ(sea bean)、ヘチマ(トカド/トカドヘチマ)、ホウレンソウ、スクオッシュ、ストローベイル、サトウキビ、サツマイモ、スイスチャード、タマリンド、タロ、タロの葉、タロの芽、ターサイ、tepeguaje(ギンネム)、ティンドラ、トマティーヨ、トマト、トマト(チェリー)、トマト(グレープタイプ)、トマト(プラムタイプ)、ターメリック、カブの葉、カブ、ヒシの実、yampi、ヤム(names)、アブラナ、ユカ(キャッサバ)等を含むが、これらに限定されない野菜作物の細胞である。
細胞は、ある場合には、節足動物細胞である。例えば、細胞は、例えば、鋏角類、多足類、六脚類、クモ類、昆虫類、イシノミ目、シミ類、旧翅下綱、カゲロウ目、トンボ目、不均翅亜目、イトトンボ類、新翅類、外翅類、積翅類、シロアリモドキ目、直翅類、絶翅目、ハサミムシ類、網翅類、非翅目、ガロアムシ科、マントファスマ科、ナナフシ、ゴキブリ、等翅類、カマキリ類、副脈翅類、チャタテ虫、アザミウマ目、シラム目、半翅類、内翅類もしくは完全変態類、膜翅目、鞘翅目、ネジレバネ目、ラクダムシ目、広翅類、脈翅類、長翅類、ノミ目、双翅類、毛翅目、または鱗翅目の亜目、科、亜科、群、下位群、または種であり得る。
細胞は、ある場合には、昆虫細胞である。例えば、ある場合には、細胞は、蚊、バッタ、ナンキンムシ、ハエ、ノミ、ミツバチ、スズメバチ、アリ、ラウス、蛾、またはカブトムシの細胞である。
キット
本開示は、本開示のCasX系、または本開示のCasX系の成分を含むキットを提供する。
本開示のキットは、a)本開示のCasXポリペプチド及びCasXガイドRNA;b)本開示のCasXポリペプチド、CasXガイドRNA、及びドナーテンプレート核酸;c)本開示のCasX融合ポリペプチド及びCasXガイドRNA;d)本開示のCasX融合ポリペプチド、CasXガイドRNA、及びドナーテンプレート核酸;e)本開示のCasXポリペプチドをコードするmRNA、及びCasXガイドRNA;f)本開示のCasXポリペプチドをコードするmRNA、CasXガイドRNA、及びドナーテンプレート核酸;g)本開示のCasX融合ポリペプチドをコードするmRNA、及びCasXガイドRNA;h)本開示のCasX融合ポリペプチドをコードするmRNA、CasXガイドRNA、及びドナーテンプレート核酸;i)本開示のCasXポリペプチドをコードするヌクレオチド配列及びCasXガイドRNAをコードするヌクレオチド配列を含む組み換え発現ベクター;j)本開示のCasXポリペプチドをコードするヌクレオチド配列、CasXガイドRNAをコードするヌクレオチド配列、及びドナーテンプレート核酸をコードするヌクレオチド配列を含む組み換え発現ベクター;k)本開示のCasX融合ポリペプチドをコードするヌクレオチド配列及びCasXガイドRNAをコードするヌクレオチド配列を含む組み換え発現ベクター;l)本開示のCasX融合ポリペプチドをコードするヌクレオチド配列、CasXガイドRNAをコードするヌクレオチド配列、及びドナーテンプレート核酸をコードするヌクレオチド配列を含む組み換え発現ベクター;m)本開示のCasXポリペプチドをコードするヌクレオチド配列を含む第1の組み換え発現ベクター、CasXガイドRNAをコードするヌクレオチド配列を含む第2の組み換え発現ベクター;n)本開示のCasXポリペプチドをコードするヌクレオチド配列を含む第1の組み換え発現ベクター、及びCasXガイドRNAをコードするヌクレオチド配列を含む第2の組み換え発現ベクター、及びドナーテンプレート核酸;o)本開示のCasX融合ポリペプチドをコードするヌクレオチド配列を含む第1の組み換え発現ベクター、及びCasXガイドRNAをコードするヌクレオチド配列を含む第2の組み換え発現ベクター;p)本開示のCasX融合ポリペプチドをコードするヌクレオチド配列を含む第1の組み換え発現ベクター、及びCasXガイドRNAをコードするヌクレオチド配列を含む第2の組み換え発現ベクター、及びドナーテンプレート核酸;q)本開示のCasXポリペプチドをコードするヌクレオチド配列、第1のCasXガイドRNAをコードするヌクレオチド配列、及びCasXガイドRNAをコードするヌクレオチド配列を含む組み換え発現ベクター;もしくはr)本開示のCasX融合ポリペプチドをコードするヌクレオチド配列、第1のCasXガイドRNAをコードするヌクレオチド配列、及び第2のCasXガイドRNAをコードするヌクレオチド配列を含む組み換え発現ベクター;または(a)〜(r)のうちの1つのいくつかの異形を含み得る。
本開示のキットは、a)本開示のCasX系の上記の成分(または本開示のCasX系を含み得る)、ならびにb)1種以上の追加の試薬、例えば、i)緩衝液、ii)プロテアーゼ阻害剤、iii)ヌクレアーゼ阻害剤、iv)検出可能な標識を現像または可視化するために必要な試薬、v)正及び/または負の対照標的DNA、vi)正及び/または負の対照CasXガイドRNA等を含み得る。本開示のキットは、a)本開示のCasX系の上記の成分(または本開示のCasX系を含み得る)、及びb)治療剤を含み得る。
本開示のキットは、a)標的核酸中の標的ヌクレオチド配列にハイブリダイズするCasXガイドRNAの部分をコードするヌクレオチド配列を含む核酸を挿入するための挿入部位、及びb)CasXガイドRNAのCasX結合部分をコードするヌクレオチド配列を含む、組み換え発現ベクターを含み得る。本開示のキットは、a)標的核酸中の標的ヌクレオチド配列にハイブリダイズするCasXガイドRNAの部分をコードするヌクレオチド配列を含む核酸を挿入するための挿入部位、b)CasXガイドRNAのCasX結合部分をコードするヌクレオチド配列、及びc)本開示のCasXポリペプチドをコードするヌクレオチド配列を含む、組み換え発現ベクターを含み得る。
実用性
本開示のCasXポリペプチドまたは本開示のCasX融合ポリペプチドは、様々な方法において用途を見出す(例えば、CasXガイドRNAと組み合わせて、またある場合には、ドナーテンプレートとさらに組み合わせて)。例えば、本開示のCasXポリペプチドを使用して、(i)標的核酸(DNAまたはRNA、一本鎖または二本鎖)を修飾する(例えば、切断、例えば、ニック、メチレート等)、(ii)標的核酸の転写を変調する、(iii)標的核酸を標識する、(iv)標的核酸に結合する(例えば、単離、標識化、撮像、追跡等の目的)、(v)標的核酸と会合したポリペプチド(例えば、ヒストン)を修飾する等が可能である。このため、本開示は、標的核酸を修飾する方法を提供する。ある場合には、標的核酸を修飾するための本開示の方法は、標的核酸をa)本開示のCasXポリペプチド、及びb)1つ以上(例えば、2つ)のCasXガイドRNAと接触させることを含む。ある場合には、標的核酸を修飾するための本開示の方法は、標的核酸をa)本開示のCasXポリペプチド、b)CasXガイドRNA、及びc)ドナー核酸(例えば、ドナーテンプレート)と接触させることを含む。ある場合には、接触ステップは、インビトロで細胞中で実行される。ある場合には、接触ステップは、インビボで細胞中で実行される。ある場合には、接触ステップは、エクスビボで細胞中で実行される。
CasXポリペプチドを使用する方法は、CasXポリペプチドを標的核酸中の特定領域に(会合したCasXガイドRNAによってそこで標的されることによって)結合することを含むため、これらの方法は、一般に本明細書では、結合方法(例えば、標的核酸の結合方法)として言及される。しかしながら、ある場合には、結合方法は、標的核酸の結合以外は何ももたらさない場合があるが、他の場合では、この方法は、異なる最終結果を有し得る(例えば、この方法は、標的核酸の修飾、例えば、切断/メチル化等;標的核酸からの転写の変調;標的核酸の翻訳の変調;ゲノム編集;標的核酸に会合したタンパク質の変調;標的核酸の単離等をもたらし得る)ことを理解されたい。
好適な方法の例については、例えば、Jinek et al.,Science.2012 Aug 17;337(6096):816−21、Chylinski et al.,RNA Biol.2013 May;10(5):726−37、Ma et al.,Biomed Res Int.2013;2013:270805、Hou et al.,Proc Natl Acad Sci USA.2013 Sep 24;110(39):15644−9、Jinek et al.,Elife.2013;2:e00471、Pattanayak et al.,Nat Biotechnol.2013 Sep;31(9):839−43、Qi et al,Cell.2013 Feb 28;152(5):1173−83、Wang et al.,Cell.2013 May 9;153(4):910−8、Auer et al.,Genome Res.2013 Oct 31、Chen et al.,Nucleic Acids Res.2013 Nov 1;41(20):e19、Cheng et al.,Cell Res.2013 Oct;23(10):1163−71、Cho et al.,Genetics.2013 Nov;195(3):1177−80、DiCarlo et al.,Nucleic Acids Res.2013 Apr;41(7):4336−43、Dickinson et al.,Nat Methods.2013 Oct;10(10):1028−34、Ebina et al.,Sci Rep.2013;3:2510、Fujii et al,Nucleic Acids Res.2013 Nov 1;41(20):e187、Hu et al.,Cell Res.2013 Nov;23(11):1322−5;、Jiang et al.,Nucleic Acids Res.2013 Nov 1;41(20):e188、Larson et al.,Nat Protoc.2013 Nov;8(11):2180−96、Mali et.at.,Nat Methods.2013 Oct;10(10):957−63、Nakayama et al.,Genesis.2013 Dec;51(12):835−43、Ran et al.,Nat Protoc.2013 Nov;8(11):2281−308、Ran et al.,Cell.2013 Sep 12;154(6):1380−9、Upadhyay et al.,G3(Bethesda).2013 Dec 9;3(12):2233−8、Walsh et al.,Proc Natl Acad Sci USA.2013 Sep 24;110(39):15514−5、Xie et al.,Mol Plant.2013 Oct 9、Yang et al.,Cell.2013 Sep 12;154(6):1370−9、ならびに米国特許及び特許出願第8,906,616号、第8,895,308号、第8,889,418号、第8,889,356号、第8,871,445号、第8,865,406号、第8,795,965号、第8,771,945号、第8,697,359号、第20140068797号、第20140170753号、第20140179006号、第20140179770号、第20140186843号、第20140186919号、第20140186958号、第20140189896号、第20140227787号、第20140234972号、第20140242664号、第20140242699号、第20140242700号、第20140242702号、第20140248702号、第20140256046号、第20140273037号、第20140273226号、第20140273230号、第20140273231号、第20140273232号、第20140273233号、第20140273234号、第20140273235号、第20140287938号、第20140295556号、第20140295557号、第20140298547号、第20140304853号、第20140309487号、第20140310828号、第20140310830号、第20140315985号、第20140335063号、第20140335620号、第20140342456号、第20140342457号、第20140342458号、第20140349400号、第20140349405号、第20140356867号、第20140356956号、第20140356958号、第20140356959号、第20140357523号、第20140357530号、第20140364333号、及び第20140377868号(各々が参照によりその全体が本明細書に組み込まれる)を参照されたい。
例えば、本開示は、標的核酸を切断する方法、標的核酸を編集する方法、標的核酸からの転写を変調する方法、標的核酸を単離する方法、標的核酸を結合する方法、標的核酸を撮像する方法、標的核酸を修飾する方法等を提供する(但し、これらに限定されない)。
本明細書において使用される場合、「標的核酸を接触させる」及び例えば、CasXポリペプチドと、またはCasX融合ポリペプチド等と「標的核酸を接触させる」という用語/語句は、標的核酸を接触させるためのすべての方法を包含する。例えば、CasXポリペプチドは、タンパク質、RNA(CasXポリペプチドをコードする)、またはDNA(CasXポリペプチドをコードする)として細胞に提供され得るが、CasXガイドRNAは、ガイドRNAとして、またはガイドRNAをコードする核酸として提供され得る。そのようなものとして、例えば、細胞中(例えば、インビトロで細胞の内側、インビボで細胞の内側、エクスビボで細胞の内側)で方法を行うとき、標的核酸を接触させることを含む方法は、活性/最終状態にある(例えば、CasXポリペプチドのタンパク質(複数可)の形態の、CasX融合ポリペプチドのタンパク質の形態の、ある場合にはガイドRNAのRNAの形態の)いずれかまたはすべての成分の、細胞への導入を包含し、また成分のうちの1つ以上をコードする1つ以上の核酸(例えば、CasXポリペプチドまたはCasX融合ポリペプチドをコードするヌクレオチド配列(複数可)を含む核酸(複数可)、ガイドRNAをコードするヌクレオチド配列(複数可)を含む核酸(複数可)、ドナーテンプレートをコードするヌクレオチド配列を含む核酸等)の、細胞への導入を包含する。これらの方法はまた、細胞の外側でインビトロで行われ得るため、標的核酸を接触させることを含む方法は、(別途特定されない限り)インビトロで細胞の外側、インビトロで細胞の内側、インビボで細胞の内側、エクスビボで細胞の内側等で接触させることを含む。
ある場合には、標的核酸を修飾するための本開示の方法は、標的核酸を本開示のCasXポリペプチドと接触させること、または本開示のCasX融合ポリペプチドと接触させることを含む。ある場合には、標的核酸を修飾するための本開示の方法は、標的核酸をCasXポリペプチド及びCasXガイドRNAと接触させることを含む。ある場合には、標的核酸を修飾するための本開示の方法は、標的核酸をCasXポリペプチド1、第1のCasXガイドRNA、及び第2のCasXガイドRNAと接触させることを含み、ある場合には、標的核酸を修飾するための本開示の方法は、標的核酸を本開示のCasXポリペプチド及びCasXガイドRNA及びドナーDNAテンプレートと接触させることを含む。
標的核酸及び関心対象の標的細胞
本開示のCasXポリペプチド、または本開示のCasX融合ポリペプチドは、CasXガイドRNAに結合されたとき、標的核酸に結合することができ、ある場合には、標的核酸に結合し、修飾することができる。標的核酸は、任意の核酸(例えば、DNA、RNA)であり得、二本鎖または一本鎖であり得、任意の種類の核酸(例えば、染色体(ゲノムDNA)、染色体由来、染色体DNA、プラスミド、ウイルス、細胞外、細胞内、ミトコンドリア、葉緑体、線状、環状等)であり得、また任意の生物に由来し得る(例えば、CasXガイドRNAが、標的核酸中の標的配列にハイブリダイズするヌクレオチド配列を含む限り、標的核酸は標的化され得る)。
標的核酸は、DNAまたはRNAであり得る。標的核酸は、二本鎖(例えば、dsDNA、dsRNA)または一本鎖(例えば、ssRNA、ssDNA)であり得る。ある場合には、標的核酸は、一本鎖である。ある場合には、標的核酸は、一本鎖RNA(ssRNA)である。ある場合には、標的ssRNA(例えば、標的細胞ssRNA、ウイルスssRNA等)は、mRNA、rRNA、tRNA、非コードRNA(ncRNA)、長い非コードRNA(lncRNA)、及びマイクロRNA(miRNA)から選択される。ある場合には、標的核酸は、一本鎖DNA(ssDNA)(例えば、ウイルスDNA)である。上記のように、ある場合には、標的核酸は、一本鎖である。
標的核酸は、任意の場所、例えば、インビトロで細胞の外側、インビトロで細胞の内側、インビボで細胞の内側、エクスビボで細胞の内側に位置し得る。好適な標的細胞(ゲノムDNAなどの標的核酸を含み得る)としては、細菌細胞、古細菌細胞、単細胞真核生物の細胞、植物細胞、藻類細胞、例えば、ボツリオコッカス・ブラウニー(Botryococcus braunii)、コナミドリムシ(Chlamydomonas reinhardtii)、ナンノクロロプシス(Nannochloropsis gaditana)、クロレラ・ピレノイドサ(Chlorella pyrenoidosa)、ヤツマタモク(Sargassum patens)、C.agardh等、真菌細胞(例えば、酵母細胞)、動物細胞、無脊椎動物由来の細胞(例えば、ミバエ、蠕虫、棘皮動物、線形動物等)、昆虫の細胞(例えば、蚊、ミツバチ、農業害虫等)、クモ形類動物の細胞(例えば、クモ、ダニ等)、脊椎動物由来の細胞(例えば、魚、両生類、爬虫類、鳥、哺乳動物)、哺乳動物由来の細胞(例えば、齧歯類由来の細胞、ヒト由来の細胞、非ヒト哺乳動物の細胞、齧歯類の細胞(例えば、マウス、ラット)、ウサギ類の細胞(例えば、ウサギ)、有蹄類の細胞(例えば、ウシ、ウマ、ラクダ、ラマ、ビクーニャ、ヒツジ、ヤギ等)、海洋哺乳動物の細胞(例えば、クジラ、アザラシ、ゾウアザラシ、イルカ、アシカ等)等が挙げられるが、これらに限定されない。任意の種類の細胞が関心対象であり得る(例えば、幹細胞、例えば、胚幹(ES)細胞、誘導多能性幹(iPS)細胞、生殖細胞(例えば、卵母細胞、精子、卵原細胞、精原細胞等)、成体細胞、体細胞、例えば、線維芽細胞、造血細胞、ニューロン、筋細胞、骨細胞、肝細胞、膵細胞、任意の段階にある胚のインビトロまたはインビボの胚細胞、例えば、1細胞、2細胞、4細胞、8細胞等の段階のゼブラフィッシュ胚等)。
細胞は、確立された細胞株に由来し得るか、またはそれらは一次細胞であってもよく、「一次細胞」、「一次細胞株」、及び「一次培養物」は、本明細書では、対象に由来し、インビトロで培養物の限定数の継代、すなわち分裂にわたって成長させた細胞及び細胞培養物を指すように同義に使用される。例えば、一次培養物は、0回、1回、2回、4回、5回、10回、または15回継代されたが、危機段階を通過するには十分でない培養物である。典型的には、一次細胞株は、インビトロで10継代未満にわたって維持される。標的細胞は、単細胞生物であり得、及び/または培養物中で成長され得る。細胞が一次細胞である場合、それらは任意の簡便な方法によって個体から採取され得る。例えば、白血球は、アフェレーシス、白血球アフェレーシス、密度勾配分離等によって簡便に採取され得るが、皮膚、筋肉、骨髄、脾臓、肝臓、膵臓、肺、腸、胃等由来の細胞は、生検によって簡便に採取され得る。
上記適用のうちのいくつかにおいて、対象の方法を用いて、標的核酸切断、標的核酸修飾を誘導する、及び/または有糸分裂もしくは有糸分裂後の細胞中の標的核酸を(例えば、可視化のために、収集及び/または分析等のために)、インビボで及び/またはエクスビボで及び/またはインビトロで結合する(例えば、標的化mRNAによってコードされたタンパク質の産生を妨害する、標的DNAを切断するか、または他の方法で修飾する、標的細胞を遺伝子修飾する)ことができる。ガイドRNAは、標的核酸にハイブリダイズすることによって特異性を提供するため、開示される方法における関心対象の有糸分裂及び/または有糸分裂後の細胞としては、任意の生物由来の細胞(例えば、細菌細胞、古細菌細胞、単細胞真核生物の細胞、植物細胞、藻類細胞、例えば、ボツリオコッカス・ブラウニー(Botryococcus braunii)、コナミドリムシ(Chlamydomonas reinhardtii)、ナンノクロロプシス(Nannochloropsis gaditana)、クロレラ・ピレノイドサ(Chlorella pyrenoidosa)、ヤツマタモク(Sargassum patens)、C.agardh等、真菌細胞(例えば、酵母細胞)、動物細胞、無脊椎動物由来の細胞(例えば、ミバエ、蠕虫、棘皮動物、線形動物等)、脊椎動物由来の細胞(例えば、魚、両生類、爬虫類、鳥、哺乳動物)、哺乳動物由来の細胞、齧歯類由来の細胞、ヒト由来の細胞等)を挙げることができる。ある場合には、対象のCasXタンパク質(及び/もしくはDNA及び/もしくはRNAなどのタンパク質をコードする核酸)ならびに/またはCasXガイドRNA(及び/またはガイドRNAをコードするDNA)、ならびに/またはドナーテンプレート、及び/またはRNPは、個体(例えば、哺乳動物、ラット、マウス、ブタ、霊長類、非ヒト霊長類、ヒト等)に導入され得る(すなわち、標的細胞がインビボであり得る)。ある場合には、そのような投与は、例えば、標的化細胞のゲノムを編集することによって、疾患を治療する及び/または予防する目的のためであり得る。
植物細胞としては、単子葉植物の細胞及び双子葉植物が挙げられる。細胞は、根細胞、葉細胞、木部の細胞、師部の細胞、形成層の細胞、頂端分裂組織細胞、実質細胞、厚角組織細胞、厚壁組織細胞等であり得る。植物細胞としては、農業作物、例えば小麦、トウモロコシ、米、モロコシ、キビ、大豆等の細胞が挙げられる。植物細胞としては、農業果物及びナッツ植物細胞、例えば、アプリコット、オレンジ、レモン、リンゴ、プラム、ナシ、アーモンド等を産生する植物の細胞が挙げられる。
標的細胞の追加の例は、「修飾細胞」という表題のセクションにおいて上に列挙される。細胞(標的細胞)の非限定例としては、原核細胞、真菌細胞、細菌細胞、古細菌細胞、単細胞真核生物の細胞、原生生物細胞、植物由来の細胞(例えば、植物作物、果物、野菜、穀物、大豆、トウモロコシ(corn)、トウモロコシ(maize)、小麦、種、トマト、米、キャッサバ、サトウキビ、カボチャ、乾草、ジャガイモ、綿、カンナビス、タバコ、顕花植物、球果植物、裸子植物、被子植物、シダ類、ヒカゲノカズラ類、ツノゴケ類、苔類コケ植物、苔類、双子葉植物、単子葉植物等由来の細胞)、藻類細胞(例えば、Botryococcus braunii、Chlamydomonas reinhardtii、Nannochloropsis gaditana、Chlorella pyrenoidosa、Sargassum patens、C.agardh等)、海藻類(例えば、昆布)、真菌細胞(例えば、酵母細胞、マッシュルーム由来の細胞)、動物細胞、無脊椎動物(例えば、ミバエ、蠕虫、棘皮動物、線形動物等)由来の細胞、脊椎動物(例えば、魚、両生類、爬虫類、鳥、哺乳動物)由来の細胞、哺乳動物(例えば、有蹄類(例えば、ブタ、ウシ、ヤギ、ヒツジ)、齧歯類(例えば、ラット、マウス)、非ヒト霊長類、ヒト、ネコ科動物(例えば、ネコ)、イヌ科動物(例えば、イヌ)等)由来の細胞等が挙げられる。ある場合には、細胞は、天然の生物を起源としない細胞である(例えば、細胞は、合成的に作製された細胞であり得る。人工細胞とも称される)。
細胞は、インビトロ細胞(例えば、確立された培養細胞株)であり得る。細胞は、エクスビボ細胞(個体からの培養細胞)であり得る。細胞は、インビボ細胞(例えば、個体中の細胞)であり得る。細胞は、単離細胞であり得る。細胞は、生物の体内の細胞であり得る。細胞は、生物であり得る。細胞は、細胞培養物(例えば、インビトロ細胞培養物)中の細胞であり得る。細胞は、細胞の集団のうちの1つであり得る。細胞は、原核細胞であり得るか、または原核細胞に由来し得る。細胞は、細菌細胞であり得るか、または細菌細胞に由来し得る。細胞は、古細菌細胞であり得るか、または古細菌細胞に由来し得る。細胞は、真核細胞であり得るか、または真核細胞に由来し得る。細胞は、植物細胞であり得るか、または植物細胞に由来し得る。細胞は、動物細胞であり得るか、または動物細胞に由来し得る。細胞は、無脊椎動物細胞であり得るか、または無脊椎動物細胞に由来し得る。細胞は、脊椎動物細胞であり得るか、または脊椎動物に由来し得る。細胞は、哺乳動物細胞であり得るか、または哺乳動物細胞に由来し得る。細胞は、齧歯類細胞であり得るか、または齧歯類細胞に由来し得る。細胞は、ヒト細胞であり得るか、またはヒト細胞に由来し得る。細胞は、微生物細胞であり得るか、または微生物細胞に由来し得る。細胞は、真菌細胞であり得るか、または真菌細胞に由来し得る。細胞は、昆虫細胞であり得る。細胞は、節足動物細胞であり得る。細胞は、原生動物細胞であり得る。細胞は、蠕虫細胞であり得る。
好適な細胞としては、幹細胞(例えば、胚幹(ES)細胞、誘導多能性幹(iPS)細胞、生殖細胞(例えば、卵母細胞、精子、卵原細胞、精原細胞等)、体細胞、例えば、線維芽細胞、オリゴデンドロサイト、グリア細胞、造血細胞、ニューロン、筋細胞、骨細胞、肝細胞、膵細胞等が挙げられる。
好適な細胞としては、ヒト胚幹細胞、胎児心筋細胞、筋線維芽細胞、間葉系幹細胞、自家移植拡張心筋細胞、脂肪細胞、全能性細胞、多能性細胞、血液肝細胞、筋芽細胞、成体肝細胞、骨髄細胞、間葉系細胞、胚性幹細胞、実質細胞、上皮細胞、内皮細胞、中皮細胞、線維芽細胞、骨芽細胞、軟骨細胞、外因性細胞、内因性細胞、幹細胞、造血幹細胞、骨髄由来の前駆細胞、心筋細胞、骨格細胞、胎児細胞、未分化細胞、多能性前駆細胞、単能性前駆細胞、単球、心筋芽細胞、骨格筋芽細胞、マクロファージ、毛細血管内皮細胞、異種細胞、同種細胞、及び出生後幹細胞が挙げられる。
ある場合には、細胞は、免疫細胞、ニューロン、上皮細胞、及び内皮細胞、または幹細胞である。ある場合には、免疫細胞は、T細胞、B細胞、単球、天然キラー細胞、樹状細胞、またはマクロファージである。ある場合には、免疫細胞は、細胞毒性T細胞である。ある場合には、免疫細胞は、ヘルパーT細胞である。ある場合には、免疫細胞は、調節性T細胞(Treg)である。
ある場合には、細胞は、幹細胞である。幹細胞は、成体幹細胞を含む。成体幹細胞はまた、体幹細胞と称される。
成体幹細胞は、分化組織中に常駐するが、自己更新の特性及び複数の細胞型、通常は幹細胞が見出される組織に典型的な細胞型を生じる能力を保持する。体幹細胞の多くの例は、当業者に既知であり、筋幹細胞、造血幹細胞、上皮幹細胞、神経幹細胞、間葉系幹細胞、哺乳動物幹細胞、腸幹細胞、中胚葉性幹細胞、内皮幹細胞、嗅官幹細胞、神経堤幹細胞等が挙げられる。
関心対象の幹細胞としては、哺乳動物幹細胞が挙げられ、「哺乳動物」という用語は、ヒト、非ヒト霊長類、飼育動物及び家畜、ならびに動物園、研究室、競技用、または愛玩動物、例えば、イヌ、ウマ、ネコ、ウシ、マウス、ラット、ウサギ等を含む哺乳動物として分類される任意の動物を指す。ある場合には、幹細胞は、ヒト幹細胞である。ある場合には、幹細胞は、齧歯類(例えば、マウス、ラット)幹細胞である。ある場合には、幹細胞は、非ヒト霊長類幹細胞である。
幹細胞は、1つ以上の幹細胞マーカー、例えば、SOX9、KRT19、KRT7、LGR5、CA9、FXYD2、CDH6、CLDN18、TSPAN8、BPIFB1、OLFM4、CDH17、及びPPARGC1Aを発現し得る。
いくつかの実施形態では、幹細胞は、造血幹細胞(HSC)である。HSCは、骨髄、血液、臍帯血、胎児肝臓、及び卵黄嚢から単離され得る中胚葉由来の細胞である。HSCは、CD34+及びCD3−として特徴付けられる。HSCは、赤血球、好中球−マクロファージ、巨核球、及びリンパ球様造血細胞系統をインビボで再配置させることができる。インビトロで、HSCは、少なくともいくらかの自己更新細胞分裂を受けるように誘導され得、インビボで見られるものと同じ系統に分化するように誘導され得る。そのようなものとして、HSCは、赤血球細胞、巨核球、好中球、マクロファージ、及びリンパ球細胞のうちの1つ以上に分化するように誘導され得る。
他の実施形態では、幹細胞は、神経幹細胞(NSC)である。神経幹細胞(NSC)は、ニューロン及びグリア(オリゴデンドロサイト及び星状細胞を含む)に分化することが可能である。神経幹細胞は、多分裂が可能である多能性幹細胞であり、特定の条件下で、神経幹細胞である娘細胞、または神経芽細胞もしくは神経膠芽細胞であり得る神経前駆細胞、ニューロン及びグリア細胞、例えば、それぞれ1種以上のニューロン及びグリア細胞になるように傾倒した細胞を産生し得る。NSCを得る方法は、当該技術分野において既知である。
他の実施形態では、幹細胞は、間葉系幹細胞(MSC)である。本来、胚性中胚葉に由来し、成体骨髄から単離されたMSCは分化して、筋肉、骨、軟骨、脂肪、骨髄基質、及び腱を形成することができる。MSCを単離する方法は、当該技術分野において既知であり、任意の既知の方法を使用して、MSCを得ることができる。例えば、ヒトMSCの単離について記載している米国特許第5,736,396号を参照されたい。
細胞は、ある場合には、植物細胞である。植物細胞は、単子葉植物の細胞であり得る。細胞は、双子葉植物の細胞であり得る。
ある場合には、細胞は、植物細胞である。例えば、細胞は、主要な農業植物、例えば、大麦、豆(乾燥食用)、キャノーラ、トウモロコシ、綿(ピマ)、綿(アプランド)、アマニ、乾草(アルファルファ)、乾草(非アルファルファ)、オーツ麦、ピーナッツ、米、モロコシ、大豆、テンサイ、サトウキビ、ヒマワリ(油)、ヒマワリ(非油)、サツマイモ、タバコ(バーレー)、タバコ(黄色種)、トマト、小麦(ダラム)、小麦(春)、小麦(冬)等の細胞であり得る。別の例として、細胞は、例えば、アルファルファスプラウト、アロエの葉、クズウコン、オモダカ、アーティチョーク、アスパラガス、筍、バナナの花、豆もやし、豆、ビーツトップ(beet tops)、ビーツ、ゴーヤ、チンゲンサイ、ブロッコリー、ブロッコリーレイブ(ラピーニ)、芽キャベツ、キャベツ、キャベツスプラウト、カクタスリーフ(ノパル)、カボチャ、カルドン、ニンジン、カリフラワー、セロリ、ハヤトウリ、チョロギ(クローヌ)、ハクサイ、キンサイ、ニラ、サイシン、シュンギク(tung ho)、カラードグリーン、トウモロコシの茎、スイートコーン、キュウリ、ダイコン、食用タンポポの葉、タロイモ、豆苗(エンドウの葉)、トウキ(冬瓜)、ナス、エンダイブ、エンダイブ、ゼンマイ、グンバイナズナ、フリゼ、カラシナ(チャイニーズマスタード)、gailon、ガランガル(サイアム、タイジンジャー)、ニンニク、ショウガ、ゴボウ、グリーン、ハノーバーサラダグリーン、ウアウソントレ、エルサレムアーティチョーク、ヒカマ、ケールグリーン、コールラビ、アカザ(quilete)、レタス(ビッブ)、レタス(ボストン)、レタス(ボストンレッド)、レタス(グリーンリーフ)、レタス(アイスバーグ)、レタス(lolla rossa)、レタス(オークリーフ・グリーン)、レタス(オークリーフ・レッド)、レタス(加工)、レタス(レッドリーフ)、レタス(ロメイン)、レタス(ルビーロメイン)、レタス(ロシアンレッドマスタード)、linkok、lo bok、ササゲ、レンコン、マーシュ、マゲイ(アガベ)リーフ、ヤムイモ、メスクランミックス、水菜、moap(糸瓜)、moo、モクア(ファジースクオッシュ)、マッシュルーム、マスタード、長芋、オクラ、空芯菜、ネギ、opo(ロングスクオッシュ)、装飾トウモロコシ、装飾ヒョウタン、パセリ、パースニップ、豆、トウガラシ(ベルタイプ)、トウガラシ、カボチャ、ラディッキオ、ラディッシュの芽、ラディッシュ、レイプグリーン、レイプグリーン、ルバーブ、ロメイン(ベビーレッド)、ルタバガ、アッケシソウ(sea bean)、ヘチマ(トカド/トカドヘチマ)、ホウレンソウ、スクオッシュ、ストローベイル、サトウキビ、サツマイモ、スイスチャード、タマリンド、タロ、タロの葉、タロの芽、ターサイ、tepeguaje(ギンネム)、ティンドラ、トマティーヨ、トマト、トマト(チェリー)、トマト(グレープタイプ)、トマト(プラムタイプ)、ターメリック、カブの葉、カブ、ヒシの実、yampi、ヤム(names)、アブラナ、ユカ(キャッサバ)等を含むが、これらに限定されない野菜作物の細胞である。
細胞は、ある場合には、節足動物細胞である。例えば、細胞は、例えば、鋏角類、多足類、六脚類、クモ類、昆虫類、イシノミ目、シミ類、旧翅下綱、カゲロウ目、トンボ目、不均翅亜目、イトトンボ類、新翅類、外翅類、積翅類、シロアリモドキ目、直翅類、絶翅目、ハサミムシ類、網翅類、非翅目、ガロアムシ科、マントファスマ科、ナナフシ、ゴキブリ、等翅類、カマキリ類、副脈翅類、チャタテ虫、アザミウマ目、シラム目、半翅類、内翅類もしくは完全変態類、膜翅目、鞘翅目、ネジレバネ目、ラクダムシ目、広翅類、脈翅類、長翅類、ノミ目、双翅類、毛翅目、または鱗翅目の亜目、科、亜科、群、下位群、または種であり得る。
細胞は、ある場合には、昆虫細胞である。例えば、ある場合には、細胞は、蚊、バッタ、ナンキンムシ、ハエ、ノミ、ミツバチ、スズメバチ、アリ、ラウス、蛾、またはカブトムシの細胞である。
標的細胞中に構成要素を導入
Cas9ガイドRNA(またはそれをコードするヌクレオチド配列を含む核酸)、及び/またはCas9融合ポリペプチド(またはそれをコードするヌクレオチド配列を含む核酸)、及び/またはドナーポリヌクレオチドは、様々な周知の方法のうちのいずれかによって宿主細胞に導入され得る。
核酸を細胞に導入する方法は、当該技術分野において既知であり、任意の簡便な方法を使用して、核酸(例えば、発現構築物)を標的細胞(例えば、真核細胞、ヒト細胞、幹細胞、前駆細胞等)に導入することができる。好適な方法は、本明細書の別の場所でより詳細に記載されており、例えば、ウイルスまたはバクテリオファージ感染、形質移入、共役、プロトプラスト融合、リポフェクション、電気穿孔、リン酸カルシウム沈降、ポリエチレンイミン(PEI)媒介型形質移入、DEAE−デキストラン媒介型形質移入、リポソーム媒介型形質移入、粒子ガン技術、リン酸カルシウム沈降、直接マイクロインジェクション、ナノ粒子媒介型核酸送達(例えば、Panyam et.,al Adv Drug Deliv Rev.2012 Sep 13.pii:S0169−409X(12)00283−9.doi:10.1016/j.addr.2012.09.023を参照)が挙げられる。成分のうちのいずれかまたはすべては、既知の方法、例えば、ヌクレオフェクションなどの既知の方法を使用して、組成物(例えば、CasXポリペプチド、CasXガイドRNA、ドナーポリヌクレオチド等の任意の簡便な組み合わせを含む)として細胞に導入され得る。
ドナーポリヌクレオチド(ドナーテンプレート)
CasX二重または単一ガイドRNAによって誘導されると、ある場合には、CasXタンパク質は、(例えば、CasXタンパク質がニッカーゼ変異形であるとき)二本鎖DNA(dsDNA)標的核酸内で部位特異的二本鎖破断(DSB)または一本鎖破断(SSB)を生成し、これらは非相同末端接合(NHEJ)または相同性配向型組み換え(HDR)のいずれかによって修復される。
ある場合には、標的DNAを(CasXタンパク質及びCasXガイドRNAと)接触させることは、非相同性末端接合または相同性配向型修復を許容する条件下で起こる。このため、ある場合には、対象の方法は、標的DNAをドナーポリヌクレオチドと(例えば、ドナーポリヌクレオチドを細胞に導入することによって)接触させることを含み、ここでドナーポリヌクレオチド、ドナーポリヌクレオチドの部分、ドナーポリヌクレオチドのコピー、またはドナーポリヌクレオチドのコピーの部分が標的DNAに統合される。ある場合には、方法は、細胞をドナーポリヌクレオチドと接触させることを含まず、標的DNAは、標的DNA内のヌクレオチドが欠失されるように修飾される。
ある場合には、CasXガイドRNA(またはそれをコードするDNA)及びCasXタンパク質(またはそれをコードする核酸、例えば、RNAまたはDNA、例えば、1つ以上の発現ベクター)が、少なくとも標的DNA配列に対して相同性を有するセグメントを含むドナーポリヌクレオチド配列と共投与され(例えば、標的核酸と接触される、細胞に投与される等)、対象の方法を使用して、核酸材料を標的DNA配列に付加する、すなわち、挿入または置換すること(例えば、核酸、例えば、タンパク質、siRNA、miRNA等をコードするものに「ノックイン」すること)、タグを付加すること(例えば、6xHis、蛍光タンパク質(例えば、緑色蛍光タンパク質、黄色蛍光タンパク質等)、ヘマグルチニン(HA)、FLAG等)、調節配列を遺伝子に付加すること(例えば、プロモーター、ポリアデニル化シグナル、内部リボソームエントリー配列(IRES)、2Aペプチド、開始コドン、停止コドン、スプライスシグナル、局在シグナル等)、核酸配列を修飾すること(例えば、突然変異を導入する、正しい配列を導入することによって突然変異を引き起こす疾患を除去する)等ができる。そのようなものとして、CasXガイドRNA及びCasXタンパク質を含む複合体は、任意のインビトロまたはインビボ用途において有用であり、部位特異的、すなわち「標的化」方法、例えば、遺伝子療法において、例えば疾患を治療するため、または抗ウイルス、抗病原性、または抗がん治療として使用される遺伝子ノックアウト、遺伝子ノックイン、遺伝子編集、遺伝子タグ付け等、農業における遺伝子修飾された生物の産生、治療、診断、または研究を目的とした細胞によるタンパク質の大規模産生、iPS細胞の誘導、生物学的研究、欠失または置換のための病原体の遺伝子の標的等でDNAを修飾することが望ましい。
ポリヌクレオチド配列を、標的配列が切断されるゲノムに挿入することが望ましい用途において、ドナーポリヌクレオチド(ドナー配列を含む核酸)もまた細胞に提供され得る。「ドナー配列」または「ドナーポリヌクレオチド」または「ドナーテンプレート」とは、CasXタンパク質によって切断された部位において(dsDNA切断後、標的DNAをニッキングした後、標的DNAを二重ニッキングした後等に)挿入される核酸配列を意味する。ドナーポリヌクレオチドは、標的部位におけるゲノム配列に対して十分な相同性、例えば、標的部位に隣接するヌクレオチド配列(例えば、標的部位の約50以下の塩基内、例えば、約30塩基内、約15塩基内、約10塩基内、約5塩基内、または標的部位に直ぐ隣接する)との70%、80%、85%、90%、95%、または100%の相同性を含み、それと相同性を担持するゲノム配列との間の相同性配向型修復を支持することができる。およそ25、50、100、もしくは200ヌクレオチド、または200超のヌクレオチドの、ドナーとゲノム配列との間の配列相同性(または10〜200ヌクレオチドの任意の整数値、もしくはそれ以上)は、相同性配向型修復を支持することができる。ドナーポリヌクレオチドは、任意の長さ、例えば、10ヌクレオチド以上、50ヌクレオチド以上、100ヌクレオチド以上、250ヌクレオチド以上、500ヌクレオチド以上、1000ヌクレオチド以上、5000ヌクレオチド以上等であり得る。
ドナー配列は、典型的に、それが置換されるゲノム配列と同一ではない。むしろ、ドナー配列は、相同性配向型修復を支持するのに(例えば、遺伝子補正のため、例えば、疾患を引き起こす塩基対を、疾患を引き起こさない塩基対に変換するために)十分な相同性が存在する限り、ゲノム配列に関して少なくとも1つ以上の単一塩基変更、挿入、欠失、反転、または再配置を含み得る。いくつかの実施形態では、ドナー配列は、相同性の2つの領域に隣接した非相同性配列を含み、それにより標的DNA領域と2つの隣接する配列との間の相同性配向型修復は、標的領域における非相同性配列の挿入をもたらす。ドナー配列はまた、関心対象のDNA領域に対して相同性でなく、関心対象のDNA領域への挿入が意図されないベクター骨格を含有する配列を含み得る。一般に、ドナー配列の相同性領域(複数可)は、組み換えが所望されるゲノム配列に対して少なくとも50%の配列同一性を有する。ある特定の実施形態では、60%、70%、80%、90%、95%、98%、99%、または99.9%の配列同一性が存在する。ドナーポリヌクレオチドの長さに応じて、1%〜100%の配列同一性の任意の値が存在し得る。
ドナー配列は、ゲノム配列と比較して、ある特定の配列の相違、例えば、制限部位、ヌクレオチド多形、選択可能なマーカー(例えば、薬物耐性遺伝子、蛍光タンパク質、酵素等)を含み得、これらを使用して、切断部位におけるドナー配列の良好な挿入について評価することができるか、またはある場合には、他の目的で使用することができる(例えば、標的化ゲノム遺伝子座における発現を示す)。ある場合には、コード領域に位置する場合、そのようなヌクレオチド配列の相違は、アミノ酸配列を変更しないか、またはサイレントアミノ酸変化(すなわち、タンパク質の構造または機能に影響しない変化)をもたらす。あるいは、これらの配列の相違は、マーカー配列の除去のために後に活性化され得る、隣接する組み換え配列、例えば、FLP、loxP配列等を含み得る。
ある場合には、ドナー配列は、一本鎖DNAとして細胞に提供される。ある場合には、ドナー配列は、二本鎖DNAとして細胞に提供される。線状または環状形態で細胞に導入され得る。線状形態で導入される場合、ドナー配列の末端は、任意の簡便な方法によって(例えば、エキソヌクレアーゼ分解から)保護され得、そのような方法は、当業者に既知である。例えば、1つ以上のジデオキシヌクレオチド残基は、線状分子の3′末端に付加され得、かつ/または自己相補的オリゴヌクレオチドは、一方の末端もしくは両方の末端にライゲーションされ得る。例えば、Chang et al.(1987)Proc.Natl.Acad Sci USA 84:4959−4963、Nehls et al.(1996)Science 272:886−889を参照されたい。外因性ポリヌクレオチドを分解から保護するためのさらなる方法としては、末端アミノ基(複数可)の付加、及び修飾ヌクレオチド間連結、例えば、ホスホロチオエート、ホスホロアミド酸、及びO−メチルリボースまたはデオキシリボース残基の使用が挙げられるが、これらに限定されない。線状ドナー配列の末端を保護するための代替として、追加の長さの配列が、組み換えに影響を及ぼすことなく分解され得る相同性の領域の外側に含まれ得る。ドナー配列は、例えば、複製起点、プロモーター、及び抗生物質耐性をコードする遺伝子などの追加の配列を有するベクター分子の一部として細胞に導入され得る。さらに、ドナー配列は、裸の核酸として、リポソームもしくはポロキサマーなどの薬剤と複合された核酸として導入され得るか、またはCasXガイドRNA及び/またはCasX融合ポリペプチド及び/またはドナーポリヌクレオチドをコードする核酸について本明細書の別の場所に記載されるように、ウイルス(例えば、アデノウイルス、AAV)によって送達され得る。
遺伝子導入の非ヒト生物
上記のように、ある場合には、本開示の核酸(例えば、組み換え発現ベクター)(例えば、本開示のCasXポリペプチドをコードするヌクレオチド配列を含む核酸、本開示のCasX融合ポリペプチドをコードするヌクレオチド配列を含む核酸等)を導入遺伝子として使用して、本開示のCasXポリペプチドまたはCasX融合ポリペプチドを産生する遺伝子導入の非ヒト生物を生成する。本開示は、本開示のCasXポリペプチドまたはCasX融合ポリペプチドをコードするヌクレオチド配列を含む遺伝子導入の非ヒト生物を提供する。
遺伝子導入の非ヒト動物
本開示は、遺伝子導入の非ヒト動物を提供し、この動物は、CasXポリペプチドまたはCasX融合ポリペプチドをコードするヌクレオチド配列を含む核酸を含む導入遺伝子を含む。いくつかの実施形態では、遺伝子導入の非ヒト動物のゲノムは、本開示のCasXポリペプチドまたはCasX融合ポリペプチドをコードするヌクレオチド配列を含む。ある場合には、遺伝子導入の非ヒト動物は、遺伝子修飾のためにホモ接合性である。ある場合には、遺伝子導入の非ヒト動物は、遺伝子修飾のためにヘテロ接合性である。いくつかの実施形態では、遺伝子導入の非ヒト動物は、脊椎動物、例えば、魚(例えば、サケ、トラウト、ゼブラフィッシュ、金魚、フグ、洞窟魚等)、両生類(カエル、イモリ、サンショウウオ等)、鳥(例えば、ニワトリ、七面鳥等)、爬虫類(例えば、ヘビ、トカゲ等)、非ヒト哺乳動物(例えば、有蹄類、例えば、ブタ、ウシ、ヤギ、ヒツジ等、ウサギ類(例えば、ウサギ)、齧歯類(例えば、ラット、マウス)、非ヒト霊長類等)等である。ある場合には、遺伝子導入の非ヒト動物は、無脊椎動物である。ある場合には、遺伝子導入の非ヒト動物は、昆虫(例えば、蚊、農業害虫等)である。ある場合には、遺伝子導入の非ヒト動物は、クモ形類である。
本開示のCasXポリペプチドまたはCasX融合ポリペプチドをコードするヌクレオチド配列は、未知のプロモーターの制御下にあり得るか(すなわち動作可能に連結される)(例えば、核酸が宿主細胞ゲノムにランダムに統合されるとき)、または既知のプロモーターの制御下にあり得る(すなわち、動作可能に連結される)。好適な既知のプロモーターは、任意の既知のプロモーターであり、構成的に活性なプロモーター(例えば、CMVプロモーター)、誘導性プロモーター(例えば、ヒートショックプロモーター、テトラサイクリン調節型プロモーター、ステロイド調節型プロモーター、金属調節型プロモーター、エストロゲン受容体調節型プロモーター等)、空間的制約及び/または時間的制約のあるプロモーター(例えば、組織特異的プロモーター、細胞型特異的プロモーター等)等を含み得る。
遺伝子導入植物
上記のように、ある場合には、本開示の核酸(例えば、組み換え発現ベクター)(例えば、本開示のCasXポリペプチドをコードするヌクレオチド配列を含む核酸、本開示のCasX融合ポリペプチドをコードするヌクレオチド配列を含む核酸等)を導入遺伝子として使用して、本開示のCasXポリペプチドまたはCasX融合ポリペプチドを産生する遺伝子導入植物を生成する。本開示は、本開示のCasXポリペプチドまたはCasX融合ポリペプチドコードするヌクレオチド配列を含む遺伝子導入植物を提供する。いくつかの実施形態では、遺伝子導入植物のゲノムは、対象の核酸を含む。いくつかの実施形態では、遺伝子導入植物は、遺伝子修飾のためにホモ接合性である。いくつかの実施形態では、遺伝子導入植物は、遺伝子修飾のためにヘテロ接合性である。
外因性核酸を植物細胞に導入する方法は、当該技術分野において周知である。そのような植物細胞は、上に定義されるように「形質転換された」とみなされる。好適な方法としては、ウイルス感染(二本鎖DNAウイルスなど)、形質移入、共役、プロトプラスト融合、電気穿孔、粒子ガン技術、リン酸カルシウム沈降、直接マイクロインジェクション、炭化ケイ素ウィスカー技術、アグロバクテリウム媒介型形質転換等が挙げられる。方法の選択は、一般に、形質転換される細胞の種類、及び形質転換が起こる状況(すなわち、インビトロ、エクスビボ、またはインビボ)に依存する。
土壌細菌のアグロバクテリウム・ツメファシエンス(Agrobacterium tumefaciens)に基づく形質転換方法は、外因性核酸分子を維管束植物に導入するために特に有用である。野生型形態のアグロバクテリウムは、宿主植物上で成長する腫瘍原性クラウウンゴールの産生を配向するTi(腫瘍誘導)プラスミドを含有する。Tiプラスミドの腫瘍誘導T−DNA領域の、植物ゲノムへの移行は、Tiプラスミドでコードされた病原性遺伝子ならびにT−DNA境界を必要とし、これらは移行される領域を描写する直接DNA反復の組である。アグロバクテリウム系ベクターは、修飾形態のTiプラスミドであり、腫瘍誘導機能は、植物宿主に導入される関心対象の核酸配列によって置き換えられる。
アグロバクテリウム媒介型形質転換は、一般に、融合体ベクターまたはバイナリベクター系を用い、Tiプラスミドの成分は、アグロバクテリウム宿主に永久に常駐し、病原性遺伝子を担持するヘルパーベクターと、T−DNA配列によって限定された関心対象の遺伝子を含むシャトルベクターとに分けられる。様々なバイナリベクターは、当該技術分野において周知であり、例えば、Clontech(Palo Alto,Calif.)から市販されている。例えば、アグロバクテリウムを培養された植物細胞または葉組織などの傷ついた組織、根片、胚軸、塊茎の幹片と共培養する方法もまた、当該技術分野において周知である。例えば、Glick and Thompson,(eds.),Methods in Plant Molecular Biology and Biotechnology,Boca Raton,Fla.:CRC Press(1993)を参照されたい。
マイクロプロジェクタイル媒介型形質転換を使用して、対象の遺伝子導入植物を産生することもできる。Klein et al.(Nature 327:70−73(1987)によって最初に記載されたこの方法は、塩化カルシウム、スペルミジン、またはポリエチレングリコールでの沈降によって所望の核酸分子でコーティングされた金またはタングステンなどのマイクロプロジェクタイルに依存する。マイクロプロジェクタイル粒子は、BIOLISTIC PD−1000(Biorad、Hercules Calif.)などのデバイスを使用して、被子植物組織中に高速で進められる。
本開示の核酸(例えば、本開示のCasXポリペプチドまたはCasX融合ポリペプチドをコードするヌクレオチド配列を含む核酸(例えば、組み換え発現ベクター)は、核酸が、例えば、インビボまたはエクスビボプロトコルを介して植物細胞(複数可)に侵入することができるような方法で植物に導入され得る。「インビボ」とは、核酸が植物の生体に投与されること、例えば、浸潤を意味する。「エクスビボ」とは、細胞または外植片は、植物の外側で修飾され、次いでそのような細胞または器官は、植物に再生されることを意味する。植物細胞の安定した形質転換または遺伝子導入植物の確立に適した複数のベクターが記載されており、Weissbach and Weissbach,(1989)Methods for Plant Molecular Biology Academic Press及びGelvin et al.,(1990)Plant Molecular Biology Manual,Kluwer Academic Publishersに記載されるものが挙げられる。特定の例には、アグロバクテリウム・ツメファシエンスのTiプラスミドに由来するもの、ならびにHerrera−Estrella et al.(1983)Nature 303:209,Bevan(1984)Nucl Acid Res.12:8711−8721,Klee(1985)Bio/Technolo 3:637−642によって開示されるものが挙げられる。あるいは、非Tiベクターを使用して、遊離DNA送達技法を使用することによって、DNAを植物及び細胞に移行させることができる。これらの方法を使用することによって、小麦、米(Christou(1991)Bio/Technology 9:957−9及び4462)ならびにトウモロコシ(Gordon−Kamm(1990)Plant Cell 2:603−618)などの遺伝子導入植物が産生され得る。未熟な胚もまた、粒子ガンを使用することによる直接DNA送達技法のため(Weeks et al.(1993)Plant Physiol 102:1077−1084;Vasil(1993)Bio/Technolo 10:667−674、Wan and Lemeaux(1994)Plant Physiol 104:37−48、及びアグロバクテリウム媒介型DNA移行のため(Ishida et al.(1996)Nature Biotech 14:745−750)の単子葉植物の良好な標的組織であり得る。DNAを葉緑体に導入するための例示的な方法は、微粒子銃ボンバードメント、プロトプラストのポリエチレングリコール形質転換、及びマイクロインジェクションである(Danieli et al Nat.Biotechnol 16:345−348,1998、Staub et al Nat.Biotechnol 18:333−338,2000、O′Neill et al Plant J.3:729−738,1993、Knoblauch et al Nat.Biotechnol 17:906−909、米国特許第5,451,513号、同第5,545,817号、同第5,545,818号、及び同第5,576,198号、国際出願第WO95/16783号、及びBoynton et al.,Methods in Enzymology 217:510−536(1993)、Svab et al.,Proc.Natl.Acad.Sci.USA 90:913−917(1993)、ならびにMcBride et al.,Proc.Natl.Acad.Sci.USA 91:7301−7305(1994))。微粒子銃ボンバードメント、プロトプラストのポリエチレングリコール形質転換、及びマイクロインジェクションの方法に適した任意のベクターは、葉緑体形質転換のための標的ベクターとして好適である。任意の二本鎖DNAベクターは、特に導入の方法がアグロバクテリウムを利用しないときに、形質転換ベクターとして使用され得る。
遺伝子修飾され得る植物としては、穀物、飼料作物、果物、野菜、油料種子作物、ヤシ、森林、及びツル植物が挙げられる。修飾され得る植物の特定例としては、以下が挙げられる:トウモロコシ、バナナ、ピーナッツ、エンドウマメ、ヒマワリ、トマト、キャノーラ、タバコ、小麦、バーレー、オーツ麦、ジャガイモ、大豆、綿、カーネーション、ソルガム、ハウチワマメ、及び米。
本開示は、形質転換された植物細胞、組織、植物、及び形質転換された植物細胞を含有する産生物を提供する。対象の形質転換細胞、及び組織、及びそれを含む産生物の特徴は、ゲノムに統合された対象の核酸の存在、及び植物細胞による本開示のCasXポリペプチドまたはCasX融合ポリペプチドの産生である。本発明の組み換え植物細胞は、組み換え細胞の集合として、または組織、種子、全植物、幹、果実、葉、根、花、幹、塊茎、穀物、動物飼料、植物の分野等において有用である。
本開示のCasXポリペプチドまたはCasX融合ポリペプチドをコードするヌクレオチド配列は、未知のプロモーターの制御下にあり得るか(すなわち動作可能に連結される)(例えば、核酸が宿主細胞ゲノムにランダムに統合されるとき)、または既知のプロモーターの制御下にあり得る(すなわち、動作可能に連結される)。好適な既知のプロモーターは、任意の既知のプロモーターであり得、構成的に活性なプロモーター、誘導性プロモーター、空間的制約及び/または時間的制約のあるプロモーターなどが挙げられる。
古細菌CAS9ポリペプチド及びガイドRNA
発明者らは、古細菌におけるII型CRISPR/Cas遺伝子座を初めて発見した。古細菌細胞は、II型系ではなく、I型及び/またはIII型CRISPR/cas系のみを含み、Cas9は、II型CRISPR系の特徴的タンパク質であると以前は考えられていた。換言すれば、本開示の前に、当該技術分野は、古細菌に属する生物がCas9タンパク質を含まないことを教示した。古細菌Cas9タンパク質(もしくはそれをコードする核酸)(例えば、ARMAN−1 Cas9タンパク質、ARMAN−4 Cas9タンパク質、その変異形等)、及び/または古細菌Cas9ガイドRNA(二重もしくは単一ガイドRNAフォーマット)(もしくはそれをコードするDNA、例えば、1つ以上の発現ベクター)、及び/またはドナーテンプレートを含む、方法及び組成物が提供される。
ARMANという用語は、「古細菌リッチモンド・マイン好酸球性ナノ生物」と称される。例えば、Baker et.al.,Proc Natl Acad Sci USA.2010 May 11;107(19):8806−8811、Baker et.al.,Science.2006 Dec 22;314(5807):1933−5を参照されたい。ARMAN−1はまた、「Candidatus Micrarchaeum acidiphilum ARMAN−1」とも称され得るが、ARMAN−4はまた、「Candidatus Parvarchaeum acidiphilum ARMAN−4」とも称され得る。ARMAN−2及びARMAN−5もまた同定されており、「Candidatus Micrarchaeum acidiphilum ARMAN−2」と称され得るが、ARMAN−5は、「Candidatus Parvarchaeum acidiphilum ARMAN−5」と称され得る。このため、「Candidatus Micrarchaeum acidiphilum」という用語は、少なくともCandidatus Micrarchaeum acidiphilum ARMAN−1及びCandidatus Micrarchaeum acidiphilum ARMAN−2を包含する汎称であるが、「Candidatus Parvarchaeum acidiphilum」という用語は、少なくともCandidatus Parvarchaeum acidiphilum ARMAN−4及びCandidatus Parvarchaeum acidiphilum ARMAN−5を包含する汎称である。このため、古細菌Cas9タンパク質(もしくはそれをコードする核酸)(例えば、ARMAN−1 Cas9タンパク質、ARMAN−4 Cas9タンパク質、その変異形等)、及び/または古細菌Cas9ガイドRNA(二重もしくは単一ガイドRNAフォーマット)(もしくはそれをコードするDNA、例えば、1つ以上の発現ベクター)、及び/またはドナーテンプレートを含む、方法及び組成物が提供される。
本明細書に記載される実施形態のうちのいずれかにおいて(例えば、すべての記載される組成物及び方法、例えば、核酸、結合方法、撮像方法、修飾方法、ゲノム編集等を含む)、CasXタンパク質の代わりに、古細菌Cas9タンパク質(例えば、ARMAN−1 Cas9タンパク質、ARMAN−4 Cas9タンパク質等)を使用することができる。換言すれば、古細菌Cas9タンパク質(例えば、ARMAN−1 Cas9タンパク質、ARMAN−4 Cas9タンパク質等)は、CasXタンパク質の代わりになり得る。そのような場合において、必要に応じて、対応するガイドRNA(古細菌Cas9ガイドRNA、例えば、二重または単一ガイドフォーマットのいずれか)が、CasXガイドRNAの代わりに使用されるべきである。古細菌Cas9タンパク質及び古細菌Cas9ガイドRNAの例は、図13(ARMAN−1及びARMAN−4 Cas9タンパク質)、図14(ARMAN−1 Cas9ガイドRNA)、及び図15(ARMAN−4 Cas9ガイドRNA)において例示されている。ガイドRNAの残りに対する(例えば、標的化因子の二重鎖形成セグメントに対する)古細菌Cas9ガイドRNAのガイド配列の配向は、CasXガイドRNAの反対であるが(例えば、CasXガイドRNAの場合、ガイド配列が3′末端にある図6及び図7のNを、古細菌Cas9ガイドRNAの場合、ガイド配列が5′末端にある図14及び図15のNと比較する)、標的dsDNA上のPAMの位置もまた、CasXタンパク質と比較して古細菌Cas9タンパク質の反対であることに留意されたい(さらなる詳細については以下を参照)。
古細菌Cas9タンパク質
非古細菌Cas9タンパク質(すなわち、古細菌由来ではなく、細菌由来のCas9タンパク質)は、当該技術分野において既知であり、対象の古細菌Cas9タンパク質は、同様のドメイン構造を有する。しかしながら、古細菌Cas9タンパク質の全体配列は、非常に多様であり、極わずかな全体配列相同性を共有する。
天然に存在する古細菌Cas9タンパク質は、標的二本鎖DNA(dsDNA)中の特定の配列において二本鎖切断を触媒するエンドヌクレアーゼとして機能する。配列特異性は、標的DNA内の標的配列にハイブリダイズする、関連ガイドRNAによって提供される。天然に存在するガイドRNAは、crRNAにハイブリダイズされたtracrRNAを含み、crRNAは、標的DNA中の標的配列にハイブリダイズするガイド配列を含む。
いくつかの実施形態では、対象の方法及び/または組成物の古細菌Cas9タンパク質は、天然に存在する(野生型)タンパク質である(またはそれに由来する)。天然に存在する古細菌Cas9タンパク質の例は、図13に示され、配列番号71及び72として記載されている。この新たに発見された古細菌Cas9タンパク質(例えば、図13を参照)は、以前に同定されたCRISPR−Casエンドヌクレアーゼと比較して短く(例えば、それらは最小として知られるCas9タンパク質である)、またこのため、代替としての古細菌Cas9タンパク質の使用が、タンパク質をコードするヌクレオチド配列が比較的短いという利点を提供することに留意することが重要である。これは、例えば、CasXタンパク質をコードする核酸が望ましい場合、例えば、研究及び/または臨床用途のために真核細胞(例えば、哺乳動物細胞、ヒト細胞、マウス細胞、インビトロ、エクスビボ、インビボ)などの細胞に送達するために、ウイルスベクター(例えば、AAVベクター)を用いる状況において有用である。
非古細菌Cas9タンパク質であるが、系統樹上で古細菌Cas9とクラスタ化し、したがって古細菌Cas9に対する配列において関連する2つの追加のCas9タンパク質(図16を参照)が、発明者らによって同定された(例えば、図16のデルタプロテオバクテリアCas9は、図12、パネルDの系統樹においてRBG_Proteobacteria|RBG_16_Deltaproteobacteria_42_7_curated|991aaとして現れるが、図16のLindowbacteria Cas9は、図12、パネルDの系統樹においてRIF2_CPR|RIFCSPLOWO2_12_FULL_Lindowbacteria_62_27_curated|RIF2|1044aaとして現れる)。ARMAN−1 Cas9及びARMAN−4 Cas9に対する図16の配列のアラインメントは、図17に提供される。
ある場合には、対象のCas9タンパク質(例えば、古細菌Cas9タンパク質)は、配列番号71(ARMAN−1)として記載されるアミノ酸配列と50%以上の配列同一性(例えば、60%以上、70%以上、80%以上、90%以上、95%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、対象のCas9タンパク質(例えば、古細菌Cas9タンパク質)は、配列番号71(ARMAN−1)として記載されるアミノ酸配列と70%以上の配列同一性(例えば、80%以上、90%以上、95%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、対象のCas9タンパク質(例えば、古細菌Cas9タンパク質)は、配列番号71(ARMAN−1)として記載されるアミノ酸配列と80%以上の配列同一性(例えば、90%以上、95%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、対象のCas9タンパク質(例えば、古細菌Cas9タンパク質)は、配列番号71(ARMAN−1)として記載されるアミノ酸配列と95%以上の配列同一性(例えば、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、対象のCas9タンパク質(例えば、古細菌Cas9タンパク質)は、配列番号71として記載されるアミノ酸配列を含む。ある場合には、対象のCas9タンパク質(例えば、古細菌Cas9タンパク質)は、Candidatus Micrarchaeum acidiphilum Cas9タンパク質である。ある場合には、対象のCas9タンパク質(例えば、古細菌Cas9タンパク質)は、ARMAN−1 Cas9タンパク質である。
ある場合には、対象のCas9タンパク質(例えば、古細菌Cas9タンパク質)は、配列番号72(ARMAN−4)として記載されるアミノ酸配列と50%以上の配列同一性(例えば、60%以上、70%以上、80%以上、90%以上、95%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、対象のCas9タンパク質(例えば、古細菌Cas9タンパク質)は、配列番号72(ARMAN−4)として記載されるアミノ酸配列と70%以上の配列同一性(例えば、80%以上、90%以上、95%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、対象のCas9タンパク質(例えば、古細菌Cas9タンパク質)は、配列番号72(ARMAN−4)として記載されるアミノ酸配列と80%以上の配列同一性(例えば、90%以上、95%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、対象のCas9タンパク質(例えば、古細菌Cas9タンパク質)は、配列番号72(ARMAN−4)として記載されるアミノ酸配列と95%以上の配列同一性(例えば、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、対象のCas9タンパク質(例えば、古細菌Cas9タンパク質)は、配列番号72として記載されるアミノ酸配列を含む。ある場合には、対象のCas9タンパク質(例えば、古細菌Cas9タンパク質)は、Candidatus Parvarchaeum acidiphilum Cas9タンパク質である。ある場合には、対象のCas9タンパク質(例えば、古細菌Cas9タンパク質)は、ARMAN−4 Cas9タンパク質である。
ある場合には、対象のCas9タンパク質(例えば、古細菌Cas9タンパク質)は、配列番号71及び72(それぞれARMAN−1及びARMAN−4)のうちのいずれか1つに記載されるアミノ酸配列と50%以上の配列同一性(例えば、60%以上、70%以上、80%以上、90%以上、95%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、対象のCas9タンパク質(例えば、古細菌Cas9タンパク質)は、配列番号71及び72(それぞれARMAN−1及びARMAN−4)のうちのいずれか1つに記載されるアミノ酸配列と70%以上の配列同一性(例えば、80%以上、90%以上、95%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、対象のCas9タンパク質(例えば、古細菌Cas9タンパク質)は、配列番号71及び72(それぞれARMAN−1及びARMAN−4)のうちのいずれか1つに記載されるアミノ酸配列と80%以上の配列同一性(例えば、90%以上、95%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、対象のCas9タンパク質(例えば、古細菌Cas9タンパク質)は、配列番号71及び72(それぞれARMAN−1及びARMAN−4)のうちのいずれか1つに記載されるアミノ酸配列と95%以上の配列同一性(例えば、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、対象のCas9タンパク質(例えば、古細菌Cas9タンパク質)は、配列番号71及び72のうちのいずれか1つに記載されるアミノ酸配列を含む。ある場合には、対象のCas9タンパク質(例えば、古細菌Cas9タンパク質)は、Candidatus Micrarchaeum acidiphilum Cas9タンパク質(例えば、ARMAN−1 Cas9タンパク質)またはCandidatus Parvarchaeum acidiphilum Cas9タンパク質(例えば、ARMAN−4 Cas9タンパク質)である。
ある場合には、対象のCas9タンパク質は、配列番号135として記載されるアミノ酸配列と50%以上の配列同一性(例えば、60%以上、70%以上、80%以上、90%以上、95%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、対象のCas9タンパク質は、配列番号135として記載されるアミノ酸配列と70%以上の配列同一性(例えば、80%以上、90%以上、95%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、対象のCas9タンパク質は、配列番号135として記載されるアミノ酸配列と80%以上の配列同一性(例えば、90%以上、95%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、対象のCas9タンパク質は、配列番号135として記載されるアミノ酸配列と95%以上の配列同一性(例えば、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、対象のCas9タンパク質は、配列番号135として記載されるアミノ酸配列を含む。
ある場合には、対象のCas9タンパク質は、配列番号136として記載されるアミノ酸配列と50%以上の配列同一性(例えば、60%以上、70%以上、80%以上、90%以上、95%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、対象のCas9タンパク質は、配列番号136として記載されるアミノ酸配列と70%以上の配列同一性(例えば、80%以上、90%以上、95%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、対象のCas9タンパク質は、配列番号136として記載されるアミノ酸配列と80%以上の配列同一性(例えば、90%以上、95%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、対象のCas9タンパク質は、配列番号136として記載されるアミノ酸配列と95%以上の配列同一性(例えば、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、対象のCas9タンパク質は、配列番号136として記載されるアミノ酸配列を含む。
ある場合には、対象のCas9タンパク質は、配列番号135及び136のうちのいずれか1つに記載されるアミノ酸配列と50%以上の配列同一性(例えば、60%以上、70%以上、80%以上、90%以上、95%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、対象のCas9タンパク質は、配列番号135及び136のうちのいずれか1つに記載されるアミノ酸配列と70%以上の配列同一性(例えば、80%以上、90%以上、95%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、対象のCas9タンパク質は、配列番号135及び136のうちのいずれか1つに記載されるアミノ酸配列と80%以上の配列同一性(例えば、90%以上、95%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、対象のCas9タンパク質は、配列番号135及び136のうちのいずれか1つに記載されるアミノ酸配列と95%以上の配列同一性(例えば、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、対象のCas9タンパク質は、配列番号135及び136のうちのいずれか1つに記載されるアミノ酸配列を含む。
ある場合には、対象のCas9タンパク質は、配列番号71、72、135、及び136のうちのいずれか1つに記載されるアミノ酸配列と50%以上の配列同一性(例えば、60%以上、70%以上、80%以上、90%以上、95%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、対象のCas9タンパク質は、配列番号71、72、135、及び136のうちのいずれか1つに記載されるアミノ酸配列と70%以上の配列同一性(例えば、80%以上、90%以上、95%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、対象のCas9タンパク質は、配列番号71、72、135、及び136のうちのいずれか1つに記載されるアミノ酸配列と80%以上の配列同一性(例えば、90%以上、95%以上、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、対象のCas9タンパク質は、配列番号71、72、135、及び136のうちのいずれか1つに記載されるアミノ酸配列と95%以上の配列同一性(例えば、98%以上、99%以上、または100%の配列同一性)を有するアミノ酸配列を含む。ある場合には、対象のCas9タンパク質は、配列番号71、72、135、及び136のうちのいずれか1つに記載されるアミノ酸配列を含む。
変異形(ニッカーゼ、dCas9、及びキメラCas9タンパク質)
使用され得る変異形の学名及び使用等(例えば、CasXタンパク質の古細菌Cas9タンパク質におけるスワップ、CasXタンパク質の新たに同定された2つの非古細菌Cas9タンパク質のうちのいずれかにおけるスワップ等)については、CasXタンパク質の変異形に関するセクションを参照されたい。例えば、上記の同一性%パラメータ、ARMAN−1 Cas9タンパク質、ARMAN−4 Cas9タンパク質、Candidatus Micrarchaeum acidiphilum Cas9タンパク質、Candidatus Parvarchaeum acidiphilum Cas9タンパク質を含む、対象のCas9タンパク質(例えば、古細菌Cas9タンパク質)についての上記パラメータのうちのいずれかは、スワップされ得る。
Cas9タンパク質(例えば、古細菌Cas9タンパク質)の触媒残基は、非古細菌Cas9タンパク質との極めて低い全体配列同一性にもかかわらず、容易に同定可能である。例えば、配列番号71(ARMAN−1)として記載される古細菌Cas9のD30(RuvCドメイン)及びH506(HNHドメイン)は、それぞれ化膿性連鎖球菌Cas9のD10及びH840に対応するが、配列番号72(ARMAN−4)として記載される古細菌Cas9のD58(RuvCドメイン)及びH514(HNHドメイン)は、それぞれ化膿性連鎖球菌Cas9のD10及びH840に対応する。これらの残基は、図13において太字にされ、下線が引かれている。
Cas9ニッカーゼ(例えば、古細菌Cas9ニッカーゼ)は、RuvCドメイン(例えば、ARMAN−1 Cas9のD30、ARMAN−4 Cas9タンパク質のD58を突然変異させることによって)またはHNHドメイン(例えば、ARMAN−1 Cas9のH506、ARMAN−4 Cas9タンパク質のH514を突然変異させることによって)のいずれかの触媒能を除去することによって(例えば、触媒残基を突然変異させることによって)生成され得る(例えば、各ドメインは、標的二本鎖DNAの一方の鎖を切断する)。不活性バージョンのCas9タンパク質(例えば、古細菌Cas9タンパク質)(例えば、dCas9、古細菌dCas9)は、RuvCドメイン及びHNHドメイン両方の触媒能を除去することによって(例えば、触媒残基を突然変異させることによって)生成され得る。
古細菌Cas9(または新たに同定された非古細菌Cas9のうちの1つ)がCasXの場合にスワップされ得ることを除いて、同じ融合タンパク質のすべてを使用することができる。非限定例としては、NLS(複数可)を有する古細菌Cas9またはdCas9またはニッカーゼCas9、触媒能及び/または転写抑制もしくは活性化能を有する古細菌Cas9またはdCas9またはニッカーゼCas9(例えば、標的DNAを修飾するため、標的DNAに会合したヒストンなどのタンパク質を修飾するため、標的DNAからの転写を変調するため等)、検出可能な標識を有する古細菌Cas9またはdCas9またはニッカーゼCas9等が挙げられる。古細菌Cas9に対して使用され得る融合パートナーの一覧は、CasXタンパク質に対して使用され得る一覧と同じである(本明細書においてさらに詳述される)。
古細菌Cas9タンパク質のプロトスペーサー隣接モチーフ(PAM)
古細菌Cas9タンパク質のPAMは、標的DNAの非相補鎖の標的配列の3′の直近である(相補鎖は、ガイドRNAのガイド配列にハイブリダイズするが、非相補鎖は、ガイドRNAと直接ハイブリダイズせず、非相補鎖の逆相補体である)。このため、古細菌Cas9タンパク質のPAMは、CasXタンパク質のPAMと比較して標的配列の反対側にある(例えば、CasXタンパク質のPAMの5′配向を示す、図6のパネルC、及び図7を参照)。いくつかの実施形態では(例えば、本明細書に記載される古細菌Cas9タンパク質が使用される場合)、非相補鎖のPAM配列は、5′−NGG−3′であり、Nは、任意のDNAヌクレオチドである。
ある場合には、異なる古細菌Cas9タンパク質(すなわち、様々な種に由来する古細菌Cas9タンパク質)は、異なる古細菌Cas9タンパク質の様々な酵素的特徴を利用するために(例えば、異なるPAM配列優先性のため、増加または減少した酵素活性のため、増加または減少したレベルの細胞毒性のため、NHEJ、ホモロジー配向型修復、一本鎖切断、二本鎖切断等の間の均衡を変化させるため、短い全配列を利用するため等)、様々な提供される方法における使用に有利であり得る。異なる種に由来する古細菌Cas9タンパク質は、標的DNA中に異なるPAM配列を好み得る。このため、一般に好まれる特定の古細菌Cas9タンパク質の場合、PAM配列優先性は、上記の5′−NGG−3′配列とは異なり得る。適切なPAM配列の同定のための様々な方法(インシリコ及び/またはウェットラボ法を含む)は、当該技術分野において既知であり、ルーチンであり、任意の簡便な方法が使用され得る。本明細書に記載されるNGG PAM配列は、インシリコ配列分析技法を使用して同定された(例えば、下記実施例の図12、パネルBを参照)。
古細菌Cas9ガイドRNA
非古細菌Cas9ガイドRNA(すなわち、古細菌由来ではなく、細菌由来のCas9ガイドRNA)は、当該技術分野において既知であり、対象の古細菌Cas9ガイドRNAは、非古細菌Cas9ガイドRNAと同様のドメイン構造を有する。古細菌Cas9ガイドRNAの場合、ガイド配列は、標的化因子RNAの二重鎖形成セグメントの5′に位置するが、CasXガイドRNAでは二重鎖形成セグメントの3′に位置することに留意されたい(例えば、例示的な古細菌Cas9ガイドRNAを示す図14及び図15を、例示的なCasXガイドRNAを示す図6のパネルC及び図7と比較する)。
ある場合には、古細菌Cas9ガイドRNA(dgRNAまたはsgRNA)の活性化因子(例えば、tracr配列)は、(i)タンパク質結合セグメントのdsRNA二重鎖に寄与する二重鎖形成セグメント、及び(ii)二重鎖形成セグメントのヌクレオチド3′のストレッチ(例えば、本明細書では3′テールと称される)を含む。ある場合には、二重鎖形成セグメントの追加のヌクレオチド3′は、1つ以上のステムループ(例えば、2つ以上、3つ以上、1、2、または3)を形成する。ある場合には、古細菌Cas9ガイドRNA(dgRNAまたはsgRNA)の活性化因子(例えば、tracr配列)は、(i)タンパク質結合セグメントのdsRNA二重鎖に寄与する二重鎖形成セグメント、及び(ii)二重鎖形成セグメントのヌクレオチドの5つ以上のヌクレオチド(例えば、6以上、7以上、8以上、9以上、10以上、11以上、12以上、13以上、14以上、15以上、20以上、25以上、30以上、35以上、40以上、45以上、50以上、60以上、70以上、または75以上のヌクレオチド)3′を含む。ある場合には、古細菌Cas9ガイドRNA(dgRNAまたはsgRNA)の活性化因子(例えば、活性化因子RNA)は、(i)タンパク質結合セグメントのdsRNA二重鎖に寄与する二重鎖形成セグメント、及び(ii)二重鎖形成セグメントのヌクレオチドの5つ以上のヌクレオチド(例えば、6以上、7以上、8以上、9以上、10以上、11以上、12以上、13以上、14以上、15以上、20以上、25以上、30以上、35以上、40以上、45以上、50以上、60以上、70以上、または75以上のヌクレオチド)3′を含む。
ある場合には、古細菌Cas9ガイドRNA(dgRNAまたはsgRNA)の活性化因子(例えば、tracr配列)は、(i)タンパク質結合セグメントのdsRNA二重鎖に寄与する二重鎖形成セグメント、及び(ii)二重鎖形成セグメントのヌクレオチド3′のストレッチ(例えば、本明細書では3′テールと称される)を含む。ある場合には、二重鎖形成セグメントのヌクレオチド3′のストレッチは、5〜200ヌクレオチド(nt)(例えば、5〜150nt、5〜130nt、5〜120nt、5〜100nt、5〜80nt、10〜200nt、10〜150nt、10〜130nt、10〜120nt、10〜100nt、10〜80nt、12〜200nt、12〜150nt、12〜130nt、12〜120nt、12〜100nt、12〜80nt、15〜200nt、15〜150nt、15〜130nt、15〜120nt、15〜100nt、15〜80nt、20〜200nt、20〜150nt、20〜130nt、20〜120nt、20〜100nt、20〜80nt、30〜200nt、30〜150nt、30〜130nt、30〜120nt、30〜100nt、または30〜80nt)の範囲の長さを有する。ある場合には、活性化因子RNAの3′テールのヌクレオチドは、野生型配列である。
複数の異なる代替配列が使用され得るが、例示的な古細菌Cas9ガイドRNA配列は、配列番号75〜76(例示的なcrRNA配列−ガイド配列)、77〜78(例示的なtracrRNA配列)、及び81〜82(例示的な単一ガイドRNA配列−ガイド配列)を含み得る。
ある場合には、活性化因子と標的化因子との間に形成されたdsRNA二重鎖領域(すなわち、活性化因子/標的化因子dsRNA二重鎖)は(例えば、二重または単一ガイドRNAフォーマットで)、8〜25塩基対(bp)の範囲(例えば、8〜22、8〜18、8〜15、8〜12、12〜25、12〜22、12〜18、12〜15、13〜25、13〜22、13〜18、13〜15、14〜25、14〜22、14〜18、14〜15、15〜25、15〜22、15〜18、17〜25、17〜22、または17〜18bp、例えば、15bp、16bp、17bp、18bp、19bp、20bp、21bp等)を含む。ある場合には、二重鎖領域は(例えば、二重または単一ガイドRNAフォーマットで)、8以上のbp(例えば、10以上、12以上、15以上、または17以上のbp)を含む。ある場合には、二重鎖領域のすべてのヌクレオチドが対合されるとは限らないため、二重鎖形成領域は、バルジを含み得る(例えば、図6、パネルC及び図7を参照)。本明細書における「バルジ」という用語は、二本鎖二重鎖に寄与しないが、寄与するヌクレオチドによって5′及び3′が囲まれているヌクレオチド(1つのヌクレオチドであり得る)のストレッチを意味するように使用され、そのようなものとしてバルジは、二重鎖領域の一部とみなされる。ある場合には、活性化因子と標的化因子との間に形成されたdsRNA二重鎖(すなわち、活性化因子/標的化因子dsRNA二重鎖)は、1つ以上のバルジ(例えば、2つ以上、3つ以上、4つ以上のバルジ)を含む。ある場合には、活性化因子と標的化因子との間に形成されたdsRNA二重鎖(すなわち、活性化因子/標的化因子dsRNA二重鎖)は、2つ以上のバルジ(例えば、3つ以上、4つ以上のバルジ)を含む。ある場合には、活性化因子と標的化因子との間に形成されたdsRNA二重鎖(すなわち、活性化因子/標的化因子dsRNA二重鎖)は、1〜5のバルジ(例えば、1〜4、1〜3、2〜5、2〜4、または2〜3のバルジ)を含む。
このため、ある場合には、活性化因子及び標的化因子の二重鎖形成セグメントは、互いに70%〜100%の相補性(例えば、75%〜100%、80%〜10%、85%〜100%、90%〜100%、95%〜100%の相補性)を有する。ある場合には、活性化因子及び標的化因子の二重鎖形成セグメントは、互いに70%〜100%の相補性(例えば、75%〜100%、80%〜10%、85%〜100%、90%〜100%、95%〜100%の相補性)を有する。ある場合には、活性化因子及び標的化因子の二重鎖形成セグメントは、互いに85%〜100%の相補性(例えば、90%〜100%、95%〜100%の相補性)を有する。ある場合には、活性化因子及び標的化因子の二重鎖形成セグメントは、互いに70%〜95%の相補性(例えば、75%〜95%、80%〜95%、85%〜95%、90%〜95%の相補性)を有する。
換言すれば、いくつかの実施形態では、活性化因子と標的化因子との間に形成されたdsRNA二重鎖(すなわち、活性化因子/標的化因子dsRNA二重鎖)は、互いに70%〜100%の相補性(例えば、75%〜100%、80%〜10%、85%〜100%、90%〜100%、95%〜100%の相補性)を有するヌクレオチドの2つのストレッチを含む。ある場合には、活性化因子/標的化因子dsRNA二重鎖は、互いに85%〜100%の相補性(例えば、90%〜100%、95%〜100%の相補性)を有するヌクレオチドの2つのストレッチを含む。ある場合には、活性化因子/標的化因子dsRNA二重鎖は、互いに70%〜95%の相補性(例えば、75%〜95%、80%〜95%、85%〜95%、90%〜95%の相補性)を有するヌクレオチドの2つのストレッチを含む。
対象の古細菌Cas9ガイドRNAの二重鎖領域は(二重ガイドまたは単一ガイドRNAフォーマットで)、天然に存在する二重鎖領域に対して1つ以上(1、2、3、4、5等)の突然変異を含み得る。例えば、ある場合には、塩基対は維持され得るが、各セグメント(標的化因子及び活性化因子)からの塩基対に寄与するヌクレオチドは異なり得る。ある場合には、対象の古細菌Cas9ガイドRNAの二重鎖領域は、(天然に存在する古細菌Cas9ガイドRNAの)天然に存在する二重鎖領域比較して、より多くの対合塩基、より少ない対合塩基、より小さいバルジ、より大きいバルジ、より少ないバルジ、より多いバルジ、またはそれらの任意の簡便な組み合わせを含む。
古細菌Cas9ガイドRNAの例示的な配列
ある場合には、標的化因子−RNAは(例えば、二重または単一ガイドRNAフォーマットで)、crRNA配列CUUACAAUCGACACUUAAAUAAUUUGCAUGUGUAAG(配列番号75)を含む(例えば、図6、パネルCのsgRNAを参照)。ある場合には、標的化因子−RNAは(例えば、二重または単一ガイドRNAフォーマットで)、crRNA配列CUUACAAUCGACACUUAAAUAAUUUGCAUGUGUAAG(配列番号75)と80%以上の同一性(例えば、85%以上、90%以上、93%以上、95%以上、97%以上、98%以上、または100%の同一性)を有するヌクレオチド配列を含む。ある場合には、標的化因子−RNAは(例えば、二重または単一ガイドRNAフォーマットで)、crRNA配列CUUACAAUCGACACUUAAAUAAUUUGCAUGUGUAAG(配列番号75)を含む。
ある場合には、標的化因子−RNAは、crRNA配列CUUUCAAUAAACAAAUAAAUCUUAGUAAUAUGUAAC(配列番号76)を含む。ある場合には、標的化因子−RNAは、crRNA配列CUUUCAAUAAACAAAUAAAUCUUAGUAAUAUGUAAC(配列番号76)と80%以上の同一性(例えば、85%以上、90%以上、93%以上、95%以上、97%以上、98%以上、または100%の同一性)を有するヌクレオチド配列を含む。ある場合には、標的化因子−RNAは(例えば、二重または単一ガイドRNAフォーマットで)、crRNA配列CUUUCAAUAAACAAAUAAAUCUUAGUAAUAUGUAAC(配列番号76)を含む。
ある場合には、標的化因子−RNAは、配列番号75〜76のうちのいずれか1つに記載されるcrRNA配列を含む。ある場合には、標的化因子−RNAは、配列番号75〜76のうちのいずれか1つに記載されるcrRNA配列と80%以上の同一性(例えば、85%以上、90%以上、93%以上、95%以上、97%以上、98%以上、または100%の同一性)を有するヌクレオチド配列を含む。
ある場合には、活性化因子−RNAは(例えば、二重または単一ガイドRNAフォーマットで)、tracrRNA配列GGCAUGGACCAUAUCCAGGUGUUGAUUGUAAACACCUAGCGGGGAAAUUAUAUAUGUUUGUAAUAUCUUCACUAUCCAAAGUUAUCUCUGGUUUUGGUUUGGUAAGCUUCACUUCACUAUUGUUUUCACUCCCAAUUUGAGUAUGGUUGGGGGUAAGGAUGCUUUCGGGGAGUGCUUUUA(配列番号77)を含む。ある場合には、標的化因子−RNAは(例えば、二重または単一ガイドRNAフォーマットで)、tracrRNA配列GGCAUGGACCAUAUCCAGGUGUUGAUUGUAAACACCUAGCGGGGAAAUUAUAUAUGUUUGUAAUAUCUUCACUAUCCAAAGUUAUCUCUGGUUUUGGUUUGGUAAGCUUCACUUCACUAUUGUUUUCACUCCCAAUUUGAGUAUGGUUGGGGGUAAGGAUGCUUUCGGGGAGUGCUUUUA(配列番号77)と80%以上の同一性(例えば、85%以上、90%以上、93%以上、95%以上、97%以上、98%以上、99%以上、または100%の同一性)を有するヌクレオチド配列を含む。
ある場合には、活性化因子−RNAは(例えば、二重または単一ガイドRNAフォーマットで)、tracrRNA配列AACUGGCUAUUGCUAAUAUUAUUUGUUUAUUGAAAGAAGCCUAGACGUUAGGGUUCGCGUGCAUGUAGGCUCCAGCAGGUACCUC(配列番号78)を含む。ある場合には、標的化因子−RNAは(例えば、二重または単一ガイドRNAフォーマットで)、tracrRNA配列AACUGGCUAUUGCUAAUAUUAUUUGUUUAUUGAAAGAAGCCUAGACGUUAGGGUUCGCGUGCAUGUAGGCUCCAGCAGGUACCUC(配列番号78)と80%以上の同一性(例えば、85%以上、90%以上、93%以上、95%以上、97%以上、98%以上、99%以上、または100%の同一性)を有するヌクレオチド配列を含む。
ある場合には、活性化因子−RNAは(例えば、二重または単一ガイドRNAフォーマットで)、配列番号77〜78のうちのいずれか1つに記載されるtracrRNA配列を含む。ある場合には、標的化因子−RNAは(例えば、二重または単一ガイドRNAフォーマットで)、配列番号77〜78のうちのいずれか1つに記載されるtracrRNA配列と80%以上の同一性(例えば、85%以上、90%以上、93%以上、95%以上、97%以上、98%以上、または100%の同一性)を有するヌクレオチド配列を含む。
ある場合には、古細菌Cas9単一ガイドRNAは、配列CUUACAAUCGACACUUaaacAGGUGUUGAUUGUAAACACCUAGCGGGGAAAUUAUAUAUGUUUGUAAUAUCUUCACUAUCCAAAGUUAUCUCUGGUUUUGGUUUGGUAAGCUUCACUUCACUAUUGUUUUCACUCCCAAUUUGAGUAUGGUUGGGGGUAAGGAUGCUUUCGGGGAGUGCUUUUA(配列番号81)を含む。ある場合には、標的化因子−RNAは、tracrRNA配列CUUACAAUCGACACUUaaacAGGUGUUGAUUGUAAACACCUAGCGGGGAAAUUAUAUAUGUUUGUAAUAUCUUCACUAUCCAAAGUUAUCUCUGGUUUUGGUUUGGUAAGCUUCACUUCACUAUUGUUUUCACUCCCAAUUUGAGUAUGGUUGGGGGUAAGGAUGCUUUCGGGGAGUGCUUUUA(配列番号81)と80%以上の同一性(例えば、85%以上、90%以上、93%以上、95%以上、97%以上、98%以上、99%以上、または100%の同一性)を有するヌクレオチド配列を含む。
ある場合には、古細菌Cas9単一ガイドRNAは、配列CUUUCAAUAAACAAAUAAaaacUUAUUUGUUUAUUGAAAGAAGCCUAGACGUUAGGGUUCGCGUGCAUGUAGGCUCCAGCAGGUACCUC(配列番号82)を含む。ある場合には、標的化因子−RNAは、tracrRNA配列CUUUCAAUAAACAAAUAAaaacUUAUUUGUUUAUUGAAAGAAGCCUAGACGUUAGGGUUCGCGUGCAUGUAGGCUCCAGCAGGUACCUC(配列番号82)と80%以上の同一性(例えば、85%以上、90%以上、93%以上、95%以上、97%以上、98%以上、99%以上、または100%の同一性)を有するヌクレオチド配列を含む。
ある場合には、古細菌Cas9単一ガイドRNAは、配列番号81〜82のうちのいずれか1つに記載される配列を含む。ある場合には、標的化因子−RNAは、配列番号81〜82のうちのいずれか1つに記載されるtracrRNA配列と80%以上の同一性(例えば、85%以上、90%以上、93%以上、95%以上、97%以上、98%以上、99%以上、または100%の同一性)を有するヌクレオチド配列を含む。
古細菌Cas9ガイドRNAのガイド配列
ある場合には、ガイド配列と標的核酸の標的部位との間の相補性のパーセントは、17以上(例えば、18以上、19以上、20以上、21以上、22以上)の連続するヌクレオチドにわたって60%以上(例えば、70%以上、75%以上、80%以上、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%)である。ある場合には、ガイド配列と標的核酸の標的部位との間の相補性のパーセントは、17以上(例えば、18以上、19以上、20以上、21以上、22以上)の連続するヌクレオチドにわたって80%以上(例えば、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%)である。ある場合には、ガイド配列と標的核酸の標的部位との間の相補性のパーセントは、17以上(例えば、18以上、19以上、20以上、21以上、22以上)の連続するヌクレオチドにわたって90%以上(例えば、95%以上、97%以上、98%以上、99%以上、または100%)である。ある場合には、ガイド配列と標的核酸の標的部位との間の相補性のパーセントは、17以上(例えば、18以上、19以上、20以上、21以上、22以上)の連続するヌクレオチドにわたって100%である。
ある場合には、ガイド配列と標的核酸の標的部位との間の相補性のパーセントは、17〜25の連続するヌクレオチドにわたって60%以上(例えば、70%以上、75%以上、80%以上、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%)である。ある場合には、ガイド配列と標的核酸の標的部位との間の相補性のパーセントは、17〜25の連続するヌクレオチドにわたって80%以上(例えば、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、または100%)である。ある場合には、ガイド配列と標的核酸の標的部位との間の相補性のパーセントは、17〜25の連続するヌクレオチドにわたって90%以上(例えば、95%以上、97%以上、98%以上、99%以上、または100%)である。ある場合には、ガイド配列と標的核酸の標的部位との間の相補性のパーセントは、17〜25の連続するヌクレオチドにわたって100%である。
ある場合には、ガイド配列は、17〜30ヌクレオチド(nt)(例えば、17〜25、17〜22、17〜20、19〜30、19〜25、19〜22、19〜20、20〜30、20〜25、または20〜22nt)の範囲の長さを有する。ある場合には、ガイド配列は、17〜25ヌクレオチド(nt)(例えば、17〜22、17〜20、19〜25、19〜22、19〜20、20〜25、20〜25、または20〜22nt)の範囲の長さを有する。ある場合には、ガイド配列は、17以上のnt(例えば、18以上、19以上、20以上、21以上、または22以上のnt;17nt、18nt、19nt、20nt、21nt、22nt、23nt、24nt、25nt等)の長さを有する。ある場合には、ガイド配列は、17ntの長さを有する。ある場合には、ガイド配列は、18ntの長さを有する。ある場合には、ガイド配列は、19ntの長さを有する。ある場合には、ガイド配列は、20ntの長さを有する。ある場合には、ガイド配列は、21ntの長さを有する。ある場合には、ガイド配列は、22ntの長さを有する。ある場合には、ガイド配列は、23ntの長さを有する。
様々なCasタンパク質及びCas9ガイドRNAの例は(たとえ非古細菌Cas9タンパク質及びガイドRNAであっても)、当該技術分野において見出すことができ、ある場合には、非古細菌Cas9タンパク質及びガイドRNAに導入されたものと同様の異形もまた、例えば、高忠実度バージョンのCas9を含む本開示のCas9ガイドRNAに導入され得る。例えば、高忠実度のCas9を生成するために、以前に知られているCas9タンパク質に導入され得る突然変異はまた、同じまたは同様の目的のために古細菌Cas9タンパク質に導入され得る(例えば、配列及び/または構造アラインメントを行って、対象の古細菌Cas9タンパク質、例えば、古細菌Cas9タンパク質ではない化膿性連鎖球菌Cas9タンパク質のアミノ酸N497、R661、Q695、及びQ926において突然変異する適切なアミノ酸を決定することができる(例えば、Kleinstiver et al.(2016)Nature 529:490を参照されたい)。例えば、Jinek et al.,Science.2012 Aug 17;337(6096):816−21、Chylinski et al.,RNA Biol.2013 May;10(5):726−37、Ma et al.,Biomed Res Int.2013;2013:270805、Hou et al.,Proc Natl Acad Sci USA.2013 Sep 24;110(39):15644−9、Jinek et al.,Elife.2013;2:e00471、Pattanayak et al.,Nat Biotechnol.2013 Sep;31(9):839−43、Qi et al,Cell.2013 Feb 28;152(5):1173−83、Wang et al.,Cell.2013 May 9;153(4):910−8、Auer et.al.,Genome Res.2013 Oct 31、Chen et.al.,Nucleic Acids Res.2013 Nov 1;41(20):e19、Cheng et.al.,Cell Res.2013 Oct;23(10):1163−71、Cho et.al.,Genetics.2013 Nov;195(3):1177−80、DiCarlo et al.,Nucleic Acids Res.2013 Apr;41(7):4336−43、Dickinson et.al.,Nat Methods.2013 Oct;10(10):1028−34、Ebina et.al.,Sci Rep.2013;3:2510、Fujii et.al,Nucleic Acids Res.2013 Nov 1;41(20):e187、Hu et.al.,Cell Res.2013 Nov;23(11):1322−5、Jiang et.al.,Nucleic Acids Res.2013 Nov 1;41(20):e188、Larson et.al.,Nat Protoc.2013 Nov;8(11):2180−96、Mali et.at.,Nat Methods.2013 Oct;10(10):957−63、Nakayama et.al.,Genesis.2013 Dec;51(12):835−43、Ran et.al.,Nat Protoc.2013 Nov;8(11):2281−308、Ran et.al.,Cell.2013 Sep 12;154(6):1380−9、Upadhyay et.al.,G3(Bethesda).2013 Dec 9;3(12):2233−8、Walsh et.al.,Proc Natl Acad Sci USA.2013 Sep 24;110(39):15514−5、Xie et.al.,Mol Plant.2013 Oct 9、Yang et.al.,Cell.2013 Sep 12;154(6):1370−9、Briner et al.,Mol Cell.2014 Oct 23;56(2):333−9、ならびに米国特許及び特許出願第8,906,616号、第8,895,308号、第8,889,418号、第8,889,356号、第8,871,445号、第8,865,406号、第8,795,965号、第8,771,945号、第8,697,359号、第20140068797号、第20140170753号、第20140179006号、第20140179770号、第20140186843号、第20140186919号、第20140186958号、第20140189896号、第20140227787号、第20140234972号、第20140242664号、第20140242699号、第20140242700号、第20140242702号、第20140248702号、第20140256046号、第20140273037号、第20140273226号、第20140273230号、第20140273231号、第20140273232号、第20140273233号、第20140273234号、第20140273235号、第20140287938号、第20140295556号、第20140295557号、第20140298547号、第20140304853号、第20140309487号、第20140310828号、第20140310830号、第20140315985号、第20140335063号、第20140335620号、第20140342456号、第20140342457号、第20140342458号、第20140349400号、第20140349405号、第20140356867号、第20140356956号、第20140356958号、第20140356959号、第20140357523号、第20140357530号、第20140364333号、及び第20140377868号を参照されたい。これらのすべては参照によりそれらの全体が本明細書に組み込まれる。
本開示の非限定的態様の例
上に記載される本主題の実施形態を含む態様は、単独で、または1つ以上の他の態様もしくは実施形態との組み合わせで有益であり得る。上記の説明を制限することなく、1〜131の番号が付けられた(CasXに関連するセットA)及び1〜133の番号が付けられた(古細菌Cas9に関連するセットB)本開示のある特定の非限定的な態様が、以下に提供される。本開示を読むと当業者には明らかであるように、個々の番号が付けられた態様のそれぞれは、先行または後続の個々の番号が付けられた態様のうちのいずれかと共に使用され得るか、または組み合わされ得る。これは、態様のすべてのそのような組み合わせに対する支持を提供することが意図され、以下に明示的に提供される態様の組み合わせに制限されない。
セットA
CasX関連
1.組成物であって、
a)CasXポリペプチド、または前記CasXポリペプチドをコードする核酸分子と、
b)CasXガイドRNA、または前記CasXガイドRNAをコードする1つ以上のDNA分子と
を含む、組成物。
2.前記CasXポリペプチドが、配列番号1または配列番号2または配列番号3に記載されるアミノ酸配列に対して50%以上の同一性を有するアミノ酸配列を含む、1に記載の組成物。
3.前記CasXガイドRNAが、単一ガイドRNAである、1または2に記載の組成物。
4.前記CasXガイドRNAが、二重ガイドRNAである、1または2に記載の組成物。
5.前記組成物が、脂質を含む、1〜4のいずれか1項に記載の組成物。
6.a)及びb)が、リポソーム内にある、1〜4のいずれか1項に記載の組成物。
7.a)及びb)が、粒子内にある、1〜4のいずれか1項に記載の組成物。
8.緩衝剤、ヌクレアーゼ阻害剤、及びプロテアーゼ阻害剤のうちの1つ以上を含む、1〜7のいずれか1項に記載の組成物。
9.前記CasXポリペプチドが、配列番号1または配列番号2または配列番号3に記載されるアミノ酸配列に対して85%以上の同一性を有するアミノ酸配列を含む、1〜8のいずれか1項に記載の組成物。
10.前記CasXポリペプチドが、二本鎖標的核酸分子の一方の鎖のみを切断することができるニッカーゼである、1〜9のいずれか1項に記載の組成物。
11.前記CasXポリペプチドが、触媒能がないCasXポリペプチド(dCasX)である、1〜9のいずれか1項に記載の組成物。
12.前記CasXポリペプチドが、配列番号1のD672、E769、及びD935から選択されるものに対応する位置に1つ以上の突然変異を含む、10または11に記載の組成物。
13.DNAドナーテンプレートをさらに含む、1〜12のいずれか1項に記載の組成物。
14.CasX単一ガイドRNA分子であって、
a)標的核酸にハイブリダイズするガイド配列、及び二重鎖形成セグメントを含む標的化因子配列と、
b)標的化因子配列の二重鎖形成セグメントとハイブリダイズしてCasXポリペプチドに結合し得る二本鎖RNA(dsRNA)二本鎖を形成する活性化因子と
を含む、CasX単一ガイドRNA分子。
15.前記ガイド配列が、19〜30ヌクレオチドの長さを有する、14に記載のCasX単一ガイドRNA分子。
16.14または15に記載のCasX単一ガイドRNA分子をコードするヌクレオチド配列を含む、DNA分子。
17.前記CasX単一ガイドRNAをコードするヌクレオチド配列が、プロモーターに動作可能に連結されている、16に記載のDNA分子。
18.前記プロモーターが、真核細胞中で機能的である、17に記載のDNA分子。
19.前記プロモーターが、植物細胞、真菌細胞、動物細胞、無脊椎動物の細胞、ハエ細胞、脊椎動物の細胞、哺乳動物細胞、霊長類細胞、非ヒト霊長類細胞、及びヒト細胞のうちの1つ以上において機能的である、18に記載のDNA分子。
20.前記プロモーターが、構成的プロモーター、誘導性プロモーター、細胞型特異的プロモーター、及び組織特異的プロモーターのうちの1つ以上である、17〜19のいずれか1項に記載のDNA分子。
21.前記DNA分子が、組み換え発現ベクターである、16〜20のいずれか1項に記載のDNA分子。
22.前記組み換え発現ベクターが、組み換えアデノ関連ウイルスベクター、組み換えレトロウイルスベクター、または組み換えレンチウイルスベクターである、21に記載のDNA分子。
23.前記プロモーターが、原核細胞中で機能的である、17に記載のDNA分子。
24.異種ポリペプチドに融合されたCasXポリペプチドを含む、CasX融合ポリペプチド。
25.前記CasXポリペプチドが、配列番号1または配列番号2または配列番号3に記載されるアミノ酸配列に対して50%以上の同一性を有するアミノ酸配列を含む、24に記載のCasX融合ポリペプチド。
26.前記CasXポリペプチドが、配列番号1または配列番号2または配列番号3に記載されるアミノ酸配列に対して85%以上の同一性を有するアミノ酸配列を含む、24に記載のCasX融合ポリペプチド。
27.前記CasXポリペプチドが、二本鎖標的核酸分子の一方の鎖のみを切断することができるニッカーゼである、24〜27のいずれか1項に記載のCasX融合ポリペプチド。
28.前記CasXポリペプチドが、触媒能がないCasXポリペプチド(dCasX)である、24〜27のいずれか1項に記載のCasX融合ポリペプチド。
29.前記CasXポリペプチドが、配列番号1のD672、E769、及びD935から選択されるものに対応する位置に1つ以上の突然変異を含む、27または28に記載のCasX融合ポリペプチド。
30.前記異種ポリペプチドが、CasXポリペプチドのN末端及び/またはC末端に融合される、24〜29のいずれか1項に記載のCasX融合ポリペプチド。
31.NLSを含む、24〜30のいずれか1項に記載のCasX融合ポリペプチド。
32.前記異種ポリペプチドが、標的細胞または標的細胞型上の細胞表面部分への結合をもたらす標的ポリペプチドである、24〜31のいずれか1項に記載のCasX融合ポリペプチド。
33.前記異種ポリペプチドが、標的DNAを修飾する酵素活性を呈する、24〜31のいずれか1項に記載のCasX融合ポリペプチド。
34.前記異種ポリペプチドが、ヌクレアーゼ活性、メチルトランスフェラーゼ活性、デメチラーゼ活性、DNA修復活性、DNA損傷活性、脱アミノ化活性、ジスムターゼ活性、アルキル化活性、脱プリン化活性、酸化活性、ピリミジン二量体形成活性、インテグラーゼ活性、トランスポザーゼ活性、リコンビナーゼ活性、ポリメラーゼ活性、リガーゼ活性、ヘリカーゼ活性、フォトリアーゼ活性、及びグリコシラーゼ活性から選択される1つ以上の酵素活性を呈する、33に記載のCasX融合ポリペプチド。
35.前記異種ポリペプチドが、ヌクレアーゼ活性、メチルトランスフェラーゼ活性、デメチラーゼ活性、脱アミノ化活性、脱プリン化活性、インテグラーゼ活性、トランスポザーゼ活性、及びリコンビナーゼ活性から選択される1つ以上の酵素活性を呈する、34に記載のCasX融合ポリペプチド。
36.前記異種ポリペプチドが、標的核酸に関連した標的ポリペプチドを修飾する酵素活性を呈する、24〜31のいずれか1項に記載のCasX融合ポリペプチド。
37.前記異種ポリペプチドが、ヒストン修飾活性を呈する、36に記載のCasX融合ポリペプチド。
38.前記異種ポリペプチドが、メチルトランスフェラーゼ活性、デメチラーゼ活性、アセチルトランスフェラーゼ活性、デアセチラーゼ活性、キナーゼ活性、ホスファターゼ活性、ユビキチンリガーゼ活性、脱ユビキチン化活性、アデニル化活性、脱アデニル化活性、SUMO化活性、脱SUMO化活性、リボシル化活性、脱リボシル化活性、ミリストイル化活性、脱ミリストイル化活性、グリコシル化活性(例えば、O−GlcNAcトランスフェラーゼからの)、及び脱グリコシル化活性から選択される1つ以上の酵素活性を呈する、36または37に記載のCasX融合ポリペプチド。
39.前記異種ポリペプチドが、メチルトランスフェラーゼ活性、デメチラーゼ活性、アセチルトランスフェラーゼ活性、及びデアセチラーゼ活性から選択される1つ以上の酵素活性を呈する、38に記載のCasX融合ポリペプチド。
40.前記異種ポリペプチドが、エンドソーム脱出ポリペプチドである、24〜31のいずれか1項に記載のCasX融合ポリペプチド。
41.前記エンドソーム脱出ポリペプチドが、GLFXALLXLLXSLWXLLLXA(配列番号94)及びGLFHALLHLLHSLWHLLLHA(配列番号95)から選択されるアミノ酸配列を含み、各Xが、独立して、リジン、ヒスチジン、及びアルギニンから選択される、40に記載のCasX融合ポリペプチド。
42.前記異種ポリペプチドが、葉緑体移行ペプチドである、24〜31のいずれか1項に記載のCasX融合ポリペプチド。
43.前記葉緑体移行ペプチドが、MASMISSSAVTTVSRASRGQSAAMAPFGGLKSMTGFPVRKVNTDITSITSNGGRVKCMQVWPPIGKKKFETLSYLPPLTRDSRA(配列番号83)、MASMISSSAVTTVSRASRGQSAAMAPFGGLKSMTGFPVRKVNTDITSITSNGGRVKS(配列番号84)、MASSMLSSATMVASPAQATMVAPFNGLKSSAAFPATRKANNDITSITSNGGRVNCMQVWPPIEKKKFETLSYLPDLTDSGGRVNC(配列番号85)、MAQVSRICNGVQNPSLISNLSKSSQRKSPLSVSLKTQQHPRAYPISSSWGLKKSGMTLIGSELRPLKVMSSVSTAC(配列番号86)、MAQVSRICNGVWNPSLISNLSKSSQRKSPLSVSLKTQQHPRAYPISSSWGLKKSGMTLIGSELRPLKVMSSVSTAC(配列番号87)、MAQINNMAQGIQTLNPNSNFHKPQVPKSSSFLVFGSKKLKNSANSMLVLKKDSIFMQLFCSFRISASVATAC(配列番号88)、MAALVTSQLATSGTVLSVTDRFRRPGFQGLRPRNPADAALGMRTVGASAAPKQSRKPHRFDRRCLSMVV(配列番号89)、MAALTTSQLATSATGFGIADRSAPSSLLRHGFQGLKPRSPAGGDATSLSVTTSARATPKQQRSVQRGSRRFPSVVVC(配列番号90)、MASSVLSSAAVATRSNVAQANMVAPFTGLKSAASFPVSRKQNLDITSIASNGGRVQC(配列番号91)、MESLAATSVFAPSRVAVPAARALVRAGTVVPTRRTSSTSGTSGVKCSAAVTPQASPVISRSAAAA(配列番号92)、及びMGAAATSMQSLKFSNRLVPPSRRLSPVPNNVTCNNLPKSAAPVRTVKCCASSWNSTINGAAATTNGASAASS(配列番号93)から選択されるアミノ酸配列を含む、42に記載のCasX融合ポリペプチド。
44.前記異種ポリペプチドが、転写を増加または減少させるタンパク質である、24〜31のいずれか1項に記載のCasX融合ポリペプチド。
45.前記異種ポリペプチドが、転写抑制因子ドメインである、44に記載のCasX融合ポリペプチド。
46.前記異種ポリペプチドが、転写活性化ドメインである、44に記載のCasX融合ポリペプチド。
47.前記異種ポリペプチドが、タンパク質結合ドメインである、24〜31のいずれか1項に記載のCasX融合ポリペプチド。
48.24〜47のいずれか1項に記載のCasX融合ポリペプチドをコードする、核酸分子。
49.前記CasX融合ポリペプチドをコードするヌクレオチド配列が、プロモーターに動作可能に連結されている、48に記載の核酸分子。
50.前記プロモーターが、真核細胞中で機能的である、49に記載の核酸分子。
51.前記プロモーターが、植物細胞、真菌細胞、動物細胞、無脊椎動物の細胞、ハエ細胞、脊椎動物の細胞、哺乳動物細胞、霊長類細胞、非ヒト霊長類細胞、及びヒト細胞のうちの1つ以上において機能的である、50に記載の核酸分子。
52.前記プロモーターが、構成的プロモーター、誘導性プロモーター、細胞型特異的プロモーター、及び組織特異的プロモーターのうちの1つ以上である、49〜51のいずれか1項に記載の核酸分子。
53.前記DNA分子が、組み換え発現ベクターである、48〜52のいずれか1項に記載の核酸分子。
54.前記組み換え発現ベクターが、組み換えアデノ関連ウイルスベクター、組み換えレトロウイルスベクター、または組み換えレンチウイルスベクターである、53に記載の核酸分子。
55.前記プロモーターが、原核細胞中で機能的である、49に記載の核酸分子。
56.前記核酸分子が、mRNAである、48に記載の核酸分子。
57.1つ以上の核酸分子であって、
(a)活性化因子RNA及び標的化因子RNAを含むCasXガイドRNAと、
(b)CasXポリペプチドと
を含む、1つ以上の核酸分子。
58.前記CasXポリペプチドが、配列番号1または配列番号2または配列番号3に記載されるアミノ酸配列に対して50%以上の同一性を有するアミノ酸配列を含む、57に記載の1つ以上の核酸分子。
59.前記CasXポリペプチドが、配列番号1または配列番号2または配列番号3に記載されるアミノ酸配列に対して85%以上の同一性を有するアミノ酸配列を含む、57に記載の1つ以上の核酸分子。
60.前記CasXガイドRNAが、単一ガイドRNAである、57〜59のいずれか1項に記載の1つ以上の核酸分子。
61.前記CasXガイドRNAが、二重ガイドRNAである、57〜59のいずれか1項に記載の1つ以上の核酸分子。
62.前記1つ以上の核酸分子が、活性化因子をコードする第1のヌクレオチド配列と、標的化因子をコードする第2のヌクレオチド配列とを含み、前記第1及び第2のヌクレオチド配列が、異なるDNA分子上に存在する、61に記載の1つ以上の核酸分子。
63.前記1つ以上の核酸分子が、プロモーターに動作可能に連結されたCasXポリペプチドをコードするヌクレオチド配列を含む、57〜62のいずれか1項に記載の1つ以上の核酸分子。
64.前記プロモーターが、真核細胞中で機能的である、63に記載の1つ以上の核酸分子。
65.前記プロモーターが、植物細胞、真菌細胞、動物細胞、無脊椎動物の細胞、ハエ細胞、脊椎動物の細胞、哺乳動物細胞、霊長類細胞、非ヒト霊長類細胞、及びヒト細胞のうちの1つ以上において機能的である、64に記載の1つ以上の核酸分子。
66.前記プロモーターが、構成的プロモーター、誘導性プロモーター、細胞型特異的プロモーター、及び組織特異的プロモーターのうちの1つ以上である、63〜65のいずれか1項に記載の1つ以上の核酸分子。
67.前記1つ以上の核酸分子が、1つ以上の組み換え発現ベクターである、57〜66のいずれか1項に記載の1つ以上の核酸分子。
68.前記1つ以上の組み換え発現ベクターが、1つ以上の組み換えアデノ関連ウイルスベクター、1つ以上の組み換えレトロウイルスベクター、または1つ以上の組み換えレンチウイルスベクターから選択される、67に記載の1つ以上の核酸分子。
69.前記プロモーターが、原核細胞中で機能的である、63に記載の1つ以上の核酸分子。
70.真核細胞であって、
a)Casxポリペプチド、またはCasxポリペプチドをコードする核酸分子、
b)CasX融合ポリペプチド、またはCasX融合ポリペプチドをコードする核酸分子、及び
c)CasXガイドRNA、またはCasXガイドRNAをコードする核酸分子のうちの1つ以上を含む、真核細胞。
71.前記CasXポリペプチドをコードする核酸分子を含み、前記核酸分子が、細胞のゲノムDNAに統合されている、70に記載の真核細胞。
72.前記真核細胞が、植物細胞、哺乳動物細胞、昆虫細胞、クモ形網動物細胞、真菌細胞、鳥類細胞、爬虫類細胞、両生類細胞、無脊椎動物細胞、マウス細胞、ラット細胞、霊長類細胞、非ヒト霊長類細胞、またはヒト細胞である、70または71に記載の真核細胞。
73.CasX融合ポリペプチド、またはCasX融合ポリペプチドをコードする核酸分子を含む、細胞。
74.前記細胞が、原核細胞である、73に記載の細胞。
75.前記CasX融合ポリペプチドをコードする核酸分子を含み、前記核酸分子が、細胞のゲノムDNAに統合されている、73または74に記載の細胞。
76.標的核酸を修飾する方法であって、
標的核酸を、
a)CasXポリペプチド、及び
b)前記標的核酸の標的配列にハイブリダイズするガイド配列を含むCasXガイドRNAと接触させることを含み、
前述の接触させることが、CasXポリペプチドによる標的核酸の修飾をもたらす、方法。
77.前記修飾が、標的核酸の切断である、76に記載の方法。
78.前記標的核酸が、二本鎖DNA、一本鎖DNA、RNA、ゲノムDNA、及び染色体外DNAから選択される、76または77に記載の方法。
79.前述の接触させることが、細胞の外側でインビトロで行われる、76〜78のいずれか1項に記載の方法。
80.前述の接触させることが、培養中の細胞の内側で行われる、76〜78のいずれか1項に記載の方法。
81.前述の接触させることが、細胞の内側でインビボで行われる、76〜78のいずれか1項に記載の方法。
82.前記細胞が、真核細胞である、80または81に記載の方法。
83.前記細胞が、植物細胞、真菌細胞、哺乳動物細胞、爬虫類細胞、昆虫細胞、鳥類細胞、魚類細胞、寄生虫細胞、節足動物細胞、無脊椎動物の細胞、脊椎動物の細胞、齧歯類細胞、マウス細胞、ラット細胞、霊長類細胞、非ヒト霊長類細胞、及びヒト細胞である、82に記載の方法。
84.前記細胞が、原核細胞である、80または81に記載の方法。
85.前述の接触させることが、ゲノム編集をもたらす、76〜84のいずれか1項に記載の方法。
86.前述の接触させることが、細胞中に、(a)CasXポリペプチド、またはCasXポリペプチドをコードする核酸分子、及び(b)CasxガイドRNA、またはCasXガイドRNAをコードする核酸分子を導入することを含む、76〜85のいずれか1項に記載の方法。
87.前述の接触させることが、細胞中にDNAドナーテンプレートを導入することをさらに含む、86に記載の方法。
88.前記CasXガイドRNAが、単一ガイドRNAである、76〜87のいずれか1項に記載の方法。
89.前記CasXガイドRNAが、二重ガイドRNAである、76〜87のいずれか1項に記載の方法。
90.標的DNAからの転写を変調するか、標的核酸を修飾するか、または標的核酸に関連したタンパク質を修飾する方法であって、
標的核酸を、
a)異種ポリペプチドに融合されたCasXポリペプチドを含む、CasX融合ポリペプチド、及び
b)標的核酸の標的配列にハイブリダイズするガイド配列を含むCasXガイドRNAと接触させることを含む、方法。
91.前記CasXガイドRNAが、単一ガイドRNAである、90に記載の方法。
92.前記CasXガイドRNAが、二重ガイドRNAである、90に記載の方法。
93.前記修飾が、標的核酸の切断ではない、90〜92のいずれか1項に記載の方法。
94.前記標的核酸が、二本鎖DNA、一本鎖DNA、RNA、ゲノムDNA、及び染色体外DNAから選択される、90〜93のいずれか1項に記載の方法。
95.前述の接触させることが、細胞の外側でインビトロで行われる、90〜94のいずれか1項に記載の方法。
96.前述の接触させることが、培養中の細胞の内側で行われる、90〜94のいずれか1項に記載の方法。
97.前述の接触させることが、細胞の内側でインビボで行われる、90〜94のいずれか1項に記載の方法。
98.前記細胞が、真核細胞である、96または97に記載の方法。
99.前記細胞が、植物細胞、真菌細胞、哺乳動物細胞、爬虫類細胞、昆虫細胞、鳥類細胞、魚類細胞、寄生虫細胞、節足動物細胞、無脊椎動物の細胞、脊椎動物の細胞、齧歯類細胞、マウス細胞、ラット細胞、霊長類細胞、非ヒト霊長類細胞、及びヒト細胞である、98に記載の方法。
100.前記細胞が、原核細胞である、96または97に記載の方法。
101.前述の接触させることが、細胞中に、(a)CasX融合ポリペプチド、またはCasX融合ポリペプチドをコードする核酸分子、及び(b)CasxガイドRNA、またはCasXガイドRNAをコードする核酸分子を導入することを含む、90〜100のいずれか1項に記載の方法。
102.前記CasXポリペプチドが、触媒能がないCasXポリペプチド(dCasX)である、90〜101のいずれか1項に記載の方法。
103.前記CasXポリペプチドが、配列番号1のD672、E769、及びD935から選択されるものに対応する位置に1つ以上の突然変異を含む、90〜102のいずれか1項に記載の方法。
104.前記異種ポリペプチドが、標的DNAを修飾する酵素活性を呈する、90〜103のいずれか1項に記載の方法。
105.前記異種ポリペプチドが、ヌクレアーゼ活性、メチルトランスフェラーゼ活性、デメチラーゼ活性、DNA修復活性、DNA損傷活性、脱アミノ化活性、ジスムターゼ活性、アルキル化活性、脱プリン化活性、酸化活性、ピリミジン二量体形成活性、インテグラーゼ活性、トランスポザーゼ活性、リコンビナーゼ活性、ポリメラーゼ活性、リガーゼ活性、ヘリカーゼ活性、フォトリアーゼ活性、及びグリコシラーゼ活性から選択される1つ以上の酵素活性を呈する、104に記載の方法。
106.異種ポリペプチドが、ヌクレアーゼ活性、メチルトランスフェラーゼ活性、デメチラーゼ活性、脱アミノ化活性、脱プリン化活性、インテグラーゼ活性、トランスポザーゼ活性、及びリコンビナーゼ活性から選択される1つ以上の酵素活性を呈する、105に記載の方法。
107.前記異種ポリペプチドが、標的核酸に関連した標的ポリペプチドを修飾する酵素活性を呈する、90〜103のいずれか1項に記載の方法。
108.前記異種ポリペプチドが、ヒストン修飾活性を呈する、107に記載の方法。
109.前記異種ポリペプチドが、メチルトランスフェラーゼ活性、デメチラーゼ活性、アセチルトランスフェラーゼ活性、デアセチラーゼ活性、キナーゼ活性、ホスファターゼ活性、ユビキチンリガーゼ活性、脱ユビキチン化活性、アデニル化活性、脱アデニル化活性、SUMO化活性、脱SUMO化活性、リボシル化活性、脱リボシル化活性、ミリストイル化活性、脱ミリストイル化活性、グリコシル化活性(例えば、O−GlcNAcトランスフェラーゼからの)、及び脱グリコシル化活性から選択される1つ以上の酵素活性を呈する、107または108に記載の方法。
110.前記異種ポリペプチドが、メチルトランスフェラーゼ活性、デメチラーゼ活性、アセチルトランスフェラーゼ活性、及びデアセチラーゼ活性から選択される1つ以上の酵素活性を呈する、109に記載の方法。
111.前記異種ポリペプチドが、転写を増加または減少させるタンパク質である、90〜103のいずれか1項に記載の方法。
112.前記異種ポリペプチドが、転写抑制因子ドメインである、111に記載の方法。
113.前記異種ポリペプチドが、転写活性化ドメインである、111に記載の方法。
114.前記異種ポリペプチドが、タンパク質結合ドメインである、90〜103のいずれか1項に記載の方法。
115.遺伝子導入の多細胞非ヒト生物であって、それらのゲノムが、
a)Casxポリペプチド、
b)CasX融合ポリペプチド、及び
c)CasXガイドRNAのうちの1つ以上をコードするヌクレオチド配列を含む導入遺伝子を含む、遺伝子導入の多細胞非ヒト生物。
116.前記CasXポリペプチドが、配列番号1または配列番号2または配列番号3に記載されるアミノ酸配列に対して50%以上のアミノ酸配列同一性を有するアミノ酸配列を含む、115に記載の遺伝子導入の多細胞非ヒト生物。
117.前記CasXポリペプチドが、配列番号1または配列番号2または配列番号3に記載されるアミノ酸配列に対して85%以上のアミノ酸配列同一性を有するアミノ酸配列を含む、115に記載の遺伝子導入の多細胞非ヒト生物。
118.前記生物が、植物、単子葉植物、双子葉植物、無脊椎動物、昆虫、節足動物、クモ形網動物、寄生虫、蠕虫、脊椎動物、魚、爬虫類、両生類、有蹄類、鳥、ブタ、ウマ、ヒツジ、齧歯類、マウス、ラット、または非ヒト霊長類である、115〜117のいずれか1項に記載の遺伝子導入の多細胞非ヒト生物。
119.系であって、
a)CasXポリペプチド及びCasX単一ガイドRNAと、
b)CasXポリペプチド、CasXガイドRNA、及びDNAドナーテンプレートと、
c)CasX融合ポリペプチド及びCasXガイドRNAと、
d)CasX融合ポリペプチド、CasXガイドRNA、及びDNAドナーテンプレートと、
e)CasXポリペプチドをコードするmRNA、及びCasX単一ガイドRNAと、
f)CasXポリペプチドをコードするmRNA、CasXガイドRNA、及びDNAドナーテンプレートと、
g)CasX融合ポリペプチドをコードするmRNA、及びCasXガイドRNAと、
h)CasX融合ポリペプチドをコードするmRNA、CasXガイドRNA、及びDNAドナーテンプレートと、
i)i)CasXポリペプチドをコードするヌクレオチド配列、及びii)CasXガイドRNAをコードするヌクレオチド配列を含む、1つ以上の組み換え発現ベクターと、
j)i)CasXポリペプチドをコードするヌクレオチド配列、ii)CasXガイドRNAをコードするヌクレオチド配列、及びiii)DNAドナーテンプレートを含む、1つ以上の組み換え発現ベクターと、
k)i)CasX融合ポリペプチドをコードするヌクレオチド配列、及びii)CasXガイドRNAをコードするヌクレオチド配列を含む、1つ以上の組み換え発現ベクターと、
l)i)CasX融合ポリペプチドをコードするヌクレオチド配列、ii)CasXガイドRNAをコードするヌクレオチド配列、及びDNAドナーテンプレートを含む、1つ以上の組み換え発現ベクターと
を含む、系。
120.前記CasXポリペプチドが、配列番号1または配列番号2または配列番号3に記載されるアミノ酸配列に対して50%以上のアミノ酸配列同一性を有するアミノ酸配列を含む、119に記載のCasX系。
121.前記CasXポリペプチドが、配列番号1または配列番号2または配列番号3に記載されるアミノ酸配列に対して85%以上のアミノ酸配列同一性を有するアミノ酸配列を含む、119に記載のCasX系。
122.前記ドナーテンプレート核酸が、8ヌクレオチド〜1000ヌクレオチドの長さを有する、119〜121のいずれか1項に記載のCasX系。
123.前記ドナーテンプレート核酸が、25ヌクレオチド〜500ヌクレオチドの長さを有する、119〜121のいずれか1項に記載のCasX系。
124.119〜123のいずれか1項に記載のCasX系を含む、キット。
125.前記キットの構成要素が、同じ容器内にある、124に記載のキット。
126.前記キットの構成要素が、別個の容器内にある、124に記載のキット。
127.119〜126のいずれか1項に記載のCasX系を含む、無菌容器。
128.前記容器が、シリンジである、127に記載の無菌容器。
129.119〜126のいずれか1項に記載のCasX系を含む、埋め込み可能なデバイス。
130.前記CasX系が、マトリックス内にある、129に記載の埋め込み可能なデバイス。
131.前記CasX系が、貯蔵器内にある、129に記載の埋め込み可能なデバイス。
セットB
古細菌Cas9関連
1.組成物であって、
a)古細菌Cas9ポリペプチド、または古細菌Cas9ポリペプチドをコードする核酸分子と、
b)古細菌Cas9ガイドRNA、または古細菌Cas9ガイドRNAをコードする1つ以上のDNA分子と
を含む、組成物。
2.前記古細菌Cas9ポリペプチドが、配列番号71または配列番号72に記載されるアミノ酸配列に対して50%以上の同一性を有するアミノ酸配列を含む、1に記載の組成物。
3.前記古細菌Cas9ガイドRNAが、単一ガイドRNAである、1または2に記載の組成物。
4.前記古細菌Cas9ガイドRNAが、二重ガイドRNAである、1または2に記載の組成物。
5.前記組成物が、脂質を含む、1〜4のいずれか1項に記載の組成物。
6.a)及びb)が、リポソーム内にある、1〜4のいずれか1項に記載の組成物。
7.a)及びb)が、粒子内にある、1〜4のいずれか1項に記載の組成物。
8.緩衝剤、ヌクレアーゼ阻害剤、及びプロテアーゼ阻害剤のうちの1つ以上を含む、1〜7のいずれか1項に記載の組成物。
9.前記古細菌Cas9ポリペプチドが、配列番号71または配列番号72に記載されるアミノ酸配列に対して85%以上の同一性を有するアミノ酸配列を含む、1〜8のいずれか1項に記載の組成物。
10.前記古細菌Cas9ポリペプチドが、二本鎖標的核酸分子の一方の鎖のみを切断することができるニッカーゼである、1〜9のいずれか1項に記載の組成物。
11.前記古細菌Cas9ポリペプチドが、触媒能がない古細菌Cas9ポリペプチド(不活性型古細菌Cas9)である、1〜9のいずれか1項に記載の組成物。
12.前記古細菌Cas9ポリペプチドが、配列番号71のD672、E769、及びD935から選択されるものに対応する位置に1つ以上の突然変異を含む、10または11に記載の組成物。
13.DNAドナーテンプレートをさらに含む、1〜12のいずれか1項に記載の組成物。
14.古細菌Cas9単一ガイドRNA分子であって、
a)標的核酸にハイブリダイズするガイド配列、及び二重鎖形成セグメントを含む標的化因子配列と、
b)標的化因子配列の二重鎖形成セグメントとハイブリダイズして古細菌Cas9ポリペプチドに結合し得る二本鎖RNA(dsRNA)二重鎖を形成する活性化因子と
を含む、古細菌Cas9単一ガイドRNA分子。
15.前記ガイド配列が、19〜30ヌクレオチドの長さを有する、14に記載の古細菌Cas9単一ガイドRNA分子。
16.14または15に記載の古細菌Cas9単一ガイドRNA分子をコードするヌクレオチド配列を含む、DNA分子。
17.前記古細菌Cas9単一ガイドRNAをコードするヌクレオチド配列が、プロモーターに動作可能に連結されている、16に記載のDNA分子。
18.前記プロモーターが、真核細胞中で機能的である、17に記載のDNA分子。
19.前記プロモーターが、植物細胞、真菌細胞、動物細胞、無脊椎動物の細胞、ハエ細胞、脊椎動物の細胞、哺乳動物細胞、霊長類細胞、非ヒト霊長類細胞、及びヒト細胞のうちの1つ以上において機能的である、18に記載のDNA分子。
20.前記プロモーターが、構成的プロモーター、誘導性プロモーター、細胞型特異的プロモーター、及び組織特異的プロモーターのうちの1つ以上である、17〜19のいずれか1項に記載のDNA分子。
21.前記DNA分子が、組み換え発現ベクターである、16〜20のいずれか1項に記載のDNA分子。
22.前記組み換え発現ベクターが、組み換えアデノ関連ウイルスベクター、組み換えレトロウイルスベクター、または組み換えレンチウイルスベクターである、21に記載のDNA分子。
23.前記プロモーターが、原核細胞中で機能的である、17に記載のDNA分子。
24.異種ポリペプチドに融合された古細菌Cas9ポリペプチドを含む、古細菌Cas9融合ポリペプチド。
25.前記古細菌Cas9ポリペプチドが、配列番号71または配列番号72に記載されるアミノ酸配列に対して50%以上の同一性を有するアミノ酸配列を含む、24に記載の古細菌Cas9融合ポリペプチド。
26.前記古細菌Cas9ポリペプチドが、配列番号71または配列番号72に記載されるアミノ酸配列に対して85%以上の同一性を有するアミノ酸配列を含む、24に記載の古細菌Cas9融合ポリペプチド。
27.前記古細菌Cas9ポリペプチドが、二本鎖標的核酸分子の一方の鎖のみを切断することができるニッカーゼである、24〜27のいずれか1項に記載の古細菌Cas9融合ポリペプチド。
28.前記古細菌Cas9ポリペプチドが、触媒能がない古細菌Cas9ポリペプチド(不活性型古細菌Cas9)である、24〜27のいずれか1項に記載の古細菌Cas9融合ポリペプチド。
29.前記古細菌Cas9ポリペプチドが、配列番号71のD672、E769、及びD935から選択されるものに対応する位置に1つ以上の突然変異を含む、27または28に記載の古細菌Cas9融合ポリペプチド。
30.前記異種ポリペプチドが、古細菌Cas9ポリペプチドのN末端及び/またはC末端に融合される、24〜29のいずれか1項に記載の古細菌Cas9融合ポリペプチド。
31.NLSを含む、24〜30のいずれか1項に記載の古細菌Cas9融合ポリペプチド。
32.前記異種ポリペプチドが、標的細胞または標的細胞型上の細胞表面部分への結合をもたらす標的ポリペプチドである、24〜31のいずれか1項に記載の古細菌Cas9融合ポリペプチド。
33.前記異種ポリペプチドが、標的DNAを修飾する酵素活性を呈する、24〜31のいずれか1項に記載の古細菌Cas9融合ポリペプチド。
34.前記異種ポリペプチドが、ヌクレアーゼ活性、メチルトランスフェラーゼ活性、デメチラーゼ活性、DNA修復活性、DNA損傷活性、脱アミノ化活性、ジスムターゼ活性、アルキル化活性、脱プリン化活性、酸化活性、ピリミジン二量体形成活性、インテグラーゼ活性、トランスポザーゼ活性、リコンビナーゼ活性、ポリメラーゼ活性、リガーゼ活性、ヘリカーゼ活性、フォトリアーゼ活性、及びグリコシラーゼ活性から選択される1つ以上の酵素活性を呈する、33に記載の古細菌Cas9融合ポリペプチド。
35.前記異種ポリペプチドが、ヌクレアーゼ活性、メチルトランスフェラーゼ活性、デメチラーゼ活性、脱アミノ化活性、脱プリン化活性、インテグラーゼ活性、トランスポザーゼ活性、及びリコンビナーゼ活性から選択される1つ以上の酵素活性を呈する、34に記載の古細菌Cas9融合ポリペプチド。
36.前記異種ポリペプチドが、標的核酸に関連した標的ポリペプチドを修飾する酵素活性を呈する、24〜31のいずれか1項に記載の古細菌Cas9融合ポリペプチド。
37.前記異種ポリペプチドが、ヒストン修飾活性を呈する、36に記載の古細菌Cas9融合ポリペプチド。
38.前記異種ポリペプチドが、メチルトランスフェラーゼ活性、デメチラーゼ活性、アセチルトランスフェラーゼ活性、デアセチラーゼ活性、キナーゼ活性、ホスファターゼ活性、ユビキチンリガーゼ活性、脱ユビキチン化活性、アデニル化活性、脱アデニル化活性、SUMO化活性、脱SUMO化活性、リボシル化活性、脱リボシル化活性、ミリストイル化活性、脱ミリストイル化活性、グリコシル化活性(例えば、O−GlcNAcトランスフェラーゼからの)、及び脱グリコシル化活性から選択される1つ以上の酵素活性を呈する、36または37に記載の古細菌Cas9融合ポリペプチド。
39.前記異種ポリペプチドが、メチルトランスフェラーゼ活性、デメチラーゼ活性、アセチルトランスフェラーゼ活性、及びデアセチラーゼ活性から選択される1つ以上の酵素活性を呈する、38に記載の古細菌Cas9融合ポリペプチド。
40.前記異種ポリペプチドが、エンドソーム脱出ポリペプチドである、24〜31のいずれか1項に記載の古細菌Cas9融合ポリペプチド。
41.前記エンドソーム脱出ポリペプチドが、GLFXALLXLLXSLWXLLLXA(配列番号94)及びGLFHALLHLLHSLWHLLLHA(配列番号95)から選択されるアミノ酸配列を含み、各Xが、独立して、リジン、ヒスチジン、及びアルギニンから選択される、40に記載の古細菌Cas9融合ポリペプチド。
42.前記異種ポリペプチドが、葉緑体移行ペプチドである、24〜31のいずれか1項に記載の古細菌Cas9融合ポリペプチド。
43.前記葉緑体移行ペプチドが、MASMISSSAVTTVSRASRGQSAAMAPFGGLKSMTGFPVRKVNTDITSITSNGGRVKCMQVWPPIGKKKFETLSYLPPLTRDSRA(配列番号83)、MASMISSSAVTTVSRASRGQSAAMAPFGGLKSMTGFPVRKVNTDITSITSNGGRVKS(配列番号84)、MASSMLSSATMVASPAQATMVAPFNGLKSSAAFPATRKANNDITSITSNGGRVNCMQVWPPIEKKKFETLSYLPDLTDSGGRVNC(配列番号85)、MAQVSRICNGVQNPSLISNLSKSSQRKSPLSVSLKTQQHPRAYPISSSWGLKKSGMTLIGSELRPLKVMSSVSTAC(配列番号86)、MAQVSRICNGVWNPSLISNLSKSSQRKSPLSVSLKTQQHPRAYPISSSWGLKKSGMTLIGSELRPLKVMSSVSTAC(配列番号87)、MAQINNMAQGIQTLNPNSNFHKPQVPKSSSFLVFGSKKLKNSANSMLVLKKDSIFMQLFCSFRISASVATAC(配列番号88)、MAALVTSQLATSGTVLSVTDRFRRPGFQGLRPRNPADAALGMRTVGASAAPKQSRKPHRFDRRCLSMVV(配列番号89)、MAALTTSQLATSATGFGIADRSAPSSLLRHGFQGLKPRSPAGGDATSLSVTTSARATPKQQRSVQRGSRRFPSVVVC(配列番号90)、MASSVLSSAAVATRSNVAQANMVAPFTGLKSAASFPVSRKQNLDITSIASNGGRVQC(配列番号91)、MESLAATSVFAPSRVAVPAARALVRAGTVVPTRRTSSTSGTSGVKCSAAVTPQASPVISRSAAAA(配列番号92)、及びMGAAATSMQSLKFSNRLVPPSRRLSPVPNNVTCNNLPKSAAPVRTVKCCASSWNSTINGAAATTNGASAASS(配列番号93)から選択されるアミノ酸配列を含む、42に記載の古細菌Cas9融合ポリペプチド。
44.前記異種ポリペプチドが、転写を増加または減少させるタンパク質である、24〜31のいずれか1項に記載の古細菌Cas9融合ポリペプチド。
45.前記異種ポリペプチドが、転写抑制因子ドメインである、44に記載の古細菌Cas9融合ポリペプチド。
46.前記異種ポリペプチドが、転写活性化ドメインである、44に記載の古細菌Cas9融合ポリペプチド。
47.前記異種ポリペプチドが、タンパク質結合ドメインである、24〜31のいずれか1項に記載の古細菌Cas9融合ポリペプチド。
48.24〜47のいずれか1項に記載の古細菌Cas9融合ポリペプチドをコードする、核酸分子。
49.前記古細菌Cas9融合ポリペプチドをコードするヌクレオチド配列が、プロモーターに動作可能に連結されている、48に記載の核酸分子。
50.前記プロモーターが、真核細胞中で機能的である、49に記載の核酸分子。
51.前記プロモーターが、植物細胞、真菌細胞、動物細胞、無脊椎動物の細胞、ハエ細胞、脊椎動物の細胞、哺乳動物細胞、霊長類細胞、非ヒト霊長類細胞、及びヒト細胞のうちの1つ以上において機能的である、50に記載の核酸分子。
52.前記プロモーターが、構成的プロモーター、誘導性プロモーター、細胞型特異的プロモーター、及び組織特異的プロモーターのうちの1つ以上である、49〜51のいずれか1項に記載の核酸分子。
53.前記DNA分子が、組み換え発現ベクターである、48〜52のいずれか1項に記載の核酸分子。
54.前記組み換え発現ベクターが、組み換えアデノ関連ウイルスベクター、組み換えレトロウイルスベクター、または組み換えレンチウイルスベクターである、53に記載の核酸分子。
55.前記プロモーターが、原核細胞中で機能的である、49に記載の核酸分子。
56.核酸分子が、mRNAである、48に記載の核酸分子。
57.1つ以上の核酸分子であって、
(a)活性化因子RNA及び標的化因子RNAを含む古細菌Cas9ガイドRNA、及び
(b)古細菌Cas9ポリペプチドをコードする、1つ以上の核酸分子。
58.前記古細菌Cas9ポリペプチドが、配列番号71または配列番号72に記載されるアミノ酸配列に対して50%以上の同一性を有するアミノ酸配列を含む、57に記載の1つ以上の核酸分子。
59.前記古細菌Cas9ポリペプチドが、配列番号71または配列番号72に記載されるアミノ酸配列に対して85%以上の同一性を有するアミノ酸配列を含む、57に記載の1つ以上の核酸分子。
60.前記古細菌Cas9ガイドRNAが、単一ガイドRNAである、57〜59のいずれか1項に記載の1つ以上の核酸分子。
61.前記古細菌Cas9ガイドRNAが、二重ガイドRNAである、57〜59のいずれか1項に記載の1つ以上の核酸分子。
62.前記1つ以上の核酸分子が、活性化因子をコードする第1のヌクレオチド配列と、標的化因子をコードする第2のヌクレオチド配列とを含み、前記第1及び第2のヌクレオチド配列が、異なるDNA分子上に存在する、61に記載の1つ以上の核酸分子。
63.前記1つ以上の核酸分子が、プロモーターに動作可能に連結された古細菌Cas9ポリペプチドをコードするヌクレオチド配列を含む、57〜62のいずれか1項に記載の1つ以上の核酸分子。
64.前記プロモーターが、真核細胞中で機能的である、63に記載の1つ以上の核酸分子。
65.前記プロモーターが、植物細胞、真菌細胞、動物細胞、無脊椎動物の細胞、ハエ細胞、脊椎動物の細胞、哺乳動物細胞、霊長類細胞、非ヒト霊長類細胞、及びヒト細胞のうちの1つ以上において機能的である、64に記載の1つ以上の核酸分子。
66.前記プロモーターが、構成的プロモーター、誘導性プロモーター、細胞型特異的プロモーター、及び組織特異的プロモーターのうちの1つ以上である、63〜65のいずれか1項に記載の1つ以上の核酸分子。
67.前記1つ以上の核酸分子が、1つ以上の組み換え発現ベクターである、57〜66のいずれか1項に記載の1つ以上の核酸分子。
68.前記1つ以上の組み換え発現ベクターが、1つ以上の組み換えアデノ関連ウイルスベクター、1つ以上の組み換えレトロウイルスベクター、または1つ以上の組み換えレンチウイルスベクターから選択される、67に記載の1つ以上の核酸分子。
69.前記プロモーターが、原核細胞中で機能的である、63に記載の1つ以上の核酸分子。
70.真核細胞であって、
a)古細菌Cas9ポリペプチド、または古細菌Cas9ポリペプチドをコードする核酸分子、
b)古細菌Cas9融合ポリペプチド、または古細菌Cas9融合ポリペプチドをコードする核酸分子、及び
c)古細菌Cas9ガイドRNA、または古細菌Cas9ガイドRNAをコードする核酸分子のうちの1つ以上を含む、真核細胞。
71.前記古細菌Cas9ポリペプチドをコードする核酸分子を含み、前記核酸分子が、細胞のゲノムDNAに統合されている、70に記載の真核細胞。
72.前記真核細胞が、植物細胞、哺乳動物細胞、昆虫細胞、クモ形網動物細胞、真菌細胞、鳥類細胞、爬虫類細胞、両生類細胞、無脊椎動物細胞、マウス細胞、ラット細胞、霊長類細胞、非ヒト霊長類細胞、またはヒト細胞である、70または71に記載の真核細胞。
73.古細菌Cas9融合ポリペプチド、または古細菌Cas9融合ポリペプチドをコードする核酸分子を含む、細胞。
74.前記細胞が、原核細胞である、73に記載の細胞。
75.前記古細菌Cas9融合ポリペプチドをコードする核酸分子を含み、前記核酸分子が、細胞のゲノムDNAに統合されている、73または74に記載の細胞。
76.標的核酸を修飾する方法であって、標的核酸を、
a)古細菌Cas9ポリペプチド、及び
b)標的核酸の標的配列にハイブリダイズするガイド配列を含む古細菌Cas9ガイドRNAと接触させることを含み、
前述の接触させることが、古細菌Cas9ポリペプチドによる標的核酸の修飾をもたらす、方法。
77.前記修飾が、標的核酸の切断である、76に記載の方法。
78.前記標的核酸が、二本鎖DNA、一本鎖DNA、RNA、ゲノムDNA、及び染色体外DNAから選択される、76または77に記載の方法。
79.前述の接触させることが、細胞の外側でインビトロで行われる、76〜78のいずれか1項に記載の方法。
80.前述の接触させることが、培養中の細胞の内側で行われる、76〜78のいずれか1項に記載の方法。
81.前述の接触させることが、細胞の内側でインビボで行われる、76〜78のいずれか1項に記載の方法。
82.前記細胞が、真核細胞である、80または81に記載の方法。
83.前記細胞が、植物細胞、真菌細胞、哺乳動物細胞、爬虫類細胞、昆虫細胞、鳥類細胞、魚類細胞、寄生虫細胞、節足動物細胞、無脊椎動物の細胞、脊椎動物の細胞、齧歯類細胞、マウス細胞、ラット細胞、霊長類細胞、非ヒト霊長類細胞、及びヒト細胞である、82に記載の方法。
84.前記細胞が、原核細胞である、80または81に記載の方法。
85.前述の接触させることが、ゲノム編集をもたらす、76〜84のいずれか1項に記載の方法。
86.前述の接触させることが、細胞中に、(a)古細菌Cas9ポリペプチド、または古細菌Cas9ポリペプチドをコードする核酸分子、及び(b)古細菌Cas9ガイドRNA、または古細菌Cas9ガイドRNAをコードする核酸分子を導入することを含む、76〜85のいずれか1項に記載の方法。
87.前述の接触させることが、細胞中にDNAドナーテンプレートを導入することをさらに含む、86に記載の方法。
88.前記古細菌Cas9ガイドRNAが、単一ガイドRNAである、76〜87のいずれか1項に記載の方法。
89.前記古細菌Cas9ガイドRNAが、二重ガイドRNAである、76〜87のいずれか1項に記載の方法。
90.標的DNAからの転写を変調するか、標的核酸を修飾するか、または標的核酸に関連したタンパク質を修飾する方法であって、
標的核酸を、
a)異種ポリペプチドに融合された古細菌Cas9ポリペプチドを含む、古細菌Cas9融合ポリペプチド、及び
b)標的核酸の標的配列にハイブリダイズするガイド配列を含む古細菌Cas9ガイドRNAと接触させることを含む、方法。
91.前記古細菌Cas9ガイドRNAが、単一ガイドRNAである、90に記載の方法。
92.前記古細菌Cas9ガイドRNAが、二重ガイドRNAである、90に記載の方法。
93.前記修飾が、標的核酸の切断ではない、90〜92のいずれか1項に記載の方法。
94.前記標的核酸が、二本鎖DNA、一本鎖DNA、RNA、ゲノムDNA、及び染色体外DNAから選択される、90〜93のいずれか1項に記載の方法。
95.前述の接触させることが、細胞の外側でインビトロで行われる、90〜94のいずれか1項に記載の方法。
96.前述の接触させることが、培養中の細胞の内側で行われる、90〜94のいずれか1項に記載の方法。
97.前述の接触させることが、細胞の内側でインビボで行われる、90〜94のいずれか1項に記載の方法。
98.前記細胞が、真核細胞である、96または97に記載の方法。
99.前記細胞が、植物細胞、真菌細胞、哺乳動物細胞、爬虫類細胞、昆虫細胞、鳥類細胞、魚類細胞、寄生虫細胞、節足動物細胞、無脊椎動物の細胞、脊椎動物の細胞、齧歯類細胞、マウス細胞、ラット細胞、霊長類細胞、非ヒト霊長類細胞、及びヒト細胞である、98に記載の方法。
100.前記細胞が、原核細胞である、96または97に記載の方法。
101.前述の接触させることが、細胞中に、(a)古細菌Cas9融合ポリペプチド、または古細菌Cas9融合ポリペプチドをコードする核酸分子、及び(b)古細菌Cas9ガイドRNA、または古細菌Cas9ガイドRNAをコードする核酸分子を導入することを含む、90〜100のいずれか1項に記載の方法。
102.前記古細菌Cas9ポリペプチドが、触媒能がない古細菌Cas9ポリペプチド(不活性型古細菌Cas9)である、90〜101のいずれか1項に記載の方法。
103.前記古細菌Cas9ポリペプチドが、配列番号71のD672、E769、及びD935から選択されるものに対応する位置に1つ以上の突然変異を含む、90〜102のいずれか1項に記載の方法。
104.前記異種ポリペプチドが、標的DNAを修飾する酵素活性を呈する、90〜103のいずれか1項に記載の方法。
105.前記異種ポリペプチドが、ヌクレアーゼ活性、メチルトランスフェラーゼ活性、デメチラーゼ活性、DNA修復活性、DNA損傷活性、脱アミノ化活性、ジスムターゼ活性、アルキル化活性、脱プリン化活性、酸化活性、ピリミジン二量体形成活性、インテグラーゼ活性、トランスポザーゼ活性、リコンビナーゼ活性、ポリメラーゼ活性、リガーゼ活性、ヘリカーゼ活性、フォトリアーゼ活性、及びグリコシラーゼ活性から選択される1つ以上の酵素活性を呈する、104に記載の方法。
106.前記異種ポリペプチドが、ヌクレアーゼ活性、メチルトランスフェラーゼ活性、デメチラーゼ活性、脱アミノ化活性、脱プリン化活性、インテグラーゼ活性、トランスポザーゼ活性、及びリコンビナーゼ活性から選択される1つ以上の酵素活性を呈する、105に記載の方法。
107.前記異種ポリペプチドが、標的核酸に関連した標的ポリペプチドを修飾する酵素活性を呈する、90〜103のいずれか1項に記載の方法。
108.前記異種ポリペプチドが、ヒストン修飾活性を呈する、107に記載の方法。
109.前記異種ポリペプチドが、メチルトランスフェラーゼ活性、デメチラーゼ活性、アセチルトランスフェラーゼ活性、デアセチラーゼ活性、キナーゼ活性、ホスファターゼ活性、ユビキチンリガーゼ活性、脱ユビキチン化活性、アデニル化活性、脱アデニル化活性、SUMO化活性、脱SUMO化活性、リボシル化活性、脱リボシル化活性、ミリストイル化活性、脱ミリストイル化活性、グリコシル化活性(例えば、O−GlcNAcトランスフェラーゼからの)、及び脱グリコシル化活性から選択される1つ以上の酵素活性を呈する、107または108に記載の方法。
110.前記異種ポリペプチドが、メチルトランスフェラーゼ活性、デメチラーゼ活性、アセチルトランスフェラーゼ活性、及びデアセチラーゼ活性から選択される1つ以上の酵素活性を呈する、109に記載の方法。
111.前記異種ポリペプチドが、転写を増加または減少させるタンパク質である、90〜103のいずれか1項に記載の方法。
112.前記異種ポリペプチドが、転写抑制因子ドメインである、111に記載の方法。
113.前記異種ポリペプチドが、転写活性化ドメインである、111に記載の方法。
114.前記異種ポリペプチドが、タンパク質結合ドメインである、90〜103のいずれか1項に記載の方法。
115.遺伝子導入の多細胞非ヒト生物であって、それらのゲノムが、
a)古細菌Cas9ポリペプチド、
b)古細菌Cas9融合ポリペプチド、及び
c)古細菌Cas9ガイドRNAのうちの1つ以上をコードするヌクレオチド配列を含む導入遺伝子を含む、遺伝子導入の多細胞非ヒト生物。
116.前記古細菌Cas9ポリペプチドが、配列番号71または配列番号72に記載されるアミノ酸配列に対して50%以上のアミノ酸配列同一性を有するアミノ酸配列を含む、115に記載の遺伝子導入の多細胞非ヒト生物。
117.前記古細菌Cas9ポリペプチドが、配列番号71または配列番号72に記載されるアミノ酸配列に対して85%以上のアミノ酸配列同一性を有するアミノ酸配列を含む、115に記載の遺伝子導入の多細胞非ヒト生物。
118.前記生物が、植物、単子葉植物、双子葉植物、無脊椎動物、昆虫、節足動物、クモ形網動物、寄生虫、蠕虫、脊椎動物、魚、爬虫類、両生類、有蹄類、鳥、ブタ、ウマ、ヒツジ、齧歯類、マウス、ラット、または非ヒト霊長類である、115〜117のいずれか1項に記載の遺伝子導入の多細胞非ヒト生物。
119.系であって、
a)古細菌Cas9ポリペプチド及び古細菌Cas9単一ガイドRNAと、
b)古細菌Cas9ポリペプチド、古細菌Cas9ガイドRNA、及びDNAドナーテンプレートと、
c)古細菌Cas9融合ポリペプチド及び古細菌Cas9ガイドRNAと、
d)古細菌Cas9融合ポリペプチド、古細菌Cas9ガイドRNA、及びDNAドナーテンプレートと、
e)古細菌Cas9ポリペプチドをコードするmRNA、及び古細菌Cas9単一ガイドRNAと、
f)古細菌Cas9ポリペプチドをコードするmRNA、古細菌Cas9ガイドRNA、及びDNAドナーテンプレートと、
g)古細菌Cas9融合ポリペプチドをコードするmRNA、及び古細菌Cas9ガイドRNAと、
h)古細菌Cas9融合ポリペプチドをコードするmRNA、古細菌Cas9ガイドRNA、及びDNAドナーテンプレートと、
i)i)古細菌Cas9ポリペプチドをコードするヌクレオチド配列、及びii)古細菌Cas9ガイドRNAをコードするヌクレオチド配列を含む、1つ以上の組み換え発現ベクターと、
j)i)古細菌Cas9ポリペプチドをコードするヌクレオチド配列、ii)古細菌Cas9ガイドRNAをコードするヌクレオチド配列、及びiii)DNAドナーテンプレートを含む、1つ以上の組み換え発現ベクターと、
k)i)古細菌Cas9融合ポリペプチドをコードするヌクレオチド配列、及びii)古細菌Cas9ガイドRNAをコードするヌクレオチド配列を含む、1つ以上の組み換え発現ベクターと、
l)i)古細菌Cas9融合ポリペプチドをコードするヌクレオチド配列、ii)古細菌Cas9ガイドRNAをコードするヌクレオチド配列、及びDNAドナーテンプレートを含む、1つ以上の組み換え発現ベクターと
を含む、系。
120.前記古細菌Cas9ポリペプチドが、配列番号71または配列番号72に記載されるアミノ酸配列に対して50%以上のアミノ酸配列同一性を有するアミノ酸配列を含む、119に記載の古細菌Cas9系。
121.前記古細菌Cas9ポリペプチドが、配列番号71または配列番号72に記載されるアミノ酸配列に対して85%以上のアミノ酸配列同一性を有するアミノ酸配列を含む、119に記載の古細菌Cas9系。
122.前記ドナーテンプレート核酸が、8ヌクレオチド〜1000ヌクレオチドの長さを有する、119〜121のいずれか1項に記載の古細菌Cas9系。
123.前記ドナーテンプレート核酸が、25ヌクレオチド〜500ヌクレオチドの長さを有する、119〜121のいずれか1項に記載の古細菌Cas9系。
124.119〜123のいずれか1項に記載の古細菌Cas9系を含む、キット。
125.前記キットの構成要素が、同じ容器内にある、124に記載のキット。
126.前記キットの構成要素が、別個の容器内にある、124に記載のキット。
127.119〜126のいずれか1項に記載の古細菌Cas9系を含む、無菌容器。
128.前記容器が、シリンジである、127に記載の無菌容器。
129.119〜126のいずれか1項に記載の古細菌Cas9系を含む、埋め込み可能なデバイス。
130.前記古細菌Cas9系が、マトリックス内にある、129に記載の埋め込み可能なデバイス。
131.前記古細菌Cas9系が、貯蔵器内にある、129に記載の埋め込み可能なデバイス。
132.前記古細菌Cas9タンパク質が、ARMAN−1 Cas9タンパク質またはARMAN−4 Cas9タンパク質である、態様1〜131(セットB)のいずれか1項。
133.前記古細菌Cas9タンパク質が、Candidatus Micrarchaeum acidiphilum Cas9タンパク質またはCandidatus Parvarchaeum acidiphilum Cas9タンパク質である、態様1〜131(セットB)のいずれか1項。
以下の実施例は、当業者に本発明をどのように作製及び使用するかの完全なる開示及び説明を提供するように提示され、本発明者が自身の発明とみなすものの範囲を限定するようには意図されておらず、以下の実験がすべてまたは唯一の実行される実験であると表すようにも意図されていない。使用される数値(例えば、量、温度等)に対する正確さを確保する努力がなされているが、いくつかの実験によるエラー及び偏差が計上されるはずである。別途示されない限り、部は、重量部であり、分子量は、重量平均分子量であり、温度は、摂氏温度であり、圧力は、大気圧であるか、またはそれに近い。例えば、bpは塩基対(複数可)、kbはキロベース(複数可)、pLはピコリットル(複数可)、sまたはsecは秒(複数可)、minは分(複数可)、hまたはhrは時間(複数可)、aaはアミノ酸(複数可)、kbはキロベース(複数可)、bpは塩基対(複数可)、ntはヌクレオチド(複数可)、i.m.は筋肉内の(に)、i.p.は腹腔内の(に)、s.c.は皮下の(に)の標準的な略語を使用してもよい。
実施例1
本明細書に記載される研究は、地下水、沈殿物、及び酸鉱山廃水からの微生物群集のメタゲノム試料の分析を含む。培養生物の中で表されない新たなクラス2 CRISPR−Cas系が同定された。
図3.CasXドメイン及び類似性研究(パネルA)HHpredを使用してAcCpf1との遠隔ホモログアラインメントから推定されたCasXの概略的ドメイン表現。保存された触媒残基は、タンパク質の上に赤色の棒でマークされる。CasXは、C末端領域(RuvC−I、RuvC−II、及びRuvC−III)ならびに大きな新規N末端ドメインにRuvCスプリットドメインを含有する。概略図の下には、以下の検索に基づく上位ヒットが表示される。(1)NCBI中のすべてのタンパク質に対するBLAST検索(モデル及び環境タンパク質を含む、NRデータベース)。(2)Makarova et al.Nat Rev Microbiol.2015 Nov;13(11):722−36、及びShmakov et al.Mol Cell.2015 Nov 5;60(3):385−97に記載されるすべてのCasタンパク質を使用して構築されたモデルに基づくプロファイル隠れマルコフモデル(HMM)検索。(3)HHpredに基づく遠隔ホモログ検索。ヒットは、それらの重要性に基づいてカラーコードされ、ヒット範囲及びE値が提供される。明らかに、CasXは、局所ヒットのみを有していた。CasXの620N末端アミノ酸は、検索スキームのうちのいずれかにおいてヒットを有していなかった。合わせて、これらの発見は、CasXが新たなCasタンパク質であることを示す。(パネルB)2つの異なるCasXを含有するCRISPR遺伝子座足場は、配列データから構築された。上はデルタプロテオバクター(CasX1)からのものであり、下は、プランクトミセス(CasX2)からのものである。対応するDNA配列は、それぞれ配列番号51及び52として記載される。
実施例2
図4(パネルA〜C)。E.coli中で発現されたCasXによるプラスミド干渉。(パネルA)CasXプラスミド干渉の実験デザイン。最小の干渉CasX遺伝子座を発現する有能なE.coli細胞(取得タンパク質が除去された)を調製した。これらの細胞を、CasX CRISPR遺伝子座中にスペーサーに対する一致を含有する(標的)または含有しない(非標的)プラスミドで形質転換し、CRISPR及び標的プラスミドに対する抗生物質選択を含む培地上に播種した。良好なプラスミド干渉は、標的プラスミドに対する減少数の形質転換コロニーをもたらす。(パネルB)CasX1(sX1)からのスペーサー、CasX2(sX2)からのスペーサー、またはランダムな30nt配列を含有する非標的プラスミドを含有する形質転換したプラスミドのcfu/μg。(パネルC)CRISPR及び標的プラスミドの両方について、抗生物質選択を含有する培地上でパネルBからの形質転換体の段階希釈を行った。
図5(パネルA〜B)CasXによるPAM依存的プラスミド干渉。(パネルA)PAM枯渇アッセイは、CasXを用いて行った。CasX CRISPR遺伝子座を含有するE.coliを、標的配列の5′または3′でランダム化された7ヌクレオチドを有するプラスミドライブラリで形質転換した。標的プラスミドを選択し、形質転換体をプールした。ランダム化領域を増幅し、ディープシーケンシングのために調製した。枯渇した配列を同定し、それを使用してPAMロゴを生成した。(パネルB)デルタプロテオバクテリアCasXに対して生成されたPAMロゴは、標的の5′−TTCN−3′隣接配列5′を含有する配列に対して強い優先性を示した。3′PAMは検出されなかった。c、プランクトミセスCasXに対して生成されたPAMロゴは、最初のTにおいて低い厳格性を有する標的の5′−TTCN−3′隣接配列5′を含有する配列に対して強い優先性を示した。3′PAMは検出されなかった。
図6(パネルA〜C)。CasXは、二重ガイドCRISPR−Casエフェクター複合体。(パネルA)tracrRNAノックアウト実験及びsgRNA試験のためのCRISPR遺伝子座。(パネルB)標的または非標的配列を含有する形質転換されたプラスミドの1μg当たりのコロニー形成単位(cfu)。tracrRNAの欠失は、プラスミド干渉の除去をもたらした。tracrRNA及びCRISPRアレイの代わりの合成sgRNAの発現は、CasXによる頑健なプラスミド干渉をもたらした。(パネルC)sgRNAデザインの図(CasX1のtracrRNA及びcrRNA配列に由来する)。tracrRNA(緑色)を、テトラループ(GAAA)によってcrRNAに接合した(反復、黒色;スペーサー、赤色)。
図7.CasX RNA誘導型DNA干渉の概略図。CasXは、tracrRNA(緑色)及びcrRNA(黒色、反復;赤色、スペーサー)に結合する。正しいプロトスペーサー隣接モチーフ(黄色)を含有する標的配列(青色)に対するガイドRNAの塩基対合は、標的DNAの二本鎖切断をもたらす。示される配列は、CasX1のtracrRNA及びcrRNA配列に由来する。
実施例3
図8.CasXを使用するヒト細胞を編集するための実験デザイン。不安定化GFPを発現するHEK293細胞を、CasX及びそのガイドRNAを発現するプラスミドのリポフェクションまたはそのガイドRNAで事前に組み立てられたCasXのヌクレオフェクションのいずれかを使用し、CasXで処置する。良好なゲノム切断は、フローサイトメトリー及び/または検査官アッセイ(例えば、T7E1アッセイ)によって検出され得る、蛍光シグナルの喪失を引き起こす、GFP遺伝子座における挿入欠失をもたらす。
実施例4
図9.CasXの組み換え発現及び精製。CasXをマルトース結合タンパク質に融合し、E.coli中で発現された。溶解物を、Ni−NTA樹脂上で精製し、TEVで処置し、ヘパリンカラム及びサイズ排除カラム上で精製した。サイズ排除カラムからの分画は、参照のための分子量マーカーと共に示される。CasXの算出サイズは、約110kDaであった。
実施例5
図10.様々なtracrRNA配列の試験。試験したtracrRNA配列は、以下のとおりであった(CasX二重ガイドRNAの概略については、図7を参照)。
tracrRNA T1:
AAGUAGUAAAUUACAUCUGGCGCGUUUAUUCCAUUACUUUGGAGCCAGUCCCAGCGACUAUGUCGUAUGGACGAAGCGCUUAUUUAUCGGAGA(配列番号24)
tracrRNA T2:
ACAUCUGGCGCGUUUAUUCCAUUACUUUGGAGCCAGUCCCAGCGACUAUGUCGUAUGGACGAAGCGCUUAUUUAUCGGAGA(配列番号21)
tracrRNA T3:
UUCCAUUACUUUGGAGCCAGUCCCAGCGACUAUGUCGUAUGGACGAAGCGCUUAUUUAUCGGAGA(配列番号66)
tracrRNA T4:
GUCCCAGCGACUAUGUCGUAUGGACGAAGCGCUUAUUUAUCGGAGA
(配列番号67)
tracrRNA T5:
GAAGCGCUUAUUUAUCGGAGA(配列番号68)
加えて、以下のcrRNA配列を機能について試験した。
crRNA1(処理されたバージョンのcrRNAは、sgRNA及び二重ガイドフォーマットの両方で活性であった)。
CCGAUAAGUAAAACGCAUCAAAGNNNNNNNNNNNNNNNNNNNN(配列番号61)
crRNA2(二重ガイドフォーマットで活性であった)。
AUUUGAAGGUAUCUCCGAUAAGUAAAACGCAUCAAAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN(配列番号62)
加えて、以下のsgRNA配列を機能について試験した(CasXガイドRNAの概略表現については、図6及び図7を参照)。
sgRNA(活性、センス、処理した):
ACAUCUGGCGCGUUUAUUCCAUUACUUUGGAGCCAGUCCCAGCGACUAUGUCGUAUGGACGAAGCGCUUAUUUAUCGGAGAgaaaCCGAUAAGUAAAACGCAUCAAAGNNNNNNNNNNNNNNNNNNN(配列番号42)
sgRNA2(不活性、センス、前処理した。下線が引かれた配列は、sgRNA1に対して異なる)
sgRNA3(不活性、センス、処理した):
NNNNNNNNNNNNNNNNNNNNCUUUGAUGCGUUUUACUUAUCGGgaaaUCUCCGAUAAAUAAGCGCUUCGUCCAUACGACAUAGUCGCUGGGACUGGCUCCAAAGUAAUGGAAUAAACGCGCCAGAUGU(配列番号64)
sgRNA4(不活性):
NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCUUUGAUGCGUUUUACUUAUCGGAGAUACCUUCAAAUgaaaGGAGCUAUCUCCGAUAAAUAAGCGCUUCGUCCAUACGACAUAGUCGCUGGGACUGGCUCCAAAGUAAUGGAAUAAACGCGCCAGAUGUAAUUUACUACUU(配列番号65)
実施例6
図11.CasX系(CasXタンパク質及びガイドRNA)を、室温及び37℃で細菌細胞中の機能について試験した。形質転換されたプラスミドの1μg当たりのコロニー形成単位(cfu)を、標的または非標的配列を含有するプラスミドについてアッセイした。このアッセイは、室温または37℃のいずれかで行った。データは、CasX系が、室温または37℃のいずれかで同様の程度で機能したことを示す。
実施例7−古細菌Cas9
図12.ARMAN−1 II型CRISPR−Cas系(パネルA)ARMAN−1 CRISPR−Cas遺伝子座の概要(パネルB)NGG 3′PAMに対する強い優先性が、240プロトスペーサーの分析から推定された。(パネルC)リッチモンド・マイン生態系から採取されたARMAN−1ゲノム中のCRISPRアレイの再構成。緑色の矢印は、反復を示し、色付きの矢印は、CRISPRスペーサーを示す(同一のスペーサーは、同じ色で着色されているが、固有能力は、黒色で着色されている)。コンティグ(灰色の棒)を、メタゲノムコンティグ上のスペーサーの順序に基づいて整列させる。灰色の背景は、アレイの保存された古いと思われる領域を示す。CRISPR系において、スペーサーは、典型的に一方向に付加されるため、遺伝子座の左側の多様なスペーサーは、左側が最近の取得が起こった場所であることを示す。最近取得されたスペーサーの多様性の存在、ならびに異なる部位から異なる時点で収集されたデータセットから組み立てられたゲノム断片中の反復及びスペーサー配列の保存は、その系が活性であることを示した。(パネルD)ARMAN−1 Cas9の系統発生は、それをARMAN−4 Cas9及びここで初めて報告される2つの新たな細菌Cas9(黒色)と一緒にクラスタ化した。これらのCas9は、遺伝子座がII−B型系において典型的に見出されるCas4を含有しているが、進化的にII−C型系に関連すると思われる。(パネルE)異なるII−B型のセットとクラスタ化されたARMAN−1 Cas1の系統発生。パネルD及びEにおける系統樹を組み合わせると、ARMAN−1 II型系は、II−B及びII−C CRSIPR−Cas系の組み換えの結果であり得ることが示唆される。
図14.(上パネル)ARMAN−1 Cas9のcrRNA:tracrRNA二重ガイドRNAの予測二次構造。可変長のcrRNA(上鎖)と予測tracrRNA配列との二次構造及び塩基対合が示される。「crRNA」は、ARMAN−1からの直接反復配列を表すが、緑色のN20は、ユーザ定義配列(ガイド配列)である。tracrRNA−69は、赤色で示されるが、tracrRNA−104及びtracrRNA−179は、それぞれ青色及びピンク色の配列によって伸長される。(下パネル)ARMAN−1 Cas9の例示的な単一ガイドRNAの予測構造。sgRNAの二次構造が示される。「標的化因子」は、部分的直接反復(短縮された)及び標的化因子を活性化因子(同様に短縮された)に接続する操作されたテトラループ(リンカー)を表す。緑色のN20は、ユーザ定義配列(ガイド配列)である。tracrRNA−69、tracrRNA−104、及びtracrRNA−179を含むSgRNAが示される。
図15.(上パネル)ARMAN−4 Cas9のcrRNA:tracrRNA二重ガイドRNAの予測二次構造。crRNA(上鎖)と予測tracrRNA配列(下鎖)との間の二次構造及び塩基対合が示される。「crRNA」は、ARMAN−4からの直接反復配列を表すが、緑色のN20は、ユーザ定義配列(ガイド配列)である。(下パネル)ARMAN−4 Cas9の例示的な単一ガイドRNAの予測構造。sgRNAの二次構造が示される。「標的化因子」は、部分的直接反復(短縮された)及び標的化因子を活性化因子(同様に短縮された)に接続する操作されたテトラループ(リンカー)を表す。緑色のN20は、ユーザ定義配列(ガイド配列)である。
実施例8:未培養微生物由来の新たなCRISPR−Cas系
CRISPR−Cas適応免疫系は、部位特異的DNA切断が可能なプログラム可能な酵素を提供することによってゲノム操作を改革した。しかしながら、現在のCRISPR−Cas技術は、単に培養された細菌からの系に基づいており、単離されていない生物由来の酵素の大多数が未開発のままである。本明細書において提供されるデータは、培養独立型ゲノム判定済みメタゲノム解析を使用して、古細菌生活ドメイン中に初めて報告されたCas9を含む、新たなCRISPR−Cas系の同定を示す。この多様なCas9酵素は、活性CRISPR−Cas系の一部として、ほとんど研究されていないナノ古細菌中で見出された。細菌中、最も主流であるが、未だに同定されていない系の中で2つの以前に知られていない系(CRISPR−CasX及びCRISPR−CasY)が発見された。明らかに、メタゲノム解析によってすべての必要な機能性成分が同定され、これがE.coli中の頑健なRNA誘導型DNA干渉活性の検証を可能にした。本明細書におけるデータは、生きた細胞における実験と組み合わせた環境微生物群集の照合が、先例がない種々のゲノムへのアクセスを可能にし、その内容が微生物に基づくバイオテクノロジーのレパートリーを拡大することを示す。
結果
地下水、沈殿物、及び酸鉱山廃水微生物群集からのテラベーススケールのメタゲノムデータセットを分析し、培養生物の中で表されないクラス2 CRISPR−Cas系を捜した。ドメイン古細菌で最初のCas9タンパク質が同定され、2つの新たなCRISPR−Cas系(CRISPR−CasX及びCRISPR−CasY)が、未培養細菌中で発見された(図18)。明らかに、古細菌Cas9及びCasYの両方は、既知の単離された代表的なものがない系統からの生物のゲノム中で排他的にコードされた。
古細菌Cas9の最初の同定
CRISPR−Cas9の特徴のうちの1つは、細菌ドメインにおいてのみ推定されるその存在であった。したがって、驚くべきことに、酸鉱山廃水(AMD)メタゲノムデータセットにおいて、ナノ古細菌ARMAN−1(Candidatus Micrarchaeum acidiphilum ARMAN−1 )及びARMAN−4(Candidatus Parvarchaeum acidiphilum ARMAN−4)のゲノム中でコードされるCas9タンパク質を発見した。これらの発見は、Cas9含有CRISPR系の発生を別の生活ドメインにまで拡大する。
ARMAN−4 cas9遺伝子は、同じゲノム文脈において、他の隣接したcas遺伝子を有しない(25kbpを超えるいくつかのDNA配列の中央に位置するにもかかわらず)、1つの隣接したCRISPR反復スペーサー単位のみを有する、16の異なる試料中で見出された(図24)。ユニバーサルCRISPRインテグラーゼをコードする典型的なCRISPRアレイ及びcas1の欠失は、新たなスペーサーを取得する能力がない系を指し示す。スペーサー配列に対する標的を同定することができなかったが、数年にわたって収集された試料中の遺伝子座の保存を考慮すると、「単一標的」CRISPR−Cas系中のその機能は、今回除外することができない。
反対に、15の異なる試料から回収したARMAN−1中のCRISPR−Cas遺伝子座は、cas1、cas2、cas4、及びcas9遺伝子に隣接した大きなCRISPRアレイを含む。広範に保存された末端を有する(最も古いスペーサーで構成される可能性がある)多くの代替ARMAN−1 CRISPRアレイ、及び多くの別個のスペーサーが組み込まれた可変領域が再構成された(図19A及び図25)。スペーサー含有量のこの超可変性に基づいて、これらのデータは、ARMAN−1 CRISPR−Cas9系は、採取された集団中で活性であることを示す。
注目すべきことには、ARMAN−1 CRISPR−Cas9系の推定スペーサー標的(プロトスペーサー)のうちの56は、それが高密度の短い仮想タンパク質をコードすることを考慮して、恐らくARMAN−1ウイルスである単一の10kbpゲノム断片上に位置していた(図19B)。実際に、低温電子断層撮影の再構成は、多くの場合、ARMAN細胞に付着したウイルス粒子を同定した。ARMAN−1プロトスペーサーはまた、ARMAN−2(別のナノ古細菌)のゲノム内の推定トランスポゾン、及び同じ生態系からのI−プラズマのものを含む、Thermoplasmatale古細菌のゲノム中の推定移動要素に由来する(図26)。直接細胞質間「橋」は、ARMAN細胞とThermoplasmatale細胞との間で観察され、それらの間の密接な関係を示唆している。したがってARMAN−1 CRISPR−Cas9は、これらの生物間のトランスポゾン伝播から防御することができ、真核生殖系における転位に対するpiRNA媒介型防御を思わせる役割である。
活性DNA標的CRISP−Cas系は、自己対非自己の区別のために標的配列の隣に位置する2〜4bpプロトスペーサー隣接モチーフ(PAM)を使用する。ゲノム標的配列に隣接した配列を調べることは、実際に、ARMAN−1における強い「NGG」PAM優先性を明らかにした(図19C)。Cas9はまた、RNA誘導型DNA切断に対して2つの別個の転写、CRISPR RNA(crRNA)及びトランス活性化CRISPR RNA(tracrRNA)を用いる。推定tracrRNAは、ARMAN−1及びARMAN−4 CRISPR−Cas9系の両方の近位で同定された(図27)。以前に、II型CRISPR系は、crRNA−tracrRNAガイド複合体成熟に関与する宿主因子RNase IIIの欠失に起因して、古細菌中で不在であったことが示唆された。明らかに、RNase IIIホモログは、ARMAN−1ゲノム中で同定されておらず(95%完全であると推定される)、内部プロモーターは、CRISPRアレイに対して予測されず、ガイドRNAの産生機序が依然として未確定であることを示唆する。E.coli及び酵母の両方ならびにインビボE.coli標的アッセイから精製されたARMAN−1及びARMAN−4 Cas9タンパク質の切断活性を試験する生化学実験は、いかなる検出可能な活性も明らかにしなかった(図32及び図28を参照)。
CRISPR−CasXは、新たな二重RNA誘導型CRISPR系である。
Cas9に加えて、クラス2Casエフェクタータンパク質の3つのファミリーCpf1、C2c1、及びC2c2のみが発見され、実験的に検証された。小さいDNA断片上でのみ同定された別の遺伝子c2c3は、そのようなタンパク質ファミリーをコードすることも示唆された。新たな種類のクラス2 CRISPR−Cas系は、地下水及び沈殿物試料から繰り返し回収された2種の細菌のゲノム中で見出された。異なる門に属する2種の生物(デルタプロテオバクテリア及びプランクトミセス)におけるこの系の高い保存は、細菌の交差門移行を示唆する。この新たに記載された系としては、Cas1、Cas2、Cas4、及び本明細書ではCasXと称される、特徴化されていない約980aaタンパク質が挙げられる。各CasXと会合したCRISPRアレイは、37塩基対の高度に類似した反復、33〜34塩基対のスペーサー、及びCasオペロンとCRISPRアレイとの間の推定tracrRNAを有していた(図18B)。BLAST検索は、トランスポザーゼに対する弱い類似性(e値>1×10-4)を明らかにしただけであり、類似性はCasX C末端の特定領域に制限されていた。遠隔ホモロジー検出及びタンパク質モデリングは、CasX C終端の近くのRuvCドメインを同定し、V型CRISPR−Cas系において見出されたものを思わせる組織を有していた(図29)。CasXタンパク質(630N末端アミノ酸)の残部は、任意の既知のタンパク質に対して検出可能な類似性を示さず、これが新規のクラス2エフェクターであることを示唆してする。tracrRNA及び別個のCas1、Cas2、及びCas4タンパク質の組み合わせは、V型系の中で固有である。さらに、CasXは、Cpf1、C2c1、及びC2c3に対する1,200aaよりも大きい典型的なサイズと比較して、任意の既知のV型タンパク質:980aaよりも大幅に小さい。
次に、その小さいサイズ及び非標準的遺伝子座含有量にもかかわらず、CasXがCas9及びCpf1酵素に類似するRNA誘導型DNA標的を可能にするかどうかが疑問であった。この可能性を試験するために、casXを含む最小CRISPR−CasX遺伝子座をコードするプラスミド、短い反復スペーサーアレイ、及び介入する非コード領域を合成した。E.coli中で発現されるとき、この最小遺伝子座は、メタゲノム分析によって同定された標的配列を担持するプラスミドによって形質転換を遮断した(図20A〜C、図30)。さらに、形質転換を伴う干渉は、最小遺伝子座におけるスペーサー配列が、プラスミド標的中のプロトスペーサー配列に一致した場合にのみ起こった。CasXのPAM配列を同定するために、標的部位に隣接した5′または3′ランダム化配列のいずれかを含有するプラスミドを使用して、E.coli中で形質転換アッセイを繰り返した。この分析は、プロトスペーサー配列の5′の直近に位置する配列「TTCN」に対する厳格な優先性を明らかにした(図20D)。3′PAM優先性は観察されなかった(図30)。この発見と一致して、「TTCA」は、環境試料中で同定された推定デルタプロテオバクテリアCRISPR−CasXプロトスペーサーの上流で見出された配列であった。明らかに、両方のCRISPR−CasX遺伝子座は、それらの高度のCasXタンパク質相同性に即して、同じPAM配列を共有する。
単一RNA及び二重誘導型系の両方の例は、V型CRISPR遺伝子座の中で存在する。環境メタトランスクリプトームデータを使用して、CasXがDNA標的化活性のためにtracrRNAを必要とするかどうかを決定した。この分析は、Cas2オープンリーディングフレームとCRISPRアレイとの間でコードされたCRISPR反復に対する配列相補性を有する非コードRNA転写を明らかにした(図21A)。CasX遺伝子座を発現するE.coli中のこの非コードRNAの発現をチェックするために、この転写に対して両方向でノーザンブロットを行った(図30)。結果は、casX遺伝子と同じ鎖上にコードされた約110ntの転写の発現を示し、約60〜70ntはより異種の転写であり、CRISPRアレイのリーダー配列は、tracrRNAとアレイとの間に存在することを示唆する。トランスクリプトームマッピングは、CRISPR RNA(crRNA)が、CRISPR−Cas9系中で起こるcrRNA処理と同様に、22nt(または約23nt)の反復及び20ntの隣接スペーサーを含むように処理されることをさらに示唆する(図21A)。さらに、crRNA−tracrRNA二重鎖のRNase III媒介型処理と一致する、2ntの3′オーバーハングが同定された(図21B)。推定tracrRNA上のCasX活性の依存性を決定するために、この領域を上記の最小CRISPR−CasX遺伝子座から欠失させ、プラスミド干渉アッセイを繰り返した。CasXプラスミドからの推定tracrRNAコード配列の欠失は、その存在中で観察される頑健な形質転換干渉を排除した(図21C)。この推定tracrRNAを、テトラループを使用して処理されたcrRNAと接合して、単一ガイドRNA(sgRNA)を形成した。crRNAの異種プロモーター単独または短縮バージョンのsgRNAを使用する発現は、いかなる有意なプラスミド干渉も有していなかったが、全長sgRNAの発現は、プラスミド形質転換に対する耐性を与えた(図21C)。一緒に、これらの結果は、CasXを新たな機能的DNA標的化、二重RNA誘導型CRISPR酵素として確立する。これらの結果は、CasXが、単一RNAガイドCRISPR酵素として機能し得ることをさらに実証する。
CRISPR−CasY、単離体を欠く細菌系統において排他的に見出された系
ある特定の候補門放射線(CPR)細菌のゲノム中でコードされた別の新たなクラス2 Casタンパク質が同定された。これらの細菌は、典型的に、小さい細胞サイズ(低温TEMデータ及びろ過による富化に基づく)、非常に小さいゲノム、及び制限された生合成能力を有し、それらが共生生物である可能性が最も高いことを示す。本明細書においてCasYと称される新たな約1,200aa Casタンパク質は、最大でCas1及びCRISPRアレイを含む最小CRISPR−Cas系の一部であると思われる(図22A)。CRISPRアレイの大部分は、17〜19ntの異常に短いスペーサーを有するが、Cas1を欠く1つの系(CasY.5)は、より長いスペーサーを有する(27〜29nt)。同定されたCasYタンパク質の6つの例は、公用データベースにおける任意のタンパク質に対して有意な配列類似性を有していなかった。公開されたCasタンパク質3.4 から構築されたプロファイルモデル(HMM)を使用する高感度検索は、6つのCasYタンパク質のうちの4つが、RuvCドメイン及びN末端の小領域(約45aa)に重なるC末端領域におけるC2c3に対する局所類似性(e値4×10-11 〜3×10-18 )を有していたことを示した(図29を参照)。C2c3は、分類学的関係がない短いコンティグ上で同定された推定V型Casエフェクターであり、実験的に検証されていない。CasYと同様に、C2c3は、短いスペーサー及びCas1を有するが、他のCasタンパク質を有しないアレイの次に見出された。明らかに、現行の研究で同定されたCasYタンパク質のうちの2つは、他のCasYタンパク質との有意な配列類似性(最良ブラストヒット:e値6×10-85 、7×10-75 )を共有するにもかかわらず、C2c3に対する有意な類似性を有していなかった。
任意の実験的に検証されたCRISPR遺伝子座に対するCRISPR−CasYの低い相同性を考慮して、次に、この系がRNA誘導型DNA干渉を及ぼすかどうかが疑問に思われたが、短いスペーサー長に起因して、そのような活性に必要とされる可能性のあるPAMモチーフに関する信頼性のある情報が存在しなかった。これに対処するために、全体CRISPR−CasY.1遺伝子座を短縮されたCRISPRアレイで合成し、プラスミドベクター上のE.coliに導入した。次いで、これらの細胞を、形質転換アッセイにおいて、アレイ中のスペーサー配列と一致し、隣接したランダム化5′または3′領域を含有する配列を有する標的プラスミドを使用して検証し、可能性のあるPAMを同定した。形質転換体の分析は、標的された配列に直接隣接した5′TAを含有する配列の枯渇を明らかにした(図22B)。この同定されたPAM配列を使用して、CasY.1遺伝子座を、単一PAMを含有するプラスミドに対して試験した。同定された5′TA PAM配列を含有する標的の存在下においてのみ、プラスミド干渉が実証された(図22C)。したがって、これらのデータは、CRISPR−CasYがDNA干渉活性を有することを示す。
考察
未培養細菌及び古細菌由来のゲノム中の新たなクラス2 CRISPR−Cas適応免疫系が同定され、特徴付けられた。活性CRISPR遺伝子座に対して普遍的なCas1の進化的分析(図23A)は、本明細書に記載される古細菌Cas9系が、任意の既存のII型サブタイプに明らかに含まれないことを示唆した。Cas1系統発生(ならびにcas4の存在)は、それをII−B型系と一緒にクラスタ化したが、Cas9の配列は、II−C型タンパク質により類似していた(図31)。したがって、古細菌II型系は、II−C型及びII−B型系の融合として生じ得た(図23B)。同様に、Cas1系統発生分析は、CRISPR−CasX系からのCas1が、任意の他の既知のV型系から離れていることを示した。V型系は、トランスポゾンと、先祖I型系からの適応モジュール(Cas1−Cas2)との融合の結果であることが示唆された。したがって、CRISPR−CasX系が、前述のV型系に対して生じたものとは異なる融合事象に続いて出現したと仮定される。驚いたことに、CRISPR−CasY及び推定C2c3系の両方は、DNAをCRISPR遺伝子座に組み込むために必須であると考えられるタンパク質、Cas2を欠くと思われる。すべてのCRISPR−Cas系が、Cas1及びCas2の両方を含有していた先祖I型系の子孫であると考えられることを考慮して、CRISPR−CasY及びC2c3系は、CRISPR−Cas系の残部とは異なる先祖を有し得るか、あるいはCas2が、それらの進化の歴史の間に喪失されたかのいずれかであり得る。
本明細書に記載される古細菌中のCas9及び細菌中の2つの以前に知られていないCRISPR−Cas系の発見は、複雑な天然微生物群集から得られた包括的なDNA及びRNA配列データベースを使用した。CasX及びCasYの場合において、ゲノム文脈は、組み立てられていない配列情報から証明されていない機能の予測に重要であった。さらに、推定tracrRNAならびに標的されたウイルス配列の同定は、メタゲノムデータにより誘導される機能試験の分析を通して明らかになった。興味深いことに、これまでに同定された最も小型のCRISPR−Cas遺伝子座のうちのいくつかは、非常に小さいゲノムを有する生物において発見された。小さいゲノムサイズの結果は、これらの生物が、基本的代謝要件について、他の群集メンバーに依存する可能性があり、したがってそれらが、伝統的な培養に基づく方法の範囲から大幅に外れたままであることである。干渉に必要とされる制限数のタンパク質は、これらの最小系を、新たなゲノム編集ツールの開発に対して特に価値あるものにする。重要なことに、本明細書では、CRISPR−Cas系に関するメタゲノム的発見が、インシリコ観察に制限されないが、それらの機能が試験され得る実験設定に導入され得ることが示される。生命が存在する事実上すべての環境が、ゲノム判定済みメタゲノム法によってここで証明され得ることを考慮して、本明細書に記載される複合計算的・実験的アプローチが、既知のCRISPR−Cas系の多様性を大幅に拡張すると予想され、生物学的研究及び臨床適用のための新たな技術を提供する。
方法
メタゲノム及びメタトランスクリプトーム
3つの異なる部位からのメタゲノム試料を分析した。(1)リッチモンド鉱山(Iron Mountain,California)から2006年〜2010年に収集された酸鉱山廃水(AMD)試料、(2)コロラド州Rifle近くのコロラド川に隣接したRifle Integrated Field Research(IFRC)サイトから2007年〜2013年に収集された地下水及び沈殿物試料。(3)Crystal Geyser(ユタ州コロラド高原にある冷たいCO2 駆動型間欠泉)から2009年〜2014年に収集された地下水。
AMDデータについて、DNA抽出方法及び短いリードシーケンシングが、Denef and Banfield(2012)及びMillerら(2011)によって報告された。Rifleデータについて、DNA及びRNA抽出、ならびにシーケンシング、アセンブリ、及びゲノム再構成は、Anantharamanら(2016)及びBrownら(2015)によって説明された。Crystal Geyserからの試料について、方法は、Probstら(2016)及びEmersonら(2015)によって説明されたものに従う。簡潔に言うと、PowerSoil DNA単離キット(MoBio Laboratories Inc.,Carlsbad,CA,USA)を使用して、DNAを試料から抽出した。RNAを、Brownら(2015)によって説明されるように、6つの2011年Rifle地下水試料から収集した0.2μmフィルターから抽出した。DNAを、Illumina HiSeq2000プラットフォーム上でシーケンシングし、メタトランスクリプトームcDNAを5500XL SOLiDプラットフォーム上でシーケンシングした。新たに報告されたCrystal Geyserデータ及びAMDデータの再分析のために、IDBA−UDを使用して配列を組み立てた。配列包括度及び遺伝子発現を決定するために使用されるDNA及びRNA(cDNA)リードマッピングはそれぞれ、Bowtie2を使用して行った。Prodigalを使用し、組み立てられた足場上でオープンリーディングフレーム(ORF)を予測した。Crystal Geyserデータセットからの足場を、緊急自己組織化写像(ESOM)を使用し、ABAWACA、ABAWACA2(https://github.com/CK7)Maxbin2、及びテトラヌクレオチド頻度の組み合わせを使用して、示差的包括度増加傾向に基づいてビニングした。GC含有率%、分類学的関係、及びゲノム完全性を使用して、ゲノムを手動で精選した。足場エラーは、ra2.py(https://github.com/christophertbrown)を使用して補正した。
CRISPR−Cas計算分析
様々な試料から組み立てられたコンティグを、Makarovaら及びShmakovらからのアラインメントに基づいて、HMMerスイートを使用して構築された隠れマルコフモデル(HMM)を使用して、既知のCasタンパク質について走査した。ローカルバージョンのCrisprFinderソフトウェアを使用して、CRISPRアレイを同定した。cas1遺伝子に隣接した10のORFのうちの1つが、800aaより大きい、特徴付けられていないタンパク質をコードしたかどうかについて、Cas1及びCRISPRアレイの両方を含有していた遺伝子座をさらに分析したところ、同じコンティグ上で既知のcas干渉遺伝子は同定されなかった。潜在的なクラス2 Casエフェクターとして、これらの大きなタンパク質をさらに分析した。これらの潜在的なエフェクターを、MCLを使用して、配列類似性に基づいてタンパク質ファミリーにクラスタ化した。これらのファミリーの各々を代表するHMMを構築すること、及びそれらを使用して同様のCasタンパク質のメタゲノムデータセットを検索することによって、これらのタンパク質ファミリーを拡張した。タンパク質ファミリーが本当に新しいことを保証するために、NCBlの非冗長(nr)及びメタゲノム(env_nr)タンパク質データベースに対してBLAST、ならびにUniProt KnowledgeBaseに対してHMM検索を使用して、既知のホモログを検索した。全長ヒットがない(タンパク質の長さの>25%)タンパク質のみを新規のタンパク質とみなした。推定Casタンパク質の遠隔相同性検索を、HH−スイートからのHHpredを使用して行った。ハイスコアHHpredヒットを使用して、分解された結晶構造及びJPred4によって予測された二次構造との比較に基づいて、ドメインアーキテクチャを推測した。新たに発見されたCasタンパク質を含むHMMデータベースは、補足データ1において入手可能である。
スペーサー配列は、CrisprFinderを使用して、組み立てられたデータから決定した。CRASSを使用して、関連試料の短いDNAリードにおける追加のスペーサーを位置付けた。次いで、スペーサーに対して≦1ミスマッチを有するヒットについて、関連メタゲノムアセンブリに対するBLAST検索によって(「−task blastn−short」を使用して)スペーサー標的(プロトスペーサー)を同定した。関連した反復を含んでいたコンティグに属するヒットをフィルタリングした(CRISPRアレイをプロトスペーサーとして同定するのを避けるため)。プロトスペーサーに隣接する領域を整列させることによって、プロトスペーサー隣接モチーフ(PAM)を同定し、WebLogoを使用して可視化した。mFoldを使用して、RNA構造を予測した。組み立てられたデータからのスペーサー、反復、及び隣接する配列を手動で整列させることによって、CRISPRアレイの多様性を分析した。Geneious9.1を用いて、手動アラインメント及びコンティグ可視化を行った。
系統発生分析のために、新たに同定された系のCas1及びCas9タンパク質を、Makarovaら及びShmakovらからのタンパク質と共に使用した。CD−HITを使用して≧90%同一性を有するタンパク質と一緒にクラスタ化することによって、非冗長セットをコンパイルした。アラインメントをMAFFTで産生し、最大尤度系統発生を、置換モデルとしてPROTGAMMALGを用いるRAxML及び100ブートストラップサンプリングを使用して構築した。Cas1ツリーは、casposonにつながる枝を使用して根付かせた。FigTree 1.4.1(http://tree.bio.ed.ac.uk/software/figtree/)及びiTOL v3を使用して、ツリーを可視化した。
異種プラスミドの生成
メタゲノムコンティグを、CasXの場合は取得に関連したタンパク質を除去し、CasX及びCasY両方の場合はCRISPRアレイのサイズを低減することによって、最小CRISPR干渉プラスミドにした。最小遺伝子座を、Gblocks(Integrated DNA Technology)として合成し、Gibson Assemblyを使用して組み立てた。
PAM枯渇アッセイ
PAM枯渇アッセイを、修正を伴って以前に記載されたように行った。プライマーを有する7ntのランダム化PAM領域と共に標的を含有するDNAオリゴヌクレオチドをアニールすることによって、ランダム化PAM配列を含有するプラスミドライブラリを組み立て、Klenow Fragment(NEB)を用いて伸長した。二本鎖DNAを、EcoRI及びNcoIで消化し、pUC19骨格にライゲーションした。ライゲーションしたライブラリをDH5αに形質転換し、>108 細胞を採取して、プラスミドを抽出し、精製した。200ngのプールしたライブラリを、CRISPR遺伝子座を内包するエレクトロコンピテントE.coliまたは遺伝子座を有しない対照プラスミドに形質転換した。形質転換した細胞を、カルベニシリン(100mgL−1)及びクロラムフェニコール(30mgL−1)を含有する選択培地上に30時間25℃で播種した。プラスミドDNAを抽出し、PAM配列をIlluminaシーケンシングのためのアダプターで増幅させた。7ntのPAM領域を抽出し、各7nt配列についてPAM頻度を計算した。特定された閾値を超えて枯渇したPAM配列を使用して、WebLogoを生成した。
プラスミド干渉
メタゲノム配列分析またはPAM枯渇アッセイから同定された推定標的を、pUC19プラスミドにクローン化した。10ngの標的プラスミドを、CRISPR遺伝子座プラスミドを含有するエレクトロコンピテントE.coli(NEB安定)に形質転換した。細胞を25℃で2時間回収し、適切な希釈液を選択培地上に播種した。プレートを25℃でインキュベートし、コロニー形成単位をカウントした。すべてのプラスミド干渉実験を3重に行い、エレクトロコンピテント細胞を各複製について独立して調製した。
ARMAN−Cas9タンパク質の発現及び精製
ARMAN−1(AR1)及びARMAN−4(AR4)からのCas9の発現構築物を、E.coliについてコドン最適化したgBlocks(Integrated DNA Technologies)から組み立てられた。組み立てられた遺伝子を、N末端His6−MBPまたはHis6融合タンパク質として、pET系発現ベクターにクローン化した。発現ベクターを、BL21(DE3)E.coli細胞に形質転換し、LBブロス中37℃で成長させた。タンパク質発現について、0.4mM IPTG(イソプロピルβ−D−1チオガラクトピラノシド)でmid−log相中に細胞を誘導し、16℃で一晩インキュベートした。すべての後次ステップを4℃で行った。細胞ペレットを、溶解緩衝液(50mM Tris−HCl pH8、500mM NaCl、1mM TCEP、10mMイミダゾール)、0.5% Triton X−100中に再懸濁し、音波による溶解前に完全プロテアーゼ阻害剤混合物(Roche)を補充した。15000gで40分間の遠心分離によって溶解物を清澄化し、バッチ中のSuperflow Ni−NTAアガロース(Qiagen)に適用した。洗浄緩衝液A(50mM Tris−HCl pH8、500mM NaCl、1mM TCEP、10mMイミダゾール)に続いて、5カラム量の洗浄緩衝液B(50mM Tris−HCl pH8、1M NaCl、1mM TCEP、10mMイミダゾール)で全体的に樹脂を洗浄した。溶出緩衝液(50mM Tris−HCl pH8、500mM NaCl、1mM TCEP、300mMイミダゾール)でNi−NTAからタンパク質を溶出した。洗浄緩衝液Aに対して一晩の透析中に、His6−MBPタグをTEVプロテアーゼによって除去した。切断されたCas9を、第2のNi−NTAアガロースカラムを通して親和性タグから除去した。5mLのヘパリンHiTrapカラム(GE Life Sciences)への適用前に、タンパク質を、IEX緩衝液A(50mM Tris−HCl pH7.5、300mM NaCl、1mM TCEP、5%グリセロール)中に透析した。Cas9を、線形NaCl(0.3〜1.5M)勾配にわたって溶出した。分画をプールし、30kDaスピン濃縮器(Thermo Fisher)で濃縮した。該当する場合、Cas9を、Superdex 200pgカラム(GE Life Sciences)上でサイズ排除クロマトグラフィを介してさらに精製し、後次切断アッセイのためにIEX緩衝液A中で保存した。酵母発現の場合、AR1−Cas9を、Gal1/10 His6−MBP TEV Ura S.cerevisiae発現ベクター(Addgeneプラスミド#48305)にクローン化した。ベクターをBY4741 URA3株に形質転換し、培養物を培地中30℃で成長させた。約0.6のOD600において、タンパク質発現を2% w/vガラクトースで誘導し、16℃で一晩インキュベートした。タンパク質精製は、上記のように行った。
RNAインビトロ転写及びオリゴヌクレオチド精製
インビトロ転写反応を、T7プロモーター配列を含有する合成DNAテンプレートを使用して、前述のように65行った。すべてのインビトロ転写ガイドRNA及び標的RNAまたはDNAを、変性PAGEを介して精製した。二本鎖標的RNA及びDNAを、95℃で1分間のインキュベーションによって20mM Tris HCl pH7.5及び100mM NaCl中でハイブリダイズし、続いて室温までゆっくり冷却した。天然のPAGEによってハイブリッドを精製した。
インビトロ切断アッセイ
37℃で30分間、1×PNK緩衝液中でT4ポリヌクレオチドキナーゼ(NEB)及び[γ−32P]ATP(Perkin−Elmer)を使用して、精製したDNA及びRNAオリゴヌクレオチドを放射線標識した。PNKを65℃で20分間にわたって熱不活性化し、illustra Microspin G−25カラム(GE Life Sciences)を使用して、遊離ATPを標識化反応から除去した。crRNA及びtracrRNAを、1×リフォールディング緩衝液(50mM Tris HCl pH7.5、300mM NaCl、1mM TCEP、5%グリセロール)中に等モル量で混合し、70℃で5分間インキュベートした後、室温までゆっくり冷却した。反応液を1mM最終金属濃度まで補充し、続いて50℃で5分間加熱した。室温までゆっくり冷却した後、リフォールドしたガイドを氷上に置いた。緩衝液、塩濃度について記載されない限り、Cas9は、37℃で10分間、1×切断緩衝液(50mM Tris HCl pH7.5、300mM NaCl、1mM TCEP、5%グリセロール、5mM二価金属)中で等モル量のガイドを用いて再構成した。切断反応は、37℃または指示された温度で放射線標識された標的上で10x過剰のCas9−ガイド複合体を用いて1×切断緩衝液中で行った。50mM EDTAを補充した等量のゲル負荷緩衝液中で反応をクエンチした。切断産生物を10%変性PAGE上で溶解し、phosphorimagingによって可視化した。
インビボE.coli干渉アッセイ
AR1−及びAR4−Cas9についてのE.coli形質転換アッセイを、以前に公開されたように行った。簡潔に言うと、ガイドRNAで形質転換されたE.coliを、エレクトロコンピテントにした。次いで、細胞を、野生型または触媒能がないCas9(dCas9)をコードする9fmolのプラスミドで形質転換した。回収された細胞の段階希釈を、選択的抗生物質と共にLBプレート上に播種した。37℃で16時間後にコロニーをカウントした。
表1.CRISPR−Cas系が同定された生物及びゲノム位置に関する詳細、ならびに再構成されたスペーサーの数及び平均長さ、及び反復長さ(NA、入手付加)。16試料からARMAN−1スペーサーを再構成した。
本発明を、その特定の実施形態を参照して説明してきたが、当業者は、本発明の真の主旨及び範囲から逸脱することなく、様々な変更が行われてもよく、均等物が置き換えられてもよいことを理解されたい。また、特定の状態、材料、物質の組成、プロセス、単数または複数のプロセスステップを、本発明の目的、主旨、及び範囲に適応させるために、多くの修正が行われてもよい。すべての係る修正は、本明細書に添付される特許請求の範囲内となるように意図されている。
相互参照
本出願は、2016年9月30日出願の米国仮特許出願第62/402,846号の利益を主張するものであり、この出願は、その全体が参照により本明細書に組み込まれる。
テキストファイルとして提供された配列表の参照による組み込み
配列表は、2017年9月28日に作成された135KBのサイズを有するテキストファイル「BERK−342WO_SeqList_ST25.txt」として本明細書と共に提供される。このテキストファイルの内容は、それらの全体が参照により本明細書に組み込まれる。

Claims (131)

  1. a)CasXポリペプチド、または前記CasXポリペプチドをコードする核酸分子と、
    b)CasXガイドRNA、または前記CasXガイドRNAをコードする1つ以上のDNA分子と
    を含む、組成物。
  2. 前記CasXポリペプチドが、配列番号1または配列番号2または配列番号3に記載されるアミノ酸配列に対して50%以上の同一性を有するアミノ酸配列を含む、請求項1に記載の組成物。
  3. 前記CasXガイドRNAが、単一ガイドRNAである、請求項1または請求項2に記載の組成物。
  4. 前記CasXガイドRNAが、二重ガイドRNAである、請求項1または請求項2に記載の組成物。
  5. 脂質を含む、請求項1〜4のいずれか1項に記載の組成物。
  6. a)及びb)が、リポソーム内にある、請求項1〜4のいずれか1項に記載の組成物。
  7. a)及びb)が、粒子内にある、請求項1〜4のいずれか1項に記載の組成物。
  8. 緩衝剤、ヌクレアーゼ阻害剤、及びプロテアーゼ阻害剤のうちの1つ以上を含む、請求項1〜7のいずれか1項に記載の組成物。
  9. 前記CasXポリペプチドが、配列番号1または配列番号2または配列番号3に記載されるアミノ酸配列に対して85%以上の同一性を有するアミノ酸配列を含む、請求項1〜8のいずれか1項に記載の組成物。
  10. 前記CasXポリペプチドが、二本鎖標的核酸分子の一方の鎖のみを切断することができるニッカーゼである、請求項1〜9のいずれか1項に記載の組成物。
  11. 前記CasXポリペプチドが、触媒能がないCasXポリペプチド(dCasX)である、請求項1〜9のいずれか1項に記載の組成物。
  12. 前記CasXポリペプチドが、配列番号1のD672、E769、及びD935から選択されるものに対応する位置に1つ以上の突然変異を含む、請求項10または請求項11に記載の組成物。
  13. DNAドナーテンプレートをさらに含む、請求項1〜12のいずれか1項に記載の組成物。
  14. a)標的核酸にハイブリダイズするガイド配列、及び二重鎖形成セグメントを含む標的化因子配列と、
    b)前記標的化因子配列の前記二重鎖形成セグメントとハイブリダイズしてCasXポリペプチドに結合し得る二本鎖RNA(dsRNA)二本鎖を形成する活性化因子配列と
    を含む、CasX単一ガイドRNA分子。
  15. 前記ガイド配列が、19〜30ヌクレオチドの長さを有する、請求項14に記載のCasX単一ガイドRNA分子。
  16. 請求項14または請求項15に記載のCasX単一ガイドRNA分子をコードするヌクレオチド配列を含む、DNA分子。
  17. 前記CasX単一ガイドRNAをコードする前記ヌクレオチド配列が、プロモーターに動作可能に連結されている、請求項16に記載のDNA分子。
  18. 前記プロモーターが、真核細胞中で機能的である、請求項17に記載のDNA分子。
  19. 前記プロモーターが、植物細胞、真菌細胞、動物細胞、無脊椎動物の細胞、ハエ細胞、脊椎動物の細胞、哺乳動物細胞、霊長類細胞、非ヒト霊長類細胞、及びヒト細胞のうちの1つ以上において機能的である、請求項18に記載のDNA分子。
  20. 前記プロモーターが、構成的プロモーター、誘導性プロモーター、細胞型特異的プロモーター、及び組織特異的プロモーターのうちの1つ以上である、請求項17〜19のいずれか1項に記載のDNA分子。
  21. 組み換え発現ベクターである、請求項16〜20のいずれか1項に記載のDNA分子。
  22. 前記組み換え発現ベクターが、組み換えアデノ関連ウイルスベクター、組み換えレトロウイルスベクター、または組み換えレンチウイルスベクターである、請求項21に記載のDNA分子。
  23. 前記プロモーターが、原核細胞中で機能的である、請求項17に記載のDNA分子。
  24. 異種ポリペプチドに融合されたCasXポリペプチドを含む、CasX融合ポリペプチド。
  25. 前記CasXポリペプチドが、配列番号1または配列番号2または配列番号3に記載されるアミノ酸配列に対して50%以上の同一性を有するアミノ酸配列を含む、請求項24に記載のCasX融合ポリペプチド。
  26. 前記CasXポリペプチドが、配列番号1または配列番号2または配列番号3に記載されるアミノ酸配列に対して85%以上の同一性を有するアミノ酸配列を含む、請求項24に記載のCasX融合ポリペプチド。
  27. 前記CasXポリペプチドが、二本鎖標的核酸分子の一方の鎖のみを切断することができるニッカーゼである、請求項24〜26のいずれか1項に記載のCasX融合ポリペプチド。
  28. 前記CasXポリペプチドが、触媒能がないCasXポリペプチド(dCasX)である、請求項24〜27のいずれか1項に記載のCasX融合ポリペプチド。
  29. 前記CasXポリペプチドが、配列番号1のD672、E769、及びD935から選択されるものに対応する位置に1つ以上の突然変異を含む、請求項27または請求項28に記載のCasX融合ポリペプチド。
  30. 前記異種ポリペプチドが、前記CasXポリペプチドのN末端及び/またはC末端に融合される、請求項24〜29のいずれか1項に記載のCasX融合ポリペプチド。
  31. NLSを含む、請求項24〜30のいずれか1項に記載のCasX融合ポリペプチド。
  32. 前記異種ポリペプチドが、標的細胞または標的細胞型上の細胞表面部分への結合をもたらす標的化ポリペプチドである、請求項24〜31のいずれか1項に記載のCasX融合ポリペプチド。
  33. 前記異種ポリペプチドが、標的DNAを修飾する酵素活性を呈する、請求項24〜31のいずれか1項に記載のCasX融合ポリペプチド。
  34. 前記異種ポリペプチドが、ヌクレアーゼ活性、メチルトランスフェラーゼ活性、デメチラーゼ活性、DNA修復活性、DNA損傷活性、脱アミノ化活性、ジスムターゼ活性、アルキル化活性、脱プリン化活性、酸化活性、ピリミジン二量体形成活性、インテグラーゼ活性、トランスポザーゼ活性、リコンビナーゼ活性、ポリメラーゼ活性、リガーゼ活性、ヘリカーゼ活性、フォトリアーゼ活性、及びグリコシラーゼ活性から選択される1つ以上の酵素活性を呈する、請求項33に記載のCasX融合ポリペプチド。
  35. 前記異種ポリペプチドが、ヌクレアーゼ活性、メチルトランスフェラーゼ活性、デメチラーゼ活性、脱アミノ化活性、脱プリン化活性、インテグラーゼ活性、トランスポザーゼ活性、及びリコンビナーゼ活性から選択される1つ以上の酵素活性を呈する、請求項34に記載のCasX融合ポリペプチド。
  36. 前記異種ポリペプチドが、標的核酸に関連した標的ポリペプチドを修飾する酵素活性を呈する、請求項24〜31のいずれか1項に記載のCasX融合ポリペプチド。
  37. 前記異種ポリペプチドが、ヒストン修飾活性を呈する、請求項36に記載のCasX融合ポリペプチド。
  38. 前記異種ポリペプチドが、メチルトランスフェラーゼ活性、デメチラーゼ活性、アセチルトランスフェラーゼ活性、デアセチラーゼ活性、キナーゼ活性、ホスファターゼ活性、ユビキチンリガーゼ活性、脱ユビキチン化活性、アデニル化活性、脱アデニル化活性、SUMO化活性、脱SUMO化活性、リボシル化活性、脱リボシル化活性、ミリストイル化活性、脱ミリストイル化活性、グリコシル化活性(例えば、O−GlcNAcトランスフェラーゼからの)、及び脱グリコシル化活性から選択される1つ以上の酵素活性を呈する、請求項36または請求項37に記載のCasX融合ポリペプチド。
  39. 前記異種ポリペプチドが、メチルトランスフェラーゼ活性、デメチラーゼ活性、アセチルトランスフェラーゼ活性、及びデアセチラーゼ活性から選択される1つ以上の酵素活性を呈する、請求項38に記載のCasX融合ポリペプチド。
  40. 前記異種ポリペプチドが、エンドソーム脱出ポリペプチドである、請求項24〜31のいずれか1項に記載のCasX融合ポリペプチド。
  41. 前記エンドソーム脱出ポリペプチドが、GLFXALLXLLXSLWXLLLXA(配列番号94)及びGLFHALLHLLHSLWHLLLHA(配列番号95)から選択されるアミノ酸配列を含み、各Xが、独立して、リジン、ヒスチジン、及びアルギニンから選択される、請求項40に記載のCasX融合ポリペプチド。
  42. 前記異種ポリペプチドが、葉緑体移行ペプチドである、請求項24〜31のいずれか1項に記載のCasX融合ポリペプチド。
  43. 前記葉緑体移行ペプチドが、MASMISSSAVTTVSRASRGQSAAMAPFGGLKSMTGFPVRKVNTDITSITSNGGRVKCMQVWPPIGKKKFETLSYLPPLTRDSRA(配列番号83)、MASMISSSAVTTVSRASRGQSAAMAPFGGLKSMTGFPVRKVNTDITSITSNGGRVKS(配列番号84)、MASSMLSSATMVASPAQATMVAPFNGLKSSAAFPATRKANNDITSITSNGGRVNCMQVWPPIEKKKFETLSYLPDLTDSGGRVNC(配列番号85)、MAQVSRICNGVQNPSLISNLSKSSQRKSPLSVSLKTQQHPRAYPISSSWGLKKSGMTLIGSELRPLKVMSSVSTAC(配列番号86)、MAQVSRICNGVWNPSLISNLSKSSQRKSPLSVSLKTQQHPRAYPISSSWGLKKSGMTLIGSELRPLKVMSSVSTAC(配列番号87)、MAQINNMAQGIQTLNPNSNFHKPQVPKSSSFLVFGSKKLKNSANSMLVLKKDSIFMQLFCSFRISASVATAC(配列番号88)、MAALVTSQLATSGTVLSVTDRFRRPGFQGLRPRNPADAALGMRTVGASAAPKQSRKPHRFDRRCLSMVV(配列番号89)、MAALTTSQLATSATGFGIADRSAPSSLLRHGFQGLKPRSPAGGDATSLSVTTSARATPKQQRSVQRGSRRFPSVVVC(配列番号90)、MASSVLSSAAVATRSNVAQANMVAPFTGLKSAASFPVSRKQNLDITSIASNGGRVQC(配列番号91)、MESLAATSVFAPSRVAVPAARALVRAGTVVPTRRTSSTSGTSGVKCSAAVTPQASPVISRSAAAA(配列番号92)、及びMGAAATSMQSLKFSNRLVPPSRRLSPVPNNVTCNNLPKSAAPVRTVKCCASSWNSTINGAAATTNGASAASS(配列番号93)から選択されるアミノ酸配列を含む、請求項42に記載のCasX融合ポリペプチド。
  44. 前記異種ポリペプチドが、転写を増加または減少させるタンパク質である、請求項24〜31のいずれか1項に記載のCasX融合ポリペプチド。
  45. 前記異種ポリペプチドが、転写抑制因子ドメインである、請求項44に記載のCasX融合ポリペプチド。
  46. 前記異種ポリペプチドが、転写活性化ドメインである、請求項44に記載のCasX融合ポリペプチド。
  47. 前記異種ポリペプチドが、タンパク質結合ドメインである、請求項24〜31のいずれか1項に記載のCasX融合ポリペプチド。
  48. 請求項24〜47のいずれか1項に記載のCasX融合ポリペプチドをコードする、核酸分子。
  49. 前記CasX融合ポリペプチドをコードするヌクレオチド配列が、プロモーターに動作可能に連結されている、請求項48に記載の核酸分子。
  50. 前記プロモーターが、真核細胞中で機能的である、請求項49に記載の核酸分子。
  51. 前記プロモーターが、植物細胞、真菌細胞、動物細胞、無脊椎動物の細胞、ハエ細胞、脊椎動物の細胞、哺乳動物細胞、霊長類細胞、非ヒト霊長類細胞、及びヒト細胞のうちの1つ以上において機能的である、請求項50に記載の核酸分子。
  52. 前記プロモーターが、構成的プロモーター、誘導性プロモーター、細胞型特異的プロモーター、及び組織特異的プロモーターのうちの1つ以上である、請求項49〜51のいずれか1項に記載の核酸分子。
  53. DNA分子が、組み換え発現ベクターである、請求項48〜52のいずれか1項に記載の核酸分子。
  54. 前記組み換え発現ベクターが、組み換えアデノ関連ウイルスベクター、組み換えレトロウイルスベクター、または組み換えレンチウイルスベクターである、請求項53に記載の核酸分子。
  55. 前記プロモーターが、原核細胞中で機能的である、請求項49に記載の核酸分子。
  56. mRNAである、請求項48に記載の核酸分子。
  57. (a)活性化因子RNA及び標的化因子RNAを含むCasXガイドRNAと、
    (b)CasXポリペプチドと
    を含む、1つ以上の核酸分子。
  58. 前記CasXポリペプチドが、配列番号1または配列番号2または配列番号3に記載されるアミノ酸配列に対して50%以上の同一性を有するアミノ酸配列を含む、請求項57に記載の1つ以上の核酸分子。
  59. 前記CasXポリペプチドが、配列番号1または配列番号2または配列番号3に記載されるアミノ酸配列に対して85%以上の同一性を有するアミノ酸配列を含む、請求項57に記載の1つ以上の核酸分子。
  60. 前記CasXガイドRNAが、単一ガイドRNAである、請求項57〜59のいずれか1項に記載の1つ以上の核酸分子。
  61. 前記CasXガイドRNAが、二重ガイドRNAである、請求項57〜59のいずれか1項に記載の1つ以上の核酸分子。
  62. 前記活性化因子をコードする第1のヌクレオチド配列と、前記標的化因子をコードする第2のヌクレオチド配列とを含み、前記第1及び第2のヌクレオチド配列が、異なるDNA分子上に存在する、請求項61に記載の1つ以上の核酸分子。
  63. プロモーターに動作可能に連結された前記CasXポリペプチドをコードするヌクレオチド配列を含む、請求項57〜62のいずれか1項に記載の1つ以上の核酸分子。
  64. 前記プロモーターが、真核細胞中で機能的である、請求項63に記載の1つ以上の核酸分子。
  65. 前記プロモーターが、植物細胞、真菌細胞、動物細胞、無脊椎動物の細胞、ハエ細胞、脊椎動物の細胞、哺乳動物細胞、霊長類細胞、非ヒト霊長類細胞、及びヒト細胞のうちの1つ以上において機能的である、請求項64に記載の1つ以上の核酸分子。
  66. 前記プロモーターが、構成的プロモーター、誘導性プロモーター、細胞型特異的プロモーター、及び組織特異的プロモーターのうちの1つ以上である、請求項63〜65のいずれか1項に記載の1つ以上の核酸分子。
  67. 1つ以上の組み換え発現ベクターである、請求項57〜66のいずれか1項に記載の1つ以上の核酸分子。
  68. 前記1つ以上の組み換え発現ベクターが、1つ以上の組み換えアデノ関連ウイルスベクター、1つ以上の組み換えレトロウイルスベクター、または1つ以上の組み換えレンチウイルスベクターから選択される、請求項67に記載の1つ以上の核酸分子。
  69. 前記プロモーターが、原核細胞中で機能的である、請求項63に記載の1つ以上の核酸分子。
  70. a)Casxポリペプチド、または前記Casxポリペプチドをコードする核酸分子、
    b)CasX融合ポリペプチド、または前記CasX融合ポリペプチドをコードする核酸分子、及び
    c)CasXガイドRNA、または前記CasXガイドRNAをコードする核酸分子のうちの1つ以上を含む、真核細胞。
  71. 前記Casxポリペプチドをコードする前記核酸分子を含み、前記核酸分子が、前記真核細胞のゲノムDNAに統合されている、請求項70に記載の真核細胞。
  72. 植物細胞、哺乳動物細胞、昆虫細胞、クモ形網動物細胞、真菌細胞、鳥類細胞、爬虫類細胞、両生類細胞、無脊椎動物細胞、マウス細胞、ラット細胞、霊長類細胞、非ヒト霊長類細胞、またはヒト細胞である、請求項70または請求項71に記載の真核細胞。
  73. CasX融合ポリペプチド、または前記CasX融合ポリペプチドをコードする核酸分子を含む、細胞。
  74. 原核細胞である、請求項73に記載の細胞。
  75. 前記CasX融合ポリペプチドをコードする前記核酸分子を含み、前記核酸分子が、前記細胞のゲノムDNAに統合されている、請求項73または請求項74に記載の細胞。
  76. 標的核酸を修飾する方法であって、
    前記標的核酸を、
    a)CasXポリペプチド、及び
    b)前記標的核酸の標的配列にハイブリダイズするガイド配列を含むCasXガイドRNAと接触させることを含み、
    前記接触させることが、前記CasXポリペプチドによる前記標的核酸の修飾をもたらす、方法。
  77. 前記修飾が、前記標的核酸の切断である、請求項76に記載の方法。
  78. 前記標的核酸が、二本鎖DNA、一本鎖DNA、RNA、ゲノムDNA、及び染色体外DNAから選択される、請求項76または請求項77に記載の方法。
  79. 前記接触させることが、細胞の外側でインビトロで行われる、請求項76〜78のいずれか1項に記載の方法。
  80. 前記接触させることが、培養中の細胞の内側で行われる、請求項76〜78のいずれか1項に記載の方法。
  81. 前記接触させることが、細胞の内側でインビボで行われる、請求項76〜78のいずれか1項に記載の方法。
  82. 前記細胞が、真核細胞である、請求項80または請求項81に記載の方法。
  83. 前記細胞が、植物細胞、真菌細胞、哺乳動物細胞、爬虫類細胞、昆虫細胞、鳥類細胞、魚類細胞、寄生虫細胞、節足動物細胞、無脊椎動物の細胞、脊椎動物の細胞、齧歯類細胞、マウス細胞、ラット細胞、霊長類細胞、非ヒト霊長類細胞、及びヒト細胞から選択される、請求項82に記載の方法。
  84. 前記細胞が、原核細胞である、請求項80または請求項81に記載の方法。
  85. 前記接触させることが、ゲノム編集をもたらす、請求項76〜84のいずれか1項に記載の方法。
  86. 前記接触させることが、細胞中に、(a)前記CasXポリペプチド、または前記CasXポリペプチドをコードする核酸分子、及び(b)前記CasxガイドRNA、または前記CasXガイドRNAをコードする核酸分子を導入することを含む、請求項76〜85のいずれか1項に記載の方法。
  87. 前記接触させることが、前記細胞中にDNAドナーテンプレートを導入することをさらに含む、請求項86に記載の方法。
  88. 前記CasXガイドRNAが、単一ガイドRNAである、請求項76〜87のいずれか1項に記載の方法。
  89. 前記CasXガイドRNAが、二重ガイドRNAである、請求項76〜87のいずれか1項に記載の方法。
  90. 標的DNAからの転写を変調するか、標的核酸を修飾するか、または標的核酸に関連したタンパク質を修飾する方法であって、
    前記標的核酸を、
    a)異種ポリペプチドに融合されたCasXポリペプチドを含む、CasX融合ポリペプチド、及び
    b)前記標的核酸の標的配列にハイブリダイズするガイド配列を含むCasXガイドRNAと接触させることを含む、方法。
  91. 前記CasXガイドRNAが、単一ガイドRNAである、請求項90に記載の方法。
  92. 前記CasXガイドRNAが、二重ガイドRNAである、請求項90に記載の方法。
  93. 前記修飾が、前記標的核酸の切断ではない、請求項90〜92のいずれか1項に記載の方法。
  94. 前記標的核酸が、二本鎖DNA、一本鎖DNA、RNA、ゲノムDNA、及び染色体外DNAから選択される、請求項90〜93のいずれか1項に記載の方法。
  95. 前記接触させることが、細胞の外側でインビトロで行われる、請求項90〜94のいずれか1項に記載の方法。
  96. 前記接触させることが、培養中の細胞の内側で行われる、請求項90〜94のいずれか1項に記載の方法。
  97. 前記接触させることが、細胞の内側でインビボで行われる、請求項90〜94のいずれか1項に記載の方法。
  98. 前記細胞が、真核細胞である、請求項96または請求項97に記載の方法。
  99. 前記細胞が、植物細胞、真菌細胞、哺乳動物細胞、爬虫類細胞、昆虫細胞、鳥類細胞、魚類細胞、寄生虫細胞、節足動物細胞、無脊椎動物の細胞、脊椎動物の細胞、齧歯類細胞、マウス細胞、ラット細胞、霊長類細胞、非ヒト霊長類細胞、及びヒト細胞から選択される、請求項98に記載の方法。
  100. 前記細胞が、原核細胞である、請求項96または請求項97に記載の方法。
  101. 前記接触させることが、細胞中に、(a)前記CasX融合ポリペプチド、または前記CasX融合ポリペプチドをコードする核酸分子、及び(b)前記CasxガイドRNA、または前記CasXガイドRNAをコードする核酸分子を導入することを含む、請求項90〜100のいずれか1項に記載の方法。
  102. 前記CasXポリペプチドが、触媒能がないCasXポリペプチド(dCasX)である、請求項90〜101のいずれか1項に記載の方法。
  103. 前記CasXポリペプチドが、配列番号1のD672、E769、及びD935から選択されるものに対応する位置に1つ以上の突然変異を含む、請求項90〜102のいずれか1項に記載の方法。
  104. 前記異種ポリペプチドが、標的DNAを修飾する酵素活性を呈する、請求項90〜103のいずれか1項に記載の方法。
  105. 前記異種ポリペプチドが、ヌクレアーゼ活性、メチルトランスフェラーゼ活性、デメチラーゼ活性、DNA修復活性、DNA損傷活性、脱アミノ化活性、ジスムターゼ活性、アルキル化活性、脱プリン化活性、酸化活性、ピリミジン二量体形成活性、インテグラーゼ活性、トランスポザーゼ活性、リコンビナーゼ活性、ポリメラーゼ活性、リガーゼ活性、ヘリカーゼ活性、フォトリアーゼ活性、及びグリコシラーゼ活性から選択される1つ以上の酵素活性を呈する、請求項104に記載の方法。
  106. 前記異種ポリペプチドが、ヌクレアーゼ活性、メチルトランスフェラーゼ活性、デメチラーゼ活性、脱アミノ化活性、脱プリン化活性、インテグラーゼ活性、トランスポザーゼ活性、及びリコンビナーゼ活性から選択される1つ以上の酵素活性を呈する、請求項105に記載の方法。
  107. 前記異種ポリペプチドが、標的核酸に関連した標的ポリペプチドを修飾する酵素活性を呈する、請求項90〜103のいずれか1項に記載の方法。
  108. 前記異種ポリペプチドが、ヒストン修飾活性を呈する、請求項107に記載の方法。
  109. 前記異種ポリペプチドが、メチルトランスフェラーゼ活性、デメチラーゼ活性、アセチルトランスフェラーゼ活性、デアセチラーゼ活性、キナーゼ活性、ホスファターゼ活性、ユビキチンリガーゼ活性、脱ユビキチン化活性、アデニル化活性、脱アデニル化活性、SUMO化活性、脱SUMO化活性、リボシル化活性、脱リボシル化活性、ミリストイル化活性、脱ミリストイル化活性、グリコシル化活性(例えば、O−GlcNAcトランスフェラーゼからの)、及び脱グリコシル化活性から選択される1つ以上の酵素活性を呈する、請求項107または請求項108に記載の方法。
  110. 前記異種ポリペプチドが、メチルトランスフェラーゼ活性、デメチラーゼ活性、アセチルトランスフェラーゼ活性、及びデアセチラーゼ活性から選択される1つ以上の酵素活性を呈する、請求項109に記載の方法。
  111. 前記異種ポリペプチドが、転写を増加または減少させるタンパク質である、請求項90〜103のいずれか1項に記載の方法。
  112. 前記異種ポリペプチドが、転写抑制因子ドメインである、請求項111に記載の方法。
  113. 前記異種ポリペプチドが、転写活性化ドメインである、請求項111に記載の方法。
  114. 前記異種ポリペプチドが、タンパク質結合ドメインである、請求項90〜103のいずれか1項に記載の方法。
  115. 遺伝子導入の多細胞非ヒト生物であって、
    それらのゲノムが、
    a)CasXポリペプチド、
    b)CasX融合ポリペプチド、及び
    c)CasXガイドRNAのうちの1つ以上をコードするヌクレオチド配列を含む導入遺伝子を含む、遺伝子導入の多細胞非ヒト生物。
  116. 前記CasXポリペプチドが、配列番号1または配列番号2または配列番号3に記載されるアミノ酸配列に対して50%以上のアミノ酸配列同一性を有するアミノ酸配列を含む、請求項115に記載の遺伝子導入の多細胞非ヒト生物。
  117. 前記CasXポリペプチドが、配列番号1または配列番号2または配列番号3に記載されるアミノ酸配列に対して85%以上のアミノ酸配列同一性を有するアミノ酸配列を含む、請求項115に記載の遺伝子導入の多細胞非ヒト生物。
  118. 植物、単子葉植物、双子葉植物、無脊椎動物、昆虫、節足動物、クモ形網動物、寄生虫、蠕虫、刺胞動物、脊椎動物、魚、爬虫類、両生類、有蹄類、鳥、ブタ、ウマ、ヒツジ、齧歯類、マウス、ラット、または非ヒト霊長類である、請求項115〜117のいずれか1項に記載の遺伝子導入の多細胞非ヒト生物。
  119. a)CasXポリペプチド及びCasX単一ガイドRNAと、
    b)CasXポリペプチド、CasXガイドRNA、及びDNAドナーテンプレートと、
    c)CasX融合ポリペプチド及びCasXガイドRNAと、
    d)CasX融合ポリペプチド、CasXガイドRNA、及びDNAドナーテンプレートと、
    e)CasXポリペプチドをコードするmRNA、及びCasX単一ガイドRNAと、
    f)CasXポリペプチドをコードするmRNA、CasXガイドRNA、及びDNAドナーテンプレートと、
    g)CasX融合ポリペプチドをコードするmRNA、及びCasXガイドRNAと、
    h)CasX融合ポリペプチドをコードするmRNA、CasXガイドRNA、及びDNAドナーテンプレートと、
    i)i)CasXポリペプチドをコードするヌクレオチド配列、及びii)CasXガイドRNAをコードするヌクレオチド配列を含む、1つ以上の組み換え発現ベクターと、
    j)i)CasXポリペプチドをコードするヌクレオチド配列、ii)CasXガイドRNAをコードするヌクレオチド配列、及びiii)DNAドナーテンプレートを含む、1つ以上の組み換え発現ベクターと、
    k)i)CasX融合ポリペプチドをコードするヌクレオチド配列、及びii)CasXガイドRNAをコードするヌクレオチド配列を含む、1つ以上の組み換え発現ベクターと、
    l)i)CasX融合ポリペプチドをコードするヌクレオチド配列、ii)CasXガイドRNAをコードするヌクレオチド配列、及びDNAドナーテンプレートを含む、1つ以上の組み換え発現ベクターと
    を含む、CasX系。
  120. 前記CasXポリペプチドが、配列番号1または配列番号2または配列番号3に記載されるアミノ酸配列に対して50%以上のアミノ酸配列同一性を有するアミノ酸配列を含む、請求項119に記載のCasX系。
  121. 前記CasXポリペプチドが、配列番号1または配列番号2または配列番号3に記載されるアミノ酸配列に対して85%以上のアミノ酸配列同一性を有するアミノ酸配列を含む、請求項119に記載のCasX系。
  122. 前記ドナーテンプレート核酸が、8ヌクレオチド〜1000ヌクレオチドの長さを有する、請求項119〜121のいずれか1項に記載のCasX系。
  123. 前記ドナーテンプレート核酸が、25ヌクレオチド〜500ヌクレオチドの長さを有する、請求項119〜121のいずれか1項に記載のCasX系。
  124. 請求項119〜123のいずれか1項に記載のCasX系を含む、キット。
  125. 前記キットの構成要素が、同じ容器内にある、請求項124に記載のキット。
  126. 前記キットの構成要素が、別個の容器内にある、請求項124に記載のキット。
  127. 請求項119〜126のいずれか1項に記載のCasX系を含む、無菌容器。
  128. シリンジである、請求項127に記載の無菌容器。
  129. 請求項119〜126のいずれか1項に記載のCasX系を含む、埋め込み可能なデバイス。
  130. 前記CasX系が、マトリックス内にある、請求項129に記載の埋め込み可能なデバイス。
  131. 前記CasX系が、貯蔵器内にある、請求項129に記載の埋め込み可能なデバイス。
JP2019517305A 2016-09-30 2017-09-28 Rna誘導型核酸修飾酵素及びその使用方法 Pending JP2019532644A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022199477A JP2023027277A (ja) 2016-09-30 2022-12-14 Rna誘導型核酸修飾酵素及びその使用方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662402846P 2016-09-30 2016-09-30
US62/402,846 2016-09-30
PCT/US2017/054081 WO2018064371A1 (en) 2016-09-30 2017-09-28 Rna-guided nucleic acid modifying enzymes and methods of use thereof

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2022199477A Division JP2023027277A (ja) 2016-09-30 2022-12-14 Rna誘導型核酸修飾酵素及びその使用方法

Publications (2)

Publication Number Publication Date
JP2019532644A true JP2019532644A (ja) 2019-11-14
JP2019532644A5 JP2019532644A5 (ja) 2020-11-12

Family

ID=61760962

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2019517305A Pending JP2019532644A (ja) 2016-09-30 2017-09-28 Rna誘導型核酸修飾酵素及びその使用方法
JP2022199477A Pending JP2023027277A (ja) 2016-09-30 2022-12-14 Rna誘導型核酸修飾酵素及びその使用方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2022199477A Pending JP2023027277A (ja) 2016-09-30 2022-12-14 Rna誘導型核酸修飾酵素及びその使用方法

Country Status (13)

Country Link
US (4) US11873504B2 (ja)
EP (1) EP3523426A4 (ja)
JP (2) JP2019532644A (ja)
KR (2) KR20230170126A (ja)
CN (1) CN110023494A (ja)
AU (1) AU2017335890B2 (ja)
BR (1) BR112019006384A2 (ja)
CA (1) CA3038960A1 (ja)
EA (1) EA201990861A1 (ja)
GB (1) GB2569733B (ja)
IL (1) IL265598A (ja)
MX (1) MX2019003674A (ja)
WO (1) WO2018064371A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021182474A1 (ja) * 2020-03-12 2021-09-16 株式会社Frest オリゴヌクレオチド及び標的rnaの部位特異的編集方法

Families Citing this family (84)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2734621B1 (en) 2011-07-22 2019-09-04 President and Fellows of Harvard College Evaluation and improvement of nuclease cleavage specificity
US9163284B2 (en) 2013-08-09 2015-10-20 President And Fellows Of Harvard College Methods for identifying a target site of a Cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9388430B2 (en) 2013-09-06 2016-07-12 President And Fellows Of Harvard College Cas9-recombinase fusion proteins and uses thereof
US9340800B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College Extended DNA-sensing GRNAS
US9526784B2 (en) 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
US11053481B2 (en) 2013-12-12 2021-07-06 President And Fellows Of Harvard College Fusions of Cas9 domains and nucleic acid-editing domains
EP3177718B1 (en) 2014-07-30 2022-03-16 President and Fellows of Harvard College Cas9 proteins including ligand-dependent inteins
US11680268B2 (en) 2014-11-07 2023-06-20 Editas Medicine, Inc. Methods for improving CRISPR/Cas-mediated genome-editing
EP3294896A1 (en) 2015-05-11 2018-03-21 Editas Medicine, Inc. Optimized crispr/cas9 systems and methods for gene editing in stem cells
EP3307887A1 (en) 2015-06-09 2018-04-18 Editas Medicine, Inc. Crispr/cas-related methods and compositions for improving transplantation
CA2999500A1 (en) 2015-09-24 2017-03-30 Editas Medicine, Inc. Use of exonucleases to improve crispr/cas-mediated genome editing
CN108513575A (zh) 2015-10-23 2018-09-07 哈佛大学的校长及成员们 核碱基编辑器及其用途
WO2017165826A1 (en) 2016-03-25 2017-09-28 Editas Medicine, Inc. Genome editing systems comprising repair-modulating enzyme molecules and methods of their use
WO2017180694A1 (en) 2016-04-13 2017-10-19 Editas Medicine, Inc. Cas9 fusion molecules gene editing systems, and methods of use thereof
US10337051B2 (en) 2016-06-16 2019-07-02 The Regents Of The University Of California Methods and compositions for detecting a target RNA
SG11201900907YA (en) 2016-08-03 2019-02-27 Harvard College Adenosine nucleobase editors and uses thereof
US11661590B2 (en) 2016-08-09 2023-05-30 President And Fellows Of Harvard College Programmable CAS9-recombinase fusion proteins and uses thereof
WO2018039438A1 (en) 2016-08-24 2018-03-01 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
WO2018064352A1 (en) 2016-09-30 2018-04-05 The Regents Of The University Of California Rna-guided nucleic acid modifying enzymes and methods of use thereof
AU2017335890B2 (en) 2016-09-30 2024-05-09 The Regents Of The University Of California RNA-guided nucleic acid modifying enzymes and methods of use thereof
CA3039928A1 (en) 2016-10-14 2018-04-19 President And Fellows Of Harvard College Aav delivery of nucleobase editors
US10745677B2 (en) 2016-12-23 2020-08-18 President And Fellows Of Harvard College Editing of CCR5 receptor gene to protect against HIV infection
WO2018136396A2 (en) * 2017-01-18 2018-07-26 Excision Biotherapeutics, Inc. Crisprs
US20190367924A1 (en) * 2017-02-17 2019-12-05 Temple University - Of The Commonwealth System Of Higher Education Gene editing therapy for hiv infection via dual targeting of hiv genome and ccr5
EP3592853A1 (en) 2017-03-09 2020-01-15 President and Fellows of Harvard College Suppression of pain by gene editing
CN110914310A (zh) 2017-03-10 2020-03-24 哈佛大学的校长及成员们 胞嘧啶至鸟嘌呤碱基编辑器
WO2018176009A1 (en) 2017-03-23 2018-09-27 President And Fellows Of Harvard College Nucleobase editors comprising nucleic acid programmable dna binding proteins
WO2018201086A1 (en) 2017-04-28 2018-11-01 Editas Medicine, Inc. Methods and systems for analyzing guide rna molecules
EP3619305A1 (en) * 2017-05-03 2020-03-11 KWS SAAT SE & Co. KGaA Use of crispr-cas endonucleases for plant genome engineering
WO2018209320A1 (en) 2017-05-12 2018-11-15 President And Fellows Of Harvard College Aptazyme-embedded guide rnas for use with crispr-cas9 in genome editing and transcriptional activation
CN110997908A (zh) 2017-06-09 2020-04-10 爱迪塔斯医药公司 工程化的cas9核酸酶
WO2019014564A1 (en) 2017-07-14 2019-01-17 Editas Medicine, Inc. SYSTEMS AND METHODS OF TARGETED INTEGRATION AND GENOME EDITING AND DETECTION THEREOF WITH INTEGRATED PRIMING SITES
CN111801345A (zh) 2017-07-28 2020-10-20 哈佛大学的校长及成员们 使用噬菌体辅助连续进化(pace)的进化碱基编辑器的方法和组合物
EP3676376A2 (en) 2017-08-30 2020-07-08 President and Fellows of Harvard College High efficiency base editors comprising gam
JP2021500036A (ja) 2017-10-16 2021-01-07 ザ ブロード インスティテュート, インコーポレーテッドThe Broad Institute, Inc. アデノシン塩基編集因子の使用
EP3701013A4 (en) * 2017-10-25 2021-08-04 Monsanto Technology LLC TARGETED ENDONUCLEASE ACTIVITY OF RNA-GUIDED ENDONUCLEASE CASX IN EUKARYONTS
AU2018358051A1 (en) 2017-11-01 2020-05-14 The Regents Of The University Of California CasZ compositions and methods of use
WO2019089808A1 (en) 2017-11-01 2019-05-09 The Regents Of The University Of California Class 2 crispr/cas compositions and methods of use
US11661599B1 (en) 2017-12-14 2023-05-30 National Technology & Engineering Solutions Of Sandia, Llc CRISPR-Cas based system for targeting single-stranded sequences
WO2019165168A1 (en) 2018-02-23 2019-08-29 Pioneer Hi-Bred International, Inc. Novel cas9 orthologs
US11807877B1 (en) 2018-03-22 2023-11-07 National Technology & Engineering Solutions Of Sandia, Llc CRISPR/Cas activity assays and compositions thereof
CA3101648A1 (en) 2018-06-07 2019-12-12 Arc Bio, Llc Compositions and methods for making guide nucleic acids
US20190390193A1 (en) * 2018-06-23 2019-12-26 John Lawrence Mee Reversible method for sustainable human cognitive enhancement
WO2020023529A1 (en) * 2018-07-24 2020-01-30 The Regents Of The University Of California Rna-guided nucleic acid modifying enzymes and methods of use thereof
WO2020028729A1 (en) 2018-08-01 2020-02-06 Mammoth Biosciences, Inc. Programmable nuclease compositions and methods of use thereof
WO2020041456A1 (en) * 2018-08-22 2020-02-27 The Regents Of The University Of California Variant type v crispr/cas effector polypeptides and methods of use thereof
EP3894550A4 (en) * 2018-12-14 2023-01-04 Pioneer Hi-Bred International, Inc. NEW CRISPR-CAS SYSTEMS FOR GENOME EDITING
EP3931313A2 (en) 2019-01-04 2022-01-05 Mammoth Biosciences, Inc. Programmable nuclease improvements and compositions and methods for nucleic acid amplification and detection
EP3911741A1 (en) * 2019-01-14 2021-11-24 University of Rochester Targeted nuclear rna cleavage and polyadenylation with crispr-cas
AU2020231380A1 (en) 2019-03-07 2021-09-23 The Regents Of The University Of California CRISPR-Cas effector polypeptides and methods of use thereof
MX2021010938A (es) 2019-03-11 2022-01-06 Sorrento Therapeutics Inc Proceso mejorado para integración de constructos de adn utilizando endonucleasas guiadas por arn.
GB2601617B (en) 2019-03-19 2024-02-21 Broad Inst Inc Methods and compositions for editing nucleotide sequences
CN113923983B (zh) * 2019-04-03 2024-02-27 乔治亚大学研究基金公司 通过细胞外囊泡来递送crispr/mcas9以用于基因组编辑
AU2020289591A1 (en) 2019-06-07 2021-12-23 Scribe Therapeutics Inc. Engineered CasX systems
CN114206376A (zh) * 2019-07-11 2022-03-18 阿伯生物技术公司 新型crispr dna靶向酶及系统
JP2021016370A (ja) * 2019-07-23 2021-02-15 株式会社東芝 核酸導入キャリア、核酸導入キャリアセット、核酸導入組成物及び核酸導入方法
EP4028523A1 (en) * 2019-09-09 2022-07-20 Scribe Therapeutics Inc. Compositions and methods for use in immunotherapy
US20220348925A1 (en) 2019-09-09 2022-11-03 Scribe Therapeutics Inc. Compositions and methods for the targeting of sod1
EP4045643A4 (en) * 2019-10-17 2023-11-08 Pairwise Plants Services, Inc. CAS12A NUCLEASE VARIANTS AND METHODS OF MAKING AND USING THE SAME
CN110669795A (zh) * 2019-10-18 2020-01-10 福州大学 一种在鱼类胚胎中实现精确定点rna剪切的技术
AU2020398658A1 (en) 2019-12-06 2022-07-07 Scribe Therapeutics Inc. Particle delivery systems
CA3159316A1 (en) 2019-12-06 2021-06-10 Benjamin OAKES Compositions and methods for the targeting of rhodopsin
EP4069846A1 (en) 2019-12-07 2022-10-12 Scribe Therapeutics Inc. Compositions and methods for the targeting of htt
CA3158403A1 (en) * 2019-12-23 2021-07-01 Jennifer A. Doudna Crispr-cas effector polypeptides and methods of use thereof
EP4085132A1 (en) * 2019-12-30 2022-11-09 DSM IP Assets B.V. Lipase-modified strain
KR20220125332A (ko) 2020-01-10 2022-09-14 스크라이브 테라퓨틱스 인크. Pcsk9의 표적화를 위한 조성물 및 방법
CA3167684A1 (en) * 2020-01-29 2021-08-05 Jenthera Therapeutics Inc. Nuclease-scaffold composition delivery platform
JP2023515573A (ja) 2020-02-26 2023-04-13 ソレント・セラピューティクス・インコーポレイテッド 普遍的な遮蔽性部分を有する活性化可能な抗原結合性タンパク質
BR112022018673A2 (pt) * 2020-03-18 2022-12-27 Scribe Therapeutics Inc Composições e métodos para o direcionamento de c9orf72
US20230167191A1 (en) 2020-04-24 2023-06-01 Sorrento Therapeutics, Inc. Memory Dimeric Antigen Receptors (mDARs)
BR112022022603A2 (pt) 2020-05-08 2023-01-17 Broad Inst Inc Métodos e composições para edição simultânea de ambas as fitas de sequência alvo de nucleotídeos de fita dupla
BR112023001641A2 (pt) * 2020-07-30 2023-04-04 Adarx Pharmaceuticals Inc Composições de edição dependentes de adar e métodos de uso das mesmas
WO2022103878A1 (en) * 2020-11-11 2022-05-19 Monsanto Technology Llc Methods to improve site-directed integration frequency
WO2022120089A1 (en) * 2020-12-03 2022-06-09 Scribe Therapeutics Inc. Compositions and methods for the targeting of ptbp1
GB2616584A (en) * 2020-12-03 2023-09-13 Scribe Therapeutics Inc Engineered class 2 type V CRISPR systems
IL303498A (en) * 2020-12-09 2023-08-01 Scribe Therapeutics Inc AAV vectors for gene editing
JP2024501383A (ja) 2020-12-22 2024-01-11 クロマ・メディシン,インコーポレーテッド エピジェネティック編集のための組成物および方法
CA3222023A1 (en) 2021-06-01 2022-12-08 Arbor Biotechnologies, Inc. Gene editing systems comprising a crispr nuclease and uses thereof
WO2022261150A2 (en) 2021-06-09 2022-12-15 Scribe Therapeutics Inc. Particle delivery systems
GB2625500A (en) * 2021-09-21 2024-06-19 Scribe Therapeutics Inc Engineered CasX repressor systems
CN113969281B (zh) * 2021-12-24 2022-04-01 汕头大学 经修饰的CrRNA片段及非洲猪瘟病毒试剂盒
US20240301447A1 (en) 2023-02-15 2024-09-12 Arbor Biotechnologies, Inc. Gene editing method for inhibiting aberrant splicing in stathmin 2 (stmn2) transcript
CN116926043B (zh) * 2023-04-28 2024-09-06 新乡医学院第三附属医院 一种dCasX蛋白核酸酶、重组载体及其应用

Family Cites Families (85)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5034506A (en) 1985-03-15 1991-07-23 Anti-Gene Development Group Uncharged morpholino-based polymers having achiral intersubunit linkages
EP1294863B1 (en) 2000-05-24 2009-07-08 Third Wave Technologies, Inc. Detection of rna
US6773885B1 (en) 2000-09-29 2004-08-10 Integrated Dna Technologies, Inc. Compositions and methods for visual ribonuclease detection assays
CN1886512A (zh) 2002-04-23 2006-12-27 斯克里普斯研究所 多肽在叶绿体中的表达以及用于表达多肽的组合物和方法
EP1580273A1 (en) 2004-03-26 2005-09-28 Friedrich-Alexander-Universität Erlangen-Nürnberg Peptide-based method for monitoring gene expression in a host cell
CN101283089A (zh) 2005-10-07 2008-10-08 加利福尼亚大学董事会 修饰细胞色素p450酶的编码核酸和其应用方法
US9689031B2 (en) 2007-07-14 2017-06-27 Ionian Technologies, Inc. Nicking and extension amplification reaction for the exponential amplification of nucleic acids
WO2010075303A1 (en) 2008-12-23 2010-07-01 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services Splicing factors with a puf protein rna-binding domain and a splicing effector domain and uses of same
WO2011100749A2 (en) 2010-02-15 2011-08-18 Cascade Biosystems, Inc. Methods and materials for detecting viral or microbial infections
WO2011156795A2 (en) 2010-06-11 2011-12-15 Pathogenica, Inc. Nucleic acids for multiplex organism detection and methods of use and making the same
WO2012027675A2 (en) 2010-08-26 2012-03-01 Massachusetts Institute Of Technology Poly(beta-amino alcohols), their preparation, and uses thereof
WO2012068627A1 (en) 2010-11-24 2012-05-31 The University Of Western Australia Peptides for the specific binding of rna targets
US9730967B2 (en) * 2011-02-04 2017-08-15 Katherine Rose Kovarik Method and system for treating cancer cachexia
US8815782B2 (en) 2011-11-11 2014-08-26 Agilent Technologies, Inc. Use of DNAzymes for analysis of an RNA sample
CA2873073A1 (en) 2012-04-16 2013-10-24 The University Of Western Australia Peptides for the binding of nucleotide targets
DK3241902T3 (en) 2012-05-25 2018-05-07 Univ California METHODS AND COMPOSITIONS FOR RNA DIRECTIVE TARGET DNA MODIFICATION AND FOR RNA DIRECTIVE MODULATION OF TRANSCRIPTION
DK3138912T3 (en) * 2012-12-06 2019-01-21 Sigma Aldrich Co Llc CRISPR-BASED RE-MODIFICATION AND REGULATION
EP2931899A1 (en) 2012-12-12 2015-10-21 The Broad Institute, Inc. Functional genomics using crispr-cas systems, compositions, methods, knock out libraries and applications thereof
PT2931898E (pt) 2012-12-12 2016-06-16 Harvard College Manipulação e otimização de sistemas, métodos e composições para manipulação de sequências com domínios funcionais
EP2898075B1 (en) 2012-12-12 2016-03-09 The Broad Institute, Inc. Engineering and optimization of improved systems, methods and enzyme compositions for sequence manipulation
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
AU2013359262C1 (en) 2012-12-12 2021-05-13 Massachusetts Institute Of Technology CRISPR-Cas component systems, methods and compositions for sequence manipulation
ES2883590T3 (es) 2012-12-12 2021-12-09 Broad Inst Inc Suministro, modificación y optimización de sistemas, métodos y composiciones para la manipulación de secuencias y aplicaciones terapéuticas
PT2896697E (pt) 2012-12-12 2015-12-31 Massachusetts Inst Technology Engenharia de sistemas, métodos e composições guia otimizadas para a manipulação de sequências
PL2784162T3 (pl) 2012-12-12 2016-01-29 Broad Inst Inc Opracowanie systemów, metod oraz zoptymalizowanych kompozycji przewodnikowych do manipulacji sekwencyjnej
US20140310830A1 (en) 2012-12-12 2014-10-16 Feng Zhang CRISPR-Cas Nickase Systems, Methods And Compositions For Sequence Manipulation in Eukaryotes
US9493844B2 (en) 2012-12-13 2016-11-15 Dow Agrosciences Llc DNA detection methods for site specific nuclease activity
EP4282970A3 (en) 2012-12-17 2024-01-17 President and Fellows of Harvard College Rna-guided human genome engineering
WO2014118272A1 (en) 2013-01-30 2014-08-07 Santaris Pharma A/S Antimir-122 oligonucleotide carbohydrate conjugates
CA2901676C (en) 2013-02-25 2023-08-22 Sangamo Biosciences, Inc. Methods and compositions for enhancing nuclease-mediated gene disruption
JP2016519652A (ja) 2013-03-14 2016-07-07 カリブー・バイオサイエンシーズ・インコーポレイテッド 核酸ターゲティング核酸の組成物および方法
US11332719B2 (en) 2013-03-15 2022-05-17 The Broad Institute, Inc. Recombinant virus and preparations thereof
US10760064B2 (en) 2013-03-15 2020-09-01 The General Hospital Corporation RNA-guided targeting of genetic and epigenomic regulatory proteins to specific genomic loci
WO2014144155A1 (en) 2013-03-15 2014-09-18 Regents Of The University Of Minnesota Engineering plant genomes using crispr/cas systems
US20140364333A1 (en) 2013-03-15 2014-12-11 President And Fellows Of Harvard College Methods for Live Imaging of Cells
US20140273230A1 (en) 2013-03-15 2014-09-18 Sigma-Aldrich Co., Llc Crispr-based genome modification and regulation
US20140349400A1 (en) 2013-03-15 2014-11-27 Massachusetts Institute Of Technology Programmable Modification of DNA
US9234213B2 (en) 2013-03-15 2016-01-12 System Biosciences, Llc Compositions and methods directed to CRISPR/Cas genomic engineering systems
CN113563476A (zh) 2013-03-15 2021-10-29 通用医疗公司 遗传和表观遗传调节蛋白至特定基因组基因座的rna引导的靶向
UA121197C2 (uk) 2013-04-05 2020-04-27 Доу Агросайенсіс Ллс Нуклеаза "цинкові пальці" для модифікацїї гена ahas та спосіб її використання
SI2986729T1 (sl) 2013-04-16 2019-02-28 Regeneron Pharmaceuticals, Inc. Ciljana sprememba genoma podgane
WO2014182700A1 (en) 2013-05-10 2014-11-13 Sangamo Biosciences, Inc. Delivery methods and compositions for nuclease-mediated genome engineering
US20140349405A1 (en) 2013-05-22 2014-11-27 Wisconsin Alumni Research Foundation Rna-directed dna cleavage and gene editing by cas9 enzyme from neisseria meningitidis
US9873907B2 (en) 2013-05-29 2018-01-23 Agilent Technologies, Inc. Method for fragmenting genomic DNA using CAS9
US9267135B2 (en) 2013-06-04 2016-02-23 President And Fellows Of Harvard College RNA-guided transcriptional regulation
US20160298096A1 (en) 2013-11-18 2016-10-13 Crispr Therapeutics Ag Crispr-cas system materials and methods
WO2015089277A1 (en) 2013-12-12 2015-06-18 The Regents Of The University Of California Methods and compositions for modifying a single stranded target nucleic acid
WO2015116686A1 (en) 2014-01-29 2015-08-06 Agilent Technologies, Inc. Cas9-based isothermal method of detection of specific dna sequence
CA2942915A1 (en) 2014-03-20 2015-09-24 Universite Laval Crispr-based methods and products for increasing frataxin levels and uses thereof
EP3129488B1 (en) 2014-04-10 2019-06-12 The Regents of The University of California Methods and compositions for using argonaute to modify a single stranded target nucleic acid
EP3155116A4 (en) 2014-06-10 2017-12-27 Massachusetts Institute Of Technology Method for gene editing
KR20170036801A (ko) 2014-08-19 2017-04-03 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 핵산의 프로빙 및 맵핑을 위한 rna-가이드된 시스템
WO2016094872A1 (en) 2014-12-12 2016-06-16 The Broad Institute Inc. Dead guides for crispr transcription factors
WO2016094867A1 (en) 2014-12-12 2016-06-16 The Broad Institute Inc. Protected guide rnas (pgrnas)
WO2016106236A1 (en) 2014-12-23 2016-06-30 The Broad Institute Inc. Rna-targeting system
WO2016123243A1 (en) * 2015-01-28 2016-08-04 The Regents Of The University Of California Methods and compositions for labeling a single-stranded target nucleic acid
TW202400626A (zh) 2015-06-18 2024-01-01 美商博得學院股份有限公司 降低脫靶效應的crispr酶突變
AU2016279077A1 (en) 2015-06-18 2019-03-28 Omar O. Abudayyeh Novel CRISPR enzymes and systems
WO2016205749A1 (en) 2015-06-18 2016-12-22 The Broad Institute Inc. Novel crispr enzymes and systems
US9790490B2 (en) 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
US9580727B1 (en) 2015-08-07 2017-02-28 Caribou Biosciences, Inc. Compositions and methods of engineered CRISPR-Cas9 systems using split-nexus Cas9-associated polynucleotides
EP3365441A1 (en) 2015-10-22 2018-08-29 The Broad Institute Inc. Type vi-b crispr enzymes and systems
US11193127B2 (en) 2016-01-08 2021-12-07 University Of Georgia Research Foundation, Inc. Methods for cleaving DNA and RNA molecules
US11441146B2 (en) * 2016-01-11 2022-09-13 Christiana Care Health Services, Inc. Compositions and methods for improving homogeneity of DNA generated using a CRISPR/Cas9 cleavage system
US9896696B2 (en) * 2016-02-15 2018-02-20 Benson Hill Biosystems, Inc. Compositions and methods for modifying genomes
JP2019506875A (ja) 2016-02-23 2019-03-14 アーク バイオ, エルエルシー 標的検出のための方法および組成物
WO2017176529A1 (en) 2016-04-06 2017-10-12 Temple Univesity-Of The Commonwealth System Of Higher Education Compositions for eradicating flavivirus infections in subjects
WO2017205668A1 (en) 2016-05-25 2017-11-30 Arizona Board Of Regents On Behalf Of Arizona State University Portable, low-cost pathogen detection and strain identification platform
US10337051B2 (en) 2016-06-16 2019-07-02 The Regents Of The University Of California Methods and compositions for detecting a target RNA
KR20230156150A (ko) 2016-06-17 2023-11-13 더 브로드 인스티튜트, 인코퍼레이티드 제vi형 crispr 오솔로그 및 시스템
WO2017223538A1 (en) * 2016-06-24 2017-12-28 The Regents Of The University Of Colorado, A Body Corporate Methods for generating barcoded combinatorial libraries
WO2018035250A1 (en) 2016-08-17 2018-02-22 The Broad Institute, Inc. Methods for identifying class 2 crispr-cas systems
AU2017335890B2 (en) 2016-09-30 2024-05-09 The Regents Of The University Of California RNA-guided nucleic acid modifying enzymes and methods of use thereof
WO2018064352A1 (en) 2016-09-30 2018-04-05 The Regents Of The University Of California Rna-guided nucleic acid modifying enzymes and methods of use thereof
CN106701830B (zh) 2016-12-07 2020-01-03 湖南人文科技学院 一种敲除猪胚胎p66shc基因的方法
HUE059759T2 (hu) 2016-12-09 2022-12-28 Broad Inst Inc CRISPR effektor rendszer alapú diagnosztika
EP3601576A1 (en) 2017-03-24 2020-02-05 CureVac AG Nucleic acids encoding crispr-associated proteins and uses thereof
CN110799525A (zh) 2017-04-21 2020-02-14 通用医疗公司 具有改变的PAM特异性的CPF1(CAS12a)的变体
WO2019030695A1 (en) 2017-08-09 2019-02-14 Benson Hill Biosystems, Inc. COMPOSITIONS AND METHODS FOR MODIFYING GENOMES
WO2019089808A1 (en) 2017-11-01 2019-05-09 The Regents Of The University Of California Class 2 crispr/cas compositions and methods of use
WO2019089796A1 (en) 2017-11-01 2019-05-09 The Regents Of The University Of California Cas12c compositions and methods of use
US20200255858A1 (en) 2017-11-01 2020-08-13 Jillian F. Banfield Casy compositions and methods of use
AU2018358051A1 (en) 2017-11-01 2020-05-14 The Regents Of The University Of California CasZ compositions and methods of use
US10253365B1 (en) 2017-11-22 2019-04-09 The Regents Of The University Of California Type V CRISPR/Cas effector proteins for cleaving ssDNAs and detecting target DNAs
JP2021508460A (ja) 2017-12-22 2021-03-11 ザ・ブロード・インスティテュート・インコーポレイテッド Crisprエフェクター系に基づくマルチプレックス診断

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
NUCLEIC ACIDS RES., 2014, VOL. 42, NO. 4, PP. 2577-2590, JPN6021043818, ISSN: 0004635069 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021182474A1 (ja) * 2020-03-12 2021-09-16 株式会社Frest オリゴヌクレオチド及び標的rnaの部位特異的編集方法

Also Published As

Publication number Publication date
US11873504B2 (en) 2024-01-16
US10570415B2 (en) 2020-02-25
EP3523426A4 (en) 2020-01-22
GB2569733A (en) 2019-06-26
WO2018064371A1 (en) 2018-04-05
US20200017879A1 (en) 2020-01-16
US11795472B2 (en) 2023-10-24
EP3523426A1 (en) 2019-08-14
KR20190071725A (ko) 2019-06-24
GB201905575D0 (en) 2019-06-05
US20180346927A1 (en) 2018-12-06
IL265598A (en) 2019-05-30
GB2569733B (en) 2022-09-14
AU2017335890B2 (en) 2024-05-09
MX2019003674A (es) 2021-01-08
AU2017335890A1 (en) 2019-04-11
KR20230170126A (ko) 2023-12-18
BR112019006384A2 (pt) 2019-06-25
US20190276842A1 (en) 2019-09-12
CA3038960A1 (en) 2018-04-05
EA201990861A1 (ru) 2019-09-30
US20240167052A1 (en) 2024-05-23
JP2023027277A (ja) 2023-03-01
CN110023494A (zh) 2019-07-16

Similar Documents

Publication Publication Date Title
JP7306696B2 (ja) Rna誘導型核酸修飾酵素及びその使用方法
US20240167052A1 (en) Rna-guided nucleic acid modifying enzymes and methods of use thereof
US11453866B2 (en) CASZ compositions and methods of use
US20240301376A1 (en) Class 2 crispr/cas compositions and methods of use
JP2021501611A (ja) Cas12c組成物及び使用方法
US20210284981A1 (en) Rna-guided nucleic acid modifying enzymes and methods of use thereof
US20230407276A1 (en) Crispr-cas effector polypeptides and methods of use thereof
EA045278B1 (ru) Рнк-направляемые модифицирующие нуклеиновые кислоты ферменты и способы их применения

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200924

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200924

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211109

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20220204

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220428

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20220823

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221214

C60 Trial request (containing other claim documents, opposition documents)

Free format text: JAPANESE INTERMEDIATE CODE: C60

Effective date: 20221214

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20221214

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20230106

C21 Notice of transfer of a case for reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C21

Effective date: 20230110

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20230127

C211 Notice of termination of reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C211

Effective date: 20230131