JP2022549430A - Dna塩基編集のための方法及び組成物 - Google Patents

Dna塩基編集のための方法及び組成物 Download PDF

Info

Publication number
JP2022549430A
JP2022549430A JP2022518227A JP2022518227A JP2022549430A JP 2022549430 A JP2022549430 A JP 2022549430A JP 2022518227 A JP2022518227 A JP 2022518227A JP 2022518227 A JP2022518227 A JP 2022518227A JP 2022549430 A JP2022549430 A JP 2022549430A
Authority
JP
Japan
Prior art keywords
seq
fusion protein
sequence
domain
dna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022518227A
Other languages
English (en)
Inventor
ジャンピン シュ
ジアン リ
Original Assignee
シンジェンタ クロップ プロテクション アクチェンゲゼルシャフト
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by シンジェンタ クロップ プロテクション アクチェンゲゼルシャフト filed Critical シンジェンタ クロップ プロテクション アクチェンゲゼルシャフト
Publication of JP2022549430A publication Critical patent/JP2022549430A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/01Preparation of mutants without inserting foreign genetic material therein; Screening processes therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • C12N15/8245Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine involving modified carbohydrate or sugar alcohol metabolism, e.g. starch biosynthesis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04005Cytidine deaminase (3.5.4.5)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/09Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Cell Biology (AREA)
  • Nutrition Science (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本発明は、細胞のゲノム中の標的部位を改変するための方法及び組成物に関する。改善されたリンカー配列で接続されている1個又は複数個のDNA結合ドメイン及び1個又は複数個の異種ドメイン、例えばDNA改変ドメインを含む、融合タンパク質が提供される。改善されたリンカー配列により接続されている1個又は複数個のDNA結合ドメイン及び1個又は複数個の異種ドメインを含む融合タンパク質をコードする、コドン最適化ポリヌクレオチドが提供される。

Description

本発明は、細胞のゲノム中における標的ヌクレオチド塩基編集のための方法及び組成物に関する。
配列表の電子的提出に関する陳述
本明細書には、2020年9月18に作成されて37 C.F.R.§1.821に基づいて提出された、約702キロバイトの、「81945_ST25」という表題のASCIIテキスト形式の配列表が添付されており、且つ本明細書と共に提出されており、この配列表は、参照により本明細書に組み込まれる。
農業では、植物のゲノムを編集して有利な対立遺伝子を作り出す能力が非常に求められている。この能力により、収量が増加したり疾患が予防されたりする可能性がある。ゲノム編集は、植物では進展が遅れている新しい分野である。さらに、意図された変更以外のゲノムに対する変更には、望ましい変更の適用が制限されるという問題がある。CRISPR-CAS9は、DNAに二本鎖切断を行なうことにより機能する。この切断は、非相同末端結合又は相同性依存性修復により修復されることから、DNA塩基の挿入又は欠失が起こる場合がある。塩基編集と称される戦略により、切断されて挿入及び欠失が生じることなくDNAが変更される。1つのバージョンでは、シチジンデアミナーゼと称される酵素は、DNAを切断し得ないように改変されているCAS9酵素(Shimatani et al,2017.Nat.Biotechnol.35,441-443)又はCAS12a酵素(Li et al,2018.Nat.Biotechnol.36,324-327)により、特定の塩基を標的とする。シチジンデアミナーゼ及びヌクレアーゼ欠損CAS9又はCAS12aは、アミノ酸リンカーを介した接続により互いに融合している。リンカー接続の改善により、例えば、オフターゲット塩基変更が減少して切断の精度が改善され、これにより、この融合タンパク質の機能が改善され得る。
この改善に関する要求を満たすために、本発明者らは、最適化されており且つ改善されているCas12a酵素及び構築物を提供する。具体的には、本発明者らは、異種ドメイン、第1のリンカー配列、及びV型CRISPR-Cas酵素を含む融合タンパク質を提供する。第1のリンカー配列は、反復GGGGS配列を含む。異種ドメインは、デアミナーゼ、ポリメラーゼ、ヌクレアーゼ、リラクサーゼ(relaxase)、アルキルトランスフェラーゼ、メチルトランスフェラーゼ、アデノシンデアミナーゼ、シチジンデアミナーゼ、オキシダーゼ、チミンアルキルトランスフェラーゼ、アデニンオキシダーゼ、アデノシンメチルトランスフェラーゼ、グリコシラーゼ、又は核局在化シグナルであり得る。塩基編集のために、異種ドメインは、デアミナーゼドメイン(例えば、シチジンデアミナーゼ又はアデニンデアミナーゼ)である。シチジンデアミナーゼドメインは、活性化誘導シチジンデアミナーゼ(「AID」)、又は例えばデアミナーゼのAPOBEC1ファミリ由来のアポリポタンパク質B mRNA編集複合体(「APOBEC」)ドメインであり得る。状況によっては、APOBECドメインは、配列番号1と少なくとも70%同一の配列を含む。アデニンデアミナーゼが必要な場合には、アデニンデアミナーゼは、配列番号92と少なくとも70%同一のアミノ酸配列を含むTadAドメインであり得る。
V型CRISPR-Cas酵素がV-A型(「Cas12a」)酵素である場合には、Cas12aは、配列番号3、配列番号6、配列番号22、配列番号45、配列番号46、配列番号47、及び配列番号48で構成された群から選択される。Cas12aドメインは、触媒的に不活性であり得るが、標的DNAに依然として結合して異種ドメインが作動することを可能にする。Cas12aは不活性であり、この配列は、配列番号3、配列番号6、又は配列番号22である。
異種ドメインとCas12a酵素との間の第1のリンカー配列は、少なくとも3回反復されたGGGGSを含み得る。他の用途では、第1のリンカー配列は、少なくとも6回反復されたGGGGSを含み得る。
本融合タンパク質は、配列番号11、12、13、又は44を含み得、且つウラシルDNAグリコシラーゼインヒビター(「UGI」)ドメイン(配列番号8により表される)も含み得る。このUGIドメインは、配列SGGSを含む第2のリンカーによりCas12a酵素に連結され得る。この融合タンパク質は、配列番号17、配列番号24、配列番号35、配列番号39、配列番号43、配列番号50、配列番号52、配列番号54、配列番号56、配列番号81、配列番号83、配列番号85、配列番号87、又は配列番号89を含み得る。これらの融合タンパク質は、DNAと接触した場合には、反復GGGGS配列の第1のリンカー配列を欠く先行技術の融合タンパク質と比較して、高い頻度でオンターゲット編集を生じ、及び低い頻度でオフターゲット編集を生じる。
本発明者らはまた、植物ゲノムDNAを編集する方法であって、植物ゲノムDNAと、(a)UGIドメインを任意に含む、上記態様の内の1つにより説明されている融合タンパク質、及び(b)工程(a)の融合タンパク質の標的を植物ゲノムDNAの標的DNA配列に定めるガイドRNA(「gRNA」)とを接触させることによる方法であり、編集された植物ゲノムDNAは、反復GGGGS配列以外の第1のリンカーを有する融合タンパク質により編集された植物ゲノムDNAと比較してオフターゲット編集が低い、方法も提供する。
本発明者らはまた、低いオフターゲット編集で植物ゲノムDNAを編集する方法であって、植物ゲノムDNAと、(a)UGIドメインを任意に含む、上記態様の内の1つにより説明されている融合タンパク質、及び(b)工程(a)の融合タンパク質の標的を植物ゲノムDNAの標的DNA配列に定めるガイドRNA(「gRNA」)と接触させることによる方法であり、編集された植物ゲノムDNAは、反復GGGGS配列以外の第1のリンカーを有する融合タンパク質により編集された植物ゲノムDNAと比較してオフターゲット編集が低い、方法も提供する。一態様では、この融合タンパク質は、配列番号24を含む。
本発明者らはまた、オフターゲット編集が低い編集植物の集団を得る方法であって、(a)編集するゲノムDNAを含む植物細胞の集団を得ること、(b)上記態様の内の1つにより説明されている融合タンパク質及び任意のUGIドメインをコードするヌクレオチド配列を得ること、(c)この植物細胞の集団を工程(b)のヌクレオチド配列で形質転換させ、それにより、この植物細胞の集団内で、この核酸配列によりコードされた融合タンパク質を発現させること、(d)形質転換された植物細胞の集団を植物へと成長させることであり、この植物の少なくとも1つは編集されている、成長させること、並びに(e)工程(d)の生成物から少なくとも1つの編集植物を選択し、それにより編集植物の集団を得ることによる方法であり、この編集植物の集団は、反復GGGGS配列以外の第1のリンカーを有する融合タンパク質により編集された植物と比較してオフターゲット編集が低い、方法も提供する。一態様では、融合タンパク質をコードするヌクレオチド配列は、配列番号17、配列番号24、配列番号35、配列番号39、配列番号43、配列番号50、配列番号52、配列番号54、配列番号56、配列番号81、配列番号83、配列番号85、配列番号87、又は配列番号89を含む。
Cas12aBEに関する3つのバージョンのDNA構築物の略図を示す。(1)は、プロモーターを示し、(2)は、核局在化シグナルであり、(3)は、デアミナーゼ(例えばAPOBECデアミナーゼ)であり、(4)は、XTENリンカーであり、(5)は、LbCas12aであり、(6)は、SGGSリンカーであり、(7)は、ウラシルグリコシラーゼインヒビターであり、(8)は、長リンカー(例えば(G4S)6リンカー)であり、(9)は、Mb2Cas12aであり、(10)は、ガイドRNAコードエレメントである。図1Aは、5’から3’の方向にLbCas12aBEプラスガイドRNA構築物を示しており、デアミナーゼ(3)は、XTENリンカー(4)によりLbCas12a(5)に作動可能に連結されている。図1Bは、5’から3’の方向にLbCas12aBEプラスガイドRNA構築物を示しており、デアミナーゼ(3)は、(G4S)6リンカー(8)によりLbCas12a(5)に作動可能に連結されている。図1Cは、5’から3’の方向にMb2Cas12aBEプラスガイドRNA構築物を示しており、デアミナーゼ(3)は、(G4S)6リンカー(8)によりMb2Cas12a(9)に作動可能に連結されている。 5’から3’の方向にCas12aBE及び多重ガイドRNAを含むDNA構築物の略図を示す。(1)は、プロモーターを示し、(2)は、核局在化シグナルであり、(3)は、デアミナーゼ(例えばAPOBECデアミナーゼ)であり、(6)は、SGGSリンカーであり、(7)は、ウラシルグリコシラーゼインヒビターであり、(8)は、長リンカー(例えば(G4S)6リンカー)であり、(9)は、Cas12aであり、(10)は、第1のガイドRNAコードエレメントであり、(11)は、第2のガイドRNAコードエレメントであり、(12)は、第3のガイドRNAコードエレメントである。各ガイドRNAコードエレメントは、crRNAセグメントと、ゲノム標的DNA配列にハイブリダイズし得る標的配列セグメントとを含む。
配列表中の配列の簡単な説明
配列番号1は、Apobec1のアミノ酸配列である。
配列番号2は、Apobec1のヌクレオチド配列である。
配列番号3は、触媒的に不活性なMb2Cas12aのアミノ酸配列である。
配列番号4は、触媒的に不活性なMb2Cas12aのヌクレオチド配列である。
配列番号5は、触媒的に不活性なcLbCas12aBEのヌクレオチド配列である。
配列番号6は、触媒的に不活性なcLbCas12aBEのアミノ酸配列である。
配列番号7は、ウラシルDNAグリコシラーゼインヒビター(UGI)のヌクレオチド配列である。
配列番号8は、ウラシルDNAグリコシラーゼインヒビター(UGI)のアミノ酸配列である。
配列番号9は、発現カセットprSoUbi4:SV40NLS:cLbCas12aBE:GS6Linker:SV40NLS:SGGSLinker:UGI:SGGSLinker:SV40NLS:tNOSを含むヌクレオチド配列である。
配列番号10は、最適化された(G4S)×6リンカーのヌクレオチド配列である。
配列番号11は、最適化された(G4S)×6リンカーのアミノ酸配列である。
配列番号12は、18 aa リンカー-SXのアミノ酸配列である。
配列番号13は、15 aa リンカー-(G4S)×3のアミノ酸配列である。
配列番号14は、構築物25057由来の融合タンパク質cLBCas12aBE-07を含むヌクレオチド配列である。
配列番号15は、構築物25057由来の融合タンパク質cLBCas12aBE-07を含むアミノ酸配列である。
配列番号16は、構築物25058由来の融合タンパク質cLBCas12aBE-08を含むヌクレオチド配列である。
配列番号17は、構築物25058由来の融合タンパク質cLBCas12aBE-08を含むアミノ酸配列である。
配列番号18は、構築物24524由来の融合タンパク質cLBCas12aBE-01を含むヌクレオチド配列である。
配列番号19は、構築物24524由来の融合タンパク質cLBCas12aBE-01を含むアミノ酸配列である。
配列番号20は、cCas9BE-02のヌクレオチド配列である。
配列番号21は、cCas9BE-02のアミノ酸配列である。
配列番号22は、触媒的に不活性なAsCas12aのアミノ酸配列である。
配列番号23は、構築物24904由来の融合タンパク質cLBCas12aBE-06を含むヌクレオチド配列である。
配列番号24は、構築物24904由来の融合タンパク質cLBCas12aBE-06を含むアミノ酸配列である。
配列番号25は、プロモーターprSoUbi4-02を含むヌクレオチド配列である。
配列番号26は、Cas12a gRNA waxy1標的配列を含むヌクレオチド配列である。
配列番号27は、Cas9 gRNA waxy1標的配列を含むヌクレオチド配列である。
配列番号28は、ZmWaxy1遺伝子エクソン4を含むヌクレオチド配列である。
配列番号29は、ZmWaxy1のフォワードプライマーである。
配列番号30は、ZmWaxy1のリバースプライマーである。
配列番号31は、ZmWaxy1の配列決定プライマーである。
配列番号32は、構築物24523由来の融合タンパク質cLbCpf1-02を含むヌクレオチド配列である。
配列番号33は、構築物24523由来の融合タンパク質cLbCpf1-02を含むアミノ酸配列である。
配列番号34は、構築物25181由来の融合タンパク質cLbCas12a-05を含むヌクレオチド配列である。
配列番号35は、構築物25181由来の融合タンパク質cLbCas12a-05を含むアミノ酸配列である。
配列番号36は、構築物25205由来の融合タンパク質cLbCas12a-02を含むヌクレオチド配列である。
配列番号37は、構築物25205由来の融合タンパク質cLbCas12a-02を含むアミノ酸配列である。
配列番号38は、構築物25513由来の融合タンパク質cLbCas12a-25を含むヌクレオチド配列である。
配列番号39は、構築物25513由来の融合タンパク質cLbCas12a-25を含むアミノ酸配列である。
配列番号40は、構築物25220由来の融合タンパク質cMb2Cas12a-01を含むヌクレオチド配列である。
配列番号41は、構築物25220由来の融合タンパク質cMb2Cas12a-01を含むアミノ酸配列である。
配列番号42は、構築物25382由来の融合タンパク質cMb2Cas12a-02を含むヌクレオチド配列である。
配列番号43は、構築物25382由来の融合タンパク質cMb2Cas12a-02を含むアミノ酸配列である。
配列番号44は、最適化された(G4SG)x6リンカーのアミノ酸配列である。
配列番号45は、活性なLbCas12aのアミノ酸配列である。
配列番号46は、活性なMb2Cas12aのアミノ酸配列である。
配列番号47は、活性なAsCas12aのアミノ酸配列である。
配列番号48は、活性なFnCas12aのアミノ酸配列である。
配列番号49は、構築物25457由来の融合タンパク質cMb2Cas12a-BE-01を含むヌクレオチド配列である。
配列番号50は、構築物25457由来の融合タンパク質cMb2Cas12a-BE-01を含むアミノ酸配列である。
配列番号51は、構築物25268由来の融合タンパク質cLbCas12a-BE-08を含むヌクレオチド配列である。
配列番号52は、構築物25268由来の融合タンパク質cLbCas12a-BE-08を含むアミノ酸配列である。
配列番号53は、構築物25173由来の融合タンパク質cLbCas12a-05を含むヌクレオチド配列である。
配列番号54は、構築物25173由来の融合タンパク質cLbCas12a-05を含むアミノ酸配列である。
配列番号55は、構築物25175由来の融合タンパク質cLbCas12a-05を含むヌクレオチド配列である。
配列番号56は、構築物25175由来の融合タンパク質cLbCas12a-05を含むアミノ酸配列である。
配列番号57は、最適化された(G4SG)6リンカーを有する触媒的な不活性なLbCas12aのアミノ酸配列である。
配列番号58は、最適化された(G4S)6リンカーを有する活性なMb2Cas12aのアミノ酸配列である。
配列番号59は、XTENリンカーを有する触媒的に不活性なMb2Cas12aのアミノ酸配列である。
配列番号60は、XTENリンカーを有する活性なAsCas12aのアミノ酸配列である。
配列番号61は、XTENリンカーを有する触媒的に不活性なAsCas12aのアミノ酸配列である。
配列番号62は、XTENリンカーを有する活性なFnCas12aのアミノ酸配列である。
配列番号63は、最適化された(G4S)6リンカーを有する活性なAsCas12aのアミノ酸配列である。
配列番号64は、最適化された(G4S)6リンカーを有する触媒的に不活性なAsCas12aのアミノ酸配列である。
配列番号65は、最適化された(G4S)6リンカーを有する活性なFnCas12aのアミノ酸配列である。
配列番号66は、最適化された(G4SG)6リンカーを有する触媒的に不活性なMb2Cas12aのアミノ酸配列である。
配列番号67は、最適化された(G4SG)6リンカーを有する活性なAsCas12aのアミノ酸配列である。
配列番号68は、最適化された(G4SG)6リンカーを有する触媒的に不活性なAsCas12aのアミノ酸配列である。
配列番号69は、最適化された(G4SG)6リンカーを有する活性なFnCas12aのアミノ酸配列である。
配列番号70は、XTENリンカーのアミノ酸配列である。
配列番号71は、Cas12a gRNA SBEII標的配列を含むヌクレオチド配列である。
配列番号72は、Cas12a gRNA GL2標的配列を含むヌクレオチド配列である。
配列番号73は、Cas12a gRNA Fad2標的配列を含むヌクレオチド配列である。
配列番号74は、waxy1標的配列、SBEII標的配列、及びFad2標的配列により使用されるCas12a crRNA配列を含むヌクレオチド配列である。
配列番号75は、GL2標的配列により使用されるCas12a crRNA配列を含むヌクレオチド配列である。
配列番号76は、構築物24785由来の融合タンパク質cCas9ABE-01を含むヌクレオチド配列である。
配列番号77は、構築物24785由来の融合タンパク質cCas9ABE-01を含むアミノ酸配列である。
配列番号78は、構築物25459由来の融合タンパク質cLbCas1aABE-01を含むヌクレオチド配列である。
配列番号79は、構築物25459由来の融合タンパク質cLbCas1aABE-01を含むアミノ酸配列である。
配列番号80は、構築物25504由来の融合タンパク質cLbCas12aABE-02を含むヌクレオチド配列である。
配列番号81は、構築物25504由来の融合タンパク質cLbCas12aABE-02を含むアミノ酸配列である。
配列番号82は、構築物25289由来の融合タンパク質cLbCas12aBE-09を含むヌクレオチド配列である。
配列番号83は、構築物25289由来の融合タンパク質cLbCas12aBE-09を含むアミノ酸配列である。
配列番号84は、構築物25658由来の融合タンパク質cdLbCas12a-ABE-CBE-01を含むヌクレオチド配列である。
配列番号85は、構築物25658由来の融合タンパク質cdLbCas12a-ABE-CBE-01を含むアミノ酸配列である。
配列番号86は、構築物25701由来の融合タンパク質cdLbCas12a-ABE-CBE-02を含むヌクレオチド配列である。
配列番号87は、構築物25701由来の融合タンパク質cdLbCas12a-ABE-CBE-02を含むアミノ酸配列である。
配列番号88は、構築物25702由来の融合タンパク質cdLbCas12a-ABE-CBE-03を含むヌクレオチド配列である。
配列番号89は、構築物25702由来の融合タンパク質cdLbCas12a-ABE-CBE-03を含むアミノ酸配列である。
配列番号90は、Cas12a gRNA ADH1標的配列を含むヌクレオチド配列である。
配列番号91は、TadA二量体を含むヌクレオチド配列である。
配列番号92は、TadA二量体を含むアミノ酸配列である。
この説明は、本発明を実施することができる全ての異なる方法、又は本発明に追加することができる全ての特徴の詳細なカタログであることを意図するものではない。例えば、一実施形態に関連して示される特徴は、他の実施形態に組み込まれてもよく、特定の実施形態に関連して示される特徴は、その実施形態から削除されてもよい。加えて、本明細書で示唆される様々な実施形態に対する多数のバリエーション及び追加は、本開示に照らして当業者には明らかであり、本発明から逸脱するものではない。従って、以下の説明は、本発明のいくつかの特定の実施形態を例示することを意図しており、その全ての置換、組合せ、及びバリエーションを網羅的に特定することを意図していない。
定義
別途定義されない限り、本明細書に用いられる全ての技術的及び科学的用語は、本発明が属する当業者により一般に理解されるものと同じ意味を有する。本明細書における本発明の説明において使用される用語は、特定の実施形態を説明するためだけのものであり、本発明を限定することを意図するものではない。本明細書に言及されている全ての出版物、特許出願、特許、及び他の参考文献は、それらの全体が参照により組み込まれる。
以下の定義及び方法は、本発明をより良く定義し、本発明の実施において当業者を導くために提供される。特に断らない限り、本明細書で使用される用語は、関連技術における当業者による従来の使用に従って理解されるべきである。分子生物学における一般的用語の定義は、Rieger et al.,Glossary of Genetics:Classical and Molecular,5th edition,Springer-Verlag:New York,1994にも見出すことができる。
本明細書で使用される場合、「長リンカー」という用語は、異種ドメインを目的のタンパク質に連結するために使用される少なくとも10個のアミノ酸のポリペプチド鎖を指す。例えば、限定されないが、長リンカーは、配列GGGGSGGGGSGGGGSGGGGSGGGGSGGGGS(配列番号11)を含み得、別途、(G4S)6、又は(G4S)×6、又は(G4S)*6と表される。長リンカーは、GGGGSGGGGGSGGGGGSGGGGGSGGGGGSGGGGGSG(配列番号44)を含み得、別途、(G4SG)6、又は(G4SG)×6、又は(G4SG)*6と表される。長リンカーによりタンパク質に連結される異種ドメインとして、下記が挙げられる:シチジンデアミナーゼ、グアニンデアミナーゼ、ウラシルグリコシラーゼインヒビター(「UGI」)、ヌクレアーゼ、及び目的のタンパク質に異種様式で作動可能に連結され得るあらゆる他のタンパク質性ドメイン。そのような目的のタンパク質として下記が挙げられるが、これらに限定されない:部位特異的ヌクレアーゼ(例えば、Cas9、Cas12a、Cas12b、Cas12i、Cas12j、又は他のCRISPRヌクレアーゼ)、ジンクフィンガー、メガヌクレアーゼ、転写アクチベーター様エフェクターヌクレーアゼ(「TALEN」)、及び同類のもの。
本発明の実施形態及び添付の特許請求の範囲の記載で使用されるように、単数形「1つの(a)」、「1つの(an)」、及び「その(the)」は、文脈が別段の明確な指示をしない限り、複数形も含むことが意図される。
本明細書で使用される場合、「及び/又は」は、関連する列挙された項目のうちの1つ以上の任意の及び全ての可能な組合せを指し、包含する。
「約」という用語は、本明細書で使用される場合、化合物の量、用量、時間、温度等の測定可能な値を指す場合、特定の量の20%、10%、5%、1%、0.5%、又はさらには0.1%の変動を包含することを意味する。
「含む」及び/又は「含んでいる」という用語は、本明細書で使用される場合、述べられた特徴、整数、工程、操作、エレメント、及び/又は成分の存在を指定するが、1つ以上の他の特徴、整数、工程、操作、エレメント、成分、及び/又はそれらの群の存在又は追加を排除しない。
本明細書で使用される場合、「から本質的になる」という移行句は、請求項の範囲が請求項に記載された特定の材料又は工程、並びに請求項に記載された発明の基本的且つ新規な特徴に実質的に影響を及ぼさないものを包含すると解釈されることを意味する。従って、用語「から本質的になる」は、本発明の請求項で使用される場合、「を含む」と同等であると解釈されることを意図しない。
本明細書で使用される場合、「増幅された」という用語は、核酸分子の少なくとも1つを鋳型として使用する、核酸分子の複数のコピー又は核酸分子に相補的な複数のコピーの構築を意味する。例えば、Diagnostic Molecular Microbiology:Principles and Applications,D.H.Persing et al.,Ed.,American Society for Microbiology,Washington,D.C.(1993)を参照されたい。増幅の産物は、アンプリコンと呼ばれる。
「コード配列」は、mRNA、rRNA、tRNA、snRNA、センスRNA又はアンチセンスRNA等のRNAに転写される核酸配列である。いくつかの実施形態では、RNAは、次いで、生物において翻訳されて、タンパク質を産生する。
本明細書で使用される場合、トランスジェニック「事象」という用語は、異種DNA、例えば、1つ以上の目的の遺伝子(例えば、導入遺伝子)を含む発現カセットを有する単一の植物細胞の形質転換及び再生によって産生される組換え植物を指す。「事象」という用語は、異種DNAを含む形質転換体の元の形質転換体及び/又は子孫を指す。「事象」という用語はまた、形質転換体と別の系統との間の性的異系交配によって産生される子孫を指す。反復親に対して戻し交配を繰り返した後でも、挿入されたDNAと形質転換された親からの隣接するDNAは、同じ染色体上の位置で交配の子孫に存在する。通常、植物組織の形質転換は複数の事象を生じ、事象の各々は、植物細胞のゲノムの異なる位置へのDNA構築物の挿入を表している。導入遺伝子の発現又は他の望ましい特徴に基づいて、特定の事象が選択される。従って、本明細書で使用される「事象MIR604」、「MIR604」又は「MIR604事象」は、MIR604形質転換体の元のMIR604形質転換体及び/又は子孫を意味する(米国特許第7,361,813号明細書、第7,897,748号明細書、第8,354,519号明細書、及び第8,884,102号明細書、参照により本明細書に組み込まれる)。
本明細書で使用される「発現カセット」は、適切な宿主細胞における特定のヌクレオチド配列の発現を指示することができる核酸分子を意味し、目的のヌクレオチド配列(典型的には、コード領域)に作動可能に連結されたプロモーターを含み、これは終結シグナルに作動可能に連結されている。発現カセットはまた、典型的には、ヌクレオチド配列の適切な翻訳に必要な配列を含む。コード領域は、通常、目的のタンパク質をコードするが、目的の機能性RNA、例えばアンチセンスRNA、又は翻訳されないRNAも、センス又はアンチセンス方向にコードしてもよい。発現カセットはまた、目的のヌクレオチド配列の直接発現に必要ではないが、発現ベクターからカセットを除去するための便利な制限部位のために存在する配列を含んでもよい。目的のヌクレオチド配列を含む発現カセットは、キメラであり得、これは、その成分の少なくとも1つが、その他の成分の少なくとも1つに関して異種であることを意味する。発現カセットはまた、天然に存在するが、異種発現に有用な組換え形態で得られたものであってもよい。しかしながら、典型的には、発現カセットは、宿主に対して異種であり、即ち、発現カセットの特定の核酸配列は、宿主細胞内に天然には存在せず、当技術方法で既知の形質転換プロセスによって宿主細胞又は宿主細胞の祖先に導入されていなければならない。発現カセット内のヌクレオチド配列の発現は、構成的プロモーターの制御下にあってもよいし、又は宿主細胞が何らかの特定の外部刺激にさらされたときにのみ転写を開始する誘導性プロモーターの制御下にあってもよい。植物等の多細胞生物の場合、プロモーターはまた、特定の組織、又は器官、又は発生段階に特異的であり得る。発現カセット又はその断片はまた、植物に形質転換される場合、「挿入された配列」又は「挿入配列」と称され得る。
「遺伝子」は、ゲノム内に位置し、前述のコード核酸配列に加えて、コード部分の発現、即ち転写及び翻訳の制御に関与する他の主に調節性の核酸配列を含む、規定された領域である。遺伝子は、コード領域及び非コード領域(例えば、イントロン、調節エレメント、プロモーター、エンハンサー、終結配列、並びに5’及び3’非翻訳領域)の両方を含み得る。遺伝子は、典型的には、mRNA、機能性RNA、又は調節配列を含む特定のタンパク質を発現する。遺伝子は、機能的タンパク質を産生するために使用され得るか、又はされ得ない。いくつかの実施形態では、遺伝子は、コード領域のみを指す。「天然遺伝子」という用語は、天然に見出されるような遺伝子を指す。「キメラ遺伝子」という用語は、1)天然では、共存して見出されない調節配列及びコード配列を含むDNA配列、又は2)天然には隣接していないタンパク質の一部をコードする配列、又は3)天然には隣接していないプロモーターの一部を含む任意の遺伝子を指す。従って、キメラ遺伝子は、異なる供給源に由来する調節配列及びコード配列を含むか、又は同じ供給源に由来するが、天然に見出されるものとは異なる様式で配置される調節配列及びコード配列を含み得る。遺伝子は、「単離」されてもよく、これは天然の状態で核酸分子と関連して通常見出される成分を実質的に又は本質的に含まない核酸分子を意味する。このような成分としては、他の細胞材料、組換え産生由来の培養培地、及び/又は核酸分子を化学的に合成する際に使用される種々の化学物質が挙げられる。
ポリヌクレオチドコード配列の「発現する」又は「発現」という用語は、配列が転写され、任意に翻訳されることを意味する。
「目的の遺伝子」、「目的のヌクレオチド配列」、又は「目的の配列」は、植物に移入された場合に、抗生物質耐性、ウイルス耐性、昆虫耐性、疾病耐性、又は他の害虫に対する耐性、除草剤耐性、栄養価の改善、工業プロセスにおける性能の改善、又は生殖能力の変化等の所望の特徴を植物に付与する任意の遺伝子を指す。「目的の遺伝子」はまた、植物において商業的に価値のある酵素又は代謝産物を産生するために植物に移入されるものであってもよい。
本明細書で使用される場合、「異種」は、それが導入される宿主細胞と天然に関連しない核酸分子又はヌクレオチド配列を指し、これは、別の種に由来するか、又は同じ種若しくは生物に由来するが、その元の形態又は細胞内で主に発現される形態から改変されている(天然に存在する核酸配列の天然に存在しない複数のコピーを含む)。従って、ヌクレオチド配列が導入される細胞のものとは異なる生物又は種に由来するヌクレオチド配列は、その細胞及び細胞の子孫に関して異種である。加えて、異種ヌクレオチド配列は、同じ天然の元の細胞型に由来し、挿入されるが、非天然の状態で存在する(例えば、異なるコピー数で存在する)、及び/又は核酸分子の天然の状態で見出されるものとは異なる調節配列の制御下に存在する、ヌクレオチド配列を含む。核酸配列はまた、例えば、発現ベクターのような核酸構築物において、それが関連し得る他の核酸配列に対して異種であり得る。非限定的な一例として、プロモーターは、その特定のプロモーターと関連して天然には存在しない、即ち、プロモーターに対して異種の1つ以上の調節エレメント及び/又はコード配列と組み合わせて、核酸構築物中に存在し得る。
「相同」核酸配列は、それが導入される宿主細胞に天然に関連する核酸配列である。相同核酸配列はまた、例えば核酸構築物中に存在し得る他の核酸配列と天然に関連する核酸配列であり得る。非限定的な一例として、プロモーターは、その特定のプロモーターと関連して天然に存在する、即ち、プロモーターと相同の1つ以上の調節エレメント及び/又はコード配列と組み合わせて、核酸構築物中に存在し得る。
「作動可能に連結された」は、一方の機能が他方の機能に影響を及ぼすような、単一の核酸配列上の核酸配列の会合を指す。例えば、プロモーターは、コード配列又は機能性RNAの発現に影響を及ぼすことができる場合(即ち、コード配列又は機能性RNAがプロモーターの転写制御下にある場合)、そのコード配列又は機能性RNAと作動可能に連結されている。センス又はアンチセンス配向におけるコード配列は、調節配列に作動可能に連結され得る。従って、ヌクレオチド配列と作動可能に関連する調節配列又は制御配列(例えば、プロモーター)は、ヌクレオチド配列の発現に影響を及ぼすことができる。例えば、GFPをコードするヌクレオチド配列に作動可能に連結されたプロモーターは、そのGFPヌクレオチド配列の発現に影響を及ぼすことができる。
制御配列は、それらがその発現を指示するように機能する限り、目的のヌクレオチド配列と連続している必要はない。従って、例えば、介在する非翻訳であるが転写された配列は、プロモーターとコード配列との間に存在することができ、プロモーター配列は、依然としてコード配列に「作動可能に連結されている」と考えることができる。
本明細書で使用される「プライマー」は、核酸ハイブリダイゼーションによって相補的標的DNA鎖にアニールされて、プライマーと標的DNA鎖との間にハイブリッドを形成し、次いで、DNAポリメラーゼのようなポリメラーゼによって標的DNA鎖に沿って伸長される単離された核酸である。プライマー対又はセットは、例えば、ポリメラーゼ連鎖反応(PCR)又は他の核酸増幅方法による核酸分子の増幅のために使用され得る。
「プローブ」は、標的核酸分子の一部に相補的であり、典型的には、標的核酸分子を検出及び/又は定量するために使用される、単離された核酸分子である。従って、いくつかの実施形態では、プローブは、検出可能な部分又はレポーター分子(例えば、放射性同位体、リガンド、化学発光剤、蛍光剤又は酵素)が結合している単離された核酸分子であり得る。本発明によるプローブは、デオキシリボ核酸又はリボ核酸だけでなく、標的核酸配列に特異的に結合し、その標的核酸配列の存在を検出し及び/又はその量を定量するために使用することができるポリアミド及び他のプローブ材料も含むことができる。
TaqManプローブは、特定のプライマーセットによって増幅されたDNA領域内でアニールするように設計される。Taqポリメラーゼがプライマーを伸長し、新生鎖を一本鎖鋳型から相補鎖の3’から5’を合成すると、ポリメラーゼの5’から3’のエキソヌクレアーゼは、プローブを介して新生鎖を伸長し、その結果、鋳型にアニールしたプローブを分解する。プローブの分解は、それからフルオロフォアを放出し、クエンチャーへの近接を破壊し、従って、クエンチング効果を軽減し、フルオロフォアの蛍光を可能にする。従って、定量的PCRサーマルサイクラーで検出される蛍光は、放出されるフルオロフォア及びPCRに存在するDNA鋳型の量に正比例する。
プライマー及びプローブは、一般に、5~100ヌクレオチド又はそれを超える長さである。いくつかの実施形態では、プライマー及びプローブは、少なくとも20ヌクレオチド以上の長さ、又は少なくとも25ヌクレオチド以上、又は少なくとも30ヌクレオチド以上の長さであり得る。このようなプライマー及びプローブは、当技術分野で既知の最適なハイブリダイゼーション条件下で標的配列に特異的にハイブリダイズする。本発明によるプライマー及びプローブは、標的配列と完全な配列相補性を有し得るが、標的配列とは異なり、標的配列にハイブリダイズする能力を保持するプローブは、本発明による従来の方法によって設計され得る。
プローブ及びプライマーを調製及び使用する方法は、例えば、Molecular Cloning:A Laboratory Manual,2nd ed.,vol.1-3,ed.Sambrook et al.,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.,1989に記載されている。PCR-プライマー対は、例えば、その目的のために意図されるコンピュータープログラムを使用することによって、既知の配列から誘導され得る。
ポリメラーゼ連鎖反応(PCR)は、DNAの特定の断片を「増幅」するための技術である。PCRを行うためには、複製されるDNA分子のヌクレオチド配列の少なくとも一部が既知でなければならない。一般に、増幅されるDNA(既知の配列)の各鎖の3’末端のヌクレオチド配列に相補的(例えば、実質的に相補的又は完全に相補的)なプライマー又は短いオリゴヌクレオチドが使用される。DNAサンプルを加熱してその鎖を分離し、プライマーと混合する。プライマーは、DNAサンプル中のそれらの相補的配列にハイブリダイズする。元のDNA鎖を鋳型として使用して合成が開始する(5’から3’方向)。反応混合物は、4つ全てのデオキシヌクレオチド三リン酸(dATP、dCTP、dGTP、及びdTTP)及びDNAポリメラーゼを含有しなければならない。重合は、新たに合成された各鎖が他のプライマーによって認識される配列を含むのに十分に進行するまで続く。これが起こると、元の分子と同一である2つのDNA分子が生成される。これらの2つの分子は、それらの鎖を分離するために加熱され、このプロセスが繰り返される。各サイクルでDNA分子の数が2倍になる。自動化された装置を用いて、複製の各サイクルを5分未満で完了することができる。30サイクル後、DNAの単一分子として開始したものは、10億を超えるコピーに増幅されている(230=1.02×109)。
オリゴヌクレオチドプライマー対のオリゴヌクレオチドは、反対のDNA鎖上に位置し、増幅されるべき領域に隣接するDNA配列に相補的である。アニーリングされたプライマーは、新たに合成されたDNA鎖にハイブリダイズする。最初の増幅サイクルは、その5’末端がオリゴヌクレオチドプライマーの位置によって固定されるが、その3’末端が可変である(不規則な(ragged)3’末端)2つの新しいDNA鎖を生じる。2つの新しい鎖は、次に、所望の長さの相補鎖の合成のための鋳型として働くことができる(5’末端はプライマーによって規定され、合成は、対向するプライマーの末端を越えて進行することができないため、3’末端は固定される)。数サイクル後、所望の固定長の産物が優勢になり始める。
リアルタイムポリメラーゼ連鎖反応とも称される定量的ポリメラーゼ連鎖反応(qPCR)は、PCR反応からのDNA産物の蓄積をリアルタイムでモニターする。qPCRは、ポリメラーゼ連鎖反応(PCR)に基づく分子生物学の実験室技術であり、標的DNA分子を増幅し、同時に定量するために使用される。特異的配列の1コピーでさえ、PCRにおいて増幅及び検出することができる。PCR反応は、DNA鋳型のコピーを指数関数的に生成する。これは、出発標的配列の量と任意の特定のサイクルで蓄積されたPCR産物の量との間の定量的関係を生じる。鋳型、試薬制限又はピロリン酸分子の蓄積で見出されるポリメラーゼ反応の阻害剤のために、PCR反応は、最終的に、指数関数的速度(即ち、プラトー相)で鋳型を生成するのを停止し、PCR産物の終点定量を信頼できないものにする。従って、重複反応は、可変量のPCR産物を生成し得る。PCR反応の指数関数相の間のみ、鋳型配列の開始量を決定するために外挿し戻すことが可能である。PCR産物が蓄積するときのPCR産物の測定(即ち、リアルタイム定量PCR)は、反応の指数関数相における定量を可能にし、従って、従来のPCRに関連する変動性を除去する。リアルタイムPCRアッセイにおいて、陽性反応は、蛍光シグナルの蓄積によって検出される。DNAサンプル中の1つ以上の特異的配列について、定量的PCRは、検出及び定量の両方を可能にする。この量は、コピーの絶対数、又はDNAインプットに対して正規化された場合の相対量、又はさらなる正規化遺伝子のいずれかであり得る。リアルタイムPCRの最初の記録以来、それは、mRNA発現研究、ゲノム又はウイルスDNAにおけるDNAコピー数測定、対立遺伝子識別アッセイ、遺伝子の特異的スプライスバリアントの発現分析、並びにパラフィン包埋組織及びレーザー捕獲顕微解剖細胞における遺伝子発現を含む、増大する及び多様な数の応用に使用されてきた。
本明細書で使用される場合、「Ct値」という表現は、「閾値サイクル」を指し、これは、「増幅された標的の量が固定閾値に達する分数サイクル数」と定義される。いくつかの実施形態では、これは、増幅曲線と閾値線との交点を表す。増幅曲線は、典型的には、所与のサイクル(X軸)での各反応の相対蛍光(Y軸)の変化を示す「S」字形であり、これは、いくつかの実施形態では、リアルタイムPCR機器によってPCR中に記録される。閾値線は、いくつかの実施形態では、反応がバックグラウンドを超える蛍光強度に達する検出のレベルである。Livak & Schmittgen(2001)25 Methods 402-408を参照されたい。これは、PCRにおける標的の濃度の相対的尺度である。一般に、qPCRのような定量アッセイのための良好なCt値は、いくつかの実施形態では、所与の参照遺伝子について10~40の範囲である。Ctレベルは、サンプル中の標的核酸の量に反比例する(即ち、Ctレベルが低いほど、サンプル中の検出可能な標的核酸の量が多い)。加えて、qPCRのような定量アッセイについての良好なCt値は、標的gDNAの比例希釈で線形応答範囲を示す。
いくつかの実施形態では、qPCRは、Ct値が定量分析のためにリアルタイムで収集され得る条件下で行われる。例えば、典型的なqPCR実験において、DNA増幅は、伸長段階の間のPCRの各サイクルでモニターされる。DNAが増幅の対数線形相にある場合、蛍光の量は、一般にバックグラウンドを超えて増加する。いくつかの実施形態では、Ct値は、この時点で収集される。
本明細書で使用される場合、「細胞」という用語は、任意の生細胞を指す。細胞は、原核細胞又は真核細胞であり得る。細胞は、単離することができる。細胞は、生物に再生することができてもできなくてもよい。細胞は、組織、カルス、培養物、器官、又は部分の状態であり得る。いくつかの実施形態では、細胞は、植物細胞であってもよい。本発明の植物細胞は、単離された単一細胞の形態であり得るか、又は培養された細胞であり得るか、又は例えば植物組織若しくは植物器官のようなより高度に組織化された単位の一部であり得る。植物細胞は、被子植物若しくは裸子植物に由来し得るか、又はその一部であり得る。さらなる実施形態では、植物細胞は、単子葉植物細胞、双子葉植物細胞であってもよい。単子葉植物細胞は、例えば、トウモロコシ、イネ、モロコシ、サトウキビ、大麦、小麦、カラス麦、芝草、又は観賞用草細胞であり得る。双子葉植物細胞は、例えば、タバコ、コショウ、ナス、ヒマワリ、アブラナ科、アマ、ジャガイモ、綿、大豆、テンサイ、又はアブラナ細胞であってもよい。
「植物部分」という用語は、限定されるものではないが、本明細書で使用される場合、胚、花粉、胚珠、種子、葉、茎、苗条、花、枝、果実、穀粒、穂(ear)、穂軸(cob)、殻、柄、根、根端、葯、植物細胞を含み、植物細胞は、植物及び/又は植物の一部、植物プロトプラスト、植物組織、植物細胞組織培養物、植物カルス、植物塊等において無傷である植物細胞を含む。本明細書で使用される場合、「苗条」は、葉及び茎を含む地上部分を指す。さらに、本明細書で使用される場合、「植物細胞」は、細胞壁を含み、プロトプラストとも称され得る、植物の構造的及び生理的単位を指す。
細胞、原核細胞、細菌細胞、真核細胞、植物細胞、植物及び/又は植物部分の状況における「導入している」又は「導入する」という用語は、核酸分子が細胞、真核細胞、植物細胞、並びに/又は植物及び/若しくは植物部分の細胞の内部に接近するように、核酸分子を細胞、真核細胞、植物、植物部分及び/又は植物細胞と接触させることを意味する。2つ以上の核酸分子が導入される場合、これらの核酸分子は、単一のポリヌクレオチド若しくは核酸構築物の一部として、又は別個のポリヌクレオチド若しくは核酸構築物として組み立てられ得、同じ又は異なる核酸構築物上に位置し得る。従って、これらのポリヌクレオチドは、単一の形質転換事象において、別々の形質転換事象において、又は例えば繁殖プロトコルの一部として、植物細胞に導入され得る。
本明細書で使用される場合、「形質転換された」及び「遺伝子導入」という用語は、少なくとも1つの組換え(例えば、異種)ポリヌクレオチドの全部又は一部を含有する任意の細胞、原核細胞、真核細胞、植物、植物細胞、カルス、植物組織、又は植物部分を指す。いくつかの実施形態では、組換えポリヌクレオチドの全部又は一部は、染色体又は安定な染色体外エレメントに安定的に統合され、その結果、連続した世代に渡される。本発明の目的のために、「組換えポリヌクレオチド」という用語は、遺伝子工学によって変更され、再配置され、又は改変されたポリヌクレオチドを指す。例としては、異種配列に結合又は連結された任意のクローン化ポリヌクレオチド、又はポリヌクレオチドが挙げられる。「組換え」という用語は、自然発生的変異のような天然に存在する事象から、又は非自然発生的変異誘発に続く選択的繁殖から生じるポリヌクレオチドの変化を指すものではない。
本明細書で使用される「形質転換」という用語は、異種核酸の細胞への導入を指す。細胞の形質転換は、安定的であっても一過性であってもよい。従って、本発明の遺伝子導入細胞、植物細胞、植物及び/又は植物部分は、安定的に形質転換され得るか、又は一過性に形質転換され得る。形質転換は、宿主細胞のゲノムへの核酸分子の転移を指し得、遺伝的に安定な継承をもたらす。いくつかの実施形態では、植物、植物部分及び/又は植物細胞への導入は、細菌媒介形質転換、粒子衝撃形質転換、リン酸カルシウム媒介形質転換、シクロデキストリン媒介形質転換、エレクトロポレーション、リポソーム媒介形質転換、ナノ粒子媒介形質転換、ポリマー媒介形質転換、ウイルス媒介核酸送達、ウィスカー媒介核酸送達、マイクロインジェクション、超音波処理、浸潤、ポリエチレングリコール媒介形質転換、プロトプラスト形質転換、又は植物、植物部分及び/若しくはその細胞への核酸の導入をもたらす任意の他の電気的、化学的、物理的及び/若しくは生物学的メカニズム、又はそれらの任意の組合せを介する。
植物を形質転換するための手順は、当技術分野で周知且つ日常的であり、文献を通して記載される。植物の形質転換のための方法の非限定的な例としては、細菌媒介核酸送達(例えば、アグロバクテリウム(Agrobacterium)属からの細菌を介する)、ウイルス媒介核酸送達、炭化ケイ素又は核酸ウィスカー媒介核酸送達、リポソーム媒介核酸送達、マイクロインジェクション、マイクロ粒子衝撃、リン酸カルシウム媒介形質転換、シクロデキストリン媒介形質転換、エレクトロポレーション、ナノ粒子媒介形質転換、超音波処理、浸潤、PEG媒介核酸取り込み、並びに植物細胞への核酸の導入をもたらす任意の他の電気的、化学的、物理的(機械的)及び/又は生物学的メカニズム(これらの任意の組み合わせを含む)を介する形質転換が挙げられる。当技術分野で既知の種々の植物形質転換法への一般的なガイドとしては、Miki et al.(“Procedures for Introducing Foreign DNA into Plants”in Methods in Plant Molecular Biology and Biotechnology,Glick,B.R.and Thompson,J.E.,Eds.(CRC Press,Inc.,Boca Raton,1993),pages 67-88)及びRakowoczy-Trojanowska(Cell Mol Biol Lett 7:849-858(2002))が挙げられる。
アグロバクテリウム媒介形質転換は、形質転換の高い効率のため、及び多くの異なる種とのその広範な有用性のために、植物を形質転換するために一般に使用される方法である。アグロバクテリウム媒介形質転換は、典型的には、目的の外来DNAを担持するバイナリーベクターを、共存するTiプラスミド上又は染色体上のいずれかで宿主アグロバクテリウム(Agrobacterium)株によって担持されるvir遺伝子の補体に依存し得る適切なアグロバクテリウム(Agrobacterium)株に導入することを含む(Uknes et al.1993,Plant Cell 5:159-169)。組換えバイナリーベクターのアグロバクテリウム(Agrobacterium)への導入は、組換えバイナリーベクターを担持する大腸菌(Escherichia coli)、組換えバイナリーベクターを標的アグロバクテリウム(Agrobacterium)株に動員することができるプラスミドを担持するヘルパー大腸菌(E.coli)株を用いる三親交配手順によって達成することができる。或いは、組換えバイナリーベクターは、核酸形質転換によってアグロバクテリウム(Agrobacterium)に導入され得る(Hoefgen and Willmitzer 1988,Nucleic Acids Res 16:9877)。
組換えアグロバクテリウム(Agrobacterium)による植物の形質転換は、通常、植物からの外植片とのアグロバクテリウム(Agrobacterium)の共培養を含み、当技術分野で周知の方法に従う。形質転換された組織は、典型的には、バイナリープラスミドT-DNA境界の間に抗生物質又は除草剤耐性マーカーを保有する選択培地上で再生される。
植物、植物部分及び植物細胞を形質転換するための別の方法は、植物組織及び細胞において不活性又は生物学的に活性な粒子を推進することを含む。例えば、米国特許第4,945,050号明細書、同第5,036,006号明細書及び同第5,100,792号明細書を参照されたい。一般に、この方法は、細胞の外表面に浸透し、その内部に組み込むのに有効な条件下で、植物細胞において不活性又は生物学的に活性な粒子を推進することを含む。不活性粒子が利用される場合、ベクターは、目的の核酸を含むベクターで粒子をコーティングすることによって、細胞に導入され得る。或いは、1つ以上の細胞をベクターによって取り囲むことができ、その結果、ベクターは、粒子の伴流によって細胞内に運ばれる。生物学的に活性な粒子(例えば、各々が導入されることが求められる1つ以上の核酸を含む、乾燥酵母細胞、乾燥細菌又はバクテリオファージ)もまた、植物組織中に推進され得る。
ポリヌクレオチドの状況における「一過性形質転換」は、ポリヌクレオチドが細胞に導入され、細胞のゲノムに統合されないことを意味する。
本明細書で使用される場合、細胞に導入されるポリヌクレオチドの状況において、「安定的に導入する」、「安定的に導入される」、「安定な形質転換」、又は「安定的に形質転換される」は、導入されたポリヌクレオチドが細胞のゲノムに安定的に統合され、従って、細胞がポリヌクレオチドで安定的に形質転換されていることを意味する。従って、統合されたポリヌクレオチドは、その子孫によって、より詳細には、複数の連続した世代の子孫によって遺伝され得る。本明細書で使用される「ゲノム」は、核及び/又は色素体ゲノムを含み、従って、例えば、葉緑体ゲノムへのポリヌクレオチドの統合を含む。本明細書で使用される安定な形質転換はまた、染色体外に維持されるポリヌクレオチド(例えば、ミニ染色体)を指す。
一過性の形質転換は、例えば、酵素結合免疫吸着アッセイ(ELISA)又はウェスタンブロットによって検出され得、これは、生物に導入された1つ以上の核酸分子によってコードされるペプチド又はポリペプチドの存在を検出し得る。細胞の安定な形質転換は、例えば、生物(例えば、植物)に導入された核酸分子のヌクレオチド配列と特異的にハイブリダイズする核酸配列を用いた細胞のゲノムDNAのサザンブロットハイブリダイゼーションアッセイによって検出され得る。細胞の安定な形質転換は、例えば、植物又は他の生物に導入された核酸分子のヌクレオチド配列と特異的にハイブリダイズする核酸配列を用いた細胞のRNAのノーザンブロットハイブリダイゼーションアッセイによって検出することができる。細胞の安定な形質転換はまた、例えば、ポリメラーゼ連鎖反応(PCR)又は当技術分野で周知の他の増幅反応によって検出することができ、核酸分子の標的配列とハイブリダイズする特異的プライマー配列を使用し、標的配列の増幅をもたらし、これは、標準的な方法に従って検出され得る。形質転換はまた、当技術分野で周知の直接配列決定及び/又はハイブリダイゼーションプロトコルによって検出することができる。
従って、本発明の特定の実施形態において、植物細胞は、当技術分野で既知の任意の方法によって、また本明細書に記載されるように、形質転換され得、無傷の植物は、種々の既知の技術のいずれかを使用して、これらの形質転換細胞から再生され得る。植物細胞、植物組織培養物及び/又は培養プロトプラストからの植物再生は、例えば、Evans et al.(Handbook of Plant Cell Cultures,Vol.1,MacMilan Publishing Co.New York(1983));及びVasil I.R.(ed.)(Cell Culture and Somatic Cell Genetics of Plants,Acad.Press,Orlando,Vol.I(1984),and Vol.II(1986))に記載されている。形質転換された遺伝子導入植物、植物細胞、及び/又は植物組織培養物を選択する方法は、当技術分野で慣用的であり、本明細書に提供される本発明の方法において使用され得る。
「形質転換及び再生プロセス」は、植物細胞に導入遺伝子を安定的に導入し、遺伝子導入植物細胞から植物を再生するプロセスを指す。本明細書で使用される場合、形質転換及び再生は、形質転換された細胞が選択剤の存在下で生存し、発達的に繁殖するように、導入遺伝子が選択マーカーを含み、形質転換された細胞が導入遺伝子を組み込んで発現する選択プロセスを含む。「再生」は、植物細胞、植物細胞の群、又は植物片、例えばプロトプラスト、カルス、又は組織部分から植物全体を成長させることを指す。
「ヌクレオチド配列」、「核酸」、「核酸配列」、「核酸分子」、「オリゴヌクレオチド」及び「ポリヌクレオチド」という用語は、本明細書において、ヌクレオチドのヘテロポリマーを指すために互換的に使用され、cDNA、ゲノムDNA、mRNA、合成(例えば、化学的に合成された)DNA又はRNA、並びにRNA及びDNAのキメラを含むRNA及びDNAの両方を包含する。核酸分子という用語は、鎖の長さに関係なくヌクレオチドの鎖を指す。ヌクレオチドは、糖、リン酸、及びプリン又はピリミジンのいずれかである塩基を含む。核酸分子は、二本鎖又は一本鎖であり得る。一本鎖の場合、核酸分子は、センス鎖又はアンチセンス鎖であり得る。核酸分子は、オリゴヌクレオチド類似体又は誘導体(例えば、イノシン又はホスホロチオエートヌクレオチド)を用いて合成することができる。このようなオリゴヌクレオチドは、例えば、変化した塩基対合能力又はヌクレアーゼに対する増大した耐性を有する核酸分子を調製するために使用され得る。本明細書に提供される核酸配列は、左から右への5’から3’方向に提示され、米国配列規則、37 CFR§§1.821-1.825及び世界知的所有権機関(WIPO)規格ST.25に記載されているヌクレオチド文字を表すための標準コードを使用して表される。
「核酸断片」は、所与の核酸分子の断片である。「RNA断片」は、所与のRNA分子の断片である。「DNA断片」は、所与のDNA分子の断片である。「核酸断片」は、所与の核酸分子の断片であり、分子から単離されていない。「RNA断片」は、所与のRNA分子の断片であり、分子から単離されていない。「DNA断片」は、所与のDNA分子の断片であり、分子から単離されていない。ポリヌクレオチドのセグメントは、任意の長さ、例えば、少なくとも5、10、15、20、25、30、40、50、75、100、150、200、300又は500以上のヌクレオチド長であり得る。ガイド配列のセグメント又は部分は、ガイド配列の約50%、40%、30%、20%、10%、例えば、ガイド配列の3分の1以下、例えば、7、6、5、4、3、又は2ヌクレオチド長であり得る。
分子の状況における「に由来する」という用語は、親分子又はその親分子からの情報を使用して単離又は作製された分子を指す。例えば、Cas9単一変異体ニッカーゼ及びCas9二重変異体ヌル-ヌクレアーゼは、各々、野生型Cas9タンパク質に由来する。
高等植物において、デオキシリボ核酸(DNA)は遺伝物質であり、一方、リボ核酸(RNA)は、DNA内に含まれる情報のタンパク質への転移に関与する。「ゲノム」は、生物の各細胞に含まれる遺伝物質の全体である。他に示されない限り、本発明の特定の核酸配列はまた、その保存的に改変されたバリアント(例えば、縮重コドン置換)及び相補的配列並びに明示的に示される配列を暗黙に包含する。具体的には、縮重コドン置換は、1つ以上の選択された(又は全ての)コドンの第3の位置が混合塩基及び/又はデオキシイノシン残基で置換される配列を生成することによって達成され得る(Batzer et al.,Nucleic Acid Res.19:5081(1991);Ohtsuka et al.,J.Biol.Chem.260:2605-2608(1985);及びRossolini et al.,Mol.Cell.Probes 8:91-98(1994))。核酸分子という用語は、遺伝子、cDNA、及び遺伝子によってコードされるmRNAと互換的に使用される。
本明細書で使用される「配列同一性」は、成分(例えば、ヌクレオチド又はアミノ酸)のアライメントのウィンドウ全体にわたって、2つの最適に整列されたポリヌクレオチド又はペプチド配列が不変である程度を指す。「同一性」は、Computational Molecular Biology(Lesk,A.M.,ed.)Oxford University Press,New York(1988);Biocomputing:Informatics and Genome Projects(Smith,D.W.,ed.)Academic Press,New York(1993);Computer Analysis of Sequence Data,Part I(Griffin,A.M.,and Griffin,H.G.,eds.)Humana Press,New Jersey(1994);Sequence Analysis in Molecular Biology(von Heinje,G.,ed.)Academic Press(1987);及びSequence Analysis Primer(Gribskov,M.and Devereux,J.,eds.)Stockton Press,New York(1991)に記載されているものを含むがこれらに限定されない、既知の方法によって容易に計算することができる。
本明細書で使用される場合、「配列同一性パーセント」又は「同一性パーセント」という用語は、2つの配列が最適に整列される場合の試験(「対象」)ポリヌクレオチド分子(又はその相補鎖)と比較した、参照(「問い合わせ」)ポリヌクレオチド分子(又はその相補鎖)の線状ポリヌクレオチド配列中の同一ヌクレオチドの百分率を指す。いくつかの実施形態では、「同一性パーセント」は、アミノ酸配列中の同一アミノ酸の百分率を指すことができる。
本明細書で使用される場合、「実質的に同一」という表現は、2つの核酸分子、ヌクレオチド配列又はタンパク質配列の状況において、以下の配列比較アルゴリズムのうちの1つを使用して、又は目視検査によって測定して、最大対応について比較及び整列された場合に、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%のヌクレオチド又はアミノ酸残基の同一性を有する2つ以上の配列又はサブ配列を指す。本発明のいくつかの実施形態では、実質的な同一性は、長さが少なくとも約50残基~約150残基である配列の領域にわたって存在する。従って、本発明のいくつかの実施形態では、実質的な同一性は、長さが少なくとも約50、約60、約70、約80、約90、約100、約110、約120、約130、約140、約150、又はそれを超える残基である配列の領域にわたって存在する。いくつかの特定の実施形態では、配列は、少なくとも約150残基にわたって実質的に同一である。さらなる実施形態では、配列は、コード領域の全長にわたって実質的に同一である。さらに、代表的な実施形態では、実質的に同一のヌクレオチド又はタンパク質配列は、実質的に同じ機能を行う(例えば、特定のゲノム標的への誘導、特定のゲノム標的部位のエンドヌクレアーゼ切断)。
配列比較のために、典型的には、1つの配列が、試験配列が比較される参照配列として機能する。配列比較アルゴリズムを使用する場合、試験配列及び参照配列をコンピュータに入力し、必要に応じてサブ配列座標を指定し、配列アルゴリズムプログラムパラメーターを指定する。次いで、配列比較アルゴリズムは、指定されたプログラムパラメーターに基づいて、参照配列に対する試験配列の配列同一性パーセントを計算する。
比較ウィンドウを整列させるための配列の最適なアライメントは、当業者に周知であり、Smith及びWatermanの局所相同性アルゴリズム、Needleman及びWunschの相同性アライメントアルゴリズム、Pearson及びLipmanの類似性方法の検索等のツールによって、及び任意に、GCG(登録商標)Wisconsin Package(登録商標)(Accelrys Inc.、San Diego、CA)の一部として入手可能なGAP、BESTFIT、FASTA及びTFASTA等のこれらのアルゴリズムのコンピュータ化された実装によって、実施することができる。試験配列及び参照配列の整列されたセグメントについての「同一性分数」は、2つの整列された配列によって共有される同一の成分の数を、参照配列セグメント(即ち、参照配列全体又は参照配列のより小さい規定された部分)中の成分の総数で割ったものである。配列同一性パーセントは、同一性分数に100を掛けたものとして表される。1つ以上のポリヌクレオチド配列の比較は、全長ポリヌクレオチド配列若しくはその一部、又はより長いポリヌクレオチド配列に対するものであり得る。本発明の目的のために、「同一性パーセント」はまた、翻訳されたヌクレオチド配列については、BLASTXバージョン2.0を使用し、ポリヌクレオチド配列については、BLASTNバージョン2.0を使用して決定され得る。
BLAST分析を実施するためのソフトウェアは、National Center for Biotechnology Informationを通して公的に入手可能である。このアルゴリズムは、最初に、問い合わせ配列中の長さWの短いワードを同定することによって、高スコア配列対(HSP)を同定することを含み、これは、データベース配列中の同じ長さのワードと整列された場合に、いくつかの正の値の閾値スコアTと一致するか、又は満たす。Tは、近傍ワードスコア閾値と称される(Altschul et al.、1990)。これらの最初の近傍ワードヒットは、それらを含むより長いHSPを見出すための検索を開始するための種として作用する。次いで、ワードヒットは、累積アライメントスコアが増加され得る限り、各配列に沿って両方向に伸長される。累積スコアは、ヌクレオチド配列について、パラメーターM(1対のマッチング残基に対する報酬スコア;常に>0)及びN(ミスマッチング残基に対するペナルティスコア;常に<0)を用いて算出される。アミノ酸配列については、スコアリングマトリックスを用いて累積スコアを計算する。各方向におけるワードヒットの延長は、累積アライメントスコアがその最大達成値から量Xだけ低下し、累積スコアが1つ以上の負のスコアリング残基アライメントの累積のためにゼロ以下になるか、又はいずれかの配列の末端に到達した場合に、停止される。BLASTアルゴリズムパラメーターW、T、及びXは、アライメントの感度及び速度を決定する。BLASTNプログラム(ヌクレオチド配列について)は、デフォルトとして、ワード長(W)11、期待値(E)10、カットオフ100、M=5、N=4、及び両方の鎖の比較を使用する。アミノ酸配列については、BLASTPプログラムは、デフォルトとして、ワード長(W)3、期待値(E)10、及びBLOSUM62スコアリングマトリックスを使用する(Henikoff & Henikoff,Proc.Natl.Acad.Sci.USA 89:10915(1989)を参照されたい)。
配列同一性パーセントを計算することに加えて、BLASTアルゴリズムはまた、2つの配列間の類似性の統計的分析を行う(例えば、Karlin & Altschul,Proc.Nat’l.Acad.Sci.USA 90:5873-5787(1993)を参照されたい)。BLASTアルゴリズムによって提供される類似性の1つの尺度は、最小合計確率(P(N))であり、これは、2つのヌクレオチド配列又はアミノ酸配列の間の一致が偶然に生じる確率の指標を提供する。例えば、試験核酸配列は、試験ヌクレオチド配列と参照ヌクレオチド配列との比較における最小合計確率が約0.1未満~約0.001未満である場合、参照配列に類似すると考えられる。従って、本発明のいくつかの実施形態では、試験ヌクレオチド配列と参照ヌクレオチド配列との比較における最小合計確率は、約0.001未満である。
2つのヌクレオチド配列はまた、2つの配列がストリンジェントな条件下で互いにハイブリダイズする場合、実質的に同一と考えられ得る。いくつかの代表的な実施形態では、実質的に同一であると考えられる2つのヌクレオチド配列は、高度にストリンジェントな条件下で互いにハイブリダイズする。
核酸ハイブリダイゼーション実験、例えばサザン及びノーザンハイブリダイゼーションの状況における「ストリンジェントなハイブリダイゼーション条件」及び「ストリンジェントなハイブリダイゼーション洗浄条件」は、配列依存性であり、異なる環境パラメーターの下で異なっている。核酸のハイブリダイゼーションの広範な指針は、Tijssen Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes part I chapter 2“Overview of principles of hybridization and the strategy of nucleic acid probe assays”Elsevier,New York(1993)に見出される。一般に、高度にストリンジェントなハイブリダイゼーション及び洗浄条件は、規定されたイオン強度及びpHにおける特異的配列についての熱融点(Tm)よりも約5℃低くなるように選択される。
mとは、標的配列の50%が完全に一致するプローブとハイブリダイズする(規定のイオン強度及びpHの下での)温度である。非常にストリンジェントな条件は、特定のプローブについてのTmに等しくなるように選択される。サザン又はノーザンブロットにおいてフィルター上に100を超える相補的残基を有する相補的ヌクレオチド配列のハイブリダイゼーションのためのストリンジェントなハイブリダイゼーション条件の例は、42℃での50%ホルムアミドと1mgのヘパリンであり、ハイブリダイゼーションは、一晩行われる。高度にストリンジェントな洗浄条件の例は、72℃で約15分間、0.1 5M NaClである。ストリンジェントな洗浄条件の例は、65℃で15分間の0.2x SSC洗浄である(SSC緩衝液の記載については、下記のSambrookを参照されたい)。しばしば、バックグラウンドプローブシグナルを除去するために、高ストリンジェンシー洗浄の前に、低ストリンジェンシー洗浄が行われる。例えば、100ヌクレオチドを超える二重鎖についての中程度のストリンジェンシー洗浄の例は、45℃で15分間の1x SSCである。例えば、100ヌクレオチドを超える二重鎖についての低ストリンジェンシー洗浄の例は、40℃で15分間の4~6x SSCである。短いプローブ(例えば、約10~50ヌクレオチド)の場合、ストリンジェントな条件は、典型的には、約1.0M未満のNaイオンの塩濃度、典型的には、pH7.0~8.3で約0.01~1.0MのNaイオン濃度(又は他の塩)を含み、温度は、典型的には、少なくとも約30℃である。ストリンジェントな条件は、ホルムアミド等の不安定化剤の添加によっても達成することができる。一般に、特定のハイブリダイゼーションアッセイにおいて無関係なプローブについて観察されるものよりも2倍(又はそれよりも高い)のシグナル対ノイズ比は、特異的ハイブリダイゼーションの検出を示す。ストリンジェントな条件下で互いにハイブリダイズしないヌクレオチド配列は、それらがコードするタンパク質が実質的に同一である場合、なお実質的に同一である。これは、例えば、ヌクレオチド配列のコピーが遺伝暗号によって許容される最大コドン縮重を用いて作製される場合に起こり得る。
以下は、本発明の参照ヌクレオチド配列と実質的に同一である相同ヌクレオチド配列をクローニングするために使用され得るハイブリダイゼーション/洗浄条件のセットの例である。一実施形態では、参照ヌクレオチド配列は、50℃で7%ドデシル硫酸ナトリウム(SDS)、0.5M NaPO4、1mM EDTA中の「試験」ヌクレオチド配列とハイブリダイズし、50℃で2X SSC、0.1% SDS中で洗浄する。別の実施形態では、参照ヌクレオチド配列は、50℃で7%ドデシル硫酸ナトリウム(SDS)、0.5M NaPO4、1mM EDTA中の「試験」ヌクレオチド配列とハイブリダイズし、50℃で1X SSC、0.1% SDS中で洗浄し、又は50℃で7%ドデシル硫酸ナトリウム(SDS)、0.5M NaPO4、1mM EDTA中の「試験」ヌクレオチド配列とハイブリダイズし、50℃で0.5X SSC、0.1% SDS中で洗浄する。なおさらなる実施形態では、参照ヌクレオチド配列は、50℃で7%ドデシル硫酸ナトリウム(SDS)、0.5M NaPO4、1mM EDTA中の「試験」ヌクレオチド配列とハイブリダイズし、50℃で0.1X SSC、0.1% SDS中で洗浄し、又は50℃で7%ドデシル硫酸ナトリウム(SDS)、0.5M NaPO4、1mM EDTA中の「試験」ヌクレオチド配列とハイブリダイズし、65℃で0.1X SSC、0.1% SDS中で洗浄する。
「単離された」核酸分子若しくはヌクレオチド配列又は「単離された」ポリペプチドは、ヒトの手によって、その天然の環境とは別に存在し、及び/又はその天然の環境におけるその機能と比較して異なる、改変された、調節された、及び/又は変更された機能を有し、従って天然の産物ではない、核酸分子、ヌクレオチド配列又はポリペプチドである。単離された核酸分子又は単離されたポリペプチドは、精製された形態で存在し得るか、又は非天然環境(例えば、組換え宿主細胞)において存在し得る。従って、例えば、ポリヌクレオチドに関して、単離されるという用語は、それが天然に存在する染色体及び/又は細胞から分離されることを意味する。ポリヌクレオチドはまた、それが天然に存在する染色体及び/又は細胞から分離され、次いで遺伝的状況、染色体、染色体位置、及び/又はそれが天然に存在しない細胞に挿入される場合、単離される。本発明の組換え核酸分子及びヌクレオチド配列は、上記で定義したように「単離された」と考えることができる。
従って、「単離された核酸分子」又は「単離されたヌクレオチド配列」は、それが由来する生物の天然に存在するゲノムにおいて、それが直接隣接している(5’末端に1つ、3’末端に1つ)ヌクレオチド配列に対して直接隣接していない核酸分子又はヌクレオチド配列である。従って、一実施形態では、単離された核酸は、コード配列に直接隣接する5’非コード(例えば、プロモーター)配列のいくつか又は全てを含む。従って、この用語は、例えば、ベクター、自律複製プラスミド若しくはウイルス、又は原核生物若しくは真核生物のゲノムDNAに組み込まれるか、又は他の配列とは無関係に別個の分子(例えば、PCR又は制限エンドヌクレアーゼ処理によって産生されるcDNA又はゲノムDNA断片)として存在する組換え核酸を含む。それはまた、さらなるポリペプチド又はペプチド配列をコードするハイブリッド核酸分子の一部である組換え核酸を含む。「単離された核酸分子」又は「単離されたヌクレオチド配列」はまた、同じ天然の元の細胞型に由来し、挿入されるが、非天然の状態で存在する、例えば異なるコピー数で存在する、及び/又は核酸分子の天然の状態で見出されるものとは異なる調節配列の制御下で存在する、ヌクレオチド配列を含み得る。
「単離された」という用語は、さらに、細胞物質、ウイルス物質、及び/又は培養培地を実質的に含まない核酸分子、ヌクレオチド配列、ポリペプチド、ペプチド、又は断片(例えば、組換えDNA技術によって生成された場合)、又は化学的前駆体若しくは他の化学物質(例えば、化学的に合成された場合)を指すことができる。さらに、「単離された断片」は、断片として天然には存在せず、そのようなものとして天然の状態では見出されない核酸分子、ヌクレオチド配列、又はポリペプチドの断片である。「単離された」は、調製物が技術的に純粋(均質)であることを必ずしも意味しないが、意図された目的のために使用することができる形態でポリペプチド又は核酸を提供するのに十分に純粋である。
本発明の代表的な実施形態では、「単離された」核酸分子、ヌクレオチド配列、及び/又はポリペプチドは、少なくとも約5%、10%、15%、20%、25%、30%、40%、50%、60%、70%、75%、80%、85%、90%、95%、97%、98%、99%(w/w)又はそれを超える純度である。他の実施形態では、「単離された」核酸、ヌクレオチド配列、及び/又はポリペプチドは、出発物質と比較して、核酸(w/w)の少なくとも約5倍、10倍、25倍、100倍、1000倍、10,000倍、100,000倍又はそれを超える濃縮が達成されていることを示す。
「野生型」ヌクレオチド配列又はアミノ酸配列は、天然に存在する(「天然」)又は内因性のヌクレオチド配列又はアミノ酸配列を指す。従って、例えば、「野生型mRNA」は、生物内に天然に存在する、又は生物に内因性のmRNAである。「相同」ヌクレオチド配列は、それが導入される宿主細胞に天然に関連するヌクレオチド配列である。
「オープンリーディングフレーム」及び「ORF」という用語は、コード配列の翻訳開始コドンと終結コドンとの間にコードされるアミノ酸配列を指す。「開始コドン」及び「終結コドン」という用語は、各々、タンパク質合成(mRNA翻訳)の開始及び連鎖終結を指定するコード配列中の3つの隣接するヌクレオチド(「コドン」)の単位を指す。
「プロモーター」は、通常そのコード配列の上流(5’)にあるヌクレオチド配列を指し、これはRNAポリメラーゼ及び適切な転写に必要な他の因子に対する認識を提供することによってコード配列の発現を制御する。「プロモーター調節配列」は、近位及びより遠位の上流エレメントから成る。プロモーター調節配列は、関連するコード配列の転写、RNAプロセシング又は安定性、又は翻訳に影響を及ぼす。調節配列には、エンハンサー、プロモーター、非翻訳リーダー配列、イントロン、及びポリアデニル化シグナル配列が含まれる。これらには、天然及び合成配列、並びに天然及び合成配列の組み合わせであり得る配列が含まれる。「エンハンサー」は、プロモーター活性を刺激し得るDNA配列であり、プロモーターの生得的エレメント、又はプロモーターのレベル若しくは組織特異性を高めるために挿入された異種エレメントであり得る。エンハンサーは、両方の配向(通常又は反転)で作動することができ、プロモーターから上流又は下流のいずれかに移動させても機能することができる。「プロモーター」という用語の意味は、「プロモーター調節配列」を含む。
「一次形質転換体」及び「T0世代」は、最初に形質転換された(即ち、形質転換から減数分裂及び受精を経ていない)組織と同じ遺伝的世代である遺伝子導入植物を指す。「二次形質転換体」及び「T1、T2、T3等の世代」は、1つ以上の減数分裂及び受精サイクルを経て一次形質転換体に由来する遺伝子導入植物を指す。これらは、一次若しくは二次形質転換体の自家受精、又は一次若しくは二次形質転換体と他の形質転換された若しくは形質転換されていない植物との交配によって誘導され得る。
「導入遺伝子」は、形質転換によってゲノムに導入され、安定的に維持されている核酸分子を指す。導入遺伝子は、少なくとも1つの発現カセットを含んでもよく、典型的には、少なくとも2つの発現カセットを含み、10以上の発現カセットを含んでもよい。導入遺伝子には、例えば、形質転換される特定の植物の遺伝子と異種又は同種の遺伝子が含まれ得る。さらに、導入遺伝子には、非天然生物に挿入された天然遺伝子、又はキメラ遺伝子が含まれ得る。「内因性遺伝子」という用語は、生物のゲノム中の天然位置にある天然遺伝子を指す。「外来」遺伝子は、宿主生物には通常見られないが、遺伝子導入によって生物に導入される遺伝子を指す。
「イントロン」は、ほとんど真核生物の遺伝子内にのみ存在するが、遺伝子産物中のアミノ酸配列には翻訳されないDNAの介在区分を指す。イントロンは、スプライシングと呼ばれるプロセスを経て未熟なmRNAから除去され、スプライシングは、エクソンをそのままに残してmRNAを形成する。本発明の目的のために、「イントロン」という用語の定義は、標的遺伝子に由来するイントロンのヌクレオチド配列に対する改変を含むが、但し、改変されたイントロンは、その関連する5’調節配列の活性を有意に低下させないことを条件とする。
「エクソン」は、タンパク質又はその一部のコード配列を有するDNAの部分を指す。エクソンは、介在する非コード配列(イントロン)によって分離されている。本発明の目的のために、「エクソン」という用語の定義は、標的遺伝子に由来するエクソンのヌクレオチド配列に対する改変を含むが、但し、改変されたエクソンは、その関連する5’調節配列の活性を有意に低下させないことを条件とする。
「切断」又は「切断している」という用語は、ポリヌクレオチドのリボシルホスホジエステルバックボーンにおける共有結合ホスホジエステル結合の切断を意味する。「切断」又は「切断している」という用語は、一本鎖切断及び二本鎖切断の両方を包含する。二本鎖切断は、2つの異なる一本鎖切断事象の結果として起こり得る。切断は、平滑末端又は互い違いの末端のいずれかの生成をもたらすことができる。「ヌクレアーゼ切断部位」又は「ゲノムヌクレアーゼ切断部位」は、特定のヌクレアーゼによって認識されるヌクレアーゼ切断配列を含むヌクレオチドの領域であり、これは、一方又は両方の鎖においてゲノムDNAのヌクレオチド配列を切断するように作用する。ヌクレアーゼ酵素によるこのような切断は、細胞内でDNA修復機構を開始させ、それが相同組換えを起こすための環境を確立する。
本発明は、融合タンパク質であって、デアミナーゼドメインと部位特異的DNA結合ドメインとの間のリンカーが改善されており、それにより編集効率が上昇しており且つ変異頻度が低下している、融合タンパク質を提供する。本発明の一部の実施形態では、デアミナーゼドメインは、シチジンデアミナーゼである。本発明の他の実施形態では、デアミナーゼドメインは、アデニンデアミナーゼである。一部の実施形態では、シチジンデアミナーゼドメインは、活性化誘導シチジンデアミナーゼ(「AID」)である。本発明の一部の実施形態では、シチジンデアミナーゼドメインは、アポリポタンパク質B mRNA編集複合体(「APOBEC」)ドメインである。一部の実施形態では、このAPOBECドメインは、APOBEC1ファミリデアミナーゼである。
「シチジンデアミナーゼ」は、シチジン及びデオキシシチジンそれぞれのウリジン及びデオキシウリジンへの不可逆的な加水分解的脱アミノ化を触媒する酵素を指す。シチジンデアミナーゼは、細胞内ピリミジンプールを維持する。シチジンデアミナーゼのあるファミリは、APOBEC(「アポリポタンパク質B mRNA編集酵素、触媒ポリペプチド様」)である。このファミリのメンバーは、CからUへの編集酵素である。APOBEC様タンパク質のN末端ドメインは触媒ドメインであり、C末端ドメインは疑似触媒ドメインである。より具体的には、この触媒ドメインは、亜鉛依存性のシチジンデアミナーゼドメインであり、シチジン脱アミノ化に重要である。APOBEC1によるRNA編集にはホモ二量体化が必要であり、この複合体は、RNA結合タンパク質と相互作用してエディトソーム(editosome)を形成する。APOBECタンパク質の非限定的な例として、APOBEC1、APOBEC2、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D、APOBEC3F、APOBEC3G、APOBEC3H、APOBEC4、及び活性化誘導(シチジン)デアミナーゼが挙げられる。APOBECタンパク質の様々な変異体であって、塩基エディタに対して異なる編集特性をもたらす変異体も既知である。例えば、ヒトAPOBEC3Aの場合には、ある特定の変異体(例えば、Y130F、Y132D、W104A、及びD131Y)は、編集効率という点で、野生型ヒトAPOBEC3Aよりもさらに優れている。従って、APOBECという用語、及びそのファミリメンバーのそれぞれはまた、対応する野生型APOBECタンパク質に対してある特定レベル(例えば、70%、75%、80%、85%、90%、95%、98%、99%)の配列同一性を有し且つシチジン脱アミノ化活性を保持するバリアント及び変異体も包含する。これらバリアント及び変異体を、アミノ酸の付加、欠失、及び/又は置換により誘導し得る。そのような置換は、一部の実施形態では、保存的置換である。
「シトシン塩基エディタ」(「CBE」)は、C・G塩基対をT・A塩基対へと変換する。
「アデニンデアミナーゼ」は、アデノシンのイノシンへの加水分解的脱アミノ化を触媒する酵素を指す。イノシンはCと対を形成し、従ってGとして読み取られるか、又はGとして複製される。例示的な酵素は、大腸菌(E.coli)由来のTadAであり、このTadAは、ホモ二量体として機能する。
「アデニン塩基エディタ」(「ABE」)は、A・T塩基対をG・C塩基対へと変換する。
ラクノスピラ科細菌(Lachnospiraceae bacterium)Cpf1(LbCpf1)は、大きい群の多くのCpf1タンパク質の内の1つである。「Cpf1」及び「Cas12a」という用語は、全体を通して互換的に使用される。Cpf1は、Casタンパク質である。「Casタンパク質」又は「クラスター化して規則的な配置の短い回文配列リピート(CRISPR)関連(Cas)タンパク質」という用語は、例えばストレプトコッカス・ピオゲネス(Streptococcus pyogenes)及び他の細菌で見出される適応免疫系であるCRISPR(クラスター化して規則的な配置の短い回文配列リピート)と関連するRNA誘導DNAエンドヌクレアーゼ酵素を指す。Casタンパク質として、Cas9、Cas12、Cas12b、Cas12i、Cas12j等が挙げられる。本発明の一部の実施形態では、部位特異的DNA結合ドメインは、ラクノスピラ科細菌(Lachnospiraceae bacterium)由来の触媒的に不活性なCas12a(「dLbCas12a」)である。他の実施形態では、部位特異的DNA結合ドメインは、ラクノスピラ科細菌(Lachnospiraceae bacterium)由来の触媒的に活性なもの(「LbCas12a」)又はモラクセラ・ボーボクリ(Moraxella bovoculi)AAX08_00205由来の触媒的に活性なもの(「Mb2Cas12a」)である。本発明の一部の実施形態では、融合タンパク質の部位特異的DNA結合ドメインとして、ラクノスピラ科細菌(Lachnospiraceae bacterium)、アシダミノコッカス種(Acidaminococcus sp.)、モラクセラ・ボーボクリ(Moraxella bovoculi)、チオミクロスピラ種(Thiomicrospira sp.)、モラクセラ・ラクナータ(Moraxella lacunata)、メタノメチルオフィルス・アルバス(Methanomethylophilus alvus)、ブチリビブリオ種(Btyrivibrio sp.)、又はバクテロイデテソラル種(Bacteroidetesoral sp.)由来のCas12aタンパク質が提供される。
本融合タンパク質は、ウラシルDNAグリコシラーゼインヒビター(UGI)及び核局在化配列(NLS)等の他の断片を含み得る。
バチルス・スブチリス(Bacillus subtilis)バクテリオファージPBS1から調製され得る「ウラシルグリコシラーゼインヒビター」(UGI)は、大腸菌(E.coli)ウラシル-DNAグリコシラーゼ(UDG)及び他種由来のUDGを阻害する低分子タンパク質(9.5kDa)である。UDGの阻害は、1:1 UGD:UGI化学量論での可逆的タンパク質結合により起こる。UGIは、UDG-DNA複合体を解離させ得る。UGIの非限定的な例は、バチルス(Bacillus)ファージAR9で見出される(YP_009283008.1)。一部の実施形態では、UGIは、配列番号8のアミノ酸配列を含むか、又は配列番号8に対して少なくとも70%、75%、80%、85%、90%、又は95%の配列同一性を有し、且つウラシルグリコシラーゼ阻害活性を保持する。
一部の実施形態では、UGIは、シチジンデアミナーゼ-Cpf1部分のC末端側に配置されている。一部の実施形態では、本融合タンパク質は、少なくとも2個のUGIを含む。
一部の実施形態では、少なくとも1個の核局在化シグナル(「NLC」)が第1の断片及び第2の断片(シチジンデアミナーゼ-Cpf1部分)のC末端に位置しており、例えば、第2の断片(Cpf1を含む)とUGIとの間に位置している。一部の実施形態では、少なくとも2個のNLSが、第2の断片とUGIとの間に位置している。一部の実施形態では、少なくとも3個のNLSが、第2の断片とUGIとの間に位置している。一部の実施形態では、少なくとも1個のNLSが、第1の断片及び第2の断片(シチジンデアミナーゼ-Cpf1部分)のN末端に位置している。
本融合タンパク質中の構成成分の配置の非限定的な例として、下記が挙げられる:N末端からC末端へ、(a)NLS、シチジンデアミナーゼ、Cas12a、NLS、UGI、NLS、2A、及びUGI;(b)NLS、シチジンデアミナーゼ、Cas12a、NLS、NLS、UGI、NLS、2A、及びUGI;(c)NLS、シチジンデアミナーゼ、Cas12a、NLS、UGI、NLS、2A、UGI、2A、及びUGI;(d)NLS、シチジンデアミナーゼ、Cas12a、NLS、UGI、NLS、2A、UGI、2A、UGI、2A、及びUGI。
一部の実施形態では、本融合タンパク質中のそれぞれの断片の間には、ペプチドリンカーが任意選択的に設けられている。一部の実施形態では、このペプチドリンカーは、1~100個のアミノ酸残基(又は限定されないが、3~20個、4~15個)を有する。一部の実施形態では、ペプチドリンカーのアミノ酸残基の少なくとも10%、20%、30%、40%、50%、60%、70%、80%、又は90%は、アラニン、グリシン、システイン、及びセリンからなる群から選択されるアミノ酸残基である。
本発明はまた、本発明のガイドRNAをコードする核酸配列を含む核酸分子を提供する。この核酸分子は、DNA又はRNA分子であり得る。いくつかの実施形態では、この核酸分子は、環状化されている。他の実施形態では、この核酸分子は、線状である。いくつかの実施形態では、この核酸分子は、一本鎖、部分二本鎖、又は二本鎖である。いくつかの実施形態では、この核酸分子は、少なくとも1つのポリペプチドと複合体化される。ポリペプチドは、核酸認識ドメイン又は核酸結合ドメインを有し得る。いくつかの実施形態では、ポリペプチドは、例えば、本発明のキメラRNA及び任意にヌクレアーゼの送達を媒介するためのシャトルである。いくつかの実施形態では、ポリペプチドは、Feldanシャトル(米国特許出願公開第20160298078号明細書、参照により本明細書に組み込まれる)である。
「オンターゲット編集」とは、gRNAの標的であるPAM部位の後に続く領域におけるシトシンからチミンへの置換のことである。主な編集ウィンドウは、PAM部位の後に続く8~13個の塩基である。「オフターゲット編集」とは、gRNA標的領域内でのインデル若しくはCからT以外の塩基変更のことであるか、又はgRNA標的領域外での塩基変更若しくはインデルのことである。
「部位特異的改変ポリペプチド」は、標的DNA(例えば、標的DNAの切断又はメチル化)及び/又は標的DNAに関連するポリペプチド(例えば、ヒストン尾部のメチル化又はアセチル化)を改変する。部位特異的改変ポリペプチドは、本明細書では、「部位特異的ポリペプチド」又は「RNA結合部位特異的改変ポリペプチド」とも称される。部位特異的改変ポリペプチドは、単一RNA分子又は少なくとも2つのRNA分子のRNA二重鎖のいずれかであり、且つガイドRNAとの関係により、DNA配列(例えば、染色体配列又は染色体外配列、例えば、エピソーム配列、ミニサークル配列、ミトコンドリア配列、葉緑体配列等)に導かれるガイドRNAと相互作用する。
いくつかの場合、部位特異的改変ポリペプチドは、天然に存在する改変ポリペプチドである。他の場合、部位特異的改変ポリペプチドは、天然に存在しないポリペプチド(例えば、キメラポリペプチド又は改変された、例えば、変異、削除、挿入された天然に存在するポリペプチド)である。例示的な天然に存在する部位特異的改変ポリペプチドは、当技術分野で既知である(例えば、Makarova et al.,2017,Cell 168:328-328.e1,及びShmakov et al.,2017,Nat Rev Microbiol 15(3):169-182参照、両方とも参照により本明細書に組み込まれる)。これらの天然に存在するポリペプチドは、DNA標的化RNAに結合し、それにより標的DNA内の特異的配列に誘導され、標的DNAを切断して二本鎖切断を生成する。
部位特異的改変ポリペプチドは、2つの部分、RNA結合部分及び活性部分を含む。いくつかの実施形態では、部位特異的改変ポリペプチドは、以下を含む:(i)DNA標的化RNAと相互作用するRNA結合部分、ここでDNA標的化RNAは、標的DNAにおける配列に相補的なヌクレオチド配列を含む;及び(ii)部位特異的酵素活性(例えば、DNAメチル化についての活性、DNA切断についての活性、ヒストンアセチル化についての活性、ヒストンメチル化についての活性等)を示す活性部分、ここで酵素活性の部位は、DNA標的化RNAによって決定される。他の実施形態では、部位特異的改変ポリペプチドは、以下を含む:(i)DNA標的化RNAと相互作用するRNA結合部分、ここでDNA標的化RNAは、標的DNAにおける配列に相補的なヌクレオチド配列を含む;及び(ii)標的DNA内の転写を調節する(例えば、転写を増加又は低下させるために)活性部分、ここで標的DNA内の調節される転写の部位は、DNA標的化RNAによって決定される。
場合によっては、部位特異的改変ポリペプチドは、作動可能に連結されている異種ドメインを有する。この異種ドメインは、酵素又はシグナルペプチドであり得る。この異種ドメインが酵素ドメインである態様では、このドメインは、標的核酸を改変する酵素活性(例えば、ヌクレアーゼ活性、メチルトランスフェラーゼ活性、デメチラーゼ活性、DNA修復活性、DNA損傷活性、脱アミノ化活性、逆転写酵素活性、ジスムターゼ活性、アルキル化活性、メチル化活性、脱プリン活性、酸化活性、ピリミジン二量体形成活性、インテグラーゼ活性、トランスポサーゼ活性、リコンビナーゼ活性、ポリメラーゼ活性、リガーゼ活性、ヘリカーゼ活性、フォトリアーゼ活性、又はグリコシラーゼ活性)を持つ。他の場合では、部位特異的改変ポリペプチドは、作動可能に連結されている酵素ドメインを有しており、この酵素ドメインの酵素活性は、標的DNAと関連するポリペプチド(例えばヒストン)を改変する(例えば、メチルトランスフェラーゼ活性、デメチラーゼ活性、アセチルトランスフェラーゼ活性、デアセチラーゼ活性、キナーゼ活性、ホスファターゼ活性、ユビキチンリガーゼ活性、脱ユビキチン化活性、アデニル化活性、脱アデニル化活性、SUMO化活性、脱SUMO化活性、リボシル化活性、脱リボシル化活性、ミリストイル化活性、又は脱ミリストイル化活性)。例示的な酵素ドメインとして、単独か又は他の酵素ドメインとの組み合わせで、アデノシンデアミナーゼ、オキシダーゼ、チミンアルキルトランスフェラーゼ、アデニンオキシダーゼ、アデノシンメチルトランスフェラーゼ、アデノシンデアミナーゼ、グリコシラーゼが挙げられる。この異種ドメインがシグナルペプチドである態様では、このシグナルペプチドは、核局在化シグナル(「NLS」、例えばSV40 NLS)であり得る。
場合によって、異なる部位特異的改変ポリペプチド、例えば、異なるCas9タンパク質(すなわち、様々な種からのCas9タンパク質)は、異なるCas9タンパク質の様々な酵素学的性質(例えば、異なるPAM配列選好のため;増加若しくは減少した酵素活性のため;増加若しくは減少したレベルの細胞毒性のため;NHEJ、相同組換え修復、一本鎖切断、二本鎖切断の間のバランスを変化させるなど)を十分に利用するために本発明の様々な提供する方法において使用するのに有利であり得る。様々な種からのCas9タンパク質(例えば、Shmakov et al.,2017に開示されているもの、又はそれに由来するポリペプチド)は、標的DNAにおける異なるPAM配列を必要とし得る。従って、選択される特定のCas9酵素について、PAM配列の要件は、Cas9活性に必要であるとして既知の5’-N GG-3’配列(ここでNは、A、T、C、又はGのいずれかである)とは異なり得る。非常に様々な種からの多数のCas9オルソログが本明細書で特定されており、タンパク質は、僅かな同一のアミノ酸を共有する。特定された全Cas9オルソログは同じドメイン構造(architecture)を有し、中央HNHエンドヌクレアーゼドメイン及び分割RuvC/RNaseHドメインを有する。Cas9タンパク質は、保存された構造を有する4つの重要なモチーフを共有する;モチーフ1、2、及び4は、RuvC様モチーフである一方、モチーフ3はHNH-モチーフである。対照的に、様々な種由来のCas12aタンパク質は、TTTVのLbCas12aカノニカルPAMと比較して異なるPAM配列要件を有し得る。
部位特異的改変ポリペプチドはまた、キメラ及び改変CRISPR/Casヌクレアーゼであり得る。例えば、部位特異的改変ポリペプチドは、改変されたCas9「塩基エディタ」であり得る。塩基の編集により、DNA切断又はドナーDNA分子を必要とすることなく、プログラム可能な方法で、1つの標的DNA塩基を別の塩基に直接且つ不可逆的に変換することが可能となる。例えば、Komor et al(2016,Nature,533:420-424)は、Cas9-シチジンデアミナーゼ融合を教示し、ここでCas9も、不活性であり、二本鎖DNA切断を誘導しないように操作されている。加えて、Gaudelli et al(2017,Nature,doi:10.1038/nature24644)は、tRNAアデノシンデアミナーゼに融合した触媒的に障害されたCas9を教示し、これは標的DNA配列におけるA/TからG/Cへの変換を媒介し得る。本発明の方法及び組成物において部位特異的改変ポリペプチドとして作用し得る操作されたCas9ヌクレアーゼの別のクラスは、NG、GAA及びGATを含む幅広いPAM配列を認識できるバリアントである(Hu et al.,2018,Nature,doi:10.1038/nature26155)。
実施形態
一実施形態では、本発明者らは、N末端からC末端の方向に、異種ドメイン、第1のリンカー配列、及びV型CRISPR-Cas酵素を含む融合タンパク質であって、第1のリンカー配列は、反復GGGGS配列を含む、融合タンパク質を提供する。一態様では、この異種ドメインは、デアミナーゼ、ポリメラーゼ、ヌクレアーゼ、リラクサーゼ、アルキルトランスフェラーゼ、メチルトランスフェラーゼ、アデノシンデアミナーゼ、シチジンデアミナーゼ、オキシダーゼ、チミンアルキルトランスフェラーゼ、アデニンオキシダーゼ、アデノシンメチルトランスフェラーゼ、グリコシラーゼ、又は核局在化シグナルである。別の態様では、この異種ドメインは、デアミナーゼドメインである。さらに別の態様では、このデアミナーゼドメインは、シチジンデアミナーゼである。別の態様では、このシチジンデアミナーゼドメインは、活性化誘導シチジンデアミナーゼ(「AID」)である。さらに別の態様では、このシチジンデアミナーゼドメインは、アポリポタンパク質B mRNA編集複合体(「APOBEC」)ドメインである。別の態様では、このAPOBECドメインは、APOBEC1ファミリのデアミナーゼである。さらに別の態様では、このAPOBECドメインは、配列番号1と少なくとも70%同一の配列を含む。別の態様では、このデアミナーゼドメインは、アデニンデアミナーゼである。さらに別の態様では、このアデニンデアミナーゼは、配列番号92と少なくとも70%同一の配列を含むTadAドメインである。
一態様では、V型CRISPR-Cas酵素は、V-A型(「Cas12a」)酵素である。別の態様では、Cas12aドメインは、配列番号3、配列番号6、配列番号22、配列番号45、配列番号46、配列番号47、及び配列番号48で構成された群から選択される。さらに別の態様では、このCas12aドメインは、触媒的に不活性であり、且つ配列番号3、配列番号6、及び配列番号22で構成された群から選択される。
一態様では、第1のリンカー配列は、少なくとも3回反復されたGGGGSを含む。別の態様では、第1のリンカー配列は、少なくとも6回反復されたGGGGSを含む。
一態様では、融合タンパク質は、配列番号11、12、13、及び44からなる群から選択される配列を含む。別の態様では、融合タンパク質は、ウラシルDNAグリコシラーゼインヒビター(「UGI」)ドメインをさらに含む。さらに別の態様では、このUGIドメインは、配列番号8を含む。別の態様では、このUGIドメインは、配列SGGSを含む第2のリンカーによりCas12a酵素に連結されている。さらに別の態様では、融合タンパク質は、配列番号17、配列番号24、配列番号35、配列番号39、配列番号43、配列番号50、配列番号52、配列番号54、配列番号56、配列番号81、配列番号83、配列番号85、配列番号87、及び配列番号89からなる群から選択される配列を含む。別の態様では、融合タンパク質は、DNAと接触した場合には、反復GGGGS配列以外の第1のリンカー配列を有する融合タンパク質と比較して、高い頻度でオンターゲット編集を生じ、且つ低い頻度でオフターゲット編集を生じる。
別の実施形態では、本発明者らは、植物ゲノムDNAを編集する方法であって、植物ゲノムDNAと、(a)UGIドメインを任意に含む、上記態様の融合タンパク質、及び(b)工程(a)の融合タンパク質の標的を植物ゲノムDNAの標的DNA配列に定めるガイドRNA(「gRNA」)とを接触させることを含み、編集された植物ゲノムDNAは、反復GGGGS配列以外の第1のリンカーを有する融合タンパク質により編集された植物ゲノムDNAと比較してオフターゲット編集が低い、方法を提供する。
別の実施形態では、本発明者らは、低いオフターゲット編集で植物ゲノムDNAを編集する方法であって、植物ゲノムDNAと、(a)UGIドメインを任意に含む、上記態様の融合タンパク質、及び(b)工程(a)の融合タンパク質の標的を植物ゲノムDNAの標的DNA配列に定めるガイドRNA(「gRNA」)とを接触させることを含み、編集された植物ゲノムDNAは、反復GGGGS配列以外の第1のリンカーを有する融合タンパク質により編集された植物ゲノムDNAと比較してオフターゲット編集が低い、方法を提供する。態様では、この融合タンパク質は、配列番号24を含む。
別の実施形態では、本発明者らは、オフターゲット編集が低い編集植物の集団を得る方法であって、(a)編集するゲノムDNAを含む植物細胞の集団を得ること、(b)上記態様の融合タンパク質及び任意のUGIドメインをコードするヌクレオチド配列を得ること、(c)植物細胞の集団を工程(b)のヌクレオチド配列で形質転換させ、それにより、この植物細胞の集団内で、核酸配列によりコードされた融合タンパク質を発現させること、(d)形質転換された植物細胞の集団を植物へと成長させることであり、この植物の少なくとも1つは編集されている、成長させること、並びに(e)工程(d)の生成物から少なくとも1つの編集植物を選択し、それにより編集植物の集団を得ることを含み、編集植物の集団は、反復GGGGS配列以外の第1のリンカーを有する融合タンパク質により編集された植物と比較してオフターゲット編集が低い、方法を提供する。一態様では、融合タンパク質をコードするヌクレオチド配列は、配列番号17、配列番号24、配列番号35、配列番号39、配列番号43、配列番号50、配列番号52、配列番号54、配列番号56、配列番号81、配列番号83、配列番号85、配列番号87、及び配列番号89を含む。一部の実施形態では、改善されたリンカー配列により接続されている1個又は複数個のDNA結合ドメイン及び1個又は複数個のDNA改変ドメインを含む融合タンパク質をコードするコドン最適化ポリヌクレオチドが提供される。
下記の実施例は、例示的な実施形態を提供する。本開示及び当該技術分野の一般的な技術水準を考慮して、当業者は、下記の実施例は例示的であることのみが意図されていること、並びに本開示の主題の範囲を逸脱することなく多数の変化、改変、及び変更が採用され得ることを理解するだろう。
実施例1.dLbCas12a-BE及びガイドRNAの発現用のベクターの構築
本発明者らは、D832A/E925A/D1148A変異を含む触媒的に不活性なラクノスピラ科細菌(Lachnospiraceae bacterium)Cas12a(これ以降、「dLbCas12a」、dLbCpf1として既に既知である)、ラットシチジンデアミナーゼ(APOBEC1)、及びウラシルDNAグリコシラーゼインヒビター(UGI)を、アミノ酸リンカーにより連結して1個のタンパク質として融合させ、植物中での塩基編集に有利な性質を使用可能にした。この融合構築物をZea maysコドンに最適化させ、商業的に合成し(GenScript,Nanjing,China)、サトウキビユビキチン-4(SoUbi4)遺伝子プロモーター下でクローニングしてdLbCas12a-BEを構成的に生成した。
構築物24524のdLbCas12a-BEでは、核局在化シグナル(SV40-NLS)に、XTENタンパク質リンカーによりdLbCas12aに連結されたAPOBEC1が続き、さらに、SGGSリンカーによりUGIに連結されたSV40-NLSが続いた。SV40-NLSはまた、SGGSリンカーによりUGIのC末端にも組み込まれており、この融合タンパク質の核中へのターゲティングが改善された。トウモロコシ最適化コドンにより作製されたdLbCas12a-BEの合成配列は、配列番号18に記載されている。
構築物24904のdLbCas12a-BEでは、SV40-NLSに、(G4S)×6と称される6回のGGGGSアミノ酸反復を有する30個アミノ酸リンカーGGGGS GGGGS GGGGS GGGGS GGGGS GGGGS(配列番号11)によりdLbCas12aに連結されたAPOBEC1が続き、さらに、SGGSリンカーによりUGIに連結されたSV40NLSが続いた。SV40-NLSはまた、SGGSリンカーによりUGIのC末端にも組み込まれており、この融合タンパク質の核中へのターゲティングが改善された。トウモロコシ最適化コドンにより作製されたdLbCas12a-BEの合成配列は、配列番号23に記載されている。
構築物25057のdLbCas12a-BEでは、SV40-NLSに、XTENタンパク質リンカーによりdLbCas12aに連結されたAPOBEC1が続き、さらに、SXと称される18個アミノ酸リンカーGGSTG GGSGG GSGGG SSG(配列番号12)によりUGIに連結されたSV40-NLSが続いた。SV40-NLSはまた、(G4S)×3と称される15個アミノ酸リンカーGGGGS GGGGSによりUGIのC末端にも組み込まれており、dLbCas12a-BEの核中へのターゲティングが改善された。トウモロコシ最適化コドンにより作製されたdLbCas12a-BEの合成配列は、配列番号14に記載されている。
構築物25058のdLbCas12a-BEでは、SV40-NLSに、30個アミノ酸リンカー(G4S)×6によりdLbCas12aに連結されたAPOBEC1が続き、さらに、SXリンカーによりUGIに連結されたSV40-NLSが続いた。SV40-NLSはまた、(G4S)×3によりUGIのC末端にも組み込まれており、dLbCas12a-BEの核へのターゲティングが改善された。トウモロコシ最適化コドンにより作製されたdLbCas12a-BEの合成配列は、配列番号16に記載されている。
dLbCas12a-BE構築物では、CRISPR/Cas12aガイドRNA転写産物は、SoUbi4プロモーターの制御下で発現され、このCRISPR/Cas12aガイドRNA転写産物は、トウモロコシWaxy1第4エクソン領域を標的として、エクソン4中のPAM配列に続くC9、C10、又はC22をTに変更する。このCRISPR/Cas12aガイドRNA転写産物はまた、足場としてLbCrRNAの直接反復も含んだ。ガイドRNAの合成配列は、配列番号26に記載されている。
構築物24784では、核局在化シグナル(xSV40NLS-06)に、xXTEN-02によりトウモロコシ最適化Cas9遺伝子(cCas9BE-02)に連結されたシチジンデアミナーゼ(xAPOBEC1-01)が続き、さらに、xSGGSリンカー-02によりウラシルDNAグリコシラーゼインヒビターxUGI-02に連結された、核局在化シグナル(xSV40NLS-04)が続き、xUGI-02は、xSGGSリンカー-02により核局在化シグナルxSV40NLS-07に連結されている。この融合タンパク質は、サトウキビユビキチン-4プロモーター(prSoUbi4-02)、続いてNOSターミネーター(tNOS-05-01)の制御下で駆動された。Cas9タンパク質は、ラットAPOBEC1に融合したD10A及びウラシルDNAグリコシラーゼインヒビター(UGI)を有するニッカーゼCas9変異である。核局在化シグナルはまた、Cas9のC末端にも組み込まれており、核へのCas9のターゲティングが改善された。cCas9BE-02の合成配列は、配列番号20に記載されている。
実施例2.トウモロコシ胚のアグロバクテリウム媒介形質転換
トウモロコシWx1での編集による潜在的事象を発生させるために、エリートトウモロコシ形質転換変種NP2222を、説明されている全ての実験用に選択した(国際公開第16106121号、参照より本明細書に組み込まれる)。
トウモロコシ形質転換用に、トウモロコシ変種NP2222を採用した。トウモロコシの穂を、未熟胚が約1.2mmである時点でGHから収穫し、次いで、この穂を20分にわたり20%Clorox溶液で滅菌し、滅菌水で3回すすいだ。
エレクトロポレーションによりベクターを有するアグロバクテリウム・ツメファシエンス(Agrobacterium tumefaciens)株LBA4404 17740 RecA-を、Gent抗生物質(25μg/ml)及びSpec抗生物質(100μg/ml)を含むYP培地上で画線し、2日にわたり28℃で増殖させた。形質転換前に、単一コロニーを選択し、新鮮なYPプレート上に画線し、28℃で1日にわたり増殖させた。アグロバクテリウム(Agrobacterium)を、接種培地を使用して再懸濁させた。OD660を0.25に調整した。
本発明者らは、胚乳を取り出し、次いで滅菌メスにより未熟胚を単離してまとめて回収し、2~3分にわたりアグロバクテリウム(Agrobacterium)懸濁液に注入した。感染した未熟胚を、2~4日にわたり22℃下で共培養培地に移した。
共培養段階後、この胚を、28℃の暗条件下で4週間にわたり、選択剤を含む培地に移した。耐性を示す胚発生カルスを再生培地に移し、16/8光周期条件にて28℃下で培養した。約3週間後、再生した小植物を、同一の培養温度及び光条件下で、発根用培地が入った栽培容器に移した。
実施例3.標的領域中の編集塩基の分析
本発明者らは、Phire Plant Direct PCR Master Mix(Thermo Fisher,F160L)を使用して、トウモロコシの葉のサンプルから直接、標的領域を含む約410bpのDNA断片を増幅させた。PCRの前に、DNA精製は必要ではない。増幅されたDNA断片のSanger DNA配列決定により、標的部位の変異を分析した。
DNA抽出及びPCR増幅を、製造業者の推奨に従って実施した。若葉の一部(例えば、直径が約2mmのパンチ)を、希釈緩衝液30μLに入れた。この葉のサンプルを、チューブの壁に軽く押し付けることにより100μLピペットチップで粉砕し、希釈緩衝液20μLを添加した。この葉の粉砕後、溶液は緑色がかっていた。植物材料を遠心分離機で沈降させ、上清1μLを、20μL PCR反応用のテンプレートとして使用した。
PCRシステムは、下記からなる。
Figure 2022549430000002
ZmWaxy1用のPCRプライマー:
フォワードプライマー:5’-AGATGGGAGACGGGTACGAGACGG-3’(配列番号29)
リバースプライマー:5’-GTATGGGTTGTTGTTGAGGCTCAGG-3’(配列番号30)
DNA配列決定プライマー:5’-GACCACCCACTGTTCCTGGAGAGGG-3’(配列番号31)
PCR条件:
5分にわたり98℃;
5秒にわたり98℃、続いて5秒にわたり60℃を35サイクル;
20秒にわたり72℃;
1分にわたり72℃;及び
分析の準備が整うまで4℃で保持。
配列決定:
PCR産物を、アガロースゲル電気泳動により分離し、特定のプライマーによるSanger DNA配列決定前に精製した。ヘテロ接合変異の場合には、標的ヌクレオチド位置で二重ピークを観察したが、コントロールと異なる独特な単一ピークをホモ接合変異と見なした。構築物24524、24904、及び24784のトランスジェニック事象を使用してZmWxy1エクソン4を増幅させて配列決定し、塩基編集を評価した。
Figure 2022549430000003
編集されたヌクレオチドを、灰色の網掛けで示す。上記に示されるように、APOBECドメインと部位特異的ヌクレアーゼとの間にXTENリンカーを含む、このバージョンのCas12a塩基エディタは、5位及び6位でシステインをチアミンへと最も効率的に編集した。しかしながら、-2位、7位、及び49位でのグアニンからアデニンへの編集例が存在する。位置は、PAM部位の開始から離れるヌクレオチドの数で決定されている。
Figure 2022549430000004
編集されたヌクレオチドを、灰色の網掛けで示す。このバージョンでは、APOBECドメインと不活性化された部位特異的ヌクレアーゼとの間にXTENリンカーを含むCas12a塩基エディタは、9位、10位、及び22位でシステインをチアミンへと編集し、且つ39位、44位、52位、そして特に53位で、グアニンをアデニンへと編集した。グアニンがアデニンへと編集されている箇所は、相補鎖で編集が行なわれたことを示す。
Figure 2022549430000005
編集されたヌクレオチドを、灰色の網掛けで示す。このバージョンでは、APOBECドメインと不活性化された部位特異的ヌクレアーゼとの間に、(G4S)6を含む長リンカーを含むCas12a塩基エディタは、9位及び10位でシステインをチアミンへと編集し、且つ19位及び53位でグアニンをアデニンへと編集した。グアニンがアデニンへと編集されている箇所は、相補鎖で編集が行なわれたことを示す。
実施例4.編集効率の測定。
Figure 2022549430000006
表4は、長リンカーを有するCas12aの塩基編集効率がCas9の塩基編集効率にどれくらい匹敵するかを示す。最適化されていないと、Cas12aBEは編集効率が約5%と低く、Cas9(87%)の編集効率よりもはるかに低い。しかしながら、デアミナーゼを触媒的に不活性なCas12aに作動可能に連結する長リンカーの添加により、編集効率が12倍改善された。
Figure 2022549430000007
表5は、XTENリンカー又は長リンカーのいずれかに作動可能に連結された場合のLbCas12a塩基エディタの編集効率の直接比較を示す。困難な標的の編集効率は、デアミナーゼが長リンカー(例えば(G4S)6)により部位特異的ヌクレアーゼに作動可能に連結されている場合には、ほぼ5倍改善されている。
Figure 2022549430000008
Figure 2022549430000009
同一構築物内でのいくつかのガイドRNA分子を使用する多重同時編集(「多重化」又は「多重編集」)、及び核局在化シグナルと活性なCas12aとの間に長リンカーを有することにより、高い編集効率が達成される。SBEIIb等の難しい標的であっても、多重編集実験デザインの一部である場合には、許容される編集効率が達成された。
実施例5.ダイズでの編集の改善。
長リンカーとCas12aとの組み合わせを使用するダイズ編集も、大きく改善されている。標準的なCas12a及び長リンカー-Cas12aによるGmFAD2編集は、ほぼ7倍改善される。
Figure 2022549430000010
実施例6.長リンカーは、トウモロコシにおけるMb2Cas12a編集を改善した。
この長リンカーはまた、Mb2Cas12a等のさらなるCas12酵素の編集効率も改善する。
Figure 2022549430000011
長リンカーがないと、Mb2Cas12aは標的配列を全く編集しなかった。しかしながら、長リンカーにより、編集効率は顕著に改善される。
実施例7.長リンカーにより接続された、Cas12aに作動可能に連結されている他の異種ドメイン。
長リンカーにより異種ドメインを(APOBECデアミナーゼのみを超えて)Cas12aに繋ぎ止めることは、本発明の範囲内である。そのような異種ドメインとして下記が挙げられるが、これらに限定されない:デアミナーゼ、ポリメラーゼ、ヌクレアーゼ、リラクサーゼ、アルキルトランスフェラーゼ、メチルトランスフェラーゼ、アデノシンデアミナーゼ、シチジンデアミナーゼ、オキシダーゼ、チミンアルキルトランスフェラーゼ、アデニンオキシダーゼ、アデノシンメチルトランスフェラーゼ、グリコシラーゼ、又は核局在化シグナル。
本発明者らは、アデニンデアミナーゼをCas12aに作動可能に連結させて、Cas12aアデニン塩基エディタ(「Cas12a-ABE」)を作製した。本発明者らは、触媒的に不活性なLbCas12a(D832A、E925A、及びD1148A変異を含む)を、アミノ酸リンカーにより作動可能に連結されている大腸菌(E.coli)野生アデニンデアミナーゼ(W23R、H36L、P48A、R51L、L84F、A106V、D108N、H123Y、S146C、D147Y、R152P、E155V、I156F、及びK157Nアミノ酸置換を含むように操作された「TadA」)に融合させた。この融合構築物をZea maysコドンに最適化させ、商業的に合成し(GenScript,Nanjing,China)、サトウキビユビキチン-4(SoUbi4)遺伝子プロモーター下でクローニングしてdLbCa12a-BEを構成的に生成した。
構築物25459のdLbCas12a-ABEでは、TadA二量体を作製するために、189bpのジャガイモイントロンが、XTENタンパク質リンカーにより連結されたTadAバリアントに後続するTadAコード配列に挿入された。これはdLbCas12aに融合しており、且つSV40-NLSもGSリンカーによりdLbCas12aのC末端に組み込まれており、この融合タンパク質の核中へのターゲティングが改善された。トウモロコシ最適化コドンにより作製されたdLbCas12a-ABEの合成配列は、配列番号79に記載されている。
構築物25504のdLbCas12a-ABEでは、TadA二量体を作製するために、189bpのジャガイモイントロンが、TadAバリアントに後続するTadAコード配列に挿入された。これは、30個アミノ酸リンカー(G4S)×6タンパク質リンカーによりdLbCas12aに連結されており、且つSV40-NLSもGSリンカーによりdLbCas12aのC末端に組み込まれており、この融合タンパク質の核中へのターゲティングが改善された。トウモロコシ最適化コドンにより作製されたdLbCas12a-ABEの合成配列は、配列番号81に記載されている。
dLbCas12a-ABE構築物では、CRISPR/Cas12aガイドRNA転写産物は、SoUbi4プロモーターの制御下で発現され、このCRISPR/Cas12aガイドRNA転写産物は、トウモロコシWaxy1遺伝子を標的とする。このCRISPR/Cas12aガイドRNA転写産物はまた、足場としてLbCrRNAの直接反復も含んだ。ガイドRNAの合成配列は、配列番号74に記載されている。
構築物25459(アデニンデアミナーゼが、XTENリンカーによりdLbCas12aに連結されていた)による実験では、トウモロコシ植物で使用した場合には、検出可能な編集が得られなかった。アデニンデアミナーゼが(G4S)*6長リンカーによりdLbCas12aに連結されていた構築物25504による実験では、編集効率が、Cas9ABEコントロール(構築物24785)の約半分である7%であった。表10を参照されたい。
Figure 2022549430000012
本発明者らは、Cas12aABEが植物で機能することが示されたのはこれが初めてであると考えている。この技術的成功の原因は、アデニンデアミナーゼをCas12aに作動可能に連結するための長リンカーの使用であると考えられる。
実施例8.トウモロコシでの二重塩基エディタ
二重塩基エディタ(Cas酵素に融合したシチジンデアミナーゼドメイン及びアデニンデアミナーゼドメイン)。この概念では、作物遺伝子の標的飽和変異誘発を適用して、農学的性能が改善されている遺伝子バリアント(例えば、同一の標的領域でのC:G>T:A置換及びA:T>G:C置換)を作製し得た。本発明者らは、下記の4種のガイドRNAを多重化した:ZmWaxy1遺伝子を標的とする1種、及びZmADH遺伝子を標的とする3種の異なるガイドRNA。
Figure 2022549430000013
Figure 2022549430000014
合計で、dLbCas12aに基づくCBE-ABEは、1%のCからTへの変異及びAからGへの変異である。イントロンの付加により、ベクターの安定性が増加するが、非効率的なスプライシングにより酵素活性が低下する場合がある。これは、Cas12aを使用する植物での二重CBE-ABE編集の最初の例であると考えられる。
Figure 2022549430000015
上記の表では、ほとんどのCas12aBE構築物は、異種酵素ドメイン-リンカー-Cas酵素のパターンに従う。このパターンの例外は、25702[TadA二量体-リンカー-PmCDA-リンカー-Cas酵素]、25701[PmCDA-リンカー-TadA二量体-リンカー-Cas酵素]、及び25658[TadA二量体-リンカー-Cas酵素-PmCDA]である。さらなる核局在化配列、ウラシルグリコシラーゼインヒビター、及び他の構成成分が存在し得るが、この表では示されていない。そのような詳細は、添付の配列表に示された配列に示されている。
本明細書で提供される実施例及び実施形態は、特許請求の範囲の非限定的な例示であり、唯一の実用例として解釈されるべきではない。さらなる変形例が、当業者により実行され得る。

Claims (27)

  1. N末端からC末端の方向に、異種ドメイン、第1のリンカー配列、及びV型CRISPR-Cas酵素を含む融合タンパク質であって、前記第1のリンカー配列が、反復GGGGS配列を含む、融合タンパク質。
  2. 前記異種ドメインが、デアミナーゼ、ポリメラーゼ、ヌクレアーゼ、リラクサーゼ、アルキルトランスフェラーゼ、メチルトランスフェラーゼ、アデノシンデアミナーゼ、シチジンデアミナーゼ、オキシダーゼ、チミンアルキルトランスフェラーゼ、アデニンオキシダーゼ、アデノシンメチルトランスフェラーゼ、グリコシラーゼ、又は核局在化シグナルである、請求項1に記載の融合タンパク質。
  3. 前記異種ドメインが、デアミナーゼドメインである、請求項2に記載の融合タンパク質。
  4. 前記デアミナーゼドメインが、シチジンデアミナーゼである、請求項3に記載の融合タンパク質。
  5. 前記シチジンデアミナーゼドメインが、活性化誘導シチジンデアミナーゼ(「AID」)である、請求項4に記載の融合タンパク質。
  6. 前記シチジンデアミナーゼドメインが、アポリポタンパク質B mRNA編集複合体(「APOBEC」)ドメインである、請求項4に記載の融合タンパク質。
  7. 前記APOBECドメインが、APOBEC1ファミリのデアミナーゼである、請求項6に記載の融合タンパク質。
  8. 前記APOBECドメインが、配列番号1と少なくとも70%同一の配列を含む、請求項7に記載の融合タンパク質。
  9. 前記デアミナーゼドメインが、アデニンデアミナーゼである、請求項3に記載の融合タンパク質。
  10. 前記アデニンデアミナーゼが、TadAドメインである、請求項9に記載の融合タンパク質。
  11. 前記TadAドメインが、配列番号92と少なくとも70%同一の配列を含む、請求項10に記載の融合タンパク質。
  12. 前記V型CRISPR-Cas酵素が、V-A型(Cas12a)酵素である、請求項1に記載の融合タンパク質。
  13. 前記Cas12aドメインが、配列番号3、配列番号6、配列番号22、配列番号45、配列番号46、配列番号47、及び配列番号48で構成された群から選択される、請求項12に記載の融合タンパク質。
  14. 前記Cas12aドメインが、触媒的に不活性であり、並びに配列番号3、配列番号6、及び配列番号22で構成された群から選択される、請求項13に記載の融合タンパク質。
  15. 前記第1のリンカー配列が、少なくとも3回反復されたGGGGSを含む、請求項1に記載の融合タンパク質。
  16. 前記第1のリンカー配列が、少なくとも6回反復されたGGGGSを含む、請求項15に記載の融合タンパク質。
  17. 前記融合タンパク質が、配列番号11、12、13、及び44からなる群から選択される配列を含む、請求項1~16のいずれか一項に記載の融合タンパク質。
  18. ウラシルDNAグリコシラーゼインヒビター(「UGI」)ドメインをさらに含む、請求項1~17のいずれか一項に記載の融合タンパク質。
  19. 前記UGIドメインが、配列番号8を含む、請求項18に記載の融合タンパク質。
  20. 前記UGIドメインが、配列SGGSを含む第2のリンカーにより前記Cas12a酵素に連結されている、請求項19に記載の融合タンパク質。
  21. 前記融合タンパク質が、配列番号17、配列番号24、配列番号35、配列番号39、配列番号43、配列番号50、配列番号52、配列番号54、配列番号56、配列番号81、配列番号83、配列番号85、配列番号87、及び配列番号89からなる群から選択される配列を含む、請求項1に記載の融合タンパク質。
  22. 前記融合タンパク質が、DNAと接触した場合に、反復GGGGS配列以外の第1のリンカー配列を有する融合タンパク質と比較して、高い頻度でオンターゲット編集を生じ、及び低い頻度でオフターゲット編集を生じる、請求項1に記載の融合タンパク質。
  23. 植物ゲノムDNAを編集する方法であって、植物ゲノムDNAと、
    (a)UGIドメインを任意に含む、請求項1~17のいずれか一項に記載の融合タンパク質、及び
    (b)工程(a)の前記融合タンパク質の標的を前記植物ゲノムDNAの標的DNA配列に定めるガイドRNA(「gRNA」)
    とを接触させることを含み、
    編集された植物ゲノムDNAが、反復GGGGS配列以外の第1のリンカーを有する融合タンパク質により編集された植物ゲノムDNAと比較してオフターゲット編集が低い、
    方法。
  24. 低いオフターゲット編集で植物ゲノムDNAを編集する方法であって、植物ゲノムDNAと、
    (a)UGIドメインを任意に含む、請求項1~17のいずれか一項に記載の融合タンパク質、及び
    (b)工程(a)の前記融合タンパク質の標的を前記植物ゲノムDNAの標的DNA配列に定めるガイドRNA(「gRNA」)
    とを接触させることを含み、
    編集された植物ゲノムDNAが、反復GGGGS配列以外の第1のリンカーを有する融合タンパク質により編集された植物ゲノムDNAと比較してオフターゲット編集が低い、
    方法。
  25. 前記融合タンパク質が、配列番号24を含む、請求項24に記載の方法。
  26. オフターゲット編集が低い編集植物の集団を得る方法であって、
    (a)編集するゲノムDNAを含む植物細胞の集団を得ること、
    (b)請求項1~16のいずれか一項に記載の融合タンパク質及び任意のUGIドメインをコードするヌクレオチド配列を得ること、
    (c)前記植物細胞の集団を工程(b)の前記ヌクレオチド配列で形質転換させ、それにより、前記植物細胞の集団内で、前記核酸配列によりコードされた融合タンパク質を発現させること、
    (d)前記形質転換された植物細胞の集団を植物へと成長させることであり、前記植物の少なくとも1つは編集されている、成長させること、
    並びに
    (e)工程(d)の生成物から少なくとも1つの編集植物を選択し、それにより編集植物の集団を得ること
    を含み、
    前記編集植物の集団が、反復GGGGS配列以外の第1のリンカーを有する融合タンパク質により編集された植物と比較してオフターゲット編集が低い、
    方法。
  27. 前記ヌクレオチド配列が、配列番号17、配列番号24、配列番号35、配列番号39、配列番号43、配列番号50、配列番号52、配列番号54、配列番号56、配列番号81、配列番号83、配列番号85、配列番号87、及び配列番号89からなる群から選択される融合タンパク質をコードする、請求項26に記載の方法。
JP2022518227A 2019-09-26 2020-09-18 Dna塩基編集のための方法及び組成物 Pending JP2022549430A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
PCT/CN2019/108026 WO2021056302A1 (en) 2019-09-26 2019-09-26 Methods and compositions for dna base editing
CNPCT/CN2019/108026 2019-09-26
PCT/US2020/051383 WO2021061507A1 (en) 2019-09-26 2020-09-18 Methods and compositions for dna base editing

Publications (1)

Publication Number Publication Date
JP2022549430A true JP2022549430A (ja) 2022-11-25

Family

ID=75166246

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022518227A Pending JP2022549430A (ja) 2019-09-26 2020-09-18 Dna塩基編集のための方法及び組成物

Country Status (11)

Country Link
US (1) US20220403396A1 (ja)
EP (1) EP4034648A4 (ja)
JP (1) JP2022549430A (ja)
KR (1) KR20220066111A (ja)
CN (1) CN114761547A (ja)
AU (1) AU2020354372A1 (ja)
CA (1) CA3149273A1 (ja)
CL (1) CL2022000745A1 (ja)
IL (1) IL290572A (ja)
MX (1) MX2022003577A (ja)
WO (2) WO2021056302A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4133071A2 (en) * 2020-04-09 2023-02-15 Verve Therapeutics, Inc. Base editing of angptl3 and methods of using same for treatment of disease

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040115184A1 (en) * 2001-02-27 2004-06-17 Smith Harold C Methods and compositions for modifying apolipoprotein b mrna editing
IL258821B (en) * 2015-10-23 2022-07-01 Harvard College Nucleobase editors and their uses
SG11201900907YA (en) * 2016-08-03 2019-02-27 Harvard College Adenosine nucleobase editors and uses thereof
WO2018165629A1 (en) * 2017-03-10 2018-09-13 President And Fellows Of Harvard College Cytosine to guanine base editor
CA3057192A1 (en) * 2017-03-23 2018-09-27 President And Fellows Of Harvard College Nucleobase editors comprising nucleic acid programmable dna binding proteins
WO2018213708A1 (en) * 2017-05-18 2018-11-22 The Broad Institute, Inc. Systems, methods, and compositions for targeted nucleic acid editing
WO2018213726A1 (en) * 2017-05-18 2018-11-22 The Broad Institute, Inc. Systems, methods, and compositions for targeted nucleic acid editing
JP2020534795A (ja) * 2017-07-28 2020-12-03 プレジデント アンド フェローズ オブ ハーバード カレッジ ファージによって支援される連続的進化(pace)を用いて塩基編集因子を進化させるための方法および組成物
WO2019041296A1 (zh) * 2017-09-01 2019-03-07 上海科技大学 一种碱基编辑系统及方法
US11795443B2 (en) * 2017-10-16 2023-10-24 The Broad Institute, Inc. Uses of adenosine base editors
CN110157727A (zh) * 2017-12-21 2019-08-23 中国科学院遗传与发育生物学研究所 植物碱基编辑方法
JP2021508460A (ja) * 2017-12-22 2021-03-11 ザ・ブロード・インスティテュート・インコーポレイテッド Crisprエフェクター系に基づくマルチプレックス診断
CN109957569B (zh) * 2017-12-22 2022-10-25 苏州齐禾生科生物科技有限公司 基于cpf1蛋白的碱基编辑系统和方法
WO2019126762A2 (en) * 2017-12-22 2019-06-27 The Broad Institute, Inc. Cas12a systems, methods, and compositions for targeted rna base editing
WO2019161783A1 (en) * 2018-02-23 2019-08-29 Shanghaitech University Fusion proteins for base editing
CN109321593B (zh) * 2018-11-07 2022-01-25 中国农业科学院植物保护研究所 一套用于水稻的人工基因编辑系统

Also Published As

Publication number Publication date
WO2021056302A1 (en) 2021-04-01
AU2020354372A1 (en) 2022-03-31
CL2022000745A1 (es) 2022-10-28
WO2021061507A1 (en) 2021-04-01
IL290572A (en) 2022-04-01
EP4034648A1 (en) 2022-08-03
MX2022003577A (es) 2022-04-25
KR20220066111A (ko) 2022-05-23
US20220403396A1 (en) 2022-12-22
EP4034648A4 (en) 2023-11-01
CN114761547A (zh) 2022-07-15
CA3149273A1 (en) 2021-04-01

Similar Documents

Publication Publication Date Title
US20210214736A1 (en) Methods and compositions for identifying and enriching for cells comprising site specific genomic modifications
US20220010322A1 (en) Gene silencing via genome editing
US20210087557A1 (en) Methods and compositions for targeted genomic insertion
US20220403396A1 (en) Methods and compositions for dna base editing
WO2023216415A1 (zh) 基于双分子脱氨酶互补的碱基编辑系统及其应用
US20220135994A1 (en) Suppression of target gene expression through genome editing of native mirnas
US11459577B2 (en) Targeted insertion sites in the maize genome
US20230114951A1 (en) Targeted insertion sites in the maize genome
WO2019213910A1 (en) Methods and compositions for targeted editing of polynucleotides
CN114174518A (zh) 非生物胁迫耐受性植物及方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230914