JP2022552409A - Cas12aヌクレアーゼの変異体ならびにその作製方法および使用方法 - Google Patents
Cas12aヌクレアーゼの変異体ならびにその作製方法および使用方法 Download PDFInfo
- Publication number
- JP2022552409A JP2022552409A JP2022523132A JP2022523132A JP2022552409A JP 2022552409 A JP2022552409 A JP 2022552409A JP 2022523132 A JP2022523132 A JP 2022523132A JP 2022523132 A JP2022523132 A JP 2022523132A JP 2022552409 A JP2022552409 A JP 2022552409A
- Authority
- JP
- Japan
- Prior art keywords
- nucleic acid
- sequence
- activity
- polypeptide
- lbcasl2a
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/20—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Spirochaetales (O), e.g. Treponema, Leptospira
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1093—General methods of preparing gene libraries, not provided for in other subgroups
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/78—Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/70—Fusion polypeptide containing domain for protein-protein interaction
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y305/00—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
- C12Y305/04—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
- C12Y305/04004—Adenosine deaminase (3.5.4.4)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y305/00—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
- C12Y305/04—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
- C12Y305/04005—Cytidine deaminase (3.5.4.5)
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Crystallography & Structural Chemistry (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Bioinformatics & Computational Biology (AREA)
- Enzymes And Modification Thereof (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
Abstract
本発明は、変更されたプロトスペーサー隣接モチーフ認識特異性を有するCas12aヌクレアーゼの変異体に関する。本発明はさらに、CRISPR-CASヌクレアーゼ変異体を作製する方法および変異体を用いて核酸を改変する方法に関する。【選択図】 図1
Description
[配列リストの電子出願に関する陳述]
連邦規則法典第37巻1.821条の下で提出されたASCIIテキスト形式の配列リストであって、2020年10月13日に作成されてEFS-Webを介して提出された、257,774バイトのサイズの1499.7WO_ST25.txtと題されたものは、紙のコピーの代わりに提供される。この配列リストは、その開示に関して参照により本明細書中に援用される。
連邦規則法典第37巻1.821条の下で提出されたASCIIテキスト形式の配列リストであって、2020年10月13日に作成されてEFS-Webを介して提出された、257,774バイトのサイズの1499.7WO_ST25.txtと題されたものは、紙のコピーの代わりに提供される。この配列リストは、その開示に関して参照により本明細書中に援用される。
[優先権の陳述]
本出願は、合衆国法典第35巻第119条(e)の下で、2019年10月17日に出願された米国仮出願番号62/916,392の利益を主張し、その内容全体は参照により本明細書中に援用される。
本出願は、合衆国法典第35巻第119条(e)の下で、2019年10月17日に出願された米国仮出願番号62/916,392の利益を主張し、その内容全体は参照により本明細書中に援用される。
[本発明の分野]
本発明は、変更されたプロトスペーサー隣接モチーフ認識特異性を有するCas12a CRISPR-Casヌクレアーゼの変異体に関する。本発明はさらに、CRISPR-CASヌクレアーゼ変異体を作製する方法、および、変異体を用いて核酸を改変する方法に関する。
本発明は、変更されたプロトスペーサー隣接モチーフ認識特異性を有するCas12a CRISPR-Casヌクレアーゼの変異体に関する。本発明はさらに、CRISPR-CASヌクレアーゼ変異体を作製する方法、および、変異体を用いて核酸を改変する方法に関する。
ゲノム編集/改変は、標的のゲノム位置にバリエーションを導入するために、部位特異的ヌクレアーゼ、例えば、CRISPR-Casヌクレアーゼを利用するプロセスである。最も広く使用されるゲノム改変のためのヌクレアーゼであるCas9は、NGGモチーフ(例えば、プロトスペーサー隣接モチーフ(PAM))の上流のゲノム領域において突然変異を導入することができる。他のCasヌクレアーゼは、異なるPAM認識特異性を有する。これらのヌクレアーゼのPAM特異性が特に厳密である場合、それらは、そのヌクレアーゼによる改変に利用可能なゲノム標的部位の数を制限することにより、ゲノム改変のためのヌクレアーゼの有用性を減少させ得る。
当該分野における短所を対処するために、本発明は、改善されたPAM特異性を有する改変されたCRISPR-Casヌクレアーゼ、およびそのようなCRISPR-Casヌクレアーゼを設計、特定、および選択するための方法を提供する。
本発明の一態様は、改変されたLachnospiraceae bacterium CRISPR(Clustered Regularly Interspaced Short Palindromic Repeats)Cas12a(LbCas12a)ポリペプチドを提供し、ここで、改変されたLbCas12aポリペプチドは、配列番号1(LbCas12a)のアミノ酸配列と少なくとも80%同一性および配列番号1の位置ナンバリングに関して以下の位置:K116、K120、K121、D122、E125、T148、T149、T152、D156、E159、Q529、G532、D535、K538、D541、Y542、L585、K591、M592、K595、V596、S599、K600、K601、Y616、Y646、および/またはW649の1つまたは複数(例えば、1、2、3、4、5、6、7、8、9、10、11、12、13またはそれよりも多く)における任意の組み合わせでの突然変異(配列番号1の位置ナンバリングに関して以下の位置:K116、K120、K121、D122、E125、T152、D156、E159、G532、D535、K538、D541、および/またはK595の1つまたは複数における任意の組み合わせでの突然変異であってもよい)を有する、アミノ酸配列を含む、から本質的になる、またはからなる。
本発明の第2の態様は、以下を含むV型Clustered Regularly Interspaced Short Palindromic Repeats(CRISPR)関連(Cas)(CRISPR-Cas)システムを提供する:(a)(i)本発明の改変されたLbCas12aポリペプチドまたは本発明の改変されたLbCas12aポリペプチドをコードする核酸、および(ii)目的ポリペプチドまたは目的ポリペプチドをコードする核酸を含む、融合タンパク質;および(b)スペーサー配列とリピート配列とを含むガイド核酸(CRISPR RNA、CRISPR DNA、crRNA、crDNA)、ここで、ガイド核酸は、改変されたLbCas12aポリペプチドまたは融合タンパク質と複合体を形成することが可能であり、スペーサー配列は、標的核酸にハイブリダイズすることが可能であり、それにより、改変されたLbCas12aポリペプチドおよび目的ポリペプチドを標的核酸にガイドし、それにより、標的核酸が改変または調整される。
本発明の第3の態様は、標的核酸を改変する方法を提供し、その方法は、標的核酸を、(a)(i)本発明の改変されたLbCas12aポリペプチド、または本発明の改変されたLbCas12aポリペプチドを含む融合タンパク質、および(ii)ガイド核酸(例えば、CRISPR RNA、CRISPR DNA、crRNA、crDNA);(b)本発明の改変されたLbCas12aポリペプチドおよびガイド核酸を含む複合体;(c)(i)本発明の改変されたlbCas12aポリペプチド、または本発明の融合タンパク質、および(ii)ガイド核酸を含む組成物;および/または、(d)本発明のシステムと接触させるステップを含み、それにより標的核酸を改変する。
本発明の第4の態様は、標的核酸を改変する方法を提供し、その方法は、標的核酸を含む細胞または無細胞系を、(a)(i)本発明の改変されたLbCas12aポリペプチドをコードするポリヌクレオチド、またはそれを含む発現カセットまたはベクター、および(ii)ガイド核酸、またはそれを含む発現カセットまたはベクター;および/または(b)(i)本発明の改変されたLbCas12aポリペプチドを含む複合体または融合タンパク質、および(ii)ガイド核酸をコードする、核酸構築物、またはそれを含む発現カセットまたはベクターと接触させるステップを含み、それにより標的核酸を改変する。
本発明の第5態様は、標的核酸を編集する方法を提供し、その方法は、標的核酸を、(a)(i)本発明の改変されたLbCas12aポリペプチドを含む融合タンパク質および(a)(ii)ガイド核酸;(b)本発明の融合タンパク質、およびガイド核酸を含む複合体;(c)本発明の融合タンパク質およびガイド核酸を含む組成物;および/または、(d)本発明のシステムと接触させるステップを含み、それにより標的核酸を編集する。
本発明の第6の態様は、標的核酸を編集する方法を提供し、その方法は、標的核酸を含む細胞または無細胞系を、(a)(i)本発明の改変されたLbCas12aポリペプチドを含む融合タンパク質をコードするポリヌクレオチド、またはそれを含む発現カセットまたはベクター、および(a)(ii)ガイド核酸、またはそれを含む発現カセットまたはベクター;および/または(b)本発明の改変されたLbCas12aポリペプチドを含む融合タンパク質、およびガイド核酸を含む複合体をコードする、核酸構築物、またはそれを含む発現カセットまたはベクター;および/または(c)本発明のシステムと接触させるステップを含み、それにより標的核酸を編集する。
本発明の第7の態様は、プロトスペーサーの5’末にPAM認識部位を有するCRISPR-Casヌクレアーゼのプロトスペーサー隣接モチーフ(PAM)の要件/特異性を判定するための二本鎖核酸分子を含むランダム化DNAライブラリーを構築する方法を提供し、その方法は、以下のステップを含む2以上の二本鎖核酸分子を調製するステップ:(a)2以上の二本鎖核酸分子のそれぞれのための非標的オリゴヌクレオチド(第1)鎖および標的オリゴヌクレオチド(第2)鎖を合成するステップ(ここで、非標的オリゴヌクレオチド鎖は5’から3’に以下を含む:(i)約5~約15ヌクレオチドを有する第1の配列、(ii)少なくとも4つのランダム化ヌクレオチドを有する第2の配列、(iii)約16~約25ヌクレオチドを含むプロトスペーサー配列、および(iv)約5~約20ヌクレオチドを有する第3の配列、ここで(i)の約5~15ヌクレオチドを有する第1の配列は、(ii)の第2の配列の5’末にすぐ隣接しており、(ii)の第2の配列は(iii)のプロトスペーサー配列の5’末にすぐ隣接しており、プロトスペーサー配列は、(iv)の第3の配列の5’末にすぐ隣接しており;標的オリゴヌクレオチド(第2)鎖は、非標的オリゴヌクレオチド鎖に相補である);および、(b)非標的オリゴヌクレオチド鎖を相補の標的オリゴヌクレオチド鎖にアニーリングさせて二本鎖核酸分子を産生するステップ(ここで、第1の配列は制限部位を(その5’末に)含み、第3の配列は制限部位を(その3’末に)含み、ここで、2以上の二本鎖核酸分子のそれぞれの第1の配列(i)、プロトスペーサー配列(iii)および第3の配列(iv)は同一である)を含み、それにより、二本鎖核酸分子を含むランダム化DNAライブラリーを構築する。
本発明の第8の態様は、プロトスペーサーの3’末にPAM認識部位を有するCRISPR-Casヌクレアーゼのプロトスペーサー隣接モチーフ(PAM)の要件/特異性を判定するための二本鎖核酸分子を含むランダム化DNAライブラリーを構築する方法を提供し、その方法は、以下のステップを含む2以上の二本鎖核酸分子を調製するステップ:(a)2以上の二本鎖核酸分子のそれぞれのための非標的オリゴヌクレオチド(第1)鎖および標的オリゴヌクレオチド(第2)鎖を合成するステップ(ここで、非標的オリゴヌクレオチド鎖は5’から3’に以下を含む:(i)約5~約20ヌクレオチドを有する第1の配列、(ii)約16~約25ヌクレオチドを含むプロトスペーサー配列、(iii)少なくとも4つのランダム化ヌクレオチドを有する第2の配列、および(iv)約5~約15ヌクレオチドを有する第3の配列、ここで(i)の約5~20ヌクレオチドを有する第1の配列は(ii)のプロトスペーサー配列の5’末にすぐ隣接しており、(iii)の第2の配列は(iii)のプロトスペーサー配列の3’末にすぐ隣接しており、(iv)の第3の配列は(iii)の第2の配列の3’末にすぐ隣接しており;標的オリゴヌクレオチド(第2)鎖は非標的オリゴヌクレオチド鎖に相補である);および(b)非標的オリゴヌクレオチド鎖を相補の標的オリゴヌクレオチド鎖にアニーリングさせて二本鎖核酸分子を産生するステップ(ここで、第1の配列(i)は制限部位を(その5’末に)含み、第3の配列(iv)は制限部位を(その3’末に)含み、ここで、2以上の二本鎖核酸分子のそれぞれの第1の配列(i)、プロトスペーサー配列(ii)および第3の配列(iv)は同一である)を含み、それにより、二本鎖核酸分子を含むランダム化DNAライブラリーを構築する。
本発明の第9の態様は、プロトスペーサーの5’末にPAM認識部位を有するCRISPR-Casヌクレアーゼのプロトスペーサー隣接モチーフ(PAM)の要件/特異性を判定するためのランダム化DNAライブラリーを提供し、ランダム化DNAライブラリーは、2以上の二本鎖核酸分子を含み、それぞれが以下を含む:(a)非標的オリゴヌクレオチド(第1)鎖および標的オリゴヌクレオチド(第2)鎖、ここで、非標的オリゴヌクレオチド鎖は、5’から3’に、(i)約5~約15ヌクレオチド(例えば、約5、6、7、8、9、10、11、12、13、14、または15ヌクレオチド、およびその中の任意の範囲または値)を有する第1の配列、(ii)少なくとも4つのランダム化ヌクレオチド(例えば、少なくとも4、5、6、7、8、9、10、またはそれよりも多く、およびその中の任意の範囲または値)を有する第2の配列、(iii)約16~約25ヌクレオチド、例えば、約16、17、18、19、20、21、22、23、24、または25ヌクレオチドを含む、プロトスペーサー配列、および(iv)約5~約20ヌクレオチド(例えば、約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20ヌクレオチド、およびその中の任意の範囲または値)を有する第3の配列を含み、ここで、(i)の約5~15ヌクレオチドを有する第1の配列は、(ii)の第2の配列の5’末にすぐ隣接しており、(ii)の第2の配列は(iii)のプロトスペーサー配列の5’末にすぐ隣接しており、プロトスペーサー配列は(iv)の第3の配列の5’末にすぐ隣接しており;標的オリゴヌクレオチド(第2)鎖は非標的オリゴヌクレオチド鎖に相補である;および(b)非標的オリゴヌクレオチド鎖は、相補の標的オリゴヌクレオチド鎖にアニーリングして、二本鎖核酸分子を産生し、ここで、第1の配列は制限部位を(その5’末に)含み、第3の配列は制限部位を(その3’末に)含み、ここで、2以上の二本鎖核酸分子のそれぞれの第1の配列(i)、プロトスペーサー配列(iii)および第3の配列(iv)は同一である。
本発明の第10の態様は、プロトスペーサーの3’末にPAM認識部位を有するCRISPR-Casヌクレアーゼのプロトスペーサー隣接モチーフ(PAM)の要件/特異性を判定するためのランダム化DNAライブラリーを提供し、ランダム化DNAライブラリーは、2以上の二本鎖核酸分子を含み、それぞれが以下を含む:(a)非標的オリゴヌクレオチド(第1)鎖および標的オリゴヌクレオチド(第2)鎖、ここで、非標的オリゴヌクレオチド鎖は、5’から3’に、(i)約5~約20ヌクレオチド(例えば、約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20ヌクレオチド、およびその中の任意の範囲または値)を有する第1の配列、(ii)約16~約25ヌクレオチド、例えば、約16、17、18、19、20、21、22、23、24、または25ヌクレオチドを含む、プロトスペーサー配列、(iii)少なくとも4つのランダム化ヌクレオチド(例えば、少なくとも4、5、6、7、8、9、10、またはそれよりも多く、およびその中の任意の範囲または値)を有する第2の配列、および(iv)約5~約15ヌクレオチド(例えば、約5、6、7、8、9、10、11、12、13、14、15ヌクレオチド、およびその中の任意の範囲または値)を有する第3の配列を含み、ここで(i)の約5~20ヌクレオチドを有する第1の配列は(ii)のプロトスペーサー配列の5’末にすぐ隣接しており、(iii)の第2の配列は(iii)のプロトスペーサー配列の3’末にすぐ隣接しており、(iv)の第3の配列は(iii)の第2の配列の3’末にすぐ隣接しており;標的オリゴヌクレオチド(第2)鎖は非標的オリゴヌクレオチド鎖に相補である;および(b)非標的オリゴヌクレオチド鎖は、相補の標的オリゴヌクレオチド鎖にアニーリングして、二本鎖核酸分子を産生し、ここで、第1の配列は制限部位を(その5’末に)含み、第3の配列は制限部位を(その3’末に)含み、ここで、2以上の二本鎖核酸分子のそれぞれの第1の配列(i)、プロトスペーサー配列(ii)および第3の配列(iv)は同一である。
本発明はさらに、本発明のCRISPR-Casヌクレアーゼおよび/または融合タンパク質をコードするポリヌクレオチドを含む発現カセットおよび/またはベクター、および/または、本発明のポリヌクレオチド、ポリペプチドおよび/または融合タンパク質を含む細胞、および/または、それを含むキットを提供する。
本発明のこれらのおよび他の態様は、以下の本発明の説明においてより詳細に示される。
[配列の簡単な説明]
配列番号1~17、49、50および51は、Cas12aヌクレアーゼをコードする例示的なヌクレオチド配列である。
配列番号18~22は、例示的なアデノシンデアミナーゼである。
配列番号23~25および配列番号42~48は、例示的なシトシンデアミナーゼである。
配列番号26は、ウラシル-DNAグリコシラーゼ阻害剤(UGI)をコードする例示的なヌクレオチド配列である。
配列番号27~29は、V型CRISPR-Cas12aヌクレアーゼに関するプロトスペーサー隣接モチーフ位置の一例を提供する。
配列番号30~39は、例えばインビトロ切断アッセイにおいて用いるための本発明のランダム化ライブラリーを産生するのに有用なヌクレオチド配列の例を示す。
配列番号40~41は、プロモーターおよびイントロンをコードする例示的な調節配列である。
配列番号52は、例示の発現カセットのヌクレオチド配列を提供する。
配列番号53は、例示のベクターのヌクレオチド配列を提供する。
配列番号54~61は、例示のスペーサー配列を提供する。
配列番号62は、例示のCRISPR RNAを提供する。
配列番号1~17、49、50および51は、Cas12aヌクレアーゼをコードする例示的なヌクレオチド配列である。
配列番号18~22は、例示的なアデノシンデアミナーゼである。
配列番号23~25および配列番号42~48は、例示的なシトシンデアミナーゼである。
配列番号26は、ウラシル-DNAグリコシラーゼ阻害剤(UGI)をコードする例示的なヌクレオチド配列である。
配列番号27~29は、V型CRISPR-Cas12aヌクレアーゼに関するプロトスペーサー隣接モチーフ位置の一例を提供する。
配列番号30~39は、例えばインビトロ切断アッセイにおいて用いるための本発明のランダム化ライブラリーを産生するのに有用なヌクレオチド配列の例を示す。
配列番号40~41は、プロモーターおよびイントロンをコードする例示的な調節配列である。
配列番号52は、例示の発現カセットのヌクレオチド配列を提供する。
配列番号53は、例示のベクターのヌクレオチド配列を提供する。
配列番号54~61は、例示のスペーサー配列を提供する。
配列番号62は、例示のCRISPR RNAを提供する。
本発明は、本発明の実施態様が示されている付随する図面および実施例に関して以下に説明されている。この説明は、本発明が実施され得る全ての異なる方法または本発明に加えられ得る全ての特徴の詳細なカタログであることを意図しない。例えば、一実施態様に関して例示される特徴が他の実施態様に組み込まれてよく、特定の実施態様に関して例示される特徴がその実施態様から削除されてよい。したがって、本発明は、本発明の一部の実施態様では、本明細書中に示される任意の特徴または特徴の組み合わせを除外または省略することができると考えられる。さらに、本明細書中に示唆される様々な実施態様に対する非常に多くのバリエーションおよび追加は、本開示に照らして当業者に明らかであり、本発明から逸脱しない。それ故に、以下の説明は、本発明の一部の特定の実施態様を例示することを意図し、それらの全ての並べ替え、組み合わせおよびバリエーションを網羅的に特定することを意図しない。
別段の定義がない限り、本明細書中で用いられる全ての技術的および科学的用語は、本発明が属する分野における通常の知識を有する者によって一般に理解されるのと同じ意味を有する。本明細書中、本発明の説明において用いられる専門用語は、特定の実施態様を説明する目的のためのみであり、本発明の限定を意図しない。
本明細書中で引用される全ての刊行物、特許出願、特許および他の参考文献は、参考文献が示されている文章および/または段落に関連のある教示に関して、それらの全体で参照により援用される。
文脈が別段の提示をしない限り、本明細書中に記載される本発明の様々な特徴は、任意の組み合わせで用いることができることが明確に意図される。さらに、本発明はまた、本発明の一部の実施態様では、本明細書中に示される任意の特徴または特徴の組み合わせを除外または省略することができると考えられる。例示すると、組成物が構成要素A、BおよびCを含むと明細書が記載する場合は、A、BまたはCのいずれか、またはそれらの組み合わせを、単独または任意の組み合わせで省略および否定することができることが明確に意図される。
本発明の説明および添付の特許請求の範囲において用いられる、単数形「a」、「an」および「the」は、文脈が明確に別段の提示をしない限り、複数形も含むことを意図する。
また、本明細書において用いられる「および/または」は、関係がある列挙された事項の1つまたは複数の任意および全てのあり得る組み合わせ、ならびに、選択的に解釈される場合は(「または(or)」)、組み合わせの欠如を指し、および包含する。
本明細書において用いられる用語「約」は、例えば量または濃度などの測定可能な値を指す場合、指定された値と同様に、指定された値の±10%、±5%、±1%、±0.5%、または実に±0.1%の変動を包含することを意味する。例えば、「約X」は、Xが測定可能な値である場合、Xおよび、Xの±10%、±5%、±1%、±0.5%、または実に±0.1%の変動を含むことを意味する。測定可能な値について本明細書中で提供される範囲は、その中の任意の他の範囲および/または個々の値を含んでよい。
本明細書において用いられる、「XとYの間」および「約XとYの間」のような語句は、XおよびYを含むと解釈すべきである。本明細書において用いられる「約XとYの間」のような語句は、「約Xと約Yの間」を意味し、「約XからYまで」のような語句は、「約Xから約Yまで」を意味する。
本明細書における値の範囲の列挙は、本明細書において別段の指示がない限り、その範囲内に入るそれぞれの個々の値を個々に言及する省略表現方法としての役割を単に意図しており、それぞれの個々の値は、あたかも本明細書において個々に列挙されたかのように本明細書中に組み込まれる。例えば、範囲10~15が開示された場合、11、12、13、および14もまた開示される。
本明細書において用いられる用語「含む(comprise)」、「含む(comprises)」および「含む(comprising)」は、記載される特徴、整数、ステップ、操作、エレメント、および/または構成要素の存在を特定するが、1つまたは複数の他の特徴、整数、ステップ、操作、エレメント、構成要素、および/またはそれらの群の存在または追加を排除しない。
本明細書において用いられる移行句「から本質的になる(consisting essentially of)」は、特許請求の範囲が、特許請求の範囲において列挙される指定の材料またはステップおよび特許請求の範囲に記載される発明の基本的および新規の特徴(単数または複数)に実質的に影響を及ぼさないものを包含すると解釈すべきであることを意味する。したがって、用語「から本質的になる」は、本発明の請求項において用いられる場合、「含む(comprising)」と同等であると解釈されることを意図しない。
本明細書において用いられる用語「増大する(increase)」、「増大する(increasing)」、「増強する(enhance)」、「増強する(enhancing)」「改善する(improve)」および「改善する(improving)」(およびそれらの文法上のバリエーション)は、コントロールと比較して、少なくとも約25%、50%、75%、100%、150%、200%、300%、400%、500%またはそれよりも多くの増加を説明する。
本明細書において用いられる用語「減少する(reduce)」、「減少した(reduced)」、「減少する(reducing)」、「減少(reduction)」、「減る(diminish)」および「低減する(decrease)」(およびそれらの文法上のバリエーション)は、例えば、コントロールと比較して、少なくとも約5%、10%、15%、20%、25%、35%、50%、75%、80%、85%、90%、95%、97%、98%、99%、または100%の低減を説明する。特定の実施態様では、減少は、検出可能な活性または量を生じさせることができず、または本質的に生じさせることができない(すなわち、ささいな量、例えば、約10%未満または実に5%)。
「異種」または「組み換え」ヌクレオチド配列は、それが導入される宿主細胞と天然に関連しないヌクレオチド配列であり、天然起源ヌクレオチド配列の非天然起源の複数コピーを含む。
「ネイティブ」または「野生型」の核酸、ヌクレオチド配列、ポリペプチドまたはアミノ酸配列は、天然起源または内因性の核酸、ヌクレオチド配列、ポリペプチドまたはアミノ酸配列を指す。したがって、例えば、「野生型mRNA」は、生物において天然起源のmRNAまたは生物にとって内因性のmRNAである。「同種」核酸配列は、それが導入される宿主細胞と天然に関連するヌクレオチド配列である。
本明細書において用いられる用語「核酸」、「核酸分子」、「ヌクレオチド配列」および「ポリヌクレオチド」は、線状または分岐の一本鎖または二本鎖であるRNAまたはDNA、またはそれらのハイブリッドを指す。その用語はまた、RNA/DNAハイブリッドも包含する。dsRNAが合成的に生産される場合、より一般的でない塩基、例えばイノシン、5-メチルシトシン、6-メチルアデニン、ヒポキサンチンおよびその他を、アンチセンス、dsRNA、およびリボザイムのペアリングに用いることもできる。例えば、ウリジンおよびシチジンのC-5プロピン類似体を含むポリヌクレオチドは、高い親和性でRNAに結合すること、および、遺伝子発現の強力なアンチセンス阻害剤であることが示されている。他の改変、例えばRNAのホスホジエステル主鎖、またはリボース糖基内の2’-ヒドロキシに対する改変を行なうこともできる。
本明細書において用いられる用語「ヌクレオチド配列」は、ヌクレオチドのヘテロポリマーまたは核酸分子の5’から3’末へのこれらのヌクレオチドの配列を指し、cDNA、DNAフラグメントまたは部分、ゲノムDNA、合成(例えば化学合成)DNA、プラスミドDNA、mRNA、およびアンチセンスRNAを含むDNAまたはRNA分子を含み、これらのいずれも、一本鎖または二本鎖であってよい。用語「ヌクレオチド配列」、「核酸」、「核酸分子」、「核酸構築物」、「オリゴヌクレオチド」および「ポリヌクレオチド」はまた、本明細書において相互交換可能にも用いられて、ヌクレオチドのヘテロポリマーを指す。本明細書中に提供される核酸分子および/またはヌクレオチド配列は本明細書において、5’から3’の方向で、左から右に示され、米国配列規則、37CFR§§1.821~1.825および世界知的所有権機関(WIPO)基準ST.25に記載のヌクレオチド記号を表わすのに標準的なコードを用いて表される。本明細書において用いられる「5’領域」は、ポリヌクレオチドの5’末に最も近いポリヌクレオチドの領域を意味することができる。したがって、例えば、ポリヌクレオチドの5’領域内のエレメントは、ポリヌクレオチドの5’末に位置する1つ目のヌクレオチドからポリヌクレオチドの途中に位置するヌクレオチドまでのどこかに位置することができる。本明細書において用いられる「3’領域」は、ポリヌクレオチドの3’末に最も近いポリヌクレオチドの領域を意味することができる。したがって、例えば、ポリヌクレオチドの3’領域内のエレメントは、ポリヌクレオチドの3’末に位置する1つ目のヌクレオチドからポリヌクレオチドの途中に位置するヌクレオチドまでのどこかに位置することができる。
本明細書において用いられる用語「遺伝子」は、mRNA、アンチセンスRNA、miRNA、抗マイクロRNAアンチセンスオリゴデオキシリボヌクレオチド(AMO)などを生産するために用いることのできる核酸分子を指す。遺伝子は、機能性タンパク質または遺伝子産物を生産するために用いることが可能であってよく、または可能でなくてもよい。遺伝子は、コード領域および非コード領域の両方(例えば、イントロン、調節エレメント、プロモーター、エンハンサー、終結配列および/または5’および3’非翻訳領域)を含むことができる。遺伝子は「単離され」てよく、それにより、その天然の状態において核酸と関連して通常見られる構成要素から実質的または本質的にフリーである核酸を意味する。そのような構成要素には、他の細胞材料、組み換え生産による培養培地、および/または、核酸の化学合成で用いられる様々な化学物質が含まれる。
用語「突然変異」は、点突然変異(例えば、ミスセンス、またはナンセンス、または、フレームシフトを生じさせる単一塩基対の挿入もしくは欠失)、挿入、欠失、および/またはトランケーションを指す。突然変異が、アミノ酸配列内の残基の別の残基による置換、または、配列内の1つまたは複数の残基の欠失または挿入である場合は、突然変異は典型的に、元の残基の後に、配列内のその残基の位置、および新たに置換された残基の識別(identity)を特定することによって記載される。
本明細書において用いられる用語「相補(complementary)」または「相補性(complementarity)」は、許容的な塩および温度条件下での塩基対合によるポリヌクレオチドの自然な結合を指す。例えば、配列「A-G-T」(5’から3’)は、相補配列「T-C-A」(3’から5’)に結合する。2つの一本鎖分子間の相補性は、ヌクレオチドのほんの一部が結合する「部分的」であってよく、または、一本鎖分子の間に全体的な相補性が存在する「完全」であってよい。核酸鎖の間の相補性の程度は、核酸鎖の間のハイブリダイゼーションの効率および強度に重大な効果を有する。
本明細書において用いられる「相補(complement)」は、コンパレーターヌクレオチド配列との100%相補性を意味することができ、または、100%未満の相補性(例えば、約70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%などの相補性)を意味することができる。
本発明のヌクレオチド配列の「部分」または「フラグメント」は、参照核酸またはヌクレオチド配列と比較して減少した長さのヌクレオチド配列であって(例えば、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20またはそれよりも多くのヌクレオチドが減少している)、参照核酸またはヌクレオチド配列と同一またはほぼ同一(例えば、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一)の連続したヌクレオチドのヌクレオチド配列を含む、から本質的になる、および/またはからなることを意味することが理解される。本発明によるそのような核酸フラグメントまたは部分は、適切な場合は、それが成分となっている、より大きなポリヌクレオチド内に含まれてよい。一例として、本発明のガイド核酸のリピート配列は、野生型CRISPR-Casリピート配列(例えば、野生型Cas9リピート、野生型Cas12aリピートなど)の一部を含んでよい。
相同性を有する異なる核酸またはタンパク質は、本明細書において「ホモログ」と呼ばれる。用語「ホモログ」は、同一および他の種由来の相同配列および同一および他の種由来のオルソロガス配列を含む。「相同性」は、位置同一性のパーセントの観点からの、2以上の核酸および/またはアミノ酸配列の間の類似性のレベルを指す(すなわち配列類似性または同一性)。相同性はまた、異なる核酸またはタンパク質の間の似ている機能特性の概念を指す。したがって、本発明の組成物および方法は、本発明のヌクレオチド配列およびポリペプチド配列に対するホモログをさらに含む。本明細書において用いられる「オルソロガス」は、種分化中に共通の先祖遺伝子から生じた異なる種における相同ヌクレオチド配列および/またはアミノ酸配列を指す。本発明のヌクレオチド配列のホモログは、本発明の上記ヌクレオチド配列と実質的な配列同一性(例えば、少なくとも約70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%または100%)を有する。
本明細書において用いられる「配列同一性」は、2つの最適に並べられたポリヌクレオチドまたはポリペプチド配列が、構成要素(例えばヌクレオチドまたはアミノ酸)のアライメントのウインドウ全体を通して不変である程度を指す。「同一性」は、制限されないが、Computational Molecular Biology(Lesk,A.M.,ed.)Oxford University Press,New York(1988);Biocomputing: Informatics and Genome Projects(Smith,D.W.,ed.)Academic Press,New York(1993);Computer Analysis of Sequence Data,Part I(Griffin,A. M.,and Griffin,H.G.,eds.)Humana Press,New Jersey(1994);Sequence Analysis in Molecular Biology(von Heinje, G.,ed.)Academic Press(1987);and Sequence Analysis Primer(Gribskov,M.and Devereux,J.,eds.)Stockton Press,New York(1991)に記載されるものを含む公知の方法によって容易に計算することができる。
本明細書において用いられる用語「配列同一性パーセント」または「同一性パーセント」は、2つの配列が最適に並べられた場合の試験(「対象」)ポリヌクレオチド分子(またはその相補鎖)と比較した、参照(「クエリー」)ポリヌクレオチド分子(またはその相補鎖)の線状ポリヌクレオチド配列における同一のヌクレオチドのパーセンテージを指す。一部の実施態様では、「同一性パーセント」は、参照ポリペプチドと比較した、アミノ酸配列における同一のアミノ酸のパーセンテージを指すことができる。
2つの核酸分子、ヌクレオチド配列またはタンパク質配列の関連における、本明細書において用いられる語句「実質的に同一」または「実質的な同一性」は、以下の配列比較アルゴリズムのうちの1つを用いて測定してまたは目視検査によって、最大一致に関して比較およびアライメントした場合に、少なくとも約70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%または100%のヌクレオチドまたはアミノ酸残基同一性を有する2以上の配列またはサブ配列を指す。本発明の一部の実施態様では、実質的な同一性は、約10ヌクレオチド~約20ヌクレオチド、約10ヌクレオチド~約25ヌクレオチド、約10ヌクレオチド~約30ヌクレオチド、約15ヌクレオチド~約25ヌクレオチド、約30ヌクレオチド~約40ヌクレオチド、約50ヌクレオチド~約60ヌクレオチド、約70ヌクレオチド~約80ヌクレオチド、約90ヌクレオチド~約100ヌクレオチド、またはそれよりも多くのヌクレオチドの長さ、およびその中の任意の範囲(配列の全長まで)である本発明のヌクレオチド配列の連続するヌクレオチドの領域にわたって存在する。一部の実施態様では、ヌクレオチド配列は、少なくとも約20ヌクレオチド(例えば、約20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40ヌクレオチド)にわたって実質的に同一であることができる。一部の実施態様では、実質的に同一のヌクレオチドまたはタンパク質配列は、実質的に同一であるヌクレオチド(またはコードされるタンパク質配列)と実質的に同一の機能を発揮する。
配列比較のために、典型的に一方の配列は参照配列として働き、それに対して試験配列が比較される。配列比較アルゴリズムを用いる場合、試験配列および参照配列がコンピューターに入力されて、必要に応じてサブ配列座標が指定されて、配列アルゴリズムのプログラムパラメーターが指定される。それから、配列比較アルゴリズムは、指定のプログラムパラメーターに基づいて、参照配列と比較した試験配列(単数または複数)に関する配列同一性パーセントを計算する。
比較ウインドウを並べるための最適な配列アライメントは当業者によく知られており、SmithおよびWatermanの局所相同性アルゴリズム、NeedlemanおよびWunschの相同性アライメントアルゴリズム、PearsonおよびLipmanの類似性検索方法のようなツールによって実行されてよく、GCG(登録商標)Wisconsin Package(登録商標)(Accelrys Inc.,San Diego,CA)の一部として利用可能なGAP、BESTFIT、FASTA、およびTFASTAなどのアルゴリズムのコンピューター化された実行によるものであってもよい。試験配列および参照配列のアライメントされたセグメントに関する「同一性分率(identity fraction)」は、2つの並べられた配列が共有する同一の構成要素の数を、参照配列セグメント内の構成要素の合計数(すなわち、参照配列全体、または参照配列のより小さな定義された部分)で割ったものである。配列同一性パーセントは、同一性分率に100をかけたものとして表される。1つまたは複数のポリヌクレオチド配列の比較は、全長ポリヌクレオチド配列またはその一部、またはより長いポリヌクレオチド配列に対するものであってよい。本発明の目的に関して、「同一性パーセント」は、翻訳されたヌクレオチド配列についてはBLASTXバージョン2.0およびポリヌクレオチド配列についてはBLASTNバージョン2.0を用いて決定してもよい。
2つのヌクレオチド配列は、その2つの配列がストリンジェントな条件下で互いにハイブリダイズする場合に、実質的に相補であると考えてもよい。一部の代表的な実施態様では、実質的に相補であると考えられる2つのヌクレオチド配列は、非常にストリンジェントな条件下で互いにハイブリダイズする。
サザンおよびノーザンのハイブリダイゼーションのような核酸ハイブリダイゼーション実験の関連における「ストリンジェントなハイブリダイゼーション条件」および「ストリンジェントなハイブリダイゼーション洗浄条件」は配列依存性であり、異なる環境パラメーター下で異なる。核酸のハイブリダイゼーションに関する広範囲のガイドは、Tijssen Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes part I chapter 2「Overview of principles of hybridization and the strategy of nucleic acid probe assays」Elsevier,New York(1993)に見られる。一般に、非常にストリンジェントなハイブリダイゼーションおよび洗浄条件は、定義されたイオン強度およびpHでの特異的な配列に関する熱融点(Tm)よりも約5℃低くなるように選択される。
Tmは、標的配列の50%が、完全に一致するプローブにハイブリダイズする温度である(定義されたイオン強度およびpHにおいて)。非常にストリンジェントな条件は、特定のプローブに関するTmと同等であるように選択される。サザンブロットまたはノーザンブロットでのフィルター上の、100を超える相補残基を有する相補ヌクレオチド配列のハイブリダイゼーションに関するストリンジェントなハイブリダイゼーション条件の一例は、42℃で1mgのヘパリンを含む50%ホルムアミドであり、ハイブリダイゼーションを一晩行なう。非常にストリンジェントな洗浄条件の一例は、72℃で約15分間の0.15M NaClである。ストリンジェントな洗浄条件の一例は、65℃で15分間の0.2×SSC洗浄である(SSCバッファーの説明については、Sambrook(下記)を参照)。しばしば、高ストリンジェンシー洗浄の前に、バックグラウンドのプローブシグナルを除去するために低ストリンジェンシー洗浄が行われる。例えば100を超えるヌクレオチドのデュプレックスのための中ストリンジェンシー洗浄の一例は、45℃で15分間の1×SSCである。例えば100を超えるヌクレオチドのデュプレックスのための低ストリンジェンシー洗浄の一例は、40℃で15分間の4~6×SSCである。短いプローブ(例えば、約10~50ヌクレオチド)については、ストリンジェントな条件は典型的に、約1.0M Naイオン未満の塩濃度、典型的に約0.01~1.0MのNaイオン濃度(または他の塩)(pH7.0~8.3)を含み、温度は典型的に少なくとも約30℃である。ストリンジェントな条件は、ホルムアミドなどの不安定化剤の添加によって達成することもできる。一般に、特定のハイブリダイゼーションアッセイにおいて、関係のないプローブに関して観察されるものよりも2倍の(またはそれよりも高い)シグナル対ノイズ比は、特異的なハイブリダイゼーションの検出を示す。ストリンジェントな条件下で互いにハイブリダイズしないヌクレオチド配列は、それらがコードするタンパク質が実質的に同一であれば、実質的に同一である。これは例えば、遺伝暗号によって許容される最大コドン縮退を用いてヌクレオチド配列のコピーが作られる場合に生じ得る。
本発明の任意のヌクレオチド配列、ポリヌクレオチドおよび/または組み換え核酸構築物は、任意の目的の生物における発現のためにコドン最適化することができる。コドン最適化は当技術分野でよく知られており、種特異的なコドン使用頻度表を用いたコドン使用頻度バイアスに関するヌクレオチド配列の改変を含む。コドン使用頻度表は、目的の生物/種について最も多く発現される遺伝子の配列分析に基づいて作成される。ヌクレオチド配列が核内で発現される場合は、コドン使用頻度表は、目的の種に関して多く発現される核遺伝子の配列分析に基づいて作成される。ヌクレオチド配列の改変は、ネイティブのポリヌクレオチド配列内に存在するコドンと種特異的なコドン使用頻度表を比較することによって決定される。当該分野で理解されているように、ヌクレオチド配列のコドン最適化は、ネイティブのヌクレオチド配列に対して100%未満(例えば、約70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、または99.9%、およびその中の任意の範囲または値)の同一性を有するヌクレオチド配列を生じさせるが、元の、ネイティブのヌクレオチド配列によってコードされるものと同じ機能を有するポリペプチドをコードする。したがって、本発明の一部の実施態様では、本発明のポリヌクレオチド、核酸構築物、発現カセット、および/またはベクター(例えば、本発明のポリペプチド、融合タンパク質、複合体、例えば、改変されたCRISPR-Casヌクレアーゼを含む/コードする)は、特定の目的の種、例えば、特定の植物種、特定の細菌種、特定の動物種などにおける発現のためにコドン最適化される。一部の実施態様では、本発明のコドン最適化された核酸構築物、ポリヌクレオチド、発現カセット、および/またはベクターは、コドン最適化されていない本発明のポリヌクレオチド、核酸構築物、発現カセット、および/またはベクターに対して約70%~約99.9%(例えば、約70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.9%または100%)またはそれよりも高い同一性を有する。
本明細書中に記載の任意の実施態様において、本発明のポリヌクレオチドまたは核酸構築物は、植物および/または植物の細胞における発現のための様々なプロモーターおよび/または他の調節エレメントと作動可能に関連し得る。したがって、一部の実施態様では、本発明のポリヌクレオチドまたは核酸構築物は、1つまたは複数のヌクレオチド配列に動作可能に連結された、1つまたは複数のプロモーター、イントロン、エンハンサー、および/またはターミネーターをさらに含み得る。一部の実施態様では、プロモーターは、イントロンと動作可能に関連し得る(例えば、Ubi1プロモーターおよびイントロン)。一部の実施態様では、イントロンと関連するプロモーターは、「プロモーター領域」と呼ばれ得る(例えば、Ubi1プロモーターおよびイントロン。)
ポリヌクレオチドの言及における本明細書において用いられる「動作可能に連結された」または「動作可能に関連した」によって、示されたエレメントが互いに機能的に関連していることを意味し、また一般的に、物理的にも関連していることを意味する。したがって、本明細書において用いられる用語「動作可能に連結された」または「動作可能に関連した」は、機能的に関連がある単一の核酸分子上のヌクレオチド配列を指す。したがって、第2のヌクレオチド配列に動作可能に連結された第1のヌクレオチド配列は、第1のヌクレオチド配列が、第2のヌクレオチド配列との機能的関係において配置されている状況を意味する。例えば、プロモーターがヌクレオチド配列の転写または発現の作用があるならば、プロモーターはヌクレオチド配列と動作可能に関連している。制御配列(例えばプロモーター)は、制御配列が発現を指揮するように機能する限り、動作可能に関連しているヌクレオチド配列と連続している必要はないことを当業者は理解している。したがって、例えば、間に存在する転写されるが翻訳されない核酸配列が、プロモーターとヌクレオチド配列の間に存在してよく、プロモーターはそれでもなお、ヌクレオチド配列に「動作可能に連結されている」と考えることができる。
ポリペプチドに対する言及において本明細書で用いられる用語「連結される」は、1つのポリペプチドが別のポリペプチドに付着することを指す。ポリペプチドは、別のポリペプチドに(N末端またはC末端で)直接的に(例えばペプチド結合を介して)、またはリンカーを介して連結されてよい。
用語「リンカー」は、当該分野で認識されており、2つの分子または部分、例えば、融合タンパク質の2つのドメイン、例えば、LbCas12a CRISPR-Casヌクレアーゼドメインおよび目的ポリペプチド(例えば、核酸編集ドメイン、デアミナーゼドメイン、アデノシンデアミナーゼ、シトシンデアミナーゼ)などを連結する化学基、または分子を指す。リンカーは、単一の連結分子で構成されてよく、または、1つよりも多い連結分子を含んでもよい。一部の実施態様では、リンカーは、有機の分子、基、ポリマー、または化学部分、例えば、二価有機部分であることができる。一部の実施態様では、リンカーは、アミノ酸またはペプチドであってよい。一部の実施態様では、ペプチドリンカーは、約4~約100またはそれよりも多くのアミノ酸の長さ、例えば、約4、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100またはそれよりも多くのアミノ酸の長さ(例えば、約4~約40、約4~約50、約4~約60、約5~約40、約5~約50、約5~約60、約9~約40、約9~約50、約9~約60、約10~約40、約10~約50、約10~約60、または約4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25アミノ酸~約26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100またはそれよりも多くのアミノ酸の長さであってよい。一部の実施態様では、ペプチドリンカーはGSリンカーであってよい。
「プロモーター」は、プロモーターと動作可能に関連しているヌクレオチド配列(例えばコード配列)の転写を制御または調節するヌクレオチド配列である。プロモーターによって制御または調節されるコード配列は、ポリペプチドおよび/または機能性RNAをコードし得る。典型的に、「プロモーター」は、RNAポリメラーゼIIのための結合部位を含み転写の開始を指示するヌクレオチド配列を指す。一般に、プロモーターは、対応するコード配列のコード領域のスタートに対して5’、すなわち上流に見られる。プロモーターは、遺伝子発現の調節因子;例えば、プロモーター領域として作用する他のエレメントを含んでよい。これらは、TATAボックスコンセンサス配列、およびしばしば、CAATボックスコンセンサス配列を含む(Breathnach and Chambon,(1981)Annu.Rev.Biochem.50:349)。植物では、CAATボックスはAGGAボックスによって置換され得る(Messing et al.,(1983)in Genetic Engineering of Plants,T.Kosuge,C.Meredith and A.Hollaender(eds.),Plenum Press,pp.211-227)。一部の実施態様では、プロモーター領域は、少なくとも1つのイントロン(例えば、配列番号40または配列番号41)を含んでよい。
本発明で有用なプロモーターは、組み換え核酸分子、例えば、「合成の核酸構築物」または「タンパク質-RNA複合体」の調製での使用のための、例えば、構成的、誘導的、時間的に調節された、発生学的に調節された、化学的に調節された、組織好適および/または組織特異的プロモーターを含むことができる。これらの様々なタイプのプロモーターは、当技術分野で知られている。
プロモーターの選択は、発現の時間的および空間的要件に応じて異なってよく、形質転換される宿主細胞に基づいて異なってもよい。多くの異なる生物のためのプロモーターは当技術分野でよく知られている。当該分野に存在する広範囲の知識に基づき、適切なプロモーターを、特定の目的の宿主生物のために選択することができる。したがって、例えば、モデル生物において非常に構成的に発現される遺伝子の上流のプロモーターについて多くが知られており、そのような知識は、適宜、他のシステムにおいて容易にアクセスして実施することができる。
一部の実施態様では、植物において機能性のプロモーターは、本発明の構築物とともに用いられ得る。植物における発現を駆動するのに有用なプロモーターの非限定的な例は、ルビスコ小サブユニット遺伝子1のプロモーター(PrbcS1)、アクチン遺伝子のプロモーター(Pactin)、硝酸還元酵素遺伝子のプロモーター(Pnr)および二重の(duplicated)炭酸脱水酵素遺伝子1のプロモーター(Pdca1)を含む(Walker et al.Plant Cell Rep.23:727-735(2005);Li et al.Gene 403:132-142(2007);Li et al.Mol Biol.Rep.37:1143-1154(2010)を参照)。PrbcS1およびPactinは構成的プロモーターであり、PnrおよびPdca1は誘導性プロモーターである。Pnrは、硝酸塩で誘導され、アンモニウムで抑制され(Li et al.Gene 403:132-142(2007))、Pdca1は塩によって誘導される(Li et al.Mol Biol.Rep.37:1143-1154(2010))。
植物に有用な構成的プロモーターの例は、限定されないが、ケストルム(cestrum)ウイルスプロモーター(cmp)(米国特許第7,166,770号)、米アクチン1プロモーター(Wang et al.(1992)Mol.Cell.Biol.12:3399-3406;ならびに、米国特許第5,641,876号)、CaMV 35Sプロモーター(Odell et al.(1985)Nature 313:810-812)、CaMV 19Sプロモーター(Lawton et al.(1987)Plant Mol.Biol.9:315-324)、nosプロモーター(Ebert et al.(1987)Proc.Natl.Acad.Sci USA 84:5745-5749)、Adhプロモーター(Walker et al.(1987)Proc.Natl.Acad.Sci.USA 84:6624-6629)、スクロースシンターゼプロモーター(Yang&Russell(1990)Proc.Natl.Acad.Sci.USA 87:4144-4148)、およびユビキチンプロモーターを含む。ユビキチン由来の構成的プロモーターが多くの細胞型において蓄積している。ユビキチンプロモーターは、トランスジェニック植物における使用のためにいくつかの植物種からクローニングされている(例えば、ヒマワリ(Binet et al.,1991.Plant Science 79:87-94)、トウモロコシ(Christensen et al.,1989.Plant Molec.Biol.12:619-632)、およびシロイヌナズナ(Norris et al.1993.Plant Molec.Biol.21:895-906))。トウモロコシユビキチンプロモーター(UbiP)は、トランスジェニック単子葉植物システムにおいて開発されており、その配列および単子葉植物形質転換のために構築されたベクターは、特許公報EP0342926に開示されている。ユビキチンプロモーターは、トランスジェニック植物、特に単子葉植物における、本発明のヌクレオチド配列の発現に適切である。さらに、McElroy et al.(Mol.Gen.Genet.231:150-160(1991))によって記載されるプロモーター発現カセットは、本発明のヌクレオチド配列の発現のために容易に改変することができ、単子葉宿主での使用に特に適切である。
一部の実施態様では、組織特異的/組織好適プロモーターを、植物細胞における異種ポリヌクレオチドの発現のために用いることができる。組織特異的または好適な発現パターンは、限定されないが、緑色組織特異的または好適、根特異的または好適、茎特異的または好適、花特異的または好適または花粉特異的または好適を含む。緑色組織における発現に適切なプロモーターは、光合成に関与する遺伝子を調節するものの多くを含み、これらの多くは、単子葉植物および双子葉植物の両方からクローニングされている。一実施態様では、本発明で有用なプロモーターは、ホスホエノールカルボキシラーゼ遺伝子由来のトウモロコシPEPCプロモーターである(Hudspeth&Grula,Plant Molec.Biol.12:579-589(1989))。組織特異的プロモーターの非限定的な例は、種子貯蔵タンパク質をコードする遺伝子と関連するもの(例えば、β-コングリシニン、クルシフェリン、ナピン(napin)およびファゼオリン)、ゼインまたは油体タンパク質(例えばオレオシン)、または脂肪酸生合成に関与するタンパク質(アシル担体タンパク質、ステアロイル-ACPデサチュラーゼおよび脂肪酸デサチュラーゼ(fad2-1)を含む)、および胚の発達中に発現する他の核酸(例えば、Bce4、例えば、Kridl et al.(1991)Seed Sci.Res.1:209-219;ならびに欧州特許第255378号を参照)を含む。植物、特にトウモロコシにおける、本発明のヌクレオチド配列の発現に有用な、組織特異的または組織優先的プロモーターは、限定されないが、根、髄、葉または花粉における発現に向かわせるものを含む。そのようなプロモーターは、例えば、WO93/07278に開示されており、その全体で参照により本明細書中に援用される。本発明で有用な組織特異的または組織好適プロモーターの他の非限定的な例は、米国特許第6,040,504号に開示される綿ルビスコプロモーター;米国特許第5,604,121号に開示される米スクロースシンターゼプロモーター;de Framond(FEBS290:103-106(1991);EP0452269(Ciba-Geigy))によって記載される根特異的プロモーター;米国特許第5,625,136号(Ciba-Geigy)に記載されておりトウモロコシtrpA遺伝子の発現を駆動する茎特異的プロモーター;WO01/73087に開示されるケストルム・イエロー・リーフ・カーリング(cestrum yellow leaf curling)ウイルスプロモーター;および、制限されないが、米由来のProOsLPS10およびProOsLPS11(Nguyen et al.Plant Biotechnol.Reports 9(5):297-306(2015))、トウモロコシ由来のZmSTK2_USP(Wang et al.Genome 60(6):485-495(2017))、トマト由来のLAT52およびLAT59(Twell et al.Development 109(3):705-713(1990))、Zm13(米国特許第10,421,972号)、シロイヌナズナ由来のPLA2-δプロモーター(米国特許第7,141,424号)、および/または、トウモロコシ由来のZmC5プロモーター(国際PCT公報番号WO1999/042587)を含む花粉特異的または好適プロモーターである。
植物組織特異的/組織好適プロモーターのさらなる例は、限定されないが、根毛特異的シス-エレメント(RHE)(Kim et al.The Plant Cell 18:2958-2970(2006))、根特異的プロモーターRCc3(Jeong et al.Plant Physiol.153:185-197(2010))およびRB7(米国特許第5459252号)、レクチンプロモーター(Lindstrom et al.(1990)Der.Genet.11:160-167;およびVodkin(1983)Prog.Clin.Biol.Res.138:87-98)、トウモロコシアルコール脱水素酵素1プロモーター(Dennis et al.(1984)NucleicAcids Res.12:3983-4000)、S-アデノシル-L-メチオニン合成酵素(SAMS)(Vander Mijnsbrugge et al.(1996)Plant and Cell Physiology,37(8):1108-1115)、トウモロコシ集光性複合体プロモーター(Bansal et al.(1992)Proc.Natl.Acad.Sci.USA89:3654-3658)、トウモロコシヒートショックタンパク質プロモーター(O’Dell et al.(1985)EMBOJ.5:451-458;およびRochester et al.(1986)EMBOJ.5:451-458)、エンドウ小サブユニットRuBPカルボキシラーゼプロモーター(Cashmore,「Nuclear genes encoding the small subunit of ribulose-l,5-bisphosphate carboxylase」pp.29-39 In:Genetic Engineering of Plants(Hollaender ed.,Plenum Press 1983;および、Poulsen et al.(1986)Mol.Gen.Genet.205:193-200)、Tiプラスミドのマンノピンシンターゼプロモーター(Langridge et al.(1989)Proc.Natl.Acad.Sci.USA 86:3219-3223)、Tiプラスミドノパリンシンターゼプロモーター(Langridge et al.(1989)、上記)、ペチュニアのカルコンイソメラーゼプロモーター(van Tunen et al.(1988)EMBOJ.7:1257-1263)、マメのグリシンリッチタンパク質1プロモーター(Keller et al.(1989)Genes Dev.3:1639-1646)、トランケートされたCaMV 35Sプロモーター(O’Dell et al.(1985)Nature 313:810-812)、ジャガイモのパタチンプロモーター(Wenzler et al.(1989)Plant Mol.Biol.13:347-354)、根細胞プロモーター(Yamamoto et al.(1990)Nucleic Acids Res.18:7449)、トウモロコシのゼインプロモーター(Kriz et al.(1987)Mol.Gen.Genet.207:90-98;Langridge et al.(1983)Cell 34:1015-1022;Reina et al.(1990)Nucleic Acids Res.18:6425;Reina et al.(1990)Nucleic Acids Res.18:7449;およびWandelt et al.(1989)Nucleic Acids Res.17:2354)、グロブリン-1プロモーター(Belanger et al.(1991)Genetics 129:863-872)、α-チューブリンcabプロモーター(Sullivan et al.(1989)Mol.Gen.Genet.215:431-440)、PEPCaseプロモーター(Hudspeth&Grula(1989)Plant Mol.Biol.12:579-589)、R遺伝子複合体関連プロモーター(Chandler et al.(1989)Plant Cell 1:1175-1183)、およびカルコンシンターゼプロモーター(Franken et al.(1991)EMBO J.10:2605-2612)を含む。
種特異的な発現に有用なものは、エンドウのビシリンプロモーター(Czako et al.(1992)Mol.Gen.Genet.235:33-40;ならびに米国特許第5,625,136号に開示される種特異的プロモーターである。成葉における発現に有用なプロモーターは、老化の発生においてスイッチされるもの、例えば、シロイヌナズナ由来のSAGプロモーターである(Gan et al.(1995)Science 270:1986-1988)。
さらに、葉緑体において機能性のプロモーターを用いることができる。そのようなプロモーターの非限定的な例は、バクテリオファージT3遺伝子9 5’UTRおよび米国特許第7,579,516号に開示される他のプロモーターを含む。本発明で有用な他のプロモーターは、限定されないが、S-E9小サブユニットRuBPカルボキシラーゼプロモーターおよびKunitzトリプシン阻害剤遺伝子プロモーター(Kti3)を含む。
本発明で有用なさらなる調節エレメントは、限定されないが、イントロン、エンハンサー、終結配列および/または5’および3’非翻訳領域を含む。
本発明で有用なイントロンは、植物において同定および単離されたイントロンであってよく、植物の形質転換において用いられる発現カセット内に挿入される。当業者によって理解されるように、イントロンは、自己切除に必要な配列を含むことができ、それは核酸構築物/発現カセット内にインフレームで組み込まれる。イントロンは、1つの核酸構築物内の複数のタンパク質コード配列を分けるためのスペーサーとして用いることができ、または、イントロンは、1つのタンパク質コード配列内で、例えばmRNAを安定化するために用いることができる。タンパク質コード配列内で用いられる場合、それらは、含められる切除部位と「インフレーム」で挿入される。イントロンは、発現を改善または改変するためのプロモーターと関連してもよい。一例として、本発明で有用なプロモーター/イントロンの組み合わせは、制限されないが、トウモロコシUbi1プロモーターおよびイントロンの組み合わせを含む。
本発明で有用なイントロンの非限定的な例は、ADHI遺伝子由来のイントロン(例えば、Adh1-Sイントロン1、2および6)、ユビキチン遺伝子(Ubi1)由来のイントロン、ルビスコ小サブユニット(rbcS)遺伝子由来のイントロン、ルビスコ大サブユニット(rbcL)遺伝子由来のイントロン、アクチン遺伝子由来のイントロン(例えば、アクチン-1イントロン)、ピルビン酸脱水素酵素キナーゼ遺伝子(pdk)由来のイントロン、硝酸還元酵素遺伝子(nr)由来のイントロン、二重の炭酸脱水酵素遺伝子1(Tdca1)由来のイントロン、psbA遺伝子由来のイントロン、atpA遺伝子由来のイントロン、またはそれらの任意の組み合わせを含む。非限定的な一例として、本発明の核酸構築物は、最適化CRISPR-Casヌクレアーゼ(例えば、配列番号1~11または23~25)およびデアミナーゼを含む塩基エディタをコードしてよく、ここで核酸構築物は、イントロンを含む/と関連するプロモーターをさらに含む。さらなる非限定的な一例として、本発明の核酸構築物は、最適化CRISPR-Casヌクレアーゼ(例えば、配列番号1~11または23~25)およびデアミナーゼを含む塩基エディタをコードしてよく、ここで、ヌクレアーゼおよび/またはデアミナーゼは1つまたは複数のイントロンを含み、核酸構築物は、イントロンを含む/と関連するプロモーターをさらに含んでもよい。
一部の実施態様では、本発明のポリヌクレオチドおよび/または核酸構築物は、「発現カセット」であってよく、または発現カセット内に含まれてよい。本明細書において用いられる「発現カセット」とは、例えば、本発明の核酸構築物(例えば、本発明の改変されたLbCas12aをコードする)を含む組み換え核酸分子を意味し、ここで、核酸構築物は、少なくとも制御配列(例えばプロモーター)と動作可能に関連する。したがって、本発明の一部の実施態様は、例えば、本発明の核酸構築物(例えば、本発明の改変されたLbCas12aをコードする本発明の核酸構築物)を発現するように設計された発現カセットを提供する。
本発明の核酸構築物を含む発現カセットはキメラであってよく、その構成要素の少なくとも1つが、その他の構成要素のうちの少なくとも1つに対して異種であることを意味する(例えば、宿主生物内で発現される目的ポリヌクレオチドに動作可能に連結された宿主生物由来のプロモーターであって、ここで、目的ポリヌクレオチドは、宿主とは異なる生物由来であり、または、そのプロモーターと関連して通常は見られない)。発現カセットは、天然起源のものであってもよいが、異種発現に有用な組み換え型で得られたものである。
発現カセットは、選択された宿主細胞において機能性である転写および/または翻訳終結領域(すなわち、終結領域)および/またはエンハンサー領域を含むこともできる。様々な転写ターミネーターおよびエンハンサーが当技術分野で知られており、発現カセットでの使用に利用可能である。転写ターミネーターは、転写終結および正しいmRNAポリアデニル化を担う。終結領域および/またはエンハンサー領域は、転写開始領域にネイティブであってよく、例えば、本発明の核酸構築物によってコードされるLbCas12aヌクレアーゼをコードする遺伝子にネイティブであってよく、宿主細胞にネイティブであってよく、または、他の由来にネイティブであってよい(例えば、プロモーター、本発明の核酸構築物によってコードされるLbCas12aヌクレアーゼをコードする遺伝子、宿主細胞、またはそれらの任意の組み合わせにとって外来または異種である)。エンハンサー領域は、本発明の核酸構築物によってコードされるLbCas12aヌクレアーゼをコードする遺伝子にネイティブであってよく、宿主細胞にネイティブであってよく、または、別の由来であってよい(例えば、プロモーター、本発明の核酸構築物によってコードされるLbCas12aヌクレアーゼをコードする遺伝子、宿主細胞、またはそれらの任意の組み合わせにとって外来または異種である)。
本発明の発現カセットは、形質転換された宿主細胞を選択するために用いることのできる選択可能マーカーをコードするヌクレオチド配列を含んでもよい。本明細書において用いられる「選択可能マーカー」は、発現されたときに、マーカーを発現している宿主細胞に別個の表現型を与え、したがって、そのような形質転換された細胞がマーカーを有していないものから区別され得る、ヌクレオチド配列を意味する。そのようなヌクレオチド配列は、化学的手段によって、例えば、選択剤(例えば抗生物質など)を用いることによって選択することのできる特徴をマーカーが与えるかどうか、または、マーカーが、観察または試験を通して、例えばスクリーニング(例えば蛍光)によって同定することのできる単純な特徴であるかどうかに応じて、選択可能マーカーまたはスクリーニング可能マーカーのいずれかをコードしてよい。適切な選択可能マーカーの多くの例が当技術分野で知られており、本明細書中に記載の発現カセットにおいて用いることができる。
発現カセットに加えて、本明細書中に記載の核酸分子/構築物およびポリヌクレオチド配列は、ベクターに関して用いられ得る。用語「ベクター」は、核酸(単数または複数)を細胞内に移行、送達、または導入するための組成物を指す。ベクターは、移行、送達、または導入されるヌクレオチド配列(単数または複数)を含む核酸構築物を含む。宿主生物の形質転換における使用のためのベクターは当技術分野でよく知られている。ベクターの一般的なクラスの非限定的な例は、ウイルスベクター、プラスミドベクター、ファージベクター、ファージミドベクター、コスミドベクター、フォスミドベクター、バクテリオファージ、人工染色体、ミニサークル、または、自己伝染性または運動性であってもよい、またはそうでなくてもよい、二本鎖または一本鎖の直鎖または環状型のアグロバクテリウム・バイナリー・ベクターを含む。一部の実施態様では、ウイルスベクターは、制限されないが、レトロウイルス、レンチウイルス、アデノウイルス、アデノ随伴、または単純ヘルペスウイルスベクターを含むことができる。本明細書において定義されるベクターは、原核生物または真核生物宿主を、細胞ゲノム内への組込みによって形質転換することができ、または、染色体外に存在することができる(例えば複製起点を有する自律複製プラスミド)。放線菌および関連種、細菌および真核生物(例えば高等植物、哺乳類、酵母または真菌細胞)から選択され得る2つの異なる宿主生物における複製が天然または設計によって可能であるDNAビヒクルを意味するシャトルベクターがさらに含まれる。一部の実施態様では、ベクター内の核酸は、宿主細胞における転写のための適切なプロモーターまたは他の調節エレメントの制御下であり、それに動作可能に連結されている。ベクターは、複数の宿主において機能する二機能性発現ベクターであってよい。ゲノムDNAの場合は、これは、その独自のプロモーターおよび/または他の調節エレメントを含んでよく、cDNAの場合は、宿主細胞における発現のための適切なプロモーターおよび/または他の調節エレメントの制御下であってよい。したがって、本発明の核酸構築物および/またはそれを含む発現カセットは、本明細書中に記載されており当技術分野で知られているベクター内に含まれてよい。一部の実施態様では、ベクターは、高コピー数ベクター(例えば、高コピー数E.coliベクター;例えば、pUC、pBluescript、pGEMなど)であってよい。したがって、例えば、本発明のライブラリーは、高コピー数ベクターを用いて構築されてよい。
本明細書において用いられる、「接触させる(contact)」、「接触させる(contacting)」、「接触した(contacted)」およびその文法上のバリエーションは、所望の反応の構成要素を、所望の反応(例えば、形質転換、転写制御、ゲノム編集、ニッキング、および/または切断)を行なうのに適切な条件下に一緒に置くことを指す。したがって、例えば、標的核酸は、(a)本発明の改変されたLbCas12aヌクレアーゼをコードする本発明のポリヌクレオチドおよび/または核酸構築物および(b)ガイド核酸と、ポリヌクレオチド/核酸構築物が発現されて改変されたLbCas12aヌクレアーゼが産生される条件下で接触され得て、ここで、ヌクレアーゼはガイド核酸と複合体を形成し、複合体が標的核酸にハイブリダイズし、それにより標的核酸を改変する。一部の実施態様では、標的核酸は、(a)本発明の改変されたLbCas12aヌクレアーゼおよび/またはそれを含む融合タンパク質(例えば、本発明の改変されたLbCas12aヌクレアーゼおよび目的ポリペプチド(例えばデアミナーゼ))および(b)ガイド核酸と接触され得て、ここで、改変されたLbCas12aヌクレアーゼはガイド核酸と複合体を形成し、複合体が標的核酸にハイブリダイズし、それにより標的核酸を改変する。本明細書中に記載のように、標的核酸は、ガイド核酸との接触の前、同時、後に、本発明のポリヌクレオチド/核酸構築物/ポリペプチドと接触され得る。
標的核酸に対する言及における、本明細書において用いられる「改変する(modifying)」または「改変(modification)」は、核酸/ヌクレオチド塩基の編集(例えば突然変異)、共有結合的改変、交換/置換、標的核酸の欠失、切断、ニッキング、および/または転写制御を含む。
目的ポリヌクレオチドの関連における「導入する(Introducing)」、「導入する(introduce)」、「導入される(introduced)」(およびそれらの文法上のバリエーション)は、目的ヌクレオチド配列(例えば、ポリヌクレオチド、核酸構築物、および/またはガイド核酸)を、宿主生物または該生物の細胞(例えば、宿主細胞;例えば植物細胞)に、ヌクレオチド配列が細胞の内側にアクセスする様式で提示することを意味する。したがって、例えば、本明細書中に記載の改変されたLbCas12aヌクレアーゼをコードする本発明のポリヌクレオチドおよびガイド核酸は、生物の細胞内に導入され得て、それにより、改変されたLbCas12aヌクレアーゼおよびガイド核酸を用いて細胞を形質転換する。
本明細書において用いられる用語「形質転換」は、細胞内への異種核酸の導入を指す。細胞の形質転換は、安定的または一過的であってよい。したがって、一部の実施態様では、宿主細胞または宿主生物は、本発明のポリヌクレオチド/核酸分子によって安定的に形質転換されてよい。一部の実施態様では、宿主細胞または宿主生物は、本発明のポリヌクレオチド/核酸構築物によって一過的に形質転換されてよい。
ポリヌクレオチドの文脈における「一過的な形質転換」は、ポリヌクレオチドが細胞内に導入され、細胞のゲノム中に組み込まれないことを意味する。
細胞内に導入されるポリヌクレオチドの文脈における「安定的に導入する」または「安定的に導入される」によって、導入されるポリヌクレオチドが細胞のゲノム中に安定的に組み込まれ、したがって細胞がポリヌクレオチドによって安定的に形質転換されることを意図する。
本明細書において用いられる「安定的な形質転換」または「安定的に形質転換される」は、核酸分子が細胞内に導入され、細胞のゲノム中に組み込まれることを意味する。したがって、組み込まれた核酸分子は、その子孫、より具体的には複数の累代の子孫に遺伝することが可能である。本明細書において用いられる「ゲノム」は、核およびプラスチドゲノムを含み、したがって、例えば葉緑体またはミトコンドリアゲノム内への核酸の組込みを含む。本明細書において用いられる安定的な形質転換はまた、染色体外に、例えばミニ染色体またはプラスミドとして維持される導入遺伝子も指すことができる。
一過的な形質転換は、例えば、生物内に導入された1つまたは複数の導入遺伝子によってコードされるペプチドまたはポリペプチドの存在を検出することのできる酵素結合免疫吸着測定法(ELISA)またはウエスタンブロットによって検出され得る。細胞の安定的な形質転換は、例えば、生物(例えば植物)内に導入された導入遺伝子のヌクレオチド配列と特異的にハイブリダイズする核酸配列を用いた細胞のゲノムDNAのサザンブロットハイブリダイゼーションアッセイによって検出することができる。細胞の安定的な形質転換は、例えば、宿主生物内に導入された導入遺伝子のヌクレオチド配列と特異的にハイブリダイズする核酸配列を用いた細胞のRNAのノーザンブロットハイブリダイゼーションアッセイによって検出することができる。細胞の安定的な形質転換はまた、例えば、導入遺伝子の標的配列(単数または複数)とハイブリダイズする特異的なプライマー配列を用いて、標準的な方法に従って検出することのできる導入遺伝子配列の増幅をもたらす、ポリメラーゼ連鎖反応(PCR)または当技術分野でよく知られている他の増幅反応によっても検出することができる。形質転換はまた、当技術分野でよく知られているダイレクトシーケンシングおよび/またはハイブリダイゼーションプロトコルによっても検出することができる。
したがって、一部の実施態様では、本発明のヌクレオチド配列、ポリヌクレオチド、および/または核酸構築物および/またはそれを含む発現カセットおよび/またはベクターは、一過的に発現されてよく、および/または、それらは宿主生物のゲノム内に安定的に組み込まれ得る。したがって、一部の実施態様では、本発明の核酸構築物(例えば、本発明の改変されたLbCas12aヌクレアーゼまたはその融合タンパク質;例えば目的ポリヌクレオチド、例えばデアミナーゼドメインに連結された改変されたLbCas12aヌクレアーゼを含む融合タンパク質をコードする)(ここで改変されたLbCas12aヌクレアーゼをコードする核酸構築物は、生物(例えば、植物、哺乳類、菌類、細菌など)における発現のためにコドン最適化される)は、ガイド核酸とともに生物の細胞内に一過的に導入されてよく、したがって、DNAは細胞内に維持されない。
本発明のポリヌクレオチド/核酸構築物は、当業者に公知の任意の方法によって細胞内に導入することができる。本発明の一部の実施態様では、細胞の形質転換は、核の形質転換を含む。他の実施態様では、細胞の形質転換は、プラスチドの形質転換(例えば、葉緑体の形質転換)を含む。さらなる実施態様では、本発明のポリヌクレオチド/核酸構築物は、従来の繁殖技術を介して細胞内に導入することができる。
真核生物および原核生物を形質転換する手順はどちらも当該分野においてよく知られておりルーチンであり、文献全体を通して記載されている(例えば、Jiang et al.2013.Nat.Biotechnol.31:233-239;Ran et al.Nature Protocols 8:2281-2308(2013)を参照)。
したがって、ヌクレオチド配列は、宿主生物またはその細胞内に、当技術分野でよく知られている任意の数の方法で導入することができる。本発明の方法は、生物内に1つまたは複数のヌクレオチド配列を導入するために特定の方法に依存せず、生物の少なくとも1つの細胞の内側にアクセスすることのみである。1よりも多いヌクレオチド配列が導入される場合は、それらは、単一の核酸構築物の一部としてアセンブルされ得て、または別個の核酸構築物として、同一または異なる核酸構築物上に位置することができる。したがって、ヌクレオチド配列は、単一の形質転換イベントにおいて、および/または別個の形質転換において目的の細胞内に導入することができ、あるいは、関連がある場合、ヌクレオチド配列は、植物内に、例えば繁殖プロトコルの一部として組み込まれ得る。
本発明は、非天然PAM認識部位/配列を含むように改変されたCas12aヌクレアーゼ(例えば、その特定のCas12aヌクレアーゼに関する天然PAM認識特異性に加えて、またはその代わりに、非天然PAM認識特異性を含むCas12aヌクレアーゼ)に関する。さらに、本発明は、改善されたPAM認識特異性を含む望ましい特性を有するCas12aヌクレアーゼを設計、特定、および選択するための方法に関する。
改変されたCas12aポリペプチドの言及において本明細書において用いられる、「変更されたPAM特異性」は、ヌクレアーゼのPAM特異性が野生型ヌクレアーゼのものから変更されていることを意味する(例えば、非ネイティブPAM配列が、ネイティブPAM配列に加えて、および/またはその代わりに認識される。例えば、改変されたCas12aヌクレアーゼは、TTTV(V=A、CまたはG)のネイティブCas12a PAM配列以外を、および/またはそれに加えてPAM配列を認識する場合は、そのPAM特異性が変更されている。
本発明は、改変されたPAM認識特異性を有するLbCas12aヌクレアーゼに関する。一部の実施態様では、本発明は、改変されたLachnospiraceae bacterium CRISPR(Clustered Regularly Interspaced Short Palindromic Repeats)Cas12a(LbCas12a)ポリペプチドを提供し、ここで、改変されたLbCas12aポリペプチドは、配列番号1(LbCas12a)のアミノ酸配列と少なくとも80%同一性(例えば、約80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100%同一性;例えば、約80%~約100%、約85%~約100%、約90%~約100% 約95%~約100%)を有するアミノ酸配列、および、配列番号1の位置ナンバリングに関して以下の位置:K116、K120、K121、D122、E125、T148、T149、T152、D156、E159、Q529、G532、D535、K538、D541、Y542、L585、K591、M592、K595、V596、S599、K600、K601、Y616、Y646、および/またはW649の1つ以上(例えば、2、3、4、5、6、7、8、9、10、11、12、13またはそれよりも多く)における突然変異を含み、配列番号1の位置ナンバリングに関して以下の位置:K116、K120、K121、D122、E125、T152、D156、E159、G532、D535、K538、D541、および/またはK595の1つ以上における突然変異であってもよい。一部の実施態様では、Cas12a(LbCas12a)ポリペプチドの突然変異は、配列番号1の位置ナンバリングに関して以下の位置:K116、K120、K121、D122、E125、T152、D156、E159、G532、D535、K538、D541、および/またはK595の1つ以上における任意の組み合わせでの突然変異を含む、から本質的になる、またはからなる。したがって、本発明の改変されたLbCas12aポリペプチドは、配列番号1の位置ナンバリングに関して位置:K116、K120、K121、D122、E125、T148、T149、T152、D156、E159、Q529、G532、D535、K538、D541、Y542、L585、K591、M592、K595、V596、S599、K600、K601、Y616、Y646、および/またはW649のいずれか1つにおける単一突然変異を含んでよく、または、配列番号1の位置ナンバリングに関して、位置:K116、K120、K121、D122、E125、T148、T149、T152、D156、E159、Q529、G532、D535、K538、D541、Y542、L585、K591、M592、K595、V596、S599、K600、K601、Y616、Y646、および/またはW649の任意の2以上における突然変異の組み合わせを含んでよい。
一部の実施態様では、Cas12a(LbCas12a)ポリペプチドの突然変異は、配列番号1の位置ナンバリングに関して以下の突然変異:K116N、K116R、K120H、K120N、K120Q、K120R、K120T、K121D、K121G、K121H、K121Q、K121R、K121S、K121T、D122H、D122K、D122N、D122R、E125K、E125Q、E125R、E125Y、T148A、T148C、T148H、T148S、T149C、T149F、T149G、T149H、T149N、T149P、T149S、T149V、T152E、T152F、T152H、T152K、T152L、T152Q、T152R、T152W、T152Y、D156E、D156H、D156I、D156K、D156L、D156Q、D156R、D156W、D156Y、E159K、E159Q、E159R、E159Y、Q529A、Q529D、Q529F、Q529G、Q529H、Q529N、Q529P、Q529S、Q529T、Q529W、G532A、G532C、G532D、G532F、G532H、G532K、G532L、G532N、G532Q、G532S、D535A、D535H、D535K、D535N、D535S、D535T、D535V、K538C、K538F、K538G、K538H、K538L、K538M、K538Q、K538R、K538V、K538W、K538Y、D541A、D541E、D541H、D541I、D541N、D541R、D541Y、Y542F、Y542H、Y542K、Y542L、Y542M、Y542N、Y542R、Y542T、Y542V、L585F、L585G、L585H、K591A、K591F、K591G、K591H、K591R、K591S、K591W、K591Y、M592A、M592E、M592Q、K595H、K595L、K595M、K595Q、K595R、K595S、K595W、K595Y、V596H、V596T、S599G、S599H、S599N、K600G、K600H、K600R、K601H、K601Q、K601R、K601T、Y616E、Y616F、Y616H、Y616K、Y616R、Y646E、Y646H、Y646K、Y646N、Y646Q、Y646R、Y646W、W649H、W649K、W649R、W649Sおよび/またはW649Yの1つ以上を含む、から本質的になる、またはからなる。理解されるように、2以上の突然変異を有する任意の単一Cas12aポリペプチドは、任意の所定の位置に単一の突然変異のみを含む。したがって、例えば、ポリペプチドは、D535A、D535H、D535K、D535N、D535S、D535T、またはD535Vのいずれか1つの位置D535における突然変異を有し得るが、同じポリペプチドは、本明細書中に記載の他の位置のいずれかの1つ以上における突然変異をさらに含み得る。一部の実施態様では、Cas12a(LbCas12a)ポリペプチドの突然変異は、配列番号1の残基位置ナンバリングに関してK116N、K116R、K120H、K120N、K120Q、K120R、K120T、K121D、K121G、K121H、K121Q、K121R、K121S、K121T、D122H、D122K、D122N、D122R、E125K、E125Q、E125R、E125Y、T152E、T152F、T152H、T152K、T152L、T152Q、T152R、T152W、T152Y、D156E、D156H、D156I、D156K、D156L、D156Q、D156R、D156W、D156Y、E159K、E159Q、E159R、E159Y、G532A、G532C、G532D、G532F、G532H、G532K、G532L、G532N、G532Q、G532S、D535A、D535H、D535K、D535N、D535S、D535T、D535V、K538C、K538F、K538G、K538H、K538L、K538M、K538Q、K538R、K538V、K538W、K538Y、D541A、D541E、D541H、D541I、D541N、D541R、D541Y、K595H、K595L、K595M、K595Q、K595R、K595S、K595W、および/またはK595Yの突然変異の1つ以上を任意の組み合わせで含む、から本質的になる、またはからなる。一部の実施態様では、Cas12a(LbCas12a)ポリペプチドの突然変異は、配列番号1の位置ナンバリングに関してK116R、K116N、K120Y、K121S、K121R、D122H、D122N、E125K、T152R、T152K、T152Y、T152Q、T152E、T152F、D156R、D156W、D156Q、D156H、D156I、D156V、D156L、D156E、E159K、E159R、G532N、G532S、G532H、G532K、G532R、G532L、D535N、D535H、D535T、D535、S D535A、D535W、K538R K538V、K538Q、K538W、K538Y、K538F、K538H、K538L、K538M、K538C、K538G、K538A、D541E、K595R、K595Q、K595Y、K595W、K595H、K595S、および/またはK595Mの突然変異の1つ以上を含む、から本質的になる、またはからなる。理解されるように、2以上の突然変異を有する任意の単一Cas12aポリペプチドは、任意の所定の位置における単一突然変異を含む。したがって、例えば、ポリペプチドは、D535A、D535H、D535K、D535N、D535S、D535T、またはD535Vのいずれか1つの位置D535における突然変異を有してよく、本明細書中に記載の任意の他の位置における、1つ以上における突然変異をさらに含んでよい。
一部の実施態様では、突然変異は、配列番号1の位置ナンバリングに関してD156R、G532R、K538R、K538V、Y542RまたはK595Rの突然変異を含まない、それらから本質的になるものではない、または、それらからなるものではない。一部の実施態様では、Cas12a(LbCas12a)ポリペプチドの突然変異は、配列番号1の位置ナンバリングに関して、G532RおよびK595Rの突然変異の組み合わせ、G532R、K538VおよびY542Rの突然変異の組み合わせ、または、D156R、G532RおよびK532Rの突然変異の組み合わせを含まない、それらから本質的になるものではない、または、それらからなるものではない。
一部の実施態様では、改変されたLbCas12aポリペプチドは、表2(実施例2にある)に記載の配列番号1の1つまたは複数のアミノ酸突然変異を含んでよい。
一部の実施態様では、改変されたLbCas12aポリペプチドは、野生型LbCas12a(例えば、配列番号1)と比較して変更されたプロトスペーサー隣接モチーフ(PAM)特異性を含んでよい。本発明の改変されたLbCas12aポリペプチドは、変更されたPAM特異性を含んでよく、変更されたPAM特異性は、制限されないが、NNNG、NNNT、NNNA、NNNC、NNG、NNT、NNC、NNA、NG、NT、NC、NA、NN、NNN、NNNNを含み、ここで各配列の各Nは独立に、T、C、G、またはAのいずれかから選択される。一部の実施態様では、変更されたPAM特異性は、制限されないが、TTTA、TTTC、TTTG、TTTT、TTCA、TTCC、TTCG、TTCT、ATTC、CTTA、CTTC、CTTG、GTTC、TATA、TATC、CTCC、TCCG、TACA、TCCG、TACA、TCCG、TCCC、TCCA、および/またはTATGを含んでよい。一部の実施態様では、変更されたPAM特異性はNNNNであってよく、ここで各配列の各Nは独立に、T、C、G、またはAのいずれかから選択される。
変更されたPAM認識特異性を有することに加えて、改変されたLbCas12aヌクレアーゼは、ヌクレアーゼ活性部位(例えば、RuvCドメイン)内に突然変異をさらに含んでよい(例えば、deadLbCas12a、dLbCas12a)。そのような改変は、ヌクレアーゼ活性(例えば、ニッカーゼ活性)が減少したLbCas12aポリペプチドまたはヌクレアーゼ活性のないLbCas12aポリペプチドを生じさせ得る。
一部の実施態様では、V型Clustered Regularly Interspaced Short Palindromic Repeats(CRISPR)関連(Cas)(CRISPR-Cas)システムが提供され、該システムは、以下を含む:(a)以下を含む融合タンパク質:(i)本発明の改変されたLbCas12aヌクレアーゼまたは本発明の改変されたLbCas12aヌクレアーゼをコードする核酸、および(ii)目的ポリペプチドまたは目的ポリペプチドをコードする核酸;および(b)スペーサー配列とリピート配列とを含むガイド核酸(CRISPR RNA、CRISPR DNA、crRNA、crDNA)(ここで、ガイド核酸は改変されたLbCas12aヌクレアーゼまたは融合タンパク質と複合体を形成することが可能であり、スペーサー配列は、標的核酸にハイブリダイズすることが可能である)、それにより、改変されたLbCas12aヌクレアーゼおよび目的ポリペプチドを標的核酸にガイドし、それにより、該システムは、標的核酸を改変(例えば切断または編集)または調整(例えば転写調整)することが可能である。一部の実施態様では、該システムは、改変されたLbCas12aヌクレアーゼのC末端および/またはN末端に連結された目的ポリペプチド(例えば融合タンパク質)を含み、ペプチドリンカーを介してもよい。
さらに、本発明の改変されたCas12aヌクレアーゼを含む融合タンパク質が本明細書において提供される。一部の実施態様では、融合タンパク質は、改変されたLbCas12aのC末端および/またはN末端に連結された目的ポリペプチドを含んでよい。一部の実施態様では、本発明は、改変されたLbCas12aを含む(および目的ポリペプチドを連結する介在リンカーを含んでもよい)、融合タンパク質を提供する。
融合タンパク質の活性と干渉しないことが当技術分野で知られているか、または後に同定される、任意のリンカーを用いてよい。融合タンパク質の活性と「干渉」しないリンカーは、融合タンパク質のポリペプチド(例えば、ヌクレアーゼおよび/または目的ポリペプチド)の活性を減少または消去しないリンカーであり;すなわち、ヌクレアーゼ活性、核酸結合活性、編集活性、および/またはヌクレアーゼまたは目的ペプチドの任意の他の活性は、ヌクレアーゼおよび目的ポリペプチドがリンカーを介して互いにつなげられている融合タンパク質において維持される。一部の実施態様では、ペプチドリンカーは、(例えばそのN末端において)、改変されたLbCas12aのC末端に連結されてよく、融合タンパク質は、リンカーのC末端に連結された目的ポリペプチドをさらに含んでもよい。一部の実施態様では、ペプチドリンカーは、(例えばそのC末端において)、改変されたLbCas12aのN末端に連結されてよく、融合タンパク質は、リンカーのN末端に連結された目的ポリペプチドをさらに含んでもよい。一部の実施態様では、本発明の改変されたLbCas12aは、そのC末端およびN末端の両方において、リンカーおよび/または目的ポリペプチドに連結されてよい(直接、またはリンカーを介して)。
一部の実施態様では、本発明で有用なリンカーは、アミノ酸またはペプチドであってよい。一部の実施態様では、本発明で有用なペプチドリンカーは、約4~約100またはそれよりも多くのアミノ酸の長さ、例えば、約4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100またはそれよりも多くのアミノ酸の長さ(例えば、約4~約40、約4~約50、約4~約60、約5~約40、約5~約50、約5~約60、約9~約40、約9~約50、約9~約60、約10~約40、約10~約50、約10~約60、または約4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25アミノ酸~約26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100またはそれよりも多くのアミノ酸の長さ)であってよい。一部の実施態様では、ペプチドリンカーはGSリンカーであってよい。
本発明によって有用な目的ポリペプチドは、制限されないが、デアミナーゼ(脱アミノ化)活性、ニッカーゼ活性、リコンビナーゼ活性、トランスポサーゼ活性、メチラーゼ活性、グリコシラーゼ(DNAグリコシラーゼ)活性、グリコシラーゼ阻害剤活性(例えば、ウラシル-DNAグリコシラーゼ阻害剤(UGI)).デメチラーゼ活性、転写活性化活性、転写抑制活性、転写終結因子(transcription release factor)活性、ヒストン修飾活性、ヌクレアーゼ活性、一本鎖RNA切断活性、二本鎖RNA切断活性、制限エンドヌクレアーゼ活性(例えば、Fok1)、核酸結合活性、メチルトランスフェラーゼ活性、DNA修復活性、DNA損傷活性、ジスムターゼ活性、アルキル化活性、脱プリン活性、酸化活性、ピリミジンダイマー形成活性、インテグラーゼ活性、トランスポサーゼ活性、ポリメラーゼ活性、リガーゼ活性、ヘリカーゼ活性、および/またはフォトリアーゼ活性を有するポリペプチドまたはタンパク質ドメインを含むことできる。
一部の実施態様では、目的ポリペプチドは、デアミナーゼ活性を有する少なくとも1つのポリペプチドまたはタンパク質ドメインを含んでよい。一部の実施態様では、少なくとも1つのポリペプチドまたはタンパク質ドメインは、アデニンデアミナーゼドメインであってよい。本発明で有用なアデニンデアミナーゼ(またはアデノシンデアミナーゼ)は、任意の公知のまたは後の同定される、任意の生物由来のアデニンデアミナーゼであってよい(例えば、米国特許第10,113,163号を参照し、それはアデニンデアミナーゼのその開示について参照により本明細書中に援用される)。アデニンデアミナーゼは、アデニンまたはアデノシンの加水分解性の脱アミノ化を触媒することができる。一部の実施態様では、アデニンデアミナーゼは、アデノシンまたはデオキシアデノシンの、それぞれイノシンまたはデオキシイノシンへの加水分解性の脱アミノ化を触媒し得る。一部の実施態様では、アデノシンデアミナーゼは、DNAにおけるアデニンまたはアデノシンの加水分解性の脱アミノ化を触媒し得る。一部の実施態様では、本発明の核酸構築物によってコードされるアデニンデアミナーゼは、標的核酸のセンス(例えば、「+」;テンプレート)鎖におけるA→G変換または標的核酸のアンチセンス(例えば、「-」、相補)鎖におけるT→C変換を産生し得る。
一部の実施態様では、アデノシンデアミナーゼは、天然起源アデニンデアミナーゼの変異体であってよい。したがって、一部の実施態様では、本発明で有用なアデノシンデアミナーゼは、野生型アデニンデアミナーゼと約70%~100%同一であってよい(例えば、天然起源アデニンデアミナーゼと約70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%同一、およびその中の任意の範囲または値)。一部の実施態様では、デアミナーゼまたはデアミナーゼは、天然に生じず、操作された、突然変異した、または進化したアデノシンデアミナーゼと呼ばれ得る。したがって、例えば、操作された、突然変異した、または進化したアデニンデアミナーゼポリペプチドまたはアデニンデアミナーゼドメインは、天然起源アデニンデアミナーゼポリペプチド/ドメインと約70%~99.9%同一であってよい(例えば、天然起源アデニンデアミナーゼポリペプチドまたはアデニンデアミナーゼドメインと約70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%または99.9%同一、およびその中の任意の範囲または値)。一部の実施態様では、アデノシンデアミナーゼは、細菌、(例えば、大腸菌、黄色ブドウ球菌、インフルエンザ菌、カウロバクター・クレセンタスなど)由来であってよい。一部の実施態様では、アデニンデアミナーゼポリペプチド/ドメインをコードするポリヌクレオチドは、生物における発現のためにコドン最適化されてよい。
一部の実施態様では、アデニンデアミナーゼドメインは、野生型tRNA特異的アデノシンデアミナーゼドメイン、例えば、tRNA特異的アデノシンデアミナーゼ(TadA)および/または突然変異/進化したアデノシンデアミナーゼドメイン、例えば、突然変異/進化したtRNA特異的アデノシンデアミナーゼドメイン(TadA*)であってよい。一部の実施態様では、TadAドメインはE.coli由来であってよい。一部の実施態様では、TadAは、改変されてよく、例えば、トランケートされてよく、全長TadAに対して1つまたは複数のN末端および/またはC末端アミノ酸が欠失していてよい(例えば、全長TadAと比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のN末端および/またはC末端アミノ酸残基が欠失してよい。一部の実施態様では、TadAポリペプチドまたはTadAドメインは、N末端メチオニンを含まない。一部の実施態様では、野生型E.coli TadAは、配列番号18のアミノ酸配列を含む。一部の実施態様では、突然変異/進化したE.coli TadA*は、配列番号19~22のアミノ酸配列を含む。一部の実施態様では、TadA/TadA*をコードするポリヌクレオチドは、生物における発現のためにコドン最適化されてよい。
本発明で有用なシトシンデアミナーゼ(またはシチジンデアミナーゼ)は、任意の公知のまたは後の同定される、任意の生物由来のシトシンデアミナーゼであってよい(例えば、米国特許第10,167,457号を参照し、それは、シトシンデアミナーゼのその開示について参照により本明細書中に援用される)。一部の実施態様では、少なくとも1つのポリペプチドまたはタンパク質ドメインは、シトシンデアミナーゼポリペプチドまたはドメインであってよい。一部の実施態様では、シトシンデアミナーゼポリペプチド/ドメインは、アポリポタンパク質B mRNA編集触媒ポリペプチド様(APOBEC)ドメインであってよい。一部の実施態様では、目的ポリペプチドは、グリコシラーゼ阻害剤活性を有する少なくとも1つのポリペプチドまたはタンパク質ドメインを含んでよい。一部の実施態様では、目的ポリペプチドは、ウラシル-DNAグリコシラーゼ阻害剤(UGI)ポリペプチド/ドメインであってよい。一部の実施態様では、本発明の改変されたLbCas12aヌクレアーゼおよびシトシンデアミナーゼドメインをコードする(例えば、改変されたLbCas12aヌクレアーゼおよびシトシンデアミナーゼドメインを含む融合タンパク質をコードする)核酸構築物は、ウラシル-DNAグリコシラーゼ阻害剤(UGI)をさらにコードしてよく、ここでUGIは、生物における発現のためにコドン最適化される。一部の実施態様では、本発明は、改変されたLbCas12aヌクレアーゼ、シトシンデアミナーゼドメイン、およびUGIを含む融合タンパク質、および/またはそれをコードする1つまたは複数のポリヌクレオチドを提供し、ここで1つまたは複数のポリヌクレオチドは、生物における発現のためにコドン最適化されてもよい。
シトシンデアミナーゼは、シチジンまたはデオキシシチジンの、それぞれウリジンまたはデオキシウリジンへの加水分解性の脱アミノ化を触媒する。一部の実施態様では、デアミナーゼまたはデアミナーゼドメインは、ウラシルへのシトシンの加水分解性の脱アミノ化を触媒するシチジンデアミナーゼドメインであってよい。一部の実施態様では、シトシンデアミナーゼは、制限されないが、霊長類(例えば、ヒト、サル、チンパンジー、ゴリラ)、イヌ、ウシ、ラットまたはマウスを含む、天然起源シトシンデアミナーゼの変異体であってよい。したがって、一部の実施態様では、本発明で有用なシトシンデアミナーゼは、野生型シトシンデアミナーゼと約70%~約100%同一であってよい(例えば、天然起源シトシンデアミナーゼと約70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%同一、およびその中の任意の範囲または値)。一部の実施態様では、シトシンデアミナーゼポリペプチド/ドメインをコードするポリヌクレオチドは、生物における発現のためにコドン最適化されてよい。
一部の実施態様では、本発明で有用なシトシンデアミナーゼは、アポリポタンパク質B mRNA編集複合体(APOBEC)ファミリーデアミナーゼであってよい。一部の実施態様では、シトシンデアミナーゼは、APOBEC1デアミナーゼ、APOBEC2デアミナーゼ、APOBEC3Aデアミナーゼ、APOBEC3Bデアミナーゼ、APOBEC3Cデアミナーゼ、APOBEC3Dデアミナーゼ、APOBEC3Fデアミナーゼ、APOBEC3Gデアミナーゼ、APOBEC3Hデアミナーゼ、APOBEC4デアミナーゼ、ヒト活性化誘導性デアミナーゼ(hAID)、rAPOBEC1、FERNY、および/またはCDA1であってよく、pmCDA1、atCDA1(例えば、At2g19570)、およびその進化したバージョンであってもよい。一部の実施態様では、シトシンデアミナーゼは、配列番号23、配列番号44または配列番号46のアミノ酸配列を有するAPOBEC1デアミナーゼであってよい。一部の実施態様では、シトシンデアミナーゼは、配列番号24のアミノ酸配列を有するAPOBEC3Aデアミナーゼであってよい。一部の実施態様では、シトシンデアミナーゼはCDA1デアミナーゼであってよく、配列番号25または配列番号43のアミノ酸配列を有するCDA1であってもよい。一部の実施態様では、シトシンデアミナーゼはFERNYデアミナーゼであってよく、配列番号42または配列番号45のアミノ酸配列を有するFERNYであってもよい。一部の実施態様では、シトシンデアミナーゼは、配列番号47または配列番号48のアミノ酸配列を有するヒト活性化誘導性デアミナーゼ(hAID)であってよい。一部の実施態様では、本発明で有用なシトシンデアミナーゼは、天然起源シトシンデアミナーゼのアミノ酸配列と約70%~約100%同一(例えば、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%または100%同一)であってよい(例えば、進化したデアミナーゼ)。一部の実施態様では、本発明で有用なシトシンデアミナーゼは、配列番号23、配列番号24、配列番号25または配列番号42~48のアミノ酸配列と約70%~約99.5%同一(例えば、約70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または99.5%同一)(例えば、配列番号23、配列番号24、配列番号25または配列番号42~48のアミノ酸配列と少なくとも80%、少なくとも85%、少なくとも90%、少なくとも92%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一)であってよい。一部の実施態様では、シトシンデアミナーゼをコードするポリヌクレオチドは、生物における発現のためにコドン最適化されてよく、コドン最適化ポリペプチドは、参照ポリヌクレオチドと約70%~99.5%同一であってよい。
本発明で有用な「ウラシルグリコシラーゼ阻害剤」(UGI)は、ウラシル-DNAグリコシラーゼ塩基除去修復酵素を阻害することが可能な任意のタンパク質であってよい。一部の実施態様では、UGIドメインは、野生型UGIまたはそのフラグメントを含む。一部の実施態様では、本発明で有用なUGIドメインは、天然起源UGIドメインのアミノ酸配列に対して、約70%~約100%同一(例えば、約70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%または100%同一およびその中の任意の範囲または値)であってよい。一部の実施態様では、UGIドメインは、配列番号26のアミノ酸配列または配列番号26のアミノ酸配列に対して約70%~約99.5%同一性を有するポリペプチド(例えば、配列番号26のアミノ酸配列に対して、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも92%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一)を含んでよい。例えば、一部の実施態様では、UGIドメインは、配列番号26のアミノ酸配列の連続ヌクレオチドの一部(例えば、約10、15、20、25、30、35、40、45、50、55、60、65、70、75、80個の連続ヌクレオチド;例えば、約10、15、20、25、30、35、40、45、~約50、55、60、65、70、75、80個の連続ヌクレオチド)に対して100%同一である配列番号26のアミノ酸配列のフラグメントを含んでよい。一部の実施態様では、UGIドメインは、公知のUGIに対して70%~約99.5%同一性(例えば、約70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%同一性、およびその中の任意の範囲または値)を有する、公知のUGI(例えば、配列番号26)の変異体であってよい。一部の実施態様では、UGAをコードするポリヌクレオチドは、生物における発現のためにコドン最適化されてよく、コドン最適化ポリペプチドは、参照ポリヌクレオチドに対して約70%~約99.5%同一であってよい。
一部の実施態様では、改変されたLbCas12aヌクレアーゼは、そのヌクレアーゼ活性部位(例えば、RuvC)内に突然変異を含んでよい。そのヌクレアーゼ活性部位(単数または複数)内に突然変異を有しておりヌクレアーゼ活性をもはや含まない改変されたLbCas12aヌクレアーゼは一般に、「dead」と呼ばれる(例えば、dLbCas12a)。一部の実施態様では、そのヌクレアーゼ活性部位(単数または複数)内に突然変異を有する改変されたLbCas12aドメインまたはポリペプチドは、突然変異のない同一のLbCas12aヌクレアーゼと比較して損なわれた活性または減少した活性(例えば、ニッカーゼ活性)を有し得る。
本発明の改変されたLbCas12aヌクレアーゼは、改変されたLbCas12aヌクレアーゼと機能するように設計されたガイドRNA(gRNA、CRISPRアレイ、CRISPR RNA、crRNA)と組み合わせて用いられて、標的核酸を改変し得る。本発明で有用なガイド核酸は、少なくともスペーサー配列およびリピート配列を含む。ガイド核酸は、改変されたLbCas12aヌクレアーゼをコードする本発明のポリヌクレオチド/核酸構築物によってコードおよび発現されるLbCas12aヌクレアーゼドメインと複合体を形成することが可能であり、スペーサー配列は、標的核酸にハイブリダイズすることが可能であり、それにより、核酸構築物(例えば、改変されたLbCas12aヌクレアーゼ(および/または目的ポリペプチド))を標的核酸にガイドし、ここで、標的核酸は、改変されたLbCas12aヌクレアーゼ(および/またはコードされるデアミナーゼドメインおよび/または目的ポリペプチド)によって、改変(例えば、切断または編集)または調整(例えば転写調整)され得る。一例として、シトシンデアミナーゼドメインに連結されたLbCas12aドメイン(例えば融合タンパク質)をコードする核酸構築物は、LbCas12aガイド核酸と組み合わせて用いられて標的核酸を改変し得て、ここで、融合タンパク質のシトシンデアミナーゼドメインは標的核酸内のシトシン塩基を脱アミノ化し、それにより標的核酸を編集する。さらなる一例では、アデニンデアミナーゼドメインに連結されたLbCas12aドメイン(例えば融合タンパク質)をコードする核酸構築物は、LbCas12aガイド核酸と組み合わせて用いられて標的核酸を改変し得て、ここで、融合タンパク質のアデニンデアミナーゼドメインは、標的核酸内のアデノシン塩基を脱アミノ化し、それにより標的核酸を編集する。
本明細書において用いられる「ガイド核酸」、「ガイドRNA」、「gRNA」、「CRISPR RNA/DNA」、「crRNA」または「crDNA」は、標的核酸(例えば、プロトスペーサー)に相補である(およびハイブリダイズする)少なくとも1つのスペーサー配列、および少なくとも1つのリピート配列(例えば、V型Cas12a CRISPR-Casシステムのリピート、またはそのフラグメントまたは部分)を含む核酸を意味し、ここで、リピート配列は、スペーサー配列の5’末および/または3’末に連結され得る。本発明のgRNAの設計は、V型Cas12aシステムに基づき得る。
一部の実施態様では、Cas12a gRNAは、5’から3’に、リピート配列(全長またはその一部(「ハンドル」);例えば、シュードノット様構造)およびスペーサー配列を含んでよい。
一部の実施態様では、ガイド核酸は、1つよりも多い「リピート配列-スペーサー」配列(例えば、2、3、4、5、6、7、8、9、10、またはそれよりも多いリピート-スペーサー配列)(例えば、リピート-スペーサー-リピート、例えば、リピート-スペーサー-リピート-スペーサー-リピート-スペーサー-リピート-スペーサー-リピート-スペーサーなど)を含んでよい。本発明のガイド核酸は、合成の、人が作製した、天然に見られないものである。gRNAは、かなり長くすることができ、アプタマーとして(MS2動員ストラテジーのように)、またはスペーサーにぶら下がる(hanging off)他のRNA構造として用いられ得る。
本明細書において用いられる「リピート配列」は、例えば、野生型Cas12a遺伝子座(例えばLbCas12a遺伝子座)の任意のリピート配列、または、本発明の核酸構築物によってコードされるLbCas12aヌクレアーゼと機能性である合成crRNAのリピート配列を指す。本発明で有用なリピート配列は、任意の公知のまたは後の同定される、Cas12a遺伝子座のリピート配列であることができ、または、Cas12aV型CRISPR-Casシステムにおいて機能するように設計された合成のリピートであることができる。リピート配列は、ヘアピン構造および/またはステムループ構造を含んでよい。一部の実施態様では、リピート配列は、その5’末においてシュードノット様構造を形成してよい(例えば、「ハンドル」)。したがって、一部の実施態様では、リピート配列は、野生型V CRISPR-Cas遺伝子座(例えば、野生型Cas12a遺伝子座)由来のリピート配列と同一または実質的に同一であることができる。野生型Cas12a遺伝子座由来のリピート配列は、確立されたアルゴリズムによって、例えば、CRISPRdbによって提供されるCRISPRfinderを用いて決定され得る(Grissa et al.Nucleic Acids Res.35(Web Server issue):W52-7を参照)。一部の実施態様では、リピート配列またはその一部は、その3’末においてスペーサー配列の5’末に連結され、それにより、リピート-スペーサー配列(例えば、ガイドRNA、crRNA)を形成する。
一部の実施態様では、リピート配列は、特定のリピートに応じて、および、リピートを含むガイドRNAがプロセッシングされるか否かにかかわらず、少なくとも10ヌクレオチドを含む、から本質的になる、またはからなる(例えば、約10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50~100またはそれよりも多くのヌクレオチド、またはその中の任意の範囲または値;例えば、約)。一部の実施態様では、リピート配列は、約10~約20、約10~約30、約10~約45、約10~約50、約15~約30、約15~約40、約15~約45、約15~約50、約20~約30、約20~約40、約20~約50、約30~約40、約40~約80、約50~約100、またはそれよりも多くのヌクレオチドを含む、から本質的になる、またはからなる。
スペーサー配列の5’末に連結されたリピート配列は、リピート配列の一部(野生型リピート配列の、例えば、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35またはそれよりも多くの連続するヌクレオチド)を含むことができる。一部の実施態様では、スペーサー配列の5’末に連結されたリピート配列の部分は、約5~約10個の連続するヌクレオチドの長さ(例えば、約5、6、7、8、9、10ヌクレオチド)であることができ、野生型CRISPR Casリピートヌクレオチド配列の同一領域(例えば、5’末)に対して、少なくとも90%同一性(例えば、少なくとも約90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、またはそれよりも多く)を有することができる。一部の実施態様では、リピート配列の部分は、その5’末にシュードノット様構造を含んでよい(例えば、「ハンドル」)。
本明細書において用いられる「スペーサー配列」は、標的核酸(例えば、標的DNA)(例えば、プロトスペーサー)に相補のヌクレオチド配列である。スペーサー配列は、標的核酸と完全に相補または実質的に相補(例えば、少なくとも約70%相補(例えば、約70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、またはそれよりも多く、およびその中の任意の範囲または値))であることができる。したがって、一部の実施態様では、スペーサー配列は、標的核酸と比較して1、2、3、4、または5個のミスマッチを有することができ、そのミスマッチは連続または不連続であることができる。一部の実施態様では、スペーサー配列は、標的核酸に対して約70%相補性を有することができる。他の実施態様では、スペーサーヌクレオチド配列は、標的核酸に対して約80%相補性を有することができる。さらに他の実施態様では、スペーサーヌクレオチド配列は、標的核酸(プロトスペーサー)に対して、約85%、90%、95%、96%、97%、98%、99%または99.5%相補性などを有することができる。一部の実施態様では、スペーサー配列は、標的核酸に対して100%相補である。スペーサー配列は、約15ヌクレオチド~約30ヌクレオチドの長さ(例えば、約15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30ヌクレオチド、またはその中の任意の範囲または値)を有してよい。したがって、一部の実施態様では、スペーサー配列は、少なくとも約15ヌクレオチド~約30ヌクレオチドの長さであり得る標的核酸(例えば、プロトスペーサー)の領域にわたって完全な相補性または実質的な相補性を有してよい。一部の実施態様では、スペーサーは、約20、21、22、23、24、または25ヌクレオチドの長さであってよい。一部の実施態様では、スペーサーは、23ヌクレオチドの長さであってよい。
一部の実施態様では、ガイドRNAのスペーサー配列の5’領域は標的核酸と同一であってよく、一方でスペーサーの3’領域は標的核酸と実質的に相補であってよい(例えば、V型CRISPR-Cas)か、または、ガイドRNAのスペーサー配列の3’領域は標的核酸と同一であってよく、一方でスペーサーの5’領域は標的核酸と実質的に相補であってよく(例えば、II型CRISPR-Cas)、したがって、標的核酸に対するスペーサー配列の全体的な相補性は、100%未満であってよい。したがって、例えば、V型CRISPR-Casシステムのためのガイドでは、例えば、20ヌクレオチドスペーサー配列の5’領域内の最初の1、2、3、4、5、6、7、8、9、10ヌクレオチド(すなわち、シード領域)は、標的核酸と100%相補であってよく、スペーサー配列の3’領域内の残りのヌクレオチドは、標的核酸と実質的に相補(例えば、少なくとも約70%相補)であってよい。一部の実施態様では、スペーサー配列の5’末の最初の1~8ヌクレオチド(例えば、最初の1、2、3、4、5、6、7、8、ヌクレオチド、およびその中の任意の範囲)は、標的核酸と100%相補であってよく、スペーサー配列の3’領域内の残りのヌクレオチドは、標的核酸と実質的に相補(例えば、少なくとも約50%相補(例えば、約50%、55%、60%、65%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、またはそれよりも多く))であってよい。
一部の実施態様では、スペーサーのシード領域は、約8~約10ヌクレオチドの長さ、約5~約6ヌクレオチドの長さ、または約6ヌクレオチドの長さであってよい。
本明細書において用いられる「標的核酸」、「標的DNA」、「標的ヌクレオチド配列」、「標的領域」、または「ゲノム中の標的領域」は、本発明のガイドRNA内のスペーサー配列と完全に相補(100%相補)または実質的に相補(例えば、少なくとも70%相補(例えば、約70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%またはそれよりも多く、およびその中の任意の範囲または値))である生物のゲノムの領域を指す。一部の実施態様では、V型CRISPR-Casシステム(例えば、LbCas12a)に有用な標的領域は、生物のゲノム(例えば、植物ゲノム、動物ゲノム、細菌ゲノム)において、PAM配列のすぐ3’に位置する。一部の実施態様では、標的領域は、PAM配列にすぐ隣接して位置する任意の少なくとも15個の連続するヌクレオチド(例えば、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30またはそれよりも多くのヌクレオチド、およびその中の任意の範囲または値;例えば、約19~約25ヌクレオチド、約20~約24ヌクレオチドの長さなど)から選択され得る。
「プロトスペーサー配列」は、標的核酸を指し、具体的には、CRISPRリピート-スペーサー配列(例えば、ガイドRNA、CRISPRアレイ、crRNA)のスペーサー配列と完全または実質的に相補である(およびハイブリダイズする)標的核酸の部分(例えば、またはゲノム内の標的領域)を指す。
V型CRISPR-Cas Cas12aシステムの場合では、プロトスペーサー配列は、プロトスペーサー隣接モチーフ(PAM)にフランキングしている(すぐ隣接している)。PAMは、非標的鎖の5’末および標的鎖の3’末に位置する(一例として以下を参照)。
標準的なCas12a PAMはTリッチである。一部の実施態様では、標準的なCas12a PAM配列は、5’-TTN、5’-TTTN、または5’-TTTVであってよい。
本発明のポリペプチド、融合タンパク質および/またはシステムは、ポリヌクレオチドまたは核酸構築物によってコードされてよい。一部の実施態様では、本発明のポリペプチド、融合タンパク質および/またはシステムをコードするポリヌクレオチド/核酸構築物は、本明細書中に記載されるように目的生物および/または目的生物の細胞における発現のための調節エレメント(例えば、プロモーター、ターミネーターなど)と動作可能に関連してよい。一部の実施態様では、本発明のポリペプチド、融合タンパク質および/またはシステムをコードするポリヌクレオチド/核酸構築物は、生物における発現のためにコドン最適化されてよい。
一部の実施態様では、本発明は、(a)本発明の改変されたLbCas12aポリペプチドまたは本発明の融合タンパク質および(b)ガイド核酸(例えば、CRISPR RNA、CRISPR DNA、crRNA、crDNA)を含む複合体を提供する。
一部の実施態様では、本発明は、(a)本発明の改変されたLbCas12aポリペプチドまたは本発明の融合タンパク質および(b)ガイド核酸を含む組成物を提供する。
一部の実施態様では、本発明は、本発明のポリヌクレオチド/核酸構築物を含む発現カセットおよび/またはベクターを提供する。一部の実施態様では、本発明のポリヌクレオチド/核酸構築物および/または1つまたは複数のガイド核酸を含む発現カセットおよび/またはベクターが提供され得る。一部の実施態様では、本発明の改変されたCRISPR-Casヌクレアーゼおよび/または改変されたCRISPR-Casヌクレアーゼを含む融合タンパク質をコードする核酸構築物は、ガイド核酸を含むものと同一または別個の発現カセットまたはベクター内に含まれてよい。核酸構築物が、ガイド核酸を含むものとは別個の発現カセットまたはベクター内に含まれる場合、標的核酸は、ガイド核酸を含む発現カセットが提供される(例えば標的核酸と接触される)前に、同時に、または後に、本発明の核酸構築物を含む発現カセットまたはベクターと接触(例えば提供)されてよい。
一部の実施態様では、本発明は、本発明の組成物および/または複合体をコードする、または本発明のシステムを含む、発現カセットおよび/またはベクターを提供する。
一部の実施態様では、生物における発現のために最適化されている本発明のポリヌクレオチド、核酸構築物、発現カセットおよび/またはベクターは、同一の本発明の改変されたCRISPR-Casヌクレアーゼまたは融合タンパク質をコードするが生物における発現のためにコドン最適化されていないポリヌクレオチド、核酸構築物、発現カセットおよび/またはベクターに対して、約70%から約100%同一(例えば、約70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%または100%、およびその中の任意の値または範囲)であってよい。ポリヌクレオチドまたは核酸構築物が最適化され得る生物は、制限されないが、動物、植物、菌類、古細菌、または細菌を含んでよい。一部の実施態様では、本発明のポリヌクレオチドまたは核酸構築物は、植物における発現のためにコドン最適化される。
一部の実施態様では、本発明は、本発明の1つまたは複数のポリヌクレオチド、ガイド核酸、核酸構築物、システム、発現カセットおよび/またはベクターを含む細胞を提供する。
本発明の核酸構築物(例えば、本発明の改変されたCRISPR-Casヌクレアーゼおよび/または本発明の改変されたCRISPR-Casヌクレアーゼを含む融合タンパク質をコードする)およびそれを含む発現カセット/ベクターは、標的核酸および/またはそれらの発現を、インビボで(例えば、生物または生物(例えば植物)の細胞において)、およびインビトロで(例えば、細胞または無細胞系において)、改変するために用いられ得る。
本発明は、Cas12aポリペプチドのPAM特異性を変更する方法をさらに提供する。一部の実施態様では、Cas12aポリペプチド内に突然変異を導入するステップを含むPAM特異性を変更する方法が提供され、ここで、突然変異は、配列番号1の位置ナンバリングに関してアミノ酸残基K116、K120、K121、D122、E125、T148、T149、T152、D156、E159、Q529、D535、K538、D541、Y542、L585、K591、M592、K595、V596、S599、K600、K601、Y616、Y646、W649におけるものである。一部の実施態様では、Cas12aポリペプチド内に導入される突然変異は、配列番号1の位置ナンバリングに関して、K116R、K116N、K120R、K120H、K120N、K120T、K120Y、K120Q、K121S、K121T、K121H、K121R、K121G、K121D、K121Q、D122R、D122K、D122H、D122E、D122N、E125R、E125K、E125Q、E125Y、T148H、T148S、T148A、T148C、T149A、T149C、T149S、T149G、T149H、T149P、T149F、T149N、T149D、T149V、T152R、T152K、T152W、T152Y、T152H、T152Q、T152E、T152L、T152F、D156R、D156K、D156Y、D156W、D156Q、D156H、D156I、D156V、D156L、D156E、E159K、E159R、E159H、E159Y、E159Q、Q529N、Q529T、Q529H、Q529A、Q529F、Q529G、Q529G、Q529S、Q529P、Q529W、Q529D、G532D、G532N、G532S、G532H、G532F、G532K、G532R、G532Q、G532A、G532L、G532C、D535N、D535H、D535V、D535T、D535、S D535A、D535W、D535K、K538R K538V、K538Q、K538W、K538Y、K538F、K538H、K538L、K538M、K538C、K538G、K538A、K538P、D541N、D541H、D541R、D541K、D541Y、D541I、D541A、D541S、D541E、Y542R、Y542K、Y542H、Y542Q、Y542F、Y542L、Y542M、Y542P、Y542V、Y542N、Y542T、L585G、L585H、L585F、K591W、K591F、K591Y、K591H、K591R、K591S、K591A、K591G、K591P、M592R、M592K、M592Q、M592E、M592A、K595R、K595Q、K595Y、K595L、K595W、K595H、K595E、K595S、K595D、K595M、V596T、V596H、V596G、V596A、S599G、S599H、S599N、S599D、K600R、K600H、K600G、K601R、K601H、K601Q、K601T、Y616K、Y616R、Y616E、Y616F、Y616H、Y646R、Y646E、Y646K、Y646H、Y646Q、Y646W、Y646N、W649H、W649K、W649Y、W649R、W649E、W649S、W649V、および/またはW649Tである。一部の実施態様では、Cas12aポリペプチド内に導入される突然変異は、配列番号1の位置ナンバリングに関してアミノ酸残基位置:K116、K120、K121、D122、E125、T152、D156、E159、G532、D535、K538、D541、および/またはK595であり、ここで突然変異は、配列番号1の位置ナンバリングに関してK116R、K116N、K120Y、K121S、K121R、D122H、D122N、E125K、T152R、T152K、T152Y、T152Q、T152E、T152F、D156R、D156W、D156Q、D156H、D156I、D156V、D156L、D156E、E159K、E159R、G532N、G532S、G532H、G532K、G532R、G532L、D535N、D535H、D535T、D535、S D535A、D535W、K538R K538V、K538Q、K538W、K538Y、K538F、K538H、K538L、K538M、K538C、K538G、K538A、D541E、K595R、K595Q、K595Y、K595W、K595H、K595S、および/またはK595Mであってもよい。導入される突然変異は単一の突然変異であってよく、または2以上の突然変異の組み合わせであってよい。理解されるように、2以上の突然変異を有する任意の単一Cas12aポリペプチドは、任意の所定の位置に単一の突然変異のみを含む。一部の実施態様では、本発明の方法によってPAM特異性が変更されたCas12aポリペプチドは、LbCas12aポリペプチド(Lachnospiraceae bacterium)である。
本発明の改変されたCas12aポリペプチドまたはヌクレアーゼ(例えば、LbCas12aヌクレアーゼ)は、細胞または無細胞系において標的核酸を改変するために(例えば、標的核酸を変更するために、細胞/生物のゲノムを変更するために)用いられ得る。したがって、一部の実施態様では、標的核酸を改変する方法が提供され、その方法は、標的核酸を、(a)(i)本発明の改変されたLbCas12aポリペプチド、または本発明の融合タンパク質(例えば、本発明の改変されたLbCas12aポリペプチドおよび目的ポリペプチド(例えば、デアミナーゼ))、および(ii)ガイド核酸;(b)(i)本発明の改変されたLbCas12aポリペプチドまたは融合タンパク質、および(ii)ガイド核酸を含む本発明の複合体;(c)(i)本発明の改変されたLbCas12aポリペプチド、または本発明の融合タンパク質、および(ii)ガイド核酸を含む組成物;および/または(d)本発明のシステムと接触させるステップを含み、それにより標的核酸を改変する。一部の実施態様では、細胞または生物のゲノムを改変/変更する方法が提供され、その方法は、細胞/生物のゲノム内の標的核酸を、(a)(i)本発明の改変されたLbCas12aポリペプチド、または本発明の融合タンパク質(例えば、本発明の改変されたLbCas12aポリペプチドおよび目的ポリペプチド(例えば、デアミナーゼ))、および(ii)ガイド核酸;(b)(i)本発明の改変されたLbCas12aポリペプチドまたは融合タンパク質、および(ii)ガイド核酸を含む本発明の複合体;(c)(i)本発明の改変されたCRISPR-Casヌクレアーゼ(例えば、改変されたLbCas12aポリペプチド)、または本発明の融合タンパク質、および(ii)ガイド核酸を含む組成物;および/または(d)本発明のシステムと接触させるステップを含み、それにより、細胞または生物のゲノムを改変/変更する。一部の実施態様では、細胞または生物は、植物細胞または植物である。
一部の実施態様では、標的核酸を改変する方法が提供され、その方法は、標的核酸を含む細胞または無細胞系を、(a)(i)本発明のポリヌクレオチド(例えば、本発明の改変されたLbCas12aポリペプチドをコードする、または、本発明の改変されたLbCas12aポリペプチドおよび目的ポリペプチド(例えばデアミナーゼ)を含む融合タンパク質をコードする)、またはそれを含む発現カセットまたはベクター、および(ii)ガイド核酸、またはそれを含む発現カセットおよび/またはベクター;および/または(b)本発明の改変されたLbCas12aポリペプチド、または本発明の改変されたLbCas12aポリペプチドおよび目的ポリペプチド(例えばデアミナーゼ)を含む融合タンパク質を含む本発明の複合体をコードする核酸構築物、またはそれを含む発現カセットおよび/またはベクターと接触させるステップを含み、ここで、接触させるステップは、ポリヌクレオチドおよび/または核酸構築物が発現され、改変されたLbCas12aポリペプチドおよび/または融合タンパク質が産生されて、それがガイド核酸と複合体を形成する条件下で行なわれ、それにより標的核酸を改変する。一部の実施態様では、細胞および/または生物のゲノムを改変/変更する方法が提供され、その方法は、標的核酸を含む細胞および/または生物内の細胞を、(a)(i)本発明のポリヌクレオチド(例えば、本発明の改変されたLbCas12aポリペプチドをコードする、または、本発明の改変されたLbCas12aポリペプチドおよび目的ポリペプチド(例えばデアミナーゼ)を含む融合タンパク質をコードする)、またはそれを含む発現カセットまたはベクター、および(ii)ガイド核酸、またはそれを含む発現カセットおよび/またはベクター;および/または(b)本発明の改変されたLbCas12aポリペプチド、または本発明の改変されたLbCas12aポリペプチドと目的ポリペプチド(例えばデアミナーゼ)とを含む融合タンパク質を含む本発明の複合体をコードする核酸構築物、またはそれを含む発現カセットおよび/またはベクターと接触させるステップを含み、ここで、接触させるステップは、ポリヌクレオチドおよび/または核酸構築物が発現され、改変されたLbCas12aポリペプチドおよび/または融合タンパク質が産生されて、それがガイド核酸と複合体を形成する条件下であり、それにより標的核酸を改変する。
一部の実施態様では、本発明は、標的核酸を編集する方法を提供し、その方法は、標的核酸を、(a)(i)本発明の融合タンパク質(本発明の改変されたLbCas12aポリペプチドおよび目的ポリペプチド(例えばデアミナーゼ)を含む)、および(a)(ii)ガイド核酸;(b)本発明の融合タンパク質、およびガイド核酸を含む複合体;(c)本発明の融合タンパク質およびガイド核酸を含む組成物;および/または(d)本発明のシステムと接触させるステップを含み、それにより標的核酸を編集する。
一部の実施態様では、本発明は、標的核酸を編集する方法を提供し、その方法は、標的核酸を含む細胞または無細胞系を、(a)(i)本発明の融合タンパク質(例えば、本発明の改変されたLbCas12aポリペプチドおよび目的ポリペプチド(例えばデアミナーゼ))をコードするポリヌクレオチドまたはそれを含む発現カセットおよび/またはベクター、および(a)(ii)ガイド核酸、またはそれを含む発現カセットおよび/またはベクター;(b)本発明の融合タンパク質、およびガイド核酸を含む複合体をコードする、核酸構築物、またはそれを含む発現カセットおよび/またはベクター;および/または(c)本発明のシステムと接触させるステップを含み、ここで、接触させるステップは、ポリヌクレオチドおよび/または核酸構築物が発現され、改変されたCRISPR-Casヌクレアーゼおよび/または融合タンパク質が産生されて、それがガイド核酸と複合体を形成する条件下で行なわれ、それにより標的核酸を編集する。
改変されたPAM認識特異性を有するCRISPR-Casヌクレアーゼは、制限されないが、インデルの作製(NHEJ)、相同性が指揮する修復において、ヌクレアーゼ機能のないゲノム認識エレメントとして(dead Cpf1)、部分的に機能性ヌクレアーゼを有するゲノム認識エレメントとして(ニッカーゼCpf1)、ゲノムDNAの触媒による編集のための融合タンパク質において(DNA塩基エディタ)、RNAの触媒による編集のための融合タンパク質において(RNA塩基エディタ)、特定のゲノム領域への他の高分子の標的化のため;特定のゲノム領域への小さな化学物質の標的化のため、特定のゲノム領域を標識するため、および/またはCRISPRが指揮するゲノム組み換えストラテジーを含む、多くの方法において使用され得る。
異なる核酸構築物、発現ベクター、および/またはベクター上に提供される場合、本発明の核酸構築物は、ガイド核酸と標的核酸を接触させる前に、同時に、または後に、標的核酸と接触され得る。
本発明の改変されたCRISPR-Casヌクレアーゼおよびポリペプチドおよびそれをコードする核酸構築物は、制限されないが、動物、植物、菌類、古細菌、または細菌を含む任意の生物における標的核酸を改変するために用いられ得る。動物は、制限されないが、哺乳類、昆虫、魚類、鳥類などを含むことができる。本発明が有用であり得る例示的な哺乳類は、限定されないが、霊長類(ヒトおよび非ヒト(例えば、チンパンジー、ヒヒ、サル、ゴリラなど))、ネコ、イヌ、マウス、ラット、フェレット、アレチネズミ、ハムスター、ウシ、ブタ、ウマ、ヤギ、ロバ、またはヒツジを含む。
任意の植物または植物部分の標的核酸は、本発明の核酸構築物を用いて改変および/または編集(例えば、突然変異、例えば、塩基編集、切断、ニッキングなど)され得る。被子植物、裸子植物、単子葉植物、双子葉植物、C3、C4、CAM植物、コケ植物、シダ植物および/またはシダ綱以外のシダ(fern ally)、微細藻類、および/または大型藻類を含む任意の植物(または、例えば属、またはより高次の分類への植物のグループ化)は、本発明の核酸構築物を用いて改変され得る。本発明で有用な植物および/または植物部位は、任意の植物種/変種/品種の植物および/または植物部位であってよい。本明細書において用いられる用語「植物部位」は、制限されないが、胚、花粉、胚珠、種子、葉、茎、芽、花、枝、果実、穀粒、穂、穂軸、穀皮、葉柄、根、根端、葯、植物細胞(植物および/または植物の部位、植物プロトプラスト、植物組織、植物細胞組織培養物、植物カルス、植物クランプなどにおける無傷の植物細胞を含む)を含む。本明細書において用いられる「芽」は、葉および茎を含む地面より上の部位を指す。さらに、本明細書において用いられる「植物細胞」は、植物の構造的および生理学的単位を指し、細胞壁を含み、プロトプラストも指してよい。植物細胞は、単離された単一細胞の形態であることができ、または培養された細胞であることができ、または、例えば植物組織または植物器官のようなより高度の組織化された単位の一部であることができる。
本発明で有用な植物の非限定的な例は、芝草(例えば、ブルーグラス、ベントグラス、ライグラス、ウシノケグサ)、クサヨシの変種(feather reed grass)、ヒロハノコメススキ(tufted hair grass)、ススキ、アルンド(arundo)、スイッチグラス、以下を含む野菜作物:チョウセンアザミ、コールラビ、アルギュラ、ニラネギ、アスパラガス、レタス(例えば、葉球、葉、ロメイン)、マランガ、メロン(例えば、マスクメロン、スイカ、クレンショウ、ハネデュー、カンタループ)、アブラナ属作物(例えば、芽キャベツ、キャベツ、カリフラワー、ブロッコリー、コラード、ケール、白菜、チンゲンサイ)、カルドン(cardoni)、ニンジン、ナパ(napa)、オクラ、タマネギ、セロリ、パセリ、ヒヨコマメ、パースニップ、チコリ、コショウ、ジャガイモ、ウリ科植物(例えば、ペポカボチャ、キュウリ、ズッキーニ、トウナス、カボチャ、ハネデューメロン、スイカ、カンタループ)、ラディッシュ、乾球オニオン、ルタバガ、ナス、セイヨウゴボウ、エンダイブ、エシャロット、エンダイブ、ニンニク、ホウレンソウ、長葱、トウナス、葉菜類、ビート(例えば、テンサイおよび飼料ビート)、サツマイモ、チャード、ホースラディッシュ、トマト、カブ、およびスパイス;果実作物、例えば、リンゴ、アンズ、チェリー類(cherries)、ネクタリン、桃、西洋ナシ、プラム、プルーン、チェリー(cherry)、マルメロ、イチジク、ナッツ(例えば、クリ、ペカン、ピスタチオ、ヘーゼルナッツ、ピスタチオ、ピーナッツ、クルミ、マカデミアナッツ、アーモンドなど)、柑橘類(例えば、クレメンタイン、キンカン、オレンジ、グレープフルーツ、タンジェリン、マンダリン、レモン、ライムなど)、ブルーベリー、ブラックラズベリー、ボイセンベリー、クランベリー、スグリ、グーズベリー、ローガンベリー、キイチゴ、イチゴ、ブラックベリー、ブドウ(例えば、ワインおよびテーブル)、アボカド、バナナ、キウイ、カキ、ザクロ、パイナップル、トロピカルフルーツ、梨状果、メロン、マンゴー、パパイヤ、およびライチ、農作物植物、例えば、クローバー、アルファルファ、オオアワガエリ、マツヨイグサ、メドウフォーム、コーン/トウモロコシ(例えば、フィールド、スイート、ポップコーン)、ホップ、ホホバ、ソバ、ベニバナ、キノア、小麦、米、大麦、ライ麦、キビ、モロコシ、オート麦、ライコ麦、モロコシ、タバコ、カポック、マメ科植物(マメ(例えば、グリーンおよび乾燥)、レンズマメ、エンドウマメ、ダイズ)、油料種子植物(例えば、セイヨウアブラナ、キャノーラ、マスタード、ケシ、オリーブ、ヒマワリ、ココナッツ、ヒマシ油植物、ココア豆、落花生、アブラヤシ、ダイズ、アマナズナ属など)、ウキクサ、シロイヌナズナ、繊維植物(綿、亜麻、大麻、ジュート)、アサ(例えば、Cannabis sativa、Cannabis indica、およびCannabis ruderalis)、クスノキ科(例えば、シナモン、樟脳)、または植物、例えばコーヒー、サトウキビ、茶、および天然ゴム植物;および/または、花壇用の草花、例えば、顕花植物、サボテン、多肉多汁植物および/または観賞植物(例えば、バラ、チューリップ、スミレ)、ならびに樹木、例えば森林樹(広葉樹および常緑樹、例えば針葉樹;例えば、ニレ、トネリコ、オーク、カエデ、モミ、トウヒ、ヒマラヤスギ、マツ、カバノキ、イトスギ、ユーカリ、ヤナギ)、ならびに、低木および他の苗木を含む。一部の実施態様では、本発明の核酸構築物および/またはそれをコードする発現カセットおよび/またはベクターは、トウモロコシ、ダイズ、小麦、キャノーラ、米、トマト、コショウ、ヒマワリ、キイチゴ、ブラックベリー、ブラックラズベリーおよび/またはチェリーを改変するために用いられ得る。
本発明は、本発明の方法を実施するためのキットをさらに含む。本発明のキットは、試薬、バッファー、および/または混合、測定、選別、標識などのための器具、ならびに、標的核酸を改変するのに適切な説明書などを含むことができる。
一部の実施態様では、本発明は、本発明の1つまたは複数のポリヌクレオチドおよび/または核酸構築物、および/またはそれを含む発現カセットおよび/またはベクターを含むキットであって、その使用のための説明書を含んでもよいキットを提供する。一部の実施態様では、キットは、目的ポリペプチドおよび/またはそれをコードするポリヌクレオチドおよびそれを含む発現カセットおよび/またはベクターさらに含んでよい。一部の実施態様では、ガイド核酸は、本発明の核酸構築物と同一の発現カセットおよび/またはベクター上に提供され得る。一部の実施態様では、ガイド核酸は、本発明の核酸構築物を含むものとは別個の発現カセットまたはベクター上に提供され得る。
したがって、一部の実施態様では、(a)本明細書において提供される改変されたCRISPR-Casヌクレアーゼをコードするポリヌクレオチドおよび(b)(a)のポリヌクレオチドの発現を駆動するプロモーターを含む、核酸構築物を含むキットが提供される。一部の実施態様では、キットは、ガイド核酸をコードする核酸構築物をさらに含んでよく、ここで構築物は、ガイド核酸の主鎖へ標的核酸配列と同一または相補の核酸配列をクローニングするためのクローニング部位を含む。
一部の実施態様では、キットは、1つまたは複数の核局在化シグナルを含む/コードする核酸構築物を含んでよく、ここで核局在化シグナルは、CRISPR-Casヌクレアーゼに融合される。一部の実施態様では、本発明の改変されたCRISPR-Casヌクレアーゼをコードする本発明の核酸構築物、または、および/または、それを含む発現カセットおよび/またはベクターを含むキットが提供され、ここで、核酸構築物、発現カセットおよび/またはベクターは、形質転換体を同定するのに有用な1つまたは複数の選択可能マーカーをさらにコードしてよい(例えば、抗生物質耐性遺伝子、除草剤耐性遺伝子などをコードする核酸)。一部の実施態様では、核酸構築物は、コードされるCRISPR-Casヌクレアーゼ内に1つまたは複数のイントロンをコードするmRNAであってよい。一部の実施態様では、キットは、本発明のポリペプチドおよび核酸構築物の発現において用いるためのプロモーター、およびプロモーターとイントロンを含んでよい。
CRISPR-CasヌクレアーゼのPAM特異性を改変するための方法および関連する組成物
CRISPR-Casシステムは、2つの主な基準:標的化DNA配列に対するガイドRNAの相同性、および特定の配列のプロトスペーサー隣接モチーフ(PAM)の存在を用いて、標的核酸に向けられる。異なるCRISPR-Casヌクレアーゼは、異なるPAM配列の要件を有する(例えば、SpCas9についてNGG、またはLbCas12a(Cpf1)についてTTTV(式中Vは、任意の非チミジンヌクレオチドである))。新規のCRISPRヌクレアーゼまたはその突然変異体を、それらのPAM要件についてスクリーニングすることは、非常に多くの反復の可能性があるので、複雑で予測不可能であり得る。インビトロアッセイ、特にPAM決定アッセイ(PAMDA)は、任意の特定のCRISPRヌクレアーゼまたはその突然変異体に関するPAM特異性をスクリーニングするために用いられ得る。これらのアッセイは、定義された/公知のプロトスペーサー配列に隣接するDNAのランダム化された部分に依拠する。ガイドRNAは、公知のプロトスペーサー配列を標的化するように設計することができ、ランダム化されたPAM領域が適切なDNA配列を含む場合は(例えば、CRISPRヌクレアーゼまたはその突然変異体によって認識される)、CRISPRヌクレアーゼは、標的に結合して切断することができる。
CRISPR-Casシステムは、2つの主な基準:標的化DNA配列に対するガイドRNAの相同性、および特定の配列のプロトスペーサー隣接モチーフ(PAM)の存在を用いて、標的核酸に向けられる。異なるCRISPR-Casヌクレアーゼは、異なるPAM配列の要件を有する(例えば、SpCas9についてNGG、またはLbCas12a(Cpf1)についてTTTV(式中Vは、任意の非チミジンヌクレオチドである))。新規のCRISPRヌクレアーゼまたはその突然変異体を、それらのPAM要件についてスクリーニングすることは、非常に多くの反復の可能性があるので、複雑で予測不可能であり得る。インビトロアッセイ、特にPAM決定アッセイ(PAMDA)は、任意の特定のCRISPRヌクレアーゼまたはその突然変異体に関するPAM特異性をスクリーニングするために用いられ得る。これらのアッセイは、定義された/公知のプロトスペーサー配列に隣接するDNAのランダム化された部分に依拠する。ガイドRNAは、公知のプロトスペーサー配列を標的化するように設計することができ、ランダム化されたPAM領域が適切なDNA配列を含む場合は(例えば、CRISPRヌクレアーゼまたはその突然変異体によって認識される)、CRISPRヌクレアーゼは、標的に結合して切断することができる。
CRISPR-CasヌクレアーゼのためのPAM認識部位は、PAM部位枯渇アッセイ(例えば、PAM枯渇アッセイ)またはPAM決定アッセイ(PAMDA)を用いて評価され得る(Kleinstiver et al.Nat Biotechnol 37:276-282(2019))。PAM枯渇アッセイについては、プロトスペーサーに隣接するランダム化ヌクレオチド(塩基対)を有するプラスミドのライブラリーが、細菌(例えば、E.coli)におけるCRISPRヌクレアーゼによる切断について試験される。プラスミドは、例えば、ランダム化PAM配列に隣接する、抗生物質耐性を与えるポリヌクレオチドを含んでよい。CRISPR-Casヌクレアーゼに対する曝露の際に切断されない配列は、抗生物質耐性遺伝子の存在に起因して抗生物質の存在下で細胞が生存することを可能にし、一方で、標的化可能なPAMを有するプラスミドは切断され、細胞死に起因してライブラリーから枯渇する。プラスミドの生存する(切断されない)集団のシーケンシングは、選択後(post-selection)のPAM枯渇値の計算を可能にし、それが、CRISPR-Casヌクレアーゼに曝されていないライブラリーと比較される。実験的ライブラリー内の配列プールから枯渇される配列は、CRISPR-Casヌクレアーゼによって認識されるPAM配列(単数または複数)を含む。
PAM配列を同定するために用いられ得る別の方法は、PAM決定アッセイ(PAMDA)である(Kleinstiver et al.Nat Biotechnol 37:276-282(2019))。この場合において、切断は生細胞の外で行なわれる。PAMDAでは、定義されたプロトスペーサー配列の隣のヌクレオチドのランダム化部分を有する単一DNA鎖が合成される。オリゴヌクレオチドは、合成されたDNA鎖の3’末にアニーリングして、エキソヌクレアーゼ・マイナス(-エキソ)Klenowフラグメントを用いて伸長し、定義された配列およびランダム化配列にわたって重合する。これによりデュプレックス・ライブラリーが産生され、それから、全DNAを増幅するために、制限エンドヌクレアーゼで切断して細菌内にクローニングされる。プラスミドを抽出して、別の制限エンドヌクレアーゼを用いて線状化して、線状テンプレートを作製する。そのテンプレートを、CRISPR-Casヌクレアーゼ-ガイドRNA複合体と接触させる。CRISPR-Casヌクレアーゼによって認識されるPAMを含む配列のみが切断される。それから、実験的ライブラリーおよびコントロールライブラリー(CRISPR-Casヌクレアーゼに曝されない)の両方をPCRによって増幅する。CRISPR-Casヌクレアーゼによって切断されない配列のみが増幅される。コントロールライブラリーおよび実験的ライブラリー(CRISPR-Casヌクレアーゼで処理される)由来のPCR増幅配列をシーケンシングおよび比較する。コントロール(CRISPR-Casヌクレアーゼに曝されない)ライブラリー内に存在するが実験的ライブラリー内には存在しないPAM配列は、CRISPR-Casヌクレアーゼによって認識されるPAM配列である(それにより、プロトスペーサーが切断されるのを可能にする)。
ヌクレアーゼの要件のインビトロでの評価のために、ランダム化されたPAMライブラリーを調製する。この方法に関して説明されるステップは、評価される全PAM配列を含んでいるバイアスのないランダム化DNAライブラリーの調製、プラスミド内へのクローニング、出発DNAの合計量を増加させるための細菌内へのライブラリーの導入、プラスミドの抽出、スーパーコイルを除去するための制限酵素を用いたプラスミドの線状化、CRIPSR-Casヌクレアーゼに対する線状化分子の曝露、フラグメントの増幅(例えば、PCR)、および最終的な配列解析(例えば、次世代シーケンシング、NGS)を含む。バイアスのないライブラリーの作製および制限消化の最初のステップは、少なくとも2つの制限酵素、Klenow伸長、および、ベクター内へのライゲーション前の産物の洗浄を必要とする。2~3種の制限酵素の使用により、典型的にライブラリーからいくつかのPAM配列が除去されて、ライブラリーにバイアスが導入される。さらに、後に続くKlenow伸長および洗浄ステップによってもPAM配列が除去され得て、それにより、さらにバイアスがライブラリー内に導入される。配列の喪失を避けるため、より完全かつバイアスのないライブラリーを産生するために、本発明は、制限エンドヌクレアーゼおよびKlenow伸長の代わりに、オーバーハングを有する重複する固体合成オリゴヌクレオチド(例えば、アニーリングしたオリゴヌクレオチド)を用いてランダム化されたPAMライブラリーを作製するための新規の方法を提供する(例えば図1bを参照)。それから、本発明の方法を用いて生産されるランダム化PAMライブラリーを用いて、従来技術の方法によって生産されるライブラリーによって以前に利用可能であったものよりも高精度でCRISPR-CasヌクレアーゼのPAM特異性を試験することができる。
したがって、一部の実施態様では、本発明は、プロトスペーサーの5’末にPAM認識部位を有するCRISPR-Casヌクレアーゼのプロトスペーサー隣接モチーフ(PAM)の要件/特異性を判定するための二本鎖核酸分子を含むランダム化DNAライブラリーを構築する方法を提供し、その方法は、以下のステップを含む2以上の二本鎖核酸分子を調製するステップ:(a)2以上の二本鎖核酸分子のそれぞれのための非標的オリゴヌクレオチド(第1)鎖および標的オリゴヌクレオチド(第2)鎖を合成するステップ、ここで非標的オリゴヌクレオチド鎖は5’から3’に以下を含む:(i)約5~約15ヌクレオチド(例えば、約5、6、7、8、9、10、11、12、13、14、または15ヌクレオチド、およびその中の任意の範囲)を有する第1の配列、(ii)(ii)少なくとも4つのランダム化ヌクレオチド(例えば、少なくとも4、5、6、7、8、9、10、またはそれよりも多く、およびその中の任意の範囲)を有する第2の配列、(ii)約16~約25ヌクレオチド(例えば、約16、17、18、19、20、21、22、23、24、または25ヌクレオチド、およびその中の任意の範囲)を含むプロトスペーサー配列、および(iv)約5~約20ヌクレオチド(例えば、約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20ヌクレオチド、およびその中の任意の範囲)を有する第3の配列、ここで(i)の約5~15ヌクレオチドを有する第1の配列は、(ii)の第2の配列の5’末にすぐ隣接しており、(ii)の第2の配列は(iii)のプロトスペーサー配列の5’末にすぐ隣接しており、プロトスペーサー配列は(iv)の第3の配列の5’末にすぐ隣接しており;標的オリゴヌクレオチド(第2)鎖は非標的オリゴヌクレオチド鎖に相補である;および(b)非標的オリゴヌクレオチド鎖を相補の標的オリゴヌクレオチド鎖にアニーリングさせて二本鎖核酸分子を産生するステップを含み、ここで第1の配列は制限部位を(その5’末に)含み、第3の配列は制限部位を(その3’末に)含み、ここで、2以上の二本鎖核酸分子のそれぞれの第1の配列(i)、プロトスペーサー配列(iii)および第3の配列(iv)は同一であり、それにより、二本鎖核酸分子を含むランダム化DNAライブラリーを構築する。一部の実施態様では、標的鎖および/または非標的鎖は、5’リン酸化されてよい。
一部の実施態様では、本発明は、プロトスペーサーの3’末にPAM認識部位を有するCRISPR-Casヌクレアーゼのプロトスペーサー隣接モチーフ(PAM)の要件/特異性を判定するための二本鎖核酸分子を含むランダム化DNAライブラリーを構築する方法を提供し、その方法は、以下のステップを含む2以上の二本鎖核酸分子を調製するステップ:(a)2以上の二本鎖核酸分子のそれぞれのための非標的オリゴヌクレオチド(第1)鎖および標的オリゴヌクレオチド(第2)鎖を合成するステップ、ここで非標的オリゴヌクレオチド鎖は5’から3’に以下を含む:(i)約5~約20ヌクレオチド(例えば、約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20ヌクレオチド、およびその中の任意の範囲)を有する第1の配列、(ii)約16~約25ヌクレオチド(例えば、約16、17、18、19、20、21、22、23、24、または25ヌクレオチド、およびその中の任意の範囲)を含むプロトスペーサー配列、(iii)少なくとも4つのランダム化ヌクレオチド(例えば、少なくとも4、5、6、7、8、9、10、またはそれよりも多く、およびその中の任意の範囲)を有する第2の配列、および(iv)約5~約15ヌクレオチド(例えば、約5、6、7、8、9、10、11、12、13、14、15ヌクレオチド、およびその中の任意の範囲)を有する第3の配列、ここで(i)の約5~20ヌクレオチドを有する第1の配列は(ii)のプロトスペーサー配列の5’末にすぐ隣接しており、(iii)の第2の配列は(iii)のプロトスペーサー配列の3’末にすぐ隣接しており、(iv)の第3の配列は(iii)の第2の配列の3’末にすぐ隣接しており;標的オリゴヌクレオチド(第2)鎖は非標的オリゴヌクレオチド鎖に相補である;および(b)非標的オリゴヌクレオチド鎖を相補の標的オリゴヌクレオチド鎖にアニーリングさせて二本鎖核酸分子を産生するステップを含み、ここで第1の配列(i)は制限部位を(その5’末に)含み、第3の配列(iv)は制限部位を(その3’末に)含み、ここで、2以上の二本鎖核酸分子のそれぞれの第1の配列(i)、プロトスペーサー配列(ii)および第3の配列(iv)は同一であり、それにより、二本鎖核酸分子を含むランダム化DNAライブラリーを構築する。一部の実施態様では、標的鎖および/または非標的鎖は5’リン酸化されてよい。
一部の実施態様では、二本鎖核酸分子がベクターにライゲーションされて、ランダム化DNAライブラリーを含むベクターが生産され得る。一部の実施態様では、ベクターは高コピー数ベクターであってよい。一部の実施態様では、ランダム化DNAライブラリーは、例えば、ランダム化DNAライブラリーを含むベクターを1つまたは複数の細菌細胞内に導入して、該1つまたは複数の細菌細胞を培養することによって増幅され得る。一部の実施態様では、ランダム化DNAライブラリーを含むベクターは、培養後に1つまたは複数の細菌細胞から単離され得る。それから、単離されたベクターは、例えば、CRISPR-CasヌクレアーゼのPAM認識特異性の分析における使用のために、(例えば、ベクターを1つまたは複数の制限酵素;例えば、ScaIまたはPfoIと接触させることにより)線状化され得る。一部の実施態様では、単離されたベクターを線状化するためにPfo1が用いられ得る。
一部の実施態様では、ランダム化DNAライブラリーが、プロトスペーサーの5’末にPAM認識部位を有するCRISPR-Casヌクレアーゼのプロトスペーサー隣接モチーフ(PAM)の要件/特異性を判定するために提供され得て、ランダム化DNAライブラリーは2以上の二本鎖核酸分子を含んでおり、そのそれぞれが、(a)非標的オリゴヌクレオチド(第1)鎖および標的オリゴヌクレオチド(第2)鎖を含み、ここで、非標的オリゴヌクレオチド鎖は、5’から3’に、(i)約5~約15ヌクレオチド(例えば、約5、6、7、8、9、10、11、12、13、14、または15ヌクレオチド、およびその中の任意の範囲)を有する第1の配列、(ii)少なくとも4つのランダム化ヌクレオチド(例えば、少なくとも4、5、6、7、8、9、10、またはそれよりも多く、およびその中の任意の範囲)を有する第2の配列、(iii)約16~約25ヌクレオチド(例えば、約16、17、18、19、20、21、22、23、24、または25ヌクレオチド、およびその中の任意の範囲)を含むプロトスペーサー配列、および(iv)約5~約20ヌクレオチド(例えば、約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20ヌクレオチド、およびその中の任意の範囲)を有する第3の配列を含み、ここで(i)の約5~15ヌクレオチドを有する第1の配列は、(ii)の第2の配列の5’末にすぐ隣接しており、(ii)の第2の配列は(iii)のプロトスペーサー配列の5’末にすぐ隣接しており、プロトスペーサー配列は(iv)の第3の配列の5’末にすぐ隣接しており;標的オリゴヌクレオチド(第2)鎖は非標的オリゴヌクレオチド鎖に相補である;および(b)非標的オリゴヌクレオチド鎖は、相補の標的オリゴヌクレオチド鎖にアニーリングして、二本鎖核酸分子を産生し、ここで第1の配列は制限部位を(その5’末に)含み、第3の配列は制限部位を(その3’末に)含み、ここで、2以上の二本鎖核酸分子のそれぞれの第1の配列(i)、プロトスペーサー配列(iii)および第3の配列(iv)は同一である。一部の実施態様では、標的鎖および/または非標的鎖は5’リン酸化されてよい。
一部の実施態様では、プロトスペーサーの3’末にPAM認識部位を有するCRISPR-Casヌクレアーゼのプロトスペーサー隣接モチーフ(PAM)の要件/特異性を判定するためのランダム化DNAライブラリーが提供され得て、ランダム化DNAライブラリーは2以上の二本鎖核酸分子を含み、そのそれぞれが、(a)非標的オリゴヌクレオチド(第1)鎖および標的オリゴヌクレオチド(第2)鎖を含み、ここで、非標的オリゴヌクレオチド鎖は、5’から3’に、(i)約5~約20ヌクレオチド(例えば、約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20ヌクレオチド、およびその中の任意の範囲)を有する第1の配列、(ii)約16~約25ヌクレオチド(例えば、約16、17、18、19、20、21、22、23、24、または25ヌクレオチド、およびその中の任意の範囲)を含むプロトスペーサー配列、(iii)少なくとも4つのランダム化ヌクレオチド(例えば、少なくとも4、5、6、7、8、9、10、またはそれよりも多く、およびその中の任意の範囲)を有する第2の配列、および(iv)約5~約15ヌクレオチド(例えば、約5、6、7、8、9、10、11、12、13、14、15ヌクレオチド、およびその中の任意の範囲)を有する第3の配列を含み、ここで(i)の約5~20ヌクレオチドを有する第1の配列は(ii)のプロトスペーサー配列の5’末にすぐ隣接しており、(iii)の第2の配列は(iii)のプロトスペーサー配列の3’末にすぐ隣接しており、(iv)の第3の配列は(iii)の第2の配列の3’末にすぐ隣接しており;標的オリゴヌクレオチド(第2)鎖は非標的オリゴヌクレオチド鎖に相補である;および(b)非標的オリゴヌクレオチド鎖は、相補の標的オリゴヌクレオチド鎖にアニーリングして、二本鎖核酸分子を産生し、ここで第1の配列は制限部位を(その5’末に)含み、第3の配列は制限部位を(その3’末に)含み、ここで、2以上の二本鎖核酸分子のそれぞれの第1の配列(i)、プロトスペーサー配列(ii)および第3の配列(iv)は同一である。一部の実施態様では、標的鎖および/または非標的鎖は5’リン酸化されてよい。
一部の実施態様では、本発明は、CRISPR-Casヌクレアーゼのプロトスペーサー隣接モチーフ(PAM)特異性を判定する方法を提供し、その方法は、CRISPR-Casヌクレアーゼを本発明のランダム化DNAライブラリーと接触させるステップ;および、ランダム化DNAライブラリーの二本鎖核酸分子を、CRISPR-Casヌクレアーゼとの接触前(例えばコントロール)および接触後にシーケンシングするステップを含み、ここで、CRISPR-Casヌクレアーゼとの接触前にランダム化DNAライブラリー内に存在するがCRISPR-Casヌクレアーゼとの接触後にランダム化DNAライブラリー内に存在しない二本鎖核酸分子は、CRISPR-CasヌクレアーゼのPAM認識配列を特定し、それにより、CRISPR-CasヌクレアーゼのPAM特異性を判定する。
一部の実施態様では、CRISPR-Casヌクレアーゼのプロトスペーサー隣接モチーフ(PAM)特異性を判定する方法は、以下のステップ:CRISPR-Casヌクレアーゼを本発明のランダム化DNAライブラリーと接触させるステップ;ランダム化DNAライブラリーの二本鎖核酸分子を、CRISPR-Casヌクレアーゼとの接触前(例えばコントロール)および接触後にシーケンシングするステップ、および、ヌクレアーゼのPAM認識配列を同定するステップを含み、ここで、同定するステップは、CRISPR-Casヌクレアーゼとの接触前にライブラリー内に存在する二本鎖核酸分子を、CRISPR-Casヌクレアーゼとの接触後にライブラリー内に存在する二本鎖核酸分子と比較するステップを含み、ここで、CRISPR-Casヌクレアーゼとの接触前にランダム化DNAライブラリー内に存在するがCRISPR-Casヌクレアーゼとの接触後にランダム化DNAライブラリーに存在しない二本鎖核酸分子は、CRISPR-CasヌクレアーゼのPAM特異性を特定する。
接触前のランダム化ライブラリーのシーケンシングの結果は、接触後のシーケンシングの結果に対するコントロールとしての役割を果たすことができる。一部の実施態様では、CRISPR-CasヌクレアーゼのPAM特異性を判定するステップは、核酸シーケンシングを行なうステップを含んでよい。一部の実施態様では、シーケンシングは次世代シーケンシング(NGS)を含んでよい。
任意のCRISPR-Casヌクレアーゼが、PAM認識特異性を改変するために本発明の方法で用いられ得る。したがって、野生型と比較して異なるPAM特異性を有するように改変され得るCRISPR-Casヌクレアーゼは、制限されないが、Cas9、C2c1、C2c3、Cas12a(Cpf1とも呼ばれる)、Cas12b、Cas12c、Cas12d、Cas12e、Cas13a、Cas13b、Cas13c、Cas13d、Casl、CaslB、Cas2、Cas3、Cas3’、Cas3’’、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(CsnlおよびCsx12としても知られる)、Cas10、Csyl、Csy2、Csy3、Csel、Cse2、Cscl、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmrl、Cmr3、Cmr4、Cmr5、Cmr6、Csbl、Csb2、Csb3、Csxl7、Csxl4、Csx10、Csx16、CsaX、Csx3、Csxl、Csxl5、Csfl、Csf2、Csf3、Csf4(dinG)、および/またはCsf5ポリペプチドまたはドメインを含むことができる。
Cas12aは、Prevotella種およびFrancisella種において元々同定されたV型Clustered Regularly Interspaced Short Palindromic Repeats(CRISPR)-Casヌクレアーゼである。Cas12a(以前はCpf1と呼ばれる)は、よりよく知られているII型CRISPR Cas9ヌクレアーゼとはいくつかの点で異なる。例えば、Cas9は、そのガイドRNA(gRNA、sgRNA)結合部位(プロトスペーサー、標的核酸、標的DNA)に対して3’であるGリッチのプロトスペーサー隣接モチーフ(PAM)(3’-NGG)を認識するが、Cas12aは、結合部位(プロトスペーサー、標的核酸、標的DNA)に対して5’に位置するTリッチのPAM(5’-TTN、5’-TTTN)を認識する。実際に、Cas9およびCas12aがそれらのガイドRNAを結合する方向は、それらのNおよびC末端に関してほとんど逆である。さらに、Cas12a酵素は、天然のCas9システムで見られるデュアルのガイドRNA(sgRNA(例えば、crRNAおよびtracrRNA))ではなく単一のガイドRNA(gRNA、CRISPRアレイ、crRNA)を使用し、Cas12aは、それ自体のgRNAを処理する。加えて、Cas12aヌクレアーゼ活性は、Cas9ヌクレアーゼ活性によって生じる平滑末端の代わりに突出DNA二本鎖切断を生じさせ、Cas12aは両DNA鎖を切断するために単一のRuvCドメインに依拠するが、Cas9は切断のためにHNHドメインおよびRuvCドメインを利用する。
本発明で有用なCRISPR Cas12aポリペプチドまたはCRISPR Cas12aドメインは、任意の公知のまたは後の同定されるCas12aヌクレアーゼであってよい(例えば、米国特許第9,790,490号を参照し、Cpf1(Cas12a)配列のその開示について参照により援用される)。用語「Cas12a」、「Cas12aポリペプチド」または「Cas12aドメイン」は、Cas12aポリペプチド、またはそのフラグメントを含む、RNAによってガイドされるヌクレアーゼを指し、それは、Cas12aのガイド核酸結合ドメイン、および/または、Cas12aの活性の、非活性の、または部分的に活性のDNA切断ドメインを含む。一部の実施態様では、本発明で有用なCas12aは、ヌクレアーゼ活性部位(例えば、Cas12aドメインのRuvC部位)内に突然変異を含んでよい。そのヌクレアーゼ活性部位内に突然変異を有しており、したがってもはやヌクレアーゼ活性を含まないCas12aドメインまたはCas12aポリペプチドは一般に、deadCas12a(例えば、dCas12a)と呼ばれる。一部の実施態様では、そのヌクレアーゼ活性部位内に突然変異を有するCas12aドメインまたはCas12aポリペプチドは、同一の突然変異を有さない同一のCas12aポリペプチドと比較して、損なわれた/減少した活性を有し得る(例えば、ニッカーゼ活性)。
一部の実施態様では、Cas12aドメインは、制限されないが、配列番号1~17(例えば、配列番号1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16および/または17)のいずれか1つのアミノ酸配列、またはそれをコードするポリヌクレオチドを含むことができる。一部の実施態様では、本発明の融合タンパク質は、Lachnospiraceae bacterium ND2006 Cas12a(LbCas12a)由来のCas12aドメインを含んでよい(例えば、配列番号1)。
本発明で有用なCRISPR Cas9ポリペプチドまたはCRISPR Cas9ドメインは、任意の公知のまたは後の同定されるCas9ヌクレアーゼであってよい。一部の実施態様では、本発明で有用なCas9ポリペプチドは、任意の公知のCas9のアミノ酸配列に対して、少なくとも70%同一性(例えば、約70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%など)を含む。CRISPR-Cas9システムは当技術分野でよく知られており、限定されないが、Legionella pneumophila str.Paris、Streptococcus thermophilus CNRZ1066、Streptococcus pyogenes MI、またはNeisseria lactamica 020-06など由来のCas9ポリペプチドを含む。
新規のPAM認識配列を同定するために本発明で有用であり得る他のヌクレアーゼは、限定されないが、C2c1、C2c3、Cas12b、Cas12c、Cas12d、Cas12e、Cas13a、Cas13b、Cas13c、Cas13d、Casl、CaslB、Cas2、Cas3、Cas3’、Cas3’’、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(CsnlおよびCsx12としても知られる)、Cas10、Csyl、Csy2、Csy3、Csel、Cse2、Cscl、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmrl、Cmr3、Cmr4、Cmr5、Cmr6、Csbl、Csb2、Csb3、Csxl7、Csxl4、Csx10、Csx16、CsaX、Csx3、Csxl、Csxl5、Csfl、Csf2、Csf3、Csf4(dinG)、および/またはCsf5を含む。
本発明はここで、以下の実施例に関して説明する。これらの実施例は、特許請求の範囲をその発明に限定することを意図せず、むしろ特定の実施態様の例示であることを意図することが理解されるべきである。当業者が想到する例示された方法における任意のバリエーションは本発明の範囲内に含まれることが意図される。
実施例1.
ランダム化ライブラリー
効率的および費用効果的なインビトロ切断アッセイ(PAM決定アッセイ(PAMDA))のためのライブラリーの効率的かつ費用効果的な作製のための本発明の方法の一例が提供される。2つのライブラリーがプロトスペーサー1および2について作製された(表1参照)。ランダム化された5ヌクレオチド配列を5’末に有するオリゴヌクレオチドを合成し、各プロトスペーサー配列が等しいモル比を占めるように確証した(Integrated DNA Technologies)(表1)。プロトスペーサー1に関するオリゴヌクレオチド(PM0518、PM0519)およびプロトスペーサー2に関するオリゴヌクレオチド(PM0520、PM0521)を、混合物をサーマルサイクラー中に95℃で5分間置き、25℃/室温まで0.1℃/秒でクールダウンさせることによってアニーリングさせた。
ランダム化ライブラリー
効率的および費用効果的なインビトロ切断アッセイ(PAM決定アッセイ(PAMDA))のためのライブラリーの効率的かつ費用効果的な作製のための本発明の方法の一例が提供される。2つのライブラリーがプロトスペーサー1および2について作製された(表1参照)。ランダム化された5ヌクレオチド配列を5’末に有するオリゴヌクレオチドを合成し、各プロトスペーサー配列が等しいモル比を占めるように確証した(Integrated DNA Technologies)(表1)。プロトスペーサー1に関するオリゴヌクレオチド(PM0518、PM0519)およびプロトスペーサー2に関するオリゴヌクレオチド(PM0520、PM0521)を、混合物をサーマルサイクラー中に95℃で5分間置き、25℃/室温まで0.1℃/秒でクールダウンさせることによってアニーリングさせた。
アニーリングした二本鎖フラグメントを、SphIおよびEcoRIで消化したpUC19ベクターに直接ライゲーションした。ライゲーションしたプロトスペーサー構築物を用いてXL1-ブルーエレクトロコンピテントE.coli細胞(Agilent)を形質転換して、1mlのSOC培地中37℃で1時間回復させた。カルベニシリンプレートを用いてE.coli細胞中のライゲーションした産物の存在について調べた。形質転換されたE.coli細胞を、カルベニシリン(50mg/mL)が補充されたLBブロス(200ml)中で16時間増殖させた。プロトスペーサー構築物を含むプラスミドを、Zymoミディプレップキットを用いて精製した。プラスミド/ベクターをディープ配列解析に供して、Illumina Miseqを用いてそれぞれのPAM位置におけるA/T/G/Cの頻度を計算した。
この方法を用いて、選択の任意のプロトスペーサーオリゴヌクレオチド(単数または複数)を用いたPAM決定のためのライブラリーを作製することができ、ここで、アニーリングされるオリゴヌクレオチドは、ライブラリー内のPAM配列の完全な相補(full complement)を維持するように選択される任意の適切な制限部位を含んでよい。
実施例2
Lachnospiraceae bacterium ND2006 Cpf1(LbCpf1)は、非常に特異的なプロトスペーサー隣接モチーフ(PAM)を必要とする。「TTTV」配列は、ランダムヌクレオチドと比較して、85塩基のうちたったの約1塩基のみ生じる。このことは、ランダムDNAにおいて16塩基中約1塩基で生じるSpCas9に関するNGG、ランダムDNAにおいて16塩基中約1塩基で生じるAaC2c1に関するTTN、および、NG PAM要件が4塩基中約1塩基で生じるxCas9/Cas9-NGの相対的な無差別性(promiscuity)と対照的である。Cpf1 PAMは、トウモロコシおよびダイズ遺伝子において、Cas9 PAMよりもかなり少ない量である(図2)。さらに、アデニンおよびシトシン(塩基エディタのための現在の標的)は、その厳格なPAM要件に基づきLbCpf1へのアクセス可能性がより一層低い(図3)。
Lachnospiraceae bacterium ND2006 Cpf1(LbCpf1)は、非常に特異的なプロトスペーサー隣接モチーフ(PAM)を必要とする。「TTTV」配列は、ランダムヌクレオチドと比較して、85塩基のうちたったの約1塩基のみ生じる。このことは、ランダムDNAにおいて16塩基中約1塩基で生じるSpCas9に関するNGG、ランダムDNAにおいて16塩基中約1塩基で生じるAaC2c1に関するTTN、および、NG PAM要件が4塩基中約1塩基で生じるxCas9/Cas9-NGの相対的な無差別性(promiscuity)と対照的である。Cpf1 PAMは、トウモロコシおよびダイズ遺伝子において、Cas9 PAMよりもかなり少ない量である(図2)。さらに、アデニンおよびシトシン(塩基エディタのための現在の標的)は、その厳格なPAM要件に基づきLbCpf1へのアクセス可能性がより一層低い(図3)。
CRISPR-Casヌクレアーゼに関して図3に示されるような厳密性は、潜在的標的および新たな形質の発生を大いに減少させる。本発明は、アクセス可能なPAM配列の改善された比を有するCRISPR-Casヌクレアーゼ、特に、LbCpf1(Cas12a)ヌクレアーゼ(例えば、約1:4またはそれより良好の比で生じるPAM認識部位を有するヌクレアーゼ)の作製に関する。そのような操作されたCas12a PAM突然変異体は、ヌクレアーゼ(NHEJまたはHDR用途のため)として用いられ得て、または、不活化バージョンは、ゲノム編集ツールにおけるゲノム認識エレメントとして用いることができる。
PAMDAアッセイ
PAM決定アッセイ(PAMDA)は、未知のPAM認識を有するCRISPR酵素に関するPAM要件を試験するのに有用である。PAM結合が成功した後にのみ標的配列を切断するCRISPR-Casヌクレアーゼの能力を利用するインビトロアッセイが存在する。手短には、ランダム化PAM配列を有するDNA基質のライブラリーを、CRISPRヌクレアーゼとともにインキュベートし、それからPCRによってDNAを増幅する。インタクトなフラグメント(例えば、ヌクレアーゼによって認識されないもの)のみが増幅される。切断されたフラグメント(ヌクレアーゼによって認識されるもの)は増幅されない。ヌクレアーゼに曝されるライブラリーおよびコントロールライブラリー(ヌクレアーゼに曝されない)の両方からのDNAをシーケンシングする。2組のシーケンシング結果を比較して、どの配列が、切断されたか、したがって、ヌクレアーゼに対する曝露後のシーケンシングのアセンブリ中に存在しないかを決定する(一例として図4を参照)。複数の時点を使用する改変PAMDAを用いて、PAM結合およびその後の切断を決定した。
PAM決定アッセイ(PAMDA)は、未知のPAM認識を有するCRISPR酵素に関するPAM要件を試験するのに有用である。PAM結合が成功した後にのみ標的配列を切断するCRISPR-Casヌクレアーゼの能力を利用するインビトロアッセイが存在する。手短には、ランダム化PAM配列を有するDNA基質のライブラリーを、CRISPRヌクレアーゼとともにインキュベートし、それからPCRによってDNAを増幅する。インタクトなフラグメント(例えば、ヌクレアーゼによって認識されないもの)のみが増幅される。切断されたフラグメント(ヌクレアーゼによって認識されるもの)は増幅されない。ヌクレアーゼに曝されるライブラリーおよびコントロールライブラリー(ヌクレアーゼに曝されない)の両方からのDNAをシーケンシングする。2組のシーケンシング結果を比較して、どの配列が、切断されたか、したがって、ヌクレアーゼに対する曝露後のシーケンシングのアセンブリ中に存在しないかを決定する(一例として図4を参照)。複数の時点を使用する改変PAMDAを用いて、PAM結合およびその後の切断を決定した。
LbCpf1突然変異誘発
186個の点突然変異(表2)を設計し、本明細書中に記載されるようにPAMDAアッセイにおいて個々に試験した。成功的なエンジニアリングは、PAM認識配列を変更させて、新規のPAM認識LbCpf1を生じさせ得て、または、PAM厳密性を緩めて、より無差別の(promiscuous)LbCpf1をもたらし得る。
186個の点突然変異(表2)を設計し、本明細書中に記載されるようにPAMDAアッセイにおいて個々に試験した。成功的なエンジニアリングは、PAM認識配列を変更させて、新規のPAM認識LbCpf1を生じさせ得て、または、PAM厳密性を緩めて、より無差別の(promiscuous)LbCpf1をもたらし得る。
個々の突然変異に加えて、PAM認識を変更する突然変異の組み合わせを組み合わせてPAMDAによって評価し、第2世代のLbCpf1突然変異を提供する。
実施例3.
3つの方法を用いて186個の突然変異を試験した:
(1)PAMDAアッセイとして知られるインビトロ方法(Kleinstiver et al.Nat Biotechnol 37,:276-282(2019))は、精製されたタンパク質およびプラスミドライブラリーを用いて、ライブラリーにわたるそれぞれの点突然変異を試験する。ライブラリーメンバーの枯渇を、次世代シーケンシング(NGS)を用いてスコア化した。枯渇は、ライブラリー自体に対して(特定のPAMに対する絶対的な活性を決定するため)、または野生型LbCas12aによる切断に対して計算した(突然変異が野生型と比較して新たなPAM認識を与えるかどうか決定するため)。
(2)PAM-SCANRとして知られる細菌方法(Leenay et al.Mol Cell 62:137-147(2016))は、Escherichia coliにおけるライブラリーを用いて、256個のあり得るPAM NNNN変異体に対するCas12a突然変異の結合を試験する。それは、切断は試験せず、結合のみ試験する。作られた突然変異は触媒領域付近にはどこにもなかったので、結合は切断も反映すると予測される(293Tアッセイにおいて後に検証)。PAM-SCANRの利点は、点突然変異を急速に試験する能力だけでなく、迅速かつ正確な方法でアミノ酸点突然変異の組み合わせを試験する能力である。このアッセイは、インビトロ切断アッセイよりも厳密であり得る。
(3)ヒトHEK293T細胞におけるインデルアッセイ。このアッセイは貴重な真核生物インデルデータを提供する。真核生物における挿入および欠失を得るために、複数の基準が満たされなければならない:CRISPR酵素が発現されて細胞内で安定である必要があり、crRNAはが発現されて正しくプロセッシングされる必要があり、タンパク質:RNA複合体が形成される必要があり、複合体が安定である必要があり、複合体が十分な量で核内に移行する必要があり、標的DNAがアクセス可能である必要があり、DNAが特定のガイドRNA設計によって良好に標的化されなければならず、二本鎖切断が、挿入または欠失(インデル)によって時折のDNA修復ミスを生じるのに十分高い割合で生じる必要がある。このことは、真核生物アッセイを、この試験における最も厳密なアッセイにさせる。実験が低スループットであることに起因して、256個全てではなく以下に記載する3個の点突然変異体のそれぞれについて数ダースのPAMを試験した。特定のガイドはしばしば標的アクセス可能性に起因して効果的でないので、偽陰性を避けるために3つの異なる標的をそれぞれのPAM突然変異体の組み合わせに選択した。
3つの方法を用いて186個の突然変異を試験した:
(1)PAMDAアッセイとして知られるインビトロ方法(Kleinstiver et al.Nat Biotechnol 37,:276-282(2019))は、精製されたタンパク質およびプラスミドライブラリーを用いて、ライブラリーにわたるそれぞれの点突然変異を試験する。ライブラリーメンバーの枯渇を、次世代シーケンシング(NGS)を用いてスコア化した。枯渇は、ライブラリー自体に対して(特定のPAMに対する絶対的な活性を決定するため)、または野生型LbCas12aによる切断に対して計算した(突然変異が野生型と比較して新たなPAM認識を与えるかどうか決定するため)。
(2)PAM-SCANRとして知られる細菌方法(Leenay et al.Mol Cell 62:137-147(2016))は、Escherichia coliにおけるライブラリーを用いて、256個のあり得るPAM NNNN変異体に対するCas12a突然変異の結合を試験する。それは、切断は試験せず、結合のみ試験する。作られた突然変異は触媒領域付近にはどこにもなかったので、結合は切断も反映すると予測される(293Tアッセイにおいて後に検証)。PAM-SCANRの利点は、点突然変異を急速に試験する能力だけでなく、迅速かつ正確な方法でアミノ酸点突然変異の組み合わせを試験する能力である。このアッセイは、インビトロ切断アッセイよりも厳密であり得る。
(3)ヒトHEK293T細胞におけるインデルアッセイ。このアッセイは貴重な真核生物インデルデータを提供する。真核生物における挿入および欠失を得るために、複数の基準が満たされなければならない:CRISPR酵素が発現されて細胞内で安定である必要があり、crRNAはが発現されて正しくプロセッシングされる必要があり、タンパク質:RNA複合体が形成される必要があり、複合体が安定である必要があり、複合体が十分な量で核内に移行する必要があり、標的DNAがアクセス可能である必要があり、DNAが特定のガイドRNA設計によって良好に標的化されなければならず、二本鎖切断が、挿入または欠失(インデル)によって時折のDNA修復ミスを生じるのに十分高い割合で生じる必要がある。このことは、真核生物アッセイを、この試験における最も厳密なアッセイにさせる。実験が低スループットであることに起因して、256個全てではなく以下に記載する3個の点突然変異体のそれぞれについて数ダースのPAMを試験した。特定のガイドはしばしば標的アクセス可能性に起因して効果的でないので、偽陰性を避けるために3つの異なる標的をそれぞれのPAM突然変異体の組み合わせに選択した。
1.PAM結合および切断のインビトロでの判定
PAMプラスミドに基づくライブラリーの構築
23ヌクレオチドスペーサー配列の直接5’の5個のランダムヌクレオチドからなるDNAライブラリーを調製した。LbCas12aは、4ヌクレオチドのプロトスペーサー隣接モチーフ(PAM)を有することが知られているが、本発明者らは、実験内のレプリケーションを許容するために4個ではなく5個のランダムヌクレオチドを用いることにした。用いたスペーサー配列は5’-GGAATCCCTTCTGCAGCACCTGG(配列番号30)であった。ライブラリーは、配列5’-NNNNNGGAATCCCTTCTGCAGCACCTGG(配列番号36)を含んでいた。5個のランダムヌクレオチドを有することは、このライブラリーにおいてアッセイされる1024個のあり得るPAMをもたらす。
PAMプラスミドに基づくライブラリーの構築
23ヌクレオチドスペーサー配列の直接5’の5個のランダムヌクレオチドからなるDNAライブラリーを調製した。LbCas12aは、4ヌクレオチドのプロトスペーサー隣接モチーフ(PAM)を有することが知られているが、本発明者らは、実験内のレプリケーションを許容するために4個ではなく5個のランダムヌクレオチドを用いることにした。用いたスペーサー配列は5’-GGAATCCCTTCTGCAGCACCTGG(配列番号30)であった。ライブラリーは、配列5’-NNNNNGGAATCCCTTCTGCAGCACCTGG(配列番号36)を含んでいた。5個のランダムヌクレオチドを有することは、このライブラリーにおいてアッセイされる1024個のあり得るPAMをもたらす。
本発明者らは、このライブラリーを産生するために新規の方法を用いた。以前に説明されたようにPAM-スペーサー融合の単一のランダム化プールを用いて、そしてポリメラーゼを用いて相補鎖を産生するのではなく(Kleinstiver et al.Nat Biotechnol 37,:276-282(2019))、本発明者らは、より直接的な方法を選択した。2つの5’-リン酸化配列を合成した:
5’phos/CGATGTNNNNNGGAATCCCTTCTGCAGCACCTGGGCGCAGGTCACGAGG(配列番号32)および
AATTCCTCGTGACCTGCGCCCAGGTGCTGCAGAAGGGATTCCNNNNNACATCGCATG/5’phos(配列番号35)。
5’phos/CGATGTNNNNNGGAATCCCTTCTGCAGCACCTGGGCGCAGGTCACGAGG(配列番号32)および
AATTCCTCGTGACCTGCGCCCAGGTGCTGCAGAAGGGATTCCNNNNNACATCGCATG/5’phos(配列番号35)。
加熱およびアニーリングすると、2つのNNNNN配列間の相補配列がアニーリングし、生じる末端は、SphIおよびEcoRI制限エンドヌクレアーゼによって生じるオーバーハングに対応するオーバーハングを有する。2つのオリゴヌクレオチドを、サーマルサイクラー中、95℃で5分間、等しいモル比でアニーリングさせて、0.1℃/秒で25℃/室温まで冷却した。
アニーリングした二本鎖フラグメントを、SphIおよびEcoRIで消化したpUC19ベクターに直接ライゲーションした。ライゲーションしたスペーサー構築物を用いてXL1-ブルーエレクトロコンピテントE.coli細胞(Agilent)を形質転換し、1mlのグルコース含有Super Optimalブロス(SOC)培地中で37℃にて1時間回復させた。ある割合のアリコートをカルベニシリンプレート上にプレーティングして、ライゲーションした産物の存在を確認した。残りの形質転換された細胞を、50mg/mLカルベニシリンで補充された200mlのLuriaブロス(LB)中で16時間増殖させた。スペーサープラスミドを、プラスミドミディプレップキット(Zymo Research)を用いて精製した。
PAMライブラリーの検証
スペーサーベクターをディープ配列解析に供して、Illumina MiSeqを製造元のプロトコルに従って用いて、PAMのそれぞれの位置におけるA/T/G/Cの頻度を計算した。手短には、10ngのDNAをPCRのためのテンプレートとして用いた。フェージング(Phasing)遺伝子特異的なフォワードおよびリバースPCRプライマーを設計して、標的部位にわたって増幅させた。アンプリコンライブラリーを、2ステップPCR方法を用いて生産し、ここで、5’テールを用いた一次PCRは、Illumina i5およびi7アダプター配列および多重化サンプルをソーティングするためのバーコードを二次PCRが付けるのを可能にした。PCR増幅を、以下のパラメーターを用いて行なった:98℃30秒間;PCR1について25サイクルおよびPCR2について8サイクル(98℃10秒、55℃20秒、72℃30秒);72℃5分間;12℃で維持。PCR反応を、Q5 High-Fidelity DNA Polymerase(New England BioLabs,Beverly,MA,United States)を用いて行なった。二次PCRアンプリコンサンプルを、AMPure XPビーズを製造元(Beckman Coulter,Brea,CA,United States)の説明書に従って用いて個々に精製し;全ての精製されたサンプルを、プレートリーダーを用いて定量化し、等しいモル比でプールし、AATIフラグメント分析器で実行した(Agilent Technologies,Palo Alto,CA,United States)。プールされたアンプリコンライブラリーを、MiSeq Reagentキットv2(Illumina,San Diego,CA,United States)を用いてIllumina MiSeq(2X250ペアエンド)でシーケンシングした。
スペーサーベクターをディープ配列解析に供して、Illumina MiSeqを製造元のプロトコルに従って用いて、PAMのそれぞれの位置におけるA/T/G/Cの頻度を計算した。手短には、10ngのDNAをPCRのためのテンプレートとして用いた。フェージング(Phasing)遺伝子特異的なフォワードおよびリバースPCRプライマーを設計して、標的部位にわたって増幅させた。アンプリコンライブラリーを、2ステップPCR方法を用いて生産し、ここで、5’テールを用いた一次PCRは、Illumina i5およびi7アダプター配列および多重化サンプルをソーティングするためのバーコードを二次PCRが付けるのを可能にした。PCR増幅を、以下のパラメーターを用いて行なった:98℃30秒間;PCR1について25サイクルおよびPCR2について8サイクル(98℃10秒、55℃20秒、72℃30秒);72℃5分間;12℃で維持。PCR反応を、Q5 High-Fidelity DNA Polymerase(New England BioLabs,Beverly,MA,United States)を用いて行なった。二次PCRアンプリコンサンプルを、AMPure XPビーズを製造元(Beckman Coulter,Brea,CA,United States)の説明書に従って用いて個々に精製し;全ての精製されたサンプルを、プレートリーダーを用いて定量化し、等しいモル比でプールし、AATIフラグメント分析器で実行した(Agilent Technologies,Palo Alto,CA,United States)。プールされたアンプリコンライブラリーを、MiSeq Reagentキットv2(Illumina,San Diego,CA,United States)を用いてIllumina MiSeq(2X250ペアエンド)でシーケンシングした。
3つの別個のリードをライブラリーについて生産し平均した。生じた1024個のライブラリーメンバーは、39リードの平均リードカウントおよび11.9リードの標準偏差を有していた。任意のPAM配列に関する平均リードの最大数は74であり、最小数は12であった。PAMカウントは正規分布に従った(図5)。
LbCas12a突然変異体のクローニング
ヌクレオプラスミンNLSおよび6xヒスチジンタグが後に続くLbCas12a配列からなるDNAカセットを合成し(GeneWiz)(配列番号52)、pET28aベクター内にNcoIとXhoIの間にクローニングして、pWISE450(配列番号53)を生成した。さらなるグリシンをMet-1とSer-2の間の配列に加えて、クローニングを容易にさせた。この書類の全体で、ナンバリングは、この過剰なグリシンを除く。その結果、186個の異なるアミノ酸点突然変異(表2)が、186個の異なるプラスミドベクターを生じる同様のストラテジーを用いて作製された。
ヌクレオプラスミンNLSおよび6xヒスチジンタグが後に続くLbCas12a配列からなるDNAカセットを合成し(GeneWiz)(配列番号52)、pET28aベクター内にNcoIとXhoIの間にクローニングして、pWISE450(配列番号53)を生成した。さらなるグリシンをMet-1とSer-2の間の配列に加えて、クローニングを容易にさせた。この書類の全体で、ナンバリングは、この過剰なグリシンを除く。その結果、186個の異なるアミノ酸点突然変異(表2)が、186個の異なるプラスミドベクターを生じる同様のストラテジーを用いて作製された。
LbCas12a突然変異体の発現および精製
BL21 Star(DE3)細胞(ThermoFisher Scientific)におけるそれぞれの突然変異体のグリセロールストックを用いて、24ウェルブロックにおいて、50μg/mLのカナマイシンを含む1mLの培地に接種した。AirPoreテープシート(Qiagen)を用いて培養を密封し、37℃で振とうしながら一晩増殖させた。翌朝、カナマイシンを含む4mLのZYP自己誘導培地に100μLの一晩培養物を接種して、37℃で振とうしながら、0.2~0.5のOD600nm範囲までインキュベートした。温度を18℃まで下げ、培養物をタンパク質発現のために一晩増殖させた。遠心分離によって細胞を回収して、ペレットを-80℃で保管した。
BL21 Star(DE3)細胞(ThermoFisher Scientific)におけるそれぞれの突然変異体のグリセロールストックを用いて、24ウェルブロックにおいて、50μg/mLのカナマイシンを含む1mLの培地に接種した。AirPoreテープシート(Qiagen)を用いて培養を密封し、37℃で振とうしながら一晩増殖させた。翌朝、カナマイシンを含む4mLのZYP自己誘導培地に100μLの一晩培養物を接種して、37℃で振とうしながら、0.2~0.5のOD600nm範囲までインキュベートした。温度を18℃まで下げ、培養物をタンパク質発現のために一晩増殖させた。遠心分離によって細胞を回収して、ペレットを-80℃で保管した。
以下のバッファーを細胞溶解および精製に用いた。非イオン性洗浄剤、溶解剤、還元剤、プロテアーゼ阻害剤、バッファー、および塩類を含む溶解バッファー。この溶液は、細菌を溶解させ、粘性を減少させ、干渉するヌクレアーゼを含まない酵素の下流の精製を可能にすることができた。バッファーAは、20mMのHepes-KOH(pH7.5)、0.5M NaCl、10%グリセロール、2mM TCEPおよび10mMイミダゾール(pH7.5)からなる。バッファーBはバッファーAと同じであるが20mMのイミダゾールも含む。バッファーCは、20mMのHepes-KOH(pH7.5)、150mM NaCl、10%グリセロール、0.5mM TCEP、および200mMイミダゾール(pH7.5)を含んでいた。
精製は、マルチウェルのフォーマットを用いて行なった。2つのステンレススチール5/32’’BBを、細胞ペレットを含むすべてのウェルに添加した。0.5mLの冷却溶解バッファー中にペレットを再懸濁して、室温で30分間、軌道混合でインキュベートした。粗溶解物(0.5mL)を、事前に平衡化されたHis MultiTrap(商標)プレート(Cytiva LifeSciences)に添加した。プレートを5分間室温でインキュベートして、タンパク質を結合させた。残りのステップを製造元の説明書に従って行なった。手短には、プレートを0.5mLのバッファーAで2回洗浄後、0.5mLのバッファーBで1回洗浄し、その後に、0.2mLのバッファーC中に溶出させた。タンパク質濃度を、Pierce(商標)Coomassie Plus(Bradford)アッセイ試薬を用いて決定した。タンパク質溶出液を4℃で保管した。
wtLbCas12aによるPAMライブラリーの試験切断
事前試験を行なって実験の3側面を評価した:実験が非特異的ヌクレアーゼを含んでいなかったことを確認する、crRNAガイドの添加の際にライブラリーからのNTTTV PAMにおける枯渇が存在したことを確認する、および、CTTTAのスパイクされたサンプルについて15分における枯渇の程度を見る。
事前試験を行なって実験の3側面を評価した:実験が非特異的ヌクレアーゼを含んでいなかったことを確認する、crRNAガイドの添加の際にライブラリーからのNTTTV PAMにおける枯渇が存在したことを確認する、および、CTTTAのスパイクされたサンプルについて15分における枯渇の程度を見る。
試験枯渇に関する反応条件は以下であった:ヌクレアーゼを含まない水、3μLのNEBバッファー2.1(New England Biolabs)、300nMのcrRNAの3μLストック(5’-AAUUUCUACUAAGUGUAGAUGGAAUCCCUUCUGCAGCACCUGG-3’(配列番号62)、Synthego Corporation)、および1μMストックでの精製されたwtLbCas12a(1μL)を含む27μLの全容量を、室温で10分間インキュベートした。3μLの10ng/μLストックを添加して反応を開始した。ライブラリーをそのまま添加し、または、1μLのCTTTA含有プラスミドを0.75ng/μLで最初に添加した。全容量は全て30μLであった。反応物を37℃で15分間インキュベートした。
表3は実験の結果を提供する。TTTV配列に関するライブラリーのカウントは219~515カウントであり(カラム2)、crRNAの不存在下で説明されるとおりに精製された野生型タンパク質を添加することは、ライブラリーメンバーの枯渇をもたらさず(カラム3)、crRNAおよびタンパク質の添加は、PAMを含む全てのNTTTVの枯渇をもたらし(カラム4)、ライブラリーにCTTTAをスパイクすることは、およそ35倍ものCTTTA NGSカウントもたらし(カラム5)、wtLbCas12aおよびcrRNAの添加は、全てのライブラリーメンバーの枯渇をもたらした(10,776から193カウントへのCTTTAの低減を含む)。また、ACGAはLbCas12aによって認識されるPAMではないので予期されるように、試験された条件下で枯渇を示さないNACGA PAM含有ライブラリーメンバーも示された。したがって、表3に示されるように、NTTTV PAMライブラリーメンバーは、wtLbCas12aによって効率的に切断および枯渇化され、一方で、wtLbCas12aによって認識されないPAM(NACGA)は切断および枯渇化されない。
表3における結果は、(1)wtLbCAs12aの効果的およびヌクレアーゼを含まない精製が達成されたこと、(2)ライブラリーが、PAM基質を含むメンバーについて試験された条件下で枯渇され得ること、(3)枯渇が、スペーサー-標的化crRNAの添加の際に生じること、および(4)大量のCTTTA基質が基質の枯渇を変更しないので、酵素-crRNA複合体は個々のライブラリーメンバーを大きく上回ることを示す。
LbCas12a突然変異体によるPAMライブラリーの切断
同一の反応条件を、wtLbCas12aの試験例において示されたとおりに186個のPAM突然変異体のそれぞれについて試験した。3つの時点を各突然変異について選択した:37℃で、75、435、および900秒。ライブラリー単独のコントロールを複数含んだ。産物をIllumina HiSeq分析(Genewiz)に供した。データを表4に報告する。
同一の反応条件を、wtLbCas12aの試験例において示されたとおりに186個のPAM突然変異体のそれぞれについて試験した。3つの時点を各突然変異について選択した:37℃で、75、435、および900秒。ライブラリー単独のコントロールを複数含んだ。産物をIllumina HiSeq分析(Genewiz)に供した。データを表4に報告する。
絶対的な枯渇スコアの処理
本発明者らは、任意の5ヌクレオチドPAMについて4つの可能性の間で、枯渇の違いをほとんど観察しなかった。換言すれば:任意の4ヌクレオチド配列についてANNNN、CNNNN、GNNNN、およびTNNNNは、同様のPAM枯渇を有していた。これは、NTTTV配列が、NがA、C、G、またはTであるかにかかわらず、同様の量で全て枯渇したことを示した野生型LbCAs12a実験において本発明者らが観察したのと一致した(表3)。第二に、本発明者らは、75、435、および900秒の3つの時点の全てが同様の枯渇を有することを観察した。このことは、反応が37℃で75秒の直後にほぼ完了することを示していた。したがって本発明者らは、5ntライブラリーからの全ての4個の4ntPAMを平均し、全ての3つの時点を平均して、各PAMについて12個のデータポイントを効果的に得ることができた。それから本発明者らは、その平均を、各PAMに関する中央値ライブラリー値で割った。これにより、全ての186個の突然変異体に対するそれぞれの4ヌクレオチドPAMに関する枯渇スコアが得られた。枯渇10は、その4nt PAMを有する4個の親プラスミドライブラリーメンバーの90%が枯渇したことを示し、スコア20は95%の枯渇を示す。
本発明者らは、任意の5ヌクレオチドPAMについて4つの可能性の間で、枯渇の違いをほとんど観察しなかった。換言すれば:任意の4ヌクレオチド配列についてANNNN、CNNNN、GNNNN、およびTNNNNは、同様のPAM枯渇を有していた。これは、NTTTV配列が、NがA、C、G、またはTであるかにかかわらず、同様の量で全て枯渇したことを示した野生型LbCAs12a実験において本発明者らが観察したのと一致した(表3)。第二に、本発明者らは、75、435、および900秒の3つの時点の全てが同様の枯渇を有することを観察した。このことは、反応が37℃で75秒の直後にほぼ完了することを示していた。したがって本発明者らは、5ntライブラリーからの全ての4個の4ntPAMを平均し、全ての3つの時点を平均して、各PAMについて12個のデータポイントを効果的に得ることができた。それから本発明者らは、その平均を、各PAMに関する中央値ライブラリー値で割った。これにより、全ての186個の突然変異体に対するそれぞれの4ヌクレオチドPAMに関する枯渇スコアが得られた。枯渇10は、その4nt PAMを有する4個の親プラスミドライブラリーメンバーの90%が枯渇したことを示し、スコア20は95%の枯渇を示す。
野生型LbCas12aに関する枯渇スコアはTTTV配列に関して9.2であり、したがって、この9.2スコア以上でPAMを切断する任意の突然変異体は、野生型をベンチマークとして用いて効果的であると考えた。例えば、表4は、突然変異体LbCas12a-K595Yが、wtLbCas12aによるTTTV含有配列の切断以上に、ライブラリーからの45個の異なるPAM 4マーをインビトロで枯渇させることを示す。この分析を用いて186個の突然変異体のそれぞれをスコア化し、突然変異体のそれぞれによるインビトロでのPAM認識および切断を判定した。認識配列を含むデータを表4に示し、それにより、TTTV含有配列に対するwtLbCas12aスコア(9.2)以上のLbCas12a-K595YのPAMDA枯渇スコアを示す。
本発明者らは、2つのLbCas12aコントロールを用いて、インビトロで切断された36個の固有のPAM配列を観察した。これは、インビトロでwtLbCas12aがTTTVだけでなくより多くの配列を認識し切断することができるという観察と一致する。TTCN、CTTN、TCTNなどは、LbCas12aによってインビトロで認識され切断されることが示されているが、AsCas12aはTTTNを切断することが示されただけである(Zetsche et al.Cell 163:759-771(2015))。
突然変異体のいくつかは、wtLbCas12aと比較して、インビトロでのPAM配列の認識および切断の合計数を増大させた(表5)。このことは、絶対的なPAM認識配列ではなく、個々の突然変異によって与えられる全体的な無差別性(promiscuity)を物語っている。いくつかの個々の点突然変異体は、野生型よりも無差別(promiscuous)であった。例えば、T152Rは57個の異なるPAMを認識し、K959Yは45個を認識した。
野生型LbCas12aに対する、枯渇の比較
インビトロwtLbCas12aは、TTTVだけよりも多くの配列を認識して切断することができる(Zetsche et al.Cell 163:759-771(2015))。TTCN、CTTN、TCTNなどは、インビトロでLbCas12aによって認識され切断されることが示されているが、AsCas12aはTTTNを切断することが示されただけである(Zetsche et al.Cell 163:759-771(2015))。この研究の目的は、LbCas12aのPAM認識を、その野生型の能力を超えて拡大することであった。この目的を達成するために、本発明者らは、ライブラリー枯渇スコア単独とは異なる分析を用いた。これらのスコアは、インビトロでの絶対的なPAM認識および切断を判定するのに重要であるが、導入される点突然変異に起因する、酵素によるPAM認識に対する変更を容易に強調するものではない。
インビトロwtLbCas12aは、TTTVだけよりも多くの配列を認識して切断することができる(Zetsche et al.Cell 163:759-771(2015))。TTCN、CTTN、TCTNなどは、インビトロでLbCas12aによって認識され切断されることが示されているが、AsCas12aはTTTNを切断することが示されただけである(Zetsche et al.Cell 163:759-771(2015))。この研究の目的は、LbCas12aのPAM認識を、その野生型の能力を超えて拡大することであった。この目的を達成するために、本発明者らは、ライブラリー枯渇スコア単独とは異なる分析を用いた。これらのスコアは、インビトロでの絶対的なPAM認識および切断を判定するのに重要であるが、導入される点突然変異に起因する、酵素によるPAM認識に対する変更を容易に強調するものではない。
第一に、前述のとおり、5ヌクレオチド枯渇の結果は、4ヌクレオチドPAMSに降下した(collapsed into)。それぞれの時点は個々に維持された。それぞれの突然変異体-時点のNGS合計カウントを、PAMあたり100カウントに正規化して、NGSチップ上のローディングの違いを考慮した。それから、それぞれの4nt PAMに関する全体的な中央値をそれぞれの突然変異体-時点と比較した。これにより、全ライブラリーと比較した枯渇ではなく野生型と比較した枯渇が提供された。結果は、どの突然変異がPAM認識プロファイルを変更したか強調する。本発明者らは保守的な手法をとり、突然変異体による新たなPAM認識の示度として4以上の枯渇スコアを選択した。枯渇スコア4は、その特定のPAM含有ライブラリーメンバーが野生型の中央値と比較して4倍切断されることを示した。例えば、100NGSカウントが、野生型について、GCGCを有するPAMに関して残っていて、25カウントが特定の突然変異体-時点について残っているならば、スコア4と計算した。
186個の突然変異のそれぞれの要約を以下の表6に示す。ボールド体で提供される突然変異は、突然変異が、4よりも上のスコアで、野生型と比較して3つよりも多くの新たなPAM配列を認識および切断したことを示す。イタリック体で提供される突然変異は、突然変異体が、4よりも上のスコアで、野生型と比較して1~3個の新たなPAM配列を得たことを示す。通常のフォントの突然変異(ボールド体またはイタリック体でない)は、点突然変異が、4よりも上のスコアで、野生型と比較して新たなPAM配列を切断しなかったことを示す。特定のアミノ酸、例えばT149は、タンパク質のPAM認識ドメイン付近であり10個の新しいアミノ酸を試験したにも関わらず、新たなPAM認識が得られなかった。他のアミノ酸、例えばD156は、新たなPAM認識モチーフをエンジニアリングするためのホットスポットであることが分かった。アスパラギン酸156は、10個の異なるアミノ酸に変更した場合、wtLbCAs12aと比較して、7個の突然変異は複数の新たなPAMを認識し、1個はいくつかの新たなPAMを示し、2個は新たなPAMが得られなかった。一般に、野生型と比較してPAM認識および切断に違いを示した任意の位置は、PAM認識をさらに変更するために二重、三重、または多重の突然変異に組み合わせることができる。合計で130/186の点突然変異は、wtLbCas12aに対して、スコア4よりも上の新たなPAMが得られず(通常のフォント/ボールド体またはイタリック体でない)、40/186は多くの新たなPAMを得て(ボールド体のフォント)、16/186は1~3個の新たなPAMを得た(イタリック体のフォント)。全体で30%の成功率(56/186)は、LbCas12aに対して点突然変異を作製することにより新規のPAM認識モチーフを設計するために効果的な方法が用いられたことを示す。
点突然変異の多くは、LbCas12aに対して新規のPAM認識を与え、これらの配列が前にあるDNAをインビトロで切断することを可能にした。いくつかの突然変異は全体的な無差別性(promiscuity)の増大をもたらしたが、設計および試験された他のものは、wtLbCas12aの認識および切断を変更することが示されなかった。合計で130/186の点突然変異は、スコア4よりも上のwtLbCas12aに対する新たなPAMを獲得せず(表6、通常のフォント/イタリック体またはボールド体でない)、40/186は多くの新たなPAMを獲得し(表6、ボールド体のフォント)、16/186は1~3個の新たなPAMを獲得した(表6、イタリック体のフォント)。全体で30%の成功率(56/186)は、LbCas12aに対して点突然変異を作製することにより新規のPAM認識モチーフを設計するために効果的な方法が用いられたことを示す。
2.原核生物における点突然変異体および組み合わせの結合の判定
個々の突然変異の組み合わせは、単一の突然変異よりもさらに多くのPAM認識を変更することができる。しかしながら、そのような実験は、急速に規模が拡大して多数の組み合わせを試験しなければならない。3個以上の新たなPAMを認識するLbCas12aを生じさせる40個の突然変異のみを用いて、二重突然変異体のライブラリーを作製し、合計で402すなわち1,600の酵素を試験することができた。三重突然変異体ライブラリーを作製すると、レプリケートで精製およびアッセイされるべき403すなわち64,000の酵素がもたらされ、それは現実的でない。したがって本発明者らは、PAM-SCANR(Leenay et al.Mol Cel l62,137-147(2016))として知られる細菌方法を採用してコンビナトリアル突然変異を評価した。本発明者らは、大腸菌におけるライブラリーを用いて、256個のあり得るPAM NNNN変異体に対するCas12a突然変異の結合を試験した。このアッセイは切断を試験せず、むしろインビボでの結合を試験する。作られた突然変異は触媒領域付近にはどこにもなかったので、結合は切断も反映すると予測される(これは、293Tアッセイにおいて後に検証された)。PAM-SCANRの利点は、点突然変異を急速に試験する能力だけでなく、迅速かつ正確な方法でアミノ酸点突然変異の組み合わせを試験する能力である。インビトロ切断アッセイよりも厳密な傾向もある。
個々の突然変異の組み合わせは、単一の突然変異よりもさらに多くのPAM認識を変更することができる。しかしながら、そのような実験は、急速に規模が拡大して多数の組み合わせを試験しなければならない。3個以上の新たなPAMを認識するLbCas12aを生じさせる40個の突然変異のみを用いて、二重突然変異体のライブラリーを作製し、合計で402すなわち1,600の酵素を試験することができた。三重突然変異体ライブラリーを作製すると、レプリケートで精製およびアッセイされるべき403すなわち64,000の酵素がもたらされ、それは現実的でない。したがって本発明者らは、PAM-SCANR(Leenay et al.Mol Cel l62,137-147(2016))として知られる細菌方法を採用してコンビナトリアル突然変異を評価した。本発明者らは、大腸菌におけるライブラリーを用いて、256個のあり得るPAM NNNN変異体に対するCas12a突然変異の結合を試験した。このアッセイは切断を試験せず、むしろインビボでの結合を試験する。作られた突然変異は触媒領域付近にはどこにもなかったので、結合は切断も反映すると予測される(これは、293Tアッセイにおいて後に検証された)。PAM-SCANRの利点は、点突然変異を急速に試験する能力だけでなく、迅速かつ正確な方法でアミノ酸点突然変異の組み合わせを試験する能力である。インビトロ切断アッセイよりも厳密な傾向もある。
レポータープラスミド
プラスミドpWISE1963を、256個のPAMSのそれぞれを有するレポーターを作製するための基礎ベクターとして用いた。プラスミドは、スペクチノマイシン耐性、ColE1複製起点、LacI、およびeGFP(lacプロモーターの制御下)を含む。NotIとSmaI制限部位の間のフラグメントを含む256個の遺伝子ブロック(lacIプロモーターのすぐ5’からlacI遺伝子まで)を、Twist Bioscienceによって合成した。各フラグメントは、lacIプロモーターのすぐ5’に異なる4マーのPAMを含んでいた。各遺伝子ブロックを、制限およびライゲーションによってpWISE1963内にクローニングした。各変異体についてクローンを選択し、PAMの同一性をサンガーシーケンシングによって確認した。
プラスミドpWISE1963を、256個のPAMSのそれぞれを有するレポーターを作製するための基礎ベクターとして用いた。プラスミドは、スペクチノマイシン耐性、ColE1複製起点、LacI、およびeGFP(lacプロモーターの制御下)を含む。NotIとSmaI制限部位の間のフラグメントを含む256個の遺伝子ブロック(lacIプロモーターのすぐ5’からlacI遺伝子まで)を、Twist Bioscienceによって合成した。各フラグメントは、lacIプロモーターのすぐ5’に異なる4マーのPAMを含んでいた。各遺伝子ブロックを、制限およびライゲーションによってpWISE1963内にクローニングした。各変異体についてクローンを選択し、PAMの同一性をサンガーシーケンシングによって確認した。
CRISPR-Casプラスミド
プラスミドpWISE2031を基礎ベクターとして全てのCRISPR-Casプラスミドの作製に用いた。プラスミドは、クロラムフェニコール耐性、CloDF13複製起点、プロモーターBbaJ23108によって駆動されるdLbCas12a、および、BbaJ23119プロモーターによって駆動されるlacIプロモーターを標的化するcrRNAを有するLbCas12aを含む。ネガティブコントロールプラスミドであるpWISE1961は、非標的化crRNAを用いたことを除きpWISE2031と同一の構成要素を含む。それぞれの点突然変異体およびコンビナトリアル突然変異体(pWISE2984-pWISE3007)を、pWISE2031(Genewiz)の部位特異的突然変異誘発を介して構築した。
プラスミドpWISE2031を基礎ベクターとして全てのCRISPR-Casプラスミドの作製に用いた。プラスミドは、クロラムフェニコール耐性、CloDF13複製起点、プロモーターBbaJ23108によって駆動されるdLbCas12a、および、BbaJ23119プロモーターによって駆動されるlacIプロモーターを標的化するcrRNAを有するLbCas12aを含む。ネガティブコントロールプラスミドであるpWISE1961は、非標的化crRNAを用いたことを除きpWISE2031と同一の構成要素を含む。それぞれの点突然変異体およびコンビナトリアル突然変異体(pWISE2984-pWISE3007)を、pWISE2031(Genewiz)の部位特異的突然変異誘発を介して構築した。
細胞株
lacI遺伝子の染色体欠失を含むE.coli細胞株であるJW0336を、Dharmacon Horizon Discoveryから取得した。記載されるプロトコルに従ってエレクトロコンピテント細胞を調製した(Sambrook,J.,and Russell,D.W.(2006).Transformation of E.coli by Electroporation.Cold Spring Harb Protoc 2006,pdb.prot3933)。E.coli JW0336を全てのライブラリー形質転換および細胞選別実験において用いた。
lacI遺伝子の染色体欠失を含むE.coli細胞株であるJW0336を、Dharmacon Horizon Discoveryから取得した。記載されるプロトコルに従ってエレクトロコンピテント細胞を調製した(Sambrook,J.,and Russell,D.W.(2006).Transformation of E.coli by Electroporation.Cold Spring Harb Protoc 2006,pdb.prot3933)。E.coli JW0336を全てのライブラリー形質転換および細胞選別実験において用いた。
レポーターライブラリーの調製
上記セクションに記載の各レポータープラスミド10ngを単一チューブ内にプールし、形質転換および増幅のためのライブラリーを産生した。プールされたプラスミドライブラリーの20分の1(およそ0.5ngの各レポーター)を、製造元の説明書に従ってスーパーコンピテントXL1-ブルー内に形質転換した。225rpmで振とうしながら37℃で回復させた1時間後に、形質転換体の全体を1LのLBスペクチノマイシンに移し、225rpmで振とうしながら37℃で一晩増殖させた。翌日、プラスミドDNAを、ZymoPUREプラスミドギガプレップキットを製造元の説明書に従って用いて一晩培養物からから抽出した。DNAをナノドロップによって定量化し、全てのその後のライブラリー形質転換において用いた。
上記セクションに記載の各レポータープラスミド10ngを単一チューブ内にプールし、形質転換および増幅のためのライブラリーを産生した。プールされたプラスミドライブラリーの20分の1(およそ0.5ngの各レポーター)を、製造元の説明書に従ってスーパーコンピテントXL1-ブルー内に形質転換した。225rpmで振とうしながら37℃で回復させた1時間後に、形質転換体の全体を1LのLBスペクチノマイシンに移し、225rpmで振とうしながら37℃で一晩増殖させた。翌日、プラスミドDNAを、ZymoPUREプラスミドギガプレップキットを製造元の説明書に従って用いて一晩培養物からから抽出した。DNAをナノドロップによって定量化し、全てのその後のライブラリー形質転換において用いた。
ライブラリー形質転換および細胞選別
100ngのレポータープラスミドライブラリーおよび100ngのCrispr/Casプラスミドを、40uLのJW0336中にエレクトロポレーションによって共形質転換した。形質転換体を、225rpmで1時間振とうしながら37℃で回復させた。回復の最後に、10uLの形質転換体を取り出し、90uLのLBと混合し、クロラムフェニコールおよびスペクチノマイシンを含むLB寒天プレート上にプレーティングして、形質転換効率を決定した。回収(recovery)の残りの量(990uL)を、スペクチノマイシンおよびクロラムフェニコールを有する29mLのLBを含む一晩培養物に移した。培養物を、225rpmで振とうしながら37℃で一晩増殖させた。翌朝、形質転換プレート上のコロニーをカウントして形質転換効率を決定した;2つを除く全ての形質転換は>2,000の形質転換体を示し、レポーターライブラリーの10倍以上のカバレッジに相当した。10倍以上のカバレッジを示さなかった2つのサンプルを繰り返した。それから、一晩培養物のグリセロールストックを調製して-80℃で保管し、各培養物の6mLを、Qiagenミニプレップキットを製造元の説明書に従って用いてミニプレップした。これらのミニプレップは「ソーティング前(pre-sort)」とラベルし、4℃で保管した。
100ngのレポータープラスミドライブラリーおよび100ngのCrispr/Casプラスミドを、40uLのJW0336中にエレクトロポレーションによって共形質転換した。形質転換体を、225rpmで1時間振とうしながら37℃で回復させた。回復の最後に、10uLの形質転換体を取り出し、90uLのLBと混合し、クロラムフェニコールおよびスペクチノマイシンを含むLB寒天プレート上にプレーティングして、形質転換効率を決定した。回収(recovery)の残りの量(990uL)を、スペクチノマイシンおよびクロラムフェニコールを有する29mLのLBを含む一晩培養物に移した。培養物を、225rpmで振とうしながら37℃で一晩増殖させた。翌朝、形質転換プレート上のコロニーをカウントして形質転換効率を決定した;2つを除く全ての形質転換は>2,000の形質転換体を示し、レポーターライブラリーの10倍以上のカバレッジに相当した。10倍以上のカバレッジを示さなかった2つのサンプルを繰り返した。それから、一晩培養物のグリセロールストックを調製して-80℃で保管し、各培養物の6mLを、Qiagenミニプレップキットを製造元の説明書に従って用いてミニプレップした。これらのミニプレップは「ソーティング前(pre-sort)」とラベルし、4℃で保管した。
それぞれの一晩ライブラリー培養物の1光学密度(OD)を卓上微量遠心機において8,000rpm、4℃で5分間スピンダウンした。上清をピペットで除去し、1mLのフィルター滅菌1×PBSバッファーを各チューブに添加した。ペレットを注意深くピペッティングによって再懸濁した。1×PBSでの洗浄をさらに2回繰り返し、最後の再懸濁後、細胞(1×PBS中、約108細胞/mL)を氷上に置いた。各サンプルをBeckman-Coulter MoFlo XDP細胞ソーターで選別した。ネガティブコントロール(WT-dLbCas12a+非標的化crRNA+レポーターライブラリー)およびポジティブコントロール(WT-dLbCas12a+標的化crRNA+レポーターライブラリー)を用いて、細胞選別のためのゲーティングパラメーターを設定した。サンプルを単細胞純度モード、電圧425、ssc電圧535、fsc電圧(ゲイン)4.0でソーティングした。ソーティングの典型的な速度は約4000イベント/秒であった。各サンプルは、最小で1.0×106イベントを有し;細胞選別を、50,000GFPポジティブイベントが集められるまで、またはサンプルが枯渇するまで行なった。サンプルが枯渇した場合は、最小で200GFPポジティブイベントを集めた。GFP陽性イベントを、スペクチノマイシンおよびクロラムフェニコールを有する2mLのLBを含むチューブ内に集めた。ソーティング後、スペクチノマイシンおよびクロラムフェニコールを有するさらなるLBでサンプルを6mLに希釈し、それから、225rpmで振とうしながら37℃で一晩増殖させた。
ソーティングの例を図6~11に提供する。図6は、wtLbCas12aおよびプラスミドスペーサーを標的化しなかったcrRNAを含むネガティブコントロールの細胞選別結果を示す。GFP highサンプルからソーティングされた細胞は、ソーティング画分中の細胞(左パネル)、および、単一ピークによって示されるGFPシグナルの単一集団(右パネル)を示さない。図7は、wtLbCas12aおよびプラスミドスペーサーを標的化するcrRNAの細胞選別結果を示す。GFP highサンプルからソーティングされた細胞は、ソーティング画分中の細胞(左パネル、GFP hi)、および、2つの主なピークによって示されるGFPシグナルの2つの集団(右パネル、GFP negおよびGFP High)を示す。また、GFP highにソーティングされた細胞が蛍光を発しているのも示される(下の右パネル)。図8は、LbCas12a-K595Yおよびプラスミドスペーサーを標的化するcrRNAの細胞選別結果を示す。GFP highサンプルからソーティングされた細胞は、ソーティング画分中の細胞(左パネル、GFP hi)、および、2つの主なピークによって示される集団(右パネル、GFP negおよびGFP high)を示す。図9は、LbCas12a-G532R-K595R二重突然変異コントロール(Gao et al.Nat Biotechnol 35,nbt.3900(2017))およびプラスミドスペーサーを標的化するcrRNAの細胞選別結果を示す。GFP highサンプルからソーティングされた細胞は、ソーティング画分中の細胞(左パネル、GFP hi)、および、2つの主なピークによって示される集団(右パネル)を示す。図10は、プラスミドスペーサーを標的化するcrRNAとともに用いた点突然変異の2つの組み合わせであるLbCas12a-T152R-K595Y二重突然変異の細胞選別結果を示す。GFP highサンプルからソーティングされた細胞は、ソーティング画分中の細胞(左パネル、GFP hi)、および、2つの主なピークによって示される集団(右パネル)を示す。図11は、プラスミドスペーサーを標的化するcrRNAとともに用いた点突然変異の3つの組み合わせであるLbCas12a-T152R-K538W-K595Y三重突然変異の細胞選別結果を示す。GFP highサンプルからソーティングされた細胞は、ソーティング画分中の細胞(左、GFP hi)および示される集団(右、緑の線)を示す。
次世代シーケンシング
翌朝、ソーティングした後に、それぞれの一晩培養物のグリセロールストックを調製して-80Cで保管した。各6mL培養物の残りの量を、Qiagenミニプレップキットを製造元の説明書に従って用いてミニプレップした。これらのミニプレップは、「ソーティング後(post-sort)」とラベルし、4℃で保管した。ソーティング前およびソーティング後のミニプレップをナノドロップにより定量化し、10倍希釈して、Illumina Mi-Seqでのシーケンスに渡した(handed off)。
翌朝、ソーティングした後に、それぞれの一晩培養物のグリセロールストックを調製して-80Cで保管した。各6mL培養物の残りの量を、Qiagenミニプレップキットを製造元の説明書に従って用いてミニプレップした。これらのミニプレップは、「ソーティング後(post-sort)」とラベルし、4℃で保管した。ソーティング前およびソーティング後のミニプレップをナノドロップにより定量化し、10倍希釈して、Illumina Mi-Seqでのシーケンスに渡した(handed off)。
スペーサーベクターをディープ配列解析に供して、Illumina MiSeqを製造元のプロトコルに従って用いて、PAMのそれぞれの位置におけるA/T/G/Cの頻度を計算した。手短には、10ngのDNAをPCRのためのテンプレートとして用いた。フェージング(Phasing)遺伝子特異的なフォワードおよびリバースPCRプライマーを設計して、標的部位にわたって増幅させた。アンプリコンライブラリーを、2ステップPCR方法を用いて生産し、ここで、5’テールを用いた一次PCRは、Illumina i5およびi7アダプター配列および多重化サンプルをソーティングするためのバーコードを二次PCRが付けるのを可能にした。PCR増幅を、以下のパラメーターを用いて行なった:98℃30秒間;PCR1について25サイクルおよびPCR2について8サイクル(98℃10秒、55℃20秒、72℃30秒);72℃5分間;12℃で維持。PCR反応を、Q5 High-Fidelity DNA Polymerase(New England BioLabs,Beverly,MA,United States)を用いて行なった。二次PCRアンプリコンサンプルを、AMPure XPビーズを製造元(Beckman Coulter,Brea,CA,United States)の説明書に従って用いて個々に精製し;全ての精製されたサンプルを、プレートリーダーを用いて定量化し、等しいモル比でプールし、AATIフラグメント分析器で実行した(Agilent Technologies,Palo Alto,CA,United States)。プールされたアンプリコンライブラリーを、MiSeq Reagentキットv2(Illumina,San Diego,CA,United States)を用いてIllumina MiSeq(2X250ペアエンド)でシーケンシングした。
高い蛍光にソーティングされた細胞のシーケンシング結果
256メンバーのレポーターライブラリーの存在下で、wtdLbCas12aおよび非標的化crRNAを含む2つのネガティブコントロールサンプルを実行した。1.0に正規化した後、ライブラリーの各メンバーに関する値をヒストグラムとしてプロットした(図12)。図12は、2つの別個のcrRNAなしコントロールおよび野生型dLbCas12aおよびレポーターライブラリーに関する合計の正規化されたNGSカウントを示す。2つの別個のサンプルを分析して組み合わせた(合計512個のポイントは256個のPAM×2を表わす)。本発明者らは、保守的な(conservative)1.67値(最も高いカウント)をこれらの実験に関するカットオフとして選択し、それよりも上をPAM結合としてスコア化した。標準偏差は0.16であった。本発明者らは、カットオフとして標準偏差の何倍かを選ぶのではなく、2つのネガティブコントロールのいずれかに見られる絶対最大値である1.67を選択した。このことは、データの標準偏差の10倍を超える非常に厳密なカットオフを与えた。実際、3個のPAM配列のみが1.5よりも上に見られた。
256メンバーのレポーターライブラリーの存在下で、wtdLbCas12aおよび非標的化crRNAを含む2つのネガティブコントロールサンプルを実行した。1.0に正規化した後、ライブラリーの各メンバーに関する値をヒストグラムとしてプロットした(図12)。図12は、2つの別個のcrRNAなしコントロールおよび野生型dLbCas12aおよびレポーターライブラリーに関する合計の正規化されたNGSカウントを示す。2つの別個のサンプルを分析して組み合わせた(合計512個のポイントは256個のPAM×2を表わす)。本発明者らは、保守的な(conservative)1.67値(最も高いカウント)をこれらの実験に関するカットオフとして選択し、それよりも上をPAM結合としてスコア化した。標準偏差は0.16であった。本発明者らは、カットオフとして標準偏差の何倍かを選ぶのではなく、2つのネガティブコントロールのいずれかに見られる絶対最大値である1.67を選択した。このことは、データの標準偏差の10倍を超える非常に厳密なカットオフを与えた。実際、3個のPAM配列のみが1.5よりも上に見られた。
ソーティング前のプールを、ソーティング前に全てシーケンシングした。平均リード/PAMはサンプルに応じて約250~500NGSリードであった。高い蛍光のソーティング後のプールをシーケンシングし、約250~500リード/PAMで同様のリードカウント/PAMを有していた。それから、両方のサンプルを、それぞれのNGS実験における小さなローディング差に関してコントロールに対して正規化した。それから2つの値を引き算して1.0に対して正規化した。多くのPAM配列が、1.67カットオフよりも上で点突然変異ライブラリーによって結合された(図13、表7)。
本発明者らは、3つの点突然変異T152R、K538W、およびK595Yを様々な組み合わせで組み合わせて、二重および三重dLbCas12a突然変異体(T152R+K538W、K538W+K595Y、およびT152R+K538W+K595Y)を作製した。これを、LbCas12a突然変異がG532R+K595Rコントロールに相当する、「RR」として知られるAsCas12aにおいて開発された以前に説明されたコントロールと比較した(Gao et al.Nat Biotechnol 35(8):789-792(2017))。「RR」は、AsCas12aおよびそれに続いてLbCas12aにおいてTYCV+CCCC配列内にインデルを生じさせることが可能であると記載されている。
同じ方法論を適用してコンビナトリアル突然変異をスコア化した。PAMライブラリーメンバーあたり平均約250~500MiSeq NGSリードをそれぞれ有するソーティング前およびソーティング後のプールをシーケンシングした。ソーティング前およびソーティング後のプールを正規化し、引き算をして、差を1.0に対して正規化した。多くのPAM配列が、1.67カットオフよりも上で組み合わせによって結合された(図14、表8)。
PAM-SCANRデータの全体的な分析
野生型LbCas12aは強いTTTV結合を示し、LbCas12a-G532R-K595Rコントロールは強いTYCVおよびCCCC結合を示した。「RR」と呼ばれるこの突然変異は、AsCas12aにおいて開発され、TYCVおよびCCCCに結合することが示された(Gao et al.Nat Biotechnol 35(8):789-792(2017))。しかしながら、インビトロでwtLbCas12aは、TTCN、CTTN、TCTNなどを認識して切断することができ、AsCas12aはTTTNを切断することのみ示された(Zetsche et al.,Cell 163:759-771(2015))。本発明者らは、LbCas12aコンテキストにおいて配置された「RR」突然変異が、AsCas12aコンテキストにおいて配置された場合よりも無差別(promiscuous)であると推測し、これは、このコントロールについて観察されたものであり、LbCas12a-RRは45個の配列を認識した。野生型およびLbCas12a-RRの結果は両方とも、選択およびソーティングのパラメーターの妥当性を示す。
野生型LbCas12aは強いTTTV結合を示し、LbCas12a-G532R-K595Rコントロールは強いTYCVおよびCCCC結合を示した。「RR」と呼ばれるこの突然変異は、AsCas12aにおいて開発され、TYCVおよびCCCCに結合することが示された(Gao et al.Nat Biotechnol 35(8):789-792(2017))。しかしながら、インビトロでwtLbCas12aは、TTCN、CTTN、TCTNなどを認識して切断することができ、AsCas12aはTTTNを切断することのみ示された(Zetsche et al.,Cell 163:759-771(2015))。本発明者らは、LbCas12aコンテキストにおいて配置された「RR」突然変異が、AsCas12aコンテキストにおいて配置された場合よりも無差別(promiscuous)であると推測し、これは、このコントロールについて観察されたものであり、LbCas12a-RRは45個の配列を認識した。野生型およびLbCas12a-RRの結果は両方とも、選択およびソーティングのパラメーターの妥当性を示す。
試験された突然変異は、新規のPAMが、インビトロで同定された個々の点突然変異によって、インビボで認識されることを明確に示した。例えば、K595Yは、1.67閾値よりも上で13個のPAMに結合し、そのうち11個はwtLbCas12aによって認識されず、Cas12aによって結合されることが知られるTTTV配列を含むものはなかった。同様に、T152Rは15個の別個のPAMを認識したが、この場合、野生型のTTTVを維持していた。試験された12個の点突然変異の全てが、それぞれ、標準的なTTTVモチーフ以外の、dLbCas12aコントロールとは異なる新規のPAM結合配列を有していた。
組合せの効果
本発明者らは、複数の点突然変異を組み合わせても、点突然変異のPAM配列の線形加算(linear addition)をもたらさないことを見いだした(図15)。例えば、LbCas12a点突然変異体K538WおよびK595Yの組み合わせは、酵素LbCas12a-K538W-K595Yをもたらし、それは場合によっては、PAM認識モチーフをK538W(垂直陰影)またはK595Y(水平陰影)と共有するが、完全に新規のPAM認識配列(thatched)をもたらすことの方が多い。同じ例を用いて、K538WはAGCTを認識するが、K538W+K595Yは認識しない。K595YはACGCを認識するが、K538W+K595Yは認識しない。CCCCはK538WによってもK595Yによっても認識されないが、二重突然変異体は高い親和性でそれに結合する。
本発明者らは、複数の点突然変異を組み合わせても、点突然変異のPAM配列の線形加算(linear addition)をもたらさないことを見いだした(図15)。例えば、LbCas12a点突然変異体K538WおよびK595Yの組み合わせは、酵素LbCas12a-K538W-K595Yをもたらし、それは場合によっては、PAM認識モチーフをK538W(垂直陰影)またはK595Y(水平陰影)と共有するが、完全に新規のPAM認識配列(thatched)をもたらすことの方が多い。同じ例を用いて、K538WはAGCTを認識するが、K538W+K595Yは認識しない。K595YはACGCを認識するが、K538W+K595Yは認識しない。CCCCはK538WによってもK595Yによっても認識されないが、二重突然変異体は高い親和性でそれに結合する。
概して、突然変異の組み合わせは、線形拡大(linear expansion)よりも多くのPAM認識をもたらす。例えば、K538Wは6個のPAM配列を認識し、K595Yは13個を認識するが、合わさるとそれらは32個の配列を認識する(図15)。単純な相加的効果は、本発明者らが観察した32個ではなく、二重突然変異体について19個のPAMをもたらすだろう。さらに、二重突然変異体によって認識された32個の配列のうち11個のみが、2つの単一突然変異のいずれかによって認識される。同様のパターンが3つの突然変異を組み合わせた場合に観察される(図16)。T152R、K538W、およびK595Yの組み合わせは、3つの個々の突然変異単独のいずれとも異なるPAM認識を有する三重突然変異をもたらす。例えば:GGCA、GGCC、GGGC、およびGGGGは、全ての3つの突然変異がLbCas12aに対してなされた場合にのみ認識される。これらのPAMのいずれも単一または二重突然変異のいずれによっても結合されないが、T152R、K538W、およびK595Yが一緒に全て突然変異した場合にのみ結合する。
PAM-SCANR対インビトロPAMDAにおける点突然変異PAM認識の比較
試験された12個の点突然変異について全体として考えると、1.67よりも上のPAM-SCANRヒットは、インビトロPAMDA枯渇アッセイにおいてよく表わされていた。K595YおよびT152Rの例を示す(図17)。図17は、K595Y(左パネル)およびT152R(右パネル)に対するPAN-SCANRによって1.67スコアよりも上を示した全ての非TTTV PAM(灰色のボックス)を比較する。1.67カットオフよりも上のPAM-SCANRポジティブPAMの全て(1つを除く)が、9.2カットオフよりも上のPAM枯渇スコアをインビトロで有した。しかしながら、PAM-SCANR方法および分析は、インビトロでのアッセイおよび分析よりも厳密であった。例えば、13個の異なるPAMをソーティングし、シーケンシングして、PAM-SCANRにおいて1.67よりも上の値を有するように正規化した。それは、45個の配列をインビトロで容易に切断されるものとして同定したPAMDAアッセイと対照的である。これは、試験管内に対する細胞内側の相対的濃度の関数であると考えられるが、PAM-SCANRに関する厳密すぎるカットオフまたはPAMDAアッセイに関する寛容すぎるカットオフの設定の関数でもあり得る。
試験された12個の点突然変異について全体として考えると、1.67よりも上のPAM-SCANRヒットは、インビトロPAMDA枯渇アッセイにおいてよく表わされていた。K595YおよびT152Rの例を示す(図17)。図17は、K595Y(左パネル)およびT152R(右パネル)に対するPAN-SCANRによって1.67スコアよりも上を示した全ての非TTTV PAM(灰色のボックス)を比較する。1.67カットオフよりも上のPAM-SCANRポジティブPAMの全て(1つを除く)が、9.2カットオフよりも上のPAM枯渇スコアをインビトロで有した。しかしながら、PAM-SCANR方法および分析は、インビトロでのアッセイおよび分析よりも厳密であった。例えば、13個の異なるPAMをソーティングし、シーケンシングして、PAM-SCANRにおいて1.67よりも上の値を有するように正規化した。それは、45個の配列をインビトロで容易に切断されるものとして同定したPAMDAアッセイと対照的である。これは、試験管内に対する細胞内側の相対的濃度の関数であると考えられるが、PAM-SCANRに関する厳密すぎるカットオフまたはPAMDAアッセイに関する寛容すぎるカットオフの設定の関数でもあり得る。
データセット間には、触媒部位から離れた残基の本発明者らのエンジニアリングが、触媒作用ではなくPAM認識および結合に影響を及ぼすことを示す相関がある。これらの残基における突然変異がPAM結合とともにヌクレアーゼ活性にも影響を与えるならば、PAM-SCANRアッセイ(結合を測定するが切断は測定しない)では多くのヒットがあり、それはPAMDAアッセイでは切断を示さなかっただろう。本発明者らはそのパターンを見ていない。本発明者らは、結合の変化に影響を与えた(PAM-SCANR)突然変異が、インビトロでの切断ももたらした(PAMDA)ことを観察している。
3.真核生物における結合、切断、およびインデル形成の判定
本発明者らは、3つの突然変異T152R、K538W、およびK595Yを選択して、それらが真核生物HEK293T細胞において挿入または欠失(インデル)を生じさせる能力を試験した。このアッセイは貴重な真核生物インデルデータを与える。真核生物における挿入および欠失を得るために、複数の基準がすべて満たされなければならない:CRISPR酵素が発現されて細胞内で安定である必要があり、crRNAが発現されて正しくプロセッシングされる必要があり、タンパク質:RNA複合体が形成される必要があり、複合体が安定である必要があり、複合体が十分な量で核内に移行する必要があり、標的DNAがアクセス可能である必要があり、DNAが特定のガイドRNA設計によって良好に標的化されなければならず、二本鎖切断が、挿入または欠失(インデル)によって時折のDNA修復ミスを生じるのに十分高い割合で生じる必要がある。このことは、真核生物アッセイを、この試験における最も厳密なアッセイにさせる。実験が低スループットであることに起因して、256個全てではなく以下に記載する3個の点突然変異体のそれぞれについて数ダースのPAMを試験した。特定のガイドはしばしば標的アクセス可能性に起因して効果的でないので、偽陰性を避けるために3つの異なる標的をそれぞれのPAM突然変異体の組み合わせに選択した。
本発明者らは、3つの突然変異T152R、K538W、およびK595Yを選択して、それらが真核生物HEK293T細胞において挿入または欠失(インデル)を生じさせる能力を試験した。このアッセイは貴重な真核生物インデルデータを与える。真核生物における挿入および欠失を得るために、複数の基準がすべて満たされなければならない:CRISPR酵素が発現されて細胞内で安定である必要があり、crRNAが発現されて正しくプロセッシングされる必要があり、タンパク質:RNA複合体が形成される必要があり、複合体が安定である必要があり、複合体が十分な量で核内に移行する必要があり、標的DNAがアクセス可能である必要があり、DNAが特定のガイドRNA設計によって良好に標的化されなければならず、二本鎖切断が、挿入または欠失(インデル)によって時折のDNA修復ミスを生じるのに十分高い割合で生じる必要がある。このことは、真核生物アッセイを、この試験における最も厳密なアッセイにさせる。実験が低スループットであることに起因して、256個全てではなく以下に記載する3個の点突然変異体のそれぞれについて数ダースのPAMを試験した。特定のガイドはしばしば標的アクセス可能性に起因して効果的でないので、偽陰性を避けるために3つの異なる標的をそれぞれのPAM突然変異体の組み合わせに選択した。
HEK293T細胞の試験
真核生物HEK293T(ATCC CRL-3216)細胞を、ダルベッコ改変イーグル培地+10%(v/v)FBS(FBS)で補充されたGlutaMax(ThermoFisher)中、37℃にて5%CO2で培養した。野生型および突然変異体LbCas12を、固体合成を用いて合成して、続いて、プラスミド内へ、CMVプロモーターの後ろにクローニングした。CRISPR RNA(crRNA)を、ヒトU6プロモーターの後ろにクローニングした(表9)。HEK293T細胞を、48ウェルのコラーゲン被覆BioCoatプレート(Corning)上に播種した。細胞を約70%密集度でトランスフェクトした。750ngのタンパク質プラスミドおよび250ngのcrRNA発現プラスミドを、製造元のプロトコルに従ってウェルあたり1.5μlのリポフェクタミン3000(ThermoFisher Scientific)を用いてトランスフェクトした。トランスフェクトされた細胞由来のゲノムDNAを3日後に採取し、インデルを検出し、ハイスループットIlluminaアンプリコン・シーケンシングを用いて定量化した。
真核生物HEK293T(ATCC CRL-3216)細胞を、ダルベッコ改変イーグル培地+10%(v/v)FBS(FBS)で補充されたGlutaMax(ThermoFisher)中、37℃にて5%CO2で培養した。野生型および突然変異体LbCas12を、固体合成を用いて合成して、続いて、プラスミド内へ、CMVプロモーターの後ろにクローニングした。CRISPR RNA(crRNA)を、ヒトU6プロモーターの後ろにクローニングした(表9)。HEK293T細胞を、48ウェルのコラーゲン被覆BioCoatプレート(Corning)上に播種した。細胞を約70%密集度でトランスフェクトした。750ngのタンパク質プラスミドおよび250ngのcrRNA発現プラスミドを、製造元のプロトコルに従ってウェルあたり1.5μlのリポフェクタミン3000(ThermoFisher Scientific)を用いてトランスフェクトした。トランスフェクトされた細胞由来のゲノムDNAを3日後に採取し、インデルを検出し、ハイスループットIlluminaアンプリコン・シーケンシングを用いて定量化した。
スペーサーベクターをディープ配列解析に供して、Illumina MiSeqを製造元のプロトコルに従って用いて、PAMのそれぞれの位置におけるA/T/G/Cの頻度を計算した。手短には、10ngのDNAをPCRのためのテンプレートとして用いた。フェージング(Phasing)遺伝子特異的なフォワードおよびリバースPCRプライマーを設計して、標的部位にわたって増幅させた。アンプリコンライブラリーを、2ステップPCR方法を用いて生産し、ここで、5’テールを用いた一次PCRは、Illumina i5およびi7アダプター配列および多重化サンプルをソーティングするためのバーコードを二次PCRが付けるのを可能にした。PCR増幅を、以下のパラメーターを用いて行なった:98℃30秒間;PCR1について25サイクルおよびPCR2について8サイクル(98℃10秒、55℃20秒、72℃30秒);72℃5分間;12℃で維持。PCR反応を、Q5 High-Fidelity DNA Polymerase(New England BioLabs,Beverly,MA,United States)を用いて行なった。二次PCRアンプリコンサンプルを、AMPure XPビーズを製造元(Beckman Coulter,Brea,CA,United States)の説明書に従って用いて個々に精製し;全ての精製されたサンプルを、プレートリーダーを用いて定量化し、等しいモル比でプールし、AATIフラグメント分析器で実行した(Agilent Technologies,Palo Alto,CA,United States)。プールされたアンプリコンライブラリーを、MiSeq Reagentキットv2(Illumina,San Diego,CA,United States)を用いてIllumina MiSeq(2X250ペアエンド)でシーケンシングした。
野生型コントロール
野生型LbCas12a(wtLbCas12a)は、TTTV(TTTA、TTTC、およびTTTG)を認識する。本発明者らは、23ヌクレオチドスペーサー標的を含むcrRNAスペーサー(表9)を用いて、TTTVに対して野生型タンパク質を試験した(図18)。
野生型LbCas12a(wtLbCas12a)は、TTTV(TTTA、TTTC、およびTTTG)を認識する。本発明者らは、23ヌクレオチドスペーサー標的を含むcrRNAスペーサー(表9)を用いて、TTTVに対して野生型タンパク質を試験した(図18)。
タンパク質および標的の選択
PAMDAインビトロアッセイにおいてPAMアクセス可能性の増大を示した多くの点突然変異が存在した。内因性293T細胞標的に対する効果的なPAM突然変異体の全てを試験することは、本発明者らの多くの点突然変異および256個のあり得る4ヌクレオチド(nt)PAMを考慮すると、実験の複雑性、費用、および時間に起因して、効率的に不可能である。したがって本発明者らは、PAMのサブセットに対して試験する3つの点突然変異を選択した。3つの試験された点突然変異は、T152R、K538W、およびK595Yである。
PAMDAインビトロアッセイにおいてPAMアクセス可能性の増大を示した多くの点突然変異が存在した。内因性293T細胞標的に対する効果的なPAM突然変異体の全てを試験することは、本発明者らの多くの点突然変異および256個のあり得る4ヌクレオチド(nt)PAMを考慮すると、実験の複雑性、費用、および時間に起因して、効率的に不可能である。したがって本発明者らは、PAMのサブセットに対して試験する3つの点突然変異を選択した。3つの試験された点突然変異は、T152R、K538W、およびK595Yである。
293T細胞におけるゲノム標的は、それらのPAM配列に基づいて選択した。3つの点突然変異に関するゲノム標的は、適切な4nt PAMを有すること、および、そのPAMから下流の23ヌクレオチドを選択すること以外、特定の規則を用いずにランダムに選択した。3つの異なるスペーサーは、それぞれのPAMをアッセイするように選択した。これは、CRISPR酵素の活性が標的特異的であり、しばしば予測することができないという観察によるものである。
平均して、本発明者らは、試験された23ヌクレオチドwtLbCas12aスペーサーの約半分が正しいPAM TTTV配列を有しているにもかかわらず効果がないことを観察した。各PAMに関するたった3つのデータポイントしかないことと、標的の約50%がインデルを産生しないという観察から、ランダムに設計されたスペーサーに関する平均よりむしろ、PAMあたりの最大インデルパーセンテージを可視化することによりPAM認識を評価することがより有益である(図19~21)。各PAMについてより多くの数のスペーサーをアッセイした場合は、統計試験を用いてそれらの平均編集効率を評価し得る。
本発明者らの全体的なトランスフェクションおよびアッセイ条件は、TTTCについておよそ11~26%、TTTAについて10%、TTTGについて4~10%で、HEK293T細胞におけるインデルを生じる野生型LbCAs12aをもたらす(図18)。これらは、文献から前に定義されたHEK293T標的部位およびガイドであり、したがって、任意のランダムに選択されたガイドよりも効果的であることが予測される。突然変異体に関するcrRNAガイドのランダムな設計にもかかわらず、多くの新たなCas12a PAM認識部位が、TTTV配列において、野生型と同様の割合でインデルを生じさせた(図19~21)。0.1%よりも上の任意のインデルは、10,000NGSリード深度で読まれたシーケンシングアッセイのノイズよりも上である。
K595Yは、ACCGにおいて25.5%、CCGCにおいて10.9%、TCGCにおいて10.1%、CCCGにおいて9.5%、GCGCにおいて8.3%、CTGGにおいて7.8%、ACGGにおいて6.3%、CCCGにおいて6.0%、TGGCにおいて5.3%などでインデルを生じさせることができた(図19)。これらの数字は全て、ランダムに設計されたにもかかわらず、wtLbCas12aに関するTTTVコントロールの範囲内である。Cas12aタンパク質の1つの主なホールマークは、TリッチなPAMを認識することである(Zetsche et al.Cell 163:759-771(2015))。このことは、ゲノム編集技術におけるそれらの有用性を制限する。K595Yは明らかにCおよびGリッチのPAMを好み、このことは、Cas2aの有用性を、以前は主にGリッチPAMを利用するCas9 CRISPR酵素の標的であった標的に拡大させる(Jinek et al.Science 337,816-821(2012))。K595Yについて、合計256個のあり得る4ヌクレオチドPAMのうち31個のみが293T細胞において試験された(または12%)。真核生物細胞においてK595Yによって認識されてインデルを生じさせ得る多くの他のPAMが存在する可能性がある。
T152Rは、CCTCにおいて11.5%、CCTGにおいて10.0%、CCCAにおいて9.6%、GCCAにおいて8.4%、GCCCにおいて7.2%、CTGCにおいて5.1%などでインデルを生じさせることができた(図20)。興味深いことに、T152Rは、TTTCにおいて34.9%、TTTAにおいて10.2%、およびTTTGにおいて6.2%で、インデルを生じさせることにより、wtLbCas12aのTTTV認識を維持した。それはまた、TTTT認識もピックアップし(picked up)、8.3%でインデルを生じさせた。T152Rについて、合計256個のあり得る4ヌクレオチドPAMの22個のみが293T細胞において試験された(または9%)。真核生物細胞においてT152Rによって認識されてインデルを生じさせ得る多くの他のPAMが存在する可能性がある。
図21に示されるように、28個のPAM標的のうち22個が、0.1%のバックグラウンドよりも上の活性を有しており、試験されたPAMの79%がこの酵素によって認識され切断されることが示唆されたが、一部の適用については所望され得るよりも低いこともある。試験された6個のPAMは、3つの選択された標的に関して、バックグラウンドよりも上の編集がなかった。3つのTTTV標的は全て、TTTC、TTTG、およびTTTAについて、それぞれ15.6%、6.2%、および5.8%で良好な活性を依然として有していた。1%よりも上のインデル形成を有する他のPAM配列は、ATTA(3.5%)、TTTT(3.2%)、TGTC(1.8%)、AGCG(1.8%)、AGTC(1.6%)、AGCA(1.4%)、およびGGTC(1.1%)を含んでいた。この点突然変異は、PAM-SCANR実験においてT152Rおよび/またはK595Yと組み合わせて用いて多種多様のPAM認識が産生されたが、それ自体では、そのアッセイを用いて相対的に少ないPAMに結合した。将来的に、単独よりむしろ二重突然変異を用いてHEK293T細胞においてインデルを産生することが優れた選択であり得る。他の2つの点突然変異と同様に、あり得る256個の4ヌクレオチドPAMのうちの28個のみが試験され(11%)、この突然変異体が、ここで試験されていないPAMまたは標的を認識し得る可能性がある。
HEK293TインデルおよびPAM-SCANR結合の間の相関
T152RおよびK595Yに関して、観察された最大インデルパーセンテージおよびPAM-SCANRスコアの間で相関が観察された(図22A~22B)。図22A~22Bは、インデル%(最大)および正規化された細菌PAM-SCANRスコアの間の線形相関を、LbCas12a-T152R(図22A)およびLbCas12a-K595Y(図22B)について示す。
T152RおよびK595Yに関して、観察された最大インデルパーセンテージおよびPAM-SCANRスコアの間で相関が観察された(図22A~22B)。図22A~22Bは、インデル%(最大)および正規化された細菌PAM-SCANRスコアの間の線形相関を、LbCas12a-T152R(図22A)およびLbCas12a-K595Y(図22B)について示す。
とりわけ、試験された1.5よりも上のPAM-SCANRスコアを有する任意の点突然変異は、293T細胞において、5%よりも高い割合でインデルを産生した。このことは、(本発明者らの厳密な1.67カットオフよりむしろ)1.5よりも上の正規化されたスコアを有する、PAM-SCANR実験において試験された任意の突然変異が、大部分の真核生物適用に有用な割合でインデルを産生することができる可能性があることを示唆している。
前述したものは本発明の例示であり、その限定と解釈すべきでない。本発明は以下の特許請求の範囲によって定義され、その等価物は本明細書中に含まれる。
Claims (60)
- 改変されたLachnospiraceae bacterium CRISPR(Clustered Regularly Interspaced Short Palindromic Repeats)Cas12a(LbCas12a)ポリペプチドであって、
前記改変されたLbCas12aポリペプチドは、配列番号1(LbCas12a)のアミノ酸配列と少なくとも80%同一性および配列番号1の位置ナンバリングに関して以下の位置:K116、K120、K121、D122、E125、T148、T149、T152、D156、E159、Q529、D535、K538、D541、Y542、L585、K591、M592、K595、V596、S599、K600、K601、Y616、Y646、W649の1つ以上における突然変異を有するアミノ酸配列を含み、配列番号1の位置ナンバリングに関して以下の位置:K116、K120、K121、D122、E125、T152、D156、E159、G532、D535、K538、D541、および/またはK595の1つ以上における突然変異であってもよい、
改変されたLbCas12aポリペプチド。 - 前記改変されたLbCas12aポリペプチドが、配列番号1の位置ナンバリングに関して、K116R、K116N、K120R、K120H、K120N、K120T、K120Y、K120Q、K121S、K121T、K121H、K121R、K121G、K121D、K121Q、D122R、D122K、D122H、D122E、D122N、E125R、E125K、E125Q、E125Y、T148H、T148S、T148A、T148C、T149A、T149C、T149S、T149G、T149H、T149P、T149F、T149N、T149D、T149V、T152R、T152K、T152W、T152Y、T152H、T152Q、T152E、T152L、T152F、D156R、D156K、D156Y、D156W、D156Q、D156H、D156I、D156V、D156L、D156E、E159K、E159R、E159H、E159Y、E159Q、Q529N、Q529T、Q529H、Q529A、Q529F、Q529G、Q529G、Q529S、Q529P、Q529W、Q529D、G532D、G532N、G532S、G532H、G532F、G532K、G532R、G532Q、G532A、G532L、G532C、D535N、D535H、D535V、D535T、D535、S D535A、D535W、D535K、K538R K538V、K538Q、K538W、K538Y、K538F、K538H、K538L、K538M、K538C、K538G、K538A、K538P、D541N、D541H、D541R、D541K、D541Y、D541I、D541A、D541S、D541E、Y542R、Y542K、Y542H、Y542Q、Y542F、Y542L、Y542M、Y542P、Y542V、Y542N、Y542T、L585G、L585H、L585F、K591W、K591F、K591Y、K591H、K591R、K591S、K591A、K591G、K591P、M592R、M592K、M592Q、M592E、M592A、K595R、K595Q、K595Y、K595L、K595W、K595H、K595E、K595S、K595D、K595M、V596T、V596H、V596G、V596A、S599G、S599H、S599N、S599D、K600R、K600H、K600G、K601R、K601H、K601Q、K601T、Y616K、Y616R、Y616E、Y616F、Y616H、Y646R、Y646E、Y646K、Y646H、Y646Q、Y646W、Y646N、W649H、W649K、W649Y、W649R、W649E、W649S、W649V、および/またはW649Tのアミノ酸突然変異の1つ以上を含み、配列番号1の位置ナンバリングに関してK116R、K116N、K120Y、K121S、K121R、D122H、D122N、E125K、T152R、T152K、T152Y、T152Q、T152E、T152F、D156R、D156W、D156Q、D156H、D156I、D156V、D156L、D156E、E159K、E159R、G532N、G532S、G532H、G532K、G532R、G532L、D535N、D535H、D535T、D535、S D535A、D535W、K538R K538V、K538Q、K538W、K538Y、K538F、K538H、K538L、K538M、K538C、K538G、K538A、D541E、K595R、K595Q、K595Y、K595W、K595H、K595S、および/またはK595Mのアミノ酸突然変異の1つ以上を含んでもよい、請求項1に記載の改変されたLbCas12aポリペプチド。
- 前記改変されたLbCas12aポリペプチドが、変更されたPAM(プロトスペーサー隣接モチーフ)特異性を有する、請求項1または2に記載の改変されたLbCas12aポリペプチド。
- ヌクレアーゼ活性部位(例えば、RuvCドメイン)内に突然変異をさらに含む、請求項1または2に記載の改変されたLbCas12aポリペプチド(例えば、deadLbCas12a、dLbCas12a)。
- 請求項1~4のいずれか一項に記載の改変されたLbCas12aポリペプチド、および、ペプチドリンカーであってもよいリンカーを含む、融合タンパク質。
- 前記ペプチドリンカーが前記改変されたLbCas12aポリペプチドのC末端および/またはN末端に連結される、請求項5に記載の融合タンパク質。
- 請求項1~4のいずれか一項に記載の改変されたLbCas12aポリペプチド、および目的ポリペプチドを含む、融合タンパク質。
- 前記目的ポリペプチドが、前記改変されたLbCas12aポリペプチドに連結される、請求項7に記載の融合タンパク質。
- 前記目的ポリペプチドが、前記改変されたLbCas12aポリペプチドのC末端および/またはN末端に連結される、請求項7または8に記載の融合タンパク質。
- 前記目的ポリペプチドが、前記改変されたLbCas12aポリペプチドに、ペプチドリンカーであってもよいリンカーを介して連結される、請求項7~9のいずれか一項に記載の融合タンパク質。
- 前記目的ポリペプチドが、デアミナーゼ(脱アミノ化)活性、ニッカーゼ活性、リコンビナーゼ活性、トランスポサーゼ活性、メチラーゼ活性、グリコシラーゼ(DNAグリコシラーゼ)活性、グリコシラーゼ阻害剤活性(例えば、ウラシル-DNAグリコシラーゼ阻害剤(UGI))、デメチラーゼ活性、転写活性化活性、転写抑制活性、転写終結因子(transcription release factor)活性、ヒストン修飾活性、ヌクレアーゼ活性、一本鎖RNA切断活性、二本鎖RNA切断活性、制限エンドヌクレアーゼ活性(例えば、Fok1)、核酸結合活性、メチルトランスフェラーゼ活性、DNA修復活性、DNA損傷活性、ジスムターゼ活性、アルキル化活性、脱プリン活性、酸化活性、ピリミジンダイマー形成活性、インテグラーゼ活性、トランスポサーゼ活性、ポリメラーゼ活性、リガーゼ活性、ヘリカーゼ活性、および/またはフォトリアーゼ活性を有する少なくとも1つのポリペプチドまたはタンパク質ドメインを含む、請求項7~9のいずれか一項に記載の融合タンパク質。
- 前記目的ポリペプチドが、デアミナーゼ活性を有する少なくとも1つのポリペプチドまたはタンパク質ドメインを含む、請求項7~11のいずれか一項に記載の融合タンパク質。
- デアミナーゼ活性を有する前記少なくとも1つのポリペプチドまたはタンパク質ドメインが、シトシンデアミナーゼドメインまたはアデニンデアミナーゼドメインである、請求項12に記載の融合タンパク質。
- 前記シトシンデアミナーゼドメインが、アポリポタンパク質B mRNA編集触媒ポリペプチド様(APOBEC)ドメインである、請求項13に記載の融合タンパク質。
- 前記アデニンデアミナーゼドメインが、TadA(tRNA特異的アデノシンデアミナーゼ)および/またはTadA*(進化したtRNA特異的アデノシンデアミナーゼ)である、請求項13に記載の融合タンパク質。
- 前記少なくとも1つのポリペプチドが、グリコシラーゼ阻害剤活性を有しており、前記少なくとも1つのポリペプチドは、ウラシル-DNAグリコシラーゼ阻害剤(UGI)であってもよい、請求項7~14のいずれか一項に記載の融合タンパク質。
- 請求項1~4のいずれか一項に記載の改変されたLbCas12aポリペプチド、または請求項5~16のいずれか一項に記載の融合タンパク質をコードする、ポリヌクレオチド。
- 前記改変されたLbCas12aポリペプチドをコードするポリヌクレオチドまたは前記融合タンパク質をコードするポリヌクレオチドが、プロモーターと作動可能に関連しており、前記プロモーターは、イントロンを含むプロモーター領域であってもよい、請求項17に記載のポリヌクレオチド。
- 前記ポリヌクレオチドが、生物における発現のためにコドン最適化されている、請求項17または18に記載のポリヌクレオチド。
- 前記生物が、動物、植物、菌類、古細菌、または細菌である、請求項17~19のいずれか一項に記載のポリヌクレオチド。
- 請求項1~4のいずれか一項に記載の改変されたLbCas12aポリペプチド、または請求項5~16のいずれか一項に記載の融合タンパク質、およびガイド核酸(例えば、CRISPR RNA、CRISPR DNA、crRNA、crDNA)を含む、複合体。
- 請求項21に記載の複合体をコードする、核酸構築物。
- (a)請求項1~4のいずれか一項に記載の改変されたLbCas12aポリペプチド、または請求項5~16のいずれか一項に記載の融合タンパク質、および(b)ガイド核酸を含む、組成物。
- 請求項17~20のいずれか一項に記載のポリヌクレオチド、または請求項22に記載の核酸構築物を含む、発現カセットまたはベクター。
- V型Clustered Regularly Interspaced Short Palindromic Repeats(CRISPR)関連(Cas)(CRISPR-Cas)システムであって、
以下を含み:
(a)以下を含む融合タンパク質:(i)請求項1~4のいずれか一項に記載の改変されたLbCas12aポリペプチドまたは請求項1~4のいずれか一項に記載の改変されたLbCas12aポリペプチドをコードする核酸、および(ii)目的ポリペプチドまたは前記目的ポリペプチドをコードする核酸;および
(b)スペーサー配列とリピート配列とを含むガイド核酸(CRISPR RNA、CRISPR DNA、crRNA、crDNA)、
ここで前記ガイド核酸は、前記改変されたLbCas12aポリペプチドまたは前記融合タンパク質と複合体を形成することが可能であり、前記スペーサー配列は、標的核酸にハイブリダイズすることが可能であり、それにより、前記改変されたLbCas12aポリペプチドおよび前記目的ポリペプチドを前記標的核酸にガイドし、それにより、前記標的核酸が改変(例えば切断または編集)または調整(例えば転写調整)される、
システム。 - 前記改変されたLbCas12aポリペプチドが、ヌクレアーゼ活性部位(例えば、RuvCドメイン)内に突然変異を含む(例えば、deadCas12a、dCas12a)、請求項25に記載のシステム。
- 前記目的ポリペプチドが、前記改変されたLbCas12aポリペプチドのC末端および/またはN末端に連結される、請求項25または26に記載のシステム。
- 前記目的ポリペプチドが、前記改変されたLbCas12aポリペプチドのC末端および/またはN末端に、ペプチドリンカーであってもよいリンカーを介して連結される、請求項25~27のいずれか一項に記載のシステム。
- 前記目的ポリペプチドが、デアミナーゼ(脱アミノ化)活性、ニッカーゼ活性、リコンビナーゼ活性、トランスポサーゼ活性、メチラーゼ活性、グリコシラーゼ(DNAグリコシラーゼ)活性、グリコシラーゼ阻害剤活性(例えば、ウラシル-DNAグリコシラーゼ阻害剤(UGI)).デメチラーゼ活性、転写活性化活性、転写抑制活性、転写終結因子(transcription release factor)活性、ヒストン修飾活性、ヌクレアーゼ活性、一本鎖RNA切断活性、二本鎖RNA切断活性、制限エンドヌクレアーゼ活性(例えば、Fok1)、核酸結合活性、メチルトランスフェラーゼ活性、DNA修復活性、DNA損傷活性、ジスムターゼ活性、アルキル化活性、脱プリン活性、酸化活性、ピリミジンダイマー形成活性、インテグラーゼ活性、トランスポサーゼ活性、ポリメラーゼ活性、リガーゼ活性、ヘリカーゼ活性、および/またはフォトリアーゼ活性を有する少なくとも1つのポリペプチドまたはタンパク質ドメインを含む、請求項25~28のいずれか一項に記載のシステム。
- 前記目的ポリペプチドが、デアミナーゼ活性を有する少なくとも1つのポリペプチドまたはタンパク質ドメインを含む、請求項25~29のいずれか一項に記載のシステム。
- デアミナーゼ活性を有する前記少なくとも1つのポリペプチドまたはタンパク質ドメインが、シトシンデアミナーゼドメインまたはアデニンデアミナーゼドメインである、請求項30に記載のシステム。
- 前記シトシンデアミナーゼドメインが、アポリポタンパク質B mRNA編集触媒ポリペプチド様(APOBEC)ドメインである、請求項31に記載のシステム。
- 前記アデニンデアミナーゼドメインが、TadA(tRNA特異的アデノシンデアミナーゼ)および/またはTadA*(進化したtRNA特異的アデノシンデアミナーゼ)である、請求項31に記載のシステム。
- 前記目的ポリペプチドが、ウラシル-DNAグリコシラーゼ阻害剤(UGI)を含む、請求項25~32のいずれか一項に記載のシステム。
- (a)および(b)の一方または両方が、1つまたは複数の発現カセットおよび/またはベクター内に含まれる、請求項25~34のいずれか一項に記載のシステム。
- 請求項17~20のいずれか一項に記載のポリヌクレオチド、請求項22に記載の核酸構築物、請求項24に記載の発現カセットまたはベクター、または請求項25~35のいずれか一項に記載のシステムを含む、細胞。
- 標的核酸を改変する方法であって、
前記標的核酸を、
(a)(i)請求項1~4のいずれか一項に記載の改変されたLbCas12aポリペプチド、または請求項5~16のいずれか一項に記載の融合タンパク質、および(ii)ガイド核酸(例えば、CRISPR RNA、CRISPR DNA、crRNA、crDNA);
(b)請求項21に記載の複合体およびガイド核酸;
(c)(i)請求項1~4のいずれか一項に記載の改変されたLbCas12aポリペプチド、または請求項5~16のいずれか一項に記載の融合タンパク質、および(ii)ガイド核酸を含む組成物;および/または
(d)請求項25~35のいずれか一項に記載のシステム
と接触させるステップを含み、それにより前記標的核酸を改変する、
方法。 - 標的核酸を改変する方法であって、
前記標的核酸を含む細胞または無細胞系を、
(a)(i)請求項17~20のいずれか一項に記載のポリヌクレオチド、またはそれを含む発現カセットまたはベクター、および(ii)ガイド核酸、またはそれを含む発現カセットまたはベクター;および/または
(b)請求項22に記載の核酸構築物、またはそれを含む発現カセットまたはベクター、
と接触させるステップを含み、それにより前記標的核酸を改変する、
方法。 - 標的核酸を編集する方法であって、
前記標的核酸を、
(a)(i)請求項7~16のいずれか一項に記載の融合タンパク質、および(a)(ii)ガイド核酸;
(b)請求項7~16のいずれか一項に記載の融合タンパク質、およびガイド核酸を含む、複合体;
(c)請求項7~16のいずれか一項に記載の融合タンパク質およびガイド核酸を含む、組成物;および/または、
(d)請求項25~35のいずれか一項に記載のシステム、
と接触させるステップを含み、それにより前記標的核酸を編集する、
方法。 - 標的核酸を編集する方法であって、
前記標的核酸を含む細胞または無細胞系を、
(a)(i)請求項7~16のいずれか一項に記載の融合タンパク質をコードするポリヌクレオチド、またはそれを含む発現カセットまたはベクター、および(a)(ii)ガイド核酸、またはそれを含む発現カセットまたはベクター;および/または
(b)請求項7~16のいずれか一項に記載の融合タンパク質およびガイド核酸を含む複合体をコードする、核酸構築物、またはそれを含む発現カセットまたはベクター;および/または
(c)請求項25~35のいずれか一項に記載のシステム、
と接触させるステップを含み、それにより前記標的核酸を編集する、
方法。 - プロトスペーサーの5’末にPAM認識部位を有するCRISPR-Casヌクレアーゼのプロトスペーサー隣接モチーフ(PAM)の要件/特異性を判定するための二本鎖核酸分子を含むランダム化DNAライブラリーを構築する方法であって、
前記方法は以下を含み:
以下のステップを含む2以上の二本鎖核酸分子を調製するステップ:
(a)前記2以上の二本鎖核酸分子のそれぞれのための非標的オリゴヌクレオチド(第1)鎖および標的オリゴヌクレオチド(第2)鎖を合成するステップ、
ここで、前記非標的オリゴヌクレオチド鎖は、5’から3’に、以下:
(i)約5~約15ヌクレオチドを有する第1の配列、
(ii)少なくとも4つのランダム化ヌクレオチドを有する第2の配列、
(iii)約16~約25ヌクレオチドを含むプロトスペーサー配列、および
(iv)約5~約20ヌクレオチドを有する第3の配列
を含み、
ここで(i)の約5~15ヌクレオチドを有する第1の配列は、(ii)の第2の配列の5’末にすぐ隣接しており、(ii)の第2の配列は(iii)のプロトスペーサー配列の5’末にすぐ隣接しており、前記プロトスペーサー配列は(iv)の第3の配列の5’末にすぐ隣接しており;前記標的オリゴヌクレオチド(第2)鎖は前記非標的オリゴヌクレオチド鎖と相補である;および
(b)前記非標的オリゴヌクレオチド鎖を前記相補の標的オリゴヌクレオチド鎖にアニーリングさせて二本鎖核酸分子を産生するステップ、
ここで、前記第1の配列は制限部位を(その5’末に)含み、前記第3の配列は制限部位を(その3’末に)含み、ここで、前記2以上の二本鎖核酸分子のそれぞれの前記第1の配列(i)、前記プロトスペーサー配列(iii)および前記第3の配列(iv)は同一であり、それにより、二本鎖核酸分子を含む前記ランダム化DNAライブラリーを構築する、
方法。 - プロトスペーサーの3’末にPAM認識部位を有するCRISPR-Casヌクレアーゼのプロトスペーサー隣接モチーフ(PAM)の要件/特異性を判定するための二本鎖核酸分子を含むランダム化DNAライブラリーを構築する方法であって、
前記方法は以下を含み:
以下のステップを含む2以上の二本鎖核酸分子を調製するステップ:
(a)前記2以上の二本鎖核酸分子のそれぞれのための非標的オリゴヌクレオチド(第1)鎖および標的オリゴヌクレオチド(第2)鎖を合成するステップ、
ここで、前記非標的オリゴヌクレオチド鎖は、5’から3’に、以下:
(i)約5~約20ヌクレオチドを有する第1の配列、
(ii)約16~約25ヌクレオチドを含むプロトスペーサー配列、
(iii)少なくとも4つのランダム化ヌクレオチドを有する第2の配列、および
(iv)約5~約15ヌクレオチドを有する第3の配列
を含み、
ここで(i)の約5~20ヌクレオチドを有する第1の配列は(ii)のプロトスペーサー配列の5’末にすぐ隣接しており、(iii)の第2の配列は(iii)のプロトスペーサー配列の3’末にすぐ隣接しており、(iv)の第3の配列は(iii)の第2の配列の3’末にすぐ隣接しており;前記標的オリゴヌクレオチド(第2)鎖は前記非標的オリゴヌクレオチド鎖に相補である;および
(b)前記非標的オリゴヌクレオチド鎖を前記相補の標的オリゴヌクレオチド鎖にアニーリングさせて二本鎖核酸分子を産生するステップ、
ここで、前記第1の配列(i)は制限部位を(その5’末に)含み、前記第3の配列(iv)は制限部位を(その3’末に)含み、ここで、前記2以上の二本鎖核酸分子のそれぞれの前記第1の配列(i)、前記プロトスペーサー配列(ii)および前記第3の配列(iv)は同一であり、それにより、二本鎖核酸分子を含む前記ランダム化DNAライブラリーを構築する、
方法。 - 前記二本鎖核酸分子をベクターにライゲーションして、前記ランダム化DNAライブラリーを含むベクターを生産するステップをさらに含む、請求項41または42に記載の方法。
- 前記ランダム化DNAライブラリーを増幅するステップをさらに含む、請求項41~43のいずれか一項に記載の方法。
- 増幅するステップが、前記ランダム化DNAライブラリーを含むベクターを1つまたは複数の細菌細胞内に導入するステップ、および、前記1つまたは複数の細菌細胞を培養するステップを含む、請求項44に記載の方法。
- 前記ランダム化DNAライブラリーを含むベクターを、前記1つまたは複数の細菌細胞から単離するステップをさらに含む、請求項45に記載の方法。
- 前記ベクターを線状化して前記ランダム化DNAライブラリーを提供するステップをさらに含む、請求項46に記載の方法。
- 前記線状化するステップが、前記ベクターを制限酵素と接触させるステップを含む、請求項47に記載の方法。
- 前記制限酵素がScaIまたはPfoIである、請求項48に記載の方法。
- 請求項41~49のいずれか一項に記載の方法によって生産される、ランダム化DNAライブラリー。
- プロトスペーサーの5’末にPAM認識部位を有するCRISPR-Casヌクレアーゼのプロトスペーサー隣接モチーフ(PAM)の要件/特異性を判定するためのランダム化DNAライブラリーが提供され得て、
前記ランダム化DNAライブラリーは、2以上の二本鎖核酸分子を含み、それぞれが以下を含む:
(a)非標的オリゴヌクレオチド(第1)鎖および標的オリゴヌクレオチド(第2)鎖、
ここで、前記非標的オリゴヌクレオチド鎖は、5’から3’に、以下を含む:
(i)約5~約15ヌクレオチド(例えば、約5、6、7、8、9、10、11、12、13、14、または15ヌクレオチド、およびその中の任意の範囲または値)を有する第1の配列、
(ii)少なくとも4つのランダム化ヌクレオチド(例えば、少なくとも4、5、6、7、8、9、10、またはそれよりも多く、およびその中の任意の範囲または値)を有する第2の配列、
(iii)約16~約25ヌクレオチド、例えば、約16、17、18、19、20、21、22、23、24、または25ヌクレオチドを含む、プロトスペーサー配列、および
(iv)約5~約20ヌクレオチド(例えば、約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20ヌクレオチド、およびその中の任意の範囲または値)を有する第3の配列、
ここで、(i)の約5~15ヌクレオチドを有する第1の配列は、(ii)の第2の配列の5’末にすぐ隣接しており、(ii)の第2の配列は(iii)のプロトスペーサー配列の5’末にすぐ隣接しており、前記プロトスペーサー配列は(iv)の第3の配列の5’末にすぐ隣接しており;前記標的オリゴヌクレオチド(第2)鎖は前記非標的オリゴヌクレオチド鎖に相補である;および
(b)前記非標的オリゴヌクレオチド鎖は、前記相補の標的オリゴヌクレオチド鎖にアニーリングして、二本鎖核酸分子を産生し、ここで前記第1の配列は制限部位を(その5’末に)含み、前記第3の配列は制限部位を(その3’末に)含み、ここで、前記2以上の二本鎖核酸分子のそれぞれの前記第1の配列(i)、前記プロトスペーサー配列(iii)および前記第3の配列(iv)は同一である。 - プロトスペーサーの3’末にPAM認識部位を有するCRISPR-Casヌクレアーゼのプロトスペーサー隣接モチーフ(PAM)の要件/特異性を判定するためのランダム化DNAライブラリーが提供され得て、
前記ランダム化DNAライブラリーは、2以上の二本鎖核酸分子を含み、それぞれが以下を含む:
(a)非標的オリゴヌクレオチド(第1)鎖および標的オリゴヌクレオチド(第2)鎖、
ここで、前記非標的オリゴヌクレオチド鎖は、5’から3’に、以下を含む:
(i)約5~約20ヌクレオチド(例えば、約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20ヌクレオチド、およびその中の任意の範囲または値)を有する第1の配列、
(ii)約16~約25ヌクレオチド、例えば、約16、17、18、19、20、21、22、23、24、または25ヌクレオチドを含む、プロトスペーサー配列、
(iii)少なくとも4つのランダム化ヌクレオチド(例えば、少なくとも4、5、6、7、8、9、10、またはそれよりも多く、およびその中の任意の範囲または値)を有する第2の配列、および
(iv)約5~約15ヌクレオチド(例えば、約5、6、7、8、9、10、11、12、13、14、15ヌクレオチド、およびその中の任意の範囲または値)を有する第3の配列、
ここで(i)の約5~20ヌクレオチドを有する第1の配列は(ii)のプロトスペーサー配列の5’末にすぐ隣接しており、(iii)の第2の配列は(iii)のプロトスペーサー配列の3’末にすぐ隣接しており、(iv)の第3の配列は(iii)の第2の配列の3’末にすぐ隣接しており;前記標的オリゴヌクレオチド(第2)鎖は前記非標的オリゴヌクレオチド鎖に相補である;および
(b)前記非標的オリゴヌクレオチド鎖は、前記相補の標的オリゴヌクレオチド鎖にアニーリングして、二本鎖核酸分子を産生し、ここで前記第1の配列は制限部位を(その5’末に)含み、前記第3の配列は制限部位を(その3’末に)含み、ここで、前記2以上の二本鎖核酸分子のそれぞれの前記第1の配列(i)、前記プロトスペーサー配列(ii)および前記第3の配列(iv)は同一である。 - CRISPR-Casヌクレアーゼのプロトスペーサー隣接モチーフ(PAM)特異性を判定する方法であって、
前記方法は、
前記CRISPR-Casヌクレアーゼを請求項51または52に記載のランダム化DNAライブラリーと接触させるステップ;および
前記ヌクレアーゼとの接触前(コントロール)および接触後に前記ランダム化DNAライブラリーの二本鎖核酸分子をシーケンシングするステップ、
を含み、
ここで、前記ヌクレアーゼとの接触前は前記ランダム化DNAライブラリー内に存在するが前記ヌクレアーゼとの接触後は前記ランダム化DNAライブラリー内に存在しない二本鎖核酸分子は、前記CRISPR-CasヌクレアーゼのPAM認識配列を特定し、それにより、前記CRISPR-Casヌクレアーゼの前記PAM特異性を判定する、
方法。 - 前記シーケンシングするステップが、次世代シーケンシングを含む、請求項53に記載の方法。
- 請求項17~20または22のいずれか一項に記載のポリヌクレオチド、および/または、それを含む発現カセットまたはベクターを含み、その使用のための説明書を含んでもよい、キット。
- CRISPR-Cas12aガイド核酸および/またはそれを含む発現カセットまたはベクターをさらに含む、請求項55に記載のキット。
- 前記ガイド核酸が、標的核酸配列と同一または相補の核酸配列を前記ガイド核酸の主鎖にクローニングするためのクローニング部位を含む、請求項56に記載のキット。
- 前記ポリヌクレオチドが1つまたは複数の核局在化シグナルをさらにコードしており、前記1つまたは複数の核局在化シグナルが前記CRISPR-Cas12aヌクレアーゼに融合されている、請求項55~57のいずれか一項に記載のキット。
- 前記ポリヌクレオチド、発現カセットまたはベクターが、1つまたは複数の選択可能マーカーをさらにコードする、請求項55~58のいずれか一項に記載のキット。
- 前記ポリヌクレオチドがmRNAであり、コードされるCRISPR-Cas12aヌクレアーゼ内に1つまたは複数のイントロンをコードする、請求項55~59のいずれか一項に記載のキット。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962916392P | 2019-10-17 | 2019-10-17 | |
US62/916,392 | 2019-10-17 | ||
PCT/US2020/055659 WO2021076682A1 (en) | 2019-10-17 | 2020-10-15 | Variants of cas12a nucleases and methods of making and use thereof |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022552409A true JP2022552409A (ja) | 2022-12-15 |
JPWO2021076682A5 JPWO2021076682A5 (ja) | 2023-10-17 |
Family
ID=75492833
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022523132A Pending JP2022552409A (ja) | 2019-10-17 | 2020-10-15 | Cas12aヌクレアーゼの変異体ならびにその作製方法および使用方法 |
Country Status (12)
Country | Link |
---|---|
US (3) | US11866745B2 (ja) |
EP (1) | EP4045643A4 (ja) |
JP (1) | JP2022552409A (ja) |
KR (1) | KR20220097408A (ja) |
CN (1) | CN114829595A (ja) |
AU (1) | AU2020366358A1 (ja) |
BR (1) | BR112022007125A2 (ja) |
CA (1) | CA3157707A1 (ja) |
CL (1) | CL2022000937A1 (ja) |
IL (1) | IL292117A (ja) |
MX (1) | MX2022004549A (ja) |
WO (1) | WO2021076682A1 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116042571A (zh) * | 2021-05-26 | 2023-05-02 | 武汉大学 | 一种Cas12a变体及其在基因编辑中的应用 |
CN114214348A (zh) * | 2021-11-16 | 2022-03-22 | 河南农业大学 | 应用于核酸检测的Crispr/LbCas12a突变体蛋白及其制备方法和应用 |
CN116254246A (zh) * | 2021-12-09 | 2023-06-13 | 北京干细胞与再生医学研究院 | 工程化cas12b效应蛋白及其使用方法 |
WO2023131870A2 (en) * | 2022-01-06 | 2023-07-13 | Twelve Bio Aps | Endonuclease variants and methods of use |
WO2023199198A1 (en) * | 2022-04-12 | 2023-10-19 | John Innes Centre | Compositions and methods for increasing genome editing efficiency |
WO2023232109A1 (zh) * | 2022-06-01 | 2023-12-07 | 中国科学院遗传与发育生物学研究所 | 新的crispr基因编辑系统 |
CN116286734B (zh) * | 2022-11-29 | 2024-04-02 | 武汉大学 | 野生型LbCas12a蛋白的突变体及SNP检测用途 |
CN116144631B (zh) * | 2023-01-17 | 2023-09-15 | 华中农业大学 | 耐热型核酸内切酶及其介导的基因编辑系统 |
CN116410955B (zh) * | 2023-03-10 | 2023-12-19 | 华中农业大学 | 两种新型核酸内切酶及其在核酸检测中的应用 |
CN116179512B (zh) * | 2023-03-16 | 2023-09-15 | 华中农业大学 | 靶标识别范围广的核酸内切酶及其应用 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9790490B2 (en) * | 2015-06-18 | 2017-10-17 | The Broad Institute Inc. | CRISPR enzymes and systems |
CN110382692A (zh) | 2016-04-19 | 2019-10-25 | 博德研究所 | 新型crispr酶以及系统 |
CA3059956A1 (en) * | 2017-04-21 | 2018-10-25 | The General Hospital Corporation | Variants of cpf1 (cas12a) with altered pam specificity |
WO2018213726A1 (en) | 2017-05-18 | 2018-11-22 | The Broad Institute, Inc. | Systems, methods, and compositions for targeted nucleic acid editing |
KR20200026804A (ko) * | 2017-05-18 | 2020-03-11 | 더 브로드 인스티튜트, 인코퍼레이티드 | 표적화된 핵산 편집을 위한 시스템, 방법 및 조성물 |
JP2019016859A (ja) | 2017-07-04 | 2019-01-31 | オリンパス株式会社 | 観察装置および観察方法 |
WO2019138052A1 (en) | 2018-01-11 | 2019-07-18 | Kws Saat Se | Optimized plant crispr/cpf1 systems |
-
2020
- 2020-10-15 CA CA3157707A patent/CA3157707A1/en active Pending
- 2020-10-15 CN CN202080087121.8A patent/CN114829595A/zh active Pending
- 2020-10-15 US US17/071,095 patent/US11866745B2/en active Active
- 2020-10-15 BR BR112022007125A patent/BR112022007125A2/pt unknown
- 2020-10-15 JP JP2022523132A patent/JP2022552409A/ja active Pending
- 2020-10-15 EP EP20875763.3A patent/EP4045643A4/en active Pending
- 2020-10-15 IL IL292117A patent/IL292117A/en unknown
- 2020-10-15 AU AU2020366358A patent/AU2020366358A1/en active Pending
- 2020-10-15 WO PCT/US2020/055659 patent/WO2021076682A1/en unknown
- 2020-10-15 MX MX2022004549A patent/MX2022004549A/es unknown
- 2020-10-15 KR KR1020227015955A patent/KR20220097408A/ko unknown
-
2022
- 2022-04-13 CL CL2022000937A patent/CL2022000937A1/es unknown
-
2023
- 2023-11-06 US US18/502,194 patent/US20240076640A1/en active Pending
- 2023-11-06 US US18/502,136 patent/US20240076639A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
US20240076639A1 (en) | 2024-03-07 |
KR20220097408A (ko) | 2022-07-07 |
US11866745B2 (en) | 2024-01-09 |
BR112022007125A2 (pt) | 2022-07-05 |
IL292117A (en) | 2022-06-01 |
MX2022004549A (es) | 2022-07-21 |
US20240076640A1 (en) | 2024-03-07 |
US20210115421A1 (en) | 2021-04-22 |
AU2020366358A1 (en) | 2022-04-28 |
EP4045643A4 (en) | 2023-11-08 |
CA3157707A1 (en) | 2021-04-22 |
WO2021076682A1 (en) | 2021-04-22 |
CN114829595A (zh) | 2022-07-29 |
CL2022000937A1 (es) | 2023-01-20 |
EP4045643A1 (en) | 2022-08-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11866745B2 (en) | Variants of CAS12A nucleases and methods of making and use thereof | |
US20210130827A1 (en) | Type v crispr-cas base editors and methods of use thereof | |
US11926834B2 (en) | Compositions and methods for RNA-encoded DNA-replacement of alleles | |
US11591607B2 (en) | Optimized CRISPR-Cas nucleases and base editors and methods of use thereof | |
US20210207113A1 (en) | Recruitment of dna polymerase for templated editing | |
US20220112473A1 (en) | Engineered proteins and methods of use thereof | |
US20210403898A1 (en) | Compositions, systems, and methods for base diversification | |
US20210238598A1 (en) | Compositions, systems, and methods for base diversification | |
US20230383271A1 (en) | Engineered proteins and methods of use thereof | |
US20230295646A1 (en) | Model editing systems and methods relating to the same |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231006 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20231006 |