JP2023121643A - Type ii crispr/cas9 genome editing system and the application thereof - Google Patents

Type ii crispr/cas9 genome editing system and the application thereof Download PDF

Info

Publication number
JP2023121643A
JP2023121643A JP2022025097A JP2022025097A JP2023121643A JP 2023121643 A JP2023121643 A JP 2023121643A JP 2022025097 A JP2022025097 A JP 2022025097A JP 2022025097 A JP2022025097 A JP 2022025097A JP 2023121643 A JP2023121643 A JP 2023121643A
Authority
JP
Japan
Prior art keywords
crispr
sequence
gene editing
seq
editing system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022025097A
Other languages
Japanese (ja)
Inventor
田瑞
Rui Tian
黄龍
Long Huang
謝紅嫺
Hongxian Xie
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhuhai Shu Tong Medical Technology Co Ltd
Original Assignee
Zhuhai Shu Tong Medical Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhuhai Shu Tong Medical Technology Co Ltd filed Critical Zhuhai Shu Tong Medical Technology Co Ltd
Priority to JP2022025097A priority Critical patent/JP2023121643A/en
Publication of JP2023121643A publication Critical patent/JP2023121643A/en
Pending legal-status Critical Current

Links

Landscapes

  • Enzymes And Modification Thereof (AREA)

Abstract

To provide a Type II CRISPR/Cas9 genome editing system.SOLUTION: Provided herein is a Type II CRISPR/Cas9 genome editing system derived from Faecalibaculum rodentium, comprising a Cas9 protein, an accessory protein, a CRISPR RNA and a trans-activated CRISPR RNA; where the Cas9 protein is a DNA endonuclease, and the Cas9 protein has a specific amino acid sequence, or an amino acid sequence with at least 80%, 85%, 90%, 95%, 98%, or 99% homology to the specific amino acid sequence.SELECTED DRAWING: None

Description

本発明は、Faecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムに関するものであり、遺伝子編集技術の分野に属する。 The present invention relates to a type II CRISPR/Cas9 gene editing system derived from Faecalibaculum rodentium and belongs to the field of gene editing technology.

遺伝子編集(gene editing)技術は、DNA配列の局在点を改造することを可能にし、例えば、第一世代の遺伝子編集ツールであるジンクフィンガーヌクレアーゼ(zinc finger nucleases、ZFNs)や、第二世代の遺伝子編集ツールである転写活性化因子様エフェクターヌクレアーゼ(transcription activator-like effector nucleases、TALEN)はいずれも標的ゲノムの改造に使用できるが、これらの方法は、設計が困難で、作りにくく、コストが高くかつ汎用性がよくない課題がある。
CRISPR(クラスター化され、規則的に間隔があいた短い回文構造の繰り返し、Clustered Regularly Interspaced Short Palindromic Repeat)/Cas(CRISPR関連タンパク質、CRISPR-associated protein)システムは、古細菌と細菌に由来する自然免疫システムであり、第3世代の遺伝子編集ツールである。従来の遺伝子編集ツール(タンパク質-DNA認識)とは異なり、この方法は、核酸塩基対の相補性の原理を利用して、標的DNA配列を認識し、Casエフェクタータンパク質(Cas effector protein)が部位特異的切断を実行するように誘導し、適用性が高く、設計が簡単で、コストが低く、効率も高いものである。Casタンパク質には、核酸認識、複合体の構造の安定化、DNAのホスホジエステル結合の加水分解などのさまざまな活動で役割を果たすさまざまな異なるエフェクタードメインが含まれる。その中で、化膿レンサ球菌に由来するII型CRISPR/Cas9システム(Streptococcus pyogene Cas,SpCas9)は、その高い切断効率により、現在、最も広く使用されているCRISPR/Casシステムになっている。このシステムは、標的ポリヌクレオチドにおけるプロトスペーサー隣接モチーフ(PAM)配列である「NGG」を認識して切断し、これにより、1つの平滑末端又は突出端を残し、遺伝子編集に影響を及ぼす。
膨大かつ多種多様なメタゲノムには、未培養または未発見の微生物が秘められており、未発見のCRISPR/Cas9システムが多数存在する可能性があり、そして、これらのシステムの、原核生物と真核生物および体外環境での活性を確認する必要がある。
2015年、Dr.Byoung-Chan Kimのチームは、実験室のマウスC57BL/6Jの糞便から新しい嫌気性菌株ALO17を分離し、原核生物の16SrRNA遺伝子の配列の系統発生解析(phylogenetic analysis)により、この菌株がHoldemanellabiformis DSM 3989T、Faecalicoccuspleomorphus ATCC 29734T、Faecalitaleacylindroides ATCC 27803T、およびAllobaculumstercoricanis DSM 13633Tと密接な親縁関係を有することを発見した(配列相同性は、それぞれ、87.4%、87.3%、86.9%、および86.9%である。)。多くの分類学的証拠に基づいて、この種はErysipelothricaceae科の新属と認定され、そしてFaecalibaculum rodentium gen.nov.,sp.nov.と命名された。これからの5年間、世界各国の科学者は、腸内微生物環境と高脂肪食、腸内微生物環境と腫瘍形成の2つの分野でこの菌株について研究してきたが、遺伝子編集の分野ではまだ報告されていない。
Gene editing technologies allow for the remodeling of DNA sequence locations, such as the first generation of gene editing tools zinc finger nucleases (ZFNs) and the second generation of gene editing tools, zinc finger nucleases (ZFNs). Gene-editing tools, transcription activator-like effector nucleases (TALENs), can all be used to modify target genomes, but these methods are difficult to design, difficult to produce, and costly. And there is a problem that versatility is not good.
The CRISPR (Clustered Regularly Interspaced Short Palindromic Repeat)/Cas (CRISPR-associated protein) system is an innate immune system derived from archaea and bacteria. It is a system and a third generation gene editing tool. Unlike conventional gene-editing tools (protein-DNA recognition), this method utilizes the principle of nucleobase pair complementarity to recognize target DNA sequences and Cas effector proteins are site-specific. It is highly adaptable, simple in design, low in cost and high in efficiency. Cas proteins contain a variety of different effector domains that play roles in a variety of activities such as nucleic acid recognition, structural stabilization of complexes, and hydrolysis of phosphodiester bonds in DNA. Among them, the type II CRISPR/Cas9 system (Streptococcus pyogene Cas, SpCas9) derived from Streptococcus pyogenes is currently the most widely used CRISPR/Cas system due to its high cleavage efficiency. This system recognizes and cleaves the protospacer adjacent motif (PAM) sequence "NGG" in the target polynucleotide, leaving a single blunt or sticky end, affecting gene editing.
The vast and diverse metagenome harbors uncultivated or undiscovered microbes, the potential for many undiscovered CRISPR/Cas9 systems, and the prokaryotic and eukaryotic evolution of these systems. It is necessary to confirm the activity in organisms and in vitro environments.
In 2015, Dr. Byoung-Chan Kim's team isolated a new anaerobic strain ALO17 from the feces of laboratory mice C57BL/6J, and by phylogenetic analysis of the sequence of the prokaryotic 16S rRNA gene, the strain was named Holdemanellabiformis DSM 3989T. , Faecalicoccus pleomorphus ATCC 29734T, Faecalitaleacylindroides ATCC 27803T, and Allobaculumstercoricanis DSM 13633T (sequence identities of 87.4%, 87.3% and 8%, respectively). 6.9%, and 86 .9%). Based on a large body of taxonomic evidence, this species has been assigned a new genus in the family Erysipelothricaceae, and Faecalibaculum rodentium gen. nov. , sp. nov. was named. Over the next five years, scientists around the world have studied this strain in two areas: gut microbiome and high-fat diet, gut microbiome and tumorigenesis, but nothing has yet been reported on gene editing. do not have.

本発明は、従来技術の不足を克服し、新しい理化学的性質を有し、NGTA及びNNTA(Nは、A、C、G又はTを表す)を含む複数の異なるPAM(protospacer adjacent motif、プロトスペーサー隣接モチーフ)配列を認識することができる、Faecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムを提供することを目的とする。
上記の目的を達成するために、本発明で採用される技術的手段は、
Faecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムであって、Cas9タンパク質、アクセサリータンパク質(accessory protein)、crRNA(即ち、CRISPR RNA)及びtracrRNA(即ち、トランス活性化型CRISPR RNA)を含み、Cas9タンパク質と、crRNAにtracrRNAが結合されてなるガイドRNAとのRNP複合体(即ち、リボ核タンパク質複合体)の形態で機能し、
前記Cas9タンパク質は、DNAのエンドヌクレアーゼであり、前記Cas9タンパク質は、配列番号1で示されるアミノ酸配列、又は配列番号1で示されるアミノ酸配列と少なくとも80%、85%、90%、95%、98%、又は99%の相同性をもつアミノ酸配列を有する。
前記Cas9タンパク質は、ヌクレアーゼドメインにより、PAM配列の上流でcrRNAと相補的な二本鎖DNAを切断し、前記ヌクレアーゼドメインが、HNH様ヌクレアーゼドメイン及び/又はRuvC様ヌクレアーゼドメインである。
いくつかの実施形態では、「リボ核タンパク質複合体」が、好ましくは、本発明における「FrCas9タンパク質複合体」である。
具体的なCas9タンパク質のいくつかの重要なアミノ酸位の変異状況について説明する。796番目のアミノ酸位のEがAに突然変異するとニッカーゼ(Nickase)ヌクレアーゼになり、902番目のアミノ酸位のNがAに突然変異するとニッカーゼヌクレアーゼになり、1010番目のアミノ酸位のHがAに突然変異するとニッカーゼヌクレアーゼになり、1013番目のアミノ酸位のDがAに突然変異するとニッカーゼヌクレアーゼになり、796番目のアミノ酸位のEと1013番目のアミノ酸位のDが同時にAに突然変異すると切断能力がないが結合能力が維持されるCas9ヌクレアーゼ(即ち、不活性型Cas9(dead Cas9))になる。
前記アクセサリータンパク質は、Cas1アクセサリータンパク質、Cas2アクセサリータンパク質及びCsn2アクセサリータンパク質を含み、
前記Cas1アクセサリータンパク質は、配列番号2で示されるアミノ酸配列、又は配列番号2で示されるアミノ酸配列と少なくとも80%、85%、90%、95%、98%、又は99%の相同性をもつアミノ酸配列を有し、
前記Cas2アクセサリータンパク質は、配列番号3で示されるアミノ酸配列、又は配列番号3で示されるアミノ酸配列と少なくとも80%、85%、90%、95%、98%、又は99%の相同性をもつアミノ酸配列を有し、
前記Csn2アクセサリータンパク質は、配列番号4で示されるアミノ酸配列、又は配列番号4で示されるアミノ酸配列と少なくとも80%、85%、90%、95%、98%、又は99%の相同性をもつアミノ酸配列を有する。
前記CRISPR RNAは、CRISPRアレイから転写されて生成され、前記CRISPR RNAは、配列番号5で示されるRNA配列、又は配列番号5で示される核酸配列と少なくとも80%、85%、90%、95%、98%、又は99%の相同性をもつRNA配列を有し、前記CRISPRアレイは、直接反複配列(direct repeat sequence)とスペーサー配列とを含み、前記直接反複配列が、配列番号6で示される核酸配列、又は配列番号6で示される核酸配列と少なくとも80%、85%、90%、95%、98%、又は99%の相同性をもつ核酸配列を有し、前記スペーサー配列が、配列番号7で示される核酸配列、又は配列番号7で示される核酸配列と少なくとも80%、85%、90%、95%、98%、又は99%の相同性をもつ核酸配列を有する。
前記トランス活性化型CRISPR RNAは、CRISPR RNAの直接反複配列と相補的な配列を含有し、前記トランス活性化型CRISPR RNAは、配列番号8で示される核酸配列、又は配列番号8で示される核酸配列と少なくとも70%、80%、85%、90%、95%、98%、又は99%の相同性をもつ核酸配列を有する。
crRNAにtracrRNAが結合されてなるガイドRNAの骨格は、crRNA 直接反複配列の7~24ntと、対応する長さのtracrRNA配列とで構成され、この二つの部分は、「GAAA」、「TGAA」、「AAAC」などのリンカーを介して融合されてsgRNA骨格を形成することができ、好ましくは、20ntの直接反複配列と71ntのtracrRNA配列とが「GAAA」を介して融合されて形成されるsgRNA骨格が配列番号9で示され、さらに、上記sgRNA骨格に基づく好ましいバリアントは、
crRNAの直接反複配列の最初の18~14ntとtracrRNAの最後の69~65ntがリンカー配列(「GAAA」など)を介して融合されて形成されるsgRNA骨格であり、それが、さらに、
(ア)sgRNA骨格の長さが91ntであり、18ntの直接反複配列と69ntのtracrRNAとを含み、配列番号10で示される骨格、
(イ)sgRNA骨格の長さが89ntであり、17ntの直接反複配列と68ntのtracrRNAとを含み、配列番号11で示される骨格、
(ウ)sgRNA骨格の長さが87ntであり、16ntの直接反複配列と67ntのtracrRNAとを含み、配列番号12で示される骨格、
(エ)sgRNA骨格の長さが85ntであり、15ntの直接反複配列と66ntのtracrRNAとを含み、配列番号13で示される骨格、
(オ)sgRNA骨格の長さが83ntであり、14ntの直接反複配列と65ntのtracrRNAとを含み、配列番号14で示される骨格、
からなる群より選ばれる骨格であり、
前記sgRNA骨格は、配列番号9~14のいずれか1つと少なくとも70%、80%、85%、90%、95%、98%又は99%の相同性をもつ核酸配列を有しても良い。
前記Faecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムは、生物学的プロセス(例えば、遺伝子編集)において、特異的なDNAを結合又は切断し、特異的なDNAを結合又は切断することは、ガイドRNAが特異的なDNAの標的部位に相補して対になることで認識することにより実現され、前記ガイドRNAと特異的なDNAの標的部位との対になる結合部分の長さの範囲は、14~30bp(好ましくは、20~23bp)であり、前記特異的なDNAは、原核生物又は真核生物のDNAである。
前記ガイドRNAと特異的なDNAの標的部位との対になる結合部分の長さは、21bp、22bp又は23bpであり、ここで、前記RNPタンパク質複合体は、プロトスペーサー隣接モチーフ(PAM)に近接する14bpの塩基のミスマッチに非常に敏感であり、前記14bpが、シード領域である。
前記DNAを結合又は切断する機能に必要なプロトスペーサー隣接モチーフ配列は、ガイドRNA/sgRNA認識配列の下流の5′-NNTA-3′である。
本発明は、さらに、DNAの編集又は結合、CRISPRの活性化又はCRISPRの干渉のためのCRISPR/Cas9遺伝子編集システムを提供し、前記CRISPR/Cas9遺伝子編集システムは、上記のII型CRISPR/Cas9遺伝子編集システムである。好ましくは、前記DNAが、原核生物又は真核生物のDNAである。好ましくは、前記II型CRISPR/Cas9遺伝子編集システムが、Faecalibaculum rodentiumに由来するものである。
別の態様では、本発明は、また、ニッカーゼ、不活性型Cas9、塩基エディター(Base Editor)又はプライムエディター(Prime Editor)の製造のためのCRISPR/Cas9遺伝子編集システムを提供し、前記CRISPR/Cas9遺伝子編集システムは、上記のII型CRISPR/Cas9遺伝子編集システムである。好ましくは、ニッカーゼ、不活性型Cas9、塩基エディター(Base Editor)又はプライムエディター(Prime Editor)を製造するプロセスは、原核生物又は真核生物内に行われる。
従来技術と比較して、本発明の有益な効果は以下の通りである。
(1)本発明は、バイオインフォマティクス解析を通じて、Faecalibaculum rodentiumにおけるII型CRSIPR/Cas9遺伝子編集システムを発見し、当該遺伝子編集システムは、原核生物又は真核生物の遺伝子の編集に適用でき、遺伝子編集ツールボックスに新たな選択肢を提供する。
(2)本発明により提供されるFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムは、新たな理化学的性質を有し、複数の異なるPAM配列を認識することができ、当該遺伝子編集システムにより認識されるPAMの具体的な配列が、ガイドRNA/sgRNA認識配列の下流の5′-NNTA-3′である。
(3)本発明により提供されるFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムは、同じDNAサイトでの切断効率が、最も常用されるSpCas9よりも高く、そしてオフターゲット率が最も常用されるSpCas9よりも低く、より安全で効果的な遺伝子編集ツールである。
(4)本発明により提供されるFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムは、当該遺伝子編集システムで認識されたPAMが、回文の特徴を有し、その標的部位は、ゲノム上に「背中合わせ」で分布して存在し、密度がSpCas9よりも高い。
(5)本発明により提供されるFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムは、高い可塑性を有し、塩基エディター(Base Editor)とプライムエディター(Prime Editor)に改造することができ、異なるシナリオで適用できる遺伝子編集ツールである。
The present invention overcomes the deficiencies of the prior art, has new physicochemical properties, and is capable of producing multiple different PAM (protospacer adjacent motifs) including NGTA and NNTA (N represents A, C, G or T). It is an object of the present invention to provide a type II CRISPR/Cas9 gene editing system from Faecalibaculum rodentium that is capable of recognizing Flanking Motif) sequences.
In order to achieve the above objects, the technical means adopted in the present invention are:
A type II CRISPR/Cas9 gene editing system from Faecalibaculum rodentium, comprising Cas9 protein, accessory protein, crRNA (i.e. CRISPR RNA) and tracrRNA (i.e. transactivating CRISPR RNA), wherein Cas9 functions in the form of an RNP complex (i.e., a ribonucleoprotein complex) of a protein and a guide RNA formed by binding tracrRNA to crRNA,
The Cas9 protein is a DNA endonuclease, and the Cas9 protein is the amino acid sequence shown in SEQ ID NO: 1, or at least 80%, 85%, 90%, 95%, 98% of the amino acid sequence shown in SEQ ID NO: 1 %, or 99% homology.
Said Cas9 protein cleaves double-stranded DNA complementary to crRNA upstream of the PAM sequence with a nuclease domain, said nuclease domain being an HNH-like nuclease domain and/or a RuvC-like nuclease domain.
In some embodiments, the "ribonucleoprotein complex" is preferably the "FrCas9 protein complex" in the present invention.
The mutational status of some key amino acid positions of specific Cas9 proteins is described. Mutation of E at amino acid position 796 to A results in a Nickase nuclease, mutation of N at amino acid position 902 to A results in a Nickase nuclease, H at amino acid position 1010 to A. Mutation results in a nickase nuclease, mutation of D at amino acid position 1013 to A results in nickase nuclease, and mutation of E at amino acid position 796 and D at amino acid position 1013 to A at the same time. It results in a Cas9 nuclease that is incapable of cleaving but retains binding ability (ie, inactive Cas9 (dead Cas9)).
The accessory proteins include Cas1 accessory protein, Cas2 accessory protein and Csn2 accessory protein,
The Cas1 accessory protein is the amino acid sequence set forth in SEQ ID NO: 2, or an amino acid having at least 80%, 85%, 90%, 95%, 98%, or 99% homology with the amino acid sequence set forth in SEQ ID NO: 2 has an array,
The Cas2 accessory protein is the amino acid sequence set forth in SEQ ID NO: 3, or an amino acid having at least 80%, 85%, 90%, 95%, 98%, or 99% homology with the amino acid sequence set forth in SEQ ID NO: 3 has an array,
The Csn2 accessory protein is the amino acid sequence set forth in SEQ ID NO: 4 or an amino acid having at least 80%, 85%, 90%, 95%, 98%, or 99% homology with the amino acid sequence set forth in SEQ ID NO: 4 has an array.
The CRISPR RNA is generated by transcription from a CRISPR array, and the CRISPR RNA is at least 80%, 85%, 90%, 95% of the RNA sequence set forth in SEQ ID NO:5 or the nucleic acid sequence set forth in SEQ ID NO:5. , 98% or 99% homology, wherein the CRISPR array comprises a direct repeat sequence and a spacer sequence, wherein the direct repeat sequence is shown in SEQ ID NO: 6 a nucleic acid sequence or a nucleic acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% homology to the nucleic acid sequence set forth in SEQ ID NO: 6, wherein the spacer sequence comprises SEQ ID NO: 7 or a nucleic acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% homology with the nucleic acid sequence shown in SEQ ID NO:7.
The transactivating CRISPR RNA contains a sequence complementary to a direct repeat sequence of CRISPR RNA, and the transactivating CRISPR RNA is the nucleic acid sequence shown in SEQ ID NO: 8, or the nucleic acid shown in SEQ ID NO: 8 Have a nucleic acid sequence that is at least 70%, 80%, 85%, 90%, 95%, 98%, or 99% homologous to the sequence.
The backbone of the guide RNA, which is crRNA bound to tracrRNA, is composed of 7-24 nt of the crRNA direct repeat sequence and the corresponding length of the tracrRNA sequence, and these two parts are designated as "GAAA", "TGAA", can be fused via a linker such as "AAAC" to form an sgRNA backbone, preferably a sgRNA backbone formed by fusing a 20 nt direct repeat sequence and a 71 nt tracrRNA sequence via a "GAAA" is shown in SEQ ID NO: 9, and further preferred variants based on the sgRNA backbone are:
an sgRNA backbone formed by fusing the first 18-14 nt of the direct repeat sequence of the crRNA and the last 69-65 nt of the tracrRNA through a linker sequence (such as "GAAA"), which further comprises
(a) a backbone represented by SEQ ID NO: 10, which has a length of 91 nt and contains a direct repeat sequence of 18 nt and a tracrRNA of 69 nt;
(b) an sgRNA backbone having a length of 89 nt, containing a direct repeat sequence of 17 nt and a tracrRNA of 68 nt, and represented by SEQ ID NO: 11;
(c) an sgRNA backbone of 87 nt in length, containing a 16 nt direct repeat sequence and 67 nt of tracrRNA, and represented by SEQ ID NO: 12;
(d) an sgRNA backbone having a length of 85 nt, containing a direct repeat sequence of 15 nt and a tracrRNA of 66 nt, and represented by SEQ ID NO: 13;
(e) a backbone represented by SEQ ID NO: 14, which has a length of 83 nt and contains a direct repeat sequence of 14 nt and a tracrRNA of 65 nt;
A skeleton selected from the group consisting of
The sgRNA backbone may have a nucleic acid sequence with at least 70%, 80%, 85%, 90%, 95%, 98% or 99% homology to any one of SEQ ID NOs:9-14.
The type II CRISPR/Cas9 gene editing system from Faecalibaculum rodentium binds or cleaves specific DNA in a biological process (e.g., gene editing). The range of the length of the binding portion that is realized by recognizing the guide RNA by complementing and pairing with the target site of the specific DNA, and the pairing portion of the guide RNA and the target site of the specific DNA is , 14-30 bp (preferably 20-23 bp), and the specific DNA is prokaryotic or eukaryotic DNA.
The length of the paired binding portion of the guide RNA and the specific DNA target site is 21 bp, 22 bp or 23 bp, wherein the RNP protein complex is adjacent to a protospacer adjacent motif (PAM). It is very sensitive to 14 bp base mismatches, said 14 bp being the seed region.
The protospacer-adjacent motif sequence required for the DNA binding or cleaving function is 5'-NNTA-3' downstream of the guide RNA/sgRNA recognition sequence.
The present invention further provides a CRISPR/Cas9 gene editing system for editing or joining DNA, activating CRISPR or interfering with CRISPR, wherein the CRISPR/Cas9 gene editing system comprises the type II CRISPR/Cas9 gene Editing system. Preferably, said DNA is prokaryotic or eukaryotic DNA. Preferably, said type II CRISPR/Cas9 gene editing system is derived from Faecalibaculum rodentium.
In another aspect, the present invention also provides a CRISPR/Cas9 gene editing system for the production of Nickase, Inactive Cas9, Base Editor or Prime Editor, wherein said CRISPR/Cas9 The gene editing system is the Type II CRISPR/Cas9 gene editing system described above. Preferably, the process of producing the nickase, inactive Cas9, Base Editor or Prime Editor is performed in a prokaryote or eukaryote.
The beneficial effects of the present invention compared with the prior art are as follows.
(1) The present invention discovers a type II CRSIPR/Cas9 gene editing system in Faecalibaculum rodentium through bioinformatics analysis, and the gene editing system can be applied to edit prokaryotic or eukaryotic genes, gene editing tools Offer new options in the box.
(2) The type II CRISPR / Cas9 gene editing system derived from Faecalibaculum rodentium provided by the present invention has new physicochemical properties, can recognize a plurality of different PAM sequences, and the gene editing system A specific sequence of PAM that is recognized is 5'-NNTA-3' downstream of the guide RNA/sgRNA recognition sequence.
(3) The type II CRISPR / Cas9 gene editing system derived from Faecalibaculum rodentium provided by the present invention has a higher cutting efficiency at the same DNA site than the most commonly used SpCas9, and the most commonly used off-target rate It is a safer and more effective gene-editing tool than SpCas9.
(4) In the type II CRISPR / Cas9 gene editing system derived from Faecalibaculum rodentium provided by the present invention, the PAM recognized by the gene editing system has palindrome characteristics, and the target site is on the genome distributed "back-to-back" in , with a higher density than SpCas9.
(5) The type II CRISPR/Cas9 gene editing system derived from Faecalibaculum rodentium provided by the present invention has high flexibility and can be remodeled into a base editor (Base Editor) and a prime editor (Prime Editor), It is a gene editing tool that can be applied in different scenarios.

本発明に記載のFaecalibaculum rodentiumのII型CRISPR/Cas9遺伝子編集システムの構成図である。1 is a schematic diagram of the type II CRISPR/Cas9 gene editing system of Faecalibaculum rodentium according to the present invention. FIG. 本発明に記載のFaecalibaculum rodentiumのII型CRISPR/Cas9遺伝子編集システムのCas9タンパク質の構造模式図である。Fig. 2 is a structural schematic diagram of the Cas9 protein of the type II CRISPR/Cas9 gene editing system of Faecalibaculum rodentium according to the present invention; 本発明に記載のFaecalibaculum rodentiumのII型CRISPR/Cas9遺伝子編集システムが認識するガイドRNA分子のRNA二次構造の予測図、及び最適なsgRNA骨格の模式図である。図3Aは、95ntのgRNAの全長を示す図である。図3Bは、骨格長さが91ntであり、18ntの直接反復配列+69ntのtracrRNAであるgRNAを示す図である。図3Cは、骨格長さが89ntであり、17ntの直接反復配列+68ntのtracrRNAであるsgRNAを示す図である。図3Dは、骨格長さが87ntであり、16ntの直接反復配列+67ntのtracrRNAであるgRNAを示す図である。図3Eは、骨格長さが85ntであり、15ntの直接反復配列+66ntのtracrRNAであるsgRNAを示す図である。図3Fは、骨格長さが83ntであり、14ntの直接反復配列+65ntのtracrRNAであるsgRNAを示す図である。FIG. 2 is a schematic diagram of an optimal sgRNA backbone and a predicted RNA secondary structure of a guide RNA molecule recognized by the Faecalibaculum rodentium type II CRISPR/Cas9 gene editing system according to the present invention. FIG. 3A shows the full length of the 95nt gRNA. FIG. 3B shows a gRNA with a backbone length of 91 nt, 18 nt direct repeat plus 69 nt tracrRNA. FIG. 3C shows an sgRNA with a backbone length of 89 nt, 17 nt direct repeat plus 68 nt tracrRNA. FIG. 3D shows a gRNA with a backbone length of 87 nt, 16 nt direct repeat plus 67 nt tracrRNA. FIG. 3E shows an sgRNA with a backbone length of 85 nt, 15 nt direct repeat plus 66 nt tracrRNA. FIG. 3F shows an sgRNA with a backbone length of 83 nt, 14 nt direct repeat plus 65 nt tracrRNA. 本発明に記載のFaecalibaculum rodentiumのII型CRISPR/Cas9遺伝子編集システムの原核PAM配列の模式図である。FIG. 2 is a schematic representation of the prokaryotic PAM sequence of the Faecalibaculum rodentium type II CRISPR/Cas9 gene editing system according to the invention. 本発明に記載のFaecalibaculum rodentiumのII型CRISPR/Cas9遺伝子編集システムの原核干渉実験の模式図である。FIG. 2 is a schematic diagram of a prokaryotic interference experiment of the Faecalibaculum rodentium type II CRISPR/Cas9 gene editing system according to the present invention. 本発明に記載のFaecalibaculum rodentiumのII型CRISPR/Cas9遺伝子編集システムの真核切断の模式図である。図6Aは、ODN-PCRゲル電気泳動像である。図6Bは、サンガーシークエンシングによるピーク図である。FIG. 2 is a schematic representation of eukaryotic cleavage of the Faecalibaculum rodentium type II CRISPR/Cas9 gene editing system according to the present invention. FIG. 6A is an ODN-PCR gel electropherogram. FIG. 6B is a peak diagram from Sanger sequencing. 本発明に記載のFaecalibaculum rodentiumのII型CRISPR/Cas9遺伝子編集システムのsgRNAの最適長さの模式図である。図7Aは、HEK293 SITE2-T2部位での異なるsgRNA長さの切断効率を示す図である。図7Bは、DNMT1-T3部位での異なるsgRNA長さの切断効率を示す図である。図7Cは、RNF2-T6部位での異なるsgRNA長さの切断効率を示す図である。FIG. 2 is a schematic diagram of the optimal length of sgRNA for the Faecalibaculum rodentium type II CRISPR/Cas9 gene editing system according to the present invention. FIG. 7A shows cleavage efficiency of different sgRNA lengths at the HEK293 SITE2-T2 site. Figure 7B shows the cleavage efficiency of different sgRNA lengths at the DNMT1-T3 site. FIG. 7C shows the cleavage efficiency of different sgRNA lengths at the RNF2-T6 site. 本発明に記載のFaecalibaculum rodentiumのII型CRISPR/Cas9遺伝子編集システムのsgRNAの認識配列の最適長さを示す図である。Fig. 2 shows the optimal length of the recognition sequence of sgRNA of the Faecalibaculum rodentium type II CRISPR/Cas9 gene editing system according to the present invention. 本発明に記載のFaecalibaculum rodentiumのII型CRISPR/Cas9遺伝子編集システムのGUIDE-seqでのターゲット効率及びオフターゲットとSpCas9のGUIDE-seqでのターゲット効率及びオフターゲットとの比較を示す模式図である。FIG. 3 is a schematic diagram showing a comparison of the target efficiency and off-target in GUIDE-seq of the Faecalibaculum rodentium type II CRISPR/Cas9 gene editing system according to the present invention and the target efficiency and off-target in SpCas9 in GUIDE-seq. FrCas9-BE塩基エディターの実験結果図である。ここで、図10Aは、ODNブレークポイントPCRによりFrCas9ニッカーゼの形態を確認する原理図と結果である。図10Bは、nFrCas9-BE4Gramの編集ウィンドウである。図10Cは、nFrCas9-ABE7.10の編集ウィンドウである。図10Dは、ClinVarデータベースにおけるSpCas9とFrCas9塩基エディターで修正できる唯一の病原性突然変異のベン図である。図10Eは、2本の「背中合わせ」sgRNAを同時に使用するFrCas9-BE4GamのC>Tの編集効率を示す図である。FrCas9-BE base editor experimental results. Here, FIG. 10A is a principle diagram and results for confirming the form of FrCas9 nickase by ODN breakpoint PCR. FIG. 10B is the edit window of nFrCas9-BE4Gram. FIG. 10C is the edit window of nFrCas9-ABE7.10. FIG. 10D is a Venn diagram of the unique pathogenic mutations that can be corrected with the SpCas9 and FrCas9 base editors in the ClinVar database. FIG. 10E shows C>T editing efficiency of FrCas9-BE4Gam using two “back-to-back” sgRNAs simultaneously. ヒトゲノムでのFrCas9とSpCas9の標的部位の分布図である。ここで、図11Aは、GRCh38ヒトゲノム中の5′-GG-3′(SpCas9 PAMを表す)の分布を示す図である。図11Bは、GRCh38ヒトゲノム中の5′-TA-3′(FrCas9 PAMを表す)の分布を示す図である。FIG. 2 is a distribution map of target sites of FrCas9 and SpCas9 in the human genome. Here, Figure 11A shows the distribution of 5'-GG-3' (representing SpCas9 PAM) in the GRCh38 human genome. Figure 11B shows the distribution of 5'-TA-3' (representing FrCas9 PAM) in the GRCh38 human genome. FrCas9が特異的にTATAボックスを標的とすることのCRISPR干渉とCRISPR活性化への応用を示す図である。ここで、図12Aは、FrCas9の標的であるABCA1遺伝子のTATAボックスの模式図である。図12Bは、TATAボックスを標的とすることにより、FrCas9とSpCas9でCRISPR干渉を行ったり、TATAボックスを標的とすることにより、FrCas9とSpCas9でCRISPR活性化を行ったりすることを示す図である。図12Cは、TATAボックスを標的とすることにより、FrCas9とSpCas9でCRISPR活性化を行うことを示す図である。FIG. 4 shows the application of FrCas9 specifically targeting the TATA box to CRISPR interference and CRISPR activation. Here, FIG. 12A is a schematic diagram of the TATA box of the ABCA1 gene, which is the target of FrCas9. FIG. 12B shows CRISPR interference in FrCas9 and SpCas9 by targeting the TATA box and CRISPR activation in FrCas9 and SpCas9 by targeting the TATA box. FIG. 12C shows CRISPR activation in FrCas9 and SpCas9 by targeting the TATA box. プライム編集の遺伝子編集システムの模式図である。Schematic diagram of a gene editing system for prime editing. サンガーシークエンシングによるFrCas9-PE プライム編集システムの遺伝子編集作用の検証を示す図である。測定されたシーケンスは、CGAACACCTCAGGTAAT(配列番号33)である。FIG. 4 shows validation of the gene-editing action of the FrCas9-PE prime editing system by Sanger sequencing. The measured sequence is CGAACACCTCAGGTAAT (SEQ ID NO:33).

本発明の目的、技術案および利点をよりよく説明するために、以下、具体的な実施例に基づいて本発明をさらに説明する。
Faecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムは、Cas9タンパク質、アクセサリータンパク質、CRISPR RNA及びトランス活性化型CRISPR RNAを含み、図1に示すように、前記Cas9タンパク質は、DNAのエンドヌクレアーゼであり、前記Cas9タンパク質が、配列番号1で示されるアミノ酸配列、又は配列番号1で示されるアミノ酸配列と少なくとも80%、85%、90%、95%、98%、又は99%の相同性をもつアミノ酸配列を有する。
図2に示すように、本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムの好ましい実施形態として、前記Cas9タンパク質は、様々なヌクレアーゼドメインにより、PAM配列の上流でcrRNAと相補的な二本鎖DNAを切断し、前記様々なヌクレアーゼドメインは、HNH様ヌクレアーゼドメイン又はRuvC様ヌクレアーゼドメインである。
本発明に記載のCas9タンパク質(Faecalibaculum rodentium Cas9)は、単にFrCas9タンパク質ということもあり、1372個のアミノ酸(配列番号1)を含み、多ドメインかつ多機能のDNAのエンドヌクレアーゼである。上記Cas9タンパク質は、様々なヌクレアーゼドメインによりPAMの上流でsgRNAと相補的な二本鎖DNAを効率的に切断する。例えば、HNH様ヌクレアーゼドメインによりsgRNA配列と相補的なDNA鎖を切断したり、RuvC様ヌクレアーゼドメインにより非相補的なDNA鎖を切断したりする。ここで、796番目のアミノ酸位のEがAに突然変異するとニッカーゼヌクレアーゼになり、902番目のアミノ酸位のNがAに突然変異するとニッカーゼヌクレアーゼになり、1010番目のアミノ酸位のHがAに突然変異するとニッカーゼヌクレアーゼになり、1013番目のアミノ酸位のDがAに突然変異するとニッカーゼヌクレアーゼになり、796番目のアミノ酸位のEと1013番目のアミノ酸位のDが同時にAに突然変異すると切断能力がないが結合能力が維持されるCas9ヌクレアーゼになる。
本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムの好ましい実施形態として、前記アクセサリータンパク質は、Cas1アクセサリータンパク質、Cas2アクセサリータンパク質及びCsn2アクセサリータンパク質を含み、前記Cas1アクセサリータンパク質が、配列番号2で示されるアミノ酸配列、又は配列番号2で示されるアミノ酸配列と少なくとも80%、85%、90%、95%、98%、又は99%の相同性をもつアミノ酸配列を有し、前記Cas2アクセサリータンパク質が、配列番号3で示されるアミノ酸配列、又は配列番号3で示されるアミノ酸配列と少なくとも80%、85%、90%、95%、98%、又は99%の相同性をもつアミノ酸配列を有し、前記Csn2アクセサリータンパク質が、配列番号4で示されるアミノ酸配列、又は配列番号4で示されるアミノ酸配列と少なくとも80%、85%、90%、95%、98%、又は99%の相同性をもつアミノ酸配列を有する。
本発明に記載のアクセサリータンパク質Cas1、Cas2、Csn2は外来遺伝子の捕捉、及びcrRNAの成熟に関与する。
本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムの好ましい実施形態として、前記CRISPR RNAは、CRISPRアレイから転写されて生成され、前記CRISPR RNAが、配列番号5で示されるRNA配列を有し、前記CRISPRアレイが、直接反複配列とスペーサー配列とを含み、前記直接反複配列が、配列番号6で示され、前記スペーサー配列が、配列番号7で示される。
本発明に記載のCRISPR RNA(crRNA)は、塩基対の相補性を利用し、Casタンパク質を誘導して侵入した外来ゲノムを認識する。細菌は、バクテリオファージやウイルスなどに暴露されている時、外来DNAの短い断片が新しいスペーサーとして宿主の染色体内のCRISPR反復スペーサー配列の間に組み込まれることにより、感染の遺伝的記録を提供し、生体に外来遺伝子が再侵入した時、crRNA前駆体(pre-crRNA)は、CRISPRアレイから転写されて生成され、その5′末端に外部から侵入した遺伝子の配列と相補し、長さが30bpであるスペーサー配列を、3′末端に長さが36bpである反複配列を持っている。
本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムの好ましい実施形態として、前記トランス活性化型CRISPR RNAは、CRISPR RNA直接反複配列と相補する配列を含有し、前記トランス活性化型CRISPR RNAが、配列番号8で示される。
本発明に記載のトランス活性化型crRNA(tracrRNA)は、タンパク質をコードしないRNAであり、crRNAの成熟およびsgRNAの形成に関与する。pre-crRNAは、tracrRNAおよびCas9ヌクレアーゼの作用でスペーサー配列の上流の0~16ntおよび反復配列の下流の12~29ntを切り取って、成熟したcrRNAを形成し、さらにtracrRNAと結合してtracrRNA-crRNA複合体を形成する。当該複合体は、長さが14~30bpであり、外来DNAの配列を認識する部分を含む。crRNAの下流とtracrRNAの上流との間に、「GAAA」、「TGAA」または「AAAC」配列のような4塩基のテトラループ(tetraloop)を追加することにより、tracrRNAとcrRNAを連結してsgRNAを形成することができる。このようなsgRNAは、上流の2つのバルジ(bulge)構造と3つの二重らせん(duplex)構造、および下流の1つのステムループ(stem loop)構造を含み、さらに、外来DNAの配列を認識する部分と骨格部分に分けることができる。
sgRNAの外来DNAの配列を認識する部分の長さとtracrRNAの長さを調整することにより、エンドヌクレアーゼの切断作用をさらに最適化することができる。本発明の先行実験から、sgRNAの外来DNAの配列を認識する部分の長さとしては、21bp、22bpまたは23bpが最適であり(図8)、骨格部分の最適な長さは、図3と図7に示すように、91nt(18ntのcrRNA直接反複配列+69ntのtracrRNA)、89nt(17ntのcrRNA直接反複配列+68ntのtracrRNA)、87nt(16ntのcrRNA直接反複配列+67ntのtracrRNA)、85nt(15ntのcrRNA直接反複配列+66ntのtracrRNA)、83nt(14ntのcrRNA直接反複配列+65ntのtracrRNA)の5種類であることが証明された。
本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムの好ましい実施形態としては、前記Faecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムは、生物学的プロセスでDNAを結合又は切断する。
本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムの好ましい実施形態としては、前記DNAが、原核生物又は真核生物のDNAである。
いくつかの実施例では、本発明のFrCas9は、複数種類の、標的配列の下流側に隣接するプロトスペーサー隣接モチーフ(PAM)を認識してDNA二本鎖分子の切断(DSB)を引き起こすことができる。FrCas9タンパク質が標的配列を認識するには、crRNAスペーサー配列と相補的なヌクレオチド、及び、相補する配列に隣接するプロトスペーサー隣接モチーフ(Protospacer Adjacent Motif、PAM)という二つの重要な要素が必要である。図4に示すように、枯渇実験により、FrCas9が原核系で切断作用を有することが明らかになり、この新たに発見されたII型CRISPR/Cas9システムで認識されるPAM配列の3、4位がTAであることが初歩的に検証された。さらに、図5に示すように、干渉実験により、FrCas9が認識した標的配列の下流のPAMが、5′-NNTA-3′であることが実証された。図6に示すように、上記のPAMは、いずれも真核に関する実験で検証された。crRNA中のスペーサー配列を人為的に設計することにより、このようなCRISPR-Cas9システムは、ゲノム中のほぼすべての関心のあるDNA配列を標的にすることができ、平滑末端を生成する部位特異的な二本鎖切断(DSB)を産生する。非相同性末端結合でDSBを修復することにより、切断部位に小さなランダム挿入/欠損(indels)が生じて目的遺伝子を不活性化させる。あるいは、高忠実度の相同組換え(homologous recombination)修復により、相同組換え修復テンプレートを用いてDSB部位で正確なゲノム修飾を行うことができる。
多くのヒトの遺伝病は、単塩基突然変異によるものであり、伝統的な方法では治療できない。塩基エディターは、正確な遺伝子編集を実現する最新かつ最も効果的な方法の一つである。その特徴としては、ニッキング(nicking)型のCRISPR-Casタンパク質により特定の標的DNAの位置を特定し、二本鎖DNAの切断を起こさずにDNAデアミナーゼを使用してこのような標的DNAを修飾および変異させ、病変塩基に対して修正を行う。いくつかの実施形態では、E796A nFrCas9と最適化された第四世代シチジン塩基エディターBE4Gamとを結合して、DNA中の塩基対C:GをT:Aに変異させるE796A nFrCas9-BEGamシトシン塩基エディター(CBE)を構築することができ、E796A nFrCas9と第七世代アデニン塩基エディターABE7.10とを結合して、塩基対A:TをG:Cに変異させるE796A nFrCas9-BABE7.10アデニン塩基エディター(ABE)を構築することができる。
いくつかの実施形態では、本発明のFrCas9の特異的なPAMは、NNTAであり、TATAボックス(真核生物プロモーターを構成する素子の一つ)に特異的な標的部位を有するため、FrCas9が特異的にTATAボックスを標的とすることで、独特のCRISPR干渉(CRISPRi)/CRISPR活性化(CRISPRa)の効果を発揮することができる。ここで、CRISPRiは、活性型のFrCas9を利用してTATAボックスを直接標的切断してTATAボックスを破壊するか、または切断活性を持たないdFrCas9(即ち、不活性型Cas9)をTATAボックスに直接結合させることにより実現されることができる。CRISPRaは、dFrCas9-VP64がTATAボックスサイトを標的とすることにより実現されることができるが、これらに限定されない。
プライム編集(Prime Editing、PE)は、まったく新しい正確な遺伝子編集ツールである。この技術は、単一塩基の自由な置換と複数の塩基の正確な挿入や欠失を実現し、遺伝子編集の過程でインデル(indels)によって生成される有害な副産物を大幅に低減し、編集精度を大幅に向上させることができ、遺伝子編集の著しい進歩であると広く考えられている。いくつかの実施形態では、本発明のFrCas9を逆転写酵素と融合させ、そのPAM配列に基づいて対応するpegRNAを設計して、FrCas9-PE遺伝子編集システムを構築することができる。具体的には、pegRNAの3′末端の配列には2つの配列が付加される。第1の配列は、プライマー結合部位(PBS)であって、切断された標的DNA鎖の末端に相補して、逆転写プロセスを開始させることができ、第2の配列は、逆転写テンプレート(RTテンプレート)であって、標的点変異または挿入欠失変異を有することにより正確な遺伝子編集を達成する。
本発明のさらなる目的は、原核生物または真核生物の遺伝子の編集、CRISPR活性化またはCRISPR干渉における上記Faecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムの使用を提供することである。
本発明に記載の使用の好ましい実施形態として、上記Faecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムは、DNAレベルでDNAを結合または切断するために使用される。
実施例1
本実施例では、本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムで認識されるガイドRNA分子のRNA二次構造を予測し、tracrRNAと反復配列から転写されたRNAとの結合過程を模擬することにより、両者の結合後のRNA構造を予測し、得られたRNA二次構造を図3に示す。
(1)材料:予測されたtracrRNAおよびrepeat配列、ならびに予測された抗反復(anti-repeat)配列。
(2)ソフトウェア:NUPACK(http://www.nupack.org/partition/new)
(3)予測方法:オンラインアプリであるNUPACKにより、それぞれ1μlの2種類のRNAの、37℃でインビトロでの相互作用プロセスを模擬し、得られたRNA組成物の二次構造を予測し、図2に示すようなRNA二次構造が得られた。
図3から分かるように、pre-crRNAは、tracrRNAおよびCas9ヌクレアーゼによってスペーサー配列の上流の0~16ntおよび反復配列の下流の12~29ntを切り取って、成熟したcrRNAを形成し、tracrRNAと融合させてtracrRNA-crRNA複合体を形成した。この複合体は、配列長さが14~30bpである、スペーサー配列と相補的な外来DNAの配列を含んだ。crRNAの下流とtracrRNAの上流との間に4塩基のテトラループを追加することで、それらを連結して、上流の2つのバルジ構造および3つの二重らせん構造と、下流の3つのステムループ構造とを含むsgRNAを形成することができる。
実施例2
本実施例では、本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムが原核系で認識するプロトスペーサー隣接モチーフ(PAM)が5′-NNTA-3′であることを見出した。
(1)材料:上記実施例により予測されたCRISPR/Cas9遺伝子編集システムに関連する遺伝子。
(2)検証方法:本実施例では、本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムについて原核生物検証システムを構築し、その切断効果を検証し、認識されるPAM配列を第2世代シーケンシング技術により予備探索し、その結果を図4に示す。
詳細な流れは以下の通りである。
(a)本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システム(エンドヌクレアーゼCas9、アクセサリータンパク質Cas1、Cas2、Csn2、CRISPRアレイ及びノンコーディング(non-coding)RNAであるtracrRNAを含む。)をpACYC184ベクターに挿入し、Cas9タンパク質について大腸菌コドン最適化を行い、CRISPRアレイに天然のスペーサー配列およびライブラリー中のスペーサー配列を付加し、さらにCas9タンパク質、CRISPRアレイの上流に強力な異種プロモーター(heterologous promoter)J23119を付加し、原核発現pACYC184-FrCas9プラスミドを構築した。
(b)ライブラリーのスペーサー配列の3′末端に7つのランダム塩基(合計16384つの挿入断片)を付加し、pUC19ベクターのマルチクローニングサイト(MCS)にEcoRI切断部位とNcoI切断部位という2つの酵素切断部位を選択し、ライブラリーをベクターにクローニングし、ターゲット-ライブラリープラスミドを構築した。
(c)pACYC184-FrCas9を含みまたは空ベクターのpACYC184プラスミドおよびターゲット-ライブラリープラスミドを共に電気的形質転換法により大腸菌DH5aに導入し、25℃で2時間蘇生した後、アンピシリンナトリウム(100μg/ml)およびクロラムフェニコール(34μg/ml)の両耐性を含むSOB培地に均一に塗布し、25℃で30時間インキュベートした後、アルカリ溶菌法によりプラスミドを回収した。
(d)PCRによりスペーサー配列と7つのランダム塩基を含む領域を増幅し、PCR産物の両端にリンカーをつけて次世代シーケンシングを行い、空ベクター対照群に対するPAM枯渇閾値(PPDV)を算出し、Weblogoを利用して本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムの5′-NNTA-3′であるPAM配列を生成した。
図3は本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムが原核系で認識したプロトスペーサー隣接モチーフ保存性PAM配列の模式図であり、枯渇実験によって得られたDNAライブラリーを次世代シークエンシング分析し、空ベクター対照群に対するPAM枯渇閾値(PPDV)を算出し、Weblogoを利用して生成されたFrCas9のPAM配列が、5′-NNTA-3′であった。
実施例3
本実施例は、干渉実験により本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムで認識されるプロトスペーサー隣接モチーフ(PAM)を検証し、その原核生物レベルでの切断能力と真核生物での潜在的な遺伝子編集能力を確認した。干渉実験の結果を図5に示す。本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムが認識する複数の可能なPAM配列の模式図を図5に示す。
In order to better describe the purpose, technical solution and advantages of the present invention, the present invention is further described below based on specific examples.
The type II CRISPR/Cas9 gene editing system derived from Faecalibaculum rodentium contains Cas9 protein, accessory proteins, CRISPR RNA and transactivating CRISPR RNA, and as shown in FIG. 1, the Cas9 protein is a DNA endonuclease. wherein the Cas9 protein has at least 80%, 85%, 90%, 95%, 98%, or 99% homology to the amino acid sequence shown in SEQ ID NO: 1, or the amino acid sequence shown in SEQ ID NO: 1 It has an amino acid sequence.
As shown in Figure 2, as a preferred embodiment of the type II CRISPR/Cas9 gene editing system from Faecalibaculum rodentium according to the present invention, the Cas9 protein is complemented with crRNA upstream of the PAM sequence by various nuclease domains. The various nuclease domains are HNH-like nuclease domains or RuvC-like nuclease domains.
The Cas9 protein (Faecalibaculum rodentium Cas9) according to the present invention, sometimes simply called FrCas9 protein, contains 1372 amino acids (SEQ ID NO: 1) and is a multidomain and multifunctional DNA endonuclease. The Cas9 protein efficiently cleaves double-stranded DNA complementary to sgRNA upstream of the PAM by means of various nuclease domains. For example, the HNH-like nuclease domain cleaves the DNA strand complementary to the sgRNA sequence, and the RuvC-like nuclease domain cleaves the non-complementary DNA strand. Here, mutation of E at amino acid position 796 to A results in a nickase nuclease, mutation of N at amino acid position 902 to A results in a nickase nuclease, and H at amino acid position 1010 to A. Mutation of D at amino acid position 1013 to A results in nickase nuclease, E at amino acid position 796 and D at amino acid position 1013 are simultaneously mutated to A This results in a Cas9 nuclease that is incapable of cutting but retains binding ability.
As a preferred embodiment of the type II CRISPR/Cas9 gene editing system from Faecalibaculum rodentium according to the present invention, said accessory proteins comprise a Cas1 accessory protein, a Cas2 accessory protein and a Csn2 accessory protein, wherein said Cas1 accessory protein has the sequence Having an amino acid sequence represented by number 2 or an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% homology with the amino acid sequence represented by SEQ ID NO: 2, said Cas2 The accessory protein has the amino acid sequence set forth in SEQ ID NO:3, or an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% homology to the amino acid sequence set forth in SEQ ID NO:3. wherein the Csn2 accessory protein has the amino acid sequence set forth in SEQ ID NO:4 or at least 80%, 85%, 90%, 95%, 98%, or 99% homology to the amino acid sequence set forth in SEQ ID NO:4 has an amino acid sequence with
The accessory proteins Cas1, Cas2, Csn2 according to the invention are involved in foreign gene capture and maturation of crRNA.
As a preferred embodiment of the type II CRISPR/Cas9 gene editing system derived from Faecalibaculum rodentium according to the present invention, the CRISPR RNA is produced by being transcribed from a CRISPR array, and the CRISPR RNA is the RNA shown in SEQ ID NO: 5 wherein said CRISPR array comprises direct repeat sequences and spacer sequences, said direct repeat sequences being shown in SEQ ID NO:6 and said spacer sequences being shown in SEQ ID NO:7.
The CRISPR RNAs (crRNAs) described in the present invention exploit base-pair complementarity to induce Cas proteins to recognize invading foreign genomes. Bacteria, when exposed to bacteriophages, viruses, etc., provide a genetic record of infection by incorporating short pieces of foreign DNA as new spacers between CRISPR repeat spacer sequences in the host chromosome; When a foreign gene re-invades the organism, a crRNA precursor (pre-crRNA) is generated by being transcribed from the CRISPR array, and its 5′ end is complementary to the sequence of the gene that has invaded from outside, and is 30 bp in length. A spacer sequence has a repeat sequence 36 bp in length at the 3' end.
As a preferred embodiment of the Faecalibaculum rodentium type II CRISPR/Cas9 gene editing system according to the present invention, said transactivating CRISPR RNA contains a sequence complementary to a CRISPR RNA direct repeat sequence, and said transactivating A type CRISPR RNA is shown in SEQ ID NO:8.
Trans-activating crRNAs (tracrRNAs) according to the present invention are RNAs that do not encode proteins and are involved in maturation of crRNAs and formation of sgRNAs. The pre-crRNA cleaves 0-16 nt upstream of the spacer sequence and 12-29 nt downstream of the repeat sequence by the action of tracrRNA and Cas9 nuclease to form mature crRNA, which further binds to tracrRNA to form a tracrRNA-crRNA complex. form the body. The complex is 14-30 bp in length and contains a portion that recognizes a sequence of foreign DNA. By adding a tetraloop of four bases, such as a "GAAA", "TGAA" or "AAAC" sequence, between the crRNA downstream and the tracrRNA upstream, the tracrRNA and crRNA are linked to form an sgRNA. can be formed. Such sgRNAs contain two bulge structures and three duplex structures upstream, and one stem loop structure downstream, and also recognize sequences of foreign DNA. It can be divided into partial and skeletal parts.
By adjusting the length of the portion of the sgRNA that recognizes the foreign DNA sequence and the length of the tracrRNA, the cleavage action of the endonuclease can be further optimized. From previous experiments of the present invention, the optimal length of the portion of the sgRNA that recognizes the foreign DNA sequence is 21 bp, 22 bp or 23 bp (FIG. 8), and the optimal length of the backbone portion is shown in FIGS. 7, 91 nt (18 nt crRNA direct repeat + 69 nt tracrRNA), 89 nt (17 nt crRNA direct repeat + 68 nt tracrRNA), 87 nt (16 nt crRNA direct repeat + 67 nt tracrRNA), 85 nt (15 nt crRNA It was proved that there are five types of 83 nt (direct repeat sequence + 66 nt tracrRNA) and 83 nt (14 nt crRNA direct repeat sequence + 65 nt tracrRNA).
In a preferred embodiment of the type II CRISPR/Cas9 gene editing system derived from Faecalibaculum rodentium according to the present invention, said type II CRISPR/Cas9 gene editing system derived from Faecalibaculum rodentium binds DNA in a biological process or disconnect.
In a preferred embodiment of the Faecalibaculum rodentium type II CRISPR/Cas9 gene editing system according to the present invention, said DNA is prokaryotic or eukaryotic DNA.
In some embodiments, the FrCas9 of the present invention can recognize multiple types of protospacer adjacent motifs (PAMs) flanking the downstream side of the target sequence to cause DNA double-stranded molecular breaks (DSBs). can. Recognition of the target sequence by the FrCas9 protein requires two key elements: the nucleotides complementary to the crRNA spacer sequence and the Protospacer Adjacent Motif (PAM) flanking the complementary sequence. As shown in Figure 4, depletion experiments revealed that FrCas9 has a cleaving effect in the prokaryotic system, with positions 3 and 4 of the PAM sequence recognized by this newly discovered type II CRISPR/Cas9 system It was rudimentary verified to be TA. Furthermore, as shown in Figure 5, interference experiments demonstrated that the PAM downstream of the target sequence recognized by FrCas9 was 5'-NNTA-3'. As shown in FIG. 6, all of the above PAMs were verified in eukaryotic experiments. By artificially designing spacer sequences in crRNA, such CRISPR-Cas9 systems can target almost any DNA sequence of interest in the genome, generating site-specific blunt ends. produces a double-strand break (DSB). By repairing the DSB with non-homologous end joining, small random insertions/deletions (indels) at the break site are generated to inactivate the gene of interest. Alternatively, high-fidelity homologous recombination repair can be used to make precise genomic modifications at DSB sites using homologous recombination repair templates.
Many human genetic diseases are due to single nucleotide mutations and cannot be cured by traditional methods. Base editors are one of the newest and most effective ways to achieve precise gene editing. It features a nicking version of the CRISPR-Cas protein that locates specific target DNA and uses DNA deaminase to modify and modify such target DNA without causing double-stranded DNA breaks. Mutate and correct for the diseased base. In some embodiments, the E796A nFrCas9-BEGam cytosine base editor combines E796A nFrCas9 with the optimized fourth generation cytidine base editor BE4Gam to mutate base pairs C:G to T:A in DNA ( E796A nFrCas9-BABE7.10 adenine base editor (ABE) that combines E796A nFrCas9 with the seventh generation adenine base editor ABE7.10 to mutate the base pair A:T to G:C. ) can be constructed.
In some embodiments, the specific PAM of FrCas9 of the present invention is NNTA and has a target site specific to the TATA box (one of the elements that make up the eukaryotic promoter), so FrCas9 is specific By specifically targeting the TATA box, unique CRISPR interference (CRISPRi)/CRISPR activation (CRISPRa) effects can be exerted. Here, CRISPRi either utilizes active FrCas9 to directly target cleave the TATA box to destroy it, or dFrCas9 without cleavage activity (i.e., inactive Cas9) directly binds to the TATA box. It can be realized by letting CRISPRa can be achieved by, but not limited to, dFrCas9-VP64 targeting the TATA box site.
Prime Editing (PE) is an entirely new precision gene editing tool. This technology enables free substitution of single bases and precise insertions and deletions of multiple bases, greatly reducing harmful by-products produced by indels in the process of gene editing, and improving editing accuracy. can be greatly improved and is widely considered to be a significant advance in gene editing. In some embodiments, the FrCas9 of the present invention can be fused with reverse transcriptase and the corresponding pegRNA can be designed based on its PAM sequence to construct the FrCas9-PE gene editing system. Specifically, two sequences are added to the 3' end sequence of pegRNA. The first sequence is the primer binding site (PBS) and can complement the ends of the cleaved target DNA strand to initiate the reverse transcription process, and the second sequence is the reverse transcription template (RT templates) and have targeted point mutations or indel mutations to achieve precise gene editing.
It is a further object of the present invention to provide the use of the type II CRISPR/Cas9 gene editing system from Faecalibaculum rodentium in prokaryotic or eukaryotic gene editing, CRISPR activation or CRISPR interference.
As a preferred embodiment of the use according to the invention, the type II CRISPR/Cas9 gene editing system from Faecalibaculum rodentium is used to join or cleave DNA at the DNA level.
Example 1
In this example, the RNA secondary structure of the guide RNA molecule recognized by the type II CRISPR / Cas9 gene editing system derived from Faecalibaculum rodentium according to the present invention is predicted, and the RNA transcribed from the tracrRNA and the repetitive sequence is predicted. By simulating the binding process, the RNA structure after binding of both was predicted, and the obtained RNA secondary structure is shown in FIG.
(1) Materials: predicted tracrRNA and repeat sequences, and predicted anti-repeat sequences.
(2) Software: NUPACK (http://www.nupack.org/partition/new)
(3) Prediction method: NUPACK, an online application, simulates the in vitro interaction process of 1 µl of each of the two RNAs at 37°C, and predicts the secondary structure of the resulting RNA composition. An RNA secondary structure as shown in 2 was obtained.
As can be seen from FIG. 3, the pre-crRNA is excised by tracrRNA and Cas9 nuclease from 0-16 nt upstream of the spacer sequence and 12-29 nt downstream of the repeat sequence to form the mature crRNA and fuse with the tracrRNA. A tracrRNA-crRNA complex was formed. This complex contained a sequence of foreign DNA complementary to the spacer sequence, with a sequence length of 14-30 bp. Adding a 4-nt tetraloop between the crRNA downstream and the tracrRNA upstream connects them to form two bulge and three double helix structures upstream and three stem-loop structures downstream. can form an sgRNA comprising
Example 2
In this example, the protospacer adjacent motif (PAM) recognized in the prokaryotic system by the type II CRISPR/Cas9 gene editing system derived from Faecalibaculum rodentium according to the present invention was found to be 5'-NNTA-3'. .
(1) Materials: genes related to the CRISPR/Cas9 gene editing system predicted by the above examples.
(2) Verification method: In this example, a prokaryotic verification system was constructed for the type II CRISPR/Cas9 gene editing system derived from Faecalibaculum rodentium according to the present invention, the cleavage effect was verified, and the recognized PAM sequence was preliminarily searched by second generation sequencing technology and the results are shown in FIG.
The detailed flow is as follows.
(a) Type II CRISPR/Cas9 gene editing system from Faecalibaculum rodentium according to the present invention, comprising endonuclease Cas9, accessory proteins Cas1, Cas2, Csn2, CRISPR array and non-coding RNA tracrRNA ) was inserted into the pACYC184 vector, E. coli codon-optimized for the Cas9 protein, the CRISPR array was added with the native spacer sequence and the spacer sequence in the library, and the Cas9 protein, a strong heterologous promoter upstream of the CRISPR array. (heterologous promoter) J23119 was added to construct a prokaryotic expression pACYC184-FrCas9 plasmid.
(b) adding 7 random bases (total of 16384 inserts) to the 3′ end of the spacer sequence of the library and cleaving the multiple cloning site (MCS) of the pUC19 vector with two enzymes, EcoRI and NcoI sites; Sites were selected and the library cloned into a vector to construct the target-library plasmid.
(c) Both the pACYC184 plasmid containing pACYC184-FrCas9 or the empty vector and the target-library plasmid were introduced into E. coli DH5a by the electrotransformation method, revived at 25°C for 2 hours, and then treated with ampicillin sodium (100 µg/ml). and chloramphenicol (34 μg/ml), and incubated at 25° C. for 30 hours, after which plasmids were recovered by alkaline lysis.
(d) Amplify a region containing a spacer sequence and 7 random bases by PCR, attach linkers to both ends of the PCR product, perform next-generation sequencing, and calculate the PAM depletion threshold (PPDV) relative to the empty vector control group, Weblogo was used to generate a PAM sequence that is 5'-NNTA-3' of the type II CRISPR/Cas9 gene editing system from Faecalibaculum rodentium described in this invention.
FIG. 3 is a schematic diagram of protospacer-adjacent-motif-conserved PAM sequences recognized in the prokaryotic system by the type II CRISPR/Cas9 gene editing system derived from Faecalibaculum rodentium according to the present invention, and the DNA library obtained by depletion experiments. was analyzed by next-generation sequencing to calculate the PAM depletion threshold (PPDV) relative to the empty vector control group, and the PAM sequence of FrCas9 generated using Weblogo was 5'-NNTA-3'.
Example 3
This example validates the protospacer adjacent motif (PAM) recognized by the type II CRISPR/Cas9 gene editing system from Faecalibaculum rodentium according to the present invention by interference experiments and demonstrates its prokaryotic-level cleavage ability and A potential gene-editing capability in eukaryotes was confirmed. The results of interference experiments are shown in FIG. A schematic representation of several possible PAM sequences recognized by the type II CRISPR/Cas9 gene editing system from Faecalibaculum rodentium according to the present invention is shown in FIG.

(1)材料:実施例4で得られたpACYC184-FrCas9、ターゲット-ライブラリープラスミド、初歩的に認識されたPAM。
(2)検証方法:本実施例は、干渉実験により、本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムが原核系で認識したプロトスペーサー隣接モチーフ(PAM)を更に確定した。
具体的な操作は次のとおりである。
(a)スペーサー配列の3′末端にNNTAの合計16種類の組み合わせ配列を付加し、EcoRI酵素切断部位とNcoI酵素切断部位のそれぞれからpUC19にクローニングしてターゲットプラスミドを構築した。
(b)16種類のターゲットプラスミドを、それぞれ、FrCas9関連遺伝子座を含むエレクトロポレーション用コンピテントセルの状態にした大腸菌DH5aに導入し、25℃で2時間蘇生した後、段階的に希釈し、アンピシリンナトリウム(100μg/ml)とクロラムフェニコール(34μg/ml)の両耐性を含むSOB培地に点状に塗布して、25℃で一晩インキュベートして、モノクローナル細菌数を観察した。
図5Cは、本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムの干渉実験の模式図である。枯渇実験で発見されたNNTAに基づいて、16種類のNNの異なる組み合わせのターゲットプラスミドを構築し、干渉実験によってモノクローナルコロニー数を観察した。図5Aの一番左の列は単独のFrCas9の場合、右側はFrCas9で目標プラスミドを標的切断した場合であり、その結果、右側の列のコロニー数はいずれも減少していることがわかった。図5Bは、本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムで認識された多種のPAM配列の切断効果の統計図であり、この図は14種類のNNの異なる組み合わせのターゲットプラスミドのcfu(コロニー形成単位)が対照群よりも低下していることを示した。以上の結果から明らかなように、新たに発見されたCRISPR/Cas9システムが原核系で認識しているプロトスペーサー隣接モチーフ(PAM)は5′-NNTA-3′である(NはA、T、C、G中の任意の塩基を表す)ことが干渉実験によって検証された。
実施例4
本実施例では、本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムにおいて、標的DNA配列を切断するために必要なtracrRNAの範囲を干渉実験により検証した。干渉実験の結果を図5Cに示す。
(1) Materials: pACYC184-FrCas9 obtained in Example 4, target-library plasmid, rudimentary recognized PAM.
(2) Verification method: This example further determined the protospacer adjacent motif (PAM) recognized in the prokaryotic system by the type II CRISPR/Cas9 gene editing system derived from Faecalibaculum rodentium according to the present invention by interference experiments. .
Specific operations are as follows.
(a) A total of 16 combinations of NNTA sequences were added to the 3' end of the spacer sequence and cloned into pUC19 from each of the EcoRI and NcoI enzyme cleavage sites to construct a target plasmid.
(b) Each of the 16 types of target plasmids was introduced into E. coli DH5a in the state of competent cells for electroporation containing the FrCas9-related locus, revived at 25 ° C. for 2 hours, and then diluted stepwise, The SOB medium containing both ampicillin sodium (100 μg/ml) and chloramphenicol (34 μg/ml) resistance was applied in dots, incubated overnight at 25° C., and the number of monoclonal bacteria was observed.
FIG. 5C is a schematic representation of an interference experiment of the type II CRISPR/Cas9 gene editing system from Faecalibaculum rodentium according to the present invention. Based on the NNTAs discovered in depletion experiments, target plasmids with different combinations of 16 NNs were constructed, and monoclonal colony numbers were observed by interference experiments. The leftmost column in FIG. 5A is for FrCas9 alone, and the right side is for targeted cleavage of the target plasmid with FrCas9. FIG. 5B is a statistical diagram of the cleavage effects of various PAM sequences recognized by the type II CRISPR/Cas9 gene editing system from Faecalibaculum rodentium according to the present invention, which shows different combinations of 14 NNs. It showed that the cfu (colony forming unit) of the target plasmid was lower than that of the control group. As is clear from the above results, the protospacer adjacent motif (PAM) recognized by the newly discovered CRISPR/Cas9 system in the prokaryotic system is 5'-NNTA-3' (N is A, T, C, representing any base in G) was verified by interference experiments.
Example 4
In this example, the extent of tracrRNA required to cleave target DNA sequences in the type II CRISPR/Cas9 gene editing system from Faecalibaculum rodentium according to the present invention was verified by interference experiments. The results of the interference experiment are shown in Figure 5C.

(1)材料:実施例5で得られたpACYC184-FrCas9、ターゲットプラスミド、初歩的に認識されたPAM。
(2)検証方法:本実施例は、干渉実験により、本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムが原核系で標的DNA配列を切断するために必要なtracrRNA範囲をさらに確認した。
具体的な操作は次のとおりである。
(a)Gibsonクローン法により、野生型Faecalibaculum rodentium中のすべての可能なノンコーディング領域(Noncoding)の合計6つの遺伝子配列をそれぞれターゲットプラスミドにクローニングし、ターゲット-NC 1~6プラスミドを構築する。ここで、NC6はノンコーディング領域の全長がつなぎ合わされたものであり、NC1~5は、それぞれ第1~第5の可能なノンコーディング領域を表した。各NCプラスミドは、ノンコーディング領域の上流に強力な異種プロモーターJ23119が付加され、それぞれ「+」で順方向のノンコーディング領域を表し、「-」は逆方向のノンコーディング領域を表した。
(1) Materials: pACYC184-FrCas9 obtained in Example 5, target plasmid, rudimentary recognized PAM.
(2) Verification method: This example uses an interference experiment to determine the tracrRNA range required for the type II CRISPR/Cas9 gene editing system derived from Faecalibaculum rodentium according to the present invention to cleave the target DNA sequence in a prokaryotic system. Confirmed further.
Specific operations are as follows.
(a) A total of 6 gene sequences of all possible noncoding regions (Noncoding) in wild-type Faecalibaculum rodentium are each cloned into target plasmids by Gibson cloning method to construct target-NC 1-6 plasmids. Here, NC6 is the full-length noncoding region concatenated, and NC1-5 represent the first to fifth possible noncoding regions, respectively. Each NC plasmid had a strong heterologous promoter J23119 added upstream of the non-coding region, with "+" representing the forward non-coding region and "-" representing the reverse non-coding region, respectively.

(b)実施例5で得られたpACYC184-FrCas9は、PCR相同組換えの方法により、すべての可能なノンコーディング領域を除去し、CRISPR関連タンパク質とCRISPRアレイの遺伝子配列を保持し、pACYC184-ΔFrCas9を構築した。
(c)12種類のターゲット-NCプラスミドをそれぞれpACYC184-ΔFrCas9を含む、エレクトロポレーション用コンピテントセルの状態にした大腸菌DH5aに導入し、25℃で2時間蘇生した後、段階的に希釈し、アンピシリンナトリウム(100μg/ml)とクロラムフェニコール(34μg/ml)の両耐性を含むSOB培地に点状に塗布して、25℃で一晩インキュベートし、モノクローナル細菌数を観察した。
図5Cは、本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムの干渉実験の模式図であり、その結果から、NC1、NC6の場合は、モノクローナルコロニー数がNC2~5の場合よりも明らかに少なく、第1の候補のノンコーディング領域は大腸菌内でのFrCas9によるDNA配列の効率的な標的切断を補助することができることを明らかにした。
実施例5
本実施例では、ODN実験により、本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムが真核細胞において発揮する標的DNA配列を切断する能力を検証し、ODN-PCR結果を図6Aに、サンガーシーケンシングの結果を図6Bに示す。
(b) pACYC184-FrCas9 obtained in Example 5 removes all possible non-coding regions by the method of PCR homologous recombination, retains the gene sequences of CRISPR-related proteins and CRISPR arrays, and pACYC184-ΔFrCas9 built.
(c) Each of the 12 target-NC plasmids was introduced into E. coli DH5a in electroporation competent cells containing pACYC184-ΔFrCas9, resuscitated at 25° C. for 2 hours, and then serially diluted, A SOB medium containing both ampicillin sodium (100 μg/ml) and chloramphenicol (34 μg/ml) resistance was applied in dots, incubated overnight at 25° C., and the number of monoclonal bacteria was observed.
Figure 5C is a schematic diagram of the interference experiment of the type II CRISPR / Cas9 gene editing system derived from Faecalibaculum rodentium according to the present invention. Clearly less than the case, the first candidate non-coding region was shown to be able to support efficient targeted cleavage of DNA sequences by FrCas9 in E. coli.
Example 5
In this example, ODN experiments verified the ability of the type II CRISPR/Cas9 gene editing system derived from Faecalibaculum rodentium according to the present invention to cleave target DNA sequences in eukaryotic cells, and the ODN-PCR results were analyzed. FIG. 6A shows the results of Sanger sequencing in FIG. 6B.

(1)材料:実施例1~6で得られたFaecalibaculum rodentium編集遺伝子のすべてのアミノ酸配列、CRISPRアレイ配列、tracrRNA配列及び認識されたPAM。
(2)検証方法:本実施例は、ODN実験により、本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムが真核細胞において発揮する標的DNA配列を切断する能力を検証した。
具体的な操作は次のとおりである。
(a)ヒト由来の最適化されたFrCas9タンパク質配列を合成し、PX330真核ベクターにクローニングし、PX330-FrCas9プラスミドを構築した。
(b)ヒトのRNF2遺伝子上のNGTA、NATA、NCTA、NTTAの上流の30bpを標的配列として選び、Gibson法でCRISPRアレイに導入し、CRISPRアレイの上流にヒト由来の真核強プロモーターU6を付加し、PX330-FrCas9-arrayプラスミドを構築した。
(c)実施例4で確定したtracrRNAの上流にマウス由来の真核強プロモーターU6を付加し、PX330-FrCas9-array-tracrRNAプラスミドを構築した。
(d)上記で構築した、異なる遺伝子部位を標的とするPX330-FrCas9-array-tracrRNAプラスミド2.5μgと、ODN1.5μlとを電気的形質転換法により状態の良好なHEK293T細胞に導入し、72時間後に全細胞を採取してDNAを抽出した。
(e)RNF2標的遺伝子部位付近かつODN配列上に設計された一対のプライマーでODN-PCRを行い、アガロースゲル電気泳動でバンドの有無を観察し、標的切断イベントの発生の有無を初歩的に確認した。
(f)サンガーシークエンシングにより、ODNが標的部位に正常に挿入されたことが検証され、FrCas9が真核細胞内で標的DNAを編集する能力を有することが実証された。
ODN-PCRの結果は、図6Aに示すように、NGTA、NATA、NCTA、NTTAでは、いずれも正しいバンドサイズを有するターゲットバンドが認められた。サンガーシークエンシングの結果は、図8に示すように、ODN挿入位置が、PAMの上流の3~4bp塩基にあり、FrCas9と従来のSpCas9とは、目的遺伝子配列の切断の発生する範囲が一致したことがわかった。
実施例6
本実施例は、ODN実験により、本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムの真核細胞中のsgRNA認識部分の最適長さを検証し、結果を図7に示す。
(1) Materials: all amino acid sequences, CRISPR array sequences, tracrRNA sequences and recognized PAMs of Faecalibaculum rodentium edited genes obtained in Examples 1-6.
(2) Verification method: In this example, the ability of the type II CRISPR/Cas9 gene editing system derived from Faecalibaculum rodentium according to the present invention to cleave target DNA sequences exhibited in eukaryotic cells was verified by ODN experiments. .
Specific operations are as follows.
(a) A human-derived optimized FrCas9 protein sequence was synthesized and cloned into the PX330 eukaryotic vector to construct the PX330-FrCas9 plasmid.
(b) Select 30 bp upstream of NGTA, NATA, NCTA, and NTTA on the human RNF2 gene as the target sequence, introduce it into the CRISPR array by the Gibson method, and add a human-derived eukaryotic strong promoter U6 upstream of the CRISPR array. and constructed the PX330-FrCas9-array plasmid.
(c) A mouse-derived strong eukaryotic promoter U6 was added upstream of the tracrRNA determined in Example 4 to construct a PX330-FrCas9-array-tracrRNA plasmid.
(d) 2.5 μg of the PX330-FrCas9-array-tracrRNA plasmid targeting different gene sites constructed above and 1.5 μl of ODN were introduced into HEK293T cells in good condition by electrotransformation, and 72 After hours, whole cells were harvested and DNA extracted.
(e) ODN-PCR is performed using a pair of primers designed near the RNF2 target gene site and on the ODN sequence, and the presence or absence of bands is observed by agarose gel electrophoresis, and the presence or absence of target cleavage events is rudimentary confirmed. did.
(f) Sanger sequencing verified that the ODN was successfully inserted into the target site, demonstrating that FrCas9 has the ability to edit target DNA in eukaryotic cells.
As a result of ODN-PCR, as shown in FIG. 6A, target bands with correct band sizes were observed in all of NGTA, NATA, NCTA and NTTA. As a result of Sanger sequencing, as shown in FIG. 8, the ODN insertion position is 3 to 4 bp bases upstream of PAM, and FrCas9 and conventional SpCas9 have the same range of occurrence of cleavage of the target gene sequence. I understand.
Example 6
This example verified the optimal length of the sgRNA recognition portion in eukaryotic cells of the type II CRISPR/Cas9 gene editing system from Faecalibaculum rodentium according to the present invention by ODN experiments, and the results are shown in FIG. .

(1)材料:実施例1~6で得られたFaecalibaculum rodentium編集遺伝子のすべてのアミノ酸配列、sgRNA配列及び認識されたPAM。
(2)検証方法:本実施例は、ODN実験により、本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムの真核細胞中のsgRNA認識部分の最適な長さを検証した。
具体的な操作は次のとおりである。
(a)ヒト由来の最適化されたFrCas9タンパク質配列を合成し、PX330真核ベクターにクローニングし、PX330-FrCas9プラスミドを構築した。
(b)従来の研究で比較的高い切断効果が確認されたSpCas9の標的部位付近のGGTAの上流の30bpを標的配列として選び、Gibson法で認識長さ19~23bpのsgRNAを構築し、sgRNAの上流にヒト由来の真核強プロモーターU6を付加し、PX330-FrCas9-sgRNAプラスミドを構築した。
(c)上記で構築した、異なる遺伝子部位を標的とするPX330-FrCas9-sgRNAプラスミド2.5μgと、ODN1.5ulとを電気的形質転換法により状態の良好なHEK293T細胞に導入し、72時間後に全細胞を採取してDNAを抽出した。
(d)標的遺伝子部位付近かつODN配列上に設計された一対のプライマーでODN-PCRを行い、アガロースゲル電気泳動でバンドの有無を観察し、標的切断イベントの発生の有無を初歩的に確認し、認識長さ19~23bpのsgRNAのバンドの強弱を比較した。
(e)標的領域のインデル(Indel)率を数量化するために、アンプリコンハイスループットライブラリを調製し、認識長さ19~23bpのsgRNAの切断効果を比較した。
図7に示すように、FrCas9のsgRNAの最適な認識長さは、21bp、22bpまたは23bpであった。
実施例7
本実施例は、ODN実験により、本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムの真核細胞中のsgRNA骨格の最適長さを検証し、結果を図8に示す。
(1)材料:実施例1-6で得られたFaecalibaculum rodentium編集遺伝子のすべてのアミノ酸配列、sgRNA配列及び認識されたPAM。
(2)検証方法:本実施例は、ODN実験により、本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムの真核細胞中のsgRNA骨格の最適な長さを検証した。
具体的な操作は次のとおりである。
(a)ヒト由来の最適化されたFrCas9タンパク質配列を合成し、PX330真核ベクターにクローニングし、PX330-FrCas9プラスミドを構築した。
(b)従来の研究で比較的高い切断効果が確認されたSpCas9の標的部位付近のGGTAの上流の30bpを標的配列として選び、Gibson法で骨格長さ71nt~95ntのsgRNAを構築し、sgRNAの上流にヒト由来の真核強プロモーターU6を付加し、PX330-FrCas9-sgRNAプラスミドを構築した。
(c)上記で構築した、異なる遺伝子部位を標的とするPX330-FrCas9-sgRNAプラスミド2.5μgと、ODN1.5μlとを電気的形質転換法により状態の良好なHEK293T細胞に導入し、72時間後に全細胞を採取してDNAを抽出した。
(d)標的遺伝子部位付近かつODN配列上に設計された一対のプライマーでODN-PCRを行い、アガロースゲル電気泳動でバンドの有無を観察し、標的切断イベントの発生の有無を初歩的に確認し、骨格長さ71nt~95ntのsgRNAのバンドの強弱を比較した。
(e)標的領域のインデル(Indel)率を数量化するために、アンプリコンハイスループットライブラリを調製し、骨格長さ71nt~95ntのsgRNAの切断効果を比較した。
図8と図3に示すように、FrCas9の最適なsgRNA骨格は83nt~91ntであった。
実施例8
本実施例は、GUIDE-seq実験により、本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムの真核細胞での切断効果がSpCas9よりも高く、オフターゲット率がSpCas9よりも低いことを検証した。
(1)材料:実施例1~6で得られたFaecalibaculum rodentium編集遺伝子の全アミノ酸配列、22bpのsgRNA配列、5′-GGTA-3′PAM配列、SpCas9アミノ酸配列、SpCas9 sgRNA配列及びSpCas9 5′-NGG-3′ PAM配列。
(2)検証方法:本実施例は、GUIDE-seq実験により、本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムの真核細胞での切断効果がSpCas9よりも高く、オフターゲット率がSpCas9よりも低いことを検証した。
具体的な操作は次のとおりである。
(a)ヒト由来の最適化されたFrCas9タンパク質配列を合成し、PX330真核ベクターにクローニングし、PX330-FrCas9プラスミドを構築した。
(b)従来の研究で比較的高い切断効果が確認されたSpCas9の標的部位付近のGGTAの上流の30bpを標的配列として選び、Gibson法で認識長さ22bpのsgRNAを構築し、sgRNAの上流にヒト由来の真核強プロモーターU6を付加し、PX330-FrCas9-sgRNAプラスミドを構築した。同時に、20bpのSpCas9 sgRNAのPX330-SpCas9-sgRNAプラスミドを構築した。
(c)上記で構築した、異なる遺伝子部位を標的とするPX330-FrCas9-sgRNAプラスミド及びPX330-SpCas9-sgRNAプラスミド2.5μgと、 ODN1.5μlとを電気的形質転換法により状態の良好なHEK293T細胞に導入し、72時間後に全細胞を採取してDNAを抽出した。
(d)標的遺伝子部位付近かつODN配列上に設計された一対のプライマーでODN-PCRを行い、アガロースゲル電気泳動でバンドの有無を観察し、標的切断イベントの発生の有無を初歩的に確認し、バンドが認められたDNAについてGUIDE-seqのライブラリーを調製した。
(e)バイオインフォマティクス解析により、同じ部位のSpCas9とFrCas9のオンターゲット切断効果及びオフターゲット状況を比較した。
図9に示すように、DYRK1A-T2部位では、FrCas9のオンターゲットのリード数が3257であり、SpCas9のオンターゲットのリード数の2456よりも高かった。同時に、FrCas9では、オフターゲットが検出されていないことに対し、SpCas9では、3カ所のオフターゲット部位が発見された。また、GRIB2B-T9部位では、FrCas9のオンターゲットのリード数が34970であり、SpCas9のオンターゲットのリード数の20434よりも高かった。同時に、FrCas9では、オフターゲットが検出されていないことに対し、SpCas9では、3カ所のオフターゲット部位が発見された。以上のデータから、FrCas9は、SpCas9よりも切断効率と特異性が優れたCas9タンパク質であることがわかった。
実施例9 FrCas9は塩基編集(Base editing、BE)に使用することができる。
多くのヒト遺伝病は、単塩基突然変異によるものであり、伝統的な方法では治療できない。塩基エディターは、正確な遺伝子編集を実現する最新かつ最も効果的な方法の一つである。その特徴としては、ニッキング型のCRISPR-Casタンパク質により特定の標的DNAの位置を特定し、二本鎖DNAの切断を起こさずにDNAデアミナーゼを使用してこのような標的DNAを修飾および変異させ、病変塩基に対して修正を行う。シトシン塩基エディター(CBE)は、DNA中の塩基対C:GをT:Aに変異させ、アデニン塩基エディター(ABE)は塩基対A:TをG:Cに変異させる。
まず、FrCas9に対してE796A、H1010A、D1013Aの3つの点突然変異を導入し、異なるFrCas9ニッカーゼ(nFrCas9)を産生した。次に、最適化された第四世代シトシン塩基エディターBE4Gamと第七世代アデニン塩基エディターABE7.10にE796A nFrCas9を結合した。FrCas9-BE4Gamの編集ウィンドウは6~10塩基目であり(図10B)、FrCas9-ABE7.10の編集ウィンドウは6~8塩基目である(図10C)ことが観察された。上記の特徴に基づいて、ClinVarデータベースにおけるFrCas9-BE4Gamの標的の範囲とFrCas9-ABE7.10の標的の範囲を計算した。FrCas9-BE4Gamで正確に修正できる病原性突然変異については、90.38%(235/260)の編集イベントは、SpCas9-BE4Gamとは異なった。FrCas9-ABE7.10で正確に修正できる病原性突然変異については、92.21%(1196/1297)の編集イベントは、SpCas9-ABE7.10と異なった(図10D)。よって、FrCas9は、TAリッチPAMによってヒトゲノム中の標的を大幅に拡張し、塩基編集器に用いてヒト疾患に関連する変異を修正した。
(1) Materials: all amino acid sequences, sgRNA sequences and recognized PAMs of Faecalibaculum rodentium edited genes obtained in Examples 1-6.
(2) Verification method: This example verified the optimal length of the sgRNA recognition portion in eukaryotic cells of the type II CRISPR/Cas9 gene editing system derived from Faecalibaculum rodentium according to the present invention by ODN experiments. .
Specific operations are as follows.
(a) A human-derived optimized FrCas9 protein sequence was synthesized and cloned into the PX330 eukaryotic vector to construct the PX330-FrCas9 plasmid.
(B) 30 bp upstream of GGTA near the target site of SpCas9, which was confirmed in previous studies to have a relatively high cleavage effect, was selected as the target sequence, and an sgRNA with a recognition length of 19 to 23 bp was constructed by the Gibson method, and the sgRNA was A human-derived strong eukaryotic promoter U6 was added upstream to construct a PX330-FrCas9-sgRNA plasmid.
(c) 2.5 μg of PX330-FrCas9-sgRNA plasmid targeting different gene sites constructed above and 1.5 ul of ODN were introduced into HEK293T cells in good condition by electrotransformation, and after 72 hours Whole cells were harvested and DNA extracted.
(d) ODN-PCR is performed using a pair of primers designed near the target gene site and on the ODN sequence, and the presence or absence of a band is observed by agarose gel electrophoresis to rudimentarily confirm the presence or absence of the target cleavage event. , compared the intensity of the bands of sgRNAs with recognition lengths of 19-23 bp.
(e) To quantify the Indel rate of target regions, amplicon high-throughput libraries were prepared to compare the cleavage effects of sgRNAs of recognition length 19-23 bp.
As shown in Figure 7, the optimal recognition length of FrCas9 sgRNA was 21bp, 22bp or 23bp.
Example 7
This example validates the optimal length of the sgRNA backbone in eukaryotic cells of the type II CRISPR/Cas9 gene editing system from Faecalibaculum rodentium according to the present invention by ODN experiments and the results are shown in FIG.
(1) Materials: all amino acid sequences, sgRNA sequences and recognized PAMs of Faecalibaculum rodentium edited genes obtained in Examples 1-6.
(2) Validation method: This example validated the optimal length of sgRNA backbone in eukaryotic cells of the type II CRISPR/Cas9 gene editing system from Faecalibaculum rodentium according to the present invention by ODN experiments.
Specific operations are as follows.
(a) A human-derived optimized FrCas9 protein sequence was synthesized and cloned into the PX330 eukaryotic vector to construct the PX330-FrCas9 plasmid.
(B) 30 bp upstream of GGTA near the target site of SpCas9, which was confirmed in previous studies to have a relatively high cleavage effect, was selected as the target sequence, and an sgRNA with a backbone length of 71 nt to 95 nt was constructed by the Gibson method, and the sgRNA was A human-derived strong eukaryotic promoter U6 was added upstream to construct a PX330-FrCas9-sgRNA plasmid.
(c) 2.5 μg of the PX330-FrCas9-sgRNA plasmid targeting different gene sites constructed above and 1.5 μl of ODN were introduced into HEK293T cells in good condition by electrotransformation, and after 72 hours Whole cells were harvested and DNA extracted.
(d) ODN-PCR is performed using a pair of primers designed near the target gene site and on the ODN sequence, and the presence or absence of a band is observed by agarose gel electrophoresis to rudimentarily confirm the presence or absence of the target cleavage event. , compared the intensity of the bands of sgRNAs with backbone lengths of 71nt to 95nt.
(e) To quantify the Indel rate of target regions, amplicon high-throughput libraries were prepared to compare the cleavage effects of sgRNAs with backbone lengths from 71nt to 95nt.
As shown in Figures 8 and 3, the optimal sgRNA backbone for FrCas9 was between 83nt and 91nt.
Example 8
In this example, by GUIDE-seq experiments, the cutting effect in eukaryotic cells of the type II CRISPR / Cas9 gene editing system derived from Faecalibaculum rodentium according to the present invention is higher than SpCas9, and the off-target rate is higher than SpCas9 verified to be low.
(1) Materials: full amino acid sequence of Faecalibaculum rodentium edited gene obtained in Examples 1-6, 22 bp sgRNA sequence, 5′-GGTA-3′ PAM sequence, SpCas9 amino acid sequence, SpCas9 sgRNA sequence and SpCas9 5′- NGG-3' PAM sequence.
(2) Verification method: In this example, according to the GUIDE-seq experiment, the type II CRISPR / Cas9 gene editing system derived from Faecalibaculum rodentium according to the present invention has a higher cutting effect in eukaryotic cells than SpCas9, and is turned off. It was verified that the target rate is lower than SpCas9.
Specific operations are as follows.
(a) A human-derived optimized FrCas9 protein sequence was synthesized and cloned into the PX330 eukaryotic vector to construct the PX330-FrCas9 plasmid.
(B) Select 30 bp upstream of GGTA near the target site of SpCas9, which was confirmed in previous studies to have a relatively high cleavage effect, as a target sequence, construct an sgRNA with a recognition length of 22 bp by the Gibson method, and upstream of sgRNA A human-derived eukaryotic strong promoter U6 was added to construct a PX330-FrCas9-sgRNA plasmid. At the same time, a 20 bp SpCas9 sgRNA PX330-SpCas9-sgRNA plasmid was constructed.
(c) 2.5 μg of PX330-FrCas9-sgRNA plasmid and PX330-SpCas9-sgRNA plasmid targeting different gene sites constructed above, and 1.5 μl of ODN are electrotransformed into HEK293T cells in good condition 72 hours later, all cells were harvested and DNA was extracted.
(d) ODN-PCR is performed using a pair of primers designed near the target gene site and on the ODN sequence, and the presence or absence of a band is observed by agarose gel electrophoresis to rudimentarily confirm the presence or absence of the target cleavage event. , a GUIDE-seq library was prepared for the DNA for which bands were observed.
(e) Bioinformatic analysis compared the on-target cleavage effect and off-target situation of SpCas9 and FrCas9 at the same site.
As shown in FIG. 9, at the DYRK1A-T2 site, the number of on-target reads for FrCas9 was 3257, which was higher than the number of on-target reads for SpCas9 of 2456. At the same time, in FrCas9, no off-target was detected, whereas in SpCas9, three off-target sites were found. In addition, at the GRIB2B-T9 site, the number of on-target reads for FrCas9 was 34,970, which was higher than the number of on-target reads of 20,434 for SpCas9. At the same time, in FrCas9, no off-target was detected, whereas in SpCas9, three off-target sites were found. From the above data, FrCas9 was found to be a Cas9 protein with better cleavage efficiency and specificity than SpCas9.
Example 9 FrCas9 can be used for base editing (BE).
Many human genetic diseases are due to single nucleotide mutations and cannot be treated by traditional methods. Base editors are one of the newest and most effective ways to achieve precise gene editing. characterized by nicking CRISPR-Cas proteins to locate specific target DNA, modifying and mutating such target DNA using DNA deaminase without double-stranded DNA breaks; Make corrections to the lesion bases. Cytosine base editors (CBE) mutate base pairs C:G to T:A in DNA, and adenine base editors (ABE) mutate base pairs A:T to G:C.
First, three point mutations E796A, H1010A, D1013A were introduced into FrCas9 to produce a different FrCas9 nickase (nFrCas9). E796A nFrCas9 was then ligated into the optimized fourth generation cytosine base editor BE4Gam and the seventh generation adenine base editor ABE7.10. It was observed that the editing window of FrCas9-BE4Gam was 6-10 bases (Fig. 10B) and that of FrCas9-ABE7.10 was 6-8 bases (Fig. 10C). Based on the above characteristics, the target ranges of FrCas9-BE4Gam and FrCas9-ABE7.10 in the ClinVar database were calculated. For pathogenic mutations that could be correctly corrected by FrCas9-BE4Gam, 90.38% (235/260) editing events differed from SpCas9-BE4Gam. For pathogenic mutations that can be correctly corrected by FrCas9-ABE7.10, 92.21% (1196/1297) editing events differed from SpCas9-ABE7.10 (Fig. 10D). Thus, FrCas9 has greatly expanded its targeting in the human genome by TA-rich PAMs and has been used as a base editor to correct mutations associated with human disease.

また、FrCas9(5′-NNTA-3′)のPAMは回文であり、これにより、sgRNAがペアとなり「背中合わせ」で存在する(図10E)。この機能は、隣接する2つの編集ウィンドウを同時に修正することで、FrCas9塩基エディターの範囲を拡大し(図10E)、FrCas9 sgRNAの標的分布と密度を高めることができる。ヒトゲノム中の5′-GG-3′(SpCas9 PAMを表す)と5′-TA-3′(FrCas9 PAMを表す)の分布を計算した(図11Aと図11B)。SpCas9(中央値=5bp、平均値=8.66bp)5と比較して、FrCas9はヒトゲノム中により密集した分布(中央値=1bp、平均値=6.16bp)を示し、追加の適用部位を提供した。
実施例10 FrCas9は、TATAボックスを標的として遺伝子発現を制御し、CRISPRの活性化と抑制に有効なツールとすることができる。
TATAボックス(TATAbox/Hognessbox)は真核生物のプロモーターを構成する素子の一つである。その一致順序は、TATA(A/T)A(A/T)(非鋳型鎖配列)である。それは、多くの真核生物の遺伝子の転写開始点の約-30bp(-25~-32bp)上流に存在し、基本的には塩基対A-Tからなり、遺伝子の転写開始を決める選択であり、RNAポリメラーゼの結合箇所の一つであり、RNAポリメラーゼとTATAボックスが強固に結合してから転写を開始する。FrCas9のPAM配列は、NNTAであるため、TATAボックスを標的とする際に天然の優位性がある。
ABCA1、UCP3及びRANKLの三つの遺伝子の中でTATAボックスを標的とし、FrCas9 CRISPR干渉(CRISPRi)の能力をテストした(図12A)。活性形態のFrCas9を直接利用してTATAボックスを標的に切断し、TATAボックスを破壊することを含んだ。その結果、FrCas9は、ABCA1、UCP3、RANKLの発現をそれぞれ31.37%、49.91%、39.62%低下させた。また、切断活性のないdFrCas9を利用してTATAボックスと直接結合させた。その結果、ABCA1、UCP3、RANKLの発現は、それぞれ61.67%、45.61%、42.60%低下した(図12B)。そのため、FrCas9は遺伝子発現を正確に制御する上で独特の潜在能力を持つことがわかった。
また、TATAボックスを直接標的とするdFrCas9-VP64を用いてFrCas9 CRISPR活性化(CRISPRa)の効果をテストし、その性能を、TATAボックスの上流を標的とするdSpCas9-VP64と比較した。これらの実験は、ABCA1、SOD1、GH1、BLM2遺伝子で行われた。その結果、dFrCas9-VP64は、有効な転写活性化を実現できることがわかった。また、ABCA1、GH1、BLM2では、dFrCas9-VP64の活性化倍数がdSpCas9-VP64より高く、SOD1遺伝子では、dFrCas9-VP64の活性化倍数がdSpCas9-VP64と同等であった(図12C)。そのため、FrCas9は、その独特な5′-NNTA-3′PAMによって、有望なCRISPRスクリーニングツールであることがわかった。
実施例11 FrCas9は、精確な遺伝子編集(Prime Editing、PE)に使用することができる。
Prime Editing(PE)は全く新しい正確な遺伝子編集ツールである。この技術は、単塩基の自由な置換と多塩基の正確な挿入・削除を実現することができ、遺伝子編集中にインデルにより生成する有害な副産物を大幅に低減し、編集精度を著しく向上させ、既存の遺伝子編集方法による遺伝子疾患治療の根本的障害を克服する可能性がある、遺伝子編集の大きな進歩であると考えられている。PEシステムには、改造されたガイドRNA(pegRNA)とプライムエディタ(prime editor)タンパク質の2つの部分が含まれる。pegRNAは、二重の機能を持ち、編集タンパク質を標的部位に誘導することができると同時に、編集用のテンプレート配列を含む。プライムエディタタンパク質は、変異したCas9ニッカーゼ(DNA鎖を1本しか切断できない)と逆転写酵素が融合したものである。Cas9で標的部位を切断した後、逆転写酵素は、pegRNAをテンプレートとして逆転写を行い、それによって必要な編集をDNA鎖に組み込み、修正後の配列は優先的にオリジナルなゲノムDNAを入れ替え、標的位置でDNAに対して永久的な編集を行った(図13)。
FrCas9の生物学的特性に基づいて、FrCas9と逆転写酵素とを融合し、そのPAM配列に基づいて相応のpegRNAを設計し、FrCas9-PE遺伝子編集システムを構築し、その遺伝子編集性能を最適化した。FrCas9 PAM配列に基づいて設計されたpegRNAは、sgRNAと比べて、pegRNAの3′末端の配列に2つの配列が付加された。第1の配列は、プライマー結合部位(PBS)であって、切断された標的DNA鎖の末端に相補的に結合されることができ、これにより、逆転写プロセスを開始させる。第2の配列は、逆転写テンプレート(RTテンプレート)であって、標的点突然変異または挿入欠失突然変異を持ち、正確な遺伝子編集を達成する。過去の研究によると、PBSとRTテンプレートの配列長は、PEシステムの遺伝子編集効率に顕著な影響を与え、かつ、遺伝子部位によって異なった。そこで、異なる長さのPBSとRTテンプレート配列との組み合わせにより、その編集効率の最適化を検討した。
細胞レベルで、FrCas9-PEシステムの遺伝子編集作用を初歩的に検証した。HEK293T細胞では、CRISPRの遺伝子編集効率の評価によく用いられるHEK293T-RNF2遺伝子部位を標的として、FrCas9-PEシステムの遺伝子編集機能を検証した。現在の実験結果は、FrCas9-PEが特定の部位の塩基編集効果を奏し得ることを示した。その後、既存のFrCas9-PEに対して、コドンの最適化、核局在化配列の位置と個数の最適化、逆転写酵素改造などの改造をさらに行った。最終的に、塩基編集効率が高く、オフターゲット反応が少なく、遺伝子編集の副産物が少ない(indel)新型FrCas9-PEの遺伝子編集システムが開発された(図14)。
Also, the PAM of FrCas9(5'-NNTA-3') is palindromic, which allows the sgRNAs to exist in pairs "back to back" (Fig. 10E). This feature expands the range of the FrCas9 base editor by modifying two adjacent editing windows simultaneously (Fig. 10E) and can increase target distribution and density of FrCas9 sgRNAs. The distribution of 5'-GG-3' (representing SpCas9 PAM) and 5'-TA-3' (representing FrCas9 PAM) in the human genome was calculated (Figures 11A and 11B). Compared to SpCas9 (median=5 bp, mean=8.66 bp)5, FrCas9 exhibits a more dense distribution in the human genome (median=1 bp, mean=6.16 bp), providing additional sites of application did.
Example 10 FrCas9 targets the TATA box to regulate gene expression and can be an effective tool for CRISPR activation and repression.
A TATA box (TATAbox/Hognessbox) is one of elements that constitute a eukaryotic promoter. The matching order is TATA(A/T) A(A/T) (non-template strand sequence). It is located approximately −30 bp (−25 to −32 bp) upstream of the transcription initiation site of many eukaryotic genes and consists essentially of the base pair AT and is the selection that determines the transcription initiation of genes. , is one of the binding sites for RNA polymerase, and transcription is initiated after the RNA polymerase and the TATA box bind tightly. Since the PAM sequence of FrCas9 is a NNTA, it has a natural advantage in targeting the TATA box.
We targeted the TATA box in three genes, ABCA1, UCP3 and RANKL, to test the ability of FrCas9 CRISPR interference (CRISPRi) (Fig. 12A). It involved direct utilization of the active form of FrCas9 to target and cleave the TATA box to disrupt the TATA box. As a result, FrCas9 reduced the expression of ABCA1, UCP3 and RANKL by 31.37%, 49.91% and 39.62%, respectively. In addition, dFrCas9 without cleavage activity was used to bind directly to the TATA box. As a result, the expression of ABCA1, UCP3 and RANKL decreased by 61.67%, 45.61% and 42.60% respectively (Fig. 12B). As such, FrCas9 was found to have unique potential in precisely regulating gene expression.
We also tested the effect of FrCas9 CRISPR activation (CRISPRa) using dFrCas9-VP64, which targets the TATA box directly, and compared its performance to dSpCas9-VP64, which targets the TATA box upstream. These experiments were performed with the ABCA1, SOD1, GH1, BLM2 genes. As a result, it was found that dFrCas9-VP64 can achieve effective transcriptional activation. Also, in ABCA1, GH1, BLM2, the activation fold of dFrCas9-VP64 is higher than dSpCas9-VP64, and in the SOD1 gene, the activation fold of dFrCas9-VP64 is equivalent to dSpCas9-VP64 (Fig. 12C). Therefore, FrCas9 proved to be a promising CRISPR screening tool due to its unique 5'-NNTA-3'PAM.
Example 11 FrCas9 can be used for precision gene editing (Prime Editing, PE).
Prime Editing (PE) is a completely new precision gene editing tool. This technology can achieve free substitution of single nucleotides and accurate insertion/deletion of multiple nucleotides, greatly reducing harmful by-products generated by indels during gene editing, significantly improving editing accuracy, It is considered to be a major advance in gene editing that has the potential to overcome fundamental obstacles to treating genetic diseases with existing gene-editing methods. The PE system contains two parts, a modified guide RNA (pegRNA) and a prime editor protein. The pegRNA has a dual function, being able to direct the editing protein to the target site as well as containing the template sequence for editing. The prime editor protein is a fusion of a mutated Cas9 nickase (which can cut only one strand of DNA) and reverse transcriptase. After cleaving the target site with Cas9, the reverse transcriptase reverse transcribes the pegRNA as a template, thereby incorporating the necessary edits into the DNA strand, the modified sequences preferentially displacing the original genomic DNA, and the target A permanent edit was made to the DNA at the position (Fig. 13).
Based on the biological properties of FrCas9, fuse FrCas9 with reverse transcriptase, design corresponding pegRNA based on its PAM sequence, construct FrCas9-PE gene editing system, and optimize its gene editing performance did. The pegRNA designed based on the FrCas9 PAM sequence had two sequences added to the 3' end sequence of the pegRNA compared to the sgRNA. The first sequence is a primer binding site (PBS), capable of complementary binding to the ends of the cleaved target DNA strand, thereby initiating the reverse transcription process. The second sequence is a reverse transcription template (RT template) with targeted point mutations or insertion-deletion mutations to achieve precise gene editing. Previous studies have shown that the sequence lengths of PBS and RT templates significantly affected the gene editing efficiency of the PE system and differed by gene site. Therefore, optimization of the editing efficiency was investigated by combining different lengths of PBS and RT template sequences.
At the cellular level, the gene-editing effects of the FrCas9-PE system were rudimentary verified. In HEK293T cells, we verified the gene-editing function of the FrCas9-PE system by targeting the HEK293T-RNF2 gene site, which is often used to evaluate the gene-editing efficiency of CRISPR. Current experimental results indicated that FrCas9-PE can exert a base-editing effect at specific sites. After that, the existing FrCas9-PE was further modified such as codon optimization, optimization of the position and number of nuclear localization sequences, and reverse transcriptase modification. Finally, a novel FrCas9-PE gene-editing system with high base-editing efficiency, low off-target reactions, and low gene-editing by-products (indel) was developed (FIG. 14).

本発明は、Faecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムに関するものであり、遺伝子編集技術の分野に属する。 The present invention relates to a type II CRISPR/Cas9 gene editing system derived from Faecalibaculum rodentium and belongs to the field of gene editing technology.

遺伝子編集(gene editing)技術は、DNA配列の局在点を改造することを可能にし、例えば、第一世代の遺伝子編集ツールであるジンクフィンガーヌクレアーゼ(zinc finger nucleases、ZFNs)や、第二世代の遺伝子編集ツールである転写活性化因子様エフェクターヌクレアーゼ(transcription activator-like effector nucleases、TALEN)はいずれも標的ゲノムの改造に使用できるが、これらの方法は、設計が困難で、作りにくく、コストが高くかつ汎用性がよくない課題がある。
CRISPR(クラスター化され、規則的に間隔があいた短い回文構造の繰り返し、Clustered Regularly Interspaced Short Palindromic Repeat)/Cas(CRISPR関連タンパク質、CRISPR-associated protein)システムは、古細菌と細菌に由来する自然免疫システムであり、第3世代の遺伝子編集ツールである。従来の遺伝子編集ツール(タンパク質-DNA認識)とは異なり、この方法は、核酸塩基対の相補性の原理を利用して、標的DNA配列を認識し、Casエフェクタータンパク質(Cas effector protein)が部位特異的切断を実行するように誘導し、適用性が高く、設計が簡単で、コストが低く、効率も高いものである。Casタンパク質には、核酸認識、複合体の構造の安定化、DNAのホスホジエステル結合の加水分解などのさまざまな活動で役割を果たすさまざまな異なるエフェクタードメインが含まれる。その中で、化膿レンサ球菌に由来するII型CRISPR/Cas9システム(Streptococcus pyogene Cas,SpCas9)は、その高い切断効率により、現在、最も広く使用されているCRISPR/Casシステムになっている。このシステムは、標的ポリヌクレオチドにおけるプロトスペーサー隣接モチーフ(PAM)配列である「NGG」を認識して切断し、これにより、1つの平滑末端又は突出端を残し、遺伝子編集に影響を及ぼす。
膨大かつ多種多様なメタゲノムには、未培養または未発見の微生物が秘められており、未発見のCRISPR/Cas9システムが多数存在する可能性があり、そして、これらのシステムの、原核生物と真核生物および体外環境での活性を確認する必要がある。
2015年、Dr.Byoung-Chan Kimのチームは、実験室のマウスC57BL/6Jの糞便から新しい嫌気性菌株ALO17を分離し、原核生物の16SrRNA遺伝子の配列の系統発生解析(phylogenetic analysis)により、この菌株がHoldemanellabiformis DSM 3989T、Faecalicoccuspleomorphus ATCC 29734T、Faecalitaleacylindroides ATCC 27803T、およびAllobaculumstercoricanis DSM 13633Tと密接な親縁関係を有することを発見した(配列相同性は、それぞれ、87.4%、87.3%、86.9%、および86.9%である。)。多くの分類学的証拠に基づいて、この種はErysipelothricaceae科の新属と認定され、そしてFaecalibaculum rodentium gen.nov.,sp.nov.と命名された。これからの5年間、世界各国の科学者は、腸内微生物環境と高脂肪食、腸内微生物環境と腫瘍形成の2つの分野でこの菌株について研究してきたが、遺伝子編集の分野ではまだ報告されていない。
Gene editing technologies allow for the remodeling of DNA sequence locations, such as the first generation of gene editing tools zinc finger nucleases (ZFNs) and the second generation of gene editing tools, zinc finger nucleases (ZFNs). Gene-editing tools, transcription activator-like effector nucleases (TALENs), can all be used to modify target genomes, but these methods are difficult to design, difficult to produce, and costly. And there is a problem that versatility is not good.
The CRISPR (Clustered Regularly Interspaced Short Palindromic Repeat)/Cas (CRISPR-associated protein) system is an innate immune system derived from archaea and bacteria. It is a system and a third generation gene editing tool. Unlike conventional gene-editing tools (protein-DNA recognition), this method utilizes the principle of nucleobase pair complementarity to recognize target DNA sequences and Cas effector proteins are site-specific. It is highly adaptable, simple in design, low in cost and high in efficiency. Cas proteins contain a variety of different effector domains that play roles in a variety of activities such as nucleic acid recognition, structural stabilization of complexes, and hydrolysis of phosphodiester bonds in DNA. Among them, the type II CRISPR/Cas9 system (Streptococcus pyogene Cas, SpCas9) derived from Streptococcus pyogenes is currently the most widely used CRISPR/Cas system due to its high cleavage efficiency. This system recognizes and cleaves the protospacer adjacent motif (PAM) sequence "NGG" in the target polynucleotide, leaving a single blunt or sticky end, affecting gene editing.
The vast and diverse metagenome harbors uncultivated or undiscovered microbes, the potential for many undiscovered CRISPR/Cas9 systems, and the prokaryotic and eukaryotic evolution of these systems. It is necessary to confirm the activity in organisms and in vitro environments.
In 2015, Dr. Byoung-Chan Kim's team isolated a new anaerobic strain ALO17 from the feces of laboratory mice C57BL/6J, and by phylogenetic analysis of the sequence of the prokaryotic 16S rRNA gene, the strain was named Holdemanellabiformis DSM 3989T. , Faecalicoccus pleomorphus ATCC 29734T, Faecalitaleacylindroides ATCC 27803T, and Allobaculumstercoricanis DSM 13633T (sequence identities of 87.4%, 87.3% and 8%, respectively). 6.9%, and 86 .9%). Based on a large body of taxonomic evidence, this species has been assigned a new genus in the family Erysipelothricaceae, and Faecalibaculum rodentium gen. nov. , sp. nov. was named. Over the next five years, scientists around the world have studied this strain in two areas: gut microbiome and high-fat diet, gut microbiome and tumorigenesis, but nothing has yet been reported on gene editing. do not have.

本発明は、従来技術の不足を克服し、新しい理化学的性質を有し、NGTA及びNNTA(Nは、A、C、G又はTを表す)を含む複数の異なるPAM(protospacer adjacent motif、プロトスペーサー隣接モチーフ)配列を認識することができる、Faecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムを提供することを目的とする。
上記の目的を達成するために、本発明で採用される技術的手段は、
Faecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムであって、Cas9タンパク質、アクセサリータンパク質(accessory protein)、crRNA(即ち、CRISPR RNA)及びtracrRNA(即ち、トランス活性化型CRISPR RNA)を含み、Cas9タンパク質と、crRNAにtracrRNAが結合されてなるガイドRNAとのRNP複合体(即ち、リボ核タンパク質複合体)の形態で機能し、
前記Cas9タンパク質は、DNAのエンドヌクレアーゼであり、前記Cas9タンパク質は、配列番号1で示されるアミノ酸配列、又は配列番号1で示されるアミノ酸配列と少なくとも80%、85%、90%、95%、98%、又は99%の相同性をもつアミノ酸配列を有する。
前記Cas9タンパク質は、ヌクレアーゼドメインにより、PAM配列の上流でcrRNAと相補的な二本鎖DNAを切断し、前記ヌクレアーゼドメインが、HNH様ヌクレアーゼドメイン及び/又はRuvC様ヌクレアーゼドメインである。
いくつかの実施形態では、「リボ核タンパク質複合体」が、好ましくは、本発明における「FrCas9タンパク質複合体」である。
具体的なCas9タンパク質のいくつかの重要なアミノ酸位の変異状況について説明する。796番目のアミノ酸位のEがAに突然変異するとニッカーゼ(Nickase)ヌクレアーゼになり、902番目のアミノ酸位のNがAに突然変異するとニッカーゼヌクレアーゼになり、1010番目のアミノ酸位のHがAに突然変異するとニッカーゼヌクレアーゼになり、1013番目のアミノ酸位のDがAに突然変異するとニッカーゼヌクレアーゼになり、796番目のアミノ酸位のEと1013番目のアミノ酸位のDが同時にAに突然変異すると切断能力がないが結合能力が維持されるCas9ヌクレアーゼ(即ち、不活性型Cas9(dead Cas9))になる。
前記アクセサリータンパク質は、Cas1アクセサリータンパク質、Cas2アクセサリータンパク質及びCsn2アクセサリータンパク質を含み、
前記Cas1アクセサリータンパク質は、配列番号2で示されるアミノ酸配列、又は配列番号2で示されるアミノ酸配列と少なくとも80%、85%、90%、95%、98%、又は99%の相同性をもつアミノ酸配列を有し、
前記Cas2アクセサリータンパク質は、配列番号3で示されるアミノ酸配列、又は配列番号3で示されるアミノ酸配列と少なくとも80%、85%、90%、95%、98%、又は99%の相同性をもつアミノ酸配列を有し、
前記Csn2アクセサリータンパク質は、配列番号4で示されるアミノ酸配列、又は配列番号4で示されるアミノ酸配列と少なくとも80%、85%、90%、95%、98%、又は99%の相同性をもつアミノ酸配列を有する。
前記CRISPR RNAは、CRISPRアレイから転写されて生成され、前記CRISPR RNAは、配列番号5で示されるRNA配列、又は配列番号5で示される核酸配列と少なくとも80%、85%、90%、95%、98%、又は99%の相同性をもつRNA配列を有し、前記CRISPRアレイは、直接反複配列(direct repeat sequence)とスペーサー配列とを含み、前記直接反複配列が、配列番号6で示される核酸配列、又は配列番号6で示される核酸配列と少なくとも80%、85%、90%、95%、98%、又は99%の相同性をもつ核酸配列を有し、前記スペーサー配列が、配列番号7で示される核酸配列、又は配列番号7で示される核酸配列と少なくとも80%、85%、90%、95%、98%、又は99%の相同性をもつ核酸配列を有する。
前記トランス活性化型CRISPR RNAは、CRISPR RNAの直接反複配列と相補的な配列を含有し、前記トランス活性化型CRISPR RNAは、配列番号8で示される核酸配列、又は配列番号8で示される核酸配列と少なくとも70%、80%、85%、90%、95%、98%、又は99%の相同性をもつ核酸配列を有する。
crRNAにtracrRNAが結合されてなるガイドRNAの骨格は、crRNA 直接反複配列の7~24ntと、対応する長さのtracrRNA配列とで構成され、この二つの部分は、「GAAA」、「TGAA」、「AAAC」などのリンカーを介して融合されてsgRNA骨格を形成することができ、好ましくは、20ntの直接反複配列と71ntのtracrRNA配列とが「GAAA」を介して融合されて形成されるsgRNA骨格が配列番号9で示され、さらに、上記sgRNA骨格に基づく好ましいバリアントは、
crRNAの直接反複配列の最初の18~14ntとtracrRNAの最後の69~65ntがリンカー配列(「GAAA」など)を介して融合されて形成されるsgRNA骨格であり、それが、さらに、
(ア)sgRNA骨格の長さが91ntであり、18ntの直接反複配列と69ntのtracrRNAとを含み、配列番号10で示される骨格、
(イ)sgRNA骨格の長さが89ntであり、17ntの直接反複配列と68ntのtracrRNAとを含み、配列番号11で示される骨格、
(ウ)sgRNA骨格の長さが87ntであり、16ntの直接反複配列と67ntのtracrRNAとを含み、配列番号12で示される骨格、
(エ)sgRNA骨格の長さが85ntであり、15ntの直接反複配列と66ntのtracrRNAとを含み、配列番号13で示される骨格、
(オ)sgRNA骨格の長さが83ntであり、14ntの直接反複配列と65ntのtracrRNAとを含み、配列番号14で示される骨格、
からなる群より選ばれる骨格であり、
前記sgRNA骨格は、配列番号9~14のいずれか1つと少なくとも70%、80%、85%、90%、95%、98%又は99%の相同性をもつ核酸配列を有しても良い。
前記Faecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムは、生物学的プロセス(例えば、遺伝子編集)において、特異的なDNAを結合又は切断し、特異的なDNAを結合又は切断することは、ガイドRNAが特異的なDNAの標的部位に相補して対になることで認識することにより実現され、前記ガイドRNAと特異的なDNAの標的部位との対になる結合部分の長さの範囲は、14~30bp(好ましくは、20~23bp)であり、前記特異的なDNAは、原核生物又は真核生物のDNAである。
前記ガイドRNAと特異的なDNAの標的部位との対になる結合部分の長さは、21bp、22bp又は23bpであり、ここで、前記RNPタンパク質複合体は、プロトスペーサー隣接モチーフ(PAM)に近接する14bpの塩基のミスマッチに非常に敏感であり、前記14bpが、シード領域である。
前記DNAを結合又は切断する機能に必要なプロトスペーサー隣接モチーフ配列は、ガイドRNA/sgRNA認識配列の下流の5′-NNTA-3′である。
本発明は、さらに、DNAの編集又は結合、CRISPRの活性化又はCRISPRの干渉のためのCRISPR/Cas9遺伝子編集システムを提供し、前記CRISPR/Cas9遺伝子編集システムは、上記のII型CRISPR/Cas9遺伝子編集システムである。好ましくは、前記DNAが、原核生物又は真核生物のDNAである。好ましくは、前記II型CRISPR/Cas9遺伝子編集システムが、Faecalibaculum rodentiumに由来するものである。
別の態様では、本発明は、また、ニッカーゼ、不活性型Cas9、塩基エディター(Base Editor)又はプライムエディター(Prime Editor)の製造のためのCRISPR/Cas9遺伝子編集システムを提供し、前記CRISPR/Cas9遺伝子編集システムは、上記のII型CRISPR/Cas9遺伝子編集システムである。好ましくは、ニッカーゼ、不活性型Cas9、塩基エディター(Base Editor)又はプライムエディター(Prime Editor)を製造するプロセスは、原核生物又は真核生物内に行われる。
従来技術と比較して、本発明の有益な効果は以下の通りである。
(1)本発明は、バイオインフォマティクス解析を通じて、Faecalibaculum rodentiumにおけるII型CRSIPR/Cas9遺伝子編集システムを発見し、当該遺伝子編集システムは、原核生物又は真核生物の遺伝子の編集に適用でき、遺伝子編集ツールボックスに新たな選択肢を提供する。
(2)本発明により提供されるFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムは、新たな理化学的性質を有し、複数の異なるPAM配列を認識することができ、当該遺伝子編集システムにより認識されるPAMの具体的な配列が、ガイドRNA/sgRNA認識配列の下流の5′-NNTA-3′である。
(3)本発明により提供されるFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムは、同じDNAサイトでの切断効率が、最も常用されるSpCas9よりも高く、そしてオフターゲット率が最も常用されるSpCas9よりも低く、より安全で効果的な遺伝子編集ツールである。
(4)本発明により提供されるFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムは、当該遺伝子編集システムで認識されたPAMが、回文の特徴を有し、その標的部位は、ゲノム上に「背中合わせ」で分布して存在し、密度がSpCas9よりも高い。
(5)本発明により提供されるFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムは、高い可塑性を有し、塩基エディター(Base Editor)とプライムエディター(Prime Editor)に改造することができ、異なるシナリオで適用できる遺伝子編集ツールである。
The present invention overcomes the deficiencies of the prior art, has new physicochemical properties, and is capable of producing multiple different PAM (protospacer adjacent motifs) including NGTA and NNTA (N represents A, C, G or T). It is an object of the present invention to provide a type II CRISPR/Cas9 gene editing system from Faecalibaculum rodentium that is capable of recognizing Flanking Motif) sequences.
In order to achieve the above objects, the technical means adopted in the present invention are:
A type II CRISPR/Cas9 gene editing system from Faecalibaculum rodentium, comprising Cas9 protein, accessory protein, crRNA (i.e. CRISPR RNA) and tracrRNA (i.e. transactivating CRISPR RNA), wherein Cas9 functions in the form of an RNP complex (i.e., a ribonucleoprotein complex) of a protein and a guide RNA formed by binding tracrRNA to crRNA,
The Cas9 protein is a DNA endonuclease, and the Cas9 protein is the amino acid sequence shown in SEQ ID NO: 1, or at least 80%, 85%, 90%, 95%, 98% of the amino acid sequence shown in SEQ ID NO: 1 %, or 99% homology.
Said Cas9 protein cleaves double-stranded DNA complementary to crRNA upstream of the PAM sequence with a nuclease domain, said nuclease domain being an HNH-like nuclease domain and/or a RuvC-like nuclease domain.
In some embodiments, the "ribonucleoprotein complex" is preferably the "FrCas9 protein complex" in the present invention.
The mutational status of some key amino acid positions of specific Cas9 proteins is described. Mutation of E at amino acid position 796 to A results in a Nickase nuclease, mutation of N at amino acid position 902 to A results in a Nickase nuclease, H at amino acid position 1010 to A. Mutation results in a nickase nuclease, mutation of D at amino acid position 1013 to A results in nickase nuclease, and mutation of E at amino acid position 796 and D at amino acid position 1013 to A at the same time. It results in a Cas9 nuclease that is incapable of cleaving but retains binding ability (ie, inactive Cas9 (dead Cas9)).
The accessory proteins include Cas1 accessory protein, Cas2 accessory protein and Csn2 accessory protein,
The Cas1 accessory protein is the amino acid sequence set forth in SEQ ID NO: 2, or an amino acid having at least 80%, 85%, 90%, 95%, 98%, or 99% homology with the amino acid sequence set forth in SEQ ID NO: 2 has an array,
The Cas2 accessory protein is the amino acid sequence set forth in SEQ ID NO: 3, or an amino acid having at least 80%, 85%, 90%, 95%, 98%, or 99% homology with the amino acid sequence set forth in SEQ ID NO: 3 has an array,
The Csn2 accessory protein is the amino acid sequence set forth in SEQ ID NO: 4 or an amino acid having at least 80%, 85%, 90%, 95%, 98%, or 99% homology with the amino acid sequence set forth in SEQ ID NO: 4 has an array.
The CRISPR RNA is generated by transcription from a CRISPR array, and the CRISPR RNA is at least 80%, 85%, 90%, 95% of the RNA sequence set forth in SEQ ID NO:5 or the nucleic acid sequence set forth in SEQ ID NO:5. , 98% or 99% homology, wherein the CRISPR array comprises a direct repeat sequence and a spacer sequence, wherein the direct repeat sequence is shown in SEQ ID NO: 6 a nucleic acid sequence or a nucleic acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% homology to the nucleic acid sequence set forth in SEQ ID NO: 6, wherein the spacer sequence comprises SEQ ID NO: 7 or a nucleic acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% homology with the nucleic acid sequence shown in SEQ ID NO:7.
The transactivating CRISPR RNA contains a sequence complementary to a direct repeat sequence of CRISPR RNA, and the transactivating CRISPR RNA is the nucleic acid sequence shown in SEQ ID NO: 8, or the nucleic acid shown in SEQ ID NO: 8 Have a nucleic acid sequence that is at least 70%, 80%, 85%, 90%, 95%, 98%, or 99% homologous to the sequence.
The backbone of the guide RNA, which is crRNA bound to tracrRNA, is composed of 7-24 nt of the crRNA direct repeat sequence and the corresponding length of the tracrRNA sequence, and these two parts are designated as "GAAA", "TGAA", can be fused via a linker such as "AAAC" to form an sgRNA backbone, preferably a sgRNA backbone formed by fusing a 20 nt direct repeat sequence and a 71 nt tracrRNA sequence via a "GAAA" is shown in SEQ ID NO: 9, and further preferred variants based on the sgRNA backbone are:
an sgRNA backbone formed by fusing the first 18-14 nt of the direct repeat sequence of the crRNA and the last 69-65 nt of the tracrRNA through a linker sequence (such as "GAAA"), which further comprises
(a) a backbone represented by SEQ ID NO: 10, which has a length of 91 nt and contains a direct repeat sequence of 18 nt and a tracrRNA of 69 nt;
(b) an sgRNA backbone having a length of 89 nt, containing a direct repeat sequence of 17 nt and a tracrRNA of 68 nt, and represented by SEQ ID NO: 11;
(c) an sgRNA backbone of 87 nt in length, containing a 16 nt direct repeat sequence and 67 nt of tracrRNA, and represented by SEQ ID NO: 12;
(d) an sgRNA backbone having a length of 85 nt, containing a direct repeat sequence of 15 nt and a tracrRNA of 66 nt, and represented by SEQ ID NO: 13;
(e) a backbone represented by SEQ ID NO: 14, which has a length of 83 nt and contains a direct repeat sequence of 14 nt and a tracrRNA of 65 nt;
A skeleton selected from the group consisting of
The sgRNA backbone may have a nucleic acid sequence with at least 70%, 80%, 85%, 90%, 95%, 98% or 99% homology to any one of SEQ ID NOs:9-14.
The type II CRISPR/Cas9 gene editing system from Faecalibaculum rodentium binds or cleaves specific DNA in a biological process (e.g., gene editing). The range of the length of the binding portion that is realized by recognizing the guide RNA by complementing and pairing with the target site of the specific DNA, and the pairing portion of the guide RNA and the target site of the specific DNA is , 14-30 bp (preferably 20-23 bp), and the specific DNA is prokaryotic or eukaryotic DNA.
The length of the paired binding portion of the guide RNA and the specific DNA target site is 21 bp, 22 bp or 23 bp, wherein the RNP protein complex is adjacent to a protospacer adjacent motif (PAM). It is very sensitive to 14 bp base mismatches, said 14 bp being the seed region.
The protospacer-adjacent motif sequence required for the DNA binding or cleaving function is 5'-NNTA-3' downstream of the guide RNA/sgRNA recognition sequence.
The present invention further provides a CRISPR/Cas9 gene editing system for editing or joining DNA, activating CRISPR or interfering with CRISPR, wherein the CRISPR/Cas9 gene editing system comprises the type II CRISPR/Cas9 gene Editing system. Preferably, said DNA is prokaryotic or eukaryotic DNA. Preferably, said type II CRISPR/Cas9 gene editing system is derived from Faecalibaculum rodentium.
In another aspect, the present invention also provides a CRISPR/Cas9 gene editing system for the production of Nickase, Inactive Cas9, Base Editor or Prime Editor, wherein said CRISPR/Cas9 The gene editing system is the Type II CRISPR/Cas9 gene editing system described above. Preferably, the process of producing the nickase, inactive Cas9, Base Editor or Prime Editor is performed in a prokaryote or eukaryote.
The beneficial effects of the present invention compared with the prior art are as follows.
(1) The present invention discovers a type II CRSIPR/Cas9 gene editing system in Faecalibaculum rodentium through bioinformatics analysis, and the gene editing system can be applied to edit prokaryotic or eukaryotic genes, gene editing tools Offer new options in the box.
(2) The type II CRISPR / Cas9 gene editing system derived from Faecalibaculum rodentium provided by the present invention has new physicochemical properties, can recognize a plurality of different PAM sequences, and the gene editing system A specific sequence of PAM that is recognized is 5'-NNTA-3' downstream of the guide RNA/sgRNA recognition sequence.
(3) The type II CRISPR / Cas9 gene editing system derived from Faecalibaculum rodentium provided by the present invention has a higher cutting efficiency at the same DNA site than the most commonly used SpCas9, and the most commonly used off-target rate It is a safer and more effective gene-editing tool than SpCas9.
(4) In the type II CRISPR / Cas9 gene editing system derived from Faecalibaculum rodentium provided by the present invention, the PAM recognized by the gene editing system has palindrome characteristics, and the target site is on the genome distributed "back-to-back" in , with a higher density than SpCas9.
(5) The type II CRISPR/Cas9 gene editing system derived from Faecalibaculum rodentium provided by the present invention has high flexibility and can be remodeled into a base editor (Base Editor) and a prime editor (Prime Editor), It is a gene editing tool that can be applied in different scenarios.

本発明に記載のFaecalibaculum rodentiumのII型CRISPR/Cas9遺伝子編集システムの構成図である。1 is a schematic diagram of the type II CRISPR/Cas9 gene editing system of Faecalibaculum rodentium according to the present invention. FIG. 本発明に記載のFaecalibaculum rodentiumのII型CRISPR/Cas9遺伝子編集システムのCas9タンパク質の構造模式図である。Fig. 2 is a structural schematic diagram of the Cas9 protein of the type II CRISPR/Cas9 gene editing system of Faecalibaculum rodentium according to the present invention; 本発明に記載のFaecalibaculum rodentiumのII型CRISPR/Cas9遺伝子編集システムが認識するガイドRNA分子のRNA二次構造の予測図、及び最適なsgRNA骨格の模式図である。図3Aは、95ntのgRNAの全長を示す図である。図3Bは、骨格長さが91ntであり、18ntの直接反復配列+69ntのtracrRNAであるgRNAを示す図である。図3Cは、骨格長さが89ntであり、17ntの直接反復配列+68ntのtracrRNAであるsgRNAを示す図である。図3Dは、骨格長さが87ntであり、16ntの直接反復配列+67ntのtracrRNAであるgRNAを示す図である。図3Eは、骨格長さが85ntであり、15ntの直接反復配列+66ntのtracrRNAであるsgRNAを示す図である。図3Fは、骨格長さが83ntであり、14ntの直接反復配列+65ntのtracrRNAであるsgRNAを示す図である。FIG. 2 is a schematic diagram of an optimal sgRNA backbone and a predicted RNA secondary structure of a guide RNA molecule recognized by the Faecalibaculum rodentium type II CRISPR/Cas9 gene editing system according to the present invention. FIG. 3A shows the full length of the 95nt gRNA. FIG. 3B shows a gRNA with a backbone length of 91 nt, 18 nt direct repeat plus 69 nt tracrRNA. FIG. 3C shows an sgRNA with a backbone length of 89 nt, 17 nt direct repeat plus 68 nt tracrRNA. FIG. 3D shows a gRNA with a backbone length of 87 nt, 16 nt direct repeat plus 67 nt tracrRNA. FIG. 3E shows an sgRNA with a backbone length of 85 nt, 15 nt direct repeat plus 66 nt tracrRNA. FIG. 3F shows an sgRNA with a backbone length of 83 nt, 14 nt direct repeat plus 65 nt tracrRNA. 本発明に記載のFaecalibaculum rodentiumのII型CRISPR/Cas9遺伝子編集システムの原核PAM配列の模式図である。FIG. 2 is a schematic representation of the prokaryotic PAM sequence of the Faecalibaculum rodentium type II CRISPR/Cas9 gene editing system according to the invention. 本発明に記載のFaecalibaculum rodentiumのII型CRISPR/Cas9遺伝子編集システムの原核干渉実験の模式図である。FIG. 2 is a schematic diagram of a prokaryotic interference experiment of the Faecalibaculum rodentium type II CRISPR/Cas9 gene editing system according to the present invention. 本発明に記載のFaecalibaculum rodentiumのII型CRISPR/Cas9遺伝子編集システムの真核切断の模式図である。図6Aは、ODN-PCRゲル電気泳動像である。図6Bは、サンガーシークエンシングによるピーク図である。FIG. 2 is a schematic representation of eukaryotic cleavage of the Faecalibaculum rodentium type II CRISPR/Cas9 gene editing system according to the present invention. FIG. 6A is an ODN-PCR gel electropherogram. FIG. 6B is a peak diagram from Sanger sequencing. 本発明に記載のFaecalibaculum rodentiumのII型CRISPR/Cas9遺伝子編集システムのsgRNAの最適長さの模式図である。図7Aは、HEK293 SITE2-T2部位での異なるsgRNA長さの切断効率を示す図である。図7Bは、DNMT1-T3部位での異なるsgRNA長さの切断効率を示す図である。図7Cは、RNF2-T6部位での異なるsgRNA長さの切断効率を示す図である。FIG. 2 is a schematic diagram of the optimal length of sgRNA for the Faecalibaculum rodentium type II CRISPR/Cas9 gene editing system according to the present invention. FIG. 7A shows cleavage efficiency of different sgRNA lengths at the HEK293 SITE2-T2 site. Figure 7B shows the cleavage efficiency of different sgRNA lengths at the DNMT1-T3 site. FIG. 7C shows the cleavage efficiency of different sgRNA lengths at the RNF2-T6 site. 本発明に記載のFaecalibaculum rodentiumのII型CRISPR/Cas9遺伝子編集システムのsgRNAの認識配列の最適長さを示す図である。Fig. 2 shows the optimal length of the recognition sequence of sgRNA of the Faecalibaculum rodentium type II CRISPR/Cas9 gene editing system according to the present invention. 本発明に記載のFaecalibaculum rodentiumのII型CRISPR/Cas9遺伝子編集システムのGUIDE-seqでのターゲット効率及びオフターゲットとSpCas9のGUIDE-seqでのターゲット効率及びオフターゲットとの比較を示す模式図である。FIG. 3 is a schematic diagram showing a comparison of the target efficiency and off-target in GUIDE-seq of the Faecalibaculum rodentium type II CRISPR/Cas9 gene editing system according to the present invention and the target efficiency and off-target in SpCas9 in GUIDE-seq. FrCas9-BE塩基エディターの実験結果図である。ここで、図10Aは、ODNブレークポイントPCRによりFrCas9ニッカーゼの形態を確認する原理図と結果である。図10Bは、nFrCas9-BE4Gramの編集ウィンドウである。図10Cは、nFrCas9-ABE7.10の編集ウィンドウである。図10Dは、ClinVarデータベースにおけるSpCas9とFrCas9塩基エディターで修正できる唯一の病原性突然変異のベン図である。図10Eは、2本の「背中合わせ」sgRNAを同時に使用するFrCas9-BE4GamのC>Tの編集効率を示す図である。FrCas9-BE base editor experimental results. Here, FIG. 10A is a principle diagram and results for confirming the form of FrCas9 nickase by ODN breakpoint PCR. FIG. 10B is the edit window of nFrCas9-BE4Gram. FIG. 10C is the edit window of nFrCas9-ABE7.10. FIG. 10D is a Venn diagram of the unique pathogenic mutations that can be corrected with the SpCas9 and FrCas9 base editors in the ClinVar database. FIG. 10E shows C>T editing efficiency of FrCas9-BE4Gam using two “back-to-back” sgRNAs simultaneously. ヒトゲノムでのFrCas9とSpCas9の標的部位の分布図である。ここで、図11Aは、GRCh38ヒトゲノム中の5′-GG-3′(SpCas9 PAMを表す)の分布を示す図である。図11Bは、GRCh38ヒトゲノム中の5′-TA-3′(FrCas9 PAMを表す)の分布を示す図である。FIG. 2 is a distribution map of target sites of FrCas9 and SpCas9 in the human genome. Here, Figure 11A shows the distribution of 5'-GG-3' (representing SpCas9 PAM) in the GRCh38 human genome. Figure 11B shows the distribution of 5'-TA-3' (representing FrCas9 PAM) in the GRCh38 human genome. FrCas9が特異的にTATAボックスを標的とすることのCRISPR干渉とCRISPR活性化への応用を示す図である。ここで、図12Aは、FrCas9の標的であるABCA1遺伝子のTATAボックスの模式図である。図12Bは、TATAボックスを標的とすることにより、FrCas9とSpCas9でCRISPR干渉を行ったり、TATAボックスを標的とすることにより、FrCas9とSpCas9でCRISPR活性化を行ったりすることを示す図である。図12Cは、TATAボックスを標的とすることにより、FrCas9とSpCas9でCRISPR活性化を行うことを示す図である。FIG. 4 shows the application of FrCas9 specifically targeting the TATA box to CRISPR interference and CRISPR activation. Here, FIG. 12A is a schematic diagram of the TATA box of the ABCA1 gene, which is the target of FrCas9. FIG. 12B shows CRISPR interference in FrCas9 and SpCas9 by targeting the TATA box and CRISPR activation in FrCas9 and SpCas9 by targeting the TATA box. FIG. 12C shows CRISPR activation in FrCas9 and SpCas9 by targeting the TATA box. プライム編集の遺伝子編集システムの模式図である。Schematic diagram of a gene editing system for prime editing. サンガーシークエンシングによるFrCas9-PE プライム編集システムの遺伝子編集作用の検証を示す図である。測定されたシーケンスは、CGAACACCTCAGGTAAT(配列番号33)である。FIG. 4 shows validation of the gene-editing action of the FrCas9-PE prime editing system by Sanger sequencing. The measured sequence is CGAACACCTCAGGTAAT (SEQ ID NO:33).

本発明の目的、技術案および利点をよりよく説明するために、以下、具体的な実施例に基づいて本発明をさらに説明する。
Faecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムは、Cas9タンパク質、アクセサリータンパク質、CRISPR RNA及びトランス活性化型CRISPR RNAを含み、図1に示すように、前記Cas9タンパク質は、DNAのエンドヌクレアーゼであり、前記Cas9タンパク質が、配列番号1で示されるアミノ酸配列、又は配列番号1で示されるアミノ酸配列と少なくとも80%、85%、90%、95%、98%、又は99%の相同性をもつアミノ酸配列を有する。
図2に示すように、本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムの好ましい実施形態として、前記Cas9タンパク質は、様々なヌクレアーゼドメインにより、PAM配列の上流でcrRNAと相補的な二本鎖DNAを切断し、前記様々なヌクレアーゼドメインは、HNH様ヌクレアーゼドメイン又はRuvC様ヌクレアーゼドメインである。
本発明に記載のCas9タンパク質(Faecalibaculum rodentium Cas9)は、単にFrCas9タンパク質ということもあり、1372個のアミノ酸(配列番号1)を含み、多ドメインかつ多機能のDNAのエンドヌクレアーゼである。上記Cas9タンパク質は、様々なヌクレアーゼドメインによりPAMの上流でsgRNAと相補的な二本鎖DNAを効率的に切断する。例えば、HNH様ヌクレアーゼドメインによりsgRNA配列と相補的なDNA鎖を切断したり、RuvC様ヌクレアーゼドメインにより非相補的なDNA鎖を切断したりする。ここで、796番目のアミノ酸位のEがAに突然変異するとニッカーゼヌクレアーゼになり、902番目のアミノ酸位のNがAに突然変異するとニッカーゼヌクレアーゼになり、1010番目のアミノ酸位のHがAに突然変異するとニッカーゼヌクレアーゼになり、1013番目のアミノ酸位のDがAに突然変異するとニッカーゼヌクレアーゼになり、796番目のアミノ酸位のEと1013番目のアミノ酸位のDが同時にAに突然変異すると切断能力がないが結合能力が維持されるCas9ヌクレアーゼになる。
本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムの好ましい実施形態として、前記アクセサリータンパク質は、Cas1アクセサリータンパク質、Cas2アクセサリータンパク質及びCsn2アクセサリータンパク質を含み、前記Cas1アクセサリータンパク質が、配列番号2で示されるアミノ酸配列、又は配列番号2で示されるアミノ酸配列と少なくとも80%、85%、90%、95%、98%、又は99%の相同性をもつアミノ酸配列を有し、前記Cas2アクセサリータンパク質が、配列番号3で示されるアミノ酸配列、又は配列番号3で示されるアミノ酸配列と少なくとも80%、85%、90%、95%、98%、又は99%の相同性をもつアミノ酸配列を有し、前記Csn2アクセサリータンパク質が、配列番号4で示されるアミノ酸配列、又は配列番号4で示されるアミノ酸配列と少なくとも80%、85%、90%、95%、98%、又は99%の相同性をもつアミノ酸配列を有する。
本発明に記載のアクセサリータンパク質Cas1、Cas2、Csn2は外来遺伝子の捕捉、及びcrRNAの成熟に関与する。
本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムの好ましい実施形態として、前記CRISPR RNAは、CRISPRアレイから転写されて生成され、前記CRISPR RNAが、配列番号5で示されるRNA配列を有し、前記CRISPRアレイが、直接反複配列とスペーサー配列とを含み、前記直接反複配列が、配列番号6で示され、前記スペーサー配列が、配列番号7で示される。
本発明に記載のCRISPR RNA(crRNA)は、塩基対の相補性を利用し、Casタンパク質を誘導して侵入した外来ゲノムを認識する。細菌は、バクテリオファージやウイルスなどに暴露されている時、外来DNAの短い断片が新しいスペーサーとして宿主の染色体内のCRISPR反復スペーサー配列の間に組み込まれることにより、感染の遺伝的記録を提供し、生体に外来遺伝子が再侵入した時、crRNA前駆体(pre-crRNA)は、CRISPRアレイから転写されて生成され、その5′末端に外部から侵入した遺伝子の配列と相補し、長さが30bpであるスペーサー配列を、3′末端に長さが36bpである反複配列を持っている。
本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムの好ましい実施形態として、前記トランス活性化型CRISPR RNAは、CRISPR RNA直接反複配列と相補する配列を含有し、前記トランス活性化型CRISPR RNAが、配列番号8で示される。
本発明に記載のトランス活性化型crRNA(tracrRNA)は、タンパク質をコードしないRNAであり、crRNAの成熟およびsgRNAの形成に関与する。pre-crRNAは、tracrRNAおよびCas9ヌクレアーゼの作用でスペーサー配列の上流の0~16ntおよび反復配列の下流の12~29ntを切り取って、成熟したcrRNAを形成し、さらにtracrRNAと結合してtracrRNA-crRNA複合体を形成する。当該複合体は、長さが14~30bpであり、外来DNAの配列を認識する部分を含む。crRNAの下流とtracrRNAの上流との間に、「GAAA」、「TGAA」または「AAAC」配列のような4塩基のテトラループ(tetraloop)を追加することにより、tracrRNAとcrRNAを連結してsgRNAを形成することができる。このようなsgRNAは、上流の2つのバルジ(bulge)構造と3つの二重らせん(duplex)構造、および下流の1つのステムループ(stem loop)構造を含み、さらに、外来DNAの配列を認識する部分と骨格部分に分けることができる。
sgRNAの外来DNAの配列を認識する部分の長さとtracrRNAの長さを調整することにより、エンドヌクレアーゼの切断作用をさらに最適化することができる。本発明の先行実験から、sgRNAの外来DNAの配列を認識する部分の長さとしては、21bp、22bpまたは23bpが最適であり(図8)、骨格部分の最適な長さは、図3と図7に示すように、91nt(18ntのcrRNA直接反複配列+69ntのtracrRNA)、89nt(17ntのcrRNA直接反複配列+68ntのtracrRNA)、87nt(16ntのcrRNA直接反複配列+67ntのtracrRNA)、85nt(15ntのcrRNA直接反複配列+66ntのtracrRNA)、83nt(14ntのcrRNA直接反複配列+65ntのtracrRNA)の5種類であることが証明された。
本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムの好ましい実施形態としては、前記Faecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムは、生物学的プロセスでDNAを結合又は切断する。
本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムの好ましい実施形態としては、前記DNAが、原核生物又は真核生物のDNAである。
いくつかの実施例では、本発明のFrCas9は、複数種類の、標的配列の下流側に隣接するプロトスペーサー隣接モチーフ(PAM)を認識してDNA二本鎖分子の切断(DSB)を引き起こすことができる。FrCas9タンパク質が標的配列を認識するには、crRNAスペーサー配列と相補的なヌクレオチド、及び、相補する配列に隣接するプロトスペーサー隣接モチーフ(Protospacer Adjacent Motif、PAM)という二つの重要な要素が必要である。図4に示すように、枯渇実験により、FrCas9が原核系で切断作用を有することが明らかになり、この新たに発見されたII型CRISPR/Cas9システムで認識されるPAM配列の3、4位がTAであることが初歩的に検証された。さらに、図5に示すように、干渉実験により、FrCas9が認識した標的配列の下流のPAMが、5′-NNTA-3′であることが実証された。図6に示すように、上記のPAMは、いずれも真核に関する実験で検証された。crRNA中のスペーサー配列を人為的に設計することにより、このようなCRISPR-Cas9システムは、ゲノム中のほぼすべての関心のあるDNA配列を標的にすることができ、平滑末端を生成する部位特異的な二本鎖切断(DSB)を産生する。非相同性末端結合でDSBを修復することにより、切断部位に小さなランダム挿入/欠損(indels)が生じて目的遺伝子を不活性化させる。あるいは、高忠実度の相同組換え(homologous recombination)修復により、相同組換え修復テンプレートを用いてDSB部位で正確なゲノム修飾を行うことができる。
多くのヒトの遺伝病は、単塩基突然変異によるものであり、伝統的な方法では治療できない。塩基エディターは、正確な遺伝子編集を実現する最新かつ最も効果的な方法の一つである。その特徴としては、ニッキング(nicking)型のCRISPR-Casタンパク質により特定の標的DNAの位置を特定し、二本鎖DNAの切断を起こさずにDNAデアミナーゼを使用してこのような標的DNAを修飾および変異させ、病変塩基に対して修正を行う。いくつかの実施形態では、E796A nFrCas9と最適化された第四世代シチジン塩基エディターBE4Gamとを結合して、DNA中の塩基対C:GをT:Aに変異させるE796A nFrCas9-BEGamシトシン塩基エディター(CBE)を構築することができ、E796A nFrCas9と第七世代アデニン塩基エディターABE7.10とを結合して、塩基対A:TをG:Cに変異させるE796A nFrCas9-BABE7.10アデニン塩基エディター(ABE)を構築することができる。
いくつかの実施形態では、本発明のFrCas9の特異的なPAMは、NNTAであり、TATAボックス(真核生物プロモーターを構成する素子の一つ)に特異的な標的部位を有するため、FrCas9が特異的にTATAボックスを標的とすることで、独特のCRISPR干渉(CRISPRi)/CRISPR活性化(CRISPRa)の効果を発揮することができる。ここで、CRISPRiは、活性型のFrCas9を利用してTATAボックスを直接標的切断してTATAボックスを破壊するか、または切断活性を持たないdFrCas9(即ち、不活性型Cas9)をTATAボックスに直接結合させることにより実現されることができる。CRISPRaは、dFrCas9-VP64がTATAボックスサイトを標的とすることにより実現されることができるが、これらに限定されない。
プライム編集(Prime Editing、PE)は、まったく新しい正確な遺伝子編集ツールである。この技術は、単一塩基の自由な置換と複数の塩基の正確な挿入や欠失を実現し、遺伝子編集の過程でインデル(indels)によって生成される有害な副産物を大幅に低減し、編集精度を大幅に向上させることができ、遺伝子編集の著しい進歩であると広く考えられている。いくつかの実施形態では、本発明のFrCas9を逆転写酵素と融合させ、そのPAM配列に基づいて対応するpegRNAを設計して、FrCas9-PE遺伝子編集システムを構築することができる。具体的には、pegRNAの3′末端の配列には2つの配列が付加される。第1の配列は、プライマー結合部位(PBS)であって、切断された標的DNA鎖の末端に相補して、逆転写プロセスを開始させることができ、第2の配列は、逆転写テンプレート(RTテンプレート)であって、標的点変異または挿入欠失変異を有することにより正確な遺伝子編集を達成する。
本発明のさらなる目的は、原核生物または真核生物の遺伝子の編集、CRISPR活性化またはCRISPR干渉における上記Faecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムの使用を提供することである。
本発明に記載の使用の好ましい実施形態として、上記Faecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムは、DNAレベルでDNAを結合または切断するために使用される。
実施例1
本実施例では、本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムで認識されるガイドRNA分子のRNA二次構造を予測し、tracrRNAと反復配列から転写されたRNAとの結合過程を模擬することにより、両者の結合後のRNA構造を予測し、得られたRNA二次構造を図3に示す。
(1)材料:予測されたtracrRNAおよびrepeat配列、ならびに予測された抗反復(anti-repeat)配列。
(2)ソフトウェア:NUPACK(http://www.nupack.org/partition/new)
(3)予測方法:オンラインアプリであるNUPACKにより、それぞれ1μlの2種類のRNAの、37℃でインビトロでの相互作用プロセスを模擬し、得られたRNA組成物の二次構造を予測し、図2に示すようなRNA二次構造が得られた。
図3から分かるように、pre-crRNAは、tracrRNAおよびCas9ヌクレアーゼによってスペーサー配列の上流の0~16ntおよび反復配列の下流の12~29ntを切り取って、成熟したcrRNAを形成し、tracrRNAと融合させてtracrRNA-crRNA複合体を形成した。この複合体は、配列長さが14~30bpである、スペーサー配列と相補的な外来DNAの配列を含んだ。crRNAの下流とtracrRNAの上流との間に4塩基のテトラループを追加することで、それらを連結して、上流の2つのバルジ構造および3つの二重らせん構造と、下流の3つのステムループ構造とを含むsgRNAを形成することができる。
実施例2
本実施例では、本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムが原核系で認識するプロトスペーサー隣接モチーフ(PAM)が5′-NNTA-3′であることを見出した。
(1)材料:上記実施例により予測されたCRISPR/Cas9遺伝子編集システムに関連する遺伝子。
(2)検証方法:本実施例では、本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムについて原核生物検証システムを構築し、その切断効果を検証し、認識されるPAM配列を第2世代シーケンシング技術により予備探索し、その結果を図4に示す。
詳細な流れは以下の通りである。
(a)本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システム(エンドヌクレアーゼCas9、アクセサリータンパク質Cas1、Cas2、Csn2、CRISPRアレイ及びノンコーディング(non-coding)RNAであるtracrRNAを含む。)をpACYC184ベクターに挿入し、Cas9タンパク質について大腸菌コドン最適化を行い、CRISPRアレイに天然のスペーサー配列およびライブラリー中のスペーサー配列を付加し、さらにCas9タンパク質、CRISPRアレイの上流に強力な異種プロモーター(heterologous promoter)J23119を付加し、原核発現pACYC184-FrCas9プラスミドを構築した。
(b)ライブラリーのスペーサー配列の3′末端に7つのランダム塩基(合計16384つの挿入断片)を付加し、pUC19ベクターのマルチクローニングサイト(MCS)にEcoRI切断部位とNcoI切断部位という2つの酵素切断部位を選択し、ライブラリーをベクターにクローニングし、ターゲット-ライブラリープラスミドを構築した。
(c)pACYC184-FrCas9を含みまたは空ベクターのpACYC184プラスミドおよびターゲット-ライブラリープラスミドを共に電気的形質転換法により大腸菌DH5aに導入し、25℃で2時間蘇生した後、アンピシリンナトリウム(100μg/ml)およびクロラムフェニコール(34μg/ml)の両耐性を含むSOB培地に均一に塗布し、25℃で30時間インキュベートした後、アルカリ溶菌法によりプラスミドを回収した。
(d)PCRによりスペーサー配列と7つのランダム塩基を含む領域を増幅し、PCR産物の両端にリンカーをつけて次世代シーケンシングを行い、空ベクター対照群に対するPAM枯渇閾値(PPDV)を算出し、Weblogoを利用して本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムの5′-NNTA-3′であるPAM配列を生成した。
図3は本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムが原核系で認識したプロトスペーサー隣接モチーフ保存性PAM配列の模式図であり、枯渇実験によって得られたDNAライブラリーを次世代シークエンシング分析し、空ベクター対照群に対するPAM枯渇閾値(PPDV)を算出し、Weblogoを利用して生成されたFrCas9のPAM配列が、5′-NNTA-3′であった。
実施例3
本実施例は、干渉実験により本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムで認識されるプロトスペーサー隣接モチーフ(PAM)を検証し、その原核生物レベルでの切断能力と真核生物での潜在的な遺伝子編集能力を確認した。干渉実験の結果を図5に示す。本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムが認識する複数の可能なPAM配列の模式図を図5に示す。
In order to better describe the purpose, technical solution and advantages of the present invention, the present invention is further described below based on specific examples.
The type II CRISPR/Cas9 gene editing system derived from Faecalibaculum rodentium contains Cas9 protein, accessory proteins, CRISPR RNA and transactivating CRISPR RNA, and as shown in FIG. 1, the Cas9 protein is a DNA endonuclease. wherein the Cas9 protein has at least 80%, 85%, 90%, 95%, 98%, or 99% homology to the amino acid sequence shown in SEQ ID NO: 1, or the amino acid sequence shown in SEQ ID NO: 1 It has an amino acid sequence.
As shown in Figure 2, as a preferred embodiment of the type II CRISPR/Cas9 gene editing system from Faecalibaculum rodentium according to the present invention, the Cas9 protein is complemented with crRNA upstream of the PAM sequence by various nuclease domains. The various nuclease domains are HNH-like nuclease domains or RuvC-like nuclease domains.
The Cas9 protein (Faecalibaculum rodentium Cas9) according to the present invention, sometimes simply called FrCas9 protein, contains 1372 amino acids (SEQ ID NO: 1) and is a multidomain and multifunctional DNA endonuclease. The Cas9 protein efficiently cleaves double-stranded DNA complementary to sgRNA upstream of the PAM by means of various nuclease domains. For example, the HNH-like nuclease domain cleaves the DNA strand complementary to the sgRNA sequence, and the RuvC-like nuclease domain cleaves the non-complementary DNA strand. Here, mutation of E at amino acid position 796 to A results in a nickase nuclease, mutation of N at amino acid position 902 to A results in a nickase nuclease, and H at amino acid position 1010 to A. Mutation of D at amino acid position 1013 to A results in nickase nuclease, E at amino acid position 796 and D at amino acid position 1013 are simultaneously mutated to A This results in a Cas9 nuclease that is incapable of cutting but retains binding ability.
As a preferred embodiment of the type II CRISPR/Cas9 gene editing system from Faecalibaculum rodentium according to the present invention, said accessory proteins comprise a Cas1 accessory protein, a Cas2 accessory protein and a Csn2 accessory protein, wherein said Cas1 accessory protein has the sequence Having an amino acid sequence represented by number 2 or an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% homology with the amino acid sequence represented by SEQ ID NO: 2, said Cas2 The accessory protein has the amino acid sequence set forth in SEQ ID NO:3, or an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% homology to the amino acid sequence set forth in SEQ ID NO:3. wherein the Csn2 accessory protein has the amino acid sequence set forth in SEQ ID NO:4 or at least 80%, 85%, 90%, 95%, 98%, or 99% homology to the amino acid sequence set forth in SEQ ID NO:4 has an amino acid sequence with
The accessory proteins Cas1, Cas2, Csn2 according to the invention are involved in foreign gene capture and maturation of crRNA.
As a preferred embodiment of the type II CRISPR/Cas9 gene editing system derived from Faecalibaculum rodentium according to the present invention, the CRISPR RNA is produced by being transcribed from a CRISPR array, and the CRISPR RNA is the RNA shown in SEQ ID NO: 5 wherein said CRISPR array comprises direct repeat sequences and spacer sequences, said direct repeat sequences being shown in SEQ ID NO:6 and said spacer sequences being shown in SEQ ID NO:7.
The CRISPR RNAs (crRNAs) described in the present invention exploit base-pair complementarity to induce Cas proteins to recognize invading foreign genomes. Bacteria, when exposed to bacteriophages, viruses, etc., provide a genetic record of infection by incorporating short pieces of foreign DNA as new spacers between CRISPR repeat spacer sequences in the host chromosome; When a foreign gene re-invades the organism, a crRNA precursor (pre-crRNA) is generated by being transcribed from the CRISPR array, and its 5′ end is complementary to the sequence of the gene that has invaded from outside, and is 30 bp in length. A spacer sequence has a repeat sequence 36 bp in length at the 3' end.
As a preferred embodiment of the Faecalibaculum rodentium type II CRISPR/Cas9 gene editing system according to the present invention, said transactivating CRISPR RNA contains a sequence complementary to a CRISPR RNA direct repeat sequence, and said transactivating A type CRISPR RNA is shown in SEQ ID NO:8.
Trans-activating crRNAs (tracrRNAs) according to the present invention are RNAs that do not encode proteins and are involved in maturation of crRNAs and formation of sgRNAs. The pre-crRNA cleaves 0-16 nt upstream of the spacer sequence and 12-29 nt downstream of the repeat sequence by the action of tracrRNA and Cas9 nuclease to form mature crRNA, which further binds to tracrRNA to form a tracrRNA-crRNA complex. form the body. The complex is 14-30 bp in length and contains a portion that recognizes a sequence of foreign DNA. By adding a tetraloop of four bases, such as a "GAAA", "TGAA" or "AAAC" sequence, between the crRNA downstream and the tracrRNA upstream, the tracrRNA and crRNA are linked to form an sgRNA. can be formed. Such sgRNAs contain two bulge structures and three duplex structures upstream, and one stem loop structure downstream, and also recognize sequences of foreign DNA. It can be divided into partial and skeletal parts.
By adjusting the length of the portion of the sgRNA that recognizes the foreign DNA sequence and the length of the tracrRNA, the cleavage action of the endonuclease can be further optimized. From previous experiments of the present invention, the optimal length of the portion of the sgRNA that recognizes the foreign DNA sequence is 21 bp, 22 bp or 23 bp (FIG. 8), and the optimal length of the backbone portion is shown in FIGS. 7, 91 nt (18 nt crRNA direct repeat + 69 nt tracrRNA), 89 nt (17 nt crRNA direct repeat + 68 nt tracrRNA), 87 nt (16 nt crRNA direct repeat + 67 nt tracrRNA), 85 nt (15 nt crRNA It was proved that there are five types of 83 nt (direct repeat sequence + 66 nt tracrRNA) and 83 nt (14 nt crRNA direct repeat sequence + 65 nt tracrRNA).
In a preferred embodiment of the type II CRISPR/Cas9 gene editing system derived from Faecalibaculum rodentium according to the present invention, said type II CRISPR/Cas9 gene editing system derived from Faecalibaculum rodentium binds DNA in a biological process or disconnect.
In a preferred embodiment of the Faecalibaculum rodentium type II CRISPR/Cas9 gene editing system according to the present invention, said DNA is prokaryotic or eukaryotic DNA.
In some embodiments, the FrCas9 of the present invention can recognize multiple types of protospacer adjacent motifs (PAMs) flanking the downstream side of the target sequence to cause DNA double-stranded molecular breaks (DSBs). can. Recognition of the target sequence by the FrCas9 protein requires two key elements: the nucleotides complementary to the crRNA spacer sequence and the Protospacer Adjacent Motif (PAM) flanking the complementary sequence. As shown in Figure 4, depletion experiments revealed that FrCas9 has a cleaving effect in the prokaryotic system, with positions 3 and 4 of the PAM sequence recognized by this newly discovered type II CRISPR/Cas9 system It was rudimentary verified to be TA. Furthermore, as shown in Figure 5, interference experiments demonstrated that the PAM downstream of the target sequence recognized by FrCas9 was 5'-NNTA-3'. As shown in FIG. 6, all of the above PAMs were verified in eukaryotic experiments. By artificially designing spacer sequences in crRNA, such CRISPR-Cas9 systems can target almost any DNA sequence of interest in the genome, generating site-specific blunt ends. produces a double-strand break (DSB). By repairing the DSB with non-homologous end joining, small random insertions/deletions (indels) at the break site are generated to inactivate the gene of interest. Alternatively, high-fidelity homologous recombination repair can be used to make precise genomic modifications at DSB sites using homologous recombination repair templates.
Many human genetic diseases are due to single nucleotide mutations and cannot be cured by traditional methods. Base editors are one of the newest and most effective ways to achieve precise gene editing. It features a nicking version of the CRISPR-Cas protein that locates specific target DNA and uses DNA deaminase to modify and modify such target DNA without causing double-stranded DNA breaks. Mutate and correct for the diseased base. In some embodiments, the E796A nFrCas9-BEGam cytosine base editor combines E796A nFrCas9 with the optimized fourth generation cytidine base editor BE4Gam to mutate base pairs C:G to T:A in DNA ( E796A nFrCas9-BABE7.10 adenine base editor (ABE) that combines E796A nFrCas9 with the seventh generation adenine base editor ABE7.10 to mutate the base pair A:T to G:C. ) can be constructed.
In some embodiments, the specific PAM of FrCas9 of the present invention is NNTA and has a target site specific to the TATA box (one of the elements that make up the eukaryotic promoter), so FrCas9 is specific By specifically targeting the TATA box, unique CRISPR interference (CRISPRi)/CRISPR activation (CRISPRa) effects can be exerted. Here, CRISPRi either utilizes active FrCas9 to directly target cleave the TATA box to destroy it, or dFrCas9 without cleavage activity (i.e., inactive Cas9) directly binds to the TATA box. It can be realized by letting CRISPRa can be achieved by, but not limited to, dFrCas9-VP64 targeting the TATA box site.
Prime Editing (PE) is an entirely new precision gene editing tool. This technology enables free substitution of single bases and precise insertions and deletions of multiple bases, greatly reducing harmful by-products produced by indels in the process of gene editing, and improving editing accuracy. can be greatly improved and is widely considered to be a significant advance in gene editing. In some embodiments, the FrCas9 of the present invention can be fused with reverse transcriptase and the corresponding pegRNA can be designed based on its PAM sequence to construct the FrCas9-PE gene editing system. Specifically, two sequences are added to the 3' end sequence of pegRNA. The first sequence is the primer binding site (PBS) and can complement the ends of the cleaved target DNA strand to initiate the reverse transcription process, and the second sequence is the reverse transcription template (RT templates) and have targeted point mutations or indel mutations to achieve precise gene editing.
It is a further object of the present invention to provide the use of the type II CRISPR/Cas9 gene editing system from Faecalibaculum rodentium in prokaryotic or eukaryotic gene editing, CRISPR activation or CRISPR interference.
As a preferred embodiment of the use according to the invention, the type II CRISPR/Cas9 gene editing system from Faecalibaculum rodentium is used to join or cleave DNA at the DNA level.
Example 1
In this example, the RNA secondary structure of the guide RNA molecule recognized by the type II CRISPR / Cas9 gene editing system derived from Faecalibaculum rodentium according to the present invention is predicted, and the RNA transcribed from the tracrRNA and the repetitive sequence is predicted. By simulating the binding process, the RNA structure after binding of both was predicted, and the obtained RNA secondary structure is shown in FIG.
(1) Materials: predicted tracrRNA and repeat sequences, and predicted anti-repeat sequences.
(2) Software: NUPACK (http://www.nupack.org/partition/new)
(3) Prediction method: NUPACK, an online application, simulates the in vitro interaction process of 1 µl of each of the two RNAs at 37°C, and predicts the secondary structure of the resulting RNA composition. An RNA secondary structure as shown in 2 was obtained.
As can be seen from FIG. 3, the pre-crRNA is excised by tracrRNA and Cas9 nuclease from 0-16 nt upstream of the spacer sequence and 12-29 nt downstream of the repeat sequence to form the mature crRNA and fuse with the tracrRNA. A tracrRNA-crRNA complex was formed. This complex contained a sequence of foreign DNA complementary to the spacer sequence, with a sequence length of 14-30 bp. Adding a 4-nt tetraloop between the crRNA downstream and the tracrRNA upstream connects them to form two bulge and three double helix structures upstream and three stem-loop structures downstream. can form an sgRNA comprising
Example 2
In this example, the protospacer adjacent motif (PAM) recognized in the prokaryotic system by the type II CRISPR/Cas9 gene editing system derived from Faecalibaculum rodentium according to the present invention was found to be 5'-NNTA-3'. .
(1) Materials: genes related to the CRISPR/Cas9 gene editing system predicted by the above examples.
(2) Verification method: In this example, a prokaryotic verification system was constructed for the type II CRISPR/Cas9 gene editing system derived from Faecalibaculum rodentium according to the present invention, the cleavage effect was verified, and the recognized PAM sequence was preliminarily searched by second generation sequencing technology and the results are shown in FIG.
The detailed flow is as follows.
(a) Type II CRISPR/Cas9 gene editing system from Faecalibaculum rodentium according to the present invention, comprising endonuclease Cas9, accessory proteins Cas1, Cas2, Csn2, CRISPR array and non-coding RNA tracrRNA ) was inserted into the pACYC184 vector, E. coli codon-optimized for the Cas9 protein, the CRISPR array was added with the native spacer sequence and the spacer sequence in the library, and the Cas9 protein, a strong heterologous promoter upstream of the CRISPR array. (heterologous promoter) J23119 was added to construct a prokaryotic expression pACYC184-FrCas9 plasmid.
(b) adding 7 random bases (total of 16384 inserts) to the 3′ end of the spacer sequence of the library and cleaving the multiple cloning site (MCS) of the pUC19 vector with two enzymes, EcoRI and NcoI sites; Sites were selected and the library cloned into a vector to construct the target-library plasmid.
(c) Both the pACYC184 plasmid containing pACYC184-FrCas9 or the empty vector and the target-library plasmid were introduced into E. coli DH5a by the electrotransformation method, revived at 25°C for 2 hours, and then treated with ampicillin sodium (100 µg/ml). and chloramphenicol (34 μg/ml), and incubated at 25° C. for 30 hours, after which plasmids were recovered by alkaline lysis.
(d) Amplify a region containing a spacer sequence and 7 random bases by PCR, attach linkers to both ends of the PCR product, perform next-generation sequencing, and calculate the PAM depletion threshold (PPDV) relative to the empty vector control group, Weblogo was used to generate a PAM sequence that is 5'-NNTA-3' of the type II CRISPR/Cas9 gene editing system from Faecalibaculum rodentium described in this invention.
FIG. 3 is a schematic diagram of protospacer-adjacent-motif-conserved PAM sequences recognized in the prokaryotic system by the type II CRISPR/Cas9 gene editing system derived from Faecalibaculum rodentium according to the present invention, and the DNA library obtained by depletion experiments. was analyzed by next-generation sequencing to calculate the PAM depletion threshold (PPDV) relative to the empty vector control group, and the PAM sequence of FrCas9 generated using Weblogo was 5'-NNTA-3'.
Example 3
This example validates the protospacer adjacent motif (PAM) recognized by the type II CRISPR/Cas9 gene editing system from Faecalibaculum rodentium according to the present invention by interference experiments and demonstrates its prokaryotic-level cleavage ability and A potential gene-editing capability in eukaryotes was confirmed. The results of interference experiments are shown in FIG. A schematic representation of several possible PAM sequences recognized by the type II CRISPR/Cas9 gene editing system from Faecalibaculum rodentium according to the present invention is shown in FIG.

(1)材料:実施例で得られたpACYC184-FrCas9、ターゲット-ライブラリープラスミド、初歩的に認識されたPAM。
(2)検証方法:本実施例は、干渉実験により、本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムが原核系で認識したプロトスペーサー隣接モチーフ(PAM)を更に確定した。
具体的な操作は次のとおりである。
(a)スペーサー配列の3′末端にNNTAの合計16種類の組み合わせ配列を付加し、EcoRI酵素切断部位とNcoI酵素切断部位のそれぞれからpUC19にクローニングしてターゲットプラスミドを構築した。
(b)16種類のターゲットプラスミドを、それぞれ、FrCas9関連遺伝子座を含むエレクトロポレーション用コンピテントセルの状態にした大腸菌DH5aに導入し、25℃で2時間蘇生した後、段階的に希釈し、アンピシリンナトリウム(100μg/ml)とクロラムフェニコール(34μg/ml)の両耐性を含むSOB培地に点状に塗布して、25℃で一晩インキュベートして、モノクローナル細菌数を観察した。
図5Cは、本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムの干渉実験の模式図である。枯渇実験で発見されたNNTAに基づいて、16種類のNNの異なる組み合わせのターゲットプラスミドを構築し、干渉実験によってモノクローナルコロニー数を観察した。図5Aの一番左の列は単独のFrCas9の場合、右側はFrCas9で目標プラスミドを標的切断した場合であり、その結果、右側の列のコロニー数はいずれも減少していることがわかった。図5Bは、本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムで認識された多種のPAM配列の切断効果の統計図であり、この図は14種類のNNの異なる組み合わせのターゲットプラスミドのcfu(コロニー形成単位)が対照群よりも低下していることを示した。以上の結果から明らかなように、新たに発見されたCRISPR/Cas9システムが原核系で認識しているプロトスペーサー隣接モチーフ(PAM)は5′-NNTA-3′である(NはA、T、C、G中の任意の塩基を表す)ことが干渉実験によって検証された。
実施例4
本実施例では、本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムにおいて、標的DNA配列を切断するために必要なtracrRNAの範囲を干渉実験により検証した。干渉実験の結果を図5Cに示す。
(1) Materials: pACYC184-FrCas9 obtained in Example 2 , target-library plasmid, rudimentary recognized PAM.
(2) Verification method: This example further determined the protospacer adjacent motif (PAM) recognized in the prokaryotic system by the type II CRISPR/Cas9 gene editing system derived from Faecalibaculum rodentium according to the present invention by interference experiments. .
Specific operations are as follows.
(a) A total of 16 combinations of NNTA sequences were added to the 3' end of the spacer sequence and cloned into pUC19 from each of the EcoRI and NcoI enzyme cleavage sites to construct a target plasmid.
(b) Each of the 16 types of target plasmids was introduced into E. coli DH5a in the state of competent cells for electroporation containing the FrCas9-related locus, revived at 25 ° C. for 2 hours, and then diluted stepwise, The SOB medium containing both ampicillin sodium (100 μg/ml) and chloramphenicol (34 μg/ml) resistance was applied in dots, incubated overnight at 25° C., and the number of monoclonal bacteria was observed.
FIG. 5C is a schematic representation of an interference experiment of the type II CRISPR/Cas9 gene editing system from Faecalibaculum rodentium according to the present invention. Based on the NNTAs discovered in depletion experiments, target plasmids with different combinations of 16 NNs were constructed, and monoclonal colony numbers were observed by interference experiments. The leftmost column in FIG. 5A is for FrCas9 alone, and the right side is for targeted cleavage of the target plasmid with FrCas9. FIG. 5B is a statistical diagram of the cleavage effects of various PAM sequences recognized by the type II CRISPR/Cas9 gene editing system from Faecalibaculum rodentium according to the present invention, which shows different combinations of 14 NNs. It showed that the cfu (colony forming unit) of the target plasmid was lower than that of the control group. As is clear from the above results, the protospacer adjacent motif (PAM) recognized by the newly discovered CRISPR/Cas9 system in the prokaryotic system is 5'-NNTA-3' (N is A, T, C, representing any base in G) was verified by interference experiments.
Example 4
In this example, the extent of tracrRNA required to cleave target DNA sequences in the type II CRISPR/Cas9 gene editing system from Faecalibaculum rodentium according to the present invention was verified by interference experiments. The results of the interference experiment are shown in Figure 5C.

(1)材料:実施例で得られたpACYC184-FrCas9、ターゲットプラスミド、初歩的に認識されたPAM。
(2)検証方法:本実施例は、干渉実験により、本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムが原核系で標的DNA配列を切断するために必要なtracrRNA範囲をさらに確認した。
具体的な操作は次のとおりである。
(a)Gibsonクローン法により、野生型Faecalibaculum rodentium中のすべての可能なノンコーディング領域(Noncoding)の合計6つの遺伝子配列をそれぞれターゲットプラスミドにクローニングし、ターゲット-NC 1~6プラスミドを構築する。ここで、NC6はノンコーディング領域の全長がつなぎ合わされたものであり、NC1~5は、それぞれ第1~第5の可能なノンコーディング領域を表した。各NCプラスミドは、ノンコーディング領域の上流に強力な異種プロモーターJ23119が付加され、それぞれ「+」で順方向のノンコーディング領域を表し、「-」は逆方向のノンコーディング領域を表した。
(1) Materials: pACYC184-FrCas9 obtained in Example 2 , target plasmid, rudimentary recognized PAM.
(2) Verification method: This example uses an interference experiment to determine the tracrRNA range necessary for the type II CRISPR/Cas9 gene editing system derived from Faecalibaculum rodentium according to the present invention to cleave the target DNA sequence in a prokaryotic system. Confirmed further.
Specific operations are as follows.
(a) A total of 6 gene sequences of all possible noncoding regions (Noncoding) in wild-type Faecalibaculum rodentium are each cloned into target plasmids by Gibson cloning method to construct target-NC 1-6 plasmids. Here, NC6 is the full-length noncoding region concatenated, and NC1-5 represent the first to fifth possible noncoding regions, respectively. Each NC plasmid had a strong heterologous promoter J23119 added upstream of the non-coding region, with "+" representing the forward non-coding region and "-" representing the reverse non-coding region.

(b)実施例で得られたpACYC184-FrCas9は、PCR相同組換えの方法により、すべての可能なノンコーディング領域を除去し、CRISPR関連タンパク質とCRISPRアレイの遺伝子配列を保持し、pACYC184-ΔFrCas9を構築した。
(c)12種類のターゲット-NCプラスミドをそれぞれpACYC184-ΔFrCas9を含む、エレクトロポレーション用コンピテントセルの状態にした大腸菌DH5aに導入し、25℃で2時間蘇生した後、段階的に希釈し、アンピシリンナトリウム(100μg/ml)とクロラムフェニコール(34μg/ml)の両耐性を含むSOB培地に点状に塗布して、25℃で一晩インキュベートし、モノクローナル細菌数を観察した。
図5Cは、本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムの干渉実験の模式図であり、その結果から、NC1、NC6の場合は、モノクローナルコロニー数がNC2~5の場合よりも明らかに少なく、第1の候補のノンコーディング領域は大腸菌内でのFrCas9によるDNA配列の効率的な標的切断を補助することができることを明らかにした。
実施例5
本実施例では、ODN実験により、本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムが真核細胞において発揮する標的DNA配列を切断する能力を検証し、ODN-PCR結果を図6Aに、サンガーシーケンシングの結果を図6Bに示す。
(b) pACYC184-FrCas9 obtained in Example 2 removes all possible non-coding regions by the method of PCR homologous recombination, retains the gene sequences of CRISPR-related proteins and CRISPR arrays, and pACYC184-ΔFrCas9 built.
(c) Each of the 12 types of target-NC plasmids was introduced into E. coli DH5a in electroporation competent cells containing pACYC184-ΔFrCas9, resuscitated at 25° C. for 2 hours, and then serially diluted, A SOB medium containing both ampicillin sodium (100 μg/ml) and chloramphenicol (34 μg/ml) resistance was applied in dots, incubated overnight at 25° C., and the number of monoclonal bacteria was observed.
Figure 5C is a schematic diagram of the interference experiment of the type II CRISPR / Cas9 gene editing system derived from Faecalibaculum rodentium according to the present invention. Clearly less than the case, the first candidate non-coding region was shown to be able to support efficient targeted cleavage of DNA sequences by FrCas9 in E. coli.
Example 5
In this example, ODN experiments verified the ability of the type II CRISPR/Cas9 gene editing system derived from Faecalibaculum rodentium according to the present invention to cleave target DNA sequences in eukaryotic cells, and ODN-PCR results were analyzed. FIG. 6A shows the results of Sanger sequencing in FIG. 6B.

(1)材料:実施例1~で得られたFaecalibaculum rodentium編集遺伝子のすべてのアミノ酸配列、CRISPRアレイ配列、tracrRNA配列及び認識されたPAM。
(2)検証方法:本実施例は、ODN実験により、本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムが真核細胞において発揮する標的DNA配列を切断する能力を検証した。
具体的な操作は次のとおりである。
(a)ヒト由来の最適化されたFrCas9タンパク質配列を合成し、PX330真核ベクターにクローニングし、PX330-FrCas9プラスミドを構築した。
(b)ヒトのRNF2遺伝子上のNGTA、NATA、NCTA、NTTAの上流の30bpを標的配列として選び、Gibson法でCRISPRアレイに導入し、CRISPRアレイの上流にヒト由来の真核強プロモーターU6を付加し、PX330-FrCas9-arrayプラスミドを構築した。
(c)実施例4で確定したtracrRNAの上流にマウス由来の真核強プロモーターU6を付加し、PX330-FrCas9-array-tracrRNAプラスミドを構築した。
(d)上記で構築した、異なる遺伝子部位を標的とするPX330-FrCas9-array-tracrRNAプラスミド2.5μgと、ODN1.5μlとを電気的形質転換法により状態の良好なHEK293T細胞に導入し、72時間後に全細胞を採取してDNAを抽出した。
(e)RNF2標的遺伝子部位付近かつODN配列上に設計された一対のプライマーでODN-PCRを行い、アガロースゲル電気泳動でバンドの有無を観察し、標的切断イベントの発生の有無を初歩的に確認した。
(f)サンガーシークエンシングにより、ODNが標的部位に正常に挿入されたことが検証され、FrCas9が真核細胞内で標的DNAを編集する能力を有することが実証された。
ODN-PCRの結果は、図6Aに示すように、NGTA、NATA、NCTA、NTTAでは、いずれも正しいバンドサイズを有するターゲットバンドが認められた。サンガーシークエンシングの結果は、図8に示すように、ODN挿入位置が、PAMの上流の3~4bp塩基にあり、FrCas9と従来のSpCas9とは、目的遺伝子配列の切断の発生する範囲が一致したことがわかった。
実施例6
本実施例は、ODN実験により、本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムの真核細胞中のsgRNA認識部分の最適長さを検証し、結果を図7に示す。
(1) Materials: all amino acid sequences, CRISPR array sequences, tracrRNA sequences and recognized PAMs of Faecalibaculum rodentium edited genes obtained in Examples 1-4 .
(2) Verification method: In this example, the ability of the type II CRISPR/Cas9 gene editing system derived from Faecalibaculum rodentium according to the present invention to cleave target DNA sequences exhibited in eukaryotic cells was verified by ODN experiments. .
Specific operations are as follows.
(a) A human-derived optimized FrCas9 protein sequence was synthesized and cloned into the PX330 eukaryotic vector to construct the PX330-FrCas9 plasmid.
(b) Select 30 bp upstream of NGTA, NATA, NCTA, and NTTA on the human RNF2 gene as the target sequence, introduce it into the CRISPR array by the Gibson method, and add a human-derived eukaryotic strong promoter U6 upstream of the CRISPR array. and constructed the PX330-FrCas9-array plasmid.
(c) A mouse-derived strong eukaryotic promoter U6 was added upstream of the tracrRNA determined in Example 4 to construct a PX330-FrCas9-array-tracrRNA plasmid.
(d) 2.5 μg of the PX330-FrCas9-array-tracrRNA plasmid targeting different gene sites constructed above and 1.5 μl of ODN were introduced into HEK293T cells in good condition by electrotransformation, and 72 After hours, whole cells were harvested and DNA extracted.
(e) ODN-PCR is performed using a pair of primers designed near the RNF2 target gene site and on the ODN sequence, and the presence or absence of bands is observed by agarose gel electrophoresis, and the presence or absence of target cleavage events is rudimentary confirmed. did.
(f) Sanger sequencing verified that the ODN was successfully inserted into the target site, demonstrating that FrCas9 has the ability to edit target DNA in eukaryotic cells.
As a result of ODN-PCR, as shown in FIG. 6A, target bands with correct band sizes were observed in all of NGTA, NATA, NCTA and NTTA. As a result of Sanger sequencing, as shown in FIG. 8, the ODN insertion position is 3 to 4 bp bases upstream of PAM, and FrCas9 and conventional SpCas9 have the same range of occurrence of cleavage of the target gene sequence. I understand.
Example 6
This example verified the optimal length of the sgRNA recognition portion in eukaryotic cells of the type II CRISPR/Cas9 gene editing system derived from Faecalibaculum rodentium according to the present invention by ODN experiments, and the results are shown in FIG. .

(1)材料:実施例1~で得られたFaecalibaculum rodentium編集遺伝子のすべてのアミノ酸配列、sgRNA配列及び認識されたPAM。
(2)検証方法:本実施例は、ODN実験により、本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムの真核細胞中のsgRNA認識部分の最適な長さを検証した。
具体的な操作は次のとおりである。
(a)ヒト由来の最適化されたFrCas9タンパク質配列を合成し、PX330真核ベクターにクローニングし、PX330-FrCas9プラスミドを構築した。
(b)従来の研究で比較的高い切断効果が確認されたSpCas9の標的部位付近のGGTAの上流の30bpを標的配列として選び、Gibson法で認識長さ19~23bpのsgRNAを構築し、sgRNAの上流にヒト由来の真核強プロモーターU6を付加し、PX330-FrCas9-sgRNAプラスミドを構築した。
(c)上記で構築した、異なる遺伝子部位を標的とするPX330-FrCas9-sgRNAプラスミド2.5μgと、ODN1.5ulとを電気的形質転換法により状態の良好なHEK293T細胞に導入し、72時間後に全細胞を採取してDNAを抽出した。
(d)標的遺伝子部位付近かつODN配列上に設計された一対のプライマーでODN-PCRを行い、アガロースゲル電気泳動でバンドの有無を観察し、標的切断イベントの発生の有無を初歩的に確認し、認識長さ19~23bpのsgRNAのバンドの強弱を比較した。
(e)標的領域のインデル(Indel)率を数量化するために、アンプリコンハイスループットライブラリを調製し、認識長さ19~23bpのsgRNAの切断効果を比較した。
図7に示すように、FrCas9のsgRNAの最適な認識長さは、21bp、22bpまたは23bpであった。
実施例7
本実施例は、ODN実験により、本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムの真核細胞中のsgRNA骨格の最適長さを検証し、結果を図8に示す。
(1)材料:実施例1-6で得られたFaecalibaculum rodentium編集遺伝子のすべてのアミノ酸配列、sgRNA配列及び認識されたPAM。
(2)検証方法:本実施例は、ODN実験により、本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムの真核細胞中のsgRNA骨格の最適な長さを検証した。
具体的な操作は次のとおりである。
(a)ヒト由来の最適化されたFrCas9タンパク質配列を合成し、PX330真核ベクターにクローニングし、PX330-FrCas9プラスミドを構築した。
(b)従来の研究で比較的高い切断効果が確認されたSpCas9の標的部位付近のGGTAの上流の30bpを標的配列として選び、Gibson法で骨格長さ71nt~95ntのsgRNAを構築し、sgRNAの上流にヒト由来の真核強プロモーターU6を付加し、PX330-FrCas9-sgRNAプラスミドを構築した。
(c)上記で構築した、異なる遺伝子部位を標的とするPX330-FrCas9-sgRNAプラスミド2.5μgと、ODN1.5μlとを電気的形質転換法により状態の良好なHEK293T細胞に導入し、72時間後に全細胞を採取してDNAを抽出した。
(d)標的遺伝子部位付近かつODN配列上に設計された一対のプライマーでODN-PCRを行い、アガロースゲル電気泳動でバンドの有無を観察し、標的切断イベントの発生の有無を初歩的に確認し、骨格長さ71nt~95ntのsgRNAのバンドの強弱を比較した。
(e)標的領域のインデル(Indel)率を数量化するために、アンプリコンハイスループットライブラリを調製し、骨格長さ71nt~95ntのsgRNAの切断効果を比較した。
図8と図3に示すように、FrCas9の最適なsgRNA骨格は83nt~91ntであった。
実施例8
本実施例は、GUIDE-seq実験により、本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムの真核細胞での切断効果がSpCas9よりも高く、オフターゲット率がSpCas9よりも低いことを検証した。
(1)材料:実施例1~6で得られたFaecalibaculum rodentium編集遺伝子の全アミノ酸配列、22bpのsgRNA配列、5′-GGTA-3′PAM配列、SpCas9アミノ酸配列、SpCas9 sgRNA配列及びSpCas9 5′-NGG-3′ PAM配列。
(2)検証方法:本実施例は、GUIDE-seq実験により、本発明に記載のFaecalibaculum rodentiumに由来するII型CRISPR/Cas9遺伝子編集システムの真核細胞での切断効果がSpCas9よりも高く、オフターゲット率がSpCas9よりも低いことを検証した。
具体的な操作は次のとおりである。
(a)ヒト由来の最適化されたFrCas9タンパク質配列を合成し、PX330真核ベクターにクローニングし、PX330-FrCas9プラスミドを構築した。
(b)従来の研究で比較的高い切断効果が確認されたSpCas9の標的部位付近のGGTAの上流の30bpを標的配列として選び、Gibson法で認識長さ22bpのsgRNAを構築し、sgRNAの上流にヒト由来の真核強プロモーターU6を付加し、PX330-FrCas9-sgRNAプラスミドを構築した。同時に、20bpのSpCas9 sgRNAのPX330-SpCas9-sgRNAプラスミドを構築した。
(c)上記で構築した、異なる遺伝子部位を標的とするPX330-FrCas9-sgRNAプラスミド及びPX330-SpCas9-sgRNAプラスミド2.5μgと、 ODN1.5μlとを電気的形質転換法により状態の良好なHEK293T細胞に導入し、72時間後に全細胞を採取してDNAを抽出した。
(d)標的遺伝子部位付近かつODN配列上に設計された一対のプライマーでODN-PCRを行い、アガロースゲル電気泳動でバンドの有無を観察し、標的切断イベントの発生の有無を初歩的に確認し、バンドが認められたDNAについてGUIDE-seqのライブラリーを調製した。
(e)バイオインフォマティクス解析により、同じ部位のSpCas9とFrCas9のオンターゲット切断効果及びオフターゲット状況を比較した。
図9に示すように、DYRK1A-T2部位では、FrCas9のオンターゲットのリード数が3257であり、SpCas9のオンターゲットのリード数の2456よりも高かった。同時に、FrCas9では、オフターゲットが検出されていないことに対し、SpCas9では、3カ所のオフターゲット部位が発見された。また、GRIB2B-T9部位では、FrCas9のオンターゲットのリード数が34970であり、SpCas9のオンターゲットのリード数の20434よりも高かった。同時に、FrCas9では、オフターゲットが検出されていないことに対し、SpCas9では、3カ所のオフターゲット部位が発見された。以上のデータから、FrCas9は、SpCas9よりも切断効率と特異性が優れたCas9タンパク質であることがわかった。
実施例9 FrCas9は塩基編集(Base editing、BE)に使用することができる。
多くのヒト遺伝病は、単塩基突然変異によるものであり、伝統的な方法では治療できない。塩基エディターは、正確な遺伝子編集を実現する最新かつ最も効果的な方法の一つである。その特徴としては、ニッキング型のCRISPR-Casタンパク質により特定の標的DNAの位置を特定し、二本鎖DNAの切断を起こさずにDNAデアミナーゼを使用してこのような標的DNAを修飾および変異させ、病変塩基に対して修正を行う。シトシン塩基エディター(CBE)は、DNA中の塩基対C:GをT:Aに変異させ、アデニン塩基エディター(ABE)は塩基対A:TをG:Cに変異させる。
まず、FrCas9に対してE796A、H1010A、D1013Aの3つの点突然変異を導入し、異なるFrCas9ニッカーゼ(nFrCas9)を産生した。次に、最適化された第四世代シトシン塩基エディターBE4Gamと第七世代アデニン塩基エディターABE7.10にE796A nFrCas9を結合した。FrCas9-BE4Gamの編集ウィンドウは6~10塩基目であり(図10B)、FrCas9-ABE7.10の編集ウィンドウは6~8塩基目である(図10C)ことが観察された。上記の特徴に基づいて、ClinVarデータベースにおけるFrCas9-BE4Gamの標的の範囲とFrCas9-ABE7.10の標的の範囲を計算した。FrCas9-BE4Gamで正確に修正できる病原性突然変異については、90.38%(235/260)の編集イベントは、SpCas9-BE4Gamとは異なった。FrCas9-ABE7.10で正確に修正できる病原性突然変異については、92.21%(1196/1297)の編集イベントは、SpCas9-ABE7.10と異なった(図10D)。よって、FrCas9は、TAリッチPAMによってヒトゲノム中の標的を大幅に拡張し、塩基編集器に用いてヒト疾患に関連する変異を修正した。
(1) Materials: All amino acid sequences, sgRNA sequences and recognized PAMs of Faecalibaculum rodentium edited genes obtained in Examples 1-4 .
(2) Verification method: This example verified the optimal length of the sgRNA recognition portion in eukaryotic cells of the type II CRISPR/Cas9 gene editing system derived from Faecalibaculum rodentium according to the present invention by ODN experiments. .
Specific operations are as follows.
(a) A human-derived optimized FrCas9 protein sequence was synthesized and cloned into the PX330 eukaryotic vector to construct the PX330-FrCas9 plasmid.
(B) 30 bp upstream of GGTA near the target site of SpCas9, which was confirmed in previous studies to have a relatively high cleavage effect, was selected as the target sequence, and an sgRNA with a recognition length of 19 to 23 bp was constructed by the Gibson method, and the sgRNA was A human-derived strong eukaryotic promoter U6 was added upstream to construct a PX330-FrCas9-sgRNA plasmid.
(c) 2.5 μg of PX330-FrCas9-sgRNA plasmid targeting different gene sites constructed above and 1.5 ul of ODN were introduced into HEK293T cells in good condition by electrotransformation, and after 72 hours Whole cells were harvested and DNA extracted.
(d) ODN-PCR is performed using a pair of primers designed near the target gene site and on the ODN sequence, and the presence or absence of a band is observed by agarose gel electrophoresis to rudimentarily confirm the presence or absence of the target cleavage event. , compared the intensity of the bands of sgRNAs with recognition lengths of 19-23 bp.
(e) To quantify the Indel rate of target regions, amplicon high-throughput libraries were prepared to compare the cleavage effects of sgRNAs of recognition length 19-23 bp.
As shown in Figure 7, the optimal recognition length of FrCas9 sgRNA was 21bp, 22bp or 23bp.
Example 7
This example validates the optimal length of the sgRNA backbone in eukaryotic cells of the type II CRISPR/Cas9 gene editing system from Faecalibaculum rodentium according to the present invention by ODN experiments and the results are shown in FIG.
(1) Materials: all amino acid sequences, sgRNA sequences and recognized PAMs of Faecalibaculum rodentium edited genes obtained in Examples 1-6.
(2) Validation method: This example validated the optimal length of sgRNA backbone in eukaryotic cells of the type II CRISPR/Cas9 gene editing system from Faecalibaculum rodentium according to the present invention by ODN experiments.
Specific operations are as follows.
(a) A human-derived optimized FrCas9 protein sequence was synthesized and cloned into the PX330 eukaryotic vector to construct the PX330-FrCas9 plasmid.
(B) 30 bp upstream of GGTA near the target site of SpCas9, which was confirmed in previous studies to have a relatively high cleavage effect, was selected as the target sequence, and an sgRNA with a backbone length of 71 nt to 95 nt was constructed by the Gibson method, and the sgRNA was A human-derived strong eukaryotic promoter U6 was added upstream to construct a PX330-FrCas9-sgRNA plasmid.
(c) 2.5 μg of the PX330-FrCas9-sgRNA plasmid targeting different gene sites constructed above and 1.5 μl of ODN were introduced into HEK293T cells in good condition by electrotransformation, and after 72 hours Whole cells were harvested and DNA extracted.
(d) ODN-PCR is performed using a pair of primers designed near the target gene site and on the ODN sequence, and the presence or absence of a band is observed by agarose gel electrophoresis to rudimentarily confirm the presence or absence of the target cleavage event. , compared the intensity of the bands of sgRNAs with backbone lengths of 71nt to 95nt.
(e) To quantify the Indel rate of target regions, amplicon high-throughput libraries were prepared to compare the cleavage effects of sgRNAs with backbone lengths from 71nt to 95nt.
As shown in Figures 8 and 3, the optimal sgRNA backbone for FrCas9 was between 83nt and 91nt.
Example 8
In this example, by GUIDE-seq experiments, the cutting effect in eukaryotic cells of the type II CRISPR / Cas9 gene editing system derived from Faecalibaculum rodentium according to the present invention is higher than SpCas9, and the off-target rate is higher than SpCas9 verified to be low.
(1) Materials: full amino acid sequence of Faecalibaculum rodentium edited gene obtained in Examples 1-6, 22 bp sgRNA sequence, 5′-GGTA-3′ PAM sequence, SpCas9 amino acid sequence, SpCas9 sgRNA sequence and SpCas9 5′- NGG-3' PAM sequence.
(2) Verification method: In this example, according to the GUIDE-seq experiment, the type II CRISPR / Cas9 gene editing system derived from Faecalibaculum rodentium according to the present invention has a higher cutting effect in eukaryotic cells than SpCas9, and is turned off. It was verified that the target rate is lower than SpCas9.
Specific operations are as follows.
(a) A human-derived optimized FrCas9 protein sequence was synthesized and cloned into the PX330 eukaryotic vector to construct the PX330-FrCas9 plasmid.
(B) Select 30 bp upstream of GGTA near the target site of SpCas9, which was confirmed in previous studies to have a relatively high cleavage effect, as a target sequence, construct an sgRNA with a recognition length of 22 bp by the Gibson method, and upstream of sgRNA A human-derived eukaryotic strong promoter U6 was added to construct a PX330-FrCas9-sgRNA plasmid. At the same time, a 20 bp SpCas9 sgRNA PX330-SpCas9-sgRNA plasmid was constructed.
(c) 2.5 μg of PX330-FrCas9-sgRNA plasmid and PX330-SpCas9-sgRNA plasmid targeting different gene sites constructed above, and 1.5 μl of ODN are electrotransformed into HEK293T cells in good condition 72 hours later, all cells were harvested and DNA was extracted.
(d) ODN-PCR is performed using a pair of primers designed near the target gene site and on the ODN sequence, and the presence or absence of a band is observed by agarose gel electrophoresis to rudimentarily confirm the presence or absence of the target cleavage event. , a GUIDE-seq library was prepared for the DNA for which bands were observed.
(e) Bioinformatic analysis compared the on-target cleavage effect and off-target situation of SpCas9 and FrCas9 at the same site.
As shown in FIG. 9, at the DYRK1A-T2 site, the number of on-target reads for FrCas9 was 3257, which was higher than the number of on-target reads for SpCas9 of 2456. At the same time, in FrCas9, no off-target was detected, whereas in SpCas9, three off-target sites were found. In addition, at the GRIB2B-T9 site, the number of on-target reads for FrCas9 was 34,970, which was higher than the number of on-target reads of 20,434 for SpCas9. At the same time, in FrCas9, no off-target was detected, whereas in SpCas9, three off-target sites were found. From the above data, FrCas9 was found to be a Cas9 protein with better cleavage efficiency and specificity than SpCas9.
Example 9 FrCas9 can be used for base editing (BE).
Many human genetic diseases are due to single nucleotide mutations and cannot be treated by traditional methods. Base editors are one of the newest and most effective ways to achieve precise gene editing. characterized by nicking CRISPR-Cas proteins to locate specific target DNA, modifying and mutating such target DNA using DNA deaminase without double-stranded DNA breaks; Make corrections to the lesion bases. Cytosine base editors (CBE) mutate base pairs C:G to T:A in DNA, and adenine base editors (ABE) mutate base pairs A:T to G:C.
First, three point mutations E796A, H1010A, D1013A were introduced into FrCas9 to produce a different FrCas9 nickase (nFrCas9). E796A nFrCas9 was then ligated into the optimized fourth generation cytosine base editor BE4Gam and the seventh generation adenine base editor ABE7.10. It was observed that the editing window of FrCas9-BE4Gam was 6-10 bases (Fig. 10B) and that of FrCas9-ABE7.10 was 6-8 bases (Fig. 10C). Based on the above characteristics, the target ranges of FrCas9-BE4Gam and FrCas9-ABE7.10 in the ClinVar database were calculated. For pathogenic mutations that could be correctly corrected by FrCas9-BE4Gam, 90.38% (235/260) editing events differed from SpCas9-BE4Gam. For pathogenic mutations that can be correctly corrected by FrCas9-ABE7.10, 92.21% (1196/1297) editing events differed from SpCas9-ABE7.10 (Fig. 10D). Thus, FrCas9 has greatly expanded its targeting in the human genome by TA-rich PAMs and has been used as a base editor to correct mutations associated with human disease.

また、FrCas9(5′-NNTA-3′)のPAMは回文であり、これにより、sgRNAがペアとなり「背中合わせ」で存在する(図10E)。この機能は、隣接する2つの編集ウィンドウを同時に修正することで、FrCas9塩基エディターの範囲を拡大し(図10E)、FrCas9 sgRNAの標的分布と密度を高めることができる。ヒトゲノム中の5′-GG-3′(SpCas9 PAMを表す)と5′-TA-3′(FrCas9 PAMを表す)の分布を計算した(図11Aと図11B)。SpCas9(中央値=5bp、平均値=8.66bpと比較して、FrCas9はヒトゲノム中により密集した分布(中央値=1bp、平均値=6.16bp)を示し、追加の適用部位を提供した。
実施例10 FrCas9は、TATAボックスを標的として遺伝子発現を制御し、CRISPRの活性化と抑制に有効なツールとすることができる。
TATAボックス(TATAbox/Hognessbox)は真核生物のプロモーターを構成する素子の一つである。その一致順序は、TATA(A/T)A(A/T)(非鋳型鎖配列)である。それは、多くの真核生物の遺伝子の転写開始点の約-30bp(-25~-32bp)上流に存在し、基本的には塩基対A-Tからなり、遺伝子の転写開始を決める選択であり、RNAポリメラーゼの結合箇所の一つであり、RNAポリメラーゼとTATAボックスが強固に結合してから転写を開始する。FrCas9のPAM配列は、NNTAであるため、TATAボックスを標的とする際に天然の優位性がある。
ABCA1、UCP3及びRANKLの三つの遺伝子の中でTATAボックスを標的とし、FrCas9 CRISPR干渉(CRISPRi)の能力をテストした(図12A)。活性形態のFrCas9を直接利用してTATAボックスを標的に切断し、TATAボックスを破壊することを含んだ。その結果、FrCas9は、ABCA1、UCP3、RANKLの発現をそれぞれ31.37%、49.91%、39.62%低下させた。また、切断活性のないdFrCas9を利用してTATAボックスと直接結合させた。その結果、ABCA1、UCP3、RANKLの発現は、それぞれ61.67%、45.61%、42.60%低下した(図12B)。そのため、FrCas9は遺伝子発現を正確に制御する上で独特の潜在能力を持つことがわかった。
また、TATAボックスを直接標的とするdFrCas9-VP64を用いてFrCas9 CRISPR活性化(CRISPRa)の効果をテストし、その性能を、TATAボックスの上流を標的とするdSpCas9-VP64と比較した。これらの実験は、ABCA1、SOD1、GH1、BLM2遺伝子で行われた。その結果、dFrCas9-VP64は、有効な転写活性化を実現できることがわかった。また、ABCA1、GH1、BLM2では、dFrCas9-VP64の活性化倍数がdSpCas9-VP64より高く、SOD1遺伝子では、dFrCas9-VP64の活性化倍数がdSpCas9-VP64と同等であった(図12C)。そのため、FrCas9は、その独特な5′-NNTA-3′PAMによって、有望なCRISPRスクリーニングツールであることがわかった。
実施例11 FrCas9は、精確な遺伝子編集(Prime Editing、PE)に使用することができる。
Prime Editing(PE)は全く新しい正確な遺伝子編集ツールである。この技術は、単塩基の自由な置換と多塩基の正確な挿入・削除を実現することができ、遺伝子編集中にインデルにより生成する有害な副産物を大幅に低減し、編集精度を著しく向上させ、既存の遺伝子編集方法による遺伝子疾患治療の根本的障害を克服する可能性がある、遺伝子編集の大きな進歩であると考えられている。PEシステムには、改造されたガイドRNA(pegRNA)とプライムエディタ(prime editor)タンパク質の2つの部分が含まれる。pegRNAは、二重の機能を持ち、編集タンパク質を標的部位に誘導することができると同時に、編集用のテンプレート配列を含む。プライムエディタタンパク質は、変異したCas9ニッカーゼ(DNA鎖を1本しか切断できない)と逆転写酵素が融合したものである。Cas9で標的部位を切断した後、逆転写酵素は、pegRNAをテンプレートとして逆転写を行い、それによって必要な編集をDNA鎖に組み込み、修正後の配列は優先的にオリジナルなゲノムDNAを入れ替え、標的位置でDNAに対して永久的な編集を行った(図13)。
FrCas9の生物学的特性に基づいて、FrCas9と逆転写酵素とを融合し、そのPAM配列に基づいて相応のpegRNAを設計し、FrCas9-PE遺伝子編集システムを構築し、その遺伝子編集性能を最適化した。FrCas9 PAM配列に基づいて設計されたpegRNAは、sgRNAと比べて、pegRNAの3′末端の配列に2つの配列が付加された。第1の配列は、プライマー結合部位(PBS)であって、切断された標的DNA鎖の末端に相補的に結合されることができ、これにより、逆転写プロセスを開始させる。第2の配列は、逆転写テンプレート(RTテンプレート)であって、標的点突然変異または挿入欠失突然変異を持ち、正確な遺伝子編集を達成する。過去の研究によると、PBSとRTテンプレートの配列長は、PEシステムの遺伝子編集効率に顕著な影響を与え、かつ、遺伝子部位によって異なった。そこで、異なる長さのPBSとRTテンプレート配列との組み合わせにより、その編集効率の最適化を検討した。
細胞レベルで、FrCas9-PEシステムの遺伝子編集作用を初歩的に検証した。HEK293T細胞では、CRISPRの遺伝子編集効率の評価によく用いられるHEK293T-RNF2遺伝子部位を標的として、FrCas9-PEシステムの遺伝子編集機能を検証した。現在の実験結果は、FrCas9-PEが特定の部位の塩基編集効果を奏し得ることを示した。その後、既存のFrCas9-PEに対して、コドンの最適化、核局在化配列の位置と個数の最適化、逆転写酵素改造などの改造をさらに行った。最終的に、塩基編集効率が高く、オフターゲット反応が少なく、遺伝子編集の副産物が少ない(indel)新型FrCas9-PEの遺伝子編集システムが開発された(図14)。
Also, the PAM of FrCas9(5'-NNTA-3') is palindromic, which allows the sgRNAs to exist in pairs "back to back" (Fig. 10E). This feature expands the range of the FrCas9 base editor by modifying two adjacent editing windows simultaneously (Fig. 10E) and can increase target distribution and density of FrCas9 sgRNAs. The distribution of 5'-GG-3' (representing SpCas9 PAM) and 5'-TA-3' (representing FrCas9 PAM) in the human genome was calculated (Figures 11A and 11B). Compared to SpCas9 (median=5 bp, mean=8.66 bp ) , FrCas9 showed a more dense distribution in the human genome (median=1 bp, mean=6.16 bp), providing additional sites of application. .
Example 10 FrCas9 targets the TATA box to regulate gene expression and can be an effective tool for CRISPR activation and repression.
A TATA box (TATAbox/Hognessbox) is one of elements that constitute a eukaryotic promoter. The matching order is TATA(A/T) A(A/T) (non-template strand sequence). It is located approximately −30 bp (−25 to −32 bp) upstream of the transcription initiation site of many eukaryotic genes and consists essentially of the base pair AT and is the selection that determines the transcription initiation of genes. , is one of the binding sites for RNA polymerase, and transcription is initiated after the RNA polymerase and the TATA box bind tightly. Since the PAM sequence of FrCas9 is a NNTA, it has a natural advantage in targeting the TATA box.
We targeted the TATA box in three genes, ABCA1, UCP3 and RANKL, to test the ability of FrCas9 CRISPR interference (CRISPRi) (Fig. 12A). It involved direct utilization of the active form of FrCas9 to target and cleave the TATA box to disrupt the TATA box. As a result, FrCas9 reduced the expression of ABCA1, UCP3 and RANKL by 31.37%, 49.91% and 39.62%, respectively. In addition, dFrCas9 without cleavage activity was used to bind directly to the TATA box. As a result, the expression of ABCA1, UCP3 and RANKL decreased by 61.67%, 45.61% and 42.60% respectively (Fig. 12B). As such, FrCas9 was found to have unique potential in precisely regulating gene expression.
We also tested the effect of FrCas9 CRISPR activation (CRISPRa) using dFrCas9-VP64, which targets the TATA box directly, and compared its performance to dSpCas9-VP64, which targets the TATA box upstream. These experiments were performed with the ABCA1, SOD1, GH1, BLM2 genes. As a result, it was found that dFrCas9-VP64 can achieve effective transcriptional activation. Also, in ABCA1, GH1, BLM2, the activation fold of dFrCas9-VP64 is higher than dSpCas9-VP64, and in the SOD1 gene, the activation fold of dFrCas9-VP64 is equivalent to dSpCas9-VP64 (Fig. 12C). Therefore, FrCas9 proved to be a promising CRISPR screening tool due to its unique 5'-NNTA-3'PAM.
Example 11 FrCas9 can be used for precision gene editing (Prime Editing, PE).
Prime Editing (PE) is a completely new precision gene editing tool. This technology can achieve free substitution of single nucleotides and accurate insertion/deletion of multiple nucleotides, greatly reducing harmful by-products generated by indels during gene editing, significantly improving editing accuracy, It is considered to be a major advance in gene editing that has the potential to overcome fundamental obstacles to treating genetic diseases with existing gene-editing methods. The PE system contains two parts, a modified guide RNA (pegRNA) and a prime editor protein. The pegRNA has a dual function, being able to direct the editing protein to the target site as well as containing the template sequence for editing. The prime editor protein is a fusion of a mutated Cas9 nickase (which can cut only one strand of DNA) and reverse transcriptase. After cleaving the target site with Cas9, the reverse transcriptase reverse transcribes the pegRNA as a template, thereby incorporating the necessary edits into the DNA strand, the modified sequences preferentially displacing the original genomic DNA, and the target A permanent edit was made to the DNA at the position (Fig. 13).
Based on the biological properties of FrCas9, fuse FrCas9 with reverse transcriptase, design corresponding pegRNA based on its PAM sequence, construct FrCas9-PE gene editing system, and optimize its gene editing performance did. The pegRNA designed based on the FrCas9 PAM sequence had two sequences added to the 3' end sequence of the pegRNA compared to the sgRNA. The first sequence is a primer binding site (PBS), capable of complementary binding to the ends of the cleaved target DNA strand, thereby initiating the reverse transcription process. The second sequence is a reverse transcription template (RT template) with targeted point mutations or insertion-deletion mutations to achieve precise gene editing. Previous studies have shown that the sequence lengths of PBS and RT templates significantly affected the gene editing efficiency of the PE system and differed by gene site. Therefore, optimization of the editing efficiency was investigated by combining different lengths of PBS and RT template sequences.
At the cellular level, the gene-editing effects of the FrCas9-PE system were rudimentary verified. In HEK293T cells, we verified the gene-editing function of the FrCas9-PE system by targeting the HEK293T-RNF2 gene site, which is often used to evaluate the gene-editing efficiency of CRISPR. Current experimental results indicated that FrCas9-PE can exert a base-editing effect at specific sites. After that, the existing FrCas9-PE was further modified such as codon optimization, optimization of the position and number of nuclear localization sequences, and reverse transcriptase modification. Finally, a novel FrCas9-PE gene-editing system with high base-editing efficiency, low off-target reactions, and low gene-editing by-products (indel) was developed (FIG. 14).

Claims (11)

II型CRISPR/Cas9遺伝子編集システムであって、
Cas9タンパク質、アクセサリータンパク質、crRNA(CRISPR RNA)及びtracrRNA(トランス活性化型CRISPR RNA)を含み、Cas9タンパク質と、crRNAにtracrRNAが結合されてなるガイドRNAとのRNP複合体(リボ核タンパク質複合体)の形態で機能し、
前記Cas9タンパク質は、DNAのエンドヌクレアーゼであり、前記Cas9タンパク質は、配列番号1で示されるアミノ酸配列、又は配列番号1で示されるアミノ酸配列と少なくとも80%、85%、90%、95%、98%、又は99%の相同性をもつアミノ酸配列を有する、
ことを特徴とする、II型CRISPR/Cas9遺伝子編集システム。
A type II CRISPR/Cas9 gene editing system,
Cas9 protein, accessory protein, crRNA (CRISPR RNA) and tracrRNA (trans-activating CRISPR RNA), including Cas9 protein and guide RNA formed by binding tracrRNA to crRNA RNP complex (ribonucleoprotein complex) functions in the form of
The Cas9 protein is a DNA endonuclease, and the Cas9 protein is the amino acid sequence shown in SEQ ID NO: 1, or at least 80%, 85%, 90%, 95%, 98% of the amino acid sequence shown in SEQ ID NO: 1 %, or 99% amino acid sequence homology,
A type II CRISPR/Cas9 gene editing system characterized by:
前記Cas9タンパク質は、ヌクレアーゼドメインにより、PAM配列の上流でcrRNAと相補的な二本鎖DNAを切断し、前記ヌクレアーゼドメインが、HNH様ヌクレアーゼドメイン及び/又はRuvC様ヌクレアーゼドメインである、
ことを特徴とする、請求項1に記載のII型CRISPR/Cas9遺伝子編集システム。
said Cas9 protein cleaves double-stranded DNA complementary to crRNA upstream of the PAM sequence with a nuclease domain, said nuclease domain being an HNH-like nuclease domain and/or a RuvC-like nuclease domain;
The type II CRISPR/Cas9 gene editing system according to claim 1, characterized in that:
前記アクセサリータンパク質は、Cas1アクセサリータンパク質、Cas2アクセサリータンパク質及びCsn2アクセサリータンパク質を含み、
前記Cas1アクセサリータンパク質は、配列番号2で示されるアミノ酸配列、又は配列番号2で示されるアミノ酸配列と少なくとも80%、85%、90%、95%、98%、又は99%の相同性をもつアミノ酸配列を有し、
前記Cas2アクセサリータンパク質は、配列番号3で示されるアミノ酸配列、又は配列番号3で示されるアミノ酸配列と少なくとも80%、85%、90%、95%、98%、又は99%の相同性をもつアミノ酸配列を有し、
前記Csn2アクセサリータンパク質は、配列番号4で示されるアミノ酸配列、又は配列番号4で示されるアミノ酸配列と少なくとも80%、85%、90%、95%、98%、又は99%の相同性をもつアミノ酸配列を有する、
ことを特徴とする、請求項1に記載のII型CRISPR/Cas9遺伝子編集システム。
The accessory proteins include Cas1 accessory protein, Cas2 accessory protein and Csn2 accessory protein,
The Cas1 accessory protein is the amino acid sequence set forth in SEQ ID NO: 2, or an amino acid having at least 80%, 85%, 90%, 95%, 98%, or 99% homology with the amino acid sequence set forth in SEQ ID NO:2 has an array,
The Cas2 accessory protein is the amino acid sequence set forth in SEQ ID NO: 3, or an amino acid having at least 80%, 85%, 90%, 95%, 98%, or 99% homology to the amino acid sequence set forth in SEQ ID NO: 3 has an array,
The Csn2 accessory protein is the amino acid sequence set forth in SEQ ID NO: 4, or an amino acid having at least 80%, 85%, 90%, 95%, 98%, or 99% homology with the amino acid sequence set forth in SEQ ID NO: 4 having an array,
The type II CRISPR/Cas9 gene editing system according to claim 1, characterized in that:
前記CRISPR RNAは、CRISPRアレイから転写されて生成され、前記CRISPR RNAは、配列番号5で示されるRNA配列、又は配列番号5で示される核酸配列と少なくとも80%、85%、90%、95%、98%、又は99%の相同性をもつRNA配列を有し、前記CRISPRアレイは、直接反複配列とスペーサー配列とを含み、前記直接反複配列が、配列番号6で示される核酸配列、又は配列番号6で示される核酸配列と少なくとも80%、85%、90%、95%、98%、又は99%の相同性をもつ核酸配列を有し、前記スペーサー配列が、配列番号7で示される核酸配列、又は配列番号7で示される核酸配列と少なくとも80%、85%、90%、95%、98%、又は99%の相同性をもつ核酸配列を有する、
ことを特徴とする、請求項1に記載のII型CRISPR/Cas9遺伝子編集システム。
The CRISPR RNA is generated by transcription from a CRISPR array, and the CRISPR RNA is at least 80%, 85%, 90%, 95% of the RNA sequence set forth in SEQ ID NO:5 or the nucleic acid sequence set forth in SEQ ID NO:5. , 98% or 99% homology, wherein the CRISPR array comprises a direct repeat sequence and a spacer sequence, wherein the direct repeat sequence is the nucleic acid sequence shown in SEQ ID NO: 6, or the sequence a nucleic acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% homology with the nucleic acid sequence shown in number 6, wherein the spacer sequence is the nucleic acid shown in SEQ ID NO:7 or a nucleic acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% homology with the nucleic acid sequence shown in SEQ ID NO:7;
The type II CRISPR/Cas9 gene editing system according to claim 1, characterized in that:
前記トランス活性化型CRISPR RNAは、CRISPR RNAの直接反複配列と相補的な配列を含有し、前記トランス活性化型CRISPR RNAは、配列番号8で示される核酸配列、又は配列番号8で示される核酸配列と少なくとも70%、80%、85%、90%、95%、98%、又は99%の相同性をもつ核酸配列を有する、
ことを特徴とする、請求項1に記載のII型CRISPR/Cas9遺伝子編集システム。
The transactivating CRISPR RNA contains a sequence complementary to a direct repeat sequence of CRISPR RNA, and the transactivating CRISPR RNA is the nucleic acid sequence shown in SEQ ID NO: 8, or the nucleic acid shown in SEQ ID NO: 8 having a nucleic acid sequence that is at least 70%, 80%, 85%, 90%, 95%, 98%, or 99% homologous to the sequence;
The type II CRISPR/Cas9 gene editing system according to claim 1, characterized in that:
crRNAにtracrRNAが結合されてなるガイドRNAの骨格は、crRNA 直接反複配列の7~24ntの配列と、tracrRNA配列とで構成され、この二つの部分は、「GAAA」、「TGAA」、「AAAC」リンカーを介して融合されてsgRNA骨格を形成することができ、
好ましくは、20ntの直接反複配列とtracrRNAの全長配列とが「GAAA」を介して融合されて形成されるsgRNA骨格が配列番号9で示され、より好ましくは、このsgRNA骨格の高効率のバリアントは、
crRNAの直接反複配列の最初の18~14ntとtracrRNAの最後の69~65ntがリンカー配列(「GAAA」など)を介して融合されて形成されるsgRNA骨格であり、それが、さらに、
(ア)sgRNA骨格の長さが91ntであり、18ntの直接反複配列と69ntのtracrRNAとを含み、配列番号10で示される骨格、
(イ)sgRNA骨格の長さが89ntであり、17ntの直接反複配列と68ntのtracrRNAとを含み、配列番号11で示される骨格、
(ウ)sgRNA骨格の長さが87ntであり、16ntの直接反複配列と67ntのtracrRNAとを含み、配列番号12で示される骨格、
(エ)sgRNA骨格の長さが85ntであり、15ntの直接反複配列と66ntのtracrRNAとを含み、配列番号13で示される骨格、
(オ)sgRNA骨格の長さが83ntであり、14ntの直接反複配列と65ntのtracrRNAとを含み、配列番号14で示される骨格、
からなる群より選ばれる骨格であり、
前記sgRNA骨格は、配列番号9~14のいずれか1つと少なくとも70%、80%、85%、90%、95%、98%又は99%の相同性をもつ核酸配列を有しても良い、
ことを特徴とする、請求項1に記載のII型CRISPR/Cas9遺伝子編集システム。
The scaffold of the guide RNA, which is crRNA bound to tracrRNA, is composed of a sequence of 7 to 24 nt of the crRNA direct repeat sequence and the tracrRNA sequence, and these two parts are "GAAA", "TGAA", and "AAAC". can be fused via a linker to form an sgRNA backbone,
Preferably, the sgRNA backbone formed by fusing a 20 nt direct repeat sequence and the full-length sequence of tracrRNA via "GAAA" to form is shown in SEQ ID NO: 9, more preferably the high efficiency variant of this sgRNA backbone is ,
an sgRNA backbone formed by fusing the first 18-14 nt of the direct repeat sequence of the crRNA and the last 69-65 nt of the tracrRNA through a linker sequence (such as "GAAA"), which further comprises
(a) a backbone represented by SEQ ID NO: 10, which has a length of 91 nt and contains a direct repeat sequence of 18 nt and a tracrRNA of 69 nt;
(b) an sgRNA backbone having a length of 89 nt, containing a direct repeat sequence of 17 nt and a tracrRNA of 68 nt, and represented by SEQ ID NO: 11;
(c) an sgRNA backbone of 87 nt in length, containing a 16 nt direct repeat sequence and 67 nt of tracrRNA, and represented by SEQ ID NO: 12;
(d) an sgRNA backbone having a length of 85 nt, containing a direct repeat sequence of 15 nt and a tracrRNA of 66 nt, and represented by SEQ ID NO: 13;
(e) a backbone represented by SEQ ID NO: 14, which has a length of 83 nt and contains a direct repeat sequence of 14 nt and a tracrRNA of 65 nt;
A skeleton selected from the group consisting of
said sgRNA backbone may have a nucleic acid sequence with at least 70%, 80%, 85%, 90%, 95%, 98% or 99% homology to any one of SEQ ID NOS: 9-14;
The type II CRISPR/Cas9 gene editing system according to claim 1, characterized in that:
前記II型CRISPR/Cas9遺伝子編集システムは、Faecalibaculum rodentiumに由来するものであり、遺伝子編集において特異的なDNAを結合又は切断し、特異的なDNAを結合又は切断することは、ガイドRNAが特異的なDNAの標的部位に相補して対になることで認識することにより実現され、前記ガイドRNAと特異的なDNAの標的部位との対になる結合部分の長さの範囲は、14~30bpであり、
前記特異的なDNAは、原核生物又は真核生物のDNAである、
ことを特徴とする、請求項1に記載のII型CRISPR/Cas9遺伝子編集システム。
The type II CRISPR / Cas9 gene editing system is derived from Faecalibaculum rodentium, binding or cleaving specific DNA in gene editing, binding or cleaving the specific DNA, the guide RNA is specific The length range of the binding portion paired with the guide RNA and the specific DNA target site is 14 to 30 bp. can be,
the specific DNA is prokaryotic or eukaryotic DNA;
The type II CRISPR/Cas9 gene editing system according to claim 1, characterized in that:
前記ガイドRNAと特異的なDNAの標的部位との対になる結合部分の長さは、21bp、22bp又は23bpであり、ここで、前記RNPタンパク質複合体は、プロトスペーサー隣接モチーフに近接する14bpの塩基のミスマッチに非常に敏感であり、前記14bpが、シード領域である、
ことを特徴とする、請求項7に記載のII型CRISPR/Cas9遺伝子編集システム。
The length of the paired binding portion between the guide RNA and the specific DNA target site is 21 bp, 22 bp or 23 bp, wherein the RNP protein complex comprises a 14 bp very sensitive to base mismatches, said 14 bp being the seed region;
The type II CRISPR/Cas9 gene editing system according to claim 7, characterized in that:
前記DNAを結合又は切断する機能に必要なプロトスペーサー隣接モチーフ配列は、ガイドRNA/sgRNA認識配列の下流の5′-NNTA-3′であり、ここで、NがA、T、C又はGである、
ことを特徴とする、請求項7に記載のII型CRISPR/Cas9遺伝子編集システム。
The protospacer-adjacent motif sequence required for the DNA binding or cleaving function is 5'-NNTA-3' downstream of the guide RNA/sgRNA recognition sequence, where N is A, T, C or G. be,
The type II CRISPR/Cas9 gene editing system according to claim 7, characterized in that:
DNAの編集又は結合、CRISPRの活性化又はCRISPRの干渉のためのCRISPR/Cas9遺伝子編集システムであって、前記CRISPR/Cas9遺伝子編集システムは、請求項1~9のいずれか一項に記載のII型CRISPR/Cas9遺伝子編集システムである、
ことを特徴とする、CRISPR/Cas9遺伝子編集システム。
CRISPR/Cas9 gene editing system for editing or joining DNA, activating CRISPR or interfering with CRISPR, wherein the CRISPR/Cas9 gene editing system is II according to any one of claims 1 to 9 A type CRISPR/Cas9 gene editing system,
A CRISPR/Cas9 gene editing system characterized by:
ニッカーゼ、不活性型Cas9、塩基エディター(Base Editor)又はプライムエディター(Prime Editor)の製造のためのCRISPR/Cas9遺伝子編集システムであって、前記CRISPR/Cas9遺伝子編集システムは、請求項1~9のいずれか一項に記載のII型CRISPR/Cas9遺伝子編集システムである、
ことを特徴とする、CRISPR/Cas9遺伝子編集システム。
A CRISPR / Cas9 gene editing system for the production of nickase, inactive Cas9, Base Editor or Prime Editor, wherein the CRISPR / Cas9 gene editing system is according to claims 1 to 9 A type II CRISPR/Cas9 gene editing system according to any one of
A CRISPR/Cas9 gene editing system characterized by:
JP2022025097A 2022-02-21 2022-02-21 Type ii crispr/cas9 genome editing system and the application thereof Pending JP2023121643A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022025097A JP2023121643A (en) 2022-02-21 2022-02-21 Type ii crispr/cas9 genome editing system and the application thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022025097A JP2023121643A (en) 2022-02-21 2022-02-21 Type ii crispr/cas9 genome editing system and the application thereof

Publications (1)

Publication Number Publication Date
JP2023121643A true JP2023121643A (en) 2023-08-31

Family

ID=87798124

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022025097A Pending JP2023121643A (en) 2022-02-21 2022-02-21 Type ii crispr/cas9 genome editing system and the application thereof

Country Status (1)

Country Link
JP (1) JP2023121643A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117866926A (en) * 2024-03-07 2024-04-12 珠海舒桐医疗科技有限公司 CRISPR-FrCas9 protein mutant and application thereof

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112331264A (en) * 2020-09-11 2021-02-05 中山大学附属第一医院 Construction method of homologous type 2 CRISPR/Cas gene editing system
CN114075559A (en) * 2020-09-14 2022-02-22 珠海舒桐医疗科技有限公司 Type 2 CRISPR/Cas9 gene editing system and application thereof

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112331264A (en) * 2020-09-11 2021-02-05 中山大学附属第一医院 Construction method of homologous type 2 CRISPR/Cas gene editing system
CN113851186A (en) * 2020-09-11 2021-12-28 中山大学 Construction method of homologous type 2 CRISPR/Cas gene editing system
CN114075559A (en) * 2020-09-14 2022-02-22 珠海舒桐医疗科技有限公司 Type 2 CRISPR/Cas9 gene editing system and application thereof

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117866926A (en) * 2024-03-07 2024-04-12 珠海舒桐医疗科技有限公司 CRISPR-FrCas9 protein mutant and application thereof

Similar Documents

Publication Publication Date Title
Eid et al. CRISPR base editors: genome editing without double-stranded breaks
JP7232540B2 (en) Multiple genome engineering enabled by CRISPR
Chen et al. Prime editing for precise and highly versatile genome manipulation
JP7223377B2 (en) Thermostable CAS9 nuclease
Du et al. Efficient targeted mutagenesis in soybean by TALENs and CRISPR/Cas9
Wang et al. Precise, predictable multi-nucleotide deletions in rice and wheat using APOBEC–Cas9
Shah et al. Genome editing in plants: advancing crop transformation and overview of tools
Li et al. SWISS: multiplexed orthogonal genome editing in plants with a Cas9 nickase and engineered CRISPR RNA scaffolds
US11788088B2 (en) CRISPR/Cas system and method for genome editing and modulating transcription
IL288263B (en) Crispr hybrid dna/rna polynucleotides and methods of use
CN114075559B (en) 2-type CRISPR/Cas9 gene editing system and application thereof
Bi et al. Gene editing with TALEN and CRISPR/Cas in rice
Villiger et al. CRISPR technologies for genome, epigenome and transcriptome editing
Cao et al. The multiplexed CRISPR targeting platforms
JP2019500036A (en) Reconstruction of DNA end repair pathways in prokaryotes
WO2019149239A1 (en) Improved method for genome editing
US20240229012A9 (en) Site-specific genome modification technology
CA3234233A1 (en) Endonuclease systems
Capdeville et al. Sophisticated CRISPR/Cas tools for fine-tuning plant performance
Jun et al. Development and application of CRISPR/Cas system in rice
JP2023121643A (en) Type ii crispr/cas9 genome editing system and the application thereof
Gupta et al. Modification of Cas9, gRNA and PAM: key to further regulate genome editing and its applications
Přibylová et al. How to use CRISPR/Cas9 in plants-from target site selection to DNA repair
RU2794774C1 (en) Crispr/cas9 type ii genome editing system and its use
US20230265421A1 (en) Type ii crispr/cas9 genome editing system and the application thereof

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220712

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220712

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230905

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231205

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20240227