WO2023140697A1 - Cas 단백질 또는 이의 변이체의 스크리닝 방법, 및 이를 이용하여 제조된 Cas 단백질 또는 이의 변이체 - Google Patents

Cas 단백질 또는 이의 변이체의 스크리닝 방법, 및 이를 이용하여 제조된 Cas 단백질 또는 이의 변이체 Download PDF

Info

Publication number
WO2023140697A1
WO2023140697A1 PCT/KR2023/001041 KR2023001041W WO2023140697A1 WO 2023140697 A1 WO2023140697 A1 WO 2023140697A1 KR 2023001041 W KR2023001041 W KR 2023001041W WO 2023140697 A1 WO2023140697 A1 WO 2023140697A1
Authority
WO
WIPO (PCT)
Prior art keywords
cas
protein
guide rna
sequence
testing
Prior art date
Application number
PCT/KR2023/001041
Other languages
English (en)
French (fr)
Inventor
김민영
최근우
권정훈
조안나
이정준
Original Assignee
주식회사 툴젠
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 툴젠 filed Critical 주식회사 툴젠
Publication of WO2023140697A1 publication Critical patent/WO2023140697A1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids

Definitions

  • This application relates to a method for screening Cas protein or variants thereof.
  • the present application relates to a method for producing a highly active Cas protein or variant thereof.
  • This application relates to Cas protein or variants thereof.
  • Cas proteins CRISPR associated proteins
  • the activity of the Cas protein or its variants developed through the existing screening system often does not reproduce the expected gene editing effect during preclinical or clinical animal models, and one of the causes is, for example, as follows:
  • the efficiency of the delivery technology for delivering the Cas protein into cells or to the target site is low, and the Cas protein or its variants that actually act in cells or at the target site are relatively insufficient, so the expected gene editing effect may not be reproduced.
  • the present specification aims to disclose a testing vector for screening Cas candidate proteins.
  • the present specification aims to disclose a testing set for screening Cas candidate proteins.
  • the purpose of this specification is to disclose the use of the testing vector and the testing set.
  • the present specification aims to disclose methods for screening Cas candidate proteins.
  • the present specification aims to disclose novel variants of the Cas9 protein derived from Streptococcus pyogenes.
  • the present specification aims to disclose various aspects of CRISPR/Cas systems comprising novel variants of the Cas9 protein from Streptococcus pyogenes.
  • the present specification discloses a testing vector for screening Cas candidate proteins comprising: an underexpressed promoter; and a nucleic acid encoding a NES-Cas fusion protein, wherein the underexpressed promoter and the nucleic acid encoding the NES-Cas fusion protein are operably linked, and the NES-Cas fusion protein is represented by Formula 1:
  • N 1 is a first nuclear export signal (NES) or absent
  • C is the Cas candidate protein
  • N 2 is a second nuclear export signal (NES) or absent, wherein the NES-Cas fusion protein includes at least one NES.
  • the low expression promoter may be a UBC promoter.
  • the UBC promoter may have a nucleic acid sequence selected from SEQ ID NO: 16.
  • the first NES and the second NES may each independently have an amino acid sequence selected from SEQ ID NO: 89 to SEQ ID NO: 104.
  • the Cas candidate protein may be a Cas9 protein derived from Streptococcus pyogenes or a variant of the Cas9 protein derived from Streptococcus pyogenes.
  • the present specification discloses a testing set for screening a Cas candidate protein comprising: any one selected from the above examples as a first testing vector; and a second testing vector selected from any one of the above embodiments, wherein the Cas candidate protein of the first testing vector and the Cas candidate protein of the second testing vector have different amino acid sequences.
  • the present specification discloses a testing set for screening a Cas candidate protein comprising two or more testing vectors of the above embodiment.
  • the present specification discloses a method for screening a Cas candidate protein comprising: (a) treating a cell with any one testing set selected from the above embodiments; (b) processing a guide RNA containing a guide domain or a nucleic acid encoding the guide RNA in a cell that has performed the step (a), wherein the guide RNA interacts with a Cas candidate protein of a testing vector included in the testing set to form a CRISPR/Cas complex, and the guide domain of the guide RNA targets a specific sequence included in a gene of the cell; (c) selecting cells in which the specific sequence targeted by the guide domain has been edited among the cells subjected to the step (b); (d) specifying the amino acid sequence of the Cas candidate protein of the testing vector included in the cells selected in step (c).
  • the selection of the cells in which the specific sequence in the process (c) has been edited may be performed by culturing the cells subjected to the process (b) under specific conditions and then selecting surviving cells.
  • the specific sequence targeted by the guide domain of the guide RNA is the sequence of the HPRT gene, and culturing the cells subjected to the process (b) under specific conditions may be culturing in a medium containing 6TG.
  • the present specification discloses a variant of Cas9 protein derived from Streptococcus pyogenes having an amino acid sequence selected from SEQ ID NO: 3 to SEQ ID NO: 8.
  • a CRISPR/Cas9 composition comprising: a variant of the Cas9 protein from Streptococcus pyogenes, or a nucleic acid encoding the variant of the Cas9 protein; A guide RNA including crRNA and tracrRNA, or a nucleic acid encoding the guide RNA, wherein the crRNA has a guide domain and a direct repeat sequentially connected from the 5' end to the 3' end, The direct repeat and the tracrRNA can form a CRISPR/Cas complex by interacting with the variant of the Cas9 protein, and the guide domain can target a predetermined nucleic acid sequence.
  • the guide RNA may be a single guide RNA in which the crRNA and the tracrRNA are linked by a linker.
  • the direct repeating portion of the crRNA of the guide RNA may have the sequence of SEQ ID NO: 13
  • the tracrRNA of the guide RNA may have the sequence of SEQ ID NO: 14.
  • the CRISPR/Cas9 composition may include the Cas9 protein variant and the guide RNA in the form of ribonucleoprotein.
  • the CRISPR/Cas9 composition may include a nucleic acid encoding the variant of the Cas9 protein and a nucleic acid encoding the guide RNA in the form of a vector.
  • Cas candidate protein screening method using the testing vector and/or testing set disclosed in the present invention, high-efficiency Cas can be effectively screened from a large number of Cas candidate libraries. Furthermore, compared to the prior art of the present invention, since screening can be performed in an environment close to an actual Cas use environment, Cas candidate proteins that operate with high efficiency in vivo can be screened more successfully.
  • FIG. 1 schematically illustrates an embodiment of a Cas candidate protein screening method disclosed herein.
  • FIG. 2 schematically illustrates an embodiment of a Cas candidate protein screening method disclosed herein.
  • GFP green fluorescent protein
  • Figure 5 is a measurement of the indel activity of Cas9 targeting EMX1 in HEK293T cells when using the UBC promoter according to Experimental Example 1.4.
  • 2NLS+EMX1 means the activity when the CMV promoter is used and two nuclear localization signals (NLS) are attached
  • 2NES +EMX1 means the activity when the CMV promoter is used and two nuclear export signals (NES) are attached
  • UBC 2NES + EMX1 means the activity when the UBC promoter is used and two nuclear export signals (NES) are attached.
  • Figure 6 is a schematic diagram explaining the modification to reduce expression activity by removing part of exon 1 and / or intron of the UBC promoter according to Experimental Example 1.5.
  • WT Cas9 means using the CMV promoter and wild-type SpCas9
  • UBC_2NES means using the SpCas9 protein containing the UBC promoter and two NES
  • UBC_Exon1_2NES means using the SpCas9 protein containing the promoter of SEQ ID NO: 17 and two NES
  • UBC_mini_2NES means using SpCas9 containing the promoter of SEQ ID NO: 18 and two NES proteins.
  • Figure 8 is a schematic diagram explaining the modification of reducing the expression activity by removing the transcription binding site from the UBC promoter.
  • mini UBC means a result using the promoter of SEQ ID NO: 18, 243 UBC using the promoter of SEQ ID NO: 19, and 208 UBC using the promoter of SEQ ID NO: 20.
  • UBC full means the UBC promoter
  • UBC mini means the promoter of SEQ ID NO: 18
  • UBC 243 means the result using the promoter of SEQ ID NO: 19.
  • 12 is a measurement of indel transduction activity for 24 targets of each Cas9 candidate group in which a mutation was generated at position 1061 of Sniper Cas9 according to Experimental Example 3.2. Labels on the horizontal axis indicate which amino acid was mutated at position 1061 of SEQ ID NO: 2, respectively. For example, in the case of Phe, it means that the 1061st amino acid in the amino acid sequence of SEQ ID NO: 2 has been mutated to phenylalanine.
  • FIG. 13 is a measurement of indel transduction activity for 24 targets of each Cas9 candidate group in which a mutation was generated at position 1074 of Sniper Cas9 according to Experimental Example 3.2.
  • Labels on the horizontal axis indicate which amino acid was mutated at position 1074 of SEQ ID NO: 2, respectively.
  • Phe it means that the 1074th amino acid in the amino acid sequence of SEQ ID NO: 2 has been mutated to phenylalanine.
  • WT Sniper is Sniper Cas9 of SEQ ID NO: 2
  • 1061 Asp Sniper Cas9 is Sniper Cas9 in which the 1061st amino acid is substituted with Aspartic acid
  • 1074 Leu Sniper Cas9 is Sniper Cas9 in which the 1074th amino acid is substituted with Leucine
  • 1061 1074 double mutation sniper Cas9 is This means that the 1061st amino acid of Sniper Cas9 is substituted with aspartic acid and the 1074th amino acid is substituted with leucine.
  • WT Cas9 is the Cas9 of SEQ ID NO: 1
  • 1061 Asp SpCas9 is the 1061st amino acid of WT Cas9 is substituted with aspartic acid
  • 1074 Leu SpCas9 is the 1074th amino acid of the WT Cas9 is substituted with leucine
  • 1061 1074 double mutation SpCas9 is 106 of the WT Cas9 It means that the 1st amino acid is substituted with aspartic acid and the 1074th amino acid is substituted with leucine.
  • NES refers to a peptide of a certain length that acts as a kind of "tag” by attaching to a protein to be transported when a substance inside a cell nucleus is transported out of the nucleus by nuclear transport, or a sequence thereof.
  • the term “NES” used in this specification includes all meanings that can be recognized by those skilled in the art, and may be appropriately interpreted depending on the context.
  • amino acid sequence when describing an amino acid sequence in this specification, it is written in the direction from the N-terminal to the C-terminal using the one-letter notation of amino acids or the three-letter notation.
  • RNVP when expressed as RNVP, it means a peptide in which arginine, asparagine, valine, and proline are sequentially connected from the N-terminal to the C-terminal.
  • Thr-Leu-Lys it means a peptide in which threonine, leucine, and lysine are sequentially connected from the N-terminal to the C-terminal.
  • amino acids that cannot be expressed by the one-letter notation other letters are used to indicate them, and additionally supplemented descriptions are provided.
  • Each amino acid notation method is as follows: Alanine (Ala, A); Arginine (Arg, R); Asparagine (Asn, N); Aspartic acid (Asp, D); Cysteine (Cys, C); Glutamic acid (Glu, E); Glutamine (Gln, Q); Glycine (Gly, G); Histidine (His, H); Isoleucine (Ile, I); Leucine (Leu, L); Lysine (Lys K); Methionine (Met, M); Phenylalanine (Phe, F); Proline (Pro, P); Serine (Ser, S); Threonine (Thr, T); Tryptophan (Trp, W); Tyrosine (Tyrosine; Tyr, Y); and Valine (Val, V).
  • each nucleoside when meaning a base, each can be interpreted as adenine (A), thymine (T), cytosine (C), guanine (G), or uracil (U) itself, and when meaning a nucleoside, each can be interpreted as adenosine (A), thymidine (T), cytidine (C), guanosine (G), or uridine (U), and when meaning a nucleotide in a sequence, each nucleoside is included. It should be construed as meaning a nucleotide that
  • operably linked means that, in gene expression technology, a specific component is linked to another component so that the specific component can function in an intended manner.
  • a promoter sequence when a promoter sequence is said to be operably linked to a coding sequence, it means that the promoter is linked to affect transcription and/or expression of the coding sequence in a cell.
  • the term includes all meanings that can be recognized by those skilled in the art, and may be appropriately interpreted depending on the context.
  • target gene or target nucleic acid
  • target gene or “target nucleic acid” basically means a gene or nucleic acid in a cell that is a target of gene editing.
  • the target gene or target nucleic acid may be used interchangeably and may refer to the same target.
  • the target gene or target nucleic acid may refer to both a gene or nucleic acid native to the target cell or a gene or nucleic acid derived from the outside, and is not particularly limited as long as it can be a target of gene editing.
  • the target gene or target nucleic acid may be single-stranded DNA, double-stranded DNA, and/or RNA.
  • the term includes all meanings that can be recognized by those skilled in the art, and may be appropriately interpreted depending on the context.
  • target sequence refers to a specific sequence that the CRISPR/Cas complex recognizes to cleave a target gene or target nucleic acid.
  • the target sequence may be appropriately selected depending on the purpose.
  • target sequence is a sequence included in a target gene or target nucleic acid sequence, and refers to a sequence complementary to a guide RNA provided herein or a spacer sequence included in an engineered guide RNA.
  • the spacer sequence is determined considering the sequence of the target gene or target nucleic acid and the PAM sequence recognized by the effector protein of the CRISPR/Cas system.
  • the target sequence may refer to only a specific strand complementarily binding to the guide RNA of the CRISPR/Cas complex, or may refer to the entire target double strand including the specific strand, which is appropriately interpreted depending on the context.
  • the term includes all meanings that can be recognized by those skilled in the art, and may be appropriately interpreted depending on the context.
  • a vector refers collectively to any material capable of delivering genetic material into a cell, unless otherwise specified.
  • a vector may be, but is not limited to, a DNA molecule comprising a genetic material of interest, such as a nucleic acid encoding an effector protein of the CRISPR/Cas system, and/or a nucleic acid encoding a guide RNA.
  • a genetic material of interest such as a nucleic acid encoding an effector protein of the CRISPR/Cas system
  • guide RNA a nucleic acid encoding a guide RNA.
  • the term includes all meanings that can be recognized by those skilled in the art, and may be appropriately interpreted depending on the context.
  • the CRISPR/Cas system is a type of immune system found in prokaryotic organisms and includes a Cas protein, and a guide RNA.
  • the detailed structure of the Cas protein or guide RNA is described in detail in the published document WO2018/231018 (International Publication No.).
  • the term "Cas protein” used herein is a general term for nucleases that can be interpreted as being used in the CRISPR/Cas system. The DNA cleavage process of the most commonly used CRISPR/Cas9 system is briefly described below.
  • the Cas9 protein corresponds to Class 2 and Type II in the CRISPR/Cas system classification, and includes Streptococcus pyogenes, Streptococcus thermophilus, Streptococcus sp., Streptomyces pristinaespiralis, and Streptomyces viridochromogenes ( Streptomyces viridochromogenes), Streptomyces viridochromogenes, Streptosporangium roseum, and Streptosporangium roseum-derived Cas9 proteins.
  • RNA having a function of inducing the CRISPR/Cas9 complex to recognize a specific sequence included in a target nucleic acid is called a guide RNA.
  • the scaffold sequence portion is a portion that interacts with the Cas9 protein and is a portion that binds to the Cas9 protein to form a complex.
  • the scaffold sequence portion includes tracrRNA and crRNA repeat sequence portions, and the scaffold sequence is determined depending on which Cas9 protein is used.
  • the guide sequence portion is a portion capable of complementarily binding with a nucleotide sequence portion of a certain length in the target nucleic acid.
  • the guide sequence portion is a base portion that can be artificially modified, and is determined by the target nucleotide sequence of interest.
  • the Cas9 protein When the CRISPR/Cas9 complex contacts a target nucleic acid, the Cas9 protein recognizes a nucleotide sequence of a certain length, and a portion of the guide RNA (the guide sequence portion) complementarily binds to a portion adjacent to the PAM sequence, the target nucleic acid is cleaved by the CRISPR/Cas9 complex.
  • a nucleotide sequence of a certain length recognized by the Cas9 protein is called a protospacer-adjacent motif (PAM) sequence, which is a sequence determined according to the type or origin of the Cas9 protein.
  • PAM protospacer-adjacent motif
  • the Cas9 protein from Streptococcus pyogenes can recognize the 5'-NGG-3' sequence in a target nucleic acid.
  • N is one of adenosine (A), thymidine (T), cytidine (C), and guanosine (G).
  • the guide sequence portion of the guide RNA must complementarily bind to the sequence portion adjacent to the PAM sequence.
  • target strand non-target strand
  • the CRISPR/Cas9 complex has cleavage activity against double-stranded DNA.
  • a strand having a protospacer binding to the guide sequence portion is referred to as a target strand (TS).
  • a strand complementary to the target strand and having a protospacer that does not bind to the guide sequence portion is referred to as a non-target strand (NTS).
  • the guide sequence portion may complementarily bind to a protospacer sequence portion included in the target strand (TS) of the double-stranded DNA.
  • the guide sequence and the protospacer sequence included in the non-target strand (NTS) of the double-stranded DNA are equivalent sequences. Specifically, the only difference is that the guide sequence is an RNA sequence and the protospacer sequence included in the non-target strand (NTS) is a corresponding DNA sequence.
  • a technology capable of screening such a high-efficiency Cas protein is essential. Since it is not possible to measure the in vivo activity of all Cas protein candidates due to time and cost issues, a method for highly efficient Cas screening is generally performed in an in vitro cell line environment. However, when the Cas protein screened and selected in the cell line environment is used in an in vivo environment such as an animal model, preclinical, or clinical experiment, it often does not show sufficient activity. This is a problem that arises because the Cas candidate protein screening method of the prior art does not sufficiently simulate the in vivo environment in which the Cas protein actually operates.
  • the testing vector includes a nucleic acid capable of expressing a "Cas candidate protein” and includes a low-efficiency delivery environment-inducing element.
  • the "Cas candidate protein” includes not only the Cas protein, but also a fusion protein in which an additional domain is fused to the Cas protein, for example, a base editor or a prime editor.
  • the testing vector expresses only a small amount of Cas protein as intended in advance and/or allows only a small amount of Cas protein to reach the active site.
  • the active site of the Cas protein or its variant refers to a site where the Cas protein or its variant interacts with the guide RNA to show activity.
  • the testing vector mimics an environment in which a sufficient amount of Cas protein is not delivered in a sufficient amount because the efficiency of delivery technology to the active site is low, as in the case of using actual Cas protein in a cell.
  • the low-efficiency delivery environment-inducing element may include an expression inhibition-inducing element and an active site access hindrance-inducing element.
  • the testing vector has a low expression level when transduced into cells, and the rate at which the expressed Cas protein successfully reaches the active site (eg, cell nucleus) is also low. Therefore, when the testing vector is used for gene editing, gene editing is performed under an environment similar to that used when the CRISPR/Cas system is used in an actual living body. When the testing vector is used for screening Cas candidate proteins, it is possible to overcome the limitations of the prior art and select Cas proteins exhibiting activities similar to those of actual in vivo experiments.
  • a testing vector for screening Cas candidate proteins may include a nucleic acid encoding a Cas protein in which an expression repression-inducing element and an active site access hindering-inducing element are fused.
  • a target for expression of a nucleic acid encoding a Cas candidate protein included in the testing vector may be a Cas protein.
  • the Cas protein may be a variant of a specific Cas protein.
  • the Cas protein may be a Cas protein having a nuclease activity, a nickase activity, or an inactivated nucleic acid cleavage function.
  • a target for expression of a nucleic acid encoding a Cas candidate protein included in the testing vector may be a base editor including a Cas protein or a variant thereof.
  • the base editor is a fusion protein in which a Cas protein or a variant thereof and a base correction domain are fused.
  • the base correction domain may be an adenosine deaminase or a cytidine deaminase, but is not limited thereto.
  • the base editor serves to substitute a specific range of bases adjacent to the target sequence recognized by the Cas protein or its variant with another.
  • the variant of the Cas protein may be one whose function is appropriately changed so as to efficiently correct bases.
  • the base editor may be a fusion protein in which a Cas protein having an inactivated nucleic acid cleavage function and a base editing domain are fused.
  • a target for expression of a nucleic acid encoding a Cas candidate protein included in the testing vector may be a prime editor including a Cas protein or a variant thereof.
  • the prime editor is a fusion protein in which a Cas protein or a variant thereof and a reverse transcriptase are fused.
  • the prime editor works together with the pegRNA for the prime editor to correct a predetermined sequence to be corrected with a previously designed correction sequence.
  • the sequence to be corrected is a sequence included in the gene of interest, and the sequence to be corrected is a sequence to be inserted into the gene by replacing the sequence to be corrected.
  • the variant of the Cas protein may be one whose function is appropriately changed so as to efficiently correct the sequence.
  • the prime editor may be a fusion protein in which a Cas protein having nickase activity and a reverse transcriptase are fused.
  • the 'low-efficiency delivery environment-inducing element' included in the testing vector does not affect the activity of the Cas protein itself, but affects the expression level and / or active site delivery. As a result, it means an element that inhibits the activity of the Cas protein or its variant. For example, when the expression of the Cas protein or variant thereof is suppressed in a cell, less Cas protein or variant thereof is produced and the activity of the Cas protein or variant thereof is more suppressed, the factor that induces inhibition of expression of the Cas protein or variant thereof may be referred to as a low-efficiency delivery environment-inducing element.
  • low-efficiency delivery environment-inducing elements elements that induce interference may be referred to as low-efficiency delivery environment-inducing elements. That is, for example, a low-efficiency delivery environment-inducing element may be used as a concept including an active site access hindrance-inducing element and an expression inhibition-inducing element.
  • low-efficiency delivery environment-inducing elements all elements that result in suppressing the activity of the Cas protein or its variants may be referred to as low-efficiency delivery environment-inducing elements.
  • expression suppression-inducing elements and active site access interference-inducing elements which are representative low-efficiency delivery environment-inducing elements, will be described.
  • Expression inhibition-inducing element (element inducing inhibition of expression)
  • the 'expression inhibition-inducing element refers to an element that inhibits the expression of Cas protein or variants thereof.
  • suppressing the expression of the Cas protein or its variant means that the Cas protein is expressed but the level of expression is down-regulated.
  • the expression repression-inducing element may include, for example, an underexpressed promoter, wherein the underexpressed promoter may be, for example, a modified promoter.
  • the modified promoter may include a sequence having a promoter function made by removing some sequences or adding some sequences from promoters well known in the art.
  • the 'element inducing interruption of access to active site' refers to an element that induces interruption of access of a Cas protein or a variant thereof to an active site.
  • the active site of the Cas protein or its variant refers to a site where the Cas protein or its variant interacts with the guide RNA to show activity.
  • the active site may be, for example, in a cell, in a nucleus of a cell, or a site where a gene determined by the guide RNA is edited.
  • the active site access hindrance-inducing element may be, for example, a nuclear export signal (NES) or a sequence encoding the same.
  • NES nuclear export signal
  • the active site access hindrance-inducing element may be expressed separately from the Cas protein included in the testing vector, or may be expressed as a fusion protein fused with the Cas protein.
  • the testing vector may express a fusion protein in which NES is fused to the N-terminus and/or C-terminus of the Cas protein.
  • a fusion of the active site access hindering-inducing element with the Cas protein is referred to as a fused Cas protein with an active site access hindering-inducing element.
  • the active site access hindering-inducing element is expressed in a fused state with the Cas protein, the activity of the Cas protein itself is not affected, and only interferes with the Cas protein's access to the active site.
  • the active site access hindrance-inducing element is NES
  • the Cas protein to which the active site access hindrance-inducing element is fused may be referred to as a NES-Cas fusion protein.
  • the active site access hindrance-inducing element prevents the Cas protein from accessing the active site, and the Cas protein to which the active site access hindrance-inducing element is fused has a low rate of reaching the active site when expressed in cells compared to general Cas proteins.
  • the testing vector expresses a Cas candidate protein or a similar expression, not only the case of expressing only the actual Cas candidate protein, but also the case of expressing a Cas protein in which the active site access hindrance-inducing element is fused. It should be understood as encompassing the term.
  • the testing vector may include a nucleic acid encoding a NES-Cas fusion protein.
  • the testing vector may not only express the Cas candidate protein, but may also express the guide RNA for the Cas candidate protein.
  • the testing vector may express each component of the CRISPR/Cas system.
  • the guide RNA includes a scaffold that interacts with the Cas candidate protein to form a CRISPR/Cas complex and a guide domain capable of targeting a predetermined target sequence.
  • the guide RNA may include a crRNA and tracrRNA including a direct repeat and a guide domain, and the direct repeat and tracrRNA may collectively be referred to as a scaffold.
  • the guide RNA includes a crRNA including a direct repeat and a guide domain, and the direct repeat may be referred to as a scaffold.
  • the testing vector includes a nucleic acid encoding a guide RNA.
  • the guide RNA may interact with a Cas candidate protein to form a CRISPR/Cas complex, and may target a predetermined target sequence.
  • the testing vector may express not only the prime editor but also pegRNA.
  • the pegRNA may have a guide RNA, an RT-template, and a primer binding site sequentially linked from the 5' end to the 3' end.
  • the guide RNA is the same as described in the above ⁇ additional component 1 - guide RNA>> section, and the guide RNA may form a complex by interacting with the prime editor.
  • the RT-template has a sequence serving as a template when a predetermined sequence to be calibrated is calibrated with a calibration sequence.
  • the primer binding site complementarily binds to the sequence to be corrected or its neighboring sequence so that the RT-template can act as a template at the right position, so that the RT-template is positioned at the right position.
  • the testing vector includes a low-efficiency delivery environment-inducing element, an environment in which Cas activity is inevitably low is created as intended in advance even when successfully transfected into cells. Specifically, 1) the expression level itself is lowered by the expression suppression-inducing element, and 2) the active site accessibility of the expressed Cas protein is reduced by the active site access hindering-inducing element, so only a small number of Cas proteins reach the active site.
  • the testing vector disclosed herein can be used to construct a library for screening various Cas candidate proteins.
  • a library is constructed by changing only the configuration of the nucleic acid encoding the Cas candidate protein to the configuration of the testing vector in various ways, the Cas candidate protein can be screened using the screening method of the present invention by directly applying the library to the cell line.
  • the testing vector can be used to construct a library for screening Cas variants derived from the same Cas protein, for example, Cas9 variants derived from Streptococcus pyogenes.
  • the testing vector may be used to construct a library for screening a Cas protein having a specific function, for example, a Cas9 protein variant in which a PAM sequence recognizing is altered.
  • the present invention discloses a testing set for screening Cas candidate proteins.
  • the testing set can be used by directly treating cells to be screened.
  • the testing set includes a plurality of the testing vectors and may include other additional components.
  • the plurality of testing vectors may include respective Cas candidate proteins included in a library for screening Cas candidate proteins.
  • the testing set includes a plurality of testing vectors.
  • the testing set includes two or more testing vectors capable of expressing Cas candidate proteins of different amino acid sequences.
  • the testing set may further include a guide RNA or a nucleic acid encoding the guide RNA.
  • the guide RNA can form a complex by interacting with a Cas candidate protein that can be expressed by at least one of the testing vectors included in the testing set, and can target a predetermined target sequence.
  • the testing set may additionally include two or more types of guide RNAs having different nucleic acid sequences.
  • each guide RNA can form a complex by interacting with a Cas candidate protein that can be expressed by at least one of the testing vectors included in the testing set, and can target a predetermined target sequence.
  • the testing set when a testing vector included in the testing set includes a prime editor as a Cas candidate protein, the testing set may include a pegRNA or a nucleic acid encoding the pegRNA.
  • the pegRNA is the same as described in the section ⁇ Nucleic acid encoding at least one guide RNA 2-when the target to be screened is a prime editor ⁇ .
  • the dummy vector is a vector having the same/similar structure and length as the testing vector, but cannot express a Cas candidate protein and preferably does not have any other effect on cells.
  • the dummy vector may be transfected into cells competitively with the testing vector when the screening method is performed.
  • the dummy vector does not have any function unlike the testing vector, but serves to reduce the number of testing vectors transfected into one cell during the screening method. As a result, it serves to increase the efficiency of the screening method by enabling more efficient selection of gene-edited cells.
  • the testing set may additionally include a selection element.
  • the selection element means an element that allows the CRISPR/Cas system to operate to select cells in which gene editing has occurred when the testing set is used in a screening method, and can be appropriately included by a person skilled in the art by referring to known techniques.
  • the selection element may be a vector containing a virulence gene, a fluorescent protein expression gene, and/or an antibiotic resistance gene.
  • the Cas protein candidate screening method enables efficient screening by quickly reducing the Cas protein candidate group with high activity when there are so many types of Cas candidate proteins to be screened that it is inefficient to evaluate and compare the activities of each Cas candidate protein.
  • the method for screening Cas protein candidates can be efficiently used when selecting a part of a large library of Cas candidate proteins.
  • the Cas candidate protein library may be, for example, a Cas amino acid sequence list in which random mutations are introduced at random positions among the amino acid sequences of a specific Cas protein.
  • the plurality of cells means two or more individual cells. Since the candidate selection method is a method of selecting a Cas protein candidate group having high activity among a plurality of Cas candidate proteins, the activity must be determined by introducing a plurality of CRISPR/Cas systems into a plurality of cells.
  • the plurality of cells may be cells of the same species.
  • the plurality of cells may be eukaryotic cells.
  • the plurality of cells may be any one selected from MRC5, HT1080, HEK293T, 129TF, MEF, C2C12, MSC, and CMMT cells.
  • the testing vector is the same as described in the section ⁇ Testing Vector for Cas Candidate Protein Screening ⁇ .
  • the plurality of testing vectors not only means that the number of testing vectors used in the Cas protein candidate screening method is plural, but also means that two or more of the testing vectors include nucleic acids encoding Cas candidate proteins having different amino acid sequences.
  • the plurality of testing vectors means that the testing vectors described in “Testing Vectors for Cas Candidate Protein Screening” are constructed for each Cas candidate protein sequence included in the Cas candidate library.
  • the dummy vector is transfected into cells competitively with the testing vector and, unlike the testing vector, does not function in cells. As a result, the dummy vector reduces the number of transfected cells (i.e. copy number) of the testing vector, enabling more efficient selection of gene-edited cells.
  • the dummy vector is as described in the ⁇ Additional Component 2 - Dummy Vector> section above.
  • the at least one guide RNA interacts with at least Cas candidate proteins included in the plurality of testing vectors to form a CRISPR/Cas complex.
  • the guide RNA is a component that expresses a Cas candidate protein from a testing vector introduced into the cell and forms a complex with the guide RNA to allow gene editing of the cell to occur. Since the Cas protein candidate screening method disclosed herein uses several types of different Cas proteins, one type or two or more types of guide RNAs to be introduced may be used depending on circumstances. For example, in the Cas protein candidate screening method, 1) each Cas candidate protein is a different variant derived from the same Cas protein, and 2) each Cas candidate protein has the same structure as the original Cas protein.
  • the CRISPR/Cas complex can form and operate, only one guide RNA can be used.
  • the guide RNA can be used as many as the number of types of the Cas candidate protein used in the screening method.
  • the at least one guide RNA refers to a pegRNA that can operate together with the prime editor.
  • the pegRNA interacts with the prime editor to form a complex.
  • the pegRNA additionally contains a primer binding site capable of complementarily binding to the sequence to be edited or a nearby sequence contained in the cell compared to the guide RNA, and an RT-template, which is a sequence that serves as a template for correcting the sequence to be calibrated with the sequence to be calibrated.
  • the pegRNA has a structure in which the guide RNA - RT-template - Primer binding site are sequentially linked from the 5' end to the 3' end.
  • the pegRNA can be treated similarly to the guide RNA, and the description of "guide RNA” below can also be applied to the pegRNA.
  • the Cas candidate protein and the guide RNA may form a CRISPR/Cas complex and operate, wherein the CRISPR/Cas complex is designed to edit a previously intended gene.
  • the Cas candidate protein binds to a specific guide RNA to form a CRISPR/Cas complex and has nuclease and/or nickase activity.
  • the specific guide RNA is capable of targeting a target sequence of a previously intended gene.
  • the pre-intended gene can be checked for editing by the CRISPR/Cas complex, and is not particularly limited as long as it is possible to select cells in which the pre-intended gene has been edited among a plurality of cells.
  • the Cas candidate protein is a prime editor, binds to pegRNA to form a complex, and has nickase activity.
  • the pegRNA is capable of correcting the sequence to be corrected for a previously intended gene with a correction sequence. It is possible to know whether the pre-intended gene has been corrected by the prime editor, and is not particularly limited as long as it is possible to select cells corrected with the pre-intended gene among a plurality of cells.
  • the pre-intended gene may be a gene exhibiting cytotoxicity in a specific culture environment.
  • the pre-intended gene is an HPRT gene, and the HPRT gene may be a gene exhibiting cytotoxicity when cultured in a 6TG environment.
  • CRISPR/Cas introduction process A process of randomly introducing a plurality of testing vectors and nucleic acids encoding at least one guide RNA into a plurality of cells (hereinafter referred to as CRISPR/Cas introduction process)
  • the Cas protein candidate screening method includes randomly introducing a plurality of testing vectors and nucleic acids encoding at least one guide RNA into a plurality of cells.
  • the guide RNA is capable of targeting a target sequence included in a pre-intended gene in a cell.
  • the Cas candidate protein expressed by the testing vector and the guide RNA interact to form a CRISPR/Cas complex, the pre-intended gene may be edited.
  • CRISPR/Cas transduced cells cells into which nucleic acids encoding the plurality of testing vectors and at least one guide RNA are introduced are referred to as CRISPR/Cas transduced cells.
  • the purpose of the CRISPR/Cas introduction process is to allow the Cas candidate protein included in the testing vector to be expressed in the cell, to directly introduce the guide RNA, or to be expressed in the cell so that the CRISPR/Cas system can operate in the cell. Since the CRISPR/Cas introduction process occurs randomly, a plurality of Cas proteins and one or more guide RNAs having different amino acid sequences can be expressed in one CRISPR/Cas cell. Accordingly, two or more different CRISPR/Cas complexes may be expressed in the single CRISPR/Cas transduced cell.
  • the amount of Cas protein delivered to the active site is reduced due to the characteristics of the testing vector.
  • the CRISPR/Cas system contained in the transfected cells can operate in an environment similar to a low-efficiency delivery environment.
  • Example 1 of the CRISPR/Cas introduction process - When the nucleic acid encoding the guide RNA is included in the testing vector
  • the nucleic acid encoding the guide RNA may be included in the testing vector.
  • the above embodiment can be used when each Cas candidate protein interacts with each other guide RNA.
  • testing vector further comprises a nucleic acid encoding the components described in "Testing Vector for Screening a Cas Candidate Protein" and a guide RNA for a Cas candidate protein.
  • Example 2 of the CRISPR/Cas introduction process In case the nucleic acid encoding the guide RNA is introduced independently of the testing vector
  • the nucleic acid encoding the guide RNA (or pegRNA) can be introduced into cells independently of the testing vector.
  • the nucleic acid encoding the guide RNA may be introduced simultaneously or sequentially with the testing vector.
  • the above embodiment can be used when each Cas candidate protein interacts with the same guide RNA. In this case, only a small amount of nucleic acid encoding the guide RNA needs to be prepared and can be efficiently used.
  • testing vectors and nucleic acids encoding guide RNAs may be introduced simultaneously or sequentially, and the number of testing vectors and the number of nucleic acids encoding the guide RNAs (referring to the number of types) may be different.
  • the CRISPR/Cas introduction process may be a process in which the methods described in ⁇ CRISPR/Cas introduction process example 1 - case in which nucleic acid encoding a guide RNA is included in a testing vector> and ⁇ CRISPR/Cas introduction process example 2> - case where each Cas candidate protein interacts with one type of guide RNA> may be appropriately combined.
  • a process of selecting cells in which a pre-intended gene has been edited among the CRISPR/Cas-introduced cells (hereinafter referred to as a cell selection process)
  • the Cas protein candidate screening method includes a process of selecting cells in which a previously intended gene has been edited among the CRISPR/Cas introduced cells.
  • the pre-intended gene may be a gene exhibiting cytotoxicity in a specific environment.
  • the cell selection process is as follows:
  • the pre-intended gene may be the HPRT gene
  • the cell selection process may be a process of culturing the plurality of cells in a medium containing 6TG and selecting cells that do not die and survive.
  • a process of specifying the amino acid sequence of a Cas candidate protein included in the selected cells (hereinafter, a process of specifying a candidate group)
  • the cells selected in the cell sorting process contain a high-efficiency Cas candidate protein capable of editing a pre-intended gene in an environment similar to a low-efficiency delivery environment. Accordingly, by specifying the amino acid sequence of the Cas candidate protein included in the selected cells, information on the Cas candidate protein can be obtained with high efficiency.
  • the method of specifying the amino acid sequence of the Cas protein is not otherwise limited, and a person skilled in the art may appropriately perform it with reference to known methods.
  • the process of specifying the candidate group may be to perform NGS (Next-Generation Sequencing) on the selected cells to specify them.
  • the Cas protein candidate screening method disclosed in the present specification When the Cas protein candidate screening method disclosed in the present specification is performed, only high-efficiency Cas candidate proteins can be quickly and efficiently selected from among numerous Cas candidate proteins.
  • the amino acid sequence list specified as a result of the Cas protein candidate screening method can then be used to 1) find the optimal Cas protein by measuring gene editing efficiency for individual sequences, or 2) search for efficient Cas protein mutation sites.
  • the plurality of testing vectors used for screening the Cas protein candidates that is, the Cas candidate protein library
  • the specified amino acid sequence list is compared with the sequence of the original Cas protein. It can be used to select efficient Cas protein mutation site candidates.
  • the ⁇ Method for Screening Cas Candidate Proteins>> should be viewed as a method for quickly selecting high-efficiency Cas protein candidates from a vast Cas protein library rather than a method for selecting an optimal Cas protein sequence. Therefore, in order to actually select the optimal Cas protein, the actual efficiency of the Cas protein of the amino acid sequence specified by the candidate screening method should be measured.
  • the method of selecting the optimal Cas protein includes measuring the gene editing efficiency of each of the specified Cas protein candidates, and can be performed by a person skilled in the art with appropriate reference to known techniques.
  • variants of the Streptococcus pyogenes-derived Cas9 protein found through the testing vector and the Cas candidate protein screening method are disclosed.
  • the inventors of the present specifications were based on the SNIPER CAS9 protein, a variant of SPCAS9 protein or SPCAS9 protein, and applied the CAS candidate protein screening method to discover high -level SPCAS9 protein variant candidate group, and analyzed the amino acid sequence of the candidates by analyzing the SPCAS9 (or SNI. PER CAS9)
  • the optimal variation location for manufacturing a highly active variant of the protein was found to be identified to identify the amino acid sequence of the highly active SPCAS9 protein variant.
  • the SpCas9 protein variant is characterized in that a specific amino acid sequence position is mutated using the Cas9 protein derived from Streptococcus pyogenes or the Sniper Cas9 protein (refer to Korean Patent Publication No. 10-2020-0125191), which is researched and disclosed by the inventors of the present specification based on the SpCas9 protein.
  • the SpCas9 protein variant may be one in which one or more amino acids in the amino acid sequence of SEQ ID NO: 1 are mutated.
  • the SpCas9 protein variant may have one or more amino acids in the amino acid sequence of SEQ ID NO: 2 mutated.
  • amino acid is mutated refers to 1) one or more amino acids in the amino acid sequence being replaced with another, 2) one or more amino acids being removed, or 3) one or more amino acids being added.
  • the SpCas9 protein variant is 20th Valine, 83rd Glutamine, 128th Tyrosine, 402nd Glutamine, 467th Arginine, 635th Arginine, 642th Leucine of the amino acid sequence of SEQ ID NO: 1 or SEQ ID NO: 2 usine), 660th glycine, 680th leusine, 692nd asparagine, 835th aspartic acid, 931st valine, 975th valine, 1019th arginine, 1027th glutamine, At least one amino acid selected from Proline at position 1061, Tryptophan at position 1074, Glutamine at position 1091, and Arginine at position 1212 may be substituted with another amino acid.
  • the SpCas9 protein variant is represented by an amino acid sequence selected from SEQ ID NO: 3 to SEQ ID NO: 8.
  • the variants of the SpCas9 protein may also operate in a complex with guide RNA capable of forming a complex with the SpCas9 protein.
  • the guide RNA includes crRNA and tracrRNA of SpCas9 protein.
  • the guide RNA may be a single guide RNA (sgRNA) in which the crRNA and tracrRNA are linked through a linker.
  • the crRNA includes a direct repeat and a guide domain.
  • the direct repeating portion of the crRNA and the tracrRNA can form a complex by interacting with the variant of the SpCas9 protein, which can be collectively referred to as a scaffold.
  • the scaffold also includes the linker.
  • the guide domain of the crRNA is capable of targeting a predetermined target sequence.
  • the direct repeat of the crRNA is represented by the nucleic acid sequence of SEQ ID NO: 13.
  • the tracrRNA is represented by the nucleic acid sequence of SEQ ID NO: 14.
  • the scaffold of the single guide RNA is represented by the nucleic acid sequence of SEQ ID NO: 15.
  • a CRISPR/Cas complex in which a mutant of the SpCas9 protein and the guide RNA interact to form a complex.
  • the CRISPR/Cas complex may be in the form of a ribonucleoprotein.
  • the CRISPR/Cas complex has target-specific nuclease activity. Specifically, the CRISPR/Cas complex can cleave a target sequence of double-stranded DNA targeted by the guide domain of the guide RNA or a nucleic acid adjacent thereto.
  • the present specification discloses a CRISPR/Cas component expression vector capable of expressing the SpCas9 protein variant and the guide RNA, respectively.
  • the CRISPR/Cas component expression vector includes a nucleic acid encoding a variant of the SpCas9 protein and a nucleic acid encoding the guide RNA.
  • the encoding nucleic acid may be DNA, RNA, and/or chemically modified nucleic acid.
  • the CRISPR/Cas component expression vector may further include components for expressing the SpCas9 protein variant and the guide RNA in target cells.
  • the additional components may be appropriately selected by a person skilled in the art by referring to known technologies.
  • a gene editing method using the CRISPR/Cas system including the SpCas9 protein variant and the guide RNA includes introducing a CRISPR/Cas composition into a target cell, wherein the CRISPR/Cas composition includes a variant of the SpCas9 protein or a nucleic acid encoding the variant of the SpCas9 protein and the guide RNA or a nucleic acid encoding the guide RNA.
  • the guide RNA is capable of targeting a predetermined target sequence in the target cell.
  • An expression suppression-inducing element which suppresses the expression of a target operably linked to the expression suppression-inducing element.
  • Example 1 the expression repression-inducing element is a low expression promoter.
  • the low expression promoter is the UBC promoter.
  • the sequence of the UBC promoter is represented by the nucleic acid sequence of TTTTATGTACCTATCTTCTTAAGTAGCTGAAGCTCCGGTTTTGAACTATGCGCTCGGGGTTGGCGAGTGTGTTTTGTGAAGTTTTTTAGGCACCTTTTGAAATGTAATCATTTGGGTCAATATGTAATTTTCAGTGTTAGACTAGTAAATTGTCCGCTAAATTCTGGCCGTTTTTGGCTTTTTTGTTAGA (SEQ ID NO: 16) Become.
  • the low expression promoter is a modified sequence of the UBC promoter.
  • Example 5 the modified sequence of the UBC promoter is obtained by removing all or part of Exon 1 and/or Intron region of the wild type UBC promoter.
  • Example 6 the modified sequence of the UBC promoter is GGCCTCCGCGCCGGGTTTTGGCGCCTCCCGCGGGCGCCCCCCTCCTCACGGCGAGCGCTGCCACGTCAGACGAAGGGCGCAGCGAGCGTCCTGATCCTTCCGCCCGGACGCTCAGGACAGCGGCCCGCTGCTCATAAGACTCGGCCTTAGAACCCCAGTATCAGCAGAAGGACATTTTAGGACGGGACTTGGGTGACTCTAGGGCACT GGTTCTTTCCAGAGAGCGGAACAGGCGAGGAAAAGTAGTCCCTTCTCGGCGATTCTGCGGAGGGATCTCCGTGGGGCGGTGAACGCCGATGATTATATAAGGACGCGCCGGGTGTGGCACAGCTAGTTCCGTCGCAGCCGGGATTTGGGTCGCAGTTCTTGTTTGTGGATCGCTGATCGTCACTTG (SEQ ID NO: 17), and GGCCTCCGCGCCGGGTTTTGGC GCCTCCCGCGGGCGCCCCCCTCCTCACGGCGAGCTGCCACGTCAGA
  • Example 5 the modified sequence of the UBC promoter is obtained by removing all or part of the SP1 binding site and/or the PPAR ⁇ binding site of the wild type UBC promoter.
  • the modified sequence of the UBC promoter is TGATCCTTCCGCCCGGACGCTCAGGACAGCGGCCCGCTGCTCATAAGACTCGGCCTTAGAACCCCAGTATCAGCAGAAGGACATTTTAGGACGGGACTTGGGTGACTCTAGGGCACTGGTTTTCTTTCCAGAGAGCGGAACAGGCGAGGAAAAGTAGTCCCTTCTCGGCGATTCTGCGGAGGGATCTCCGTGGGCGGTGAACGCC GATGATTATATAAGGACGCGCCGGGTGTGGCACAGCT (SEQ ID NO: 19), and GCTGCTCATAAGACTCGGCCTTAGAACCCCAGTATCAGCAGAAGGACATTTTAGGACGGGACTTGGGTGACTCTAGGGCACTGGTTTTCTTTCCAGAGAGCGGAACAGGCGAGGAAAAGTAGTCCCTTCTCGGCGATTCTGCGGAGGGATCTCCGTGGGGCGGTGAACGCCGATGATTAT Represented by a nucleic acid sequence selected from ATAAGGACGCGCCGGGTGTGGCACAGCTCT
  • An active site access hindrance-inducing element which prevents a target connected to the active site access hindrance-inducing element from approaching the active site.
  • the active site access hindrance-inducing factor is a Nuclear export signal (NES).
  • the active site access barrier-inducing element is LDLASLIL (SEQ ID NO: 89), EMLKEINEALQLAE (SEQ ID NO: 90), EMLREINEALELKD (SEQ ID NO: 91), EILREINEALEFKD (SEQ ID NO: 92), EMFQELNEALELKD (SEQ ID NO: 93), KMFQELNEALELKD (SEQ ID NO: 94), EMFR ELNEALELKD (SEQ ID NO: 95), EMFRELNEALELMD (SEQ ID NO: 96), EMFRELNDALELKD (SEQ ID NO: 97), EMFRNLNEALELKD (SEQ ID NO: 98), EMIKKLNDALELQE (SEQ ID NO: 99), EMLKKINDGLDLLE (SEQ ID NO: 100), EFLKKINDGLELLE (SEQ ID NO: 101), EFLKK Represented by an amino acid sequence selected from INDGLELSD (SEQ ID NO: 102), LW
  • a Cas protein having nuclease activity having nuclease activity.
  • a Cas protein having nickase activity is provided.
  • the Cas9 protein according to any one of Examples 13 to 16, Streptococcus pyogenes, Streptococcus thermophilus, Streptococcus sp., Streptomyces pristinaespiralis, Streptomyces viridochromogenes (Streptococcus sp.) omyces viridochromogenes), Streptomyces viridochromogenes, Streptosporangium roseum, or Streptosporangium roseum derived Cas9 protein or a variant thereof.
  • Base editor including:
  • the base editor is a fusion protein in which a Cas protein and the base correction domain are fused.
  • Example 18 The method of Example 18, wherein the base editing domain is an adenosine deaminase.
  • Example 18 The method of Example 18, wherein the base editing domain is a cytidine deaminase.
  • the prime editor is a fusion protein in which the Cas protein and the reverse transcriptase are fused.
  • Fusion proteins comprising:
  • the fusion protein is a fusion protein in which at least one active site access hindrance-inducing element is fused to the N-terminus and/or C-terminus of the Cas protein of any one of Examples 13 to 17, the base editor of any one of Examples 18 to 20, or the prime editor of Example 21.
  • Example 23 wherein the active site access hindrance-inducing element is NES
  • the fusion protein includes a Cas protein, it is referred to as a NES-Cas fusion protein,
  • the fusion protein includes a base editor, it is referred to as a NES-base editor fusion protein,
  • the fusion protein When the fusion protein includes a prime editor, it is referred to as a NES-prime editor fusion protein.
  • the N 1 is an active site access hindrance-inducing element or absent in any one of Examples 10 to 12,
  • C is the Cas protein of any one of Examples 13 to 17, the base editor of any one of Examples 18 to 20, or the prime editor of Example 21,
  • the N 2 is an active site access hindrance-inducing element or absent in any one of Examples 10 to 12,
  • the fusion protein includes at least one active site access hindrance-inducing element.
  • Example 25 wherein the active site access hindrance-inducing element is NES
  • the fusion protein includes a Cas protein, it is referred to as a NES-Cas fusion protein,
  • the fusion protein includes a base editor, it is referred to as a NES-base editor fusion protein,
  • the fusion protein When the fusion protein includes a prime editor, it is referred to as a NES-prime editor fusion protein.
  • the expression suppression-inducing element and the nucleic acid encoding the fusion protein are operably linked.
  • Example 28 containing a nucleic acid encoding a guide RNA
  • Example 27 wherein the testing vector further comprises a nucleic acid encoding a guide RNA
  • the guide RNA can form a CRISPR/Cas complex by interacting with the Cas protein included in the fusion protein,
  • the guide RNA may target a predetermined target sequence.
  • Example 29 containing nucleic acids encoding pegRNA
  • Example 27 wherein the testing vector further comprises a nucleic acid encoding pegRNA
  • the pegRNA is a guide RNA, an RT-template, and a primer binding site sequentially linked from the 5' end to the 3' end,
  • the guide RNA may form a complex by interacting with the Cas protein included in the fusion protein,
  • the guide RNA may target a predetermined target sequence
  • the primer binding site may bind complementary to a predetermined sequence to be calibrated or to a sequence adjacent to the sequence to be calibrated,
  • the RT-template is a sequence serving as a template for correcting the sequence to be corrected with a correction sequence.
  • Testing set including:
  • the testing set includes nucleic acids encoding Cas proteins having at least two different amino acid sequences.
  • Example 30 The method of Example 30, wherein the testing set further comprises at least one guide RNA or a nucleic acid encoding the guide RNA,
  • Each of the guide RNAs may interact with at least one of the Cas proteins encoded by the fusion protein-encoding nucleic acids included in the testing set to form a CRISPR/Cas complex,
  • the guide RNA may target a predetermined target sequence.
  • Example 32 based on two testing vectors
  • Testing set including:
  • amino acid sequence of the Cas protein included in the fusion protein of the first testing vector and the amino acid sequence of the Cas protein included in the fusion protein of the second testing vector are different from each other.
  • Example 33 2 testing vectors, 1 guide RNA
  • Example 32 The method of Example 32, wherein the testing set further comprises a guide RNA or a nucleic acid encoding the guide RNA,
  • the guide RNA may form a CRISPR/Cas complex by interacting with the Cas protein included in the fusion protein of the first testing vector,
  • the guide RNA may form a CRISPR/Cas complex by interacting with the Cas protein included in the fusion protein of the second testing vector,
  • the guide RNA may target a predetermined target sequence.
  • Example 34 2 testing vectors, 1 pegRNA
  • Example 32 The method of Example 32, wherein the testing set further comprises pegRNA or a nucleic acid encoding the pegRNA,
  • the pegRNA is a guide RNA, an RT-template, and a primer binding site sequentially linked from the 5' end to the 3' end,
  • the guide RNA may form a complex by interacting with the Cas protein included in the fusion protein of the first testing vector,
  • the guide RNA may form a complex by interacting with the Cas protein included in the fusion protein of the second testing vector,
  • the guide RNA may target a predetermined target sequence
  • the primer binding site may bind complementary to a predetermined sequence to be calibrated or to a sequence adjacent to the sequence to be calibrated,
  • the RT-template is a sequence serving as a template for correcting the sequence to be corrected with a correction sequence.
  • Example 35 2 testing vectors, 2 guide RNAs
  • testing set further comprises:
  • the first guide RNA may form a CRISPR/Cas complex by interacting with the Cas protein included in the fusion protein of the first testing vector,
  • the second guide RNA may form a CRISPR / Cas complex by interacting with the Cas protein included in the fusion protein of the second testing vector,
  • the first guide RNA and the second guide RNA may each independently target a predetermined target sequence.
  • Example 36 2 testing vectors, 2 pegRNAs
  • testing set further comprises:
  • the first pegRNA is a first guide RNA, an RT-template, and a primer binding site sequentially linked from the 5' end to the 3' end;
  • the second pegRNA is a second guide RNA, an RT-template, and a primer binding site sequentially linked from the 5' end to the 3' end;
  • the first guide RNA may form a complex by interacting with the Cas protein included in the fusion protein of the first testing vector
  • the second guide RNA may form a complex by interacting with the Cas protein included in the fusion protein of the second testing vector,
  • the first guide RNA and the second guide RNA may each independently target a predetermined target sequence
  • the primer binding site may bind complementary to a predetermined sequence to be calibrated or to a sequence adjacent to the sequence to be calibrated,
  • the RT-template is a sequence serving as a template for correcting the sequence to be corrected with a correction sequence.
  • the testing set further includes a plurality of dummy vectors
  • the dummy vector does not express Cas protein in cells.
  • each of the plurality of dummy vectors has the same size (eg, sequence length) as at least one testing vector included in the testing set.
  • Cas candidate protein screening method comprising:
  • the CRISPR / Cas introduction process is a process of processing a plurality of cells with a testing set selected from any one of Examples 30 to 38, and optionally, processing at least one guide RNA (or pegRNA) or a nucleic acid encoding the guide RNA (or pegRNA),
  • a plurality of testing vectors included in the testing set and, optionally, a guide RNA or a nucleic acid encoding the guide RNA are randomly introduced into the plurality of cells,
  • the guide RNA included in the testing set can target a predetermined target sequence of a predetermined gene
  • the cell selection process is a process of selecting cells in which a predetermined gene has been edited among cells into which the testing set is introduced.
  • the process of specifying the candidate group is a process of specifying the amino acid sequence of the Cas protein included in the testing vector introduced into the selected cells.
  • Example 40 CRISPR/Cas introduction 1 - inclusion of guide RNA in testing vector
  • Example 39 the (a) CRISPR/Cas introduction process has the following characteristics:
  • the plurality of testing vectors included in the testing set are each independently the testing vectors of Example 28,
  • the CRISPR/Cas introduction process is to randomly introduce a plurality of testing vectors included in the testing set into the plurality of cells.
  • Example 41 CRISPR/Cas introduction 2 - introduction of one kind of guide RNA
  • Example 39 the (a) CRISPR/Cas introduction process has the following characteristics:
  • the testing set includes a plurality of testing vectors each independently selected from Examples 27 to 29, and one type of guide RNA or a nucleic acid encoding the guide RNA,
  • the CRISPR/Cas introduction process is to simultaneously or sequentially introduce a plurality of testing vectors included in the testing set and the guide RNA or a nucleic acid encoding the guide RNA into the plurality of cells.
  • Example 42 CRISPR/Cas introduction 3 - introduction of multiple guide RNAs
  • Example 39 the (a) CRISPR/Cas introduction process has the following characteristics:
  • the testing set includes a plurality of testing vectors each independently selected from Examples 27 to 29, and a plurality of guide RNAs or nucleic acids encoding the guide RNAs,
  • the CRISPR/Cas introduction process is to simultaneously or sequentially introduce a plurality of testing vectors included in the testing set and the plurality of guide RNAs or nucleic acids encoding the guide RNAs into the plurality of cells.
  • Example 43 CRISPR/Cas introduction 4 - Testing set and guide RNA treated separately
  • Example 39 the (a) CRISPR/Cas introduction process has the following characteristics:
  • the testing set includes a plurality of testing vectors each independently selected from Example 27,
  • the CRISPR/Cas introduction process is a process of randomly introducing the testing set and at least one guide RNA or a nucleic acid encoding the guide RNA into a plurality of cells,
  • the testing set and the guide RNA or a nucleic acid encoding the guide RNA are introduced simultaneously or sequentially.
  • the predetermined gene is a gene exhibiting cytotoxicity under specific conditions
  • the process of selecting cells in which the predetermined gene has been edited is a process of selecting cells that do not die and survive.
  • the predetermined gene is the HPRT gene, and the specific condition is that the plurality of cells are cultured in a medium containing 6TG.
  • the variant of the original Cas protein according to Example 46 is one in which at least one amino acid in the amino acid sequence of the original Cas protein is substituted with another amino acid.
  • Example 47 The method according to Example 47, wherein the original Cas protein is a Cas9 protein from Streptococcus pyogenes.
  • Example 47 wherein the native Cas protein is IAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLA SAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD (SEQ ID NO: 1) OR IAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWD
  • the variant of the original Cas protein according to any one of Examples 46 to No entry found recognizes a PAM sequence different from the PAM sequence recognized by the original Cas protein.
  • Example 50 The method according to Example 50, wherein the variant of the original Cas protein is a variant of the Cas9 protein derived from Streptococcus pyogenes, and the variant of the original Cas protein recognizes a PAM sequence different from 5'-NGG-3'.
  • Example 52 wherein the plurality of cells are human, non-human animal, and/or plant cells.
  • Example 54 human cell definition
  • Example 53 wherein the plurality of cells are human cells, and at least one selected from MRC5, HT1080, HEK293T, 129TF, MEF, C2C12, MSC, and CMMT cells.
  • the Cas protein is the prime editor of Example 21, and the guide RNA is a pegRNA in which a guide RNA, an RT-template, and a primer binding site are sequentially linked from the 5' end to the 3' end, and the prime editor-pegRNA complex functions to correct the sequence to be corrected included in the predetermined gene with a correction sequence using the RT-template as a template.
  • Example 56 wherein the variant of the Cas9 protein is IAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFEL ENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD (SEQ ID NO: 1) or IAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWD
  • the variant of the Cas9 protein is 20th Valine, 83rd Glutamine, 128th Tyrosine, 402nd Glutamine, 467th Arginine, 635th Arginine, 642nd Leusine in the amino acid sequence of the Cas9 protein , 660th Glysine, 680th Leusine, 692nd Asparagine, 835th Aspartic Acid, 931th Valine, 975th Valine, 1019th Arginine, 1027th Glutamine, 106 At least one amino acid selected from Proline at position 1, Tryptophan at position 1074, Glutamine at position 1091, and Arginine at position 1212 is substituted with another amino acid.
  • the variant of the Cas9 protein is IAKSEXEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRXLIETNGETGEIVXDKGRDFATVRKVLSMPXVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFEL ENGRKXMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD (SEQ ID NO: 9), IAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRXLIETNGETGEIVX
  • the Cas9 protein variant according to any one of Examples 56 to 59, wherein the variant of the Cas9 protein is IAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRDLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEV KKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD (SEQ ID NO: 3), IAKSEQEIGKATAKYFFYSNINFFK
  • the variant of the Cas9 protein according to any one of Examples 56 to 60 is one in which at least one nuclear localization signal (NLS) is fused to the N-terminus and/or C-terminus.
  • NLS nuclear localization signal
  • crRNA in which a guide domain and a direct repeat are linked from the 5' end to the 3' end;
  • the direct repeat of the crRNA and the tracrRNA may form a complex by interacting with a Cas9 protein derived from Streptococcus pyogenes or a variant of the Cas9 protein,
  • the guide domain may target a predetermined target sequence.
  • the guide RNA is a single guide RNA in which the crRNA and the tracrRNA are linked from the 5' end to the 3' end through a linker.
  • Example 65 single guide RNA scaffold sequence definition
  • the guide RNA has a guide domain and a scaffold sequentially linked from the 5' end to the 3' end,
  • the scaffold is a direct repeater, linker, and tracrRNA connected in the direction from the 5' end to the 3' end,
  • the scaffold is represented by a nucleic acid sequence of UUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (SEQ ID NO: 15) or a nucleic acid sequence that is at least 80%, at least 85%, at least 90%, or at least 95% identical to the nucleic acid sequence.
  • the direct repeating portion of the crRNA is represented by a nucleic acid sequence of GUUUUAGAGCUA (SEQ ID NO: 13) or a nucleic acid sequence that is at least 80%, at least 85%, at least 90%, or at least 95% identical to the nucleic acid sequence,
  • the tracrRNA is represented by a nucleic acid sequence of UAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU (SEQ ID NO: 14) or a nucleic acid sequence that is at least 80%, at least 85%, at least 90%, or at least 95% identical to the nucleic acid sequence.
  • a CRISPR/Cas complex comprising:
  • the guide RNA interacts with the Cas9 protein variant to form a complex.
  • Vectors expressing each component of the CRISPR/Cas system including:
  • the guide RNA may form a complex by interacting with the Cas9 protein variant.
  • a CRISPR/Cas composition comprising:
  • a guide RNA selected from any one of Examples 62 to 66, or a nucleic acid encoding the guide RNA,
  • the guide RNA interacts with the Cas9 protein variant to form a complex.
  • Example 70 gene editing method
  • Intracellular target gene editing methods comprising:
  • the guide domain included in the guide RNA targets the target sequence of the target gene in the cell.
  • PCR was performed for the UBC promoter sequence using gDNA of HEK293T cells. Then, plasmid cloning was performed through Gibson assembly.
  • NLS, NES cloning and modified UBC promoter cloning were all performed through Gibson assembly.
  • HEK293T cells were cultured in DMEM (10% FBS, 1% penicillin streptomycin) at 37°C, 5% CO 2 environment. 500 ng of Cas9 plasmid, 500 ng of sgRNA plasmid, and 2 ⁇ l of Lipofectamin2000 were used to transfect 1x10 5 HEK293T cells. 2 or 3 days after transfection, gDNA prep was performed to conduct targeted deep sequencing experiments.
  • RNA was completely removed from the stable cell line selected for about 2 weeks according to the above method, and gDNA prep was performed.
  • HPRT is a gene that participates in the metabolic process of converting 6TG into a toxic substance.
  • Sp Cas9 by knocking out HPRT with Sp Cas9, cells can survive in a 6TG environment. That is, Cas9 mutants that effectively knock out HPRT by creating an environment in which Cas9 is not well transmitted can be screened through 6TG treatment.
  • a low-expression promoter was used to create an environment with a low transduction rate of 0.1% indel activity.
  • the SpCas9 is the Cas9 protein of SEQ ID NO: 1
  • NLS is the Nuclear localization signal of SEQ ID NO: 22
  • NES is the Nuclear export signal of SEQ ID NO: 89.
  • the expression level can be reduced by removing a relatively insignificant part of the promoter.
  • the inventors of the present specification selected modified UBC promoter candidates through references, and attempted to confirm changes in indel introduction activity accordingly.
  • the commonly used UBC promoter is used in the form of an intron attached to Exon1, which does not encode a protein, in the promoter part.
  • the expression level decreases when the intron portion is removed or both Exon1 and intron are removed.
  • a modification method for such a UBC promoter is schematically shown in FIG. 6 . Referring to Experimental Example 1, when using a variant of the UBC promoter, how much indel was introduced into the EMX1 gene was measured. The composition of the Cas protein and promoter used in this experiment is shown in [Table 2].
  • SpCas9 is the Cas9 protein of SEQ ID NO: 1
  • NLS is the Nuclear localization signal of SEQ ID NO: 22
  • NES is the Nuclear export signal of SEQ ID NO: 89.
  • Experimental results are shown in FIG. 7 . As a result of the experiment, it was confirmed that the indel introduction rate decreased as Exon1 and intron portions were removed from the UBC promoter.
  • the inventors of the present invention conducted research to achieve a lower expression rate through additional modifications other than the above modifications.
  • the inventors searched for the transcription factor binding site of the UBC promoter, and tried to determine whether the expression rate was lowered by removing the SP1 binding site and the PPAR ⁇ binding site located at the 5' side.
  • a schematic diagram of the UBC promoter with the binding site removed is shown in FIG. 8 .
  • Experimental Example 1.1 when using the UBC promoter variant in which the transcription factor binding site of the UBC promoter was removed, how much indel was introduced into the EMX1 gene was measured.
  • the Cas protein and promoter configurations used in this experiment are shown in Table 3.
  • the SpCas9 is the Cas9 protein of SEQ ID NO: 1
  • NLS is the nuclear localization signal of SEQ ID NO: 22
  • NES is the nuclear export signal of SEQ ID NO: 89.
  • HeLa stable cell lines were constructed using the piggybac system for the UBC promoter, UBC_mini (SEQ ID NO: 18) promoter, and UBC 243 (SEQ ID NO: 20) promoter, and indel generation experiments were performed targeting the HPRT gene.
  • the Cas protein, guide RNA and promoter configurations used in the experiment are shown in [Table 4].
  • the SpCas9 is the Cas9 protein of SEQ ID NO: 1
  • NLS is the Nuclear localization signal of SEQ ID NO: 22
  • NES is the Nuclear export signal of SEQ ID NO: 89.
  • the UBC 243 promoter showed the lowest activity (FIG. 11).
  • the result of using the UBC 243 promoter is a PCR error, and there is a possibility that indels did not actually occur.
  • Sniper library 1 2, 3 each of 4x10 6 cells were cultured on 3 plates of 150pi dishes.
  • the vector used to construct the library can express the fusion protein of the NES-Cas protein-NES structure, and the UCB mini promoter is operably linked to express the fusion protein.
  • the Cas protein is the same as the Cas candidate protein included in the three Sniper libraries, respectively.
  • a library was constructed by transfecting the vector used for constructing the library into HeLa cells with reference to Experimental Example 2.1.
  • the library cell line obtained in Experimental Example 2.2 was transfected with a guide RNA targeting the HPRT gene by the method according to Experimental Example 2.1, and then cultured in a 6TG environment to select only cells knocked out by generating an indel in the HPRT gene.
  • the number of surviving cell colonies for each Sniper library was as follows:
  • Genomic DNA was extracted from each cell of the cell colony selected in Experimental Example 2.4, and cloning was performed using the gDNA as a template in the same vector as the Gibson assembly method. Then, the number of Cas protein variants identified in each library was confirmed through full sequencing. As a result, 73 variants of Sniper Cas protein were identified in Sniper library 1 and 28 variants in Sniper library 2.
  • Sniper Cas9 protein variant candidates with high activity were identified through sequencing, except for overlapping mutations, silent mutations, and stop codons in the front of the Sniper Cas protein sequence.
  • the specified candidate group is shown in [Table 6].
  • Target 1 AAGAAGAAGGAGTAACATCC 39
  • Target 2 CTGTGCTCTTTGCTCTCTCA 40
  • Target 3 TTTCATTACAATCGCGTGGC 41
  • Target 4 GTACCACCGGATGGGACTGG 42
  • Target 5 GTACGGGTGGCTCTCAAGCG 43
  • Target 6 TGCTGACCGCGATGCCTACC 44
  • Target 7 ACCGTCTGTGGATAGGAGAG 45
  • Target 8 GCCTCGGGGCTGAGCGTGCG 46
  • Target 9 CTCTGTTGAAAAAGAGAACT 47
  • Target 10 GCTGCCGACTCCGGTGCCGT 48
  • Target 12 GTGCTGCGGTTGTCCCATTG 50
  • Target 13 CAGCCTTGTACAGCGGCCTGC 51
  • Target 14 CGGGAGGAAACCCTACAACC 52
  • Target 15 TCACCCTTTTCCTCTTGGGG 53
  • Target 16 ACAGATGCCCAGCGGGTAGC 54
  • Target 17 TTGTGAAGTAATCTTAGGGT 55
  • the guide RNA used for each target sequence is the same as that in which the target sequence and the guide RNA scaffold sequence of SEQ ID NO: 15 are connected from the 5' end to the 3' end, and are as described in SEQ ID NOs: 65 to 88.
  • the Sniper Cas9 variants showing higher indel efficiency than the Wild-type Sniper Cas9 were the 108, 42, 82, and 85 variants in Table 6, and the indels for them The results of the development experiment are shown in [Table 8] below.
  • Sniper is Wild-type Sniper Cas9
  • the previous number is the same as the label disclosed in Table 7, and #1, #2, and #3 mean the number of experiments.
  • average means the average of each experimental result.
  • a primer was designed with NNN at the mutation site, and a mutation fragment was prepared at the mutation site using PCR.
  • a vector was prepared from the PCR fragment through Gibbson assembly.
  • Each plasmid produced after mini-prep was sequenced to confirm whether a mutation was inserted at the above mutation site.
  • HEK293T was cultured in DMEM (10% FBS, 1% penicillin streptomycin) at 37°C, 5% CO 2 environment.
  • HEK293T cells were transfected with 50 ng of the plasmid capable of expressing the Cas variant candidates prepared above and 1 ul of Lipofectamin2000 in 2 x 10 5 cells.
  • HEK293T was cultured in DMEM (10% FBS, 1% penicillin streptomycin) at 37°C, 5% CO 2 environment.
  • SpCas9 Streptococcus pyogenes-derived Cas9
  • plasmid vectors were prepared with reference to Experimental Example 3.1, and vectors encoding single guide RNAs targeting the target sequence of [Table 7] in HEK293T cells. was transfected together to measure the frequency of indel occurrence (Figs. 12 and 13).
  • the number of mutant spCas9 copies integrated in a stable cell line can be minimized and screening efficiency can be further increased.
  • the following experiment is performed.
  • Experimental Example 1 Experimental Example 3, and Provisional Experimental Example 1, it is confirmed whether candidates can be efficiently selected for the base editor and the prime editor.
  • a strategy of knock-out by replacing the base of the start codon of the HPRT1 gene is used, and in the case of the prime editor, a strategy is used to prevent proper expression by inserting a correction sequence including a stop codon using the front exon of the HPRT1 gene as a sequence to be corrected.
  • cells can be selected by culturing the cells in a 6TG environment.
  • Transfection is performed on HeLa cells 8x10 4 using 250ng sgRNA plasmid (epegRNA plasmid for Prime editor), 250ng Base editor or Prime editor plasmid, and 1ul of lipofectamin2000.
  • PCR is performed on the spCas9 full sequence using the gDNA obtained through screening.
  • the selected products are requested for re-sequencing and mutation analysis is performed on the spCas9 full sequence.
  • Colony sequencing analysis can be replaced with NGS analysis, or the number of sequencing can be reduced based on the results of NGS analysis.
  • Mutants to be used in experiments are obtained through direct cloning or colony sequencing. (Since Cas9 in a low expression environment must be used, the CMV 2NES vector is used as it is.)
  • Cas candidate protein screening method using the testing vector and/or testing set disclosed in the present invention, high-efficiency Cas can be effectively screened from a large number of Cas candidate libraries. Furthermore, compared to the prior art of the present invention, since screening can be performed in an environment close to an actual Cas use environment, Cas candidate proteins that operate with high efficiency in vivo can be screened more successfully.

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Medicinal Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 출원은 Cas 단백질 또는 이의 변이체의 스크리닝 방법, 상기 스크리닝 방법을 활용한 고활성 Cas 단백질 또는 이의 변이체를 제조하는 방법, 및 상기 방법으로 선별된 고효율의 Cas 단백질 또는 이의 변이체에 관한 것이다. 본 발명에서 개시하는 테스팅 벡터 및/또는 테스팅 세트를 사용한, Cas 후보 단백질 스크리닝 방법을 사용하면, 수많은 Cas 후보 라이브러리로부터 고효율의 Cas를 효과적으로 스크리닝 할 수 있다. 나아가, 본 발명의 종래 기술에 비해 실제 Cas 사용 환경에 가까운 환경 하 스크리닝을 수행할 수 있으므로, 생체 내에서 고효율로 작동하는 Cas 후보 단백질을 더 성공적으로 선별할 수 있다.

Description

Cas 단백질 또는 이의 변이체의 스크리닝 방법, 및 이를 이용하여 제조된 Cas 단백질 또는 이의 변이체
본 출원은 Cas 단백질 또는 이의 변이체의 스크리닝 방법에 관한 것이다.
본 출원은 고활성 Cas 단백질 또는 이의 변이체를 제조하는 방법에 관한 것이다.
본 출원은 Cas 단백질 또는 이의 변이체에 관한 것이다.
기존에 개발된 Cas 단백질 (CRISPR associated protein) 또는 이의 변이체들은 E.coli나 Yeast 스크리닝 시스템을 통해 개발되어 왔다. 그러나, 위와 같이, 기존의 스크리닝 시스템을 통해 개발된 Cas 단백질 또는 이의 변이체의 활성은 동물모델 전임상이나 임상을 진행할 때 기대만큼의 유전자 편집 효과가 재현되지 않는 경우가 다수 발생하며, 그 원인 중 하나는 예를 들면 다음과 같다: Cas 단백질을 세포 내 또는 표적 위치(target site)로 전달하는 전달 기술의 효율이 떨어져, 세포 내 또는 표적 위치(target site)에서 실제로 작용하는 Cas 단백질 또는 이의 변이체가 상대적으로 부족하여, 기대되었던 유전자 편집 효과가 재현되지 않을 수 있다.
이러한 문제를 해결하기 위해 사람과 가장 가까운 환경에서 활성을 보이는 또는 활성이 높은 Cas 단백질 또는 이의 변이체들을 스크리닝 할 필요가 있다. 상기 문제는 낮은 농도에서도 높은 활성을 보이는 Cas 단백질 또는 이의 변이체를 제조함으로써 해결할 수 있다.
본 명세서는 Cas 후보 단백질 스크리닝을 위한 테스팅 벡터를 개시하는 것을 목적으로 한다.
본 명세서는 Cas 후보 단백질 스크리닝을 위한 테스팅 세트를 개시하는 것을 목적으로 한다.
본 명세서에서는 상기 테스팅 벡터 및 상기 테스팅 세트의 용도를 개시하는 것을 목적으로 한다.
본 명세서는 Cas 후보 단백질 스크리닝을 위한 방법을 개시하는 것을 목적으로 한다.
본 명세서는 스트렙토코커스 피오게네스 유래 Cas9 단백질의 신규 변이체를 개시하는 것을 목적으로 한다.
본 명세서는 스트렙토코커스 피오게네스 유래 Cas9 단백질의 신규 변이체를 포함하는 CRISPR/Cas 시스템의 다양한 양태를 개시하는 것을 목적으로 한다.
본 명세서는 다음을 포함하는 Cas 후보 단백질 스크리닝을 위한 테스팅 벡터를 개시한다: 저발현 프로모터; 및 NES-Cas 융합 단백질 암호화 핵산, 여기서, 상기 저발현 프로모터 및 상기 NES-Cas 융합 단백질 암호화 핵산은 작동적으로 연결되어 있고, 상기 NES-Cas 융합 단백질은 [구조식 1]로 표현되는 것임:
[구조식 1]
N1-C-N2
여기서, 상기 N1은 제1 NES(nuclear export signal)이거나 부존재하고, 상기 C는 상기 Cas 후보 단백질이고, 상기 N2는 제2 NES(nuclear export signal)이거나 부존재하며, 여기서, 상기 NES-Cas 융합 단백질은 적어도 하나의 NES를 포함함.
일 실시예로, 상기 저발현 프로모터는 UBC 프로모터일 수 있다.
일 실시예로, 상기 UBC 프로모터는 서열번호 16 중 선택된 핵산 서열을 가질 수 있다.
일 실시예로, 상기 제1 NES 및 상기 제2 NES는 각각 독립적으로 서열번호 89 내지 서열번호 104 중 선택된 아미노산 서열을 가질 수 있다.
일 실시예로, 상기 Cas 후보 단백질은 Streptococcus pyogenes 유래 Cas9 단백질 또는 Streptococcus pyogenes 유래 Cas9 단백질의 변이체일 수 있다.
본 명세서는 다음을 포함하는 Cas 후보 단백질 스크리닝을 위한 테스팅 세트를 개시한다: 제1 테스팅 벡터로, 상기 실시예 중 선택된 어느 하나; 및 제2 테스팅 벡터로, 상기 실시예 중 선택된 어느 하나, 여기서, 상기 제1 테스팅 벡터의 상기 Cas 후보 단백질 및 상기 제2 테스팅 벡터의 상기 Cas 후보 단백질은 서로 다른 아미노산 서열을 가짐.
본 명세서는 상기 실시예의 테스팅 벡터를 둘 이상 포함하는, Cas 후보 단백질 스크리닝을 위한 테스팅 세트를 개시한다.
본 명세서는 다음을 포함하는 Cas 후보 단백질 스크리닝 방법을 개시한다: (a) 상기 실시예 중 선택된 어느 하나의 테스팅 세트를 세포에 처리하는 과정; (b) 상기 (a) 과정을 수행한 세포에 가이드 도메인을 포함하는 가이드 RNA 또는 상기 가이드 RNA를 암호화하는 핵산을 처리하는 과정, 여기서, 상기 가이드 RNA는 상기 테스팅 세트에 포함된 테스팅 벡터의 Cas 후보 단백질과 상호작용하여 CRISPR/Cas 복합체를 형성할 수 있고, 상기 가이드 RNA의 가이드 도메인은 상기 세포의 유전자에 포함된 특정 서열을 표적화하는 것임; (c) 상기 (b) 과정을 수행한 세포 중 상기 가이드 도메인이 표적화한 상기 특정 서열이 편집된 세포를 선별하는 과정; (d) 상기 (c) 과정에서 선별된 세포 내 포함된 상기 테스팅 벡터의 상기 Cas 후보 단백질의 아미노산 서열을 특정하는 과정.
일 실시예로, 상기 (c) 과정의 상기 특정 서열이 편집된 세포를 선별하는 것은 상기 (b) 과정을 수행한 세포를 특정 조건에서 배양한 후, 살아남은 세포를 선별하는 것일 수 있다.
일 실시예로, 상기 가이드 RNA의 가이드 도메인이 표적화하는 상기 특정 서열은 HPRT 유전자의 서열이고, 상기 (b) 과정을 수행한 세포를 특정 조건에서 배양하는 것은 6TG를 포함한 배지에서 배양하는 것일 수 있다.
본 명세서는 서열번호 3 내지 서열번호 8 중 선택된 아미노산 서열을 가지는 Streptococcus pyogenes 유래 Cas9 단백질의 변이체를 개시한다.
본 명세서는 다음을 포함하는 CRISPR/Cas9 조성물을 개시한다: 상기 Streptococcus pyogenes 유래 Cas9 단백질의 변이체, 또는 상기 Cas9 단백질의 변이체를 암호화하는 핵산; crRNA 및 tracrRNA를 포함하는 가이드 RNA, 또는 상기 가이드 RNA를 암호화하는 핵산, 여기서, 상기 crRNA는 5'말단에서 3'말단 방향으로 가이드 도메인 및 직접 반복부(direct repeat)가 순차적으로 연결된 것이고, 상기 직접 반복부 및 상기 tracrRNA는 상기 Cas9 단백질의 변이체와 상호작용하여 CRISPR/Cas 복합체를 이룰 수 있는 것이고, 상기 가이드 도메인은 미리 결정된 핵산 서열을 표적화할 수 있는 것임.
일 실시예로, 상기 가이드 RNA는 상기 crRNA 및 상기 tracrRNA가 링커로 연결된 싱글 가이드 RNA일 수 있다.
일 실시예로, 상기 가이드 RNA의 crRNA의 직접 반복부는 서열번호 13의 서열을 가지고, 상기 가이드 RNA의 tracrRNA는 서열번호 14의 서열을 가질 수 있다.
일 실시예로, 상기 CRISPR/Cas9 조성물은 상기 Cas9 단백질의 변이체 및 상기 가이드 RNA를 리보뉴클레오프로틴(ribonucleoprotein) 형태로 포함할 수 있다.
일 실시예로, 상기 CRISPR/Cas9 조성물은 상기 Cas9 단백질의 변이체를 암호화하는 핵산 및 상기 가이드 RNA를 암호화하는 핵산을 벡터 형태로 포함할 수 있다.
본 발명에서 개시하는 테스팅 벡터 및/또는 테스팅 세트를 사용한, Cas 후보 단백질 스크리닝 방법을 사용하면, 수많은 Cas 후보 라이브러리로부터 고효율의 Cas를 효과적으로 스크리닝 할 수 있다. 나아가, 본 발명의 종래 기술에 비해 실제 Cas 사용 환경에 가까운 환경 하 스크리닝을 수행할 수 있으므로, 생체 내에서 고효율로 작동하는 Cas 후보 단백질을 더 성공적으로 선별할 수 있다.
도 1은 본 명세서에서 개시하는 Cas 후보 단백질 스크리닝 방법의 일 구현예를 모식적으로 설명한 것이다.
도 2는 본 명세서에서 개시하는 Cas 후보 단백질 스크리닝 방법의 일 구현예를 모식적으로 설명한 것이다.
도 3은 실험예 1.3에 따라 NLS 또는 NES를 융합한 Cas 단백질의 HPRT 인델 활성을 측정한 결과이다.
도 4은 실험예 1.4에 따라 포유류 세포의 발현 프로모터 별 GFP(Green fluorescent protein)의 발현 수준을 측정한 데이터이다.
도 5는 실험예 1.4에 따라, UBC 프로모터를 사용하였을 때 HEK293T 세포의 EMX1을 표적으로 하는 Cas9의 인델 활성을 측정한 것이다. 여기서, 2NLS+EMX1은 CMV promoter를 사용하고, nuclear localization signal(NLS)을 두 개 달았을 때의 활성, 2NES+EMX1은 CMV promoter를 사용하고, nuclear export signal(NES)을 두 개 달았을 때의 활성, UBC 2NES + EMX1은 UBC 프로모터를 사용하고, nuclear export signal(NES)을 두 개 달았을 때의 활성을 의미한다.
도 6은 실험예 1.5에 따라 UBC 프로모터의 exon 1 및/또는 intron 일부를 제거하여 발현 활성을 떨어트리는 변형에 대해 설명한 모식도이다.
도 7은 실험예 1.5에 따라 UBC 프로모터의 길이를 변경하였을 때 EMX1 인델 도입 활성을 측정한 결과이다. 여기서, WT Cas9은 CMV 프로모터 및 야생형의 SpCas9을 사용한 것, UBC_2NES는 UBC 프로모터 및 2개의 NES를 포함하는 SpCas9 단백질을 사용한 것, UBC_Exon1_2NES는 서열번호 17의 프로모터 및 2개의 NES를 포함하는 SpCas9 단백질을 사용한 것, 및 UBC_mini_2NES는 서열번호 18의 프로모터 및 2개의 NES 단백질을 포함하는 SpCas9을 사용한 것을 의미한다.
도 8은 UBC 프로모터에서 transcription binding site를 제거하여 발현 활성을 떨어트리는 변형에 대해 설명한 모식도이다.
도 9는 실험예 1.5에 따라 UBC 프로모터의 transcription binding site를 제거하였을 때 HPRT 인델 도입 활성을 측정한 결과이다. 여기서, mini UBC는 서열번호 18의 프로모터를 사용한 것, 243 UBC는 서열번호 19의 프로모터를 사용한 것, 및 208 UBC는 서열번호 20의 프로모터를 사용한 결과를 의미한다.
도 10은 실험예 1.6에서 Stable cell line을 대상으로 한 저발현 프로모터 실험에 사용된 UBC 프로모터 및 그 변형 서열을 모식적으로 나타낸 것이다.
도 11은 실험예 1.6에 따라 UBC 프로모터 및 그 변형의 HPRT 인델 도입 활성을 측정한 결과이다. 여기서, UBC full은 UBC 프로모터, UBC mini는 서열번호 18의 프로모터, UBC 243은 서열번호 19의 프로모터를 사용한 결과를 의미한다.
도 12는 실험예 3.2에 따라 Sniper Cas9의 1061번째 위치에 변이를 발생시킨 각 Cas9 후보군들의 24개 표적에 대한 인델 도입 활성을 측정한 것이다. 가로축의 레이블은 각각 서열번호 2의 1061번째 위치가 어떤 아미노산으로 변이되었는 지를 의미한다. 예를 들어, Phe의 경우, 서열번호 2의 아미노산 서열 중 1061번째 아미노산이 페닐알라닌(Phenylalanine)으로 변이되었다는 의미이다.
도 13는 실험예 3.2에 따라 Sniper Cas9의 1074번째 위치에 변이를 발생시킨 각 Cas9 후보군들의 24개 표적에 대한 인델 도입 활성을 측정한 것이다. 가로축의 레이블은 각각 서열번호 2의 1074번째 위치가 어떤 아미노산으로 변이되었는 지를 의미한다. 예를 들어, Phe의 경우, 서열번호 2의 아미노산 서열 중 1074번째 아미노산이 페닐알라닌(Phenylalanine)으로 변이되었다는 의미이다.
도 14은 실험예 3.3에 따라 각각의 Sniper Cas9 변이체 후보군들의 24개 표적에 대한 농도 별 인델 발생 비율을 나타낸 그래프이다. 여기서, WT Sniper는 서열번호 2의 Sniper Cas9, 1061 Asp Sniper Cas9은 Sniper Cas9의 1061번째 아미노산이 아스파르트산(Aspartic acid)로 치환된 것, 1074 Leu Sniper Cas9은 상기 Sniper Cas9의 1074번째 아미노산이 류신(Leucine)으로 치환된 것, 및 1061 1074 double mutation sniper Cas9은 상기 Sniper Cas9의 1061번째 아미노산이 아스파르트산으로, 1074번째 아미노산이 류신으로 치환된 것을 의미한다.
도 15은 실험예 3.3에 따라 각각의 SpCas9 변이체 후보군들의 24개 표적에 대한 농도 별 인델 발생 비율을 나타낸 그래프이다. 여기서, WT Cas9은 서열번호 1의 Cas9, 1061 Asp SpCas9은 WT Cas9의 1061번째 아미노산이 아스파르트산(Aspartic acid)로 치환된 것, 1074 Leu SpCas9은 상기 WT Cas9의 1074번째 아미노산이 류신(Leucine)으로 치환된 것, 및 1061 1074 double mutation SpCas9은 상기 WT Cas9의 1061번째 아미노산이 아스파르트산으로, 1074번째 아미노산이 류신으로 치환된 것을 의미한다.
이하, 첨부된 도면을 참조하여, 발명의 내용을 특정한 구현예와 예시들을 통해 더욱 상세하게 설명한다. 상기 첨부된 도면은 발명의 일부 구현예를 포함하지만, 모든 구현예를 포함하고 있지는 않다는 점에 유의해야 한다. 본 명세서에 의해 개시되는 발명의 내용은 다양하게 구현될 수 있으며, 여기에 설명되는 특정 구현예로 제한되지 않는다. 이러한 구현예들은 본 명세서에 적용되는 법적 요건을 만족시키기 위해 제공되는 것으로 보아야 한다. 본 명세서에 개시된 발명이 속한 기술분야에 있어 통상의 기술자라면, 본 명세서에 개시된 발명의 내용에 대한 많은 변형 및 다른 구현예들을 떠올릴 수 있을 것이다. 따라서, 본 명세서에서 개시된 발명의 내용은 여기에 기재된 특정 구현예로 제한되지 않으며, 이에 대한 변형 및 다른 구현예들도 청구범위 내에 포함되는 것으로 이해되어야 한다.
용어의 정의
Nuclear export signal
본 명세서에서 "NES"라 함은, 핵 수송(nuclear transport) 작용으로 세포 핵 내부의 물질을 핵 외부로 수송할 때, 수송 대상인 단백질에 붙어 일종의 "태그"역할을 하는 일정 길이의 펩타이드, 또는 그 서열을 의미한다. 본 명세서에서 사용되는 "NES"라는 용어는 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절하게 해석될 수 있다.
본 명세서에서 사용되는 "약"이라는 용어는 참조 양, 수준, 값, 수, 빈도, 퍼센트, 치수, 크기, 양, 중량 또는 길이에 대해 30, 25, 20, 15, 10, 9, 8, 7, 6, 5, 4, 3, 2, 1%, 또는 0% 정도로 변하는 양, 수준, 값, 수, 빈도, 퍼센트, 치수, 크기, 양, 중량 또는 길이를 의미한다.
아미노산 서열 표기
달리 서술하지 않는 한, 본 명세서에서 아미노산 서열을 기재할 때는 아미노산 일문자 표기법, 또는 세문자 표기법을 사용하여, N-터미널에서 C-터미널 방향으로 기재한다. 예를 들어, RNVP로 표기하는 경우, N-터미널에서 C-터미널 방향으로 아르기닌(arginine), 아스파라긴(asparagine), 발린(valine), 및 프롤린(proline)이 차례로 연결된 펩타이드를 의미한다. 또 다른 예를 들어, Thr-Leu-Lys로 표기하는 경우, N-터미널에서 C-터미널 방향으로 트레오닌(Threonine), 류신(Leucine), 및 리신(Lysine)이 차례로 연결된 펩타이드를 의미한다. 상기 일문자 표기법으로 나타낼 수 없는 아미노산의 경우, 다른 문자를 사용하여 표기하며, 추가적으로 보충하여 설명한다.
각각의 아미노산 표기 방법은 다음과 같다: 알라닌(Alanine; Ala, A); 아르기닌(Arginine; Arg, R); 아스파라긴(Asparagine; Asn, N); 아스파르트산(Aspartic acid; Asp, D); 시스테인(Cysteine; Cys, C); 글루탐산(Glutamic acid; Glu, E); 글루타민(Glutamine; Gln, Q); 글리신(Glycine; Gly, G); 히스티딘(Histidine; His, H); 이소류신(Isoleucine; Ile, I); 류신(Leucine; Leu, L); 리신(Lysine; Lys K); 메티오닌(Methionine; Met, M); 페닐알라닌(Phenylalanine; Phe, F); 프롤린(Proline; Pro, P); 세린(Serine; Ser, S); 트레오닌(Threonine; Thr, T); 트립토판(Tryptophan; Trp, W); 티로신(Tyrosine; Tyr, Y); 및 발린(Valine; Val, V).
핵산 서열 표기
본 명세서에서 사용되는 A, T, C, G 및 U 기호는 당업계 통상의 기술자가 이해하는 의미로 해석된다. 문맥 및 기술에 따라 DNA 또는 RNA 상에서 염기, 뉴클레오사이드 또는 뉴클레오타이드로 적절히 해석될 수 있다. 예를 들어, 염기를 의미하는 경우는 각각 아데닌(A), 티민(T), 시토신(C), 구아닌(G) 또는 우라실(U) 자체로 해석될 수 있고, 뉴클레오사이드를 의미하는 경우는 각각 아데노신(A), 티미딘(T), 시티딘(C), 구아노신(G) 또는 유리딘(U)으로 해석될 수 있으며, 서열에서 뉴클레오타이드를 의미하는 경우는 상기 각각의 뉴클레오사이드를 포함하는 뉴클레오타이드를 의미하는 것으로 해석되어야 한다.
작동 가능하게 연결된
본 명세서에서 사용되는 "작동 가능하게 연결된"이라는 용어는 유전자 발현 기술에 있어서, 특정 구성이 다른 구성과 연결되어, 상기 특정 구성이 의도된 방식대로 기능할 수 있도록 연결되어 있는 것을 의미한다. 예를 들어, 프로모터 서열이 암호화 서열과 작동적으로 연결되었다고 할 때, 상기 프로모터가 상기 암호화 서열의 세포 내에서의 전사 및/또는 발현에 영향을 미칠 수 있도록 연결된 것을 의미한다. 또한, 상기 용어는 당업계 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절히 해석될 수 있다.
표적 유전자 또는 표적 핵산
본 명세서에서 사용되는 "표적 유전자" 또는 "표적 핵산"은 기본적으로, 유전자 편집의 대상이 되는 세포 내 유전자, 또는 핵산을 의미한다. 상기 표적 유전자 또는 표적 핵산은 혼용될 수 있으며, 서로 동일한 대상을 지칭할 수 있다. 상기 표적 유전자 또는 표적 핵산은 달리 기재되지 않은 한, 대상 세포가 가진 고유한 유전자 또는 핵산, 혹은 외부 유래의 유전자 또는 핵산 모두를 의미할 수 있으며, 유전자 편집의 대상이 될 수 있다면 특별히 제한되지 않는다. 상기 표적 유전자 또는 표적 핵산은 단일가닥 DNA, 이중가닥 DNA, 및/또는 RNA일 수 있다. 또한, 상기 용어는 당업계 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절히 해석될 수 있다.
표적 서열
본 명세서에서 사용되는 "표적 서열"은 CRISPR/Cas 복합체가 표적 유전자 또는 표적 핵산을 절단하기 위해 인식하는 특정 서열을 의미한다. 상기 표적 서열은 그 목적에 따라 적절히 선택될 수 있다. 구체적으로, "표적 서열"은 표적 유전자 또는 표적 핵산 서열 내에 포함된 서열이며, 본 명세서에서 제공하는 가이드 RNA, 또는 엔지니어링 된 가이드 RNA에 포함된 스페이서 서열과 상보성을 가지는 서열을 의미한다. 일반적으로, 상기 스페이서 서열은 표적 유전자 또는 표적 핵산의 서열 및 CRISPR/Cas 시스템의 이펙터 단백질이 인식하는 PAM 서열을 고려하여 결정된다. 상기 표적 서열은 CRISPR/Cas 복합체의 가이드 RNA와 상보적으로 결합하는 특정 가닥만을 지칭할 수 있으며, 상기 특정 가닥 부분을 포함하는 표적 이중 가닥 전체를 지칭할 수도 있으며, 이는 문맥에 따라 적절히 해석된다. 또한, 상기 용어는 당업계 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절히 해석될 수 있다.
벡터
본 명세서에서 사용되는 "벡터"는 달리 특정되지 않는 한, 유전 물질을 세포 내로 운반할 수 있는 모든 물질을 통틀어 일컫는다. 예를 들어, 벡터는 대상이 되는 유전 물질, 예를 들어 CRISPR/Cas 시스템의 이펙터 단백질을 암호화하는 핵산, 및/또는 가이드 RNA를 암호화하는 핵산을 포함하는 DNA 분자일 수 있으나, 이에 제한되는 것은 아니다. 상기 용어는 당업계 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절히 해석될 수 있다.
CRISPR/Cas 시스템
CRISPR/Cas 시스템 개괄
CRISPR/Cas 시스템은 원핵생물 유기체에서 발견되는 면역 시스템의 일종이며, Cas 단백질, 및 가이드 RNA를 포함한다. Cas 단백질, 또는 가이드 RNA의 자세한 구성에 대해서는 공개문헌인 WO2018/231018(국제공개번호)에 자세히 설명되어 있다. 본 명세서에서 사용되는 "Cas 단백질" 이라는 용어는 CRISPR/Cas 시스템에서 이용되는 것으로 해석될 수 있는 뉴클레이즈(nuclease)를 총칭하는 용어이다. 이하에서는 가장 일반적으로 쓰이는 CRISPR/Cas9 시스템의 DNA 절단 과정을 간략히 설명한다.
Cas9 단백질
CRISPR/Cas9 복합체에서, 핵산을 절단하는 뉴클레이즈(nuclase) 활성을 가지는 단백질을 Cas9 단백질이라 한다. 상기 Cas9 단백질은 CRISPR/Cas 시스템 분류 상 Class 2, Type II에 해당하며, 스트렙토코커스 피오게네스(Streptococcus pyogenes), 스트렙토코커스 써모필러스(Streptococcus thermophilus), 스트렙토코커스 속 (Streptococcus sp.), 스트렙토마이세스 프리스티네스피랄리스(Streptomyces pristinaespiralis), 스트렙토마이세스 비리도크로모게네스(Streptomyces viridochromogenes), 스트렙토마이세스 비리도크로모게네스(Streptomyces viridochromogenes), 스트렙토스포랑기움 로세움(Streptosporangium roseum), 스트렙토스포랑기움 로세움(Streptosporangium roseum) 유래 Cas9 단백질 등이 있다.
가이드 RNA
CRISPR/Cas9 복합체에서, 표적 핵산에 포함된 특정 서열을 인식하도록 CRISPR/Cas9 복합체를 유도하는 기능을 가지는 RNA를 가이드 RNA라 한다. 상기 가이드 RNA의 구성을 기능적으로 나눈다면 크게, 1) 스캐폴드 서열 부분, 및 2) 가이드 서열 부분으로 나눌 수 있다. 상기 스캐폴드 서열 부분은 Cas9 단백질과 상호작용하는 부분으로, Cas9 단백질과 결합하여 복합체를 이룰 수 있도록 하는 부분이다. 일반적으로, 상기 스캐폴드 서열 부분은 tracrRNA, crRNA 반복 서열 부분을 포함하며, 상기 스캐폴드 서열은 어떤 Cas9 단백질을 사용하느냐에 따라서 결정된다. 상기 가이드 서열 부분은, 표적 핵산 내 일정 길이의 뉴클레오타이드 서열 부분과 상보적으로 결합할 수 있는 부분이다. 상기 가이드 서열 부분은 인위적으로 변형할 수 있는 염기 부분으로, 관심 있는 표적 뉴클레오타이드 서열에 의해 결정된다.
CRISPR/Cas9 복합체가 표적 핵산을 절단하는 과정
CRISPR/Cas9 복합체가 표적 핵산에 접촉하여 Cas9 단백질이 일정 길이의 뉴클레오타이드 서열을 인식하고, 가이드 RNA의 일부(상기 가이드 서열 부분)가 상기 PAM 서열과 인접한 부분과 상보적으로 결합하는 경우, CRISPR/Cas9 복합체에 의해 상기 표적 핵산이 절단된다. 이때, Cas9 단백질이 인식하는 일정 길이의 뉴클레오타이드 서열은 프로토스페이서 인접 모티프(protospacer-adjacent motif, PAM) 서열이라 하며, 이는 Cas9 단백질의 종류나 기원에 따라 결정되는 서열이다. 예를 들어, 스트렙토코커스 피오게네스(Streptococcus pyogenes) 유래 Cas9 단백질은 표적 핵산 내 5'-NGG-3' 서열을 인식할 수 있다. 이때, 상기 N은 상기 N은 아데노신(A), 티미딘(T), 사이티딘(C), 구아노신(G)중 하나이다. CRISPR/Cas9 복합체가 표적 핵산을 절단하기 위해서는 가이드 RNA의 가이드 서열 부분이 PAM 서열에 인접한 서열 부분과 상보적으로 결합해야 하므로, 상기 가이드 서열 부분은 표적 핵산의 서열, 구체적으로는 PAM 서열과 인접한 서열 부분에 맞추어 결정된다. CRISPR/Cas9 복합체가 상기 표적 핵산을 절단할 때, 표적 핵산의 PAM 서열 부분 및/또는 상기 가이드 서열과 상보적으로 결합하는 서열 부분 내 임의의 위치가 절단되게 된다.
표적 가닥, 비표적 가닥
CRISPR/Cas9 복합체는 이중가닥 DNA에 대한 절단 활성을 가진다. 상기 이중가닥 DNA에서, 상기 가이드 서열 부분과 결합하는 프로토스페이서(protospacer)가 있는 가닥을 표적 가닥(Target strand, TS)이라 한다. 상기 표적 가닥과는 상보적인 가닥으로, 상기 가이드 서열 부분과 결합하지 않는 프로토스페이서(protospacer)가 있는 가닥을 비표적 가닥(Non-target strand, NTS)라 한다. 상기 가이드 서열 부분은 이중가닥 DNA의 표적 가닥(TS)에 포함된 프로토스페이서 서열 부분과 상보적으로 결합할 수 있다. 상기 가이드 서열 및 이중가닥 DNA의 비표적 가닥(NTS)에 포함된 프로토스페이서 서열은 동등한(equivalent) 서열이다. 구체적으로, 가이드 서열은 RNA 서열이고, 비표적 가닥(NTS)에 포함된 프로토스페이서 서열은 이에 대응되는 DNA 서열이라는 차이가 있을 뿐이다.
종래 기술의 한계점
더 높은 효율의 신규 Cas 단백질 또는 Cas 단백질의 변이체를 개발하기 위해서는 그러한 고효율의 Cas 단백질을 스크리닝할 수 있는 기술이 필수적이다. 시간 및 비용의 문제로 모든 Cas 단백질 후보에 대해 생체 내(in vivo) 활성을 측정할 수는 없으므로, 고효율의 Cas를 스크리닝하는 방법은 생체 외(in vitro)의 셀 라인 환경 하 수행되는 것이 일반적이다. 하지만, 상기 셀 라인 환경 하 스크리닝되어 선별된 Cas 단백질을 동물모델, 전임상, 또는 임상 실험 등 생체 내(in vivo) 환경에서 사용할 때, 충분한 활성을 보이지 못하는 경우가 많다. 이는, 종래 기술의 Cas 후보 단백질 스크리닝 방법이 Cas 단백질이 실제 작동해야 하는 생체 내 환경을 충분히 모사하지 못하기 때문에 발생하는 문제이다. 달리 말해, 종래의 Cas 후보 단백질 스크리닝 방법 하 높은 활성을 나타내는 Cas 단백질의 경우라도, 실제 사용되는 생체 내 환경에서는 낮은 활성을 보일 수 있다는 의미이다. 이런 차이점이 발생하는 원인 중 하나로, CRISPR/Cas 시스템을 실제 생체 내에 투여하여 사용할 때 상기 CRISPR/Cas 시스템을 목적 위치나 세포에 전달하는 기술의 효율이 낮아 실제 목적 세포의 활성부위 내에 도달하는 CRISPR/Cas 시스템의 숫자가 적은 것을 들 수 있다.
따라서, 실제 생체 내 사용 환경과 최대한 유사한 환경에서 Cas 후보 단백질을 스크리닝하는 기술이 요구되고 있지만, 이를 해결한 종래 기술을 찾아보기 힘든 실정이다.
Cas 후보 단백질 스크리닝을 위한 테스팅 벡터
Cas 후보 단백질 스크리닝을 위한 테스팅 벡터 개괄
본 명세서에서는 Cas 후보 단백질 스크리닝을 위한 테스팅 벡터를 개시한다. 상기 테스팅 벡터는 "Cas 후보 단백질"을 발현할 수 있는 핵산을 포함하며, 저효율 전달환경-유도 요소(low-efficiency delivery environment-inducing element)를 포함한다. 상기 "Cas 후보 단백질"은 Cas 단백질 뿐 아니라, 상기 Cas 단백질에 추가적인 도메인이 융합된 융합 단백질, 예를 들어, 베이스 에디터 또는 프라임 에디터도 포괄하여 지칭한다. 상기 테스팅 벡터는 통상적인 발현벡터와는 달리 미리 의도된 대로 적은 양의 Cas 단백질만을 발현시키고/발현시키거나, 적은 양의 Cas 단백질만을 활성부위에 도달하도록 한다. 이때 Cas 단백질 또는 이의 변이체의 활성부위는 Cas 단백질 또는 이의 변이체가 가이드 RNA와 함께 작용하여 활성을 나타내는 부위를 의미한다. 상기 저효율 전달환경-유도 요소로 인해, 상기 테스팅 벡터는 세포 내에서 실제 Cas 단백질을 사용할 때와 같이 활성부위에 전달하는 기술의 효율이 낮아 Cas 단백질이 충분한 양으로 전달되지 못하는 환경을 모사한다. 상기 저효율 전달환경-유도 요소는, 발현 억제-유도 요소 및 활성부위 접근 방해-유도 요소를 포함할 수 있다.
상기 테스팅 벡터는 세포 내 형질도입 시 발현량이 낮으며, 발현된 Cas 단백질이 활성부위(예를 들어, 세포핵)에 성공적으로 도달하는 비율도 낮다. 따라서, 상기 테스팅 벡터를 유전자 편집에 사용할 경우 실제 생체 내에서 CRISPR/Cas 시스템을 활용할 때의 환경과 유사한 환경 하에서 유전자 편집이 수행된다. 상기 테스팅 벡터를 Cas 후보 단백질 스크리닝에 사용하는 경우, 종래 기술의 한계점을 극복하고, 실제 생체내 실험 결과와 유사한 활성을 보이는 Cas 단백질을 선별할 수 있다.
일 구현예로, Cas 후보 단백질 스크리닝을 위한 테스팅 벡터는 발현 억제-유도 요소 및 활성부위 접근 방해-유도 요소가 융합된 Cas 단백질을 암호화하는 핵산을 포함할 수 있다.
스크리닝 대상 1 - Cas 단백질
상기 테스팅 벡터에 포함되는 Cas 후보 단백질을 암호화하는 핵산의 발현 대상은 Cas 단백질일 수 있다. 상기 Cas 단백질은 특정 Cas 단백질의 변이체일 수 있다. 상기 Cas 단백질은 뉴클레이즈(nuclase) 활성을 가지거나, 니케이즈(nickase) 활성을 가지거나, 핵산 절단 기능이 불활성화(inactivated) 된 Cas 단백질일 수 있다.
스크리닝 대상 2 - 베이스 에디터
상기 테스팅 벡터에 포함되는 Cas 후보 단백질을 암호화하는 핵산의 발현 대상은 Cas 단백질 또는 그 변이체를 포함하는 베이스 에디터일 수 있다. 구체적으로, 상기 베이스 에디터는 Cas 단백질 또는 그 변이체 및 염기교정 도메인이 융합된 융합 단백질이다. 여기서, 상기 염기교정 도메인은 아데노신 탈아미노화효소 또는 시티딘 탈아미노화효소일 수 있으나, 이에 제한되는 것은 아니다. 상기 베이스 에디터는 상기 Cas 단백질 또는 그 변이체가 인식한 표적서열에 인접한 특정 범위의 염기를 다른 것으로 치환하는 기능을 한다. 여기서, 상기 Cas 단백질의 변이체는 효율적으로 염기를 교정할 수 있도록 그 기능이 적절히 변경된 것일 수 있다.
일 구현예로, 상기 베이스 에디터는 핵산 절단 기능이 불활성화 된 Cas 단백질 및 염기교정 도메인이 융합된 융합 단백질일 수 있다.
스크리닝 대상 3 - 프라임 에디터
상기 테스팅 벡터에 포함되는 Cas 후보 단백질을 암호화하는 핵산의 발현 대상은 Cas 단백질 또는 그 변이체를 포함하는 프라임 에디터일 수 있다. 구체적으로, 상기 프라임 에디터는 Cas 단백질 또는 그 변이체 및 역전사 효소가 융합된 융합 단백질이다. 상기 프라임 에디터는 상기 프라임 에디터에 대한 pegRNA와 함께 작동하여 미리 결정된 교정대상 서열을 미리 설계된 교정서열로 교정하는 기능을 한다. 여기서, 상기 교정대상 서열은 대상의 유전자에 포함된 서열이고, 상기 교정서열은 교정대상 서열을 대체하여 유전자에 삽입하고자 하는 서열이다. 여기서, 상기 Cas 단백질의 변이체는 효율적으로 서열을 교정할 수 있도록 그 기능이 적절히 변경된 것일 수 있다.
일 구현예로, 상기 프라임 에디터는 니케이즈(nickase) 활성을 가지는 Cas 단백질 및 역전사 효소가 융합된 융합 단백질일 수 있다.
저효율 전달환경-유도 요소(low-efficiency delivery environment-inducing element)
상기 테스팅 벡터에 포함된 '저효율 전달환경-유도 요소(low-efficiency delivery environment-inducing element)'는 Cas 단백질 그 자체의 활성에는 영향을 주지 않지만, 발현량 및/또는 활성부위 전달에 영향을 미쳐 결과적으로 Cas 단백질 또는 이의 변이체의 활성을 억제하는 요소를 의미한다. 예를 들어, 세포에서 Cas 단백질 또는 이의 변이체의 발현이 억제되어, 보다 적은 Cas 단백질 또는 이의 변이체가 생성되어 Cas 단백질 또는 이의 변이체의 활성이 보다 억제된 경우, Cas 단백질 또는 이의 변이체의 발현의 억제를 유도하는 요소는 저효율 전달환경-유도 요소로 지칭될 수 있다. 다른 예로, 세포에서 Cas 단백질 또는 이의 변이체가 활성 부위로의 접근이 방해되어 결과적으로 Cas 단백질 또는 이의 변이체의 활성이 보다 억제된 경우, Cas 단백질 또는 이의 변이체의 활성 부위로의 접근의 방해를 유도하는 요소는 저효율 전달환경-유도 요소로 지칭될 수 있다. 즉, 예를 들어, 저효율 전달환경-유도 요소는 활성부위 접근 방해-유도 요소 및 발현 억제-유도 요소를 포함하는 개념으로 사용될 수 있다. 또한, 결과적으로 Cas 단백질 또는 이의 변이체의 활성을 억제하는 결과를 가져오는 요소는 모두 저효율 전달환경-유도 요소로 지칭될 수 있다. 이하 대표적인 저효율 전달환경-유도 요소인 발현 억제-유도 요소 및 활성부위 접근 방해-유도 요소를 설명한다.
발현 억제-유도 요소(element inducing inhibition of expression)
상기 '발현 억제-유도 요소 (element inducing inhibition of expression)'는 Cas 단백질 또는 이의 변이체의 발현을 억제하는 요소를 의미한다. 여기서, Cas 단백질 또는 이의 변이체의 발현이 억제됨은, Cas 단백질이 발현이 되나 발현의 정도가 하향 조절(down regulation)되는 것을 의미한다. 예를 들어, 발현 억제-유도 요소 및 Cas 단백질 또는 이의 변이체를 암호화하는 서열을 포함하는 벡터가 세포 내로 삽입되는 경우, Cas 단백질 또는 이의 변이체는 상기 벡터로부터 발현될 수 있으나 발현의 정도가 보다 억제된다. 발현 억제-유도 요소는 예를 들어, 저발현 프로모터를 포함할 수 있고, 이때 상기 저발현 프로모터는, 예를 들어, 변형된 프로모터일 수 있다. 상기 변형된 프로모터는 당업계에 잘 알려진 프로모터에서 일부 서열을 제거하거나 일부 서열을 추가하여 만들어진 프로모터 기능을 갖는 서열을 포함할 수 있다.
활성부위 접근 방해-유도 요소
상기 '활성부위 접근 방해-유도 요소(element inducing interruption of access to active site)'는 Cas 단백질 또는 이의 변이체의 활성부위로의 접근의 방해를 유도하는 요소를 의미한다. 이때 Cas 단백질 또는 이의 변이체의 활성부위는 Cas 단백질 또는 이의 변이체가 가이드 RNA와 함께 작용하여 활성을 나타내는 부위를 의미한다. 활성 부위는 예를 들어, 세포 내, 세포의 핵 내, 또는 상기 가이드 RNA에 의해 결정되는 유전자가 편집되는 위치일 수 있다. 활성부위 접근 방해-유도 요소는, 예를 들어, NES(nuclear export signal) 또는 이를 암호화하는 서열일 수 있다.
활성부위 접근 방해-유도 요소가 융합된 Cas 단백질
상기 활성부위 접근 방해-유도 요소는, 상기 테스팅 벡터에 포함된 Cas 단백질과 별개로 발현될 수도 있지만, 상기 Cas 단백질과 융합된 융합 단백질로 발현될 수도 있다. 예를 들어, 상기 활성부위 접근 방해-유도 요소가 NES인 경우, 상기 테스팅 벡터는 상기 Cas 단백질의 N말단 및/또는 C말단에 상기 NES가 융합된 융합 단백질을 발현하는 것일 수 있다. 상기 활성부위 접근 방해-유도 요소가 상기 Cas 단백질과 융합된 것을 활성부위 접근 방해-유도 요소가 융합된 Cas 단백질이라 지칭한다. 상기 활성부위 접근 방해-유도 요소가 상기 Cas 단백질과 융합된 상태로 발현되는 경우에도, 상기 Cas 단백질 자체의 활성에는 영향이 없으며, 단지 상기 Cas 단백질이 활성부위에 접근하는 것을 방해할 뿐이다. 여기서, 상기 활성부위 접근 방해-유도 요소가 NES인 경우, 상기 활성부위 접근 방해-유도 요소가 융합된 Cas 단백질은 NES-Cas 융합 단백질이라 지칭될 수 있다. 전술한 바 상기 활성부위 접근 방해-유도 요소는 Cas 단백질이 활성을 나타내는 부위에 접근하는 것을 방해하는 바, 상기 활성부위 접근 방해-유도 요소가 융합된 Cas 단백질은 세포 내에서 발현 시 활성부위에 도달하는 비율이 일반적인 Cas 단백질에 비해 낮다. 본 명세서에서 "상기 테스팅 벡터가 Cas 후보 단백질을 발현한다" 또는 이와 유사하게 표현하는 경우, 실제 Cas 후보 단백질만을 발현하는 경우 뿐 아니라, 상기 활성부위 접근 방해-유도 요소가 융합된 Cas 단백질을 발현하는 것까지 포괄하여 지칭하는 것으로 이해되어야 한다.
일 구현예로, 상기 테스팅 벡터는 NES-Cas 융합 단백질을 암호화하는 핵산을 포함할 수 있다.
추가 구성요소 1 - 가이드 RNA
경우에 따라, 상기 테스팅 벡터는 Cas 후보 단백질만을 발현하는 것이 아니라 상기 Cas 후보 단백질에 대한 가이드 RNA도 함께 발현하는 것일 수 있다. 달리 표현하면, 상기 테스팅 벡터는 CRISPR/Cas 시스템의 각 구성요소를 발현하는 것일 수 있다. 이때, 상기 가이드 RNA는 상기 Cas 후보 단백질과 상호작용하여 CRISPR/Cas 복합체를 형성하는 스캐폴드 및 미리 결정된 표적서열을 표적화할 수 있는 가이드 도메인을 포함한다. 예를 들어, 상기 가이드 RNA는 직접 반복부(direct repeat) 및 가이드 도메인을 포함하는 crRNA 및 tracrRNA를 포함할 수 있고, 상기 직접 반복부 및 tracrRNA를 통틀어 스캐폴드로 지칭할 수 있다. 또 다른 예를 들어, 상기 가이드 RNA는 직접 반복부(direct repeat) 및 가이드 도메인을 포함하는 crRNA를 포함하며, 상기 직접 반복부를 스캐폴드로 지칭할 수 있다.
일 구현예로, 상기 테스팅 벡터는 가이드 RNA를 암호화하는 핵산을 포함한다. 여기서, 상기 가이드 RNA는 Cas 후보 단백질과 상호작용하여 CRISPR/Cas 복합체를 형성할 수 있으며, 미리 결정된 표적서열을 표적화할 수 있다.
추가 구성요소 2 - pegRNA
상기 Cas 후보 단백질이 상기 프라임 에디터인 경우, 상기 테스팅 벡터는 상기 프라임 에디터 뿐 아니라, pegRNA도 함께 발현하는 것일 수 있다. 이때, 상기 pegRNA는 5'말단에서 3'말단 방향으로, 가이드 RNA, RT-template, 및 Primer binding site가 순차적으로 연결된 것일 수 있다. 여기서, 상기 가이드 RNA는 위 《추가 구성요소 1 - 가이드 RNA》 단락에서 설명된 것과 같으며, 상기 가이드 RNA는 상기 프라임 에디터와 상호작용하여 복합체를 형성할 수 있다. 상기 RT-template는 미리 결정된 교정대상 서열을 교정서열로 교정할 때 주형이 되는 서열을 가진다. 상기 Primer binding site는 상기 RT-template이 올바른 위치에서 주형으로 작용할 수 있도록 상기 교정대상 서열 또는 그 인근의 서열과 상보적으로 결합하여 상기 RT-template이 올바른 곳에 위치하도록 한다.
테스팅 벡터의 효과
상기 테스팅 벡터는 저효율 전달환경-유도 요소를 포함하므로, 세포 내 성공적으로 형질도입(transfection)이 되더라도 미리 의도된 대로 Cas 활성이 낮을 수 밖에 없는 환경이 조성된다. 구체적으로, 1) 발현 억제-유도 요소에 의해 발현량 자체가 낮아지며, 2) 발현된 Cas 단백질은 활성부위 접근 방해-유도 요소에 의해 활성부위 접근성이 떨어지므로, 적은 수의 Cas 단백질만이 활성부위에 도달하게 된다.
테스팅 벡터의 장점
본 명세서에서 개시하는 테스팅 벡터를 Cas 후보 단백질 스크리닝에 사용하는 경우, 상기 저효율 전달환경-유도 요소의 작용으로 인해 다른 스크리닝 환경 조작 없이도 실제 CRISPR/Cas 시스템 사용 환경과 유사한 저효율 전달환경이 손쉽게 달성된다. 따라서, 실제 생체 내 세포의 유전자 편집 등에 활용하였을 때 높은 활성을 보이는 Cas 단백질을 저비용 고효율로 손쉽게 스크리닝할 수 있다는 장점이 있다.
테스팅 벡터의 용도
본 명세서에서 개시하는 상기 테스팅 벡터는 다양한 Cas 후보 단백질 스크리닝을 위한 라이브러리 구성에 사용될 수 있다. 상기 테스팅 벡터의 구성에 상기 Cas 후보 단백질을 암호화하는 핵산의 구성만을 다양하게 바꾸어 라이브러리를 구성하는 경우, 이를 바로 Cell line에 적용하여 본 발명의 스크리닝 방법을 활용한 Cas 후보 단백질 스크리닝을 진행할 수 있다.
일 구현예로, 상기 테스팅 벡터는 동일한 Cas 단백질 유래의 Cas 변이체, 예를 들어 스트렙토코커스 피오게네스 유래 Cas9 변이체 스크리닝을 위한 라이브러리 구성에 활용될 수 있다. 또 다른 구현예로, 상기 테스팅 벡터는 특정 기능의 Cas 단백질, 예를 들어 인식하는 PAM 서열이 변경된 Cas9 단백질 변이체 스크리닝을 위한 라이브러리 구성에 활용될 수 있다.
Cas 후보 단백질 스크리닝을 위한 테스팅 세트
테스팅 세트 개괄
본 발명에서는 Cas 후보 단백질 스크리닝을 위한 테스팅 세트를 개시한다. 상기 테스팅 세트는 스크리닝을 수행할 세포에 직접 처리하여 사용할 수 있는 것이다. 상기 테스팅 세트는 복수의 상기 테스팅 벡터를 포함하며, 기타 추가 구성요소를 포함할 수 있다. 여기서, 상기 복수의 테스팅 벡터는 Cas 후보 단백질 스크리닝을 위한 라이브러리에 포함된 각각의 Cas 후보 단백질을 포함할 수 있다.
복수의 테스팅 벡터 포함
상기 테스팅 세트는 복수의 테스팅 벡터를 포함한다. 상기 테스팅 세트는 서로 다른 아미노산 서열의 Cas 후보 단백질을 발현할 수 있는 두 개 이상의 테스팅 벡터를 포함한다.
추가 구성요소 1 - 가이드 RNA 또는 가이드 RNA를 암호화하는 핵산
일 구현예로, 상기 테스팅 세트는 추가적으로 가이드 RNA 또는 상기 가이드 RNA를 암호화하는 핵산을 추가적으로 더 포함할 수 있다. 여기서, 상기 가이드 RNA는 상기 테스팅 세트에 포함된 테스팅 벡터 중 적어도 하나가 발현할 수 있는 Cas 후보 단백질과 상호작용하여 복합체를 이룰 수 있는 것이며, 미리 결정된 표적서열을 표적화할 수 있는 것이다.
또 다론 구현예로, 상기 테스팅 세트는 핵산 서열이 서로 상이한 2종류 이상의 가이드 RNA를 추가적으로 포함할 수 있다. 여기서, 각각의 가이드 RNA는 상기 테스팅 세트에 포함된 테스팅 벡터 중 적어도 하나가 발현할 수 있는 Cas 후보 단백질과 상호작용하여 복합체를 이룰 수 있는 것이며, 미리 결정된 표적서열을 표적화할 수 있는 것이다.
일 구현예로, 상기 테스팅 세트에 포함된 테스팅 벡터가 Cas 후보 단백질로써 프라임 에디터를 포함하는 경우, 상기 테스팅 세트는 pegRNA 또는 상기 pegRNA를 암호화하는 핵산을 포함할 수 있다. 상기 pegRNA는 《적어도 하나의 가이드 RNA를 암호화하는 핵산 2 - 스크리닝 대상이 프라임 에디터인 경우》 단락에 설명된 것과 같다.
추가 구성요소 2 - 더미 벡터
상기 더미 벡터는 상기 테스팅 벡터와 동일/유사한 구조 및 길이를 가지는 벡터이나, Cas 후보 단백질을 발현할 수 없으며, 바람직하게는 세포에 다른 영향을 미치지 않는 벡터이다. 상기 더미 벡터는 스크리닝 방법 수행 시, 테스팅 벡터와 경쟁적으로 세포에 형질감염될 수 있다. 상기 더미 벡터는 상기 테스팅 벡터와는 달리 아무런 기능을 하지 않지만, 스크리닝 방법 수행 시 하나의 세포에 형질감염되는 테스팅 벡터의 수를 줄여주는 역할을 한다. 그 결과, 더 효율적으로 유전자가 편집된 세포를 선별할 수 있게 하여 상기 스크리닝 방법의 효율을 높이는 역할을 한다.
추가 구성요소 2 - 선별요소(selection element)
상기 테스팅 세트는 추가적으로 선별요소를 더 포함할 수 있다. 상기 선별요소는 상기 테스팅 세트를 스크리닝 방법에 사용 시, CRISPR/Cas 시스템이 작동하여 유전자 편집이 일어난 세포를 선별할 수 있도록 하는 요소를 의미하며, 통상의 기술자가 공지 기술을 참고하여 적절히 포함시킬 수 있는 것이다.
일 구현예로, 상기 선별요소는 독성 유전자, 형광 단백질 발현 유전자, 및/또는 항생제 내성 유전자를 포함하는 벡터일 수 있다.
Cas 후보 단백질 스크리닝 방법 1 - 후보군 선별
후보군 선별 방법 개괄
본 명세서에서는 Cas 후보 단백질 스크리닝 방법 중, Cas 단백질 후보군을 선별하는 방법(이하, Cas 단백질 후보군 스크리닝 방법)을 개시한다. 상기 Cas 단백질 후보군 스크리닝 방법은 스크리닝하고자 하는 Cas 후보 단백질의 종류가 매우 많아 각각의 Cas 후보 단백질의 활성을 평가하여 일일히 비교하는 것이 비효율적일 때, 고활성의 Cas 단백질 후보군을 빠르게 줄여주어 효율적인 스크리닝을 가능하게 하는 방법이다. 상기 Cas 단백질 후보군 스크리닝 방법은 대량의 Cas 후보 단백질 라이브러리 중 일부를 선별하고자 할 때 효율적으로 사용할 수 있다. 상기 Cas 후보 단백질 라이브러리는, 예를 들어 특정 Cas 단백질의 아미노산 서열 중 임의의 위치에 무작위적인 변이를 도입한 Cas 아미노산 서열 목록일 수 있다.
상기 Cas 단백질 후보군 스크리닝 방법은
(a) 복수의 세포에 복수의 테스팅 벡터, 적어도 하나의 가이드 RNA를 암호화하는 핵산, 및 선택적으로 더미 벡터를 무작위로 도입하는 과정;
(b) 상기 도입된 세포 중 미리 의도된 유전자가 편집된 세포를 선별하는 과정; 및
(c) 상기 선별된 세포 내 포함된 Cas 후보 단백질의 아미노산 서열을 특정하는 과정을 포함한다.
이하, 각 과정에 대해 자세히 설명한다.
복수의 세포
상기 복수의 세포는 둘 이상의 개별 세포를 의미한다. 상기 후보군 선별 방법은 복수의 Cas 후보 단백질 중 고활성의 Cas 단백질 후보군을 선별하는 방법이므로, 복수의 세포에 복수의 CRISPR/Cas 시스템을 도입하여 활성을 판단해야 한다. 일 구현예로, 상기 복수의 세포는 동일 종의 세포일 수 있다. 일 예로, 상기 복수의 세포는 진핵세포일 수 있다. 구체적으로, 상기 복수의 세포는 MRC5, HT1080, HEK293T, 129TF, MEF, C2C12, MSC, 및 CMMT 세포 중 선택된 어느 하나일 수 있다.
복수의 테스팅 벡터
상기 테스팅 벡터는 《Cas 후보 단백질 스크리닝을 위한 테스팅 벡터》 단락에서 설명된 것과 같다. 상기 복수의 테스팅 벡터는 상기 Cas 단백질 후보군 스크리닝 방법에 사용하는 테스팅 벡터의 개수가 복수라는 의미 뿐 아니라, 둘 이상의 상기 테스팅 벡터가 각각 서로 다른 아미노산 서열을 가지는 Cas 후보 단백질을 암호화하는 핵산을 포함한다는 의미도 포함한다. 상기 복수의 테스팅 벡터는 달리 표현하면 Cas 후보 라이브러리 내 포함된 각각의 Cas 후보 단백질 서열에 대해, 《Cas 후보 단백질 스크리닝을 위한 테스팅 벡터》에서 설명된 테스팅 벡터를 구성한 것을 의미한다.
더미 벡터
상기 더미 벡터는 상기 테스팅 벡터와 경쟁적으로 세포 내에 형질감염되는 것으로, 테스팅 벡터와는 달리 세포 내에서 아무런 기능을 하지 않는다. 상기 더미 벡터는 결과적으로 상기 테스팅 벡터가 상기 세포 내에 형질감염되는 수(i.e. copy number)를 줄여 더 효율적으로 유전자가 편집된 세포를 선별할 수 있도록 한다. 상기 더미 벡터는 상기 《추가 구성요소 2 - 더미 벡터》 단락에서 설명된 바와 같다.
적어도 하나의 가이드 RNA를 암호화하는 핵산 1 - 스크리닝 대상이 Cas 단백질 또는 베이스 에디터인 경우
상기 적어도 하나의 가이드 RNA는 상기 복수의 테스팅 벡터에 포함된 적어도 Cas 후보 단백질과 상호작용하여 CRISPR/Cas 복합체를 이루는 것이다. 상기 가이드 RNA는 상기 세포 내 도입된 테스팅 벡터로부터 Cas 후보 단백질이 발현되고, 상기 가이드 RNA와 복합체를 이루어 상기 세포의 유전자 편집이 일어날 수 있도록 하는 구성이다. 본 명세서에서 개시하는 상기 Cas 단백질 후보군 스크리닝 방법은 여러 종류의 서로 다른 Cas 단백질을 사용하는 것이므로, 상황에 따라 도입해야 하는 가이드 RNA도 한 종류, 또는 두 종류 이상일 수 있다. 예를 들어, 상기 Cas 단백질 후보군 스크리닝 방법에 사용하는 1) 각각의 Cas 후보 단백질이 동일한 Cas 단백질에서 유래한 각기 다른 변이체이며, 2) 각 Cas 후보 단백질이 원 Cas 단백질과 동일한 구조의 가이드 RNA와 함께 CRISPR/Cas 복합체를 이루어 작동할 수 있는 경우, 상기 가이드 RNA는 한 종류만 사용될 수 있다. 또 다른 예를 들어, 각각의 Cas 후보 단백질이 각각 독립적으로, 특정 가이드 RNA와 함께 CRISPR/Cas 복합체를 이루어 작동할 수 있는 경우, 상기 가이드 RNA는 상기 스크리닝 방법에 사용된 상기 Cas 후보 단백질의 종류 수 만큼 사용될 수 있다.
적어도 하나의 가이드 RNA를 암호화하는 핵산 2 - 스크리닝 대상이 프라임 에디터인 경우
상기 테스팅 벡터에 포함된 "Cas 후보 단백질"이 프라임 에디터인 경우, 상기 적어도 하나의 가이드 RNA는 프라임 에디터와 함께 작동할 수 있는 pegRNA를 의미한다. 상기 pegRNA는 상기 프라임 에디터와 상호작용하여 복합체를 이루는 것이다. 상기 pegRNA는 가이드 RNA와 비교하여 상기 세포가 포함하는 교정대상 서열 또는 인근의 서열과 상보적으로 결합할 수 있는 Primer binding site 및 상기 교정대상 서열을 교정서열로 교정하는 주형이 되는 서열인 RT-template을 추가적으로 더 포함한다. 상기 pegRNA는 5'말단에서 3'말단 방향으로 상기 가이드 RNA - RT-template - Primer binding site가 순차적으로 연결된 구조이다. 상기 pegRNA는 상기 가이드 RNA와 유사하게 취급될 수 있으며, 이하 "가이드 RNA"에 대한 설명은 상기 pegRNA에도 적용될 수 있다.
미리 의도된 유전자
상기 Cas 후보 단백질 및 상기 가이드 RNA는 CRISPR/Cas 복합체를 이루어 작동할 수 있는데, 여기서, 상기 CRISPR/Cas 복합체는 미리 의도된 유전자를 편집하도록 설계된다. 일 구현예로, 상기 Cas 후보 단백질은 특정 가이드 RNA와 결합하여 CRISPR/Cas 복합체를 이루고, 뉴클레이즈(nuclase) 및/또는 니케이즈(nickase)활성을 가진다. 여기서, 상기 특정 가이드 RNA는 미리 의도된 유전자의 표적서열을 표적화할 수 있는 것이다. 상기 미리 의도된 유전자는 CRISPR/Cas 복합체에 의한 편집 여부를 알 수 있으며, 복수의 세포 중 상기 미리 의도된 유전자가 편집된 세포를 선별할 수 있는 것이라면 특별히 제한되지 않는다. 또 다른 구현예로, 상기 Cas 후보 단백질은 프라임 에디터이며, pegRNA와 결합하여 복합체를 이루고, 니케이즈 활성을 가진다. 여기서, 상기 pegRNA는 미리 의도된 유전자의 교정대상 서열을 교정서열로 교정할 수 있는 것이다. 상기 미리 의도된 유전자는 상기 프라임 에디터에 의한 교정 여부를 알 수 있으며, 복수의 세포 중 상기 미리 의도된 유전자가 교정된 세포를 선별할 수 있는 것이라면 특별히 제한되지 않는다.
일 구현예로, 상기 미리 의도된 유전자는 특정 배양 환경에서 세포독성을 나타내는 유전자일 수 있다. 일 예로, 상기 미리 의도된 유전자는 HPRT 유전자이며, 상기 HPRT 유전자는 6TG 환경에서 배양 시 세포독성을 나타내는 유전자일 수 있다.
복수의 세포에 복수의 테스팅 벡터 및 적어도 하나의 가이드 RNA를 암호화하는 핵산을 무작위로 도입하는 과정(이하, CRISPR/Cas 도입과정)
상기 Cas 단백질 후보군 스크리닝 방법은 복수의 세포에 복수의 테스팅 벡터 및 적어도 하나의 가이드 RNA를 암호화하는 핵산을 무작위로 도입하는 과정을 포함한다. 여기서, 상기 가이드 RNA는 세포 내 미리 의도된 유전자에 포함된 표적서열을 표적화할 수 있는 것이다. 또한, 상기 테스팅 벡터가 발현하는 Cas 후보 단백질 및 상기 가이드 RNA가 상호작용하여 CRISPR/Cas 복합체를 형성하는 경우, 상기 미리 의도된 유전자를 편집할 수 있다. 이하, 서술 편의를 위해 상기 복수의 테스팅 벡터 및 적어도 하나의 가이드 RNA를 암호화하는 핵산이 도입된 세포를 CRISPR/Cas 도입 세포라 칭한다. 상기 CRISPR/Cas 도입과정의 목적은 세포 내에서 테스팅 벡터 내 포함된 Cas 후보 단백질이 발현될 수 있도록 하고, 가이드 RNA를 직접 도입하거나, 또는 세포 내에서 발현될 수 있도록 하여 세포 내에서 CRISPR/Cas 시스템이 작동할 수 있도록 하기 위함이다. 상기 CRISPR/Cas 도입과정은 무작위로 일어나므로, 하나의 CRISPR/Cas 세포 내에 서로 다른 아미노산 서열을 가지는 복수의 Cas 단백질 및 하나 이상의 가이드 RNA가 발현될 수있다. 이에 따라, 상기 하나의 CRISPR/Cas 도입 세포 내에 2종 이상의 서로 다른 CRISPR/Cas 복합체가 발현될 수 있다. 상기 CRISPR/Cas 시스템의 각 구성요소 중 Cas 단백질은 상기 테스팅 벡터의 특징으로 인해 활성부위, 즉 세포핵에 전달되는 양이 적어진다. 따라서, 상기 형질감염된 세포 내 포함된 CRISPR/Cas 시스템은 저효율 전달환경과 비슷한 환경에서 작동할 수 있다.
상기 CRISPR/Cas 도입과정은 상기 가이드 RNA의 도입 양상에 따라 달라질 수 있는 바, 이에 대해 설명한다.
CRISPR/Cas 도입과정 예시 1 - 가이드 RNA를 암호화하는 핵산이 테스팅 벡터에 포함된 경우
일 구현예로, 상기 가이드 RNA(또는 pegRNA)를 암호화하는 핵산은 상기 테스팅 벡터에 포함되어 있을 수 있다. 위와 같은 구현예는 각각의 Cas 후보 단백질이 각각 서로 다른 가이드 RNA와 상호작용할 때 이용될 수 있다.
이 경우, 상기 CRISPR/Cas 도입과정은 다음과 같다:
(a) 복수의 세포에 복수의 테스팅 벡터를 무작위로 도입하는 과정, 여기서, 상기 테스팅 벡터는 《Cas 후보 단백질 스크리닝을 위한 테스팅 벡터》에 설명된 구성요소 및 Cas 후보 단백질에 대한 가이드 RNA를 암호화하는 핵산을 추가로 포함한다.
CRISPR/Cas 도입과정 예시 2 - 가이드 RNA를 암호화하는 핵산이 테스팅 벡터와는 독립적으로 도입되는 경우
일 구현예로, 상기 가이드 RNA(또는 pegRNA)를 암호화하는 핵산은 상기 테스팅 벡터와 독립적으로 세포에 도입될 수 있다. 여기서, 상기 가이드 RNA를 암호화하는 핵산은 상기 테스팅 벡터와 동시에, 또는 순차적으로 도입될 수 있다. 위와 같은 구현예는 각각의 Cas 후보 단백질이 같은 가이드 RNA와 상호작용할 때 이용될 수 있다. 이 경우, 상기 가이드 RNA를 암호화하는 핵산을 적은 종류만 준비하면 되어 효율적으로 이용될 수 있다.
이 경우, 상기 CRISPR/Cas 도입과정은 다음과 같다:
(a) 복수의 세포에 복수의 테스팅 벡터 및 가이드 RNA를 암호화하는 핵산을 무작위로 도입하는 과정, 여기서, 상기 테스팅 벡터 및 상기 가이드 RNA를 암호화하는 핵산은 동시에, 또는 순차적으로 도입될 수 있으며, 상기 테스팅 벡터의 수 및 상기 가이드 RNA를 암호화하는 핵산의 수(종류 수를 의미함)는 상이할 수 있다.
CRISPR/Cas 도입과정 예시 3 - 예시 1 및 예시 2의 조합
일 구현예로, 상기 CRISPR/Cas 도입과정은 상기 《CRISPR/Cas 도입과정 예시 1 - 가이드 RNA를 암호화하는 핵산이 테스팅 벡터에 포함된 경우》 및 《CRISPR/Cas 도입과정 예시 2 - 각각의 Cas 후보 단백질이 한 종류의 가이드 RNA와 상호작용하는 경우》 단락에서 설명된 방법이 적절히 조합된 과정일 수 있다.
상기 CRISPR/Cas 도입 세포 중 미리 의도된 유전자가 편집된 세포를 선별하는 과정(이하, 세포 선별 과정)
상기 CRISPR/Cas 도입 세포는 세포 내에서 CRISPR/Cas 시스템의 각 구성요소가 발현될 것이고, 상기 테스팅 벡터의 효과에 따라 적은 수의 CRISPR/Cas 복합체만이 활성부위(즉, 세포핵)에 도달하게 된다. 여기서, 적은 수의 CRISPR/Cas 복합체 만으로도 효율적으로 작동하여 미리 의도된 유전자를 편집한다면, 이는 고효율의 Cas 단백질 후보로 선별할 가치가 있다. 이러한 Cas 후보 단백질을 선별하기 위해, 상기 Cas 단백질 후보군 스크리닝 방법은 상기 CRISPR/Cas 도입 세포 중 미리 의도된 유전자가 편집된 세포를 선별하는 과정을 포함한다. 일 구현예로, 상기 미리 의도된 유전자는 특정 환경에서 세포독성을 나타내는 유전자일 수 있다.
일 구현예로, 상기 세포 선별 과정은 다음과 같다:
(b) 상기 미리 의도된 유전자가 세포독성을 나타내는 환경에서 상기 복수의 세포를 배양하고, 죽지 않고 살아남은 세포를 선별하는 과정.
일 예로, 상기 미리 의도된 유전자는 HPRT 유전자일 수 있고, 상기 세포 선별 과정은 상기 복수의 세포를 6TG가 포함된 배지에서 배양하고, 죽지 않고 살아남은 세포를 선별하는 과정일 수 있다.
상기 선별된 세포 내 포함된 Cas 후보 단백질의 아미노산 서열을 특정하는 과정(이하, 후보군 특정 과정)
상기 세포 선별 과정에서 선별된 세포 내에는 저효율의 전달환경과 유사한 환경에서 미리 의도된 유전자를 편집할 수 있는 고효율의 Cas 후보 단백질이 포함되어 있을 것이라 판단할 수 있다. 따라서, 상기 선별된 세포 내 포함된 Cas 후보 단백질의 아미노산 서열을 특정하여, 고효율의 Cas 후보 단백질 정보를 획득할 수 있다. 여기서, 상기 Cas 단백질의 아미노산 서열을 특정하는 방법은 달리 제한되지 않으며, 통상의 기술자가 공지된 방법을 참고하여 적절히 수행할 수 있다. 일 구현예로, 상기 후보군 특정 과정은 상기 선별된 세포에 NGS(Next-Generation Sequencing)를 수행하여 특정하는 것일 수 있다.
상기 Cas 후보 단백질의 아미노산 서열 활용
본 명세서에서 개시하는 상기 Cas 단백질 후보군 스크리닝 방법을 수행하는 경우, 수많은 Cas 후보 단백질 중 고효율의 Cas 후보 단백질만을 빠르고 효율적으로 선별할 수 있다. 상기 Cas 단백질 후보군 스크리닝 방법 결과 특정된 아미노산 서열 리스트는 이후 1) 개별 서열에 대한 유전자 편집 효율 측정을 통해 최적의 Cas 단백질을 찾아내는 데 활용되거나, 2) 효율적인 Cas 단백질 변이위치를 탐색하는 데 활용될 수 있다. 특히, 상기 Cas 단백질 후보군 스크리닝에 사용된 복수의 테스팅 벡터, 즉 Cas 후보 단백질 라이브러리가 동일한 Cas 단백질 유래의 Cas 변이체 라이브러리인 경우, 상기 특정된 아미노산 서열 리스트는 이를 원 Cas 단백질의 서열과 비교함으로써 효율적인 Cas 단백질 변이위치 후보를 선별하는 데 사용될 수 있다.
Cas 후보 단백질 스크리닝 방법 2 - 최적의 Cas 단백질 선별
상기 《Cas 후보 단백질 스크리닝 방법》은 최적의 Cas 단백질 서열을 선별하는 방법이라기 보다는 방대한 Cas 단백질 라이브러리에서 고효율의 Cas 단백질 후보를 빠르게 선별하는 방법으로 보아야 한다. 따라서, 실제로 최적의 Cas 단백질을 선별하기 위해서는 상기 후보군 스크리닝 방법에 의해 특정된 아미노산 서열의 Cas 단백질의 실제 효율을 측정해야 한다. 상기 최적의 Cas 단백질을 선별하는 방법은 상기 특정된 Cas 단백질 후보군 각각의 유전자 편집 효율을 측정하는 것을 포함하며, 통상의 기술자가 공지된 기술을 적절히 참고하여 수행할 수 있다.
Cas 단백질 또는 이의 변이체
Cas 단백질 또는 이의 변이체 개괄
본 명세서에서는 상기 테스팅 벡터 및 상기 Cas 후보 단백질 스크리닝 방법을 통해 찾아낸 Streptococcus pyogenes 유래 Cas9 단백질(이하, SpCas9 단백질)의 변이체를 개시한다. 본 명세서의 발명자들은 SpCas9 단백질 또는 SpCas9 단백질의 변이체인 Sniper Cas9 단백질을 기초로, 상기 Cas 후보 단백질 스크리닝 방법을 적용하여 고활성의 SpCas9 단백질 변이체 후보군을 발굴하였고, 상기 후보군들의 아미노산 서열을 분석하여 SpCas9 (또는 Sniper Cas9) 단백질의 고활성 변이체를 제조하기 위한 최적의 변이 위치를 찾아내고, 이를 검증하여 고활성의 SpCas9 단백질 변이체의 아미노산 서열을 특정하였다.
Cas 단백질 1 - 백본 서열
상기 SpCas9 단백질 변이체는 Streptococcus pyogenes 유래 Cas9 단백질 또는 상기 SpCas9 단백질을 기초로 본 명세서의 발명자들이 연구하여 개시한 Sniper Cas9 단백질(한국 특허공보 10-2020-0125191 참조)을 백본으로 하여, 특정 아미노산 서열 위치가 변이된 것을 특징으로 한다.
일 구현예로, 상기 SpCas9 단백질 변이체는 서열번호 1의 아미노산 서열 중 하나 이상의 아미노산이 변이된 것일 수 있다.
또 다른 구현예로, 상기 SpCas9 단백질 변이체는 서열번호 2의 아미노산 서열 중 하나 이상의 아미노산이 변이된 것일 수 있다.
여기서, 상기한 "아미노산이 변이되었다"함은, 1) 상기 아미노산 서열 중 하나 이상의 아미노산이 다른 것으로 치환된 것이거나, 2) 하나 이상의 아미노산이 제거된 것이거나, 3) 하나 이상의 아미노산이 추가된 것 모두를 통틀어 일컫는다.
Cas 단백질 2 - 변이 위치
일 구현예로, 상기 SpCas9 단백질 변이체는 서열번호 1 또는 서열번호 2의 아미노산 서열의 20번째 발린(Valine), 83번째 글루타민(Glutamine), 128번째 티로신(Tyrosine), 402번째 글루타민(Glutamine), 467번째 아르기닌(Arginine), 635번째 아르기닌(Arginine), 642번째 류신(Leusine), 660번째 글리신(Glysine), 680번째 류신(Leusine), 692번째 아스파라긴(Asparagine), 835번째 아스파르트산(Aspartic acid), 931번째 발린(Valine), 975번째 발린(Valine), 1019번째 아르기닌(Arginine), 1027번째 글루타민(Glutamine), 1061번째 프롤린(Proline), 1074번째 트립토판(Tryptophan), 1091번째 글루타민(Glutamine), 및 1212번째 아르기닌(Arginine) 중 선택된 하나 이상의 아미노산이 다른 아미노산으로 치환된 것일 수 있다.
Cas 단백질 3 - 아미노산 서열 특정
일 구현예로, 상기 SpCas9 단백질 변이체는 서열번호 3 내지 서열번호 8 중 선택된 아미노산 서열로 표현된다.
가이드 RNA
상기 SpCas9 단백질의 변이체 역시 상기 SpCas9 단백질과 복합체를 이룰 수 있는 가이드 RNA와 복합체를 이루어 작동할 수 있다. 상기 가이드 RNA는 SpCas9 단백질의 crRNA 및 tracrRNA를 포함한다. 상기 가이드 RNA는 상기 crRNA 및 tracrRNA가 링커를 통해 연결된 싱글 가이드 RNA(sgRNA)일 수 있다. 상기 crRNA는 직접 반복부(direct repeat) 및 가이드 도메인을 포함한다. 상기 crRNA의 직접 반복부 및 상기 tracrRNA는 상기 SpCas9 단백질의 변이체와 상호작용하여 복합체를 이룰 수 있는 것이며, 이를 통틀어 스캐폴드라 지칭할 수 있다. 여기서, 상기 가이드 RNA가 싱글 가이드 RNA일 경우, 상기 스캐폴드는 상기 링커도 포함한다. 상기 crRNA의 가이드 도메인은 미리 결정된 표적서열을 표적화할 수 있는 것이다.
일 구현예로, 상기 crRNA의 직접 반복부는 서열번호 13의 핵산 서열로 표현된다. 일 구현예로, 상기 tracrRNA는 서열번호 14의 핵산 서열로 표현된다. 일 구현예로, 상기 싱글 가이드 RNA의 스캐폴드는 서열번호 15의 핵산 서열로 표현된다.
CRISPR/Cas 복합체
본 명세서에서는 상기 SpCas9 단백질의 변이체 및 상기 가이드 RNA가 상호작용하여 복합체를 이룬 CRISPR/Cas 복합체를 개시한다. 상기 CRISPR/Cas 복합체는 리보뉴클레오프로틴(ribonucleoprotein) 형태일 수 있다. 상기 CRISPR/Cas 복합체는 표적-특이적 뉴클레이즈 활성을 가진다. 구체적으로, 상기 CRISPR/Cas 복합체는 상기 가이드 RNA의 가이드 도메인이 표적화한 이중가닥 DNA의 표적서열 또는 이와 인접한 핵산을 절단할 수 있다.
CRISPR/Cas 구성요소 발현벡터
본 명세서에서는 상기 SpCas9 단백질의 변이체 및 상기 가이드 RNA 각각을 발현할 수 있는 CRISPR/Cas 구성요소 발현벡터를 개시한다. 상기 CRISPR/Cas 구성요소 발현벡터는 상기 SpCas9 단백질의 변이체를 암호화하는 핵산 및 상기 가이드 RNA를 암호화하는 핵산을 포함한다. 상기 암호화핵산은 DNA, RNA, 및/또는 화학적으로 변형된 핵산일 수 있다. 상기 CRISPR/Cas 구성요소 발현벡터는 대상 세포 내에서 상기 SpCas9 단백질의 변이체 및 상기 가이드 RNA를 발현할 수 있도록 하기 위한 구성요소를 추가적으로 더 포함할 수 있다. 상기 추가 구성요소는 통상의 기술자가 공지된 기술을 참고하여 적절하게 선택할 수 있다.
CRISPR/Cas 시스템을 사용한 유전자 편집 방법
본 명세서에서는 상기 SpCas9 단백질의 변이체 및 상기 가이드 RNA를 포함하는 CRISPR/Cas 시스템을 사용한 유전자 편집 방법을 제공한다. 상기 유전자 편집 방법은 대상 세포에 CRISPR/Cas 조성물을 도입하는 과정을 포함하며, 상기 CRISPR/Cas 조성물은 상기 SpCas9 단백질의 변이체 또는 상기 SpCas9 단백질의 변이체를 암호화하는 핵산 및 상기 가이드 RNA 또는 상기 가이드 RNA를 암호화하는 핵산을 포함한다. 여기서, 상기 가이드 RNA는 상기 대상 세포 내 미리 결정된 표적서열을 표적화할 수 있는 것이다. 결과적으로, 상기 유전자 편집 방법을 수행하면 상기 대상 세포 내에서 CRISPR/Cas 복합체에 의해 상기 표적서열 또는 이와 인접한 핵산이 편집된다.
발명의 가능한 실시예
이하 본 명세서에서 제공하는 발명의 가능한 실시예들을 나열한다. 본 단락에서 제공하는 이하의 실시예들은 단지 발명의 일 예시에 해당될 뿐이다. 따라서, 본 명세서에서 제공하는 발명을 하기 실시예로 제한하여 해석할 수 없다. 실시예 번호와 함께 기재된 간략한 설명 또한, 각 실시예 간 구분의 편의를 위한 것일 뿐 본 명세서에서 개시하는 발명에 대한 제한으로 해석될 수 없다.
발현 억제-유도 요소
실시예 1, 발현 억제-유도 요소
발현 억제-유도 요소로, 상기 발현 억제-유도 요소와 작동적으로 연결된(Operably linked) 대상의 발현을 억제하는 것임.
실시예 2, 저발현 프로모터
실시예 1에 있어서, 상기 발현 억제-유도 요소는 저발현 프로모터임.
실시예 3, UBC 프로모터
실시예 2에 있어서, 상기 저발현 프로모터는 UBC 프로모터임.
실시예 4, UBC 프로모터 서열
실시예 3에 있어서, 상기 UBC 프로모터의 서열은 TTTTATGTACCTATCTTCTTAAGTAGCTGAAGCTCCGGTTTTGAACTATGCGCTCGGGGTTGGCGAGTGTGTTTTGTGAAGTTTTTTAGGCACCTTTTGAAATGTAATCATTTGGGTCAATATGTAATTTTCAGTGTTAGACTAGTAAATTGTCCGCTAAATTCTGGCCGTTTTTGGCTTTTTTGTTAGA(서열번호 16)의 핵산 서열로 표현됨.
실시예 5, UBC 프로모터 변형 서열
실시예 2에 있어서, 상기 저발현 프로모터는 UBC 프로모터의 변형 서열임.
실시예 6, Exon 및 Intron 제거
실시예 5에 있어서, 상기 UBC 프로모터의 변형 서열은 야생형의 UBC 프로모터의 Exon 1 및/또는 Intron 영역의 전부 또는 일부를 제거한 것임.
실시예 7, Exon 및 Intron 제거 서열
실시예 6에 있어서, 상기 UBC 프로모터의 변형 서열은 GGCCTCCGCGCCGGGTTTTGGCGCCTCCCGCGGGCGCCCCCCTCCTCACGGCGAGCGCTGCCACGTCAGACGAAGGGCGCAGCGAGCGTCCTGATCCTTCCGCCCGGACGCTCAGGACAGCGGCCCGCTGCTCATAAGACTCGGCCTTAGAACCCCAGTATCAGCAGAAGGACATTTTAGGACGGGACTTGGGTGACTCTAGGGCACTGGTTTTCTTTCCAGAGAGCGGAACAGGCGAGGAAAAGTAGTCCCTTCTCGGCGATTCTGCGGAGGGATCTCCGTGGGGCGGTGAACGCCGATGATTATATAAGGACGCGCCGGGTGTGGCACAGCTAGTTCCGTCGCAGCCGGGATTTGGGTCGCAGTTCTTGTTTGTGGATCGCTGTGATCGTCACTTG(서열번호 17), 및 GGCCTCCGCGCCGGGTTTTGGCGCCTCCCGCGGGCGCCCCCCTCCTCACGGCGAGCGCTGCCACGTCAGACGAAGGGCGCAGCGAGCGTCCTGATCCTTCCGCCCGGACGCTCAGGACAGCGGCCCGCTGCTCATAAGACTCGGCCTTAGAACCCCAGTATCAGCAGAAGGACATTTTAGGACGGGACTTGGGTGACTCTAGGGCACTGGTTTTCTTTCCAGAGAGCGGAACAGGCGAGGAAAAGTAGTCCCTTCTCGGCGATTCTGCGGAGGGATCTCCGTGGGGCGGTGAACGCCGATGATTATATAAGGACGCGCCGGGTGTGGCACAGCT(서열번호 18) 중 선택된 핵산 서열로 표현됨.
실시예 8, Binding site 제거
실시예 5에 있어서, 상기 UBC 프로모터의 변형 서열은 야생형의 UBC 프로모터의 SP1 binding site 및/또는 PPARβ binding site의 전부 또는 일부를 제거한 것임.
실시예 9, Binding site 제거 서열
실시예 8에 있어서, 상기 UBC 프로모터의 변형 서열은 TGATCCTTCCGCCCGGACGCTCAGGACAGCGGCCCGCTGCTCATAAGACTCGGCCTTAGAACCCCAGTATCAGCAGAAGGACATTTTAGGACGGGACTTGGGTGACTCTAGGGCACTGGTTTTCTTTCCAGAGAGCGGAACAGGCGAGGAAAAGTAGTCCCTTCTCGGCGATTCTGCGGAGGGATCTCCGTGGGGCGGTGAACGCCGATGATTATATAAGGACGCGCCGGGTGTGGCACAGCT(서열번호 19), 및 GCTGCTCATAAGACTCGGCCTTAGAACCCCAGTATCAGCAGAAGGACATTTTAGGACGGGACTTGGGTGACTCTAGGGCACTGGTTTTCTTTCCAGAGAGCGGAACAGGCGAGGAAAAGTAGTCCCTTCTCGGCGATTCTGCGGAGGGATCTCCGTGGGGCGGTGAACGCCGATGATTATATAAGGACGCGCCGGGTGTGGCACAGCT(서열번호 20) 중 선택된 핵산 서열로 표현됨.
활성부위 접근 방해-유도 요소
실시예 10, 활성부위 접근 방해-유도 요소
활성부위 접근 방해-유도 요소로, 상기 활성부위 접근 방해-유도 요소와 연결된 대상이 활성부위로 접근하는 것을 방해하는 것임.
실시예 11, NES
실시예 10에 있어서, 상기 활성부위 접근 방해-유도 요소는 Nuclear export signal(NES)임.
실시예 12, NES 예시
실시예 11에 있어서, 상기 활성부위 접근 방해-유도 요소는 LDLASLIL(서열번호 89), EMLKEINEALQLAE(서열번호 90), EMLREINEALELKD(서열번호 91), EILREINEALEFKD(서열번호 92), EMFQELNEALELKD(서열번호 93), KMFQELNEALELKD(서열번호 94), EMFRELNEALELKD(서열번호 95), EMFRELNEALELMD(서열번호 96), EMFRELNDALELKD(서열번호 97), EMFRNLNEALELKD(서열번호 98), EMIKKLNDALELQE(서열번호 99), EMLKKINDGLDLLE(서열번호 100), EFLKKINDGLELLE(서열번호 101), EFLKKINDGLELSD(서열번호 102), LWFKSLNDGLELMD(서열번호 103), 및 EILMKLKESLELME(서열번호 104) 중 선택된 아미노산 서열로 표현됨.
Cas 단백질
실시예 13, Nuclase
뉴클레이즈 활성을 가지는 Cas 단백질.
실시예 14, Nickase
니케이즈 활성을 가지는 Cas 단백질.
실시예 15, Dead
핵산 절단 기능이 불활성화 된 Cas 단백질.
실시예 16, Cas9 단백질
실시예 13 내지 실시예 15 중 어느 하나에 있어서, 상기 Cas 단백질은 Cas9 단백질 또는 그 변이체임.
실시예 17, Cas9 단백질 유래
실시예 13 내지 실시예 16 중 어느 하나에 있어서, 상기 Cas9 단백질은 스트렙토코커스 피오게네스(Streptococcus pyogenes), 스트렙토코커스 써모필러스(Streptococcus thermophilus), 스트렙토코커스 속 (Streptococcus sp.), 스트렙토마이세스 프리스티네스피랄리스(Streptomyces pristinaespiralis), 스트렙토마이세스 비리도크로모게네스(Streptomyces viridochromogenes), 스트렙토마이세스 비리도크로모게네스(Streptomyces viridochromogenes), 스트렙토스포랑기움 로세움(Streptosporangium roseum), 또는 스트렙토스포랑기움 로세움(Streptosporangium roseum) 유래 Cas9 단백질 또는 그 변이체임.
Base editor
실시예 18, 베이스 에디터
다음을 포함하는 베이스 에디터:
실시예 13 내지 실시예 17 중 어느 하나의 Cas 단백질; 및
염기교정 도메인,
여기서, 상기 베이스 에디터는 Cas 단백질 및 상기 염기교정 도메인이 융합된 융합 단백질임.
실시예 19, ABE
실시예 18에 있어서, 상기 염기교정 도메인은 아데노신 탈아미노화효소임.
실시예 20, CBE
실시예 18에 있어서, 상기 염기교정 도메인은 시티딘 탈아미노화효소임.
Prime editor
실시예 21, 프라임 에디터 효소
다음을 포함하는 프라임 에디터:
실시예 13 내지 실시예 17 중 어느 하나의 Cas 단백질; 및
역전사 효소(reverse transcriptase),
여기서, 상기 프라임 에디터는 상기 Cas 단백질 및 상기 역전사 효소가 융합된 융합 단백질임.
활성부위 접근 방해-유도 요소가 융합된 Cas 단백질
실시예 22, 융합 단백질
다음을 포함하는 융합 단백질:
실시예 10 내지 실시예 12 중 어느 하나의 활성부위 접근 방해-유도 요소; 및
실시예 13 내지 실시예 17 중 어느 하나의 Cas 단백질, 실시예 18 내지 실시예 20 중 어느 하나의 베이스 에디터, 또는 실시예 21의 프라임 에디터.
실시예 23, 융합 단백질 구조 한정
실시예 22에 있어서, 상기 융합 단백질은 상기 실시예 13 내지 실시예 17 중 어느 하나의 Cas 단백질, 실시예 18 내지 실시예 20 중 어느 하나의 베이스 에디터, 또는 실시예 21의 프라임 에디터의 N말단 및/또는 C말단에 적어도 하나의 상기 활성부위 접근 방해-유도 요소가 융합된 융합 단백질임.
실시예 24, NES 한정
실시예 23에 있어서, 상기 활성부위 접근 방해-유도 요소는 NES이고,
상기 융합 단백질이 Cas 단백질을 포함할 경우 NES-Cas 융합 단백질로 지칭되고,
상기 융합 단백질이 베이스 에디터를 포함할 경우 NES-베이스 에디터 융합 단백질로 지칭되며,
상기 융합 단백질이 프라임 에디터를 포함할 경우 NES-프라임 에디터 융합 단백질로 지칭됨.
실시예 25, 융합 단백질 구조식 한정
다음 구조식 1로 표현되는 융합 단백질:
[구조식 1]
N1 - C - N2
여기서, 상기 N1은 실시예 10 내지 실시예 12 중 어느 하나의 활성부위 접근 방해-유도 요소 또는 부존재이고,
상기 C는 실시예 13 내지 실시예 17 중 어느 하나의 Cas 단백질, 실시예 18 내지 실시예 20 중 어느 하나의 베이스 에디터, 또는 실시예 21의 프라임 에디터이고,
상기 N2는 실시예 10 내지 실시예 12 중 어느 하나의 활성부위 접근 방해-유도 요소 또는 부존재이며,
상기 융합 단백질은 적어도 하나의 활성부위 접근 방해-유도 요소를 포함함.
실시예 26, NES 한정
실시예 25에 있어서, 상기 활성부위 접근 방해-유도 요소는 NES이고,
상기 융합 단백질이 Cas 단백질을 포함할 경우 NES-Cas 융합 단백질로 지칭되고,
상기 융합 단백질이 베이스 에디터를 포함할 경우 NES-베이스 에디터 융합 단백질로 지칭되며,
상기 융합 단백질이 프라임 에디터를 포함할 경우 NES-프라임 에디터 융합 단백질로 지칭됨.
테스팅 벡터
실시예 27, 테스팅 벡터
다음을 포함하는 테스팅 벡터:
실시예 1 내지 실시예 9 중 어느 하나의 발현 억제-유도 요소; 및
실시예 22 내지 실시예 26 중 어느 하나의 융합 단백질을 암호화하는 핵산,
여기서, 상기 발현 억제-유도 요소 및 상기 융합 단백질을 암호화하는 핵산은 작동적으로 연결되어 있음(Operably linked).
실시예 28, 가이드 RNA를 암호화하는 핵산 포함
실시예 27에 있어서, 상기 테스팅 벡터는 가이드 RNA를 암호화하는 핵산을 추가적으로 더 포함하고,
여기서, 상기 가이드 RNA는 상기 융합 단백질에 포함된 Cas 단백질과 상호작용하여 CRISPR/Cas 복합체를 형성할 수 있고,
상기 가이드 RNA는 미리 결정된 표적서열을 표적화 할 수 있음.
실시예 29, pegRNA를 암호화하는 핵산 포함
실시예 27에 있어서, 상기 테스팅 벡터는 pegRNA를 암호화하는 핵산을 추가적으로 더 포함하고,
여기서, 상기 pegRNA는 5'말단에서 3'말단 방향으로 가이드 RNA, RT-template, 및 Primer binding site가 순차적으로 연결된 것이고,
상기 가이드 RNA는 상기 융합 단백질에 포함된 Cas 단백질과 상호작용하여 복합체를 형성할 수 있고,
상기 가이드 RNA는 미리 결정된 표적서열을 표적화 할 수 있으며,
상기 Primer binding site는 미리 결정된 교정대상 서열 또는 상기 교정대상 서열의 인근 서열에 상보적으로 결합할 수 있고,
상기 RT-template은 상기 교정대상 서열을 교정서열로 교정하기 위한 주형이 되는 서열임.
테스팅 세트
실시예 30, 테스팅 세트
다음을 포함하는 테스팅 세트:
복수의, 실시예 27 내지 실시예 29 중 어느 하나의 테스팅 벡터,
여기서, 상기 테스팅 세트에는 적어도 두 개의 서로 다른 아미노산 서열을 가지는 Cas 단백질을 암호화하는 핵산이 포함됨.
실시예 31, 가이드 RNA 포함
실시예 30에 있어서, 상기 테스팅 세트는 적어도 하나의 가이드 RNA 또는 상기 가이드 RNA를 암호화하는 핵산을 더 포함하고,
상기 각각의 가이드 RNA는 상기 테스팅 세트에 포함된 융합 단백질 암호화 핵산이 암호화하는 Cas 단백질 중 적어도 하나와 상호작용하여 CRISPR/Cas 복합체를 이룰 수 있으며,
상기 가이드 RNA는 미리 결정된 표적서열을 표적화 할 수 있음.
실시예 32, 2개의 테스팅 벡터 기준
다음을 포함하는 테스팅 세트:
제1 테스팅 벡터로, 실시예 27 내지 실시예 29 중 선택된 어느 하나; 및
제2 테스팅 벡터로, 실시예 27 내지 실시예 29 중 선택된 어느 하나,
여기서, 상기 제1 테스팅 벡터의 융합 단백질에 포함된 Cas 단백질의 아미노산 서열 및 상기 제2 테스팅 벡터의 융합 단백질에 포함된 Cas 단백질의 아미노산 서열은 서로 다름.
실시예 33, 2개의 테스팅 벡터, 1개의 가이드 RNA
실시예 32에 있어서, 상기 테스팅 세트는 가이드 RNA 또는 상기 가이드 RNA를 암호화하는 핵산을 더 포함하며,
상기 가이드 RNA는 상기 제1 테스팅 벡터의 융합 단백질에 포함된 Cas 단백질과 상호작용하여 CRISPR/Cas 복합체를 형성할 수 있고,
상기 가이드 RNA는 상기 제2 테스팅 벡터의 융합 단백질에 포함된 Cas 단백질과 상호작용하여 CRISPR/Cas 복합체를 형성할 수 있으며,
상기 가이드 RNA는 미리 결정된 표적서열을 표적화할 수 있음.
실시예 34, 2개의 테스팅 벡터, 1개의 pegRNA
실시예 32에 있어서, 상기 테스팅 세트는 pegRNA 또는 상기 pegRNA를 암호화하는 핵산을 더 포함하며,
여기서, 상기 pegRNA는 5'말단에서 3'말단 방향으로 가이드 RNA, RT-template, 및 Primer binding site가 순차적으로 연결된 것이고,
상기 가이드 RNA는 상기 제1 테스팅 벡터의 융합 단백질에 포함된 Cas 단백질과 상호작용하여 복합체를 형성할 수 있고,
상기 가이드 RNA는 상기 제2 테스팅 벡터의 융합 단백질에 포함된 Cas 단백질과 상호작용하여 복합체를 형성할 수 있으며,
상기 가이드 RNA는 미리 결정된 표적서열을 표적화할 수 있고,
상기 Primer binding site는 미리 결정된 교정대상 서열 또는 상기 교정대상 서열의 인근 서열에 상보적으로 결합할 수 있고,
상기 RT-template은 상기 교정대상 서열을 교정서열로 교정하기 위한 주형이 되는 서열임.
실시예 35, 2개의 테스팅 벡터, 2개의 가이드 RNA
실시예 32에 있어서, 상기 테스팅 세트는 다음을 더 포함함:
제1 가이드 RNA 또는 상기 제1 가이드 RNA를 암호화하는 핵산; 및
제2 가이드 RNA 또는 상기 제2 가이드 RNA를 암호화하는 핵산,
여기서, 상기 제1 가이드 RNA는 상기 제1 테스팅 벡터의 융합 단백질에 포함된 Cas 단백질과 상호작용하여 CRISPR/Cas 복합체를 형성할 수 있고,
상기 제2 가이드 RNA는 상기 제2 테스팅 벡터의 융합 단백질에 포함된 Cas 단백질과 상호작용하여 CRISPR/Cas 복합체를 형성할 수 있으며,
상기 제1 가이드 RNA 및 상기 제2 가이드 RNA는 각각 독립적으로 미리 결정된 표적서열을 표적화할 수 있음.
실시예 36, 2개의 테스팅 벡터, 2개의 pegRNA
실시예 32에 있어서, 상기 테스팅 세트는 다음을 더 포함함:
제1 pegRNA 또는 상기 제1 pegRNA를 암호화하는 핵산으로,
여기서, 상기 제1 pegRNA는 5'말단에서 3'말단 방향으로 제1 가이드 RNA, RT-template, 및 Primer binding site가 순차적으로 연결된 것임;
제2 pegRNA 또는 상기 제2 pegRNA를 암호화하는 핵산으로,
여기서, 상기 제2 pegRNA는 5'말단에서 3'말단 방향으로 제2 가이드 RNA, RT-template, 및 Primer binding site가 순차적으로 연결된 것임;
여기서, 상기 제1 가이드 RNA는 상기 제1 테스팅 벡터의 융합 단백질에 포함된 Cas 단백질과 상호작용하여 복합체를 형성할 수 있고,
상기 제2 가이드 RNA는 상기 제2 테스팅 벡터의 융합 단백질에 포함된 Cas 단백질과 상호작용하여 복합체를 형성할 수 있으며,
상기 제1 가이드 RNA 및 상기 제2 가이드 RNA는 각각 독립적으로 미리 결정된 표적서열을 표적화할 수 있고,
상기 Primer binding site는 미리 결정된 교정대상 서열 또는 상기 교정대상 서열의 인근 서열에 상보적으로 결합할 수 있고,
상기 RT-template은 상기 교정대상 서열을 교정서열로 교정하기 위한 주형이 되는 서열임.
실시예 37, 더미벡터 포함
실시예 30 내지 실시예 36 중 어느 하나에 있어서,
상기 테스팅 세트는 복수의 더미벡터를 추가적으로 더 포함하며,
상기 더미벡터는 세포 내에서 Cas 단백질을 발현하지 않는 것임.
실시예 38, 더미벡터 사이즈
실시예 37에 있어서, 상기 복수의 더미벡터는 각각 상기 테스팅 세트 내 포함된 적어도 하나의 테스팅 벡터와 동일한 사이즈(예를 들어, 서열 길이)를 가짐.
Cas 후보 단백질 스크리닝 방법 - 후보군 선별
실시예 39, 스크리닝 방법
다음을 포함하는 Cas 후보 단백질 스크리닝 방법:
(a) CRISPR/Cas 도입과정,
여기서, 상기 CRISPR/Cas 도입과정은 복수의 세포에 실시예 30 내지 실시예 38 중 선택된 어느 하나의 테스팅 세트를 처리하고, 선택적으로, 적어도 하나의 가이드 RNA(또는 pegRNA) 또는 상기 가이드 RNA(또는 pegRNA)를 암호화하는 핵산을 처리하는 과정이고,
이로 인해, 상기 테스팅 세트에 포함된 복수의 테스팅 벡터 및 선택적으로, 가이드 RNA 또는 상기 가이드 RNA를 암호화하는 핵산이 상기 복수의 세포에 무작위로 도입되고,
상기 테스팅 세트에 포함된 가이드 RNA는 미리 결정된 유전자의 미리 결정된 표적서열을 표적화할 수 있는 것임;
(b) 세포 선별 과정,
여기서, 상기 세포 선별 과정은 상기 테스팅 세트가 도입된 세포 중 미리 결정된 유전자가 편집된 세포를 선별하는 과정임; 및
(c) 후보군 특정 과정,
여기서, 상기 후보군 특정 과정은 상기 선별된 세포에 도입된 테스팅 벡터에 포함된 Cas 단백질의 아미노산 서열을 특정하는 과정임.
실시예 40, CRISPR/Cas 도입양태 1 - 테스팅 벡터에 가이드 RNA 포함
실시예 39에 있어서, 상기 (a) CRISPR/Cas 도입과정은 다음과 같은 특징을 가짐:
상기 테스팅 세트에 포함된 복수의 테스팅 벡터는 각각 독립적으로 실시예 28의 테스팅 벡터이고,
상기 CRISPR/Cas 도입과정은 상기 복수의 세포에 상기 테스팅 세트에 포함된 복수의 테스팅 벡터를 무작위로 도입하는 것임.
실시예 41, CRISPR/Cas 도입양태 2 - 한 종류의 가이드 RNA 도입
실시예 39에 있어서, 상기 (a) CRISPR/Cas 도입과정은 다음과 같은 특징을 가짐:
상기 테스팅 세트는 실시예 27 내지 실시예 29 중 각각 독립적으로 선택된 복수의 테스팅 벡터, 및 1종류의 가이드 RNA 또는 상기 가이드 RNA를 암호화하는 핵산을 포함하고,
상기 CRISPR/Cas 도입과정은 상기 복수의 세포에 상기 테스팅 세트에 포함된 복수의 테스팅 벡터 및 상기 가이드 RNA 또는 상기 가이드 RNA를 암호화하는 핵산을 동시에 또는 순차적으로 도입하는 것임.
실시예 42, CRISPR/Cas 도입양태 3 - 복수의 가이드 RNA 도입
실시예 39에 있어서, 상기 (a) CRISPR/Cas 도입과정은 다음과 같은 특징을 가짐:
상기 테스팅 세트는 실시예 27 내지 실시예 29 중 각각 독립적으로 선택된 복수의 테스팅 벡터, 및 복수의 가이드 RNA 또는 상기 가이드 RNA를 암호화하는 핵산을 포함하고,
상기 CRISPR/Cas 도입과정은 상기 복수의 세포에 상기 테스팅 세트에 포함된 복수의 테스팅 벡터 및 상기 복수의 가이드 RNA 또는 상기 가이드 RNA를 암호화하는 핵산을 동시에 또는 순차적으로 도입하는 것임.
실시예 43, CRISPR/Cas 도입양태 4 - 테스팅 세트 및 가이드 RNA 따로 처리
실시예 39에 있어서, 상기 (a) CRISPR/Cas 도입과정은 다음과 같은 특징을 가짐:
상기 테스팅 세트는 실시예 27 중 각각 독립적으로 선택된 복수의 테스팅 벡터를 포함하고,
상기 CRISPR/Cas 도입과정은 복수의 세포에 상기 테스팅 세트 및 적어도 하나의 가이드 RNA 또는 상기 가이드 RNA를 암호화하는 핵산을 상기 복수의 세포에 무작위로 도입하는 과정이고,
상기 테스팅 세트 및 상기 가이드 RNA 또는 상기 가이드 RNA를 암호화하는 핵산은 동시에, 또는 순차적으로 도입됨.
실시예 44, 세포 선별 과정 구체화
실시예 39 내지 실시예 43 중 어느 하나에 있어서, 상기 (b) 세포 선별 과정은 다음과 같은 특징을 가짐:
상기 미리 결정된 유전자는 특정 조건 하 세포독성을 나타내는 유전자이고,
상기 미리 결정된 유전자가 편집된 세포를 선별하는 과정은 죽지 않고 살아남은 세포를 선별하는 과정임.
실시예 45, HPRT, 6TG 조건
실시예 44에 있어서, 상기 미리 결정된 유전자는 HPRT 유전자이고, 상기 특정 조건은 상기 복수의 세포를 6TG가 포함된 배지에서 배양시키는 것임.
실시예 46, Cas 변이체 스크리닝 방법
실시예 39 내지 실시예 45 중 어느 하나에 있어서, 상기 테스팅 세트의 복수의 테스팅 벡터에 포함된 각각의 Cas 단백질을 암호화하는 핵산이 암호화하는 Cas 단백질은 모두 "원 Cas 단백질"의 변이체임.
실시예 47, 변이체의 의미 한정
실시예 46에 있어서, 상기 원 Cas 단백질의 변이체는 상기 원 Cas 단백질의 아미노산 서열 중 적어도 하나의 아미노산이 다른 아미노산으로 치환된 것임.
실시예 48, SpCas9 변이체 한정
실시예 47에 있어서, 상기 원 Cas 단백질은 스트렙토코커스 피오게네스 유래 Cas9 단백질임.
실시예 49, SpCas9 변이체 백본 서열 한정
실시예 47에 있어서, 상기 원 Cas 단백질은 IAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD(서열번호 1) 또는 IAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD(서열번호 2) 중 선택된 아미노산으로 표현됨.
실시예 50, PAM 변이체 한정
실시예 46 내지 No entry found 중 어느 하나에 있어서, 상기 원 Cas 단백질의 변이체는 상기 원 Cas 단백질이 인식하는 PAM 서열과는 다른 PAM 서열을 인식하는 것을 특징으로 함.
실시예 51, SpCas9 PAM 변이체 한정
실시예 50에 있어서, 상기 원 Cas 단백질의 변이체는 스트렙토코커스 피오게네스 유래 Cas9 단백질의 변이체이고, 상기 원 Cas 단백질의 변이체는 5'-NGG-3'과 다른 PAM 서열을 인식하는 것을 특징으로 함.
실시예 52, 세포 한정
실시예 39 내지 실시예 51 중 어느 하나에 있어서, 상기 복수의 세포는 진핵세포임.
실시예 53, 인간/동물/식물 한정
실시예 52에 있어서, 상기 복수의 세포는 인간, 비인간 동물, 및/또는 식물 세포임.
실시예 54, 인간 세포 한정
실시예 53에 있어서, 상기 복수의 세포는 인간 세포이고, MRC5, HT1080, HEK293T, 129TF, MEF, C2C12, MSC, 및 CMMT 세포 중 선택된 적어도 하나임.
실시예 55, 프라임 에디터 한정
실시예 39 내지 실시예 54 중 어느 하나에 있어서, 상기 Cas 단백질은 실시예 21의 프라임 에디터이고, 상기 가이드 RNA는 5'말단에서 3'말단 방향으로 가이드 RNA, RT-template, 및 Primer binding site가 순차적으로 연결된 pegRNA이며, 프라임 에디터-pegRNA 복합체는 상기 미리 결정된 유전자에 포함된 교정대상 서열을 상기 RT-template을 주형으로 하는 교정서열로 교정하는 기능을 함.
신규 Cas 단백질 또는 이의 변이체
실시예 56, SpCas9 변이체
스트렙토코커스 피오게네스(Streptococcus pyogenes) 유래 Cas9 단백질의 변이체.
실시예 57, 백본 서열 한정
실시예 56에 있어서, 상기 Cas9 단백질의 변이체는 IAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD(서열번호 1) 또는 IAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD(서열번호 2) 중 선택된 아미노산 서열로 표현되는 Cas9 단백질의 변이체임.
실시예 58, 변이위치 한정
실시예 57에 있어서, 상기 Cas9 단백질의 변이체는 상기 Cas9 단백질의 아미노산 서열 중 20번째 발린(Valine), 83번째 글루타민(Glutamine), 128번째 티로신(Tyrosine), 402번째 글루타민(Glutamine), 467번째 아르기닌(Arginine), 635번째 아르기닌(Arginine), 642번째 류신(Leusine), 660번째 글리신(Glysine), 680번째 류신(Leusine), 692번째 아스파라긴(Asparagine), 835번째 아스파르트산(Aspartic acid), 931번째 발린(Valine), 975번째 발린(Valine), 1019번째 아르기닌(Arginine), 1027번째 글루타민(Glutamine), 1061번째 프롤린(Proline), 1074번째 트립토판(Tryptophan), 1091번째 글루타민(Glutamine), 및 1212번째 아르기닌(Arginine) 중 선택된 하나 이상의 아미노산이 다른 아미노산으로 치환된 것임.
실시예 59, 변이위치 한정 - 서열표현
실시예 57에 있어서, 상기 Cas9 단백질의 변이체는 IAKSEXEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRXLIETNGETGEIVXDKGRDFATVRKVLSMPXVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKXMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD(서열번호 9), IAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRXLIETNGETGEIVXDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD(서열번호 10), IAKSEXEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRXLIETNGETGEIVXDKGRDFATVRKVLSMPXVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKXMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD(서열번호 11), 및 IAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRXLIETNGETGEIVXDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD(서열번호 12) 중 선택된 아미노산 서열로 표현되고, 여기서, 상기 X는 임의의 표준 아미노산이고, 상기 Cas9 단백질의 변이체의 아미노산 서열은 서열번호 1 및 서열번호 2의 아미노산 서열과는 다름.
실시예 60, 서열한정
실시예 56 내지 실시예 59 중 어느 하나에 있어서, 상기 Cas9 단백질의 변이체는 IAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRDLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD(서열번호 3), IAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRDLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD(서열번호 4), IAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVLDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD(서열번호 5), IAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVLDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD(서열번호 6), IAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRDLIETNGETGEIVLDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD(서열번호 7), 및 IAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRDLIETNGETGEIVLDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD(서열번호 8) 중 선택된 아미노산 서열로 표현됨.
실시예 61, NLS 포함
실시예 56 내지 실시예 60 중 어느 하나에 있어서, 상기 Cas9 단백질의 변이체는 N말단 및/또는 C말단에 적어도 하나의 nuclear localization signal(NLS)이 융합된 것임.
신규 CRISPR/Cas 시스템
실시예 62, 가이드 RNA
다음을 포함하는 가이드 RNA:
crRNA로, 5'말단에서 3'말단 방향으로 가이드 도메인 및 직접 반복부(direct repeat)이 연결된 것; 및
tracrRNA,
여기서, 상기 crRNA의 직접 반복부 및 상기 tracrRNA는 스트렙토코커스 피오게네스 유래의 Cas9 단백질 또는 상기 Cas9 단백질의 변이체와 상호작용하여 복합체를 형성할 수 있으며,
상기 가이드 도메인은 미리 결정된 표적서열을 표적화할 수 있음.
실시예 63, 싱글 가이드 RNA
실시예 62에 있어서, 상기 가이드 RNA는 5'말단에서 3'말단 방향으로 상기 crRNA 및 상기 tracrRNA가 링커를 통해 연결된 싱글 가이드 RNA임.
실시예 64, 링커 한정
실시예 63에 있어서, 상기 링커는 5'-GAAA-3'임.
실시예 65, 싱글 가이드 RNA 스캐폴드 서열 한정
실시예 64에 있어서, 상기 가이드 RNA는 5'말단에서 3'말단 방향으로 가이드 도메인 및 스캐폴드가 순차적으로 연결된 것이며,
상기 스캐폴드는 5'말단에서 3'말단 방향으로 상기 직접 반복부, 링커, 및 tracrRNA가 연결된 것이며,
상기 스캐폴드는 UUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(서열번호 15)의 핵산 서열 또는 상기 핵산 서열과 80% 이상, 85% 이상, 90% 이상, 또는 95% 이상 일치하는 핵산 서열로 표현됨.
실시예 66, 스캐폴드 서열 한정
실시예 64에 있어서,
상기 crRNA의 직접 반복부는 GUUUUAGAGCUA(서열번호 13)의 핵산 서열 또는 상기 핵산 서열과 80% 이상, 85% 이상, 90% 이상, 또는 95% 이상 일치하는 핵산 서열로 표현되고,
상기 tracrRNA는 UAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(서열번호 14)의 핵산 서열 또는 상기 핵산 서열과 80% 이상, 85% 이상, 90% 이상, 또는 95% 이상 일치하는 핵산 서열로 표현됨.
실시예 67, CRISPR/Cas 복합체
다음을 포함하는 CRISPR/Cas 복합체:
실시예 56 내지 실시예 61 중 선택된 어느 하나의 Cas9 단백질 변이체; 및
실시예 62 내지 실시예 66 중 선택된 어느 하나의 가이드 RNA,
여기서, 상기 가이드 RNA는 상기 Cas9 단백질 변이체와 상호작용하여 복합체를 형성함.
실시예 68, CRISPR/Cas 각 구성요소 발현 벡터
다음을 포함하는 CRISPR/Cas 시스템의 각 구성요소를 발현하는 벡터:
실시예 56 내지 실시예 61 중 선택된 어느 하나의 Cas9 단백질 변이체를 암호화하는 핵산; 및
실시예 62 내지 실시예 66 중 선택된 어느 하나의 가이드 RNA를 암호화하는 핵산,
여기서, 상기 가이드 RNA는 상기 Cas9 단백질 변이체와 상호작용하여 복합체를 형성할 수 있음.
실시예 69, CRISPR/Cas 조성물
다음을 포함하는 CRISPR/Cas 조성물:
실시예 56 내지 실시예 61 중 선택된 어느 하나의 Cas9 단백질 변이체 또는 상기 Cas9 단백질 변이체를 암호화하는 핵산; 및
실시예 62 내지 실시예 66 중 선택된 어느 하나의 가이드 RNA, 또는 상기 가이드 RNA를 암호화하는 핵산,
여기서, 상기 가이드 RNA는 상기 Cas9 단백질 변이체와 상호작용하여 복합체를 형성함.
신규 CRISPR/Cas 시스템을 사용한 유전자 편집 방법
실시예 70, 유전자 편집 방법
다음을 포함하는 세포 내 표적 유전자 편집 방법:
실시예 67의 CRISPR/Cas 복합체, 실시예 68의 CRISPR/Cas 시스템의 각 구성요소를 발현하는 벡터, 및/또는 실시예 69의 CRISPR/Cas 조성물을 상기 세포에 도입하는 과정,
여기서, 상기 가이드 RNA에 포함된 상기 가이드 도메인은 상기 세포 내 상기 표적 유전자의 표적 서열을 표적화함.
이하, 실험예 및 실시예를 통해 본 명세서가 제공하는 발명에 대해 더욱 상세히 설명한다. 이들 실시예는 오로지 본 명세서에 의해 개시되는 내용을 예시하기 위한 것으로, 본 명세서에 의해 개시되는 내용의 범위가 이들 실시예에 의해 제한되는 것으로 해석되지 않는 것은 당업계에서 통상의 지식을 가진 자에게 있어서 자명할 것이다.
실험예 1. 스크리닝 시스템 셋업
실험예 1.1. 실험방법 및 재료
UBC 프로모터 클로닝
HEK293T 세포의 gDNA를 이용하여 UBC 프로모터 서열에 대한 PCR을 진행하였다. 그 후, Gibson assembly를 통해 플라스미드 클로닝을 진행하였다.
플라스미드 구축
NLS, NES cloning 및 변형된 UBC 프로모터 클로닝은 모두 Gibson assembly를 통해 수행하였다.
세포 배양 및 형질감염(transfection)
DMEM (10% FBS, 1% penicillin streptomycin)을 사용하여 37°C, 5% CO2 환경에서 HEK293T 세포를 배양하였다. Cas9 plasmid 500 ng, sgRNA plasmid 500 ng, Lipofectamin2000 2μl를 사용하여 HEK293T 세포 1x105에 형질감염(transfection)을 수행하였다. 형질감염 후 2일 또는 3일 후 gDNA prep을 진행하여 targeted deep sequencing 실험을 진행하였다.
Stable cell line 제작
1. Cas9 plasmid 1μg, transposase vector 1μg, Lipofectamin2000 2μl을 사용하여 2x106 HeLa 세포에 형질감염을 수행하였다.
2. 형질감염 다음날부터 Blasticidine selection을 5μg/ml로 진행하였다.
3. 2주정도 selection 후 HPRT sgRNA plasmid 500ng, lipofectamine2000 1μl을 사용하여 stable cell 1x105에 형질감염을 수행하였다.
4. 2일 후 gDNA prep하여 targeted deep sequencing를 진행하였다.
qPCR을 이용한 Copy number 확인
1. 상기 방법에 따라 2주정도 selection한 stable cell line에서 RNA를 완전 제거하고 gDNA prep을 수행하였다.
2. piggybac copy number kit의 프라이머를 사용하여 qPCR을 진행하였다.
3. 상기 qPCR 결과를 토대로 copy number를 계산하였다.
실험예 1.2. 실험 개요
인위적으로 SpCas9이 전달이 잘되지 않는 환경을 만들기 위해 핵외수송신호 (Nuclear export signal, NES)과 유전자 가위가 적게 발현될 수 있는 low expression promoter를 이용하였다.
HPRT는 6TG라는 물질을 toxic한 물질로 변하는 대사과정에 참여하는 유전자로 이 연구는 HPRT를 Sp Cas9으로 knock out 시킴으로써 6TG 환경에서 cell이 살아남게 만들 수 있다. 즉 Cas9이 잘 전달되지 않는 환경을 만들어서 HPRT를 효과적으로 Knock out하는 Cas9 mutant를 6TG 처리를 통해 스크리닝 할 수 있다.
실험예 1.3. Nuclear export signal의 효과 확인
실험예 1.1의 실험방법을 참조하여, Nuclear Localization Sequence (NLS) 가 양끝에 존재하는 경우, NLS가 한쪽 끝에 있는 경우, signal peptide가 없는 경우, NES(서열번호 89)가 한쪽 끝에 있는 경우, 및 NES가 양끝에 존재하는 경우에 대해 Cas9의 HPRT 유전자에 대한 인델 도입 활성 변화를 측정하였다(도 3).
실험 결과, 양끝에 NES가 존재할 경우 인델 도입 비율이 가장 낮게 나오는 것을 확인하였다. 따라서, Cas 단백질의 양 끝에 NES를 융합한 융합 단백질을 사용하는 것으로 결정하였다.
실험예 1.4. 저발현 프로모터의 선택
상기 Cas 단백질의 양 끝에 NES를 융합한 단백질에 더하여, 저발현 프로모터를 사용하여 0.1%의 인델 활성이 나오는 낮은 전달율의 환경을 만들고자 하였다.
참고문헌을 통해 Mammalian cell expression promoter 발현 정도를 보았을 때, HEK293T cell에서 UBC 프로모터를 사용하면 발현율을 가장 많이 낮출 수 있을 것으로 판단하고(도 4), 실험적으로 확인을 진행하였다.
실험예 1을 참조하여, NLS, NES와 각각 융합시킨 Cas9 단백질의 EMX1 인델 활성을 측정하였다. 실험예 1.4에 사용한 표적서열 및 가이드 RNA 서열은 다음 [표 1]에 나타낸 바와 같다:
Label Cas structure Promoter Target guide RNA
2NLS+EMX1 NLS-SpCas9-NLS CMV promoter AAGAAGAAGGAGTAACATCC
(SEQ ID NO: 38)
GAGTCCGAGCAGAAGAAGAAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT
(SEQ ID NO: 64)
2NES+EMX1 NES- SpCas9-NES CMV promoter
UBC 2NES+EMX1 NES- SpCas9-NES UBC promoter
여기서, 상기 SpCas9은 서열번호 1의 Cas9 단백질, NLS는 서열번호 22의 Nuclear localization signal이며, NES는 서열번호 89의 Nuclear export signal임.실험 결과, UBC 프로모터를 사용하고, NES를 융합시킨 Cas9 단백질의 경우 인델 도입 비율이 1.78%로, CMV 프로모터를 사용했을 때보다 월등히 낮아지는 것을 확인하였다(도 5).
실험예 1.5. 프로모터 사이즈 변형
프로모터에서 비교적 덜 중요한 부분을 제거하면 발현 수준을 낮출 수 있다고 알려져 있다. 본 명세서 발명자들은 참고문헌을 통해 변형된 UBC 프로모터 후보를 선정하고, 이에 따른 인델 도입 활성 변화를 확인하고자 하였다. 일반적으로 사용되는 UBC 프로모터는 프로모터 부분에 단백질을 암호화하지 않는 Exon1과 intron이 붙어있는 형태로 사용되고 있다. 선행연구에 따르면, intron 부분을 제거하거나, Exon1 및 intron 모두를 제거하는 경우, 발현 수준이 감소하는 것으로 알려져 있다. 이러한 UBC 프로모터에 대한 변형 방법을 도 6에 모식적으로 나타냈다. 실험예 1을 참조하여, UBC 프로모터의 변이체를 사용하는 경우 EMX1 유전자에 인델을 얼마나 도입하는 지 측정했다. 본 실험에 사용한 Cas 단백질 및 프로모터의 구성은 [표 2]에 나타냈다.
Label Cas structure Promoter Target guide RNA
WT Cas9 NLS-SpCas9-NLS CMV promoter AAGAAGAAGGAGTAACATCC
(SEQ ID NO: 38)
GAGTCCGAGCAGAAGAAGAAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT
(SEQ ID NO: 64)
UBC_2NES NES- SpCas9-NES UBC promoter
UBC_Exon1_2NES NES- SpCas9-NES UBC Exon 1(SEQ ID NO: 17)
UBC_mini_2NES NES- SpCas9-NES UBC mini(SEQ ID NO: 18)
여기서, 상기 SpCas9은 서열번호 1의 Cas9 단백질, NLS는 서열번호 22의 Nuclear localization signal이며, NES는 서열번호 89의 Nuclear export signal임.실험 결과는 도 7에 나타냈다. 실험 결과, UBC 프로모터에서 Exon1과 intron 부분을 제거할수록 인델 도입 비율이 감소하는 것을 확인하였다.
본 발명 발명자들은 상기 변형 외 추가적인 변형을 통해 더 낮은 발현율을 달성하기 위한 연구를 진행하였다. 상기 발명자들은 UBC 프로모터의 transcription factor binding site를 찾았고, 그 중 5'쪽에 위치한 SP1 binding site와 PPARβ binding site를 제거하여 발현율이 더 낮아지는 지를 확인하고자 하였다. 상기 binding site를 제거한 UBC 프로모터에 대한 모식도를 도 8에 나타냈다. 실험예 1.1을 참조하여, UBC 프로모터의 transcription factor binding site를 제거한 UBC 프로모터 변이체를 사용하는 경우 EMX1 유전자에 대해 인델을 얼마나 도입하는 지 측정하였다. 본 실험에 사용한 Cas 단백질 및 프로모터 구성은 [표 3]에 나타내었다.
Label Cas structure Promoter Target guide RNA
mini UBC NES- SpCas9-NES UBC mini
(SEQ ID NO: 18)
AAGAAGAAGGAGTAACATCC
(SEQ ID NO: 38)
GAGTCCGAGCAGAAGAAGAAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT
(SEQ ID NO: 64)
243 UBC NES- SpCas9-NES UBC 243
(SEQ ID NO: 19)
208 UBC NES- SpCas9-NES UBC 208(SEQ ID NO: 20)
여기서, 상기 SpCas9은 서열번호 1의 Cas9 단백질, NLS는 서열번호 22의 Nuclear localization signal이며, NES는 서열번호 89의 Nuclear export signal임.실험 결과 SP1 binding site만 제거한 UBC 243이 가장 낮은 인델 효율을 보이는 것을 확인하였다(도 9).
실험예 1.6. Stable cell line에서의 활성 확인
실험예 1.5에서 진행한 실험은 플라스미드를 사용하여 고농도로 형질감염(transfection) 시켜서 확인한 결과이기 때문에, 실제 스크리닝 방법을 수행할 때의 조건과는 다소 상이하다. 따라서, 실제 스크리닝에 사용하는 Stable cell line에서 상기 NES-Cas 융합 단백질 구조 및 상기 저발현 프로모터가 의도한 대로 기능하는 지 확인하고자 하였다.
UBC 프로모터, UBC_mini (서열번호 18) 프로모터, 및 UBC 243(서열번호 20) 프로모터에 대해 피기백 시스템(piggybac system)을 이용하여 HeLa stable cell line을 제작하고 HPRT 유전자를 표적으로 인델 발생 실험을 수행하였다. 실험에 사용한 Cas 단백질, 가이드 RNA 및 프로모터 구성은 [표 4]에 나타냈다.
Label Cas structure Promoter Target guide RNA
UBC full NES- SpCas9-NES UBC promoter
(SEQ ID NO: 16)
CGAGATGTGATGAAGGAGA
(SEQ ID NO: 37)
GCGAGATGTGATGAAGGAGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT
(SEQ ID NO: 64)
UBC mini NES- SpCas9-NES UBC mini
(SEQ ID NO: 18)
UBC 243 NES- SpCas9-NES UBC 243(SEQ ID NO: 19)
여기서, 상기 SpCas9은 서열번호 1의 Cas9 단백질, NLS는 서열번호 22의 Nuclear localization signal이며, NES는 서열번호 89의 Nuclear export signal임.실험 결과, 실험예 1.5에서 진행한 플라스미드 실험 결과에 비해 모두 낮은 인델 활성을 보였으며, UBC 243 프로모터를 사용한 결과 가장 낮은 활성을 보였다(도 11). 다만, 상기 UBC 243 프로모터를 사용한 결과는 PCR 에러로 실제로는 인델이 발생하지 않았을 가능성이 있다.
또한, 각 stable cell line에 대해 copy number를 확인해본 결과 대략 20 copy 이상이 들어가 있는 것을 확인하였다. 실제 스크리닝 방법에는 세포 당 하나의 Cas 단백질에 대해 1 copy가 들어가도록 할 예정이기 때문에, UBC mini를 사용하는 것이 바람직할 수 있다.
실험예 2. 고활성의 Cas9 단백질 후보군 스크리닝
실험예 2.1. 실험방법 및 재료
Cell culture and transfection
1. DMEM (10% FBS, 1% penicillin streptomycin) media 사용하여 150pi 총 18판에 HeLa cell 2x10^6으로 culture(Sniper 1,2,3 각 각 6판씩 사용)
2. 하루 뒤에 각 150pi 당 piggy-UBC mini-sniper plasmid 2ug, transposase 2ug, lipofectamine2000 8ul로 transfection
3. 3일 뒤 puromycin 2ug/ml 처리
4. 3일 뒤 cell counting 후 sub culture
5. 2일 뒤 각 library 6판을 합쳐서 150pi 2판씩 4x10^6으로 culture
6. 2주간 puromycin 2ug/ml로 sub culture하며 selection 진행
HPRT sgRNA transfection and 6TG selection
1. Sniper library 1, 2, 3 각 각 4x106 cell을 3판의 150pi dish에 배양하였다.
2. 하루 뒤 HPRT sgRNA 20ug, lipofectamine 60ul로 형질감염시켰다.
3. 3일 뒤 6TG 30uM를 처리하였다.
4. 3주 동안 subculture 진행하며 살아남은 세포를 선별하였다.
5. 선별된 세포의 colony 개수를 확인하였다.
실험예 2.2. Sniper library 제작 (Vector change)
실험예 2.1 및 실험예 1.1을 참고하여, 기존 Sniper 2.0 screening (한국출원 '출원번호: 10-2020-0125191' 참고)에서 사용하였던 각기 다른 방법으로 제작한 Sniper library 3종류(이하 Sniper1, Sniper2, Sniper3)에 UBC mini 프로모터를 작동적으로 연결시켜 벡터를 구성하였다.
구체적으로, 상기 라이브러리 구성에 사용된 벡터는 NES-Cas단백질-NES 구조의 융합 단백질을 발현할 수 있으며, UCB mini 프로모터가 상기 융합 단백질을 발현할 수 있도록 작동적으로 연결되어 있다. 상기 Cas 단백질은 각각 상기 Sniper library 3종류에 포함된 Cas 후보 단백질과 같다.
상기 라이브러리 구성에 사용된 벡터를 실험예 2.1을 참조하여 HeLa cell에 형질감염시켜 라이브러리를 구성하였다.
실험예 2.3. Copy number 계산 결과
실험예 1.1을 참조하여, 실험예 2.2에서 구성한 라이브러리 내 평균적인 copy number 수를 측정하였다. 측정 결과는 다음 [표 5]에 나타내었다.
PB UCR PB-UCR 2^ -(PB-UCR) copy number copy number (average)
Sniper library 1 1st 23.819 25.684 -1.86464 3.641773 7.283547 5.2
2nd 24.246 26.844 -2.59866 6.05722 3.02861
Sniper library 2 1st 25.961 29.489 -3.52769 11.53296 23.06592 13.3
2nd 26.3 29.156 -2.85528 7.236458 3.618229
Sniper library 3 1st 24.474 27.336 -2.86262 7.273337 14.54667 9.6
2nd 23.9 27.146 -3.2461 9.487958 4.743979
실험은 2번 반복하여 얻어진 copy number의 평균을 구하였다.실험예 2.4. 6TG selection 결과
실험예 2.2에서 얻어진 라이브러리 세포주에 대해, 실험예 2.1에 따른 방법으로 HPRT 유전자를 표적화하는 가이드 RNA를 형질감염 시킨 후, 6TG 환경에서 배양하여 HPRT 유전자에 인델이 발생하여 녹-아웃 된 세포만을 선별하였다. 선별 결과, 각 Sniper library 별로 생존한 세포 콜로니의 수는 다음과 같았다:
Sniper library 1 : 7개
Sniper library 2 : 2개
Sniper library 3 : 0개
실험예 2.5. Sniper library cloning
실험예 2.4에서 선별된 세포 콜로니의 세포에서 각각 genomic DNA를 추출하고, 상기 gDNA를 주형으로 하여 기존과 같은 벡터에 Gibson assembly 방식으로 클로닝을 진행하였다. 그 후 Full sequencing을 통해 각 라이브러리에서 확인된 각 Cas 단백질 변이체의 개수를 확인하였으며, 확인 결과 상기 Sniper library 1에서는 73개, Sniper library 2에서는 28개의 Sniper Cas 단백질의 변이체를 확인할 수 있었다.
시퀀싱을 통하여 중복된 변이, 침묵 변이(silent mutation) 및 Sniper Cas 단백질 서열 앞부분에 stop codon이 존재하는 경우를 제외하고, 고활성의 Sniper Cas9 단백질 변이체 후보군을 특정하였다. 상기 특정된 후보군은 [표 6]에 나타내었다.
Label Library Mutation site
43 Sniper library 1 R635H, P1061R
88 niper library 1 Q402H
103 niper library 1 R1212H
108 niper library 1 P1061R
85 niper library 1 W1074stop
82 niper library 1 R1019C, W1074stop
42 niper library 1 P1061R, W1074stop
187 Sniper library 2 V20M, Q83H, V931M, V975G, Q1091H
135 Sniper library 2 R467W, R635C, G660D, N692I, Q1027R
152 Sniper library 2 Y128N, L642M, L680M, D835H
실험예 2.6. indel frequency check
상기 10개의 고활성 Cas 후보 단백질에 대해, 실험예 2.1을 참조하여, HEK294T stable cell line에서 각각 24개의 표적에 대한 인델 도입 활성을 확인하였다. 이때, 형질감염(transfection) 시킨 벡터의 농도는 50ng이었다.
각각의 표적 서열은 다음 [표 7]에 나타낸 바와 같다:
Label Target sequence SEQ ID NO
Target 1 AAGAAGAAGGAGTAACATCC 39
Target 2 CTGTGCTCTTTGCTCTCTCA 40
Target 3 TTTCATTACAATCGCGTGGC 41
Target 4 GTACCACCGGATGGGACTGG 42
Target 5 GTACGGGTGGCTCTCAAGCG 43
Target 6 TGCTGACCGCGATGCCTACC 44
Target 7 ACCGTCTGTGGATAGGAGAG 45
Target 8 GCCTCGGGGCTGAGCGTGCG 46
Target 9 CTCTGTTGAAAAAGAGAACT 47
Target 10 GCTGCCGACTCCGGTGCCGT 48
Target 11 GATCACTGTCAACTACGGCT 49
Target 12 GTGCTGCGGTTGTCCCATTG 50
Target 13 CAGCCTGTACAGCGGCCTGC 51
Target 14 CGGGAGGAAACCCTACAACC 52
Target 15 TCACCCTTTTCCTCTTGGGG 53
Target 16 ACAGATGCCCAGCGGGTAGC 54
Target 17 TTGTGAAGTAATCTTAGGGT 55
Target 18 AGAACCCGAGTGCTGCTTGG 56
Target 19 GCGGAAGCCCGACGGTTGCT 57
Target 20 ACCTGCGAGGCGGCCCACTT 58
Target 21 CGTAGGTCACCAGAAAGCAG 59
Target 22 TCGGTCTTGGGCGCGCTCTG 60
Target 23 GTGTAGCTGGCGTAATCTGT 61
Target 24 GCACCCTAAGGGGGGAGAAA 62
여기서, 각각의 표적 서열에 대해 사용한 가이드 RNA는 상기 5'말단에서 3'말단 방향으로, 표적서열 및 서열번호 15의 가이드 RNA 스캐폴드 서열이 연결된 것과 같으며, 서열번호 65 내지 서열번호 88에 개시된 바와 같다.이 중 Wild-type Sniper Cas9에 비해 높은 인델 효율을 보이는 Sniper Cas9 변이체는 표 6의 108, 42, 82, 85 변이체였으며, 이에 대한 인델 발생 실험 결과는 다음 [표 8]에 나타냈다.
Label More than minimum frequency Insertions Deletions Indel frequency
Sniper #1 55087 167 266 0.79
Sniper #2 84858 174 325 0.59
Sniper #3 72322 167 260 0.59
Sniper average 70755.67 169.33 283.67 0.65
108 #1 64270 397 507 1.41
108 #2 73970 281 479 1.03
108 #3 75586 278 369 0.86
108 average 71275.33 318.67 451.67 1.10
42 #1 81803 560 1174 2.12
42 #2 56966 493 792 2.26
42 #3 - - - -
42 average 69384.5 526.5 983 2.19
82 #1 64305 529 848 2.14
82 #2 92560 702 1342 2.21
82 #3 77204 531 1167 2.20
82 average 78023 587.33 1119 2.18
85 #1 14444 244 314 3.86
85 #2 57709 744 1268 3.49
85 #3 39317 558 885 3.67
85 average 37156.67 515.33 822.33 3.67
상기 표의 Label에서, Sniper는 Wild-type Sniper Cas9, 앞의 숫자는 표 7에 개시한 레이블과 같으며, #1, #2, #3은 각 실험 횟수를 의미한다. 또한, average는 각 실험 결과의 평균을 의미한다.실험 결과, 50ng이라는 낮은 농도에서 1061 혹은 1074에 mutation 된 Sniper Cas9 변이체가 다른 Cas9 변이체 후보 단백질보다 높은 인델 도입 효율을 보여주었으므로, 상기 1061 또는 1074 자리가 Cas9 단백질의 활성에 큰 영향을 주는 위치라고 추측할 수 있었다.
실험예 3. 고활성의 Cas9 단백질 특정
실험예 3.1. 실험재료 및 방법
Cas 변이체 후보군 제작
1. 변이 위치에 NNN을 넣은 프라이머를 디자인하고, PCR을 이용하여 상기 변이 위치 부분에 mutation fragment를 제작하였다.
2. 상기 PCR fragment를 Gibbson assembly를 통하여 벡터를 제작했다.
3. transformation을 통하여 클로닝 한 뒤에 Ampicillin 이 함유된 agar plate에 분주 및 spreading. 그리고 37도에서 하룻밤 반응시켰다.
4. 다음 날 콜로니 확인 후, 각각의 콜로니에 대해 mini-prep을 진행했다.
5. mini-prep 후 생산된 각각의 플라스미드를 시퀀싱하여 상기 변이 위치에 mutation이 삽입되었는 지 확인하였다.
세포배양 및 Cas 변이체 후보군 형질감염
1. DMEM (10% FBS, 1% penicillin streptomycin)을 사용하여 37°C, 5% CO2 환경에서 HEK293T를 배양하였다.
2. 위에서 제조된 Cas 변이체 후보군을 발현할 수 있는 플라스미드 50ng 및 Lipofectamin2000 1ul를 HEK293T cell 2 x 105에 형질감염(transfection) 시켰다.
3. 형질감염 1일 후 배지를 DMEM으로 교환하였고, 3일 후에 gDNA prep을 진행하여 targeted deep sequencing을 수행하였다.
Cas 변이체 후보군에 대한 농도별 형질감염
1. DMEM (10% FBS, 1% penicillin streptomycin)을 사용하여 37°C, 5% CO2 환경에서 HEK293T를 배양하였다.
2. 위에서 제조된 Cas 변이체 후보군을 발현할 수 있는 플라스미드를 실험군 별로 각각 10ng, 100ng, 1000ng 사용하고, Lipofectamin2000 1ul와 함께 HEK293T cell 2 x 105에 형질감염(transfection) 시켰다.
3. 형질감염 1일 후 배지를 DMEM으로 교환하였고, 3일 후에 gDNA prep을 진행하여 targeted deep sequencing을 수행하였다.
실험예 3.2. Site saturation mutation
실험예 2를 통해, Sniper Cas9 및 Streptococcus pyogenes 유래 Cas9(이하, SpCas9) 단백질의 아미노산 서열 중 1061번째 아미노산 및 1074번째 아미노산이 상기 Cas9 단백질의 활성에 중요한 역할을 하는 것을 확인하였다.
해당 위치의 아미노산을 다른 표준 아미노산 또는 Stop codon을 삽입한 변이체에 대한 효과를 확인하고자, [표 7]에 개시된 24개 표적에 대해 각 Cas9 변이체 단백질의 인델 도입 비율을 확인하였다.
구체적으로, Sniper Cas9의 1061번째 아미노산을 프롤린이 아닌 다른 아미노산, 또는 Stop codon으로 치환한 Cas9 변이체, 및 Sniper Cas9의 1074번째 아미노산을 트립토판이 아닌 다른 아미노산, 또는 Stop codon으로 치환한 Cas9 변이체에 대해, 실험예 3.1을 참조하여 플라스미드 벡터를 제조하고, HEK293T 세포에 [표 7]의 표적서열을 표적화하는 싱글 가이드 RNA를 암호화하는 벡터와 함께 형질감염하여 그 인델 발생 빈도를 측정하였다 (도 12 및 도 13).
실험 결과, Sniper Cas9(서열번호 2)의 1061 위치의 아미노산을 아스파르트 산으로 치환한 P1061D 변이체(서열번호 4), 및 1074 위치의 아미노산을 류신으로 치환한 W1072L 변이체(서열번호 6)가 인델 활성이 높은 것으로 나타났다.
실험예 3.3. 농도별 indel 발생 비율 비교
실험예 3.1을 참조하여, Sniper Cas9 및 SpCas9 변이체의 [표 7]의 표적서열에 대한 농도 별 인델 도입 빈도를 측정하였다. 각각의 변이체 구성은 다음 [표 9]에 나타냈다.
Label Mutation site SEQ ID NO
Sniper Cas9 - 2
1061 Asp Sniper Cas9 P1061D 4
1074 Leu Sniper Cas9 W1074L 6
1061 1074 double mutation sniper Cas9 P1061D, W1074L 8
WT Cas9 - 1
1061 Asp SpCas9 P1061D 3
1074 Leu SpCas9 W1074L 5
1061 1074 double mutation SpCas9 P1061D, W1074L 7
실험 결과는 도 14 및 도 15에 나타냈다.실험 결과, 선별한 Cas9 변이체가 대체로 Sniper Cas9, 또는 SpCas9과 비교하여 동등하거나 더 높은 인델 발생 효율을 보이는 것으로 나타났다.
가실험예 1. 더미벡터를 이용한 스크리닝 방법
더미벡터(Dummy vector)를 사용함으로써 stable cell line에서 integration된 mutant spCas9 copy수를 최소화하고, 스크리닝 효율을 더욱 높일 수 있다. 상기 더미벡터를 사용하는 스크리닝 방법의 구체적인 조건을 결정하기 위하여 다음과 같은 실험을 진행한다.
가실험예 1.1. 더미벡터 준비
스크리닝에 사용할 spCas9 mutant library가 들어있는 vector와 동일한 사이즈의 더미를 준비한다. vector에서 spCas9 sequence 부분을 restriction enzyme을 통해 제거하고 동일한 사이즈의 sequence를 gDNA PCR을 통해 확보한다. 이후 Gibson assembly를 통해 일반 spCas9용, Base editor용, Prime editor용 dummy vector 3종을 준비한다.
가실험예 1.2. 공벡터(empty vector) 준비
cloning 편의와 wt spCas9이 스크리닝에 영향을 끼칠 부분을 줄이기 위하여 spCas9 mutant library를 클로닝 할 empty vector를 Gibson assembly를 통해 준비한다.
가실험예 1.3. 더미벡터를 사용하는 스크리닝 방법에 사용할 저발현 프로모터 선정
N말단 및 C말단에 NES를 1개씩 둔 상태에서 CMV, UBC, UBC exon1, UBC mini, UBC 243, UBC 208 프로모터 6종을 stable cell line으로 만들어 개선된 스크리닝 환경에서 사용할 프로모터를 선정하고자 한다. 아래 방식으로 Dummy vector를 사용한 Stable cell line 제작하고 indel test를 진행한다.
1. 실험예 1을 참조하여, Dummy vector 1.8ug, spCas9 200ng, transposase vector 2ug, lipofectamin2000 8ul를 사용하여 2x106 HeLa 세포에 형질감염을 수행한다.
2. 형질감염 다음날부터 puromycin selection을 2ug/ml로 진행한다.
3. 2주정도 selection 후 HPRT1 sgRNA plasmid 500ng, lipofectamin2000 1ul를 사용하여 stable cell 1x105에 형질감염을 수행한다.
4. 2일 후 gDNA prep하여 targeted deep sequencing을 진행한다.
5. 가실험예 3의 베이스 에디터 및 프라임 에디터에 대해서 위와 동일한 실험을 반복한다.
6. Indel 분석을 통해 스크리닝에 사용할 최적의 프로모터를 선정한다.
가실험예 2. 고활성의 베이스 에디터 또는 프라임 에디터 후보군 스크리닝 방법
실험예 1 지내 실험예 3, 및 가실험예 1을 참조하여, 베이스 에디터 및 프라임 에디터에 대해서도 후보군을 효율적으로 선별할 수 있는 지 확인한다. 여기서, 베이스 에디터의 경우 HPRT1 유전자의 개시 코돈(start codon)의 염기를 치환하여 녹아웃(knock-out)하는 전략을 사용하고, 프라임 에디터의 경우 HPRT1 유전자의 앞쪽 exon 부분을 교정대상 서열로 하여, 정지 코돈(stop codon)을 포함하는 교정서열을 삽입하여 제대로 발현되지 못하게 하는 전략을 사용한다. 상기 전략에 따라 유전자가 교정되는 경우, 6TG 환경에서 세포를 배양함으로써 세포를 선별할 수 있다.
1. HeLa cell 8x104에 250ng sgRNA plasmid(Prime editor의 경우 epegRNA plasmid), Base editor 또는 Prime editor plasmid 250ng, lipofectamin2000 1ul을 사용하여 형질감염을 수행한다.
2. 형질감염을 한지 2일 후 gDNA를 prep한다.
3. 형질감염을 한지 7일 후 30uM 6-TG selection을 시작한다.
4. 약 2주간 6-TG selection을 진행 후 gDNA를 prep한다.
5. Prep한 gDNA를 사용하여 targeted deep sequencing을 진행한다.
6. Editing rate 분석을 통해 형질감염 2일 후 gDNA에 비해 2주 6-TG selection을 진행한 gDNA에서 editing rate가 높게 나오는 것을 확인 함으로써 6-TG selection이 가능함을 증명한다.
가실험예 3. SpCas9 변이체를 포함하는, 고활성의 베이스 에디터 또는 프라임 에디터 선별 방법
가실험예 3.1. 스크리닝 라이브러리 제작
가실험예 1을 통해 선정된 저발현 프로모터를 가진 공벡터(empty vector)를 restriction enzyme으로 cut한 후 gel purification을 진행한다. 그리고 Mutant library gene fragment를 사용한 Gibson assembly를 진행한다. 최대한 다양한 mutant library vector를 제작하기 위하여 electroporation을 통해 E.coli 형질전환을 수행한다. Library의 다양성이 충족되었는지는 E.coli의 colony수를 통해 파악한다.
가실험예 3.2. Stable cell line 제작 및 6TG selection
1. Dummy vector 1.8ug, Library vector 200ng, transposase vector 2ug, lipofectamin2000 8ul를 사용하여 2x106 HeLa 세포에 형질감염을 수행한다.
2. 형질감염 다음날부터 puromycin selection을 2ug/ml로 진행한다.
3. 2주정도 selection 후 HPRT1 sgRNA plasmid 20ug, lipofectamin2000 40ul를 사용하여 stable cell 4x106에 형질감염을 수행한다.
4. 형질감염을 수행한지 최소 일주일 이상 되도록 배양을 진행한다.
5. HPRT1 sgRNA 형질감염이 된 stable cell 4x106에 6-TG 30uM로 selection을 시작한다.
6. Colony가 형성될 때까지 6-TG 30uM 환경에서 지속적으로 selection을 진행한다.
7. Colony를 떼어내고 다시 6-TG 30uM 환경에서 selection을 진행한다.
8. 최종적으로 selection된 cell의 gDNA를 prep한다.
9. Targeted deep sequencing을 통해 최종 editing rate를 확인한다.
10. Copy number qPCR을 통해 integration 되어있는 copy수를 확인한다.
가실험예 3.3. 콜로니 시퀀싱 및 NGS 분석
1. 스크리닝을 통해 확보한 gDNA를 사용하여 spCas9 full sequence에 대한 PCR을 진행한다.
2. Gibson assembly를 통해 CMV 2NES vector에 cloning 한다.
3. Gibson assembly 반응액 1~2ul를 heat E.coli transformation 한다.
4. E.coli colony에 대하여 spCas9 sequence가 잘 들어가 있는지 1차 sequencing을 진행하여 self가 아닌 것들만 100개 골라낸다.
5. 골라낸 산물들은 재 sequencing을 의뢰하여 spCas9 full sequence에 대하여 mutation 분석을 진행한다.
6. colony sequencing 분석은 NGS 분석으로 대체하거나 혹은 NGS 분석 결과를 바탕으로 sequencing 수를 줄일 수도 있다.
7. NGS 분석을 진행하기 위해서 먼저 스크리닝된 gDNA를 사용하여 spCas9 full sequence를 PCR을 한다.
8. PCR 산물을 gel purification을 진행한다. 이 때 농도를 최대한 확보하며 elution volume이 55ul를 넘지 않도록 한다. Total 산물이 최소 1ug이 되는 것이 좋다.
9. covaris를 통해 325bp 크기로 DNA를 자른다.
10. 자른 1ug DNA는 바로 NEBnext ultra II library kit를 이용하여 library 제작을 진행한다.
11. 1X Ampure XP Bead prep을 진행한다. 최종 Elution은 50ul PCR reaction에 모두 사용할 수 있도록 맞춘다.
12. 최종 NGS 분석을 진행하고 데이터 분석을 진행한다. (아미노산 별 mutation read수 또는 % 자료 등)
가실험예 3.4. 변이체 활성 테스트
1. colony sequencing/NGS를 통해 얻은 상위 rank mutant 결과를 이용하여 activity실험에 사용할 mutant들을 선별한다.
2. 실험에 사용할 mutant들은 직접 cloning을 진행하거나 colony sequencing을 통해 얻는다. (낮은 발현 환경의 Cas9을 사용하여야 하기 때문에 CMV 2NES vector를 그대로 사용한다.)
3. 24개 target에 대해 동시에 분석할 수 있는stable HEK293T cell stock을 풀어서 배양한다.
4. 배양한 cell 1x105 cell에 cas9 mutant vector 500ng, lipofectamin2000 1ul 사용하여 형질감염을 수행한다.
6. 형질감염 2-3일 후에 direct PCR lysis reagent를 통해 gDNA를 추출한다.
7. 1ul의 gDNA를 사용하여 targeted deep sequencing을 진행한다.
8. 1차 분석에서는 1반복으로 하고, activity가 증가된 것으로 여겨지는 것은 추가적으로 3반복 실험을 진행한다.
9. Prime editor의 경우 24개 target을 동시에 분석할 수 있는stable HEK293T cell 을 사용할 수 없기 때문에 1개 target을 이용하여 1차 적으로 activity 테스트 후, 최종적으로 mutant가 정해진다면 8개 정도 target에 대하여 activity test 3반복을 한다.
본 발명에서 개시하는 테스팅 벡터 및/또는 테스팅 세트를 사용한, Cas 후보 단백질 스크리닝 방법을 사용하면, 수많은 Cas 후보 라이브러리로부터 고효율의 Cas를 효과적으로 스크리닝 할 수 있다. 나아가, 본 발명의 종래 기술에 비해 실제 Cas 사용 환경에 가까운 환경 하 스크리닝을 수행할 수 있으므로, 생체 내에서 고효율로 작동하는 Cas 후보 단백질을 더 성공적으로 선별할 수 있다.

Claims (16)

  1. Cas 후보 단백질 스크리닝을 위한 테스팅 벡터로, 다음을 포함함:
    저발현 프로모터; 및
    NES-Cas 융합 단백질 암호화 핵산,
    여기서, 상기 저발현 프로모터 및 상기 NES-Cas 융합 단백질 암호화 핵산은 작동적으로 연결되어 있고,
    상기 NES-Cas 융합 단백질은 [구조식 1]로 표현되는 것임:
    [구조식 1]
    N1-C-N2
    여기서, 상기 N1은 제1 NES(nuclear export signal)이거나 부존재하고,
    상기 C는 상기 Cas 후보 단백질이고,
    상기 N2는 제2 NES(nuclear export signal)이거나 부존재하며,
    여기서, 상기 NES-Cas 융합 단백질은 적어도 하나의 NES를 포함함.
  2. 제1항에 있어서, 상기 저발현 프로모터는 UBC 프로모터인 테스팅 벡터.
  3. 제2항에 있어서, 상기 UBC 프로모터는 서열번호 16 중 선택된 핵산 서열을 가지는 테스팅 벡터.
  4. 제1항 내지 제3항 중 선택된 어느 하나에 있어서, 상기 제1 NES 및 상기 제2 NES는 각각 독립적으로 서열번호 89 내지 서열번호 104중 선택된 아미노산 서열을 가지는 테스팅 벡터.
  5. 제1항 내지 제4항 중 선택된 어느 하나에 있어서, 상기 Cas 후보 단백질은 Streptococcus pyogenes 유래 Cas9 단백질 또는 Streptococcus pyogenes 유래 Cas9 단백질의 변이체인 테스팅 벡터.
  6. Cas 후보 단백질 스크리닝을 위한 테스팅 세트로, 다음을 포함함:
    제1 테스팅 벡터로, 제1항 내지 제5항 중 선택된 어느 하나; 및
    제2 테스팅 벡터로, 제1항 내지 제5항 중 선택된 어느 하나,
    여기서, 상기 제1 테스팅 벡터의 상기 Cas 후보 단백질 및 상기 제2 테스팅 벡터의 상기 Cas 후보 단백질은 서로 다른 아미노산 서열을 가짐.
  7. 제1항 내지 제5항 중 선택된 어느 하나의 테스팅 벡터를 둘 이상 포함하는, Cas 후보 단백질 스크리닝을 위한 테스팅 세트.
  8. Cas 후보 단백질 스크리닝 방법으로, 다음을 포함함:
    (a) 제7항 중 선택된 어느 하나의 테스팅 세트를 세포에 처리하는 과정;
    (b) 상기 (a) 과정을 수행한 세포에 가이드 도메인을 포함하는 가이드 RNA 또는 상기 가이드 RNA를 암호화하는 핵산을 처리하는 과정,
    여기서, 상기 가이드 RNA는 상기 테스팅 세트에 포함된 테스팅 벡터의 Cas 후보 단백질과 상호작용하여 CRISPR/Cas 복합체를 형성할 수 있고,
    상기 가이드 RNA의 가이드 도메인은 상기 세포의 유전자에 포함된 특정 서열을 표적화하는 것임;
    (c) 상기 (b) 과정을 수행한 세포 중 상기 가이드 도메인이 표적화한 상기 특정 서열이 편집된 세포를 선별하는 과정;
    (d) 상기 (c) 과정에서 선별된 세포 내 포함된 상기 테스팅 벡터의 상기 Cas 후보 단백질의 아미노산 서열을 특정하는 과정.
  9. 제8항에 있어서, 상기 (c) 과정의 상기 특정 서열이 편집된 세포를 선별하는 것은 상기 (b) 과정을 수행한 세포를 특정 조건에서 배양한 후, 살아남은 세포를 선별하는 것인 Cas 후보 단백질 스크리닝 방법.
  10. 제9항에 있어서, 상기 가이드 RNA의 가이드 도메인이 표적화하는 상기 특정 서열은 HPRT 유전자의 서열이고, 상기 (b) 과정을 수행한 세포를 특정 조건에서 배양하는 것은 6TG를 포함한 배지에서 배양하는 것인 Cas 후보 단백질 스크리닝 방법.
  11. 서열번호 3 내지 서열번호 8 중 선택된 아미노산 서열을 가지는 Streptococcus pyogenes 유래 Cas9 단백질의 변이체.
  12. 다음을 포함하는 CRISPR/Cas9 조성물:
    제11항의 Streptococcus pyogenes 유래 Cas9 단백질의 변이체, 또는 상기 Cas9 단백질의 변이체를 암호화하는 핵산;
    crRNA 및 tracrRNA를 포함하는 가이드 RNA, 또는 상기 가이드 RNA를 암호화하는 핵산,
    여기서, 상기 crRNA는 5'말단에서 3'말단 방향으로 가이드 도메인 및 직접 반복부(direct repeat)가 순차적으로 연결된 것이고,
    상기 직접 반복부 및 상기 tracrRNA는 상기 Cas9 단백질의 변이체와 상호작용하여 CRISPR/Cas 복합체를 이룰 수 있는 것이고,
    상기 가이드 도메인은 미리 결정된 핵산 서열을 표적화할 수 있는 것임.
  13. 제12항에 있어서, 상기 가이드 RNA는 상기 crRNA 및 상기 tracrRNA가 링커로 연결된 싱글 가이드 RNA인 CRISPR/Cas9 조성물.
  14. 제12항 내지 제13항 중 선택된 어느 하나에 있어서,
    상기 가이드 RNA의 crRNA의 직접 반복부는 서열번호 13의 서열을 가지고,
    상기 가이드 RNA의 tracrRNA는 서열번호 14의 서열을 가지는 CRISPR/Cas9 조성물.
  15. 제12항 내지 제14항 중 선택된 어느 하나에 있어서, 상기 CRISPR/Cas9 조성물은 상기 Cas9 단백질의 변이체 및 상기 가이드 RNA를 리보뉴클레오프로틴(ribonucleoprotein) 형태로 포함하는 CRISPR/Cas9 조성물.
  16. 제13항 내지 제14항 중 선택된 어느 하나에 있어서, 상기 CRISPR/Cas9 조성물은 상기 Cas9 단백질의 변이체를 암호화하는 핵산 및 상기 가이드 RNA를 암호화하는 핵산을 벡터 형태로 포함하는 CRISPR/Cas9 조성물.
PCT/KR2023/001041 2022-01-24 2023-01-20 Cas 단백질 또는 이의 변이체의 스크리닝 방법, 및 이를 이용하여 제조된 Cas 단백질 또는 이의 변이체 WO2023140697A1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20220010249 2022-01-24
KR10-2022-0010249 2022-01-24

Publications (1)

Publication Number Publication Date
WO2023140697A1 true WO2023140697A1 (ko) 2023-07-27

Family

ID=87348537

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2023/001041 WO2023140697A1 (ko) 2022-01-24 2023-01-20 Cas 단백질 또는 이의 변이체의 스크리닝 방법, 및 이를 이용하여 제조된 Cas 단백질 또는 이의 변이체

Country Status (1)

Country Link
WO (1) WO2023140697A1 (ko)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220005411A (ko) * 2020-07-06 2022-01-13 한국과학기술연구원 질환 세포-특이적인 miRNA에 의해 세포 생리 활성 조절 물질의 활성을 조절하는 복합체 및 이를 CRISPR/Cas 시스템에 적용한 질환 특이적 유전자 조작용 복합체

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220005411A (ko) * 2020-07-06 2022-01-13 한국과학기술연구원 질환 세포-특이적인 miRNA에 의해 세포 생리 활성 조절 물질의 활성을 조절하는 복합체 및 이를 CRISPR/Cas 시스템에 적용한 질환 특이적 유전자 조작용 복합체

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
DATABASE PROTEIN ANONYMOUS : "Chain A, CRISPR-associated endonuclease Cas9/Csn1", XP093079846, retrieved from NCBI *
LE RHUN ANAÏS, ESCALERA-MAURER ANDRÉS, BRATOVIČ MAJDA, CHARPENTIER EMMANUELLE: "CRISPR-Cas in Streptococcus pyogenes", RNA BIOLOGY, vol. 16, no. 4, 3 April 2019 (2019-04-03), pages 380 - 389, XP093079848, ISSN: 1547-6286, DOI: 10.1080/15476286.2019.1582974 *
LI BIN, YEN T. S. BENEDICT: "Characterization of the Nuclear Export Signal of Polypyrimidine Tract-binding Protein", JOURNAL OF BIOLOGICAL CHEMISTRY, AMERICAN SOCIETY FOR BIOCHEMISTRY AND MOLECULAR BIOLOGY, US, vol. 277, no. 12, 1 March 2002 (2002-03-01), US , pages 10306 - 10314, XP093079850, ISSN: 0021-9258, DOI: 10.1074/jbc.M109686200 *
LIU LIANG; YIN MAOLU; WANG MIN; WANG YANLI: "Phage AcrIIA2 DNA Mimicry: Structural Basis of the CRISPR and Anti-CRISPR Arms Race", MOLECULAR CELL, ELSEVIER, AMSTERDAM, NL, vol. 73, no. 3, 1 January 1900 (1900-01-01), AMSTERDAM, NL, pages 611, XP085595314, ISSN: 1097-2765, DOI: 10.1016/j.molcel.2018.11.011 *
MARINA RYAN J., BRANNAN KRISTOPHER W., DONG KEVIN D., YEE BRIAN A., YEO GENE W.: "Evaluation of Engineered CRISPR-Cas-Mediated Systems for Site-Specific RNA Editing", CELL REPORTS, ELSEVIER INC, US, vol. 33, no. 5, 3 November 2020 (2020-11-03), US , pages 108350, XP055898294, ISSN: 2211-1247, DOI: 10.1016/j.celrep.2020.108350 *

Similar Documents

Publication Publication Date Title
WO2021086083A2 (ko) CRISPR/Cas12f1 시스템 효율화를 위한 엔지니어링 된 가이드 RNA 및 그 용도
WO2019009682A2 (ko) 표적 특이적 crispr 변이체
WO2017217768A1 (ko) 온타겟 및 오프타겟의 다중 타겟 시스템을 이용하는, 표적 특이적 유전자 가위 스크리닝 방법 및 이의 용도
WO2017188797A1 (ko) In vivo에서 rna-가이드 뉴클레아제의 활성을 고처리량 방식으로 평가하는 방법
WO2018001258A1 (zh) 一种用于核酸富集捕获的探针及设计方法
WO2016021973A1 (ko) 캄필로박터 제주니 crispr/cas 시스템 유래 rgen을 이용한 유전체 교정
WO2018062866A2 (en) CELL-PERMEABLE (CP)-Cas9 RECOMBINANT PROTEIN AND USES THEREOF
WO2015167278A1 (en) A protein secretory factor with high secretory efficiency and an expression vector comprising the same
WO2015199387A2 (ko) 가용성 단백질 발현량 및 활성이 증대된 헬리코박터 파일로리 유래 α-1,3 푸코실 전달효소의 유전자와 단백질 및 α-1,3 푸코실올리고당 생산에의 응용
WO2022075813A1 (ko) Crispr/cas12f1 시스템 효율화를 위한 엔지니어링 된 가이드 rna 및 그 용도
WO2011025242A2 (ko) 번역 효율 증진용 dna 단편 및 이를 포함하는 재조합 벡터
WO2020076079A2 (ko) 락토바실러스 카제이 유래의 두 종류 프로모터를 이용한 두 가지 목적단백질의 동시 표면발현벡터 및 이를 이용한 단백질의 미생물표면 발현 방법
WO2022163951A1 (ko) 신규한 단백질 변이체 및 이를 이용한 l-라이신 생산 방법
WO2020235974A9 (ko) 단일염기 치환 단백질 및 이를 포함하는 조성물
WO2022220503A1 (ko) Crispr 시스템을 이용한 유전자 발현 조절 시스템
CN1330666C (zh) 低氧-诱导因子1αHIF-1α变体和鉴定HIF-1α调节剂的方法
WO2018182361A1 (ko) CRISPR/Cas 시스템과 재조합 효소 및 단일가닥 올리고디옥시리보핵산을 이용한 코리네박테리움 변이균주 제조방법
WO2012134215A2 (ko) 동물세포 발현벡터
WO2023140697A1 (ko) Cas 단백질 또는 이의 변이체의 스크리닝 방법, 및 이를 이용하여 제조된 Cas 단백질 또는 이의 변이체
WO2023153845A2 (ko) 상동지정복구를 위한 target 시스템 및 이를 이용한 유전자 편집 방법
WO2023059115A1 (ko) 유전자 편집을 위한 target 시스템 및 이의 용도
WO2022075816A1 (ko) Crispr/cas12f1(cas14a1) 시스템 효율화를 위한 엔지니어링 된 가이드 rna 및 이의 용도
WO2015199386A1 (ko) 가용성 단백질 발현량이 증대된 헬리코박터 파일로리 유래 α-1,2 푸코실 전달효소의 유전자와 단백질 및 α-1,2 푸코실올리고당 생산에의 응용
WO2016122058A1 (ko) 세포성점균을 이용한 인간 페닐알라닌 수산화효소의 활성분석 방법
WO2022075808A1 (ko) Crispr/cas12f1 시스템 효율화를 위한 u-rich tail을 포함하는 엔지니어링 된 가이드 rna 및 그 용도

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 23743540

Country of ref document: EP

Kind code of ref document: A1