WO2023075154A1 - Method for inactivating gene of porcine endogenous retrovirus and composition thereof - Google Patents

Method for inactivating gene of porcine endogenous retrovirus and composition thereof Download PDF

Info

Publication number
WO2023075154A1
WO2023075154A1 PCT/KR2022/014077 KR2022014077W WO2023075154A1 WO 2023075154 A1 WO2023075154 A1 WO 2023075154A1 KR 2022014077 W KR2022014077 W KR 2022014077W WO 2023075154 A1 WO2023075154 A1 WO 2023075154A1
Authority
WO
WIPO (PCT)
Prior art keywords
perv
gene
sequence
nucleic acid
target
Prior art date
Application number
PCT/KR2022/014077
Other languages
French (fr)
Korean (ko)
Inventor
구옥재
염수영
Original Assignee
주식회사 툴젠
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 툴젠 filed Critical 주식회사 툴젠
Priority to KR1020237000584A priority Critical patent/KR20230065230A/en
Publication of WO2023075154A1 publication Critical patent/WO2023075154A1/en

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
    • A01K67/027New or modified breeds of vertebrates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • C12N15/1131Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against viruses
    • C12N15/1132Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against viruses against retroviridae, e.g. HIV
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N7/00Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • A01K2217/075Animals genetically altered by homologous recombination inducing loss of function, i.e. knock out
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • A01K2227/108Swine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/13011Gammaretrovirus, e.g. murine leukeamia virus
    • C12N2740/13061Methods of inactivation or attenuation
    • C12N2740/13062Methods of inactivation or attenuation by genetic engineering
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04005Cytidine deaminase (3.5.4.5)

Definitions

  • This application relates to the artificial manipulation or modification of target genes present in multiple copies. More specifically, it relates to a composition capable of artificially manipulating the PERV genome existing in multiple copies in the genome of a pig cell and a method of inactivating PERV using the same.
  • the CRISPR-Cas system consists of a guide RNA (gRNA) having a sequence complementary to a target gene or nucleic acid and a CRISPR enzyme, a nuclease capable of cleaving the target gene or nucleic acid.
  • gRNA guide RNA
  • CRISPR enzyme a nuclease capable of cleaving the target gene or nucleic acid.
  • the gRNA and the CRISPR enzyme form a CRISPR complex. and the target gene or nucleic acid is cut or modified by the formed CRISPR complex.
  • the gene edited by the CRISPR-Cas system is usually 1 copy or 2 copies, and even if genome editing occurs at the same time, no big problem arises.
  • the number of copies of the target gene is multiple, that is, when multiple copies of the gene are targeted, gene editing using the CRISPR-Cas system involves rearrangement of the genome through simultaneous nucleic acid cleavage and repair processes, Serious problems such as loss of some nucleic acid fragments may occur, which may result in cytotoxicity and cell death.
  • porcine organs are considered promising as a solution to the shortage of organs for transplantation, the use of porcine organs remains unresolved for transmission or transmission of porcine endogenous retrovirus (PERV) to humans.
  • PERV porcine endogenous retrovirus
  • PERV is harmless to pigs, but when transferred or spread to humans, there is potential for various diseases caused by retroviruses.
  • One object of the present application is to provide a composition for artificially manipulating the gene of porcine endogenous retrovirus (PERV).
  • PERV porcine endogenous retrovirus
  • Another object of the present application is to provide a method for artificially inactivating a porcine endogenous retrovirus gene.
  • Another object of the present application is to provide a pig cell or / and pig or / and pig organ using the above method.
  • a method for inactivating porcine endogenous retrovirus (PERV), which is present in multiple copies in the pig genome is provided.
  • the target gene of the PERV is at least one selected from the gag gene, the pol gene, and the env gene,
  • the target sequence is 5'-CAG-3', 5'-CAA-3', 5'-CGA-3', 5'-CTA-3', 5'-CCA-3' and 5'-TCA-3 At least one nucleotide sequence of the nucleotide sequence of ', wherein the target sequence is located in a continuous 10 bp to 30 bp sequence region of the PERV gene,
  • the Cas protein is a Cas9 protein derived from Streptococcus pyogenes, a Cas9 protein derived from Campylobacter jejuni, a Cas9 protein derived from Streptococcus thermophiles, and a Staphylococcus au It is selected from the group consisting of Cas9 protein derived from Staphylococcus aureus, Staphylococcus auricularis and Cpf1 protein,
  • the inactivation reduces or suppresses the expression of the target gene of PERV by generating a stop codon in the target sequence
  • a method characterized by inactivating PERV present in the multiple copies may be provided.
  • stop codon is any one or more nucleotide sequences selected from 5'-TAG-3', 5'-TAA-3' and 5'-TGA-3' may be provided.
  • a composition for genetic manipulation is provided for inactivating porcine endogenous retrovirus (PERV).
  • PERV porcine endogenous retrovirus
  • a guide RNA comprising one or more guide domain sequences selected from SEQ ID NOs: 66 to 130, or a nucleic acid encoding the same;
  • the target gene of the PERV is at least one selected from the gag gene, the pol gene, and the env gene,
  • the guide domain may form a complementary bond with a guide nucleic acid binding target sequence among target sequences of the PERV gene,
  • the guide RNA is 5'-CAG-3', 5'-CAA-3', 5'-CGA-3', 5'-CUA-3', 5'-CCA-3' and 5' in the guide domain sequence. -Contains one or more of the nucleotide sequences of UCA-3',
  • the Cas protein is a Cas9 protein derived from Streptococcus pyogenes, a Cas9 protein derived from Campylobacter jejuni, a Cas9 protein derived from Streptococcus thermophiles, and a Staphylococcus au
  • a composition characterized by being selected from the group consisting of a Cas9 protein derived from Staphylococcus aureus, a Staphylococcus auricularis, and a Cpf1 protein may be provided.
  • pig cells are provided.
  • a porcine endogenous retrovirus (PERV) in which at least one gene selected from the gag gene, pol gene, and env gene is inactivated is included in the genome,
  • a pig cell containing at least two or more stop codons in each of the inactivated genes
  • the stop codon is any one or more nucleotide sequences selected from 5'-TAG-3', 5'-TAA-3' and 5'-TGA-3',
  • the inactivated PERV exists in multiple copies in the genome and
  • Porcine cells characterized in that the expression level of PERV is reduced by 50% or more compared to before inactivation can be provided. That is, a pig cell characterized in that the inactivated PERV gene is present at 50% or more compared to before inactivation can be provided.
  • composition provided by the present application it is possible to provide a method for artificially inactivating a gene of a pig endogenous retrovirus.
  • PAM refers to a protospacer adjacent motif
  • UGI refers to a uracil DNA glycosylase inhibitor
  • FIG. 2 is a diagram showing vectors used in this application. Arrows indicate the positions of primers used to check whether the transgene used in this application is integrated.
  • Colonies #1 and #3 refer to colonies derived from single cells obtained after Neomycin selection, respectively.
  • FIG. 4 is a diagram showing the results of confirming that a stop codon was generated in the gag gene of PERV of the present application.
  • FIG. 5 is a diagram showing the results of confirming that a stop codon was generated in the pol gene of PERV of the present application.
  • target sequence is a nucleotide sequence present in a target gene or nucleic acid, specifically, a partial nucleotide sequence of a target region in a target gene or nucleic acid, wherein the "target region” is a guide nucleic acid-editor protein in a target gene or nucleic acid. It is a site that can be modified by In this case, the target sequence may be a guide nucleic acid binding sequence or a guide nucleic acid non-binding sequence.
  • the target region is a region including nucleotides in which base substitution is induced by a base modification enzyme. The term target region may be used interchangeably with target site.
  • guide nucleic acid-binding sequence is a nucleotide sequence having partial or complete complementarity with the guide sequence included in the guide domain of the guide nucleic acid, and is complementary to the guide sequence included in the guide domain of the guide nucleic acid.
  • guide nucleic acid binding sequence may be used interchangeably with guide nucleic acid binding target sequence.
  • guide nucleic acid-non-binding sequence is a nucleotide sequence having partial or complete homology with the guide sequence included in the guide domain of the guide nucleic acid, and the guide included in the guide domain of the guide nucleic acid unable to form complementary sequences.
  • guide nucleic acid non-binding sequence may be used interchangeably with guide nucleic acid non-binding target sequence.
  • the target sequence may be used as a term meaning both types of nucleotide sequence information.
  • the target sequence may mean sequence information of a transcribed strand of the target gene DNA, or nucleotide sequence information of a non-transcribed strand.
  • targeting means complementary binding with a guide nucleic acid binding sequence among target sequences present in a target gene or nucleic acid.
  • the complementary bond may be 100% complete complementary bond, or 70% or more and less than 100% incomplete complementary bond.
  • targeting gRNA refers to a gRNA that complementarily binds to a guide nucleic acid binding sequence among target sequences present in a target gene or nucleic acid.
  • the term “artificially modified or engineered or artificially engineered” means a state artificially modified, not a state as it exists in nature.
  • the non-natural, artificially engineered or modified porcine endogenous retrovirus (PERV) gene may be used interchangeably with the term artificial PERV gene.
  • the non-natural, artificially engineered or modified PERV gene is an artificially engineered or modified gag gene, an artificially engineered or modified pol gene, and an artificially engineered or modified env gene. It can be used in an inclusive sense.
  • PERV gene is meant to include both the RNA genome sequence of PERV and its DNA counterpart sequence, for example, a cDNA sequence transcribed by the RNA genome sequence of PERV, a double-stranded DNA generated by the cDNA sequence It includes both sequences and DNA sequences inserted into the genome of a host cell. Also, the PERV gene may be used interchangeably with the genome of PERV.
  • activation or deactivation refers to a state in which a target nucleic acid or gene is artificially manipulated.
  • a state in which a target site in a target nucleic acid or gene is cleaved and the function is reduced and/or lost ii) a state in which transcription and/or translation of the target nucleic acid or gene is not and/or suppressed and/or reduced.
  • the inactivation may suppress or reduce the occurrence of a disease by inactivating a disease-causing gene or a gene having an abnormal function, thereby regulating the expression of a target gene or nucleic acid or protein.
  • a disease-causing gene or a gene having an abnormal function thereby regulating the expression of a target gene or nucleic acid or protein.
  • the PERV gene when the PERV gene is inactivated, i) the target site in the PERV gene is cleaved and the function is reduced or lost; and ii) the transcription and / or translation of the target gene among the PERV genes is inhibited or It should be interpreted as including all; a state in which expression of a gene or protein is reduced and/or suppressed.
  • inactivation of PERV should be interpreted as a state in which expression is reduced and/or suppressed by artificially generating a stop codon to inhibit transcription and/or translation of a PERV target gene.
  • the present application relates to a composition and method capable of artificially manipulating a porcine endogenous retrovirus (PERV) present in multiple copies in the pig genome, and in particular, by forming a stop codon in a target sequence, PERV It is characterized by inactivating.
  • PERV porcine endogenous retrovirus
  • a sequence capable of forming a stop codon with a single base substitution is found, and a base modification capable of inducing or generating a single base substitution use enzymes.
  • the CRISPR/Cas system and a base modifying enzyme that induces or generates a single base substitution, such as deaminase, are used together.
  • the gag gene, pol gene, and env gene of PERV present in the genome of a pig are used as specific target regions, and a stop codon is formed specifically in the target region, thereby inactivating PERV. occurs
  • a specific gene of PERV can be targeted and specifically targeted.
  • a stop codon can be artificially generated at a desired position by using a base modifying enzyme that induces or generates a single base substitution while site-specifically targeting a specific gene of PERV with the CRISPR/Cas system.
  • the generated stop codon can act in the process of transcription or translation of a specific gene of PERV, thereby suppressing the expression of a specific gene of PERV.
  • the present application uses a CRISPR/Cas system and a base modifying enzyme together to inactivate PERV.
  • the present application is characterized by the use of a CRISPR/Cas system (eg, gRNA and Cas nickase) and a base modifying enzyme (eg, deaminase) for cleaving DNA.
  • a CRISPR/Cas system eg, gRNA and Cas nickase
  • a base modifying enzyme eg, deaminase
  • FIG. 1 For the principle of inactivating PERV of the present application, reference may be made to the schematic diagram of FIG. 1.
  • nCas9 and cytidine deaminase of Cas9 are described as an example. 1 illustrates the technical principle of the present application by way of example, and is not limited thereto.
  • a CRISPR/Cas system containing gRNA and Cas9 nickase to target the target gene or nucleic acid of PERV is required.
  • cytidine deaminse and uracil DNA glycosylase inhibitor are required to generate a stop codon by replacing cytosine (C) with thymine (T) .
  • the gRNA targets a target sequence including the 5'-CAG-3' sequence and the PAM sequence, interacts with Cas9 nickase, and Cas9 nickase cuts a single strand in the target site.
  • cytidine deaminase when used together with Cas9 nickase, cytidine deaminase and UGI act on the opposite strand of the DNA strand cleaved by Cas9 nickase, resulting in the 5'-CAG-3' sequence in the target sequence.
  • cytidine is substituted with thymine to change the sequence to 5'-TAG-3'.
  • the target nucleic acid or gene is inactivated by having the 5'-TAG-3' sequence, which is a stop codon sequence, in the target sequence.
  • the gRNA of the CRISPR/Cas system binds to a target nucleic acid or gene sequence (target in FIG. 1) and interacts with Cas9 nickase, whereby Cas9 nickase cuts a single strand in the target site (scissors in FIG. 1), and PERV Inactivated. That is, by using the CRIPSR/Cas system in the present application, the cleavage is not only specific to the target gene in the porcine genome, but also has a characteristic that occurs specifically at a specific position of the target gene.
  • the gRNA of the CRISPR/Cas system can recognize the target gene, the gag gene, pol gene, and env gene, which play the most important role in replication among the PERV genes present in the pig genome, can be targeted.
  • Cas9 nickase cuts the target site of the target gene, so that the CRISPR / Cas system for PERV inactivation of the present application can specifically target the desired gene.
  • the target sequence must include the PAM sequence.
  • a gRNA can be designed in consideration of the PAM sequence. Briefly, the design method can be designed by finding a region where a PAM sequence is present in a sequence in a target nucleic acid or gene, and selecting a sequence of ⁇ 20 bp from the corresponding PAM sequence.
  • the present application uses cytidine deaminase together with the CRISPR/Cas system for PERV inactivation.
  • the CRISPR/Cas system is used in combination with base modifying enzymes (e.g., cytidine deaminase and UGI)
  • base modifying enzymes e.g., cytidine deaminase and UGI
  • cytosine is replaced by thymine, resulting in the target gene or target within the nucleic acid targeted by the CRISPR/Cas system. This is to achieve the purpose of making a specific sequence of sequences become a stop codon.
  • Cytidine deaminase is an enzyme having an activity of substituting thymine for cytosine, and in one embodiment, cytosine located on a strand where a PAM sequence is present in a target sequence is converted to thymine.
  • UGI a protein that inhibits uracil (U) to cytosine conversion enzyme (Uracil DNA glycosylase; UDG)
  • UDG cytosine conversion enzyme
  • UGI acts to inhibit the restoration of uracil, an intermediate product of deamination, to cytosine by UDG due to cytidine deaminase.
  • guanine (G) on the opposite strand is substituted with adenine (A), resulting in a single base pair substitution from C-G pair to T-A pair.
  • cytidine deaminase and UGI cytosine located on the strand where the PAM sequence is present in the target sequence is substituted with thymine.
  • cytidine deaminase is an enzyme involved in changing cytosine to thymine
  • a sequence that can be changed to a stop codon sequence in the target sequence for example, 5'-CAG-3', 5'-CAA-3 ', 5'-CGA-3', 5'-CTA-3', 5'-CCA-3' and 5'-TCA-3'
  • a target sequence comprising any one or more nucleotide sequences selected from the present application can be used in
  • the CRIPSR/Cas system targets any one or more genes of PERV's gag gene, pol gene, and env gene, cleave the target site, and A stop codon is formed within the PERV gene to inhibit transcription or/or translation of one or more of the PERV genes, thereby reducing or/or suppressing expression of the PERV gene, thereby further enhancing the PERV inactivation effect.
  • composition for genetic engineering for artificially inactivating PERV described above.
  • the composition for genetic engineering may be used for the production of artificially engineered PERV genes.
  • the PERV gene artificially manipulated by the composition for genetic engineering may control the transfer of the PERV gene and the expression of the protein encoded by the PERV gene.
  • the target gene targeted by the composition for genetic manipulation of the present application is PERV.
  • PERV exists in the form of a provirus or viral particle in multiple copies on all types of pig genomes, and is not easy to control because it spreads through the germ line.
  • PERV refers to endogenous retroviruses that are inserted into the pig's genome and are passed on to the next generation according to Mendel's genetic laws, and are also transmitted by infection.
  • PERV is classified into Retroviridae and Gammaretrovirus , and belongs to gamma-retroviruses, such as murine leukemia virus and feline leukemia virus, which cause leukemia or immunodeficiency in terms of nucleotide sequence, amino acid sequence and morphology. .
  • the virus undergoes germline transmission, does not show any symptoms in pigs, and most exist in a form in which actual viruses cannot be made due to gene deletion or mutation.
  • Replicable PERV subtypes include PERV-A, PERV-B and PERV-C.
  • PERV-A and PERV-B can infect human cells, pig cells, and cells of other species, while PERV-C has been reported to only partially infect pig cells and human cells called HT1080 (Takeuchi et al., 1998). In some studies, it has been confirmed that a virus recombined with PERV-C as a template and only the receptor binding site with PERV-A exhibits 500-fold infectivity against human cells (Birke et al., 2004; Harrison et al., 2004; Scobie et al., 2004). In addition, it has been reported that humanized PERV, once infected with human cells, has increased infectivity to human cells compared to PERV produced in pig cells.
  • composition for genetic manipulation of the present application may simultaneously target any two or more subtypes selected from among PERV-A, PERV-B and PERV-C.
  • Target genes disclosed by this application may be some genes included in the PERV gene.
  • the target gene disclosed by this application may be a gag gene among PERV genes.
  • the target gene disclosed by this application may be a pol gene among PERV genes.
  • the target gene disclosed by the present application may be an env gene among PERV genes.
  • PERV genes include the gag gene, pol gene and env gene. These are the genes that play the most important role in PERV replication. Specifically, gag gene, pol gene, and env gene are known. Specifically, the gag gene encodes the core protein, the pol gene encodes the reverse transcriptase, and the env gene encodes the envelope protein.
  • gag gene and pol gene which form viral enzymes and structural proteins, show a similarity of more than 90% in PERV-A, PERV-B, and PERV-C, whereas the similarity of the env gene related to host cell infection is makes a big difference
  • the target gene disclosed by the present application may be two or more genes selected from among the gag gene, the pol gene, and the env gene among the PERV genes.
  • the pol gene and the gag gene of PERV are targeted and inactivated as target genes, i) the pol gene region involved in reverse transcription and replication is inactivated, thereby inhibiting reverse transcription and replication, and ii) core essential for growth at the same time
  • the gag gene which encodes the protein
  • the target gene disclosed by this application may be a gag gene, a pol gene, and an env gene among PERV genes.
  • the target gene disclosed by the present application may be two or more genes selected from the gag gene, the pol gene, and the env gene among the genes of the PERV subtype.
  • the PERV gene may exist as a whole genome sequence or a partial nucleic acid sequence of PERV in the genome of a pig cell.
  • the partial nucleic acid sequence may be the entire nucleic acid sequence of one or more of the gag gene, pol gene, and env gene.
  • the partial nucleic acid sequence may be a partial nucleic acid sequence of one or more of the gag gene, pol gene, and env gene.
  • the PERV gene can be present in 1 to 100 copies within the genome of a pig cell.
  • the PERV gene may be a full-length genome sequence or a partial nucleic acid sequence of PERV.
  • 1 to 100 copies of the PERV gene in the genome of the pig cell may be contiguous and/or non-contiguous.
  • PERV gene For example, if 60 copies of the PERV gene are present in the genome of a pig cell, 10 copies may exist continuously and the remaining 50 copies may each exist non-contiguously. Alternatively, if 20 copies of the PERV gene exist in the genome of a pig cell, 10 copies exist continuously and the remaining 10 copies also exist continuously, but two groups of 10 consecutive copies may exist non-contiguously. there is.
  • 1 to 100 copies in the genome of the pig cell may exist in a mixture of the full-length genome sequence and some nucleic acid sequences of PERV.
  • the PERV gene may exist in the genome of a pig cell, 2 copies may exist as the full-length genome sequence of PERV, and the remaining 3 copies may exist as partial nucleic acid sequences.
  • the PERV gene has 13 copies in the genome of a pig cell, 5 copies are present as the full-length genome sequence of PERV, 4 copies are present as the entire nucleic acid sequence of the gag gene among the PERV genes, and the remaining 4 A copy of the dog may exist as a partial nucleic acid sequence of the pol gene in the PERV gene.
  • the target gene in order for the CRISPR/Cas system included in the genetic manipulation composition of the present application to operate, the target gene must contain a PAM (Protospacer adjacent motif) sequence in the target sequence.
  • PAM Protospacer adjacent motif
  • the Cas protein recognizes the PAM sequence in the CRISPR/Cas system, the PAM sequence must be included in the target sequence for its operation.
  • the PAM sequence must be included in the target sequence for its operation.
  • the target sequence in the target gene can be determined based on PAM. Because of this, since the target gene of the present application is designed to enable the CRISPR/Cas system to operate, the location of the target gene has a PAM-specific feature.
  • the target sequence disclosed by the present application may be a sequence of 10 to 35 consecutive nucleotides adjacent to the 5' end and/or 3' end of the PAM sequence in the nucleic acid sequence of the target gene.
  • the PAM sequence may be, for example, one or more of the following sequences (written in the 5' to 3' direction).
  • N is A, T, C or G
  • N is each independently A, T, C or G, R is A or G, and Y is C or T;
  • N is each independently A, T, C or G
  • NNAGAAW N is each independently A, T, C or G, and W is A or T;
  • N is each independently A, T, C or G
  • NNGRR(T) N is each independently A, T, C or G, and R is A or G
  • TTN N is A, T, C or G
  • the target sequence (guide nucleic acid non-binding sequence) may be a sequence of 10 to 35 consecutive nucleotides adjacent to the 5' end and/or the 3' end of the PAM sequence in the nucleic acid sequence of the PERV gene.
  • the target sequence may be a sequence of 10 to 35 consecutive nucleotides adjacent to the 5' end and/or 3' end of the PAM sequence in the nucleic acid sequence of the gag gene.
  • the target sequence may be a sequence of 10 to 35 consecutive nucleotides adjacent to the 5' end and/or 3' end of the PAM sequence in the nucleic acid sequence of the pol gene.
  • the target sequence may be a sequence of 10 to 35 consecutive nucleotides adjacent to the 5' end and/or the 3' end of the PAM sequence in the nucleic acid sequence of the env gene.
  • the target sequence of the target gene must include a sequence capable of base substitution with a stop codon in the sequence.
  • the base substitution may be effected by a base modifying enzyme that induces or generates a single base substitution.
  • the base modifying enzyme may be deaminase.
  • deaminase may include cytidine deaminase that changes (substitutes) cytosine into thymine, adenosine deaminase that substitutes adenine into guanine, and the like.
  • cytidine deaminase which changes cytosine to thymine, will be mainly described below.
  • cytosine in a sequence capable of base substitution with a stop codon in the target sequence is substituted with thymine, thereby generating a stop codon.
  • the PERV sequence targeted by the present application is a stop codonation target sequence, 5'-CAG-3', 5'-CAA-3', 5'-CGA-3', 5'-CTA-3 ', 5'-CCA-3' and 5'-TCA-3' and includes any one or more nucleotide sequences selected from. Regarding this, it is described in [Table 1] and [Table 2] below.
  • the stop codon target sequence is included in the guide nucleic acid non-binding sequence of the PERV target gene in the 5' to 3' direction (Table 1); Or it may not be included in the guide nucleic acid binding sequence on its opposite strand.
  • the strand containing the guide nucleic acid non-binding sequence is referred to as the first strand
  • the opposite strand is referred to as the second strand.
  • 5'-CAG-3', 5'-CAA-3' and 5'-CGA-3' to the 5' to 3' strand (i.e., guide nucleic acid non-binding sequence) of PERV targeted in this application It can be considered the case of including any one or more nucleotide sequences.
  • cytidine deaminase which substitutes cytosine for thymine, works, the stop codons 5'-TAG-3', 5'-TAA-3' and 5'-TGA-3' are changed (Table 1 ).
  • Stop codonation target sequence included in the target sequence of the first strand After cytidine deaminase treatment change sequence 5'-CAG-3' ⁇ 5'-TAG-3' 5'-CAA-3' ⁇ 5'-TAA-3' 5'-CGA-3' ⁇ 5'-TAA-3'
  • any one or more nucleotide sequences selected from 5'-CTA-3', 5'-CCA-3' and 5'-TCA-3' may contain
  • cytosine (C) is substituted with thymine (T)
  • T thymine
  • the second strand has a complementary sequence (3'-GAT- 5', 3'-GGT-5', 3'-AGT-5') is changed to 3'-AAT-5', which is a sequence complementary to the altered sequence (5'-TTA-3'). That is, the stop codon 5'-TAA-3' is generated on the second strand (Table 2).
  • Stop codonation target sequence included in the target sequence of the first strand After cytidine deaminase treatment included in the first strand altered sequence Stop codon sequence included in the second strand complementary to the altered sequence 5'-CTA-3' ⁇ 5'-TTA-3' 3'-AAT-5' 5'-CCA-3' ⁇ 5'-TTA-3' 3'-AAT-5' 5'-TCA-3' ⁇ 5'-TTA-3' 3'-AAT-5'
  • the target sequence targeted in the present application is a sequence that considers both a PAM sequence for the CRISPR/Cas system to operate and a sequence capable of generating a stop codon by operating a base modifying enzyme (hereinafter, a target sequence for stop codonation).
  • the target sequence targeted in the present application is a sequence that considers both a PAM sequence for the CRISPR/Cas system to operate and a sequence capable of generating a stop codon by operating a base modifying enzyme (hereinafter, a target sequence for stop codonation).
  • the target sequence of the present application is 5'-CAG-3', 5'-CAA-3', 5'-CGA-3' , 5'-CTA-3', 5'-CCA-3' and 5'-TCA-3'.
  • the target sequence disclosed by this application may be a sequence of 10 to 35 consecutive nucleotides including 5'-CAG-3' in the nucleic acid sequence of the target gene.
  • the target sequence disclosed by this application may be a sequence of 10 to 35 consecutive nucleotides including 5'-CAA-3' in the nucleic acid sequence of the target gene.
  • the target sequence disclosed by this application may be a sequence of 10 to 35 consecutive nucleotides including 5'-CGA-3' in the nucleic acid sequence of the target gene.
  • the target sequence disclosed by this application may be a sequence of 10 to 35 consecutive nucleotides including 5'-CTA-3' in the nucleic acid sequence of the target gene.
  • the target sequence disclosed by this application may be a sequence of 10 to 35 consecutive nucleotides including 5'-CCA-3' in the nucleic acid sequence of the target gene.
  • the target sequence disclosed by this application may be a sequence of 10 to 35 consecutive nucleotides including 5'-TCA-3' in the nucleic acid sequence of the target gene.
  • target sequences that can be used in one embodiment of the present invention are summarized in [Table 3], and the target sequences described in [Table 3] are guide nucleic acid non-binding sequences, complementary sequences through the described sequences. , that is, the guide nucleic acid binding sequence can be predicted.
  • Target gene Direction Target (5' to 3', w/o PAM) SEQ ID No. PERV-gag-1 gag + ttcaggttaagaagggacct SEQ ID NO: 1 PERV-gag-2 gag + gcagacactcttcacagccg SEQ ID NO: 2 PERV-gag-3 gag + ccagaaagcctcagtggccc SEQ ID NO: 3 PERV-gag-4 gag + tcagagactggaagggtac SEQ ID NO: 4 PERV-gag-6 gag - agccatggtttaacccatgg SEQ ID NO: 5 PERV-gag-7 gag - tcccaaccgaggcgagtcaa SEQ ID NO: 6 PERV-gag-8 gag - gtcccaaccgaggcgagtca SEQ ID NO: 7 PERV-gag-9 gag + tcc
  • composition for genetic manipulation disclosed by the present application may include an editor protein.
  • nucleotide modification enzyme may refer to Korean Patent Publication No. 2020-0135225.
  • the "editor protein” refers to a peptide, polypeptide or protein capable of artificially editing a genome or nucleic acid in a target cell.
  • the editor protein may be a cutting enzyme or a fusion protein containing the same.
  • the fusion protein may consist of a cleavage enzyme and one or more enzymes that function differently from the cleavage enzyme.
  • One or more enzymes that have a different function from the cleavage enzyme may be one or more enzymes selected from base modification enzymes, methylation regulatory enzymes, phosphorylation regulatory enzymes, and acetylation regulatory enzymes.
  • the cleavage enzyme may be a polypeptide or protein that functions to cleave nucleic acids, genes, or chromosomes.
  • the base modifying enzyme may be a polypeptide or protein that functions to transform a base of a nucleotide constituting a nucleic acid into another base.
  • the methylation-regulating enzyme may be a polypeptide or protein that functions to methylate and/or demethylate nucleotide sequences of nucleic acids, genes, or chromosomes.
  • the phosphorylation-regulating enzyme may be a polypeptide or protein that functions to phosphorylate and/or dephosphorylate a nucleotide sequence of a nucleic acid, gene, or chromosome.
  • the acetylation regulatory enzyme may be a polypeptide or protein that functions to acetylate and/or deacetylate a nucleotide sequence of a nucleic acid, gene, or chromosome.
  • editor protein may further include additional domains, peptides, polypeptides or proteins.
  • the additional domain, peptide, polypeptide or protein may be a functional domain, peptide, polypeptide or protein having the same or different function as the functional domain, peptide, polypeptide or protein included in the editor protein.
  • the editor protein includes a CRISPR enzyme.
  • the CRISPR enzyme is Streptococcus pyogenes, Streptococcus thermophilus, Streptococcus sp., Staphylococcus aureus or Campylobacter jejuni (Campylobacter jejuni, Cj).
  • the CRISPR enzyme may be Cas9, Cpf1 or nickase, but is not limited thereto.
  • Cpf1 The structural characteristics of Cpf1 are described by Takashi Yamano et al. (2016) Cell 165:949-962.
  • the nickase refers to a CRISPR enzyme engineered or modified to cleave only one strand of the double strand of a target gene or nucleic acid, and the nickase is a single strand, for example, non-complementary with the gRNA of the target gene or nucleic acid It has nuclease activity that cleave the strand or the complementary strand. Thus, the nuclease activity of two nickases is required to cleave the double strand.
  • the CRISPR enzyme recognizes or interacts with a specific nucleotide sequence in a target gene or nucleic acid, that is, a protospacer adjacent motif (PAM).
  • PAM protospacer adjacent motif
  • the Cas9 protein recognizes a proto-spaceradjacent motif (PAM) sequence on a subject's genomic DNA sequence and interacts with a guide nucleic acid to cut the DNA sequence at a position adjacent to the PAM sequence. Origin of the CRISPR enzyme It is generally understood that PAM is determined according to, but as research on mutants of enzymes derived from the enzyme proceeds, PAM may change.
  • PAM proto-spaceradjacent motif
  • the PAM may be 5'-NNAGAAW-3'
  • the PAM may be 5'-NNNNGATT-3'
  • the PAM may be 5'-NNGRR (T) -3'
  • N is each independently A, T, C or G
  • R may be A or G.
  • PAM may be 5'-NNGG-3', wherein N is A, T, G or C; or A, U, G or C.
  • the PAM sequence may be 5'-TTN-3' (N is A, T, C, or G).
  • the editor protein of the present application further includes a base modification enzyme.
  • the base modifying enzyme may be a polypeptide or protein that functions to transform a base of a nucleotide constituting a nucleic acid into another base.
  • the base modifying enzyme may be deaminase.
  • the deaminase may be wild-type or mutant.
  • the deaminase variant may be an enzyme having increased deaminase activity compared to wild-type deaminase.
  • a deaminase variant may be an enzyme in which one or more amino acid sequences in deaminase are modified.
  • the modification may be any one selected from substitution, deletion and insertion of amino acids.
  • the deaminase may modify (substitute) one or more bases selected from adenine (A), guanine (G), cytosine (C), thymine (T), and uracil (U) with another base.
  • bases selected from adenine (A), guanine (G), cytosine (C), thymine (T), and uracil (U) with another base.
  • the selected bases when the selected one or more bases are adenine (A), the selected bases can be modified to guanine (G), cytosine (C), thymine (T) or uracil (U).
  • the selected bases when the selected one or more bases are guanine (G), the selected bases may be modified to adenine (A), cytosine (C), thymine (T) or uracil (U).
  • the selected one or more bases when the selected one or more bases are cytosine (C), the selected bases may be modified to adenine (A), guanine (G), thymine (T) or uracil (U).
  • the selected one or more bases when the selected one or more bases are thymine (T) or uracil (U), the selected bases may be modified to adenine (A), guanine (G) or cytosine (C).
  • the deaminase may be adenosine deaminase, cytidine deaminase, cytosine deaminase or guanine deaminase.
  • the deaminase is AID, PmCDA1, AICDA, ARP2, CDA2, HIGM2, APOBEC1, APOBEC2, APOBEC3A, APOBEC3B, APOBEC3C, APOBEC3D, APOBEC3E, APOBEC3F, APOBEC3G, APOBEC3H, AICDA, CDA, DCTD, AMPD1, ADAT , ADAT2, ADAR, ADAR2, ADA, TadA or GDA.
  • the cytidine deaminase may substitute thymine for cytosine.
  • the adenosine deaminase may replace adenine with guanine.
  • the deaminase of the present application may be cytidine deaminase.
  • the cytidine deaminase may be AID, PmCDA1, AICDA, ARP2, CDA2, HIGM2, APOBEC1, APOBEC2, APOBEC3A, APOBEC3B, APOBEC3C, APOBEC3D, APOBEC3E, APOBEC3F, APOBEC3G, APOBEC3H, CDA or DCTD.
  • the deaminase can generate a specific codon sequence.
  • the specific codon sequence may be any one or more stop codon sequences selected from among 5'-TAG-3', 5'-TAA-3' and 5'-TGA-3'.
  • the target sequence in the target gene or nucleic acid is 5'-CAG-3', 5'-CAA-3', 5'-CGA-3', 5'-CTA- 3', 5'-CCA-3' and 5'-TCA-3', if it contains any one or more nucleotide sequences selected from among, cytosine is substituted with thymine, and the stop codon sequence in the target gene or nucleic acid can create
  • one or more bases may be substituted with the base modifying enzyme to generate a stop codon.
  • one or more bases may be substituted with the base modifying enzyme to induce stop codon generation.
  • the stop codon may be 5'-TAG-3', 5'-TAA-3' and/or 5'-TGA-3'.
  • the editor protein of the present application may further include a DNA glycosylase inhibitor.
  • the DNA glycosylase inhibitor can further increase the efficiency of base modification.
  • the DNA glycosylase inhibitor may be a uracil glycosylase inhibitor (UGI) that inhibits an enzyme that converts uracil into cytosine.
  • UMI uracil glycosylase inhibitor
  • the deaminase and DNA glycosylase inhibitors may be involved sequentially or simultaneously.
  • the cytidine deaminase deaminates cytosine, providing the intermediate product uracil.
  • the mechanism by which the provided uracil is restored to cytosine by UGI is inhibited, and as a result, cytosine can be replaced by thymine by DNA-replication or mismatch-repair.
  • the editor protein of the present application may include a CRISPR enzyme and a base modification enzyme independently or may be fused to each other and included as a fusion protein. At this time, it can be expressed as a separate vector or included in one vector.
  • the editor protein may be composed of wild-type Cas9 and cytidine deaminase.
  • the editor protein may be composed of Cas9 nickase, cytidine deaminase and UGI.
  • the editor protein of the present application may be a fusion protein in which a CRISPR enzyme and a nucleotide modification enzyme are fused to each other. At this time, it may optionally further include a linker.
  • the editor protein may be a fusion protein in which wild-type Cas9 and deaminase are fused.
  • the editor protein may be composed of a Cas9 nickase and a fusion protein in which cytidine deaminase and UGI are fused.
  • the editor protein may be a fusion protein composed of Cas9 nickase, cytidine deaminase and UGI.
  • composition for genetic manipulation disclosed by the present application further includes a guide nucleic acid.
  • the composition for genetic manipulation is a guide nucleic acid targeting a target sequence within the PERV gene.
  • the "guide nucleic acid” refers to a nucleotide sequence capable of recognizing a target nucleic acid, gene or chromosome and interacting with an editor protein.
  • the guide nucleic acid may complementarily bind to a target sequence, a gene, or a part of a nucleotide sequence in a chromosome.
  • some nucleotide sequences of the guide nucleic acid may interact with some amino acids of the editor protein to form a guide nucleic acid-editor protein complex (ribonucleoprotein, RNP).
  • the guide nucleic acid may perform a function of inducing a guide nucleic acid-editor protein complex to be located in a target region of a target nucleic acid, gene, or chromosome.
  • the guide nucleic acid may be in the form of DNA, RNA or a DNA/RNA mixture.
  • the guide nucleic acid may include one or more domains.
  • the domain may be a functional domain such as a guide domain, a first complementary domain, a linking domain, a second complementary domain, a proximal domain, and a tail domain, but is not limited thereto.
  • gRNA refers to an RNA capable of specifically targeting the gRNA-CRISPR enzyme complex, ie, the CRISPR complex, to a target gene or nucleic acid.
  • the gRNA refers to a target gene or nucleic acid-specific RNA, and can bind to a CRISPR enzyme to direct the CRISPR enzyme to a target gene or nucleic acid.
  • the guide RNA may include crRNA (CRISPR RNA) or/and tracrRNA (trans-activating crRNA).
  • CRISPR RNA CRISPR RNA
  • tracrRNA trans-activating crRNA
  • a form in which the crRNA and a specific site of the tracrRNA are fused may be referred to as sgRNA (sinlge-chain guide RNA).
  • the crRNA is a site that binds to a target sequence, and the tracrRNA is involved in forming the following editor protein complex.
  • the crRNA may include a guide domain and a first complementary domain
  • the tracrRNA may include a second complementary domain, a proximal domain and optionally a tail domain.
  • the guide domain is a domain containing a guide sequence capable of complementary binding with a target sequence (guide nucleic acid binding sequence) on a target gene or nucleic acid, and can play a role for specific interaction with a target gene or nucleic acid. .
  • the first complementary domain is a nucleic acid sequence including a nucleic acid sequence complementary to the second complementary domain, and may have complementarity to the extent of forming a double strand with the second complementary domain.
  • the "linking domain” is a nucleic acid sequence linking two or more domains, and the linking domain may link two or more identical or different domains.
  • the linking domain may form a covalent or non-covalent bond with two or more domains, or may link two or more domains covalently or non-covalently.
  • the "second complementary domain” is a nucleic acid sequence including a nucleic acid sequence complementary to the first complementary domain, and may have complementarity to the extent of forming a double strand with the first complementary domain.
  • proximal domain may be a nucleic acid sequence located proximal to the second complementary domain.
  • the "tail domain” may be a nucleic acid sequence located at one or more ends of both ends of the guide nucleic acid.
  • composition of the present application may be a gRNA capable of targeting a target gene in the PERV gene.
  • composition of the present application may be a gRNA capable of simultaneously targeting target genes each present in two or more subtype gene sequences selected from among PERV-A, PERV-B and PERV-C.
  • the gRNA may include a guide domain capable of partially or completely complementary binding with a guide nucleic acid binding sequence among target sequences of the PERV gene.
  • the gRNA may include a guide domain capable of partially or completely complementary binding to a guide nucleic acid binding sequence among target sequences of the gag gene, pol gene, and/or env gene.
  • the guide domain may be at least 70%, 75%, 80%, 85%, 90% or 95% complementary or completely complementary to the guide nucleic acid binding sequence.
  • the guide RNA may include a guide domain that complementarily binds to a guide nucleic acid binding target sequence and includes the same sequence as a guide nucleic acid non-binding target sequence in which T is replaced with U.
  • the guide RNA is 5'-CAG-3', 5'-CAA-3', 5'-CGA-3', 5'-CUA-3', 5'-CCA-3' and 5'-UCA -3' includes one or more of the nucleotide sequences.
  • the part of the guide RNA sequence complementary to the guide nucleic acid binding target sequence is the guide domain region.
  • the guide domain may include a nucleotide sequence complementary to a guide nucleic acid binding sequence among target sequences of the PERV gene.
  • the complementary nucleotide sequence may include 0 to 5, 0 to 4, 0 to 3, 0 to 2, and 0 to 1 mismatches.
  • the guide domain may include a nucleotide sequence complementary to a guide nucleic acid binding sequence among target sequences of the gag gene.
  • the complementary nucleotide sequence may include 0 to 5, 0 to 4, 0 to 3, 0 to 2, and 0 to 1 mismatches.
  • the guide domain may include a nucleotide sequence complementary to a guide nucleic acid binding sequence among target sequences of the pol gene.
  • the complementary nucleotide sequence may include 0 to 5, 0 to 4, 0 to 3, 0 to 2, and 0 to 1 mismatches.
  • the guide domain may include a nucleotide sequence complementary to a guide nucleic acid binding sequence among target sequences of the env gene.
  • the complementary nucleotide sequence may include 0 to 5, 0 to 4, 0 to 3, 0 to 2, and 0 to 1 mismatches.
  • the gRNA may include one or more domains selected from the group consisting of a first complementary domain, a linking domain, a second complementary domain, a proximal domain, and a tail domain.
  • domain regions other than the guide domain region contribute to forming a complex with the Cas protein.
  • the guide nucleic acid non-binding target sequence in the gag gene, pol gene and/or env gene includes a PAM and a stop codon target sequence.
  • the base modification enzyme operates on the guide nucleic acid non-binding target sequence, some bases of the stop codon target sequence are substituted (changed). At this time, a stop codon sequence in the target sequence may be generated by the substitution.
  • the PAM sequence can provide a selection criterion for a target sequence when designing a gRNA.
  • a target position is found based on the PAM sequence, and the target sequence is designed to include a portion containing the stop codon target sequence.
  • the same RNA sequence as the sequence in which T is substituted with U is determined as the guide domain sequence.
  • composition for genetic manipulation of the present application may include a guide nucleic acid and an editor protein.
  • composition for genetic manipulation is a composition for genetic manipulation
  • the target nucleic acid may be the full length or partial nucleic acid sequence of the PERV gene.
  • the PERV gene may include a gag gene, a pol gene, and/or an env gene.
  • the description of the PERV gene is as described above.
  • the target nucleic acid may be a gag gene.
  • the target nucleic acid may be a pol gene.
  • the target nucleic acid may be an env gene.
  • the target nucleic acid may be two genes selected from a gag gene, a pol gene, and an env gene.
  • the target nucleic acid may be a gag gene, a pol gene, and an env gene.
  • the target sequence may include a specific sequence.
  • the specific sequence may be a nucleotide sequence of 5'-CAG-3'.
  • the specific sequence may be a nucleotide sequence of 5'-CAA-3'.
  • the specific sequence may be a nucleotide sequence of 5'-CGA-3'.
  • the specific sequence may be a nucleotide sequence of 5'-CTA-3'.
  • the specific sequence may be a nucleotide sequence of 5'-CCA-3'.
  • the specific sequence may be a nucleotide sequence of 5'-TCA-3'.
  • the composition for genetic manipulation may include a gRNA, a CRISPR enzyme, and a base modification enzyme.
  • compositions for genetic manipulation are provided.
  • a gRNA capable of targeting a target sequence within a target nucleic acid sequence or a nucleic acid sequence encoding the same
  • the target nucleic acid may be the full length or partial nucleic acid sequence of the PERV gene.
  • the PERV gene may include a gag gene, a pol gene, and/or an env gene.
  • the description of the PERV gene is as described above.
  • the target nucleic acid may be a gag gene.
  • the target nucleic acid may be a pol gene.
  • the target nucleic acid may be an env gene.
  • the target nucleic acid may be two genes selected from a gag gene, a pol gene, and an env gene.
  • the target nucleic acid may be a gag gene, a pol gene, and an env gene.
  • the target sequence may include a specific sequence.
  • the specific sequence may be a nucleotide sequence of 5'-CAG-3'.
  • the specific sequence may be a nucleotide sequence of 5'-CAA-3'.
  • the specific sequence may be a nucleotide sequence of 5'-CGA-3'.
  • the specific sequence may be a nucleotide sequence of 5'-CTA-3'.
  • the specific sequence may be a nucleotide sequence of 5'-CCA-3'.
  • the specific sequence may be a nucleotide sequence of 5'-TCA-3'.
  • the CRISPR enzyme may be Cas9 nickase.
  • nucleotide modification enzyme is as described above.
  • the base modifying enzyme may be a deaminase.
  • the deaminase may be cytidine deaminase.
  • the CRISPR enzyme and the base modification enzyme may be fusion proteins fused to each other.
  • composition for genetic manipulation may further include a DNA glycosylase inhibitor.
  • the DNA glycosylase inhibitor may be a uracil glycosylase inhibitor.
  • the CRISPR enzyme, base modifying enzyme, and DNA glycosylase inhibitor may be included in the composition for genetic manipulation in the form of a fusion protein in which two or more of them are fused to each other.
  • the guide nucleic acid, editor protein, or guide nucleic acid-editor protein complex included in the composition for genetic manipulation disclosed in the present application may be delivered or introduced into cells in various forms.
  • the guide nucleic acid and editor protein may be delivered or introduced into a subject in the form of a nucleic acid-protein mixture.
  • the guide nucleic acid and editor protein may be delivered or introduced into a subject in the form of a guide nucleic acid-editor protein complex.
  • the guide nucleic acid may be DNA, RNA or a mixture thereof.
  • the editor protein may be in the form of a peptide, polypeptide or protein.
  • the guide nucleic acid and the editor protein may be delivered or introduced into the target in the form of a guide nucleic acid-editor protein complex, that is, a ribonucleoprotein (RNP), in which the guide nucleic acid in the form of RNA and the editor protein in the form of protein are formed.
  • a guide nucleic acid-editor protein complex that is, a ribonucleoprotein (RNP)
  • RNP ribonucleoprotein
  • composition for genetic manipulation may be in the form of a vector or a non-vector.
  • a vector containing the nucleic acid sequence encoding the guide nucleic acid or/and the CRISPR enzyme or/and the base modification enzyme simultaneously or separately may be constructed.
  • the vector may be a viral vector or a recombinant viral vector.
  • the virus may be a DNA virus or an RNA virus.
  • the DNA virus may be a double-stranded DNA (dsDNA) virus or a single-stranded DNA (ssDNA) virus.
  • dsDNA double-stranded DNA
  • ssDNA single-stranded DNA
  • the RNA virus may be a single-stranded RNA (ssRNA) virus.
  • ssRNA single-stranded RNA
  • the virus may be retrovirus, lentivirus, adenovirus, adeno-associated virus (AAV), vaccinia virus, poxvirus or herpes simplex virus, but is not limited thereto.
  • the vector may contain one or more regulation/control elements.
  • the regulatory / control elements are promoters, enhancers, introns, polyadenylation signals, Kozak consensus sequences, internal ribosome entry sites (IRES), splice acceptors and / or 2A sequence may be included.
  • a suitable promoter may be used according to the control region (ie, a nucleic acid sequence encoding a guide nucleic acid or an editor protein).
  • useful promoters for guide nucleic acids can be H1, EF-1a, tRNA or U6 promoters.
  • useful promoters for editor proteins may be the CMV, EF-1a, EFS, MSCV, PGK or CAG promoters.
  • the vector may contain one or more additional domains for separation and purification.
  • the one or more additional domains may be tags or reporter genes for separation and purification of proteins (including peptides).
  • the tag includes a histidine (His) tag, a V5 tag, a FLAG tag, an influenza hemagglutinin (HA) tag, a Myc tag, a VSV-G tag and a thioredoxin (Trx) tag
  • the reporter gene is glutathione -S-transferase (GST), horseradish peroxidase (HRP), chloramphenicol acetyltransferase (CAT) beta-galactosidase, beta-glucuronidase, luciferase, green fluorescent protein (GFP), HcRed, DsRed, cyan fluorescent protein (CFP), yellow fluorescent protein (YFP) and blue fluorescent protein (BFP).
  • the non-vector may be naked DNA, DNA complex, mRNA, or a mixture thereof.
  • the non-vector can be prepared by electroporation, gene gun, sonoporation, magnetofection, transient cell compression or squeezing (eg, Lee, et al, (2012) Nano Lett., 12, 6322- 6327), lipid-mediated transfection, dendrimers, nanoparticles, calcium phosphate, silica, silicate (ormosil), or combinations thereof.
  • delivery through electroporation may be performed by mixing cells and nucleic acid sequences encoding guide nucleic acids and/or editor proteins in a cartridge, chamber, or cuvette, and applying electrical stimulation of a predetermined duration and amplitude. there is.
  • a non-vector may be delivered using nanoparticles.
  • the nanoparticles may be inorganic nanoparticles (eg, magnetic nanoparticles, silica, etc.) or organic nanoparticles (eg, polyethylene glycol (PEG)-coated lipids, etc.).
  • the outer surface of the nanoparticles can be conjugated with a positively charged polymer (eg, polyethyleneimine, polylysine, polyserine, etc.) to enable adhesion.
  • delivery may be performed using a lipid envelope.
  • delivery may be performed using exosomes.
  • Exosomes are endogenous nano-vesicles that transport proteins and RNA, capable of delivering RNA to the brain and other target organs.
  • delivery may be performed using liposomes.
  • Liposomes are spherical vesicular structures composed of a single or multilamellar lipid bilayer surrounding an inner aqueous compartment and a relatively impermeable outer lipophilic phospholipid bilayer. Liposomes can be made from several different types of lipids; Phospholipids are most commonly used to create liposomes as drug carriers.
  • composition for delivery of the non-vector may include some other additives.
  • the composition for genetic manipulation of the present application may be knocked into the pig genome in order to continuously inactivate PERV in the pig genome.
  • the composition for genetic engineering is knocked into the genome, the possibility of permanent inactivation of PERV in multicopy state rather than temporary inactivation can be increased.
  • the composition for genetic manipulation of the present application uses the CRISPR/Cas system, it not only suppresses the transcription or/and translation of the target gene of PERV, but also creates a stop codon sequence in the target sequence of the target gene, thereby providing a target-specific and , high efficiency of PERV inactivation can be achieved.
  • the vector may include one or more transfer factors.
  • the transfer factor or a vector including the transfer factor may be located within a safe harbor.
  • the safe harbor may be AAVS1, ROSA26, and the like.
  • the safe harbor enables the expression of the foreign gene or the vector containing the same to be continued without causing side effects even when the foreign gene or the vector containing the same is inserted or knocked into a specific part of the pig genome.
  • the transfer factor may be a piggyBac transfer factor or a Sleeping Beauty transfer factor.
  • the piggyBac transfer factor may include an inverted terminal repeat sequence (ITR) at both ends.
  • ITR inverted terminal repeat sequence
  • the enzyme that mediates translocation of the piggyBac transfer factor may include piggyBac transposase.
  • the piggyBac transfer factor can be inserted into the genome by recognizing a specific nucleotide sequence.
  • the specific nucleotide sequence may be a target insertion site, and the target insertion site may be TTAA.
  • the genome may be a genome of an animal cell including a pig cell, a human cell, a mouse cell, and a rat cell.
  • the piggyBac transfer factor may include an external gene or nucleic acid sequence.
  • the piggyBac transfer factor may include an external gene or nucleic acid sequence between ITRs at both ends.
  • the foreign gene or nucleic acid sequence may be a gene or nucleic acid sequence to be translocated.
  • the external gene or nucleic acid sequence may be a guide nucleic acid and/or an editor protein.
  • the foreign gene may be inserted into the genome by a piggyBac transfer factor.
  • the vector system may be configured as follows.
  • the piggyBac transfer factor may include a nucleic acid sequence encoding a guide nucleic acid and an editor protein between ITRs at both ends.
  • the piggyBac transfer factor may include a nucleic acid sequence encoding a guide nucleic acid or an editor protein between ITRs at both ends.
  • the Sleeping Beauty transfer factor may include direct repeat (DR) at both ends.
  • DR direct repeat
  • the Sleeping Beauty transfer factor may include ITR at both ends.
  • the ITR may include a DR.
  • the Sleeping Beauty transfer factor may include Sleeping Beauty transposase as an enzyme that mediates translocation.
  • the Sleeping Beauty transfer factor can be inserted into the genome by recognizing a specific nucleotide sequence.
  • the specific nucleotide sequence may be a target insertion site, and the target insertion site may be a TA.
  • the genome may be a genome of an animal cell including pig cells, human cells, mouse cells, and rat cells.
  • the Sleeping Beauty transfer factor may include an external gene or nucleic acid sequence.
  • the Sleeping Beauty transfer factor may include an external gene or nucleic acid sequence between ITRs at both ends.
  • the foreign gene or nucleic acid sequence may be a gene or nucleic acid sequence to be translocated.
  • the external gene or nucleic acid sequence may be a guide nucleic acid and/or an editor protein.
  • the foreign gene may be inserted into the genome by a Sleeping Beauty transfer factor.
  • the vector system may be configured as follows.
  • the Sleeping Beauty transfer factor may include a nucleic acid sequence encoding a guide nucleic acid and an editor protein between ITRs at both ends.
  • the Sleeping Beauty transfer factor may include a nucleic acid sequence encoding a guide nucleic acid or an editor protein between ITRs at both ends.
  • composition for genetic manipulation was knocked into the pig genome. Furthermore, through the results of FIGS. 4 to 5, it can be confirmed that the composition for genetic manipulation generated a stop codon in the target sequence of the PERV gene.
  • composition for genetic engineering Another aspect disclosed by the present application relates to a method for inactivating PERV using the composition for genetic engineering. Description of the composition for genetic manipulation is the same as described above.
  • Cas9 protein derived from Streptococcus pyogenes Cas9 protein derived from Campylobacter jejuni, Cas9 protein derived from Streptococcus thermophiles, Staphylococcus aure
  • At least one editor protein selected from the group consisting of a Cas9 protein derived from Staphylococcus aureus, a Cas9 protein derived from Neisseria meningitidis, a Staphylococcus auricularis (SauriCas9), and a Cpf1 protein or a nucleic acid sequence encoding the same;
  • Cas9 protein derived from Streptococcus pyogenes Cas9 protein derived from Campylobacter jejuni, Cas9 protein derived from Streptococcus thermophiles, Staphylococcus aure
  • At least one editor protein selected from the group consisting of a Cas9 protein derived from Staphylococcus aureus, a Cas9 protein derived from Neisseria meningitidis, a Staphylococcus auricularis (SauriCas9), and a Cpf1 protein or a nucleic acid sequence encoding the same; and
  • the introduction may be performed by at least one method selected from electroporation, liposome, plasmid, viral vector, nanoparticles, and PTD (Protein translocation domain) fusion protein method.
  • the plasmid may be a vector containing a transfer factor for genome knock-in of pigs.
  • the vector-related description including the transfer factor is the same as described above.
  • the viral vector may be at least one selected from the group consisting of retrovirus, lentivirus, adenovirus, adeno-associated virus (AAV), vaccinia virus, poxvirus, and herpes simplex virus.
  • composition for manipulation may be delivered or introduced into a subject as a non-vector.
  • the subject may be a pig or a pig cell.
  • the porcine cells may include primary cultured porcine cells or commercial porcine cell lines.
  • the method may be a pig cell production method comprising the step of introducing a composition for genetic manipulation capable of artificially manipulating the gene of PERV into the pig cell.
  • the porcine cell may be a porcine cell containing the PERV gene.
  • the porcine cell may be a porcine cell containing the full length or partial nucleic acid sequence of the PERV gene.
  • the full length or partial nucleic acid sequence of the PERV gene may be present in the genome of the pig cell.
  • the full length or partial nucleic acid sequence of the PERV gene may be present in the pig cell.
  • the target nucleic acid may be the full length or partial nucleic acid sequence of the PERV gene.
  • the PERV gene may include a gag gene, a pol gene, and/or an env gene.
  • the description of the PERV gene is as described above.
  • the target nucleic acid may be a gag gene.
  • the target nucleic acid may be a pol gene.
  • the target nucleic acid may be an env gene.
  • the target nucleic acid may be two genes selected from a gag gene, a pol gene, and an env gene.
  • the target nucleic acid may be a gag gene, a pol gene, and an env gene.
  • the method comprises extracting a cell or cell population from a pig, and modifying the cell or cell population. Culturing of the cells can occur in vitro at any stage.
  • the engineered cell or cell population can be reintroduced into a pig or human, and furthermore, the nucleus or genome extracted from the engineered cell or cell population can be transplanted into a pig cell.
  • it may further include; confirming whether the introduced composition for genetic manipulation is introduced.
  • the step of confirming whether or not the introduction may be performed using a known technique.
  • the known technology may include a method for confirming transformation or a method for selecting transduction.
  • the selection method may be a method using a selectable marker.
  • the selectable marker may include an antibiotic gene, a fluorescent protein, and the like.
  • the antibiotic gene may be ampicillin, neomycin, kanamycin, hygromycin, gentamicin, puromycin, and the like.
  • the fluorescent protein may be green fluorescent protein (GFP), yellow fluorescent protein (YFP), red fluorescent protein (RFP), and the like.
  • the selectable marker may be included in the composition.
  • a selectable marker can be used as an indicator of whether the composition has been introduced into a subject.
  • an antibiotic resistance gene is used as a selection marker, and the composition is inserted together and a colony is formed by culturing cells in a medium containing an antibiotic, it can be determined that the composition has been introduced.
  • the selection can be made as follows. When the cells are cultured in a medium containing antibiotics and colonies are formed, it can be determined that the composition has been introduced into the cells.
  • porcine cells in which PERV is inactivated on the porcine genome can be selected and obtained.
  • Another aspect disclosed by the present application relates to a porcine cell, pig or porcine organ artificially engineered to inactivate PERV using the above method.
  • it relates to artificially engineered pig cells.
  • Manipulated porcine cell or engineered porcine cell means a pig cell that has been artificially manipulated rather than in a natural state.
  • An engineered porcine cell may be a porcine cell produced by genetic engineering.
  • the engineered porcine cell may be a porcine cell comprising an artificially engineered porcine endogenous retrovirus (PERV) gene.
  • PERV porcine endogenous retrovirus
  • the engineered porcine cell may be a porcine cell in which PERV gene transfer is inhibited.
  • the PERV gene transfer may be a position shift transfer on the genome in an engineered porcine cell.
  • the PERV gene transfer may be transfer into the genome of an engineered porcine cell and an adjacent cell, i.e., an engineered or non-engineered neighbor cell.
  • the adjacent cells may be animal cells including pig cells, human cells, mouse cells, and rat cells.
  • the engineered porcine cell may be a porcine cell in which production of a protein encoded by the PERV gene is inhibited or inhibited.
  • the engineered porcine cell may be a porcine cell in which production of a protein encoded by the gag gene is inhibited or inhibited.
  • An engineered porcine cell may be a porcine cell in which production of a protein encoded by a pol gene is inhibited or inhibited.
  • the engineered porcine cell may be a porcine cell in which the production of a protein encoded by the env gene is inhibited or inhibited.
  • the engineered porcine cell may be a porcine cell in which production of two or more of the proteins encoded by the gag gene, the pol gene and the env gene is inhibited or inhibited.
  • the engineered porcine cell may be a porcine cell comprising one or more of an artificially engineered gag gene, an artificially engineered pol gene, and an artificially engineered env gene.
  • the artificially engineered gag gene, artificially engineered pol gene, and artificially engineered env gene may be artificially engineered to include a specific sequence.
  • the specific sequence may be a stop codon.
  • the specific sequence may be 5'-TAG-3', 5'-TAA-3' and/or 5'-TGA-3'.
  • the artificially engineered gag gene may be a gene containing two or more stop codons.
  • the artificially engineered pol gene may be a gene containing two or more stop codons.
  • the artificially engineered env gene may be a gene containing two or more stop codons.
  • the two or more stop codons may include a first stop codon and one or more additional stop codons.
  • the “first stop codon” refers to a stop codon present at the 3' end of the gag gene, pol gene, and/or env gene in their natural state.
  • the first stop codon may be one of 5'-TAG-3', 5'-TAA-3' and 5'-TGA-3'.
  • the "additional stop codon” means a stop codon excluding the first stop codon in the nucleic acid sequence of the artificially engineered gag gene, pol gene and / or env gene, which is a natural gag gene, pol gene and / or it may be an artificially generated stop codon that does not exist in the nucleic acid sequence of the env gene.
  • the addition stop codon may have the same or different nucleotide sequence as the first stop codon.
  • the additional termination codon may be 5'-TAG-3', 5'-TAA-3' and/or 5'-TGA-3'.
  • the addition termination codon may be located at or adjacent to the 5' end of the nucleic acid sequence of the gag gene, pol gene and/or env gene.
  • the additional termination codon may be located within the nucleic acid sequence of the gag gene, pol gene and/or env gene.
  • the additional termination codon may be located adjacent to the 3' end of the gag gene, pol gene, and/or env gene.
  • the one or more additional termination codons are contiguous nucleotides of 1 bp to 100 bp adjacent to the 5' end and/or 3' end of the proto-spacer-adjacent motif (PAM) sequence in the nucleic acid sequence of the gag gene, pol gene and/or env gene. can be located within a sequence.
  • PAM proto-spacer-adjacent motif
  • the engineered porcine cell contains an artificially generated stop codon, not just a stop codon originally present in the genome, that is, naturally present. More specifically, the porcine cell further includes a stop codon naturally present in each of the gag gene, pol gene and env gene of PERV and an artificially generated stop codon in each of the gag gene, pol gene and env gene, thereby producing PERV is inactivated.
  • the artificially engineered gag gene may include one or more additional stop codons in the nucleic acid sequence of the gag gene, in addition to the first stop codon present at the 3' end of the nucleic acid sequence of the wild-type gag gene.
  • the artificially engineered pol gene may include one or more additional stop codons in the nucleic acid sequence of the pol gene, in addition to the first stop codon present at the 3' end of the nucleic acid sequence of the wild-type pol gene.
  • the artificially engineered env gene may include one or more additional stop codons in the nucleic acid sequence of the env gene, in addition to the first stop codon present at the 3' end of the nucleic acid sequence of the wild-type env gene.
  • porcine cells containing one or more artificially engineered genes are listed:
  • the engineered pig cell is a pig cell comprising one artificially engineered gene.
  • One artificially engineered gene is one of an artificially engineered gag gene, an artificially engineered pol gene, and an artificially engineered env gene.
  • the one artificially engineered gene includes a first stop codon and one or more additional stop codons, and the additional stop codon is 5'-NGG-3' of the nucleic acid sequence of one or more artificially engineered genes ( N is A, T, C or G) may be located within a contiguous nucleotide sequence of 1 bp to 100 bp located adjacent to the 5' end and/or 3' end of the PAM sequence.
  • the engineered porcine cell is a porcine cell comprising two artificially engineered genes.
  • the two artificially engineered genes are two of an artificially engineered gag gene, an artificially engineered pol gene, and an artificially engineered env gene.
  • each of the two artificially engineered genes includes a first stop codon and one or more additional stop codons, and the additional stop codon is 5'-NGG-3' of the nucleic acid sequence of the one or more artificially engineered genes.
  • N is A, T, C or G
  • the engineered porcine cell is a porcine cell comprising three artificially engineered genes.
  • the three artificially engineered genes are an artificially engineered gag gene, an artificially engineered pol gene, and an artificially engineered env gene.
  • each of the three artificially engineered genes includes a first stop codon and one or more additional stop codons, and the additional stop codon is 5'-NGG-3' of the nucleic acid sequence of the one or more artificially engineered genes.
  • N is A, T, C or G
  • the porcine cell comprises:
  • a porcine endogenous retrovirus (PERV) in which at least one gene selected from the gag gene, pol gene, and env gene is inactivated is included in the genome,
  • a pig cell containing at least two or more stop codons in each of the inactivated genes
  • the stop codon is any one or more nucleotide sequences selected from 5'-TAG-3', 5'-TAA-3' and 5'-TGA-3',
  • the inactivated PERV exists in multiple copies in the genome
  • the expression level of PERV is reduced by 50% or more compared to before inactivation.
  • One aspect disclosed by this application relates to transgenic pigs.
  • the transgenic pig may be produced using engineered pig cells.
  • it relates to a method for producing a transgenic pig by transplanting a nucleus extracted from an engineered pig cell into an enucleated egg to produce offspring, and a transgenic pig produced thereby.
  • the transgenic pig may be a pig having a full-length or partial nucleic acid sequence of the artificially engineered PERV gene in its genome.
  • somatic cell nuclear transfer may be used using engineered porcine cells to produce transgenic pigs.
  • step (c) microinjecting and fusing the nucleus of the engineered porcine cell of step (a), that is, the nuclear donor cell, into the enucleated oocyte of step (b);
  • step (d) activating the oocyte fused in step (c);
  • one aspect disclosed by the present specification relates to a transgenic pig organ.
  • the transgenic pig organ may be an organ obtained from a transgenic pig.
  • the transgenic pig organ may be any organ that can be transplanted, such as heart, liver, kidney, and small intestine.
  • the transplant may be a homograft or a heterograft.
  • gRNA was designed as follows using http://www.rgenome.net/be-designer/.
  • each gRNA sequence is PERV-A, PERV -B and PERV-C were analyzed for simultaneous targeting, and only gRNAs capable of simultaneously targeting PERV-A, PERV-B, and PERV-C were selected with one gRNA.
  • a gRNA at a position close to the Start Codon was finally selected and used (Table 5).
  • guide RNAs targeting SEQ ID NO: 132 and SEQ ID NO: 139, respectively, were designed.
  • Piggybac vector (#20960) and Target-AID vector (#79620; pcDNA3.1_pCMV-nCas-PmCDA1-ugi pH1-gRNA (HPRT)) were purchased from Addgene.
  • PERV-gag and PERV-pol targeting sgRNAs were synthesized with the U6 promoter sequence (U6-sgGag and U6-sgPol).
  • An All-in-one PiggyBac vector was constructed using the above vectors (FIG. 2). Primer sequences used in vector construction are as follows (Table 6):
  • the vector was designed so that all of the sequences encoding the guide RNAs including the guide domain sequences of SEQ ID NO: 66 and SEQ ID NO: 81 were included in the vector.
  • nCas9 nickase Cas9
  • UGI uracil-DNA glycosylase inhibitor
  • PmCDA1 cytidine deaminase 1
  • NeoR neomycin resistance
  • KanR kanamycin resistance
  • pA poly A
  • the PWG #8 cell line (Passage: 3) to be used for transfection was cultured in the following medium composition:
  • Dulbecco's modified Angel medium (DMEM) (Gibco, Carlsbad, California, USA)
  • Non-essential amino acids (NEAA) (Gibco)
  • porcine fibroblast cell line PWG cells
  • PBS porcine fibroblast cell line
  • the prepared 3X10 5 PWG cells were transfected with 500 ng All-in-one PiggyBac vector prepared in Experimental Method 2 using a Neon electroporator (ThermoFisher).
  • the transduced PWG cells were cultured in a clean medium, and 4 hours later, the medium was replaced with a clean medium. Two days later, Neomycin (2 ⁇ g/mL) was treated for 10 days. Thereafter, colonies derived from single cells were selected and experiments were conducted. Since the All-in-one PiggyBac vector contains the antibiotic resistance gene NeoR as a selection marker, cells that survive when neomycin is treated are cells transduced with the transgene.
  • colonies #1 and #3 refer to single cell-derived colonies obtained after Neomycin selection. Referring to FIG. 3, bands corresponding to transgenes are well observed in both colonies #1 and #3.
  • BE-Analyzer rgenome.net
  • 5'-CAG-3' in the target sequence of the gag gene is modified to 5'-TAG-3'.
  • each sgRNA targeting the fusion editor protein (Cas9, cytidine deaminase, UGI) and the gag and pol genes included in the transgene integrated into the genome of the transfected cell is transfected. It was confirmed that the expression in the transfected cells could generate stop codons in the target sequences of the gag and pol genes in the genome of the cells. Therefore, the transfected cells using the composition of the present application can express PERV is believed to be significantly suppressed. In addition, since the fusion protein and sgRNA targeting the above-described PERV gene are expected to be continuously expressed, it is expected that PERV can be continuously inactivated regardless of the copy number of the PERV gene in the future.
  • the present application relates to a composition capable of artificially manipulating the PERV genome existing in multiple copies in the genome of a pig cell and a method of inactivating PERV using the same.
  • It relates to a target sequence of the PERV gene, a gRNA sequence for targeting the PERV gene, a primer sequence, and the like.

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Virology (AREA)
  • Biophysics (AREA)
  • Environmental Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Mycology (AREA)
  • Animal Husbandry (AREA)
  • Immunology (AREA)
  • Animal Behavior & Ethology (AREA)
  • AIDS & HIV (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

The present application relates to a composition capable of artificially manipulating a PERV genome existing in multiple copies in the genome of a porcine cell, and a method for inactivating PERV using same.

Description

돼지 내인성 레트로바이러스의 유전자를 불활성화하는 방법 및 이의 조성물 Method for inactivating the gene of porcine endogenous retrovirus and composition thereof
본 출원은 다중 카피로 존재하는 표적 유전자의 인위적 조작 또는 변형에 관한 것이다. 보다 구체적으로, 돼지 세포의 게놈 내 다중 카피로 존재하는 PERV 게놈을 인위적으로 조작할 수 있는 조성물 및 이를 이용한 PERV 불활성 방법에 관한 것이다.This application relates to the artificial manipulation or modification of target genes present in multiple copies. More specifically, it relates to a composition capable of artificially manipulating the PERV genome existing in multiple copies in the genome of a pig cell and a method of inactivating PERV using the same.
CRISPR-Cas 시스템은 표적하는 유전자 또는 핵산에 상보적인 서열을 가지는 guide RNA(gRNA)와 표적하는 유전자 또는 핵산을 절단할 수 있는 뉴클레아제인 CRISPR 효소로 구성되며, gRNA와 CRISPR 효소는 CRISPR 복합체를 형성하고, 형성된 CRISPR 복합체에 의해 표적하는 유전자 또는 핵산을 절단 또는 변형시킨다.The CRISPR-Cas system consists of a guide RNA (gRNA) having a sequence complementary to a target gene or nucleic acid and a CRISPR enzyme, a nuclease capable of cleaving the target gene or nucleic acid. The gRNA and the CRISPR enzyme form a CRISPR complex. and the target gene or nucleic acid is cut or modified by the formed CRISPR complex.
일반적으로 CRISPR-Cas 시스템에 의해 편집되는 유전자는 보통 1 카피 또는 2 카피로, 동시에 게놈 편집이 발생하여도 큰 문제가 발생하지 않는다. 하지만, 표적하는 유전자의 카피 수가 여러 개일 경우, 즉, 다중 카피의 유전자를 표적하는 경우, CRISPR-Cas 시스템을 이용한 유전자 편집은 동시 다발적으로 진행되는 핵산 절단 및 수복 과정을 통해 게놈의 재배열, 일부 핵산 절편의 손실 등의 심각한 문제가 발생할 수 있으며, 이로 인해 세포 독성 및 세포 사멸 등의 결과가 초래될 수 있다.In general, the gene edited by the CRISPR-Cas system is usually 1 copy or 2 copies, and even if genome editing occurs at the same time, no big problem arises. However, when the number of copies of the target gene is multiple, that is, when multiple copies of the gene are targeted, gene editing using the CRISPR-Cas system involves rearrangement of the genome through simultaneous nucleic acid cleavage and repair processes, Serious problems such as loss of some nucleic acid fragments may occur, which may result in cytotoxicity and cell death.
이러한 문제점은 이식용 장기 분야에서도 인식되고 있다. 이식용 장기의 부족은 장기 부전의 치료에 주요 장벽이다. 이식용 장기 부족의 해결 방안으로 돼지 장기가 유망한 것으로 간주되지만, 돼지 장기의 사용은 인간에 돼지 내인성 레트로바이러스(PERV)의 전이 또는 전파에 관한 문제가 여전히 해결되고 있지 않고 있다. PERV는 돼지에는 무해하지만 인간에 전이 또는 전파될 경우, 레트로바이러스에 의해 발생할 수 있는 다양한 질환 등이 발생할 잠재적 가능성이 있다. 이러한 누제를 해결하기 위해, PERV가 불활성된 돼지의 생산이 필요한 실정이다. This problem is also recognized in the field of organs for transplantation. The shortage of organs for transplantation is a major barrier to the treatment of organ failure. Although porcine organs are considered promising as a solution to the shortage of organs for transplantation, the use of porcine organs remains unresolved for transmission or transmission of porcine endogenous retrovirus (PERV) to humans. PERV is harmless to pigs, but when transferred or spread to humans, there is potential for various diseases caused by retroviruses. In order to solve these problems, it is necessary to produce pigs in which PERV is inactivated.
최근 연구에 따르면, 돼지 신장 상피 세포주(PK15)에서 PERV가 62 카피로 존재하는 것을 확인하였고, 이를 CRISPR/Cas 시스템으로 다중 편집하고자 시도하였다. 하지만 대부분의 세포는 사멸하였고 오직 일부만 PERV가 불활성된 것을 확인하였다. 이는 제한적인 성공으로, 동시적으로 발생하는 게놈 편집에 의한 게놈의 재배열, 낮은 효율 등의 부가적인 문제점이 여전히 존재한다.According to a recent study, it was confirmed that PERV exists in 62 copies in a porcine kidney epithelial cell line (PK15), and multiple editing was attempted with the CRISPR/Cas system. However, most of the cells died and only some confirmed that PERV was inactivated. This has been a limited success, but additional problems such as rearrangement of the genome due to concurrent genome editing and low efficiency still exist.
따라서, 이식용 장기의 잠재적 공급원의 확보를 위한 다중 카피의 유전자를 동시적으로 편집하기 위한 효율적인 기술이 필요한 상황이다. Therefore, there is a need for an efficient technique for simultaneously editing multiple copies of genes to secure potential sources of organs for transplantation.
본 출원의 일 과제는, 돼지 내인성 레트로 바이러스(porcine endogenous retrovirus, PERV)의 유전자를 인위적으로 조작하는 조성물을 제공하는 것을 목적으로 한다.One object of the present application is to provide a composition for artificially manipulating the gene of porcine endogenous retrovirus (PERV).
본 출원의 다른 과제는, 돼지 내인성 레트로 바이러스 유전자를 인위적으로 불활성화하는 방법을 제공하는 것을 목적으로 한다.Another object of the present application is to provide a method for artificially inactivating a porcine endogenous retrovirus gene.
본 출원의 또 다른 과제는, 상기 방법을 이용한 돼지 세포 또는/및 돼지 또는/및 돼지 장기를 제공하는 것을 목적으로 한다.Another object of the present application is to provide a pig cell or / and pig or / and pig organ using the above method.
전술한 본 출원의 과제를 해결하기 위하여, 돼지의 게놈에 다중카피로 존재하는, 돼지 내인성 레트로바이러스(porcine endogenous retrovirus, PERV)를 불활성화하는 방법이 제공된다.In order to solve the above problems of the present application, a method for inactivating porcine endogenous retrovirus (PERV), which is present in multiple copies in the pig genome, is provided.
돼지 세포에 유전자 조작용 조성물을 도입시키는 단계;를 포함하고,Incorporating a composition for genetic manipulation into pig cells;
이 때, 상기 유전자 조작용 조성물은,At this time, the composition for genetic manipulation,
(a) PERV의 표적유전자의 표적 서열을 표적화할 수 있는 가이드 RNA 또는 이를 코딩하는 핵산서열;(a) a guide RNA capable of targeting a target sequence of a target gene of PERV or a nucleic acid sequence encoding the same;
(b) Cas 단백질 또는 이를 코딩하는 핵산서열; 및(b) a Cas protein or a nucleic acid sequence encoding the same; and
(c) 시티딘 디아미네이즈 또는 이를 코딩하는 핵산서열;(c) cytidine deaminase or a nucleic acid sequence encoding the same;
을 포함하고,including,
이 때, 상기 PERV의 표적유전자는, gag 유전자, pol 유전자 및 env 유전자 중 선택되는 하나 이상이고,At this time, the target gene of the PERV is at least one selected from the gag gene, the pol gene, and the env gene,
상기 표적서열은 5'-CAG-3', 5'-CAA-3', 5'-CGA-3', 5'-CTA-3', 5'-CCA-3' 및 5'-TCA-3'의 뉴클레오타이드 서열 중 하나 이상의 뉴클레오타이드 서열을 포함하고, 이 때, 표적 서열은 상기 PERV 유전자의 연속하는 10bp 내지 30bp 서열 영역에 위치하고,The target sequence is 5'-CAG-3', 5'-CAA-3', 5'-CGA-3', 5'-CTA-3', 5'-CCA-3' and 5'-TCA-3 At least one nucleotide sequence of the nucleotide sequence of ', wherein the target sequence is located in a continuous 10 bp to 30 bp sequence region of the PERV gene,
상기 Cas 단백질은 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophiles) 유래의 Cas9 단백질, 스타필로코커스 아우레우스 (Staphylococcus aureus) 유래의 Cas9 단백질, 스타필로코커스 아우리쿨라리스(Staphylococcus auricularis) 및 Cpf1 단백질로 이루어진 군에서 선택되고,The Cas protein is a Cas9 protein derived from Streptococcus pyogenes, a Cas9 protein derived from Campylobacter jejuni, a Cas9 protein derived from Streptococcus thermophiles, and a Staphylococcus au It is selected from the group consisting of Cas9 protein derived from Staphylococcus aureus, Staphylococcus auricularis and Cpf1 protein,
상기 불활성화는 상기 표적서열 내에 종결 코돈을 생성함으로써, PERV의 표적유전자의 발현이 감소 또는 억제되고,The inactivation reduces or suppresses the expression of the target gene of PERV by generating a stop codon in the target sequence,
상기 다중카피로 존재하는PERV를 불활성화하는 것을 특징으로 하는 방법이 제공될 수 있다.A method characterized by inactivating PERV present in the multiple copies may be provided.
이 때, 상기 종결 코돈은 5'-TAG-3', 5'-TAA-3' 및 5'-TGA-3' 중 선택되는 어느 하나 이상의 뉴클레오타이드 서열인 것을 특징으로 하는 방법이 제공될 수 있다.At this time, a method characterized in that the stop codon is any one or more nucleotide sequences selected from 5'-TAG-3', 5'-TAA-3' and 5'-TGA-3' may be provided.
전술한 본 출원의 다른 과제를 해결하기 위하여, 돼지 내인성 레트로바이러스(porcine endogenous retrovirus, PERV)를 불활성화하기 위한, 유전자 조작용 조성물이 제공된다.In order to solve the other object of the present application described above, a composition for genetic manipulation is provided for inactivating porcine endogenous retrovirus (PERV).
상기 조성물은,The composition,
(a) SEQ ID NOs: 66 내지 130에서 선택되는 어느 하나 이상의 가이드 도메인 서열을 포함하는, 가이드RNA 또는 이를 코딩하는 핵산;(a) a guide RNA comprising one or more guide domain sequences selected from SEQ ID NOs: 66 to 130, or a nucleic acid encoding the same;
(b) Cas 단백질 또는 이를 코딩하는 핵산서열; 및(b) a Cas protein or a nucleic acid sequence encoding the same; and
(c) 시티딘 디아미네이즈(cytidine deaminase) 또는 이를 코딩하는 핵산서열;(c) cytidine deaminase or a nucleic acid sequence encoding the same;
을 포함하고,including,
이 때, 상기 PERV의 표적유전자는, gag 유전자, pol 유전자 및 env 유전자 중 선택되는 하나 이상이고,At this time, the target gene of the PERV is at least one selected from the gag gene, the pol gene, and the env gene,
상기 가이드 도메인은 PERV 유전자의 표적 서열 중 가이드핵산 결합 표적서열과 상보적 결합을 형성할 수 있고,The guide domain may form a complementary bond with a guide nucleic acid binding target sequence among target sequences of the PERV gene,
상기 가이드RNA는 가이드 도메인 서열 내에 5'-CAG-3', 5'-CAA-3', 5'-CGA-3', 5'-CUA-3', 5'-CCA-3' 및 5'-UCA-3'의 뉴클레오타이드 서열 중 하나 이상의 서열을 포함하고,The guide RNA is 5'-CAG-3', 5'-CAA-3', 5'-CGA-3', 5'-CUA-3', 5'-CCA-3' and 5' in the guide domain sequence. -Contains one or more of the nucleotide sequences of UCA-3',
상기 Cas 단백질은 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophiles) 유래의 Cas9 단백질, 스타필로코커스 아우레우스 (Staphylococcus aureus)유래의 Cas9 단백질, 스타필로코커스 아우리쿨라리스(Staphylococcus auricularis) 및 Cpf1 단백질로 이루어진 군에서 선택되는 것을 특징으로 하는 조성물이 제공될 수 있다.The Cas protein is a Cas9 protein derived from Streptococcus pyogenes, a Cas9 protein derived from Campylobacter jejuni, a Cas9 protein derived from Streptococcus thermophiles, and a Staphylococcus au A composition characterized by being selected from the group consisting of a Cas9 protein derived from Staphylococcus aureus, a Staphylococcus auricularis, and a Cpf1 protein may be provided.
또한, 전술한 본 출원의 또 다른 과제를 해결하기 위하여, 돼지 세포가 제공된다.In addition, in order to solve another object of the present application described above, pig cells are provided.
상기 돼지 세포는,The pig cells,
gag 유전자, pol 유전자 및 env 유전자에서 선택되는 하나이상의 유전자가 불활성화된 돼지 내인성 레트로바이러스(porcine endogenous retrovirus, PERV)를 게놈 내에 포함하고, A porcine endogenous retrovirus (PERV) in which at least one gene selected from the gag gene, pol gene, and env gene is inactivated is included in the genome,
상기 불활성화된 유전자 내에는 각각 적어도 2개 이상의 종결 코돈이 포함된 돼지 세포로서, A pig cell containing at least two or more stop codons in each of the inactivated genes,
상기 종결 코돈은 5'-TAG-3', 5'-TAA-3' 및 5'-TGA-3' 중 선택되는 어느 하나 이상의 뉴클레오타이드 서열이고,The stop codon is any one or more nucleotide sequences selected from 5'-TAG-3', 5'-TAA-3' and 5'-TGA-3',
상기 불활성화된 PERV는 게놈 내에 다중카피로 존재하며The inactivated PERV exists in multiple copies in the genome and
PERV의 발현량이 불활성 전과 비교하여 50% 이상 감소된 것을 특징으로 하는 돼지세포가 제공될 수 있다. 즉, 불활성화된 PERV 유전자가 불활성 전과 비교하여 50% 이상 존재하는 것을 특징으로 하는 돼지세포가 제공될 수 있다.Porcine cells characterized in that the expression level of PERV is reduced by 50% or more compared to before inactivation can be provided. That is, a pig cell characterized in that the inactivated PERV gene is present at 50% or more compared to before inactivation can be provided.
본 출원에 따르면 다음과 같은 효과가 발생한다.According to this application, the following effects occur.
첫째, 본 출원에 의하면, 돼지 내인성 레트로 바이러스의 유전자를 인위적으로 조작하는 조성물을 제공할 수 있게 된다.First, according to the present application, it is possible to provide a composition for artificially manipulating the gene of a porcine endogenous retrovirus.
둘째, 본 출원에 의해 제공되는 조성물을 이용함으로써, 돼지 내인성 레트로 바이러스의 유전자를 인위적으로 불활성화하는 방법을 제공할 수 있게 된다.Second, by using the composition provided by the present application, it is possible to provide a method for artificially inactivating a gene of a pig endogenous retrovirus.
셋째, 본 출원에 의해 제공되는 방법을 이용함으로써, 돼지 내인성 레트로 바이러스의 유전자가 인위적으로 조작된 돼지 세포 또는/및 돼지 또는/및 돼지 장기를 제공할 수 있게 된다.Thirdly, by using the method provided by the present application, it is possible to provide pig cells or/and pigs or/and pig organs artificially engineered with pig endogenous retrovirus genes.
도 1은 본 출원 기술의 모식도를 나타낸 도면이다. PAM은 protospacer adjacent motif을 지칭하고, UGI는 Uracil DNA glycosylase inhibitor를 지칭한다.1 is a diagram showing a schematic diagram of the technology of the present application. PAM refers to a protospacer adjacent motif, and UGI refers to a uracil DNA glycosylase inhibitor.
도 2는 본 출원에 사용한 벡터를 도시한 도면이다. 화살표는 본 출원에 사용된 트랜스진의 인테그레이션 여부를 확인하기 위해 사용된 프라이머의 위치를 표시한 것이다.2 is a diagram showing vectors used in this application. Arrows indicate the positions of primers used to check whether the transgene used in this application is integrated.
도 3은 본 출원의 트랜스진의 세포 내 인테그레이션 여부를 확인한 도면이다. Colony #1, #3 은 각각 Neomycin selection 후 얻어진 단일 세포 유래의 콜로니를 의미한다.3 is a view confirming whether the transgene of the present application is integrated into a cell. Colonies #1 and #3 refer to colonies derived from single cells obtained after Neomycin selection, respectively.
도 4는 본 출원의 PERV의 gag 유전자에 종결코돈이 생성된 것을 확인한 결과를 도시한 도면이다.4 is a diagram showing the results of confirming that a stop codon was generated in the gag gene of PERV of the present application.
도 5는 본 출원의 PERV의 pol 유전자에 종결코돈이 생성된 것을 확인한 결과를 도시한 도면이다.5 is a diagram showing the results of confirming that a stop codon was generated in the pol gene of PERV of the present application.
본 출원에 첨부된 도면, 이하의 설명을 참조하여, 출원의 내용을 더욱 상세하게 설명한다. 상기 첨부된 도면은 출원의 구현예를 포함하지만, 모든 구현예를 포함하고 있지 않다. 또한, 본 출원의 내용은 다양한 형태로 구체화될 수 있으며 하기에서 설명되는 특정 구현예로 제한되지 않는다. 즉, 본 출원은 다양한 변경을 가할 수 있고 여러 가지 실시예들을 가질 수 있다. 본 출원에 따른 실시예를 기준으로 본 출원의 구성과 특징을 설명하였으나 본 출원은 이에 한정되지 않으며, 본 출원의 사상과 범위 내에서 다양하게 변경 또는 변형할 수 있음은 본 출원이 속하는 기술분야의 당업자에게 명백한 것이며, 따라서 이와 같은 변경 또는 변형은 첨부된 특허청구범위에 속함을 밝혀둔다.The content of the application will be described in more detail with reference to the accompanying drawings and the following description. The accompanying drawings include embodiments of the application, but do not include all embodiments. In addition, the subject matter of the present application may be embodied in various forms and is not limited to the specific implementations described below. That is, the present application can make various changes and have various embodiments. Although the configuration and characteristics of the present application have been described based on the embodiments according to the present application, the present application is not limited thereto, and it is possible to make various changes or modifications within the spirit and scope of the present application in the technical field to which this application belongs. It will be apparent to those skilled in the art, and thus such changes or modifications are intended to fall within the scope of the appended claims.
달리 정의되지 않는 한, 본 명세서에서 사용되는 모든 기술적 및 과학적 용어는 본 발명이 속하는 기술분야의 당업자에 의해 통상적으로 이해되는 것과 동일한 의미를 가진다. 본 명세서에 기재된 것과 유사 또는 동일한 방법 및 물질이 본 발명의 실행 또는 시험에서 사용될 수 있다. 본 명세서에서 언급된 모든 간행물, 특허 출원, 특허 및 기타 다른 참고문헌은 전체가 참고로 포함된다. 추가로, 물질, 방법 및 실시예는 단지 예시적이며, 제한하는 것으로 의도되지 않는다.Unless defined otherwise, all technical and scientific terms used herein have the same meaning as commonly understood by one of ordinary skill in the art to which this invention belongs. Methods and materials similar or equivalent to those described herein may be used in the practice or testing of the present invention. All publications, patent applications, patents and other references mentioned herein are incorporated by reference in their entirety. Additionally, the materials, methods, and examples are illustrative only and not intended to be limiting.
용어 “표적 서열”은 표적 유전자 또는 핵산 내에 존재하는 뉴클레오타이드 서열로, 구체적으로는 표적 유전자 또는 핵산 내에 표적 영역의 일부 뉴클레오타이드 서열이며, 이때 “표적 영역”은 표적 유전자 또는 핵산 내에 가이드핵산-에디터단백질에 의해 변형될 수 있는 부위이다. 이 때, 상기 표적 서열은 가이드핵산 결합서열 또는 가이드핵산 비결합서열일 수 있다. 또한, 표적 영역은 염기 변형 효소에 의해 염기치환이 유도되는 뉴클레오타이드를 포함하는 영역이다. 용어 표적 영역은 표적 부위와 혼용되어 사용될 수 있다.The term "target sequence" is a nucleotide sequence present in a target gene or nucleic acid, specifically, a partial nucleotide sequence of a target region in a target gene or nucleic acid, wherein the "target region" is a guide nucleic acid-editor protein in a target gene or nucleic acid. It is a site that can be modified by In this case, the target sequence may be a guide nucleic acid binding sequence or a guide nucleic acid non-binding sequence. In addition, the target region is a region including nucleotides in which base substitution is induced by a base modification enzyme. The term target region may be used interchangeably with target site.
상기 “가이드핵산 결합 서열(guide nucleic acid-binding sequence)”은 가이드핵산의 가이드 도메인에 포함되는 가이드 서열과 일부 또는 완전한 상보성을 가지는 뉴클레오타이드서열로, 가이드핵산의 가이드 도메인에 포함되는 가이드 서열과 상보적인 결합을 할 수 있다. 용어 가이드핵산 결합 서열은 가이드핵산 결합 표적서열과 혼용되어 사용될 수 있다.The "guide nucleic acid-binding sequence" is a nucleotide sequence having partial or complete complementarity with the guide sequence included in the guide domain of the guide nucleic acid, and is complementary to the guide sequence included in the guide domain of the guide nucleic acid. can combine The term guide nucleic acid binding sequence may be used interchangeably with guide nucleic acid binding target sequence.
상기 “가이드핵산 비결합 서열(guide nucleic acid-non-binding sequence)”은 가이드핵산의 가이드 도메인에 포함되는 가이드 서열과 일부 또는 완전한 상동성을 가지는 뉴클레오타이드서열로, 가이드핵산의 가이드 도메인에 포함되는 가이드 서열과 상보적인 결합을 할 수 없다. 용어 가이드핵산 비결합 서열은 가이드핵산 비결합 표적서열과 혼용되어 사용될 수 있다.The "guide nucleic acid-non-binding sequence" is a nucleotide sequence having partial or complete homology with the guide sequence included in the guide domain of the guide nucleic acid, and the guide included in the guide domain of the guide nucleic acid unable to form complementary sequences. The term guide nucleic acid non-binding sequence may be used interchangeably with guide nucleic acid non-binding target sequence.
이하에서, 표적 서열이라 함은 두 가지의 뉴클레오타이드서열 정보 모두를 의미하는 용어로 사용될 수 있다. 예를 들어, 표적 유전자의 경우, 표적 서열은 표적 유전자 DNA의 transcribed strand의 서열 정보를 의미하는 것일 수도 있고, 또는 non-transcribed strand의 뉴클레오타이드서열 정보를 의미하는 것일 수도 있다.Hereinafter, the target sequence may be used as a term meaning both types of nucleotide sequence information. For example, in the case of a target gene, the target sequence may mean sequence information of a transcribed strand of the target gene DNA, or nucleotide sequence information of a non-transcribed strand.
용어 “표적화(targeting)”는 표적 유전자 또는 핵산 내에 존재하는 표적 서열 중 가이드핵산 결합 서열과 상보적 결합을 하는 것을 의미한다. 이때, 상기 상보적 결합은 100%의 완전한 상보적 결합일 수 있고, 또는 70% 이상 100% 미만의 불완전한 상보적 결합일 수 있다. 따라서, “표적화하는 gRNA”는 표적 유전자 또는 핵산 내에 존재하는 표적 서열 중 가이드핵산 결합 서열과 상보적 결합을 하는 gRNA를 의미한다.The term “targeting” means complementary binding with a guide nucleic acid binding sequence among target sequences present in a target gene or nucleic acid. At this time, the complementary bond may be 100% complete complementary bond, or 70% or more and less than 100% incomplete complementary bond. Accordingly, "targeting gRNA" refers to a gRNA that complementarily binds to a guide nucleic acid binding sequence among target sequences present in a target gene or nucleic acid.
용어 “인위적으로 조작된(artificially modified or engineered or artificially engineered)”이라는 용어는 자연상태에서 일어나는 존재 그대로의 상태가 아닌, 인위적으로 변형을 가한 상태를 의미한다. 이하에서, 비자연적인 인위적으로 조작된 또는 변형된 돼지의 내인성 레트로바이러스(Porcine Endogenous Retrovirus, PERV) 유전자는 인위적인 PERV 유전자라는 용어와 혼용되어 사용할 수 있다. 상기 비자연적인 인위적으로 조작된 또는 변형된 PERV 유전자는 인위적으로 조작된 또는 변형된 gag 유전자, 인위적으로 조작된 또는 변형된 pol 유전자, 인위적으로 조작된 또는 변형된 env 유전자 중 선택되는 하나 이상의 유전자를 포함하는 의미로 사용할 수 있다.The term “artificially modified or engineered or artificially engineered” means a state artificially modified, not a state as it exists in nature. Hereinafter, the non-natural, artificially engineered or modified porcine endogenous retrovirus (PERV) gene may be used interchangeably with the term artificial PERV gene. The non-natural, artificially engineered or modified PERV gene is an artificially engineered or modified gag gene, an artificially engineered or modified pol gene, and an artificially engineered or modified env gene. It can be used in an inclusive sense.
용어 “PERV 유전자”는 PERV의 RNA 게놈 서열 및 이의 DNA 대응 서열을 모두 포함하는 것을 의미하며, 예를 들어, PERV의 RNA 게놈 서열에 의해 전사된 cDNA 서열, cDNA 서열에 의해 생성된 이중 가닥의 DNA 서열 및 숙주세포의 게놈에 삽입된 DNA 서열을 모두 포함한다. 또한 PERV 유전자는 PERV의 게놈과 혼용되어 사용될 수 있다.The term "PERV gene" is meant to include both the RNA genome sequence of PERV and its DNA counterpart sequence, for example, a cDNA sequence transcribed by the RNA genome sequence of PERV, a double-stranded DNA generated by the cDNA sequence It includes both sequences and DNA sequences inserted into the genome of a host cell. Also, the PERV gene may be used interchangeably with the genome of PERV.
용어 “불활성화(inactivation 또는 deactivation)”는 표적 핵산 또는 유전자를 인위적으로 조작한 상태를 의미한다. 특히 i) 표적 핵산 또는 유전자 내 표적 부위가 절단(cleavage)되어 기능이 감소 및/또는 상실된 상태; 및 ii) 표적 핵산 또는 유전자의 전사 및/또는 번역이 되지 못하거나 및/또는 억제 및/또는 감소된 상태;를 의미한다.The term “inactivation or deactivation” refers to a state in which a target nucleic acid or gene is artificially manipulated. In particular, i) a state in which a target site in a target nucleic acid or gene is cleaved and the function is reduced and/or lost; and ii) a state in which transcription and/or translation of the target nucleic acid or gene is not and/or suppressed and/or reduced.
상기 불활성화는 질병을 유발하는 유전자 또는 비정상적인 기능을 가지는 유전자를 불활성화함으로써, 표적 유전자 또는 핵산 또는 단백질의 발현을 조절하여 질병이 발생되는 것을 억제하거나 감소시킬 수 있다. 예를 들어, PERV의 유전자가 불활성화될 경우, i) PERV의 유전자 내 표적 부위가 절단되어 기능이 감소 또는 상실된 상태;, 및 ii) PERV의 유전자 중 표적 유전자의 전사 및/또는 번역이 억제 또는 감소되어 유전자 또는 단백질의 발현이 감소 및/또는 억제된 상태;를 모두 포함하는 것으로 해석되어야 한다. 특히, 본 출원에서는 PERV의 불활성화라고 함은, 인위적으로 종결코돈을 생성하여 PERV의 표적 유전자의 전사 및/또는 번역을 억제함으로써 발현이 감소 및/또는 억제된 상태로 해석되어야 한다.The inactivation may suppress or reduce the occurrence of a disease by inactivating a disease-causing gene or a gene having an abnormal function, thereby regulating the expression of a target gene or nucleic acid or protein. For example, when the PERV gene is inactivated, i) the target site in the PERV gene is cleaved and the function is reduced or lost; and ii) the transcription and / or translation of the target gene among the PERV genes is inhibited or It should be interpreted as including all; a state in which expression of a gene or protein is reduced and/or suppressed. In particular, in the present application, inactivation of PERV should be interpreted as a state in which expression is reduced and/or suppressed by artificially generating a stop codon to inhibit transcription and/or translation of a PERV target gene.
I. 본 출원의 기술적 특징 요약I. SUMMARY OF TECHNICAL FEATURES OF THIS APPLICATION
본 출원은 돼지의 게놈에 다중카피로 존재하는 돼지의 내인성 레트로바이러스(Porcine Endogenous Retrovirus, PERV)를 인위적으로 조작할 수 있는 조성물 및 방법에 관한 것으로, 특히, 표적서열 내 종결코돈을 형성하게 함으로써 PERV를 불활성화하는 것을 특징으로 한다.The present application relates to a composition and method capable of artificially manipulating a porcine endogenous retrovirus (PERV) present in multiple copies in the pig genome, and in particular, by forming a stop codon in a target sequence, PERV It is characterized by inactivating.
구체적으로, 본 출원에서 표적하는 돼지 게놈 내 PERV의 표적영역 내 표적서열에서 단일 염기 치환으로 종결 코돈(stop codon)을 형성할 수 있는 서열을 찾고, 단일염기 치환을 유도 또는 발생시킬 수 있는 염기 변형 효소를 이용한다.Specifically, in the target sequence in the target region of PERV in the porcine genome targeted in this application, a sequence capable of forming a stop codon with a single base substitution is found, and a base modification capable of inducing or generating a single base substitution use enzymes.
이러한 방법으로 PERV의 표적영역 내 서열을 종결 코돈으로 조작하기 위해, CRISPR/Cas 시스템 및 단일염기 치환을 유도 또는 발생시키는 염기 변형 효소 예를 들어, 디아미네이즈(deaminase)를 함께 이용한다. 본 출원의 방법에 의하면, 돼지의 게놈에 존재하는 PERV의 gag 유전자, pol 유전자, env 유전자를 특정 표적영역으로 하여, 해당 표적영역에 특이적으로 종결 코돈을 형성하여, PERV가 불활성화 되는 효과가 발생된다.In order to manipulate the sequence in the target region of PERV with a stop codon in this way, the CRISPR/Cas system and a base modifying enzyme that induces or generates a single base substitution, such as deaminase, are used together. According to the method of the present application, the gag gene, pol gene, and env gene of PERV present in the genome of a pig are used as specific target regions, and a stop codon is formed specifically in the target region, thereby inactivating PERV. occurs
그러므로, 본 출원은 다음과 같은 기술적 특징을 가진다.Therefore, this application has the following technical features.
i) CRISPR/Cas 시스템을 이용함으로써, PERV의 특정 유전자를 표적으로 하여 특이적으로 타겟할 수 있다.i) By using the CRISPR/Cas system, a specific gene of PERV can be targeted and specifically targeted.
ii) CRISPR/Cas 시스템으로 PERV의 특정 유전자를 위치 특이적으로 타겟하면서, 단일 염기 치환을 유도 또는 발생시키는 염기 변형 효소를 함께 이용함으로써, 목적하는 위치에 인위적으로 종결 코돈을 생성할 수 있다. 생성된 종결 코돈은 인해, PERV의 특정 유전자의 전사 또는 번역 과정에서 작용하여, PERV의 특정 유전자의 발현을 억제할 수 있다.ii) A stop codon can be artificially generated at a desired position by using a base modifying enzyme that induces or generates a single base substitution while site-specifically targeting a specific gene of PERV with the CRISPR/Cas system. The generated stop codon can act in the process of transcription or translation of a specific gene of PERV, thereby suppressing the expression of a specific gene of PERV.
iii) PERV의 특정 유전자를 표적하여, 표적 서열 특이적으로 높은 효율과 정확성을 가지고, 동시에 종결 코돈을 생성하여 PERV 발현이 억제되므로, 다중카피로 존재하는 PERV를 조작하더라도 세포가 사멸되지 않아 안전한 효과가 있다.iii) By targeting a specific gene of PERV, it has high efficiency and accuracy specific to the target sequence, and at the same time generates a stop codon to suppress PERV expression, so even if PERV that exists in multiple copies is manipulated, cells are not killed, so a safe effect there is
특히, 종래 기술의 문제점인, 다중 카피의 PERV를 동시에 넉아웃(knock-out) 시켜 불활성화할 때 세포 자체가 쉽게 사멸하는 등 세포를 인위적으로 조작하는 효율이 낮다는 점을 극복하고자 하였다.In particular, it was intended to overcome the problem of the prior art, such as the low efficiency of artificially manipulating cells, such as easy death of cells themselves when inactivating by simultaneously knocking out multiple copies of PERV.
이에 대해서 조금 더 구체적으로 설명하면 다음과 같다.A more detailed description of this is as follows.
II. 본 출원의 기술적(작동) 원리II. Technical (operational) principle of the present application
전 세계적으로 장기의 이종 이식이 절실히 요구되고 있는 실정이나, 주요 장벽인 면역학적 요인이 여전히 문제화되고 있다. 이러한 문제는, 이종 이식으로 각광받고 있는 무균돼지에서도 발견되었다. 무균돼지의 게놈에 존재하는 PERV가 체외에서 인간의 세포를 감염시킬 가능성이 있다고 보고되면서, 이를 해결하고자 많은 노력을 기울이고 있다. 하지만, PERV는 모든 종류의 돼지 게놈(genome) 상에 다중카피 상태로 프로바이러스(provirus) 형태 또는 바이러스 입자(viral particle) 형태로 존재하고, 생식선(germ line)을 통해 전파되어 제어가 힘들다. 따라서, PERV가 체외에서 인간의 세포를 감염시키지 않게 하기 위한, 효율적인 방안이 필요하다.Although organ xenotransplantation is urgently required worldwide, immunological factors, which are a major barrier, are still problematic. These problems were also found in germ-free pigs, which are in the limelight for xenotransplantation. As it has been reported that PERV present in the genome of germ-free pigs has the potential to infect human cells in vitro, many efforts are being made to solve this problem. However, PERV exists in the form of a provirus or viral particle in multiple copies on all types of pig genomes, and is difficult to control because it spreads through the germ line. Therefore, an efficient method is needed to prevent PERV from infecting human cells in vitro.
본 출원은 상기 문제를 해결하기 위해, CRISPR/Cas 시스템 및 염기 변형 효소를 함께 사용하여, PERV를 불활성화 한다. In order to solve the above problem, the present application uses a CRISPR/Cas system and a base modifying enzyme together to inactivate PERV.
특히, 본 출원은 DNA를 절단하는 CRISPR/Cas 시스템(예를 들어, gRNA 및 Cas nickase) 및 염기 변형효소(예를 들어, deaminase)를 함께 사용하는 것을 특징으로 한다.In particular, the present application is characterized by the use of a CRISPR/Cas system (eg, gRNA and Cas nickase) and a base modifying enzyme (eg, deaminase) for cleaving DNA.
본 출원의 PERV를 불활성화 시키는 원리에 대해서는 도 1의 모식도를 참고할 수 있다 도 1에서는, Cas9의 니케이즈(nCas9)와 시티딘 디아미네이즈(cytidine deaminase)를 예를 들어 설명한다. 도 1은 본 출원의 기술적 원리를 예시적으로 설명하고 있는 것으로, 이로 인해 한정되지 않는다.For the principle of inactivating PERV of the present application, reference may be made to the schematic diagram of FIG. 1. In FIG. 1, nCas9 and cytidine deaminase of Cas9 are described as an example. 1 illustrates the technical principle of the present application by way of example, and is not limited thereto.
도 1을 참고하면, 돼지 게놈에 존재하는 PERV를 불활성화하는 원리는 다음과 같다.Referring to Figure 1, the principle of inactivating PERV present in the pig genome is as follows.
PERV 불활성화를 위해, PERV의 표적 유전자 또는 핵산을 타겟하기 위한 gRNA 및 Cas9 nickase를 포함하는 CRISPR/Cas 시스템이 필요하다. 또한, 시토신(cytosine, C)을 티민(thymine, T)으로 치환하여 종결코돈을 생성하기 위한, 시티딘 디아미네이즈(cytidine deaminse)와 우라실 DNA 글리코실레이즈 억제제(Uracil DNA glycosylase inhibitor)가 필요하다.For PERV inactivation, a CRISPR/Cas system containing gRNA and Cas9 nickase to target the target gene or nucleic acid of PERV is required. In addition, cytidine deaminse and uracil DNA glycosylase inhibitor are required to generate a stop codon by replacing cytosine (C) with thymine (T) .
도 1에서, gRNA가 5'-CAG-3' 서열 및 PAM 서열을 포함하고 있는 표적 서열을 타겟팅하고, Cas9 nicakase와 상호작용하여, Cas9 nickase가 표적 부위 중 단일가닥을 절단한다. In FIG. 1, the gRNA targets a target sequence including the 5'-CAG-3' sequence and the PAM sequence, interacts with Cas9 nickase, and Cas9 nickase cuts a single strand in the target site.
본 출원에서 목적하는 표적 서열의 특정 염기를 치환하여 종결코돈을 생성하기 위해서, 표적 서열을 인식하는 Cas9의 특성은 유지되면서, 상기 종결코돈이 생성되는 스트랜드의 반대 스트랜드를 절단하는 nickase Cas9(nCas9)를 사용한다.In this application, in order to generate a stop codon by substituting a specific base of a target sequence of interest, while maintaining the characteristics of Cas9 that recognizes the target sequence, the strand opposite to the strand where the stop codon is generated Nickase Cas9 (nCas9) Use
이에 기반하여, Cas9 nickase와 함께 시티딘 디아미네이즈를 사용하면, Cas9 nickase에 의해 잘려진 DNA 가닥의 반대 가닥에서 시티딘 디아미네이즈와 UGI가 작동하여, 표적 서열 내 5'-CAG-3' 서열 중 시티딘이 티민으로 치환되어 5'-TAG-3' 서열로 변경된다. 이로써, 표적 서열이 종결코돈 서열인 5'-TAG-3' 서열을 가지게 됨으로써, 표적 핵산 또는 유전자가 불활성화된다.Based on this, when cytidine deaminase is used together with Cas9 nickase, cytidine deaminase and UGI act on the opposite strand of the DNA strand cleaved by Cas9 nickase, resulting in the 5'-CAG-3' sequence in the target sequence. Among them, cytidine is substituted with thymine to change the sequence to 5'-TAG-3'. As a result, the target nucleic acid or gene is inactivated by having the 5'-TAG-3' sequence, which is a stop codon sequence, in the target sequence.
이에 대해서, 자세히 설명하면 하기와 같다.This is described in detail as follows.
CRISPR/Cas 시스템의 gRNA는 표적 핵산 또는 유전자 서열과 결합하고(도 1의 target), Cas9 nickase와 상호작용함으로써, Cas9 nickase가 표적 부위 중 단일가닥을 절단한다(도 1의 가위모양), PERV가 불활성화된다. 즉, 본 출원에서 CRIPSR/Cas 시스템을 이용함으로써, 상기 절단은 돼지 게놈 내 표적 유전자 특이적일 뿐만 아니라, 표적 유전자의 특정 위치 특이적으로 일어나는 특징을 가진다.The gRNA of the CRISPR/Cas system binds to a target nucleic acid or gene sequence (target in FIG. 1) and interacts with Cas9 nickase, whereby Cas9 nickase cuts a single strand in the target site (scissors in FIG. 1), and PERV Inactivated. That is, by using the CRIPSR/Cas system in the present application, the cleavage is not only specific to the target gene in the porcine genome, but also has a characteristic that occurs specifically at a specific position of the target gene.
이와 같이, CRISPR/Cas 시스템의 gRNA가 표적 유전자를 인지할 수 있기 때문에, 돼지 게놈에 존재하는 PERV의 유전자 중, 복제에 가장 중요한 역할을 수행하는 유전자인 gag 유전자, pol 유전자, env 유전자를 표적할 수 있다. 더불어, Cas9 nickase는 표적 유전자의 표적 부위를 절단함으로써, 본 출원의 PERV 불활성화를 위한 CRISPR/Cas 시스템은 목적하는 유전자를 특이적으로 타겟할 수 있는 것이다.As such, since the gRNA of the CRISPR/Cas system can recognize the target gene, the gag gene, pol gene, and env gene, which play the most important role in replication among the PERV genes present in the pig genome, can be targeted. can In addition, Cas9 nickase cuts the target site of the target gene, so that the CRISPR / Cas system for PERV inactivation of the present application can specifically target the desired gene.
이 때, Cas9 nickase는 PAM(Protospacer adjacent motif) 서열을 인식하기 때문에, 표적 서열은, PAM 서열을 포함하고 있어야 한다.At this time, since Cas9 nickase recognizes a PAM (Protospacer adjacent motif) sequence, the target sequence must include the PAM sequence.
상기 PAM 서열을 고려하여 gRNA를 설계할 수 있다. 설계하는 방법을 간략하게 설명하면, 표적 핵산 또는 유전자 내 서열 중 PAM 서열이 존재하는 부위를 찾고, 해당 PAM 서열로부터 ~20bp의 서열을 선정하여 설계할 수 있다.A gRNA can be designed in consideration of the PAM sequence. Briefly, the design method can be designed by finding a region where a PAM sequence is present in a sequence in a target nucleic acid or gene, and selecting a sequence of ~20 bp from the corresponding PAM sequence.
한편, 본 출원은 PERV 불활성화를 위해, CRISPR/Cas 시스템과 함께 시티딘 디아미네이즈를 사용한다. 특히, CRISPR/Cas 시스템과 염기 변형 효소(예를 들어, 시티딘 디아미네이즈와 UGI)를 함께 이용하면, 시토신이 티민으로 치환되어, 결과적으로 CRISPR/Cas 시스템이 표적하는 표적 유전자 또는 핵산 내의 표적서열의 특정 서열이 종결코돈으로 되게끔 하기 위한 목적을 달성하기 위해서이다.Meanwhile, the present application uses cytidine deaminase together with the CRISPR/Cas system for PERV inactivation. In particular, when the CRISPR/Cas system is used in combination with base modifying enzymes (e.g., cytidine deaminase and UGI), cytosine is replaced by thymine, resulting in the target gene or target within the nucleic acid targeted by the CRISPR/Cas system. This is to achieve the purpose of making a specific sequence of sequences become a stop codon.
시티딘 디아미네이즈는 시토신을 티민으로 치환하는 활성을 가진 효소로, 일 실시예에서 표적 서열 내 PAM 서열이 존재하는 가닥에 위치하는 시토신을 티민으로 변환시킨다. Cytidine deaminase is an enzyme having an activity of substituting thymine for cytosine, and in one embodiment, cytosine located on a strand where a PAM sequence is present in a target sequence is converted to thymine.
이 때, 염기의 치환 효율을 높이기 위해서, 시티딘 디아미네이즈와 함께 우라실(uracil, U)을 시토신으로 바꾸는 효소(Uracil DNA glycosylase; UDG)를 억제하는 단백질인 UGI를 추가적으로 더 사용한다. 이 경우, UGI는 시티딘 디아미네이즈로 인한, 탈아민(deamination)의 중간 생성 물질인 우라실이 UDG에 의해 시토신으로 복원되는 것을 저해하는 역할을 한다. 이후, 우라실이 포함된 가닥을 주형으로 한 DNA replication 또는 mismatch-repair 과정에서 반대편 가닥의 구아닌(G)이 아데닌(A)으로 치환되어, 결과적으로 C-G pair에서 T-A pair로 단일 염기쌍이 치환된다. 일 구체예로, CRISPR/Cas 시스템, 시티딘 디아미네이즈 및 UGI의 작용에 의해, 표적 서열 내 PAM 서열이 존재하는 가닥에 위치하는 시토신이 티민으로 치환된다.At this time, in order to increase the efficiency of base substitution, UGI, a protein that inhibits uracil (U) to cytosine conversion enzyme (Uracil DNA glycosylase; UDG), is additionally used along with cytidine deaminase. In this case, UGI acts to inhibit the restoration of uracil, an intermediate product of deamination, to cytosine by UDG due to cytidine deaminase. Then, in the process of DNA replication or mismatch-repair using the strand containing uracil as a template, guanine (G) on the opposite strand is substituted with adenine (A), resulting in a single base pair substitution from C-G pair to T-A pair. In one embodiment, by the action of the CRISPR/Cas system, cytidine deaminase and UGI, cytosine located on the strand where the PAM sequence is present in the target sequence is substituted with thymine.
시티딘 디아미네이즈는 시토신을 티민으로 변경하는데 관여하는 효소이기 때문에, 이를 고려하면 표적서열에 종결코돈 서열로 변경가능한 서열인 예를 들어, 5'-CAG-3', 5'-CAA-3', 5'-CGA-3', 5'-CTA-3', 5'-CCA-3' 및 5'-TCA-3'의 중 선택되는 어느 하나 이상의 뉴클레오타이드 서열을 포함하는 표적서열을 본 출원에서 사용할 수 있다.Since cytidine deaminase is an enzyme involved in changing cytosine to thymine, considering this, a sequence that can be changed to a stop codon sequence in the target sequence, for example, 5'-CAG-3', 5'-CAA-3 ', 5'-CGA-3', 5'-CTA-3', 5'-CCA-3' and 5'-TCA-3', a target sequence comprising any one or more nucleotide sequences selected from the present application can be used in
이와 같이, CRISPR/Cas 시스템과 디아미네이즈(deaminase)가 함께 작동되면, CRIPSR/Cas 시스템이 PERV의 gag 유전자, pol 유전자, env 유전자 중 어느 하나 이상의 유전자를 표적하여 표적부위를 절단하고, 표적 서열 내에 종결코돈이 형성되어 상기 PERV 유전자 중 하나 이상의 유전자의 전사 또는/및 번역이 억제되어 PERV 유전자의 발현이 감소 또는/및 억제됨으로써, PERV 불활성화 효과를 더욱 상승시킬 수 있다.As such, when the CRISPR/Cas system and deaminase work together, the CRIPSR/Cas system targets any one or more genes of PERV's gag gene, pol gene, and env gene, cleave the target site, and A stop codon is formed within the PERV gene to inhibit transcription or/or translation of one or more of the PERV genes, thereby reducing or/or suppressing expression of the PERV gene, thereby further enhancing the PERV inactivation effect.
이하에서, 본 출원의 상기 기술적 특징을 가진 PERV를 인위적으로 불활성화하기 위한 조작용 조성물 및 이를 이용한 PERV 불활성화 방법을 보다 자세하게 설명하도록 한다.Hereinafter, a composition for manipulation for artificially inactivating PERV having the above technical features of the present application and a method for inactivating PERV using the same will be described in more detail.
III. PERV 불활성화를 위한, 유전자 조작용 조성물III. Composition for genetic engineering for PERV inactivation
본 출원에 의해 개시되는 일 태양은 상기에서 설명한 PERV를 인위적으로 불활성화를 위한 유전자 조작용 조성물에 관한 것이다. 상기 유전자 조작용 조성물은 인위적으로 조작된 PERV 유전자의 생성에 이용될 수 있다. 또한, 상기 유전자 조작용 조성물에 의해 인위적으로 조작된 PERV 유전자는 PERV 유전자의 전이, PERV 유전자에 의해 암호화되는 단백질의 발현을 조절할 수 있다.One aspect disclosed by the present application relates to a composition for genetic engineering for artificially inactivating PERV described above. The composition for genetic engineering may be used for the production of artificially engineered PERV genes. In addition, the PERV gene artificially manipulated by the composition for genetic engineering may control the transfer of the PERV gene and the expression of the protein encoded by the PERV gene.
1) 표적 유전자1) target gene
본 출원의 상기 유전자 조작용 조성물이 표적하는 표적 유전자는 PERV이다.The target gene targeted by the composition for genetic manipulation of the present application is PERV.
PERV는 모든 종류의 돼지 게놈(genome) 상에 다중카피 상태로 프로바이러스(provirus) 형태 또는 바이러스 입자(viral particle) 형태로 존재하고, 생식선(germ line)을 통해 전파되어 제어가용이하지 않다. PERV는 돼지의 게놈에 삽입되어 존재하는 내인성 레트로바이러스(endogenous retroviruses)를 의미하는 것으로 멘델의 유전법칙에 의해 다음 세대에 전달되며, 감염에 의하여 전달되기도 한다.PERV exists in the form of a provirus or viral particle in multiple copies on all types of pig genomes, and is not easy to control because it spreads through the germ line. PERV refers to endogenous retroviruses that are inserted into the pig's genome and are passed on to the next generation according to Mendel's genetic laws, and are also transmitted by infection.
PERV는 RetroviridaeGammaretrovirus 속으로 분류되며, 염기서열 및 아미노산 서열과 형태학적으로 백혈병이나 면역 결핍증을 일으키는 쥐 백혈병 바이러스(murine leukemia virus)와 고양이 백혈병 바이러스(feline leukemia virus)와 같이 감마-레트로바이러스에 속한다. 상기 바이러스는 생식선전이를 하고, 돼지 내에서는 어떠한 증상도 보이지 않으며, 대부분은 유전자 결실 또는 돌연변이로 인해 실제 바이러스를 만들 수 없는 형태로 존재하고 있다. PERV is classified into Retroviridae and Gammaretrovirus , and belongs to gamma-retroviruses, such as murine leukemia virus and feline leukemia virus, which cause leukemia or immunodeficiency in terms of nucleotide sequence, amino acid sequence and morphology. . The virus undergoes germline transmission, does not show any symptoms in pigs, and most exist in a form in which actual viruses cannot be made due to gene deletion or mutation.
복제 가능한 PERV의 서브타입(subtype)은 PERV-A, PERV-B 및 PERV-C이 포함된다.Replicable PERV subtypes include PERV-A, PERV-B and PERV-C.
PERV-A와 PERV-B는 사람 세포, 돼지 세포, 다른 종의 세포에 감염이 가능한 반면, PERV-C는 돼지 세포 및 HT1080이라는 인간 세포에만 부분적으로 감염하는 것으로 보고되어 있다(Takeuchi et al., 1998). 일부 연구에서 PERV-C를 주형으로 하고 수용체 결합 부위만 PERV-A으로 재조합한 바이러스가 인간 세포에 대해서 500배의 감염성을 나타내는 것을 확인하였다(Birke et al., 2004; Harrison et al., 2004; Scobie et al., 2004). 또한 한번 인간세포에 감염된 인간화된 PERV는 돼지세포에서 생성된 PERV에 비하여 인간세포로의 감염성이 증가한다는 보고가 있다.PERV-A and PERV-B can infect human cells, pig cells, and cells of other species, while PERV-C has been reported to only partially infect pig cells and human cells called HT1080 (Takeuchi et al., 1998). In some studies, it has been confirmed that a virus recombined with PERV-C as a template and only the receptor binding site with PERV-A exhibits 500-fold infectivity against human cells (Birke et al., 2004; Harrison et al., 2004; Scobie et al., 2004). In addition, it has been reported that humanized PERV, once infected with human cells, has increased infectivity to human cells compared to PERV produced in pig cells.
일 예로, 본 출원의 상기 유전자 조작용 조성물은 PERV-A, PERV-B 및 PERV-C 중 선택되는 어느 두 개 이상의 서브타입을 동시에 표적할 수 있다.For example, the composition for genetic manipulation of the present application may simultaneously target any two or more subtypes selected from among PERV-A, PERV-B and PERV-C.
본 출원에 의해 개시되는 표적 유전자는 PERV 유전자에 포함된 일부 유전자일 수 있다.Target genes disclosed by this application may be some genes included in the PERV gene.
본 출원에 의해 개시되는 표적 유전자는 PERV 유전자 중 gag 유전자일 수 있다.The target gene disclosed by this application may be a gag gene among PERV genes.
본 출원에 의해 개시되는 표적 유전자는 PERV 유전자 중 pol 유전자일 수 있다.The target gene disclosed by this application may be a pol gene among PERV genes.
본 출원에 의해 개시되는 표적 유전자는 PERV 유전자 중 env 유전자일 수 있다.The target gene disclosed by the present application may be an env gene among PERV genes.
PERV 유전자는 gag 유전자, pol 유전자 및 env 유전자를 포함한다. 이들은 PERV 복제에 가장 중요한 역할을 수행하는 유전자다. 구체적으로, gag 유전자, pol 유전자, env 유전자가 알려져 있다. 구체적으로, gag 유전자는 코어 단백질을 암호화하고, pol 유전자는 역전사 효소를 암호화하고, env 유전자는 외피 단백질을 암호화하고 있다.PERV genes include the gag gene, pol gene and env gene. These are the genes that play the most important role in PERV replication. Specifically, gag gene, pol gene, and env gene are known. Specifically, the gag gene encodes the core protein, the pol gene encodes the reverse transcriptase, and the env gene encodes the envelope protein.
이들 중 바이러스의 효소 및 구조 단백질을 형성하는 gag 유전자와 pol 유전자는 PERV-A, PERV-B, PERV-C에서 90% 이상의 유사성을 보이는 반면, 숙주 세포로의 감염에 관계하는 env 유전자의 유사성은 큰 차이를 보인다.Among these, the gag gene and pol gene, which form viral enzymes and structural proteins, show a similarity of more than 90% in PERV-A, PERV-B, and PERV-C, whereas the similarity of the env gene related to host cell infection is makes a big difference
본 출원에 의해 개시되는 표적 유전자는 PERV 유전자 중 gag 유전자, pol 유전자 및 env 유전자 중 선택된 둘 이상의 유전자일 수 있다.The target gene disclosed by the present application may be two or more genes selected from among the gag gene, the pol gene, and the env gene among the PERV genes.
일 예로, 표적 유전자로 PERV의 pol 유전자 및 gag 유전자를 표적하여 불활성화할 경우, i) 역전사 및 복제에 관여하는 pol 유전자 영역이 비활성화됨으로써, 역전사 및 복제가 저해되고, ii) 동시에 성장에 필수적인 코어 단백질을 암호화하는 gag 유전자가 비활성화됨으로써, 바이러스 입자가 만들어지는 것이 차단될 수 있다.For example, when the pol gene and the gag gene of PERV are targeted and inactivated as target genes, i) the pol gene region involved in reverse transcription and replication is inactivated, thereby inhibiting reverse transcription and replication, and ii) core essential for growth at the same time By inactivating the gag gene, which encodes the protein, the production of viral particles can be blocked.
본 출원에 의해 개시되는 표적 유전자는 PERV 유전자 중 gag 유전자, pol 유전자 및 env 유전자일 수 있다.The target gene disclosed by this application may be a gag gene, a pol gene, and an env gene among PERV genes.
본 출원에 의해 개시되는 표적 유전자는 PERV 서브타입의 유전자 중 gag 유전자, pol 유전자 및 env 유전자 중 선택된 둘 이상의 유전자일 수 있다.The target gene disclosed by the present application may be two or more genes selected from the gag gene, the pol gene, and the env gene among the genes of the PERV subtype.
상기 PERV 유전자는 돼지 세포의 게놈 내에 PERV의 전장 게놈 서열(whole genome sequence) 또는 일부 핵산서열로 존재할 수 있다.The PERV gene may exist as a whole genome sequence or a partial nucleic acid sequence of PERV in the genome of a pig cell.
이때, 상기 일부 핵산서열은 gag 유전자, pol 유전자 및 env 유전자 중 하나 이상의 유전자의 전체 핵산서열일 수 있다.In this case, the partial nucleic acid sequence may be the entire nucleic acid sequence of one or more of the gag gene, pol gene, and env gene.
이때, 상기 일부 핵산서열은 gag 유전자, pol 유전자 및 env 유전자 중 하나 이상의 유전자의 일부 핵산서열일 수 있다.In this case, the partial nucleic acid sequence may be a partial nucleic acid sequence of one or more of the gag gene, pol gene, and env gene.
PERV 유전자는 돼지 세포의 게놈 내에 1 내지 100개의 카피로 존재할 수 있다.The PERV gene can be present in 1 to 100 copies within the genome of a pig cell.
이때, 상기 PERV 유전자는 PERV의 전장 게놈 서열 또는 일부 핵산서열일 수 있다.In this case, the PERV gene may be a full-length genome sequence or a partial nucleic acid sequence of PERV.
이때, 돼지 세포의 게놈 내에 1 내지 100개의 PERV 유전자 카피는 연속적 및/또는 비연속적으로 존재할 수 있다.At this time, 1 to 100 copies of the PERV gene in the genome of the pig cell may be contiguous and/or non-contiguous.
예를 들어, 상기 PERV 유전자가 돼지 세포의 게놈 내에 60개의 카피가 존재하는 경우, 10개의 카피는 연속적으로 존재하고 나머지 50개의 카피는 각각 비연속적으로 존재할 수 있다. 또는 상기 PERV 유전자가 돼지 세포의 게놈 내에 20개의 카피가 존재하는 경우, 10개의 카피는 연속적으로 존재하고 나머지 10개의 카피도 연속적으로 존재하나, 연속하는 10개 카피의 두 그룹은 비연속적으로 존재할 수 있다.For example, if 60 copies of the PERV gene are present in the genome of a pig cell, 10 copies may exist continuously and the remaining 50 copies may each exist non-contiguously. Alternatively, if 20 copies of the PERV gene exist in the genome of a pig cell, 10 copies exist continuously and the remaining 10 copies also exist continuously, but two groups of 10 consecutive copies may exist non-contiguously. there is.
이때, 돼지 세포의 게놈 내에 1 내지 100개의 카피는 PERV의 전장 게놈 서열 및 일부 핵산서열이 혼합되어 존재할 수 있다.At this time, 1 to 100 copies in the genome of the pig cell may exist in a mixture of the full-length genome sequence and some nucleic acid sequences of PERV.
예를 들어, 상기 PERV 유전자가 돼지 세포의 게놈 내에 5개의 카피가 존재하는 경우, 2개의 카피는 PERV의 전장 게놈 서열로 존재하고, 나머지 3개의 카피는 일부 핵산서열로 존재할 수 있다. 또는 상기 PERV 유전자가 돼지 세포의 게놈 내에 13개의 카피가 존재하는 경우, 5개의 카피는 PERV의 전장 게놈 서열로 존재하고, 4개의 카피는 PERV 유전자 중 gag 유전자의 전체 핵산서열로 존재하며, 나머지 4개의 카피는 PERV 유전자 중 pol 유전자의 일부 핵산서열로 존재할 수 있다.For example, if 5 copies of the PERV gene exist in the genome of a pig cell, 2 copies may exist as the full-length genome sequence of PERV, and the remaining 3 copies may exist as partial nucleic acid sequences. Alternatively, when the PERV gene has 13 copies in the genome of a pig cell, 5 copies are present as the full-length genome sequence of PERV, 4 copies are present as the entire nucleic acid sequence of the gag gene among the PERV genes, and the remaining 4 A copy of the dog may exist as a partial nucleic acid sequence of the pol gene in the PERV gene.
앞서 설명하였다시피, 본 출원의 상기 유전자 조작용 조성물에 포함된 CRISPR/Cas 시스템이 작동하기 위해서는, 표적 유전자의 표적서열 내에 PAM(Protospacer adjacent motif) 서열을 포함하고 있어야 한다.As described above, in order for the CRISPR/Cas system included in the genetic manipulation composition of the present application to operate, the target gene must contain a PAM (Protospacer adjacent motif) sequence in the target sequence.
이는 CRISPR/Cas 시스템에서 Cas 단백질이 PAM 서열을 인식하기 때문에, 이의 작동을 위해서 표적서열 내에 PAM 서열이 포함되어야 한다. 특히, PAM 서열과 인접한 영역에, 가이드핵산 비결합 서열이 있고, 반대 가닥에 가이드핵산 결합 서열이 존재한다.Since the Cas protein recognizes the PAM sequence in the CRISPR/Cas system, the PAM sequence must be included in the target sequence for its operation. In particular, there is a guide nucleic acid non-binding sequence in the region adjacent to the PAM sequence, and a guide nucleic acid binding sequence is present on the opposite strand.
그래서, CRISPR/Cas 시스템이 작동하기 위해서는, 표적 유전자 내 표적서열을 PAM을 기준으로 결정할 수 있다. 이로 인해, 본 출원의 표적 유전자는 CRISPR/Cas 시스템이 작동가능하도록 설계되기 때문에, 표적 유전자의 위치가 PAM 특이적인 특징이 있다.So, in order for the CRISPR/Cas system to work, the target sequence in the target gene can be determined based on PAM. Because of this, since the target gene of the present application is designed to enable the CRISPR/Cas system to operate, the location of the target gene has a PAM-specific feature.
구현예에서, In an embodiment,
본 출원에 의해 개시되는 표적 서열 즉, 가이드핵산 비결합서열은 표적 유전자의 핵산 서열 내의 PAM 서열의 5' 말단 및/또는 3' 말단에 인접한 연속하는 10 내지 35개의 뉴클레오타이드 서열일 수 있다.The target sequence disclosed by the present application, that is, the guide nucleic acid non-binding sequence may be a sequence of 10 to 35 consecutive nucleotides adjacent to the 5' end and/or 3' end of the PAM sequence in the nucleic acid sequence of the target gene.
이때, 상기 PAM 서열은 예를 들어, 하기의 서열 중 1 이상일 수 있다(5'에서 3'방향으로 기재함).In this case, the PAM sequence may be, for example, one or more of the following sequences (written in the 5' to 3' direction).
NGG (N은 A, T, C 또는 G임);NGG (N is A, T, C or G);
NNNNRYAC (N은 각각 독립적으로 A, T, C 또는 G이고, R은 A또는 G이고, Y는 C또는 T임);NNNNRYAC (N is each independently A, T, C or G, R is A or G, and Y is C or T);
NNGG (N은 각각 독립적으로 A, T, C 또는 G임);NNGG (N is each independently A, T, C or G);
NNAGAAW (N은 각각 독립적으로 A, T, C 또는 G이고, W는 A 또는 T임);NNAGAAW (N is each independently A, T, C or G, and W is A or T);
NNNNGATT (N은 각각 독립적으로 A, T, C 또는 G임);NNNNGATT (N is each independently A, T, C or G);
NNGRR(T) (N은 각각 독립적으로 A, T, C 또는 G이고, R은 A 또는 G임); 및TTN (N은 A, T, C 또는 G임).NNGRR(T) (N is each independently A, T, C or G, and R is A or G); and TTN (N is A, T, C or G).
일 예로, 상기 표적 서열(가이드핵산 비결합서열)은 PERV 유전자의 핵산 서열 내의 PAM 서열의 5' 말단 및/또는 3' 말단에 인접한 연속하는 10 내지 35개의 뉴클레오타이드 서열일 수 있다.For example, the target sequence (guide nucleic acid non-binding sequence) may be a sequence of 10 to 35 consecutive nucleotides adjacent to the 5' end and/or the 3' end of the PAM sequence in the nucleic acid sequence of the PERV gene.
다른 일 예로, 상기 표적 서열은 gag 유전자의 핵산 서열 내의 PAM 서열의 5' 말단 및/또는 3' 말단에 인접한 연속하는 10 내지 35개의 뉴클레오타이드 서열일 수 있다.As another example, the target sequence may be a sequence of 10 to 35 consecutive nucleotides adjacent to the 5' end and/or 3' end of the PAM sequence in the nucleic acid sequence of the gag gene.
또 다른 일 예로, 상기 표적 서열은 pol 유전자의 핵산 서열 내의 PAM 서열의 5' 말단 및/또는 3' 말단에 인접한 연속하는 10 내지 35개의 뉴클레오타이드 서열일 수 있다.As another example, the target sequence may be a sequence of 10 to 35 consecutive nucleotides adjacent to the 5' end and/or 3' end of the PAM sequence in the nucleic acid sequence of the pol gene.
다른 일 예로, 상기 표적 서열은 env 유전자의 핵산 서열 내의 PAM 서열의 5' 말단 및/또는 3' 말단에 인접한 연속하는 10 내지 35개의 뉴클레오타이드 서열일 수 있다.As another example, the target sequence may be a sequence of 10 to 35 consecutive nucleotides adjacent to the 5' end and/or the 3' end of the PAM sequence in the nucleic acid sequence of the env gene.
또한, 본 출원에서, 상기 표적유전자의 표적서열은 서열 내에 종결코돈으로 염기 치환 가능한 서열을 포함하고 있어야 한다. 상기 염기 치환은 단일염기 치환을 유도 또는 발생시키는 염기 변형 효소에 의해 이루어질 수 있다.In addition, in the present application, the target sequence of the target gene must include a sequence capable of base substitution with a stop codon in the sequence. The base substitution may be effected by a base modifying enzyme that induces or generates a single base substitution.
이 때, 상기 염기 변형 효소는 디아미네이즈일 수 있다. In this case, the base modifying enzyme may be deaminase.
예를 들어, 디아미네이즈는 시토신을 티민으로 변경(치환)하는 시티딘 디아미네이즈, 아데닌을 구아닌으로 치환하는 아데노신 디아미네이즈 등이 포함될 수 있다.For example, deaminase may include cytidine deaminase that changes (substitutes) cytosine into thymine, adenosine deaminase that substitutes adenine into guanine, and the like.
편의상, 이하에서는 시토신을 티민으로 변경하는 시티딘 디아미네이즈를 중심으로 서술한다.For convenience, cytidine deaminase, which changes cytosine to thymine, will be mainly described below.
예를 들어, 상기 시티딘 디아미네이즈가 표적서열에 작동되면, 표적서열 내 종결코돈으로 염기 치환가능한 서열 중 시토신이 티민으로 치환되어, 종결코돈을 생성시킬 수 있다.For example, when the cytidine deaminase is operated on a target sequence, cytosine in a sequence capable of base substitution with a stop codon in the target sequence is substituted with thymine, thereby generating a stop codon.
일 구체예로, 본 출원이 표적하는 PERV 서열은 종결코돈화 대상 서열로서, 5'-CAG-3', 5'-CAA-3', 5'-CGA-3', 5'-CTA-3', 5'-CCA-3' 및 5'-TCA-3'의 중 선택되는 어느 하나 이상의 뉴클레오타이드 서열을 포함하고 있다. 이에 대해서, 하기 [표 1] 및 [표 2]에 기재한다.In one embodiment, the PERV sequence targeted by the present application is a stop codonation target sequence, 5'-CAG-3', 5'-CAA-3', 5'-CGA-3', 5'-CTA-3 ', 5'-CCA-3' and 5'-TCA-3' and includes any one or more nucleotide sequences selected from. Regarding this, it is described in [Table 1] and [Table 2] below.
상기 종결코돈화 대상 서열은 5'에서 3' 방향으로, PERV 표적 유전자의 가이드핵산 비결합서열에 포함되거나(표 1); 또는 이의 반대 스트랜드 상에서 가이드핵산 결합서열에 포함되어 있지 않을 수 있다. 설명을 위해서, 가이드핵산 비결합서열이 포함된 가닥을 제1스트랜드로 하고, 반대 스트랜드(가이드핵산 결합서열 포함)를 제2 스트랜드로 한다The stop codon target sequence is included in the guide nucleic acid non-binding sequence of the PERV target gene in the 5' to 3' direction (Table 1); Or it may not be included in the guide nucleic acid binding sequence on its opposite strand. For explanation, the strand containing the guide nucleic acid non-binding sequence is referred to as the first strand, and the opposite strand (including the guide nucleic acid binding sequence) is referred to as the second strand.
i) 제1 스트랜드 상에서 종결코돈을 생성하기 위한, 제1 스트랜드의 표적서열에 포함된 종결코돈화 대상 서열:i) a stop codon target sequence included in the target sequence of the first strand for generating a stop codon on the first strand:
본 출원에서 표적하는 PERV의 5'에서 3'방향의 스트랜드(즉, 가이드핵산 비결합 서열)에 5'-CAG-3', 5'-CAA-3' 및 5'-CGA-3' 중 선택되는 어느 하나 이상의 뉴클레오타이드 서열을 포함한 경우를 고려할 수 있다. 이 경우, 시토신을 티민으로 치환하는 시티딘 디아미네이즈가 작동하면, 종결코돈인 5'-TAG-3', 5'-TAA-3' 및 5'-TGA-3'로 변경된다(표 1).Selection of 5'-CAG-3', 5'-CAA-3' and 5'-CGA-3' to the 5' to 3' strand (i.e., guide nucleic acid non-binding sequence) of PERV targeted in this application It can be considered the case of including any one or more nucleotide sequences. In this case, when cytidine deaminase, which substitutes cytosine for thymine, works, the stop codons 5'-TAG-3', 5'-TAA-3' and 5'-TGA-3' are changed (Table 1 ).
제1 스트랜드의 표적서열에 포함된 종결코돈화 대상 서열Stop codonation target sequence included in the target sequence of the first strand 시티딘 디아미네이즈 처리 후After cytidine deaminase treatment
변경 서열change sequence
5'-CAG-3'5'-CAG-3' 5'-TAG-3'5'-TAG-3'
5'-CAA-3'5'-CAA-3' 5'-TAA-3'5'-TAA-3'
5'-CGA-3'5'-CGA-3' 5'-TAA-3'5'-TAA-3'
ii) 제2 스트랜드 상에서 종결코돈을 생성하기 위한, 제1 스트랜드의 표적서열에 포함된 종결코돈화 대상 서열:ii) a stop codon target sequence included in the target sequence of the first strand for generating a stop codon on the second strand:
동일한 관점에서, [표 1]의 제 1 스트랜드의 반대 스트랜드(제 2 스트랜드)에 종결코돈을 생성하는 경우를 고려할 수 있다. 다시 말해, [표 1]의 제 1 스트랜드에 종결코돈화 대상 서열로서, 5'-CTA-3', 5'-CCA-3' 및 5'-TCA-3' 중 선택되는 어느 하나 이상의 뉴클레오타이드 서열을 포함하고 있을 수 있다. 이 때, 시티딘 디아미네이즈가 작동하면, 시토신(C)이 티민(T)으로 치환되어, 상기 서열들은 5'-TTA-3'로 변경된다. 상기 변경된 서열(5'-TTA-3')을 포함하는 제1 스트랜드를 주형으로, DNA replication 또는 repair가 일어나면, 제 2스트랜드에서는, 상기 종결코돈화 대상 서열의 상보적인 서열(3'-GAT-5', 3'-GGT-5', 3'-AGT-5')이, 상기 변경된 서열(5'-TTA-3')의 상보적인 서열인 3'-AAT-5'로 변경된다. 즉, 제 2 스트랜드에 종결코돈인 5'-TAA-3'가 생성된다 (표 2).From the same point of view, the case of generating a stop codon on the opposite strand (second strand) of the first strand in [Table 1] can be considered. In other words, as a target sequence for stop codonation in the first strand of [Table 1], any one or more nucleotide sequences selected from 5'-CTA-3', 5'-CCA-3' and 5'-TCA-3' may contain At this time, when cytidine deaminase works, cytosine (C) is substituted with thymine (T), and the above sequences are changed to 5'-TTA-3'. When DNA replication or repair occurs using the first strand containing the altered sequence (5'-TTA-3') as a template, the second strand has a complementary sequence (3'-GAT- 5', 3'-GGT-5', 3'-AGT-5') is changed to 3'-AAT-5', which is a sequence complementary to the altered sequence (5'-TTA-3'). That is, the stop codon 5'-TAA-3' is generated on the second strand (Table 2).
제1스트랜드의 표적서열에 포함된 종결코돈화 대상 서열Stop codonation target sequence included in the target sequence of the first strand 시티딘 디아미네이즈 처리 후After cytidine deaminase treatment
제1스트랜드에 포함된included in the first strand
변경된 서열altered sequence
변경된 서열에 상보적인 제2 스트랜드에 포함된 종결코돈 서열Stop codon sequence included in the second strand complementary to the altered sequence
5'-CTA-3'5'-CTA-3' 5'-TTA-3'5'-TTA-3' 3'-AAT-5'3'-AAT-5'
5'-CCA-3'5'-CCA-3' 5'-TTA-3'5'-TTA-3' 3'-AAT-5'3'-AAT-5'
5'-TCA-3'5'-TCA-3' 5'-TTA-3'5'-TTA-3' 3'-AAT-5'3'-AAT-5'
본 출원에서 타겟하는 표적서열은 CRISPR/Cas 시스템이 작동하기 위한, PAM 서열 및 염기 변형효소가 작동하여 종결코돈을 생성할 수 있는 서열 (이하, 종결코돈화 대상 서열)을 모두 고려한 서열이다.The target sequence targeted in the present application is a sequence that considers both a PAM sequence for the CRISPR/Cas system to operate and a sequence capable of generating a stop codon by operating a base modifying enzyme (hereinafter, a target sequence for stop codonation).
본 출원에서 타겟하는 표적서열은 CRISPR/Cas 시스템이 작동하기 위한, PAM 서열 및 염기 변형효소가 작동하여 종결코돈을 생성할 수 있는 서열 (이하, 종결코돈화 대상 서열)을 모두 고려한 서열이다.The target sequence targeted in the present application is a sequence that considers both a PAM sequence for the CRISPR/Cas system to operate and a sequence capable of generating a stop codon by operating a base modifying enzyme (hereinafter, a target sequence for stop codonation).
따라서, 상기 [표 1] 및 [표 2]를 통해, 본 출원의 표적서열은 종결코돈화 대상 서열인 5'-CAG-3', 5'-CAA-3', 5'-CGA-3', 5'-CTA-3', 5'-CCA-3' 및 5'-TCA-3' 중 선택되는 어느 하나 이상의 뉴클레오타이드 서열을 반드시 포함한 서열이어야 한다.Therefore, through [Table 1] and [Table 2], the target sequence of the present application is 5'-CAG-3', 5'-CAA-3', 5'-CGA-3' , 5'-CTA-3', 5'-CCA-3' and 5'-TCA-3'.
일 구현예에서,In one embodiment,
본 출원에 의해 개시되는 표적 서열은 표적 유전자의 핵산 서열 내에 5'-CAG-3'을 포함하는 연속하는 10 내지 35개의 뉴클레오타이드 서열일 수 있다.The target sequence disclosed by this application may be a sequence of 10 to 35 consecutive nucleotides including 5'-CAG-3' in the nucleic acid sequence of the target gene.
본 출원에 의해 개시되는 표적 서열은 표적 유전자의 핵산 서열 내에 5'-CAA-3'을 포함하는 연속하는 10 내지 35개의 뉴클레오타이드 서열일 수 있다.The target sequence disclosed by this application may be a sequence of 10 to 35 consecutive nucleotides including 5'-CAA-3' in the nucleic acid sequence of the target gene.
본 출원에 의해 개시되는 표적 서열은 표적 유전자의 핵산 서열 내에 5'-CGA-3'을 포함하는 연속하는 10 내지 35개의 뉴클레오타이드 서열일 수 있다.The target sequence disclosed by this application may be a sequence of 10 to 35 consecutive nucleotides including 5'-CGA-3' in the nucleic acid sequence of the target gene.
본 출원에 의해 개시되는 표적 서열은 표적 유전자의 핵산 서열 내에 5'-CTA-3'을 포함하는 연속하는 10 내지 35개의 뉴클레오타이드 서열일 수 있다.The target sequence disclosed by this application may be a sequence of 10 to 35 consecutive nucleotides including 5'-CTA-3' in the nucleic acid sequence of the target gene.
본 출원에 의해 개시되는 표적 서열은 표적 유전자의 핵산 서열 내에 5'-CCA-3'을 포함하는 연속하는 10 내지 35개의 뉴클레오타이드 서열일 수 있다.The target sequence disclosed by this application may be a sequence of 10 to 35 consecutive nucleotides including 5'-CCA-3' in the nucleic acid sequence of the target gene.
본 출원에 의해 개시되는 표적 서열은 표적 유전자의 핵산 서열 내에 5'-TCA-3'을 포함하는 연속하는 10 내지 35개의 뉴클레오타이드 서열일 수 있다.The target sequence disclosed by this application may be a sequence of 10 to 35 consecutive nucleotides including 5'-TCA-3' in the nucleic acid sequence of the target gene.
이하, 본 발명의 일 구체예에서 사용할 수 있는 표적 서열들의 일 예들은 [표 3]에 정리하였으며, [표 3]에 기재된 표적 서열은 가이드핵산 비결합 서열로, 기재한 서열을 통해 상보적인 서열, 즉, 가이드핵산 결합 서열이 예측될 수 있다. Hereinafter, examples of target sequences that can be used in one embodiment of the present invention are summarized in [Table 3], and the target sequences described in [Table 3] are guide nucleic acid non-binding sequences, complementary sequences through the described sequences. , that is, the guide nucleic acid binding sequence can be predicted.
NameName Target geneTarget gene DirectionDirection Target (5' to 3', w/o PAM)Target (5' to 3', w/o PAM) SEQ ID NOSEQ ID No.
PERV-gag-1PERV-gag-1 gaggag ++ ttcaggttaagaagggacctttcaggttaagaagggacct SEQ ID NO: 1SEQ ID NO: 1
PERV-gag-2PERV-gag-2 gaggag ++ gcagacactcttcacagccggcagacactcttcacagccg SEQ ID NO: 2SEQ ID NO: 2
PERV-gag-3PERV-gag-3 gaggag ++ ccagaaagcctcagtggcccccagaaagcctcagtggccc SEQ ID NO: 3SEQ ID NO: 3
PERV-gag-4PERV-gag-4 gaggag ++ tcagagactggaagggttactcagagactggaagggtac SEQ ID NO: 4SEQ ID NO: 4
PERV-gag-6PERV-gag-6 gaggag -- agccatggtttaacccatggagccatggtttaacccatgg SEQ ID NO: 5SEQ ID NO: 5
PERV-gag-7PERV-gag-7 gaggag -- tcccaaccgaggcgagtcaatcccaaccgaggcgagtcaa SEQ ID NO: 6SEQ ID NO: 6
PERV-gag-8PERV-gag-8 gaggag -- gtcccaaccgaggcgagtcagtcccaaccgaggcgagtca SEQ ID NO: 7SEQ ID NO: 7
PERV-gag-9PERV-gag-9 gaggag ++ tccccgaatcctggctcttgtccccgaatcctggctcttg SEQ ID NO: 8SEQ ID NO: 8
PERV-gag-10PERV-gag-10 gaggag ++ gcgagagagaattctgttaggcgagagagaattctgttag SEQ ID NO: 9SEQ ID NO: 9
PERV-gag-11PERV-gag-11 gaggag ++ tccccaacgcctcacggggttccccaacgcctcacggggt SEQ ID NO: 10SEQ ID NO: 10
PERV-gag-12PERV-gag-12 gaggag ++ ccaacgcctcacggggttggccaacgcctcacggggttgg SEQ ID NO: 11SEQ ID NO: 11
PERV-gag-13PERV-gag-13 gaggag ++ gttgcaaaatgagattgacagttgcaaaatgagattgaca SEQ ID NO: 12SEQ ID NO: 12
PERV-gag-14PERV-gag-14 gaggag ++ ttgcaaaatgagattgacatttgcaaaatgagattgacat SEQ ID NO: 13SEQ ID NO: 13
PERV-pol-1PERV-pol-1 polpol ++ ggagcagtttccccaagcctggagcagtttccccaagcct SEQ ID NO: 14SEQ ID NO: 14
PERV-pol-2PERV-pol-2 polpol ++ cccacaggttattcaactgacccacaggttatcaactga SEQ ID NO: 15SEQ ID NO: 15
PERV-pol-3PERV-pol-3 polpol ++ acagtaccccttgagtagagacagtaccccttgagtagag SEQ ID NO: 16SEQ ID NO: 16
PERV-pol-4PERV-pol-4 polpol ++ ggtgcaggacatacacccaaggtgcaggacatacacccaa SEQ ID NO: 17SEQ ID NO: 17
PERV-pol-5PERV-pol-5 polpol ++ ggcccagatttgcaggagagggcccagatttgcaggagag SEQ ID NO: 18SEQ ID NO: 18
PERV-pol-6PERV-pol-6 polpol ++ cgggcagcgatggctgacggcgggcagcgatggctgacgg SEQ ID NO: 19SEQ ID NO: 19
PERV-pol-7PERV-pol-7 polpol ++ gacagtacaccctagaagacgacagtacaccctagaagac SEQ ID NO: 20SEQ ID NO: 20
PERV-pol-8PERV-pol-8 polpol ++ agaccagttctctgagactcagaccagttctctgagactc SEQ ID NO: 21SEQ ID NO: 21
PERV-pol-9PERV-pol-9 polpol ++ ccagttctctgagactccggccagttctctgagactccgg SEQ ID NO: 22SEQ ID NO: 22
PERV-pol-10PERV-pol-10 polpol ++ cagttctctgagactccggacagttctctgagactccgga SEQ ID NO: 23SEQ ID NO: 23
PERV-pol-11PERV-pol-11 polpol -- ccagttccgttcaggcgggaccagttccgttcaggcggga SEQ ID NO: 24SEQ ID NO: 24
PERV-pol-12PERV-pol-12 polpol -- accagttccgttcaggcgggaccagttccgttcaggcggg SEQ ID NO: 25SEQ ID NO: 25
PERV-pol-13PERV-pol-13 polpol -- tgtaccagttccgttcaggctgtaccagttccgttcaggc SEQ ID NO: 26SEQ ID NO: 26
PERV-pol-14PERV-pol-14 polpol -- ctccattcgaaggcaaaaagctccattcgaaggcaaaaag SEQ ID NO: 27SEQ ID NO: 27
PERV-pol-15PERV-pol-15 polpol -- cctccatggtcctagggtttcctccatggtcctagggttt SEQ ID NO: 28SEQ ID NO: 28
PERV-pol-16PERV-pol-16 polpol -- tcctccatggtcctagggtttcctccatggtcctagggtt SEQ ID NO: 29SEQ ID NO: 29
PERV-pol-17PERV-pol-17 polpol -- cttcccagtgagcgcctgggcttcccagtgagcgcctggg SEQ ID NO: 30SEQ ID NO: 30
PERV-pol-18PERV-pol-18 polpol -- ccagtattttttagccaccaccagtattttttagccacca SEQ ID NO: 31SEQ ID NO: 31
PERV-pol-19PERV-pol-19 polpol -- cttcagttgaataacctgtgcttcagttgaataacctgtg SEQ ID NO: 32SEQ ID NO: 32
PERV-pol-20PERV-pol-20 polpol -- ttctaagcagtcctgtttggttctaagcagtcctgtttgg SEQ ID NO: 33SEQ ID NO: 33
PERV-pol-21PERV-pol-21 polpol -- tcctagggtgtactgtcgtctcctagggtgtactgtcgtc SEQ ID NO: 34SEQ ID NO: 34
PERV-pol-22PERV-pol-22 polpol ++ agcgatggctgacggaggcaagcgatggctgacggaggca SEQ ID NO: 35SEQ ID NO: 35
PERV-pol-23PERV-pol-23 polpol ++ gctcaaatttcttttgaacagctcaaatttcttttgaaca SEQ ID NO: 36SEQ ID NO: 36
PERV-pol-24PERV-pol-24 polpol ++ tcaagatatacagtcctggttcaagatatacagtcctggt SEQ ID NO: 37SEQ ID NO: 37
PERV-pol-25PERV-pol-25 polpol ++ caagcctgggcagaaaccgccaagcctggggcagaaaccgc SEQ ID NO: 38SEQ ID NO: 38
PERV-pol-26PERV-pol-26 polpol ++ tgttcaaagattaatccaactgttcaaagattaatccaac SEQ ID NO: 39SEQ ID NO: 39
PERV-pol-27PERV-pol-27 polpol ++ gttcaaagattaatccaacagttcaaagattaatccaaca SEQ ID NO: 40SEQ ID NO: 40
PERV-pol-28PERV-pol-28 polpol ++ aaacaagtgagagagtttttaaacaagtgagagagttttt SEQ ID NO: 41SEQ ID NO: 41
PERV-pol-29PERV-pol-29 polpol ++ aacaagtgagagagtttttgaacaagtgagagagtttttg SEQ ID NO: 42SEQ ID NO: 42
PERV-pol-30PERV-pol-30 polpol ++ cccaaaccctaggaccatggcccaaaccctaggaccatgg SEQ ID NO: 43SEQ ID NO: 43
PERV-pol-31PERV-pol-31 polpol ++ caactattgattgaggagaccaactattgattgaggagac SEQ ID NO: 44SEQ ID NO: 44
PERV-pol-32PERV-pol-32 polpol ++ agcgcaaaaggctgagctcaagcgcaaaaggctgagctca SEQ ID NO: 45SEQ ID NO: 45
PERV-pol-33PERV-pol-33 polpol ++ caagctttgcggctggccgacaagctttgcggctggccga SEQ ID NO: 46SEQ ID NO: 46
PERV-pol-34PERV-pol-34 polpol ++ tccgagatttggaatacctatccgagatttggaataccta SEQ ID NO: 47SEQ ID NO: 47
PERV-env-1PERV-env-1 envenv ++ aacaggaaaatattcaaaagaacaggaaaatattcaaaag SEQ ID NO: 48SEQ ID NO: 48
PERV-env-2PERV-env-2 envenv ++ tgaacaggggcccccggccctgaacaggggccccccggccc SEQ ID NO: 49SEQ ID NO: 49
PERV-env-3PERV-env-3 envenv ++ cagcagctagagaaaggactcagcagctagagaaaggact SEQ ID NO: 50SEQ ID NO: 50
PERV-env-4PERV-env-4 envenv ++ accaggggtggtttgaaggaaccaggggtggtttgaagga SEQ ID NO: 51SEQ ID NO: 51
PERV-env-5PERV-env-5 envenv -- ccagcttaacgtgggatgcaccagcttaacgtgggatgca SEQ ID NO: 52SEQ ID NO: 52
PERV-env-6PERV-env-6 envenv -- tttccagtctccatcgttggtttccagtctccatcgttgg SEQ ID NO: 53SEQ ID NO: 53
PERV-env-7PERV-env-7 envenv -- ccatttccagtctccatcgtccatttccagtctccatcgt SEQ ID NO: 54SEQ ID NO: 54
PERV-env-8PERV-env-8 envenv -- gcccaccacctgttataaccgcccaccacctgttataacc SEQ ID NO: 55SEQ ID NO: 55
PERV-env-9PERV-env-9 envenv -- accatccttcaaaccaccccaccatccttcaaaccacccc SEQ ID NO: 56SEQ ID NO: 56
PERV-env-10PERV-env-10 envenv ++ actcgaggtgttgctcctagactcgaggtgttgctcctag SEQ ID NO: 57SEQ ID NO: 57
PERV-env-11PERV-env-11 envenv ++ ccgagtgtactaccatcctgccgagtgtactaccatcctg SEQ ID NO: 58SEQ ID NO: 58
PERV-env-12PERV-env-12 envenv ++ taccaaggccttctgagccataccaaggccttctgagcca SEQ ID NO: 59SEQ ID NO: 59
PERV-env-13PERV-env-13 envenv -- gtctataaggcgtttactacgtctataaggcgtttaactac SEQ ID NO: 60SEQ ID NO: 60
PERV-env-14PERV-env-14 envenv -- gaccatgacacagaaatcttgaccatgacacagaaatctt SEQ ID NO: 61SEQ ID NO: 61
PERV-env-15PERV-env-15 envenv -- accatccttcaaaccaccccaccatccttcaaaccacccc SEQ ID NO: 62SEQ ID NO: 62
PERV-env-16PERV-env-16 envenv -- acccactcgttctctaacaaacccactcgttctctaacaa SEQ ID NO: 63SEQ ID NO: 63
PERV-env-17PERV-env-17 envenv -- cgtcagagcagaaagcagggcgtcagagcagaaagcaggg SEQ ID NO: 64SEQ ID NO: 64
PERV-env-18PERV-env-18 envenv -- tcctatgcatgtccccttcctcctatgcatgtccccttcc SEQ ID NO: 65SEQ ID NO: 65
2) 에디터단백질2) Editor protein
본 출원에 의해 개시되는 상기 유전자 조작용 조성물은 에디터단백질을 포함할 수 있다.The composition for genetic manipulation disclosed by the present application may include an editor protein.
하기에서 설명할, 가이드핵산, 에디터단백질, 가이드핵산-에디터단백질 복합체에 대한 구체적인 설명은 한국 공개특허 제2018-0054427호, 한국 공개특허 제2018-0136914호를 참조할 수 있다.For a detailed description of the guide nucleic acid, editor protein, and guide nucleic acid-editor protein complex, which will be described below, reference may be made to Korean Patent Publication No. 2018-0054427 and Korean Patent Publication No. 2018-0136914.
또한, 염기 변형 효소에 대한 구체적인 설명은 한국 공개특허 제2020-0135225호를 참조할 수 있다.In addition, a detailed description of the nucleotide modification enzyme may refer to Korean Patent Publication No. 2020-0135225.
상기 “에디터단백질”은 대상 세포 내 게놈 또는 핵산을 인위적으로 조작(editing)할 수 있는 펩타이드, 폴리펩타이드 또는 단백질을 의미한다.The "editor protein" refers to a peptide, polypeptide or protein capable of artificially editing a genome or nucleic acid in a target cell.
상기 에디터단백질은 절단 효소 또는 이를 포함하는 융합 단백질일 수 있다.The editor protein may be a cutting enzyme or a fusion protein containing the same.
상기 융합 단백질은 절단 효소 및 절단 효소와 다른 기능을 하는 하나 이상의 효소로 구성될 수 있다.The fusion protein may consist of a cleavage enzyme and one or more enzymes that function differently from the cleavage enzyme.
상기 절단 효소와 다른 기능을 하는 하나 이상의 효소는 염기 변형 효소, 메틸화 조절 효소, 인산화 조절 효소 및 아세틸화 조절 효소 중 선택된 하나 이상의 효소일 수 있다. One or more enzymes that have a different function from the cleavage enzyme may be one or more enzymes selected from base modification enzymes, methylation regulatory enzymes, phosphorylation regulatory enzymes, and acetylation regulatory enzymes.
이때, 상기 절단 효소는 핵산, 유전자 또는 염색체를 절단하는 기능을 하는 폴리펩타이드 또는 단백질일 수 있다.In this case, the cleavage enzyme may be a polypeptide or protein that functions to cleave nucleic acids, genes, or chromosomes.
이때, 상기 염기 변형 효소는 핵산을 구성하는 뉴클레오타이드의 염기를 다른 염기로 변형시키는 기능을 하는 폴리펩타이드 또는 단백질일 수 있다.In this case, the base modifying enzyme may be a polypeptide or protein that functions to transform a base of a nucleotide constituting a nucleic acid into another base.
이때, 상기 메틸화 조절 효소는 핵산, 유전자 또는 염색체의 뉴클레오타이드 서열에 메틸화 및/또는 탈메틸화 시키는 기능을 하는 폴리펩타이드 또는 단백질일 수 있다.In this case, the methylation-regulating enzyme may be a polypeptide or protein that functions to methylate and/or demethylate nucleotide sequences of nucleic acids, genes, or chromosomes.
이때, 상기 인산화 조절 효소는 핵산, 유전자 또는 염색체의 뉴클레오타이드 서열에 인산화 및/또는 탈인산화 시키는 기능을 하는 폴리펩타이드 또는 단백질일 수 있다.In this case, the phosphorylation-regulating enzyme may be a polypeptide or protein that functions to phosphorylate and/or dephosphorylate a nucleotide sequence of a nucleic acid, gene, or chromosome.
이때, 상기 아세틸화 조절 효소는 핵산, 유전자 또는 염색체의 뉴클레오타이드 서열에 아세틸화 및/또는 탈아세틸화 시키는 기능을 하는 폴리펩타이드 또는 단백질일 수 있다.In this case, the acetylation regulatory enzyme may be a polypeptide or protein that functions to acetylate and/or deacetylate a nucleotide sequence of a nucleic acid, gene, or chromosome.
또한 상기 에디터단백질은 추가적인 도메인, 펩타이드, 폴리펩타이드 또는 단백질을 더 포함할 수 있다.In addition, the editor protein may further include additional domains, peptides, polypeptides or proteins.
상기 추가적인 도메인, 펩타이드, 폴리펩타이드 또는 단백질은 상기 에디터단백질에 포함된 기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질과 동일하거나 다른 기능을 가지는 기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질일 수 있다.The additional domain, peptide, polypeptide or protein may be a functional domain, peptide, polypeptide or protein having the same or different function as the functional domain, peptide, polypeptide or protein included in the editor protein.
일 구체예에서, 상기 에디터단백질은 CRISPR 효소를 포함한다.In one embodiment, the editor protein includes a CRISPR enzyme.
본 출원에서, 상기 CRISPR 효소는 스트렙토코커스 피오게네스(Streptococcus pyogenes), 스트렙토코커스 써모필러스(Streptococcus thermophilus), 스트렙토코커스 속(Streptococcus sp.), 황색포도상구균(Staphylococcus aureus) 또는 캄필로박터 제주니(Campylobacter jejuni, Cj) 유래일 수 있다.In the present application, the CRISPR enzyme is Streptococcus pyogenes, Streptococcus thermophilus, Streptococcus sp., Staphylococcus aureus or Campylobacter jejuni (Campylobacter jejuni, Cj).
상기 CRISPR 효소는 Cas9, Cpf1 또는 니카아제(nickase)일 수 있으나, 이에 한정하지 않는다.The CRISPR enzyme may be Cas9, Cpf1 or nickase, but is not limited thereto.
상기 Cas9의 구조적 특성은 Hiroshi Nishimasu et al. (2014) Cell 156:935-949를 참고할 수 있다.Structural characteristics of the Cas9 are described by Hiroshi Nishimasu et al. (2014) Cell 156:935-949.
상기 Cpf1의 구조적 특성은 Takashi Yamano et al. (2016) Cell 165:949-962를 참고할 수 있다.The structural characteristics of Cpf1 are described by Takashi Yamano et al. (2016) Cell 165:949-962.
상기 니카아제(nickase)는 표적 유전자 또는 핵산의 이중가닥 중 한 가닥만 절단되도록 조작 또는 변형된 CRISPR 효소를 의미하며, 상기 니카아제는 단일가닥, 예를 들어, 표적 유전자 또는 핵산의 gRNA와 비상보성 가닥 또는 상보성 가닥을 절단하는 뉴클레아제 활성을 가진다. 따라서, 이중가닥을 절단하기 위해서는 니카아제 2개의 뉴클레아제 활성이 필요하다.The nickase refers to a CRISPR enzyme engineered or modified to cleave only one strand of the double strand of a target gene or nucleic acid, and the nickase is a single strand, for example, non-complementary with the gRNA of the target gene or nucleic acid It has nuclease activity that cleave the strand or the complementary strand. Thus, the nuclease activity of two nickases is required to cleave the double strand.
상기 CRISPR효소는 표적 유전자 또는 핵산 내의 특정 뉴클레오타이드서열, 즉, PAM(Protospacer adjacent motif)을 인식하거나 또는 PAM과 상호작용한다.The CRISPR enzyme recognizes or interacts with a specific nucleotide sequence in a target gene or nucleic acid, that is, a protospacer adjacent motif (PAM).
예를 들어, 상기 Cas9 단백질은 대상의 게놈 DNA 서열 상에서 PAM(proto-spaceradjacent Motif)서열을 인지하고 가이드핵산과 상호작용하여 PAM 서열 인접 위치에서 DNA 서열을 절단하는 기능을 한다.상기 CRISPR 효소의 유래에 따라 PAM이 결정되는 것으로 일반적으로 이해되고 있으나, 해당 유래의 효소의 돌연변이(mutant)에 대한 연구가 진행됨에 따라, PAM은 달라질 수도 있다.For example, the Cas9 protein recognizes a proto-spaceradjacent motif (PAM) sequence on a subject's genomic DNA sequence and interacts with a guide nucleic acid to cut the DNA sequence at a position adjacent to the PAM sequence. Origin of the CRISPR enzyme It is generally understood that PAM is determined according to, but as research on mutants of enzymes derived from the enzyme proceeds, PAM may change.
예를 들어, CRISPR 효소가 SpCas9 인 경우 PAM은 5'-NGG-3'일 수 있고, 스트렙토코커스 써모필러스 Cas9(StCas9)인 경우 PAM은 5'-NNAGAAW-3'(W = A or T)일 수 있고, 네이세리아 메닝기디티스 Cas9(NmCas9)인 경우 PAM은 5'-NNNNGATT-3'일 수 있고, 캄필로박터 제주니 Cas9(CjCas9)의 경우 PAM은 5'-NNNNRYAC-3' (V = G or C or A, R = A or G, Y = C or T)일 수 있고, 스타필로코커스 아우레우스 Cas9(SaCas9)인 경우 PAM은 5'-NNGRR(T)-3'일 수 있으며, 이 때, N은 각각 독립적으로 A, T, C 또는 G이고, R은 A 또는 G일 수 있다. 또한, 스타필로코커스 아우리쿨라리스 Cas9(Staphylococcus auricularis, SauriCas9)의 경우 PAM은 5'-NNGG-3'일 수 있으며, 이때 상기 N은 A, T, G 또는 C; 또는 A, U, G 또는 C일 수 있다. 다른 예를 들어, CRISPR 효소가 Cpf1인 경우, PAM 서열은 5'-TTN-3' (N은 A, T, C 또는 G)일 수 있다.For example, if the CRISPR enzyme is SpCas9, the PAM may be 5'-NGG-3', and if the CRISPR enzyme is SpCas9, the PAM may be 5'-NNAGAAW-3' (W = A or T) In the case of Neisseria meningiditis Cas9 (NmCas9), the PAM may be 5'-NNNNGATT-3', and in the case of Campylobacter jejuni Cas9 (CjCas9), the PAM is 5'-NNNNRYAC-3' (V = G or C or A, R = A or G, Y = C or T), and in the case of Staphylococcus aureus Cas9 (SaCas9), the PAM may be 5'-NNGRR (T) -3' , In this case, N is each independently A, T, C or G, and R may be A or G. In addition, in the case of Staphylococcus auricularis, SauriCas9, PAM may be 5'-NNGG-3', wherein N is A, T, G or C; or A, U, G or C. For another example, when the CRISPR enzyme is Cpf1, the PAM sequence may be 5'-TTN-3' (N is A, T, C, or G).
본 출원의 에디터단백질은 염기 변형 효소를 더 포함한다.The editor protein of the present application further includes a base modification enzyme.
상기 염기 변형 효소는 핵산을 구성하는 뉴클레오타이드의 염기를 다른 염기로 변형시키는 기능을 하는 폴리펩타이드 또는 단백질일 수 있다.The base modifying enzyme may be a polypeptide or protein that functions to transform a base of a nucleotide constituting a nucleic acid into another base.
상기 염기 변형 효소는 디아미네이즈(deaminase)일 수 있다.The base modifying enzyme may be deaminase.
상기 디아미네이즈는 야생형 또는 변이체일 수 있다. 상기 디아미네이즈 변이체는 야생형 디아미네이즈보다 디아미네이즈 활성이 증가된 효소일 수 있다.The deaminase may be wild-type or mutant. The deaminase variant may be an enzyme having increased deaminase activity compared to wild-type deaminase.
예를 들어, 디아미네이즈 변이체는 디아미네이즈 내 하나 이상의 아미노산 서열이 변형된 효소일 수 있다. 이 때, 상기 변형은 아미노산의 치환, 결실 및 삽입 중 선택된 어느 하나일 수 있다.For example, a deaminase variant may be an enzyme in which one or more amino acid sequences in deaminase are modified. At this time, the modification may be any one selected from substitution, deletion and insertion of amino acids.
상기 디아미네이즈는 아데닌(A), 구아닌(G), 시토신(C), 티민(T) 및 우라실(U) 중 선택된 하나 이상의 염기를 다른 염기로 변형(치환)시킬 수 있다.The deaminase may modify (substitute) one or more bases selected from adenine (A), guanine (G), cytosine (C), thymine (T), and uracil (U) with another base.
예를 들어, 상기 선택된 하나 이상의 염기가 아데닌(A)인 경우, 선택된 염기는 구아닌(G), 시토신(C), 티민(T) 또는 우라실(U)로 변형될 수 있다. 또는 상기 선택된 하나 이상의 염기가 구아닌(G)인 경우, 선택된 염기는 아데닌(A), 시토신(C), 티민(T) 또는 우라실(U)로 변형될 수 있다. 또는 상기 선택된 하나 이상의 염기가 시토신(C)인 경우, 선택된 염기는 아데닌(A), 구아닌(G), 티민(T) 또는 우라실(U)로 변형될 수 있다. 또는 상기 선택된 하나 이상의 염기가 티민(T) 또는 우라실(U)인 경우, 선택된 염기는 아데닌(A), 구아닌(G) 또는 시토신(C)로 변형될 수 있다.For example, when the selected one or more bases are adenine (A), the selected bases can be modified to guanine (G), cytosine (C), thymine (T) or uracil (U). Alternatively, when the selected one or more bases are guanine (G), the selected bases may be modified to adenine (A), cytosine (C), thymine (T) or uracil (U). Alternatively, when the selected one or more bases are cytosine (C), the selected bases may be modified to adenine (A), guanine (G), thymine (T) or uracil (U). Alternatively, when the selected one or more bases are thymine (T) or uracil (U), the selected bases may be modified to adenine (A), guanine (G) or cytosine (C).
상기 디아미네이즈는 아데노신 디아미네이즈(adenosine deaminase), 시티딘 디아미네이즈(cytidine deaminase), 시토신 디아미네이즈(cytosine deaminase) 또는 구아닌 디아미네이즈(guanine deaminase)일 수 있다.The deaminase may be adenosine deaminase, cytidine deaminase, cytosine deaminase or guanine deaminase.
예를 들어, 상기 디아미네이즈는 AID, PmCDA1, AICDA, ARP2, CDA2, HIGM2, APOBEC1, APOBEC2, APOBEC3A, APOBEC3B, APOBEC3C, APOBEC3D, APOBEC3E, APOBEC3F, APOBEC3G, APOBEC3H, AICDA, CDA, DCTD, AMPD1, ADAT, ADAT2, ADAR, ADAR2, ADA, TadA 또는 GDA일 수 있다.For example, the deaminase is AID, PmCDA1, AICDA, ARP2, CDA2, HIGM2, APOBEC1, APOBEC2, APOBEC3A, APOBEC3B, APOBEC3C, APOBEC3D, APOBEC3E, APOBEC3F, APOBEC3G, APOBEC3H, AICDA, CDA, DCTD, AMPD1, ADAT , ADAT2, ADAR, ADAR2, ADA, TadA or GDA.
일 구체예로, 상기 시티딘 디아미네이즈는 시토신을 티민으로 치환할 수 있다.In one embodiment, the cytidine deaminase may substitute thymine for cytosine.
다른 구체예로, 상기 아데노신 디아미네이즈는 아데닌을 구아닌으로 치환할 수 있다.In another embodiment, the adenosine deaminase may replace adenine with guanine.
예를 들어, 본 출원의 디아미네이즈는 시티딘 디아미네이즈일 수 있다.For example, the deaminase of the present application may be cytidine deaminase.
상기 시티딘 디아미네이즈는 AID, PmCDA1, AICDA, ARP2, CDA2, HIGM2, APOBEC1, APOBEC2, APOBEC3A, APOBEC3B, APOBEC3C, APOBEC3D, APOBEC3E, APOBEC3F, APOBEC3G, APOBEC3H, CDA 또는 DCTD 일 수 있다.The cytidine deaminase may be AID, PmCDA1, AICDA, ARP2, CDA2, HIGM2, APOBEC1, APOBEC2, APOBEC3A, APOBEC3B, APOBEC3C, APOBEC3D, APOBEC3E, APOBEC3F, APOBEC3G, APOBEC3H, CDA or DCTD.
상기 디아미네이즈는 특정코돈 서열을 생성시킬 수 있다. 이 때, 상기 특정코돈 서열은 5'-TAG-3', 5'-TAA-3' 및 5'-TGA-3'의 중 선택되는 어느 하나 이상의 종결코돈 서열일 수 있다.The deaminase can generate a specific codon sequence. In this case, the specific codon sequence may be any one or more stop codon sequences selected from among 5'-TAG-3', 5'-TAA-3' and 5'-TGA-3'.
일 구체예로, 시티딘 디아미네이즈의 경우, 표적 유전자 또는 핵산 내 표적 서열이 5'-CAG-3', 5'-CAA-3', 5'-CGA-3', 5'-CTA-3', 5'-CCA-3' 및 5'-TCA-3'의 중 선택되는 어느 하나 이상의 뉴클레오타이드 서열을 포함하고 있는 경우, 시토신을 티민으로 치환하여, 상기 표적 유전자 또는 핵산 내에 상기 종결코돈 서열을 생성시킬 수 있다.In one embodiment, in the case of cytidine deaminase, the target sequence in the target gene or nucleic acid is 5'-CAG-3', 5'-CAA-3', 5'-CGA-3', 5'-CTA- 3', 5'-CCA-3' and 5'-TCA-3', if it contains any one or more nucleotide sequences selected from among, cytosine is substituted with thymine, and the stop codon sequence in the target gene or nucleic acid can create
예를 들어, 상기 염기 변형 효소로 하나 이상의 염기가 치환되어 종결 코돈을 생성할 수 있다.For example, one or more bases may be substituted with the base modifying enzyme to generate a stop codon.
예를 들어, 상기 염기 변형 효소로 하나 이상의 염기가 치환되어 종결 코돈 생성을 유도할 수 있다.For example, one or more bases may be substituted with the base modifying enzyme to induce stop codon generation.
상기 종결 코돈은 5'-TAG-3', 5'-TAA-3' 및/또는 5'-TGA-3'일 수 있다.The stop codon may be 5'-TAG-3', 5'-TAA-3' and/or 5'-TGA-3'.
본 출원의 에디터단백질은 DNA 글리코실레이즈 억제제(DNA glycosylase inhibitor)를 더 포함할 수 있다.The editor protein of the present application may further include a DNA glycosylase inhibitor.
상기 DNA 글리코실레이즈 억제제는 염기 변형의 효율을 더 높여줄 수 있다.The DNA glycosylase inhibitor can further increase the efficiency of base modification.
예를 들어, 상기 DNA 글리코실레이즈 억제제는 우라실을 시토신으로 바꾸는 효소를 억제하는 우라실 글리코실레이즈 억제제(uracil glycosylase inhibitor, UGI)일 수 있다.For example, the DNA glycosylase inhibitor may be a uracil glycosylase inhibitor (UGI) that inhibits an enzyme that converts uracil into cytosine.
염기 치환시, 상기 디아미네이즈 및 DNA 글리코실레이즈 억제제는 순차적 또는 동시에 관여할 수 있다.In base substitution, the deaminase and DNA glycosylase inhibitors may be involved sequentially or simultaneously.
예를 들어, 상기 시티딘 디아미네이즈는 시토신을 탈아민화하여, 중간 생성물인 우라실을 제공한다. 제공된 우라실은 UGI에 의해 시토신으로 복원되는 기작이 저해되고, DNA-replication 또는 mismatch-repair에 의해, 결과적으로 시토신이 티민으로 치환될 수 있다.For example, the cytidine deaminase deaminates cytosine, providing the intermediate product uracil. The mechanism by which the provided uracil is restored to cytosine by UGI is inhibited, and as a result, cytosine can be replaced by thymine by DNA-replication or mismatch-repair.
한편, 예를 들어, 본 출원의 에디터 단백질은 CRISPR 효소 및 염기 변형 효소를 독립적으로 포함하거나, 서로 융합시켜 융합 단백질로 포함할 수 있다. 이 때, 별개의 벡터로 발현시키거나, 하나의 벡터에 포함하여 발현시킬 수 있다.Meanwhile, for example, the editor protein of the present application may include a CRISPR enzyme and a base modification enzyme independently or may be fused to each other and included as a fusion protein. At this time, it can be expressed as a separate vector or included in one vector.
일 구체예로, 상기 에디터 단백질은 야생형 Cas9 및 시티딘 디아미네이즈로 구성될 수 있다.In one embodiment, the editor protein may be composed of wild-type Cas9 and cytidine deaminase.
다른 구체예로, 상기 에디터 단백질은 Cas9 니카아제, 시티딘 디아미네이즈 및 UGI로 구성될 수 있다.In another embodiment, the editor protein may be composed of Cas9 nickase, cytidine deaminase and UGI.
다른 예를 들어, 본 출원의 에디터 단백질은 CRISPR 효소 및 염기변형 효소를 서로 융합시킨 융합단백질일 수 있다. 이 때, 선택적으로 링커를 더 포함할 수 있다.For another example, the editor protein of the present application may be a fusion protein in which a CRISPR enzyme and a nucleotide modification enzyme are fused to each other. At this time, it may optionally further include a linker.
일 구체예로, 상기 에디터 단백질은 야생형 Cas9 및 디아미네이즈가 융합된 융합 단백질일 수 있다.In one embodiment, the editor protein may be a fusion protein in which wild-type Cas9 and deaminase are fused.
다른 구체예로, 상기 에디터 단백질은 시티딘디아미네이즈와 UGI가 융합된 융합단백질 및 Cas9 니카아제로 구성될 수 있다.In another embodiment, the editor protein may be composed of a Cas9 nickase and a fusion protein in which cytidine deaminase and UGI are fused.
또 다른 구체예로, 상기 에디터 단백질은 Cas9 니카아제, 시티딘디아미네이즈 및 UGI로 구성된 융합 단백질일 수 있다.In another embodiment, the editor protein may be a fusion protein composed of Cas9 nickase, cytidine deaminase and UGI.
3) 가이드핵산3) guide nucleic acid
본 출원에 의해 개시되는 상기 유전자 조작용 조성물은 가이드핵산을 더 포함한다.The composition for genetic manipulation disclosed by the present application further includes a guide nucleic acid.
본 출원에 의해 개시되는 일 구체예로, 상기 유전자 조작용 조성물은 PERV 유전자 내 표적 서열을 표적화하는 가이드핵산이다.In one embodiment disclosed by the present application, the composition for genetic manipulation is a guide nucleic acid targeting a target sequence within the PERV gene.
상기 “가이드핵산”은 표적 핵산, 유전자 또는 염색체를 인지하고, 및 에디터단백질과 상호작용할 수 있는 뉴클레오타이드서열을 의미한다. 이때, 상기 가이드핵산은 표적 서열, 유전자 또는 염색체 내의 일부 뉴클레오타이드서열과 상보적으로 결합할 수 있다. 또한 상기 가이드핵산의 일부 뉴클레오타이드서열은 에디터단백질의 일부 아미노산과 상호작용하여 가이드핵산-에디터단백질 복합체(ribonucleoprotein, RNP)를 형성할 수 있다.The "guide nucleic acid" refers to a nucleotide sequence capable of recognizing a target nucleic acid, gene or chromosome and interacting with an editor protein. In this case, the guide nucleic acid may complementarily bind to a target sequence, a gene, or a part of a nucleotide sequence in a chromosome. In addition, some nucleotide sequences of the guide nucleic acid may interact with some amino acids of the editor protein to form a guide nucleic acid-editor protein complex (ribonucleoprotein, RNP).
상기 가이드핵산은 가이드핵산-에디터단백질 복합체가 표적 핵산, 유전자 또는 염색체의 표적 영역에 위치할 수 있도록 유도하는 기능을 수행할 수 있다.The guide nucleic acid may perform a function of inducing a guide nucleic acid-editor protein complex to be located in a target region of a target nucleic acid, gene, or chromosome.
상기 가이드핵산은 DNA, RNA 또는 DNA/RNA 혼합의 형태일 수 있다.The guide nucleic acid may be in the form of DNA, RNA or a DNA/RNA mixture.
상기 가이드핵산은 하나 이상의 도메인을 포함할 수 있다.The guide nucleic acid may include one or more domains.
상기 도메인은 가이드 도메인, 제 1 상보적 도메인, 연결 도메인, 제 2 상보적 도메인, 근위 도메인, 꼬리도메인 등의 기능적 도메인일 수 있으며, 이에 제한되지 않는다.The domain may be a functional domain such as a guide domain, a first complementary domain, a linking domain, a second complementary domain, a proximal domain, and a tail domain, but is not limited thereto.
“가이드 RNA”RNA, gRNA)는 표적 유전자 또는 핵산에 대한 gRNA-CRISPR 효소 복합체, 즉, CRISPR 복합체를 특이적으로 표적시킬 수 있는 RNA를 지칭한다. 또한, 상기 gRNA는 표적 유전자 또는 핵산 특이적 RNA를 의미하며, CRISPR 효소과 결합하여 CRISPR 효소를 표적 유전자 또는 핵산으로 인도할 수 있다.“Guide RNA” RNA (gRNA) refers to an RNA capable of specifically targeting the gRNA-CRISPR enzyme complex, ie, the CRISPR complex, to a target gene or nucleic acid. In addition, the gRNA refers to a target gene or nucleic acid-specific RNA, and can bind to a CRISPR enzyme to direct the CRISPR enzyme to a target gene or nucleic acid.
가이드 RNA는 crRNA(CRISPR RNA) 또는/및 tracrRNA(trans-activating crRNA)를 포함할 수 있다. 상기 crRNA와 상기 tracrRNA의 특정 부위가 융합된 형태를 sgRNA(sinlge-chain guide RNA)로 지칭할 수 있다.The guide RNA may include crRNA (CRISPR RNA) or/and tracrRNA (trans-activating crRNA). A form in which the crRNA and a specific site of the tracrRNA are fused may be referred to as sgRNA (sinlge-chain guide RNA).
상기 crRNA는 표적서열과 결합하는 부위이고, 상기 tracrRNA는 하기 에디터단백질 복합체를 형성하는데 관여한다.The crRNA is a site that binds to a target sequence, and the tracrRNA is involved in forming the following editor protein complex.
예를 들어, 상기 crRNA는 가이드 도메인과 제 1 상보적 도메인을 포함할 수 있으며, 상기 tracrRNA는 제 2 상보적 도메인, 근위 도메인 및 선택적으로 꼬리 도메인을 포함할 수 있다.For example, the crRNA may include a guide domain and a first complementary domain, and the tracrRNA may include a second complementary domain, a proximal domain and optionally a tail domain.
상기 가이드 도메인은 표적 유전자 또는 핵산 상에서 표적 서열(가이드 핵산 결합 서열)과 상보적인 결합을 할 수 있는 가이드 서열이 포함된 도메인으로, 표적 유전자 또는 핵산과의 특이적인 상호작용을 위한 역할을 할 수 있다.The guide domain is a domain containing a guide sequence capable of complementary binding with a target sequence (guide nucleic acid binding sequence) on a target gene or nucleic acid, and can play a role for specific interaction with a target gene or nucleic acid. .
상기 제 1 상보적 도메인은 제 2 상보적 도메인과 상보적 핵산서열을 포함하는 핵산 서열로, 제 2 상보적 도메인과 이중가닥을 형성할 수 있을 정도로 상보성을 가질 수 있다.The first complementary domain is a nucleic acid sequence including a nucleic acid sequence complementary to the second complementary domain, and may have complementarity to the extent of forming a double strand with the second complementary domain.
상기 "연결 도메인"은 두 개 이상의 도메인을 연결하는 핵산서열로, 연결 도메인은 동일한 또는 서로 다른 두 개 이상의 도메인을 연결할 수 있다. 상기 연결 도메인은 두 개 이상의 도메인과 공유결합 또는 비공유결합을 할 수 있고, 또는 두 개 이상의 도메인을 공유적 또는 비공유적으로 연결할 수 있다.The "linking domain" is a nucleic acid sequence linking two or more domains, and the linking domain may link two or more identical or different domains. The linking domain may form a covalent or non-covalent bond with two or more domains, or may link two or more domains covalently or non-covalently.
상기 "제 2 상보적 도메인"은 상기 제 1 상보적 도메인과 상보적 핵산서열을 포함하는 핵산서열로 제 1 상보적 도메인과 이중가닥을 형성할 수 있을 정도로 상보성을 가질 수 있다.The "second complementary domain" is a nucleic acid sequence including a nucleic acid sequence complementary to the first complementary domain, and may have complementarity to the extent of forming a double strand with the first complementary domain.
상기 "근위 도메인"은 제 2 상보적 도메인에 근접하게 위치하는 핵산서열일 수 있다.The "proximal domain" may be a nucleic acid sequence located proximal to the second complementary domain.
상기 "꼬리 도메인"은 가이드핵산의 양 말단 중 어느 하나 이상의 말단에 위치하는 핵산서열일 수 있다.The "tail domain" may be a nucleic acid sequence located at one or more ends of both ends of the guide nucleic acid.
일 예로, 본 출원의 상기 조성물은 PERV 유전자 내 표적 유전자를 표적화할 수 있는 gRNA일 수 있다.For example, the composition of the present application may be a gRNA capable of targeting a target gene in the PERV gene.
다른 예로, 본 출원의 상기 조성물은 PERV-A, PERV-B 및 PERV-C 중 선택되는 어느 두 개 이상의 서브타입 유전자 서열에 각각 존재하는 표적유전자를 동시에 표적할 수 있는 gRNA일 수 있다.As another example, the composition of the present application may be a gRNA capable of simultaneously targeting target genes each present in two or more subtype gene sequences selected from among PERV-A, PERV-B and PERV-C.
상기 gRNA는 PERV 유전자의 표적 서열 중 가이드핵산 결합 서열과 일부 또는 완전한 상보적 결합을 할 수 있는 가이드 도메인을 포함할 수 있다.The gRNA may include a guide domain capable of partially or completely complementary binding with a guide nucleic acid binding sequence among target sequences of the PERV gene.
상기 gRNA는 gag 유전자, pol 유전자 및/또는 env 유전자의 표적 서열 중 가이드핵산 결합 서열과 일부 또는 완전한 상보적 결합을 할 수 있는 가이드 도메인을 포함할 수 있다.The gRNA may include a guide domain capable of partially or completely complementary binding to a guide nucleic acid binding sequence among target sequences of the gag gene, pol gene, and/or env gene.
상기 가이드 도메인은 가이드핵산 결합 서열에 최소한 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상보성이거나 또는 완전하게 상보성일 수 있다.The guide domain may be at least 70%, 75%, 80%, 85%, 90% or 95% complementary or completely complementary to the guide nucleic acid binding sequence.
가이드 RNA는 가이드핵산 결합 표적서열과 상보적으로 결합하고, T가 U로 치환된 가이드핵산 비결합 표적서열과 동일한 서열을 포함하는 가이드 도메인을 포함할 수 있다The guide RNA may include a guide domain that complementarily binds to a guide nucleic acid binding target sequence and includes the same sequence as a guide nucleic acid non-binding target sequence in which T is replaced with U.
따라서, 상기 가이드RNA는 5'-CAG-3', 5'-CAA-3', 5'-CGA-3', 5'-CUA-3', 5'-CCA-3' 및 5'-UCA-3'의 뉴클레오타이드 서열 중 하나 이상의 서열을 포함한다.Therefore, the guide RNA is 5'-CAG-3', 5'-CAA-3', 5'-CGA-3', 5'-CUA-3', 5'-CCA-3' and 5'-UCA -3' includes one or more of the nucleotide sequences.
본 출원에서, 가이드 RNA 서열 중 가이드핵산 결합 표적서열과 상보적으로 결합하는 부분은 가이드 도메인영역이다.In the present application, the part of the guide RNA sequence complementary to the guide nucleic acid binding target sequence is the guide domain region.
상기 가이드 도메인은 PERV 유전자의 표적 서열 중 가이드핵산 결합 서열과 상보적인 뉴클레오타이드서열을 포함할 수 있다. 이때, 상기 상보적인 뉴클레오타이드서열은 0 내지 5, 0 내지 4, 0 내지 3, 0 내지 2, 0 내지 1개의 미스매치(mismatching)를 포함할 수 있다.The guide domain may include a nucleotide sequence complementary to a guide nucleic acid binding sequence among target sequences of the PERV gene. In this case, the complementary nucleotide sequence may include 0 to 5, 0 to 4, 0 to 3, 0 to 2, and 0 to 1 mismatches.
상기 가이드 도메인은 gag 유전자의 표적 서열 중 가이드핵산 결합 서열과 상보적인 뉴클레오타이드서열을 포함할 수 있다. 이때, 상기 상보적인 뉴클레오타이드서열은 0 내지 5, 0 내지 4, 0 내지 3, 0 내지 2, 0 내지 1개의 미스매치(mismatching)를 포함할 수 있다.The guide domain may include a nucleotide sequence complementary to a guide nucleic acid binding sequence among target sequences of the gag gene. In this case, the complementary nucleotide sequence may include 0 to 5, 0 to 4, 0 to 3, 0 to 2, and 0 to 1 mismatches.
상기 가이드 도메인은 pol 유전자의 표적 서열 중 가이드핵산 결합 서열과 상보적인 뉴클레오타이드서열을 포함할 수 있다. 이때, 상기 상보적인 뉴클레오타이드서열은 0 내지 5, 0 내지 4, 0 내지 3, 0 내지 2, 0 내지 1개의 미스매치(mismatching)를 포함할 수 있다.The guide domain may include a nucleotide sequence complementary to a guide nucleic acid binding sequence among target sequences of the pol gene. In this case, the complementary nucleotide sequence may include 0 to 5, 0 to 4, 0 to 3, 0 to 2, and 0 to 1 mismatches.
상기 가이드 도메인은 env 유전자의 표적 서열 중 가이드핵산 결합 서열과 상보적인 뉴클레오타이드서열을 포함할 수 있다. 이때, 상기 상보적인 뉴클레오타이드서열은 0 내지 5, 0 내지 4, 0 내지 3, 0 내지 2, 0 내지 1개의 미스매치(mismatching)를 포함할 수 있다.The guide domain may include a nucleotide sequence complementary to a guide nucleic acid binding sequence among target sequences of the env gene. In this case, the complementary nucleotide sequence may include 0 to 5, 0 to 4, 0 to 3, 0 to 2, and 0 to 1 mismatches.
상기 gRNA는 제 1 상보적 도메인, 연결 도메인, 제 2 상보적 도메인, 근위 도메인 및 꼬리 도메인으로 구성된 군에서 선택된 하나 이상의 도메인을 포함할 수 있다.The gRNA may include one or more domains selected from the group consisting of a first complementary domain, a linking domain, a second complementary domain, a proximal domain, and a tail domain.
상기 가이드 RNA 서열 중 가이드 도메인영역 외의 다른 도메인 영역은 Cas 단백질과 복합체를 형성하는데 기여한다.Among the guide RNA sequences, domain regions other than the guide domain region contribute to forming a complex with the Cas protein.
본 출원에서, gag 유전자, pol 유전자 및/또는 env 유전자 내에서 가이드핵산 비결합 표적서열은 PAM과 종결코돈화 대상 서열을 포함한다. 또한, 상기 가이드핵산 비결합 표적서열에 염기 변형 효소가 작동하면, 종결코돈화 대상 서열의 일부 염기가 치환(변경) 된다. 이 때, 상기 치환으로 표적서열 내 종결코돈 서열이 생성될 수 있다.In the present application, the guide nucleic acid non-binding target sequence in the gag gene, pol gene and/or env gene includes a PAM and a stop codon target sequence. In addition, when the base modification enzyme operates on the guide nucleic acid non-binding target sequence, some bases of the stop codon target sequence are substituted (changed). At this time, a stop codon sequence in the target sequence may be generated by the substitution.
상기 PAM 서열은 gRNA설계시 표적 서열에 대한 선택 기준을 제공할 수 있다. PAM 서열을 기준으로 표적 위치를 찾고, 종결코돈화 대상 서열이 포함되어 있는 부분을 포함하도록 표적 서열을 설계한다. 이 때, T가 U로 치환된 가이드핵산 비결합 표적서열에서 T가 U로 치환된 서열과 동일한 RNA 서열을 가이드 도메인 서열로 결정한다.The PAM sequence can provide a selection criterion for a target sequence when designing a gRNA. A target position is found based on the PAM sequence, and the target sequence is designed to include a portion containing the stop codon target sequence. At this time, in the guide nucleic acid non-binding target sequence in which T is substituted with U, the same RNA sequence as the sequence in which T is substituted with U is determined as the guide domain sequence.
이하, 본 출원의 일 구체예에서 사용할 수 있는 gRNA의 가이드 도메인을 [표 4]에 정리하였다.Hereinafter, guide domains of gRNAs that can be used in one embodiment of the present application are summarized in [Table 4].
NameName Target geneTarget gene DirectionDirection gRNA (5' to 3', w/o PAM)gRNA (5' to 3', w/o PAM) SEQ ID NOSEQ ID No.
PERV-gag-1_GPERV-gag-1_G gaggag ++ uucagguuaagaagggaccuuucagguuaagaagggaccu SEQ ID NO: 66SEQ ID NO: 66
PERV-gag-2_GPERV-gag-2_G gaggag ++ gcagacacucuucacagccggcagacacucuucacagccg SEQ ID NO: 67SEQ ID NO: 67
PERV-gag-3_GPERV-gag-3_G gaggag ++ ccagaaagccucaguggcccccagaaagccucaguggccc SEQ ID NO: 68SEQ ID NO: 68
PERV-gag-4_GPERV-gag-4_G gaggag ++ ucagagacuggaaggguuacucagagacuggaaggguuac SEQ ID NO: 69SEQ ID NO: 69
PERV-gag-6_GPERV-gag-6_G gaggag -- agccaugguuuaacccauggagccaugguuuaacccaugg SEQ ID NO: 70SEQ ID NO: 70
PERV-gag-7_GPERV-gag-7_G gaggag -- ucccaaccgaggcgagucaaucccaaccgaggcgagucaa SEQ ID NO: 71SEQ ID NO: 71
PERV-gag-8_GPERV-gag-8_G gaggag -- gucccaaccgaggcgagucagucccaaccgaggcgaguca SEQ ID NO: 72SEQ ID NO: 72
PERV-gag-9_GPERV-gag-9_G gaggag ++ uccccgaauccuggcucuuguccccgaauccuggcucuug SEQ ID NO: 73SEQ ID NO: 73
PERV-gag-10_GPERV-gag-10_G gaggag ++ gcgagagagaauucuguuaggcgagagagaauucuguuag SEQ ID NO: 74SEQ ID NO: 74
PERV-gag-11_GPERV-gag-11_G gaggag ++ uccccaacgccucacgggguuccccaacgccucacggggu SEQ ID NO: 75SEQ ID NO: 75
PERV-gag-12_GPERV-gag-12_G gaggag ++ ccaacgccucacgggguuggccaacgccucacgggguugg SEQ ID NO: 76SEQ ID NO: 76
PERV-gag-13_GPERV-gag-13_G gaggag ++ guugcaaaaugagauugacaguugcaaaaugagauugaca SEQ ID NO: 77SEQ ID NO: 77
PERV-gag-14_GPERV-gag-14_G gaggag ++ uugcaaaaugagauugacauuugcaaaaugagauugacau SEQ ID NO: 78SEQ ID NO: 78
PERV-pol-1_GPERV-pol-1_G polpol ++ ggagcaguuuccccaagccuggagcaguuuccccaagccu SEQ ID NO: 79SEQ ID NO: 79
PERV-pol-2_GPERV-pol-2_G polpol ++ cccacagguuauucaacugacccacagguuauucaacuga SEQ ID NO: 80SEQ ID NO: 80
PERV-pol-3_GPERV-pol-3_G polpol ++ acaguaccccuugaguagagacaguaccccuugaguagag SEQ ID NO: 81SEQ ID NO: 81
PERV-pol-4_GPERV-pol-4_G polpol ++ ggugcaggacauacacccaaggugcaggacauacacccaa SEQ ID NO: 82SEQ ID NO: 82
PERV-pol-5_GPERV-pol-5_G polpol ++ ggcccagauuugcaggagagggcccagauuugcaggagag SEQ ID NO: 83SEQ ID NO: 83
PERV-pol-6_GPERV-pol-6_G polpol ++ cgggcagcgauggcugacggcgggcagcgauggcugacgg SEQ ID NO: 84SEQ ID NO: 84
PERV-pol-7_GPERV-pol-7_G polpol ++ gacaguacacccuagaagacgacaguacacccuagaagac SEQ ID NO: 85SEQ ID NO: 85
PERV-pol-8_GPERV-pol-8_G polpol ++ agaccaguucucugagacucagaccaguucucugagacuc SEQ ID NO: 86SEQ ID NO: 86
PERV-pol-9_GPERV-pol-9_G polpol ++ ccaguucucugagacuccggccaguucucugagacuccgg SEQ ID NO: 87SEQ ID NO: 87
PERV-pol-10_GPERV-pol-10_G polpol ++ caguucucugagacuccggacaguucucugagacuccgga SEQ ID NO: 88SEQ ID NO: 88
PERV-pol-11_GPERV-pol-11_G polpol -- ccaguuccguucaggcgggaccaguuccguucaggcggga SEQ ID NO: 89SEQ ID NO: 89
PERV-pol-12_GPERV-pol-12_G polpol -- accaguuccguucaggcgggaccaguuccguucaggcggg SEQ ID NO: 90SEQ ID NO: 90
PERV-pol-13_GPERV-pol-13_G polpol -- uguaccaguuccguucaggcuguaccaguuccguucaggc SEQ ID NO: 91SEQ ID NO: 91
PERV-pol-14_GPERV-pol-14_G polpol -- cuccauucgaaggcaaaaagcuccauucgaaggcaaaaag SEQ ID NO: 92SEQ ID NO: 92
PERV-pol-15_GPERV-pol-15_G polpol -- ccuccaugguccuaggguuuccuccaugguccuaggguuu SEQ ID NO: 93SEQ ID NO: 93
PERV-pol-16_GPERV-pol-16_G polpol -- uccuccaugguccuaggguuuccuccaugguccuaggguu SEQ ID NO: 94SEQ ID NO: 94
PERV-pol-17_GPERV-pol-17_G polpol -- cuucccagugagcgccugggcuucccaugagcgccuggg SEQ ID NO: 95SEQ ID NO: 95
PERV-pol-18_GPERV-pol-18_G polpol -- ccaguauuuuuuagccaccaccaguauuuuuuagccacca SEQ ID NO: 96SEQ ID NO: 96
PERV-pol-19_GPERV-pol-19_G polpol -- cuucaguugaauaaccugugcuucaguugaauaaccugg SEQ ID NO: 97SEQ ID NO: 97
PERV-pol-20_GPERV-pol-20_G polpol -- uucuaagcaguccuguuugguucuaagcaguccuguuugg SEQ ID NO: 98SEQ ID NO: 98
PERV-pol-21_GPERV-pol-21_G polpol -- uccuaggguguacugucgucuccuaggguguacugucguc SEQ ID NO: 99SEQ ID NO: 99
PERV-pol-22_GPERV-pol-22_G polpol ++ agcgauggcugacggaggcaagcgauggcugacggaggca SEQ ID NO: 100SEQ ID NO: 100
PERV-pol-23_GPERV-pol-23_G polpol ++ gcucaaauuucuuuugaacagcucaaauuucuuuugaaca SEQ ID NO: 101SEQ ID NO: 101
PERV-pol-24_GPERV-pol-24_G polpol ++ ucaagauauacaguccugguucaagauauacaguccuggu SEQ ID NO: 102SEQ ID NO: 102
PERV-pol-25_GPERV-pol-25_G polpol ++ caagccugggcagaaaccgccaagccugggcagaaaccgc SEQ ID NO: 103SEQ ID NO: 103
PERV-pol-26_GPERV-pol-26_G polpol ++ uguucaaagauuaauccaacuguucaaagauuaauccaac SEQ ID NO: 104SEQ ID NO: 104
PERV-pol-27_GPERV-pol-27_G polpol ++ guucaaagauuaauccaacaguucaaagauuaauccaaca SEQ ID NO: 105SEQ ID NO: 105
PERV-pol-28_GPERV-pol-28_G polpol ++ aaacaagugagagaguuuuuaaacaagugagagaguuuuu SEQ ID NO: 106SEQ ID NO: 106
PERV-pol-29_GPERV-pol-29_G polpol ++ aacaagugagagaguuuuugaacaagugagagaguuuuug SEQ ID NO: 107SEQ ID NO: 107
PERV-pol-30_GPERV-pol-30_G polpol ++ cccaaacccuaggaccauggcccaaacccuaggaccaugg SEQ ID NO: 108SEQ ID NO: 108
PERV-pol-31_GPERV-pol-31_G polpol ++ caacuauugauugaggagaccaacuauugauugaggagac SEQ ID NO: 109SEQ ID NO: 109
PERV-pol-32_GPERV-pol-32_G polpol ++ agcgcaaaaggcugagcucaagcgcaaaaggcugagcuca SEQ ID NO: 110SEQ ID NO: 110
PERV-pol-33_GPERV-pol-33_G polpol ++ caagcuuugcggcuggccgacaagcuuugcggcuggccga SEQ ID NO: 111SEQ ID NO: 111
PERV-pol-34_GPERV-pol-34_G polpol ++ uccgagauuuggaauaccuauccgagauuuggaauccua SEQ ID NO: 112SEQ ID NO: 112
PERV-env-1_GPERV-env-1_G envenv ++ aacaggaaaauauucaaaagaacaggaaaauauucaaaag SEQ ID NO: 113SEQ ID NO: 113
PERV-env-2_GPERV-env-2_G envenv ++ ugaacaggggcccccggcccugaacaggggccccccggccc SEQ ID NO: 114SEQ ID NO: 114
PERV-env-3_GPERV-env-3_G envenv ++ cagcagcuagagaaaggacucagcagcuagagaaaggacu SEQ ID NO: 115SEQ ID NO: 115
PERV-env-4_GPERV-env-4_G envenv ++ accaggggugguuugaaggaaccaggggugguuugaagga SEQ ID NO: 116SEQ ID NO: 116
PERV-env-5_GPERV-env-5_G envenv -- ccagcuuaacgugggaugcaccagcuuaacgugggaugca SEQ ID NO: 117SEQ ID NO: 117
PERV-env-6_GPERV-env-6_G envenv -- uuuccagucuccaucguugguuuccagucuccaucguugg SEQ ID NO: 118SEQ ID NO: 118
PERV-env-7_GPERV-env-7_G envenv -- ccauuuccagucuccaucguccauuuccagucuccaucgu SEQ ID NO: 119SEQ ID NO: 119
PERV-env-8_GPERV-env-8_G envenv -- gcccaccaccuguuauaaccgcccaccaccuguuauaacc SEQ ID NO: 120SEQ ID NO: 120
PERV-env-9_GPERV-env-9_G envenv -- accauccuucaaaccaccccaccauccuucaaaccacccc SEQ ID NO: 121SEQ ID NO: 121
PERV-env-10_GPERV-env-10_G envenv ++ acucgagguguugcuccuagacucgagguguugcuccuag SEQ ID NO: 122SEQ ID NO: 122
PERV-env-11_GPERV-env-11_G envenv ++ ccgaguguacuaccauccugccgaguguacuaccauccug SEQ ID NO: 123SEQ ID NO: 123
PERV-env-12_GPERV-env-12_G envenv ++ uaccaaggccuucugagccauaccaaggccuucugagcca SEQ ID NO: 124SEQ ID NO: 124
PERV-env-13_GPERV-env-13_G envenv -- gucuauaaggcguuuacuacgucuauaaggcguuuacuac SEQ ID NO: 125SEQ ID NO: 125
PERV-env-14_GPERV-env-14_G envenv -- gaccaugacacagaaaucuugaccaugacacagaaaucuu SEQ ID NO: 126SEQ ID NO: 126
PERV-env-15_GPERV-env-15_G envenv -- accauccuucaaaccaccccaccauccuucaaaccacccc SEQ ID NO: 127SEQ ID NO: 127
PERV-env-16_GPERV-env-16_G envenv -- acccacucguucucuaacaaaccacucguucucuaacaa SEQ ID NO: 128SEQ ID NO: 128
PERV-env-17_GPERV-env-17_G envenv -- cgucagagcagaaagcagggcgucagagcagaaagcaggg SEQ ID NO: 129SEQ ID NO: 129
PERV-env-18_GPERV-env-18_G envenv -- uccuaugcauguccccuuccuccuaugcaugucccccuucc SEQ ID NO: 130SEQ ID NO: 130
4) 유전자 조작용 조성물 형태4) Form of composition for genetic manipulation
본 출원의 상기 유전자 조작용 조성물은 가이드핵산 및 에디터단백질을 포함할 수 있다.The composition for genetic manipulation of the present application may include a guide nucleic acid and an editor protein.
유전자 조작용 조성물은,Composition for genetic manipulation,
(a) 표적 핵산 서열 내에 표적 서열을 표적화할 수 있는 가이드핵산 또는 이를 암호화하는 핵산서열; 및(a) a guide nucleic acid capable of targeting a target sequence within a target nucleic acid sequence or a nucleic acid sequence encoding the same; and
(b) 하나 이상의 에디터단백질 또는 이를 암호화하는 핵산서열;(b) one or more editor proteins or nucleic acid sequences encoding them;
을 포함할 수 있다.can include
상기 표적 핵산은 PERV 유전자의 전장 또는 일부 핵산서열일 수 있다.The target nucleic acid may be the full length or partial nucleic acid sequence of the PERV gene.
이때, 상기 PERV 유전자는 gag 유전자, pol 유전자 및/또는 env 유전자를 포함할 수 있다. 상기 PERV 유전자 관련 설명은 상기 기술한 바와 같다.In this case, the PERV gene may include a gag gene, a pol gene, and/or an env gene. The description of the PERV gene is as described above.
상기 표적 핵산은 gag 유전자일 수 있다.The target nucleic acid may be a gag gene.
상기 표적 핵산은 pol 유전자일 수 있다.The target nucleic acid may be a pol gene.
상기 표적 핵산은 env 유전자일 수 있다.The target nucleic acid may be an env gene.
상기 표적 핵산은 gag 유전자, pol 유전자 및 env 유전자 중 선택된 두 개의 유전자일 수 있다.The target nucleic acid may be two genes selected from a gag gene, a pol gene, and an env gene.
상기 표적 핵산은 gag 유전자, pol 유전자 및 env 유전자일 수 있다.The target nucleic acid may be a gag gene, a pol gene, and an env gene.
상기 표적 서열관련 설명은 상기 기술한 바와 같다.The description of the target sequence is the same as described above.
상기 표적 서열은 특정 서열을 포함할 수 있다.The target sequence may include a specific sequence.
상기 특정 서열은 5'-CAG-3'의 뉴클레오타이드 서열일 수 있다.The specific sequence may be a nucleotide sequence of 5'-CAG-3'.
상기 특정 서열은 5'-CAA-3'의 뉴클레오타이드 서열일 수 있다.The specific sequence may be a nucleotide sequence of 5'-CAA-3'.
상기 특정 서열은 5'-CGA-3'의 뉴클레오타이드 서열일 수 있다.The specific sequence may be a nucleotide sequence of 5'-CGA-3'.
상기 특정 서열은 5'-CTA-3'의 뉴클레오타이드 서열일 수 있다.The specific sequence may be a nucleotide sequence of 5'-CTA-3'.
상기 특정 서열은 5'-CCA-3'의 뉴클레오타이드 서열일 수 있다.The specific sequence may be a nucleotide sequence of 5'-CCA-3'.
상기 특정 서열은 5'-TCA-3'의 뉴클레오타이드 서열일 수 있다.The specific sequence may be a nucleotide sequence of 5'-TCA-3'.
본 출원에 의해 개시되는 일 구체예로서, 유전자 조작용 조성물은 gRNA, CRISPR 효소, 염기 변형 효소를 포함할 수 있다.As one specific example disclosed by the present application, the composition for genetic manipulation may include a gRNA, a CRISPR enzyme, and a base modification enzyme.
유전자 조작용 조성물은 Compositions for genetic manipulation
(a) 표적 핵산 서열 내에 표적 서열을 표적화할 수 있는 gRNA 또는 이를 암호화하는 핵산서열; (a) a gRNA capable of targeting a target sequence within a target nucleic acid sequence or a nucleic acid sequence encoding the same;
(b) 하나 이상의 CRISPR 효소 또는 이를 암호화하는 핵산서열; 및(b) one or more CRISPR enzymes or nucleic acid sequences encoding them; and
(C) 하나 이상의 염기 변형 효소 또는 이를 암호화하는 핵산서열;(C) one or more base modifying enzymes or nucleic acid sequences encoding the same;
을 포함할 수 있다.can include
상기 표적 핵산은 PERV 유전자의 전장 또는 일부 핵산서열일 수 있다.The target nucleic acid may be the full length or partial nucleic acid sequence of the PERV gene.
이때, 상기 PERV 유전자는 gag 유전자, pol 유전자 및/또는 env 유전자를 포함할 수 있다. 상기 PERV 유전자 관련 설명은 상기 기술한 바와 같다.In this case, the PERV gene may include a gag gene, a pol gene, and/or an env gene. The description of the PERV gene is as described above.
상기 표적 핵산은 gag 유전자일 수 있다.The target nucleic acid may be a gag gene.
상기 표적 핵산은 pol 유전자일 수 있다.The target nucleic acid may be a pol gene.
상기 표적 핵산은 env 유전자일 수 있다.The target nucleic acid may be an env gene.
상기 표적 핵산은 gag 유전자, pol 유전자 및 env 유전자 중 선택된 두 개의 유전자일 수 있다.The target nucleic acid may be two genes selected from a gag gene, a pol gene, and an env gene.
상기 표적 핵산은 gag 유전자, pol 유전자 및 env 유전자일 수 있다.The target nucleic acid may be a gag gene, a pol gene, and an env gene.
상기 표적 서열관련 설명은 상기 기술한 바와 같다.The description of the target sequence is the same as described above.
상기 표적 서열은 특정 서열을 포함할 수 있다.The target sequence may include a specific sequence.
상기 특정 서열은 5'-CAG-3'의 뉴클레오타이드 서열일 수 있다.The specific sequence may be a nucleotide sequence of 5'-CAG-3'.
상기 특정 서열은 5'-CAA-3'의 뉴클레오타이드 서열일 수 있다.The specific sequence may be a nucleotide sequence of 5'-CAA-3'.
상기 특정 서열은 5'-CGA-3'의 뉴클레오타이드 서열일 수 있다.The specific sequence may be a nucleotide sequence of 5'-CGA-3'.
상기 특정 서열은 5'-CTA-3'의 뉴클레오타이드 서열일 수 있다.The specific sequence may be a nucleotide sequence of 5'-CTA-3'.
상기 특정 서열은 5'-CCA-3'의 뉴클레오타이드 서열일 수 있다.The specific sequence may be a nucleotide sequence of 5'-CCA-3'.
상기 특정 서열은 5'-TCA-3'의 뉴클레오타이드 서열일 수 있다.The specific sequence may be a nucleotide sequence of 5'-TCA-3'.
상기 CRISPR 효소 관련 설명은 상기 기술한 바와 같다.Description of the CRISPR enzyme is as described above.
상기 CRISPR 효소는 Cas9 니카아제일 수 있다.The CRISPR enzyme may be Cas9 nickase.
상기 염기 변형 효소 관련 설명은 상기 기술한 바와 같다.Description of the nucleotide modification enzyme is as described above.
상기 염기 변형 효소는 디아미나아제일 수 있다.The base modifying enzyme may be a deaminase.
상기 디아미나아제는 시티딘 디아미나아제일 수 있다.The deaminase may be cytidine deaminase.
상기 CRISPR 효소와 상기 염기 변형 효소는 서로 융합된 융합단백질일 수 있다.The CRISPR enzyme and the base modification enzyme may be fusion proteins fused to each other.
상기 유전자 조작용 조성물은 DNA 글리코실레이즈 억제제를 더 포함할 수 있다.The composition for genetic manipulation may further include a DNA glycosylase inhibitor.
상기 DNA 글리코실레이즈 억제제 관련 설명은 상기 기술한 바와 같다.Description of the DNA glycosylase inhibitor is the same as described above.
상기 DNA 글리코실레이즈 억제제는 우라실 글리코실레이즈 억제제일 수 있다.The DNA glycosylase inhibitor may be a uracil glycosylase inhibitor.
상기 CRISPR 효소, 염기 변형 효소 및 DNA 글리코실레이즈 억제제는 이 중 둘 이상이 서로 융합된 융합단백질의 형태로 상기 유전자 조작용 조성물에 포함될 수 있다.The CRISPR enzyme, base modifying enzyme, and DNA glycosylase inhibitor may be included in the composition for genetic manipulation in the form of a fusion protein in which two or more of them are fused to each other.
상기 가이드핵산 및 에디터단백질 관련 설명은 상기 기술한 바와 같다.Descriptions related to the guide nucleic acid and the editor protein are the same as described above.
본 출원에 의해 개시되는 상기 유전자 조작용 조성물에 포함된 가이드핵산, 에디터단백질 또는 가이드핵산-에디터단백질 복합체는 다양한 형태로 세포 내로 전달 또는 도입될 수 있다.The guide nucleic acid, editor protein, or guide nucleic acid-editor protein complex included in the composition for genetic manipulation disclosed in the present application may be delivered or introduced into cells in various forms.
상기 가이드핵산 및 에디터단백질은 핵산-단백질 혼합의 형태로 대상 내로 전달 또는 도입될 수 있다.The guide nucleic acid and editor protein may be delivered or introduced into a subject in the form of a nucleic acid-protein mixture.
상기 가이드핵산 및 에디터단백질은 가이드핵산-에디터단백질 복합체의 형태로 대상 내로 전달 또는 도입될 수 있다.The guide nucleic acid and editor protein may be delivered or introduced into a subject in the form of a guide nucleic acid-editor protein complex.
예를 들어, 상기 가이드핵산은 DNA, RNA 또는 이의 혼합 형태일 수 있다. 상기 에디터단백질은 펩타이드, 폴리펩타이드 또는 단백질의 형태일 수 있다. For example, the guide nucleic acid may be DNA, RNA or a mixture thereof. The editor protein may be in the form of a peptide, polypeptide or protein.
일 예로, 가이드핵산 및 에디터단백질은 RNA 형태의 가이드핵산과 단백질 형태의 에디터단백질이 가이드핵산-에디터단백질 복합체, 즉 ribonucleoprotein(RNP)의 형태로 대상 내로 전달 또는 도입될 수 있다.For example, the guide nucleic acid and the editor protein may be delivered or introduced into the target in the form of a guide nucleic acid-editor protein complex, that is, a ribonucleoprotein (RNP), in which the guide nucleic acid in the form of RNA and the editor protein in the form of protein are formed.
상기 유전자 조작용 조성물은 벡터 또는 비벡터에 포함된 형태일 수 있다.The composition for genetic manipulation may be in the form of a vector or a non-vector.
이 때, 상기 가이드핵산 또는/및 CRISPR 효소 또는/및 염기 변형 효소를 암호화하는 핵산서열을 동시에 또는 개별적으로 포함하는 벡터로 구성할 수 있다.In this case, a vector containing the nucleic acid sequence encoding the guide nucleic acid or/and the CRISPR enzyme or/and the base modification enzyme simultaneously or separately may be constructed.
벡터는 바이러스 벡터 또는 재조합 바이러스 벡터일 수 있다.The vector may be a viral vector or a recombinant viral vector.
상기 바이러스는 DNA 바이러스 또는 RNA 바이러스일 수 있다.The virus may be a DNA virus or an RNA virus.
이때, 상기 DNA 바이러스는 이중가닥 DNA(dsDNA) 바이러스 또는 단일가닥 DNA(ssDNA) 바이러스 일 수 있다.In this case, the DNA virus may be a double-stranded DNA (dsDNA) virus or a single-stranded DNA (ssDNA) virus.
이때, 상기 RNA 바이러스는 단일가닥 RNA(ssRNA) 바이러스일 수 있다.At this time, the RNA virus may be a single-stranded RNA (ssRNA) virus.
상기 바이러스는 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스(AAV), 백시니아바이러스, 폭스바이러스 또는 단순포진 바이러스일 수 있으나, 이에 제한되지 않는다.The virus may be retrovirus, lentivirus, adenovirus, adeno-associated virus (AAV), vaccinia virus, poxvirus or herpes simplex virus, but is not limited thereto.
상기 벡터는 하나 이상의 조절/제어 구성요소를 포함할 수 있다.The vector may contain one or more regulation/control elements.
이때, 상기 조절/제어 구성요소는 포로모터, 인핸서, 인트론, 폴리아데닐화 신호, 코작 공통(Kozak consensus) 서열, 내부 리보솜 유입 부위(internal ribosome entry site, IRES), 스플라이스 억셉터 및/또는 2A 서열을 포함할 수 있다.At this time, the regulatory / control elements are promoters, enhancers, introns, polyadenylation signals, Kozak consensus sequences, internal ribosome entry sites (IRES), splice acceptors and / or 2A sequence may be included.
상기 프로모터는 제어 영역(즉, 가이드핵산 또는 에디터단백질을 암호화하는 핵산서열)에 따라 적합한 프로모터를 이용할 수 있다.As the promoter, a suitable promoter may be used according to the control region (ie, a nucleic acid sequence encoding a guide nucleic acid or an editor protein).
예를 들어, 가이드핵산을 위해 유용한 프로모터는 H1, EF-1a, tRNA 또는 U6 프로모터일 수 있다. 예를 들어, 에디터단백질을 위해 유용한 프로모터는 CMV, EF-1a, EFS, MSCV, PGK 또는 CAG 프로모터일 수 있다.For example, useful promoters for guide nucleic acids can be H1, EF-1a, tRNA or U6 promoters. For example, useful promoters for editor proteins may be the CMV, EF-1a, EFS, MSCV, PGK or CAG promoters.
상기 벡터는 분리 정제를 위한 하나 이상의 추가 도메인을 포함할 수 있다.The vector may contain one or more additional domains for separation and purification.
이때, 상기 하나 이상의 추가 도메인은 단백질(펩타이드 포함)의 분리정제를 위한 태그(tag) 또는 리포터 유전자일 수 있다.In this case, the one or more additional domains may be tags or reporter genes for separation and purification of proteins (including peptides).
상기 태그는 히스티딘(His) 태그, V5 태그, FLAG 태그, 인플루엔자 헤마글루티닌(HA) 태그, Myc 태그, VSV-G 태그 및 티오레독신(Trx) 태그 등을 포함하며, 상기 리포터 유전자는 글루타티온-S-트랜스 퍼라제(GST), 호스라디시(horseradish) 과산화효소(HRP), 클로람페니콜 아세틸트랜스퍼라제(CAT) 베타-갈락토시다제, 베타-글루쿠로니다제, 루시퍼라제, 녹색 형광 단백질(GFP), HcRed, DsRed, 청록색 형광 단백질(CFP), 황색 형광 단백질(YFP) 및 청색 형광 단백질(BFP)을 포함하는 자가형광 단백질을 포함하나, 이들에 한정되지 않는다.The tag includes a histidine (His) tag, a V5 tag, a FLAG tag, an influenza hemagglutinin (HA) tag, a Myc tag, a VSV-G tag and a thioredoxin (Trx) tag, and the reporter gene is glutathione -S-transferase (GST), horseradish peroxidase (HRP), chloramphenicol acetyltransferase (CAT) beta-galactosidase, beta-glucuronidase, luciferase, green fluorescent protein (GFP), HcRed, DsRed, cyan fluorescent protein (CFP), yellow fluorescent protein (YFP) and blue fluorescent protein (BFP).
상기 비벡터는 네이키드 DNA, DNA 복합체, mRNA 또는 이의 혼합일 수 있다.The non-vector may be naked DNA, DNA complex, mRNA, or a mixture thereof.
상기 비벡터는 전기천공법, 유전자총, 초음파천공법, 자기주입법(magnetofection), 일시적인 세포 압축 또는 스퀴징(예를 들어, 문헌[Lee, et al, (2012) Nano Lett., 12, 6322-6327]에 기재되어 있음), 지질-매개 형질감염, 덴드리머, 나노입자, 인산칼슘, 실리카, 실리케이트(오르모실) 또는 이의 조합에 의해 대상 내로 전달 또는 도입될 수 있다.The non-vector can be prepared by electroporation, gene gun, sonoporation, magnetofection, transient cell compression or squeezing (eg, Lee, et al, (2012) Nano Lett., 12, 6322- 6327), lipid-mediated transfection, dendrimers, nanoparticles, calcium phosphate, silica, silicate (ormosil), or combinations thereof.
일 예로, 전기천공법을 통한 전달은 카트리지, 챔버 또는 큐벳 내에서 세포와 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열을 혼합하고, 정해진 지속시간 및 진폭의 전기적 자극을 적용에 의해 수행될 수 있다. For example, delivery through electroporation may be performed by mixing cells and nucleic acid sequences encoding guide nucleic acids and/or editor proteins in a cartridge, chamber, or cuvette, and applying electrical stimulation of a predetermined duration and amplitude. there is.
다른 일 예로, 나노입자를 이용하여 비벡터를 전달할 수 있다. 상기 나노입자는 무기 나노입자(예를 들면, 자기 나노입자, 실리카 등) 또는 유기 나노입자(예를 들면, 폴리에틸렌 글리콜(PEG)로 코팅된 지질 등)일 수 있다. 상기 나노입자의 외면은 부착을 가능하게 하는 양 전하로 하전된 중합체(예를 들면, 폴리에틸렌이민, 폴리리신, 폴리세린 등)와 컨쥬케이팅될 수 있다.As another example, a non-vector may be delivered using nanoparticles. The nanoparticles may be inorganic nanoparticles (eg, magnetic nanoparticles, silica, etc.) or organic nanoparticles (eg, polyethylene glycol (PEG)-coated lipids, etc.). The outer surface of the nanoparticles can be conjugated with a positively charged polymer (eg, polyethyleneimine, polylysine, polyserine, etc.) to enable adhesion.
임의의 구체예로, 지질 외피를 이용하여 전달할 수 있다. In certain embodiments, delivery may be performed using a lipid envelope.
임의의 구체예로, 엑소좀을 이용하여 전달할 수 있다. 엑소좀은 뇌 및 다른 표적 기관에 RNA를 전달할 수 있는, 단백질 및 RNA를 수송하는 내인성 나노-소낭이다.In certain embodiments, delivery may be performed using exosomes. Exosomes are endogenous nano-vesicles that transport proteins and RNA, capable of delivering RNA to the brain and other target organs.
임의의 구체예로, 리포좀을 이용하여 전달할 수 있다. 리포좀은 내부 수성 구획을 둘러싸는 단일 또는 다중 라멜라 지질 이중층 및 상대적으로 불투과성인 외측 친지성 인지질 이중층으로 구성된 구체 소낭 구조이다. 리포좀은 몇몇 상이한 유형의 지질로부터 만들어질 수 있지만; 약물 담체로서 리포좀을 생성하는데 인지질이 가장 통상적으로 사용된다.In certain embodiments, delivery may be performed using liposomes. Liposomes are spherical vesicular structures composed of a single or multilamellar lipid bilayer surrounding an inner aqueous compartment and a relatively impermeable outer lipophilic phospholipid bilayer. Liposomes can be made from several different types of lipids; Phospholipids are most commonly used to create liposomes as drug carriers.
또한, 비벡터의 전달을 위한 조성물은 기타 몇몇 다른 첨가제를 포함할 수 있다.In addition, the composition for delivery of the non-vector may include some other additives.
4-1) 돼지 게놈에 넉인하기 위한 구성요소4-1) Components for knocking in pig genome
본 출원의 상기 유전자 조작용 조성물은 돼지 게놈의 PERV의 지속적인 불활성화를 시키기 위해서, 상기 유전자 조작용 조성물을 돼지 게놈에 넉인시킬 수 있다. 게놈 내에 상기 유전자 조작용 조성물이 넉인되면, 다중 카피 상태의 PERV가 일시적으로 불활성화 되는 것이 아닌 영구적으로 불활성화 될 가능성을 높일 수 있다. 더욱이, 본원의 상기 유전자 조작용 조성물은 CRISPR/Cas 시스템을 사용하므로, PERV의 표적유전자의 전사 또는/및 번역을 억제할 뿐만 아니라, 해당 표적유전자의 표적서열 내에 종결코돈 서열을 생성하여 표적 특이적이고, 높은 효율의 PERV 불활성화를 달성할 수 있다.The composition for genetic manipulation of the present application may be knocked into the pig genome in order to continuously inactivate PERV in the pig genome. When the composition for genetic engineering is knocked into the genome, the possibility of permanent inactivation of PERV in multicopy state rather than temporary inactivation can be increased. Moreover, since the composition for genetic manipulation of the present application uses the CRISPR/Cas system, it not only suppresses the transcription or/and translation of the target gene of PERV, but also creates a stop codon sequence in the target sequence of the target gene, thereby providing a target-specific and , high efficiency of PERV inactivation can be achieved.
이를 위하여, 상기 벡터는 하나 이상의 전이인자를 포함할 수 있다.To this end, the vector may include one or more transfer factors.
상기 전이인자는 또는 이를 포함하는 벡터는 세이프 하버(safe harbor) 내에 위치할 수 있다.The transfer factor or a vector including the transfer factor may be located within a safe harbor.
예를 들어, 상기 세이프 하버는 AAVS1, ROSA26 등일 수 있다.For example, the safe harbor may be AAVS1, ROSA26, and the like.
상기 세이프 하버는, 돼지 게놈의 특정 부분에 외래 유전자 또는 이를 포함하는 벡터가 삽입 또는 넉인 되어도 부작용이 유발되지 않으면서, 상기 외래 유전자 또는 이를 포함하는 벡터의 발현이 지속적으로 될 수 있도록 한다The safe harbor enables the expression of the foreign gene or the vector containing the same to be continued without causing side effects even when the foreign gene or the vector containing the same is inserted or knocked into a specific part of the pig genome.
상기 전이인자는 piggyBac 전이인자 또는 Sleeping Beauty 전이인자일 수 있다.The transfer factor may be a piggyBac transfer factor or a Sleeping Beauty transfer factor.
..
상기 piggyBac 전이인자는 양 말단에 역말단반복서열(inverted terminal repeat sequence, ITR)을 포함할 수 있다.The piggyBac transfer factor may include an inverted terminal repeat sequence (ITR) at both ends.
상기 piggyBac 전이인자는 전위를 매개하는 효소는 piggyBac 트랜스포사아제(transposase)를 포함할 수 있다.The enzyme that mediates translocation of the piggyBac transfer factor may include piggyBac transposase.
상기 piggyBac 전이인자는 특정 염기서열을 인지하여 유전체에 삽입될 수 있다.The piggyBac transfer factor can be inserted into the genome by recognizing a specific nucleotide sequence.
이때, 상기 특정 염기서열은 표적 삽입 위치(target insertion site)일 수 있고, 상기 표적 삽입 위치는 TTAA일 수 있다.In this case, the specific nucleotide sequence may be a target insertion site, and the target insertion site may be TTAA.
이때, 유전체는 돼지 세포, 인간 세포, 마우스 세포, 래트 세포를 포함한 동물 세포의 게놈일 수 있다.In this case, the genome may be a genome of an animal cell including a pig cell, a human cell, a mouse cell, and a rat cell.
상기 piggyBac 전이인자는 외부 유전자 또는 핵산 서열을 포함할 수 있다.The piggyBac transfer factor may include an external gene or nucleic acid sequence.
상기 piggyBac 전이인자는 양 말단의 ITR 사이에 외부 유전자 또는 핵산 서열을 포함할 수 있다.The piggyBac transfer factor may include an external gene or nucleic acid sequence between ITRs at both ends.
상기 외부 유전자 또는 핵산서열은 전위하고자 하는 유전자 또는 핵산서열일 수 있다.The foreign gene or nucleic acid sequence may be a gene or nucleic acid sequence to be translocated.
상기 외부 유전자 또는 핵산서열은 가이드핵산 및/또는 에디터단백질일 수 있다.The external gene or nucleic acid sequence may be a guide nucleic acid and/or an editor protein.
이때, 상기 외부 유전자는 piggyBac 전이인자에 의해 유전체에 삽입될 수 있다.At this time, the foreign gene may be inserted into the genome by a piggyBac transfer factor.
예를 들어, 상기 전이인자가 piggyBac 전이인자인 경우, 상기 vector system은 다음과 같이 구성될 수 있다. 상기 piggyBac 전이인자는 양 말단의 ITR 사이에 가이드핵산 및 에디터단백질을 암호화하는 핵산 서열을 포함할 수 있다. 또는 상기 piggyBac 전이인자는 양 말단의 ITR 사이에 가이드핵산 또는 에디터단백질을 암호화하는 핵산 서열을 포함할 수 있다.For example, when the transfer factor is a piggyBac transfer factor, the vector system may be configured as follows. The piggyBac transfer factor may include a nucleic acid sequence encoding a guide nucleic acid and an editor protein between ITRs at both ends. Alternatively, the piggyBac transfer factor may include a nucleic acid sequence encoding a guide nucleic acid or an editor protein between ITRs at both ends.
상기 Sleeping Beauty 전이인자는 양 말단에 direct repeat(DR)를 포함할 수 있다.The Sleeping Beauty transfer factor may include direct repeat (DR) at both ends.
상기 Sleeping Beauty 전이인자는 양 말단에 ITR을 포함할 수 있다.The Sleeping Beauty transfer factor may include ITR at both ends.
이때, 상기 ITR은 DR을 포함할 수 있다.In this case, the ITR may include a DR.
상기 Sleeping Beauty 전이인자는 전위를 매개하는 효소는 Sleeping Beauty 트랜스포사아제(transposase)를 포함할 수 있다.The Sleeping Beauty transfer factor may include Sleeping Beauty transposase as an enzyme that mediates translocation.
상기 Sleeping Beauty 전이인자는 특정 염기서열을 인지하여 유전체에 삽입될 수 있다.The Sleeping Beauty transfer factor can be inserted into the genome by recognizing a specific nucleotide sequence.
이때, 상기 특정 염기서열은 표적 삽입 위치(target insertion site)일 수 있고, 상기 표적 삽입 위치는 TA일 수 있다.In this case, the specific nucleotide sequence may be a target insertion site, and the target insertion site may be a TA.
이때, 유전체는 돼지 세포, 인간 세포, 마우스 세포, 래트 세포를 포함한 동물 세포의 게놈일 수 있다In this case, the genome may be a genome of an animal cell including pig cells, human cells, mouse cells, and rat cells.
상기 Sleeping Beauty 전이인자는 외부 유전자 또는 핵산 서열을 포함할 수 있다.The Sleeping Beauty transfer factor may include an external gene or nucleic acid sequence.
상기 Sleeping Beauty 전이인자는 양 말단의 ITR 사이에 외부 유전자 또는 핵산 서열을 포함할 수 있다.The Sleeping Beauty transfer factor may include an external gene or nucleic acid sequence between ITRs at both ends.
상기 외부 유전자 또는 핵산서열은 전위하고자 하는 유전자 또는 핵산서열일 수 있다.The foreign gene or nucleic acid sequence may be a gene or nucleic acid sequence to be translocated.
상기 외부 유전자 또는 핵산서열은 가이드핵산 및/또는 에디터단백질일 수 있다.The external gene or nucleic acid sequence may be a guide nucleic acid and/or an editor protein.
이때, 상기 외부 유전자는 Sleeping Beauty 전이인자에 의해 유전체에 삽입될 수 있다.At this time, the foreign gene may be inserted into the genome by a Sleeping Beauty transfer factor.
예를 들어, 상기 전이인자가 Sleeping Beauty 전이인자인 경우, 상기 vector system은 다음과 같이 구성될 수 있다. 상기 Sleeping Beauty 전이인자는 양 말단의 ITR 사이에 가이드핵산 및 에디터단백질을 암호화하는 핵산 서열을 포함할 수 있다. 또는 상기 Sleeping Beauty 전이인자는 양 말단의 ITR 사이에 가이드핵산 또는 에디터단백질을 암호화하는 핵산 서열을 포함할 수 있다.For example, when the transfer factor is a Sleeping Beauty transfer factor, the vector system may be configured as follows. The Sleeping Beauty transfer factor may include a nucleic acid sequence encoding a guide nucleic acid and an editor protein between ITRs at both ends. Alternatively, the Sleeping Beauty transfer factor may include a nucleic acid sequence encoding a guide nucleic acid or an editor protein between ITRs at both ends.
본 출원의 실시예에서도 유전자 조작용 조성물을 돼지 게놈에 넉인한 것을 도 3의 결과를 통해 확인할 수 있다. 나아가, 도 4 내지 도 5의 결과를 통해, 상기 유전자 조작용 조성물이 PERV 유전자의 표적서열에 종결코돈을 생성시킨 것을 확인할 수 있다.Even in the examples of the present application, it can be confirmed through the results of FIG. 3 that the composition for genetic manipulation was knocked into the pig genome. Furthermore, through the results of FIGS. 4 to 5, it can be confirmed that the composition for genetic manipulation generated a stop codon in the target sequence of the PERV gene.
IV. PERV 불활성화 방법IV. PERV inactivation method
본 출원에 의해 개시되는 다른 태양은 상기 유전자 조작용 조성물을 이용하여, PERV를 불활성화 하는 방법에 관한 것이다. 상기 유전자 조작용 조성물 관련 설명은 상기 기술한 바와 같다.Another aspect disclosed by the present application relates to a method for inactivating PERV using the composition for genetic engineering. Description of the composition for genetic manipulation is the same as described above.
일 예를 들어, 상기 방법은,For example, the method,
돼지 세포에 유전자 조작용 조성물을 도입시키는 단계;를 포함하고,Incorporating a composition for genetic manipulation into pig cells;
이 때, 상기 유전자 조작용 조성물은,At this time, the composition for genetic manipulation,
(a) 표적 핵산 서열 내에 표적 서열을 표적화할 수 있는 가이드핵산 또는 이를 암호화하는 핵산서열; 및(a) a guide nucleic acid capable of targeting a target sequence within a target nucleic acid sequence or a nucleic acid sequence encoding the same; and
(b) 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophiles) 유래의 Cas9 단백질, 스타필로코커스 아우레우스 (Staphylococcus aureus) 유래의 Cas9 단백질, 네이세리아 메닝기디티스 (Neisseria meningitidis)유래의 Cas9 단백질, 스타필로코커스 아우리쿨라리스 Cas9(Staphylococcus auricularis, SauriCas9) 및 Cpf1 단백질로 이루어진 군에서 선택된 하나 이상인 에디터단백질 또는 이를 암호화하는 핵산서열;(b) Cas9 protein derived from Streptococcus pyogenes, Cas9 protein derived from Campylobacter jejuni, Cas9 protein derived from Streptococcus thermophiles, Staphylococcus aure At least one editor protein selected from the group consisting of a Cas9 protein derived from Staphylococcus aureus, a Cas9 protein derived from Neisseria meningitidis, a Staphylococcus auricularis (SauriCas9), and a Cpf1 protein or a nucleic acid sequence encoding the same;
을 포함할 수 있다.can include
다른 예를 들어, 상기 방법은, In another example, the method
돼지 세포에 유전자 조작용 조성물을 도입시키는 단계;를 포함하고,Incorporating a composition for genetic manipulation into pig cells;
이 때, 상기 유전자 조작용 조성물은,At this time, the composition for genetic manipulation,
(a) 표적 핵산 서열 내에 표적 서열을 표적화할 수 있는 가이드핵산 또는 이를 암호화하는 핵산서열;(a) a guide nucleic acid capable of targeting a target sequence within a target nucleic acid sequence or a nucleic acid sequence encoding the same;
(b) 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophiles) 유래의 Cas9 단백질, 스타필로코커스 아우레우스 (Staphylococcus aureus) 유래의 Cas9 단백질, 네이세리아 메닝기디티스 (Neisseria meningitidis)유래의 Cas9 단백질, 스타필로코커스 아우리쿨라리스 Cas9(Staphylococcus auricularis, SauriCas9) 및 Cpf1 단백질로 이루어진 군에서 선택된 하나 이상인 에디터단백질 또는 이를 암호화하는 핵산서열; 및(b) Cas9 protein derived from Streptococcus pyogenes, Cas9 protein derived from Campylobacter jejuni, Cas9 protein derived from Streptococcus thermophiles, Staphylococcus aure At least one editor protein selected from the group consisting of a Cas9 protein derived from Staphylococcus aureus, a Cas9 protein derived from Neisseria meningitidis, a Staphylococcus auricularis (SauriCas9), and a Cpf1 protein or a nucleic acid sequence encoding the same; and
(c) 하나 이상의 디아미네이즈 또는 이를 암호화하는 핵산서열;(c) one or more deaminase or a nucleic acid sequence encoding the same;
을 포함할 수 있다.can include
상기 도입은 전기천공법 (electroporation), 리포좀, 플라스미드, 바이러스벡터, 나노파티클(nanoparticles) 및 PTD (Protein translocation domain) 융합 단백질 방법 중 선택되는 1이상의 방법으로 수행될 수 있다.The introduction may be performed by at least one method selected from electroporation, liposome, plasmid, viral vector, nanoparticles, and PTD (Protein translocation domain) fusion protein method.
상기 플라스미드는 돼지의 게놈 넉인을 위하여 전이인자를 포함한 벡터일 수 있다.The plasmid may be a vector containing a transfer factor for genome knock-in of pigs.
상기 전이인자를 포함한 벡터 관련 설명은 상기 기술한 바와 같다.The vector-related description including the transfer factor is the same as described above.
상기 바이러스 벡터는 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스(AAV), 백시니아바이러스, 폭스바이러스 및 단순포진 바이러스로 구성된 군에서 선택되는 1이상일 수 있다.The viral vector may be at least one selected from the group consisting of retrovirus, lentivirus, adenovirus, adeno-associated virus (AAV), vaccinia virus, poxvirus, and herpes simplex virus.
다른 일 구현예로, 상기 조작용 조성물은 비벡터로 대상 내로 전달 또는 도입될 수 있다.In another embodiment, the composition for manipulation may be delivered or introduced into a subject as a non-vector.
상기 비벡터에 관한 설명은 상기 기술한 바와 같다.The description of the non-vector is as described above.
상기 대상은 돼지 또는 돼지 세포일 수 있다.The subject may be a pig or a pig cell.
이 때, 상기 돼지 세포는 돼지를 초대배양한 세포 또는 상업적인 돼지 세포주 등을 포함할 수 있다.In this case, the porcine cells may include primary cultured porcine cells or commercial porcine cell lines.
구체예에서, 상기 방법은 돼지 세포에 PERV의 유전자를 인위적으로 조작할 수 있는 유전자 조작용 조성물을 도입시키는 단계를 포함하는 돼지 세포 제조 방법일 수 있다.In one embodiment, the method may be a pig cell production method comprising the step of introducing a composition for genetic manipulation capable of artificially manipulating the gene of PERV into the pig cell.
상기 돼지 세포는 PERV 유전자를 포함하는 돼지 세포일 수 있다.The porcine cell may be a porcine cell containing the PERV gene.
상기 돼지 세포는 PERV 유전자의 전장 또는 일부 핵산서열을 포함하고 있는 돼지 세포일 수 있다.The porcine cell may be a porcine cell containing the full length or partial nucleic acid sequence of the PERV gene.
이때, 상기 PERV 유전자의 전장 또는 일부 핵산서열은 돼지 세포의 게놈 내 존재할 수 있다.In this case, the full length or partial nucleic acid sequence of the PERV gene may be present in the genome of the pig cell.
이때, 상기 PERV 유전자의 전장 또는 일부 핵산서열은 돼지 세포 내 존재할 수 있다.In this case, the full length or partial nucleic acid sequence of the PERV gene may be present in the pig cell.
상기 표적 핵산은 PERV 유전자의 전장 또는 일부 핵산서열일 수 있다.The target nucleic acid may be the full length or partial nucleic acid sequence of the PERV gene.
이때, 상기 PERV 유전자는 gag 유전자, pol 유전자 및/또는 env 유전자를 포함할 수 있다. 상기 PERV 유전자 관련 설명은 상기 기술한 바와 같다.In this case, the PERV gene may include a gag gene, a pol gene, and/or an env gene. The description of the PERV gene is as described above.
상기 표적 핵산은 gag 유전자일 수 있다.The target nucleic acid may be a gag gene.
상기 표적 핵산은 pol 유전자일 수 있다.The target nucleic acid may be a pol gene.
상기 표적 핵산은 env 유전자일 수 있다.The target nucleic acid may be an env gene.
상기 표적 핵산은 gag 유전자, pol 유전자 및 env 유전자 중 선택된 두 개의 유전자일 수 있다.The target nucleic acid may be two genes selected from a gag gene, a pol gene, and an env gene.
상기 표적 핵산은 gag 유전자, pol 유전자 및 env 유전자일 수 있다.The target nucleic acid may be a gag gene, a pol gene, and an env gene.
일부 실시형태에서, 상기 방법은 돼지로부터 세포 또는 세포 집단을 추출하는 단계, 및 세포 또는 세포집단을 변형하는 단계를 포함한다. 세포의 배양은 생체 외에서 임의의 단계로 일어날 수 있다. 조작된 세포 또는 세포 집단은 돼지 또는 인간에 재도입될 수 있으며, 나아가 조작된 세포 또는 세포 집단에서 추출된 핵 또는 게놈은 돼지 세포에 이식될 수 있다.In some embodiments, the method comprises extracting a cell or cell population from a pig, and modifying the cell or cell population. Culturing of the cells can occur in vitro at any stage. The engineered cell or cell population can be reintroduced into a pig or human, and furthermore, the nucleus or genome extracted from the engineered cell or cell population can be transplanted into a pig cell.
조성물이 대상에 도입되었는지 여부를 확인하는 방법How to Determine Whether a Composition Has Been Introduced to a Subject
상기 방법은,The method,
상기 도입시킨 유전자 조작용 조성물의 도입여부를 확인하는 단계;를 선택적으로, 더 포함할 수 있다.Optionally, it may further include; confirming whether the introduced composition for genetic manipulation is introduced.
상기 도입여부를 확인하는 단계;는 공지된 기술을 사용하여 수행될 수 있다.The step of confirming whether or not the introduction; may be performed using a known technique.
예를 들어, 상기 공지된 기술은 형질전환(transformation)을 확인하는 방법 또는 형질도입(transdection)을 선별하는 방법 등이 포함될 수 있다.For example, the known technology may include a method for confirming transformation or a method for selecting transduction.
상기 선별하는 방법은 선별 마커(selectable marker)를 이용하는 방법일 수 있다.The selection method may be a method using a selectable marker.
상기 선별 마커는 항생제 유전자, 형광 단백질 등이 포함될 수 있다.The selectable marker may include an antibiotic gene, a fluorescent protein, and the like.
예를 들어, 상기 항생제 유전자는 암피실린(ampicillin), 네오마이신(neomycin), 카나마이신(kanamycin), 하이그로마이신(Hygromycin), 젠타마이신(Gentamicin), 퓨로마이신(Puromycin) 등일 수 있다.For example, the antibiotic gene may be ampicillin, neomycin, kanamycin, hygromycin, gentamicin, puromycin, and the like.
예를 들어, 상기 형광 단백질은 녹색 형광 단백질(Green Fluorescent Protein, GFP), 노란 형광 단백질(Yellow Fluorescent Protein, YFP), 빨강 형광 단백질(Red Fluorescent Protein, RFP) 등일 수 있다.For example, the fluorescent protein may be green fluorescent protein (GFP), yellow fluorescent protein (YFP), red fluorescent protein (RFP), and the like.
상기 선별 마커를 이용할 경우, 상기 조성물 내에 선별 마커가 포함되어 있을 수 있다.When using the selectable marker, the selectable marker may be included in the composition.
선별 마커는 상기 조성물이 대상 내에 도입되었는지의 지표로 사용될 수 있다. 항생제 저항성 유전자가 선별 마커로 사용되며, 상기 조성물이 함께 삽입되어, 항생제가 포함된 배지에서 세포를 배양하여 콜로니가 형성되면 상기 조성물이 도입된 것으로 판단할 수 있다.A selectable marker can be used as an indicator of whether the composition has been introduced into a subject. When an antibiotic resistance gene is used as a selection marker, and the composition is inserted together and a colony is formed by culturing cells in a medium containing an antibiotic, it can be determined that the composition has been introduced.
예를 들어, 상기 조성물이 도입된 대상이 세포이면서 선별 마커가 항생제 유전자일 경우 다음과 같이 선별할 수 있다. 상기 세포를 항생제가 포함된 배지에서 배양하여 콜로니가 형성되면, 상기 조성물이 세포에 도입된 것으로 판단할 수 있다.For example, when the subject to which the composition is introduced is a cell and the selectable marker is an antibiotic gene, the selection can be made as follows. When the cells are cultured in a medium containing antibiotics and colonies are formed, it can be determined that the composition has been introduced into the cells.
상기 설명한 방법을 이용하여, 돼지 게놈 상에서 PERV가 불활성화된 돼지세포를 선별하여 수득할 수 있다.Using the method described above, porcine cells in which PERV is inactivated on the porcine genome can be selected and obtained.
V. PERV가 불활성화된 동물세포 & 동물 & 동물장기V. PERV-inactivated animal cell & animal & animal organ
본 출원에 의해 개시되는 또 다른 태양은 상기 방법을 이용하여 PERV가 불활성화되도록 인위적으로 조작된 돼지세포, 돼지 또는 돼지의 장기에 관한 것이다.Another aspect disclosed by the present application relates to a porcine cell, pig or porcine organ artificially engineered to inactivate PERV using the above method.
1) 인위적으로 조작된 돼지 세포1) Artificially engineered pig cells
일 예로, 인위적으로 조작된 돼지 세포에 관한 것이다.As an example, it relates to artificially engineered pig cells.
“조작된 돼지 세포(manipulated porcine cell 또는 engineered porcine cell)”는 자연상태가 아닌 인위적인 조작을 가한 돼지 세포를 의미한다.“Manipulated porcine cell or engineered porcine cell” means a pig cell that has been artificially manipulated rather than in a natural state.
조작된 돼지 세포는 유전자 조작에 의해 생성된 돼지 세포일 수 있다.An engineered porcine cell may be a porcine cell produced by genetic engineering.
조작된 돼지 세포는 인위적으로 조작된 돼지 내인성 레트로바이러스(PERV, Porcine endogenous retrovirus) 유전자를 포함하는 돼지 세포일 수 있다.The engineered porcine cell may be a porcine cell comprising an artificially engineered porcine endogenous retrovirus (PERV) gene.
조작된 돼지 세포는 PERV 유전자 전이가 저해된 돼지 세포일 수 있다.The engineered porcine cell may be a porcine cell in which PERV gene transfer is inhibited.
상기 PERV 유전자 전이는 조작된 돼지 세포 내의 게놈 상에서의 위치 이동 전이일 수 있다.The PERV gene transfer may be a position shift transfer on the genome in an engineered porcine cell.
상기 PERV 유전자 전이는 조작된 돼지 세포와 인접한 세포, 즉, 조작되거나 조작되지 않은 이웃 세포의 게놈 내로의 전이일 수 있다.The PERV gene transfer may be transfer into the genome of an engineered porcine cell and an adjacent cell, i.e., an engineered or non-engineered neighbor cell.
이때, 상기 인접한 세포는 돼지 세포, 인간 세포, 마우스 세포, 래트 세포를 포함하는 동물 세포일 수 있다.In this case, the adjacent cells may be animal cells including pig cells, human cells, mouse cells, and rat cells.
조작된 돼지 세포는 PERV 유전자에 의해 암호화되는 단백질의 생성이 저해 또는 억제된 돼지 세포일 수 있다.The engineered porcine cell may be a porcine cell in which production of a protein encoded by the PERV gene is inhibited or inhibited.
조작된 돼지 세포는 gag 유전자에 의해 암호화되는 단백질의 생성이 저해 또는 억제된 돼지 세포일 수 있다.The engineered porcine cell may be a porcine cell in which production of a protein encoded by the gag gene is inhibited or inhibited.
조작된 돼지 세포는 pol 유전자에 의해 암호화되는 단백질의 생성이 저해 또는 억제된 돼지 세포일 수 있다.An engineered porcine cell may be a porcine cell in which production of a protein encoded by a pol gene is inhibited or inhibited.
조작된 돼지 세포는 env 유전자에 의해 암호화되는 단백질의 생성이 저해 또는 억제된 돼지 세포일 수 있다.The engineered porcine cell may be a porcine cell in which the production of a protein encoded by the env gene is inhibited or inhibited.
조작된 돼지 세포는 gag 유전자, pol 유전자 및 env 유전자에 의해 암호화되는 단백질들 중 둘 이상의 단백질의 생성이 저해 또는 억제된 돼지 세포일 수 있다.The engineered porcine cell may be a porcine cell in which production of two or more of the proteins encoded by the gag gene, the pol gene and the env gene is inhibited or inhibited.
본 명세서에 의해 개시되는 일 구현예로서, 조작된 돼지 세포는 인위적으로 조작된 gag 유전자, 인위적으로 조작된 pol 유전자 및 인위적으로 조작된 env 유전자 중 하나 이상을 포함하는 돼지 세포일 수 있다.As an embodiment disclosed by this specification, the engineered porcine cell may be a porcine cell comprising one or more of an artificially engineered gag gene, an artificially engineered pol gene, and an artificially engineered env gene.
상기 인위적으로 조작된 gag 유전자, 인위적으로 조작된 pol 유전자 및 인위적으로 조작된 env 유전자는 특정 서열을 포함되도록 인위적으로 조작된 것일 수 있다. The artificially engineered gag gene, artificially engineered pol gene, and artificially engineered env gene may be artificially engineered to include a specific sequence.
이때, 상기 특정 서열은 종결 코돈일 수 있다.In this case, the specific sequence may be a stop codon.
이때, 특정 서열은 5'-TAG-3', 5'-TAA-3' 및/또는 5'-TGA-3'일 수 있다.In this case, the specific sequence may be 5'-TAG-3', 5'-TAA-3' and/or 5'-TGA-3'.
상기 인위적으로 조작된 gag 유전자는 2개 이상의 종결 코돈이 포함된 유전자일 수 있다.The artificially engineered gag gene may be a gene containing two or more stop codons.
상기 인위적으로 조작된 pol 유전자는 2개 이상의 종결 코돈이 포함된 유전자일 수 있다.The artificially engineered pol gene may be a gene containing two or more stop codons.
상기 인위적으로 조작된 env 유전자는 2개 이상의 종결 코돈이 포함된 유전자일 수 있다.The artificially engineered env gene may be a gene containing two or more stop codons.
상기 2개 이상의 종결 코돈은 제 1 종결 코돈 및 하나 이상의 부가 종결 코돈을 포함할 수 있다.The two or more stop codons may include a first stop codon and one or more additional stop codons.
이때, 상기 “제 1 종결 코돈”은 자연 상태의 gag 유전자, pol 유전자 및/또는 env 유전자의 3' 말단에 존재하는 종결 코돈을 의미한다. In this case, the “first stop codon” refers to a stop codon present at the 3' end of the gag gene, pol gene, and/or env gene in their natural state.
상기 제 1 종결 코돈은 5'-TAG-3', 5'-TAA-3' 및 5'-TGA-3' 중 하나일 수 있다.The first stop codon may be one of 5'-TAG-3', 5'-TAA-3' and 5'-TGA-3'.
이때, 상기 “부가 종결 코돈”은 인위적으로 조작한 gag 유전자, pol 유전자 및/또는 env 유전자의핵산 서열 내에서 제 1 종결 코돈을 제외한 종결 코돈을 의미하며, 이는 자연 상태의 gag 유전자, pol 유전자 및/또는 env 유전자의 핵산 서열 내에 존재하지 않는 인위적으로 생성된 종결 코돈일 수 있다.At this time, the "additional stop codon" means a stop codon excluding the first stop codon in the nucleic acid sequence of the artificially engineered gag gene, pol gene and / or env gene, which is a natural gag gene, pol gene and / or it may be an artificially generated stop codon that does not exist in the nucleic acid sequence of the env gene.
상기 부가 종결 코돈은 제 1 종결 코돈과 뉴클레오타이드 서열이 동일하거나 상이할 수 있다.The addition stop codon may have the same or different nucleotide sequence as the first stop codon.
상기 부가 종결 코돈은 5'-TAG-3', 5'-TAA-3' 및/또는 5'-TGA-3'일 수 있다.The additional termination codon may be 5'-TAG-3', 5'-TAA-3' and/or 5'-TGA-3'.
예를 들어, 상기 부가 종결 코돈은 gag 유전자, pol 유전자 및/또는 env 유전자의 핵산 서열의 5' 말단 또는 이와 인접하여 위치할 수 있다.For example, the addition termination codon may be located at or adjacent to the 5' end of the nucleic acid sequence of the gag gene, pol gene and/or env gene.
다른 예를 들어, 상기 부가 종결 코돈은 gag 유전자, pol 유전자 및/또는 env 유전자의 핵산 서열 내에 위치할 수 있다.In another example, the additional termination codon may be located within the nucleic acid sequence of the gag gene, pol gene and/or env gene.
또 다른 예를 들어, 상기 부가 종결 코돈은 gag 유전자, pol 유전자 및/또는 env 유전자의 3' 말단과 인접하여 위치할 수 있다.In another example, the additional termination codon may be located adjacent to the 3' end of the gag gene, pol gene, and/or env gene.
상기 하나 이상의 부가 종결 코돈은 gag 유전자, pol 유전자 및/또는 env 유전자의 핵산 서열 내의 PAM(proto-spacer-adjacent Motif) 서열의 5' 말단 및/또는 3' 말단에 인접한 연속하는 1bp 내지 100bp의 뉴클레오타이드 서열 내에 위치할 수 있다.The one or more additional termination codons are contiguous nucleotides of 1 bp to 100 bp adjacent to the 5' end and/or 3' end of the proto-spacer-adjacent motif (PAM) sequence in the nucleic acid sequence of the gag gene, pol gene and/or env gene. can be located within a sequence.
다시 말해, 상기 조작된 돼지 세포는 게놈 내에 본래 존재하는 즉, 자연적으로 존재하는 종결코돈 만 가지는 것이 아닌, 인위적으로 생성된 종결코돈을 포함한 것이다. 더욱 구체적으로, 상기 돼지세포는 PERV의 gag 유전자, pol 유전자 및 env 유전자 각각 자연적으로 가지고 있는 종결코돈 및 상기 gag 유전자, pol 유전자 및 env 유전자 각각 인위적으로 생성된 종결코돈을 더 포함하고 있음으로써, PERV가 불활성화된 것이다.In other words, the engineered porcine cell contains an artificially generated stop codon, not just a stop codon originally present in the genome, that is, naturally present. More specifically, the porcine cell further includes a stop codon naturally present in each of the gag gene, pol gene and env gene of PERV and an artificially generated stop codon in each of the gag gene, pol gene and env gene, thereby producing PERV is inactivated.
일 구체예로서, As one embodiment,
상기 인위적으로 조작된 gag 유전자는 야생형 gag 유전자의 핵산 서열의 3' 말단에 존재하는 제 1 종결 코돈 이외에, gag 유전자의 핵산 서열 내에 하나 이상의 부가 종결 코돈을 포함할 수 있다.The artificially engineered gag gene may include one or more additional stop codons in the nucleic acid sequence of the gag gene, in addition to the first stop codon present at the 3' end of the nucleic acid sequence of the wild-type gag gene.
상기 인위적으로 조작된 pol 유전자는 야생형 pol 유전자의 핵산 서열의 3' 말단에 존재하는 제 1 종결 코돈 이외에, pol 유전자의 핵산 서열 내에 하나 이상의 부가 종결 코돈을 포함할 수 있다.The artificially engineered pol gene may include one or more additional stop codons in the nucleic acid sequence of the pol gene, in addition to the first stop codon present at the 3' end of the nucleic acid sequence of the wild-type pol gene.
상기 인위적으로 조작된 env 유전자는 야생형 env 유전자의 핵산 서열의 3' 말단에 존재하는 제 1 종결 코돈 이외에, env 유전자의 핵산 서열 내에 하나 이상의 부가 종결 코돈을 포함할 수 있다.The artificially engineered env gene may include one or more additional stop codons in the nucleic acid sequence of the env gene, in addition to the first stop codon present at the 3' end of the nucleic acid sequence of the wild-type env gene.
본 출원에서, 인위적으로 조작된 하나 이상의 유전자를 포함하는 돼지 세포의 보다 구체적인 예시들을 나열한다:In this application, more specific examples of porcine cells containing one or more artificially engineered genes are listed:
예를 들어, 상기 조작된 돼지 세포는 인위적으로 조작된 유전자 1개를 포함하는 돼지 세포이다. 상기 인위적으로 조작된 유전자 1개는 인위적으로 조작된 gag 유전자, 인위적으로 조작된 pol 유전자 및 인위적으로 조작된 env 유전자 중 1개이다. 이 때, 상기 인위적으로 조작된 유전자 1개는 제 1 종결 코돈 및 하나 이상의 부가 종결 코돈을 포함하고, 상기 부가 종결 코돈은 인위적으로 조작된 하나 이상의 유전자의 핵산 서열 중 5'-NGG-3'(N은 A, T, C 또는 G임) PAM 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 100bp의 뉴클레오타이드 서열 내에 위치하는 것 일 수 있다.For example, the engineered pig cell is a pig cell comprising one artificially engineered gene. One artificially engineered gene is one of an artificially engineered gag gene, an artificially engineered pol gene, and an artificially engineered env gene. At this time, the one artificially engineered gene includes a first stop codon and one or more additional stop codons, and the additional stop codon is 5'-NGG-3' of the nucleic acid sequence of one or more artificially engineered genes ( N is A, T, C or G) may be located within a contiguous nucleotide sequence of 1 bp to 100 bp located adjacent to the 5' end and/or 3' end of the PAM sequence.
다른 예를 들어, 상기 조작된 돼지 세포는 인위적으로 조작된 유전자 2개를 포함하는 돼지 세포이다. 상기 인위적으로 조작된 유전자 2개는 인위적으로 조작된 gag 유전자, 인위적으로 조작된 pol 유전자 및 인위적으로 조작된 env 유전자 중 2개이다. 이 때, 상기 인위적으로 조작된 유전자 2개 각각은 제 1 종결 코돈 및 하나 이상의 부가 종결 코돈을 포함하고, 상기 부가 종결 코돈은 인위적으로 조작된 하나 이상의 유전자의 핵산 서열 중 5'-NGG-3'(N은 A, T, C 또는 G임) PAM 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 100bp의 뉴클레오타이드 서열 내에 위치하는 것 일 수 있다.In another example, the engineered porcine cell is a porcine cell comprising two artificially engineered genes. The two artificially engineered genes are two of an artificially engineered gag gene, an artificially engineered pol gene, and an artificially engineered env gene. At this time, each of the two artificially engineered genes includes a first stop codon and one or more additional stop codons, and the additional stop codon is 5'-NGG-3' of the nucleic acid sequence of the one or more artificially engineered genes. (N is A, T, C or G) may be located within a contiguous nucleotide sequence of 1 bp to 100 bp located adjacent to the 5' end and/or 3' end of the PAM sequence.
또 다른 예를 들어, 상기 조작된 돼지 세포는 인위적으로 조작된 유전자 3개를 포함하는 돼지 세포이다. 상기 인위적으로 조작된 유전자 3개는 인위적으로 조작된 gag 유전자, 인위적으로 조작된 pol 유전자 및 인위적으로 조작된 env 유전자이다. 이 때, 상기 인위적으로 조작된 유전자 3개 각각은 제 1 종결 코돈 및 하나 이상의 부가 종결 코돈을 포함하고, 상기 부가 종결 코돈은 인위적으로 조작된 하나 이상의 유전자의 핵산 서열 중 5'-NGG-3'(N은 A, T, C 또는 G임) PAM 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 100bp의 뉴클레오타이드 서열 내에 위치하는 것 일 수 있다.In another example, the engineered porcine cell is a porcine cell comprising three artificially engineered genes. The three artificially engineered genes are an artificially engineered gag gene, an artificially engineered pol gene, and an artificially engineered env gene. At this time, each of the three artificially engineered genes includes a first stop codon and one or more additional stop codons, and the additional stop codon is 5'-NGG-3' of the nucleic acid sequence of the one or more artificially engineered genes. (N is A, T, C or G) may be located within a contiguous nucleotide sequence of 1 bp to 100 bp located adjacent to the 5' end and/or 3' end of the PAM sequence.
임의의 실시예로, 상기 돼지 세포는,In certain embodiments, the porcine cell comprises:
gag 유전자, pol 유전자 및 env 유전자에서 선택되는 하나이상의 유전자가 불활성화된 돼지 내인성 레트로바이러스(porcine endogenous retrovirus, PERV)를 게놈 내에 포함하고, A porcine endogenous retrovirus (PERV) in which at least one gene selected from the gag gene, pol gene, and env gene is inactivated is included in the genome,
상기 불활성화된 유전자 내에는 각각 적어도 2개 이상의 종결 코돈이 포함된 돼지 세포로서, A pig cell containing at least two or more stop codons in each of the inactivated genes,
상기 종결 코돈은 5'-TAG-3', 5'-TAA-3' 및 5'-TGA-3' 중 선택되는 어느 하나 이상의 뉴클레오타이드 서열이고,The stop codon is any one or more nucleotide sequences selected from 5'-TAG-3', 5'-TAA-3' and 5'-TGA-3',
상기 불활성화된 PERV는 게놈 내에 다중카피로 존재하며,The inactivated PERV exists in multiple copies in the genome,
PERV의 발현량이 불활성 전과 비교하여 50% 이상 감소된 것일 수 있다.It may be that the expression level of PERV is reduced by 50% or more compared to before inactivation.
2) 인위적으로 조작된 형질전환 돼지2) Artificially engineered transgenic pigs
본 출원에 의해 개시되는 일 태양은 형질전환 돼지에 관한 것이다.One aspect disclosed by this application relates to transgenic pigs.
상기 형질전환 돼지는 조작된 돼지 세포을 이용해 제조된 것일 수 있다.The transgenic pig may be produced using engineered pig cells.
상기 조작된 돼지 세포 관련 설명은 상기 기술한 바와 같다.Description of the engineered porcine cells is as described above.
일 예로서, 조작된 돼지 세포에서 추출한 핵을 탈핵된 난자에 이식하여 산자를 생산함으로써, 형질전환된 돼지의 제조 방법 및 이에 의해 제조된 형질전환 돼지에 관한 것이다.As an example, it relates to a method for producing a transgenic pig by transplanting a nucleus extracted from an engineered pig cell into an enucleated egg to produce offspring, and a transgenic pig produced thereby.
상기 형질전환 돼지는 게놈 내 인위적으로 조작된 PERV 유전자의 전장 또는 일부 핵산 서열이 존재하는 돼지일 수 있다.The transgenic pig may be a pig having a full-length or partial nucleic acid sequence of the artificially engineered PERV gene in its genome.
상기 인위적으로 조작된 PERV 유전자 관련 설명은 상기 기술한 바와 같다.Description of the artificially engineered PERV gene is as described above.
일 구현예에서, 형질전환 돼지를 생산하기 위해, 조작된 돼지 세포를 사용하여 체세포핵 이식법(somatic cell nuclear transfer, SCNT)을 이용할 수 있다.In one embodiment, somatic cell nuclear transfer (SCNT) may be used using engineered porcine cells to produce transgenic pigs.
형질전환 돼지 생산방법은,Transgenic pig production method,
(a) 돼지의 조직으로부터 분리한 체세포 또는 줄기세포를 배양 및 유전자 조작용 조성물을 도입하여 조작된 돼지 세포, 즉 핵 공여 세포 제조 단계;(a) culturing somatic cells or stem cells isolated from pig tissue and introducing a composition for genetic manipulation to prepare engineered pig cells, that is, nuclear donor cells;
(b) 돼지의 난자로부터 핵을 제거하여 탈핵 난자를 제조하는 단계; (b) preparing enucleated oocytes by removing nuclei from porcine eggs;
(c) 상기 (b) 단계의 탈핵 난자에 (a) 단계의 조작된 돼지 세포, 즉 핵 공여 세포의 핵을 미세주입하고 융합시키는 단계;(c) microinjecting and fusing the nucleus of the engineered porcine cell of step (a), that is, the nuclear donor cell, into the enucleated oocyte of step (b);
(d) 상기 (c) 단계에서 융합된 난자를 활성화시키는 단계; 및(d) activating the oocyte fused in step (c); and
(e) 상기 활성화된 난자를 대리모의 난관에 이식하는 단계(e) transplanting the activated egg into the oviduct of the surrogate mother
를 포함할 수 있다.can include
각 단계에 관한 통상적 기술 내용은 당업계에 공지되어 있는 종래의 체세포 핵이식 기술을 이용한 복제 동물의 제조방법 등을 참조하여 이해할 수 있을 것이다.Conventional descriptions of each step will be understood by referring to methods for producing cloned animals using conventional somatic cell nuclear transfer technology known in the art.
3) 형질전환 돼지 장기3) Transgenic pig organs
또한, 본 명세서에 의해 개시되는 일 태양은 형질전환 돼지 장기에 관한 것이다.In addition, one aspect disclosed by the present specification relates to a transgenic pig organ.
상기 형질전환 돼지 장기는 형질전환 돼지에서 수득한 장기일 수 있다.The transgenic pig organ may be an organ obtained from a transgenic pig.
상디 형질전환 돼지 관련 설명은 상기에 기술한 바와 같다.Description of Sanji transgenic pigs is as described above.
상기 형질전환 돼지 장기는 심장, 간, 신장 및 소장 등 이식이 가능한 모든 장기일 수 있다.The transgenic pig organ may be any organ that can be transplanted, such as heart, liver, kidney, and small intestine.
이때, 상기 이식은 동종이식(homograft) 또는 이종이식(heterograft)일 수 있다.In this case, the transplant may be a homograft or a heterograft.
본 출원에 의해 개시된 유전자 조작용 조성물을 이용한 PERV 유전자의 인위적인 조작 또는 변형은 기존 CRISPR-Cas 시스템을 이용한 다중 카피 유전자의 넉아웃시 발생하는 게놈 재배열 등에 의한 세포 독성 및 세포 사멸의 문제점을 해결하고 표적하는 다중 카피의 표적 유전자를 효과적이며 안전하게 불활성시킬 수 있다. 또한, 본 명세서에 의해 개시되는 조작된 돼지 세포를 이용하여 생성된 형질전환 돼지는 이종 장기 이식 치료를 위해 유용하여 이용될 수 있다.Artificial manipulation or modification of the PERV gene using the genetic manipulation composition disclosed in this application solves the problems of cytotoxicity and cell death due to genomic rearrangement, etc. that occur when knocking out a multi-copy gene using the existing CRISPR-Cas system. Multiple copies of the target gene can be effectively and safely inactivated. In addition, transgenic pigs generated using the engineered pig cells disclosed herein may be usefully used for xenotransplantation therapy.
이하, 실시예를 통하여 본 발명을 더욱 상세히 설명하고자 한다.Hereinafter, the present invention will be described in more detail through examples.
이들 실시예는 오로지 본 발명을 보다 구체적으로 설명하기 위한 것으로서, 본 발명의 범위가 이들 실시예에 의해 제한되지 않는다는 것은 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 있어 자명할 것이다.These examples are only for explaining the present invention in more detail, and it will be apparent to those skilled in the art that the scope of the present invention is not limited by these examples.
실험 방법 및 결과Experimental methods and results
1. gRNA 설계1. gRNA design
http://www.rgenome.net/be-designer/을 이용하여 다음과 같이 gRNA를 설계하였다.gRNA was designed as follows using http://www.rgenome.net/be-designer/.
구체적으로, 1) PERV의 gag, pol, env 유전자에 존재할 수 있는 gRNA 서열 중 C to T Base editing에 의해 Stop Codon을 유도할 수 있는 gRNA들만 선별 후, 2) 각 gRNA 서열이 PERV-A, PERV-B, PERV-C를 동시에 타게팅 할 수 있는지 분석하여, 하나의 gRNA로 PERV-A, PERV-B, PERV-C를 동시에 타겟팅 할 수 있는 gRNA만을 선별해 내었다. 본 실시예에서는 선별된 gRNA 중 Start Codon에 가까운 position의 gRNA를 최종적으로 선택하여 사용하였다 (표 5).Specifically, 1) among the gRNA sequences that may exist in the gag, pol, and env genes of PERV, only gRNAs capable of inducing a stop codon by C to T base editing are selected, and 2) each gRNA sequence is PERV-A, PERV -B and PERV-C were analyzed for simultaneous targeting, and only gRNAs capable of simultaneously targeting PERV-A, PERV-B, and PERV-C were selected with one gRNA. In this example, among the selected gRNAs, a gRNA at a position close to the Start Codon was finally selected and used (Table 5).
Figure PCTKR2022014077-appb-img-000001
Figure PCTKR2022014077-appb-img-000001
본 실시예에서는, SEQ ID NO: 132 및 SEQ ID NO: 139를 각각 표적하는 가이드 RNA를 설계하였다.In this example, guide RNAs targeting SEQ ID NO: 132 and SEQ ID NO: 139, respectively, were designed.
2. 벡터 제작(All-in-one PiggyBac vector cloning)2. Vector construction (All-in-one PiggyBac vector cloning)
piggybac vector(#20960) 및 Target-AID vector (#79620; pcDNA3.1_pCMV-nCas-PmCDA1-ugi pH1-gRNA(HPRT))는 Addgene에서 구입하였다. PERV-gag 및 PERV-pol을 타겟하는 sgRNA는 U6 프로모터 시퀀스와 함께 합성하였다(U6-sgGag 및 U6-sgPol). 상기 벡터들을 이용하여 All-in-one PiggyBac 벡터를 제작하였다 (도 2). 벡터 제작 시 사용된 프라이머 서열은 다음과 같다 (표 6):Piggybac vector (#20960) and Target-AID vector (#79620; pcDNA3.1_pCMV-nCas-PmCDA1-ugi pH1-gRNA (HPRT)) were purchased from Addgene. PERV-gag and PERV-pol targeting sgRNAs were synthesized with the U6 promoter sequence (U6-sgGag and U6-sgPol). An All-in-one PiggyBac vector was constructed using the above vectors (FIG. 2). Primer sequences used in vector construction are as follows (Table 6):
상기 벡터에는 서열번호 66 및 서열번호 81의 가이드 도메인 서열을 각각 포함하는 가이드 RNA를 암호화하는 서열이 모두 포함되도록 벡터를 설계하였다.The vector was designed so that all of the sequences encoding the guide RNAs including the guide domain sequences of SEQ ID NO: 66 and SEQ ID NO: 81 were included in the vector.
GeneGene RangeRange DirectionDirection Primer Sequence Primer Sequence
(5' to 3')(5' to 3')
Length, Temp.Length, Temp. SEQ. ID No.SEQ. ID No.
gaggag 1-5291-529 1st Forward1 st Forward ctggtggtctcctactgtcgctggtggtctcctactgtcg 20bp, 57-58℃20bp, 57-58℃ SEQ ID NO: 157SEQ ID NO: 157
1st Reverse1 st Reverse ctccaagagccaggattcggctccaagagccaggattcgg 20bp, 59℃20bp, 59℃ SEQ ID NO: 158SEQ ID NO: 158
2-2852-285 2nd Forward 2nd Forward gtcttgtgcgtccttgtctagtcttgtgcgtccttgtcta 20bp, 54℃20bp, 54℃ SEQ ID NO: 159SEQ ID NO: 159
2nd Reverse 2nd Reverse cgtaaggatatagggctcctcgtaaggatatagggctcct 20bp, 54-55℃20bp, 54-55℃ SEQ ID NO: 160SEQ ID NO: 160
polpol 1-4951-495 1st Forward1 st Forward ccatcactgtgttgaccctcccatcactgtgttgaccctc 20bp, 56-57℃20bp, 56-57℃ SEQ ID NO: 161SEQ ID NO: 161
1st Reverse1 st Reverse ggtgtaatctcaggcagaagggtgtaatctcaggcagaag 20bp, 54-55℃20bp, 54-55℃ SEQ ID NO: 162SEQ ID NO: 162
2-2952-295 2nd Forward 2nd Forward tatacagtcctggttggagctatacagtcctggttggagc 20bp, 54-56℃20bp, 54-56℃ SEQ ID NO: 163SEQ ID NO: 163
2nd Reverse 2nd Reverse attgacctctctcaagtcctattgacctctctcaagtcct 20bp, 54-55℃20bp, 54-55℃ SEQ ID NO: 164SEQ ID NO: 164
1st In-fusion cloning: PB-MluI-NotI cloning 1st In-fusion cloning: PB-MluI-NotI cloning
2nd Restriction enzyme cloning: PB-MluI-NotI & MluI-CMV-nCas9-PmCDA1-UGI-NeoR/KanR-pA-NotI 2nd Restriction enzyme cloning: PB-MluI-NotI & MluI-CMV-nCas9-PmCDA1-UGI-NeoR/KanR-pA-NotI
(vector size: 4352bp, insert size: 7199bp) ( vector size: 4352bp, insert size: 7199bp)
3rd In-fusion cloning: PB-CMV-nCas9-PmCDA1-UGI-NeoR/KanR-pA NotI + U6-sgGag + U6-sgPol 3rd In-fusion cloning: PB-CMV-nCas9-PmCDA1-UGI-NeoR/KanR-pA NotI + U6-sgGag + U6-sgPol
이 때, 3rd In-fusion cloning에 기재된 약어들은 다음을 지칭한다:At this time, the abbreviations described in 3 rd In-fusion cloning refer to:
nCas9 (nickase Cas9), UGI (uracil-DNA glycosylase inhibitor), PmCDA1 (cytidine deaminase 1)nCas9 (nickase Cas9), UGI (uracil-DNA glycosylase inhibitor), PmCDA1 (cytidine deaminase 1)
NeoR (neomycin resistance), KanR (kanamycin resistance), pA (poly A).NeoR (neomycin resistance), KanR (kanamycin resistance), pA (poly A).
3. 세포 트랜스펙션(Cell transfection)3. Cell transfection
Transfection에 사용될 PWG #8 세포주(Passage: 3)를 다음과 같은 배지조성에서 배양하였다:The PWG #8 cell line (Passage: 3) to be used for transfection was cultured in the following medium composition:
Dulbecco's modified Eangel medium (DMEM) (Gibco, Carlsbad, California, USA)Dulbecco's modified Angel medium (DMEM) (Gibco, Carlsbad, California, USA)
1% P/S, 10% Fetal bovine serum (FBS) (Gibco)1% P/S, 10% Fetal bovine serum (FBS) (Gibco)
100 mM β-Mercaptoethanol (β-ME) (Sigma)100 mM β-Mercaptoethanol (β-ME) (Sigma)
1% Non-essential amino acids (NEAA) (Gibco)1% Non-essential amino acids (NEAA) (Gibco)
배양된 돼지 섬유아세포주(PWG 세포)를 PBS로 워싱한 후 trypsin을 처리하여 세포를 준비하였다. 준비된 3Ⅹ105 PWG 세포에 상기 실험방법 2에서 제작한 500 ng All-in-one PiggyBac vector를 Neon electroporator(ThermoFisher)를 이용하여 transfection 하였다. After washing the cultured porcine fibroblast cell line (PWG cells) with PBS, the cells were prepared by treating them with trypsin. The prepared 3Ⅹ10 5 PWG cells were transfected with 500 ng All-in-one PiggyBac vector prepared in Experimental Method 2 using a Neon electroporator (ThermoFisher).
트랜스펙션(transfection) 후, 형질도입된 PWG 세포를 깨끗한 배지에서 배양하고, 4시간 후 다시 깨끗한 배지로 교환하였다. 이틀 후에 Neomycin (2μg/mL) 을 10일간 처리하였다. 이후, Single cell에서 유래한 콜로니를 골라 실험을 진행하였다. All-in-one PiggyBac vector에 항생제 저항성 유전자인 NeoR이 셀렉션(selection) 마커로 포함되어 있기 때문에, 네오마이신이 처리되었을 때 생존한 세포는 트랜스진(transgene)이 형질도입된 세포이다.After transfection, the transduced PWG cells were cultured in a clean medium, and 4 hours later, the medium was replaced with a clean medium. Two days later, Neomycin (2μg/mL) was treated for 10 days. Thereafter, colonies derived from single cells were selected and experiments were conducted. Since the All-in-one PiggyBac vector contains the antibiotic resistance gene NeoR as a selection marker, cells that survive when neomycin is treated are cells transduced with the transgene.
4. 트랜스진의 도입 여부 확인(Identification of transgene integration)4. Identification of transgene integration
네오마이신 처리시 생존한 세포에 해당 트랜스진이 게놈에 도입(인테그레이션, integration) 되었는지의 여부를 확인하기 위해 하기 실험을 진행하였다.The following experiment was performed to confirm whether the corresponding transgene was introduced (integrated) into the genome in cells surviving neomycin treatment.
DNeasy Blood & Tissue Kit(Qiagen, Cat No./ID: 69506)를 이용하여 세포의 genomic DNA를 추출하였고, 도 2에서 화살표로 표시된 위치의 프라이머를 이용하여 PCR 한 후 Agarose gel에 loading 하여 밴드를 확인하였다(도 3). 이 때 사용한 프라이머는 다음과 같다(표 7):Cellular genomic DNA was extracted using the DNeasy Blood & Tissue Kit (Qiagen, Cat No./ID: 69506), PCR was performed using the primers indicated by arrows in FIG. 2, and bands were confirmed by loading on an agarose gel. (FIG. 3). The primers used at this time are as follows (Table 7):
NameName Primer Sequence (5' to 3')Primer Sequence (5' to 3') SEQ. ID No.SEQ. ID No.
integration_Forwardintegration_Forward CCTCGTGCTTTACGGTATCGCCTCGTGCTTTACGGTATCG SEQ ID NO: 165SEQ ID NO: 165
integration_Reverseintegration_Reverse ATGCTCAAGGGGCTTCATGAATGCTCAAGGGGCTTCATGA SEQ ID NO: 166SEQ ID NO: 166
도 3에서, Colony #1, #3 은 각각 Neomycin selection 후 얻어진 단일 세포 유래의 콜로니를 의미한다.도 3을 보면, Colony #1, #3 모두에서 트랜스진에 해당하는 band가 잘 관찰되고 있다. In FIG. 3, colonies #1 and #3 refer to single cell-derived colonies obtained after Neomycin selection. Referring to FIG. 3, bands corresponding to transgenes are well observed in both colonies #1 and #3.
즉, 도 3의 결과를 통해, 트랜스펙션을 통해 세포에 넣어준 트랜스진이 세포의 게놈 내에 인테그레이션 된 것을 확인할 수 있었다.That is, through the results of FIG. 3 , it was confirmed that the transgene introduced into the cell through transfection was integrated into the genome of the cell.
5. 표적 서열의 변형 확인5. Identification of variants of the target sequence
상기 transgene이 세포의 게놈 내 integration된 세포를 deep sequenceing (Illumina miSeq 이용) 후 BE-Analyzer(rgenome.net)를 이용하여 표적 서열 내 변형이 발생하였는지 확인하였다.After deep sequencing (using Illumina miSeq) the cells in which the transgene was integrated into the genome of the cells were used, BE-Analyzer (rgenome.net) was used to confirm whether or not modification occurred in the target sequence.
gag 유전자 및 pol 유전자에 존재하는 각각의 표적 서열 내에 종결 코돈이 생성된 것을 확인한결과는 도 4 및 도 5와 같다.The results of confirming that stop codons were generated in each of the target sequences present in the gag gene and the pol gene are shown in FIGS. 4 and 5 .
도 4를 살펴보면, gag 유전자의 표적 서열 내에 5'-CAG-3'가 5'-TAG-3'로 변형된 것을 알 수 있다.Referring to Figure 4, it can be seen that 5'-CAG-3' in the target sequence of the gag gene is modified to 5'-TAG-3'.
도 5를 살펴보면, pol 유전자의 표적 서열 내에 5'-CAG-3'가 5'-TAG-3'로 변형된 것을 알 수 있다.5, it can be seen that 5'-CAG-3' in the target sequence of the pol gene is modified to 5'-TAG-3'.
각 Colony에서 종결 코돈이 생성된 효율은 다음의 [표 8]과 같다.The efficiency of stop codon generation in each colony is shown in [Table 8].
Target GeneTarget Gene C-to-T Substitution (%)C-to-T Substitution (%)
PERV-PERV- gaggag non-treatednon-treated 0.220.22
Colony #1 Colony #1 63.1563.15
Colony #3 Colony #3 52.1252.12
PERV-PERV- polpol non-treatednon-treated 0.110.11
Colony #1 Colony #1 54.6054.60
Colony #3 Colony #3 47.8347.83
본 출원의 상기 실시예를 통해, 트랜스펙션된 세포의 게놈 내에 integration 된 transgene에 포함된 융합 에디터 단백질(Cas9, 시티딘 디아미나아제, UGI)과 gag 및 pol 유전자를 표적하는 각각의 sgRNA가 트랜스펙션된 세포에서 발현되어, 상기 세포의 게놈 내의 gag 및 pol 유전자의 표적 서열 내에 종결코돈을 생성할 수 있는 것을 확인하였다.따라서, 본 출원의 조성물을 이용하여 트랜스펙션된 세포는 PERV의 발현이 현저하게 억제될 것으로 판단된다. 뿐만 아니라, 전술한 PERV 유전자를 표적하는 융합 단백질과 sgRNA가 지속적으로 발현될 것으로 예상되므로, 향후 PERV 유전자의 카피 수와 상관없이 지속적으로 PERV를 불활성화 시킬 수 있을 것으로 예상된다.Through the above examples of the present application, each sgRNA targeting the fusion editor protein (Cas9, cytidine deaminase, UGI) and the gag and pol genes included in the transgene integrated into the genome of the transfected cell is transfected. It was confirmed that the expression in the transfected cells could generate stop codons in the target sequences of the gag and pol genes in the genome of the cells. Therefore, the transfected cells using the composition of the present application can express PERV is believed to be significantly suppressed. In addition, since the fusion protein and sgRNA targeting the above-described PERV gene are expected to be continuously expressed, it is expected that PERV can be continuously inactivated regardless of the copy number of the PERV gene in the future.
본 출원은 돼지 세포의 게놈 내 다중 카피로 존재하는 PERV 게놈을 인위적으로 조작할 수 있는 조성물 및 이를 이용한 PERV 불활성 방법에 관한 것이다.The present application relates to a composition capable of artificially manipulating the PERV genome existing in multiple copies in the genome of a pig cell and a method of inactivating PERV using the same.
PERV 유전자의 표적서열, PERV 유전자 표적을 위한 gRNA 서열, 프라이머 서열 등에 관한 것이다.It relates to a target sequence of the PERV gene, a gRNA sequence for targeting the PERV gene, a primer sequence, and the like.

Claims (26)

  1. 돼지의 게놈에 다중카피로 존재하는, 돼지 내인성 레트로바이러스(porcine endogenous retrovirus, PERV)를 불활성화하는 방법으로서, 상기 방법은,A method for inactivating a porcine endogenous retrovirus (PERV) present in multiple copies in a pig genome, the method comprising:
    돼지 세포에 유전자 조작용 조성물을 도입시키는 단계;를 포함하고,Incorporating a composition for genetic manipulation into pig cells;
    이 때, 상기 유전자 조작용 조성물은,At this time, the composition for genetic manipulation,
    (a) PERV의 표적유전자의 표적 서열을 표적화할 수 있는 가이드 RNA 또는 이를 코딩하는 핵산서열;(a) a guide RNA capable of targeting a target sequence of a target gene of PERV or a nucleic acid sequence encoding the same;
    (b) Cas 단백질 또는 이를 코딩하는 핵산서열; 및(b) a Cas protein or a nucleic acid sequence encoding the same; and
    (c) 시티딘 디아미네이즈 또는 이를 코딩하는 핵산서열;(c) cytidine deaminase or a nucleic acid sequence encoding the same;
    을 포함하고,including,
    이 때, 상기 PERV의 표적유전자는, gag 유전자, pol 유전자 및 env 유전자 중 선택되는 하나 이상이고,At this time, the target gene of the PERV is at least one selected from the gag gene, the pol gene, and the env gene,
    상기 표적서열은 5'-CAG-3', 5'-CAA-3', 5'-CGA-3', 5'-CTA-3', 5'-CCA-3' 및 5'-TCA-3'의 뉴클레오타이드 서열 중 하나 이상의 뉴클레오타이드 서열을 포함하고, 이 때, 표적 서열은 상기 PERV 유전자의 연속하는 10bp 내지 30bp 서열 영역에 위치하고,The target sequence is 5'-CAG-3', 5'-CAA-3', 5'-CGA-3', 5'-CTA-3', 5'-CCA-3' and 5'-TCA-3 At least one nucleotide sequence of the nucleotide sequence of ', wherein the target sequence is located in a continuous 10 bp to 30 bp sequence region of the PERV gene,
    상기 Cas 단백질은 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophiles) 유래의 Cas9 단백질, 스타필로코커스 아우레우스 (Staphylococcus aureus) 유래의 Cas9 단백질, 스타필로코커스 아우리쿨라리스(Staphylococcus auricularis) 및 Cpf1 단백질로 이루어진 군에서 선택되고,The Cas protein is a Cas9 protein derived from Streptococcus pyogenes, a Cas9 protein derived from Campylobacter jejuni, a Cas9 protein derived from Streptococcus thermophiles, and a Staphylococcus au It is selected from the group consisting of Cas9 protein derived from Staphylococcus aureus, Staphylococcus auricularis and Cpf1 protein,
    상기 불활성화는 상기 표적서열 내에 종결 코돈을 생성함으로써, PERV의 표적유전자의 발현이 감소 또는 억제되고,The inactivation reduces or suppresses the expression of the target gene of PERV by generating a stop codon in the target sequence,
    상기 다중카피로 존재하는PERV를 불활성화하는 것을 특징으로 하는 방법.A method characterized by inactivating PERV present in the multiple copies.
  2. 제 1항에 있어서,According to claim 1,
    상기 도입은 전기천공법 (electroporation), 리포좀, 플라스미드, 바이러스벡터, 나노파티클(nanoparticles) 및 PTD (Protein translocation domain) 융합 단백질 방법 중 선택되는 1 이상의 방법으로 수행되는 것을 특징으로 하는 방법.Characterized in that the introduction is performed by one or more methods selected from electroporation, liposomes, plasmids, viral vectors, nanoparticles and PTD (Protein translocation domain) fusion protein methods.
  3. 제 1항에 있어서,According to claim 1,
    상기 종결 코돈은 5'-TAG-3', 5'-TAA-3' 및 5'-TGA-3' 중 선택되는 어느 하나 이상의 뉴클레오타이드 서열인 것을 특징으로 하는 방법.Wherein the stop codon is any one or more nucleotide sequences selected from 5'-TAG-3', 5'-TAA-3' and 5'-TGA-3'.
  4. 제 1항에 있어서,According to claim 1,
    상기 시티딘 디아미네이즈는 AID, PmCDA1, AICDA, ARP2, CDA2, HIGM2, APOBEC1, APOBEC2, APOBEC3A, APOBEC3B, APOBEC3C, APOBEC3D, APOBEC3E, APOBEC3F, APOBEC3G, APOBEC3H, CDA 및 DCTD 중 선택되는 것을 특징으로 하는 방법.Wherein the cytidine deaminase is selected from AID, PmCDA1, AICDA, ARP2, CDA2, HIGM2, APOBEC1, APOBEC2, APOBEC3A, APOBEC3B, APOBEC3C, APOBEC3D, APOBEC3E, APOBEC3F, APOBEC3G, APOBEC3H, CDA and DCTD .
  5. 제 1항에 있어서,According to claim 1,
    상기 유전자 조작용 조성물은 DNA 글리코실레이즈 억제제(DNA glycosylase inhibitor)를 더 포함하는 것을 특징으로 하는 방법.The composition for genetic manipulation is characterized in that it further comprises a DNA glycosylase inhibitor (DNA glycosylase inhibitor).
  6. 제 5항에 있어서,According to claim 5,
    상기 DNA 글리코실레이즈 억제제는 우라실 글리코실레이즈 억제제(uracil glycosylase inhibitor, UGI)인 것을 특징으로 하는 방법.Wherein the DNA glycosylase inhibitor is a uracil glycosylase inhibitor (UGI).
  7. 제 1항에 있어서,According to claim 1,
    상기 Cas9 단백질은 Cas9 니케이즈(Cas9 nickase, nCas9)인 것을 특징으로 하는 방법.The Cas9 protein is characterized in that the Cas9 nickase (Cas9 nickase, nCas9).
  8. 제 1항에 있어서,According to claim 1,
    상기 표적 서열은 SEQ ID NOs: 1 내지 65에서 선택되는 어느 하나 이상인 것을 특징으로 방법.The method, characterized in that the target sequence is any one or more selected from SEQ ID NOs: 1 to 65.
  9. 제 1항에 있어서,According to claim 1,
    상기 표적 서열은 상기 PERV 유전자의 핵산 서열 내에 존재하는 PAM(proto-spacer-adjacent motif) 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 10bp 내지 25bp내에 위치하는 것을 특징으로 하는 방법.The target sequence is positioned adjacent to the 5' end and / or 3' end of the PAM (proto-spacer-adjacent motif) sequence present in the nucleic acid sequence of the PERV gene and located within 10 bp to 25 bp method.
  10. 제 9항에 있어서,According to claim 9,
    상기 PAM 서열은 하기의 서열 중 1 이상인 것을 특징으로 하는 방법:(5'에서 3'방향으로 기재함)The method characterized in that the PAM sequence is one or more of the following sequences: (written in the 5' to 3' direction)
    NGG(N은 A, T, C 또는 G임);NGG (N is A, T, C or G);
    NNNNRYAC(N은 각각 독립적으로 A, T, C 또는 G이고, R은 A또는 G이고, Y는 C또는 T임);NNNNRYAC (N is each independently A, T, C or G, R is A or G, and Y is C or T);
    NNGG(N은 A, T, C 또는 G임);NNGG (N is A, T, C or G);
    NNAGAAW(N은 각각 독립적으로 A, T, C 또는 G이고, W는 A 또는 T임);NNAGAAW (N is each independently A, T, C or G, and W is A or T);
    NNNNGATT(N은 각각 독립적으로 A, T, C 또는 G임);NNNNGATT (N is each independently A, T, C or G);
    NNGRR(T)(N은 각각 독립적으로 A, T, C 또는 G이고, R은 A 또는 G임); 및NNGRR(T), where each N is independently A, T, C, or G, and R is A or G; and
    TTN(N은 A, T, C 또는 G임).TTN (where N is A, T, C, or G).
  11. 제 1항에 있어서,According to claim 1,
    상기 유전자 조작용 조성물은 상기 돼지 세포의 게놈 내에 인테그레이션(integration) 되는 것을 특징으로 하는 방법.Wherein the composition for genetic manipulation is integrated into the genome of the pig cell.
  12. 제 1항에 있어서,According to claim 1,
    상기 가이드 RNA는 PERV-A, PERV-B, PERV-C 중 선택되는 두 개 이상의 서브타입 유전자 서열에 각각 존재하는 표적유전자를 동시에 표적할 수 있는 것을 특징으로 하는 방법.The method of claim 1 , wherein the guide RNA can simultaneously target target genes present in two or more subtype gene sequences selected from among PERV-A, PERV-B and PERV-C.
  13. 돼지 내인성 레트로바이러스(porcine endogenous retrovirus, PERV)를 불활성화하기 위한, 유전자 조작용 조성물로서,A composition for genetic manipulation for inactivating porcine endogenous retrovirus (PERV),
    상기 조성물은,The composition,
    (a) SEQ ID NOs: 66 내지 130에서 선택되는 어느 하나 이상의 가이드 도메인 서열을 포함하는, 가이드RNA 또는 이를 코딩하는 핵산;(a) a guide RNA comprising one or more guide domain sequences selected from SEQ ID NOs: 66 to 130, or a nucleic acid encoding the same;
    (b) Cas 단백질 또는 이를 코딩하는 핵산서열; 및(b) a Cas protein or a nucleic acid sequence encoding the same; and
    (c) 시티딘 디아미네이즈(cytidine deaminase) 또는 이를 코딩하는 핵산서열;(c) cytidine deaminase or a nucleic acid sequence encoding the same;
    을 포함하고,including,
    이 때, 상기 PERV의 표적유전자는, gag 유전자, pol 유전자 및 env 유전자 중 선택되는 하나 이상이고,At this time, the target gene of the PERV is at least one selected from the gag gene, the pol gene, and the env gene,
    상기 가이드 도메인은 PERV 유전자의 표적 서열 중 가이드핵산 결합 표적서열과 상보적 결합을 형성할 수 있고,The guide domain may form a complementary bond with a guide nucleic acid binding target sequence among target sequences of the PERV gene,
    상기 가이드RNA는 가이드 도메인 서열 내에 5'-CAG-3', 5'-CAA-3', 5'-CGA-3', 5'-CUA-3', 5'-CCA-3' 및 5'-UCA-3'의 뉴클레오타이드 서열 중 하나 이상의 서열을 포함하고,The guide RNA is 5'-CAG-3', 5'-CAA-3', 5'-CGA-3', 5'-CUA-3', 5'-CCA-3' and 5' in the guide domain sequence. -Contains one or more of the nucleotide sequences of UCA-3',
    상기 Cas 단백질은 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophiles) 유래의 Cas9 단백질, 스타필로코커스 아우레우스 (Staphylococcus aureus)유래의 Cas9 단백질, 스타필로코커스 아우리쿨라리스(Staphylococcus auricularis) 및 Cpf1 단백질로 이루어진 군에서 선택되는 것을 특징으로 하는 조성물.The Cas protein is a Cas9 protein derived from Streptococcus pyogenes, a Cas9 protein derived from Campylobacter jejuni, a Cas9 protein derived from Streptococcus thermophiles, and a Staphylococcus au A composition characterized in that it is selected from the group consisting of a Cas9 protein derived from Staphylococcus aureus, a Staphylococcus auricularis and a Cpf1 protein.
  14. 제 13항에 있어서,According to claim 13,
    상기 시티딘 디아미네이즈는 AID, PmCDA1, AICDA, ARP2, CDA2, HIGM2, APOBEC1, APOBEC2, APOBEC3A, APOBEC3B, APOBEC3C, APOBEC3D, APOBEC3E, APOBEC3F, APOBEC3G, APOBEC3H, CDA 및 DCTD 중 선택되는 것을 특징으로 하는 조성물.The composition, characterized in that the cytidine deaminase is selected from AID, PmCDA1, AICDA, ARP2, CDA2, HIGM2, APOBEC1, APOBEC2, APOBEC3A, APOBEC3B, APOBEC3C, APOBEC3D, APOBEC3E, APOBEC3F, APOBEC3G, APOBEC3H, CDA and DCTD .
  15. 제 13항에 있어서,According to claim 13,
    상기 유전자 조작용 조성물은 DNA 글리코실레이즈 억제제(DNA glycosylase inhibitor)를 더 포함하는 것을 특징으로 하는 조성물.The composition for genetic manipulation is characterized in that it further comprises a DNA glycosylase inhibitor (DNA glycosylase inhibitor).
  16. 제 15항에 있어서,According to claim 15,
    상기 DNA 글리코실레이즈 억제제는 우라실 글리코실레이즈 억제제(uracil glycosylase inhibitor, UGI)인 것을 특징으로 하는 조성물.The composition, characterized in that the DNA glycosylase inhibitor is a uracil glycosylase inhibitor (UGI).
  17. 제 13항에 있어서,According to claim 13,
    상기 Cas 단백질은 Cas9 니케이즈(Cas9 nickase, nCas9)인 것을 특징으로 하는 조성물.The Cas protein is a composition characterized in that the Cas9 nickase (Cas9 nickase, nCas9).
  18. 제 13항에 있어서,According to claim 13,
    상기 표적 서열은 상기 PERV 유전자의 핵산 서열 내에 존재하는 PAM(proto-spacer-adjacent motif) 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 10bp 내지 25bp내에 위치하는 것을 특징으로 하는 조성물.The target sequence is positioned adjacent to the 5' end and / or 3' end of the PAM (proto-spacer-adjacent motif) sequence present in the nucleic acid sequence of the PERV gene and located within 10 bp to 25 bp composition.
  19. 제 18항에 있어서,According to claim 18,
    상기 PAM 서열은 하기의 서열 중 1 이상인 것을 특징으로 하는 조성물:(5'에서 3'방향으로 기재함)The composition, characterized in that the PAM sequence is one or more of the following sequences: (written in the 5 'to 3' direction)
    NGG(N은 A, T, C 또는 G임);NGG (N is A, T, C or G);
    NNNNRYAC(N은 각각 독립적으로 A, T, C 또는 G이고, R은 A또는 G이고, Y는 C또는 T임);NNNNRYAC (N is each independently A, T, C or G, R is A or G, and Y is C or T);
    NNGG(N은 A, T, C 또는 G임);NNGG (N is A, T, C or G);
    NNAGAAW(N은 각각 독립적으로 A, T, C 또는 G이고, W는 A 또는 T임);NNAGAAW (N is each independently A, T, C or G, and W is A or T);
    NNNNGATT(N은 각각 독립적으로 A, T, C 또는 G임);NNNNGATT (N is each independently A, T, C or G);
    NNGRR(T)(N은 각각 독립적으로 A, T, C 또는 G이고, R은 A 또는 G임); 및NNGRR(T), where each N is independently A, T, C, or G, and R is A or G; and
    TTN(N은 A, T, C 또는 G임).TTN (where N is A, T, C, or G).
  20. 제 13항에 있어서,According to claim 13,
    상기 조성물은 가이드 RNA, Cas 단백질 및 시티딘 디아미네이즈가 하나의 벡터에 모두 포함되거나 또는 각각의 핵산서열이 개별적인 벡터에 포함되는 것을 특징으로 하는 조성물.The composition is characterized in that the guide RNA, Cas protein and cytidine deaminase are all included in one vector or each nucleic acid sequence is included in an individual vector.
  21. 제 20항에 있어서,21. The method of claim 20,
    상기 벡터는 바이러스 벡터 또는 플라스미드인 것을 특징으로 하는 조성물.Wherein the vector is a viral vector or a plasmid.
  22. 제 21항에 있어서,According to claim 21,
    상기 바이러스는 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스(AAV), 백시니아바이러스, 폭스바이러스 또는 단순포진 바이러스 중 선택되는 하나 이상인 것을 특징으로 하는 조성물.The composition, characterized in that the virus is at least one selected from retrovirus, lentivirus, adenovirus, adeno-associated virus (AAV), vaccinia virus, poxvirus or herpes simplex virus.
  23. 제 21항에 있어서,According to claim 21,
    상기 벡터는 전이인자 또는/및 트랜스포사아제(transposase)를 코딩하는 유전자를 더 포함할 수 있는 것을 특징으로 하는 조성물.The vector composition characterized in that it may further comprise a gene encoding a transfer factor or / and transposase (transposase).
  24. 제 23항에 있어서,24. The method of claim 23,
    상기 전이인자는 piggyBac 전이인자 또는 Sleeping Beauty 전이인자인 것을 특징으로 하는 조성물.The transfer factor is a composition, characterized in that the piggyBac transfer factor or Sleeping Beauty transfer factor.
  25. gag 유전자, pol 유전자 및 env 유전자에서 선택되는 하나이상의 유전자가 불활성화된 돼지 내인성 레트로바이러스(porcine endogenous retrovirus, PERV)를 게놈 내에 포함하고, A porcine endogenous retrovirus (PERV) in which at least one gene selected from the gag gene, pol gene, and env gene is inactivated is included in the genome,
    상기 불활성화된 유전자 내에는 각각 적어도 2개 이상의 종결 코돈이 포함된 돼지 세포로서, A pig cell containing at least two or more stop codons in each of the inactivated genes,
    상기 종결 코돈은 5'-TAG-3', 5'-TAA-3' 및 5'-TGA-3' 중 선택되는 어느 하나 이상의 뉴클레오타이드 서열이고,The stop codon is any one or more nucleotide sequences selected from 5'-TAG-3', 5'-TAA-3' and 5'-TGA-3',
    상기 불활성화된 PERV는 게놈 내에 다중카피로 존재하며The inactivated PERV exists in multiple copies in the genome and
    PERV의 발현량이 불활성 전과 비교하여 50% 이상 감소된 것을 특징으로 하는 돼지세포.Porcine cells characterized in that the expression level of PERV is reduced by 50% or more compared to before inactivation.
  26. 제 25항에 있어서,26. The method of claim 25,
    상기 돼지세포를 이용하여 생산된 돼지.A pig produced using the pig cells.
PCT/KR2022/014077 2021-10-25 2022-09-21 Method for inactivating gene of porcine endogenous retrovirus and composition thereof WO2023075154A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020237000584A KR20230065230A (en) 2021-10-25 2022-09-21 Method for inactivating the gene of porcine endogenous retrovirus and composition thereof

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2021-0142534 2021-10-25
KR20210142534 2021-10-25

Publications (1)

Publication Number Publication Date
WO2023075154A1 true WO2023075154A1 (en) 2023-05-04

Family

ID=86158295

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2022/014077 WO2023075154A1 (en) 2021-10-25 2022-09-21 Method for inactivating gene of porcine endogenous retrovirus and composition thereof

Country Status (2)

Country Link
KR (1) KR20230065230A (en)
WO (1) WO2023075154A1 (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080025172A (en) * 2005-06-24 2008-03-19 리전츠 오브 더 유니버스티 오브 미네소타 Using cytosine deaminases to diminish retroelement transfer from pigs to humans
WO2019005886A1 (en) * 2017-06-26 2019-01-03 The Broad Institute, Inc. Crispr/cas-cytidine deaminase based compositions, systems, and methods for targeted nucleic acid editing

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080025172A (en) * 2005-06-24 2008-03-19 리전츠 오브 더 유니버스티 오브 미네소타 Using cytosine deaminases to diminish retroelement transfer from pigs to humans
WO2019005886A1 (en) * 2017-06-26 2019-01-03 The Broad Institute, Inc. Crispr/cas-cytidine deaminase based compositions, systems, and methods for targeted nucleic acid editing

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
LI ZHIFANG, DUAN XIAOYUE, AN XIAOMENG, FENG TAO, LI PAN, LI LINLIN, LIU JUN, WU PANXUE, PAN DENGKE, DU XUGUANG, WU SEN: "Efficient RNA-guided base editing for disease modeling in pigs", CELL DISCOVERY, vol. 4, no. 1, XP093060102, DOI: 10.1038/s41421-018-0065-7 *
SMITH CORY J, CASTANON OSCAR, SAID KHALED, VOLF VERENA, KHOSHAKHLAGH PARASTOO, HORNICK AMANDA, FERREIRA RAPHAEL, WU CHUN-TING, GÜE: "Enabling large-scale genome editing at repetitive elements by reducing DNA nicking", NUCLEIC ACIDS RESEARCH, vol. 48, no. 9, 21 May 2020 (2020-05-21), GB , pages 5183 - 5195, XP093060105, ISSN: 0305-1048, DOI: 10.1093/nar/gkaa239 *
XIE JINGKE, GE WEIKAI, LI NAN, LIU QISHUAI, CHEN FANGBING, YANG XIAOYU, HUANG XINGYUN, OUYANG ZHEN, ZHANG QUANJUN, ZHAO YU, LIU ZH: "Efficient base editing for multiple genes and loci in pigs using base editors", NATURE COMMUNICATIONS, vol. 10, no. 1, 28 June 2019 (2019-06-28), UK, pages 2852, XP055905014, ISSN: 2041-1723, DOI: 10.1038/s41467-019-10421-8 *
YUM SOO-YOUNG, JANG GOO, KOO OKJAE: "Target-AID-Mediated Multiplex Base Editing in Porcine Fibroblasts", 21 September 2021 (2021-09-21), XP093060113, DOI: 10.20944/preprints202109.0362.v1 *

Also Published As

Publication number Publication date
KR20230065230A (en) 2023-05-11

Similar Documents

Publication Publication Date Title
WO2019009682A2 (en) Target-specific crispr mutant
WO2021086083A2 (en) Engineered guide rna for increasing efficiency of crispr/cas12f1 system, and use of same
WO2018231018A2 (en) Platform for expressing protein of interest in liver
AU2013335451C1 (en) Composition for cleaving a target DNA comprising a guide RNA specific for the target DNA and Cas protein-encoding nucleic acid or Cas protein, and use thereof
WO2022075813A1 (en) Engineered guide rna for increasing efficiency of crispr/cas12f1 system, and use of same
WO2022075816A1 (en) Engineered guide rna for increasing efficiency of crispr/cas12f1 (cas14a1) system, and use thereof
WO2016021973A1 (en) Genome editing using campylobacter jejuni crispr/cas system-derived rgen
WO2017217768A1 (en) Method for screening targeted genetic scissors by using multiple target system of on-target and off-target activity and use thereof
WO2017188797A1 (en) Method for evaluating, in vivo, activity of rna-guided nuclease in high-throughput manner
WO2022060185A1 (en) Targeted deaminase and base editing using same
WO2018088694A2 (en) Artificially engineered sc function control system
WO2018034554A1 (en) Artificially engineered angiogenesis regulatory system
WO2019066549A2 (en) Gene manipulation for treatment of retinal dysfunction disorder
WO2019066490A2 (en) Artificial genome manipulation for gene expression regulation
WO2022220503A1 (en) Gene expression regulatory system using crispr system
WO2022075808A1 (en) Engineered guide rna comprising u-rich tail for increasing efficiency of crispr/cas12f1 system, and use thereof
WO2020235974A9 (en) Single base substitution protein, and composition comprising same
WO2020218657A1 (en) Target specific crispr mutant
WO2023075154A1 (en) Method for inactivating gene of porcine endogenous retrovirus and composition thereof
WO2018117377A1 (en) Oleic acid-enriched plant body having genetically modified fad2 and production method therefor
WO2012134215A2 (en) Expression vector for animal cells
WO2020022803A1 (en) Gene editing of anticoagulants
WO2020022802A1 (en) Genome editing for treating autoimmune disease
WO2018230976A1 (en) Genome editing system for repeat expansion mutation
WO2023153845A2 (en) Target system for homology-directed repair and gene editing method using same

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22887358

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE