WO2020022802A1 - 인위적인 유전자 조작을 통한 자가면역질환 치료 - Google Patents

인위적인 유전자 조작을 통한 자가면역질환 치료 Download PDF

Info

Publication number
WO2020022802A1
WO2020022802A1 PCT/KR2019/009237 KR2019009237W WO2020022802A1 WO 2020022802 A1 WO2020022802 A1 WO 2020022802A1 KR 2019009237 W KR2019009237 W KR 2019009237W WO 2020022802 A1 WO2020022802 A1 WO 2020022802A1
Authority
WO
WIPO (PCT)
Prior art keywords
seq
exon
sequence
guide
nucleic acid
Prior art date
Application number
PCT/KR2019/009237
Other languages
English (en)
French (fr)
Inventor
송동우
조동현
김정훈
이정민
이규준
김운기
Original Assignee
주식회사 툴젠
서울대학교산학협력단
서울대학교병원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 툴젠, 서울대학교산학협력단, 서울대학교병원 filed Critical 주식회사 툴젠
Publication of WO2020022802A1 publication Critical patent/WO2020022802A1/ko

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • A61K31/7088Compounds having three or more nucleosides or nucleotides
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • A61P37/02Immunomodulators
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Definitions

  • the present invention relates to artificial manipulation or modification of immune participating genes for immune function regulation. More specifically, the present invention relates to a system capable of artificially regulating an immune response or function, comprising a composition capable of artificially manipulating an immune participating gene for regulating an immune response.
  • autoimmune disease is a disease caused by the body's internal immune system attacks the normal cells inside, not the external antigen, the cause is not yet clear. Congenital and likely a genetic disorder. It is exacerbated by environmental factors such as stress and lifestyle, but it is not certain. It is the most common among adult women, but in fact it appears in both sexes.
  • autoimmune diseases have no known cause, and symptomatic treatment has developed without cure. It's just speculated that stress, hormones, or wrong lifestyles are the cause. It is known that more than 100 kinds of autoimmune diseases, and the most representative examples of autoimmune diseases are rheumatoid arthritis, and autoimmune diseases occurring in the eye include uveitis, Behcet's disease, and Sjogren's syndrome.
  • Uveitis is one out of every 1,000 to 5000 patients, and more than 10% of the patients are at risk of blindness even after treatment, and the risk is the third (about 20%) cause of blindness. Despite this major disease, there are no special treatments other than the anti-inflammatory corticosteroids.
  • composition for genetic manipulation As one embodiment of the present invention to provide a composition for genetic manipulation.
  • the present invention relates to a composition for genetic manipulation for artificially manipulating the immune participating gene present in the genome of the cell for artificial immune function regulation. More specifically, the present invention relates to a composition for genetic engineering comprising a guide nucleic acid and an editor protein capable of targeting an immune participating gene. The present invention also relates to a method for treating or ameliorating immune dysfunction diseases using a genetically engineered composition for artificially manipulating an immune participating gene.
  • the present invention provides a composition for genetic manipulation for a specific purpose.
  • composition for genetic manipulation is N-(2-aminoethyl)-2-aminoethyl-N-(2-aminoethyl)-2-aminoethyl-N-(2-aminoethyl)-2-aminoethyl-N-(2-aminoethyl)-2-aminoethyl-N-(2-aminoethyl)-2-aminoethyl
  • a guide nucleic acid or a nucleic acid sequence encoding the target nucleic acid comprising a guide sequence which forms a complementary bond with a target sequence located in an immune participation gene;
  • the immune participating gene may be a gene encoding a protein including a death domain.
  • the protein containing the death domain may be a TNF receptor, ankyrin, MyD88 or IRAK family proteins.
  • the immune participating gene may be a gene encoding a protein including a Toll / interleukin-1 receptor (TIR) domain.
  • TIR Toll / interleukin-1 receptor
  • the protein including the Toll / interleukin-1 receptor (TIR) domain may be MyD88, interleukin-1 receptor, Toll receptor or Toll like receptor protein.
  • the immune participating gene may be a gene encoding a complement component protein.
  • the complement component protein may be a C1, C2, C3, C4, C5, C6, C7, C8 or C9 protein.
  • the immune participating gene may be a MYD88 gene.
  • the immune participating gene may be a C3 gene.
  • the target sequence may be located at the exon of the immune participating gene.
  • the target sequence may be one or more sequences selected from SEQ ID NO: 19 to SEQ ID NO: 416.
  • the target sequence is SEQ ID NOs: 21, 22, 25, 26, 29, 35, 36, 37, 38, 39, 40, 155, 157, 158, 159, 161, 171, 172, 177, 178, 181, One or more sequences selected from 183, 184, 185, 186, and 188.
  • the target sequence is SEQ ID NO: 49, 51, 52, 64, 65, 71, 78, 90, 95, 96, 100, 102, 103, 105, 109, 112, 114, 115, 116, 117, 118, At least one sequence selected from 119, 120, 121, 211, 212, 243, 244, 245, 262, 263, 264, 274, 284, 285, 286, 312, 313, 314, 315 and 316.
  • the guide sequence may be one or more sequences selected from SEQ ID NO: 417 to SEQ ID NO: 814.
  • the guide sequence is SEQ ID NOs: 419, 420, 423, 424, 427, 433, 434, 435, 436, 437, 438, 553, 555, 556, 557, 559, 569, 570, 575, 576, 579, One or more sequences selected from 581, 582, 583, 584, and 586.
  • the guide sequence is SEQ ID NOs: 447, 449, 450, 462, 463, 469, 476, 488, 493, 494, 498, 500, 501, 503, 507, 510, 512, 513, 514, 515, 516, 517, 518, 519, 609, 610, 641, 642, 643, 660, 661, 662, 672, 682, 683, 684, 710, 711, 712, 713 and 714.
  • the guide sequence may form a complementary bond with a target sequence located at exon 1, exon 2, exon 3, exon 4 or exon 5 of the MYD88 gene.
  • the guide sequence is exon 3, exon 4, exon 6, exon 7, exon 10, exon 11, exon 13, exon 15, exon 16, exon 17, exon 20, exon 21, exon 22, exon 23, exon Binding to a target sequence located at 25, exon 26, exon 28, exon 29 or exon 30.
  • the complementary bond may be a bond containing 0 to 5 mismatches.
  • the guide nucleic acid may include a guide domain.
  • the guide sequence may be included in the guide domain.
  • the guide nucleic acid may include at least one domain of a first complementary domain, a second complementary domain, a linking domain, a proximal domain, and a tail domain.
  • the editor protein is Cas9 protein derived from Streptococcus pyogenes, Cas9 protein derived from Campylobacter jejuni, Cas9 protein derived from Streptococcus thermophilus, Staphylococcus aureus It may be at least one selected from the group consisting of Cas9 protein from Staphylococcus aureus, Cas9 protein derived from Neisseria meningitidis, and Cpf1 protein.
  • the editor protein may be a Cas9 protein from Streptococcus pyogenes or a Cas9 protein from Campylobacter jejuni.
  • the guide nucleic acid and the editor protein may each be present in one or more plasmids or one or more viral vectors in the form of nucleic acid sequences.
  • the viral vector may be at least one selected from the group consisting of a retrovirus vector, a lentiviral vector, an adenovirus vector, an adeno-associated virus (AAV) vector, a vaccinia virus vector, a poxvirus vector and a herpes simplex virus vector.
  • the genetic engineering composition may be in the form of a guide nucleic acid-editor protein complex in which the guide nucleic acid and the editor protein are bound.
  • the guide nucleic acid may be guide RNA (gRNA).
  • gRNA guide RNA
  • the present invention also provides guide nucleic acids that can target immune participating genes for specific purposes.
  • the guide nucleic acid may comprise a guide sequence that forms a complementary bond with a target sequence located in an immune participation gene.
  • the immune participating gene may be a MYD88 gene or a C3 gene.
  • the guide sequence may be at least one selected from the sequences consisting of SEQ ID NO: 417 to SEQ ID NO: 814.
  • the complementary bond may be a bond containing 0 to 5 mismatches.
  • the guide nucleic acid may form a complex with the editor protein.
  • the guide sequence is SEQ ID NO: 419, 420, 423, 424, 427, 433, 434, 435, 436, 437, 438, 553, 555, 556, 557, 559, 569, 570, 575 , 576, 579, 581, 582, 583, 584 and 586.
  • the guide sequence is SEQ ID NO: 447, 449, 450, 462, 463, 469, 476, 488, 493, 494, 498, 500, 501, 503, 507, 510, 512, 513, 514
  • At least one sequence selected from among 515, 516, 517, 518, 519, 609, 610, 641, 642, 643, 660, 661, 662, 672, 682, 683, 684, 710, 711, 712, 713 and 714 Can be.
  • the guide sequence may form a complementary bond with a target sequence located at exon 1, exon 2, exon 3, exon 4 or exon 5 of the MYD88 gene.
  • the guide sequence is exon 3, exon 4, exon 6, exon 7, exon 10, exon 11, exon 13, exon 15, exon 16, exon 17, exon 20, exon 21, exon 22, exon 23, exon Binding to a target sequence located at 25, exon 26, exon 28, exon 29 or exon 30.
  • the guide nucleic acid may include a guide domain.
  • the guide sequence may be included in the guide domain.
  • the guide nucleic acid may include at least one domain of a first complementary domain, a second complementary domain, a linking domain, a proximal domain, and a tail domain.
  • the present invention provides a method for treating uveitis, comprising administering (introducing) a genetically engineered composition to a subject to be treated to treat uveitis.
  • the method of treating Uveitis may comprise introducing (administering) a genetically engineered composition into a treatment subject.
  • the genetic manipulation composition includes
  • a guide nucleic acid or a nucleic acid sequence encoding the target nucleic acid comprising a guide sequence which forms a complementary bond with a target sequence located in an immune participation gene;
  • the immune participating gene may be a MYD88 gene or a C3 gene.
  • the guide sequence may be at least one selected from the sequences consisting of SEQ ID NO: 417 to SEQ ID NO: 814.
  • the complementary bond may be a bond containing 0 to 5 mismatches.
  • the guide sequence is SEQ ID NO: 419, 420, 423, 424, 427, 433, 434, 435, 436, 437, 438, 553, 555, 556, 557, 559, 569, 570, 575 , 576, 579, 581, 582, 583, 584 and 586.
  • the guide sequence is SEQ ID NO: 447, 449, 450, 462, 463, 469, 476, 488, 493, 494, 498, 500, 501, 503, 507, 510, 512, 513, 514
  • At least one sequence selected from among 515, 516, 517, 518, 519, 609, 610, 641, 642, 643, 660, 661, 662, 672, 682, 683, 684, 710, 711, 712, 713 and 714 Can be.
  • the guide sequence may form a complementary bond with a target sequence located at exon 1, exon 2, exon 3, exon 4 or exon 5 of the MYD88 gene.
  • the guide sequence is exon 3, exon 4, exon 6, exon 7, exon 10, exon 11, exon 13, exon 15, exon 16, exon 17, exon 20, exon 21, exon 22, exon 23, exon Binding to a target sequence located at 25, exon 26, exon 28, exon 29 or exon 30.
  • the editor protein is a Cas9 protein derived from Streptococcus pyogenes, a Cas9 protein derived from Campylobacter jejuni, a Cas9 protein derived from Streptococcus thermophilus, and Staphylococcus aureus. It may be at least one selected from the group consisting of Cas9 protein from Staphylococcus aureus, Cas9 protein derived from Neisseria meningitidis, and Cpf1 protein.
  • the editor protein is Cas9 protein from Streptococcus pyogenes, Cas9 protein from Staphylococcus aureus or Cas9 from Campylobacter jejuni. Protein.
  • the genetically engineered composition may be in the form of a plasmid or viral vector.
  • the viral vector may be at least one selected from the group consisting of a retrovirus vector, a lentiviral vector, an adenovirus vector, an adeno-associated virus (AAV) vector, a vaccinia virus vector, a poxvirus vector and a herpes simplex virus vector.
  • the guide nucleic acid and editor protein may each be present in one or more vectors in the form of a nucleic acid sequence.
  • the genetic engineering composition may be in the form of a guide nucleic acid-editor protein complex in which the guide nucleic acid and the editor protein are bound.
  • the guide nucleic acid may be guide RNA (gRNA).
  • gRNA guide RNA
  • the guide nucleic acid-editor protein complex may be formed by the interaction between some nucleotide sequence of the guide nucleic acid and some amino acid of the editor protein.
  • the genetic engineering composition may further include a donor containing a nucleic acid sequence to be inserted or a nucleic acid sequence encoding the same.
  • the guide nucleic acid and editor protein, and / or donor may each be present in one or more vectors in the form of a nucleic acid sequence.
  • the vector may be a plasmid or a viral vector.
  • the viral vector may be at least one selected from the group consisting of retrovirus, lentivirus, adenovirus, adeno-associated virus (AAV), vaccinia virus, poxvirus and herpes simplex virus.
  • the treatment target may be a mammal including humans, primates such as monkeys, rodents such as mice, rats, and the like.
  • the genetically engineered composition may be administered (introduced) to a treatment subject.
  • the genetically engineered composition may be administered (introduced) to a specific body location of the subject to be treated.
  • the particular body position may be an iris, ciliary body, choroid, retina or tissue that is in close proximity to and / or in close proximity to function.
  • the iris, ciliary body, choroid and / or eye may be an iris, ciliary body, choroid and / or eye.
  • the administration may be performed by injection, transfusion, implantation or transplantation.
  • the administration may be subretinal, subcutaneously, intradermaliy, intraocularly, intravitreally intratumorally, intraranodally, intramedullary, It may be carried out by a route of administration chosen intramuscularly, intravenously, intralymphatic or intraperitoneally.
  • the present invention can regulate the function and / or expression of the immune participating genes through the composition for genetic engineering. More specifically, by artificially manipulating and / or modifying an immune participating gene by using a composition for genetic engineering comprising a guide nucleic acid and an editor protein that targets an immune participating gene, the function and / or expression of the immune participating gene may be artificially controlled. Allows you to regulate immune function.
  • a genetically engineered composition for artificially manipulating an immune participating gene may be used to ameliorate or treat immune dysfunction.
  • 1 is a graph confirming the indel (%) of the on-target and off-target in Retina cells and RPE cells by gRNA and Cas9 targeting the C3 gene, depending on the type of Cas9 Cj (CjCas9) or Sp (SpCas9) Marked as.
  • Figure 2 is a graph confirming the indel (%) of the on-target and off-target in Retina cells and RPE cells by gRNA and Cas9 targeting the Myd88 gene, Cj (CjCas9) or Sp (SpCas9) depending on the type of Cas9 Marked as.
  • One aspect of the disclosure disclosed herein relates to guide nucleic acids.
  • “Guidenucleic acid” means a nucleotide sequence that recognizes a target nucleic acid, gene or chromosome, and can interact with editor proteins.
  • the guide nucleic acid may bind complementarily with some nucleotide sequences in the target nucleic acid, gene or chromosome.
  • some nucleotide sequences of the guide nucleic acids may interact with some amino acids of the editor protein to form guide nucleic acid-editor protein complexes.
  • the guide nucleic acid may perform a function of inducing the guide nucleic acid-editor protein complex to be located in a target region of a target nucleic acid, gene or chromosome.
  • the guide nucleic acid may be in the form of DNA, RNA or DNA / RNA mixture, and may have 5 to 150 nucleic acid sequences.
  • the guide nucleic acid may be one continuous nucleic acid sequence.
  • one contiguous nucleic acid sequence may be (N) m , where N is A, T, C or G, or A, U, C or G, and m means an integer from 1 to 150 .
  • the guide nucleic acid may be two or more consecutive nucleic acid sequences.
  • two or more consecutive nucleic acid sequences may be (N) m and (N) o , where N is A, T, C or G, or A, U, C or G, and m and o are It means an integer of 1 to 150, m and o may be the same or different from each other.
  • the guide nucleic acid may comprise one or more domains.
  • the domain may be a functional domain such as a guide domain, a first complementary domain, a connecting domain, a second complementary domain, a proximal domain, a tail domain, or the like, but is not limited thereto.
  • one guide nucleic acid may have two or more functional domains.
  • the two or more functional domains may be different from each other.
  • two or more functional domains included in one guide nucleic acid may be identical to each other.
  • one guide nucleic acid may have two or more proximal domains, and for example, one guide nucleic acid may have two or more tail domains.
  • the fact that the functional domains included in one guide nucleic acid are the same domains does not mean that the sequences of the two functional domains are the same. .
  • a "guide domain” is a domain capable of complementary binding to some sequences of either strand of a double strand of a target gene or nucleic acid, and serves for specific interaction with the target gene or nucleic acid.
  • the guide domain may serve to induce the guide nucleic acid-editor protein complex to a position having a specific nucleotide sequence of a target gene or nucleic acid.
  • the guide domain may be between 10 and 35 nucleotide sequences.
  • the guide domain may be 10 to 35 nucleotide sequences, 15 to 35 nucleotide sequences, 20 to 35 nucleotide sequences, 25 to 35 nucleotide sequences, or 30 to 35 nucleotide sequences.
  • the guide domain may be 10 to 15 nucleotide sequences, 15 to 20 nucleotide sequences, 20 to 25 nucleotide sequences, 25 to 30 nucleotide sequences, or 30 to 35 nucleotide sequences.
  • the guide domain may comprise a guide sequence.
  • a “guide sequence” is a nucleotide sequence that is complementary to some sequence of either of the double strands of a target gene or nucleic acid, wherein the guide sequence is at least 50%, 55%, 60%, 65%, 70%, 75%, Nucleotide sequence having at least 80%, 85%, 90% or 95% complementarity or complete complementarity.
  • the guide sequence may be 10 to 25 nucleotide sequences.
  • the guide sequence may be 10 to 25 nucleotide sequences, 15 to 25 nucleotide sequences, or 20 to 25 nucleotide sequences.
  • the guide sequence may be 10 to 15 nucleotide sequences, 15 to 20 nucleotide sequences, or 20 to 25 nucleotide sequences.
  • the guide domain may further comprise additional nucleotide sequences.
  • the additional nucleotide sequence may be for improving or decreasing the function of the guide domain.
  • the additional nucleotide sequence may be for improving or decreasing the function of the guide sequence.
  • the additional nucleotide sequence may be 1 to 10 nucleotide sequences.
  • the additional nucleotide sequence may be 2 to 10 nucleotide sequences, 4 to 10 nucleotide sequences, 6 to 10 nucleotide sequences, or 8 to 10 nucleotide sequences.
  • the additional nucleotide sequence may be 1 to 3 nucleotide sequences, 3 to 6 nucleotide sequences, or 7 to 10 nucleotide sequences.
  • the additional nucleotide sequence comprises one nucleotide sequence, two nucleotide sequences, three nucleotide sequences, four nucleotide sequences, five nucleotide sequences, six nucleotide sequences, seven nucleotide sequences, eight nucleotide sequences, It may be nine nucleotide sequences or ten nucleotide sequences.
  • the additional nucleotide sequence may be one nucleotide sequence G (guanine) or may be two nucleotide sequences GG.
  • the additional nucleotide sequence may be located at the 5 'end of the guide sequence.
  • the additional nucleotide sequence may be located at the 3 'end of the guide sequence.
  • a “first complementary domain” is a domain comprising a complementary nucleotide sequence to a second complementary domain described below, and is complementary enough to form a double strand with the second complementary domain.
  • the first complementary domain may have at least 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, or 95% complementarity with respect to the second complementary domain. Nucleotide sequences that may have or have complete complementarity.
  • the first complementary domain may form a double strand through complementary binding with the second complementary domain.
  • the formed double strands may serve to interact with some amino acids of the editor protein to form guide nucleic acid-editor protein complexes.
  • the first complementary domain may be between 5 and 35 nucleotide sequences.
  • the first complementary domain comprises 5 to 35 nucleotide sequences, 10 to 35 nucleotide sequences, 15 to 35 nucleotide sequences, 20 to 35 nucleotide sequences, 25 to 35 nucleotide sequences, or 30 to 35 nucleotide sequences Can be.
  • the first complementary domain may comprise 1 to 5 nucleotide sequences, 5 to 10 nucleotide sequences, 10 to 15 nucleotide sequences, 15 to 20 nucleotide sequences, 20 to 25 nucleotide sequences, 25 to 30 Nucleotide sequences or 30 to 35 nucleotide sequences.
  • a “linking domain” is a nucleotide sequence that connects two or more domains, wherein the linking domain connects two or more domains that are the same or different.
  • the linking domain may be covalently or non-covalently coupled with two or more domains, or may connect two or more domains covalently or non-covalently.
  • the linking domain may be 1 to 30 nucleotide sequences.
  • the linking domain may be 1 to 5 nucleotide sequences, 5 to 10 nucleotide sequences, 10 to 15 nucleotide sequences, 15 to 20 nucleotide sequences, 20 to 25 nucleotide sequences, or 25 to 30 nucleotide sequences Can be.
  • the linking domain may comprise 1 to 30 nucleotide sequences, 5 to 30 nucleotide sequences, 10 to 30 nucleotide sequences, 15 to 30 nucleotide sequences, 20 to 30 nucleotide sequences, or 25 to 30 nucleotide sequences. Can be.
  • a “second complementary domain” is a domain comprising a nucleotide sequence comprising a complementary nucleic acid sequence and a first complementary domain as described above, and is complementary enough to form a double strand with the first complementary domain.
  • the second complementary domain may have at least 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, or 95% complementarity with respect to the first complementary domain. Nucleotide sequences that may have or have complete complementarity.
  • the second complementary domain may form a double strand through complementary binding with the first complementary domain.
  • the formed double strands may serve to interact with some amino acids of the editor protein to form guide nucleic acid-editor protein complexes.
  • the second complementary domain comprises a complementary nucleotide sequence with the first complementary domain and a nucleotide sequence that is not complementary with the first complementary domain, eg, a nucleotide sequence that does not form a double strand with the first complementary domain.
  • the nucleotide sequence may be longer than the first complementary domain.
  • the second complementary domain may be between 5 and 35 nucleotide sequences.
  • the second complementary domain comprises 1 to 35 nucleotide sequences, 5 to 35 nucleotide sequences, 10 to 35 nucleotide sequences, 15 to 35 nucleotide sequences, 20 to 35 nucleotide sequences, 25 to 35 nucleotides Sequence or 30 to 35 nucleotide sequences.
  • the second complementary domain includes 1 to 5 nucleotide sequences, 5 to 10 nucleotide sequences, 10 to 15 nucleotide sequences, 15 to 20 nucleotide sequences, 20 to 25 nucleotide sequences, 25 to 30 Nucleotide sequence or 30 to 35 nucleotide sequences.
  • proximal domain is a nucleotide sequence located proximate to a second complementary domain.
  • the proximal domain may comprise complementary nucleotide sequences within the proximal domain and may form a double strand by the complementary nucleotide sequence.
  • the proximal domain may be 1 to 20 nucleotide sequences.
  • the proximal domain may be 1 to 20 nucleotide sequences, 5 to 20 nucleotide sequences, 10 to 20 nucleotide sequences, or 15 to 20 nucleotide sequences.
  • the proximal domain may be 1 to 5 nucleotide sequences, 5 to 10 nucleotide sequences, 10 to 15 nucleotide sequences, or 15 to 20 nucleotide sequences.
  • a “tail domain” is a nucleotide sequence located at either or more of the ends of both guide nucleic acids.
  • the tail domain may comprise complementary nucleotide sequences within the tail domain and may form a double strand by the complementary nucleotide sequence.
  • the tail domain may be from 1 to 50 nucleotide sequences.
  • the tail domain is 5 to 50 nucleotide sequences, 10 to 50 nucleotide sequences, 15 to 50 nucleotide sequences, 20 to 50 nucleotide sequences, 25 to 50 nucleotide sequences, 30 to 50 nucleotide sequences, 35 It may be from 50 to 50 nucleotide sequences, 40 to 50 nucleotide sequences or 45 to 50 nucleotide sequences.
  • the tail domain includes 1 to 5 nucleotide sequences, 5 to 10 nucleotide sequences, 10 to 15 nucleotide sequences, 15 to 20 nucleotide sequences, 20 to 25 nucleotide sequences, 25 to 30 nucleotide sequences, 30 to 35 nucleotide sequences, 35 to 40 nucleotide sequences, 40 to 45 nucleotide sequences, or 45 to 50 nucleotide sequences.
  • nucleic acid sequences included in the domains may include a selective or additional chemical modification. have.
  • the chemical modification may be methylation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid (LNA), 2'-O-methyl 3'phosphorothioate (MS) or 2'-O-methyl 3'thioPACE (MSP). It is not limited.
  • Guide nucleic acids include one or more domains.
  • the guide nucleic acid may comprise a guide domain.
  • the guide nucleic acid may comprise a first complementary domain.
  • the guide nucleic acid may comprise a linking domain.
  • the guide nucleic acid may comprise a second complementary domain.
  • the guide nucleic acid may comprise a proximal domain.
  • the guide nucleic acid may comprise a tail domain.
  • the number of domains may be 1, 2, 3, 4, 5, 6 or more.
  • the guide nucleic acid may include 1, 2, 3, 4, 5, 6 or more guide domains.
  • the guide nucleic acid may comprise one, two, three, four, five, six or more first complementary domains.
  • the guide nucleic acid may comprise 1, 2, 3, 4, 5, 6 or more linking domains.
  • the guide nucleic acid may comprise one, two, three, four, five, six or more second complementary domains.
  • the guide nucleic acid may comprise 1, 2, 3, 4, 5, 6 or more proximal domains.
  • the guide nucleic acid may comprise 1, 2, 3, 4, 5, 6 or more tail domains.
  • the guide nucleic acid may be included by overlapping one domain.
  • the guide nucleic acid may be included without overlapping or overlapping multiple domains.
  • the guide nucleic acid may include the same kind of domain, wherein the same kind of domain may have the same nucleic acid sequence or different nucleic acid sequences.
  • the guide nucleic acid may include two kinds of domains, wherein the other two kinds of domains may have different nucleic acid sequences or the same nucleic acid sequences.
  • the guide nucleic acid may include three kinds of domains, wherein the other three kinds of domains may have different nucleic acid sequences or the same nucleic acid sequences.
  • the guide nucleic acid may include four kinds of domains, wherein the other four kinds of domains may have different nucleic acid sequences or the same nucleic acid sequences.
  • the guide nucleic acid may include five kinds of domains, wherein the other five kinds of domains may have different nucleic acid sequences or the same nucleic acid sequences.
  • the guide nucleic acid may include six kinds of domains, wherein the other six kinds of domains may have different nucleic acid sequences or the same nucleic acid sequences.
  • the guide nucleic acid is [guide domain]-[first complementary domain]-[linking domain]-[second complementary domain]-[linking domain]-[guide domain]-[first complementary domain] -[Linking domain]-[second complementary domain], wherein the two guide domains can comprise guide sequences for different or identical targets, and the two first complementary domains Two second complementary domains may have the same nucleic acid sequence or different nucleic acid sequences.
  • the guide domains contain guide sequences for different targets, the guide nucleic acids can specifically bind to two targets, where specific binding can occur simultaneously or sequentially.
  • the linking domain may be cleaved by a specific enzyme, and in the presence of a specific enzyme, the guide nucleic acid may be divided into two parts or three parts.
  • the guide nucleic acid may be a gRNA.
  • GRNA refers to an RNA capable of specific targeting to a gRNA-CRISPR enzyme complex, ie, a CRISPR complex, for a target gene or nucleic acid.
  • the gRNA refers to a target gene or nucleic acid specific RNA, and may bind to the CRISPR enzyme to direct the CRISPR enzyme to the target gene or nucleic acid.
  • the gRNA may comprise a plurality of domains. Each domain allows for intra- or inter-strand interaction of three-dimensional behavior or the active form of gRNA.
  • gRNAs include single-stranded gRNAs (single RNA molecules); Or double gRNA (comprising more than one typically two separate RNA molecules).
  • a single stranded gRNA comprises a guide domain in the 5 'to 3' direction, ie, a domain comprising a guide sequence capable of complementary binding to a target gene or nucleic acid; A first complementary domain; Connecting domains; A second complementary domain, a domain having a sequence complementary to the first complementary domain sequence and thus capable of forming a double stranded nucleic acid with the first complementary domain; Proximal domain; And optionally a tail domain.
  • the dual gRNA comprises a guide domain from the 5 'to 3' direction, ie a domain comprising a guide sequence capable of complementary binding to a target gene or nucleic acid, and a first complementary domain.
  • a first strand A first strand;
  • a second complementary domain a domain having a sequence complementary to the first complementary domain sequence and thus capable of forming a double stranded nucleic acid with the first complementary domain, a proximal domain; And optionally a second strand comprising a tail domain.
  • the first strand may be referred to as crRNA
  • the second strand may be referred to as tracrRNA.
  • the crRNA may comprise a guide domain and a first complementary domain
  • the tracrRNA may comprise a second complementary domain, a proximal domain and optionally a tail domain.
  • a single stranded gRNA comprises a guide domain in the 3 'to 5' direction, ie, a domain comprising a guide sequence capable of complementary binding to a target gene or nucleic acid; A first complementary domain; And a second complementary domain, a domain having a sequence complementary to the first complementary domain sequence, so as to form a double-stranded nucleic acid with the first complementary domain.
  • the first complementary domain may have homology with a naturally occurring first complementary domain, or may be derived from a naturally occurring first complementary domain.
  • the first complementary domain may have a difference in the nucleotide sequence of the first complementary domain according to a species present in nature, may be derived from a first complementary domain including a species present in nature, or It may have some or complete homology with the first complementary domain comprising the species present in nature.
  • the first complementary domain Streptococcus blood yoge Ness (Streptococcus pyogenes), Campylobacter Jeju Needle (Campylobacter jejuni), Streptococcus Thermo filler's (Streptococcus thermophilus), Staphylococcus aureus (Staphylococcus aureus ) or Neisseria meningitidis , or at least 50%, or complete homology with the first complementary domain or the derived first complementary domain.
  • the first complementary domain is a first complementary domain of Streptococcus pyogenes or a first complementary domain derived from Streptococcus pyogenes
  • the first complementary domain is 5′-GUUUUAGAGCUA-3 '(SEQ ID NO: 1) or a nucleotide sequence having at least 50% homology with at least 50% homology with 5'-GUUUUAGAGCUA-3' (SEQ ID NO: 1).
  • the first complementary domain may further include (X) n , that is, 5′-GUUUUAGAGCUA (X) n ⁇ 3 ′ (SEQ ID NO: 1).
  • the X may be selected from the group consisting of nucleotides A, T, U, and G, wherein n is the number of nucleotide sequences, and may be an integer of 5 to 15. In this case, (X) n may be as many as n integer repeats of the same nucleotide sequence, or may be an integer number of n nucleotide sequences in which nucleotides A, T, U and G are mixed.
  • the first complementary domain when the first complementary domain is a first complementary domain of campylobacter jejuni or a first complementary domain derived from campylobacter jejuni, the first complementary domain is 5′-GUUUUAGUCCCUUUUUAUAAUAUUUCUU -3 '(SEQ ID NO: 2) or 5'-GUUUUAGUCCCUU-3' (SEQ ID NO: 3), or 5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3 '(SEQ ID NO: 2) or 5'-GUUUUAGUCCCUU- Nucleotide sequence having at least 50% homology with 3 ′ (SEQ ID NO: 3).
  • the first complementary domain further comprises (X) n , ie, 5′-GUUUUAGUCCCUUUUUAAAUUUCUU (X) n ⁇ 3 ′ (SEQ ID NO: 2) or 5′-GUUUUAGUCCCUU (X) n ⁇ 3 ′ (SEQ ID NO: 3), you can.
  • the X may be selected from the group consisting of nucleotides A, T, U, and G, wherein n is the number of nucleotide sequences, and may be an integer of 5 to 15.
  • (X) n may be as many as n integer repeats of the same nucleotide sequence, or may be an integer number of n nucleotide sequences in which nucleotides A, T, U and G are mixed.
  • the first complementary domain is Parcubacteria bacterium (GWC2011_GWC2_44_17), Lachnospiraceae bacterium (MC2017), Butyrivibrio proteoclasii ( Boyrivibrio proteoclasii ) , Tampere Greenwich bacterium tumefaciens (Peregrinibacteria bacterium (GW2011_GWA_33_10)), liquid Let Mino Caucus Supervisors (Acidaminococcus sp.
  • BV3L6 Fort fatigue Monastir marker caviar (Porphyromonas macacae), racheu furnace Fira seae tumefaciens (Lachnospiraceae bacterium (ND2006) ), Porphyromonas crevioricanis , Prevotella disiens , Moraxella bovoculi (237), Smiihella sp.
  • the first complementary domain is a first complementary domain of a Falcobacteria bacterium or a first complementary domain from Falcubacteria bacterium
  • the first complementary domain is 5′-UUUGUAGAU-3 ′ ( SEQ ID NO: 4) or a nucleotide sequence having at least 50% homology with at least 50% homology with 5'-UUUGUAGAU-3 '(SEQ ID NO: 4).
  • the first complementary domain may further include (X) n , that is, 5 ′-(X) n UUUGUAGAU-3 ′ (SEQ ID NO: 4).
  • X may be selected from the group consisting of nucleotides A, T, U, and G, wherein n is the number of nucleotide sequences, and may be an integer of 1 to 5. In this case, (X) n may be as many as n integer repeats of the same nucleotide sequence, or may be an integer number of n nucleotide sequences in which nucleotides A, T, U and G are mixed.
  • the linking domain may be a nucleotide sequence that serves to connect the first and second complementary domains.
  • the linking domain may be covalently or non-covalently bonded to the first and second complementary domains, respectively.
  • the linking domain may connect the first and second complementary domains covalently or non-covalently.
  • the linking domain is suitable for use in single-stranded gRNA molecules and may be covalently or non-covalently linked to the first and second strands of a double gRNA, or covalently or non-covalently linked to the first and second strands.
  • Single stranded gRNAs can be used to generate.
  • the linking domain can be used to generate single-stranded gRNAs by covalently or non-covalently covalently or non-covalently with the crRNA and tracrRNA of the double gRNA, or by covalently or non-covalently connecting the crRNA and tracrRNA.
  • the second complementary domain may have homology with a naturally occurring second complementary domain or may be derived from a naturally occurring second complementary domain.
  • the second complementary domain may have a difference in the nucleotide sequence of the second complementary domain according to a species present in nature, may be derived from a second complementary domain including a species present in nature, or It may have some or complete homology with a second complementary domain comprising a species present in nature.
  • the second complementary domain s Streptococcus blood yoge Ness (Streptococcus pyogenes), Campylobacter Jeju Needle (Campylobacter jejuni), Streptococcus Thermo filler's (Streptococcus thermophilus), Staphylococcus aureus (Staphylococcus aureus ) or Neisseria meningitidis , or at least 50%, or complete homology with a second complementary domain or derived second complementary domain.
  • the second complementary domain is a second complementary domain of Streptococcus pyogenes or a second complementary domain derived from Streptococcus pyogenes
  • the second complementary domain is 5′- UAGC AAGU UAAAA.
  • U-3 ′ SEQ ID NO: 5
  • U-3 ′ SEQ ID NO: 5
  • a nucleotide sequence that has at least 50% homology with at least 50% Underlined is the nucleotide sequence forming a double strand with the first complementary domain).
  • the second complementary domain further comprises (X) n or / and (X) m , ie 5 ′-(X) n UAGC AAGU UAAAA U (X) m ⁇ 3 ′ (SEQ ID NO: 5), can.
  • X may be selected from the group consisting of nucleotides A, T, U and G, wherein n and m are the number of nucleotide sequences, n may be an integer of 1 to 15, and m may be 1 to 6 have.
  • (X) n may be as many as n integer repeats of the same nucleotide sequence, or may be an integer number of n nucleotide sequences in which nucleotides A, T, U and G are mixed.
  • (X) m may also be as many as m integer repeats of the same nucleotide sequence, or m integer nucleotide sequences in which nucleotides A, T, U and G are mixed.
  • the second complementary domain is a second complementary domain of Campylobacter jejuni or a second complementary domain derived from Campylobacter jejuni
  • the second complementary domain is 5′- AAGAAAUUUAAAAAGGGACUAAAA U-3 '(SEQ ID NO: 6) or 5'- AAGGGACUAAAA U-3' (SEQ ID NO: 7) or 5'- AAGAAAUUUAAAAAGGGACUAAAA U-3 '(SEQ ID NO: 6) or 5' - May be a nucleotide sequence having at least 50% homology with at least 50% homology with AAGGGACUAAAA U-3 '(SEQ ID NO: 7) (underlined is a nucleotide sequence that forms a double strand with the first complementary domain).
  • the second complementary domain further comprises (X) n or / and (X) m , ie 5 ′-(X) n AAGAAAUUUAAAAAGGGACUAAAA U (X) m ⁇ 3 ′ (SEQ ID NO: 6) Or 5 ′-(X) n AAGGGACUAAAA U (X) m ⁇ 3 ′ (SEQ ID NO: 7).
  • X may be selected from the group consisting of nucleotides A, T, U, and G, wherein n may be an integer of 1 to 15, and m may be 1 to 6.
  • (X) n may be as many as n integer repeats of the same nucleotide sequence, or may be an integer number of n nucleotide sequences in which nucleotides A, T, U and G are mixed.
  • (X) m may also be as many as m integer repeats of the same nucleotide sequence, or m integer nucleotide sequences in which nucleotides A, T, U and G are mixed.
  • the second complementary domain is Parcubacteria bacterium (GWC2011_GWC2_44_17), Lachnospiraceae bacterium (MC2017), Butyrivibrio proteoclasii ( Boyrivibrio proteoclasii ) , Tampere Greenwich bacterium tumefaciens (Peregrinibacteria bacterium (GW2011_GWA_33_10)), liquid Let Mino Caucus Supervisors (Acidaminococcus sp.
  • BV3L6 Fort fatigue Monastir marker caviar (Porphyromonas macacae), racheu furnace Fira seae tumefaciens (Lachnospiraceae bacterium (ND2006) ), Porphyromonas crevioricanis , Prevotella disiens , Moraxella bovoculi (237), Smiihella sp.
  • the second complementary domain is a second complementary domain of a Falcobacteria bacterium or a second complementary domain from Falcubacteria bacterium
  • the second complementary domain is 5′-AAAUU UCUAC U-3 '(SEQ ID NO: 8) or may be a nucleotide sequence having at least 50% or more homology with at least 50% homology with 5'-AAAUU UCUAC U-3' (SEQ ID NO: 8). 1 nucleotide sequence forming a double strand with the complementary domain).
  • the second complementary domain further comprises (X) n or / and (X) m , ie 5 ′-(X) n AAAUU UCUAC U (X) m ⁇ 3 ′ (SEQ ID NO: 8 ), can do.
  • X may be selected from the group consisting of nucleotides A, T, U, and G, wherein n and m are the number of nucleotide sequences, n may be an integer of 1 to 10, and m may be 1 to 6 have.
  • (X) n may be as many as n integer repeats of the same nucleotide sequence, or may be an integer number of n nucleotide sequences in which nucleotides A, T, U and G are mixed.
  • (X) m may also be as many as m integer repeats of the same nucleotide sequence, or m integer nucleotide sequences in which nucleotides A, T, U and G are mixed.
  • first complementary domain and the second complementary domain may be complementary to each other.
  • the first complementary domain and the second complementary domain may form a double strand through the complementary bond.
  • the formed double strand may interact with the CRISPR enzyme.
  • the first complementary domain may comprise additional nucleotide sequences that do not complementarily bind to the second complementary domain of the second strand.
  • the additional nucleotide sequence may be 1 to 15 nucleotide sequences.
  • the additional nucleotide sequence may be 1 to 5 nucleotide sequences, 5 to 10 nucleotide sequences, or 10 to 15 nucleotide sequences.
  • the proximal domain may be a domain located in the 3 'direction of the second complementary domain.
  • the proximal domain may have homology with a naturally occurring proximal domain or may be derived from a naturally occurring proximal domain.
  • the proximal domain may have a difference in the nucleotide sequence of the proximal domain according to a species present in nature, may be derived from a proximal domain including a species present in nature, or a proximal domain including a species present in nature It may have some or complete homology with.
  • the proximal domain is Streptococcus pyogenes , Campylobacter jejuni , Streptococcus thermophilus , Staphylococcus aureus or Staphylococcus aureus Have at least 50%, or complete homology with, the proximal domain or derived proximal domain of Neisseria meningitidis .
  • the proximal domain when the proximal domain is a proximal domain of Streptococcus pyogenes or a proximal domain derived from Streptococcus pyogenes, the proximal domain may be 5′-AAGGCUAGUCCG-3 ′ (SEQ ID NO: 9), Or a nucleotide sequence having at least 50% or more homology with 5′-AAGGCUAGUCCG-3 ′ (SEQ ID NO: 9). In this case, the proximal domain may further include (X) n , that is, 5′-AAGGCUAGUCCG (X) n ⁇ 3 ′ (SEQ ID NO: 9).
  • X may be selected from the group consisting of nucleotides A, T, U, and G, wherein n is the number of nucleotide sequences, and may be an integer of 1 to 15. In this case, (X) n may be as many as n integer repeats of the same nucleotide sequence, or may be an integer number of n nucleotide sequences in which nucleotides A, T, U and G are mixed.
  • the proximal domain when the proximal domain is the proximal domain of Campylobacter jejuni or the proximal domain derived from Campylobacter jejuni, the proximal domain may be 5'-AAAGAGUUUGC-3 '(SEQ ID NO: 10). Or a nucleotide sequence having at least 50% or more homology with 5′-AAAGAGUUUGC-3 ′ (SEQ ID NO: 10). In this case, the proximal domain may further include (X) n , that is, 5′-AAAGAGUUUGC (X) n ⁇ 3 ′ (SEQ ID NO: 10).
  • X may be selected from the group consisting of nucleotides A, T, U, and G, wherein n is the number of nucleotide sequences, and may be an integer of 1 to 40. In this case, (X) n may be as many as n integer repeats of the same nucleotide sequence, or may be an integer number of n nucleotide sequences in which nucleotides A, T, U and G are mixed.
  • the tail domain may be optionally added to the 3 'end of the first strand or the second strand of a single stranded or double gRNA.
  • the tail domain may have homology with the naturally occurring tail domain or may be derived from a naturally occurring tail domain.
  • the tail domain may have a difference in the nucleotide sequence of the tail domain according to the species present in nature, may be derived from the tail domain including the species present in nature, or the tail domain including the species present in nature It may have some or complete homology with.
  • the tail domain is Streptococcus pyogenes , Campylobacter jejuni , Streptococcus thermophilus , Staphylococcus aureus or Staphylococcus aureus It may have at least 50%, or complete homology, with some or at least 50% of the tail or derived tail domain of Neisseria meningitidis .
  • the tail domain when the tail domain is the tail domain of Streptococcus pyogenes or the Streptococcus pyogenes derived tail domain, the tail domain may be 5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3 '(SEQ ID NO: 11), Or a nucleotide sequence having at least 50% or more homology with 5′-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3 ′ (SEQ ID NO: 11). In this case, the tail domain may further include (X) n , that is, 5′-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC (X) n ⁇ 3 ′ (SEQ ID NO: 11).
  • X may be selected from the group consisting of nucleotides A, T, U, and G, wherein n is the number of nucleotide sequences, and may be an integer of 1 to 15. In this case, (X) n may be as many as n integer repeats of the same nucleotide sequence, or may be an integer number of n nucleotide sequences in which nucleotides A, T, U and G are mixed.
  • the tail domain may be 5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3 '(SEQ ID NO: 12) Or a nucleotide sequence having at least 50% homology with at least 50% homology with 5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3 '(SEQ ID NO: 12).
  • the tail domain may further include (X) n , that is, 5′-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU (X) n ⁇ 3 ′ (SEQ ID NO: 12).
  • X may be selected from the group consisting of nucleotides A, T, U, and G, wherein n is the number of nucleotide sequences, and may be an integer of 1 to 15.
  • (X) n may be as many as n integer repeats of the same nucleotide sequence, or may be an integer number of n nucleotide sequences in which nucleotides A, T, U and G are mixed.
  • the tail domain may comprise 1 to 10 nucleotide sequences at the 3 ′ end associated with in vitro or in vivo transcription methods.
  • the tail domain can be any nucleotide sequence present at the 3 'end of the DNA template.
  • the tail domain may be UUUUUU
  • the tail domain may be UUUU
  • the pol-III promoter may comprise several uracil nucleotides or alternatively nucleotides.
  • the gRNA may comprise a plurality of domains as described above, so that the length of the nucleic acid sequence can be adjusted according to the type and number of domains included in the gRNA, and each domain is used to determine the three-dimensional form or active form of the gRNA. Inter-strand interactions can occur.
  • gRNAs include single-stranded gRNAs (single RNA molecules); Or double gRNA (comprising more than one typically two separate RNA molecules).
  • Double gRNAs consist of a first strand and a second strand.
  • the first strand may be referred to as crRNA
  • the second strand may be referred to as tracrRNA.
  • first strand and the second strand may optionally include additional nucleotide sequences.
  • the first strand is
  • the N target is a nucleotide sequence complementary to some sequence of any one of the double strand of the target gene or nucleic acid
  • the N target is a nucleotide sequence site that can vary depending on the target sequence on the target gene or nucleic acid.
  • (Q) m is a nucleotide sequence comprising a first complementary domain, and comprises a nucleotide sequence capable of complementary binding to the second complementary domain of the second strand.
  • (Q) m may be a sequence having some or complete homology with the first complementary domain of a species present in nature, and the nucleotide sequence of the first complementary domain may be changed depending on the species derived.
  • Q may be independently selected from the group consisting of A, U, C, and G, wherein m is the number of nucleotide sequences, and may be an integer of 5 to 35.
  • (Q) m May be 5'-GUUUUAGAGCUA-3 '(SEQ ID NO: 1) or a nucleotide sequence having at least 50% homology with 5'-GUUUUAGAGCUA-3' (SEQ ID NO: 1).
  • (Q) m is 5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3 '(SEQ ID NO: 2) or 5'-GUUUUAGUCCCUU-3' (SEQ ID NO: 3), or 5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3 '(SEQ ID NO: 2) or 5 It may be a nucleotide sequence having at least 50% homology with '-GUUUUAGUCCCUU-3' (SEQ ID NO: 3).
  • (Q) m May be 5'-GUUUUAGAGCUGUGUUGUUUCG-3 '(SEQ ID NO: 13) or may be a nucleotide sequence having at least 50% homology with 5'-GUUUUAGAGCUGUGUUGUUUCG-3' (SEQ ID NO: 13).
  • (X) a , (X) b and (X) c is a nucleotide sequence that can be optionally added, wherein X may be independently selected from the group consisting of A, U, C and G, A, b and c are the number of nucleotide sequences, and may be 0 or an integer of 1 to 20.
  • the second strand is
  • the second strand is
  • (Z) h is a nucleotide sequence comprising a second complementary domain, and includes a nucleotide sequence capable of complementary binding to the first complementary domain of the first strand.
  • (Z) h may be a sequence having partial or complete homology with a second complementary domain of a species present in nature, and the nucleotide sequence of the second complementary domain may be changed according to the derived species.
  • Z may be independently selected from the group consisting of A, U, C, and G, and h may be an integer of 5 to 50 as the number of nucleotide sequences.
  • (Z) h May be 5'-UAGCAAGUUAAAAU-3 '(SEQ ID NO: 5) or a nucleotide sequence having at least 50% homology with 5'-UAGCAAGUUAAAAU-3' (SEQ ID NO: 5).
  • (Z) h is 5'-AAGAAAUUUAAAAAGGGACUAAAAU-3 '(SEQ ID NO: 6) or 5'-AAGGGACUAAAAU-3' (SEQ ID NO: 7), or 5'-AAGAAAUUUAAAAAGGGACUAAAAU-3 '(SEQ ID NO: 6) or 5 It may be a nucleotide sequence having at least 50% homology with '-AAGGGACUAAAAU-3' (SEQ ID NO: 7).
  • (Z) h May be 5'-CGAAACAACACAGCGAGUUAAAAU-3 '(SEQ ID NO: 14) or may be a nucleotide sequence having at least 50% homology with 5'-CGAAACAACACAGCGAGUUAAAAU-3' (SEQ ID NO: 14).
  • (P) k is a nucleotide sequence comprising a proximal domain, and may be a sequence having partial or complete homology with the proximal domain of a species in nature, and the nucleotide sequence of the proximal domain is changed according to the derived species.
  • P may be independently selected from the group consisting of A, U, C, and G, and k may be an integer of 1 to 20 as the number of nucleotide sequences.
  • (P) k is 5′-AAGGCUAGUCCG-3 ′ ( SEQ ID NO: 9) or a nucleotide sequence having at least 50% homology with 5'-AAGGCUAGUCCG-3 '(SEQ ID NO: 9).
  • (P) k is 5′-AAAGAGUUUGC-3 ′ (SEQ ID NO: 10) or a nucleotide sequence having at least 50% homology with 5'-AAAGAGUUUGC-3 '(SEQ ID NO: 10).
  • (P) k is 5′-AAGGCUUAGUCCG-3 ′ ( SEQ ID NO: 15) or a nucleotide sequence having at least 50% homology with 5'-AAGGCUUAGUCCG-3 '(SEQ ID NO: 15).
  • (F) i is a nucleotide sequence including a tail domain, and may be a sequence having partial or complete homology with a tail domain of a species present in nature, and the nucleotide sequence of the tail domain may be changed according to the derived species.
  • F may be independently selected from the group consisting of A, U, C, and G, wherein i is the number of nucleotide sequences, and may be an integer of 1 to 50.
  • (F) i is 5′-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3 ′ ( SEQ ID NO: 11) or a nucleotide sequence having at least 50% homology with 5′-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3 ′ (SEQ ID NO: 11).
  • (F) i is 5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3 '(SEQ) when the tail domain has some or complete homology with the tail domain of Campylobacter jejuni or the Campylobacter jejuni derived tail domain ID NO: 12) or a nucleotide sequence having at least 50% homology with 5′-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3 ′ (SEQ ID NO: 12).
  • tail domain has partial or complete homology with the tail domain of Streptococcus thermophilus or the Streptococcus thermophilus derived tail domain
  • (F) i is 5′-UACUCAACUUGAAAAGGUGGCACCGAUUCGGUGUUUUU-3 ′ ( SEQ ID NO: 16) or a nucleotide sequence having at least 50% homology with 5'-UACUCAACUUGAAAAGGUGGCACCGAUUCGGUGUUUUU-3 '(SEQ ID NO: 16).
  • (F) i may comprise 1 to 10 nucleotide sequences at the 3 'end associated with in vitro or in vivo transcription methods.
  • the tail domain can be any nucleotide sequence present at the 3 'end of the DNA template.
  • the tail domain may be UUUUUU
  • the tail domain may be UUUU
  • the pol-III promoter may comprise several uracil nucleotides or alternatively nucleotides.
  • the (X) d , (X) e and (X) f is a nucleotide sequence that can be optionally added, wherein X may be independently selected from the group consisting of A, U, C and G,
  • the d, e and f is the number of nucleotide sequences, may be 0 or an integer of 1 to 20.
  • the single stranded gRNA can be divided into a first single stranded gRNA and a second single stranded gRNA.
  • the first single stranded gRNA is a single stranded gRNA which connects the first and second strands of the double gRNA with a linking domain.
  • the single stranded gRNA is
  • the first single stranded gRNA may optionally comprise additional nucleotide sequences.
  • the first single-stranded gRNA is
  • the single-stranded gRNA is
  • the N target is a nucleotide sequence complementary to some sequence of any one of the double strand of the target gene or nucleic acid
  • the N target is a nucleotide sequence site that can vary depending on the target sequence on the target gene or nucleic acid.
  • (Q) m is a nucleotide sequence comprising a first complementary domain, and includes a nucleotide sequence capable of complementary binding to the second complementary domain.
  • (Q) m may be a sequence having some or complete homology with the first complementary domain of a species present in nature, and the nucleotide sequence of the first complementary domain may be changed depending on the species derived.
  • Q may be independently selected from the group consisting of A, U, C, and G, wherein m is the number of nucleotide sequences, and may be an integer of 5 to 35.
  • (Q) m May be 5'-GUUUUAGAGCUA-3 '(SEQ ID NO: 1) or a nucleotide sequence having at least 50% homology with 5'-GUUUUAGAGCUA-3' (SEQ ID NO: 1).
  • (Q) m is 5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3 '(SEQ ID NO: 2) or 5'-GUUUUAGUCCCUU-3' (SEQ ID NO: 3), or 5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3 '(SEQ ID NO: 2) or 5 It may be a nucleotide sequence having at least 50% homology with '-GUUUUAGUCCCUU-3' (SEQ ID NO: 3).
  • (Q) m May be 5'-GUUUUAGAGCUGUGUUGUUUCG-3 '(SEQ ID NO: 13) or may be a nucleotide sequence having at least 50% homology with 5'-GUUUUAGAGCUGUGUUGUUUCG-3' (SEQ ID NO: 13).
  • (L) j is a nucleotide sequence comprising a linking domain, is a nucleotide sequence that is capable of connecting a first complementary domain and a second complementary domain to generate a single stranded gRNA.
  • L may be independently selected from the group consisting of A, U, C and G, wherein j is the number of nucleotide sequences, it may be an integer of 1 to 30.
  • (Z) h is a nucleotide sequence including a second complementary domain, and includes a nucleotide sequence capable of complementary binding to the first complementary domain.
  • (Z) h may be a sequence having partial or complete homology with a second complementary domain of a species present in nature, and the nucleotide sequence of the second complementary domain may be changed according to the derived species.
  • Z may be independently selected from the group consisting of A, U, C, and G, and h may be an integer of 5 to 50 as the number of nucleotide sequences.
  • (Z) h May be 5'-UAGCAAGUUAAAAU-3 '(SEQ ID NO: 5) or a nucleotide sequence having at least 50% homology with 5'-UAGCAAGUUAAAAU-3' (SEQ ID NO: 5).
  • (Z) h is 5'-AAGAAAUUUAAAAAGGGACUAAAAU-3 '(SEQ ID NO: 6) or 5'-AAGGGACUAAAAU-3' (SEQ ID NO: 7), or 5'-AAGAAAUUUAAAAAGGGACUAAAAU-3 '(SEQ ID NO: 6) or 5 It may be a nucleotide sequence having at least 50% homology with '-AAGGGACUAAAAU-3' (SEQ ID NO: 7).
  • (Z) h May be 5'-CGAAACAACACAGCGAGUUAAAAU-3 '(SEQ ID NO: 14) or may be a nucleotide sequence having at least 50% homology with 5'-CGAAACAACACAGCGAGUUAAAAU-3' (SEQ ID NO: 14).
  • (P) k is a nucleotide sequence comprising a proximal domain, and may be a sequence having partial or complete homology with the proximal domain of a species in nature, and the nucleotide sequence of the proximal domain is changed according to the derived species.
  • P may be independently selected from the group consisting of A, U, C, and G, and k may be an integer of 1 to 20 as the number of nucleotide sequences.
  • (P) k is 5′-AAGGCUAGUCCG-3 ′ ( SEQ ID NO: 9) or a nucleotide sequence having at least 50% homology with 5'-AAGGCUAGUCCG-3 '(SEQ ID NO: 9).
  • (P) k is 5′-AAAGAGUUUGC-3 ′ (SEQ ID NO: 10) or a nucleotide sequence having at least 50% homology with 5'-AAAGAGUUUGC-3 '(SEQ ID NO: 10).
  • (P) k is 5′-AAGGCUUAGUCCG-3 ′ ( SEQ ID NO: 15) or a nucleotide sequence having at least 50% homology with 5'-AAGGCUUAGUCCG-3 '(SEQ ID NO: 15).
  • (F) i is a nucleotide sequence including a tail domain, and may be a sequence having partial or complete homology with a tail domain of a species present in nature, and the nucleotide sequence of the tail domain may be changed according to the derived species.
  • F may be independently selected from the group consisting of A, U, C, and G, wherein i is the number of nucleotide sequences, and may be an integer of 1 to 50.
  • (F) i is 5′-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3 ′ ( SEQ ID NO: 11) or a nucleotide sequence having at least 50% homology with 5′-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3 ′ (SEQ ID NO: 11).
  • (F) i is 5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3 '(SEQ) when the tail domain has some or complete homology with the tail domain of Campylobacter jejuni or the Campylobacter jejuni derived tail domain ID NO: 12) or a nucleotide sequence having at least 50% homology with 5′-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3 ′ (SEQ ID NO: 12).
  • tail domain has partial or complete homology with the tail domain of Streptococcus thermophilus or the Streptococcus thermophilus derived tail domain
  • (F) i is 5′-UACUCAACUUGAAAAGGUGGCACCGAUUCGGUGUUUUU-3 ′ ( SEQ ID NO: 16) or a nucleotide sequence having at least 50% homology with 5'-UACUCAACUUGAAAAGGUGGCACCGAUUCGGUGUUUUU-3 '(SEQ ID NO: 16).
  • (F) i may comprise 1 to 10 nucleotide sequences at the 3 'end associated with in vitro or in vivo transcription methods.
  • the tail domain can be any nucleotide sequence present at the 3 'end of the DNA template.
  • the tail domain may be UUUUUU
  • the tail domain may be UUUU
  • the pol-III promoter may comprise several uracil nucleotides or alternatively nucleotides.
  • (X) a , (X) b , (X) c , (X) d , (X) e and (X) f are nucleotide sequences that can be optionally added, wherein X is A, U, It may be independently selected from the group consisting of C and G, wherein a, b, c, d, e and f is the number of nucleotide sequences, it may be an integer of 0 or 1 to 20.
  • the second single stranded gRNA may be a single stranded gRNA consisting of a guide domain, a first complementary domain and a second complementary domain.
  • the second single-stranded gRNA is
  • the second single stranded gRNA may optionally comprise additional nucleotide sequences.
  • the second single-stranded gRNA is
  • the single-stranded gRNA is
  • the N target is a nucleotide sequence complementary to some sequence of any one of the double strand of the target gene or nucleic acid
  • the N target is a nucleotide sequence site that can vary depending on the target sequence on the target gene or nucleic acid.
  • (Q) m is a nucleotide sequence comprising a first complementary domain, and includes a nucleotide sequence capable of complementary binding to the second complementary domain.
  • (Q) m may be a sequence having part or complete homology with the first complementary domain of a species present in nature, and the nucleotide sequence of the first complementary domain may be changed according to the derived species.
  • Q may be independently selected from the group consisting of A, U, C, and G, wherein m is the number of nucleotide sequences, and may be an integer of 5 to 35.
  • (Q) m is 5 It may be '-UUUGUAGAU-3' (SEQ ID NO: 4) or may be a nucleotide sequence having at least 50% or more homology with 5'-UUUGUAGAU-3 '(SEQ ID NO: 4).
  • (Z) h is a nucleotide sequence including a second complementary domain, and includes a nucleotide sequence capable of complementary binding to the first complementary domain.
  • (Z) h may be a sequence having partial or complete homology with a second complementary domain of a species present in nature, and the nucleotide sequence of the second complementary domain may be changed according to the derived species.
  • Z may be independently selected from the group consisting of A, U, C, and G, and h may be an integer of 5 to 50 as the number of nucleotide sequences.
  • (Z) h is 5 It may be '-AAAUUUCUACU-3' (SEQ ID NO: 8) or may be a nucleotide sequence having at least 50% homology with 5'-AAAUUUCUACU-3 '(SEQ ID NO: 8).
  • (L) j is a nucleotide sequence including a linking domain, and is a nucleotide sequence connecting the first and second complementary domains.
  • L may be independently selected from the group consisting of A, U, C and G, wherein j is the number of nucleotide sequences, it may be an integer of 1 to 30.
  • (X) a , (X) b and (X) c is a nucleotide sequence that can be optionally added, wherein X may be independently selected from the group consisting of A, U, C and G, A, b and c are the number of nucleotide sequences, and may be 0 or an integer of 1 to 20.
  • the guide nucleic acid may be a gRNA that complementarily binds to a target sequence of an immune participating gene.
  • immune participation gene means any gene that directly participates in or indirectly affects immune function regulation.
  • the immune participating gene may regulate innate immunity.
  • the immune participating gene may regulate acquired immunity.
  • the immune participating gene can regulate the function of phagocytes.
  • the immune participating gene may promote or increase the expression of cytokines.
  • the immune participating gene may inhibit or inhibit the expression of cytokines.
  • the immune participating gene may promote or increase the expression of proinflammatory cytokine.
  • the immune participating gene may inhibit or inhibit the expression of proinflammatory cytokine.
  • the immune participating gene may promote or increase the expression of inflammatory cytokine.
  • the immune participating gene may inhibit or inhibit the expression of inflammatory cytokine.
  • the immune participating genes can promote or increase the interaction between intracellular and / or extracellular Toll / interleukin-1 receptor (TIR) domains.
  • TIR Toll / interleukin-1 receptor
  • the immune participating gene can inhibit or inhibit the interaction between intracellular and / or extracellular Toll / interleukin-1 receptor (TIR) domains.
  • TIR Toll / interleukin-1 receptor
  • the immune participating gene can interact with the Toll / interleukin-1 receptor (TIR) domain.
  • TIR Toll / interleukin-1 receptor
  • the immune participating gene may be a polypeptide or protein including a Toll / interleukin-1 receptor (TIR) domain or a gene encoding the same.
  • TIR Toll / interleukin-1 receptor
  • the immune participating gene may promote or increase intracellular signaling mediated by Toll receptor or Toll like receptor.
  • the immune participating gene may inhibit or inhibit intracellular signaling mediated by Toll receptor or Toll like receptor.
  • the immune participating gene may interact with Toll receptor or Toll like receptor.
  • the immune participating gene may promote or increase intracellular signaling mediated by interleukin-1 receptor.
  • the immune participating gene may inhibit or inhibit intracellular signaling mediated by interleukin-1 receptor.
  • the immune participating gene may interact with the interleukin-1 receptor.
  • the immune participating gene can promote or increase the interaction between the intra and / or extra Death domains.
  • the immune participating genes may inhibit or inhibit interactions between intracellular and / or extracellular Death domains.
  • the immune participating gene can interact with the Death domain.
  • the immune participating gene may be a polypeptide or protein including a death domain or a gene encoding the same.
  • the immune participating gene may promote or increase intracellular signaling mediated by one or more of the interleukin-1 receptor-associated kinase (IRAK) family.
  • IRAK interleukin-1 receptor-associated kinase
  • the immune participating gene may inhibit or inhibit intracellular signaling mediated by one or more of the interleukin-1 receptor-associated kinase (IRAK) family.
  • IRAK interleukin-1 receptor-associated kinase
  • the immune participating gene may interact with one or more of the interleukin-1 receptor-associated kinase (IRAK) family.
  • IRAK interleukin-1 receptor-associated kinase
  • the interleukin-1 receptor-associated kinase (IRAK) family is composed of IRAK1, IRAK2, IRAK3, and IRAK4.
  • the immune participating gene can regulate the Complement system.
  • the immune participating gene can regulate the classical pathway in the complement system.
  • the immune participating gene may regulate the lectin pathway in the complement system.
  • the immune participating gene may regulate an alternative pathway in the complement system.
  • the immune participating gene can modulate a Complement system mediated inflammatory response.
  • the immune participating gene can regulate Complement system mediated cell lysis.
  • the immune participating gene may regulate Complement system mediated opsonization.
  • the immune participating gene may promote or increase the interaction between complement components that control the complement system.
  • the immune participating gene may inhibit or inhibit the interaction between complement components that control the complement system.
  • the immune participating gene can regulate the function of antibody production.
  • the immune participating genes disclosed herein may be genes encoding polypeptides or proteins comprising a Death domain and / or a Toll / interleukin-1 receptor (TIR) domain.
  • TIR Toll / interleukin-1 receptor
  • the death domain is one of the protein motifs found mainly in proteins that control apoptosis and inflammation.
  • the proteins that include the death domain include the TNF receptor, ankyrin, MyD88, and the IRAK family.
  • TIR domain is an intracellular signaling domain, mainly found in MyD88, interleukin-1 receptor, Toll receptor, Toll like receptor and plant R proteins, and the protein containing TIR domain includes IL18R1, IL18RAP, IL1R1, IL1RAP, IL1RAPL1, IL1RAPL2, IL1RL1, IL1RL2, MYD88, SIGIRR, TLR1, TLR10, TLR2, TLR3, TLR4, TLR5, TLR6, TLR7, TLR8, TLR9 and the like.
  • the immune participating gene may be MYD88 gene.
  • MYD88 Myeloid differentiation primary response 88 gene consists of 296 amino acids and has a Death domain and a Toll / interleukin-1 receptor (TIR) domain, a gene encoding a protein (also called full length DNA, cDNA or mRNA), also called MYD88D. Means.
  • the MYD88 gene may be, but is not limited to, one or more selected from the group consisting of: genes encoding human MYD88 (eg, NCBI Accession No. NP_001166037, NP_001166038, NP_001166039, NP_001166040, NP_002459, etc.) , NCBI Accession No. MYD88 gene represented by NM_001172566, NM_001172567, NM_001172568, NM_001172569, NM_002468 and the like.
  • the immune participating factor may be derived from a mammal including humans, primates such as monkeys, rodents such as rats, mice, and the like.
  • Gene information can be obtained from known databases such as GenBank of the National Center for Biotechnology Information (NCBI).
  • the immune participating gene disclosed herein may be a gene encoding a Complement component protein.
  • Complement component is a protein that controls the complement system, C1, C2, C3, C4, C5, C6, C7, C8, C9 and the like.
  • the immune participating gene may be a C3 gene.
  • Complement component 3 (C3) gene is a 1663 amino acid protein that encodes a protein (full length DNA, cDNA, or mRNA), also called complement C3, C3a, C3b, ASP, AHUS5, ARMD9, CPAMD1, or HEL-S-62p. ).
  • the C3 gene may be one or more selected from the group consisting of, but is not limited to: a gene encoding human C3 (e.g., NCBI Accession No. NP_000055, etc.), such as NCBI Accession No. C3 gene represented by NM_000064 and the like.
  • the immune participating factor may be derived from a mammal including humans, primates such as monkeys, rodents such as rats, mice, and the like.
  • Gene information can be obtained from known databases such as GenBank of the National Center for Biotechnology Information (NCBI).
  • the immune participating genes disclosed herein may be a gene encoding a polypeptide or protein comprising a Death domain and / or a Toll / interleukin-1 receptor (TIR) domain and / or a gene encoding a Complement component protein. .
  • TIR Toll / interleukin-1 receptor
  • the immune participating gene may be a MYD88 gene and / or a C3 gene.
  • the guide nucleic acid may be a gRNA that binds complementarily to the target sequence of the MYD88 gene.
  • the guide nucleic acid may be a gRNA that complementarily binds to the target sequence of the C3 gene.
  • Target sequence is a nucleotide sequence present in a target gene or nucleic acid, specifically a nucleotide sequence of a target region within a target gene or nucleic acid, wherein the “target region” is guided by a guide nucleic acid-editor protein in the target gene or nucleic acid. It is a site that can be modified.
  • the target gene disclosed by the present specification may be an immune participating gene.
  • Target genes disclosed herein may be MYD88 gene and / or C3 gene.
  • the target sequence may be used as a term meaning both kinds of nucleotide sequence information.
  • the target sequence may mean sequence information of the transcribed strand of the target gene DNA, or may mean nucleotide sequence information of the non-transcribed strand.
  • the target sequence may mean 5'-ATCATTGGCAGACTAGTTCG-3 '(SEQ ID NO: 17), which is a nucleotide sequence of some of the target regions of target gene A, and a nucleotide sequence that is complementary thereto (non- transcribed strand) 5'-CGAACTAGTCTGCCAATGAT-3 '(SEQ ID NO: 18).
  • the target sequence may be between 5 and 50 nucleotide sequences.
  • the target sequence comprises 16 nucleotide sequences, 17 nucleotide sequences, 18 nucleotide sequences, 19 nucleotide sequences, 20 nucleotide sequences, 21 nucleotide sequences, 22 nucleotide sequences, 23 nucleotide sequences, 24 nucleotide sequences It may be a nucleotide sequence or 25 nucleotide sequences.
  • the target sequence includes a guide nucleic acid binding sequence or a guide nucleic acid non-binding sequence.
  • the “guide nucleic acid binding sequence” is a nucleotide sequence having complementarity with the guide sequence included in the guide domain of the guide nucleic acid, and may bind complementarily with the guide sequence included in the guide domain of the guide nucleic acid.
  • the target sequence and guide nucleic acid binding sequence are nucleotide sequences that may vary depending on the target gene or nucleic acid, ie, the subject to be genetically engineered or corrected, and can be variously designed according to the target gene or nucleic acid.
  • the "guide nucleic acid non-binding sequence” is a nucleotide sequence having homology with the guide sequence included in the guide domain of the guide nucleic acid, and cannot bind complementarily with the guide sequence included in the guide domain of the guide nucleic acid.
  • the guide nucleic acid non-binding sequence is a nucleotide sequence having complementarity with the guide nucleic acid binding sequence, and can be complementary to the guide nucleic acid binding sequence.
  • the guide nucleic acid binding sequence may be a nucleotide sequence of some of the target sequences, and a nucleotide sequence having two different sequence sequences of the target sequence, that is, one nucleotide sequence of two nucleotide sequences capable of complementary binding to each other.
  • the guide nucleic acid non-binding sequence may be a nucleotide sequence other than the guide nucleic acid binding sequence of the target sequence.
  • nucleotide sequences 5'-ATCATTGGCAGACTAGTTCG-3 '(SEQ ID NO: 17) of the target region of target gene A and its complementary nucleotide sequence 5'-CGAACTAGTCTGCCAATGAT-3' (SEQ ID NO: 18) are one of two target sequences: 5'-ATCATTGGCAGACTAGTTCG-3 '(SEQ ID NO: 17) or 5'-CGAACTAGTCTGCCAATGAT-3' (SEQ ID NO: 18) Can be.
  • the guide nucleic acid non-binding sequence may be 5'-CGAACTAGTCTGCCAATGAT-3 '(SEQ ID NO: 18) when the guide nucleic acid binding sequence is 5'-ATCATTGGCAGACTAGTTCG-3' (SEQ ID NO: 17), or
  • the guide nucleic acid unbinding sequence may be 5'-ATCATTGGCAGACTAGTTCG-3' (SEQ ID NO: 17).
  • the guide nucleic acid binding sequence may be a nucleotide sequence selected from a target sequence, ie, a nucleotide sequence identical to a transcribed strand and a nucleotide sequence identical to a non-transcribed strand.
  • the guide nucleic acid non-binding sequence may be a nucleotide sequence other than the guide nucleic acid binding sequence of the target sequence, ie, a nucleotide sequence selected from a nucleotide sequence identical to a transcribed strand and a nucleotide sequence identical to a non-transcribed strand.
  • the guide nucleic acid binding sequence may be the same length as the target sequence.
  • the guide nucleic acid unbinding sequence may be the same length as the target sequence or guide nucleic acid binding sequence.
  • the guide nucleic acid binding sequence may be 5 to 50 nucleotide sequences.
  • the guide nucleic acid binding sequence is 16 nucleotide sequence, 17 nucleotide sequence, 18 nucleotide sequence, 19 nucleotide sequence, 20 nucleotide sequence, 21 nucleotide sequence, 22 nucleotide sequence, 23 nucleotide sequence, It may be 24 nucleotide sequences or 25 nucleotide sequences.
  • the guide nucleic acid non-binding sequence may be 5 to 50 nucleotide sequences.
  • the guide nucleic acid non-binding sequence comprises 16 nucleotide sequences, 17 nucleotide sequences, 18 nucleotide sequences, 19 nucleotide sequences, 20 nucleotide sequences, 21 nucleotide sequences, 22 nucleotide sequences, 23 nucleotide sequences , 24 nucleotide sequences or 25 nucleotide sequences.
  • the guide nucleic acid binding sequence may bind complementary to the guide sequence included in the guide domain of the guide nucleic acid, and the length of the guide nucleic acid binding sequence may be the same as that of the guide sequence.
  • the guide nucleic acid binding sequence may be a nucleotide sequence complementary to the guide sequence included in the guide domain of the guide nucleic acid, for example at least 70%, 75%, 80%, 85%, 90% or 95% or more complementary Or a nucleotide sequence that is completely complementary.
  • the guide nucleic acid binding sequence may have or include 1 to 8 nucleotide sequences that are not complementary to the guide sequence included in the guide domain of the guide nucleic acid.
  • the guide nucleic acid non-binding sequence may have homology with the guide sequence included in the guide domain of the guide nucleic acid, and the length of the guide nucleic acid non-binding sequence may be the same as that of the guide sequence.
  • the guide nucleic acid non-binding sequence may be a nucleotide sequence homologous to the guide sequence included in the guide domain of the guide nucleic acid, for example, at least 70%, 75%, 80%, 85%, 90% or 95% or more. It may be a homologous or completely homologous nucleotide sequence.
  • the guide nucleic acid non-binding sequence may have or include 1 to 8 nucleotide sequences that are not homologous to the guide sequence included in the guide domain of the guide nucleic acid.
  • the guide nucleic acid non-binding sequence may be complementary to the guide nucleic acid binding sequence, and the guide nucleic acid non-binding sequence may be the same as the length of the guide nucleic acid binding sequence.
  • the guide nucleic acid non-binding sequence may be a nucleotide sequence complementary to the guide nucleic acid binding sequence, for example at least 70%, 75%, 80%, 85%, 90% or 95% or more complementary or completely complementary It may be a nucleotide sequence.
  • the guide nucleic acid non-binding sequence may have or include 1 to 8 nucleotide sequences that are not complementary to the guide nucleic acid binding sequence.
  • the guide nucleic acid binding sequence may be a nucleotide sequence located close to the nucleotide sequence that the editor protein can recognize.
  • the guide nucleic acid binding sequence may be a contiguous 5 to 50 nucleotide sequence located adjacent to the 5 'end or / and 3' end of the nucleotide sequence that the editor protein can recognize.
  • the guide nucleic acid non-binding sequence may be a nucleotide sequence close to the nucleotide sequence that the editor protein can recognize.
  • the guide nucleic acid non-binding sequence may be a contiguous 5 to 50 nucleotide sequence located adjacent to the 5 'end and / or 3' end of the nucleotide sequence that the editor protein can recognize.
  • the target sequence disclosed herein may be consecutive 10 to 35 nucleotide sequences located in the promoter region of an immune participating gene.
  • the target sequence may be 10 to 35 nucleotide sequences, 15 to 35 nucleotide sequences, 20 to 35 nucleotide sequences, 25 to 35 nucleotide sequences or 30 to 35 nucleotide sequences.
  • the target sequence may be 10 to 15 nucleotide sequences, 15 to 20 nucleotide sequences, 20 to 25 nucleotide sequences, 25 to 30 nucleotide sequences, or 30 to 35 nucleotide sequences.
  • the target sequence may be a contiguous 10 to 25 nucleotide sequences located in the promoter region of the MYD88 gene.
  • the target sequence may be a contiguous 10 to 25 nucleotide sequence located in the promoter region of the C3 gene.
  • the target sequence disclosed herein may be consecutive 10 to 35 nucleotide sequences located in the intron region of an immune participating gene.
  • the target sequence may be 10 to 35 nucleotide sequences, 15 to 35 nucleotide sequences, 20 to 35 nucleotide sequences, 25 to 35 nucleotide sequences or 30 to 35 nucleotide sequences.
  • the target sequence may be 10 to 15 nucleotide sequences, 15 to 20 nucleotide sequences, 20 to 25 nucleotide sequences, 25 to 30 nucleotide sequences, or 30 to 35 nucleotide sequences.
  • the target sequence may be a contiguous 10 to 25 nucleotide sequences located in the intron region of the MYD88 gene.
  • the target sequence may be a contiguous 10-25 nucleotide sequence located in the intron region of the C3 gene.
  • the target sequence disclosed herein may be consecutive 10 to 35 nucleotide sequences located in the exon region of an immune participating gene.
  • the target sequence may be 10 to 35 nucleotide sequences, 15 to 35 nucleotide sequences, 20 to 35 nucleotide sequences, 25 to 35 nucleotide sequences or 30 to 35 nucleotide sequences.
  • the target sequence may be 10 to 15 nucleotide sequences, 15 to 20 nucleotide sequences, 20 to 25 nucleotide sequences, 25 to 30 nucleotide sequences, or 30 to 35 nucleotide sequences.
  • the target sequence may be a contiguous 10 to 25 nucleotide sequences located in the exon region of the MYD88 gene.
  • the target sequence may be a contiguous 10-25 nucleotide sequence located in the exon region of the C3 gene.
  • the target sequence disclosed herein may be consecutive 10 to 35 nucleotide sequences located in an enhancer region of an immune participating gene.
  • the target sequence may be 10 to 35 nucleotide sequences, 15 to 35 nucleotide sequences, 20 to 35 nucleotide sequences, 25 to 35 nucleotide sequences or 30 to 35 nucleotide sequences.
  • the target sequence may be 10 to 15 nucleotide sequences, 15 to 20 nucleotide sequences, 20 to 25 nucleotide sequences, 25 to 30 nucleotide sequences, or 30 to 35 nucleotide sequences.
  • the target sequence may be a contiguous 10 to 25 nucleotide sequences located in the enhancer region of the MYD88 gene.
  • the target sequence may be a contiguous 10 to 25 nucleotide sequence located in the enhancer region of the C3 gene.
  • the target sequence disclosed herein may be a contiguous 10 to 35 nucleotide sequence located of the coding, non-coding or mixed portion thereof of an immune participating gene.
  • the target sequence may be 10 to 35 nucleotide sequences, 15 to 35 nucleotide sequences, 20 to 35 nucleotide sequences, 25 to 35 nucleotide sequences or 30 to 35 nucleotide sequences.
  • the target sequence may be 10 to 15 nucleotide sequences, 15 to 20 nucleotide sequences, 20 to 25 nucleotide sequences, 25 to 30 nucleotide sequences, or 30 to 35 nucleotide sequences.
  • the target sequence may be a contiguous 10 to 25 nucleotide sequence located of the coding, non-coding or mixing portion thereof of the MYD88 gene.
  • the target sequence may be a contiguous 10-25 nucleotide sequence located of the coding, non-coding or mixing portion thereof of the C3 gene.
  • the target sequence disclosed herein may be a contiguous 10 to 35 nucleotide sequence located of a promoter, enhancer, 3'UTR, polyadenyl (polyA) or mixed portion thereof of an immune participating gene.
  • the target sequence may be 10 to 35 nucleotide sequences, 15 to 35 nucleotide sequences, 20 to 35 nucleotide sequences, 25 to 35 nucleotide sequences or 30 to 35 nucleotide sequences.
  • the target sequence may be 10 to 15 nucleotide sequences, 15 to 20 nucleotide sequences, 20 to 25 nucleotide sequences, 25 to 30 nucleotide sequences, or 30 to 35 nucleotide sequences.
  • the target sequence may be a contiguous 10 to 25 nucleotide sequence located of a promoter, enhancer, 3'UTR, polyadenyl (polyA) or a mixed portion thereof of the MYD88 gene.
  • the target sequence may be a contiguous 10-25 nucleotide sequence located of a promoter, enhancer, 3'UTR, polyadenyl (polyA) or a mixture portion thereof of the C3 gene.
  • the target sequence disclosed herein may be a contiguous 10 to 35 nucleotide sequence located of an exon, intron, or mixed portion thereof of an immune participating gene.
  • the target sequence may be 10 to 35 nucleotide sequences, 15 to 35 nucleotide sequences, 20 to 35 nucleotide sequences, 25 to 35 nucleotide sequences or 30 to 35 nucleotide sequences.
  • the target sequence may be 10 to 15 nucleotide sequences, 15 to 20 nucleotide sequences, 20 to 25 nucleotide sequences, 25 to 30 nucleotide sequences, or 30 to 35 nucleotide sequences.
  • the target sequence may be a contiguous 10-25 nucleotide sequence located of an exon, intron, or mixture portion thereof of the MYD88 gene.
  • the target sequence may be a contiguous 10-25 nucleotide sequence located of an exon, intron, or mixture portion thereof of the C3 gene.
  • the target sequence disclosed herein may be a contiguous 10 to 35 nucleotide sequence comprising or in close proximity to a mutant portion of an immune participating gene (eg, a portion other than a wild type gene).
  • the target sequence may be 10 to 35 nucleotide sequences, 15 to 35 nucleotide sequences, 20 to 35 nucleotide sequences, 25 to 35 nucleotide sequences or 30 to 35 nucleotide sequences.
  • the target sequence may be 10 to 15 nucleotide sequences, 15 to 20 nucleotide sequences, 20 to 25 nucleotide sequences, 25 to 30 nucleotide sequences, or 30 to 35 nucleotide sequences.
  • the target sequence may be a contiguous 10-25 nucleotide sequence comprising or in close proximity to a mutant portion of the MYD88 gene (eg, a portion different from the wild-type gene).
  • the target sequence may be a contiguous 10-25 nucleotide sequence comprising or in close proximity to a mutant portion of the C3 gene (eg, a portion different from the wild-type gene).
  • the target sequence disclosed by the present specification may be a continuous 10 to 35 nucleotide sequences adjacent to the 5 'end and / or 3' end of the proto-spacer-adjacent Motif (PAM) sequence in the nucleic acid sequence of the immune participating gene.
  • PAM proto-spacer-adjacent Motif
  • the "proto-spacer-adjacent Motif (PAM) sequence” is a nucleotide sequence that the editor protein can recognize. At this time, the PAM sequence may be different in nucleotide sequence according to the type of the editor protein and the species derived.
  • the PAM sequence may be, for example, one or more of the following sequences (described in the 5 'to 3' direction).
  • N is A, T, C or G
  • N is each independently A, T, C or G, R is A or G and Y is C or T);
  • NNAGAAW N is each independently A, T, C or G, and W is A or T;
  • N are each independently A, T, C, or G;
  • NNGRR (T), wherein each N is independently A, T, C or G, and R is A or G;
  • TTN (N is A, T, C or G).
  • the target sequence may be 10 to 35 nucleotide sequences, 15 to 35 nucleotide sequences, 20 to 35 nucleotide sequences, 25 to 35 nucleotide sequences or 30 to 35 nucleotide sequences.
  • the target sequence may be 10 to 15 nucleotide sequences, 15 to 20 nucleotide sequences, 20 to 25 nucleotide sequences, 25 to 30 nucleotide sequences, or 30 to 35 nucleotide sequences.
  • the target sequence may be 10 to 25 nucleotide sequences consecutively adjacent to the 5 'end and / or 3' end of the PAM sequence in the nucleic acid sequence of the MYD88 gene.
  • T, G or C; or A, U, G or C) may be consecutive 10 to 25 nucleotide sequences located adjacent to the 5 'end or / and 3' end of the sequence.
  • the target sequence is a gene of MYD88 gene.
  • the target sequence may be consecutive 10 to 25 nucleotide sequences adjacent to the 5 'end and / or 3' end of the PAM sequence in the nucleic acid sequence of the C3 gene.
  • T, G or C; or A, U, G or C) may be consecutive 10 to 25 nucleotide sequences located adjacent to the 5 'end or / and 3' end of the sequence.
  • the target sequence is a C3 gene.
  • target sequences that can be used in one embodiment of the present invention are shown in a table, and the target sequences described in the table are guide nucleic acid non-binding sequences, and sequences complementary through the described sequences, that is, guide nucleic acid binding sequences are Can be predicted:
  • Target sequences of MYD88 gene for CjCas9 Loci (Exon) Target (w / o PAM) (SEQ ID NO) PAM E01 GTTCAAGAACAGAGACAGGCGG (SEQ ID NO: 19) CGCCGCAC E01 GCCTGTCTCTGTTCTTGAACGT (SEQ ID NO: 20) GCGGACAC E01 GGTCCAGTCGGCCGCCACCTGT (SEQ ID NO: 21) GTCCGCAC E01 GCGCTGGCGGAGGAGATGGACT (SEQ ID NO: 22) TTGAGTAC E01 TGTGTCTCCAGTTGCCGGATCT (SEQ ID NO: 23) CCAAGTAC E01 AGTACTTGGAGATCCGGCAACT (SEQ ID NO: 24) GGAGACAC E01 ACCAATGCTGGGTCCCAGCTCC (SEQ ID NO: 25) AGCAGCAC E02 GCCTCCTCCTGCTGCTGCTTCA (SEQ ID NO: 26) AGATATAC E02
  • Target sequences of C3 gene for CjCas9 Loci (Exon) Target (w / o PAM) (SEQ ID NO) PAM E02 CGCAAGATGTTGGGGGTGATGA (SEQ ID NO: 42) TAGAGTAC E02 ATCCCCTTGCGCGTCGTGGGCC (SEQ ID NO: 43) TCCAGCAC E02 GGTCAGCACAGTCTTCTCACTG (SEQ ID NO: 44) GACAGCAC E02 GCCCATGTGGTTGGTGGCAGGG (SEQ ID NO: 45) GTCAGCAC E03 CACCACTTGGGTCCCGAAGGTG (SEQ ID NO: 46) GCCTGCAC E03 GAGGTACCCGCTCTGCAGGCTG (SEQ ID NO: 47) ACCAGCAC E03 GTGGTGCTGGTCAGCCTGCAGA (SEQ ID NO: 48) GCGGGTAC E03 ATGGTCTTGTCTGTCTGGATGA (SEQ ID NO: 49) AGAGGTAC E03 CTTCATCCAGACAG
  • Target sequences of MYD88 gene for SpCas9 Loci (Exon) Target (w / o PAM) (SEQ ID NO) PAM E01 TCCTGGAGCCTCAGCGCGGT (SEQ ID NO: 151) CGG E01 GGCTCCAGGACCGCCCGCCA (SEQ ID NO: 152) TGG E01 GCAGCCATGGCGGGCGGTCC (SEQ ID NO: 153) TGG E01 GGACCGCCCGCCATGGCTGC (SEQ ID NO: 154) AGG E01 GTTCTTGAACGTGCGGACAC (SEQ ID NO: 155) AGG E01 GGCGGCCGACTGGACCGCGC (SEQ ID NO: 156) TGG E01 CTCCGCCAGCGCGGTCCAGT (SEQ ID NO: 157) CGG E01 GTCCATCTCCTCCGCCAGCG (SEQ ID NO: 158) CGG E01 GGCCGACTGGACCGCGCTGG (SEQ ID NO: 159) CGG E01 CGACTGGACCGCGCTGGCGG (SEQ
  • Target sequences of C3 gene for SpCas9 Loci (Exon) Target (w / o PAM) (SEQ ID NO) PAM E01 GCTACTAACCCACCTCCCCC (SEQ ID NO: 190) TGG E02 CACCCCCAACATCTTGCGGC (SEQ ID NO: 191) TGG E02 CTCCAGCCGCAAGATGTTGG (SEQ ID NO: 192) GGG E02 GAGCGAGGAGACCATGGTGC (SEQ ID NO: 193) TGG E02 CTGGAGGCCCACGACGCGCA (SEQ ID NO: 194) AGG E02 TGGAGGCCCACGACGCGCAA (SEQ ID NO: 195) GGG E02 GGAGGCCCACGACGCGCAAG (SEQ ID NO: 196) GGG E02 AACATCCCCTTGCGCGTCGT (SEQ ID NO: 197) GGG E02 GAACATCCCCTTGCGCGTCG (SEQ ID NO: 198) TGG E02 GTTTTTTGCCTGGGAAGTCG (S
  • the guide nucleic acid may be a gRNA comprising a guide sequence that complementarily binds to a target sequence of the MYD88 gene.
  • the guide nucleic acid may be a gRNA comprising a guide sequence that complementarily binds to a target sequence of the C3 gene.
  • a “guide sequence” is a nucleotide sequence that is complementary to some sequence of either of the double strands of a target gene or nucleic acid, wherein the guide sequence is at least 50%, 55%, 60%, 65%, 70%, 75%, Nucleotide sequence having at least 80%, 85%, 90% or 95% complementarity or complete complementarity.
  • the guide sequence may be 10 to 25 nucleotide sequences.
  • the guide sequence may be 10 to 25 nucleotide sequences, 15 to 25 nucleotide sequences, or 20 to 25 nucleotide sequences.
  • the guide sequence may be 10 to 15 nucleotide sequences, 15 to 20 nucleotide sequences, or 20 to 25 nucleotide sequences.
  • the target gene disclosed by the present specification may be an immune participating gene.
  • Target genes disclosed herein may be MYD88 gene and / or C3 gene.
  • the guide sequence can form a complementary bond with the target sequence.
  • the target sequence may be a guide nucleic acid binding sequence.
  • the “guide nucleic acid binding sequence” is a nucleotide sequence having complementarity with the guide sequence included in the guide domain of the guide nucleic acid, and may bind complementarily with the guide sequence included in the guide domain of the guide nucleic acid.
  • the target sequence and guide nucleic acid binding sequence are nucleotide sequences that may vary depending on the target gene or nucleic acid, ie, the subject to be genetically engineered or corrected, and can be variously designed according to the target gene or nucleic acid.
  • the guide nucleic acid binding sequence may be the same length as the guide sequence.
  • the guide nucleic acid binding sequence may be a sequence shorter than the length of the guide sequence.
  • the guide nucleic acid binding sequence may be a sequence longer than the length of the guide sequence.
  • the guide sequence is a nucleotide sequence that is at least 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% or 95% complementary or completely complementary to the guide nucleic acid binding sequence. Can be.
  • the guide sequence may have or include 1 to 8 nucleotide sequences that are not complementary to the guide nucleic acid binding sequence.
  • the guide sequence disclosed herein can form complementary binding with consecutive 10 to 35 nucleotide sequences located in the promoter region of an immune participating gene.
  • the guide sequence may form a complementary bond with consecutive 10 to 25 nucleotide sequences located in the promoter region of the MYD88 gene.
  • the guide sequence may form a complementary bond with consecutive 10 to 25 nucleotide sequences located in the promoter region of the C3 gene.
  • the guide sequence disclosed herein can form complementary binding with consecutive 10 to 35 nucleotide sequences located in the intron region of an immune participating gene.
  • the guide sequence may form a complementary bond with consecutive 10 to 25 nucleotide sequences located in the intron region of the MYD88 gene.
  • the guide sequence may form a complementary bond with consecutive 10-25 nucleotide sequences located in the intron region of the C3 gene.
  • the guide sequence disclosed herein may form complementary binding with consecutive 10 to 35 nucleotide sequences located in the exon region of an immune participating gene.
  • the guide sequence may form a complementary bond with consecutive 10 to 25 nucleotide sequences located in the exon region of the MYD88 gene.
  • the guide sequence may form a complementary bond with consecutive 10 to 25 nucleotide sequences located in the exon region of the C3 gene.
  • the guide sequence disclosed herein may form complementary binding with consecutive 10 to 35 nucleotide sequences located in an enhancer region of an immune participating gene.
  • the guide sequence may form a complementary bond with consecutive 10 to 25 nucleotide sequences located in an enhancer region of MYD88 gene.
  • the guide sequence may form a complementary bond with consecutive 10 to 25 nucleotide sequences located in an enhancer region of the C3 gene.
  • the guide sequence disclosed herein may form complementary binding with consecutive 10 to 35 nucleotide sequences located of the coding, non-coding or mixed portion thereof of an immune participating gene.
  • the guide sequence may form a complementary bond with the contiguous 10-25 nucleotide sequences located of the coding, non-coding or mixed portion thereof of the MYD88 gene.
  • the guide sequence can form a complementary bond with the contiguous 10-25 nucleotide sequences located of the coding, non-coding, or mixed portion thereof of the C3 gene.
  • the guide sequence disclosed herein may form complementary binding to a contiguous 10 to 35 nucleotide sequence located of a promoter, enhancer, 3'UTR, polyadenyle (polyA) or mixed portion thereof of an immune participating gene.
  • the guide sequence may form complementary binding to a contiguous 10 to 25 nucleotide sequence located of a promoter, enhancer, 3′UTR, polyadenyl (polyA), or mixture portion thereof of the MYD88 gene.
  • the guide sequence may form complementary binding to a contiguous 10-25 nucleotide sequence located of a promoter, enhancer, 3′UTR, polyadenyle (polyA) or a mixture portion thereof of the C3 gene.
  • the guide sequence disclosed herein may form complementary binding with consecutive 10 to 35 nucleotide sequences located of an exon, intron, or mixed portion thereof of an immune participating gene.
  • the guide sequence may form a complementary bond with the contiguous 10-25 nucleotide sequences located of the exon, intron, or mixed portion thereof of the MYD88 gene.
  • the guide sequence may form a complementary bond with the contiguous 10-25 nucleotide sequences located of the exon, intron, or mixed portion thereof of the C3 gene.
  • the guide sequence disclosed herein may comprise a mutant portion of an immune participating gene (eg, a portion other than a wild type gene) or may form a complementary binding with adjacent 10 to 35 nucleotide sequences in close proximity.
  • the guide sequence may comprise a mutant portion of the MYD88 gene (eg, a portion different from the wild-type gene) or may form a complementary binding with consecutive 10-25 nucleotide sequences in close proximity.
  • the guide sequence may comprise a mutant portion of the C3 gene (eg, a portion different from the wild-type gene) or may form a complementary binding with consecutive 10-25 nucleotide sequences in close proximity.
  • the guide sequence disclosed herein is complementary to the contiguous 10 to 35 nucleotide sequences adjacent to the 5 'end and / or 3' end of the proto-spacer-adjacent Motif (PAM) sequence in the nucleic acid sequence of the immune participating gene. Can be formed.
  • PAM proto-spacer-adjacent Motif
  • the "proto-spacer-adjacent Motif (PAM) sequence” is a nucleotide sequence that the editor protein can recognize. At this time, the PAM sequence may be different in nucleotide sequence according to the type of the editor protein and the species derived.
  • the PAM sequence may be, for example, one or more of the following sequences (described in the 5 'to 3' direction).
  • N is A, T, C or G
  • N is each independently A, T, C or G, R is A or G and Y is C or T);
  • NNAGAAW N is each independently A, T, C or G, and W is A or T;
  • N are each independently A, T, C, or G;
  • NNGRR (T), wherein each N is independently A, T, C or G, and R is A or G;
  • TTN (N is A, T, C or G).
  • the guide sequence may form a complementary bond with consecutive 10 to 25 nucleotide sequences adjacent to the 5 'end and / or 3' end of the PAM sequence in the nucleic acid sequence of MYD88 gene.
  • T, G or C; or A, U, G or C) may form complementary binding to consecutive 10-25 nucleotide sequences located adjacent to the 5 'end or / and 3' end of the sequence.
  • a complementary bond can be formed with consecutive 10-25 nucleotide sequences located adjacent to the 5 'end or / and 3' end of the sequence.
  • the guide sequence is a gene of MYD88 gene.
  • Consecutive 10 to 10 adjacent to the 5 'end and / or 3' end of the 5'-TTN-3 '(N A, T, G or C; or A, U, G or C) sequence in the nucleic acid sequence A complementary bond can be formed with 25 nucleotide sequences.
  • the guide sequence may form a complementary bond with consecutive 10 to 25 nucleotide sequences adjacent to the 5 'end and / or 3' end of the PAM sequence in the nucleic acid sequence of the C3 gene.
  • a complementary bond can be formed with consecutive 10-25 nucleotide sequences located adjacent to the 5 'end or / and 3' end of the sequence.
  • the guide sequence is a C3 gene.
  • Consecutive 10 to 10 adjacent to the 5 'end and / or 3' end of the 5'-TTN-3 '(N A, T, G or C; or A, U, G or C) sequence in the nucleic acid sequence A complementary bond can be formed with 25 nucleotide sequences.
  • the guide sequence described in the table is a guide sequence capable of targeting the MYD88 gene or the C3 gene, and may form a complementary binding with the target sequence located in the MYD88 gene or the C3 gene.
  • the guide sequences described in Tables 5-8 are guide sequences capable of targeting the target sequences of Tables 1-4, respectively.
  • One aspect of the disclosure disclosed herein relates to a composition for genetic engineering for artificially engineering an immune participating gene.
  • the genetically engineered composition can be used to generate artificially engineered immune participating genes.
  • the immune participation gene artificially manipulated by the genetic manipulation composition can induce artificial immune function regulation.
  • artificially modified or engineered or artificially engineered refers to the state of artificial modification, not the state of existence as it occurs in nature.
  • an unnatural artificially engineered or modified immune participating gene can be used interchangeably with the term artificial immune participating gene.
  • “Artificial immune regulation” means that when an immune function of a subject (cell, tissue, organ, individual) is in an abnormal state, the abnormal immune function can return to normal state or maintain its normal state. I mean.
  • Genetic engineering can be made in consideration of the process of gene expression regulation.
  • RNA processing regulation RNA processing regulation
  • RNA transport regulation RNA degradation regulation
  • translation regulation protein modification regulation step
  • RNAi RNA interference or RNA silencing
  • small RNA sRNA interferes with mRNA or decreases its stability, and in some cases destroys it, preventing protein synthesis information from being transferred in the middle. Expression can be controlled.
  • genetic engineering utilizes wild type or variant enzymes capable of catalyzing the hydrolysis (cleavage) of bonds between nucleic acids in a DNA or RNA molecule, preferably a DNA molecule.
  • a DNA or RNA molecule preferably a DNA molecule.
  • Guide nucleic acid-editor protein complexes can be used.
  • At least one nuclease selected from the group consisting of meganuclease, zinc finger nuclease, CRISPR / Cas9 (Cas9 protein), CRISPR-Cpf1 (Cpf1 protein), and TALE-nuclease Genes can be manipulated using clease to control the expression of genetic information.
  • the genetically engineered composition disclosed by the present specification may include guide nucleic acid and editor protein.
  • the target sequence related description is as described above.
  • a guide nucleic acid comprising a guide sequence capable of forming a complementary binding to a target sequence of an immune participating gene or a nucleic acid sequence encoding the same;
  • the target sequence related description is as described above.
  • the genetically engineered composition may comprise a guide nucleic acid-editor protein complex.
  • Guide nucleic acid-editor protein complex refers to a complex formed through the interaction of guide nucleic acid and editor protein.
  • the guide nucleic acid related description is as described above.
  • editing protein refers to a peptide, polypeptide or protein that binds directly to, or does not directly interact with, a nucleic acid.
  • the nucleic acid may be a nucleic acid included in a target nucleic acid, gene or chromosome.
  • the nucleic acid may be a guide nucleic acid.
  • the editor protein may be an enzyme.
  • the "enzyme” refers to a polypeptide or protein comprising a domain capable of cleaving a nucleic acid, gene or chromosome.
  • the enzyme may be a nuclease or a restriction enzyme.
  • the editor protein may comprise a fully active enzyme.
  • the "fully active enzyme” refers to an enzyme having the same function as the original nucleic acid, gene or chromosome cleavage function of the wild type enzyme.
  • a wild type enzyme that cleaves double strands of DNA can be a fully active enzyme that cleaves both DNA strands.
  • the artificially engineered enzyme variant is identical to the wild type enzyme. If the double strand of DNA is cleaved, the artificially engineered enzyme variant may be a fully active enzyme.
  • the fully active enzyme may include an enzyme having an improved function than the function of the wild-type enzyme.
  • certain modified or engineered forms of wild-type enzymes that cleave double strands of DNA may have increased complete enzymatic activity, ie, activity that cleaves increased DNA double strands, than wild-type enzymes.
  • the editor protein may comprise an incomplete or partially active enzyme.
  • the "incomplete or partially active enzyme” refers to an enzyme having only a part of the original nucleic acid, gene or chromosome cleavage function of the wild type enzyme.
  • the specific modified or engineered form of the wild type enzyme that cuts the double strand of DNA may be a form having a first function or a form having a second function.
  • the first function may be a function of cutting the first strand of the double strand of DNA
  • the second function may be a function of cutting the second strand of the double strand of the DNA.
  • the enzyme having the first function or the enzyme having the second function may be an incomplete or partially active enzyme.
  • the editor protein may comprise an inactive enzyme.
  • the "inert enzyme” means an enzyme in which all of the original nucleic acid, gene or chromosome cleavage function of the wild type enzyme is inactivated.
  • certain modified or engineered forms of wild-type enzymes are forms in which both the first and second functions are lost, i.e., the first and second strands of the double strand of DNA are cleaved. Both functions may be lost. In this case, the enzyme having lost both the first function and the second function may be an inactive enzyme.
  • the editor protein may be a fusion protein.
  • fusion protein refers to a protein produced by fusing an additional domain, peptide, polypeptide or protein to an enzyme.
  • the additional domain, peptide, polypeptide or protein may be a functional domain, peptide, polypeptide or protein having the same or different function as the functional domain, peptide, polypeptide or protein included in the enzyme.
  • the fusion protein is at or near the amino terminus of the enzyme; At or near the carboxy terminus; Middle part of an enzyme; Or in the form to which the functional domain, peptide, polypeptide or protein is added to one or more of these combinations.
  • the functional domain, peptide, polypeptide or protein may be methylase activity, dimethylase activity, transcription activation activity, transcription repression activity, transcription release factor.
  • the functional domain, peptide, polypeptide or protein may be a deminase.
  • the tag includes a histidine tag, a V5 tag, a FLAG tag, an influenza hemagglutinin (HA) tag, a Myc tag, a VSV-G tag, a thioredoxin (Trx) tag, and the like.
  • the reporter gene is glutathione.
  • GST horseradish peroxidase
  • HRP horseradish peroxidase
  • CAT chloramphenicol acetyltransferase
  • GFP green fluorescent protein
  • HcRed HcRed
  • DsRed cyan fluorescent protein
  • BFP blue fluorescent protein
  • the functional domain, peptide, polypeptide or protein may be a NLS (nuclear localization sequence or signal) or NES (nuclear export sequence or signal).
  • Said NLS comprises NLS of SV40 virus large T-antigen with amino acid sequence PKKKRKV (SEQ ID NO: 815); NLS from nucleoplasmin (eg, nucleoplasmin bipartite NLS with sequence KRPAATKKAGQAKKKK (SEQ ID NO: 816)); C-myc NLS having the amino acid sequence PAAKRVKLD (SEQ ID NO: 817) or RQRRNELKRSP (SEQ ID NO: 818); HRNPA1 M9 NLS having the sequence NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY (SEQ ID NO: 819); The sequence RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV (SEQ ID NO: 820) of the IBB domain from importin-alpha; The sequences VSRKRPRP (SEQ ID NO: 821) and PPKKARED (SEQ ID NO: 822) of the myoma T protein
  • the additional domain, peptide, polypeptide or protein may be a nonfunctional domain, peptide, polypeptide or protein that does not perform a particular function.
  • the nonfunctional domain, peptide, polypeptide or protein may be a domain, peptide, polypeptide or protein that does not affect the function of the enzyme.
  • the fusion protein is at or near the amino terminus of the enzyme; At or near the carboxy terminus; Middle part of an enzyme; Or a form in which the nonfunctional domain, peptide, polypeptide or protein is added to one or more of these combinations.
  • the editor protein may be an enzyme or a fusion protein present in nature.
  • the editor protein may be in a form in which a part of an enzyme or a fusion protein existing in a natural state is modified.
  • the editor protein may be an artificially generated enzyme or fusion protein that does not exist in nature.
  • the editor protein may be a modified form of a part of an artificially generated enzyme or fusion protein that does not exist in nature.
  • the modification may be substitution, removal, addition, or a mixture of amino acids included in the editor protein.
  • the modification may be substitution, removal, addition or mixture of some of the nucleotides of the nucleotide sequence encoding the editor protein.
  • the genetically engineered composition may further comprise a donor or a nucleic acid sequence encoding the specific nucleotide sequence that you want to insert optionally.
  • the desired nucleic acid sequence may be some nucleotide sequence of the immune participating gene.
  • the insertion may be a nucleic acid sequence for correcting or introducing a mutation of an immune participating gene to be manipulated.
  • donor refers to a nucleotide sequence that aids in repair by homologous recombination of a damaged gene or nucleic acid.
  • the donor may be a double stranded nucleic acid or a single stranded nucleic acid.
  • the donor may be linear or circular.
  • the donor may comprise a nucleotide sequence having homology to a target gene or nucleic acid.
  • the donor may comprise a nucleotide sequence that is homologous to each of the positions at which a particular nucleotide sequence is to be inserted, eg, the nucleotide sequence upstream and downstream of the damaged nucleic acid.
  • the specific nucleotide sequence to be inserted may be located between the nucleotide sequence homologous to the right nucleotide sequence of the damaged nucleic acid and the nucleotide sequence homologous to the left nucleotide sequence of the damaged nucleic acid.
  • the nucleotide sequence having homology has at least 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% or 95% homology or is completely identical You can have the same sex.
  • the donor may optionally comprise an additional nucleotide sequence.
  • the additional nucleic acid sequence may serve to increase donor stability, in-target insertion efficiency or homologous recombination efficiency.
  • the additional nucleotide sequence may be a nucleic acid sequence rich in nucleotides A and T, that is, an A-T rich domain.
  • the additional nucleotide sequence may be a scaffold / matrix attachment region (SMAR).
  • Guide nucleic acids, editor proteins or guide nucleic acid-editor protein complexes disclosed herein may be delivered or introduced into a subject in various forms.
  • subject means a sample or a sample obtained from an organism into which the guide nucleic acid, the editor protein, or the guide nucleic acid-editor protein complex is introduced, or an organism or the organism in which the guide nucleic acid, the editor protein or the guide nucleic acid-editor protein complex operates. do.
  • the subject may be an organism comprising a target gene or chromosome of the guide nucleic acid-editor protein complex.
  • the organism may be an animal, animal tissue or animal cell.
  • the organism can be human, human tissue or human cell.
  • the tissue may be eye, skin, liver, kidney, heart, lung, brain, muscle or blood.
  • the cell may be an eye cell, neuron, macrophage, T cell or B cell.
  • the sample or sample is obtained from an organism containing a target gene or chromosome, such as saliva, blood, liver tissue, brain tissue, hepatocytes, nerve cells, phagocytes, macrophages, T cells, B cells, astrocytes, cancer cells or stem cells Can be one.
  • a target gene or chromosome such as saliva, blood, liver tissue, brain tissue, hepatocytes, nerve cells, phagocytes, macrophages, T cells, B cells, astrocytes, cancer cells or stem cells Can be one.
  • the subject may be an organism comprising an immune participating gene.
  • the guide nucleic acid, editor protein or guide nucleic acid-editor protein complex may be delivered or introduced into the subject in the form of DNA, RNA or a mixture thereof.
  • the form of DNA, RNA or a mixture thereof encoding guide nucleic acid and / or editor protein may be delivered or introduced into the subject by methods known in the art.
  • the form of DNA, RNA or a mixture thereof encoding the guide nucleic acid and / or editor protein may be delivered or introduced into the subject by a vector, a nonvector or a combination thereof.
  • the vector can be a viral or nonviral vector (eg plasmid).
  • the nonvector may be naked DNA, DNA complex or mRNA.
  • the nucleic acid sequence encoding the guide nucleic acid and / or editor protein can be delivered or introduced into the subject by a vector.
  • the vector may include nucleic acid sequences encoding guide nucleic acids and / or editor proteins.
  • the vector may include a nucleic acid sequence encoding the guide nucleic acid and the editor protein at the same time.
  • the vector may include a nucleic acid sequence encoding a guide nucleic acid.
  • the domains included in the guide nucleic acid may be included in one vector or may be divided and included in each vector.
  • the vector may include a nucleic acid sequence encoding the editor protein.
  • the nucleic acid sequence encoding the editor protein may be included in one vector or the nucleic acid sequence encoding the editor protein may be divided and included in several vectors.
  • the vector may include one or more adjustment / control components.
  • the regulatory / control component is a poromotor, an enhancer, an intron, a polyadenylation signal, a Kozak consensus sequence, an internal ribosome entry site (IRES), a splice acceptor and / or 2A. Sequences may be included.
  • the promoter may be a promoter recognized by RNA polymerase II.
  • the promoter may be a promoter recognized by RNA polymerase III.
  • the promoter may be an inducible promoter.
  • the promoter may be a subject specific promoter.
  • the promoter may be a viral or nonviral promoter.
  • the promoter may use a suitable promoter according to a control region (ie, a nucleic acid sequence encoding a guide nucleic acid or an editor protein).
  • a control region ie, a nucleic acid sequence encoding a guide nucleic acid or an editor protein.
  • useful promoters for guide nucleic acids can be H1, EF-1a, tRNA or U6 promoters.
  • useful promoters for editor proteins can be CMV, EF-1a, EFS, MSCV, PGK or CAG promoters.
  • the vector can be a viral vector or a recombinant viral vector.
  • the virus may be a DNA virus or an RNA virus.
  • the DNA virus may be a double-stranded DNA (dsDNA) virus or a single-stranded DNA (ssDNA) virus.
  • dsDNA double-stranded DNA
  • ssDNA single-stranded DNA
  • the RNA virus may be a single-stranded RNA (ssRNA) virus.
  • ssRNA single-stranded RNA
  • the virus may be, but is not limited to, retrovirus, lentivirus, adenovirus, adeno-associated virus (AAV), vaccinia virus, poxvirus or herpes simplex virus.
  • viruses can infect a host (eg, a cell) to introduce a nucleic acid encoding the genetic information of the virus into the host or to insert a nucleic acid encoding the genetic information into the genome of the host.
  • Viruses having these characteristics can be used to introduce guide nucleic acids and / or editor proteins into a subject.
  • Guide nucleic acids and / or editor proteins introduced using a virus can be transiently expressed in a subject (eg, a cell).
  • guide nucleic acids and / or editor proteins introduced using a virus may be present in the subject (eg, cells) for a long time (eg, 1 week, 2 weeks, 3 weeks, 1 month, 2 months, 3 months, 6 months). , 9 months, 1 year, 2 years or permanent).
  • the packaging capacity of the virus can vary from virus type to at least 2 kb to 50 kb. According to this packaging ability, a viral vector containing a guide nucleic acid or an editor protein alone can be designed, or a viral vector including both guide nucleic acid and an editor protein can be designed. Alternatively, viral vectors can be designed that include guide nucleic acids, editor proteins, and additional components.
  • nucleic acid sequences encoding guide nucleic acids and / or editor proteins may be delivered or introduced by recombinant lentiviruses.
  • nucleic acid sequence encoding the guide nucleic acid and / or editor protein may be delivered or introduced by recombinant adenovirus.
  • nucleic acid sequence encoding the guide nucleic acid and / or editor protein may be delivered or introduced by recombinant AAV.
  • nucleic acid sequences encoding guide nucleic acids and / or editor proteins may be delivered or introduced by a hybrid virus, eg, a hybrid of one or more of the viruses described herein.
  • nucleic acid sequence encoding the guide nucleic acid and / or editor protein may be delivered or introduced into the subject in a non-vector.
  • Non-vectors can include nucleic acid sequences encoding guide nucleic acids and / or editor proteins.
  • the nonvector may be naked DNA, DNA complex, mRNA or a mixture thereof.
  • Such non-vectors can be used for electroporation, gene guns, ultrasonic perforation, magnetofection, transient cell compression or squeezing (eg, Lee, et al, (2012) Nano Lett., 12, 6322- 6327), lipid-mediated transfection, dendrimers, nanoparticles, calcium phosphate, silica, silicates (ormosils), or combinations thereof.
  • delivery via electroporation may be performed by mixing cells and nucleic acid sequences encoding guide nucleic acids and / or editor proteins in a cartridge, chamber or cuvette and applying electrical stimulation of a predetermined duration and amplitude. have.
  • the non-vector may be delivered using nanoparticles.
  • the nanoparticles can be inorganic nanoparticles (eg, magnetic nanoparticles, silica, etc.) or organic nanoparticles (eg, lipids coated with polyethylene glycol (PEG), etc.).
  • the outer surface of the nanoparticles may be conjugated with a positively charged polymer (eg, polyethyleneimine, polylysine, polyserine, etc.) to enable adhesion.
  • the lipid envelope may be used for delivery.
  • Exosomes are endogenous nano-vesicles that transport proteins and RNA that can deliver RNA to the brain and other target organs.
  • liposomes can be delivered.
  • Liposomes are spherical vesicle structures consisting of a single or multiple lamellar lipid bilayers surrounding the inner aqueous compartment and a relatively impermeable outer lipophilic phospholipid bilayer. Liposomes can be made from several different types of lipids; Phospholipids are most commonly used to produce liposomes as drug carriers.
  • compositions for the delivery of non-vectors may include some other additive.
  • the editor protein may be delivered or introduced into the subject in the form of a peptide, polypeptide or protein.
  • the editor protein may be delivered or introduced into a subject by methods known in the art, such as peptides, polypeptides or proteins.
  • peptides, polypeptides or proteins are described by electroporation, microinjection, transient cell compression or squeezing (e.g., Lee, et al, (2012) Nano Lett., 12, 6322-6327). Can be delivered or introduced into a subject by lipid-mediated transfection, nanoparticles, liposomes, peptide-mediated delivery, or a combination thereof.
  • Delivery of the peptide, polypeptide or protein may be delivered with a nucleic acid sequence encoding a guide nucleic acid.
  • delivery via electroporation may be performed by mixing with cells to introduce the editor protein with or without guide nucleic acid in a cartridge, chamber or cuvette, and applying electrical stimulation of a defined duration and amplitude. .
  • the guide nucleic acid and editor protein may be delivered or introduced into the subject in the form of a nucleic acid-protein mixture.
  • the guide nucleic acid and editor protein may be delivered or introduced into the subject in the form of a guide nucleic acid-editor protein complex.
  • the guide nucleic acid may be in the form of DNA, RNA or a mixture thereof.
  • the editor protein may be in the form of a peptide, polypeptide or protein.
  • the guide nucleic acid and the editor protein may be delivered or introduced into the subject in the form of a guide nucleic acid in the RNA form and the editor protein in the protein form in the form of a guide nucleic acid-editor protein complex, ie, ribonucleoprotein (RNP).
  • a guide nucleic acid-editor protein complex ie, ribonucleoprotein (RNP).
  • Guide nucleic acid-editor protein complexes disclosed by the present specification can modify target nucleic acids, genes or chromosomes.
  • guide nucleic acid-editor protein complexes induce modifications in the sequence of a target nucleic acid, gene or chromosome.
  • the protein expressed by the target nucleic acid, gene or chromosome may be modified in structure and / or function, regulated expression of the protein, or eliminated expression of the protein.
  • the guide nucleic acid-editor protein complex may act at the DNA, RNA, gene or chromosome level.
  • the guide nucleic acid-editor protein complex may manipulate or modify a target gene to modulate (eg, inhibit, inhibit, decrease, increase or promote expression of a protein encoded by a target gene), or regulate protein activity ( For example, inhibiting, inhibiting, decreasing, increasing or promoting) or modified proteins.
  • the guide nucleic acid-editor protein complex may act at the stage of transcription and translation of the gene.
  • the guide nucleic acid-editor protein complex may promote (or inhibit) transcription of a target gene to regulate (eg, inhibit, inhibit, decrease, increase or promote) expression of a protein encoded by the target gene.
  • the guide nucleic acid-editor protein complex may promote (or inhibit) translation of a target gene to regulate (eg, inhibit, inhibit, decrease, increase or promote) expression of a protein encoded by the target gene.
  • the genetically engineered composition may comprise gRNA and CRISPR enzyme.
  • the target sequence related description is as described above.
  • a gRNA comprising a guide sequence capable of forming a complementary binding to a target sequence of an immune participating gene or a nucleic acid sequence encoding the same
  • the target sequence related description is as described above.
  • the genetically engineered composition may comprise a gRNA-CRISPR enzyme complex.
  • GRNA-CRISPR enzyme complex means a complex formed through the interaction of gRNA and CRISPR enzyme.
  • the gRNA related description is as described above.
  • CRISPR enzyme is a major protein component of the CRISPR-Cas system, complexes with gRNA to form the CRISPR-Cas system.
  • the CRISPR enzyme may be a nucleic acid or polypeptide (or protein) having a sequence encoding the CRISPR enzyme.
  • the CRISPR enzyme may be a Type II CRISPR enzyme.
  • Type II CRISPR enzyme The crystal structure of Type II CRISPR enzyme was studied in two or more naturally-occurring microbial Type II CRISPR enzyme molecules (Jinek et al., Science, 343 (6176): 1247997, 2014) and Streptococcus pyogen complexed with gRNA.
  • Nes Cas9 SpCas9
  • SpCas9 Nes Cas9
  • Type II CRISPR enzymes comprise two lobes, namely recognition (REC) and nuclease (NUC) lobes, each lobe comprising several domains.
  • the REC lobe comprises an arginine-rich bridge helix (BH), a REC1 domain and a REC2 domain.
  • BH arginine-rich bridge helix
  • the BH domain is then a long ⁇ -helix and arginine rich region, and the REC1 and REC2 domains play an important role in the recognition of double strands, eg, single stranded gRNAs, double gRNAs or tracrRNAs, formed in gRNAs.
  • the NUC lobe comprises a RuvC domain, an HNH domain and a PAM-interaction (PI) domain.
  • the RuvC domain is used to encompass the RuvC-like domain
  • the HNH domain is used to encompass the HNH-like domain.
  • the RuvC domain shares structural similarity with respect to the members of the microorganism present in the natural state including the Type II CRISPR enzyme, and complements with a single strand, for example, a non-complementary strand of a target gene or nucleic acid, that is, gRNA. Cut strands that do not bond normally.
  • the RuvC domain is often referred to in the art as the RuvCI domain, RuvCII domain and RuvCIII domain, commonly referred to as RuvC I, RuvCII and RuvCIII.
  • the HNH domain shares structural similarity with the HNH endonuclease and cleaves a single strand, eg, the complementary strand of the target nucleic acid molecule, ie, the strand that complements the gRNA.
  • the HNH domain is located between the RuvC II and III motifs.
  • the PI domain recognizes or interacts with a specific nucleotide sequence within a target gene or nucleic acid, ie, Protospacer adjacent motif (PAM).
  • PAM Protospacer adjacent motif
  • the PAM may vary depending on the origin of the Type II CRISPR enzyme.
  • PAM may vary as a study of a mutant of the enzyme derived from the enzyme proceeds.
  • the Type II CRISPR enzyme may be Cas9.
  • the Cas9 is Streptococcus pyogenes, Streptococcus thermophilus, Streptococcus sp., Streptococcus sp., Staphylococcus aureus, Norcardiopsis dasonville , Streptomyces pristinaespiralis, Streptomyces viridochromogenes, Streptomyces viridochromogenes, Streptosporium roseum , Streptosporangium roseum, AlicyclobacHlus acidocaldarius, Bacillus pseudomycoides, Bacillus selenitireduceus bacilli Exiguobacterium sibiricum, Lactobacillus Lactobacillus delbrueckii, Lactobacillus salivarius, Microscilla marina, Burkholderiales bacterium, Polaramonas naphthalenican boran (Polaromonas na polarans) Poloromonas sp., Cro
  • the Cas9 is an enzyme that binds to a gRNA and cleaves or modifies a target sequence or position on a target gene or nucleic acid.
  • the Cas9 is non-complementary with an HNH domain or gRNA capable of cleaving a nucleic acid strand to which the gRNA has a complementary binding. It can be composed of a RuvC domain capable of cleaving a nucleic acid strand, a target, ie, a REC domain that interacts with the target, and a PI domain that recognizes PAM. Specific structural characteristics of Cas9 are described in Hiroshi Nishimasu et al. (2014) Cell 156: 935-949.
  • the Cas9 may be isolated from a microorganism existing in nature or may be produced unnaturally through a recombinant method or a synthetic method.
  • the CRISPR enzyme may be a Type V CRISPR enzyme.
  • Type V CRISPR enzymes have a similar RuvC domain that corresponds to the RuvC domain of Type II CRISPR enzymes, which lacks the HNH domain of Type II CRISPR enzymes and instead includes a Nuc domain and WED with a REC domain that interacts with the target. It can consist of a domain and a PI domain that recognizes PAM.
  • the structural characteristics of specific Type V CRISPR enzymes are described in Takashi Yamano et al. (2016) Cell 165: 949-962.
  • Type V CRISPR enzymes can interact with gRNAs, form gRNA-CRISPR enzyme complexes, ie, CRISPR complexes, and cooperate with gRNAs to bring the guide sequence to the target sequence, including the PAM sequence. At this time, the ability of the Type V CRISPR enzyme to interact with the target gene or nucleic acid is dependent on the PAM sequence.
  • the PAM sequence is a sequence present in a target gene or nucleic acid, and may be recognized by the PI domain of a Type V CRISPR enzyme.
  • the PAM sequence may be different depending on the origin of the Type V CRISPR enzyme. That is, there is a PAM sequence that can be specifically recognized for each species.
  • the PAM sequence recognized by Cpf1 may be 5'-TTN-3 '(N is A, T, C or G).
  • the PAM may vary as a study of a mutant of the enzyme derived from the enzyme proceeds.
  • the Type V CRISPR enzyme may be Cpf1.
  • the Cpf1 is Streptococcus, Campylobacter, Nitratifractor, Staphylococcus, Parvibaculum, Roseburia, Neisseria, Gluconacetobacter, Azospirillum, Sphaerochaeta, Lactobacillus, Eubacterium, Corynebacter, Carnobacterium, Rhodobacter, Listeria, Clono bacterium Clonocius bacterium Or Cpf1 from Methanomethyophilus, Porphyromonas, Prevotella, Bacteroidetes, Helcococcus, Letospira, Desulfovibrio, Desulfonatronum, Opitutaceae, Tuberibacillus, Bacillus, Brevibacilus, Methylobacterium or Acidaminococcus.
  • the Cpf1 has a similar RuvC domain that corresponds to the RuvC domain of Cas9, which lacks the HNH domain of Cas9 and instead includes a Nuc domain, a PI domain that recognizes a REC domain and a WED domain and PAM that interact with the target. It may be configured as. Specific structural properties of Cpf1 are described in Takashi Yamano et al. (2016) Cell 165: 949-962.
  • the Cpf1 may be isolated from a microorganism existing in a natural state or may be produced unnaturally through a recombinant method or a synthetic method.
  • the CRISPR enzyme may be a nuclease or restriction enzyme having a function of cleaving double strands of a target gene or nucleic acid.
  • the CRISPR enzyme may be a fully active CRISPR enzyme.
  • “Full activity” means a state having the same function as that of a wild type CRISPR enzyme, and the CRISPR enzyme in this state is called a fully active CRISPR enzyme.
  • the "function of the wild type CRISPR enzyme” is a function of cutting a double strand of DNA, that is, a first function to cut the first strand of the double strand of DNA and the second strand of the double strand of DNA It is a state which has all the 2nd functions to do.
  • the fully active CRISPR enzyme may be a wild type CRISPR enzyme that cleaves double strands of DNA.
  • the fully active CRISPR enzyme may be a CRISPR enzyme variant that has modified or engineered a wild type CRISPR enzyme that cleaves double strands of DNA.
  • the CRISPR enzyme variant may be an enzyme in which one or more amino acids in the amino acid sequence of the wild-type CRISPR enzyme are substituted with another amino acid or one or more amino acids are removed.
  • the CRISPR enzyme variant may be an enzyme in which one or more amino acids are added to an amino acid sequence of a wild type CRISPR enzyme. At this time, the position of the added amino acid may be in the N-terminal, C-terminal or amino acid sequence of the wild-type enzyme.
  • the CRISPR enzyme variant may be a fully active enzyme with improved function than wild type CRISPR enzyme.
  • modified or engineered forms of wild-type CRISPR enzymes ie, CRISPR enzyme variants
  • CRISPR enzyme variants can cleave DNA double strands without binding or maintaining a certain distance apart.
  • the modified or engineered form may be a fully active CRISPR enzyme with enhanced functional activity than the wild type CRISPR enzyme.
  • the CRISPR enzyme variant may be a fully active CRISPR enzyme with reduced function than wild type CRISPR enzyme.
  • certain modified or engineered forms of wild-type CRISPR enzymes can cleave DNA double strands at or above a certain distance or a specific bond is formed.
  • the specific binding may be, for example, binding of an amino acid at a specific position of an enzyme to a DNA nucleotide sequence at a cleavage position.
  • the modified or engineered form may be a fully active CRISPR enzyme with reduced functional activity than the wild type CRISPR enzyme.
  • the CRISPR enzyme may be an incomplete or partially active CRISPR enzyme.
  • “Incomplete or partially active” refers to the function of the wild-type CRISPR enzyme, one selected from the first function of cleaving the first strand of the double strand of DNA and the second function of cleaving the second strand of the double strand of DNA. Branch means state. CRISPR enzymes in this state are termed incomplete or partially active CRISPR enzymes. The incomplete or partially active CRISPR enzyme may also be referred to as a nickase.
  • “Nickase” refers to a CRISPR enzyme that has been engineered or modified to cleave only one of the double strands of a target gene or nucleic acid, which nickase is equivalent to the gRNA of a single strand, eg, a target gene or nucleic acid.
  • nickase is equivalent to the gRNA of a single strand, eg, a target gene or nucleic acid.
  • the cleavage of double strands requires the nuclease activity of two kinases.
  • the kinase may have nuclease activity by the RuvC domain of the CRISPR enzyme. That is, the kinase may not include nuclease activity by the HNH domain of the CRISPR enzyme, for which the HNH domain may be engineered or altered.
  • the kinase when the CRISPR enzyme is a Type II CRISPR enzyme, the kinase may be a Type II CRISPR enzyme including a modified HNH domain.
  • the kinase when the Type II CRISPR enzyme is wild type SpCas9, the kinase may be a SpCas9 variant in which the nuclease activity of the HNH domain is inactivated by mutating histidine amino acid sequence 840 of wild type SpCas9 to alanine. have. Since the generated kinase, ie, SpCas9 variant, has nuclease activity by the RuvC domain, it is possible to cut non-complementary strands of a target gene or nucleic acid, ie, strands which do not complementally bind gRNA.
  • the kinase when the Type II CRISPR enzyme is wild type CjCas9, the kinase is a CjCas9 variant in which the nuclease activity of the HNH domain is inactivated by mutating histidine amino acid sequence 559 of wild type CjCas9 to alanine. Can be.
  • the generated kinase, ie, CjCas9 variant since the generated kinase, ie, CjCas9 variant, has nuclease activity by the RuvC domain, non-complementary strands of a target gene or nucleic acid, ie, strands which do not complementally bind gRNA, can be cleaved.
  • the kinase may have nuclease activity by the HNH domain of the CRISPR enzyme. That is, the kinase may not include nuclease activity by the RuvC domain of the CRISPR enzyme, for which the RuvC domain may be engineered or altered.
  • the kinase when the CRISPR enzyme is a Type II CRISPR enzyme, the kinase may be a Type II CRISPR enzyme including a modified RuvC domain.
  • the kinase when the Type II CRISPR enzyme is wild type SpCas9, the kinase is a SpCas9 variant in which the nuclease activity of the RuvC domain is inactivated by mutating the aspartic acid of amino acid sequence No. 10 of wild type SpCas9 to alanine.
  • the generated kinase, ie, SpCas9 variant has nuclease activity by the HNH domain, and thus can cleave the complementary strand of the target gene or nucleic acid, ie, the strand that does not complementary to the gRNA.
  • the kinase when the Type II CRISPR enzyme is wild type CjCas9, the kinase mutates the amino acid sequence 8 aspartic acid of wild type CjCas9 to alanine to alanine to inactivate CjCas9 of the nuclease activity of the RuvC domain. It may be a variant. In this case, since the generated kinase, ie, CjCas9 variant, has nuclease activity by the HNH domain, the complementary strand of the target gene or nucleic acid, ie, a strand not complementary to gRNA, may be cleaved.
  • the CRISPR enzyme may be an inactive CRISPR enzyme.
  • “Inactive” means a loss of the function of the wild-type CRISPR enzyme, ie, the first function of cleaving the first strand of the double strand of DNA and the second function of cleaving the second strand of the double strand of DNA.
  • the CRISPR enzyme in this state is called an inactive CRISPR enzyme.
  • the inactive CRISPR enzyme may have nuclease inactivation due to mutation in a domain having nuclease activity of wild type CRISPR enzyme.
  • the inactive CRISPR enzyme may have nuclease incompatibility due to mutations in the RuvC domain and the HNH domain. That is, the inactive CRISPR enzyme may not include nuclease activity by the RuvC domain and HNH domain of the CRISPR enzyme, for which the RuvC domain and the HNH domain may be manipulated or altered.
  • the inactive CRISPR enzyme may be a Type II CRISPR enzyme including a modified RuvC domain and an HNH domain.
  • the inactive CRISPR enzyme mutates both amino acid sequence 10 aspartic acid and histidine 840 to alanine of wild type SpCas9 to nucleases of the RuvC domain and HNH domain.
  • the SpCas9 variant may be inactivated in activity.
  • the generated inactive CRISPR enzyme, ie, SpCas9 variant inactivates the nuclease activity of the RuvC domain and the HNH domain, and thus cannot cut all the double strands of the target gene or nucleic acid.
  • the inactive CRISPR enzyme when the Type II CRISPR enzyme is wild type CjCas9, the inactive CRISPR enzyme mutates both amino acid sequence 8 aspartic acid and 559 histidine to alanine of the wild type CjCas9 to alanine to produce a new protein of the RuvC domain and the HNH domain. It may be a CjCas9 variant in which clease activity is inactivated.
  • the generated inactive CRISPR enzyme, ie, CjCas9 variant inactivates the nuclease activity of the RuvC domain and the HNH domain, and thus cannot cut all the double strands of the target gene or nucleic acid.
  • the CRISPR enzyme may have a helicase activity, that is, a function of unwinding the helical structure of the double stranded nucleic acid.
  • the CRISPR enzyme may also modify the CRISPR enzyme to be fully active, incomplete or partially active, or inactive with respect to the helicase activity of the CRISPR enzyme.
  • the CRISPR enzyme may be a CRISPR enzyme variant that artificially engineered or modified wild type CRISPR enzyme.
  • the CRISPR enzyme variant is artificially modified to modify the function of the wild type CRISPR enzyme, ie, the first function of cleaving the first strand of the double strand of DNA and / or the second function of cleaving the second strand of the double strand of DNA. It may be an engineered or modified CRISPR enzyme variant.
  • the CRISPR enzyme variant may be in a form in which the first function of the wild type CRISPR enzyme is lost.
  • the CRISPR enzyme variant may be in a form in which the second function of the wild type CRISPR enzyme is lost.
  • the CRISPR enzyme variant may be in a form in which the function of the wild-type CRISPR enzyme is lost, that is, both the first function and the second function are lost.
  • the CRISPR enzyme variant may form a gRNA-CRISPR enzyme complex through interaction with gRNA.
  • the CRISPR enzyme variant may be a CRISPR enzyme variant that has been artificially engineered or modified to modify the function of interacting with the gRNA of the wild type CRISPR enzyme.
  • the CRISPR enzyme variant may be in a form of reduced interaction with gRNA compared to wild type CRISPR enzyme.
  • the CRISPR enzyme variant may be in the form of increased interaction of gRNA compared to wild type CRISPR enzyme.
  • the CRISPR enzyme variant may be in a form with reduced interaction with gRNA while having the first function of the wild type CRISPR enzyme.
  • the CRISPR enzyme variant may be in the form of increased interaction with gRNA while having the first function of the wild type CRISPR enzyme.
  • the CRISPR enzyme variant may be in a form with reduced interaction with gRNA while having a second function of wild type CRISPR enzyme.
  • the CRISPR enzyme variant may be in the form of increased interaction with gRNA while having a second function of wild-type CRISPR enzyme.
  • the CRISPR enzyme variant may be in a form with reduced interaction with gRNA without having the first and second functions of the wild type CRISPR enzyme.
  • the CRISPR enzyme variant may be in the form of increased interaction with gRNA without having the first and second functions of wild-type CRISPR enzyme.
  • various gRNA-CRISPR enzyme complexes may be formed according to the interaction strength of the gRNA and CRISPR enzyme variants, and the function of accessing or cutting the target sequence may be different according to the CRISPR enzyme variants.
  • a gRNA-CRISPR enzyme complex formed by a CRISPR enzyme variant with reduced interaction with gRNA may only double or single strand of the target sequence if it is close to or localized to a target sequence that is fully complementary to the gRNA. Can be cut.
  • the CRISPR enzyme variant may be a modification of at least one amino acid of the amino acid sequence of the wild-type CRISPR enzyme.
  • the CRISPR enzyme variant may be a substitution of at least one amino acid of the amino acid sequence of the wild type CRISPR enzyme.
  • the CRISPR enzyme variant may be one from which at least one amino acid of the amino acid sequence of the wild type CRISPR enzyme is removed.
  • the CRISPR enzyme variant may be one or more amino acids added to the amino acid sequence of the wild type CRISPR enzyme.
  • the CRISPR enzyme variant may be a substitution, removal and / or addition of at least one or more amino acids of the amino acid sequence of the wild type CRISPR enzyme.
  • the CRISPR enzyme variant is optionally functional in addition to the original function of the wild-type CRISPR enzyme, that is, the first function of cleaving the first strand of the double strand of DNA and the second function of cleaving the second strand of the double strand of DNA. It may further comprise a (functional) domain. At this time, the CRISPR enzyme variant may have an additional function in addition to the original function of the wild-type CRISPR enzyme.
  • the functional domain is methylase activity, dimethylase activity, transcription activation activity, transcription repression activity, transcription release factor activity, histone modification It may be a domain having modification activity, RNA cleavage activity or nucleic acid binding activity, or may be a tag or reporter gene for isolation and purification of proteins (including peptides), but is not limited thereto. It doesn't work.
  • the tag includes a histidine (His) tag, a V5 tag, a FLAG tag, an influenza hemagglutinin (HA) tag, a Myc tag, a VSV-G tag, a thioredoxin (Trx) tag, and the like.
  • the reporter gene is glutathione.
  • GST horseradish peroxidase
  • HRP horseradish peroxidase
  • CAT chloramphenicol acetyltransferase
  • beta-galactosidase beta-glucuronidase
  • luciferase green fluorescent protein Autofluorescent proteins including, but not limited to, (GFP), HcRed, DsRed, cyan fluorescent protein (CFP), yellow fluorescent protein (YFP), and blue fluorescent protein (BFP).
  • GFP horseradish peroxidase
  • CAT chloramphenicol acetyltransferase
  • CFP cyan fluorescent protein
  • YFP yellow fluorescent protein
  • BFP blue fluorescent protein
  • the functional domain may be a deminase.
  • an incomplete or partial CRISPR enzyme may further comprise cytidine deaminase as a functional domain.
  • a fusion protein can be generated by adding a cytidine deminase, such as apolipoprotein B editing complex 1 (APOBEC1), to SpCas9 kinase.
  • APOBEC1 apolipoprotein B editing complex 1
  • SpCas9 kinase]-[APOBEC1] thus formed can be used for nucleotide calibration or editing of nucleotides C as T or U, or nucleotide G to A for nucleotide calibration or editing.
  • an incomplete or partial CRISPR enzyme may further comprise adenine deaminase as a functional domain.
  • a fusion protein can be generated by adding adenine dianases, such as TadA variants, ADAR2 variants, ADAT2 variants, etc. to SpCas9 kinase.
  • adenine dianases such as TadA variants, ADAR2 variants, ADAT2 variants, etc.
  • SpCas9 kinase [SpCas9 kinase]-[TadA variant], [SpCas9 kinase]-[ADAR2 variant] or [SpCas9 kinase]-[ADAT2 variant] thus formed transforms nucleotide A to inosine, and the modified inosine is modified by polymerase.
  • nucleotide G Since it is recognized as nucleotide G and has the effect of nucleotide correction or editing substantially from nucleotide A to G, nucleotide A can be used for nucleotide correction or editing from G, or nucleotide T from C for nucleotide correction or editing. .
  • the functional domain may be a nuclear localization sequence or signal (NLS) or a nuclear export sequence or signal (NES).
  • NLS nuclear localization sequence or signal
  • NES nuclear export sequence or signal
  • the CRISPR enzyme may comprise one or more NLS.
  • the NLS is at or near the amino terminus of the CRISPR enzyme; At or near the carboxy terminus; Or one or more NLSs in combination thereof.
  • the NLS may be, but is not limited to, an NLS sequence derived from: NLS of SV40 virus large T-antigen with amino acid sequence PKKKRKV (SEQ ID NO: 815); NLS from nucleoplasmin (eg, nucleoplasmin bipartite NLS with sequence KRPAATKKAGQAKKKK (SEQ ID NO: 816)); C-myc NLS having the amino acid sequence PAAKRVKLD (SEQ ID NO: 817) or RQRRNELKRSP (SEQ ID NO: 818); HRNPA1 M9 NLS having the sequence NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY (SEQ ID NO: 819); The sequence RMRIZFKNKGKDTAELRRRRVE
  • the CRISPR enzyme variant may include a split form of CRISPR enzyme divided into two or more parts by dividing the CRISPR enzyme.
  • split is meant splitting a protein functionally or structurally or optionally into two or more.
  • the split form of CRISPR enzyme may be a fully active enzyme, an incomplete or partially active enzyme or an inactive enzyme.
  • a split SpCas9 divided into two parts may be generated by dividing between 656 tyrosine and 657 threonine.
  • the split form of CRISPR enzyme may optionally comprise additional domains, peptides, polypeptides or proteins for reconstitution.
  • Additional domains, peptide polypeptides or proteins for this reconstitution may be assembled such that the split form of the CRISPR enzyme is structurally identical or similar to the wild type CRISPR enzyme.
  • Additional domains, peptides, polypeptides or proteins for the reconstitution include FRB and FKBP dimerization domains; Inteins; ERT and VPR domains or domains that form dimers in certain conditions.
  • the CRISPR enzyme is SpCas9
  • a split SpCas9 divided into two parts by dividing between serine 713 and glycine 714 can be linked to the FRB domain in one of two parts, and the FKBP domain in the other. have.
  • the split SpCas9 thus generated can generate a reconstituted CRISPR enzyme by forming a dimer of the FRB domain and the FKBP domain in the presence of rapamycin.
  • the CRISPR enzyme or CRISPR enzyme variant disclosed herein may be a polypeptide, a protein or a nucleic acid having a sequence encoding the same, codon optimized for the subject to which the CRISPR enzyme or CRISPR enzyme variant is to be introduced. It may be.
  • Codon optimization refers to a nucleic acid for enhanced expression in a host cell of interest by maintaining the native amino phase sequence, replacing at least one codon of the native sequence with a codon that is used more frequently or most frequently in the gene of the host cell. Refers to a process of modifying a sequence.
  • Various species have specific biases for specific codons of specific amino acids, and codon bias (difference in codon usage between organisms) is often correlated with the efficiency of translation of mRNA, which is due to the nature of the codons being translated and the availability of specific tRNA molecules. It is considered to be influenced by.
  • the preponderance of tRNAs selected in cells generally reflects the codons most frequently used for peptide synthesis. Thus, genes can be tailored for optimal gene expression in a given organism based on codon optimization.
  • gRNA, CRISPR enzyme or gRNA-CRISPR enzyme complex disclosed herein can be delivered or introduced into a subject in various forms.
  • the gRNA and / or CRISPR enzyme may be delivered or introduced into the subject by a vector comprising nucleic acid sequences encoding each.
  • the vector may comprise nucleic acid sequences encoding gRNAs and / or CRISPR enzymes.
  • the vector may include a nucleic acid sequence encoding a gRNA and a CRISPR enzyme.
  • the vector may include a nucleic acid sequence encoding gRNA.
  • the domains included in the gRNA may be included in one vector or may be divided and included in each vector.
  • the vector may include a nucleic acid sequence encoding a CRISPR enzyme.
  • the nucleic acid sequence encoding the CRISPR enzyme may be included in one vector or the nucleic acid sequence encoding the CRISPR enzyme may be divided and included in several vectors.
  • the vector may include one or more adjustment / control components.
  • the regulatory / control component is a poromotor, an enhancer, an intron, a polyadenylation signal, a Kozak consensus sequence, an internal ribosome entry site (IRES), a splice acceptor and / or 2A. Sequences may be included.
  • the promoter may be a promoter recognized by RNA polymerase II.
  • the promoter may be a promoter recognized by RNA polymerase III.
  • the promoter may be an inducible promoter.
  • the promoter may be a subject specific promoter.
  • the promoter may be a viral or nonviral promoter.
  • the promoter may use a suitable promoter depending on the control region (ie, the nucleic acid sequence encoding the gRNA and / or CRISPR enzyme).
  • useful promoters for gRNAs may be H1, EF-1a, tRNA or U6 promoters.
  • a promoter useful for the CRISPR enzyme can be a CMV, EF-1a, EFS, MSCV, PGK or CAG promoter.
  • the vector may be a viral vector or a recombinant viral vector.
  • the virus may be a DNA virus or an RNA virus.
  • the DNA virus may be a double-stranded DNA (dsDNA) virus or a single-stranded DNA (ssDNA) virus.
  • dsDNA double-stranded DNA
  • ssDNA single-stranded DNA
  • the RNA virus may be a single-stranded RNA (ssRNA) virus.
  • ssRNA single-stranded RNA
  • the virus may be, but is not limited to, retrovirus, lentivirus, adenovirus, adeno-associated virus (AAV), vaccinia virus, poxvirus or herpes simplex virus.
  • nucleic acid sequence encoding the gRNA and / or CRISPR enzyme can be delivered or introduced by recombinant lentiviral.
  • a nucleic acid sequence encoding a gRNA and / or CRISPR enzyme may be delivered or introduced by recombinant adenovirus.
  • a nucleic acid sequence encoding a gRNA and / or CRISPR enzyme may be delivered or introduced by recombinant AAV.
  • nucleic acid sequences encoding gRNAs and / or CRISPR enzymes may be delivered or introduced by hybrid viruses, such as hybrids of one or more of the viruses described herein.
  • it can be delivered or introduced into the subject in the form of a gRNA-CRISPR enzyme complex.
  • the gRNA may be DNA, RNA or a mixed form thereof.
  • the CRISPR enzyme may be in the form of a peptide, polypeptide or protein.
  • the gRNA and CRISPR enzyme may be delivered or introduced into the subject in the form of an RNA form of gRNA and a protein form of CRISPR gRNA-CRISPR enzyme complex, ie, ribonucleoprotein (RNP).
  • RNP ribonucleoprotein
  • the CRISPR gRNA-CRISPR enzyme complex is described by electroporation, microinjection, transient cell compaction or squeezing (eg, Lee, et al, (2012) Nano Lett., 12, 6322-6327). ), Lipid-mediated transfection, nanoparticles, liposomes, peptide-mediated delivery, or a combination thereof, can be delivered or introduced into the subject.
  • the gRNA-CRISPR enzyme complexes disclosed herein can be used to artificially manipulate or modify a target gene, ie an immune participating gene.
  • the target gene can be engineered or modified using the gRNA-CRISPR enzyme complex described above, ie, the CRISPR complex.
  • manipulation or modification of the target gene includes both i) cleavage or damage of the target gene and ii) repair or repair of the damaged target gene.
  • Cleavage or damage of the target gene may be cleavage or damage of the target gene using the CRISPR complex, specifically, cleavage damage of the target sequence within the target gene.
  • the target sequence may be a target of a gRNA-CRISPR enzyme complex, and the target sequence may or may not include a PAM sequence recognized by the CRISPR enzyme.
  • target sequences can provide the operator with important criteria in the gRNA design stage.
  • the target sequence can be specifically recognized by the gRNA of the gRNA-CRISPR enzyme complex, whereby the gRNA-CRISPR enzyme complex can be located proximate to the recognized target sequence.
  • cleavage of the target site is meant the breakage of the covalent backbone of the polynucleotide. Cleavage includes, but is not limited to, enzymatic or chemical hydrolysis of phosphodiester bonds, and can be performed by a variety of other methods. Both cleavage of single strands and cleavage of double strands are possible, and cleavage of double strands can occur as a result of cleavage of two distinct single-strands. Double strand breaks can produce blunt ends or staggered ends (or sticky ends).
  • the cleavage or damage of the target gene using the CRISPR complex may be a double strand of the target sequence is cut or damaged.
  • the CRISPR complex may cleave both double strands of the target sequence that complementarily bind the gRNA.
  • each CRISPR complex can each cleave two single strands of the target sequence that complementarily bind to the gRNA. That is, the complementary single strand of the target sequence complementary to the gRNA is cleaved by SpCas9 kinase (D10A), and the non-complementary single strand of the target sequence complementary to the gRNA is cleaved by SpCas9 kinase (H840A). Each cleavage can occur sequentially or simultaneously.
  • the cleavage or damage of the target gene or nucleic acid using the CRISPR complex may be a cleavage or damage of only a single strand of the double strand of the target sequence.
  • the single strand may be a guide nucleic acid binding sequence of the target sequence that complementarily binds to the gRNA, that is, complementary single strand, or a guide nucleic acid non-binding sequence that does not complementarily bind to the gRNA, that is, non-complementary with gRNA. It may be single stranded.
  • the CRISPR complex is a guide nucleic acid binding sequence of the target sequence that complements the gRNA, that is, the complementary single strand is cleaved by SpCas9 kinase (D10A).
  • the non-complementary guide nucleic acid binding sequence of the target sequence ie, the gRNA and the non-complementary single strand, may not be cleaved.
  • the CRISPR complex is a guide nucleic acid non-binding sequence of the target sequence that does not complementally bind gRNA, i.e., the gRNA and non-complementary single strands are SpCas9 kinase.
  • the guide nucleic acid binding sequence of the target sequence that is cleaved by (H840A) and complementarily binds to the gRNA, ie, the complementary single strand, may not be cleaved.
  • cutting or damaging the target gene or nucleic acid using the CRISPR complex may be to remove some nucleic acid fragments (fragment).
  • the double strand of the target sequence that complementarily binds to the first gRNA is cleaved, and Nucleic acid fragments can be removed by the first gRNA, the second gRNA, and the SpCas9 by cleaving the double strand of the target sequence that complementarily binds the 2 gRNA.
  • NHEJ non-homologous end-binding
  • HDR homologous recombination repair
  • the non-homologous end joining is a method of repairing or repairing double strand breaks in DNA by joining both ends of a truncated double strand or single strand together.
  • the broken double strand is repaired when the two suitable ends formed by the breakage (e.g., cleavage) of the are repeated frequent contacts so that the two ends are fully joined.
  • NHEJ is a possible repair method in all cell cycles and occurs when there are no homologous genomes to use as templates in cells, mainly during the G1 phase.
  • Indel mutations produced by NHEJ are unpredictable in nature, but certain indel sequences are preferred at a given site of damage, possibly due to small regions of microhomology. Typically deletion lengths range from 1 bp to 50 bp, and insertions tend to be shorter and often include short overlapping sequences that immediately surround the site of breakage.
  • NHEJ is a process of causing mutations and can be used to delete motifs of small sequences when the generation of specific final sequences is not required.
  • the CRISPR enzyme eg, Cas9 or Cpf1
  • the CRISPR enzyme is used to cleave the double strand or two single strands of the target gene or nucleic acid, and the double strand or two single strands of the broken target gene or nucleic acid are deleted by NHEJ. Generated, thereby inducing specific knockout of a target gene or nucleic acid.
  • the position of the target gene or nucleic acid cleaved by the CRISPR enzyme may be a non-coding region or a coding region
  • the location of the target gene or nucleic acid to be repaired by NHEJ may be a non-coding region or a coding region.
  • indels insertion and deletion
  • a variety of indels may occur at a repair site by cutting a double strand of a target gene using a CRISPR complex and repairing by NHEJ.
  • Index refers to a variation in which some nucleotides are inserted or deleted in the nucleotide sequence of DNA. Indel may be introduced into the target sequence in the process of repair by the HDR or NHEJ mechanism when the gRNA-CRISPR enzyme complex cleaves the nucleic acid (DNA, RNA) of the immune participating factor as described above.
  • the homology directed repair is a method that can be corrected without error by using a homologous sequence as a template to repair or repair a damaged gene or nucleic acid, and generally repairs damaged DNA. Or repairs or repairs broken DNA using information from unmodified complementary nucleotide sequences or from sibling chromosomes to repair, ie, to restore the original information the cell has.
  • the most common form of HDR is homologous recombination (HR). HDR is a repair or repair method that usually occurs at the S or G2 / M stages of actively dividing cells.
  • an artificially synthesized DNA template using complementary nucleotide sequence or homologous nucleotide sequence information ie, complementary Nucleic acid templates comprising an nucleotide sequence or homologous nucleotide sequence may be provided to a cell to repair or repair broken DNA.
  • complementary Nucleic acid templates comprising an nucleotide sequence or homologous nucleotide sequence
  • the nucleic acid sequence or nucleic acid manipulation additionally included in the broken DNA may be inserted (Knock-In).
  • the nucleic acid sequence or nucleic acid fragment further included may be, but is not limited to, a nucleic acid sequence or nucleic acid fragment for correcting a modified target gene or nucleic acid of a mutation to a normal gene or nucleic acid, or a gene or nucleic acid desired for expression in a cell. .
  • a CRISPR complex is used to cleave a double strand or a single strand of a target gene or nucleic acid, and provide a cell with a nucleic acid template comprising a nucleotide sequence complementary to a nucleotide sequence proximate the cleavage site to cleave the target gene or nucleic acid.
  • Nucleotide sequences can be repaired or repaired by the HDR method.
  • nucleic acid template comprising the complementary nucleotide sequence has a broken DNA, ie, a truncated double- or single-stranded complementary nucleotide sequence, and further comprises a nucleic acid sequence or nucleic acid fragment desired to be inserted into the broken DNA.
  • additional nucleic acid sequences or nucleic acid fragments can be inserted at the cleaved position of the broken DNA, ie, the target gene or nucleic acid, using a nucleic acid template comprising the complementary nucleotide sequence and the nucleic acid sequence or nucleic acid fragment to be inserted.
  • the nucleic acid sequence or nucleic acid fragment to be inserted and the additional nucleic acid sequence or nucleic acid fragment are nucleic acid sequences or nucleic acid fragments for correcting a modified target gene or nucleic acid of a mutation to a normal gene or nucleic acid, or a gene to be expressed in a cell or Nucleic acids.
  • the complementary nucleotide sequence may be a damaged DNA, that is, a nucleotide sequence complementary to a nucleotide sequence on the right and left sides of a truncated double strand or single strand of a target gene or nucleic acid.
  • the complementary nucleotide sequence may be a damaged DNA, that is, a nucleotide sequence complementary to the 3 'and 5' ends of a truncated double strand or single strand of a target gene or nucleic acid.
  • the complementary nucleotide sequence may be 15 to 3000 nucleotide sequences, and the length or size of the complementary nucleotide sequence may be appropriately designed depending on the size of the nucleic acid template or the target gene or nucleic acid.
  • the nucleic acid template may be a double stranded or single stranded nucleic acid, and may be linear or circular, but is not limited thereto.
  • a CRISPR complex is used to cleave a double strand or a single strand of a target gene or nucleic acid, and to provide a cell with a nucleic acid template comprising a nucleotide sequence homologous to a cleavage site and a homologous nucleotide sequence to cleave the target gene or nucleic acid. Nucleotide sequences can be repaired or repaired by the HDR method.
  • the nucleic acid template comprising the homologous nucleotide sequence has a broken DNA, ie, a truncated double-stranded or single-stranded homologous nucleotide sequence, and further includes a nucleic acid sequence or nucleic acid fragment to be inserted into the broken DNA.
  • additional nucleic acid sequences or nucleic acid fragments can be inserted at the cleaved position of the broken DNA, ie, the target gene or nucleic acid, using a nucleic acid template including the homologous nucleotide sequence and the nucleic acid sequence or nucleic acid fragment to be inserted.
  • the nucleic acid sequence or nucleic acid fragment to be inserted and the additional nucleic acid sequence or nucleic acid fragment are nucleic acid sequences or nucleic acid fragments for correcting a modified target gene or nucleic acid of a mutation to a normal gene or nucleic acid, or a gene to be expressed in a cell or Nucleic acids.
  • the homologous nucleotide sequence may be a broken DNA, that is, a nucleotide sequence having homology with the nucleotide sequence on the right and left sides of the truncated double strand or single strand of the target gene or nucleic acid.
  • the complementary nucleotide sequence may be a broken DNA, that is, a nucleotide sequence having homology with the 3 'and 5' ends of a truncated double strand or single strand of a target gene or nucleic acid.
  • the homologous nucleotide sequence may be 15 to 3000 nucleotide sequences, and the length or size of the homologous nucleotide sequence may be appropriately designed depending on the size of the nucleic acid template or the target gene or nucleic acid.
  • the nucleic acid template may be a double stranded or single stranded nucleic acid, and may be linear or circular, but is not limited thereto.
  • a method of repairing or repairing a damaged target gene can be a method using single strand annealing, single strand break repair, mismatch repair, nucleotide cleavage repair or nucleotide cleavage repair.
  • Single-strand annealing is a method of repairing double strand breaks between two repeat sequences present in a target nucleic acid, and in general, repeat sequences of more than 30 nucleotide sequences can be used. .
  • each single strand has a repeat sequence with respect to the double strand of the target nucleic acid (to be a sticky end), and after the cleavage, the single strand overhang containing the repeat sequence improperly repeats the repeat sequence itself.
  • RAD52 binds to each repeat sequence on the overhang and aligns the sequences to allow annealing of the complementary repeat sequences.
  • the single stranded flaps of the protrusions are cleaved and new DNA synthesis recovers DNA double strands while filling any gaps.
  • the DNA sequence between the two repeats is deleted, and the deletion length may depend on a number of factors including the location of the two repeats used and the cutting path or progression.
  • SSA uses complementary sequences, ie, complementary repeat sequences, similarly to the HDR approach, and in contrast does not require nucleic acid templates to alter or modify the target nucleic acid sequence.
  • Single strand breaks in the genome can be repaired or repaired through single-strand break repair (SSBA), a mechanism separate from the repair mechanisms discussed above.
  • SSBA single-strand break repair
  • PARP1 and / or PARP2 recognize the break and mobilize repair mechanisms.
  • PARP1 binding and activity is transient in DAN breakdown, and SSBR is promoted by promoting stability of the SSBR protein complex in the damaged area.
  • the most important protein in the SSBR complex is XRCC1, which interacts with and stabilizes proteins that promote 3 'and 5' end processing of DNA. End processing typically involves restoring the damaged 3 'end to the hydroxylated state and / or the 5' end to a phosphate moiety, and when the end is processed, a DNA gap fill occurs.
  • DNA gap filling DNA ligase promotes terminal binding.
  • MMR mismatch repair
  • MSH2 / 6 or MSH2 / 3 complexes have ATP degrading enzyme activity, which plays an important role in the initiation of mismatch recognition and repair, and MSH2 / 6 preferentially recognizes nucleotide-nucleotide mismatches, one or two While identifying mismatches of nucleotides, MSH2 / 3 recognizes larger mismatches preferentially.
  • the nucleotide excision repair is active throughout the cell cycle and is a repair method used to remove small non-helix-twisted nucleotide damage from the genome.
  • Damaged DNA cleaves the damaged nucleotides by cleaving N-glycoside linkages that link nucleotides to the sugar phosphorylated backbone, followed by cleavage of the phosphodiester backbone to create DNA single strand breaks.
  • the damaged single-strand ends thus formed are removed, and the gap created by the removed single strand is filled with new complementary nucleotides, and the complementary nucleotide ends newly filled with DNA ligase are combined with the backbone to repair or repair the damaged DNA.
  • NER Nucleotide excision repair
  • the artificial manipulation effect of the target gene, ie, the immune participating gene, by the gRNA-CRISPR enzyme complex may be largely knockout, knockdown, and knockin.
  • Knockout means inactivating a target gene or nucleic acid, and "inactivation of a target gene or nucleic acid” means a condition in which transcription and / or translation of the target gene or nucleic acid is not possible. Knockout can prevent the expression of proteins by inhibiting the transcription and translation of disease-causing genes or genes with abnormal functions.
  • the CRISPR complex when editing or correcting a target gene or chromosome using a gRNA-CRISPR enzyme complex, ie, a CRISPR complex, the CRISPR complex may be used to cleave the target gene or chromosome. Damaged target genes or chromosomes using the CRISPR complex can be repaired by damaged genes or chromosomes via NHEJ. Broken target genes or chromosomes are produced by NHEJ, which can induce specific knockout of the target genes or chromosomes.
  • the CRISPR complex when editing and correcting a target gene or chromosome using a gRNA-CRISPR enzyme complex, ie, a CRISPR complex and a donor, the CRISPR complex can be used to cleave the target gene or nucleic acid.
  • Target genes or nucleic acids damaged using the CRISPR complex can be repaired via HDR using a donor.
  • the donor then comprises a homologous nucleotide sequence and the nucleotide sequence desired to be inserted.
  • the number of nucleotide sequences to be inserted can be variously adjusted according to the insertion position or purpose.
  • the nucleotide sequence desired to be inserted at the damaged nucleotide sequence site is inserted, which can induce specific knockout of the target gene or chromosome.
  • Knockdown means reducing the transcription and / or translation of a target gene or nucleic acid or decreasing the expression of a target protein. Knockdown can regulate the expression of genes or proteins that are overexpressed, preventing disease from occurring or treating the disease.
  • the CRISPR inactive complex when editing or correcting a target gene or chromosome using a gRNA- CRISPR inactive enzyme-transcription inhibitory active domain complex, ie, a CRISPR inactive complex comprising a transcription inhibitory active domain, the CRISPR inactive complex may be a target gene or It specifically binds to a chromosome, and transcription of the target gene or chromosome is inhibited by a transcription inhibitory active domain included in the CRISPR inactive complex, thereby inducing knockdown in which expression of the gene or chromosome is inhibited.
  • a gRNA- CRISPR inactive enzyme-transcription inhibitory active domain complex ie, a CRISPR inactive complex comprising a transcription inhibitory active domain
  • the CRISPR inactive complex may be a target gene or It specifically binds to a chromosome, and transcription of the target gene or chromosome is inhibited by a transcription inhibitory active domain included in the CRISPR inactive complex,
  • the CRISPR complex when editing and correcting a target gene or chromosome using a gRNA-CRISPR enzyme complex, ie, a CRISPR complex, the CRISPR complex may cleave a promoter and / or enhancer site of the target gene or chromosome.
  • the gRNA may recognize a portion of the nucleotide sequence of the promoter and / or enhancer region of the target gene or chromosome as the target sequence. Damaged target genes or chromosomes using the CRISPR complex can be repaired by damaged genes or chromosomes via NHEJ. Broken target genes or chromosomes are produced by indels by NHEJ, which can induce specific knockdown of the target genes or chromosomes.
  • a damaged target gene or chromosome using the CRISPR complex can be repaired by the damaged gene or chromosome via HDR.
  • a damaged gene or chromosome is repaired using a donor, the nucleotide sequence desired to be inserted at the damaged nucleotide sequence site is inserted, which can induce specific knockdown of the target gene or chromosome.
  • “Knockin” means inserting a particular nucleic acid or gene into a target gene or nucleic acid, wherein “specific nucleic acid or gene” refers to the nucleic acid or gene to be inserted or desired to be expressed. Through knock-in, the mutant gene causing the disease may be corrected correctly, or the normal gene may be inserted to induce the expression of the normal gene and used to treat the disease.
  • knock-in may additionally require a donor.
  • the CRISPR complex when editing or correcting a target gene or nucleic acid using a gRNA-CRISPR enzyme complex, ie, a CRISPR complex and a donor, the CRISPR complex may be used to cleave the target gene or nucleic acid.
  • Target genes or nucleic acids that are damaged using the CRISPR complex can be repaired through the HDR using a donor.
  • the donor includes a specific nucleic acid or gene, and by using the donor, a specific nucleic acid or gene can be inserted into a damaged gene or chromosome. At this time, the inserted specific nucleic acid or gene can be induced by the expression of protein.
  • the gRNA-CRISPR enzyme complex may make artificial manipulations or modifications to the MYD88 gene and / or the C3 gene.
  • the gRNA-CRISPR enzyme complex may specifically recognize the target sequence of the MYD88 gene and / or the C3 gene.
  • the target sequence can be specifically recognized by the gRNA of the gRNA-CRISPR enzyme complex, whereby the gRNA-CRISPR enzyme complex can be located proximate to the recognized target sequence.
  • the target sequence may be a site or region where an artificial modification occurs to the MYD88 gene and / or the C3 gene.
  • the target sequence may be a continuous 10bp to 25bp nucleotide sequence located in the promoter region of the MYD88 gene and / or the C3 gene.
  • the target sequence may be a continuous 10bp to 25bp nucleotide sequence located in the intron region of the MYD88 gene and / or the C3 gene.
  • the target sequence may be a continuous 10bp to 25bp nucleotide sequence located in the exon region of the MYD88 gene and / or the C3 gene.
  • the target sequence may be a continuous 10bp to 25bp nucleotide sequence located in the enhancer region of the MYD88 gene and / or the C3 gene.
  • the target sequence may be a continuous 10bp to 25bp nucleotide sequence adjacent to the 5 'end and / or 3' end of the PAM (proto-spacer-adjacent Motif) sequence in the nucleic acid sequence of the MYD88 gene and / or the C3 gene.
  • PAM proto-spacer-adjacent Motif
  • the PAM sequence may be, for example, one or more of the following sequences (described in the 5 'to 3' direction).
  • N is A, T, C or G
  • N is each independently A, T, C or G, R is A or G and Y is C or T);
  • NNAGAAW N is each independently A, T, C or G, and W is A or T;
  • N are each independently A, T, C, or G;
  • NNGRR (T), wherein each N is independently A, T, C or G, and R is A or G;
  • TTN (N is A, T, C or G).
  • the target sequence may be one or more nucleotide sequences selected from the nucleotide sequences set forth in Tables 1, 2, 3, and 4.
  • the gRNA-CRISPR enzyme complex may be composed of gRNA and CRISPR enzyme.
  • the gRNA may comprise a guide domain capable of complementary binding to the guide nucleic acid binding sequence of the target sequence of the MYD88 gene and / or C3 gene.
  • the guide domain may be at least 70%, 75%, 80%, 85%, 90% or 95% complementary or completely complementary to the guide nucleic acid binding sequence.
  • the guide domain may comprise a nucleotide sequence complementary to the guide nucleic acid binding sequence of the target sequence of the MYD88 gene.
  • the complementary nucleotide sequence may include 0 to 5, 0 to 4, 0 to 3, 0 to 2 mismatching (mismatching).
  • the guide domain may comprise a nucleotide sequence complementary to the guide nucleic acid binding sequence of the target sequence of the C3 gene.
  • the complementary nucleotide sequence may include 0 to 5, 0 to 4, 0 to 3, 0 to 2 mismatching (mismatching).
  • the gRNA may comprise one or more domains selected from the group consisting of a first complementary domain, a linking domain, a second complementary domain, a proximal domain and a tail domain.
  • the CRISPR enzyme is a Cas9 protein derived from Streptococcus pyogenes, a Cas9 protein derived from Campylobacter jejuni, a Cas9 protein derived from Streptococcus thermophilus, and Staphylococcus aureus. It may be at least one selected from the group consisting of Cas9 protein from Staphylococcus aureus, Cas9 protein derived from Neisseria meningitidis, and Cpf1 protein.
  • the editor protein may be a Cas9 protein derived from Campylobacter jejuni or a Cas9 protein derived from Staphylococcus aureus.
  • the gRNA-CRISPR enzyme complex may add various artificial manipulations or modifications to the MYD88 gene and / or the C3 gene, depending on the type of gRNA and CRISPR enzyme.

Abstract

본 발명은 인위적인 면역 기능조절을 위해 세포의 게놈 내 존재하는 면역 참여 유전자를 인위적으로 조작하기 위한 유전자 조작용 조성물에 관한 것이다. 보다 구체적으로, 면역 참여 유전자를 표적화할 수 있는 가이드핵산 및 에디터 단백질을 포함하는 유전자 조작용 조성물에 관한 것이다. 또한 면역 참여 유전자를 인위적으로 조작하기 위한 유전자 조작용 조성물을 이용하여 면역 기능이상 질환을 치료 또는 개선하는 방법에 관한 것이다.

Description

[규칙 제26조에 의한 보정 26.08.2019] 인위적인 유전자 조작을 통한 자가면역질환 치료
본 발명은 면역 기능조절을 위한, 면역 참여 유전자의 인위적 조작 또는 변형에 관한 것이다. 보다 구체적으로, 면역 반응을 조절하기 위한 면역 참여 유전자를 인위적으로 조작할 수 있는 조성물을 포함하는, 인위적으로 면역 반응 또는 기능을 조절할 수 있는 시스템에 관한 것이다.
자가면역질환(autoimmune disease)은 인체 내부의 면역계가 외부 항원이 아닌 내부의 정상세포를 공격하여 생기는 질병으로, 그 원인은 아직 명확하게 밝혀지지 않았다. 선천성으로 유전 질환일 가능성이 많다. 스트레스나 생활습관 같은 환경적인 요인에 의해 악화된다고 하나 확실하진 않다. 성인 여성에게 가장 흔하다고는 하나 사실상 남녀노소 불문하고 나타난다.
자가면역질환은 원인이 밝혀지지 않은 만큼 완치법 없이 대증치료가 발달했으며 당연히 이론상 예방법도 없다. 그저 추측상 스트레스나 호르몬 또는 잘못된 생활습관이 원인일 것으로 여겨지고 있다. 자가면연질환은 그 종류만 해도 100가지가 넘는다고 알려져 있고, 가장 대표적인 자가면역질환의 예는 류마티스 관절염이 있으며, 안구에서 발생하는 자가면역질환으로는 포도막염, 베체트병, 쇼그렌 증후군 등이 있다.
그 중에서 포도막염(Uveitis)은 1000~5000명당 1명꼴로 환자가 발생되며 치료 후에도 환자 중 10%이상이 실명의 위험이 있고, 전체 실명환자의 원인 중에서 3번째(약 20%)에 해당할 만큼 위험성이 큰 질환임에도 불구하고 항염증제인 corticosteroid 외에는 특별한 치료제가 전무한 상태이다.
따라서, 유전자 교정을 이용해 염증유발 유전자의 발현을 근본적으로 녹아웃 시킬 수 있는, 한 번의 처치로 장기적 또는 영구적인 효과를 기대할 수 있는 치료제 개발이 필요한 실정이다.
본 발명의 일 구체예로서 유전자 조작용 조성물을 제공하고자 한다.
본 발명의 일 구체예로서 면역 참여 유전자를 표적할 수 있는 가이드핵산을 제공하고자 한다.
본 발명의 일 구체예로서 면역 기능이상 질환을 치료하는 방법을 제공하고자 한다.
상기 과제를 해결하기 위하여, 본 발명은 인위적인 면역 기능조절을 위해 세포의 게놈 내 존재하는 면역 참여 유전자를 인위적으로 조작하기 위한 유전자 조작용 조성물에 관한 것이다. 보다 구체적으로, 면역 참여 유전자를 표적화할 수 있는 가이드핵산 및 에디터 단백질을 포함하는 유전자 조작용 조성물에 관한 것이다. 또한 면역 참여 유전자를 인위적으로 조작하기 위한 유전자 조작용 조성물을 이용하여 면역 기능이상 질환을 치료 또는 개선하는 방법에 관한 것이다.
본 발명은 특정 목적을 위해 유전자 조작용 조성물을 제공한다.
구현예에서, 상기 유전자 조작용 조성물은
면역 참여 유전자(immune participation gene) 내에 위치하는 표적 서열과 상보적인 결합을 형성하는 가이드 서열을 포함하는 가이드핵산 또는 이를 암호화하는 핵산 서열; 및
에디터단백질 또는 이를 암호화하는 핵산 서열
을 포함할 수 있다.
상기 면역 참여 유전자는 Death 도메인을 포함하는 단백질을 암호화하는 유전자일 수 있다.
이때, 상기 Death 도메인을 포함하는 단백질은 TNF receptor, ankyrin, MyD88 또는 IRAK family 단백질일 수 있다.
상기 면역 참여 유전자는 Toll/interleukin-1 receptor(TIR) 도메인을 포함하는 단백질을 암호화하는 유전자일 수 있다.
이때, 상기 Toll/interleukin-1 receptor(TIR) 도메인을 포함하는 단백질은 MyD88, interleukin-1 receptor, Toll receptor 또는 Toll like receptor 단백질일 수 있다.
상기 면역 참여 유전자는 Complement component 단백질을 암호화하는 유전자일 수 있다.
이때, 상기 Complement component 단백질은 C1, C2, C3, C4, C5, C6, C7, C8 또는 C9 단백질일 수 있다.
일 구체예에서, 상기 면역 참여 유전자는 MYD88 유전자일 수 있다.
일 구체예에서, 상기 면역 참여 유전자는 C3 유전자일 수 있다.
상기 표적 서열은 면역 참여 유전자의 exon에 위치할 수 있다.
상기 표적 서열은 SEQ ID NO: 19 내지 SEQ ID NO: 416 중 선택된 하나 이상의 서열일 수 있다.
상기 표적 서열은 SEQ ID NO: 21, 22, 25, 26, 29, 35, 36, 37, 38, 39, 40, 155, 157, 158, 159, 161, 171, 172, 177, 178, 181, 183, 184, 185, 186 및 188 중 선택된 하나 이상의 서열일 수 있다.
상기 표적 서열은 SEQ ID NO: 49, 51, 52, 64, 65, 71, 78, 90, 95, 96, 100, 102, 103, 105, 109, 112, 114, 115, 116, 117, 118, 119, 120, 121, 211, 212, 243, 244, 245, 262, 263, 264, 274, 284, 285, 286, 312, 313, 314, 315 및 316 중 선택된 하나 이상의 서열일 수 있다.
상기 가이드 서열은 SEQ ID NO: 417 내지 SEQ ID NO: 814 중 선택된 하나 이상의 서열일 수 있다.
상기 가이드 서열은 SEQ ID NO: 419, 420, 423, 424, 427, 433, 434, 435, 436, 437, 438, 553, 555, 556, 557, 559, 569, 570, 575, 576, 579, 581, 582, 583, 584 및 586 중 선택된 하나 이상의 서열일 수 있다.
상기 가이드 서열은 SEQ ID NO: 447, 449, 450, 462, 463, 469, 476, 488, 493, 494, 498, 500, 501, 503, 507, 510, 512, 513, 514, 515, 516, 517, 518, 519, 609, 610, 641, 642, 643, 660, 661, 662, 672, 682, 683, 684, 710, 711, 712, 713 및 714 중 선택된 하나 이상의 서열일 수 있다.
상기 가이드 서열은 MYD88 유전자의 exon 1, exon 2, exon 3, exon 4 또는 exon 5에 위치하는 표적 서열과 상보적인 결합을 형성할 수 있다.
상기 가이드 서열은 C3 유전자의 exon 3, exon 4, exon 6, exon 7, exon 10, exon 11, exon 13, exon 15, exon 16, exon 17, exon 20, exon 21, exon 22, exon 23, exon 25, exon 26, exon 28, exon 29 또는 exon 30에 위치하는 표적 서열과 상보적인 결합을 형성할 수 있다.
상기 상보적인 결합은 0 내지 5개의 미스매칭을 포함하는 결합일 수 있다.
상기 가이드핵산은 가이드 도메인은 포함할 수 있다.
이때, 상기 가이드 서열은 상기 가이드 도메인에 포함될 수 있다.
상기 가이드핵산은 제 1 상보적 도메인, 제 2 상보적 도메인, 연결 도메인, 근위 도메인 및 꼬리 도메인인 중 적어도 하나 이상의 도메인은 포함할 수 있다.
상기 에디터단백질은 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophilus) 유래의 Cas9 단백질, 스타필로코커스 아우레우스 (Staphylococcus aureus) 유래의 Cas9 단백질, 네이세리아 메닝기티디스 (Neisseria meningitidis)유래의 Cas9 단백질, 및 Cpf1 단백질로 이루어진 군에서 선택된 하나 이상일 수 있다.
일 구체예에서, 상기 에디터단백질은 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질 또는 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질일 수 있다.
상기 유전자 조작용 조성물은 가이드핵산 및 에디터단백질이 각각 핵산 서열의 형태로 1 이상의 플라스미드 또는 1 이상의 바이러스 벡터에 존재할 수 있다.
이때, 상기 바이러스 벡터는 레트로바이러스 벡터, 렌티바이러스 벡터, 아데노바이러스 벡터, 아데노-연관 바이러스(AAV) 벡터, 백시니아바이러스 벡터, 폭스바이러스 벡터 및 단순포진 바이러스 벡터로 구성된 군에서 선택된 하나 이상일 수 있다.
상기 유전자 조작용 조성물은 가이드핵산과 에디터단백질이 결합한 가이드핵산-에디터단백질 복합체 형태일 수 있다.
이때, 상기 가이드핵산은 guide RNA(gRNA)일 수 있다.
또한, 본 발명은 특정 목적을 위해 면역 참여 유전자를 표적할 수 있는 가이드핵산을 제공한다.
일 구현예에서, 상기 가이드핵산은 면역 참여 유전자(immune participation gene) 내에 위치하는 표적 서열과 상보적인 결합을 형성하는 가이드 서열을 포함할 수 있다.
상기 면역 참여 유전자는 MYD88 유전자 또는 C3 유전자일 수 있다.
상기 가이드 서열은 SEQ ID NO: 417 내지 SEQ ID NO: 814로 구성되 서열들 중 선택된 하나 이상의 서열일 수 있다.
상기 상보적인 결합은 0 내지 5개의 미스매칭을 포함하는 결합일 수 있다.
상기 가이드핵산은 에디터단백질과 복합체를 형성할 수 있다.
일 구체예에서, 상기 가이드 서열은 SEQ ID NO: 419, 420, 423, 424, 427, 433, 434, 435, 436, 437, 438, 553, 555, 556, 557, 559, 569, 570, 575, 576, 579, 581, 582, 583, 584 및 586 중 선택된 하나 이상의 서열일 수 있다.
일 구체예에서, 상기 가이드 서열은 SEQ ID NO: 447, 449, 450, 462, 463, 469, 476, 488, 493, 494, 498, 500, 501, 503, 507, 510, 512, 513, 514, 515, 516, 517, 518, 519, 609, 610, 641, 642, 643, 660, 661, 662, 672, 682, 683, 684, 710, 711, 712, 713 및 714 중 선택된 하나 이상의 서열일 수 있다.
상기 가이드 서열은 MYD88 유전자의 exon 1, exon 2, exon 3, exon 4 또는 exon 5에 위치하는 표적 서열과 상보적인 결합을 형성할 수 있다.
상기 가이드 서열은 C3 유전자의 exon 3, exon 4, exon 6, exon 7, exon 10, exon 11, exon 13, exon 15, exon 16, exon 17, exon 20, exon 21, exon 22, exon 23, exon 25, exon 26, exon 28, exon 29 또는 exon 30에 위치하는 표적 서열과 상보적인 결합을 형성할 수 있다.
상기 가이드핵산은 가이드 도메인은 포함할 수 있다.
이때, 상기 가이드 서열은 상기 가이드 도메인에 포함될 수 있다.
상기 가이드핵산은 제 1 상보적 도메인, 제 2 상보적 도메인, 연결 도메인, 근위 도메인 및 꼬리 도메인인 중 적어도 하나 이상의 도메인은 포함할 수 있다.
본 발명은 포도막염(Uveitis)을 치료하기 위해 치료 대상에 유전자 조작용 조성물을 투여(도입)하는 단계를 포함하는, 포도막염(Uveitis)을 치료하는 방법을 제공한다.
일 구현예에서, 포도막염(Uveitis)을 치료하는 방법은 유전자 조작용 조성물을 치료 대상에 도입(투여)하는 단계를 포함할 수 있다.
상기 유전자 조작용 조성물은
면역 참여 유전자(immune participation gene) 내에 위치하는 표적 서열과 상보적인 결합을 형성하는 가이드 서열을 포함하는 가이드핵산 또는 이를 암호화하는 핵산 서열; 및
에디터단백질 또는 이를 암호화하는 핵산 서열
을 포함할 수 있다.
상기 면역 참여 유전자는 MYD88 유전자 또는 C3 유전자일 수 있다.
상기 가이드 서열은 SEQ ID NO: 417 내지 SEQ ID NO: 814로 구성된 서열들 중 선택된 하나 이상의 서열일 수 있다.
상기 상보적인 결합은 0 내지 5개의 미스매칭을 포함하는 결합일 수 있다.
일 구체예에서, 상기 가이드 서열은 SEQ ID NO: 419, 420, 423, 424, 427, 433, 434, 435, 436, 437, 438, 553, 555, 556, 557, 559, 569, 570, 575, 576, 579, 581, 582, 583, 584 및 586 중 선택된 하나 이상의 서열일 수 있다.
일 구체예에서, 상기 가이드 서열은 SEQ ID NO: 447, 449, 450, 462, 463, 469, 476, 488, 493, 494, 498, 500, 501, 503, 507, 510, 512, 513, 514, 515, 516, 517, 518, 519, 609, 610, 641, 642, 643, 660, 661, 662, 672, 682, 683, 684, 710, 711, 712, 713 및 714 중 선택된 하나 이상의 서열일 수 있다.
상기 가이드 서열은 MYD88 유전자의 exon 1, exon 2, exon 3, exon 4 또는 exon 5에 위치하는 표적 서열과 상보적인 결합을 형성할 수 있다.
상기 가이드 서열은 C3 유전자의 exon 3, exon 4, exon 6, exon 7, exon 10, exon 11, exon 13, exon 15, exon 16, exon 17, exon 20, exon 21, exon 22, exon 23, exon 25, exon 26, exon 28, exon 29 또는 exon 30에 위치하는 표적 서열과 상보적인 결합을 형성할 수 있다.
상기 에디터단백질은 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophilus) 유래의 Cas9 단백질, 스타필로코커스 아우레우스 (Staphylococcus aureus) 유래의 Cas9 단백질, 네이세리아 메닝기티디스 (Neisseria meningitidis)유래의 Cas9 단백질, 및 Cpf1 단백질로 이루어진 군에서 선택된 하나 이상일 수 있다.
일 구체예에서, 상기 에디터단백질은 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 스타필로코커스 아우레우스 (Staphylococcus aureus) 유래의 Cas9 단백질 또는 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질일 수 있다.
상기 유전자 조작용 조성물은 플라스미드 또는 바이러스 벡터 형태일 수 있다.
이때, 상기 바이러스 벡터는 레트로바이러스 벡터, 렌티바이러스 벡터, 아데노바이러스 벡터, 아데노-연관 바이러스(AAV) 벡터, 백시니아바이러스 벡터, 폭스바이러스 벡터 및 단순포진 바이러스 벡터로 구성된 군에서 선택된 하나 이상일 수 있다.
상기 가이드 핵산 및 에디터 단백질은 각각 핵산 서열의 형태로 1 이상의 벡터에 존재할 수 있다.
상기 유전자 조작용 조성물은 가이드핵산과 에디터단백질이 결합한 가이드핵산-에디터단백질 복합체 형태일 수 있다.
이때, 상기 가이드핵산은 guide RNA(gRNA)일 수 있다.
이때, 상기 가이드핵산-에디터단백질 복합체는 가이드핵산의 일부 뉴클레오타이드 서열과 에디터단백질의 일부 아미노산이 상호작용하여 형성된 것일 수 있다.
상기 유전자 조작용 조성물은 삽입을 원하는 핵산서열을 포함하는 도너 또는 이를 암호화하는 핵산서열을 선택적으로 더 포함할 수 있다.
상기 가이드 핵산 및 에디터 단백질, 및/또는 도너는, 각각 핵산 서열의 형태로 1 이상의 벡터에 존재할 수 있다.
이때, 상기 벡터는 플라스미드 또는 바이러스벡터일 수 잇다.
이때, 상기 상기 바이러스 벡터는 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스(AAV), 백시니아바이러스, 폭스바이러스 및 단순포진 바이러스로 구성된 군에서 선택되는 1이상일 수 있다.
상기 치료 대상은 인간, 원숭이 등의 영장류, 마우스, 래트 등의 설치류 등을 포함하는 포유동물일 수 있다.
상기 유전자 조작용 조성물은 치료 대상에 투여(도입)될 수 있다.
상기 유전자 조작용 조성물은 치료 대상의 특정 신체 위치에 투여(도입)될 수 있다.
상기 특정 신체 위치는 기능이 비정상적인 홍채, 모양체, 맥락막, 망막 또는 이와 상호작용할 수 있는 및/또는 근접한 조직(위치)일 수 있다. 예를 들어, 홍채, 모양체, 맥락막 및/또는 안구일 수 있다.
상기 투여(도입)는 주사(injection), 수혈(transfusion), 삽입(implantation) 또는 이식(transplantation)으로 수행될 수 있다.
상기 투여(도입)는 망막하(subretinal), 피하(subcutaneously), 피내(intradermaliy), 안구내(intraocularly), 유리체내(intravitreally) 종양내(intratumorally), 절내(intranodally), 골수내(intramedullary), 근육내(intramuscularly), 정맥내(intravenous), 림프액내(intralymphatic) 또는 복막내(intraperitoneally)에서 선택된 투여 경로로 수행될 수 있다.
본 발명은 유전자 조작용 조성물을 통해 면역 참여 유전자의 기능 및/또는 발현을 조절할 수 있다. 보다 구체적으로, 면역 참여 유전자를 표적화하는 가이드핵산 및 에디터단백질을 포함하는 유전자 조작용 조성물을 이용해 면역 참여 유전자를 인위적으로 조작 및/또는 변형하여 면역 참여 유전자의 기능 및/또는 발현을 조절하여 인위적으로 면역 기능조절을 할 수 있도록 한다. 또한, 면역 참여 유전자를 인위적으로 조작하기 위한 유전자 조작용 조성물을 이용하여 면역 기능이상 질환을 개선 또는 치료할 수 있다.
도 1은 C3 유전자를 표적하는 gRNA 및 Cas9에 의한 Retina cell 및 RPE cell에서 온-타겟 및 오프-타겟의 인델(%)을 확인한 그래프로, Cas9의 종류에 따라 Cj(CjCas9) 또는 Sp(SpCas9)로 표시하였다.
도 2는 Myd88 유전자를 표적하는 gRNA 및 Cas9에 의한 Retina cell 및 RPE cell에서 온-타겟 및 오프-타겟의 인델(%)을 확인한 그래프로, Cas9의 종류에 따라 Cj(CjCas9) 또는 Sp(SpCas9)로 표시하였다.
달리 정의되지 않는 한, 본 명세서에서 사용되는 모든 기술적 및 과학적 용어는 본 발명이 속하는 기술분야의 당업자에 의해 통상적으로 이해되는 것과 동일한 의미를 가진다. 본 명세서에 기재된 것과 유사 또는 동일한 방법 및 물질이 본 발명의 실행 또는 시험에서 사용될 수 있지만, 적합한 방법 및 물질이 이하에 기재된다. 본 명세서에 언급된 모든 간행물, 특허 출원, 특허 및 기타 다른 참고문헌은 전체가 참고로 포함된다. 추가로, 물질, 방법 및 실시예는 단지 예시적이며, 제한하는 것으로 의도되지 않는다.
본 명세서에 의해 개시되는 내용의 일 태양은 가이드핵산에 관한 것이다.
“가이드핵산”은 표적 핵산, 유전자 또는 염색체를 인지하고, 및 에디터단백질과 상호작용할 수 있는 뉴클레오타이드 서열을 의미한다. 이때, 상기 가이드핵산은 표적 핵산, 유전자 또는 염색체 내의 일부 뉴클레오타이드 서열과 상보적인 결합할 수 있다. 또한 상기 가이드핵산의 일부 뉴클레오타이드 서열은 에디터단백질의 일부 아미노산과 상호작용하여 가이드핵산-에디터단백질 복합체를 형성할 수 있다.
상기 가이드핵산은 가이드핵산-에디터단백질 복합체가 표적 핵산, 유전자 또는 염색체의 표적 영역에 위치할 수 있도록 유도하는 기능을 수행할 수 있다.
상기 가이드핵산은 DNA, RNA 또는 DNA/RNA 혼합의 형태일 수 있고, 5 내지 150개의 핵산서열을 가질 수 있다.
상기 가이드핵산은 하나의 연속된 핵산서열일 수 있다.
예를 들어, 하나의 연속된 핵산 서열은 (N)m 일 수 있고, 이때 N은 A, T, C 또는 G, 또는 A, U, C 또는 G이며, m은 1 내지 150의 정수를 의미한다.
상기 가이드핵산은 연속된 핵산서열이 두 개 이상일 수 있다.
예를 들어, 두 개 이상의 연속된 핵산서열은 (N)m과 (N)o 일 수 있고, 이때 N은 A, T, C 또는 G, 또는 A, U, C 또는 G이며, m 및 o는 1 내지 150의 정수를 의미하며, m과 o는 서로 같거나 다를 수 있다.
상기 가이드핵산은 하나 이상의 도메인을 포함할 수 있다.
상기 도메인은 가이드 도메인, 제 1 상보적 도메인, 연결 도메인, 제 2 상보적 도메인, 근위 도메인, 꼬리도메인 등의 기능적 도메인일 수 있으며, 이에 제한되지 않는다.
이때, 하나의 가이드핵산은 2 이상의 기능적 도메인을 가질 수 있다. 이때, 상기 2 이상의 기능적 도메인은 서로 상이할 수 있다. 또는 하나의 가이드핵산에 포함된 2 이상의 기능적 도메인은 서로 동일할 수도 있다. 예를 들어, 하나의 가이드핵산은 2 이상의 근위 도메인을 가질 수 있고, 다른 예를 들어, 하나의 가이드핵산은 2 이상의 꼬리도메인을 가질 수 있다. 다만, 하나의 가이드핵산에 포함되어 있는 기능적 도메인이 서로 동일한 도메인이라는 말은 두 기능적 도메인의 시퀀스가 동일하다는 의미는 아니며, 시퀀스가 상이하여도 기능적으로 동일한 기능을 수행하고 있으면 동일한 도메인이라고 할 수 있다.
기능적 도메인에 대해서 이하에서 구체적으로 설명한다.
i) 가이드 도메인
"가이드 도메인"은 표적 유전자 또는 핵산의 이중 가닥 중 어느 하나 가닥의 일부 서열에 상보적인 결합을 할 수 있는 도메인으로, 표적 유전자 또는 핵산과의 특이적인 상호작용을 위해 역할한다. 예를 들어, 가이드 도메인은 표적 유전자 또는 핵산의 특정 뉴클레오타이드 서열을 가지는 위치로 가이드핵산-에디터단백질 복합체를 유도하는 기능을 수행할 수 있다.
상기 가이드 도메인은 10 내지 35개의 뉴클레오타이드 서열일 수 있다.
일 예로, 상기 가이드 도메인은 10 내지 35개의 뉴클레오타이드 서열, 15 내지 35개의 뉴클레오타이드 서열, 20 내지 35개의 뉴클레오타이드 서열, 25 내지 35개의 뉴클레오타이드 서열 또는 30 내지 35개의 뉴클레오타이드 서열일 수 있다.
다른 일 예로, 상기 가이드 도메인은 10 내지 15개의 뉴클레오타이드 서열, 15 내지 20개의 뉴클레오타이드 서열, 20 내지 25개의 뉴클레오타이드 서열, 25 내지 30개의 뉴클레오타이드 서열 또는 30 내지 35개의 뉴클레오타이드 서열일 수 있다.
상기 가이드 도메인은 가이드 서열을 포함할 수 있다.
“가이드 서열”은 표적 유전자 또는 핵산의 이중 가닥 중 어느 하나 가닥의 일부 서열에 상보적인 뉴클레오타이드 서열이며, 이때 상기 가이드 서열은 최소한 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상보성을 가지거나 또는 완전한 상보성을 가지는 뉴클레오타이드 서열일 수 있다.
상기 가이드 서열은 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
일 예로, 상기 가이드 서열은 10 내지 25개의 뉴클레오타이드 서열, 15 내지 25개의 뉴클레오타이드 서열 또는 20 내지 25개의 뉴클레오타이드 서열일 수 있다.
다른 일 예로, 상기 가이드 서열은 10 내지 15개의 뉴클레오타이드 서열, 15 내지 20개의 뉴클레오타이드 서열 또는 20 내지 25개의 뉴클레오타이드 서열일 수 있다.
또한, 상기 가이드 도메인은 추가 뉴클레오타이드 서열을 더 포함할 수 있다.
상기 추가 뉴클레오타이드 서열은 가이드 도메인의 기능 향상 또는 저하를 위한 것일 수 있다.
상기 추가 뉴클레오타이드 서열은 가이드 서열의 기능 향상 또는 저하를 위한 것일 수 있다.
상기 추가 뉴클레오타이드 서열은 1 내지 10개의 뉴클레오타이드 서열일 수 있다.
일 예로, 상기 추가 뉴클레오타이드 서열은 2내지 10개의 뉴클레오타이드 서열, 4 내지 10개의 뉴클레오타이드 서열, 6 내지 10개의 뉴클레오타이드 서열 또는 8 내지 10개의 뉴클레오타이드 서열일 수 있다.
다른 일 예로, 상기 추가 뉴클레오타이드 서열은 1 내지 3개의 뉴클레오타이드 서열, 3 내지 6개의 뉴클레오타이드 서열 또는 7 내지 10개의 뉴클레오타이드 서열일 수 있다.
일 구체예로서, 상기 추가 뉴클레오타이드 서열은 1개의 뉴클레오타이드 서열, 2개의 뉴클레오타이드 서열, 3개의 뉴클레오타이드 서열, 4개의 뉴클레오타이드 서열, 5개의 뉴클레오타이드 서열, 6개의 뉴클레오타이드 서열, 7개의 뉴클레오타이드 서열, 8개의 뉴클레오타이드 서열, 9개의 뉴클레오타이드 서열 또는 10개의 뉴클레오타이드 서열일 수 있다.
예를 들어, 상기 추가 뉴클레오타이드 서열은 1개의 뉴클레오타이드 서열 G(구아닌)일 수 있으며, 또는 2개의 뉴클레오타이드 서열 GG일 수 있다.
상기 추가 뉴클레오타이드 서열은 상기 가이드 서열의 5' 말단에 위치할 수 있다.
상기 추가 뉴클레오타이드 서열은 상기 가이드 서열의 3' 말단에 위치할 수 있다.
ii) 제 1 상보적 도메인
"제 1 상보적 도메인"은 이하에서 설명하는 제 2 상보적 도메인에 대해 상보적 뉴클레오타이드 서열을 포함하는 도메인으로, 제 2 상보적 도메인과 이중가닥을 형성할 수 있을 정도로 상보성을 가진다. 예를 들어, 제 1 상보적 도메인은 제 2 상보적 도메인에 대해 최소한 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상보성을 가지거나 또는 완전한 상보성을 가지는 뉴클레오타이드 서열일 수 있다.
상기 제 1 상보적 도메인은 제 2 상보적 도메인과 상보적 결합을 통해 이중가닥을 형성할 수 있다. 이때, 상기 형성된 이중가닥은 에디터단백질의 일부 아미노산과 상호작용하여 가이드핵산-에디터단백질 복합체를 형성하는 역할을 할 수 있다.
상기 제 1 상보적 도메인은 5 내지 35개의 뉴클레오타이드 서열일 수 있다.
일 예로, 제 1 상보적 도메인은 5 내지 35개의 뉴클레오타이드 서열, 10 내지 35개의 뉴클레오타이드 서열, 15 내지 35개의 뉴클레오타이드 서열, 20 내지 35개의 뉴클레오타이드 서열, 25 내지 35개의 뉴클레오타이드 서열 또는 30 내지 35개의 뉴클레오타이드 서열일 수 있다.
다른 일 예로서, 상기 제 1 상보적 도메인은 1 내지 5개의 뉴클레오타이드 서열, 5 내지 10개의 뉴클레오타이드 서열, 10 내지 15개의 뉴클레오타이드 서열, 15 내지 20개의 뉴클레오타이드 서열, 20 내지 25개의 뉴클레오타이드 서열, 25 내지 30개의 뉴클레오타이드 서열 또는 30 내지 35개의 뉴클레오타이드 서열일 수 있다.
iii) 연결 도메인
"연결 도메인"은 두 개 이상의 도메인을 연결하는 뉴클레오타이드 서열로, 연결 도메인은 동일한 또는 서로 다른 두 개 이상의 도메인을 연결한다. 연결 도메인은 두 개 이상의 도메인과 공유결합 또는 비공유결합을 할 수 있고, 또는 두 개 이상의 도메인을 공유적 또는 비공유적으로 연결할 수 있다.
상기 연결 도메인은 1 내지 30개의 뉴클레오타이드 서열일 수 있다.
일 예로서, 상기 연결 도메인은 1 내지 5개의 뉴클레오타이드 서열, 5 내지 10개의 뉴클레오타이드 서열, 10 내지 15개의 뉴클레오타이드 서열, 15 내지 20개의 뉴클레오타이드 서열, 20 내지 25개의 뉴클레오타이드 서열 또는 25 내지 30개의 뉴클레오타이드 서열일 수 있다.
다른 일 예로서, 상기 연결 도메인은 1 내지 30개의 뉴클레오타이드 서열, 5 내지 30개의 뉴클레오타이드 서열, 10 내지 30개의 뉴클레오타이드 서열, 15 내지 30개의 뉴클레오타이드 서열, 20 내지 30개의 뉴클레오타이드 서열 또는 25 내지 30개의 뉴클레오타이드 서열일 수 있다.
iv) 제 2 상보적 도메인
"제 2 상보적 도메인"은 전술한 제 1 상보적 도메인과 상보적 핵산서열을 포함하는 뉴클레오타이드 서열을 포함하는 도메인으로, 제 1 상보적 도메인과 이중가닥을 형성할 수 있을 정도로 상보성을 가진다. 예를 들어, 제 2 상보적 도메인은 제 1 상보적 도메인에 대해 최소한 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상보성을 가지거나 또는 완전한 상보성을 가지는 뉴클레오타이드 서열일 수 있다.
상기 제 2 상보적 도메인은 제 1 상보적 도메인과 상보적 결합을 통해 이중가닥을 형성할 수 있다. 이때, 상기 형성된 이중가닥은 에디터단백질의 일부 아미노산과 상호작용하여 가이드핵산-에디터단백질 복합체를 형성하는 역할을 할 수 있다.
제 2 상보적 도메인은 제 1 상보적 도메인과 상보적 뉴클레오타이드 서열 및 제 1 상보적 도메인과의 상보성이 없는 뉴클레오타이드 서열, 예를 들어, 제 1 상보적 도메인과 이중가닥을 형성하지 않는 뉴클레오타이드 서열을 포함할 수 있으며, 제 1 상보적 도메인보다 뉴클레오타이드 서열의 길이가 길 수 있다.
상기 제 2 상보적 도메인은 5 내지 35개의 뉴클레오타이드 서열일 수 있다.
일 예로, 상기 제 2 상보적 도메인은 1 내지 35개의 뉴클레오타이드 서열, 5 내지 35개의 뉴클레오타이드 서열, 10 내지 35개의 뉴클레오타이드 서열, 15 내지 35개의 뉴클레오타이드 서열, 20 내지 35개의 뉴클레오타이드 서열, 25 내지 35개의 뉴클레오타이드 서열 또는 30 내지 35 뉴클레오타이드 서열일 수 있다.
다른 일 예로, 상기 제 2 상보적 도메인은 1 내지 5개의 뉴클레오타이드 서열, 5 내지 10개의 뉴클레오타이드 서열, 10 내지 15개의 뉴클레오타이드 서열, 15 내지 20개의 뉴클레오타이드 서열, 20 내지 25개의 뉴클레오타이드 서열, 25 내지 30개의 뉴클레오타이드 서열 또는 30 내지 35개의 뉴클레오타이드 서열일 수 있다.
v) 근위 도메인(proximal domain)
"근위 도메인"은 제 2 상보적 도메인에 근접하게 위치하는 뉴클레오타이드 서열이다.
근위 도메인은 근위 도메인 내의 상보적인 뉴클레오타이드 서열을 포함할 수 있으며, 상보적인 뉴클레오타이드 서열에 의해 이중가닥을 형성할 수 있다.
상기 근위 도메인은 1 내지 20개의 뉴클레오타이드 서열일 수 있다.
일 예로서, 상기 근위 도메인은 1 내지 20개의 뉴클레오타이드 서열, 5 내지 20개의 뉴클레오타이드 서열, 10 내지 20개의 뉴클레오타이드 서열 또는 15 내지 20개의 뉴클레오타이드 서열일 수 있다.
다른 일 예로서, 상기 근위 도메인은 1 내지 5개의 뉴클레오타이드 서열, 5 내지 10개의 뉴클레오타이드 서열, 10 내지 15개의 뉴클레오타이드 서열 또는 15 내지 20개의 뉴클레오타이드 서열일 수 있다.
vi) 꼬리 도메인
"꼬리 도메인"은 가이드핵산의 양 말단 중 어느 하나 이상의 말단에 위치하는 뉴클레오타이드 서열이다.
꼬리 도메인은 꼬리 도메인 내의 상보적인 뉴클레오타이드 서열을 포함할 수 있으며, 상보적인 뉴클레오타이드 서열에 의해 이중가닥을 형성할 수 있다.
상기 꼬리 도메인은 1 내지 50개의 뉴클레오타이드 서열일 수 있다.
일 예로, 상기 꼬리 도메인은 5 내지 50개의 뉴클레오타이드 서열, 10 내지 50개의 뉴클레오타이드 서열, 15 내지 50개의 뉴클레오타이드 서열, 20 내지 50개의 뉴클레오타이드 서열, 25 내지 50개의 뉴클레오타이드 서열, 30 내지 50개의 뉴클레오타이드 서열, 35 내지 50개의 뉴클레오타이드 서열, 40 내지 50개의 뉴클레오타이드 서열 또는 45 내지 50개의 뉴클레오타이드 서열일 수 있다.
다른 일 예로, 상기 꼬리 도메인은 1 내지 5개의 뉴클레오타이드 서열, 5 내지 10개의 뉴클레오타이드 서열, 10 내지 15개의 뉴클레오타이드 서열, 15 내지 20개의 뉴클레오타이드 서열, 20 내지 25개의 뉴클레오타이드 서열, 25 내지 30개의 뉴클레오타이드 서열, 30 내지 35개의 뉴클레오타이드 서열, 35 내지 40개의 뉴클레오타이드 서열, 40 내지 45개의 뉴클레오타이드 서열 또는 45 내지 50개의 뉴클레오타이드 서열일 수 있다.
한편, 상기 도메인들, 즉, 가이드 도메인, 제 1 상보적 도메인, 연결 도메인, 제 2 상보적 도메인, 근위 도메인 및 꼬리 도메인이 포함하는 핵산 서열의 일부 또는 전부는 선택적 또는 추가적으로 화학적 변형을 포함할 수 있다.
상기 화학적 변형은 methylation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid(LNA), 2'-O-methyl 3'phosphorothioate(MS) 또는 2'-O-methyl 3'thioPACE(MSP)일 수 있으나, 이에 제한되지 않는다.
가이드핵산은 하나 이상의 도메인을 포함한다.
상기 가이드핵산은 가이드 도메인을 포함할 수 있다.
상기 가이드핵산은 제 1 상보적 도메인을 포함할 수 있다.
상기 가이드핵산은 연결 도메인을 포함할 수 있다.
상기 가이드핵산은 제 2 상보적 도메인을 포함할 수 있다.
상기 가이드핵산은 근위 도메인을 포함할 수 있다.
상기 가이드핵산은 꼬리 도메인을 포함할 수 있다.
이때, 상기 도메인의 개수는 1, 2, 3, 4, 5, 6 또는 그 이상일 수 있다.
상기 가이드핵산은 1, 2, 3, 4, 5, 6 또는 그 이상의 가이드 도메인을 포함할 수 있다.
상기 가이드핵산은 1, 2, 3, 4, 5, 6 또는 그 이상의 제 1 상보적 도메인을 포함할 수 있다.
상기 가이드핵산은 1, 2, 3, 4, 5, 6 또는 그 이상의 연결 도메인을 포함할 수 있다.
상기 가이드핵산은 1, 2, 3, 4, 5, 6 또는 그 이상의 제 2 상보적 도메인을 포함할 수 있다.
상기 가이드핵산은 1, 2, 3, 4, 5, 6 또는 그 이상의 근위 도메인을 포함할 수 있다.
상기 가이드핵산은 1, 2, 3, 4, 5, 6 또는 그 이상의 꼬리 도메인을 포함할 수 있다.
이때, 상기 가이드핵산은 하나의 도메인이 중복되어 포함될 수 있다.
상기 가이드핵산은 여러 도메인을 중복 또는 중복시키지 않고 포함할 수 있다.
상기 가이드핵산은 같은 종류의 도메인을 포함할 수 있으며, 이때, 같은 종류의 도메인은 동일한 핵산서열을 가지거나 또는 서로 다른 핵산서열을 가질 수 있다.
상기 가이드핵산은 두 종류의 도메인을 포함할 수 있으며, 이때, 다른 두 종류의 도메인은 서로 다른 핵산서열을 가지거나 또는 동일한 핵산서열을 가질 수 있다.
상기 가이드핵산은 세 종류의 도메인을 포함할 수 있으며, 이때, 다른 세 종류의 도메인은 서로 다른 핵산서열을 가지거나 또는 동일한 핵산서열을 가질 수 있다.
상기 가이드핵산은 네 종류의 도메인을 포함할 수 있으며, 이때, 다른 네 종류의 도메인은 서로 다른 핵산서열을 가지거나 또는 동일한 핵산서열을 가질 수 있다.
상기 가이드핵산은 다섯 종류의 도메인을 포함할 수 있으며, 이때, 다른 다섯 종류의 도메인은 서로 다른 핵산서열을 가지거나 또는 동일한 핵산서열을 가질 수 있다.
상기 가이드핵산은 여섯 종류의 도메인을 포함할 수 있으며, 이때, 다른 여섯 종류의 도메인은 서로 다른 핵산서열을 가지거나 또는 동일한 핵산서열을 가질 수 있다.
예를 들면, 가이드핵산은 [가이드 도메인]-[제 1 상보적 도메인]-[연결 도메인]-[제 2 상보적 도메인]-[연결 도메인]-[가이드 도메인]-[제 1 상보적 도메인]-[연결 도메인]-[제 2 상보적 도메인]으로 구성될 수 있으며, 이때, 두 개의 가이드 도메인은 서로 다른 또는 동일한 표적을 위한 가이드 서열을 포함할 수 있으며, 상기 두 개의 제 1 상보적 도메인과 두 개의 제 2 상보적 도메인 동일한 핵산서열을 가지거나 다른 핵산서열을 가질 수 있다. 가이드 도메인이 서로 다른 표적을 위한 가이드 서열을 포함하는 경우, 상기 가이드핵산은 두 개의 표적에 특이적으로 결합할 수 있으며, 이때, 특이적 결합을 동시에 일어나거나 순차적으로 일어날 수 있다. 또한, 상기 연결 도메인은 특정 효소에 의해 절단될 수 있으며, 특정 효소의 존재 하에서 상기 가이드핵산은 두 부분 또는 세 부분으로 나누어질 수 있다.
본 명세서에 의해 개시되는 내용의 일 구체예로서, 가이드핵산은 gRNA일 수 있다.
gRNA
“gRNA”는 표적 유전자 또는 핵산에 대한 gRNA-CRISPR 효소 복합체, 즉, CRISPR 복합체를 특이적 표적화할 수 있는 RNA를 지칭한다. 또한, 상기 gRNA는 표적 유전자 또는 핵산 특이적 RNA를 의미하며, CRISPR 효소과 결합하여 CRISPR 효소를 표적 유전자 또는 핵산으로 인도할 수 있다.
상기 gRNA는 다수의 도메인을 포함할 수 있다. 각각의 도메인에 의해 3차원 행태 또는 gRNA의 활성 형태의 가닥내 또는 가닥간 상호작용을 할 수 있다.
gRNA는 단일가닥 gRNA(단일 RNA 분자); 또는 이중 gRNA(하나 초과의 통상적으로 2개의 별개의 RNA 분자를 포함함)로서 지칭될 수 있다.
일 구체예에서, 단일가닥 gRNA는 5'으로부터 3' 방향으로 가이드 도메인, 즉 표적 유전자 또는 핵산에 상보적인 결합을 할 수 있는 가이드 서열(guide sequence)를 포함하는 도메인; 제 1 상보적 도메인; 연결 도메인; 제 2 상보적 도메인, 상기 제 1 상보적 도메인 서열에 상보적인 서열을 가지므로 제 1 상보적 도메인과 이중가닥 핵산을 형성할 수 있는 도메인; 근위 도메인(proximal domain); 및 선택적으로 꼬리 도메인을 포함할 수 있다.
다른 일 구체예로서, 이중 gRNA는 5'으로부터 3' 방향으로 가이드 도메인, 즉 표적 유전자 또는 핵산에 상보적인 결합을 할 수 있는 가이드 서열(guide sequence)를 포함하는 도메인 및 제 1 상보적 도메인을 포함하는 제 1가닥; 및 제 2 상보적 도메인, 상기 제 1 상보적 도메인 서열에 상보적인 서열을 가지므로 제 1 상보적 도메인과 이중가닥 핵산을 형성할 수 있는 도메인, 근위 도메인(proximal domain); 및 선택적으로 꼬리 도메인을 포함하는 제 2 가닥을 포함할 수 있다.
이때, 상기 제 1가닥은 crRNA라고 지칭될 수 있고, 상기 제 2가닥은 tracrRNA로 지칭될 수 있다. 상기 crRNA는 가이드 도메인과 제 1 상보적 도메인을 포함할 수 있으며, 상기 tracrRNA는 제 2 상보적 도메인, 근위 도메인 및 선택적으로 꼬리 도메인을 포함할 수 있다.
또 다른 일 구체예로서, 단일가닥 gRNA는 3'으로부터 5' 방향으로 가이드 도메인, 즉 표적 유전자 또는 핵산에 상보적인 결합을 할 수 있는 가이드 서열(guide sequence)를 포함하는 도메인; 제 1 상보적 도메인; 및 제 2 상보적 도메인, 상기 제 1 상보적 도메인 서열에 상보적인 서열을 가지므로 제 1 상보적 도메인과 이중가닥 핵산을 형성할 수 있는 도메인을 포함할 수 있다.
이때, 상기 제 1 상보적 도메인은 자연유래의 제 1 상보적 도메인과 상동성을 가지거나, 또는 자연유래의 제 1 상보적 도메인으로부터 유래될 수 있다. 또한, 상기 제 1 상보적 도메인은 자연에 존재하는 종에 따라 제 1 상보적 도메인의 뉴클레오타이드 서열에 차이가 존재할 수 있으며, 자연에 존재하는 종이 포함하는 제 1 상보적 도메인으로부터 유래될 수 있고, 또는 자연에 존재하는 종이 포함하는 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가질 수 있다.
일 구체예로서, 상기 제 1 상보적 도메인은 스트렙토코커스 피요게네스(Streptococcus pyogenes), 캄필로박터 제주니(Campylobacter jejuni), 스트렙토코커스 써모필러스(Streptococcus thermophilus), 스타필로코커스 아우레우스(Staphylococcus aureus) 또는 네이세리아 메닝기티디스(Neisseria meningitidis)의 제 1 상보적 도메인 또는 유래된 제 1 상보적 도메인과 일부, 최소 50%이상, 또는 완전한 상동성을 가질 수 있다.
예를 들어, 상기 제 1 상보적 도메인이 스트렙토코커스 피요게네스의 제 1 상보적 도메인 또는 스트렙토코커스 피요게네스 유래 제 1 상보적 도메인인 경우, 상기 제 1 상보적 도메인은 5'-GUUUUAGAGCUA-3'(SEQ ID NO: 1)일 수 있고, 또는 5'-GUUUUAGAGCUA-3'(SEQ ID NO: 1)와 일부, 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다. 이때, 상기 제 1 상보적 도메인은 추가로 (X)n을 포함, 즉, 5'-GUUUUAGAGCUA(X)n-3'(SEQ ID NO: 1), 할 수 있다. 상기 X는 뉴클레오타이드 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n은 뉴클레오타이드 서열의 개수로, 5 내지 15의 정수일 수 있다. 이때, (X)n은 동일한 뉴클레오타이드 서열의 정수 n개만큼의 반복일 수 있고, 또는 뉴클레오타이드 A, T, U 및 G가 혼합된 정수 n개의 뉴클레오타이드 서열일 수 있다.
또 다른 예를 들어, 상기 제 1 상보적 도메인이 캄필로박터 제주니의 제 1 상보적 도메인 또는 캄필로박터 제주니 유래 제 1 상보적 도메인인 경우, 상기 제 1 상보적 도메인은 5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'(SEQ ID NO: 2) 또는 5'-GUUUUAGUCCCUU-3'(SEQ ID NO: 3)일 수 있고, 또는 5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'(SEQ ID NO: 2) 또는 5'-GUUUUAGUCCCUU-3'(SEQ ID NO: 3)와 일부, 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다. 이때, 상기 제 1 상보적 도메인은 추가로 (X)n을 포함, 즉, 5'-GUUUUAGUCCCUUUUUAAAUUUCUU(X)n-3'(SEQ ID NO: 2) 또는 5'-GUUUUAGUCCCUU(X)n-3'(SEQ ID NO: 3), 할 수 있다. 상기 X는 뉴클레오타이드 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n은 뉴클레오타이드 서열의 개수로, 5 내지 15의 정수일 수 있다. 이때, (X)n은 동일한 뉴클레오타이드 서열의 정수 n개만큼의 반복일 수 있고, 또는 뉴클레오타이드 A, T, U 및 G가 혼합된 정수 n개의 뉴클레오타이드 서열일 수 있다.
다른 일 구체예로서, 상기 제 1 상보적 도메인은 팔쿠박테리아 박테리움(Parcubacteria bacterium (GWC2011_GWC2_44_17)), 라츠노스피라세애 박테리움(Lachnospiraceae bacterium (MC2017)), 부티리비브리오 프로테오클라시커스(Butyrivibrio proteoclasiicus), 페레그리니박테리아 박테리움(Peregrinibacteria bacterium (GW2011_GWA_33_10)), 액시다미노코커스 에스피(Acidaminococcus sp. (BV3L6)), 포르피로모나스 마카캐(Porphyromonas macacae), 라츠노피라세애 박테리움(Lachnospiraceae bacterium (ND2006)), 포르피로모나스 크레비오리카니스(Porphyromonas crevioricanis), 프레보텔라 디이엔스(Prevotella disiens), 모라셀라 보보쿨리(Moraxella bovoculi (237)), 스미이헬라 에스피(Smiihella sp. (SC_KO8D17)), 렙포스피라 이나다이(Leptospira inadai), 라츠노스피라세애 박테리움(Lachnospiraceae bacterium (MA2020)), 프란시셀라 노비시다(Francisella novicida (U112)), 캔디다투스 메타노플라즈마 털미툼(Candidatus Methanoplasma termitum) 또는 에유박테리움 엘리겐스(Eubacterium eligens)의 제 1 상보적 도메인 또는 유래된 제 1 상보적 도메인과 일부, 최소 50%이상, 또는 완전한 상동성을 가질 수 있다.
예를 들어, 상기 제 1 상보적 도메인이 팔쿠박테리아 박테리움의 제 1 상보적 도메인 또는 팔쿠박테리아 박테리움 유래 제 1 상보적 도메인인 경우, 상기 제 1 상보적 도메인은 5'-UUUGUAGAU-3'(SEQ ID NO: 4) 일 수 있고, 또는 5'-UUUGUAGAU-3'(SEQ ID NO: 4)와 일부, 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다. 이때, 상기 제 1 상보적 도메인은 추가로 (X)n을 포함, 즉, 5'-(X)nUUUGUAGAU-3'(SEQ ID NO: 4), 할 수 있다. 상기 X는 뉴클레오타이드 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n은 뉴클레오타이드 서열의 개수로, 1 내지 5의 정수일 수 있다. 이때, (X)n은 동일한 뉴클레오타이드 서열의 정수 n개만큼의 반복일 수 있고, 또는 뉴클레오타이드 A, T, U 및 G가 혼합된 정수 n개의 뉴클레오타이드 서열일 수 있다.
이때, 상기 연결 도메인은 제 1 상보적 도메인과 제 2 상보적 도메인을 연결하는 역할을 하는 뉴클레오타이드 서열일 수 있다.
상기 연결 도메인은 제 1 상보적 도메인 및 제 2 상보적 도메인과 각각 공유결합 또는 비공유결합을 할 수 있다.
상기 연결 도메인은 제 1 상보적 도메인과 제 2 상보적 도메인을 공유적 또는 비공유적으로 연결할 수 있다.
상기 연결 도메인은 단일가닥 gRNA 분자에 사용하기에 적합하며, 이중 gRNA의 제 1 가닥 및 제 2 가닥과 공유결합 또는 비공유결합 하거나, 또는 제 1 가닥 및 제 2 가닥을 공유적 또는 비공유적으로 연결하여 단일가닥 gRNA을 생성에 사용될 수 있다.
상기 연결 도메인은 이중 gRNA의 crRNA 및 tracrRNA과 공유결합 또는 비공유결합 하거나, 또는 crRNA 및 tracrRNA를 공유적 또는 비공유적으로 연결하여 단일가닥 gRNA를 생성에 사용될 수 있다.
이때, 상기 제 2 상보적 도메인은 자연유래의 제 2 상보적 도메인과 상동성을 가지거나, 또는 자연유래의 제 2 상보적 도메인으로부터 유래될 수 있다. 또한, 상기 제 2 상보적 도메인은 자연에 존재하는 종에 따라 제 2 상보적 도메인의 뉴클레오타이드 서열에 차이가 존재할 수 있으며, 자연에 존재하는 종이 포함하는 제 2 상보적 도메인으로부터 유래될 수 있고, 또는 자연에 존재하는 종이 포함하는 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가질 수 있다.
일 구체예로서, 상기 제 2 상보적 도메인은 스트렙토코커스 피요게네스(Streptococcus pyogenes), 캄필로박터 제주니(Campylobacter jejuni), 스트렙토코커스 써모필러스(Streptococcus thermophilus), 스타필로코커스 아우레우스(Staphylococcus aureus) 또는 네이세리아 메닝기티디스(Neisseria meningitidis)의 제 2 상보적 도메인 또는 유래된 제 2 상보적 도메인과 일부, 최소 50%이상, 또는 완전한 상동성을 가질 수 있다.
예를 들어, 상기 제 2 상보적 도메인이 스트렙토코커스 피요게네스의 제 2 상보적 도메인 또는 스트렙토코커스 피요게네스 유래 제 2 상보적 도메인인 경우, 상기 제 2 상보적 도메인은 5'-UAGCAAGUUAAAAU-3'(SEQ ID NO: 5)일 수 있고, 또는 5'-UAGCAAGUUAAAAU-3'(SEQ ID NO: 5)와 일부, 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다(밑줄 표시는 제 1 상보적 도메인과 이중가닥을 형성하는 뉴클레오타이드 서열). 이때, 상기 제 2 상보적 도메인은 추가로 (X)n 또는/및 (X)m을 포함, 즉, 5'-(X)n UAGCAAGUUAAAAU(X)m-3'(SEQ ID NO: 5), 할 수 있다. 상기 X는 뉴클레오타이드 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n 및 m은 뉴클레오타이드 서열의 개수로, 상기 n은 1 내지 15의 정수일 수 있고, 상기 m은 1 내지 6일 수 있다. 이때, (X)n은 동일한 뉴클레오타이드 서열의 정수 n개만큼의 반복일 수 있고, 또는 뉴클레오타이드 A, T, U 및 G가 혼합된 정수 n개의 뉴클레오타이드 서열일 수 있다. 또한 (X)m은 동일한 뉴클레오타이드 서열의 정수 m개만큼의 반복일 수 있고, 또는 뉴클레오타이드 A, T, U 및 G가 혼합된 정수 m개의 뉴클레오타이드 서열일 수 있다.
또 다른 예를 들어, 상기 제 2 상보적 도메인이 캄필로박터 제주니의 제 2 상보적 도메인 또는 캄필로박터 제주니 유래 제 2 상보적 도메인인 경우, 상기 제 2 상보적 도메인은 5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'(SEQ ID NO: 6) 또는 5'-AAGGGACUAAAAU-3'(SEQ ID NO: 7)일 수 있고, 또는 5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'(SEQ ID NO: 6) 또는 5'-AAGGGACUAAAAU-3'(SEQ ID NO: 7)와 일부, 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다(밑줄 표시는 제 1 상보적 도메인과 이중가닥을 형성하는 뉴클레오타이드 서열). 이때, 상기 제 2 상보적 도메인은 추가로 (X)n 또는/및 (X)m을 포함, 즉, 5'-(X)n AAGAAAUUUAAAAAGGGACUAAAAU(X)m-3'(SEQ ID NO: 6) 또는 5'-(X)n AAGGGACUAAAAU(X)m-3'(SEQ ID NO: 7), 할 수 있다. 상기 X는 뉴클레오타이드 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n은 1 내지 15의 정수일 수 있고, 상기 m은 1 내지 6일 수 있다. 이때, (X)n은 동일한 뉴클레오타이드 서열의 정수 n개만큼의 반복일 수 있고, 또는 뉴클레오타이드 A, T, U 및 G가 혼합된 정수 n개의 뉴클레오타이드 서열일 수 있다. 또한 (X)m은 동일한 뉴클레오타이드 서열의 정수 m개만큼의 반복일 수 있고, 또는 뉴클레오타이드 A, T, U 및 G가 혼합된 정수 m개의 뉴클레오타이드 서열일 수 있다.
다른 일 구체예로서, 상기 제 2 상보적 도메인은 팔쿠박테리아 박테리움(Parcubacteria bacterium (GWC2011_GWC2_44_17)), 라츠노스피라세애 박테리움(Lachnospiraceae bacterium (MC2017)), 부티리비브리오 프로테오클라시커스(Butyrivibrio proteoclasiicus), 페레그리니박테리아 박테리움(Peregrinibacteria bacterium (GW2011_GWA_33_10)), 액시다미노코커스 에스피(Acidaminococcus sp. (BV3L6)), 포르피로모나스 마카캐(Porphyromonas macacae), 라츠노피라세애 박테리움(Lachnospiraceae bacterium (ND2006)), 포르피로모나스 크레비오리카니스(Porphyromonas crevioricanis), 프레보텔라 디이엔스(Prevotella disiens), 모라셀라 보보쿨리(Moraxella bovoculi (237)), 스미이헬라 에스피(Smiihella sp. (SC_KO8D17)), 렙포스피라 이나다이(Leptospira inadai), 라츠노스피라세애 박테리움(Lachnospiraceae bacterium (MA2020)), 프란시셀라 노비시다(Francisella novicida (U112)), 캔디다투스 메타노플라즈마 털미툼(Candidatus Methanoplasma termitum) 또는 에유박테리움 엘리겐스(Eubacterium eligens)의 제 2 상보적 도메인 또는 유래된 제 2 상보적 도메인과 일부, 최소 50%이상, 또는 완전한 상동성을 가질 수 있다.
예를 들어, 상기 제 2 상보적 도메인이 팔쿠박테리아 박테리움의 제 2 상보적 도메인 또는 팔쿠박테리아 박테리움 유래 제 2 상보적 도메인인 경우, 상기 제 2 상보적 도메인은 5'-AAAUUUCUACU-3'(SEQ ID NO: 8) 일 수 있고, 또는 5'-AAAUUUCUACU-3'(SEQ ID NO: 8)와 일부, 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다(밑줄 표시는 제 1 상보적 도메인과 이중가닥을 형성하는 뉴클레오타이드 서열). 이때, 상기 제 2 상보적 도메인은 추가로 (X)n 또는/및 (X)m을 포함, 즉, 5'-(X)nAAAUUUCUACU (X)m-3'(SEQ ID NO: 8), 할 수 있다. 상기 X는 뉴클레오타이드 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n 및 m은 뉴클레오타이드 서열의 개수로, 상기 n은 1 내지 10의 정수일 수 있고, 상기 m은 1 내지 6일 수 있다. 이때, (X)n은 동일한 뉴클레오타이드 서열의 정수 n개만큼의 반복일 수 있고, 또는 뉴클레오타이드 A, T, U 및 G가 혼합된 정수 n개의 뉴클레오타이드 서열일 수 있다. 또한 (X)m은 동일한 뉴클레오타이드 서열의 정수 m개만큼의 반복일 수 있고, 또는 뉴클레오타이드 A, T, U 및 G가 혼합된 정수 m개의 뉴클레오타이드 서열일 수 있다.
이때, 상기 제 1 상보적 도메인과 상기 제 2 상보적 도메인은 상보적 결합을 할 수 있다.
상기 제 1 상보적 도메인과 상기 제 2 상보적 도메인은 상기 상보적 결합을 통해 이중가닥을 형성할 수 있다.
상기 형성된 이중가닥은 CRISPR 효소와 상호작용할 수 있다.
선택적으로, 상기 제 1 상보적 도메인은 제 2 가닥의 제 2 상보적 도메인과 상보적 결합을 하지않는 추가 뉴클레오타이드 서열을 포함할 수 있다.
이때, 상기 추가 뉴클레오타이드 서열은 1 내지 15개의 뉴클레오타이드 서열일 수 있다. 예를 들어, 상기 추가 뉴클레오타이드 서열은 1 내지 5개의 뉴클레오타이드 서열, 5 내지 10개의 뉴클레오타이드 서열, 또는 10 내지 15개의 뉴클레오타이드 서열일 수 있다.
이때, 상기 근위 도메인은 제 2 상보적 도메인의 3' 방향에 위치하는 도메인일 수 있다.
상기 근위 도메인은 자연유래의 근위 도메인과 상동성을 가지거나, 또는 자연유래의 근위 도메인으로부터 유래될 수 있다. 또한, 상기 근위 도메인은 자연에 존재하는 종에 따라 근위 도메인의 뉴클레오타이드 서열에 차이가 존재할 수 있으며, 자연에 존재하는 종이 포함하는 근위 도메인으로부터 유래될 수 있고, 또는 자연에 존재하는 종이 포함하는 근위 도메인과 일부 또는 완전한 상동성을 가질 수 있다.
일 구체예로서, 상기 근위 도메인은 스트렙토코커스 피요게네스(Streptococcus pyogenes), 캄필로박터 제주니(Campylobacter jejuni), 스트렙토코커스 써모필러스(Streptococcus thermophilus), 스타필로코커스 아우레우스(Staphylococcus aureus) 또는 네이세리아 메닝기티디스(Neisseria meningitidis)의 근위 도메인 또는 유래된 근위 도메인과 일부, 최소 50%이상, 또는 완전한 상동성을 가질 수 있다.
예를 들어, 상기 근위 도메인이 스트렙토코커스 피요게네스의 근위 도메인 또는 스트렙토코커스 피요게네스 유래 근위 도메인인 경우, 상기 근위 도메인은 5'-AAGGCUAGUCCG-3'(SEQ ID NO: 9)일 수 있고, 또는 5'-AAGGCUAGUCCG-3'(SEQ ID NO: 9)와 일부, 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다. 이때, 상기 근위 도메인은 추가로 (X)n을 포함, 즉, 5'-AAGGCUAGUCCG(X)n-3'(SEQ ID NO: 9), 할 수 있다. 상기 X는 뉴클레오타이드 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n은 뉴클레오타이드 서열의 개수로, 1 내지 15의 정수일 수 있다. 이때, (X)n은 동일한 뉴클레오타이드 서열의 정수 n개만큼의 반복일 수 있고, 또는 뉴클레오타이드 A, T, U 및 G가 혼합된 정수 n개의 뉴클레오타이드 서열일 수 있다.
또 다른 예를 들어, 상기 근위 도메인이 캄필로박터 제주니의 근위 도메인 또는 캄필로박터 제주니 유래 근위 도메인인 경우, 상기 근위 도메인은 5'-AAAGAGUUUGC-3'(SEQ ID NO: 10)일 수 있고, 또는 5'-AAAGAGUUUGC-3'(SEQ ID NO: 10)와 일부, 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다. 이때, 상기 근위 도메인은 추가로 (X)n을 포함, 즉, 5'-AAAGAGUUUGC(X)n-3'(SEQ ID NO: 10), 할 수 있다. 상기 X는 뉴클레오타이드 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n은 뉴클레오타이드 서열의 개수로, 1 내지 40의 정수일 수 있다. 이때, (X)n은 동일한 뉴클레오타이드 서열의 정수 n개만큼의 반복일 수 있고, 또는 뉴클레오타이드 A, T, U 및 G가 혼합된 정수 n개의 뉴클레오타이드 서열일 수 있다.
이때, 상기 꼬리 도메인은 단일가닥 gRNA 또는 이중 gRNA의 제 1 가닥 또는 제 2 가닥의 3' 말단에 선택적으로 추가될 수 있다.
상기 꼬리 도메인은 자연유래의 꼬리 도메인과 상동성을 가지거나, 또는 자연유래의 꼬리 도메인으로부터 유래될 수 있다. 또한, 상기 꼬리 도메인은 자연에 존재하는 종에 따라 꼬리 도메인의 뉴클레오타이드 서열에 차이가 존재할 수 있으며, 자연에 존재하는 종이 포함하는 꼬리 도메인으로부터 유래될 수 있고, 또는 자연에 존재하는 종이 포함하는 꼬리 도메인과 일부 또는 완전한 상동성을 가질 수 있다.
일 구체예로서, 상기 꼬리 도메인은 스트렙토코커스 피요게네스(Streptococcus pyogenes), 캄필로박터 제주니(Campylobacter jejuni), 스트렙토코커스 써모필러스(Streptococcus thermophilus), 스타필로코커스 아우레우스(Staphylococcus aureus) 또는 네이세리아 메닝기티디스(Neisseria meningitidis)의 꼬리 도메인 또는 유래된 꼬리 도메인과 일부, 최소 50%이상, 또는 완전한 상동성을 가질 수 있다.
예를 들어, 상기 꼬리 도메인이 스트렙토코커스 피요게네스의 꼬리 도메인 또는 스트렙토코커스 피요게네스 유래 꼬리 도메인인 경우, 상기 꼬리 도메인은 5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'(SEQ ID NO: 11)일 수 있고, 또는 5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'(SEQ ID NO: 11)와 일부, 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다. 이때, 상기 꼬리 도메인은 추가로 (X)n을 포함, 즉, 5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(X)n-3'(SEQ ID NO: 11), 할 수 있다. 상기 X는 뉴클레오타이드 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n은 뉴클레오타이드 서열의 개수로, 1 내지 15의 정수일 수 있다. 이때, (X)n은 동일한 뉴클레오타이드 서열의 정수 n개만큼의 반복일 수 있고, 또는 뉴클레오타이드 A, T, U 및 G가 혼합된 정수 n개의 뉴클레오타이드 서열일 수 있다.
또 다른 예를 들어, 상기 꼬리 도메인이 캄필로박터 제주니의 꼬리 도메인 또는 캄필로박터 제주니 유래 꼬리 도메인인 경우, 상기 꼬리 도메인은 5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'(SEQ ID NO: 12)일 수 있고, 또는 5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'(SEQ ID NO: 12)와 일부, 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다. 이때, 상기 꼬리 도메인은 추가로 (X)n을 포함, 즉, 5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU(X)n-3'(SEQ ID NO: 12), 할 수 있다. 상기 X는 뉴클레오타이드 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n은 뉴클레오타이드 서열의 개수로, 1 내지 15의 정수일 수 있다. 이때, (X)n은 동일한 뉴클레오타이드 서열의 정수 n개만큼의 반복일 수 있고, 또는 뉴클레오타이드 A, T, U 및 G가 혼합된 정수 n개의 뉴클레오타이드 서열일 수 있다.
다른 일 구체예에서, 상기 꼬리 도메인은 시험관내 또는 생체내 전사 방법과 관련된 3' 말단에 1 내지 10개의 뉴클레오타이드 서열을 포함할 수 있다.
예를 들어, T7 프로모터가 gRNA의 시험관내 전사를 위해 사용될 때, 상기 꼬리 도메인은 DNA 주형의 3' 말단에 존재하는 임의의 뉴클레오타이드 서열일 수 있다. 또한, U6 프로모터가 생체내 전사를 위해 사용되는 경우, 상기 꼬리 도메인은 UUUUUU일 수 있으며, H1 프로모터가 전사를 위해 사용되는 경우, 상기 꼬리 도메인은 UUUU일 수 있고, pol-III 프로모터를 사용하는 경우에는, 상기 꼬리 도메인은 여러 개의 우라실 뉴클레오타이드거나 또는 대안될 수 있는 뉴클레오타이드를 포함할 수 있다.
gRNA는 상기에 기재된 바와 같이 다수의 도메인을 포함할 수 있어, gRNA가 포함하는 도메인의 종류 및 개수에 따라 핵산 서열의 길이를 조절할 수 있으며, 각각의 도메인에 의해 3차원 형태 또는 gRNA의 활성 형태의 가닥내 또는 가닥간 상호작용을 할 수 있다.
gRNA는 단일가닥 gRNA(단일 RNA 분자); 또는 이중 gRNA(하나 초과의 통상적으로 2개의 별개의 RNA 분자를 포함함)로서 지칭될 수 있다.
이중 gRNA
이중 gRNA는 제 1 가닥 및 제 2 가닥으로 구성된다.
이때, 상기 제 1 가닥은
5'-[가이드 도메인]-[제 1 상보적 도메인]-3'으로 구성될 수 있고,
상기 제 2 가닥은
5'-[제 2 상보적 도메인]-[근위 도메인(proximal domain)]-3' 또는
5'-[제 2 상보적 도메인]-[근위 도메인(proximal domain)]-[꼬리 도메인]-3'으로 구성될 수 있다.
이때, 상기 제 1가닥은 crRNA라고 지칭될 수 있고, 상기 제 2가닥은 tracrRNA로 지칭될 수 있다.
이때, 상기 제 1가닥 및 제 2가닥은 선택적으로 추가적인 뉴클레오타이드 서열을 포함할 수 있다.
일 구체예로서, 상기 제 1 가닥은
5'-(Ntarget)-(Q)m-3'; 또는
5'-(X)a-(Ntarget)-(X)b-(Q)m-(X)c-3'일 수 있다.
이때, 상기 Ntarget은 표적 유전자 또는 핵산의 이중 가닥 중 어느 하나 가닥의 일부 서열에 상보적인 뉴클레오타이드 서열로서, 상기 Ntarget은 표적 유전자 또는 핵산 상의 표적 서열에 따라 변할 수 있는 뉴클레오타이드 서열 부위이다.
이때, 상기 (Q)m은 제 1 상보적 도메인을 포함하는 뉴클레오타이드 서열로, 제 2 가닥의 제 2 상보적 도메인과 상보적 결합을 할 수 있는 뉴클레오타이드 서열을 포함한다. 상기 (Q)m은 자연에 존재하는 종의 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가지는 서열일 수 있으며, 유래된 종에 따라 상기 제 1 상보적 도메인의 뉴클레오타이드 서열은 변경될 수 있다. 상기 Q는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 m은 뉴클레오타이드 서열의 개수로, 5 내지 35의 정수일 수 있다.
예를 들어, 상기 제 1 상보적 도메인이 스트렙토코커스 피요게네스의 제 1 상보적 도메인 또는 스트렙토코커스 피요게네스 유래 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Q)m은 5'-GUUUUAGAGCUA-3'(SEQ ID NO: 1)일 수 있고, 또는 5'-GUUUUAGAGCUA-3'(SEQ ID NO: 1)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.
다른 예로, 상기 제 1 상보적 도메인이 캄필로박터 제주니의 제 1 상보적 도메인 또는 캄필로박터 제주니 유래 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Q)m은 5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'(SEQ ID NO: 2) 또는 5'-GUUUUAGUCCCUU-3'(SEQ ID NO: 3)일 수 있고, 또는 5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'(SEQ ID NO: 2) 또는 5'-GUUUUAGUCCCUU-3'(SEQ ID NO: 3)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.
또 다른 예로, 상기 제 1 상보적 도메인이 스트렙토코커스 써모필러스의 제 1 상보적 도메인 또는 스트렙토코커스 써모필러스 유래 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Q)m은 5'-GUUUUAGAGCUGUGUUGUUUCG-3'(SEQ ID NO: 13)일 수 있고, 또는 5'-GUUUUAGAGCUGUGUUGUUUCG-3'(SEQ ID NO: 13)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.
또한, 상기 (X)a, (X)b 및 (X)c는 선택적으로 추가할 수 있는 뉴클레오타이드 서열로, 상기 X는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 a, b 및 c는 뉴클레오타이드 서열의 개수로, 0 또는 1 내지 20의 정수일 수 있다.
일 구체예로서, 상기 제 2 가닥은
5'-(Z)h-(P)k-3'; 또는
5'-(X)d-(Z)h-(X)e-(P)k-(X)f-3' 일 수 있다.
다른 일 구체예로서, 상기 제 2 가닥은
5'-(Z)h-(P)k-(F)i-3'; 또는
5'-(X)d-(Z)h-(X)e-(P)k-(X)f-(F)i-3' 일 수 있다.
이때, 상기 (Z)h는 제 2 상보적 도메인을 포함하는 뉴클레오타이드 서열로, 제 1 가닥의 제 1 상보적 도메인과 상보적 결합을 할 수 있는 뉴클레오타이드 서열을 포함한다. 상기 (Z)h은 자연에 존재하는 종의 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가지는 서열일 수 있으며, 유래된 종에 따라 상기 제 2 상보적 도메인의 뉴클레오타이드 서열은 변경될 수 있다. 상기 Z는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 h은 뉴클레오타이드 서열의 개수로, 5 내지 50의 정수일 수 있다.
예를 들어, 상기 제 2 상보적 도메인이 스트렙토코커스 피요게네스의 제 2 상보적 도메인 또는 스트렙토코커스 피요게네스 유래 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Z)h은 5'-UAGCAAGUUAAAAU-3'(SEQ ID NO: 5)일 수 있고, 또는 5'-UAGCAAGUUAAAAU-3'(SEQ ID NO: 5)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.
다른 예로, 상기 제 2 상보적 도메인이 캄필로박터 제주니의 제 2 상보적 도메인 또는 캄필로박터 제주니 유래 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Z)h은 5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'(SEQ ID NO: 6) 또는 5'-AAGGGACUAAAAU-3'(SEQ ID NO: 7)일 수 있고, 또는 5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'(SEQ ID NO: 6) 또는 5'-AAGGGACUAAAAU-3'(SEQ ID NO: 7)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.
또 다른 예로, 상기 제 2 상보적 도메인이 스트렙토코커스 써모필러스의 제 2 상보적 도메인 또는 스트렙토코커스 써모필러스 유래 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Z)h은 5'-CGAAACAACACAGCGAGUUAAAAU-3'(SEQ ID NO: 14)일 수 있고, 또는 5'-CGAAACAACACAGCGAGUUAAAAU-3'(SEQ ID NO: 14)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.
상기 (P)k는 근위 도메인을 포함하는 뉴클레오타이드 서열로, 자연에 존재하는 종의 근위 도메인과 일부 또는 완전한 상동성을 가지는 서열일 수 있으며, 유래된 종에 따라 상기 근위 도메인의 뉴클레오타이드 서열은 변경될 수 있다. 상기 P는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 k은 뉴클레오타이드 서열의 개수로, 1 내지 20의 정수일 수 있다.
예를 들어, 상기 근위 도메인이 스트렙토코커스 피요게네스의 근위 도메인 또는 스트렙토코커스 피요게네스 유래 근위 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (P)k는 5'-AAGGCUAGUCCG-3'(SEQ ID NO: 9)일 수 있고, 또는 5'-AAGGCUAGUCCG-3'(SEQ ID NO: 9)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.
다른 예로, 상기 근위 도메인이 캄필로박터 제주니의 근위 도메인 또는 캄필로박터 제주니 유래 근위 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (P)k는 5'-AAAGAGUUUGC-3'(SEQ ID NO: 10)일 수 있고, 또는 5'-AAAGAGUUUGC-3'(SEQ ID NO: 10)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.
또 다른 예로, 상기 근위 도메인이 스트렙토코커스 써모필러스의 근위 도메인 또는 스트렙토코커스 써모필러스 유래 근위 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (P)k는 5'-AAGGCUUAGUCCG-3'(SEQ ID NO: 15)일 수 있고, 또는 5'-AAGGCUUAGUCCG-3'(SEQ ID NO: 15)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.
상기 (F)i는 꼬리 도메인을 포함하는 뉴클레오타이드 서열로, 자연에 존재하는 종의 꼬리 도메인과 일부 또는 완전한 상동성을 가지는 서열일 수 있으며, 유래된 종에 따라 상기 꼬리 도메인의 뉴클레오타이드 서열은 변경될 수 있다. 상기 F는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 i은 뉴클레오타이드 서열의 개수로, 1 내지 50의 정수일 수 있다.
예를 들어, 상기 꼬리 도메인이 스트렙토코커스 피요게네스의 꼬리 도메인 또는 스트렙토코커스 피요게네스 유래 꼬리 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (F)i는 5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'(SEQ ID NO: 11)일 수 있고, 또는 5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'(SEQ ID NO: 11)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.
다른 예로, 상기 꼬리 도메인이 캄필로박터 제주니의 꼬리 도메인 또는 캄필로박터 제주니 유래 꼬리 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (F)i는 5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'(SEQ ID NO: 12)일 수 있고, 또는 5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'(SEQ ID NO: 12)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.
또 다른 예로, 상기 꼬리 도메인이 스트렙토코커스 써모필러스의 꼬리 도메인 또는 스트렙토코커스 써모필러스 유래 꼬리 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (F)i는 5'-UACUCAACUUGAAAAGGUGGCACCGAUUCGGUGUUUUU-3'(SEQ ID NO: 16)일 수 있고, 또는 5'-UACUCAACUUGAAAAGGUGGCACCGAUUCGGUGUUUUU-3'(SEQ ID NO: 16)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.
또한, 상기 (F)i는 시험관내 또는 생체내 전사 방법과 관련된 3' 말단에 1 내지 10개의 뉴클레오타이드 서열을 포함할 수 있다.
예를 들어, T7 프로모터가 gRNA의 시험관내 전사를 위해 사용될 때, 상기 꼬리 도메인은 DNA 주형의 3' 말단에 존재하는 임의의 뉴클레오타이드 서열일 수 있다. 또한, U6 프로모터가 생체내 전사를 위해 사용되는 경우, 상기 꼬리 도메인은 UUUUUU일 수 있으며, H1 프로모터가 전사를 위해 사용되는 경우, 상기 꼬리 도메인은 UUUU일 수 있고, pol-III 프로모터를 사용하는 경우에는, 상기 꼬리 도메인은 여러 개의 우라실 뉴클레오타이드거나 또는 대안될 수 있는 뉴클레오타이드를 포함할 수 있다.
또한, 상기 (X)d, (X)e 및 (X)f는 선택적으로 추가할 수 있는 뉴클레오타이드 서열로, 상기 X는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 d, e 및 f는 뉴클레오타이드 서열의 개수로, 0 또는 1 내지 20의 정수일 수 있다.
단일가닥 gRNA
단일가닥 gRNA는 제 1 단일가닥 gRNA 및 제 2 단일가닥 gRNA로 나뉠 수 있다.
제 1 단일가닥 gRNA
제 1 단일가닥 gRNA는 상기 이중 gRNA의 제 1 가닥과 제 2 가닥을 연결 도메인으로 연결한 단일가닥 gRNA이다.
구체적으로, 상기 단일가닥 gRNA는
5'-[가이드 도메인]-[제 1 상보적 도메인]-[연결 도메인]-[제 2 상보적 도메인]-3',
5'-[가이드 도메인]-[제 1 상보적 도메인]-[연결 도메인]-[제 2 상보적 도메인]-[근위 도메인(proximal domain)]-3' 또는
5'-[가이드 도메인]-[제 1 상보적 도메인]-[연결 도메인]-[제 2 상보적 도메인]-[근위 도메인(proximal domain)]-[꼬리 도메인]-3'으로 구성될 수 있다.
상기 제 1 단일가닥 gRNA는 선택적으로 추가적인 뉴클레오타이드 서열을 포함할 수 있다.
일 구체예로서, 상기 제 1 단일가닥 gRNA는
5'-(Ntarget)-(Q)m-(L)j-(Z)h-3';
5'-(Ntarget)-(Q)m-(L)j-(Z)h-(P)k-3'; 또는
5'-(Ntarget)-(Q)m-(L)j-(Z)h-(P)k-(F)i-3'일 수 있다.
다른 일 구체예로서, 상기 단일가닥 gRNA는
5'-(X)a-(Ntarget)-(X)b-(Q)m-(X)c-(L)j-(X)d-(Z)h-(X)e-3';
5'-(X)a-(Ntarget)-(X)b-(Q)m-(X)c-(L)j-(X)d-(Z)h-(X)e-(P)k-(X)f-3'; 또는
5'-(X)a-(Ntarget)-(X)b-(Q)m-(X)c-(L)j-(X)d-(Z)h-(X)e-(P)k-(X)f-(F)i-3'일 수 있다.
이때, 상기 Ntarget은 표적 유전자 또는 핵산의 이중 가닥 중 어느 하나 가닥의 일부 서열에 상보적인 뉴클레오타이드 서열로서, 상기 Ntarget은 표적 유전자 또는 핵산 상의 표적 서열에 따라 변할 수 있는 뉴클레오타이드 서열 부위이다.
상기 (Q)m은 제 1 상보적 도메인을 포함하는 뉴클레오타이드 서열로, 제 2 상보적 도메인과 상보적 결합을 할 수 있는 뉴클레오타이드 서열을 포함한다. 상기 (Q)m은 자연에 존재하는 종의 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가지는 서열일 수 있으며, 유래된 종에 따라 상기 제 1 상보적 도메인의 뉴클레오타이드 서열은 변경될 수 있다. 상기 Q는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 m은 뉴클레오타이드 서열의 개수로, 5 내지 35의 정수일 수 있다.
예를 들어, 상기 제 1 상보적 도메인이 스트렙토코커스 피요게네스의 제 1 상보적 도메인 또는 스트렙토코커스 피요게네스 유래 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Q)m은 5'-GUUUUAGAGCUA-3'(SEQ ID NO: 1)일 수 있고, 또는 5'-GUUUUAGAGCUA-3'(SEQ ID NO: 1)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.
다른 예로, 상기 제 1 상보적 도메인이 캄필로박터 제주니의 제 1 상보적 도메인 또는 캄필로박터 제주니 유래 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Q)m은 5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'(SEQ ID NO: 2) 또는 5'-GUUUUAGUCCCUU-3'(SEQ ID NO: 3) 일 수 있고, 또는 5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'(SEQ ID NO: 2) 또는 5'-GUUUUAGUCCCUU-3'(SEQ ID NO: 3)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.
또 다른 예로, 상기 제 1 상보적 도메인이 스트렙토코커스 써모필러스의 제 1 상보적 도메인 또는 스트렙토코커스 써모필러스 유래 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Q)m은 5'-GUUUUAGAGCUGUGUUGUUUCG-3'(SEQ ID NO: 13)일 수 있고, 또는 5'-GUUUUAGAGCUGUGUUGUUUCG-3'(SEQ ID NO: 13)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.
또한, 상기 (L)j는 연결 도메인을 포함하는 뉴클레오타이드 서열로, 제 1 상보적 도메인과 제 2 상보적 도메인을 연결하여 단일가닥 gRNA을 생성할 수 있도록 하는 뉴클레오타이드 서열이다. 이때, 상기 L은 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 j은 뉴클레오타이드 서열의 개수로, 1 내지 30의 정수일 수 있다.
상기 (Z)h는 제 2 상보적 도메인을 포함하는 뉴클레오타이드 서열로, 제 1 상보적 도메인과 상보적 결합을 할 수 있는 뉴클레오타이드 서열을 포함한다. 상기 (Z)h은 자연에 존재하는 종의 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가지는 서열일 수 있으며, 유래된 종에 따라 상기 제 2 상보적 도메인의 뉴클레오타이드 서열은 변경될 수 있다. 상기 Z는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 h은 뉴클레오타이드 서열의 개수로, 5 내지 50의 정수일 수 있다.
예를 들어, 상기 제 2 상보적 도메인이 스트렙토코커스 피요게네스의 제 2 상보적 도메인 또는 스트렙토코커스 피요게네스 유래 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Z)h은 5'-UAGCAAGUUAAAAU-3'(SEQ ID NO: 5)일 수 있고, 또는 5'-UAGCAAGUUAAAAU-3'(SEQ ID NO: 5)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.
다른 예로, 상기 제 2 상보적 도메인이 캄필로박터 제주니의 제 2 상보적 도메인 또는 캄필로박터 제주니 유래 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Z)h은 5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'(SEQ ID NO: 6) 또는 5'-AAGGGACUAAAAU-3'(SEQ ID NO: 7)일 수 있고, 또는 5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'(SEQ ID NO: 6) 또는 5'-AAGGGACUAAAAU-3'(SEQ ID NO: 7)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.
또 다른 예로, 상기 제 2 상보적 도메인이 스트렙토코커스 써모필러스의 제 2 상보적 도메인 또는 스트렙토코커스 써모필러스 유래 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Z)h은 5'-CGAAACAACACAGCGAGUUAAAAU-3'(SEQ ID NO: 14)일 수 있고, 또는 5'-CGAAACAACACAGCGAGUUAAAAU-3'(SEQ ID NO: 14)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.
상기 (P)k는 근위 도메인을 포함하는 뉴클레오타이드 서열로, 자연에 존재하는 종의 근위 도메인과 일부 또는 완전한 상동성을 가지는 서열일 수 있으며, 유래된 종에 따라 상기 근위 도메인의 뉴클레오타이드 서열은 변경될 수 있다. 상기 P는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 k은 뉴클레오타이드 서열의 개수로, 1 내지 20의 정수일 수 있다.
예를 들어, 상기 근위 도메인이 스트렙토코커스 피요게네스의 근위 도메인 또는 스트렙토코커스 피요게네스 유래 근위 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (P)k는 5'-AAGGCUAGUCCG-3'(SEQ ID NO: 9)일 수 있고, 또는 5'-AAGGCUAGUCCG-3'(SEQ ID NO: 9)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.
다른 예로, 상기 근위 도메인이 캄필로박터 제주니의 근위 도메인 또는 캄필로박터 제주니 유래 근위 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (P)k는 5'-AAAGAGUUUGC-3'(SEQ ID NO: 10)일 수 있고, 또는 5'-AAAGAGUUUGC-3'(SEQ ID NO: 10)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.
또 다른 예로, 상기 근위 도메인이 스트렙토코커스 써모필러스의 근위 도메인 또는 스트렙토코커스 써모필러스 유래 근위 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (P)k는 5'-AAGGCUUAGUCCG-3'(SEQ ID NO: 15)일 수 있고, 또는 5'-AAGGCUUAGUCCG-3'(SEQ ID NO: 15)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.
상기 (F)i는 꼬리 도메인을 포함하는 뉴클레오타이드 서열로, 자연에 존재하는 종의 꼬리 도메인과 일부 또는 완전한 상동성을 가지는 서열일 수 있으며, 유래된 종에 따라 상기 꼬리 도메인의 뉴클레오타이드 서열은 변경될 수 있다. 상기 F는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 i은 뉴클레오타이드 서열의 개수로, 1 내지 50의 정수일 수 있다.
예를 들어, 상기 꼬리 도메인이 스트렙토코커스 피요게네스의 꼬리 도메인 또는 스트렙토코커스 피요게네스 유래 꼬리 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (F)i는 5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'(SEQ ID NO: 11)일 수 있고, 또는 5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'(SEQ ID NO: 11)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.
다른 예로, 상기 꼬리 도메인이 캄필로박터 제주니의 꼬리 도메인 또는 캄필로박터 제주니 유래 꼬리 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (F)i는 5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'(SEQ ID NO: 12)일 수 있고, 또는 5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'(SEQ ID NO: 12)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.
또 다른 예로, 상기 꼬리 도메인이 스트렙토코커스 써모필러스의 꼬리 도메인 또는 스트렙토코커스 써모필러스 유래 꼬리 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (F)i는 5'-UACUCAACUUGAAAAGGUGGCACCGAUUCGGUGUUUUU-3'(SEQ ID NO: 16)일 수 있고, 또는 5'-UACUCAACUUGAAAAGGUGGCACCGAUUCGGUGUUUUU-3'(SEQ ID NO: 16)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.
또한, 상기 (F)i는 시험관내 또는 생체내 전사 방법과 관련된 3' 말단에 1 내지 10개의 뉴클레오타이드 서열을 포함할 수 있다.
예를 들어, T7 프로모터가 gRNA의 시험관내 전사를 위해 사용될 때, 상기 꼬리 도메인은 DNA 주형의 3' 말단에 존재하는 임의의 뉴클레오타이드 서열일 수 있다. 또한, U6 프로모터가 생체내 전사를 위해 사용되는 경우, 상기 꼬리 도메인은 UUUUUU일 수 있으며, H1 프로모터가 전사를 위해 사용되는 경우, 상기 꼬리 도메인은 UUUU일 수 있고, pol-III 프로모터를 사용하는 경우에는, 상기 꼬리 도메인은 여러 개의 우라실 뉴클레오타이드거나 또는 대안될 수 있는 뉴클레오타이드를 포함할 수 있다.
또한, 상기 (X)a, (X)b, (X)c, (X)d, (X)e 및 (X)f는 선택적으로 추가할 수 있는 뉴클레오타이드 서열로, 상기 X는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 a, b, c, d, e 및 f는 뉴클레오타이드 서열의 개수로, 0 또는 1 내지 20의 정수일 수 있다.
제 2 단일가닥 gRNA
제 2 단일가닥 gRNA는 가이드 도메인, 제 1 상보적 도메인 및 제 2 상보적 도메인으로 구성되는 단일가닥 gRNA일 수 있다.
이때, 상기 제 2 단일가닥 gRNA는
5'-[제 2 상보적 도메인]-[제 1 상보적 도메인]-[가이드 도메인]-3'; 또는
5'-[제 2 상보적 도메인]-[연결 도메인]-[제 1 상보적 도메인]-[가이드 도메인]-3'으로 구성될 수 있다.
상기 제 2 단일가닥 gRNA는 선택적으로 추가적인 뉴클레오타이드 서열을 포함할 수 있다.
일 구체예로서, 상기 제 2 단일가닥 gRNA는
5'-(Z)h-(Q)m-(Ntarget)-3'; 또는
5'-(X)a-(Z)h-(X)b-(Q)m-(X)c-(Ntarget)-3'일 수 있다.
다른 일 구체예로서, 상기 단일가닥 gRNA는
5'-(Z)h-(L)j-(Q)m-(Ntarget)-3'; 또는
5'-(X)a-(Z)h-(L)j-(Q)m-(X)c-(Ntarget)-3'일 수 있다.
이때, 상기 Ntarget은 표적 유전자 또는 핵산의 이중 가닥 중 어느 하나 가닥의 일부 서열에 상보적인 뉴클레오타이드 서열로서, 상기 Ntarget은 표적 유전자 또는 핵산 상의 표적 서열에 따라 변할 수 있는 뉴클레오타이드 서열 부위이다.
상기 (Q)m은 제 1 상보적 도메인을 포함하는 뉴클레오타이드 서열로, 제 2 상보적 도메인과 상보적 결합을 할 수 있는 뉴클레오타이드 서열을 포함한다. 상기 (Q)m은 자연에 존재하는 종의 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가지는 서열일 수 있으며, 유래된 종에 따라 상기 제 1 상보적 도메인의 뉴클레오타이드 서열은 변경될 수 있다. 상기 Q는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 m은 뉴클레오타이드 서열의 개수로, 5 내지 35의 정수일 수 있다.
예를 들어, 상기 제 1 상보적 도메인이 팔쿠박테리아 박테리움의 제 1 상보적 도메인 또는 팔쿠박테리아 박테리움 유래 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Q)m은 5'-UUUGUAGAU-3'(SEQ ID NO: 4)일 수 있고, 또는 5'-UUUGUAGAU-3'(SEQ ID NO: 4)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.
상기 (Z)h는 제 2 상보적 도메인을 포함하는 뉴클레오타이드 서열로, 제 1 상보적 도메인과 상보적 결합을 할 수 있는 뉴클레오타이드 서열을 포함한다. 상기 (Z)h은 자연에 존재하는 종의 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가지는 서열일 수 있으며, 유래된 종에 따라 상기 제 2 상보적 도메인의 뉴클레오타이드 서열은 변경될 수 있다. 상기 Z는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 h은 뉴클레오타이드 서열의 개수로, 5 내지 50의 정수일 수 있다.
예를 들어, 상기 제 2 상보적 도메인이 팔쿠박테리아 박테리움의 제 2 상보적 도메인 또는 팔쿠박테리아 박테리움 유래 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Z)h은 5'-AAAUUUCUACU-3'(SEQ ID NO: 8)일 수 있고, 또는 5'-AAAUUUCUACU-3'(SEQ ID NO: 8)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.
또한, 상기 (L)j는 연결 도메인을 포함하는 뉴클레오타이드 서열로, 제 1 상보적 도메인과 제 2 상보적 도메인을 연결하는 뉴클레오타이드 서열이다. 이때, 상기 L은 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 j은 뉴클레오타이드 서열의 개수로, 1 내지 30의 정수일 수 있다.
또한, 상기 (X)a, (X)b 및 (X)c는 선택적으로 추가할 수 있는 뉴클레오타이드 서열로, 상기 X는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 a, b 및 c는 뉴클레오타이드 서열의 개수로, 0 또는 1 내지 20의 정수일 수 있다.
본 명세서에 의해 개시되는 내용의 일 태양으로서, 가이드핵산은 면역 참여 유전자의 표적 서열에 상보적으로 결합하는 gRNA일 수 있다.
“면역 참여 유전자(immune participation gene)”는 면역 기능조절(immune function regulation)에 직접적으로 참여하거나 또는 간접적으로 영향을 미치는 모든 유전자를 의미한다.
상기 면역 참여 유전자는 선천 면역(innate immunity) 조절할 수 있다.
상기 면역 참여 유전자는 후천 면역(acquired immunity) 조절할 수 있다.
상기 면역 참여 유전자는 식세포(phagocyte)의 기능 조절할 수 있다.
상기 면역 참여 유전자는 사이토카인(cytokine)의 발현을 촉진하거나 증가시킬 수 있다.
상기 면역 참여 유전자는 사이토카인(cytokine)의 발현을 억제하거나 저해시킬 수 있다.
상기 면역 참여 유전자는 전염증성 사이토카인(proinflammatory cytokine)의 발현을 촉진하거나 증가시킬 수 있다.
상기 면역 참여 유전자는 전염증성 사이토카인(proinflammatory cytokine)의 발현을 억제하거나 저해시킬 수 있다.
상기 면역 참여 유전자는 염증성 사이토카인(inflammatory cytokine)의 발현을 촉진하거나 증가시킬 수 있다.
상기 면역 참여 유전자는 염증성 사이토카인(inflammatory cytokine)의 발현을 억제하거나 저해시킬 수 있다.
상기 면역 참여 유전자는 세포 내 및/또는 외의 Toll/interleukin-1 receptor(TIR) 도메인 간의 상호작용을 촉진하거나 증가시킬 수 있다.
상기 면역 참여 유전자는 세포 내 및/또는 외의 Toll/interleukin-1 receptor(TIR) 도메인 간의 상호작용을 억제하거나 저해할 수 있다.
상기 면역 참여 유전자는 Toll/interleukin-1 receptor(TIR) 도메인과 상호작용할 수 있다.
상기 면역 참여 유전자는 Toll/interleukin-1 receptor(TIR) 도메인을 포함하는 폴리펩타이드 또는 단백질이거나 또는 이를 암호화하는 유전자 일 수 있다.
상기 면역 참여 유전자는 Toll receptor 또는 Toll like receptor에 의해 매개되는 세포 내 신호전달을 촉진하거나 증가시킬 수 있다.
상기 면역 참여 유전자는 Toll receptor 또는 Toll like receptor에 의해 매개되는 세포 내 신호전달을 억제시키거나 저해할 수 있다.
상기 면역 참여 유전자는 Toll receptor 또는 Toll like receptor와 상호작용할 수 있다.
상기 면역 참여 유전자는 interleukin-1 receptor에 의해 매개되는 세포 내 신호전달을 촉진시키거나 증가시킬 수 있다.
상기 면역 참여 유전자는 interleukin-1 receptor에 의해 매개되는 세포 내 신호전달을 억제시키거나 저해시킬 수 있다.
상기 면역 참여 유전자는 interleukin-1 receptor와 상호작용할 수 있다.
상기 면역 참여 유전자는 세포 내 및/또는 외의 Death 도메인 간의 상호작용을 촉진하거나 증가시킬 수 있다.
상기 면역 참여 유전자는 세포 내 및/또는 외의 Death 도메인 간의 상호작용을 억제하거나 저해할 수 있다.
상기 면역 참여 유전자는 Death 도메인과 상호작용할 수 있다.
상기 면역 참여 유전자는 Death 도메인을 포함하는 폴리펩타이드 또는 단백질이거나 또는 이를 암호화하는 유전자 일 수 있다.
상기 면역 참여 유전자는 IRAK(interleukin-1 receptor-associated kinase) family 중 하나 이상에 의해 매개되는 세포 내 신호전달을 촉진하거나 증가시킬 수 있다.
상기 면역 참여 유전자는 IRAK(interleukin-1 receptor-associated kinase) family 중 하나 이상에 의해 매개되는 세포 내 신호전달을 억제하거나 저해할 수 있다.
상기 면역 참여 유전자는 IRAK(interleukin-1 receptor-associated kinase) family 중 하나 이상과 상호작용할 수 있다.
이때, 상기 IRAK(interleukin-1 receptor-associated kinase) family는 IRAK1, IRAK2, IRAK3 및 IRAK4로 구성된다.
상기 면역 참여 유전자는 Complement system 조절할 수 있다.
상기 면역 참여 유전자는 Complement system 중 classical pathway를 조절할 수 있다.
상기 면역 참여 유전자는 Complement system 중 lectin pathway를 조절할 수 있다.
상기 면역 참여 유전자는 Complement system 중 alternative pathway를 조절할 수 있다.
상기 면역 참여 유전자는 Complement system 매개 염증반응을 조절할 수 있다.
상기 면역 참여 유전자는 Complement system 매개 세포 용해(lysis)를 조절할 수 있다.
상기 면역 참여 유전자는 Complement system 매개 옵소닌작용(opsonization)을 조절할 수 있다.
상기 면역 참여 유전자는 Complement system을 조절하는 complement component 간의 상호작용을 촉진하거나 증가시킬 수 있다.
상기 면역 참여 유전자는 Complement system을 조절하는 complement component 간의 상호작용을 억제시키거나 저해시킬 수 있다.
상기 면역 참여 유전자는 항체 생성에 관한 기능 조절할 수 있다.
구현예에서,
본 명세서에 의해 개시되는 면역 참여 유전자는 Death 도메인 및/또는 Toll/interleukin-1 receptor(TIR) 도메인을 포함하는 폴리펩타이드 또는 단백질을 암호화하는 유전자일 수 있다.
Death 도메인은 주로 apoptosis와 inflammation을 조절하는 단백질에서 발견되는 단백질 모티프(motif) 중 하나로, death 도메인을 포함하는 단백질로는 TNF receptor, ankyrin, MyD88, IRAK family 등이 있다.
Toll/interleukin-1 receptor(TIR) 도메인은 세포 내 신호전달 도메인으로, MyD88, interleukin-1 receptor, Toll receptor, Toll like receptor 및 plant R 단백질에서 주로 발견되며, TIR 도메인을 포함하는 단백질로는 IL18R1, IL18RAP, IL1R1, IL1RAP, IL1RAPL1, IL1RAPL2, IL1RL1, IL1RL2, MYD88, SIGIRR, TLR1, TLR10, TLR2, TLR3, TLR4, TLR5, TLR6, TLR7, TLR8, TLR9 등이 있다.
상기 면역 참여 유전자는 MYD88 유전자일 수 있다.
MYD88(Myeloid differentiation primary response 88) 유전자는 296개의 아미노산으로 구성되며 Death 도메인 및 Toll/interleukin-1 receptor(TIR) 도메인을 가지는 단백질로서 MYD88D로도 칭해지는 단백질을 암호화하는 유전자(전장 DNA, cDNA 또는 mRNA)를 의미한다. 일 예에서, MYD88 유전자는 다음으로 이루어진 군에서 선택된 하나 이상일 수 있으나, 이에 제한되는 것은 아니다: 인간 MYD88 (e.g., NCBI Accession No. NP_001166037, NP_001166038, NP_001166039, NP_001166040, NP_002459 등)을 암호화하는 유전자, 예컨대, NCBI Accession No. NM_001172566, NM_001172567, NM_001172568, NM_001172569, NM_002468 등으로 표현되는 MYD88 유전자.
상기 면역 참여 인자는 인간, 원숭이 등의 영장류, 래트, 마우스 등의 설치류 등을 포함하는 포유류로부터 유래하는 것일 수 있다.
유전자 정보는 NCBI (National Center for Biotechnology Information)의 GenBank와 같은 공지의 데이터 베이스에서 얻을 수 있다.
구현예에서,
본 명세서에 의해 개시되는 면역 참여 유전자는 Complement component 단백질을 암호화하는 유전자일 수 있다.
Complement component는 Complement system을 조절하는 단백질로서, C1, C2, C3, C4, C5, C6, C7, C8, C9 등이 있다.
상기 면역 참여 유전자는 C3 유전자일 수 있다.
C3(Complement component 3) 유전자는 1663개의 아미노산으로 구성된 단백질로서 complement C3, C3a, C3b, ASP, AHUS5, ARMD9, CPAMD1 또는 HEL-S-62p로도 칭해지는 단백질을 암호화하는 유전자(전장 DNA, cDNA 또는 mRNA)를 의미한다. 일 예에서, C3 유전자는 다음으로 이루어진 군에서 선택된 하나 이상일 수 있으나, 이에 제한되는 것은 아니다: 인간 C3 (e.g., NCBI Accession No. NP_000055 등)을 암호화하는 유전자, 예컨대, NCBI Accession No. NM_000064 등으로 표현되는 C3 유전자.
상기 면역 참여 인자는 인간, 원숭이 등의 영장류, 래트, 마우스 등의 설치류 등을 포함하는 포유류로부터 유래하는 것일 수 있다.
유전자 정보는 NCBI (National Center for Biotechnology Information)의 GenBank와 같은 공지의 데이터 베이스에서 얻을 수 있다.
구현예에서,
본 명세서에 의해 개시되는 면역 참여 유전자는 Death 도메인 및/또는 Toll/interleukin-1 receptor(TIR) 도메인을 포함하는 폴리펩타이드 또는 단백질을 암호화하는 유전자이거나 및/또는 Complement component 단백질을 암호화하는 유전자일 수 있다.
상기 면역 참여 유전자는 MYD88 유전자 및/또는 C3 유전자일 수 있다.
본 명세서에 의해 개시되는 내용의 일 구현예에서, 가이드핵산은 MYD88 유전자의 표적 서열에 상보적으로 결합하는 gRNA일 수 있다.
본 명세서에 의해 개시되는 내용의 다른 구현예에서, 가이드핵산은 C3 유전자의 표적 서열에 상보적으로 결합하는 gRNA일 수 있다.
“표적 서열”은 표적 유전자 또는 핵산 내에 존재하는 뉴클레오타이드 서열로, 구체적으로는 표적 유전자 또는 핵산 내에 표적 영역의 일부 뉴클레오타이드 서열이며, 이때 “표적 영역”은 표적 유전자 또는 핵산 내에 가이드핵산-에디터단백질에 의해 변형될 수 있는 부위이다.
본 명세서에 의해 개시되는 표적 유전자는 면역 참여 유전자일 수 있다.
본 명세서에 의해 개시되는 표적 유전자는 MYD88 유전자 및/또는 C3 유전자일 수 있다.
이하에서, 표적 서열이라 함은 두 가지의 뉴클레오타이드 서열 정보 모두를 의미하는 용어로 사용될 수 있다. 예를 들어, 표적 유전자의 경우, 표적 서열은 표적 유전자 DNA의 transcribed strand의 서열 정보를 의미하는 것일 수도 있고, 또는 non-transcribed strand의 뉴클레오타이드 서열 정보를 의미하는 것일 수도 있다.
예를 들어, 표적 서열은 표적 유전자 A의 표적 영역 중 일부 뉴클레오타이드 서열(transcribed strand)인 5'-ATCATTGGCAGACTAGTTCG-3'(SEQ ID NO: 17)을 의미할 수도 있으며, 이에 상보적인 뉴클레오타이드 서열(non-transcribed strand)인 5'-CGAACTAGTCTGCCAATGAT-3'(SEQ ID NO: 18)을 의미할 수도 있다.
표적 서열은 5 내지 50개의 뉴클레오타이드 서열일 수 있다.
일 구체예로서 상기 표적 서열은 16개의 뉴클레오타이드 서열, 17개의 뉴클레오타이드 서열, 18개의 뉴클레오타이드 서열, 19개의 뉴클레오타이드 서열, 20개의 뉴클레오타이드 서열, 21개의 뉴클레오타이드 서열, 22개의 뉴클레오타이드 서열, 23개의 뉴클레오타이드 서열, 24개의 뉴클레오타이드 서열 또는 25개의 뉴클레오타이드 서열일 수 있다.
표적 서열은 가이드핵산 결합 서열 혹은 가이드핵산 비결합 서열을 포함한다.
“가이드핵산 결합 서열”은 가이드핵산의 가이드 도메인에 포함되는 가이드 서열과 상보성을 가지는 뉴클레오타이드 서열로, 가이드핵산의 가이드 도메인에 포함되는 가이드 서열과 상보적인 결합을 할 수 있다. 표적 서열 및 가이드핵산 결합 서열은 표적 유전자 또는 핵산에 따라, 즉 유전자 조작 또는 교정하고자 하는 대상에 따라 달라질 수 있는 뉴클레오타이드 서열로, 표적 유전자 또는 핵산에 따라 다양하게 설계될 수 있다.
“가이드핵산 비결합 서열”은 가이드핵산의 가이드 도메인에 포함되는 가이드 서열과 상동성을 가지는 뉴클레오타이드 서열로, 가이드핵산의 가이드 도메인에 포함되는 가이드 서열과 상보적인 결합을 할 수 없다. 또한, 가이드핵산 비결합 서열은 가이드핵산 결합 서열과 상보성을 가지는 뉴클레오타이드 서열로, 가이드핵산 결합 서열과 상보적인 결합을 할 수 있다.
가이드핵산 결합 서열은 표적 서열 중 일부 뉴클레오타이드 서열로, 표적 서열의 두 가지 서로 다른 서열순서를 가지는 뉴클레오타이드 서열, 즉, 서로 상보적인 결합을 할 수 있는 두 가지의 뉴클레오타이드 서열 중 한 가지 뉴클레오타이드 서열일 수 있다. 이때, 가이드핵산 비결합 서열은 표적 서열 중 가이드핵산 결합 서열을 제외한 나머지 뉴클레오타이드 서열일 수 있다.
예를 들면, 표적 유전자 A의 표적 영역 중 일부 뉴클레오타이드 서열인 5'-ATCATTGGCAGACTAGTTCG-3'(SEQ ID NO: 17)과 이에 상보적인 뉴클레오타이드 서열인 5'-CGAACTAGTCTGCCAATGAT-3'(SEQ ID NO: 18)을 표적 서열로 할 때, 가이드핵산 결합 서열은 두 개의 표적 서열 중 하나, 즉, 5'-ATCATTGGCAGACTAGTTCG-3'(SEQ ID NO: 17) 또는 5'-CGAACTAGTCTGCCAATGAT-3'(SEQ ID NO: 18)일 수 있다. 이때, 가이드핵산 비결합 서열은, 가이드핵산 결합 서열이 5'-ATCATTGGCAGACTAGTTCG-3'(SEQ ID NO: 17)인 경우, 5'-CGAACTAGTCTGCCAATGAT-3'(SEQ ID NO: 18)일 수 있고, 또는 가이드핵산 결합 서열이 5'-CGAACTAGTCTGCCAATGAT-3'(SEQ ID NO: 18)인 경우 가이드핵산 비결합 서열은 5'-ATCATTGGCAGACTAGTTCG-3'(SEQ ID NO: 17)일 수 있다.
가이드핵산 결합 서열은 표적 서열, 즉, transcribed strand와 동일한 뉴클레오타이드 서열 및 non-transcribed strand와 동일한 뉴클레오타이드 서열 중 선택된 하나의 뉴클레오타이드 서열일 수 있다. 이때, 가이드핵산 비결합 서열은 표적 서열 중 가이드핵산 결합 서열, 즉, transcribed strand와 동일한 뉴클레오타이드 서열 및 non-transcribed strand와 동일한 뉴클레오타이드 서열 중 선택된 하나의 뉴클레오타이드 서열을 제외한 나머지 뉴클레오타이드 서열일 수 있다.
가이드핵산 결합 서열은 표적 서열의 길이와 동일할 수 있다.
가이드핵산 비결합 서열은 표적 서열 또는 가이드핵산 결합 서열의 길이와 동일할 수 있다.
가이드핵산 결합 서열은 5 내지 50개의 뉴클레오타이드 서열일 수 있다.
일 구체예로서 상기 가이드핵산 결합 서열은 16개의 뉴클레오타이드 서열, 17개의 뉴클레오타이드 서열, 18개의 뉴클레오타이드 서열, 19개의 뉴클레오타이드 서열, 20개의 뉴클레오타이드 서열, 21개의 뉴클레오타이드 서열, 22개의 뉴클레오타이드 서열, 23개의 뉴클레오타이드 서열, 24개의 뉴클레오타이드 서열 또는 25개의 뉴클레오타이드 서열일 수 있다.
가이드핵산 비결합 서열은 5 내지 50개의 뉴클레오타이드 서열일 수 있다.
일 구체예로서 상기 가이드핵산 비결합 서열은 16개의 뉴클레오타이드 서열, 17개의 뉴클레오타이드 서열, 18개의 뉴클레오타이드 서열, 19개의 뉴클레오타이드 서열, 20개의 뉴클레오타이드 서열, 21개의 뉴클레오타이드 서열, 22개의 뉴클레오타이드 서열, 23개의 뉴클레오타이드 서열, 24개의 뉴클레오타이드 서열 또는 25개의 뉴클레오타이드 서열일 수 있다.
가이드핵산 결합 서열은 가이드핵산의 가이드 도메인에 포함된 가이드 서열과 상보적인 결합을 할 수 있으며, 상기 가이드핵산 결합 서열의 길이는 가이드 서열의 길이와 동일할 수 있다.
상기 가이드핵산 결합 서열은 가이드핵산의 가이드 도메인에 포함된 가이드 서열에 상보적인 뉴클레오타이드 서열일 수 있으며, 예를 들어 최소한 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상보적이거나 또는 완전하게 상보적인 뉴클레오타이드 서열일 수 있다.
일 예로, 상기 가이드핵산 결합 서열은 가이드핵산의 가이드 도메인에 포함된 가이드 서열에 상보적이지 않은 1 내지 8개의 뉴클레오타이드 서열을 가지거나 또는 포함할 수 있다.
가이드핵산 비결합 서열은 가이드핵산의 가이드 도메인에 포함된 가이드 서열과 상동성을 가질 수 있으며, 상기 가이드핵산 비결합 서열의 길이는 가이드 서열의 길이와 동일할 수 있다.
상기 가이드핵산 비결합 서열은 가이드핵산의 가이드 도메인에 포함된 가이드 서열에 상동성을 가진 뉴클레오타이드 서열일 수 있으며, 예를 들어 최소한 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상동성이거나 또는 완전하게 상동성인 뉴클레오타이드 서열일 수 있다.
일 예로, 상기 가이드핵산 비결합 서열은 가이드핵산의 가이드 도메인에 포함된 가이드 서열에 상동적이 않은 1 내지 8개의 뉴클레오타이드 서열을 가지거나 포함할 수 있다.
가이드핵산 비결합 서열은 가이드핵산 결합 서열과 상보적 결합을 할 수 있으며, 상기 가이드핵산 비결합 서열은 가이드핵산 결합 서열의 길이와 동일할 수 있다.
상기 가이드핵산 비결합 서열은 가이드핵산 결합서열에 상보적인 뉴클레오타이드 서열일 수 있으며, 예를 들어 최소한 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상보적이거나 또는 완전하게 상보적인 뉴클레오타이드 서열일 수 있다.
일 예로, 상기 가이드핵산 비결합 서열은 가이드핵산 결합 서열에 상보적이지 않은 1 내지 8개의 뉴클레오타이드 서열을 가지거나 포함할 수 있다.
또한, 상기 가이드핵산 결합 서열은 에디터단백질이 인식할 수 있는 뉴클레오타이드 서열에 근접한 위치에 위치한 뉴클레오타이드 서열일 수 있다.
일 예로, 상기 가이드핵산 결합 서열은 에디터단백질이 인식할 수 있는 뉴클레오타이드 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 5 내지 50개의 뉴클레오타이드 서열일 수 있다.
또한, 상기 가이드핵산 비결합 서열은 에디터단백질이 인식할 수 있는 뉴클레오타이드 서열에 근접한 위치에 뉴클레오타이드 서열일 수 있다.
일 예로, 상기 가이드핵산 비결합 서열은 에디터단백질이 인식할 수 있는 뉴클레오타이드 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 5 내지 50개의 뉴클레오타이드 서열일 수 있다.
구현예에서,
본 명세서에 의해 개시되는 표적 서열은 면역 참여 유전자의 프로모터 영역에 위치한 연속하는 10 내지 35개의 뉴클레오타이드 서열일 수 있다.
이때, 상기 표적 서열은 10 내지 35개의 뉴클레오타이드 서열, 15 내지 35개의 뉴클레오타이드 서열, 20 내지 35개의 뉴클레오타이드 서열, 25 내지 35개의 뉴클레오타이드 서열 또는 30 내지 35개의 뉴클레오타이드 서열일 수 있다.
또는 상기 표적 서열은 10 내지 15개의 뉴클레오타이드 서열, 15 내지 20개의 뉴클레오타이드 서열, 20 내지 25개의 뉴클레오타이드 서열, 25 내지 30개의 뉴클레오타이드 서열 또는 30 내지 35개의 뉴클레오타이드 서열일 수 있다.
일 예로, 상기 표적 서열은 MYD88 유전자의 프로모터 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
다른 예로, 상기 표적 서열은 C3 유전자의 프로모터 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
본 명세서에 의해 개시되는 표적 서열은 면역 참여 유전자의 인트론 영역에 위치한 연속하는 10 내지 35개의 뉴클레오타이드 서열일 수 있다.
이때, 상기 표적 서열은 10 내지 35개의 뉴클레오타이드 서열, 15 내지 35개의 뉴클레오타이드 서열, 20 내지 35개의 뉴클레오타이드 서열, 25 내지 35개의 뉴클레오타이드 서열 또는 30 내지 35개의 뉴클레오타이드 서열일 수 있다.
또는 상기 표적 서열은 10 내지 15개의 뉴클레오타이드 서열, 15 내지 20개의 뉴클레오타이드 서열, 20 내지 25개의 뉴클레오타이드 서열, 25 내지 30개의 뉴클레오타이드 서열 또는 30 내지 35개의 뉴클레오타이드 서열일 수 있다.
일 예로, 상기 표적 서열은 MYD88 유전자의 인트론 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
다른 예로, 상기 표적 서열은 C3 유전자의 인트론 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
본 명세서에 의해 개시되는 표적 서열은 면역 참여 유전자의 엑손 영역에 위치한 연속하는 10 내지 35개의 뉴클레오타이드 서열일 수 있다.
이때, 상기 표적 서열은 10 내지 35개의 뉴클레오타이드 서열, 15 내지 35개의 뉴클레오타이드 서열, 20 내지 35개의 뉴클레오타이드 서열, 25 내지 35개의 뉴클레오타이드 서열 또는 30 내지 35개의 뉴클레오타이드 서열일 수 있다.
또는 상기 표적 서열은 10 내지 15개의 뉴클레오타이드 서열, 15 내지 20개의 뉴클레오타이드 서열, 20 내지 25개의 뉴클레오타이드 서열, 25 내지 30개의 뉴클레오타이드 서열 또는 30 내지 35개의 뉴클레오타이드 서열일 수 있다.
일 예로, 상기 표적 서열은 MYD88 유전자의 엑손 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
다른 예로, 상기 표적 서열은 C3 유전자의 엑손 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
본 명세서에 의해 개시되는 표적 서열은 면역 참여 유전자의 인핸서 영역에 위치한 연속하는 10 내지 35개의 뉴클레오타이드 서열일 수 있다.
이때, 상기 표적 서열은 10 내지 35개의 뉴클레오타이드 서열, 15 내지 35개의 뉴클레오타이드 서열, 20 내지 35개의 뉴클레오타이드 서열, 25 내지 35개의 뉴클레오타이드 서열 또는 30 내지 35개의 뉴클레오타이드 서열일 수 있다.
또는 상기 표적 서열은 10 내지 15개의 뉴클레오타이드 서열, 15 내지 20개의 뉴클레오타이드 서열, 20 내지 25개의 뉴클레오타이드 서열, 25 내지 30개의 뉴클레오타이드 서열 또는 30 내지 35개의 뉴클레오타이드 서열일 수 있다.
일 예로, 상기 표적 서열은 MYD88 유전자의 인핸서 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
다른 예로, 상기 표적 서열은 C3 유전자의 인핸서 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
본 명세서에 의해 개시되는 표적 서열은 면역 참여 유전자의 암호화, 비암호화 또는 이의 혼합 부분의 위치한 연속하는 10 내지 35개의 뉴클레오타이드 서열일 수 있다.
이때, 상기 표적 서열은 10 내지 35개의 뉴클레오타이드 서열, 15 내지 35개의 뉴클레오타이드 서열, 20 내지 35개의 뉴클레오타이드 서열, 25 내지 35개의 뉴클레오타이드 서열 또는 30 내지 35개의 뉴클레오타이드 서열일 수 있다.
또는 상기 표적 서열은 10 내지 15개의 뉴클레오타이드 서열, 15 내지 20개의 뉴클레오타이드 서열, 20 내지 25개의 뉴클레오타이드 서열, 25 내지 30개의 뉴클레오타이드 서열 또는 30 내지 35개의 뉴클레오타이드 서열일 수 있다.
일 예로, 상기 표적 서열은 MYD88 유전자의 암호화, 비암호화 또는 이의 혼합 부분의 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
다른 예로, 상기 표적 서열은 C3 유전자의 암호화, 비암호화 또는 이의 혼합 부분의 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
본 명세서에 의해 개시되는 표적 서열은 면역 참여 유전자의 프로모터, 인핸서, 3'UTR, 폴리아데닐(polyA) 또는 이의 혼합 부분의 위치한 연속하는 10 내지 35개의 뉴클레오타이드 서열일 수 있다.
이때, 상기 표적 서열은 10 내지 35개의 뉴클레오타이드 서열, 15 내지 35개의 뉴클레오타이드 서열, 20 내지 35개의 뉴클레오타이드 서열, 25 내지 35개의 뉴클레오타이드 서열 또는 30 내지 35개의 뉴클레오타이드 서열일 수 있다.
또는 상기 표적 서열은 10 내지 15개의 뉴클레오타이드 서열, 15 내지 20개의 뉴클레오타이드 서열, 20 내지 25개의 뉴클레오타이드 서열, 25 내지 30개의 뉴클레오타이드 서열 또는 30 내지 35개의 뉴클레오타이드 서열일 수 있다.
일 예로, 상기 표적 서열은 MYD88 유전자의 프로모터, 인핸서, 3'UTR, 폴리아데닐(polyA) 또는 이의 혼합 부분의 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
다른 예로, 상기 표적 서열은 C3 유전자의 프로모터, 인핸서, 3'UTR, 폴리아데닐(polyA) 또는 이의 혼합 부분의 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
본 명세서에 의해 개시되는 표적 서열은 면역 참여 유전자의 엑손, 인트론 또는 이의 혼합 부분의 위치한 연속하는 10 내지 35개의 뉴클레오타이드 서열일 수 있다.
이때, 상기 표적 서열은 10 내지 35개의 뉴클레오타이드 서열, 15 내지 35개의 뉴클레오타이드 서열, 20 내지 35개의 뉴클레오타이드 서열, 25 내지 35개의 뉴클레오타이드 서열 또는 30 내지 35개의 뉴클레오타이드 서열일 수 있다.
또는 상기 표적 서열은 10 내지 15개의 뉴클레오타이드 서열, 15 내지 20개의 뉴클레오타이드 서열, 20 내지 25개의 뉴클레오타이드 서열, 25 내지 30개의 뉴클레오타이드 서열 또는 30 내지 35개의 뉴클레오타이드 서열일 수 있다.
일 예로, 상기 표적 서열은 MYD88 유전자의 엑손, 인트론 또는 이의 혼합 부분의 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
다른 예로, 상기 표적 서열은 C3 유전자의 엑손, 인트론 또는 이의 혼합 부분의 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
본 명세서에 의해 개시되는 표적 서열은 면역 참여 유전자의 돌연변이 부분(예를 들면, 야생형 유전자와 다른 부분)을 포함하거나 또는 근접한 연속하는 10 내지 35개의 뉴클레오타이드 서열일 수 있다.
이때, 상기 표적 서열은 10 내지 35개의 뉴클레오타이드 서열, 15 내지 35개의 뉴클레오타이드 서열, 20 내지 35개의 뉴클레오타이드 서열, 25 내지 35개의 뉴클레오타이드 서열 또는 30 내지 35개의 뉴클레오타이드 서열일 수 있다.
또는 상기 표적 서열은 10 내지 15개의 뉴클레오타이드 서열, 15 내지 20개의 뉴클레오타이드 서열, 20 내지 25개의 뉴클레오타이드 서열, 25 내지 30개의 뉴클레오타이드 서열 또는 30 내지 35개의 뉴클레오타이드 서열일 수 있다.
일 예로, 상기 표적 서열은 MYD88 유전자의 돌연변이 부분(예를 들면, 야생형 유전자와 다른 부분)을 포함하거나 또는 근접한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
다른 예로, 상기 표적 서열은 C3 유전자의 돌연변이 부분(예를 들면, 야생형 유전자와 다른 부분)을 포함하거나 또는 근접한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
본 명세서에 의해 개시되는 표적 서열은 면역 참여 유전자의 핵산서열 내의 PAM(proto-spacer-adjacent Motif) 서열의 5' 말단 및/또는 3' 말단에 인접한 연속하는 10 내지 35개의 뉴클레오타이드 서열일 수 있다.
“PAM(proto-spacer-adjacent Motif) 서열”은 에디터단백질이 인식할 수 있는 뉴클레오타이드 서열이다. 이때, PAM 서열은 에디터단백질의 종류 및 유래된 종에 따라 뉴클레오타이드 서열에 차이가 있을 수 있다.
이때, 상기 PAM 서열은 예를 들어, 하기의 서열 중 1 이상일 수 있다(5'에서 3'방향으로 기재함).
NGG(N은 A, T, C 또는 G임);
NNNNRYAC(N은 각각 독립적으로 A, T, C 또는 G이고, R은 A또는 G이고, Y는 C또는 T임);
NNAGAAW(N은 각각 독립적으로 A, T, C 또는 G이고, W는 A 또는 T임);
NNNNGATT(N은 각각 독립적으로 A, T, C 또는 G임);
NNGRR(T)(N은 각각 독립적으로 A, T, C 또는 G이고, R은 A 또는 G임); 및
TTN(N은 A, T, C 또는 G임).
이때, 상기 표적 서열은 10 내지 35개의 뉴클레오타이드 서열, 15 내지 35개의 뉴클레오타이드 서열, 20 내지 35개의 뉴클레오타이드 서열, 25 내지 35개의 뉴클레오타이드 서열 또는 30 내지 35개의 뉴클레오타이드 서열일 수 있다.
또는 상기 표적 서열은 10 내지 15개의 뉴클레오타이드 서열, 15 내지 20개의 뉴클레오타이드 서열, 20 내지 25개의 뉴클레오타이드 서열, 25 내지 30개의 뉴클레오타이드 서열 또는 30 내지 35개의 뉴클레오타이드 서열일 수 있다.
일 예로, 상기 표적 서열은 MYD88 유전자의 핵산서열 내의 PAM 서열의 5' 말단 및/또는 3' 말단에 인접한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 MYD88 유전자의 핵산서열 내의 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NGGNG-3' 또는/및 5'-NNAGAAW-3' (W = A 또는 T이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 MYD88 유전자의 핵산서열 내의 5'-NGGNG-3' 또는/및 5'-NNAGAAW-3' (W = A 또는 T이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
또 다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNNNGATT-3' 또는/및 5'-NNNGCTT-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 MYD88 유전자의 핵산서열 내의 5'-NNNNGATT-3' 또는/및 5'-NNNGCTT-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNNVRYAC-3' (V = G, C 또는 A; R = A 또는 G 이며, Y = C 또는 T 이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 MYD88 유전자의 핵산서열 내의 5'-NNNVRYAC-3' (V = G, C 또는 A; R = A 또는 G 이며, Y = C 또는 T 이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NAAR-3'(R = A 또는 G이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 MYD88 유전자의 핵산서열 내의 5'-NAAR-3'(R = A 또는 G이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
또 다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNGRR-3', 5'-NNGRRT-3' 또는/및 5'-NNGRRV-3' (R = A 또는 G이며, V = G, C 또는 A이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 MYD88 유전자의 핵산서열 내의 5'-NNGRR-3', 5'-NNGRRT-3' 또는/및 5'-NNGRRV-3' (R = A 또는 G이며, V = G, C 또는 A이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-TTN-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 MYD88 유전자의 핵산서열 내의 5'-TTN-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
다른 예로, 상기 표적 서열은 C3 유전자의 핵산서열 내의 PAM 서열의 5' 말단 및/또는 3' 말단에 인접한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 C3 유전자의 핵산서열 내의 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NGGNG-3' 또는/및 5'-NNAGAAW-3' (W = A 또는 T이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 C3 유전자의 핵산서열 내의 5'-NGGNG-3' 또는/및 5'-NNAGAAW-3' (W = A 또는 T이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
또 다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNNNGATT-3' 또는/및 5'-NNNGCTT-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 C3 유전자의 핵산서열 내의 5'-NNNNGATT-3' 또는/및 5'-NNNGCTT-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNNVRYAC-3' (V = G, C 또는 A; R = A 또는 G 이며, Y = C 또는 T 이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 C3 유전자의 핵산서열 내의 5'-NNNVRYAC-3' (V = G, C 또는 A; R = A 또는 G 이며, Y = C 또는 T 이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NAAR-3'(R = A 또는 G이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 C3 유전자의 핵산서열 내의 5'-NAAR-3'(R = A 또는 G이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
또 다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNGRR-3', 5'-NNGRRT-3' 또는/및 5'-NNGRRV-3' (R = A 또는 G이며, V = G, C 또는 A이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 C3 유전자의 핵산서열 내의 5'-NNGRR-3', 5'-NNGRRT-3' 또는/및 5'-NNGRRV-3' (R = A 또는 G이며, V = G, C 또는 A이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-TTN-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 C3 유전자의 핵산서열 내의 5'-TTN-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
이하, 본 발명의 일 구체예에서 사용할 수 있는 표적 서열들의 일 예들을 표로 나타내며, 표에 기재된 표적 서열은 가이드핵산 비결합 서열로, 기재한 서열을 통해 상보적인 서열, 즉, 가이드핵산 결합 서열은 예측될 수 있다:
CjCas9을 위한 MYD88 유전자의 표적 서열(Target sequences of MYD88 gene for CjCas9)
Loci.(Exon) Target(w/o PAM) (SEQ ID NO) PAM
E01 GTTCAAGAACAGAGACAGGCGG (SEQ ID NO: 19) CGCCGCAC
E01 GCCTGTCTCTGTTCTTGAACGT (SEQ ID NO: 20) GCGGACAC
E01 GGTCCAGTCGGCCGCCACCTGT (SEQ ID NO: 21) GTCCGCAC
E01 GCGCTGGCGGAGGAGATGGACT (SEQ ID NO: 22) TTGAGTAC
E01 TGTGTCTCCAGTTGCCGGATCT (SEQ ID NO: 23) CCAAGTAC
E01 AGTACTTGGAGATCCGGCAACT (SEQ ID NO: 24) GGAGACAC
E01 ACCAATGCTGGGTCCCAGCTCC (SEQ ID NO: 25) AGCAGCAC
E02 GCCTCCTCCTGCTGCTGCTTCA (SEQ ID NO: 26) AGATATAC
E02 TGCCCGCCAGCTCTGCTGTCCG (SEQ ID NO: 27) TGGGACAC
E02 GGACAGCAGAGCTGGCGGGCAT (SEQ ID NO: 28) CACCACAC
E03 CTGTTCCAGTTGCCGGATCATC (SEQ ID NO: 29) TCCTGCAC
E03 CCAGGCAGGACATCGCGGTCAG (SEQ ID NO: 30) ACACACAC
E03 TGCCAGGCAGGACATCGCGGTC (SEQ ID NO: 31) AGACACAC
E03 GGTGCCAGGCAGGACATCGCGG (SEQ ID NO: 32) TCAGACAC
E03 TGTGTCTGACCGCGATGTCCTG (SEQ ID NO: 33) CCTGGCAC
E03 CGATGAGCTCACTAGCAATAGA (SEQ ID NO: 34) CCAGACAC
E04 TCAGAGACAACCACCACCATCC (SEQ ID NO: 35) GGCGGCAC
E04 AGGAATGTGACTTCCAGACCAA (SEQ ID NO: 36) ATTTGCAC
E05 TGATGGGGATCAGTCGCTTCTG (SEQ ID NO: 37) ATGGGCAC
E05 CATCAGAAGCGACTGATCCCCA (SEQ ID NO: 38) TCAAGTAC
E05 CTGGGGAACTCTTTCTTCATTG (SEQ ID NO: 39) CCTTGTAC
E05 CCTGAGGTTCATCACTGTCTGC (SEQ ID NO: 40) GACTACAC
E05 CACTGTCTGCGACTACACCAAC (SEQ ID NO: 41) CCCTGCAC
CjCas9을 위한 C3 유전자의 표적 서열(Target sequences of C3 gene for CjCas9)
Loci.(Exon) Target (w/o PAM) (SEQ ID NO) PAM
E02 CGCAAGATGTTGGGGGTGATGA (SEQ ID NO: 42) TAGAGTAC
E02 ATCCCCTTGCGCGTCGTGGGCC (SEQ ID NO: 43) TCCAGCAC
E02 GGTCAGCACAGTCTTCTCACTG (SEQ ID NO: 44) GACAGCAC
E02 GCCCATGTGGTTGGTGGCAGGG (SEQ ID NO: 45) GTCAGCAC
E03 CACCACTTGGGTCCCGAAGGTG (SEQ ID NO: 46) GCCTGCAC
E03 GAGGTACCCGCTCTGCAGGCTG (SEQ ID NO: 47) ACCAGCAC
E03 GTGGTGCTGGTCAGCCTGCAGA (SEQ ID NO: 48) GCGGGTAC
E03 ATGGTCTTGTCTGTCTGGATGA (SEQ ID NO: 49) AGAGGTAC
E03 CTTCATCCAGACAGACAAGACC (SEQ ID NO: 50) ATCTACAC
E06 TTCTCCACTGAGTTTGAGGTGA (SEQ ID NO: 51) AGGAGTAC
E07 CTCCACTATGACCTCGAAACTG (SEQ ID NO: 52) GGCAGCAC
E08 TGCCTGAATCCCTCAAGCGCAT (SEQ ID NO: 53) TCCGGTAC
E09 CGGGGGAGGTTGTGCTGAGCCG (SEQ ID NO: 54) GAAGGTAC
E09 CCCGTCCAGCAGTACCTTCCGG (SEQ ID NO: 55) CTCAGCAC
E09 TCGGGGGTTCTGCACCCCGTCC (SEQ ID NO: 56) AGCAGTAC
E09 CACCAGGTCTTCTGCTCGGGGG (SEQ ID NO: 57) TTCTGCAC
E09 GCAGAAGACCTGGTGGGGAAGT (SEQ ID NO: 58) CTTTGTAC
E09 GAGTGCAAGATGACGGTGGCAG (SEQ ID NO: 59) ACACGTAC
E09 ACCTGAGTGCAAGATGACGGTG (SEQ ID NO: 60) GCAGACAC
E09 TTGTACGTGTCTGCCACCGTCA (SEQ ID NO: 61) TCTTGCAC
E10 GATGGGGATCCCGCTGCGCTCT (SEQ ID NO: 62) GCCTGCAC
E10 CTCCCTACCAGATCCACTTCAC (SEQ ID NO: 63) CAAGACAC
E10 CAGATCCACTTCACCAAGACAC (SEQ ID NO: 64) CCAAGTAC
E10 AGGTCAAAGGGCATTCCTGGTT (SEQ ID NO: 65) TGAAGTAC
E11 TGGAGAGCCATCAGGGTTCGTC (SEQ ID NO: 66) ACGAACAC
E11 AGTCCCCGTGGCAGTCCAGGGC (SEQ ID NO: 67) GAGGACAC
E11 CACGCCATCTCCCTGGGTTAGA (SEQ ID NO: 68) GACTGCAC
E11 AGATGGCGTGGCCAAACTCAGC (SEQ ID NO: 69) ATCAACAC
E11 ATGGCGTGGCCAAACTCAGCAT (SEQ ID NO: 70) CAACACAC
E11 GGCGTGGCCAAACTCAGCATCA (SEQ ID NO: 71) ACACACAC
E12 CTCCGAGAGCTCCTGCTTCTTC (SEQ ID NO: 72) GTGCGCAC
E12 CAGGACCATGCAGGCTCTGCCC (SEQ ID NO: 73) TACAGCAC
E12 CAATTACCTGCATCTCTCAGTG (SEQ ID NO: 74) CTACGTAC
E12 CTCCCCGGGTCTGAGCTCTGTA (SEQ ID NO: 75) CGTAGCAC
E12 TGAGGGTCTCCCCGGGTCTGAG (SEQ ID NO: 76) CTCTGTAC
E12 CGCCCACGAGGCCAAGATCCGC (SEQ ID NO: 77) TACTACAC
E13 GAAGTCGGTGGTGATGGACAGG (SEQ ID NO: 78) GGCAGCAC
E13 TTCATCCCTTCCTTCCGCCTGG (SEQ ID NO: 79) TGGCGTAC
E13 CCCTTCCTTCCGCCTGGTGGCG (SEQ ID NO: 80) TACTACAC
E13 TGGCCGCTGGCACCGATCAGCG (SEQ ID NO: 81) TGTAGTAC
E13 CGGCCACCACCTCCCTCTGGCC (SEQ ID NO: 82) GCTGGCAC
E13 CACGCAGGAGTCCTTGACGTCC (SEQ ID NO: 83) ACCCACAC
E14 GCGGCCAGTCAGAAGACCGGCA (SEQ ID NO: 84) GCCTGTAC
E14 TATCTTCAGGGTCATCTGCTGC (SEQ ID NO: 85) CCAGGTAC
E14 TAGAGGGTGACCACGGGGCCCG (SEQ ID NO: 86) GGTGGTAC
E14 GAACACGCCCTTGTCCACGGCC (SEQ ID NO: 87) ACCAGTAC
E14 CAGTTTGTTCTTCTTATTCAGC (SEQ ID NO: 88) ACGAACAC
E14 CTGCGTCAGTTTGTTCTTCTTA (SEQ ID NO: 89) TTCAGCAC
E15 CGTGGTGGAGAAGGCAGACATC (SEQ ID NO: 90) GGCTGCAC
E15 TGAAGGTCAGCCCTGCGTCGGA (SEQ ID NO: 91) GAAGACAC
E16 CGGCGTCGGCGGGCGGCTGGCT (SEQ ID NO: 92) GCGGGCAC
E16 TTTGTCCATTCGCTTCTCCGTG (SEQ ID NO: 93) AGCTGCAC
E17 GGAACACGTGCTCCCGCAGTCG (SEQ ID NO: 94) GCAAGTAC
E17 TCGCAGCACTTGCGCAGCTCCT (SEQ ID NO: 95) TGGGGTAC
E17 GGGTTCTCCCGCATGCCGTCCT (SEQ ID NO: 96) CGCAGCAC
E17 AGGGAGATGAAACGGGTCCGGC (SEQ ID NO: 97) GCTGGCAC
E17 TTGCAGCAGTCCAGGAAGACCT (SEQ ID NO: 98) TCTTGCAC
E17 AACTACATCACAGAGCTGCGGC (SEQ ID NO: 99) GGCAGCAC
E20 TTACTGTGACCTCGAAGGGGTC (SEQ ID NO: 100) TGCCACAC
E21 CACTTCCTGCAGGCCGGTCTTT (SEQ ID NO: 101) AGCGGCAC
E21 TCACCACGACCTTCAGGGACTT (SEQ ID NO: 102) CCTGACAC
E22 CAGAATGAACAAAACTGTGGCT (SEQ ID NO: 103) GTTCGCAC
E23 GTCTGCAGGTGGGATGTCCTCT (SEQ ID NO: 104) TTCTGCAC
E23 TGCAGACCTCAGTGACCAAGTC (SEQ ID NO: 105) CCGGACAC
E23 AGACCAGAATTCTCCTGCAAGG (SEQ ID NO: 106) TGAGACAC
E24 GATGCCGTCGACGCGGAACGGC (SEQ ID NO: 107) TGAAGCAC
E24 CCACTGCTCCGTTTCATCCAGG (SEQ ID NO: 108) TAATGCAC
E25 GGTTGTCTGAAGGCCAGCTGCT (SEQ ID NO: 109) GGGTGTAC
E25 CTGCCTTTGCGGCCTTCGTGAA (SEQ ID NO: 110) ACGGGCAC
E25 TGCGGCCTTCGTGAAACGGGCA (SEQ ID NO: 111) CCCAGCAC
E26 GGGTCTTCCAGGAGGATGCGCC (SEQ ID NO: 112) CGTGATAC
E26 GTCTTCCAGGAGGATGCGCCCG (SEQ ID NO: 113) TGATACAC
E28 CAACTACATGAACCTACAGAGA (SEQ ID NO: 114) TCCTACAC
E29 TTCATTGAGCCAACGCACGACG (SEQ ID NO: 115) GGAGGCAC
E29 GTCGTGCGTTGGCTCAATGAAC (SEQ ID NO: 116) AGAGATAC
E29 GTAGTATCTCTGTTCATTGAGC (SEQ ID NO: 117) CAACGCAC
E30 CTTTTGGTATTGAGCCAAGGCT (SEQ ID NO: 118) TGGAACAC
E30 TTCATGGTGTTCCAAGCCTTGG (SEQ ID NO: 119) CTCAATAC
E30 GCAGGAGGCTGGCAGATTCCCA (SEQ ID NO: 120) GTGGATAC
E30 CTGCCAGCCTCCTGCGATCAGA (SEQ ID NO: 121) AGAGGTAC
E31 AGTCACAGCTGAAGGAAAAGGC (SEQ ID NO: 122) CAAGGCAC
E32 CTCCCATCTTACCAGGTGGTGA (SEQ ID NO: 123) CAATGTAC
E32 GTGAGTTGATCTTTGGCCTTAG (SEQ ID NO: 124) CATGGTAC
E32 TCGACCTCAAGGTCACCATAAA (SEQ ID NO: 125) ACCAGCAC
E33 GGCATCCTGAGGCCTCTTTTCT (SEQ ID NO: 126) AGAAACAC
E33 AGAAAAGAGGCCTCAGGATGCC (SEQ ID NO: 127) AAGAACAC
E33 CAAGAACACTATGATCCTTGAG (SEQ ID NO: 128) ATCTGTAC
E34 GACATAGTGGCATCCTGGTCTC (SEQ ID NO: 129) CCCGGTAC
E34 ATCCATGATGACTGGCTTTGCT (SEQ ID NO: 130) CCAGACAC
E35 CCCCAGCTGGCCAATGGTGTTG (SEQ ID NO: 131) ACAGATAC
E35 GCTCATACTTGGAGATGTATCT (SEQ ID NO: 132) GTCAACAC
E35 CTATCGGAGAAGGCTTTGTCCA (SEQ ID NO: 133) GCTCATAC
E35 GCTGGACAAAGCCTTCTCCGAT (SEQ ID NO: 134) AGGAACAC
E36 GACTGTCTAGCTTTCAAAGTTC (SEQ ID NO: 135) ACCAATAC
E37 ATCACATCTGCCCGCAGAGGAA (SEQ ID NO: 136) AGCTGTAC
E37 CCTCCTTTTCCGGATGGTAGAA (SEQ ID NO: 137) CCGGGTAC
E37 CCAGGGAACTCACCCTCAGCAC (SEQ ID NO: 138) AGCGGCAC
E38 CACCCCACCCTGCAGAGAATTG (SEQ ID NO: 139) CTTCATAC
E39 CTGAACCTTGACCAGTCGGGTC (SEQ ID NO: 140) TTGTACAC
E39 AGCTGAACCTTGACCAGTCGGG (SEQ ID NO: 141) TCTTGTAC
E39 GTTCAGCTGTCCAATGACTTTG (SEQ ID NO: 142) ACGAGTAC
E39 TTGATGGTCTGCTCAATGGCCA (SEQ ID NO: 143) TGATGTAC
E40 GATGAACGTGCGCTGCTGTCCA (SEQ ID NO: 144) ACCTGCAC
E40 TTCTCCTCCAGCTTCAGGGCTT (SEQ ID NO: 145) CTCTGCAC
E40 GAAGCCCTGAAGCTGGAGGAGA (SEQ ID NO: 146) AGAAACAC
E41 CAGCCTCAGCTACATCATCGGG (SEQ ID NO: 147) AAGGACAC
E41 ATCATCGGGAAGGACACTTGGG (SEQ ID NO: 148) TGGAGCAC
E41 GTTGTCTTTGGGTGCCCCAACT (SEQ ID NO: 149) GACCACAC
E41 GGGGAATGGGGGTGTGGTCAGT (SEQ ID NO: 150) TGGGGCAC
SpCas9을 위한 MYD88 유전자의 표적 서열(Target sequences of MYD88 gene for SpCas9)
Loci.(Exon) Target (w/o PAM) (SEQ ID NO) PAM
E01 TCCTGGAGCCTCAGCGCGGT (SEQ ID NO: 151) CGG
E01 GGCTCCAGGACCGCCCGCCA (SEQ ID NO: 152) TGG
E01 GCAGCCATGGCGGGCGGTCC (SEQ ID NO: 153) TGG
E01 GGACCGCCCGCCATGGCTGC (SEQ ID NO: 154) AGG
E01 GTTCTTGAACGTGCGGACAC (SEQ ID NO: 155) AGG
E01 GGCGGCCGACTGGACCGCGC (SEQ ID NO: 156) TGG
E01 CTCCGCCAGCGCGGTCCAGT (SEQ ID NO: 157) CGG
E01 GTCCATCTCCTCCGCCAGCG (SEQ ID NO: 158) CGG
E01 GGCCGACTGGACCGCGCTGG (SEQ ID NO: 159) CGG
E01 CGACTGGACCGCGCTGGCGG (SEQ ID NO: 160) AGG
E01 GTACTTGGAGATCCGGCAAC (SEQ ID NO: 161) TGG
E01 CCGCTTGTGTCTCCAGTTGC (SEQ ID NO: 162) CGG
E01 GAGACACAAGCGGACCCCAC (SEQ ID NO: 163) TGG
E01 GGACGCCCTGGCGCCTCTGT (SEQ ID NO: 164) AGG
E01 GTCGGCCTACAGAGGCGCCA (SEQ ID NO: 165) GGG
E01 AGTCGGCCTACAGAGGCGCC (SEQ ID NO: 166) AGG
E01 CTCGAGCAGTCGGCCTACAG (SEQ ID NO: 167) AGG
E01 TGGTAAGCAGCTCGAGCAGT (SEQ ID NO: 168) CGG
E01 GCTCGAGCTGCTTACCAAGC (SEQ ID NO: 169) TGG
E01 CTCGAGCTGCTTACCAAGCT (SEQ ID NO: 170) GGG
E01 CACGTCGTCGCGGCCCAGCT (SEQ ID NO: 171) TGG
E01 GCTCCAGCAGCACGTCGTCG (SEQ ID NO: 172) CGG
E01 CGACGACGTGCTGCTGGAGC (SEQ ID NO: 173) TGG
E01 GGAGGCTGAGAAGCCTTTAC (SEQ ID NO: 174) AGG
E02 TCTACAGCGGCCACCTGTAA (SEQ ID NO: 175) AGG
E02 CACCACACTTGATGACCCCC (SEQ ID NO: 176) TGG
E03 ATGAAGGCATCGAAACGCTC (SEQ ID NO: 177) AGG
E03 GCACAAACTGGATGTCGCTG (SEQ ID NO: 178) GGG
E03 TGCACAAACTGGATGTCGCT (SEQ ID NO: 179) GGG
E03 GGATCATCTCCTGCACAAAC (SEQ ID NO: 180) TGG
E03 GCAGGAGATGATCCGGCAAC (SEQ ID NO: 181) TGG
E03 TCTGACCGCGATGTCCTGCC (SEQ ID NO: 182) TGG
E04 TGATGATTACCTGCAGAGCA (SEQ ID NO: 183) AGG
E05 GGGGATCAGTCGCTTCTGAT (SEQ ID NO: 184) GGG
E05 TGGGGATCAGTCGCTTCTGA (SEQ ID NO: 185) TGG
E05 CGCAGACAGTGATGAACCTC (SEQ ID NO: 186) AGG
E05 CCAAGATTTGGTGCAGGGGT (SEQ ID NO: 187) TGG
E05 GCGAGTCCAGAACCAAGATT (SEQ ID NO: 188) TGG
E05 GTTCTGGACTCGCCTTGCCA (SEQ ID NO: 189) AGG
SpCas9을 위한 C3 유전자의 표적 서열(Target sequences of C3 gene for SpCas9)
Loci.(Exon) Target (w/o PAM) (SEQ ID NO) PAM
E01 GCTACTAACCCACCTCCCCC (SEQ ID NO: 190) TGG
E02 CACCCCCAACATCTTGCGGC (SEQ ID NO: 191) TGG
E02 CTCCAGCCGCAAGATGTTGG (SEQ ID NO: 192) GGG
E02 GAGCGAGGAGACCATGGTGC (SEQ ID NO: 193) TGG
E02 CTGGAGGCCCACGACGCGCA (SEQ ID NO: 194) AGG
E02 TGGAGGCCCACGACGCGCAA (SEQ ID NO: 195) GGG
E02 GGAGGCCCACGACGCGCAAG (SEQ ID NO: 196) GGG
E02 AACATCCCCTTGCGCGTCGT (SEQ ID NO: 197) GGG
E02 GAACATCCCCTTGCGCGTCG (SEQ ID NO: 198) TGG
E02 GTTTTTTGCCTGGGAAGTCG (SEQ ID NO: 199) TGG
E02 ACAGCACTAGTTTTTTGCCT (SEQ ID NO: 200) GGG
E02 GACAGCACTAGTTTTTTGCC (SEQ ID NO: 201) TGG
E02 GGTCAGCACAGTCTTCTCAC (SEQ ID NO: 202) TGG
E03 TTCTGACTTGAACTCCCTGT (SEQ ID NO: 203) TGG
E03 CAACAAGTTCGTGACCGTGC (SEQ ID NO: 204) AGG
E03 CACCACTTGGGTCCCGAAGG (SEQ ID NO: 205) TGG
E03 CTCCACCACTTGGGTCCCGA (SEQ ID NO: 206) AGG
E03 TGAAGAGGTACCCGCTCTGC (SEQ ID NO: 207) AGG
E04 GGGTAGCAGCTTGTGGTTGA (SEQ ID NO: 208) CGG
E04 AACCACAAGCTGCTACCCGT (SEQ ID NO: 209) GGG
E04 GGCCCACGGGTAGCAGCTTG (SEQ ID NO: 210) TGG
E04 ACAAGCTGCTACCCGTGGGC (SEQ ID NO: 211) CGG
E04 GCTGCTACCCGTGGGCCGGA (SEQ ID NO: 212) CGG
E04 ACCCGTGGGCCGGACGGTCA (SEQ ID NO: 213) TGG
E04 ACCATGACCGTCCGGCCCAC (SEQ ID NO: 214) GGG
E04 GACCATGACCGTCCGGCCCA (SEQ ID NO: 215) CGG
E04 CAATGTTGACCATGACCGTC (SEQ ID NO: 216) CGG
E05 TGCTTGACCGGGATGCCTTC (SEQ ID NO: 217) CGG
E05 GGAAGGCATCCCGGTCAAGC (SEQ ID NO: 218) AGG
E05 ACAAGGAGTCCTGCTTGACC (SEQ ID NO: 219) GGG
E05 TGGCGTCTTGCCCTTGTCTT (SEQ ID NO: 220) GGG
E07 GCCCAGTTTCGAGGTCATAG (SEQ ID NO: 221) TGG
E07 CTCCACTATGACCTCGAAAC (SEQ ID NO: 222) TGG
E07 ATGTAGTAGAATTTCTCTGT (SEQ ID NO: 223) AGG
E07 CTACTACATCTATAACGAGA (SEQ ID NO: 224) AGG
E07 CATCTATAACGAGAAGGGCC (SEQ ID NO: 225) TGG
E07 CTATAACGAGAAGGGCCTGG (SEQ ID NO: 226) AGG
E08 CTTTGTCATCTTCGGGATCC (SEQ ID NO: 227) AGG
E08 GTCATCTTCGGGATCCAGGA (SEQ ID NO: 228) TGG
E08 AAATCCTCTGTTCGCCATCC (SEQ ID NO: 229) TGG
E08 GGAATGCGCTTGAGGGATTC (SEQ ID NO: 230) AGG
E09 CGGGGGAGGTTGTGCTGAGC (SEQ ID NO: 231) CGG
E09 AGCCGGAAGGTACTGCTGGA (SEQ ID NO: 232) CGG
E09 GCCGGAAGGTACTGCTGGAC (SEQ ID NO: 233) GGG
E09 CCGGAAGGTACTGCTGGACG (SEQ ID NO: 234) GGG
E09 CCCCGTCCAGCAGTACCTTC (SEQ ID NO: 235) CGG
E09 CCACCAGGTCTTCTGCTCGG (SEQ ID NO: 236) GGG
E09 CCCACCAGGTCTTCTGCTCG (SEQ ID NO: 237) GGG
E09 CGTACAAAGACTTCCCCACC (SEQ ID NO: 238) AGG
E10 TGGTAGGGAGAGGTCACGAT (SEQ ID NO: 239) GGG
E10 CTGGTAGGGAGAGGTCACGA (SEQ ID NO: 240) TGG
E10 ATTCCTGGTTTGAAGTACTT (SEQ ID NO: 241) GGG
E11 GTGTTCGTGACGAACCCTGA (SEQ ID NO: 242) TGG
E11 GACTGCCACGGGGACTCGGT (SEQ ID NO: 243) AGG
E11 TCCAGCCTACCGAGTCCCCG (SEQ ID NO: 244) TGG
E11 CGAGTCCCCGTGGCAGTCCA (SEQ ID NO: 245) GGG
E11 CCCCGTGGCAGTCCAGGGCG (SEQ ID NO: 246) AGG
E11 TCTAACCCAGGGAGATGGCG (SEQ ID NO: 247) TGG
E13 GAACAAGGGCAGGCTGTTGA (SEQ ID NO: 248) AGG
E13 GCTGTTGAAGGCGGGACGCC (SEQ ID NO: 249) AGG
E13 GGACGCCAGGTGCGAGAGCC (SEQ ID NO: 250) CGG
E13 GGGGCAGCACCACCAGGTCC (SEQ ID NO: 251) TGG
E13 AAGTCGGTGGTGATGGACAG (SEQ ID NO: 252) GGG
E13 TACGCCACCAGGCGGAAGGA (SEQ ID NO: 253) AGG
E13 GTAGTACGCCACCAGGCGGA (SEQ ID NO: 254) AGG
E13 GCGTGTAGTACGCCACCAGG (SEQ ID NO: 255) CGG
E13 TCAGCGTGTAGTACGCCACC (SEQ ID NO: 256) AGG
E13 GTGGCGTACTACACGCTGAT (SEQ ID NO: 257) CGG
E13 TACACGCTGATCGGTGCCAG (SEQ ID NO: 258) CGG
E13 TGATCGGTGCCAGCGGCCAG (SEQ ID NO: 259) AGG
E13 CGGTGCCAGCGGCCAGAGGG (SEQ ID NO: 260) AGG
E13 GGTGGTGGCCGACTCCGTGT (SEQ ID NO: 261) GGG
E13 GACGTCCACCCACACGGAGT (SEQ ID NO: 262) CGG
E13 GGTGGCCGACTCCGTGTGGG (SEQ ID NO: 263) TGG
E13 CTCCGTGTGGGTGGACGTCA (SEQ ID NO: 264) AGG
E13 GACGTCAAGGACTCCTGCGT (SEQ ID NO: 265) GGG
E14 CAGGCTGCCGGTCTTCTGAC (SEQ ID NO: 266) TGG
E14 AAGACCGGCAGCCTGTACCT (SEQ ID NO: 267) GGG
E14 TGAAGATAGAGGGTGACCAC (SEQ ID NO: 268) GGG
E14 CCGGGTGGTACTGGTGGCCG (SEQ ID NO: 269) TGG
E14 GGTACTGGTGGCCGTGGACA (SEQ ID NO: 270) AGG
E14 GTACTGGTGGCCGTGGACAA (SEQ ID NO: 271) GGG
E15 GGCAGACATCGGCTGCACCC (SEQ ID NO: 272) CGG
E15 GTAATCCTTCCCACTGCCCG (SEQ ID NO: 273) GGG
E15 GCGTAATCCTTCCCACTGCC (SEQ ID NO: 274) CGG
E15 ATCGGCTGCACCCCGGGCAG (SEQ ID NO: 275) TGG
E15 TCGGCTGCACCCCGGGCAGT (SEQ ID NO: 276) GGG
E15 GGCAGTGGGAAGGATTACGC (SEQ ID NO: 277) CGG
E15 GCCGGTGTCTTCTCCGACGC (SEQ ID NO: 278) AGG
E15 CCGGTGTCTTCTCCGACGCA (SEQ ID NO: 279) GGG
E15 CCCTGCGTCGGAGAAGACAC (SEQ ID NO: 280) CGG
E15 CGTGAAGGTCAGCCCTGCGT (SEQ ID NO: 281) CGG
E15 CTGGCCACTGCTGCTCGTGA (SEQ ID NO: 282) AGG
E16 GAACGGCGTCGGCGGGCGGC (SEQ ID NO: 283) TGG
E16 CACGGAACGGCGTCGGCGGG (SEQ ID NO: 284) CGG
E16 CTGCACGGAACGGCGTCGGC (SEQ ID NO: 285) GGG
E16 GCTGCACGGAACGGCGTCGG (SEQ ID NO: 286) CGG
E16 TGAGCTGCACGGAACGGCGT (SEQ ID NO: 287) CGG
E16 ACGCCGTTCCGTGCAGCTCA (SEQ ID NO: 288) CGG
E16 TCTCCGTGAGCTGCACGGAA (SEQ ID NO: 289) CGG
E16 TCGCTTCTCCGTGAGCTGCA (SEQ ID NO: 290) CGG
E16 GCAGCTCACGGAGAAGCGAA (SEQ ID NO: 291) TGG
E17 GGAGCTGCGCAAGTGCTGCG (SEQ ID NO: 292) AGG
E17 CTGCGCAAGTGCTGCGAGGA (SEQ ID NO: 293) CGG
E17 GTGCTGCGAGGACGGCATGC (SEQ ID NO: 294) GGG
E17 GCATGCGGGAGAACCCCATG (SEQ ID NO: 295) AGG
E17 GCGCTGGCACGAGAACCTCA (SEQ ID NO: 296) TGG
E17 AGATGAAACGGGTCCGGCGC (SEQ ID NO: 297) TGG
E17 CCAGGGAGATGAAACGGGTC (SEQ ID NO: 298) CGG
E17 CTCGCCCAGGGAGATGAAAC (SEQ ID NO: 299) GGG
E17 CTTCTTGCACGCCTCGCCCA (SEQ ID NO: 300) GGG
E17 CCTGGGCGAGGCGTGCAAGA (SEQ ID NO: 301) AGG
E17 CCTTCTTGCACGCCTCGCCC (SEQ ID NO: 302) AGG
E17 GGCGTGCAAGAAGGTCTTCC (SEQ ID NO: 303) TGG
E17 ACTACATCACAGAGCTGCGG (SEQ ID NO: 304) CGG
E17 GCACGCGCGGGCCAGCCACC (SEQ ID NO: 305) TGG
E17 CACGCGCGGGCCAGCCACCT (SEQ ID NO: 306) GGG
E18 GAGCTGGCTGTGGAACGTTG (SEQ ID NO: 307) AGG
E19 GAAAGACTCCATCACCACGT (SEQ ID NO: 308) GGG
E19 CAGAATCTCCCACGTGGTGA (SEQ ID NO: 309) TGG
E20 CTGTGTGGCAGACCCCTTCG (SEQ ID NO: 310) AGG
E20 TGCATTACTGTGACCTCGAA (SEQ ID NO: 311) GGG
E20 CTGCATTACTGTGACCTCGA (SEQ ID NO: 312) AGG
E20 AGGACTTCTTCATCGACCTG (SEQ ID NO: 313) CGG
E20 TCGTTTCGAACAACAGAGTA (SEQ ID NO: 314) GGG
E20 CTCTGTTGTTCGAAACGAGC (SEQ ID NO: 315) AGG
E20 TGTTGTTCGAAACGAGCAGG (SEQ ID NO: 316) TGG
E20 GGTAATTGTAGAGAACGGCT (SEQ ID NO: 317) CGG
E20 GAGCCGTTCTCTACAATTAC (SEQ ID NO: 318) CGG
E20 CTGCCGGTAATTGTAGAGAA (SEQ ID NO: 319) CGG
E21 GACGCCTCTTGGTGGTGGCC (SEQ ID NO: 320) AGG
E21 CTGCTGGTGACGCCTCTTGG (SEQ ID NO: 321) TGG
E21 GGTCTGCTGGTGACGCCTCT (SEQ ID NO: 322) TGG
E21 GGGGGATGGTTACGGTCTGC (SEQ ID NO: 323) TGG
E21 CAACGAGGACTTGGGGGGGA (SEQ ID NO: 324) TGG
E21 GAACGGACAACGAGGACTTG (SEQ ID NO: 325) GGG
E21 GGAACGGACAACGAGGACTT (SEQ ID NO: 326) GGG
E21 TGGAACGGACAACGAGGACT (SEQ ID NO: 327) TGG
E21 GACATATGGAACGGACAACG (SEQ ID NO: 328) AGG
E21 CGGCACGATGACATATGGAA (SEQ ID NO: 329) CGG
E21 TTTAGCGGCACGATGACATA (SEQ ID NO: 330) TGG
E21 GTCATCGTGCCGCTAAAGAC (SEQ ID NO: 331) CGG
E21 TCCTGCAGGCCGGTCTTTAG (SEQ ID NO: 332) CGG
E21 GACTTCCACTTCCTGCAGGC (SEQ ID NO: 333) CGG
E23 TGTCCGGGACTTGGTCACTG (SEQ ID NO: 334) AGG
E23 CAGACTCGGTGTCCGGGACT (SEQ ID NO: 335) TGG
E24 CGACGGCATCCTCTGTCATC (SEQ ID NO: 336) TGG
E24 GACAGAGGATGCCGTCGACG (SEQ ID NO: 337) CGG
E24 AGGATGCCGTCGACGCGGAA (SEQ ID NO: 338) CGG
E24 CTTCAGCCGTTCCGCGTCGA (SEQ ID NO: 339) CGG
E24 AGCCCGAGGGGGTCACAATG (SEQ ID NO: 340) AGG
E24 TGTGACCCCCTCGGGCTGCG (SEQ ID NO: 341) GGG
E24 CATGATCGGCATGACGCCCA (SEQ ID NO: 342) CGG
E24 TAATGCACAGCGATGACCGT (SEQ ID NO: 343) GGG
E24 GTAATGCACAGCGATGACCG (SEQ ID NO: 344) TGG
E24 GGTCATCGCTGTGCATTACC (SEQ ID NO: 345) TGG
E24 TGTGCATTACCTGGATGAAA (SEQ ID NO: 346) CGG
E24 TTCGGCCTAGAGAAGCGGCA (SEQ ID NO: 347) GGG
E24 AGGCCCCCTGCCGCTTCTCT (SEQ ID NO: 348) AGG
E25 GTTGTCTGAAGGCCAGCTGC (SEQ ID NO: 349) TGG
E25 CCTTTGCGGCCTTCGTGAAA (SEQ ID NO: 350) CGG
E25 CCGTTTCACGAAGGCCGCAA (SEQ ID NO: 351) AGG
E25 CTTTGCGGCCTTCGTGAAAC (SEQ ID NO: 352) GGG
E25 GCTGGGTGCCCGTTTCACGA (SEQ ID NO: 353) AGG
E26 GCTGACCGCCTACGTGGTCA (SEQ ID NO: 354) AGG
E26 ATCGACTCCCAAGTCCTCTG (SEQ ID NO: 355) CGG
E26 CGACTCCCAAGTCCTCTGCG (SEQ ID NO: 356) GGG
E26 TCCTCTGCGGGGCTGTTAAA (SEQ ID NO: 357) TGG
E26 GGAGAAGCAGAAGCCCGACG (SEQ ID NO: 358) GGG
E26 ATCCTCCTGGAAGACCCCGT (SEQ ID NO: 359) CGG
E26 GTATCACGGGCGCATCCTCC (SEQ ID NO: 360) TGG
E26 ATCATTTCTTGGTGTATCAC (SEQ ID NO: 361) GGG
E27 CGAGAAAGACATGGCCCTCA (SEQ ID NO: 362) CGG
E28 CGAGAAAGACATGGCCCTCA (SEQ ID NO: 363) CGG
E29 AAGAACCGCTGGGAGGACCC (SEQ ID NO: 364) TGG
E29 CGTTGTAGAGCTGCTTACCA (SEQ ID NO: 365) GGG
E29 ACGTTGTAGAGCTGCTTACC (SEQ ID NO: 366) AGG
E29 TGGTAAGCAGCTCTACAACG (SEQ ID NO: 367) TGG
E29 GGCCACATCCTATGCCCTCT (SEQ ID NO: 368) TGG
E29 TAGCTGCAGTAGGGCCAAGA (SEQ ID NO: 369) GGG
E29 TTAGCTGCAGTAGGGCCAAG (SEQ ID NO: 370) AGG
E29 TTGTGCCTCCCGTCGTGCGT (SEQ ID NO: 371) TGG
E29 TTGAGCCAACGCACGACGGG (SEQ ID NO: 372) AGG
E29 TTCATTGAGCCAACGCACGA (SEQ ID NO: 373) CGG
E29 AATGAACAGAGATACTACGG (SEQ ID NO: 374) TGG
E29 GAACAGAGATACTACGGTGG (SEQ ID NO: 375) TGG
E29 AGATACTACGGTGGTGGCTA (SEQ ID NO: 376) TGG
E30 AGCCTTGGCTCAATACCAAA (SEQ ID NO: 377) AGG
E30 GTCCTTTTGGTATTGAGCCA (SEQ ID NO: 378) AGG
E30 AAAGGACGCCCCTGACCACC (SEQ ID NO: 379) AGG
E30 CATCAAGGTTCAGTTCCTGG (SEQ ID NO: 380) TGG
E30 GGTGATCTTGGAGCTGCGGC (SEQ ID NO: 381) TGG
E30 AGATCACCCACCGTATCCAC (SEQ ID NO: 382) TGG
E30 GATCACCCACCGTATCCACT (SEQ ID NO: 383) GGG
E30 AGATTCCCAGTGGATACGGT (SEQ ID NO: 384) GGG
E32 CTTGAGGTCGAATTTATTAC (SEQ ID NO: 385) AGG
E32 TGTTTCCGGTGCTGGTTTTA (SEQ ID NO: 386) TGG
E34 ATATAGACATAGTGGCATCC (SEQ ID NO: 387) TGG
E34 GGATGCCACTATGTCTATAT (SEQ ID NO: 388) TGG
E35 GATGTATCTGTCAACACCAT (SEQ ID NO: 389) TGG
E35 GGCTTTGTCCAGCTCATACT (SEQ ID NO: 390) TGG
E36 AATGTAGAGCTTATCCAGCC (SEQ ID NO: 391) TGG
E36 TATCCAGCCTGGAGCAGTCA (SEQ ID NO: 392) AGG
E36 AGACCTTGACTGCTCCAGGC (SEQ ID NO: 393) TGG
E36 GCGTAGACCTTGACTGCTCC (SEQ ID NO: 394) AGG
E36 GGTCTACGCCTATTACAACC (SEQ ID NO: 395) TGG
E37 CTGTACCCGGTTCTACCATC (SEQ ID NO: 396) CGG
E37 CTTTTCCGGATGGTAGAACC (SEQ ID NO: 397) GGG
E38 CATACAAAAGTCGGATGACA (SEQ ID NO: 398) AGG
E38 GTCGGATGACAAGGTCACCC (SEQ ID NO: 399) TGG
E38 GGTCACCCTGGAAGAACGGC (SEQ ID NO: 400) TGG
E39 GATGTACTCGTCAAAGTCAT (SEQ ID NO: 401) TGG
E39 TGACTTTGACGAGTACATCA (SEQ ID NO: 402) TGG
E39 TGACTTGATGGTCTGCTCAA (SEQ ID NO: 403) TGG
E40 GAAGAAACACTACCTCATGT (SEQ ID NO: 404) GGG
E40 AAGAAACACTACCTCATGTG (SEQ ID NO: 405) GGG
E40 CGGAGGAGAGACCCCACATG (SEQ ID NO: 406) AGG
E41 CCTCAGCTACATCATCGGGA (SEQ ID NO: 407) AGG
E41 CATCATCGGGAAGGACACTT (SEQ ID NO: 408) GGG
E41 TCTTGGCATTCGTCCTCCTC (SEQ ID NO: 409) GGG
E41 CGAGGTCCTGGCATTGTTTC (SEQ ID NO: 410) TGG
E41 CGGTGAAGGCGCCGAGGTCC (SEQ ID NO: 411) TGG
E41 TGCTCTCGGTGAAGGCGCCG (SEQ ID NO: 412) AGG
E41 CGGCGCCTTCACCGAGAGCA (SEQ ID NO: 413) TGG
E41 GACAACCATGCTCTCGGTGA (SEQ ID NO: 414) AGG
E41 ACCGAGAGCATGGTTGTCTT (SEQ ID NO: 415) TGG
E41 CCGAGAGCATGGTTGTCTTT (SEQ ID NO: 416) GGG
본 명세서에 의해 개시되는 내용의 일 구현예에서, 가이드핵산은 MYD88 유전자의 표적 서열에 상보적으로 결합하는 가이드 서열을 포함하는 gRNA일 수 있다.
본 명세서에 의해 개시되는 내용의 다른 구현예에서, 가이드핵산은 C3 유전자의 표적 서열에 상보적으로 결합하는 가이드 서열을 포함하는 gRNA일 수 있다.
“가이드 서열”은 표적 유전자 또는 핵산의 이중 가닥 중 어느 하나 가닥의 일부 서열에 상보적인 뉴클레오타이드 서열이며, 이때 상기 가이드 서열은 최소한 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상보성을 가지거나 또는 완전한 상보성을 가지는 뉴클레오타이드 서열일 수 있다.
상기 가이드 서열은 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
일 예로, 상기 가이드 서열은 10 내지 25개의 뉴클레오타이드 서열, 15 내지 25개의 뉴클레오타이드 서열 또는 20 내지 25개의 뉴클레오타이드 서열일 수 있다.
다른 일 예로, 상기 가이드 서열은 10 내지 15개의 뉴클레오타이드 서열, 15 내지 20개의 뉴클레오타이드 서열 또는 20 내지 25개의 뉴클레오타이드 서열일 수 있다.
본 명세서에 의해 개시되는 표적 유전자는 면역 참여 유전자일 수 있다.
본 명세서에 의해 개시되는 표적 유전자는 MYD88 유전자 및/또는 C3 유전자일 수 있다.
상기 가이드 서열은 표적 서열과 상보적인 결합을 형성할 수 있다.
상기 표적 서열은 가이드핵산 결합 서열일 수 있다.
“가이드핵산 결합 서열”은 가이드핵산의 가이드 도메인에 포함되는 가이드 서열과 상보성을 가지는 뉴클레오타이드 서열로, 가이드핵산의 가이드 도메인에 포함되는 가이드 서열과 상보적인 결합을 할 수 있다. 표적 서열 및 가이드핵산 결합 서열은 표적 유전자 또는 핵산에 따라, 즉 유전자 조작 또는 교정하고자 하는 대상에 따라 달라질 수 있는 뉴클레오타이드 서열로, 표적 유전자 또는 핵산에 따라 다양하게 설계될 수 있다.
상기 표적 서열 및 가이드핵산 결합 서열 관련 설명은 상기 기술한 바와 같다.
상기 가이드핵산 결합 서열은 가이드 서열의 길이와 동일할 수 있다.
상기 가이드핵산 결합 서열은 가이드 서열의 길이보다 짧은 서열일 수 있다.
상기 가이드핵산 결합 서열은 가이드 서열의 길이보다 긴 서열일 수 있다.
상기 가이드 서열은 가이드핵산 결합 서열과 최소한 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상보적이거나 또는 완전하게 상보적인 뉴클레오타이드 서열일 수 있다.
일 예로, 상기 가이드 서열은 가이드핵산 결합 서열에 상보적이지 않은 1 내지 8개의 뉴클레오타이드 서열을 가지거나 또는 포함할 수 있다.
구현예에서,
본 명세서에 의해 개시되는 가이드 서열은 면역 참여 유전자의 프로모터 영역에 위치한 연속하는 10 내지 35개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
일 예로, 상기 가이드 서열은 MYD88 유전자의 프로모터 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
다른 예로, 상기 가이드 서열은 C3 유전자의 프로모터 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
본 명세서에 의해 개시되는 가이드 서열은 면역 참여 유전자의 인트론 영역에 위치한 연속하는 10 내지 35개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
일 예로, 상기 가이드 서열은 MYD88 유전자의 인트론 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
다른 예로, 상기 가이드 서열은 C3 유전자의 인트론 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
본 명세서에 의해 개시되는 가이드 서열은 면역 참여 유전자의 엑손 영역에 위치한 연속하는 10 내지 35개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
일 예로, 상기 가이드 서열은 MYD88 유전자의 엑손 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
다른 예로, 상기 가이드 서열은 C3 유전자의 엑손 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
본 명세서에 의해 개시되는 가이드 서열은 면역 참여 유전자의 인핸서 영역에 위치한 연속하는 10 내지 35개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
일 예로, 상기 가이드 서열은 MYD88 유전자의 인핸서 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
다른 예로, 상기 가이드 서열은 C3 유전자의 인핸서 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
본 명세서에 의해 개시되는 가이드 서열은 면역 참여 유전자의 암호화, 비암호화 또는 이의 혼합 부분의 위치한 연속하는 10 내지 35개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
일 예로, 상기 가이드 서열은 MYD88 유전자의 암호화, 비암호화 또는 이의 혼합 부분의 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
다른 예로, 상기 가이드 서열은 C3 유전자의 암호화, 비암호화 또는 이의 혼합 부분의 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
본 명세서에 의해 개시되는 가이드 서열은 면역 참여 유전자의 프로모터, 인핸서, 3'UTR, 폴리아데닐(polyA) 또는 이의 혼합 부분의 위치한 연속하는 10 내지 35개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
일 예로, 상기 가이드 서열은 MYD88 유전자의 프로모터, 인핸서, 3'UTR, 폴리아데닐(polyA) 또는 이의 혼합 부분의 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
다른 예로, 상기 가이드 서열은 C3 유전자의 프로모터, 인핸서, 3'UTR, 폴리아데닐(polyA) 또는 이의 혼합 부분의 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
본 명세서에 의해 개시되는 가이드 서열은 면역 참여 유전자의 엑손, 인트론 또는 이의 혼합 부분의 위치한 연속하는 10 내지 35개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
일 예로, 상기 가이드 서열은 MYD88 유전자의 엑손, 인트론 또는 이의 혼합 부분의 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
다른 예로, 상기 가이드 서열은 C3 유전자의 엑손, 인트론 또는 이의 혼합 부분의 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
본 명세서에 의해 개시되는 가이드 서열은 면역 참여 유전자의 돌연변이 부분(예를 들면, 야생형 유전자와 다른 부분)을 포함하거나 또는 근접한 연속하는 10 내지 35개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
일 예로, 상기 가이드 서열은 MYD88 유전자의 돌연변이 부분(예를 들면, 야생형 유전자와 다른 부분)을 포함하거나 또는 근접한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
다른 예로, 상기 가이드 서열은 C3 유전자의 돌연변이 부분(예를 들면, 야생형 유전자와 다른 부분)을 포함하거나 또는 근접한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
본 명세서에 의해 개시되는 가이드 서열은 면역 참여 유전자의 핵산서열 내의 PAM(proto-spacer-adjacent Motif) 서열의 5' 말단 및/또는 3' 말단에 인접한 연속하는 10 내지 35개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
“PAM(proto-spacer-adjacent Motif) 서열”은 에디터단백질이 인식할 수 있는 뉴클레오타이드 서열이다. 이때, PAM 서열은 에디터단백질의 종류 및 유래된 종에 따라 뉴클레오타이드 서열에 차이가 있을 수 있다.
이때, 상기 PAM 서열은 예를 들어, 하기의 서열 중 1 이상일 수 있다(5'에서 3'방향으로 기재함).
NGG(N은 A, T, C 또는 G임);
NNNNRYAC(N은 각각 독립적으로 A, T, C 또는 G이고, R은 A또는 G이고, Y는 C또는 T임);
NNAGAAW(N은 각각 독립적으로 A, T, C 또는 G이고, W는 A 또는 T임);
NNNNGATT(N은 각각 독립적으로 A, T, C 또는 G임);
NNGRR(T)(N은 각각 독립적으로 A, T, C 또는 G이고, R은 A 또는 G임); 및
TTN(N은 A, T, C 또는 G임).
일 예로, 상기 가이드 서열은 MYD88 유전자의 핵산서열 내의 PAM 서열의 5' 말단 및/또는 3' 말단에 인접한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 가이드 서열은 MYD88 유전자의 핵산서열 내의 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NGGNG-3' 또는/및 5'-NNAGAAW-3' (W = A 또는 T이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 가이드 서열은 MYD88 유전자의 핵산서열 내의 5'-NGGNG-3' 또는/및 5'-NNAGAAW-3' (W = A 또는 T이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
또 다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNNNGATT-3' 또는/및 5'-NNNGCTT-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 가이드 서열은 MYD88 유전자의 핵산서열 내의 5'-NNNNGATT-3' 또는/및 5'-NNNGCTT-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNNVRYAC-3' (V = G, C 또는 A; R = A 또는 G 이며, Y = C 또는 T 이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 가이드 서열은 MYD88 유전자의 핵산서열 내의 5'-NNNVRYAC-3' (V = G, C 또는 A; R = A 또는 G 이며, Y = C 또는 T 이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NAAR-3'(R = A 또는 G이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 가이드 서열은 MYD88 유전자의 핵산서열 내의 5'-NAAR-3'(R = A 또는 G이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
또 다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNGRR-3', 5'-NNGRRT-3' 또는/및 5'-NNGRRV-3' (R = A 또는 G이며, V = G, C 또는 A이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 가이드 서열은 MYD88 유전자의 핵산서열 내의 5'-NNGRR-3', 5'-NNGRRT-3' 또는/및 5'-NNGRRV-3' (R = A 또는 G이며, V = G, C 또는 A이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-TTN-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 가이드 서열은 MYD88 유전자의 핵산서열 내의 5'-TTN-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
다른 예로, 상기 가이드 서열은 C3 유전자의 핵산서열 내의 PAM 서열의 5' 말단 및/또는 3' 말단에 인접한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 가이드 서열은 C3 유전자의 핵산서열 내의 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NGGNG-3' 또는/및 5'-NNAGAAW-3' (W = A 또는 T이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 가이드 서열은 C3 유전자의 핵산서열 내의 5'-NGGNG-3' 또는/및 5'-NNAGAAW-3' (W = A 또는 T이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
또 다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNNNGATT-3' 또는/및 5'-NNNGCTT-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 가이드 서열은 C3 유전자의 핵산서열 내의 5'-NNNNGATT-3' 또는/및 5'-NNNGCTT-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNNVRYAC-3' (V = G, C 또는 A; R = A 또는 G 이며, Y = C 또는 T 이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 가이드 서열은 C3 유전자의 핵산서열 내의 5'-NNNVRYAC-3' (V = G, C 또는 A; R = A 또는 G 이며, Y = C 또는 T 이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NAAR-3'(R = A 또는 G이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 가이드 서열은 C3 유전자의 핵산서열 내의 5'-NAAR-3'(R = A 또는 G이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
또 다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNGRR-3', 5'-NNGRRT-3' 또는/및 5'-NNGRRV-3' (R = A 또는 G이며, V = G, C 또는 A이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 가이드 서열은 C3 유전자의 핵산서열 내의 5'-NNGRR-3', 5'-NNGRRT-3' 또는/및 5'-NNGRRV-3' (R = A 또는 G이며, V = G, C 또는 A이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-TTN-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 가이드 서열은 C3 유전자의 핵산서열 내의 5'-TTN-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
이하, 본 발명의 일 구체예에서 사용할 수 있는 가이드 서열들의 일 예들을 표로 나타낸다. 표에 기재된 가이드 서열은 MYD88 유전자 또는 C3 유전자를 표적할 수 있는 가이드 서열로, MYD88 유전자 또는 C3 유전자 내에 위치하는 표적 서열과 상보적인 결합을 형성할 수 있다. 표 5 내지 표 8에 기재된 가이드 서열은 표 1 내지 표 4의 표적 서열을 각각 표적할 수 있는 가이드 서열이다.
CjCas9을 위한 MYD88 유전자를 표적할 수 있는 가이드 서열(Guide sequences capable of targeting MYD88 gene for CjCas9)
Loci.(Exon) Guide sequence SEQ ID NO
E01 GUUCAAGAACAGAGACAGGCGG SEQ ID NO: 417
E01 GCCUGUCUCUGUUCUUGAACGU SEQ ID NO: 418
E01 GGUCCAGUCGGCCGCCACCUGU SEQ ID NO: 419
E01 GCGCUGGCGGAGGAGAUGGACU SEQ ID NO: 420
E01 UGUGUCUCCAGUUGCCGGAUCU SEQ ID NO: 421
E01 AGUACUUGGAGAUCCGGCAACU SEQ ID NO: 422
E01 ACCAAUGCUGGGUCCCAGCUCC SEQ ID NO: 423
E02 GCCUCCUCCUGCUGCUGCUUCA SEQ ID NO: 424
E02 UGCCCGCCAGCUCUGCUGUCCG SEQ ID NO: 425
E02 GGACAGCAGAGCUGGCGGGCAU SEQ ID NO: 426
E03 CUGUUCCAGUUGCCGGAUCAUC SEQ ID NO: 427
E03 CCAGGCAGGACAUCGCGGUCAG SEQ ID NO: 428
E03 UGCCAGGCAGGACAUCGCGGUC SEQ ID NO: 429
E03 GGUGCCAGGCAGGACAUCGCGG SEQ ID NO: 430
E03 UGUGUCUGACCGCGAUGUCCUG SEQ ID NO: 431
E03 CGAUGAGCUCACUAGCAAUAGA SEQ ID NO: 432
E04 UCAGAGACAACCACCACCAUCC SEQ ID NO: 433
E04 AGGAAUGUGACUUCCAGACCAA SEQ ID NO: 434
E05 UGAUGGGGAUCAGUCGCUUCUG SEQ ID NO: 435
E05 CAUCAGAAGCGACUGAUCCCCA SEQ ID NO: 436
E05 CUGGGGAACUCUUUCUUCAUUG SEQ ID NO: 437
E05 CCUGAGGUUCAUCACUGUCUGC SEQ ID NO: 438
E05 CACUGUCUGCGACUACACCAAC SEQ ID NO: 439
CjCas9을 위한 C3 유전자를 표적할 수 있는 가이드 서열(Guide sequences capable of targeting C3 gene for CjCas9)
Loci.(Exon) Guide sequence SEQ ID NO
E02 CGCAAGAUGUUGGGGGUGAUGA SEQ ID NO: 440
E02 AUCCCCUUGCGCGUCGUGGGCC SEQ ID NO: 441
E02 GGUCAGCACAGUCUUCUCACUG SEQ ID NO: 442
E02 GCCCAUGUGGUUGGUGGCAGGG SEQ ID NO: 443
E03 CACCACUUGGGUCCCGAAGGUG SEQ ID NO: 444
E03 GAGGUACCCGCUCUGCAGGCUG SEQ ID NO: 445
E03 GUGGUGCUGGUCAGCCUGCAGA SEQ ID NO: 446
E03 AUGGUCUUGUCUGUCUGGAUGA SEQ ID NO: 447
E03 CUUCAUCCAGACAGACAAGACC SEQ ID NO: 448
E06 UUCUCCACUGAGUUUGAGGUGA SEQ ID NO: 449
E07 CUCCACUAUGACCUCGAAACUG SEQ ID NO: 450
E08 UGCCUGAAUCCCUCAAGCGCAU SEQ ID NO: 451
E09 CGGGGGAGGUUGUGCUGAGCCG SEQ ID NO: 452
E09 CCCGUCCAGCAGUACCUUCCGG SEQ ID NO: 453
E09 UCGGGGGUUCUGCACCCCGUCC SEQ ID NO: 454
E09 CACCAGGUCUUCUGCUCGGGGG SEQ ID NO: 455
E09 GCAGAAGACCUGGUGGGGAAGU SEQ ID NO: 456
E09 GAGUGCAAGAUGACGGUGGCAG SEQ ID NO: 457
E09 ACCUGAGUGCAAGAUGACGGUG SEQ ID NO: 458
E09 UUGUACGUGUCUGCCACCGUCA SEQ ID NO: 459
E10 GAUGGGGAUCCCGCUGCGCUCU SEQ ID NO: 460
E10 CUCCCUACCAGAUCCACUUCAC SEQ ID NO: 461
E10 CAGAUCCACUUCACCAAGACAC SEQ ID NO: 462
E10 AGGUCAAAGGGCAUUCCUGGUU SEQ ID NO: 463
E11 UGGAGAGCCAUCAGGGUUCGUC SEQ ID NO: 464
E11 AGUCCCCGUGGCAGUCCAGGGC SEQ ID NO: 465
E11 CACGCCAUCUCCCUGGGUUAGA SEQ ID NO: 466
E11 AGAUGGCGUGGCCAAACUCAGC SEQ ID NO: 467
E11 AUGGCGUGGCCAAACUCAGCAU SEQ ID NO: 468
E11 GGCGUGGCCAAACUCAGCAUCA SEQ ID NO: 469
E12 CUCCGAGAGCUCCUGCUUCUUC SEQ ID NO: 470
E12 CAGGACCAUGCAGGCUCUGCCC SEQ ID NO: 471
E12 CAAUUACCUGCAUCUCUCAGUG SEQ ID NO: 472
E12 CUCCCCGGGUCUGAGCUCUGUA SEQ ID NO: 473
E12 UGAGGGUCUCCCCGGGUCUGAG SEQ ID NO: 474
E12 CGCCCACGAGGCCAAGAUCCGC SEQ ID NO: 475
E13 GAAGUCGGUGGUGAUGGACAGG SEQ ID NO: 476
E13 UUCAUCCCUUCCUUCCGCCUGG SEQ ID NO: 477
E13 CCCUUCCUUCCGCCUGGUGGCG SEQ ID NO: 478
E13 UGGCCGCUGGCACCGAUCAGCG SEQ ID NO: 479
E13 CGGCCACCACCUCCCUCUGGCC SEQ ID NO: 480
E13 CACGCAGGAGUCCUUGACGUCC SEQ ID NO: 481
E14 GCGGCCAGUCAGAAGACCGGCA SEQ ID NO: 482
E14 UAUCUUCAGGGUCAUCUGCUGC SEQ ID NO: 483
E14 UAGAGGGUGACCACGGGGCCCG SEQ ID NO: 484
E14 GAACACGCCCUUGUCCACGGCC SEQ ID NO: 485
E14 CAGUUUGUUCUUCUUAUUCAGC SEQ ID NO: 486
E14 CUGCGUCAGUUUGUUCUUCUUA SEQ ID NO: 487
E15 CGUGGUGGAGAAGGCAGACAUC SEQ ID NO: 488
E15 UGAAGGUCAGCCCUGCGUCGGA SEQ ID NO: 489
E16 CGGCGUCGGCGGGCGGCUGGCU SEQ ID NO: 490
E16 UUUGUCCAUUCGCUUCUCCGUG SEQ ID NO: 491
E17 GGAACACGUGCUCCCGCAGUCG SEQ ID NO: 492
E17 UCGCAGCACUUGCGCAGCUCCU SEQ ID NO: 493
E17 GGGUUCUCCCGCAUGCCGUCCU SEQ ID NO: 494
E17 AGGGAGAUGAAACGGGUCCGGC SEQ ID NO: 495
E17 UUGCAGCAGUCCAGGAAGACCU SEQ ID NO: 496
E17 AACUACAUCACAGAGCUGCGGC SEQ ID NO: 497
E20 UUACUGUGACCUCGAAGGGGUC SEQ ID NO: 498
E21 CACUUCCUGCAGGCCGGUCUUU SEQ ID NO: 499
E21 UCACCACGACCUUCAGGGACUU SEQ ID NO: 500
E22 CAGAAUGAACAAAACUGUGGCU SEQ ID NO: 501
E23 GUCUGCAGGUGGGAUGUCCUCU SEQ ID NO: 502
E23 UGCAGACCUCAGUGACCAAGUC SEQ ID NO: 503
E23 AGACCAGAAUUCUCCUGCAAGG SEQ ID NO: 504
E24 GAUGCCGUCGACGCGGAACGGC SEQ ID NO: 505
E24 CCACUGCUCCGUUUCAUCCAGG SEQ ID NO: 506
E25 GGUUGUCUGAAGGCCAGCUGCU SEQ ID NO: 507
E25 CUGCCUUUGCGGCCUUCGUGAA SEQ ID NO: 508
E25 UGCGGCCUUCGUGAAACGGGCA SEQ ID NO: 509
E26 GGGUCUUCCAGGAGGAUGCGCC SEQ ID NO: 510
E26 GUCUUCCAGGAGGAUGCGCCCG SEQ ID NO: 511
E28 CAACUACAUGAACCUACAGAGA SEQ ID NO: 512
E29 UUCAUUGAGCCAACGCACGACG SEQ ID NO: 513
E29 GUCGUGCGUUGGCUCAAUGAAC SEQ ID NO: 514
E29 GUAGUAUCUCUGUUCAUUGAGC SEQ ID NO: 515
E30 CUUUUGGUAUUGAGCCAAGGCU SEQ ID NO: 516
E30 UUCAUGGUGUUCCAAGCCUUGG SEQ ID NO: 517
E30 GCAGGAGGCUGGCAGAUUCCCA SEQ ID NO: 518
E30 CUGCCAGCCUCCUGCGAUCAGA SEQ ID NO: 519
E31 AGUCACAGCUGAAGGAAAAGGC SEQ ID NO: 520
E32 CUCCCAUCUUACCAGGUGGUGA SEQ ID NO: 521
E32 GUGAGUUGAUCUUUGGCCUUAG SEQ ID NO: 522
E32 UCGACCUCAAGGUCACCAUAAA SEQ ID NO: 523
E33 GGCAUCCUGAGGCCUCUUUUCU SEQ ID NO: 524
E33 AGAAAAGAGGCCUCAGGAUGCC SEQ ID NO: 525
E33 CAAGAACACUAUGAUCCUUGAG SEQ ID NO: 526
E34 GACAUAGUGGCAUCCUGGUCUC SEQ ID NO: 527
E34 AUCCAUGAUGACUGGCUUUGCU SEQ ID NO: 528
E35 CCCCAGCUGGCCAAUGGUGUUG SEQ ID NO: 529
E35 GCUCAUACUUGGAGAUGUAUCU SEQ ID NO: 530
E35 CUAUCGGAGAAGGCUUUGUCCA SEQ ID NO: 531
E35 GCUGGACAAAGCCUUCUCCGAU SEQ ID NO: 532
E36 GACUGUCUAGCUUUCAAAGUUC SEQ ID NO: 533
E37 AUCACAUCUGCCCGCAGAGGAA SEQ ID NO: 534
E37 CCUCCUUUUCCGGAUGGUAGAA SEQ ID NO: 535
E37 CCAGGGAACUCACCCUCAGCAC SEQ ID NO: 536
E38 CACCCCACCCUGCAGAGAAUUG SEQ ID NO: 537
E39 CUGAACCUUGACCAGUCGGGUC SEQ ID NO: 538
E39 AGCUGAACCUUGACCAGUCGGG SEQ ID NO: 539
E39 GUUCAGCUGUCCAAUGACUUUG SEQ ID NO: 540
E39 UUGAUGGUCUGCUCAAUGGCCA SEQ ID NO: 541
E40 GAUGAACGUGCGCUGCUGUCCA SEQ ID NO: 542
E40 UUCUCCUCCAGCUUCAGGGCUU SEQ ID NO: 543
E40 GAAGCCCUGAAGCUGGAGGAGA SEQ ID NO: 544
E41 CAGCCUCAGCUACAUCAUCGGG SEQ ID NO: 545
E41 AUCAUCGGGAAGGACACUUGGG SEQ ID NO: 546
E41 GUUGUCUUUGGGUGCCCCAACU SEQ ID NO: 547
E41 GGGGAAUGGGGGUGUGGUCAGU SEQ ID NO: 548
SpCas9을 위한 MYD88 유전자를 표적할 수 있는 가이드 서열(Guide sequences capable of targeting MYD88 gene for SpCas9)
Loci.(Exon) Guide sequence SEQ ID NO
E01 UCCUGGAGCCUCAGCGCGGU SEQ ID NO: 549
E01 GGCUCCAGGACCGCCCGCCA SEQ ID NO: 550
E01 GCAGCCAUGGCGGGCGGUCC SEQ ID NO: 551
E01 GGACCGCCCGCCAUGGCUGC SEQ ID NO: 552
E01 GUUCUUGAACGUGCGGACAC SEQ ID NO: 553
E01 GGCGGCCGACUGGACCGCGC SEQ ID NO: 554
E01 CUCCGCCAGCGCGGUCCAGU SEQ ID NO: 555
E01 GUCCAUCUCCUCCGCCAGCG SEQ ID NO: 556
E01 GGCCGACUGGACCGCGCUGG SEQ ID NO: 557
E01 CGACUGGACCGCGCUGGCGG SEQ ID NO: 558
E01 GUACUUGGAGAUCCGGCAAC SEQ ID NO: 559
E01 CCGCUUGUGUCUCCAGUUGC SEQ ID NO: 560
E01 GAGACACAAGCGGACCCCAC SEQ ID NO: 561
E01 GGACGCCCUGGCGCCUCUGU SEQ ID NO: 562
E01 GUCGGCCUACAGAGGCGCCA SEQ ID NO: 563
E01 AGUCGGCCUACAGAGGCGCC SEQ ID NO: 564
E01 CUCGAGCAGUCGGCCUACAG SEQ ID NO: 565
E01 UGGUAAGCAGCUCGAGCAGU SEQ ID NO: 566
E01 GCUCGAGCUGCUUACCAAGC SEQ ID NO: 567
E01 CUCGAGCUGCUUACCAAGCU SEQ ID NO: 568
E01 CACGUCGUCGCGGCCCAGCU SEQ ID NO: 569
E01 GCUCCAGCAGCACGUCGUCG SEQ ID NO: 570
E01 CGACGACGUGCUGCUGGAGC SEQ ID NO: 571
E01 GGAGGCUGAGAAGCCUUUAC SEQ ID NO: 572
E02 UCUACAGCGGCCACCUGUAA SEQ ID NO: 573
E02 CACCACACUUGAUGACCCCC SEQ ID NO: 574
E03 AUGAAGGCAUCGAAACGCUC SEQ ID NO: 575
E03 GCACAAACUGGAUGUCGCUG SEQ ID NO: 576
E03 UGCACAAACUGGAUGUCGCU SEQ ID NO: 577
E03 GGAUCAUCUCCUGCACAAAC SEQ ID NO: 578
E03 GCAGGAGAUGAUCCGGCAAC SEQ ID NO: 579
E03 UCUGACCGCGAUGUCCUGCC SEQ ID NO: 580
E04 UGAUGAUUACCUGCAGAGCA SEQ ID NO: 581
E05 GGGGAUCAGUCGCUUCUGAU SEQ ID NO: 582
E05 UGGGGAUCAGUCGCUUCUGA SEQ ID NO: 583
E05 CGCAGACAGUGAUGAACCUC SEQ ID NO: 584
E05 CCAAGAUUUGGUGCAGGGGU SEQ ID NO: 585
E05 GCGAGUCCAGAACCAAGAUU SEQ ID NO: 586
E05 GUUCUGGACUCGCCUUGCCA SEQ ID NO: 587
SpCas9을 위한 C3 유전자를 표적할 수 있는 가이드 서열(Guide sequences capable of targeting C3 gene for SpCas9)
Loci.(Exon) Guide sequence SEQ ID NO
E01 GCUACUAACCCACCUCCCCC SEQ ID NO: 588
E02 CACCCCCAACAUCUUGCGGC SEQ ID NO: 589
E02 CUCCAGCCGCAAGAUGUUGG SEQ ID NO: 590
E02 GAGCGAGGAGACCAUGGUGC SEQ ID NO: 591
E02 CUGGAGGCCCACGACGCGCA SEQ ID NO: 592
E02 UGGAGGCCCACGACGCGCAA SEQ ID NO: 593
E02 GGAGGCCCACGACGCGCAAG SEQ ID NO: 594
E02 AACAUCCCCUUGCGCGUCGU SEQ ID NO: 595
E02 GAACAUCCCCUUGCGCGUCG SEQ ID NO: 596
E02 GUUUUUUGCCUGGGAAGUCG SEQ ID NO: 597
E02 ACAGCACUAGUUUUUUGCCU SEQ ID NO: 598
E02 GACAGCACUAGUUUUUUGCC SEQ ID NO: 599
E02 GGUCAGCACAGUCUUCUCAC SEQ ID NO: 600
E03 UUCUGACUUGAACUCCCUGU SEQ ID NO: 601
E03 CAACAAGUUCGUGACCGUGC SEQ ID NO: 602
E03 CACCACUUGGGUCCCGAAGG SEQ ID NO: 603
E03 CUCCACCACUUGGGUCCCGA SEQ ID NO: 604
E03 UGAAGAGGUACCCGCUCUGC SEQ ID NO: 605
E04 GGGUAGCAGCUUGUGGUUGA SEQ ID NO: 606
E04 AACCACAAGCUGCUACCCGU SEQ ID NO: 607
E04 GGCCCACGGGUAGCAGCUUG SEQ ID NO: 608
E04 ACAAGCUGCUACCCGUGGGC SEQ ID NO: 609
E04 GCUGCUACCCGUGGGCCGGA SEQ ID NO: 610
E04 ACCCGUGGGCCGGACGGUCA SEQ ID NO: 611
E04 ACCAUGACCGUCCGGCCCAC SEQ ID NO: 612
E04 GACCAUGACCGUCCGGCCCA SEQ ID NO: 613
E04 CAAUGUUGACCAUGACCGUC SEQ ID NO: 614
E05 UGCUUGACCGGGAUGCCUUC SEQ ID NO: 615
E05 GGAAGGCAUCCCGGUCAAGC SEQ ID NO: 616
E05 ACAAGGAGUCCUGCUUGACC SEQ ID NO: 617
E05 UGGCGUCUUGCCCUUGUCUU SEQ ID NO: 618
E07 GCCCAGUUUCGAGGUCAUAG SEQ ID NO: 619
E07 CUCCACUAUGACCUCGAAAC SEQ ID NO: 620
E07 AUGUAGUAGAAUUUCUCUGU SEQ ID NO: 621
E07 CUACUACAUCUAUAACGAGA SEQ ID NO: 622
E07 CAUCUAUAACGAGAAGGGCC SEQ ID NO: 623
E07 CUAUAACGAGAAGGGCCUGG SEQ ID NO: 624
E08 CUUUGUCAUCUUCGGGAUCC SEQ ID NO: 625
E08 GUCAUCUUCGGGAUCCAGGA SEQ ID NO: 626
E08 AAAUCCUCUGUUCGCCAUCC SEQ ID NO: 627
E08 GGAAUGCGCUUGAGGGAUUC SEQ ID NO: 628
E09 CGGGGGAGGUUGUGCUGAGC SEQ ID NO: 629
E09 AGCCGGAAGGUACUGCUGGA SEQ ID NO: 630
E09 GCCGGAAGGUACUGCUGGAC SEQ ID NO: 631
E09 CCGGAAGGUACUGCUGGACG SEQ ID NO: 632
E09 CCCCGUCCAGCAGUACCUUC SEQ ID NO: 633
E09 CCACCAGGUCUUCUGCUCGG SEQ ID NO: 634
E09 CCCACCAGGUCUUCUGCUCG SEQ ID NO: 635
E09 CGUACAAAGACUUCCCCACC SEQ ID NO: 636
E10 UGGUAGGGAGAGGUCACGAU SEQ ID NO: 637
E10 CUGGUAGGGAGAGGUCACGA SEQ ID NO: 638
E10 AUUCCUGGUUUGAAGUACUU SEQ ID NO: 639
E11 GUGUUCGUGACGAACCCUGA SEQ ID NO: 640
E11 GACUGCCACGGGGACUCGGU SEQ ID NO: 641
E11 UCCAGCCUACCGAGUCCCCG SEQ ID NO: 642
E11 CGAGUCCCCGUGGCAGUCCA SEQ ID NO: 643
E11 CCCCGUGGCAGUCCAGGGCG SEQ ID NO: 644
E11 UCUAACCCAGGGAGAUGGCG SEQ ID NO: 645
E13 GAACAAGGGCAGGCUGUUGA SEQ ID NO: 646
E13 GCUGUUGAAGGCGGGACGCC SEQ ID NO: 647
E13 GGACGCCAGGUGCGAGAGCC SEQ ID NO: 648
E13 GGGGCAGCACCACCAGGUCC SEQ ID NO: 649
E13 AAGUCGGUGGUGAUGGACAG SEQ ID NO: 650
E13 UACGCCACCAGGCGGAAGGA SEQ ID NO: 651
E13 GUAGUACGCCACCAGGCGGA SEQ ID NO: 652
E13 GCGUGUAGUACGCCACCAGG SEQ ID NO: 653
E13 UCAGCGUGUAGUACGCCACC SEQ ID NO: 654
E13 GUGGCGUACUACACGCUGAU SEQ ID NO: 655
E13 UACACGCUGAUCGGUGCCAG SEQ ID NO: 656
E13 UGAUCGGUGCCAGCGGCCAG SEQ ID NO: 657
E13 CGGUGCCAGCGGCCAGAGGG SEQ ID NO: 658
E13 GGUGGUGGCCGACUCCGUGU SEQ ID NO: 659
E13 GACGUCCACCCACACGGAGU SEQ ID NO: 660
E13 GGUGGCCGACUCCGUGUGGG SEQ ID NO: 661
E13 CUCCGUGUGGGUGGACGUCA SEQ ID NO: 662
E13 GACGUCAAGGACUCCUGCGU SEQ ID NO: 663
E14 CAGGCUGCCGGUCUUCUGAC SEQ ID NO: 664
E14 AAGACCGGCAGCCUGUACCU SEQ ID NO: 665
E14 UGAAGAUAGAGGGUGACCAC SEQ ID NO: 666
E14 CCGGGUGGUACUGGUGGCCG SEQ ID NO: 667
E14 GGUACUGGUGGCCGUGGACA SEQ ID NO: 668
E14 GUACUGGUGGCCGUGGACAA SEQ ID NO: 669
E15 GGCAGACAUCGGCUGCACCC SEQ ID NO: 670
E15 GUAAUCCUUCCCACUGCCCG SEQ ID NO: 671
E15 GCGUAAUCCUUCCCACUGCC SEQ ID NO: 672
E15 AUCGGCUGCACCCCGGGCAG SEQ ID NO: 673
E15 UCGGCUGCACCCCGGGCAGU SEQ ID NO: 674
E15 GGCAGUGGGAAGGAUUACGC SEQ ID NO: 675
E15 GCCGGUGUCUUCUCCGACGC SEQ ID NO: 676
E15 CCGGUGUCUUCUCCGACGCA SEQ ID NO: 677
E15 CCCUGCGUCGGAGAAGACAC SEQ ID NO: 678
E15 CGUGAAGGUCAGCCCUGCGU SEQ ID NO: 679
E15 CUGGCCACUGCUGCUCGUGA SEQ ID NO: 680
E16 GAACGGCGUCGGCGGGCGGC SEQ ID NO: 681
E16 CACGGAACGGCGUCGGCGGG SEQ ID NO: 682
E16 CUGCACGGAACGGCGUCGGC SEQ ID NO: 683
E16 GCUGCACGGAACGGCGUCGG SEQ ID NO: 684
E16 UGAGCUGCACGGAACGGCGU SEQ ID NO: 685
E16 ACGCCGUUCCGUGCAGCUCA SEQ ID NO: 686
E16 UCUCCGUGAGCUGCACGGAA SEQ ID NO: 687
E16 UCGCUUCUCCGUGAGCUGCA SEQ ID NO: 688
E16 GCAGCUCACGGAGAAGCGAA SEQ ID NO: 689
E17 GGAGCUGCGCAAGUGCUGCG SEQ ID NO: 690
E17 CUGCGCAAGUGCUGCGAGGA SEQ ID NO: 691
E17 GUGCUGCGAGGACGGCAUGC SEQ ID NO: 692
E17 GCAUGCGGGAGAACCCCAUG SEQ ID NO: 693
E17 GCGCUGGCACGAGAACCUCA SEQ ID NO: 694
E17 AGAUGAAACGGGUCCGGCGC SEQ ID NO: 695
E17 CCAGGGAGAUGAAACGGGUC SEQ ID NO: 696
E17 CUCGCCCAGGGAGAUGAAAC SEQ ID NO: 697
E17 CUUCUUGCACGCCUCGCCCA SEQ ID NO: 698
E17 CCUGGGCGAGGCGUGCAAGA SEQ ID NO: 699
E17 CCUUCUUGCACGCCUCGCCC SEQ ID NO: 700
E17 GGCGUGCAAGAAGGUCUUCC SEQ ID NO: 701
E17 ACUACAUCACAGAGCUGCGG SEQ ID NO: 702
E17 GCACGCGCGGGCCAGCCACC SEQ ID NO: 703
E17 CACGCGCGGGCCAGCCACCU SEQ ID NO: 704
E18 GAGCUGGCUGUGGAACGUUG SEQ ID NO: 705
E19 GAAAGACUCCAUCACCACGU SEQ ID NO: 706
E19 CAGAAUCUCCCACGUGGUGA SEQ ID NO: 707
E20 CUGUGUGGCAGACCCCUUCG SEQ ID NO: 708
E20 UGCAUUACUGUGACCUCGAA SEQ ID NO: 709
E20 CUGCAUUACUGUGACCUCGA SEQ ID NO: 710
E20 AGGACUUCUUCAUCGACCUG SEQ ID NO: 711
E20 UCGUUUCGAACAACAGAGUA SEQ ID NO: 712
E20 CUCUGUUGUUCGAAACGAGC SEQ ID NO: 713
E20 UGUUGUUCGAAACGAGCAGG SEQ ID NO: 714
E20 GGUAAUUGUAGAGAACGGCU SEQ ID NO: 715
E20 GAGCCGUUCUCUACAAUUAC SEQ ID NO: 716
E20 CUGCCGGUAAUUGUAGAGAA SEQ ID NO: 717
E21 GACGCCUCUUGGUGGUGGCC SEQ ID NO: 718
E21 CUGCUGGUGACGCCUCUUGG SEQ ID NO: 719
E21 GGUCUGCUGGUGACGCCUCU SEQ ID NO: 720
E21 GGGGGAUGGUUACGGUCUGC SEQ ID NO: 721
E21 CAACGAGGACUUGGGGGGGA SEQ ID NO: 722
E21 GAACGGACAACGAGGACUUG SEQ ID NO: 723
E21 GGAACGGACAACGAGGACUU SEQ ID NO: 724
E21 UGGAACGGACAACGAGGACU SEQ ID NO: 725
E21 GACAUAUGGAACGGACAACG SEQ ID NO: 726
E21 CGGCACGAUGACAUAUGGAA SEQ ID NO: 727
E21 UUUAGCGGCACGAUGACAUA SEQ ID NO: 728
E21 GUCAUCGUGCCGCUAAAGAC SEQ ID NO: 729
E21 UCCUGCAGGCCGGUCUUUAG SEQ ID NO: 730
E21 GACUUCCACUUCCUGCAGGC SEQ ID NO: 731
E23 UGUCCGGGACUUGGUCACUG SEQ ID NO: 732
E23 CAGACUCGGUGUCCGGGACU SEQ ID NO: 733
E24 CGACGGCAUCCUCUGUCAUC SEQ ID NO: 734
E24 GACAGAGGAUGCCGUCGACG SEQ ID NO: 735
E24 AGGAUGCCGUCGACGCGGAA SEQ ID NO: 736
E24 CUUCAGCCGUUCCGCGUCGA SEQ ID NO: 737
E24 AGCCCGAGGGGGUCACAAUG SEQ ID NO: 738
E24 UGUGACCCCCUCGGGCUGCG SEQ ID NO: 739
E24 CAUGAUCGGCAUGACGCCCA SEQ ID NO: 740
E24 UAAUGCACAGCGAUGACCGU SEQ ID NO: 741
E24 GUAAUGCACAGCGAUGACCG SEQ ID NO: 742
E24 GGUCAUCGCUGUGCAUUACC SEQ ID NO: 743
E24 UGUGCAUUACCUGGAUGAAA SEQ ID NO: 744
E24 UUCGGCCUAGAGAAGCGGCA SEQ ID NO: 745
E24 AGGCCCCCUGCCGCUUCUCU SEQ ID NO: 746
E25 GUUGUCUGAAGGCCAGCUGC SEQ ID NO: 747
E25 CCUUUGCGGCCUUCGUGAAA SEQ ID NO: 748
E25 CCGUUUCACGAAGGCCGCAA SEQ ID NO: 749
E25 CUUUGCGGCCUUCGUGAAAC SEQ ID NO: 750
E25 GCUGGGUGCCCGUUUCACGA SEQ ID NO: 751
E26 GCUGACCGCCUACGUGGUCA SEQ ID NO: 752
E26 AUCGACUCCCAAGUCCUCUG SEQ ID NO: 753
E26 CGACUCCCAAGUCCUCUGCG SEQ ID NO: 754
E26 UCCUCUGCGGGGCUGUUAAA SEQ ID NO: 755
E26 GGAGAAGCAGAAGCCCGACG SEQ ID NO: 756
E26 AUCCUCCUGGAAGACCCCGU SEQ ID NO: 757
E26 GUAUCACGGGCGCAUCCUCC SEQ ID NO: 758
E26 AUCAUUUCUUGGUGUAUCAC SEQ ID NO: 759
E27 CGAGAAAGACAUGGCCCUCA SEQ ID NO: 760
E28 CGAGAAAGACAUGGCCCUCA SEQ ID NO: 761
E29 AAGAACCGCUGGGAGGACCC SEQ ID NO: 762
E29 CGUUGUAGAGCUGCUUACCA SEQ ID NO: 763
E29 ACGUUGUAGAGCUGCUUACC SEQ ID NO: 764
E29 UGGUAAGCAGCUCUACAACG SEQ ID NO: 765
E29 GGCCACAUCCUAUGCCCUCU SEQ ID NO: 766
E29 UAGCUGCAGUAGGGCCAAGA SEQ ID NO: 767
E29 UUAGCUGCAGUAGGGCCAAG SEQ ID NO: 768
E29 UUGUGCCUCCCGUCGUGCGU SEQ ID NO: 769
E29 UUGAGCCAACGCACGACGGG SEQ ID NO: 770
E29 UUCAUUGAGCCAACGCACGA SEQ ID NO: 771
E29 AAUGAACAGAGAUACUACGG SEQ ID NO: 772
E29 GAACAGAGAUACUACGGUGG SEQ ID NO: 773
E29 AGAUACUACGGUGGUGGCUA SEQ ID NO: 774
E30 AGCCUUGGCUCAAUACCAAA SEQ ID NO: 775
E30 GUCCUUUUGGUAUUGAGCCA SEQ ID NO: 776
E30 AAAGGACGCCCCUGACCACC SEQ ID NO: 777
E30 CAUCAAGGUUCAGUUCCUGG SEQ ID NO: 778
E30 GGUGAUCUUGGAGCUGCGGC SEQ ID NO: 779
E30 AGAUCACCCACCGUAUCCAC SEQ ID NO: 780
E30 GAUCACCCACCGUAUCCACU SEQ ID NO: 781
E30 AGAUUCCCAGUGGAUACGGU SEQ ID NO: 782
E32 CUUGAGGUCGAAUUUAUUAC SEQ ID NO: 783
E32 UGUUUCCGGUGCUGGUUUUA SEQ ID NO: 784
E34 AUAUAGACAUAGUGGCAUCC SEQ ID NO: 785
E34 GGAUGCCACUAUGUCUAUAU SEQ ID NO: 786
E35 GAUGUAUCUGUCAACACCAU SEQ ID NO: 787
E35 GGCUUUGUCCAGCUCAUACU SEQ ID NO: 788
E36 AAUGUAGAGCUUAUCCAGCC SEQ ID NO: 789
E36 UAUCCAGCCUGGAGCAGUCA SEQ ID NO: 790
E36 AGACCUUGACUGCUCCAGGC SEQ ID NO: 791
E36 GCGUAGACCUUGACUGCUCC SEQ ID NO: 792
E36 GGUCUACGCCUAUUACAACC SEQ ID NO: 793
E37 CUGUACCCGGUUCUACCAUC SEQ ID NO: 794
E37 CUUUUCCGGAUGGUAGAACC SEQ ID NO: 795
E38 CAUACAAAAGUCGGAUGACA SEQ ID NO: 796
E38 GUCGGAUGACAAGGUCACCC SEQ ID NO: 797
E38 GGUCACCCUGGAAGAACGGC SEQ ID NO: 798
E39 GAUGUACUCGUCAAAGUCAU SEQ ID NO: 799
E39 UGACUUUGACGAGUACAUCA SEQ ID NO: 800
E39 UGACUUGAUGGUCUGCUCAA SEQ ID NO: 801
E40 GAAGAAACACUACCUCAUGU SEQ ID NO: 802
E40 AAGAAACACUACCUCAUGUG SEQ ID NO: 803
E40 CGGAGGAGAGACCCCACAUG SEQ ID NO: 804
E41 CCUCAGCUACAUCAUCGGGA SEQ ID NO: 805
E41 CAUCAUCGGGAAGGACACUU SEQ ID NO: 806
E41 UCUUGGCAUUCGUCCUCCUC SEQ ID NO: 807
E41 CGAGGUCCUGGCAUUGUUUC SEQ ID NO: 808
E41 CGGUGAAGGCGCCGAGGUCC SEQ ID NO: 809
E41 UGCUCUCGGUGAAGGCGCCG SEQ ID NO: 810
E41 CGGCGCCUUCACCGAGAGCA SEQ ID NO: 811
E41 GACAACCAUGCUCUCGGUGA SEQ ID NO: 812
E41 ACCGAGAGCAUGGUUGUCUU SEQ ID NO: 813
E41 CCGAGAGCAUGGUUGUCUUU SEQ ID NO: 814
본 명세서에 의해 개시되는 내용의 일 태양은 면역 참여 유전자를 인위적으로 조작하기 위한 유전자 조작용 조성물에 관한 것이다.
상기 유전자 조작용 조성물은 인위적으로 조작된 면역 참여 유전자의 생성에 이용될 수 있다. 또한, 상기 유전자 조작용 조성물에 의해 인위적으로 조작된 면역 참여 유전자는 인위적인 면역 기능조절을 유도할 수 있다.
“인위적으로 조작된(artificially modified or engineered or artificially engineered)”이라는 용어는 자연상태에서 일어나는 존재 그대로의 상태가 아닌, 인위적으로 변형을 가한 상태를 의미한다. 이하에서, 비자연적인 인위적으로 조작된 또는 변형된 면역 참여 유전자는 인위적인 면역 참여 유전자라는 용어와 혼용하여 사용할 수 있다.
"인위적인 면역 기능조절"은 대상체(세포, 조직, 기관, 개체)의 면역 기능이 비정상적인 상태에 놓여 있는 경우, 그 비정상적인 면역 기능이 정상적인 상태로 돌아갈 수 있도록 하고 또는 그 정상적인 상태를 지속하여 유지할 수 있도록 하는 것을 의미한다.
유전자 조작은 유전자 발현 조절 과정을 고려하여 이루어질 수 있다.
구현예에서, 전사조절, RNA 가공 조절, RNA 수송 조절, RNA 분해 조절, 번역 조절 또는 단백질 변형 조절 단계에서 각 단계에 적합한 조작수단을 선택하여 이루어질 수 있다.
예를 들어, RNAi (RNA 간섭 or RNA silencing)을 이용하여, small RNA(sRNA)가 mRNA를 방해하거나 안정성을 저하시키며, 경우에 따라서는 파괴하여 단백질 합성정보가 중간에서 전달되지 못하게 함으로써 유전정보의 발현을 제어할 수 있다.
구현예에서, 유전자 조작은 DNA 또는 RNA 분자, 바람직하게는 DNA 분자 내 핵산들 사이의 결합들(bonds)의 가수분해(절단(cleavage))을 촉매화할 수 있는 야생형 또는 변종(variant) 효소를 이용할 수 있다. 가이드핵산-에디터단백질 복합체를 이용할 수 있다.
예를 들어, 메가뉴클레아제(meganuclease), 징크핑거(Zinc finger) 뉴클레아제, CRISPR/Cas9(Cas9 단백질), CRISPR-Cpf1(Cpf1 단백질) 및 TALE-뉴클레아제로 이루어진 군에서 선택된 하나 이상의 뉴클레아제를 이용하여 유전자를 조작하여 유전정보의 발현을 제어할 수 있다.
본 명세서에 의해 개시되는 유전자 조작용 조성물은 가이드핵산 및 에디터단백질을 포함할 수 있다.
유전자 조작용 조성물은
(a) 면역 참여 유전자의 표적 서열에 상보적인 결합을 형성할 수 있는 가이드핵산 또는 이를 암호화하는 핵산서열; 및
(b) 하나 이상의 에디터단백질 또는 이를 암호화하는 핵산서열
을 포함할 수 있다.
상기 면역 참여 유전자 관련 설명은 상기 기술한 바와 같다.
상기 표적 서열 관련 설명은 상기 기술한 바와 같다.
유전자 조작용 조성물은
(a) 면역 참여 유전자의 표적 서열에 상보적인 결합을 형성할 수 있는 가이드 서열을 포함하는 가이드핵산 또는 이를 암호화하는 핵산서열; 및
(b) 하나 이상의 에디터단백질 또는 이를 암호화하는 핵산서열
을 포함할 수 있다.
상기 면역 참여 유전자 관련 설명은 상기 기술한 바와 같다.
상기 표적 서열 관련 설명은 상기 기술한 바와 같다.
상기 가이드서열 관련 설명은 상기 기술한 바와 같다.
유전자 조작용 조성물은 가이드핵산-에디터단백질 복합체를 포함할 수 있다.
“가이드핵산-에디터단백질 복합체”는 가이드핵산과 에디터단백질의 상호작용을 통해 형성된 복합체를 의미한다.
상기 가이드핵산 관련 설명은 상기 기술한 바와 같다.
상기 “에디터단백질”은 핵산과 직접적으로 결합하거나, 또는 직접 결합하지는 않지만 상호작용할 수 있는 펩타이드, 폴리펩타이드 또는 단백질을 의미한다.
이때, 상기 핵산은 표적 핵산, 유전자 또는 염색체에 포함된 핵산일 수 있다.
이때, 상기 핵산은 가이드핵산일 수 있다.
상기 에디터단백질은 효소일 수 있다.
이때, 상기 “효소”는 핵산, 유전자 또는 염색체를 절단할 수 있는 도메인을 포함하는 폴리펩타이드 또는 단백질을 의미한다.
상기 효소는 뉴클레아제 또는 제한효소일 수 있다.
상기 에디터단백질은 완전 활성 효소를 포함할 수 있다.
이때, 상기 “완전 활성 효소”는 야생형(wild type) 효소의 본래의 핵산, 유전자 또는 염색체 절단 기능과 동일한 기능을 가지는 효소를 의미한다. 예를 들면, DNA의 이중 가닥을 절단하는 야생형 효소는 DNA 이중 가닥을 모두 절단하는 완전한 활성 효소일 수 있다. 또 다른 예를 들면, DNA의 이중 가닥을 절단하는 야생형 효소가 인위적인 조작에 의해 아미노산 서열 중 일부 서열이 삭제(deletion) 또는 치환(substitution)된 경우, 인위적으로 조작된 효소 변이체가 야생형 효소와 동일하게 DNA의 이중 가닥을 절단한다면, 상기 인위적으로 조작된 효소 변이체는 완전 활성 효소일 수 있다.
또한, 상기 완전 활성 효소는 야생형의 효소의 기능보다 향상 된 기능을 가지고 있는 효소를 포함할 수 있다. 예를 들면, DNA의 이중 가닥을 절단하는 야생형 효소의 특정 변형 또는 조작된 형태는 야생형 효소보다 증가된 완전한 효소 활성, 즉, 증가된 DNA 이중 가닥을 절단하는 활성을 가질 수 있다.
상기 에디터단백질은 불완전 또는 부분 활성 효소를 포함할 수 있다.
이때, 상기 "불완전 또는 부분 활성 효소"는 야생형 효소의 본래의 핵산, 유전자 또는 염색체 절단 기능의 일부만을 가지는 효소를 의미한다. 예를 들면, DNA의 이중 가닥을 절단하는 야생형 효소의 특정 변형 또는 조작된 형태는 제1 기능을 가지는 형태 또는 제2 기능을 가지는 형태일 수 있다. 이때, 제1 기능은 DNA의 이중 가닥 중 제1 가닥을 절단하는 기능이고, 제2 기능은 DNA의 이중 가닥 중 제2 가닥을 절단하는 기능일 수 있다. 이때, 상기 제1 기능을 가지는 효소 또는 제2 기능을 가지는 효소는 불완전 또는 부분 활성 효소일 수 있다.
상기 에디터단백질은 불활성 효소를 포함할 수 있다.
이때, 상기 "불활성 효소"는 야생형 효소의 본래의 핵산, 유전자 또는 염색체 절단 기능이 모두 불활성화 된 효소를 의미한다. 예를 들면, 야생형 효소의 특정 변형 또는 조작된 형태는 제1 기능 및 제2 기능이 모두 상실된 형태, 즉, DNA의 이중 가닥 중 제1 가닥을 절단하는 제1 기능 및 제2 가닥을 절단하는 제2 기능이 모두 상실된 형태일 수 있다. 이때, 상기 제1 기능 및 제2 기능이 모두 상실된 효소는 불활성 효소일 수 있다.
상기 에디터단백질은 융합단백질일 수 있다.
이때, 상기 “융합 단백질”은 효소에 추가적인 도메인, 펩타이드, 폴리펩타이드 또는 단백질을 융합하여 생성한 단백질을 의미한다.
상기 추가적인 도메인, 펩타이드, 폴리펩타이드 또는 단백질은 상기 효소에 포함된 기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질과 동일하거나 다른 기능을 가지는 기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질일 수 있다.
상기 융합 단백질은 효소의 아미노 말단 또는 그 근처; 카르복시 말단 또는 그 근처; 효소의 중간부; 또는 이들 조합의 하나 이상에 상기 기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질이 부가된 형태일 수 있다.
이때, 상기 기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질은 메틸라아제(methylase) 활성, 디메틸라아제(demethylase) 활성, 전사촉진(transcription activation) 활성, 전사 저해(transcription repression) 활성, 전사 방출 인자(transcription release factor) 활성, 히스톤 변형(histone modification) 활성, RNA 절단(cleavage) 활성 또는 핵산 결합(nucleic acid binding) 활성을 가지는 도메인, 펩타이드, 폴리펩타이드 또는 단백질 일 수 있으며, 또는 단백질(펩타이드 포함)의 분리정제를 위한 태그(tag) 또는 리포터 유전자일 수 있으나, 이에 제한되지 않는다.
상기 기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질은 디아미네이즈(deaminase)일 수 있다.
상기 태그는 히스티딘(His) 태그, V5 태그, FLAG 태그, 인플루엔자 헤마글루티닌(HA) 태그, Myc 태그, VSV-G 태그 및 티오레독신(Trx) 태그 등을 포함하며, 상기 리포터 유전자는 글루타티온-S-트랜스 퍼라제(GST), 호스래디시(horseradish) 과산화효소(HRP), 클로람페니콜 아세틸트랜스퍼라제(CAT) 베타-갈락토시다제, 베타-글루쿠로니다제, 루시퍼라제, 녹색 형광 단백질(GFP), HcRed, DsRed, 청록색 형광 단백질(CFP), 황색 형광 단백질(YFP) 및 청색 형광 단백질(BFP)을 포함하는 자가형광 단백질을 포함하나, 이들에 한정되지 않는다.
또한, 상기 기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질은 NLS(nuclear localization sequence or signal) 또는 NES(nuclear export sequence or signal)일 수 있다.
상기 NLS는 아미노산 서열 PKKKRKV(SEQ ID NO: 815)를 갖는 SV40 바이러스 대형 T-항원의 NLS; 뉴클레오플라스민(nucleoplasmin)으로부터의 NLS(예를 들어, 서열 KRPAATKKAGQAKKKK(SEQ ID NO: 816)를 갖는 뉴클레오플라스민 이분(bipartite) NLS); 아미노산 서열 PAAKRVKLD(SEQ ID NO: 817) 또는 RQRRNELKRSP(SEQ ID NO: 818)를 갖는 c-myc NLS; 서열 NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(SEQ ID NO: 819)를 갖는 hRNPA1 M9 NLS; 임포틴-알파로부터의 IBB 도메인의 서열 RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(SEQ ID NO: 820); 마이오마(myoma) T 단백질의 서열 VSRKRPRP(SEQ ID NO: 821) 및 PPKKARED(SEQ ID NO: 822); 인간 p53의 서열 PQPKKKPL(SEQ ID NO: 823); 마우스 c-abl IV의 서열 SALIKKKKKMAP(SEQ ID NO: 824); 인플루엔자 바이러스 NS1의 서열 DRLRR(SEQ ID NO: 825) 및 PKQKKRK(SEQ ID NO: 826); 간염 바이러스 델타 항원의 서열 RKLKKKIKKL(SEQ ID NO: 827); 마우스 Mx1 단백질의 서열 REKKKFLKRR(SEQ ID NO: 828); 인간 폴리(ADP-리보스) 중합효소의 서열 KRKGDEVDGVDEVAKKKSKK(SEQ ID NO: 829); 또는 스테로이드 호르몬 수용체(인간) 글루코코르티코이드의 서열 RKCLQAGMNLEARKTKK(SEQ ID NO: 830)로부터 유래된 NLS 서열일 수 있으나, 이에 제한되지 않는다.
상기 추가적인 도메인, 펩타이드, 폴리펩타이드 또는 단백질은 특정 기능을 수행하지 않는 비기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질일 수 있다. 이때, 상기 비기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질은 상기 효소의 기능에 영향을 주지 않는 도메인, 펩타이드, 폴리펩타이드 또는 단백질일 수 있다.
상기 융합 단백질은 효소의 아미노 말단 또는 그 근처; 카르복시 말단 또는 그 근처; 효소의 중간부; 또는 이들 조합의 하나 이상에 상기 비기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질이 부가된 형태일 수 있다.
상기 에디터단백질은 자연 상태에 존재하는 효소 또는 융합 단백질일 수 있다.
상기 에디터단백질은 자연 상태에 존재하는 효소 또는 융합 단백질의 일부가 변형된 형태일 수 있다.
상기 에디터단백질은 자연 상태에 존재하지 않는 인위적으로 생성된 효소 또는 융합 단백질일 수 있다.
상기 에디터단백질은 자연 상태에 존재하지 않는 인위적으로 생성된 효소 또는 융합 단백질의 일부가 변형된 형태일 수 있다.
이때, 상기 변형은 에디터단백질에 포함된 아미노산의 치환, 제거, 부가 또는 이의 혼합일 수 있다.
또는 상기 변형은 에디터단백질을 암호화하는 뉴클레오타이드 서열 중 일부 뉴클레오타이드의 치환, 제거, 부가 또는 이의 혼합일 수 있다.
또한, 상기 유전자 조작용 조성물은 삽입을 원하는 특정 뉴클레오타이드 서열을 포함하는 도너 또는 이를 암호화하는 핵산서열을 선택적으로 더 포함할 수 있다.
이때, 상기 삽입은 원하는 핵산서열은 면역 참여 유전자의 일부 뉴클레오타이드 서열일 수 있다.
이때, 상기 삽입은 원하는 핵산서열은 조작하고자 하는 면역 참여 유전자의 돌연변이를 교정하거나 돌연변이를 도입하기 위한 핵산 서열일 수 있다.
상기 "도너(donor)"는 손상된 유전자 또는 핵산의 상동성 재조합에 의한 수복을 돕는 뉴클레오타이드 서열을 의미한다.
상기 도너는 이중가닥 핵산 또는 단일가닥 핵산일 수 있다.
상기 도너는 선형 또는 원형일 수 있다.
상기 도너는 표적 유전자 또는 핵산에 상동성을 가지는 뉴클레오타이드 서열을 포함할 수 있다.
예를 들어, 도너는 특정 뉴클레오타이드 서열을 삽입하고자 하는 위치, 예를 들어, 손상된 핵산의 왼쪽(upstream)및 오른쪽(downstream)의 뉴클레오타이드 서열과 각각 상동성을 가지는 뉴클레오타이드 서열을 포함할 수 있다. 이때, 삽입하고자 하는 특정 뉴클레오타이드 서열은 손상된 핵산의 오른쪽 뉴클레오타이드 서열에 대해 상동성을 가지는 뉴클레오타이드 서열과 손상된 핵산의 왼쪽 뉴클레오타이드 서열에 대해 상동성을 가지는 뉴클레오타이드 서열 사이에 위치할 수 있다. 이때, 상기 상동성을 가지는 뉴클레오타이드 서열은 최소한 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상동성을 갖거나 또는 완전하게 상동성을 가질 수 있다.
상기 도너는 선택적으로 부수적인 뉴클레오타이드 서열을 포함할 수 있다. 이때, 부수적인 핵산서열은 도너의 안정성, 표적 내 삽입 효율 또는 상동성 재조합 효율을 높이는 역할을 하는 것일 수 있다.
예를 들어, 상기 부수적인 뉴클레오타이드 서열은 뉴클레오타이드 A, T가 풍부한 핵산서열, 즉, A-T 풍부 도메인(A-T rich domain)일 수 있다. 예를 들면, 상기 부수적인 뉴클레오타이드 서열은 SMAR(scaffold/matrix attachment region)일 수 있다.
본 명세서에 의해 개시되는 가이드핵산, 에디터단백질 또는 가이드핵산-에디터단백질 복합체는 다양한 형태로 대상 내로 전달 또는 도입될 수 있다.
이때, "대상"은 가이드핵산, 에디터단백질 또는 가이드핵산-에디터단백질 복합체가 도입되는 유기체, 또는 가이드핵산, 에디터단백질 또는 가이드핵산-에디터단백질 복합체가 작동하는 유기체 또는 유기체로부터 획득한 검체 또는 시료를 의미한다.
상기 대상은 가이드핵산-에디터단백질 복합체의 표적 유전자 또는 염색체를 포함하는 유기체일 수 있다.
상기 유기체는 동물, 동물의 조직 또는 동물 세포일 수 있다.
상기 유기체는 인간, 인간의 조직 또는 인간 세포일 수 있다.
상기 조직은 안구, 피부, 간, 신장, 심장, 폐, 뇌, 근육 또는 혈액일 수 있다.
상기 세포는 안구세포, 신경세포, 대식세포, T 세포 또는 B 세포일 수 있다.
상기 검체 또는 시료는 침, 혈액, 간조직, 뇌조직, 간세포, 신경세포, 식세포, 대식세포, T 세포, B 세포, 성상교세포, 암세포 또는 줄기세포 등 표적 유전자 또는 염색체를 포함하는 유기체에서 획득한 것 일 수 있다.
바람직하게는, 상기 대상은 면역 참여 유전자를 포함하는 유기체일 수 있다.
상기 가이드핵산, 에디터단백질 또는 가이드핵산-에디터단백질 복합체는 DNA, RNA 또는 이의 혼합의 형태로 대상 내로 전달 또는 도입될 수 있다.
이때, 가이드핵산 및/또는 에디터단백질을 암호화하는 DNA, RNA 또는 이의 혼합의 형태는 당업계에 공지된 방법에 의해 대상 내로 전달 또는 도입될 수 있다.
또는, 가이드핵산 및/또는 에디터단백질을 암호화하는 DNA, RNA 또는 이의 혼합의 형태는 벡터, 비벡터 또는 이들의 조합에 의해 대상 내로 전달 또는 도입될 수 있다.
상기 벡터는 바이러스 또는 비바이러스 벡터(예를 들어, 플라스미드)일 수 있다.
상기 비벡터는 네이키드 DNA, DNA 복합체 또는 mRNA일 수 있다.
일 구현예로, 상기 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열은 벡터에 의해 대상 내로 전달 또는 도입될 수 있다.
상기 벡터는 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열을 포함할 수 있다.
일 예로, 상기 벡터는 가이드핵산과 에디터단백질을 암호화하는 핵산서열을 동시에 포함할 수 있다.
다른 일 예로, 상기 벡터는 가이드핵산 암호화하는 핵산서열을 포함할 수 있다.
예를 들어, 상기 가이드핵산에 포함되는 도메인은 하나의 벡터에 모두 포함되거나 또는 각각의 도메인을 나누어 각각의 벡터에 포함시킬 수 있다.
다른 일 예로, 상기 벡터는 에디터단백질을 암호화하는 핵산서열을 포함할 수 있다.
예를 들어, 상기 에디터단백질의 경우, 에디터단백질을 암호화하는 핵산서열은 하나의 벡터에 포함되거나 또는 에디터단백질을 암호화하는 핵산서열이 분할되어 여러 개의 벡터에 포함될 수 있다.
상기 벡터는 하나 이상의 조절/제어 구성요소를 포함할 수 있다.
이때, 상기 조절/제어 구성요소는 포로모터, 인핸서, 인트론, 폴리아데닐화 신호, 코작 공통(Kozak consensus) 서열, 내부 리보솜 유입 부위(internal ribosome entry site, IRES), 스플라이스 억셉터 및/또는 2A 서열을 포함할 수 있다.
상기 프로모터는 RNA 중합효소 II에 의해 인식되는 프로모터일 수 있다.
상기 프로모터는 RNA 중합효소 III에 의해 인식되는 프로모터일 수 있다.
상기 프로모터는 유도성 프로모터일 수 있다.
상기 프로모터는 대상 특이적 프로모터일 수 있다.
상기 프로모터는 바이러스 또는 비바이러스 프로모터일 수 있다.
상기 프로모터는 제어 영역(즉, 가이드핵산 또는 에디터단백질을 암호화하는 핵산서열)에 따라 적합한 프로모터를 이용할 수 있다.
예를 들어, 가이드핵산을 위해 유용한 프로모터는 H1, EF-1a, tRNA 또는 U6 프로모터일 수 있다. 예를 들어, 에디터단백질을 위해 유용한 프로모터는 CMV, EF-1a, EFS, MSCV, PGK 또는 CAG 프로모터일 수 있다.
벡터는 바이러스 벡터 또는 재조합 바이러스 벡터일 수 있다.
상기 바이러스는 DNA 바이러스 또는 RNA 바이러스일 수 있다.
이때, 상기 DNA 바이러스는 이중가닥 DNA(dsDNA) 바이러스 또는 단일가닥 DNA(ssDNA) 바이러스 일 수 있다.
이때, 상기 RNA 바이러스는 단일가닥 RNA(ssRNA) 바이러스일 수 있다.
상기 바이러스는 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스(AAV), 백시니아바이러스, 폭스바이러스 또는 단순포진 바이러스일 수 있으나, 이에 제한되지 않는다.
일반적으로 바이러스는 숙주(예를 들면, 세포)를 감염시켜, 숙주 내에 바이러스의 유전정보를 암호화하는 핵산을 도입시키거나 숙주의 게놈 내로 유전정보를 암호화하는 핵산을 삽입시킬 수 있다. 이러한 특징을 가지는 바이러스를 이용하여 대상 내로 가이드핵산 및/또는 에디터단백질을 도입시킬 수 있다. 바이러스를 이용하여 도입된 가이드핵산 및/또는 에디터단백질은 대상(예를 들면, 세포)에서 일시적으로 발현될 수 있다. 또는 바이러스를 이용하여 도입된 가이드핵산 및/또는 에디터단백질은 대상(예를 들면, 세포)에서 장기간(예를 들면, 1주, 2주, 3주, 1개월, 2개월, 3개월, 6개월, 9개월, 1년, 2년 또는 영구적) 지속적으로 발현될 수 있다.
바이러스의 패키징 능력은 적어도 2kb 내지 50kb로 바이러스 종류에 따라 다를 수 있다. 이러한 패키징 능력에 따라 가이드핵산 또는 에디터단백질을 단독으로 포함하는 바이러스 벡터를 설계하거나 가이드핵산 및 에디터단백질을 모두 포함하는 바이러스 벡터를 설계할 수 있다. 또는 가이드핵산, 에디터단백질 및 추가 구성요소를 포함하는 바이러스 벡터를 설계할 수 있다.
일 예로, 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열은 재조합 렌티바이러스에 의해 전달 또는 도입될 수 있다.
다른 일 예로, 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열은 재조합 아데노바이러스에 의해 전달 또는 도입될 수 있다.
또 다른 일 예로, 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열은 재조합 AAV에 의해 전달 또는 도입될 수 있다.
다른 일 예로, 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열은 혼성 바이러스, 예를 들어 본 명세서에 기재한 바이러스 중 하나 이상의 혼성체에 의해 전달 또는 도입될 수 있다.
다른 일 구현예로, 상기 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열은 비벡터로 대상 내로 전달 또는 도입될 수 있다.
비벡터는 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열을 포함할 수 있다.
상기 비벡터는 네이키드 DNA, DNA 복합체, mRNA 또는 이의 혼합일 수 있다.
상기 비벡터는 전기천공법, 유전자총, 초음파천공법, 자기주입법(magnetofection), 일시적인 세포 압축 또는 스퀴징(예를 들어, 문헌[Lee, et al, (2012) Nano Lett., 12, 6322-6327]에 기재되어 있음), 지질-매개 형질감염, 덴드리머, 나노입자, 인산칼슘, 실리카, 실리케이트(오르모실) 또는 이의 조합에 의해 대상 내로 전달 또는 도입될 수 있다.
일 예로, 전기천공법을 통한 전달은 카트리지, 챔버 또는 큐벳 내에서 세포와 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열을 혼합하고, 정해진 지속시간 및 진폭의 전기적 자극을 적용에 의해 수행될 수 있다.
다른 일 예로, 나노입자를 이용하여 비벡터를 전달할 수 있다. 상기 나노입자는 무기 나노입자(예를 들면, 자기 나노입자, 실리카 등) 또는 유기 나노입자(예를 들면, 폴리에틸렌 글리콜(PEG)로 코팅된 지질 등)일 수 있다. 상기 나노입자의 외면은 부착을 가능하게 하는 양 전하로 하전된 중합체(예를 들면, 폴리에틸렌이민, 폴리리신, 폴리세린 등)와 컨쥬케이팅될 수 있다.
임의의 구체예로, 지질 외피를 이용하여 전달할 수 있다.
임의의 구체예로, 엑소좀을 이용하여 전달할 수 있다. 엑소좀은 뇌 및 다른 표적 기관에 RNA를 전달할 수 있는, 단백질 및 RNA를 수송하는 내인성 나노-소낭이다.
임의의 구체예로, 리포좀을 이용하여 전달할 수 있다. 리포좀은 내부 수성 구획을 둘러싸는 단일 또는 다중 라멜라 지질 이중층 및 상대적으로 불투과성인 외측 친지성 인지질 이중층으로 구성된 구체 소낭 구조이다. 리포좀은 몇몇 상이한 유형의 지질로부터 만들어질 수 있지만; 약물 담체로서 리포좀을 생성하는데 인지질이 가장 통상적으로 사용된다.
또한, 비벡터의 전달을 위한 조성물은 기타 몇몇 다른 첨가제를 포함할 수 있다.
상기 에디터단백질은 펩타이드, 폴리펩타이드 또는 단백질의 형태로 대상 내로 전달 또는 도입될 수 있다.
상기 에디터단백질은 펩타이드, 폴리펩타이드 또는 단백질의 형태는 당업계에 공지된 방법에 의해 대상 내로 전달 또는 도입될 수 있다.
상기 펩타이드, 폴리펩타이드 또는 단백질의 형태는 전기천공법, 미량주사법, 일시적인 세포 압축 또는 스퀴징(예를 들어, 문헌[Lee, et al, (2012) Nano Lett., 12, 6322-6327]에 기재되어 있음), 지질-매개 형질감염, 나노파티클, 리포솜, 펩타이드-매개 전달 또는 이의 조합에 의해 대상 내로 전달 또는 도입될 수 있다.
상기 펩타이드, 폴리펩타이드 또는 단백질의 전달은 가이드핵산을 암호화하는 핵산서열과 함께 전달될 수 있다.
일 예로, 전기천공법을 통한 전달은 카트리지, 챔버 또는 큐벳 내에서 가이드핵산와 함께 또는 가이드핵산 없이 에디터단백질을 도입시킬 세포와 혼합하고, 정해진 지속시간 및 진폭의 전기적 자극을 적용에 의해 수행될 수 있다.
상기 가이드핵산 및 에디터단백질은 핵산-단백질 혼합의 형태로 대상 내로 전달 또는 도입될 수 있다.
상기 가이드핵산 및 에디터단백질은 가이드핵산-에디터단백질 복합체의 형태로 대상 내로 전달 또는 도입될 수 있다.
예를 들어, 상기 가이드핵산은 DNA, RNA 또는 이의 혼합 형태일 수 있다. 상기 에디터단백질은 펩타이드, 폴리펩타이드 또는 단백질의 형태일 수 있다.
일 예로, 가이드핵산 및 에디터단백질은 RNA 형태의 가이드핵산과 단백질 형태의 에디터단백질이 가이드핵산-에디터단백질 복합체, 즉 ribonucleoprotein(RNP)의 형태로 대상 내로 전달 또는 도입될 수 있다.
본 명세서에 의해 개시되는 가이드핵산-에디터단백질 복합체는 표적 핵산, 유전자 또는 염색체를 변형시킬 수 있다.
예를 들어, 가이드핵산-에디터단백질 복합체는 표적 핵산, 유전자 또는 염색체의 서열에 변형(modification)을 유도한다. 그 결과, 상기 표적 핵산, 유전자 또는 염색체에 의해 발현되는 단백질은 그 구조 및/또는 기능이 변형되거나, 그 단백질의 발현이 조절되거나, 그 단백질의 발현이 제거될 수 있다.
상기 가이드핵산-에디터단백질 복합체는 DNA, RNA, 유전자 또는 염색체 수준에서 작용할 수 있다.
일 예로, 상기 가이드핵산-에디터단백질 복합체는 표적 유전자를 조작 또는 변형하여 표적 유전자가 암호화하는 단백질의 발현을 조절(예를 들어, 억제, 저해, 감소, 증가 또는 촉진) 하거나, 또는 단백질 활성 조절(예를 들어, 억제, 저해, 감소, 증가 또는 촉진) 또는 변형된 단백질을 발현할 수 있다.
상기 가이드핵산-에디터단백질 복합체는 유전자의 전사와 번역의 단계에서 작용할 수 있다.
일 예로, 상기 가이드핵산-에디터단백질 복합체는 표적 유전자의 전사를 촉진 또는 저해하여 표적 유전자가 암호화하는 단백질의 발현을 조절(예를 들어, 억제, 저해, 감소, 증가 또는 촉진)할 수 있다.
다른 일 예로, 상기 가이드핵산-에디터단백질 복합체는 표적 유전자의 번역을 촉진 또는 저해하여 표적 유전자가 암호화하는 단백질의 발현을 조절(예를 들어, 억제, 저해, 감소, 증가 또는 촉진)할 수 있다.
본 명세서에 의해 개시되는 내용의 일 구체예로서, 유전자 조작용 조성물은 gRNA 및 CRISPR 효소를 포함할 수 있다.
유전자 조작용 조성물은
(a) 면역 참여 유전자의 표적 서열에 상보적인 결합을 형성할 수 있는 gRNA 또는 이를 암호화하는 핵산서열; 및
(b) 하나 이상의 CRISPR 효소 또는 이를 암호화하는 핵산서열
을 포함할 수 있다.
상기 면역 참여 유전자 관련 설명은 상기 기술한 바와 같다.
상기 표적 서열 관련 설명은 상기 기술한 바와 같다.
유전자 조작용 조성물은
(a) 면역 참여 유전자의 표적 서열에 상보적인 결합을 형성할 수 있는 가이드 서열을 포함하는 gRNA 또는 이를 암호화하는 핵산서열; 및
(b) 하나 이상의 CRISPR 효소 또는 이를 암호화하는 핵산서열
을 포함할 수 있다.
상기 면역 참여 유전자 관련 설명은 상기 기술한 바와 같다.
상기 표적 서열 관련 설명은 상기 기술한 바와 같다.
상기 가이드 서열 관련 설명은 상기 기술한 바와 같다.
유전자 조작용 조성물은 gRNA-CRISPR 효소 복합체를 포함할 수 있다.
“gRNA-CRISPR 효소 복합체”는 gRNA과 CRISPR 효소의 상호작용을 통해 형성된 복합체를 의미한다.
상기 gRNA 관련 설명은 상기 기술한 바와 같다.
상기 “CRISPR 효소”는 CRISPR-Cas 시스템의 주요 단백질 구성 요소로, gRNA와 복합체를 형성하여 CRISPR-Cas 시스템을 형성한다.
상기 CRISPR 효소는 CRISPR 효소를 암호화하는 서열을 가지는 핵산 또는 폴리펩타이드(또는 단백질)일 수 있다.
상기 CRISPR 효소는 Type II CRISPR 효소일 수 있다.
Type II CRISPR 효소의 결정 구조는 2종 이상의 자연유래 미생물 Type II CRISPR 효소 분자에 대한 연구(Jinek et al., Science, 343(6176):1247997, 2014) 및 gRNA와 함께 복합체를 이루는 스트렙토코커스 피오게네스 Cas9(SpCas9)에 대한 연구(Nishimasu et al., Cell, 156:935-949, 2014; 및 Anders et al., Nature, 2014, doi: 10.1038/nature13579)를 통해 결정되었다.
Type II CRISPR 효소는 2개의 로브, 즉, 인식(REC) 및 뉴클레아제(NUC) 로브를 포함하며, 각각의 로브는 여러 개의 도메인을 포함한다.
상기 REC 로브는 아르기닌-풍부 브릿지 나선(BH), REC1 도메인 및 REC2 도메인을 포함한다.
이때, 상기 BH 도메인은 긴 α-나선 및 아르기닌 풍부 영역이며, 상기 REC1 및 REC2 도메인은 gRNA 내의 형성되는 이중가닥의, 예를 들어, 단일가닥 gRNA, 이중 gRNA 또는 tracrRNA의 인식에 중요한 역할을 한다.
상기 NUC 로브는 RuvC 도메인, HNH 도메인 및 PAM-상호작용(PI) 도메인을 포함한다. 이때, 상기 RuvC 도메인은 RuvC-유사 도메인을 포괄하는 의미로 사용되고, 또한 상기 HNH 도메인은 HNH-유사 도메인을 포괄하는 의미로 사용된다.
이때, 상기 RuvC 도메인은 Type II CRISPR 효소를 포함하는 자연상태에 존재하는 미생물의 구성원에 대해 구조적으로 유사성을 공유하며, 단일가닥, 예를 들어 표적 유전자 또는 핵산의 비상보성 가닥, 즉, gRNA와 상보적인 결합을 하지 않는 가닥을 절단한다. 상기 RuvC 도메인은 종종 당업계에서 RuvCI 도메인, RuvCII 도메인 및 RuvCIII 도메인으로서, 통상적으로 RuvC I, RuvCII 및 RuvCIII로 지칭된다.
상기 HNH 도메인은 HNH 엔도뉴클레아제와 구조적 유사성을 공유하며, 단일 가닥, 예를 들어 표적 핵산 분자의 상보성 가닥, 즉, gRNA와 상보적인 결합을 하는 가닥을 절단한다. HNH 도메인은 RuvC II와 III 모티프 사이에 위치한다.
상기 PI 도메인은 표적 유전자 또는 핵산 내의 특정 뉴클레오타이드 서열, 즉, PAM(Protospacer adjacent motif)을 인식하거나 또는 PAM과 상호작용한다. 이때, 상기 PAM은 Type II CRISPR 효소의 유래(origin)에 따라 다를 수 있다. 예를 들어, CRISPR 효소가 SpCas9 인 경우 PAM은 5'-NGG-3'일 수 있고, 스트렙토코커스 써모필러스 Cas9(StCas9)인 경우 PAM은 5'-NNAGAAW-3'(W = A or T)일 수 있고, 네이세리아 메닝기티디스 Cas9(NmCas9)인 경우 PAM은 5'-NNNNGATT-3'일 수 있고, 캄필로박터 제주니 Cas9(CjCas9)의 경우 PAM은 5'-NNNVRYAC-3' (V = G or C or A, R = A or G, Y = C or T)일 수 있으며, 이때 상기 N은 A, T, G 또는 C; 또는 A, U, G 또는 C일 수 있다. 다만, 전술한 효소의 유래에 따라 PAM이 결정되는 것으로 일반적으로 이해되고 있으나, 해당 유래의 효소의 돌연변이(mutant)에 대한 연구가 진행됨에 따라, 상기 PAM은 달라질 수도 있다.
상기 Type II CRISPR 효소는 Cas9일 수 있다.
상기 Cas9은 스트렙토코커스 피오게네스(Streptococcus pyogenes), 스트렙토코커스 써모필러스(Streptococcus thermophilus), 스트렙토코커스 속(Streptococcus sp.), 황색포도상구균(Staphylococcus aureus), 노카르디옵시스 다손빌레이(Nocardiopsis dassonvillei), 스트렙토마이세스 프리스티네스피랄리스(Streptomyces pristinaespiralis), 스트렙토마이세스 비리도크로모게네스(Streptomyces viridochromogenes), 스트렙토마이세스 비리도크로모게네스(Streptomyces viridochromogenes), 스트렙토스포랑기움 로세움(Streptosporangium roseum), 스트렙토스포랑기움 로세움(Streptosporangium roseum), 알리사이클로바클루스 아시도칼다리우스(AlicyclobacHlus acidocaldarius), 바실러스 슈도마이코이데스(Bacillus pseudomycoides), 바실러스 셀레니티레두센스(Bacillus selenitireducens), 엑시구오박테리움 시비리쿰(Exiguobacterium sibiricum), 락토바실러스 델브루에키이(Lactobacillus delbrueckii), 락토바실러스 살리바리우스(Lactobacillus salivarius), 미크로스 킬라 마리나(Microscilla marina), 부르크홀데리아레스 박테리움(Burkholderiales bacterium), 폴라로모나스 나프탈레니보란스(Polaromonas naphthalenivorans), 폴라로모나스 속(Polaromonas sp.), 크로코스파에라 와트소니이(Crocosphaera watsonii), 시아노테세 속(Cyanothece sp.), 마이크로시스티스 아에루기노사(Microcystis aeruginosa), 시네코코커스 속(Synechococcus sp.), 아세토할로비움 아라바티쿰(Acetohalobium arabaticum), 암모니펙스 데겐시이(Ammonifex degensii), 칼디셀룰로시럽토 베시이(Caldicelulosiruptor bescii), 칸디다투스 데술포루디스(Candidatus Desulforudis), 클로스트리듐 보툴리눔(Clostridium botulinum), 클로스트리듐 디피실레(Clostridium difficile), 피네골디아 마그나(Finegoldia magna), 나트라나에로비우스 써모필러스 (Natranaerobius thermophilus), 펠로토마쿨럼 써모프로피오니쿰(Pelotomaculum thermopropionicum), 아시디티오바실러스 칼두스(Acidithiobacillus caldus), 아시디티오바실러스 페로옥시단스(Acidithiobacillus ferrooxidans), 알로크로마티움 비노숨(Allochromatium vinosum), 마리노박터 속(Marinobacter sp.), 니트로소코커스 할로필러스(Nitrosococcus halophilus), 니트로소코커스 와트소니(Nitrosococcus watsoni), 슈도알테로 모나스 할로플란크티스(Pseudoalteromonas haloplanktis), 크테도노박테르 라세미페르(Ktedonobacter racemifer), 메타노할로비움 에베스티가툼(Methanohalobium evestigatum), 아나베나 바리아빌리스(Anabaena variabilis), 노둘라리아 스푸미게나(Nodularia spumigena), 노스톡 속(Nostoc sp.), 아르트로스피라 맥시마(Arthrospira maxima), 아르트로스피라 플라텐시스(Arthrospira platensis), 아르트로스피라 속(Arthrospira sp.), 링비아속(Lyngbya sp.), 마이크로콜레우스 크토노플라스테스(Microcoleus chthonoplastes), 오실라토리아 속(Oscillatoria sp.), 페트로토가 모빌리스(Petrotoga mobilis), 써모시포 아프리카누스(Thermosipho africanus) 또는 아카리오클로리스 마리나(Acaryochloris marina) 등 다양한 미생물 유래의 Cas9일 수 있다.
상기 Cas9은 gRNA와 결합하여 표적 유전자 또는 핵산 상에서 표적 서열 또는 위치를 절단 또는 변형시키는 효소로서, gRNA가 상보적인 결합을 하는 핵산 가닥(strand)을 절단할 수 있는 HNH 도메인, gRNA와 비상보적인 결합을 하는 핵산 가닥(strand)을 절단할 수 있는 RuvC 도메인, 표적, 즉, 타겟과 상호작용하는 REC 도메인 및 PAM을 인식하는 PI 도메인으로 구성될 수 있다. 구체적인 Cas9의 구조적 특성은 Hiroshi Nishimasu et al. (2014) Cell 156:935-949를 참고할 수 있다.
상기 Cas9은 자연상태에서 존재하는 미생물에서 분리된 것 또는 재조합적 방법 또는 합성적 방법을 통해 비자연적으로 생산된 것일 수 있다.
또한, 상기 CRISPR 효소는 Type V CRISPR 효소일 수 있다.
Type V CRISPR 효소는 Type II CRISPR 효소의 RuvC 도메인에 상응하는 유사한 RuvC 도메인이 있으며, Type II CRISPR 효소의 HNH 도메인은 결핍되어 있고, 대신에 Nuc 도메인을 포함하며, 표적과 상호작용하는 REC 도메인과 WED 도메인 및 PAM을 인식하는 PI 도메인으로 구성될 수 있다. 구체적인 Type V CRISPR 효소의 구조적 특성은 Takashi Yamano et al. (2016) Cell 165:949-962를 참고할 수 있다.
Type V CRISPR 효소는 gRNA와 상호작용할 수 있으며, gRNA-CRISPR 효소 복합체, 즉, CRISPR 복합체를 형성할 수 있고, gRNA와 협력하여 가이드 서열을 및 PAM 서열을 포함하는 표적 서열로 근접시킬 수 있다. 이때, 표적 유전자 또는 핵산과 상호작용하기 위한 Type V CRISPR 효소의 능력은 PAM 서열에 의존적이다.
상기 PAM 서열은 표적 유전자 또는 핵산 내에 존재하는 서열로, Type V CRISPR 효소의 PI 도메인에 의해 인식될 수 있다. 상기 PAM 서열은 Type V CRISPR 효소의 유래에 따라 그 서열이 다를 수 있다. 즉, 종마다 특이적으로 인식할 수 있는 PAM 서열이 존재한다. 예를 들어, Cpf1이 인식하는 PAM 서열은 5'-TTN-3' (N은 A, T, C 또는 G)일 수 있다. 다만, 전술한 효소의 유래에 따라 PAM이 결정되는 것으로 일반적으로 이해되고 있으나, 해당 유래의 효소의 돌연변이(mutant)에 대한 연구가 진행됨에 따라, 상기 PAM은 달라질 수도 있다.
상기 Type V CRISPR 효소는 Cpf1일 수 있다.
상기 Cpf1은 Streptococcus, Campylobacter, Nitratifractor, Staphylococcus, Parvibaculum, Roseburia, Neisseria, Gluconacetobacter, Azospirillum, Sphaerochaeta, Lactobacillus, Eubacterium, Corynebacter, Carnobacterium, Rhodobacter, Listeria, Paludibacter, Clostridium, Lachnospiraceae, Clostridiaridium, Leptotrichia, Francisella, Legionella, Alicyclobacillus, Methanomethyophilus, Porphyromonas, Prevotella, Bacteroidetes, Helcococcus, Letospira, Desulfovibrio, Desulfonatronum, Opitutaceae, Tuberibacillus, Bacillus, Brevibacilus, Methylobacterium 또는 Acidaminococcus 유래의 Cpf1일 수 있다.
상기 Cpf1은 Cas9의 RuvC 도메인에 상응하는 유사한 RuvC 도메인이 있으며, Cas9의 HNH 도메인은 결핍되어 있고, 대신에 Nuc 도메인을 포함하며, 타겟과 상호작용하는 REC 도메인과 WED 도메인 및 PAM을 인식하는 PI 도메인으로 구성될 수 있다. 구체적인 Cpf1의 구조적 특성은 Takashi Yamano et al. (2016) Cell 165:949-962를 참고할 수 있다.
상기 Cpf1는 자연상태에서 존재하는 미생물에서 분리된 것 또는 재조합적 방법 또는 합성적 방법을 통해 비자연적으로 생산된 것일 수 있다.
상기 CRISPR 효소는 표적 유전자 또는 핵산의 이중가닥을 절단하는 기능을 가지는 뉴클레아제 또는 제한효소일 수 있다.
상기 CRISPR 효소는 완전 활성 CRISPR 효소일 수 있다.
"완전 활성"는 야생형(wild type) CRISPR 효소의 기능과 동일한 기능을 가지고 있는 상태를 의미하며, 이러한 상태의 CRISPR 효소를 완전 활성 CRISPR 효소로 명칭한다. 이때, “야생형(wild type) CRISPR 효소의 기능”은 DNA의 이중 가닥을 절단하는 기능, 즉, DNA의 이중 가닥 중 제1 가닥을 절단하는 제1 기능 및 DNA의 이중 가닥 중 제2 가닥을 절단하는 제2 기능을 모두 가지는 상태를 말한다.
상기 완전 활성 CRISPR 효소는 DNA의 이중 가닥을 절단하는 야생형 CRISPR 효소일 수 있다.
상기 완전 활성 CRISPR 효소는 DNA의 이중 가닥을 절단하는 야생형 CRISPR 효소를 변형 또는 조작시킨 CRISPR 효소 변이체일 수 있다.
상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 아미노산 서열 중 하나 이상의 아미노산이 다른 아미노산으로 치환되거나 또는 하나 이상의 아미노산이 제거된 효소일 수 있다.
상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 아미노산 서열에 하나 이상의 아미노산이 부가된 효소일 수 있다. 이때, 부가되는 아미노산의 위치는 야생형 효소의 N 말단, C 말단 또는 아미노산 서열 내일 수 있다.
상기 CRISPR 효소 변이체는 야생형 CRISPR 효소보다 기능이 향상된 완전 활성 효소일 수 있다.
예를 들면, 야생형 CRISPR 효소의 특정 변형 또는 조작된 형태, 즉, CRISPR 효소 변이체는 절단해야 하는 DNA 이중 가닥과 결합하지 않거나 또는 일정한 거리 간격을 유지한 상태에서 DNA 이중 가닥을 절단할 수 있다. 이러한 경우, 상기 변형 또는 조작된 형태는 야생형 CRISPR 효소보다 기능 활성이 향상된 완전 활성 CRISPR 효소일 수 있다.
상기 CRISPR 효소 변이체는 야생형 CRISPR 효소보다 기능이 감소된 완전 활성 CRISPR 효소일 수 있다.
예를 들면, 야생형 CRISPR 효소의 특정 변형 또는 조작된 형태, 즉, CRISPR 효소 변이체는 절단해야 하는 DNA 이중 가닥과 일정 거리이상으로 근접한 상태 또는 특정 결합이 형성된 상태에서 DNA 이중 가닥을 절단할 수 있다. 이때, 특정 결합은, 예를 들어, 효소의 특정 위치의 아미노산과 절단 위치의 DNA 뉴클레오타이드 서열과의 결합일 수 있다. 이러한 경우, 상기 변형 또는 조작된 형태는 야생형 CRISPR 효소보다 기능 활성이 감소된 완전 활성 CRISPR 효소일 수 있다.
상기 CRISPR 효소는 불완전 또는 부분 활성 CRISPR 효소일 수 있다.
“불완전 또는 부분 활성”은 야생형 CRISPR 효소의 기능, 즉, DNA의 이중 가닥 중 제1 가닥을 절단하는 제1 기능 및 DNA의 이중 가닥 중 제2 가닥을 절단하는 제2 기능 중 선택된 하나의 기능을 가지는 상태를 의미한다. 이러한 상태의 CRISPR 효소는 불완전 또는 부분 활성 CRISPR 효소로 명칭한다. 또한 상기 불완전 또는 부분 활성 CRISPR 효소는 니카아제(nickase)로 지칭될 수 있다.
“니카아제(nickase)”는 표적 유전자 또는 핵산의 이중가닥 중 한 가닥만 절단되도록 조작 또는 변형된 CRISPR 효소를 의미하며, 상기 니카아제는 단일가닥, 예를 들어, 표적 유전자 또는 핵산의 gRNA와 비상보성 가닥 또는 상보성 가닥을 절단하는 뉴클레아제 활성을 가진다. 따라서, 이중가닥을 절단하기 위해서는 2개의 니카아제의 뉴클레아제 활성이 필요하다.
상기 니카아제는 CRISPR 효소의 RuvC 도메인에 의한 뉴클레아제 활성을 가질 수 있다. 즉, 상기 니카아제는 CRISPR 효소의 HNH 도메인에 의한 뉴클레아제 활성을 포함하지 않을 수 있으며, 이를 위해 HNH 도메인은 조작 또는 변경될 수 있다.
일 예로, 상기 CRISPR 효소가 Type II CRISPR 효소일 때, 상기 니카아제는 변형된 HNH 도메인을 포함하는 Type II CRISPR 효소일 수 있다.
예를 들어, 상기 Type II CRISPR 효소가 야생형 SpCas9의 경우, 상기 니카아제는 야생형 SpCas9의 아미노산 서열 840번 히스티딘을 알라닌으로 변이(mutation)시켜 HNH 도메인의 뉴클레아제 활성이 불활성화된 SpCas9 변이체일 수 있다. 이때 생성된 니카아제, 즉, SpCas9 변이체는 RuvC 도메인에 의한 뉴클레아제 활성을 가지므로, 표적 유전자 또는 핵산의 비상보성 가닥, 즉, gRNA와 상보적인 결합을 하지 않는 가닥을 절단할 수 있다.
또 다른 예를 들어, 상기 Type II CRISPR 효소가 야생형 CjCas9의 경우, 상기 니카아제는 야생형 CjCas9의 아미노산 서열 559번 히스티딘을 알라닌으로 변이(mutation)시켜 HNH 도메인의 뉴클레아제 활성이 불활성화된 CjCas9 변이체일 수 있다. 이때 생성된 니카아제, 즉, CjCas9 변이체는 RuvC 도메인에 의한 뉴클레아제 활성을 가지므로, 표적 유전자 또는 핵산의 비상보성 가닥, 즉, gRNA와 상보적인 결합을 하지 않는 가닥을 절단할 수 있다.
또한, 상기 니카아제는 CRISPR 효소의 HNH 도메인에 의한 뉴클레아제 활성을 가질 수 있다. 즉, 상기 니카아제는 CRISPR 효소의 RuvC 도메인에 의한 뉴클레아제 활성을 포함하지 않을 수 있으며, 이를 위해 RuvC 도메인은 조작 또는 변경될 수 있다.
일 예로, 상기 CRISPR 효소가 Type II CRISPR 효소일 때, 상기 니카아제는 변형된 RuvC 도메인을 포함하는 Type II CRISPR 효소일 수 있다.
예를 들어, 상기 Type II CRISPR 효소가 야생형 SpCas9의 경우, 상기 니카아제는 야생형 SpCas9의 아미노산 서열 10번 아스파르트산을 알라닌으로 변이(mutation)시켜 RuvC 도메인의 뉴클레아제 활성이 불활성화된 SpCas9 변이체일 수 있다. 이때 생성된 니카아제, 즉, SpCas9 변이체는 HNH 도메인에 의한 뉴클레아제 활성을 가지므로, 표적 유전자 또는 핵산의 상보성 가닥, 즉, gRNA와 상보적인 결합을 하지 않는 가닥을 절단할 수 있다.
또 다른 예를 들어, 상기 Type II CRISPR 효소가 야생형 CjCas9의 경우, 상기 니카아제는 야생형 CjCas9의 아미노산 서열 8번 아스파르트산을 알라닌으로 변이(mutation)시켜 RuvC 도메인의 뉴클레아제 활성이 불활성화된 CjCas9 변이체일 수 있다. 이때 생성된 니카아제, 즉, CjCas9 변이체는 HNH 도메인에 의한 뉴클레아제 활성을 가지므로, 표적 유전자 또는 핵산의 상보성 가닥, 즉, gRNA와 상보적인 결합을 하지 않는 가닥을 절단할 수 있다.
상기 CRISPR 효소는 불활성 CRISPR 효소일 수 있다.
“불활성”은 야생형 CRISPR 효소의 기능, 즉, DNA의 이중 가닥 중 제1 가닥을 절단하는 제1 기능 및 DNA의 이중 가닥 중 제2 가닥을 절단하는 제2 기능이 모두 상실된 상태를 의미한다. 이러한 상태의 CRISPR 효소는 불활성 CRISPR 효소로 명칭한다.
상기 불활성 CRISPR 효소는 야생형 CRISPR 효소의 뉴클레아제 활성을 가지는 도메인에 변이로 인한 뉴클레아제 불활성을 가질 수 있다.
상기 불활성 CRISPR 효소는 RuvC 도메인 및 HNH 도메인에 변이로 인한 뉴클레아제 불화성을 가질 수 있다. 즉, 상기 불활성 CRISPR 효소는 CRISPR 효소의 RuvC 도메인 및 HNH 도메인에 의한 뉴클레아제 활성을 포함하지 않을 수 있으며, 이를 위해 RuvC 도메인 및 HNH 도메인은 조작 또는 변경될 수 있다.
일 예로, 상기 CRISPR 효소가 Type II CRISPR 효소일 때, 상기 불활성 CRISPR 효소는 변형된 RuvC 도메인 및 HNH 도메인을 포함하는 Type II CRISPR 효소일 수 있다.
예를 들어, 상기 Type II CRISPR 효소가 야생형 SpCas9의 경우, 상기 불활성 CRISPR 효소는 야생형 SpCas9의 아미노산 서열 10번 아스파르트산과 840번 히스티딘을 모두 알라닌으로 변이(mutation)시켜 RuvC 도메인 및 HNH 도메인의 뉴클레아제 활성이 불활성화된 SpCas9 변이체일 수 있다. 이때 생성된 불활성 CRISPR 효소, 즉, SpCas9 변이체는 RuvC 도메인 및 HNH 도메인의 뉴클레아제 활성이 불활성 되므로, 표적 유전자 또는 핵산의 이중가닥을 모두 절단할 수 없다.
또 다른 예를 들어, 상기 Type II CRISPR 효소가 야생형 CjCas9의 경우, 상기 불활성 CRISPR 효소는 야생형 CjCas9의 아미노산 서열 8번 아스파르트산과 559번 히스티딘을 모두 알라닌으로 변이(mutation)시켜 RuvC 도메인 및 HNH 도메인의 뉴클레아제 활성이 불활성화된 CjCas9 변이체일 수 있다. 이때 생성된 불활성 CRISPR 효소, 즉, CjCas9 변이체는 RuvC 도메인 및 HNH 도메인의 뉴클레아제 활성이 불활성 되므로, 표적 유전자 또는 핵산의 이중가닥을 모두 절단할 수 없다.
상기 CRISPR 효소는 상기 기재된 뉴클레아제 활성 외에도 헬리카제 활성, 즉, 이중가닥 핵산의 나선 구조를 푸는 기능을 가질 수 있다.
또한, 상기 CRISPR 효소는 CRISPR 효소의 헬리카제 활성에 대해 완전 활성, 불완전 또는 부분 활성, 또는 불활성이 되도록 CRISPR 효소를 변형시킬 수 있다.
상기 CRISPR 효소는 야생형 CRISPR 효소를 인위적으로 조작 또는 변형시킨 CRISPR 효소 변이체일 수 있다.
상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 기능, 즉, DNA의 이중 가닥 중 제1 가닥을 절단하는 제1 기능 및/또는 DNA의 이중 가닥 중 제2 가닥을 절단하는 제2 기능을 변형시키기 위해 인위적으로 조작 또는 변형된 CRISPR 효소 변이체일 수 있다.
예를 들어, 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 기능 중 제1 기능이 상실된 형태일 수 있다.
또는 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 기능 중 제2 기능이 상실된 형태일 수 있다.
예를 들어, 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 기능, 즉, 제1 기능 및 제2 기능이 모두 상실된 형태일 수 있다.
상기 CRISPR 효소 변이체는 gRNA와 상호작용을 통한 gRNA-CRISPR 효소 복합체 형성할 수 있다.
상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 gRNA와 상호작용하는 기능을 변형시키기 위해 인위적으로 조작 또는 변형된 CRISPR 효소 변이체일 수 있다.
예를 들어, 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소에 비해 gRNA와의 상호작용이 감소된 형태일 수 있다.
또는 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소에 비해 gRNA의 상호작용이 증가된 형태일 수 있다.
예를 들어, 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 제1 기능을 가지면서 gRNA와의 상호작용이 감소된 형태일 수 있다.
또는 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 제1 기능을 가지면서 gRNA와의 상호작용이 증가된 형태일 수 있다.
예를 들어, 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 제2 기능을 가지면서 gRNA와의 상호작용이 감소된 형태일 수 있다.
또는 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 제2 기능을 가지면서 gRNA와의 상호작용이 증가된 형태일 수 있다.
예를 들어, 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 제1 기능 및 제2 기능을 가지지 않으면서 gRNA와의 상호작용이 감소된 형태일 수 있다.
또는 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 제1 기능 및 제2 기능을 가지지 않으면서 gRNA와의 상호작용이 증가된 형태일 수 있다.
이때, gRNA와 CRISPR 효소 변이체의 상호작용 세기에 따라 다양한 gRNA-CRISPR 효소 복합체가 형성될 수 있고, CRISPR 효소 변이체에 따라 표적 서열에 접근 또는 절단하는 기능에 차이가 생길 수 있다.
예를 들어, gRNA와의 상호작용이 감소된 CRISPR 효소 변이체에 의해 형성된 gRNA-CRISPR 효소 복합체는 gRNA와 완전히 상보적 결합을 하는 표적 서열에 근접 또는 국소화되는 경우에만 오직 표적 서열의 이중가닥 또는 단일가닥을 절단할 수 있다.
상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 아미노산 서열 중 적어도 하나 이상의 아미노산이 변형된 것일 수 있다.
일 예로, 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 아미노산 서열 중 적어도 하나 이상의 아미노산의 치환된 것일 수 있다.
다른 일 예로, 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 아미노산 서열 중 적어도 하나 이상의 아미노산이 제거된 것일 수 있다.
또 다른 일 예로, 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 아미노산 서열 내에 적어도 하나 이상의 아미노산이 부가된 것일 수 있다.
일 예로, 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 아미노산 서열 중 적어도 하나 이상의 아미노산의 치환, 제거 및/또는 부가된 것일 수 있다.
또한, 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 원래 기능, 즉, DNA의 이중 가닥 중 제1 가닥을 절단하는 제1 기능 및 DNA의 이중 가닥 중 제2 가닥을 절단하는 제2 기능, 이외에 선택적으로 기능적(functional) 도메인을 추가로 포함할 수 있다. 이때, 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 원래 기능 이외에 부가적인 기능을 가질 수 있다.
상기 기능적 도메인은 메틸라아제(methylase) 활성, 디메틸라아제(demethylase) 활성, 전사촉진(transcription activation) 활성, 전사 저해(transcription repression) 활성, 전사 방출 인자(transcription release factor) 활성, 히스톤 변형(histone modification) 활성, RNA 절단(cleavage) 활성 또는 핵산 결합(nucleic acid binding) 활성을 가지는 도메인일 수 있으며, 또는 단백질(펩타이드 포함)의 분리정제를 위한 태그(tag) 또는 리포터 유전자일 수 있으나, 이에 제한되지 않는다.
상기 태그는 히스티딘(His) 태그, V5 태그, FLAG 태그, 인플루엔자 헤마글루티닌(HA) 태그, Myc 태그, VSV-G 태그 및 티오레독신(Trx) 태그 등을 포함하며, 상기 리포터 유전자는 글루타티온-S-트랜스 퍼라제(GST), 호스라디시(horseradish) 과산화효소(HRP), 클로람페니콜 아세틸트랜스퍼라제(CAT) 베타-갈락토시다제, 베타-글루쿠로니다제, 루시퍼라제, 녹색 형광 단백질(GFP), HcRed, DsRed, 청록색 형광 단백질(CFP), 황색 형광 단백질(YFP) 및 청색 형광 단백질(BFP)을 포함하는 자가형광 단백질을 포함하나, 이들에 한정되지 않는다.
상기 기능적 도메인은 디아미네이즈(deaminase)일 수 있다.
예를 들어, 불완전 또는 부분 CRISPR 효소에 시티딘 디아미네이즈(cytidine deaminase)를 기능적 도메인으로 추가로 포함할 수 있다. 일 구체예로, SpCas9 니카아제에 시티딘 디아미네이즈, 예를 들면, APOBEC1(apolipoprotein B editing complex 1)를 추가하여 융합 단백질을 생성할 수 있다. 이렇게 형성된 [SpCas9 니카아제]-[APOBEC1]은 뉴클레오타이드 C를 T 또는 U로 뉴클레오타이드 교정 또는 편집에 이용되거나, 또는 뉴클레오타이드 G를 A로 뉴클레오타이드 교정 또는 편집에 이용될 수 있다.
또 다른 예를 들어, 불완전 또는 부분 CRISPR 효소에 아데닌 디아미네이즈(adenine deaminase)를 기능적 도메인으로 추가로 포함할 수 있다. 일 구체예로, SpCas9 니카아제에 아데닌 디아미네이즈, 예를 들면, TadA variants, ADAR2 variants, ADAT2 variants 등을 추가하여 융합 단백질을 생성할 수 있다. 이렇게 형성된 [SpCas9 니카아제]-[TadA variant], [SpCas9 니카아제]-[ADAR2 variant] 또는 [SpCas9 니카아제]-[ADAT2 variant]는 뉴클레오타이드 A를 inosine으로 변형시키며, 변형된 inosine은 polymerase에 의해 뉴클레오타이드 G로 인식되어 실질적으로 뉴클레오타이드 A를 G로 뉴클레오타이드 교정 또는 편집되는 효과를 보이므로, 뉴클레오타이드 A를 G로 뉴클레오타이드 교정 또는 편집에 이용되거나, 또는 뉴클레오타이드 T를 C로 뉴클레오타이드 교정 또는 편집에 이용될 수 있다.
상기 기능적 도메인은 NLS(nuclear localization sequence or signal) 또는 NES(nuclear export sequence or signal)일 수 있다.
일 예로, CRISPR 효소는 하나 이상의 NLS를 포함할 수 있다. 이때, 상기 NLS는 CRISPR 효소의 아미노 말단 또는 그 근처; 카르복시 말단 또는 그 근처; 또는 이들의 조합에 하나 이상의 NLS를 포함할 수 있다. 상기 NLS는 하기로부터 유래된 NLS 서열일 수 있으나, 이에 제한되지 않는다: 아미노산 서열 PKKKRKV(SEQ ID NO: 815)를 갖는 SV40 바이러스 대형 T-항원의 NLS; 뉴클레오플라스민(nucleoplasmin)으로부터의 NLS(예를 들어, 서열 KRPAATKKAGQAKKKK(SEQ ID NO: 816)를 갖는 뉴클레오플라스민 이분(bipartite) NLS); 아미노산 서열 PAAKRVKLD(SEQ ID NO: 817) 또는 RQRRNELKRSP(SEQ ID NO: 818)를 갖는 c-myc NLS; 서열 NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(SEQ ID NO: 819)를 갖는 hRNPA1 M9 NLS; 임포틴-알파로부터의 IBB 도메인의 서열 RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(SEQ ID NO: 820); 마이오마(myoma) T 단백질의 서열 VSRKRPRP(SEQ ID NO: 821) 및 PPKKARED(SEQ ID NO: 822); 인간 p53의 서열 PQPKKKPL(SEQ ID NO: 823); 마우스 c-abl IV의 서열 SALIKKKKKMAP(SEQ ID NO: 824); 인플루엔자 바이러스 NS1의 서열 DRLRR(SEQ ID NO: 825) 및 PKQKKRK(SEQ ID NO: 826); 간염 바이러스 델타 항원의 서열 RKLKKKIKKL(SEQ ID NO: 827); 마우스 Mx1 단백질의 서열 REKKKFLKRR(SEQ ID NO: 828); 인간 폴리(ADP-리보스) 중합효소의 서열 KRKGDEVDGVDEVAKKKSKK(SEQ ID NO: 829); 및 스테로이드 호르몬 수용체(인간) 글루코코르티코이드의 서열 RKCLQAGMNLEARKTKK(SEQ ID NO: 830).
또한, 상기 CRISPR 효소 변이체는 CRISPR 효소를 분할하여 두 개 이상의 부분으로 나눈 스플릿(split) 형태의 CRISPR 효소를 포함할 수 있다. “스플릿(split)”은 단백질을 기능적으로 또는 구조적으로 또는 임의로 두 개 이상으로 분할하는 것을 의미한다.
상기 스플릿(split) 형태의 CRISPR 효소는 완전 활성 효소, 불완전 또는 부분 활성 효소 또는 불활성 효소일 수 있다.
예를 들어, 상기 CRISPR 효소가 SpCas9의 경우, 656번 타이로신과 657번 트레오닌 사이를 분할하여 두 개의 부분으로 나눈 스플릿 SpCas9을 생성할 수 있다.
상기 스플릿(split) 형태의 CRISPR 효소는 선택적으로 재구성(reconstitution)을 위한 추가 도메인, 펩타이드, 폴리펩타이드 또는 단백질을 포함할 수 있다.
상기 재구성을 위한 추가 도메인, 펩타이드 폴리펩타이드 또는 단백질은 스플릿(split) 형태의 CRISPR 효소가 구조적으로 야생형 CRISPR 효소와 동일하거나 유사하도록 조립될 수 있다.
상기 재구성(reconstitution)을 위한 추가 도메인, 펩타이드, 폴리펩타이드 또는 단백질은 FRB 및 FKBP dimerization domains; 인테인(intein); ERT 및 VPR domains 또는 특정 조건에서 이량이질체(heterodimer)를 형성하는 도메인일 수 있다.
예를 들어, 상기 CRISPR 효소가 SpCas9의 경우, 713번 세린과 714번 글라이신 사이를 분할하여 두 개의 부분으로 나눈 스플릿 SpCas9에 두 부분 중 하나에 FRB 도메인을 연결하고, 나머지 하나에 FKBP 도메인을 연결할 수 있다. 이렇게 생성된 스플릿 SpCas9은 라파마이신이 존재하는 환경에서 FRB 도메인과 FKBP 도메인이 다이머를 형성하여 재구성된 CRISPR 효소를 생성할 수 있다.
본 명세서에 의해 개시되는 CRISPR 효소 또는 CRISPR 효소 변이체는 폴리펩타이드, 단백질 또는 이를 암호화하는 서열을 가지는 핵산일 수 있으며, 상기 CRISPR 효소 또는 CRISPR 효소 변이체를 도입하고자 하는 대상에 맞추어 코돈 최적화(codon optimization)된 것일 수 있다.
“코돈 최적화”는 고유 서열의 적어도 하나의 코돈을 숙주 세포의 유전자에 더욱 빈번하게 또는 가장 빈번하게 사용되는 코돈으로 대체하면서, 고유 아미노상 서열을 유지함으로써 관심 숙주 세포에서의 발현의 증진을 위해 핵산서열을 변형시키는 과정을 의미한다. 다양한 종은 특정 아미노산의 특정 코돈에 대한 특정 편향을 가지며, 코돈 편향(유기체 간의 코돈 사용의 차이)은 종종 mRNA의 번역의 효율과 상호관련 되며, 이는 번역되는 코돈의 특성 및 특정 tRNA 분자의 이용가능성에 의해 좌우되는 것을 여겨진다. 세포에서 선택된 tRNA의 우세는 일반적으로 펩타이드 합성에 가장 빈번하게 사용되는 코돈을 반영한 것이다. 따라서, 유전자는 코돈 최적화에 기초하여 주어진 유기체에서 최적의 유전자 발현을 위해 맞춤화될 수 있다.
본 명세서에 의해 개시되는 gRNA, CRISPR 효소 또는 gRNA-CRISPR 효소 복합체는 다양한 형태로 대상 내로 전달 또는 도입될 수 있다.
상기 대상 관련 설명은 상기 기술한 바와 같다.
일 구현예로서, gRNA 및/또는 CRISPR 효소는 각각을 암호화하는 핵산서열을 포함하는 벡터에 의해 대상 내로 전달 또는 도입될 수 있다.
벡터는 gRNA 및/또는 CRISPR 효소를 암호화하는 핵산서열을 포함할 수 있다.
일 예로, 상기 벡터는 gRNA 및 CRISPR 효소를 암호화하는 핵산서열을 동시에 포함할 수 있다.
다른 일 예로, 상기 벡터는 gRNA 암호화하는 핵산서열을 포함할 수 있다.
예를 들어, 상기 gRNA에 포함되는 도메인은 하나의 벡터에 모두 포함되거나 또는 각각의 도메인을 나누어 각각의 벡터에 포함시킬 수 있다.
다른 일 예로, 상기 벡터는 CRISPR 효소를 암호화하는 핵산서열을 포함할 수 있다.
예를 들어, 상기 CRISPR 효소의 경우, CRISPR 효소를 암호화하는 핵산서열은 하나의 벡터에 포함되거나 또는 CRISPR 효소를 암호화하는 핵산서열은 분할되어 여러 개의 벡터에 포함될 수 있다.
상기 벡터는 하나 이상의 조절/제어 구성요소를 포함할 수 있다.
이때, 상기 조절/제어 구성요소는 포로모터, 인핸서, 인트론, 폴리아데닐화 신호, 코작 공통(Kozak consensus) 서열, 내부 리보솜 유입 부위(internal ribosome entry site, IRES), 스플라이스 억셉터 및/또는 2A 서열을 포함할 수 있다.
상기 프로모터는 RNA 중합효소 II에 의해 인식되는 프로모터일 수 있다.
상기 프로모터는 RNA 중합효소 III에 의해 인식되는 프로모터일 수 있다.
상기 프로모터는 유도성 프로모터일 수 있다.
상기 프로모터는 대상 특이적 프로모터일 수 있다.
상기 프로모터는 바이러스 또는 비바이러스 프로모터일 수 있다.
상기 프로모터는 제어 영역(즉, gRNA 및/또는 CRISPR 효소를 암호화하는 핵산서열)에 따라 적합한 프로모터를 이용할 수 있다.
예를 들어, gRNA를 위해 유용한 프로모터는 H1, EF-1a, tRNA 또는 U6 프로모터일 수 있다. 예를 들어, CRISPR 효소를 위해 유용한 프로모터는 CMV, EF-1a, EFS, MSCV, PGK 또는 CAG 프로모터일 수 있다.
상기 벡터는 바이러스 벡터 또는 재조합 바이러스 벡터일 수 있다.
상기 바이러스는 DNA 바이러스 또는 RNA 바이러스일 수 있다.
이때, 상기 DNA 바이러스는 이중가닥 DNA(dsDNA) 바이러스 또는 단일가닥 DNA(ssDNA) 바이러스 일 수 있다.
이때, 상기 RNA 바이러스는 단일가닥 RNA(ssRNA) 바이러스일 수 있다.
상기 바이러스는 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스(AAV), 백시니아바이러스, 폭스바이러스 또는 단순포진 바이러스일 수 있으나, 이에 제한되지 않는다.
일 예로, gRNA 및/또는 CRISPR 효소를 암호화하는 핵산서열은 재조합 렌티바이러스에 의해 전달 또는 도입될 수 있다.
다른 일 예로, gRNA 및/또는 CRISPR 효소를 암호화하는 핵산서열은 재조합 아데노바이러스에 의해 전달 또는 도입될 수 있다.
또 다른 일 예로, gRNA 및/또는 CRISPR 효소를 암호화하는 핵산서열은 재조합 AAV에 의해 전달 또는 도입될 수 있다.
다른 일 예로, gRNA 및/또는 CRISPR 효소를 암호화하는 핵산서열은 혼성 바이러스, 예를 들어 본 명세서에 기재한 바이러스 중 하나 이상의 혼성체에 의해 전달 또는 도입될 수 있다.
일 구현예로서, gRNA-CRISPR 효소 복합체의 형태로 대상 내로 전달 또는 도입될 수 있다.
예를 들어, 상기 gRNA는 DNA, RNA 또는 이의 혼합 형태일 수 있다. 상기 CRISPR 효소는 펩타이드, 폴리펩타이드 또는 단백질의 형태일 수 있다.
일 예로, gRNA 및 CRISPR 효소는 RNA 형태의 gRNA와 단백질 형태의 CRISPR gRNA-CRISPR 효소 복합체, 즉 ribonucleoprotein(RNP)의 형태로 대상 내로 전달 또는 도입될 수 있다.
상기 CRISPR gRNA-CRISPR 효소 복합체는 전기천공법, 미량주사법, 일시적인 세포 압축 또는 스퀴징(예를 들어, 문헌[Lee, et al, (2012) Nano Lett., 12, 6322-6327]에 기재되어 있음), 지질-매개 형질감염, 나노파티클, 리포솜, 펩타이드-매개 전달 또는 이의 조합에 의해 대상 내로 전달 또는 도입될 수 있다.
본 명세서에 의해 개시되는 gRNA-CRISPR 효소 복합체는 표적 유전자, 즉, 면역 참여 유전자를 인위적으로 조작 또는 변형시키는데 이용될 수 있다.
표적 유전자는 앞서 기재한 gRNA-CRISPR 효소 복합체, 즉, CRISPR 복합체를 이용하여 조작 또는 변형할 수 있다. 이때, 표적 유전자의 조작 또는 변형은 i) 표적 유전자의 절단 또는 손상과 ii) 손상된 표적 유전자의 수선 또는 수복하는 단계를 모두 포함한다.
상기 i) 표적 유전자의 절단 또는 손상은 CRISPR 복합체를 이용한 표적 유전자의 절단 또는 손상일 수 있으며, 구체적으로는 표적 유전자 내의 표적 서열의 절단 손상일 수 있다.
상기 표적 서열은 gRNA-CRISPR 효소 복합체의 타겟이 될 수 있고, 상기 표적 서열은 CRISPR 효소가 인식하는 PAM 서열을 포함하거나 또는 포함하지 않을 수 있다. 이러한 표적 서열은 실시자에게 gRNA 설계 단계에서 중요한 기준을 제공할 수 있다.
상기 표적 서열은 gRNA-CRISPR 효소 복합체의 gRNA에 의해 특이적으로 인식될 수 있으며, 이로 인해 gRNA-CRISPR 효소 복합체는 인식된 표적 서열에 근접하게 위치할 수 있다.
표적 부위의 "절단(cleavage)"은 폴리뉴클레오타이드의 공유결합(covalent backbone)의 파손(breakage)을 의미한다. 절단은 포스포다이에스터(phosphodiester) 결합의 효소적 또는 화학적 가수분해를 포함하나, 이에 제한되지 않으며, 이외의 다양한 여러 가지 방법들에 의하여 수행될 수 있다. 단일가닥의 절단 및 이중가닥의 절단 모두 가능하며, 이중가닥의 절단은 두 개의 구별되는(distinct) 단일-가닥의 절단의 결과로서 발생할 수 있다. 이중 가닥의 절단은 blunt ends 또는 staggered end(또는 sticky end)를 생성할 수 있다.
일 예로, 상기 CRISPR 복합체를 이용한 표적 유전자의 절단 또는 손상은 표적 서열의 이중가닥이 모두 절단 또는 손상되는 것일 수 있다.
일 구체예로서, CRISPR 효소가 야생형의 SpCas9인 경우, CRISPR 복합체는 gRNA와 상보적 결합을 하는 표적 서열의 이중가닥을 모두 절단시킬 수 있다.
다른 일 구체예로서, CRISPR 효소가 SpCas9 니카아제(D10A)와 SpCas9 니카아제(H840A)인 경우, 각각의 CRISPR 복합체는 gRNA와 상보적 결합을 하는 표적 서열의 두 개의 단일가닥을 각각 절단시킬 수 있다. 즉, gRNA와 상보적 결합을 하는 표적 서열의 상보성 단일가닥은 SpCas9 니카아제(D10A)에 의해 절단되고, gRNA와 상보적 결합을 하는 표적 서열의 비상보성 단일가닥은 SpCas9 니카아제(H840A)에 의해 절단될 수 있고, 각각의 절단은 순차적으로 또는 동시에 발생할 수 있다.
다른 일 예로, 상기 CRISPR 복합체를 이용한 표적 유전자 또는 핵산의 절단 또는 손상은 표적 서열의 이중가닥 중 단일가닥만 절단 또는 손상되는 것일 수 있다. 이때, 단일가닥은 gRNA와 상보적 결합을 하는 표적 서열의 가이드핵산 결합 서열, 즉, 상보성 단일가닥일 수 있고, 또는 gRNA와 상보적 결합을 하지 않는 가이드핵산 비결합 서열, 즉, gRNA와 비상보성 단일가닥일 수 있다.
일 구체예로서, CRISPR 효소가 SpCas9 니카아제(D10A)인 경우, CRISPR 복합체는 gRNA와 상보적 결합을 하는 표적 서열의 가이드핵산 결합 서열, 즉, 상보성 단일가닥은 SpCas9 니카아제(D10A)에 의해 절단되고, gRNA와 상보적 결합을 하지 않는 표적 서열의 가이드핵산 비결합 서열, 즉, gRNA와 비상보성 단일가닥은 절단되지 않을 수 있다.
다른 일 구체예로서, CRISPR 효소가 SpCas9 니카아제(H840A)인 경우, CRISPR 복합체는 gRNA와 상보적 결합을 하지 않는 표적 서열의 가이드핵산 비결합 서열, 즉, gRNA와 비상보성 단일가닥은 SpCas9 니카아제(H840A)에 의해 절단되고, gRNA와 상보적 결합을 하는 표적 서열의 가이드핵산 결합 서열, 즉, 상보성 단일가닥은 절단되지 않을 수 있다.
또 다른 일 예로, 상기 CRISPR 복합체를 이용한 표적 유전자 또는 핵산의 절단 또는 손상은 일부 핵산 조각(fragment)를 제거하는 것일 수 있다.
일 구체예로서, 상기 CRISPR 복합체가 서로 다른 표적 서열에 상보적 결합을 하는 두 개의 gRNA와 야생형 SpCas9에 의해 구성되는 경우, 제 1 gRNA와 상보적 결합을 하는 표적 서열의 이중가닥을 절단하고, 제 2 gRNA와 상보적 결합을 하는 표적 서열의 이중가닥을 절단하여 제 1 gRNA와 제 2 gRNA 및 SpCas9에 의해 핵산 조각을 제거할 수 있다.
상기 ii) 손상된 표적 유전자의 수선 또는 수복은 비-상동성 말단-결합 (NHEJ) 및 상동 재조합 수리(HDR)을 통해 수선 또는 수복될 수 있다.
상기 비-상동성 말단-결합 (Non-homologous end joining, NHEJ)은 절단된 이중가닥 또는 단일가닥의 양 말단이 함께 결합함으로써 DNA 내 이중가닥 파손을 수복 또는 수선하는 방법으로, 일반적으로, 이중가닥의 파손(예를 들어, 절단)에 의해 형성된 2 개의 적합성 말단이 빈번한 접촉을 반복하여 2개의 말단이 완전히 결합되는 경우 파손된 이중가닥이 복구된다. NHEJ는 모든 세포주기에서 가능한 수복 방식으로, 주로 G1 시기와 같이 세포 내에 주형으로 쓸 상동유전체가 없을 때 발생한다.
NHEJ를 이용한 손상된 유전자 또는 핵산의 수복 과정에서 NHEJ 수선 부위에 핵산 서열의 일부 삽입 및/또는 결실(삽입결실)을 초래하며, 이러한 삽입 및/또는 결실은 리딩 프레임을 변경시키고, 프레임쉬프트 된 전사체 mRNA를 만들어내고, 결과적으로 넌센스-매개 붕괴(nonsense mediated decay)를 겪거나 정상적인 단백질을 합성하는데 실패함으로써 본래의 기능을 상실하게 된다. 또는 추가적으로, 리딩 프레임을 유지하지만, 상당한 양의 서열을 삽입 또는 결실시키는 돌연변이를 초래해 단백질의 기능성을 파괴할 수 있다. 이는 중요한 기능적 도메인의 돌연변이가 단백질의 비중요 영역에서의 돌연변이보다 덜 용인될 가능성이 있기 때문에 좌위 의존적이다.
NHEJ에 의해 생성된 삽입결실 돌연변이는 자연 상태에서 예측 불가능하지만, 주어진 파손 부위에서 특정 삽입 결실 서열이 선호되며, 이는 마이크로상동성의 작은 영역에 기인할 가능성이 있다. 통상적으로 결실 길이는 1 bp 내지 50 bp 범위이며, 삽입은 더 짧게 되는 경향이 있고, 종종 파손 부위를 바로 둘러싸는 짧은 중복 서열을 포함한다.
또한, NHEJ는 돌연변이를 유발하는 과정으로, 특이적 최종 서열의 생성이 필요하지 않은 경우, 작은 서열의 모티프를 결실시키는데 사용될 수 있다.
이러한 NHEJ를 이용하면, CRISPR 복합체에 의해 표적되는 유전자의 특이적 넉아웃(knockout)할 수 있다. CRISPR 효소, 예를 들어, Cas9 또는 Cpf1을 이용하여 표적 유전자 또는 핵산의 이중가닥 또는 두 개의 단일가닥의 절단하고, 파손된 표적 유전자 또는 핵산의 이중가닥 또는 두 개의 단일가닥은 NHEJ에 의해 삽입결실이 생성되며, 이를 통해 표적 유전자 또는 핵산의 특이적 넉아웃을 유도할 수 있다. 이때, 상기 CRISPR 효소에 의해 절단되는 표적 유전자 또는 핵산의 위치는 비암호 영역 또는 암호 영역일 수 있으며, 더불어 NHEJ에 의해 수복되는 표적 유전자 또는 핵산의 위치는 비암호 영역 또는 암호 영역일 수 있다.
일 예로, CRISPR 복합체를 이용하여 표적 유전자의 이중가닥을 절단하고 NHEJ에 의해 수복되는 과정을 통해 수복 부위에 다양한 인델 (indel; insertion and deletion)이 발생할 수 있다.
"인델(indel)"은 DNA의 뉴클레오타이드 배열에서 일부 뉴클레오타이드가 중간에 삽입 (insertion)되거나 결실 (deletion) 된 변이를 총칭한다. 인델은 상술한 바와 같이 gRNA-CRISPR 효소 복합체가 면역 참여 인자의 핵산(DNA, RNA)를 절단하는 경우, HDR 또는 NHEJ 기작에 의해 수선되는 과정에서 표적 서열에 도입되는 것일 수 있다.
상기 상동 재조합 수리(homology directed repairing, HDR)는 손상된 유전자 또는 핵산을 수선 또는 수복하기 위해 상동성을 가진 서열을 주형으로 이용하는 방식으로 오류 없이 교정할 수 있는 방법으로, 일반적으로, 파손된 DNA을 수선 또는 수복하기 위해, 즉 세포가 가지고 있는 원래의 정보를 복원하기 위해, 변형이 이루어지지 않은 상보적인 뉴클레오타이드 서열의 정보를 이용하거나 자매 염색분체의 정보를 이용하여 파손된 DNA를 수선 또는 수복한다. HDR의 가장 일반적인 형태는 상동성 재조합(homologous recombination, HR)이다. HDR은 통상적으로 활발하게 분열하는 세포의 S나 G2/M 시기에 주로 발생하는 수선 또는 수복 방식이다.
HDR을 이용한 손상된 DNA 수선 또는 수복을 위해, 세포가 본래 가지는 상보적인 뉴클레오타이드 서열 또는 자매 염색분체를 이용하는 대신에, 상보적인 뉴클레오타이드 서열 또는 상동성 뉴클레오타이드 서열 정보를 이용한 인공적으로 합성한 DNA 주형, 즉, 상보적인 뉴클레오타이드 서열 또는 상동성 뉴클레오타이드 서열을 포함하는 핵산 주형을 세포에 제공하여 파손된 DNA를 수선 또는 수복할 수 있다. 이때, 상기 핵산 주형에 추가로 핵산 서열 또는 핵산 조각을 포함시켜 파손된 DNA를 수선 또는 수복 할 때, 파손된 DNA에 추가로 포함시킨 핵산 서열 또는 핵산 조작을 삽입(Knock-In)할 수 있다. 추가로 포함시킨 핵산 서열 또는 핵산 조각은 돌연변이의 변형된 표적 유전자 또는 핵산을 정상 유전자 또는 핵산으로 교정하기 위한 핵산 서열 또는 핵산 조각이거나 세포 내에서 발현을 원하는 유전자 또는 핵산일 수 있으나, 이에 제한되지 않는다.
일 예로, CRISPR 복합체를 이용하여 표적 유전자 또는 핵산의 이중가닥 또는 단일가닥을 절단하고, 절단 위치와 근접한 뉴클레오타이드 서열과 상보적인 뉴클레오타이드 서열을 포함하는 핵산 주형을 세포에 제공하여 표적 유전자 또는 핵산의 절단된 뉴클레오타이드 서열을 HDR 방법으로 수선 또는 수복할 수 있다.
이때, 상기 상보적인 뉴클레오타이드 서열을 포함하는 핵산 주형은 파손된 DNA, 즉 절단된 이중가닥 또는 단일가닥의 상보적인 뉴클레오타이드 서열을 가지며, 추가로 파손된 DNA에 삽입하기 원하는 핵산 서열 또는 핵산 조각을 포함할 수 있다. 이와 같이 상보적인 뉴클레오타이드 서열과 삽입하고자 하는 핵산 서열 또는 핵산 조각을 포함하는 핵산 주형을 이용하여 파손된 DNA, 즉 표적 유전자 또는 핵산의 절단된 위치에 추가적인 핵산 서열 또는 핵산 조각을 삽입할 수 있다. 이때, 상기 삽입하고자 하는 핵산 서열 또는 핵산 조각 및 추가적인 핵산 서열 또는 핵산 조각은 돌연변이의 변형된 표적 유전자 또는 핵산을 정상 유전자 또는 핵산으로 교정하기 위한 핵산 서열 또는 핵산 조각이거나 세포 내에서 발현을 원하는 유전자 또는 핵산일 수 있다. 상기 상보적인 뉴클레오타이드 서열은 파손된 DNA, 즉 표적 유전자 또는 핵산의 절단된 이중가닥 또는 단일가닥의 오른쪽 및 왼쪽의 뉴클레오타이드 서열과 상보적인 결합을 하는 뉴클레오타이드 서열일 수 있다. 또는 상기 상보적인 뉴클레오타이드 서열은 파손된 DNA, 즉 표적 유전자 또는 핵산의 절단된 이중가닥 또는 단일가닥의 3' 및 5' 말단과 상보적인 결합을 하는 뉴클레오타이드 서열일 수 있다. 상기 상보적인 뉴클레오타이드 서열은 15 내지 3000개의 뉴클레오타이드 서열일 수 있으며, 핵산 주형의 크기 또는 표적 유전자 또는 핵산에 따라 적절하게 상기 상보적인 뉴클레오타이드 서열의 길이 또는 크기를 설계할 수 있다. 이때, 핵산 주형을 이중가닥 또는 단일가닥의 핵산일 수 있으며, 선형 또는 원형일 수 있으나, 이에 제한되지 않는다.
다른 일 예로, CRISPR 복합체를 이용하여 표적 유전자 또는 핵산의 이중가닥 또는 단일가닥을 절단하고, 절단 위치와 근접한 뉴클레오타이드 서열과 상동성 뉴클레오타이드 서열을 포함하는 핵산 주형을 세포에 제공하여 표적 유전자 또는 핵산의 절단된 뉴클레오타이드 서열을 HDR 방법으로 수선 또는 수복할 수 있다.
이때, 상기 상동성 뉴클레오타이드 서열을 포함하는 핵산 주형은 파손된 DNA, 즉 절단된 이중가닥 또는 단일가닥의 상동성 뉴클레오타이드 서열을 가지며, 추가로 파손된 DNA에 삽입하기 원하는 핵산 서열 또는 핵산 조각을 포함할 수 있다. 이와 같이 상동성 뉴클레오타이드 서열과 삽입하고자 하는 핵산 서열 또는 핵산 조각을 포함하는 핵산 주형을 이용하여 파손된 DNA, 즉 표적 유전자 또는 핵산의 절단된 위치에 추가적인 핵산 서열 또는 핵산 조각을 삽입할 수 있다. 이때, 상기 삽입하고자 하는 핵산 서열 또는 핵산 조각 및 추가적인 핵산 서열 또는 핵산 조각은 돌연변이의 변형된 표적 유전자 또는 핵산을 정상 유전자 또는 핵산으로 교정하기 위한 핵산 서열 또는 핵산 조각이거나 세포 내에서 발현을 원하는 유전자 또는 핵산일 수 있다. 상기 상동성 뉴클레오타이드 서열은 파손된 DNA, 즉 표적 유전자 또는 핵산의 절단된 이중가닥 또는 단일가닥의 오른쪽 및 왼쪽의 뉴클레오타이드 서열과 상동성을 가지는 뉴클레오타이드 서열일 수 있다. 또는 상기 상보적인 뉴클레오타이드 서열은 파손된 DNA, 즉 표적 유전자 또는 핵산의 절단된 이중가닥 또는 단일가닥의 3' 및 5' 말단과 상동성을 가지는 뉴클레오타이드 서열일 수 있다. 상기 상동성 뉴클레오타이드 서열은 15 내지 3000개의 뉴클레오타이드 서열일 수 있으며, 핵산 주형의 크기 또는 표적 유전자 또는 핵산에 따라 적절하게 상기 상동성 뉴클레오타이드 서열의 길이 또는 크기를 설계할 수 있다. 이때, 핵산 주형을 이중가닥 또는 단일가닥의 핵산일 수 있으며, 선형 또는 원형일 수 있으나, 이에 제한되지 않는다.
상기 NHEJ와 HDR 외에도 손상된 표적 유전자를 수선 또는 수복하는 다양한 방법이 존재한다. 예를 들어, 손상된 표적 유전자의 수선 또는 수복 방법은 단일가닥 어닐링, 단일가닥 파손 수선, 미스매치 수선, 뉴클레오타이드 절단 수선 또는 뉴클레오타이드 절단 수선을 이용한 방법일 수 있다.
상기 단일가닥 어닐링(Single-strand annealing, SSA)은 표적 핵산 중에 존재하는 2개의 반복부 서열 사이의 이중가닥 파손을 수선하는 방법으로, 일반적으로 30개 초과의 뉴클레오타이드 서열의 반복부 서열을 이용할 수 있다. 파손 말단에서 표적 핵산의 이중가닥에 대해 반복부 서열을 각각의 단일가닥이 가지도록 절단(Sticky end가 되도록)되며, 절단 후 반복부 서열을 함유하는 단일가닥 돌출부는 반복체 서열이 자체적으로 부적절하게 어닐링되는 것을 방지하기 위해 RPA 단백질로 코팅된다. RAD52는 돌출부 상의 각각의 반복부 서열에 결합하고, 상보성 반복부 서열의 어닐링을 가능하게 하는 서열을 정렬한다. 어닐링 후에, 돌출부의 단일가닥 플랩(flap)은 절단되고, 새로운 DNA 합성이 임의의 갭을 채우면서 DNA 이중가닥을 복원한다. 이러한 수복 또는 수선의 결과로, 2개의 반복체 사이의 DNA 서열이 결실되며, 결실 길이는 이용되는 2개의 반복체의 위치를 포함하는 다수의 인자 및 절단 경로 또는 진행도에 의존될 수 있다.
SSA는 HDR 방식과 유사하게는 상보성 서열, 즉 상보성 반복부 서열을 이용하고, 대조적으로는 표적 핵산 서열을 변경 또는 수정하기 위한 핵산 주형을 필요로 하지 않는다.
게놈 내 단일가닥 파손은 상기 논의된 수선 메커니즘과는 별도의 메커니즘인 단일가닥 파손 수선(Single-strand break repair, SSBA)을 통해 수선 또는 수복될 수 있다. DNA 파손의 형태가 단일가닥 파손일 때, PARP1 및/또는 PARP2는 파손을 인식하고 수선 기작을 동원한다. DAN 파손에서 PARP1의 결합 및 활성을 일시적이며, 손상부에 SSBR 단백질 복합체의 안정성을 촉진함으로써 SSBR을 촉진시킨다. SSBR 복합체에서 가장 중요한 단백질은 XRCC1으로, 이는 DNA의 3' 및 5' 말단 가공을 촉진하는 단백질과 상호작용하며, 안정화시킨다. 말단 가공은 일반적을 손상된 3' 말단을 하이드록실화 된 상태 및/또는 5' 말단을 인산염 모이어티로 복구하는 것을 수반하며, 말단이 가공되면, DNA 갭 채우기가 일어난다. DNA 갭 채우기에는 2가지 방법, 즉, 짧은 패치 수선 및 긴 패치 수선이 있으며, 이때 짧은 패치 수선은 빠져있는 단일 뉴클레오타이드의 삽입을 수반한다. DNA 갭 채우기 후, DNA 리가아제는 말단의 결합을 촉진한다.
상기 미스매치 수선(Mismatch repair, MMR)은 잘못 짝지어진 DNA 뉴클레오타이드상에서 작용할 수 있다. MSH2/6 또는 MSH2/3 복합체는 둘 다 미스매치 인식 및 수선의 개시에서 중요한 역할을 하는 ATP 분해효소 활성을 가지며, MSH2/6는 뉴클레오타이드-뉴클레오타이드 미스매치를 우선적으로 인식하고, 1개 또는 2개의 뉴클레오타이드의 미스매치를 동정하는 반면, MSH2/3는 더 큰 미스매치를 우선적으로 인식한다.
상기 뉴클레오타이드 절단 수선(Base excision repair, BER)은 세포주기 전체에서 활성이며, 게놈으로부터 작은 비-나선-뒤틀림 뉴클레오타이드 손상부를 제거하는데 이용되는 수선 방식이다. 손상된 DNA는 당 인산화 백본에 뉴클레오타이드를 연결하는 N-글리코사이드 결합을 절단하여 손상된 뉴클레오타이드를 절단하고, 이어서 포스포디에스테르 백본을 절단하여 DNA 단일가닥 파손을 생성한다. 이렇게 형성된 파손된 단일가닥 말단을 제거하고, 제거된 단일가닥에 의해 발생된 갭을 새로운 상보성 뉴클레오타이드로 채운 후, DNA 리가아제로 새로 채워진 상보성 뉴클레오타이드 말단과 백본을 결합시켜 손상된 DNA를 수선 또는 수복한다.
상기 뉴클레오타이드 절단 수선(Nucleotide excision repair, NER)은 DNA로부터 큰 나선-뒤틀림 손상을 제거하는 중요한 절단 메커니즘으로, 손상이 인식되면, 손상부를 함유하는 짧은 단일가닥 DNA 세그먼트를 제거하여, 22개 내지 30개 뉴클레오타이드의 단일가닥 갭을 생성한다. 생성된 갭은 새로운 상보성 뉴클레오타이드로 채운 후, DNA 리가아제로 새로 채워진 상보성 뉴클레오타이드 말단과 백본을 결합시켜 손상된 DNA를 수선 또는 수복한다.
상기 gRNA-CRISPR 효소 복합체에 의한 표적 유전자, 즉, 면역 참여 유전자의 인위적인 조작 효과는 크게 넉아웃(knockout), 넉다운(knockdown), 넉인(knockin)일 수 있다.
"넉아웃(knockout)"은 표적 유전자 또는 핵산을 불활성화시키는 것을 의미하며, “표적 유전자 또는 핵산의 불활성화”는 표적 유전자 또는 핵산의 전사 및/또는 번역이 되지 못하는 상태를 의미한다. 넉아웃을 통해 질병을 유발하는 유전자 또는 비정상적 기능을 가지는 유전자의 전사 및 번역을 억제하여 단백질의 발현을 막을 수 있다.
예를 들어, gRNA-CRISPR 효소 복합체, 즉, CRISPR 복합체를 이용하여 표적 유전자 또는 염색체를 편집 또는 교정하는 경우, CRISPR 복합체를 이용하여 표적 유전자 또는 염색체를 절단할 수 있다. CRISPR 복합체를 이용하여 손상된 표적 유전자 또는 염색체는 NHEJ를 통해 손상된 유전자 또는 염색체가 수복될 수 있다. 파손된 표적 유전자 또는 염색체는 NHEJ에 의해 삽입결실이 생성되며, 이를 통해 표적 유전자 또는 염색체의 특이적 넉아웃을 유도할 수 있다.
다른 예를 들어, gRNA-CRISPR 효소 복합체, 즉, CRISPR 복합체 및 도너을 이용하여 표적 유전자 또는 염색체를 편집 교정하는 경우, CRISPR 복합체를 이용하여 표적 유전자 또는 핵산을 절단할 수 있다. CRISPR 복합체를 이용하여 손상된 표적 유전자 또는 핵산은 도너를 이용해 HDR을 통해 손상된 유전자 또는 염색체가 수복될 수 있다. 이때, 도너는 상동성 뉴클레오타이드 서열 및 삽입시키길 원하는 뉴클레오타이드 서열을 포함한다. 이때, 삽입시키길 원하는 뉴클레오타이드 서열은 개수는 삽입 위치 또는 목적에 따라 다양하게 조절될 수 있다. 도너를 이용해 손상된 유전자 또는 염색체가 수복된 경우, 손상된 뉴클레오타이드 서열 부위에 삽입시키길 원하는 뉴클레오타이드 서열이 삽입되며, 이를 통해 표적 유전자 또는 염색체의 특이적 넉아웃을 유도할 수 있다.
"넉다운(knockdown)"은 표적 유전자 또는 핵산의 전사 및/또는 번역을 감소시키거나 표적 단백질의 발현이 감소하는 것을 의미한다. 넉다운을 통해 과발현되는 유전자 또는 단백질의 발현을 조절하여 질병의 발생을 막거나 질병을 치료할 수 있다.
예를 들어, gRNA- CRISPR 불활성 효소-전사 저해 활성 도메인 복합체, 즉, 전사 저해 활성 도메인을 포함하는 CRISPR 불활성 복합체를 이용하여 표적 유전자 또는 염색체를 편집 또는 교정하는 경우, 상기 CRISPR 불활성 복합체가 표적 유전자 또는 염색체에 특이적으로 결합하고, CRISPR 불활성 복합체에 포함된 전사 저해 활성 도메인에 의해 표적 유전자 또는 염색체의 전사가 저해되어 해당 유전자 또는 염색체의 발현이 저해되는 넉다운을 유도할 수 있다.
다른 예를 들어, gRNA-CRISPR 효소 복합체, 즉, CRISPR 복합체를 이용하여 표적 유전자 또는 염색체를 편집 교정하는 경우, 상기 CRISPR 복합체가 표적 유전자 또는 염색체의 프로모터 및/또는 인핸서 부위를 절단할 수 있다. 이때, 상기 gRNA는 표적 유전자 또는 염색체의 프로모터 및/또는 인핸서 부위의 일부 뉴클레오타이드 서열을 표적 서열로 인식할 수 있다. CRISPR 복합체를 이용하여 손상된 표적 유전자 또는 염색체는 NHEJ를 통해 손상된 유전자 또는 염색체가 수복될 수 있다. 파손된 표적 유전자 또는 염색체는 NHEJ에 의해 삽입결실이 생성되며, 이를 통해 표적 유전자 또는 염색체의 특이적 넉다운을 유도할 수 있다. 또는 선택적으로 도너를 이용하는 경우, CRISPR 복합체를 이용하여 손상된 표적 유전자 또는 염색체는 HDR을 통해 손상된 유전자 또는 염색체가 수복될 수 있다. 도너를 이용해 손상된 유전자 또는 염색체가 수복된 경우, 손상된 뉴클레오타이드 서열 부위에 삽입시키길 원하는 뉴클레오타이드 서열이 삽입되며, 이를 통해 표적 유전자 또는 염색체의 특이적 넉다운을 유도할 수 있다.
"넉인(knockin)"은 표적 유전자 또는 핵산에 특정 핵산 또는 유전자를 삽입하는 것을 의미하며, 이때, "특정 핵산 또는 유전자"은 삽입하고자 하는 또는 발현시키기 원하는 핵산 또는 유전자를 의미한다. 넉인을 통해 질병을 유발하는 돌연변이 유전자를 올바르게 교정하거나, 정상 유전자를 삽입하여 정상 유전자의 발현을 유도하여 질병 치료에 이용할 수 있다.
더불어, 넉인은 추가적으로 도너(donor)를 필요로 할 수 있다.
예를 들어, gRNA-CRISPR 효소 복합체, 즉, CRISPR 복합체 및 도너를 이용하여 표적 유전자 또는 핵산을 편집 또는 교정하는 경우, CRISPR 복합체를 이용하여 표적 유전자 또는 핵산을 절단할 수 있다. CRISPR 복합체를 이용하여 손상된 표적 유전자 또는 핵산은 도너를 이용해 HDR를 통해 손상된 유전자 또는 핵산이 수복될 수 있다. 이때, 도너는 특정 핵산 또는 유전자를 포함하며, 이를 이용하여 손상된 유전자 또는 염색체에 특정 핵산 또는 유전자를 삽입할 수 있다. 이때, 삽입된 특정 핵산 또는 유전자는 단밸질도의 발현이 유도할 수 있다.
본 명세서에 의해 개시되는 내용의 일 구체예로서, gRNA-CRISPR 효소 복합체는 MYD88 유전자 및/또는 C3 유전자에 인위적인 조작 또는 변형을 가할 수 있다.
상기 gRNA-CRISPR 효소 복합체는 MYD88 유전자 및/또는 C3 유전자의 표적 서열을 특이적으로 인식할 수 있다.
상기 표적 서열은 gRNA-CRISPR 효소 복합체의 gRNA에 의해 특이적으로 인식될 수 있으며, 이로 인해 gRNA-CRISPR 효소 복합체는 인식된 표적 서열에 근접하게 위치할 수 있다.
상기 표적 서열은 MYD88 유전자 및/또는 C3 유전자에 인위적인 변형이 일어나는 부위 또는 영역일 수 있다.
상기 표적 서열은 MYD88 유전자 및/또는 C3 유전자의 프로모터 영역에 위치한 연속하는 10bp 내지 25bp의 뉴클레오타이드 서열일 수 있다.
상기 표적 서열은 MYD88 유전자 및/또는 C3 유전자의 인트론 영역에 위치한 연속하는 10bp 내지 25bp의 뉴클레오타이드 서열일 수 있다.
상기 표적 서열은 MYD88 유전자 및/또는 C3 유전자의 엑손 영역에 위치한 연속하는 10bp 내지 25bp의 뉴클레오타이드 서열일 수 있다.
상기 표적 서열은 MYD88 유전자 및/또는 C3 유전자의 인핸서 영역에 위치한 연속하는 10bp 내지 25bp의 뉴클레오타이드 서열일 수 있다.
상기 표적 서열은 MYD88 유전자 및/또는 C3 유전자의 핵산서열 내의 PAM(proto-spacer-adjacent Motif) 서열의 5' 말단 및/또는 3' 말단에 인접한 연속하는 10bp 내지 25bp의 뉴클레오타이드 서열일 수 있다.
이때, 상기 PAM 서열은 예를 들어, 하기의 서열 중 1 이상일 수 있다(5'에서 3'방향으로 기재함).
NGG(N은 A, T, C 또는 G임);
NNNNRYAC(N은 각각 독립적으로 A, T, C 또는 G이고, R은 A또는 G이고, Y는 C또는 T임);
NNAGAAW(N은 각각 독립적으로 A, T, C 또는 G이고, W는 A 또는 T임);
NNNNGATT(N은 각각 독립적으로 A, T, C 또는 G임);
NNGRR(T)(N은 각각 독립적으로 A, T, C 또는 G이고, R은 A 또는 G임); 및
TTN(N은 A, T, C 또는 G임).
일구체예에서, 상기 표적 서열은 표 1, 표 2, 표 3 및 표 4에 기재된 뉴클레오타이드 서열 중 선택된 하나 이상의 뉴클레오타이드 서열일 수 있다.
상기 gRNA-CRISPR 효소 복합체는 gRNA와 CRISPR 효소로 구성될 수 있다.
상기 gRNA는 MYD88 유전자 및/또는 C3 유전자의 표적 서열 중 가이드핵산 결합 서열과 상보적 결합을 할 수 있는 가이드 도메인을 포함할 수 있다.
상기 가이드 도메인은 가이드핵산 결합 서열에 최소한 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상보성이거나 또는 완전하게 상보성일 수 있다.
상기 가이드 도메인은 MYD88 유전자의 표적 서열 중 가이드핵산 결합 서열에 상보적인 뉴클레오타이드 서열을 포함할 수 있다. 이때, 상기 상보적인 뉴클레오타이드 서열은 0 내지 5, 0 내지 4, 0 내지 3, 0 내지 2개의 미스매치(mismatching)를 포함할 수 있다.
상기 가이드 도메인은 C3 유전자의 표적 서열 중 가이드핵산 결합 서열에 상보적인 뉴클레오타이드 서열을 포함할 수 있다. 이때, 상기 상보적인 뉴클레오타이드 서열은 0 내지 5, 0 내지 4, 0 내지 3, 0 내지 2개의 미스매치(mismatching)를 포함할 수 있다.
상기 gRNA는 제 1 상보적 도메인, 연결 도메인, 제 2 상보적 도메인, 근위 도메인 및 꼬리 도메인으로 구성된 군에서 선택된 하나 이상의 도메인을 포함할 수 있다.
상기 CRISPR 효소는 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophilus) 유래의 Cas9 단백질, 스타필로코커스 아우레우스 (Staphylococcus aureus) 유래의 Cas9 단백질, 네이세리아 메닝기티디스 (Neisseria meningitidis)유래의 Cas9 단백질, 및 Cpf1 단백질로 이루어진 군에서 선택된 하나 이상일 수 있다. 일 예에서, 상기 에디터단백질은 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질 또는 스타필로코커스 아우레우스 (Staphylococcus aureus) 유래의 Cas9 단백질일 수 있다.
상기 gRNA-CRISPR 효소 복합체는 gRNA 및 CRISPR 효소의 종류에 따라 MYD88 유전자 및/또는 C3 유전자에 다양한 인위적인 조작 또는 변형을 가할 수 있다.
상기 인위적으로 조작 또는 변형된 MYD88 유전자 및/또는 C3 유전자는 표적 서열 내에 또는 표적 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp의 뉴클레오타이드 서열 부위에 다음 중 하나 이상의 변형을 포함할 수 있다:
i) 하나 이상의 뉴클레오타이드의 결실,
ii) 하나 이상의 뉴클레오타이드의 야생형 유전자와 상이한 뉴클레오타이드로의 치환,
iii) 하나 이상의 뉴클레오타이드의 삽입, 또는
iv) 상기 i) 내지 iii) 중에서 선택된 2 가지 이상의 조합.
예를 들어, 인위적으로 조작 또는 변형된 MYD88 유전자 및/또는 C3 유전자는 표적 서열 내에 또는 표적 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp의 뉴클레오타이드 서열 부위에 하나 이상의 뉴클레오타이드 결실을 포함할 수 있다. 일 예로, 결실되는 뉴클레오타이드는 연속되거나 연속되지 않는 1, 2, 3, 4 또는 5bp 일 수 있다. 다른 일 예로, 결실되는 뉴클레오타이드는 연속되는 2bp 이상의 뉴클레오타이드로 이루어진 뉴클레오타이드 조각일 수 있다. 이때, 뉴클레오타이드 조각은 2bp 내지 5bp, 6bp 내지 10bp, 11bp 내지 15bp, 16bp 내지 20bp, 21bp 내지 25bp, 26bp 내지 30bp, 31bp 내지 35bp, 36bp 내지 40bp, 41bp 내지 45bp 또는 46bp 내지 50bp일 수 있다. 또다른 일 예로, 결실되는 뉴클레오타이드는 2 이상의 뉴클레오타이드 조각일 수 있다. 이때, 2 이상의 뉴클레오타이드 조각은 뉴클레오타이드 서열이 연속되지 않는, 즉, 하나 이상의 뉴클레오타이드 서열 간격을 가지는 각각의 뉴클레오타이드 조각일 수 있으며, 결실된 2 이상의 뉴클레오타이드 조각에 의해 2 이상의 결실 부위가 발생할 수 있다.
또는, 예를 들어, 인위적으로 조작 또는 변형된 MYD88 유전자 및/또는 C3 유전자는 표적 서열 내에 또는 표적 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp의 뉴클레오타이드 서열 부위에 하나 이상의 뉴클레오타이드 삽입을 포함할 수 있다. 일 예로, 삽입되는 뉴클레오타이드는 연속된 1, 2, 3, 4 또는 5bp 일 수 있다. 다른 일 예로, 삽입되는 뉴클레오타이드는 연속되는 5bp 이상의 뉴클레오타이드로 이루어진 뉴클레오타이드 조각일 수 있다. 이때, 뉴클레오타이드 조각은 5bp 내지 10bp, 11bp 내지 50bp, 50bp 내지 100bp, 100bp 내지 200bp, 200bp 내지 300bp, 300bp 내지 400bp, 400bp 내지 500bp, 500bp 내지 750bp 또는 750bp 내지 1000bp일 수 있다. 또 다른 일 예로, 삽입되는 뉴클레오타이드는 특정 유전자의 일부 또는 전체 뉴클레오타이드 서열일 수 있다. 이때, 특정 유전자는 MYD88 유전자 및/또는 C3 유전자를 포함하는 대상체, 예를 들어, 인간세포가 포함하지 않는 외부에서 유입된 유전자일 수 있다. 또는 특정 유전자는 MYD88 유전자 및/또는 C3 유전자를 포함하는 대상체, 예를 들어, 인간세포가 포함하는 유전자, 예를 들어, 인간세포 게놈에 존재하는 유전자일 수 있다.
또는, 예를 들어, 인위적으로 조작 또는 변형된 MYD88 유전자 및/또는 C3 유전자는 표적 서열 내에 또는 표적 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp의 뉴클레오타이드 서열 부위에 하나 이상의 뉴클레오타이드 결실 및 삽입을 포함할 수 있다. 일 예로, 결실되는 뉴클레오타이드는 연속되거나 연속되지 않는 1, 2, 3, 4 또는 5bp 일 수 있다. 이때, 삽입되는 뉴클레오타이드는 1, 2, 3, 4 또는 5bp; 뉴클레오타이드 조각; 또는 특정 유전자의 일부 또는 전체 뉴클레오타이드 서열일 수 있으며, 상기 결실과 삽입은 순차적으로 일어나거나 동시에 발생할 수 있다. 이때, 삽입되는 뉴클레오타이드 조각은 5bp 내지 10bp, 11bp 내지 50bp, 50bp 내지 100bp, 100bp 내지 200bp, 200bp 내지 300bp, 300bp 내지 400bp, 400bp 내지 500bp, 500bp 내지 750bp 또는 750bp 내지 1000bp일 수 있다. 이때, 특정 유전자는 MYD88 유전자 및/또는 C3 유전자를 포함하는 대상체, 예를 들어, 인간세포가 포함하지 않는 외부에서 유입된 유전자일 수 있다. 또는 특정 유전자는 MYD88 유전자 및/또는 C3 유전자를 포함하는 대상체, 예를 들어, 인간세포가 포함하는 유전자, 예를 들어, 인간세포 게놈에 존재하는 유전자일 수 있다. 다른 일 예로, 결실되는 뉴클레오타이드는 2bp 이상의 뉴클레오타이드로 이루어진 뉴클레오타이드 조각일 수 있다. 이때, 결실되는 뉴클레오타이드 조각은 2bp 내지 5bp, 6bp 내지 10bp, 11bp 내지 15bp, 16bp 내지 20bp, 21bp 내지 25bp, 26bp 내지 30bp, 31bp 내지 35bp, 36bp 내지 40bp, 41bp 내지 45bp 또는 46bp 내지 50bp일 수 있다. 이때, 삽입되는 뉴클레오타이드는 1, 2, 3, 4 또는 5bp; 뉴클레오타이드 조각; 또는 특정 유전자의 일부 또는 전체 뉴클레오타이드 서열일 수 있으며, 상기 결실과 삽입은 순차적으로 일어나거나 동시에 발생할 수 있다. 또 다른 일 예로, 결실되는 뉴클레오타이드는 2 이상의 뉴클레오타이드 조각일 수 있다. 이때, 삽입되는 뉴클레오타이드는 1, 2, 3, 4 또는 5bp; 뉴클레오타이드 조각; 또는 특정 유전자의 일부 또는 전체 뉴클레오타이드 서열일 수 있으며, 상기 결실과 삽입은 순차적으로 일어나거나 동시에 발생할 수 있다. 또한, 상기 삽입은 결실된 2 이상의 부위에 일부 또는 전체 부위에서 발생할 수 있다.
상기 인위적으로 조작 또는 변형된 MYD88 유전자 및/또는 C3 유전자는 PAM 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp의 뉴클레오타이드 서열 부위에 다음 중 하나 이상의 변형을 포함할 수 있다:
i) 하나 이상의 뉴클레오타이드의 결실,
ii) 하나 이상의 뉴클레오타이드의 야생형 유전자와 상이한 뉴클레오타이드로의 치환,
iii) 하나 이상의 뉴클레오타이드의 삽입, 또는
iv) 상기 i) 내지 iii) 중에서 선택된 2 가지 이상의 조합.
일 예로, 상기 CRISPR 효소가 SpCas9 단백질인 경우, 상기 인위적인 조작 또는 변형된 MYD88 유전자 및/또는 C3 유전자는 5'-NGG-3' (N은 A, T, G, 또는 C임) PAM 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp, 1bp 내지 40bp, 1bp 내지 30bp, 또는 1bp 내지 25bp의 뉴클레오타이드 서열 부위 내에 다음 중 하나 이상의 변형을 포함할 수 있다:
i) 하나 이상의 뉴클레오타이드의 결실,
ii) 하나 이상의 뉴클레오타이드의 야생형 유전자와 상이한 뉴클레오타이드로의 치환,
iii) 하나 이상의 뉴클레오타이드의 삽입, 또는
iv) 상기 i) 내지 iii) 중에서 선택된 2 가지 이상의 조합.
다른 일 예로, 상기 CRISPR 효소가 CjCas9 단백질인 경우, 상기 인위적인 조작 또는 변형된 MYD88 유전자 및/또는 C3 유전자는 5'-NNNNRYAC-3'(N은 각각 독립적으로 A, T, C 또는 G이고, R은 A또는 G이고, Y는 C 또는 T임) PAM 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp, 1bp 내지 40bp, 1bp 내지 30bp, 또는 1bp 내지 25bp의 뉴클레오타이드 서열 부위 내에 다음 중 하나 이상의 변형을 포함할 수 있다:
i) 하나 이상의 뉴클레오타이드의 결실,
ii) 하나 이상의 뉴클레오타이드의 야생형 유전자와 상이한 뉴클레오타이드로의 치환,
iii) 하나 이상의 뉴클레오타이드의 삽입, 또는
iv) 상기 i) 내지 iii) 중에서 선택된 2 가지 이상의 조합.
또 다른 일 예로, 상기 CRISPR 효소가 StCas9 단백질인 경우, 상기 인위적인 조작 또는 변형된 MYD88 유전자 및/또는 C3 유전자는 5'-NNAGAAW-3'(N은 각각 독립적으로 A, T, C 또는 G이고, W는 A 또는 T임) PAM 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp, 1bp 내지 40bp, 1bp 내지 30bp, 또는 1bp 내지 25bp의 뉴클레오타이드 서열 부위 내에 다음 중 하나 이상의 변형을 포함할 수 있다:
i) 하나 이상의 뉴클레오타이드의 결실,
ii) 하나 이상의 뉴클레오타이드의 야생형 유전자와 상이한 뉴클레오타이드로의 치환,
iii) 하나 이상의 뉴클레오타이드의 삽입, 또는
iv) 상기 i) 내지 iii) 중에서 선택된 2 가지 이상의 조합.
일 예로, 상기 CRISPR 효소가 NmCas9 단백질인 경우, 상기 인위적인 조작 또는 변형된 MYD88 유전자 및/또는 C3 유전자는 5'-NNNNGATT-3'(N은 각각 독립적으로 A, T, C 또는 G임) PAM 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp, 1bp 내지 40bp, 1bp 내지 30bp, 또는 1bp 내지 25bp의 뉴클레오타이드 서열 부위 내에 다음 중 하나 이상의 변형을 포함할 수 있다:
i) 하나 이상의 뉴클레오타이드의 결실,
ii) 하나 이상의 뉴클레오타이드의 야생형 유전자와 상이한 뉴클레오타이드로의 치환,
iii) 하나 이상의 뉴클레오타이드의 삽입, 또는
iv) 상기 i) 내지 iii) 중에서 선택된 2 가지 이상의 조합.
다른 일 예로, 상기 CRISPR 효소가 SaCas9 단백질인 경우, 상기 인위적인 조작 또는 변형된 MYD88 유전자 및/또는 C3 유전자는 5'-NNGRR(T)-3'(N은 각각 독립적으로 A, T, C 또는 G이고, R은 A또는 G이고, (T)는 임의로 포함가능한 서열을 의미함) PAM 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp, 1bp 내지 40bp, 1bp 내지 30bp, 또는 1bp 내지 25bp의 뉴클레오타이드 서열 부위 내에 다음 중 하나 이상의 변형을 포함할 수 있다:
i) 하나 이상의 뉴클레오타이드의 결실,
ii) 하나 이상의 뉴클레오타이드의 야생형 유전자와 상이한 뉴클레오타이드로의 치환,
iii) 하나 이상의 뉴클레오타이드의 삽입, 또는
iv) 상기 i) 내지 iii) 중에서 선택된 2 가지 이상의 조합.
또 다른 일 예로, 상기 CRISPR 효소가 Cpf1 단백질인 경우, 상기 인위적인 조작 또는 변형된 MYD88 유전자 및/또는 C3 유전자는 5'-TTN-3'(N은 A, T, C 또는 G임) PAM 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp, 1bp 내지 40bp, 1bp 내지 30bp, 또는 1bp 내지 25bp의 뉴클레오타이드 서열 부위 내에 다음 중 하나 이상의 변형을 포함할 수 있다:
i) 하나 이상의 뉴클레오타이드의 결실,
ii) 하나 이상의 뉴클레오타이드의 야생형 유전자와 상이한 뉴클레오타이드로의 치환,
iii) 하나 이상의 뉴클레오타이드의 삽입, 또는
iv) 상기 i) 내지 iii) 중에서 선택된 2 가지 이상의 조합.
상기 gRNA-CRISPR 효소 복합체에 의한 MYD88 유전자 및/또는 C3 유전자의 인위적인 조작 효과는 넉아웃(knockout)일 수 있다.
상기 gRNA-CRISPR 효소 복합체에 의한 MYD88 유전자 및/또는 C3 유전자의 인위적인 조작 효과는 MYD88 유전자 및/또는 C3 유전자에 의해 각각 암호화되는 단백질의 발현이 억제될 수 있다.
상기 gRNA-CRISPR 효소 복합체에 의한 MYD88 유전자 및/또는 C3 유전자의 인위적인 조작 효과는 넉다운(knockdown)일 수 있다.
상기 gRNA-CRISPR 효소 복합체에 의한 MYD88 유전자 및/또는 C3 유전자의 인위적인 조작 효과는 MYD88 유전자 및/또는 C3 유전자에 의해 각각 암호화되는 단백질의 발현이 감소될 수 있다.
상기 gRNA-CRISPR 효소 복합체에 의한 MYD88 유전자 및/또는 C3 유전자의 인위적인 조작 효과는 넉인(knockin)일 수 있다.
이때, 상기 넉인 효과는 gRNA-CRISPR 효소 복합체 및 추가적으로 외부 유래 뉴클레오타이드 서열 또는 유전자를 포함하는 도너에 의해 유도된 것일 수 있다.
상기 gRNA-CRISPR 효소 복합체에 의한 MYD88 유전자 및/또는 C3 유전자의 인위적인 조작 효과는 외부 유래 뉴클레오타이드 서열 또는 유전자에 의해 암호화되는 펩타이드 또는 단백질이 발현될 수 있다.
본 명세서에 의해 개시되는 일 태양은 면역 기능이상 질환을 치료하기 위한 유전자 조작용 조성물을 이용한 면역 기능이상 질환 치료방법에 관한 것이다.
본 명세서에 의해 개시되는 일 구체예는 치료 대상에 면역 참여 인자를 인위적으로 조작하기 위한 유전자 조작용 조성물의 투여를 포함하는 방법을 이용하는 면역 기능이상 질환 치료 용도이다.
이때, 상기 치료 대상은 인간, 원숭이 등의 영장류, 마우스, 래트 등의 설치류 등을 포함하는 포유동물일 수 있다.
“면역 기능이상”은 면역 반응 과정 중 특정 또는 전체적 과정의 일시적 또는 영구적인 장애, 과정 불활성화, 활성 저해, 과활성 등의 전체적인 면역 반응의 기능 저하 또는 과활성으로 인한 정상적인 기능 또는 역할을 하지 못 하는 모든 형태, 과정 및/또는 이로 인한 결과물 또는 면역 반응에 참여하는 물질, 예를 들면, 면역 참여 인자 등의 이상을 통해 발생되는 비정상적인 모든 상태 및/또는 이로 인한 결과물 등을 포함하는 모든 상태를 의미한다. 따라서, “면역 기능이상 질환”은 상기와 같은 상태로 인해 발생하는 질병을 모두 포함하는 모든 상태를 의미한다.
이때, 면역 기능이상 질환은 면역 기능장애 질환 및 면역 참여 인자 유발 질환을 모두 포함한다.
상기 “면역 참여 인자 유발 질환”은 면역 참여 인자의 비정상적인 형태, 예를 들면, 돌연변이 등 또는 비정상적인 발현으로 인해 발생하는 질병을 모두 포함하는 모든 상태를 의미한다.
면역 기능이상 질환은 안구에서 발생하는 비정상적인 면역 질환으로, 감염성 질환, 비감염성 질환 또는 자가면역 질환일 수 있으며, 또한 그로 인해 발생하는 안구 합병증인 백내장, 녹내장, 망막변성, 망막박리, 시신경위축 등도 포함할 수 있다.
일 실시예에서, 면역 기능이상 질환은 안구 내 자가면역질환, 포도막염, 베체트병, 쇼그렌 증후군 또는 보그트-고야나기-하라다 병일 수 있다.
자가면역질환(autoimmune disease)은 자가면역에 의해 나타나는 질병으로, 정상적인 화학 물질과 신체의 일부 세포들에 대해 면역계가 잘못된 반응을 일으키는 것으로 비정상적인 면역 반응에 의해 건강한 세포를 공격하여 발생하는 질환이다. 자가면역질환은 다양한 림프구 중에 체내 자기자신의 분자와 반응하는 수용체를 가지는 림프구에 의해 나타나기도 한다. 이러한 자기반응성 림프구들이 제거되거나 불활성되지 않으면 면역계는 결국 자신의 세포 또는 조직을 공격하게 된다. 하지만 정상의 경우 림프구들이 골수에서 성숙되는 동안 자기반응성이 점검되며 이러한 과정 동안 자기 분자에 특이적인 수용체를 가진 림프구들은 세포자상(apoptosis)에 의해 죽거나 무반응세포로 변하게 된다. 결과적으로 비자기분자와 반응하는 림프구만 남게 되고 이러한 과정을 자기관용기작(self-tolerance)이라고 한다. 만약 자기관용기작이 정상적이지 못할 경우에는 류마티스 관절염과 같은 자가면역질환을 유발하게 된다. 자가면역질환에는 류마티스 관절염뿐만 아니라 1형 당뇨병(인슐린 의존성), 전신성 루푸스, 크론병, 건선 등이 있고, 안구에 발생하는 자가면역질환으로는 포도막염, 베체트병, 쇼그렌 증후군, 보고트-고야나기-하라다 병 등이 있다.
포도막염은 안구의 중간층을 형성하는 홍채, 모양체 및 맥락막으로 이루어진 포도막에 염증이 생기는 것으로, 포도막은 혈관이 풍부하고 결합조직이 많아 염증이 생기기 쉽고, 홍채, 모양체, 맥락막에 각각 따로 염증이 발생하기도 하지만, 홍채모양체염과 같이 동시에 발생하기도 한다.
포도막염의 원인은 크게 감염성과 비감염성으로 나뉘고, 비감염성에는 자가면역과 종양에 의한 경우가 있다. 감염성 포도막염은 외상에 의하여 다친 경우가 아니라면 면역력이 정상인 일반 사람들에게서는 흔히 볼 수 없는데, 원인으로는 세균, 진균 그리고 바이러스가 있다.
자가면역이란 내 몸의 세포를 적으로 간주하고 공격하는 염증반응이 생기는 것으로 과로, 스트레스, 유전적 요인 등이 영향을 주기도 한다. 자가면역에 의한 포도막염은 특별히 다치거나 감염 질환을 앓은 적이 없으면서 안구 내 염증이 발생하는 것으로, 눈에만 염증이 있는 경우도 있지만, 관절염, 혈관염 등의 몸 속 다른 염증질환과 동반하여 나타나는 경우도 있다. 종양에 의한 포도막염은 다른 원인의 포도막염과 증상이 비슷하기 때문에 진단이 쉽지 않아 종양 치료를 위해서 반드시 정확한 감별진단이 필요하다.
포도막염(Uveitis)은 다른 안구 질환과 달리 초기에 원인을 찾아내기 어려운 경우가 많다. 이는 한가지 원인이 다양한 염증형태로 나타낼 수 있고, 질환의 초기에는 진단에 필요한 전형적인 증상들 중에서 일부만이 나타나기도 하며, 또한 대부분의 포도막염이 자가면역반응에 의하여 발생하는데 이런 경우 감염성 질환처럼 한두 가지 검사로 원인 균을 바로 확인할 수 있는 것이 아니기 때문이다. 따라서, 포도막염의 최종진단은 수개월 이상이 걸리는 경우도 흔하고, 다른 어떤 안구 질환보다도 많은 노력이 필요한 경우가 많다.
포도막염은 염증이 안구 속에 주로 어느 부위에 발생하였는지에 따라 크게 전포도막염, 중간포도막염, 후포도막염, 그리고 전체포도막염으로 분류된다.
전체포도막염이란 위치가 어느 한 부위에 국한되지 않고 눈 전체에 염증이 발생한 경우를 말한다. 전포도막염, 중간포도막염, 후포도막염, 전체포도막염 각각은 다시 염증의 형태 또는 원인에 따라 분류된다. 예를 들어, 안구에서 사진기의 조리개 역할을 하는 홍채에 염증이 발생한 경우에는 홍채염이라고 말하는데, 홍채는 안구의 앞부분에 위치하기 때문에 전포도막염의 한 종류이다.
홍채염은 일으키는 원인은 매우 다양한데, 자가면역반응에 의하여 발생하는 경우가 가장 많지만, 세균, 진균, 바이러스 감염에 의하여 발생하는 경우도 있고, 종양이나 다른 안구 질환에서도 발생할 수 있다. 예를 들어, 헤르페스 바이러스(herpes virus)에 의한 각막염에 의하여 이차적으로 홍채염이 발생할 수 있으며, 이런 경우 헤르페스 바이러스에 의한 각막 포도막염(각막 홍채염)이 된다.
중간포도막염은 염증이 주로 유리체 및 주변 망막에 발생한 경우를 말하며, 후포도막염은 망막, 맥락막 및 시신경에 염증이 있을 경우를 말한다.
포도막염은 다양한 원인과 염증 정도에 따라 증상도 다양하게 나타나지만, 대표적인 증상으로 시력저하, 날파리증, 통증, 충혈, 눌물흘림, 눈부심 등이 있다. 안구의 앞쪽 포도막에 생기는 염증인 전포도막염은 시력장애보다는 충혈과 눈부심, 통증이 심하고, 안구의 뒤쪽에 포도막에 생기는 염증인 후포도막염은 시력저하와 날파리증이 주 증상으로 눈부심, 변시증(사물이 찌그러져 보이는 현상)이 생길 수 있다.
심하지 않은 포도막염의 경우 치료로 낫게 되지만, 원인을 알 수 없고 치료가 잘 되지 않는 경우는 염증이 진행되면서 황반부종, 삼출망막박리, 맥락망막위축 등으로 인해 시력감소가 심해지며, 이런 경우 적극적인 치료로도 시력회복이 어려울 수 있다.
최근에는 AIDS에 따른 기회성감염증으로서 세포거대바이러스 망막염이 급증하고 있다. 포도막염은 반복, 혹은 지연화하는 경우가 많아, 여러 가지 눈합병증(백내장, 녹내장, 망막변성, 망막박리, 시신경위축 등)이 생겨 실명의 원인이 되기도 한다.
베체트병(Behcet's disease)은 구강궤양이나 음부궤양 등의 증상을 나타내는 자가면역질환으로 만성 염증성 질환이다. 베체트병이 발생하는 원인은 정확히 밝혀지지 않았지만 오래 전부터 유전적인 소인이 있는 환자에게서 환경적인 요인이 더해지면서 면역반응이 활성화되고 그 결과 여러가지 증상이 나타난다고 여겨지고 있다. 특히 HLA-B51이라는 유전자 베체트병에 가장 중요한 유전인자로 알려져 있고 지역에 따른 차이가 큰 것으로 알려져 있다. 또한 일부 바이러스와 세균에 대한 면역반응이 베체트병의 염증방응과 관련이 있을 가능성이 있다고 알려져 있다.
이러한 베체트병과 안구 질환의 연관성은 우리나라의 베체트병 환자가 외국에 비해 안구에 침범되는 빈도가 적긴 하지만 20 ~ 30%에서 안구 증상이 나타난다. 병적인 증상은 포도막과 망막에 발생하며 적극적인 치료를 하지 않을 경우 시력에 장애를 주는 합병증이 생기거나 심할 경우 실명할 수 있다.
쇼그렌 증후군(Sjogren's syndrome)은 타액선, 눈물샘 등에 림프구가 침입해 만성 염증이 생겨 분비 장애를 일으켜 입이 마르고 눈이 건조해지는 증상을 보이는 자가면역성 전신 질환이다. 원인은 잘 알려져 있지 않지만, 유전적인 원인이나, 바이러스 감염, 호르몬 이상 등이 관여되어 나타나는 자가면역질환으로 생각되고 있다. 체내의 방어기전이 눈물, 침 등을 분비하는 분비샘을 파괴하여 병을 일으키게 된다.
보그트-고야나기-하라다(Vogt-Kayanagi-Harada disease, VKH) 병은 삼출 망막 박리와 육아종 범포도막염과 함께 신경계와 피부 증상을 나타내는 다발적 전신 질환이다. VKH 병은 주로 아시아, 중동, 스페인계와 아메리칸 인디언에게서 잘 발생한다. 일본에서는 VKH병이 Behcet's 병 다음으로 흔한 포도막염의 원인질환이다. 자가면역계의 이상 및 유전적 영향에 기인한다고 알려져 있으며, HLA-DR4, HLA-DR53, 그리고 HLA-DQ4와 관련되어 있는 것으로 알려졌다. Vogt, Koyanagi 와 Harada 가 각각 20년 동안 양측 포도막염, 삼출 망막박리, 신경이상과 외피질환을 가진 환자들을 보고하였다.
병의 발현양상이 다양하고, 전형적인 증상을 나타내지 않는 경우도 있다. 따라서 증상유무에 따라 완전 VKH, 불완전 VKH, 가능한 VKH로 나누어 진단하며 다음 3가지 조건을 다 충족한 경우 진단할 수 있다. (1) 이전에 눈의 외상력이나 수술력이 없는 경우 (2) 임상적이나 검사 결과에 따라 다른 눈의 질환을 가진 증거가 없는 경우 (3) 양측 눈에서 모두 증상이 나타난 경우.
완전 VKH 병은 초기에는 삼출 망막 박리나 국소 망막하액을 가지는 광범위한 맥락막염을 보인다. 이러한 증상이 없는 환자는 혈관 조영술 상에서 지연된 맥락막 관류, 다발성의 극소 유출, 판모양비닐 과다형광부위, 망막하액의 저류와 시신경 염색 등의 형광물질에 의한 이상 소견이 관찰되며, 초음파상 광범위하게 맥락막의 비후가 관찰된다. 후기에는 눈의 탈색소, 동전형 맥락망막흉터, 망막색소상피(RPE) 응괴와 이동, 또는 전방 포도막염이 관찰된다. 또한 뇌막자극 증상, 뇌척수액 세포증가증 등의 신경증상과 귀울림 등의 청력이상 및 탈모, 백모증, 백반증 등의 외피증상이 동반된다.
불완전 VKH 병은 완전 VKH 병과 비슷하나 신경계와 청력 증상이나 외피증상 두 가지가 모두 보이지 않고 이중 한가지만 나타난다. 가능한 VKH 병은 눈의 증상만 가지고 있는 경우이다.
정확한 원인은 아직 모른지만, 자가면역계의 이상과 연관이 있다고 생각되고 있으며 유전적인 영향이 있다는 사실은 인종과 민족에 따라 특이적으로 HLA형 결정을 가지고 있는 것으로 확인할 수 있다. 일본 환자들에서는 HLA-DR4, HLA-DR53과 HLA-DQ4가 관련되어 있으며 중국 환자들은 HLA-DR4, HLA-DR53과 HLA-DQ7 이 관련되어 있다. 미국에서는 HLA-DR4와 HLA-DR53과 연관이 있으며 남부캘리포니아에 살고 있는 스페인계통의 사람에서는 HLA-DR1과 HLA-DR4와 연관이 있다고 보고되고 있다.
leptin이라는 지방세포에서 유래된 면역기전에 관여하는 물질이 면역반응을 촉진시킴으로써 VKH의 발병에 관여한다고 보고 된 바 있고, 또한 최근의 연구에서는 T-도움 세포가 멜라닌세포를 공격해서 발생한다는 설명도 있다.
본 명세서에 의해 개시되는 내용의 일 구체예는 면역 참여 인자를 인위적으로 조작할 수 있는 유전자 조작용 조성물을 포함하는 약학적 조성물이다.
상기 유전자 조작용 조성물 관련 설명은 상기 기술한 바와 같다.
일 구현예로, 상기 유전자 조작용 조성물은 다음을 포함할 수 있다.
(a) 면역 참여 유전자의 표적 서열에 상보적인 결합을 형성할 수 있는 가이드핵산 또는 이를 암호화하는 핵산서열; 및
(b) 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophilus) 유래의 Cas9 단백질, 스타필로코커스 아우레우스 (Staphylococcus aureus) 유래의 Cas9 단백질, 네이세리아 메닝기티디스 (Neisseria meningitidis)유래의 Cas9 단백질, 및 Cpf1 단백질로 이루어진 군에서 선택된 하나 이상의 단백질을 포함하는 에디터단백질 또는 이를 암호화하는 핵산서열.
이때, 상기 면역 참여 유전자는 MYD88 유전자 및/또는 C3 유전자일 수 있다.
이때, 상기 유전자 조작용 조성물은 가이드핵산 및/또는 에디터단백질은 각각을 암호화하는 핵산서열을 포함하는 벡터를 포함할 수 있다.
이때, 가이드핵산 또는 이를 암호화하는 핵산서열; 및 에디터단백질을 암호화하는 핵산서열은 1 이상의 벡터의 형태로 존재할 수 있다. 동종 또는 이종의 벡터의 형태로 존재할 수 있다.
다른 일 구현예로, 상기 유전자 조작용 조성물은 다음을 포함할 수 있다.
(a) 면역 참여 유전자의 표적 서열에 상보적인 결합을 형성할 수 있는 가이드핵산 또는 이를 암호화하는 핵산서열;
(b) 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophilus) 유래의 Cas9 단백질, 스타필로코커스 아우레우스 (Staphylococcus aureus) 유래의 Cas9 단백질, 네이세리아 메닝기티디스 (Neisseria meningitidis)유래의 Cas9 단백질, 및 Cpf1 단백질로 이루어진 군에서 선택된 하나 이상의 단백질을 포함하는 에디터단백질 또는 이를 암호화하는 핵산서열; 및
(c) 삽입을 원하는 핵산서열을 포함하는 도너 또는 이를 암호화하는 핵산서열.
이때, 삽입을 원하는 핵산서열은 면역 참여 인자의 일부 서열일 수 있다.
또는 삽입을 원하는 핵산서열은 조작하고자 하는 면역 참여 인자의 돌연변이를 교정하기 위한 핵산서열일 수 있다.
이때, 가이드핵산 또는 이를 암호화하는 핵산서열; 에디터단백질을 암호화하는 핵산서열; 및 삽입을 원하는 핵산서열을 포함하는 도너 또는 이를 암호화하는 핵산서열은 1 이상의 벡터의 형태로 존재할 수 있다. 동종 또는 이종의 벡터의 형태로 존재할 수 있다.
상기 약학적 조성물은 부가적 요소를 추가로 더 포함할 수 있다.
상기 부가적 요소는 대상의 체내에 전달하기 위한 적절한 담체를 포함할 수 있다.
또 다른 일 구현예로, 상기 유전자 조작용 조성물은 다음을 포함할 수 있다.
(a) 면역 참여 유전자의 표적 서열과 상보적인 결합을 형성할 수 있는 가이드 서열을 포함하는 가이드핵산 또는 이를 암호화하는 핵산서열; 및
(b) 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophilus) 유래의 Cas9 단백질, 스타필로코커스 아우레우스 (Staphylococcus aureus) 유래의 Cas9 단백질, 네이세리아 메닝기티디스 (Neisseria meningitidis)유래의 Cas9 단백질, 및 Cpf1 단백질로 이루어진 군에서 선택된 하나 이상의 단백질을 포함하는 에디터단백질 또는 이를 암호화하는 핵산서열.
이때, 상기 면역 참여 유전자는 MYD88 유전자 및/또는 C3 유전자일 수 있다.
이때, 상기 유전자 조작용 조성물은 가이드핵산 및/또는 에디터단백질은 각각을 암호화하는 핵산서열을 포함하는 벡터를 포함할 수 있다.
이때, 가이드핵산 또는 이를 암호화하는 핵산서열; 및 에디터단백질을 암호화하는 핵산서열은 1 이상의 벡터의 형태로 존재할 수 있다. 동종 또는 이종의 벡터의 형태로 존재할 수 있다.
다른 일 구현예로, 상기 유전자 조작용 조성물은 다음을 포함할 수 있다.
(a) 면역 참여 유전자의 표적 서열과 상보적인 결합을 형성할 수 있는 가이드 서열을 포함하는 가이드핵산 또는 이를 암호화하는 핵산서열;
(b) 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophilus) 유래의 Cas9 단백질, 스타필로코커스 아우레우스 (Staphylococcus aureus) 유래의 Cas9 단백질, 네이세리아 메닝기티디스 (Neisseria meningitidis)유래의 Cas9 단백질, 및 Cpf1 단백질로 이루어진 군에서 선택된 하나 이상의 단백질을 포함하는 에디터단백질 또는 이를 암호화하는 핵산서열; 및
(c) 삽입을 원하는 핵산서열을 포함하는 도너 또는 이를 암호화하는 핵산서열.
이때, 삽입을 원하는 핵산서열은 면역 참여 인자의 일부 서열일 수 있다.
또는 삽입을 원하는 핵산서열은 조작하고자 하는 면역 참여 인자의 돌연변이를 교정하기 위한 핵산서열일 수 있다.
이때, 가이드핵산 또는 이를 암호화하는 핵산서열; 에디터단백질을 암호화하는 핵산서열; 및 삽입을 원하는 핵산서열을 포함하는 도너 또는 이를 암호화하는 핵산서열은 1 이상의 벡터의 형태로 존재할 수 있다. 동종 또는 이종의 벡터의 형태로 존재할 수 있다.
상기 약학적 조성물은 부가적 요소를 추가로 더 포함할 수 있다.
상기 부가적 요소는 대상의 체내에 전달하기 위한 적절한 담체를 포함할 수 있다.
본 명세서에 의해 개시되는 내용의 일 구체예는 면역 기능이상 질환을 치료하기 위해 면역 기능이상 유기체에 유전자 조작용 조성물을 투여하는 단계를 포함하는, 면역 이상 질환의 치료방법이다.
상기 치료방법은 생체의 유전자를 조작하여 면역 기능을 조절하는 치료방법일 수 있다. 이러한 치료방법은 생체의 유전자를 조작하기 위한 유전자 조작용 조성물을 체내에 직접 주입하여 이루어질 수 있다.
상기 유전자 조작용 조성물 관련 설명은 상기 기술한 바와 같다.
일 구현예로, 상기 유전자 조작용 조성물은 다음을 포함할 수 있다:
(a) 면역 참여 유전자의 표적 서열에 상보적인 결합을 형성할 수 있는 가이드핵산 또는 이를 암호화하는 핵산서열; 및
(b) 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophilus) 유래의 Cas9 단백질, 스타필로코커스 아우레우스 (Staphylococcus aureus) 유래의 Cas9 단백질, 네이세리아 메닝기티디스 (Neisseria meningitidis)유래의 Cas9 단백질, 및 Cpf1 단백질로 이루어진 군에서 선택된 하나 이상의 단백질을 포함하는 에디터단백질 또는 이를 암호화하는 핵산서열.
다른 일 구현예로, 상기 유전자 조작용 조성물은 다음을 포함할 수 있다:
(a) 면역 참여 유전자의 표적 서열과 상보적인 결합을 형성할 수 있는 가이드 서열을 포함하는 가이드핵산 또는 이를 암호화하는 핵산서열; 및
(b) 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophilus) 유래의 Cas9 단백질, 스타필로코커스 아우레우스 (Staphylococcus aureus) 유래의 Cas9 단백질, 네이세리아 메닝기티디스 (Neisseria meningitidis)유래의 Cas9 단백질, 및 Cpf1 단백질로 이루어진 군에서 선택된 하나 이상의 단백질을 포함하는 에디터단백질 또는 이를 암호화하는 핵산서열.
이때, 상기 면역 참여 유전자는 MYD88 유전자 및/또는 C3 유전자일 수 있다.
상기 가이드 핵산 및 에디터 단백질은, 각각 핵산 서열의 형태로 1 이상의 벡터에 존재하거나, 또는 가이드 핵산과 에디터 단백질의 결합으로 복합체를 형성하여 존재할 수 있다.
상기 유전자 조작용 조성물은 삽입을 원하는 핵산서열을 포함하는 도너 또는 이를 암호화하는 핵산서열을 선택적으로 더 포함할 수 있다.
상기 가이드 핵산 및 에디터 단백질, 및/또는 도너는, 각각 핵산 서열의 형태로 1 이상의 벡터에 존재할 수 있다.
이때, 상기 벡터는 플라스미드 또는 바이러스벡터일 수 잇다.
이때, 상기 상기 바이러스 벡터는 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스(AAV), 백시니아바이러스, 폭스바이러스 및 단순포진 바이러스로 구성된 군에서 선택되는 1이상일 수 있다.
상기 면역 기능이상 질환 관련 설명은 상기 기술한 바와 같다.
상기 면역 기능이상 질환은 안구 내 자가면역질환, 포도막염, 베체트병, 쇼그렌 증후군 또는 보그트-고야나기-하라다 병일 수 있다.
상기 유전자 조작용 조성물은 면역 기능이상을 보이는 치료 대상에 투여될 수 있다.
상기 치료 대상은 인간, 원숭이 등의 영장류, 마우스, 래트 등의 설치류 등을 포함하는 포유동물일 수 있다.
상기 유전자 조작용 조성물은 치료 대상의 특정 신체 위치에 투여될 수 있다.
상기 특정 신체 위치는 기능이 비정상적인 홍채, 모양체, 맥락막, 망막 또는 이와 상호작용할 수 있는 및/또는 근접한 조직(위치)일 수 있다. 예를 들어, 홍채, 모양체, 맥락막 및/또는 안구일 수 있다.
상기 투여는 주사(injection), 수혈(transfusion), 삽입(implantation) 또는 이식(transplantation)으로 수행될 수 있다.
상기 투여는 망막하(subretinal), 피하(subcutaneously), 피내(intradermaliy), 안구내(intraocularly), 유리체내(intravitreally) 종양내(intratumorally), 절내(intranodally), 골수내(intramedullary), 근육내(intramuscularly), 정맥내(intravenous), 림프액내(intralymphatic) 또는 복막내(intraperitoneally)에서 선택된 투여 경로로 수행될 수 있다.
유전자 조작용 조성물의 1회 투여량(소정의 소망하는 효과를 얻기 위한 약학적 유효량)은 투여 대상의 체중 kg 당 104-109 세포, 예컨대, 105 내지 106 세포/kg(체중) 정도로 상기 수치 범위들 내의 모든 정수값들 중에서 선택될 수 있으나, 이에 제한되는 것은 아니고, 투여 대상의 연령, 건강 및 체중, 동시에 받는 치료의 종류, 만약 있다면 치료의 빈도, 원하는 효과의 특성 등을 고려하여 적절히 처방될 수 있다.
본 명세서에 의해 개시되는 몇몇 구현예들의 방법, 조성물에 의해 면역 참여 인자를 인위적으로 조작할 경우, 면역 기능의 정상화가 가능하게 되고, 이를 통해 비정상적인 또는 질병을 유발하는 면역 기능이상을 억제시키거나 개선시키는 등의 효과를 얻을 수 있다.
본 명세서에 의해 개시되는 내용의 일 구체예는 진핵 세포에서 면역 참여 유전자를 변형하는 방법에 관한 것으로, 이것은 생체 내, 생체 외 또는 시험관내에서 이루어질 수 있다.
일부 실시형태에서, 방법은 인간 또는 비인간 동물로부터 세포 또는 세포 집단을 시료추출하는 단계, 및 세포 또는 세포들을 변형하는 단계를 포함한다. 배양은 생체외에서 임의의 단계에서 일어날 수 있다. 세포 또는 세포들은 심지어 비인간 동물 또는 식물에 재도입될 수 있다.
상기 방법은 진핵세포에 유전자 조작용 조성물을 도입시키는 단계를 포함하는, 진핵세포를 인위적으로 조작하는 방법일 수 있다.
상기 유전자 조작용 조성물 관련 설명은 상기 기술한 바와 같다.
일 구현예로, 상기 유전자 조작용 조성물은 다음을 포함할 수 있다:
(a) 면역 참여 유전자의 표적 서열에 상보적인 결합을 형성할 수 있는 가이드핵산 또는 이를 암호화하는 핵산서열; 및
(b) 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophilus) 유래의 Cas9 단백질, 스타필로코커스 아우레우스 (Staphylococcus aureus) 유래의 Cas9 단백질, 네이세리아 메닝기티디스 (Neisseria meningitidis)유래의 Cas9 단백질, 및 Cpf1 단백질로 이루어진 군에서 선택된 하나 이상의 단백질을 포함하는 에디터단백질 또는 이를 암호화하는 핵산서열.
다른 일 구현예로, 상기 유전자 조작용 조성물은 다음을 포함할 수 있다:
(a) 면역 참여 유전자의 표적 서열과 상보적인 결합을 형성할 수 있는 가이드 서열을 포함하는 가이드핵산 또는 이를 암호화하는 핵산서열; 및
(b) 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophilus) 유래의 Cas9 단백질, 스타필로코커스 아우레우스 (Staphylococcus aureus) 유래의 Cas9 단백질, 네이세리아 메닝기티디스 (Neisseria meningitidis)유래의 Cas9 단백질, 및 Cpf1 단백질로 이루어진 군에서 선택된 하나 이상의 단백질을 포함하는 에디터단백질 또는 이를 암호화하는 핵산서열.
이때, 상기 면역 참여 유전자는 MYD88 유전자 및/또는 C3 유전자일 수 있다.
상기 가이드 핵산 및 에디터 단백질은, 각각 핵산 서열의 형태로 1 이상의 벡터에 존재하거나, 또는 가이드 핵산과 에디터 단백질의 결합으로 복합체를 형성하여 존재할 수 있다.
상기 도입 단계는 생체 내 또는 생체 외에서 수행될 수 있다.
예를 들어, 도입 단계는 전기천공법 (electroporation), 리포좀, 플라스미드, 바이러스벡터, 나노파티클(nanoparticles) 및 PTD (Protein translocation domain) 융합 단백질 방법 중 선택되는 1이상의 방법으로 수행될 수 있다.
예를 들어, 바이러스 벡터는 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스(AAV), 백시니아바이러스, 폭스바이러스 및 단순포진 바이러스로 구성된 군에서 선택되는 1이상일 수 있다.
이하, 실시예를 통하여 본 발명을 더욱 상세히 설명하고자 한다.
이들 실시예는 오로지 본 발명을 보다 구체적으로 설명하기 위한 것으로서, 본 발명의 범위가 이들 실시예에 의해 제한되지 않는다는 것은 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 있어 자명할 것이다.
실험방법
1. sgRNA 설계
CRISPR RGEN Tools (Institute for Basic Science, Korea)을 사용하여 인간의 C3 및 Myd88 유전자에 대한 CRISPR/SpCas9 또는 CRISPR/CjCas9 표적 부위들 중에서 2-base-mismatch까지의 off-target이 예측되지 않는 것들을 선별하였다. 실험에 이용된 sgRNA는 표 5 내지 표 8에 기재된 가이드 서열들 중 적어도 하나 이상을 포함하도록 설계하였다.
2. Guide RNA의 활성 검증 및 off-target 분석
HEK293 세포주에 각각의 guide RNA 서열이 cloning된 sgRNA발현용 벡터를 Cas9 발현용 벡터와 함께 Lipofectamine 2000 또는 Electroporation을 통해 transfection 하였다. 약 2 ~ 3일 후 genomic DNA를 추출하고 PCR로 on-target위치를 증폭시킨 후, Next-Generation Sequencing을 위한 sequencing primer에 특이적인 adaptor 및 TruSeq HT 이중 지표 프라이머(TruSeq HT Dual Index primers)를 붙이는 추가적인 PCR을 진행하였다. 이후 paired sequencing을 통하여 나온 read들을 분석하여 on-target 유전체 위치에서의 insertion 또는 deletion (Indels) 확인을 통해 guide RNA들의 활성을 평가하였다.
선별된 guide RNA의 off-target 분석을 위해서는 첫 번째, CRISPR RGEN Tools의 Cas-Offinder를 사용한 in-silico 방법으로 3-base mismatch가 있는 off-target list들을 선별하고, 각각의 off-target에 해당하는 유전체상의 특정 부분에 대한 targeted-deep sequencing을 통한 방법으로 검증하였다. 두 번째 방법으로는, guide RNA와 Cas9 단백질을 37℃에서 overnight로 처리한 인간의 전체 genomic DNA를 Whole Genome Sequencing을 하고, 이후 Digenome-seq 분석을 통해서 잠재적인 list들을 확보하였다. 이후 off-target 후보들 각각의 유전체상의 특정 부분에 대한 targeted-deep sequencing을 통한 방법으로 off-target 위치에서의 indel 도입 여부를 검증하였다.
3. AAV 제작
SpCas9의 유전자교정 도구 전달은 dual AAV system을 사용하였다. 즉, AAV2의 역위 말단 반복(Inverted Tandem Repeat, ITR)사이에 Mammalian 발현용 promoter인 EFS, C- 또는 N-말단에 NLS와 HA태그를 가지는 human codon 최적화된 Cas9, BGHA를 포함하는 벡터 (pAAV-EFS-SpCas9) 및 U6 promoter sgRNA서열을 포함하는 벡터 (pAAV-U6-sgRNA)를 각각 합성하여 제작하였다. CjCas9의 유전자교정 도구 전달은 single AAV system을 사용하였다. 즉, AAV2 ITR사이에 EFS promoter C- 또는 N-말단에 NLS와 HA태그를 가지는 human codon 최적화된 Cas9, BGHA, U6 promoter와 sgRNA 서열을 포함하는 벡터(pAAV-EFS-CjCas9-U6-sgRNA)를 합성하여 제작하였다. AAV 생산은, AAV capsid의 위형(pseudotype)에 대한 벡터, 제작된 pAAV 벡터(pAAV-EFS-SpCas9 또는 pAAV-U6-sgRNA 또는 pAAV-EFS-CjCas9-U6-sgRNA), pHelper vector를 1:1:1의 몰농도로 HEK293세포에 동시에 transfection하였다. 72시간 후, 세포를 융해한 후 얻은 virus particle을 iodixanol(Sigma-aldrich)을 이용해 step-gradient 초원심분리기로 분리정제하고, AAV의 정량적인 확인은 qPCR을 이용한 titration 방법으로 측정하였다.
4. 망막하 주사
2~3주령의 생쥐의 복강에 2.25 mg/kg의 틸레타민(tiletamine)/졸라제팜(zolazepam) 및 0.7 mg/kg의 자일라진 하이드로클로라이드(xylazine hydrochloride) 혼합물을 주사하여 마취시켰다. 수술용 현미경(Leica Microsystems Ltd.) 하에서 33 gauge 블런트 니들이 있는 Nanofil 주사기(World Precision Instruments Inc.)를 사용하여 2 ㎕의 AAV(2 × 1010 ~ 2 × 1011 바이러스 게놈)를 망막하로 주사하였다(subretinal injection).
5. In vivo indel 분석
망막색소상피-맥락막-공막 조직 및 망막 조직을 PBS로 세척하고, 망막색소상피는 용해 버퍼(NucleoSpin Tissue, Macherey-Nagel)에 담은 후 30초 간 볼텍싱(vortexing)하여 맥락막 및 공막으로부터 분리하였다. 게놈 DNA는 PCR 및 Next-Generation-Sequencing을 통해 on-target 및 off-target에 대한 indel 분석에 사용되었다.
6. 내독소 유발 포도막염 모델 평가
내독소 유발 포도막염(Endotoxin-induced uveitis) 모델은, 마우스의 유리체내로 250ng의 E.coli 055:B5 유래 lipopolysaccharide를 주사하여 유발하였고, 48시간 후에 iris hyperemia, pupil, exudate in anterior chamber, hypopyon 항목 등의 반응평가를 실시하였다.
7. 자가면역 포도막염 모델 평가
자가면역 포도막염(experimental autoimmune uveitis) 모델은 마우스의 피부하로 300㎍ IRBP1-20을 complete Freund’s adjuvant 200㎕에 녹여 주사하고, 200ng의 pertussis toxin을 복강내 주사하여 유발하고 이틀 간격으로 안저검사를 통해 반응 평가를 실시하였다. 또한 IRBP1-20 및 pertussis 주사 4주 후 마우스를 sacrifice하여 안구를 적출하고, papaffin block제작/section을 통해 hematoxylin and eosin 염색 후 조직학적 평가를 시행하였다.
실험결과
1. gRNA 선별을 위한 indel 확인
각 gRNA 별 indel(%)는 activity(Indel induction level)로 기재하였고, 이때, indel이 10% 미만은 activity ++; 20% 미만은 activity +++; 30% 미만은 activity ++++; 30% 이상은 activity +++++; 및 50% 이상은 activity ++++++로 나타냈다.
① MYD88 유전자를 위한 gRNA 선별
CjCas9을 위한 MYD88 유전자를 표적하는 gRNA 선별(gRNA selection to target MYD88 gene for CjCas9)
Name Target(w/o PAM)(SEQ ID NO) Mismatch(0b, 1b, 2b) GC content (%) Activity (Indel induction level)
Cj22-hMyd88-E01-#03 GGTCCAGTCGGCCGCCACCTGT(SEQ ID NO: 21) 1, 0, 0 72.7 ++
Cj22-hMyd88-E01-#04 GCGCTGGCGGAGGAGATGGACT(SEQ ID NO: 22) 1, 0, 0 68.2 ++
Cj22-hMyd88-E01-#07 ACCAATGCTGGGTCCCAGCTCC(SEQ ID NO: 25) 1, 0, 0 63.6 ++
Cj22-hMyd88-E02-#01 GCCTCCTCCTGCTGCTGCTTCA(SEQ ID NO: 26) 1, 0, 0 63.6 ++
Cj22-hMyd88-E03-#01 CTGTTCCAGTTGCCGGATCATC(SEQ ID NO: 29) 1, 0, 0 54.5 ++
Cj22-hMyd88-E04-#01 TCAGAGACAACCACCACCATCC(SEQ ID NO: 35) 1, 0, 0 54.5 ++
Cj22-hMyd88-E04-#02 AGGAATGTGACTTCCAGACCAA(SEQ ID NO: 36) 1, 0, 0 45.5 ++
Cj22-hMyd88-E05-#01 TGATGGGGATCAGTCGCTTCTG(SEQ ID NO: 37) 1, 0, 0 54.5 ++
Cj22-hMyd88-E05-#02 CATCAGAAGCGACTGATCCCCA(SEQ ID NO: 38) 1, 0, 0 54.5 ++
Cj22-hMyd88-E05-#03 CTGGGGAACTCTTTCTTCATTG(SEQ ID NO: 39) 1, 0, 0 45.5 ++
Cj22-hMyd88-E05-#04 CCTGAGGTTCATCACTGTCTGC(SEQ ID NO: 40) 1, 0, 0 54.5 ++
SpCas9을 위한 MYD88 유전자를 표적하는 gRNA 선별(gRNA selection to target MYD88 gene for SpCas9)
Name Target(w/o PAM)(SEQ ID NO) Mismatch(0b, 1b, 2b) GC content (%) Activity (Indel induction level)
Sp20-hMyd88-E01-#05 GTTCTTGAACGTGCGGACAC(SEQ ID NO: 155) 1, 0, 0 55.0 ++++++
Sp20-hMyd88-E01-#07 CTCCGCCAGCGCGGTCCAGT(SEQ ID NO: 157) 1, 0, 0 75.0 ++++++
Sp20-hMyd88-E01-#08 GTCCATCTCCTCCGCCAGCG(SEQ ID NO: 158) 1, 0, 0 70.0 ++++++
Sp20-hMyd88-E01-#09 GGCCGACTGGACCGCGCTGG(SEQ ID NO: 159) 1, 0, 0 80.0 ++++++
Sp20-hMyd88-E01-#11 GTACTTGGAGATCCGGCAAC(SEQ ID NO: 161) 1, 0, 0 55.0 ++++++
Sp20-hMyd88-E01-#21 CACGTCGTCGCGGCCCAGCT(SEQ ID NO: 171) 1, 0, 0 75.0 +++++
Sp20-hMyd88-E01-#22 GCTCCAGCAGCACGTCGTCG(SEQ ID NO: 172) 1, 0, 0 70.0 ++++++
Sp20-hMyd88-E03-#01 ATGAAGGCATCGAAACGCTC(SEQ ID NO: 177) 1, 0, 0 50.0 ++++++
Sp20-hMyd88-E03-#02 GCACAAACTGGATGTCGCTG(SEQ ID NO: 178) 1, 0, 0 55.0 ++++++
Sp20-hMyd88-E03-#05 GCAGGAGATGATCCGGCAAC(SEQ ID NO: 181) 1, 0, 0 60.0 ++++++
Sp20-hMyd88-E04-#01 TGATGATTACCTGCAGAGCA(SEQ ID NO: 183) 1, 0, 0 45.0 ++++
Sp20-hMyd88-E05-#01 GGGGATCAGTCGCTTCTGAT(SEQ ID NO: 184) 1, 0, 0 55.0 ++++++
Sp20-hMyd88-E05-#02 TGGGGATCAGTCGCTTCTGA(SEQ ID NO: 185) 1, 0, 0 55.0 ++++++
Sp20-hMyd88-E05-#03 CGCAGACAGTGATGAACCTC(SEQ ID NO: 186) 1, 0, 0 55.0 ++++++
Sp20-hMyd88-E05-#05 GCGAGTCCAGAACCAAGATT(SEQ ID NO: 188) 1, 0, 0 50.0 ++++++
② C3 유전자를 위한 gRNA 선별
CjCas9을 위한 C3 유전자를 표적하는 gRNA 선별(gRNA selection to target C3 gene for CjCas9)
Name Target(w/o PAM)(SEQ ID NO) Mismatch(0b, 1b, 2b) GC content (%) Activity (Indel induction level)
Cj22-hC3-E03-#04 ATGGTCTTGTCTGTCTGGATGA(SEQ ID NO: 49) 1, 0, 0 45.5 ++++
Cj22-hC3-E06-#01 TTCTCCACTGAGTTTGAGGTGA(SEQ ID NO: 51) 1, 0, 0 45.5 ++
Cj22-hC3-E07-#01 CTCCACTATGACCTCGAAACTG(SEQ ID NO: 52) 1, 0, 0 50.0 ++
Cj22-hC3-E10-#03 CAGATCCACTTCACCAAGACAC(SEQ ID NO: 64) 1, 0, 0 50.0 ++++
Cj22-hC3-E10-#04 AGGTCAAAGGGCATTCCTGGTT(SEQ ID NO: 65) 1, 0, 0 50.0 ++
Cj22-hC3-E11-#06 GGCGTGGCCAAACTCAGCATCA(SEQ ID NO: 71) 1, 0, 0 59.1 ++
Cj22-hC3-E13-#01 GAAGTCGGTGGTGATGGACAGG(SEQ ID NO: 78) 1, 0, 0 59.1 ++
Cj22-hC3-E15-#01 CGTGGTGGAGAAGGCAGACATC(SEQ ID NO: 90) 1, 0, 0 59.1 ++
Cj22-hC3-E17-#02 TCGCAGCACTTGCGCAGCTCCT(SEQ ID NO: 95) 1, 0, 0 63.6 ++
Cj22-hC3-E17-#03 GGGTTCTCCCGCATGCCGTCCT(SEQ ID NO: 96) 1, 0, 0 68.2 ++
Cj22-hC3-E20-#01 TTACTGTGACCTCGAAGGGGTC(SEQ ID NO: 100) 1, 0, 0 54.5 ++
Cj22-hC3-E21-#02 TCACCACGACCTTCAGGGACTT(SEQ ID NO: 102) 1, 0, 0 54.5 ++
Cj22-hC3-E22-#01 CAGAATGAACAAAACTGTGGCT(SEQ ID NO: 103) 1, 0, 0 40.9 ++
Cj22-hC3-E23-#02 TGCAGACCTCAGTGACCAAGTC(SEQ ID NO: 105) 1, 0, 0 54.5 ++
Cj22-hC3-E25-#01 GGTTGTCTGAAGGCCAGCTGCT(SEQ ID NO: 109) 1, 0, 0 59.1 ++
Cj22-hC3-E26-#01 GGGTCTTCCAGGAGGATGCGCC(SEQ ID NO: 112) 1, 0, 0 68.2 ++++
Cj22-hC3-E28-#01 CAACTACATGAACCTACAGAGA(SEQ ID NO: 114) 1, 0, 0 40.9 ++
Cj22-hC3-E29-#01 TTCATTGAGCCAACGCACGACG(SEQ ID NO: 115) 1, 0, 0 54.5 ++
Cj22-hC3-E29-#02 GTCGTGCGTTGGCTCAATGAAC(SEQ ID NO: 116) 1, 0, 0 54.5 ++
Cj22-hC3-E29-#03 GTAGTATCTCTGTTCATTGAGC(SEQ ID NO: 117) 1, 0, 0 40.9 ++
Cj22-hC3-E30-#01 CTTTTGGTATTGAGCCAAGGCT(SEQ ID NO: 118) 1, 0, 0 45.5 ++
Cj22-hC3-E30-#02 TTCATGGTGTTCCAAGCCTTGG(SEQ ID NO: 119) 1, 0, 0 50.0 ++
Cj22-hC3-E30-#03 GCAGGAGGCTGGCAGATTCCCA(SEQ ID NO: 120) 1, 0, 0 63.6 ++
Cj22-hC3-E30-#04 CTGCCAGCCTCCTGCGATCAGA(SEQ ID NO: 121) 1, 0, 0 63.6 ++
SpCas9을 위한 C3 유전자를 표적하는 gRNA 선별(gRNA selection to target C3 gene for SpCas9)
Name Target(w/o PAM)(SEQ ID NO) Mismatch(0b, 1b, 2b) GC content Activity (Indel induction level)
Sp20-hC3-E04-#04 ACAAGCTGCTACCCGTGGGC(SEQ ID NO: 211) 1, 0, 0 65.0 ++++++
Sp20-hC3-E04-#05 GCTGCTACCCGTGGGCCGGA(SEQ ID NO: 212) 1, 0, 0 75.0 ++++++
Sp20-hC3-E11-#02 GACTGCCACGGGGACTCGGT(SEQ ID NO: 243) 1, 0, 0 70.0 ++++++
Sp20-hC3-E11-#03 TCCAGCCTACCGAGTCCCCG(SEQ ID NO: 244) 1, 0, 0 70.0 ++++++
Sp20-hC3-E11-#04 CGAGTCCCCGTGGCAGTCCA(SEQ ID NO: 245) 1, 0, 0 70.0 ++++++
Sp20-hC3-E13-#15 GACGTCCACCCACACGGAGT(SEQ ID NO: 262) 1, 0, 0 65.0 ++++++
Sp20-hC3-E13-#16 GGTGGCCGACTCCGTGTGGG(SEQ ID NO: 263) 1, 0, 0 75.0 +++
Sp20-hC3-E13-#17 CTCCGTGTGGGTGGACGTCA(SEQ ID NO: 264) 1, 0, 0 65.0 ++++++
Sp20-hC3-E15-#03 GCGTAATCCTTCCCACTGCC(SEQ ID NO: 274) 1, 0, 0 60.0 ++++
Sp20-hC3-E16-#02 CACGGAACGGCGTCGGCGGG(SEQ ID NO: 284) 1, 0, 0 80.0 ++
Sp20-hC3-E16-#03 CTGCACGGAACGGCGTCGGC(SEQ ID NO: 285) 1, 0, 0 75.0 +++++
Sp20-hC3-E16-#04 GCTGCACGGAACGGCGTCGG(SEQ ID NO: 286) 1, 0, 0 75.0 +++++
Sp20-hC3-E20-#03 CTGCATTACTGTGACCTCGA(SEQ ID NO: 312) 1, 0, 0 50.0 ++++
Sp20-hC3-E20-#04 AGGACTTCTTCATCGACCTG(SEQ ID NO: 313) 1, 0, 0 50.0 +++++
Sp20-hC3-E20-#05 TCGTTTCGAACAACAGAGTA(SEQ ID NO: 314) 1, 0, 0 40.0 ++
Sp20-hC3-E20-#06 CTCTGTTGTTCGAAACGAGC(SEQ ID NO: 315) 1, 0, 0 50.0 ++
Sp20-hC3-E20-#07 TGTTGTTCGAAACGAGCAGG(SEQ ID NO: 316) 1, 0, 0 50.0 ++
2. 마우스의 안구에서 온-타겟 및 오프-타겟 효과 확인
Myd88 유전자 또는 C3 유전자를 표적하는 gRNA 및 Cas9를 포함하는 AAV를 마우스의 망막하에 주사하였고, 전달된 gRNA 및 Cas9에 의한 Myd88 유전자 및 C3 유전자의 각각 온-타겟 및 오프-타겟 효과를 망막(Retina) 세포 및 망막 색소 상피세포(retinal pigment epithelial(RPE) cells)에서 확인하였다.
각각의 온-타겟과 오프-타겟의 서열은 다음의 표13 및 표 14와 같다. 각각의 온-타겟과 오프-타겟의 서열은 Cas9의 종류에 따라 Cj(CjCas9) 또는 Sp(SpCas9)로 구분하여 표시하였고, 오프-타겟의 경우, 미스매치되는 서열을 소문자로 나타냈으며, PAM 서열은 기울임꼴로 표시하였다.
C3 유전자를 위한 온-타겟 및 오프-타겟
C3-Sp DNA(5' to 3')(SEQ ID NO) Chromosome Mismatches
on-target GACAACAACCTACTGCCCGT-GGG(SEQ ID NO: 831) chr17 0
off1 GACAAgAACCTACTGCaCaT-CAG(SEQ ID NO: 832) chr3 3
off2 GcCAACcACCTACTGCCCtT-CAG(SEQ ID NO: 833) chr7 3
off3 GAaAACAAgCTACTGCCCtT-GAG(SEQ ID NO: 834) chr9 3
C3-Cj DNA(5' to 3')(SEQ ID NO) Chromosome Mismatches
on-target GAGTGCAGGATGACAGTGACGG-AGACATAC(SEQ ID NO: 835) chr17 0
off1 GAcaGCAGGgTGACAGTGACtG-TGCTGCAC(SEQ ID NO: 836) chr1 4
off2 GttTGCAGGATGcCAGTGAtGG-GATGACAC(SEQ ID NO: 837) chr13 4
off3 GgGTGgAGGATGACAGTGAgGt-GTGTACAC(SEQ ID NO: 838) chr14 4
Myd88 유전자를 위한 온-타겟 및 오프-타겟
Myd88-Sp DNA(5' to 3')(SEQ ID NO) Chromosome Mismatches
on-target GAGGGTTCAAGAACAGCGAT-AGG(SEQ ID NO: 839) chr9 0
off1 GAtGGTTCAAGAACAttGAT-CAG(SEQ ID NO: 840) chr3 3
off2 GAGGGTTCAAGAgaAGgGAT-GGG(SEQ ID NO: 841) chr4 3
off3 cAGGtTTCAAGAcCAGCGAT-GAG(SEQ ID NO: 842) chr5 3
off4 GAGGGTTgAgGAACgGCGAT-CGG(SEQ ID NO: 843) chr16 3
off5 GAGGGTTCcAGAACAGCcAg-GGG(SEQ ID NO: 844) chr16 3
off6 GAGGGTTCAAGAACAGgGtc-CGG(SEQ ID NO: 845) chr16 3
off7 GAGGGacCAAGAcCAGCGAT-CAG(SEQ ID NO: 846) chr16 3
off8 GAaGGTTCAAGAACAGgGAg-AAG(SEQ ID NO: 847) chr13 3
off9 GAGGGTTaAAGAACAGCcgT-GAG(SEQ ID NO: 848) chr2 3
off10 cAGGGTTgAAGAACAGgGAT-TGG(SEQ ID NO: 849) chr2 3
off11 GAGaGTTgAAGAACAGCcAT-GAG(SEQ ID NO: 850) chr19 3
off12 GAGaGTTtAAGAACAGtGAT-AGG(SEQ ID NO: 851) chr15 3
off13 GAGGGTTaAAGAACAGaGgT-GGG(SEQ ID NO: 852) chr10 3
off14 GAGGGTTCAAGAtCAGaGgT-TAG(SEQ ID NO: 853) chrX 3
Myd88-Cj DNA(5' to 3')(SEQ ID NO) Chromosome Mismatches
on-target GGTGCCCGGCAGGACGTCACGG-TCGGACAC(SEQ ID NO: 854) chr9 0
off1 GGTtCCtGGCAGGtCtTCAgGG-AGAAACAC(SEQ ID NO: 855) chr8 5
off2 GGTGCCCGGCcGGgCGcCgCGc-CTTTGTAC(SEQ ID NO: 856) chr3 5
off3 GtaGCCCtGCAGGAaGTCAaGG-CAGAACAC(SEQ ID NO: 857) chr7 5
off4 GGTGCCgGGCAGGAaGTgggGG-GAAGATAC(SEQ ID NO: 858) chr7 5
그 결과, Retina cell 및 RPE cell에서 각각 Myd88 유전자 및 C3 유전자의 온-타겟에서 인델이 나타나는 것을 확인하였다. 또한, 오프-타겟에서는 인델이 발생하지 않는 것을 확인하여 gRNA 및 Cas9이 표적 특이적으로 작동함을 확인하였다(도 1 및 도 2). 따라서, 본 연구에서 제시한 MYD88 유전자 및 C3 유전자를 위한 AAV 또는 그의 변이체는 망막하 주입을 통해 Uveitis 치료를 위해 사용될 수 있을 것으로 기대된다.
본 발명은 면역 참여 유전자를 표적화하는 가이드핵산 및 에디터단백질을 포함하는 유전자 조작용 조성물을 이용해 면역 참여 유전자를 인위적으로 조작 및/또는 변형하여 면역 참여 유전자의 기능 및/또는 발현을 조절하여 인위적으로 면역 기능조절하도록 하므로, 이를 이용하여 면역 기능이상 질환의 개선 또는 치료에 이용할 수 있다.
MYD88 유전자 및 C3 유전자의 표적 서열, 및 이를 표적할 수 있는 가이드 서열

Claims (37)

  1. 유전자 조작용 조성물을 치료 대상에 도입(투여)하는 단계를 포함하는 포도막염(Uveitis)을 치료하는 방법으로,
    상기 유전자 조작용 조성물은
    면역 참여 유전자(immune participation gene) 내에 위치하는 표적 서열과 상보적인 결합을 형성하는 가이드 서열을 포함하는 가이드핵산 또는 이를 암호화하는 핵산 서열; 및
    에디터단백질 또는 이를 암호화하는 핵산 서열을 포함하며,
    상기 면역 참여 유전자는 MYD88 유전자 또는 C3 유전자이고,
    상기 상보적인 결합은 0 내지 5개의 미스매칭을 포함하는 결합인,
    포도막염(Uveitis)을 치료하는 방법.
  2. 제1항에 있어서,
    상기 가이드 서열은 SEQ ID NO: 417 내지 SEQ ID NO: 814로 구성된 서열들 중 선택된 하나 이상의 서열인 것을 특징으로 하는 포도막염(Uveitis)을 치료하는 방법.
  3. 제2항에 있어서,
    상기 가이드 서열은 SEQ ID NO: 419, 420, 423, 424, 427, 433, 434, 435, 436, 437, 438, 553, 555, 556, 557, 559, 569, 570, 575, 576, 579, 581, 582, 583, 584 및 586 중 선택된 하나 이상의 서열인 것을 특징으로 하는 포도막염(Uveitis)을 치료하는 방법.
  4. 제2항에 대해서,
    상기 가이드 서열은 SEQ ID NO: 447, 449, 450, 462, 463, 469, 476, 488, 493, 494, 498, 500, 501, 503, 507, 510, 512, 513, 514, 515, 516, 517, 518, 519, 609, 610, 641, 642, 643, 660, 661, 662, 672, 682, 683, 684, 710, 711, 712, 713 및 714 중 선택된 하나 이상의 서열인 것을 특징으로 하는 포도막염(Uveitis)을 치료하는 방법.
  5. 제1항에 있어서,
    상기 가이드 서열은 MYD88 유전자의 exon 1, exon 2, exon 3, exon 4 또는 exon 5에 위치하는 표적 서열과 상보적인 결합을 형성하는 것을 특징으로 하는 포도막염(Uveitis)을 치료하는 방법.
  6. 제1항에 있어서,
    상기 가이드 서열은 C3 유전자의 exon 3, exon 4, exon 6, exon 7, exon 10, exon 11, exon 13, exon 15, exon 16, exon 17, exon 20, exon 21, exon 22, exon 23, exon 25, exon 26, exon 28, exon 29 또는 exon 30에 위치하는 표적 서열과 상보적인 결합을 형성하는 것을 특징으로 하는 포도막염(Uveitis)을 치료하는 방법.
  7. 제1항에 있어서,
    상기 에디터단백질은 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 스타필로코커스 아우레우스 (Staphylococcus aureus) 유래의 Cas9 단백질 또는 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질인 것을 특징으로 하는 포도막염(Uveitis)을 치료하는 방법.
  8. 제1항에 있어서,
    상기 유전자 조작용 조성물은 가이드핵산 및 에디터단백질이 각각 핵산 서열의 형태로 1 이상의 플라스미드 또는 1 이상의 바이러스 벡터에 존재하는 특징으로 하는 포도막염(Uveitis)을 치료하는 방법.
  9. 제8항에 있어서,
    상기 바이러스 벡터는 레트로바이러스 벡터, 렌티바이러스 벡터, 아데노바이러스 벡터, 아데노-연관 바이러스(AAV) 벡터, 백시니아바이러스 벡터, 폭스바이러스 벡터 및 단순포진 바이러스 벡터로 구성된 군에서 선택된 하나 이상인 것을 특징으로 하는 포도막염(Uveitis)을 치료하는 방법.
  10. 제1항에 있어서,
    상기 유전자 조작용 조성물은 가이드핵산과 에디터단백질이 결합한 가이드핵산-에디터단백질 복합체 형태이며, 상기 가이드핵산은 guide RNA(gRNA)인 것을 특징으로 하는 포도막염(Uveitis)을 치료하는 방법.
  11. 제1항에 있어서,
    상기 도입(투여)은 주사(injection), 수혈(transfusion), 삽입(implantation) 또는 이식(transplantation)으로 수행되는 것을 특징으로 하는 포도막염(Uveitis)을 치료하는 방법.
  12. 제1항에 있어서,
    상기 도입(투여)은 망막하(subretinal), 피하(subcutaneously), 피내(intradermaliy), 안구내(intraocularly), 유리체내(intravitreally) 종양내(intratumorally), 절내(intranodally), 골수내(intramedullary), 근육내(intramuscularly), 정맥내(intravenous), 림프액내(intralymphatic) 및 복막내(intraperitoneally) 중에서 선택된 투여 경로로 수행되는 것을 특징으로 하는 포도막염(Uveitis)을 치료하는 방법.
  13. 제1항에 있어서,
    상기 치료 대상은 인간, 원숭이, 마우스, 래트를 포함하는 포유동물인 것을 특징으로 하는 포도막염(Uveitis)을 치료하는 방법.
  14. 면역 참여 유전자(immune participation gene) 내에 위치하는 표적 서열과 상보적인 결합을 형성하는 가이드 서열을 포함하는 가이드핵산 또는 이를 암호화하는 핵산 서열; 및
    에디터단백질 또는 이를 암호화하는 핵산 서열
    을 포함하는 유전자 조작용 조성물로,
    상기 면역 참여 유전자는 MYD88 유전자 또는 C3 유전자이고,
    상기 가이드 서열은 SEQ ID NO: 417 내지 SEQ ID NO: 814로 구성된 서열들 중 선택된 하나 이상의 서열이며,
    상기 상보적인 결합은 0 내지 5개의 미스매칭을 포함하는 결합인,
    유전자 조작용 조성물.
  15. 제14항에 있어서,
    상기 표적 서열은 면역 참여 유전자의 exon에 위치하는 것을 특징으로 하는 유전자 조작용 조성물.
  16. 제14항에 있어서,
    상기 표적 서열은 SEQ ID NO: 19 내지 SEQ ID NO: 416 중 선택된 하나 이상의 서열인 것을 특징으로 하는 유전자 조작용 조성물.
  17. 제16항에 있어서,
    상기 표적 서열은 SEQ ID NO: 21, 22, 25, 26, 29, 35, 36, 37, 38, 39, 40, 155, 157, 158, 159, 161, 171, 172, 177, 178, 181, 183, 184, 185, 186 및 188 중 선택된 하나 이상의 서열인 것을 특징으로 하는 유전자 조작용 조성물.
  18. 제16항에 있어서,
    상기 표적 서열은 SEQ ID NO: 49, 51, 52, 64, 65, 71, 78, 90, 95, 96, 100, 102, 103, 105, 109, 112, 114, 115, 116, 117, 118, 119, 120, 121, 211, 212, 243, 244, 245, 262, 263, 264, 274, 284, 285, 286, 312, 313, 314, 315 및 316 중 선택된 하나 이상의 서열인 것을 특징으로 하는 유전자 조작용 조성물.
  19. 제14항에 있어서,
    상기 가이드 서열은 SEQ ID NO: 419, 420, 423, 424, 427, 433, 434, 435, 436, 437, 438, 553, 555, 556, 557, 559, 569, 570, 575, 576, 579, 581, 582, 583, 584 및 586 중 선택된 하나 이상의 서열인 것을 특징으로 하는 유전자 조작용 조성물.
  20. 제14항에 있어서,
    상기 가이드 서열은 SEQ ID NO: 447, 449, 450, 462, 463, 469, 476, 488, 493, 494, 498, 500, 501, 503, 507, 510, 512, 513, 514, 515, 516, 517, 518, 519, 609, 610, 641, 642, 643, 660, 661, 662, 672, 682, 683, 684, 710, 711, 712, 713 및 714 중 선택된 하나 이상의 서열인 것을 특징으로 하는 유전자 조작용 조성물.
  21. 제14항에 있어서,
    상기 가이드 서열은 MYD88 유전자의 exon 1, exon 2, exon 3, exon 4 또는 exon 5에 위치하는 표적 서열과 상보적인 결합을 형성하는 것을 특징으로 하는 유전자 조작용 조성물.
  22. 제14항에 있어서,
    상기 가이드 서열은 C3 유전자의 exon 3, exon 4, exon 6, exon 7, exon 10, exon 11, exon 13, exon 15, exon 16, exon 17, exon 20, exon 21, exon 22, exon 23, exon 25, exon 26, exon 28, exon 29 또는 exon 30에 위치하는 표적 서열과 상보적인 결합을 형성하는 것을 특징으로 하는 유전자 조작용 조성물.
  23. 제14항에 있어서,
    상기 가이드핵산은 가이드 도메인은 포함하는 것을 특징으로 하는 유전자 조작용 조성물.
  24. 제23항에 있어서,
    상기 가이드 서열은 상기 가이드 도메인에 포함되는 것을 특징으로 하는 유전자 조작용 조성물.
  25. 제14항에 있어서,
    상기 가이드핵산은 제 1 상보적 도메인, 제 2 상보적 도메인, 연결 도메인, 근위 도메인 및 꼬리 도메인인 중 적어도 하나 이상의 도메인은 포함하는 것을 특징으로 하는 유전자 조작용 조성물.
  26. 제14항에 있어서,
    상기 에디터단백질은 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 스타필로코커스 아우레우스 (Staphylococcus aureus) 유래의 Cas9 단백질 또는 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질인 것을 특징으로 하는 유전자 조작용 조성물.
  27. 제14항에 있어서,
    상기 유전자 조작용 조성물은 가이드핵산 및 에디터단백질이 각각 핵산 서열의 형태로 1 이상의 플라스미드 또는 1 이상의 바이러스 벡터에 존재하는 것을 특징으로 하는 유전자 조작용 조성물.
  28. 제27항에 있어서,
    상기 바이러스 벡터는 레트로바이러스 벡터, 렌티바이러스 벡터, 아데노바이러스 벡터, 아데노-연관 바이러스(AAV) 벡터, 백시니아바이러스 벡터, 폭스바이러스 벡터 및 단순포진 바이러스 벡터로 구성된 군에서 선택된 하나 이상인 것을 특징으로 하는 유전자 조작용 조성물.
  29. 제14항에 있어서,
    상기 유전자 조작용 조성물은 가이드핵산과 에디터단백질이 결합한 가이드핵산-에디터단백질 복합체 형태이며, 상기 가이드핵산은 guide RNA(gRNA)인 것을 특징으로 하는 유전자 조작용 조성물.
  30. 면역 참여 유전자(immune participation gene) 내에 위치하는 표적 서열과 상보적인 결합을 형성하는 가이드 서열을 포함하는 가이드핵산으로,
    상기 면역 참여 유전자는 MYD88 유전자 또는 C3 유전자이며,
    상기 가이드 서열은 SEQ ID NO: 417 내지 SEQ ID NO: 814로 구성된 서열들 중 선택된 하나 이상의 서열이고,
    상기 상보적인 결합은 0 내지 5개의 미스매칭을 포함하는 결합이며,
    상기 가이드핵산은 에디터단백질과 복합체를 형성할 수 있는 가이드핵산.
  31. 제30항에 대해서,
    상기 가이드 서열은 SEQ ID NO: 419, 420, 423, 424, 427, 433, 434, 435, 436, 437, 438, 553, 555, 556, 557, 559, 569, 570, 575, 576, 579, 581, 582, 583, 584 및 586 중 선택된 하나 이상의 서열인 것을 특징으로 하는 가이드핵산.
  32. 제30항에 대해서,
    상기 가이드 서열은 SEQ ID NO: 447, 449, 450, 462, 463, 469, 476, 488, 493, 494, 498, 500, 501, 503, 507, 510, 512, 513, 514, 515, 516, 517, 518, 519, 609, 610, 641, 642, 643, 660, 661, 662, 672, 682, 683, 684, 710, 711, 712, 713 및 714 중 선택된 하나 이상의 서열인 것을 특징으로 하는 가이드핵산.
  33. 제30항에 있어서,
    상기 가이드 서열은 MYD88 유전자의 exon 1, exon 2, exon 3, exon 4 또는 exon 5에 위치하는 표적 서열과 상보적인 결합을 형성하는 것을 특징으로 하는 가이드핵산.
  34. 제30항에 있어서,
    상기 가이드 서열은 C3 유전자의 exon 3, exon 4, exon 6, exon 7, exon 10, exon 11, exon 13, exon 15, exon 16, exon 17, exon 20, exon 21, exon 22, exon 23, exon 25, exon 26, exon 28, exon 29 또는 exon 30에 위치하는 표적 서열과 상보적인 결합을 형성하는 것을 특징으로 하는 가이드핵산.
  35. 제30항에 있어서,
    상기 가이드핵산은 가이드 도메인은 포함하는 것을 특징으로 하는 가이드핵산.
  36. 제35항에 있어서,
    상기 가이드 서열은 상기 가이드 도메인에 포함되는 것을 특징으로 하는 가이드핵산.
  37. 제30항에 있어서,
    상기 가이드핵산은 제 1 상보적 도메인, 제 2 상보적 도메인, 연결 도메인, 근위 도메인 및 꼬리 도메인인 중 적어도 하나 이상의 도메인은 포함하는 것을 특징으로 하는 가이드핵산.
PCT/KR2019/009237 2018-07-25 2019-07-25 인위적인 유전자 조작을 통한 자가면역질환 치료 WO2020022802A1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201862702984P 2018-07-25 2018-07-25
US62/702,984 2018-07-25

Publications (1)

Publication Number Publication Date
WO2020022802A1 true WO2020022802A1 (ko) 2020-01-30

Family

ID=69182378

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2019/009237 WO2020022802A1 (ko) 2018-07-25 2019-07-25 인위적인 유전자 조작을 통한 자가면역질환 치료

Country Status (2)

Country Link
KR (1) KR20200011899A (ko)
WO (1) WO2020022802A1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022251409A3 (en) * 2021-05-27 2022-12-29 Apellis Pharmaceuticals, Inc. Genomic editing of complement
CN116731984A (zh) * 2023-07-24 2023-09-12 合肥戬谷生物科技有限公司 一种基于TadA8e突变体实现碱基颠换的编辑工具及应用

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016049251A1 (en) * 2014-09-24 2016-03-31 The Broad Institute Inc. Delivery, use and therapeutic applications of the crispr-cas systems and compositions for modeling mutations in leukocytes
WO2017068077A1 (en) * 2015-10-20 2017-04-27 Institut National De La Sante Et De La Recherche Medicale (Inserm) Methods and products for genetic engineering
US20170175128A1 (en) * 2014-04-18 2017-06-22 Editas Medicine, Inc. Crispr-cas-related methods, compositions and components for cancer immunotherapy
US20170304418A1 (en) * 2016-04-25 2017-10-26 Regen BioPharma, Inc. Universal donor checkpoint inhibitor silenced/gene edited cord blood killer cells
WO2018009525A1 (en) * 2016-07-05 2018-01-11 The Johnson Hopkins University Crispr/cas9-based compositions and methods for treating cancer
WO2018212361A1 (en) * 2017-05-17 2018-11-22 Edigene Corporation Method of treating diseases associated with myd88 pathways using crispr-gndm system

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170175128A1 (en) * 2014-04-18 2017-06-22 Editas Medicine, Inc. Crispr-cas-related methods, compositions and components for cancer immunotherapy
WO2016049251A1 (en) * 2014-09-24 2016-03-31 The Broad Institute Inc. Delivery, use and therapeutic applications of the crispr-cas systems and compositions for modeling mutations in leukocytes
WO2017068077A1 (en) * 2015-10-20 2017-04-27 Institut National De La Sante Et De La Recherche Medicale (Inserm) Methods and products for genetic engineering
US20170304418A1 (en) * 2016-04-25 2017-10-26 Regen BioPharma, Inc. Universal donor checkpoint inhibitor silenced/gene edited cord blood killer cells
WO2018009525A1 (en) * 2016-07-05 2018-01-11 The Johnson Hopkins University Crispr/cas9-based compositions and methods for treating cancer
WO2018212361A1 (en) * 2017-05-17 2018-11-22 Edigene Corporation Method of treating diseases associated with myd88 pathways using crispr-gndm system

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ZHANG , WEI: "Generation of complement protein C3 deficient pigs by CRISPR/Cas9-mediated gene targeting", SCIENTIFIC REPORTS, vol. 7, no. 1, December 2017 (2017-12-01), pages 1 - 9, XP055523379, DOI: 10.1038/s41598-017-05400-2 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022251409A3 (en) * 2021-05-27 2022-12-29 Apellis Pharmaceuticals, Inc. Genomic editing of complement
CN116731984A (zh) * 2023-07-24 2023-09-12 合肥戬谷生物科技有限公司 一种基于TadA8e突变体实现碱基颠换的编辑工具及应用

Also Published As

Publication number Publication date
KR20200011899A (ko) 2020-02-04

Similar Documents

Publication Publication Date Title
WO2018034554A1 (ko) 인위적으로 조작된 신생혈관형성 조절 시스템
WO2018088694A2 (ko) 인위적으로 조작된 sc 기능 조절 시스템
WO2019066549A2 (ko) 망막 기능장애 질환 치료를 위한 유전자 조작
WO2019066490A2 (ko) 유전자 발현 조절을 위한 인위적인 게놈 조작
WO2019009682A2 (ko) 표적 특이적 crispr 변이체
WO2014065596A1 (en) Composition for cleaving a target dna comprising a guide rna specific for the target dna and cas protein-encoding nucleic acid or cas protein, and use thereof
WO2018231018A2 (ko) 간에서 목적하는 단백질 발현하기 위한 플랫폼
AU2017335084B2 (en) Compositions containing protein loaded exosome and methods for preparing and delivering the same
WO2019103442A2 (ko) CRISPR/Cpf1 시스템을 이용한 유전체 편집용 조성물 및 이의 용도
WO2016021973A1 (ko) 캄필로박터 제주니 crispr/cas 시스템 유래 rgen을 이용한 유전체 교정
WO2020022802A1 (ko) 인위적인 유전자 조작을 통한 자가면역질환 치료
WO2018208067A1 (ko) 인위적으로 조작된 조작면역세포
WO2017188797A1 (ko) In vivo에서 rna-가이드 뉴클레아제의 활성을 고처리량 방식으로 평가하는 방법
WO2022060185A1 (ko) 표적화된 탈아미노효소 및 이를 이용한 염기 교정
WO2018030874A1 (ko) 조작된 면역조절요소 및 이에 의해 변형된 면역 활성
WO2018117377A1 (ko) Fad2 유전자 조작된 올레인산 강화 식물체 및 이의 제조 방법
WO2020022803A1 (ko) 항응고 인자들의 유전자 에디팅
WO2018230976A1 (ko) 반복 확장 돌연변이에 대한 게놈 편집 시스템
WO2020235974A2 (ko) 단일염기 치환 단백질 및 이를 포함하는 조성물
WO2023153845A2 (ko) 상동지정복구를 위한 target 시스템 및 이를 이용한 유전자 편집 방법
WO2022075816A1 (ko) Crispr/cas12f1(cas14a1) 시스템 효율화를 위한 엔지니어링 된 가이드 rna 및 이의 용도
WO2022124839A1 (ko) 온-타겟 활성이 유지되고 오프-타겟 활성이 감소된 가이드 rna 및 이의 용도
WO2020218657A1 (ko) 표적 특이적 crispr 변이체
WO2023172116A1 (ko) 듀센 근이영양증 치료를 위한 유전자 편집 시스템 및 이를 이용한 질병 치료 방법
WO2020197242A1 (ko) 혈우병b 질환 모델 랫드

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19840222

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19840222

Country of ref document: EP

Kind code of ref document: A1