WO2018030874A1 - 조작된 면역조절요소 및 이에 의해 변형된 면역 활성 - Google Patents

조작된 면역조절요소 및 이에 의해 변형된 면역 활성 Download PDF

Info

Publication number
WO2018030874A1
WO2018030874A1 PCT/KR2017/008835 KR2017008835W WO2018030874A1 WO 2018030874 A1 WO2018030874 A1 WO 2018030874A1 KR 2017008835 W KR2017008835 W KR 2017008835W WO 2018030874 A1 WO2018030874 A1 WO 2018030874A1
Authority
WO
WIPO (PCT)
Prior art keywords
nucleic acid
domain
sequence
gene
complementary
Prior art date
Application number
PCT/KR2017/008835
Other languages
English (en)
French (fr)
Inventor
김석중
김윤영
유호성
정인영
이정민
Original Assignee
주식회사 툴젠
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to RU2019106669A priority Critical patent/RU2767206C2/ru
Priority to SG11201901184QA priority patent/SG11201901184QA/en
Application filed by 주식회사 툴젠 filed Critical 주식회사 툴젠
Priority to EP17839891.3A priority patent/EP3498846A4/en
Priority to US16/324,955 priority patent/US20190185860A1/en
Priority to CN201780063250.1A priority patent/CN109844118A/zh
Priority to AU2017308473A priority patent/AU2017308473B2/en
Priority to JP2019507817A priority patent/JP7215808B2/ja
Priority to CA3033736A priority patent/CA3033736C/en
Priority to BR112019002779-3A priority patent/BR112019002779A2/pt
Publication of WO2018030874A1 publication Critical patent/WO2018030874A1/ko
Priority to AU2018264636A priority patent/AU2018264636B2/en
Priority to KR1020180052448A priority patent/KR20180123445A/ko
Priority to PCT/KR2018/005284 priority patent/WO2018208067A1/ko
Priority to JP2019561310A priority patent/JP7235391B2/ja
Priority to CN201880045774.2A priority patent/CN110914431B/zh
Priority to KR1020197036278A priority patent/KR102338993B1/ko
Priority to US16/611,383 priority patent/US20210147798A1/en
Priority to JP2023004738A priority patent/JP2023052426A/ja

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K35/00Medicinal preparations containing materials or reaction products thereof with undetermined constitution
    • A61K35/12Materials from mammals; Compositions comprising non-specified tissues or cells; Compositions comprising non-embryonic stem cells; Genetically modified cells
    • A61K35/14Blood; Artificial blood
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/46Cellular immunotherapy
    • A61K39/461Cellular immunotherapy characterised by the cell type used
    • A61K39/4611T-cells, e.g. tumor infiltrating lymphocytes [TIL], lymphokine-activated killer cells [LAK] or regulatory T cells [Treg]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/46Cellular immunotherapy
    • A61K39/461Cellular immunotherapy characterised by the cell type used
    • A61K39/4613Natural-killer cells [NK or NK-T]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/46Cellular immunotherapy
    • A61K39/463Cellular immunotherapy characterised by recombinant expression
    • A61K39/4631Chimeric Antigen Receptors [CAR]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/46Cellular immunotherapy
    • A61K39/464Cellular immunotherapy characterised by the antigen targeted or presented
    • A61K39/4643Vertebrate antigens
    • A61K39/4644Cancer antigens
    • A61K39/464402Receptors, cell surface antigens or cell surface determinants
    • A61K39/464403Receptors for growth factors
    • A61K39/464404Epidermal growth factor receptors [EGFR]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/46Cellular immunotherapy
    • A61K39/464Cellular immunotherapy characterised by the antigen targeted or presented
    • A61K39/4643Vertebrate antigens
    • A61K39/4644Cancer antigens
    • A61K39/464454Enzymes
    • A61K39/464462Kinases, e.g. Raf or Src
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0634Cells from the blood or the immune system
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/70503Immunoglobulin superfamily
    • C07K14/7051T-cell receptor (TcR)-CD3 complex
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/03Fusion polypeptide containing a localisation/targetting motif containing a transmembrane segment
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Definitions

  • the present invention is directed to artificially engineered immune systems with improved immune effects. More specifically, it relates to an artificially modified immune system, including artificially engineered immunoregulatory elements and cells comprising the same.
  • Cell therapy is a medicine that induces therapeutic effects such as regeneration by using living cells to restore damaged or diseased cells, tissues, and individuals. Refers to medicines manufactured by chemical and biological methods.
  • immunomodulatory cell therapy drugs are drugs used for the purpose of treating diseases by regulating the immune response in the body by using immune cells such as dendritic cells, natural killer cells, and T cells.
  • immunomodulatory cell therapies are mainly developed as an indication for cancer treatment, and by directly injecting immune cells to patients to activate immune function, thereby obtaining a therapeutic effect, surgical therapy, chemotherapy or radiation therapy used in conventional cancer treatment. It has a different therapeutic mechanism and efficacy, and is expected to occupy a major part of bio-drug in the future.
  • the immunomodulatory cell therapeutics have different physical and chemical characteristics of the substances introduced into the cells according to the type, and when the foreign genes are introduced into the immune cells as viral vectors, they have both characteristics of cell therapy and gene therapy.
  • the immunomodulatory cell therapeutic agent activates various immune cells such as PBMC (Pipheral blood mononuclear cell), T cells, NK cells isolated from the patient through apheresis, and activates them with various antibodies and cytokines, and then multiplies them in vitro. It is injected into the patient, or by injecting the immune cells into which the gene such as TCR (T-Cell Receptor) or CAR (Chimeric Antigen Receptor) is introduced.
  • PBMC Peripheral blood mononuclear cell
  • T cells T cells
  • NK cells isolated from the patient through apheresis
  • Adoptive immunotherapy involving the delivery of autologous antigen-specific immune cells (eg T cells) produced ex vivo may be used to treat various immune disorders as well as cancer. It could be a promising strategy.
  • autologous antigen-specific immune cells eg T cells
  • an immune cell therapy agent can be used in various ways as an anti-cancer function as well as an autoimmune inhibitor, and thus, an immune cell therapy agent can be used for various indications by controlling an immune response. Therefore, there is a great demand for improving and developing the therapeutic efficacy of engineered immune cells used in adoptive immunotherapy.
  • the present invention seeks to provide, in one embodiment, an artificially engineered immune system with improved immune effects.
  • the present invention provides an artificially engineered immunomodulatory element and a cell comprising the same.
  • the present invention seeks to provide a method of modifying (eg, enhancing or inhibiting) the function of immune cells.
  • the present invention seeks to provide a therapeutic and / or prophylactic use of a disease associated with abnormal immune function, including an immunomodulatory element and / or immune cells with altered immune function.
  • the present invention provides an anticancer function through enhancement of proliferation, survival, cytotoxicity, cell infiltration, and cytokine-release of immune cells. do.
  • an immunomodulatory gene such as artificially engineered PD-1, CTLA-4, A20, DGK ⁇ , DGK ⁇ , FAS, EGR2, PPP2R2D, PSGL-1, KDM6A, TET2 and / or expression products thereof To provide.
  • the present invention provides a composition for calibrating immune cell genome comprising a guide nucleic acid-editor protein complex applicable to the regulation of immunoregulatory gene activity and a method of using the same.
  • the present invention can be used for the manipulation of immunomodulatory genes such as artificially engineered PD-1, CTLA-4, A20, DGK ⁇ , DGK ⁇ , FAS, EGR2, PPP2R2D, PSGL-1, KDM6A, TET2, etc. It is intended to provide guide nucleic acids and editor proteins.
  • the present invention relates to an artificially engineered immune system having an improved immune effect. More specifically, it relates to an artificially modified immune system, including artificially engineered immunoregulatory elements and cells comprising the same.
  • the present invention provides immunoregulatory elements genetically engineered or modified for specific purposes.
  • an "immunoregulatory element” is a substance that functions in the formation and performance of an immune response and includes all of the various substances that may have an unnatural, ie, artificially engineered, immune response regulatory function. For example, it may be a gene or protein expressed in immune cells, genetically engineered or modified.
  • the immunoregulatory element may function in relation to activation or inactivation of immune cells. Can function to suppress immune responses. It can function to promote an immune response. For example, it may be an immune cell growth regulator, an immune cell death regulatory element, an immune cell dysfunction element, or a cytokine secretion element.
  • an immunomodulatory element for example, genetically engineered or modified, PD-1 gene, CTLA-4 gene, TNFAIP3 (A20) gene, DGKA gene, DGKZ gene, FAS gene, EGR2 gene , PPP2R2D gene, TET2 gene, PSGL-1 gene, KDM6A gene.
  • the present invention may comprise two or more genes genetically engineered or modified as an immunoregulatory element.
  • PD-1 gene CTLA-4 gene, TNFAIP3 (A20) gene, DGKA gene, DGKZ gene, FAS gene, EGR2 gene, PPP2R2D gene, TET2 gene, PSGL-1 gene, and KDM6A gene
  • TNFAIP3 A20 gene
  • DGKA gene DGKA gene
  • DGKZ gene FAS gene
  • EGR2 gene PPP2R2D gene
  • TET2 gene PSGL-1 gene
  • KDM6A gene Two or more genes selected can be manipulated or modified.
  • Preferred examples of the invention may be genetically engineered or modified TNFAIP3, DGKA, DGKZ, FAS, EGR2, PSGL-1, KDM6A genes.
  • Modifications in the nucleic acid sequence can be artificially manipulated by, but not limited to, guide nucleic acid-editor protein complexes.
  • Guide nucleic acid-editor protein complex means a complex formed through the interaction of a guide nucleic acid and an editor protein, and the nucleic acid-protein complex includes a guide nucleic acid and an editor protein.
  • Guide nucleic acid-editor protein complexes can modify a subject.
  • the subject may be a target nucleic acid, gene, chromosome or protein.
  • the gene is an immunoregulatory gene artificially manipulated by a guide nucleic acid-editor protein complex.
  • It may be an artificially engineered immunomodulatory gene characterized in that it comprises a.
  • the modification of the nucleic acid can occur in the promoter region of the gene.
  • the modification of the nucleic acid can occur in the exon region of the gene. In one embodiment, the modification may occur in a region within the top 50% of the coding regions of the gene.
  • the modification of the nucleic acid can occur in the intron region of the gene.
  • the modification of the nucleic acid can occur in the enhancer region of the gene.
  • the PAM sequence can be, for example, one or more of the following sequences (described in the 5 'to 3' direction).
  • N is A, T, C or G
  • N is each independently A, T, C or G, R is A or G, and Y is C or T;
  • NNAGAAW N is each independently A, T, C or G, and W is A or T;
  • N are each independently A, T, C, or G;
  • N is each independently A, T, C or G, R is A or G and Y is C or T);
  • TTN (N is A, T, C or G).
  • the present invention provides SEQ ID NO: 1 of the nucleic acid sequence of at least one gene selected from PD-1, CTLA-4, A20, DGK ⁇ , DGK ⁇ , FAS, EGR2, PPP2R2D, PSGL-1, KDM6A, and TET2.
  • guide nucleic acids capable of forming complementary binding to target sequences from 289 to 289, respectively.
  • one or more guide nucleic acids selected from the following groups may be provided:
  • a guide nucleic acid capable of forming a complementary bond to a target sequence of SEQ ID NOs: 6 and 11, respectively, in the A20 gene nucleic acid sequence;
  • a guide nucleic acid capable of forming a complementary bond to a target sequence of SEQ ID NOs: 87 and 89, respectively, of the PD-1 gene nucleic acid sequence;
  • a guide nucleic acid capable of forming a complementary bond to a target sequence of SEQ ID NOs: 109, 110, 111, 112, and 113 of the DGK ⁇ gene nucleic acid sequence, respectively;
  • a guide nucleic acid capable of forming a complementary bond to a target sequence of SEQ ID NOs: 126, 128, and 129, respectively, of the TET-2 gene nucleic acid sequence;
  • the guide nucleic acid may be, but is not limited to, 18 to 25 bp, 18 to 24 bp, 18 to 23 bp, 19 to 23 bp, 19 to 23 bp, or 20 to 23 bp.
  • the present invention may provide artificially engineered immune cells comprising one or more of the artificially engineered immunoregulatory genes and products expressed therefrom.
  • immune cell is a cell involved in an immune response, and includes all cells which are directly or indirectly involved in the immune response and their cells prior to their differentiation.
  • the stem cells are derived from embryonic stem cells, adult stem cells, induced pluripotent stem cells (iPS cells) or induced pluripotent stem cells having the ability to replicate and differentiate.
  • Cells eg, an iPS cell generated from a subject, manipulated to alter (eg, induce a mutation in).
  • the immune cell may be a CD3 positive cell.
  • it may be a T cell or a CAR-T cell.
  • the immune cell may be a CD56 positive cell.
  • it may be NK cells, such as NK92, primary NK cells.
  • the immune cells can be CD3 and CD56 double positive cells.
  • it may be a Natural Killer T (NKT) cell or a Cytokine Induced Killer cell (CIK).
  • NKT Natural Killer T
  • CIK Cytokine Induced Killer cell
  • the cells may be T cells, such as CD8 + T cells (eg, CD8 + naive T cells, CD8 + effector T cells, central memory T cells, or effector memory T cells), CD4 + T cells, natural killer T cells ( NKT cells), regulatory T cells (Treg), stem cell memory T cells, lymphocyte progenitor cells, hematopoietic stem cells, natural killer cells (NK cells), dendritic cells, cytokine-induced killer cells (CIK) Killer cell), PBMC (Peripheral blood mononuclear cell), monocytes (monocyte), macrophage (macrophage), NKT (Natural Killer T) cells, etc. may be one or more selected from the group consisting of.
  • the immune cells may be T cells, CAR-T cells, NK cells or NKT cells and the like.
  • Immune cells can be artificially engineered to inhibit or inactivate the activity of the immunoregulatory genes.
  • the immune cell may further comprise a chimeric antigen receptor (CAR).
  • CAR chimeric antigen receptor
  • the T cells may further comprise chimeric antigen receptors (CARs) or engineered TCRs (T-cell receptors).
  • CARs chimeric antigen receptors
  • T-cell receptors engineered TCRs
  • Immune cells may further comprise guide nucleic acid-editor protein complexes or nucleic acid sequences encoding them.
  • the editor protein is a Cas9 protein derived from Streptococcus pyogenes, a Cas9 protein derived from Campylobacter jejuni, a Cas9 protein derived from Streptococcus thermophilus, Streptococcus aureus It may be at least one selected from the group consisting of Cas9 protein from Streptococcus aureus, Cas9 protein derived from Neisseria meningitidis, and Cpf1 protein. In one example, it may be a Cas9 protein from Streptococcus pyogenes or a Cas9 protein from Campylobacter jejuni.
  • the guide nucleic acid binds complementarily with a portion of the nucleic acid sequence of one or more genes selected from the group consisting of PD-1, CTLA-4, A20, DGK ⁇ , DGK ⁇ , FAS, EGR2, PPP2R2D, PSGL-1, KDM6A, and TET2, respectively. Can be formed. 0 to 5, 0 to 4, 0 to 3, 0 to 2 mismatching.
  • the guide nucleic acid may be a nucleotide forming a binding complementary to at least one of the target sequences of SEQ ID NOs: 1 to 289 in Table 1.
  • SEQ ID NOs: 6 and 11 A20
  • SEQ ID NOs: 19, 20, 21, and 23 SEQ ID NO: 25
  • EGR2 SEQ ID NO: 64
  • PPP2R2D SEQ ID NOs: 87 and 89
  • PD-1 SEQ ID NOs: 109, 110, 111, 112 and 113
  • DGK ⁇ SEQ ID NOs: 126, 128 and 129
  • TERT-2 SEQ ID NO: 182
  • SEQ ID NOs: 252, 254, 257 and 264 (FAS) And nucleotides each forming a complementary bond to at least one of the target sequences of SEQ ID NO: 285 (KDM6A).
  • the immune cell may comprise one or more of artificially engineered DGK ⁇ and DGK ⁇ genes, in which modifications in nucleic acid sequences have occurred.
  • the immune cell may comprise a combination of artificially engineered DGK ⁇ and DGK ⁇ genes that have undergone modifications in nucleic acid sequences.
  • a composition that gives rise to a desired immune response. It may be referred to as a pharmaceutical composition or a therapeutic composition.
  • the invention comprises SEQ ID NO: 1 of the nucleic acid sequence of at least one gene selected from the group consisting of PD-1, CTLA-4, A20, DGK ⁇ , DGK ⁇ , FAS, EGR2, PPP2R2D, PSGL-1, KDM6A, and TET2 Guide nucleic acids each capable of forming a complementary bond to a target sequence of 289 to 289; And editor proteins or nucleic acids encoding them
  • composition for genetic manipulation comprising a.
  • the invention relates to immune cells isolated from the human body.
  • Cas9 protein from Streptococcus pyogenes Cas9 protein from Campylobacter jejuni, Cas9 protein from Streptococcus thermophilus, Streptococcus aureus
  • the guide nucleic acid and the editor protein may be present in one or more vectors in the form of a nucleic acid sequence, or may be present by forming a complex by combining the guide nucleic acid and the editor protein.
  • the contacting step may be performed in vivo or ex vivo.
  • the contacting step may be performed by one or more methods selected from electroporation, liposomes, plasmids, viral vectors, nanoparticles, and protein translocation domain (PTD) fusion protein methods.
  • electroporation liposomes
  • plasmids plasmids
  • viral vectors viral vectors
  • nanoparticles and protein translocation domain (PTD) fusion protein methods.
  • PTD protein translocation domain
  • the viral vector may be one or more selected from the group consisting of retroviruses, lentiviruses, adenoviruses, adeno-associated viruses (AAV), vaccinia virus, poxvirus and herpes virus.
  • retroviruses lentiviruses
  • adenoviruses lentiviruses
  • AAV adeno-associated viruses
  • vaccinia virus poxvirus and herpes virus.
  • the sequence of said immune cell target position in a subject by sequencing one or more genes of PD-1, CTLA-4, A20, DGK ⁇ , DGK ⁇ , FAS, EGR2, PPP2R2D, PSGL-1, KDM6A, and TET2. Provides a way to provide information about
  • a kit for genetic manipulation comprising:
  • Cas9 protein from Streptococcus pyogenes Cas9 protein from Campylobacter jejuni
  • Cas9 protein from Streptococcus thermophilus Cas9 protein from Streptococcus aureus
  • An editor protein or nucleic acid encoding the same which is at least one selected from the group consisting of Cas9 protein from Streptococcus aureus, Cas9 protein derived from Neisseria meningitidis, and Cpf1 protein.
  • kits can be used to artificially manipulate the gene of interest.
  • the invention provides all aspects of a disease therapeutic use using an immunotherapy approach comprising administration of artificially engineered cells, such as genetically engineered immune cells or stem cells, to a subject.
  • artificially engineered cells such as genetically engineered immune cells or stem cells
  • it is useful for adoptive immunotherapy.
  • the subject to be treated may be a mammal including humans, primates such as monkeys, rodents such as mice, rats and the like.
  • Effective immune cell therapeutics can be obtained by artificially engineered immunoregulatory elements and an immune system that has been artificially modified in function by cells comprising the same.
  • the survival, proliferation, persistence, cytotoxicity, and cytokine secretion of immune cells Immune efficacy, such as involved in release and / or infiltration, may be improved.
  • FIG. 1 is a graph showing CD25 MFI (median fluorescence intensity) in cells knocked out of DGK-alpha gene using sgRNA for DGK-alpha (# 11; denoted DGK-alpha # 11).
  • FIG. 2 is a graph showing CD25 MFI in cells knocked out of A20 gene using sgRNA for A20 (labeled # 11; A20 # 11).
  • EGR2 # 1 is a graph showing CD25 MFI in cells knocked out of the EGR2 gene using sgRNA for EGR2 (# 1; denoted as EGR2 # 1).
  • PPP2R2D # 10 is a graph showing CD25 MFI in cells knocked out of PPP2R2D gene using sgRNA for PPP2R2D (# 10; denoted PPP2R2D # 10).
  • FIG. 5 shows A20 using sgRNA for DGK-alpha (# 11; denoted DGK-alpha # 11) and cells knocked out of the DGKalpha gene, sgRNA for A20 (# 11; denoted A20 # 11).
  • FIG. 6 shows a cell knocked out of the DGKalpha gene using sgRNA for DGK-alpha (# 11; denoted DGK-alpha # 11), sgRNA for DGK-alpha (in combination with # 8 and # 11; DGKalpha # 8 + Cells knocked out of the DGK-alpha gene using the sgRNA for DGK-zeta (# 5; marked with DGK-zeta # 5), and for A20. Cells knocked out of the A20 gene using sgRNA (labeled # 11; A20 # 11)
  • FIG. 7 shows a cell knocked out of the DGK-alpha gene using DGK-alpha # 11, a cell knocked out of the DGK-alpha gene using DGKalpha # 8 + 11, and a DGK-zeta using DGK-zeta # 5.
  • FIG. 8A relates to knockout results of the CRISPR / Cas9 mediated DGK gene in human primary T cells,
  • A Gene knockout timeline (human cell activation by CD3 / CD28 beads, 139 CAR in human primary T cells).
  • B Knockout of DGK gene using lentiviral delivery, electroporation d)
  • B Indel efficiency for DGK ⁇ and DGK ⁇ using the Mi-seq system.
  • FIG. 8B shows the results of off-target analysis. The graph shown.
  • FIG. 9a shows the effector and proliferation of CAR-T cells by knockout of the DGK gene.
  • A Killing activity of 139 CAR-T cells according to 7-AAD positive U87vIII cell measurement using flow cytometry. activity) evaluation result
  • B The result of cytokine secretion analysis by ELISA (IFN- ⁇ , IL-2 kit, Biolegend)
  • Figure 9b is a graph showing the results of evaluation of proliferative capacity of 139 CAR T-cells using flow cytometry.
  • FIG. 10 relates to the results of DGKs knockout enhancing 139 CAR expression and amplifying CD3 end signaling after antigen exposure, (A) for phosphorylated ERK signal of 139 CAR-T cells, stimulated with CD3 / CD28 beads Western blot results, (B) 139 CAR expression results using flow cytometry: the left side is the expression of CAR according to antigen exposure, the right is a graph showing the comparison of CAR expression after 3 days of antigen exposure.
  • Figure 11 relates to the results of DGKs knockout does not induce tonic activation and T-cell exhaustion, (A) evaluation of IFN- ⁇ secretion by ELISA, (B) PD- which is an Exhaustion marker in CAR-positive T-cells Graph showing 1 (left) and TIM-3 (right) analysis results.
  • FIG. 12 relates to a result of DGK-knocked-out T-cells avoiding the immunosuppressive effects of TGF- ⁇ and PGE2.
  • Evaluation of Killing Activity, IFN- ⁇ Secretion and IL-2 Secretion of DGK ⁇ CAR-T Cells (B) Killing Activity of 139 CAR-T and 139 DGK ⁇ CAR-T Cells with or Without PGE2 (0.5 ug / mL) activity), IFN- ⁇ secretion and IL-2 secretion evaluation results.
  • Figure 13 relates to the effect of knockout efficiency and effector function of DGK ⁇ mediated by CRISPR / Cas9 in human NK cells
  • (A) and (B) are NK-92 cells and human primary using Mi-seq system It is a graph showing the knockout efficiency analysis in NK cells
  • (C) is a graph showing the killing activity of NK-92 by measuring 7-AAD positive Raji cells.
  • Figure 14 shows the knockout efficiency of DGK ⁇ and DGK ⁇ by CRISPR / Cas9 mediated human NKT cells, (A) indel efficiency, (B) cell growth (C) cell viability evaluation results and (D) protein levels Western blot experiment results for confirming the expression is shown.
  • Figures 17a-17c show assay results for hPSGL-1 sgRNA screening in Jurkat cells, indel efficiency and extent of Jurtat cells not expressing PSGL-1 after knockout (17a) and expression on Jurkat cell surface after knockout
  • the graphs 17b and 17c showing the expression level of PSGL-1.
  • the present invention is directed to artificially engineered immune systems with improved immune effects. More specifically, it relates to an artificially modified immune system, including artificially engineered immunoregulatory elements and cells comprising the same.
  • Immunomodulatory factor ( immune regulatory factor )
  • an "immunoregulatory element” is a substance that functions in the formation and performance of an immune response and includes all of the various substances that may have an unnatural, ie, artificially engineered, immune response regulatory function. For example, it may be a gene or protein expressed in immune cells, genetically engineered or modified.
  • artificially manipulated refers to a state in which an artificial modification has been made, not a state as it occurs in nature.
  • genetically engineered refers to a case where an artificial genetic modification is made to a biological or non-living material referred to in the present invention, for example, to artificially modify a genome for a specific purpose.
  • Genes and / or gene products polypeptides, proteins, etc.
  • the present invention provides immunoregulatory elements that are genetically engineered or modified for specific purposes.
  • immunomodulatory elements Since the elements divided below are only examples of immunomodulatory elements, the present invention does not limit the types of immunoregulatory elements encompassed by the present invention.
  • the genes or proteins listed below may not only have one type of immunoregulatory function, but may have multiple types of functions. In addition, two or more immunomodulatory elements may be provided as necessary.
  • an “immune cell activity regulatory element” is an element that functions to modulate the degree or activity of an immune response, eg, a gene or protein that functions to modulate the degree or activity of an immune response, eg, genetically engineered or modified. Can be.
  • Immune cell activation regulatory elements may function in the activation or inactivation of immune cells.
  • Immune cell activation regulatory elements may function to promote or enhance an immune response.
  • Immune cell activation regulatory elements may function to inhibit immune responses.
  • Immune cell activity-regulating elements may function in conjunction with channel proteins and receptors on cell membranes to regulate signal transduction and protein synthesis and degradation.
  • the immune cell activity regulatory element may be PD-1.
  • PD-1 gene (also referred to as PDCD1 gene; hereafter PD-1 gene and PDCD1 gene are used to mean the same gene) is the protein PD-1 (Programmed cell death protein) also called CD279 (cluster of differentiation 279) Means a gene (full length DNA, cDNA or mRNA).
  • the PD-1 gene may be, but is not limited to, one or more selected from the group consisting of: a gene encoding human PD-1 (eg, NCBI Accession No. NP_005009.2, etc.) such as NCBI Accession No. PD-1 gene represented by NM_005018.2, NG_012110.1 and the like.
  • the immune cell activity regulatory element may be CTLA-4.
  • CTLA-4 cytotoxic T-lymphocyte-associated protein 4
  • CTLA-4 also called CD152 (cluster of differentiation 152).
  • the CTLA-4 gene may be one or more selected from the group consisting of, but is not limited to: a gene encoding human CTLA-4 (eg, NCBI Accession No. NP_001032720.1, NP_005205.2, etc.)
  • the CTLA-4 gene represented by NCBI Accession No. NM_001037631.2, NM_005214.4, NG_011502.1 and the like.
  • the immune cell activity regulatory element may be CBLB.
  • the immune cell activity regulatory element may be PSGL-1.
  • the immune cell activity regulatory element may be ILT2.
  • the immune cell activity regulatory element may be KIR2DL4.
  • the immune cell activity regulatory element may be SHP-1.
  • the genes may be derived from mammals including humans, primates such as monkeys, rodents such as rats and mice.
  • immune cell activating elements may function to promote an immune response.
  • the immune cell activity regulating element may be an immune cell growth regulating element.
  • Immuno cell growth regulator refers to an element that functions to regulate the growth of immune cells by regulating protein synthesis and the like in immune cells, and may be, for example, genes or proteins expressed in immune cells.
  • the immune cell growth regulator may function in relation to transcription of DNA, translation of RNA, and cell differentiation.
  • immune cell growth regulatory elements may be genes or proteins involved in the expression pathways of NFAT, I ⁇ B / NF- ⁇ B, AP-1, 4E-BP1, eIF4E, S6.
  • the immune cell growth regulator may be DGK-alpha.
  • DGKA Dgk-alpDha gene means a gene (full length DNA, cDNA or mRNA) encoding DGKA (Diacylglycerol kinase alpha).
  • the DGKA gene may be one or more selected from the group consisting of, but is not limited to: human DGKA (eg, NCBI Accession No. NP_001336.2, NP_958852.1, NP_958853.1, NP_963848.1, etc.) Genes encoding proteins, such as NCBI Accession No. DGKA gene represented by NM_001345.4, NM_201444.2, NM_201445.1, NM_201554.1, NC_000012.12 and the like.
  • the immune cell growth regulator may be DGK-zeta.
  • DGKZ (Dgk-zeta) gene means a gene (full length DNA, cDNA or mRNA) encoding DGKZ (Diacylglycerol kinase zeta).
  • the DGKZ gene may be one or more selected from the group consisting of, but is not limited to: human DGKZ (eg, NCBI Accession No. NP_001099010.1, NP_001186195.1, NP_001186196.1, NP_001186197.1, NP_003637 .2, NP_963290.1, NP_963291.2, etc.), for example, NCBI Accession No.
  • DGKZ genes represented by NM_001105540.1, NM_001199266.1, NM_001199267.1, NM_001199268.1, NM_003646.3, NM_201532.2, NM_201533.3, NG_047092.1 and the like.
  • the immune cell growth regulator may be EGR2.
  • EGR2 gene refers to a gene (full length DNA, cDNA or mRNA) encoding EGR2 (Early growth response protein 2).
  • the EGR2 gene may be one or more selected from the group consisting of, but is not limited to:
  • the immune cell growth regulator may be EGR3.
  • the immune cell growth regulator may be PPP2R2D.
  • the immune cell growth regulator may be A20 (TNFAIP3).
  • the immune cell growth regulator may be PSGL-1.
  • the genes may be derived from mammals including humans, primates such as monkeys, rodents such as rats and mice.
  • the immune cell activity regulating element may be an immune cell death regulating element.
  • immune cell death regulatory element is an element that functions in killing immune cells, and may be a gene or protein expressed in immune cells.
  • the immune cell death regulatory element may have a function related to cell death (apoptosis) or cell necrosis (necrosis) of immune cells.
  • the immune cell death regulatory element may be a caspase cascade-associated protein or gene.
  • the immune cell death regulatory element may be Fas.
  • Fas When referring to a protein or gene hereinafter, it is natural for a person skilled in the art to manipulate a receptor and a binding portion on which the protein or gene acts.
  • the immune cell death regulatory element may be a death domain-associated protein or gene. At this time, the immune cell death regulatory element may be Daxx.
  • the immune cell death regulatory element may be a Bcl-2 family protein.
  • the immune cell death regulatory element may be a BH3-only family protein.
  • the immune cell death regulatory element may be Bim.
  • the immune cell death regulatory element may be Bid.
  • the immune cell death regulatory element may be BAD.
  • the immune cell death regulatory element may be a ligand or a receptor located in the immune extracellular membrane.
  • the immune cell death regulatory element may be PD-1.
  • the immune cell death regulatory element may be CTLA-4.
  • the immune cell activity regulating element may be an immune cell exhaustion regulating element.
  • immune cell loss factor is an element that functions in relation to the progressive loss of function of an immune cell, and may be a gene or protein expressed in immune cells that functions.
  • the immune cell dysfunction element may function to help the transcription or translation of genes involved in the inactivation of immune cells.
  • the function of assisting transcription may be a function of demethylation of the gene.
  • genes involved in inactivation of immune cells include genes of the immune cell activation regulatory element.
  • the immune cell loss factor may be TET2.
  • TET2 Genes encoding human TET2 (e.g., NCBI Accession No. NP_001120680.1, NP_060098.3, etc.), such as NCBI Accession NM_001127208.2, No. TET2 gene represented by NM_017628.4, NG_028191.1, etc.
  • Immune cell dysfunction may play a role in the excessive growth of immune cells. Immune cells that only grow excessively and do not regenerate lose their function.
  • the immune cell loss factor may be Wnt.
  • a protein or gene hereinafter, it is natural for a person skilled in the art to manipulate a gene in the protein or a signal transduction pathway in which the protein is included and a receptor or binding portion to which the gene functions.
  • the immune cell dysfunction element may be Akt.
  • Akt Akt
  • the immune cell activity regulating element may be a cytokine production regulating element.
  • a "cytokine secretory element” may be a gene or protein expressed in immune cells that functions as a component involved in cytokine secretion of immune cells.
  • Cytokine is a generic term for proteins secreted by immune cells and is a signaling protein that plays an important role in the body. Involved in infection, immunity, inflammation, trauma, rot, cancer, etc. Cytokines can be secreted from cells and then affect other cells or the cells themselves. For example, it may induce proliferation of macrophages or promote differentiation of secretory cells themselves. However, when secreted in excessive amounts, problems such as attacking normal cells appear, so proper secretion of cytokines in the immune response is also important.
  • Cytokine secretion elements are preferably, for example, TTNF ⁇ , IFN- ⁇ , TGF- ⁇ , IL-2, IL-4, IL-10, IL-13, IL-1, IL-6, IL-12, Gene or protein in IL-7, IL-15, IL-17, IFN- ⁇ .
  • the cytokine may function to transmit a signal to other immune cells to induce or kill different antigen-bearing cells recognized by the immune cells.
  • the cytokine secretion element may preferably be a gene or protein in the gene pathway related to IL-2 secretion.
  • the immunoregulatory element can mean a group of molecules expressed in immune cells. These molecules can act effectively to down / up control or inhibit / promote the immune response.
  • immunoreactive checkpoint as a group of molecules expressing T cells is a Programmed Death1 (PD-1. PDCD1 or CD279, accession number: NM_005018) cytotoxic T lymphocyte antigen 4 (directly inhibiting immune cells).
  • CTLA-4 or CD152 GenBank accession number AF414120.1
  • LAG3 CD223, accession number: NM_002286.5
  • Tim3 HAVCR2, GenBank accession number: JX049979.1
  • BTLA CD272, accession number: NM_181780.3
  • BY55 CD160, GenBank accession number: CR541888.1
  • TIGIT IVSTM3, accession number: NM_173799
  • LAIR1 CD305, GenBank accession number: CR542051.1
  • SIGLEC10 GeneBank accession number: AY358337.1
  • 2B4 CD244, accession number: NM_001166664.1
  • PPP2CA PPP2CB, PTPN6, PTPN22, CD96, CRTAM, SIGLEC7, SIGLEC9, TNFRSF10B, TNFRSF10A, CASP8, CASP10, CASP3, CASP6, CASP7, FADD, FASAD TFRBRII
  • an immunomodulatory element for example, genetically engineered or modified, PD-1 gene, CTLA-4 gene, TNFAIP3 (A20) gene, DGKA gene, DGKZ gene, FAS gene, EGR2 gene , PPP2R2D gene, TET2 gene, PSGL-1 gene, and KDM6A gene.
  • the present invention may comprise two or more genes genetically engineered or modified as an immunoregulatory element.
  • PD-1 gene CTLA-4 gene, TNFAIP3 (A20) gene, DGKA gene, DGKZ gene, FAS gene, EGR2 gene, PPP2R2D gene, TET2 gene, PSGL-1 gene, and KDM6A gene
  • TNFAIP3 A20 gene
  • DGKA gene DGKA gene
  • DGKZ gene FAS gene
  • EGR2 gene PPP2R2D gene
  • TET2 gene PSGL-1 gene
  • KDM6A gene Two or more genes selected can be manipulated or modified.
  • Preferred examples of the invention may be genetically engineered or modified TNFAIP3, DGKA, DGKZ, FAS, EGR2, PSGL-1, KDM6A genes.
  • Such genetic manipulation or modification can be obtained by artificially inserting, deleting, replacing, or inverting mutations in some or all regions of the genomic sequence of a wild type gene.
  • the genetic manipulation or modification may be obtained by fusing the manipulation or modification of two or more genes.
  • such genetic manipulation or modification may inactivate the gene so that the protein encoded from the gene is not expressed in the form of a protein having an original function.
  • such genetic manipulation or modification may further enable the gene to be expressed so that the protein encoded from the gene is expressed in the form of a protein having an improved function than the original function.
  • the function of a protein encoded by a particular gene is A
  • the function of the protein expressed by the engineered gene may be completely different from A or have additional functions (A + B) including A together. have.
  • such genetic manipulation or modification may be such that two or more proteins are expressed in a fused form using two or more genes having different or complementary functions.
  • such genetic manipulation or modification may be used to allow two or more proteins to be expressed in separate and independent forms in cells using two or more genes having different or complementary functions.
  • Gene information can be obtained from known databases such as GenBank of the National Center for Biotechnology Information (NCBI).
  • the manipulation or modification of the gene may be induced by one or more of the following:
  • 'target gene' a gene of modification
  • nucleotides of the target gene such as 1 to 30, 1 to 27, 1 to 25, 1 to 23, 1 to Deletion of 20, 1 to 15, 1 to 10, 1 to 5, 1 to 3, or 1 nucleotides
  • nucleotides of the target gene such as 1 to 30, 1 to 27, 1 to 25, 1 to 23, 1 to 20, 1 to 15, 1 to 10, 1 to 5, 1 To three, or one, nucleotide substitution with a nucleotide different from the original (wild-type), and one or more nucleotides, such as 1 to 30, 1 to 27, 1 to 25, 1 to 23, 1 to 20 Insertion of a dog, 1-15, 1-10, 1-5, 1-3, or 1 nucleotides, each independently selected from A, T, C and G, into any position of the target gene .
  • the modified part of the target gene is at least 1bp, 3bp or more, 5bp or more, 7bp or more, 10bp or more, 12bp or more, 15bp or more, 17bp or more, 20bp or more, for example, 1bp to 30bp, 3bp to 30bp, 5bp to 30bp, 7bp to 30bp, 10bp to 30bp, 12bp to 30bp, 15bp to 30bp, 17bp to 30bp, 20bp to 30bp, 1bp to 27bp, 3bp to 27bp, 5bp to 27bp, 7bp to 27bp, 10bp to 27bp, 12bp to 27bp, 15bp to 27bp, 17bp to 27bp, 20bp to 27bp, 1bp to 25bp, 3bp to 25bp, 5bp to 25bp, 7bp to 25bp, 10bp to 25bp,
  • One aspect of the invention is a cell comprising said artificially engineered immunomodulatory elements.
  • the cells are, but are not limited to, immune cells and stem cells.
  • an “immune cell” of the present invention is a cell involved in an immune response, and includes all cells directly or indirectly involved in the immune response and their cells before differentiation.
  • Immune cells may have functions of secretion of cytokines, differentiation into other immune cells, and cytotoxicity. Immune cells also include cells from which natural mutations have occurred.
  • Immune cells differentiate from hematopoietic stem cells in the bone marrow and largely include lymhoid progenitor cells and myeloid progenitor cells. T cells and B cells responsible for acquired immunity by differentiation of lymphoid progenitor cells; And macrophages, eosinophils, neutrophils, basophils, granulocytes, megakaryocytes, erythrocytes, etc., differentiated from myeloid progenitor cells.
  • the cells may be T cells, such as CD8 + T cells (eg, CD8 + naive T cells, CD8 + effector T cells, central memory T cells, or effector memory T cells), CD4 + T cells, natural killer T cells ( NKT cells), regulatory T cells (Treg), stem cell memory T cells, lymphocyte progenitor cells, hematopoietic stem cells, natural killer cells (NK cells), dendritic cells, cytokine-induced killer cells (CIK) Killer cell), PBMC (Peripheral blood mononuclear cell), monocytes (monocyte), macrophage (macrophage), NKT (Natural Killer T) cells, etc. may be one or more selected from the group consisting of.
  • CD8 + T cells eg, CD8 + naive T cells, CD8 + effector T cells, central memory T cells, or effector memory T cells
  • CD4 + T cells such as CD8 + T cells (eg, CD8 + naive T cells, CD
  • Macrophages and dendritic cells are referred to as "antigen presenting cells” or “APCs”, which are specialized cells that can activate T cells when the major histocompatibility complex (MHC) receptors on their cell surface interact with TCR on the T cell surface.
  • APCs antigen presenting cells
  • MHC major histocompatibility complex
  • any hematopoietic stem cell or immune system cell can be converted to APC by introducing a nucleic acid molecule that expresses an antigen recognized by a TCR or other antigen binding protein (eg, a CAR).
  • said immune cell can be a cell used in immunotherapy by inactivating or exchanging a gene that synthesizes a protein (eg, an immune checkpoint protein) that is involved in MHC recognition and / or immune function.
  • a protein eg, an immune checkpoint protein
  • said immune cells can further comprise polynucleotides encoding receptors of single chain and multiple subunits (eg, CAR, TCR) for specific cellular recognition.
  • polynucleotides encoding receptors of single chain and multiple subunits (eg, CAR, TCR) for specific cellular recognition.
  • the immune cells of the present invention comprise blood (eg, peripheral blood), stem cells (eg, embryonic stem cells, induced pluripotent stem cells, etc.) of healthy donors and / or patients. ), Cord blood, bone marrow, and the like may be derived from immune cells, and may be manipulated in vitro.
  • blood eg, peripheral blood
  • stem cells eg, embryonic stem cells, induced pluripotent stem cells, etc.
  • Cord blood eg, bone marrow, and the like may be derived from immune cells, and may be manipulated in vitro.
  • the immune cells can be CD3 positive cells.
  • it may be a T cell or a CAR-T cell.
  • CD3 is a receptor in which TCR and various proteins exist as a complex on the surface of T cells. Five proteins, called ⁇ , ⁇ , ⁇ , ⁇ , and ⁇ chains, form CD3, which, together with TCR, exist as TCR / CD3 complexes in the ⁇ : ⁇ or ⁇ : ⁇ states. They are known to have a function of signal transduction in the cell upon antigen recognition of T cells.
  • the immune cells can be CD56 positive cells.
  • it may be NK cells, such as NK92, primary NK cells.
  • NK cells have the third largest number of immune cells, and about 10% of peripheral blood immune cells are NK cells.
  • NK cells have CD56 and CD16 and mature in the liver or bone marrow.
  • perforin can be sprayed on the cell membrane to dissolve and puncture the cell membrane, and granzyme is sprayed on the cell membrane to dissolve the cytoplasm and cause apoptosis or inside the cell. Infusion of water and salt causes necrosis, which kills many cancer cells.
  • NK cells are well known as cells in which foreign genetic material is not easily introduced.
  • said immune cells can be CD3 and CD56 double positive cells.
  • it may be a natural killer T (NKT) or cytokine-induced killer cell (CIK) cell.
  • Natural killer T (NKT) or cytokine-induced killer cell (CIK) cells are immune cells that express both CD3, a T cell marker, and a CD56 molecule, a natural killer cell (NK cell) marker. Since it is derived from T cells and has both the characteristics and functions of NK cells, tumor cells are killed regardless of the major histocompatibility complex (MHC).
  • natural killer T (NKT) cells are cells expressing NK1.1 or NKR-P1A (CD161), which are receptors for T cells (TCR) and NK cell-specific surface markers.
  • NKT cells recognize glycolipids presented by CD1d, a monomorphic protein with a structure similar to MHC class I. NKT cells secrete various types of cytokines such as IL-4, IL-13, IL-10 and IFN- ⁇ when activated by ligands such as ⁇ -GalCer. In addition, the NKT cells have anti-tumor activity.
  • CIK cells are a kind of immune cells that proliferate when blood is collected and treated with interleukin 2 and CD3 antibodies in vitro for 2-3 weeks, and are positive for CD3 and CD56. CIK cells produce large amounts of IFN- ⁇ and TNF- ⁇ .
  • the cells are embryonic stem cells, adult stem cells, induced pluripotent stem cells (iPS cells) or induced pluripotent stem cells with self-replicating and differentiating abilities.
  • Cells may be derived from (eg, an iPS cell derived cell).
  • Cells as preferred examples of the invention include engineered or modified genes that are immunoregulatory elements.
  • the cell may comprise part or all of the engineered or modified gene; Or expression products thereof.
  • the protein encoded from the gene may be a cell in which it is not expressed in the form of a protein with its original function.
  • the protein encoded from the gene may be a cell expressed in the form of a protein having an improved function than the original function.
  • such genetic manipulation or modification may be such that the protein encoded from this gene is expressed in the form of a protein that functions in and / or other than its original function.
  • it may be a cell in which two or more proteins are expressed in a modified form using two or more genes having different or complementary functions by such genetic manipulation or modification.
  • such genetic manipulation or modification may be immune cells with high cytokine production or secretion of three types of IL-2, TNF ⁇ and IFN ⁇ .
  • the cells of the present invention may further comprise a configuration as follows.
  • Cells of the invention may comprise an "immune receptor".
  • an “immune receptor” is a receptor present on the surface of an artificially engineered or modified immune cell, and refers to a substance that participates in an immune response, such as an antigen, that recognizes and functions a specific function.
  • the receptor may be wild or artificially manipulated
  • the receptor may have affinity for the antigen.
  • the receptor may have the ability to recognize the structure of the MHC structural protein and the antigen disclosed in the structural protein.
  • Receptors can generate immune response signals.
  • Immunune response signal means any signal that occurs during the immune response.
  • the immune response signal may be a signal related to the growth and differentiation of immune cells.
  • the immune response signal may be a signal associated with the death of immune cells.
  • the immune response signal may be a signal related to the activity of immune cells.
  • the immune response signal may be a signal associated with the assistance of the immune response.
  • the immune response signal may be a signal that regulates expression of a target gene.
  • the immune response signal may be to promote or inhibit the synthesis of cytokines.
  • the immune response signal may be to promote or inhibit the secretion of cytokines.
  • the immune response signal may be a signal that helps growth or differentiation of other immune cells.
  • the immune response signal may be a signal that modulates the activity of other immune cells.
  • the immune response signal may be a signal that attracts other immune cells to the location where the signal occurs.
  • the receptor may be a T cell receptor (TCR).
  • TCR T cell receptor
  • the cell may be modified to include a specific T cell receptor (TCR) gene (e.g., TRAC or TRBC gene).
  • TCR T cell receptor
  • the TCR may be used for a tumor associated antigen (eg, MART1 (melanoma antigen recognized by T cells 1, MAGEA3 (melanoma-associated antigen3), NY-ESOl), NYESOl,, carcinoembryonic antigen (CEA), GP100, etc.). It may have binding specificity.
  • the receptor may be a toll like receptor (TLR).
  • TLR toll like receptor
  • the receptors may be CD4 and CD8, which are co-receptors involved in MHC-limiting T cell activation.
  • the receptor may be CTLA-4 (CD152).
  • the receptor may be CD28.
  • the receptor may be CD137, 4-1BB, a receptor that amplifies T cell responses.
  • the receptor may be CD3 ⁇ , a signaling component of T cell antigen receptor.
  • the receptor may be a CAR (Chimeric Antigen Receptor).
  • the receptor may be an artificially engineered artificial receptor (artificial receptor)
  • Articles refers to a functionally functional and specific function of an antigen that is artificially produced, rather than a wild type receptor.
  • These artificial receptors may contribute to the improvement of the immune response by improving the ability to recognize a specific antigen or by generating an enhanced immune response signal.
  • the artificial receptor may have the following configuration as an example.
  • Artificial receptors include antigen recognition units.
  • Antigen recognition part means a site that recognizes an antigen as part of an artificial receptor.
  • the antigen recognition unit may be an improved ability to recognize a specific antigen than wild receptors.
  • the specific antigen may be an antigen of cancer cells.
  • certain antigens may be antigens of general body cells.
  • the antigen recognition portion may have affinity with the antigen.
  • the antigen recognition unit may generate a signal while binding to the antigen.
  • the signal may be an electrical signal.
  • the signal may be a chemical signal.
  • the antigen recognition unit may include a signal sequence.
  • the signal sequence refers to a peptide sequence that allows the protein to be delivered to a specific position during protein synthesis.
  • the signal sequence may be located near the N terminus of the antigen recognition portion. In this case, the distance from the N terminal may be about 100 amino acids.
  • the signal sequence may be located near the C terminus of the antigen recognition portion. In this case, the distance from the C terminal may be about 100 amino acids.
  • the antigen recognition part may have an organic functional relationship with the first signaling part.
  • the antigen recognition portion may have homology with the Fab (fragment antigen binding) domain of the antibody.
  • the antigen recognition portion may be a single-chain variable fragment (scFv).
  • the antigen recognition unit may recognize the antigen by itself or form an antigen recognition construct.
  • Antigen recognition constructs must form a specific structure in order to recognize the antigen, and the unit and the combination of the units forming the specific structure can be easily understood by those skilled in the art.
  • the antigen recognition construct may also consist of one or two or more units.
  • the antigen recognition construct may be a structure in which the units are connected in a line, or may be a structure connected in parallel.
  • a structure connected in a line means a form in which two or more units are continuously connected in one direction, and a structure connected in parallel means that two or more units are simultaneously connected to one end of one unit, for example, in different directions. It means a combined form.
  • the unit may be an inorganic material.
  • the unit may be a biochemical ligand.
  • the monomer may have homology with the antigen recognition portion of the wild type receptor.
  • the monomer may be homologous to the antibody protein.
  • the unit may have a heavy chain or homology with an immunoglobulin.
  • the unit may have a light chain or homology with an immunoglobulin.
  • the unit may include a signal sequence.
  • the unit may be bound by a chemical bond, or may be bound through a specific bond.
  • Antigen recognition unit combining part is a site where the antigen recognition unit is combined with each other, it may be an optional configuration that exists when there is an antigen recognition structure consisting of two or more antigen recognition units. .
  • the antigen recognition structural unit binding portion may be a peptide. At this time, the binding portion may have a high ratio of serine and threonine.
  • the antigen recognition structural unit binding portion may be a chemical binding.
  • the antigen recognition structural unit binding portion may help to express the conformation of the antigen recognition structural unit by having a specific length.
  • the antigen recognition structural unit binding unit may help the function of the antigen recognition structure by having a specific positional relationship between the antigen recognition structural units.
  • the artificial receptor includes the receptor body portion.
  • the "receptor body part” is a site that mediates the connection between the antigen recognition unit and the signal generator, and may physically connect the antigen recognition unit and the signal generator.
  • the function of the receptor body may be to transmit a signal generated by the antigen recognition unit or the signal generator.
  • the structure of the receptor body may optionally have the function of a signal generator.
  • the function of the receptor body may be to allow the artificial receptor to be immobilized to immune cells.
  • the receptor body may comprise an amino acid helix structure.
  • the structure of the receptor body may include a portion homologous to a part of a general receptor protein present in the body.
  • the homology can range from 50 to 100%.
  • the structure of the receptor body may include a portion homologous to the protein on the immune cell.
  • the homology can range from 50 to 100%.
  • the receptor body can be a CD8 transmembrane domain.
  • the receptor body can be the CD28 transmembrane region.
  • the CD28 may function as the second signal generator and the receiver body at the same time.
  • the artificial receptor may include a signal generator.
  • First signal generator refers to a site that generates an immune response signal as part of an artificial receptor.
  • “Second signal generator” refers to a site that interacts with or independently generates an immune response signal as part of an artificial receptor.
  • the artificial receptor may include a first signal generator and / or a second signal generator.
  • Two or more first and / or second signal generators may be included.
  • the first and / or second signaling portion may comprise specific sequence motifs.
  • the sequence motif may be homologous to the motif of a cluster of designition (CD) protein.
  • the CD protein may be CD3, CD247, CD79.
  • the sequence motif may be an amino acid sequence of YxxL / I.
  • the sequence motif may be multiplexed into the first and / or second signaling portion.
  • the first sequence motif may be located at a position 1 to 200 amino acids away from the start position of the first signal generator.
  • the second sequence motif may be at a position 1 to 200 amino acids away from the start position of the second signaling portion.
  • the spacing between each sequence motif may be 1 to 15 amino acids in number.
  • the spacing between each preferred sequence motif is the number of 6 to 8 amino acids.
  • the first and / or second signal generator may be CD3 ⁇ .
  • the first and / or second signal generator may be Fc ⁇ RI ⁇ .
  • the first and / or second signal generator may generate an immune response signal only when certain conditions are satisfied.
  • Specific conditions may be that the antigen recognition unit recognizes the antigen.
  • Certain conditions may be that the antigen recognition site forms a bond with the antigen.
  • Specific conditions may be that the signal generated when the antigen recognition unit and the antigen form a bond.
  • Specific conditions may be that the antigen recognition unit recognizes or binds the antigen and then separates it.
  • the immune response signal may be a signal related to the growth and differentiation of immune cells.
  • the immune response signal may be a signal associated with the death of immune cells.
  • the immune response signal may be a signal related to the activity of immune cells.
  • the immune response signal may be a signal associated with the assistance of the immune response.
  • the immune response signal may be specifically activated by a signal generated by the antigen recognition unit.
  • the immune response signal may be a signal that regulates expression of a target gene.
  • the immune response signal may be a signal that suppresses the immune response.
  • the signal generator may include an additional signal generator.
  • Additional signal generator means a site that generates additional immune response signals to the immune response signals generated by the first and / or second signal generator as part of the artificial receptor.
  • the additional signal generator is referred to as n-th signal generator (n ⁇ 1) in this order.
  • the artificial receptor may include an additional signal generator in addition to the first signal generator.
  • Two or more additional signal generators may be included in the artificial receptor.
  • the additional signal generator may be a structure that generates 4-1BB, CD27, CD28, ICOS, OX40 or other immune response signal.
  • the conditions under which the additional signal generator generates the immune response signal and the characteristics of the generated immune response signal include contents corresponding to the immune response signal of the first and / or second signal generator.
  • the immune response signal may be to promote the synthesis of cytokines.
  • the immune response signal may be to promote or inhibit the secretion of cytokines.
  • the cytokine may be preferably IL-2, TNF ⁇ or IFN- ⁇ .
  • the immune response signal may be a signal that helps growth or differentiation of other immune cells.
  • Immune response signals may be signals that regulate the activity of other immune cells.
  • the immune response signal may be a signal that attracts other immune cells to the location where the signal occurs.
  • the present invention encompasses all possible binding relationships of artificial receptors.
  • embodiments of the artificial receptor of the present invention are not limited to those mentioned herein.
  • the artificial receptor may be comprised of an antigen recognition portion-receptor body portion-first signaling portion.
  • the receptor body may optionally be included.
  • the artificial receptor may be composed of an antigen recognition unit-receptor body portion-second signal generator-first signal generator.
  • the receptor body may optionally be included. In this case, the positions of the first signal generator and the second signal generator may be changed.
  • the artificial receptor may be composed of an antigen recognition unit-receptor body portion-second signal generator-third signal generator-first signal generator.
  • the receptor body may optionally be included. In this case, the positions of the first signal generator to the third signal generator may be changed.
  • the number of signal generators in the artificial receptor is not limited to one to three, but may be included in more than three.
  • the artificial receptor may have a structure of an antigen recognition unit-signal generator-receptor body.
  • the structure may be advantageous when it is necessary to generate an immune response signal that acts extracellularly with the artificial receptor.
  • Co receptors may function corresponding to wild receptors.
  • the artificial receptor may function to form a specific positional relationship by forming a bond with a specific antigen.
  • Artificial receptors may function to recognize specific antigens and generate immune response signals that promote immune responses to specific antigens.
  • Artificial receptors can function to suppress the immune response to cells in the body by recognizing antigens in general body cells.
  • the artificial receptor may optionally include a signal sequence.
  • the receptor may help the receptor to be easily located on the immune cell membrane.
  • the receptor in the immune cell contains the signal sequence of the transmembrane protein, the receptor may help to pass through the membrane of the immune cell and position it on the outer membrane of the immune cell.
  • the artificial receptor may comprise one or more signal sequences.
  • the signal sequence may include many positively charged amino acids.
  • the signal sequence may comprise a positively charged amino acid at a position near the N or C terminus.
  • the signal sequence may be a signal sequence of the transmembrane protein.
  • the signal sequence may be a signal sequence of a protein located on the outer membrane of an immune cell.
  • the signal sequence may be included in the structure of the artificial receptor, that is, the antigen recognition unit, the receptor body, the first signal generator, and the additional signal generator.
  • the signal sequence may be located near the N or C terminal of each structure.
  • the distance from the N or C terminal may be about 100 amino acids.
  • the cell may be modified to include a specific T cell receptor (TCR) gene.
  • TCR T cell receptor
  • the TCR is a tumor associated antigen (eg, melanoma antigen recognized by T cells 1), MAGEA3 (melanoma-associated antigen3), NY-ESOl, carcinoembryonic antigen (CEA), GP100, etc.
  • NY-ES-Ol, melanoma may have binding specificity.
  • the cell may be modified to include a specific chimeric antigen receptor (CAR).
  • CAR is a tumor associated antigen (eg, CD 19, CD20, carbonic anhydrase IX (CAIX), CD 171, CEA, ERBB2, GD2, alpha-folate receptor, Lewis Y antigen, prostate specific membrane antigen (PSMA) Or tumor associated glycoprotein 72 (TAG72).
  • a tumor associated antigen eg, CD 19, CD20, carbonic anhydrase IX (CAIX), CD 171, CEA, ERBB2, GD2, alpha-folate receptor, Lewis Y antigen, prostate specific membrane antigen (PSMA) Or tumor associated glycoprotein 72 (TAG72).
  • PSMA prostate specific membrane antigen
  • TAG72 tumor associated glycoprotein 72
  • the cell may be modified to bind to one or more of the following tumor antigens, eg, by TCR or CAR.
  • Tumor antigens include, but are not limited to, AD034, AKT1, BRAP, CAGE, CDX2, CLP, CT-7, CT8 / HOM-TES-85, cTAGE-1, EGFR, EGFRvIII, Fibulin-1, HAGE , HCA587 / MAGE-C2, hCAP-G, HCE661, HER2 / neu, HLA-Cw, HOM-HD-21 / Galectin9, HOM-MEEL-40 / SSX2, HOM-RCC-3.1.3 / CAXII, HOXA7, HOXB6 , Hu, HUB 1, KM-HN-3, KM-KN-1, KOC1, KOC2, KOC3, KOC3, LAGE-1, MAGE-1, MAGE-4a, MPPl 1, MSLN, NNP-1, NY-BR -1, NY-BR-62, NY-BR-85, NY-CO-37, NY-CO-38, NY-ESO-1, NY-ESO-5
  • Antigen binding regulatory elements antigen binding regulating element
  • the cells of the present invention may further comprise an "antigen binding regulatory element".
  • an “antigen binding regulatory element” is an element that enables binding between a receptor and an antigen, and may be a gene or a protein that performs this function.
  • HVGD host HVGD (graft disease)
  • HostGraft in which an immune response to externally manipulated cells is activated and the therapeutic effect is lost.
  • the antigen binding regulatory element may be a protein or gene related to the structure of the receptor.
  • the antigen binding regulatory element may be a protein or gene homologous to the structure of the receptor.
  • the antigen binding regulatory element may be dCK.
  • the antigen binding regulatory element may be CD52.
  • the antigen binding regulatory element may be B2M.
  • An antigen binding regulatory element may be a protein or gene associated with a construct recognized by a receptor.
  • the antigen binding regulatory element may be an MHC protein.
  • One embodiment of the present invention is an immune cell comprising the artificially engineered immunoregulatory genes or proteins they express.
  • the artificially engineered immunoregulatory genes or proteins they express And immune cells comprising receptors.
  • Representative examples of the cells of the present invention are immune cells.
  • the immune cells may include peripheral blood mononuclear cells (PBMCs), natural killer cells, NK cells, monocytes, T cells, CAR-T cells, macrophages, NKT cells ( Natural killer T cell) may be one or more selected from the group consisting of.
  • PBMCs peripheral blood mononuclear cells
  • natural killer cells NK cells
  • monocytes T cells
  • CAR-T cells CAR-T cells
  • macrophages NK cells
  • NKT cells Natural killer T cell
  • the cells may be T cells, CAR-T cells, natural killer cells or natural killer T cells.
  • T cells T cells
  • NK cells NKT cells
  • immune cell proliferation eg, limited proliferation of immune cells after adoptive delivery
  • immune cell survival eg, induction of apoptosis of immune cells by a factor in the tumor environment
  • immune cell function eg, cytotoxic immune cell function by inhibitors secreted by host immune cells and cancer cells.
  • one or more immune cell expression genes for example one or more genes selected from the group consisting of PD-1, CTLA-4, TNFAIP3, DGKA, DGKZ, Fas, EGR2, PPP2R2D, PSGL-1, KDM6A, and TET2 Is inactivated and regulates these limiting factors through immune cells.
  • one or more immune cell expression genes such as PD-1, CTLA-4, TNFAIP3, DGKA, DGKZ, Fas, EGR2, PPP2R2D, PSGL-1, KDM6A and / or TET2 genes are used to propagate one or more immune cells. Targeted and manipulated to knock out, knock down or knock in each independently to affect survival, function.
  • DGKA and DGKZ were knocked out simultaneously.
  • one or more immune cell expression genes such as PD-1, CTLA-4, TNFAIP3, DGKA, DGKZ, Fas, EGR2, PPP2R2D, PSGL-1, KDM6A and / or TET2 genes are non-coding or coding regions, Affecting the proliferation, survival, and function of one or more immune cells, for example by targeting promoter regions, enhancers, 3'UTRs, and / or polyadenylation signal sequences, or transcription sequences such as intron or exon sequences To be knocked out, knocked down or knocked-in independently.
  • one or more immune cell expression genes such as PD-1, CTLA-4, TNFAIP3, DGKA, DGKZ, Fas, EGR2, PPP2R2D, PSGL-1, KDM6A and / or TET2 gene, are present at one or more sites in the sequence.
  • the targets can be engineered to be knocked out, knocked down, or knocked down independently to affect the proliferation, survival, and function of one or more immune cells.
  • another aspect of the present invention is the artificially engineered immunomodulatory element; And / or the immune system, which forms an immune response mechanism, to which cells comprising the same are involved.
  • immune system of the present invention is a term that includes all the phenomena that affect the body's immune response by altering the function of artificially engineered immunoregulatory elements, ie, involved in mechanisms that exhibit new immune efficacy. It includes all materials, compositions, methods and uses that are directly or indirectly involved in such immune system. For example, all genes involved in innate, adaptive, cellular, humoral, active and passive immune responses, immune cells and immune organs / tissues are included.
  • immune system factor Each of the elements that make up this immune system are collectively referred to as an "immune system factor.”
  • the immune system of the present invention includes manipulated immune cells.
  • Manipulated immune cells refer to immune cells that have been artificially manipulated rather than natural. Recently, techniques for enhancing immune efficacy by extracting immune cells from the body and applying artificial manipulations have been actively studied. Immune cells that have been manipulated in this way are excellent in their immune efficacy against certain diseases, and thus are being highlighted as new treatment methods. In particular, research on engineered immune cells has been actively conducted in connection with the treatment of cancer.
  • the engineered immune cells may be functionally engineered immune cells or artificial structure-added immune cells.
  • Engineered immune cells ( functionally manipulated immune cell )
  • Wild-type immune cell of the present invention means that the wild-receptor or immunoregulatory element is engineered in nature as an immune cell.
  • immune cells include not only immune cells that have already differentiated but also cells before differentiation (e.g., stem cells).
  • the engineered immune cells may be immune cells engineered with wild receptors.
  • the wild receptor may be TCR.
  • the engineered immune cell may be one in which the wild receptor is absent or present in lesser proportions.
  • the engineered immune cells may be ones in which the wild receptors are present in more proportions on the surface.
  • the engineered immune cells may be enhanced in the ability of wild receptors to recognize specific antigens.
  • the engineered immune cells may be immune cells engineered with immunoregulatory elements.
  • Functionally engineered immune cells may be engineered immune cell activity regulatory elements.
  • the functional immune cells may be immune cells in which one or more selected from SHP-1, PD-1, CTLA-4, CBLB, ILT-2, KIR2DL4, and PSGL-1 are inactivated.
  • Functionally engineered immune cells may be engineered immune cell growth regulators.
  • the functional immune cells may be immune cells in which at least one selected from DGK-alpha, DGK-zeta, Fas, EGR2, Egr3, PPP2R2D, and A20 is inactivated.
  • a preferred embodiment is to inactivate one or more selected from DGK-alpha, DGK-zeta, EGR2, PPP2R2D, A20.
  • Functionally engineered immune cells may be engineered immune cell death regulatory elements.
  • the functional immune cells may be immune cells in which at least one selected from Daxx, Bim, Bid, BAD, PD-1, and CTLA-4 is inactivated.
  • the engineered immune cells may be immune cells inserted elements that induce self-killing.
  • Functionally engineered immune cells may have been engineered immune cell loss factor.
  • the functional immune cells may be immune cells in which one or more selected from TET2 and Wnt Akt are inactivated.
  • Functionally engineered immune cells may be engineered cytokine secretion elements.
  • Functionally engineered immune cells may be engineered antigen binding regulatory elements.
  • the functional immune cells may be immune cells in which at least one selected from among dCK, CD52, B2M, and MHC is inactivated.
  • the engineered immune cells may be engineered with immunoregulatory elements other than those mentioned above.
  • Functionally engineered immune cells may be one or more immunomodulatory elements are manipulated simultaneously. At this time, one or more kinds of immunoregulatory elements may be manipulated.
  • one immunomodulatory element when one immunomodulatory element is manipulated, one kind of new immune effect does not have to appear. Manipulation of one immunoregulatory element may result in or inhibit several new immune effects.
  • the new immunopotency may be a controlled ability to recognize specific antigens.
  • the new immunopotency may be an improved ability to recognize specific antigens.
  • the specific antigen may be an antigen of a disease.
  • it may be an antigen of cancer cells.
  • the new immunopotency may be a decrease in the ability to recognize certain antigens.
  • the new immune efficacy may be an improved immune capacity.
  • the new immune effect may be that of the growth of immune cells.
  • the immune effect may be to promote or alleviate the growth and differentiation of immune cells.
  • the new immunopotency may be a controlled killing of immune cells.
  • the immune effect may be to prevent the death of immune cells.
  • the immune efficacy may be to allow the immune cells to die on their own after a suitable time.
  • the new immunopotential may be one in which immune cells lose their function.
  • the new immunopotential may be a regulated cytokine secretion of immune cells.
  • the immune effect may be to promote or inhibit the secretion of cytokines.
  • the new immunopotency may be to modulate the antigen binding capacity of the wild receptor in immune cells.
  • the immunogenic effect may be to improve the specificity of the wild receptor for a specific antigen.
  • Immunomedianic immune cell refers to the addition of artificial structures in immune cells.
  • the prosthetic immune cells may be immune cells to which an artificial receptor has been added.
  • the artificial receptor may be capable of recognizing antigens of certain diseases.
  • the structure-added immune cells may be CAR-T cells.
  • each artificial receptor may be one that is expressed in time series according to the conditions.
  • the first artificial receptor may generate an immune response signal that initiates the expression of the second artificial receptor gene, and then the second artificial receptor may be expressed.
  • the second artificial receptor may produce an immune response signal that induces an immune response against cancer cells.
  • the cancer cell attack ability of the engineered immune cells can be improved.
  • Artificial receptors may be capable of recognizing engineered immune cells.
  • Artificial receptors may be capable of recognizing general body cells.
  • the structure-added immune cells may be iCAR-T cells.
  • the artificial receptor may be capable of recognizing a third substance.
  • the third substance may have the ability to bind to the antigen of a specific disease.
  • the third substance may bind to the artificial receptor and at the same time may bind to the antigen of a specific disease.
  • it may have the ability to bind to cancer cell antigens simultaneously with the artificial receptor.
  • the artificial structure-added immune cell may be an immune cell added with an artificial structure having a specific function, in addition to the artificial receptor.
  • artificial immune cells When artificial immune structures are added to immune cells, artificial immune cells may have new immune effects.
  • the new immunopotency may be to bind specific antigens so that immune cells are in a specific positional relationship with the antigen.
  • the new immune potency may be a function of recognizing a specific antigen and promoting an immune response against the specific antigen.
  • the new immunopotency may be a function of suppressing excessive immune responses.
  • the new immunopotency may be a function of regulating the pathway of the immune response.
  • the new immune effect may be a function of forming a bond with a third substance to identify a specific disease.
  • the third material may be a biomarker of a specific disease.
  • One preferred example of the specific antigens mentioned above may be antigens of cancer cells.
  • Antigens of cancer cells include, but are not limited to, AD034, AKT1, BRAP, CAGE, CDX2, CLP, CT-7, CT8 / HOM-TES-85, cTAGE-1, EGFR, EGFRvIII, Fibulin-1, HAGE, HCA587 / MAGE-C2, hCAP-G, HCE661, HER2 / neu, HLA-Cw, HOM-HD-21 / Galectin9, HOM-MEEL-40 / SSX2, HOM-RCC-3.1.3 / CAXII, HOXA7, HOXB6, Hu, HUB 1, KM-HN-3, KM-KN-1, KOC1, KOC2, KOC3, KOC3, LAGE-1, MAGE-1, MAGE-4a, MPPl 1, MSLN, NNP-1, NY-BR-1, NY-BR-62, NY-BR-85, NY-CO-37, NY-CO-38, NY-ESO-1, NY-ESO-5, NY-
  • Combination type immune cells ( hybrid manipulated immune cell )
  • a “complex operated immune cell” refers to a cell in which both immunomodulatory elements and artificial structures are added as immune cells.
  • Manipulation of immunoregulatory elements in multimodal immune cells is as described for functionally engineered immune cells.
  • the addition of the artificial structure is as described for the artificial structure-added immune cells.
  • the position where the artificial structure is added may be the same as the position of the gene where the manipulation took place.
  • the new immunological efficacy of the hybridized immune cells may include new immune effects of the functionally engineered immune cells and the artificial structure-added immune cells, and may be further improved by the interaction between them.
  • Improved immune efficacy may be to improve the specificity and immune response to a particular disease.
  • the multi-engineered immune cell may be one that has enhanced specificity and immune response to cancer.
  • the immune system of the present invention comprises a desired immune response and thereby a disease treatment mechanism made by an engineered immunoregulatory element and / or a manipulated immune cell.
  • it may be used to influence immune cell proliferation using immunoregulatory elements and / or engineered immune cells that inactivate genes that inhibit immune cell proliferation.
  • it may be used to influence immune cell survival using immunoregulatory elements and / or engineered immune cells that inactivate genes that mediate immune cell apoptosis.
  • it may be used to influence immune cell function using immunoregulatory elements and / or engineered immune cells that have inactivated genes encoding immunosuppressive and inhibitory signaling factors.
  • compositions discussed herein affect one or more of the factors that limit the efficacy of genetically modified immune cells as therapeutic agents for a particular disease, such as immune cell proliferation, immune cell survival, immune cell function, or any combination thereof. It can be used individually or in combination to drive.
  • immuno-regulating therapy refers to the treatment of diseases by controlling the immune response in the body by using an engineered immunoregulatory element and / or engineered immune cells.
  • diseases can be treated by activating or inactivating an immune response in the body using immune cells such as dendritic cells, natural killer cells, and T cells.
  • immune cells such as dendritic cells, natural killer cells, and T cells.
  • immunomodulatory therapies are mainly developed as an indication for cancer treatment, and by directly injecting immune cells to the patient to activate immune function, and thus obtain a therapeutic effect, the immunomodulatory therapy is different from the conventional surgery, chemotherapy or radiation therapy used in cancer treatment. It is a different therapeutic mechanism.
  • immunomodulatory therapy includes dendritic immunomodulatory cell therapies, lymphokine activated cells (LAKs), tumor infiltrating T cells (tumor), depending on the immune cells used and the genes introduced into the cells in the manufacturing process.
  • LAKs lymphokine activated cells
  • tumor infiltrating T cells tumor infiltrating T cells
  • TIL T lymphocytle
  • TCR-T T cell receptor-modified T cells
  • CAR-T chimeric antigen receptor-modified T cells
  • the manipulation or modification of the immunomodulatory elements, immune cells, and substances involved in the immune system of the present invention may be accomplished, preferably through genetic manipulation.
  • compositions and methods can be provided that target and genetically engineer some or all of the non-coding or coding regions of an immunoregulatory gene that affect the proliferation, survival and / or function of immune cells.
  • one or more of the immunoregulatory genes involved therein can be engineered or modified for formation of a desired immune system. This can be done through modification of the nucleic acids that make up the gene. As a result of the operation, knock down, knock out, and knock in forms are all included.
  • a promoter region, or transcriptional sequence, such as an intron or exon sequence can be targeted.
  • Coding sequences, such as coding regions, initial coding regions, can be targeted for alteration and knockout of expression.
  • the nucleic acid modification is one or more nucleotides, such as 1 to 30 bp, 1 to 27 bp, 1 to 25 bp, 1 to 23 bp, 1 to 20 bp, 1 to 15 bp, 1 to 10 bp, 1 to 5 bp, 1 to 3 bp, or Substitution, deletion, and / or insertion of 1 bp of nucleotides.
  • a deletion in one or more of the immunoregulatory genes to knock out one or more of the immunoregulatory genes, or to eliminate one or more expressions, or to knock out one or more one or two alleles Or targeted to include mutations.
  • gene knockdown can be used to reduce expression of unwanted alleles or transcripts.
  • it can be used to alter immunoregulatory genes that affect immune cell function by targeting non-coding sequences of promoters, enhancers, introns, 3'UTRs, and / or polyadenylation signals.
  • said gene nucleic acid alteration may result in the regulation of activity, such as activation or inactivation of an immunoregulatory gene.
  • said genetic nucleic acid modification may be to inactivate the targeted gene by catalyzing single stranded or double stranded cleavage, i.e., nucleic acid strand damage, of a specific site within the gene targeted by the guide nucleic acid-editor protein complex.
  • nucleic acid strand breaks can be repaired through mechanisms such as homologous recombination or nonhomologous end joining (NHEJ).
  • NHEJ nonhomologous end joining
  • the invention may provide said genetically engineered site.
  • an NHEJ-mediated alteration refers to a position within said gene that results in a reduction or elimination of the expression of an immunoregulatory gene product.
  • the genetic manipulation may be performed in consideration of a gene expression control process.
  • RNA processing regulation RNA processing regulation
  • RNA transport regulation RNA degradation regulation
  • translation regulation protein modification regulation step
  • RNAi RNA interference or RNA silencing
  • sRNAs small RNAs
  • Expression can be controlled.
  • nucleic acid-editor protein complexes capable of catalyzing the hydrolysis (cleavage) of bonds between nucleic acids in DNA or RNA molecules, preferably DNA molecules.
  • Guide nucleic acid-editor protein complexes can be used.
  • At least one nuclease selected from the group consisting of meganuclease, zinc finger nuclease, CRISPR / Cas9 (Cas9 protein), CRISPR-Cpf1 (Cpf1 protein), and TALE-nuclease.
  • Genes can be manipulated using clease to control the expression of genetic information.
  • Preferred examples include, but are not limited to, non-homologous end joining (NHEJ) or homologous recombination repair using a guide nucleic acid-editor protein complex, for example, using a CRISPR / Cas system. homology-directed repair (HDR).
  • NHEJ non-homologous end joining
  • HDR homology-directed repair
  • immunomodulatory genes that affect the proliferation, survival and / or function of immune cells include PD-1 gene, CTLA-4 gene, TNFAIP3 gene, DGKA gene, DGKZ gene, Fas gene, EGR2 gene, PPP2R2D gene. , TET2 gene, PSGL-1 gene and KDM6A gene.
  • Target sequence sites of the genes that is, sites where nucleic acid modification can occur are summarized in Table 1 below (with the target sequence sites described in Table 1 including PAM sequence 5′-NGG-3 ′ at the 3 ′ end). Listed)
  • the said target sequence can target two or more types simultaneously.
  • the said gene can target 2 or more types simultaneously.
  • Two or more target sequences in the homologous gene or two or more target sequences in the heterologous gene can be targeted simultaneously.
  • DGKa or DGKz may be targeted, respectively.
  • DGKa and DGKz may be simultaneously targeted.
  • Guide nucleic acid-editor protein complex means a complex formed through the interaction of a guide nucleic acid and an editor protein, and the nucleic acid-protein complex includes a guide nucleic acid and an editor protein.
  • guide nucleic acid refers to a nucleic acid capable of recognizing a target nucleic acid, gene, chromosome or protein.
  • the guide nucleic acid may be in the form of DNA, RNA or DNA / RNA mixture, and may have 5 to 150 nucleic acid sequences.
  • the guide nucleic acid may comprise one or more domains.
  • the domain may be a guide domain, a first complementary domain, a connecting domain, a second complementary domain, a proximal domain, a tail domain, or the like, but is not limited thereto.
  • the guide nucleic acid may include two or more domains, and may include the same domain repeatedly or include different domains.
  • the guide nucleic acid may be one continuous nucleic acid sequence.
  • one contiguous nucleic acid sequence may be (N) m, where N is A, T, C or G, or A, U, C or G, and m means an integer from 1 to 150 .
  • the guide nucleic acid may be two or more consecutive nucleic acid sequences.
  • two or more consecutive nucleic acid sequences may be (N) m and (N) o, where N is A, T, C or G, or A, U, C or G, and m and o are It means an integer of 1 to 150, m and o may be the same or different from each other.
  • editor protein refers to a peptide, polypeptide or protein that can bind directly to a nucleic acid or not, but not directly.
  • the editor protein may also be conceptually referred to as “genetic scissors” or RGEN (RNA-Guided Endonuclease).
  • the editor protein may be an enzyme.
  • the editor protein may be a fusion protein.
  • fusion protein refers to a protein produced by fusing an enzyme and an additional domain, peptide, polypeptide or protein.
  • enzyme refers to a protein including a domain capable of cleaving a nucleic acid, gene, chromosome or protein.
  • the additional domain, peptide, polypeptide or protein may be a functional domain, peptide, polypeptide or protein having the same or different function as the enzyme.
  • the fusion protein is at or near the amino terminus of the enzyme; At or near the carboxy terminus; Middle part of an enzyme; Or may comprise additional domains, peptides, polypeptides or proteins in one or more of these combinations.
  • the fusion protein is at or near the amino terminus of the enzyme; At or near the carboxy terminus; Middle part of an enzyme; Or one or more of these combinations may comprise a functional domain, peptide, polypeptide or protein.
  • Guide nucleic acid-editor protein complexes can modify a subject.
  • the subject may be a target nucleic acid, gene, chromosome or protein.
  • the guide nucleic acid-editor protein complex may ultimately regulate (eg, inhibit, inhibit, decrease, increase or promote) expression of a target protein, or may remove or express a new protein. To be able.
  • the guide nucleic acid-editor protein complex may act at the DNA, RNA, gene or chromosome level.
  • the guide nucleic acid-editor protein complex may act at the stage of transcription and translation of the gene.
  • the guide nucleic acid-editor protein complex may act at the protein level.
  • Guide nucleic acids are nucleic acids capable of recognizing target nucleic acids, genes, chromosomes or proteins, forming guide nucleic acid-protein complexes.
  • the guide nucleic acid serves to recognize or target the nucleic acid, gene, chromosome or protein to which the guide nucleic acid-protein complex is targeted.
  • the guide nucleic acid may be in the form of DNA, RNA or DNA / RNA mixture, and may have 5 to 150 nucleic acid sequences.
  • the guide nucleic acid may be linear or circular.
  • the guide nucleic acid may be one continuous nucleic acid sequence.
  • one contiguous nucleic acid sequence may be (N) m, where N is A, T, C or G, or A, U, C or G, and m means an integer from 1 to 150 .
  • the guide nucleic acid may be two or more consecutive nucleic acid sequences.
  • two or more consecutive nucleic acid sequences may be (N) m and (N) o, where N is A, T, C or G, or A, U, C or G, and m and o are It means an integer of 1 to 150, m and o may be the same or different from each other.
  • the guide nucleic acid may comprise one or more domains.
  • the domain may be a guide domain, a first complementary domain, a connecting domain, a second complementary domain, a proximal domain, a tail domain, and the like, but is not limited thereto.
  • the guide nucleic acid may include two or more domains, and may include the same domain repeatedly or include different domains.
  • a “guide domain” is a domain containing complementary guide sequences capable of complementary binding to a target sequence on a target gene or nucleic acid, and serves for specific interaction with the target gene or nucleic acid.
  • the guide sequence is a nucleic acid sequence that is complementary to the target sequence on the target gene or nucleic acid, for example at least 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% or 95 It may be at least% complementary or completely complementary nucleic acid sequence.
  • the guide domain may be 5 to 50 base sequences.
  • the guide domain is 5 to 50 base sequences, 10 to 50 base sequences, 15 to 50 base sequences, 20 to 50 base sequences, 25 to 50 base sequences, 30 to 50 base sequences, 35 To 50 nucleotide sequences, 40 to 50 nucleotide sequences, or 45 to 50 nucleotide sequences.
  • the guide domain includes 1 to 5 base sequences, 5 to 10 base sequences, 10 to 15 base sequences, 15 to 20 base sequences, 20 to 25 base sequences, 25 to 30 base sequences, It may be 30 to 35 base sequences, 35 to 40 base sequences, 40 to 45 base sequences or 45 to 50 base sequences.
  • the guide domain may comprise a guide sequence.
  • the guide sequence may be a complementary base sequence capable of complementary binding to the target sequence on the target gene or nucleic acid.
  • the guide sequence may be a nucleic acid sequence that is complementary to the target sequence on the target gene or nucleic acid, for example at least 70%, 75%, 80%, 85%, 90% or 95% or more complementary or completely complementary. Nucleic acid sequence.
  • the guide sequence may be 5 to 50 nucleotide sequences.
  • the guide domain is 5 to 50 base sequences, 10 to 50 base sequences, 15 to 50 base sequences, 20 to 50 base sequences, 25 to 50 base sequences, 30 to 50 base sequences, 35 To 50 nucleotide sequences, 40 to 50 nucleotide sequences, or 45 to 50 nucleotide sequences.
  • the guide sequence is 1 to 5 base sequences, 5 to 10 base sequences, 10 to 15 base sequences, 15 to 20 base sequences, 20 to 25 base sequences, 25 to 30 base sequences, It may be 30 to 35 base sequences, 35 to 40 base sequences, 40 to 45 base sequences or 45 to 50 base sequences.
  • the guide domain may include a guide sequence and an additional nucleotide sequence.
  • the additional base sequence may be for improving or decreasing the function of the guide domain.
  • the additional base sequence may be for improving or decreasing the function of the guide sequence.
  • the additional base sequence may be 1 to 35 base sequences.
  • the additional base sequence may be 5 to 35 base sequences, 10 to 35 base sequences, 15 to 35 base sequences, 20 to 35 base sequences, 25 to 35 base sequences, or 30 to 35 base sequences. Can be.
  • the additional base sequence is 1 to 5 base sequences, 5 to 10 base sequences, 10 to 15 base sequences, 15 to 20 base sequences, 20 to 25 base sequences, 25 to 30 base sequences Or 30 to 35 base sequences.
  • the additional base sequence may be located at the 5 'end of the guide sequence.
  • the additional base sequence may be located at the 3 'end of the guide sequence.
  • a “first complementary domain” is a nucleic acid sequence comprising a complementary nucleic acid sequence and a second complementary domain, and is complementary enough to form a double strand with the second complementary domain.
  • the first complementary domain may be 5 to 35 base sequences.
  • the first complementary domain may be 5 to 35 nucleotide sequences, 10 to 35 nucleotide sequences, 15 to 35 nucleotide sequences, 20 to 35 nucleotide sequences, 25 to 35 nucleotide sequences, or 30 to 35 nucleotide sequences. Can be.
  • the first complementary domain includes 1 to 5 nucleotide sequences, 5 to 10 nucleotide sequences, 10 to 15 nucleotide sequences, 15 to 20 nucleotide sequences, 20 to 25 nucleotide sequences, 25 to 30 It can be a base sequence or 30 to 35 base sequences.
  • a “linking domain” is a nucleic acid sequence that connects two or more domains, wherein the linking domain connects two or more domains that are the same or different.
  • the linking domain may be covalently or non-covalently linked to two or more domains, or may connect two or more domains covalently or non-covalently.
  • the linking domain may be 1 to 30 nucleotide sequences.
  • the linking domain may be 1 to 5 nucleotide sequences, 5 to 10 nucleotide sequences, 10 to 15 nucleotide sequences, 15 to 20 nucleotide sequences, 20 to 25 nucleotide sequences, or 25 to 30 nucleotide sequences. Can be.
  • the linking domain may include 1 to 30 nucleotide sequences, 5 to 30 nucleotide sequences, 10 to 30 nucleotide sequences, 15 to 30 nucleotide sequences, 20 to 30 nucleotide sequences, or 25 to 30 nucleotide sequences. Can be.
  • a “second complementary domain” is a nucleic acid sequence comprising a complementary nucleic acid sequence with a first complementary domain, and has a complementarity enough to form a double strand with the first complementary domain.
  • the second complementary domain includes a complementary base sequence with the first complementary domain and a base sequence without complementarity with the first complementary domain, eg, a base sequence that does not form a double strand with the first complementary domain.
  • the base sequence may be longer than the first complementary domain.
  • the second complementary domain may be 5 to 35 base sequences.
  • the second complementary domain may include 1 to 35 base sequences, 5 to 35 base sequences, 10 to 35 base sequences, 15 to 35 base sequences, 20 to 35 base sequences, and 25 to 35 bases. Sequence or 30 to 35 nucleotide sequences.
  • the second complementary domain includes 1 to 5 nucleotide sequences, 5 to 10 nucleotide sequences, 10 to 15 nucleotide sequences, 15 to 20 nucleotide sequences, 20 to 25 nucleotide sequences, and 25 to 30 nucleotide sequences. Base sequence or 30 to 35 base sequences.
  • proximal domain is a nucleic acid sequence located proximate to the second complementary domain.
  • the proximal domain may comprise complementary nucleotide sequences within the proximal domain and may form double strands by the complementary nucleotide sequences.
  • the proximal domain may be 1 to 20 nucleotide sequences.
  • the proximal domain may be 1 to 20 nucleotide sequences, 5 to 20 nucleotide sequences, 10 to 20 nucleotide sequences, or 15 to 20 nucleotide sequences.
  • the proximal domain may be 1 to 5 base sequences, 5 to 10 base sequences, 10 to 15 base sequences, or 15 to 20 base sequences.
  • the “tail domain” is a nucleic acid sequence located at one or more ends of both ends of the guide nucleic acid.
  • the tail domain may comprise complementary sequences within the tail domain, and may form double strands by complementary sequences.
  • the tail domain may be 1 to 50 nucleotide sequences.
  • the tail domain is 5 to 50 base sequences, 10 to 50 base sequences, 15 to 50 base sequences, 20 to 50 base sequences, 25 to 50 base sequences, 30 to 50 base sequences, 35 To 50 nucleotide sequences, 40 to 50 nucleotide sequences, or 45 to 50 nucleotide sequences.
  • the tail domain may include 1 to 5 base sequences, 5 to 10 base sequences, 10 to 15 base sequences, 15 to 20 base sequences, 20 to 25 base sequences, 25 to 30 base sequences, It may be 30 to 35 base sequences, 35 to 40 base sequences, 40 to 45 base sequences or 45 to 50 base sequences.
  • nucleic acid sequences included in the domains may include selective or additional chemical modification. have.
  • the chemical modification may be methylation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid (LNA), 2'-O-methyl 3'phosphorothioate (MS) or 2'-O-methyl 3'thioPACE (MSP). It is not limited.
  • Guide nucleic acids include one or more domains.
  • the guide nucleic acid may include a guide domain.
  • the guide nucleic acid may comprise a first complementary domain.
  • the guide nucleic acid may comprise a linking domain.
  • the guide nucleic acid may comprise a second complementary domain.
  • the guide nucleic acid may comprise a proximal domain.
  • the guide nucleic acid may comprise a tail domain.
  • the number of domains may be 1, 2, 3, 4, 5, 6 or more.
  • the guide nucleic acid may include 1, 2, 3, 4, 5, 6 or more guide domains.
  • the guide nucleic acid may comprise one, two, three, four, five, six or more first complementary domains.
  • the guide nucleic acid may comprise 1, 2, 3, 4, 5, 6 or more linking domains.
  • the guide nucleic acid may comprise one, two, three, four, five, six or more second complementary domains.
  • the guide nucleic acid may comprise 1, 2, 3, 4, 5, 6 or more proximal domains.
  • the guide nucleic acid may comprise 1, 2, 3, 4, 5, 6 or more tail domains.
  • the guide nucleic acid may be included by overlapping one domain.
  • the guide nucleic acid may be included without overlapping or overlapping multiple domains.
  • the guide nucleic acid may include the same kind of domain, wherein the same kind of domain may have the same nucleic acid sequence or different nucleic acid sequences.
  • the guide nucleic acid may include two kinds of domains, wherein the other two kinds of domains may have different nucleic acid sequences or the same nucleic acid sequences.
  • the guide nucleic acid may include three kinds of domains, wherein the other three kinds of domains may have different nucleic acid sequences or the same nucleic acid sequences.
  • the guide nucleic acid may include four kinds of domains, wherein the other four kinds of domains may have different nucleic acid sequences or the same nucleic acid sequences.
  • the guide nucleic acid may include five kinds of domains, wherein the other five kinds of domains may have different nucleic acid sequences or the same nucleic acid sequences.
  • the guide nucleic acid may include six kinds of domains, wherein the other six kinds of domains may have different nucleic acid sequences or the same nucleic acid sequences.
  • the guide nucleic acid is [guide domain]-[first complementary domain]-[linking domain]-[second complementary domain]-[linking domain]-[guide domain]-[first complementary domain] -[Linking domain]-[second complementary domain], wherein the two guide domains may comprise guide sequences for different or identical targets, and the two first complementary domains Two second complementary domains may have the same nucleic acid sequence or different nucleic acid sequences.
  • the guide domains contain guide sequences for different targets, the guide nucleic acids can specifically bind to two targets, where specific binding can occur simultaneously or sequentially.
  • the linking domain may be cleaved by a specific enzyme, and in the presence of a specific enzyme, the guide nucleic acid may be divided into two parts or three parts.
  • gRNA As an embodiment of the guide nucleic acid of the present invention, gRNA is described below.
  • GRNA refers to a gRNA-CRISPR enzyme complex, ie, a specific targeting nucleic acid of a CRISPR complex, to a target gene or nucleic acid.
  • the gRNA refers to a target gene or nucleic acid specific RNA, and can bind to the CRISPR enzyme to direct the CRISPR enzyme to the target gene or nucleic acid.
  • the gRNA may comprise a plurality of domains. Each domain allows for intra- or inter-strand interaction of three-dimensional behavior or active forms of gRNAs.
  • gRNAs include single-stranded gRNAs (single RNA molecules); Or double gRNA (comprising more than one typically two separate RNA molecules).
  • the single stranded gRNA comprises a guide domain in the 5 'to 3' direction, ie, a domain comprising a guide sequence capable of complementary binding to a target gene or nucleic acid; A first complementary domain; Connecting domains; A second complementary domain, a domain having a sequence complementary to the first complementary domain sequence and thus capable of forming a double stranded nucleic acid with the first complementary domain; Proximal domain; And optionally a tail domain.
  • the dual gRNA comprises a guide domain from the 5 'to 3' direction, ie a domain comprising a guide sequence capable of complementary binding to a target gene or nucleic acid and a first complementary domain.
  • the first strand and a second complementary domain, a domain having a sequence complementary to the first complementary domain sequence, capable of forming a double stranded nucleic acid with the first complementary domain, and a proximal domain; And optionally a second strand comprising a tail domain.
  • the first strand may be referred to as crRNA
  • the second strand may be referred to as tracrRNA.
  • the crRNA may comprise a guide domain and a first complementary domain
  • the tracrRNA may comprise a second complementary domain, a proximal domain and optionally a tail domain.
  • the single stranded gRNA comprises a guide domain in the 3 'to 5' direction, ie, a domain comprising a guide sequence capable of complementary binding to a target gene or nucleic acid; A first complementary domain; And a second complementary domain having a sequence complementary to the first complementary domain sequence and thus capable of forming a double stranded nucleic acid with the first complementary domain.
  • the guide domain comprises a complementary guide sequence capable of complementary binding to the target sequence on the target gene or nucleic acid.
  • the guide sequence is a nucleic acid sequence that is complementary to the target sequence on the target gene or nucleic acid, for example at least 70%, 75%, 80%, 85%, 90% or 95% or more complementary or completely complementary nucleic acid sequence. Can be.
  • the guide domain is believed to play a role in specific interactions with the target gene or nucleic acid of the gRNA-Cas complex, ie the CRISPR complex.
  • the guide domain may be 5 to 50 base sequences.
  • the guide domain has 16 nucleotide sequences, 17 nucleotide sequences, 18 nucleotide sequences, 19 nucleotide sequences, 20 nucleotide sequences, 21 nucleotide sequences, 22 nucleotide sequences, 23 nucleotide sequences, 24 It can be a base sequence or 25 base sequences.
  • the guide domain comprises 16 base sequences, 17 base sequences, 18 base sequences, 19 base sequences, 20 base sequences, 21 base sequences, 22 base sequences, 23 base sequences, It may include 24 base sequences or 25 base sequences.
  • the guide domain may include a guide sequence.
  • the guide sequence may be a complementary base sequence capable of complementary binding to the target sequence on the target gene or nucleic acid.
  • the guide sequence may be a nucleic acid sequence that is complementary to the target sequence on the target gene or nucleic acid, for example at least 70%, 75%, 80%, 85%, 90% or 95% or more complementary or completely complementary. Nucleic acid sequence.
  • the guide sequence may be 5 to 50 nucleotide sequences.
  • the guide sequence is 16 bases, 17 bases, 18 bases, 19 bases, 20 bases, 21 bases, 22 bases, 23 bases, 24 It can be a base sequence or 25 base sequences.
  • the guide sequence comprises 16 base sequences, 17 base sequences, 18 base sequences, 19 base sequences, 20 base sequences, 21 base sequences, 22 base sequences, 23 base sequences, It may include 24 base sequences or 25 base sequences.
  • the guide domain may include a guide sequence and an additional nucleotide sequence.
  • the additional base sequence may be 1 to 35 base sequences.
  • the additional base sequence is 1 base sequence, 2 base sequences, 3 base sequences, 4 base sequences, 5 base sequences, 6 base sequences, 7 base sequences, 8 base sequences, It may be 9 nucleotide sequences or 10 nucleotide sequences.
  • the additional base sequence may be one base sequence G (guanine), or may be two base sequences GG.
  • the additional base sequence may be located at the 5 'end of the guide sequence.
  • the additional base sequence may be located at the 3 'end of the guide sequence.
  • some or all of the base sequences of the guide domains may include chemical modifications.
  • the chemical modification may be methylation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid (LNA), 2'-O-methyl 3'phosphorothioate (MS) or 2'-O-methyl 3'thioPACE (MSP). It is not limited.
  • the first complementary domain comprises a complementary nucleic acid sequence with a second complementary domain, and is complementary enough to form a double strand with the second complementary domain.
  • the first complementary domain may be 5 to 35 base sequences.
  • the first complementary domain may include 5 to 35 base sequences.
  • the first complementary domain is 5 base sequence, 6 base sequence, 7 base sequence, 8 base sequence, 9 base sequence, 10 base sequence, 11 base sequence, 12 base Sequence, 13 bases, 14 bases, 15 bases, 16 bases, 17 bases, 18 bases, 19 bases, 20 bases, 21 bases, 22 bases Sequence, 23 nucleotide sequences, 24 nucleotide sequences, or 25 nucleotide sequences.
  • the first complementary domain includes 5 base sequences, 6 base sequences, 7 base sequences, 8 base sequences, 9 base sequences, 10 base sequences, 11 base sequences, and 12 base sequences.
  • the first complementary domain may have homology with a naturally occurring first complementary domain or may be derived from a naturally occurring first complementary domain.
  • the first complementary domain may have a difference in the nucleotide sequence of the first complementary domain according to a species present in nature, may be derived from a first complementary domain including a species present in nature, or It may have some or complete homology with the first complementary domain comprising the species present in nature.
  • the first complementary domain is Streptococcus pyogenes, Campylobacter jejuni, Streptococcus thermophilus, Streptococcus aureus ) Or a first complementary domain or derived first complementary domain of Neisseria meningitides, at least 50% or at least homologous.
  • the first complementary domain when the first complementary domain is a first complementary domain of Streptococcus pyogenes or a first complementary domain derived from Streptococcus pyogenes, the first complementary domain is 5′-GUUUUAGAGCUA-3 Or may be a sequence having at least 50% or more homology with 5′-GUUUUAGAGCUA-3 ′.
  • the first complementary domain may further include (X) n, that is, 5′-GUUUUAGAGCUA (X) n-3 ′.
  • X may be selected from the group consisting of bases A, T, U, and G, wherein n is the number of base sequences, and may be an integer of 5 to 15.
  • (X) n may be repeated as many as n integers of the same base sequence, or may be an integer number of n base sequences in which bases A, T, U and G are mixed.
  • the first complementary domain when the first complementary domain is a first complementary domain of Campylobacter jejuni or a first complementary domain derived from Campylobacter jejuni, the first complementary domain is 5'-GUUUUAGUCCCUUUUUAAAUUUCUUU. It may be -3 ', or may be a nucleotide sequence having at least 50% or more homology with 5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'. In this case, the first complementary domain may further include (X) n, that is, 5′-GUUUUAGUCCCUUUUUAAAUUUCUU (X) n-3 ′.
  • X may be selected from the group consisting of bases A, T, U, and G, wherein n is the number of base sequences, and may be an integer of 5 to 15. In this case, (X) n may be repeated as many as n integers of the same base sequence, or may be an integer number of n base sequences in which bases A, T, U and G are mixed.
  • the first complementary domain is Parcubacteria bacterium (GWC2011_GWC2_44_17), Lachnospiraceae bacterium (MC2017), Butyrivibrio proteoclascus (Butyrivibcus proteoclas , Peregrinibacteria bacterium (GW2011_GWA_33_10), Acidaminococcus sp. ), Porphyromonas crevioricanis, Prevotella disiens, Moraxella bovoculi (237), Smiihella sp.
  • the first complementary domain when the first complementary domain is a first complementary domain of a Falcobacteria bacterium or a first complementary domain derived from Falcubacteria bacterium, the first complementary domain is 5′-UUUGUAGAU-3 ′ days. Or a nucleotide sequence having at least 50% or more homology with 5′-UUUGUAGAU-3 ′.
  • the first complementary domain may further include (X) n, that is, 5 ′-(X) nUUUGUAGAU-3 ′.
  • X may be selected from the group consisting of bases A, T, U and G, and n may be an integer of 1 to 5 as the number of base sequences.
  • (X) n may be repeated as many as n integers of the same base sequence, or may be an integer number of n base sequences in which bases A, T, U and G are mixed.
  • part or all of the base sequence of the first complementary domain may comprise a chemical modification.
  • the chemical modification may be methylation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid (LNA), 2'-O-methyl 3'phosphorothioate (MS) or 2'-O-methyl 3'thioPACE (MSP). It is not limited.
  • Linking domains are nucleic acid sequences that link two or more domains, and linking domains link two or more domains that are the same or different.
  • the linking domain may be covalently or non-covalently linked to two or more domains, or may connect two or more domains covalently or non-covalently.
  • the linking domain may be a nucleic acid sequence that connects the first and second complementary domains to generate a single stranded gRNA.
  • the linking domain may be covalently or non-covalently bonded to the first and second complementary domains.
  • the linking domain may connect the first and second complementary domains covalently or non-covalently.
  • the linking domain may be 1 to 30 nucleotide sequences.
  • the linking domain may include 1 to 30 nucleotide sequences.
  • the linking domain comprises 1 to 5 base sequences, 5 to 10 base sequences, 10 to 15 base sequences, 15 to 20 base sequences, 20 to 25 base sequences, or 25 to 30 base sequences. Can be.
  • the linking domain is 1 to 5 base sequences, 5 to 10 base sequences, 10 to 15 base sequences, 15 to 20 base sequences, 20 to 25 base sequences, or 25 to 30 bases. Sequences may be included.
  • the linking domain is suitable for use in single-stranded gRNA molecules and can be covalently or non-covalently linked to the first and second strands of a double gRNA, or covalently or non-covalently linked to the first and second strands.
  • Single stranded gRNAs can be used to generate.
  • the linking domain may be used to generate single-stranded gRNAs either covalently or non-covalently with the crRNA and tracrRNA of the double gRNA, or by covalently or non-covalently linking the crRNA and tracrRNA.
  • the linking domain may be homologous to or derived from a naturally occurring sequence, such as some sequences of tracrRNA.
  • some or all of the base sequences of the linking domains may include chemical modifications.
  • the chemical modification may be methylation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid (LNA), 2'-O-methyl 3'phosphorothioate (MS) or 2'-O-methyl 3'thioPACE (MSP). It is not limited.
  • the second complementary domain comprises a complementary nucleic acid sequence with the first complementary domain and is complementary enough to form a double strand with the first complementary domain.
  • the second complementary domain includes a complementary base sequence with the first complementary domain and a base sequence without complementarity with the first complementary domain, eg, a base sequence that does not form a double strand with the first complementary domain.
  • the base sequence may be longer than the first complementary domain.
  • the second complementary domain may be 5 to 35 base sequences.
  • the first complementary domain may include 5 to 35 base sequences.
  • the second complementary domain is 5 base sequence, 6 base sequence, 7 base sequence, 8 base sequence, 9 base sequence, 10 base sequence, 11 base sequence, 12 base Sequence, 13 bases, 14 bases, 15 bases, 16 bases, 17 bases, 18 bases, 19 bases, 20 bases, 21 bases, 22 bases Sequence, 23 nucleotide sequences, 24 nucleotide sequences, or 25 nucleotide sequences.
  • the second complementary domain includes 5 base sequences, 6 base sequences, 7 base sequences, 8 base sequences, 9 base sequences, 10 base sequences, 11 base sequences, and 12 base sequences.
  • the second complementary domain may have homology with a naturally occurring second complementary domain or may be derived from a naturally occurring second complementary domain.
  • the second complementary domain may have a difference in the nucleotide sequence of the second complementary domain according to a species present in nature, may be derived from a second complementary domain including a species present in nature, or It may have some or complete homology with the second complementary domain, including species present in nature.
  • the second complementary domain is Streptococcus pyogenes, Campylobacter jejuni, Streptococcus thermophilus, Streptococcus aureus ) Or a second complementary domain or derived second complementary domain of Neisseria meningitides, at least 50% or at least fully homologous.
  • the second complementary domain is a second complementary domain of Streptococcus pyogenes or a second complementary domain derived from Streptococcus pyogenes
  • the second complementary domain is 5′- UAGC AAGU UAAAA.
  • U-3 ', or 5'- UAGC AAGU UAAAA U-3' may be a sequence having at least 50% homology with at least 50% (underlined marks to form a double strand with the first complementary domain) Sequence).
  • the second complementary domain may further include (X) n or / and (X) m, that is, 5 ′-(X) n UAGC AAGU UAAAA U (X) m-3 ′.
  • the X may be selected from the group consisting of bases A, T, U and G, wherein n and m are the number of base sequences, n may be an integer of 1 to 15, and m may be 1 to 6 have.
  • (X) n may be repeated as many as n integers of the same base sequence, or may be an integer number of n base sequences in which bases A, T, U and G are mixed.
  • (X) m may be repeated as many as m integers of the same base sequence, or may be m integer sequences of base A, T, U and G mixed.
  • the second complementary domain when the first complementary domain is a second complementary domain of Campylobacter jejuni or a second complementary domain derived from Campylobacter jejuni, the second complementary domain is 5′- AAGAAAUUUAAAAAGGGACUAAAAU -3 'or 5'- AAGAAAUUUAAAAAGGGACUAAAAU -3' and may be a base sequence having at least 50% homology with at least 50% (underlined sequences to form a double strand with the first complementary domain).
  • the second complementary domain may further comprise (X) n or / and (X) m, ie 5 ′-(X) n AAGAAAUUUAAAAAGGGACUAAAAU (X) m ⁇ 3 ′.
  • X may be selected from the group consisting of bases A, T, U and G, n may be an integer of 1 to 15, and m may be 1 to 6.
  • (X) n may be repeated as many as n integers of the same base sequence, or may be an integer number of n base sequences in which bases A, T, U and G are mixed.
  • (X) m may be repeated as many as m integers of the same base sequence, or may be m integer sequences of base A, T, U and G mixed.
  • the first complementary domain is Parcubacteria bacterium (GWC2011_GWC2_44_17), Lachnospiraceae bacterium (MC2017), Butyrivibrio proteoclascus (Butyrivibcus proteoclas , Peregrinibacteria bacterium (GW2011_GWA_33_10), Acidaminococcus sp. ), Porphyromonas crevioricanis, Prevotella disiens, Moraxella bovoculi (237), Smiihella sp.
  • the second complementary domain when the second complementary domain is a second complementary domain of a Falcobacteria bacterium or a second complementary domain derived from Falcubacteria bacterium, the second complementary domain is 5′-AAAUU UCUAC U-3 Or a base sequence having at least 50% homology with at least 50% homology with 5′-AAAUU UCUAC U-3 ′ (an underlined sequence forms a double strand with the first complementary domain).
  • the second complementary domain may further include (X) n or / and (X) m, that is, 5 ′-(X) n AAAUU UCUAC U (X) m ⁇ 3 ′.
  • the X may be selected from the group consisting of bases A, T, U and G, wherein n and m are the number of base sequences, n may be an integer of 1 to 10, and m may be 1 to 6 have.
  • (X) n may be repeated as many as n integers of the same base sequence, or may be an integer number of n base sequences in which bases A, T, U and G are mixed.
  • (X) m may be repeated as many as m integers of the same base sequence, or may be m integer sequences of base A, T, U and G mixed.
  • some or all of the base sequences of the second complementary domain may comprise chemical modifications.
  • the chemical modification may be methylation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid (LNA), 2'-O-methyl 3'phosphorothioate (MS) or 2'-O-methyl 3'thioPACE (MSP). It is not limited.
  • the proximal domain is one to twenty nucleotide sequences located close to the second complementary domain and is located in the 3 ′ direction of the second complementary domain. In this case, the proximal domain may form a double-stranded bond between complementary nucleotide sequences in the proximal domain.
  • the proximal domain is 5 bases, 6 bases, 7 bases, 8 bases, 8 bases, 9 bases, 10 bases, 11 bases, 12 It can be a base sequence, 13 base sequences 14 base sequences or 15 base sequences.
  • the proximal domain is 5 nucleotide sequences, 6 nucleotide sequences, 7 nucleotide sequences, 8 nucleotide sequences, 8 nucleotide sequences, 9 nucleotide sequences, 10 nucleotide sequences, 11 nucleotide sequences, 12 It may include the base sequence, 13 base sequences 14 base sequences or 15 base sequences.
  • proximal domain may have homology with a naturally occurring proximal domain or may be derived from a naturally occurring proximal domain.
  • proximal domain may have a difference in the nucleotide sequence of the proximal domain according to the species present in nature, may be derived from the proximal domain including the species present in nature, or the proximal domain including the species present in nature It may have some or complete homology with.
  • the proximal domain is Streptococcus pyogenes, Campylobacter jejuni, Streptococcus thermophilus, Streptococcus aureus or Nay. Have at least 50%, or complete homology, with some or at least 50% of the proximal domain or the derived proximal domain of Neisseria meningitides.
  • the proximal domain when the proximal domain is a proximal domain of Streptococcus pyogenes or a proximal domain derived from Streptococcus pyogenes, the proximal domain may be 5'-AAGGCUAGUCCG-3 ', or 5'-AAGGCUAGUCCG-3 'And some, at least 50% homology may be a base sequence.
  • the proximal domain may further include (X) n, that is, 5′-AAGGCUAGUCCG (X) n-3 ′.
  • X may be selected from the group consisting of bases A, T, U, and G, and n may be an integer of 1 to 15 as the number of base sequences.
  • (X) n may be repeated as many as n integers of the same base sequence, or may be an integer number of n base sequences in which bases A, T, U and G are mixed.
  • the proximal domain may be 5'-AAAGAGUUUGC-3 ', or 5'-AAAGAGUUUGC And a base sequence having at least 50% homology with -3 '.
  • the proximal domain may further include (X) n, that is, 5′-AAAGAGUUUGC (X) n-3 ′.
  • X may be selected from the group consisting of bases A, T, U and G, and n may be an integer of 1 to 40 as the number of base sequences.
  • (X) n may be repeated as many as n integers of the same base sequence, or may be an integer number of n base sequences in which bases A, T, U and G are mixed.
  • some or all of the base sequences of the proximal domain may comprise chemical modifications.
  • the chemical modification may be methylation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid (LNA), 2'-O-methyl 3'phosphorothioate (MS) or 2'-O-methyl 3'thioPACE (MSP). It is not limited.
  • the tail domain is a domain that can be optionally added to the 3 'end of a single stranded or double gRNA, the tail domain can be from 1 to 50 nucleotide sequences, or the tail domain can comprise from 1 to 50 nucleotide sequences. can do. In this case, the tail domain may form a double-stranded bond between complementary nucleotide sequences in the tail domain.
  • the tail domain is 1 to 5 base sequences, 5 to 10 base sequences, 10 to 15 base sequences, 15 to 20 base sequences, 20 to 25 base sequences, 25 to 30 base sequences , 30 to 35 base sequences, 35 to 40 base sequences, 40 to 45 base sequences or 45 to 50 base sequences can be.
  • the tail domain has 1 to 5 base sequences, 5 to 10 base sequences, 10 to 15 base sequences, 15 to 20 base sequences, 20 to 25 base sequences, and 25 to 30 base sequences. , 30 to 35 base sequences, 35 to 40 base sequences, 40 to 45 base sequences or 45 to 50 base sequences may be included.
  • the tail domain may have homology with a naturally occurring tail domain or may be derived from a naturally occurring tail domain.
  • the tail domain may have a difference in the nucleotide sequence of the tail domain according to the species present in nature, may be derived from the tail domain including the species present in nature, or the tail domain including the species present in nature It may have some or complete homology with.
  • the tail domain is Streptococcus pyogenes, Campylobacter jejuni, Streptococcus thermophilus, Streptococcus aureus or Ney It may have at least 50%, or complete homology, with at least 50% of the tail or derived tail domains of Neisseria meningitides.
  • the tail domain may be 5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3 ', or 5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3 'And some, at least 50% homology may be a base sequence.
  • the tail domain may further include (X) n, that is, 5′-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC (X) n-3 ′.
  • X may be selected from the group consisting of bases A, T, U, and G, and n may be an integer of 1 to 15 as the number of base sequences. In this case, (X) n may be repeated as many as n integers of the same base sequence, or may be an integer number of n base sequences in which bases A, T, U and G are mixed.
  • the tail domain is a Campylobacter jejuni's tail domain or a Campylobacter jejuni derived tail domain
  • the tail domain can be 5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3 ', or 5'-GGGACUCUGCGGGGUUACAAUCCCCUAUAACCG And a base sequence having at least 50% homology with -3 '.
  • the tail domain may further include (X) n, that is, 5′-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU (X) n-3 ′.
  • X may be selected from the group consisting of bases A, T, U, and G, and n may be an integer of 1 to 15 as the number of base sequences. In this case, (X) n may be repeated as many as n integers of the same base sequence, or may be an integer number of n base sequences in which bases A, T, U and G are mixed.
  • the tail domain may comprise 1 to 10 nucleotide sequences at the 3 ′ end associated with in vitro or in vivo transcription methods.
  • the tail domain can be any nucleotide sequence present at the 3 ′ end of the DNA template.
  • the tail domain may be UUUUUU
  • the tail domain may be UUUU
  • the pol-III promoter may comprise several uracil bases or alternative bases.
  • part or all of the nucleotide sequence of the tail domain may comprise a chemical modification.
  • the chemical modification may be methylation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid (LNA), 2'-O-methyl 3'phosphorothioate (MS) or 2'-O-methyl 3'thioPACE (MSP). It is not limited.
  • the gRNA may comprise a plurality of domains as described above, allowing the length of the nucleic acid sequence to be adjusted depending on the domain that the gRNA contains, with each domain within or stranding the three-dimensional behavior or active form of the gRNA Can interact with each other.
  • gRNAs include single-stranded gRNAs (single RNA molecules); Or double gRNA (comprising more than one typically two separate RNA molecules).
  • Double gRNAs consist of a first strand and a second strand.
  • the first strand may be referred to as crRNA
  • the second strand may be referred to as tracrRNA.
  • the guide domain comprises a complementary guide sequence capable of complementary binding to the target sequence on the target gene or nucleic acid.
  • the guide sequence is a nucleic acid sequence that is complementary to the target sequence on the target gene or nucleic acid, for example at least 70%, 75%, 80%, 85%, 90% or 95% or more complementary or completely complementary nucleic acid sequence. Can be.
  • the guide domain is believed to play a role in specific interactions with the target gene or nucleic acid of the gRNA-Cas complex, ie the CRISPR complex.
  • the guide domain may be 5 to 50 base sequences, or may include 5 to 50 base sequences.
  • the guide domain may include 16 nucleotide sequences, 17 nucleotide sequences, 18 nucleotide sequences, 19 nucleotide sequences, 20 nucleotide sequences, 21 nucleotide sequences, 22 nucleotide sequences, 23 nucleotide sequences, and 24 nucleotide sequences. Or 25 sequences, or may include the same.
  • the guide domain may comprise a guide sequence.
  • the guide sequence may be a complementary nucleotide sequence or a base sequence having complementarity capable of complementary binding to the target sequence on the target gene or nucleic acid, for example at least 70%, 75%, 80%, 85% At least 90% or 95% complementary or completely complementary sequences.
  • the guide sequence may be 5 to 50 base sequences, or may include 5 to 50 base sequences.
  • the guide sequence is 16 bases, 17 bases, 18 bases, 19 bases, 20 bases, 21 bases, 22 bases, 23 bases, 24 bases It may be a base sequence or 25 base sequences, or may include the same.
  • the guide domain may comprise a guide sequence and an additional base sequence.
  • the additional base sequence may be 1 to 35 base sequences.
  • the additional base sequence may include one nucleotide sequence, two nucleotide sequences, three nucleotide sequences, four nucleotide sequences, five nucleotide sequences, six nucleotide sequences, seven nucleotide sequences, eight nucleotide sequences, and 9 nucleotide sequences. It can be a base sequence or 10 base sequences.
  • the additional base sequence may be one base sequence G (guanine), or may be two base sequences GG.
  • the additional base sequence may be located at the 5 'end of the guide domain, or may be located at the 5' end of the guide sequence.
  • the additional base sequence may be located at the 3 'end of the guide domain, or may be located at the 3' end of the guide sequence.
  • the first complementary domain comprises a complementary nucleic acid sequence with the second complementary domain of the second strand, and is a domain having a complementary enough to form a double strand with the second complementary domain.
  • the first complementary domain may be 5 to 35 nucleotide sequences, or may include 5 to 35 nucleotide sequences.
  • the first complementary domain includes five nucleotide sequences, six nucleotide sequences, seven nucleotide sequences, eight nucleotide sequences, nine nucleotide sequences, ten nucleotide sequences, eleven nucleotide sequences, twelve nucleotide sequences, 13 nucleotide sequences, 14 nucleotide sequences, 15 nucleotide sequences, 16 nucleotide sequences, 17 nucleotide sequences, 18 nucleotide sequences, 19 nucleotide sequences, 20 nucleotide sequences, 21 nucleotide sequences, 22 nucleotide sequences, It may be 23 base sequences, 24 base sequences, or 25 base sequences, or may include the same.
  • the first complementary domain may have homology with a naturally occurring first complementary domain or may be derived from a naturally occurring first complementary domain.
  • the first complementary domain may have a difference in the nucleotide sequence of the first complementary domain according to a species present in nature, may be derived from a first complementary domain including a species present in nature, or It may have some or complete homology with the first complementary domain comprising the species present in nature.
  • the first complementary domain is Streptococcus pyogenes , Campylobacter jejuni ), Streptococcus thermophilus ), Streptococcus aureus , or Neisseria meningiditis meningitides ), at least 50%, or completely homologous with the first complementary domain or the derived first complementary domain.
  • the first complementary domain may comprise additional sequences that do not complementarily bind to the second complementary domain of the second strand.
  • the additional base sequence may be 1 to 15 base sequences.
  • the additional base sequence may be 1 to 5 base sequences, 5 to 10 base sequences, or 10 to 15 base sequences.
  • some or all of the base sequences of the guide domain and / or the first complementary domain may comprise chemical modifications.
  • the chemical modification may be methylation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid (LNA), 2'-O-methyl 3'phosphorothioate (MS) or 2'-O-methyl 3'thioPACE (MSP). It is not limited.
  • the first strand may be composed of 5 '-[guide domain]-[first complementary domain] -3' as described above.
  • first strand may optionally include additional nucleotide sequences.
  • the first strand is
  • the N target is a base sequence capable of complementary binding to the target sequence on the target gene or nucleic acid
  • the N target is a base sequence region that can be changed according to the target sequence on the target gene or nucleic acid.
  • (Q) m is a nucleotide sequence including the first complementary domain, and includes a base sequence capable of complementary binding to the second complementary domain of the second strand.
  • the (Q) m may be a sequence having a part or complete homology with the first complementary domain of a species present in nature, and the base sequence of the first complementary domain may be changed according to the derived species.
  • Q may be independently selected from the group consisting of A, U, C, and G, and m may be an integer of 5 to 35 as the number of base sequences.
  • (Q) m May be 5'-GUUUUAGAGCUA-3 ', or may be a nucleotide sequence having at least 50% homology with 5'-GUUUUAGAGCUA-3'.
  • (Q) m is 5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3 'or a base sequence having at least 50% homology with 5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'.
  • (Q) m May be 5'-GUUUUAGAGCUGUGUUGUUUCG-3 ', or may be a base sequence having at least 50% homology with 5'-GUUUUAGAGCUGUGUUGUUUCG-3'.
  • (X) a , (X) b and (X) c is a nucleotide sequence that can be optionally added, wherein X may be independently selected from the group consisting of A, U, C and G, A, b, and c are the number of base sequences, and may be 0 or an integer of 1 to 20.
  • the second strand consists of a second complementary domain and a proximal domain and may optionally further comprise a tail domain.
  • the second complementary domain in the second strand comprises a complementary nucleic acid sequence with the first complementary domain of the first strand and is complementary enough to form a double strand with the first complementary domain.
  • the second complementary domain includes a complementary base sequence with the first complementary domain and a base sequence without complementarity with the first complementary domain, eg, a base sequence that does not form a double strand with the first complementary domain.
  • the base sequence may be longer than the first complementary domain.
  • the second complementary domain may be 5 to 35 nucleotide sequences, or may include 5 to 35 nucleotide sequences.
  • the second complementary domain includes 5 base sequences, 6 base sequences, 7 base sequences, 8 base sequences, 9 base sequences, 10 base sequences, 11 base sequences, and 12 base sequences.
  • nucleotide sequences 13 nucleotide sequences, 14 nucleotide sequences, 15 nucleotide sequences, 16 nucleotide sequences, 17 nucleotide sequences, 18 nucleotide sequences, 19 nucleotide sequences, 20 nucleotide sequences, 21 nucleotide sequences, 22 nucleotide sequences , 23 base sequences, 24 base sequences or 25 base sequences, or may include the same.
  • the second complementary domain may have homology with a naturally occurring second complementary domain or may be derived from a naturally occurring second complementary domain.
  • the second complementary domain may have a difference in the nucleotide sequence of the second complementary domain according to a species present in nature, may be derived from a second complementary domain including a species present in nature, or It may have some or complete homology with the second complementary domain, including species present in nature.
  • the second complementary domain is Streptococcus pyogenes , Campylobacter jejuni ), Streptococcus thermophilus ), Streptococcus aureus , or Neisseria meningiditis meningitides ) or at least 50%, or complete homology, with a second complementary domain or derived second complementary domain.
  • the second complementary domain may comprise additional sequences that do not complementarily bind to the first complementary domain of the first strand.
  • the additional base sequence may be 1 to 25 base sequences.
  • the additional base sequence may be 1 to 5 base sequences, 5 to 10 base sequences, 10 to 15 base sequences, 15 to 20 base sequences, or 20 to 25 base sequences.
  • the proximal domain in the second strand is 1-20 nucleotide sequences, which is located in the 3 'direction of the second complementary domain.
  • the proximal domain includes five nucleotide sequences, six nucleotide sequences, seven nucleotide sequences, eight nucleotide sequences, eight nucleotide sequences, nine nucleotide sequences, ten nucleotide sequences, eleven nucleotide sequences, and twelve nucleotide sequences. It may be a nucleotide sequence, 13 base sequences, 14 base sequences or 15 base sequences, or may include the same.
  • the proximal domain may form a double-stranded bond between complementary nucleotide sequences in the proximal domain.
  • proximal domain may have homology with a naturally occurring proximal domain or may be derived from a naturally occurring proximal domain.
  • proximal domain may have a difference in the nucleotide sequence of the proximal domain according to the species present in nature, may be derived from the proximal domain including the species present in nature, or the proximal domain including the species present in nature It may have some or complete homology with.
  • the proximal domain is Streptococcus pyogenes , Campylobacter jejuni ), Streptococcus thermophilus ), Streptococcus aureus , or Neisseria meningiditis meningitides ) may have some, at least 50%, or complete homology with the proximal domain or derived proximal domain.
  • the tail domain in the second strand is a domain that can be selectively added to the 3 'end of the second strand
  • the tail domain can be 1 to 50 nucleotide sequences, or 1 to 50 nucleotide sequences It may include.
  • the tail domain may include 1 to 5 base sequences, 5 to 10 base sequences, 10 to 15 base sequences, 15 to 20 base sequences, 20 to 25 base sequences, 25 to 30 base sequences, It may be 30 to 35 base sequences, 35 to 40 base sequences, 40 to 45 base sequences or 45 to 50 base sequences, or may include the same.
  • the tail domain may form a double-stranded bond between complementary nucleotide sequences in the tail domain.
  • the tail domain may have homology with a naturally occurring tail domain or may be derived from a naturally occurring tail domain.
  • the tail domain may have a difference in the nucleotide sequence of the tail domain according to the species present in nature, may be derived from the tail domain including the species present in nature, or the tail domain including the species present in nature It may have some or complete homology with.
  • the tail domain is Streptococcus pyogenes , Campylobacter jejuni ), Streptococcus thermophilus ), Streptococcus aureus , or Neisseria meningiditis meningitides ) or at least 50%, or complete homology with the tail domain or derived tail domain.
  • the tail domain may comprise 1 to 10 nucleotide sequences at the 3 ′ end associated with in vitro or in vivo transcription methods.
  • the tail domain can be any nucleotide sequence present at the 3 'end of the DNA template.
  • the tail domain may be UUUUUU
  • the tail domain may be UUUU
  • the pol-III promoter may comprise several uracil bases or alternative bases.
  • some or all of the base sequences of the second complementary domain, proximal domain, and / or tail domain may comprise chemical modifications.
  • the chemical modification may be methylation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid (LNA), 2'-O-methyl 3'phosphorothioate (MS) or 2'-O-methyl 3'thioPACE (MSP). It is not limited.
  • the second strand may be 5 '-[second complementary domain]-[proximal domain] -3' or 5 '-[second complementary domain]-[proximal domain]-[tail domain]-as described above. 3 '.
  • the second strand may optionally include additional nucleotide sequences.
  • the second strand is
  • the second strand is
  • (Z) h is a nucleotide sequence including the second complementary domain, and includes a base sequence capable of complementary binding to the first complementary domain of the first strand.
  • (Z) h may be a sequence having partial or complete homology with a second complementary domain of a species present in nature, and the base sequence of the second complementary domain may be changed according to the derived species.
  • Z may be independently selected from the group consisting of A, U, C, and G, and h may be an integer of 5 to 50 as the number of base sequences.
  • (Z) h May be 5'-UAGCAAGUUAAAAU-3 ', or may be a base sequence having at least 50% homology with 5'-UAGCAAGUUAAAAU-3'.
  • (Z) h is 5'-AAGAAAUUUAAAAAGGGACUAAAAU-3 'or may be a base sequence having at least 50% homology with 5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'.
  • (Z) h May be 5'-CGAAACAACACAGCGAGUUAAAAU-3 'or may be a base sequence having at least 50% homology with 5'-CGAAACAACACAGCGAGUUAAAAU-3'.
  • (P) k is a nucleotide sequence including the proximal domain, and may be a sequence having partial or complete homology with the proximal domain of a species existing in nature, and the base sequence of the proximal domain is changed according to the derived species. Can be.
  • the P may be independently selected from the group consisting of A, U, C and G, and k may be an integer of 1 to 20 as the number of base sequences.
  • (P) k is 5'-AAGGCUAGUCCG-3 ' Or a base sequence having at least 50% homology with 5′-AAGGCUAGUCCG-3 ′.
  • (P) k may be 5′-AAAGAGUUUGC-3 ′. Or a base sequence having at least 50% homology with 5′-AAAGAGUUUGC-3 ′.
  • (P) k is 5′-AAGGCUUAGUCCG-3 ′
  • a base sequence having at least 50% homology with 5′-AAGGCUUAGUCCG-3 ′ is 5′-AAGGCUUAGUCCG-3 ′.
  • (F) i is a nucleotide sequence including a tail domain, and may be a sequence having partial or complete homology with a tail domain of a species existing in nature, and the nucleotide sequence of the tail domain is changed according to the derived species.
  • F may be independently selected from the group consisting of A, U, C, and G, and i may be an integer of 1 to 50 as the number of base sequences.
  • (F) i is 5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3 ' Or a base sequence having at least 50% homology with 5′-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3 ′.
  • (F) i is 5′-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3 ′ when the tail domain has part or complete homology with the tail domain of Campylobacter jejuni or the Campylobacter jejuni derived tail domain Or a base sequence having at least 50% homology with 5′-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3 ′.
  • tail domain has partial or complete homology with the tail domain of Streptococcus thermophilus or the Streptococcus thermophilus derived tail domain
  • (F) i is 5′-UACUCAACUUGAAAAGGUGGCACCGAUUCGGUGUUUUU-3 '
  • (F) i may include 1 to 10 nucleotide sequences at the 3 'end associated with in vitro or in vivo transcription methods.
  • the tail domain can be any nucleotide sequence present at the 3 'end of the DNA template.
  • the tail domain may be UUUUUU
  • the tail domain may be UUUU
  • the pol-III promoter may comprise several uracil bases or alternative bases.
  • (X) d , (X) e and (X) f is a nucleotide sequence that can be optionally added, X may be independently selected from the group consisting of A, U, C and G, The d, e and f is the number of base sequences, it may be an integer of 0 or 1 to 20.
  • Single-stranded gRNAs can be divided into two types.
  • first and second strands of the double gRNA there is a single-stranded gRNA connecting the first and second strands of the double gRNA with a linking domain, wherein the single-stranded gRNA is 5 '-[first strand]-[linking domain]-[second strand ] -3 '.
  • the single stranded gRNA is
  • Each domain except the linking domain is identical to the description for each domain of the first and second strands of the double gRNA.
  • the linking domain is a domain connecting the first strand and the second strand, specifically, a nucleic acid sequence capable of connecting the first and second complementary domains to generate a single-stranded gRNA. to be.
  • the linking domain may be covalently or non-covalently coupled to the first complementary domain and the second complementary domain, or may be covalently or non-covalently linked to the first complementary domain and the second complementary domain.
  • the linking domain may be 1 to 30 nucleotide sequences, or may include 1 to 30 nucleotide sequences.
  • the linking domain may be 1 to 5 nucleotide sequences, 5 to 10 nucleotide sequences, 10 to 15 nucleotide sequences, 15 to 20 nucleotide sequences, 20 to 25 nucleotide sequences, or 25 to 30 nucleotide sequences. It may be, or may include it.
  • the linking domain is suitable for use in single-stranded gRNA molecules and can be covalently or non-covalently linked to the first and second strands of a double gRNA, or covalently or non-covalently linked to the first and second strands.
  • Single stranded gRNAs can be used to generate.
  • the linking domain may be used to generate single-stranded gRNAs either covalently or non-covalently with the crRNA and tracrRNA of the double gRNA, or by covalently or non-covalently linking the crRNA and tracrRNA.
  • the linking domain may be homologous to or derived from a naturally occurring sequence, such as some sequences of tracrRNA.
  • some or all of the base sequences of the linking domains may include chemical modifications.
  • the chemical modification may be methylation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid (LNA), 2'-O-methyl 3'phosphorothioate (MS) or 2'-O-methyl 3'thioPACE (MSP). It is not limited.
  • single-stranded gRNAs are 5 '-[guide domain]-[first complementary domain]-[linking domain]-[second complementary domain]-[proximal domain] -3' as described above. Or 5 '-[guide domain]-[first complementary domain]-[connection domain]-[second complementary domain]-[proximal domain]-[tail domain] -3'. have.
  • the single-stranded gRNA may optionally include additional nucleotide sequences.
  • the single stranded gRNA is
  • the single-stranded gRNA is
  • the N target is a base sequence capable of complementary binding to the target sequence on the target gene or nucleic acid
  • the N target is a base sequence region that can be changed according to the target sequence on the target gene or nucleic acid.
  • (Q) m is a nucleotide sequence including the first complementary domain, and includes a base sequence capable of complementary binding to the second complementary domain.
  • the (Q) m may be a sequence having a part or complete homology with the first complementary domain of a species present in nature, and the base sequence of the first complementary domain may be changed according to the derived species.
  • Q may be independently selected from the group consisting of A, U, C, and G, and m may be an integer of 5 to 35 as the number of base sequences.
  • (Q) m May be 5'-GUUUUAGAGCUA-3 ', or may be a nucleotide sequence having at least 50% homology with 5'-GUUUUAGAGCUA-3'.
  • (Q) m is 5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3 'or a base sequence having at least 50% homology with 5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'.
  • (Q) m May be 5'-GUUUUAGAGCUGUGUUGUUUCG-3 ', or may be a base sequence having at least 50% homology with 5'-GUUUUAGAGCUGUGUUGUUUCG-3'.
  • (L) j is a nucleotide sequence including a linking domain, which is a base sequence that can be produced by connecting the first complementary domain and the second complementary domain to generate a single stranded gRNA.
  • L may be independently selected from the group consisting of A, U, C and G, wherein j is the number of base sequences, it may be an integer of 1 to 30.
  • (Z) h is a nucleotide sequence including a second complementary domain, and includes a base sequence capable of complementary binding to the first complementary domain.
  • (Z) h may be a sequence having partial or complete homology with a second complementary domain of a species present in nature, and the base sequence of the second complementary domain may be changed according to the derived species.
  • Z may be independently selected from the group consisting of A, U, C, and G, and h may be an integer of 5 to 50 as the number of base sequences.
  • (Z) h May be 5'-UAGCAAGUUAAAAU-3 ', or may be a base sequence having at least 50% homology with 5'-UAGCAAGUUAAAAU-3'.
  • (Z) h is 5'-AAGAAAUUUAAAAAGGGACUAAAAU-3 'or may be a base sequence having at least 50% homology with 5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'.
  • (Z) h May be 5'-CGAAACAACACAGCGAGUUAAAAU-3 'or may be a base sequence having at least 50% homology with 5'-CGAAACAACACAGCGAGUUAAAAU-3'.
  • (P) k is a nucleotide sequence including the proximal domain, and may be a sequence having partial or complete homology with the proximal domain of a species existing in nature, and the base sequence of the proximal domain is changed according to the derived species. Can be.
  • the P may be independently selected from the group consisting of A, U, C and G, and k may be an integer of 1 to 20 as the number of base sequences.
  • (P) k is 5'-AAGGCUAGUCCG-3 ' Or a base sequence having at least 50% homology with 5′-AAGGCUAGUCCG-3 ′.
  • (P) k may be 5′-AAAGAGUUUGC-3 ′. Or a base sequence having at least 50% homology with 5′-AAAGAGUUUGC-3 ′.
  • (P) k is 5′-AAGGCUUAGUCCG-3 ′
  • a base sequence having at least 50% homology with 5′-AAGGCUUAGUCCG-3 ′ is 5′-AAGGCUUAGUCCG-3 ′.
  • (F) i is a nucleotide sequence including a tail domain, and may be a sequence having partial or complete homology with a tail domain of a species existing in nature, and the nucleotide sequence of the tail domain is changed according to the derived species.
  • F may be independently selected from the group consisting of A, U, C, and G, and i may be an integer of 1 to 50 as the number of base sequences.
  • (F) i is 5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3 ' Or a base sequence having at least 50% homology with 5′-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3 ′.
  • (F) i is 5′-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3 ′ when the tail domain has part or complete homology with the tail domain of Campylobacter jejuni or the Campylobacter jejuni derived tail domain Or a base sequence having at least 50% homology with 5′-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3 ′.
  • tail domain has partial or complete homology with the tail domain of Streptococcus thermophilus or the Streptococcus thermophilus derived tail domain
  • (F) i is 5′-UACUCAACUUGAAAAGGUGGCACCGAUUCGGUGUUUUU-3 '
  • (F) i may include 1 to 10 nucleotide sequences at the 3 'end associated with in vitro or in vivo transcription methods.
  • the tail domain can be any nucleotide sequence present at the 3 'end of the DNA template.
  • the tail domain may be UUUUUU
  • the tail domain may be UUUU
  • the pol-III promoter may comprise several uracil bases or alternative bases.
  • the (X) a , (X) b , (X) c , (X) d , (X) e and (X) f is a nucleotide sequence that can be optionally added, wherein X is A, U, It may be selected independently from the group consisting of C and G, wherein a, b, c, d, e and f is the number of base sequences, it may be an integer of 0 or 1 to 20.
  • the single stranded gRNA may then be a single stranded gRNA consisting of a guide domain, a first complementary domain and a second complementary domain,
  • the single-stranded gRNA is
  • the guide domain comprises a complementary guide sequence capable of complementary binding to the target sequence on the target gene or nucleic acid.
  • the guide sequence is a nucleic acid sequence that is complementary to the target sequence on the target gene or nucleic acid, for example at least 70%, 75%, 80%, 85%, 90% or 95% or more complementary or completely complementary nucleic acid sequence. Can be.
  • the guide domain is believed to play a role in specific interactions with the target gene or nucleic acid of the gRNA-Cas complex, ie the CRISPR complex.
  • the guide domain may be 5 to 50 base sequences, or may include 5 to 50 base sequences.
  • the guide domain may include 16 nucleotide sequences, 17 nucleotide sequences, 18 nucleotide sequences, 19 nucleotide sequences, 20 nucleotide sequences, 21 nucleotide sequences, 22 nucleotide sequences, 23 nucleotide sequences, and 24 nucleotide sequences. Or 25 sequences, or may include the same.
  • the guide domain may comprise a guide sequence.
  • the guide sequence may be a complementary nucleotide sequence or a base sequence having complementarity capable of complementary binding to the target sequence on the target gene or nucleic acid, for example at least 70%, 75%, 80%, 85% At least 90% or 95% complementary or completely complementary sequences.
  • the guide sequence may be 5 to 50 base sequences, or may include 5 to 50 base sequences.
  • the guide sequence is 16 bases, 17 bases, 18 bases, 19 bases, 20 bases, 21 bases, 22 bases, 23 bases, 24 bases It may be a base sequence or 25 base sequences, or may include the same.
  • the guide domain may comprise a guide sequence and an additional base sequence.
  • the additional base sequence may be 1 to 35 base sequences.
  • the additional base sequence may include one nucleotide sequence, two nucleotide sequences, three nucleotide sequences, four nucleotide sequences, five nucleotide sequences, six nucleotide sequences, seven nucleotide sequences, eight nucleotide sequences, and 9 nucleotide sequences. It can be a base sequence or 10 base sequences.
  • the additional base sequence may be one base sequence G (guanine), or may be two base sequences GG.
  • the additional base sequence may be located at the 5 'end of the guide domain, or may be located at the 5' end of the guide sequence.
  • the additional base sequence may be located at the 3 'end of the guide domain, or may be located at the 3' end of the guide sequence.
  • the first complementary domain includes a second complementary domain and a complementary nucleic acid sequence, and has a complementarity enough to form a double strand with the second complementary domain.
  • the first complementary domain may be 5 to 35 nucleotide sequences, or may include 5 to 35 nucleotide sequences.
  • the first complementary domain includes five nucleotide sequences, six nucleotide sequences, seven nucleotide sequences, eight nucleotide sequences, nine nucleotide sequences, ten nucleotide sequences, eleven nucleotide sequences, twelve nucleotide sequences, 13 nucleotide sequences, 14 nucleotide sequences, 15 nucleotide sequences, 16 nucleotide sequences, 17 nucleotide sequences, 18 nucleotide sequences, 19 nucleotide sequences, 20 nucleotide sequences, 21 nucleotide sequences, 22 nucleotide sequences, It may be 23 base sequences, 24 base sequences, or 25 base sequences, or may include the same.
  • the first complementary domain may have homology with a naturally occurring first complementary domain or may be derived from a naturally occurring first complementary domain.
  • the first complementary domain may have a difference in the nucleotide sequence of the first complementary domain according to a species present in nature, may be derived from a first complementary domain including a species present in nature, or It may have some or complete homology with the first complementary domain comprising the species present in nature.
  • the first complementary domain palku bacterium tumefaciens (Parcubacteria bacterium (GWC2011_GWC2_44_17)), racheu furnace Spirra seae tumefaciens (Lachnospiraceae bacterium (MC2017)), butyronitrile Lee V. proteosome keulrasikeo switch (Butyrivibrio proteoclasiicus), Peregrinibacteria bacterium (GW2011_GWA_33_10), Acidaminococcus sp .
  • BV3L6 Porphyromonas macacae , Laznopyraceae bacterium ( Lachnospiraceae) bacterium (ND2006)), Porphyromonas crevioricanis ), Prevotella disiens , Moraxella bovoculi (237)), Smiihella sp .
  • the first complementary domain may comprise additional sequences that do not complementarily bind to the second complementary domain.
  • the additional base sequence may be 1 to 15 base sequences.
  • the additional base sequence may be 1 to 5 base sequences, 5 to 10 base sequences, or 10 to 15 base sequences.
  • the second complementary domain comprises a complementary nucleic acid sequence with the first complementary domain of the first strand and has a complementarity enough to form a double strand with the first complementary domain.
  • the second complementary domain includes a complementary base sequence with the first complementary domain and a base sequence without complementarity with the first complementary domain, eg, a base sequence that does not form a double strand with the first complementary domain.
  • the base sequence may be longer than the first complementary domain.
  • the second complementary domain may be 5 to 35 nucleotide sequences, or may include 5 to 35 nucleotide sequences.
  • the second complementary domain includes 5 base sequences, 6 base sequences, 7 base sequences, 8 base sequences, 9 base sequences, 10 base sequences, 11 base sequences, and 12 base sequences.
  • nucleotide sequences 13 nucleotide sequences, 14 nucleotide sequences, 15 nucleotide sequences, 16 nucleotide sequences, 17 nucleotide sequences, 18 nucleotide sequences, 19 nucleotide sequences, 20 nucleotide sequences, 21 nucleotide sequences, 22 nucleotide sequences , 23 base sequences, 24 base sequences or 25 base sequences, or may include the same.
  • the second complementary domain may have homology with a naturally occurring second complementary domain or may be derived from a naturally occurring second complementary domain.
  • the second complementary domain may have a difference in the nucleotide sequence of the second complementary domain according to a species present in nature, may be derived from a second complementary domain including a species present in nature, or It may have some or complete homology with the second complementary domain, including species present in nature.
  • the second complementary domains palku bacterium tumefaciens (Parcubacteria bacterium (GWC2011_GWC2_44_17)), racheu furnace Spirra seae tumefaciens (Lachnospiraceae bacterium (MC2017)), butyronitrile Lee V. proteosome keulrasikeo switch (Butyrivibrio proteoclasiicus), Peregrinibacteria bacterium (GW2011_GWA_33_10), Acidaminococcus sp .
  • BV3L6 Porphyromonas macacae , Laznopyraceae bacterium ( Lachnospiraceae) bacterium (ND2006)), Porphyromonas crevioricanis ), Prevotella disiens , Moraxella bovoculi (237)), Smiihella sp .
  • the second complementary domain may comprise additional sequences that do not complementarily bind to the first complementary domain.
  • the additional base sequence may be 1 to 15 base sequences.
  • the additional base sequence may be 1 to 5 base sequences, 5 to 10 base sequences, or 10 to 15 base sequences.
  • the linking domain is a nucleic acid sequence that allows the first and second complementary domains to be joined to produce a single stranded gRNA.
  • the linking domain may be covalently or non-covalently coupled to the first complementary domain and the second complementary domain, or may be covalently or non-covalently linked to the first complementary domain and the second complementary domain.
  • the linking domain may be 1 to 30 nucleotide sequences, or may include 1 to 30 nucleotide sequences.
  • the linking domain may be 1 to 5 nucleotide sequences, 5 to 10 nucleotide sequences, 10 to 15 nucleotide sequences, 15 to 20 nucleotide sequences, 20 to 25 nucleotide sequences, or 25 to 30 nucleotide sequences. It may be, or may include it.
  • some or all of the base sequences of the guide domain, the first complementary domain, the second complementary domain, and the linking domain may comprise chemical modifications.
  • the chemical modification may be methylation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid (LNA), 2'-O-methyl 3'phosphorothioate (MS) or 2'-O-methyl 3'thioPACE (MSP). It is not limited.
  • the single-stranded gRNA is 5 '-[second complementary domain]-[first complementary domain]-[guide domain] -3' or 5 '-[second complementary domain]-[ Linking domain]-[first complementary domain]-[guide domain] -3 '.
  • the single-stranded gRNA may optionally include additional nucleotide sequences.
  • the single stranded gRNA is
  • the single-stranded gRNA is

Abstract

본 발명은 개선된 면역효과를 갖는, 인위적으로 조작한 면역 시스템에 관한 것이다. 보다 구체적으로, 인위적으로 조작한 면역조절요소 및 이를 포함하는 세포를 포함하는, 인위적으로 기능을 변형시킨 면역 시스템에 관한 것이다. 구체적인 양태로, 인위적으로 조작된 PD-1, CTLA-4, A20, DGKα, DGKζ, FAS, EGR2, PPP2R2D, PSGL-1, KDM6A, 및 TET2 등의 면역조절 유전자 및/또는 이의 발현 산물에 의한 면역 시스템에 관한 것이다.

Description

조작된 면역조절요소 및 이에 의해 변형된 면역 활성
본 발명은 개선된 면역효과를 갖는, 인위적으로 조작한 면역 시스템에 관한 것이다. 보다 구체적으로, 인위적으로 조작한 면역조절요소 및 이를 포함하는 세포를 포함하는, 인위적으로 기능을 변형시킨 면역 시스템에 관한 것이다.
세포치료제는 손상되었거나 질병이 있는 세포, 조직, 개체를 회복시키기 위해 살아있는 세포를 사용해 재생 등의 치료 효능을 유도하는 의약품으로서, 자가, 동종, 이종 세포를 체외에서 배양·증식하거나 선별하는 등 물리적, 화학적, 생물학적 방법으로 조작하여 제조하는 의약품을 말한다.
그 중에서, 면역조절 세포치료제란 수지상세포(dendritic cell), 자연 살해 세포(natural killer cell),T 세포 등 면역세포를 이용하여 체내의 면역반응을 조절하여 질병을 치료할 목적으로 사용되는 의약품이다.
현재, 면역조절 세포치료제는 주로 암 치료를 적응증으로 개발되고 있으며, 환자에게 직접 면역세포를 투여하여 면역 기능을 활성화하여, 치료 효과를 얻기 때문에 기존의 암 치료에 이용되는 수술 요법, 항암제나 방사선 치료와는 차별화되는 치료 기전 및 효능을 가지며, 향후 바이오 신약의 주요한 부분을 차지할 것으로 예상되는 분야이다.
면역조절 세포치료제는 종류에 따라서 세포에 도입하는 물질의 물리·화학적 특징이 서로 다르고, 면역 세포에 외래 유전자가 바이러스 벡터 등으로 도입되는 경우 세포치료제이자 유전자치료제라는 두 가지 모두의 특징을 가지게 된다.
상기 면역조절 세포치료제는 채집(apheresis)을 통해 환자로부터 분리한 PBMC(peripheral blood mononuclear cell), T 세포, NK세포 등 다양한 면역세포를 다양한 항체 및 사이토카인으로 활성화 시킨 뒤, 이를 체외에서 증식시켜 다시 환자에게 주입하거나, TCR (T-Cell Receptor)이나 CAR (Chimeric Antigen Receptor) 등의 유전자를 도입한 면역세포를 환자에게 다시 주입하는 방식으로 이루어진다.
엑스 비보(ex vivo)에서 만들어내는 자기유래(autologous) 항원-특이적 면역세포(예를 들어, T 세포)들의 전달을 수반하는 입양 면역요법(adoptive immunotherapy)은 암뿐만 아니라 다양한 면역 질환을 치료하는 유망한 전략이 될 수 있을 것이다.
최근 면역세포치료제가 항암 기능뿐 아니라 자가면역 억제제 등으로 다양하게 활용될 수 있다는 것이 보고된 바, 면역세포치료제는 면역 반응을 조절함으로써 다양한 적응증에 사용될 수 있다. 따라서, 입양 면역요법에 사용되는 조작된 면역 세포의 치료 효능의 개선 및 개발 요구가 매우 큰 실정이다.
본 발명은 일 구체예로서 개선된 면역효과를 갖는, 인위적으로 조작한 면역 시스템을 제공하고자 한다.
본 발명은 일 구체예로서 인위적으로 조작한 면역조절요소 및 이를 포함하는 세포를 제공하고자 한다.
본 발명은 일 구체예로서 면역 세포의 기능의 변형(예를 들어, 증강 또는 억제) 방법을 제공하고자 한다.
본 발명은 일 구체예로서 면역 기능이 변형된 면역조절요소 및/또는 면역 세포를 유효 성분으로서 포함하는, 면역능 이상에 수반되는 질환의 치료 및/또는 예방 용도를 제공하고자 한다.
본 발명은 일 구체예로서 면역세포의 증식률 (proliferation), 생존률 (survival), 세포독성 (cytotoxicity), 세포 침윤 (infiltration), 사이토카인 분비량 (cytokine-release) 등의 증진을 통한 항암 기능을 제공하고자 한다.
본 발명은 일 구체예로서, 인위적으로 조작된 PD-1, CTLA-4, A20, DGKα, DGKζ, FAS, EGR2, PPP2R2D, PSGL-1, KDM6A, TET2 등의 면역조절 유전자 및/또는 이의 발현 산물을 제공하고자 한다.
본 발명은 일 구체예로서, 면역조절 유전자의 활성 조절에 적용 가능한 가이드핵산-에디터단백질 복합체를 포함하는 면역세포 유전체 교정용 조성물 및 이를 이용하는 방법을 제공하고자 한다.
본 발명은 일 구체예로서, 인위적으로 조작된 PD-1, CTLA-4, A20, DGKα, DGKζ, FAS, EGR2, PPP2R2D, PSGL-1, KDM6A, TET2 등의 면역조절 유전자의 조작에 사용할 수 있는 가이드 핵산 및 에디터단백질을 제공하고자 한다.
상기 과제를 해결하기 위하여, 본 발명은 개선된 면역효과를 갖는, 인위적으로 조작한 면역 시스템에 관한 것이다. 보다 구체적으로, 인위적으로 조작한 면역조절요소 및 이를 포함하는 세포를 포함하는, 인위적으로 기능을 변형시킨 면역 시스템에 관한 것이다.
본 발명은 특정 목적을 위해 유전적으로 조작된 또는 변형된 면역조절요소를 제공한다.
"면역조절요소"는 면역반응의 형성 및 수행과 관련된 기능을 하는 물질로서, 비자연적인, 즉, 인위적으로 조작된, 면역반응 조절 기능을 가질 수 있는 다양한 물질을 모두 포함한다. 예를 들어, 유전적으로 조작된 또는 변형된, 면역세포에서 발현되는 유전자 또는 단백질일 수 있다.
상기 면역조절요소는 면역세포의 활성화 또는 비활성화에 관련된 기능을 할 수 있다. 면역반응을 억제하는 기능을 할 수 있다. 면역반응을 촉진하는 기능을 할 수 있다. 예를 들어, 면역세포생장조절요소, 면역세포사멸조절요소, 면역세포기능소실요소, 또는 사이토카인 분비요소 등일 수 있다.
본 발명의 일 구현예에서는 면역조절요소로서 예를 들어, 유전적으로 조작된 또는 변형된, PD-1 유전자, CTLA-4 유전자, TNFAIP3(A20) 유전자, DGKA 유전자, DGKZ 유전자, FAS 유전자, EGR2 유전자, PPP2R2D 유전자, TET2 유전자, PSGL-1 유전자, KDM6A 유전자일 수 있다.
본 발명의 일 구현예에서는 면역조절요소로서 유전적으로 조작된 또는 변형된 2이상의 유전자를 포함할 수 있다. 예를 들어, PD-1 유전자, CTLA-4 유전자, TNFAIP3(A20) 유전자, DGKA 유전자, DGKZ 유전자, FAS 유전자, EGR2 유전자, PPP2R2D 유전자, TET2 유전자, PSGL-1 유전자, 및 KDM6A 유전자로 구성된 군에서 선택되는 2이상의 유전자를 조작 또는 변형할 수 있다.
본 발명의 바람직한 예로서 유전적으로 조작된 또는 변형된 TNFAIP3, DGKA, DGKZ, FAS, EGR2, PSGL-1, KDM6A 유전자일 수 있다.
그러므로, 본 발명의 일 구현예에서는 핵산서열 내 변형이 일어난, PD-1, CTLA-4, A20, DGKα, DGKζ, FAS, EGR2, PPP2R2D, PSGL-1, KDM6A, 및 TET2로 구성된 군에서 선택된 하나 이상의 인위적으로 조작된 면역조절 유전자를 제공한다.
상기 핵산서열 내 변형은 비제한적으로, 가이드핵산-에디터단백질 복합체에 의해 인위적으로 조작될 수 있다.
“가이드핵산-에디터단백질 복합체”는 가이드핵산과 에디터단백질의 상호작용을 통해 형성된 복합체를 의미하며, 핵산-단백질 복합체는 가이드핵산과 에디터단백질을 포함한다.
가이드핵산-에디터단백질 복합체는 대상을 변형시킬 수 있다. 상기 대상은 표적 핵산, 유전자, 염색체 또는 단백질일 수 있다.
예를 들어, 상기 유전자는 가이드핵산-에디터단백질 복합체에 의해 인위적으로 조작된 면역조절 유전자로서,
상기 면역조절 유전자를 구성하는 핵산서열 내 PAM(proto-spacer-adjacent Motif) 서열 중 또는 이의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp의 염기 서열 부위 내의
하나 이상의 뉴클레오타이드의 결실 또는 삽입;
야생형 유전자와 상이한 하나 이상의 뉴클레오타이드로의 치환;
외부 유래의 하나 이상의 뉴클레오타이드 삽입
중 하나 이상의 핵산의 변형, 또는
상기 면역조절 유전자를 구성하는 핵산서열 내 하나 이상의 뉴클레오타이드의 화학적 변형
을 포함하는 것을 특징으로 하는 인위적으로 조작된 면역조절 유전자일 수 있다.
상기 핵산의 변형은 유전자의 프로모터 영역에서 일어날 수 있다.
상기 핵산의 변형은 유전자의 엑손 영역에서 일어날 수 있다. 일 실시예에서는 유전자의 암호화 영역 중 상위 50% 내의 영역에서 변형이 일어날 수 있다.
상기 핵산의 변형은 유전자의 인트론 영역에서 일어날 수 있다.
상기 핵산의 변형은 유전자의 인핸서 영역에서 일어날 수 있다.
상기 PAM 서열은 예를 들어, 하기의 서열 중 1 이상일 수 있다(5'에서 3'방향으로 기재함).
NGG(N은 A, T, C 또는 G임);
NNNNRYAC(N은 각각 독립적으로 A, T, C 또는 G이고, R은 A또는 G이고, Y는 C 또는 T임);
NNAGAAW(N은 각각 독립적으로 A, T, C 또는 G이고, W는 A 또는 T임);
NNNNGATT(N은 각각 독립적으로 A, T, C 또는 G임);
NNGRR(T)(N은 각각 독립적으로 A, T, C 또는 G이고, R은 A 또는 G이고, Y는 C 또는 T임); 및
TTN(N은 A, T, C 또는 G임).
또한, 다른 구현예에서, 본 발명은 PD-1, CTLA-4, A20, DGKα, DGKζ, FAS, EGR2, PPP2R2D, PSGL-1, KDM6A, 및 TET2 중 선택된 하나 이상의 유전자의 핵산 서열 중 서열번호 1 내지 289번의 타겟 서열에 각각 상보적인 결합을 형성할 수 있는 가이드 핵산을 제공한다.
예를 들어, 이하의 군으로부터 선택되는 1이상의 가이드 핵산을 제공할 수 있다:
A20 유전자 핵산 서열 중 서열번호 6 및 11의 타겟 서열에 각각 상보적인 결합을 형성할 수 있는 가이드 핵산;
DGKa 유전자 핵산 서열 중 서열번호 19, 20, 21, 및 23의 타겟 서열에 각각 상보적인 결합을 형성할 수 있는 가이드 핵산;
EGR2 유전자 핵산 서열 중 서열번호 25의 타겟 서열에 각각 상보적인 결합을 형성할 수 있는 가이드 핵산;
PPP2R2D 유전자 핵산 서열 중 서열번호 64의 타겟 서열에 각각 상보적인 결합을 형성할 수 있는 가이드 핵산;
PD-1 유전자 핵산 서열 중 서열번호 87 및 89의 타겟 서열에 각각 상보적인 결합을 형성할 수 있는 가이드 핵산;
DGKζ 유전자 핵산 서열 중 서열번호 109, 110, 111, 112 및 113의 타겟 서열에 각각 상보적인 결합을 형성할 수 있는 가이드 핵산;
TET-2 유전자 핵산 서열 중 서열번호 126, 128 및 129의 타겟 서열에 각각 상보적인 결합을 형성할 수 있는 가이드 핵산;
PSGL-1 유전자 핵산 서열 중 서열번호 182의 타겟 서열에 각각 상보적인 결합을 형성할 수 있는 가이드 핵산;
FAS 유전자 핵산 서열 중 서열번호 252, 254, 257 및 264의 타겟 서열에 각각 상보적인 결합을 형성할 수 있는 가이드 핵산; 및
KDM6A 유전자 핵산 서열 중 서열번호 285의 타겟 서열에 각각 상보적인 결합을 형성할 수 있는 가이드 핵산.
상기 가이드 핵산은 비제한적으로, 18 내지 25 bp, 18 내지 24 bp, 18 내지 23 bp, 19 내지 23 bp, 19 내지 23 bp, 또는 20 내지 23 bp의 뉴클레오타이드일 수 있다.
또한, 구현예에서, 본 발명은 상기 인위적으로 조작된 면역조절 유전자 및 이로부터 발현되는 산물 중 1이상을 포함하는, 인위적으로 조작된 면역세포를 제공할 수 있다.
상기 세포는 비제한적으로 면역세포 및 줄기세포이다. 면역세포(immune cell)"는 면역반응에 관여하는 세포로서, 면역반응에 직접 또는 간접적으로 관여하는 모든 세포 및 이들의 분화하기 전 세포를 포함한다.
상기 줄기세포는 자가 복제와 분화 능력을 가진 배아줄기세포(embryonic stem cells), 성체줄기세포(adult stem cells), 유도만능줄기세포 (induced pluripotent stem cell; iPS cell) 또는 유도만능줄기세포로부터 유도된 세포 (e.g., an iPS cell generated from a subject, manipulated to alter (e.g., induce a mutation in) 일 수 있다.
상기 면역세포는 CD3 양성 세포(positive cell)일 수 있다. 예를 들어, T 세포 또는 CAR-T 세포일 수 있다.
상기 면역세포는 CD56 양성 세포(positive cell)일 수 있다. 예를 들어, NK 세포, 예컨대 NK92, primary NK 세포일 수 있다.
구현예에서, 상기 면역세포는 CD3 및 CD56 이중 양성 세포(CD3/CD56 double positive cell)일 수 있다. 예를 들어, NKT(Natural Killer T)세포 또는 CIK(Cytokine Induced Killer cell)일 수 있다.
구체적으로 예를 들어, 상기 세포는 T 세포, 예컨대 CD8+ T 세포 (e.g., CD8+ naive T 세포, CD8+ effector T 세포, central memory T 세포, 또는 effector memory T 세포), CD4+ T 세포, natural killer T 세포 (NKT 세포), regulatory T 세포 (Treg), 줄기세포 memory T 세포, 림프구 전구세포 (lymphoid progenitor cell), hematopoietic 줄기세포, natural killer 세포 (NK 세포), dendritic 세포, 싸이토카인 유도 살해세포(CIK: Cytokine Induced Killer cell), PBMC(Peripheral blood mononuclear cell), 단핵세포 (monocyte), 대식세포 (macrophage), NKT(Natural Killer T)세포등으로 이루어진 군에서 선택된 1종 이상일 수 있다. 바람직하게는 상기 면역세포는 T 세포, CAR-T 세포, NK 세포 또는 NKT 세포 등일 수 있다.
면역세포는 상기 면역조절 유전자의 활성이 억제 또는 불활성화되도록 인위적으로 조작될 수 있다.
면역 세포는 키메라 항원 수용체(CAR)를 추가로 더 포함할 수 있다.
일 예로 T 세포는 키메라 항원 수용체(CAR) 또는 조작된 TCR(T-세포 수용체)을 추가로 더 포함할 수 있다.
면역세포는 가이드핵산-에디터단백질 복합체 또는 이들을 암호화하는 핵산서열을 추가로 포함할 수 있다.
상기 에디터단백질은 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophilus) 유래의 Cas9 단백질, 스트렙토코커스 아우레우스 (Streptococcus aureus) 유래의 Cas9 단백질, 네이세리아 메닝기디티스 (Neisseria meningitidis)유래의 Cas9 단백질, 및 Cpf1 단백질로 이루어진 군에서 선택된 하나 이상일 수 있다. 일 예에서, 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질 또는 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질일 수 있다.
상기 가이드 핵산은 PD-1, CTLA-4, A20, DGKα, DGKζ, FAS, EGR2, PPP2R2D, PSGL-1, KDM6A, 및 TET2 로 구성된 군에서 선택된 하나 이상의 유전자의 핵산 서열의 일부와 각각 상보적인 결합을 형성할 수 있다. 0 내지 5, 0 내지 4, 0 내지 3, 0 내지 2개의 미스매치(mismatching)를 포함할 수 있다. 바람직한 예로서, 상기 가이드 핵산은 표 1의 서열번호 1 내지 289번의 타겟 서열 중 1 이상에 각각 상보적인 결합을 형성하는 뉴클레오타이드일 수 있다.
예를 들어, 서열번호 6 및 11 (A20), 서열번호 19, 20, 21, 및 23 (DGKa), 서열번호 25 (EGR2), 서열번호 64 (PPP2R2D), 서열번호 87 및 89 (PD-1), 서열번호 109, 110, 111, 112 및 113 (DGKζ), 서열번호 126, 128 및 129 (TET-2), 서열번호 182 (PSGL-1), 서열번호 252, 254, 257 및 264 (FAS), 및 서열번호 285 (KDM6A)의 타겟서열 중 1 이상에 각각 상보적인 결합을 형성하는 뉴클레오타이드일 수 있다.
일 구체예에서, 면역세포는 핵산서열 내 변형이 일어난, 인위적으로 조작된 DGKα 및 DGKζ유전자 중 1 이상을 포함할 수 있다.
다른 구체예에서, 면역세포는 핵산서열 내 변형이 일어난, 인위적으로 조작된 DGKα 및 DGKζ유전자를 함께 포함할 수 있다.
구현예에서, 목적하는 면역 반응을 야기하는 조성물을 제공한다. 약학적 조성물 또는 치료용 조성물로 칭할 수 있다.
구현예에서, 본 발명은 PD-1, CTLA-4, A20, DGKα, DGKζ, FAS, EGR2, PPP2R2D, PSGL-1, KDM6A, 및 TET2 로 구성된 군에서 선택된 하나 이상의 유전자의 핵산 서열 중 서열번호 1 내지 289번의 타겟 서열에 각각 상보적인 결합을 형성할 수 있는 가이드 핵산; 및 에디터단백질 또는 이를 암호화하는 핵산
을 포함하는 유전자 조작용 조성물을 제공한다.
관련 구성 설명은 상기 기술한 바와 같다.
구현예에서, 본 발명은 인체에서 분리된 면역세포에
(a) PD-1, CTLA-4, A20, DGKα, DGKζ, FAS, EGR2, PPP2R2D, PSGL-1, KDM6A, 및 TET2 로 구성된 군에서 선택된 하나 이상의 유전자의 핵산 서열 중 서열번호 1 내지 289번의 타겟 서열에 각각 상보적인 결합을 형성할 수 있는 가이드 핵산; 및
(b) 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophilus) 유래의 Cas9 단백질, 스트렙토코커스 아우레우스 (Streptococcus aureus) 유래의 Cas9 단백질, 네이세리아 메닝기디티스 (Neisseria meningitidis)유래의 Cas9 단백질, 및 Cpf1 단백질로 이루어진 군에서 선택된 하나 이상인 에디터 단백질을
접촉시키는 단계를 포함하는, 면역 세포를 인위적으로 조작하는 방법을 제공한다.
상기 가이드 핵산 및 에디터 단백질은, 각각 핵산 서열의 형태로 1 이상의 벡터에 존재하거나, 또는 가이드 핵산과 에디터 단백질의 결합으로 복합체를 형성하여 존재할 수 있다.
상기 접촉시키는 단계는 생체 내 또는 생체 외에서 수행될 수 있다.
접촉시키는 단계는 전기천공법 (electroporation), 리포좀, 플라스미드, 바이러스벡터, 나노파티클(nanoparticles) 및 PTD (Protein translocation domain) 융합 단백질 방법 중 선택되는 1이상의 방법으로 수행될 수 있다.
바이러스 벡터는 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스(AAV), 백시니아바이러스, 폭스바이러스 및 단순포진 바이러스로 구성된 군에서 선택되는 1이상일 수 있다.
구현예에서, PD-1, CTLA-4, A20, DGKα, DGKζ, FAS, EGR2, PPP2R2D, PSGL-1, KDM6A, 및 TET2 중 1 이상의 유전자를 서열분석함으로써 대상체에서 상기 면역 세포 표적 위치의 서열에 대한 정보를 제공하는 방법을 제공한다.
또한, 이러한 방법으로 제공받은 정보를 이용하여 라이브러리를 구축하는 방법을 제공한다.
구현예에서, 다음을 포함하는 유전자 조작용 키트를 제공한다.
(a) PD-1, CTLA-4, A20, DGKα, DGKζ, FAS, EGR2, PPP2R2D, PSGL-1, KDM6A, 및 TET2 로 구성된 군에서 선택된 하나 이상의 유전자의 핵산 서열 중 서열번호 1 내지 289번의 타겟 서열에 각각 상보적인 결합을 형성할 수 있는 가이드 핵산;
(b) 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophilus) 유래의 Cas9 단백질, 스트렙토코커스 아우레우스 (Streptococcus aureus) 유래의 Cas9 단백질, 네이세리아 메닝기디티스 (Neisseria meningitidis)유래의 Cas9 단백질, 및 Cpf1 단백질로 이루어진 군에서 선택된 하나 이상인 에디터 단백질 또는 이를 암호화하는 핵산.
이러한 키트를 이용하여 목적하는 유전자를 인위적으로 조작할 수 있다.
구현예에서, 본 발명은 대상체에 대한 인위적으로 조작된 세포, 예컨대 유전적으로 조작된 면역 세포 또는 줄기세포의 투여를 포함하는 면역요법 접근을 사용하는 질환 치료 용도의 모든 양태를 제공한다. 특히, 입양 면역요법에 유용하다.
치료 대상은 인간, 원숭이 등의 영장류, 마우스, 래트 등의 설치류 등을 포함하는 포유동물일 수 있다.
인위적으로 조작한 면역조절요소 및 이를 포함하는 세포에 의해 인위적으로 기능을 변형시킨 면역 시스템에 의해서, 효과적인 면역세포 치료제를 수득할 수 있다.
예를 들어, 본 발명의 방법, 조성물에 의해 인위적으로 면역조절요소를 조절할 경우, 면역세포의 생존(survival), 증식(proliferation), 지속(persistency), 세포독성(cytotoxicity), 사이토카인 분비(cytokine-release) 및/또는 침윤(infiltration) 등에 관여하는 면역 효능이 향상될 수 있다.
도 1은 DGK-alpha에 대한 sgRNA(#11; DGK-alpha#11로 표시)를 사용하여 DGK-alpha 유전자가 넉아웃된 세포에서의 CD25 MFI (median fluorescence intensity)를 보여주는 그래프이다.
도 2는 A20에 대한 sgRNA(#11; A20#11로 표시)를 사용하여 A20 유전자가 넉아웃된 세포에서의 CD25 MFI 를 보여주는 그래프이다.
도 3은 EGR2에 대한 sgRNA(#1; EGR2#1로 표시)를 사용하여 EGR2 유전자가 넉아웃된 세포에서의 CD25 MFI 를 보여주는 그래프이다.
도 4는 PPP2R2D에 대한 sgRNA(#10; PPP2R2D#10으로 표시)를 사용하여 PPP2R2D 유전자가 넉아웃된 세포에서의 CD25 MFI를 보여주는 그래프이다.
도 5는 DGK-alpha에 대한 sgRNA(#11; DGK-alpha#11로 표시)를 사용하여 DGKalpha 유전자가 넉아웃된 세포, A20에 대한 sgRNA(#11; A20#11로 표시)를 사용하여 A20 유전자가 넉아웃된 세포, EGR2에 대한 sgRNA(#1; EGR2#1로 표시)를 사용하여 EGR2 유전자가 넉아웃된 세포의 배양 배지 내의 IFN-gamma 수준을 각각 보여주는 그래프이다 (IFN-gamma 수준 단위: pg/ml).
도 6은 DGK-alpha에 대한 sgRNA(#11; DGK-alpha#11로 표시)를 사용하여 DGKalpha 유전자가 녹아웃된 세포, DGK-alpha에 대한 sgRNA(#8와 #11 함께 사용; DGKalpha#8+11로 표시)를 사용하여 DGK-alpha 유전자가 녹아웃된 세포, DGK-zeta에 대한 sgRNA(#5; DGK-zeta#5로 표시)를 사용하여 DGK-zeta 유전자가 녹아웃된 세포, 및 A20에 대한 sgRNA(#11; A20#11로 표시)를 사용하여 A20 유전자가 녹아웃된 세포
의 배양 배지 내의 IFN-gamma 수준을 각각 보여주는 그래프이다 (IFN-gamma 수준 단위: pg/ml).
도 7은 DGK-alpha#11 를 사용하여 DGK-alpha 유전자가 넉아웃된 세포, DGKalpha#8+11를 사용하여 DGK-alpha 유전자가 넉아웃된 세포, DGK-zeta#5를 사용하여 DGK-zeta 유전자가 넉아웃된 세포, 및 A20#11를 사용하여 A20 유전자가 넉아웃된 세포의 배양 배지 내의 IL-2 수준을 각각 보여주는 그래프이다 (IL-2 수준 단위:pg/ml).
도 8a은 인간 원발성 T 세포에서의 CRISPR/Cas9 매개된 DGK 유전자의 넉아웃 결과에 관한 것으로, (A) 인간 원발성 T 세포에서 유전자 넉아웃 타임라인(CD3/CD28 비즈에 의한 세포 활성화, 139 CAR의 렌티바이러스 전달, 전기천공법d을 이용한 DGK유전자의 넉아웃) (B) Mi-seq system을 이용한, DGKα 및 DGKζ 에 대한 인델(indel) 효율 확인한 결과 그래프이고, 도 8b는 Off-target 분석 결과를 나타낸 그래프이다.
도 9a는 DGK 유전자의 넉아웃에 의한 CAR-T 세포의 이펙터 및 증식 개선 효과를 나타낸 것으로, (A) flow cytometry를 이용한 7-AAD 양성 U87vIII 세포 측정에 따른 139 CAR-T 세포의 킬링 활성(Killing activity) 평가 결과 (B) ELISA (IFN-γ, IL-2 kit, Biolegend)에 의한 사이토카인 분비능 분석 결과이고, 도 9b는 flow cytometry를 이용한 139 CAR T-세포의 증식능 평가결과를 나타낸 그래프이다.
도 10은 DGKs 넉아웃이 항원 노출 후 139 CAR 발현을 강화시키고 CD3 말단 시그널링을 증폭시키는 결과에 관한 것으로, (A) CD3/CD28 비즈로 자극된, 139 CAR-T 세포들의 인산화된 ERK 시그널에 대한 웨스턴 블랏 결과, (B) flow cytometry를 이용한 139 CAR 발현 결과: 왼쪽은 항원 노출 여부에 따른 CAR 발현, 오른쪽은 항원 노출 3일 후 CAR 발현의 비교를 나타낸 그래프이다.
도 11은 DGKs 넉아웃이 tonic activation 및 T-cell exhaustion을 유도하지 않는 결과에 관한 것으로, (A) ELISA에 의한 IFN-γ 분비능 평가, (B) CAR-양성 T-세포에서 Exhaustion marker인 PD-1 (왼쪽) 및 TIM-3 (오른쪽) 분석 결과를 나타낸 그래프이다.
도 12는 DGK-넉아웃된 T-세포가 TGF-β 및 PGE2의 면역억제효과를 피하는 결과에 관한 것으로, (A) TGF-β (10ng/mL) 유무 여부에 따른, 139 CAR-T 및 139 DGKαζ CAR-T 세포의 킬링 활성, IFN-γ 분비능 및 IL-2 분비능 평가 (B) PGE2 (0.5 ug/mL) 유무 여부에 따른, 139 CAR-T 및 139 DGKαζ CAR-T 세포의 킬링활성(Killing activity), IFN-γ 분비능 및 IL-2 분비능 평가 결과를 나타낸 그래프이다.
도 13은 human NK 세포에서의 CRISPR/Cas9 매개에 의한 DGKα의 넉아웃 효율 및 이펙터 기능에 대한 영향에 관한 것으로, (A) 및 (B)는 Mi-seq system을 이용한 NK-92 세포 및 human primary NK 세포에서의 넉아웃 효율 분석을 나타낸 그래프이고, (C)는 7-AAD 양성 Raji 세포 측정에 의한 NK-92의 킬링 활성(Killing activity)을 나타낸 그래프이다.
도 14는 human NKT세포에서의 CRISPR/Cas9 매개에 의한 DGKα, DGKζ의 넉아웃 효율을 나타낸 것으로, (A) 인델 효율, (B)세포 성장 (C) 세포 생존능 평가 결과와 (D) 단백질 수준에서 발현 여부를 확인하기 위한 웨스턴 블랏 실험 결과를 나타낸 것이다.
도 15는 human NKT세포에서의 DGKα, DGKζ의 넉아웃이 이펙터 기능에 미치는 영향에 관한 것으로, DGKα, DGKζ의 각각 및 동시 넉아웃의 (A) 킬링 활성 및 (B) ELISA (IFN- kit, Biolegend)에 의한 IFN-γ분비능을 확인한 그래프이다.
도 16은 human NKT세포에서의 DGKα, DGKζ의 넉아웃의 기능 평가를 위해, NKT 세포에서 PA-1을 넉아웃시킨 후, (A) 인델 효율 및 (B)세포독성의 향상, 즉 킬링 활성의 향상을 나타낸 그래프이다.
도 17a 내지 17c는 Jurkat 세포에서의 hPSGL-1 sgRNA 스크리닝을 위한 분석 결과를 나타낸 것으로 인델 효율 및 넉아웃 후 PSGL-1을 발현하지 않는 Jurtat 세포의 정도(17a)와 넉아웃 후 Jurkat 세포 표면에서 발현하는 PSGL-1의 발현 정도를 나타낸 그래프(17b,17c)이다.
도 18은 인간 원발성 T 세포(human primary T cells)에서의 hPSGL-1 넉아웃(KO) 실험 결과로, (A) 인델 효율 및 (B) 넉아웃 후 PSGL-1을 발현하지 않는 T 세포의 정도 및 (C) 넉아웃 후 T세포 표면에서 발현하는 PSGL-1의 발현 정도를 나타낸 그래프이다.
달리 정의되지 않는 한, 본 명세서에서 사용되는 모든 기술적 및 과학적 용어는 본 발명이 속하는 기술분야의 당업자에 의해 통상적으로 이해되는 것과 동일한 의미를 가진다. 본 명세서에 기재된 것과 유사 또는 동일한 방법 및 물질이 본 발명의 실행 또는 시험에서 사용될 수 있지만, 적합한 방법 및 물질이 이하에 기재된다. 본 명세서에 언급된 모든 간행물, 특허 출원, 특허 및 기타 다른 참고문헌은 전체가 참고로 포함된다. 추가로, 물질, 방법 및 실시예는 단지 예시적이며, 제한하는 것으로 의도되지 않는다
본 발명은 개선된 면역효과를 갖는, 인위적으로 조작한 면역 시스템에 관한 것이다. 보다 구체적으로, 인위적으로 조작한 면역조절요소 및 이를 포함하는 세포를 포함하는, 인위적으로 기능을 변형시킨 면역 시스템에 관한 것이다.
[면역조절요소]
면역조절요소( immune regulatory factor )
"면역조절요소"는 면역반응의 형성 및 수행과 관련된 기능을 하는 물질로서, 비자연적인, 즉, 인위적으로 조작된, 면역반응 조절 기능을 가질 수 있는 다양한 물질을 모두 포함한다. 예를 들어, 유전적으로 조작된 또는 변형된, 면역세포에서 발현되는 유전자 또는 단백질일 수 있다.
"인위적으로 조작된"이라는 용어는 자연상태에서 일어나는 존재 그대로의 상태가 아닌, 인위적으로 변형을 가한 상태를 의미한다.
"유전적으로 조작된"이라는 용어는 본 발명에서 언급하는 생물 또는 비생물 유래 물질에 대하여 인위적으로 유전적 변형을 가하는 조작이 이루어진 경우를 의미하는 것으로, 예를 들어, 특정 목적 하 인위적으로 게놈을 변형시킨 유전자 및/또는 유전자 산물(폴리펩타이드, 단백질 등)일 수 있다.
바람직한 예로서, 본 발명은 특정 목적을 위해 유전적으로 조작된 또는 변형된 면역조절요소를 제공한다.
이하 분설한 요소들은 면역조절요소의 일 예일 뿐이므로 본 발명이 포괄하는 면역조절요소들의 종류들을 한정하는 것이 아니다. 이하 나열된 유전자 또는 단백질은 단 한 종류의 면역조절요소적 기능만 갖는 것이 아니라, 복수 종류의 기능이 있을 수 있다. 또한, 필요에 따라 2이상의 면역조절요소를 제공할 수 있다.
[면역세포활성조절요소(immune cell activity regulating elements)]
"면역세포활성조절요소"는 면역반응의 정도 또는 활성을 조절하는 기능을 하는 요소로서, 예를 들어, 유전적으로 조작된 또는 변형된, 면역반응의 정도 또는 활성을 조절하는 기능을 하는 유전자 또는 단백질일 수 있다.
면역세포활성조절요소는 면역세포의 활성화 또는 비활성화에 관련된 기능을 할 수 있다.
면역세포활성조절요소는 면역반응을 촉진하거나 향상시키는 기능을 할 수 있다.
면역세포활성조절요소는 면역반응을 억제하는 기능을 할 수 있다.
면역세포활성조절요소는 세포막의 채널 단백질, 수용체와 결합하여 면역반응을 조절하는 신호 전달 및 단백질의 합성, 분해에 관련된 기능을 할 수 있다.
예를 들어,
면역세포활성조절요소는 PD-1일 수 있다.
PD-1 유전자 (PDCD1 유전자로도 칭해짐; 이하, PD-1 유전자와 PDCD1유전자는 동일한 유전자를 의미하기 위하여 사용됨)는 CD279 (cluster of differentiation 279)로도 칭해지는 단백질 PD-1 (Programmed cell death protein)을 암호화하는 유전자 (전장 DNA, cDNA 또는 mRNA)를 의미한다. 일 예에서, PD-1 유전자는 다음으로 이루어진 군에서 선택된 하나 이상일 수 있으나, 이에 제한되는 것은 아니다: 인간 PD-1 (e.g., NCBI Accession No. NP_005009.2 등)을 암호화하는 유전자, 예컨대, NCBI Accession No. NM_005018.2, NG_012110.1 등으로 표현되는 PD-1 유전자.
면역세포활성조절요소는 CTLA-4일 수 있다.
CTLA-4 (cytotoxic T-lymphocyte-associated protein 4) 유전자는 CD152 (cluster of differentiation 152)로도 칭해지는 단백질 CTLA-4를 암호화하는 유전자 (전장 DNA, cDNA 또는 mRNA)를 의미한다. 일 예에서, CTLA-4 유전자는 다음으로 이루어진 군에서 선택된 하나 이상일 수 있으나, 이에 제한되는 것은 아니다: 인간 CTLA-4 (e.g., NCBI Accession No. NP_001032720.1,NP_005205.2 등)을 암호화하는 유전자, 예컨대, NCBI Accession No.NM_001037631.2, NM_005214.4, NG_011502.1 등으로 표현되는 CTLA-4 유전자.
면역세포활성조절요소는 CBLB일 수 있다.
면역세포활성조절요소는 PSGL-1일 수 있다.
면역세포활성조절요소는 ILT2일 수 있다.
면역세포활성조절요소는 KIR2DL4일 수 있다.
면역세포활성조절요소는 SHP-1일 수 있다.
상기 유전자들은 인간, 원숭이 등의 영장류, 래트, 마우스 등의 설치류 등을 포함하는 포유류로부터 유래하는 것일 수 있다.
일 구체예에서, 면역세포활성조절요소는 면역반응을 촉진하는 기능을 할 수 있다.
상기 면역세포활성조절요소는 면역세포생장조절요소(immune cell growth regulating element)일 수 있다.
"면역세포생장조절요소"는 면역세포 내의 단백질 합성 등을 조절하여 면역세포의 생장을 조절하는 기능을 하는 요소를 의미하고, 예를 들어, 면역세포에서 발현되는 유전자 또는 단백질일 수 있다.
상기 면역세포생장조절요소는 DNA의 전사, RNA의 해독, 세포 분화에 관련된 기능을 할 수 있다.
면역세포생장조절요소의 예는 NFAT, IκB/NF-κB, AP-1, 4E-BP1, eIF4E, S6의 발현 경로(pathway)에 관여하는 유전자 또는 단백질일 수 있다.
예를 들어,
면역세포생장조절요소는 DGK-alpha일 수 있다.
DGKA (Dgk-alpDha) 유전자는 DGKA (Diacylglycerol kinase alpha)를 암호화하는 유전자 (전장 DNA, cDNA 또는 mRNA)를 의미한다. 일 예에서, DGKA 유전자는 다음으로 이루어진 군에서 선택된 하나 이상일 수 있으나, 이에 제한되는 것은 아니다: 인간 DGKA (e.g., NCBI Accession No. NP_001336.2, NP_958852.1,NP_958853.1, NP_963848.1 등)을 암호화하는 유전자, 예컨대, NCBI Accession No. NM_001345.4, NM_201444.2, NM_201445.1, NM_201554.1, NC_000012.12 등으로 표현되는 DGKA 유전자.
면역세포생장조절요소는 DGK-zeta일 수 있다.
DGKZ (Dgk-zeta) 유전자는 DGKZ (Diacylglycerol kinase zeta)를 암호화하는 유전자 (전장 DNA, cDNA 또는 mRNA)를 의미한다. 일 예에서, DGKZ 유전자는 다음으로 이루어진 군에서 선택된 하나 이상일 수 있으나, 이에 제한되는 것은 아니다:인간 DGKZ (e.g., NCBI Accession No. NP_001099010.1, NP_001186195.1, NP_001186196.1, NP_001186197.1, NP_003637.2, NP_963290.1, NP_963291.2 등)을 암호화하는 유전자, 예컨대, NCBI Accession No. NM_001105540.1, NM_001199266.1, NM_001199267.1, NM_001199268.1, NM_003646.3, NM_201532.2, NM_201533.3, NG_047092.1 등으로 표현되는 DGKZ 유전자.
면역세포생장조절요소는 EGR2일 수 있다.
EGR2 유전자는 EGR2 (Early growth response protein 2)를 암호화하는 유전자 (전장 DNA, cDNA 또는 mRNA)를 의미한다. 일 예에서, EGR2 유전자는 다음으로 이루어진 군에서 선택된 하나 이상일 수 있으나, 이에 제한되는 것은 아니다:
면역세포생장조절요소는 EGR3일 수 있다.
면역세포생장조절요소는 PPP2R2D일 수 있다.
면역세포생장조절요소는 A20(TNFAIP3)일 수 있다.
면역세포생장조절요소는 PSGL-1일 수 있다.
상기 유전자들은 인간, 원숭이 등의 영장류, 래트, 마우스 등의 설치류 등을 포함하는 포유류로부터 유래하는 것일 수 있다.
상기 면역세포활성조절요소는 면역세포사멸조절요소(immune cell death regulating element)일 수 있다.
"면역세포사멸조절요소"는 면역세포의 사멸에 관련된 기능을 하는 요소로서, 이러한 기능을 하는, 면역세포에서 발현되는 유전자 또는 단백질일 수 있다.
상기 면역세포사멸조절요소는 면역세포의 세포 사멸(apoptosis) 또는 세포괴사(necrosis)에 관련된 기능을 할 수 있다.
일 구체예로, 면역세포사멸조절요소는 caspase cascade-associated 단백질 또는 유전자일 수 있다.
면역세포사멸조절요소는 Fas일 수 있다. 이하 단백질 또는 유전자를 언급할 때, 그 단백질 또는 유전자가 작용하는 수용체, 결합부분을 조작할 수 있음은 통상의 기술자에게 당연하다.
다른 구체예로, 면역세포사멸조절요소는 Death domain-associated 단백질 또는 유전자일 수 있다. 이때, 면역세포사멸조절요소는 Daxx일 수 있다.
면역세포사멸조절요소는 Bcl-2 family 단백질일 수 있다.
면역세포사멸조절요소는 BH3-only family 단백질일 수 있다.
면역세포사멸조절요소는 Bim일 수 있다.
면역세포사멸조절요소는 Bid일 수 있다.
면역세포사멸조절요소는 BAD일 수 있다.
면역세포사멸조절요소는 면역세포외막에 위치한 리간드 또는 수용체일 수 있다.
이때, 면역세포사멸조절요소는 PD-1일 수 있다.
또한, 면역세포사멸조절요소는 CTLA-4일 수 있다.
상기 면역세포활성조절요소는 면역세포기능소실요소(immune cell exhaustion regulating element)일 수 있다.
"면역세포기능소실요소"는 면역세포의 점진적인 기능의 소실에 관련된 기능을 하는 요소로서, 이러한 기능을 하는, 면역세포에서 발현되는 유전자 또는 단백질일 수 있다.
면역세포기능소실요소는 면역세포의 비활성화에 관여하는 유전자의 전사 또는 번역을 돕는 기능을 할 수 있다.
이때, 전사를 돕는 기능은 해당 유전자를 demethylation하는 기능일 수 있다.
또한, 면역세포의 비활성화에 관여하는 유전자는 상기 면역세포활성조절요소의 유전자를 포함한다.
이때, 면역세포기능소실요소는 TET2일 수 있다.
인간 TET2 (e.g., NCBI Accession No. NP_001120680.1, NP_060098.3 등)을 암호화하는 유전자, 예컨대, NCBI Accession NM_001127208.2, No. NM_017628.4, NG_028191.1 등으로 표현되는 TET2 유전자
면역세포기능소실요소는 면역세포의 지나친 성장에 관여하는 기능을 할 수 있다. 지나친 성장만을 하고 재생하지 않는 면역세포는 기능을 소실하게 된다.
이때, 면역세포기능소실요소는 Wnt일 수 있다. 이하 단백질 또는 유전자를 언급할 때, 그 단백질 또는 그 단백질이 포함된 신호 전달 경로에 있는 유전자 및 그 유전자가 작용하는 수용체, 결합부분을 조작할 수 있음은 통상의 기술자에게 당연하다.
또한, 면역세포기능소실요소는 Akt일 수 있다. 이하 단백질 또는 유전자를 언급할 때, 그 단백질 또는 그 단백질이 포함된 신호 전달 경로에 있는 유전자 및 그 유전자가 작용하는 수용체, 결합부분을 조작할 수 있음은 통상의 기술자에게 당연하다.
상기 면역세포활성조절요소는 사이토카인 분비요소(cytokine production regulating element)일 수 있다
"사이토카인 분비요소"는 면역세포의 사이토카인 분비에 관여하는 요소로 이러한 기능을 하는, 면역세포에서 발현되는 유전자 또는 단백질일 수 있다.
사이토카인(cytokine)은 면역 세포가 분비하는 단백질을 통틀어 일컫는 말로서, 생체에서 중요한 역할을 하는 신호 단백질이다. 감염, 면역, 염증, 외상(trauma), 부패, 암 등에 관여한다. 사이토카인은 세포로부터 분비된 후 다른 세포나 분비한 세포 자신에게 영향을 줄 수 있다. 예를 들어, 대식세포의 증식을 유도하거나 분비 세포 자신의 분화를 촉진하기도 한다. 하지만 지나치게 많은 양으로 분비되는 경우 정상 세포를 공격하는 등의 문제가 나타나므로 면역 반응에서는 사이토카인의 적절한 분비도 중요하다.
사이토카인 분비요소는 예를 들어, 바람직하게는 TTNFα, IFN-γ, TGF-β, IL-2, IL-4, IL-10, IL-13, IL-1, IL-6, IL-12, IL-7, IL-15, IL-17, IFN-α로에 있는 유전자 또는 단백질일 수 있다.
또는, 상기 사이토카인은 다른 면역세포에게 신호를 전달하여 면역세포가 인식한 항원보유세포를 사멸시키도록 유도하거나 분화를 돕는 기능을 할 수 있다. 이때, 사이토카인 분비요소는 바람직하게는 IL-2 분비에 관한 유전자 경로에 있는 유전자 또는 단백질일 수 있다.
구현예에서, 상기 면역조절요소는 면역세포에서 발현하는 분자의 일군을 의미할 수 있다. 이들 분자는 면역 응답을 하향/상향 제어 또는 저해/촉진하기 위해 효과적으로 작용할 수 있다.
예를 들어, T세포가 발현하는 분자의 일군으로서 "면역 체크 포인트" 는 면역 세포를 직접 저해하는, Programmed Death1(PD-1. PDCD1 또는 CD279, accession 번호 :NM_005018) 세포 상해성 T림프구 항원 4(CTLA-4 또는 CD152, GenBank accession 번호 AF414120.1), LAG3(CD223, accession 번호 :NM_002286.5), Tim3(HAVCR2, GenBank accession 번호 :JX049979.1), BTLA(CD272, accession 번호 :NM_181780.3), BY55(CD160, GenBank accession 번호 :CR541888.1), TIGIT(IVSTM3, accession 번호:NM_173799), LAIR1(CD305, GenBank accession 번호 :CR542051.1), SIGLEC10(GeneBank accession 번호 :AY358337.1), 2B4(CD244, accession 번호 :NM_001166664.1), PPP2CA, PPP2CB, PTPN6, PTPN22, CD96, CRTAM, SIGLEC7, SIGLEC9, TNFRSF10B, TNFRSF10A, CASP8, CASP10, CASP3, CASP6, CASP7, FADD, FAS, TGFBRII, TGFRBRI, SMAD2, SMAD3, SMAD4, SMAD10, SKI, SKIL,TGIF1, IL10RA, IL10RB, HMOX2, IL6R, IL6ST,EIF2AK4, CSK, PAG1, SIT1, FOXP3, PRDM1, BATF,GUCY1A2, GUCY1A3, GUCY1B2, GUCY1B3일 수 있지만, 이것으로 한정되지 않는다.
본 발명의 일 구현예에서는 면역조절요소로서 예를 들어, 유전적으로 조작된 또는 변형된, PD-1 유전자, CTLA-4 유전자, TNFAIP3(A20) 유전자, DGKA 유전자, DGKZ 유전자, FAS 유전자, EGR2 유전자, PPP2R2D 유전자, TET2 유전자, PSGL-1 유전자, 및 KDM6A 유전자일 수 있다.
본 발명의 일 구현예에서는 면역조절요소로서 유전적으로 조작된 또는 변형된 2이상의 유전자를 포함할 수 있다. 예를 들어, PD-1 유전자, CTLA-4 유전자, TNFAIP3(A20) 유전자, DGKA 유전자, DGKZ 유전자, FAS 유전자, EGR2 유전자, PPP2R2D 유전자, TET2 유전자, PSGL-1 유전자, 및 KDM6A 유전자로 구성된 군에서 선택되는 2이상의 유전자를 조작 또는 변형할 수 있다.
본 발명의 바람직한 예로서 유전적으로 조작된 또는 변형된 TNFAIP3, DGKA, DGKZ, FAS, EGR2, PSGL-1, KDM6A 유전자일 수 있다.
상기 유전자 조작 또는 변형은 야생 형태(wild type) 유전자의 게놈 서열 중 일부 또는 전부 영역에 인위적으로 삽입, 결실, 치환, 역위 변이를 일으킴으로써 수득할 수 있다. 또한, 상기 유전자 조작 또는 변형은 2이상의 유전자의 조작 또는 변형을 융합시킴으로써 수득할 수도 있다
예를 들어, 이러한 유전자 조작 또는 변형으로 상기 유전자를 불활성화시킴으로써 이 유전자로부터 코딩되는 단백질이 본래의 기능을 갖는 단백질 형태로 발현되지 않도록 하는 것일 수 있다.
예를 들어, 이러한 유전자 조작 또는 변형으로 상기 유전자를 더욱 활성화시킴으로써 이 유전자로부터 코딩되는 단백질이 본래의 기능보다 향상된 기능을 갖는 단백질 형태로 발현되도록 하는 것일 수 있다. 일 예로, 특정 유전자에 의해 코딩되는 단백질의 기능이 A인 경우, 조작된 유전자에 의해 발현되는 단백질의 기능은 A와 전혀 다르거나 또는 A를 포함하는 추가의 기능(A+B)을 함께 가질 수 있다.
예를 들어, 이러한 유전자 조작 또는 변형으로 서로 상이한 또는 서로 보완되는 기능을 가지는 2 이상의 유전자를 이용하여 2 이상의 단백질이 융합된 형태로 발현되도록 하는 것일 수 있다.
예를 들어, 이러한 유전자 조작 또는 변형으로 서로 상이한 또는 서로 보완되는 기능을 가지는 2 이상의 유전자를 이용하여 2 이상의 단백질이 세포 내에서 각각 분리된 독립적인 형태로 발현되도록 하는 것일 수 있다.
유전자 정보는 NCBI (National Center for Biotechnology Information)의 GenBank와 같은 공지의 데이터 베이스에서 얻을 수 있다.
일 구체예로, 유전자의 조작 또는 변형은 다음 중 하나 이상에 의하여 유도된 것일 수 있다:
변형 대상 유전자 (이하, '타겟 유전자')의 전부 또는 일부결실, 예컨대, 타겟 유전자의 1bp 이상의 뉴클레오타이드, 예컨대, 1 내지 30개, 1내지 27개, 1 내지 25개, 1 내지 23개, 1 내지 20개, 1 내지 15개, 1 내지 10개, 1내지 5개, 1 내지 3개, 또는 1개의 뉴클레오타이드의 결실,
타겟 유전자의 1bp 이상의 뉴클레오타이드, 예컨대, 1 내지 30개, 1 내지 27개, 1 내지 25개, 1 내지 23개, 1 내지 20개, 1 내지 15개, 1 내지 10개, 1 내지 5개, 1 내지 3개, 또는 1개의 뉴클레오타이드의 원래(야생형)와 상이한 뉴클레오타이드로의 치환, 및 하나 이상의 뉴클레오타이드, 예컨대, 1 내지 30개, 1 내지 27개, 1 내지 25개, 1 내지 23개, 1 내지 20개, 1 내지 15개, 1 내지 10개, 1 내지 5개, 1 내지 3개, 또는 1개의 뉴클레오타이드 (각각 독립적으로 A, T, C 및 G 중에서 선택됨)의 타겟 유전자의 임의의 위치에의 삽입.
상기 타겟 유전자의 변형되는 일부 ('타겟 부위')는 상기 유전자 중의 1bp 이상, 3bp 이상, 5bp 이상, 7bp 이상, 10bp 이상, 12bp 이상, 15bp 이상,17bp 이상, 20bp 이상, 예컨대, 1bp 내지 30bp, 3bp 내지 30bp, 5bp 내지 30bp,7bp 내지 30bp, 10bp 내지 30bp, 12bp 내지 30bp, 15bp 내지 30bp, 17bp 내지 30bp, 20bp 내지 30bp, 1bp 내지 27bp, 3bp 내지 27bp, 5bp 내지 27bp, 7bp 내지 27bp, 10bp 내지 27bp, 12bp 내지 27bp, 15bp 내지 27bp, 17bp 내지 27bp, 20bp 내지 27bp, 1bp 내지 25bp, 3bp 내지 25bp, 5bp 내지 25bp, 7bp 내지 25bp, 10bp 내지 25bp, 12bp 내지 25bp, 15bp 내지 25bp, 17bp 내지 25bp, 20bp 내지 25bp, 1bp 내지 23bp, 3bp 내지 23bp, 5bp 내지 23bp, 7bp 내지 23bp, 10bp 내지 23bp, 12bp 내지 23bp, 15bp 내지 23bp, 17bp 내지 23bp, 20bp 내지 23bp, 1bp 내지 20bp, 3bp 내지 20bp, 5bp 내지 20bp, 7bp 내지 20bp, 10bp 내지 20bp, 12bp 내지 20bp, 15bp 내지 20bp, 17bp 내지 20bp, 21bp 내지 25bp, 18bp 내지 22bp, 또는 21bp 내지 23bp의 연속하는 염기서열 부위일 수 있다.
[면역조절요소 함유 세포]
본 발명의 일 양태는 상기 인위적으로 조작된 면역조절요소를 포함하는 세포이다.
상기 세포는 비제한적으로 면역세포 및 줄기세포이다.
본 발명의 "면역세포(immune cell)"는 면역반응에 관여하는 세포로서, 면역반응에 직접 또는 간접적으로 관여하는 모든 세포 및 이들의 분화하기 전 세포를 포함한다.
면역세포는 사이토카인의 분비, 다른 면역세포로의 분화, 세포 독성의 기능을 가질 수 있다. 면역세포는 자연상태로부터 변이가 일어난 세포도 포함한다.
면역세포들은 골수에 있는 조혈모세포 (hematopoietic stem cell)로부터 분화하여 크게 림포이드계열 전구세포 (lymhoid progenitor cells)와 미엘로이드계열 전구세포(myeloid progenitor cells)를 포함한다. 림포이드계열 전구세포가 분화하여 후천면역을 담당하는 T세포 및 B 세포; 및 미엘로이드계열 전구세포로부터 분화한 대식세포 (macrophage), 호산구(eosinophil), 호중구 (basophil), 호염기구(basophil), 과립거대핵세포 (megakaryocyte), 적혈구 (erythrocyte) 등을 모두 포함한다.
구체적으로 예를 들어, 상기 세포는 T 세포, 예컨대 CD8+ T 세포 (e.g., CD8+ naive T 세포, CD8+ effector T 세포, central memory T 세포, 또는 effector memory T 세포), CD4+ T 세포, natural killer T 세포 (NKT 세포), regulatory T 세포 (Treg), 줄기세포 memory T 세포, 림프구 전구세포 (lymphoid progenitor cell), hematopoietic 줄기세포, natural killer 세포 (NK 세포), dendritic 세포, 싸이토카인 유도 살해세포(CIK: Cytokine Induced Killer cell), PBMC(Peripheral blood mononuclear cell), 단핵세포 (monocyte), 대식세포 (macrophage), NKT(Natural Killer T)세포등으로 이루어진 군에서 선택된 1종 이상일 수 있다. 대식세포 및 수지상 세포는 그 세포 표면 상의 주요 조직적합성 복합체(MHC) 수용체가 T 세포 표면 상의 TCR과 상호작용하는 경우 T 세포를 활성화할 수 있는 특수화 세포인 "항원 제시 세포" 또는 "APC"로 지칭될 수 있다. 대안적으로, TCR 또는 다른 항원 결합 단백질(예를 들면, CAR)에 의해 인식되는 항원을 발현하는 핵산 분자를 도입함으로써 임의의 조혈 줄기세포 또는 면역계 세포를 APC로 전환시킬 수 있다.
구현예에서, 상기 면역세포는 MHC 인식 및/또는 면역 기능에 연관된 단백질(예를 들어, 면역 체크 포인트 단백질)을 합성하는 유전자를 불활성화 또는 교환함으로써 면역 요법으로 사용되는 세포일 수 있다.
구현예에서, 상기 면역세포는 특이적인 세포 인식을 위해 단쇄 및 멀티 서브유닛의 수용체(예를 들어, CAR, TCR)를 코드하는 폴리뉴클레오타이드를 추가로 포함할 수 있다.
구현예에서, 본 발명의 면역세포는 건강한 공여자 및/또는 환자의 혈액(예컨대, peripheral blood), 줄기세포 (예컨대, 배아줄기세포(embryonic stem cell), 유도만능줄기세포(induced pluripotent stem cell) 등), 제대혈(cord blood), 골수(bone marrow) 등에서 유래하는 면역세포일 수 있으며, 생체 외에서 조작된 것일 수 있다.
구현예에서, 상기 면역세포는 CD3 양성 세포(CD3 positive cell)일 수 있다. 예를 들어, T 세포 또는 CAR-T 세포일 수 있다. CD3는 T cell 표면에서 TCR과 여러가지의 단백질이 하나의 복합체로 존재하는 수용체이다. γ, δ, ε, ζ, η chain 이라고 불리는 다섯 가지의 단백질이 CD3를 이루고 있으며, 이들은 TCR과 함께 αβ:γδεζζ 또는 αβ:γδεζη 상태의 TCR/CD3 복합체로 존재한다. 이들은 T cell의 항원 인식 시, 세포 내로 활성화 신호를 전달 (signal transduction)하는 기능을 가지고 있는 것으로 알려져 있다.
구현예에서, 상기 면역세포는 CD56 양성 세포(CD56 positive cell)일 수 있다. 예를 들어, NK 세포, 예컨대 NK92, primary NK 세포일 수 있다.
NK 세포는 면역세포 중 3번째로 많은 수를 가지고 있으며 말초혈액의 면역세포 중 약 10%가 NK 세포이다. NK 세포는 CD56과 CD16을 가지고 있으며 간이나 골수에서 성숙한다. 바이러스 감염세포나 종양 세포를 공격하는데, 비정상세포를 인지하면 퍼포린을 세포막에 뿌려 세포막을 녹여 구멍을 내고, 그랜자임을 세포막 내에 뿌려 세포질을 해체함으로써 세포사멸(apotosis)을 일으키거나, 세포 내부에 물과 염분을 주입해서 세포괴사(necrosis)를 일으킨다.여러 암세포를 죽이는 기능을 가지고 있다. 특히, NK 세포는 외부 유전 물질의 도입이 용이하지 않은 세포로 잘 알려져 있다.
구현예에서, 상기 면역세포는 CD3 및 CD56 이중 양성 세포(double positive cell)일 수 있다. 예를 들어, NKT(natural killer T) 또는 CIK(cytokine-induced killer cell) 세포일 수 있다.
Natural killer T(NKT) 또는 CIK(cytokine-induced killer cell)세포는 일반적으로 T 세포 마커인 CD3와 자연 살해세포(natural killer cell, NK cell) 마커인 CD56 분자를 동시에 발현하는 면역세포이다. T 세포로부터 유래되어 NK 세포의 특징과 기능을 모두 가지고 있기 때문에 주조직적합성복합체(MHC)와 무관하게 종양세포를 사멸한다. 특히, NKT(Natural Killer T) 세포는 T 세포의 수용체(TCR)와 NK 세포 특이적인 표면 마커인 NK1.1 혹은 NKR-P1A(CD161)를 발현하는 세포이다.
일 예로서, NKT 세포는 MHC class I과 유사한 구조의 monomorphic 단백질인 CD1d에 의해 제시(presentation)되는 glycolipid를 인지한다. NKT 세포는 α-GalCer 와 같은 ligand에 의해서 활성 되었을 때 IL-4, IL-13, IL-10, IFN-γ 와 같은 다양한 종류의 사이토카인들을 분비한다. 또한, 상기 NKT 세포는 anti-tumor activity를 갖고 있다.
다른 예로, CIK 세포는 혈액을 채취하여 체외에서 인터루킨 2와 CD3 항체를 처리하여 2-3주간 배양할 때 증식되는 면역세포의 일종으로, CD3, CD56에 양성인 세포이다. CIK세포는 다량의 IFN-γ와 TNF-α를 생성한다.
구현예에서, 상기 세포는 자가 복제와 분화 능력을 가진 배아줄기세포(embryonic stem cells), 성체줄기세포(adult stem cells), 유도만능줄기세포 (induced pluripotent stem cell; iPS cell) 또는 유도만능줄기세포로부터 유도된 세포 (e.g., an iPS cell derived cell) 일 수 있다.
본 발명의 바람직한 예로서의 세포는 면역조절요소인, 조작 또는 변형된 유전자를 포함한다.
상기 세포는 조작 또는 변형된 유전자의 일부 또는 전부; 또는 그 발현 산물을 포함할 수 있다.
예를 들어, 유전자 조작 또는 변형으로 해당 유전자를 불활성화시킴으로써 이 유전자로부터 코딩되는 단백질이 본래의 기능을 갖는 단백질 형태로 발현되지 않는 세포일 수 있다.
예를 들어, 이러한 유전자 조작 또는 변형으로 상기 유전자를 더욱 활성화시킴으로써 이 유전자로부터 코딩되는 단백질이 본래의 기능보다 향상된 기능을 갖는 단백질 형태로 발현되는 세포일 수 있다.
예를 들어, 이러한 유전자 조작 또는 변형으로 이 유전자로부터 코딩되는 단백질이 본래의 기능 및/또는 이외의 기능을 하는 단백질 형태로 발현되도록 하는 것일 수 있다
예를 들어, 이러한 유전자 조작 또는 변형으로 서로 상이한 또는 서로 보완되는 기능을 가지는 2 이상의 유전자를 이용하여 2 이상의 단백질이 변형된 형태로 발현되는 세포일 수 있다.
예를 들어, 이러한 유전자 조작 또는 변형으로 IL-2, TNFα 및 IFNγ 의 3 종류의 사이토카인 생성 또는 분비능이 높은 면역 세포일 수 있다
일 예로서, 본 발명의 세포는 하기와 같은 구성을 추가로 포함할 수 있다.
- 수용체
본 발명의 세포는 "면역 수용체(immune receptor)"를 포함할 수 있다.
"면역 수용체(immune receptor)"는 인위적으로 조작 또는 변형된 면역세포 표면에 존재하는 수용체로서, 면역 반응에 관여하는 물질, 예를 들어 항원을 인식하고 특정 기능을 하는 기능체를 의미한다.
상기 수용체는 야생 상태 또는 인위적으로 조작된 상태일 수 있다
수용체는 항원에 대한 친결합성을 가질 수 있다.
수용체는 MHC 구조단백질과 구조단백질에 개시된 항원이 이루는 구조에 대한 인식능력을 가질 수 있다.
수용체는 면역반응신호를 생성할 수 있다.
"면역반응신호"는 면역반응 과정에서 생겨나는 일체의 신호를 의미한다.
면역반응신호는 면역세포의 생장 및 분화와 관련된 신호일 수 있다.
면역반응신호는 면역세포의 사멸과 관련된 신호일 수 있다.
면역반응신호는 면역세포의 활성과 관련된 신호일 수 있다.
면역반응신호는 면역반응의 보조와 관련된 신호일 수 있다.
면역반응신호는 목적 유전자의 발현을 조절하는 신호일 수 있다.
면역반응신호는 사이토카인의 합성을 촉진 또는 억제하는 것일 수 있다.
면역반응신호는 사이토카인의 분비를 촉진 또는 억제하는 것일 수 있다
면역반응신호는 다른 면역세포의 생장 또는 분화를 돕는 신호일 수 있다.
면역반응신호는 다른 면역세포의 활성을 조절하는 신호일 수 있다.
면역반응신호는 다른 면역세포를 신호가 발생하는 위치로 유인하는 신호일 수 있다.
일 구체예로,
상기 수용체는 TCR(T cell receptor)일 수 있다.
일 예에서, 상기 세포는 특정 T 세포 수용체 (TCR) 유전자(e.g., TRAC 또는 TRBC 유전자)를 포함하도록 변형된 것일 수 있다. 다른 예에서, 상기 TCR은 tumor associated antigen (e.g., MART1 (melanoma antigen recognized by T cells 1, MAGEA3(melanoma-associated antigen3), NY-ESOl), NYESOl, , CEA(carcinoembryonic antigen), GP100 등)에 대하여 결합 특이성을 갖는 것일 수 있다.
상기 수용체는 TLR(Toll like receptor)일 수 있다.
상기 수용체는 MHC-제한 T 세포 활성화에 관여하는 공조수용체인 CD4 와 CD8일 수 있다.
상기 수용체는 CTLA-4 (CD152) 일 수 있다.
상기 수용체는 CD28 일 수 있다.
상기 수용체는 T세포의 반응을 증폭시키는 수용체인 CD137, 4-1BB일 수 있다
상기 수용체는 T세포 항원수용체의 신호전달요소인 CD3ζ일 수 있다
상기 수용체는 CAR(Chimeric Antigen Receptor)일 수 있다.
본 발명의 일 구체예로서, 상기 수용체는 인위적으로 조작된 인공수용체(artificial receptor)일 수 있다
"인공수용체(artificial receptor)"는 야생형 수용체가 아닌 인위적으로 만들어진, 항원에 대한 인식능력을 가지며 특정한 기능을 하는 기능체를 의미한다.
이러한 인공수용체는 특정 항원에 대한 인식능력이 개선되거나 증강된 면역반응신호를 생성하여 면역반응의 향상에 기여할 수 있다.
인공수용체는 일 예로 하기와 같은 구성을 가질 수 있다.
(i) 항원인식부
인공수용체는 항원인식부를 포함한다.
"항원인식부(antigen recognition part)"는 인공수용체의 일부로서 항원을 인식하는 부위를 의미한다.
항원인식부는 특정 항원에 대한 인식능력이 야생수용체보다 개선된 것일 수 있다. 이때, 특정 항원은 암세포의 항원일 수 있다. 또한, 특정 항원은 일반적인 체내 세포의 항원일 수 있다.
항원인식부는 항원과의 친결합성을 가질 수 있다.
항원인식부는 항원과 결합하면서 신호를 생성할 수 있다. 상기 신호는 전기적 신호일 수 있다. 상기 신호는 화학적 신호일 수 있다.
항원인식부는 신호서열을 포함할 수 있다.
상기 신호서열은 단백질이 합성되는 과정에서 단백질을 특정한 위치로 전달되도록 하는 펩타이드 서열을 의미한다.
신호서열은 항원인식부의 N 말단에 가까운 위치에 있을 수 있다. 이때, N 말단으로부터의 거리는 100개 아미노산 내외일 수 있다. 신호서열은 항원인식부의 C 말단에 가까운 위치에 있을 수 있다. 이때, C 말단으로부터의 거리는 100개 아미노산 내외일 수 있다.
항원인식부는 제1 신호발생부와 유기적인 기능 관계를 가질 수 있다.
항원인식부는 항체의 Fab(fragment antigen binding) 도메인과 상동성이 있을 수 있다.
항원인식부는 scFv(single-chain variable fragment)일 수 있다.
항원인식부는 그 자체로서 항원을 인식하거나 또는 항원인식구조체를 형성하여 항원을 인식할 수 있다.
항원인식구조체는 특정 구조를 이루어야 항원을 인식할 수 있고, 이러한 특정 구조를 이루는 단위체 및 상기 단위체들의 결합은 기술분야에서 통상의 지식을 가진 자가 쉽게 이해할 수 있다. 또한 항원인식구조체는 1개 또는 2이상의 단위체로 구성될 수 있다.
항원인식구조체는 단위체가 일렬로 연결된 구조일 수 있거나, 또는 병렬적으로 연결된 구조일 수 있다.
일렬로 연결된 구조는 2이상의 단위체가 일 방향으로 이어서 연속적으로 결합되어 있는 형태를 의미하고, 병렬적으로 연결된 구조는 1개의 단위체의 말단부위에 2개 이상의 각 단위체가 동시에, 예를 들어 서로 다른 방향으로 결합되어 있는 형태를 의미한다.
예를 들어,
상기 단위체는 무기물일 수 있다.
상기 단위체는 생화학적 리간드일 수 있다.
상기 단위체는 야생형 수용체의 항원인식부와 상동성이 있을 수 있다.
상기 단위체는 항체 단백질과 상동성이 있을 수 있다.
상기 단위체는 이뮤노글로불린의 중쇄부(heavy chain) 또는 이와 상동성이 있을 수 있다.
상기 단위체는 이뮤노글로불린의 경쇄부(light chain) 또는 이와 상동성이 있을 수 있다.
상기 단위체는 신호서열을 포함할 수 있다.
한편, 상기 단위체는 화학적 결합으로 결합되어 있거나, 특정 결합부를 통해 결합되어 있을 수 있다.
"항원인식구조단위체 결합부(antigen recognition unit combining part)"는 항원인식구조단위체가 서로 결합되는 부위로서, 두 개 이상의 항원인식구조단위체로 이루어진 항원인식구조체가 있을 때 존재하는 선택적인 구성일 수 있다.
항원인식구조단위체 결합부는 펩타이드일 수 있다. 이때, 결합부는 세린과 트레오닌의 비율이 높을 수 있다.
항원인식구조단위체 결합부는 화학적 결합일 수 있다.
항원인식구조단위체 결합부는 특정 길이를 가짐으로써 항원인식구조단위체의 입체구조 발현을 도울 수 있다.
항원인식구조단위체 결합부는 항원인식구조단위체 간에 특정한 위치 관계를 갖도록 하여 항원인식구조체의 기능을 도울 수 있다.
(ii) 수용체몸체부
인공수용체는 수용체몸체부를 포함한다.
"수용체몸체부"는 항원인식부와 신호발생부 간의 연결을 매개하는 부위로서, 항원인식부와 신호발생부를 물리적으로 연결하는 것일 수 있다.
수용체몸체부의 기능은 항원인식부 또는 신호발생부에서 생성한 신호를 전달하는 것일 수 있다.
수용체몸체부의 구조는 경우에 따라 신호발생부의 기능을 동시에 가질 수도 있다.
수용체몸체부의 기능은 인공수용기체가 면역세포에 고정되도록 하는 것일 수 있다.
수용체몸체부는 아미노산 나선 구조를 포함할 수 있다.
수용체몸체부의 구조는 체내에 존재하는 일반적인 수용체(receptor) 단백질의 일부와 상동성이 있는 부분을 포함할 수 있다. 상동성의 범위는 50 내지 100%일 수 있다.
수용체몸체부의 구조는 면역세포 상의 단백질과 상동성이 있는 부분을 포함할 수 있다. 상동성의 범위는 50 내지 100%일 수 있다.
예를 들어,
수용체몸체부는 CD8 막횡단 영역(transmembrane domain)일 수 있다.
수용체몸체부는 CD28 막횡단 영역일 수 있다. 이때 제2 신호발생부가 CD28인 경우, CD28은 동시에 제2 신호발생부와 수용체몸체부의 기능을 할 수 있다.
(iii) 신호발생부
인공수용체는 신호발생부를 포함할 수 있다.
"제1 신호발생부"는 인공수용체의 일부로서 면역반응신호를 생성하는 부위를 말한다.
"제2 신호발생부"는 인공수용체의 일부로서 제1 신호발생부와 상호작용하여 또는 독립적으로 면역반응신호를 생성하는 부위를 말한다.
인공수용체는 제1 신호발생부 및/또는 제 2신호발생부를 포함할 수 있다.
제1 및/또는 제2 신호발생부를 각각 2개 이상 포함할 수 있다.
제1 및/또는 제2 신호발생부는 특정 서열모티프를 포함할 수 있다.
서열모티프는 CD(cluster of designition) 단백질의 모티프와 상동성이 있을 수 있다.
이때, CD 단백질은 CD3, CD247, CD79일 수 있다.
서열모티프는 YxxL/I의 아미노산 서열일 수 있다.
서열모티프는 제1 및/또는 제2 신호발생부에 다중적으로 포함될 수 있다.
이때, 첫 번째 서열모티프는 제1 신호발생부의 시작 위치로부터 1 내지 200 아미노산 갯수만큼 떨어진 위치에 있을 수 있다. 두 번째 서열모티프는 제2 신호발생부의 시작 위치로부터 1 내지 200 아미노산 갯수만큼 떨어진 위치에 있을 수 있다.
또한, 각 서열모티프 간의 이격은 1 내지 15 아미노산 갯수일 수 있다.
이 때, 바람직한 각 서열모티프 간의 이격은 6 내지 8 아미노산 갯수이다.
예를 들어,
제1 및/또는 제2 신호발생부는 CD3 ζ일 수 있다.
제1 및/또는 제2 신호발생부는 FcεRIγ일 수 있다.
제1 및/또는 제2 신호발생부는 특정 조건이 만족 되어야만 면역반응 신호를 생성하는 것일 수 있다.
특정 조건은 항원인식부가 항원을 인식하는 것일 수 있다.
특정 조건은 항원인식부가 항원과 결합을 형성하는 것일 수 있다.
특정 조건은 항원인식부와 항원이 결합을 형성할 때 생성된 신호를 전달받는 것일 수 있다.
특정 조건은 항원인식부가 항원을 인식하거나 결합하다가 분리되는 것일 수 있다.
면역반응신호는 면역세포의 생장 및 분화와 관련된 신호일 수 있다.
면역반응신호는 면역세포의 사멸과 관련된 신호일 수 있다.
면역반응신호는 면역세포의 활성과 관련된 신호일 수 있다.
면역반응신호는 면역반응의 보조와 관련된 신호일 수 있다.
면역반응신호는 항원인식부에서 생성된 신호 특이적으로 활성화될 수 있다.
면역반응신호는 목적 유전자의 발현을 조절하는 신호일 수 있다.
면역반응신호는 면역반응을 억제하는 신호일 수 있다.
일 예에서, 상기 신호발생부는 부가적 신호발생부를 포함할 수 있다.
"부가적 신호발생부"는 인공수용체의 일부로서 제1 및/또는 제2 신호발생부가 생성하는 면역반응신호에 대하여 부가적인 면역반응신호를 생성하는 부위를 의미한다.
이하 부가적 신호발생부는 그 순서에 따라 제n 신호발생부(n≠1)로 호칭한다.
인공수용체는 제1 신호발생부 외에도 부가적 신호발생부를 포함할 수 있다.
부가적 신호발생부는 2개 이상이 인공수용체에 포함될 수 있다.
부가적 신호발생부는 4-1BB, CD27, CD28, ICOS, OX40 혹은 그 외의 면역반응신호를 발생하는 구조일 수 있다.
부가적 신호발생부가 면역반응신호를 생성하는 조건 및 생성하는 면역반응신호의 특성은 상기 제1 및/또는 제2 신호발생부의 면역반응신호와 상응하는 내용을 포함한다.
면역반응신호는 사이토카인의 합성을 촉진하는 것일 수 있다. 면역반응신호는 사이토카인의 분비를 촉진 또는 억제하는 것일 수 있다. 이때, 사이토카인은 바람직하게는 IL-2, TNFα 또는 IFN-γ일 수 있다.
면역반응신호는 다른 면역세포의 생장 또는 분화를 돕는 신호일 수 있다.
면역반응신호는 다른 면역세포의 활성을 조절하는 신호일 수 있다
면역반응신호는 다른 면역세포를 신호가 발생하는 위치로 유인하는 신호일 수 있다.
본 발명은 인공수용체의 모든 가능한 결합관계를 포함한다. 따라서, 본 발명의 인공수용체의 양태는 여기서 언급한 것들에만 한정되지 않는다.
인공수용체는 항원인식부-수용체몸체부-제1 신호발생부로 구성될 수 있다. 수용체몸체부는 선택적으로 포함될 수 있다.
인공수용체는 항원인식부-수용체몸체부-제2 신호발생부-제1 신호발생부로 구성될 수 있다. 수용체몸체부는 선택적으로 포함될 수 있다. 이때, 제1 신호발생부와 제2 신호발생부의 위치는 바뀔 수 있다.
인공수용체는 항원인식부-수용체몸체부-제2 신호발생부-제3 신호발생부-제1 신호발생부로 구성될 수 있다. 수용체몸체부는 선택적으로 포함될 수 있다. 이때, 제1 신호발생부 내지 제3 신호발생부의 위치는 바뀔 수 있다.
인공수용체에서 신호발생부의 갯수는 1 내지 3개에 한정되지 않고, 3개를 초과하여 포함될 수 있다.
상기 예들 외에도 인공수용체는 항원인식부-신호발생부-수용체몸체부의 구조를 가질 수 있다. 상기 구조는 인공수용체를 갖는 세포 외에서 작용하는 면역반응신호를 생성해야 하는 때에 유리할 수 있다.
인공수용체는 야생 수용체에 상응하는 기능을 할 수 있다.
인공수용체는 특정 항원과 결합을 형성하여 특정 위치관계를 형성하는 기능을 할 수 있다.
인공수용체는 특정 항원을 인식하여 특정 항원에 대한 면역반응을 촉진하는 면역반응신호를 생성하는 기능을 할 수 있다.
인공수용체는 일반적인 체내세포의 항원을 인식하여 체내세포에 대한 면역반응을 억제하는 기능을 할 수 있다.
(iv) 신호서열
일 예에서, 상기 인공수용체는 신호서열을 선택적으로 포함할 수 있다.
인공수용체가 특정 단백질의 신호서열을 포함한다면 인공수용체가 면역세포 막에 용이하게 위치하는 데 도움을 줄 수 있다. 바람직하게는, 면역세포 안에 있는 인공수용체가 막관통단백질의 신호서열을 포함한다면 인공수용체가 면역세포막을 통과하여, 면역세포의 외막에 위치하는 것을 도울 수 있다.
인공수용체는 하나 이상의 신호서열을 포함할 수 있다.
신호서열은 양전하 아미노산을 많이 포함할 수 있다.
신호서열은 N 또는 C 말단에 가까운 위치에 양전하 아미노산을 포함할 수 있다.
신호서열은 막관통단백질의 신호서열일 수 있다.
신호서열은 면역세포의 외막에 위치한 단백질의 신호서열일 수 있다.
상기 신호서열은 인공수용체가 갖는 구조, 즉 항원인식부, 수용체몸체부, 제1 신호발생부, 부가적 신호발생부에 포함될 수 있다.
이때, 신호서열은 각 구조의 N 또는 C 말단에 가까운 위치에 있을 수 있다.
이때, N 또는 C 말단으로부터의 거리는 100개 아미노산 내외일 수 있다.
일 예에서, 상기 세포는 특정 T 세포 수용체 (TCR) 유전자를 포함하도록 변형된 것일 수 있다.
다른 예에서, 상기 TCR은 tumor associated antigen (e.g., MART1 (melanoma antigen recognized by T cells 1), MAGEA3(melanoma-associated antigen3), NY-ESOl, CEA(carcinoembryonic antigen), GP100 등NY-ES-Ol, melanoma )에 대하여 결합 특이성을 갖는 것일 수 있다.
다른 예에서, 상기 세포는 특정 chimeric antigen receptor (CAR)를 포함하도록 변형된 것일 수 있다. 일 예에서, 상기 CAR는 tumor associated antigen (e.g., CD 19, CD20, carbonic anhydrase IX (CAIX), CD 171, CEA, ERBB2, GD2, alpha-folate receptor, Lewis Y antigen, prostate specific membrane antigen (PSMA) 또는 tumor associated glycoprotein 72 (TAG72))에 대하여 결합 특이성을 갖는 것일 수 있다.
다른 예에서, 상기 세포는, 예컨대, TCR 또는 CAR에 의하여 다음과 같은 종양 항원(tumor antigen) 중 하나 이상과 결합하도록 변형된 것일 수 있다.
종양 항원(Tumor antigen)은, 이에 제한되지 않지만, AD034, AKT1, BRAP, CAGE, CDX2, CLP, CT-7, CT8/HOM-TES-85, cTAGE-1, EGFR, EGFRvIII, Fibulin- 1, HAGE, HCA587/MAGE-C2, hCAP-G, HCE661, HER2/neu, HLA-Cw, HOM-HD-21/Galectin9, HOM-MEEL- 40/SSX2, HOM-RCC-3.1.3/CAXII, HOXA7, HOXB6, Hu, HUB 1, KM-HN-3, KM-KN- 1, KOC1, KOC2, KOC3, KOC3, LAGE-1, MAGE-1, MAGE-4a, MPPl 1, MSLN, NNP-1, NY-BR-1, NY-BR-62, NY-BR-85, NY-CO-37, NY-CO-38, NY-ESO-1, NY-ESO-5, NY-LU-12, NY-REN-10, NY-REN-19/LKB/STK1 1, NY-REN-21 , NY-REN-26/BCR, NY-REN-3/NY-CO-38, NY-REN-33/SNC6, NY- REN-43, NY-REN-65, NY-REN-9, NY-SAR-35, OGFr, PSMA, PSCA PLU-1, Rab38, RBPJkappa, RHAMM, SCP1, SCP- 1, SSX3, SSX4, SSX5, TOP2A, TOP2B, 또는 Tyrosinase 등을 포함하는 것일 수 있다.
- 항원결합조절요소( antigen binding regulating element )
본 발명의 세포는 "항원결합조절요소"를 추가로 포함할 수 있다.
"항원결합조절요소"는 수용체와 항원 간 결합을 가능하게 하는 요소로서, 이러한 기능을 하는 유전자 또는 단백질일 수 있다.
이러한 항원결합조절요소를 이용하여 면역반응을 조절할 수 있다. 예를 들어, 생체에 외부적 조작을 거친 세포를 넣어 치료하는 경우, 외부적 조작을 거친 세포에 대한 면역반응이 활성화되어 치료효과가 없어지는 HVGD(host HVGD (graft disease; 숙주편대이식질환, HostGraft)이 문제되는 경우, 면역세포 수용체의 항원결합력을 억제하여 해결할 수 있다
항원결합조절요소는 수용체의 구조에 관련된 단백질 또는 유전자일 수 있다.
항원결합조절요소는 상기 수용체의 구조와 상동성이 있는 단백질 또는 유전자일 수 있다.
예를 들어,
상기 항원결합조절요소는 dCK일 수 있다.
상기 항원결합조절요소는 CD52일 수 있다.
상기 항원결합조절요소는 B2M일 수 있다.
항원결합조절요소는 수용체가 인식하는 구조체에 관련된 단백질 또는 유전자일 수 있다.
예를 들어, 상기 항원결합조절요소는 MHC 단백질일 수 있다.
본 발명의 일 구현예는, 상기 인위적으로 조작된 면역조절 유전자 또는 이들이 발현하는 단백질을 포함하는 면역세포이다.
본 발명의 다른 구현예는, 상기 인위적으로 조작된 면역조절 유전자 또는 이들이 발현하는 단백질; 및 수용체를 포함하는 면역세포이다.
본 발명의 또 다른 구현예는, 상기 인위적으로 조작된 면역조절 유전자 또는 이들이 발현하는 단백질; 수용체; 및 항원결합조절요소를 포함하는 면역세포이다.
본 발명의 세포로서 대표적인 예는 면역세포이다.
본 발명의 일부 실시예에서의 면역세포는 PBMC(Peripheral blood mononuclear cell), NK 세포(Natural killer cell), 단핵세포 (monocyte), T 세포, CAR-T세포, 대식세포 (macrophage), NKT 세포(Natural killer T cell) 등으로 이루어진 군에서 선택된 1종 이상일 수 있다. 바람직하게는, T 세포, CAR-T세포, NK 세포(natural killer cell) 또는 NKT 세포(natural killer T cell)일 수 있다.
유전적으로 조작된 면역 세포, 예컨대 T세포, NK 세포, NKT세포의 효능을 제한하는 인자는
(1) 면역 세포 증식, 예를 들어 입양 전달 후 면역 세포의 제한된 증식;
(2) 면역 세포 생존, 예를 들어 종양 환경에서 인자에 의한 면역 세포의 세포 자멸사의 유도; 및
(3) 면역 세포 기능, 예를 들어 숙주 면역 세포 및 암 세포에 의해 분비되는 저해 인자에 의한 세포독성 면역 세포 기능의 저해를 포함한다.
이를 위해, 하나 이상의 면역 세포 발현 유전자, 예를 들어, PD-1, CTLA-4, TNFAIP3, DGKA, DGKZ,Fas, EGR2, PPP2R2D, PSGL-1, KDM6A , 및 TET2로 이루어진 군에서 선택된 하나 이상의 유전자가 불활성화된, 면역세포를 통해 상기 제한 인자들을 조절한다.
일 예로, 하나 이상의 면역 세포 발현 유전자, 예를 들어 PD-1, CTLA-4, TNFAIP3, DGKA, DGKZ,Fas, EGR2, PPP2R2D, PSGL-1, KDM6A 및/또는 TET2 유전자는 하나 이상의 면역세포의 증식, 생존, 기능에 영향을 미치기 위해, 각각 독립적으로 넉아웃, 넉다운 또는 넉인되도록 표적화되어 조작될 수 있다.
일 예로, 하나의 면역 세포에서, 발현 유전자, 예를 들어 PD-1, CTLA-4, TNFAIP3, DGKA, DGKZ,Fas, EGR2, PPP2R2D, PSGL-1, KDM6A 및/또는 TET2 유전자 중 2 이상에 대해 동시에 넉아웃, 넉다운 또는 넉인되도록 표적화되어 조작될 수 있다. 일 실시예에서, DGKA 및 DGKZ를 동시에 넉아웃시켰다.
일 예로, 하나 이상의 면역 세포 발현 유전자, 예를 들어 PD-1, CTLA-4, TNFAIP3, DGKA, DGKZ,Fas, EGR2, PPP2R2D, PSGL-1, KDM6A 및/또는 TET2 유전자는 비 암호 또는 암호 영역, 예를 들어 프로모터 영역, 인핸서, 3'UTR, 및/또는 폴리아데닐화 신호서열, 또는 전사 서열, 예를 들어 인트론 또는 엑손 서열을 표적화함으로써, 하나 이상의 면역세포의 증식, 생존, 기능에 영향을 미치기 위해, 각각 독립적으로 넉아웃, 넉다운 또는 넉인되도록 표적화되어 조작될 수 있다.
일 예로, 하나 이상의 면역 세포 발현 유전자, 예를 들어 PD-1, CTLA-4, TNFAIP3, DGKA, DGKZ,Fas, EGR2, PPP2R2D, PSGL-1, KDM6A 및/또는 TET2 유전자는 서열 중 한 부위 이상에서의 결실, 치환, 삽입 또는 돌연변이를 포함하는 변경의 유도에 의해, 하나 이상의 면역세포의 증식, 생존, 기능에 영향을 미치기 위해, 각각 독립적으로 넉아웃, 넉다운 또는 넉인되도록 표적화되어 조작될 수 있다.
이 때, 본 명세서에서 개시하고 있지 않은 면역조절 유전자를 조합하여 표적화할 수 있음은 자명하다.
[면역 시스템]
또한, 본 발명의 다른 양태는 상기 인위적으로 조작된 면역조절요소; 및/또는 이를 포함하는 세포가 관여하는, 면역 반응 메커니즘을 형성하는 면역 시스템 이다.
본 발명의 "면역 시스템(immune system)"은 인위적으로 조작된 면역조절요소의 기능 변경에 의해 체내 면역반응에 영향을 끼치는, 즉 새로운 면역효능을 나타내는 메커니즘에 관여하는 모든 현상을 포함하는 용어로서, 이러한 면역 시스템에 직접적으로 또는 간접적으로 관여하는 모든 물질, 조성물, 방법 및 용도를 포함한다. 예를 들어, 선천면역, 적응면역, 세포성 면역, 체액성 면역, 능동면역, 수동면역 반응에 관여하는 유전자, 면역세포 및 면역기관/조직을 모두 포함한다.
이러한 면역 시스템을 구성하는 각 요소들을 통칭하여 "면역 시스템 요소(immune system factor)"로 말하기도 한다.
본 발명의 면역 시스템은 조작면역세포(manipulated immune cell)를 포함한다.
조작면역세포(manipulated immune cell)는 자연상태가 아닌 인공적인 조작을 가한 면역세포를 의미한다. 최근, 면역세포를 체내에서 추출하고 인공적인 조작을 가하여 면역 효능을 증강하는 기술이 적극적으로 연구되고 있다. 이렇게 조작을 가한 면역세포는 특정한 질병에 대한 면역효능이 탁월하여 새로운 치료방법으로서 조명을 받고 있다. 특히, 암의 치료에 관련하여 조작면역세포의 연구가 활발히 진행되고 있다.
상기 조작면역세포는 기능조작형 면역세포 또는 인공구조부가형 면역세포일 수 있다.
기능조작형 면역세포( functionally manipulated immune cell )
본 발명의 "기능조작형 면역세포"는 면역세포로서 자연상태에서 야생수용체 혹은 면역조절요소가 조작된 것을 의미한다.
이하 조작은 유전자를 절단, 연결, 제거, 삽입, 변형하거나 단백질을 제거, 부가, 변형하는 조작으로서 통상의 기술자가 단백질과 유전자의 조작에 활용할 수 있는 모든 조작을 의미한다. 이하 면역세포는 이미 분화를 마친 면역세포만이 아니라, 분화하기 전의 세포(e.g., 줄기세포)를 포함한다.
기능조작형 면역세포는 야생수용체가 조작된 면역세포일 수 있다. 이때, 야생수용체는 TCR일 수 있다.
기능조작형 면역세포는 야생수용체가 표면에 없거나 더 적은 비율로 존재하는 것일 수 있다.
기능조작형 면역세포는 야생수용체가 표면에 더 많은 비율로 존재하는 것일 수 있다.
기능조작형 면역세포는 야생수용체의 특정 항원에 대한 인식능력이 증강된 것일 수 있다.
기능조작형 면역세포는 면역조절요소가 조작된 면역세포일 수 있다.
기능조작형 면역세포는 면역세포활성조절요소가 조작된 것일 수 있다.
이때, 기능조작형 면역세포는 SHP-1, PD-1, CTLA-4, CBLB, ILT-2, KIR2DL4, PSGL-1 중 선택된 하나 이상이 비활성화된 면역세포일 수 있다.
기능조작형 면역세포는 면역세포생장조절요소가 조작된 것일 수 있다.
이때, 기능조작형 면역세포는 DGK-alpha, DGK-zeta, Fas, EGR2, Egr3, PPP2R2D, A20 중 선택된 하나 이상이 비활성화된 면역세포일 수 있다. 바람직한 실시양태는 DGK-alpha, DGK-zeta, EGR2, PPP2R2D, A20 중 선택된 하나 이상을 비활성화하는 것이다.
기능조작형 면역세포는 면역세포사멸조절요소가 조작된 것일 수 있다.
이때, 기능조작형 면역세포는 Daxx, Bim, Bid, BAD, PD-1, CTLA-4 중 선택된 하나 이상이 비활성화된 면역세포일 수 있다.
또한, 기능조작형 면역세포는 스스로 사멸을 유도하는 요소가 삽입된 면역세포일 수 있다.
기능조작형 면역세포는 면역세포기능소실요소가 조작된 것일 수 있다.
이때, 기능조작형 면역세포는 TET2, Wnt Akt 중 선택된 하나 이상이 비활성화된 면역세포일 수 있다.
기능조작형 면역세포는 사이토카인 분비요소가 조작된 것일 수 있다.
기능조작형 면역세포는 항원결합조절요소가 조작된 것일 수 있다.
이때, 기능조작형 면역세포는 dCK, CD52, B2M, MHC 중 선택된 하나 이상이 비활성화된 면역세포일 수 있다.
기능조작형 면역세포는 상기 언급된 것들과 다른 면역조절요소가 조작된 것일 수 있다.
기능조작형 면역세포는 한 개 이상의 면역조절요소가 동시에 조작된 것일 수 있다. 이때, 한 종류 이상의 면역조절요소가 조작될 수 있다.
상기 야생수용체와 면역조절요소의 조작에 의해 기능조작형 면역세포는 새로운 면역효능을 가질 수 있다.
이때, 한 면역조절요소를 조작하는 경우 반드시 한 종류의 새로운 면역효능이 나타나야만 하는 것은 아니다. 한 면역조절요소의 조작은 여러 가지의 새로운 면역효능을 야기하거나 억제할 수도 있다.
새로운 면역효능은 특정 항원에 대한 인식능력이 조절된 것일 수 있다.
새로운 면역효능은 특정 항원에 대한 인식능력이 향상된 것일 수 있다.
이때, 특정 항원은 질병의 항원일 수 있다. 예를 들어, 암세포의 항원일 수 있다.
새로운 면역효능은 특정 항원에 대한 인식능력이 저하된 것일 수 있다.
새로운 면역효능은 면역능력이 향상된 것일 수 있다.
새로운 면역효능은 면역세포의 생장이 조절된 것일 수 있다. 이때, 면역효능은 면역세포의 생장과 분화가 촉진하거나 완화하는 것일 수 있다.
새로운 면역효능은 면역세포의 사멸이 조절된 것일 수 있다. 이때, 면역효능은 면역세포의 사멸을 막는 것일 수 있다. 또한, 면역효능은 면역세포가 적절한 시간이 지났을 때 스스로 사멸하도록 하는 것일 수 있다.
새로운 면역효능은 면역세포의 기능소실이 완화된 것일 수 있다.
새로운 면역효능은 면역세포의 사이토카인 분비가 조절된 것일 수 있다. 이때, 면역효능은 사이토카인의 분비를 촉진하거나 억제하는 것일 수 있다.
새로운 면역효능은 면역세포에서 야생수용체의 항원 결합능을 조절하는 것일 수 있다. 이때, 면역효능은 야생수용체의 특정 항원에 대한 특이성을 향상하는 것일 수 있다.
인공구조부가형 면역세포( artificial structure supplemented immune cell )
"인공구조부가형 면역세포"는 면역세포 내 인공적인 구조를 부가시킨 것을 의미한다.
예를 들어, 인공구조부가형 면역세포는 인공수용체가 부가된 면역세포일 수 있다.
인공수용체는 특정 질병의 항원에 대한 인식능력이 있는 것일 수 있다. 일 예로 인공구조부가형 면역세포는 CAR-T 세포일 수 있다.
또한, 특정 질병이 야기하는 2개 이상의 항원들 각각에 대한 인식능력이 있는 인공수용체들을 부가한 것일 수 있다. 이때, 각각의 인공수용체는 조건에 따라 시계열적으로 발현되는 것일 수 있다.
예컨데, 암의 치료를 목적으로 하는 조작면역세포일 때, 제1 인공수용체는 제2 인공수용체 유전자의 발현을 개시하는 면역반응신호를 생성하고, 이후에 제2 인공수용체가 발현되는 것일 수 있다. 제2 인공수용체는 암세포에 대한 면역반응을 유도하는 면역반응신호를 생성할 수 있다. 이 경우 조작면역세포의 암세포 공격 능력이 향상될 수 있다.
인공수용체는 조작면역세포에 대한 인식능력이 있는 것일 수 있다.
인공수용체는 일반적인 체내세포에 대한 인식능력이 있는 것일 수 있다. 일 예로 인공구조부가형 면역세포는 iCAR-T 세포일 수 있다.
인공수용체는 제3의 물질에 대한 인식능력이 있는 것일 수 있다. 이때, 제3의 물질은 특정 질병의 항원에 대한 결합능력이 있을 수 있다.
이 때, 제3의 물질은 인공수용체에 결합할 수 있고 동시에 특정 질병의 항원과 결합할 수 있을 수 있다. 예를 들어, 인공수용체와 동시에 암세포 항원에 대한 결합능력을 가질 수 있다.
다른 예로, 인공구조부가형 면역세포는 인공수용체 외에도, 특정 기능을 가지는 인공적인 구조가 부가된 면역세포일 수 있다.
면역세포에 자연상태와는 다른 인공적인 구조를 부가하는 경우 인공구조부가형 면역세포는 새로운 면역효능을 가질 수 있다.
예를 들어,
새로운 면역효능은 특정 항원과 결합하여 면역세포가 항원과 특정한 위치관계에 있도록 하는 것일 수 있다.
새로운 면역효능은 특정 항원을 인식하여 특정 항원에 대한 면역반응을 촉진하는 기능일 수 있다.
새로운 면역효능은 과도한 면역반응을 억제하는 기능일 수 있다.
새로운 면역효능은 면역반응의 신호 전달경로(passway)를 조절하는 기능일 수 있다.
새로운 면역효능은 제3의 물질과 결합을 형성하여 특정 질환을 확인할 수 있는 기능일 수 있다. 이때, 제3의 물질은 특정 질병의 바이오마커일 수 있다.
상기 언급된 특정 항원의 바람직한 일 예는 암세포의 항원일 수 있다.
암세포의 항원은, 이에 제한되지 않지만, AD034, AKT1, BRAP, CAGE, CDX2, CLP, CT-7, CT8/HOM-TES-85, cTAGE-1, EGFR, EGFRvIII, Fibulin- 1, HAGE, HCA587/MAGE-C2, hCAP-G, HCE661, HER2/neu, HLA-Cw, HOM-HD-21/Galectin9, HOM-MEEL- 40/SSX2, HOM-RCC-3.1.3/CAXII, HOXA7, HOXB6, Hu, HUB 1, KM-HN-3, KM-KN- 1, KOC1, KOC2, KOC3, KOC3, LAGE-1, MAGE-1, MAGE-4a, MPPl 1, MSLN, NNP-1, NY-BR-1, NY-BR-62, NY-BR-85, NY-CO-37, NY-CO-38, NY-ESO-1, NY-ESO-5, NY-LU-12, NY-REN-10, NY-REN-19/LKB/STK1 1, NY-REN-21 , NY-REN-26/BCR, NY-REN-3/NY-CO-38, NY-REN-33/SNC6, NY- REN-43, NY-REN-65, NY-REN-9, NY-SAR-35, OGFr, PLU-1, PSMA, PSCA, Rab38, RBPJkappa, RHAMM, SCP1, SCP- 1, SSX3, SSX4, SSX5, TOP2A, TOP2B, ROR-1 또는 Tyrosinase 등을 포함하는 것일 수 있다.
복합조작형 면역세포( hybrid manipulated immune cell )
"복합조작형 면역세포"는 면역세포로서 면역조절요소 조작 및 인공구조의 부가가 모두 이루어진 세포를 의미한다.
복합조작형 면역세포에서 면역조절요소의 조작은 상기 기능조작형 면역세포에서 설명된 바와 같다. 또한, 인공구조의 부가는 상기 인공구조부가형 면역세포에서 설명된 바와 같다.
면역세포의 기능조작이 유전적 조작인 경우, 인공구조가 부가된 위치는 기능조작이 일어난 유전자 위치와 같을 수 있다.
복합조작형 면역세포의 새로운 면역효능은 상기 기능조작형 면역세포와 인공구조부가형 면역세포의 새로운 면역효능을 포함하고, 이들 간의 상호작용에 의해 더욱 개량된 면역효능을 나타내는 것일 수도 있다.
개량된 면역효능은 특정질병에 대한 특이성과 면역반응이 향상되는 것일 수 있다. 바람직한 일 예에서, 복합조작형 면역세포는 암에 대한 특이성과 면역반응이 향상된 것일 수 있다.
본 발명의 면역 시스템은 조작된 면역조절요소 및/또는 조작면역세포(manipulated immune cell)에 의해 이루어지는, 목적하는 면역반응 및 이에 의한 질병 치료 메커니즘을 포함한다.
구현예에서, 면역 세포 증식을 저해하는 유전자를 불활성화시킨 면역조절요소 및/또는 조작면역세포를 이용하여 면역 세포 증식에 영향을 미치기 위해 사용될 수 있다.
구현예에서, 면역 세포 세포사멸을 매개하는 유전자를 불활성화시킨 면역조절요소 및/또는 조작면역세포를 이용하여 면역 세포 생존에 영향을 미치기 위해 사용될 수 있다.
구현예에서, 면역억제 및 저해 신호전달 인자를 암호화하는 유전자를 불활성화시킨 면역조절요소 및/또는 조작면역세포를 이용하여 면역 세포 기능에 영향을 미치기 위해 사용될 수 있다.
본 명세서에서 논의되는 방법 및 조성물은 특정 질환 치료제로서 유전자 변형된 면역 세포의 효능, 예를 들어 면역세포 증식, 면역세포 생존, 면역세포 기능 또는 이들의 임의의 조합을 제한하는 인자 중 하나 이상에 영향을 미치기 위해 개개로 또는 조합으로 이용될 수 있다.
한편, 면역조절 치료(immune-regulating therapy)란 조작된 면역조절요소 및/또는 조작면역세포를 이용하여 체내의 면역반응을 조절하여 질병을 치료하는 것을 의미한다.
예를 들어, 수지상세포(dendritic cell), 자연 살해 세포(natural killer cell), T 세포 등 면역세포를 이용하여 체내의 면역반응을 활성화 또는 불활성화시켜 질병을 치료할 수 있다.
이러한 면역조절 치료는 주로 암 치료를 적응증으로 개발되고 있으며, 환자에게 직접 면역세포를 투여하여 면역 기능을 활성화하여, 치료 효과를 얻기 때문에 기존의 암 치료에 이용되는 수술 요법, 항암제나 방사선 치료와는 차별화되는 치료 기전이다.
면역조절 치료의 일 구체예는 사용하는 면역세포 및 제조 공정에서 세포 내로 도입하는 유전자의 특징에 따라 수지상 면역조절 세포치료제, 림포카인 활성세포(lymphokine activated killer, LAK), 종양 침윤 T 세포 (tumor-infiltrating T lymphocytle, TIL), T 수용체 발현 T 세포 (T cell receptor-modified T cells, TCR-T), 키메릭 항원 수용체 발현T 세포 (chimeric antigen receptor-modified T cells, CAR-T) 등을 포함한다.
[유전적 조작 또는 변형]
본 발명의 면역조절요소, 면역세포 및 면역시스템에 관여하는 물질의 조작 또는 변형은, 바람직하게는 유전적 조작을 통해 이루어질 수 있다.
일 양태에서, 면역세포의 증식, 생존 및/또는 기능에 영향을 미치는 면역조절 유전자의 비 암호 또는 암호 영역의 일부 또는 전부를 타겟팅하여 유전자 조작하는 조성물 및 방법을 제공할 수 있다.
상기 조성물 및 방법은
구현예에서, 목적하는 면역 시스템의 형성을 위해, 이에 관여하는 면역조절 유전자 중 하나 이상을 조작하거나 변형시킬 수 있다. 이는 유전자를 구성하는 핵산의 변형을 통해 이루어질 수 있다. 조작 결과로서, 넉다운(knock down), 넉아웃(knock out), 넉인(knock in) 형태를 모두 포함한다.
구현예에서, 프로모터 영역, 또는 전사 서열, 예를 들어 인트론 또는 엑손 서열을 타겟으로 할 수 있다. 암호 서열, 예를 들어 암호 영역, 초기 암호 영역은 발현의 변경 및 넉아웃을 위해 표적화될 수 있다.
구현예에서, 핵산 변형은 하나 이상의 뉴클레오타이드, 예컨대, 1 내지 30bp, 1 내지 27bp, 1 내지 25bp, 1 내지 23bp, 1 내지 20bp, 1 내지 15bp, 1 내지 10bp, 1 내지 5bp, 1 내지 3bp, 또는 1bp의 뉴클레오타이드의 치환, 결실, 및/또는 삽입일 수 있다.
구현예에서, 면역조절 유전자 중 하나 이상을 넉아웃하기 위해, 또는 하나 이상의 발현을 제거하기 위해, 또는 하나 이상의 1 개 또는 2 개의 대립유전자를 넉아웃하기 위해, 면역조절 유전자 중 하나 이상에서의 결실 또는 돌연변이를 포함하도록 표적화될 수 있다.
구현예에서, 유전자 넉다운은 원치않는 대립유전자 또는 전사체의 발현을 감소시키기 위해 사용될 수 있다.
구현예에서, 프로모터, 인핸서, 인트론, 3'UTR, 및/또는 폴리아데닐화 신호의 비 암호 서열을 표적화함으로써 면역 세포 기능에 영향을 미치는 면역조절 유전자를 변경하기 위해 사용될 수 있다.
구현예에서, 상기 유전자 핵산 변경을 통해 면역조절 유전자의 활성 조절, 예컨대, 활성화 또는 불활성화를 야기할 수 있다.
구현예에서, 상기 유전자 핵산 변형은 가이드핵산-에디터단백질 복합체에 의하여 타겟된 유전자 내의 특정 부위의 단일가닥 또는 이중가닥 절단(cleavage), 즉 핵산 가닥 손상을 촉매화하여 타겟된 유전자를 불활성화시키는 것일 수 있다.
구현예에서, 핵산 가닥 손상(breaks)은 상동(homologous) 재조합(recombination) 또는 비상동 말단 연결 (nonhomologous end joining; NHEJ) 등의 메커니즘들을 통하여 수선될 수 있다.
이 경우, NHEJ 메커니즘이 일어나면, 절단 위치(cleavage site)에서 DNA 서열에 변화가 유발되고, 이에 의하여 유전자가 불활성화될 수 있다. NHEJ을 통한 수선은 짧은 유전자 단편의 치환들, 삽입들 또는 결실을 야기하고, 해당 유전자 넉아웃(knockouts)의 유도에 사용될 수 있다.
다른 양태에서, 본 발명은 상기 유전자 조작 위치를 제공할 수 있다.
구현예에서, NHEJ-매개 변경에 의해 변경된다면, 면역조절 유전자 산물의 발현의 감소 또는 제거를 야기하는, 상기 유전자 내의 위치를 지칭한다.
예를 들어,
초기 암호 영역에 있을 수 있다.
상위 50%의 암호영역에 있을 수 있다.
프로모터 서열에 있을 수 있다.
특정 인트론 서열에 있을 수 있다
특정 엑손 서열에 있을 수 있다.
면역세포의 증식, 생존 및/또는 기능에 영향을 미치는 유전자의 특정 위치에 있을 수 있다.
면역반응에 관여하는 단백질의 기능에 영향을 미치는 유전자의 특정 위치에 있을 수 있다.
특정 항원에 대한 인식능력에 영향을 미치는 유전자의 특정 위치에 있을 수 있다.
면역세포의 사이토카인 분비를 조절하는 기능에 영향을 미치는 유전자의 특정 위치에 있을 수 있다.
면역세포에서 수용체의 항원 결합능을 조절하는 기능에 영향을 미치는 유전자의 특정 위치에 있을 수 있다.
상기 유전자 조작은 유전자 발현 조절 과정을 고려하여 이루어질 수 있다.
구현예에서, 전사조절, RNA 가공 조절, RNA 수송 조절, RNA 분해 조절, 번역 조절 또는 단백질 변형 조절 단계에서 각 단계에 적합한 조작수단을 선택하여 이루어질 수 있다.
구현예에서, RNAi (RNA 간섭 or RNA silencing)을 이용하여, small RNA(sRNAs)가 mRNA를 방해하거나 안정성을 저하시키며, 경우에 따라서는 파괴하여 단백질 합성정보가 중간에서 전달되지 못하게 함으로써 유전정보의 발현을 제어할 수 있다.
구현예에서, DNA 또는 RNA 분자, 바람직하게는 DNA 분자 내 핵산들 사이의 결합들(bonds)의 가수분해(절단(cleavage))을 촉매화할 수 있는 야생형 또는 변종(variant) 효소를 이용할 수 있다. 가이드핵산-에디터단백질 복합체를 이용할 수 있다.
예를 들어, 메가뉴클레아제(meganuclease), 징크핑거(Zinc finger) 뉴클레아제, CRISPR/Cas9 (Cas9 단백질), CRISPR-Cpf1(Cpf1 단백질) 및 TALE-뉴클레아제로 이루어진 군에서 선택된 하나 이상의 뉴클레아제를 이용하여 유전자를 조작하여 유전정보의 발현을 제어할 수 있다.
바람직한 예로서, 비제한적으로, 가이드핵산-에디터단백질 복합체를 이용하여, 예를 들어, CRISPR/Cas 시스템을 사용하여 비-상동성 말단 결합(non-homologous end joining:NHEJ) 또는 상동성 재조합 복구(homology-directed repair:HDR)에 의해 매개될 수 있다.
일 구체예에서, 면역세포의 증식, 생존 및/또는 기능에 영향을 미치는 면역조절 유전자로 PD-1 유전자, CTLA-4 유전자, TNFAIP3 유전자, DGKA 유전자, DGKZ 유전자, Fas 유전자, EGR2 유전자, PPP2R2D 유전자, TET2 유전자, 또는 PSGL-1 유전자, KDM6A 유전자를 들 수 있다.
상기 유전자들의 타겟 서열 부위, 즉, 핵산 변형이 일어날 수 있는 부위를 하기 표 1에 정리하였다 (표 1에 기재된 타겟 서열 부위는 3' 말단에 PAM 서열 5'-NGG-3'이 포함된 상태로 기재됨)
상기 타겟 서열은 2종 이상을 동시에 타겟으로 할 수 있다.
상기 유전자는 2종 이상을 동시에 타겟으로 할 수 있다.
동종 유전자 내 2종 이상의 타겟서열 또는 이종 유전자 내 2종 이상의 타겟서열을 동시에 타겟으로 할 수 있다.
일 실시예에서는 DGKa 또는 DGKz를 각각 타겟으로 할 수 있다.
일 실시예에서는 DGKa 및 DGKz를 동시에 타겟으로 할 수 있다.
[표 1] 타겟 서열
Figure PCTKR2017008835-appb-I000001
Figure PCTKR2017008835-appb-I000002
Figure PCTKR2017008835-appb-I000003
Figure PCTKR2017008835-appb-I000004
Figure PCTKR2017008835-appb-I000005
Figure PCTKR2017008835-appb-I000006
Figure PCTKR2017008835-appb-I000007
Figure PCTKR2017008835-appb-I000008
Figure PCTKR2017008835-appb-I000009
Figure PCTKR2017008835-appb-I000010
[유전자 가위 시스템]
본 발명의 면역조절요소, 면역세포 및 면역시스템에 관여하는 물질의 유전적 조작 또는 변형은 "가이드핵산-에디터단백질 복합체"를 이용하여 이루어질 수 있다.
가이드핵산-에디터단백질 복합체
“가이드핵산-에디터단백질 복합체”는 가이드핵산과 에디터단백질의 상호작용을 통해 형성된 복합체를 의미하며, 핵산-단백질 복합체는 가이드핵산과 에디터단백질을 포함한다.
상기 “가이드핵산”은 표적 핵산, 유전자, 염색체 또는 단백질을 인식할 수 있는 핵산을 의미한다.
상기 가이드핵산은 DNA, RNA 또는 DNA/RNA 혼합의 형태일 수 있고, 5 내지 150개의 핵산서열을 가질 수 있다.
상기 가이드핵산은 하나 이상의 도메인을 포함할 수 있다.
상기 도메인은 가이드 도메인, 제 1 상보적 도메인, 연결 도메인, 제 2 상보적 도메인, 근위 도메인, 꼬리도메인 등 일 수 있으며, 이에 제한되지 않는다.
상기 가이드핵산은 두 개 이상의 도메인을 포함할 수 있으며, 이때, 동일한 도메인을 반복적으로 포함하거나, 서로 다른 도메인을 포함할 수 있다.
상기 가이드핵산은 하나의 연속된 핵산서열일 수 있다.
예를 들어, 하나의 연속된 핵산 서열은 (N)m 일 수 있고, 이때 N은 A, T, C 또는 G, 또는 A, U, C 또는 G이며, m은 1 내지 150의 정수를 의미한다.
상기 가이드핵산은 연속된 핵산서열이 두 개 이상일 수 있다.
예를 들어, 두 개 이상의 연속된 핵산서열은 (N)m과 (N)o 일 수 있고, 이때 N은 A, T, C 또는 G, 또는 A, U, C 또는 G이며, m 및 o는 1 내지 150의 정수를 의미하며, m과 o는 서로 같거나 다를 수 있다.
상기 “에디터단백질”은 핵산과 직접적으로 결합하거나, 또는 직접 결합하지는 않지만 상호작용할 수 있는 펩타이드, 폴리펩타이드 또는 단백질을 의미한다. 상기 에디터단백질에 대해서 개념적으로 "유전자 가위" 또는 RGEN(RNA-Guided Endonuclease)으로 칭하기도 한다.
상기 에디터단백질은 효소일 수 있다.
상기 에디터단백질은 융합 단백질일 수 있다.
이때, 상기 “융합 단백질”은 효소 및 추가적인 도메인, 펩타이드, 폴리펩타이드 또는 단백질을 융합하여 생성한 단백질을 의미한다.
상기 “효소”는 핵산, 유전자, 염색체 또는 단백질을 절단할 수 있는 도메인을 포함하는 단백질을 의미한다.
상기 추가적인 도메인, 펩타이드, 폴리펩타이드 또는 단백질은 상기 효소와 동일하거나 다른 기능을 가지는 기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질일 수 있다.
상기 융합 단백질은 효소의 아미노 말단 또는 그 근처; 카르복시 말단 또는 그 근처; 효소의 중간부; 또는 이들 조합의 하나 이상에 추가적인 도메인, 펩타이드, 폴리펩타이드 또는 단백질을 포함할 수 있다.
상기 융합 단백질은 효소의 아미노 말단 또는 그 근처; 카르복시 말단 또는 그 근처; 효소의 중간부; 또는 이들 조합의 하나 이상에 기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질을 포함할 수 있다.
가이드핵산-에디터단백질 복합체는 대상을 변형시킬 수 있다.
상기 대상은 표적 핵산, 유전자, 염색체 또는 단백질일 수 있다.
예를 들어, 가이드핵산-에디터단백질 복합체는 최종적으로 대상하는 단백질의 발현을 조절(예를 들어, 억제, 저해, 감소, 증가 또는 촉진) 할 수 있도록 하거나, 또는 단백질을 제거 또는 새로운 단백질을 발현할 수 있도록 한다.
이때, 상기 가이드핵산-에디터단백질 복합체는 DNA, RNA, 유전자 또는 염색체 수준에서 작용할 수 있다.
상기 가이드핵산-에디터단백질 복합체는 유전자의 전사와 번역의 단계에서 작용할 수 있다.
상기 가이드핵산-에디터단백질 복합체는 단백질 수준에서 작용할 수 있다.
1. 가이드핵산
가이드핵산은 표적 핵산, 유전자, 염색체 또는 단백질을 인식할 수 있는 핵산으로, 가이드핵산-단백질 복합체를 형성한다.
이때, 가이드핵산은 가이드핵산-단백질 복합체가 표적하는 핵산, 유전자, 염색체 또는 단백질을 인식 또는 표적하도록 역할한다.
상기 가이드핵산은 DNA, RNA 또는 DNA/RNA 혼합의 형태일 수 있고, 5 내지 150개의 핵산서열을 가질 수 있다.
상기 가이드핵산은 선형 또는 원형일 수 있다.
상기 가이드핵산은 하나의 연속된 핵산서열일 수 있다.
예를 들어, 하나의 연속된 핵산 서열은 (N)m 일 수 있고, 이때 N은 A, T, C 또는 G, 또는 A, U, C 또는 G이며, m은 1 내지 150의 정수를 의미한다.
상기 가이드핵산은 연속된 핵산서열이 두 개 이상일 수 있다.
예를 들어, 두 개 이상의 연속된 핵산서열은 (N)m과 (N)o 일 수 있고, 이때 N은 A, T, C 또는 G, 또는 A, U, C 또는 G이며, m 및 o는 1 내지 150의 정수를 의미하며, m과 o는 서로 같거나 다를 수 있다.
상기 가이드핵산은 하나 이상의 도메인을 포함할 수 있다.
이때, 상기 도메인은 가이드 도메인, 제 1 상보적 도메인, 연결 도메인, 제 2 상보적 도메인, 근위 도메인, 꼬리도메인 등 일 수 있으며, 이에 제한되지 않는다.
상기 가이드핵산은 두 개 이상의 도메인을 포함할 수 있으며, 이때, 동일한 도메인을 반복적으로 포함하거나, 서로 다른 도메인을 포함할 수 있다.
상기 도메인에 대한 설명은 하단에 기술한다.
i) 가이드 도메인
“가이드 도메인”은 표적 유전자 또는 핵산 상에서 표적 서열과 상보적인 결합을 할 수 있는 상보적인 가이드 서열이 포함된 도메인으로, 표적 유전자 또는 핵산과의 특이적인 상호작용을 위해 역할한다.
상기 가이드 서열은 표적 유전자 또는 핵산 상에서 표적 서열에 상보성인 핵산 서열로, 예를 들어 최소한 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상보적이거나 또는 완전하게 상보적인 핵산 서열일 수 있다.
상기 가이드 도메인은 5 내지 50개의 염기서열일 수 있다.
일 예로, 상기 가이드 도메인은 5 내지 50개의 염기서열, 10 내지 50개의 염기서열, 15 내지50개의 염기서열, 20 내지 50개의 염기서열, 25 내지 50개의 염기서열, 30 내지 50개의 염기서열, 35 내지 50개의 염기서열, 40 내지 50개의 염기서열 또는 45 내지 50개의 염기서열일 수 있다.
다른 일 예로, 상기 가이드 도메인은 1 내지 5개의 염기서열, 5내지 10개의 염기서열, 10 내지 15개의 염기서열, 15 내지 20개의 염기서열, 20 내지 25개의 염기서열, 25 내지 30개의 염기서열, 30 내지 35개의 염기서열, 35 내지 40개의 염기서열, 40 내지 45개의 염기서열 또는 45 내지 50개의 염기서열일 수 있다.
상기 가이드 도메인은 가이드 서열을 포함할 수 있다.
상기 가이드 서열은 표적 유전자 또는 핵산 상에서 표적 서열과 상보적인 결합을 할 수 있는 상보적인 염기서열일 수 있다.
상기 가이드 서열은 표적 유전자 또는 핵산 상에서 표적 서열에 상보성인 핵산 서열일 수 있으며, 예를 들어 최소한 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상보적이거나 또는 완전하게 상보적인 핵산 서열일 수 있다.
상기 가이드 서열은 5 내지 50개의 염기서열일 수 있다.
일 예로, 상기 가이드 도메인은 5 내지 50개의 염기서열, 10 내지 50개의 염기서열, 15 내지50개의 염기서열, 20 내지 50개의 염기서열, 25 내지 50개의 염기서열, 30 내지 50개의 염기서열, 35 내지 50개의 염기서열, 40 내지 50개의 염기서열 또는 45 내지 50개의 염기서열일 수 있다.
다른 일 예로, 상기 가이드 서열은 1 내지 5개의 염기서열, 5내지 10개의 염기서열, 10 내지 15개의 염기서열, 15 내지 20개의 염기서열, 20 내지 25개의 염기서열, 25 내지 30개의 염기서열, 30 내지 35개의 염기서열, 35 내지 40개의 염기서열, 40 내지 45개의 염기서열 또는 45 내지 50개의 염기서열일 수 있다.
또한, 상기 가이드 도메인은 가이드 서열 및 추가 염기서열을 포함할 수 있다.
상기 추가 염기서열은 가이드 도메인의 기능 향상 또는 저하를 위한 것일 수 있다.
상기 추가 염기서열은 가이드 서열의 기능 향상 또는 저하를 위한 것일 수 있다.
상기 추가 염기서열은 1 내지 35개의 염기서열일 수 있다.
일 예로, 상기 추가 염기서열은 5 내지 35개의 염기서열, 10 내지 35개의 염기서열, 15 내지35개의 염기서열, 20 내지 35개의 염기서열, 25 내지 35개의 염기서열 또는 30 내지 35개의 염기서열일 수 있다.
다른 일 예로, 상기 추가 염기서열은 1 내지 5개의 염기서열, 5내지 10개의 염기서열, 10 내지 15개의 염기서열, 15 내지 20개의 염기서열, 20 내지 25개의 염기서열, 25 내지 30개의 염기서열 또는 30 내지 35개의 염기서열일 수 있다.
상기 추가 염기서열은 상기 가이드 서열의 5’말단에 위치할 수 있다.
상기 추가 염기서열은 상기 가이드 서열의 3’말단에 위치할 수 있다.
ii) 제 1 상보적 도메인
“제 1 상보적 도메인”은 제 2 상보적 도메인과 상보적 핵산서열을 포함하는 핵산 서열로, 제 2 상보적 도메인과 이중가닥을 형성할 수 있을 정도로 상보성을 가진다.
상기 제 1 상보적 도메인은 5 내지 35개의 염기서열일 수 있다.
일 예로, 제 1 상보적 도메인은 5 내지 35개의 염기서열, 10 내지 35개의 염기서열, 15 내지35개의 염기서열, 20 내지 35개의 염기서열, 25 내지 35개의 염기서열 또는 30 내지 35개의 염기서열일 수 있다.
다른 일 예로서, 상기 제 1 상보적 도메인은 1 내지 5개의 염기서열, 5내지 10개의 염기서열, 10 내지 15개의 염기서열, 15 내지 20개의 염기서열, 20 내지 25개의 염기서열, 25 내지 30개의 염기서열 또는 30 내지 35개의 염기서열일 수 있다.
iii) 연결 도메인
“연결 도메인”은 두 개 이상의 도메인을 연결하는 핵산 서열로, 연결 도메인은 동일한 또는 서로 다른 두 개 이상의 도메인을 연결한다. 연결 도메인은 두 개 이상의 도메인과 공유결합 또는 비공유결합을 할 수 있고, 또는 두 개 이상의 도메인을 공유적 또는 비공유적으로 연결할 수 있다.
상기 연결 도메인은 1 내지 30개의 염기서열일 수 있다.
일 예로서, 상기 연결 도메인은 1 내지 5개의 염기서열, 5내지 10개의 염기서열, 10 내지 15개의 염기서열, 15내지 20개의 염기서열, 20 내지 25개의 염기서열 또는 25 내지 30개의 염기서열일 수 있다.
다른 일 예로서, 상기 연결 도메인은 1 내지 30 개의 염기서열, 5내지 30개의 염기서열, 10 내지 30개의 염기서열, 15내지 30개의 염기서열, 20 내지 30개의 염기서열 또는 25 내지 30개의 염기서열일 수 있다.
iv ) 제 2 상보적 도메인
“제 2 상보적 도메인”은 제 1 상보적 도메인과 상보적 핵산서열을 포함하는 핵산서열로, 제 1 상보적 도메인과 이중가닥을 형성할 수 있을 정도로 상보성을 가진다.
제 2 상보적 도메인은 제 1 상보적 도메인과 상보적 염기서열 및 제 1 상보적 도메인과의 상보성이 없는 염기서열, 예를 들어, 제 1 상보적 도메인과 이중가닥을 형성하지 않는 염기서열을 포함할 수 있으며, 제 1 상보적 도메인보다 염기서열의 길이가 길 수 있다.
상기 제 2 상보적 도메인은 5 내지 35개의 염기서열일 수 있다.
일 예로, 상기 제 2 상보적 도메인은 1 내지 35개의 염기서열, 5내지 35개의 염기서열, 10 내지 35개의 염기서열, 15내지 35개의 염기서열, 20 내지 35개의 염기서열, 25 내지 35개의 염기서열 또는 30 내지 35 염기서열일 수 있다.
다른 일 예로, 상기 제 2 상보적 도메인은 1 내지 5개의 염기서열, 5내지 10개의 염기서열, 10 내지 15개의 염기서열, 15 내지 20개의 염기서열, 20 내지 25개의 염기서열, 25 내지 30개의 염기서열 또는 30 내지 35개의 염기서열일 수 있다.
v) 근위 도메인( proximal domain )
“근위 도메인”은 제 2 상보적 도메인에 근접하게 위치하는 핵산서열이다.
근위 도메인은 근위 도메인 내의 상보적인 염기서열을 포함할 수 있으며, 상보적인 염기서열에 의해 이중가닥을 형성할 수 있다.
상기 근위 도메인은 1 내지 20개의 염기서열일 수 있다.
일 예로서, 상기 근위 도메인은 1 내지 20개의 염기서열, 5내지 20개의 염기서열, 10 내지 20개의 염기서열 또는 15내지 20개의 염기서열일 수 있다.
다른 일 예로서, 상기 근위 도메인은 1 내지 5개의 염기서열, 5내지 10개의 염기서열, 10 내지 15개의 염기서열 또는 15 내지 20개의 염기서열일 수 있다.
vi ) 꼬리 도메인
“꼬리 도메인”은 가이드핵산의 양 말단 중 어느 하나이상의 말단에 위치하는 핵산서열이다.
꼬리 도메인은 꼬리 도메인 내의 상보적인 염기서열을 포함할 수 있으며, 상보적인 염기서열에 의해 이중가닥을 형성할 수 있다.
상기 꼬리 도메인은 1 내지 50개의 염기서열일 수 있다.
일 예로, 상기 꼬리 도메인은 5 내지 50개의 염기서열, 10 내지 50개의 염기서열, 15 내지50개의 염기서열, 20 내지 50개의 염기서열, 25 내지 50개의 염기서열, 30 내지 50개의 염기서열, 35 내지 50개의 염기서열, 40 내지 50개의 염기서열 또는 45 내지 50개의 염기서열일 수 있다.
다른 일 예로, 상기 꼬리 도메인은 1 내지 5개의 염기서열, 5내지 10개의 염기서열, 10 내지 15개의 염기서열, 15 내지 20개의 염기서열, 20 내지 25개의 염기서열, 25 내지 30개의 염기서열, 30 내지 35개의 염기서열, 35 내지 40개의 염기서열, 40 내지 45개의 염기서열 또는 45 내지 50개의 염기서열일 수 있다.
한편, 상기 도메인들, 즉, 가이드 도메인, 제 1 상보적 도메인, 연결 도메인, 제 2 상보적 도메인, 근위 도메인 및 꼬리 도메인이 포함하는 핵산 서열의 일부 또는 전부는 선택적 또는 추가적으로 화학적 변형을 포함할 수 있다.
상기 화학적 변형은 methylation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid(LNA), 2’-O-methyl 3’phosphorothioate(MS) 또는 2’-O-methyl 3’thioPACE(MSP)일 수 있으나, 이에 제한되지 않는다.
가이드핵산은 하나 이상의 도메인을 포함한다.
상기 가이드핵산은 가이드 도메인을 포함할 수 있다.
상기 가이드핵산은 제 1 상보적 도메인을 포함할 수 있다.
상기 가이드핵산은 연결 도메인을 포함할 수 있다.
상기 가이드핵산은 제 2 상보적 도메인을 포함할 수 있다.
상기 가이드핵산은 근위 도메인을 포함할 수 있다.
상기 가이드핵산은 꼬리 도메인을 포함할 수 있다.
이때, 상기 도메인의 개수는 1, 2, 3, 4, 5, 6 또는 그 이상일 수 있다.
상기 가이드핵산은 1, 2, 3, 4, 5, 6 또는 그 이상의 가이드 도메인을 포함할 수 있다.
상기 가이드핵산은 1, 2, 3, 4, 5, 6 또는 그 이상의 제 1 상보적 도메인을 포함할 수 있다.
상기 가이드핵산은 1, 2, 3, 4, 5, 6 또는 그 이상의 연결 도메인을 포함할 수 있다.
상기 가이드핵산은 1, 2, 3, 4, 5, 6 또는 그 이상의 제 2 상보적 도메인을 포함할 수 있다.
상기 가이드핵산은 1, 2, 3, 4, 5, 6 또는 그 이상의 근위 도메인을 포함할 수 있다.
상기 가이드핵산은 1, 2, 3, 4, 5, 6 또는 그 이상의 꼬리 도메인을 포함할 수 있다.
이때, 상기 가이드핵산은 하나의 도메인이 중복되어 포함될 수 있다.
상기 가이드핵산은 여러 도메인을 중복 또는 중복시키지 않고 포함할 수 있다.
상기 가이드핵산은 같은 종류의 도메인을 포함할 수 있으며, 이때, 같은 종류의 도메인은 동일한 핵산서열을 가지거나 또는 서로 다른 핵산서열을 가질 수 있다.
상기 가이드핵산은 두 종류의 도메인을 포함할 수 있으며, 이때, 다른 두 종류의 도메인은 서로 다른 핵산서열을 가지거나 또는 동일한 핵산서열을 가질 수 있다.
상기 가이드핵산은 세 종류의 도메인을 포함할 수 있으며, 이때, 다른 세 종류의 도메인은 서로 다른 핵산서열을 가지거나 또는 동일한 핵산서열을 가질 수 있다.
상기 가이드핵산은 네 종류의 도메인을 포함할 수 있으며, 이때, 다른 네 종류의 도메인은 서로 다른 핵산서열을 가지거나 또는 동일한 핵산서열을 가질 수 있다.
상기 가이드핵산은 다섯 종류의 도메인을 포함할 수 있으며, 이때, 다른 다섯 종류의 도메인은 서로 다른 핵산서열을 가지거나 또는 동일한 핵산서열을 가질 수 있다.
상기 가이드핵산은 여섯 종류의 도메인을 포함할 수 있으며, 이때, 다른 여섯 종류의 도메인은 서로 다른 핵산서열을 가지거나 또는 동일한 핵산서열을 가질 수 있다.
예를 들면, 가이드핵산은 [가이드 도메인]-[제 1 상보적 도메인]-[연결 도메인]-[제 2 상보적 도메인]-[연결 도메인]-[가이드 도메인]-[제 1 상보적 도메인]-[연결 도메인]-[제 2 상보적 도메인]으로 구성될 수 있으며, 이때, 두 개의 가이드 도메인은 서로 다른 또는 동일한 표적을 위한 가이드 서열을 포함할 수 있으며, 상기 두 개의 제 1 상보적 도메인과 두 개의 제 2 상보적 도메인 동일한 핵산서열을 가지거나 다른 핵산서열을 가질 수 있다. 가이드 도메인이 서로 다른 표적을 위한 가이드 서열을 포함하는 경우, 상기 가이드핵산은 두 개의 표적에 특이적으로 결합할 수 있으며, 이때, 특이적 결합을 동시에 일어나거나 순차적으로 일어날 수 있다. 또한 상기 연결 도메인은 특정 효소에 의해 절단될 수 있으며, 특정 효소의 존재하에서 상기 가이드핵산은 두 부분 또는 세 부분으로 나누어질 수 있다.
본 발명의 가이드핵산의 일 구체예로서, gRNA에 대해 하단에 기술하였다.
gRNA
“gRNA”는 표적 유전자 또는 핵산에 대한 gRNA-CRISPR 효소 복합체, 즉, CRISPR 복합체의 특이적 표적화할 수 있는 핵산을 지칭한다. 또한, 상기 gRNA는 표적 유전자 또는 핵산 특이적 RNA를 의미하며, CRISPR 효소과 결합하여 CRISPR 효소를 표적 유전자 또는 핵산으로 인도할 수 있다.
상기 gRNA는 다수의 도메인을 포함할 수 있다. 각각의 도메인에 의해 3차원 행태 또는 gRNA의 활성 형태의 가닥내 또는 가닥간 상호작용을 할 수 있다.
gRNA는 단일가닥 gRNA(단일 RNA 분자); 또는 이중 gRNA(하나 초과의 통상적으로 2개의 별개의 RNA 분자를 포함함)로서 지칭될 수 있다.
일 구체예에서, 단일가닥 gRNA는 5’으로부터 3’ 방향으로 가이드 도메인, 즉 표적 유전자 또는 핵산에 상보적인 결합을 할 수 있는 가이드 서열(guide sequence)를 포함하는 도메인; 제 1 상보적 도메인; 연결 도메인; 제 2 상보적 도메인, 상기 제 1 상보적 도메인 서열에 상보적인 서열을 가지므로 제 1 상보적 도메인과 이중가닥 핵산을 형성할 수 있는 도메인; 근위 도메인(proximal domain); 및 선택적으로 꼬리 도메인을 포함할 수 있다.
다른 일 구체예로서, 이중 gRNA는 5’으로부터 3’ 방향으로 가이드 도메인, 즉 표적 유전자 또는 핵산에 상보적인 결합을 할 수 있는 가이드 서열(guide sequence)를 포함하는 도메인 및 제 1 상보적 도메인을 포함하는 제 1가닥; 및 제 2 상보적 도메인, 상기 제 1 상보적 도메인 서열에 상보적인 서열을 가지므로 제 1 상보적 도메인과 이중가닥 핵산을 형성할 수 있는 도메인, 근위 도메인(proximal domain); 및 선택적으로 꼬리 도메인을 포함하는 제 2 가닥을 포함할 수 있다.
이때, 상기 제 1가닥은 crRNA라고 지칭될 수 있고, 상기 제 2가닥은 tracrRNA로 지칭될 수 있다. 상기 crRNA는 가이드 도메인과 제 1 상보적 도메인을 포함할 수 있으며, 상기 tracrRNA는 제 2 상보적 도메인, 근위 도메인 및 선택적으로 꼬리 도메인을 포함할 수 있다.
또 다른 일 구체예로서, 단일가닥 gRNA는 3’으로부터 5’ 방향으로 가이드 도메인, 즉 표적 유전자 또는 핵산에 상보적인 결합을 할 수 있는 가이드 서열(guide sequence)를 포함하는 도메인; 제 1 상보적 도메인; 및 제 2 상보적 도메인, 상기 제 1 상보적 도메인 서열에 상보적인 서열을 가지므로 제 1 상보적 도메인과 이중가닥 핵산을 형성할 수 있는 도메인을 포함할 수 있다.
가이드 도메인
상기 가이드 도메인은 표적 유전자 또는 핵산 상에서 표적 서열과 상보적인 결합을 할 수 있는 상보적인 가이드 서열을 포함한다. 상기 가이드 서열은 표적 유전자 또는 핵산 상에서 표적 서열에 상보성인 핵산 서열로, 예를 들어 최소한 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상보적이거나 또는 완전하게 상보적인 핵산 서열일 수 있다. 가이드 도메인은 gRNA-Cas 복합체, 즉, CRISPR 복합체의 표적 유전자 또는 핵산과의 특이적인 상호작용을 할 수 있도록 역할을 한다고 여겨진다.
상기 가이드 도메인은 5 내지 50개의 염기서열일 수 있다.
일 구체예로서, 상기 가이드 도메인은 16개의 염기서열, 17개의 염기서열, 18개의 염기서열, 19개의 염기서열, 20개의 염기서열, 21개의 염기서열, 22개의 염기서열, 23개의 염기서열, 24개의 염기서열 또는 25개의 염기서열일 수 있다.
다른 일 구체예로서, 상기 가이드 도메인은 16개의 염기서열, 17개의 염기서열, 18개의 염기서열, 19개의 염기서열, 20개의 염기서열, 21개의 염기서열, 22개의 염기서열, 23개의 염기서열, 24개의 염기서열 또는 25개의 염기서열을 포함할 수 있다.
이때, 상기 가이드 도메인은 가이드 서열을 포함할 수 있다.
상기 가이드 서열은 표적 유전자 또는 핵산 상에서 표적 서열과 상보적인 결합을 할 수 있는 상보적인 염기서열일 수 있다.
상기 가이드 서열은 표적 유전자 또는 핵산 상에서 표적 서열에 상보성인 핵산 서열일 수 있으며, 예를 들어 최소한 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상보적이거나 또는 완전하게 상보적인 핵산 서열일 수 있다.
상기 가이드 서열은 5 내지 50개의 염기서열일 수 있다.
일 구체예로서, 상기 가이드 서열은 16개의 염기서열, 17개의 염기서열, 18개의 염기서열, 19개의 염기서열, 20개의 염기서열, 21개의 염기서열, 22개의 염기서열, 23개의 염기서열, 24개의 염기서열 또는 25개의 염기서열일 수 있다.
다른 일 구체예로서, 상기 가이드 서열은 16개의 염기서열, 17개의 염기서열, 18개의 염기서열, 19개의 염기서열, 20개의 염기서열, 21개의 염기서열, 22개의 염기서열, 23개의 염기서열, 24개의 염기서열 또는 25개의 염기서열을 포함할 수 있다.
이때, 상기 가이드 도메인은 가이드 서열 및 추가 염기서열을 포함할 수 있다.
상기 추가 염기서열은 1 내지 35개의 염기서열일 수 있다.
일 구체예로서, 상기 추가 염기서열은 1개의 염기서열, 2개의 염기서열, 3개의 염기서열, 4개의 염기서열, 5개의 염기서열, 6개의 염기서열, 7개의 염기서열, 8개의 염기서열, 9개의 염기서열 또는 10개의 염기서열일 수 있다.
예를 들어, 상기 추가 염기서열은 1개의 염기서열 G(구아닌)일 수 있으며, 또는 2개의 염기서열 GG일 수 있다.
상기 추가 염기서열은 상기 가이드 서열의 5’말단에 위치할 수 있다.
상기 추가 염기서열은 상기 가이드 서열의 3’말단에 위치할 수 있다.
선택적으로 상기 가이드 도메인의 염기서열의 일부 또는 전부는 화학적 변형을 포함할 수 있다. 상기 화학적 변형은 methylation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid(LNA), 2’-O-methyl 3’phosphorothioate(MS) 또는 2’-O-methyl 3’thioPACE(MSP)일 수 있으나, 이에 제한되지 않는다.
제 1 상보적 도메인
제 1 상보적 도메인은 제 2 상보적 도메인과 상보적 핵산서열을 포함하며, 제 2 상보적 도메인과 이중가닥을 형성할 수 있을 정도로 상보성을 가진다.
이때, 상기 제 1 상보적 도메인은 5 내지 35개의 염기서열일 수 있다. 상기 제 1 상보적 도메인은 5 내지 35개의 염기서열을 포함할 수 있다.
일 구체예로서, 상기 제 1 상보적 도메인은 5개의 염기서열, 6개의 염기서열, 7개의 염기서열, 8개의 염기서열, 9개의 염기서열, 10개의 염기서열, 11개의 염기서열, 12개의 염기서열, 13개의 염기서열, 14개의 염기서열, 15개의 염기서열, 16개의 염기서열, 17개의 염기서열, 18개의 염기서열, 19개의 염기서열, 20개의 염기서열, 21개의 염기서열, 22개의 염기서열, 23개의 염기서열, 24개의 염기서열 또는 25개의 염기서열일 수 있다.
다른 일 구체예로서, 상기 제 1 상보적 도메인은 5개의 염기서열, 6개의 염기서열, 7개의 염기서열, 8개의 염기서열, 9개의 염기서열, 10개의 염기서열, 11개의 염기서열, 12개의 염기서열, 13개의 염기서열, 14개의 염기서열, 15개의 염기서열, 16개의 염기서열, 17개의 염기서열, 18개의 염기서열, 19개의 염기서열, 20개의 염기서열, 21개의 염기서열, 22개의 염기서열, 23개의 염기서열, 24개의 염기서열 또는 25개의 염기서열을 포함할 수 있다.
상기 제 1 상보적 도메인은 자연유래의 제 1 상보적 도메인과 상동성을 가지거나, 또는 자연유래의 제 1 상보적 도메인으로부터 유래될 수 있다. 또한, 상기 제 1 상보적 도메인은 자연에 존재하는 종에 따라 제 1 상보적 도메인의 염기서열에 차이가 존재할 수 있으며, 자연에 존재하는 종이 포함하는 제 1 상보적 도메인으로부터 유래될 수 있고, 또는 자연에 존재하는 종이 포함하는 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가질 수 있다.
일 구체예로서, 상기 제 1 상보적 도메인은 스트렙토코커스 피요게네스(Streptococcus pyogenes), 캄필로박터 제주니(Campylobacter jejuni), 스트렙토코커스 써모필러스(Streptococcus thermophilus), 스트렙토코커스 아우레우스(Streptococcus aureus) 또는 네이세리아 메닝기디티스(Neisseria meningitides)의 제 1 상보적 도메인 또는 유래된 제 1 상보적 도메인과 일부, 최소 50%이상, 또는 완전한 상동성을 가질 수 있다.
예를 들어, 상기 제 1 상보적 도메인이 스트렙토코커스 피요게네스의 제 1 상보적 도메인 또는 스트렙토코커스 피요게네스 유래 제 1 상보적 도메인인 경우, 상기 제 1 상보적 도메인은 5’-GUUUUAGAGCUA-3’일 수 있고, 또는 5’-GUUUUAGAGCUA-3’와 일부, 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다. 이때, 상기 제 1 상보적 도메인은 추가로 (X)n을 포함, 즉, 5’-GUUUUAGAGCUA(X)n-3’, 할 수 있다. 상기 X는 염기 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n은 염기서열의 개수로, 5 내지 15의 정수일 수 있다. 이때, (X)n은 동일한 염기서열의 정수 n개만큼의 반복일 수 있고, 또는 염기 A, T, U 및 G가 혼합된 정수 n개의 염기서열일 수 있다.
또 다른 예를 들어, 상기 제 1 상보적 도메인이 캄필로박터 제주니의 제 1 상보적 도메인 또는 캄필로박터 제주니 유래 제 1 상보적 도메인인 경우, 상기 제 1 상보적 도메인은 5’-GUUUUAGUCCCUUUUUAAAUUUCUU-3’일 수 있고, 또는 5’-GUUUUAGUCCCUUUUUAAAUUUCUU-3’와 일부, 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다. 이때, 상기 제 1 상보적 도메인은 추가로 (X)n을 포함, 즉, 5’-GUUUUAGUCCCUUUUUAAAUUUCUU(X)n-3’, 할 수 있다. 상기 X는 염기 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n은 염기서열의 개수로, 5 내지 15의 정수일 수 있다. 이때, (X)n은 동일한 염기서열의 정수 n개만큼의 반복일 수 있고, 또는 염기 A, T, U 및 G가 혼합된 정수 n개의 염기서열일 수 있다.
다른 일 구체예로서, 상기 제 1 상보적 도메인은 팔쿠박테리아 박테리움(Parcubacteria bacterium (GWC2011_GWC2_44_17)), 라츠노스피라세애 박테리움(Lachnospiraceae bacterium (MC2017)), 부티리비브리오 프로테오클라시커스(Butyrivibrio proteoclasiicus), 페레그리니박테리아 박테리움(Peregrinibacteria bacterium (GW2011_GWA_33_10)), 액시다미노코커스 에스피(Acidaminococcus sp. (BV3L6)), 포르피로모나스 마카캐(Porphyromonas macacae), 라츠노피라세애 박테리움(Lachnospiraceae bacterium (ND2006)), 포르피로모나스 크레비오리카니스(Porphyromonas crevioricanis), 프레보텔라 디이엔스(Prevotella disiens), 모라셀라 보보쿨리(Moraxella bovoculi (237)), 스미이헬라 에스피(Smiihella sp. (SC_KO8D17)), 렙포스피라 이나다이(Leptospira inadai), 라츠노스피라세애 박테리움(Lachnospiraceae bacterium (MA2020)), 프란시셀라 노비시다(Francisella novicida (U112)), 캔디다투스 메타노플라즈마 털미툼(Candidatus Methanoplasma termitum) 또는 에유박테리움 엘리겐스(Eubacterium eligens)의 제 1 상보적 도메인 또는 유래된 제 1 상보적 도메인과 일부, 최소 50%이상, 또는 완전한 상동성을 가질 수 있다.
예를 들어, 상기 제 1 상보적 도메인이 팔쿠박테리아 박테리움의 제 1 상보적 도메인 또는 팔쿠박테리아 박테리움 유래 제 1 상보적 도메인인 경우, 상기 제 1 상보적 도메인은 5’-UUUGUAGAU-3’ 일 수 있고, 또는 5’-UUUGUAGAU-3’와 일부, 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다. 이때, 상기 제 1 상보적 도메인은 추가로 (X)n을 포함, 즉, 5’-(X)nUUUGUAGAU-3’ 할 수 있다. 상기 X는 염기 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n은 염기서열의 개수로, 1 내지 5의 정수일 수 있다. 이때, (X)n은 동일한 염기서열의 정수 n개만큼의 반복일 수 있고, 또는 염기 A, T, U 및 G가 혼합된 정수 n개의 염기서열일 수 있다.
선택적으로 상기 제 1 상보적 도메인의 염기서열의 일부 또는 전부는 화학적 변형을 포함할 수 있다. 상기 화학적 변형은 methylation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid(LNA), 2’-O-methyl 3’phosphorothioate(MS) 또는 2’-O-methyl 3’thioPACE(MSP)일 수 있으나, 이에 제한되지 않는다.
연결 도메인
연결 도메인은 두 개 이상의 도메인을 연결하는 핵산 서열로, 연결 도메인은 동일한 또는 서로 다른 두 개 이상의 도메인을 연결한다. 연결 도메인은 두 개 이상의 도메인과 공유결합 또는 비공유결합을 할 수 있고, 또는 두 개 이상의 도메인을 공유적 또는 비공유적으로 연결할 수 있다.
상기 연결 도메인은 제 1 상보적 도메인과 제 2 상보적 도메인을 연결하여 단일가닥 gRNA을 생성할 수 있도록 하는 핵산서열일 수 있다.
상기 연결 도메인은 제 1 상보적 도메인과 제 2 상보적 도메인과 공유결합 또는 비공유결합을 할 수 있다.
상기 연결 도메인은 제 1 상보적 도메인과 제 2 상보적 도메인을 공유적 또는 비공유적으로 연결할 수 있다.
상기 연결 도메인은 1 내지 30개의 염기서열일 수 있다. 상기 연결 도메인은 1 내지 30개의 염기서열을 포함할 수 있다.
일 구체예로서, 상기 연결 도메인은 1 내지 5개의 염기서열, 5내지 10개의 염기서열, 10 내지 15개의 염기서열, 15내지 20개의 염기서열, 20 내지 25개의 염기서열 또는 25 내지 30개의 염기서열일 수 있다.
다른 일 구체예로서, 상기 연결 도메인은 1 내지 5개의 염기서열, 5내지 10개의 염기서열, 10 내지 15개의 염기서열, 15내지 20개의 염기서열, 20 내지 25개의 염기서열 또는 25 내지 30개의 염기서열을 포함할 수 있다.
상기 연결 도메인은 단일가닥 gRNA 분자에 사용하기에 적합하며, 이중 gRNA의 제 1 가닥 및 제 2 가닥과 공유결합 또는 비공유결합 하거나, 또는 제 1 가닥 및 제 2 가닥을 공유적 또는 비공유적으로 연결하여 단일가닥 gRNA을 생성에 사용될 수 있다. 상기 연결 도메인은 이중 gRNA의 crRNA 및 tracrRNA과 공유결합 또는 비공유결합 하거나, 또는 crRNA 및 tracrRNA를 공유적 또는 비공유적으로 연결하여 단일가닥 gRNA를 생성에 사용될 수 있다.
상기 연결 도메인은 자연유래 서열, 예를 들어 tracrRNA의 일부 서열과 상동성을 같거나, 또는 이로부터 유래될 수 있다.
선택적으로 상기 연결 도메인의 염기서열의 일부 또는 전부는 화학적 변형을 포함할 수 있다. 상기 화학적 변형은 methylation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid(LNA), 2’-O-methyl 3’phosphorothioate(MS) 또는 2’-O-methyl 3’thioPACE(MSP)일 수 있으나, 이에 제한되지 않는다.
제 2 상보적 도메인
제 2 상보적 도메인은 제 1 상보적 도메인과 상보적 핵산서열을 포함하며, 제 1 상보적 도메인과 이중가닥을 형성할 수 있을 정도로 상보성을 가진다. 제 2 상보적 도메인은 제 1 상보적 도메인과 상보적 염기서열 및 제 1 상보적 도메인과의 상보성이 없는 염기서열, 예를 들어, 제 1 상보적 도메인과 이중가닥을 형성하지 않는 염기서열을 포함할 수 있으며, 제 1 상보적 도메인보다 염기서열의 길이가 길 수 있다.
이때, 상기 제 2 상보적 도메인은 5 내지 35개의 염기서열일 수 있다. 상기 제 1 상보적 도메인은 5 내지 35개의 염기서열을 포함할 수 있다.
일 구체예로서, 상기 제 2 상보적 도메인은 5개의 염기서열, 6개의 염기서열, 7개의 염기서열, 8개의 염기서열, 9개의 염기서열, 10개의 염기서열, 11개의 염기서열, 12개의 염기서열, 13개의 염기서열, 14개의 염기서열, 15개의 염기서열, 16개의 염기서열, 17개의 염기서열, 18개의 염기서열, 19개의 염기서열, 20개의 염기서열, 21개의 염기서열, 22개의 염기서열, 23개의 염기서열, 24개의 염기서열 또는 25개의 염기서열일 수 있다.
다른 일 구체예로서, 상기 제 2 상보적 도메인은 5개의 염기서열, 6개의 염기서열, 7개의 염기서열, 8개의 염기서열, 9개의 염기서열, 10개의 염기서열, 11개의 염기서열, 12개의 염기서열, 13개의 염기서열, 14개의 염기서열, 15개의 염기서열, 16개의 염기서열, 17개의 염기서열, 18개의 염기서열, 19개의 염기서열, 20개의 염기서열, 21개의 염기서열, 22개의 염기서열, 23개의 염기서열, 24개의 염기서열 또는 25개의 염기서열을 포함할 수 있다.
또한, 상기 제 2 상보적 도메인은 자연유래의 제 2 상보적 도메인과 상동성을 가지거나, 또는 자연유래의 제 2 상보적 도메인으로부터 유래될 수 있다. 또한, 상기 제 2 상보적 도메인은 자연에 존재하는 종에 따라 제 2 상보적 도메인의 염기서열에 차이가 존재할 수 있으며, 자연에 존재하는 종이 포함하는 제 2 상보적 도메인으로부터 유래될 수 있고, 또는 자연에 존재하는 종이 포함하는 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가질 수 있다.
일 구체예로서, 상기 제 2 상보적 도메인은 스트렙토코커스 피요게네스(Streptococcus pyogenes), 캄필로박터 제주니(Campylobacter jejuni), 스트렙토코커스 써모필러스(Streptococcus thermophilus), 스트렙토코커스 아우레우스(Streptococcus aureus) 또는 네이세리아 메닝기디티스(Neisseria meningitides)의 제 2 상보적 도메인 또는 유래된 제 2 상보적 도메인과 일부, 최소 50%이상, 또는 완전한 상동성을 가질 수 있다.
예를 들어, 상기 제 2 상보적 도메인이 스트렙토코커스 피요게네스의 제 2 상보적 도메인 또는 스트렙토코커스 피요게네스 유래 제 2 상보적 도메인인 경우, 상기 제 2 상보적 도메인은 5’-UAGCAAGUUAAAAU-3’일 수 있고, 또는 5’-UAGCAAGUUAAAAU-3’와 일부, 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다(밑줄 표시는 제 1 상보적 도메인과 이중가닥을 형성하는 염기서열). 이때, 상기 제 2 상보적 도메인은 추가로 (X)n 또는/및 (X)m을 포함, 즉, 5’-(X)n UAGCAAGUUAAAAU(X)m-3’, 할 수 있다. 상기 X는 염기 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n 및 m은 염기서열의 개수로, 상기 n은 1 내지 15의 정수일 수 있고, 상기 m은 1 내지 6일 수 있다. 이때, (X)n은 동일한 염기서열의 정수 n개만큼의 반복일 수 있고, 또는 염기 A, T, U 및 G가 혼합된 정수 n개의 염기서열일 수 있다. 또한 (X)m은 동일한 염기서열의 정수 m개만큼의 반복일 수 있고, 또는 염기 A, T, U 및 G가 혼합된 정수 m개의 염기서열일 수 있다.
또 다른 예를 들어, 상기 제 1 상보적 도메인이 캄필로박터 제주니의 제 2 상보적 도메인 또는 캄필로박터 제주니 유래 제 2 상보적 도메인인 경우, 상기 제 2 상보적 도메인은 5’-AAGAAAUUUAAAAAGGGACUAAAAU-3’일 수 있고, 또는 5’-AAGAAAUUUAAAAAGGGACUAAAAU -3’와 일부, 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다(밑줄 표시는 제 1 상보적 도메인과 이중가닥을 형성하는 염기서열). 이때, 상기 제 2 상보적 도메인은 추가로 (X)n 또는/및 (X)m을 포함, 즉, 5’-(X)n AAGAAAUUUAAAAAGGGACUAAAAU(X)m-3’, 할 수 있다. 상기 X는 염기 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n은 1 내지 15의 정수일 수 있고, 상기 m은 1 내지 6일 수 있다. 이때, (X)n은 동일한 염기서열의 정수 n개만큼의 반복일 수 있고, 또는 염기 A, T, U 및 G가 혼합된 정수 n개의 염기서열일 수 있다. 또한 (X)m은 동일한 염기서열의 정수 m개만큼의 반복일 수 있고, 또는 염기 A, T, U 및 G가 혼합된 정수 m개의 염기서열일 수 있다.
다른 일 구체예로서, 상기 제 1 상보적 도메인은 팔쿠박테리아 박테리움(Parcubacteria bacterium (GWC2011_GWC2_44_17)), 라츠노스피라세애 박테리움(Lachnospiraceae bacterium (MC2017)), 부티리비브리오 프로테오클라시커스(Butyrivibrio proteoclasiicus), 페레그리니박테리아 박테리움(Peregrinibacteria bacterium (GW2011_GWA_33_10)), 액시다미노코커스 에스피(Acidaminococcus sp. (BV3L6)), 포르피로모나스 마카캐(Porphyromonas macacae), 라츠노피라세애 박테리움(Lachnospiraceae bacterium (ND2006)), 포르피로모나스 크레비오리카니스(Porphyromonas crevioricanis), 프레보텔라 디이엔스(Prevotella disiens), 모라셀라 보보쿨리(Moraxella bovoculi (237)), 스미이헬라 에스피(Smiihella sp. (SC_KO8D17)), 렙포스피라 이나다이(Leptospira inadai), 라츠노스피라세애 박테리움(Lachnospiraceae bacterium (MA2020)), 프란시셀라 노비시다(Francisella novicida (U112)), 캔디다투스 메타노플라즈마 털미툼(Candidatus Methanoplasma termitum) 또는 에유박테리움 엘리겐스(Eubacterium eligens)의 제 1 상보적 도메인 또는 유래된 제 1 상보적 도메인과 일부, 최소 50%이상, 또는 완전한 상동성을 가질 수 있다.
예를 들어, 상기 제 2 상보적 도메인이 팔쿠박테리아 박테리움의 제 2 상보적 도메인 또는 팔쿠박테리아 박테리움 유래 제 2 상보적 도메인인 경우, 상기 제 2 상보적 도메인은 5’-AAAUUUCUACU-3’ 일 수 있고, 또는 5’-AAAUUUCUACU-3’와 일부, 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다(밑줄 표시는 제 1 상보적 도메인과 이중가닥을 형성하는 염기서열). 이때, 상기 제 2 상보적 도메인은 추가로 (X)n 또는/및 (X)m을 포함, 즉, 5’-(X)nAAAUUUCUACU(X)m-3’ 할 수 있다. 상기 X는 염기 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n 및 m은 염기서열의 개수로, 상기 n은 1 내지 10의 정수일 수 있고, 상기 m은 1 내지 6일 수 있다. 이때, (X)n은 동일한 염기서열의 정수 n개만큼의 반복일 수 있고, 또는 염기 A, T, U 및 G가 혼합된 정수 n개의 염기서열일 수 있다. 또한 (X)m은 동일한 염기서열의 정수 m개만큼의 반복일 수 있고, 또는 염기 A, T, U 및 G가 혼합된 정수 m개의 염기서열일 수 있다.
선택적으로 상기 제 2 상보적 도메인의 염기서열의 일부 또는 전부는 화학적 변형을 포함할 수 있다. 상기 화학적 변형은 methylation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid(LNA), 2’-O-methyl 3’phosphorothioate(MS) 또는 2’-O-methyl 3’thioPACE(MSP)일 수 있으나, 이에 제한되지 않는다.
근위 도메인(proximal domain)
근위 도메인은 제 2 상보적 도메인에 근접하게 위치하는 1 내지 20개의 염기서열로, 제 2 상보적 도메인의 3’ 방향에 위치하는 도메인이다. 이때, 상기 근위 도메인은 근위 도메인 내의 상보적인 염기서열간의 이중가닥 결합을 형성할 수 있다.
일 구체예로서, 상기 근위 도메인은 5개의 염기서열, 6개의 염기서열, 7개의 염기서열, 8개의 염기서열, 8개의 염기서열, 9개의 염기서열, 10개의 염기서열, 11개의 염기서열, 12개의 염기서열, 13개의 염기서열 14개의 염기서열 또는 15개의 염기서열일 수 있다.
다른 구체예로서, 상기 근위 도메인은 5개의 염기서열, 6개의 염기서열, 7개의 염기서열, 8개의 염기서열, 8개의 염기서열, 9개의 염기서열, 10개의 염기서열, 11개의 염기서열, 12개의 염기서열, 13개의 염기서열 14개의 염기서열 또는 15개의 염기서열을 포함할 수 있다.
또한, 상기 근위 도메인은 자연유래의 근위 도메인과 상동성을 가지거나, 또는 자연유래의 근위 도메인으로부터 유래될 수 있다. 또한, 상기 근위 도메인은 자연에 존재하는 종에 따라 근위 도메인의 염기서열에 차이가 존재할 수 있으며, 자연에 존재하는 종이 포함하는 근위 도메인으로부터 유래될 수 있고, 또는 자연에 존재하는 종이 포함하는 근위 도메인과 일부 또는 완전한 상동성을 가질 수 있다.
일 구체예로서, 상기 근위 도메인은 스트렙토코커스 피요게네스(Streptococcus pyogenes), 캄필로박터 제주니(Campylobacter jejuni), 스트렙토코커스 써모필러스(Streptococcus thermophilus), 스트렙토코커스 아우레우스(Streptococcus aureus) 또는 네이세리아 메닝기디티스(Neisseria meningitides)의 근위 도메인 또는 유래된 근위 도메인과 일부, 최소 50%이상, 또는 완전한 상동성을 가질 수 있다.
예를 들어, 상기 근위 도메인이 스트렙토코커스 피요게네스의 근위 도메인 또는 스트렙토코커스 피요게네스 유래 근위 도메인인 경우, 상기 근위 도메인은 5’-AAGGCUAGUCCG-3’일 수 있고, 또는 5’-AAGGCUAGUCCG-3’와 일부, 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다. 이때, 상기 근위 도메인은 추가로 (X)n을 포함, 즉, 5’-AAGGCUAGUCCG(X)n-3’, 할 수 있다. 상기 X는 염기 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n은 염기서열의 개수로, 1 내지 15의 정수일 수 있다. 이때, (X)n은 동일한 염기서열의 정수 n개만큼의 반복일 수 있고, 또는 염기 A, T, U 및 G가 혼합된 정수 n개의 염기서열일 수 있다.
또 다른 예를 들어, 상기 근위 도메인이 캄필로박터 제주니의 근위 도메인 또는 캄필로박터 제주니 유래 근위 도메인인 경우, 상기 근위 도메인은 5’-AAAGAGUUUGC-3’일 수 있고, 또는 5’-AAAGAGUUUGC-3’와 일부, 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다. 이때, 상기 근위 도메인은 추가로 (X)n을 포함, 즉, 5’-AAAGAGUUUGC(X)n-3’, 할 수 있다. 상기 X는 염기 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n은 염기서열의 개수로, 1 내지 40의 정수일 수 있다. 이때, (X)n은 동일한 염기서열의 정수 n개만큼의 반복일 수 있고, 또는 염기 A, T, U 및 G가 혼합된 정수 n개의 염기서열일 수 있다.
선택적으로 상기 근위 도메인의 염기서열의 일부 또는 전부는 화학적 변형을 포함할 수 있다. 상기 화학적 변형은 methylation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid(LNA), 2’-O-methyl 3’phosphorothioate(MS) 또는 2’-O-methyl 3’thioPACE(MSP)일 수 있으나, 이에 제한되지 않는다.
꼬리 도메인
꼬리 도메인은 단일가닥 gRNA 또는 이중 gRNA의 3’ 말단에 선택적으로 추가될 수 있는 도메인으로, 상기 꼬리 도메인은 1 내지 50개의 염기서열일 수 있으며, 또는 상기 꼬리 도메인은 1 내지 50개의 염기서열을 포함할 수 있다. 이때, 상기 꼬리 도메인은 꼬리 도메인 내의 상보적인 염기서열간의 이중가닥 결합을 형성할 수 있다.
일 구체예로서, 상기 꼬리 도메인은 1 내지 5개의 염기서열, 5내지 10개의 염기서열, 10 내지 15개의 염기서열, 15 내지 20개의 염기서열, 20 내지 25개의 염기서열, 25 내지 30개의 염기서열, 30 내지 35개의 염기서열, 35 내지 40개의 염기서열, 40 내지 45개의 염기서열 또는 45 내지 50개의 염기서열일 수 있다.
다른 구체예로서, 상기 꼬리 도메인은 1 내지 5개의 염기서열, 5내지 10개의 염기서열, 10 내지 15개의 염기서열, 15 내지 20개의 염기서열, 20 내지 25개의 염기서열, 25 내지 30개의 염기서열, 30 내지 35개의 염기서열, 35 내지 40개의 염기서열, 40 내지 45개의 염기서열 또는 45 내지 50개의 염기서열을 포함할 수 있다.
또한, 상기 꼬리 도메인은 자연유래의 꼬리 도메인과 상동성을 가지거나, 또는 자연유래의 꼬리 도메인으로부터 유래될 수 있다. 또한, 상기 꼬리 도메인은 자연에 존재하는 종에 따라 꼬리 도메인의 염기서열에 차이가 존재할 수 있으며, 자연에 존재하는 종이 포함하는 꼬리 도메인으로부터 유래될 수 있고, 또는 자연에 존재하는 종이 포함하는 꼬리 도메인과 일부 또는 완전한 상동성을 가질 수 있다.
일 구체예로서, 상기 꼬리 도메인은 스트렙토코커스 피요게네스(Streptococcus pyogenes), 캄필로박터 제주니(Campylobacter jejuni), 스트렙토코커스 써모필러스(Streptococcus thermophilus), 스트렙토코커스 아우레우스(Streptococcus aureus) 또는 네이세리아 메닝기디티스(Neisseria meningitides)의 꼬리 도메인 또는 유래된 꼬리 도메인과 일부, 최소 50%이상, 또는 완전한 상동성을 가질 수 있다.
예를 들어, 상기 꼬리 도메인이 스트렙토코커스 피요게네스의 꼬리 도메인 또는 스트렙토코커스 피요게네스 유래 꼬리 도메인인 경우, 상기 꼬리 도메인은 5’-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3’일 수 있고, 또는 5’-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3’와 일부, 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다. 이때, 상기 꼬리 도메인은 추가로 (X)n을 포함, 즉, 5’-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(X)n-3’, 할 수 있다. 상기 X는 염기 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n은 염기서열의 개수로, 1 내지 15의 정수일 수 있다. 이때, (X)n은 동일한 염기서열의 정수 n개만큼의 반복일 수 있고, 또는 염기 A, T, U 및 G가 혼합된 정수 n개의 염기서열일 수 있다.
또 다른 예를 들어, 상기 꼬리 도메인이 캄필로박터 제주니의 꼬리 도메인 또는 캄필로박터 제주니 유래 꼬리 도메인인 경우, 상기 꼬리 도메인은 5’-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3’일 수 있고, 또는 5’-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3’와 일부, 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다. 이때, 상기 꼬리 도메인은 추가로 (X)n을 포함, 즉, 5’-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU(X)n-3’, 할 수 있다. 상기 X는 염기 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n은 염기서열의 개수로, 1 내지 15의 정수일 수 있다. 이때, (X)n은 동일한 염기서열의 정수 n개만큼의 반복일 수 있고, 또는 염기 A, T, U 및 G가 혼합된 정수 n개의 염기서열일 수 있다.
다른 일 구체예에서, 상기 꼬리 도메인은 시험관내 또는 생체내 전사 방법과 관련된 3’ 말단에 1 내지 10개의 염기서열을 포함할 수 있다.
예를 들어, T7 프로모터가 gRNA의 시험관내 전사를 위해 사용될 때, 상기 꼬리 도메인은 DNA 주형의 3’ 말단에 존재하는 임의의 염기서열일 수 있다. 또한, U6 프로모터가 생체내 전사를 위해 사용되는 경우, 상기 꼬리 도메인은 UUUUUU일 수 있으며, H1 프로모터가 전사를 위해 사용되는 경우, 상기 꼬리 도메인은 UUUU일 수 있고, pol-III 프로모터를 사용하는 경우에는, 상기 꼬리 도메인은 여러 개의 우라실 염기이거나 또는 대안될 수 있는 염기를 포함할 수 있다.
선택적으로 상기 꼬리 도메인의 염기서열의 일부 또는 전부는 화학적 변형을 포함할 수 있다. 상기 화학적 변형은 methylation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid(LNA), 2’-O-methyl 3’phosphorothioate(MS) 또는 2’-O-methyl 3’thioPACE(MSP)일 수 있으나, 이에 제한되지 않는다.
gRNA는 상기에 기재된 바와 같이 다수의 도메인을 포함할 수 있어, gRNA가 포함하는 도메인의 따라 핵산 서열의 길이를 조절할 수 있으며, 각각의 도메인에 의해 3차원 행태 또는 gRNA의 활성 형태의 가닥내 또는 가닥간 상호작용을 할 수 있다.
gRNA는 단일가닥 gRNA(단일 RNA 분자); 또는 이중 gRNA(하나 초과의 통상적으로 2개의 별개의 RNA 분자를 포함함)로서 지칭될 수 있다.
이중 gRNA
이중 gRNA는 제 1 가닥 및 제 2 가닥으로 구성된다.
이때, 상기 제 1 가닥은
5’-[가이드 도메인]-[제 1 상보적 도메인]-3’으로 구성될 수 있고,
상기 제 2 가닥은
5’-[제 2 상보적 도메인]-[근위 도메인(proximal domain)]-3’ 또는
5’-[제 2 상보적 도메인]-[근위 도메인(proximal domain)]-[꼬리 도메인]-3’으로 구성될 수 있다.
이때, 상기 제 1가닥은 crRNA라고 지칭될 수 있고, 상기 제 2가닥은 tracrRNA로 지칭될 수 있다.
제 1 가닥
[가이드 도메인]
상기 제 1 가닥에서 상기 가이드 도메인은 표적 유전자 또는 핵산 상에서 표적 서열과 상보적인 결합을 할 수 있는 상보적인 가이드 서열을 포함한다. 상기 가이드 서열은 표적 유전자 또는 핵산 상에서 표적 서열에 상보성인 핵산 서열로, 예를 들어 최소한 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상보적이거나 또는 완전하게 상보적인 핵산 서열일 수 있다. 가이드 도메인은 gRNA-Cas 복합체, 즉, CRISPR 복합체의 표적 유전자 또는 핵산과의 특이적인 상호작용을 할 수 있도록 역할을 한다고 여겨진다.
이때, 상기 가이드 도메인은 5 내지 50개의 염기서열일 수 있으며, 또는 5 내지 50개의 염기서열을 포함할 수 있다. 예들 들어 상기 가이드 도메인은 16개의 염기서열, 17개의 염기서열, 18개의 염기서열, 19개의 염기서열, 20개의 염기서열, 21개의 염기서열, 22개의 염기서열, 23개의 염기서열, 24개의 염기서열 또는 25개의 염기서열일 수 있으며, 또는 이를 포함할 수 있다.
또한, 상기 가이드 도메인은 가이드 서열을 포함할 수 있다.
이때, 상기 가이드 서열은 표적 유전자 또는 핵산 상에서 표적 서열과 상보적인 결합을 할 수 있는 상보적인 염기서열 또는 상보성을 가지는 염기서열일 수 있으며, 예를 들어 최소한 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상보적이거나 또는 완전하게 상보적인 염기서열일 수 있다.
이때, 상기 가이드 서열은 5 내지 50개의 염기서열일 수 있으며, 또는 5 내지 50개의 염기서열을 포함할 수 있다. 예를 들어, 상기 가이드 서열은 16개의 염기서열, 17개의 염기서열, 18개의 염기서열, 19개의 염기서열, 20개의 염기서열, 21개의 염기서열, 22개의 염기서열, 23개의 염기서열, 24개의 염기서열 또는 25개의 염기서열일 수 있으며, 또는 이를 포함할 수 있다.
선택적으로, 상기 가이드 도메인은 가이드 서열 및 추가 염기서열을 포함할 수 있다.
이때, 상기 추가 염기서열은 1 내지 35개의 염기서열일 수 있다. 예를 들어, 상기 추가 염기서열은 1개의 염기서열, 2개의 염기서열, 3개의 염기서열, 4개의 염기서열, 5개의 염기서열, 6개의 염기서열, 7개의 염기서열, 8개의 염기서열, 9개의 염기서열 또는 10개의 염기서열일 수 있다.
일 구체예로서, 상기 추가 염기서열은 1개의 염기서열 G(구아닌)일 수 있으며, 또는 2개의 염기서열 GG일 수 있다.
이때, 상기 추가 염기서열은 상기 가이드 도메인의 5'말단에 위치할 수 있으며, 또는 가이드 서열의 5'말단에 위치할 수 있다.
상기 추가 염기서열은 상기 가이드 도메인의 3'말단에 위치할 수 있으며, 또는 가이드 서열의 3'말단에 위치할 수 있다.
[ 제 1 상보적 도메인]
제 1 상보적 도메인은 제 2 가닥의 제 2 상보적 도메인과 상보적 핵산서열을 포함하며, 제 2 상보적 도메인과 이중가닥을 형성할 수 있을 정도의 상보성을 가지는 도메인이다.
이때, 상기 제 1 상보적 도메인은 5 내지 35개의 염기서열이거나, 또는 5 내지 35개의 염기서열을 포함할 수 있다. 예들 들어, 상기 제 1 상보적 도메인은 5개의 염기서열, 6개의 염기서열, 7개의 염기서열, 8개의 염기서열, 9개의 염기서열, 10개의 염기서열, 11개의 염기서열, 12개의 염기서열, 13개의 염기서열, 14개의 염기서열, 15개의 염기서열, 16개의 염기서열, 17개의 염기서열, 18개의 염기서열, 19개의 염기서열, 20개의 염기서열, 21개의 염기서열, 22개의 염기서열, 23개의 염기서열, 24개의 염기서열 또는 25개의 염기서열일 수 있으며, 또는 이를 포함할 수 있다.
상기 제 1 상보적 도메인은 자연유래의 제 1 상보적 도메인과 상동성을 가지거나, 또는 자연유래의 제 1 상보적 도메인으로부터 유래될 수 있다. 또한, 상기 제 1 상보적 도메인은 자연에 존재하는 종에 따라 제 1 상보적 도메인의 염기서열에 차이가 존재할 수 있으며, 자연에 존재하는 종이 포함하는 제 1 상보적 도메인으로부터 유래될 수 있고, 또는 자연에 존재하는 종이 포함하는 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가질 수 있다.
일 구체예로서, 상기 제 1 상보적 도메인은 스트렙토코커스 피요게네스(Streptococcus pyogenes), 캄필로박터 제주니(Campylobacter jejuni), 스트렙토코커스 써모필러스(Streptococcus thermophilus), 스트렙토코커스 아우레우스(Streptococcus aureus) 또는 네이세리아 메닝기디티스(Neisseria meningitides)의 제 1 상보적 도메인 또는 유래된 제 1 상보적 도메인과 일부, 최소 50%이상, 또는 완전한 상동성을 가질 수 있다.
선택적으로, 상기 제 1 상보적 도메인은 제 2 가닥의 제 2 상보적 도메인과 상보적 결합을 하지않는 추가 염기서열을 포함할 수 있다.
이때, 상기 추가 염기서열은 1 내지 15개의 염기서열일 수 있다. 예를 들어, 상기 추가 염기서열은 1 내지 5개의 염기서열, 5 내지 10개의 염기서열, 또는 10 내지 15개의 염기서열일 수 있다.
선택적으로 상기 가이드 도메인 또는/및 제 1 상보적 도메인의 염기서열의 일부 또는 전부는 화학적 변형을 포함할 수 있다. 상기 화학적 변형은 methylation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid(LNA), 2'-O-methyl 3'phosphorothioate(MS) 또는 2'-O-methyl 3'thioPACE(MSP)일 수 있으나, 이에 제한되지 않는다.
따라서, 제 1 가닥은 상기 기재와 같이 5'-[가이드 도메인]-[제 1 상보적 도메인]-3'으로 구성될 수 있다.
또한, 상기 제 1 가닥은 선택적으로 추가적인 염기서열을 포함할 수 있다.
일 구체예로서, 상기 제 1 가닥은
5'-(Ntarget)-(Q)m-3'; 또는
5'-(X)a-(Ntarget)-(X)b-(Q)m-(X)c-3'일 수 있다.
이때, 상기 Ntarget은 표적 유전자 또는 핵산 상의 표적 서열과 상보적인 결합을 할 수 있는 염기서열로서, 상기 Ntarget은 표적 유전자 또는 핵산 상의 표적 서열에 따라 변할 수 있는 염기서열 부위이다.
이때, 상기 (Q)m은 제 1 상보적 도메인을 포함하는 염기서열로, 제 2 가닥의 제 2 상보적 도메인과 상보적 결합을 할 수 있는 염기서열을 포함한다. 상기 (Q)m은 자연에 존재하는 종의 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가지는 서열일 수 있으며, 유래된 종에 따라 상기 제 1 상보적 도메인의 염기서열은 변경될 수 있다. 상기 Q는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 m은 염기서열의 개수로, 5 내지 35의 정수일 수 있다.
예를 들어, 상기 제 1 상보적 도메인이 스트렙토코커스 피요게네스의 제 1 상보적 도메인 또는 스트렙토코커스 피요게네스 유래 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Q)m은 5'-GUUUUAGAGCUA-3'일 수 있고, 또는 5'-GUUUUAGAGCUA-3'와 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다.
다른 예로, 상기 제 1 상보적 도메인이 캄필로박터 제주니의 제 1 상보적 도메인 또는 캄필로박터 제주니 유래 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Q)m은 5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'일 수 있고, 또는 5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'와 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다.
또 다른 예로, 상기 제 1 상보적 도메인이 스트렙토코커스 써모필러스의 제 1 상보적 도메인 또는 스트렙토코커스 써모필러스 유래 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Q)m은 5'-GUUUUAGAGCUGUGUUGUUUCG-3'일 수 있고, 또는 5'-GUUUUAGAGCUGUGUUGUUUCG-3'와 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다.
또한, 상기 (X)a, (X)b 및 (X)c는 선택적으로 추가할 수 있는 염기서열로, 상기 X는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 a, b 및 c는 염기서열의 개수로, 0 또는 1 내지 20의 정수일 수 있다.
제 2 가닥
제 2 가닥은 제 2 상보적 도메인과 근위 도메인으로 구성되며, 선택적으로 꼬리 도메인을 추가로 포함할 수 있다.
[ 제 2 상보적 도메인]
상기 제 2 가닥에서 제 2 상보적 도메인은 상기 제 1 가닥의 제 1 상보적 도메인과 상보적 핵산서열을 포함하며, 제 1 상보적 도메인과 이중가닥을 형성할 수 있을 정도로 상보성을 가진다. 제 2 상보적 도메인은 제 1 상보적 도메인과 상보적 염기서열 및 제 1 상보적 도메인과의 상보성이 없는 염기서열, 예를 들어, 제 1 상보적 도메인과 이중가닥을 형성하지 않는 염기서열을 포함할 수 있으며, 제 1 상보적 도메인보다 염기서열의 길이가 길 수 있다.
이때, 상기 제 2 상보적 도메인은 5 내지 35개의 염기서열이거나, 또는 5 내지 35개의 염기서열을 포함할 수 있다. 예를 들어, 상기 제 2 상보적 도메인은 5개의 염기서열, 6개의 염기서열, 7개의 염기서열, 8개의 염기서열, 9개의 염기서열, 10개의 염기서열, 11개의 염기서열, 12개의 염기서열, 13개의 염기서열, 14개의 염기서열, 15개의 염기서열, 16개의 염기서열, 17개의 염기서열, 18개의 염기서열, 19개의 염기서열, 20개의 염기서열, 21개의 염기서열, 22개의 염기서열, 23개의 염기서열, 24개의 염기서열 또는 25개의 염기서열일 수 있으며, 또는 이를 포함할 수 있다.
상기 제 2 상보적 도메인은 자연유래의 제 2 상보적 도메인과 상동성을 가지거나, 또는 자연유래의 제 2 상보적 도메인으로부터 유래될 수 있다. 또한, 상기 제 2 상보적 도메인은 자연에 존재하는 종에 따라 제 2 상보적 도메인의 염기서열에 차이가 존재할 수 있으며, 자연에 존재하는 종이 포함하는 제 2 상보적 도메인으로부터 유래될 수 있고, 또는 자연에 존재하는 종이 포함하는 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가질 수 있다.
일 구체예로서, 상기 제 2 상보적 도메인은 스트렙토코커스 피요게네스(Streptococcus pyogenes), 캄필로박터 제주니(Campylobacter jejuni), 스트렙토코커스 써모필러스(Streptococcus thermophilus), 스트렙토코커스 아우레우스(Streptococcus aureus) 또는 네이세리아 메닝기디티스(Neisseria meningitides)의 제 2 상보적 도메인 또는 유래된 제 2 상보적 도메인과 일부, 최소 50%이상, 또는 완전한 상동성을 가질 수 있다.
선택적으로, 상기 제 2 상보적 도메인은 제 1 가닥의 제 1 상보적 도메인과 상보적 결합을 하지않는 추가 염기서열을 포함할 수 있다.
이때, 상기 추가 염기서열은 1 내지 25개의 염기서열일 수 있다. 예를 들어, 상기 추가 염기서열은 1 내지 5개의 염기서열, 5 내지 10개의 염기서열, 10 내지 15개의 염기서열, 15 내지 20개의 염기서열 또는 20 내지 25개의 염기서열일 수 있다.
[ 근위 도메인]
상기 제 2 가닥에서 근위 도메인은 1 내지 20개의 염기서열로, 제 2 상보적 도메인의 3' 방향에 위치하는 도메인이다. 예를 들어, 상기 근위 도메인은 5개의 염기서열, 6개의 염기서열, 7개의 염기서열, 8개의 염기서열, 8개의 염기서열, 9개의 염기서열, 10개의 염기서열, 11개의 염기서열, 12개의 염기서열, 13개의 염기서열 14개의 염기서열 또는 15개의 염기서열일 수 있으며, 또는 이를 포함할 수 있다.
이때, 상기 근위 도메인은 근위 도메인 내의 상보적인 염기서열간의 이중가닥 결합을 형성할 수 있다.
또한, 상기 근위 도메인은 자연유래의 근위 도메인과 상동성을 가지거나, 또는 자연유래의 근위 도메인으로부터 유래될 수 있다. 또한, 상기 근위 도메인은 자연에 존재하는 종에 따라 근위 도메인의 염기서열에 차이가 존재할 수 있으며, 자연에 존재하는 종이 포함하는 근위 도메인으로부터 유래될 수 있고, 또는 자연에 존재하는 종이 포함하는 근위 도메인과 일부 또는 완전한 상동성을 가질 수 있다.
일 구체예로서, 상기 근위 도메인은 스트렙토코커스 피요게네스(Streptococcus pyogenes), 캄필로박터 제주니(Campylobacter jejuni), 스트렙토코커스 써모필러스(Streptococcus thermophilus), 스트렙토코커스 아우레우스(Streptococcus aureus) 또는 네이세리아 메닝기디티스(Neisseria meningitides)의 근위 도메인 또는 유래된 근위 도메인과 일부, 최소 50%이상, 또는 완전한 상동성을 가질 수 있다.
[꼬리 도메인]
선택적으로, 상기 제 2 가닥에서 꼬리 도메인은 제 2 가닥의 3' 말단에 선택적으로 추가될 수 있는 도메인으로, 상기 꼬리 도메인은 1 내지 50개의 염기서열일 수 있으며, 또는 1 내지 50개의 염기서열을 포함할 수 있다. 예를 들어, 상기 꼬리 도메인은 1 내지 5개의 염기서열, 5내지 10개의 염기서열, 10 내지 15개의 염기서열, 15 내지 20개의 염기서열, 20 내지 25개의 염기서열, 25 내지 30개의 염기서열, 30 내지 35개의 염기서열, 35 내지 40개의 염기서열, 40 내지 45개의 염기서열 또는 45 내지 50개의 염기서열일 수 있으며, 또는 이를 포함할 수 있다.
이때, 상기 꼬리 도메인은 꼬리 도메인 내의 상보적인 염기서열간의 이중가닥 결합을 형성할 수 있다.
또한, 상기 꼬리 도메인은 자연유래의 꼬리 도메인과 상동성을 가지거나, 또는 자연유래의 꼬리 도메인으로부터 유래될 수 있다. 또한, 상기 꼬리 도메인은 자연에 존재하는 종에 따라 꼬리 도메인의 염기서열에 차이가 존재할 수 있으며, 자연에 존재하는 종이 포함하는 꼬리 도메인으로부터 유래될 수 있고, 또는 자연에 존재하는 종이 포함하는 꼬리 도메인과 일부 또는 완전한 상동성을 가질 수 있다.
일 구체예로서, 상기 꼬리 도메인은 스트렙토코커스 피요게네스(Streptococcus pyogenes), 캄필로박터 제주니(Campylobacter jejuni), 스트렙토코커스 써모필러스(Streptococcus thermophilus), 스트렙토코커스 아우레우스(Streptococcus aureus) 또는 네이세리아 메닝기디티스(Neisseria meningitides)의 꼬리 도메인 또는 유래된 꼬리 도메인과 일부, 최소 50%이상, 또는 완전한 상동성을 가질 수 있다.
다른 일 구체예에서, 상기 꼬리 도메인은 시험관내 또는 생체내 전사 방법과 관련된 3' 말단에 1 내지 10개의 염기서열을 포함할 수 있다.
예를 들어, T7 프로모터가 gRNA의 시험관내 전사를 위해 사용될 때, 상기 꼬리 도메인은 DNA 주형의 3' 말단에 존재하는 임의의 염기서열일 수 있다. 또한, U6 프로모터가 생체내 전사를 위해 사용되는 경우, 상기 꼬리 도메인은 UUUUUU일 수 있으며, H1 프로모터가 전사를 위해 사용되는 경우, 상기 꼬리 도메인은 UUUU일 수 있고, pol-III 프로모터를 사용하는 경우에는, 상기 꼬리 도메인은 여러 개의 우라실 염기이거나 또는 대안될 수 있는 염기를 포함할 수 있다.
선택적으로 상기 제 2 상보적 도메인, 근위 도메인 또는/및 꼬리 도메인의 염기서열의 일부 또는 전부는 화학적 변형을 포함할 수 있다. 상기 화학적 변형은 methylation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid(LNA), 2'-O-methyl 3'phosphorothioate(MS) 또는 2'-O-methyl 3'thioPACE(MSP)일 수 있으나, 이에 제한되지 않는다.
따라서, 제 2 가닥은 상기 기재와 같이 5'-[제 2 상보적 도메인]-[근위 도메인]-3' 또는 5'-[제 2 상보적 도메인]-[근위 도메인]-[꼬리 도메인]-3'으로 구성될 수 있다.
또한, 상기 제 2 가닥은 선택적으로 추가적인 염기서열을 포함할 수 있다.
일 구체예로서, 상기 제 2 가닥은
5'-(Z)h-(P)k-3'; 또는
5'-(X)d-(Z)h-(X)e-(P)k-(X)f-3' 일 수 있다.
다른 일 구체예로서, 상기 제 2 가닥은
5'-(Z)h-(P)k-(F)i-3'; 또는
5'-(X)d-(Z)h-(X)e-(P)k-(X)f-(F)i-3' 일 수 있다.
이때, 상기 (Z)h는 제 2 상보적 도메인을 포함하는 염기서열로, 제 1 가닥의 제 1 상보적 도메인과 상보적 결합을 할 수 있는 염기서열을 포함한다. 상기 (Z)h은 자연에 존재하는 종의 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가지는 서열일 수 있으며, 유래된 종에 따라 상기 제 2 상보적 도메인의 염기서열은 변경될 수 있다. 상기 Z는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 h은 염기서열의 개수로, 5 내지 50의 정수일 수 있다.
예를 들어, 상기 제 2 상보적 도메인이 스트렙토코커스 피요게네스의 제 2 상보적 도메인 또는 스트렙토코커스 피요게네스 유래 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Z)h은 5'-UAGCAAGUUAAAAU-3'일 수 있고, 또는 5'-UAGCAAGUUAAAAU-3'와 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다.
다른 예로, 상기 제 2 상보적 도메인이 캄필로박터 제주니의 제 2 상보적 도메인 또는 캄필로박터 제주니 유래 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Z)h은 5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'일 수 있고, 또는 5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'와 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다.
또 다른 예로, 상기 제 2 상보적 도메인이 스트렙토코커스 써모필러스의 제 2 상보적 도메인 또는 스트렙토코커스 써모필러스 유래 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Z)h은 5'-CGAAACAACACAGCGAGUUAAAAU-3'일 수 있고, 또는 5'-CGAAACAACACAGCGAGUUAAAAU-3'와 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다.
상기 (P)k는 근위 도메인을 포함하는 염기서열로, 자연에 존재하는 종의 근위 도메인과 일부 또는 완전한 상동성을 가지는 서열일 수 있으며, 유래된 종에 따라 상기 근위 도메인의 염기서열은 변경될 수 있다. 상기 P는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 k은 염기서열의 개수로, 1 내지 20의 정수일 수 있다.
예를 들어, 상기 근위 도메인이 스트렙토코커스 피요게네스의 근위 도메인 또는 스트렙토코커스 피요게네스 유래 근위 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (P)k는 5'-AAGGCUAGUCCG-3'일 수 있고, 또는 5'-AAGGCUAGUCCG-3'와 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다.
다른 예로, 상기 근위 도메인이 캄필로박터 제주니의 근위 도메인 또는 캄필로박터 제주니 유래 근위 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (P)k는 5'-AAAGAGUUUGC-3'일 수 있고, 또는 5'-AAAGAGUUUGC-3'와 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다.
또 다른 예로, 상기 근위 도메인이 스트렙토코커스 써모필러스의 근위 도메인 또는 스트렙토코커스 써모필러스 유래 근위 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (P)k는 5'-AAGGCUUAGUCCG-3'일 수 있고, 또는 5'-AAGGCUUAGUCCG-3'와 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다.
상기 (F)i는 꼬리 도메인을 포함하는 염기서열로, 자연에 존재하는 종의 꼬리 도메인과 일부 또는 완전한 상동성을 가지는 서열일 수 있으며, 유래된 종에 따라 상기 꼬리 도메인의 염기서열은 변경될 수 있다. 상기 F는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 i은 염기서열의 개수로, 1 내지 50의 정수일 수 있다.
예를 들어, 상기 꼬리 도메인이 스트렙토코커스 피요게네스의 꼬리 도메인 또는 스트렙토코커스 피요게네스 유래 꼬리 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (F)i는 5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'일 수 있고, 또는 5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'와 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다.
다른 예로, 상기 꼬리 도메인이 캄필로박터 제주니의 꼬리 도메인 또는 캄필로박터 제주니 유래 꼬리 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (F)i는 5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'일 수 있고, 또는 5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'와 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다.
또 다른 예로, 상기 꼬리 도메인이 스트렙토코커스 써모필러스의 꼬리 도메인 또는 스트렙토코커스 써모필러스 유래 꼬리 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (F)i는 5'-UACUCAACUUGAAAAGGUGGCACCGAUUCGGUGUUUUU-3'일 수 있고, 또는 5'-UACUCAACUUGAAAAGGUGGCACCGAUUCGGUGUUUUU-3'와 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다.
또한, 상기 (F)i는 시험관내 또는 생체내 전사 방법과 관련된 3' 말단에 1 내지 10개의 염기서열을 포함할 수 있다.
예를 들어, T7 프로모터가 gRNA의 시험관내 전사를 위해 사용될 때, 상기 꼬리 도메인은 DNA 주형의 3' 말단에 존재하는 임의의 염기서열일 수 있다. 또한, U6 프로모터가 생체내 전사를 위해 사용되는 경우, 상기 꼬리 도메인은 UUUUUU일 수 있으며, H1 프로모터가 전사를 위해 사용되는 경우, 상기 꼬리 도메인은 UUUU일 수 있고, pol-III 프로모터를 사용하는 경우에는, 상기 꼬리 도메인은 여러 개의 우라실 염기이거나 또는 대안될 수 있는 염기를 포함할 수 있다.
또한, 상기 (X)d, (X)e 및 (X)f는 선택적으로 추가할 수 있는 염기서열로, 상기 X는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 d, e 및 f는 염기서열의 개수로, 0 또는 1 내지 20의 정수일 수 있다.
단일가닥 gRNA
단일가닥 gRNA는 두 가지로 종류로 나뉠 수 있다.
i) 단일가닥 gRNA
우선, 상기 이중 gRNA의 제 1 가닥과 제 2 가닥을 연결 도메인으로 연결한 단일가닥 gRNA이 있으며, 이때, 상기 단일가닥 gRNA는 5'-[제 1 가닥]-[연결 도메인]-[제 2 가닥]-3'로 이루어져 있다.
구체적으로, 상기 단일가닥 gRNA는
5'-[가이드 도메인]-[제 1 상보적 도메인]-[연결 도메인]-[제 2 상보적 도메인]-[근위 도메인(proximal domain)]-3' 또는
5'-[가이드 도메인]-[제 1 상보적 도메인]-[연결 도메인]-[제 2 상보적 도메인]-[근위 도메인(proximal domain)]-[꼬리 도메인]-3'으로 구성될 수 있다.
연결 도메인을 제외한 각각의 도메인은 상기 이중 gRNA의 제 1 가닥 및 제 2 가닥의 각 도메인에 관한 기재와 동일하다.
-연결 도메인
상기 단일가닥 gRNA에서 상기 연결 도메인은 제 1 가닥과 제 2 가닥을 연결하는 도메인으로, 구체적으로는 제 1 상보적 도메인과 제 2 상보적 도메인을 연결하여 단일가닥 gRNA을 생성할 수 있도록 하는 핵산서열이다. 이때, 상기 연결 도메인은 제 1 상보적 도메인과 제 2 상보적 도메인과 공유결합 또는 비공유결합을 할 수 있고, 또는 제 1 상보적 도메인과 제 2 상보적 도메인을 공유적 또는 비공유적으로 연결할 수 있다.
상기 연결 도메인은 1 내지 30개의 염기서열이거나, 또는 1 내지 30개의 염기서열을 포함할 수 있다. 예를 들어, 상기 연결 도메인은 1 내지 5개의 염기서열, 5내지 10개의 염기서열, 10 내지 15개의 염기서열, 15내지 20개의 염기서열, 20 내지 25개의 염기서열 또는 25 내지 30개의 염기서열일 수 있으며, 또는 이를 포함할 수 있다.
상기 연결 도메인은 단일가닥 gRNA 분자에 사용하기에 적합하며, 이중 gRNA의 제 1 가닥 및 제 2 가닥과 공유결합 또는 비공유결합 하거나, 또는 제 1 가닥 및 제 2 가닥을 공유적 또는 비공유적으로 연결하여 단일가닥 gRNA을 생성에 사용될 수 있다. 상기 연결 도메인은 이중 gRNA의 crRNA 및 tracrRNA과 공유결합 또는 비공유결합 하거나, 또는 crRNA 및 tracrRNA를 공유적 또는 비공유적으로 연결하여 단일가닥 gRNA를 생성에 사용될 수 있다.
상기 연결 도메인은 자연유래 서열, 예를 들어 tracrRNA의 일부 서열과 상동성을 같거나, 또는 이로부터 유래될 수 있다.
선택적으로 상기 연결 도메인의 염기서열의 일부 또는 전부는 화학적 변형을 포함할 수 있다. 상기 화학적 변형은 methylation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid(LNA), 2'-O-methyl 3'phosphorothioate(MS) 또는 2'-O-methyl 3'thioPACE(MSP)일 수 있으나, 이에 제한되지 않는다.
따라서, 단일가닥 gRNA는 상기 기재와 같이 5'-[가이드 도메인]-[제 1 상보적 도메인]-[연결 도메인]-[제 2 상보적 도메인]-[근위 도메인(proximal domain)]-3' 또는 5'-[가이드 도메인]-[제 1 상보적 도메인]-[연결 도메인]-[제 2 상보적 도메인]-[근위 도메인(proximal domain)]-[꼬리 도메인]-3'으로 구성될 수 있다.
또한, 상기 단일가닥 gRNA는 선택적으로 추가적인 염기서열을 포함할 수 있다.
일 구체예로서, 상기 단일가닥 gRNA는
5'-(Ntarget)-(Q)m-(L)j-(Z)h-(P)k-3'; 또는
5'-(Ntarget)-(Q)m-(L)j-(Z)h-(P)k-(F)i-3'일 수 있다.
다른 일 구체예로서, 상기 단일가닥 gRNA는
5'-(X)a-(Ntarget)-(X)b-(Q)m-(X)c-(L)j-(X)d-(Z)h-(X)e-(P)k-(X)f-3'; 또는
5'-(X)a-(Ntarget)-(X)b-(Q)m-(X)c-(L)j-(X)d-(Z)h-(X)e-(P)k-(X)f-(F)i-3'일 수 있다.
이때, 상기 Ntarget은 표적 유전자 또는 핵산 상의 표적 서열과 상보적인 결합을 할 수 있는 염기서열로서, 상기 Ntarget은 표적 유전자 또는 핵산 상의 표적 서열에 따라 변할 수 있는 염기서열 부위이다.
상기 (Q)m은 제 1 상보적 도메인을 포함하는 염기서열로, 제 2 상보적 도메인과 상보적 결합을 할 수 있는 염기서열을 포함한다. 상기 (Q)m은 자연에 존재하는 종의 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가지는 서열일 수 있으며, 유래된 종에 따라 상기 제 1 상보적 도메인의 염기서열은 변경될 수 있다. 상기 Q는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 m은 염기서열의 개수로, 5 내지 35의 정수일 수 있다.
예를 들어, 상기 제 1 상보적 도메인이 스트렙토코커스 피요게네스의 제 1 상보적 도메인 또는 스트렙토코커스 피요게네스 유래 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Q)m은 5'-GUUUUAGAGCUA-3'일 수 있고, 또는 5'-GUUUUAGAGCUA-3'와 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다.
다른 예로, 상기 제 1 상보적 도메인이 캄필로박터 제주니의 제 1 상보적 도메인 또는 캄필로박터 제주니 유래 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Q)m은 5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'일 수 있고, 또는 5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'와 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다.
또 다른 예로, 상기 제 1 상보적 도메인이 스트렙토코커스 써모필러스의 제 1 상보적 도메인 또는 스트렙토코커스 써모필러스 유래 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Q)m은 5'-GUUUUAGAGCUGUGUUGUUUCG-3'일 수 있고, 또는 5'-GUUUUAGAGCUGUGUUGUUUCG-3'와 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다.
또한, 상기 (L)j는 연결 도메인을 포함하는 염기서열로, 제 1 상보적 도메인과 제 2 상보적 도메인을 연결하여 단일가닥 gRNA을 생성할 수 있도록 하는 염기서열이다. 이때, 상기 L은 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 j은 염기서열의 개수로, 1 내지 30의 정수일 수 있다.
상기 (Z)h는 제 2 상보적 도메인을 포함하는 염기서열로, 제 1 상보적 도메인과 상보적 결합을 할 수 있는 염기서열을 포함한다. 상기 (Z)h은 자연에 존재하는 종의 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가지는 서열일 수 있으며, 유래된 종에 따라 상기 제 2 상보적 도메인의 염기서열은 변경될 수 있다. 상기 Z는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 h은 염기서열의 개수로, 5 내지 50의 정수일 수 있다.
예를 들어, 상기 제 2 상보적 도메인이 스트렙토코커스 피요게네스의 제 2 상보적 도메인 또는 스트렙토코커스 피요게네스 유래 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Z)h은 5'-UAGCAAGUUAAAAU-3'일 수 있고, 또는 5'-UAGCAAGUUAAAAU-3'와 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다.
다른 예로, 상기 제 2 상보적 도메인이 캄필로박터 제주니의 제 2 상보적 도메인 또는 캄필로박터 제주니 유래 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Z)h은 5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'일 수 있고, 또는 5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'와 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다.
또 다른 예로, 상기 제 2 상보적 도메인이 스트렙토코커스 써모필러스의 제 2 상보적 도메인 또는 스트렙토코커스 써모필러스 유래 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Z)h은 5'-CGAAACAACACAGCGAGUUAAAAU-3'일 수 있고, 또는 5'-CGAAACAACACAGCGAGUUAAAAU-3'와 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다.
상기 (P)k는 근위 도메인을 포함하는 염기서열로, 자연에 존재하는 종의 근위 도메인과 일부 또는 완전한 상동성을 가지는 서열일 수 있으며, 유래된 종에 따라 상기 근위 도메인의 염기서열은 변경될 수 있다. 상기 P는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 k은 염기서열의 개수로, 1 내지 20의 정수일 수 있다.
예를 들어, 상기 근위 도메인이 스트렙토코커스 피요게네스의 근위 도메인 또는 스트렙토코커스 피요게네스 유래 근위 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (P)k는 5'-AAGGCUAGUCCG-3'일 수 있고, 또는 5'-AAGGCUAGUCCG-3'와 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다.
다른 예로, 상기 근위 도메인이 캄필로박터 제주니의 근위 도메인 또는 캄필로박터 제주니 유래 근위 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (P)k는 5'-AAAGAGUUUGC-3'일 수 있고, 또는 5'-AAAGAGUUUGC-3'와 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다.
또 다른 예로, 상기 근위 도메인이 스트렙토코커스 써모필러스의 근위 도메인 또는 스트렙토코커스 써모필러스 유래 근위 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (P)k는 5'-AAGGCUUAGUCCG-3'일 수 있고, 또는 5'-AAGGCUUAGUCCG-3'와 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다.
상기 (F)i는 꼬리 도메인을 포함하는 염기서열로, 자연에 존재하는 종의 꼬리 도메인과 일부 또는 완전한 상동성을 가지는 서열일 수 있으며, 유래된 종에 따라 상기 꼬리 도메인의 염기서열은 변경될 수 있다. 상기 F는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 i은 염기서열의 개수로, 1 내지 50의 정수일 수 있다.
예를 들어, 상기 꼬리 도메인이 스트렙토코커스 피요게네스의 꼬리 도메인 또는 스트렙토코커스 피요게네스 유래 꼬리 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (F)i는 5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'일 수 있고, 또는 5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'와 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다.
다른 예로, 상기 꼬리 도메인이 캄필로박터 제주니의 꼬리 도메인 또는 캄필로박터 제주니 유래 꼬리 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (F)i는 5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'일 수 있고, 또는 5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'와 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다.
또 다른 예로, 상기 꼬리 도메인이 스트렙토코커스 써모필러스의 꼬리 도메인 또는 스트렙토코커스 써모필러스 유래 꼬리 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (F)i는 5'-UACUCAACUUGAAAAGGUGGCACCGAUUCGGUGUUUUU-3'일 수 있고, 또는 5'-UACUCAACUUGAAAAGGUGGCACCGAUUCGGUGUUUUU-3'와 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다.
또한, 상기 (F)i는 시험관내 또는 생체내 전사 방법과 관련된 3' 말단에 1 내지 10개의 염기서열을 포함할 수 있다.
예를 들어, T7 프로모터가 gRNA의 시험관내 전사를 위해 사용될 때, 상기 꼬리 도메인은 DNA 주형의 3' 말단에 존재하는 임의의 염기서열일 수 있다. 또한, U6 프로모터가 생체내 전사를 위해 사용되는 경우, 상기 꼬리 도메인은 UUUUUU일 수 있으며, H1 프로모터가 전사를 위해 사용되는 경우, 상기 꼬리 도메인은 UUUU일 수 있고, pol-III 프로모터를 사용하는 경우에는, 상기 꼬리 도메인은 여러 개의 우라실 염기이거나 또는 대안될 수 있는 염기를 포함할 수 있다.
또한, 상기 (X)a, (X)b, (X)c, (X)d, (X)e 및 (X)f는 선택적으로 추가할 수 있는 염기서열로, 상기 X는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 a, b, c, d, e 및 f는 염기서열의 개수로, 0 또는 1 내지 20의 정수일 수 있다.
ii ) 단일가닥 gRNA
그 다음으로, 단일가닥 gRNA는 가이드 도메인, 제 1 상보적 도메인 및 제 2 상보적 도메인으로 구성되는 단일가닥 gRNA일 수 있으며,
이때, 상기 단일가닥 gRNA는
5'-[제 2 상보적 도메인]-[제 1 상보적 도메인]-[가이드 도메인]-3'; 또는
5'-[제 2 상보적 도메인]-[연결 도메인]-[제 1 상보적 도메인]-[가이드 도메인]-3'으로 구성될 수 있다.
- 가이드 도메인
상기 단일가닥 gRNA에서 상기 가이드 도메인은 표적 유전자 또는 핵산 상에서 표적 서열과 상보적인 결합을 할 수 있는 상보적인 가이드 서열을 포함한다. 상기 가이드 서열은 표적 유전자 또는 핵산 상에서 표적 서열에 상보성인 핵산 서열로, 예를 들어 최소한 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상보적이거나 또는 완전하게 상보적인 핵산 서열일 수 있다. 가이드 도메인은 gRNA-Cas 복합체, 즉, CRISPR 복합체의 표적 유전자 또는 핵산과의 특이적인 상호작용을 할 수 있도록 역할을 한다고 여겨진다.
이때, 상기 가이드 도메인은 5 내지 50개의 염기서열일 수 있으며, 또는 5 내지 50개의 염기서열을 포함할 수 있다. 예들 들어 상기 가이드 도메인은 16개의 염기서열, 17개의 염기서열, 18개의 염기서열, 19개의 염기서열, 20개의 염기서열, 21개의 염기서열, 22개의 염기서열, 23개의 염기서열, 24개의 염기서열 또는 25개의 염기서열일 수 있으며, 또는 이를 포함할 수 있다.
또한, 상기 가이드 도메인은 가이드 서열을 포함할 수 있다.
이때, 상기 가이드 서열은 표적 유전자 또는 핵산 상에서 표적 서열과 상보적인 결합을 할 수 있는 상보적인 염기서열 또는 상보성을 가지는 염기서열일 수 있으며, 예를 들어 최소한 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상보적이거나 또는 완전하게 상보적인 염기서열일 수 있다.
이때, 상기 가이드 서열은 5 내지 50개의 염기서열일 수 있으며, 또는 5 내지 50개의 염기서열을 포함할 수 있다. 예를 들어, 상기 가이드 서열은 16개의 염기서열, 17개의 염기서열, 18개의 염기서열, 19개의 염기서열, 20개의 염기서열, 21개의 염기서열, 22개의 염기서열, 23개의 염기서열, 24개의 염기서열 또는 25개의 염기서열일 수 있으며, 또는 이를 포함할 수 있다.
선택적으로, 상기 가이드 도메인은 가이드 서열 및 추가 염기서열을 포함할 수 있다.
이때, 상기 추가 염기서열은 1 내지 35개의 염기서열일 수 있다. 예를 들어, 상기 추가 염기서열은 1개의 염기서열, 2개의 염기서열, 3개의 염기서열, 4개의 염기서열, 5개의 염기서열, 6개의 염기서열, 7개의 염기서열, 8개의 염기서열, 9개의 염기서열 또는 10개의 염기서열일 수 있다.
일 구체예로서, 상기 추가 염기서열은 1개의 염기서열 G(구아닌)일 수 있으며, 또는 2개의 염기서열 GG일 수 있다.
이때, 상기 추가 염기서열은 상기 가이드 도메인의 5'말단에 위치할 수 있으며, 또는 가이드 서열의 5'말단에 위치할 수 있다.
상기 추가 염기서열은 상기 가이드 도메인의 3'말단에 위치할 수 있으며, 또는 가이드 서열의 3'말단에 위치할 수 있다.
- 제 1 상보적 도메인
제 1 상보적 도메인은 제 2 상보적 도메인과 상보적 핵산서열을 포함하며, 제 2 상보적 도메인과 이중가닥을 형성할 수 있을 정도의 상보성을 가지는 도메인이다.
이때, 상기 제 1 상보적 도메인은 5 내지 35개의 염기서열이거나, 또는 5 내지 35개의 염기서열을 포함할 수 있다. 예들 들어, 상기 제 1 상보적 도메인은 5개의 염기서열, 6개의 염기서열, 7개의 염기서열, 8개의 염기서열, 9개의 염기서열, 10개의 염기서열, 11개의 염기서열, 12개의 염기서열, 13개의 염기서열, 14개의 염기서열, 15개의 염기서열, 16개의 염기서열, 17개의 염기서열, 18개의 염기서열, 19개의 염기서열, 20개의 염기서열, 21개의 염기서열, 22개의 염기서열, 23개의 염기서열, 24개의 염기서열 또는 25개의 염기서열일 수 있으며, 또는 이를 포함할 수 있다.
상기 제 1 상보적 도메인은 자연유래의 제 1 상보적 도메인과 상동성을 가지거나, 또는 자연유래의 제 1 상보적 도메인으로부터 유래될 수 있다. 또한, 상기 제 1 상보적 도메인은 자연에 존재하는 종에 따라 제 1 상보적 도메인의 염기서열에 차이가 존재할 수 있으며, 자연에 존재하는 종이 포함하는 제 1 상보적 도메인으로부터 유래될 수 있고, 또는 자연에 존재하는 종이 포함하는 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가질 수 있다.
일 구체예로서, 상기 제 1 상보적 도메인은 팔쿠박테리아 박테리움(Parcubacteria bacterium (GWC2011_GWC2_44_17)), 라츠노스피라세애 박테리움(Lachnospiraceae bacterium (MC2017)), 부티리비브리오 프로테오클라시커스(Butyrivibrio proteoclasiicus), 페레그리니박테리아 박테리움(Peregrinibacteria bacterium (GW2011_GWA_33_10)), 액시다미노코커스 에스피(Acidaminococcus sp . (BV3L6)), 포르피로모나스 마카캐(Porphyromonas macacae), 라츠노피라세애 박테리움(Lachnospiraceae bacterium (ND2006)), 포르피로모나스 크레비오리카니스(Porphyromonas crevioricanis), 프레보텔라 디이엔스(Prevotella disiens), 모라셀라 보보쿨리(Moraxella bovoculi (237)), 스미이헬라 에스피(Smiihella sp . (SC_KO8D17)), 렙포스피라 이나다이(Leptospira inadai), 라츠노스피라세애 박테리움(Lachnospiraceae bacterium (MA2020)), 프란시셀라 노비시다(Francisella novicida (U112)), 캔디다투스 메타노플라즈마 털미툼(Candidatus Methanoplasma termitum) 또는 에유박테리움 엘리겐스(Eubacterium eligens)의 제 1 상보적 도메인 또는 유래된 제 1 상보적 도메인과 일부, 최소 50%이상, 또는 완전한 상동성을 가질 수 있다.
선택적으로, 상기 제 1 상보적 도메인은 제 2 상보적 도메인과 상보적 결합을 하지 않는 추가 염기서열을 포함할 수 있다.
이때, 상기 추가 염기서열은 1 내지 15개의 염기서열일 수 있다. 예를 들어, 상기 추가 염기서열은 1 내지 5개의 염기서열, 5 내지 10개의 염기서열, 또는 10 내지 15개의 염기서열일 수 있다.
- 제 2 상보적 도메인
제 2 상보적 도메인은 상기 제 1 가닥의 제 1 상보적 도메인과 상보적 핵산서열을 포함하며, 제 1 상보적 도메인과 이중가닥을 형성할 수 있을 정도로 상보성을 가진다. 제 2 상보적 도메인은 제 1 상보적 도메인과 상보적 염기서열 및 제 1 상보적 도메인과의 상보성이 없는 염기서열, 예를 들어, 제 1 상보적 도메인과 이중가닥을 형성하지 않는 염기서열을 포함할 수 있으며, 제 1 상보적 도메인보다 염기서열의 길이가 길 수 있다.
이때, 상기 제 2 상보적 도메인은 5 내지 35개의 염기서열이거나, 또는 5 내지 35개의 염기서열을 포함할 수 있다. 예를 들어, 상기 제 2 상보적 도메인은 5개의 염기서열, 6개의 염기서열, 7개의 염기서열, 8개의 염기서열, 9개의 염기서열, 10개의 염기서열, 11개의 염기서열, 12개의 염기서열, 13개의 염기서열, 14개의 염기서열, 15개의 염기서열, 16개의 염기서열, 17개의 염기서열, 18개의 염기서열, 19개의 염기서열, 20개의 염기서열, 21개의 염기서열, 22개의 염기서열, 23개의 염기서열, 24개의 염기서열 또는 25개의 염기서열일 수 있으며, 또는 이를 포함할 수 있다.
상기 제 2 상보적 도메인은 자연유래의 제 2 상보적 도메인과 상동성을 가지거나, 또는 자연유래의 제 2 상보적 도메인으로부터 유래될 수 있다. 또한, 상기 제 2 상보적 도메인은 자연에 존재하는 종에 따라 제 2 상보적 도메인의 염기서열에 차이가 존재할 수 있으며, 자연에 존재하는 종이 포함하는 제 2 상보적 도메인으로부터 유래될 수 있고, 또는 자연에 존재하는 종이 포함하는 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가질 수 있다.
일 구체예로서, 상기 제 2 상보적 도메인은 팔쿠박테리아 박테리움(Parcubacteria bacterium (GWC2011_GWC2_44_17)), 라츠노스피라세애 박테리움(Lachnospiraceae bacterium (MC2017)), 부티리비브리오 프로테오클라시커스(Butyrivibrio proteoclasiicus), 페레그리니박테리아 박테리움(Peregrinibacteria bacterium (GW2011_GWA_33_10)), 액시다미노코커스 에스피(Acidaminococcus sp . (BV3L6)), 포르피로모나스 마카캐(Porphyromonas macacae), 라츠노피라세애 박테리움(Lachnospiraceae bacterium (ND2006)), 포르피로모나스 크레비오리카니스(Porphyromonas crevioricanis), 프레보텔라 디이엔스(Prevotella disiens), 모라셀라 보보쿨리(Moraxella bovoculi (237)), 스미이헬라 에스피(Smiihella sp . (SC_KO8D17)), 렙포스피라 이나다이(Leptospira inadai), 라츠노스피라세애 박테리움(Lachnospiraceae bacterium (MA2020)), 프란시셀라 노비시다(Francisella novicida (U112)), 캔디다투스 메타노플라즈마 털미툼(Candidatus Methanoplasma termitum) 또는 에유박테리움 엘리겐스(Eubacterium eligens)의 제 2 상보적 도메인 또는 유래된 제 2 상보적 도메인과 일부, 최소 50%이상, 또는 완전한 상동성을 가질 수 있다.
선택적으로, 상기 제 2 상보적 도메인은 제 1 상보적 도메인과 상보적 결합을 하지 않는 추가 염기서열을 포함할 수 있다.
이때, 상기 추가 염기서열은 1 내지 15개의 염기서열일 수 있다. 예를 들어, 상기 추가 염기서열은 1 내지 5개의 염기서열, 5 내지 10개의 염기서열, 또는 10 내지 15개의 염기서열일 수 있다.
- 연결 도메인
선택적으로, 연결 도메인은 제 1 상보적 도메인과 제 2 상보적 도메인을 연결하여 단일가닥 gRNA을 생성할 수 있도록 하는 핵산서열이다. 이때, 상기 연결 도메인은 제 1 상보적 도메인과 제 2 상보적 도메인과 공유결합 또는 비공유결합을 할 수 있고, 또는 제 1 상보적 도메인과 제 2 상보적 도메인을 공유적 또는 비공유적으로 연결할 수 있다.
상기 연결 도메인은 1 내지 30개의 염기서열이거나, 또는 1 내지 30개의 염기서열을 포함할 수 있다. 예를 들어, 상기 연결 도메인은 1 내지 5개의 염기서열, 5내지 10개의 염기서열, 10 내지 15개의 염기서열, 15내지 20개의 염기서열, 20 내지 25개의 염기서열 또는 25 내지 30개의 염기서열일 수 있으며, 또는 이를 포함할 수 있다.
선택적으로 상기 가이드 도메인, 제 1 상보적 도메인, 제 2 상보적 도메인 및 연결 도메인의 염기서열의 일부 또는 전부는 화학적 변형을 포함할 수 있다. 상기 화학적 변형은 methylation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid(LNA), 2'-O-methyl 3'phosphorothioate(MS) 또는 2'-O-methyl 3'thioPACE(MSP)일 수 있으나, 이에 제한되지 않는다.
따라서, 상기 단일가닥 gRNA는 상기 기재와 같이 5'-[제 2 상보적 도메인]-[제 1 상보적 도메인]-[가이드 도메인]-3' 또는 5'-[제 2 상보적 도메인]-[연결 도메인]-[제 1 상보적 도메인]-[가이드 도메인]-3'으로 구성될 수 있다.
또한, 상기 단일가닥 gRNA는 선택적으로 추가적인 염기서열을 포함할 수 있다.
일 구체예로서, 상기 단일가닥 gRNA는
5'-(Z)h-(Q)m-(Ntarget)-3'; 또는
5'-(X)a-(Z)h-(X)b-(Q)m-(X)c-(Ntarget)-3'일 수 있다.
다른 일 구체예로서, 상기 단일가닥 gRNA는
5'-(Z)h-(L)j-(Q)m-(Ntarget)-3'; 또는
5'-(X)a-(Z)h-(L)j-(Q)m-(X)c-(Ntarget)-3'일 수 있다.
이때, 상기 Ntarget은 표적 유전자 또는 핵산 상의 표적 서열과 상보적인 결합을 할 수 있는 염기서열로서, 상기 Ntarget은 표적 유전자 또는 핵산 상의 표적 서열에 따라 변할 수 있는 염기서열 부위이다.
상기 (Q)m은 제 1 상보적 도메인을 포함하는 염기서열로, 제 2 상보적 도메인과 상보적 결합을 할 수 있는 염기서열을 포함한다. 상기 (Q)m은 자연에 존재하는 종의 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가지는 서열일 수 있으며, 유래된 종에 따라 상기 제 1 상보적 도메인의 염기서열은 변경될 수 있다. 상기 Q는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 m은 염기서열의 개수로, 5 내지 35의 정수일 수 있다.
예를 들어, 상기 제 1 상보적 도메인이 팔쿠박테리아 박테리움의 제 1 상보적 도메인 또는 팔쿠박테리아 박테리움 유래 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Q)m은 5'-UUUGUAGAU-3'일 수 있고, 또는 5'-UUUGUAGAU-3'와 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다.
상기 (Z)h는 제 2 상보적 도메인을 포함하는 염기서열로, 제 1 상보적 도메인과 상보적 결합을 할 수 있는 염기서열을 포함한다. 상기 (Z)h은 자연에 존재하는 종의 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가지는 서열일 수 있으며, 유래된 종에 따라 상기 제 2 상보적 도메인의 염기서열은 변경될 수 있다. 상기 Z는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 h은 염기서열의 개수로, 5 내지 50의 정수일 수 있다.
예를 들어, 상기 제 2 상보적 도메인이 팔쿠박테리아 박테리움의 제 2 상보적 도메인 또는 팔쿠박테리아 박테리움 유래 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Z)h은 5'-AAAUUUCUACU-3'일 수 있고, 또는 5'-AAAUUUCUACU-3'와 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다.
또한, 상기 (L)j는 연결 도메인을 포함하는 염기서열로, 제 1 상보적 도메인과 제 2 상보적 도메인을 연결하는 염기서열이다. 이때, 상기 L은 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 j은 염기서열의 개수로, 1 내지 30의 정수일 수 있다.
또한, 상기 (X)a, (X)b 및 (X)c는 선택적으로 추가할 수 있는 염기서열로, 상기 X는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 a, b 및 c는 염기서열의 개수로, 0 또는 1 내지 20의 정수일 수 있다.
2. 에디터단백질
에디터단백질은 핵산과 직접적으로 결합하거나, 또는 직접 결합하지는 않지만 상호작용할 수 있는 펩타이드, 폴리펩타이드 또는 단백질을 의미한다. 상기 에디터단백질에 대해서 개념적으로 "유전자 가위" 또는 RGEN(RNA-Guided Endonuclease)으로 칭하기도 한다.
상기 핵산은 타겟 핵산, 유전자 또는 염색체에 포함된 핵산일 수 있다.
상기 핵산은 가이드핵산일 수 있다.
상기 에디터단백질은 효소일 수 있다.
상기 에디터단백질은 융합 단백질일 수 있다.
이때, 상기 융합 단백질은 효소 및 추가적인 도메인, 펩타이드, 폴리펩타이드 또는 단백질을 융합하여 생성한 단백질을 의미한다.
상기 효소는 핵산, 유전자, 염색체 또는 단백질을 절단할 수 있는 도메인을 포함하는 단백질을 의미한다.
상기 효소는 뉴클레아제, 프로테아제 또는 제한효소일 수 있다.
상기 추가적인 도메인, 펩타이드, 폴리펩타이드 또는 단백질은 상기 효소와 동일하거나 다른 기능을 가지는 기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질일 수 있다.
상기 융합 단백질은 효소의 아미노 말단 또는 그 근처; 카르복시 말단 또는 그 근처; 효소의 중간부; 또는 이들 조합의 하나 이상에 추가적인 도메인, 펩타이드, 폴리펩타이드 또는 단백질을 포함할 수 있다.
상기 융합 단백질은 효소의 아미노 말단 또는 그 근처; 카르복시 말단 또는 그 근처; 효소의 중간부; 또는 이들 조합의 하나 이상에 기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질을 포함할 수 있다.
이때, 상기 기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질은 메틸라아제(methylase) 활성, 디메틸라아제(demethylase) 활성, 전사촉진(transcription activation) 활성, 전사 저해(transcription repression) 활성, 전사 방출 인자(transcription release factor) 활성, 히스톤 변형(histone modification) 활성, RNA 절단(cleavage) 활성 또는 핵산 결합(nucleic acid binding) 활성을 가지는 도메인, 펩타이드, 폴리펩타이드 또는 단백질 일 수 있으며, 또는 단백질(펩타이드 포함)의 분리정제를 위한 태그(tag) 또는 리포터 유전자일 수 있으나, 이에 제한되지 않는다.
상기 기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질은 디아미네이즈(deaminase)일 수 있다.
상기 태그는 히스티딘(His) 태그, V5 태그, FLAG 태그, 인플루엔자 헤마글루티닌(HA) 태그, Myc 태그, VSV-G 태그 및 티오레독신(Trx) 태그 등을 포함하며, 상기 리포터 유전자는 글루타티온-S-트랜스 퍼라제(GST), 호스래디시(horseradish) 과산화효소(HRP), 클로람페니콜 아세틸트랜스퍼라제(CAT) 베타-갈락토시다제, 베타-글루쿠로니다제, 루시퍼라제, 녹색 형광 단백질(GFP), HcRed, DsRed, 청록색 형광 단백질(CFP), 황색 형광 단백질(YFP) 및 청색 형광 단백질(BFP)을 포함하는 자가형광 단백질을 포함하나, 이들에 한정되지 않는다.
또한, 상기 기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질은 NLS(nuclear localization sequence or signal) 또는 NES(nuclear export sequence or signal)일 수 있다.
상기 NLS는 아미노산 서열 PKKKRKV를 갖는 SV40 바이러스 대형 T-항원의 NLS; 뉴클레오플라스민(nucleoplasmin)으로부터의 NLS(예를 들어, 서열 KRPAATKKAGQAKKKK를 갖는 뉴클레오플라스민 이분(bipartite) NLS); 아미노산 서열 PAAKRVKLD 또는 RQRRNELKRSP를 갖는 c-myc NLS; 서열 NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY를 갖는 hRNPA1 M9 NLS; 임포틴-알파로부터의 IBB 도메인의 서열 RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV; 마이오마(myoma) T 단백질의 서열 VSRKRPRP 및 PPKKARED; 인간 p53의 서열 POPKKKPL; 마우스 c-abl IV의 서열 SALIKKKKKMAP; 인플루엔자 바이러스 NS1의 서열 DRLRR 및 PKQKKRK; 간염 바이러스 델타 항원의 서열 RKLKKKIKKL; 마우스 Mx1 단백질의 서열 REKKKFLKRR; 인간 폴리(ADP-리보스) 중합효소의 서열 KRKGDEVDGVDEVAKKKSKK; 또는 스테로이드 호르몬 수용체(인간) 글루코코르티코이드의 서열 RKCLQAGMNLEARKTKK로부터 유래된 NLS 서열일 수 있으나, 이에 제한되지 않는다.
상기 에디터단백질은 완전 활성 효소를 포함할 수 있다.
이때, 상기 “완전 활성 효소”는 야생형(wild type)의 효소의 기능과 동일한 기능을 가지고 있는 효소를 의미하며, 예를 들면, DNA의 이중 가닥을 절단하는 야생형 효소는 DNA 이중 가닥을 모두 절단하는 완전한 효소 활성을 가진다.
또한, 상기 완전 활성 효소는 야생형의 효소의 기능보다 향산된 기능을 가지고 있는 효소를 포함하며, 예를 들면, DNA의 이중 가닥을 절단하는 야생형 효소의 특정 변형 또는 조작 형태는 야생형 효소보다 증가된 완전한 효소 활성, 즉, DNA 이중 가닥을 절단하는 활성을 가진다.
상기 에디터단백질은 불완전 또는 부분 활성 효소를 포함할 수 있다.
이때, 상기 “불완전 또는 부분 활성 효소”는 야생형의 효소의 기능의 일부만을 가지는 효소를 의미하며, 예를 들면, DNA의 이중 가닥을 절단하는 야생형 효소의 특정 변형 또는 조작된 형태는 DNA 이중 가닥 중 일부, 즉 단일 가닥만 절단하는 불완전한 또는 일부의 효소 활성을 가진다.
상기 에디터단백질은 불활성 효소를 포함할 수 있다.
이때, 상기 “불활성 효소”는 야생형의 효소의 기능이 모두 불활성화 된 효소를 의미하며, 예를 들면, DNA의 이중 가닥을 절단하는 야생형 효소의 특정 변형 또는 조작된 형태는 DNA 이중 가닥을 모두 절단하지 못하도록 불활성을 가진다.
상기 에디터단백질은 자연 상태에 존재하는 효소 또는 융합 단백질일 수 있다.
상기 에디터단백질은 자연 상태에 존재하는 효소 또는 융합 단백질의 일부가 변형된 형태일 수 있다.
상기 에디터단백질은 자연 상태에 존재하지 않는 인위적으로 생성된 효소 또는 융합 단백질일 수 있다.
상기 에디터단백질은 자연 상태에 존재하는지 않는 인위적으로 생성된 효소 또는 융합 단백질의 일부가 변형된 형태일 수 있다.
이때, 상기 변형은 에디터단백질에 포함된 아미노산의 치환, 제거, 부가 또는 이의 혼합일 수 있다.
또는 상기 변형은 에디터단백질을 암호화하는 염기서열 중 일부 염기의 치환, 제거, 부가 또는 이의 혼합일 수 있다.
본 발명의 에디터단백질의 일 구체예로서, CRISPR 효소에 대해 하단에 기술하였다.
CRISPR 효소
“CRISPR 효소”는 CRISPR-Cas 시스템의 주요 단백질 구성 요소로, gRNA와 복합체를 형성하여CRISPR-Cas 시스템을 형성한다.
상기 CRISPR 효소는 CRISPR 효소를 암호화하는 서열을 가지는 핵산 또는 폴리펩타이드(또는 단백질)로, 대표적으로 Type II CRISPR 효소 또는 Type V CRISPR 효소가 많이 사용된다.
상기 Type II CRISPR 효소으로는 Cas9이 있으며, 상기 Cas9은 Actinobacteria (예, Actinomyces naeslundii) Cas9, Aquificae Cas9, Bacteroidetes Cas 9, Chlamydiae Cas9, Chloroflexi Cas9, Cyanobacteria Cas9, Elusimicrobia Cas9, Fibrobacteres Cas9, Firmicutes Cas9 (예, Streptococcus pyogenes Cas9, Streptococcus thermophilus Cas9, Listeria innocua Cas9, Streptococcus agalactiae Cas9, Streptococcus mutans Cas9 및 Enterococcus faecium Cas9), Fusobacteria Cas9, Proteobacteria (예, Neisseria meningitides, Campylobacter jejuni) Cas9, Spirochaetes (예, Treponema denticola) Cas9 등 다양한 미생물 유래의 Cas9일 수 있다.
"Cas9"은 gRNA와 결합하여 표적 유전자 또는 핵산 상에서 표적 서열 또는 위치를 절단 또는 변형시키는 효소로서, gRNA가 상보적인 결합을 하는 핵산 가닥(strand)을 절단할 수 있는 HNH 도메인, gRNA와 비상보적인 결합을 하는 핵산 가닥(strand)을 절단할 수 있는 RuvC 도메인, 표적, 즉, 타겟을 인식하는 REC 도메인 및 PAM을 인식하는 PI 도메인으로 구성될 수 있다. 구체적인 Cas9의 구조적 특성은 Hiroshi Nishimasu et al. (2014) Cell 156:935-949를 참고할 수 있다.
또한, 상기 Type V CRISPR 효소으로는 Cpf1이 있으며, 상기 Cpf1은 Streptococcus, Campylobacter, Nitratifractor, Staphylococcus, Parvibaculum, Roseburia, Neisseria, Gluconacetobacter, Azospirillum, Sphaerochaeta, Lactobacillus, Eubacterium, Corynebacter, Carnobacterium, Rhodobacter, Listeria, Paludibacter, Clostridium, Lachnospiraceae, Clostridiaridium, Leptotrichia, Francisella, Legionella, Alicyclobacillus, Methanomethyophilus, Porphyromonas, Prevotella, Bacteroidetes, Helcococcus, Letospira, Desulfovibrio, Desulfonatronum, Opitutaceae, Tuberibacillus, Bacillus, Brevibacilus, Methylobacterium 또는 Acidaminococcus 유래의 Cpf1일 수 있다.
상기 Cpf1은 Cas9의 RuvC 도메인에 상응하는 유사한 RuvC 도메인이 있으며, Cas9의 HNH 도메인은 결핍되어 있고, 대신에 Nuc 도메인을 포함하며, 타겟을 인식하는 REC 도메인과 WED 도메인 및 PAM을 인식하는 PI 도메인으로 구성될 수 있다. 구체적인 Cpf1의 구조적 특성은 Takashi Yamano et al. (2016) Cell 165:949-962를 참고할 수 있다.
상기 Cas9 또는 Cpf1 단백질 등의 CRISPR 효소는 자연상태에서 존재하는 미생물에서 분리된 것 또는 재조합적 방법 또는 합성적 방법으로 비자연적으로 생산된 것일 수 있다.
Type II CRISPR 효소
Type II CRISPR 효소의 결정 구조는 2종 이상의 자연유래 미생물 Type II CRISPR 효소 분자에 대한 연구(Jinek et al., Science, 343(6176):1247997, 2014) 및 gRNA와 함께 복합체를 이루는 스트렙토코커스 피오게네스 Cas9(SpCas9)에 대한 연구(Nishimasu et al., Cell, 156:935-949, 2014; 및 Anders et al., Nature, 2014, doi: 10.1038/nature13579)를 통해 결정되었다.
Type II CRISPR 효소는 2개의 로브, 즉, 인식(REC) 및 뉴클레아제(NUC) 로브를 포함하며, 각각의 로브는 여러 개의 도메인을 포함한다.
상기 REC 로브는 아르기닌-풍부 브릿지 나선(BH), REC1 도메인 및 REC2 도메인을 포함한다.
이때, 상기 BH 도메인은 긴 α-나선 및 아르기닌 풍부 영역이며, 상기 REC1 및 REC2 도메인은 gRNA 내의 형성되는 이중가닥의, 예를 들어, 단일가닥 gRNA, 이중 gRNA 또는 tracrRNA의 인식에 중요한 역할을 한다.
상기 NUC 로브는 RuvC 도메인, HNH 도메인 및 PAM-상호작용(PI) 도메인을 포함한다. 이때, 상기 RuvC 도메인은 RuvC-유사 도메인을 포괄하는 의미로 사용되고, 또한 상기 HNH 도메인은 HNH-유사 도메인을 포괄하는 의미로 사용된다.
이때, 상기 RuvC 도메인은 Type II CRISPR 효소를 포함하는 자연상태에 존재하는 미생물의 구성원에 대해 구조적으로 유사성을 공유하며, 단일가닥, 예를 들어 표적 유전자 또는 핵산의 비상보성 가닥, 즉, gRNA와 상보적인 결합을 하지 않는 가닥을 절단한다. 상기 RuvC 도메인은 종종 당업계에서 RuvCI 도메인, RuvCII 도메인 및 RuvCIII 도메인으로서, 통상적으로 RuvC I, RuvCII 및 RuvCIII로 지칭된다. 예를 들어, SpCas9의 경우, 상기 RuvC 도메인은 SpCas9의 아미노산 서열 1 내지 59, 718 내지 769 및 909 내지 1098에 위치하는 각각 3 개의 분할 RuvC 도메인(RuvC I, RuvCII 및 RuvCIII)으로부터 조립된다.
상기 HNH 도메인은 HNH 엔도뉴클레아제와 구조적 유사성을 공유하며, 단일 가닥, 예를 들어 표적 핵산 분자의 상보성 가닥, 즉, gRNA와 상보적인 결합을 하는 가닥을 절단한다. HNH 도메인은 RuvC II와 III 모티프 사이에 위치한다. 예를 들어, SpCas9의 경우, HNH 도메인은 SpCas9의 아미노산 서열 775 내지 908에 위치한다.
상기 PI 도메인은 표적 유전자 또는 핵산 내의 특정 염기서열, 즉, PAM(Protospacer adjacent motif)을 인식하거나 또는 PAM과 상호작용한다. 예를 들어, SpCas9의 경우, PI 도메인은 SpCas9의 아미노산 서열 1099 내지 1368에 위치한다.
이때, 상기 PAM은 Type II CRISPR 효소의 유래에 따라 다를 수 있다. 예를 들어, CRISPR 효소가 SpCas9 인 경우 PAM은 5'-NGG-3'일 수 있고, 스트렙토코커스 써모필러스 Cas9(StCas9)인 경우 PAM은 5'-NNAGAAW-3'(W = A or T)일 수 있고, 네이세리아 메닝기디티스 Cas9(NmCas9)인 경우 PAM은 5'-NNNNGATT-3'일 수 있고, 캄필로박터 제주니 Cas9(CjCas9)의 경우 PAM은 5'-NNNVRYAC-3' (V = G or C or A, R = A or G, Y = C or T)일 수 있으며, 이때 상기 N은 A, T, G 또는 C; 또는 A, U, G 또는 C일 수 있다.
Type V CRISPR 효소
Type V CRISPR 효소는 Type II CRISPR 효소의 RuvC 도메인에 상응하는 유사한 RuvC 도메인이 있으며, Type II CRISPR 효소의 HNH 도메인은 결핍되어 있고, 대신에 Nuc 도메인을 포함하며, 타겟을 인식하는 REC 도메인과 WED 도메인 및 PAM을 인식하는 PI 도메인으로 구성될 수 있다. 구체적인 Type V CRISPR 효소의 구조적 특성은 Takashi Yamano et al. (2016) Cell 165:949-962를 참고할 수 있다.
Type V CRISPR 효소는 gRNA와 상호작용할 수 있으며, gRNA-CRISPR 효소 복합체, 즉, CRISPR 복합체를 형성할 수 있고, gRNA와 협력하여 가이드 서열을 및 PAM 서열을 포함하는 표적 서열로 근접시킬 수 있다. 이때, 표적 유전자 또는 핵산과 상호작용하기 위한 Type V CRISPR 효소의 능력은 PAM 서열에 의존적이다.
상기 PAM 서열은 표적 유전자 또는 핵산 내에 존재하는 서열로, Type V CRISPR 효소의 PI 도메인에 의해 인식될 수 있다. 상기 PAM 서열은 Type V CRISPR 효소의 유래에 따라 그 서열이 다를 수 있다. 즉, 종마다 특이적으로 인식할 수 있는 PAM 서열이 존재한다.
일 예로, Cpf1이 인식하는 PAM 서열은 5'-TTN-3' (N은 A, T, C 또는 G)일 수 있다.
CRISPR 효소 활성
CRISPR 효소는 표적 유전자 또는 핵산의 이중가닥 또는 단일가닥을 절단하며, 이중가닥 또는 단일가닥의 파손 또는 결손을 초래하는 뉴클레아제 활성을 가진다. 일반적으로 야생형 Type II CRISPR 효소 또는 Type V CRISPR 효소는 일반적으로 표적 유전자 또는 핵산의 이중가닥을 절단한다.
CRISPR 효소의 상기와 같은 뉴클레아제 활성을 변형 또는 변경하기 위해서, CRISPR 효소는 조작 또는 변형될 수 있으며, 이러한 조작 또는 변형된 CRISPR 효소는 불완전 또는 부분 활성 효소 또는 불활성 효소로 변형될 수 있다.
불완전 또는 부분 활성 효소
CRISPR 효소가 변형하여 효소 활성을 변경시켜 불완전 또는 부분 활성을 가지도록 한 CRISPR 효소를 니카아제(nickase)로 명칭한다.
“니카아제(nickase)”는 표적 유전자 또는 핵산의 이중가닥 중 한 가닥만 절단되도록 조작 또는 변형된 CRISPR 효소를 의미하며, 상기 니카아제는 단일가닥, 예를 들어, 표적 유전자 또는 핵산의 gRNA와 비상보성 가닥 또는 상보성 가닥을 절단하는 뉴클레아제 활성을 가진다. 따라서, 이중가닥을 절단하기 위해서는 2개의 니카아제의 뉴클레아제 활성이 필요하다.
예를 들어, 상기 니카아제는 RuvC 도메인에 의한 뉴클레아제 활성을 가질 수 있다. 즉, 상기 니카아제는 HNH 도메인에 의한 뉴클레아제 활성을 포함하지 않을 수 있으며, 이를 위해 HNH 도메인은 조작 또는 변경될 수 있다.
일 예로, CRISPR 효소가 Type II CRISPR 효소일 때,
일 구체예로, SpCas9의 경우, SpCas9의 아미노산 서열 840번 히스티딘을 알라닌으로 변이(mutation)시키면, HNH 도메인의 뉴클레아제 활성이 불활성화되므로 니카아제로 사용할 수 있으며, 이때 생성된 니카아제는 RuvC 도메인에 의한 뉴클레아제 활성을 가지므로, 표적 유전자 또는 핵산의 비상보성 가닥, 즉, gRNA와 상보적인 결합을 하지 않는 가닥을 절단할 수 있다.
다른 일 구체예로, CjCas9의 경우, CjCas9의 아미노산 서열 559번 히스티딘을 알라닌으로 변이(mutation)시키면, HNH 도메인의 뉴클레아제 활성이 불활성화되므로 니카아제로 사용할 수 있으며, 이때 생성된 니카아제는 RuvC 도메인에 의한 뉴클레아제 활성을 가지므로, 표적 유전자 또는 핵산의 비상보성 가닥, 즉, gRNA와 상보적인 결합을 하지 않는 가닥을 절단할 수 있다.
예를 들어, 상기 니카아제는 HNH 도메인에 의한 뉴클레아제 활성을 가질 수 있다. 즉, 상기 니카아제는 RuvC 도메인에 의한 뉴클레아제 활성을 포함하지 않을 수 있으며, 이를 위해 RuvC 도메인은 조작 또는 변경될 수 있다.
일 예로, CRISPR 효소가 Type II CRISPR 효소일 때,
일 구체예로, SpCas9의 경우, SpCas9의 아미노산 서열 10번 아스파르트산을 알라닌으로 변이(mutation)시키면, RuvC 도메인의 뉴클레아제 활성이 불활성화되므로 니카아제로 사용할 수 있으며, 이때 생성된 니카아제는 HNH 도메인에 의한 뉴클레아제 활성을 가지므로, 표적 유전자 또는 핵산의 상보성 가닥, 즉, gRNA와 상보적인 결합을 하는 가닥을 절단할 수 있다.
다른 일 구체예로서, CjCas9의 경우, CjCas9의 아미노산 서열 8번 아스파르트산을 알라닌으로 변이(mutation)시키면, RuvC 도메인의 뉴클레아제 활성이 불활성화되므로 니카아제로 사용할 수 있으며, 이때 생성된 니카아제는 HNH 도메인에 의한 뉴클레아제 활성을 가지므로, 표적 유전자 또는 핵산의 상보성 가닥, 즉, gRNA와 상보적인 결합을 하는 가닥을 절단할 수 있다.
불활성 효소
CRISPR 효소를 변형시켜 효소 활성이 완전히 불활성화 된 CRISPR 효소를 불활성 CRISPR 효소로 명칭한다.
“불활성 CRISPR 효소”는 표적 유전자 또는 핵산의 이중가닥을 모두 절단할 수 없도록 변형된 CRISPR 효소를 의미하며, 상기 불활성 CRISPR 효소는 야생형 CRISPR 효소의 뉴클레아제 활성을 가지는 도메인에 변이로 인한 뉴클레아제 불활성을 가진다. 상기 불활성 CRISPR 효소는 RuvC 도메인 및 HNH 도메인에 의한 뉴클레아제 활성을 불화성화된 것일 수 있다.
예를 들어, 상기 불활성 CRISPR 효소는 뉴클레아제 활성을 불활성화시키기 위해, RuvC 도메인 및 HNH 도메인을 조작 또는 변경할 수 있다.
일 예로, CRISPR 효소가 Type II CRISPR 효소일 때,
일 구체예로, SpCas9의 경우, SpCas9의 아미노산 서열 10번 아스파르트산과 840번 히스티딘을 모두 알라닌으로 변이(mutation)시키면, RuvC 도메인 및 HNH 도메인에 의한 뉴클레아제 활성이 불활성화되므로, 표적 유전자 또는 핵산의 이중가닥을 모두 절단할 수 없다.
다른 일 구체예로서, CjCas9의 경우, CjCas9의 아미노산 서열 8번 아스파르트산과 559번 히스티딘을 모두 알라닌으로 변이(mutation)시키면, RuvC 도메인 및 HNH 도메인에 의한 뉴클레아제 활성이 불활성화되므로, 표적 유전자 또는 핵산의 이중가닥을 모두 절단할 수 없다.
그 밖의 활성
CRISPR 효소는 상기 기재된 뉴클레아제 활성 외에도, 엔도뉴클레아제 활성, 엑소뉴클레아제 활성 또는 헬리카제 활성, 즉, 이중가닥 핵산의 나선 구조를 푸는 능력을 가질 수 있다.
또한, CRISPR 효소는 CRISPR 효소의 엔도뉴클레아제 활성, 엑소뉴클레아제 활성 또는 헬리카제 활성은 완전 활성, 불완전 또는 부분 활성, 또는 불활성이 되도록 CRISPR 효소를 변형시킬 수 있다.
CRISPR 효소의 표적화
CRISPR 효소는 gRNA와 상호작용할 수 있으며, gRNA-CRISPR 효소 복합체, 즉, CRISPR 복합체를 형성할 수 있고, gRNA와 협력하여 가이드 서열을 및 PAM 서열을 포함하는 표적 서열로 근접시킬 수 있다. 이때, 표적 유전자 또는 핵산과 상호작용하기 위한 CRISPR 효소의 능력은 PAM 서열에 의존적이다.
상기 PAM 서열은 표적 유전자 또는 핵산 내에 존재하는 서열로, CRISPR 효소의 PI 도메인에 의해 인식될 수 있다. 상기 PAM 서열은 CRISPR 효소의 유래에 따라 그 서열이 다를 수 있다. 즉, 종마다 특이적으로 인식할 수 있는 PAM 서열이 존재한다.
일 예로, CRISPR 효소가 Type II CRISPR 효소일 때,
SpCas9인 경우, PAM 서열은 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3'일 수 있고,
StCas9인 경우, PAM 서열은 5'-NGGNG-3' 또는/및 5'-NNAGAAW-3'(W = A 또는 T)일 수 있으며,
NmCas9인 경우, PAM 서열은 5'-NNNNGATT-3' 또는/및 5'-NNNGCTT-3'일 수 있고,
CjCas9의 경우, PAM 서열은 5'-NNNVRYAC-3' (V = G, C 또는 A; R = A 또는 G; Y = C 또는 T)일 수 있으며,
스트렙토코커스 뮤탄스 Cas9(SmCas9)의 경우, PAM 서열은 5'-NGG-3' 및/또는 5'-NAAR-3'(R = A 또는 G)일 수 있고,
스타필로코커스 아우레우스 Cas9(SaCas9)의 경우, PAM 서열은 5'-NNGRR-3', 5'-NNGRRT-3' 또는/및 5'-NNGRRV-3' (R = A 또는 G; V = G, C 또는 A)일 수 있다.
다른 일 예로, CRISPR 효소가 Type V CRISPR 효소일 때,
Cpf1의 경우, PAM 서열은 5'-TTN-3'일 수 있다.
이때, 상기 N은 A, T, G 또는 C; 또는 A, U, G 또는 C일 수 있다.
이러한 종마다 특이적으로 인식할 수 있는 PAM 서열을 이용하면, 특이적 PAM 서열을 인식할 수있는 CRISPR 효소를 조작 또는 변형할 수 있다. 예를 들어, SpCas9의 뉴클레아제 활성을 가지며, CjCas9 특이적 PAM 서열을 인식할 수 있도록 SpCas9의 PI 도메인을 CjCas9의 PI 도메인으로 교체할 수 있고, 이를 통해 CjCas9 특이적 PAM 서열을 인식하는 SpCas9을 생성할 수 있다. 이러한 PI 도메인의 치환 또는 교체를 통해, 특이적으로 인식하는 PAM 서열을 변경 설계할 수 있다.
CRISPR 효소 변이체
CRISPR 효소의 뉴클레아제 활성, 헬리카제 활성, gRNA와 상호작용 능력, 및 표적 유전자 또는 핵산에 근접 능력, 예를 들어 PAM 인식 능력 등의 다양한 특성을 향상 또는 저해시킬 수 있도록, CRISPR 효소를 변이시킬 수 있다.
또한, CRISPR 효소 변이체는 gRNA와 상호작용을 통한 gRNA-CRISPR 효소 복합체 형성, 즉, CRISPR 복합체를 형성하여 표적 유전자 또는 핵산에 근접 또는 국소화될 때, gRNA와 일부 상보적 결합을 하는 비표적 유전자 또는 핵산 및 상보적 결합을 하지 않는 비표적 유전자 또는 핵산의 이중가닥 또는 단일가닥을 절단하지 않고, 오직 표적 유전자 또는 핵산의 이중가닥 또는 단일가닥만을 절단할 수 있도록 표적 특이성을 향상시킨 변형 또는 조작된 CRISPR 효소일 수 있다.
이때, 상기 gRNA와 일부 상보적 결합을 하는 비표적 유전자 또는 핵산 및 상보적 결합을 하지 않는 비표적 유전자 또는 핵산의 이중가닥 또는 단일가닥이 절단되는 효과를 오프-타겟(off-target) 효과로 지칭되며, 상기 gRNA와 일부 상보적 결합을 하는 비표적 유전자 또는 핵산 및 상보적 결합을 하지 않는 비표적 유전자 또는 핵산의 위치 또는 염기서열은 오프-타겟으로 지칭되고, 이때, 오프-타겟의 개수는 하나 이상일 수 있다. 이와 반대로, 표적 유전자 또는 핵산의 이중가닥 또는 단일가닥의 절단 효과는 온-타겟(on-target) 효과라 지칭되면, 표적 유전자 또는 핵산의 위치 또는 표적서열은 온-타겟으로 지칭된다.
CRISPR 효소 변이체는 자연적으로 발생하는 CRISPR 효소의 아미노산이 적어도 하나이상 변형된 것으로, 변형되지 않은 CRISPR 효소에 비해 뉴클레아제 활성, 헬리카제 활성, gRNA와 상호작용 능력, 표적 유전자 또는 핵산에 근접 능력 및 표적 특이성 중 하나이상이 특성이 변형, 예를 들어, 향상 또는 저해될 수 있다. 이때, 상기 변형은 아미노산 치환, 제거, 부가 또는 이의 혼합일 수 있다.
CRISPR 효소 변이체에서,
상기 변형은 자연적으로 발생하는 CRISPR 효소 내에 존재하는 양전하를 가지는 아미노산들로 구성된 부위(region)에 위치한 하나 또는 둘 이상의 아미노산의 변형일 수 있다.
예를 들어, 상기 변형은 자연적으로 발생하는 CRISPR 효소 내에 존재하는 양전하를 가지는 아미노산, 즉, 리신(Lysine, K), 아르기닌(Arginine, R) 및 히스티딘(histidine, H) 중 하나 또는 둘 이상의 아미노산의 변형일 수 있다.
상기 변형은 자연적으로 발생하는 CRISPR 효소 내에 존재하는 양전하를 가지지 않는 아미노산들로 구성된 부위(region)에 위치한 하나 또는 둘 이상의 아미노산의 변형일 수 있다.
예를 들어, 상기 변형은 자연적으로 발생하는 CRISPR 효소 내에 존재하는 양전하를 가지지 않는 아미노산, 즉, 아스파르트산(Aspartic aicd, D), 글루탐산(Glutamic acid, E), 세린(Serine, S), 트레오닌(Threonine, T), 아스파라긴(Asparagine, N), 글루타민(Glutamine, Q), 시스테인(Cysteine, C), 프롤린(Proline, P), 글라이신(Glysin, G), 알라닌(Alanine, A), 발린(Valine, V), 이소류신(Isoleucine, I), 류신(Leucine, L), 메티오닌(Methionine, M), 페닐알라닌(Phenylalanine, F), 타이로신(Tyrosine, Y) 및 트립토판(Tryptophan, W) 중 하나 또는 둘 이상의 아미노산의 변형일 수 있다.
다른 예로, 상기 변형은 자연적으로 발생하는 CRISPR 효소 내에 존재하는 전하를 가지지 않는 아미노산, 즉, 세린(Serine, S), 트레오닌(Threonine, T), 아스파라긴(Asparagine, N), 글루타민(Glutamine, Q), 시스테인(Cysteine, C), 프롤린(Proline, P), 글라이신(Glysin, G), 알라닌(Alanine, A), 발린(Valine, V), 이소류신(Isoleucine, I), 류신(Leucine, L), 메티오닌(Methionine, M), 페닐알라닌(Phenylalanine, F), 타이로신(Tyrosine, Y) 및 트립토판(Tryptophan, W) 중 하나 또는 둘 이상의 아미노산의 변형일 수 있다.
또한, 상기 변형은 자연적으로 발생하는 CRISPR 효소 내에 존재하는 소수성(hydrophobic) 잔기를 가지는 아미노산 중 하나 또는 둘 이상의 아미노산의 변형일 수 있다.
예를 들면, 상기 변형은 자연적으로 발생하는 CRISPR 효소 내에 존재하는 글라이신(Glysin, G), 알라닌(Alanine, A), 발린(Valine, V), 이소류신(Isoleucine, I), 류신(Leucine, L), 메티오닌(Methionine, M), 페닐알라닌(Phenylalanine, F), 타이로신(Tyrosine, Y) 및 트립토판(Tryptophan, W) 중 하나 또는 둘 이상의 아미노산의 변형일 수 있다.
상기 변형은 자연적으로 발생하는 CRISPR 효소 내에 존재하는 극성(polar) 잔기를 가지는 아미노산 중 하나 또는 둘 이상의 아미노산의 변형일 수 있다.
예를 들어, 상기 변형은 자연적으로 발생하는 CRISPR 효소 내에 존재하는 세린(Serine, S), 트레오닌(Threonine, T), 아스파라긴(Asparagine, N), 글루타민(Glutamine, Q), 시스테인(Cysteine, C), 프롤린(Proline, P), 리신(Lysine, K), 아르기닌(Arginine, R), 히스티딘(histidine, H), 아스파르트산(Aspartic aicd, D) 및 글루탐산(Glutamic acid, E) 중 하나 또는 둘 이상의 아미노산의 변형일 수 있다.
또는, 상기 변형은 자연적으로 발생하는 CRISPR 효소 내에 존재하는 리신(Lysine, K), 아르기닌(Arginine, R) 및 히스티딘(histidine, H)으로 구성된 아미노산들 중 하나 또는 둘 이상의 아미노산의 변형일 수 있다.
예를 들어, 상기 변형은 자연적으로 발생하는 CRISPR 효소 내에 존재하는 리신(Lysine, K), 아르기닌(Arginine, R) 및 히스티딘(histidine, H)으로 구성된 아미노산들 중 하나 또는 둘 이상의 아미노산의 치환일 수 있다.
상기 변형은 자연적으로 발생하는 CRISPR 효소 내에 존재하는 아스파르트산(Aspartic aicd, D) 및 글루탐산(Glutamic acid, E)으로 구성된 아미노산들 중 하나 또는 둘 이상의 아미노산의 변형일 수 있다.
예를 들어, 상기 변형은 자연적으로 발생하는 CRISPR 효소 내에 존재하는 아스파르트산(Aspartic aicd, D) 및 글루탐산(Glutamic acid, E)으로 구성된 아미노산들 중 하나 또는 둘 이상의 아미노산의 치환일 수 있다.
상기 변형은 자연적으로 발생하는 CRISPR 효소 내에 존재하는 세린(Serine, S), 트레오닌(Threonine, T), 아스파라긴(Asparagine, N), 글루타민(Glutamine, Q), 시스테인(Cysteine, C), 프롤린(Proline, P), 글라이신(Glysin, G), 알라닌(Alanine, A), 발린(Valine, V), 이소류신(Isoleucine, I), 류신(Leucine, L), 메티오닌(Methionine, M), 페닐알라닌(Phenylalanine, F), 타이로신(Tyrosine, Y) 및 트립토판(Tryptophan, W)으로 구성된 아미노산들 중 하나 또는 둘 이상의 아미노산의 변형일 수 있다.
예를 들어, 상기 변형은 자연적으로 발생하는 CRISPR 효소 내에 존재하는 세린(Serine, S), 트레오닌(Threonine, T), 아스파라긴(Asparagine, N), 글루타민(Glutamine, Q), 시스테인(Cysteine, C), 프롤린(Proline, P), 글라이신(Glysin, G), 알라닌(Alanine, A), 발린(Valine, V), 이소류신(Isoleucine, I), 류신(Leucine, L), 메티오닌(Methionine, M), 페닐알라닌(Phenylalanine, F), 타이로신(Tyrosine, Y) 및 트립토판(Tryptophan, W)으로 구성된 아미노산들 중 하나 또는 둘 이상의 아미노산의 치환일 수 있다.
또한, 상기 변형은 자연적으로 발생하는 CRISPR 효소 내에 존재하는 아미노산들 중 하나, 둘, 셋, 넷, 다섯, 여섯, 일곱 또는 그 이상의 아미노산들의 변형일 수 있다.
또한, CRISPR 효소 변이체에서,
상기 변형은 CRISPR 효소의 RuvC 도메인에 존재하는 아미노산 중 하나 또는 둘 이상의 아미노산의 변형일 수 있다. 이때, 상기 RuvC 도메인은 RuvCI, RuvCII 또는 RuvCIII 도메인일 수 있다.
상기 변형은 CRISPR 효소의 HNH 도메인에 존재하는 아미노산 중 하나 또는 둘 이상의 아미노산의 변형일 수 있다.
상기 변형은 CRISPR 효소의 REC 도메인에 존재하는 아미노산 중 하나 또는 둘 이상의 아미노산의 변형일 수 있다.
상기 변형은 CRISPR 효소의 PI 도메인에 존재하는 아미노산 중 하나 또는 둘 이상의 아미노산의 변형일 수 있다.
상기 변형은 CRISPR 효소의 REC, RuvC, HNH 또는 PI 도메인 중 적어도 둘 이상의 도메인에 포함된 아미노산 중 둘 이상의 아미노산의 변형일 수 있다.
일 예로, 상기 변형은 CRISPR 효소의 REC 및 RuvC 도메인에 포함된 아미노산 중 둘 이상의 아미노산의 변형일 수 있다.
일 구체예로서, SpCas9 변이체에서, 상기 변형은 SpCas9의 REC 및 RuvC 도메인에 포함된 A203, H277, G366, F539, I601, M763, D965 및 F1038 아미노산 중 적어도 둘 이상의 아미노산의 변형일 수 있다.
다른 일 예로, 상기 변형은 CRISPR 효소의 REC 및 HNH 도메인에 포함된 아미노산 중 둘 이상의 아미노산의 변형일 수 있다.
일 구체예로서, SpCas9 변이체에서, 상기 변형은 SpCas9의 REC 및 HNH 도메인에 포함된 포함된 A203, H277, G366, F539, I601 및 K890 아미노산 중 적어도 둘 이상의 아미노산의 변형일 수 있다.
일 예로, 상기 변형은 CRISPR 효소의 REC 및 PI 도메인에 포함된 아미노산 중 둘 이상의 아미노산의 변형일 수 있다.
일 구체예로서, SpCas9 변이체에서, 상기 변형은 SpCas9의 REC 및 PI 도메인에 포함된 A203, H277, G366, F539, I601, T1102 및 D1127 아미노산 중 적어도 둘 이상의 아미노산의 변형일 수 있다.
다른 일 예로, 상기 변형은 CRISPR 효소의 REC, RuvC 및 HNH 도메인에 포함된 아미노산 중 셋 이상의 아미노산의 변형일 수 있다.
일 구체예로서, SpCas9 변이체에서, 상기 변형은 SpCas9의 REC, RuvC 및 HNH 도메인에 포함된 A203, H277, G366, F539, I601, M763, K890, D965 및 F1038 아미노산 중 적어도 셋 이상의 아미노산의 변형일 수 있다.
일 예로, 상기 변형은 CRISPR 효소의 REC, RuvC 및 PI 도메인에 포함된 아미노산 중 셋 이상의 아미노산의 변형일 수 있다.
일 구체예로서, SpCas9 변이체에서, 상기 변형은 SpCas9의 REC, RuvC 및 PI 도메인에 포함된 A203, H277, G366, F539, I601, M763, D965, F1038, T1102 및 D1127 아미노산 중 적어도 셋 이상의 아미노산의 변형일 수 있다.
다른 일 예로, 상기 변형은 CRISPR 효소의 REC, HNH 및 PI 도메인에 포함된 아미노산 중 셋 이상의 아미노산의 변형일 수 있다.
일 구체예로서, SpCas9 변이체에서, 상기 변형은 SpCas9의 REC, HNH 및 PI 도메인에 포함된 A203, H277, G366, F539, I601, K890, T1102 및 D1127 아미노산 중 적어도 셋 이상의 아미노산의 변형일 수 있다.
일 예로, 상기 변형은 CRISPR 효소의 RuvC, HNH 및 PI 도메인에 포함된 아미노산 중 셋 이상의 아미노산의 변형일 수 있다.
일 구체예로서, SpCas9 변이체에서, 상기 변형은 SpCas9의 RuvC, HNH 및 PI 도메인에 포함된 M763, K890, D965, F1038, T1102 및 D1127 아미노산 중 적어도 셋 이상의 아미노산의 변형일 수 있다.
다른 일 예로, 상기 변형은 CRISPR 효소의 REC, RuvC, HNH 및 PI 도메인에 포함된 아미노산 중 넷 이상의 아미노산의 변형일 수 있다.
일 구체예로서, SpCas9 변이체에서, 상기 변형은 SpCas9의 REC, RuvC, HNH 및 PI 도메인에 포함된 A203, H277, G366, F539, I601, M763, K890, D965, F1038, T1102 및 D1127 아미노산 중 적어도 넷 이상의 아미노산의 변형일 수 있다.
또한, CRISPR 효소 변이체에서,
상기 변형은 CRISPR 효소의 뉴클레아제 활성에 참여하는 아미노산 중 하나 또는 둘 이상의 아미노산의 변형일 수 있다.
예를 들어, SpCas9 변이체에서, 상기 변형은 D10, E762, H840, N854, N863 및 D986로 구성된 아미노산 그룹 중에 하나 또는 둘 이상의 변형일 수 있으며, 또는 다른 Cas9 orthologs의 이에 대응되는 아미노산 그룹 중에 하나 또는 둘 이상의 아미노산의 변형일 수 있다.
상기 변형은 CRISPR 효소의 뉴클레아제 활성을 일부 불활성화 시키는 변형일 수 있으며, 이러한 CRISPR 효소 변이체는 니카아제일 수 있다.
이때, 상기 변형은 CRISPR 효소의 RuvC 도메인의 뉴클레아제 활성을 불활성화 시키는 변형일 수 있으며, 이러한 CRISPR 효소 변이체는 표적 유전자 또는 핵산의 비상보성 가닥, 즉, gRNA와 상보적인 결합을 하지 않는 가닥을 절단할 수 없다.
일 구체예로, SpCas9의 경우, SpCas9의 아미노산 서열 10번 아스파르트산을 알라닌으로 변이(mutation)시키면, 즉, D10A로 변이시키면, RuvC 도메인의 뉴클레아제 활성이 불활성화되므로 니카아제로 사용할 수 있으며, 이때 생성된 니카아제는 표적 유전자 또는 핵산의 비상보성 가닥, 즉, gRNA와 상보적인 결합을 하지 않는 가닥을 절단할 수 없다.
다른 일 구체예로서, CjCas9의 경우, CjCas9의 아미노산 서열 8번 아스파르트산을 알라닌으로 변이(mutation)시키면, 즉, D8A로 변이시키면, RuvC 도메인의 뉴클레아제 활성이 불활성화되므로 니카아제로 사용할 수 있으며, 이때 생성된 니카아제는 표적 유전자 또는 핵산의 비상보성 가닥, 즉, gRNA와 상보적인 결합을 하지 않는 가닥을 절단할 수 없다.
또한 이때, 상기 변형은 CRISPR 효소의 HNH 도메인의 뉴클레아제 활성을 불활성화 시키는 변형일 수 있으며, 이러한 CRISPR 효소 변이체는 표적 유전자 또는 핵산의 상보성 가닥, 즉, gRNA와 상보적인 결합을 하는 가닥을 절단할 수 없다.
일 구체예로, SpCas9의 경우, SpCas9의 아미노산 서열 840번 히스티딘을 알라닌으로 변이(mutation)시키면, 즉, H840A로 변이시키면, HNH 도메인의 뉴클레아제 활성이 불활성화되므로 니카아제로 사용할 수 있으며, 이때 생성된 니카아제는 표적 유전자 또는 핵산의 상보성 가닥, 즉, gRNA와 상보적인 결합을 하는 가닥을 절단할 수 없다.
다른 일 구체예로, CjCas9의 경우, CjCas9의 아미노산 서열 559번 히스티딘을 알라닌으로 변이(mutation)시키면, 즉, H559A로 변이시키면, HNH 도메인의 뉴클레아제 활성이 불활성화되므로 니카아제로 사용할 수 있으며, 이때 생성된 니카아제는 표적 유전자 또는 핵산의 상보성 가닥, 즉, gRNA와 상보적인 결합을 하는 가닥을 절단할 수 없다.
또한, 상기 변형을 CRISPR 효소의 뉴클레아제 활성을 완전히 불활성화 시키는 변형일 수 있으며, 이러한 CRISPR 효소 변이체는 불활성 CRISPR 효소일 수 있다.
이때, 상기 변형은 CRISPR 효소의 RuvC 및 HNH 도메인의 뉴클레아제 활성을 불활성화 시키는 변형일 수 있으며, 이러한 CRISPR 효소 변이체는 표적 유전자 또는 핵산의 이중가닥을 절단할 수 없다.
일 구체예로, SpCas9의 경우, SpCas9의 아미노산 서열 10번 아스파르트산과 840번 히스티딘을 모두 알라닌으로 변이(mutation)시키면, 즉, D10A 및 H840A로 변이시키면, RuvC 도메인 및 HNH 도메인에 의한 뉴클레아제 활성이 불활성화되므로, 표적 유전자 또는 핵산의 이중가닥을 모두 절단할 수 없다.
다른 일 구체예로서, CjCas9의 경우, CjCas9의 아미노산 서열 8번 아스파르트산과 559번 히스티딘을 모두 알라닌으로 변이(mutation)시키면, 즉, D8A 및 H559A로 변이시키면, RuvC 도메인 및 HNH 도메인에 의한 뉴클레아제 활성이 불활성화되므로, 표적 유전자 또는 핵산의 이중가닥을 모두 절단할 수 없다.
또한, CRISPR 효소 변이체는 CRISPR 효소의 원래 특성 이외에 선택적으로 기능적(functional) 도메인을 추가로 포함할 수 있으며, 이러한 CRISPR 효소 변이체는 원래의 특성 이외에 부가적인 특성을 가질 수 있다.
이때, 상기 기능적 도메인은 메틸라아제(methylase) 활성, 디메틸라아제(demethylase) 활성, 전사촉진(transcription activation) 활성, 전사 저해(transcription repression) 활성, 전사 방출 인자(transcription release factor) 활성, 히스톤 변형(histone modification) 활성, RNA 절단(cleavage) 활성 또는 핵산 결합(nucleic acid binding) 활성을 가지는 도메인일 수 있으며, 또는 단백질(펩타이드 포함)의 분리정제를 위한 태그(tag) 또는 리포터 유전자일 수 있으나, 이에 제한되지 않는다.
상기 기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질은 디아미네이즈(deaminase)일 수 있다.
예를 들어, 불완전 또는 부분 CRISPR 효소에 시티딘 디아미네이즈(cytidine deaminase)를 기능적 도메인으로 추가로 포함할 수 있다. 일 구체예로, SpCas9 니카아제에 시티딘 디아미네이즈, 예를 들면, APOBEC1(apolipoprotein B editing complex 1)를 추가하여 융합 단백질을 생성할 수 있다. 이렇게 형성된 [SpCas9 니카아제]-[APOBEC1]은 염기 C를 T 또는 U로 염기 교정 또는 편집에 이용되거나, 또는 염기 G를 A로 염기 교정 또는 편집에 이용될 수 있다.
상기 태그는 히스티딘(His) 태그, V5 태그, FLAG 태그, 인플루엔자 헤마글루티닌(HA) 태그, Myc 태그, VSV-G 태그 및 티오레독신(Trx) 태그 등을 포함하며, 상기 리포터 유전자는 글루타티온-S-트랜스 퍼라제(GST), 호스라디시(horseradish) 과산화효소(HRP), 클로람페니콜 아세틸트랜스퍼라제(CAT) 베타-갈락토시다제, 베타-글루쿠로니다제, 루시퍼라제, 녹색 형광 단백질(GFP), HcRed, DsRed, 청록색 형광 단백질(CFP), 황색 형광 단백질(YFP) 및 청색 형광 단백질(BFP)을 포함하는 자가형광 단백질을 포함하나, 이들에 한정되지 않는다.
또한, 상기 기능적 도메인은 NLS(nuclear localization sequence or signal) 또는 NES(nuclear export sequence or signal)일 수 있다.
일 예로, CRISPR 효소는 하나 이상의 NLS를 포함할 수 있다. 이때, 상기 NLS는 CRISPR 효소의 아미노 말단 또는 그 근처; 카르복시 말단 또는 그 근처; 또는 이들의 조합에 하나 이상의 NLS를 포함할 수 있다. 상기 NLS는 하기로부터 유래된 NLS 서열일 수 있으나, 이에 제한되지 않는다: 아미노산 서열 PKKKRKV를 갖는 SV40 바이러스 대형 T-항원의 NLS; 뉴클레오플라스민(nucleoplasmin)으로부터의 NLS(예를 들어, 서열 KRPAATKKAGQAKKKK를 갖는 뉴클레오플라스민 이분(bipartite) NLS); 아미노산 서열 PAAKRVKLD 또는 RQRRNELKRSP를 갖는 c-myc NLS; 서열 NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY를 갖는 hRNPA1 M9 NLS; 임포틴-알파로부터의 IBB 도메인의 서열 RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV; 마이오마(myoma) T 단백질의 서열 VSRKRPRP 및 PPKKARED; 인간 p53의 서열 POPKKKPL; 마우스 c-abl IV의 서열 SALIKKKKKMAP; 인플루엔자 바이러스 NS1의 서열 DRLRR 및 PKQKKRK; 간염 바이러스 델타 항원의 서열 RKLKKKIKKL; 마우스 Mx1 단백질의 서열 REKKKFLKRR; 인간 폴리(ADP-리보스) 중합효소의 서열 KRKGDEVDGVDEVAKKKSKK; 및 스테로이드 호르몬 수용체(인간) 글루코코르티코이드의 서열 RKCLQAGMNLEARKTKK.
또한, CRISPR 효소 변이체는 CRISPR 효소를 분할하여 두 개 이상의 부분으로 나눈 스플릿(split) 형태의 CRISPR 효소를 포함할 수 있다. “스플릿(split)”은 단백질을 기능적으로 또는 구조적으로 또는 임의로 두 개 이상으로 분할하는 것을 의미한다.
이때, 상기 스플릿(split) 형태의 CRISPR 효소는 완전 활성 효소, 불완전 또는 부분 활성 효소 또는 불활성 효소일 수 있다.
예를 들어, SpCas9의 경우, 656번 타이로신과 657번 트레오닌 사이를 분할하여 두 개의 부분으로 나눈 스플릿 SpCas9을 생성할 수 있다.
또한, 상기 스플릿(split) 형태의 CRISPR 효소는 선택적으로 재구성(reconstitution)을 위한 추가 도메인, 펩타이드, 폴리펩타이드 또는 단백질을 포함할 수 있다.
이때, 상기 “재구성”은 스플릿(split) 형태의 CRISPR 효소가 구조적으로 야생형 CRISPR 효소와 동일하거나 유사하도록 하는 것을 의미한다.
상기 재구성(reconstitution)을 위한 추가 도메인, 펩타이드, 폴리펩타이드 또는 단백질은 FRB 및 FKBP dimerization domains; 인테인(intein); ERT 및 VPR domains 또는 특정 조건에서 이량이질체(heterodimer)를 형성하는 도메인일 수 있다.
예를 들어, SpCas9의 경우, 713번 세린과 714번 글라이신 사이를 분할하여 두 개의 부분으로 나눈 스플릿 SpCas9에 두 부분 중 하나에 FRB 도메인을 연결하고, 나머지 하나에 FKBP 도메인을 연결할 수 있다. 이렇게 생성된 스플릿 SpCas9은 라파마이신이 존재하는 환경에서 FRB 도메인과 FKBP 도메인이 다이머를 형성하여 재구성된 CRISPR 효소를 생성할 수 있다.
본 발명에서 기재한 CRISPR 효소 또는 CRISPR 효소 변이체는 폴리펩타이드, 단백질 또는 이를 암호화하는 서열을 가지는 핵산일 수 있으며, 상기 CRISPR 효소 또는 CRISPR 효소 변이체를 도입하고자 하는 대상에 맞추어 코돈 최적화(codon optimization)된 것일 수 있다.
“코돈 최적화”는 고유 서열의 적어도 하나의 코돈을 숙주 세포의 유전자에 더욱 빈번하게 또는 가장 빈번하게 사용되는 코돈으로 대체하면서, 고유 아미노상 서열을 유지함으로써 관심 숙주 세포에서의 발현의 증진을 위해 핵산서열을 변형시키는 과정을 의미한다. 다양한 종은 특정 아미노산의 특정 코돈에 대한 특정 편향을 가지며, 코돈 편향(유기체 간의 코돈 사용의 차이)은 종종 mRNA의 번역의 효율과 상호관련 되며, 이는 번역되는 코돈의 특성 및 특정 tRNA 분자의 이용가능성에 의해 좌우되는 것을 여겨진다. 세포에서 선택된 tRNA의 우세는 일반적으로 펩타이드 합성에 가장 빈번하게 사용되는 코돈을 반영한 것이다. 따라서, 유전자는 코돈 최적화에 기초하여 주어진 유기체에서 최적의 유전자 발현을 위해 맞춤화될 수 있다.
3. 표적 서열
“표적 서열”은 표적 유전자 또는 핵산 내에 존재하는 염기서열로, 가이드핵산의 가이드 도메인에 포함되는 가이드 서열과 상보성을 가진다. 표적 서열은 표적 유전자 또는 핵산에 따라, 즉 유전자 조작 또는 교정하고자 하는 대상에 따라 달라질 수 있는 염기서열로, 표적 유전자 또는 핵산에 따라 다양하게 설계될 수 있다.
표적 서열은 가이드핵산의 가이드 도메인에 포함된 가이드 서열과 상보적인 결합을 할 수 있으며, 상기 표적 서열의 길이는 가이드 서열의 길이와 동일할 수 있다.
상기 표적 서열은 5 내지 50개의 염기서열일 수 있다.
일 구체예로서 상기 표적서열은 16개의 염기서열, 17개의 염기서열, 18개의 염기서열, 19개의 염기서열, 20개의 염기서열, 21개의 염기서열, 22개의 염기서열, 23개의 염기서열, 24개의 염기서열 또는 25개의 염기서열일 수 있다.
상기 표적 서열은 가이드핵산의 가이드 도메인에 포함된 가이드 서열에 상보적인 핵산 서열일 수 있으며, 예를 들어 최소한 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상보적이거나 또는 완전하게 상보적인 핵산 서열일 수 있다.
일 예로, 상기 표적 서열은 가이드핵산의 가이드 도메인에 포함된 가이드 서열에 상보적이지 않은 1 내지 8개의 염기서열을 가지거나 또는 포함할 수 있다.
또한, 상기 표적 서열은 에디터단백질이 인식할 수 있는 핵산서열에 근접한 위치에 위치한 염기서열일 수 있다.
일 예로, 상기 표적 서열은 에디터단백질이 인식할 수 있는 핵산서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 5 내지 50개의 염기서열일 수 있다.
본 발명의 표적 서열의 일 구체예로서, gRNA-CRISPR 효소 복합체에 대한 표적 서열을 하단에 기술하였다.
gRNA-CRISPR 효소 복합체를 이용하여 표적 유전자 또는 핵산을 표적하는 경우,
표적 서열은 gRNA의 가이드 도메인에 포함되는 가이드 서열과 상보성을 가진다. 표적 서열은 표적 유전자 또는 핵산에 따라, 즉 유전자 조작 또는 교정하고자 하는 대상에 따라 달라질 수 있는 염기서열로, 표적 유전자 또는 핵산에 따라 다양하게 설계될 수 있다.
또한, 표적 서열은 CRISPR 효소, 즉 Cas9 또는 Cpf1이 인식할 수 있는 PAM 서열에 근접한 위치에 위치한 염기서열일 수 있다.
일 예로, 상기 표적 서열은 CRISPR 효소가 인식할 수 있는 PAM 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 5 내지 50개의 염기서열일 수 있다.
일 구체예로서, CRISPR 효소가 SpCas9인 경우, 상기 표적 서열은 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 16 내지 25개의 염기서열일 수 있다.
다른 일 구체예로서, CRISPR 효소가 StCas9인 경우, 상기 표적 서열은 5'-NGGNG-3' 또는/및 5'-NNAGAAW-3' (W = A 또는 T이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 16 내지 25개의 염기서열일 수 있다.
또 다른 일 구체예로서, CRISPR 효소가 NmCas9인 경우, 상기 표적 서열은 5'-NNNNGATT-3' 또는/및 5'-NNNGCTT-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 16 내지 25개의 염기서열일 수 있다.
일 구체예로서, CRISPR 효소가 CjCas9인 경우, 상기 표적 서열은 5'-NNNVRYAC-3' (V = G, C 또는 A; R = A 또는 G 이며, Y = C 또는 T 이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 16 내지 25개의 염기서열일 수 있다.
다른 일 구체예로서, CRISPR 효소가 SmCas9인 경우, 상기 표적 서열은 5'-NGG-3' 및/또는 5'-NAAR-3'(R = A 또는 G이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 16 내지 25개의 염기서열일 수 있다.
또 다른 일 구체예로서, CRISPR 효소가 SaCas9인 경우, 상기 표적 서열은 5'-NNGRR-3', 5'-NNGRRT-3' 또는/및 5'-NNGRRV-3' (R = A 또는 G이며, V = G, C 또는 A이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 16 내지 25개의 염기서열일 수 있다.
일 구체예로서, CRISPR 효소가 Cpf1인 경우, 상기 표적 서열은 5'-TTN-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 16 내지 25개의 염기서열일 수 있다.
4. 가이드핵산 - 에디터단백질 복합체 이용
가이드핵산-에디터단백질 복합체는 대상을 변형시킬 수 있다.
상기 대상은 표적 핵산, 유전자, 염색체 또는 단백질일 수 있다.
예를 들어, 가이드핵산-에디터단백질 복합체는 최종적으로 대상하는 단백질의 발현을 조절(예를 들어, 억제, 저해, 감소, 증가 또는 촉진) 할 수 있도록 하거나, 또는 단백질을 제거, 단백질 활성 조절(예를 들어, 억제, 저해, 감소, 증가 또는 촉진) 또는 새로운 단백질을 발현할 수 있도록 한다.
이때, 상기 가이드핵산-에디터단백질 복합체는 DNA, RNA, 유전자 또는 염색체 수준에서 작용할 수 있다.
일 예로, 상기 가이드핵산-에디터단백질 복합체는 표적 DNA를 조작 또는 변형하여 표적 DNA가 암호화하는 단백질의 발현을 조절(예를 들어, 억제, 저해, 감소, 증가 또는 촉진) 하거나, 또는 단백질을 제거, 단백질 활성 조절(예를 들어, 억제, 저해, 감소, 증가 또는 촉진) 또는 변형된 단백질을 발현할 수 있다.
다른 일 예로, 상기 가이드핵산-에디터단백질 복합체는 표적 RNA를 조작 또는 변형하여 표적 DNA가 암호화하는 단백질의 발현을 조절(예를 들어, 억제, 저해, 감소, 증가 또는 촉진) 하거나, 또는 단백질을 제거, 단백질 활성 조절(예를 들어, 억제, 저해, 감소, 증가 또는 촉진) 또는 변형된 단백질을 발현할 수 있다.
일 예로, 상기 가이드핵산-에디터단백질 복합체는 표적 유전자를 조작 또는 변형하여 표적 DNA가 암호화하는 단백질의 발현을 조절(예를 들어, 억제, 저해, 감소, 증가 또는 촉진) 하거나, 또는 단백질을 제거, 단백질 활성 조절(예를 들어, 억제, 저해, 감소, 증가 또는 촉진) 또는 변형된 단백질을 발현할 수 있다.
다른 일 예로, 상기 가이드핵산-에디터단백질 복합체는 표적 염색체를 조작 또는 변형하여 표적 DNA가 암호화하는 단백질의 발현을 조절(예를 들어, 억제, 저해, 감소, 증가 또는 촉진) 하거나, 또는 단백질을 제거, 단백질 활성 조절(예를 들어, 억제, 저해, 감소, 증가 또는 촉진) 또는 변형된 단백질을 발현할 수 있다.
상기 가이드핵산-에디터단백질 복합체는 유전자의 전사와 번역의 단계에서 작용할 수 있다.
일 예로, 상기 가이드핵산-에디터단백질 복합체는 표적 유전자의 전사를 촉진 또는 저해하여 표적 유전자가 암호화하는 단백질의 발현을 조절(예를 들어, 억제, 저해, 감소, 증가 또는 촉진)할 수 있다.
다른 일 예로, 상기 가이드핵산-에디터단백질 복합체는 표적 유전자의 번역을 촉진 또는 저해하여 표적 유전자가 암호화하는 단백질의 발현을 조절(예를 들어, 억제, 저해, 감소, 증가 또는 촉진)할 수 있다.
상기 가이드핵산-에디터단백질 복합체는 단백질 수준에서 작용할 수 있다.
일 예로, 상기 가이드핵산-에디터단백질 복합체는 표적 단백질을 조작 또는 변형하여 표적 단백질 제거 또는 단백질 활성 조절(예를 들어, 억제, 저해, 감소, 증가 또는 촉진)할 수 있다.
본 발명의 가이드핵산-에디터단백질 복합체 이용의 일 구체예로서, gRNA-CRISPR 효소 복합체를 이용한 표적 DNA, RNA, 유전자 또는 염색체의 조작 또는 변형에 대해 하단에 기술하였다.
유전자 편집
앞서 기재한 gRNA-CRISPR 효소 복합체, 즉, CRISPR 복합체를 이용하여 표적 유전자 또는 핵산을 편집 또는 교정할 수 있다. 이때, 표적 유전자 또는 핵산을 편집 또는 교정은 i) 표적 유전자 또는 핵산의 절단 또는 손상과 ii) 손상된 표적 유전자 또는 핵산의 수선 또는 수복하는 단계를 모두 포함한다.
i) 표적 유전자 또는 핵산의 절단 또는 손상
i) 표적 유전자 또는 핵산의 절단 또는 손상은 CRISPR 복합체를 이용한 표적 유전자 또는 핵산의 절단 또는 손상일 수 있으며, 구체적으로는 표적 유전자 또는 핵산 내의 표적 서열의 절단 손상일 수 있다.
일 예로, 상기 CRISPR 복합체를 이용한 표적 유전자 또는 핵산의 절단 또는 손상은 표적 서열의 이중가닥이 모두 절단 또는 손상되는 것일 수 있다.
일 구체예로서, 야생형의 SpCas9을 이용하는 경우, gRNA와 상보적 결합을 하는 표적 서열의 이중가닥은 모두 절단될 수 있다.
다른 일 구체예로서, SpCas9 니카아제(D10A)와 SpCas9 니카아제(H840A)를 이용하는 경우, gRNA와 상보적 결합을 하는 표적 서열의 상보성 단일가닥은 SpCas9 니카아제(D10A)에 의해 절단되고, gRNA와 상보적 결합을 하는 표적 서열의 비상보성 단일가닥은 SpCas9 니카아제(H840A)에 의해 절단될 수 있고, 각각의 절단은 순차적으로 또는 동시에 발생할 수 있다.
또 다른 일 구체예로서, SpCas9 니카아제(D10A)와 SpCas9 니카아제(H840A)와 서로 다른 표적 서열을 가지는 두 개의 gRNA를 이용하는 경우, 제 1 gRNA와 상보적 결합을 하는 표적 서열의 상보성 단일가닥은 SpCas9 니카아제(D10A)에 의해 절단되고, 제 2 gRNS와 상보적 결합을 하는 표적 서열의 비상보성 단일가닥은 SpCas9 니카아제(H840A)에 의해 절단될 수 있고, 각각의 절단은 순차적으로 또는 동시에 발생할 수 있다.
다른 일 예로, 상기 CRISPR 복합체를 이용한 표적 유전자 또는 핵산의 절단 또는 손상은 표적 서열 중 단일가닥만 절단 또는 손상되는 것일 수 있다. 이때, 단일가닥은 gRNA와 상보적 결합을 하는 표적 서열의 상보성 단일가닥일 수 있고, 또는 gRNA와 상보적 결합을 하는 표적 서열의 비상보성 단일가닥일 수 있다.
일 구체예로서, SpCas9 니카아제(D10A)를 이용하는 경우, gRNA와 상보적 결합을 하는 표적 서열의 상보성 단일가닥은 SpCas9 니카아제(D10A)에 의해 절단되고, gRNA와 상보적 결합을 하는 표적 서열의 비상보성 단일가닥은 절단되지 않을 수 있다.
다른 일 구체예로서, SpCas9 니카아제(H840A)를 이용하는 경우, gRNA와 상보적 결합을 하는 표적 서열의 비상보성 단일가닥은 SpCas9 니카아제(H840A)에 의해 절단되고, gRNA와 상보적 결합을 하는 표적 서열의 상보성 단일가닥은 절단되지 않을 수 있다.
또 다른 일 예로, 상기 CRISPR 복합체를 이용한 표적 유전자 또는 핵산의 절단 또는 손상은 일부 핵산 조각(fragment)를 제거하는 것일 수 있다.
일 구체예로서, 서로 다른 표적 서열을 가지는 두 개의 gRNA와 야생형 SpCas9을 이용하는 경우, 제 1 gRNA와 상보적 결합을 하는 표적 서열의 이중가닥을 절단하고, 제 2 gRNA와 상보적 결합을 하는 표적 서열의 이중가닥을 절단하여 제 1 gRNA와 제 2 gRNA 및 SpCas9에 의해 핵산 조각을 제거할 수 있다.
다른 일 구체예로서, 서로 다른 표적 서열을 가지는 두 개의 gRNA와 야생형 SpCas9 및 SpCas9 니카아제(D10A)와 SpCas9 니카아제(H840A)를 이용하는 경우, 제 1 gRNA와 상보적 결합을 하는 표적 서열의 이중가닥은 야생형 SpCas9에 의해 절단되고, 제 2 gRNA와 상보적 결합을 하는 표적 서열의 상보성 단일가닥은 SpCas9 니카아제(D10A)에 의해, 비상보성 단일가닥은 SpCas9 니카아제(H840A)에 의해 절단되어 제 1 gRNA와 제 2 gRNA 및 야생형 SpCas9, SpCas9 니카아제(D10A)와 SpCas9 니카아제(H840A)에 의해 핵산 조각을 제거할 수 있다.
또 다른 구체예로서, 서로 다른 표적 서열을 가지는 두 개의 gRNA와 SpCas9 니카아제(D10A)와 SpCas9 니카아제(H840A)를 이용하는 경우, 제 1 gRNA와 상보적 결합을 하는 표적 서열의 상보성 단일가닥은 SpCas9 니카아제(D10A)에 의해, 비상보성 단일가닥은 SpCas9 니카아제(H840A)에 의해 절단되고, 제 2 gRNA와 상보적 결합을 하는 표적 서열의 상보성 단일가닥은 SpCas9 니카아제(D10A)에 의해, 비상보성 단일가닥은 SpCas9 니카아제(H840A)에 의해 절단되어 제 1 gRNA와 제 2 gRNA 및 SpCas9 니카아제(D10A)와 SpCas9 니카아제(H840A)에 의해 핵산 조각을 제거할 수 있다.
다른 구체예로서, 서로 다른 표적 서열을 가지는 세 개의 gRNA와 야생형 SpCas9 및 SpCas9 니카아제(D10A)와 SpCas9 니카아제(H840A)를 이용하는 경우, 제 1 gRNA와 상보적 결합을 하는 표적 서열의 이중가닥은 야생형 SpCas9에 의해 절단되고, 제 2 gRNA와 상보적 결합을 하는 표적 서열의 상보성 단일가닥은 SpCas9 니카아제(D10A)에 의해 절단되며, 제 3 gRNA와 상보적 결합을 하는 표적 서열의 비상보성 단일가닥은 SpCas9 니카아제(H840A)에 의해 절단되어 제 1 gRNA, 제 2 gRNA 및 제 3 gRNA와 야생형 SpCas9, SpCas9 니카아제(D10A) 및 SpCas9 니카아제(H840A)에 의해 핵산 조각을 제거할 수 있다.
또 다른 구체예로서, 서로 다른 표적 서열을 가지는 네 개의 gRNA와 SpCas9 니카아제(D10A)와 SpCas9 니카아제(H840A)를 이용하는 경우, 제 1 gRNA와 상보적 결합을 하는 표적 서열의 상보성 단일가닥은 SpCas9 니카아제(D10A)에 의해 절단되고, 제 2 gRNA와 상보적 결합을 하는 표적 서열의 비상보성 단일가닥은 SpCas9 니카아제(H840A)에 의해 절단되며, 제 3 gRNA와 상보적 결합을 하는 표적 서열의 상보성 단일가닥은 SpCas9 니카아제(D10A)에 의해 절단되고, 제 4 gRNA와 상보적 결합을 하는 표적 서열의 비상보성 단일가닥은 SpCas9 니카아제(H840A)에 의해 절단되어 제 1 gRNA, 제 2 gRNA, 제 3 gRNA 및 제 4 gRNA와 SpCas9 니카아제(D10A)및 SpCas9 니카아제(H840A)에 의해 핵산 조각을 제거할 수 있다.
ii ) 손상된 표적 유전자 또는 핵산의 수선 또는 수복
상기 CRISPR 복합체에 의해 절단 또는 손상된 표적 유전자 또는 핵산은 비-상동성 말단-결합 (NHEJ) 및 상동 재조합 수리(HDR)을 통해 수선 또는 수복될 수 있다.
비- 상동성 말단-결합 ( Non - homologous end joining , NHEJ )
NHEJ는 절단된 이중가닥 또는 단일가닥의 양 말단이 함께 결합함으로써 DNA 내 이중가닥 파손을 수복 또는 수선하는 방법으로, 일반적으로, 이중가닥의 파손(예를 들어, 절단)에 의해 형성된 2 개의 적합성 말단이 빈번한 접촉을 반복하여 2개의 말단이 완전히 결합되는 경우 파손된 이중가닥이 복구된다. NHEJ는 모든 세포주기에서 가능한 수복 방식으로, 주로 G1 시기와 같이 세포 내에 주형으로 쓸 상동유전체가 없을 때 발생한다.
NHEJ를 이용한 손상된 유전자 또는 핵산의 수복 과정에서 NHEJ 수선 부위에 핵산 서열의 일부 삽입 및/또는 결실(삽입결실)을 초래하며, 이러한 삽입 및/또는 결실은 리딩 프레임을 변경시키고, 프레임쉬프트 된 전사체 mRNA를 만들어내고, 결과적으로 넌센스-매개 붕괴(nonsense mediated decay)를 겪거나 정상적인 단백질을 합성하는데 실패함으로써 본래의 기능을 상실하게 된다. 또는 추가적으로, 리딩 프레임을 유지하지만, 상당한 양의 서열을 삽입 또는 결실시키는 돌연변이를 초래해 단백질의 기능성을 파괴할 수 있다. 이는 중요한 기능적 도메인의 돌연변이가 단백질의 비중요 영역에서의 돌연변이보다 덜 용인될 가능성이 있기 때문에 좌위 의존적이다.
NHEJ에 의해 생성된 삽입결실 돌연변이는 자연 상태에서 예측 불가능하지만, 주어진 파손 부위에서 특정 삽입 결실 서열이 선호되며, 이는 마이크로상동성의 작은 영역에 기인할 가능성이 있다. 통상적으로 결실 길이는 1 bp 내지 50 bp 범위이며, 삽입은 더 짧게 되는 경향이 있고, 종종 파손 부위를 바로 둘러싸는 짧은 중복 서열을 포함한다.
또한, NHEJ는 돌연변이를 유발하는 과정으로, 특이적 최종 서열의 생성이 필요하지 않은 경우, 작은 서열의 모티프를 결실시키는데 사용될 수 있다.
이러한 NHEJ를 이용하면, CRISPR 복합체에 의해 표적되는 유전자의 특이적 넉아웃(knockout)할 수 있다. CRISPR 효소, 예를 들어, Cas9 또는 Cpf1을 이용하여 표적 유전자 또는 핵산의 이중가닥 또는 두 개의 단일가닥의 절단하고, 파손된 표적 유전자 또는 핵산의 이중가닥 또는 두 개의 단일가닥은 NHEJ에 의해 삽입결실이 생성되며, 이를 통해 표적 유전자 또는 핵산의 특이적 넉아웃을 유도할 수 있다. 이때, 상기 CRISPR 효소에 의해 절단되는 표적 유전자 또는 핵산의 위치는 비암호 영역 또는 암호 영역일 수 있으며, 더불어 NHEJ에 의해 수복되는 표적 유전자 또는 핵산의 위치는 비암호 영역 또는 암호 영역일 수 있다.
상동 재조합 수리( homology directed repairing , HDR )
HDR은 손상된 유전자 또는 핵산을 수선 또는 수복하기 위해 상동성을 가진 서열을 주형으로 이용하는 방식으로 오류 없이 교정할 수 있는 방법으로, 일반적으로, 파손된 DNA을 수선 또는 수복하기 위해, 즉 세포가 가지고 있는 원래의 정보를 복원하기 위해, 변형이 이루어지지 않은 상보적인 염기서열의 정보를 이용하거나 자매 염색분체의 정보를 이용하여 파손된 DNA를 수선 또는 수복한다. HDR의 가장 일반적인 형태는 상동성 재조합(homologous recombination, HR)이다. HDR은 통상적으로 활발하게 분열하는 세포의 S나 G2/M 시기에 주로 발생하는 수선 또는 수복 방식이다.
HDR을 이용한 손상된 DNA 수선 또는 수복을 위해, 세포가 본래 가지는 상보적인 염기서열 또는 자매 염색분체를 이용하는 대신에, 상보적인 염기서열 또는 상동성 염기서열 정보를 이용한 인공적으로 합성한 DNA 주형, 즉, 상보적인 염기서열 또는 상동성 염기서열을 포함하는 핵산 주형을 세포에 제공하여 파손된 DNA를 수선 또는 수복할 수 있다. 이때, 상기 핵산 주형에 추가로 핵산 서열 또는 핵산 조각을 포함시켜 파손된 DNA를 수선 또는 수복 할 때, 파손된 DNA에 추가로 포함시킨 핵산 서열 또는 핵산 조작을 삽입(Knock-In)할 수 있다. 추가로 포함시키는 핵산 서열 또는 핵산 조작은 돌연변이의 변형된 표적 유전자 또는 핵산을 정상 유전자 또는 핵산으로 교정하기 위한 핵산 서열 또는 핵산 조각이거나 세포 내에서 발현을 원하는 유전자 또는 핵산일 수 있으나, 이에 제한되지 않는다.
일 예로, CRISPR 복합체를 이용하여 표적 유전자 또는 핵산의 이중가닥 또는 단일가닥을 절단하고, 절단 위치와 근접한 염기서열과 상보적인 염기서열을 포함하는 핵산 주형을 세포에 제공하여 표적 유전자 또는 핵산의 절단된 염기서열을 HDR 방법으로 수선 또는 수복할 수 있다.
이때, 상기 상보적인 염기서열을 포함하는 핵산 주형은 파손된 DNA, 즉 절단된 이중가닥 또는 단일가닥의 상보적인 염기서열을 가지며, 추가로 파손된 DNA에 삽입하기 원하는 핵산 서열 또는 핵산 조각을 포함할 수 있다. 이와 같이 상보적인 염기서열과 삽입하고자 하는 핵산 서열 또는 핵산 조각을 포함하는 핵산 주형을 이용하여 파손된 DNA, 즉 표적 유전자 또는 핵산의 절단된 위치에 추가적인 핵산 서열 또는 핵산 조각을 삽입할 수 있다. 이때, 상기 삽입하고자 하는 핵산 서열 또는 핵산 조각 및 추가적인 핵산 서열 또는 핵산 조각은 돌연변이의 변형된 표적 유전자 또는 핵산을 정상 유전자 또는 핵산으로 교정하기 위한 핵산 서열 또는 핵산 조각이거나 세포 내에서 발현을 원하는 유전자 또는 핵산일 수 있다. 상기 상보적인 염기서열은 파손된 DNA, 즉 표적 유전자 또는 핵산의 절단된 이중가닥 또는 단일가닥의 오른쪽 및 왼쪽의 염기서열과 상보적인 결합을 하는 염기서열일 수 있다. 또는 상기 상보적인 염기서열은 파손된 DNA, 즉 표적 유전자 또는 핵산의 절단된 이중가닥 또는 단일가닥의 3' 및 5' 말단과 상보적인 결합을 하는 염기서열일 수 있다. 상기 상보적인 염기서열은 15 내지 3000개의 염기서열일 수 있으며, 핵산 주형의 크기 또는 표적 유전자 또는 핵산에 따라 적절하게 상기 상보적인 염기서열의 길이 또는 크기를 설계할 수 있다. 이때, 핵산 주형을 이중가닥 또는 단일가닥의 핵산일 수 있으며, 선형 또는 원형일 수 있으나, 이에 제한되지 않는다.
다른 일 예로, CRISPR 복합체를 이용하여 표적 유전자 또는 핵산의 이중가닥 또는 단일가닥을 절단하고, 절단 위치와 근접한 염기서열과 상동성 염기서열을 포함하는 핵산 주형을 세포에 제공하여 표적 유전자 또는 핵산의 절단된 염기서열을 HDR 방법으로 수선 또는 수복할 수 있다.
이때, 상기 상동성 염기서열을 포함하는 핵산 주형은 파손된 DNA, 즉 절단된 이중가닥 또는 단일가닥의 상동성 염기서열을 가지며, 추가로 파손된 DNA에 삽입하기 원하는 핵산 서열 또는 핵산 조각을 포함할 수 있다. 이와 같이 상동성 염기서열과 삽입하고자 하는 핵산 서열 또는 핵산 조각을 포함하는 핵산 주형을 이용하여 파손된 DNA, 즉 표적 유전자 또는 핵산의 절단된 위치에 추가적인 핵산 서열 또는 핵산 조각을 삽입할 수 있다. 이때, 상기 삽입하고자 하는 핵산 서열 또는 핵산 조각 및 추가적인 핵산 서열 또는 핵산 조각은 돌연변이의 변형된 표적 유전자 또는 핵산을 정상 유전자 또는 핵산으로 교정하기 위한 핵산 서열 또는 핵산 조각이거나 세포 내에서 발현을 원하는 유전자 또는 핵산일 수 있다. 상기 상동성 염기서열은 파손된 DNA, 즉 표적 유전자 또는 핵산의 절단된 이중가닥 또는 단일가닥의 오른쪽 및 왼쪽의 염기서열과 상동성을 가지는 염기서열일 수 있다. 또는 상기 상보적인 염기서열은 파손된 DNA, 즉 표적 유전자 또는 핵산의 절단된 이중가닥 또는 단일가닥의 3' 및 5' 말단과 상동성을 가지는 염기서열일 수 있다. 상기 상동성 염기서열은 15 내지 3000개의 염기서열일 수 있으며, 핵산 주형의 크기 또는 표적 유전자 또는 핵산에 따라 적절하게 상기 상동성 염기서열의 길이 또는 크기를 설계할 수 있다. 이때, 핵산 주형을 이중가닥 또는 단일가닥의 핵산일 수 있으며, 선형 또는 원형일 수 있으나, 이에 제한되지 않는다.
상기의 NHEJ와 HDR 외에도 파손된 DNA를 수선 또는 수복하는 방법이 존재한다.
단일가닥 어닐링 ( Single - strand annealing , SSA )
SSA는 표적 핵산 중에 존재하는 2개의 반복부 서열 사이의 이중가닥 파손을 수선하는 방법으로, 일반적으로 30개 초과의 염기서열의 반복수 서열을 이용한다. 파손 말단에서 표적 핵산의 이중가닥에 대해 반복부 서열을 각각의 단일가닥이 가지도록 절단(Sticky end가 되도록)되며, 절단 후 반복부 서열을 함유하는 단일가닥 돌출부는 반복체 서열이 자체적으로 부적절하게 어닐링되는 것을 방지하기 위해 RPA 단백질로 코팅된다. RAD52는 돌출부 상의 각각의 반복부 서열에 결합하고, 상보성 반복부 서열의 어닐링을 가능하게 하는 서열을 정렬한다. 어닐링 후에, 돌출부의 단일가닥 플랩(flap)은 절단되고, 새로운 DNA 합성이 임의의 갭을 채우면서 DNA 이중가닥을 복원한다. 이러한 수복 또는 수선의 결과로, 2개의 반복체 사이의 DNA 서열이 결실되며, 결실 길이는 이용되는 2개의 반복체의 위치를 포함하는 다수의 인자 및 절단 경로 또는 진행도에 의존될 수 있다.
SSA는 HDR 방식과 유사하게는 상보성 서열, 즉 상보성 반복부 서열을 이용하고, 대조적으로는 표적 핵산 서열을 변경 또는 수정하기 위한 핵산 주형을 필요로 하지 않는다.
단일가닥 파손 수선( Single - strand break repair , SSBA )
게놈 내 단일가닥 파손은 상기 논의된 수선 메커니즘과는 별도의 메커니즘인 SSBR을 통해 수선 또는 수복된다. DNA 파손의 형태가 단일가닥 파손일 때, PARP1 및/또는 PARP2는 파손을 인식하고 수선 기작을 동원한다. DAN 파손에서 PARP1의 결합 및 활성을 일시적이며, 손상부에 SSBR 단백질 복합체의 안정성을 촉진함으로써 SSBR을 촉진시킨다. SSBR 복합체에서 가장 중요한 단백질은 XRCC1으로, 이는 DNA의 3' 및 5' 말단 가공을 촉진하는 단백질과 상호작용하며, 안정화시킨다. 말단 가공은 일반적을 손상된 3' 말단을 하이드록실화된 상태 및/또는 5' 말단을 인산염 모이어티로 복구하는 것을 수반하며, 말단이 가공되면, DNA 갭 채우기가 일어난다. DNA 갭 채우기에는 2가지 방법, 즉, 짧은 패치 수선 및 긴 패치 수선이 있으며, 이때 짧은 패치 수선은 빠져있는 단일 염기의 삽입을 수반한다. DNA 갭 채우기 후, DNA 리가아제는 말단의 결합을 촉진한다.
미스매치 수선( Mismatch repair , MMR )
MMR은 잘못 짝지어진 DNA 염기상에서 작용한다. MSH2/6 또는 MSH2/3 복합체는 둘 다 미스매치 인식 및 수선의 개시에서 중요한 역할을 하는 ATP 분해효소 활성을 가지며, MSH2/6는 염기-염기 미스매치를 우선적으로 인식하고, 1개 또는 2개의 염기의 미스매치를 동정하는 반면, MSH2/3는 더 큰 미스매치를 우선적으로 인식한다.
염기 절단 수선( Base excision repair , BER )
BER은 세포주기 전체에서 활성이며, 게놈으로부터 작은 비-나선-뒤틀림 염기 손상부를 제거하는데 이용되는 수선 방식이다. 손상된 DNA는 당 인산화 백본에 염기를 연결하는 N-글리코사이드 결합을 절단하여 손상된 염기를 절단하고, 이어서 포스포디에스테르 백본을 절단하여 DNA 단일가닥 파손을 생성한다. 이렇게 형성된 파손된 단일가닥 말단을 제거하고, 제거된 단일가닥에 의해 발생된 갭을 새로운 상보성 염기로 채운 후, DNA 리가아제로 새로 채워진 상보성 염기 말단과 백본을 결합시켜 손상된 DNA를 수선 또는 수복한다.
뉴클레오타이드 절단 수선( Nucleotide excision repair , NER )
NER은 DNA로부터 큰 나선-뒤틀림 손상을 제거하는 중요한 절단 메커니즘으로, 손상이 인식되면, 손상부를 함유하는 짧은 단일가닥 DNA 세그먼트를 제거하여, 22개 내지 30개 염기의 단일가닥 갭을 생성한다. 생성된 갭은 새로운 상보성 염기로 채운 후, DNA 리가아제로 새로 채워진 상보성 염기 말단과 백본을 결합시켜 손상된 DNA를 수선 또는 수복한다.
유전자 편집 효과
표적 유전자 또는 핵산을 편집 또는 교정은 크게 넉아웃(knockout), 넉다운(knockdown), 넉인(knockin)의 효과를 초래할 수 있다.
넉아웃(Knockout)
“넉아웃(knockout)”은 표적 유전자 또는 핵산을 불활성화 시키는 것을 의미하며, “표적 유전자 또는 핵산의 불활성화”는 표적 유전자 또는 핵산의 전사 및/또는 번역이 되지 못하는 상태를 의미한다. 넉아웃을 통해 질병을 유발하는 유전자 또는 비정상적 기능을 가지는 유전자의 전사 및 번역을 억제하여 단백질의 발현을 막을 수 있다.
예를 들어, gRNA-CRISPR 효소 복합체, 즉, CRISPR 복합체를 이용하여 표적 유전자 또는 핵산을 편집 또는 교정하는 경우, CRISPR 복합체를 이용하여 표적 유전자 또는 핵산을 절단할 수 있다. CRISPR 복합체를 이용하여 손상된 표적 유전자 또는 핵산은 NHEJ를 통해 손상된 유전자 또는 핵산이 수복될 수 있다. 파손된 표적 유전자 또는 핵산은 NHEJ에 의해 삽입결실이 생성되며, 이를 통해 표적 유전자 또는 핵산의 특이적 넉아웃을 유도할 수 있다.
넉다운(Knockdown)
“넉다운(knockdown)”은 표적 유전자 또는 핵산의 전사 및/또는 번역을 감소시키거나 표적 단백질의 발현이 감소하는 것을 의미한다. 넉다운을 통해 과발현 되는 유전자 또는 단백질의 발현을 조절하여 질병의 발생을 막거나 질병을 치료할 수 있다.
예를 들어, gRNA- CRISPR 불활성 효소-전사 저해 활성 도메인 복합체, 즉, 전사 저해 활성 도메인을 포함하는 CRISPR 불활성 복합체를 이용하여 표적 유전자 또는 핵산을 편집 또는 교정하는 경우, 상기 CRISPR 불활성 복합체가 표적 유전자 또는 핵산에 특이적으로 결합하고, CRISPR 불활성 복합체에 포함된 전사 저해 활성 도메인에 의해 표적 유전자 또는 핵산의 전사가 저해되어 해당 유전자 또는 핵산의 발현이 저해되는 넉다운을 유도할 수 있다.
넉인( Knockin )
“넉인(knockin)”은 표적 유전자 또는 핵산에 특정 핵산 또는 유전자를 삽입하는 것을 의미하며, 이때, “특정 핵산”은 삽입하고자 하는 또는 발현시키기 원하는 유전자 또는 핵산을 의미한다. 넉인을 통해 질병을 유발하는 돌연변이 유전자를 올바르게 교정하거나, 정상 유전자를 삽입하여 정상 유전자의 발현을 유도하여 질병 치료에 이용할 수 있다.
더불어, 넉인은 추가적으로 도너(donor)를 필요로 할 수 있다.
예를 들어, gRNA-CRISPR 효소 복합체, 즉, CRISPR 복합체를 이용하여 표적 유전자 또는 핵산을 편집 또는 교정하는 경우, CRISPR 복합체를 이용하여 표적 유전자 또는 핵산을 절단할 수 있다. CRISPR 복합체를 이용하여 손상된 표적 유전자 또는 핵산은 HDR를 통해 손상된 유전자 또는 핵산이 수복될 수 있다. 이때, 도너를 이용하여 손상된 유전자 또는 핵산에 특정 핵산을 삽입할 수 있다.
상기 “도너(donor)”는 손상된 유전자 또는 핵산의 HDR을 통한 수복을 돕는 핵산서열을 의미하며, 이때, 주형은 특정 핵산을 포함할 수 있다.
상기 도너는 이중가닥 핵산 또는 단일가닥 핵산일 수 있다.
상기 도너는 선형 또는 원형일 수 있다.
상기 도너는 표적 유전자 또는 핵산에 상동성을 가지는 핵산서열을 포함할 수 있다.
예를 들어, 도너는 특정 핵산을 삽입하고자 하는 위치, 예를 들어, 손상된 핵산의 왼쪽(upstream)및 오른쪽(downstream)의 염기서열과 각각 상동성을 가지는 핵산서열을 포함할 수 있다. 이때, 삽입하고자 하는 특정 핵산은 손상된 핵산의 오른쪽 염기서열과 상동성을 가지는 핵산서열과 손상된 핵산의 왼쪽 염기서열과 상동성을 가지는 핵산서열 사이에 위치할 수 있다. 이때, 상기 상동성을 가지는 핵산서열은 최소한 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상동성을 갖거나 또는 완전하게 상동성을 가질 수 있다.
상기 도너는 선택적으로 부수적인 핵산서열을 포함할 수 있다. 이때, 부수적인 핵산서열은 도너의 안정성, 넉인 효율 또는 HDR 효율을 높이는 역할을 하는 것일 수 있다.
예를 들어, 상기 부수적인 핵산서열은 염기 A, T가 풍부한 핵산서열, 즉, A-T 풍부 도메인(A-T rich domain)일 수 있다. 또는 상기 부수적인 핵산서열은 S/MAR(scaffold/matrix attachment region)일 수 있다.
5. 기타 추가 구성물
가이드핵산-에디터단백질 복합체의 효율을 증가 또는 손상된 유전자 또는 핵산의 수복 효율을 향상시키기 위해 선택적으로 추가 구성물을 포함할 수 있다.
추가 구성물은 가이드핵산-에디터단백질 복합체의 효율을 향상시키기 위해 선택적으로 이용될 수 있다.
액티베이터 ( activator )
추가 구성물은 가이드핵산-에디터단백질 복합체의 표적 핵산, 유전자 또는 염색체의 절단 효율을 높이기 위한 액티베이터(activator)로 이용될 수 있다.
상기 “액티베이터(activator)”는 가이드핵산-에디터단백질 복합체와 표적 핵산, 유전자 또는 염색체의 결합을 안정화 시키거나, 또는 가이드핵산-에디터단백질 복합체를 표적 핵산, 유전자 또는 염색체에 더 잘 접근시킬 수 있도록 역할하는 핵산을 의미한다.
상기 액티베이터는 이중가닥 핵산 또는 단일가닥 핵산일 수 있다.
상기 액티베이터는 선형 또는 원형일 수 있다.
상기 액티베이터는 가이드핵산-에디터단백질 복합체와 표적 핵산, 유전자 또는 염색체의 결합을 안정화시키는 “헬퍼(helper)”와 가이드핵산-에디터단백질 복합체를 표적 핵산, 유전자 또는 염색체에 더 잘 접근시킬 수 있도록 역할하는 “에스코터(escortor)”로 나눌 수 있다.
상기 헬퍼는 가이드핵산-에디터단백질 복합체의 표적 핵산, 유전자 또는 염색체의 절단 효율을 증가시킬 수 있다.
예를 들어, 상기 헬퍼는 표적 핵산, 유전자 또는 염색체에 상동성을 가지는 핵산서열을 포함하여 가이드핵산-에디터단백질 복합체가 표적 핵산, 유전자 또는 염색체에 결합할 때, 상기 헬퍼에 포함된 상동성을 가지는 핵산서열이 표적 핵산, 유전자 또는 염색체와 추가적인 상보적인 결합을 이루어 가이드핵산-에디터단백질 복합체와 표적 핵산, 유전자 또는 염색체의 결합이 안정화될 수 있도록 할 수 있다.
상기 에스코터는 가이드핵산-에디터단백질 복합체의 표적 핵산, 유전자 또는 염색체의 절단 효율을 증가시킬 수 있다.
예를 들어, 상기 에스코터는 표적 핵산, 유전자 또는 염색체에 상동성을 가지는 핵산서열을 포함하고, 이때, 상기 에스코터에 포함된 상동성을 가지는 핵산서열이 가이드핵산-에디터단백질 복합체의 가이드핵산과 일부 상보적 결합을 할 수 있다. 이를 통해, 가이드핵산-에디터단백질 복합체와 일부 상보적인 결합을 한 에스코터는 표적 핵산, 유전자 또는 염색체와 일부 상보적인 결합을 할 수 있고, 그 결과 에스코터는 가이드핵산-에디터단백질 복합체를 정확한 표적 핵산, 유전자 또는 염색체 위치에 접근하도록 할 수 있다.
상기 상동성을 가지는 핵산서열은 최소한 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상동성을 갖거나 또는 완전하게 상동성을 가질 수 있다.
또한, 상기 추가 구성물은 손상된 유전자 또는 핵산의 수복 효율을 향상시키기 위해 선택적으로 이용될 수 있다.
어시스터 ( Assistor )
추가 구성물은 손상된 유전자 또는 핵산의 수복 효율을 향상시키기 위한 어시스터(assistor)로 이용될 수 있다.
상기 “어시스터(assistor)”는 손상된 유전자 또는 핵산, 예를 들어, 가이드핵산-에디터단백질 복합체에 의해 절단된 유전자 또는 핵산의 수복 과정에 참여하거나 수복 효율을 높이는 역할을 하는 핵산을 의미한다.
상기 어시스터는 이중가닥 핵산 또는 단일가닥 핵산일 수 있다.
상기 어시스터는 선형 또는 원형일 수 있다.
상기 어시스터는 수복 방법에 따라 NHEJ를 이용한 수복 과정에 참여하거나 수복 효율을 향상시키는 “NHEJ 어시스터”와 HDR을 이용한 수복 과정에 참여하거나 수복 효율을 향상시키는 “HDR 어시스터”로 나눌 수 있다.
상기 NHEJ 어시스터는 NHEJ를 이용한 손상된 유전자 또는 핵산의 수복 과정에 참여하거나 수복 효율을 향상시킬 수 있다.
예를 들어, 상기 NHEJ 어시스터는 손상된 핵산서열의 일부와 상동성을 가지는 핵산 서열을 포함할 수 있다. 이때, 상기 상동성을 가지는 핵산서열은 손상된 핵산서열의 일 말단(예를 들어 3' 말단) 핵산서열과 상동성을 가지는 핵산서열을 포함하며, 또한 손상된 핵산서열의 다른 말단(예를 들어 5' 말단) 핵산서열과 상동성을 가지는 핵산서열을 포함할 수 있다. 또는 손상된 핵산서열의 왼쪽(upstream)및 오른쪽(downstream)의 염기서열과 각각 상동성을 가지는 핵산서열을 포함할 수 있다. 이러한 상동성을 가지는 핵산서열은 손상된 핵산서열의 두 부분이 근접한 위치에 존재할 수 있도록 도와줌으로써 NHEJ에 의해 손상된 핵산의 수복 효율을 높일 수 있다.
상기 HDR 어시스터는 HDR을 이용한 손상된 유전자 또는 핵산의 수복 과정에 참여하거나 수복 효율을 향상시킬 수 있다.
예를 들어, 상기 HDR 어시스터는 손상된 핵산서열의 일부와 상동성을 가지는 핵산 서열을 포함할 수 있다. 이때, 상기 상동성을 가지는 핵산서열은 손상된 핵산서열의 일 말단(예를 들어 3' 말단) 핵산서열과 상동성을 가지는 핵산서열을 포함하며, 또한 손상된 핵산서열의 다른 말단(예를 들어 5' 말단) 핵산서열과 상동성을 가지는 핵산서열을 포함할 수 있다. 또는 손상된 핵산서열의 왼쪽(upstream)및 오른쪽(downstream)의 염기서열과 각각 상동성을 가지는 핵산서열을 포함할 수 있다. 이러한 상동성을 가지는 핵산서열은 손상된 핵산서열의 주형으로 역할하여 HDR에 의한 손상된 핵산의 수복 효율을 높일 수 있다.
다른 예로, 상기 HDR 어시스터는 손상된 핵산서열의 일부와 상동성을 가지는 핵산 서열 및 특정핵산, 예를 들면 삽입하고자 하는 핵산 또는 유전자를 포함할 수 있다. 이때, 상기 상동성을 가지는 핵산서열은 손상된 핵산서열의 왼쪽(upstream)및 오른쪽(downstream)의 염기서열과 각각 상동성을 가지는 핵산서열을 포함할 수 있다. 상기 특정 핵산은 손상된 핵산의 오른쪽 염기서열과 상동성을 가지는 핵산서열과 손상된 핵산의 왼쪽 염기서열과 상동성을 가지는 핵산서열 사이에 위치할 수 있다. 이러한 상동성을 가지는 핵산서열 및 특정 핵산은 손상된 핵산에 특정 핵산을 삽입할 수 있는 도너로 역할하여 넉인을 위한 HDR의 효율을 높일 수 있다.
상기 상동성을 가지는 핵산서열은 최소한 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상동성을 갖거나 또는 완전하게 상동성을 가질 수 있다.
6. 대상
“대상”은 가이드핵산, 에디터단백질 또는 가이드핵산-에디터단백질 복합체가 도입되는 유기체, 또는 가이드핵산, 에디터단백질 또는 가이드핵산-에디터단백질 복합체가 작동하는 유기체 또는 유기체로부터 획득한 검체 또는 시료를 의미한다.
상기 대상은 가이드핵산-에디터단백질 복합체의 표적 핵산, 유전자, 염색체 또는 단백질을 포함하는 유기체일 수 있다.
상기 유기체는 세포, 조직, 식물, 동물 또는 인간일 수 있다.
상기 세포는 원핵세포, 진핵세포일 수 있다.
상기 진핵세포는 식물세포, 동물세포, 인간세포일 수 있으나, 이에 제한하지 않는다.
상기 조직은 피부, 간, 신장, 심장, 폐, 뇌, 근육 등의 동물 또는 인간의 신체 조직일 수 있다.
상기 대상은 가이드핵산-에디터단백질 복합체의 표적 핵산, 유전자, 염색체 또는 단백질을 포함하는 검체 또는 시료일 수 있다.
상기 검체 또는 시료는 침, 혈액, 피부조직, 암세포 또는 줄기세포 등 표적 핵산, 유전자, 염색체 또는 단백질을 포함하는 유기체에서 획득한 것 일 수 있다.
본 발명에서 대상의 일 구체예로서, 가이드핵산-에디터단백질 복합체의 표적 유전자 또는 핵산을 포함하는 대상에 대해 하단에 기재하였다.
예를 들어, PD-1 유전자, CTLA-4 유전자, TNFAIP3 유전자, DGKA 유전자, DGKZ 유전자,Fas 유전자, EGR2 유전자, PPP2R2D 유전자, PSGL-1 유전자, KDM6A 유전자, 및/또는 TET2 유전자를 타겟 유전자로 할 수 있다.
일 구체예에서, 상기 각 유전자의 타겟 서열은 표 1에 기재된 서열 중 PAM 서열을 제외한 서열 (단 T는 U로 바뀜)들 중에서 선택된 1종 이상일 수 있다. 이러한 타겟 서열은 가이드 핵산 설계의 기준이 될 수 있다.
즉, 각 유전자 별 타겟 서열 부위의 염기서열 및 이에 대응하는 가이드 RNA의 타겟팅 서열 부위 (가이드 RNA의 타겟팅 서열 부위; 타겟 서열 부위와 혼성화 가능한 뉴클레오타이드 서열을 갖는 가이드 RNA의 타겟팅 서열 부위)를 앞서 표 1에 정리하였다 (표 1에 기재된 타겟 서열 부위는 3' 말단에 PAM 서열 5'-NGG-3'이 포함된 상태로 기재됨)
이들 타겟 서열 부위는 유전자 게놈 내에서 타겟 서열을제외하고 0bp 내지 2bp 미스매치(mismatch) 부위가 없는 서열로 off-target 효과가 낮고 유전자 교정 효율이 높은 것을 특징으로 한다.
상기 타겟 서열은 2종 이상을 동시에 타겟으로 할 수 있다.
상기 유전자는 2종 이상을 동시에 타겟으로 할 수 있다.
동종 유전자 내 2종 이상의 타겟서열 또는 이종 유전자 내 2종 이상의 타겟서열을 동시에 타겟으로 할 수 있다.
상기 유전자 내 비암호 또는 암호 영역, 예를 들어 프로모터 영역, 인핸서, 3'UTR, 및/또는 폴리아데닐화 신호서열, 또는 전사 서열, 예를 들어 인트론 또는 엑손 서열을 타겟으로 할 수 있다.
상기 유전자들의 상위 50%의 암호영역을 타겟으로 할 수 있다.
일 실시예에서는 DGKa 또는 DGKz를 각각 타겟으로 할 수 있다.
일 실시예에서는 DGKa 및 DGKz를 동시에 타겟으로 할 수 있다.
본 발명의 구현예에서, 각 유전자의 인위적인 조작을 위해 상기 서열번호 1 내지 289번의 타겟서열에 상응하는 가이드 핵산 서열이 제공된다.
본 발명의 구현예에서, 각 유전자의 인위적인 조작을 위해 상기 서열번호 1 내지 289번의 타겟서열에 상응하는 가이드 핵산 서열과 상호작용하는, 예를 들어 복합체를 형성하는 에디터 단백질이 제공된다.
본 발명의 구현예에서, 상기 서열번호 1 내지 289번의 타겟서열 부위에서 인위적인 조작이 일어난 각 유전자의 핵산 변형 산물 및 이의 발현 산물이 제공된다.
본 발명의 구현예에서, 각 유전자의 인위적인 조작을 위해
서열번호 6 및 11 (A20),
서열번호 19, 20, 21, 및 23 (DGKa)
서열번호 25 (EGR2)
서열번호 64 (PPP2R2D)
서열번호 87 및 89 (PD-1)
서열번호 109, 110, 111, 112 및 113 (Dgkζ)
서열번호 126, 128 및 129 (Tet-2)
서열번호 182 (PSGL-1)
서열번호 252, 254, 257 및 264 (FAS)
서열번호 285 (KDM6A)
중 1 이상의 타겟서열에 상응하는 가이드 핵산 서열 및 이와 상호작용하는 에디터단백질과의 복합체가 제공된다.
본 발명의 구현예에서, 상기 서열번호 6 및 11 (A20), 서열번호 19, 20, 21, 및 23 (DGKa), 서열번호 25 (EGR2), 서열번호 64 (PPP2R2D), 서열번호 87 및 89 (PD-1), 서열번호 109, 110, 111, 112 및 113 (Dgkζ), 서열번호 126, 128 및 129 (Tet-2), 서열번호 182 (PSGL-1), 서열번호 252, 254, 257 및 264 (FAS), 및 서열번호 285 (KDM6A)의 타겟서열 부위에서 인위적인 조작이 일어난 각 유전자의 핵산 변형 산물 및 이의 발현 산물이 제공된다.
7. 전달
가이드핵산, 에디터단백질 또는 가이드핵산-에디터단백질 복합체는 다양한 전달 방법과 다양한 형태로 대상 내에 전달 또는 도입될 수 있다.
상기 가이드핵산은 DNA, RNA 또는 이의 혼합의 형태로 대상 내에 전달 또는 도입될 수 있다.
상기 에디터단백질은 에디터단백질을 암호화하는 DNA, RNA, DNA/RNA 혼합, 펩타이드, 폴리펩타이드 또는 단백질의 형태로 대상 내에 전달 또는 도입될 수 있다.
상기 가이드핵산-에디터단백질 복합체는 각 구성성분, 즉, 가이드핵산 및 에디터단백질을 암호화하는 DNA, RNA 또는 이의 혼합의 형태로 대상 내에 전달 또는 도입될 수 있다.
상기 가이드핵산-에디터단백질 복합체는 DNA, RNA 또는 이의 혼합의 형태를 가지는 가이드핵산과 펩타이드, 폴리펩타이드 또는 단백질의 형태를 가지는 에디터단백질의 복합체로 대상 내에 전달 또는 도입될 수 있다.
가이드핵산-에디터단백질 복합체의 효율을 증가 또는 저해할 수 있는 추가 구성물을 대상으로의 도입 형태 및 방법
i) DNA, RNA 또는 이의 혼합의 형태로 전달
가이드핵산 및/또는 에디터단백질을 암호화하는 DNA, RNA 또는 이의 혼합의 형태는 당업계에 공지된 방법에 의해 대상 내로 전달 또는 도입될 수 있다.
또는, 가이드핵산 및/또는 에디터단백질을 암호화하는 DNA, RNA 또는 이의 혼합의 형태는 벡터, 비벡터 또는 이들의 조합에 의해 대상 내로 전달 또는 도입될 수 있다.
상기 벡터는 바이러스 또는 비바이러스 벡터(예를 들어, 플라스미드)일 수 있다.
상기 비벡터는 네이키드 DNA, DNA 복합체 또는 mRNA일 수 있다.
벡터 기반 도입
가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열은 벡터에 의해 대상 내로 전달 또는 도입될 수 있다.
벡터는 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열을 포함할 수 있다.
예를 들어, 상기 벡터는 가이드핵산과 에디터단백질을 암호화하는 핵산서열을 동시에 포함할 수 있다.
예를 들어, 상기 벡터는 가이드핵산 암호화하는 핵산서열을 포함할 수 있다.
일 예로, 상기 가이드핵산이 포함하는 도메인은 하나의 벡터에 모두 포함되거나 또는 각각의 도메인을 나누어 각각의 벡터에 포함시킬 수 있다.
예를 들어, 상기 벡터는 에디터단백질을 암호화하는 핵산서열을 포함할 수 있다.
일 예로, 상기 에디터단백질의 경우, 에디터단백질을 암호화하는 핵산서열을 하나의 벡터에 포함하거나 또는 에디터단백질을 암호화하는 핵산서열을 분할하여 여러 개의 벡터에 포함시킬 수 있다.
상기 벡터는 하나 이상의 조절/제어 구성요소를 포함할 수 있다.
이때, 상기 조절/제어 구성요소는 포로모터, 인핸서, 인트론, 폴리아데닐화 신호, 코작 공통(Kozak consensus) 서열, 내부 리보솜 유입 부위(internal ribosome entry site, IRES), 스플라이스 억셉터 및/또는 2A 서열을 포함할 수 있다.
상기 프로모터는 RNA 중합효소 II에 의해 인식되는 프로모터일 수 있다.
상기 프로모터는 RNA 중합효소 III에 의해 인식되는 프로모터일 수 있다.
상기 프로모터는 유도성 프로모터일 수 있다.
상기 프로모터는 대상 특이적 프로모터일 수 있다.
상기 프로모터는 바이러스 또는 비바이러스 프로모터일 수 있다.
상기 프로모터는 제어 영역(즉, 가이드핵산 또는 에디터단백질를 암호화하는 핵산서열)에 따라 적합한 프로모터를 이용할 수 있다.
예를 들어, 가이드핵산을 위해 유용한 프로모터는 H1, EF-1a, tRNA 또는 U6 프로모터일 수 있다. 예를 들어, 에디터단백질을 위해 유용한 프로모터는 CMV, EF-1a, EFS, MSCV, PGK 또는 CAG 프로모터일 수 있다.
벡터는 바이러스 벡터 또는 재조합 바이러스 벡터일 수 있다.
상기 바이러스는 DNA 바이러스 또는 RNA 바이러스일 수 있다.
이때, 상기 DNA 바이러스는 이중가닥 DNA(dsDNA) 바이러스 또는 단일가닥 DNA(ssDNA) 바이러스 일 수 있다.
이때, 상기 RNA 바이러스는 단일가닥 RNA(ssRNA) 바이러스일 수 있다.
상기 바이러스는 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스(AAV), 백시니아바이러스, 폭스바이러스 또는 단순포진 바이러스일 수 있으나, 이에 제한되지 않는다.
일반적으로 바이러스는 숙주(예를 들면, 세포)를 감염시켜, 숙주 내에 바이러스의 유전정보를 암호화하는 핵산을 도입시키거나 숙주의 게놈 내로 유전정보를 암호화하는 핵산을 삽입시킬 수 있다. 이러한 특징을 가지는 바이러스를 이용하여 대상 내로 가이드핵산 및/또는 에디터단백질을 도입시킬 수 있다. 바이러스를 이용하여 도입된 가이드핵산 및/또는 에디터단백질은 대상(예를 들면, 세포)에서 일시적으로 발현될 수 있다. 또는 바이러스를 이용하여 도입된 가이드핵산 및/또는 에디터단백질은 대상(예를 들면, 세포)에서 장기간(예를 들면, 1주, 2주, 3주, 1개월, 2개월, 3개월, 6개월, 9개월, 1년, 2년 또는 영구적) 지속적으로 발현될 수 있다.
바이러스의 패키징 능력은 적어도 2kb 내지 50kb로 바이러스 종류에 따라 다를 수 있다. 이러한 패키징 능력에 따라 가이드핵산 또는 에디터단백질을 단독으로 포함하는 바이러스 벡터를 설계하거나 가이드핵산 및 에디터단백질을 모두 포함하는 바이러스 벡터를 설계할 수 있다. 또는 가이드핵산, 에디터단백질 및 추가 구성요소를 포함하는 바이러스 벡터를 설계할 수 있다.
일 예로, 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열은 재조합 렌티바이러스에 의해 전달 또는 도입될 수 있다.
다른 일 예로, 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열은 재조합 아데노바이러스에 의해 전달 또는 도입될 수 있다.
또 다른 일 예로, 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열은 재조합 AAV에 의해 전달 또는 도입될 수 있다.
다른 일 예로, 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열은 혼성 바이러스, 예를 들어 본 명세서에 기재한 바이러스 중 하나 이상의 혼성체에 의해 전달 또는 도입될 수 있다.
비벡터 기반 도입
가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열은 비벡터로 대상 내로 전달 또는 도입될 수 있다.
비벡터는 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열을 포함할 수 있다.
상기 비벡터는 네이키드 DNA, DNA 복합체, mRNA 또는 이의 혼합일 수 있다.
상기 비벡터는 전기천공법, 유전자총, 초음파천공법, 자기주입법(magnetofection), 일시적인 세포 압축 또는 스퀴징(예를 들어, 문헌[Lee, et al, (2012) Nano Lett ., 12, 6322-6327]에 기재되어 있음), 지질-매개 형질감염, 덴드리머, 나노입자, 인산칼슘, 실리카, 실리케이트(오르모실) 또는 이의 조합에 의해 대상 내로 전달 또는 도입될 수 있다.
일 예로, 전기천공법을 통한 전달은 카트리지, 챔버 또는 큐벳 내에서 세포와 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열을 혼합하고, 정해진 지속시간 및 진폭의 전기적 자극을 적용에 의해 수행될 수 있다.
다른 일 예로, 나노입자를 이용하여 비벡터를 전달할 수 있다. 상기 나노입자는 무기 나노입자(예를 들면, 자기 나노입자, 실리카 등) 또는 유기 나노입자(예를 들면, 폴리에틸렌 글리콜(PEG)로 코팅된 지질 등)일 수 있다. 상기 나노입자의 외면은 부착을 가능하게 하는 양 전하로 하전된 중합체(예를 들면, 폴리에틸렌이민, 폴리리신, 폴리세린 등)와 컨쥬케이팅될 수 있다.
ii) 펩타이드, 폴리펩타이드 또는 단백질의 형태로 전달
에디터단백질은 펩타이드, 폴리펩타이드 또는 단백질의 형태는 당업계에 공지된 방법에 의해 대상 내로 전달 또는 도입될 수 있다.
상기 펩타이드, 폴리펩타이드 또는 단백질의 형태는 전기천공법, 미량주사법, 일시적인 세포 압축 또는 스퀴징(예를 들어, 문헌[Lee, et al, (2012) Nano Lett., 12, 6322-6327]에 기재되어 있음), 지질-매개 형질감염, 나노파티클, 리포솜, 펩타이드-매개 전달 또는 이의 조합에 의해 대상 내로 전달 또는 도입될 수 있다.
상기 펩타이드, 폴리펩타이드 또는 단백질의 전달은 가이드핵산을 암호화하는 핵산서열과 함께 전달될 수 있다.
일 예로, 전기천공법을 통한 전달은 카트리지, 챔버 또는 큐벳 내에서 가이드핵산와 함께 또는 가이드핵산 없이 에디터단백질을 도입시킬 세포와 혼합하고, 정해진 지속시간 및 진폭의 전기적 자극을 적용에 의해 수행될 수 있다.
iii) 핵산-단백질 혼합의 형태로 전달
가이드핵산 및 에디터단백질은 가이드핵산-에디터단백질 복합체의 형태로 대상 내로 전달 또는 도입될 수 있다.
예를 들어, 상기 가이드핵산은 DNA, RNA 또는 이의 혼합 형태일 수 있다. 상기 에디터단백질은 펩타이드, 폴리펩타이드 또는 단백질의 형태일 수 있다.
일 예로, 가이드핵산 및 에디터단백질은 RNA 형태의 가이드핵산과 단백질 형태의 에디터단백질이 가이드핵산-에디터단백질 복합체, 즉 ribonucleoprotein(RNP)의 형태로 대상 내로 전달 또는 도입될 수 있다.
본 발명에서 가이드핵산 및/또는 에디터단백질을 대상으로 전달하는 방법의 일 구체예로서, gRNA, CRISPR 효소 또는 gRNA-CRISPR 효소 복합체의 전달에 대해 하단에 기재하였다.
8. 형질전환체
“형질전환체”는 가이드핵산, 에디터단백질 또는 가이드핵산-에디터단백질 복합체가 도입된 유기체, 또는 가이드핵산, 에디터단백질 또는 가이드핵산-에디터단백질 복합체가 발현되는 유기체 또는 유기체로부터 획득한 검체 또는 시료를 의미한다.
상기 형질전환체는 가이드핵산, 에디터단백질 또는 가이드핵산-에디터단백질 복합체가 DNA, RNA 또는 이의 혼합의 형태로 도입된 유기체일 수 있다.
예를 들어, 상기 형질전환체는 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열 포함하는 벡터가 도입된 유기체일 수 있다. 이때, 벡터는 비바이러스 벡터, 바이러스 벡터 또는 재조합 바이러스 벡터일 수 있다.
다른 예로, 상기 형질전환체는 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열을 포함하는 비벡터 형태로 도입된 유기체일 수 있다. 이때, 비벡터는 네이키드 DNA, DNA 복합체, mRNA 또는 이의 혼합일 수 있다.
상기 형질전환체는 가이드핵산, 에디터단백질 또는 가이드핵산-에디터단백질 복합체가 펩타이드, 폴리펩타이드 또는 단백질의 형태로 도입된 유기체일 수 있다.
상기 형질전환체는 가이드핵산, 에디터단백질 또는 가이드핵산-에디터단백질 복합체가 DNA, RNA, 펩타이드, 폴리펩타이드, 단백질 또는 이의 혼합의 형태로 도입된 유기체일 수 있다.
예를 들어, 상기 형질전환체는 RNA 형태의 가이드핵산과 단백질 형태의 에디터단백질이 가이드핵산-에디터단백질 복합체를 이루어 도입된 유기체일 수 있다.
상기 형질전환체는 가이드핵산-에디터단백질 복합체의 표적 핵산, 유전자, 염색체 또는 단백질을 포함하는 유기체일 수 있다.
상기 유기체는 세포, 조직, 식물, 동물 또는 인간일 수 있다.
상기 세포는 원핵세포, 진핵세포일 수 있다.
상기 진핵세포는 식물세포, 동물세포, 인간세포일 수 있으나, 이에 제한하지 않는다.
상기 조직은 피부, 간, 신장, 심장, 폐, 뇌, 근육 등의 동물 또는 인간의 신체 조직일 수 있다.
상기 형질전환체는 가이드핵산, 에디터단백질 또는 가이드핵산-에디터단백질 복합체가 도입되거나 발현되는 유기체 또는 유기체로부터 획득한 검체 또는 시료일 수 있다.
상기 검체 또는 시료는 침, 혈액, 피부조직, 암세포 또는 줄기세포 일 수 있다.
또한, 일 구체예에서, 본 발명은 PD-1, CTLA-4, TNFAIP3, DGKA, DGKZ, Fas, EGR2, PPP2R2D, PSGL-1, KDM6A 및/또는 TET2 유전자의 타겟 부위에서의 핵산 변형을 위해 사용되는 가이드핵산-에디터단백질 복합체를 제공한다.
특히, 유전자로부터의 표적 부위와 상보적 결합을 할 수 있는 도메인을 포함하는 gRNA 분자, 예를 들어 단리된 또는 비천연 유래 gRNA 분자 및 이를 암호화하는 DNA를 제공할 수 있다. 상기 gRNA 및 이를 암호화하는 DNA 서열은 표 1의 타겟 부위 서열에 상보적으로 결합할 수 있도록 설계될 수 있다.
또한, gRNA 분자의 타겟 부위는 PD-1, CTLA-4, TNFAIP3, DGKA, DGKZ,Fas, EGR2, PPP2R2D, PSGL-1, KDM6A 및/또는 TET2에서, 면역 세포 표적 위치의 변경, 예를 들어 이중 가닥 파손 또는 단일 가닥 파손; 또는 표적 위치에 특정 기능을 가지는 제3의 면역조절요소를 제공하도록 구성된다.
또한, 2 개 이상의 gRNA가 표적 핵산에서 2 개 이상의 절단 사건, 예를 들어 이중 가닥 또는 단일 가닥 파손을 위치시키기 위해 사용될 때, 2 개 이상의 절단 사건이 동일 또는 상이한 Cas9 단백질에 의해 생성될 수 있다.
상기 gRNA 는 예를 들어,
PD-1, CTLA-4, TNFAIP3, DGKA, DGKZ,Fas, EGR2, PPP2R2D, PSGL-1, KDM6A , 및/또는 TET2에서 2이상의 유전자를 타겟으로 할 수 있고,
PD-1, CTLA-4, TNFAIP3, DGKA, DGKZ,Fas, EGR2, PPP2R2D, PSGL-1, KDM6A , 및/또는 TET2의 각각 유전자 내에서 2이상의 부위를 타겟으로 할 수 있고,
PD-1, CTLA-4, TNFAIP3, DGKA, DGKZ,Fas, EGR2, PPP2R2D, PSGL-1, KDM6A , 및/또는 TET2의 이중 가닥 및/또는 단일 가닥 절단을 독립적으로 유도할 수 있고
PD-1, CTLA-4, TNFAIP3, DGKA, DGKZ,Fas, EGR2, PPP2R2D, PSGL-1, KDM6A , 및/또는 TET2의 절단 부위에 하나 외부 유래 뉴클레오타이드의 삽입을 유도할 수도 있다.
또한, 본 발명의 다른 구체예로서 가이드핵산-에디터단백질 복합체를 구성하는 핵산은
(a) 본 명세서에 개시된 바와 같은 PD-1, CTLA-4, TNFAIP3, DGKA, DGKZ,Fas, EGR2, PPP2R2D, PSGL-1, KDM6A 및/또는 TET2 유전자에서 타겟 부위 서열에 상보성인 가이드 도메인을 포함하는 gRNA 분자를 암호화하는 서열; 및
(b) 에디터단백질을 암호화하는 서열을 포함할 수 있다.
이때, 상기 (a)는 타겟 부위에 따라 2 이상 존재할 수 있고, (b)는 동종 또는 2종 이상의 에디터단백질을 사용할 수 있다.
구현예에서, 핵산은 PD-1, CTLA-4, TNFAIP3, DGKA, DGKZ,Fas, EGR2, PPP2R2D, PSGL-1, KDM6A , 및/또는 TET2 유전자의 발현을 감소시키거나, 줄이거나 또는 억제하기 위해 면역 세포 넉다운 표적 위치에 충분히 가까운 효소적으로 불활성인 에디터단백질 또는 이의 융합단백질(예를 들어, 전사 리프레서 도메인 융합)을 표적화하도록 구성한다.
또한, 본 발명의 구체예로서 가이드핵산-에디터단백질 복합체에 의한 면역 세포-발현 유전자, 예를 들어 PD-1, CTLA-4, TNFAIP3, DGKA, DGKZ,Fas, EGR2, PPP2R2D, PSGL-1, KDM6A , 및/또는 TET2 유전자의 조작은 임의의 메커니즘에 의해 매개될 수 있다.
예시적인 메커니즘은, 비-상동성 말단-결합(NHEJ), 마이크로 상동성-매개 말단 결합(MMEJ), 상동성-관련 수선(HDR), SDSA(합성 의존적 가닥 어닐링), 단일 가닥 어닐링 또는 단일 가닥 침투를 포함하지만, 이들로 제한되지 않는다.
이 밖에도, 앞서 설명한 가이드핵산-에디터단백질 복합체의 구조, 기능, 활용의 모든 양태를 적용하여, PD-1, CTLA-4, TNFAIP3, DGKA, DGKZ,Fas, EGR2, PPP2R2D, PSGL-1, 및/또는 TET2 유전자의 조작에 사용할 수 있음은 자명할 것이다.
본 발명의 일 구체예는 상기 "가이드핵산-에디터단백질 복합체"를 이용하여 수득한 결과물인 면역 시스템 요소(immune system factor)는, 예를 들어 조작된 유전자, 이에 의해 발현되는 산물, 이들을 포함하는 세포, 조성물, 형질전환체 등일 수 있다.
구현예로서,
가이드핵산-에디터단백질 복합체에 의해 인위적으로 조작된 면역조절 유전자 또는 이의 발현 단백질; 및 이들을 포함하는 세포이다.
가이드핵산-에디터단백질 복합체에 의해 유전적으로 조작된 면역조절 유전자 또는 이의 발현 단백질; 및 이들을 포함하는 세포이다.
가이드핵산-에디터단백질 복합체에 의해 유전적으로 조작된 면역조절 유전자의 핵산 서열 또는 아미노산 서열이다.
가이드핵산-에디터단백질 복합체에 의해 유전적으로 조작된 면역조절 유전자, 이의 발현 단백질, 상기 조작된 면역조절요소 및/또는 단백질을 포함하는 세포, 상기 조작된 면역조절요소, 단백질, 및/또는 세포를 포함하는 조성물이다.
가이드핵산-에디터단백질 복합체에 의해 유전적으로 조작된 면역조절 유전자, 이의 발현 단백질, 상기 조작된 면역조절요소 및/또는 단백질을 포함하는 세포, 상기 조작된 면역조절요소, 단백질, 및/또는 세포를 포함하는 조성물 중 하나 이상의 도입으로 인해 형성되는 형질전환체이다.
상기 가이드핵산-에디터단백질 복합체를 이용하여 수득한 결과물인 면역 요소(immune factor)는 각 요소들을 독립적으로 2이상을 포함할 수 있고, 또한 각 요소별로 2이상을 포함할 수 있다.
예를 들어,
인위적으로 조작된 면역조절 유전자, 이의 발현 단백질; 및 이들을 포함하는 세포 중 2이상을 동시에 포함하는 형태로 제공될 수 있고,
인위적으로 조작된, 1종 또는 2종 이상의 면역조절 유전자를 동시에 제공할 수 있고,
인위적으로 조작된, 1종 또는 2종 이상의 면역조절 단백질을 동시에 제공할 수 있고,
인위적으로 조작된, 1종 또는 2종 이상의 면역 세포를 동시에 제공할 수 있고,
상기 인위적으로 조작된 면역 요소들의 2이상의 조합을 동시에 제공할 수 있다.
바람직한, "가이드핵산-에디터단백질 복합체"를 이용하여 수득한 결과물인 면역 시스템 요소(immune system factor)의 예는 하기와 같은 구성을 가질 수 있다.
일 구체예로, 면역조절요소가 유전자인 경우,
가이드핵산-에디터단백질 복합체에 의해 인위적으로 조작된 면역조절 유전자의 구성은,
상기 면역조절 유전자를 구성하는 핵산서열 내 PAM(proto-spacer-adjacent Motif) 서열 중 또는 이의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp, 1bp 내지 40bp, 1bp 내지 30bp, 바람직하게는 3bp 내지 25bp의 염기 서열 부위 내의
하나 이상의 뉴클레오타이드의 결실 또는 삽입;
야생형 유전자와 상이한 하나 이상의 뉴클레오타이드로의 치환;
외부 유래의 하나 이상의 뉴클레오타이드 삽입
중 하나 이상의 핵산의 변형을 포함할 수 있다.
또한, 상기 면역조절 유전자를 구성하는 핵산서열 내 하나 이상의 뉴클레오타이드의 화학적 변형을 포함할 수 있다.
이 때, '외부 유래 뉴클레오타이드'는 면역조절 유전자가 본래 가지고 있는 뉴클레오타이드가 아니라, 외부로부터 생성된, 예를 들어, 이종 생물 유래 또는 인위적으로 합성한 뉴클레오타이드를 모두 포함하는 개념이다. 50bp 이하의 작은 크기의 올리고뉴클레오타이드뿐만 아니라, 특정 기능을 가지는 단백질의 발현을 위한 큰 크기의 수백, 수천, 또는 수만 bp의 뉴클레오타이드도 포함한다. 이러한 '외부 유래 뉴클레오타이드'를 도너(donor)라 칭할 수 있다.
상기 화학적 변형은 메틸화, 아세틸화, 인산화, 유비퀴틴화, ADP-리보실화, 미리스틸화, 및 글리코실화 등을 포함하고, 예를 들어, 뉴클레오티드가 가지고 있는 작용기의 일부가 수소원자, 불소원자, -O-알킬기, -O-아실기, 및 아미노기 중 어느 하나로 치환되거나, 이에 제한되지 않는다. 또한, 핵산 분자의 전달능을 높이기 위해 -Br, -Cl, -R, -R'OR, -SH, -SR, -N3 및 -CN (R= alkyl, aryl, alkylene) 중 어느 하나로도 치환될 수 있다. 또한, 적어도 1개의 뉴클레오티드의 포스페이트 백본이 alkylphosphonate form, phosphoroamidate form 및 boranophosphate form 중 어느 하나로 치환될 수 있다. 또한, 상기 화학적 변형은 상기 핵산 분자에 포함되는 적어도 1종의 뉴클레오티드가 LNA (locked nucleic acid), UNA(unlocked nucleic acid), Morpholino, PNA (peptide nucleic acid) 중 어느 하나로 치환된 것임을 특징으로 할 수 있으며, 상기 화학적 변형은 상기 핵산 분자가 지질, 세포투과성 펩타이드(cell penetrating peptide) 및 세포 표적 리간드로 구성된 군에서 선택되는 하나 이상과 결합 되는 것을 특징으로 할 수 있다
목적하는 면역 시스템을 형성하기 위하여 가이드핵산-에디터단백질 복합체에 의해 인위적으로 면역조절 유전자를 구성하는 핵산에 변형을 가할 수 있다.
목적하는 면역 시스템을 형성할 수 있는, 면역조절 유전자의 핵산의 변형을 포함하는 부위를 표적 서열(target sequence)로 또는 표적 부위(target site)로 칭한다.
이러한 "표적 서열 (target sequence)"은 가이드핵산-에디터단백질 복합체의 타겟이 될 수 있고, 상기 표적 서열은 에디터단백질이 인식하는 PAM(protospacer-adjacent motif) 서열을 포함할 수 있으나, 이에 제한되지 않는다. 이러한 표적 서열은 실시자에게 가이드 핵산 설계 단계에 중요한 기준을 제공할 수 있다.
이러한 핵산의 변형은 핵산의 "절단(cleavage)를 포함한다.
타겟 부위의 "절단(cleavage)"은 폴리뉴클레오타이드의 공유결합(covalent backbone)의 파손(breakage)을 의미한다. 절단은 포스포다이에스터(phosphodiester) 결합의 효소적 또는 화학적 가수분해를 포함하나, 이에 제한되지 않으며, 이외의 다양한 여러 가지 방법들에 의하여 수행될 수 있다. 단일-가닥의 절단 및 이중-가닥의 절단 모두 가능하며, 이중-가닥의 절단은 두 개의 구별되는(distinct) 단일-가닥의 절단의 결과로서 발생할 수 있다. 이중 가닥의 절단은 blunt ends 또는 staggered end를 생성할 수 있다.
불활성화된 에디터단백질을 사용하는 경우, 상기 절단 프로세스 없이, 특정 기능을 보유하는 인자를 타겟 부위 또는 면역조절 유전자의 임의의 부위에 가깝게 위치할 수 있도록 유도할 수 있다. 이러한 특정 기능에 따라 면역조절 유전자의 핵산서열 내 하나 이상의 뉴클레오타이드의 화학적 변형을 포함할 수 있다.
일 구체예에서, 가이드핵산-에디터단백질 복합체에 의해 형성되는 핵산의 절단을 통해, 표적 및 비표적 활성에 의해 다양한 인델 (indel; insertion and deletion)이 발생할 수 있다.
"인델(indel)"은 DNA의 염기 배열에서 일부 염기가 중간에 삽입 (insertion) 되거나 결실 (deletion) 된 변이를 총칭한다.
인델은 상술한 바와 같이 가이드핵산-에디터단백질 복합체가 면역조절 유전자의 핵산(DNA, RNA)을 절단하는 경우, 상동재조합 (homologous recombination) 또는 비상동재접합 (non-homologous end-joining, NHEJ) 기작에 의해 수선되는 과정에서 표적 서열에 도입되는 것일 수 있다.
본 발명의 인위적으로 조작된 면역조절 유전자란, 이러한 핵산의 절단 및 인델, 도너의 삽입 등으로 본래 유전자의 핵산서열에 변형이 이루어진 것으로서, 목적하는 면역 시스템의 형성, 예를 들어 특정 면역 기능의 촉진 또는 억제 또는 보완 등의 효과를 발휘하는 데 기여한다.
예를 들어,
상기 인위적으로 조작된 면역조절 유전자에 의해 특정 단백질의 발현 및 활성을 촉진시킬 수 있다.
상기 인위적으로 조작된 면역조절 유전자에 의해 특정 단백질을 불활성화시킬 수 있다.
일 예로, 유전체(genome) 중 면역 반응을 하향조절(downregulation)하는 면역 조절 유전자들 예컨대, PD-1, CTLA-4, TNFAIP3, DGKA (Dgkα), DGKAZ (Dgkζ), Fas, EGR2, PPP2R2D, PSGL-1, 및/또는 TET2 유전자의 특정 타겟 부위를 절단하여 상기 유전자를 넉다운 또는 넉아웃시킬 수 있다.
다른 예로, 표적화된 넉다운은 전사를 변경하기 위해, 예를 들어 PD-1, CTLA-4, TNFAIP3, DGKA (Dgkα), DGKAZ (Dgkζ), Fas, EGR2, PPP2R2D, PSGL-1, KDM6A , 및/또는 TET2 유전자의 전사를 차단하거나, 저감시키거나 또는 감소시키기 위해 전사 리프레서 도메인 또는 염색질 변형 단백질에 융합된 효소적으로 불활성인 에디터단백질을 표적화함으로써 매개될 수 있다.
상기 인위적으로 조작된 면역조절 유전자에 의해 면역 세포의 활성을 조절할 수 있다. 면역세포의 증식률(proliferation), 생존률 (survival), 세포독성 (cytotoxicity), 세포 침윤(infiltration), 사이토카인 분비량 (cytokine-release) 등을 조절할 수 있다.
상기 인위적으로 조작된 면역조절 유전자에 의해 면역 기능, 항종양 기능, 항염 기능 등의 치료 효능을 수득할 수 있다.
가이드핵산-에디터단백질 복합체의 구성적 특징에 따라, 면역조절 유전자의 타겟 부위가 포함하는 주요 PAM 서열이 상이할 수 있다.
이하, 대표적인 에디터단백질 예들 및 면역조절 유전자를 중심으로 기술하지만, 이는 특정 예시에 지나지 않고 이러한 내용으로 본 발명이 제한되지는 않는다.
예를 들어, 에디터단백질이 스트렙토코커스 피요게네스 (Streptococcus pyogenes) 유래의 Cas9 단백질인 경우, 상기 PAM 서열은 5'-NGG-3' (N은 A,T, G, 또는 C임)이고, 상기 절단되는 염기서열 부위(타겟 부위)는 타겟 유전자 내의 5'-NGG-3' 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 25bp, 예컨대 17bp 내지 23bp 또는 21bp 내지 23bp의 염기서열 부위일 수 있다.
면역조절 유전자 내의
a) 'NGG' (N은 A, T, C 또는 G임) 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 25bp, 예컨대 17bp 내지 23bp의 염기 서열 부위 내의 하나 이상의 뉴클레오타이드의 결실
b) 'NGG' 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 25bp, 예컨대 17bp 내지 23bp의 염기 서열 부위 내의 하나 이상의 뉴클레오타이드의 야생형 유전자와 상이한 뉴클레오타이드로의 치환,
c) 'NGG' 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 25bp, 예컨대 17bp 내지 23bp의 염기 서열 부위 내로의 하나 이상의 뉴클레오타이드의 삽입, 또는
d) 상기 a) 내지 c) 중에서 선택된 2 가지 이상의 조합
에 의한 것인, 인위적으로 조작된 면역조절 유전자, 예를 들어, 인위적으로 조작된 PD-1 유전자, CTLA-4 유전자, TNFAIP3 유전자, DGKA 유전자, DGKZ 유전자,Fas 유전자, EGR2 유전자, PPP2R2D 유전자, PSGL-1 유전자, KDM6A 유전자, 및 TET2 유전자를 제공할 수 있다.
예를 들어, 에디터단백질이 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질인 경우, 상기 PAM 서열은 5'-NNNNRYAC-3'(N은 각각 독립적으로 A, T, C 또는 G이고, R은 A또는 G이고, Y는 C 또는 T임)이고, 상기 절단되는 염기서열 부위(타겟 부위)는 타겟 유전자 내의 5'-NNNNRYAC-3' 서열의5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 25bp, 예컨대 17bp 내지 23bp 또는 21bp 내지 23bp의 염기서열 부위일 수 있다.
면역조절 유전자 내의
a') 'NNNNRYAC'(N은 각각 독립적으로 A, T, C 또는 G이고, R은 A또는 G이고, Y는 C 또는 T임) 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 25bp, 예컨대 17bp 내지 23bp의 염기 서열 부위 내의 하나 이상의 뉴클레오타이드의 결실
b') 'NNNNRYAC' 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 25bp, 예컨대 17bp 내지 23bp의 염기 서열 부위 내의 하나 이상의 뉴클레오타이드의 야생형유전자와 상이한 뉴클레오타이드로의 치환,
c') 'NNNNRYAC' 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 25bp, 예컨대 17bp 내지 23bp의 염기 서열 부위 내로의 하나 이상의 뉴클레오타이드의 삽입, 또는
d') 상기 a') 내지 c') 중에서 선택된 2 가지 이상의 조합
에 의한 것인, 인위적으로 조작된 면역조절 유전자, 예를 들어, 인위적으로 조작된 PD-1 유전자, CTLA-4 유전자, TNFAIP3 유전자, DGKA 유전자, DGKZ 유전자,Fas 유전자, EGR2 유전자, PPP2R2D 유전자, PSGL-1 유전자, KDM6A 유전자, 및 TET2 유전자를 제공할 수 있다.
예를 들어, 에디터단백질이 스트렙토코커스 써모필러스 (Streptococcus thermophilus) 유래의 Cas9 단백질인 경우, 상기 PAM 서열은 5'-NNAGAAW-3'(N은 각각 독립적으로 A, T, C 또는 G이고, W는 A 또는 T임)이고, 상기 절단되는 염기서열 부위(타겟 부위)는 타겟 유전자 내의 5'-NNAGAAW-3' 서열의 5' 말단 또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 25bp, 예컨대 17bp 내지 23bp 또는 21bp 내지 23bp의 염기서열 부위일 수 있다.
면역조절 유전자 내의
a'') 'NNAGAAW'(N은 각각 독립적으로 A, T, C 또는 G이고, W는 A 또는 T임)서열의 5' 말단에 인접하여 위치하는 연속하는 1bp 내지 25bp, 예컨대 17bp 내지 23bp의 염기 서열 부위 내의 하나 이상의 뉴클레오타이드의 결실
b'') 'NNAGAAW' 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 25bp, 예컨대 17bp 내지 23bp의 염기 서열 부위 내의 하나 이상의 뉴클레오타이드의 야생형 유전자와 상이한 뉴클레오타이드로의 치환,
c'') 'NNAGAAW' 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 25bp, 예컨대 17bp 내지 23bp의 염기 서열 부위 내로의 하나 이상의 뉴클레오타이드의 삽입, 또는
d'') 상기 a'') 내지 c'') 중에서 선택된 2 가지 이상의 조합
에 의한 것인, 인위적으로 조작된 면역조절 유전자, 예를 들어, 인위적으로 조작된 PD-1 유전자, CTLA-4 유전자, TNFAIP3 유전자, DGKA 유전자, DGKZ 유전자,Fas 유전자, EGR2 유전자, PPP2R2D 유전자, PSGL-1 유전자, KDM6A 유전자, 및 TET2 유전자를 제공할 수 있다.
예를 들어, 에디터단백질이 네이세리아 메닝기디티스 (Neisseria meningitidis) 유래의 Cas9 단백질인 경우, 상기 PAM 서열은 5'-NNNNGATT-3'(N은 각각 독립적으로 A, T, C 또는 G임)이고, 상기 절단되는 염기서열 부위(타겟 부위)는 타겟 유전자 내의 5'-NNNNGATT-3' 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 25bp, 예컨대 17bp 내지 23bp 또는 21bp 내지 23bp의 염기서열 부위일 수 있다.
면역조절 유전자 내의
a''') 'NNNNGATT'(N은 각각 독립적으로 A, T, C 또는 G임) 서열의 5' 말단및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 25bp, 예컨대 17bp 내지 23bp의 염기 서열 부위 내의 하나 이상의 뉴클레오타이드의 결실
b''') 'NNNNGATT' 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 25bp, 예컨대 17bp 내지 23bp의 염기 서열 부위 내의 하나 이상의 뉴클레오타이드의 야생형 유전자와 상이한 뉴클레오타이드로의 치환,
c''') 'NNNNGATT' 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 25bp, 예컨대 17bp 내지 23bp의 염기 서열 부위 내로의 하나 이상의 뉴클레오타이드의 삽입, 또는
d''') 상기 a''') 내지 c''') 중에서 선택된 2 가지 이상의 조합
에 의한 것인 인위적으로 조작된 면역조절 유전자, 예를 들어, 인위적으로 조작된 PD-1 유전자, CTLA-4 유전자, TNFAIP3 유전자, DGKA 유전자, DGKZ 유전자,Fas 유전자, EGR2 유전자, PPP2R2D 유전자, PSGL-1 유전자, KDM6A 유전자, 및 TET2 유전자를 제공할 수 있다.
예를 들어, 에디터단백질이 스트렙토코커스 아우레우스(Streptococcus aureus) 유래의 Cas9 단백질인 경우, 상기 PAM 서열은 5'-NNGRR(T)-3'(N은 각각 독립적으로 A, T, C 또는 G이고, R은 A또는 G이고, (T)는 임의로 포함가능한 서열을 의미함)이고, 상기 절단되는 염기서열 부위(타겟 부위)는 타겟 유전자 내의 5'-NNGRR(T)-3' 서열의 5' 말단 또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 25bp, 예컨대 17bp 내지 23bp 또는 21bp 내지 23bp의 염기서열 부위일 수 있다.
면역조절 유전자 내의
a'''') 5'-NNGRR(T)-3' (N은 각각 독립적으로 A, T, C 또는 G이고, R은 A또
는 G이고, Y는 C 또는 T임) 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 25bp, 예컨대 17bp 내지 23bp의 염기 서열 부위 (타겟 부위) 내의 하나 이상의 뉴클레오타이드의 결실
b'''') 5'-NNGRR(T)-3' 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하
는 연속하는 1bp 내지 25bp, 예컨대 17bp 내지 23bp의 염기 서열 부위 (타겟 부위) 내의 하나 이상의 뉴클레오타이드의 야생형 유전자와 상이한 뉴클레오타이드로의 치환,
c'''') 5'-NNGRR(T)-3' 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 25bp, 예컨대 17bp 내지 23bp의 염기 서열 부위 (타겟 부위) 내로의 하나 이상의 뉴클레오타이드의 삽입, 또는
d'''') 상기 a'''') 내지 c'''') 중에서 선택된 2 가지 이상의 조합
에 의한 것인, 인위적으로 조작된 면역조절 유전자, 예를 들어, 인위적으로 조작된 PD-1 유전자, CTLA-4 유전자, TNFAIP3 유전자, DGKA 유전자, DGKZ 유전자,Fas 유전자, EGR2 유전자, PPP2R2D 유전자, PSGL-1 유전자, KDM6A 유전자, 및 TET2 유전자를 제공할 수 있다.
예를 들어, 에디터단백질이 Cpf1 단백질이 사용되는 경우,
상기 PAM 서열은 5'-TTN-3'(N은 A, T, C 또는 G임)이고, 상기 절단되는 염기서열 부위(타겟 부위)는 타겟 유전자 내의 5'-TTN-3' 서열의 5' 말단 또는 3' 말단에 인접하여 위치하는 연속하는 10bp 내지 30bp, 예컨대, 15bp 내지 26bp, 17bp 내지 30bp, 또는 17bp 내지 26bp의 염기서열 부위일 수 있다.
상기 Cpf1 단백질은 Parcubacteria bacterium (GWC2011_GWC2_44_17), Lachnospiraceae bacterium (MC2017), Butyrivibrio proteoclasiicus, Peregrinibacteria bacterium (GW2011_GWA_33_10), Acidaminococcus sp. (BV3L6), Porphyromonas macacae, Lachnospiraceae bacterium (ND2006), Porphyromonas crevioricanis, Prevotella disiens, Moraxella bovoculi(237), Smiihella sp. (SC_KO8D17), Leptospira inadai, Lachnospiraceae bacterium (MA2020), Francisella novicida (U112), Candidatus Methanoplasma termitum, Eubacterium eligens 등의 미생물 유래의 것일 수 있으며, 예컨대, Parcubacteria bacterium (GWC2011_GWC2_44_17), Peregrinibacteria bacterium (GW2011_GWA_33_10), Acidaminococcus sp. (BV3L6), Porphyromonas macacae, Lachnospiraceae bacterium (ND2006), Porphyromonas crevioricanis, Prevotella disiens, Moraxella bovoculi (237), Leptospira inadai, Lachnospiraceae bacterium (MA2020), Francisella novicida (U112), Candidatus Methanoplasma termitum, 또는 Eubacterium eligens 유래의 것일 수 있으나, 이에 제한되는 것은 아니다.
면역조절 유전자 내의
a''''') 5'-TTN-3'(N은 A, T, C 또는 G임) 서열의 5' 말단 및/또는 3' 말단
에 인접하여 위치하는 연속하는 10bp 내지 30bp, 예컨대, 15bp 내지 26bp의 염기 서열 부위 (타겟 부위) 내의 하나 이상의 뉴클레오타이드의 결실
b''''') 5'-TTN-3' 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연
속하는 10bp 내지 30bp, 예컨대, 15bp 내지 26bp의 염기 서열 부위 (타겟 부위) 내의 하나 이상의 뉴클레오타이드의 야생형 유전자와 상이한 뉴클레오타이드로의 치환,
c''''') 5'-TTN-3' 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연
속하는 10bp 내지 30bp, 예컨대, 15bp 내지 26bp의 염기 서열 부위 (타겟 부위) 내로의 하나 이상의 뉴클레오타이드의 삽입, 또는
d''''') 상기 a''''') 내지 c''''') 중에서 선택된 2 가지 이상의 조합
에 의한 것인, 인위적으로 조작된 면역조절 유전자, 예를 들어, 인위적으로 조작된 PD-1 유전자, CTLA-4 유전자, TNFAIP3 유전자, DGKA 유전자, DGKZ 유전자,Fas 유전자, EGR2 유전자, PPP2R2D 유전자, PSGL-1 유전자, KDM6A 유전자, 및 TET2 유전자를 제공할 수 있다.
다른 구체예로 , 면역조절요소가 단백질인 경우 ,
상기 인위적으로 조작된 단백질은 가이드핵산-에디터단백질 복합체의 직간접 작용에 의해 형성되는 새로운 또는 변경된 면역 반응에 관여하는 모든 단백질을 포함한다.
예를 들어, 가이드핵산-에디터단백질 복합체에 의해 인위적으로 조작된 면역조절 유전자에 의해 발현된 단백질 또는 이러한 단백질 활성에 의해 영향을 받아 증가되거나 감소된 타 단백질일 수 있지만, 이에 제한되지 않는다.
상기 인위적으로 조작된 면역조절 단백질은 상기 인위적으로 조작된 면역조절 유전자의 구성과 상응하는 아미노산 구성 및 활성을 가질 수 있다, 일 구체예서:
(i) 발현 특성이 변화된, 인위적으로 조작된 단백질을 제공할 수 있다.
예를 들어, 면역조절 유전자 핵산서열 내 PAM(proto-spacer-adjacent Motif) 서열 중 또는 이의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp, 1bp 내지 40bp, 1bp 내지 30bp, 바람직하게는 3bp 내지 25bp의 염기 서열 부위 내의
하나 이상의 뉴클레오타이드의 결실 또는 삽입에 따른 발현량 감소 또는 증가;
야생형 유전자와 상이한 하나 이상의 뉴클레오타이드로의 치환에 따른 발현량 감소 또는 증가; ;
외부 유래의 하나 이상의 뉴클레오타이드 삽입에 따른 발현량 감소 또는 증가, 또는 융합 단백질의 발현 또는 특정 단백질의 독립적인 발현;
상기 설명한 단백질들의 발현 특성에 영향을 받는 제3의 단백질의 발현량 감소 또는 증가;
중 하나 이상의 특징을 가지는 단백질의 변형을 포함할 수 있다.
(ii) 구조 특성이 변화된, 인위적으로 조작된 단백질을 제공할 수 있다.
예를 들어, 면역조절 유전자 핵산서열 내 PAM(proto-spacer-adjacent Motif) 서열 중 또는 이의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp, 1bp 내지 40bp, 1bp 내지 30bp, 바람직하게는 3bp 내지 25bp의 염기 서열 부위 내의
하나 이상의 뉴클레오타이드의 결실 또는 삽입에 따른 코돈 변경, 아미노산의 변경, 및 3차원 구조의 변경;
야생형 유전자와 상이한 하나 이상의 뉴클레오타이드로의 치환에 따른 코돈 변경, 아미노산의 변경, 이에 따른 3차원 구조의 변경;
외부 유래의 하나 이상의 뉴클레오타이드 삽입에 따른 코돈 변경, 아미노산의 변경 및 3차원 구조의 변경, 또는 특정 단백질과의 융합 구조 또는 특정 단백질이 분리되는 독립적 구조;
상기 설명한 구조특성이 변화된 단백질의 영향을 받는 제3의 단백질의 코돈 변경, 아미노산의 변경, 및 3차원 구조의 변경;
중 하나 이상의 특징을 가지는 단백질의 변형을 포함할 수 있다.
(iii) 면역 기능 특성이 변화된, 인위적으로 조작된 단백질을 제공할 수 있다.
예를 들어, 면역조절 유전자 핵산서열 내 PAM(proto-spacer-adjacent Motif) 서열 중 또는 이의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp, 1bp 내지 40bp, 1bp 내지 30bp, 바람직하게는 3bp 내지 25bp의 염기 서열 부위 내의
하나 이상의 뉴클레오타이드의 결실 또는 삽입에 기인하는 단백질 변형에 의해 특정 면역 기능의 활성화 또는 불활성화 또는 새로운 면역 기능의 도입;
야생형 유전자와 상이한 하나 이상의 뉴클레오타이드로의 치환에 기인하는 단백질 변형에 의해 특정 면역 기능의 활성화 또는 불활성화 또는 새로운 면역 기능의 도입;
외부 유래의 하나 이상의 뉴클레오타이드 삽입에 기인하는 단백질 변형에 의해 특정 면역 기능의 활성화 또는 불활성화 또는 새로운 면역 기능의 도입, 특히 특정 단백질의 융합 발현 또는 독립적 발현으로 기존 면역 기능에 제3의 기능을 도입할 수 있음;
상기 설명한 면역 기능 특성이 변화된 단백질의 영향을 받는 제3의 단백질의 기능 변경;
중 하나 이상의 특징을 가지는 단백질의 변형을 포함할 수 있다.
또한, 면역조절 유전자를 구성하는 핵산서열 내 하나 이상의 뉴클레오타이드의 화학적 변형에 의한 인위적으로 조작된 단백질을 포함할 수 있다.
예를 들어, 메틸화, 아세틸화, 인산화, 유비퀴틴화, ADP-리보실화, 미리스틸화, 및 글리코실화에 의한 단백질의 발현 특성, 구조 특성 및 면역 기능 특성 중 1이상의 특성이 변경될 수 있다.
예를 들어, 뉴클레오타이드의 화학적 변형에 의해 제3의 단백질이 유전자의 핵산 서열 내 결합함으로써 제3의 구조 및 기능을 부여할 수 있다.
다른 구체예로, "가이드핵산-에디터단백질 복합체"를 이용하여 수득한 결과물인 면역 시스템 요소(immune system factor)로서, 인위적으로 조작된 세포를 제공한다.
상기 인위적으로 조작된 세포는
가이드핵산-에디터단백질 복합체에 의해 인위적으로 조작된 면역조절 유전자; 및
가이드핵산-에디터단백질 복합체의 직간접 작용에 의해 형성되는 새로운 또는 변경된 면역 반응에 관여하는 단백질
중 하나 이상을 포함하는 세포일 수 있다. 구체예로서 면역 세포 또는 줄기세포일 수 있다.
이러한 세포는 상기 설명하는 인위적으로 조작된 면역조절 유전자 및/또는 단백질이 나타내는 면역 기능 및 이에 따라 파생되는 세포 내 메커니즘에 관여하는 기능을 보유한다.
다른 구체예로, "가이드핵산-에디터단백질 복합체"를 이용하여 수득한 결과물인 면역 시스템 요소(immune system factor)로서, 목적하는 면역 반응을 야기하는 조성물을 제공한다. 약학적 조성물 또는 치료용 조성물로 칭할 수 있다.
상기 목적하는 면역 반응을 야기하는 조성물은
가이드핵산-에디터단백질 복합체에 의해 인위적으로 조작된 면역조절 유전자;
가이드핵산-에디터단백질 복합체의 직간접 작용에 의해 형성되는 새로운 또는 변경된 면역 반응에 관여하는 단백질; 및
상기 면역조절 유전자 및/또는 단백질을 포함하는 세포
중 하나 이상을 유효성분으로 포함할 수 있다.
이러한 조성물은 상기 설명하는 인위적으로 조작된 면역조절 유전자, 단백질및/또는 세포가 나타내는 면역 기능 및 이에 따라 파생되는 체내 다양한 메커니즘에 관여하는 기능을 보유한다.
상기 조성물, 예컨대 세포 치료제는 면역 관련 질환, 예컨대, 암의 예방 및/또는 치료에 사용될 수 있다.
[제조 방법]
본 발명의 일 구체예로서, 인위적으로 조작된 면역조절요소 및 이를 포함하는 면역세포를 제조하는 방법을 제공한다.
인위적으로 조작된 면역조절요소에 관한 설명은 앞서 기재한 설명을 참조할 수 있다. 이하, 조작된 면역세포의 대표적인 예시 중심으로 상기 방법을 설명한다.
- 세포의 배양
조작면역세포를 생산하기 위해서는 먼저 건강한 공여자로부터 세포를 채취하여 배양한다. 예를 들어, T세포, NK 세포, NKT세포 등의 면역세포를 공지의 방법을 이용하여 공여자로부터 채취하여 적절한 세포 배양 배지에서 배양한다.
이후 설명하는 바와 같이, 배양한 면역세포가 발현하는 면역조절요소 중 일부를 선택하여 인위적으로 조작한다. 예를 들어, PD-1, CTLA-4, TNFAIP3, DGKA (Dgkα), DGKAZ (Dgkζ), Fas, EGR2, PPP2R2D, PSGL-1, 및/또는 TET2를 유전적으로 조작한다. 유전적 조작에 관한 구체적 설명은 앞서 기술한 바를 참조한다.
또는 면역세포를 형질전환한 뒤 배양하여 조작면역세포를 생산하게 된다.
- 기능조작형 면역세포의 생산방법
기능조작형 면역세포는 면역조절요소 단백질을 삽입하거나 제거하여 생산할 수 있다.
기능조작형 면역세포는 면역조절요소인 유전자를 변형하여 생산할 수 있다.
기능조작형 면역세포는 야생수용체 혹은 면역조절 유전자를 넉다운(knock-down, KD) 또는 넉아웃(knock-out, KO)하여 생산할 수 있다. 넉다운 또는 넉아웃은 목적유전자의 절단, DNA의 전사 저해제, 상보적인 microRNA 등의 RNA 해독 저해제 등을 통해 유전자의 발현을 억제하는 것을 의미한다.
넉다운 또는 넉아웃은 microRNA를 통해 이루어질 수 있다.
넉다운 또는 넉아웃은 바람직하게는 본 발명의 가이드핵산-에디터단백질 복합체에 의해 이루어진다.
넉다운 또는 넉아웃은 유전자가위를 사용한 NHEJ를 통해 이루어질 수 있다.
넉다운 또는 넉아웃은 유전자가위와 주형 뉴클레오타이드를 사용한 HR을 통해 이루어질 수 있다.
일 예로, PD-1, CTLA-4, TNFAIP3, DGKA (Dgkα), DGKAZ (Dgkζ), Fas, EGR2, PPP2R2D, PSGL-1, 및/또는 TET2 유전자의 특정 타겟 부위를 절단하여 넉다운 또는 넉아웃시킬 수 있다.
기능조작형 면역세포는 타겟 부위의 변형을 포함할 수 있는데,
유전자의 암호 영역에 매우 근접한 또는 암호 영역 내의 하나 이상의 뉴클레오타이드의 삽입 또는 결실(예를 들어, NHEJ-매개 삽입 또는 결실),
유전자의 적어도 일부를 포함하는 게놈 서열의 결실(예를 들어, NHEJ-매개 결실),
유전자의 비-암호 영역, 예를 들어 프로모터 영역을 표적화함으로써 효소적으로 불활성인 에디터 단백질에 의해 매개되는 유전자의 넉다운 또는 넉아웃의 변형을 예로 들 수 있다.
또한, 기능조작형 면역세포는 야생수용체 혹은 면역조절 유전자를 형질도입(transfection)하여 생산할 수 있다.
형질도입 방법은 목적유전자를 포함한 에피좀의 삽입 또는 게놈에 융합되는 방법을 포함한다.
형질도입은 에피좀을 삽입하여 이루어질 수 있다. 에피좀 벡터는 진핵생물의 핵에서 게놈 외의 외인성 유전자로 작용하면서 게놈에는 융합되지 않는 벡터를 말한다. 이때, 에피좀은 플라스미드일 수 있다.
형질도입은 가이드핵산-에디터단백질 복합체 및 주형 뉴클레오타이드를 사용한 HR을 통해 이루어질 수 있다.
또한, 기능조작형 면역세포는 야생수용체 혹은 면역조절 유전자를 넉아웃하면서 동시에 다른 야생수용체 혹은 면역조절 유전자를 형질도입하여 생산할 수 있다. 형질도입 방법은 목적유전자를 포함한 에피좀의 삽입 또는 게놈에 융합되는 방법을 포함한다.
이때, 형질도입되는 유전자는 넉아웃되는 유전자의 위치에 융합될 수 있다.
형질도입은 에피좀을 삽입하여 이루어질 수 있다.
형질도입은 가이드핵산-에디터단백질 복합체 및 주형 뉴클레오타이드를 사용한 HR을 통해 이루어질 수 있다.
- 인공구조부가형 면역세포의 생산방법
인공구조부가형 면역세포는 인공구조를 단백질의 형태로 면역세포에 직접 부가하여 생산할 수 있다.
인공구조부가형 면역세포는 인공구조를 코딩하는 유전자를 형질도입하여 생산할 수 있다.
형질도입 방법은 목적유전자를 포함한 에피좀의 삽입 또는 게놈에 융합되는 방법을 포함한다.
형질도입은 에피좀을 삽입하여 이루어질 수 있다.
형질도입은 가이드핵산-에디터단백질 복합체 및 주형 뉴클레오타이드를 사용한 HR을 통해 이루어질 수 있다
구현예에서, 면역세포에 가이드핵산 및 에디터단백질를 도입(형질도입)시키는 단계를 포함하는, 면역세포에서의 하나 이상의 면역 조절 유전자의 불활성화 방법을 제공한다.
구현예에서, 면역세포에 가이드핵산 및 에디터단백질를 도입(형질도입)시키는 단계를 포함하는 형질전환 면역세포의 제조 방법을 제공한다
- 복합조작형 면역세포의 생산방법
복합조작형 면역세포는 상기 기능조작형 면역세포의 생산방법 및 인공구조부가형 면역세포의 생산방법에서 설명된 단백질 및 유전자의 조작 방법에 의하여 만들어질 수 있다.
복합조작형 면역세포의 생산방법은 야생수용체 또는 면역조절요소를 넉아웃 또는 형질도입하는 단계를 포함한다. 이 단계는 상기 기능조작형 면역세포의 생산방법에서 설명된 방법에 따라 이루어질 수 있다.
복합조작형 면역세포의 생산방법은 인공구조를 형질도입하는 단계를 포함한다. 이 단계는 상기 인공구조부가형 면역세포의 생산방법에서 설명된 방법에 따라 이루어질 수 있다.
복합조작형 면역세포의 생산방법의 바람직한 일 양태는 면역세포의 야생수용체를 넉아웃하면서 동시에 인공구조를 형질도입하는 것이다.
일 예로, 면역세포의 PD-1, CTLA-4를 넉아웃하면서 동시에 인공구조를 형질도입하는 것이다.
다른 예로, 면역세포의 TNFAIP3(A20), DGK-alpha, DGK-zeta, Fas, EGR2, PPP2R2D, PSGL-1, KDM6A 및/또는 TET2를 넉아웃하면서 인공구조를 형질도입하는 것이다.
이때, 형질도입되는 유전자는 넉아웃되는 유전자와 같은 위치에 융합될 수 있다.
상기 설명한 조작된 면역세포를 생산하기 위해 공지의 방법을 이용할 수 있고, 예를 들어, 일반적으로 재조합 벡터를 이용할 수 있다.
- 면역세포 재조합 발현벡터
"발현목적염기서열(expression target sequence)"은 목적 세포의 단백질 또는 유전자를 변형하기 위한 수단, 또는 새로이 발현하고자 하는 유전자를 암호화하는 염기서열을 의미한다. 본 발명의 일 구체예에서는 상기 발현목적 염기서열은 가이드핵산 및 에디터단백질을 코딩하는 서열 및 이들 발현을 위한 부가적인 서열을 포함할 수 있다.
"재조합 벡터(recombinant vector)"는 발현목적염기서열을 목적 세포로 전달하는 기능을 하는 전달체로서, 예를 들어 플라스미드, 에피좀 벡터, 바이러스 벡터 등을 포함한다.
"재조합 발현벡터(recombinant expression vector)"는 재조합 벡터의 일 구체예로서, 재조합 벡터에 연결된 발현목적염기서열이 목적 세포 내에서 발현되는 기능까지 나타내는, 인위적으로 작제된 벡터를 의미한다.
면역세포 재조합 발현벡터는 재조합 발현벡터로서, 면역세포를 조작면역세포로 발현시키기 위하여 면역세포의 단백질 또는 유전자를 변형하기 위한 수단, 또는 새로이 발현하고자 하는 유전자를 암호화하는 재조합 발현벡터이다.
면역세포 재조합 발현벡터는 위에서 설명한 가이드핵산-에디터단백질 복합체 발현하기 위한 재조합 발현벡터를 포함한다.
구현예에서,
조작된 면역세포는 면역세포를 한 종류의 면역세포 재조합 발현벡터로 형질전환하는 것만으로 수득될 수 있다.
조작면역세포는 면역세포를 두 종류 이상의 면역세포 재조합 발현벡터로 형질전환하는 것으로 수득될 수 있다.
면역세포 재조합 발현벡터는 최종적으로 발현해야 하는 염기서열의 크기에 따라 적절한 갯수의 재조합 발현벡터로 분할하여 설계될 수 있다.
(기능조작형 재조합발현벡터)
일 구체예로서 기능조작형 면역세포를 제조하기 위한 재조합발현벡터를 제공한다.
구현예에서, 기능조작형 재조합발현벡터는 야생수용체 또는 면역조절요소 유전자를 넉아웃하기 위한 재조합염기서열을 포함한다.
유전자를 넉아웃하기 위한 재조합 발현벡터는 위에서 설명한 가이드핵산-에디터단백질 복합체를 발현하기 위한 재조합 발현벡터를 포함한다. 이때, gRNA의 표적서열은 야생수용체 또는 면역조절요소의 염기서열과 상보성을 가질 수 있다. 또한, 재조합 발현벡터는 필요에 따라 가이드핵산-에디터단백질 복합체에 의해 절단된 위치에 삽입하기 위한 주형뉴클레오타이드를 포함할 수 있다.
구현예에서, 기능조작형 재조합발현벡터는 야생수용체 또는 면역조절요소 유전자를 형질도입하기 위한 재조합염기서열을 포함한다.
이 때, 기능조작형 재조합발현벡터는 에피좀 벡터일 수 있다. 상기 에피좀 벡터는 유전자의 발현을 위한 프로모터를 포함할 수 있다.
구현예에서, 기능조작형 재조합발현벡터는 생체의 게놈에 융합되기 위한 기능을 가진 것일 수 있다. 이때, 기능조작형 재조합발현벡터는 바이러스 벡터일 수 있다. 이때, 바람직한 바이러스 벡터는 아데노 계열바이러스 벡터일 수 있다.
구현예에서, 기능조작형 재조합발현벡터는 삽입목적위치와 상동성이 있는 염기서열을 포함할 수 있다. HR 과정에서 삽입하기 위한 주형 뉴클레오타이드일 수 있다. 상기 주형뉴클레오타이드는 가이드핵산-에디터단백질 복합체에 의해 절단되는 부위의 서열과 상동성이 있을 수 있다.
구현예에서, 기능조작형 재조합발현벡터는 위에서 설명한 가이드핵산-에디터단백질 복합체를 발현하기 위한 서열을 동일 벡터에 또는 상이한 벡터에 독립적으로 포함시킬 수 있다.
또 다른 양태에서, 기능조작형 재조합발현벡터는 야생수용체 또는 면역조절요소 유전자를 넉아웃하고 다른 야생수용체 또는 면역조절요소 유전자를 형질도입하기 위한 재조합염기서열을 포함한다.
유전자를 넉아웃하기 위한 재조합염기서열은 위에서 설명한 가이드핵산-에디터단백질 복합체를 발현하기 위한 재조합발현벡터의 염기서열을 포함한다. 이때, gRNA의 표적서열은 면역조절요소의 염기서열과 상보성을 가질 수 있다.
형질도입을 위한 재조합발현벡터는 에피좀 벡터일 수 있다. 이때, 에피좀 벡터는 유전자의 발현을 위한 프로모터를 포함할 수 있다.
형질도입을 위한 재조합발현벡터는 생체의 게놈에 융합되기 위한 기능을 가진 것일 수 있다.
형질도입을 위한 재조합발현벡터는 바이러스 벡터일 수 있다. 이때, 바람직한 바이러스 벡터는 아데노계열바이러스 벡터이다.
형질도입을 위한 재조합발현벡터는 삽입목적위치와 상동성이 있는 염기서열을 포함할 수 있다. HR 과정에서 삽입하기 위한 주형 뉴클레오타이드일 수 있다. 상기 주형뉴클레오타이드는 가이드핵산-에디터단백질 복합체에 의해 절단되는 부위의 서열과 상동성이 있을 수 있다.
또한, 기능조작형 재조합발현벡터는 위에서 설명한 가이드핵산-에디터단백질 복합체를 발현하기 위한 재조합 발현벡터를 포함할 수 있다.
(인공구조부가형 재조합발현벡터)
일 구체예로서 인공구조부가형 면역세포를 제조하기 위한 재조합발현벡터를 제공한다.
인공구조부가형 재조합발현벡터는 면역조절요소 유전자를 형질도입하기 위한 재조합염기서열을 포함한다.
일 예에서 인공구조부가형 재조합발현벡터는 에피좀 벡터일 수 있다. 에피좀 벡터는 진핵생물의 핵에서 게놈 외의 외인성 유전자로 작용하면서 게놈에는 융합되지 않는 벡터를 말한다. 이때, 에피좀 벡터는 유전자의 발현을 위한 프로모터를 포함할 수 있다.
다른 예에서 인공구조부가형 재조합발현벡터는 생체의 게놈에 융합되기 위한 기능을 가진 것일 수 있다.
이때, 인공구조부가형 재조합발현벡터는 바이러스 벡터일 수 있다. 이때, 바람직한 바이러스 벡터는 아데노계열바이러스 벡터이다.
또한, 인공구조부가형 재조합발현벡터는 삽입목적위치와 상동성이 있는 염기서열을 포함할 수 있다. HR 과정에서 삽입하기 위한 주형 뉴클레오타이드일 수 있다. 상기 주형뉴클레오타이드는 가이드핵산-에디터단백질 복합체에 의해 절단되는 부위의 서열과 상동성이 있을 수 있다.
또한, 인공구조부가형 재조합발현벡터는 위에서 설명한 가이드핵산-에디터단백질 복합체를 발현하기 위한 재조합 발현벡터를 포함할 수 있다.
(복합조작형 재조합발현벡터)
복합조작형 재조합발현벡터는 야생수용체 또는 면역조절요소 유전자를 넉아웃하고 다른 인공구조 유전자를 형질도입하기 위한 재조합염기서열을 포함한다.
유전자를 넉아웃하기 위한 재조합염기서열은 위에서 설명한 가이드핵산-에디터단백질 복합체를 발현하기 위한 재조합발현벡터의 염기서열을 포함한다. 이때, gRNA의 표적서열은 면역조절요소의 염기서열과 상보성을 가질 수 있다.
일 예에서 형질도입을 위한 재조합발현벡터는 에피좀 벡터일 수 있다. 이때, 에피좀 벡터는 유전자의 발현을 위한 프로모터를 포함할 수 있다.
다른 예에서 형질도입을 위한 재조합발현벡터는 생체의 게놈에 융합되기 위한 기능을 가진 것일 수 있다.
이때, 형질도입을 위한 재조합발현벡터는 바이러스 벡터일 수 있다. 이때, 바람직한 바이러스 벡터는 아데노계열바이러스 벡터이다.
또한, 형질도입을 위한 재조합발현벡터는 삽입목적위치와 상동성이 있는 염기서열을 포함할 수 있다. HR 과정에서 삽입하기 위한 주형 뉴클레오타이드일 수 있다. 상기 주형뉴클레오타이드는 가이드핵산-에디터단백질 복합체에 의해 절단되는 부위의 서열과 상동성이 있을 수 있다.
또한, 기능조작형 재조합발현벡터는 위에서 설명한 가이드핵산-에디터단백질 복합체를 발현하기 위한 재조합 발현벡터를 포함할 수 있다.
한편, 본 발명의 특정 실시예는 가이드핵산-에디터단백질 복합체에 의한 인위적으로 조작된 면역조절요소를 포함하는 면역세포를 제조하는 방법을 제공한다.
구현예에서, 세포를 (a) PD-1, CTLA-4, TNFAIP3, DGKA (Dgkα), DGKAZ (Dgkζ), Fas, EGR2, PPP2R2D, PSGL-1 및/또는 TET2 유전자를 표적화하는 1이상의 가이드핵산, 예를 들어 gRNA, 및 (b) 에디터 단백질, 예를 들어, Cas9 단백질과 접촉시키는 단계를 포함하는, 세포의 표적 핵산의 서열이 변경된, 조작된 면역세포를 제조하는 방법일 수 있다.
상기 접촉 방법은 상기 가이드 핵산과 에디터 단백질을 통상적인 방법으로 직접 면역세포에 도입하는 것일 수 있다.
상기 접촉 방법은 상기 가이드 핵산과 에디터 단백질을 암호화하는 각 DNA 분자를 하나의 벡터 또는 각각 별개의 벡터에 포함된 상태로 면역세포에 도입하는 것일 수 있다.
상기 접촉 방법은 벡터를 이용하여 이루어질 수 있다. 상기 벡터는 바이러스 벡터일 수 있다. 상기 바이러스 벡터는 예를 들어, 레트로바이러스, 아데노바이러스계 벡터일 수 있다.
상기 방법은 전기천공법 (electroporation), 리포좀, 바이러스벡터, 나노파티클(nanoparticles) 뿐만 아니라 PTD (Protein translocation domain) 융합 단백질 방법 등 당업계에 공지된 다양한 방법들을 사용하여 면역세포 내로 전달될 수 있다.
상기 방법은 상이한 유전자를 타겟하는 gRNA를 세포 내로 도입하는 단계, 또는 이러한 gRNA를 암호화하는 핵산을 세포 내로 도입하는 단계를 추가로 포함할 수 있다.
상기 방법은 생체 내 또는 생체 외, 예컨대 인체 외에서 진행되는 것일 수 있다.
예를 들어, 접촉시키는 단계는 생체외에서 수행될 수 있고, 접촉된 세포는 접촉시키는 단계 후에 대상체의 신체로 복귀될 수 있다.
상기 방법은 생체 내의 면역세포 또는 생체, 예컨대, 인체로부터 분리된 면역세포 또는 인공적으로 생산한 면역세포를 이용할 수 있다. 일 예로서, 암으로 고통받는 대상체로부터의 세포를 접촉시키는 단계를 포함할 수 있다.
상기 방법에 사용되는 면역 세포는, 인간, 원숭이 등의 영장류, 마우스, 래트 등의 설치류를 포함하는 포유동물에서 유래한 면역세포일 수 있다. 예를 들어 NKT 세포, NK세포, T 세포 등일 수 있다. 이 때, 면역 수용체(immune receptor)가 부가된 (예를 들어, CAR(키메라 항원 수용체), 또는 조작된 TCR(T-세포 수용체) 부가) 조작된 면역세포일 수 있다. 상기 면역세포는 PD-1, CTLA-4, TNFAIP3, DGKA (Dgkα), DGKAZ (Dgkζ), Fas, EGR2, PPP2R2D, PSGL-1 및/또는 TET2 유전자 중 하나 이상에서 면역 세포 표적 위치 돌연변이를 도입하기 전에, 후에 또는 동시에 면역 수용체(예를 들어, TCR 또는 CAR)를 발현시키도록 조작될 수 있다.
상기 방법은 면역세포에 적합한 배지, 예컨대, 혈청 (예컨대, 소 태아 또는 인간 혈청), 인터루킨-2 (IL-2), 인슐린, IFNgammaI1L-4, IL-7, GM-CSF, IL-10, IL-15, TGF-beta, 및 TNF-alpha 또는 당업자에게 알려진 세포들의 성장을 위한 다른 첨가제들을 포함하는, 증식 및 생존능력(viability)에 필요한 인자들을 포함할 수 있는, 적절한 배지 (예컨대, Minimal Essential Media 또는 RPMI Media 1640 또는, X-vivo-10, -15, -20, (Lonza))에서 수행될 수 있으나, 이에 제한되는 것은 아니다.
[용도]
본 발명의 일 구체예는 대상체에 대한 인위적으로 조작된 세포, 예컨대 유전적으로 조작된 면역 세포 또는 줄기세포의 투여를 포함하는 면역요법 접근을 사용하는 질환 치료 용도이다.
치료 대상은 인간, 원숭이 등의 영장류, 마우스, 래트 등의 설치류 등을 포함하는 포유동물일 수 있다.
약학적 조성물
본 발명의 일 구체예는 면역 반응을 이용하여 질환 치료에 이용하고자 하는 조성물이다. 예를 들어, 인위적으로 조작된 면역조절 유전자 또는 이를 포함하는 면역세포를 함유하는 조성물이다. 치료용 조성물 또는 약학적 조성물 또는 세포치료제로 칭할 수 있다.
구현예에서, 조성물은 면역세포를 포함할 수 있다.
구현예에서, 조성물은 면역조절 인위적으로 조작된 유전자 및/또는 이에 의해 발현된 단백질을 포함할 수 있다.
상기 면역세포는 이미 분화를 끝낸 면역세포일 수 있다.
상기면역세포는 골수, 제대혈로부터 추출한 것일 수 있다.
상기면역세포는 줄기세포일 수 있다. 이때, 줄기세포는 조혈모세포(hematopoietic stem cell)일 수 있다.
조성물은 조작면역세포를 포함할 수 있다.
조성물은 기능조작형 면역세포를 포함할 수 있다.
조성물은 인공구조부가형 면역세포를 포함할 수 있다.
다른 구현예에서, 상기 조성물은 부가적 요소를 추가로 더 포함할 수 있다.
조성물은 항원결합매개체를 포함할 수 있다.
조성물은 사이토카인을 포함할 수 있다.
조성물은 사이토카인 분비촉진제 또는 억제제를 포함할 수 있다.
조성물은 조작면역세포를 체내에 전달하기 위한 적절한 담체를 포함할 수 있다.
조성물에 포함되는 면역세포는 환자에 동종이계일 수 있다
치료 방법
본 발명의 다른 구현예는, 상기 설명한 조성물의 생산 및 유효량의 상기 조성물을 이를 필요로 하는 환자에 투여를 포함하는 환자에서 질환의 치료 방법이다.
일 구체예에서 입양 면역요법을 이용하는 치료 방법일 수 있다.
- 치료 대상 질병
입양 면역요법은 임의의 특정 질병을 치료하기 위한 것일 수 있다.
임의의 특정 질병은 면역질환일 수 있다. 이때, 면역질환은 면역능력이 저하되는 질병일 수 있다.
면역질환은 자가면역질환일 수 있다.
예를 들어, 자가면역질환은 이식편대숙주병(GVHD, Graft versus host disease), 루푸스(systemic lupus erythematosus), 셀리악 병(celiac disease), 제1 형 당뇨병(diabetes mellitus type 1), 그레이브스 병(graves disease), 염증성 장질환(inflammatory bowel disease), 건선(psoriasis), 류머티스 관절염(rheumatoid arthritis), 다발성 경화증(muliple sclerosis) 등을 포함한다.
면역질환은 과증식성 질환일 수 있다.
예를 들어, 혈액 악성 종양 또는 고형암이다. 대표적인 혈액 악성 종양은 급성 림프구성 백혈병(ALL), 급성 골수성 백혈병(AML), 만성 골수성 백혈병(CML), 만성 호산구성 백혈병(CEL), 골수이형성 증후군(MDS), 비호지킨 림프종(NHL), 다발성 골수종(MM)을 포함한다. 고형암의 예는 담도암, 방광암, 뼈 및 연조직 암종, 뇌종양, 유방암, 자궁경부암, 결장암, 대장선암종, 대장암, 데스모이드 종양, 배아암, 자궁내막암, 식도암, 위암, 위선암종, 다형성교아종, 부인과 종양, 두경부 편평상피 세포암종, 간암, 폐암, 악성 흑색종, 골육종, 난소암, 췌장암, 췌장관 선암종, 원발성 성상세포 종양, 원발성 갑상선암, 전립선암, 신장암, 신세포암종, 횡문근육종, 피부암, 연조직 육종, 고환 생식 세포 종양, 요로상피세포암, 자궁육종, 또는 자궁암 등을 포함한다.
고형 악성종양 및 혈액 악성종양을 포함한 광범위한 암이 치료 대상이 될 수 있다.
예를 들어, 치료될 수 있는 암의 종류는 유방, 전립선, 췌장, 결장 및 직장의 선암; 폐의 기관지원성 암종의 모든 형태(편평세포 암종, 선암종, 소세포 폐암 및 비소세포 폐암 포함); 골수종; 흑색종; 간장암; 신경아세포종; 유두종; 아푸도마; 분리종; 새열종; 악성 카르시노이드 증후군; 카르시노이드 심장 질환; 및 암종(예를 들면, 워커, 기저세포, 기저편평성, 브라운-피어스, 도관, 에를리히 종양, 크렙스 2, 메르켈 세포, 점액소, 비-소세포 폐, 구리세포, 유두, 경섬유질, 세기관지, 기관지원성, 편평 세포 및 이행 세포)을 포함한다. 치료될 수 있는 추가 유형
의 암은 조직구 장애; 백혈병; 악성 조직구증가; 호지킨 질환; 비-호지킨 림프종; 형질세포종, 세망내피종; 흑색종; 신세포 암종; 연골아세포종; 연골종; 연골육종; 섬유종; 섬유육종; 거대세포 종양; 조직구종; 지방종, 지방육종; 중피종; 점액종; 점액육종; 골종; 골육종; 척색종, 두개인두종; 미분화세포종; 과오종; 간엽종; 중신종; 근육종; 에나멜상피종; 백악질종; 치아종; 기형종; 흉선종; 영양막 종양을 포함한다.
추가로, 다음과 같은 종류의 암이 또한 치료 가능한 것으로 고려될 수 있다: 선종; 담관암; 진주종; 원주종; 낭종암; 낭선종; 과립막 세포 종양; 음양모세포종; 간암; 한선종; 섬 세포 종양; 라이디히(Leydig) 세포 종양; 유두종; 세르톨리 세포 종양; 난모막 세포 종양; 자궁근종; 자궁육종; 근아세포종; 근종; 근육종; 횡문근종; 횡문육종; 상의세포종; 신경절세포종; 신경교종; 수모세포종; 뇌수막종; 신경집종; 신경아세포종; 신경상피종; 신경섬유종; 신경종; 부신경절종; 부신경절종 비-크로마핀 및 다형성교아종. 치료될 수 있는 암의 유형은 또한 피각혈관종; 호산구 증가증을 갖는 혈관림프양 증식; 혈관 경화증; 혈관종; 사구맥관종; 혈관내피종; 혈관종; 혈관주위세포종; 혈관육종; 림프관종; 림프관근종; 림프관육종; 송과체종; 암육종; 연골육종; 엽상 낭육종; 섬유육종; 혈관육종; 평활근육종; 백혈육종; 지방육종; 림프관육종; 근육종; 점액육종; 난소 암종; 횡문근육종; 육종; 신생물; 신경섬유종증 및 자궁경부 이형상피증을 포함한다
또한, 임의의 특정 질병은 병원체가 알려졌으나 치료법이 알려지지 않은 난치성 질병일 수 있다.
난치성 질병은 바이러스 감염 질병일 수 있다.
난치성 질병은 프리온 병원체 유래 질병일 수 있다.
임의의 특정 질병은 박테리아 질환일 수 있다.
임의의 특정 질병은 염증성 질환일 수 있다.
임의의 특정 질병은 노화-관련 질환일 수 있다.
- 면역능력 증강 치료
면역능력이 현저히 저하된 환자의 경우, 가벼운 감염도 치명적인 결과를 불러올 수 있다. 면역능력 저하는 면역세포의 기능 저하, 면역세포 생산량의 감소 등에 의해 발생한다. 이러한 면역능력 저하를 치료하기 위한 면역능력 증강 치료에는 정상적인 면역세포의 생산을 활성화하는 영구적 치료방법이 있는 반면 일시적으로 면역세포를 주입하는 일시적 치료방법이 있을 수 있다.
면역능력 증강 치료는 상기 치료조성물을 환자의 체내에 주입하여 영구적으로 면역능력을 증강하고자 하는 것일 수 있다.
면역능력 증강 치료는 환자의 특정 신체 부위에 치료조성물을 주입하는 방법일 수 있다. 이때, 특정 신체 부위는 면역세포공급원 조직을 가지는 부위일 수 있다.
면역능력 증강 치료는 환자의 체내에 새로운 면역세포공급원을 생성하는 것일 수 있다. 이때, 일 예로, 치료조성물은 줄기세포를 포함할 수 있다. 이때, 줄기세포는 조혈모세포일 수 있다.
면역능력 증강 치료는 상기 치료조성물을 환자의 체내에 주입하여 일시적으로 면역능력을 증강하고자 하는 것일 수 있다.
면역능력 증강 치료는 치료조성물를 환자의 체내에 주입하는 것일 수 있다.
이때, 바람직한 치료조성물은 분화를 마친 면역세포를 포함할 수 있다.
면역능력 증강 치료에 사용되는 치료조성물은 특정 갯수의 면역세포를 포함할 수 있다.
특정 갯수는 면역능력이 저하된 정도에 따라 바뀔 수 있다.
특정 갯수는 체내의 용적에 따라 바뀔 수 있다.
특정 갯수는 환자의 사이토카인 분비량에 따라 조절될 수 있다.
- 난치성 질병 치료
면역세포 조작기술은 HIV, 프리온, 암 등 병원체에 대한 완전한 치료가 알려지지 않은 질병에 대한 치료방법을 제공할 수 있다. 이러한 질병들은 병원체가 알려졌음에도 항체 형성이 어렵고, 진행이 매우 빠르고, 면역체계를 무력화하고, 병원체가 체내에 잠복하는 특성이 있어 치료가 어려운 경우가 많다. 조작면역세포는 상기 문제들을 해결하기 위한 강력한 수단이 될 수 있다.
난치성 질병 치료는 상기 치료조성물을 체내에 주입하여 이루어질 수 있다. 이때, 바람직한 치료조성물은 조작된 면역세포를 포함할 수 있다. 또한, 치료조성물은 특정한 신체 위치에 주입될 수 있다.
조작면역세포는 목적 질병의 병원체에 대한 인식능력이 개선된 것일 수 있다.
조작면역세포는 면역반응의 세기 또는 활성이 증강된 것일 수 있다.
- 유전자 교정 치료
외부로 추출한 면역세포를 이용한 치료방법 외에도 직접적으로 생체의 유전자를 조작하여 면역세포의 발현에 영향을 주는 치료방법이 있을 수 있다. 이러한 치료방법은 생체의 유전자를 조작하기 위한 유전자 교정용 조성물을 체내에 직접 주입하여 이루어질 수 있다.
유전자 교정용 조성물은 가이드핵산-에디터단백질 복합체를 포함할 수 있다.
유전자 교정용 조성물은 특정 신체 위치에 주입될 수 있다.
특정 신체 위치는 면역세포공급원일 수 있다. 예를 들어, 골수이다.
본 발명의 일 구현예는 앞서 설명한 인위적으로 조작한 면역 시스템의 구성요소들을 포함하는 조성물의 유효량을 대상에 투여하여 면역 관련 질환을 치료하는 방법에 관한 것이다.
임의의 구체예에서, 치료 방법은 예를 들어, 바이러스 벡터를 통해 생체 외에서 재조합적으로 조작 또는 변형된 세포 집단의 용도를 제공한다. 추가 구체예에서, 변형된 세포 집단은 동계, 동종이계, 또는 자기 세포이다. 상기 언급된 임의의 구체예에서, 조작 또는 변형된 세포 집단은 추가로 본원에 기재된 바와 같은 약학적으로 허용 가능한 담체, 희석제, 또는 부형제와 함께 제제화될 수 있다.
투여 대상은 인간, 원숭이 등의 영장류, 마우스, 래트 등의 설치류 등을 포함하는 포유동물일 수 있다.
투여는 전달 경로 또는 방식에 상관없이 이를 대상에 전달하는 것을 지칭한다. 투여는 연속적으로 또는 간헐적으로 그리고 비경구적으로 실시될 수 있다.
특정 구체예에서, 보조 치료제와의 공동 투여는 임의의 순서 및 임의의 투약 계획으로 다중 약제의 동시 및/또는 순차적 전달을 포함할 수 있다(예를 들면, 항원 특이적 재조합 숙주 T 세포 및 항원 발현 세포와 함께 하나 이상의 사이토카인; 면역억제 요법, 예컨대 칼시뉴린 억제제,코르티코스테로이드, 미소관 억제제, 저 용량 마이코페놀산 프로드럭, 또는 이들의 임의의 조합).
특정 구체예에서, 투여 단계는 수 주, 수 개월, 또는 최대 2년까지 수 회 반복될 수 있다.
조성물은 의료 분야에서 숙련자에 의해 결정되는 바와 같이 치료 또는 예방되는 질환 또는 상태에 적절한 방식으로 투여될 수 있다. 조성물의 투여를 위한 적절한 용량 및 적합한 기간 및 빈도는 환자의 건강 상태, 환자의 사이즈(즉, 체중, 질량, 체 면적), 환자 질환의 유형 및 중증도, 활성 성분의 특정 형태 및 투여방법과 같은 인자에 의해 결정될 것이다.
예를 들어, 조성물의 투여는 주사(injection), 수혈(transfusion), 삽입(implantation) 또는 이식(transplantation)과 같은, 임의의 편리한 방식으로 수행될 수 있다. 투여 경로는 피하(subcutaneously), 피내(intradermaliy), 종양내(intratumorally), 절내(intranodally), 골수내(intramedullary), 근육내(intramuscularly), 정맥내(intravenous), 림프액내(intralymphatic), 복막내(intraperitoneally) 등에서 선택될 수 있다.
조성물의 1회 투여량(소정의 소망하는 효과를 얻기 위한 약학적 유효량)은 투여 대상의 체중 kg 당 104-109 세포, 예컨대, 105 내지 106 세포/kg(체중) 정도로 상기 수치 범위들 내의 모든 정수값들 중에서 선택될 수 있으나, 이에 제한되는 것은 아니고, 투여 대상의 연령, 건강 및 체중, 동시에 받는 치료의 종류, 만약 있다면 치료의 빈도, 원하는 효과의 특성 등을 고려하여 적절히 처방될 수 있다.
본 발명의 방법, 조성물에 의해 인위적으로 조작된 면역조절요소를 조절할 경우, 면역세포의 생존(survival), 증식(proliferation), 지속(persistency), 세포독성(cytotoxicity), 사이토카인 분비(cytokine-release) 및/또는 침윤(infiltration) 등에 관여하는 면역 효능이 향상될 수 있다.
이하, 실시예를 통하여 본 발명을 더욱 상세히 설명하고자 한다.
이들 실시예는 오로지 본 발명을 보다 구체적으로 설명하기 위한 것으로서, 본 발명의 범위가 이들 실시예에 의해 제한되지 않는다는 것은 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 있어 자명할 것이다.
실시예 1: 세포 준비 ( cell activation & culture ) 및 형질감염
Jurkat 세포 (ATCC TIB-152; 인간 T-세포의 불멸화 세포주)를 10%(v/v) fetal bovine serum (GeneAll)이 보충된 RPMI 1640 배지에서 배양하였다. 세포들은37 및 5% CO2 조건 하의 인큐베이터에서 배양하였다.
인간 Naive T-세포 (STEMCELL Technology)를 각각 10%(v/v) fetal bovine serum (GeneAll) 및/또는 IL-2 (50U/mL), IL-7 (5ng/mL), 및 IL-15(5ng/mL) (PEPROTECH) 가 보충된 X-VIVO 15 배지 (Lonza)에서 배양하였다. 세포 활성화를 위하여, 상기 배지 내 세포들의 농도는 각각 1x10^6 cells/mL로 하였다.
CD2/CD3/CD28 비드 (anti-CD2/3/CD28 Dynabeads; Miltenyi Biotec)를 3:1의 비율(비드:세포; 비드 및 세포의 개수 기준) 이 되도록 넣어주고, 상기 세포들을 37 및 5% CO2 조건 하의 인큐베이터에서 배양하였다. 상기와 같은 세포 활성화를 72 시간 동안 수행한 후, 상기 CD2/CD3/CD28 비드를 자석을 이용하여 제거하고, 비드가비드가 없는 상태에서 상기 세포들을 12-24시간 동안 더 배양하였다.
특정 유전자를 높은 효율로 넉아웃 할 수 있는 gRNA를 찾기 위해서 상기 배양된 1x10^6 개의Jurkat 세포 2x10^5 세포에 세포에 하기의 실시예 2 및 3에서 설명한 것처럼 in vitro transcribed sgRNA 1 ug (microgram) 및 Cas9 단백질 (툴젠. 한국) 4ug을 전기천공으로 도입시켰다 (in vitro). Neon Transfection System (ThermoFisher Scientific, Grand Island, NY)의 10uL tip 를 사용하여 다음의 조건으로 유전자를 도입하였다:
Jurkats (Buffer R): 1,400 V, 20 ms, 2 pulses.
마찬가지로 특정 유전자를 T 세포에서 넉아웃 하기 위해서 인간원발성 T 세포 1x10^6 세포에 1 ug gRNA 과 4 ug Cas9 단백질 (툴젠, 한국)을 전기천공법으로 도입시켰다. 이 때 사용한 gRNA는 in vitro transcribed and AP(alkaline phosphatase) 처리된sgRNA 또는 chemically synthesized crRNA와 tracrRNA 복합체(Integrated DNA Technologies)이다. 전기천공법을 위해 Neon Transfection System (ThermoFisher Scientific, Grand Island, NY)의 10uL tip을 사용하여 다음의 조건으로 유전자를 도입하였다:
Human primary T-cells (Buffer T): 1,550 V, 10 ms, 3 pulses;
상기 세포들을 무항생제 배지 500ul에 플레이팅하고 37℃ 및 5% CO2조건 하의 인큐베이터에서 배양하였다.
실시예 2: sgRNA 설계 및 합성
2.1: sgRNA 설계
CRISPR RGEN Tools (http://www.rgenome.net/)을 사용하여 인간의 PD-1 유전자 (PDCD1; NCBI Accession No. NM_005018.2), CTLA-4 유전자 (NCBI Accession No. NM_001037631.2), A20 유전자 (TNFAIP3; NCBI Accession No. NM_001270507.1), DGK-alpha 유전자 (NCBI Accession No. NM_001345.4), DGK-zeta 유전자 (NCBI Accession No. NM_001105540.1), EGR2EGR2EGR2 유전자 (NCBI Accession No. NM_000399.4), PPP2R2DPPP2R2D 유전자 (NCBI Accession No. NM_001291310.1), PSGL-1유전자 (NCBI Accession No. NM_003006.4), 및 TET2TET2TET2 유전자 (NCBI Accession No. NM_017628.4), FAS유전자 (NCBI Accession No. XM_006717819.3, XM_011539764.2, NM_152871.3, 또는 NM_152872.3), KDM6A 유전자 (NCBI Accession No. NM_001291415.1, NM_001291416.1, NM_001291418.1, NM_001291417.1, NM_001291421.1, 또는 NM_021140.3)의 CRISPR/Cas9 표적 부위 선별 및 추정 오프-타겟 검사를 수행하였다. CRISPR/Cas9 표적 부위로서 인간 게놈 (GRCh38/hg38) 내에서 온타겟 서열부위를 제외하고 0-, 1-, 또는 2bp 미스매치(mismatch) 부위가 없는 DNA 서열들을 sgRNA 타겟부위로 선정하였다.
2.2: sgRNA 합성
2 개의 상보적 올리고뉴클레오타드를 어닐링 및 연장시켜 sgRNA 합성을 위한 주형들을 PCR-증폭시켰다.
이 때 사용된 타겟 부위 서열, 이를 증폭시키기 위한 프라이머 서열, 및 이로부터 얻어진 sgRNA이 타겟팅하는 DNA 타겟 서열(PAM 포함)을 아래의 표 2에 정리하였다.
상기 주형 DNA (타겟 서열에서 3' 말단의 'NGG' 제외)에 대하여 T7 RNA polymerase (New England Biolabs)를 이용하여 in vitro transcription을 수행하고, 제조자 사용 설명서에 따라서 RNA를 합성한 후 Turbo DNAse(Ambion)를 사용하여 주형 DNA를 제거하였다. Expin Combo kit (GeneAll)과 이소프로판올 침전을 통하여 전사된 RNA를 정제하였다.
T 세포를 이용한 실험에서는 sgRNA의 immunogenicity와 degradation을 최소화하기 위해서 상기의 방법으로 합성된 sgRNA에 alkaline phosphatase(New England Biolabs)를 이용하여 5' 말단의 phosphate 잔기를 제거한 후 Expin Combo kit(GeneAll)과 이소프로판올 침전으로 다시 RNA를 정제하여 사용하였다. 또한 일부 T 세포를 이용한 실험에서는 chemically synthesized sgRNA(Trilink) 또는 chemically synthesized dgRNA(Integrated DNA Technologies)를 사용하였다.
본 실시예에서, 상기 chemically synthesized sgRNA는 2'OMe 및 phosphorothioate로 변형된 것을 사용하였다.
예시로 본 실시예에 사용된 chemically modified DGKα sgRNA #11는 5'-2'OMe(C(ps)U(ps)C(ps)) UCA AGC UGA GUG GGU CCG UUU UAG AGC UAG AAA UAG CAA GUU AAA AUA AGG CUA GUC CGU UAU CAA CUU GAA AAA GUG GCA CCG AGU CGG UGC 2'OMe(U(ps)U(ps)U(ps)U -3' 구조식을 갖는다(2'OMe = 2'-methly RNA and ps=phosphorothioate).
다른 예에서 본 실시예에서 사용된 A20 sgRNA #1은 GCUUGUGGCGCUGAAAACGAAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU (볼드체는 타겟 서열 부위에 혼성화하는 서열임; 다른 타겟 유전자 및 다른 타겟 서열에 대한 sgRNA는 상기 볼드체 서열이 타겟 서열(단, T가 U로 바뀜)을 갖는 것임) 또는 상기 서열의 3' 말단의 3개의 뉴클레오타이드 및 5' 말단의 3개의 뉴클레오타이드가 2'-OMe 변형 및 포스포로티오에이트 백본이 도입된 변형이 가해진 것일 수 있다.
[표 2]
Figure PCTKR2017008835-appb-I000011
Figure PCTKR2017008835-appb-I000012
Figure PCTKR2017008835-appb-I000013
Figure PCTKR2017008835-appb-I000014
Figure PCTKR2017008835-appb-I000015
Figure PCTKR2017008835-appb-I000016
Figure PCTKR2017008835-appb-I000017
Figure PCTKR2017008835-appb-I000018
Figure PCTKR2017008835-appb-I000019
Figure PCTKR2017008835-appb-I000020
Figure PCTKR2017008835-appb-I000021
Figure PCTKR2017008835-appb-I000022
Figure PCTKR2017008835-appb-I000023
Figure PCTKR2017008835-appb-I000024
Figure PCTKR2017008835-appb-I000025
Figure PCTKR2017008835-appb-I000026
Figure PCTKR2017008835-appb-I000027
Figure PCTKR2017008835-appb-I000028
Figure PCTKR2017008835-appb-I000029
Figure PCTKR2017008835-appb-I000030
Figure PCTKR2017008835-appb-I000031
Figure PCTKR2017008835-appb-I000032
Figure PCTKR2017008835-appb-I000033
Figure PCTKR2017008835-appb-I000034
Figure PCTKR2017008835-appb-I000035
Figure PCTKR2017008835-appb-I000036
Figure PCTKR2017008835-appb-I000037
Figure PCTKR2017008835-appb-I000038
Figure PCTKR2017008835-appb-I000039
Figure PCTKR2017008835-appb-I000040
Figure PCTKR2017008835-appb-I000041
Figure PCTKR2017008835-appb-I000042
Figure PCTKR2017008835-appb-I000043
Figure PCTKR2017008835-appb-I000044
Figure PCTKR2017008835-appb-I000045
Figure PCTKR2017008835-appb-I000046
Figure PCTKR2017008835-appb-I000047
2.3 Deep sequencing
Hipi Plus DNA polymerase (Elpis-bio)를 사용하여 온-타겟 (ontarget) 및 오프-타겟 (off-target) 부위를 200~300bp 크기로 PCR-증폭시켰다. 상기의 방법으로 얻어진 PCR 산물을 Mi-seq. (Illumina)장비를 이용하여 sequencing 하여 CRISPR RGEN tool (www.rgenome.net)의 Cas Analyzer를 통해 분석하였다. CRISPR/Cas9 절단 부위로부터 5bp 이내에서의 insertion/deletions를 RGEN로부터 유도된 변이로 간주하였다.
표 4 및 표 6 등에서 볼 수 있듯이 deep sequencing 결과 CRISPR-Cas9을 전달하였을 때 다양한 면역세포에서 높은 효율로 indel 변이가 일어남을 확인할 수 있었다.
실시예 3: sgRNAs 준비
3.1. Jurkat 세포에서의 sgRNAs 선별
상기 실시예 2에 기재된 방법에 의하여 얻어진 A20, DGKα, EGR2, PPP2R2D, EGR2, PPP2r2dPPP2R2D, PD-1, CTLA-4, DGKζ, PSGL-1, KDM6A, FAS및 TET2TET2TET2의 엑손을 타겟팅하는 sgRNA들의 활성을 Jurkat 세포에서 시험하였다.
상기 실시예 2에서 얻어진 각각의 sgRNA를 실시예 1의 방법에 의하여 Cas9와 함께 형질도입시킨 Jurkat 세포에서의 indel ratio를 형질도입이 없는 Jurkat 세포와 비교하여 시험하였다. 상기 시험된 CRISPR/Cas9 표적 서열 및 인간 genome 중 비슷한 표적 서열을 가진 mismatch site의 수를 표 3에, 각 sgRNA에 의한의한 indel ratio를 표 4에 각각 정리하였다. 각각의 유전자를 타겟으로 하는 gRNA 중에서 활성이 좋았던 것들의 DNA 타겟 부위를 굵은 글씨로 표시해두었다..
[표 3]
Figure PCTKR2017008835-appb-I000048
Figure PCTKR2017008835-appb-I000049
Figure PCTKR2017008835-appb-I000050
Figure PCTKR2017008835-appb-I000051
Figure PCTKR2017008835-appb-I000052
Figure PCTKR2017008835-appb-I000053
Figure PCTKR2017008835-appb-I000054
Figure PCTKR2017008835-appb-I000055
Figure PCTKR2017008835-appb-I000056
Figure PCTKR2017008835-appb-I000057
[표 4] 상기 표적 서열에 대한 각각의 sgRNA의 Jurkat 세포에서의 활성
Figure PCTKR2017008835-appb-I000058
Figure PCTKR2017008835-appb-I000059
Figure PCTKR2017008835-appb-I000060
Figure PCTKR2017008835-appb-I000061
Figure PCTKR2017008835-appb-I000062
Figure PCTKR2017008835-appb-I000063
Figure PCTKR2017008835-appb-I000064
Figure PCTKR2017008835-appb-I000065
3.2. 인간 원발성 T 세포 ( human primary T- cells )에서의 sgRNAs 선별
상기 실시예 3.1에서 얻어진 Jurkat 세포에서의 sgRNA 활성 결과에 기초하여, Jurkat 세포에서 비교적 높은 활성을 갖는 sgRNA들(표 3 및 표 4의 굵은 글씨 참조)을 선택하여 인간 원발성 T-세포에서의 활성을 시험하였다.
Single 또는 dual gRNA와 Cas9을 인간 원발성 T 세포에 전달하여 시험하였고, 시험한 CRISPR/Cas9 표적 서열을 표 5에, 각 sgRNA에 의한 indel ratio를 표 6에 각각 정리하였다.
[표 5] 인간 원발성 T-세포에서의 표적 서열 및 미스매치
Figure PCTKR2017008835-appb-I000066
Figure PCTKR2017008835-appb-I000067
[표 6] 상기 표적 서열에 대한 각각의 gRNA의 인간 원발성 T 면역세포에서의 활성
Figure PCTKR2017008835-appb-I000068
마찬가지로 상기 실시예 3.1에서 얻어진 Jurkat 세포에서의 sgRNA 활성 결과에 기초하여, Jurkat 세포에서 비교적 높은 활성을 갖는 PSGL-1 #17 sgRNA를 선택하여 인간 원발성 T-세포에서의 활성을 시험하였다
또한, 활성화된 인간 원발성 T 세포에 전기천공법(Neon, Thermo Scientific)을 통해 4 ug Sp. Cas9 단백질 및 1 ug의 in vitro 전사된 AP-처리 sgRNA를 전달하였다. 5일 후, 각 T 세포로부터 gDNA를 분리하여추출하여 targeted deepd sequencing을 통해 인델 효율을 분석하였다(도 18 A). 또한 T 세포 표면에서의 PSGL-1 발현을 flow cytometry(Attune Flow cytometry, Thermo Scienctific)로 분석하여 PSGL-1 넉아웃을 확인하였다(도 18 B, C).
도 17a 내지 17c는 Jurkat 세포에서의 hPSGL-1 sgRNA 스크리닝을 위한 분석 결과를 나타낸 것으로 인델 효율 및 넉아웃 후 PSGL-1을 발현하지 않는 Jurtat 세포의 정도(17a)와 넉아웃 후 Jurkat 세포 표면에서 발현하는 PSGL-1의 발현 정도를 나타낸 그래프(17b,17c)이다.
도 18는 인간 원발성 T 세포(human primary T cells)에서의 hPSGL-1 넉아웃(KO) 실험 결과로, (A) 인델 효율 및 (B) 넉아웃 후 PSGL-1을 발현하지 않는 T 세포의 정도 및 (C) 넉아웃 후 T세포 표면에서 발현하는 PSGL-1의 발현 정도를 나타낸 그래프이다. 그 결과, Cas9 단백질과 gRNA 복합체 전달을 통해 PSGL-1이 효과적으로 넉아웃되어 표면단백질인 PSGL-1을 flow cytometry로 관찰하지 못하게 되었음을 확인하였다.
실시예 4: Jurkat 세포의 활성화 및 사이토카인 분비의 증진 시험
상기 Cas9 단백질과 sgRNA가 도입된 Jurkat 세포에서, 도입된 sgRNA의 표적 부위에 해당하는 게놈 DNA 서열이 절단되고 이 부위를 중심으로 NHEJ에 의한 결손, 삽입 및 치환으로 인하여 상기 절단 DNA 서열이 위치하는 유전자가 넉아웃된다.
상기 실시예 1에서와 같이 전기천공에 의하여 Cas9 단백질과 sgRNA가 도입된 Jurkat 세포를 전기천공 후 7일 동안 배양하고, CD3 dynabeads(Miltenyi Biotec) 또는 CD3/28 dynabeads (Miltenyi Biotec)를 사용하여 활성화시켰다.
24시간 후, IL-2 수용체인 CD25의 발현과 IFN-gamma의 방출 수준을 각각 유세포분석법 (flow cytometry) 및 ELISA로 분석하였다.
우선, IL-2 수용체인 CD25의 발현 수준을 유세포분석법에 의하여 측정하였다. Cas9 단백질과 sgRNA가 도입된 Jurkat 세포를 도입 후 7일간 각각 배양한 후, CD3 또는 CD3/28 dynabeads (Miltenyi Biotec)를 3:1 (비드:세포; 개수 기준)의 비율로 사용하여 재자극하여, CD25의 발현을 측정하였다.
세포 활성화 후 1일 되는 때에 표현형 분석을 수행하였다. 상기 비드로 재자극된 (활성화된) 세포를 1%(v/v) FBS (fetal bovine serum) 보충된 PBS (phosphate-buffered saline)로 세척한 후, PE-conjugated anti-CD25 antibody (BD Bioscience)로 4℃에서 30분 동안 염색하였다.
상기 얻어진 세포를 PBS로 세척 및 재현탁시킨 후, BD ACCURI C6 (BD Biosciences) 상에서 유세포분석을 수행하였으며, 이로부터 얻어진 median fluorescence intensity (MFI)에 의하여 CD25 발현수준을 측정하였다.
비교를 위하여, Cas9 단백질과 sgRNA가 도입되지 않은 야생형 세포 및 CD3 또는 CD3/28 dynabeads를 처리하지 않은 세포에 대하여 동일한 방법으로 유세포분석을 수행하였다.
상기 얻어진 CD25 발현수준(CD25 MFI)을 도 1 내지 도 4에 나타내었다.
도 1은 DGK-alpha에 대한 sgRNA(#11; DGK-alpha#11로 표시)를 사용하여 DGK-alpha 유전자가 넉아웃된 세포에서의 CD25 MFI,
도 2는 A20에 대한 sgRNA(#11;A20#11로 표시)를 사용하여 A20 유전자가 넉아웃된 세포에서의 CD25 MFI,
도 3은 EGR2에 대한 sgRNA(#1; EGR2#1로 표시)를 사용하여 EGR2 유전자가 넉아웃된 세포에서의 CD25 MFI, 및
도 4는 PPP2R2D에 대한 sgRNA(#10; PPP2R2D#10으로 표시)를 사용하여 PPP2R2D 유전자가 넉아웃된 세포에서의 CD25 MFI를 각각 나타낸다.
도 1 내지 도 4에 나타난 바와 같이, CD3 또는 CD3/28 dynabeads를 처리하지 않은 세포의 경우, 상기 유전자들의 넉아웃 여부가 CD25 발현 수준에 영향을 미치지 않는 반면, CD3 또는 CD3/28 dynabeads를 처리한 경우에는 CD25 발현 수준이 야생형인 경우와 비교하여 상기 유전자들이 넉아웃된 경우 현저히 증가한 것을 확인할 수 있었다.
또한, 사이토카인의 일종인 IFN-gamma의 분비 수준을 ELISA를 통하여 시험하였다.
앞서 기재된 바와 같이 CD3 또는 CD3/28 dynabeads를 이용하여 재자극된 Jurkat 세포를 36시간 동안 두어 활성화시킨 후, 배양 배지를 수집하고 diluent buffer (provided by ELISA kit, Biolegend)를 사용하여 1/100 또는 1/200 비율로 희석하고, ELISA kit (BioLegend)를 사용하여 발색시키며, Spectrophotometer (MULTISCAN GO, Thermo Scientific)를 통해 정량화하였다.
비교를 위하여, Cas9 단백질과 sgRNA가 도입되지 않은 야생형 세포에 대하여 동일한 방법으로 ELISA를 수행하였다.
상기 얻어진 결과를 도 5에 나타내었다.
도 5는 DGK-alpha에 대한 sgRNA(#11; DGK-alpha#11로 표시)를 사용하여 DGK-alpha 유전자가 넉아웃된 세포 배양 배지 내의 IFN-gamma 수준, A20에 대한 sgRNA(#11; A20#11로 표시)를 사용하여 A20 유전자가 넉아웃된 세포 배양 배지 내의 IFN-gamma 수준, EGR2에 대한 sgRNA(#1; EGR2#1로 표시)를 사용하여 EGR2 유전자가 넉아웃된 세포 배양 배지 내의 IFN-gamma 수준을 보여준다 (IFN-gamma 수준 단위: pg/ml).
도 5에 나타난 바와 같이, 상기 유전자들이 넉아웃된 경우, 야생형과 비교하여, IFN-gamma의 분비량이 유의미하게 증가한 것을 확인할 수 있다.
실시예 5: 인간 원발성 T-세포의 활성화 및 사이토카인 분비 증진시험
상기 실시예 4에 기재된 방법을 참조하여, Cas9 단백질과 sgRNA가 도입된 인간 원발성 T-세포를 CD3 비드로 활성화시키고(비드:세포 비율을 1:1, 2:1, 및 3:1로 하여 각각 처리함), 2일 후에 IFN-gamma 및 IL-2의 분비 수준을 ELISA (IFN-gamma 또는 IL-2 ELISA kit; Biolegend)로 측정하였다.
상기 얻어진 결과를 도 6 및 도 7에 나타내었다.
도 6은 DGK-alpha에 대한 sgRNA(#11; DGK-alpha#11로 표시)를 사용하여 DGK-alpha 유전자가 넉아웃된 세포배양 배지 내의 IFN-gamma 수준, DGK-alpha에 대한 sgRNA(#8와 #11 함께 사용; DGK-alpha#8+11로 표시)를 사용하여 DGK-alpha 유전자가 넉아웃된 세포 배양배지 내의 IFN-gamma 수준, DGK-zeta에 대한 sgRNA(#5; DGK-zeta#5로 표시)를 사용하여 DGK-zeta 유전자가 넉아웃된 세포 배양 배지 내의 IFN-gamma 수준, 및 A20에 대한 sgRNA(#11; A20#11로 표시)를 사용하여 A20 유전자가 넉아웃된 세포 배양 배지 내의 IFN-gamma 수준을 보여준다 (IFN-gamma 수준 단위: pg/ml).
도 7은 DGKalpha#11 를 사용하여 DGK-alpha 유전자가 넉아웃된 세포 배양 배지 내의 IL-2 수준, DGK-alpha#8+11를 사용하여 DGK-alpha 유전자가 넉아웃된 세포 배양 배지 내의 IL-2 수준, DGK-zeta#5 를 사용하여 DGK-zeta 유전자가 넉아웃된 세포 배양 배지 내의 IL-2 수준, 및 A20#11를 사용하여 A20 유전자가 넉아웃된 세포 배양 배지 내의 IL-2 수준을 보여준다 (IL-2 수준 단위: pg/ml).
도 6 및 도 7에서, "AAVS1"은 AAVS1 부위가 CRISPR 시스템으로 절단된 세포로 음성 대조군으로 사용되었다.
도 6 및 도 7에 나타난 바와 같이, 상기 유전자들이 넉아웃된 경우, 야생형과 비교하여, IFN-gamma 및 IL-2와 같은 사이토카인의 분비량이 유의미하게 증가한 것을 확인할 수 있다.
Jurkat과 인간 원발성 T세포에서 CD25발현과 사이토카인 분비가 증가된 상기의 결과들은 상기 유전자들의 넉아웃되었을 때 TCR매개 활성화 신호가 증가된 것을 의미하며, 이렇게 증대된 반응성에 의해 T세포의 면역작용이 강화될 수 있음을 보여준다.
실시예 6: CAR-T 세포의 활성화 및 사이토카인 분비 증진시험
인간 말초 혈액 T 세포(human peripheral blood T cells, pan-T cell)는 STEMCELL TECHNOLOGIES에서 구입하였다. 세포 배양을 위해 50 U/mL의 hIL-2와 5 ng/mL의 hIL-7을 첨가한 X-VIVO 15 배양액을 사용하였다. 세포를 활성화시키기 위해 항-CD3/28 Dynabeads(ThermoFisher Scientific)를 이용하였으며, 이때 비드와 세포의 비율은 3:1로 하였다.
24시간동안 활성 시킨 후, T 세포는 레트로넥틴(retronectin)이 코팅된 플레이트에서 139-CAR 렌티바이러스와 48시간동안 혼합시켰다. 139-CAR는 EGFRvIII를 특이적으로 인식하여 면역반응을 유도할 수 있는 CAR이다. 그 후, 재조합 S. pyogenes Cas9 단백질 (툴젠, 한국) 40 μg과 화학적으로 합성된 tracr/crRNA (Integrated DNA Technologies) 10 μg을 4D-Nucleofecter(Lonza)를 전기 천공법으로 세포에 도입하였다.
In vitro 실험을 위해, Cell Trace(ThermoFisher Scientific)로 미리 염색된 U87vIII암세포주를 139 CAR-T와 적절한 비율로 공동 배양하였으며, 이때, 배양은 10 ng/mL TGF-β1 또는 0.5 μg/mL PGE2를 첨가하거나 첨가하지 않은 상태에서 배양하였다. 암세포주와 공동 배양한 다음, 세포독성 실험을 위해 세포를 7-아미노액티노마이신(7-aminoactinomycin D; 7-AAD)으로 염색하였다. 염색된 시료는 Attune NxT Acoustic Focusing Cytometer에서 수집하고, FlowJo로 분석하였다.
세포독성은 [(% lysis sample - % lysis minimum) / (% lysis max [100%] - % lysis minimum]x100%의 수식으로 계산하였다. 또한 공동 배양의 상층액은 IL-2와 IFN-γ의 함량 측정을 위해 ELISA Kit(Biolegend)를 이용해 분석하였다. 139 CAR-T 세포의 세포증식 실험을 위해, CellTrace로 염색한 139-CAR-T 세포를 타겟 암세포주인 U87vIII와 공배양한 후 139 CAR-T 세포에서 Cell Trace의 희석정도를 flow cytometry를 이용하여 측정하였다.
실험 계획에 따라(도 8a의 A), DGKα 또는 DGKζ을 표적하는 단일 Cas9/gRNA Ribonucleoprotein(RNP) 복합체가 전달된 139 CAR-T 세포에서의 DGKα 및 DGKζ의 인델 효과는 각 75.9%, 93.5%로 확인되었다(도 8a의 B).
DGKα 및 DGKζ의 이중 음성 139 CAR-T 세포를 생성하기 위해, DGKα와 DGKζ를 각각 표적하는 두 개의 gRNA를 전기 천공법으로 세포에 도입하였고, 그 결과 DGKα 및 DGKζ의 인델 효과는 각 49.2%, 92.4%로 확인되었다(도 8a의 B).
DGKα 및 DGKζ의 각각의 gRNA에 대한 오프타겟의 현저한 효과가 없음을 표적된 딥-시퀀싱(deep-sequencing)을 이용하여 확인하였다(도 8b).
또한, DGKα, DGKζ, 및 DGKαζ KO 139 CAR-T 세포는 야생형의 139 CAR-T 세포에 비해 세포독성, 사이토카인 생성 및 증식 능력이 현저히 증가하였음을 관찰하였다(도 9a의 A, B 및 도 9b).
흥미롭게도 DGKαζ KO 139 CAR-T 세포는 DGKα 또는 DGKζ 단일 KO 139 CAR-T 세포에 비해 훨씬 증가된 사이토카인 방출을 확인하였고, 이는 DGKα와 DGKζ의 시너지 효과로 판단된다. 이러한 DGKs KO 139 CAR-T 세포의 이펙터 기능 증가는 CD3-말단 시그널, 즉, ERK1/2의 증가 및 항원 노출 후 CAR의 높은 발현에 기인된 것으로 판단된다(도 10 A, B).
또한, DGKs KO 139 CAR-T 세포에서 강하게 활성된 신호에도 불구하고, 타겟 암세포가 없을 때의 기초 사이토카인 증가가 관찰되지 않았고 이는 DGKs KO의 높은 안전성을 암시한다.(도 11 A). 또한, 139 CAR-T 세포와 비교하면, DGKs KO 139 CAR-T 세포에서 exhaustion marker인 PD-11과 TIM-33의 발현이 증가하지 않았고, 이러한 결과는 DGKs KO이 장기간 항원 노출 후에 T 세포의 exhaustion을 촉진하지 않음을 예측할 수 있다(도 11 B).
139 CAR-T 세포의 항암효과는 TGF-β1 및 PGE2와 같은 시그널1 면역억제 억제제를 처리한 경우 현저하게 손상되는 반면, DGKαζ KO 139 CAR-T 세포의 경우, 억제성 용해 인자가 존재할 때에도 세포독성 및 사이토카인 방출이 유지됨을 확인하였다(도 12 A, B).
이러한 결과를 통해, CRISPR/Cas9을 이용하여 DGK를 제거함으로써 T 세포 기능을 활성화시킬 수 있음을 확인하였다.
즉, DGK의 제거가 CD3 말단 신호를 강화시켜 항암 기능 및 CAR-T 세포의 증식을 높인다는 것을 확인하였다.
또한, DGKαζ (두 개의 isoforms)의 녹아웃(KO) CAR-T 세포는 exhaustion markers의 현저한 증가를 나타내지 않았고, TGF-β 및 프로스타글란딘 E2(prostaglandin E2, PGE2)와 같은 면역억제 용해성 인자에 덜 반응하였다.
이처럼, CRISPR/Cas9에 의한 DGK KO에 의해 T 세포의 증가된 이펙터 기능을 강화시킬 수 있음을 확인하였다.
실시예 7: NK(Natural Killer) 세포의 활성화 및 사이토카인 분비 증진시험
7.1 NK 92 세포주 및 인간 원발성 NK ( human primary NK ) 세포 배양
NK92 세포주를 ATCC(CRL-2407)로부터 구입하고, Primary NK 세포는 STEMCELL TECHNOLOGY로부터 구입하여, 제공된 프로토콜에 따라 배양하였다.
NK92 세포는, 100 μg/ml 스트렙토마이신, 100 U/ml 페니실린, 2 mM 울트라글루타민I(UltraGlutamine I), 200 ~ 300 U/ml IL-2 및 10 U/ml IL-15로 보충된 10% FCS(fetal calf serum) 함유 RPMI 1640 (WellGene)배지에서 배양하였다.
7.2 전기천공법(elctroporation)에 의한 도입
NK92 세포주에서 DGKα, DGKζ를 넉아웃하기 위해, Neon electroporator (Thermo Fisher Scientific)으로 1200V, 10ms, 3 펄스 조건에서 천기천공법을 수행하였다. 원발성 NK 세포에 대해서는 1200V, 20ms, 3 펄스 조건으로 수행하였다.
4 μg의 재조합 S. pyogenes Cas9 단백질(Toolgen, 한국) 및 1 μg의 화학적으로 합성된 tracr/crRNA (Integrated DNA Technologies)를 20분 동안 인큐베이션하여 Cas9 RNP 복합체를 수득하였다.
R buffer에 재현탁시킨 2×10^5 NK92 세포를 미리 인큐베이션시킨(pre-incubated) Cas9 RNP 복합체에 첨가(접촉)시켜 전기천공하였다. 그 후, 세포들을 배지에서 4×10^5 cells/mL 농도로 플레이팅하였다.
실험에 사용한 crRNA 표적화 서열은 다음과 같다:
DGKα: CTCTCAAGCTGAGTGGGTCC
DGKζ: ACGAGCACTCACCAGCATCC.
7.3 In vitro 킬링 어세이(killing assay)
NK92 세포 및 원발성 NK 세포의 세포독성(cytotoxicity)을 분석하기 위하여, 세포를 U-bottom 96 플레이트에서 CellTrace Far Red (Invitrogen)으로 염색된 Raji 세포 또는 1x10^5 K562와 공배양하였다. 공배양 18시간 후 세포들을 수확한 후, 7-AAD로 염색하여 flow cytometry을 이용하여 분석하였다. 모든 세포독성 실험은 3회 수행하였다.
그 결과를 도 13에 도시하였다. NK92 세포 및 원발성 NK 세포에서의 DGKα 넉아웃 효율(KO efficiency)이 우수함을 확인할 수 있었다(도 13 A 및 B) 또한, (B) 7-AAD 양성 Raji 세포의 측정을 통해 NK-92의 킬링(killing) 활성을 확인한 결과, DGKα 넉아웃에 의해 세포독성이 높아짐을 알 수 있었다.
특히, 이러한 결과는 유전적 조작이 쉽지 않은 것으로 알려져있는 NK 세포에 대해서도 효과적으로 면역기능 조작이 가능함을 확인한 결과이다.
실시예 8: NKT(Natural Killer) 세포의 활성화 및 사이토카인 분비 증진시험
8.1 NKT 세포 배양
인간 PBMC를 STEMCELL TECHNOLOGY(Canada)로부터 구입하였다. 이들 세포를, 1000 U/ml 인터페론-γ(Pepro Tech)가 첨가된, 10% FBS 보충 RPMI 배지에 1×10^6 cells/ml의 농도로 플레이팅하였다. 50ng/ml 항-인간 OKT-3 (Biolegend)을 5일 동안, 그리고 400U/ml IL-2 (Pepro Tech)을 20일 동안 배양배지에 첨가하였다.
8.2 전기천공법(elctroporation)에 의한 도입
NKT 세포주에서 DGKα, DGKζ, PD1을 넉아웃하기 위해, Neon electroporator (Thermo Fisher Scientific)으로 1550V, 10ms, 3 펄스 조건에서 천기천공법을 수행하였다.
4 μg의 재조합 S. pyogenes Cas9 단백질(툴젠, 한국) 및 1 μg의 화학적으로 합성된 tracr/crRNA (Integrated DNA Technologies)를 20분동안 인큐베이션하여 Cas9 RNP 복합체를 수득하였다.
R buffer에 재현탁시킨 2×10^5 NKT 세포를 미리 인큐베이션시킨(pre-incubated) Cas9 RNP 복합체에 첨가(접촉)시켜 전기천공하였다. 그 후, 세포들을 배지에서 4×10^5 cells/mL 농도로 씨딩하였다.
실험에 사용한 crRNA 표적화 서열은 다음과 같다:
DGKα: CTCTCAAGCTGAGTGGGTCC
DGKζ: ACGAGCACTCACCAGCATCC.
PD-11: GTCTGGGCGGTGCTACAACTGGG
7.3 In vitro 킬링 어세이(killing assay)
NKT 세포의 세포독성(cytotoxicity)을 분석하기 위하여, CellTrace Far Red (Invitrogen)으로 염색된 2x10^44 U87vIII 세포와 NKT 세포를 U-bottom 96-웰 플레이트에서 공배양하였다. 공배양 18시간 후 세포들을 수확한 후, 7-AAD로 염색하여 flow cytometry을 이용하여 분석하였다. 모든 세포독성 실험은 3회 수행하였다.
그 결과, 도 14에 나타낸 바와 같이, human NKT세포에서 DGKα, DGKζ의 넉아웃이 CRISPR/Cas9 시스템에 의해 효율적으로 잘 일어났음을 확인할 수 있었다.
Deep sequencing에 의해 Indel 효율을 확인하고(도 14 A), CRISPR/Cas9 처리한 NKT 세포를 트립판 블루 염색으로 분석하여, 세포 성장(도 14 B) 및 생존능이 유지됨을 확인하였다(Viability=Viable cell number/Total cell number). 그리고 DGKα, DGKζ의 넉아웃이 잘 일어났음을 웨스턴 블랏 실험을 통해 단백질 수준에서 발현 여부를 확인하였다(도 14 D)
또한, 도 15에 나타낸 바와 같이, DGKα, DGKζ의 넉아웃이 NAT 세포의 이펙터 기능을 개선함을 확인할 수 있었다.
U87vIII, H460, 및 K562 세포에 Cell trace (Thermo fisher)를 처리하여 96-웰 플레이트에서 E:T(effector cell : target cell ratio) = 20:1의 비율로 18시간 동안 배양하고, 7-AAD 양성 암 세포들의 사멸정도를 flow cytometry로 분석한 결과, DGKα, DGKζ의 넉아웃이 해당 NKT 세포들의 NKT 킬링 활성을 높여주는 것을 알 수 있었다. DGKα, DGKζ의 각각의 넉아웃도 킬링 활성 증진의 효과가 있었지만, 두 유전자를 동시에 넉아웃한 경우 킬링 활성이 더 크게 향상됨을 확인하였다(도 15 A).
한편, ELISA (IFN- kit, Biolegend)에 의해 IFN-분비능을 확인한 결과, 마찬가지로 DGKα, DGKζ의 넉아웃이 해당 세포들의 IFN-분비능을 높여주는 것을 알 수 있었다. DGKα, DGKζ의 각각의 넉아웃도 IFN-분비능 증진의 효과가 있었지만, 두 유전자를 동시에 넉아웃한 경우 IFN-분비능이 더 크게 향상됨을 확인하였다(도 15 B).
한편, 도 16에 나타낸 바와 같이, human NKT 세포에서 CRISPR/Cas9 매개의 PD-1의 넉아웃이 NKT 세포의 이펙터 기능을 강화시킴을 확인하였다. PD NKT 세포에 CRISPR-Cas9을 이용하여 PD-1의 넉아웃을 유도하고, PD-1의 넉아웃 효율을 targeted deep sequencing으로 분석하였다. 또한 PD-1 넉아웃을 통한 NKT 세포의 항암 이펙터로서의 기능을 확인하기 위하여, U87vIII 세포와 NKT 세포를 공배양하였다. U87vIII 세포에 Cell Trace (Thermo fisher)를 처리하여 96- 플레이트에서 E:T = 50:1의 비율로 18시간 동안 배양하고, 7-AAD 양성 암 세포들을 flowcytometry로 분석하여 킬링 활성을 분석하였다.
그 결과, CRISPR/Cas9에 의한 PD-1 유전자 내의 높은 인델 효율을 확인하고(도 16A), 이에 따라 세포독성이 향상되는 것도 확인하였다(도 16B)
종합적으로, 상기의 결과는 CRISPR/Cas9에 의한 면역조절 유전자, 예를 들어, DGK 등의 넉아웃이 다양한 종류의 면역세포에서 의미 있는 면역기능 향상 효과를 가져올 수 있음을 보여준다.
이러한, DGK 넉아웃의 생물학적 효과는 T 세포, NK 세포, NKT 등의 세포에서 면역기능 향상을 통해 상기의 세포를 포함한 면역 세포들이 임상 적용 가능한 형태의 세포치료제로 개발될 수 있음을 보여준다.
인위적으로 조작한 면역조절요소 및 이를 포함하는 세포를 포함하는, 인위적으로 기능을 변형시킨 면역 시스템에 의해서, 효과적인 면역세포 치료제를 수득할 수 있다.
예를 들어, 본 발명의 방법, 조성물에 의해 인위적으로 조작된 면역조절요소를 조절할 경우, 면역세포의 생존(survival), 증식(proliferation), 지속(persistency), 세포독성(cytotoxicity), 사이토카인 분비(cytokine-release) 및/또는 침윤(infiltration) 등에 관여하는 면역 효능이 향상될 수 있다.

Claims (34)

  1. 핵산서열 내 변형이 일어난, PD-1, CTLA-4, A20, Dgkα, Dgkζ, Fas, EGR2, PPP2R2D, PSGL-1, KDM6A 및 Tet2로 구성된 군에서 선택된 하나 이상의 인위적으로 조작된 면역조절 유전자.
  2. 제1항에 있어서,
    상기 핵산서열 내 변형은 가이드핵산-에디터단백질 복합체에 의해 인위적으로 일어난 것을 특징으로 하는, 인위적으로 조작된 면역조절 유전자.
  3. 제1항에 있어서,
    상기 면역 조절 유전자는 A20, Dgkα, Dgkζ, EGR2, PSGL-1 또는 KDM6A인 것을 특징으로 하는 인위적으로 조작된 면역조절 유전자.
  4. 제1항에 있어서,
    상기 유전자는 가이드핵산-에디터단백질 복합체에 의해 인위적으로 조작된 면역조절 유전자로서,
    상기 면역조절 유전자를 구성하는 핵산서열 내 PAM(proto-spacer-adjacent Motif) 서열 중 또는 이의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp의 염기 서열 부위 내의
    하나 이상의 뉴클레오타이드의 결실 또는 삽입;
    야생형 유전자와 상이한 하나 이상의 뉴클레오타이드로의 치환;
    외부 유래의 하나 이상의 뉴클레오타이드 삽입
    중 하나 이상의 핵산의 변형, 또는
    상기 면역조절 유전자를 구성하는 핵산서열 내 하나 이상의 뉴클레오타이드의 화학적 변형
    을 포함하는 것을 특징으로 하는 인위적으로 조작된 면역조절 유전자.
  5. 제1항에 있어서,
    상기 핵산의 변형은 유전자의 프로모터 영역에서 일어난 것을 특징으로 하는인위적으로 조작된 면역조절 유전자.
  6. 제1항에 있어서,
    상기 핵산의 변형은 유전자의 엑손 영역에서 일어난 것을 특징으로 하는 인위적으로 조작된 면역조절 유전자.
  7. 제1항에 있어서,
    상기 핵산의 변형은 유전자의 인트론 영역에서 일어난 것을 특징으로 하는 인위적으로 조작된 면역조절 유전자.
  8. 제1항에 있어서,
    상기 핵산의 변형은 유전자의 인핸서 영역에서 일어난 것을 특징으로 하는 인위적으로 조작된 면역조절 유전자.
  9. 제4항에 있어서,
    상기 PAM 서열은 하기의 서열 중 1 이상인 것을 특징으로 하는 인위적으로 조작된 면역조절 유전자(5'에서 3'방향으로 기재함).
    NGG(N은 A, T, C 또는 G임);
    NNNNRYAC(N은 각각 독립적으로 A, T, C 또는 G이고, R은 A또는 G이고, Y는 C 또는 T임);
    NNAGAAW(N은 각각 독립적으로 A, T, C 또는 G이고, W는 A 또는 T임);
    NNNNGATT(N은 각각 독립적으로 A, T, C 또는 G임);
    NNGRR(T)(N은 각각 독립적으로 A, T, C 또는 G이고, R은 A 또는 G이고, Y는 C 또는 T임); 및
    TTN(N은 A, T, C 또는 G임).
  10. PD-1, CTLA-4, A20, Dgkα, Dgkζ, Fas, EGR2, PPP2R2D, PSGL-1, KDM6A 및 Tet2 중 선택된 하나 이상의 유전자의 핵산 서열 중 서열번호 1 내지 289번의 타겟 서열에 각각 상보적인 결합을 형성할 수 있는 가이드 핵산
  11. 제10항에 있어서,
    이하의 군으로부터 선택되는 1이상의 가이드 핵산:
    A20 유전자 핵산 서열 중 서열번호 6 및 11의 타겟 서열에 각각 상보적인 결합을 형성할 수 있는 가이드 핵산;
    DGKa 유전자 핵산 서열 중 서열번호 19, 20, 21, 및 23의 타겟 서열에 각각 상보적인 결합을 형성할 수 있는 가이드 핵산;
    EGR2 유전자 핵산 서열 중 서열번호 25의 타겟 서열에 각각 상보적인 결합을 형성할 수 있는 가이드 핵산;
    PPP2R2D 유전자 핵산 서열 중 서열번호 64의 타겟 서열에 각각 상보적인 결합을 형성할 수 있는 가이드 핵산;
    PD-1 유전자 핵산 서열 중 서열번호 87 및 89의 타겟 서열에 각각 상보적인 결합을 형성할 수 있는 가이드 핵산;
    Dgkζ 유전자 핵산 서열 중 서열번호 109, 110, 111, 112 및 113의 타겟 서열에 각각 상보적인 결합을 형성할 수 있는 가이드 핵산;
    Tet-2 유전자 핵산 서열 중 서열번호 126, 128 및 129의 타겟 서열에 각각 상보적인 결합을 형성할 수 있는 가이드 핵산;
    PSGL-1 유전자 핵산 서열 중 서열번호 182의 타겟 서열에 각각 상보적인 결합을 형성할 수 있는 가이드 핵산;
    FAS 유전자 핵산 서열 중 서열번호 252, 254, 257 및 264의 타겟 서열에 각각 상보적인 결합을 형성할 수 있는 가이드 핵산; 및
    KDM6A 유전자 핵산 서열 중 서열번호 285의 타겟 서열에 각각 상보적인 결합을 형성할 수 있는 가이드 핵산.
  12. 제10항에 있어서,
    상기 가이드 핵산은 18 내지 23 bp의 뉴클레오타이드인, gRNA 분자.
  13. 핵산서열 내 변형이 일어난, PD-1, CTLA-4, A20, Dgkα, Dgkζ, Fas, EGR2, PPP2R2D, PSGL-1, KDM6A 및 Tet2로 구성된 군에서 선택된 하나 이상의 인위적으로 조작된 면역조절 유전자 및 이로부터 발현되는 산물 중 1이상을 포함하는, 인위적으로 조작된 면역세포.
  14. 제13항에 있어서,
    상기 면역세포는 T 세포, CAR-T 세포, NK 세포 및 NKT 세포로 구성된 군에서 선택된 1 이상의 세포인 것을 특징으로 하는 인위적으로 조작된 면역세포.
  15. 제13항에 있어서,
    상기 면역세포는 상기 면역조절 유전자의 활성이 억제 또는 불활성화되도록 인위적으로 조작된 면역세포
  16. 제13항에 있어서,
    상기 면역 세포는 키메라 항원 수용체(CAR)를 추가로 더 포함하고 있는 것을 특징으로 하는, 인위적으로 조작된 면역세포
  17. 제14항에 있어서,
    상기 T 세포는 키메라 항원 수용체(CAR) 또는 조작된 TCR(T-세포 수용체)를 추가로 더 포함하고 있는 것을 특징으로 하는, 인위적으로 조작된 면역세포
  18. 제13항에 있어서,
    상기 면역세포는 가이드핵산-에디터단백질 복합체 또는 이들을 암호화하는 핵산서열을 추가로 포함하는, 인위적으로 조작된 면역세포.
  19. 제18항에 있어서, 상기 에디터단백질은
    스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophilus) 유래의 Cas9 단백질, 스트렙토코커스 아우레우스 (Streptococcus aureus) 유래의 Cas9 단백질, 네이세리아 메닝기디티스 (Neisseria meningitidis)유래의 Cas9 단백질, 및 Cpf1 단백질로 이루어진 군에서 선택된 하나 이상인 것을 특징으로 하는 인위적으로 조작된 면역세포.
  20. 제18항에 있어서,
    상기 가이드 핵산은 PD-1, CTLA-4, A20, Dgkα, Dgkζ, Fas, EGR2, PPP2R2D, PSGL-1, KDM6A 및 Tet2 로 구성된 군에서 선택된 하나 이상의 유전자의 핵산 서열 중 서열번호 1 내지 289번의 타겟 서열에 각각 상보적인 결합을 형성할 수 있는 것을 특징으로 하는 인위적으로 조작된 면역세포.
  21. 제13항에 있어서,
    상기 면역세포는 핵산서열 내 변형이 일어난, 인위적으로 조작된 Dgkα 및 Dgkζ유전자 중 1 이상을 포함하고 있는 것을 특징으로 하는, 인위적으로 조작된 면역세포.
  22. 제13항에 있어서,
    상기 면역세포는 핵산서열 내 변형이 일어난, 인위적으로 조작된 Dgkα 및 Dgkζ유전자를 함께 포함하고 있는 것을 특징으로 하는, 인위적으로 조작된 면역세포.
  23. PD-1, CTLA-4, A20, Dgkα, Dgkζ, Fas, EGR2, PPP2R2D, PSGL-1, KDM6A 및 Tet2 로 구성된 군에서 선택된 하나 이상의 유전자의 핵산 서열 중 서열번호 1 내지 289번의 타겟 서열에 각각 상보적인 결합을 형성할 수 있는 가이드 핵산; 및
    에디터단백질 또는 이를 암호화하는 핵산
    을 포함하는 유전자 조작용 조성물
  24. 제23항에 있어서, 상기 에디터단백질은
    스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophilus) 유래의 Cas9 단백질, 스트렙토코커스 아우레우스 (Streptococcus aureus) 유래의 Cas9 단백질, 네이세리아 메닝기디티스 (Neisseria meningitidis)유래의 Cas9 단백질, 및 Cpf1 단백질로 이루어진 군에서 선택된 하나 이상인 것을 특징으로 하는 유전자 조작용 조성물
  25. 제23항에 있어서, 상기 유전자 조작은
    면역조절 유전자를 구성하는 핵산서열 내 PAM(proto-spacer-adjacent Motif) 서열 중 또는 이의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp의 염기 서열 부위 내의
    하나 이상의 뉴클레오타이드의 결실 또는 삽입;
    야생형 유전자와 상이한 하나 이상의 뉴클레오타이드로의 치환;
    외부 유래의 하나 이상의 뉴클레오타이드 삽입
    중 하나 이상의 핵산의 변형, 또는
    상기 면역조절 유전자를 구성하는 핵산서열 내 하나 이상의 뉴클레오타이드의 화학적 변형
    을 포함하는 것을 특징으로 하는 유전자 조작용 조성물
  26. 제24항에 있어서,
    상기 PAM 서열은 하기의 서열 중 1 이상인 것을 특징으로 하는 유전자 조작용 조성물(5'에서 3'방향으로 기재함):
    NGG(N은 A, T, C 또는 G임);
    NNNNRYAC(N은 각각 독립적으로 A, T, C 또는 G이고, R은 A또는 G이고, Y는 C 또는 T임);
    NNAGAAW(N은 각각 독립적으로 A, T, C 또는 G이고, W는 A 또는 T임);
    NNNNGATT(N은 각각 독립적으로 A, T, C 또는 G임);
    NNGRR(T)(N은 각각 독립적으로 A, T, C 또는 G이고, R은 A 또는 G이고, Y는 C 또는 T임); 및
    TTN(N은 A, T, C 또는 G임).
  27. 인체에서 분리된 면역세포에
    (a) PD-1, CTLA-4, A20, Dgkα, Dgkζ, Fas, EGR2, PPP2R2D, PSGL-1, KDM6A 및 Tet2 로 구성된 군에서 선택된 하나 이상의 유전자의 핵산 서열 중 서열번호 1 내지 289번의 타겟 서열에 각각 상보적인 결합을 형성할 수 있는 가이드 핵산; 및
    (b) 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophilus) 유래의 Cas9 단백질, 스트렙토코커스 아우레우스 (Streptococcus aureus) 유래의 Cas9 단백질, 네이세리아 메닝기디티스 (Neisseria meningitidis)유래의 Cas9 단백질, 및 Cpf1 단백질로 이루어진 군에서 선택된 하나 이상인 에디터 단백질을
    접촉시키는 단계를 포함하는, 면역 세포를 인위적으로 조작하는 방법.
  28. 제27항에 있어서,
    상기 가이드 핵산 및 에디터 단백질은
    각각 핵산 서열의 형태로 1 이상의 벡터에 존재하거나, 또는
    가이드 핵산과 에디터 단백질의 결합으로 복합체를 형성하여 존재하는 것을 특징으로 하는 면역 세포를 인위적으로 조작하는 방법.
  29. 제27항에 있어서,
    상기 접촉시키는 단계는 생체 외에서 수행되는 것을 특징으로 하는 방법.
  30. 제27항에 있어서,
    상기 접촉시키는 단계는 전기천공법 (electroporation), 리포좀, 플라스미드, 바이러스 벡터, 나노파티클(nanoparticles) 및 PTD (Protein translocation domain) 융합 단백질 방법 중 선택되는 1이상의 방법으로 수행되는 것을 특징으로 하는 방법.
  31. 제30항에 있어서,
    상기 바이러스 벡터는 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스(AAV), 백시니아바이러스, 폭스바이러스 및 단순포진 바이러스로 구성된 군에서 선택되는 1이상인 것을 특징으로 하는 방법.
  32. PD-1, CTLA-4, A20, Dgkα, Dgkζ, Fas, EGR2, PPP2R2D, PSGL-1, KDM6A 및 Tet2 중 1 이상의 유전자를 서열분석함으로써 대상체에서 상기 면역 세포 표적 위치의 서열에 대한 정보를 제공하는 방법.
  33. 제32항의 방법을 통해 제공받은 정보를 이용하여 라이브러리를 구축하는 방법.
  34. (a) PD-1, CTLA-4, A20, Dgkα, Dgkζ, Fas, EGR2, PPP2R2D, PSGL-1, KDM6A 및 Tet2 로 구성된 군에서 선택된 하나 이상의 유전자의 핵산 서열 중 서열번호 1 내지 289번의 타겟 서열에 각각 상보적인 결합을 형성할 수 있는 가이드 핵산;
    (b) 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophilus) 유래의 Cas9 단백질, 스트렙토코커스 아우레우스 (Streptococcus aureus) 유래의 Cas9 단백질, 네이세리아 메닝기디티스 (Neisseria meningitidis)유래의 Cas9 단백질, 및 Cpf1 단백질로 이루어진 군에서 선택된 하나 이상인 에디터 단백질 또는 이를 암호화하는 핵산
    을 포함하는 유전자 조작용 키트.
PCT/KR2017/008835 2016-08-12 2017-08-14 조작된 면역조절요소 및 이에 의해 변형된 면역 활성 WO2018030874A1 (ko)

Priority Applications (17)

Application Number Priority Date Filing Date Title
BR112019002779-3A BR112019002779A2 (pt) 2016-08-12 2017-08-14 elemento imunorregulador manipulado e imunidade alterada por este
CA3033736A CA3033736C (en) 2016-08-12 2017-08-14 Manipulated immunoregulatory element and immunity altered thereby
EP17839891.3A EP3498846A4 (en) 2016-08-12 2017-08-14 MANIPULATED IMMUNEGULATORY ELEMENT AND CHANGED IMMUNITY
US16/324,955 US20190185860A1 (en) 2016-08-12 2017-08-14 Manipulated Immunoregulatory Element And Immunity Altered Thereby
CN201780063250.1A CN109844118A (zh) 2016-08-12 2017-08-14 经操纵的免疫调节因子以及由此改变的免疫力
AU2017308473A AU2017308473B2 (en) 2016-08-12 2017-08-14 Manipulated immunoregulatory element and immunity altered thereby
JP2019507817A JP7215808B2 (ja) 2016-08-12 2017-08-14 操作された免疫調節エレメントおよび変更された免疫
RU2019106669A RU2767206C2 (ru) 2016-08-12 2017-08-14 Модифицированный иммунорегуляторный элемент и изменение иммунитета посредством этого элемента
SG11201901184QA SG11201901184QA (en) 2016-08-12 2017-08-14 Manipulated immunoregulatory element and immunity altered thereby
AU2018264636A AU2018264636B2 (en) 2017-05-08 2018-05-08 Artificially manipulated immune cell
US16/611,383 US20210147798A1 (en) 2017-05-08 2018-05-08 Artificially Manipulated Immune Cell
KR1020180052448A KR20180123445A (ko) 2017-05-08 2018-05-08 인위적으로 조작된 조작면역세포
PCT/KR2018/005284 WO2018208067A1 (ko) 2017-05-08 2018-05-08 인위적으로 조작된 조작면역세포
JP2019561310A JP7235391B2 (ja) 2017-05-08 2018-05-08 人工的に操作された免疫細胞
CN201880045774.2A CN110914431B (zh) 2017-05-08 2018-05-08 经人工操纵的免疫细胞
KR1020197036278A KR102338993B1 (ko) 2017-05-08 2018-05-08 인위적으로 조작된 조작면역세포
JP2023004738A JP2023052426A (ja) 2016-08-12 2023-01-16 操作された免疫調節エレメントおよび変更された免疫

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR10-2016-0103308 2016-08-12
KR1020160103308 2016-08-12
US201762502822P 2017-05-08 2017-05-08
US62/502,822 2017-05-08

Publications (1)

Publication Number Publication Date
WO2018030874A1 true WO2018030874A1 (ko) 2018-02-15

Family

ID=61163220

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2017/008835 WO2018030874A1 (ko) 2016-08-12 2017-08-14 조작된 면역조절요소 및 이에 의해 변형된 면역 활성

Country Status (2)

Country Link
KR (1) KR20180018457A (ko)
WO (1) WO2018030874A1 (ko)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108753817A (zh) * 2018-04-13 2018-11-06 北京华伟康信生物科技有限公司 增强细胞的抗癌能力的方法及采用该方法获得的增强型细胞
CN111321171A (zh) * 2018-12-14 2020-06-23 江苏集萃药康生物科技有限公司 一种应用CRISPR/Cas9介导ES打靶技术制备基因打靶动物模型的方法
WO2020168392A1 (en) * 2019-02-22 2020-08-27 Garvan Institute Of Medical Research Methods of modulating immune response via snvs of a20 that can "tune" the immune system of a subject
WO2021044378A1 (en) * 2019-09-06 2021-03-11 Crispr Therapeutics Ag Genetically engineered t cells having improved persistence in culture
AU2018264636B2 (en) * 2017-05-08 2022-03-17 Toolgen Incorporated Artificially manipulated immune cell

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220192163A1 (en) 2019-03-26 2022-06-23 Toolgen Incorporated Hemophilia b rat model

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140120622A1 (en) * 2012-10-10 2014-05-01 Sangamo Biosciences, Inc. T cell modifying compounds and uses thereof
KR20150105635A (ko) * 2012-12-12 2015-09-17 더 브로드 인스티튜트, 인코퍼레이티드 서열 조작을 위한 crispr-cas 성분 시스템, 방법 및 조성물
KR20160018425A (ko) * 2014-08-06 2016-02-17 차의과학대학교 산학협력단 조직적합성항원 유전자들의 교정을 통하여 구축한, 면역적합형 세포
US20160120906A1 (en) * 2013-05-13 2016-05-05 Cellectis Methods for engineering highly active t cell for immunotheraphy

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140120622A1 (en) * 2012-10-10 2014-05-01 Sangamo Biosciences, Inc. T cell modifying compounds and uses thereof
KR20150105635A (ko) * 2012-12-12 2015-09-17 더 브로드 인스티튜트, 인코퍼레이티드 서열 조작을 위한 crispr-cas 성분 시스템, 방법 및 조성물
US20160120906A1 (en) * 2013-05-13 2016-05-05 Cellectis Methods for engineering highly active t cell for immunotheraphy
KR20160018425A (ko) * 2014-08-06 2016-02-17 차의과학대학교 산학협력단 조직적합성항원 유전자들의 교정을 통하여 구축한, 면역적합형 세포

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
FAGERLUND, ROBERT D. ET AL.: "The Cpfl CRISPR-Cas Protein Expands Genome-editing Tools", GENOME BIOLOGY, vol. 16, 2015, pages 1 - 3, XP055271439 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2018264636B2 (en) * 2017-05-08 2022-03-17 Toolgen Incorporated Artificially manipulated immune cell
CN108753817A (zh) * 2018-04-13 2018-11-06 北京华伟康信生物科技有限公司 增强细胞的抗癌能力的方法及采用该方法获得的增强型细胞
CN111321171A (zh) * 2018-12-14 2020-06-23 江苏集萃药康生物科技有限公司 一种应用CRISPR/Cas9介导ES打靶技术制备基因打靶动物模型的方法
WO2020168392A1 (en) * 2019-02-22 2020-08-27 Garvan Institute Of Medical Research Methods of modulating immune response via snvs of a20 that can "tune" the immune system of a subject
WO2021044378A1 (en) * 2019-09-06 2021-03-11 Crispr Therapeutics Ag Genetically engineered t cells having improved persistence in culture
US20210079347A1 (en) * 2019-09-06 2021-03-18 Crispr Therapeutics Ag Genetically engineered t cells having improved persistence in culture

Also Published As

Publication number Publication date
KR20180018457A (ko) 2018-02-21

Similar Documents

Publication Publication Date Title
WO2018030874A1 (ko) 조작된 면역조절요소 및 이에 의해 변형된 면역 활성
KR102276371B1 (ko) 조작된 면역조절요소 및 이에 의해 변형된 면역 활성
WO2018208067A1 (ko) 인위적으로 조작된 조작면역세포
AU2018220087B2 (en) Hla g-modified cells and methods
AU2016231061B2 (en) Methods for engineering allogeneic T cell to increase their persistence and/or engraftment into patients
WO2018217064A2 (ko) 형질전환된 t세포를 이용한 자연살해세포의 배양방법
CN110869046A (zh) 通用型抗cd22嵌合抗原受体工程化的免疫细胞
WO2018088694A2 (ko) 인위적으로 조작된 sc 기능 조절 시스템
WO2020101361A1 (ko) 형질전환된 t세포를 이용한 제대혈 유래 자연살해세포의 배양방법
CA2422597A1 (en) T cell receptor transfer into a candidate effector cell or a precursor thereof
WO2018230976A1 (ko) 반복 확장 돌연변이에 대한 게놈 편집 시스템
WO2021170089A1 (en) Engineering immune cells via simultaneous knock-in and gene disruption
WO2020085827A1 (ko) 조작된 면역 세포
WO2023167575A1 (ko) 저면역원성 줄기세포, 줄기세포로부터 분화되거나 유래된 저면역원성 세포 및 이의 제조방법
WO2023282730A1 (ko) 트랜스포존 시스템 및 이의 용도
WO2022010220A1 (ko) 면역원성이 감소된 신규한 이식용 세포
WO2022075784A1 (ko) T 세포 수용체, t 세포 수용체를 포함하는 면역 세포 및 이를 이용하는 방법
WO2024058589A1 (ko) 유전자 가위 넉-인을 이용하여 제조한 키메릭 항원 수용체 세포 및 이의 용도
WO2021145700A1 (ko) 저산소 환경 하에서 높은 적응력을 가지는 세포 및 이의 용도
WO2022220648A1 (ko) Hla-dr 특이적 키메라 항원 수용체 및 이의 용도
WO2023038475A1 (ko) 유도 자연살해세포의 제조방법 및 그의 용도

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17839891

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 3033736

Country of ref document: CA

Ref document number: 2019507817

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2017308473

Country of ref document: AU

Date of ref document: 20170814

Kind code of ref document: A

ENP Entry into the national phase

Ref document number: 2017839891

Country of ref document: EP

Effective date: 20190312

REG Reference to national code

Ref country code: BR

Ref legal event code: B01A

Ref document number: 112019002779

Country of ref document: BR

ENP Entry into the national phase

Ref document number: 112019002779

Country of ref document: BR

Kind code of ref document: A2

Effective date: 20190211