WO2020046047A1 - 세포의 유전체에서 표적 핵산을 변형시키는 방법 - Google Patents

세포의 유전체에서 표적 핵산을 변형시키는 방법 Download PDF

Info

Publication number
WO2020046047A1
WO2020046047A1 PCT/KR2019/011166 KR2019011166W WO2020046047A1 WO 2020046047 A1 WO2020046047 A1 WO 2020046047A1 KR 2019011166 W KR2019011166 W KR 2019011166W WO 2020046047 A1 WO2020046047 A1 WO 2020046047A1
Authority
WO
WIPO (PCT)
Prior art keywords
pam
nucleic acid
spcas9
target nucleic
cas9
Prior art date
Application number
PCT/KR2019/011166
Other languages
English (en)
French (fr)
Inventor
김형범
김희권
Original Assignee
연세대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 연세대학교 산학협력단 filed Critical 연세대학교 산학협력단
Priority to US17/271,971 priority Critical patent/US20210340528A1/en
Priority to EP19854936.2A priority patent/EP3845645A4/en
Publication of WO2020046047A1 publication Critical patent/WO2020046047A1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites

Definitions

  • the present invention relates to a method for genome editing of cells using a novel protospacer adjacent motif.
  • the CRISPR-Cas9 system is an adaptive immune system found in bacteria and archaea and is used for genome editing of various cells, including various biological and human cells.
  • PAM protospacer adjacent motif
  • the PAM sequence of Streptococcus pyogenes Cas9 (SpCas9), the most commonly used CRISPR nuclease, is 5'-NGG-3 '.
  • Other CRISPR nucleases that exhibit efficient activity in mammalian cells recognize other PAMs in addition to NGG.
  • CRISPR nuclease variants have been developed that target sequences without PAM sequences, but there are still sequences that are not targeted.
  • xCas9 and SpCas9-NG have been developed that can target sequences with PAMs other than NGG (Hu, J.H. et al., Nature vol.556, pp.57-63 (2016)).
  • xCas9 showed lower off-target activity compared to SpCas9.
  • the activity of xCas9 and SpCas9-NG was only studied with only 20 and 69 intrinsic human genome sequences, respectively, and no extensive investigation of the target sequence has been made.
  • cells in which the target nucleic acid of the genome has been modified by a method of modifying the target nucleic acid in the genome of a cell using the novel PAM sequence.
  • One aspect is a method of modifying a target nucleic acid in a genome of a cell, the method comprising incubating the target nucleic acid, a clustered regularly interspaced palindromic repeats-associated (CRISPR associated) nuclease or variant thereof, and a guide RNA to provide.
  • CRISPR associated clustered regularly interspaced palindromic repeats-associated
  • the cell may be a cell in vivo or an isolated cell. If the cell is a cell in vivo, the method may be performed in vivo. If the cell is an isolated cell, the method may be performed ex vivo or in vitro.
  • the cells may be somatic cells, germ cells, stem cells, cancer cells, or cell lines.
  • the cells may be selected from the group consisting of cancer cells, stem cells, vascular endothelial cells, leukocytes, immune cells, epithelial cells, germ cells, fibroblasts, muscle cells, bone marrow cells, epidermal cells, osteoblasts, and neurons.
  • the cells may be cells of animals, plants, bacteria, or fungi, including humans.
  • the genome refers to all genetic information of living things or cells.
  • the target nucleic acid means a nucleic acid to be modified.
  • the method of modifying a target nucleic acid in a cell's genome may also be called genome editing.
  • the method comprises incubating a cell comprising a target nucleic acid, a clustered regularly interspaced palindromic repeats-associated (CRISPR associated) nuclease or variant thereof, and a guide RNA.
  • CRISPR associated clustered regularly interspaced palindromic repeats-associated
  • the target nucleic acid may comprise a protospacer adjacent motif (PAM), and a target sequence complementary to the guide RNA.
  • PAM protospacer adjacent motif
  • the protospacer-adjacent motif may be a nucleotide sequence recognized by Cas nuclease in a target nucleic acid.
  • the PAM is 5'-NA-3 ', 5'-NTG-3', 5'-GTH-3 ', 5'-VCGD-3', 5'-TCGDG-3 ', 5'-GGT-3' , 5'-BGC-3 ', 5'-RTG-3', 5'-NYGG-3 ', 5'-AGCCA-3', 5'-CTGCA-3 ', 5'-TGTCA-3', 5 '-GCGCA-3', 5'-GCGCT-3 ', 5'-GCGTT-3', 5'-AGCCC-3 ', 5'-CGTCA-3', 5'-GCGTA-3 ', 5'- AGCCG-3 ', 5'-GCGTC-3', 5'-AGTCA-3 ', 5'-AGCAC-3' and 5'-AGCTC-3
  • 'A' means adenine (A)
  • 'G' means guanine (G)
  • 'C' means cytosine (C)
  • 'N' means adenine (A), guanine (G), cytosine (C), thymine (T), uracil (U), unknown, or other nucleic acid.
  • 'H' refers to a base other than guanine (G) and may be adenine (A), cytosine (C), thymine (T), or uracil (U).
  • 'V' means a base other than thymine (T) and uracil (U), and may be adenine (A), guanine (G), or cytosine (C).
  • 'D' means a base other than cytosine (C) and may be adenine (A), guanine (G), thymine (T), or uracil (U).
  • 'B' means a base other than adenine (A) and may be guanine (G), cytosine (C), thymine (T), or uracil (U).
  • 'R' means purine and may be adenine (A) or guanine (G).
  • 5′-NA-3 ′ is 5′-AA-3 ′, 5′-GA-3 ′, 5′-CA-3 ′, or 5′-TA-3 ′.
  • 5'-NTG-3 ' is 5'-ATG-3', 5'-GTG-3 ', 5'-CTG-3', or 5'-TTG-3 '.
  • 5'-GTH-3 ' is 5'-GTA-3', 5'-GTC-3 ', or 5'-GTT-3'.
  • 5'-VCGD-3 ' is 5'-ACGA-3', 5'-ACGG-3 ', 5'-ACGT-3', 5'-GCGA-3 ', 5'-GCGG-3', 5 ' -GCGT-3 ', 5'-CCGA-3', 5'-CCGG-3 ', or 5'-CCGT-3'.
  • 5'-TCGDG-3 ' is 5'-TCGAG-3', 5'-TCGGG-3 ', or 5'-TCGTG-3'.
  • 5'-BGC-3 ' is 5'-GGC-3', 5'-CGC-3 ', or 5'-TGC-3'.
  • 5'-RTG-3 ' is 5'-ATG-3' or 5'-GTG-3 '.
  • 5'-NYGG-3 ' is 5'-ACGG-3', 5'-ATGG-3 ', 5'-GCGG-3', 5'-GTGG-3 ', 5'-CCGG-3', 5 ' -CTGG-3 ', 5'-TCGG-3', or '5'-TTGG-3'.
  • the PAM may be immediately adjacent or consecutive to the 3'-end or 5'-end of the target sequence.
  • the Cas nuclease may be an endonuclease that cleaves a nucleic acid double strand.
  • the Cas nuclease may be an RNA guided DNA endonuclease.
  • the Cas nuclease is Streptococcus sp., Campylobacter sp., Legionella sp., Neisseria sp., Pasteurella sp. ), Francisella sp., And Prevotella sp., Nucleases derived from bacteria selected from the group consisting of.
  • the Cas nuclease is Streptococcus pyogenes, Streptococcus thermophilus, Streptococcus aureus, Campylobacter jejuni, Legionella pneumophila (Legionella pneumophila), Neisseria meningitidis, Pasteurella multocida, Francisella novicida, and Prevotella disiens. Nucleases derived from the selected bacterium.
  • the Cas nuclease may be Cas9, Cpf1, C2c1, C2c2, C2c3, Cas3, Cas5, Cas7, Cas8, or Cas10.
  • the Cas9 is, for example, Streptococcus pyogenes-derived Cas9 (Streptococcus pyogenes Cas9: SpCas9).
  • the variant of Cas nuclease is a variant that retains the function of Cas nuclease.
  • the variant of Cas nuclease is composed of xCas9, SpCas9-NG, Cas9 nickase (Cas9 nickase: Cas9 nickase), inactivated Cas9 (Deactivated Cas9: dCas9), and destabilized Cas9 (Destabilized Cas9: DD-Cas9) group Can be selected from.
  • the polynucleotide encoding the Cas nuclease or variant thereof may be contained in a plasmid vector or a viral vector.
  • the PAM is 5'-NA-3 ', 5'-NTG-3', 5'-GTH-3 ', 5'-VCGD-3', and It may be a polynucleotide consisting of a nucleotide sequence selected from the group consisting of 5'-TCGDG-3 '.
  • the PAM is 5'-GGT-3 ', 5'-BGC-3', 5'-RTG-3 ', 5'-NYGG- 3 ', 5'-AGCCA-3', 5'-CTGCA-3 ', 5'-TGTCA-3', 5'-GCGCA-3 ', 5'-GCGCT-3', 5'-GCGTT-3 ' , 5'-AGCCC-3 ', 5'-CGTCA-3', 5'-GCGTA-3 ', 5'-AGCCG-3', 5'-GCGTC-3 ', 5'-AGTCA-3', 5 It may be a polynucleotide consisting of a nucleotide sequence selected from the group consisting of '-AGCAC-3' and 5'-AGCTC-3 '.
  • guide RNA refers to a polynucleotide that recognizes a target nucleic acid in a cell through genome editing to cleave, insert, or link the target nucleic acid.
  • the guide RNA may comprise a sequence complementary to the target sequence of the target nucleic acid.
  • the guide RNA may be a polynucleotide complementary to a nucleotide sequence of 2 to 24 nucleotides (hereinafter referred to as 'nt') consecutive in the 5 'or 3' direction of PAM in the target nucleic acid.
  • the length of the guide RNA may be 17 nt, 18 nt, 19 nt, 20 nt, 21 nt, 22 nt, 23 nt, or 24 nt.
  • the guide RNA may be a single-chain guide RNA (sgRNA).
  • the sgRNA may comprise tracrRNA complexed with crRNA (CRISPR RNA) and / or Cas nuclease specific for the target nucleic acid sequence.
  • CRISPR RNA crRNA
  • the guide RNA may be contained in a plasmid vector or a viral vector.
  • the incubation may be to introduce a polynucleotide and guide RNA encoding a Cas nuclease or variant thereof into a cell comprising the target nucleic acid.
  • the introduction includes integration, transformation, transduction, transfection, or a combination thereof.
  • the introduction may be transient or stable introduction.
  • the target nucleic acid can be recognized by the Cas nuclease or variant thereof, and a complex of the guide RNA.
  • the Cas nuclease or variant thereof, and a complex of guide RNA may be sequence-specifically modified to the target nucleic acid.
  • the modification may be insertion, cleavage, insertion, ligation, deaminoation, or a combination thereof.
  • the cleavage can be a cleavage of the double strand of genomic DNA.
  • the cleavage can be a blunt end or a sticky end.
  • the modification may be the insertion of a foreign polynucleotide at the site of cleavage and cleavage of the target nucleic acid. Inserting a foreign polynucleotide into the cleavage site of the genome may be by homology dependent method.
  • the homology dependent method may be homologous recombination or homology-directed repair (HDR).
  • the method can be performed in vitro, ex vivo, or in vivo.
  • Another aspect provides a cell in which the target nucleic acid of the genome is modified by a method of modifying the target nucleic acid in the genome of the cell of one aspect.
  • the cells, genomes, target nucleic acids, and modifications are as described above.
  • genome editing can be performed by targeting genomic editing to a position that has not been previously targeted. This makes it possible to expand the scope of application of genome editing.
  • FIG. 1A is a schematic diagram illustrating an experimental procedure for determining PAM sequences using a fixed protospacer
  • FIG. 1B is a schematic diagram of experimental designs for PAM sequence determination.
  • 2A to 2C are graphs showing the indel frequency (%) according to the PAM sequence of xCas9 nuclease.
  • 3A to 3C are graphs showing the indel frequency (%) according to the PAM sequence of SpCas9-NG nuclease.
  • 4A-4C are graphs showing indel frequencies (%) according to the PAM sequence of SpCas9 nuclease.
  • 5A-5C are heat maps showing indel frequencies (%) according to the first to fifth positions in the PAM sequence of xCas9, SpCas9-NG, and SpCas9 nuclease, respectively.
  • 6A-6C are graphs showing indel frequencies (%) according to the PAM sequence of xCas9, SpCas9-NG, and SpCas9 nuclease, respectively.
  • 7A-7C show the average indel frequencies (%) of xCas9 and SpCas9, the average indel frequencies (%) of SpCas9-NG and SpCas9, and the average indel frequencies (%) of xCas9 and SpCas9-NG, respectively, for the PAM sequence. to be.
  • oligonucleotide libraries were prepared by Twist Bioscience Co. to identify PAM sequences recognized by Cas nuclease.
  • Each oligonucleotide is 19- or 20-nt sgRNA from the 5 'end, BsmBI restriction site, barcode 1 (20-nt sequence), second BsmBI restriction site, barcode 2 (15-nt sequence), and PAM It was designed to include a 30-nt target sequence containing.
  • Plasmid libraries containing sgRNAs and target sequences used a two-step cloning method to prevent uncoupling between the guide RNA and the target sequence during PCR amplification of the oligonucleotide pool.
  • the first step is the construction of an initial plasmid library comprising guide RNA and target sequence.
  • Lsm-gRNA-Puro plasmid (Addgene, # 84752) was linearized using BsmBI restriction enzyme (NEB) and a PCR-amplified oligonucleotide pool (target sequence) was ligated to the linearized vector.
  • the reaction was transformed into E. coli and plasmids were isolated from selected colonies.
  • Primers used for oligonucleotide pool amplification are as follows.
  • the second step is the insertion of the sgRNA scaffold.
  • the plasmid library prepared in the first step was digested with BsmBI restriction enzyme (NEB) and nucleic acid fragments were purified from the gel after agarose electrophoresis. Insert fragments containing sgRNA scaffolds were synthesized and cloned into TOPO vectors (T-blunt vector, Solgent). The sequence of the insert fragments is shown below, sgRNAs containing poly T sequences are shown in bold and the BsmBI restriction site is underlined.
  • BsmBI restriction enzyme N-smBI restriction enzyme
  • the TOPO vector containing the insert fragment was digested with BsmBI restriction enzyme (NEB) to isolate the 83-nt insert fragment. Insert fragments were ligated to the truncated plasmid library, transformed into E. coli, and the plasmid library was isolated from the selected colonies.
  • BsmBI restriction enzyme NEB
  • HEK293T cells (ATCC), human embryonic kidney cells, were prepared for lentiviral library production.
  • the plasmids prepared in Example 1.1, psPAX2, and pMD2.G were mixed and transfected into HEK293T cells using Lipofectamine 2000 (Invitrogen). Fresh medium was added to the cells 12 hours after transfection and supernatants containing virus were obtained 36 hours after transfection. The obtained supernatant was filtered through Millex-HV 0.45 ⁇ m low protein binding membrane (Millipore) and aliquots were stored at ⁇ 80 ° C. until use. Virus yield was verified by measurement with Lenti-X p24 Rapid Titer Kit (Clontech).
  • serially diluted virus aliquots were transduced into HEK293T cells in the presence of 8 ⁇ g / ml polybrene and 2 ⁇ g / ml puromycin or 20 ⁇ g / ml blasticidin It was calculated by culturing in the presence of S (InvivoGen).
  • HEK293T cells were cultured overnight in a culture dish.
  • a lentiviral library of multiplicity of infection (MOI) 0.3 was transduced into HEK293T cells in the presence of 8 ⁇ g / ml polybrene and the cells were cultured overnight.
  • Cells were cultured in the presence of 2 ⁇ g / ml puromycin to remove untransduced cells and the cell library was maintained in an amount of 1.2 ⁇ 10 7 cells.
  • Cell libraries of amounts of 1.2 ⁇ 10 7 cells were prepared and xCas9-, SpCas9-NG, and SpCas9-encoding viruses were transduced into cells in the presence of 8 ⁇ g / ml polybrene. Transduction was performed with MOI 5 and cells were selected in the presence of 20 ⁇ g / ml blasticidine S.
  • genomic DNA was isolated from cells using the Wizard Genomic DNA purification kit (Promega). Inserted target sequences were PCR amplified using 2X Taq PCR Smart mix (Solgent) for high performance experiments. In the first PCR, a total of 240 ⁇ g of genomic DNA for each cell library was used to provide at least 1000 ⁇ coverage for the library (about 10 ⁇ g of genomic DNA per 10 6 cells). 2.5 ⁇ g of genomic DNA for each reaction was first PCR and all reaction products were pooled. 50 ng of the sample in the purified product was subjected to secondary PCR amplification using a primer containing Illumina adapter and barcode sequence. The amplified product was purified after electrophoresis and analyzed using HiSeq or MiniSeq (Illumina).
  • the Python scripts program was modified to analyze high-depth sequencing data. Each guide RNA and target sequence pair was identified using a 15-nt barcode and a total of 19-nt sequences of 4-nt upstream. Indels were considered xCas9-, SpCas9-NG-, or SpCas9-induced mutations if the indel was located at the expected cleavage site (ie, the 8-nt region located in the middle of the site). In order to remove background indel frequency resulting from array synthesis and PCR amplification, the indel frequency without total read, indel read, and Cas9 was calculated, and the indel frequency (%) was calculated according to the following equation. Calculated.
  • PAM sequences with an average indel frequency of at least 5% were selected for up to 6 days after transduction in human cells and the indel frequencies according to xCas9, SpCas9-NG, and SpCas9 nuclease and PAM sequences were analyzed.
  • Indel frequencies (%) according to xCas9 nuclease and PAM sequence are shown in FIGS. 2A-2C
  • indels frequencies (%) according to SpCas9-NG nuclease and PAM sequence are shown in FIGS. 3A-3C
  • SpCas9 nuclei Indel frequencies according to clease and PAM sequences are shown in FIGS.
  • the PAM sequence was divided into several groups.
  • the NGG PAM sequence generally showed the highest indel frequency.
  • the fourth nucleotide was C
  • the highest xCas9 activity was observed when the fifth nucleotide was A
  • the nucleotide that induced the highest xCas9 activity at the first position was S (ie G or C) rather than A.
  • the most potent xCas9 PAM sequence in this group was expected to be SGGCA.
  • Representative non-NGG PAMs for xCas9 were NGW (ie NG (A or T)), and BGC (or more broadly NGC) and SAG (or more broadly NAG) also functioned as PAMs.
  • NGT was a non-NGG PAM sequence, showing a higher indel frequency compared to AGGCN PAM, a subset of the NGG PAM sequence (FIG. 3A).
  • target sequences with NGGNN (abbreviated as NGGDN) PAM induced significantly higher indel frequencies compared to AGGCN PAM.
  • NGGDN target sequences with NGGNN (abbreviated as NGGDN) PAM induced significantly higher indel frequencies compared to AGGCN PAM.
  • four subsets were identified that were statistically significant in SpCas9-NG inducible indel frequency.
  • SpCas9 nuclease unlike xCas9 and SpCas9-NG, did not show sequential indel frequencies according to the NGGDN PAM sequence. All analyzed NGGDN PAM sequences showed similar SpCas9-induced indel frequencies (FIG. 4C). Only the fourth of the first, fourth, and fifth nucleotides of the NGGNN's PAM sequence had an effect on SpCas9-induced indel frequency and showed high activity when the fourth nucleotide was H (excluding G) (FIG. 4b and 4c).
  • the potent non-NGG PAMs for SpCas9 were NAG and NGA, and GGT, BGC and RTG also functioned as PAMs.
  • Example 1.5 analyzed 79 PAM sequences using 80 immobilized identical protospacer sequences. To more broadly analyze the PAM sequence, about 13,200 were prepared from the oligonucleotide library described in Example 1.1.
  • cell libraries were prepared from oligonucleotide libraries, and after delivery of Cas9 to cell libraries, indel frequencies were measured.
  • indel frequencies were calculated according to the first to fifth nucleotides in the PAM sequence.
  • PAM sequences excluded from the analysis are indicated by hatching in FIGS. 5A-5C, and the number of target sequences per PAM sequence was 3 to 306 (average 33).
  • Heat maps representing the percent indels according to the first to fifth positions in the PAM sequence of xCas9, SpCas9-NG, and SpCas9 nuclease are shown in FIGS. 5A-5C, respectively; % indel frequencies according to the PAM sequence of xCas9, SpCas9-NG, and SpCas9 nuclease are shown in FIGS.
  • the PAM sequences that resulted in the highest mean indel frequency were GGGCA, CGGCA, AGGCA and TGGCA, leading to an indel frequency of an average of 39%, 34%, 33%, 32%, respectively, with (C or G) GGCA being the strongest PAM Indicates that it is a sequence.
  • the non-NGG PAM sequences for xCas9 in the top 95 5-nucleotide PAM sequences were NGW, SAG and BGC, and most of the nucleotides at position 4 were C, and NGGC, NGWC, SAGC and BGCC were NGGD, NGWD, respectively. Higher mean indel frequency compared to, SAGD and BGCD.
  • PAM sequences have been identified that induce indel frequencies of at least 5%, including AGCCA (12%), CAACG (11%), GAACA (9.7%).
  • AGCCA (12%)
  • CAACG (11%
  • GAACA GAACA (9.7%).
  • the PAM sequences of 5'-NGD-3 ', 5'-SAG-3', and 5'-BGCC-3 ' were identified.
  • TCGDG sequence (average indel frequency 8.4%) was also found to function as PAM.
  • PAM PAM-specific asemiconductor sequence
  • new 5'-NA-3 ', 5'-NTG-3', 5'-GTH-3 ', 5'-VCGD-3', and 5'-TCGDG-3 ' One PAM sequence was identified.
  • SpCas9 showed no preference for specific nucleotides at the fourth position, except RTG and NYGG.
  • SpCas9 is also a PAM sequence that induces SpCas9-induced indel frequencies of more than 5% with AGCCA (16%), CTGCA (10%), TGTCA (8.0%), GCGCA (7.5%), and AGCTC (5.1%). 14 species of the back were confirmed.
  • SpCas9 showed the highest activity on the 5'-NGG-3 'PAM sequence
  • xCas9 was 5'-GGTC-3' and 5'-HGT-3 'PAM sequence compared to SpCas9 Had higher activity.
  • SpCas9-NG had higher activity on most non-NGG PAMs than 5'-NYGG-3 'and 5'-VCGG-3' compared to SpCas9.
  • SpCas9-NG showed higher activity on all analyzed PAM sequences except 5'-NGGC-3 '.

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Mycology (AREA)
  • Cell Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

신규한 PAM 서열을 이용하는 세포의 유전체에서 표적 핵산을 변형시키는 방법 및 이에 의해 유전체의 표적 핵산이 변형된 세포를 제공한다. 이에 의하면, 기존에 표적으로 하지 못한 위치를 유전체 편집의 표적으로 하여 유전체 편집을 수행할 수 있고, 이에 의해 유전체 편집의 활용 범위를 확대시킬 수 있다.

Description

세포의 유전체에서 표적 핵산을 변형시키는 방법
신규한 프로토스페이서 인접 모티프를 이용한 세포의 유전체 편집 방법에 관한 것이다.
CRISPR-Cas9 시스템은, 세균 및 고세균에서 발견되는 적응적 면역 시스템으로, 다양한 생물 및 인간 세포를 포함한 다양한 세포의 유전체 편집에 이용되고 있다. 그러나, 표적 DNA 영역에 이용가능한 프로토스페이서 인접 모티프(protospacer adjacent motif: PAM)이 없거나, 불충분한 온-타겟(on-target) 활성, 또는 오프-타겟(off-target) 효과 등으로 인해, CRISPR-Cas9의 적용이 흔히 제한된다. 가장 흔히 사용되는 CRISPR 뉴클레아제인, 스트렙토코커스 피오게네스 Cas9(Streptococcus pyogenes Cas9: SpCas9)의 PAM 서열은 5'-NGG-3'이다. 포유동물 세포에서 효율적인 활성을 나타내는 다른 CRISPR 뉴클레아제는 NGG 이외에 다른 PAM도 인식한다. PAM 서열이 없는 서열을 표적으로 하는 CRISPR 뉴클레아제 변이체가 개발되었지만, 표적이 되지 않는 서열들이 여전히 있다.
최근, NGG가 아닌 PAM을 갖는 서열을 표적화할 수 있는 xCas9 및 SpCas9-NG가 개발되었다(Hu, J.H. et al., Nature vol.556, pp.57-63 (2018)). xCas9은 SpCas9에 비해 더 낮은 오프-타겟 활성을 나타내었다. xCas9 및 SpCas9-NG의 활성에 대해 겨우 각각 20 및 69 내재적인 인간 유전체 서열로만 연구되었을 뿐이고, 표적 서열에 대한 광범위한 조사는 이루어진 바가 없다.
따라서, CRISPR-Cas9 시스템의 적용 범위를 넓히기 위해, xCas9 및 SpCas9-NG의 PAM 호환성 및 표적 서열에 대한 활성을 조사하여, NGG가 아닌 PAM 서열을 발굴할 필요가 있다.
신규한 PAM 서열을 이용하는 세포의 유전체에서 표적 핵산을 변형시키는 방법을 제공한다.
신규한 PAM 서열을 이용하는 세포의 유전체에서 표적 핵산을 변형시키는 방법에 의해 유전체의 표적 핵산이 변형된 세포를 제공한다.
일 양상은 세포의 유전체에서 표적 핵산을 변형시키는 방법으로서, 표적 핵산, Cas(clustered regularly interspaced palindromic repeats-associated: CRISPR associated) 뉴클레아제 또는 이의 변이체, 및 가이드 RNA를 인큐베이션하는 단계를 포함하는 방법을 제공한다.
상기 세포는 생체 내 세포 또는 분리된 세포일 수 있다. 상기 세포가 생체 내 세포인 경우, 상기 방법은 생체 내(in vivo)에서 수행될 수 있다. 상기 세포가 분리된 세포인 경우, 상기 방법은 생체 외(ex vivo) 또는 시험관 내(in vitro)에서 수행될 수 있다.
상기 세포는 체세포, 생식세포, 줄기세포, 암세포, 또는 세포주일 수 있다. 상기 세포는 암세포, 줄기세포, 혈관내피 세포, 백혈구, 면역 세포, 상피 세포, 생식 세포, 섬유아세포, 근육 세포, 골수 세포, 표피 세포, 골아세포, 및 신경세포로 이루어진 군으로부터 선택될 수 있다. 상기 세포는 인간을 포함한 동물, 식물, 세균, 또는 균류의 세포일 수 있다.
상기 유전체(genome)은 생명체 또는 세포가 갖는 모든 유전정보를 말한다.
상기 표적 핵산은 변형시키고자 하는 핵산을 의미한다.
세포의 유전체에서 표적 핵산을 변형시키는 방법은 유전체 편집(genome editing)으로도 불릴 수 있다.
상기 방법은 표적 핵산을 포함한 세포, Cas(clustered regularly interspaced palindromic repeats- associated: CRISPR associated) 뉴클레아제 또는 이의 변이체를 암호화하는 폴리뉴클레오티드, 및 가이드 RNA를 인큐베이션하는 단계를 포함한다.
상기 표적 핵산은 프로토스페이서-인접 모티프(protospacer adjacent motif: PAM), 및 상기 가이드 RNA에 상보적인 표적 서열을 포함할 수 있다.
상기 프로토스페이서-인접 모티프(PAM)는 표적 핵산에서 Cas 뉴클레아제가 인식하는 뉴클레오티드 서열일 수 있다. 상기 PAM은 5'-NA-3', 5'-NTG-3', 5'-GTH-3', 5'-VCGD-3', 5'-TCGDG-3', 5'-GGT-3', 5'-BGC-3', 5'-RTG-3', 5'-NYGG-3', 5'-AGCCA-3', 5'-CTGCA-3', 5'-TGTCA-3', 5'-GCGCA-3', 5'-GCGCT-3', 5'-GCGTT-3', 5'-AGCCC-3', 5'-CGTCA-3', 5'-GCGTA-3', 5'-AGCCG-3', 5'-GCGTC-3', 5'-AGTCA-3', 5'-AGCAC-3' 및 5'-AGCTC-3'로 이루어진 군으로부터 선택될 수 있다. 상기 뉴클레오티드 서열에서, 'A'는 아데닌(adenine: A)을 의미하고, 'G'는 구아닌(guanine: G)을 의미하고, 'C'는 시토신(cytosine: C)을 의미하고, 및 'T'는 티민(thymine: T)을 의미한다. 'N'은 아데닌(A), 구아닌(G), 시토신(C), 티민(T), 우라실(uracil: U), 불명, 또는 기타의 핵산을 의미한다. 'H'는 구아닌(G)이 아닌 염기를 의미하고, 아데닌(A), 시토신(C), 티민(T), 또는 우라실(U)일 수 있다. 'V'는 티민(T) 및 우라실(U)이 아닌 염기를 의미하고, 아데닌(A), 구아닌(G), 또는 시토신(C)일 수 있다. 'D'는 시토신(C)이 아닌 염기를 의미하고, 아데닌(A), 구아닌(G), 티민(T), 또는 우라실(U)일 수 있다. 'B'는 아데닌(A)이 아닌 염기를 의미하고, 구아닌(G), 시토신(C), 티민(T), 또는 우라실(U)일 수 있다. 'R'은 퓨린(purine)을 의미하고, 아데닌(A) 또는 구아닌(G)일 수 있다. 'Y'는 피리미딘(pyrimidine)을 의미하고, 시토신(C), 티민(T), 또는 우라실(U)일 수 있다. 상기 5'-NA-3'는 5'-AA-3', 5'-GA-3', 5'-CA-3', 또는 5'-TA-3'이다. 5'-NTG-3'는 5'-ATG-3', 5'-GTG-3', 5'-CTG-3', 또는 5'-TTG-3'이다. 5'-GTH-3'는 5'-GTA-3', 5'-GTC-3', 또는 5'-GTT-3'이다. 5'-VCGD-3'는 5'-ACGA-3', 5'-ACGG-3', 5'-ACGT-3', 5'-GCGA-3', 5'-GCGG-3', 5'-GCGT-3', 5'-CCGA-3', 5'-CCGG-3', 또는 5'-CCGT-3'이다. 5'-TCGDG-3'는 5'-TCGAG-3', 5'-TCGGG-3', 또는 5'-TCGTG-3'이다. 5'-BGC-3'는 5'-GGC-3', 5'-CGC-3', 또는 5'-TGC-3'이다. 5'-RTG-3'는 5'-ATG-3' 또는 5'-GTG-3'이다. 5'-NYGG-3'는 5'-ACGG-3', 5'-ATGG-3', 5'-GCGG-3', 5'-GTGG-3', 5'-CCGG-3', 5'-CTGG-3', 5'-TCGG-3', 또는 '5'-TTGG-3'이다. 상기 PAM은 표적 서열의 3'-말단 또는 5'-말단에 바로 인접 또는 연속한 것일 수 있다.
상기 Cas 뉴클레아제는 핵산 이중가닥을 절단하는 엔도뉴클레아제(endo uclease)일 수 있다. 상기 Cas 뉴클레아제는 RNA-가이드 DNA 엔도뉴클레아제(RNA guided DNA endonuclease)일 수 있다. 상기 Cas 뉴클레아제는 스트렙토코커스 속(Streptococcus sp.), 캄필로박터 속(Campylobacter sp.), 레지오넬라 속(Legionella sp.), 네이세리아 속(Neisseria sp.), 파스테우렐라 속(Pasteurella sp.), 프란시셀라(Francisella sp.), 및 프레보텔라 속(Prevotella sp.)으로 이루어진 군으로부터 선택된 세균으로부터 유래된 뉴클레아제일 수 있다. 상기 상기 Cas 뉴클레아제는 스트렙토코커스 피오게네스(Streptococcus pyogenes), 스트렙토코커스 써모필러스(Streptococcus thermophilus), 스트렙토코커스 아우레우스(Streptococcus aureus), 캄필로박터 제주니(Campylobacter jejuni), 레지오넬라 뉴모필라(Legionella pneumophila), 네이세리아 메닝기티디스(Neisseria meningitidis), 파스테우렐라 물토시다(Pasteurella multocida), 프란시셀라 노비시다(Francisella novicida), 및 프레보텔라 디시엔스(Prevotella disiens)로 이루어진 군으로부터 선택된 세균으로부터 유래된 뉴클레아제일 수 있다. 상기 Cas 뉴클레아제는 Cas9, Cpf1, C2c1, C2c2, C2c3, Cas3, Cas5, Cas7, Cas8, 또는 Cas10일 수 있다. 상기 Cas9은 예를 들어, 스트렙토코커스 피오게네스 유래 Cas9(Streptococcus pyogenes Cas9: SpCas9)이다.
상기 Cas 뉴클레아제의 변이체는 Cas 뉴클레아제의 기능을 보유한 변이체이다. 상기 Cas 뉴클레아제의 변이체는 xCas9, SpCas9-NG, Cas9 틈내기효소(Cas9 nickase: Cas9 nickase), 불활성화 Cas9(Deactivated Cas9: dCas9), 및 불안정화 Cas9(destabilized Cas9: DD-Cas9)로 이루어진 군으로부터 선택될 수 있다.
상기 Cas 뉴클레아제 또는 이의 변이체를 암호화하는 폴리뉴클레오티드는 플라스미드 벡터 또는 바이러스 벡터에 함유된 것일 수 있다.
상기 Cas 뉴클레아제의 변이체가 SpCas9-NG인 경우, 상기 PAM은 5'-NA-3', 5'-NTG-3', 5'-GTH-3', 5'-VCGD-3', 및 5'-TCGDG-3'로 이루어진 군으로부터 선택된 뉴클레오티드 서열로 이루어진 폴리뉴클레오티드일 수 있다. 상기 Cas 뉴클레아제가 스트렙토코커스 피오게네스 유래 Cas9(SpCas9)인 경우, 상기 PAM은 5'-GGT-3', 5'-BGC-3', 5'-RTG-3', 5'-NYGG-3', 5'-AGCCA-3', 5'-CTGCA-3', 5'-TGTCA-3', 5'-GCGCA-3', 5'-GCGCT-3', 5'-GCGTT-3', 5'-AGCCC-3', 5'-CGTCA-3', 5'-GCGTA-3', 5'-AGCCG-3', 5'-GCGTC-3', 5'-AGTCA-3', 5'-AGCAC-3' 및 5'-AGCTC-3'로 이루어진 군으로부터 선택된 뉴클레오티드 서열로 이루어진 폴리뉴클레오티드일 수 있다.
용어 "가이드(guide) RNA"는 유전체 편집을 통해 세포내에서 표적 핵산을 인식하여 표적 핵산을 절단, 삽입, 또는 연결시키는 폴리뉴클레오티드를 말한다. 상기 가이드 RNA는 표적 핵산 중 표적 서열에 상보적인 서열을 포함할 수 있다. 상기 가이드 RNA는 상기 표적 핵산에서 PAM의 5' 방향 또는 3' 방향으로 연속적인 2 내지 24 뉴클레오티드(이하, 'nt'라 함)의 뉴클레오티드 서열과 상보적인 폴리뉴클레오티드일 수 있다. 상기 가이드 RNA의 길이는 17 nt, 18 nt, 19 nt, 20 nt, 21 nt, 22 nt, 23 nt, 또는 24 nt일 수 있다. 상기 가이드 RNA는 단일-사슬 가이드 RNA(single-chain guide RNA: sgRNA)일 수 있다. 상기 sgRNA는 표적 핵산 서열에 특이적인 crRNA(CRISPR RNA) 및/또는 Cas 뉴클레아제와 복합체를 형성하는 tracrRNA를 포함할 수 있다. 상기 가이드 RNA는 플라스미드 벡터 또는 바이러스 벡터에 함유된 것일 수 있다.
상기 인큐베이션은 표적 핵산을 포함하는 세포에 Cas 뉴클레아제 또는 이의 변이체를 암호화하는 폴리뉴클레오티드 및 가이드 RNA를 도입하는 것일 수 있다. 상기 도입은 통합(integration), 형질전환(transformation), 형질도입(transduction), 형질감염(transfection), 또는 이들의 조합을 포함한다. 상기 도입은 일시적(transient) 또는 안정한(stable) 도입일 수 있다.
상기 표적 핵산은 상기 Cas 뉴클레아제 또는 이의 변이체, 및 상기 가이드 RNA의 복합체에 의해 인식될 수 있다.
상기 Cas 뉴클레아제 또는 이의 변이체, 및 가이드 RNA의 복합체는 표적 핵산을 서열-특이적으로 변형될 수 있다. 상기 변형은 삽입, 절단, 삽입, 연결, 탈아미노화, 또는 이들의 조합일 수 있다. 상기 절단은 유전체 DNA의 이중가닥의 절단일 수 있다. 상기 절단은 평활 말단(blunt end) 또는 접착 말단(sticky end)일 수 있다. 상기 변형은 표적 핵산의 절단 및 절단 부위에 외래 폴리뉴클레오티드의 삽입일 수 있다. 외래 폴리뉴클레오티드를 유전체의 절단 부위에 삽입하는 것은 상동성 의존적 방법에 의한 것일 수 있다. 상기 상동성 의존적 방법은 상동 재조합(homologous recombination) 또는 상동성-직접 수선(homology-directed repair: HDR)일 수 있다.
상기 방법은 시험관 내(in vitro), 생체 외(ex vivo), 또는 생체 내(in vivo)에서 수행될 수 있다.
다른 양상은 일 양상의 세포의 유전체에서 표적 핵산을 변형시키는 방법으로 유전체의 표적 핵산이 변형된 세포를 제공한다.
상기 세포, 유전체, 표적 핵산, 및 변형은 전술한 바와 같다.
신규한 PAM 서열을 이용하는 세포의 유전체에서 표적 핵산을 변형시키는 방법 및 이에 의해 유전체의 표적 핵산이 변형된 세포에 의하면, 기존에 표적으로 하지 못한 위치를 유전체 편집의 표적으로 하여 유전체 편집을 수행할 수 있고, 이에 의해 유전체 편집의 활용 범위를 확대시킬 수 있다.
도 1a는 고정된 프로토스페이서를 이용하여 PAM 서열을 결정하기 위한 실험 과정을 나타낸 개략도이고, 도 1b는 PAM 서열 결정을 위한 실험 디자인의 개략도이다.
도 2a 내지 2c는 xCas9 뉴클레아제의 PAM 서열에 따른 인델 빈도(%)를 나타내 그래프이다.
도 3a 내지 3c는 SpCas9-NG 뉴클레아제의 PAM 서열에 따른 인델 빈도(%)를 나타내 그래프이다.
도 4a 내지 4c는 SpCas9 뉴클레아제의 PAM 서열에 따른 인델 빈도(%)를 나타내 그래프이다.
도 5a 내지 5c는 각각 xCas9, SpCas9-NG, 및 SpCas9 뉴클레아제의 PAM 서열에서 첫번째 내지 5번째 위치에 따른 인델 빈도(%)를 나타내는 히트 맵이다.
도 6a 내지 6c는 각각 xCas9, SpCas9-NG, 및 SpCas9 뉴클레아제의 PAM 서열에 따른 인델 빈도(%)를 나타내 그래프이다.
도 7a 내지 7c는 PAM 서열에 대해 각각 xCas9과 SpCas9의 평균 인델 빈도(%), SpCas9-NG와 SpCas9의 평균 인델 빈도(%), 및 xCas9과 SpCas9-NG의 평균 인델 빈도(%)를 나타내 그래프이다.
이하 실시예를 통하여 보다 상세하게 설명한다. 그러나, 이들 실시예는 하나 이상의 구체예를 예시적으로 설명하기 위한 것으로 본 발명의 범위가 이들 실시예에 한정되는 것은 아니다.
실시예 1. xCas9, SpCas9-NG, 및 SpCas9 PAM 서열의 확인
1. 가이드 RNA, PAM 서열, 및 표적 서열을 함유한 플라스미드 라이브러리의 준비
우선, Cas 뉴클레아제에 의해 인식되는 PAM 서열 확인을 위해, Twist Bioscience Co.에 의뢰하여 올리고뉴클레오티드 라이브러리를 제작하였다.
각 올리고뉴클레오티드는, 5' 말단으로부터 19- 또는 20-nt의 sgRNA, BsmBI 제한효소 부위, 바코드 1(20-nt 서열), 제2 BsmBI 제한효소 부위, 바코드 2(15-nt 서열), 및 PAM을 함유하는 30-nt 표적 서열을 포함하도록 디자인되었다. 특히, 올리고뉴클레오티드는 79 종의 상이한 5-뉴클레오티드 PAM 서열(=NNNAT 카테고리에서 64 + 16 in the AGGNN 카테고리에서 16 - 중복 AGGAT)을 포함하고, 80 종의 GN19 단일 가이드 RNA(single guide RNA: sgRNA) 서열을 포함하므로, 6,320 (=79 x 80)종의 표적 서열을 표적으로 하는 플라스미드 라이브러리이다(도 1b).
sgRNA와 표적 서열을 함유하는 플라스미드 라이브러리는 2단계 클로닝 방법을 이용하여, 올리고뉴클레오티드 풀(pool)의 PCR 증폭 과정에서 가이드 RNA와 표적 서열간의 언커플링(uncoupling)을 방지하였다.
제1 단계는 가이드 RNA 및 표적 서열을 포함하는 초기 플라스미드 라이브러리 제작이다. BsmBI 제한효소(NEB)를 사용하여 Lenti-gRNA-Puro 플라스미드(Addgene, #84752)를 선형화시키고, 선형화된 벡터에 PCR-증폭된 올리고뉴클레오티드 풀(표적 서열)을 라이게이션시켰다. 반응물을 대장균에 형질전환시키고, 선별된 콜로니로부터 플라스미드를 분리하였다. 올리고뉴클레오티드 풀 증폭에 사용된 프라이머는 다음과 같다.
정방향 프라이머:
5'-TTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACC-3' (서열번호 1)
역방향 프라이머:
5'-GAGTAAGCTGACCGCTGAAGTACAAGTGGTAGAGTAGAGATCTAGTTACGCCAAGCT-3' (서열번호 2)
제2 단계는 sgRNA 스캐폴드의 삽입이다. 제1 단계에서 제작된 플라스미드 라이브러리는 BsmBI 제한효소(NEB)로 절단하고 아가로스 전기영동 후 겔에서 핵산 단편을 정제하였다. sgRNA 스캐폴드를 함유한 인서트 단편을 합성하고 TOPO 벡터(T-두가닥(blunt) 벡터, Solgent)에 클로닝하였다. 인서트 단편의 서열을 하기에 나타내었고, 폴리 T 서열을 포함한 sgRNA는 굵은 글씨로 표시하고, BsmBI 제한효소 부위는 밑줄로 표시하였다.
5'-CGTCTCT GTTT TAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAG
TGGCACCGAGTCGGTGCTTT TTT GGGAGACG-3' (서열번호 3)
인서트 단편을 함유한 TOPO 벡터를 BsmBI 제한효소(NEB)로 절단하여 83-nt 인서트 단편을 분리하였다. 절단된 플라스미드 라이브러리에 인서트 단편을 라이게이션시키고, 대장균에 형질전환시킨 후, 선별된 콜로니로부터 플라스미드 라이브러리를 분리하였다.
2. 세포 라이브러리의 준비
우선, 렌티바이러스 라이브러리 생산을 위해, 인간 배아 신장 세포인 HEK293T 세포(ATCC)를 준비하였다. 실시예 1.1에서 준비된 플라스미드, psPAX2, 및 pMD2.G를 혼합하고, 리포펙타민 2000 (Invitrogen)을 사용하여 HEK293T 세포에 형질감염시켰다. 형질감염 후 12 시간에 신선한 배지를 세포에 가하고, 형질 감염 후 36 시간에 바이러스를 함유한 상층액을 수득하였다. 수득된 상층액은 Millex-HV 0.45 ㎛ 저-단백질 결합 멤브레인(Millipore)으로 여과하고, 분액은 사용시까지 -80℃에 보관하였다. 바이러스 수율은 Lenti-X p24 Rapid Titer Kit(Clontech)로 측정하여 검증하였다. 바이러스 역가 산출을 위해, 순차 희석된 바이러스 분액을 8 ㎍/㎖의 폴리브렌(polybrene)의 존재에서 HEK293T 세포에 형질도입하고, 2 ㎍/㎖ 퓨로마이신 또는 20 ㎍/㎖ 블라스티시딘(blasticidin) S (InvivoGen)의 존재에서 배양하여 산출하였다.
준비된 렌티바이러스 라이브러리의 형질도입을 위해, HEK293T 세포를 배양 접시에 밤새 배양하였다. 감염다중도(multiplicity of infection: MOI) 0.3의 렌티바이러스 라이브러리를 8 ㎍/㎖의 폴리브렌의 존재에서 HEK293T 세포에 형질도입하고, 세포를 밤새 배양하였다. 세포를 2 ㎍/㎖ 퓨로마이신의 존재에서 배양하여 형질도입되지 않은 세포를 제거하고, 1.2x107 세포의 양으로 세포 라이브러리를 유지하였다.
3. 세포 라이브러리에 Cas9의 전달
1.2x107 세포의 양의 세포 라이브러리를 준비하고, xCas9-, SpCas9-NG, 및 SpCas9-암호화하는 바이러스를 8 ㎍/㎖의 폴리브렌의 존재에서 세포에 형질도입시켰다. 형질도입은 MOI 5로 수행하였고, 20 ㎍/㎖ 블라스티시딘 S의 존재 하에서 세포를 선별하였다.
4. 인델 빈도의 측정
실시예 1.3에서 준비된 세포에서 유전체 중 인델(삽입/결실, insertion/deletion: indel)의 빈도를 측정하기 위해, 고심도(deep) 시퀀싱 및 인델 빈도의 분석을 수행하였다.
고심도 시퀀싱을 위해, Wizard Genomic DNA purification kit(Promega)를 사용하여 세포로부터 유전체 DNA를 분리하였다. 삽입된 표적 사열은 고성능 실험을 위해 2X Taq PCR Smart mix(Solgent)를 사용하여 PCR 증폭하였다. 첫번째 PCR에서, 각 세포 라이브러리에 대해 총 240 ㎍의 유전체 DNA를 이용하여 라이브러리에 대해 1000x 이상의 커버리지가 되도록 하였다(106 개의 세포 당 약 10 ㎍의 유전체 DNA). 각 반응 당 2.5 ㎍의 유전체 DNA를 1차 PCR하고, 반응산물을 모두 풀링(pooling)한 후 정제하였다. 정제된 산물 중 50 ng의 시료를 Illumina 어댑터 및 바코드 서열을 함유한 프라이머를 이용하여 2차 PCR 증폭하였다. 증폭된 산물은 전기영동 후 정제하고, HiSeq 또는 MiniSeq(Illumina)를 이용하여 분석하였다.
실험에 사용된 프라이머는 다음과 같다.
1차 PCR 반응용 프라이머
정방향 프라이머:
5'-ACACTCTTTCCCTACACGACGCTCTTCCGATCTCTTGAAAAAGTGGCACCGAGTCG-3' (정방향 프라이머, 서열번호 4)
5'-ACACTCTTTCCCTACACGACGCTCTTCCGATCTTCTTGAAAAAGTGGCACCGAGTCG-3' (서열번호 5)
5'-ACACTCTTTCCCTACACGACGCTCTTCCGATCTCGCTTGAAAAAGTGGCACCGAGTCG-3' (서열번호 6)
역방향 프라이머:
5'-GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTTTAAGTCGAGTAAGCTGACCGCTGAAG-3' (서열번호 7)
5'-GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTATTAAGTCGAGTAAGCTGACCGCTGAAG-3' (서열번호 8)
5'-GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTTATTAAGTCGAGTAAGCTGACCGCTGAAG-3' (서열번호 9)
2차 PCR 반응용 프라이머
정방향 프라이머:
5'-AATGATACGGCGACCACCGAGATCTCAC (index) ACACTCTTTCCCTACACGAC-3' (서열번호 10)
역방향 프라이머:
5'-CAAGCAGAAGACGGCATACGAGAT (index) GTGACTGGAGTTCAGACGTGT-3' (서열번호11)
인델 빈도의 분석을 위해 Python scripts 프로그램을 변형하여 고심도 시퀀싱 데이터를 분석하였다. 15-nt의 바코드와 그의 상류에 위치한 4-nt의 총 19-nt의 서열을 이용하여 각 가이드 RNA와 표적 서열의 쌍을 식별하였다. 인델이 예상된 절단 부위(즉, 그 부위의 가운데에 위치한 8-nt 영역)에 위치해 있을 경우, 인델은 xCas9-, SpCas9-NG-, 또는 SpCas9-유도된 돌연변이라고 간주하였다. 어레이 합성 및 PCR 증폭의 결과인 배경 인델 빈도를 제거하기 위해, 총 리드(read), 인델 리드, 및 Cas9을 도입하지 않은 경우의 인델 빈도를 산출하고, 하기 수학식에 따라 인델 빈도(%)를 산출하였다.
Figure PCTKR2019011166-appb-I000001
(수학식 1)
고심도 시퀀싱 데이터는 NCBI Sequence Read Archive(SRA; www.ncbi.nlm.nih.gov/sra/)에 Accession No. SRP158724에 업로드하였다.
5. PAM 서열의 결정
실시예 1.4에 따라 수득된 고심도 시퀀싱 데이터에서, xCas9, SpCas9-NG, 또는 SpCas9 뉴클레아제에서 높은 인델 빈도를 갖는 PAM 서열을 선별하였다.
사람 세포에서 형질 도입 후 6일까지 5% 이상의 평균 인델 빈도를 갖는 PAM 서열을 선별하고, xCas9, SpCas9-NG, 및 SpCas9 뉴클레아제와 PAM 서열에 따른 인델 빈도를 분석하였다.
xCas9 뉴클레아제와 PAM 서열에 따른 인델 빈도(%)는 도 2a 내지 도 2c에 나타내고, SpCas9-NG 뉴클레아제와 PAM 서열에 따른 인델 빈도(%)는 도 3a 내지 도 3c에 나타내고, SpCas9 뉴클레아제와 PAM 서열에 따른 인델 빈도(%)는 도 4a 내지 도 4c에 나타내었다(ANOVA 분석 후 Tukey 사후 검정; *: P<0.05, **: P <0.01, ***: P <0.001; AGGTC에 대해, ##: P <0.01, ###: P < 0.001; AGGGC에 대해, §: P < 0.001, §§§: P < 0.001; AGGAC에 대해 ‡: P < 0.05, ‡‡: P < 0.01, ‡‡‡: P < 0.001). 박스 플롯에서, 위, 중간, 및 아래의 선은 각각 25번째, 50번째, 및 75번째 백분위를 표시하고, 수염(whisker)는 10번째 및 90번째 백분위를 나타내었다. 개수(N)은 PAM 서열 당 67 내지 79개의 표적 서열이다.
도 2a 내지 도 4c에 나타난 바와 같이, PAM 서열은 몇개의 그룹으로 나뉘었다. xCas9, SpCas9-NG, 및 SpCas9 뉴클레아제에서, NGG PAM 서열은 일반적으로 가장 높은 인델 빈도를 나타내었다.
xCas9 뉴클레아제에 대해서는, 인델 빈도가 높은 순서대로, AGGCA, AGGCB (즉, AGGC(C, G, 또는 T)), 또는 NGGNN의 PAM 서열을 갖는 표적 서열에서 높은 인델 빈도를 유의하게 유도하였다(도 2a 내지 2c). 이외에도 통계적으로 유의한 차이가 있는 6개의 서브세트를 확인하였다. 또한, NGGNN의 PAM 서열의 첫번째, 4번째, 및 5번째 뉴클레오티드 모두 xCas9-유도성 인델 빈도에 영향이 있었고, 4번째 뉴클레오티드가 C인 경우 가장 높은 활성을 나타내었다(도 2b 및 2c). 4번째 뉴클레오티드가 C인 경우, 5번째 뉴클레오티드가 A 일 때 가장 높은 xCas9 활성이 관찰되었고, ii) 첫번째 위치에서 가장 높은 xCas9 활성을 유도한 뉴클레오티드는 A보다는 S(즉, G 또는 C)였다. 따라서, 이 그룹에서 가장 강력한 xCas9 PAM 서열은 SGGCA일 것으로 예상되었다. xCas9에 대한 대표적인 비-NGG PAM은 NGW (즉, NG (A 또는 T)였고, BGC (또는 더 광범위하게 NGC) 및 SAG (또는 더 광범위하게 NAG)도 PAM으로서 기능을 하였다.
SpCas9-NG에서, NGT는 비-NGG PAM 서열로서, NGG PAM 서열의 서브세트인 AGGCN PAM에 비해 높은 인델 빈도를 나타내었다(도 3a). 또한, NGGNN(NGGDN으로 약칭) PAM을 갖는 표적 서열이 AGGCN PAM에 비해 유의하게 높은 인델 빈도를 유도하였다. NGGDN PAM 서열의 세트 중에서, SpCas9-NG 유도성 인델 빈도에서 통계적으로 유의한 4개의 서브세트가 확인되었다. NGGNN의 PAM 서열의 첫번째, 4번째, 및 5번째 뉴클레오티드 중 4번째 뉴클레오티드만이 SpCas9-NG-유도성 인델 빈도에 영향이 있었고, 4번째 뉴클레오티드가 D(C 제외)인 경우 높은 활성을 나타내었다(도 3b 및 3c). SpCas9-NG에 대해 강력한 비-NGG PAM은 NGT였고, NGA, NGC, NGN, NAG, NAH, NTG, GTH 및 VCG도 PAM으로서 기능을 하였다.
SpCas9 뉴클레아제는, xCas9 및 SpCas9-NG과 달리, NGGDN PAM 서열에 따른 순차적인 인델 빈도는 나타나지 않았다. 분석된 NGGDN PAM 서열 모두 유사한 SpCas9-유도성 인델 빈도를 나타내었다(도 4c). NGGNN의 PAM 서열의 첫번째, 4번째, 및 5번째 뉴클레오티드 중 4번째 뉴클레오티드만이 SpCas9-유도성 인델 빈도에 영향이 있었고, 4번째 뉴클레오티드가 H(G 제외)인 경우 높은 활성을 나타내었다다(도 4b 및 4c). SpCas9에 대해 강력한 비-NGG PAM은 NAG 및 NGA였고, GGT, BGC 및 RTG도 PAM으로서 기능을 하였다.
6. 광범위의 PAM 서열 및 프로토스페이서를 이용한 PAM 분석
실시예 1.5는 80개의 고정된 동일 프로토스페이서 서열을 이용하여 79 종의 PAM 서열을 분석하였다. 더욱 광범위하게 PAM 서열을 분석하기 위해, 실시예 1.1에 기재된 올리고뉴클레오티드 라이브러리에서 약 13,200개가 준비되었다.
실시예 1.1 내지 1.4에 기재된 바와 같이, 올리고뉴클레오티드 라이브러리로부터 세포 라이브러리를 준비하고, 세포 라이브러리에 Cas9의 전달한 후, 인델 빈도를 측정하였다. xCas9, SpCas9-NG, 또는 SpCas9 뉴클레아제에서, PAM 서열에서 첫번째 내지 5번째 뉴클레오티드에 따른 인델 빈도를 산출하였다. 분석에서 제외된 PAM 서열은 도 5a 내지 5c에서 빗금으로 표시하였고, PAM 서열 당 표적 서열의 수는 3 내지 306개(평균 33개)였다.
xCas9, SpCas9-NG, 및 SpCas9 뉴클레아제의 PAM 서열에서 첫번째 내지 5번째 위치에 따른 인델 빈도(%)를 나타내는 히트맵(heat map)을 각각 도 5a 내지 5c에 나타내고; xCas9, SpCas9-NG, 및 SpCas9 뉴클레아제의 PAM 서열에 따른 인델 빈도(%)를 각각 도 6a 내지 6c에 나타내고; 및 PAM 서열에 대해 각각 xCas9과 SpCas9의 평균 인델 빈도(%), SpCas9-NG와 SpCas9의 평균 인델 빈도(%), 및 xCas9과 SpCas9-NG의 평균 인델 빈도(%)를 나타내 그래프를 도 7a 내지 7c에 나타내었다. 도 7a 내지 7c에서, 점선은 y=x을 나타내고, x 축과 y 축의 눈금은 0%에서 10%까지는 직선으로 나타내고, 10%에서 100%까지는 지수로 나타내었다.
592종(=37종 3 뉴클레오티드 PAM 서열 x 42)의 5-뉴클레오티드 PAM 서열은 실시예 1.5의 분석에서 제시된 가능한 모든 종류의 PAM을 포함한다. 592종의 PAM 서열 중 7종은 표적 서열의 무작위적 선택 및 낮은 시퀀싱 리드 카운트 때문에 분석에서 제외하였다. 남은 585종의 5-뉴클레오티드 PAM 서열에서, PAM 서열 당 표적 서열의 평균은 33종이었다.
도 5a 및 6a에 나타난 바와 같이, xCas9 뉴클레아제의 경우, 평균 인델 빈도가 10%를 넘는 상위 95종의 5-뉴클레오티드 PAM 서열 중 93종이 NGG, NGW, SAG 및 BGC PAM 군에 포함되었다. 나머지 2종의 PAM 서열은 AGCCA 및 CAACG였다. 이러한 결과는 세균성 세포에서 AGC 및 CAA가 xCas9 뉴클레아제에 대한 PAM으로 기능할 수 있다는 기존 결과와 일치한다(Hu, J.H. et al, Nature 556, 57-63 (2018)). 가장 높은 평균 인델 빈도를 유도한 PAM 서열은 GGGCA, CGGCA, AGGCA 및 TGGCA이었고, 각각 평균 39%, 34%, 33%, 32%의 인델 빈도를 유도하여, (C 또는 G)GGCA가 가장 강력한 PAM 서열임을 제시한다. 한편, 상위 95종의 5-뉴클레오티드 PAM 서열에서 xCas9에 대한 비-NGG PAM 서열은 NGW, SAG 및 BGC이었고, 대부분 4번째 위치의 뉴클레오티드가 C이었고, NGGC, NGWC, SAGC 및 BGCC는 각각 NGGD, NGWD, SAGD 및 BGCD에 비해 더 높은 평균 인델 빈도를 유도하였다. 이외에, AGCCA(12%), CAACG(11%), GAACA(9.7%)를 포함하여 5% 이상의 인델 빈도를 유도하는 PAM 서열이 확인되었다. 또한, xCas9 뉴클레아제에 대해, 5'-NGD-3', 5'-SAG-3', 및 5'-BGCC-3'의 PAM 서열을 확인하였다.
도 5b 및 6b에 나타난 바와 같이, SpCas9-NG 뉴클레아제의 경우, 평균 인델 빈도가 10%를 넘는 상위 455종의 5-뉴클레오티드 PAM 서열은 모두 NGN, NAN, NTG, GTH 및 VCG PAM 군에 포함되었다. xCas9과 달리, 4번째 뉴클레오티드가 C인 경우 D에 비해 평균 SpCas9-NG-유도성 인델 빈도가 낮았다(평균 인델 빈도; NGND vs. NGNC, 32% 대 28%; NAND vs. NANC, 17% 대 13%; NTGD 대 NTGC, 14% 대 8.9%; GTHD 대 GTHC, 10% 대 10%; VCGD 대 VCGC, 7.5% 대 4.2%). TCGDG 서열(평균 인델 빈도 8.4%)도 PAM으로서 기능하는 것으로 확인되었다. 또한, SpCas9-NG에 대해, 5'-NA-3', 5'-NTG-3', 5'-GTH-3', 5'-VCGD-3', 및 5'-TCGDG-3'의 신규한 PAM 서열을 확인하였다.
도 5c 및 6c에 나타난 바와 같이, SpCas9 뉴클레아제의 경우, 평균 인델 빈도가 10%를 넘는 상위 243종의 5-뉴클레오티드 PAM 서열 중 241종은 NGG, NAG, NGA, GGT, BGC, RTG 및 NYGG PAM 군에 포함되었다. 상위 243종에서 남은 2종의 PAM 서열은 AGCCA와 CTGCA였고, 각각 16 %와 10 %의 삽입 빈도를 유도하였다. NGG 카테고리의 PAM이 상위 1위에서 64위의 순서였고, 나머지 PAM과 명확히 구별되어, NGG가 SpCas9에 대해 가장 유효한 PAM 서열임을 확인하였다. xCas9 및 SpCas9-NG와 달리, SpCas9은 RTG 및 NYGG를 제외하고, 4번째 위치에서 특정 뉴클레오티드에 대한 선호도가 나타나지 않았다. 또한, SpCas9은 5% 초과의 SpCas9-유도성 인델 빈도를 유도하는 PAM 서열로 AGCCA(16%), CTGCA(10%), TGTCA(8.0%), GCGCA(7.5%), 및 AGCTC(5.1%) 등의 14종이 확인되었다. 또한, SpCas9에 대해, 5'-GGT-3', 5'-BGC-3', 5'-RTG-3', 5'-NYGG-3', 5'-AGCCA-3', 5'-CTGCA-3', 5'-TGTCA-3', 5'-GCGCA-3', 5'-GCGCT-3', 5'-GCGTT-3', 5'-AGCCC-3', 5'-CGTCA-3', 5'-GCGTA-3', 5'-AGCCG-3', 5'-GCGTC-3', 5'-AGTCA-3', 5'-AGCAC-3', 및 5'-AGCTC-3'의 신규한 PAM 서열을 확인하였다.
도 7a 내지 7c에 나타난 바와 같이, SpCas9은 5'-NGG-3' PAM 서열에 가장 높은 활성을 나타내었고, xCas9은 SpCas9에 비해 5'-GGTC-3' 및 5'-HGT-3' PAM 서열에 더 높은 활성을 가졌다. SpCas9-NG는 SpCas9에 비해 5'-NYGG-3' 및 5'-VCGG-3'를 제외한 대부분의 비-NGG PAM에 더 높은 활성을 가졌다. xCas9과 비교하여, SpCas9-NG는 5'-NGGC-3'를 제외하고 모든 분석된 PAM 서열에 더 높은 활성을 나타내었다.
따라서, 신규한 PAM 서열을 이용하여 인간 유전체에서 표적가능한 위치를 발굴함하고, PAM 서열에 따른 뉴클레아제의 인델 유도 활성을 예측함으로써, 유전체 편집의 활용 가능성을 증가시킬 수 있었다.

Claims (10)

  1. 세포의 유전체에서 표적 핵산을 변형시키는 방법으로서, 상기 방법은
    표적 핵산을 포함한 세포, Cas(clustered regularly interspaced palindromic repeats- associated: CRISPR associated) 뉴클레아제 또는 이의 변이체를 암호화하는 폴리뉴클레오티드, 및 가이드 RNA를 인큐베이션하는 단계를 포함하고,
    상기 표적 핵산은 프로토스페이서-인접 모티프(protospacer adjacent motif: PAM), 및 상기 가이드 RNA에 상보적인 표적 서열을 포함하고,
    상기 PAM은 5'-NA-3', 5'-NTG-3', 5'-GTH-3', 5'-VCGD-3', 5'-TCGDG-3', 5'-GGT-3', 5'-BGC-3', 5'-RTG-3', 5'-NYGG-3', 5'-AGCCA-3', 5'-CTGCA-3', 5'-TGTCA-3', 5'-GCGCA-3', 5'-GCGCT-3', 5'-GCGTT-3', 5'-AGCCC-3', 5'-CGTCA-3', 5'-GCGTA-3', 5'-AGCCG-3', 5'-GCGTC-3', 5'-AGTCA-3', 5'-AGCAC-3' 및 5'-AGCTC-3'로 이루어진 군으로부터 선택된 서열로 이루어진 것이고,
    상기 표적 핵산은 상기 Cas 뉴클레아제 또는 이의 변이체, 및 상기 가이드 RNA의 복합체에 의해 인식될 수 있고,
    상기 Cas 뉴클레아제 또는 이의 변이체, 및 가이드 RNA의 복합체는 표적 핵산을 서열-특이적으로 변형시키는 것인 방법.
  2. 청구항 1에 있어서, 상기 Cas 뉴클레아제는 스트렙토코커스 피오게네스(Streptococcus pyogenes), 스트렙토코커스 써모필러스(Streptococcus thermophilus), 스트렙토코커스 아우레우스(Streptococcus aureus), 캄필로박터 제주니(Campylobacter jejuni), 레지오넬라 뉴모필라(Legionella pneumophila), 네이세리아 메닝기티디스(Neisseria meningitidis), 파스테우렐라 물토시다(Pasteurella multocida), 프란시셀라 노비시다(Francisella novicida), 및 프레보텔라 디시엔스(Prevotella disiens)로 이루어진 군으로부터 선택된 세균으로부터 유래된 뉴클레아제인 것인 방법.
  3. 청구항 1에 있어서, 상기 Cas 뉴클레아제는 Cas9, Cpf1, C2c1, C2c2, C2c3, Cas3, Cas5, Cas7, Cas8, 또는 Cas10인 것인 방법.
  4. 청구항 1에 있어서, 상기 Cas 뉴클레아제의 변이체는 xCas9, SpCas9-NG, Cas9 틈내기효소(Cas9 nickase: Cas9 nickase), 불활성화 Cas9(Deactivated Cas9: dCas9), 및 불안정화 Cas9(destabilized Cas9: DD-Cas9)로 이루어진 군으로부터 선택된 것인 방법.
  5. 청구항 1에 있어서, 상기 Cas 뉴클레아제의 변이체가 SpCas9-NG인 경우, 상기 PAM은 5'-NA-3', 5'-NTG-3', 5'-GTH-3', 5'-VCGD-3', 및 5'-TCGDG-3'로 이루어진 군으로부터 선택된 뉴클레오티드 서열로 이루어진 폴리뉴클레오티드인 것인 방법.
  6. 청구항 1에 있어서, 상기 Cas 뉴클레아제가 스트렙토코커스 피오게네스 유래 Cas9(SpCas9)인 경우, 상기 PAM은 5'-GGT-3', 5'-BGC-3', 5'-RTG-3', 5'-NYGG-3', 5'-AGCCA-3', 5'-CTGCA-3', 5'-TGTCA-3', 5'-GCGCA-3', 5'-GCGCT-3', 5'-GCGTT-3', 5'-AGCCC-3', 5'-CGTCA-3', 5'-GCGTA-3', 5'-AGCCG-3', 5'-GCGTC-3', 5'-AGTCA-3', 5'-AGCAC-3' 및 5'-AGCTC-3'로 이루어진 군으로부터 선택된 뉴클레오티드 서열로 이루어진 폴리뉴클레오티드인 것인 방법.
  7. 청구항 1에 있어서, 상기 가이드 RNA는 상기 표적 핵산에서 PAM의 5' 방향 또는 3' 방향으로 연속적인 2 내지 24 뉴클레오티드 서열과 상보적인 폴리뉴클레오티드인 것인 방법.
  8. 청구항 1에 있어서, 상기 가이드 RNA의 길이는 17 뉴클레오티드 내지 24 뉴클레오티드인 것인 방법.
  9. 청구항 1에 있어서, 상기 변형은 절단, 삽입, 절단, 삽입, 연결, 탈아미노화, 또는 이들의 조합인 것인 방법.
  10. 청구항 1의 방법으로 유전체의 표적 핵산이 변형된 세포.
PCT/KR2019/011166 2018-08-31 2019-08-30 세포의 유전체에서 표적 핵산을 변형시키는 방법 WO2020046047A1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
US17/271,971 US20210340528A1 (en) 2018-08-31 2019-08-30 Method for modifying target nucleic acid in genome of cell
EP19854936.2A EP3845645A4 (en) 2018-08-31 2019-08-30 METHOD OF MODIFYING A TARGET NUCLEIC ACID IN THE GENOME OF A CELL

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR10-2018-0103979 2018-08-31
KR20180103979 2018-08-31
KR10-2019-0000391 2019-01-02
KR20190000391 2019-01-02

Publications (1)

Publication Number Publication Date
WO2020046047A1 true WO2020046047A1 (ko) 2020-03-05

Family

ID=69642922

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2019/011166 WO2020046047A1 (ko) 2018-08-31 2019-08-30 세포의 유전체에서 표적 핵산을 변형시키는 방법

Country Status (4)

Country Link
US (1) US20210340528A1 (ko)
EP (1) EP3845645A4 (ko)
KR (4) KR20200026164A (ko)
WO (1) WO2020046047A1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114555803A (zh) * 2019-10-14 2022-05-27 延世大学校产学协力团 新的前间区序列邻近基序序列以及利用其修饰细胞基因组中靶核酸的方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016033298A1 (en) * 2014-08-28 2016-03-03 North Carolina State University Novel cas9 proteins and guiding features for dna targeting and genome editing
WO2017205290A1 (en) * 2016-05-23 2017-11-30 The Trustees Of Columbia University In The City Of New York Bypassing the pam requirement of the crispr-cas system

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190381192A1 (en) * 2017-02-22 2019-12-19 Io Biosciences, Inc. Nucleic acid constructs comprising gene editing multi-sites and uses thereof

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016033298A1 (en) * 2014-08-28 2016-03-03 North Carolina State University Novel cas9 proteins and guiding features for dna targeting and genome editing
WO2017205290A1 (en) * 2016-05-23 2017-11-30 The Trustees Of Columbia University In The City Of New York Bypassing the pam requirement of the crispr-cas system

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
HIRANO, S.: "Structural Basis for the Altered PAM Specificities of Engineered CRISPR-Cas9", MOLECULAR CELL, 17 March 2016 (2016-03-17), pages 886 - 894, XP029464130 *
HU , J. H. O: "Evolved Cas9 variants with broad PAM compatibility and high DNA specificity", NATURE, 5 April 2018 (2018-04-05), pages 57 - 63, XP055490065 *
HU, J.H. ET AL., NATURE, vol. 556, 2018, pages 57 - 63
KLEINSTIVER, B. P.: "Engineered CRISPR-Cas9 nucleases with altered PAM specificities", NATURE, 2015, pages 481 - 485, XP055293257 *
See also references of EP3845645A4

Also Published As

Publication number Publication date
KR102648886B1 (ko) 2024-03-19
US20210340528A1 (en) 2021-11-04
KR102696880B1 (ko) 2024-08-21
KR20220061078A (ko) 2022-05-12
KR20220061929A (ko) 2022-05-13
EP3845645A1 (en) 2021-07-07
EP3845645A4 (en) 2022-05-18
KR20200026164A (ko) 2020-03-10
KR20200112795A (ko) 2020-10-05

Similar Documents

Publication Publication Date Title
CN105861552B (zh) 一种T7 RNA聚合酶介导的CRISPR/Cas9基因编辑系统的构建方法
US6573046B1 (en) Eukaryotic use of improved chimeric mutational vectors
CN104726494A (zh) CRISPR-Cas9技术构建染色体易位干细胞及动物模型的方法
CN111607594A (zh) 一种基于CRISPR-Cas9编辑技术的敲除猪IRF8基因的细胞系及其构建方法
CN108707635B (zh) 用于核苷酸序列修饰的组合物、方法与应用
JP2023506631A (ja) 共有結合で閉端された核酸分子末端を使用したngsライブラリー調製
WO2022119294A1 (ko) 사이토신 교정 활성이 제거된 아데닌 염기교정 유전자가위 및 이의 용도
US20240352433A1 (en) Enzymes with hepn domains
WO2017215517A1 (zh) 测序文库构建中5&#39;和3&#39;接头连接副产物的去除方法
WO2020046047A1 (ko) 세포의 유전체에서 표적 핵산을 변형시키는 방법
WO2021175287A1 (zh) 检测单碱基编辑系统随机脱靶效应的方法
CN104388456A (zh) 一种同时表达两条sgRNA的载体的构建方法
WO2021075827A1 (ko) 신규 프로토스페이서 인접 모티프 서열 및 이를 이용한 세포의 유전체에서 표적 핵산을 변형시키는 방법
CN109554451A (zh) 一种同时进行基因组dna多态性和甲基化检测的方法
WO2022059891A1 (ko) 알러지 주요유전자 fel d1 타켓 고양이 셀라인 구축
WO2021020884A2 (ko) 사이토신 염기교정용 조성물 및 이의 용도
Gozukirmizi et al. Transposon activity in plant genomes
CN113151277A (zh) 鸡DF-1细胞IHH基因敲除稳定细胞株的构建方法及其特异性sgRNA
CN109628447B (zh) 特异靶向羊友好位点H11的sgRNA及其编码DNA和应用
CN112921040A (zh) 一种基于CRISPR-Cas9基因编辑技术的猪TFF1基因敲除细胞系的构建方法
JP2022549721A (ja) 環状一本鎖ポリヌクレオチドを含む核酸送達ベクター
CN111218468A (zh) 一种缩短水稻生育期的育种方法
WO2022119295A1 (ko) 티민-사이토신 서열 특이적 사이토신 교정 활성이 증진된 아데닌 염기교정 유전자가위 및 이의 용도
CN112553251B (zh) 一种流感病毒相关宿主基因突变体的筛选方法
WO2022146124A1 (ko) 조직 특이적 발현을 위한 융합 프로모터 및 이의 용도

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19854936

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2019854936

Country of ref document: EP

Effective date: 20210331