BR112020003439A2 - tecnologia de alteração específica de sequência alvo usando o reconhecimento alvo nucleotídico - Google Patents
tecnologia de alteração específica de sequência alvo usando o reconhecimento alvo nucleotídico Download PDFInfo
- Publication number
- BR112020003439A2 BR112020003439A2 BR112020003439-8A BR112020003439A BR112020003439A2 BR 112020003439 A2 BR112020003439 A2 BR 112020003439A2 BR 112020003439 A BR112020003439 A BR 112020003439A BR 112020003439 A2 BR112020003439 A2 BR 112020003439A2
- Authority
- BR
- Brazil
- Prior art keywords
- sequence
- target
- crispr
- gene
- complementary
- Prior art date
Links
- 239000002773 nucleotide Substances 0.000 title claims abstract description 138
- 125000003729 nucleotide group Chemical group 0.000 title claims abstract description 137
- 230000008859 change Effects 0.000 title claims description 9
- 238000005516 engineering process Methods 0.000 title description 2
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 162
- 108020005004 Guide RNA Proteins 0.000 claims abstract description 137
- 238000000034 method Methods 0.000 claims abstract description 101
- 108091033409 CRISPR Proteins 0.000 claims abstract description 94
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 90
- 108020004414 DNA Proteins 0.000 claims abstract description 88
- 238000010354 CRISPR gene editing Methods 0.000 claims abstract description 87
- 230000000295 complement effect Effects 0.000 claims abstract description 55
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 33
- 230000008685 targeting Effects 0.000 claims abstract description 33
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 32
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 32
- 230000003252 repetitive effect Effects 0.000 claims abstract description 27
- 230000014509 gene expression Effects 0.000 claims description 63
- 102000040430 polynucleotide Human genes 0.000 claims description 23
- 108091033319 polynucleotide Proteins 0.000 claims description 23
- 239000002157 polynucleotide Substances 0.000 claims description 23
- 239000013604 expression vector Substances 0.000 claims description 16
- 102000053602 DNA Human genes 0.000 claims description 11
- 238000003780 insertion Methods 0.000 claims description 9
- 230000037431 insertion Effects 0.000 claims description 9
- 238000012217 deletion Methods 0.000 claims description 6
- 230000037430 deletion Effects 0.000 claims description 6
- 238000006467 substitution reaction Methods 0.000 claims description 3
- 210000004027 cell Anatomy 0.000 description 108
- 235000018102 proteins Nutrition 0.000 description 80
- 239000013598 vector Substances 0.000 description 43
- 108010042407 Endonucleases Proteins 0.000 description 40
- 239000013612 plasmid Substances 0.000 description 36
- 102100031780 Endonuclease Human genes 0.000 description 35
- 230000035772 mutation Effects 0.000 description 31
- 108090000765 processed proteins & peptides Proteins 0.000 description 23
- 238000004458 analytical method Methods 0.000 description 21
- 239000012634 fragment Substances 0.000 description 21
- 238000010362 genome editing Methods 0.000 description 21
- 241000588724 Escherichia coli Species 0.000 description 20
- 238000003776 cleavage reaction Methods 0.000 description 19
- 230000007017 scission Effects 0.000 description 19
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 18
- 241000192710 Microcystis aeruginosa Species 0.000 description 17
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 16
- 241000196324 Embryophyta Species 0.000 description 15
- 108091028043 Nucleic acid sequence Proteins 0.000 description 14
- 125000003275 alpha amino acid group Chemical group 0.000 description 13
- 101150102092 ccdB gene Proteins 0.000 description 13
- 229920002401 polyacrylamide Polymers 0.000 description 13
- 241000208125 Nicotiana Species 0.000 description 12
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 12
- 240000003768 Solanum lycopersicum Species 0.000 description 11
- 108020001507 fusion proteins Proteins 0.000 description 11
- 102000037865 fusion proteins Human genes 0.000 description 11
- 238000011144 upstream manufacturing Methods 0.000 description 11
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 10
- 101150108119 PDS gene Proteins 0.000 description 10
- 241000219194 Arabidopsis Species 0.000 description 9
- 238000000338 in vitro Methods 0.000 description 9
- 241000589158 Agrobacterium Species 0.000 description 8
- 206010020649 Hyperkeratosis Diseases 0.000 description 8
- 101150053283 IAA9 gene Proteins 0.000 description 8
- 238000001727 in vivo Methods 0.000 description 8
- 239000002609 medium Substances 0.000 description 8
- 239000013600 plasmid vector Substances 0.000 description 8
- 238000012163 sequencing technique Methods 0.000 description 8
- 125000006850 spacer group Chemical group 0.000 description 8
- 241000700605 Viruses Species 0.000 description 7
- 108091008146 restriction endonucleases Proteins 0.000 description 7
- 230000001629 suppression Effects 0.000 description 7
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 6
- 229960005091 chloramphenicol Drugs 0.000 description 6
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 6
- 229930027917 kanamycin Natural products 0.000 description 6
- 229960000318 kanamycin Drugs 0.000 description 6
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 6
- 229930182823 kanamycin A Natural products 0.000 description 6
- 239000000203 mixture Substances 0.000 description 6
- 229920001184 polypeptide Polymers 0.000 description 6
- 102000004196 processed proteins & peptides Human genes 0.000 description 6
- 230000001105 regulatory effect Effects 0.000 description 6
- 241000894007 species Species 0.000 description 6
- 239000000126 substance Substances 0.000 description 6
- 238000001890 transfection Methods 0.000 description 6
- 241000894006 Bacteria Species 0.000 description 5
- 102000004533 Endonucleases Human genes 0.000 description 5
- 230000004075 alteration Effects 0.000 description 5
- 238000010276 construction Methods 0.000 description 5
- 238000007796 conventional method Methods 0.000 description 5
- 239000013613 expression plasmid Substances 0.000 description 5
- 238000007894 restriction fragment length polymorphism technique Methods 0.000 description 5
- 101100290380 Caenorhabditis elegans cel-1 gene Proteins 0.000 description 4
- 108091026890 Coding region Proteins 0.000 description 4
- 108091027305 Heteroduplex Proteins 0.000 description 4
- 101001048956 Homo sapiens Homeobox protein EMX1 Proteins 0.000 description 4
- 239000006142 Luria-Bertani Agar Substances 0.000 description 4
- 108010076504 Protein Sorting Signals Proteins 0.000 description 4
- 108091026822 U6 spliceosomal RNA Proteins 0.000 description 4
- 230000009471 action Effects 0.000 description 4
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 4
- 230000001580 bacterial effect Effects 0.000 description 4
- 230000015556 catabolic process Effects 0.000 description 4
- 230000007717 exclusion Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 108010040467 CRISPR-Associated Proteins Proteins 0.000 description 3
- 241000701489 Cauliflower mosaic virus Species 0.000 description 3
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 3
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 3
- 102000002812 Heat-Shock Proteins Human genes 0.000 description 3
- 108010004889 Heat-Shock Proteins Proteins 0.000 description 3
- 108010033040 Histones Proteins 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- 241000207746 Nicotiana benthamiana Species 0.000 description 3
- 108091023040 Transcription factor Proteins 0.000 description 3
- 102000040945 Transcription factor Human genes 0.000 description 3
- 210000004102 animal cell Anatomy 0.000 description 3
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 3
- 238000003556 assay Methods 0.000 description 3
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 239000003623 enhancer Substances 0.000 description 3
- 210000003527 eukaryotic cell Anatomy 0.000 description 3
- 102000034287 fluorescent proteins Human genes 0.000 description 3
- 108091006047 fluorescent proteins Proteins 0.000 description 3
- 239000008103 glucose Substances 0.000 description 3
- 210000005260 human cell Anatomy 0.000 description 3
- 238000001638 lipofection Methods 0.000 description 3
- 238000002703 mutagenesis Methods 0.000 description 3
- 231100000350 mutagenesis Toxicity 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 2
- 108700028369 Alleles Proteins 0.000 description 2
- 241000203069 Archaea Species 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- 241000287828 Gallus gallus Species 0.000 description 2
- 241000192701 Microcystis Species 0.000 description 2
- 208000009869 Neu-Laxova syndrome Diseases 0.000 description 2
- 101710163270 Nuclease Proteins 0.000 description 2
- 108020004682 Single-Stranded DNA Proteins 0.000 description 2
- 108700005078 Synthetic Genes Proteins 0.000 description 2
- 210000004507 artificial chromosome Anatomy 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 229910052791 calcium Inorganic materials 0.000 description 2
- 239000011575 calcium Substances 0.000 description 2
- 239000001506 calcium phosphate Substances 0.000 description 2
- 229910000389 calcium phosphate Inorganic materials 0.000 description 2
- 235000011010 calcium phosphates Nutrition 0.000 description 2
- 238000004113 cell culture Methods 0.000 description 2
- 230000010261 cell growth Effects 0.000 description 2
- 230000011559 double-strand break repair via nonhomologous end joining Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 108010025678 empty spiracles homeobox proteins Proteins 0.000 description 2
- 230000002779 inactivation Effects 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 210000003292 kidney cell Anatomy 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 238000000520 microinjection Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 230000003007 single stranded DNA break Effects 0.000 description 2
- 230000000392 somatic effect Effects 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- UZKQTCBAMSWPJD-UQCOIBPSSA-N trans-Zeatin Natural products OCC(/C)=C\CNC1=NC=NC2=C1N=CN2 UZKQTCBAMSWPJD-UQCOIBPSSA-N 0.000 description 2
- UZKQTCBAMSWPJD-FARCUNLSSA-N trans-zeatin Chemical compound OCC(/C)=C/CNC1=NC=NC2=C1N=CN2 UZKQTCBAMSWPJD-FARCUNLSSA-N 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 238000010361 transduction Methods 0.000 description 2
- 230000026683 transduction Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 2
- 241001135192 Acetohalobium arabaticum Species 0.000 description 1
- 206010069754 Acquired gene mutation Diseases 0.000 description 1
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 1
- 241000147155 Ammonifex degensii Species 0.000 description 1
- 241000192537 Anabaena cylindrica Species 0.000 description 1
- 235000011299 Brassica oleracea var botrytis Nutrition 0.000 description 1
- 240000003259 Brassica oleracea var. botrytis Species 0.000 description 1
- 101100268670 Caenorhabditis elegans acc-3 gene Proteins 0.000 description 1
- 241000511679 Caldicellulosiruptor lactoaceticus Species 0.000 description 1
- 241000193403 Clostridium Species 0.000 description 1
- 208000003322 Coinfection Diseases 0.000 description 1
- 241000973884 Crinalium epipsammum Species 0.000 description 1
- 241000159506 Cyanothece Species 0.000 description 1
- 241001263141 Cylindrospermum stagnale Species 0.000 description 1
- 241000701022 Cytomegalovirus Species 0.000 description 1
- 230000007067 DNA methylation Effects 0.000 description 1
- 230000007018 DNA scission Effects 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 201000005569 Gout Diseases 0.000 description 1
- 108010051696 Growth Hormone Proteins 0.000 description 1
- 241001152403 Haloquadratum walsbyi Species 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 102000003893 Histone acetyltransferases Human genes 0.000 description 1
- 108090000246 Histone acetyltransferases Proteins 0.000 description 1
- 241001265502 Methanocaldococcus vulcanius Species 0.000 description 1
- 241000205263 Methanospirillum hungatei Species 0.000 description 1
- 108020005196 Mitochondrial DNA Proteins 0.000 description 1
- 241000908263 Natrialba asiatica Species 0.000 description 1
- 241000204971 Natronomonas pharaonis Species 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- 241000424623 Nostoc punctiforme Species 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 241000248493 Oscillatoria acuminata Species 0.000 description 1
- 241000122845 Phormidesmis priestleyi Species 0.000 description 1
- 241001632455 Picrophilus torridus Species 0.000 description 1
- 102000055027 Protein Methyltransferases Human genes 0.000 description 1
- 108700040121 Protein Methyltransferases Proteins 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 108020004688 Small Nuclear RNA Proteins 0.000 description 1
- 102000039471 Small Nuclear RNA Human genes 0.000 description 1
- 235000002560 Solanum lycopersicum Nutrition 0.000 description 1
- 102100038803 Somatotropin Human genes 0.000 description 1
- 241000589887 Spirochaeta thermophila Species 0.000 description 1
- 241001464991 Stanieria cyanosphaera Species 0.000 description 1
- 206010042135 Stomatitis necrotising Diseases 0.000 description 1
- 241000205098 Sulfolobus acidocaldarius Species 0.000 description 1
- 241001439057 Syneches Species 0.000 description 1
- 241000078013 Trichormus variabilis Species 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 210000005006 adaptive immune system Anatomy 0.000 description 1
- 238000013019 agitation Methods 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 210000001367 artery Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 108010006025 bovine growth hormone Proteins 0.000 description 1
- 238000012832 cell culture technique Methods 0.000 description 1
- 239000004568 cement Substances 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000005782 double-strand break Effects 0.000 description 1
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 241001233957 eudicotyledons Species 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000011331 genomic analysis Methods 0.000 description 1
- 239000000122 growth hormone Substances 0.000 description 1
- 230000006195 histone acetylation Effects 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 238000001764 infiltration Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 239000006870 ms-medium Substances 0.000 description 1
- 238000007481 next generation sequencing Methods 0.000 description 1
- 201000008585 noma Diseases 0.000 description 1
- XQNRAQZFPXUCOT-UHFFFAOYSA-N phytene Natural products CC(C)CCCC(C)CCCC(C)CCCC(C)C=C XQNRAQZFPXUCOT-UHFFFAOYSA-N 0.000 description 1
- 210000002706 plastid Anatomy 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 235000004252 protein component Nutrition 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 238000007634 remodeling Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 230000037439 somatic mutation Effects 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/111—General methods applicable to biologically active non-coding nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/09—Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Biomedical Technology (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Medicinal Chemistry (AREA)
- Analytical Chemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Crystallography & Structural Chemistry (AREA)
- Immunology (AREA)
- Gastroenterology & Hepatology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Peptides Or Proteins (AREA)
Abstract
A presente invenção refere-se a um método para direcionar uma sequência nucleotídica alvo. O método inclui a introdução em uma célula: (i) proteínas relacionadas tipo I-D de CRISPR Cas5d, Cas6d e Cas7d, ou ácidos nucleicos que codificam estas proteínas; e (ii) um RNA guia que inclui uma sequência complementar à referida sequência nucleotídica alvo e uma sequência repetitiva comum derivada do locus do gene de CRISPR antes e depois da referida sequência complementar, ou um DNA que codifica o referido RNA guia.
Description
Relatório Descritivo da Patente de Invenção para "TECNO-
LOGIA DE ALTERAÇÃO ESPECÍFICA DE SEQUÊNCIA ALVO USANDO O RECONHECIMENTO ALVO NUCLEOTÍDICO". Campo técnico
[0001] A presente invenção refere-se a um método para direcionar uma sequência nucleotídica alvo, um método para alterar especifica- mente a sequência nucleotídica alvo e um método para suprimir a ex- pressão de um gene alvo, em que o reconhecimento alvo nucleotídico de CRISPR (Repetições Palindrômicas Curtas com Intercalação Regu- lar e Agrupadas) é utilizado um sistema de identificação de tipo e um complexo compreendendo proteínas Cas (associadas às CRISPR) e um RNA guia usado nos métodos. Técnica Anterior
[0002] Bactérias e arqueias têm sistemas de CRISPR como siste- ma imunológico adaptativo contra vírus e plasmídeos estranhos hete- rólogos. O sistema de CRISPR utiliza um RNA molecular baixo (referi- do como RNA guia ou gRNA) que é complementar a uma sequência de DNA invasora para promover o direcionamento e a degradação do DNA estranho alvo. Neste momento, é necessária a proteína Cas que se liga ao gRNA para formar um complexo. O sistema de CRISPR in- clui sistemas tipo |, tipo Il, tipo Ill e tipo V. Em qualquer sistema, o complexo Cas-proteína-RNAm atua na sequência alvo para causar interferência em vírus e plasmídeos estranhos. Nos sistemas tipo Il e tipo V, o mecanismo de interferência envolve quebras de fita dupla do DNA no DNA alvo por uma proteína integrada com um domínio protei- co que retém a ligação ao gRNA e um domínio proteico de clivagem de DNA do tipo RuvC. Para o sistema tipo Ill, foi demonstrado in vitro e in vivo que a interferência é causada pela clivagem de uma sequência de RNA alvo por um complexo de cinco a oito proteínas Cas e um gRNA, diferentemente do sistema tipo |l.
[0003] Nos últimos anos, foram desenvolvidas técnicas de edição de genoma usando os sistemas de CRISPR tipo || e tipo V, em que Cas9 e Cpf1 são utilizados como proteína Cas. Cas9 e Cpf1 exigem uma sequência que consiste em cerca de 2 a 5 nucleotídeos na proxi- midade de uma sequência alvo, que é chamada de sequência de moti- vo adjacente protoespaçador (PAM), a fim de reconhecer o DNA alvo. Ela foi demonstrada in vitro e in vivo que um complexo Cas9-gRNA e um complexo Cpf1-gRNA são endonucleases guiadas por RNA espe- cíficas da sequência que causam quebras de fita dupla de DNA em sítios alvo próximos às sequências de PAM.
[0004] Por outro lado, em relação ao sistema de CRISPR tipo |, vários subtipos foram identificados em sequências genômicas de vá- rias bactérias, e os subtipos foram denominados tipo IA, IB, IC, ID, IE, IF e IU. Entre esses subtipos, o sistema tipo IE derivado de Escheri- chia coli foi mais estudado e demonstrou-se que um complexo que consiste em seis proteínas Cas (Cas3, Cse1l, Cse2, Cas7, Cas5, Cas6e) e um gRNA promove a degradação de uma sequência de DNA alvo. Para os outros subtipos, excluindo um subtipo (tipo |-C), no en- tanto, os componentes da proteína Cas, sequências de gRNA, se- quências de PAM que determinam os DNAs alvo, etc. necessários pa- ra o efeito de interferência, dificilmente são elucidados. Além disso, como técnicas que utilizam proteínas CAS derivadas do sistema de CRISPR tipo |, um método para suprimir a expressão de um gene alvo que compreende o uso de moléculas de ácido nucleico recombinantes que codificam proteínas CAS derivadas do sistema de CRISPR tipo | (Literatura de Patente 1) e um método para alterar um ácido nucleico alvo que compreende a utilização de um complexo de proteínas Cas derivadas do sistema de CRISPR tipo | e outras proteínas (literatura de patente 2 e literatura de patente 3) foram relatadas. No entanto, nunca foi relatada uma técnica para clivar e alterar uma fita dupla de uma molécula de DNA alvo por endonuclease guiada por RNA derivada do sistema de CRISPR tipo |. Lista de Citação Literatura de Patente
[0005] Literatura de Patente 1: WO2015/155686
[0006] Literatura de patente 2: JP-A 2015-503535
[0007] Literatura de Patente 3: WO2017/043573 Sumário da Invenção Problemas Técnicos
[0008] Nos sistemas de CRISPR convencionais tipo |l e tipo V, uma molécula de RNA a ser utilizada para direcionar é limitada a uma molécula de RNA de cerca de 20 nucleotídeos que precede ou segue uma sequência PAM de 2 a 5 nucleotídeos que determina a especificida- de do alvo. Assim, os sistemas de CRISPR convencionais tipo Il e V têm problemas em que existem locis em que um alvo não pode ser projetado e que sequências semelhantes podem ser clivadas. É desejável o de- senvolvimento de um novo sistema de direcionamento e de uma nova endonuclease guiada por RNA que não possua os problemas. Solução de Problemas
[0009] Para resolver os problemas acima, os presentes inventores estudaram intensivamente. Como resultado, surpreendentemente, um novo sistema de direcionamento e uma nova endonuclease guiada por RNA que têm como alvo uma sequência mais longa do que a sequên- cia alvo das endonucleases CRISPR tipo Il ou endonucleases guiadas por RNA tipo V convencionalmente usadas na tecnologia de edição de genoma foram encontradas a partir do CRISPR tipo ID, e então verifi- cou-se que o novo sistema de direcionamento e a endonuclease guia- da por RNA podem ser usados em técnicas de edição de genoma para permitir a alteração em uma sequência nucleotídica alvo. Assim, a presente invenção foi concluída.
[0010] Ou seja, a presente invenção fornece:
[1] Um método para direcionar uma sequência nucleotídica alvo, o método compreendendo a introdução em uma célula de: (i) proteínas associadas a CRISPR tipo |-D Cas5d, Cas6d e Cas7d, ou ácidos nucleicos que codificam as proteínas, e (ii) um RNA guia compreendendo uma sequência comple- mentar à sequência nucleotídica alvo e sequências repetitivas comuns derivadas de um locus de CRISPR, precedendo e seguindo a sequên- cia complementar, ou um DNA que codifica o RNA guia;
[2] Um método para alterar uma sequência nucleotídica al- vo, o método compreendendo a introdução em uma célula de: (i) proteínas associadas a CRISPR tipo |-D Cas3d, Cas5d, Cas6d, Cas7d e Cas10d, ou ácidos nucleicos que codificam as proteí- nas, e (ii) um RNA guia compreendendo uma sequência comple- mentar à sequência nucleotídica alvo e sequências repetitivas comuns derivadas de um locus de CRISPR, precedendo e seguindo a sequên- cia complementar, ou um DNA que codifica o RNA guia;
[3] Um método para suprimir a expressão de um gene alvo, o método compreendendo a introdução em uma célula de: (i) proteínas associadas a CRISPR tipo |-D Cas5d, Cas6d e Cas7d, ou ácidos nucleicos que codificam as proteínas, e (ii) um RNA guia compreendendo uma sequência comple- mentar a pelo menos uma parte da sequência do gene alvo e sequên- cias repetitivas comuns derivadas de um locus de CRISPR, preceden- do e seguindo a sequência complementar, ou um DNA que codifica o RNA guia;
[4] O método de acordo com qualquer um dentre [1] a [3], em que o RNA guia compreende uma sequência que consiste em 20 a 50 nucleotídeos que é complementar à sequência nucleotídica alvo;
[5] O método de acordo com [2] ou [4], compreendendo ainda a introdução de um polinucleotídeo doador na célula;
[6] O método de acordo com qualquer um dentre [2], [4] e
[5], em que a alteração é deleção, inserção ou substituição de nucleo- tídeos;
[7] O método de acordo com qualquer um dentre [1] a [6], em que a Cas5d reconhece 5'-GTH-3' (H = A, C ou T) como uma se- quência de motivo adjacente protoespaçador (PAM);
[8] Um complexo, compreendendo: (i) proteínas associadas a CRISPR tipo |-D Cas5d, Cas6d e Cas7d, e (ii) um RNA guia compreendendo uma sequência comple- mentar a uma sequência nucleotídica alvo e sequências repetitivas comuns derivadas de um locus de CRISPR, precedendo e seguindo a sequência complementar;
[9] O complexo de acordo com [8], compreendendo ainda Cas3d e Cas10d;
[10] O complexo de acordo com [8] ou [9], em que o RNA guia compreende uma sequência que consiste em 20 a 50 nucleotí- deos que é complementar à sequência nucleotídica alvo;
[11] Um vetor de expressão caracterizado pelo fato de que compreende: (i) ácidos nucleicos que codificam as proteínas associadas a CRISPR tipo |-D Cas5d, Cas6d e Cas7d, e (ii) um DNA que codifica um RNA guia compreendendo uma sequência complementar à sequência nucleotídica alvo e se- quências repetitivas comuns derivadas de um locus de CRISPR, pre- cedendo e seguindo a sequência complementar;
[12] O vetor de expressão de acordo com [11], compreen- dendo ainda ácidos nucleicos que codificam Cas3d e Cas10d;
[13] Uma molécula de DNA que codifica o complexo de acordo com qualquer um dentre [8] a [10];
[14] Uso de (i) proteínas associadas a CRISPR tipo |-D Cas5d, Cas6d e Cas7d, ou ácidos nucleicos que codificam as proteínas, e (ii) um RNA guia compreendendo uma sequência comple- mentar à sequência nucleotídica alvo e sequências repetitivas comuns derivadas de um locus de CRISPR, precedendo e seguindo a sequên- cia complementar, ou um DNA que codifica o RNA guia, para direcionar a sequência nucleotídica alvo;
[15] Uso de (i) proteínas associadas a CRISPR tipo |-D Cas3d, Cas5d, Cas6d, Cas7d e Cas10d, ou ácidos nucleicos que codificam as proteí- nas, e (ii) um RNA guia compreendendo uma sequência comple- mentar à sequência nucleotídica alvo e sequências repetitivas comuns derivadas de um locus de CRISPR, precedendo e seguindo a sequên- cia complementar, ou um DNA que codifica o RNA guia, para alterar a sequência nucleotídica alvo;
[16] Uso de (i) proteínas associadas a CRISPR tipo |-D Cas5d, Cas6d e Cas7d, ou ácidos nucleicos que codificam as proteínas, e (ii) um RNA guia compreendendo uma sequência comple- mentar a pelo menos uma parte da sequência genética segmentada e sequências repetitivas comuns derivadas de um locus de CRISPR, precedendo e seguindo a sequência complementar, ou um DNA que codifica o RNA guia, para suprimir a expressão do gene alvo;
[17] Uso de acordo com qualquer um dentre [14] a [16], em que o RNA guia compreende uma sequência que consiste em 20 a 50 nucleotídeos complementares à sequência nucleotídica alvo;
[18] Uso de acordo com [15] ou [17], em que a alteração é exclusão, inserção ou substituição de nucleotídeo;
[19] Uso de acordo com qualquer um dentre [14] a [18], em que a Cas5d reconhece 5'-GTH-3' (H = A, C ou T) como uma sequên- cia de motivo adjacente protoespaçador (PAM);
[20] Uso de um complexo compreendendo: (i) proteínas associadas a CRISPR tipo |-D Cas5d, Cas6d e Cas7d, e (ii) um RNA guia que compreende uma sequência comple- mentar a uma sequência nucleotídica alvo e sequências repetitivas comuns derivadas de um locus de CRISPR, precedendo e seguindo a sequência complementar, para direcionar a sequência nucleotídica alvo;
[21] Uso de um complexo compreendendo: (i) proteínas associadas a CRISPR tipo |-DCas3d, Cas5d, Cas6d, Cas7d e Cas10d e (ii) um RNA guia que compreende uma sequência comple- mentar a uma sequência nucleotídica alvo e sequências repetitivas comuns derivadas de um locus de CRISPR, precedendo e seguindo a sequência complementar, para alterar a sequência nucleotídica alvo;
[22] Uso do complexo, compreendendo: (i) proteínas associadas a CRISPR tipo |-D Cas5d, Cas6d e Cas7d, e (ii) um RNA guia que compreende uma sequência comple- mentar a pelo menos uma parte da sequência genética segmentada e sequências repetitivas comuns derivadas de um locus de CRISPR, precedendo e seguindo a sequência complementar, para suprimir a expressão do gene alvo; e
[23] Uso de acordo com qualquer um dentre [20] a [22], em que o RNA guia compreende uma sequência que consiste em 20 a 50 nucleotídeos complementares à sequência nucleotídica alvo. Efeitos da Invenção
[0011] As sequências de PAM do sistema de CRISPR tipo I|-D (a seguir, também denominado "TiD") são diferentes das sequências de PAM do sistema de CRISPR tipo |l e do sistema tipo V. Portanto, de acordo com a presente invenção, o uso das proteínas Cas de CRISPR tipo I-D torna possível direcionar loci que não podem ser direcionados pelas técnicas convencionais de edição de genoma usando endonu- cleases guiadas por RNA derivado de CRISPR tipo Il ou V. Além dis- So, as sequências de PAM da endonuclease guiada por RNA deriva- das de CRISPR tipo |-D da presente invenção são mais frequentemen- te encontradas nas sequências genômicas de alguns organismos do que as sequências de PAM de CRISPR tipo || e tipo V. Portanto, de acordo com a presente invenção, é possível direcionar um número maior de sequências de genes do que as técnicas convencionais de edição de genoma, utilizando os sistemas de CRISPR tipo |l e tipo V. Além disso, os presentes inventores descobriram que um gRNA no sistema de CRISPR tipo |-D pode direcionar uma sequência alvo com um comprimento de 30 nucleotídeos ou mais. Por outro lado, um gRNA no sistema de CRISPR tipo Il ou tipo V pode direcionar uma se- quência com um comprimento de cerca de 20 nucleotídeos. Assim, o sistema de CRISPR tipo I-D da presente invenção mostra proprieda- des de ligação mais estáveis e especificidade de alvo do que as técni- cas convencionais.
[0012] Assim, de acordo com a presente invenção, é possível rea- lizar a geração de alelos mutantes, controle da expressão gênica por ativação e inativação transcricional e alteração epigenômica por dire- cionamento de um domínio proteico modificador de DNA/modificador de histona, em regiões gênicas que não podem ser direcionadas pelas técnicas convencionais. Breve Descrição dos Desenhos
[0013] A FIG. 1 descreve o componente do sistema de CRISPR tipo I-D da presente invenção e os modos de direcionamento e cliva- gem em uma sequência alvo.
[0014] A FIG. 2 mostra o vetor de expressão TiD para edição do genoma de E. coli: a) a estrutura do plasmídeo pEcTiD2; b) a estrutura do plasmídeo pEcTiD3, promotor sintético Pro: J23108, t1: sequência terminadora STOP767, RBS: sequência de ligação ao ribossoma, t2: sequência terminadora STOP768 (1), t3: sequência terminadora TOP768 (2), t3: sequência terminadora T7: T7, 7d: Cas7 derivada de Microcys- tis aeruginosa (daqui em diante, abreviado como "Ma"), 6d: MaCas6d, 5d: MaCas5d, 3d: MaCas3d, 10d: MaCas10d, promotor T7 pro: T7, CrRN: sequência de repetição CRISPR derivada de TiD, Cm: gene de resistência ao cloranfenicol, origem de replicação derivada do plasmí- deo p15A ori: p15A.
[0015] A FIG. 3 mostra as estruturas dos plasmídeos das bibliote- cas pMW ccdB e pMW cedB-PAM: a) a estrutura de pMW ccedB, t2: sequência terminadora rrnB2, t1: sequência terminadora rrnB1, PAM: sequência de motivos adjacente protoespaçadores, promotor 17 pro: T7, gene ccdB, Km : gene de resistência à canamicina, origem de re- plicação derivada do plasmídeo pSC101 ori: pSC101; b) a sequência alvo da biblioteca de plasmídeos pMW ccedB-PAM, em que 4 nucleotí- deos aleatórios são inseridos no sítio NNNN para obter um plasmídeo da biblioteca de rastreamento de sequências de PAM, uma região em caixa indica o promotor T7, a sequência sublinhada indica a sequência alvo TiD e as letras maiúsculas indicam o locus do ccdB.
[0016] A FIG. 4 mostra o vetor de expressão de TiD para edição do genoma da planta: a) a estrutura do plasmídeo pEgPTiD1; b) a es-
trutura do cassete de expressão de crRNA para plantas; c) a estrutura do plasmídeo pEgPTiD2, RB: sequência da borda direita, LB: sequên- cia da borda esquerda, 2x35S: 2x promotor do gene 358 do vírus do mosaico de couve-flor e sequência realçadora OQ de translação, 3d: MaCas3d com uma sequência que codifica 2xNLS (sinal de localiza- ção nuclear), 10d : MaCas10d com 2xNLS, 7d: MaCas7d com 2xNLS, 6d: MaCas6d com 2xNLS, 5d: MaCas5d com 2xNLS, 2A (1) - (4): se- quências 2A do peptídeo de autoclivagem (1) - (4), Ter: terminador do gene da proteína de 18,2 kDa de choque térmico de Arabidopsis, Km: cassete de expressão do gene de resistência à canamicina, U6-26: promotor do gene U6 snRNA-26 de Arabidopsis, cr»RNA: sequências de repetição de CRISPR derivadas do locus TiD.
[0017] A FIG. 5-1 mostra a mutagênese do gene PDS do tabaco usando pEgPTiD2-pds: a) sequências alvo no gene PDS do tabaco, em que a sequência alvo 1 foi selecionada a partir do terceiro éxon e a sequência alvo 2 foi selecionada a partir do sexto éxon, as partes em caixa nas sequências alvo mostradas no painel inferior indicam as se- quências de PAM e as partes sublinhadas indicam as sequências alvo; b) introdução de pEgPTiD2-pds e um vetor binário de expressão de GFP por agroinfiltração, em que as agrobactérias que transportam pE- gPTiD2-pds (1) ou pegPTiD-pds (2) e as Agrobacteria que transportam um plasmídeo binário de expressão de GFP foram infectadas por agroinfiltração e discos foliares nos quais o GFP foi infectado por dis- cos de folhas e a expressão de GFP foi observada, foram excisados e utilizados para a análise da introdução da mutação do PDS.
[0018] A FIG. 5-2 mostra a mutagênese direcionada ao sítio do gene PDS do tabaco usando pEgPTiD2-pds: c) análise da introdução da mutação PDS pelo ensaio Cel-1, onde o DNA genômico foi prepa- rado a partir dos discos das folhas nas quais a expressão de GFP foi observada na FIG . 5-b), e a presença ou ausência de mutações foi analisada pelo ensaio Cel-1. Marcas de triângulo indicam fragmentos do gene PDS mutado que foram clivados pela nuclease Cel-1.
[0019] A FIG. 6 mostra a mutagênese do gene IAA9 do tomate usando pEgPTiD2-iaa9: a) uma sequência alvo no gene IAAS9 do toma- te, em que a sequência alvo 1 foi selecionada a partir do segundo éxon, uma parte encaixotada na sequência alvo mostrada no painel inferior indica a sequência PAM, e a parte sublinhada indica a sequên- cia alvo; b) pegPTiD2-iaa9 foi introduzido em um disco de folhas de tomate pelo método Agrobacterium para obter células de calo trans- formadas; c) análise de mutação por POCR-RFLP, em que a região con- tendo a sequência alvo IAAS9 foi amplificada por PCR a partir de um DNA genômico que foi preparado a partir das células de calo transfor- madas nas quais foi introduzido o pEgPTiD2-iaa9, e a análise de mu- tação foi realizada por POR-RFLP usando Accl. Triângulos abertos indicam fragmentos de clivagem Accl derivados tipo selvagem, e um triângulo acima dos triângulos abertos indica um fragmento mutado que não sofre clivagem por Accl.
[0020] A FIG. 7 mostra a análise de mutação por sequenciação em calos introduzidos por pEcTiD2-iaa9. A sequência superior mostra a sequência IAAS9 tipo selvagem e uma parte sublinhada indica a se- quência alvo. Sequências em caixa indicam as sequências de PAM. Os sítios onde ocorreram mutações são mostrados por símbolos ou hífens de inserção. O hífen indica a exclusão de nucleotídeos.
[0021] A FIG. 8 mostra a análise de mutação em uma planta regene- rada introduzida por pEcTiD2-iaa9: a) análise de mutação por PCR- RFLP, em que triângulos abertos indicam fragmentos de clivagem Accl derivados tipo selvagem, e um triângulo acima dos triângulos abertos in- dica fragmentos mutados que não sofrem clivagem Accl; e b) uma foto- grafia de um tomateiro introduzido por mutação que mostra morfologia anormal de folhas verdadeiras como resultado da ruptura do gene IAA9.
[0022] A FIG. 9 mostra um esquema experimental de edição de genoma usando a linhagem celular HEK293.
[0023] A FIG. 10 mostra resultados da análise de mutação pela análise de mobilidade heteroduplex. Um fragmento considerado deri- vado de uma sequência mutada foi detectado (símbolo de chave preta) do genoma de uma célula na qual um crRNA contendo a sequência do alvo 1 no gene EMX1 e os genes TiD foram introduzidos.
[0024] A FIG. 11 mostra os resultados da análise de mutação pela análise de mobilidade heteroduplex. Um fragmento considerado deri- vado de uma sequência mutada foi detectado (símbolo de chave preta) a partir do genoma de uma célula na qual foi introduzido um cr»RNA contendo a sequência do alvo 2 no gene EMX1 e nos genes TiD.
[0025] A FIG. 12 mostra a análise de sequenciamento de sequên- cias mutadas. Letras brancas em fundo preto indicam PAM (sequência adjacente do protoespaçador) reconhecida por TiD. Sequências em caixa indicam sequências alvo. Hífens (-) indicam exclusão de nucleo- tídeo. Um caractere alfabético em minúscula em negrito indica inser- ção de nucleotídeo. No lado direito de cada sequência, é mostrada a eficiência somática da mutação (o número de clones nos quais uma sequência mutada foi observada/o número total de clones analisados).
[0026] A FIG. 13 mostra a análise de sequenciamento de sequên- cias mutadas. Letras brancas em fundo preto indicam PAM (sequência adjacente do protoespaçador) reconhecida pelo TiD. Sequências em caixas indicam sequências alvo. Hífens (-) indicam deleção de nucleo- tídeos. Os caracteres alfabéticos minúsculos em negrito indicam a in- serção de nucleotídeos. No lado direito de cada sequência, é mostrada a eficiência somática da mutação (o número de clones nos quais uma sequência mutada foi observada/o número total de clones analisados). Modo de Realização da Invenção
[0027] A presente invenção fornece uma técnica de edição de ge-
noma utilizando o sistema de CRISPR tipo |-D. Especificamente, entre as proteínas Cas de CRISPR tipo I|-D, Cas3d, Cas5d, Cas6d, Cas7d e Cas10d são utilizadas na presente invenção. Na presente invenção, veri- ficou-se que o sistema de CRISPR tipo |-D compreende um módulo de reconhecimento alvo compreendendo Cas5d, Cas6d e Cas7d e um mó- dulo de clivagem polinucleotídica compreendendo Cas3d e Cas10d.
[0028] Especificamente, o princípio de ação da presente invenção é o seguinte.
[0029] Complexo, compreendendo: 1) um gRNA necessário para o direcionamento de uma se- quência nucleotídica alvo (a seguir também denominada "direciona- mento"), compreendendo uma sequência complementar à sequência nucleotídica alvo e uma sequência repetitiva comum presente no locus de CRISPR tipo |-D, 2) Cas5d que reconhece uma sequência PAM presente na proximidade da sequência nucleotídica alvo, 3) Cas7d que se liga ao gRNA de 1) e é necessário para o direcionamento da sequência nucleotídica alvo, e 4) Cas6d, que realiza o processamento do gRNA de 1), e 5) um complexo compreendendo Cas10d que interage com o complexo compreendendo 1) a 4) e executa a remodelagem da se- quência nucleotídica alvo e Cas3d que executa a degradação de um polinucleotídeo são fornecidos a uma célula e na célula, 6) direcionamento da sequência nucleotídica alvo pelo complexo compreendendo 1) a 4), ou seja, 7) direcionamento da sequência nucleotídica alvo por um complexo compreendendo um gRNA maduro que é obtido pelo pro- cessamento do gRNA de 1) por Cas6d de 4) e 2) e 3) é realizado, e
8) um polinucleotídeo na sequência nucleotídica alvo é cli- vado pelo complexo de 5).
[0030] Portanto, a presente invenção fornece um método para di- recionar uma sequência nucleotídica alvo (a seguir também referido como "o método de direcionamento de sequência alvo da presente in- venção"), um método para alterar uma sequência nucleotídica alvo (a seguir referido como "o método de alteração de sequência alvo da presente invenção") e um método para suprimir a expressão de um gene alvo (a seguir também referido como" o método de supressão de expressão do gene alvo da presente invenção"), em que o sistema de identificação de tipo CRISPR é utilizado nos métodos. Além disso, a presente invenção fornece um complexo compreendendo proteínas Cas associadas a CRISPR tipo |-D e um gRNA (a seguir também refe- rido como "o complexo da presente invenção"), e um vetor compreen- dendo uma molécula de ácido nucleico que codifica o complexo, que é usada nos métodos acima mencionados da presente invenção. (1) Célula
[0031] Na presente invenção, a célula pode ser uma célula proca- riótica ou uma célula eucariótica, e não é particularmente limitada. Exemplos de células incluem bactérias, arqueias, leveduras, células vegetais, células de insetos e células animais (por exemplo, células humanas, células não humanas, células de vertebrados não mamiífe- ros, células de invertebrados, etc.). (2) Endonuclease quiada por RNA e proteína Cas
[0032] Na presente invenção, a "endonuclease guiada por RNA" significa uma endonuclease compreendendo pelo menos um domínio nuclease e pelo menos um domínio que se liga a um gRNA, que é gui- ado a uma sequência nucleotídica alvo (ou a um sítio nucleotídico al- vo) pelo gRNA . A endonuclease guiada por RNA usada na presente invenção é uma endonuclease guiada por RNA derivada de CRISPR tipo
I-D e compreende proteínas associadas a CRISPR tipo I-D Cas3d, Cas5d, Cas6d, Cas7d e Cas10d. Na presente invenção, verificou-se que Cas5d, Cas6d e Cas7d constituem um "módulo de reconhecimento alvo" que contribui para o reconhecimento alvo, e Cas3d e Cas10d constituem um "módulo de clivagem de polinucleotídeos" que contribui para a cliva- gem de um polinucleotídeo. Especificamente, a endonuclease guiada por RNA utilizada na presente invenção compreende o módulo de re- conhecimento alvo compreendendo Cas5d, Cas6d e Cas7d e o módu- lo de clivagem polinucleotídica compreendendo Cas3d e Cas10d.
[0033] As Cas3d, Cas5d, Cas6d, Cas7d e Cas10d utilizadas na presente invenção podem ser derivadas de qualquer bactéria ou ar- queia. Exemplos da bactéria e da arqueia incluem Microcystis aerugi- nosa, Acetohalobiumarabaticum, Ammonifexdegensii, Anabaena cylin- drica, Anabaena variabilis, Caldicellulosiruptorlactoaceticus, Caldiline- aaerophila, Clostridium algicarnis, Crinaliumepipsammum, Cyanothece Sp., Cylindrospermumstagnale, Haloquadratumwalsbyi, Halorubrumla- cusprofundi, Methanocaldococcusvulcanius, Methanospirillumhungatei, Natrialbaasiatica, Natronomonaspharaonis, Nostocpunctiforme, Phor- midesmispriestleyi, Oscillatoriaacuminata, Picrophilustorridus, Spiro- chaetathermophila, Stanieriacyanosphaera, Sulfolobusacidocaldarius, Sulfolobusislandicus, Synechocystis Sp., Thermacetogeniumphaeum, Thermofilumpendens, etc. As informações da sequência de aminoáci- dos e da sequência nucleotídica das proteínas Cas estão disponíveis em banco de dados público, por exemplo, NCBI GenBank. Além disso, as sequências de novas espécies microbianas também podem ser ob- tidas a partir de dados do genoma microbiano obtidos por análise me- tagenômica ou por meio do programa BLAST. Os ácidos nucleicos que codificam as proteínas Cas podem ser construídos, por exemplo, por síntese química ou semelhante após a seleção de códons ideais para translação em uma célula hospedeira na qual os ácidos nucleicos são introduzidos com base nas informações da sequência de aminoácidos usada em uma célula hospedeira torna possível aumentar o nível de expressão da proteína. Por exemplo, as proteínas Cas podem ser quimicamente sintetizadas com base nas informações da sequência de aminoácidos ou produzidas em uma célula através da introdução de ácidos nucleicos que codificam as proteínas Cas na célula através de um vetor apropriado ou semelhante. Cada proteína Cas de Cas3d, Cas5d, Cas6d, Cas7d e Cas10d pode ser uma proteína Cas tipo mu- tante, desde que retenha a função de cada proteína Cas conforme descrito no princípio de ação da presente invenção. (3) RNA guia
[0034] Na presente invenção, o RNA guia (gRNA) é uma molécula que forma um complexo com o módulo de reconhecimento alvo (Cas5d, Cas6d e Cas7d) para direcionar uma sequência nucleotídica alvo juntamente com essas proteínas Cas. Na presente invenção, o gRNA se liga a Cas7d do módulo de reconhecimento alvo. Na presen- te invenção, o gRNA se liga a um complexo compreendendo Cas5d, Cas6d e Cas7d para guiar o complexo para a sequência nucleotídica alvo. Por exemplo, o gRNA se liga ao módulo de reconhecimento alvo da endonuclease guiada por RNA para guiar a endonuclease guiada por RNA para a sequência nucleotídica alvo. Quando o módulo de re- conhecimento alvo está presente como parte de uma proteína de fu- são que não seja a endonuclease guiada por RNA, o gRNA se liga ao módulo de reconhecimento alvo para guiar a proteína de fusão para a sequência nucleotídica alvo.
[0035] O gRNA compreende uma sequência complementar a uma sequência alvo, de modo que um par de bases pode ser formado entre o gRNA e a sequência nucleotídica alvo, e sequências repetitivas co- muns derivadas do locus de CRISPR tipo |-D antes e depois (no lado de extremidade 5' e no lado de extremidade 3' da) sequência comple-
mentar. As partes comuns da sequência repetitiva do gRNA podem ter pelo menos uma estrutura em formato de grampo de cabelo. Por exemplo, a sequência repetitiva comum colocada no lado de extremi- dade 5' da sequência complementar a uma sequência nucleotídica al- vo pode ter uma estrutura em formato de grampo de cabelo e a se- quência repetitiva comum colocada no lado 3' da extremidade da se- quência complementar a um alvo sequência nucleotídica pode ser de cadeia simples. Na presente invenção, o gRNA tem de preferência uma estrutura em formato de grampo de cabelo.
[0036] A sequência repetitiva comum derivada de um locus de CRISPR tipo |-D pode ser encontrada a partir de uma região de se- quência de genes de gRNA adjacente a um grupo de genes tipo |-D usando um programa de pesquisa repetida em tandem. O comprimen- to nucleotídico da sequência repetitiva comum contida no gRNA não é particularmente limitado desde que o gRNA interaja com o módulo de reconhecimento alvo para direcionar uma sequência de nucleotídeo alvo. Por exemplo, cada uma das sequências repetitivas comuns que precedem e seguem a sequência complementar a uma sequência nu- cleotídica alvo pode ter um comprimento de cerca de 10 a 70 nucleotí- deos, por exemplo, um comprimento de 30 a 50 nucleotídeos.
[0037] O gRNA pode conter uma sequência que consiste em cerca de 10 a 70 nucleotídeos, que é complementar a uma sequência nucle- otídica alvo. A sequência complementar a uma sequência nucleotídica alvo contida no gRNA é preferencialmente uma sequência consistindo em 20 a 50 nucleotídeos, mais preferencialmente uma sequência con- sistindo em 25 a 45 nucleotídeos, mais preferencialmente uma se- quência consistindo em 30 a 40 nucleotídeos, ou ainda mais preferen- cialmente uma sequência que consiste em 32 a 37 nucleotídeos, por exemplo, uma sequência que consiste em 32 nucleotídeos, 33 nucleo- tídeos, 34 nucleotídeos, 35 nucleotídeos, 36 nucleotídeos ou 37 nucle-
otídeos. A especificidade da sequência de reconhecimento alvo pelo gRNA é aumentada mais grandemente à medida que a sequência alvo que pode ser direcionada é mais longa. Além disso, o valor de Tm de um par de bases formado entre o gRNA e a sequência alvo é mais alto e a estabilidade do reconhecimento do alvo aumenta mais à medida que a sequência alvo que pode ser direcionada é mais longa. Uma vez que o comprimento de uma sequência que pode ser direcionada por um gRNA para endonucleases guiadas por RNA (por exemplo, Cas9 e Cpf1) usado nas técnicas convencionais de edição de genoma tem cerca de 20 a 24 comprimentos de nucleotídeos, a presente invenção é excelente nessa especificidade de sequência e na estabilidade em comparação com os métodos convencionais. (4) Sequência nucleotídica alvo
[0038] Na presente invenção, a sequência nucleotídica alvo (tam- bém referida como "a sequência alvo", quando aqui utilizada) é qual- quer sequência de ácido nucleico e não é particularmente limitada desde que seja uma sequência localizada nas proximidades de um mo- tivo de proximidade protoespaçador (PAM). A sequência nucleotídica alvo pode ser uma sequência de DNA de fita dupla, uma sequência de DNA de fita única ou uma sequência de RNA. Exemplos de DNA inclu- em DNA genômico nuclear eucariótico, DNA mitocondrial, DNA plastídi- co, DNA genômico procariótico, DNA fágico e DNA plasmídico. Na pre- sente invenção, a sequência nucleotídica alvo é preferencialmente um DNA de fita dupla no genoma. Quando aqui utilizada, a frase "na proxi- midade de" inclui ser adjacente a um local e estar próximo a um local. Quando aqui utilizada, a "proximidade" inclui adjacência e redondeza.
[0039] As sequências de PAM usadas para o reconhecimento do alvo dos sistemas de CRISPR variam de acordo com os tipos de sis- temas de CRISPR. Na presente invenção, verificou-se que a sequên- cia PAM utilizada pelo sistema de CRISPR tipo |-D é 5-GTH-3' (H= A,
C ou T) (Exemplo 1). De preferência, uma sequência localizada na proximidade do lado 3' a jusante da sequência PAM é selecionada como a sequência nucleotídica alvo. Por exemplo, a sequência nucleo- tídica alvo pode ser uma sequência localizada na proximidade da se- quência PAM e presente em um íntron, uma região codificante, uma região não codificante ou uma região controle de um gene alvo. O ge- ne alvo pode ser qualquer gene e opcionalmente selecionado.
[0040] As sequências de PAM para Cas9 e Cpf1i usadas nas téc- nicas convencionais de edição de genoma são 5'-NGG-3' (N= A, C, G ou T) e 5-TTTV-3' (V = A, C ou G), A frequência de aparecimento da sequência PAM para TiD (ou seja, o número de alvos candidatos do sistema de CRISPR) foi comparada com as frequências de apareci- mento das sequências de PAM para Cas9 e Cpf1i nas sequências ge- nômicas de plantas superiores. Como resultado, verificou-se que a frequência de aparência da sequência de PAM para TiDis é a mais alta e o TiD tem um número maior de alvos do que as técnicas convencio- nais de edição de genoma usando Cas9 e Cpf1 (Tabela 1). Tabela 1 Comparação do número de sequência do PAM (= número de alvos
(5) O método de direcionar uma sequência alvo da presente invenção
[0041] O método de direcionar uma sequência alvo da presente invenção é caracterizado pela introdução do módulo de reconhecimen- to alvo (Cas5d, Cas6d e Cas7d) e o gRNA na célula. Especificamente, o método de direcionamento de sequência alvo da presente invenção é caracterizado por introduzir na célula (i) Cas5d, Cas6d e Cas7d, ou ácidos nucleicos que codificam essas proteínas, e (ii) o gRNA ou um DNA que codifica o gRNA. O método de direcionamento de sequência alvo da presente invenção pode ser realizado in vitro ou in vivo.
[0042] No método de direcionar uma sequência alvo da presente invenção, o módulo de reconhecimento alvo pode ser introduzido na célula como um complexo isolado compreendendo Cas5d, Cas6d e Cas7d, ou cada um de Cas5d, Cas6d e Cas7d pode ser introduzido na célula como um isolado proteína. No método de direcionamento de sequência alvo da presente invenção, o módulo de reconhecimento alvo também pode ser introduzido na célula como ácidos nucleicos que codificam as proteínas Cas Cas5d, Cas6d e Cas7d. Exemplos do ácido nucleico incluem RNA como mRNA e DNA.
[0043] Os DNAs que codificam as proteínas Cas podem estar con- tidos, por exemplo, em um vetor. A sequência de DNA é de preferên- cia operacionalmente ligada a uma sequência reguladora, como um promotor ou terminador. Quando a célula na qual o módulo de reco- nhecimento alvo é introduzido é uma célula eucariótica, uma sequên- cia de sinal de localização nuclear é preferencialmente adicionada ao DNA que codifica a proteína Cas. Dois ou mais ou todos os DNAs que codificam as proteínas Cas Cas5d, Cas6d e Cas7d podem estar conti- dos em um único vetor ou em vetores separados. O número de veto- res e os tipos e combinações de proteínas Cas codificadas pelos DNAs a serem incorporados em cada vetor não são limitados. Quando dois ou mais DNAs que codificam as proteínas Cas estão contidos em um único vetor, as sequências de DNA podem ser ligadas umas às outras, por exemplo, através de uma sequência que codifica um peptí- deo autoclivante, de forma a ser expressa policistronicamente. Os dois ou mais DNAs que codificam as proteínas Cas podem estar ligadas em qualquer ordem.
[0044] O gRNA pode ser introduzido na célula como um RNA ou como um DNA que codifica o gRNA. O DNA que codifica o gRNA pode estar contido, por exemplo, em um vetor. A sequência de DNA é de preferência operacionalmente ligada a uma sequência reguladora, co- mo um promotor ou um terminador.
[0045] Os DNAs que codificam as proteínas Cas e o DNA que co- difica o gRNA podem estar contidos no mesmo vetor ou em vetores separados. Por exemplo, um ou mais ou todos os DNAs que codificam Cas5d, Cas6d e Cas7d e o DNA que codifica o gRNA podem estar contidos em um único vetor.
[0046] A sequência reguladora, como um promotor ou um termi- nador, e a sequência do sinal de localização nuclear são conhecidas na técnica e podem ser adequadamente selecionadas dependendo das espécies de organismos nas quais a célula na qual o módulo de reconhecimento alvo e o gRNA é introduzido é derivada das espécies de organismos. O vetor usado para a introdução pode ser adequada- mente selecionado, dependendo das espécies de organismos em que a célula na qual o vetor é introduzido é derivado das espécies de or- ganismos e não é particularmente limitado. Exemplos do vetor incluem vetores plasmídicos, vetores de vírus, fagomídeos, cosmídeos, cro- mossomas artificiais/minicromossomas e transposons.
[0047] A introdução do módulo de reconhecimento alvo e do gRNA na célula pode ser realizada por vários meios conhecidos na técnica. Exemplos de tais meios incluem transfecção, por exemplo, transfecção mediada por fosfato de cálcio, eletroporação, transfecção de liposso-
mas, etc., transdução de vírus, lipofecção, biolística, microinjeção, mé- todo de Agrobacterium, agroinfiltração e um método de PEG-cálcio.
[0048] O módulo de reconhecimento alvo e o gRNA podem ser introduzidos na célula simultaneamente ou sequencialmente. Cas5d, Cas6d e Cas7d constituindo o módulo de reconhecimento alvo, ou áci- dos nucleicos que codificam essas proteínas Cas podem ser introduzi- dos na célula simultaneamente ou sequencialmente. Por exemplo, as proteínas Cas Cas5d, Cas6d e Cas7d sintetizadas in vitro ou in vivo e o gRNA sintetizado in vitro ou in vivo podem ser incubadas in vitro pa- ra formar um complexo, e o complexo pode ser introduzido na célula.
[0049] Após a introdução do módulo de reconhecimento alvo e do gRNA, a célula é cultivada sob condições adequadas para o direcio- namento de uma sequência nucleotídica alvo. A célula é então cultiva- da sob condições adequadas para crescimento e manutenção celular. As condições de cultura podem ser adequadas para as espécies de organismos nas quais a célula na qual o módulo de reconhecimento alvo e o gRNA são introduzidos é derivada e podem ser adequada- mente determinadas por uma pessoa versada na técnica, por exemplo, com base na cultura de células conhecidas nas técnicas.
[0050] De acordo com o método de direcionar uma sequência alvo da presente invenção, o gRNA liga Cas7d do módulo de reconheci- mento alvo para formar um complexo do módulo de reconhecimento alvo e o gRNA. Ao mesmo tempo, o gRNA forma um par de bases com a sequência nucleotídica alvo. O módulo de reconhecimento alvo tem como alvo a sequência nucleotídica alvo de uma maneira especí- fica da sequência, reconhecendo a sequência PAM presente na pro- ximidade da sequência nucleotídica alvo. No método de direcionamen- to de sequência alvo da presente invenção, Cas10d pode ser adicio- nalmente introduzida na célula. (6) O método de direcionar uma sequência alvo da presente invenção
[0051] O método de alteração da sequência alvo da presente in- venção é caracterizado pela introdução da endonuclease guiada por RNA e o gRNA na célula. Especificamente, o método alvo de alteração de sequência da presente invenção é caracterizado por introduzir na célula (i) Cas3d, Cas5d, Cas6d, Cas7d e Cas10d, ou ácidos nucleicos que codificam as proteínas e (ii) o gRNA ou um DNA que codifica o gRNA. O método de alteração da sequência alvo da presente invenção compreende a clivagem de uma sequência nucleotídica direcionada pelo método de direcionamento da sequência alvo da presente inven- ção com o módulo de clivagem polinucleotídica. O método de altera- ção da sequência alvo da presente invenção pode ser realizado in vitro ou in vivo. Na presente invenção, a alteração inclui deleção, inserção e substituição de um ou mais nucleotídeos e uma combinação dos mesmos.
[0052] No método de alteração da sequência alvo da presente in- venção, além da endonuclease guiada por RNA e do gRNA, um poli- nucleotídeo doador pode ser introduzido na célula. O polinucleotídeo doador compreende pelo menos uma sequência doadora que contém alteração desejada para ser introduzida em um sítio alvo. O polinucleo- tídeo doador pode compreender, além da sequência doadora, sequên- cias com alta homologia com as sequências a montante e a jusante da sequência alvo (preferencialmente, sequências substancialmente idên- ticas às sequências a montante e a jusante da sequência alvo) em ambas as extremidades do doador sequência. O polinucleotídeo doa- dor pode ser um DNA de fita simples ou dupla. O polinucleotídeo doa- dor pode ser adequadamente projetado por uma pessoa versada na técnica com base nos métodos conhecidas na técnica.
[0053] Quando o polinucleotídeo doador está ausente no método de alterar uma sequência alvo da invenção, a clivagem na sequência nucleotídica alvo pode ser reparada por união de extremidade não homóloga (NHEJ). Sabe-se que a NHEJ é propensa a erros, e a ex- clusão, inserção ou substituição de um ou mais nucleotídeos, ou uma combinação dos mesmos, pode ocorrer durante o reparo da clivagem. Assim, a sequência pode ser alterada no sítio de sequência alvo e, as- sim, induzida a mudança de quadro ou um códon de interrupção ima- turo para inativar ou eliminar a expressão do gene codificado pela re- gião de sequência alvo.
[0054] Quando o polinucleotídeo doador está presente no método de alteração de uma sequência alvo da presente invenção, a sequên- cia doadora do polinucleotídeo doador é inserida no sítio de sequência alvo ou substitui o sítio de sequência alvo pelo reparo de recombinação homóloga (HDR) da sequência nucleotídica alvo clivada. Como resulta- do, a alteração desejada é introduzida no sítio de sequência alvo.
[0055] A endonuclease guiada por RNA pode ser introduzida na célula como um complexo isolado compreendendo Cas5d, Cas6d, Cas7d, Cas3d e Cas10d, ou cada um de Cas5d, Cas6d, Cas7d, Cas7d, Cas3d e Cas10d pode ser introduzido na célula como uma úni- ca proteína isolada. A endonuclease guiada por RNA também pode ser introduzida na célula como ácidos nucleicos que codificam as pro- teínas Cas Cas5d, Cas6d, Cas7d, Cas3d e Cas10d. Exemplos do áci- do nucleico incluem RNA como mRNA e DNA.
[0056] O DNA que codifica a proteína Cas pode estar contido, por exemplo, em um vetor, e a sequência de DNA é preferencialmente operacionalmente ligada a uma sequência reguladora, como um pro- motor ou um terminador. Quando a célula na qual a endonuclease gui- ada por RNA é introduzida é uma célula eucariótica, uma sequência de sinal de localização nuclear é preferencialmente adicionada ao DNA que codifica a proteína Cas. Dois ou mais ou todos os DNAs que codi- ficam as proteínas Cas Cas3d, Cas5d, Cas6d, Cas7d e Cas10d po- dem estar contidos em um único vetor ou em vetores separados. O número de vetores e os tipos e combinações de proteínas Cas codifi- cadas pelos DNAs a serem incorporados em cada vetor não são limi- tados. Quando dois ou mais DNAs que codificam as proteínas Cas es- tão contidos em um único vetor, as sequências de DNA podem ser |i- gadas umas às outras, por exemplo, através de uma sequência que codifica um peptídeo de autoclivagem, de modo a ser expressa policis- tronicamente. Os dois ou mais DNAs que codificam as proteínas Cas podem estar ligados em qualquer ordem.
[0057] O gRNA pode ser introduzido na célula como um RNA ou como um DNA que codifica o gRNA. O DNA que codifica o gRNA pode estar contido, por exemplo, em um vetor. A sequência de DNA é de preferência operacionalmente ligada a uma sequência reguladora, co- mo um promotor ou um terminador.
[0058] Os DNAs que codificam as proteínas Cas e o DNA que co- difica o gRNA podem estar contidos no mesmo vetor ou podem estar contidos em vetores separados. Por exemplo, um ou mais ou todos os DNAs que codificam Cas3d, Cas5d, Cas6d, Cas7d e Cas10d e o DNA que codifica o gRNA podem estar contidos em um único vetor.
[0059] A sequência reguladora, como um promotor ou um termi- nador, e a sequência do sinal de localização nuclear são conhecidas na técnica e podem ser adequadamente selecionadas dependendo tipo de célula na qual a endonuclease guiada por RAN e o gRNA são introduzidos. O vetor usado para uma introdução pode ser adequada- mente selecionado, dependendo tipo de célula na qual o vetor é intro- duzido, e não é particularmente limitado. Exemplos do vetor incluem vetores de plasmídeo, vetores de vírus, fagomídeos, cosmídeos, cro- mossomas artificiais/minicromossomas e transposons.
[0060] A introdução da endonuclease guiada por RNA, o gRNA e o polinucleotídeo doador na célula pode ser realizada por vários meios conhecidos na técnica. Exemplos de tais meios incluem transfecção,
por exemplo, transfecção mediada por fosfato de cálcio, eletroporação, transfecção de lipossomas, etc., transdução de vírus, lipofecção, bio- lística, microinjeção, método Agrobacterium, Agroinfiltração e método PEG-cálcio.
[0061] A endonuclease guiada por RNA, o gRNA e o polinucleotí- deo doador podem ser introduzidos na célula simultaneamente ou se- quencialmente. Cas3d, Cas5d, Cas6d, Cas7d e Cas10d que constitu- em a endonuclease guiada por RNA ou ácidos nucleicos que codificam essas proteínas Cas podem ser introduzidos na célula simultaneamen- te ou sequencialmente.
[0062] Após a introdução da endonuclease guiada por RNA e do gRNA ou da endonuclease guiada por RNA, o gRNA e o polinucleotí- deo doador, a célula é cultivada em condições adequadas para cliva- gem no sítio de sequência alvo. A célula é então cultivada sob condi- ções adequadas para crescimento e manutenção celular. As condi- ções de cultura podem ser adequadas para as espécies de organis- mos das quais derivam as células nas quais a endonuclease guiada por RNA e o gRNA ou a endonuclease guiada por RNA, o grRNAÃ e o polinucleotídeo doador são introduzidos e podem ser adequadamente determinados por uma pessoa versada na técnica, por exemplo, com base em técnicas conhecidas de cultura de células.
[0063] De acordo com o método de alteração de uma sequência alvo da presente invenção, o gRNA forma um par de bases com a se- quência nucleotídica alvo e, ao mesmo tempo, o gRNA interage com o módulo de reconhecimento alvo da endonuclease guiada por RNA pa- ra guiar a Endonuclease guiada por RNA para o sítio de sequência al- vo. Então, o módulo de clivagem da endonuclease guiada por RNA cliva a sequência no sítio de sequência alvo. Quando a sequência cli- vada é reparada, a sequência alvo é alterada. Por exemplo, o método de alteração de uma sequência alvo da presente invenção pode ser utilizado para uma alteração de uma sequência nucleotídica alvo no genoma. Um DNA de cadeia dupla no genoma é clivado e depois alte- rado no sítio alvo pelo método de alteração de uma sequência alvo da presente invenção. (7) O método de supressão de genes alvo da presente invenção
[0064] O método de expressão-supressão do gene alvo da presen- te invenção é caracterizado pela introdução do módulo de reconheci- mento alvo (Cas5d, Cas6d e Cas7d) e o gRNA na célula. Especifica- mente, o método de supressão do gene alvo da presente invenção é caracterizado pela introdução na célula (i) Cas5d, Cas6d e Cas7d, ou ácidos nucleicos que codificam as proteínas, e (ii) o gRNA ou um DNA que codifica o gRNA. No método de supressão do gene alvo da pre- sente invenção, pelo menos uma parte da sequência do gene alvo é selecionada como uma sequência nucleotídica alvo, e o gRNA conten- do uma sequência complementar à sequência alvo é usado. O método de supressão do gene alvo da presente invenção compreende suprimir a expressão de um gene contendo a sequência alvo pela ligação de um complexo do módulo de reconhecimento alvo e o gRNA à sequên- cia alvo ao direcionar a sequência nucleotídica alvo pelo método de supressão de gene alvo da presente invenção. O método de supres- são do gene alvo da presente invenção pode ser realizado in vitro ou in vivo. De acordo com o método de supressão do gene alvo da pre- sente invenção, embora a sequência do gene alvo não seja clivada, a função de uma região gênica contendo a sequência alvo ou a expres- são do gene é inibida pela ligação do complexo do módulo de reco- nhecimento do alvo e o gRNA para a sequência nucleotídica alvo.
[0065] O módulo de reconhecimento alvo e o gRNA, um método para um método para introduzi-los na célula, a cultura de células no momento da introdução e após a introdução e similares são como descritos em "(5) O método de direcionar uma sequência alvo da pre-
sente invenção". No método de supressão gênica alvo da presente in- venção, Cas10d pode ser também introduzido na célula. (8) Complexo da presente invenção
[0066] O complexo da presente invenção compreende as proteí- nas Cas tipo |-D de CRISPR e o gRNA. A presente invenção fornece particularmente um complexo compreendendo o módulo de reconhe- cimento alvo e o gRNA, e um complexo compreendendo a endonu- clease guiada por RNA e o gRNA. Mais especificamente, um complexo compreendendo Cas5d, Cas6d, Cas7d e o gRNA, e um complexo compreendendo Cas5d, Cas6d, Cas7d, Cas3d, Cas10d e o gRNA é fornecido. Além disso, uma molécula de DNA que codifica o complexo é fornecida. O complexo da presente invenção pode ser utilizado no méto- do de alterar uma sequência alvo, no método de supressão gênica alvo e no método de direcionar uma sequência alvo da presente invenção. Uma sequência alvo no genoma de uma célula pode ser alterada pela introdu- ção de um complexo compreendendo a endonuclease guiada por RNA (um complexo compreendendo Cas5d, Cas6d, Cas7d, Cas3d e Cas10d) e o gRNA na célula para permitir o complexo funcionar na célula. Além disso, uma sequência alvo em uma célula pode ser direcionada e a ex- pressão de um gene codificado por uma região de sequência alvo pode ser suprimida pela introdução de um complexo compreendendo o mó- dulo de reconhecimento alvo (um complexo compreendendo Cas5d, Cas6d e Cas7d) e o gRNA na célula para permitir o complexo funcio- nar na célula. O complexo que compreende o módulo de reconheci- mento alvo e o gRNA pode ainda conter Cas10d.
[0067] O complexo da presente invenção pode ser produzido in vitro ou in vivo por um método convencional. Por exemplo, ácidos nu- cleicos que codificam as proteínas Cas que constituem a endonu- clease guiada por RNA ou o módulo de reconhecimento alvo, e o gRNA ou um DNA que codifica o gRNA podem ser introduzidos em uma célula para permitir o complexo formar-se na célula.
[0068] Exemplos do complexo da presente invenção incluem, po- rém, não estão limitados a, um complexo compreendendo Cas5d (SEQ ID NO: 1), Cas6d (SEQ ID NO: 2) e Cas7d (SEQ ID NO: 3) de Microcystis aeruginosa, e um gRNA que consiste em uma sequência mostrada por GUUCCAAUUAAUCUUAAGCCCUAUUAGGGAUUGAA
ACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGUUCCA AUUAAUCUUAAGCCCUAUUAGGGAUUGAAAC (SEQ ID NO: 6; N é qualquer nucleotídeo que constitui uma sequência complementar a uma sequência nucleotídica alvo), e um complexo compreendendo Cas 5d (SEQ ID NO: 1), Cas6d (SEQ ID NO: 2), Cas7d (SEQ ID NO: 3), Cas3d (SEQ ID NO: 4), e Cas10d (SEQ ID NO: 5) de Microcystis aeruginosa, e um gRNA que consiste em uma sequência mostrada por
NNNNNNNNNNNNNNNNNNNNNNNNNNNNGUUCCAAUUAAUCUUA AGCCCUAUUAGGGAUUGAAAC (SEQ ID NO: 6 ; N é qualquer nu- cleotídeo que constitui uma sequência complementar a uma sequência nucleotídica alvo). Na sequência de gRNA, o número de N pode variar dentro de uma faixa de 10 a 70, preferivelmente 20 a 50, mais preferi- velmente 25 a 45, ainda mais preferivelmente 30 a 40 e ainda mais preferivelmente 32 a 37. (9) Vetor de expressão da presente invenção
[0069] A presente invenção também fornece um vetor de expres- são contendo um ácido nucleico que codifica a endonuclease guiada por RNA compreendendo Cas3d, Cas5d, Cas6d, Cas7d e Cas10d e um DNA que codifica o gRNA que compreende uma sequência com- plementar a uma sequência alvo e sequências repetitivas comuns de- rivadas de um locus de CRISPR, precedendo e seguindo a sequência alvo, e um vetor de expressão contendo ácidos nucleicos que codifi- cam as proteínas associadas tipo I-D de CRISPR Cas5d, Cas6d e
Cas7d, e um DNA que codifica o gRNA compreendendo uma sequên- cia complementar a uma sequência alvo e sequências repetitivas co- muns derivadas de um locus de CRISPR, precedendo e seguindo a sequência alvo.
[0070] O vetor da presente invenção é um vetor para introduzir as proteínas Cas e o gRNA na célula, conforme descrito em "(5) Método de direcionamento de sequência alvo da presente invenção", "(6) Mé- todo de alteração de sequência alvo da presente invenção" e "(7) Mé- todo de supressão de expressão gênica alvo da presente invenção". Após a introdução do vetor na célula, as proteínas Cas e o gRNA são expressos na célula. O vetor da presente invenção também pode ser um vetor no qual a sequência alvo contida no gRNA é substituída por qualquer sequência contendo um sítio de restrição. Tal vetor é usado após a incorporação de uma sequência nucleotídica alvo desejada no sítio de restrição. Qualquer sequência pode ser, por exemplo, uma se- quência espaçadora presente em um locus tipo |I-D de CRISPR ou uma parte da sequência espaçadora. (10) Proteína de fusão compreendendo o módulo de reconhecimento alvo da presente invenção
[0071] A presente invenção também fornece uma proteína de fu- são compreendendo o módulo de reconhecimento alvo e um polipeptí- deo funcional. Quando a proteína de fusão e o gRNA são introduzidos em uma célula, a proteína de fusão é guiada a uma sequência nucleo- tídica alvo ou um gene alvo na célula pela ação do módulo de reco- nhecimento alvo e do gRNA, e a sequência nucleotídica alvo ou o ge- ne alvo é alterado ou modificado pela ação do polipeptídeo funcional. Assim, a presente invenção também fornece um método para alterar ou modificar a sequência nucleotídica alvo ou um gene alvo, que com- preende a introdução da proteína de fusão e do gRNA em uma célula. Além disso, a presente invenção fornece um complexo compreenden-
do a proteína de fusão e o gRNA.
[0072] O polipeptídeo funcional é um polipeptídeo que exibe qual- quer função em uma sequência alvo e é um polipeptídeo diferente de Cas3d e Cas10d. Exemplos do polipeptídeo funcional incluem, porém, não estão limitados a, enzimas de restrição, fatores de transcrição, DNA metilases, histona acetonases, proteínas fluorescentes, módulos de clivagem de polinucleotídeo, por exemplo, módulos de clivagem de nucleotídeo de enzimas de restrição; módulos de regulação de ex- pressão gênica, por exemplo, módulos de ativação de transcrição e módulos de repressão de transcrição de fatores de transcrição; e mó- dulos de modificação epigenômica, por exemplo, módulos de metila- ção de DNA metilases e módulos de acetilação de histonas de histona acetilases. Um exemplo da proteína fluorescente é a GFP. Por exem- plo, uma sequência alvo pode ser alterada pela introdução da proteína de fusão compreendendo o módulo de reconhecimento alvo e o módu- lo de clivagem de polinucleotídeo com o gRNA em uma célula, da mesma maneira que o método de alteração de uma sequência alvo da presente invenção. Por exemplo, uma sequência alvo pode ser modifi- cada para regular a expressão de um gene alvo pela introdução da proteína de fusão compreendendo o módulo de reconhecimento alvo e o módulo de regulação de expressão de gene ou o módulo de modifi- cação epigenômica juntamente com o gRNA em uma célula. Por exemplo, a proximidade de uma sequência alvo pode ser fluorescen- temente marcada pela introdução da proteína de fusão compreenden- do o módulo de reconhecimento alvo e a proteína fluorescente junta- mente com o gRNA em uma célula.
[0073] A seguir, exemplos da presente invenção são mostrados. No entanto, a presente invenção não está limitada aos exemplos. Exemplos
[0074] Como uma modalidade, um grupo de genes (Cas3d, Cas5d,
Cas6d, Cas7d, Cas10d) derivados do locus tipo |-D de CRISPR (a seguir também referido como "TiD"), derivado de Microcystis aeruginosa, foi clonado e depois utilizado. Para o processamento e construção de se- quências de DNA nos Exemplos, síntese química de gene artificial, PCR, tratamento com enzimas de restrição, ligação ou um método de Gibson Assembly foi usada. Além disso, o método de Sanger ou um método de sequenciação de próxima geração foi usado para determi- nar as sequências de nucleotídeo. Exemplo 1. Edição de genoma em E. coli
[0075] Neste exemplo, foi demonstrado que a técnica da presente invenção funciona efetivamente em E. coli, que é um organismo mode- lo bacteriano típico. (1) Construção do plasmídeo de expressão do gene TiD
[0076] Um grupo de gene derivado do locus tipo |-D de CRISPR (a seguir também referido como "locus de TiD") de Microcystis aerugino- Sa (a seguir também referido como "M. aeruginosa") foi clonado. As sequências otimizadas por códon de E. coli (SEQ ID NOs: 7 a 11) que codificam cada proteína Cas foram sintetizadas quimicamente artifici- almente com base na informação da sequência de aminoácido de Cas5d, Cas6d, Cas7d, Cas3d e Cas10 derivada de locus de TiD de M. aeruginosa. Um fragmento de DNA compreendendo um promotor sin- tético J23108 (SEQ ID NO: 12) ou uma sequência de ligação ao ribos- somo sintética (SEQ ID NO: 13) a montante de cada gene de codifica- ção de proteína Cas e uma sequência terminadora (SEQ ID NO: 14 a 17) a jusante de cada gene de codificação da proteína Cas foi ligado no vetor de plasmídeo pACYC184 (fabricado pelo gene Nippon) para construir o pECTiD1. Além disso, uma sequência de repetição CRISPR (crRNA, SEQ ID NO: 18) presente nas proximidades do locus tipo |-D de CRISPR de M. aeruginosa foi extraída, e um cassete de expressão de crRNA (SEQ ID NO: 20) contendo a sequência de repetição
CRISPR sob o controle de um promotor T7 (SEQ ID NO: 19) foi sinte- tizado. O cassete de expressão de crRNA continha uma sequência de região promotora de ccdB de E. coli, que foi uma sequência alvo neste Exemplo. A sequência do cassete de expressão de crRNA foi incorpo- rada em pEcTiD1 para construir o pEcTiD2 (FIG. 2a). Além disso, pEcTiD3 contendo cassetes de expressão gênica Cas5d, Cas6d e Cas7d foi construído como um vetor de plasmídeo de expressão de TiD para edição de genoma sem quebra de fita dupla de DNA (FIG. 2b). Os promotores, terminadores, sequência de repetição CRISPR e sequência de cassete de expressão de crRNA utilizados neste Exem- plo são mostrados na Tabela 2. Tabela 2 Promotor sintético J23108 | 5-CTGACAGCTAGCTCAGTCCTAGGTATAATGCTAGOC-3' (SEQ ID NO:12) sequência de ligação ao | S-AATAATTTTGTTTAACTTTAAGAAGGAGATATACAT-3' ribossoma (RBS) (SEQ ID NO:13) sequência terminadora | 5- AGATCCTGTAAAACGACGGCCAGT-3' (SEQ ID NO: 14) STOP767 sequência terminadora | -CGCCAGGGTTTTCCCAGTC-3' (SEQ ID NO:15) STOP768(1) sequência terminadora | - CGCCAGGGTTTTCCCAGTC-3' (SEQ ID NO:16) TOP768(2) sequência terminadora T7 | 5- TAGCATAACCCCTTGGGGCCTCTAMACGGGTCTTGA GGGGTTTTTTG-3' (SEQ ID NO:17) sequência de repetição | 5- GTTCCAATTAATCTTAAGCCCTATTAGGGATTGAAAC- CRISPR 3' (SEQ ID NO:18) sequência de promotor T7 5-TAATACGACTCACTATAGG-3' (SEQ ID NO:19) sequência de cassete de | -GTTCCAATTAATCTTAAGCCCTATTAGGGATTGAAAC expressão de cr»RNA ggtaataatacgactcactatagggagaaaggateCTTCCAATTAATCT- TAAGCCCTATTAGGGATTGAAAC-3' (SEQ ID NO:20) (As letras maiúsculas indicam a sequência de repetição de TiDCRISPR crRNA. Letras minúsculas indicam uma sequên- cia de 35 nucleotídeos da região promotora de ccdBgege, que é a sequência alvo.) (2) Construção da biblioteca de motivo adjacente ao protoespaçador (PAM)
[0077] Neste exemplo, um cassete de gene ccdB sintético (SEQ ID NO: 21) (Tabela 3) na qual a sequência do promotor T7 está ligada a montante do gene ccdB de E. coli como o DNA alvo, foi utilizado. À sequência alvo de TiD foi uma sequência de 35 nucleotídeos compre- endendo a região de promotor T7 a montante do gene ccdB. O casse- te de gene ccdB sintético foi ligado a um sítio de múltiplas clonagens no vetor de plasmídeo pMW219 (fabricado pelo gene Nippon) para construir DpMW cedB1 (FIG. 3a).
[0078] O sistema de CRISPR reconhece uma sequência de motivo adjacente ao protoespaçador (PAM) localizada nas proximidades de uma sequência alvo e se liga à sequência alvo por meio de um gRNA. Visto que a sequência de PAM de TiD de M. aeruginosa usada neste Exemplo foi desconhecida, um plasmídeo de biblioteca de sequência de PAM foi construída. Sequências de quatro nucleotídeos randomiza- das foram introduzidas a montante do promotor T7 de pMW cecdB1 usando a síntese de DNA química artificial e PCR (FIG. 3b). Os plas- mídeos da biblioteca de pMW ccedB-PAM construídos foram introduzi- dos em uma linhagem celular de E. coli resistente ao ccdB, mantendo a resistência ao CcdB (fabricada pela Thermo Fisher Scientific) e, em seguida, os plasmídeos foram preparados. Tabela 3 SEQ ID NO:21 Cassete de expressão do gene ccdB sintético (A sequência sublinhada indica o pro- 5'-aggetttaatacgacteactatagggagaaaggatccataaaggaggtaaataatgaagcagoetattacagtgacagttgacage gacagctatcagttgcteaagecatatatgateteaatatetecggtetggtaageacaaceatgcagaatgaagecegtegtetgegtg ccgaacgctggaaageggaaaateageaagegategctgagetegeccegetitatigaaatgaacgectettttgctgacgagaaca gggactggtgaa ATGCAGTTTAAGGTTTACACCTATAAA AGAGAGAGCCGTTATCGTCTG
GTCTCCGTTATEGGGGAAGAAGTGGCTGATCTCAGCCACCGCGAAAATGACATCA AAAACGCCATTAACCTGATGTTCTGGGGAATATAA-3'
(3) Determinação da sequência de PAM no sistema TiD de M. aerugi- nosa
[0079] A sequência de PAM para TiD foi determinada usando PECTiD3-T7 que inseriu a sequência de 35 nucleotídeos complementa- res à região de promotora T7 no plasmídeo da biblioteca pDpMW cecdB- PAM. O pEcTiD3-T7 foi introduzido na cepa BL21AI de E. coli (fabrica- da pela Thermo Fisher Scientific) para obter uma cepa hospedeira de E. coli para a edição do genoma do gene ccdB. A cepa BL21AI [pEc- TiD3-T7] expressa as proteínas Cas5d, Cas6d e Cas7d necessárias para o reconhecimento da sequência alvo. O complexo Cas5d/Cas6d/ Cas7d-crRNA reconhece uma sequência alvo adjacente à sequência de PAM apropriada e se liga à sequência alvo para inibir a função do promotor T7, que é a sequência alvo, apesar de não clivar a sequência alvo.
[0080] A expressão de ccdB pelo pMW-cedB-PAM introduzido na cepa BL21AI é induzida em um meio suplementado com arabinose, e as células BL21AI não tendo resistência ao CcdB são mortas. Quando o plasmídeo da biblioteca PpMW cedB-PAM é introduzido nas células BL21AI nas quais o plasmídeo de expressão TiD foi introduzido ante- cipadamente, o Cas5d/Cas6d/Cas7-crRNA expresso a partir do plas- mídeo pEcTiD3 liga-se ao promotor T7 do plasmídeo da biblioteca PMW cedB-PAM tendo uma sequência PAM apropriada para ser re- conhecida por TiD, desse modo a produção da proteína CcdB é inibida e, assim, as células de E. coli podem crescer. Das colônias de E. coli crescidas, o plasmídeo da biblioteca PpMW cedB-PAM foi preparado e a sequência PAM foi analisada pelo sequenciamento para determinar a sequência PAM de TiD de M. aeruginosa.
[0081] Os plasmídeos da biblioteca pMW ccedB-PAM, que foram preparados em grandes quantidades, foram introduzidos na cepa BL21AI [pEcTiD3-T7] por um método de célula competente químico.
As células BL21AI mantendo o plasmídeo da biblioteca pMW cecdB- PAM e o pEcTiD3-T7 foram selecionadas em um meio de ágar LB con- tendo 25 mg/L de cloranfenicol, 25 mg/L de canamicina e glicose 1%. Das colônias de E. coli assim obtidas, cerca de 1 x 107 colônias foram coletadas, lavadas várias vezes com um meio líquido de LB não con- tendo antibióticos e glicose, e assim suspensas em um meio líquido de LB contendo arabinose 1% em 1 x 10º células/mL. A suspensão foi cultivada com agitação a 37ºC por 2 horas para induzir a expressão do cCcrRNA e do ccdB sob o controle do promotor T7 pela arabinose. Em seguida, 200 uL da suspensão foram riscados em um meio de ágar LB contendo 25 mg/L de cloranfenicol, 25 mg/L de canamicina e arabino- se 1%. Após cultura durante a noite a 37ºC, as colônias bacterianas foram coletadas. De cerca de 500 colônias assim coletadas, seus plasmídeos foram preparados, e a proximidade da sequência de PAM foi submetida à análise de sequenciamento. As sequências de PAM dos plasmídeos da biblioteca DpMW ccdB-PAM resgatadas na presen- ça do plasmídeo de expressão de TiD continha a sequência 5-NGTH- 3' (N= AC, GouT;H=A,CouT). As frequências de uso das se- quências de PAM foram de 28% para NGTA, 33% para NGTC e 38% para NGTT. Portanto, verificou-se que a sequência de PAM utilizada pelo TiD foi 5-GTH-3 '(H = A, CouT).
(4) Edição de genoma em E. coli
[0082] Os plasmídeos pMW cedB-PAMgta, pMW cedB-PAMgtec e PMW cedB-PAMgtt contendo os três tipos de sequências de PAM de- terminados usando os plasmídeos da biblioteca pEcTiD3-1T7 e PMW cedB-PAM foram construídos e introduzidos juntamente com PEcTiD-lI7 na cepa BL21AI. As células BL21AI mantendo pMW cecdB- PAMgta/pEcTiD2-T7, pMW cedB-PAMgtce/pEcTiD2-T7 and pMW cedB- PAMgtt/pEcTiD2-T7 foram selecionados em meio de ágar LB contendo mg/L de cloranfenicol, 25 mg/L de canamicina e glicose 1%, e em seguida constatado conter o plasmídeo introduzido em cada célula bacteriana por análise de sequenciamento. Subsequentemente, as cé- lulas BL21AIl mantendo o plasmídeo correto foram riscadas em um meio de ágar LB contendo 25 mg/L de cloranfenicol, 25 mg/L de ca- namicina e arabinose 1% e depois cultivadas durante a noite a 37ºC. Como um resultado, todas as células bacterianas não cresceram, o que provavelmente foi causado pela quebra de DNA de fita dupla no DNA do plasmídeo na presença de Cas3d e Cas10d. Exemplo 2. Edição de genoma em plantas superiores
[0083] Neste exemplo, como uma modalidade de edição de geno- ma em eucariotos superiores, foi demonstrado que a técnica da pre- sente invenção funciona efetivamente em Nicotianabenthamiana e So- lanumlycopersicum. (1) Construção do vetor binário para expressão do gene TiD em célu- las de planta superiores
[0084] De acordo com as frequências em Arabidopsis e tabaco, as sequências otimizadas com dicotiledôneo que codificam cada proteína Cas foram sintetizadas quimicamente artificialmente com base nas in- formações da sequência de aminoácido de Cas5d, Cas6d, Cas7d, Cas3d e Cas10 derivadas do locus de TiD de M. aeruginosa. Um fra- gmento de DNA, compreendendo uma sequência de sinal de localiza- ção nuclear (SEQ ID NO: 22, SEQ ID NO: 23) contendo dois sinais de localização nuclear dispostos em 5'-a montante tandem de cada um dos genes de codificação da proteína Cas, e uma sequência peptídica 2A de autoclivagem (SEQ ID NOs: 24-28) entre os genes de codifica- ção de proteína Cas. Uma sequência de promotor (promotor 2 x 358; SEQ ID NO: 29) compreendendo dois promotores de gene 358 do ví- rus em mosaico da couve-flor dispostos em tandem e a sequência OQ do realçador da translação foi ligado ao 5'-a montante dos cinco frag- mentos de gene TiD fundidos entre si por meio de sequências peptídi-
cas 2A, e a sequência terminadora gênica de 18,2 kDa da proteína de choque térmico de Arabidopsis (SEQ ID NO: 30) foi ligada a 3'-a jusan- te dos cinco fragmentos do gene TiD fundidos entre si através das se- quências peptídicas 2A, e assim um cassete de expressão do gene TiD foi preparado.
O cassete de expressão do gene TiD foi clonado no vetor de plasmídeo binário pcCAMBIAZ300 para construir o pEgPTiD1 (FIG. 4a). Para um cassete de expressão de crRNA para plantas, um DNA no qual uma sequência espaçadora contendo dois sítios de Bsal da enzima de restrição foi colocada entre duas sequências de crRNA, de modo que qualquer sequência de 35 nucleotídeos sintetizada qui- micamente artificialmente pudesse ser ligada aos sítios de Bsal (SEQ ID NO: 31). A sequência promotora gênica snRNA-26 de Arabidopsis U6 (SEQ ID NO: 32) foi ligada a 5'-a montante da sequência do casse- te de expressão de crRNA, e a sequência poli T foi ligada a 3'-a jusan- te da sequência do cassete de expressão de crRNA (Fig. 4b). O cas- sete de expressão de crRNA para plantas foi ligado entre a sequência RB e o promotor 2 x 358 de pEgPTidD1 para construir pEgPTiD2, que foi usado como um vetor de plasmídeo binário de expressão de gene TiD para edição do genoma de planta (FIG. 4c). As sequências otimi- zadas por códon dicotiledôneas que codificam cada proteína Cas à qual um sinal de localização nuclear está ligado em pEgPTidD1 e pE- gPTidD2 são mostradas nas SEQ ID NOs: 33 a 37. A sequência sinal de localização nuclear, sequência 2A peptídica de autoclivagem, pro- motor, terminador, e a sequência do cassete de expressão de cr»RNA usada neste exemplo são mostradas na Tabela 4. Tabela 4-1 sinal de localização nuclear nuclear (codificando SEQ ID NO: | GACCCAMAGAAGAAGCGGAAGGTAGACC 22) CTAAGAAGAAGCGCAAGGTTTCTGGA-3'
Lo EEIDNOA) — sequência de aminoácido 2A pep- | SSEGRGSLLTCGDVEENPGP É (SEQ ID sequência peptídica 2A (1) de | 5- autoclivagem (codificando SEQ | GGCTCTGAGGGCAGAGGCAGCCTGCTGA ID NO: 24) CCTGCEGCGACGTGGAGGAAAACCCTGG CCCT-3' (SEQ ID NO:25) sequência peptídica 2A (2) de | 5- autoclivagem (codificando SEQ | GGGTCTGAGGGACGCGGCTCCCTGCTCA ID NO: 24) CCTGTGGAGATGTGGAAGAGAACCCAGG CCCC-3' (SEQ ID NO:26) sequência peptídica 2A (3) de | 5- autoclivagem (codificando SEQ | GGTTCTGAAGGCAGAGGCTCTCTGCTGA ID NO: 24)) CATGTGGGGATGTGGAGGAAAATCCTGG CCCT-3' (SEQ ID NO:27) sequência peptídica 2A (4) de | 5- autoclivagem (codificando SEQ | GGATCCGAGGGCAGAGGAAGTCTGCTAA ID NO: 24) CATGCGGTGACGTTGAGGAGAATCCCGG GCCA-3' (SEQ ID NO:28) Sequência Q + promotora do ge- | 5'- ne 358 do vírus em mosaico da | GCCAACATGGTGGAGCACGACACTCTCG couve-flor 2 x TCTACTCCAAGAATATCAAAGATACAGTCT
AACAAACAACAAACAACATTACAATTACTA TTTACAATT-3' (SEQ ID NO:29) Tabela 4-2 Terminador do gene de 18,2 kDa | 5- da proteína de choque térmico de | ATATGAAGATGAAGATGAAATATTTGGTG Arabidopsis TGTCAAATAAAAAGCTTGTGTGCTTAAGTT
TTACGTTTATTTTAGTACTAATTGTAACGT GAGAC-3' (SEQ ID NO:30) cassete de expressão de crRNA | 5'- para plantas GTTCCAATTAATCTTAAGCCCTATTAGGG ATTGAAACggagaccctcaattgteggteteGTTCCA
ATTAATCTTAAGCCCTATTAGGGATTGAAA a os amenos TT sequência promotora gênica U6 | 5'- SNRNA-26 de Arabidopsis thalia- | AAGCTTCGTTGAACAACGGAAACTCGACT na TGCCTTCCGCACAATACATCATTTCTTCTT
AGTTTATATACAGCTAGAGTCGAAGTAGT GATT-3' (SEQ ID NO:32) (2) Edição de genoma em Nicotianabenthamiana
[0085] No Exemplo do tabaco, o gene de fitoeno dessaturase (PDS) foi selecionado como uma sequência alvo para a introdução de mutações (FIG. 5-1 a). A sequência alvo 1 (Alvo 1, SEQ ID NO: 38) foi selecionada a partir do terceiro éxon no gene de PDS do tabaco, e o DNA sintetizado químico artificial do alvo 1 foi ligado ao cassete de expressão de crRNA para plantas para construir pEgPTiD2-pds (1). Similarmente, a sequência alvo 2 (Alvo 2, SEQ ID NO: 39) foi selecio- nada a partir do sexto éxon, e o DNA sintetizado químico artificial do alvo 2 foi ligado no cassete de expressão de crRNA para plantas para construir pegPTiD2-pds (2). Os vetores binários assim construídos fo- ram introduzidos na cepa de Agrobacterium tumefaciens GV2260. À introdução do vetor de expressão de TiD direcionado à PDS do tabaco nas células do tabaco foi realizada por agroinfiltração. As células de
Agrobacterium mantendo pEgPTiD2-pds (1) ou pEgPTidD2-pds (2) e as células de Agrobacterium mantendo um vetor binário de expressão de GFP foram cultivadas separadamente, e depois coinfectadas à ver- dadeira folhagem de Nicotianabenthamiana (FIG. 5-1 b). Três dias após a coinfecção, um DNA genômico foi preparado a partir de uma região que emite fluorescência de GFP em um disco foliar e, em se- guida, usado como um padrão para amplificar por POR um fragmento de gene de PDS de 300-500 pb contendo a sequência alvo. O frag- mento amplificado por PCR foi utilizado para o ensaio Cel-1 para ana- lisar se uma mutação foi introduzida no gene de PDS. Como um con- trole, um disco de folha de tabaco no qual apenas o vetor binário de expressão de GFP foi introduzido, foi utilizado. Quando apenas o vetor de expressão de GFP foi introduzido, nenhuma mutação foi observada no gene de PDS. Por outro lado, quando pEgPTiD2-pds e o vetor de expressão de GFP foram introduzidos simultaneamente, a introdução de uma(s) mutação(ões) foi observada em cada sequência alvo do ge- ne de PDS (FIG. 5-2 c). As sequências alvo 1 e 2 são mostradas na Tabela 5. Tabela 5 de PDS do tabaco (Alvo 1) | (SEQ ID NO:38) Sequência alvo 2 no gene | 5-AMATTTGCTATTGGACTCTTGCCAGCAATGCTTGG-3' (3) Edição de genoma em Solanumlycopersicum
[0086] No Exemplo do tomate, um gene IAAS9 do fator de transcri- ção Aux/IAA foi selecionado como uma sequência alvo para a introdu- ção de mutações (FIG. 6a). A sequência alvo 1 (SEQ ID NO: 40) (Ta- bela 6) foi selecionada a partir do segundo éxon do gene IAAS9 do to- mate, e o DNA sintetizado químico artificial do alvo 1 foi ligado ao cas- sete de expressão de crRNA para plantas para construir pEgPTiD2- iaa9. O vetor binário construído foi introduzido na cepa de Agrobacte-
rium tumefaciens GV2260. A introdução do vetor de expressão de TiD direcionado ao gene IAAS9 do tomate nas células do tomate foi realiza- da por um método de Agrobacterium utilizando um disco foliar deriva- do dos cotilédones do tomate. Os discos foliares coinoculados com Agrobacterium foram cultivados em meio solidificado MS contendo 100 mg/L de canamicina e 1,5 mg/L de t-zeatina para obter calos nos quais a introdução gênica de uma região T-DNA em pEgPTiD2-iaa9 ocorreu (FIG. 6b). A sequência de reconhecimento para a enzima de restrição Accl existe na sequência alvo de IAA9. Quando uma mutação é intro- duzida como um resultado da edição do genoma por TiD, o sítio de reconhecimento Accl desaparece. Assim, a análise do polimorfismo de comprimento de enzima de restrição por PCR (RFLP) usando Accl foi realizada para analisar mutações que ocorreram na sequência alvo de IAA9. Um DNA genômico foi preparado a partir dos calos transforma- dos obtidos e usado como um padrão para amplificar por PCR uma região de aproximadamente 300 bases contendo a sequência alvo de IAA9. O fragmento de PCR foi digerido com Accl. Verificou-se que o fragmento de PCR das culturas de calo em que o pEgPTiD2-iaa9 foi introduzido continha uma sequência que não foi digerida por Accl co- mo um resultado da introdução de mutação na sequência alvo IAA9 (FIG. 6c). A sequência nucleotídica do fragmento de PCR do calo no qual pEgPTiD2-iaa9 foi introduzido, foi determinada. Como um resul- tado, verificou-se que a deleção nucleotídica de 1 a 4 nucleotídeos foi introduzida imediatamente após a sequência PAM na sequência alvo de IAAS9. (FIG. 7).
[0087] Os calos em que o pEgPTiD2-iaa9 foi introduzido, foi tam- bém cultivado em um meio solidificado com MS contendo 100 mg/L de canamicina e 1,0 mg/L de t-zeatina para obter brotos transformados e regenerados. Um DNA genômico foi preparado a partir dos brotos re- generados, e usados como um padrão para realizar a análise de POCR-
RFLP com Accl. Como mostrado na FIG. 8a, fragmentos de PCR que não foram clivados com Accl foram observados. Por outras palavras, os brotos transformados e regenerados nos quais a sequência alvo IAAS foi quase 100% mutada foram obtidos. De 14 brotos transforma- dos e regenerados, os 13 brotos mostraram os mesmos resultados como mostrado na FIG. 8A. Nestas plantas regeneradas, as folhagens verdadeiras eram em forma de folha única, que é um dos fenótipos causados pela deficiência de IAA9. Assim, foi demonstrado que uma(s) mutação(ões) pode(m) ser introduzida(s) com alta eficiência pela edição do genoma usando TiD. Tabela 6 IAA9 do tomate (SEQ ID NO:40) Exemplo 3. Edição de genoma em animais superiores
[0088] Neste exemplo, como uma modalidade de edição de geno- ma em animais superiores, foi demonstrado que a técnica da presente invenção funciona efetivamente na linhagem celular derivada de célu- las renais embrionárias humanas HEK293. (1) Construção do vetor para expressão do gene TiD em células de animais superiores
[0089] As sequências gênicas que codificam cada proteína Cas foram sintetizadas quimicamente artificialmente com base na informa- ção da sequência de aminoácido de Cas5d, Cas6d, Cas7d, Cas3d e Cas10 derivadas do locus de TiD de M. aeruginosa. Um fragmento de DNA compreendendo uma sequência sinal de localização nuclear (SEQ ID NO: 22, SEQ ID NO: 23) contendo dois sinais de localização nuclear dispostos em 5'-a montante tandem de cada um dos genes de codificação de proteína Cas, e uma sequência peptídica 2A de autocli- vagem (SEQ ID NOs: 24-28) entre os genes de codificação de proteí- na Cas foi preparada. Uma sequência híbrida promotora de realçador de citomegalovírus + gene de B-actina de galinha (promotor CBh; SEQ
ID NO: 41) foi ligada em 5'-a montante dos cinco fragmentos do gene TiD fundidos entre si através das sequências peptídicas 2A, e uma se- quência terminadora gênica do hormônio de crescimento bovino (ter- minador bGH; SEQ ID NO: 42) foi ligada em 3'-a jusante dos cinco fra- gmentos do gene TiD fundidos entre si através das sequências peptí- dicas 2A e, assim, um cassete de expressão do gene TiD foi prepara- do. O cassete de expressão gênica TiD foi ligado a um vetor pCR8TOPO (fabricado pela Thermo Fisher Scientific) para construir pCR hTiD. Para um cassete de expressão de crRNA, um DNA no qual uma sequência espaçadora contendo dois sítios Bsal da enzima de restrição foi colocada entre duas sequências de crRNA para que qual- quer sequência de 35 nucleotídeos pudesse ser ligada, foi artificial- mente quimicamente sintetizado (SEQ ID NO: 31). A sequência pro- motora gênica U6 snRNA humano (SEQ ID NO: 43) como uma se- quência de controle de expressão foi ligada a 5'-a montante do cassete de expressão de crRNA, e a sequência de poli T foi ligada a 3'-a jusan- te do cassete de expressão de crRNA. O cassete de expressão de CcrRNA com o promotor do gene U6 snRNA humano e a sequência poli T foi ligado em um vetor pCR8TOPO (fabricado por Thermo Fisher Scientific) para construir pCR crRNA. As sequências que codificam cada proteína Cas com os sinais de localização nuclear em pCR hTiD são mostradas como SEQ ID NOs: 33-37. As sequências promotoras de CBh, terminadoras de bGH e promotoras do gene U6 snRNA hu- manas são mostradas na Tabela 7. Tabela 7 realçador de cito- | CGTTACATAACTTACGGTAMATGGCCCGCCTGGCTGACCGCCCA megalovírus + gene | ACGACCCCCGCCCATTGACGTCAATAGTAACGCCAATAGGGACT de B-actina de gali- | TICCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCA nha universal CTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTA
ATTAGTCATCGCTATTACCATGGTCGAGGTGAGCCCCACGTTCT GCTTCACTCTCCCCATOTOECCCCCEeTeCCCACCCCCAATTTTG
CGEGGAGTCGCTGCGACGCTGCCTTCGCCCCEGTGCCCEGCTCE GCCGCCECCTEGEGCEGCCeGCceeGGCTETGACTGACCGCG
GTTGGTGGGGTATTAATGTTTAATTACCTGGAGCACCTGCCTGA AATCACTTTTTTTCAGGTTGGACCGGTGCCACC-3' —“(SEQ |D NO:41) sequência termina- | 5- dora gênica do | GCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTT hormônio de cres- | GTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCA cimento bovino CTCCCACTGTCCTTTCCTAATAMAATGAGGAAATTGCATCGCATT
GGACAGCAAGGGGGAGGATTGGGAAGAGAATAGCAGGCATGCT GGGGA-3' (SEQ ID NO:42) promotor do gene | 5- U6 snRNA humano | GAGGGCCTATTTCCCATGATTCCTTCATATTTGCATATACGATAC
TGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATAT CTTGTGGAAAGGACGAAACACC-3' (SEQ ID NO:43) (2) Edição de genoma em células animais cultivadas
[0090] No Exemplo de células animais cultivadas, uma linhagem celular derivada de células renais embrionárias humanas (linhagem celular HEK293) foi utilizada, e o gene EMX1 foi selecionado como uma sequência alvo para a introdução de mutações. O alvo 1 (SEQ ID NO: 44) e o alvo 2 (SEQ ID NO: 45) foram selecionados como sequên- cias alvo no gene EMX1, e o DNA sintetizado químico artificial do alvo 1 e 2 foi ligado no cassete de expressão de crRNA para células humanas cultivadas preparadas em (1) acima para construir puC crRNA-T1 contendo o alvo 1 e puC crRNA-T2 contendo o alvo 2. Os plasmídeos construídos foram amplificados na cepa de E. coli HSTO8 (fabricada por Takara Bio Inc.) e depois purificados usando PureYield (marca regis- trada) Plasmid Miniprep System (fabricado por Promega Corp.). Entre os plasmídeos purificados, uma mistura de pCR hTiD e pUC crRNA-T1 ou uma mistura de pCR hTiD e puUC crRNA-T?2 foi introduzida nas célu- las HEK293 por transfecção. Três dias após a introdução dos vetores de plasmídeos, as células foram coletadas, e um DNA genômico foi preparado a partir deles usando o Mini-Kit de DNA Blood & Cell Cultu- re (fabricado por Qiagen). Utilizando o DNA genômico preparado como um padrão, a região da sequência genômica compreendendo o alvo 1 ou o alvo 2 foi amplificada por PCR e a análise de mutação foi realiza- da pela análise de mobilidade de heteroduplex usando um aparelho de eletroforese automático MuUltiNA (fabricado por Shimadzu Corporation). Além disso, o fragmento de PCR amplificado foi clonado no vetor PNEB193 (fabricado por New England Biolab), e uma sequência muta- da foi identificada por análise de sequenciação. A eficiência da muta- ção somática foi calculada com base no "número de clones nos quais uma sequência mutada foi observada/no número total de clones anali- sados". A linhagem celular na qual o plasmídeo não foi introduzido, ou PCR hTiD, pUC crRNA-T1 ou pUC crRNA-T2 foi introduzido isola- damente, foi usada como controle para realizar a análise de mutações da mesma maneira. Um esquema experimental para edição do geno- ma usando a linhagem celular HEK293 é mostrado na FIG. 9
[0091] FIG. 10 e FIG. 11 mostram resultados experimentais obti- dos quando a linhagem celular HEK293 foi transfectada com a mistura de pCR hTiD e pUC crRNA-T1 ou a mistura de pCR hTiD e PUC crRNA-T2 ou quando a linhagem celular HEK293 não foi trans- fectada com o plasmídeo (controle). Como mostrado na FIG. 10 e FIG. 11, picos indicando mutações introduzidas na sequência alvo foram detectados na linhagem celular HEK293 transfectada com a mistura de pCR hTiD e pUC crRNA-T1 ou a mistura de pCR hTiD e pUC crRNA- T2. Por outro lado, nenhum pico indicando a introdução da mutação foi detectado na linhagem celular na qual o plasmídeo não foi introduzido como um controle. Similarmente à linhagem celular na qual o plasmí- deo não foi introduzido, nenhum pico indicando a introdução da muta- ção foi detectado na linhagem celular na qual pCR hTiD, puUC crRNA- T1 ou pUC crRNA-T2 foram introduzidos isoladamente.
[0092] Em seguida, as amostras de sequência nas quais um pico indicando a introdução de mutação foi detectado por análise de mobili- dade de heteroduplex foram clonadas em um vetor de plasmídeo e analisadas por sequenciação. Como um resultado, como mostrado na FIG. 12 e FIG 13, verificou-se que mutações de deleção e/ou inserção foram introduzidas no alvo 1 e no alvo 2. Tabela 8 ID NO:44) NO:45) Aplicabilidade Industrial
[0093] De acordo com a presente invenção, é possível direcionar uma sequência gênica que não pode ser direcionada pela técnica de edição de genoma convencional usando endonuclease guiada por RNA derivada de tipo Il ou tipo V de CRISPR. Especificamente, de acordo com a presente invenção, é possível gerar alelos mutantes, controlar a expressão gênica por ativação e inativação transcricional e realizar alteração epigenômica por direcionamento de um domínio de proteína de modificação de DNA/modificação de histona em regiões gênicas que não podem ser direcionadas pelas técnicas convencio- nais.
Texto Livre da Listagem de Sequência
[0094] SEQ ID NO: 1; Sequência de aminoácido de Cas5d de Mi- crocystis aeruginosa
[0095] SEQ ID NO: 2; Sequência de aminoácido de Cas6d de Mi- crocystis aeruginosa
[0096] SEQ ID NO: 3; Sequência de aminoácido de Cas7d de Mi- crocystis aeruginosa
[0097] SEQ ID NO: 4; Sequência de aminoácido de Cas3d de Mi- crocystis aeruginosa
[0098] SEQID NO: 5; Sequência de aminoácido de Cas10d de Mi- crocystis aeruginosa
[0099] SEQ ID NO: 6; TiDcrRNA contendo repetição direta (37b) e espaçador (35b de N). N é qualquer nucleotídeo que constitui uma se- quência complementar a uma sequência nucleotídica alvo.
[00100] SEQ ID NO: 7; Sequência nucleotídica de Cas5d para ex- pressão em Escherichia coli
[00101] SEQID NO: 8; Sequência nucleotídica de Cas6d para ex- pressão em Escherichia coli
[00102] SEQID NO: 59; Sequência nucleotídica de Cas7d para ex- pressão em Escherichia coli
[00103] SEQID NO: 10; Sequência nucleotídica de Cas3d para ex- pressão em Escherichia coli
[00104] SEQ ID NO: 11; Sequência nucleotídica de Cas10d para expressão em Escherichia coli
[00105] SEQID NO: 12; Promotor de síntese J23108
[00106] SEQID NO: 13; Sequência de ligação ribossômica
[00107] —SEQID NO: 14; Sequência terminadora STOP767
[00108] SEQID NO: 15; Sequência terminadora STOP768 (1)
[00109] —“SEQID NO: 16; Sequência terminadora TOP768 (2)
[00110] SEQID NO: 17; Sequência terminadora T7
[00111] SEQID NO: 18; Sequência de repetição CRISPR
[00112] SEQID NO: 19; Sequência promotora T7
[00113] SEQID NO: 20; cassete de expressão de cr»RNA
[00114] SEQID NO: 21; Cassete de expressão gênica cccdB de síntese
[00115] SEQ ID NO: 22; Sequência de aminoácido sinal de locali- zação nuclear (NLS)
[00116] SEQID NO: 23; Sequência nucleotídica NLS
[00117] SEQID NO: 24; Sequência de aminoácido 2A peptídica de autoclivagem
[00118] SEQID NO: 25; Sequência de codificação 2A (1) peptídica de autoclivagem
[00119] SEQID NO: 26; Sequência de codificação 2A (2) peptídica de autoclivagem
[00120] SEQ ID NO: 27; Sequência de codificação 2A (3) peptídica de autoclivagem
[00121] SEQID NO: 28; Sequência de codificação 2A (4) peptídica de autoclivagem
[00122] SEQID NO: 29; Sequência ômega + promotora do gene 358 do vírus em mosaico da couve-flor 2 x
[00123] SEQID NO: 30; Sequência terminadora gênica de 18,2 kDa da proteína de choque térmico de Arabidopsis
[00124] SEQID NO: 31; cassete de expressão de cr»RNA
[00125] SEQID NO: 32; Sequência promotora gênica U6 snRNA-26 de Arabidopsis
[00126] SEQID NO: 33; 2xNLS + Cas5d
[00127] SEQID NO: 34; 2xNLS + Cas6d
[00128] SEQID NO: 35; 2xNLS + Cas7d
[00129] SEQID NO: 36; 2xNLS + Cas3d
[00130] SEQID NO: 37; 2xNLS + Cas10d
[00131] SEQID NO: 38; Sequência alvo 1 no gene de PDS do ta- baco
[00132] SEQID NO: 39; Sequência alvo 2 no gene de PDS do ta- baco
[00133] “SEQID NO:40; Sequência alvo no gene IAAS9 do tomate
[00134] SEQ ID NO: 41; Promotor híbrido de realçador de citome- galovírus + gene de B-actina de galinha universal
[00135] SEQID NO: 42; Sequência terminadora gênica do hormô- nio crescimento derivada de bovino
[00136] SEQID NO: 43; promotor do gene U6 snRNA humano
[00137] SEQID NO: 44; Sequência de alvo 1 no gene EMX1 huma- no
[00138] SEQID NO: 45; Sequência de alvo 2 no gene EMX1 huma- no
Claims (13)
1. Método para direcionar uma sequência nucleotídica alvo, caracterizado pelo fato de que o método compreende a introdução em uma célula: (i) proteínas associadas ao Tipo |-D de CRISPR, Cas5d, Cas6d e Cas7d, ou ácidos nucleicos que codificam as proteínas, e (ii) um RNA guia compreendendo uma sequência com- plementar à sequência nucleotídica alvo, e sequências repetitivas co- muns derivadas de um locus de CRISPR, precedendo e seguindo a sequência complementar, ou um DNA que codifica o RNA guia.
2. Método para alterar uma sequência nucleotídica alvo, caracterizado pelo fato de que o método compreende a introdução em uma célula: (i) proteínas associadas ao tipo |-D de CRISPR Cas3d, Cas5d, Cas6d, Cas7d e Cas10d, ou ácidos nucleicos codificando as proteínas, e (ii) um RNA guia compreendendo uma sequência com- plementar à sequência nucleotídica alvo e sequências repetitivas co- muns derivadas de um locus de CRISPR, precedendo e seguindo a sequência complementar, ou um DNA que codifica o RNA guia.
3. Método para suprimir a expressão de um gene alvo, ca- racterizado pelo fato de que o método compreende a introdução em uma célula: (i) proteínas associadas ao tipo |-D de CRISPR Cas5d, Cas6d e Cas7d, ou ácidos nucleicos que codificam as proteínas, e (ii) um RNA guia compreendendo uma sequência com- plementar a pelo menos uma parte da sequência gênica alvo e se- quências repetitivas comuns derivadas de um locus de CRISPR, pre- cedendo e seguindo a sequência complementar, ou um DNA que codi- fica o RNA guia.
4. Método, de acordo com qualquer uma das reivindicações 1 a 3, caracterizado pelo fato de que o RNA guia compreende uma se- quência que consiste em 20 a 50 nucleotídeos que é complementar à sequência nucleotídica alvo.
5. Método, de acordo com a reivindicação 2 ou 4, caracteri- zado pelo fato de que ainda compreende a introdução de um polinu- cleotídeo doador na célula.
6. Método, de acordo com qualquer uma das reivindicações 2,4 e 5, caracterizado pelo fato de que a alteração é a deleção, inser- ção ou substituição de nucleotídeos.
7. Método, de acordo com qualquer uma das reivindicações 1 a 6, caracterizado pelo fato de que a Cas5d reconhece 5'-GTH-3' (H = A, C ou T) como uma sequência de motivo adjacente ao protoespa- çador (PAM).
8. Complexo, caracterizado pelo fato de que compreende: (i) proteínas associadas ao tipo |-D de CRISPR Cas5d, Cas6d e Cas7d, e (ii) um RNA guia compreendendo uma sequência com- plementar a uma sequência nucleotídica alvo, sequências repetitivas comuns derivadas de um locus de CRISPR, precedendo e seguindo a sequência complementar.
9. Complexo, de acordo com a reivindicação 8, caracteriza- do pelo fato de que também compreende Cas3d e Cas10d.
10. Complexo, de acordo com a reivindicação 8 ou 9, carac- terizado pelo fato de que o RNA guia compreende uma sequência que consiste em 20 a 50 nucleotídeos que é complementar à sequência nucleotídica alvo.
11. Vetor de expressão, caracterizado pelo fato de que compreende: (i) ácidos nucleicos que codificam as proteínas associa-
das ao tipo |-D de CRISPR Cas5d, Cas6d e Cas7d, e (ii) um DNA que codifica um RNA guia compreendendo uma sequência complementar a uma sequência nucleotídica alvo, e sequências repetitivas comuns derivadas de um locus de CRISPR, precedendo e seguindo a sequência complementar.
12. Vetor de expressão, de acordo com a reivindicação 11, caracterizado pelo fato de que ainda compreende ácidos nucleicos que codificam Cas3d e Cas10d.
13. Molécula de DNA, caracterizada pelo fato de que codifi- ca o complexo como definido em qualquer uma das reivindicações 8 a
10.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017158876 | 2017-08-21 | ||
JP2017-158876 | 2017-08-21 | ||
JP2017-236518 | 2017-12-08 | ||
JP2017236518 | 2017-12-08 | ||
PCT/JP2018/030607 WO2019039417A1 (ja) | 2017-08-21 | 2018-08-20 | ヌクレオチド標的認識を利用した標的配列特異的改変技術 |
Publications (1)
Publication Number | Publication Date |
---|---|
BR112020003439A2 true BR112020003439A2 (pt) | 2020-08-25 |
Family
ID=65438898
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BR112020003439-8A BR112020003439A2 (pt) | 2017-08-21 | 2018-08-20 | tecnologia de alteração específica de sequência alvo usando o reconhecimento alvo nucleotídico |
Country Status (13)
Country | Link |
---|---|
US (1) | US12012596B2 (pt) |
EP (1) | EP3674404A4 (pt) |
JP (2) | JP7017259B2 (pt) |
KR (1) | KR102626503B1 (pt) |
CN (1) | CN111247247A (pt) |
AU (1) | AU2018321021B2 (pt) |
BR (1) | BR112020003439A2 (pt) |
CA (1) | CA3073372A1 (pt) |
IL (1) | IL272688A (pt) |
MX (1) | MX2020001998A (pt) |
NZ (1) | NZ762361A (pt) |
SG (1) | SG11202001471SA (pt) |
WO (1) | WO2019039417A1 (pt) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FI3636753T3 (fi) * | 2017-06-08 | 2024-05-03 | Univ Osaka | Menetelmä DNA-muokatun eukaryoottisen solun valmistamiseksi |
WO2020122104A1 (ja) * | 2018-12-11 | 2020-06-18 | 国立大学法人京都大学 | ゲノムdnaに欠失を誘導する方法 |
JP7489112B2 (ja) | 2019-03-14 | 2024-05-23 | 国立大学法人徳島大学 | Crisprタイプi-dシステムを利用した標的配列改変技術 |
KR20210148286A (ko) | 2019-04-05 | 2021-12-07 | 고꾸리쯔 다이가꾸 호우징 오사까 다이가꾸 | 녹인 세포의 제작 방법 |
KR102550308B1 (ko) * | 2020-09-29 | 2023-06-30 | 경상국립대학교산학협력단 | SlHKT1;2 유전자 교정에 의해 내염성이 증가된 유전체 교정 토마토 식물체의 제조 방법 및 상기 방법에 의해 제조된 내염성이 증가된 유전체 교정 토마토 식물체 |
US20230374479A1 (en) | 2020-10-08 | 2023-11-23 | Tokushima University | Technique for modifying target nucleotide sequence using crispr-type i-d system |
CN112921038B (zh) * | 2021-02-23 | 2022-08-02 | 安徽农业大学 | 同源重组机制介导的精准序列替换基因编辑方法及其元件结构 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100102580A1 (en) | 2008-10-23 | 2010-04-29 | Brooks Ryan J | Energy absorber with differentiating angled walls |
GB201122458D0 (en) | 2011-12-30 | 2012-02-08 | Univ Wageningen | Modified cascade ribonucleoproteins and uses thereof |
JP2017512481A (ja) | 2014-04-08 | 2017-05-25 | ノースカロライナ ステート ユニバーシティーNorth Carolina State University | Crispr関連遺伝子を用いた、rna依存性の転写抑制のための方法および組成物 |
PL3152312T3 (pl) * | 2014-06-06 | 2020-08-10 | Regeneron Pharmaceuticals, Inc. | Sposoby i kompozycje do modyfikowania docelowego locus |
PT3155099T (pt) * | 2014-06-23 | 2018-04-20 | Regeneron Pharma | Montagem de dna mediada por nuclease |
EP3348636B1 (en) | 2015-09-09 | 2021-12-01 | National University Corporation Kobe University | Method for modifying genome sequence that specifically converts nucleobase of targeted dna sequence, and molecular complex used in said method |
US11970710B2 (en) * | 2015-10-13 | 2024-04-30 | Duke University | Genome engineering with Type I CRISPR systems in eukaryotic cells |
FI3636753T3 (fi) | 2017-06-08 | 2024-05-03 | Univ Osaka | Menetelmä DNA-muokatun eukaryoottisen solun valmistamiseksi |
-
2018
- 2018-08-20 KR KR1020207007763A patent/KR102626503B1/ko active IP Right Grant
- 2018-08-20 AU AU2018321021A patent/AU2018321021B2/en active Active
- 2018-08-20 CA CA3073372A patent/CA3073372A1/en active Pending
- 2018-08-20 BR BR112020003439-8A patent/BR112020003439A2/pt unknown
- 2018-08-20 US US16/640,521 patent/US12012596B2/en active Active
- 2018-08-20 JP JP2019537609A patent/JP7017259B2/ja active Active
- 2018-08-20 WO PCT/JP2018/030607 patent/WO2019039417A1/ja unknown
- 2018-08-20 SG SG11202001471SA patent/SG11202001471SA/en unknown
- 2018-08-20 NZ NZ762361A patent/NZ762361A/en unknown
- 2018-08-20 MX MX2020001998A patent/MX2020001998A/es unknown
- 2018-08-20 CN CN201880068289.7A patent/CN111247247A/zh active Pending
- 2018-08-20 EP EP18847639.4A patent/EP3674404A4/en active Pending
-
2020
- 2020-02-16 IL IL272688A patent/IL272688A/en unknown
-
2021
- 2021-10-20 JP JP2021171578A patent/JP7054283B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
MX2020001998A (es) | 2020-10-05 |
CA3073372A1 (en) | 2019-02-28 |
NZ762361A (en) | 2024-03-22 |
WO2019039417A1 (ja) | 2019-02-28 |
JP7054283B2 (ja) | 2022-04-13 |
JP2022009293A (ja) | 2022-01-14 |
AU2018321021A1 (en) | 2020-03-26 |
KR20200039775A (ko) | 2020-04-16 |
US20210363520A1 (en) | 2021-11-25 |
JP7017259B2 (ja) | 2022-02-08 |
KR102626503B1 (ko) | 2024-01-17 |
AU2018321021B2 (en) | 2022-10-06 |
EP3674404A1 (en) | 2020-07-01 |
JPWO2019039417A1 (ja) | 2020-11-26 |
IL272688A (en) | 2020-04-30 |
SG11202001471SA (en) | 2020-03-30 |
CN111247247A (zh) | 2020-06-05 |
US12012596B2 (en) | 2024-06-18 |
EP3674404A4 (en) | 2021-05-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
BR112020003439A2 (pt) | tecnologia de alteração específica de sequência alvo usando o reconhecimento alvo nucleotídico | |
CN106922154B (zh) | 使用空肠弯曲杆菌crispr/cas系统衍生的rna引导的工程化核酸酶的基因编辑 | |
CN105646719B (zh) | 一种高效定点转基因的工具及其应用 | |
US11702643B2 (en) | System and method for genome editing | |
US11713471B2 (en) | Class II, type V CRISPR systems | |
CA3185855A1 (en) | Bacterial strains for dna production | |
KR20200078685A (ko) | 부위-특이적인 뉴클레오티드 치환을 통해 글리포세이트-내성 벼를 수득하는 방법 | |
WO2013142578A1 (en) | RNA-DIRECTED DNA CLEAVAGE BY THE Cas9-crRNA COMPLEX | |
EP3749764A1 (en) | Genome editing using crispr in corynebacterium | |
WO2022056324A1 (en) | Base editing enzymes | |
CA3234233A1 (en) | Endonuclease systems | |
WO2023076952A1 (en) | Enzymes with hepn domains | |
WO2022159742A1 (en) | Novel engineered and chimeric nucleases | |
WO2022056301A1 (en) | Base editing enzymes | |
KR20240099283A (ko) | 염기 편집 효소 | |
WO2023097262A1 (en) | Endonuclease systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
B350 | Update of information on the portal [chapter 15.35 patent gazette] | ||
B06W | Patent application suspended after preliminary examination (for patents with searches from other patent authorities) chapter 6.23 patent gazette] |