BR112020010036A2 - complexo, ácido nucleico, e, método para alteração de um sítio alvo de um dna de fita dupla de uma bactéria, ou regulação de uma expressão de um gene codificado por um dna de fita dupla próximo ao sítio. - Google Patents
complexo, ácido nucleico, e, método para alteração de um sítio alvo de um dna de fita dupla de uma bactéria, ou regulação de uma expressão de um gene codificado por um dna de fita dupla próximo ao sítio. Download PDFInfo
- Publication number
- BR112020010036A2 BR112020010036A2 BR112020010036-6A BR112020010036A BR112020010036A2 BR 112020010036 A2 BR112020010036 A2 BR 112020010036A2 BR 112020010036 A BR112020010036 A BR 112020010036A BR 112020010036 A2 BR112020010036 A2 BR 112020010036A2
- Authority
- BR
- Brazil
- Prior art keywords
- nucleic acid
- complex
- dna
- target
- sequence
- Prior art date
Links
- 108020004414 DNA Proteins 0.000 title claims abstract description 141
- 150000007523 nucleic acids Chemical class 0.000 title claims abstract description 119
- 102000053602 DNA Human genes 0.000 title claims abstract description 54
- 238000000034 method Methods 0.000 title claims description 93
- 108090000623 proteins and genes Proteins 0.000 title claims description 93
- 102000039446 nucleic acids Human genes 0.000 title claims description 74
- 108020004707 nucleic acids Proteins 0.000 title claims description 74
- 241000894006 Bacteria Species 0.000 title claims description 61
- 230000014509 gene expression Effects 0.000 title claims description 39
- 230000001105 regulatory effect Effects 0.000 title claims description 26
- 239000002773 nucleotide Substances 0.000 claims abstract description 86
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 86
- 108091028043 Nucleic acid sequence Proteins 0.000 claims abstract description 53
- 230000017854 proteolysis Effects 0.000 claims abstract description 44
- 125000000539 amino acid group Chemical group 0.000 claims abstract description 28
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 20
- 230000002209 hydrophobic effect Effects 0.000 claims abstract description 8
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 claims abstract description 7
- 102000004190 Enzymes Human genes 0.000 claims description 89
- 108090000790 Enzymes Proteins 0.000 claims description 89
- 230000033590 base-excision repair Effects 0.000 claims description 38
- 239000003112 inhibitor Substances 0.000 claims description 30
- 108020001738 DNA Glycosylase Proteins 0.000 claims description 20
- 102000028381 DNA glycosylase Human genes 0.000 claims description 20
- 230000027455 binding Effects 0.000 claims description 17
- 230000007018 DNA scission Effects 0.000 claims description 11
- 239000004474 valine Substances 0.000 claims description 11
- 230000008439 repair process Effects 0.000 claims description 9
- 150000001413 amino acids Chemical class 0.000 abstract description 22
- 229940088598 enzyme Drugs 0.000 description 81
- 230000035772 mutation Effects 0.000 description 74
- 210000004027 cell Anatomy 0.000 description 52
- 239000013598 vector Substances 0.000 description 44
- 102000004169 proteins and genes Human genes 0.000 description 42
- 235000018102 proteins Nutrition 0.000 description 41
- 101150045500 galK gene Proteins 0.000 description 40
- 238000010362 genome editing Methods 0.000 description 39
- 230000000694 effects Effects 0.000 description 36
- 239000013612 plasmid Substances 0.000 description 34
- 241000588724 Escherichia coli Species 0.000 description 32
- 231100000350 mutagenesis Toxicity 0.000 description 26
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 24
- 238000002703 mutagenesis Methods 0.000 description 23
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 22
- 108020005004 Guide RNA Proteins 0.000 description 19
- 239000002609 medium Substances 0.000 description 19
- 108091033409 CRISPR Proteins 0.000 description 18
- 239000012636 effector Substances 0.000 description 17
- 102100037111 Uracil-DNA glycosylase Human genes 0.000 description 16
- 230000000869 mutational effect Effects 0.000 description 16
- JQXXHWHPUNPDRT-WLSIYKJHSA-N rifampicin Chemical compound O([C@](C1=O)(C)O/C=C/[C@@H]([C@H]([C@@H](OC(C)=O)[C@H](C)[C@H](O)[C@H](C)[C@@H](O)[C@@H](C)\C=C\C=C(C)/C(=O)NC=2C(O)=C3C([O-])=C4C)C)OC)C4=C1C3=C(O)C=2\C=N\N1CC[NH+](C)CC1 JQXXHWHPUNPDRT-WLSIYKJHSA-N 0.000 description 15
- 229960001225 rifampicin Drugs 0.000 description 15
- 230000002103 transcriptional effect Effects 0.000 description 15
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 14
- 229940024606 amino acid Drugs 0.000 description 14
- 235000001014 amino acid Nutrition 0.000 description 14
- 238000006243 chemical reaction Methods 0.000 description 14
- 230000000295 complement effect Effects 0.000 description 14
- 239000011701 zinc Substances 0.000 description 14
- 229910052725 zinc Inorganic materials 0.000 description 14
- 101150090202 rpoB gene Proteins 0.000 description 13
- 108091079001 CRISPR RNA Proteins 0.000 description 12
- 238000003776 cleavage reaction Methods 0.000 description 12
- 239000013604 expression vector Substances 0.000 description 12
- 108010073062 Transcription Activator-Like Effectors Proteins 0.000 description 11
- 108020001507 fusion proteins Proteins 0.000 description 11
- 102000037865 fusion proteins Human genes 0.000 description 11
- 230000007017 scission Effects 0.000 description 11
- 238000012163 sequencing technique Methods 0.000 description 11
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 10
- 230000010076 replication Effects 0.000 description 10
- 108020004705 Codon Proteins 0.000 description 9
- 108091027544 Subgenomic mRNA Proteins 0.000 description 9
- 108091028113 Trans-activating crRNA Proteins 0.000 description 9
- 238000004458 analytical method Methods 0.000 description 9
- 230000001939 inductive effect Effects 0.000 description 9
- 238000013518 transcription Methods 0.000 description 9
- 230000035897 transcription Effects 0.000 description 9
- VRYALKFFQXWPIH-HSUXUTPPSA-N 2-deoxy-D-galactose Chemical compound OC[C@@H](O)[C@H](O)[C@H](O)CC=O VRYALKFFQXWPIH-HSUXUTPPSA-N 0.000 description 8
- 101100038261 Methanococcus vannielii (strain ATCC 35089 / DSM 1224 / JCM 13029 / OCM 148 / SB) rpo2C gene Proteins 0.000 description 8
- 230000004075 alteration Effects 0.000 description 8
- 230000033228 biological regulation Effects 0.000 description 8
- 238000002474 experimental method Methods 0.000 description 8
- 101150085857 rpo2 gene Proteins 0.000 description 8
- 238000001228 spectrum Methods 0.000 description 8
- 230000009466 transformation Effects 0.000 description 8
- 238000012070 whole genome sequencing analysis Methods 0.000 description 8
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 7
- YAWWQIFONIPBKT-HXUWFJFHSA-N 2-[[(2r)-2-butyl-6,7-dichloro-2-cyclopentyl-1-oxo-3h-inden-5-yl]oxy]acetic acid Chemical compound C1([C@@]2(C(C3=C(Cl)C(Cl)=C(OCC(O)=O)C=C3C2)=O)CCCC)CCCC1 YAWWQIFONIPBKT-HXUWFJFHSA-N 0.000 description 7
- 241000193830 Bacillus <bacterium> Species 0.000 description 7
- 108091026890 Coding region Proteins 0.000 description 7
- 101000807668 Homo sapiens Uracil-DNA glycosylase Proteins 0.000 description 7
- 239000006137 Luria-Bertani broth Substances 0.000 description 7
- 101000910035 Streptococcus pyogenes serotype M1 CRISPR-associated endonuclease Cas9/Csn1 Proteins 0.000 description 7
- 101710172430 Uracil-DNA glycosylase inhibitor Proteins 0.000 description 7
- 230000001419 dependent effect Effects 0.000 description 7
- 101100139907 Arabidopsis thaliana RAR1 gene Proteins 0.000 description 6
- 235000014469 Bacillus subtilis Nutrition 0.000 description 6
- 102100026846 Cytidine deaminase Human genes 0.000 description 6
- 108010031325 Cytidine deaminase Proteins 0.000 description 6
- 102000010719 DNA-(Apurinic or Apyrimidinic Site) Lyase Human genes 0.000 description 6
- 108010063362 DNA-(Apurinic or Apyrimidinic Site) Lyase Proteins 0.000 description 6
- 101710163270 Nuclease Proteins 0.000 description 6
- 241000251745 Petromyzon marinus Species 0.000 description 6
- 101100028790 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) PBS2 gene Proteins 0.000 description 6
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 6
- 101710160987 Uracil-DNA glycosylase Proteins 0.000 description 6
- 239000012634 fragment Substances 0.000 description 6
- 230000006698 induction Effects 0.000 description 6
- 238000004519 manufacturing process Methods 0.000 description 6
- 230000037361 pathway Effects 0.000 description 6
- 230000006798 recombination Effects 0.000 description 6
- 238000005215 recombination Methods 0.000 description 6
- 108091008146 restriction endonucleases Proteins 0.000 description 6
- 238000011144 upstream manufacturing Methods 0.000 description 6
- 101100301559 Bacillus anthracis repS gene Proteins 0.000 description 5
- 244000063299 Bacillus subtilis Species 0.000 description 5
- 101100247969 Clostridium saccharobutylicum regA gene Proteins 0.000 description 5
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 5
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 5
- 101100412434 Escherichia coli (strain K12) repB gene Proteins 0.000 description 5
- 102100026406 G/T mismatch-specific thymine DNA glycosylase Human genes 0.000 description 5
- 101100114425 Streptococcus agalactiae copG gene Proteins 0.000 description 5
- 108010035344 Thymine DNA Glycosylase Proteins 0.000 description 5
- 108091032917 Transfer-messenger RNA Proteins 0.000 description 5
- 230000001580 bacterial effect Effects 0.000 description 5
- 230000030833 cell death Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 5
- 239000000470 constituent Substances 0.000 description 5
- 229940104302 cytosine Drugs 0.000 description 5
- 238000006481 deamination reaction Methods 0.000 description 5
- 238000012217 deletion Methods 0.000 description 5
- 230000037430 deletion Effects 0.000 description 5
- 238000003780 insertion Methods 0.000 description 5
- 230000037431 insertion Effects 0.000 description 5
- 230000036438 mutation frequency Effects 0.000 description 5
- 230000001293 nucleolytic effect Effects 0.000 description 5
- 101150044854 repA gene Proteins 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 231100000419 toxicity Toxicity 0.000 description 5
- 230000001988 toxicity Effects 0.000 description 5
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 4
- 241000701022 Cytomegalovirus Species 0.000 description 4
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 4
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 4
- 229940113491 Glycosylase inhibitor Drugs 0.000 description 4
- 241000282414 Homo sapiens Species 0.000 description 4
- 239000006142 Luria-Bertani Agar Substances 0.000 description 4
- 102000001218 Rec A Recombinases Human genes 0.000 description 4
- 108010055016 Rec A Recombinases Proteins 0.000 description 4
- 102100022433 Single-stranded DNA cytosine deaminase Human genes 0.000 description 4
- 238000000692 Student's t-test Methods 0.000 description 4
- 108020005038 Terminator Codon Proteins 0.000 description 4
- 108010020764 Transposases Proteins 0.000 description 4
- 239000002253 acid Substances 0.000 description 4
- 238000004113 cell culture Methods 0.000 description 4
- 229960005091 chloramphenicol Drugs 0.000 description 4
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 4
- 239000002299 complementary DNA Substances 0.000 description 4
- 230000006378 damage Effects 0.000 description 4
- 238000012350 deep sequencing Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 230000001965 increasing effect Effects 0.000 description 4
- 239000003550 marker Substances 0.000 description 4
- 230000000873 masking effect Effects 0.000 description 4
- 230000001404 mediated effect Effects 0.000 description 4
- 230000033607 mismatch repair Effects 0.000 description 4
- 102000004196 processed proteins & peptides Human genes 0.000 description 4
- 230000002829 reductive effect Effects 0.000 description 4
- 238000012353 t test Methods 0.000 description 4
- 241001515965 unidentified phage Species 0.000 description 4
- 208000035657 Abasia Diseases 0.000 description 3
- 101100069807 Bacillus subtilis (strain 168) gudD gene Proteins 0.000 description 3
- 102000000311 Cytosine Deaminase Human genes 0.000 description 3
- 108010080611 Cytosine Deaminase Proteins 0.000 description 3
- 230000004568 DNA-binding Effects 0.000 description 3
- 206010059866 Drug resistance Diseases 0.000 description 3
- 241000588722 Escherichia Species 0.000 description 3
- 101100159448 Escherichia coli (strain K12) ycbF gene Proteins 0.000 description 3
- 241000206602 Eukaryota Species 0.000 description 3
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 241000238631 Hexapoda Species 0.000 description 3
- 241000124008 Mammalia Species 0.000 description 3
- 241000589516 Pseudomonas Species 0.000 description 3
- 101710143275 Single-stranded DNA cytosine deaminase Proteins 0.000 description 3
- 241000194017 Streptococcus Species 0.000 description 3
- 102000008579 Transposases Human genes 0.000 description 3
- 108010072685 Uracil-DNA Glycosidase Proteins 0.000 description 3
- 241000700618 Vaccinia virus Species 0.000 description 3
- 210000004102 animal cell Anatomy 0.000 description 3
- 238000012258 culturing Methods 0.000 description 3
- 230000009615 deamination Effects 0.000 description 3
- 239000008103 glucose Substances 0.000 description 3
- 238000010348 incorporation Methods 0.000 description 3
- 238000011534 incubation Methods 0.000 description 3
- 230000002401 inhibitory effect Effects 0.000 description 3
- 238000002955 isolation Methods 0.000 description 3
- 231100000053 low toxicity Toxicity 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000013207 serial dilution Methods 0.000 description 3
- 230000003007 single stranded DNA break Effects 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 238000000527 sonication Methods 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 230000002194 synthesizing effect Effects 0.000 description 3
- 230000010474 transient expression Effects 0.000 description 3
- 229940035893 uracil Drugs 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 2
- 108010034927 3-methyladenine-DNA glycosylase Proteins 0.000 description 2
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- LRFVTYWOQMYALW-UHFFFAOYSA-N 9H-xanthine Chemical compound O=C1NC(=O)NC2=C1NC=N2 LRFVTYWOQMYALW-UHFFFAOYSA-N 0.000 description 2
- 229920001817 Agar Polymers 0.000 description 2
- 108700028369 Alleles Proteins 0.000 description 2
- 108020000946 Bacterial DNA Proteins 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 2
- 241000282693 Cercopithecidae Species 0.000 description 2
- 108091092236 Chimeric RNA Proteins 0.000 description 2
- 108700010070 Codon Usage Proteins 0.000 description 2
- -1 Cpf1) Proteins 0.000 description 2
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 2
- 108010061982 DNA Ligases Proteins 0.000 description 2
- 102000012410 DNA Ligases Human genes 0.000 description 2
- 102100039128 DNA-3-methyladenine glycosylase Human genes 0.000 description 2
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 2
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 2
- 102220545976 Dihydropyrimidinase_Y70A_mutation Human genes 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- 108010042407 Endonucleases Proteins 0.000 description 2
- 102000004533 Endonucleases Human genes 0.000 description 2
- 241000283073 Equus caballus Species 0.000 description 2
- 241001013691 Escherichia coli BW25113 Species 0.000 description 2
- 108060002716 Exonuclease Proteins 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 102220511664 Heme oxygenase 1_Y70G_mutation Human genes 0.000 description 2
- 101001113440 Homo sapiens Poly [ADP-ribose] polymerase 2 Proteins 0.000 description 2
- 241000701044 Human gammaherpesvirus 4 Species 0.000 description 2
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 2
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- 102100023652 Poly [ADP-ribose] polymerase 2 Human genes 0.000 description 2
- 241000589776 Pseudomonas putida Species 0.000 description 2
- 108010091086 Recombinases Proteins 0.000 description 2
- 102000018120 Recombinases Human genes 0.000 description 2
- 241000714474 Rous sarcoma virus Species 0.000 description 2
- 241000700584 Simplexvirus Species 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 241000191940 Staphylococcus Species 0.000 description 2
- 241000193996 Streptococcus pyogenes Species 0.000 description 2
- 241000282898 Sus scrofa Species 0.000 description 2
- 102000006601 Thymidine Kinase Human genes 0.000 description 2
- 108020004440 Thymidine kinase Proteins 0.000 description 2
- 108091023040 Transcription factor Proteins 0.000 description 2
- 102000040945 Transcription factor Human genes 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 238000005273 aeration Methods 0.000 description 2
- 239000008272 agar Substances 0.000 description 2
- 238000013019 agitation Methods 0.000 description 2
- 230000003466 anti-cipated effect Effects 0.000 description 2
- 101150059062 apln gene Proteins 0.000 description 2
- 229940041514 candida albicans extract Drugs 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 230000032823 cell division Effects 0.000 description 2
- 230000010261 cell growth Effects 0.000 description 2
- 230000004663 cell proliferation Effects 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 239000013599 cloning vector Substances 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 2
- 108010029834 cytosine-DNA glycosidase Proteins 0.000 description 2
- 231100000135 cytotoxicity Toxicity 0.000 description 2
- 230000003013 cytotoxicity Effects 0.000 description 2
- 230000002950 deficient Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 230000006846 excision repair Effects 0.000 description 2
- 102000013165 exonuclease Human genes 0.000 description 2
- 239000013613 expression plasmid Substances 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 230000012010 growth Effects 0.000 description 2
- 101150046463 gsiA gene Proteins 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- LNEPOXFFQSENCJ-UHFFFAOYSA-N haloperidol Chemical compound C1CC(O)(C=2C=CC(Cl)=CC=2)CCN1CCCC(=O)C1=CC=C(F)C=C1 LNEPOXFFQSENCJ-UHFFFAOYSA-N 0.000 description 2
- 125000005842 heteroatom Chemical group 0.000 description 2
- 231100000086 high toxicity Toxicity 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- 230000017730 intein-mediated protein splicing Effects 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 238000001638 lipofection Methods 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 238000000520 microinjection Methods 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 230000001737 promoting effect Effects 0.000 description 2
- 239000002096 quantum dot Substances 0.000 description 2
- 230000009257 reactivity Effects 0.000 description 2
- 238000003757 reverse transcription PCR Methods 0.000 description 2
- 238000007480 sanger sequencing Methods 0.000 description 2
- 238000002864 sequence alignment Methods 0.000 description 2
- 230000009870 specific binding Effects 0.000 description 2
- 230000004083 survival effect Effects 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 230000014616 translation Effects 0.000 description 2
- 239000013603 viral vector Substances 0.000 description 2
- 239000012138 yeast extract Substances 0.000 description 2
- 101150013738 yfiH gene Proteins 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- DLZKEQQWXODGGZ-KCJUWKMLSA-N 2-[[(2r)-2-[[(2s)-2-amino-3-(4-hydroxyphenyl)propanoyl]amino]propanoyl]amino]acetic acid Chemical compound OC(=O)CNC(=O)[C@@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DLZKEQQWXODGGZ-KCJUWKMLSA-N 0.000 description 1
- LTZZZXXIKHHTMO-UHFFFAOYSA-N 4-[[4-fluoro-3-[4-(4-fluorobenzoyl)piperazine-1-carbonyl]phenyl]methyl]-2H-phthalazin-1-one Chemical compound FC1=C(C=C(CC2=NNC(C3=CC=CC=C23)=O)C=C1)C(=O)N1CCN(CC1)C(C1=CC=C(C=C1)F)=O LTZZZXXIKHHTMO-UHFFFAOYSA-N 0.000 description 1
- 101710169336 5'-deoxyadenosine deaminase Proteins 0.000 description 1
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 1
- 108010049290 ADP Ribose Transferases Proteins 0.000 description 1
- 108010029988 AICDA (activation-induced cytidine deaminase) Proteins 0.000 description 1
- 241000093740 Acidaminococcus sp. Species 0.000 description 1
- 241000589291 Acinetobacter Species 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 102000055025 Adenosine deaminases Human genes 0.000 description 1
- 241000607534 Aeromonas Species 0.000 description 1
- 241000589158 Agrobacterium Species 0.000 description 1
- 108091093088 Amplicon Proteins 0.000 description 1
- 101001030716 Arabidopsis thaliana Histone deacetylase HDT1 Proteins 0.000 description 1
- 101100028789 Arabidopsis thaliana PBS1 gene Proteins 0.000 description 1
- 101100365087 Arabidopsis thaliana SCRA gene Proteins 0.000 description 1
- 101100365680 Arabidopsis thaliana SGT1B gene Proteins 0.000 description 1
- 101100007857 Bacillus subtilis (strain 168) cspB gene Proteins 0.000 description 1
- 241000588807 Bordetella Species 0.000 description 1
- 241000589562 Brucella Species 0.000 description 1
- 101100280051 Brucella abortus biovar 1 (strain 9-941) eryH gene Proteins 0.000 description 1
- 108010040467 CRISPR-Associated Proteins Proteins 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 241001185363 Chlamydiae Species 0.000 description 1
- 108020004998 Chloroplast DNA Proteins 0.000 description 1
- 241000588923 Citrobacter Species 0.000 description 1
- 101100417900 Clostridium acetobutylicum (strain ATCC 824 / DSM 792 / JCM 1419 / LMG 5710 / VKM B-1787) rbr3A gene Proteins 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 241000186216 Corynebacterium Species 0.000 description 1
- 108010051219 Cre recombinase Proteins 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- 102100036279 DNA (cytosine-5)-methyltransferase 1 Human genes 0.000 description 1
- 102100024812 DNA (cytosine-5)-methyltransferase 3A Human genes 0.000 description 1
- 102100024810 DNA (cytosine-5)-methyltransferase 3B Human genes 0.000 description 1
- 101710123222 DNA (cytosine-5)-methyltransferase 3B Proteins 0.000 description 1
- 108010054814 DNA Gyrase Proteins 0.000 description 1
- 108010024491 DNA Methyltransferase 3A Proteins 0.000 description 1
- 108090000323 DNA Topoisomerases Proteins 0.000 description 1
- 102000003915 DNA Topoisomerases Human genes 0.000 description 1
- 230000006463 DNA deamination Effects 0.000 description 1
- 230000008836 DNA modification Effects 0.000 description 1
- 230000033616 DNA repair Effects 0.000 description 1
- 230000008265 DNA repair mechanism Effects 0.000 description 1
- 102100037377 DNA-(apurinic or apyrimidinic site) endonuclease 2 Human genes 0.000 description 1
- 229920001353 Dextrin Polymers 0.000 description 1
- 239000004375 Dextrin Substances 0.000 description 1
- 101100440695 Dictyostelium discoideum corB gene Proteins 0.000 description 1
- 101100102100 Drosophila melanogaster uri gene Proteins 0.000 description 1
- 102100028779 Endonuclease 8-like 2 Human genes 0.000 description 1
- 102100028773 Endonuclease 8-like 3 Human genes 0.000 description 1
- 241000186811 Erysipelothrix Species 0.000 description 1
- 101100170051 Escherichia coli (strain K12) ddpD gene Proteins 0.000 description 1
- 101100324830 Escherichia coli (strain K12) mgtA gene Proteins 0.000 description 1
- 101100267062 Escherichia coli (strain K12) yfeH gene Proteins 0.000 description 1
- 101100267452 Escherichia coli (strain K12) ykgE gene Proteins 0.000 description 1
- 101100053670 Escherichia coli (strain K12) yuaC gene Proteins 0.000 description 1
- 241001646716 Escherichia coli K-12 Species 0.000 description 1
- 241000589599 Francisella tularensis subsp. novicida Species 0.000 description 1
- 229940123611 Genome editing Drugs 0.000 description 1
- 208000031448 Genomic Instability Diseases 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 206010053759 Growth retardation Diseases 0.000 description 1
- 108010005440 Guanosine deaminase Proteins 0.000 description 1
- 241000606790 Haemophilus Species 0.000 description 1
- 241000589989 Helicobacter Species 0.000 description 1
- 208000009889 Herpes Simplex Diseases 0.000 description 1
- 108010068250 Herpes Simplex Virus Protein Vmw65 Proteins 0.000 description 1
- 101000931098 Homo sapiens DNA (cytosine-5)-methyltransferase 1 Proteins 0.000 description 1
- 101000927847 Homo sapiens DNA ligase 3 Proteins 0.000 description 1
- 101000806823 Homo sapiens DNA-(apurinic or apyrimidinic site) endonuclease 2 Proteins 0.000 description 1
- 101001123823 Homo sapiens Endonuclease 8-like 2 Proteins 0.000 description 1
- 101001123819 Homo sapiens Endonuclease 8-like 3 Proteins 0.000 description 1
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 description 1
- 101000615495 Homo sapiens Methyl-CpG-binding domain protein 3 Proteins 0.000 description 1
- 101000615492 Homo sapiens Methyl-CpG-binding domain protein 4 Proteins 0.000 description 1
- 101000664956 Homo sapiens Single-strand selective monofunctional uracil DNA glycosylase Proteins 0.000 description 1
- 101000755690 Homo sapiens Single-stranded DNA cytosine deaminase Proteins 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- 101150039072 INSA gene Proteins 0.000 description 1
- 108700005091 Immunoglobulin Genes Proteins 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 241001112693 Lachnospiraceae Species 0.000 description 1
- 241000589248 Legionella Species 0.000 description 1
- 208000007764 Legionnaires' Disease Diseases 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 102100033284 Leucine-rich repeats and immunoglobulin-like domains protein 3 Human genes 0.000 description 1
- 108091022912 Mannose-6-Phosphate Isomerase Proteins 0.000 description 1
- 102000048193 Mannose-6-phosphate isomerases Human genes 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 102000006890 Methyl-CpG-Binding Protein 2 Human genes 0.000 description 1
- 108010072388 Methyl-CpG-Binding Protein 2 Proteins 0.000 description 1
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 description 1
- 102100021291 Methyl-CpG-binding domain protein 3 Human genes 0.000 description 1
- 102100021290 Methyl-CpG-binding domain protein 4 Human genes 0.000 description 1
- 108020005196 Mitochondrial DNA Proteins 0.000 description 1
- 241000713869 Moloney murine leukemia virus Species 0.000 description 1
- 102000016943 Muramidase Human genes 0.000 description 1
- 108010014251 Muramidase Proteins 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 101100490139 Mus musculus Acer3 gene Proteins 0.000 description 1
- 206010028400 Mutagenic effect Diseases 0.000 description 1
- 108010021466 Mutant Proteins Proteins 0.000 description 1
- 102000008300 Mutant Proteins Human genes 0.000 description 1
- 241000186359 Mycobacterium Species 0.000 description 1
- 101100235161 Mycolicibacterium smegmatis (strain ATCC 700084 / mc(2)155) lerI gene Proteins 0.000 description 1
- 101100301239 Myxococcus xanthus recA1 gene Proteins 0.000 description 1
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 1
- 241000588653 Neisseria Species 0.000 description 1
- 241000588650 Neisseria meningitidis Species 0.000 description 1
- 101150034686 PDC gene Proteins 0.000 description 1
- 102000000470 PDZ domains Human genes 0.000 description 1
- 108050008994 PDZ domains Proteins 0.000 description 1
- 102000007079 Peptide Fragments Human genes 0.000 description 1
- 108010033276 Peptide Fragments Proteins 0.000 description 1
- 239000001888 Peptone Substances 0.000 description 1
- 108010080698 Peptones Proteins 0.000 description 1
- 108700023175 Phosphate acetyltransferases Proteins 0.000 description 1
- 102100023712 Poly [ADP-ribose] polymerase 1 Human genes 0.000 description 1
- 101710182846 Polyhedrin Proteins 0.000 description 1
- 241000183024 Populus tremula Species 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 101100084022 Pseudomonas aeruginosa (strain ATCC 15692 / DSM 22644 / CIP 104116 / JCM 14847 / LMG 12228 / 1C / PRS 101 / PAO1) lapA gene Proteins 0.000 description 1
- 101100371218 Pseudomonas putida (strain DOT-T1E) ttgD gene Proteins 0.000 description 1
- 101710181816 Pyruvate-formate-lyase deactivase Proteins 0.000 description 1
- 108091008103 RNA aptamers Proteins 0.000 description 1
- 101710090029 Replication-associated protein A Proteins 0.000 description 1
- 241000316848 Rhodococcus <scale insect> Species 0.000 description 1
- 101150105073 SCR1 gene Proteins 0.000 description 1
- 102000000395 SH3 domains Human genes 0.000 description 1
- 108050008861 SH3 domains Proteins 0.000 description 1
- 229910003797 SPO1 Inorganic materials 0.000 description 1
- 229910003798 SPO2 Inorganic materials 0.000 description 1
- 101100134054 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) NTG1 gene Proteins 0.000 description 1
- 101100150136 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) SPO1 gene Proteins 0.000 description 1
- 241000235343 Saccharomycetales Species 0.000 description 1
- 241000607142 Salmonella Species 0.000 description 1
- 101100356268 Schizosaccharomyces pombe (strain 972 / ATCC 24843) red1 gene Proteins 0.000 description 1
- 101100478210 Schizosaccharomyces pombe (strain 972 / ATCC 24843) spo2 gene Proteins 0.000 description 1
- 108091081021 Sense strand Proteins 0.000 description 1
- 102100038661 Single-strand selective monofunctional uracil DNA glycosylase Human genes 0.000 description 1
- 244000061456 Solanum tuberosum Species 0.000 description 1
- 235000002595 Solanum tuberosum Nutrition 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 241000194020 Streptococcus thermophilus Species 0.000 description 1
- 241000187747 Streptomyces Species 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 102220548254 Tafazzin_E96Q_mutation Human genes 0.000 description 1
- JZRWCGZRTZMZEH-UHFFFAOYSA-N Thiamine Natural products CC1=C(CCO)SC=[N+]1CC1=CN=C(C)N=C1N JZRWCGZRTZMZEH-UHFFFAOYSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 102000005924 Triose-Phosphate Isomerase Human genes 0.000 description 1
- 108700015934 Triose-phosphate isomerases Proteins 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 101150025342 UGI gene Proteins 0.000 description 1
- 241000347391 Umbrina cirrosa Species 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 241000607598 Vibrio Species 0.000 description 1
- 208000027418 Wounds and injury Diseases 0.000 description 1
- 102000002258 X-ray Repair Cross Complementing Protein 1 Human genes 0.000 description 1
- 108010000443 X-ray Repair Cross Complementing Protein 1 Proteins 0.000 description 1
- 102100029089 Xylulose kinase Human genes 0.000 description 1
- 241000607734 Yersinia <bacteria> Species 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 210000005006 adaptive immune system Anatomy 0.000 description 1
- 101150063416 add gene Proteins 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 101150014383 adhE gene Proteins 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 150000003863 ammonium salts Chemical class 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 1
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 238000003149 assay kit Methods 0.000 description 1
- 125000004429 atom Chemical group 0.000 description 1
- 235000015278 beef Nutrition 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 125000002915 carbonyl group Chemical group [*:2]C([*:1])=O 0.000 description 1
- 101150038500 cas9 gene Proteins 0.000 description 1
- 239000005018 casein Substances 0.000 description 1
- BECPQYXYKAMYBN-UHFFFAOYSA-N casein, tech. Chemical compound NCCCCC(C(O)=O)N=C(O)C(CC(O)=O)N=C(O)C(CCC(O)=N)N=C(O)C(CC(C)C)N=C(O)C(CCC(O)=O)N=C(O)C(CC(O)=O)N=C(O)C(CCC(O)=O)N=C(O)C(C(C)O)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=O)N=C(O)C(CCC(O)=O)N=C(O)C(COP(O)(O)=O)N=C(O)C(CCC(O)=N)N=C(O)C(N)CC1=CC=CC=C1 BECPQYXYKAMYBN-UHFFFAOYSA-N 0.000 description 1
- 235000021240 caseins Nutrition 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000000975 co-precipitation Methods 0.000 description 1
- 230000001332 colony forming effect Effects 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 101150110403 cspA gene Proteins 0.000 description 1
- 101150068339 cspLA gene Proteins 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 101150083941 degS gene Proteins 0.000 description 1
- 101150106284 deoR gene Proteins 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 235000019425 dextrin Nutrition 0.000 description 1
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 101150036865 espE gene Proteins 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 150000002256 galaktoses Chemical class 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 101150107144 hemC gene Proteins 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 208000032839 leukemia Diseases 0.000 description 1
- 229960000274 lysozyme Drugs 0.000 description 1
- 239000004325 lysozyme Substances 0.000 description 1
- 235000010335 lysozyme Nutrition 0.000 description 1
- 239000011777 magnesium Substances 0.000 description 1
- 229910001629 magnesium chloride Inorganic materials 0.000 description 1
- 101150019727 malQ gene Proteins 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 101150039008 miaB gene Proteins 0.000 description 1
- 238000012737 microarray-based gene expression Methods 0.000 description 1
- 208000022499 mismatch repair cancer syndrome Diseases 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000006011 modification reaction Methods 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 229910000403 monosodium phosphate Inorganic materials 0.000 description 1
- 235000019799 monosodium phosphate Nutrition 0.000 description 1
- 101150035528 mukB gene Proteins 0.000 description 1
- 238000012243 multiplex automated genomic engineering Methods 0.000 description 1
- 231100000243 mutagenic effect Toxicity 0.000 description 1
- 230000003505 mutagenic effect Effects 0.000 description 1
- 101150027065 nagE gene Proteins 0.000 description 1
- 150000002823 nitrates Chemical class 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 101150012154 nupG gene Proteins 0.000 description 1
- 238000010397 one-hybrid screening Methods 0.000 description 1
- 210000003463 organelle Anatomy 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 101150019841 penP gene Proteins 0.000 description 1
- 235000019319 peptone Nutrition 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 101150009573 phoA gene Proteins 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 101150035139 puuD gene Proteins 0.000 description 1
- 125000000714 pyrimidinyl group Chemical group 0.000 description 1
- 101150079601 recA gene Proteins 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 101150098466 rpsL gene Proteins 0.000 description 1
- 239000006152 selective media Substances 0.000 description 1
- 101150085300 sepA gene Proteins 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 101150068906 snr-6 gene Proteins 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- AJPJDKMHJJGVTQ-UHFFFAOYSA-M sodium dihydrogen phosphate Chemical compound [Na+].OP(O)([O-])=O AJPJDKMHJJGVTQ-UHFFFAOYSA-M 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 239000007921 spray Substances 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 125000001424 substituent group Chemical group 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 235000019157 thiamine Nutrition 0.000 description 1
- KYMBYSLLVAOCFI-UHFFFAOYSA-N thiamine Chemical compound CC1=C(CCO)SCN1CC1=CN=C(C)N=C1N KYMBYSLLVAOCFI-UHFFFAOYSA-N 0.000 description 1
- 229960003495 thiamine Drugs 0.000 description 1
- 239000011721 thiamine Substances 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 101150065732 tir gene Proteins 0.000 description 1
- 231100000167 toxic agent Toxicity 0.000 description 1
- 239000003440 toxic substance Substances 0.000 description 1
- 101150080369 tpiA gene Proteins 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 239000012137 tryptone Substances 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 241000701447 unidentified baculovirus Species 0.000 description 1
- 241001529453 unidentified herpesvirus Species 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 230000035899 viability Effects 0.000 description 1
- 101150030118 vibB gene Proteins 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
- 229940075420 xanthine Drugs 0.000 description 1
- 108091022915 xylulokinase Proteins 0.000 description 1
- 101150091532 ybbA gene Proteins 0.000 description 1
- 101150119021 ycbF gene Proteins 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2497—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing N- glycosyl compounds (3.2.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/78—Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y302/00—Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
- C12Y302/02—Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2) hydrolysing N-glycosyl compounds (3.2.2)
- C12Y302/02027—Uracil-DNA glycosylase (3.2.2.27)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y305/00—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
- C12Y305/04—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
- C12Y305/04005—Cytidine deaminase (3.5.4.5)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/40—Fusion polypeptide containing a tag for immunodetection, or an epitope for immunisation
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/80—Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/95—Fusion polypeptide containing a motif/fusion for degradation (ubiquitin fusions, PEST sequence)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Medicinal Chemistry (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Mycology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
- Peptides Or Proteins (AREA)
Abstract
A presente invenção provê um complexo no qual os seguintes componentes estão ligados: um módulo de reconhecimento de sequência de ácido nucleico que especificamente se liga com uma sequência de nucleotídeos alvo em DNA de fita dupla; e uma etiqueta de degradação de proteína composta de (i) um peptídeo que inclui três resíduos de aminoácidos hidrofóbicos na terminação-C ou (ii) um peptídeo que inclui três resíduos de aminoácidos hidrofóbicos na terminação-C em que pelo menos alguns dos ditos resíduos de aminoácidos são substituídos por serina.
Description
UM DNA DE FITA DUPLA PRÓXIMO AO SÍTIO [Campo Técnico]
[001] A presente invenção refere-se a um complexo para edição de genoma que é estável e causa poucos efeitos colaterais, um ácido nucleico codificante do mesmo, e um método de edição de genoma que usa o complexo. [Fundamentos da Técnica]
[002] A edição de genoma que não requer a incorporação de um gene marcador de seleção e que pode minimizar o efeito sobre a expressão de genes a jusante no mesmo operon é particularmente vantajosa em procariotos. RecET- e X- Red-recombinases derivadas de fago têm sido usadas como técnicas recombinantes e facilitam a incorporação/substituição, dependente de homologia, de DNA doador ou de oligonucleotídeos doadores (por exemplo, literatura de não patente 1). Pela combinação de uma cepa deficiente em reparo de malpareamento (MMR, MisMatch Repair) direcionado por metila, recombinação elevadamente eficiente pode ser realizada sem a incorporação de um marcador selecionável (literatura de não patente 2), e diversidade genética em múltiplos loci alvo pode ser alcançada dentro de vários dias. Por conseguinte, a técnica é utilizada em engenharia automatizada de genomas multiplex (MAGE, Multiplex Automated Genome Engineering). Contudo, as técnicas de recombinação supracitadas baseiam-se em deficiência de MMR e fatores dependentes de hospedeiro como RecA, que é um elemento constituinte central do sistema de reparo de RNA recombinante, e danifica a maioria das Escherichia coli usadas como um hospedeiro para clonagem. Portanto, ela não pode ser facilmente aplicada em espécies bacterianas com um background diferente (literatura de não patente 3).
[003] É sabido que CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats, repetições palindrômicas curtas agrupadas e regularmente interespaçadas) e proteína associada às CRISPR (Cas, CRISPR-associated) funcionam como um sistema imune adaptativo bacteriano pela clivagem de DNA alvo em uma maneira dependente de um RNA guia único (sgRNA, single guide RNA) e um motivo adjacente protoespaçador (PAM, Protospacer Adjacent Motif). Cas9-nuclease de Streptococcus pyogenes é amplamente usada como uma poderosa ferramenta de edição de genoma em eucariotos tendo uma via de reparo de quebras de DNA de fita dubla (DSB, Double-Stranded DNA Break) (por exemplo, literaturas de não patente 4, 5). Durante o reparo de DSB pela via de Junção de extremidades não homólogas (NHEJ, Non-Homologous End Joining), uma pequena inserção e/ou deleção (indels) são/é introduzida(s) no DNA alvo, e ocorre mutação sítio-específica ou destruição do gene. Embora a eficiência dependa da célula hospedeira, o reparo por recombinação homóloga (HDR, Homologous Recombination Repair) pode ser favorecido pela provisão de um DNA doador contendo um braço de homologia para a região alvo para edição mais acurada.
[004] Contudo, visto que a técnica de edição de genoma, atualmente, baseia-se no sistema de reparo de DNA do hospedeiro, a aplicação em procariotos requer planejamento adicional. Na maioria das bactérias, a clivagem de DNA por nucleases artificiais resulta em morte celular devido à falta da via NHEJ (literaturas de não patente 6, 7). Portanto, CRISPR/Cas9 é usado apenas como um contra- seletor para células com genes alterados em outros métodos, como o sistema de recombinação A-Red (por exemplo, literaturas de não patente 8, 9).
[005] Recentemente, tem sido demonstrada a edição de bases alvo mediada por desaminase na qual os nucleotídeos são diretamente editados no locus de gene alvo sem o uso de DNA doador contendo um braço de homologia para a região alvo (por exemplo, literatura de patente 1, literaturas de não patente 10 a 12). Visto que esta técnica utiliza desaminação de DNA ao invés de clivagem de DNA mediada por nuclease, ela não induz morte celular bacteriana e é aplicável à edição de genoma de bactérias. Contudo, sua eficiência de mutação, especialmente a eficiência de edição simultânea de múltiplos sítios, não é suficiente.
[Lista de Citações] [Literatura de patente] Literatura de patente 1: WO 2015/133554 [Literaturas de não patente] Literatura de não patente 1: Datsenko, K. A. & Wanner, B. L., Proc. Natl. Acad. Sci. U.S. A. 97, 6640-5 (2000).
Literatura de não patente 2: Costantino, N. & Court, D. L., Proc. Natl. Acad. Sci. U.S. A. 100, 15748-53 (2003).
Literatura de não patente 3: Wang, JJ. et al., Mol. Biotechnol. 32, 43-53 (2006).
Literatura de não patente 4: Mali, P. er al., Science 339, 823-827 (2013).
Literatura de não patente 5: Cong, L. et al., Science 339, 819-823 (2013).
Literatura de não patente 6: Bowater, R. & Doherty, A. J., PLoS Genet. 2, 93-99 (2006).
Literatura de não patente 7: Cui, L. & Bikard, D., Nucleic Acids Res. 44, 4243-4251 (2016).
Literatura de não patente 8: Jiang, W. et al., Nat. Biotechnol. 31, 233-239 (2013).
Literatura de não patente 9: Li, Y. et al., Metab. Eng. 31, 1-9 (2015).
Literatura de não patente 10: Komor, A. C. et al., Nature 61, 5985- 91 (2016).
Literatura de não patente 11: Nishida, K. et al., Science 102, 553- 563 (2016).
Literatura de não patente 12: Ma, Y. et al., Nat. Methods 1-9 (2016). doi:10.1038/nmeth.4027 [Sumário da Invenção]
[Problema Técnico]
[006] Vetores convencionais para edição de genoma impõem uma pesada carga sobre os hospedeiros, particularmente bactérias, e podem tornar o vetor instável no hospedeiro, devido a uma toxicidade alta do complexo para edição de genoma que é expressado a partir do vetor e atua sobre o DNA genômico do hospedeiro. Na edição de genoma, ocorrem efeitos colaterais como mutação não específica, mutação em alvo diferente do previsto (off-target mutation) e semelhantes. Particularmente, quando a eficiência de mutação é aumentada usando o inibidor de uracil-DNA-glicosilase (UGI, Uracil DNA Glycosylase Inhibitor) e semelhantes, ocorre, em resposta, uma toxicidade forte para o hospedeiro, e morte celular, um aumento na taxa de mutação não específica e semelhantes. Portanto, um objetivo da presente invenção é prover um ácido nucleico como um vetor tendo toxicidade baixa que pode ser estavelmente amplificado mesmo em um hospedeiro, e um complexo para edição de genoma codificado pelo ácido nucleico, e um método para edição de genoma usando o vetor, e uma enzima alteradora de ácido nucleico se necessária, cujo método não se baseia em fatores dependentes do hospedeiro como RecA, pode alterar o DNA de bactéria enquanto que suprime a mutação não específica e semelhantes, e é aplicável a uma ampla variedade de bactérias. [Solução do Problema]
[007] O presente inventor teve uma ideia de que um vetor em uma bactéria pode ser estabilizado e mutação não específica de DNA bacteriano e semelhantes pode ser reduzida pela supressão da quantidade de um complexo para edição de genoma presente na bactéria que tem toxicidade alta para a bactéria como um hospedeiro. Para suprimir a quantidade de um complexo para edição de genoma, o inventor observou a etiqueta LVA que é uma etiqueta de proteólise conhecida por favorecer a degradação de proteínas em bactérias e encurtar a meia- vida, e prosseguiu com a pesquisa. Como resultado, o inventor tem demonstrado que a mutação não específica pode ser reduzida enquanto que mantém a eficiência de mutação no sítio alvo pela adição de uma etiqueta de proteólise a um complexo para edição de genoma e que mesmo quando o UGI é combinado, mutação não específica pode ser reduzida e a sequência alvo pode ser alterada com eficiência alta (Figura 9, Figura 10). O presente inventor conduziu estudos adicionais e completou a presente invenção.
[008] Consequentemente, a presente invenção provê o seguinte:
[1] Um complexo compreendendo um módulo reconhecedor de sequência de ácido nucleico e uma etiqueta de proteólise, sendo que o módulo está ligado à etiqueta de proteólise, o módulo especificamente se liga a uma sequência de nucleotídeos alvo em um DNA de fita dupla, e a etiqueta consiste em (1) um peptídeo contendo 3 resíduos de aminoácidos hidrofóbicos na terminação-C, ou (ii) um peptídeo contendo 3 resíduos de aminoácidos na terminação-C sendo que pelo menos uma parte dos resíduos de aminoácidos está substituída por serina.
[2] O complexo de [1], sendo que o complexo supracitado está adicionalmente ligado com uma enzima alteradora de ácido nucleico, e converte um ou mais nucleotídeos no sítio alvo em outros um ou mais resíduos ou os exclui, ou insere um ou mais nucleotídeos no sítio alvo.
[3] O complexo de [1] ou [2], sendo que os 3 resíduos de aminoácidos supracitados são leucina-valina-alanina, leucina-alanina-alanina, alanina-alanina-valina ou alanina-serina-valina.
[4] O complexo de qualquer um de [1] a [3], sendo que o módulo reconhecedor de sequência de ácido nucleico supracitado é um sistema CRISPR- Cas no qual apenas uma das duas capacidades de clivagem de DNA de Cas ou ambas as capacidades de clivagem de DNA estão inativadas.
[5] O complexo de qualquer um de [1] a [3], sendo que o complexo supracitado é um complexo no qual a etiqueta de proteólise está ligada a um sistema CRISPR-Cas.
[6] O complexo de qualquer um de [2] a [4], sendo que a enzima alteradora de ácido nucleico supracitada é uma enzima conversora de base de ácido nucleico ou uma DNA-eglicosilase.
[7] O complexo de [6], sendo que a enzima conversora de base de ácido nucleico supramencionada é desaminase.
[8] O complexo de [6] ou [7], sendo que um inibidor de reparo por excisão de base está adicionalmente ligado ao complexo.
[9] Um ácido nucleico codificante do complexo de qualquer um de 01) a[8].
[10] Um método para alteração de um sítio alvo de um DNA de fita dupla de uma bactéria, ou regulação de uma expressão de um gene codificado por um DNA de fita dupla próximo ao sítio, compreendendo uma etapa de colocar em contato com o DNA de fita dupla, um complexo compreendendo um módulo reconhecedor de sequência de ácido nucleico que especificamente se liga a uma sequência de nucleotídeos alvo em um DNA de fita dupla selecionado e uma etiqueta de proteólise, sendo que a etiqueta de proteólise consiste em (1) um peptídeo contendo 3 resíduos de aminoácidos hidrofóbicos na terminação-C, ou (ii) um peptídeo contendo 3 resíduos de aminoácidos na terminação-C sendo que pelo menos uma parte dos resíduos de aminoácidos está substituída por serina.
[11] O método de [10], compreendendo uma etapa de converter um ou mais nucleotídeos no sítio alvo em outros um ou mais nucleotídeos ou excluir um ou mais nucleotídeos, ou inserir um ou mais nucleotídeos no dito sítio alvo, sendo que o complexo supracitado está adicionalmente ligado com uma enzima alteradora de ácido nucleico.
[12] O método de [10] ou [11], sendo que os 3 resíduos de aminoácidos supracitados são leucina-valina-alanina, leucina-alanina-alanina, alanina-alanina-valina ou alanina-serina-valina.
[13] O método de qualquer um de [10] a [12], sendo que o módulo reconhecedor de sequência de ácido nucleico supracitado é um sistema CRISPR- Cas no qual apenas uma das duas capacidades de clivagem de DNA de Cas ou ambas as capacidades de clivagem de DNA estão inativadas.
[14] O método de qualquer um de [10] a [12], sendo que o complexo supracitado é um complexo no qual a etiqueta de proteólise está ligada a um sistema CRISPR-Cas.
[15] O método de qualquer um de [10] a [14], sendo que são usados dois ou mais tipos de módulos reconhecedores de sequência de ácido nucleico cada um especificamente se ligando a uma sequência de ácido nucleico alvo diferente.
[16] O método de [15], sendo que a sequência de nucleotídeos alvo diferente supracitada está presente em um gene diferente.
[17] O método de qualquer um de [10] a [13], [15] e [16], sendo que a enzima alteradora de ácido nucleico supracitada é uma enzima conversora de base de ácido nucleico ou uma DNA-glicosilase.
[18] O método de [17], sendo que a enzima conversora de base de ácido nucleico supramencionada é desaminase.
[19] O método de [17] ou [18], sendo que o complexo está adicionalmente ligado a um inibidor de reparo por excisão de base.
[20] O método de qualquer um de [10] a [19], sendo que o DNA de fita dupla é colocado em contato com o complexo pela introdução do ácido nucleico codificante do complexo para dentro da bactéria tendo o DNA de fita dupla.
[Efeitos Vantajosos da Invenção]
[009] De acordo com a presente invenção, são providos um ácido nucleico (por exemplo, vetor) que é estável e amplificável mesmo em uma bactéria hospedeira e tem toxicidade baixa, e um complexo para edição de genoma que é codificado pelo ácido nucleico. De acordo com o método para edição de genoma usando o ácido nucleico e a enzima alteradora de ácido nucleico da presente invenção, é possível alterar o gene de uma bactéria hospedeira enquanto que suprime mutação não específica e semelhantes, ou regula a expressão de um gene codificado por um DNA de fita dupla. Visto que este método não se baseia em fatores dependentes do hospedeiro como RecA, ele pode ser aplicado em uma ampla variedade de bactérias. [Breve Descrição dos Desenhos]
[0010] A Figura 1 mostra o esboço do sistema Target-AID em uma bactéria. (a) É um modelo esquemático de edição de base Target-AID (dCas9- PmCDAI/sgRNA). O complexo dCas9-PmCDA1/sgRNA liga-se ao DNA de fita dupla para formar uma alça-R na maneira dependente de seRNA e de PAM. PmCDA 1 catalisa a desaminação de citosina localizada em uma fita de topo (não complementar) dentro de 15-20 bases a montante a partir de PAM, que resulta em mutagênese de C-para-T. (b) Mostra um plasmídeo único Target-AID de bactéria. O plasmídeo contém o gene de resistência ao cloranfenicol (Cm, chloramphenicol-resistant), o repressor * cI sensível à temperatura (ts), a origem pSCI101 (ori) e RepAl1O1 (ts). O operador *à expressa a fusão dCas9-PmCDA1 à alta temperatura (>37ºC) quando o repressor cI (ts) torna-se inativado. seRNA é expressado por um promotor constitutivo J23119. dCas9 é uma Cas9 deficiente em nuclease com mutações DIOA H840A, e PmCDAI é citosina-desaminase de Petromyzon marinus.
[0011] A Figura 2 mostra a eficiência de transformação dos vetores Cas9 e Target-AID em Escherichia coli. Os plasmídeos que expressam cada proteína para alteração (Cas9, dCas, Cas9-CDA, nCas-CDA ou dCas-CDA) com seRNA reconhecedor de gene galK foram transformados para dentro da cepa DH5a de Escherichia coli e selecionados para o marcador de resistência ao cloranfenicol. As células viáveis foram contadas e calculadas como unidade de formação de colônia (UFC) por quantidade de DNA plasmidial transformado. Os pontos representam três experimentos independentes e a caixa indica intervalo de confiança de 95% para uma média geométrica pela análise de teste-t.
[0012] A Figura 3 mostra uma mutação induzida em um sítio específico do gene galK9 pelo dCas-CDA. As células DH5a que expressam dCas-CDA com sgRNA reconhecedor de galK 9 foram aplicadas como manchas sobre placa de ágar LB para isolar colônias individuais. Oito clones aleatoriamente selecionados foram sequenciados e as sequências foram alinhadas. As sequências de aminoácidos traduzidas são mostradas abaixo de cada uma das sequências de nucleotídeos. A frequência da sequência alinhada é indicada como contagem de clones. A Caixa e a caixa invertida indicam a sequência alvo e a sequência de PAM, respectivamente. Número de ORF é indicado no topo. Sítios mutados estão realçados em sombra preta e bases mutadas e aminoácidos mutados são mostrados em negrito. Os códons mutados estão sublinhados.
[0013] A Figura 4 mostra a frequência de mutação avaliada pela resistência a fármaco. (a) Mostra a mutagênese de galK e a frequência de resistência a 2-DOG. Células DH5a que expressam dCas-CDA com seRNA (vetor) não reconhecedor ou ssRNA reconhecedor de galK 9 foram aplicadas como manchas sobre a placa de ágar de meio M63 com ou sem 2-DOG em diluições seriais, e as colônias foram contadas. (b) Mostra a mutagênese de rpoB e a frequência de resistência à rifampicina. As células que expressam dCas-CDA com seRNA (vetor) não reconhecedor ou ssRNA reconhecedor de rpoB 1 foram aplicadas como manchas sobre a placa de ágar LB com ou sem rifampicina em diluições seriais, e as colônias foram contadas. A frequência de resistência a fármaco é calculada como um número de colônias resistentes a fármaco sobre aquele de colônias não selecionadas. Os pontos representam quatro experimentos independentes e a caixa indica intervalo de confiança de 95% para uma média geométrica pela análise de teste-t.
[0014] A Figura 5 mostra a mutagênese de ganho-de-função do gene rpoB. (a) Mostra o alinhamento de sequências de mutações de rpoB induzidas por dCas- CDA. Células DH5a que expressam dCas-CDA com sgRNA reconhecedor de rpoB | foram aplicadas como manchas sobre a placa de ágar LB para isolar colônias individuais. Oito clones aleatoriamente selecionados foram sequenciados e as sequências foram alinhadas. As sequências de aminoácidos traduzidas são mostradas abaixo de cada uma das sequências de nucleotídeos. A frequência das
/67 sequências alinhadas é indicada como contagem de clones. À caixa e a caixa invertida indicam a sequência alvo e a sequência de PAM. O número de ORF é indicado no topo. Os sítios mutados estão realçados em sombra preta e as bases mutadas e os aminoácidos mutados são mostrados em negrito. Os códons mutados estão sublinhados. (b) Mostra os resultados das análises de sequenciamento de genoma inteiro das células reconhecidas por rpoB. Três clones independentes selecionados por rifampicina foram submetidos ao sequenciamento de genoma inteiro. A cobertura de sequência foi calculada como a soma de pares de bases da sequência mapeada sobre 4.631 Mbp de sequência de genoma de Escherichia coli BW25113. Mutação parental/variável é mostrada pelo número de variantes obtidas pela subtração das mutações parentais comuns das variantes detectadas sobre frequência de 50% incluindo inserções, deleções, variantes de nucleotídeo único (SNV, Single Nucleotide Variants) e variantes de múltiplos nucleotídeos (MNV, Multiple Nucleotide Variants). A mutação detectada indica o número de mutações (contagem), locus genômico (região/gene), sequência de genoma de referência (referência) e alelo mutante (alelo). A chamada de variante foi realizada como descrito nos Exemplos. (c) Mostra as sequências ao redor das mutações detectadas listadas em (b). Os sítios mutados estão realçados em sombra cinza e as bases mutadas e os aminoácidos mutados estão realçados em negrito.
[0015] A Figura 6 mostra a presença ou ausência de UGI-LVA, e posição e frequência de mutação quando foi usado ssRNA com um comprimento diferente. As sequências alvo (galK 8,9, 11 e 13) com comprimento de 20 nt e mais longas foram testadas pelo uso de dCas-CDA (barra azul) ou de dCas-CDA-UGI-LVA (barra vermelha) e analisadas por sequenciamento profundo. Foi representada em gráfico a média de três experimentos independentes. À sombra cinza e a caixa invertida indicam as sequências alvo de galK e PAM, respectivamente. As bases mutadas estão sublinhadas.
[0016] A Figura 7 mostra o efeito das propriedades da sequência alvo sobre as posições e frequências mutacionais para Target-AID. As células que expressam dCas-CDA e cada seRNA reconhecedor foram analisadas por sequenciamento profundo. As sequências alvo (comprimento de 20nt ou conforme indicado) foram fita de DNA (+) sobre galK ORF ou fita de DNA (-) abaixo de galK ORF, e como era de se esperar introduziram mutações de sentido trocado (M, missense) ou sem sentido (N, nonsense). O número de ORF correspondente é indicado (Posição). Frequências de mutação da posição de base de pico (realçada em sombra cinza na sequência) foram obtidas como médias de três experimentos independentes. As frequências de mutação em >50%, 10-50% ou <10% estão realçadas em sombras de cinza.
[0017] A Figura 8 mostra o efeito de comprimentos alvo sobre o espectro mutacional. (a) Mostra as frequências de mutação usando vários comprimentos de sequências alvo no gsiA. As sequências alvo que contêm poli-C no sítio distal foram editadas por dCas-CDA-UGI-LVA e analisadas por sequenciamento profundo. Os espectros mutacionais para ses RNAs com 18nt, 20nt, 22nt ou 24nt de comprimento foram distinguidos pela sombra de cinza. São mostradas as médias para três experimentos independentes. À caixa invertida indica PAM. As bases mutadas estão sublinhadas. (b) Mostra as frequências de mutação para alvos em ycbF e yfiH. Os alvos estão localizados nas fitas inferiores. Espectros mutacionais para se«RNAs com 18nt, 20nt ou 22nt de comprimento são usados e mostrados como em (a). (c) Mostra os espectros mutacionais médios para cada comprimento de seRNA de (a) e (b). As posições de pico estão numeradas.
[0018] A Figura 9 mostra a mutagênese múltipla no gene galK. (a) Mostra o efeito mutagênico não específico avaliado pela resistência à rifampicina. As células que expressam cada proteína (vetor, dCas, dCas-CDA, dCas-CDA-LVA ou dCas-CDA1-UGI-LVA) com a unidade de seRNA em tandem contendo os alvos galK 10-galK 11-galK 13 foram aplicadas como manchas sobre a placa de ágar LB com ou sem rifampiícina para avaliar a frequência de mutações não específicas. Os pontos representam pelo menos três experimentos independentes e a caixa indica o intervalo de confiança de 95% para uma média geométrica pela análise de teste-t. (b) Mostra a frequência de mutação multiplex em alvo induzida pela região alvo. Oito clones aleatoriamente selecionados em (a) foram sequenciados nos três loci alvo. As frequências de clone mutante único, mutante duplo ou mutante triplo são indicadas. (c) e (d) Mostram os alinhamentos de sequências dos mutantes. Alvos individuais (galK 10, galK 11 ou galK 13) (c) ou alvos triplos (d) foram mutados usando dCas-CDA-UGILVA. Oito clones aleatoriamente selecionados foram sequenciados e as sequências foram alinhadas. A caixa e a caixa invertida indicam a sequência alvo e a sequência de PAM, respectivamente. Sítios de mutação e bases mutadas estão realçados em sombra preta e negrito, respectivamente.
[0019] A Figura 10 mostra a mutagênese multiplex. (a) Mostra um desenho esquemático de dois plasmídeos para mutagênese multiplex; um vetor para alteração da expressão de dCas-CDA-UGI-LVA e um plasmídeo pSBP80608 contendo duas unidades de seRNA repetidas em tandem contendo três ssRNA reconhecedores. (b) Mostra os alinhamentos de sequências das regiões alvo. Oito clones aleatoriamente selecionados foram sequenciados e alinhados em cada região alvo. Os números de clones são indicados à esquerda das sequências. A caixa e a caixa invertida indicam a sequência alvo e PAM. Os sítios mutados e as bases mutadas estão realçados em sombra preta e negrito.
[0020] A Figura 11 mostra a disrupção simultânea de genes multicópias de transposase. IS1, 2, 3 e 5 são simultaneamente reconhecidos usando dCas-CDA- UGI-LVA. sgRNAs são desenhados para introduzir códons de terminação na sequência comum do mesmo tipo de transposase. São alinhadas todas menos as sequências que não podem ser amplificadas a partir do genoma de referência DHIOB. As sequências de aminoácidos traduzidas são mostradas no topo de cada sequência comum. As regiões genômicas de cada sequência são mostradas à esquerda. Todas as sequências alvo são desenhadas com base nas fitas complementares e as regiões correspondentes estão enquadradas com as sequências PAM complementares (invertidas). As bases mutadas estão realçadas em sombra preta.
[0021] A Figura 12 mostra um procedimento de isolamento e de verificação para as células com IS-editados. Isolamento de clones e verificação de sequências são realizados em estágios. Os clones isolados são numerados como indicado na linha de topo de cada tabela e a sequência é analisada nos sítios IS indicados na coluna da esquerda. O genótipo foi determinado como mutação alvo verificada (mut), não mutado (wt) ou hetero de mut e wt (hetero) com base no espectro de sequenciamento de Sanger.
[0022] A Figura 13 é um desenho esquemático mostrando os vetores para expressão em levedura (vetor basal (background): vetor pRS315) usado no Exemplo 5. Na Figura, Gallp é um promotor GAL1-10. [Descrição das Modalidades]
1. Complexo para edição de genoma e ácido nucleico codificante do mesmo
[0023] A presente invenção provê um complexo para edição de genoma no qual um módulo reconhecedor de sequência de ácido nucleico que especificamente se liga a uma sequência de nucleotídeos alvo em um DNA de fita dupla e uma etiqueta de proteólise estão ligados, e um ácido nucleico codificante do complexo. Em uma modalidade do complexo para edição de genoma da presente invenção, é provido um complexo no qual uma enzima alteradora de ácido nucleico está adicionalmente ligada (isto é, um complexo no qual um módulo reconhecedor de sequência de ácido nucleico, uma enzima alteradora de ácido nucleico e uma etiqueta de proteólise estão ligados), que pode alterar o ácido nucleico no sítio alvo. Em uma modalidade, para melhorar a eficácia de alteração do DNA de fita dupla, um inibidor de reparo por excisão de base pode estar adicionalmente ligado ao complexo. Em outra modalidade do complexo para edição de genoma, é provido um complexo no qual pelo menos um módulo reconhecedor de sequência de ácido nucleico e uma etiqueta de proteólise estão ligados, que pode regular a expressão de um DNA de fita dupla de gene na vizinhança do sítio alvo. Em uma modalidade, um fator regulatório transcricional pode estar adicionalmente ligado ao complexo.
14 /67 A seguir, um complexo no qual pelo menos qualquer um(a) de uma enzima alteradora de ácido nucleico, um inibidor de reparo por excisão de base e um fator regulatório transcricional está ligado(a) e um complexo no qual nenhum deles está ligado é algumas vezes coletivamente chamado de “o complexo da presente invenção” ou “o complexo para edição de genoma”, e particularmente, um complexo no qual uma enzima alteradora de ácido nucleico está ligada é algumas vezes chamado de “o complexo de enzima alteradora de ácido nucleico”. Os ácidos nucleicos codificantes destes complexos são algumas vezes coletivamente chamados de “o ácido nucleico da presente invenção”.
[0024] Quando o ácido nucleico da presente invenção é introduzido em uma bactéria hospedeira (por exemplo, Escherichia coli) e a bactéria hospedeira é cultivada para o propósito de replicação, ao invés de alteração de DNA, e um complexo é expressado não intencionalmente a partir do ácido nucleico, a toxicidade para a bactéria hospedeira pode ser suprimida para baixo porque o complexo é degradado rapidamente pela etiqueta de proteólise. De fato, quando o ácido nucleico da presente invenção é introduzido em uma bactéria hospedeira para o propósito de replicação do ácido nucleico, a eficiência de transformação da bactéria hospedeira é alta conforme demonstrado nos Exemplos descritos abaixo em comparação com quando um não contendo um ácido nucleico codificante de etiqueta de proteólise é introduzido. Portanto, o ácido nucleico da presente invenção contendo uma sequência codificante de etiqueta de proteólise pode ser estavelmente replicado em uma bactéria como um ácido nucleico para edição de genoma de um hospedeiro diferente de bactérias (por exemplo, eucarioto). Portanto, é útil adicionar uma sequência codificante de etiqueta de proteólise da presente invenção a um vetor que almeja editar o genoma em um hospedeiro diferente de bactérias.
[0025] Na presente invenção, a “alteração” de um DNA de fita dupla significa que um nucleotídeo (por exemplo, dC) em uma fita de DNA é convertido em outro nucleotídeo (por exemplo, dT, dA ou dG), ou excluído, ou um nucleotídeo ou uma sequência de nucleotídeos é inserido(a) entre certos nucleotídeos em uma fita de DNA. O DNA de fita dupla a ser alterado não é particularmente limitado desde que ele seja um DNA presente na célula, preferivelmente um DNA genômico. O “sítio alvo” de um DNA de fita dupla significa a “sequência de nucleotídeos alvo” inteira ou parcial, que um módulo reconhecedor de sequência de ácido nucleico especificamente reconhece e se liga à mesma, ou a vizinhança da sequência de nucleotídeos alvo (uma ou ambas de a montante de 5' e a jusante de 3”). A “sequência de nucleotídeos alvo” significa uma sequência à qual se liga um módulo reconhecedor de sequência de ácido nucleico no DNA de fita dupla. Na presente invenção, o termo “edição de genoma” é usado para significar não apenas alteração de um DNA de fita dupla mas também favorecimento ou supressão da expressão de um gene codificado por um DNA de fita dupla na vizinhança do sítio alvo.
[0026] Na presente invenção, o “módulo reconhecedor de sequência de ácido nucleico” significa uma molécula ou um complexo molecular tendo uma capacidade para especificamente reconhecer e se ligar a uma sequência de nucleotídeos específica (isto é, sequência de nucleotídeos alvo) em uma fita de DNA. Quando um complexo de enzima alteradora de ácido nucleico é usado, a ligação do módulo reconhecedor de sequência de ácido nucleico a uma sequência de nucleotídeos alvo permite que uma enzima alteradora de ácido nucleico e/ou um inibidor de reparo por excisão de base ligada(o) ao módulo especificamente atue em um sítio alvo de um DNA de fita dupla.
[0027] Na presente invenção, a “enzima alteradora de ácido nucleico” significa uma enzima que modifica DNA, e a modificação causa, direta ou indiretamente, alteração de DNA. A enzima pode ser um fragmento de peptídeo da mesma desde que ele tenha uma atividade catalítica. Exemplos de tal reação de modificação de DNA incluem uma reação para clivar DNA (doravante a ser chamada também de “reação de clivagem de fita de DNA”) que é catalisada por uma enzima nucleolítica, uma reação para converter um substituinte no anel purina ou pirimidina de uma base de ácido nucleico em outro grupo ou átomo, que é uma
16 /67 reação catalisada por uma enzima conversora de base de ácido nucleico e não envolve diretamente clivagem de fita de DNA (doravante a ser chamada também de “reação de conversão de base da ácido nucleico”) (por exemplo, reação de desaminação de base), uma reação para hidrolisar ligação N-glicosídica (doravante a ser chamada também de “reação de excisão de base”) que é catalisada por DNA- glicosilase e semelhantes. Como mostrado nos Exemplos descritos abaixo, a toxicidade de um complexo de enzima alteradora de ácido nucleico contendo uma enzima conversora de base de ácido nucleico para a bactéria hospedeira pode ser reduzida pela adição de uma etiqueta de proteólise. Portanto, a técnica da presente invenção pode ser aplicada na edição de genoma usando não apenas uma enzima conversora de base de ácido nucleico mas também enzimas nucleolíticas convencionalmente difíceis para aplicação em bactérias devido à forte toxicidade das mesmas. Portanto, a enzima alteradora de ácido nucleico a ser usada na presente invenção inclui uma enzima nucleolítica, uma enzima conversora de base de ácido nucleico, uma DNA-eglicosilase e semelhantes. A partir do aspecto de redução de citotoxicidade, a enzima conversora de base de ácido nucleico e a DNA -eglicosilase são preferíveis, e o sítio alvo pode ser alterado usando estas enzimas no sítio alvo, sem clivagem de pelo menos uma das fitas do DNA de fita dupla.
[0028] Na presente invenção, a “etiqueta de proteólise” consiste predominantemente em um peptídeo contendo não menos do que 3 resíduos de aminoácidos hidrofóbicos, sendo que o peptídeo mostra uma meia-vida encurtada de proteína quando adicionado a um complexo para edição de genoma em comparação com aquele sem adição ao complexo. Como tal aminoácido, podem ser mencionados glicina, alanina, valina, leucina, isoleucina, metionina, prolina, fenilalanina, e triptofano. A etiqueta de proteólise da presente invenção necessita apenas conter quaisquer três destes resíduos de aminoácidos na terminação-C, e outra constituição não é particularmente limitada. Ela pode ser um peptídeo consistindo nos três resíduos de aminoácidos. Um peptídeo no qual uma parte dos ou todos os resíduos de aminoácidos hidrofóbicos supracitados é/são substituída(os) por serina ou treonina é também abrangido na etiqueta de proteólise da presente invenção.
Embora os três resíduos de aminoácidos preferíveis supracitados não sejam particularmente limitados, leucina-valina-alanina (LVA), leucina-alanina- alanina (LAA), alanina-alanina-valina (AAV) e semelhantes, cujos elevados efeitos foram confirmados em Escherichia coli e Pseudomonas putida (Andersen J.B. et al., Apll.
Environ.
Microbiol., 64:2240-2246 (1998)), podem ser mencionados e, um contendo serina, alanina-serina-valina (ASV) e semelhantes pode ser mencionado.
Além disso, a base de dados de “ImRNA tag peptide” [peptídeo tag adicionado por tmRNA] (por exemplo, tmRDB, http://www .ag.auburn.edu/mirror/tmRDB/peptide/peptidephylolist.html) e semelhantes pode ser referida para a etiqueta de proteólise contendo estes três resíduos de aminoácidos.
Especificamente, podem ser mencionados de modo não limitante YAASV (SEQ ID NO: 324), YALAA (SEQ ID NO: 325), ANDENYALAA (SEQ ID NO: 181) e AANDENYALAA (SEQ ID NO: 182) como tmRNA tag peptides de Escherichia coli, GKQNNLSLAA (SEQ ID NO: 183), GKSNNNFALAA (SEQ ID NO: 184), GKENNNFALAA (SEQ ID NO: 185), GKTNSFNQNVALAA (SEQ ID NO: 186), GKSNQNLALAA (SEQ ID NO: 187) e GKQNYALAA (SEQ ID NO: 188) conhecidos como tmRNA tag peptides [peptídeos fag adicionados por tmRNA] de gênero Bacillus, ANDDNYALAA (SEQ ID NO: 189), ANDDQYGAALAA (SEQ ID NO: 190), ANDENYGQEFALAA (SEQ ID NO: 191), ANDETYGDYALAA (SEQ ID NO: 192), ANDETYGEYALAA (SEQ ID NO: 193), ANDETYGEETYALAA (SEQ ID NO: 194), ANDENYGAEYKLAA (SEQ ID NO: 195) e ANDENYGAQLAA (SEQ ID NO: 196) conhecidos como tmRNA tag peptides de gênero Pseudomonas, AKNTNSYALAA (SEQ ID NO: 197), AKNTNSYAVAA (SEQ ID NO: 198), AKNNTTYALAA (SEQ ID NO: 199), AKNTNTYALAA (SEQ ID NO: 200) e AKNNTSYALAA (SEQ ID NO: 201) conhecidos como tmRNA tag peptides de gênero Streptococcus e semelhantes.
A etiqueta de proteólise tipicamente consiste em 3 a 15 resíduos de aminoácidos, mas não é limitada a esta faixa. Em uma modalidade, a etiqueta de proteólise consiste em 3 a 5 resíduos de aminoácidos. Aquelas pessoas comumente versadas na técnica podem apropriadamente selecionar a etiqueta de proteólise de acordo com o tipo de bactéria hospedeira. No presente relatório descritivo, a não ser que seja especificado de outra maneira, a letra maiúscula do alfabeto indica o código de uma letra para o aminoácido, e a sequência de aminoácidos é indicada da esquerda para a direita, da terminação-N para a terminação-C.
[0029] Na presente invenção, o “complexo para edição de genoma” significa um complexo molecular tendo atividade de alteração de ácido nucleico ou atividade de regulação de expressão e munido com um reconhecimento de sequência de nucleotídeos específica, que inclui o complexo supracitado ao qual estão ligados um módulo reconhecedor de sequência de ácido nucleico e uma etiqueta de proteólise. O “complexo de enzima alteradora de ácido nucleico” significa um complexo molecular tendo uma atividade de alteração de ácido e munido com uma capacidade de reconhecimento de sequência de nucleotídeos específica, que inclui o complexo supramencionado ao qual estão ligados um módulo reconhecedor de sequência de ácido nucleico, uma enzima alteradora de ácido nucleico, e uma etiqueta de proteólise. O complexo pode estar ligado com um inibidor de reparo por excisão de base. O “complexo” aqui abrange não apenas um constituído de moléculas plurais mas também um tendo, em uma molécula única, uma molécula constituindo o complexo supramencionado da presente invenção como proteínas de fusão. Ademais, um complexo de molécula ou complexo molecular que funciona devido a um módulo reconhecedor de sequência de ácido nucleico e uma enzima alteradora de ácido nucleico em integração como enzima de restrição e sistema CRISPR/Cas, e está ligado com a etiqueta de proteólise é também abrangido no complexo da presente invenção. Além disso, “a codificação de um complexo” abrange tanto codificação de moléculas respectivas constituindo o complexo, quanto codificação de uma proteína de fusão tendo moléculas
19 /67 constituintes em uma molécula única.
[0030] A enzima nucleolítica usada na presente invenção não é particularmente limitada desde que ela catalise a reação supracitada, e, por exemplo, podem ser mencionadas nuclease (por exemplo, proteína efetora Cas (por exemplo, Cas9, Cpf1), endonuclease (por exemplo, enzima de restrição), exonuclease etc.), recombinase, DNA-girase, DNA-topoisomerase, transposase e semelhantes.
[0031] A enzima conversora de base de ácido nucleico a ser usada na presente invenção não é particularmente limitada desde que ela possa catalisar a reação supracitada, e exemplos da mesma incluem desaminase pertencendo à superfamília de ácido nucleico/nucleotídeo-desaminases, que catalisa uma reação de desaminação que converte um grupo amino em um grupo carbonila. Exemplos preferíveis da mesma incluem citidina-desaminase capaz de converter citosina ou 5-metilcitosina em uracila ou timina, respectivamente, adenosina-desaminase capaz de converter adenina em hipoxantina, guanosina-desaminase capaz de converter guanina em xantina e semelhantes. Como citidina-desaminase, mais preferida é citidina-desaminase induzida por ativação (doravante a ser também chamada de AID, Activation-Induced cytidine Deaminase) que é uma enzima que introduz uma mutação em um gene de imunoglobulina na imunidade adquirida de vertebrados ou semelhantes.
[0032] Embora a derivação de enzima conversora de base de ácido nucleico não seja particularmente limitada, por exemplo, pode ser usada PRCDAI1 (Petromyzon marinus Cytosine DeAminase 1, citosina-desaminase 1 de Petromyzon marinus) derivada de Petromyzon marinus, ou AID (citidina- desaminase induzida por ativação, Activation-Induced Cytidine DeAminase; AICDA) derivada de mamífero (por exemplo, humano, suíno, bovino, cavalo, macaco etc.). Por exemplo, números de acesso ao GenBank de EF094822 e ABOI1IS5149 podem ser referidos para a sequência de bases e a sequência de aminoácidos de cDNA de PmCDAI, números de acesso ao GenBank de NM 020661 e NP 065712 podem ser referidos para a sequência de bases e a
/67 sequência de aminoácidos de cDNA de AID humana. A partir do aspecto de atividade de enzima, PMCDA 1 é preferida.
[0033] A DNA-glicosilase a ser usada na presente invenção não é particularmente limitada desde que ela possa catalisar a reação supracitada, e podem ser mencionadas timina-DNA-glicosilase, “oxoguanina-glicosilase, alquiladenina-DNA-glicosilase (por exemplo, 3-metiladenina-DNA-glicosilase de levedura (MAGI) etc.) e semelhantes. O presente inventor previamente relatou que o uso de uma DNA-glicosilase com reatividade suficientemente baixa com DNA tendo uma estrutura de hélice dupla sem distorção (DNA não relaxado) como DNA-eglicosilase pode reduzir a citotoxicidade e eficientemente alterar uma sequência alvo (WO 2016/072399). Portanto, como DNA-glicosilase, é preferivelmente usada uma DNA-glicosilase com reatividade suficientemente baixa com DNA tendo uma estrutura de hélice dupla sem distorção. Exemplos de tal DNA-glicosilase incluem um mutante de UNG tendo atividade de citosina-DNA- glicosilase (CDG) e/ou atividade de timina-DNA-glicosilase (TDG) (uracil-DNA- glicosilase), e mutante de UDG de vírus vaccínia, que são descritos em WO 2016/072399.
[0034] Exemplos específicos do mutante de UNG supracitado incluem mutante duplo N222D/L304A de UNGI de leveduray mutante duplo N222D/R308E de UNGI1 de levedura, mutante duplo N222D/R308C de UNG1 de levedura, mutante duplo YI64A/L304A de UNGI1 de levedura, mutante duplo YI164A/R308E de UNG1 de levedura, mutante duplo Y164A/R308C de UNG1 de levedura, mutante duplo Y164G/L304A de UNGI1 de levedura, mutante duplo Y164G/R308E de UNG1 de levedura, mutante duplo Y164G/R308C de UNG1 de levedura, mutante triplo N222D/YI164A/L304A de UNGI1 de levedura, mutante triplo N2229D/YI6G4A/R308E de UNGI de levedura, mutante triplo N222D/YIG4A/R308C de UNGI de levedura mutante triplo N222D/YIG4G/L304A “de UNGI de levedura mutante triplo N222D/YIGAG/R308E — de UNGI de levedura mutante triplo
N222D/Y164G/R308C de UNG1 de levedura e semelhantes. Quando outra UNG é usada no lugar de UNG1 de levedura, pode ser usado um mutante no qual uma mutação similar tem sido introduzida no aminoácido correspondendo a cada mutante descrito acima. Como mutante de UDG do vírus vaccínia, podem ser mencionados mutante N120D, mutante Y70G, mutante Y70A, mutante duplo N120D/Y70G, mutante duplo N120D/Y70A e semelhantes. Alternativamente, ela pode ser uma DNA-eglicosilase dividida em dois segmentos que é uma enzima dividida desenhada de modo que cada segmento esteja ligado a qualquer um de dois módulos reconhecedores de ácido nucleico divididos para formar dois complexos, o módulo reconhecedor de sequência de ácido nucleico pode especificamente se ligar à sequência de nucleotídeos alvo quando ambos os complexos estão reenovelados, e a DNA-glicosilase pode catalisar uma reação de excisão de base pela ligação específica. A enzima dividida pode ser desenhada e produzida com referência às descrições de, por exemplo, WO 2016/072399, Nat. Biotechnol. 33(2): 139-142 (2015), PNAS 112(10): 2984-2989 (2015).
[0035] Na presente invenção, o “reparo por excisão de base” é um dos mecanismos de reparo de DNA de organismos vivos, e significa um mecanismo para reparo de danos de bases pelo corte de partes danificadas das bases por enzimas e rejunção delas. A excisão de bases danificadas é realizada pela DNA- glicosilase, que é uma enzima que hidrolisa a ligação N-glicosídica de DNA. Um sítio abásico (sítio apurínico/apirimidínico (AP)) resultante da reação abásica pela enzima é tratado por uma enzima a jusante da via de reparo por excisão de base (BER, Base Excision Repair) como uma AP-endonuclease, DNA-polimerase, DNA-ligase e semelhantes. Exemplos de tal gene ou proteína envolvido(a) na via BER incluem, mas não se limitam a, UNG (NM 003362), SMUG1 (NM 014311), MBD4 (NM 003925), TDG (NM 003211), OGG!I (NM 002542), MYH (NM 012222), NTHLI (NM 002528, MPG (NM 002434, NEILI (NM 024608), NEIL2 (NM 145043), NEIL3 (NM 018248, APEI (NM 001641), APE2 (NM. 014481), LIG3 (NM 013975), XRCC1 (NM. 006297),
ADPRT (PARPI) (NM 0016718), ADPRTL2 (PARP2) (NM 005484) e semelhantes (parênteses indicam o número de sequência de referência (refseg) no qual a informação de sequência de bases de cada gene (cCDNA) é registrada).
[0036] Na presente invenção, o “inibidor de reparo por excisão de base” significa uma substância que inibe qualquer estágio da via BER supracitada, ou uma proteína que provavelmente inibe BER pela inibição da expressão de moléculas mobilizadas na via BER. Embora o inibidor de reparo por excisão de base a ser usado na presente invenção não seja particularmente limitado desde que ele consequentemente iniba BER, a partir do aspecto de eficiência, é preferível um inibidor de DNA-glicosilase localizado a montante da via BER. Exemplos do inibidor de DNA-eglicosilase a ser usado na presente invenção incluem, mas não se limitam a, um inibidor de timina-DNA-glicosilase, um inibidor de uracil-DNA- glicosilase, um inibidor de oxoguanina-DNA-glicosilase, um inibidor de alquilguanina-DNA-glicosilase e semelhantes. Por exemplo, quando citidina- desaminase é usada como uma enzima alteradora de ácido nucleico, é adequado usar um inibidor de uracil-DNA-glicosilase para inibir o reparo de malpareamento de U:G ou G:U de DNA gerado por mutação.
[0037] Exemplos de tal inibidor de uracil-DNA-glicosilase incluem, mas não se limitam a, um inibidor de uracil-DNA-glicosilase (Ugi) derivado de bacteriófago de Bacillus subtilis, PBS1, e um inibidor de uracil-DNA-glicosilase (Ugi) derivado de bacteriófago de Bacillus subtilis, PBS2 (Wang, Z., e Mosbaugh, D.W. (1988) J. Bacteriol. 170, 1082-1091). O inibidor supracitado do reparo de malpareamento de DNA pode ser usado na presente invenção. Particularmente, Ugi derivado de PBS2 é também conhecido por ter um efeito de torná-lo difícil para causar mutação, clivagem e recombinação diferentes de T a partir de C em DNA, e dessa forma é adequado o uso de Ugi derivado de PBS2.
[0038] Conforme supracitado, o mecanismo de reparo por excisão de base (BER), quando uma base é excisada por DNA-glicosilase, AP-endonuclease aplica uma nick [uma quebra em uma ligação 5'-3'-fosfodiéster] no sítio abásico (sítio AP),
23 /67 e a exonuclease completamente excisa o sítio AP. Quando o sítio AP é excisado, a DNA-polimerase produz uma nova base pelo uso da base da fita oposta como um molde, e a DNA-ligase finalmente religa a nick para completar o reparo. AP- endonuclease mutante que tem perdido a atividade enzimática mas mantém a capacidade de ligação ao sítio AP é conhecida por completamente inibir o BER. Portanto, estas AP-endonucleases mutantes podem também ser usadas como inibidor de reparo por excisão de base na presente invenção. Embora a derivação da AP-endonuclease mutante não seja particularmente limitada, por exemplo, podem ser usadas AP-endonucleases derivadas de Escherichia coli, levedura, mamífero (por exemplo, humano, camundongo, suíno, bovino, cavalo, macaco etc.) e semelhantes. Por exemplo, UniprotKB nº P27695 pode ser referido para a sequência de aminoácidos de Apel humano. Exemplos de AP-endonuclease mutante que tem perdido a atividade enzimática mas mantém a capacidade de ligação ao sítio AP incluem proteínas tendo sítio de atividade mutado e sítio de ligação ao Mg (cofator) mutado. Por exemplo, E96Q, Y171A, Y171F, YI7IH, D210N, D210A, N212A e semelhantes podem ser mencionados para Apel humano.
[0039] Na presente invenção, o “fator regulatório transcricional” significa uma proteína ou um domínio da mesma que tem uma atividade de promover ou de suprimir a transcrição de gene. A seguir, um tendo uma atividade de promover a transcrição é chamado de um “fator de ativação de transcrição”, e um tendo uma atividade de suprimir a transcrição é algumas vezes chamado de “fator inibitório de transcrição”.
[0040] O fator de ativação de transcrição a ser usado na presente invenção não é particularmente limitado desce que ele possa promover a transcrição do gene alvo e, por exemplo, podem ser mencionados um domínio ativado de VP16 de HSV (Herpes simplex virus, vírus do herpes simples), subunidade p65 de NF«B, VP64, VP160, HSF, P300 e RTA de vírus EB (Epstein-Barr Virus, vírus Epstein- Barr), proteínas de fusão destes e semelhantes. O fator inibitório de transcrição a ser
24 /67 usado na presente invenção não é particularmente limitado desde que ele possa suprimir a transcrição do gene alvo e, por exemplo, podem ser mencionados KRAB, MBD?2B, v-ErbA, SID (incluindo concatâmero SID (SID4X)), MBD2, MBD3, a família DNMT (por exemplo, DNMTI, DNMT3A, DNMT3B), Rb, MeCP2, ROM e AtHD2A, proteínas de fusão destes e semelhantes.
[0041] Uma sequência de nucleotídeos alvo em um DNA de fita dupla a ser reconhecida pelo módulo reconhecedor de sequência de ácido nucleico no complexo da presente invenção não é particularmente limitada desde que o módulo se ligue especificamente a ela, e pode ser qualquer sequência no DNA de fita dupla. O comprimento da sequência de nucleotídeos alvo necessita apenas ser suficiente para a ligação específica do módulo reconhecedor de sequência de ácido nucleico. Por exemplo, quando mutação é introduzida em um sítio específico no DNA genômico de um mamífero, ela é não menor do que 12 nucleotídeos, preferivelmente é não menor do que 15 nucleotídeos, mais preferivelmente é não menor do que 17 nucleotídeos, de acordo com o tamanho do genoma do mesmo. Embora o limite superior do comprimento não seja particularmente limitado, ele é preferivelmente não menor do que 25 nucleotídeos.
[0042] Como o módulo reconhecedor de sequência de ácido nucleico no complexo da presente invenção, podem ser usados um sistema CRISPR-Cas no qual pelo menos uma capacidade de clivagem de DNA da proteína efetora Cas está inativada (doravante também a ser chamado de “CRISPR-Cas-mutante”), motivo dedo de zinco, efetor TAL e motivo PPR e semelhantes, e também um fragmento que contém um domínio de ligação ao DNA de uma proteína que especificamente se liga ao DNA, como enzima de restrição, fator regulatório transcricional, RNA- polimerase e semelhantes, e semelhantes, mas o módulo não se limita aos mesmos. Quando uma enzima alteradora de ácido nucleico é usada, também pode ser usado o sistema CRISPR-Cas no qual um módulo reconhecedor de sequência de ácido nucleico e uma enzima alteradora de ácido nucleico estão integrados (proteína efetora Cas do sistema mantém ambas as atividades da capacidade de clivagem de
DNA). Preferivelmente, podem ser mencionados CRISPR-Cas-mutante, motivo dedo de zinco, efetor TAL, motivo PPR e semelhantes.
[0043] Um motivo dedo de zinco é constituído pela ligação de 3 a 6 diferentes unidades de dedo de zinco do tipo Cys2His2 (1 dedo reconhece cerca de 3 bases), e pode reconhecer uma sequência de nucleotídeos alvo de 9 a 18 bases. Um motivo dedo de zinco pode ser produzido por um método conhecido como método de montagem modular (“Modular Assembly Method”) (Nat. Biotechnol. (2002) 20: 135-141), método OPEN (Mol. Cell (2008) 31: 294-301), método CoDA (Nat. Methods (2011) 8: 67-69), método de um híbrido em Escherichia coli (Escherichia coli one-hybrid method) (Nat. Biotechnol. (2008) 26:695-701) e semelhantes. Pode-se consultar JP-B-4968498 para detalhes da produção do motivo dedo de zinco.
[0044] Um efetor TAL tem uma estrutura de repetição de módulo com cerca de 34 aminoácidos como uma unidade, e os 12º e 13º resíduos de aminoácidos (chamados RVD) de um módulo determinam a estabilidade da ligação e a especificidade para base. Visto que cada módulo é elevadamente independente, o efetor TAL específico para uma sequência de nucleotídeos pode ser produzido simplesmente por conexão ao módulo. Para o efetor TAL, um método de produção utilizando um recurso aberto (método REAL (Curr. Protoc. Mol. Biol. (2012) Chapter 12: Unit 12.15), método FLASH (Nat. Biotechnol. (2012) 30: 460-465), e método Golden Gate (Nucleic Acids Res. (2011) 39: e82) etc.) têm sido comprovados, e um efetor TAL para uma sequência de nucleotídeos alvo pode ser desenhado comparativamente convenientemente. A Publicação Nacional de Pedido de Patente Internacional nº 2013-513389 pode ser consultada para detalhes da produção de um efetor TAL.
[0045] O motivo PPR é constituído de modo que uma sequência de nucleotídeos específica seja reconhecida por uma continuação de motivos PPR cada um consistindo em 35 aminoácidos e reconhecimento de uma base de ácido nucleico, e reconhece uma base alvo apenas por 1, 4 e 1i(-2) aminoácidos de cada
26 /67 motivo. A constituição do motivo não tem dependência, e está isenta de interferência de motivos em ambos os lados. Portanto, como o efetor TAL, uma proteína PPR específica para a sequência de nucleotídeos alvo pode ser produzida simplesmente pela conexão dos motivos PPR. Pode-se consultar JP-A-2013- 128413 para detalhes da produção de um motivo PPR .
[0046] Quando é usado um fragmento de enzima de restrição, de fator regulatório transcricional, de RNA-polimerase e semelhantes, visto que dos domínios de ligação ao DNA destas proteínas são bem conhecidos, um fragmento que contém o domínio e não tem uma capacidade de clivagem de fita dupla de DNA, pode ser facilmente desenhado e construído.
[0047] Quando uma enzima alteradora de ácido nucleico é usada, qualquer um dos módulos reconhecedores de sequência de ácido nucleico supracitados pode ser provido como uma proteína de fusão com a enzima alteradora de ácido nucleico supracitada e/ou um inibidor de reparo por excisão de base, ou um domínio de ligação à proteína como domínio SH3, domínio PDZ, domínio GK, domínio GB e semelhantes e um parceiro de ligação do mesmo podem ser fusionados com um módulo reconhecedor de sequência de ácido nucleico e/ou um inibidor de reparo por excisão de base, respectivamente, e provido como um complexo de proteína via uma interação do domínio e de um parceiro de ligação do mesmo. Alternativamente, um módulo reconhecedor de sequência de ácido nucleico e/ou um inibidor de reparo por excisão de base podem ser cada um fusionados com inteína, e eles podem ser ligados pela ligação após a síntese de proteína. A etiqueta de proteólise pode ser ligada com qualquer uma das moléculas constituintes de um complexo de enzima alteradora de ácido nucleico (módulo reconhecedor de sequência de ácido nucleico, enzima alteradora de ácido nucleico e inibidor de reparo por excisão de base), e pode ser ligada com moléculas constituintes plurais. Também, quando um fator regulatório transcricional é usado, o fator regulatório transcricional pode ser provido como um proteína de fusão com um módulo reconhecedor de sequência de ácido nucleico na mesma maneira como descrita acima, ou pode ser ligado com um módulo de reconhecimento de ácido nucleico via o domínio de ligação à proteína supracitado e um parceiro de ligação do mesmo. Na mesma maneira como descrita acima, a etiqueta de proteólise pode ser ligada como uma proteína de fusão, ou pode ser ligada com um complexo para edição de genoma ou uma molécula constituinte do mesmo via o domínio de ligação à proteína supracitado e um parceiro de ligação do mesmo. A etiqueta de proteólise é preferivelmente ligada com a terminação-C de um complexo para edição de genoma ou uma molécula constituinte do mesmo.
[0048] No ácido nucleico da presente invenção, um módulo reconhecedor de sequência de ácido nucleico, a etiqueta de proteólise, uma enzima alteradora de ácido nucleico e/ou um inibidor de reparo por excisão de base se necessário, ou um fator regulatório transcricional podem ser preparados como um ácido nucleico codificante de uma proteína de fusão do mesmo, ou em uma forma capaz de formar um complexo em uma célula hospedeira após a tradução em uma proteína pela utilização de um domínio de ligação, inteína e semelhantes, ou como um ácido nucleico codificante de cada um deles. O ácido nucleico aqui pode ser um DNA ou um RNA. Quando ele é um DNA, ele é preferivelmente um DNA de fita dupla, e provido na forma de um vetor de expressão posto sob regulação de um promotor funcional em uma célula hospedeira. Quando ele é um RNA, ele é preferivelmente um RNA de fita simples.
[0049] Um DNA codificante de um módulo reconhecedor de sequência de ácido nucleico como motivo dedo de zinco, efetor TAL, motivo PPR e semelhantes pode ser obtido por qualquer método supracitado para cada módulo. Un DNA codificante de um módulo reconhecedor de sequência de enzima de restrição, fator regulatório transcricional, RNA-polimerase e semelhantes pode ser clonado, por exemplo, por síntese de um iniciador oligoDNA que abrange uma região codificante de uma parte desejada da proteína (parte contendo domínio de ligação ao DNA) com base na informação de sequência de cDNA do mesmo, e amplificação pelo método de RT-PCR usando, como um molde, o RNA total ou a
28 /67 fração de mMRNA preparado(a) a partir das células produtoras de proteína.
[0050] Um DNA codificante de uma enzima alteradora de ácido nucleico e um inibidor de reparo por excisão de base podem também ser clonados similarmente pela síntese de um iniciador oligoDNA baseado na informação de sequência de CDNA do mesmo, e amplificação pelo método de RT-PCR usando, como um molde, o RNA total ou a fração de mRNA preparado(a) a partir das células produtoras de proteína. Por exemplo, um DNA codificante de UGI derivada de PBS2 pode ser clonado pelo desenho de iniciadores adequados para a montante e a jusante de CDS baseado na sequência de cDNA (número de acesso JO4434) registrada na base de dados NCBI/GenBank, e clonagem de mRNA derivado de PBS2 pelo método de RT-PCR.
[0051] O DNA clonado pode ser diretamente, ou após digestão com uma enzima de restrição quando desejada, ou após a adição de um linker adequado (por exemplo, linker GS, linker GGGAR etc.), um espaçador (por exemplo, sequência FLAG etc.) e/ou um sinal de localização nuclear (NLS, Nuclear Localization Signal) (cada sinal de transferência de organela quando o DNA de fita dupla de interesse é DNA de mitocôndria ou DNA de cloroplasto), para preparar um DNA codificante de uma proteína de fusão. Além disso, um DNA codificante de uma proteína de fusão pode ser preparado pela ligação com um DNA codificante de um módulo reconhecedor de sequência de ácido nucleico.
[0052] Um DNA codificante do complexo para edição de genoma da presente invenção pode ser obtido por síntese química da fita de DNA, ou por conexão de fitas curtas de oligoDNA sintetizadas parcialmente sobrepostas pela utilização do método de PCR e do método de Montagem de Gibson para construir um DNA codificante do comprimento completo do mesmo. À vantagem de construção de um DNA de comprimento completo por síntese química ou uma combinação de método de PCR ou método de Montagem de Gibson é que o códon a ser usado pode ser desenhado em comprimento completo de CDS de acordo com a hospedeiro para dentro do qual o DNA é introduzido. Na expressão de um DNA
29 /67 heterólogo, é previsto que o nível de expressão de proteína aumenta pela conversão da sequência de DNA da mesma em um códon elevadamente frequentemente usado no organismo hospedeiro. Como os dados de frequência de uso de códons no hospedeiro a ser usado, por exemplo pode ser utilizada a base de dados de frequência de uso de códons revelada na página principal na Internet de “Kazusa DNA Research Institute” (http://www.kazusa.ou.jp/codon/index.html), ou podem ser consultados documentos que mostram a frequência de uso de códons em cada hospedeiro. Como referência aos dados obtidos e à sequência de DNA a ser introduzida, os códons que mostram baixa frequência de uso no hospedeiro dentre aqueles usados para a sequência de DNA podem ser convertidos em um códon que codifica o mesmo aminoácido e que mostra alta frequência de uso.
[0053] Um vetor de expressão contendo um DNA codificante do complexo para edição de genoma da presente invenção pode ser produzido, por exemplo, pela ligação do DNA a jusante de um promotor em um vetor de expressão adequado.
[0054] Como o vetor de expressão, são usados plasmídeos de Escherichia coli (por exemplo, pBR322, pBR325, pUC12, pUC13); plasmídeos de Bacillus subtilis (por exemplo, pUB110, pTP5, pC194); plasmídeos de levedura (por exemplo, pSH19, pSH15); plasmídeos de expressão em célula de inseto (por exemplo, pFast-Bac); plasmídeo de expressão em célula animal (por exemplo, pAIl-11, pXT1, pRe/CMV, pRe/RSV, peDNAI/Neo); bacteriófagos como fago-) e semelhantes; vetores virais de insetos como baculovírus e semelhantes (por exemplo, BMNPV, AcNPV); vetores virais de animais como retrovírus, vírus vaccínia, adenovírus e semelhantes, e semelhantes.
[0055] Como o promotor, qualquer promotor apropriado para um hospedeiro usado para expressão de gene pode ser utilizado. Quando uma enzima nucleolítica é usada como uma enzima alteradora de ácido nucleico, visto que a taxa de sobrevida da célula hospedeira algumas vezes decresce enormemente devido à toxicidade, é desejável aumentar o número de células pelo início da
/67 indução pelo uso de um promotor indutivo. Por outro lado, quando uma enzima conversora de base de ácido nucleico e DNA-glicosilase são usadas como uma enzima alteradora de ácido nucleico, ou quando uma enzima alteradora de ácido nucleico não é usada, visto que proliferação de células suficientes pode também ser alcançada pela expressão do complexo de enzima alteradora de ácido nucleico da presente invenção, um promotor constitutivo podem também ser usado sem limitação.
[0056] Por exemplo, quando o hospedeiro é uma célula de animal, são usados promotor SRa, promotor SV40, promotor LTR, promotor de CMV (citomegalovírus), promotor de RSV (Rous sarcoma virus, vírus do sarcoma de Rous), LTR de MoMuLV (Moloney mouse leukemia virus, vírus da leucemia murina Moloney), promotor HSV-TK (Simple Herpes Virus Thymidine Kinase, timidina-cinase do vírus do herpes simples) e semelhantes. Destes, promotor de CMV, promotor SRa e semelhantes são preferíveis.
[0057] Quando o hospedeiro é Escherichia coli, são preferíveis promotores da série J23 (por exemplo, promotor J23119), promotor trp, promotor lac, promotor recA, promotor AP;, promotor Ipp, promotor T7 e semelhantes.
[0058] Quando o hospedeiro é do gênero Bacillus, são preferíveis promotor SPO1, promotor SPO2, promotor penP e semelhantes.
[0059] Quando o hospedeiro é uma célula de levedura, são preferíveis, o promotor Gall/10, promotor PHOS, promotor PGK, promotor GAP, promotor ADH e semelhantes.
[0060] Quando o hospedeiro é uma célula de inseto, são preferíveis, um promotor de poliedrina, promotor P10 e semelhantes.
[0061] Quando o hospedeiro é uma célula de planta, são preferíveis, promotor CAM V35S, promotor CAMV19S, promotor NOS e semelhantes.
[0062] Como o vetor de expressão, além daqueles mencionados acima, pode ser usado, à medida que se necessite, um contendo um intensificador, um sinal de emenda (splicing), um terminador, um sinal de adição de poli-A, um marcador de seleção como gene de resistência a fármaco, um gene de complementação auxotrófica e semelhantes, uma origem de replicação e semelhantes.
[0063] Um RNA codificante do complexo da presente invenção pode ser preparado, por exemplo, por transcrição para mMRNA com um sistema de transcrição in vitro per se conhecido pelo uso do vetor de expressão supracitado contendo um DNA codificante de cada proteína como um molde.
[0064] A bactéria hospedeira usada para replicação do ácido nucleico da presente invenção não é particularmente limitada desde que ela seja um bactéria tendo um sistema de proteólise que usa tmRNA (ssrA). Por exemplo, são usados gênero Escherichia, gênero Bacillus, gênero Pseudomonas (por exemplo, Pseudomonas putida), gênero Streptococcus (por exemplo, Streptococcus), gênero Streptomyces, gênero Staphylococcus, gênero Yersinia, gênero Acinetobacter, gênero Klebsiella, gênero Bordetella, gênero Lactococcus, gênero Neisseria, gênero Aeromonas, gênero Francisellay gênero Corynebacterium, gênero Citrobacter, gênero Chlamydiae, gênero Haemophilus, gênero Brucella, gênero Mycobacterium, gênero Legionella, gênero Rhodococcus, gênero Pseudomonas, gênero Helicobacter, gênero Salmonella, gênero Staphylococcus, gênero Vibrio, e gênero Erysipelothrix e semelhantes.
[0065] Como o gênero Escherichia, são usadas Escherichia coli K12* DHI [Proc. Natl. Acad. Sci. USA, 60, 160 (1968)], Escherichia coli IMI03 [Nucleic Acids Research, 9, 309 (1981)], Escherichia coli JA221 [Journal of Molecular Biology, 120, 517 / (1978)), Escherichia coli HB1I01 [Journal of Molecular Biology, 41, 459 (1969)], Escherichia coli C600 [Genetics, 39, 440 (1954)], Escherichia coli DH5a, Escherichia coli BW25113 e semelhantes.
[0066] Como o gênero Bacillus, são usadas Bacillus subtilis MI114 [Gene, 24,255 (1983)], Bacillus subtilis 207-21 [Journal of Biochemistry, 95, 87 (1984)] e semelhantes.
[0067] Quando uma enzima conversora de base de ácido nucleico ou DNA-glicosilase é usada como uma enzima alteradora de ácido nucleico, a enzima alteradora de ácido nucleico e/ou um inibidor de reparo por excisão de base são/é provido(s) como um complexo com Cas-mutante por um método similar ao esquema de acoplamento com o dedo de zinco supracitado e semelhantes.
Alternativamente, uma enzima conversora de base de ácido nucleico e/ou um inibidor de reparo por excisão de base, e Cas-mutante podem também ser ligados pela utilização de aptâmeros MS2F6, PP7 de RNA e semelhantes e arcabouço de RNA pela ligação de proteínas ao mesmo.
O RNA guia forma uma fita complementar com a sequência de nucleotídeos alvo, a Cas-mutante é recrutada pelo tracrRNA ligado e a Cas-mutante reconhece o PAM (Protospacer Adjacent Motif, motivo adjacente protoespaçador) da sequência alvo do sítio de clivagem de DNA (quando SpCas9 é usado, PAM tem 3 bases de NGG (N é qualquer base), e teoricamente pode reconhecer qualquer sítio no genoma). Um ou ambos os DNAs não pode(m) ser clivado(s) e, devido à ação da enzima conversora de base de ácido nucleico ou da DNA-glicosilase ligada à Cas-mutante, ocorre a conversão de base de ácido nucleico ou a excisão de base de ácido nucleico no sítio alvo (apropriadamente ajustado dentro de várias centenas de bases incluindo a sequência de nucleotídeos alvo completa ou parcial) e um malpareamento (por exemplo, quando citidina-desaminase como PMCDAI1, AID ou semelhantes é usada como a enzima conversora de base de ácido nucleico, citosina na fita senso ou na fita antissenso no sítio alvo é convertida para uracila para causar malpareamento de U:G ou G:U), ou sítio apurínico/apirimidínico (sítio AP) ocorre no DNA de fita dupla.
Várias mutações são introduzidas devido a um erro no sistema BER da célula que tenta reparar este.
Por exemplo, o malpareamento ou o sítio AP são é corretamente reparado, e quando reparado de modo que uma base da fita oposta forme um par com uma base da fita convertida (T-A ou A-T no exemplo supracitado), ou quando outro nucleotídeo é adicionalmente substituído (por exemplo, UA, G) ou quando uma a numerosas bases são excluídas ou inseridas durante o reparo, várias mutações são introduzidas.
Pelo uso de um inibidor de reparo por excisão de base em combinação, o mecanismo de BER intracelular é
33 /67 inibido, a frequência de reparos errados aumenta, e a eficiência de introdução de mutação pode ser aprimorada.
[0068] Em relação aos motivos dedo de zinco, a produção de muitos motivos dedo de zinco realmente funcionais não é fácil, porque a eficiência de produção de um dedo de zinco que especificamente se liga a uma sequência de nucleotídeos alvo não é alta e a seleção de um dedo de zinco tendo alta especificidade de ligação é complicada. Embora efetores TAL e motivos PPR tenham um alto grau de liberdade de reconhecimento de sequência de ácido nucleico alvo em comparação com os motivos dedo de zinco, permanece um problema na eficiência porque uma proteína grande necessita ser desenhada e construída cada tempo de acordo com a sequência de nucleotídeos alvo.
[0069] Em contraste, visto que o sistema CRISPR-Cas reconhece a sequência de DNA de fita dupla de interesse com um RNA guia complementar à sequência de nucleotídeos alvo, qualquer sequência pode ser reconhecida simplesmente pela síntese de um oligoDNA capaz de especificamente hibridizar com a sequência de nucleotídeos alvo.
[0070] Portanto, em uma modalidade mais preferível da presente invenção, um sistema CRISPR-Cas que mantém ambas as atividades da capacidade de clivagem de DNA, ou um sistema CRISPR-Cas no qual a capacidade de clivagem de DNA de apenas uma da ou ambas da Cas está inativada (CRISPR-Cas-mutante) é usado como um módulo reconhecedor de sequência de ácido nucleico.
[0071] O módulo reconhecedor de sequência de ácido nucleico da presente invenção que usa CRISPR-Cas-mutante é provido como um complexo de um CRISPR-RNA (crRNA) contendo uma sequência complementar à sequência de nucleotídeos alvo e, se necessário, RNA transativador (tracrRNA, trans- activating RNA) necessário para recrutar a proteína efetora Cas-mutante (quando tracrRNA é necessário, possivelmente provido como RNA quimérico com crRNA) e proteína efetora Cas-mutante. Uma molécula de RNA consistindo em apenas crRNA ou um RNA quimérico de crRNA e tracrRNA que constitui um módulo
34 /67 reconhecedor de sequência de ácido nucleico em combinação com uma proteína efetora Cas-mutante é coletivamente chamado de um “RNA guia”. O mesmo também se aplica quando é usado um sistema CRISPR/Cas sem introdução de mutação.
[0072] Embora a proteína efetora Cas a ser usada na presente invenção não seja particularmente limitada desde que ela possa formar um complexo com o RNA guia e reconhecer e se ligar à sequência de nucleotídeos alvo no gene de interesse e a um motivo adjacente protoespaçador (PAM) adjacente à mesma, ela é preferivelmente Cas9 ou Cpfl1. Exemplos de Cas9 incluem, mas não se limitam a, Cas9 derivada de Streptococcus pyogenes (SpCas9; sequência de PAM: NGG (N é A, G, T ou C, doravante o mesmo)), Cas9 derivada de Streptococcus thermophilus (StCas9; sequência de PAM: NNAGAAW), Cas9 derivada de Neisseria meningitidis (NmCas9; sequência de PAM: NNNNGATT) e semelhantes. Preferida é SpCas9 com menos restrição por PAM (substancialmente 2 bases, e teoricamente pode reconhecer qualquer sítio no genoma). Exemplos da Cpfl incluem, mas não se limitam a, Cpfl derivada de Francisella novicida (FnCpfl; sequência de PAM: NTT), Cpfl derivada de Acidaminococcus sp. (AsCpfl; sequência de PAM: NTTT), Cpf1 derivada de bactéria Lachnospiraceae (LECpfl; sequência de PAM: NTTT) e semelhantes. Como uma proteína efetora Cas- mutante (algumas vezes a ser abreviada como Cas-mutante) a ser usada na presente invenção, podem ser usadas qualquer proteína efetora Cas na qual a capacidade de clivagem de ambas as fitas do DNA de fita dupla está inativada e uma que tem atividade de nickase (enzima que quebra ligação 5º-3"-fosfodiéster) na qual pelo menos uma capacidade de clivagem de uma fita apenas está inativada. Por exemplo, no caso de SpCas9, pode ser usada uma mutante DIOA na qual o 10º resíduo Asp está convertido em um resíduo Ala e não possui a capacidade de clivagem de uma fita oposta à fita que forma uma fita complementar com um RNA guia (tendo, por conseguinte, atividade de nickase para uma fita que forma a fita complementar com RNA guia), ou uma mutante H840A na qual o 840º resíduo His está convertido em
/67 um resíduo Ala e não possui a capacidade de clivagem de uma fita que forma uma fita complementar com RNA guia (tendo, por conseguinte, atividade de nickase para uma fita que forma fita complementar com RNA guia, ou uma mutante dupla da mesma (dCas9). No caso de FnCpfl, pode ser usada uma mutante na qual o 917º resíduo Asp está convertido em um resíduo Ala (D917A) ou o 1006º resíduo Glu está convertido em um resíduo Ala (E1006A), e não possui a capacidade de clivagem de ambas as fitas. Desde que pelo menos uma das fitas de DNA de fita dupla não possua capacidade de clivagem, a outra Cas-mutante também pode ser similarmente usada.
[0073] Um DNA codificante de uma proteína efetora Cas (incluindo Cas- mutante, doravante o mesmo) pode ser clonado por um método similar ao método supracitado para um DNA codificante de um inibidor de reparo por excisão de base, a partir de uma célula que produz a enzima. Uma Cas-mutante pode ser obtida pela introdução de uma mutação para converter um resíduo de aminoácido do sítio importante para a atividade de clivagem de DNA (por exemplo, o 10º resíduo Asp e o 840º resíduo His para SpCas9, o 917º resíduo Asp e o 1006º resíduo Glu para FnCpfl e semelhantes, embora não limitado aos mesmos) em outras aminoácidos, em um DNA codificante de Cas clonada, por um método de indução de mutação sítio-específica per se conhecido.
[0074] Alternativamente, um DNA codificante de uma proteína efetora Cas pode também ser construído como um DNA com uso de códons adequado para a expressão em uma célula hospedeira a ser usada, por um método similar àqueles mencionados acima para um DNA codificante de um módulo reconhecedor de sequência de ácido nucleico e um DNA codificante de DNA- glicosilase, e em uma combinação de síntese química ou método de PCR ou método de Montagem de Gibson.
[0075] O obtido DNA codificante de uma proteína efetora Cas, uma enzima alteradora de ácido nucleico, um inibidor de reparo por excisão de base, e/ou um fator regulatório transcricional pode ser inserido a jusante de um promotor
36 /67 de um vetor de expressão similar a um supracitado, de acordo com a célula alvo.
[0076] Por outro lado, um DNA codificante de RNA guia pode ser obtido pelo desenho de uma sequência de oligoDNA que liga uma sequência codificante de sequência de crRNA contendo uma sequência de nucleotídeos complementar à sequência de nucleotídeos alvo (a ser também chamada de “sequência alvo” no presente relatório descritivo) (por exemplo, quando FnCpfl é recrutada como uma proteína efetora Cas, pode ser usado crRNA contendo a SEQ ID NO: 19; AAUUUCUACUGUUGUAGAU no lado-5' da sequência alvo, e as sequências sublinhadas formam pares de bases para formar a estrutura de haste-alça), ou uma sequência codificante de crRNA e, se necessária, uma sequência codificante de tracrRNA conhecida (por exemplo, como sequência codificante de tracrRNA quando Cas é recrutada como proteína Cas9, gttttagagctagaaatagcaagttaaaataagectagtccgttateaacttgaaaaagtggcacegagtegatecttttt ; SEQID NO: 18) e pela síntese química usando um sintetizador de DNA/RNA.
[0077] A “fita alvo” significa aqui uma fita que forma um híbrido com crRNA da sequência de nucleotídeos alvo, e a fita oposta, que se torna de fita simples após a hibridização da fita alvo e crRNA, é chamada de uma “fita não alvo”. Visto que é suposto que uma reação de conversão de base de ácido nucleico em geral frequentemente ocorre em uma fita não alvo de fita simples, quando a sequência de nucleotídeos alvo é para ser expressada por uma das fitas (por exemplo, quando a sequência de PAM é indicada, quando é mostrada relação posicional de sequência de nucleotídeos alvo e PAM etc.), ela é representada por uma sequência da fita não alvo.
[0078] Embora o comprimento da sequência alvo não seja particularmente limitado desde que ela possa especificamente se ligar a uma sequência de nucleotídeos alvo, por exemplo, ela é de 15 a 30 nucleotídeos, preferivelmente de 18 a 25 nucleotídeos. A seleção da sequência de nucleotídeos alvo é restringida pela presença de um PAM adjacente no lado-3' (no caso de Cas9) ou no lado-5* (no caso de Cpf1) da sequência. De acordo com a constatação verificada nos Exemplos mencionados abaixo, no sistema da presente invenção no qual CRISPR-Cas- mutada e citidina-desaminase estão combinadas, existe a regularidade de deslocamentos de C facilmente substituída para a extremidade-S* à medida que a sequência de nucleotídeos alvo torna-se mais longa. Por conseguinte, pela determinação apropriada do comprimento da sequência de nucleotídeos alvo (a sequência alvo como uma fita complementar da mesma), pode ser deslocado o sítio de uma base para dentro do qual uma mutação pode ser introduzida. Como resultado, restrição por PAM (NGG em SpCas9) pode ser removida pelo menos parcialmente, e é previsto que o grau de liberdade de introdução de mutação é ainda mais alto.
[0079] Quando Cas9 é usada como uma proteína efetora Cas, uma sequência alvo pode ser desenhada, por exemplo, usando um sítio da Internet para desenho de RNA guia aberto para o público (“CRISPR Design Tool”, “CRISPRdirect” etc.) pela listagem de sequências de até 20 meros tendo PAM (por exemplo, NGG no caso de SpCas9) adjacente ao lado-3' das sequências CDS do gene de interesse, e seleção de uma sequência que causa uma alteração de aminoácido na proteína codificada pelo gene alvo quando C dentro de 7 nucleotídeos a partir da extremidade 5º do mesmo na direção da extremidade 3º é convertida em T. Uma sequência apropriada pode ser selecionada mesmo quando é usada uma sequência alvo com um comprimento diferente de 20 meros. Uma sequência candidata tendo um número pequeno de sítios alvo diferentes dos previstos no genoma de hospedeiro de interesse pode ser usada como uma sequência alvo. Quando o programa de computador de desenho de RNA guia a ser usado não tem uma função para pesquisar sítios alvo diferentes dos previstos no genoma do hospedeiro, por exemplo os sítios alvo diferentes dos previstos podem ser pesquisados pela aplicação de uma pesquisa por BLAST em comparação com o genoma do hospedeiro, por exemplo, 8 a 12 nucleotídeos no lado-3' da sequência candidata (sequência-semente com alta capacidade de discriminação da sequência de nucleotídeos alvo).
38 /67
[0080] Embora um DNA codificante de RNA guia possa também ser inserido em um vetor de expressão similar a um supracitado. Como o promotor, são preferivelmente usados promotor do sistema pol III (por exemplo, promotor SNR6, SNR52, SCR1, RPR1, U3, U6, HI etc.) e terminador (por exemplo, sequência poli- T (sequência Tç etc.)).
[0081] Um DNA codificante de RNA guia RNA (crRNA ou quimera de CrRNA-tracrRNA) pode ser obtido pelo desenho de uma sequência de oligoRNA que liga uma sequência complementar à fita alvo da sequência de nucleotídeos alvo e uma sequência de tracrRNA conhecida (quando Cas9 é recrutada) ou uma sequência de repetições direta de crRNA (quando Cpfl é recrutada) e pela síntese química usando um sintetizador de DNA/RNA.
2. Método de alteração de sítio alvo de DNA de fita dupla de bactéria hospedeira
[0082] O sítio alvo do DNA de fita dupla do hospedeiro pode ser alterado, ou a expressão de um gene codificado pelo DNA de fita dupla na vizinhança do sítio alvo pode ser regulada pela introdução do complexo e do ácido nucleico da presente invenção descritos em 1. em um hospedeiro, particularmente uma bactéria, e cultura do hospedeiro. Por conseguinte, em outra modalidade, é provido um método para alteração de um sítio alvo de um DNA de fita dupla de uma bactéria, incluindo uma etapa de colocar o complexo de enzima alteradora de ácido nucleico em contato com o DNA de fita dupla da bactéria hospedeira para converter um ou mais nucleotídeos no sítio alvo em outros um ou mais nucleotídeos ou excluir um ou mais nucleotídeos, ou inserir um ou mais nucleotídeos no dito sítio alvo (doravante a ser também chamado de “o método de alteração da presente invenção”). Com o uso de uma enzima conversora de base de ácido nucleico ou de DNA -glicosilase como uma enzima alteradora de ácido nucleico, o sítio alvo pode ser alterado sem clivagem de pelo menos uma das fitas do DNA de fita dupla no sítio alvo. Em ainda outra modalidade, é provido um método que inclui colocar o complexo da presente invenção em contato com um DNA de fita dupla da bactéria hospedeira e regular a transcrição de um gene na vizinhança do sítio alvo.
39 /67
[0083] O complexo da presente invenção é colocado em contato com o DNA de fita dupla pela introdução do complexo ou de um ácido nucleico codificante do mesmo em uma bactéria que tem o DNA de fita dupla desejado (por exemplo, DNA genômico). Considerando-se a eficiência de introdução e expressão, é desejável introduzir o complexo para edição de genoma dentro da bactéria na forma de um ácido nucleico codificante do complexo, ao invés de o próprio complexo, e expressar o complexo na bactéria.
[0084] Exemplos da bactéria usada no método de alteração da presente invenção incluem aquelas similares às bactérias usadas para a replicação de ácido nucleico em 1.
[0085] Um vetor de expressão pode ser introduzido por um método conhecido (por exemplo, método de lisozima, método competente, método de PEG, método de coprecipitação com CaCl,, método de eletroporação, o método de microinjeção, o método de pistola de partículas, método de lipofecção, método de Agrobacterium e semelhantes) de acordo com o tipo da bactéria.
[0086] Escherichia coli pode ser transformada de acordo com os métodos descritos, por exemplo, em Proc. Natl. Acad. Sci. USA, 69, 2110 (1972), Gene, 17, 107 (1982) e semelhantes.
[0087] O gênero Bacillus pode ser introduzido em um vetor de acordo com os métodos descritos, por exemplo, em Molecular & General Genetics, 168, 111 (1979) e semelhantes.
[0088] Uma bactéria introduzida com um vetor pode ser cultivada de acordo com um método conhecido de acordo com o tipo da bactéria.
[0089] Por exemplo, quando Escherichia coli ou gênero Bacillus é cultivada(o), um meio líquido é preferível para ser usado para a cultura. O meio preferivelmente contém uma fonte de carbono, uma fonte de nitrogênio, uma substância inorgânica e semelhantes necessárias para o crescimento do transformante. Exemplos da fonte de carbono incluem glicose, dextrina, amido solúvel, sacarose; exemplos da fonte de nitrogênio incluem substâncias inorgânicas
40 /67 ou orgânicas como sais de amônio, sais de nitrato, soro macerado de milho, peptona, caseína, extrato de carne bovina, torta de soja, extrato de batata e semelhantes; e exemplos da substância inorgânica incluem cloreto de cálcio, di-hidrogenofosfato de sódio, cloreto de magnésio e semelhantes. O meio pode conter extrato de levedo, vitaminas, fator promotor de crescimento e semelhantes. O pH do meio é preferivelmente de cerca de 5 a cerca de 8.
[0090] Como um meio para cultura de Escherichia coli, por exemplo, é preferível o meio M9 contendo glicose, casaminoácido [Journal of Experiments in Molecular Genetics, 431-433, Cold Spring Harbor Laboratory, New York 1972, EUA]. Se necessários, por exemplo, agentes como ácido 3B-indolilacrílico podem ser adicionados ao meio para garantir uma função eficiente de um promotor. Escherichia coli é cultivada em geral a de cerca de 15ºC a cerca de 43ºC. Se necessárias, aeração e agitação podem ser realizadas.
[0091] O gênero Bacillus é cultivado em geral a de cerca de 30ºC a cerca de 40ºC. Se necessárias, aeração e agitação podem ser realizadas.
[0092] Os presentes inventores confirmaram que quando PMCDAI é usada como a enzima alteradora de ácido nucleico, a eficiência de introdução de mutação é aumentada pela cultura de células animais e de células de planta a uma temperatura mais baixa (por exemplo, de 20 a 26ºC, preferivelmente, cerca de 25ºC) do que a temperatura usual. Quando uma bactéria é cultivada, é também preferível cultivá-la à temperatura baixa supracitada.
[0093] Um RNA codificante do complexo da presente invenção pode ser introduzido em uma célula hospedeira pelo método de microinjeção, método de lipofecção e semelhantes. A introdução de RNA pode ser realizada uma vez ou múltiplas vezes repetidas (por exemplo, 2 a 5 vezes) em intervalos adequados.
[0094] Os presentes inventores também confirmaram com o uso de uma levedura de brotamento que quando os módulos reconhecedores de sequência são produzidos correspondendo às múltiplas sequências de nucleotídeos alvo adjacentes, e simultaneamente usados, a eficiência de introdução de mutação aumenta enormemente do que com o uso de uma única sequência de nucleotídeos como um alvo, e efeitos similares podem também ser previstos na bactéria. O efeito pode ocorrer tanto quando as sequências de nucleotídeos estão na mesma direção (fitas alvo são as mesmas), quanto quando elas são opostas (ambas as fitas de DNA de fita dupla são fitas alvo).
[0095] Em uma modalidade preferível, foi demonstrado que a mutação pode ser simultaneamente introduzida em 6 sítios do DNA genômico de uma bactéria pelo método da presente invenção (Figura 10), e a eficiência de introdução de mutação é extremamente alta. Por conseguinte, no método de alteração de sequência genômica, ou no método de regulação de expressão de gene alvo da presente invenção, pode também ser realizada alteração de múltiplas regiões de DNA em posições completamente diferentes como alvos, ou regulação de expressão de genes alvo plurais. Por conseguinte, em uma modalidade preferível da presente invenção, podem ser usados dois ou mais tipos de módulos reconhecedoras de sequência de ácido nucleico que especificamente se ligam às diferentes sequências de nucleotídeos alvo (que, quando o DNA alvo é DNA endógeno de célula, pode estar presente em um gene objeto, ou dois ou mais diferentes genes objeto, e estes genes objeto podem estar presentes no mesmo cromossomo ou plasmídeo, ou cromossomo diferente ou plasmídeo diferente). Neste caso, cada um destes módulos reconhecedores de sequência de ácido nucleico, e uma enzima alteradora de ácido nucleico e/ou um inibidor de reparo por excisão de base, ou um fator regulatório transcricional formam um complexo adicionado com a etiqueta de proteólise. Aqui, podem ser usados uma enzima conversora de base de ácido nucleico comum, um inibidor de reparo por excisão de base comum e um fator regulatório transcricional comum. Por exemplo, quando o sistema CRISPR-Cas é usado como um módulo reconhecedor de sequência de ácido nucleico, é usado um complexo comum (incluindo proteína de fusão) de uma proteína efetora Cas e uma enzima alteradora de ácido nucleico e/ou um inibidor de reparo por excisão de base, ou um fator regulatório transcricional, e dois ou mais tipos de RNAs quiméricos de cada um dos dois ou mais RNAs guia que respectivamente formam uma fita complementar com uma sequência de nucleotídeos alvo diferente, e tracrRNA são produzidos e usados como RNA-guia- tracrRNA. Por outro lado, quando motivo dedo de zinco, efetor TAL e semelhantes são usados como módulos reconhecedores de sequência de ácido nucleico, por exemplo, uma enzima alteradora de ácido nucleico e/ou um inibidor de reparo por excisão de base, ou um fator regulatório transcricional podem ser usados como um módulo reconhecedor de sequência de ácido nucleico que especificamente se liga a um nucleotídeo alvo diferente.
[0096] Para expressar o complexo da presente invenção em uma bactéria hospedeira, conforme mencionado acima, um vetor de expressão que contém um DNA codificante do complexo é introduzido na bactéria hospedeira. Para introdução eficiente de mutação ou regulação eficiente da expressão de um gene alvo, é desejável manter uma expressão do complexo para edição de genoma em um dado nível ou acima durante não menos do que um dado período. A partir de tal ponto de vista, é certo que o vetor de expressão é incorporado no genoma do hospedeiro. Visto que expressão contínua do complexo para edição de genoma aumenta o risco para clivagem de alvo diferente do previsto, ele é preferivelmente imediatamente removido após a realização da introdução de mutação. Exemplos dos meios para remoção de DNA incorporado no genoma do hospedeiro incluem um método que usa um sistema Cre-loxP, um método que usa transposon e semelhantes.
[0097] Alternativamente, a edição de genoma de hospedeiro pode ser eficientemente realizada enquanto se evita o risco para clivagem de alvo diferente do previsto pela causação de uma reação de ácido nucleico em um estágio desejado, e expressão transiente do complexo da presente invenção em uma bactéria hospedeira durante um período necessário para estabilização da alteração do sítio alvo. Embora um período necessário para a reação de alteração de ácido nucleico e a estabilização da alteração do sítio alvo varie dependendo do tipo da bactéria
43 /67 hospedeira, das condições de cultura e semelhantes, cerca de 2 a 3 dias são considerados como necessários porque pelo menos várias gerações de divisão celular são em geral necessárias. Aquelas pessoas comumente versadas na técnica podem apropriadamente determinar um período de indução de expressão preferível com base nas condições de cultura a serem usadas. O período de indução de expressão de um ácido nucleico codificante do complexo da presente invenção pode ser prolongado para além do “período necessário para estabilização da alteração do sítio alvo” supracitado desde que a bactéria hospedeira esteja isenta de efeitos colaterais.
[0098] Como um meio para transientemente expressar o complexo da presente invenção em um estágio desejado durante um período desejado, pode ser mencionado um método que inclui a produção de um construto (vetor de expressão) que contém um DNA codificante do complexo (em sistema CRISPR- Cas-mutante, um DNA codificante de um RNA guia, um DNA codificante de uma proteína efetora Cas, e, conforme a necessidade, um DNA codificante de uma enzima alteradora de ácido nucleico e/ou de um inibidor de reparo por excisão de base, ou de um fator regulatório transcricional) em uma forma que permite a regulação do período de expressão do complexo e a introdução do mesmo na célula hospedeira. A “forma capaz de regular o período de expressão” é especificamente, por exemplo, um ácido nucleico codificante do complexo da presente invenção posto sob regulação de uma região regulatória induzível. Embora a “região regulatória induzível” não seja particularmente limitada, ela é, por exemplo, um operon de um repressor de mutação sensível à temperatura (ts) e um operador regulado pelo mesmo. Exemplos do repressor de mutação ts incluem, mas não se limitam a, mutação ts de repressor cI de fago-A. No caso de repressor cI (ts) de fago-), ele está ligado a um operador para suprimir a expressão de gene a jusante a não maior do que 30ºC (por exemplo, 28ºC). A uma temperatura alta de não menor do que 37ºC (por exemplo, 42ºC), ele é dissociado do operador para permitir a indução de expressão de gene. Por conseguinte, o período quando a expressão do gene alvo é suprimida pode ser minimizado pela cultura de uma bactéria hospedeira introduzida com um ácido nucleico codificante do complexo da presente invenção em geral a não maior do que 30ºC, aumento da temperatura para não menor do que 37ºC em um estágio apropriado, realização da cultura durante um dado período para realizar a reação de conversão de ácido nucleico e, após a introdução de mutação no gene alvo, abaixamento rápido da temperatura para não maior do que 30ºC. Dessa forma, mesmo quando um gene essencial para a célula hospedeira é reconhecido, ele pode ser eficientemente editado enquanto se suprimem os efeitos colaterais.
[0099] Quando a mutação sensível à temperatura é utilizada, por exemplo, uma mutante sensível à temperatura de uma proteína necessária para replicação autônoma de um vetor é incluída em um vetor que contém um DNA codificante do complexo da presente invenção. Como resultado, replicação autônoma torna-se impossível rapidamente após a expressão do complexo, e o vetor naturalmente se desprende durante a divisão celular. Exemplos da proteína mutante sensível à temperatura incluem, mas não se limitam a, uma mutante sensível à temperatura de Rep101 ori necessária para a replicação de pPSC101 ori. Rep101 ori (ts) atua sobre pSCI101 ori para permitir replicação autônoma a não maior do que 30ºC (por exemplo, 28ºC), mas perde função a não menor do que 37ºC (por exemplo, 42ºC), e o plasmídeo não pode se replicar autonomamente. Por conseguinte, um uso combinado com repressor cI (ts) do fago-) supracitado simultaneamente permite a expressão transiente do complexo da presente invenção, e a remoção do plasmídeo.
[00100] Além disso, um DNA codificante do complexo da presente invenção é introduzido em uma bactéria hospedeira sob a regulação de promotor induzível (por exemplo, promotor lac (induzido por IPTG), promotor cspA (induzido por choque frio), promotor araBAD (induzido por arabinose) etc.), a substância indutora é adicionada ao meio (ou removida do meio) em um estágio apropriado para induzir a expressão do complexo, a cultura é realizada durante um dado período para realizar uma reação de alteração de ácido nucleico e, introdução de mutação no gene alvo, descontinuação da indução de expressão, pelos quais a expressão transiente do complexo pode ser realizada.
[00101] A presente invenção é explicada a seguir por referência aos Exemplos, que não devem ser interpretados como limitantes. [Exemplos]
[00102] Nos Exemplos mencionados abaixo, os experimentos foram realizados como segue. <Desenho de cepa, plasmídeo, iniciador e gRNA alvo>
[00103] Foram usadas Escherichia coli DH5a ((F endAl supE4 thi-1 recAl relAl gyrÃ96 deoR phoA 0;P8OdlacZ AMIS AdlacZY A-argF)U169, hsdR17 GK, mK)), 1 (TaKaRa-Bio), BW25113 (lacltº rmBrua AlacZwnshsdR514 AaraBADnar33 ArhaBAD, p78 rph-1 A(araB-D)567 A(rhaD-B)568AlacZ4787(::rmB- 3) hsdR514 rph-1) e ToplO (F-merA A(mrr-hsdRMS-merBC) 680 lacZAMIS AlacX74 nupG recA1 araD139 A(ara-leu)7697 galE15 galK16 rpsL(Str8) endA1 1 ) (Invitrogen. Os plasmídeos e iniciadores usados nos Exemplos são respectivamente mostrados na Tabela 1 e na Tabela 2. Um par de oligoDNA para construção do vetor de gRNA alvo foi desenhado como segue: 5'-tagc-(sequência alvo)-3' e 5'-aaac-(sequência complementar reversa da sequência alvo)-3'. [Tabela 1-1] Plasmídeos usados no Exemplo Alvo editado é mostrado em itálico.
46 /67 Plasmídeos Características Referência Plasmídeos gerais pSC101 Ter, repA 101(Ts), Estoque de laboratório pWYL21 Amp”, Em, vetor de recombinação de B. subtilis codificante de — Wang, 2012 (23) genes de À cl857, À , B, À exo e cre recombinases PTAKN2 Kan', pMB1 ori, vetor de clonagem Estoque de laboratório Plasmídeos Cas/CRISPR pCas9 Cm, pl 5A ori, cas9, tracrRNA, repetição-Bas! espaçador-sepetição — Jiang, 2013 (13) PCRISPR Kan". repetição-Basi espaçador-repotição Jiang, 2013 (13) pScI dCas9-PmCDA! Cm, repA 101(Ts), 2 cI857,dCas9-PmCDAI, Este estudo —J23119-sgRNA J23119- unidade-de-soRNA pSBP307 pScl dCas9-PmCDA1 J23119-galK 9 Este estudo pSBP304 pScl dCas9-PmCDAI 123119-1poB 1 Este estudo pScl Cn, repA 101(Ts), * cI857, Este estudo pScl dCas Cm. repA 101(Ts), à cI857, dCas9 Este estudo pScI dCas9-PmCDAI Cmt. repA 101(Ts). * cI857, dCas9-PmCDAI Este estudo pScI dCas9-PmCDAI-LVA Cr, repA 101(Ts), à cI857, dCas9-PmCDAI-LVA Este estudo pScl dCas9-PmCDAI-UGI-LVA — Cn, repA 101(Ts), 2. cI857, dCas9-PmCDA1-UGI-LVA Este estudo PTAKN2 123119-seRNA Kan', pTAKN2, J23119- unidades-de-soRNA Este estudo pSBPS04 PTAKN2 J23119-galK 10-galK 11-galK 13 Este estudo pSBPS06 PTAKN2 123119-galK 2-x31B I-mand 1 Este estudo pSBP$08 PTAKN2 123119-pra 1-adhE 3pid 2 Este estudo pSBPS060S PTAKN2 123119 Este estudo -galKk 2-xy1B I-manA 1-pta 1-adhE 3-1pid 2 PTAKN-IS1235 PTAKN2 J23119-1S7-IS2-IS3-IS5 Este estudo
[Tabela 1-2] Plasmídeos Características Referência pSBP800] Kan", pTAKN2 123119-galK 1 Fate esmudo pSBP8003 pTAKN2 123119-galK 2 Fsteesmudo pSBP8004 PTAKN2 123119-galKk 3 Este estudo pSBP8005 PTAKN2 J23119-gaiKk 4 Esteestodo pSBP8006 PTAKN2 J123119-galK 5 Este estido pSBP8007 pPTAKN2 J123119-g8a/K 6 Tee ando pSBP8008 PTAKN2 J23119-galK 7 Fste estido pSBP8009 PTAKN2 J123119-galK 8 (20 m] Fate equdo pSBP8010 PTAKN2 J1233119-galK 5 [21 nt] Est esndo pSBP8011 PTAKN2 DI19-.galK 9/20 nm) Este esmo pSBP8012 PTAKN2 123119-galKk 9/21 mt) Tae estado pSBP8013 PTAKN2 J233119-.galK 10 Este estudo pSBP8014 PTAKN2 J233119-galKk 1 [20m] Tste esudo pSBP8O!S PTAKN2 123119-galK 11/23 ni) Fete estudo pSBP8016 PTAKN2 123119-galK 12 Ene emdo pSBP8017 PTAKN2 D3119-galK 13/20 nm) Este ndo pSBPRO0I8 PTAKN2 123119-galK 13[21 nf) Este estudo pSBP8019 PTAKN2 J23119-galK 14 Tste estudo pSBP8025 PTAKN2 123119-gsis[A/Sm] Pete estado pSBP8021 PTAKN2 123119-gstd [420 n1] Fate esxudo pSBP8022 PTAKN2 123119-gsi4 [422 nt) Este estudo pSBP8023 PTAKN2 J233119-gsid [424 m) Eseesodo pSBP8029 PTAKN2 J23119-gsid [BIS nm) FEsteestuto pSBP802? PTAKN2 J23119-gsiA [B20m] Fste estudo PSBP8040 PTAKN2 123119-gsiA [B22 m) Tantado pSBP8042 PTAKN2 123119-gsid [B24 m] Este esudo pSBP8043 PTAKN2 R3119-gsiA [CI8 nm) Este estido pSBP8030 PTAKN2 J23119.gsid [C20 mj Pete exudo pSBP8S045 PTAKN2 123119-gsid [C22 nt] Tae esto pSBP8047 PTAKN2 123119-gsi4 [C24 m] Este estudo pSBP8048 PTAKN2 J23119-chF [18 mn) Fate exudo pSBPS0SO pTAKN2 J23119-ychF [20 nt] Fate estudo pSBP8052 PTAKN2 R3119-pcbF [22 mt] Este estudo pSBP8037 PTAKN2 123119-4fiH [18n1) Este esmão pSBP8035 PTAKN2 J23119-3:fiH [20 m) Este emndo pSBP8056 PTAKN2 123119.7fiH [22 m) Ter emo [Tabela 2-1]
Nome |Sequência (5*-> 3”) SEQ |Propósito
NO p346 |GCTACTCTAGAAAAAAAAACCCCGCCCTGTCAGGGGCGGGGT /20 — |Xbal-rhoTer- TTTTTTTTCGGGGTTTAGCAAGATGGCAGCGC ichmrUnit R p426 |GCCTGATCGATGCATCAGAAAATTATTTITAAATTTCCTCTTGA [21 Clal-upE-P3- ICAGCTAGCTCAGTCCTAGGTATAATGCTAGCAGAGACCCGGG (chmrUnit F2
ATGGTC p597, |GATCCTTTTTGATAATCTCGTCGACATAACAATTGAGCAAGAA |22 — |Sall-eRNArepeat F
TCTTCATCG p598 |CTCACGTTAAGGGATTTTGGTCATCTGCAGTGTATGCGTATTIT |23 |Pstl gRNArepeat
GCGCGCTG R p599 |GAAGATTCTTGCTCAATTGTTATGTCGACGAGATTATCAAAAA |24 —|Sall-pTAKN2-Kan- IGGATCTTCACCTAG down ICAGCGCGCAAATACGCATACACTGCAGATGACCAAAATCCCT [25 = |Pstl-prTAKN2- TAACGTGAG colE1-up |p685. |TCTTTCCCTACACGACGCTCTTCCGATCTCCGCAGAACAGGCA 41 NGSadaptor- GCAGAG galK Fl
49 /67 Ip686 |GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGACAATGGG|42 — |NGSadaptor- CGCATCGAGGG galK R1 Ip687 |TCTTTCCCTACACGACGCTCTTCCGATCTCACACCGACTACAA 43 — |NGSadaptor- CGACGG galK F2 1p688 |GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGCTGCTGCA [44 |NGSadaptor- ATACGGTTCCG galK R2 1p689 |TCTTTCCCTACACGACGCTCTTCCGATCTCTTCGGCGGCGTGG 145 | NGSadaptor- ACATGG galK F3 1p690 |GTGACTGGAGTTCAGACGTGTGCTCTTICCGATCTACGACAGCC/46 |NGSadaptor- ACACCTTTGGGC galK R3 1p691 |TCTTTCCCTACACGACGCTCTTCCGATCTGGCGGTGGAAACGG 47 — |NGSadaptor-gisA. F|
GTACCGTCG 1p692 |GTGACTGGAGTTCAGACGTGTGCTCTICCGATCTCGCCCACCA l48 — |NGSadaptor- GCGATAGCGTT gsiA R 1p693 |TCTTTCCCTACACGACGCTCTTCCGATCTGGCGCTCTTGATTTT 49 — |NGSadaptor- ceces (ycbF. F 1p694 |GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGGATGGCACI|s0 — |[NGSadaptor- GCTGGCAATGC ycbF R 1p695. |TCTTTCCCTACACGACGCTCTTCCGATCTGCCTCCCTGTGCTGT 51 — |NGSadaptor-yfil F
TTTGC |p696 |CTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGCTCAACAC |52 |NGSadaptor- CCACGTTCGCC yin R [Tabela 2-2] Nome |Sequência (5º->3') — |SEQ [Propósi] |Nome |Sequência "->3') — |SEQ |Propósi ID to ID to
NO NO 1631 |GCTCATTATTTGCC |53 |ISI-LF| [716 |CGGAGGAAACAGA 97 182 cecTtTG ATCAGTGTG 1.F 1632 |TGCCGGTTGCCAGA 54 —|ISI-LR] [722 |GAGATGGTGGAGAT/98 152 TAGTC ccretes UR 1683 |GGTCTTICAGGAAAT|55 |IS1-2 F| [717 |GATAGTTAGCGATG 99 1852 CACCG ceeG6 12F 1684 |CGTTCAACCACTTC |56 |I1S1-2 R| 1723 |GGAGAATCCCCAGG|100 |1S2-
50 /67 1639 JCACAAAGCTGTAAA |57 I1S1-3 F| [718 TGAAACGTGCGGGT 101 |IS2- TCAGCG CTCAAC 13 F 1640 |GICAATGCAACACC |58 IS1-3 R| |724— |GGATAGTGGTTAAT 102. |IS2-
CCTTTC GGTGGCGTC BR 1635 |JCETACAACCAGGTCG |59 IS14 F| [1641 |CGTGCTGAGGGCTA [103 |IS3-1 F
AGTCAG TTTACC 1636 |GTYAATCCTGCACCT |60 IS1-4 Rj [1642 |GACGTCATCATITA 104 |IS3-1L R
CCATCAC IGCCAGATG 1628 JGCCAGTAGTACCCG |61 IS1-5 F| [1643 |GGTTCTCAGGTTAA 105 |IS3-2 F
TCGTTG TGTTTCGG 1627 JCACAAGTCGTATTT |62 IS1-5 Rj [16044 |CACCAGATACTACG 106 |IS3-2 R
ICCAGAGG TTACCG 1637 JCETGCAATAAGCAGA |63 IS1-6 F| [16045 |TTICGGACTGAAAGG 107 |IS3-3 F
ACCACC AGCAAG 1638 |TGITGTGCGGTAAG |64 IS1-6 Rj [1646 |AGATTCGTGCTCAC 108 |IS33 R
TGTCTG CTTTCC 1629 JGAGCAATGGATGG |65 IS1-7 F| [1647 |GATTAGTATTGGCG 109 |IS34 F
ATTCGAAG CTGTTGTG 1630 |TGAACAACTGTCCA |66 IS1-7 Rj [1648 |CAGTCCATTTCACC 110 |ISS4 R
TGATTTCG IGTATGAG 703 IGGTACTTTCCGGGC |67 ISI-8 F| [1649 JACAGACGACCAGA 111. |IS3-5 F
AACCG IGTAATGTC 708 ICTGCCATTAGCGCA |68 ISI-8 R| [1650 |TGGTTACGCGCTTT 112 |IS3-5 R
GCCA CATGG 704 — JCATAGCTCTACACG |69 —|IS1-9 F| [1651 |CAGGCTGAACATGG 113. |ISS-1 F
ICCAGG ATAAGAC 709 ATCATGGGCTCCTT |70 IS1-9 R| [1652 JACGTATGGACATCT 114 |ISS-LR
TTAGTTGC AAACATCC 705 IGATATTGCCCGCCG |71 IS1- 1653 |JGCAAGGTTGTGCTT |115 |IS5-2 F GACAC 10 F ICTAAAGG 710 ICGATCTAAAGCGCG |72 IS1- 1654 |CCTGCAATCTAAAG [116 |[IS5-2 R CAGC 10 R IGTAAGGATC 706 IGACGTTGTTGAAAA |73 IS1- 1655 |IGATTGCTGTGGCAG |117 [IS5-3 F TGTAGGGT 1F GTTTAC
711 IGCCTAACGCCTTITA |74 IS1- 1656, JCAGTACAACCTAGT 118 |ISS3 R
ATTCAGG NR TGCACC 707 TGTTGTGGAGCCTG |75 IS1- 1657 |TGAAGATTCCGTGC |119 |ISS4 F AACGG 12 F IGTAACC 712 IGCAACTGTTCCGGC |76 IS1- 1658 |JCACGATGAAACCGT 120 |ISS4 R
AGATG PR CAGTG 1556 |JCGGATTAATGATAA [77 1S2-1 F| [1659 |ATGCTACTGCCGGA 121 |IS5-5 F
GTGGATCAG ACAAC 1563 |JCTTAGTGAATATTT |78 182-1 R TGATGTCAGCGAGA 122 |IS5-5 R
GCCGACG AGATGG 15577 |GCTGATAAGTTACC 79 1S82-2 F| [1661 / |AGCACAGGTCAATA 123 |IS56 F
1564. |JGCGACTATACAGGT |80 1S82-2 Rj [1662 |AATATAGACCCGCA 124 |IS56 R
TATTGACC IGATGATG 1685 JACATTACAGAGAAG|81 182-3 F| [1663 |TCCGCCAGGATTGA 125. |IS5-7 F
CCGATG TTTTCG 1686 |GTGATAGTTAGCGA |82 182-3 Rj [1664 |CTCCGGGTATGGAG 126 |IS5S7 R
TGCCG CTATG 1559 |JGGACGAATAAACG |83 1S24 F| [1665 |GATCAGGACGCTCA 127. |IS5S-8 F
ICATAATTAC TATTCG 1566 |TCCCAACCTTCIGT |84 IS24 R| |1666 |CTGICATGTCGGTT 128 |IS5S-8 R
ICACAG AGTTCC 1560 |CAATTTTCGCACCG |85 182-5 F| [16677 JACAGGATGAAAGTC/|129 |IS5-9 F
GAATC TTTGCC 1567 |ATGGAGATACGACA, 1S82-5 R| [1668 |GCAATTTCCGCTTTT/130 |IS59 R
ATCAGC GCTCG 1561 JCAATTCCTGGAACA [87 — |[IS2-6 F| [1681 |AACTGCTTCTCCTC 131 |IS5- TTATCCG ACCATC 10 F 1568 |TGAGTGATGTTTTG 1S82-6 R| [1682 |J|AGAATCGTCTGGCG 132 |IS5- GCGAC GTTG 10 R 1562 |CETGTACTCACAGGG 1S82-7 F| [1671 |JCATCAGAATCAATG 133 |IS5-
TGATG CTGCG UF 1569 |JGGCAGACAGTTTGA |90 1S82-7 R| [1672 ITCGCTGACTTCAGT [134 |IS5-
713 |CGCCACGAACGTAG|91 [1852-8 F| [1673 |GCCTGCCAGATGAT (135 |IS5- meo | fee de 719 — |GATTGGTGAACACA|92 1828 R| 1674 |ACCAGACCGTGGTT |136 |IS5- Pee me fe 714 — |GGTCAGGTGGTTTG [93 [1852-9 F| 1725 — |TITGTITATCCAGCC |137 |IS5- eo | ferem | fo | 720 — |AAGTGGACACGCTA|94 |182-9 R| |728 — |TTCCTGTATACCTG |138 |IS5- Cien | fase | fo | 715 |CACTCAACACATAC 95 [182- 726 |CACGCACATACAAC |139 |1S5- eo fue || ls fo | 721 |CAACACCAAACTGG|96 [182 729 — |TIGACTGTGCGCAA |140 |1S5- Cmt fu [fe fa 727 — |CCTATTCCGCCCAT |141 |1S5- | CET 1730 — |CAMAGGTCCAGGCT 142 |1S5- LL pj ESSE) <Construção de plasmídeos>
[00104] Plasmídeos pCas9 e pCRISPR foram obtidos junto ao Laboratório Marraffini (Literatura de não patente 8) via Addgene. Nickase Cas9:nCas9 (DIOA ou H840A) e nuclease-deficiente-Cas9:dCas9 (DIOA e H840A) (SEQ ID NO: 1 e 2) (Jinek, M. et al., Science 337, 816-822 (2012).) foram produzidas pelo método de PCR. PMCDAI1 (SEQ ID NO: 3 e 4) foi fusionada na terminação-C de CnCas9 ou dCas9 com linkers peptídicos de 121 aminoácidos (SEQ ID NO: 5 e 6) (Figura D.
[00105] Um plasmídeo pScI dCas9-PmMCDAI J23119-seRNA transporta a unidade de seRNA (SEQ ID NO: 15) conduzido pelo promotor constitutivo sintético J23119 (BBa J23119 no registro para partes biológicas padrão) (http://parts.igem.org/Part:BBa J23119) (SEQ ID NO: 16) amplificado por PCR usando p346/p426. A unidade de expressão de seRNA contém dois sítios de restrição Bsal para inserção de sequência alvo. Um par de oligoDNA que contém a sequência de sgeRNA alvo foi anelado e ligado em pScI. dCas9-PmMCDA1I. seRNA digerido com Basl.
53 /67
[00106] pScI e pScI. dCas9 estão transportando apenas o operador À e o operador-dCas9, respectivamente. pScI dCas9-PmCDA1 está transportando o gene dCas9-PmCDAI. A etiqueta de degradação (etiqueta LVA) e o gene UGI são adicionados à terminação-C do gene dCas9-PmCDAI, resultando nos plasmídeos pScI dCas9-PmCDAI-LVA e pScI. dCas9-PmMCDA1I-UGI-LVA, respectivamente.
[00107] O vetor plasmidial pTAKN-2 tem origem pMB1 compatível com pSCI101. A unidade de seRNA com o promotor J23119 foi digerida a partir de oligonucleotídeo sintético com EcoRI-HindIII, seguido pela ligação ao vetor de clonagem prTAKN2. Os plasmídeos hospedando três sequências alvo em tandem (PpSBP804, galK 10-galK 11-gal 133 pSBP806, galK 2-xylB I-manA 1; PSBP808, pta 1-adhE 3-tpiA 2) foram construídos usando a montagem Golden Gate do produto de PCR usando digestão com Bsal e ligação (Engler, C. et al., PLoS One 4, (2009)). O plasmídeo hospedando seis diferentes sequências alvo (pSBP80608) foi construído usando a Montagem de Gibson dos produtos de PCR amplificados a partir de pPSBP808 (pta 1-adhE 3-tpiÃA 2 sequências em tandem) pelos iniciadores p597/598 e a partir de pPSBP806 (vetor e galK 2-xylB I1-manA 1 sequência em tandem) pelos iniciadores p599/p600. Para o plasmídeo de edição de IS, as unidades expressando seRNA foram alinhadas em tandem na ordem de IS1, 182,1S83 e IS5.
<Ensaio de mutagênese>
[00108] Células DH5a ou BW25113 quimicamente transformadas com plasmídeo(s) objetivo(s) foram pré-cultivadas com 1 mL de meio SOC (2% de Triptona Bacto, 0,5% de Extrato de Levedo, 10 mM de NaCl, 2,5 mM de KCl, 1 mM de MgSO, e 20 mM de glicose). Após a incubação durante 2 a 3h a 28ºC, as culturas de células foram diluídas 1:10 para dentro de 1 mL de caldo de Luria- Bertani (LB) ou caldo terrífico (TB, Terrific Broth), suplementado com os seguintes anticorpos conforme a necessidade: cloranfenicol (25 ug/mL) e/ou canamicina (30 ug/mL), e crescidas de um dia para o outro a 28ºC em 100K rpm usando um misturador Maximizer (TAITEC, Saitama, Japão). No dia seguinte, as
54 /67 culturas de células foram diluídas 1:10 para dentro de 1 mL de meio de novo e cultivadas durante 6h a 37ºC para indução, seguida por incubação de um dia para o outro a 28ºC. As culturas de células foram então aplicadas como manchas em diluição serial sobre placas de ágar LB ou TB suplementadas com antibióticos apropriados, incubadas de um dia para o outro a 28ºC para formar colônias individuais.
[00109] Para seleção positiva para disrupção de gene galK, as células foram crescidas em meio mínimo M63 (2 g/L de (NH,)2SO,, 13,6 g/L de KH;PO,, 0,5 mg/L de FeSO,4-7H,O, 1 mM de MgSO;, 0,1 mM de CaCl; e 10 ug/mL de tiamina) contendo 0,2% de glicerol e 0,2% de 2-desoxi-galctose (2-DOG) (Warming, S. et al., Nucleic Acids Res. 33, 1-12 (2005)). Para seleção para mutação de resistência à rifampicina do gene rpoB, as células foram crescidas em caldo LB contendo 50 ugmL de rifampicina. Para a análise de sequenciamento, as colônias foram aleatoriamente coletadas e diretamente amplificadas usando iniciadores apropriados por PCR e foram analisadas por sequenciamento de Sanger usando um “3130XL Genetic Analyzer” (Applied Biosystems). A análise estatística de teste-t foi realizada usando o programa de computador Excel (Microsoft). <Sequenciamento de genoma inteiro>
[00110] Células BW25113 hospedando cada construto de expressão (dCas9, dCas9-PmCDA1, dCas9-PmMCDAI-LVA-UGI e dCas9-PmMCDAI com alvo rpoB 1) foram pré-incubadas de um dia para o outro, diluídas 1:10 para dentro de ImL de meio LB e crescidas durante 6h a 37ºC para indução, seguido por incubação de um dia para o outro a 28ºC. As células foram espalhadas sobre meio de placa contendo rifampicina para isolar colônias individuais. Cada uma de três colônias independentes foram inoculadas para dentro do meio TB. DNA genômico foi extraído usando o kit “Wizard Genomic DNA Purification Kit” (Promega) e então fragmentado por sonicação usando sistema de sonicação “Bioruptor UCD- 200 TS Sonication System” (Diagenote) para obter fragmentos com distribuição de tamanho de 500-1.000 pb. Biblioteca de DNA genômico foi preparada usando o kit
“NEBNext Ultra DNA Library Prep Kit for Ilumina” (New England Biolabs) e rotulados por iniciadores “Dual Index Primers”. A seleção de tamanho da biblioteca foi realizada usando “Agencourt AMPure XP” (Beckman Coulter) para obter fragmentos alvo com comprimento na faixa de 600 a 800 pb.
A distribuição de tamanho foi avaliada pelo sistema “Agilent 2100 Bioanalyzer' (Agilent Technologies). O DNA foi quantificado usando o kit “Qubit HS dsDNA HS Assay Kit' e o fluorômetro “Qubit Fluorometer” (Thermo Fisher Scientific). O sequenciamento foi realizado usando o sistema de sequenciamento “MiSeg” (Ulumina) e o kit “MiSeq Reagent Kit v3” para obter comprimento de read (sequência gerada pelo sequenciamento) de 2x300 pb, prevendo cobertura de aproximadamente 20 vezes o tamanho do genoma.
A análise dos dados foi realizada usando o “CLC Genomic Workbench 9.0.” (CLC Bio). As reads (sequências geradas pelo sequenciamento) de sequência foram pareadas e as reads sobrepostas dentro de um par de reads foram unidas então foram trimadas com base em um limite de qualidade de 0,01 com um máximo de 2 ambiguidades.
As reads foram mapeadas em relação ao genoma de referência de Escherichia coli BW25113 pelo seguinte ajuste (Masking mode (Modo de mascaragem) = sem mascaragem, Mismatch cost (Custo de malpareamento) = 2, Insertion cost (Custo de inserção) = 3, Deletion cost (Custo de deleção) = 3, Length fraction (Fração de comprimento) = 0,5, Similarity fraction (Fração de similaridade) = 0,8, Global alignment (Alinhamento global) = Não, Auto-detect paired distances (Autodetectar distâncias pareadas) = Sim, Nonspecific match handling (Manipulação de igualdade não específica) = ignorar). O realinhamento local foi realizado com ajustes padrão (Realign unaligned ends (Realinhar extremidades não alinhadas) = Sim, Multi-pass realignment (Realinhamento por multipassagem) = 2). A chamada de variante foi realizada com os seguintes ajustes (Ignore positions with coverage (Ignorar posições com cobertura) = 1.000.000, Ignore broken pairs (Ignorar pares quebrados) = Sim, Ignore Nonspecific matches (Ignorar igualdades não específicas) = Reads, Minimum coverage (Cobertura mínima) = 5, Minimum count (Contagem
56 /67 mínima) = 2, Minimum frequency (Frequência mínima) = 50%, Base quality filter (Filtro de qualidade de base) = Não, Read detection filter (Filtro de detecção de Read) = Não, Relative read direction filter (Filtro de direção de read relativa) = Sim, Significance (Significância) = 1%, Read position filter (Filtro de posição de read) = Não, Remove pyro-error variants (Remover pyro-error variants (variantes de erro em pirossequenciamento)) = Não). O arquivo de saída foi organizado usando Excel (Microsoft). <Sequenciamento profundo de regiões alvo>
[00111] Células DH5a — expressaram — dCas9-PmMCDAI ou dCas9- PmCDAI1-UGI-LVA com gRNA reconhecedor de genes galK, gsiA, ycbF ou yfiH foram incubadas de um dia para o outro, diluídas 1:10 para dentro de ImL de meio LB e crescidas durante 6h a 37ºC para indução. As culturas de células foram coletadas e o DNA genômico foi extraído. O fragmento contendo a região alvo (-0,3 kb) foi diretamente amplificado usando pares de iniciadores (p685-p696) a partir do DNA genômico extraído. O amplicon foi rotulado com iniciadores “Dual Index Primers”. Mais do que 30,000reads por amostra, em média, foram analisadas pelo sistema de sequenciamento “MiSeq”. As reads de sequência foram pareadas e trimadas com base em um limite de qualidade de 0,01 com um máximo de 2 ambiguidades e então as reads sobrepostas dentro de um par de reads foram unidas. As reads foram mapeadas para cada sequência de referência pelos seguintes ajustes (Masking mode (Modo de mascaragem = sem mascaragem, Mismatch cost (Custo de malpareamento) = 2, Insertion cost (Custo de inserção) = 3, Deletion cost (Custo de deleção) = 3, Length fraction (Fração de comprimento) = 0,5, Similarity fraction (Fração de similaridade) = 0,8, Global alignment (Alinhamento global) = Não, Auto-detect paired distances (Autodetectar distâncias pareadas) = Sim, Nonspecific match handling (Manipulação de igualdade não específica) = Mapear aleatoriamente). O arquivo de saída foi organizado usando Excel. Exemplo 1: Mutagênese de alvo mediada por desaminase em Escherichia coli
[00112] Para avaliar se a mutagênese de alvo mediada por desaminase é aplicável em bactérias, foi construído um vetor Target-AID bacteriano que expressa Cas9 cataliticamente inativada (dCas: mutações DIOA e H840A) fusionada na citosina-desaminase PMCDAI1 de P. marinus (lampreia-marinha) (Literatura de não patente 11) (CDA) sob o sistema operador à induzível por temperatura (Wang, Y. et al., Nucleic Acids Res. 40, (2012)) e híbrido de arcabouço de gRNA- sequência alvo de 20 nucleotídeos (nt) (sgsRNA) sob um promotor constitutivo sintético J23119 (Figura 1b). Embora nickase Cas9 (nCas: uma mutação DIOA) em combinação com a desaminase possa ser usada em eucariotos para alcançar eficiência mutacional mais alta (Literatura de não patentes 10, 11), o plasmídeo que expressa nCas(DIOA)-CDA mostrou eficiência de transformação insatisfatória, sugerindo que ele causa grave crescimento celular e/ou morte celular em Escherichia coli, similarmente à nuclease completa Cas9 (Figura 2). Por outro lado, nCas (H840)-CDA mostrou eficiência de transformação tão alta quanto dCas e dCas-CDA, e foi desvantajosa para proliferação celular e sobrevida celular.
[00113] Para avaliar quantitativamente a eficácia de mutagênese alvo, o gene galK foi usado como um alvo cuja perda de função pode ser positivamente selecionada por um análogo de galactose 2-desoxi-D-galactose (2-DOG), que é catalisada pelo produto do gene galK galactocinase para formar um composto tóxico (Warming, S. et al., Nucleic Acids Res. 33, 1-12 (2005)). Como Target-AID é conhecido por induzir mutações em nucleotídeos de citocina (C) localizados a cerca de 15 a 20 bases com a região central de 16 a 19 bases a montante da sequência de motivo adjacente protoespaçador (PAM) (Literatura de não patente 11) (Figura 1(9)). A sequência alvo foi selecionada no gene galK para introduzir um códon de terminação (Figura 3) e induziu viabilidade de quase 100% contra 2- DOG, sugerindo mutagênese elevadamente eficiente (Figura 4(a)). Seis de oito colônias foram mutadas conforme previsto quando a análise de sequenciamento foi realizada nas células do meio não seletivo para 2-DOG. As substituições de C para T foram observadas nas posições -17 e/ou -20 conforme previsto.
[00114] A seguir, foi reconhecido um gene essencial rpoB que codifica a subunidade-B de RNA-polimerase. Embora a interrupção da função do gene de rpoB causaria morte celular ou supressão de crescimento celular, sabe-se que mutações pontuais específicas no gene rpoB conferem resistência à rifampicina (Jin, D.J.etal., J. Mol. Biol. 202, 245-253 (1988)). Uma sequência alvo foi desenhada para induzir uma mutação pontual que confere resistência à rifampicina (Figura5(a)). Com supressão de crescimento não óbvia, as células transformadas ganharam resistência à rifampiícina em frequência de quase 100% (Figura 4(b)). Análise de sequenciamento dos clones selecionados não resistentes à rifampicina confirmou as substituições de C para T nas posições -16 e/ou -17 a partir da sequência de PAM (posições 1545 e 1546 do gene rpo) conforme previsto (Figura 5(a)). O sequenciamento do genoma inteiro foi realizado para avaliar o possível efeito de mutagêneses não específicas do Target-AID em Escherichia coli. Três clones independentes que expressam dCas-CDA e o sgRNA reconhecedor de r1poB 1 foram analisados e foi verificado que contêm zero a duas peculiares variantes de nucleotídeo individuais (SNVs, Single Nucleotide Variants) em posição genômica aparentemente não relacionada (Figura 5(b)). Sequências adjacentes das SNVs detectadas não mostraram nenhuma similaridade com a sequência alvo de rpoB (Figura 5(c)).
Exemplo 2 Efeito do comprimento de seRNA e do inibidor de uracil-DNA- glicosilase sobre as posições e frequência mutacionais
[00115] Para abrangentemente analisar as posição e eficiência mutacionais, análise de sequenciamento profundo foi realizada usando 18 sequências alvo no gene galK (Figura 6, Figura 7). Sete alvos mostraram mutagênese elevadamente eficiente (61,7-95,1%) enquanto que cinco mostraram mutagênese insatisfatória (1,4-9,2%). As posições mutacionais mais efetivas foram a 17-20 bases a montante de PAM, que foi consistente com o estudo prévio em organismos superiores. À frequência de mutação também variou dependendo do comprimento da sequência alvo, conforme reconhecido a partir da eficiência mais alta em galK 8 e galK 13,e mais baixa em galK 9 e galK 11, de sgRNA com sequências alvo mais longas
59 /67 (Figura 6, barras à esquerda).
[00116] Para aprimorar a eficiência mutacional, o inibidor de uracil-DNA- glicosilase (UGT) de bacteriófago PBS2 (Zhigang, W. er al., Gene 99, 31-37 (1991).) e a etiqueta de degradação de proteína (etiqueta(tag)-LVA) (Andersen, J. B. et al., Appl. Environ. Microbiol. 64, 2240-2246 (1998).) foram introduzidos pela fusão na terminação-C de dCas-CDA. UGI reforça a mutagênese pela desaminação de citidina porque ela inibe a remoção de uracila (produto imediato da desaminação de citosina) de DNA (Literaturas de não patente 10, 11). É previsto que o uso da etiqueta(tag)-LVA protege as células da lesão e suprime a ocorrência de células fugitivas pelo decréscimo da meia-vida da proteína dCas-CDA-UGI, que poderia ser potencialmente prejudicial quando expressada em excesso. Para avaliar o efeito de mutagênese não específica, a análise de sequenciamento de genoma inteiro foi realizada nas células que expressam dCas, dCas-CDA e dCas-CDA-UGI-LVA. Embora dCas-CDA induzisse O a 2 mutações em SNV, dCas-CDA-UGI-LVA induziu 21-30 mutações sem viés posicional no genoma inteiro (Tabela 3 e Tabela 4). [Tabela 3] Análise de sequenciamento de genoma inteiro de variante resistente à rifampicina Cepa Clone | Coberturade | — Mutação em rpoB Número de | C:GparaT:A sequência | Posição | Aminoácido | outras SNV = Fe TE TT E 1 34,7 4172764 | SS31F 2 1 dCas-CDA 2 281 4172718 3 205 4172718 | DSI6N o o 1 173 4172737 | S522F PP a dns CDA-DAGF 2 233 4172737 | S522F 30 29 mA 3 24,0 4172863
[00117] Os clones resistentes à rifampicina selecionados que expressam cada um dos construtos (dCas, dCas-CDA ou dCas-CDA-LVA-UGD sem seRNA foram submetidos ao sequenciamento de genoma inteiro. Triplicata biológica foi
60 / 67 mostrada para dCas-CDA e dCas-CDA-LVA-UGI. A cobertura de sequência foi calculada como a soma de pares de bases da sequência mapeada sobre 4.631 Mpb da sequência do genoma de Escherichia coli BW25113. A lista de mutações peculiares é mostrada na Tabela 4. [Tabela 4] Lista de mutações peculiares em SNV O detalhe de SNV detectada pelo sequenciamento de genoma inteiro é mostrado na Tabela 3. . B83372 — roda ce T 3I68ITO — park G à ACas- CDA 1 1371764 = sos IT à 3365636 — mant G A 31518 — corB C T 3374392 — degO Cc T 97137 nmirG C T 3441395 — SOSTRNA G A 290595 —intergênico Cc T dCas-CDA- 3521736 vfF G A 652855 espE Cc T -“UGI-LVA 3787020 vibB G A 689724 — miaB c 7 2 3921738 — fo ce 7 896435 ariM c T 4233085 maliG Cc T 1267335 — intergênico Cc T 4291989 mato Cc T 2054913 nac G A 4357531 aspA c T 2062420 vocA G A 4486193 — intergênico ç T dCas-CDA- |2072468 intergênico G A 124371 intergênico C T -UGI-LVA [2110764 weak G A 268728 O Cc T 2550667 —intergênico C T 701013 nagE Cc T 3322221 — intergênico G A 1094697 vcdx Cc T 3681689 vhiKk G Cc 1253681 ph C T 3692110 besG G A 1356138 puuD Cc T 3983269 hemC Cc T 1513742 eurá G A 4110323 — intergênico G A 1552442 ddpD G A 4335067 dr c T 1771594 dio G A 4480068 idnRk Cc T 1950273 torZ G A 4596191 (RNA-Leu G A 2025444 dom SG A 4596193 (RNA-Len EG A 221782 —mdo G A 800029 EX Cc T 2298519 = intergênico G A 1024591 23S1RNA C T dCas-CDA- [231274 — res G A 1050689 os 6 a “UGI-LVA |/2730338 — intergênico Cc 7 1199523 ma Cc T 3 2769113 il G Fr 1644392 -— dE GA 7 2811281 — intergênico G A 1723279 — inmtergênco | G A 3009344 — of G à : 1728672 — intergênico Cc T 3055007 sepA G A dCas-CDA- 2 61805 , dis G A 3542313 malQ G A “UGFLVA 206332) IS2transposase| GA 3572324 — Air 6 A 2 úçee eRA : 2 38747795 yhhr GA 2505 e 36019 EM ; Bem e | e Geo e | 8 2249454 veil G A , 22 E. 4133803 = fiB cc 7 2261905 vei G A 347276 da c T 2416291 fel a .—- ssa eos Y 4384586 mr € T 2438584 = fed GA ar » 4386604 — omiB c T 2563453 = emJ G A A gs6 1a 2668799 — aphC G A - dos 2957527 —ppdd | G A.
[00118] dCas-CDA-UGI-LVA mostrou mutagênese robusta em todos os sítios alvo independente do comprimento e da posição da sequência alvo (Figura 5,
barras à direita) e permitiu comparação de espectros mutacionais usando diferente comprimento de se RNA. Como resultado, galK 9 e galK 11 mostraram espectros mutacionais estendidos para as extremidades 5º (Figura 6). Para adicionalmente caracterizar o efeito do comprimento de sequência alvo de seRNA, foram testadas sequências ricas em C com comprimentos de 18nt, 20nt, 22nt e 24nt (Figuras 8(a) e (b)). Os espectros mutacionais para cada um dos 5 sítios alvo consistentemente mostraram o deslocamento de pico e a expansão de janela para a extremidade 5º à medida que aumentava o comprimento da sequência alvo (Figura 8(c)).
Exemplo 3 Mutagênese multiplex
[00119] Para edição multiplex, a repetição em tandem de unidades de expressão de seRNA foi montada em um plasmídeo separado do plasmídeo para alteração. Um plasmídeo que reconhece três sítios no gene galK (galK 10, galK 11 e galK 13) foi construído e cointroduzido em células com o vetor para alteração que expressa dCas, dCas-CDA, dCas-CDA-LVA ou dCas-CDA1-UGI- LVA. Primeiro, o efeito de mutagênese não específica foi avaliado pela análise da ocorrência de mutação de resistência à rifampicina (Figura 9). Embora dCas-CDA mostrasse aumento de aproximadamente 10 vezes sobre a frequência mutacional de fundo (background), dCas-CDA-UGI-LVA mostrou outro aumento de 10 vezes sobre a frequência mutacional de dCas-CDA. Contudo, a mutação em um sítio ocorreu em ambos e a taxa de mutação de pelo menos o alvo não mostrou uma diferença significativa entre a presença ou ausência de LVA. Por conseguinte, foi mostrado que mutagênese não específica pode ser suprimida pela adição de LVA, enquanto que se mantém a eficiência de mutação, e dCas-CDA e dCas-CDA-LVA não foram suficientemente eficientes para obter imediatamente mutante triplo, dCas-CDA-UGI-LVA foi bem sucedida em mutagênese tripla em cinco dos oito clones analisados (Figuras 9(b) e (d)), embora a frequência mutacional parecesse mais baixa quando comparada com o resultado de cada alvo individual que produziu 100% (8/8) para cada um dos alvos (Figuras 9(c) e (d)). Por conseguinte, foi mostrado que mutagênese não específica pode ser suprimida por uma
62 /67 combinação de UGI e LVA, enquanto que se alcança alta frequência de mutação.
[00120] Seis genes diferentes: galK, xyIB (xilulocinase), manA (manose-6- fosfato-isomerase), pta (fosfato-acetiltransferase),) adhE (Aldeído-álcool- desidrogenase), e tpiA (Triosefosfato-isomerase) foram, então, selecionados, para introduzir códons de terminação (Figura 10). As células que expressam dCas-CDA- UGI-LVA com seis genes diferentes que reconhecem se RNAs encontrados em sete dos oito clones foram bem-sucedidamente mutadas em todos os loci alvo (Figura 10). Exemplo 4 Edição de gene multicópias por Target-AID
[00121] Os elementos multicópias ocupam uma quantidade substancial da sequência do genoma. Diferente de outros métodos que envolvem recombinação ou clivagens genômicas, Target-AID pode editar imediatamente múltiplos loci usando a mesma sequência de seRNA sem induzir instabilidade genômica. Para uma prova de conceito, os quatro principais elementos transponíveis (Transposable Elements, TEs: IS1I, 2, 3, e 5) no genoma de Escherichia coli foram selecionados simultaneamente pelo uso de quatro seRNAs. Dez, doze, cinco e quatorze loci para IS1, 2, 3, e 5, respectivamente, foram capazes de serem amplificados especificamente pelos iniciadores de PCR peculiares para cada locus. Os sgRNAs foram desenhados para conterem as sequências comuns dos genes de transposase de cada TE para introduzir códons de terminação (Figura 11). Células de Escherichia coli Top10 foram transformadas com dois plassmídeo respectivamente que expressam dCas-CDA-UGI-LVA e os quatro seRNAs alvo. Procedimento de isolamento e verificação para célula com IS-editado é mostrado na Figura 12 e descrito como segue. Após transformação dupla e seleção, as colônias foram amplificadas por PCR e sequenciadas primeiro nos sítios IS5-1, IS5-2, IS5-11, 1S5-
12. Os alvos IS5 revelaram-se menos eficientes. Das quatro colônias analisadas, uma conteve três sítios mutados e um sítio heterogênico (IS5-1). As células foram então suspensas em meio líquido e espalhadas sobre placas para reisolar as colônias. Três das oito colônias continham mutação em IS5-1, duas das quais foram então
63 /67 adicionalmente sequenciadas para o restante dos 24 loci IS, mostrando que uma continha todos os sítios mutados mas um sítio incompleto, heterogênico (IS5-5). As células foram então suspensas e espalhadas para obter quatro de seis clones reisolados que contêm mutação em IS5-5. Um dos clones foi sequenciado nos sítios IS5 e foi verificado que contém um sítio heterogênico (IS5-2). Oito clones foram reisolados e 6 continham mutação em IS5-2. Dois dos clones foram espalhadas sobre meio de não seleção para obter células que perderam plasmídeos. Os genomas das células foram então extraídos e sequenciados para confirmar mutações em todos os sítios IS (Figura 11) e adicionalmente submetidos ao sequenciamento de genoma inteiro para avaliar o amplo efeito de alvo diferente do previsto no genoma. Dentre 34 potenciais sítios alvo diferentes dos previstos do genoma de referência que continham sequências igualadas em 1-8 bases próximas ao PAM, foi verificado que dois sítios foram mutados (Tabela 5). [Tabela 5] Lista de sítios IS candidatos alvo diferentes do previsto avaliados pelo sequenciamento do genoma inteiro. SEQ Frequência (9%) lalpareame; Alvo egião ita Sequência ID PAM jgene Clone to | Clone 2 | NO "
CATCCATATC Is o 143 AGG insA
GGTGGCATC 181 off-l 459398-459420 10 GCCCACGTCA 144 TGG ybbA <0l <ol
A 2084230- GTCCATTAGC 1S1 off.2 6 15 CGG uy 100 100 2084252 ACCACGTCAA Í : TGCAATCGC Í : 2617074- ij Í |
181.0ft3 nn CTTCACGTCA 146 TGG yfeH <0l <ol 2617096 i j i Í | A Í Í
ATAGCGGTA 2965681- 181 off4 10 GGCCACGTCAM7 TGG owsN <ol <o! 2965703
64 / 67
TGGGCGCTG 677105- IS1. off5 1 TTGCACGTCA 148 TGG iiml 0,1 <0l 677127
ACCACCGCG 615816- IS1. off6 TACCACGTCA 149 TGG fecA 1 <ol 615838
AGCCACTCCA 182 i E 150 CGG insDI i CTGGAGACGA i 2664330- GATCTTGTGA
182. off-1 9 151 CGG euQ <01l <ol 2664352 CCGGAGACGA 2797547- CCCGTTTIGC 182 off2 9 152 CGG rel <01l <ol 2797569 CAGGAGACGA 3478902- CATCTCTGCT j
182. off-3 6 153 TGG degS <01 <ol 3478924 CTGGAGACGA i
ACCACGTATA 183 154 CGG insEl
AATTATCTCC 183 off-1 229782-229804 10 155 TGG pepD <01l <ol
GAAGTGTTG 183 off2 297081-297103 9 ATGAGCCGCT 156 AGG ykgE <01l <ol
AAAAGCCGA 183 off.3 828708-828730 9 GGCAGCCGCT1I157 CGG folA <01l <o0l
AACGTTGAA 183 off4 992936-992958 8 GTCAGCCGCT 158 GGG serS <ol <ol
CAGAGCAGG 1031011- 183 off5 10 TTCAGCCGCT 159º CGG mukB <0l <ol 1031033
G 2009292- CATGCCAATA 1S3 off6 7 160 TGG rsml 100 100 2009314 TCAGCCGCTG 2236079- TCTGCTGCTG 1S3 off7 7 161 AGG ak <01 <ol 2236101 CCAGCCGCTG
65 /67
AAGAAGAGA 381447- 1S3 oft8 8 TCAAGCCGCT 162 TGG kml — Ol <O 381469
GACAACAGT A417471- 183 off-9 CTTAGCCGCT 163 GGG Djak 1 <o 417493
AGACATACA DARA639- 183 off-10 9 GCCAGCCGCT 164 TGG mol — <0l <O DABA661
G 2495424- TTACTAAAAA 183 oft-11 1) 166 GGG intergênico <0,1 <01 2495446 AAAGCCGCTG | GTGTAAAAA DA95435- 183 oft-l2 | 9 ACGAGCCGCT 166 GGG intergênico <0,1 <01 2495457 | G
CGCATAGCT 2517513- 183 oft13 . 9 GGAAGCCGCTI67 TGG agt —<0l <Ol 2517535 : Í Í :
G 2629660- AATTAGTGGT 183 oft-ld | 8 168 GG OM << 2629682 GCAGCCGCTG 3232817- TGCTGGTCIT 183 oft15 | 8 169 TGG ess 1 < 3232839 TGAGCCGCTG 3251435- TTCCGGATAG 183 off-16 10 10 CGG hD —<0l <0l 3251457 TTAGCCGCTG 3382350- AGCATATCGT 183 oft17 7 Mm GGG al << 3382372 GCAGCCGCTG 3393244- GGCGGGTTIT 183 oft18 8 12 GGG al << 3393266 TTAGCCGCTG
CGGCTCGCT 4109690- 183 oft-19 10 CGCAGCCGCT173 CGG gM — <0l <Ol 4109712
G 4378317- CTGCGATTCC 183 off-20 10 14 GGG E <0l <0l 4378339 TCAGCCGCTG
ACACGTCGA 4418352- 183 oft-21 10 TATAGCCGCT 175 CGG pin — <0l <Ol 4418374
66 /67
GTGCCACTGA IS5 o 176 TGG insHl
TTGCCTTTCT 1632093- GTACCTGTAT 1S5. off-1 5 17 CGG nl —<0l <0l 1632115 TTGCCTTTCT 3273904- TTATCGGCCT 185 off2 10 178 GGG olC <ol <o! 3273926 GAGCCTTTCT 3775233- CTTAACGTCC
185.0ft3 10 179 CGG kkk — <0l <0l 3775255 GCGCCTTTCT 4553528- CTGACCGATA 185 off-4 7 180 TGG 7 12 <ol 4553550 ATGCCTTTCT
[00122] Região indica os sítios alvo na base de dados DH1OB. Fita indica a orientação dos sítios alvo. Prováveis sequências alvo diferentes do previsto foram determinadas como descrito no presente relatório descritivo. Malpareamento indica número de malpareamentos entre sequências alvo previstas e sequêancias alvo diferentes do previsto. Os nucleotídeos de malpareamento estão realçados em negrito. São mostradas as frequência de mutações de C-para-T em cada sequência realçada em caixa cinza. Exemplo 5 Comparação de eficiência de transformação de Escherichia coli pelo vetor para expressão em levedura
[00123] Vetores para expressão em levedura que codificam LbCpf1 (SEQ ID NO: 326 e 327) como proteína efetora Cas , YAASV ou YALAA como etiqueta de proteólise (vetor 3685:Cpf1-NLS-3xFlag-YAASV (SEQ ID NO: 328), vetor 3687:Cpf1-NLS-3xFlag-YALAA (SEQ ID NO: 329)), e um vetor de controle isento de ácido nucleico que codifica etiqueta de proteólise (vetor 3687:Cpf1-NLS-3xFlag(SEQ ID NO: 330)) foram gerados usando o vetor pRS315 como o vetor basal (background). Com o uso destes vetores, foi verificada a eficiência de transformação de Escherichia coli. O desenho esquemático de cada vetor é mostrado na Figura 13. Conforme mostrado na seguinte Tabela 6, uma solução de DNA contendo cada vetor foi ajustada para 2 ng/uL, 20 uL de células competentes de Escherichia coli Top10 foram transformas pela adição de 1 uL (2 ng) da solução de DNA. Depois, 200 uL de SOC foram adicionados, a mistura foi cultivada para recuperação a 37ºC durante 1 h e repousada sobre gelo durante 5 min para descontinuar a proliferação, e 1 uL de Amp 50 mg/mL foi adicionado. Uma parte do meio de cultura (1 uL ou 10 uL) foi diluída com TE, aplicada sobre placa LB+Amp, cultivada de um dia para o outro a 37ºC e o número de colônias foi contado. Os resultados são mostrados na Tabela 6. [Tabela 6] EEN A 35 retração de pesmdeo (rsi) consente [os TE
[00124] Foi mostrado que a eficiência de transformação de Escherichia coli foi alta quando foram usados o vetor 3685 e o vetor 3686 tendo um ácido nucleico que codifica a etiqueta de proteólise, em comparação com o uso do vetor de controle 3687. Por conseguinte, é previsto que o uso da etiqueta de proteólise aprimora a eficiência de replicação quando se replicam vetores em bactérias como Escherichia coli e semelhantes mesmo se vetor for para expressão em um organismo heterólogo.
[00125] Este pedido é baseado no Pedido de Patente Japonês nº 2017- 225221 depositado no Japão (data de depósito: 22 de Novembro d 2017), cujos conteúdos são aqui incorporados em suas totalidades. [Aplicabilidade Industrial]
[00126] De acordo com a presente invenção, são providos um vetor que é estável e amplificável mesmo em uma bactéria hospedeira e tem toxicidade baixa, e um complexo para edição de genoma que é codificado pelo vetor. De acordo com o método para edição de genoma que usa o ácido nucleico e a enzima alteradora de ácido nucleico da presente invenção, é possível alterar o gene de uma bactéria hospedeira enquanto que suprime mutação não específica e semelhantes. Visto que este método não se baseia em fatores dependentes do hospedeiro como RecA, ele pode ser aplicado em uma ampla variedade de bactérias, e é extremamente útil.
Claims (20)
1. Complexo, caracterizado pelo fato de que compreende um módulo reconhecedor de sequência de ácido nucleico e uma etiqueta de proteólise, sendo que o módulo está ligado à etiqueta de proteólise, o módulo especificamente se liga a uma sequência de nucleotídeos alvo em um DNA de fita dupla, e a etiqueta consiste em (i) um peptídeo contendo 3 resíduos de aminoácidos hidrofóbicos na terminação-C, ou (li) um peptídeo contendo 3 resíduos de aminoácidos na terminação-C sendo que pelo menos uma parte dos resíduos de aminoácidos está substituída por serina.
2. Complexo de acordo com a reivindicação 1, caracterizado pelo fato de que o complexo está adicionalmente ligado a uma enzima alteradora de ácido nucleico, e converte um ou mais nucleotídeos no sítio alvo em outros um ou mais resíduos ou os exclui, ou insere um ou mais nucleotídeos no sítio alvo.
3. Complexo de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de que os 3 resíduos de aminoácidos são leucina-valina-alanina, leucina- alanina-alanina, alanina-alanina-valina ou alanina-serina-valina.
4. Complexo de acordo com qualquer uma das reivindicações 1 a 3, caracterizado pelo fato de que o módulo reconhecedor de sequência de ácido nucleico é um sistema CRISPR-Cas no qual apenas uma das duas capacidades de clivagem de DNA de Cas ou ambas as capacidades de clivagem de DNA estão inativadas.
5. Complexo de acordo com qualquer uma das reivindicações 1 a 3, caracterizado pelo fato de que o complexo é um complexo no qual a etiqueta de proteólise está ligada a um sistema CRISPR-Cas.
6. Complexo de acordo com qualquer uma das reivindicações 2 a 4, caracterizado pelo fato de que a enzima alteradora de ácido nucleico é uma enzima conversora de base de ácido nucleico ou uma DNA-glicosilase.
7. Complexo de acordo com a reivindicação 6, caracterizado pelo fato de que a enzima conversora de base de ácido nucleico é desaminase.
8. Complexo de acordo com a reivindicação 6 ou 7, caracterizado pelo fato de que um inibidor de reparo por excisão de base está adicionalmente ligado ao complexo.
9. Ácido nucleico, caracterizado pelo fato de que codifica o complexo como definido em qualquer uma das reivindicações 1 a 8.
10. Método para alteração de um sítio alvo de um DNA de fita dupla de uma bactéria, ou regulação de uma expressão de um gene codificado por um DNA de fita dupla próximo ao sítio, caracterizado pelo fato de que compreende uma etapa de colocar em contato com o DNA de fita dupla, um complexo compreendendo um módulo reconhecedor de sequência de ácido nucleico que especificamente se liga a uma sequência de nucleotídeos alvo em um DNA de fita dupla selecionado e uma etiqueta de proteólise, sendo que a etiqueta de proteólise consiste em (1) um peptídeo contendo 3 resíduos de aminoácidos hidrofóbicos na terminação-C, ou (1) um peptídeo contendo 3 resíduos de aminoácidos na terminação-C sendo que pelo menos uma parte dos resíduos de aminoácidos está substituída por serina.
11. Método de acordo com a reivindicação 10, caracterizado pelo fato de que compreende uma etapa de converter um ou mais nucleotídeos no sítio alvo em outros um ou mais nucleotídeos ou excluir um ou mais nucleotídeos, ou inserir um ou mais nucleotídeos no dito sítio alvo, sendo que o complexo está adicionalmente ligado com uma enzima alteradora de ácido nucleico.
12. Método de acordo com a reivindicação 10 ou 11, caracterizado pelo fato de que os 3 resíduos de aminoácidos são leucina-valina-alanina, leucina- alanina-alanina, alanina-alanina-valina ou alanina-serina-valina.
13. Método de acordo com qualquer uma das reivindicações 10 a 12, caracterizado pelo fato de que o módulo reconhecedor de sequência de ácido nucleico é um sistema CRISPR-Cas no qual apenas uma das duas capacidades de clivagem de DNA de Cas ou ambas as capacidades de clivagem de DNA estão inativadas.
14. Método de acordo com qualquer uma das reivindicações 10 a 12, caracterizado pelo fato de que o complexo é um complexo no qual a etiqueta de proteólise está ligada a um sistema CRISPR-Cas.
15. Método de acordo com qualquer uma das reivindicações 10 a 14, caracterizado pelo fato de serem usados dois ou mais tipos de módulos reconhecedores de sequência de ácido nucleico cada um especificamente se ligando a uma sequência de ácido nucleico alvo diferente.
16. Método de acordo com a reivindicação 15, caracterizado pelo fato de que a sequência de nucleotídeos alvo diferente está presente em um gene diferente.
17. Método de acordo com qualquer uma das reivindicações 10 a 13, 15 ou 16, caracterizado pelo fato de que a enzima alteradora de ácido nucleico é uma enzima conversora de base de ácido nucleico ou uma DNA-glicosilase.
18. Método de acordo com a reivindicação 17, caracterizado pelo fato de quea enzima conversora de base de ácido nucleico é desaminase.
19. Método de acordo com a reivindicação 17 ou 18, caracterizado pelo fato de que o complexo está adicionalmente ligado a um inibidor de reparo por excisão de base.
20. Método de acordo com qualquer uma das reivindicações 10 a 19, caracterizado pelo fato de que o DNA de fita dupla é colocado em contato com o complexo pela introdução do ácido nucleico codificante do complexo na bactéria tendo o DNA de fita dupla.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017-225221 | 2017-11-22 | ||
JP2017225221 | 2017-11-22 | ||
PCT/JP2018/042915 WO2019103020A1 (ja) | 2017-11-22 | 2018-11-21 | 安定で副作用の少ないゲノム編集用複合体及びそれをコードする核酸 |
Publications (1)
Publication Number | Publication Date |
---|---|
BR112020010036A2 true BR112020010036A2 (pt) | 2020-10-20 |
Family
ID=66632001
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BR112020010036-6A BR112020010036A2 (pt) | 2017-11-22 | 2018-11-21 | complexo, ácido nucleico, e, método para alteração de um sítio alvo de um dna de fita dupla de uma bactéria, ou regulação de uma expressão de um gene codificado por um dna de fita dupla próximo ao sítio. |
Country Status (9)
Country | Link |
---|---|
US (1) | US20210024906A1 (pt) |
EP (1) | EP3715454A4 (pt) |
JP (2) | JP7328695B2 (pt) |
KR (1) | KR102387830B1 (pt) |
CN (1) | CN111615557A (pt) |
BR (1) | BR112020010036A2 (pt) |
CA (1) | CA3082922C (pt) |
SG (1) | SG11202004691WA (pt) |
WO (1) | WO2019103020A1 (pt) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7133856B2 (ja) * | 2017-03-22 | 2022-09-09 | 国立大学法人神戸大学 | 細胞内在性のdna修飾酵素を利用して標的化したdnaの核酸塩基を特異的に変換する、細胞の核酸配列の変換方法、及びそれに用いる分子複合体 |
WO2022095929A1 (en) * | 2020-11-06 | 2022-05-12 | The University Of Hong Kong | Transferable type i-f crispr-cas genome editing system |
CN116555227B (zh) * | 2021-02-03 | 2024-08-06 | 山东舜丰生物科技有限公司 | 新型Cas酶以及应用 |
CN113862274B (zh) * | 2021-09-29 | 2023-10-03 | 燕山大学 | 一种高特异性识别ape1的寡核苷酸适配体apt-d1及其制备方法和应用 |
CN116064429B (zh) * | 2022-08-04 | 2023-11-03 | 四川省畜牧科学研究院 | 一种重组大肠杆菌高效表达漆酶的方法 |
WO2024094084A1 (en) * | 2022-11-01 | 2024-05-10 | Huidagene Therapeutics Co., Ltd. | Iscb polypeptides and uses thereof |
CN117947054B (zh) * | 2024-03-25 | 2024-06-21 | 上海羽冠生物技术有限公司 | 一种百日咳鲍特菌无缝基因编辑的方法 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2003251286B2 (en) | 2002-01-23 | 2007-08-16 | The University Of Utah Research Foundation | Targeted chromosomal mutagenesis using zinc finger nucleases |
JP2013128413A (ja) | 2010-03-11 | 2013-07-04 | Kyushu Univ | Pprモチーフを利用したrna結合性蛋白質の改変方法 |
CN104010660A (zh) | 2011-10-04 | 2014-08-27 | 株式会社Ihi | 金属Salen配位化合物响应性药剂以及金属Salen配位化合物的体内行为控制系统 |
CN111471675A (zh) | 2014-03-05 | 2020-07-31 | 国立大学法人神户大学 | 特异性转变靶向dna序列的核酸碱基的基因组序列的修饰方法、及其使用的分子复合体 |
AU2015324935B2 (en) * | 2014-10-01 | 2021-04-08 | The General Hospital Corporation | Methods for increasing efficiency of nuclease-induced homology-directed repair |
JP6153180B2 (ja) | 2014-11-04 | 2017-06-28 | 国立大学法人神戸大学 | 脱塩基反応により標的化したdna配列に特異的に変異を導入する、ゲノム配列の改変方法、並びにそれに用いる分子複合体 |
CN104531632A (zh) * | 2014-11-18 | 2015-04-22 | 李云英 | 快速降解的Cas9-ODC422-461融合蛋白及其应用 |
US20160362667A1 (en) * | 2015-06-10 | 2016-12-15 | Caribou Biosciences, Inc. | CRISPR-Cas Compositions and Methods |
CN109536474A (zh) * | 2015-06-18 | 2019-03-29 | 布罗德研究所有限公司 | 降低脱靶效应的crispr酶突变 |
JP6909475B2 (ja) | 2016-06-14 | 2021-07-28 | 有限会社メカノトランスフォーマ | アクチュエータおよび伸縮素子のリード線引き出し方法 |
US10465187B2 (en) * | 2017-02-06 | 2019-11-05 | Trustees Of Boston University | Integrated system for programmable DNA methylation |
WO2018226880A1 (en) * | 2017-06-06 | 2018-12-13 | Zymergen Inc. | A htp genomic engineering platform for improving escherichia coli |
-
2018
- 2018-11-21 KR KR1020207017695A patent/KR102387830B1/ko active IP Right Grant
- 2018-11-21 EP EP18882051.8A patent/EP3715454A4/en active Pending
- 2018-11-21 SG SG11202004691WA patent/SG11202004691WA/en unknown
- 2018-11-21 BR BR112020010036-6A patent/BR112020010036A2/pt active Search and Examination
- 2018-11-21 CA CA3082922A patent/CA3082922C/en active Active
- 2018-11-21 JP JP2019555327A patent/JP7328695B2/ja active Active
- 2018-11-21 US US16/764,799 patent/US20210024906A1/en active Pending
- 2018-11-21 CN CN201880075854.2A patent/CN111615557A/zh active Pending
- 2018-11-21 WO PCT/JP2018/042915 patent/WO2019103020A1/ja unknown
-
2023
- 2023-07-28 JP JP2023123850A patent/JP2023129709A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
JPWO2019103020A1 (ja) | 2021-01-21 |
WO2019103020A1 (ja) | 2019-05-31 |
EP3715454A1 (en) | 2020-09-30 |
CN111615557A (zh) | 2020-09-01 |
CA3082922A1 (en) | 2019-05-31 |
CA3082922C (en) | 2024-02-13 |
KR20200091884A (ko) | 2020-07-31 |
EP3715454A4 (en) | 2021-08-18 |
SG11202004691WA (en) | 2020-06-29 |
US20210024906A1 (en) | 2021-01-28 |
JP2023129709A (ja) | 2023-09-14 |
JP7328695B2 (ja) | 2023-08-17 |
KR102387830B1 (ko) | 2022-04-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
BR112020010036A2 (pt) | complexo, ácido nucleico, e, método para alteração de um sítio alvo de um dna de fita dupla de uma bactéria, ou regulação de uma expressão de um gene codificado por um dna de fita dupla próximo ao sítio. | |
US11345933B2 (en) | CRISPR enabled multiplexed genome engineering | |
US20200399620A1 (en) | Engineered CRISPR-Cas9 nucleases with Altered PAM Specificity | |
JP7223377B2 (ja) | 熱安定性cas9ヌクレアーゼ | |
JP5934196B2 (ja) | 直接クローニング | |
JP7546689B2 (ja) | クラス2のii型crisprシステム | |
US20200362346A1 (en) | Genome editing using crispr in corynebacterium | |
US20240294948A1 (en) | Endonuclease systems | |
JPWO2017183724A1 (ja) | ゲノム配列改変技術における変異導入効率の向上方法、及びそれに用いる分子複合体 | |
EP4200422A1 (en) | Systems and methods for transposing cargo nucleotide sequences | |
US20230048564A1 (en) | Crispr-associated transposon systems and methods of using same | |
WO2023076952A1 (en) | Enzymes with hepn domains | |
KR20180128864A (ko) | 매칭된 5' 뉴클레오타이드를 포함하는 가이드 rna를 포함하는 유전자 교정용 조성물 및 이를 이용한 유전자 교정 방법 | |
US20240254516A1 (en) | Complex for genome editing having stability and few side-effects, and nucleic acid coding same | |
US20240352433A1 (en) | Enzymes with hepn domains | |
Fregoso Ocampo et al. | DNA targeting by compact Cas9d and its resurrected ancestor |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
B350 | Update of information on the portal [chapter 15.35 patent gazette] | ||
B06W | Patent application suspended after preliminary examination (for patents with searches from other patent authorities) chapter 6.23 patent gazette] | ||
B06A | Patent application procedure suspended [chapter 6.1 patent gazette] |