KR20240020179A - 관심 rna 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 rna 전사시스템, 그리고 이들의 방법 및 생산물 - Google Patents
관심 rna 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 rna 전사시스템, 그리고 이들의 방법 및 생산물 Download PDFInfo
- Publication number
- KR20240020179A KR20240020179A KR1020230078194A KR20230078194A KR20240020179A KR 20240020179 A KR20240020179 A KR 20240020179A KR 1020230078194 A KR1020230078194 A KR 1020230078194A KR 20230078194 A KR20230078194 A KR 20230078194A KR 20240020179 A KR20240020179 A KR 20240020179A
- Authority
- KR
- South Korea
- Prior art keywords
- rna
- cell
- interest
- systems
- cells
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 261
- 239000000126 substance Substances 0.000 title claims abstract description 167
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 137
- 210000004027 cell Anatomy 0.000 title claims description 261
- 238000013518 transcription Methods 0.000 title claims description 181
- 230000035897 transcription Effects 0.000 title claims description 179
- 210000004671 cell-free system Anatomy 0.000 title claims description 168
- 108020004999 messenger RNA Proteins 0.000 claims abstract description 110
- 239000000203 mixture Substances 0.000 claims abstract description 38
- 239000003153 chemical reaction reagent Substances 0.000 claims abstract description 37
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 36
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 35
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 35
- 230000001413 cellular effect Effects 0.000 claims abstract description 22
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims abstract description 19
- 230000014509 gene expression Effects 0.000 claims description 320
- 229920002477 rna polymer Polymers 0.000 claims description 288
- 102000004190 Enzymes Human genes 0.000 claims description 286
- 108090000790 Enzymes Proteins 0.000 claims description 286
- 239000000047 product Substances 0.000 claims description 165
- 108090000623 proteins and genes Proteins 0.000 claims description 154
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 claims description 153
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 claims description 149
- 238000006243 chemical reaction Methods 0.000 claims description 137
- 108020004414 DNA Proteins 0.000 claims description 125
- 230000000694 effects Effects 0.000 claims description 101
- 102000004169 proteins and genes Human genes 0.000 claims description 100
- 235000018102 proteins Nutrition 0.000 claims description 94
- 230000014616 translation Effects 0.000 claims description 79
- 108060004795 Methyltransferase Proteins 0.000 claims description 76
- 238000013519 translation Methods 0.000 claims description 75
- 102000006382 Ribonucleases Human genes 0.000 claims description 73
- 108010083644 Ribonucleases Proteins 0.000 claims description 73
- 125000003729 nucleotide group Chemical group 0.000 claims description 70
- 239000002773 nucleotide Substances 0.000 claims description 56
- 108091092328 cellular RNA Proteins 0.000 claims description 54
- 230000015572 biosynthetic process Effects 0.000 claims description 50
- 230000006819 RNA synthesis Effects 0.000 claims description 47
- 241000710929 Alphavirus Species 0.000 claims description 45
- 241000588724 Escherichia coli Species 0.000 claims description 45
- -1 nucleoside triphosphates Chemical class 0.000 claims description 45
- 238000003786 synthesis reaction Methods 0.000 claims description 44
- 239000003161 ribonuclease inhibitor Substances 0.000 claims description 39
- 101710163270 Nuclease Proteins 0.000 claims description 36
- 108091000080 Phosphotransferase Proteins 0.000 claims description 33
- 102000020233 phosphotransferase Human genes 0.000 claims description 33
- 239000013592 cell lysate Substances 0.000 claims description 31
- 238000004587 chromatography analysis Methods 0.000 claims description 29
- 239000002777 nucleoside Substances 0.000 claims description 29
- 230000002194 synthesizing effect Effects 0.000 claims description 28
- 239000002585 base Substances 0.000 claims description 25
- 238000001243 protein synthesis Methods 0.000 claims description 25
- 229910019142 PO4 Inorganic materials 0.000 claims description 24
- 230000008569 process Effects 0.000 claims description 24
- 239000010452 phosphate Substances 0.000 claims description 23
- 230000002779 inactivation Effects 0.000 claims description 22
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 claims description 22
- 229940024606 amino acid Drugs 0.000 claims description 21
- 235000001014 amino acid Nutrition 0.000 claims description 21
- 150000001413 amino acids Chemical class 0.000 claims description 21
- 239000001226 triphosphate Substances 0.000 claims description 20
- 108700026244 Open Reading Frames Proteins 0.000 claims description 19
- 238000000108 ultra-filtration Methods 0.000 claims description 19
- 101710149004 Nuclease P1 Proteins 0.000 claims description 18
- 235000011180 diphosphates Nutrition 0.000 claims description 18
- 102000040650 (ribonucleotides)n+m Human genes 0.000 claims description 17
- 239000002028 Biomass Substances 0.000 claims description 17
- 210000003705 ribosome Anatomy 0.000 claims description 17
- 108010053770 Deoxyribonucleases Proteins 0.000 claims description 16
- 102000016911 Deoxyribonucleases Human genes 0.000 claims description 16
- 108020004566 Transfer RNA Proteins 0.000 claims description 16
- 230000001419 dependent effect Effects 0.000 claims description 16
- 230000006870 function Effects 0.000 claims description 16
- 101001066878 Homo sapiens Polyribonucleotide nucleotidyltransferase 1, mitochondrial Proteins 0.000 claims description 15
- 102000002681 Polyribonucleotide nucleotidyltransferase Human genes 0.000 claims description 15
- 238000012258 culturing Methods 0.000 claims description 15
- 238000011026 diafiltration Methods 0.000 claims description 15
- 239000001177 diphosphate Substances 0.000 claims description 15
- 241000700605 Viruses Species 0.000 claims description 13
- 239000000386 donor Substances 0.000 claims description 13
- 239000013612 plasmid Substances 0.000 claims description 13
- 235000011178 triphosphate Nutrition 0.000 claims description 13
- 241001515965 unidentified phage Species 0.000 claims description 13
- 108700028939 Amino Acyl-tRNA Synthetases Proteins 0.000 claims description 12
- 102000052866 Amino Acyl-tRNA Synthetases Human genes 0.000 claims description 12
- 230000004570 RNA-binding Effects 0.000 claims description 12
- 108020000161 polyphosphate kinase Proteins 0.000 claims description 12
- 239000012634 fragment Substances 0.000 claims description 11
- RQFCJASXJCIDSX-UUOKFMHZSA-N guanosine 5'-monophosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O RQFCJASXJCIDSX-UUOKFMHZSA-N 0.000 claims description 11
- 230000037353 metabolic pathway Effects 0.000 claims description 11
- 239000013598 vector Substances 0.000 claims description 11
- 229920002554 vinyl polymer Polymers 0.000 claims description 11
- 241000120506 Bluetongue virus Species 0.000 claims description 10
- 229920000388 Polyphosphate Polymers 0.000 claims description 10
- 239000013000 chemical inhibitor Substances 0.000 claims description 10
- 210000003527 eukaryotic cell Anatomy 0.000 claims description 10
- 239000000463 material Substances 0.000 claims description 10
- 239000012528 membrane Substances 0.000 claims description 10
- 239000001205 polyphosphate Substances 0.000 claims description 10
- 235000011176 polyphosphates Nutrition 0.000 claims description 10
- 230000005030 transcription termination Effects 0.000 claims description 10
- 108010032819 exoribonuclease II Proteins 0.000 claims description 9
- 239000000284 extract Substances 0.000 claims description 9
- 238000001914 filtration Methods 0.000 claims description 9
- 108010044843 Peptide Initiation Factors Proteins 0.000 claims description 8
- 102000005877 Peptide Initiation Factors Human genes 0.000 claims description 8
- 108090000638 Ribonuclease R Proteins 0.000 claims description 8
- 230000004927 fusion Effects 0.000 claims description 8
- 230000000415 inactivating effect Effects 0.000 claims description 8
- 239000002994 raw material Substances 0.000 claims description 8
- 238000000926 separation method Methods 0.000 claims description 8
- 235000000346 sugar Nutrition 0.000 claims description 8
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 claims description 8
- 108010057163 Ribonuclease III Proteins 0.000 claims description 7
- 102000003661 Ribonuclease III Human genes 0.000 claims description 7
- 230000007246 mechanism Effects 0.000 claims description 7
- 238000001556 precipitation Methods 0.000 claims description 7
- 239000012264 purified product Substances 0.000 claims description 7
- 230000001105 regulatory effect Effects 0.000 claims description 7
- 108020003589 5' Untranslated Regions Proteins 0.000 claims description 6
- 241000196324 Embryophyta Species 0.000 claims description 6
- 108010006519 Molecular Chaperones Proteins 0.000 claims description 6
- 102000005431 Molecular Chaperones Human genes 0.000 claims description 6
- 238000000354 decomposition reaction Methods 0.000 claims description 6
- 238000000502 dialysis Methods 0.000 claims description 6
- KWGKDLIKAYFUFQ-UHFFFAOYSA-M lithium chloride Chemical compound [Li+].[Cl-] KWGKDLIKAYFUFQ-UHFFFAOYSA-M 0.000 claims description 6
- 230000002934 lysing effect Effects 0.000 claims description 6
- 239000000758 substrate Substances 0.000 claims description 6
- LSNNMFCWUKXFEE-UHFFFAOYSA-M Bisulfite Chemical compound OS([O-])=O LSNNMFCWUKXFEE-UHFFFAOYSA-M 0.000 claims description 5
- 101001112318 Dictyostelium discoideum Nucleoside diphosphate kinase, cytosolic Proteins 0.000 claims description 5
- 101001112320 Dictyostelium discoideum Nucleoside diphosphate kinase, mitochondrial Proteins 0.000 claims description 5
- 101001128731 Homo sapiens Putative nucleoside diphosphate kinase Proteins 0.000 claims description 5
- 102100032116 Putative nucleoside diphosphate kinase Human genes 0.000 claims description 5
- 230000001276 controlling effect Effects 0.000 claims description 5
- IERHLVCPSMICTF-XVFCMESISA-N cytidine 5'-monophosphate Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(O)=O)O1 IERHLVCPSMICTF-XVFCMESISA-N 0.000 claims description 5
- IERHLVCPSMICTF-UHFFFAOYSA-N cytidine monophosphate Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(COP(O)(O)=O)O1 IERHLVCPSMICTF-UHFFFAOYSA-N 0.000 claims description 5
- XPPKVPWEQAFLFU-UHFFFAOYSA-N diphosphoric acid Chemical compound OP(O)(=O)OP(O)(O)=O XPPKVPWEQAFLFU-UHFFFAOYSA-N 0.000 claims description 5
- 108010079502 exoribonuclease T Proteins 0.000 claims description 5
- 230000001939 inductive effect Effects 0.000 claims description 5
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 5
- 102100038740 Activator of RNA decay Human genes 0.000 claims description 4
- 108091026890 Coding region Proteins 0.000 claims description 4
- 102100036755 Glutathione peroxidase 7 Human genes 0.000 claims description 4
- 101710119044 Glutathione peroxidase 7 Proteins 0.000 claims description 4
- 241000238631 Hexapoda Species 0.000 claims description 4
- 101710124239 Poly(A) polymerase Proteins 0.000 claims description 4
- DJJCXFVJDGTHFX-UHFFFAOYSA-N Uridinemonophosphate Natural products OC1C(O)C(COP(O)(O)=O)OC1N1C(=O)NC(=O)C=C1 DJJCXFVJDGTHFX-UHFFFAOYSA-N 0.000 claims description 4
- 241000700618 Vaccinia virus Species 0.000 claims description 4
- 239000012190 activator Substances 0.000 claims description 4
- 239000006227 byproduct Substances 0.000 claims description 4
- 238000006206 glycosylation reaction Methods 0.000 claims description 4
- 229940005740 hexametaphosphate Drugs 0.000 claims description 4
- 235000005772 leucine Nutrition 0.000 claims description 4
- 230000011987 methylation Effects 0.000 claims description 4
- 238000007069 methylation reaction Methods 0.000 claims description 4
- 210000001236 prokaryotic cell Anatomy 0.000 claims description 4
- 108090000589 ribonuclease E Proteins 0.000 claims description 4
- 230000001131 transforming effect Effects 0.000 claims description 4
- DJJCXFVJDGTHFX-XVFCMESISA-N uridine 5'-monophosphate Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1 DJJCXFVJDGTHFX-XVFCMESISA-N 0.000 claims description 4
- 101001072202 Homo sapiens Protein disulfide-isomerase Proteins 0.000 claims description 3
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 claims description 3
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 claims description 3
- 241001465754 Metazoa Species 0.000 claims description 3
- 108091036407 Polyadenylation Proteins 0.000 claims description 3
- 102000006010 Protein Disulfide-Isomerase Human genes 0.000 claims description 3
- UDMBCSSLTHHNCD-KQYNXXCUSA-N adenosine 5'-monophosphate Chemical class C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O UDMBCSSLTHHNCD-KQYNXXCUSA-N 0.000 claims description 3
- 210000004748 cultured cell Anatomy 0.000 claims description 3
- 238000013461 design Methods 0.000 claims description 3
- 230000013595 glycosylation Effects 0.000 claims description 3
- 108091006086 inhibitor proteins Proteins 0.000 claims description 3
- 238000002156 mixing Methods 0.000 claims description 3
- 108020003519 protein disulfide isomerase Proteins 0.000 claims description 3
- 239000000376 reactant Substances 0.000 claims description 3
- 230000010076 replication Effects 0.000 claims description 3
- 241000894007 species Species 0.000 claims description 3
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 claims description 2
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 claims description 2
- 108091008103 RNA aptamers Proteins 0.000 claims description 2
- 102000039471 Small Nuclear RNA Human genes 0.000 claims description 2
- 235000018417 cysteine Nutrition 0.000 claims description 2
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 claims description 2
- 239000007857 degradation product Substances 0.000 claims description 2
- 230000009977 dual effect Effects 0.000 claims description 2
- 229940049906 glutamate Drugs 0.000 claims description 2
- 230000006698 induction Effects 0.000 claims description 2
- 230000003993 interaction Effects 0.000 claims description 2
- 108091070501 miRNA Proteins 0.000 claims description 2
- 230000026731 phosphorylation Effects 0.000 claims description 2
- 238000006366 phosphorylation reaction Methods 0.000 claims description 2
- 230000000379 polymerizing effect Effects 0.000 claims description 2
- 150000008163 sugars Chemical class 0.000 claims description 2
- 238000011144 upstream manufacturing Methods 0.000 claims description 2
- 108091028075 Circular RNA Proteins 0.000 claims 5
- 235000013928 guanylic acid Nutrition 0.000 claims 5
- 230000004481 post-translational protein modification Effects 0.000 claims 5
- 108010009595 Inorganic Pyrophosphatase Proteins 0.000 claims 3
- 102100027050 Inorganic pyrophosphatase Human genes 0.000 claims 3
- 101710129823 Polyphosphate kinase 2 Proteins 0.000 claims 3
- 108020005345 3' Untranslated Regions Proteins 0.000 claims 2
- 102000053642 Catalytic RNA Human genes 0.000 claims 2
- 108090000994 Catalytic RNA Proteins 0.000 claims 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 claims 2
- 108091027874 Group I catalytic intron Proteins 0.000 claims 2
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 claims 2
- 108010009413 Pyrophosphatases Proteins 0.000 claims 2
- 102000009609 Pyrophosphatases Human genes 0.000 claims 2
- 230000003321 amplification Effects 0.000 claims 2
- 102000023732 binding proteins Human genes 0.000 claims 2
- 108091008324 binding proteins Proteins 0.000 claims 2
- 238000004811 liquid chromatography Methods 0.000 claims 2
- 229920002521 macromolecule Polymers 0.000 claims 2
- 239000002679 microRNA Substances 0.000 claims 2
- DTBNBXWJWCWCIK-UHFFFAOYSA-N phosphoenolpyruvic acid Chemical compound OC(=O)C(=C)OP(O)(O)=O DTBNBXWJWCWCIK-UHFFFAOYSA-N 0.000 claims 2
- 108091092562 ribozyme Proteins 0.000 claims 2
- 239000004055 small Interfering RNA Substances 0.000 claims 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 claims 1
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 claims 1
- 101001082110 Acanthamoeba polyphaga mimivirus Eukaryotic translation initiation factor 4E homolog Proteins 0.000 claims 1
- 108010092060 Acetate kinase Proteins 0.000 claims 1
- 239000004475 Arginine Substances 0.000 claims 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 claims 1
- 241000193830 Bacillus <bacterium> Species 0.000 claims 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 claims 1
- 241000701489 Cauliflower mosaic virus Species 0.000 claims 1
- 101001082109 Danio rerio Eukaryotic translation initiation factor 4E-1B Proteins 0.000 claims 1
- 108010002700 Exoribonucleases Proteins 0.000 claims 1
- 102000004678 Exoribonucleases Human genes 0.000 claims 1
- 239000004471 Glycine Substances 0.000 claims 1
- 108020004202 Guanylate Kinase Proteins 0.000 claims 1
- 108020005004 Guide RNA Proteins 0.000 claims 1
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 claims 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 claims 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 claims 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 claims 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 claims 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 claims 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 claims 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 claims 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 claims 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 claims 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 claims 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 claims 1
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 claims 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 claims 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 claims 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 claims 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 claims 1
- 239000004472 Lysine Substances 0.000 claims 1
- 229920002774 Maltodextrin Polymers 0.000 claims 1
- 239000005913 Maltodextrin Substances 0.000 claims 1
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 claims 1
- 101710132574 Peroxidase 7 Proteins 0.000 claims 1
- 108091007412 Piwi-interacting RNA Proteins 0.000 claims 1
- 101710135451 Probable cytidylate kinase Proteins 0.000 claims 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 claims 1
- 241000589516 Pseudomonas Species 0.000 claims 1
- 229930185560 Pseudouridine Natural products 0.000 claims 1
- PTJWIQPHWPFNBW-UHFFFAOYSA-N Pseudouridine C Natural products OC1C(O)C(CO)OC1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-UHFFFAOYSA-N 0.000 claims 1
- 102000013009 Pyruvate Kinase Human genes 0.000 claims 1
- 108020005115 Pyruvate Kinase Proteins 0.000 claims 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 claims 1
- 241000700584 Simplexvirus Species 0.000 claims 1
- 108020004688 Small Nuclear RNA Proteins 0.000 claims 1
- 108020003224 Small Nucleolar RNA Proteins 0.000 claims 1
- 102000042773 Small Nucleolar RNA Human genes 0.000 claims 1
- 108091027967 Small hairpin RNA Proteins 0.000 claims 1
- 235000002595 Solanum tuberosum Nutrition 0.000 claims 1
- 244000061456 Solanum tuberosum Species 0.000 claims 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 claims 1
- 239000004473 Threonine Substances 0.000 claims 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 claims 1
- 108020000553 UMP kinase Proteins 0.000 claims 1
- 108020004417 Untranslated RNA Proteins 0.000 claims 1
- 102000039634 Untranslated RNA Human genes 0.000 claims 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 claims 1
- YIJVOACVHQZMKI-JXOAFFINSA-N [[(2r,3s,4r,5r)-5-(4-amino-5-methyl-2-oxopyrimidin-1-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound O=C1N=C(N)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 YIJVOACVHQZMKI-JXOAFFINSA-N 0.000 claims 1
- LIPOUNRJVLNBCD-UHFFFAOYSA-N acetyl dihydrogen phosphate Chemical compound CC(=O)OP(O)(O)=O LIPOUNRJVLNBCD-UHFFFAOYSA-N 0.000 claims 1
- 230000021736 acetylation Effects 0.000 claims 1
- 238000006640 acetylation reaction Methods 0.000 claims 1
- 235000004279 alanine Nutrition 0.000 claims 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 claims 1
- 229960001230 asparagine Drugs 0.000 claims 1
- 235000009582 asparagine Nutrition 0.000 claims 1
- 229940009098 aspartate Drugs 0.000 claims 1
- WGDUUQDYDIIBKT-UHFFFAOYSA-N beta-Pseudouridine Natural products OC1OC(CN2C=CC(=O)NC2=O)C(O)C1O WGDUUQDYDIIBKT-UHFFFAOYSA-N 0.000 claims 1
- 229910052799 carbon Inorganic materials 0.000 claims 1
- 239000000470 constituent Substances 0.000 claims 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 claims 1
- 238000001035 drying Methods 0.000 claims 1
- 238000000605 extraction Methods 0.000 claims 1
- 229930195712 glutamate Natural products 0.000 claims 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 claims 1
- 229960002743 glutamine Drugs 0.000 claims 1
- 102000006638 guanylate kinase Human genes 0.000 claims 1
- 229910052816 inorganic phosphate Inorganic materials 0.000 claims 1
- 229960000310 isoleucine Drugs 0.000 claims 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 claims 1
- 229940035034 maltodextrin Drugs 0.000 claims 1
- 229930182817 methionine Natural products 0.000 claims 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 claims 1
- 229930029653 phosphoenolpyruvate Natural products 0.000 claims 1
- 239000011148 porous material Substances 0.000 claims 1
- 108091007428 primary miRNA Proteins 0.000 claims 1
- 239000003223 protective agent Substances 0.000 claims 1
- PTJWIQPHWPFNBW-GBNDHIKLSA-N pseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-GBNDHIKLSA-N 0.000 claims 1
- 238000004064 recycling Methods 0.000 claims 1
- 150000003384 small molecules Chemical class 0.000 claims 1
- RWRDLPDLKQPQOW-UHFFFAOYSA-N tetrahydropyrrole Natural products C1CCNC1 RWRDLPDLKQPQOW-UHFFFAOYSA-N 0.000 claims 1
- 238000010257 thawing Methods 0.000 claims 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 claims 1
- 241000701161 unidentified adenovirus Species 0.000 claims 1
- 241000701447 unidentified baculovirus Species 0.000 claims 1
- 241001430294 unidentified retrovirus Species 0.000 claims 1
- 239000004474 valine Substances 0.000 claims 1
- 108091030071 RNAI Proteins 0.000 description 351
- 230000009368 gene silencing by RNA Effects 0.000 description 349
- 229940088598 enzyme Drugs 0.000 description 274
- 102000053602 DNA Human genes 0.000 description 86
- 239000000243 solution Substances 0.000 description 64
- 238000006731 degradation reaction Methods 0.000 description 43
- 235000002639 sodium chloride Nutrition 0.000 description 33
- 230000015556 catabolic process Effects 0.000 description 32
- 230000003197 catalytic effect Effects 0.000 description 30
- 108091036078 conserved sequence Proteins 0.000 description 26
- 150000003839 salts Chemical class 0.000 description 24
- 108010012974 RNA triphosphatase Proteins 0.000 description 20
- 239000000306 component Substances 0.000 description 19
- 239000003112 inhibitor Substances 0.000 description 19
- 238000012705 nitroxide-mediated radical polymerization Methods 0.000 description 19
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 18
- 239000006166 lysate Substances 0.000 description 18
- 108010064833 guanylyltransferase Proteins 0.000 description 17
- 108020002230 Pancreatic Ribonuclease Proteins 0.000 description 16
- 102000005891 Pancreatic ribonuclease Human genes 0.000 description 16
- 101000956368 Trittame loki CRISP/Allergen/PR-1 Proteins 0.000 description 15
- 108091092259 cell-free RNA Proteins 0.000 description 15
- 238000000338 in vitro Methods 0.000 description 15
- 230000004048 modification Effects 0.000 description 15
- 238000012986 modification Methods 0.000 description 15
- 239000002609 medium Substances 0.000 description 14
- 239000000178 monomer Substances 0.000 description 14
- 230000001580 bacterial effect Effects 0.000 description 13
- 238000002360 preparation method Methods 0.000 description 13
- 102000035195 Peptidases Human genes 0.000 description 12
- 108091005804 Peptidases Proteins 0.000 description 12
- 239000004365 Protease Substances 0.000 description 12
- 239000000872 buffer Substances 0.000 description 12
- 239000000562 conjugate Substances 0.000 description 12
- 102000016397 Methyltransferase Human genes 0.000 description 11
- 101710172711 Structural protein Proteins 0.000 description 11
- 108090000765 processed proteins & peptides Proteins 0.000 description 11
- 238000013459 approach Methods 0.000 description 10
- 230000000295 complement effect Effects 0.000 description 10
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 10
- 238000001962 electrophoresis Methods 0.000 description 10
- 230000002255 enzymatic effect Effects 0.000 description 10
- 102000004196 processed proteins & peptides Human genes 0.000 description 10
- 238000000746 purification Methods 0.000 description 10
- 101100326791 Caenorhabditis elegans cap-2 gene Proteins 0.000 description 9
- UYTPUPDQBNUYGX-UHFFFAOYSA-N Guanine Natural products O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 9
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 9
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 9
- 102000001253 Protein Kinase Human genes 0.000 description 9
- 101710137500 T7 RNA polymerase Proteins 0.000 description 9
- 230000008901 benefit Effects 0.000 description 9
- 108020001778 catalytic domains Proteins 0.000 description 9
- 230000005764 inhibitory process Effects 0.000 description 9
- 230000037361 pathway Effects 0.000 description 9
- 229920001184 polypeptide Polymers 0.000 description 9
- 239000011780 sodium chloride Substances 0.000 description 9
- 101800000515 Non-structural protein 3 Proteins 0.000 description 8
- 101800000980 Protease nsP2 Proteins 0.000 description 8
- 101800001758 RNA-directed RNA polymerase nsP4 Proteins 0.000 description 8
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 8
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 8
- 210000000805 cytoplasm Anatomy 0.000 description 8
- 230000001747 exhibiting effect Effects 0.000 description 8
- 210000004940 nucleus Anatomy 0.000 description 8
- 235000019419 proteases Nutrition 0.000 description 8
- 230000004083 survival effect Effects 0.000 description 8
- 108090000331 Firefly luciferases Proteins 0.000 description 7
- 108091028043 Nucleic acid sequence Proteins 0.000 description 7
- 229940041514 candida albicans extract Drugs 0.000 description 7
- 239000003599 detergent Substances 0.000 description 7
- 230000002401 inhibitory effect Effects 0.000 description 7
- 239000002207 metabolite Substances 0.000 description 7
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 7
- 230000002829 reductive effect Effects 0.000 description 7
- 238000012546 transfer Methods 0.000 description 7
- 239000012138 yeast extract Substances 0.000 description 7
- RQFCJASXJCIDSX-UHFFFAOYSA-N 14C-Guanosin-5'-monophosphat Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(COP(O)(O)=O)C(O)C1O RQFCJASXJCIDSX-UHFFFAOYSA-N 0.000 description 6
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 6
- 239000001888 Peptone Substances 0.000 description 6
- 108010080698 Peptones Proteins 0.000 description 6
- 101710188297 Trehalose synthase/amylase TreS Proteins 0.000 description 6
- 230000006037 cell lysis Effects 0.000 description 6
- 230000009089 cytolysis Effects 0.000 description 6
- 230000001965 increasing effect Effects 0.000 description 6
- 230000035772 mutation Effects 0.000 description 6
- 150000003833 nucleoside derivatives Chemical class 0.000 description 6
- 235000019319 peptone Nutrition 0.000 description 6
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 6
- 108060006633 protein kinase Proteins 0.000 description 6
- 108020004418 ribosomal RNA Proteins 0.000 description 6
- BDHFUVZGWQCTTF-UHFFFAOYSA-M sulfonate Chemical compound [O-]S(=O)=O BDHFUVZGWQCTTF-UHFFFAOYSA-M 0.000 description 6
- LWIHDJKSTIGBAC-UHFFFAOYSA-K tripotassium phosphate Chemical compound [K+].[K+].[K+].[O-]P([O-])([O-])=O LWIHDJKSTIGBAC-UHFFFAOYSA-K 0.000 description 6
- 230000003612 virological effect Effects 0.000 description 6
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 5
- 241000894006 Bacteria Species 0.000 description 5
- 102100038712 Cap-specific mRNA (nucleoside-2'-O-)-methyltransferase 1 Human genes 0.000 description 5
- 102100028712 Cytosolic purine 5'-nucleotidase Human genes 0.000 description 5
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 5
- 108010038016 Mannose-1-phosphate guanylyltransferase Proteins 0.000 description 5
- 108010076039 Polyproteins Proteins 0.000 description 5
- 241000710960 Sindbis virus Species 0.000 description 5
- 241000710959 Venezuelan equine encephalitis virus Species 0.000 description 5
- 238000004113 cell culture Methods 0.000 description 5
- 230000002068 genetic effect Effects 0.000 description 5
- 239000000543 intermediate Substances 0.000 description 5
- 210000004962 mammalian cell Anatomy 0.000 description 5
- 125000003835 nucleoside group Chemical group 0.000 description 5
- 239000003960 organic solvent Substances 0.000 description 5
- 108091008146 restriction endonucleases Proteins 0.000 description 5
- 241001492234 Bamboo mosaic virus Species 0.000 description 4
- RTZKZFJDLAIYFH-UHFFFAOYSA-N Diethyl ether Chemical compound CCOCC RTZKZFJDLAIYFH-UHFFFAOYSA-N 0.000 description 4
- 102000003951 Erythropoietin Human genes 0.000 description 4
- 108090000394 Erythropoietin Proteins 0.000 description 4
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 4
- 241000206602 Eukaryota Species 0.000 description 4
- 101000721712 Homo sapiens NTF2-related export protein 1 Proteins 0.000 description 4
- 239000007987 MES buffer Substances 0.000 description 4
- CSNNHWWHGAXBCP-UHFFFAOYSA-L Magnesium sulfate Chemical compound [Mg+2].[O-][S+2]([O-])([O-])[O-] CSNNHWWHGAXBCP-UHFFFAOYSA-L 0.000 description 4
- 102100025055 NTF2-related export protein 1 Human genes 0.000 description 4
- 108700019535 Phosphoprotein Phosphatases Proteins 0.000 description 4
- 102000045595 Phosphoprotein Phosphatases Human genes 0.000 description 4
- WCUXLLCKKVVCTQ-UHFFFAOYSA-M Potassium chloride Chemical compound [Cl-].[K+] WCUXLLCKKVVCTQ-UHFFFAOYSA-M 0.000 description 4
- 108010009460 RNA Polymerase II Proteins 0.000 description 4
- 102000009572 RNA Polymerase II Human genes 0.000 description 4
- 101710141795 Ribonuclease inhibitor Proteins 0.000 description 4
- 102100037968 Ribonuclease inhibitor Human genes 0.000 description 4
- 241000710961 Semliki Forest virus Species 0.000 description 4
- QAOWNCQODCNURD-UHFFFAOYSA-L Sulfate Chemical compound [O-]S([O-])(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-L 0.000 description 4
- 108700019146 Transgenes Proteins 0.000 description 4
- 239000002253 acid Substances 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 230000002238 attenuated effect Effects 0.000 description 4
- 230000027455 binding Effects 0.000 description 4
- 238000003776 cleavage reaction Methods 0.000 description 4
- 238000010367 cloning Methods 0.000 description 4
- 150000001875 compounds Chemical class 0.000 description 4
- 238000009295 crossflow filtration Methods 0.000 description 4
- 230000001086 cytosolic effect Effects 0.000 description 4
- 230000006378 damage Effects 0.000 description 4
- 230000002939 deleterious effect Effects 0.000 description 4
- 238000004925 denaturation Methods 0.000 description 4
- 230000036425 denaturation Effects 0.000 description 4
- FFYPMLJYZAEMQB-UHFFFAOYSA-N diethyl pyrocarbonate Chemical compound CCOC(=O)OC(=O)OCC FFYPMLJYZAEMQB-UHFFFAOYSA-N 0.000 description 4
- 229940079919 digestives enzyme preparation Drugs 0.000 description 4
- 238000006911 enzymatic reaction Methods 0.000 description 4
- 229940105423 erythropoietin Drugs 0.000 description 4
- 230000002414 glycolytic effect Effects 0.000 description 4
- 230000003834 intracellular effect Effects 0.000 description 4
- 229910021645 metal ion Inorganic materials 0.000 description 4
- 229920000642 polymer Polymers 0.000 description 4
- OXCMYAYHXIHQOA-UHFFFAOYSA-N potassium;[2-butyl-5-chloro-3-[[4-[2-(1,2,4-triaza-3-azanidacyclopenta-1,4-dien-5-yl)phenyl]phenyl]methyl]imidazol-4-yl]methanol Chemical compound [K+].CCCCC1=NC(Cl)=C(CO)N1CC1=CC=C(C=2C(=CC=CC=2)C2=N[N-]N=N2)C=C1 OXCMYAYHXIHQOA-UHFFFAOYSA-N 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- PUZPDOWCWNUUKD-UHFFFAOYSA-M sodium fluoride Chemical compound [F-].[Na+] PUZPDOWCWNUUKD-UHFFFAOYSA-M 0.000 description 4
- HEMHJVSKTPXQMS-UHFFFAOYSA-M sodium hydroxide Inorganic materials [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 4
- 239000007858 starting material Substances 0.000 description 4
- 238000003860 storage Methods 0.000 description 4
- 230000014621 translational initiation Effects 0.000 description 4
- ZWEHNKRNPOVVGH-UHFFFAOYSA-N 2-Butanone Chemical compound CCC(C)=O ZWEHNKRNPOVVGH-UHFFFAOYSA-N 0.000 description 3
- CSCPPACGZOOCGX-UHFFFAOYSA-N Acetone Chemical compound CC(C)=O CSCPPACGZOOCGX-UHFFFAOYSA-N 0.000 description 3
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 3
- 241000701386 African swine fever virus Species 0.000 description 3
- 101150014715 CAP2 gene Proteins 0.000 description 3
- 108020004705 Codon Proteins 0.000 description 3
- 101150116298 D12L gene Proteins 0.000 description 3
- 102000012410 DNA Ligases Human genes 0.000 description 3
- 108010061982 DNA Ligases Proteins 0.000 description 3
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 3
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 108010025076 Holoenzymes Proteins 0.000 description 3
- 241000282414 Homo sapiens Species 0.000 description 3
- 101000883304 Homo sapiens Cap-specific mRNA (nucleoside-2'-O-)-methyltransferase 1 Proteins 0.000 description 3
- 102000004157 Hydrolases Human genes 0.000 description 3
- 108090000604 Hydrolases Proteins 0.000 description 3
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 3
- 101100326803 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) fac-2 gene Proteins 0.000 description 3
- 108091034117 Oligonucleotide Proteins 0.000 description 3
- 102000004316 Oxidoreductases Human genes 0.000 description 3
- 108090000854 Oxidoreductases Proteins 0.000 description 3
- 229940122208 Ribonuclease inhibitor Drugs 0.000 description 3
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 3
- 108091027544 Subgenomic mRNA Proteins 0.000 description 3
- 108020005038 Terminator Codon Proteins 0.000 description 3
- YXFVVABEGXRONW-UHFFFAOYSA-N Toluene Chemical compound CC1=CC=CC=C1 YXFVVABEGXRONW-UHFFFAOYSA-N 0.000 description 3
- 241000209140 Triticum Species 0.000 description 3
- 235000021307 Triticum Nutrition 0.000 description 3
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 3
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 3
- 238000004220 aggregation Methods 0.000 description 3
- 150000001450 anions Chemical class 0.000 description 3
- 230000010261 cell growth Effects 0.000 description 3
- 230000000593 degrading effect Effects 0.000 description 3
- 230000030609 dephosphorylation Effects 0.000 description 3
- 238000006209 dephosphorylation reaction Methods 0.000 description 3
- 230000029087 digestion Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000012467 final product Substances 0.000 description 3
- 230000012010 growth Effects 0.000 description 3
- 239000001963 growth medium Substances 0.000 description 3
- 230000009931 harmful effect Effects 0.000 description 3
- XLYOFNOQVPJJNP-ZSJDYOACSA-N heavy water Substances [2H]O[2H] XLYOFNOQVPJJNP-ZSJDYOACSA-N 0.000 description 3
- 238000004191 hydrophobic interaction chromatography Methods 0.000 description 3
- 238000001727 in vivo Methods 0.000 description 3
- 230000000977 initiatory effect Effects 0.000 description 3
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 3
- 108010026228 mRNA guanylyltransferase Proteins 0.000 description 3
- 102100039604 mRNA guanylyltransferase Human genes 0.000 description 3
- 229910001629 magnesium chloride Inorganic materials 0.000 description 3
- 235000019796 monopotassium phosphate Nutrition 0.000 description 3
- 229910000402 monopotassium phosphate Inorganic materials 0.000 description 3
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 description 3
- 239000013600 plasmid vector Substances 0.000 description 3
- GNSKLFRGEWLPPA-UHFFFAOYSA-M potassium dihydrogen phosphate Chemical compound [K+].OP(O)([O-])=O GNSKLFRGEWLPPA-UHFFFAOYSA-M 0.000 description 3
- 229910000160 potassium phosphate Inorganic materials 0.000 description 3
- 229940093916 potassium phosphate Drugs 0.000 description 3
- 235000011009 potassium phosphates Nutrition 0.000 description 3
- 239000002243 precursor Substances 0.000 description 3
- 239000002342 ribonucleoside Substances 0.000 description 3
- 239000000523 sample Substances 0.000 description 3
- 230000007017 scission Effects 0.000 description 3
- 230000008685 targeting Effects 0.000 description 3
- 238000011282 treatment Methods 0.000 description 3
- 230000007306 turnover Effects 0.000 description 3
- NLVXSWCKKBEXTG-UHFFFAOYSA-N vinylsulfonic acid Chemical compound OS(=O)(=O)C=C NLVXSWCKKBEXTG-UHFFFAOYSA-N 0.000 description 3
- 239000011701 zinc Substances 0.000 description 3
- HZAXFHJVJLSVMW-UHFFFAOYSA-N 2-Aminoethan-1-ol Chemical compound NCCO HZAXFHJVJLSVMW-UHFFFAOYSA-N 0.000 description 2
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 2
- YASYEJJMZJALEJ-UHFFFAOYSA-N Citric acid monohydrate Chemical compound O.OC(=O)CC(O)(C(O)=O)CC(O)=O YASYEJJMZJALEJ-UHFFFAOYSA-N 0.000 description 2
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 2
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 2
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 2
- 101150084744 D1R gene Proteins 0.000 description 2
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 2
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 2
- 241001198387 Escherichia coli BL21(DE3) Species 0.000 description 2
- 101000686777 Escherichia phage T7 T7 RNA polymerase Proteins 0.000 description 2
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 2
- 102220480121 H/ACA ribonucleoprotein complex subunit DKC1_R10A_mutation Human genes 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 101000844521 Homo sapiens Transient receptor potential cation channel subfamily M member 5 Proteins 0.000 description 2
- 101000963221 Homo sapiens mRNA guanylyltransferase Proteins 0.000 description 2
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 2
- 108091092195 Intron Proteins 0.000 description 2
- 239000007836 KH2PO4 Substances 0.000 description 2
- 102000003960 Ligases Human genes 0.000 description 2
- 108090000364 Ligases Proteins 0.000 description 2
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 2
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 229910021380 Manganese Chloride Inorganic materials 0.000 description 2
- GLFNIEUTAYBVOC-UHFFFAOYSA-L Manganese chloride Chemical compound Cl[Mn]Cl GLFNIEUTAYBVOC-UHFFFAOYSA-L 0.000 description 2
- 241000699666 Mus <mouse, genus> Species 0.000 description 2
- PXHVJJICTQNCMI-UHFFFAOYSA-N Nickel Chemical compound [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 2
- 241000283973 Oryctolagus cuniculus Species 0.000 description 2
- 241000228153 Penicillium citrinum Species 0.000 description 2
- 229940122907 Phosphatase inhibitor Drugs 0.000 description 2
- 108020005161 RNA Caps Proteins 0.000 description 2
- 108010065868 RNA polymerase SP6 Proteins 0.000 description 2
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 2
- 108020004682 Single-Stranded DNA Proteins 0.000 description 2
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 2
- 102000004357 Transferases Human genes 0.000 description 2
- 108090000992 Transferases Proteins 0.000 description 2
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 2
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 2
- MZVQCMJNVPIDEA-UHFFFAOYSA-N [CH2]CN(CC)CC Chemical group [CH2]CN(CC)CC MZVQCMJNVPIDEA-UHFFFAOYSA-N 0.000 description 2
- 230000002378 acidificating effect Effects 0.000 description 2
- 238000001042 affinity chromatography Methods 0.000 description 2
- 150000001298 alcohols Chemical class 0.000 description 2
- 125000003275 alpha amino acid group Chemical group 0.000 description 2
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 2
- 150000001412 amines Chemical class 0.000 description 2
- 210000004102 animal cell Anatomy 0.000 description 2
- 238000005571 anion exchange chromatography Methods 0.000 description 2
- 108010028263 bacteriophage T3 RNA polymerase Proteins 0.000 description 2
- 235000012216 bentonite Nutrition 0.000 description 2
- 239000012620 biological material Substances 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 125000002057 carboxymethyl group Chemical group [H]OC(=O)C([H])([H])[*] 0.000 description 2
- 239000003054 catalyst Substances 0.000 description 2
- 150000001768 cations Chemical class 0.000 description 2
- 239000006143 cell culture medium Substances 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000001627 detrimental effect Effects 0.000 description 2
- ZPWVASYFFYYZEW-UHFFFAOYSA-L dipotassium hydrogen phosphate Chemical compound [K+].[K+].OP([O-])([O-])=O ZPWVASYFFYYZEW-UHFFFAOYSA-L 0.000 description 2
- 235000019797 dipotassium phosphate Nutrition 0.000 description 2
- 229910000396 dipotassium phosphate Inorganic materials 0.000 description 2
- DDXLVDQZPFLQMZ-UHFFFAOYSA-M dodecyl(trimethyl)azanium;chloride Chemical compound [Cl-].CCCCCCCCCCCC[N+](C)(C)C DDXLVDQZPFLQMZ-UHFFFAOYSA-M 0.000 description 2
- XJWSAJYUBXQQDR-UHFFFAOYSA-M dodecyltrimethylammonium bromide Chemical compound [Br-].CCCCCCCCCCCC[N+](C)(C)C XJWSAJYUBXQQDR-UHFFFAOYSA-M 0.000 description 2
- 230000037149 energy metabolism Effects 0.000 description 2
- UMSGVWVBUHUHEH-UHFFFAOYSA-M ethyl(trimethyl)azanium;bromide Chemical compound [Br-].CC[N+](C)(C)C UMSGVWVBUHUHEH-UHFFFAOYSA-M 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 102000035175 foldases Human genes 0.000 description 2
- 108091005749 foldases Proteins 0.000 description 2
- 230000002538 fungal effect Effects 0.000 description 2
- 239000008103 glucose Substances 0.000 description 2
- 229940029575 guanosine Drugs 0.000 description 2
- 238000006460 hydrolysis reaction Methods 0.000 description 2
- 230000001976 improved effect Effects 0.000 description 2
- 229940125396 insulin Drugs 0.000 description 2
- 230000017730 intein-mediated protein splicing Effects 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 230000028744 lysogeny Effects 0.000 description 2
- 102220515209 mRNA cap guanine-N7 methyltransferase_K66A_mutation Human genes 0.000 description 2
- 239000011777 magnesium Substances 0.000 description 2
- 229910052749 magnesium Inorganic materials 0.000 description 2
- 229910052943 magnesium sulfate Inorganic materials 0.000 description 2
- 235000019341 magnesium sulphate Nutrition 0.000 description 2
- 239000011565 manganese chloride Substances 0.000 description 2
- 235000002867 manganese chloride Nutrition 0.000 description 2
- 230000002503 metabolic effect Effects 0.000 description 2
- 230000004060 metabolic process Effects 0.000 description 2
- 229910052751 metal Inorganic materials 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- 230000000813 microbial effect Effects 0.000 description 2
- 210000001322 periplasm Anatomy 0.000 description 2
- 239000008363 phosphate buffer Substances 0.000 description 2
- 230000008488 polyadenylation Effects 0.000 description 2
- 238000006116 polymerization reaction Methods 0.000 description 2
- SCVFZCLFOSHCOH-UHFFFAOYSA-M potassium acetate Chemical compound [K+].CC([O-])=O SCVFZCLFOSHCOH-UHFFFAOYSA-M 0.000 description 2
- 239000001103 potassium chloride Substances 0.000 description 2
- 235000011164 potassium chloride Nutrition 0.000 description 2
- 230000003389 potentiating effect Effects 0.000 description 2
- 238000011533 pre-incubation Methods 0.000 description 2
- 108020001580 protein domains Proteins 0.000 description 2
- 230000012846 protein folding Effects 0.000 description 2
- 238000010188 recombinant method Methods 0.000 description 2
- 239000011347 resin Substances 0.000 description 2
- 229920005989 resin Polymers 0.000 description 2
- 210000001995 reticulocyte Anatomy 0.000 description 2
- 229930000044 secondary metabolite Natural products 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 229910052708 sodium Inorganic materials 0.000 description 2
- 239000011734 sodium Substances 0.000 description 2
- FQENQNTWSFEDLI-UHFFFAOYSA-J sodium diphosphate Chemical compound [Na+].[Na+].[Na+].[Na+].[O-]P([O-])(=O)OP([O-])([O-])=O FQENQNTWSFEDLI-UHFFFAOYSA-J 0.000 description 2
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 2
- 239000011775 sodium fluoride Substances 0.000 description 2
- 235000013024 sodium fluoride Nutrition 0.000 description 2
- 239000001488 sodium phosphate Substances 0.000 description 2
- 229910000162 sodium phosphate Inorganic materials 0.000 description 2
- 235000011008 sodium phosphates Nutrition 0.000 description 2
- 229940048086 sodium pyrophosphate Drugs 0.000 description 2
- 239000002904 solvent Substances 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 235000019818 tetrasodium diphosphate Nutrition 0.000 description 2
- 239000001577 tetrasodium phosphonato phosphate Substances 0.000 description 2
- 230000005026 transcription initiation Effects 0.000 description 2
- 230000032258 transport Effects 0.000 description 2
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 2
- 108010027510 vaccinia virus capping enzyme Proteins 0.000 description 2
- 229910052725 zinc Inorganic materials 0.000 description 2
- RYHBNJHYFVUHQT-UHFFFAOYSA-N 1,4-Dioxane Chemical compound C1COCCO1 RYHBNJHYFVUHQT-UHFFFAOYSA-N 0.000 description 1
- SXGZJKUKBWWHRA-UHFFFAOYSA-M 2-(N-morpholino)ethanesulfonate Chemical compound [O-]S(=O)(=O)CCN1CCOCC1 SXGZJKUKBWWHRA-UHFFFAOYSA-M 0.000 description 1
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 1
- 125000000022 2-aminoethyl group Chemical group [H]C([*])([H])C([H])([H])N([H])[H] 0.000 description 1
- GUPXYSSGJWIURR-UHFFFAOYSA-N 3-octoxypropane-1,2-diol Chemical compound CCCCCCCCOCC(O)CO GUPXYSSGJWIURR-UHFFFAOYSA-N 0.000 description 1
- XTWYTFMLZFPYCI-KQYNXXCUSA-N 5'-adenylphosphoric acid Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O XTWYTFMLZFPYCI-KQYNXXCUSA-N 0.000 description 1
- 125000001417 5'-guanylyl group Chemical group C=12N=C(N([H])[H])N([H])C(=O)C=1N=C([H])N2[C@@]1([H])[C@@](O[H])([H])[C@@](O[H])([H])[C@](C(OP(=O)(O[H])[*])([H])[H])([H])O1 0.000 description 1
- OQRXBXNATIHDQO-UHFFFAOYSA-N 6-chloropyridine-3,4-diamine Chemical compound NC1=CN=C(Cl)C=C1N OQRXBXNATIHDQO-UHFFFAOYSA-N 0.000 description 1
- LRFVTYWOQMYALW-UHFFFAOYSA-N 9H-xanthine Chemical class O=C1NC(=O)NC2=C1NC=N2 LRFVTYWOQMYALW-UHFFFAOYSA-N 0.000 description 1
- AEOBEOJCBAYXBA-UHFFFAOYSA-N A2P5P Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(O)=O)C(O)C1OP(O)(O)=O AEOBEOJCBAYXBA-UHFFFAOYSA-N 0.000 description 1
- 101150011527 ABD1 gene Proteins 0.000 description 1
- 241001556567 Acanthamoeba polyphaga mimivirus Species 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 1
- 101000768957 Acholeplasma phage L2 Uncharacterized 37.2 kDa protein Proteins 0.000 description 1
- 101000823746 Acidianus ambivalens Uncharacterized 17.7 kDa protein in bps2 3'region Proteins 0.000 description 1
- 101000916369 Acidianus ambivalens Uncharacterized protein in sor 5'region Proteins 0.000 description 1
- 101000769342 Acinetobacter guillouiae Uncharacterized protein in rpoN-murA intergenic region Proteins 0.000 description 1
- 101000823696 Actinobacillus pleuropneumoniae Uncharacterized glycosyltransferase in aroQ 3'region Proteins 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- XTWYTFMLZFPYCI-UHFFFAOYSA-N Adenosine diphosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(=O)OP(O)(O)=O)C(O)C1O XTWYTFMLZFPYCI-UHFFFAOYSA-N 0.000 description 1
- 208000007407 African swine fever Diseases 0.000 description 1
- 101100022493 African swine fever virus (strain Badajoz 1971 Vero-adapted) Ba71V-101 gene Proteins 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- 101000786513 Agrobacterium tumefaciens (strain 15955) Uncharacterized protein outside the virF region Proteins 0.000 description 1
- 101000618005 Alkalihalobacillus pseudofirmus (strain ATCC BAA-2126 / JCM 17055 / OF4) Uncharacterized protein BpOF4_00885 Proteins 0.000 description 1
- 108010039224 Amidophosphoribosyltransferase Proteins 0.000 description 1
- QGZKDVFQNNGYKY-UHFFFAOYSA-O Ammonium Chemical compound [NH4+] QGZKDVFQNNGYKY-UHFFFAOYSA-O 0.000 description 1
- 102100020724 Ankyrin repeat, SAM and basic leucine zipper domain-containing protein 1 Human genes 0.000 description 1
- 102100037435 Antiviral innate immune response receptor RIG-I Human genes 0.000 description 1
- 101710127675 Antiviral innate immune response receptor RIG-I Proteins 0.000 description 1
- 241000724287 Apple mosaic virus Species 0.000 description 1
- 241000201370 Autographa californica nucleopolyhedrovirus Species 0.000 description 1
- 101000967489 Azorhizobium caulinodans (strain ATCC 43989 / DSM 5975 / JCM 20966 / LMG 6465 / NBRC 14845 / NCIMB 13405 / ORS 571) Uncharacterized protein AZC_3924 Proteins 0.000 description 1
- 101150112145 B16L gene Proteins 0.000 description 1
- 101000823761 Bacillus licheniformis Uncharacterized 9.4 kDa protein in flaL 3'region Proteins 0.000 description 1
- 101000819719 Bacillus methanolicus Uncharacterized N-acetyltransferase in lysA 3'region Proteins 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 101000789586 Bacillus subtilis (strain 168) UPF0702 transmembrane protein YkjA Proteins 0.000 description 1
- 101000792624 Bacillus subtilis (strain 168) Uncharacterized protein YbxH Proteins 0.000 description 1
- 101000790792 Bacillus subtilis (strain 168) Uncharacterized protein YckC Proteins 0.000 description 1
- 101000819705 Bacillus subtilis (strain 168) Uncharacterized protein YlxR Proteins 0.000 description 1
- 101000948218 Bacillus subtilis (strain 168) Uncharacterized protein YtxJ Proteins 0.000 description 1
- 101000718627 Bacillus thuringiensis subsp. kurstaki Putative RNA polymerase sigma-G factor Proteins 0.000 description 1
- 108020000946 Bacterial DNA Proteins 0.000 description 1
- 108091032955 Bacterial small RNA Proteins 0.000 description 1
- 101000641200 Bombyx mori densovirus Putative non-structural protein Proteins 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 239000012619 Butyl Sepharose® Substances 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- ZWIADYZPOWUWEW-XVFCMESISA-N CDP Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(O)=O)O1 ZWIADYZPOWUWEW-XVFCMESISA-N 0.000 description 1
- 101150089397 CEG1 gene Proteins 0.000 description 1
- 101150072317 CET1 gene Proteins 0.000 description 1
- 101710083568 CMP-N-acetylneuraminate-beta-galactosamide-alpha-2,3-sialyltransferase 1 Proteins 0.000 description 1
- 102100027098 CMP-N-acetylneuraminate-beta-galactosamide-alpha-2,3-sialyltransferase 1 Human genes 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- 101710158575 Cap-specific mRNA (nucleoside-2'-O-)-methyltransferase Proteins 0.000 description 1
- 102100038716 Cap-specific mRNA (nucleoside-2'-O-)-methyltransferase 2 Human genes 0.000 description 1
- VEXZGXHMUGYJMC-UHFFFAOYSA-M Chloride anion Chemical compound [Cl-] VEXZGXHMUGYJMC-UHFFFAOYSA-M 0.000 description 1
- 241000800392 Chrysochromulina ericina virus Species 0.000 description 1
- 101000947633 Claviceps purpurea Uncharacterized 13.8 kDa protein Proteins 0.000 description 1
- 229910021580 Cobalt(II) chloride Inorganic materials 0.000 description 1
- 206010010144 Completed suicide Diseases 0.000 description 1
- 229910021592 Copper(II) chloride Inorganic materials 0.000 description 1
- 241000711573 Coronaviridae Species 0.000 description 1
- YVGGHNCTFXOJCH-UHFFFAOYSA-N DDT Chemical compound C1=CC(Cl)=CC=C1C(C(Cl)(Cl)Cl)C1=CC=C(Cl)C=C1 YVGGHNCTFXOJCH-UHFFFAOYSA-N 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- 108020005199 Dehydrogenases Proteins 0.000 description 1
- 241000725619 Dengue virus Species 0.000 description 1
- 241000710827 Dengue virus 1 Species 0.000 description 1
- 101100112225 Emericella nidulans (strain FGSC A4 / ATCC 38163 / CBS 112.46 / NRRL 194 / M139) cpa-1 gene Proteins 0.000 description 1
- 108010067770 Endopeptidase K Proteins 0.000 description 1
- 101000948901 Enterobacteria phage T4 Uncharacterized 16.0 kDa protein in segB-ipI intergenic region Proteins 0.000 description 1
- 101000805958 Equine herpesvirus 4 (strain 1942) Virion protein US10 homolog Proteins 0.000 description 1
- 241000672609 Escherichia coli BL21 Species 0.000 description 1
- 241001131798 Escherichia coli HT115 Species 0.000 description 1
- 101000790442 Escherichia coli Insertion element IS2 uncharacterized 11.1 kDa protein Proteins 0.000 description 1
- 101000788354 Escherichia phage P2 Uncharacterized 8.2 kDa protein in gpA 5'region Proteins 0.000 description 1
- OTMSDBZUPAUEDD-UHFFFAOYSA-N Ethane Chemical compound CC OTMSDBZUPAUEDD-UHFFFAOYSA-N 0.000 description 1
- 108010014863 Eukaryotic Initiation Factors Proteins 0.000 description 1
- 102000002241 Eukaryotic Initiation Factors Human genes 0.000 description 1
- VTLYFUHAOXGGBS-UHFFFAOYSA-N Fe3+ Chemical compound [Fe+3] VTLYFUHAOXGGBS-UHFFFAOYSA-N 0.000 description 1
- 101000770304 Frankia alni UPF0460 protein in nifX-nifW intergenic region Proteins 0.000 description 1
- 101001076781 Fructilactobacillus sanfranciscensis (strain ATCC 27651 / DSM 20451 / JCM 5668 / CCUG 30143 / KCTC 3205 / NCIMB 702811 / NRRL B-3934 / L-12) Ribose-5-phosphate isomerase A Proteins 0.000 description 1
- 102000010100 G-patch domains Human genes 0.000 description 1
- 108050001761 G-patch domains Proteins 0.000 description 1
- 230000005526 G1 to G0 transition Effects 0.000 description 1
- QGWNDRXFNXRZMB-UUOKFMHZSA-N GDP Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O QGWNDRXFNXRZMB-UUOKFMHZSA-N 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- 101000797344 Geobacillus stearothermophilus Putative tRNA (cytidine(34)-2'-O)-methyltransferase Proteins 0.000 description 1
- 101000748410 Geobacillus stearothermophilus Uncharacterized protein in fumA 3'region Proteins 0.000 description 1
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 description 1
- 239000007995 HEPES buffer Substances 0.000 description 1
- 101000772675 Haemophilus influenzae (strain ATCC 51907 / DSM 11121 / KW20 / Rd) UPF0438 protein HI_0847 Proteins 0.000 description 1
- 101000631019 Haemophilus influenzae (strain ATCC 51907 / DSM 11121 / KW20 / Rd) Uncharacterized protein HI_0350 Proteins 0.000 description 1
- 101000768938 Haemophilus phage HP1 (strain HP1c1) Uncharacterized 8.9 kDa protein in int-C1 intergenic region Proteins 0.000 description 1
- HTTJABKRGRZYRN-UHFFFAOYSA-N Heparin Chemical compound OC1C(NC(=O)C)C(O)OC(COS(O)(=O)=O)C1OC1C(OS(O)(=O)=O)C(O)C(OC2C(C(OS(O)(=O)=O)C(OC3C(C(O)C(O)C(O3)C(O)=O)OS(O)(=O)=O)C(CO)O2)NS(O)(=O)=O)C(C(O)=O)O1 HTTJABKRGRZYRN-UHFFFAOYSA-N 0.000 description 1
- 108091006054 His-tagged proteins Proteins 0.000 description 1
- 101000785414 Homo sapiens Ankyrin repeat, SAM and basic leucine zipper domain-containing protein 1 Proteins 0.000 description 1
- 101000883291 Homo sapiens Cap-specific mRNA (nucleoside-2'-O-)-methyltransferase 2 Proteins 0.000 description 1
- 101001082073 Homo sapiens Interferon-induced helicase C domain-containing protein 1 Proteins 0.000 description 1
- 101000833492 Homo sapiens Jouberin Proteins 0.000 description 1
- 101000651236 Homo sapiens NCK-interacting protein with SH3 domain Proteins 0.000 description 1
- 101001023733 Homo sapiens Neurotrypsin Proteins 0.000 description 1
- 101100151951 Homo sapiens SARS1 gene Proteins 0.000 description 1
- 101000801195 Homo sapiens TLE family member 5 Proteins 0.000 description 1
- 101001039684 Homo sapiens mRNA cap guanine-N7 methyltransferase Proteins 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 102000004877 Insulin Human genes 0.000 description 1
- 108090001061 Insulin Proteins 0.000 description 1
- 102100027353 Interferon-induced helicase C domain-containing protein 1 Human genes 0.000 description 1
- 102000014150 Interferons Human genes 0.000 description 1
- 108010050904 Interferons Proteins 0.000 description 1
- 241000710842 Japanese encephalitis virus Species 0.000 description 1
- 102100024407 Jouberin Human genes 0.000 description 1
- 101000782488 Junonia coenia densovirus (isolate pBRJ/1990) Putative non-structural protein NS2 Proteins 0.000 description 1
- 101000811523 Klebsiella pneumoniae Uncharacterized 55.8 kDa protein in cps region Proteins 0.000 description 1
- 241000235649 Kluyveromyces Species 0.000 description 1
- 241001138401 Kluyveromyces lactis Species 0.000 description 1
- 101000818409 Lactococcus lactis subsp. lactis Uncharacterized HTH-type transcriptional regulator in lacX 3'region Proteins 0.000 description 1
- 108090001090 Lectins Proteins 0.000 description 1
- 102000004856 Lectins Human genes 0.000 description 1
- 101000878851 Leptolyngbya boryana Putative Fe(2+) transport protein A Proteins 0.000 description 1
- WHXSMMKQMYFTQS-UHFFFAOYSA-N Lithium Chemical compound [Li] WHXSMMKQMYFTQS-UHFFFAOYSA-N 0.000 description 1
- 239000007993 MOPS buffer Substances 0.000 description 1
- 241001042466 Mammalian orthoreovirus Species 0.000 description 1
- 241001492366 Meaban virus Species 0.000 description 1
- 101000758828 Methanosarcina barkeri (strain Fusaro / DSM 804) Uncharacterized protein Mbar_A1602 Proteins 0.000 description 1
- 101001122401 Middle East respiratory syndrome-related coronavirus (isolate United Kingdom/H123990006/2012) Non-structural protein ORF3 Proteins 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 101001055788 Mycolicibacterium smegmatis (strain ATCC 700084 / mc(2)155) Pentapeptide repeat protein MfpA Proteins 0.000 description 1
- 102000010722 N-Glycosyl Hydrolases Human genes 0.000 description 1
- 108010063372 N-Glycosyl Hydrolases Proteins 0.000 description 1
- 229930182474 N-glycoside Natural products 0.000 description 1
- VQAYFKKCNSOZKM-UHFFFAOYSA-N NSC 29409 Natural products C1=NC=2C(NC)=NC=NC=2N1C1OC(CO)C(O)C1O VQAYFKKCNSOZKM-UHFFFAOYSA-N 0.000 description 1
- 229910004619 Na2MoO4 Inorganic materials 0.000 description 1
- 102100035484 Neurotrypsin Human genes 0.000 description 1
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 1
- 102100036518 Nucleoside diphosphate phosphatase ENTPD5 Human genes 0.000 description 1
- 108010011356 Nucleoside phosphotransferase Proteins 0.000 description 1
- 108010075285 Nucleoside-Triphosphatase Proteins 0.000 description 1
- 102000008021 Nucleoside-Triphosphatase Human genes 0.000 description 1
- 102000003832 Nucleotidyltransferases Human genes 0.000 description 1
- 108090000119 Nucleotidyltransferases Proteins 0.000 description 1
- 101000740670 Orgyia pseudotsugata multicapsid polyhedrosis virus Protein C42 Proteins 0.000 description 1
- 241000702244 Orthoreovirus Species 0.000 description 1
- 239000007990 PIPES buffer Substances 0.000 description 1
- 101000669384 Papaver somniferum Reticuline N-methyltransferase Proteins 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 241000228143 Penicillium Species 0.000 description 1
- 102000002508 Peptide Elongation Factors Human genes 0.000 description 1
- 108010068204 Peptide Elongation Factors Proteins 0.000 description 1
- 241001332332 Phaeocystis globosa virus Species 0.000 description 1
- 102000006335 Phosphate-Binding Proteins Human genes 0.000 description 1
- 108010058514 Phosphate-Binding Proteins Proteins 0.000 description 1
- 102100036629 Phosphoglucomutase-2 Human genes 0.000 description 1
- 102000004861 Phosphoric Diester Hydrolases Human genes 0.000 description 1
- 108090001050 Phosphoric Diester Hydrolases Proteins 0.000 description 1
- 101000769182 Photorhabdus luminescens Uncharacterized protein in pnp 3'region Proteins 0.000 description 1
- 241000701253 Phycodnaviridae Species 0.000 description 1
- 239000004695 Polyether sulfone Substances 0.000 description 1
- 239000004372 Polyvinyl alcohol Substances 0.000 description 1
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 1
- 108010029485 Protein Isoforms Proteins 0.000 description 1
- 102000001708 Protein Isoforms Human genes 0.000 description 1
- 108700040121 Protein Methyltransferases Proteins 0.000 description 1
- 102000055027 Protein Methyltransferases Human genes 0.000 description 1
- 108010001267 Protein Subunits Proteins 0.000 description 1
- 102000002067 Protein Subunits Human genes 0.000 description 1
- 101000961392 Pseudescherichia vulneris Uncharacterized 29.9 kDa protein in crtE 3'region Proteins 0.000 description 1
- 101000731030 Pseudomonas oleovorans Poly(3-hydroxyalkanoate) polymerase 2 Proteins 0.000 description 1
- 101001065485 Pseudomonas putida Probable fatty acid methyltransferase Proteins 0.000 description 1
- 102100036286 Purine nucleoside phosphorylase Human genes 0.000 description 1
- 102100036164 Putative phospholipase B-like 2 Human genes 0.000 description 1
- 101710200837 Putative phospholipase B-like 2 Proteins 0.000 description 1
- 101150090155 R gene Proteins 0.000 description 1
- 238000002123 RNA extraction Methods 0.000 description 1
- 230000007022 RNA scission Effects 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 101000711023 Rhizobium leguminosarum bv. trifolii Uncharacterized protein in tfuA 3'region Proteins 0.000 description 1
- 101000948156 Rhodococcus erythropolis Uncharacterized 47.3 kDa protein in thcA 5'region Proteins 0.000 description 1
- 101000917565 Rhodococcus fascians Uncharacterized 33.6 kDa protein in fasciation locus Proteins 0.000 description 1
- 102100020783 Ribokinase Human genes 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- MEFKEPWMEQBLKI-AIRLBKTGSA-N S-adenosyl-L-methioninate Chemical compound O[C@@H]1[C@H](O)[C@@H](C[S+](CC[C@H](N)C([O-])=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 MEFKEPWMEQBLKI-AIRLBKTGSA-N 0.000 description 1
- 241000315672 SARS coronavirus Species 0.000 description 1
- 101000790284 Saimiriine herpesvirus 2 (strain 488) Uncharacterized 9.5 kDa protein in DHFR 3'region Proteins 0.000 description 1
- 229920002684 Sepharose Polymers 0.000 description 1
- 241000607715 Serratia marcescens Species 0.000 description 1
- VMHLLURERBWHNL-UHFFFAOYSA-M Sodium acetate Chemical compound [Na+].CC([O-])=O VMHLLURERBWHNL-UHFFFAOYSA-M 0.000 description 1
- 241000710888 St. Louis encephalitis virus Species 0.000 description 1
- 101000936719 Streptococcus gordonii Accessory Sec system protein Asp3 Proteins 0.000 description 1
- 101000788499 Streptomyces coelicolor Uncharacterized oxidoreductase in mprA 5'region Proteins 0.000 description 1
- 101001102841 Streptomyces griseus Purine nucleoside phosphorylase ORF3 Proteins 0.000 description 1
- 101000708557 Streptomyces lincolnensis Uncharacterized 17.2 kDa protein in melC2-rnhH intergenic region Proteins 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 102100033766 TLE family member 5 Human genes 0.000 description 1
- 101000649826 Thermotoga neapolitana Putative anti-sigma factor antagonist TM1081 homolog Proteins 0.000 description 1
- 241000710771 Tick-borne encephalitis virus Species 0.000 description 1
- 101710120037 Toxin CcdB Proteins 0.000 description 1
- 102100040396 Transcobalamin-1 Human genes 0.000 description 1
- 101710124861 Transcobalamin-1 Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 108030003004 Triphosphatases Proteins 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- 108091023045 Untranslated Region Proteins 0.000 description 1
- XCCTYIAWTASOJW-XVFCMESISA-N Uridine-5'-Diphosphate Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(=O)OP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1 XCCTYIAWTASOJW-XVFCMESISA-N 0.000 description 1
- 101100076195 Vaccinia virus (strain Western Reserve) VACWR117 gene Proteins 0.000 description 1
- 206010046865 Vaccinia virus infection Diseases 0.000 description 1
- 101000827562 Vibrio alginolyticus Uncharacterized protein in proC 3'region Proteins 0.000 description 1
- 101000778915 Vibrio parahaemolyticus serotype O3:K6 (strain RIMD 2210633) Uncharacterized membrane protein VP2115 Proteins 0.000 description 1
- 108010067390 Viral Proteins Proteins 0.000 description 1
- 241000907505 Yokose virus Species 0.000 description 1
- 241000907316 Zika virus Species 0.000 description 1
- XJLXINKUBYWONI-DQQFMEOOSA-N [[(2r,3r,4r,5r)-5-(6-aminopurin-9-yl)-3-hydroxy-4-phosphonooxyoxolan-2-yl]methoxy-hydroxyphosphoryl] [(2s,3r,4s,5s)-5-(3-carbamoylpyridin-1-ium-1-yl)-3,4-dihydroxyoxolan-2-yl]methyl phosphate Chemical compound NC(=O)C1=CC=C[N+]([C@@H]2[C@H]([C@@H](O)[C@H](COP([O-])(=O)OP(O)(=O)OC[C@@H]3[C@H]([C@@H](OP(O)(O)=O)[C@@H](O3)N3C4=NC=NC(N)=C4N=C3)O)O2)O)=C1 XJLXINKUBYWONI-DQQFMEOOSA-N 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 239000008351 acetate buffer Substances 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 229960001570 ademetionine Drugs 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 125000003158 alcohol group Chemical group 0.000 description 1
- GZCGUPFRVQAUEE-SLPGGIOYSA-N aldehydo-D-glucose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C=O GZCGUPFRVQAUEE-SLPGGIOYSA-N 0.000 description 1
- 125000000266 alpha-aminoacyl group Chemical group 0.000 description 1
- 230000006229 amino acid addition Effects 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 1
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 1
- 235000011130 ammonium sulphate Nutrition 0.000 description 1
- 238000004873 anchoring Methods 0.000 description 1
- 125000000129 anionic group Chemical group 0.000 description 1
- 238000011394 anticancer treatment Methods 0.000 description 1
- 239000003429 antifungal agent Substances 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 238000010923 batch production Methods 0.000 description 1
- 239000000440 bentonite Substances 0.000 description 1
- 229910000278 bentonite Inorganic materials 0.000 description 1
- SVPXDRXYRYOSEX-UHFFFAOYSA-N bentoquatam Chemical compound O.O=[Si]=O.O=[Al]O[Al]=O SVPXDRXYRYOSEX-UHFFFAOYSA-N 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 1
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 230000001851 biosynthetic effect Effects 0.000 description 1
- OWMVSZAMULFTJU-UHFFFAOYSA-N bis-tris Chemical compound OCCN(CCO)C(CO)(CO)CO OWMVSZAMULFTJU-UHFFFAOYSA-N 0.000 description 1
- 235000000332 black box Nutrition 0.000 description 1
- KGBXLFKZBHKPEV-UHFFFAOYSA-N boric acid Chemical compound OB(O)O KGBXLFKZBHKPEV-UHFFFAOYSA-N 0.000 description 1
- 125000000484 butyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 210000004900 c-terminal fragment Anatomy 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 230000008777 canonical pathway Effects 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- GYSSRZJIHXQEHQ-UHFFFAOYSA-N carboxin Chemical compound S1CCOC(C)=C1C(=O)NC1=CC=CC=C1 GYSSRZJIHXQEHQ-UHFFFAOYSA-N 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 231100000357 carcinogen Toxicity 0.000 description 1
- 239000003183 carcinogenic agent Substances 0.000 description 1
- 230000001925 catabolic effect Effects 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 238000005277 cation exchange chromatography Methods 0.000 description 1
- 125000002091 cationic group Chemical group 0.000 description 1
- 230000003915 cell function Effects 0.000 description 1
- 210000002421 cell wall Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000007073 chemical hydrolysis Effects 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 239000003638 chemical reducing agent Substances 0.000 description 1
- 210000003763 chloroplast Anatomy 0.000 description 1
- 239000007979 citrate buffer Substances 0.000 description 1
- 229960002303 citric acid monohydrate Drugs 0.000 description 1
- 229910017052 cobalt Inorganic materials 0.000 description 1
- 239000010941 cobalt Substances 0.000 description 1
- GUTLYIVDDKVIGB-UHFFFAOYSA-N cobalt atom Chemical compound [Co] GUTLYIVDDKVIGB-UHFFFAOYSA-N 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 238000010924 continuous production Methods 0.000 description 1
- 229920001577 copolymer Polymers 0.000 description 1
- ORTQZVOHEJQUHG-UHFFFAOYSA-L copper(II) chloride Chemical compound Cl[Cu]Cl ORTQZVOHEJQUHG-UHFFFAOYSA-L 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 125000000151 cysteine group Chemical class N[C@@H](CS)C(=O)* 0.000 description 1
- 210000000172 cytosol Anatomy 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 239000005549 deoxyribonucleoside Substances 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- MNNHAPBLZZVQHP-UHFFFAOYSA-N diammonium hydrogen phosphate Chemical compound [NH4+].[NH4+].OP([O-])([O-])=O MNNHAPBLZZVQHP-UHFFFAOYSA-N 0.000 description 1
- 229910000388 diammonium phosphate Inorganic materials 0.000 description 1
- 235000019838 diammonium phosphate Nutrition 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 239000003937 drug carrier Substances 0.000 description 1
- 238000009509 drug development Methods 0.000 description 1
- 230000002681 effect on RNA Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 230000006862 enzymatic digestion Effects 0.000 description 1
- 230000009088 enzymatic function Effects 0.000 description 1
- 230000009483 enzymatic pathway Effects 0.000 description 1
- 238000001976 enzyme digestion Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 238000010230 functional analysis Methods 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 238000003209 gene knockout Methods 0.000 description 1
- 238000012239 gene modification Methods 0.000 description 1
- 238000001415 gene therapy Methods 0.000 description 1
- 230000005017 genetic modification Effects 0.000 description 1
- 235000013617 genetically modified food Nutrition 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 229960002897 heparin Drugs 0.000 description 1
- 229920000669 heparin Polymers 0.000 description 1
- 125000004051 hexyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 238000000265 homogenisation Methods 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 230000003301 hydrolyzing effect Effects 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical class O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 230000015788 innate immune response Effects 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 229940079322 interferon Drugs 0.000 description 1
- 239000013067 intermediate product Substances 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 239000002523 lectin Substances 0.000 description 1
- 231100000518 lethal Toxicity 0.000 description 1
- 230000001665 lethal effect Effects 0.000 description 1
- 150000002614 leucines Chemical class 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 229910052744 lithium Inorganic materials 0.000 description 1
- 102100040949 mRNA cap guanine-N7 methyltransferase Human genes 0.000 description 1
- 238000010841 mRNA extraction Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 229940049920 malate Drugs 0.000 description 1
- BJEPYKJPYRNKOW-UHFFFAOYSA-N malic acid Chemical compound OC(=O)C(O)CC(O)=O BJEPYKJPYRNKOW-UHFFFAOYSA-N 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 229910052759 nickel Inorganic materials 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 238000001668 nucleic acid synthesis Methods 0.000 description 1
- 108010009099 nucleoside phosphorylase Proteins 0.000 description 1
- 108010028546 nucleoside-diphosphatase Proteins 0.000 description 1
- 230000030648 nucleus localization Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 210000003463 organelle Anatomy 0.000 description 1
- 238000012261 overproduction Methods 0.000 description 1
- 239000007800 oxidant agent Substances 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 230000010412 perfusion Effects 0.000 description 1
- 108010001722 phosphopentomutase Proteins 0.000 description 1
- 150000003013 phosphoric acid derivatives Chemical group 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 230000007180 physiological regulation Effects 0.000 description 1
- 238000007747 plating Methods 0.000 description 1
- 229920000447 polyanionic polymer Polymers 0.000 description 1
- 229920006393 polyether sulfone Polymers 0.000 description 1
- 229920002451 polyvinyl alcohol Polymers 0.000 description 1
- 238000012987 post-synthetic modification Methods 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 239000011591 potassium Substances 0.000 description 1
- 229910052700 potassium Inorganic materials 0.000 description 1
- 235000011056 potassium acetate Nutrition 0.000 description 1
- ZLMJMSJWJFRBEC-OUBTZVSYSA-N potassium-40 Chemical compound [40K] ZLMJMSJWJFRBEC-OUBTZVSYSA-N 0.000 description 1
- 239000002244 precipitate Substances 0.000 description 1
- 230000004224 protection Effects 0.000 description 1
- 230000009979 protective mechanism Effects 0.000 description 1
- 230000002797 proteolythic effect Effects 0.000 description 1
- 229940048084 pyrophosphate Drugs 0.000 description 1
- 238000006722 reduction reaction Methods 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 238000003757 reverse transcription PCR Methods 0.000 description 1
- 108010066476 ribonuclease B Proteins 0.000 description 1
- 108010066483 ribonuclease C Proteins 0.000 description 1
- 230000002245 ribonucleolytic effect Effects 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- DWRXFEITVBNRMK-JXOAFFINSA-N ribothymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 DWRXFEITVBNRMK-JXOAFFINSA-N 0.000 description 1
- 238000013341 scale-up Methods 0.000 description 1
- 238000004062 sedimentation Methods 0.000 description 1
- 230000009919 sequestration Effects 0.000 description 1
- 108091029842 small nuclear ribonucleic acid Proteins 0.000 description 1
- 210000001812 small ribosome subunit Anatomy 0.000 description 1
- 239000001632 sodium acetate Substances 0.000 description 1
- 235000017281 sodium acetate Nutrition 0.000 description 1
- 239000011684 sodium molybdate Substances 0.000 description 1
- 235000015393 sodium molybdate Nutrition 0.000 description 1
- TVXXNOYZHKPKGW-UHFFFAOYSA-N sodium molybdate (anhydrous) Chemical compound [Na+].[Na+].[O-][Mo]([O-])(=O)=O TVXXNOYZHKPKGW-UHFFFAOYSA-N 0.000 description 1
- CSRCBLMBBOJYEX-UHFFFAOYSA-M sodium;2-morpholin-4-ylethanesulfonic acid;hydroxide Chemical compound [OH-].[Na+].OS(=O)(=O)CCN1CCOCC1 CSRCBLMBBOJYEX-UHFFFAOYSA-M 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 230000003393 splenic effect Effects 0.000 description 1
- 230000002269 spontaneous effect Effects 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 239000011550 stock solution Substances 0.000 description 1
- 238000012916 structural analysis Methods 0.000 description 1
- 239000004094 surface-active agent Substances 0.000 description 1
- 229940065721 systemic for obstructive airway disease xanthines Drugs 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 229960003495 thiamine Drugs 0.000 description 1
- DPJRMOMPQZCRJU-UHFFFAOYSA-M thiamine hydrochloride Chemical compound Cl.[Cl-].CC1=C(CCO)SC=[N+]1CC1=CN=C(C)N=C1N DPJRMOMPQZCRJU-UHFFFAOYSA-M 0.000 description 1
- 150000003573 thiols Chemical class 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 239000011573 trace mineral Substances 0.000 description 1
- 235000013619 trace mineral Nutrition 0.000 description 1
- 230000005029 transcription elongation Effects 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- IHIXIJGXTJIKRB-UHFFFAOYSA-N trisodium vanadate Chemical compound [Na+].[Na+].[Na+].[O-][V]([O-])([O-])=O IHIXIJGXTJIKRB-UHFFFAOYSA-N 0.000 description 1
- 239000012137 tryptone Substances 0.000 description 1
- 238000013060 ultrafiltration and diafiltration Methods 0.000 description 1
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 229960005486 vaccine Drugs 0.000 description 1
- 208000007089 vaccinia Diseases 0.000 description 1
- 210000003934 vacuole Anatomy 0.000 description 1
- 230000029812 viral genome replication Effects 0.000 description 1
- 108700026215 vpr Genes Proteins 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1003—Extracting or separating nucleic acids from biological samples, e.g. pure separation or isolation methods; Conditions, buffers or apparatuses therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1241—Nucleotidyltransferases (2.7.7)
- C12N9/1247—DNA-directed RNA polymerase (2.7.7.6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1241—Nucleotidyltransferases (2.7.7)
- C12N9/127—RNA-directed RNA polymerase (2.7.7.48), i.e. RNA replicase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/001—Vector systems having a special element relevant for transcription controllable enhancer/promoter combination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/50—Vector systems having a special element relevant for transcription regulating RNA stability, not being an intron, e.g. poly A signal
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Analytical Chemistry (AREA)
- Crystallography & Structural Chemistry (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
본 발명은 핵산 및/또는 유용물질, 특별하게는 RNA 및 구체적으로는 메신저 RNA(mRNA) 및 구체적으로는 진핵생물 mRNA의 세포, 무세포 조성물, RNA 및 유용물질 생산에 관한 것이다. 본 발명에 개시된 시약 및 방법은 저비용, 고효율 및 상업적으로 유용한 규모로 무세포 조성물 및 세포에서 RNA 및/또는 유용물질 생산을 가능하게 한다.
Description
본 발명은 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 생산, RNA 전사 시스템 그리고 이들의 방법 및 생산물에 관한 것이다. 본 발명에 개시된 RNA 전사 시스템, 시약 및 방법은 저비용, 고효율 및 상업적으로 유용한 규모로 RNA 및/또는 유용물질의 무세포 및 세포 생산을 가능하게 한다.
리보핵산(RNA)은 생명체 어디에든 존재하고, 단백질의 조절 및 합성을 위한 DNA로부터의 지시를 운반하는, 세포에서의 정보의 핵심적 메신저로서 작용한다. RNA는 생명공학에서 흥미로운데, 그 이유는 세포에서 mRNA 수준을 합성적으로 조절하는 것이 농업 작물 보호, 항암 치료제, 유전자 요법, 백신, 면역계 조절, 질환 검출 및 동물 건강과 같은 분야에서 응용되기 때문이다. 기능적 단일-가닥(예를 들어, mRNA) 및 이중-가닥 RNA 분자는 살아있는 세포에서 그리고 정제된 재조합 효소 및 정제된 뉴클레오타이드 트라이포스페이트를 사용하여 시험관내에서 생산되었다(예를 들어, 유럽 특허 제1631675호, 미국 특허 출원 공개 제2014/0271559 A1호 및 제PCT/US2018/05535호 참조, 이들의 각각은 본 발명에 참조에 의해 포함됨).
특허 US5830694A에서는 'T7 프로모터-T7 RNA Polymerase' 발현단위인 'autogene'를 도입된 숙주세포는 T7 RNA Polymerase 산물의 자동증폭에 의한 일방적 과다 생산으로 사멸하여 autogene의 자동증폭 속도를 관리하는 T7 프로모터와 조절인자의 융합체와 T7 Polymerase 활성을 감소시키는 전략을 함께 사용하여 특허 US5830694A를 완성하였다.
무세포 발현 시스템 (또한 시험관 내 전사/번역, 무세포 단백질 발현, 무세포 번역, 또는 무세포 단백질 합성으로 공지되어 있음)은 기능성 단백질 또는 기타 표적 분자를 시험관 내에서 발현시킬 수 있도록 하는 분자 생물학 기법을 대표한다. 일반적인 무세포 발현 시스템은 전사-번역(transcription-translation, TXTL) 기전을 포함한다. 하나 이상의 해당분자를 생성하기 위해, 전형적인 합성 시스템은 미생물, 식물, 또는 동물 세포의 미정제 용해물로부터 에너지 생성 및 해당분자 합성에 필수적인 촉매 성분의 앙상블을 활용한다. 미정제 용해물은 DNA의 RNA로의 전사, RNA의 단백질로의 번역, 단백질 접힘, 및 에너지 대사에 필수적인 요소 (예로서, 리보솜, 아미노아실 tRNA 합성효소, 번역 개시 및 신장 인자, 리보솜 방출 인자, 뉴클레오타이드 재생 효소, 대사 효소, 샤페론, 폴데이즈(foldase), 등)을 포함할 수 있다.
현재 사용되는 통상적인 합성 시스템은 대장균 (Escherichia coli, ECE), 토끼 망상적혈구 (rabbit reticulocytes, RRL), 밀 배아 (wheat germ, WGE), 및 곤충 세포 (ICE), 및 심지어 포유류 세포 (MC)로부터 제조된다. 최근에는 전사와 번역관련 생체분자들로 재구성된 최소한 전사과 번역이 가능한 시스템(TXTL 시스템), PURE cell-free transcription-translation system도 상업화되었다.
그럼에도 불구하고, 광범위한 상업적 응용을 가능하게 하는 규모에서의 RNA및/또는 유용물질 및 구체적으로 mRNA 및/또는 단백질의 생산은 현재 비용이 엄청나게 높다. 더 저렴하고; 더 신속하고; 바람직하게는 제품 안전과 품질에 도움이 되도록 공정을 보다 확실하게 제어할 수 있는 수단으로 특수 시약의 외부 공급이 필요 없이, 쉽게 실행할 수 있고; 선행 기술 방법과 대등한 양과 등급의 RNA 및/또는 유용물질, 구체적으로 mRNA 및/또는 단백질을 생산을 하기 위한 방법 및 생산물이 필요하다.
본 발명은 세포, 전사-번역을 하는 무세포 및 관심 RNA 전사 시스템으로 진핵세포 mRNA를 포함하는 관심 RNA 및/또는 유용물질을 합성하며, 세포 배양, 세포 조작 또는 세포 형질감염의 복잡함 없이 관심 RNA 및/또는 유용물질을 생성하는 간단하고 효율적인 방법 및 생산물을 제공하고자한다.
본 발명의 전사-번역을 하는 무세포의 관심 RNA 합성은 관심 RNA를 인코딩하는 DNA가 형질전환된 세포, 세포용해물에 있는 물질의 사용 극대화, 관심 RNA 합성의 효율성, RNase 제거 또는 불활성 등으로, 체외전사 또는 박테리아 또는 조직 배양 세포에 기반한 생체 내 기법과 비교하여 상당히 빠른 방법일 수 있다. 이러한 시스템의 또 다른 장점은, 종종 발현되는 관심 RNA가 숙주세포에 독성을 가질 수 있거나 일반적으로 세포 발현과 양립할 수 없어 관심 RNA 합성에 대해 전적으로 비효율적인 수단이 아닌 경우에도 생체내 시스템에서는 실행 불가능하게 만들 수 있는 점이나, 본 발명의 무세포 관심 RNA 합성은 이를 회피할 수 있는 무세포 시스템이다. 본 발명에서 제안하는 무세포 전사-번역 시스템을 이용한 관심 RNA 합성은 세포에서 관심 RNA 과다 전사의 다양한 제한사항 예컨대 RNA 독성, RNA 분해 및 RNA 응집, 제어되지 않은 합성후 변형, 또는 세포 기구의 격리로 인한 세포 성장에 대한 RNA 합성의 세포내 합성에 따른 부정적인 효과를 해결하는 방법 및 생산물을 제공하고자한다.
본 발명에서 제안하는 무세포 시스템을 사용하여 더 짧은 기간 내에 상당히 더 높은 양의 관심 RNA가 발현할 수 있으며, 이는 하류의 고처리량 구조 및 기능 분석에 사용할 수 있다. 이와 같은 무세포 관심 RNA 합성은 또한 비용 절감, 합리화된 생산, 더 쉬운 규모 증대 및 단순화된 정제의 관점에서 상당한 이점이 있다. 무세포 RNA 합성 시스템에서, 관심 RNA의 유전자를 코딩하는 데옥시리보핵산 (DNA) 또는 리보핵산 (RNA)을 전사-번역-적격 세포용해물에 형질전환되거나 첨가하고, 관심 유전자의 전사를 수행함으로써, 원하는 관심 RNA를 합성할 수 있다. 본 발명에서 제안하는 관심 RNA를 인코딩하는 DNA의 전사는 세포용해물 전사-번역 시스템에서 단일 반응들이 커플링되어 주형 DNA가 즉각적으로 RNA로 전사되게 할 수 있거나, 또는 연결될 수 있는데, 이러한 경우에는 투입된 발현단위가 전사되고, 번역되어 합성되고, 내재 또는 투입된 NMP 혼합물로부터 NTP 혼합물을 합성하며, 투입된 관심 RNA 전사시스템으로부터 관심 RNA가 전사되는 것이다. 일반적으로, 커플링된 발현단위들의 전사 및 번역, NTP 합성 및 관심 RNA 합성을 위한 효소들의 전사 및 번역(무세포 시스템에서의 커플링된 전사번역)은 더 적은 시간 및 세포용해물 조작으로 관심 RNA의 수율을 증가시킨다. 본 발명은 관심 RNA의 즉각적인 전사는 RNA 분해와 연관된 가능한 유해 효과를 방지하는 방법 및 생산물을 제공하고자한다.
보다 구체적으로, 본 발명의 RNA 합성 시스템은 살아있는 세포를 사용하지 않고 관심 RNA를 생성할 수 있다. 전형적인 무세포 발현 시스템은 세포용해물에서 발견되는 생물학적 성분/기계(machinery)를 활용하여 세포내의 mRNA를 인코딩하는 DNA로부터 많은 종류의 mRNA를 생성할 수 있다. 전형적인 무세포 발현 시스템 반응의 통상적인 성분으로는 일반적으로 세포로부터 유도된 세포용해물, ATP와 같은 에너지원, NTP 공급원, 마그네슘과 같은 보조 인자, 및 전형적으로 플라스미드 합성 주형, 또는 선형 발현 (또는 합성) 주형의 형태로의, 바람직한 유전자를 가지는 핵산 합성 주형을 포함할 수 있다. 일반적으로 세포용해물은 해당 세포를 용해시키고, 원심분리 또는 기타 침전 방법을 통해 세포 벽, 게놈 DNA, RNA 및 기타 파편을 제거하여 획득될 수 있다. 본 발명은 특정 관심 RNA 및/또는 유용물질을 생성하고 분리, 정제할 목적으로 세포용해물은 전사와 번역에 관여하는 필수적인 세포 기계를 포함하고 그 활성을 유지하도록 하는 방법 및 생산물을 제공하고자한다.
본 발명에서 제안하는 관심 RNA를 합성하는 합성 시스템은 더 많은 양 (일반적으로 마이크로그램 양)의 특정 DNA 주형을 포함하는 관심 RNA 전사시스템, 에너지원 및 NTP 혼합물을 요구한다는 것이다. 일반적으로, 충분한 양의 이와 같은 관심 RNA 전사시스템은 정밀한 설계, 다중 워크플로우 단계 및 상당한 노력을 통해서만 수득될 수 있다. 본 발명은 관심 RNA 전사시스템의 구성성분의 설계 및 합성하고 플라스미드 벡터 내로 클로닝하고, 플라스미드 벡터를 숙주세포 예컨대 대장균에서 증폭시켜 분리, 정제한 후, 이를 세포용해물에 첨가하거나 또는 관심 RNA 전사시스템을 세포용해물 유래 세포에 형질전환함으로써 무세포 전사-번역 시스템을 위한 적합한 관심 RNA 전사시스템 또는 이들에 상응하는 직선형 DNA를 제공하며, 그리고 에너지원 및 NTP 혼합물을 내재된 자원을 이용하거나 더 추가적으로 첨가하도록 하는 방법 및 생산물을 제공하고자한다.
합성 시스템의 많은 유리한 측면에도 불구하고, 지금까지는 몇몇 장애가 RNA 생산 기술로서 이의 사용을 제한하고 있다. 이러한 장애는 활성 효소의 부족, 낮은 RNA 생산 속도, RNase 활성, 작은 반응 규모, 충분한 NTP, 및 블랙박스(black-box) 과학으로서의 초기 개발의 어려움을 포함한다. 이상적인 관심 RNA 합성 시스템을 위한 기존의 무세포 전사-번역 시스템에서 발견되는 뚜렷한 한계는 화학적 환경의 유해한 수반되며 변화 없이, 전사-번역에 필요한 RNA 합성의 많은 에너지 및 RNase 활성 제어를 공급하기 어려운 점이며, 게다가, 고가의 시약 비용, 특히 뉴클레오타이드 형태의 고에너지 포스페이트 시약 및 2차 에너지원은 이러한 기존의 무세포 전사-번역 시스템의 실질적인 사용을 제한하는 요소들을 극복하는 방법 및 생산물을 본 발명에서 제공하고자한다.
본 발명은 US5830694A에서 입증한 T7 RNA Polymerase autogene 만이 도입된 숙주세포는 T7 RNA Polymerase autogene의 산물에 의해 숙주세포에 치명적인 피해가 발생한다는 사실을 해결하는 방법 및 생산물을 제공하고자한다.
하기에서 보다 상세히 논의되는 바와 같이, 본 발명에서 제안하는 기술은 기존의 세포 RNA 생산 및 무세포 발현 시스템의 한계, 특히 특정 RNA 과다 합성 한계를 극복하면서, 반응 지속 시간을 연장시키고, 생성물 수율을 높이는, 에너지 효과적이며 강력한 무세포 발현 및 세포 RNA 관심 합성 시스템으로 진핵세포 mRNA를 포함하는 관심 RNA 및/또는 유용물질을 합성하는 시스템 및 생산물의 목표를 충족시킨다.
본 발명에는 상업적으로 유용한 양 및 비용으로 전사 및 번역을 하는 무세포 시스템 및 세포에서 RNA, 특별하게는 진핵세포 mRNA 및/또는 유용물질을 생산하기 위한 시약, 방법 및 생산물이 제공된다.
본 발명의 관심 RNA 전사시스템은 RNA 중합효소 발현단위와 관심 RNA 발현단위를 포함한다.
도 1에 제시한 바와 같이, 관심 RNA 및/또는 유용물질을 합성할 목적으로 Uncoupled transcription-translation를 실시하기 위해서, 본 발명은 (i) 세포유래 NMP로부터 NTP를 합성하는 반응구, (ii) 세포유래 NTP로부터 관심 RNA 및/또는 유용물질을 합성하는 반응구 및 (iii) 상기 두 반응구를 연결하는 TFF(Tangential Flow Filtration) 모듈을 포함하는 바이오리액터; 그리고 (i) 세포배양 및 용해를 포함하는 전처리 단계, (ii) 세포유래 NMP로부터 NTP를 합성하는 단계, 및 (iii) RNA 중합효소와 세포유래 NTP로부터 관심 RNA 및/또는 유용물질을 합성하는 단계를 포함하는 Uncoupled transcription-translation을 제공한다.
본 발명은 관심 RNA 및/또는 유용물질을 합성하기 위한, (i) 전사 및 번역을 하는 DdRp를 인코딩하는 DNA, 그 전사체, 및 DdRp; 및 (ii) RNA 중합효소 발현단위를 포함하는 세포에서 유래하는 무세포 또는 그의 정제산물을 포함하는 RNA 합성 시스템은 (a) 관심 RNA 발현단위; (b) 포스페이트 공여자를 포함하는 에너지원; (c) 외인성 천연 및/또는 변형된 뉴클레오티드 5'-트리포스페이트 및/또는 캡핑시약을 포함하는 반응시약; (d) RNase 활성의 불활성화되는 조건; 및 (e) 상기 발현단위들은 (i) DNA인 경우는 서로 작동하도록 연결하는 autogene system, 또는 (ii) RNA인 경우는 번역이 가능한 구조를 포함하는 핵산;을 제공한다.
도 1에 제시한 바와 같이, 관심 RNA 및/또는 유용물질을 합성할 목적으로 Uncoupled transcription-translation를 실시하기 위해서, (i) 전사 및 번역을 하는 DdRp를 인코딩하는 DNA, 그 전사체, 및 DdRp; 및 (ii) RNA 중합효소 발현단위를 포함하는 세포에서 유래하는 무세포 또는 정제된 RNA 중합효소를 포함하는 RNA 합성 시스템의 반응 방법으로서, (a) 상기 RNA 합성 시스템에 (i) 포스페이트 공여자를 포함하는 에너지원, (ii) 외인성 천연 및/또는 변형된 뉴클레오티드 5'-트리포스페이트 및 (iii) 선택적으로 캡핑시약;를 포함하는 반응시약을 첨가하며, RNase의 불활성화되는 조건을 처리한 후, 상기 관심 RNA 발현단위를 첨가하여 관심 RNA를 제조하도록 제1 반응용액을 배양하는 단계; (b) 상기 배양된 제1 반응용액에서 생산된 상기 관심 RNA를 분리 및 정제하며, 여기서, 추가적 선택적으로 RNA 생산 이후에 상기 제1 반응용액에 적어도 1종의 데옥시리보뉴클레아제 발현단위 및/또는 데옥시리보뉴클레아제를 첨가하여 상기 DNA를 분해시키는 조건 하에서 배양하는 과정을 포함하는 단계;를 제공한다.
도 1에 제시한 바와 같이, 관심 RNA 및/또는 유용물질을 합성할 목적으로 Uncoupled transcription-translation를 실시하기 위해서, (i) 전사 및 번역을 하는 DdRp를 인코딩하는 DNA, 그 전사체, 및 DdRp; 및 (ii) 선택적으로 RNA 중합효소 발현단위를 포함하는 세포에서 유래하는 무세포 또는 정제 RNA 중합효소를 포함하는 RNA 합성 시스템은 (a) 상기 RNase 분해산물을 기질로 하여 상기 NTP 혼합물을 제조할 수 있는 뉴클레오티드 키나제 발현단위; (b) 세포 RNA(내인성 RNA 및/또는 외인성 RNA)를 분해하는 RNase 발현단위를 포함하는 설계 발현단위 및/또는 그 발현산물; (c) 관심 RNA 발현단위; (d) 포스페이트 공여자를 포함하는 에너지원; (e) RNase 활성의 불활성화되는 조건; 및 (f) 상기 발현단위들은 (i) DNA인 경우는 서로 작동하도록 연결하는 autogene system, 또는 (ii) RNA인 경우는 번역이 가능한 구조를 포함하는 핵산;을 제공한다.
도 1에 제시한 바와 같이, 관심 RNA 및/또는 유용물질을 합성할 목적으로 Uncoupled transcription-translation를 실시하기 위해서, (i) 전사 및 번역을 하는 DdRp를 인코딩하는 DNA, 그 전사체, 및 DdRp; 및 (ii) 선택적으로 RNA 중합효소 발현단위를 포함하는 세포에서 유래하는 무세포 또는 그의 정제산물를 포함하는 RNA 합성 시스템의 반응 방법으로서, (a) 상기 뉴클레오티드 키나제 발현단위 및/또는 그 발현산물을 포함한 세포로부터 상기 뉴클레오티드 키나제를 포함하는 세포용해물을 제조하고, 선택적으로 정제하는 단계; (b) 세포 RNA(내인성 RNA 및/또는 외인성 RNA)로부터 RNase를 이용하여 NMP를 제조하고, 선택적으로 정제하는 단계; (c) 상기 단계(a)의 제조한 뉴클레오티드 키나제를 포함하는 세포용해물들 혼합하여 제조한 세포 RNA 유래 NTP-무세포 시스템에 단계 (b)에서 제조한 NMP를 첨가하여 NTP를 제조하며, 선택적으로 정제하는 단계; (d) 상기 RNA 합성 시스템에 (c)에서 제조한 NTP, (i) 포스페이트 공여자를 포함하는 에너지원, (ii) 선택적으로 외인성 천연 및/또는 변형된 뉴클레오티드 5'-트리포스페이트 및 (iii) 선택적으로 캡핑시약;을 포함하는 반응시약을 첨가하며, RNase의 불활성화되는 조건을 처리하고 상기 관심 RNA 발현단위를 첨가하여 관심 RNA를 제조하도록 제2 반응용액을 배양하는 단계; 및 (e) 상기 배양된 제2 반응용액에서 생산된 상기 관심 RNA를 분리 및 정제하며, 여기서, 추가적 선택적으로 RNA 생산 이후에 상기 배양한 반응용액에 적어도 1종의 데옥시리보뉴클레아제 발현단위 및/또는 데옥시리보뉴클레아제를 첨가하여 상기 DNA를 분해시키는 조건에서 배양하는 과정을 포함하는 단계;를 제공한다.
도 1에 제시한 바와 같이, 관심 RNA 및/또는 유용물질을 합성할 목적으로 Uncoupled transcription-translation를 실시하기 위해서, (i) 전사 및 번역을 하는 DdRp를 인코딩하는 DNA, 그 전사체, 및 DdRp; 및 (ii) 선택적으로 RNA 중합효소 발현단위를 포함하는 세포에서 유래하는 무세포 또는 그의 정제산물를 포함하는 RNA 합성 시스템의 반응 방법으로서, (a) (i) 상기 뉴클레오티드 키나제 발현단위 및/또는 그 발현산물을 포함한 세포로부터 상기 뉴클레오티드 키나제를 포함하도록 제조하거나 정제된 세포용해물; (ii) 세포 RNA(내인성 RNA 및/또는 외인성 RNA)로부터 RNase를 이용하여 제조되거나 정제된 NMP; (iii) 상기 관심 RNA 발현단위, 포스페이트 공여자를 포함하는 에너지원, 선택적으로 외인성 천연 및/또는 변형된 뉴클레오티드 5'-트리포스페이트 및 선택적으로 캡핑시약을 포함하는 반응시약;을 준비하는 단계; (b) 상기 RNA 합성 시스템에 단계 (a)에서 준비한 세포용해물, NMP 및 반응시약을 첨가하고, RNase의 불활성화되는 조건을 처리한 후, 상기 관심 RNA 발현단위를 첨가하여 RNA를 제조하도록 제3 반응용액을 배양하는 단계; 및 (c) 상기 배양된 제3 반응용액에서 생산된 상기 관심 RNA를 분리 및 정제하며, 여기서, 추가적 선택적으로 RNA 생산 이후에 상기 배양한 반응용액에 적어도 1종의 데옥시리보뉴클레아제 발현단위 및/또는 데옥시리보뉴클레아제를 첨가하여 상기 DNA를 분해시키는 조건에서 배양하는 과정을 포함하는 단계;를 제공한다.
상기 RNA 중합효소 발현단위의 발현을 유도하여 세포용해를 유발할 수도 있다.
도 1에 제시한 바와 같이, 관심 RNA 및/또는 유용물질을 합성할 목적으로 Uncoupled transcription-translation를 실시하기 위해서, (i) 관심 RNA(RNAi)를 발현하는 단위를 포함하는 관심 RNA 발현단위(Expression Unit, EU), (ii) 상기 RNA 중합효소 발현단위(Autogene)를 자가증폭을 하며 Autogene에 상응하는 프로모터의 하류지역에 있는 유전자들을 무한 증폭하도록 하는 상호작용하는 구성을 포함하는 Autogene System, 및 (iii) 관심 발현단위의 최종산물 생산에 필요한 반응원재료 대사경로 유전자들의 세트를 포함하는 설계 발현단위;를 포함하는 설계증폭발현(DAE, Designed Amplifying Expression) 시스템을 제공한다.
상기 관심 RNA 발현단위, 상기 RNA 중합효소 발현단위(Autogene) 및 상기 설계 발현단위를 포함하는 발현단위는 DNA 또는 RNA일 수 있으며 DNA인 모든 발현단위는 autogene system을 적용할 수 있으며 RNA인 경우는 번역할 수 있는 구조를 갖는 핵산체이다.
상기 autogene system을 작동할 수 있도록 하는 촉발자(trigger)는 RNA 및/또는 유용물질 합성 시스템에 있는 DdRp으로 프로모터와 DdRp를 포함하는 autogene을 구성하는 프로모터와 작용하여 하류지역에 있는 DdRp를 발현하도록 한다.
본 발명에서는 RNA 및/또는 유용물질의 생산 환경은 최종산물 또는 중간산물인 RNA의 분해를 보호하기 위한 RNase 불황성화 환경이며 단지 RNase 활성만 불활성화하고 다른 단백질의 활성에는 거의 영향이 없는 조건으로 구축하였다. 따라서 RNA 및/또는 유용물질의 생산 환경은 본래 세포 기능을 활용할 수 있는 세포추출물을 사용할 수 있어 세포의 본래 기능인 RNA 및/또는 유용물질의 합성 기능을 활용할 수 있다. 본 발명에서 합성 시스템에 내재된 세포 본래 기능을 최대한 활용하도록 하는 방법을 제공한다.
본 발명은 세포의 본래 기능을 최대한 활용하면서 RNA 및/또는 유용물질의 생산 환경을 유지하기 위한 요구를 충족시키기 위해서 한외여과(UF) 및 정용여과(DF) 시스템을 사용한 바이오리액터를 제공한다.
또한, 본 발명은 상기 관심 RNA 전사시스템이 발현되는 무세포 발현 시스템과 무세포유래 세포에서 분리되는 캡핑 RNA와 캡핑되지 않은 RNA를 분리하고 이들 RNA에서 캡핑 RNA를 분리하는 방법을 제공한다.
바람직하게, 본 발명의 RNA 생산에서 설계 발현단위는 세포 RNA를 NMP 또는 NDP로, 이들을 NTP로의 대사에 관련된 유전자들의 세트로 최종산물 RNA의 생산에 필요한 반응원재료 관련 유전자 세트를 제공할 수 있다.
바람직하게, 상기 발명의 RNA 및/또는 유용물질을 생산하는 무세포 조성물은 (a) 적이도 1종류의 DdRp를 포함하는 무세포 시스템; (b) 세포 RNA를 분해하는 1종 이상의 RNase 발현단위 또는 이에 상응하는 RNase; (c) 상기 적어도 하나의 리보뉴클레아제를 불활성화시키는 1종 이상의 RNase 저해제 발현단위, 이에 상응하는 RNase 저해제 및 화합물을 포함하는 군에서 선택되어진 어느 하나 이상; (d) 외인성 천연 및/또는 변형된 뉴클레오티드 5'-트리포스페이트, 뉴클레오티드 키나제 발현단위 및 이에 상응하는 뉴클레오티드 키나제를 포함하는 군에서 선택되어진 어느 하나 이상; (e) 헥사메타포스페이트 또는 폴리포스페이트를 포함하는 에너지원; (f) 캡핑시약; (g) RNA 중합효소 발현단위; 및 (h) 관심 RNA 발현단위:를 포함하는 키트를 제공할 수 있다.
본 발명에서 RNA 및/또는 유용물질 합성 시스템에서 전사 및 번역을 하는 DdRp를 인코딩하는 DNA, 그 전사체, 및 DdRp를 포함하는 군에서 선택되어진 어느 하나 이상을 포함 및/또는 첨가하는 전사와 번역을 하는 무세포 시스템 및 설계 증폭발현(DAE, Designed Amplifying Expression) 시스템을 포함하는 RNA 및/또는 유용물질 생산 시스템은 (a) 상기 무세포 시스템; (b) 상기 RNA 및/또는 유용물질을 제공하도록 하는 관심 RNA 발현단위; (c) RNA 중합효소 발현단위(Autogene); (d) 상기 RNA 및/또는 유용물질 생산에 필요한 설계 발현단위; 및 (e) 상기 발현단위들은 (i) DNA인 경우는 서로 작동하도록 연결하는 autogene system, 또는 (ii) RNA인 경우는 번역이 가능한 구조를 포함하는 핵산;을 제공한다
본 발명에서 RNA 및/또는 유용물질 생산은 (a) 세포 RNA 유래 NMP로부터 NTP를 제조하며, 이어서 상기 제조한 세포 RNA 유래 NTP 및/또는 외인성 천연 또는 변형 NTP로부터 NTP 용액을 제조하는 단계; (b) 관심 RNA 발현단위를 주형으로 RNA 중합효소 발현단위에 의해서 상기 제조한 NTP 용액의 NTP를 중합하여 상기 관심 RNA를 합성하는 단계; (c) 상기 무세포 시스템에 상기 합성된 관심 RNA를 첨가하여 상기 관심 RNA를 주형으로 단백질을 합성하며 여기서, 선택적으로 설계 발현단위에서 선택되어진 어느 하나 이상을 첨가하는 단계;를 제공한다.
본 발명의 이들 및 다른 특징 및 이점은 첨부된 청구범위와 함께 하기 상세한 설명으로부터 보다 완전하게 이해될 것이다. 청구범위의 범주는 청구범위에서의 설명에 의해서 정의되며, 본 설명에 제시된 특징 및 이점의 구체적인 논의에 의해서 정의되지 않는다는 것이 주목된다.
본 발명은 핵산, 특별하게는 RNA, 이들이 지시하는 단백질 및 구체적으로는 메신저 RNA(mRNA), 이들이 지시하는 단백질 및 구체적으로는 진핵생물 mRNA, 이들이 지시하는 단백질의 세포 및 무세포 생산 그리고 이들의 방법에 관한 것이다. 본 발명에 개시된 시약 및 방법은 저비용, 고효율 및 상업적으로 유용한 규모로 RNA 및/또는 유용물질의 무세포 및 세포 생산을 가능하게 한다.
도 1은 관심 RNA 및/또는 유용물질을 합성할 목적으로 Uncoupled transcription-translation을 실시하기 위해서, (i) 세포유래 NMP로부터 NTP를 합성하는 반응구, (ii) 세포유래 NTP로부터 관심 RNA 및/또는 유용물질을 합성하는 반응구, 및 (iii) 상기 두 반응구를 연결하는 TFF(Tangential Flow Filtration) 모듈을 포함하는 바이오리액터 (a), 그리고 (i) 세포배양 및 용해를 포함하는 전처리 단계, (ii) 세포유래 NMP로부터 NTP를 합성하는 단계 및 (iii) RNA 중합효소와 세포유래 NTP로부터 관심 RNA 및/또는 유용물질을 합성하는 단계를 포함하는 Uncoupled transcription-translation을 실시하는 흐름도(b)이고,
도 2는 관심 RNA 및/또는 유용물질을 연속 생산하는 바이오리엑터를 구성하는 한외여과 및 정용여과 시스템을 이용한 관심 RNA 및/또는 유용물질의 반응원료를 공급하고 부산물을 여과하는 개념에 대한 요약도이고,
도 3은 관심 RNA 절편은 <T7 promoter - 5'UTR - ctDdRp01 DNA- 전사 종결서열>이며, 이를 pUC19에 삽입하여 얻은 "pUC19 ctDdRp01" 및 RdRp 발현단위를 생성하기 위해, <T7 promoter - 5'UTR - RdRp를 코딩하는 오픈 리딩 프레임 DNA - 전사종결서열>을 순서대로 라이게이션하여 재조합 DNA를 제조하여. pUC 19 벡터에 삽입하여 얻은 "pUC19 RdRp"을 대장균에 형질전환한 후 분리하고 이들을 제한효소로 절단한 후, 전기영동한 이미지이고.
도 4는 관심 RNA 단위를 인코딩하는 관심 RNA 절편은 T7 promoter - 5'UTR - 관심 RNA - (Tethering domain)4 - 5'AES/mtRNR1 - A30LA70)이며 이를 t관심 RNA라고 하며, 플라스미드에 삽입하여 얻은 "pUC19 t관심 RNA" 및 관심 dsRNA 단위를 인코딩하는 관심 RNA 절편은 <DdRp가 작동하는 프로모터- 관심 RNA-전사 종결서열>로 pUC19에 삽입하여 얻은 "pUC19 ds관심 RNA"를 대장균에 형질전환한 후 분리하고 이들을 제한효소로 절단한 후, 전기영동한 이미지이고,
도 5는 관심 RNA 전사시스템을 구성하는 관심 RNA 발현단위에서 RNA가 dsRNA인 dsRNA 발현단위의 구조이고.
도 6은 증폭된 ctDdRp 발현단위와 관심 RNA 단위를 포함하는 PCR 산물을 선형화된 pUC19 벡터와 T4 DNA ligase를 이용하여 클로닝하여 얻은 "pUC19 ctDdRp01+관심 RNA"를 대장균에 형질전환한 후 분리하고 이들을 제한효소로 절단한 후, 전기영동한 이미지이고,
도 7은 증폭된 RdRp 발현단위와 관심 RNA 단위를 포함하는 PCR 산물을 선형화된 pUC19 벡터와 T4 DNA ligase를 이용하여 클로닝하여 얻은 "pUC19 RdRp + LacRdRp관심 RNA"대장균에 형질전환한 후 분리하고 이들을 제한효소로 절단한 후, 전기영동한 이미지이고,
도 8은 증폭된 DdRp 발현단위, RdRp DNA 절편과 T7RdRp관심 RNA 절편을 포함하는 PCR 산물은 선형화된 pUC19 벡터와 T4 DNA ligase를 이용하여 클로닝하여 얻은 "pUC19 Pus-X1-DdRp+RdRp+T7RdRp관심 RNA"를 대장균에 형질전환한 후 분리하고 이들을 제한효소로 절단한 후, 전기영동한 이미지이고,
도 9는 무세포 발현 시스템을 구성하는 조성물의 유전자들을 pET28t에 클로닝하여 얻은 재조합 플라스미드를 대장균에 형질전환한 후 분리하고 이들을 제한효소로 절단한 후, 전기영동한 이미지이고,
도 10은 관심 반딧물 루시퍼라제 RNA 전사시스템을 형질도입한 대장균에서 총 RNA를 분리하여 전기영동한 이미지이고,
도 11은 관심 반딧물 루시퍼라제 RNA 전사시스템이 반응시스템에서의 표기된 반응조성물에서 생산되는 반딧물 루시퍼라제 mRNA의 전기영동한 이미지이고,
도 12는 관심 반딧물 루시퍼라제 mRNA 전사시스템에서 생산된 반딧물 루시퍼라제 mRNA의 투여방법에 따른 생체내 발현 양상이고,
도 13은 반응물을 DNase-처리하고, RNA를 LiCl 침전에 의해 정제하고, RNA 품질을 BioAnalyzer로 전기영동한 결과로, 도 13a는 캡핑된 IVT-생산된 mRNA의 전기영동도이고 도 13b는 세포 RNA-유래된 뉴클레오타이드를 사용한 캡핑된 CFR-생산된 mRNA의 전기영동도이며. 도 13c는 정제된 4종류의 뉴클레오사이드 모노포스페이트의 동일 몰량 혼합물을 사용한 캡핑된 CFR-생산된 mRNA의 전기영동도이고,
도 14는 상기 TnT Quick Master Mix에 상기 반딧불 루시퍼라제 mRNA 전사시스템인 원형 플라스미드 DNA, NTP 혼합물 및 PVSA를 첨가한 반응용액을 배양한 후, DNase-처리하고, 합성된 반딧불 루시퍼라제 mRNA를 LiCl 침전에 의해 정제하고, RNA 품질을 BioAnalyzer(Agilent, 미국)를 사용하여 전기영동한 결과이고,
도 15는 His-tagged EPO 발현단위의 당화 결과를 확인한 결과로 15 a는 ppGalNAcT, C1GalT-1와 β-갈락토시드 α-2,3- 시알릴트랜스퍼라제 1(ST3Gal1) 유전자를 포함하는 발현단위의 발현산물에 의한 His-tagged EPO 발현단위의 산물에 대한 0-당화의 예시도이고, 15 b는 His-tagged EPO 발현단위를 상기 0-당화 유전자들이 있는 2-챔버 시스템에서 반응시킨 후, HisPur Cobalt Resin로 His-tagged EPO를 분리정제하고 Endo H, and O-Glycosidase를 처리하고 얻은 산물을 전기영동하고 면역분석한 이미지이고,
도 16은 한외여과(UF) 및 정용여과(DF) 시스템, 합성 시스템 및 DAE(Designed Amplifying Expression) 시스템(관심 RNA 발현단위, 설계 DNA 세트 및 Autogene 시스템으로 구성)을 사용한 관심 RNA 및/또는 유용물질의 연속생산을 위한 바이오리액터의 예시도이고,
도 17은 대장균 세포용해물(CL) 및 His 태그 단백질의 NiNTA resin in column의 관류(F), 세척 1(W1), 세척 2(W2), 용출 1-3(E1-E3)정제 단계에 얻은 용액에 대한 12% SDS-PAGE 분석(a) 및 정제된 mCherry을 포함하는 용액이 excitation : 587 nm과 Emission : 610 nm로 얻은 색상 이미지(b)이고.
도 18은 인테인 매개 단백질 트랜스-스플라이싱(intein-mediated protein trans-splicing; IMPTS)의 예시로 IMPTS에서 인테인의 N- 및 C-말단 단편(IntN 및 IntC)는 두 개의 서로 다른 폴리펩타이드에 각각 융합되어 있고, 환원된 상태에서 두 성분이 혼합되면 자발적인 반응이 일어나 두 폴리펩타이드 사이에 펩타이드 결합이 형성되고,
도 19는 IntC/Fab#1-Fc 복합체이고,
도 20은는 Fab#2-IntN 복합체이며,
도 21은 IntC/Fab#1-Fc 복합체와 Fab#2-IntN 복합체에 의해 제조된 BsAbs(a)와 IntC-IntN복합체이고,
도 22는 pAzF, OTS 시스템 및 인슐린 A와 B 사슬 유전자를 포함하는 무세포 시스템에서 제조한 시료를 SDS-PAGE 겔로 분석한 결과로 시료에서는 예상하는 5kDa 전후에서 밴드를 형성하였으며 2mMDTT와 함께 배양한 시료에서는 상응하는 밴드를 확인할 수 없었으며,
도 23는. TAMRA-인슐린과 HepG2 세포주의 반응 결과를 분석한 이미지이다
도 2는 관심 RNA 및/또는 유용물질을 연속 생산하는 바이오리엑터를 구성하는 한외여과 및 정용여과 시스템을 이용한 관심 RNA 및/또는 유용물질의 반응원료를 공급하고 부산물을 여과하는 개념에 대한 요약도이고,
도 3은 관심 RNA 절편은 <T7 promoter - 5'UTR - ctDdRp01 DNA- 전사 종결서열>이며, 이를 pUC19에 삽입하여 얻은 "pUC19 ctDdRp01" 및 RdRp 발현단위를 생성하기 위해, <T7 promoter - 5'UTR - RdRp를 코딩하는 오픈 리딩 프레임 DNA - 전사종결서열>을 순서대로 라이게이션하여 재조합 DNA를 제조하여. pUC 19 벡터에 삽입하여 얻은 "pUC19 RdRp"을 대장균에 형질전환한 후 분리하고 이들을 제한효소로 절단한 후, 전기영동한 이미지이고.
도 4는 관심 RNA 단위를 인코딩하는 관심 RNA 절편은 T7 promoter - 5'UTR - 관심 RNA - (Tethering domain)4 - 5'AES/mtRNR1 - A30LA70)이며 이를 t관심 RNA라고 하며, 플라스미드에 삽입하여 얻은 "pUC19 t관심 RNA" 및 관심 dsRNA 단위를 인코딩하는 관심 RNA 절편은 <DdRp가 작동하는 프로모터- 관심 RNA-전사 종결서열>로 pUC19에 삽입하여 얻은 "pUC19 ds관심 RNA"를 대장균에 형질전환한 후 분리하고 이들을 제한효소로 절단한 후, 전기영동한 이미지이고,
도 5는 관심 RNA 전사시스템을 구성하는 관심 RNA 발현단위에서 RNA가 dsRNA인 dsRNA 발현단위의 구조이고.
도 6은 증폭된 ctDdRp 발현단위와 관심 RNA 단위를 포함하는 PCR 산물을 선형화된 pUC19 벡터와 T4 DNA ligase를 이용하여 클로닝하여 얻은 "pUC19 ctDdRp01+관심 RNA"를 대장균에 형질전환한 후 분리하고 이들을 제한효소로 절단한 후, 전기영동한 이미지이고,
도 7은 증폭된 RdRp 발현단위와 관심 RNA 단위를 포함하는 PCR 산물을 선형화된 pUC19 벡터와 T4 DNA ligase를 이용하여 클로닝하여 얻은 "pUC19 RdRp + LacRdRp관심 RNA"대장균에 형질전환한 후 분리하고 이들을 제한효소로 절단한 후, 전기영동한 이미지이고,
도 8은 증폭된 DdRp 발현단위, RdRp DNA 절편과 T7RdRp관심 RNA 절편을 포함하는 PCR 산물은 선형화된 pUC19 벡터와 T4 DNA ligase를 이용하여 클로닝하여 얻은 "pUC19 Pus-X1-DdRp+RdRp+T7RdRp관심 RNA"를 대장균에 형질전환한 후 분리하고 이들을 제한효소로 절단한 후, 전기영동한 이미지이고,
도 9는 무세포 발현 시스템을 구성하는 조성물의 유전자들을 pET28t에 클로닝하여 얻은 재조합 플라스미드를 대장균에 형질전환한 후 분리하고 이들을 제한효소로 절단한 후, 전기영동한 이미지이고,
도 10은 관심 반딧물 루시퍼라제 RNA 전사시스템을 형질도입한 대장균에서 총 RNA를 분리하여 전기영동한 이미지이고,
도 11은 관심 반딧물 루시퍼라제 RNA 전사시스템이 반응시스템에서의 표기된 반응조성물에서 생산되는 반딧물 루시퍼라제 mRNA의 전기영동한 이미지이고,
도 12는 관심 반딧물 루시퍼라제 mRNA 전사시스템에서 생산된 반딧물 루시퍼라제 mRNA의 투여방법에 따른 생체내 발현 양상이고,
도 13은 반응물을 DNase-처리하고, RNA를 LiCl 침전에 의해 정제하고, RNA 품질을 BioAnalyzer로 전기영동한 결과로, 도 13a는 캡핑된 IVT-생산된 mRNA의 전기영동도이고 도 13b는 세포 RNA-유래된 뉴클레오타이드를 사용한 캡핑된 CFR-생산된 mRNA의 전기영동도이며. 도 13c는 정제된 4종류의 뉴클레오사이드 모노포스페이트의 동일 몰량 혼합물을 사용한 캡핑된 CFR-생산된 mRNA의 전기영동도이고,
도 14는 상기 TnT Quick Master Mix에 상기 반딧불 루시퍼라제 mRNA 전사시스템인 원형 플라스미드 DNA, NTP 혼합물 및 PVSA를 첨가한 반응용액을 배양한 후, DNase-처리하고, 합성된 반딧불 루시퍼라제 mRNA를 LiCl 침전에 의해 정제하고, RNA 품질을 BioAnalyzer(Agilent, 미국)를 사용하여 전기영동한 결과이고,
도 15는 His-tagged EPO 발현단위의 당화 결과를 확인한 결과로 15 a는 ppGalNAcT, C1GalT-1와 β-갈락토시드 α-2,3- 시알릴트랜스퍼라제 1(ST3Gal1) 유전자를 포함하는 발현단위의 발현산물에 의한 His-tagged EPO 발현단위의 산물에 대한 0-당화의 예시도이고, 15 b는 His-tagged EPO 발현단위를 상기 0-당화 유전자들이 있는 2-챔버 시스템에서 반응시킨 후, HisPur Cobalt Resin로 His-tagged EPO를 분리정제하고 Endo H, and O-Glycosidase를 처리하고 얻은 산물을 전기영동하고 면역분석한 이미지이고,
도 16은 한외여과(UF) 및 정용여과(DF) 시스템, 합성 시스템 및 DAE(Designed Amplifying Expression) 시스템(관심 RNA 발현단위, 설계 DNA 세트 및 Autogene 시스템으로 구성)을 사용한 관심 RNA 및/또는 유용물질의 연속생산을 위한 바이오리액터의 예시도이고,
도 17은 대장균 세포용해물(CL) 및 His 태그 단백질의 NiNTA resin in column의 관류(F), 세척 1(W1), 세척 2(W2), 용출 1-3(E1-E3)정제 단계에 얻은 용액에 대한 12% SDS-PAGE 분석(a) 및 정제된 mCherry을 포함하는 용액이 excitation : 587 nm과 Emission : 610 nm로 얻은 색상 이미지(b)이고.
도 18은 인테인 매개 단백질 트랜스-스플라이싱(intein-mediated protein trans-splicing; IMPTS)의 예시로 IMPTS에서 인테인의 N- 및 C-말단 단편(IntN 및 IntC)는 두 개의 서로 다른 폴리펩타이드에 각각 융합되어 있고, 환원된 상태에서 두 성분이 혼합되면 자발적인 반응이 일어나 두 폴리펩타이드 사이에 펩타이드 결합이 형성되고,
도 19는 IntC/Fab#1-Fc 복합체이고,
도 20은는 Fab#2-IntN 복합체이며,
도 21은 IntC/Fab#1-Fc 복합체와 Fab#2-IntN 복합체에 의해 제조된 BsAbs(a)와 IntC-IntN복합체이고,
도 22는 pAzF, OTS 시스템 및 인슐린 A와 B 사슬 유전자를 포함하는 무세포 시스템에서 제조한 시료를 SDS-PAGE 겔로 분석한 결과로 시료에서는 예상하는 5kDa 전후에서 밴드를 형성하였으며 2mMDTT와 함께 배양한 시료에서는 상응하는 밴드를 확인할 수 없었으며,
도 23는. TAMRA-인슐린과 HepG2 세포주의 반응 결과를 분석한 이미지이다
본 발명에는 RNA 및 구체적으로는 메신저 RNA(mRNA) 및 보다 더 구체적으로는 RNA 및/또는 유용물질의 무세포 및 세포 생산(생합성)을 위한 방법, 세포, 조성물 및 시스템 그리고 생산물이 제공된다.
하기에 추가로 구체적으로 언급된 바와 같은, 본 발명은 RNA를 위한 빌딩 블록을 공급하기 위해서 저비용의 규모 확대 가능한 출발 물질(또는 "바이오매스")을 사용하여 무세포 RNA 및/또는 유용물질을 생산하기 위한 방법 및 생산물을 제공한다. 하기에 추가로 구체적으로 언급된 바와 같은, 본 발명에 제공된 방법은 하기 일반적으로 기재된 개시된 관심 RNA 전사시스템, 무세포 조성물 및 세포 그리고 이들의 방법의 단계를 포함한다.
발명의 주제를 더욱 명확하게, 그리고 간결하게 기술하고 지시하기 위해, 하기 설명 및 첨부된 청구범위에서 사용되는 특정 용어에 대해 하기의 정의가 제공된다.
용어 "유용물질"은 생산물로 RNA, 단백질, 바이오베터, 뉴클레오티드, 아미노산. 에너지, 친환경 바이오 물질, 2차 대사산물 등을 포함하는 목적 대사산물을 지칭한다. 본 발명에서 제안하는 관심 RNA 및/또는 유용물질의 생산을 위한 합성 시스템은 관심 RNA 발현단위, 설계 DNA 세트 및 그 발현산물 그리고 Autogene 시스템 및 그 발현산물을 포함하는 설계 증폭발현(Designed Amplifying Expression, DAE) 시스템을 포함할 수 있다.
상기 RNA 중합효소 발현단위(Autogene)의 발현을 유도하여 세포용해를 유발할 수도 있다.
본 발명에서 목적 대사산물이 RNA인 경우, 본 발명의 DAE 시스템은 (i) 관심 RNA를 코딩하는 DNA 발현단위, (ii) 자가증폭하는 RNA 중합효소와 이에 의해 무한 증폭하는 자기 자신을 포함한 Autogene 시스템, 및 (iii) 관심 RNA 발현단위의 관심 RNA 대사경로에 있는 중간물질의 대사경로 유전자들, 뉴클레오티이드 kinases을 포함하는 설계 DNA 세트를 포함하며, 이들의 발현단위는 Autogene 시스템에 의해 무한 증폭되는 구성을 갖을 수 있다.
본 발명에서 목적 대사산물이 단백질인 경우, 본 발명의 DAE 시스템은 (i) 관심 RNA를 코딩하는 DNA 발현단위, (ii) 자가증폭하는 RNA 중합효소와 이에 의해 무한증폭하는 자기 자신을 포함한 Autogene 시스템, (iii) 관심 RNA 발현단위의 관심 RNA 대사경로를 구성하는 중간물질의 대사경로 유전자 발현단위 및 이들의 발현산물, 뉴클레오티이드 kinases을 포함하는 설계 DNA 세트, 및 (iv) 관심 RNA의 번역에 관련 대사경로를 구성하는 유전자 발현단위 및 그 발현산물들을 포함하며, 이들의 발현단위는 Autogene 시스템에 의해 무한 증폭되는 구성을 갖을 수 있다. 상기 목적 대사산물이 단백질인 경우, 상기 무세포 시스템은 추가적 선택적으로 (i) chaperones, ribosome 및 ribosomal factor; (ii) tRNA 및 aminoacyl-tRNA synthetase; (iii) Initiation factors, elongation factor 등의 관련 factors; (iv) ATP 및 GTP 등을 포함하는 에너지원; 및 (v) 20 표준 아미노산 및/또는 비자연 아미노산;을 포함하는 무세포 단백질 합성 반응시약을 포함할 수 있다.
특히, 비자연 아미노산을 포함하는 단백질을 이용하여 약물 운반체로도 사용할 수 있다.
본 발명에서 구축되는 설계 DNA 세트 및 그 발현산물로 유용물질을 생산할 수 있어 다양하게 재설계되는 설계 DNA 세트의 구성은 다양한 유용물질을 제공할 수도 있다.
또한, 본 발명에서 제안하는 합성 시스템은 반응물질로 내재물질을 활용하며 대사경로의 중간대사물질 또는 외래 반응원료를 첨가하여 유용물질을 생산할 수도 있다.
용어 "뉴클레오시드"는 핵산 염기 (핵염기)가 당 모이어티에 연결되어 있는 글리코실아민 화합물을 지칭한다. "뉴클레오티드"는 뉴클레오시드 포스페이트를 지칭한다. 뉴클레오티드는 공지된 바와 같이 그의 뉴클레오시드에 상응하는 알파벳 문자 (문자 명칭)를 사용하여 표현될 수 있다. 예를 들어, A는 아데노신 (핵염기 아데닌을 함유하는 뉴클레오시드)을 가리키고, C는 시티딘을 가리키고, G는 구아노신을 가리키고, U는 우리딘을 가리키며, T는 티미딘 (5-메틸 우리딘)을 가리킨다. N은 랜덤 뉴클레오시드를 나타내고, dNTP는 데옥시리보뉴클레오시드 트리포스페이트를 지칭한다. N은 A, C, G, 또는 T/U 중 어느 하나일 수 있다.
용어 "뉴클레오티드 유사체"는 천연 발생 뉴클레오티드와 구조적으로 유사한 화합물을 지칭한다. 뉴클레오티드 유사체는 변경된 포스페이트 골격, 당 모이어티, 핵염기, 또는 그의 조합을 가질 수 있다. 뉴클레오티드 유사체는 천연 뉴클레오티드, 합성 뉴클레오티드, 변형된 뉴클레오티드, 또는 대용 교체 모이어티 (예를 들어, 이노신)일 수 있다.
용어 "변형된 뉴클레오티드"는 당 변형 또는 염기 변형뿐만 아니라 백본 변형을 포함하는 화학적 변형이 있는 뉴클레오티드를 지칭한다. 본 발명의 화학적 변형 RNA 분자는 뉴클레오티드 유사체/변형체, 예를 들어, 백본 변형체, 당 변형체 또는 염기 변형체를 함유할 수 있다. 본 발명과 관련된 백본 변형은 핵산 분자에 함유된 뉴클레오티드의 백본의 포스페이트가 화학적으로 변형된 변형이다. 본 발명과 관련된 당 변형은 핵산 분자의 뉴클레오티드의 당의 변형이다. 더욱이, 본 발명과 관련된 염기 변형은 핵산 분자의 핵산 분자의 뉴클레오티드 염기 성분의 변형이다. 뉴클레오티드 유사체 또는 변형체는 바람직하게 전사 및/또는 번역에 적용할 수 있는 뉴클레오티드 유사체로부터 선택된다.
용어 "발현단위"는 RNA 또는 단백질 발현에 적격인 DNA 또는 RNA 서열을 지칭하며 이들의 산물을 '발현산물'라고 하였다. 본 발명의 발현단위는 DNA 발현적격 단위이거나 RNA 발현적격 단위일 수도 있다, 본 발명에서 발현단위는 그 발현산물을 포함하여 의미할 수도 있다. 달리 말하면, 발현단위는 하나 이상의 오픈 리딩 프레임 (ORF) 또는 기능적인 RNA(예를 들어, RNA 압타머, μRNA 등)를 인코딩하는 DNA에 작동가능하게 연결된 적어도 하나의 프로모터 및 조절서열을 포함하는 발현적격 단위이다. 하나 이상의 ORF는 하나 이상의 동일하거나 상이한 단백질을 코딩할 수도 있다. 일부 경우에, 발현단위는 1개를 초과하는 ORF에 작동가능하게 연결된 하나의 프로모터를 포함할 수 있다. 예를 들어, 발현서열은 하나는 단백질을 코딩하고 다른 하나는 다른 단백질을 코딩하는 2개의 상이한 ORF에 기능적으로 연결된 프로모터를 포함할 수 있다. 상기 발현단위는 RNA 중합효소에 주형으로 제공될 수 있으며 그 산물 RNA는 원핵생물 또는 진핵생물 각각에서 번역이 가능한 별도의 구조일 수 있다. 관심 RNA 발현단위는 진핵세포에서 효율적으로 번역하기 위해서. 리보좀이 결합할 수 있는 구조를 갖을 수 있다. 발현단위는 효율적인 단백질 발현을 보조하기 위한 서열 예컨대 캡-비의존적 번역요소(CITE) 또는 캡구조를 추가로 포함할 수도 있다. 또 리보좀이 결합할 수 있는 구조가 없을 수도 있다. 발현단위는 하기에 구체적으로 기술하였다. 상기 발현산물은 발현단위가 지시하는 단백질뿐만이 아니라 단백질이 효소인 경우, 효소의 반응산물로 RNA, 단백질, 바이오베터, 뉴클레오티드, 아미노산. 에너지, 친환경 바이오 물질, 2차 대사산물 등을 포함하는 목적 대사산물인 유용물질을 포함할 수도 있다.
I. 무세포 조성물
"무세포 생산"은 살아있는 세포를 사용하지 않고 생체분자 또는 화학적 화합물의 합성을 위한 생물학적 과정의 사용이다. 먼저, 이러한 방법에서, 세포를 용해시켜, 무세포 시스템을 생성한다. 둘 다 효소를 함유하는 비정제된(조) 분획 또는 부분적으로 정제된 분획을 목적하는 생성물의 생산을 위해 사용할 수 있다. 이러한 방법에서 사용되는 효소는 무세포 시스템에 첨가될 수 있는 정제된 효소이거나 또는, 효소 발현단위이다. 비제한적인 예로서, 세포를 배양하고, 수집하고, 고압 균질화 또는 다른 세포 용해 방법(예를 들어, 화학적 세포용해)에 의해 용해시킨다. 무세포 반응은 배취식 또는 공급-배취 방식으로 수행될 수 있다. 일부 예에서, 효소적 경로는 반응기의 작업 부피를 충전하고, 세포내 환경에서보다 더 희석될 수 있다. 그러나, 막 회합된 촉매를 비롯한 실질적으로 모든 세포성 촉매가 제공된다.
본 발명에서 무세포, 세포용해물 및 합성 시스템은 뜻 구분을 하지 않고 통상적으로 동일한 의미로 사용하였다.
바람직하게, 본 발명의 최소한 전사와 번역이 가능한 세포용해물은 무세포 발현 시스템 (또한 시험관 내 전사/번역, 무세포 단백질 발현, 무세포 번역, 또는 무세포 단백질 합성으로 공지되어 있음)을 지칭한다. 일반적인 무세포 발현 시스템은 무세포 전사-번역(cell-free transcription-translation, CFTT) 기전을 포함한다. 하나 이상의 해당분자를 생성하기 위해, 전형적인 CFTT 시스템은 미생물, 식물, 또는 동물 세포의 미정제 용해물로부터 에너지 생성 및 해당분자 합성에 필수적인 촉매 성분의 앙상블을 활용한다. 미정제 용해물은 DNA의 RNA로의 전사, RNA의 단백질로의 번역, 단백질 접힘, 및 에너지 대사에 필수적인 요소 (예로서, 리보솜, 아미노아실t RNA 합성효소, 번역 개시 및 신장 인자, 리보솜 방출 인자, 뉴클레오타이드 재생 효소, 대사 효소, 샤페론, 폴데이즈(foldase), 등)을 포함할 수 있다. 현재 사용되는 통상적인 세포 추출물은 대장균 (Escherichia coli, ECE), 토끼 망상적혈구 (rabbit reticulocytes, RRL), 밀 배아 (wheat germ, WGE), 및 곤충 세포 (ICE), 및 심지어 포유류 세포 (MC)로부터 제조된다. 최근에는 전사와 번역관련 생체분자들로 재구성된 최소한 전사과 번역이 가능한 시스템, PURE cell-free transcription-translation system도 상업화되었다.
바이오매스
본 발명에서 무세포 RNA 합성을 위한 세포용해물 및/또는 세포 RNA를 제공하기 위한 바이오매스는 진핵세포 또는 원핵세포를 일 수 있으며, 바람직하게는 손쉽게 세포용해물 및/또는 세포 RNA를 얻을 수 있는 세균, 대장균, 효모, 식물세포, 밀배아, 곤충세포, 또는 포유류세포를 포함한다.
본 발명에서는 무세포 RNA 합성을 위한 세포용해물 및/또는 세포 RNA를 얻기 위한 바이오매스로 대장균을 사용하였으며 특히, T7 RNA polymerase를 갖고 있는 대장균 BL21(DE3), BL21 Star (DE3), HT115(DE3) 및 SHuffle 균주를 사용하였으며, 각각 재조합 단백질 및 RNA를 독립적으로 발현하는 숙주세포로 많이 사용하고 있다. BL21(DE3)은 2개의 주요 프로테아제 인코딩 유전자가 결핍되어 있지만 활성 dsRNA 특이적 RNase III 인코딩 유전자가 있다. BL21 Star (DE3)는 낮은 mRNA 분해를 위한 rne131 돌연변이가 있는 균주이다. HT115(DE3)는 RNase III 인코딩 유전자가 없지만 프로테아제 인코딩 유전자를 포함하고 있다. 하나의 480bp 세그먼트(L4440-s3)가 있는 이중 T7-프로모터 플라스미드 L4440을 포함하는 대장균 HT115(DE3)는 RNAase III 결핍 균주로 dsRNA 생산에 사용되고 있다. 또한SHuffle 균주는 아황화 결합을 가능하게 한다.
일반적으로 사용되는 세균성 대장균 성장 배지는 LB(Lysogeny Broth) Miller 배지(1% NaCl): 1% 펩톤, 0.5% 효모 추출물 및 1% NaCl; LB(Lysogeny Broth) Lennox Broth(0.5% NaCl): 1% 펩톤, 0.5% 효모 추출물 및 0.5% NaCl; 2× YT 브로스(2× 효모 추출물 및 트립톤): 1.6% 펩톤, 1% 효모 추출물 및 0.5% NaCl; SOB 배지(Super Optimal Broth): 2% 펩톤, 0.5% 효모 추출물, 10mM NaCl, 2.5mM KCl, 10mM MgCl2, 10mM MgSO4; SOC 배지(이화 억제제가 있는 Super Optimal 브로쓰): SOB+20mM 글루코스; TB(Terrific Broth) 배지: 1.2% 펩톤, 2.4% 효모 추출물, 72mM K2 HPO4, 17mM KH2PO4 및 0.4% 글리세롤; 및 SB(Super Broth) 배지: 3.2% 펩톤, 2% 효모 추출물, 및 0.5% NaCl 및/또는 Korz 배지(Korz, DJ et al. 1995) 등 제한이 없다.
바람직하게, 대장균 균주의 고밀도 배양은 Korz 배지를 포함하는 1L 진탕 플라스크에서 배양하였다. Korz 배지는 13.3g/L KH2PO4, 4.0g/L (NH4)2HPO4, 1.2g/L MgSO4 7H2O, 1.7g/L citric acid monohydrate, 8.4mg/L Titriplex III, 2.5mg/L CoCl2 6H2O, 1.5mg/L CuCl2 2H2O, 3.0 mg/L H3BO3, 15.0 mg/L MnCl2 4H2O, 2.5 mg/L Na2MoO4 2H2O, 13.0 mg/L Zn(CH3-COO)2 2H2O, 100.0 mg/L Fe(III) citrate hydrate, 4.5 mg/L thiamine HCl 뿐만 아니라 다양한 농도의 d-glucose(2.0-30.0 g/L) 및 leucine(0-3.0 g/L)으로 구성하였다. 별도로 포도당, phosphate buffer 및 미량 원소를 121°C에서 15분 동안 고압멸균 처리한다.
고밀도 세균성 대장균 성장 배지의 예는 DNAGro™ 배지, ProGro™ 배지, AutoX™ 배지, DetoX™ 배지, InduX™ 배지 및 SecPro™ 배지를 포함하지만 이에 제한되지는 않는다.
세포는 효소 또는 핵산의 발현을 일으키는 조건하에 배양한다. 이러한 배양 조건은 발현되는 특정 제품 및 원하는 제품 양에 따라 달라질 수 있다.
세포는 30℃ 내지 40℃의 온도에서 배양한다. 예를 들어, 엔지니어링된 세포는 30℃, 31℃, 32℃, 33℃의 온도에서 배양될 수 있다. 34℃, 35℃, 36℃, 37℃, 38℃, 39℃ 또는 40℃. 전형적으로, 37°C의 온도에서 조작 된 대장균 세포와 같은 세포가 배양한다.
세포는 12시간 내지 72시간 또는 그 이상의 기간 동안 배양한다. 예를 들어, 엔지니어링된 세포는 12, 18, 24, 30, 36, 42, 48, 54, 60, 66, 또는 72시간의 기간 동안 배양될 수 있다. 일반적으로 엔지니어링된 박테리아 세포와 같은 세포는 12 내지 24시간 동안 배양한다. 세포는 37℃의 온도에서 12 내지 24시간 동안 배양한다.
세포는 600 nm(OD600)의 파장에서 측정된 5 내지 200의 광학 밀도로 (예를 들어, 액체 세포 배양 배지에서) 배양한다. 세포는 5, 10, 15, 20, 25, 50, 75, 100, 150 또는 200이다.
세포는 1 x 108 (OD 600 < 1) 내지 2 x 1011 (OD ~ 200) 생존 세포/ml 세포 배양 배지의 밀도로 배양한다. (전환 인자: OD 1=8×108 세포/ml).
세포 RNA는 효모를 통해서 쉽게 얻을 수도 있다. 숙주 세포로부터 유래된, 세포 용해물에 존재하는 RNA (예를 들어, 내인성 RNA)를 뉴클레아제에 의해 그의 구성요소 단량체로 전환시킨다. 바이오매스로부터의 RNA (예를 들어, 내인성 RNA)는 전형적으로 리보솜 RNA (rRNA), 메신저 RNA (mRNA), 운반 RNA (tRNA), 다른 RNA, 또는 이들의 조합을 포함한다. RNA의 해중합 또는 분해는 간단히 "단량체"로도 지칭되는 5'-뉴클레오시드 모노포스페이트 (5'-NMP)의 풀을 발생시킨다. 뉴클레오시드 디포스페이트로 전환되고, 뉴클레오시드 트리포스페이트로 전환되는 이들 단량체는 관심의 RNA의 하류 중합/합성을 위한 출발 물질로서 사용된다.
RNA 해중합 효소는 세포 RNA를 5'-NMP로 해중합시키는 리보뉴클레아제(예를 들어, 뉴클레아제 P1, RNase R)이다. RNA의 공급원으로서의 세포는 뉴클레아제를 발현하도록 조작될 수 있거나, 또는 뉴클레아제는 분리된 세포에 의해서 생산되고, 반응에 도입될 수 있다. 예를 들어, 효모로부터의 세포 RNA는 페니실리엄 시트리넘(Penicillium citrinum)에 의해서 생산된 뉴클레아제 P1에 의해서 해중합될 수 있다. 뉴클레아제 P1은 단일가닥 RNA 및 DNA를 RNA로 5' 뉴클레오사이드 모노포스페이트로 가수분해시키는 아연-의존성 단일-뉴클레아제이다. 이 효소는 염기 특이성이 없다.
RNA 합성을 위한 무세포
본 발명에서 전사와 번역이 가능한 무세포를 사용한 RNA 합성하는 조성물 및 방법을 제공한다. 본 발명에서 용해물은 전사관련 분자, 리보솜과 번역 보조 인자로 구성된 전사 및 번역에 필요한 분자 구성 요소를 제공하는 세포질 추출물이다. 그것의 준비는 네 가지 주요 단계로 구성된다: 세포 성장, 용해, 사전 배양 및 투석. 1L세포 배양은 일반적으로 12-20 ml의 무세포 반응에 적합한 4-8 ml의 용해물을 생성할 수 있다.
본 발명에서는 빠른 배양 성장률(3-4시간 후 OD 600값이 ~ 3임)은 리보솜이 풍부한 생산적인 용해물을 얻는 데 필수적이다. 이것은 2x YPT와 같은 리치 미디어를 사용하여 달성된다. 2X YT 성장 배지에 인산염(22mmol/L 포타슘 포스페이트 1염기 및 40mmol/L 포타슘 포스페이트 2염기성)을 첨가하면 일정한 pH를 유지하고 용해물의 포스파타제 활성을 낮춘다. 본 발명의 무세포 반응을 조립한 후 낮은 포스파타제 활성은 핵산 및 에너지 대사산물의 중요한 전구체인 리보뉴클레오사이드, ATP 및 GTP의 빠른 분해를 방지한다. 대장균 BL21 DE3 균주는 여러 프로테아제의 유전적 결실과 함께 세포 용해 전에 T7 RNA 중합효소를 생산하는 편리함을 제공한다.
세포 용해 후 상층액은 펠릿의 파편을 방해하지 않고 피펫으로 회수한다. 상층액을 새로운 멸균 튜브에 넣고 배양하여 내인성 mRNA를 분해한다. 사전 배양은 또한 용해물를 활성화하는 내인성 전사 및 번역이 완료될 수 있도록 한다. 원심분리는 DNA를 제거한다. 꼭 필요한 것은 아니지만 세 번째 단계는 용해물을 저장하기 전에 투석을 하여 10kDa보다 작은 분자 구성요소를 제거하여 RNA 수율을 향상시킬 수 있다.
가장 생산적인 용해물의 단백질 농도는 30-50 mg/ml이지만, 선호하는 용해물 단백질 농도는 약 30 mg/ml이며, 이는 대장균 세포질의 약 10배 희석이다. 단백질 농도가 이 범위를 벗어난 용해물의 경우 새로운 용해물을 준비해야 한다. 세포 추출물은 항생제가 없는 한천 플레이트에 일부를 플레이팅하여 무세포임을 확인할 수 있다. 모든 살아있는 세포가 성장하여 용해물에 남아 있는 살아있는 세포의 농도를 추정할 수 있다.
DNA 템플릿의 준비
DNA 템플릿의 적절한 선택, 준비 및 보관은 고성능 무세포 RNA 합성을 달성하는 데 중요하다. DNA는 먼저 상업적으로 이용 가능한 DNA 준비 키트를 사용하여 준비할 수 있다. 무세포 RNA 합성에 대한 고품질 DNA를 얻으려면 PCR 정제 키트를 사용하여 후속적으로 세척한 후 고압 멸균된 18.2 MΩ cm/L 물로 용출한다. 고품질 DNA 템플릿은 흡광도 측정으로 A260/280이 1.8-2.0이 이상적이다. 원형 플라스미드와 선형 DNA 모두 사용할 수 있지만 플라스미드는 최대 2배 선형 PCR 제품보다 더 큰 CFE 활성이 더 높다. 선형 DNA는 프로테아제 RecBCD에 의해 분해될 수 있기 때문에 플라스미드는 선형 DNA보다 CFE 반응에서 더 안정적입니다. 그럼에도 불구하고, 특히 PCR의 선형 DNA 템플릿은 원형 플라스미드 DNA에 비해 더 빠르고 저렴한 준비로 인해 많은 응용 분야에 매력적인 이점을 제공한다. 또한, CFE 반응의 분해를 제한하기 위해 간단하고 저렴한 방법을 사용할 수 있다.
T7 전사시스템의 구성요소인 T7 RNA 중합효소와 T7p14 프로모터는 보편적이고 강력하며 접근 가능한 무세포 RNA 합성를 제공한다. 따라서 T7p14 프로모터/비번역 영역 아래에 복제되고 T7 터미네이터를 포함하는 egfp 유전자가 있는 플라스미드는 무세포 RNA 합성 시스템의 효율성을 평가하는 데 이상적이다. 무세포 RNA 합성 반응에서 플라스미드 농도가 일반적으로 0 ~ 20 nmol/L 로 다양하기 때문에 >100 nmol/L의 DNA 스톡 용액이 이상적이다.
무세포 단백질 합성
일반적으로 세포 내에서 행해지고 있는 단백질의 합성반응은 먼저 유전 정보를 가진 DNA로부터 그 정보가 mRNA에 전사된 후, 리보솜이 mRNA의 정보를 번역하여 단백질을 합성하게 된다. 이와 같이 세포 내에 있어서의 단백질 합성을 시험관 등의 생체 외에서 행하는 무세포 단백질 합성(cell-free protein synthesis)은 세포에서 단백질 생산에 관련되는 세포 내 단백질 합성기구와 이의 인자들만을 추출하여 세포 외부에서 세포의 생리적 조절 기작이 배제된 상태로 단백질의 합성 과정만을 인위적으로 반복시켜 단기간에 목적 단백질을 대량 생산하는 기술로서, 요구되는 단백질 생합성 기구 즉, 리보좀, 개시인자, 신장인자, 종결인자, 아미노아실티알엔에이(aminoacyl tRNA) 합성효소 등은 세포 추출액에 포함된 것을 이용하거나 별개로 추가하여 사용할 수 있다.
본 발명에서 무세포 시스템에서 투입되는 효소를 인코딩하는 DNA에서 전사되는 mRNA를 주형으로 단백질 합성에 필수적인 Aminoacyl-tRNA는 아미노산을 개별적으로 리보솜으로 운반하여 단백질을 합성할 수 있다. 각 tRNA가 동족 아미노산을 얻기 위해 동족 아미노아실-tRNA 합성효소(aminoacyl-tRNA synthetases, AARS)가 반응을 촉매하여 아미노산을 tRNA 3'-말단에 부착하여 "하전된" 상태를 초래한다. 신장 인자 단백질은 아미노아실화된 또는 "하전된" tRNA를 리보솜의 유리 A 자리로 수송하고 올바른 tRNA 안티코돈과 각 mRNA 코돈의 정확한 연관을 보장한다. tRNA는 단백질 합성이 완료될 때까지 아미노산을 하나씩 제공한다. 단백질 합성은 tRNA 및, 아미노아실-tRNA 합성효소를 사용한 촉매적 아미노아실화 및 편집 메커니즘이 중요하다.
본 발명에서 DNA dependent RNA polymerase(DdRp)와 특정 효소를 포함하는 "배양된 세포를 용해시키는 것"을 지칭하지만, 단일 배양물(예를 들어, RNA를 합성하는 데 필요한 모든 효소를 함유함)로부터 얻어진 세포의 클론 집단을 용해시키는 것뿐만 아니라 각각 상이한 세포 배양물(예를 들어, DdRp를 포함한 각각 RNA 및/또는 세포 RNA 기질을 합성하는 데 필요한 1종 이상의 효소를 함유함)로부터 얻어진 세포의 1종 초과의 클론 집단을 용해시키는 것을 포괄하는 것으로 의도됨이 이해되어야 한다.
유도성 프로모터에 의해 발현하는 DdRp를 포함하는 세포에서 본 발명의 무세포 RNA 합성 공정에서 무세포에서 원하는 효소(뉴클레아제, RNase inhibitor 및 키나제 등)들 발현단위를 DdRp에 의해 발현을 유도할 수 있다. 예를 들어, 특정 키나제 발현단위를 포함하는 무세포(예를 들어, 엔지니어링된 무세포)의 집단을 상기 효소 발현단위를 함께 배양하고, 이를 사용하여 1종의 무세포 시스템을 생산할 수 있고, 상이한 키나제 발현단위를 포함하는 무세포(예를 들어, 엔지니어링된 무세포)의 또 다른 집단을 함께 배양하고, 이를 사용하여 또 다른 무세포용해물을 생산할 수 있다. 그 후, 각각 상이한 키나제 발현단위를 포함하는 이들 2 발현단위 종 이상의 무세포용해물을 본 발명의 무세포 mRNA 생합성 방법에 사용하기 위해 배합할 수 있다.
본 발명의 실시형태에서, 효소 활성이 유지되는 것이 바람직한 효소, 예컨대, 키나제의 존재 하에서, 열을 사용하여 바람직하지 않은 효소 활성을 불활성화시키는 경우, 이러한 효소, 예컨대, 키나제의 열안정성 변이체가 이롭게 사용된다.
바이오매스 리보핵산의 뉴클레오사이드 모노포스페이트로의 분해
본 발명은 일련의 효소적 반응을 포함하는 무세포 공정을 통해서 바이오매스로부터의 RNA(예를 들어, 내인성 세포 RNA)를 바람직한 관심 RNA로 전환시키는 것에 기초한다. 먼저, 세포 RNA로부터 유래된, 반응용액에 존재하는 RNA(예를 들어, 내인성 RNA)를 뉴클레아제에 의해 이의 구성요소 단량체로 전환시킨다. 용어 "바이오매스"는 세포 물질의 전체 물질을 의미하도록 의도되고, 탄수화물, DNA, 지질, 단백질, RNA 및 이들의 단편을 포함하지만 이들로 제한되지 않는다. 선택적으로, RNA는 단량체로 전환되기 전에 정제될 수 있다. 바이오매스로부터의 RNA(예를 들어, 내인성 RNA)는 전형적으로 리보솜 RNA(rRNA), 메신저 RNA(mRNA), 트랜스퍼 RNA(tRNA), 다른 RNA 또는 이들의 조합물을 포함한다. 적절한 뉴클레아제, 예를 들어, 5'-뉴클레오사이드 모노포스페이트(5'-NMP)를 생산하는 뉴클레아제를 사용한 RNA의 분해 또는 분해는 간단히 "단량체"로도 지칭되는 5'-NMP의 풀을 초래한다. 뉴클레오사이드 다이포스페이트로 전환되고, 뉴클레오사이드 트라이포스페이트로 추가로 전환되는 이들 단량체는 mRNA의 하류 중합/합성을 위한 출발 물질로서 사용된다. 단량체는 변형된 골격 계통을 갖거나 대안적인 염기, 즉, 티오에이트이고, 전문화된 뉴클레아제로 분해되고, 전문화된 키나제로 인산화된다. NTP의 상업적인 양의 생산은 국제 출원 제PCT/US2018/05535호(발명의 명칭: "Methods and Compositions for Nucleoside Triphosphate and Ribonucleic Acid Production")를 참조하였다.
관심 RNA를 합성하는 데 요구되는 RNA(예를 들어, 내인성 RNA)의 양은 예를 들어, 특정 mRNA의 바람직한 길이 및 수율뿐만 아니라 세포의 RNA(예를 들어, 대장균 또는 효모 세포로부터의 내인성 RNA)의 뉴클레오타이드 조성에 대한 mRNA의 뉴클레오티드 조성에 따라 달라질 수 있다. 전형적으로, 박테리아 세포에 대해, 예를 들어, RNA(예를 들어, 내인성 RNA) 함량은 총 세포 질량의 5 내지 50%의 범위인 반면, 진핵생물 세포의 경우에 그 양은 약 20%이다. 출발 물질의 질량 백분율은 예를 들어, 하기 방정식을 사용하여 계산될 수 있다:(RNA의 킬로그램(kg)/건조 세포 중량의 킬로그램)×100%.
내인성 RNA는 화학적 또는 효소적 수단에 의해 이의 구성요소 단량체로 분해되거나 분해될 수 있다. 그러나, RNA의 화학적 가수분해는 전형적으로 2'- 및 3'-NMP를 생성시키는데, 이는 RNA로 중합될 수 없다. 따라서, 본 발명에 제공된 바와 같은 방법, 조성물 및 시스템은 주로 내인성 RNA의 분해를 위한 효소를 사용한다. "RNA를 분해시키는 효소"는 RNA 분자에서 2개의 뉴클레오타이드 사이의 포스포다이에스터 결합의 가수분해를 촉매한다. 따라서, "RNA를 분해시키는 효소"는 RNA(세포 RNA)를 이의 단량체 형태, 뉴클레오사이드 모노포스페이트(NMP) 또는 뉴클레오사이드 다이포스페이트(NDP)로 전환시킨다.
효소에 따라, RNA의 효소적 분해는 3'-NMP, 5'-NMP, 3'-NMP와 5'-NMP의 조합물 또는 5'-NDP를 산출할 수 있으나, 3'-NTP(3'-NDP로부터 전환되며, 이는 3'-NMP로부터 전환됨)를 중합시키는 것이 가능하지 않기 때문에, 5'-NMP(이는 그 후 5'-NDP로, 그 후 5'-NTP로 전환됨) 또는 5'-NDP(이는 그 후 5'-NTP로 전환됨)를 산출하는 효소, 예컨대, 뉴클레아제 P1 또는 PNPase가 바람직하다. 3'-NMP를 산출하는 효소는 엔지니어링된 세포의 게놈 DNA로부터 제거되어 RNA 생산의 효율을 증가시킨다. RNA 분해에 사용되는 효소는 뉴클레아제 P1이다. 사용되는 뉴클레아제 P1의 농도는 0.1 내지 3.0㎎/㎖(예를 들어, 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1.0, 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2.0, 2.1, 2.2, 2.3, 2.4, 2.5, 2.6, 2.7, 2.8, 2.9, 3.0㎎/㎖)이다. 사용되는 뉴클레아제 P1의 농도는 1 내지 3㎎/㎖이다.
RNA를 분해시키는 효소의 예는 비제한적으로 리보뉴클레아제(RNase R, 예를 들어, RNase R)를 비롯한 뉴클레아제(예를 들어, 뉴클레아제 P1)를 포함한다. 뉴클레아제는 보다 작은 성분(예를 들어, 뉴클레오사이드 모노포스페이트라고도 지칭되는 단량체 또는 올리고뉴클레오타이드)으로의 핵산의 분해를 촉매한다. 포스포다이에스터라제는 포스포다이에스터 결합의 분해를 촉매한다. RNA를 분해시키는 이들 효소는 전장 유전자에 의해 또는 유전자 융합물(예를 들어, 2종의 상이한 효소 활성을 암호화하는 적어도 2종의 상이한 유전자(또는 유전자의 단편)를 포함하는 DNA)에 의해 암호화될 수 있다.
RNase는 세포에서 RNA 성숙 및 턴 오버를 조절하는 기능을 한다. 각각의 RNase는 특이적 기질 선호도를 갖는다. 따라서, 상이한 RNase의 조합물 또는 상이한 뉴클레아제의 조합물은 일반적으로 바이오매스-유래된 RNA(예를 들어, 내인성 RNA)를 분해시키는 데 사용될 수 있다. 예를 들어, 1 내지 2, 1 내지 3, 1 내지 4, 1 내지 5, 1 내지 6, 1 내지 7, 1 내지 8, 1 내지 9, 또는 1 내지 10종의 상이한 뉴클레아제가 RNA를 분해시키는 데 조합으로 사용될 수 있다. 적어도 1종, 적어도 2종, 적어도 3종, 적어도 4종, 적어도 5종, 적어도 6종, 적어도 7종, 적어도 8종, 적어도 9종, 또는 적어도 10종의 상이한 뉴클레아제가 RNA를 분해시키는 데 조합으로 사용될 수 있다. 본 발명에 제공된 바와 같이 사용하기 위한 뉴클레아제의 비제한적 예를 표 1에 포함시킨다. 사용되는 뉴클레아제는 뉴클레아제 P1이다.
효소 | 유기체 | EC # | UniProt |
뉴클레아제 P1 (P1 뉴클레아제) |
페니실리엄 시트리널 | 3.1.30.1 | P24289 |
RNase II | 대장균 | 3.1.13.1 | P30850 |
RNase III | 대장균 | 3.1.26.3 | POA7YO |
RNase R | Pseodomonas putida 또는 대장균 | 3.1.13.- | R9V9M9; P21499 |
RNase JI | Bacillus subtilis | 3.1.4.1 | Q45493 |
NucA | Serratia marcescens | 3.1.30.2 | P13717 |
RNase T | 대장균 | 3.1.27.3 | P30014 |
RNase E | 대장균 | 3.1.26.12 | P21513 |
PNPase | 대장균 | 2.7.7.8 | P05055 |
RNA를 분해시키는 효소(예를 들어, RNase)는 숙주세포에 대해 내인성(숙주-유래됨)일 수 있거나, 이들은 숙주세포 내로 외인적으로 도입된 엔지니어링된 핵산(예를 들어, 에피솜 벡터 상에 있거나, 숙주세포의 게놈 내로 통합됨)에 의해 암호화될 수 있다. 대안적으로, 효소를 상업적으로 공급된 단리된 단백질을 포함하는 단리된 단백질로서 반응에 첨가할 수 있다. 효소를 내인적으로 생산하는 세포 또는 효소를 생산하도록 엔지니어링된 세포로부터 부분적으로 정제된 효소를 포함하는, 부분적으로 정제된 효소를 반응에 사용할 수 있다.
무세포 반응용액에서 세포 RNA를 배양시키기 위해서, RNA의 분해를 초래하는 조건은 당업계에 공지되어 있거나, 예를 들어, pH, 온도, 시간의 길이 및 무세포 시스템의 염 농도뿐만 아니라 임의의 외인성 보조인자를 비롯한 특정 뉴클레아제(예를 들어, 뉴클레아제 P1) 활성을 위한 최적 조건을 고려하여, 당업자에 의해 결정될 수 있다. 이러한 반응 조건에 대한 예는 이전에 기재된 것을 포함한다(예를 들어, 문헌[Wong et al., 1983,J. Am. Chem. Soc. 105: 115-117], 유럽 특허 제EP1587947B1호 또는 문헌[Cheng and Deutscher, 2002, J Biol Chem. 277:21624-21629] 참고). 금속 이온(예를 들어, Zn2+, Mg2+)이 분해 반응을 위해 부족하다. 금속 이온(예를 들어, Zn2+, Mg2+)의 농도는 8mM 이하(예를 들어, 8mM 미만, 7mM 미만, 6mM 미만, 5mM 미만, 4mM 미만, 3mM 미만, 2mM 미만, 1mM 미만, 0.5mM 미만, 0.1mM 미만 및 0.05mM 미만)이다. 금속 이온(예를 들어, Zn2+, Mg2+)의 농도는 0.1mM 내지 8mM, 0.1mM 내지 7mM 또는 0.1mM 내지 5mM이다. 바람직하게, 금속 이온은 Zn2+이다.
RNA 분해 반응 동안의 무세포 시스템의 pH는 3 내지 8의 값일 수 있다. 또는 pH는 5.8이다. 무세포 시스템의 pH는 필요에 따라 조정될 수 있다.
RNA 분해 반응 동안 무세포 시스템의 온도는 15℃ 내지 99℃이다.
RNA 분해 반응 동안 무세포 반응용액은 24시간 동안 70℃의 온도에서 배양된다. RNA 분해 반응 동안 반응용액은 5 내지 30분 동안 70℃의 온도에서 배양된다. RNA 분해 반응 동안 반응용액은 5 내지 5.5의 pH를 갖고, 15분 동안 70℃의 온도에서 배양된다. RNA 분해 반응 동안 반응용액은 RNA가 NDP 또는 RNA가 5'-NMP로 65%를 초과하게 전환되는 조건 하에서 배양될 수 있다. RNA는 (또는 적어도) 50mM/hr, 100mM/hr 또는 200mM/hr의 속도로 NDP 또는 5'-NMP로 전환된다. 다른 실시형태에서, RNA 분해 반응 동안 반응용액은 더 높은 온도(예를 들어, 50℃ 내지 70℃)에서 배양된다.
RNA 분해 반응을 달성하기 위해서 생산되는 무세포 시스템은 5분(min) 내지 72시간(hr) 동안 배양될 수 있다. RNA 분해 반응 동안 무세포 시스템은 5 내지 10분, 5 내지 15분, 5 내지 20분, 5 내지 30분 또는 5분 내지 48시간 동안 배양된다. RNA 분해 반응 동안 무세포 시스템은 24시간 동안 37℃의 온도에서 배양된다. RNA 분해 반응 동안 무세포 시스템은 5 내지 10분 동안 70℃의 온도에서 배양된다. RNA 분해 반응 동안 무세포 시스템은 5 내지 5.5의 pH를 갖고, 15분 동안 70℃의 온도에서 배양된다. RNA 분해 반응 동안 무세포 시스템은 RNA가 5'-NMP로 65%를 초과하게 전환되는 조건 하에서 배양될 수 있다. RNA는 (또는 적어도) 50mM/hr, 100mM/hr 또는 200mM/hr의 속도로 5'-NMP로 전환된다.
예를 들어, 효소 응집을 방지하기 위해서, 염을 무세포 시스템에 첨가한다. 예를 들어, 염화나트륨, 염화칼륨, 아세트산나트륨, 아세트산칼륨 또는 이들의 조합물을 무세포 시스템에 첨가할 수 있다. RNA 분해 반응 동안 무세포 시스템 중의 염의 농도는 5mM 내지 1M일 수 있다. RNA 분해 반응 동안 무세포 시스템 중의 염의 농도는 5mM, 10mM, 15mM, 20mM, 25mM, 50mM, 100mM, 150mM, 200mM, 250mM, 500mM, 750mM 또는 1M일 수 있다. 무세포 시스템은 40 내지 60mM의 인산칼륨, 1 내지 5mM의 MnCl2 및 /또는 10 내지 50mM의 MgCl2(예를 들어, 20mM MgCl2)를 포함한다.
완충액은 예를 들어, 특정 pH 값 및/또는 염 농도를 달성하기 위해서 무세포 시스템에 첨가된다. 완충액의 예는 비제한적으로 인산염 완충액, Tris 완충액, MOPS 완충액, HEPES 완충액, 시트레이트 완충액, 아세테이트 완충액, 말레이트 완충액, MES 완충액, 히스티딘 완충액, PIPES 완충액, 비스-tris 완충액 및 에탄올아민 완충액을 포함한다.
뉴클레아제 P1을 사용하여 바이오매스를 분해시킨다. 뉴클레아제 P1을 후속 단계 이전에 반응용액에서 여과한다. RNA의 분해는 5'-AMP, 5'-UMP, 5'-CMP 및 5'-GMP를 포함하는 5'-NMP의 생산을 초래할 수 있다. RNA의 분해는 임의의 미리 결정된 비율의 NMP를 초래하지 않지만, 세포 RNA의 조성에 좌우될 것이라고 이해되어야 한다.
PNPase를 사용하여 바이오매스를 분해시킷 우 있다. PNPase를 후속 단계 이전에 반응용액에서 불활성화되거나 제거된다. 인산염의 존재 하에서의 RNA의 분해는 5'-ADP, 5'-UDP, 5'-CDP 및 5'-GDP를 포함하는 5'-NDP의 생산을 초래할 수 있다. RNA의 분해는 임의의 미리 결정된 비율의 NDP를 초래하지 않지만, 세포 RNA의 조성에 좌우될 것이라고 이해되어야 한다. 본 발명에 사용된 바와 같이, NDP를 제조하기 위한 PNPase의 사용은 인산염의 사용을 요구한다.
용해 시 세포 중의 내인성 RNA 중 50 내지 98%는 5'-NMP 또는 5'-NDP로 전환된다(분해된다). 예를 들어, 50 내지 95%, 50 내지 90%, 50 내지 85%, 50 내지 80%, 75 내지 98%, 75 내지 95%, 75 내지 90%, 75 내지 85% 또는 75 내지 80%의 RNA는 5'-NMP로 전환된다(분해된다). 용해 시 세포중의 내인성 RNA 중 65 내지 70%는 5'-NMP 또는 5'NDP로 전환된다(분해된다). 더 낮은 수율이 또한 허용 가능하다.
RNA 분해 효소의 제거 또는 불활성화
본 발명은 무세포 mRNA 반응용액에서 합성된 RNA 분해를 관리하는 효율적인 방법에 관한 것으로 뉴클레아제 억제제 부류, 예를 들어 RNase inhibitor(RI)의 사용에 관한 것이다. RI는 뉴클레아제, 특히 RNase에 결합하여 이를 억제한다. 본 발명은 RNase 및 기타 뉴클레아제와 관련된 적용에 유용한 정제된 완충액 및 시약을 생성하기 위한 연구에 사용되는 완충액 및 기타 시약으로부터 이들 RNase 및 기타 뉴클레아제를 제거하거나 불활성하는 방법을 제공한다. 본 발명은 확인된 억제제 중 하나 이상을 사용하여 RNase 및 기타 뉴클레아제를 억제하는 방법을 제공한다. 본 발명은 또한 생물학적 배지로부터 원하지 않는 RNase 및 기타 뉴클레아제를 제거하기 위한 방법 및 물질에 관한 것이다.
생화학 연구 및 생명공학은 고분자 핵산에 의존한다. 그러나 보관 및 사용 중에 핵산은 의도적으로든 의도하지 않든 뉴클레아제와 연관이 있다. 예를 들어, 뉴클레아제는 종종 무세포 RNA 반응용액 샘플에서 RNA를 파괴할 목적으로 추가되거나 그 반대의 경우도 마찬가지이다. 이러한 뉴클레아제의 잔류량은 프로토콜의 다운스트림 단계에 영향을 미칠 수 있다.
시험관 내에서 RI는 RNase 오염이 잠재적인 문제인 다양한 분자 생물학 응용 분야에서 유용하다. 이러한 응용 프로그램의 예에는 RNA 분리, 정제 및 저장, 특히 mRNA 분리 및 정제, RNA 특성화 또는 사용 분석, mRNA의 역전사, 무세포 번역 시스템, RNase 무첨가 항체 제조, 역전사-PCR 및 시험관내 바이러스 복제가 있다. 이상적으로, 이러한 종류의 응용 분야에 사용되는 RI는 진핵생물 RNase A, RNase B 및 RNase C와 같은 다양한 RNase와 원핵생물 RNase를 억제할 수 있다. 다양한 적용을 위한 RI가 무세포 RNA 반응용액에도 필요하다.
최근에 MES(2-(N-morpholino)ethane sulfonate)-NaOH 완충액(pH 6.0)은 낮은 염 농도에서 RNase A 및 K7A/R10A/K66A로 명명된 이의 변이체에 의한 촉매 작용을 억제한다. 이 억제제는 폴리머가 아닌 음이온성인 "고하전"이다. 이 완충액은 RNase 억제의 기원은 "일반적인 완충액에서 낮은 수준의 작은 음이온"이다. K7A/R10A/K66A RNase A 변이체는 야생형 효소보다 양이온성 잔기가 3개 적으며 인산기 결합에 대해 알려진 4개의 하위 사이트 중 2개가 효과적으로 결여되어 있다. MES-NaOH(2-(N-모르폴리노)에탄 설포네이트-NaOH) 완충제에서 비닐 설폰산의 상대적으로 저분자량 올리고머로서 억제제(들)이다.
뉴클레오사이드 및 뉴클레오타이드를 비롯한 다양한 저분자량 RNase 억제제가 있다. 본 발명에서 저렴한 화학적(비생물학적) RI로 우리딘-바나데이트(uridine-vanadate, UV)는 pH 7에서 Ki=10μM인 특히 강력한 RNase 억제제이다. 리보뉴클레오사이드 바나딜 복합체 혼합물은 세포 용해 및 mRNA 정제 등에 사용되고 이인산기를 갖는 뉴클레오티드인 RNase 억제제이다. 추가로 보고된 리보눌세아제 억제제에는 특정 점토(예: 벤토나이트 및 마칼로이드), 특정 계면활성제(예: SDS, EDTA); 프로테이나제 K 및 황산암모늄이다.
특정 다중음이온은 RNase A의 효과적인 억제제로 보고되었다. 헤파린, 티로신-글루타메이트 공중합체, 다양한 폴리설페이트 및 폴리포스페이트가 효소에 의한 촉매 작용을 억제한다.
폴리(비닐설폰산)(또는 폴리(비닐 설포네이트), 폴리에틸렌설폰산(PES)은 pH 7.6에서 RNase 활성을 억제한다. 5,700(g/mol)에서 27,600(g/mol) 범위의 분자량을 갖는 PVSA 샘플을 다양한 농도에서 RNase의 억제에 대해 평가되었다. RNase의 억제율은 일반적으로 PVSA의 분자량이 증가하고 존재하는 PVSA의 양이 증가함에 따라 증가한다. 평가된 가장 낮은 분자량 PVSA에 대해 제시된 결과는 일관된 억제를 확인할 수 없었다. 분자량 5,700의 PVSA는 중간 농도에서 억제를 나타내었고, 그러나 더 낮거나 더 높은 농도에서는 없다. 분자량 6400의 PVSA는 더 낮은 농도에서 RNase의 자극을 나타내고 더 높은 농도에서 RNase의 억제를 확인하였다. 분자량 12,900의 PVSA에 의한 RNase 억제에 대해 보고된 결과도 제시된 데이터의 일반적인 경향과 일치하지 않았다. 분자량이 9,000보다 큰 더 긴 중합체만이 RNase의 우수한 억제제이다.
특히, 황산염 가지가 있는 음으로 하전된 중합체인 폴리비닐 설폰산(PVSA, 평균 MW ~2-5kDa)은 RNase A의 강력한 억제제이다. 분자량과 억제제의 연관성이 있으며, 반복되는 황산염 단위는 RNA의 백본을 형성하는 반복되는 인산염 단위와 유사하고 RNase A와 전하의 경쟁적인 쿨롱 상호작용을 형성하여 RNA 결합 부위를 점유하고 RNase A를 효과적으로 억제한다. PVSA(Polyvinyl Sulfonic Acid, 평균 MW ~2-5kDa)는 RNase의 억제 IC50은 0.15 mg/mL이며 13 mg/mL 이상의 PVSA 농도에서 95% 이상의 억제 효과가 있다.
PVSA는 또한 DNase의 강력한 억제제이다. 폴리비닐 설포네이트가 "매우 강력한 억제제"로 기술된 황산화 폴리비닐 알코올과 비교하여 리보뉴클레아제(췌장)의 "상당히 효과적인" 억제제이다. 폴리비닐 설포네이트에 의한 억제는 염화나트륨 농도가 증가함에 따라 현저하게 감소한다. 이 실험에 사용된 폴리비닐 설포네이트의 분자량은 보고되지 않았다.
비장 mRNA의 분리가 폴리비닐설페이트 또는 벤토나이트와 같은 RNase 억제제의 존재하에 수행할 수 있다. 활성 단백질 합성을 위해 무세포 시스템에서 폴리비닐 설폰산을 사용할 수도 있다.
MES 완충제의 오염물이 다수의 진균 NADP 의존성 탈수소효소를 억제한다. 억제제는 '에틸렌술폰산 올리고머'로 확인돼 항진균제 개발의 '모델 화합물'이다. MES 완충액은 에틸렌설폰산(즉, 폴리비닐 설포네이트)의 큰 중합체(~50,000g/mol)를 함유하였다. 폴리비닐 설포네이트(Mr(상대 분자량)=50,000)는 다수의 진균 효소의 강력한 억제제이다.
50-kD 리보뉴클레아제 억제제 단백질(RI)은 RNase A(Kd~10-14 )와 모든 포스포릴 그룹 결합 하위 부위를 킬레이트 하는 단단한 1:1 복합체를 형성한다. 파이로포스페이트 연결 올리고뉴클레오티드 및 리보뉴클레아제 억제제의 유용성은 생산의 어려움과 비용 및 고유한 불안정성으로 인해 제한한다. 항-뉴클레아제 항체를 사용하여 뉴클레아제를 억제하기 위한 방법 및 조성물도 있다.
본 발명에서 내인성 및/또는 외인성 뉴클레아제에 의한 바이오매스로부터의 RNA(예를 들어, 내인성 RNA)의 이의 단량체 구성요소(예를 들어, NMP 또는 NDP)로의 전환 후, RNA 생합성에 유해한 효과를 가질 수 있는 뉴클레아제 및 포스파타제를 비롯한 몇몇 효소가 반응용액 또는 무세포 시스템에 잔류할 수 있다. 예를 들어, 분해를 위해서 사용되는 뉴클레아제(예를 들어, 뉴클레아제 P1)는 바이오매스의 분해 후 활성을 유지할 수 있다. 또 다른 예로서, 세포 RNA 공급원은 다수의 천연 포스파타제를 함유하는데, 이들 중 다수는 NTP, NDP 및 NMP를 탈인산화시킨다. RNA 분해 후 세포 RNA로부터 유래된 NMP의 탈인산화는 비-인산화된 뉴클레오사이드의 축적을 초래하고, 유용한 NMP 기질의 손실을 초래하여, 합성 RNA 수율을 감소시킬 수 있다. 본 발명에서 이를 방지하기 위해서 RNase Inhibitor(RI)를 사용할 수 있다. 대표적인 RI는 RNasin Plus Ribonuclease Inhibitor(Promega Corporation), Ribonuclease Inhibitor(TAKARA BIO INC.) 및 RNase inhibitor(TOYOBO CO., LTD.)를 포함한다.
시험관 내에서 RNA 분해를 완화하는 RI 기술은 리보뉴클레아제 억제에 효과적인 디에틸피로카보네이트(DEPC)로 샘플과 용액에 전처리하는 것이다. 그러나 한 가지 문제는 DEPC 및 기타 유사한 화학 물질이 알려진 발암 물질이다. 이러한 화학 물질은 또한 아민, 티올 및 알코올 그룹과 매우 쉽게 반응하며 사용 및 생산되는 완충제 및 생물학적 시약에 종종 이러한 사이드 그룹이 포함되어 있는 많은 생물학적 실험에는 사용할 수 없다. DEPC는 또한 RNA를 알킬화하여 일부 응용 분야에서 사용할 수 없게 만들 수 있다. 생물학적으로 생산된 RI도 리보뉴클레아제를 효과적으로 억제할 수 있지만, 그 작용은 종종 특정 유형의 리보뉴클레아제에 특이적이다.
본 발명에서 무세포 시스템 유래 세포는 인위적으로 단백질 RI를 과발현하여 RNA 분해 효소의 불활성화를 유도할 수도 있다. 모든 세포 내의 리보핵산은 5'말단 캡(5'end capping), 3' 말단 폴리아데닐레이션(3'end polyadenylation), 리보핵산-단백질 복합체 (RNA-protein complex) 내에서의 접힘 등의 다양한 기작에 의해 리보핵산 분해효소로부터 보호를 할 수 있다. 또 다른 보호 기작은 단백질 RI에 의한 것으로, 단백질 RI는 리보핵산 분해효소의 활성을 저해하여 리보핵산이 분해되는 것을 방지한다.
단백질 RNase inhibitor는 고도로 보존된 단백질 계열로 돼지, 소, 쥐, 생쥐, 양 및 인간과 같은 다른 숙주 사이의 아미노산 서열 보존률은 거의 70%이다. 모든 진핵생물 리보뉴클레아제 억제제는 다음과 같은 특징이 있다: (i) 환원된 시스테인의 높은 함량(30-32개의 잔기, 총 아미노산의 7%), (ii) 15-16개의 반복된 소수성 류신이 풍부한 동기로 구성된 코. 이러한 특징으로 인해 진핵생물 리보뉴클레아제 억제제의 재조합 생산이 어렵다.
본 발명에서, E. coli SHuffle 균주로부터 무세포 시스템을 제조하고, 인간 단백질 이황화 이소머라제(Protein disulfide isomerase, PDI), Glutathione peroxidase 7(GPx7) 및 이들의 융합체(PDI-GPx7 융합)로부터 제조한 autogene system이 있는 설계 발현단위를 사용하여 아황화 결합(disulfide bridge)이 있는 RNase inhibitor 단백질과 FL(full length, 전장)-IgG 등을 포함하는 단백질의 발현을 할 수 있는 상기 제조한 autogene system이 있는 설계 발현단위를 포함하는 무세포 시스템을 제작할 수 있다. 상기 무세포 시스템에서 RNase inhibitor 단백질에서 생산할 수도 있다. 또한 본 시스템에서 RNase 활성을 제어하여 불활성화하면서 RNA 합성을 할 수도 있다.
대장균에서 인간 및 돼지 RI의 초기 생산 시험은 낮은 기능적 수율과 주요 응집을 일으킨다. 예를 들어, 대장균에서 기능성 돼지 RI의 수율은 10mg/L 만큼 낮았고 Sacharomyces cerevisiae에서는 0.2 mg/g 습중량이다. 최근에 대장균에서 말토오스 결합 단백질(MBP)에 대한 융합으로서 가용성 및 기능적 단백질 R를의 생산하고 있다, 융합 단백질은 진정한 RI를 얻기 위해 추가적인 단백질 분해 처리 단계가 필요하다는 단점이 있으며, 이는 산업적 규모의 생산에 한계가 된다. 또 다른 공정전략은 단백질 RI의 수율은 DTT의 지연된 첨가 및 유지 또는 낮은 수준의 용존 산소와 함께 GroELS 및 RI의 순차적 유도를 결합함으로써 최대화하였는데, 이 공정 전략은 최종 세포 건조 중량이 25g L-1이고 용적 수율이 625mg L-1 의 가용성 및 고활성 RI 를 갖는 유가식 공정 조건하의 생물반응기에서도 성공적이다. 상기 RNA 분해 효소의 제거 또는 불활성화는 특허 US20130344563A1을 참조할 수도 있다.
바람직하지 않은 효소 활성의 제거 또는 불활성화
세포로부터 유래된 물질(예를 들어, 세포용해물(들) 또는 세포용해물(들)로부터 얻은 효소 제제)을 포함하는 반응용액의 경우, 임의의 것을 사용하여 바람직하지 않은 천연효소 활성을 없애거나, 제거하거나 불활성화시키는 것이 바람직할 수 있다. 바람직하지 않은 천연효소 활성은 예를 들어, 포스파타제, 뉴클레아제, 프로테아제, 데아미나제, 산화환원효소 및 가수분해효소를 포함한다. NMP로의 RNA 분해 후 NDP 또는 NTP의 탈인산화는 NMP가 NDP 및 NTP로 인산화되고, 그 다음 NMP 또는 뉴클레오사이드 출발 지점으로 탈인산화되는 동안 무익(futile) 에너지 주기(합성 RNA의 낮은 수율을 생산하는 에너지 주기)를 초래할 수 있다. 무익 주기는 단위 에너지 입력물(예를 들어, 폴리포스페이트, ATP 또는 고에너지 인산염의 다른 공급원)당 RNA 생성물 수율을 감소시킨다.
다수의 방법을 사용하여 바람직하지 않은 효소 활성을 없애거나, 제거하거나 불활성화시킬 수 있다. 숙주 게놈으로부터의 유해한 효소를 암호화하는 유전자를 제거함으로써 바람직하지 않은 효소 활성을 제거한다. RNA의 생합성에 유해한 효소는 조작 동안 숙주세포 게놈으로부터 결실될 수 있되, 단 그 효소는 숙주세포(예를 들어, 박테리아 세포) 생존 및/또는 성장에 필수적이지 아니 한다. 효소 또는 효소 활성의 결실은 예를 들어, 숙주세포 게놈에서 그 효소를 암호화하는 유전자를 결실시키거나 변형시킴으로써 달성될 수 있다. 효소는 숙주세포가 특정 효소의 발현 및/또는 활성 없이 생존할 수 없는 경우 "숙주세포 생존에 필수적"이다. 유사하게, 효소는 숙주세포가 특정 효소의 발현 및/또는 활성 없이 분화 및/또는 성장할 수 없는 경우 "숙주세포 성장에 필수적"이다.
RNA의 생합성에 유해한 효소가 숙주세포의 생존 및/또는 성장에 필수적인 경우 다른 방법을 사용할 수 있다. 효소 활성은 열 비활성화, pH 변화, 염 농도의 변화, 알코올 또는 또 다른 유기 용매로의 처리, 세제 처리 또한 화학 저해제의 사용을 통해서 제거된다. 효소 활성은 여과, 침전 및 포획 방법 및/또는 크로마토그래피를 포함하지만 이들로 제한되지 않는 물리적 분리에 의해 제거된다. 사용된 일부 크로마토그래피는 고정화 금속 크로마토그래피이다. 상기 접근법 중 임의의 것의 조합을 또한 사용할 수 있다.
천연효소 활성은 유전자 변형, 세포로부터의 효소 분비, 국소화(예를 들어, 주변세포질 표적화) 및/또는 프로테아제 표적화를 통해 제거된다. 천연효소 활성은 온도, pH, 염, 세제, 알코올 또는 다른 용매 및/또는 화학 저해제를 통해 불활성화된다. 천연효소 활성은 물리적 분리, 예컨대, 침전, 여과, 포획 및/또는 크로마토그래피를 통해 제거된다.
바람직하지 않은(예를 들어, 천연) 효소 활성(들)은 유전자, 조건부 또는 분리 접근법을 사용하여 제거될 수 있다. 유전자 접근법을 사용하여 바람직하지 않은 효소 활성을 제거한다. 따라서, 세포는 바람직하지 않은 효소 활성을 감소시키거나 제거하도록 변형된다. 바람직하지 않은 효소 활성(들)을 감소시키거나 또는 제거하기 위해 사용될 수 있는 유전자 접근법의 예는 분비, 유전자 넉아웃 및 프로테아제 표적화를 포함하지만 이들로 제한되지 않는다.
조건부 접근법을 사용하여 바람직하지 않은 효소 활성을 제거한다. 따라서, 바람직하지 않은 활성을 나타내는 효소가 효소 제제, 무세포 시스템 및/또는 반응용액에 남아있고, 선택적으로 불활성화된다. 바람직하지 않은 효소 활성을 감소시키거나, 또는 제거하기 위해 사용될 수 있는 조건부 접근법의 예는 온도, pH, 염, 세제, 알코올 또는 다른 용매 및/또는 화학 저해제의 변화를 포함하지만 이들로 제한되지 않는다. 분리/정제 접근법을 사용하여 바람직하지 않은 효소 활성을 제거한다. 따라서, 바람직하지 않은 활성을 나타내는 효소는 효소 제제, 무세포 시스템 및/또는 반응용액으로부터 물리적으로 분리된다. 바람직하지 않은 효소 활성을 감소시키거나 또는 제거하기 위해 사용될 수 있는 분리 접근법의 예는 물리적 분리, 예컨대, 여과, 침전, 포획 및/또는 크로마토그래피를 포함하지만 이들로 제한되지 않는다.
경로 효소를 발현하는 세포 또는 세포의 용해물로부터 제조된 효소는 NTP 및/또는 RNA의 생산을 위한 반응용액에 사용된다. 이러한 세포 또는 무세포 시스템에서, NTP 및/또는 RNA 생산에 유해한 효과를 가질 수 있는 효소가 존재한다. 이러한 효소의 비제한적인 예는 포스파타제, 뉴클레아제, 프로테아제, 데아미나제, 산화환원효소 및/또는 가수분해효소, 예컨대, 대장균 세포에 의해 발현되는 것을 포함한다. 포스파타제는 뉴클레오타이드 인산화/탈인산화의 무익 주기로 인해서 NTP 생산을 감소시키는 포스페이트기(예를 들어, NMP를 뉴클레오사이드로 전환, NDP를 NMP로 전환 또는 NTP를 NDP로 전환)를 제거한다. 뉴클레아제는 핵산을 단량체 또는 올리고머로 절단하여 RNA 생성물 분해(예를 들어, RNase에 의한) 및/또는 DNA 주형 분해(예를 들어, DNase에 의한)로 이어진다. 프로테아제는 단백질을 아미노산 또는 펩타이드로 절단하며, 이것이 경로 효소를 분해한다. 데아미나제는 아미노기를 제거하는데, 이것은 경로 중간체를 유용하지 않은 기질(예를 들어, 크산틴 및 하이포크산틴)로 전환시킴으로써 NTP 농도를 감소시키고 RNA 생성물(예를 들어, C에서 U로)의 돌연변이를 유발할 수 있다. 가수분해효소(예를 들어, 뉴클레오사이드 가수분해효소 또는 뉴클레오타이드 가수분해효소)는 뉴클레오사이드 또는 뉴클레오타이드를 염기 및 당 모이어티로 절단하여 뉴클레오타이드의 비가역적 분해로 인해 NTP 농도를 감소시킨다. 산화환원효소는 한 분자(산화제)에서 다른 분자(환원제)로의 전자 전달을 촉매한다. 산화 및/또는 환원 반응은 예를 들어, DNA 및/또는 RNA의 핵염기를 손상시켜, 전사 및/또는 번역의 오류 또는 단백질 또는 효소의 손상으로 이어지고, 이것은 기능 손실로 이어질 수 있다.
따라서, 효소 제제, 무세포 시스템 및/또는 반응용액에서 이러한 천연효소 활성 또는 다른 바람직하지 않은 효소 활성을 없애거나, 제거하거나, 비활성화시키는 것이 다수의 실시형태에서 유리하다.
숙주세포의 게놈으로부터 열 불활성화, 결실 또는 물리적으로 제거될 수 있는 효소의 예는 비제한적으로 뉴클레아제(예를 들어, RNase III, RNase I, RNase R, 뉴클레아제 P1, PNPase, RNase II 및 RNase T), 포스파타제(예를 들어, 뉴클레오사이드 모노포스파타제, 뉴클레오사이드 다이포스파타제, 뉴클레오사이드 트라이포스파타제) 및 RNA를 분해시키거나 뉴클레오타이드를 탈인산화시키는 다른 효소를 포함한다. RNA를 분해시키는 효소는 RNA 분자를 절단하거나 부분적으로 가수분해시키거나 완전히 가수분해시킬 수 있는 임의의 효소를 포함한다.
효소를 불활성화시키는 기술의 예는 조건부 접근법을 포함한다. 효소 제제, 무세포 시스템 및 /또는 반응용액은 선택적으로 불활성화되는 바람직하지 않은 활성을 나타내는 효소를 포함한다. 바람직하지 않은 활성을 나타내는 효소는 효소를 제거 조건(예를 들어, 고온 또는 저온, 산성 또는 염기성 pH 값, 고염 또는 저염, 세제 및/또는 유기 용매)에 노출시킴으로써 선택적으로 불활성화될 수 있다. 바람직하지 않은 효소 활성은 침전 또는 크로마토그래피에 의해 제거된다.
"열 불활성화"는 내인성 뉴클레아제, 포스파타제 또는 다른 효소를 불활성화(또는 적어도 부분적으로 불활성화)시키기에 충분한 온도로 무세포 반응용액을 가열시키는 과정을 지칭한다. 일반적으로, 열 불활성화 과정은 유해한 효소의 변성(언폴딩)을 포함한다. 내인성 세포 단백질이 변성되는 온도는 유기체마다 달라진다. 예를 들어, 대장균에서, 내인성 세포 효소는 일반적으로 41℃ 초과의 온도에서 변성된다. 변성 온도는 다른 유기체의 경우 41℃보다 높거나 낮을 수 있다. 반응용액의 효소는 55℃ 내지 95℃ 또는 그 초과의 온도에서 열 불활성화될 수 있다.
무세포 반응용액의 효소는 55 내지 95℃의 온도에서 열 불활성화될 수 있다. 무세포 반응용액의 효소는 70℃의 온도에서 열 불활성화될 수 있다. 무세포 반응용액의 효소는 60℃의 온도에서 열 불활성화될 수 있다. 유해한 효소의 화학적 저해제를 도입하는 것이 또한 가능할 수 있다. 이러한 저해제는 소듐 오쏘바나데이트(단백질 포스포티로실 포스파타제의 저해제), 소듐 플루오라이드(포스포세릴 및 포스포트레오닐 포스파타제의 저해제), 피로인산나트륨(포스파타제 저해제), 인산나트륨 및/또는 인산칼륨을 포함할 수 있지만 이들로 제한되지 않는다.
바람직하지 않은 효소의 열 불활성화를 달성하기 위해 무세포 반응용액이 승온에서 배양되는 시간 기간은 예를 들어, 무세포 반응용액의 부피 및 바이오매스가 제조된 유기체에 따라 달라질 수 있다. 무세포 반응용액은 55℃ 내지 99℃의 온도에서 0.5분(min) 내지 24시간(hr) 동안 처리된다. 효소는 60 내지 80℃의 온도에서 10 내지 20분 동안 열 불활성화된다. 효소는 70℃의 온도에서 15분 동안 열 불활성화된다.
내인성 RNA를 분해시키는 효소는 효소를 열에 더 민감하게 만드는 하나 이상의 변형(예를 들어, 돌연변이)을 포함한다. 이러한 효소를 "열-민감성 효소"라고 지칭한다. 열-민감성 효소는 이들의 야생형 대응물보다 더 낮은 온도에서 변성 및 불활성화되고, 그리고/또는 열-민감성 효소의 활성을 감소시키는 데 필요한 시간 기간은 야생형 대응물보다 더 짧다.
열 불활성화된 효소는 일부 경우에서는 어느 정도 활성을 유지할 수 있음을 이해해야 한다. 예를 들어, 열-불활성화된 효소의 활성 수준은 열-불활성화되지 않은 동일한 효소의 활성 수준의 50% 미만일 수 있다. 열 불활성화된 효소의 활성 수준은 열 불활성화되지 않은 동일한 효소의 활성 수준의 40% 미만, 30% 미만, 20% 미만, 10% 미만, 5% 미만, 1% 미만, 또는 0.1% 미만이다.
따라서, 효소의 활성이 완전히 제거되거나 감소될 수 있다. 효소의 변성(열 불활성화) 형태가 이의 천연 형태의 효소에 의해 촉매되는 반응을 더 이상 촉매하지 않는 경우 효소는 완전히 불활성화된 것으로 간주된다. 열-불활성화된 변성된 효소는, 열-불활성화된 효소의 활성이 가열되지 않은 효소(즉, 이의 천연 환경에서)의 활성에 비해 적어도 50%만큼 감소되는 경우 "불활성화된" 것으로 간주된다. 열-불활성화된 효소의 활성은 가열되지 않은 효소의 활성에 비해 50 내지 100%만큼 감소된다.
반응용액은 바람직하지 않은 활성을 나타내는 효소를 일시적으로 또는 비가역적으로 불활성화시키는 산 또는 염기(pH 변화)에 노출된다. "산 또는 염기 불활성화"는 바람직하지 않은 효소(들)를 불활성화(또는 적어도 부분적으로 불활성화)시키기에 충분한 pH로 반응용액을 조정하는 과정을 지칭한다. 일반적으로 산 또는 염기 불활성화 과정은 효소(들)의 변성(언폴딩)을 포함한다. 효소가 변성되는 pH는 유기체마다 달라진다. 예를 들어, 대장균에서 천연효소는 일반적으로 pH 7.5 초과 또는 6.5 이하에서 변성된다. 변성 pH는 다른 유기체에 대한 변성 pH보다 높거나 낮을 수 있다. 본 명세서에 제공된 바와 같이 반응용액의 효소는 pH 7.5 내지 14 또는 그 초과에서 염기 불활성화될 수 있다.
무세포 반응용액은 바람직하지 않은 활성을 나타내는 효소를 일시적으로 또는 비가역적으로 불활성화시키는 고염 또는 저염(염 농도의 변화)에 노출된다. "염 불활성화"는 효소 제제, 무세포 시스템 및/또는 무세포 반응용액을 효소를 불활성화(또는 부분적으로 불활성화)시키기에 충분한 염 농도로 조정하는 과정을 지칭한다. 일반적으로 염 불활성화 과정은 효소의 변성(언폴딩)을 포함한다. 효소가 변성되는 염 농도는 유기체마다 달라진다. 예를 들어, 대장균에서, 천연효소는 일반적으로 600mM 초과의 염 농도에서 변성된다. 변성 염 농도는 다른 유기체에 대한 변성 염 농도보다 높거나 낮을 수 있다. 염은 음이온과 양이온의 조합물이다. 본 명세서에 제시된 바와 같은 무세포 반응용액에서 바람직하지 않은 효소 활성의 염 불활성화에 사용될 수 있는 양이온의 비제한적 예는 리튬, 나트륨, 칼륨, 마그네슘, 칼슘 및 암모늄을 포함한다. 무세포 반응용액에서 바람직하지 않은 효소 활성의 염 불활성화에 사용될 수 있는 음이온의 비제한적 예는 아세테이트, 클로라이드, 설페이트 및 포스페이트를 포함한다.
유기 용매를 효소 제제, 무세포 시스템 및/또는 반응용액에 첨가하여 바람직하지 않은 활성을 나타내는 효소를 불활성화시킨다. 유기 용매의 비제한적인 예는 에탄올, 메탄올, 에터, 다이옥산, 아세톤, 메틸 에틸 케톤, 아세토나이트릴, 다이메틸 설폭사이드 및 톨루엔을 포함한다.
세제를 효소 제제, 무세포 시스템 및/또는 반응용액에 첨가하여 바람직하지 않은 활성을 나타내는 효소를 불활성화시킨다. 세제의 비제한적인 예는 소듐 도데실 설페이트(SDS), 에틸 트라이메틸암모늄 브로마이드(ETMAB), 라우릴 트라이메틸 암모늄 브로마이드(LTAB) 및 라우릴 트라이메틸암모늄 클로라이드(LTAC)를 포함한다.
화학적 저해제를 효소 제제, 무세포 시스템 및/또는 반응용액에 첨가하여 바람직하지 않은 활성을 나타내는 효소를 불활성화시킨다. 화학적 저해제의 비제한적인 예는 소듐 쏘바나데이트(단백질 포스포티로실 포스파타제의 저해제), 소듐 플루오라이드(포스포세릴 및 포스포트레오닐 포스파타제의 저해제), 피로인산나트륨(포스파타제 저해제), 인산나트륨 및/또는 인산칼륨을 포함한다. 화학적 저해제는 화학적 저해제 라이브러리로부터 선택된다.
본 명세서에서 사용되는 조건부 접근법 중 임의의 것의 경우, 무세포 시스템 또는 무세포 반응용액에 존재하는 경로 효소 중 임의의 것이 또한 제거 조건(예를 들어, 고온 또는 저온, 산성 또는 염기성 pH 값, 고염 또는 저염, 세제 및/또는 유기 용매)에 노출될 수 있다는 것이다. 따라서, 경로 효소(예를 들어, 폴리포스페이트 키나제, NMP 키나제, NDP 키나제 및/또는 중합효소)는 제거 조건을 견딜 수 있다.
효소는 제거 조건에 노출된 후 효소가 (불활성화 조건에 노출되기 전의 효소 활성에 비해) 적어도 10%(예를 들어, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 또는 적어도 90%)의 효소 활성을 유지하는 경우 제거 조건을 견디는 것으로 간주된다.
효소 제제, 세포용해물 및/또는 무세포 반응용액의 천연효소가 열-불활성화(예를 들어, 적어도 55℃ 또는 55 내지 95℃의 온도에, 적어도 30초 또는 30초 내지 60분 노출)되는 경우, 그 경로 효소는 열안정적인 효소일 수 있다. 따라서, 폴리포스페이트 키나제, NMP 키나제, NDP 키나제, 뉴클레오사이드 키나제, 포스포리보실트랜스퍼라제, 뉴클레오사이드 포스포릴라제, 리보키나제, 포스포펜토무타제 및 중합효소 중 적어도 1종은 이의 열안정성 변이체이다. 효소(예를 들어, 키나제 또는 중합효소)는 효소가 (a) 천연효소를 변성시키는 고온(즉, 42℃)에 일시적으로 노출된 후에도 활성을 유지하거나 (b) 천연효소가 낮은 속도로 기능하는 중간 내지 높은 온도에 일시적으로 노출된 후 높은 속도로 기능하는 경우 열 안정적이라고 간주된다. 열안정성 효소는 공지되어 있고, 사용을 위한 열안정성 효소의 비제한적인 예는 공지되어 있다. 제거 조건을 견딜 수 있는 경로 효소의 비제한적인 예는 또한 공지되어 있다.
바람직하지 않은 활성을 나타내는 천연효소는 반응용액으로부터 물리적으로 제거된다. 바람직하지 않은 활성을 나타내는 효소는 무세포 반응용액으로부터 침전된다. 바람직하지 않은 활성을 나타내는 효소는 반응용액으로부터 여과(예를 들어, 크기 기준)된다. 바람직하지 않은 활성을 나타내는 효소는 포획 및/또는 크로마토그래피(예를 들어, 고정상에 대한 차동 친화도에 의해서)를 통해서 반응용액으로부터 제거된다. 바람직하지 않은 활성을 나타내는 효소는 친화도 크로마토그래피를 통해 반응용액으로부터 제거된다. 친화도 크로마토그래피의 예는 단백질 A 크로마토그래피, 단백질 G 크로마토그래피, 금속 결합 크로마토그래피(예를 들어, 니켈 크로마토그래피), 렉틴 크로마토그래피 및 GST 크로마토그래피를 포함하지만 이들로 제한되지 않는다. 바람직하지 않은 활성을 나타내는 효소는 이온 교환 크로마토그래피를 통해 반응용액으로부터 제거된다. 음이온 교환 크로마토그래피(AEX)의 예는 다이에틸아미노에틸(DEAE) 크로마토그래피, 4차 아미노에틸(QAE) 크로마토그래피 및 4차 아민(Q) 크로마토그래피를 포함하지만 이들로 제한되지 않는다. 양이온 교환 크로마토그래피의 예는 카복시메틸(CM) 크로마토그래피, 설포에틸(SE) 크로마토그래피, 설포프로필(SP) 크로마토그래피, 포스페이트(P) 크로마토그래피 및 설포네이트(S) 크로마토그래피를 포함하지만 이들로 제한되지 않는다. 바람직하지 않은 활성을 나타내는 효소는 소수성 상호작용 크로마토그래피(HIC)를 통해 반응용액으로부터 제거된다. 소수성 상호작용 크로마토그래피의 예는, 페닐 세파로스 크로마토그래피, 부틸 세파로스 크로마토그래피, 옥틸 세파로스크로마토그래피, 캡토 페닐 크로마토그래피, 토이펄(Toyopearl) 부틸 크로마토그래피, 토이펄 페닐 크로마토그래피, 토이펄 헥실 크로마토그래피, 토이펄 에터 크로마토그래피 및 토이펄 PPG 크로마토그래피를 포함하지만 이들로 제한되지 않는다. 상기에 설명한 화학물질 중 임의의 것이 대안적으로 경로 효소를 고정하거나 포획하는데 사용될 수 있다.
아연 의존성 효소인 페니실리엄 시트리넘으로부터의 뉴클레아제 P1은 RNA에서 3'-5'-포스포다이에스터 결합 및 염기 특이성이 없는 3'-포스페이트에 의해서 말단화된 모노- 및 올리고뉴클레오타이드 내의 열 변성된 DNA 및 3'-포스포모노에스터 결합 둘 다를 가수분해시킨다. 뉴클레아제 P1은 단일-가닥 DNA 및 RNA를 리보뉴클레오사이드 5'-모노포스페이트의 수준으로 완전히 가수분해시킬 수 있다.
대장균 RNase I은 온전한 박테리아 세포의 원형질막 주변 공간에 위치하며, rRNA, mRNA 및 tRNA를 포함한 광범위한 RNA 분자의 분해를 촉매한다. 생리 조건에서, 이 효소의 주변 세포질 국소화는 효소가 세포 내에서 RNA 안정성에 거의 영향을 미치지 않는다는 것을 의미하지만; 박테리아 세포용해물에서 주변 세포질과 세포질을 혼합하면 RNase I이 세포 RNA에 접근할 수 있다. 무세포 시스템에서 RNase I의 존재는 RNA 분해를 통해 합성 RNA의 수율을 감소시킬 수 있다. RNase I 또는 RNase I을 암호화하는 유전자인 RNA는 세포 생존에 필수적이지 않으므로, RNA는 엔지니어링된 숙주세포에서 결실되거나 돌연변이 형태이다. 반응용액 중의 RNase I은 내인성 RNA의 분해 후에 열 또는 PVSA 불활성화된다.
대장균 RNase R 및 RNase T는 dsRNA, rRNA, tRNA 및 mRNA뿐만 아니라 구조화되지 않은 작은 RNA 분자의 분해를 촉매한다. 효소 및 효소를 암호화하는 유전자 rnr 및 rnt 각각은 박테리아 세포 생존에 필수적이지 않으므로, rnr 및/또는 rnt는 엔지니어링된 숙주세포(예를 들어, 대장균 세포)에서 결실되거나 돌연변이 형태이다. 무세포 반응용액 중의 RNase R 및/또는 RNase T는 내인성 RNA의 분해후에 열 또는 PVSA 불활성화될 수 있다.
대장균 RNaseE 및 PNPase는 세포에서 mRNA 턴오버를 담당하는 데그라다솜(degradasome)의 성분이다. RNaseE는 PNPase 및 RNase II와 함께 기능하여 세포 mRNA 풀을 턴오버시킨다. RNase E, rne를 암호화하는 유전자의 파괴는 대장균에서 치명적이다. 따라서, 무세포 반응용액 중의 RNase E는 내인성 RNA의 분해 후에 열 또는 PVSA 불활성화될 수 있다. PNPase 또는 PNPase를 암호화하는 유전자 pnp는 세포 생존에 필수적이지 않으므로, 엔지니어링된 숙주세포(예를 들어, 대장균 숙주세포)에서 pnp가 결실되거나 돌연변이될 수 있다. 반응용액 중의 PNPase는 내인성 RNA의 분해 후에 열 불활성화된다.
대장균 RNase II는 3'에서 5' 방향으로 mRNA와 tRNA를 모두 분해시킨다. RNase II 또는 RNase II를 암호화하는 유전자인 rnb는 세포 생존에 필수적이지 않으므로, rnb는 엔지니어링된 숙주세포에서 결실되거나 돌연변이된다. 반응용액 중의 RNase II는 내인성 RNA의 분해 후에 열 활성화된다. pnp 또는 rnb는 숙주세포 생존에 필수적이지 않지만, 둘 다 동시에 파괴되면 치명적일 수 있다. PNPase 및 RNase II 둘 다가 모두 열 또는 PVSA 불활성화된다.
II. 관심 RNA 전사시스템
본 발명의 관심 RNA 전사시스템은 RNA 중합효소에 의해 관심 RNA의 지속적 발현이 가능하도록 하는 기능을 제공한다. 본 발명의 RNA 전사시스템은 RNA 중합효소 발현단위와 관심 RNA 발현단위를 포함한다.
A. RNA 중합효소 발현단위
본 발명의 관심 RNA 전사시스템을 구성하는 RNA 중합효소 발현단위는 관심 RNA 발현단위에 있는 관심 RNA를 인코딩하는 DNA로부터 관심 RNA를 합성하는 RNA 중합효소를 인코딩하는 DNA 단위체이다.
본 발명의 관심 RNA 전사시스템을 위한 무세포유래 세포는 동물, 식물, 효모 및 박테리아 등을 사용할 수 있으며, 원핵세포와 진핵세포를 나누어 발현단위를 제공해야 한다.
본 발명의 관심 RNA 합성을 위한 무세포 시스템 유래 세포는 원핵세포과 진핵세포가 있으며 이들에 따라 RNA 중합효소를 인코딩하는 DNA 주형의 구성을 상이하게 해야 한다.
무세포 RNA 합성을 위한 무세포 시스템을 제공하기 위한 원핵세포 바이오매스를 사용할 수 있으며 바람직하게, 는 RNA 중합효소의 일종인 T7 RNA polymerase를 갖고있는 대장균 BL21(DE3), BL21 Star (DE3) 및 HT115(DE3) 균주를 사용할 수 있다.
BL21(DE3)은 2개의 주요 프로테아제 인코딩 유전자가 결핍되어 있지만 dsRNA 특이적 RNase III 인코딩 유전자가 있다. BL21 Star (DE3)는 낮은 mRNA 분해를 위한 rne131 돌연변이가 있는 균주이다. HT115(DE3)는 RNase III 인코딩 유전자가 없지만 프로테아제 인코딩 유전자를 포함하고 있다.
박테리아와 같은 이종 발현시스템에서 단백질 합성은 생명공학의 주요 목표 중 하나이다. 단백질은 mRNA의 서열에 암호화된 지시에 따라 리보솜에 의해 합성된다.
본 발명은 상기 목적을 달성하기 위하여 본 발명의 관심 RNA 전사시스템의 RNA 중합효소 발현단위는 하기 식(I)의 염기서열을 포함하는 RNA 중합 효소 유전자를 제공한다.
식(I): W-X-Y-Z
상기 식에서 W는 무세포유래 세포에 있는 RNA 중합효소에 의해 인지되는 프로모터와 SD 부위를 포함하는 5'UTR을 포함할 수 있다. 상기 W는 프로모터, 조절인자, repressor 및 activator의 종류 또는 이들의 조합으로 특징이 결정되는 single promoter 또는 hybrid promoter 조절 시스템으로 상기 발현단위의 전사시기를 조절할 수도 있다.
X는 상기한 RNA 중합효소 유전자의 5'말단 염기서열, 번역시작 코돈 ATG을 나타내며 상기 RNA 중합효소 유전자는 (a) DNA dependent RNA Polymerase(DdRp) 또는 그 변이체; 또는 (a) 상기 DdRp 또는 그 변이체; (b) 캡핑효소 또는 그 변이체; 및 (c) 링커;를 포함하는 ctDdRp일 수도 있다.
여기서, ctDdRp를 포함하는 상기 RNA 중합효소 발현단위는 추가적으로 RNA 결합 테더링 펩타이드를 포함할 수도 있다. 상기 RNA 중합효소는 단백질- RNA 테더링 시스템(protein- RNA tethering system)의 적어도 하나의 RNA 결합 도메인(RNA-binding domain)을 포함하는 것을 특징으로 하며, 여기서, 상기 RNA 결합 도메인은 특정 RNA 서열 및/또는 구조로 구성된 상기 단백질- RNA 테더링 시스템의 RNA 요소에 특이적으로 결합을 특징으로 하는 RNA 구조체일 수도 있다.
더욱더 바람직하게, 본 발명의 관심 RNA 전사시스템의 RNA 중합효소의 발현단위는 RNA dependent RNA Polymerase(RdRp) 또는 그 변이체를 포함할 수도 있다.
Y는 상기한 RNA 중합효소 유전자의 2번째 내지 번역종결 코돈에 해당하는 염기서열을 나타내며;
Z는 상기한 RNA 중합효소 유전자의 3'말단의 종료 코돈 이하 전사 종결서열을 포함하는 염기서열을 나타낸다.
본 발명에서 상류에 있는 프로모터(W)가 하류에 있는 RNA 중합효소(X-Y-Z)에 의해 인지되고 작동하는 구조체를 autogene이라고 한다.
또한, 본 발명은 종료코돈 이하 전사 종결서열로서 Z부위인 3'말단에 TGA TAA의 번역종료 코돈을 연결시켜 번역 종료가 확실히 일어나도록 유도하였다.
본 발명은 본 발명의 RNA 중합효소 유전자 염기서열로부터 발현되는 RNA 중합 효소 아미노산 서열을 제공한다.
또한, 본 발명은 본 발명의 RNA 중합효소 유전자를 포함하는 발현 벡터를 제공한다.
무세포유래 세포 대장균에서 관심 RNA 전사시스템을 위한 RNA 중합효소 발현단위의 발현율을 증가시키기 위해 다양한 방법들을 고려할 수 있다. 첫째, 플라스미드의 자기복제 [유전자 복사수(gene copy number) 및 안정성에 관련된 요소, 둘째, mRNA [mRNA 합성의 개시율, mRNA 합성의 연장(elongation)과 종료(termination) 및 mRNA의 분해율에 관련된 요소, 셋째, 관심 단백질의 번역개시율에 관련된 요소, 넷째, 관심 단백질의 분해율에 관련된 요소 등이 무세포유래 세포와 적합하도록 고려되어야 한다.
RNA 중합효소 및 이를 포함하는 키메라 효소
RNA 중합효소를 얻기 위해서는, 유전자로부터 여러 단계의 과정을 거쳐야 하며, 유전자의 발현효율은 각 단계의 효율에 따라 결정된다. 즉 유전자의 양과 안정성, mRNA의 전사효율 및 안정성, 번역효율 등 어느 하나에 치우치지 않고 모든 단계가 복합적으로 조화를 이루어야 하는데, 관심 단백질로는 발현되지 않지만 발현을 조절하는 프로모터와 전사종결서열 등의 염기조성뿐만 아니라 관심 유전자의 염기조성이 서로 적합성을 이루어야만 각 단계의 효율이 증가되고 RNA 중합효소의 발현도 증가될 수 있다.
"키메라 효소"는 자연에서 발견되는 천연효소가 아닌 (즉, 비천연)효소를 지칭한다. 따라서, 키메라 효소는 상이한 공급원(예를 들어, 상이한 효소로부터) 또는 동일한 공급원(예를 들어, 동일한 효소로부터)으로부터 유래되지만 자연에서 발견되는 것과는 상이한 방식으로 배열된 촉매 도메인으로부터 유래된 촉매 도메인을 포함할 수 있다. "키메라 효소"는 단량체(즉, 단일 단위) 효소 뿐만 아니라 올리고머(즉, 다중 단위) 효소, 특히 헤테로올리고머 효소를 포함한다. 보다 구체적으로, "키메라 효소"는 하나(즉, 단일 단위) 또는 여러 개(즉, 다중 단위 ) 촉매 도메인(들)(캡핑 효소의 하나 이상의 촉매 도메인) 또는 단백질(들)(하나 이상의 캡핑 효소)일 수 있다.
효소의 "촉매 도메인"는 특히 3차원 구조에서 효소 기능을 보장하는 데 필요하고 충분한 단백질 도메인에 관한 것이다. 예를 들어, RNA 삼인산효소의 촉매 도메인은 RNA 삼인산효소 기능을 보장하는 데 필요하고 충분한 도메인이다. "촉매 도메인"는 야생형 또는 돌연변이 효소의 촉매 도메인을 포함한다.
"단백질 도메인"는 독립적으로 접히고 기능하는 단백질의 별개의 기능적 및/또는 구조적 빌딩 블록 및 요소를 정의한다.
특히, 본 발명에 따른 키메라 효소는 단량체 또는 올리고머 비천연효소이다.
"단량체 효소"는 단 하나의 폴리펩티드 사슬로 구성된 단일 단위 효소에 관한 것이다.
"올리고머 효소"는 공유 또는 비공유로 함께 연결된 2개 이상의 폴리펩티드 사슬로 구성된 다중 단위 효소를 지칭한다. "올리고머 효소"는 다중-단위 효소를 포함하며, 여기서 상기 효소의 2개 이상의 단위는 공유적으로 또는 비공유적으로 함께 연결된다. "올리고머 효소"는 단일 유형의 단량체(서브유닛)로만 구성된 다중 단위 효소인 호모올리고머 효소 및 상이한 유형의 단량체(서브유닛)로 구성된 헤테로 올리고머 효소를 포함한다.
본 발명자는 특히 RNA 트리포스파타제의 촉매 도메인, 구아닐릴트랜스퍼라제의 촉매 도메인, N7-구아닌 메틸트랜스퍼라제의 촉매 도메인을 포함하는 캡핑 효소의 촉매 도메인; 및 특정 RNA 서열 및/또는 구조로 구성된 RNA 요소에 특이적으로 결합하는 RNA-결합 도메인을 포함하는 단백질- RNA 테더링 시스템의 RNA-결합 도메인;를 포함하는 단량체 또는 올리고머 키메라(비천연) 효소는 RNA 중합효소에 의해 생산되는 특정 mRNA의 캡핑 비율을 매우 높게 향상시킬 수 있다.
본 발명자는 캡핑 효소의 촉매 도메인 및 박테리오파지 단백질- RNA 테더링 시스템의 박테리오파지 RNA-결합 도메인을 포함하는 세포질 단량체 또는 올리고머 키메라 효소는 단백질- RNA 테더링 시스템의 다른 RNA-결합 도메인과 비교하여 박테리오파지 DNA-의존성 RNA 중합효소에 의해 생산되는 특정 mRNA의 캡핑비율을 크게 향상시킬 수 있다.
본 발명자는 또한 캡핑 효소의 촉매 도메인, 단백질- RNA 테더링 시스템의 RNA-결합 도메인 및 폴리(A) 중합효소의 촉매 도메인을 포함하는 단량체 또는 올리고머 키메라 효소가 폴리(A) 중합효소의 존재 하에서 캡핑 효소의 조합과 비교하여 RNA 중합효소에 의해 생성된 특정 mRNA의 캡핑 속도를 협력적으로 증가시킬 수도 있다.
1. DNA dependent RNA Polymerase
중합효소는 일반적으로 단량체 빌딩 블록으로부터 중합체 분자의 합성을 촉매할 수 있는 분자이다. " RNA 중합효소"는 리보뉴클레오타이드 빌딩 블록으로부터 RNA 분자의 합성을 촉매할 수 있는 분자이다. "DNA 중합효소"는 데옥시리보뉴클레오타이드 빌딩 블록으로부터 DNA 분자의 합성을 촉매할 수 있는 분자이다.
DNA 중합효소 및 RNA 중합효소의 경우, 분자 실체는 전형적으로 단백질 또는 복수의 단백질의 집합체 또는 복합체이다. 전형적으로, DNA 중합효소는 전형적으로 DNA 분자인 주형 핵산을 기반으로 DNA 분자를 합성한다. 전형적으로, RNA 중합효소는 주형 핵산을 기반으로 RNA 분자를 합성하고, 주형 핵산은 DNA 분자(RNA 중합효소가 DNA 의존성 RNA 중합효소, DdRp인 경우)이거나 RNA 분자이다(RNA 중합효소가 RNA 의존성 RNA 중합효소인 RdRp인 경우).
DdRp는 RNAP(RNA Polymerase, RNA 중합효소)의 동의어이고, 진핵생물의 핵에 있는 DdRp는 RNAP I, RNAP II 및 RNAP III이고 이들은 구조적으로 서로 매우 다르며 각각 다른 유전자 세트를 전사하다 (다른 중합효소는 미토콘드리아와 엽록체에 있다). 그러나 세 가지 모두 서로 관련된 두 개의 큰 서브유닛과 박테리아 RNAP의 가장 큰 두 개의 서브유닛을 가지고 있다. 또한, 이러한 세 가지 효소 모두에서 또는 RNAP I과 RNAP III 사이에서만 공통적으로 발견되는 여러 작은 서브유닛이 있다.
진핵 DdRp는 박테리아 RNAP와 마찬가지로 전사 개시에 필요한 특수 보조 인자가 필요하다. 그러나 박테리아의 경우와 달리 진핵 개시인자는 프로모터 요소를 중합효소 홀로엔자임의 일부가 아닌 독립적으로 인식한다. 특히 RNAP II에 의해 전사된 유전자에서 많은 다른 개시인자가 관련되며, 일부 개시인자는 그 자가로 매우 복잡한 단백질이다. 정제된 진핵 RNA 중합효소만으로는 프로모터에서 선택적으로 전사를 시작할 수 없다.
홀로엔자임은 때때로 진핵 RNAP를 지칭하는 데 사용되지만, 이 경우에는 박테리아 '핵심' 효소와 비슷한 것을 의미하며 프로모터에서 전사할 수 없다. 그러나 박테리아 핵심 효소와 달리 진핵세포 전체 효소는 RNA의 전사 또는 처리와 관련된 많은 다른 단백질을 포함할 수 있다.
본 발명에 따른 키메라 효소는 DNA-의존성 RNA 중합효소의 하나 이상의 촉매 도메인을 추가로 포함한다.
"DNA-의존성 RNA 중합효소"(DdRp)는 5' - 3' 방향으로 단일 또는 이중 가닥 DNA 주형으로부터 RNA의 상보적 가닥을 합성하는 뉴클레오티딜 전이효소에 관한 것이다.
바람직하게는, DdRp의 상기 촉매 도메인은 비교적 단순한 구조를 갖고 보다 바람직하게는 게놈 효소 조절 요소(즉, 프로모터 및 전사 종결 신호)를 특징으로 하는 효소의 촉매 도메인이다.
따라서, 특히, DdRp의 상기 촉매 도메인은 박테리오파지 DNA-의존성 RNA 중합효소, 박테리아 DNA-의존성 RNA 중합효소 또는 다양한 진핵 세포 소기관의 DNA-의존성 RNA 중합효소의 촉매 영역일 수 있다.
DdRp의 상기 촉매 도메인은 박테리오파지 DNA-의존성 RNA 중합효소의 촉매 도메인이다.
박테리오파지 DNA-의존성 RNA 중합효소는 특히 진핵생물 RNA 중합효소보다 더 높은 진행성을 가짐으로써 이식유전자 발현 수준을 최적화한다는 이점이 있다. 박테리오파지 DNA 의존성 RNA 중합효소는 또한 다수의 소단위(예: RNA 중합효소 II)와 전사 인자로 구성된 대부분의 핵 진핵생물 중합효소보다 훨씬 단순한 구조를 가지고 있다. 지금까지 특성화된 대부분의 박테리오파지 DNA-의존성 RNA 중합효소는 단일 소단위 효소이며, 전사 개시, 연장 또는 종결을 위한 보조 단백질이 필요하지 않다. 복제된 박테리오파지의 이름을 따서 명명된 이러한 효소 중 일부는 형질전환에 중요한 조절 게놈 요소(예: 프로모터 및 종결 신호)도 잘 특성화되어 있다.
또한 내인성 유전자 전사와 이식유전자 전사 사이에는 경쟁이 없다. 박테리오파지 DNA-의존성 RNA-중합효소 모이어티를 포함하는 본 발명에 따른 키메라 효소는 임의의 진핵생물 종(예를 들어, 효모, 설치류 및 인간)에서 RNA RNA의 생성을 허용한다. 그들은 비싸지 않고 빠르고 쉽게 구현할 수 있으므로 대규모 분석 및 단백질 생산에 적합하다. RNA 중합효소 II와 같은 진핵생물 RNA 중합효소와 대조적으로 대부분의 박테리오파지 DNA 의존성 RNA 중합효소는 전사의 개시, 연장 또는 종결을 위한 인자 관련이 필요하지 않기 때문에 모든 생물학적 시스템(예: 무세포 반응용액, 배양 세포 및 살아있는 유기체)에서 RNA RNA의 생산을 허용한다.
박테리오파지 DNA-의존성 RNA 중합효소의 상기 촉매 도메인은 특히 야생형 T7 RNA 중합효소(NCBI 게놈 서열 NC_001 604; 유전자 1261 050; Gene 1261 050); UniProtKB/Swiss-Prot P00573), 야생형 T3 RNA 중합효소(NCBI 게놈 서열 NC_003298; Gene 927437; UniProtKB/Swiss-Prot Q778M8), 야생형 K1 E RNA 중합효소(NCBI 게놈 서열 AM084415.1, UnisissProtKB/Sw Prot Q2WC24), 야생형 K1-5 RNA 중합효소(NCBI 게놈 서열 AY370674.1, NCBI YP_654105.1), 야생형 K11 RNA 중합효소(NCBI 게놈 K11 RNAP 서열 NC_004665; Gene 12588850; Q859H5), 야생형 cpA1 122 RNA 중합효소(NCBI 게놈 서열 NC_004777; 유전자 1733944; UniProtKB/Swiss-Prot 단백질 Q858N4), 야생형 cpYeo3-12 RNA 중합효소(NCBI 게놈 서열 NC_026/Gene2) Q9T145) 및 야생형 gh-1 RNA 폴리 지우기(NCBI 게놈 서열 NC_004665; 유전자 1258850; UniProtKB/Swiss-Prot 단백질 Q859H5), 야생형 SP6 RNA 중합효소(NCBI 게놈 서열 NC_004831; Gene 1481778; UniProtKB/Swiss-Prot 단백질 Q7Y5R1), 및 상보적인 단일 가닥 RNA를 합성할 수 있는 이들의 돌연변이체 또는 유도체 5' - 3' 방향으로 이중 가닥 주형 DNA에 대한 서열, 보다 구체적으로 야생형 T7 RNA 중합효소, 야생형 T3 RNA 중합효소, 야생형 SP6 RNA 중합효소, 야생형 K1-5 RNA 중합효소 및 5' - 3' 방향으로 이중 가닥 주형 DNA에 서열 상보적인 단일 가닥 RNA를 합성할 수 있는 야생형 K1 E RNA 중합효소 및 이의 돌연변이체 또는 유도체 등이다.
박테리오파지 RNA 중합효소의 원형, 즉 박테리오파지 T7 RNA 중합효소는 시험관 내에서 효소가 매우 높은 진행성이고 37°C에서 5' - 3' 방향으로 240-250 뉴클레오티드/초를 연장한다는 이점이 있다. 더욱이, 진핵 세포에서 발현될 때, 박테리오파지 T7 RNA 중합효소는 대부분 세포질에 남아있다, 따라서 세포질에서 진핵 세포의 핵으로의 큰 DNA 분자(즉, 이식유전자)의 능동 전달 및 핵에서 세포질로 RNA 분자의 유출을 방지함으로써 이식유전자 발현 수준을 최적화할 수 있다.
DdRp의 촉매 도메인은 K1 E 또는 K1-5 RNA 중합효소의 야생형 중 하나일 수 있지만 단일-합성을 할 수 있는 K1 E 또는 K1-5 RNA 중합효소의 돌연변이체일 수도 있다. 5' - 3' 방향으로 이중 가닥 주형 DNA에 서열상 상보적인 가닥 RNA(가공성 포함). 예를 들어, 상기 돌연변이는 K1E RNA 중합효소 돌연변이 R551 S, F644A, Q649S, G645A, R627S, 181 OS, D812E 및 K631 M, 특히 R551 S 등일 수도 있다.
바람직하게는, 본 발명에 따른 키메라 효소의 DdRp의 상기 촉매 도메인은 내인성 유전자 전사와 상기 DNA 서열 전사 사이의 경쟁을 방지하기 위해 무세포유래 세포의 것과 상이한 효소로부터의 것이다.
2. RdRp
본 발명은 RNA 중합효소의 발현단위는 (i) 무세포유래 세포에서 작동하는 프로모터;
(ii) RNA dependent RNA Polymerase(RdRp) ORF 또는 그의 변이체; 및
(iii) 전사 종결서열;을 포함하는 단위를 특징으로 하는 관심 RNA 전사시스템일 수도 있다.
바람직하게는, 알파바이러스 RdRp를 발현시키기 위한 RNA 중합효소의 발현단위는 알파바이러스 RdRp를 코딩하는 오픈 리딩 프레임 (Open Reading Frame: ORF)을 포함한다.
"RdRp"는 RNA 의존성 RNA 중합효소 (RNA dependent RNA polymerase: RdRP)를 의미한다. RdRp는 일반적으로 폴리펩티드 또는 (+) 가닥 RNA 주형에 기반한 (-) 가닥 RNA의 합성을 촉매할 수 있는, 및/또는 (-) 가닥 RNA 주형에 기반한 (+) 가닥 RNA의 합성을 촉매할 수 있는 둘 이상의 동일한 및/또는 비동일한 단백질의 복합체 또는 결합체를 지칭한다.
RdRp는 추가적으로 하나 이상의 추가 기능, 예컨대 프로테아제 (자가-절단을 위해), 헬리카제, 말단 아데닐릴 전이효소 (폴리(A) 꼬리 추가를 위해), 메틸전달효소 및 구아닐릴 전이효소 (5'-캡을 핵산에 제공하기 위해), 핵 위치화 신호(nuclear localization sites), 트리포스파타아제를 추가로 가질 수 있다.
"알파바이러스 RdRp"는 자연성 발생 알파바이러스로부터의 RNA RdRp 및 약독 알파바이러스와 같은 알파바이러스의 변이체 또는 유도체로부터의 RNA RdRp를 포함하는, 알파바이러스로부터의 RNA RdRp를 지칭한다. 용어 "RdRp" 및 "알파바이러스 RdRp"는 임의의 특정 RdRp가 알파바이러스 RdRp가 아니라고 문맥이 지시하지 않는 한, 상호 교환적으로 사용된다.
"RdRp"라는 용어는 알파바이러스-감염된 세포에 의해 발현되거나 RdRp에 대해 코딩하는 핵산으로 형질 주입된 세포에 의해 발현되는 알파바이러스 RdRp의 모든 변이체, 특히 번역 후 변형된 변이체, 입체배좌체, 이소형체 및 상동체를 포함한다. 또한, 용어 "RdRp"는 재조합 방법에 의해 생성되고 생산될 수 있는 모든 형태의 RdRp를 포함한다. 예를 들어, 실험실에서 RdRp의 검출 및/또는 정제를 용이하게 하는 태그를 포함하는 RdRp, 예를 들어 myc-태그, HA-태그 또는 올리고히스티딘 태그(His-태그)는 재조합 방법에 의해 제조될 수 있다.
선택적으로, RdRp는 추가적으로 임의의 하나 이상의 알파바이러스 보존서열구성 1 (CSE 1) 또는 이의 상보 서열, 보존서열구성 2 (CSE 2) 또는 이의 상보 서열, 보존서열구성 3 (CSE 3) 또는 이의 상보 서열, 보존서열구성 4 (CSE 4) 또는 이의 상보 서열에 대해 결합 능력이 있음을 기능적으로 의미한다.
바람직하게는, RdRp는 CSE 2 [즉, (+) 가닥에] 및/또는 CSE 4 [즉, (+) 가닥에]에 결합할 수 있거나, CSE 1의 상보체 [즉, (-) 가닥에] 및/또는 CSE 3의 상보체 [즉, (-) 가닥에]에 결합할 수 있다.
RdRp의 기원은 특정 알파바이러스에만 국한되지 않는다. 바람직한 일 실시형태에서, 알파바이러스 RdRp는 자연성 발생 Semliki Forest 바이러스 및 약독 Semliki Forest 바이러스와 같은 Semliki Forest 바이러스의 변이체 또는 유도체를 포함하는 Semliki Forest 바이러스로부터 유래된 것이다. 또 바람직하게, RdRp는 자연성 발생 Sindbis 바이러스 및 약독 Sindbis 바이러스와 같은 Sindbis 바이러스의 변이체 또는 유도체를 포함하는 Sindbis 바이러스로부터 유래된 것이다. 또 바람직하게, RdRp는 자연성 발생 VEEV 및 약독 VEEV와 같은 VEEV의 변이체 또는 유도체를 포함하는 베네수엘라 마뇌염 바이러스(VEEV)로부터 유래된 것이다.
알파바이러스 RdRp는 전형적으로 알파바이러스 비구조성 단백질 (nsP)을 포함하거나 이로 구성된다. "비구조성 단백질"은 알파바이러스 기원의 임의의 하나 이상의 별개의 비구조성 단백질 (nsP1, nsP2, nsP3, nsP4)을 지칭하거나, 알파바이러스 기원의 둘 이상의 비구조성 단백질, 예를 들어 nsP1234의 폴리펩티드 서열을 포함하는 폴리-단백질을 지칭한다. "비구조성 단백질"은 nsP123을 지칭한다. "비구조성 단백질"은 nsP1234를 지칭한다. "비구조성 단백질"은 nsP123 (동의어로 P123) 및 nsP4의 복합체 또는 결합체를 지칭한다. "비구조성 단백질"은 nsP1, nsP2 및 nsP3의 복합체 또는 결합체를 나타낸다. "비구조성 단백질"은 nsP1, nsP2, nsP3 및 nsP4의 복합체 또는 결합체를 나타낸다. "비구조성 단백질"은 nsP1, nsP2, nsP3 및 nsP4로 이루어진 군으로부터 선택된 어느 하나 이상의 복합체 또는 결합체를 지칭한다.
용어 "복합체" 또는 "결합체"는 다수 요소들의 기능적 앙상블이다. 알파바이러스 RdRp와 관련하여, 용어 "복합체 또는 결합체"는 적어도 2개의 다수 단백질 분자를 의미하며, 그 중 적어도 하나는 알파바이러스 비구조성 단백질이고, 여기서 복합체 또는 결합체는 RNA-의존성 RNA 중합효소 (RdRP) 활성을 나타낸다. 복합체 또는 결합체는 다수의 상이한 단백질 (헤테로다합체) 및/또는 하나의 특정 단백질 (호모다합체)의 다수 사본으로 이루어질 수 있다. 다합체 또는 다수와 관련하여, "다수(multi)"는 2, 3, 4, 5, 6, 7, 8, 9, 10, 10개 초과와 같은 둘 이상의 것을 의미한다.
또한, 복합체 또는 결합체는 둘 이상의 다른 알파바이러스의 단백질도 포함할 수 있다. 예를 들어, 상이한 알파바이러스 비구조성 단백질을 포함하는 본 발명에 따른 복합체 또는 결합체에서, 모든 비구조성 단백질이 동일한 알파바이러스 유래일 필요는 없다. 이종 복합체 또는 결합체도 본 발명에 동등하게 포함된다. 단지 예시적인 목적으로, 이종 복합체 또는 결합체는 제1 알파바이러스 (예를 들어, Sindbis 바이러스)로부터의 하나 이상의 비구조성 단백질 (예를 들어, nsP1, nsP2) 및 제 2 알파바이러스 (예를 들어 Semliki Forest 바이러스)로부터의 하나 이상의 비구조성 단백질 (nsP3, nsP4)을 포함할 수 있다.
"복합체" 또는 "결합체"는 공간적으로 근접한 2개 이상의 동일하거나 상이한 단백질 분자를 지칭한다. 복합체의 단백질은 바람직하게는 서로 직접적 또는 간접적인 물리적 또는 물리화학적 접촉을 한다. 복합체 또는 결합체는 다수의 상이한 단백질(헤테로다합체) 및/또는 하나의 특정 단백질(호모다합체)의 다중 사본으로 구성될 수 있다.
"RdRp"는 알파바이러스 비구조성 단백질의 탄수화물-개질된 형태 (예컨대 글리코실화됨) 및 지질-개질된 형태를 포함하여 각각의 동시- 또는 번역-후 변형된 형태를 포함한다. "RdRp"는 알파바이러스 RdRp의 각각 및 모든 기능적 단편을 포함한다. 단편은 RNA 의존성 RNA 중합효소 (RdRP)로서 작용할 때 기능적이다. RdRp는 RdRp가 발현되는 세포에서 막성(membranous) 복제 복합체 및/또는 액포를 형성할 수 있다.
바람직하게는 RNA 중합효소의 발현단위는 상기 정의된 RdRp에 대한 코딩영역(들)을 포함한다. 코딩영역(들)은 하나 이상의 오픈 리딩 프레임(들)로 구성될 수 있다. RNA 중합효소의 발현단위는 알파바이러스 nsP1, nsP2, nsP3 및 nsP4 모두를 암호화한다. RNA 중합효소의 발현단위는 하나의 단일 개방형 해독특에 의해 코딩되어, 하나의 단일이고, 선택적으로 절단 가능한 폴리단백질, nsP1234로서 알파바이러스 nsP1, nsP2, nsP3 및 nsP4를 암호화한다. RNA 중합효소의 발현단위는 하나의 단일 개방형 해독특에 의해 코딩되어, 하나의 단일이고, 선택적으로 절단 가능한 폴리단백질, nsP123으로서 알파바이러스 nsP1, nsP2 및 nsP3을 암호화한다. nsP4는 개별적으로 암호화될 수 있다.
바람직하게는, 본 발명의 RNA 중합효소의 발현단위는 알파바이러스 서브게놈 프로모터를 포함하지 않는다.
바람직하게는, RNA 중합효소의 발현단위는 mRNA 분자이다. mRNA 분자는 바람직하게는 CSE 1 및 CSE 4를 포함하지 않는다. 그러한 mRNA는 RdRp의 결합에 대해 레플리콘과 경쟁하지 않아, 레플리콘이 RdRp에 의해 매우 효율적으로 복제될 수 있다고 생각된다.
RNA 중합효소의 발현단위의 RNA는 바람직하게는 이중가닥이 아니며, 바람직하게는 단일가닥이고, 보다 바람직하게는 (+) 가닥 RNA이다. RdRp는 RdRp mRNA 발현단위 상의 오픈 리딩 프레임에 의해 코딩된다.
본 발명의 RNA 중합효소의 발현단위는 인트론-없는 RNA, 바람직하게는 인트론-없는 mRNA이다. 바람직하게는, RNA 중합효소의 발현단위는 자연적으로 인트론-없는 RNA (mRNA)이다. 예를 들어, 인트론-없는 RNA (mRNA)는 시험관내에서 합성에 의해, 예를 들어 시험관내 전사에 의해 수집될 수 있다. RNA 중합효소의 발현단위는 인트론을 포함하지 않는 nsP1234를 코딩하는 오픈 리딩 프레임을 포함한다. RNA 중합효소의 발현단위는 인트론을 포함하지 않는 nsP123을 코딩하는 오픈 리딩 프레임을 포함한다.
"인트론"은 RNA의 코딩 서열을 폴리펩티드로 번역하기 전에 제거되는, 즉 RNA로부터 스플라이싱된 전구체 mRNA (pre-mRNA)의 비-코딩 섹션으로 정의된다. 일단 인트론이 pre-mRNA로부터 스플라이싱되면, 얻어진 mRNA 서열은 폴리펩티드로 번역될 준비가 된 것이다. 즉, 인트론의 뉴클레오타이드 서열은 전형적으로 단백질로 번역되지 않는다. 인트론-없는 mRNA는 폴리펩티드로 번역하기 위한 코돈(염기 삼중항)을 연속적인 순서로 포함하는 mRNA이다. 인트론-없는 mRNA는 자연적으로 인트론이 없거나 (예를 들어 세포 내 또는 시험관내 전사에서 인트론-없는 mRNA로 처음 합성될 수 있음) 인트론-함유 pre-mRNA의 스플라이싱에 의해 인트론-없는 mRNA로 성숙될 수 있다. 자연적으로 인트론-없는 시험관내 전사된 RNA가 본 발명에서 바람직하다.
본 발명의 RNA 중합효소의 발현단위는 적어도 자가-복제가 가능하지 않는다는 점 및/또는 서브-게놈 프로모터의 제어 하에 오픈 리딩 프레임을 포함하지 않는다는 점에서 알파바이러스 게놈 RNA와 상이하다. 자가 증폭이 불가능한 경우, RNA 중합효소의 발현단위는 "자살 구성체(suicide construct)"라고도 불릴 수 있다.
바람직하게는, 본 발명의 RNA 중합효소의 발현단위는 알파바이러스 구조 단백질과 관련이 없다. 바람직하게는 RNA 중합효소의 발현단위는 알파바이러스 구조 단백질에 의해 포장되지 않는다. 보다 바람직하게는, RNA 중합효소의 발현단위는 바이러스 입자 내에 포장되지 않는다. 바람직하게는, RNA 중합효소의 발현단위는 바이러스 단백질과 결합하지 않는다 (바이러스 단백질-없는 시스템). 바이러스 단백질-없는 시스템은 종래 기술, 예를 들어 헬퍼-바이러스 기반 시스템과 비교하여 이점을 제공한다.
바람직하게는, RNA 중합효소의 발현단위는 (+) 가닥 주형에 기반한 (-) 가닥 합성 및/또는 (-) 가닥 주형에 기반한 (+) 가닥 합성에 필요한 적어도 하나의 보존서열구성 (CSE)이 부족하다. 보다 바람직하게는, RNA 중합효소의 발현단위는 어떠한 알파바이러스 보존서열구성 (CSE)도 포함하지 않는다. 특히, 알파바이러스의 4개 CSE에서, 하기 CSE 중 임의의 하나 이상이 바람직하게는 RNA 중합효소의 발현단위상에 존재하지 않는다.
- 자연계에서 발견되는 알파바이러스에서 (-) 가닥 주형에 기반한 (+) 가닥 합성을 위한 프로모터로서 기능하는 것으로 여겨지는 CSE 1;
- 자연계에서 발견되는 알파바이러스의 (+) 가닥 게놈 RNA에 기반한 (-) 가닥 합성을 위한 프로모터로서 기능하는 것으로 여겨지는 CSE 2;
- 자연계에서 발견되는 알파바이러스에서 서브게놈 (+) 가닥 RNA의 효율적인 전사에 기여한다고 여겨지는 CSE 3;
- 자연계에서 발견되는 알파바이러스에서 (+) 가닥 게놈 RNA에 기반한 (-) 가닥 합성의 개시를 위한 코어-프로모터로 작용한다고 여져지는 CSE 4.
CSE 1, CSE 3 및 CSE 4는 존재하지 않고 CSE 2가 존재할 수도 있거나 존재하지 않을 수도 있다.
특히, 임의의 하나 이상의 알파바이러스 CSE가 없는 경우, 본 발명의 RdRp mRNA 발현단위는 알파바이러스 게놈 RNA와 유사한 것보다 전형적인 진핵세포 mRNA와 매우 유사하다.
본 발명의 RNA 중합효소의 발현단위는 분리된 핵산 분자이다.
3. 캡핑효소와 Poly(A) polymerase
진핵생물에서 전령 RNA(mRNA)의 전구체, 즉 pre-mRNA는 RNA 중합효소 II에 의해 합성된 다음 번역, 안정성 또는 면역 반응을 포함한 생물학적 활동에 필요한 여러 가지 전사 후 변형이 일어난다. 이러한 변형들에서 mRNA 대사 및 번역에 특히 중요한 2개는 5'-말단에 캡을 추가하고 3'-말단에 폴리아데닐화 꼬리를 추가이다.
캡핑은 거의 모든 진핵 메신저 RNAs의 5'-말단에서 발견되는 특수 구조이다. 가장 단순한 캡 구조인 cap-0은 N7에서 메틸화된 구아닌 뉴클레오시드가 첨가된 결과로, 이 뉴클레오시드는 1차 RNA의 말단에 결합된 5'-5' 트리포스페이트에 의해 형성된다(즉, m7GpppN 여기서 N은 임의의 염기, m은 메틸 그룹 및 p는 포스페이트를 나타냄). 소위 표준 경로에서 cap-0의 형성은 일련의 세 가지 효소 반응을 포함한다. 즉, RNA triphosphatase(RTPase)는 초기 pre-mRNA의 5' triphosphate 말단의 γ phosphate 잔기를 제거하여 diphosphate로 전환하고, RNA guanylyltransferase(GTase)는 GTP에서 GMP를 초기 RNA 말단의 diphosphate 5' 말단으로 전달하며, RNA N7-guanine methyltransferase (N7-MTase)는 구아닌의 아조트 azode 7에 있는 메틸 잔기를 첨가시켜 GpppN 캡을 형성하는 반응이다.
고등 진핵생물 및 일부 바이러스에서, 각각 cap1- 및 cap2-specific MTase로 명명된 두 개의 분리된 리보스-2'-0 MTase에 의해 첫 번째(즉, cap-1 구조; m7GpppNm2'-°pN) 및 두 번째(즉, cap2 구조; m7GpppNm2' 0pNm2' 0) 전사된 뉴클레오티드의 리보스의 2'-히드록실 그룹이 메틸화될 수 있다(Langberg and Moss 1981). 그러나 세포 N7-MTase 활성은 독점적으로 핵에 있으며 대조적으로 cap-1 ribose-2'-0 MTase 활성은 HeLa 세포의 세포질과 핵 모두에서 감지된 반면 cap2 MTase 활성은 세포질에서만 발견된다.
5' 말단 m7GpppN 캡의 형성은 pre-mRNA 처리의 첫 번째 단계이다. m7GpppN 캡은 mRNA 안정성과 핵에서 세포질로의 전달에서 중요한 역할을 한다. 또한, 5'-말단 m7GpppN 캡은 작은 리보솜 서브유닛의 16S 부분이 mRNA로 이동하는 것을 매개하는 진핵생물 번역 개시 인자 4F(elF4F) 복합체를 고정함으로써 mRNA를 단백질로 번역하는 데 중요하다. 따라서 5'-말단 m7GpppN 캡은 시험관내 및 세포내에서 mRNA의 번역을 크게 향상시킨다. cap-0, cap-1 및 cap-2 변형은 차례로 인터페론 type-l 반응을 유도하는 RNA 센서 RIG-1 및 MDA5를 통해 비자기 RNA와 self를 구별함으로써 선천적 면역에 참여한다.
"캡핑 효소"는 mRNA의 5'-말단에 m7 GpppG 캡을 추가할 수 있고/있거나 RNA 서열의 궁극 또는 끝에서 두 번째 염기를 변형할 수 있는 임의의 효소를 의미한다. 표준 캡핑 효소 및 cap-1 또는 cap-2 뉴클레오사이드 2' 메틸트랜스퍼라제, N6-메틸-아데노신 트랜스퍼라제을 포함할 수 있다.
"cap-0 표준 캡핑 효소"는 일련의 3가지 효소 반응을 포함함으로써 RNA 분자의 5' 말단에 cap-0 구조를 추가할 수 있는 효소를 지칭한다. 즉, 초기 pre-mRNA에서 5' 삼인산 말단의 γ-인산 잔기를 제거하여 이인산 pp RNA 제조하는 RNA 트리포스파타제(RTPase), GTP에서 이인산 pp RNA 초기 RNA 말단으로 GMP를 전달하는 RNA 구아닐릴트랜스퍼라제(GTase), 및 Gppp RNA 캡에 대한 구아닌의 질소 7 잔기에 메틸을 추가하는 RNA N7-구아닌 메틸트랜스퍼라제(N7-MTase)이다.
cap-0 구조의 정식 형성에 관여하는 진핵 생물 및 바이러스의 효소 도메인은 다양한 수의 단백질 소단위로 조립될 수 있다.
세 가지 중요한 효소 도메인, 즉 RTPase, GTase 및 N7-MTase가 모두 포함된 단일 소단위 캡핑 효소. 이러한 효소에는 다음이 포함되지만 이에 국한되지는 않는다. ① Acanthamoeba Polyphaga mimivirus capping enzyme R382 (NCBI APMV genomic sequence NC_006450; UniProtKB/Swiss-Prot accession number Q5UQX1), ② 효모 클루이베로마이세스 락티스 선형 염색체외 에피솜 pGKL2로부터의 ORF3 캡핑 효소(NCBI Kluyveromyces 599 pGgenomic 7 서열) UniProtKB/Swiss-Prot 수탁 번호 P05469), ③ 아프리카 돼지 열병 바이러스 NP868R 캡핑 효소 (NCBI ASFV 게놈 서열 균주 BA71 V NC_001659; UniProtKB/Swiss-Prot 수탁 번호 P32094), VP4 Bluetongue 바이러스 캡핑 효소(NCBI BTV 혈청형 10 게놈 서열 Y00421; UniProtKB/Swiss-Prot accession number P07132)이다.
다음을 포함하지만 이에 국한되지 않는 두 개의 소단위로 구성된 캡핑 효소는 ① RTPase 및 GTase 효소 활성을 모두 갖는 RNGTT 서브유닛으로 구성된 포유동물 캡핑 효소 (HCE1로도 명명됨; 인간 및 마우스 UniProtKB/Swiss-Prot 수탁 번호 060942 및 055236, 각각) 및 N7-MTase 효소 활성을 갖는 RNMT (인간 및 마우스 UniProtKB/Swiss-Prot 수탁 번호 Q05D80 및 D3YYS7, 각각), ② RTPase, GTase 및 N7-MTase 효소 도메인을 갖는 D1R 유전자 산물로 구성된 백시니아 캡핑 효소(서열 균주 웨스턴 리저브 NC_006998.1; UniProtKB/Swiss-Prot 수탁 번호 P04298) 및 D12L 유전자 생성물 고유 효소 활성은 없지만 RNA N7-MTase 활성을 크게 향상시키는 D1R 서브유닛(게놈 서열 균주 웨스턴 리저브 NC_006998.1; 유전자 3707515; UniProtKB/Swiss-Prot 수탁 번호 P04318) 등이다.
3개의 서브유닛으로 구성된 캡핑 효소는 RTPase가 있는 Saccharomyces cerevisiae CET1(UniProtKB/Swiss-Prot 수탁 번호 013297), GTase가 있는 CEG1(UniProtKB/Swiss-Prot 수탁 번호 Q01 159) 및 N7-MTase 촉매 활성을 갖는 ABD1 (UniProtKB/Swiss-Prot 수탁 번호 P32783) 등이다.
"cap-0 비정규 캡핑 효소"는 RNA 분자의 5' 말단에 cap-0 구조를 추가할 수 있지만 정규 효소적 과정과 다른 경로에 있는 효소를 의미한다. 세 가지 비표준 5' RNA 캡 합성 메커니즘이 보고되었다.
"cap-1 캡핑 효소"라는 용어는 RNA 분자의 5' 말단에 cap-1 구조를 부가할 수 있는 효소를 의미한다. 본 명세서에 사용된 바와 같이, 용어 "캡-2 캡핑 효소"는 RNA 분자의 5' 말단에 캡-2 구조를 부가할 수 있는 효소를 지칭한다.
포유동물, 고등 진핵생물 및 일부 바이러스에서 두 개의 캡 변형이 발견되는데, 이는 효모 및 식물 mRNA에 없고, 뉴클레오티드의 리보스 부분의 2' 히드록시기의 메틸화에 의해 생성된다. mRNA의 5' 말단: 첫 번째 mRNA 뉴클레오티드에서 cap-1, 두 번째 mRNA 뉴클레오티드에서 cap-2. Cap-1 메틸화는 거의 모든 포유동물 mRNA 분자에서 발견되는 반면 mRNA의 절반만이 두 번째 전사된 뉴클레오티드에 2'-O-메틸화된 잔기를 포함한다.
포유류에서 cap-1 및 cap-2 변형은 2개의 리보스-2'-0 메틸트랜스퍼라제(뉴클레오사이드-2'-메틸트랜스퍼라제 또는 2'-0-MTase라고도 함)에 의해 수행된다.
첫째, MTR1(cap-1 리보스-2'-0 MTase 활성, FTSJD2, KIAA0082 또는 ISG95라고도 함; UniProtKB/Swiss-Prot 수탁 번호 Q8N1 G2)은 핵에서만 발견되며 추정되는 핵 위치 신호 및 RNA 결합에 잠재적으로 관여하는 G-패치 도메인이다. 놀랍게도, MRT1은 RNA 중합효소 II의 CTD와 연관되는데, 이는 cap-1 형성이 mRNA 합성 초기에 발생함을 나타냅니다.
둘째, MTR2(캡 2 리보스-2'-0 MTase, FTSJD1 또는 FLJ1 1 171로도 명명됨; UniProtKB/Swiss-Prot 수탁 번호 Q8IYT2)는 S-아데노실메티오닌에서 두 번째의 2'-O-리보스로 메틸기를 전달한다. mRNA와 작은 핵 RNA의 뉴클레오티드. MTR2에는 구아노신 cap-0 또는 cap-1 변형의 N7 메틸화가 필요하지 않지만 cap-1의 존재는 MTR2 활성을 증가시킨다. MTR2 단백질은 핵 MTR1과 대조적으로 핵과 세포질 전체에 분포되어 있다.
일부 진핵 바이러스는 다음을 포함하여 자체 cap-1 및/또는 cap-2 2'-0-MTase를 가지고 있다. 백시니아 바이러스로부터의 VP39(NCBI 게놈 서열 NC_006998.1; cap-1 및 cap-2 2'-O-MTase 효소 활성을 모두 갖는 UniProtKB/Swiss-Prot 수탁 번호 YP_232977이다. Autographa californica Nucleopolyhedrovirus로부터의 Orf69(NCBI 게놈 서열 NC_001623.1; UniProtKB/Swiss-Prot 수탁 번호 P41469)이다. 코로나바이러스의 nspl 6(인간 SARS 코로나바이러스 NCBI 게놈 서열 NC_004718.3의 폴리프로테인 1 ab의 잔기 6776-7073; UniProtKB/Swiss-Prot 수탁 번호 P0C6X7)이다. GTase 및 N7-MTase 효소 활성 외에 2'-0-MTase를 갖는 Reovirus(예: 포유류 오르토레오바이러스 유형 3, 균주 Dearing; NCBI 게놈 서열 J03488; UniProtKB/Swiss-Prot 수탁 번호 P1 1079)로부터의 λ2 단백질( Bujnicki 및 Rychlewski 2001), 청설 바이러스로부터의 VP4(NCBI BTV 혈청형 10 게놈 서열 ID Y00421; UniProtKB/Swiss-Prot 수탁 번호 P07132), 뎅기열 바이러스, 서열 바이러스, 지카 바이러스를 포함하는 플라비바이러스로부터의 NS5 , Meaban 바이러스, Yokose 바이러스, St. Louis 뇌염 바이러스, 일본 뇌염 바이러스, 진드기 매개 뇌염 바이러스(예: 뎅기열 바이러스 유형 1 균주 Nauru/West Pac/1974의 다단백질; NCBI 게놈 서열 U88535; UniProtKB/Swiss-Prot 수탁 번호 P17763)은 또한 mRNA의 내부 아데노신 잔기를 메틸화할 수 있다.
본 발명에 따른 키메라 효소는 하기를 포함하거나 이로 이루어진다. RNA 트리포스파타제의 하나 이상의 촉매 도메인; 구아닐릴트랜스퍼라제의 하나 이상의 촉매 도메인; N7-구아닌 메틸트랜스퍼라제의 하나 이상의 촉매 도메인; 그리고 단백질- RNA 테더링 시스템의 적어도 하나의 RNA-결합 도메인일 수 있다.
특히, 상기 촉매 도메인 중 적어도 하나는 cap-0 표준 캡핑 효소, 보다 구체적으로 바이러스 cap-0 표준 캡핑 효소의 촉매 도메인이다.
" RNA 트리포스파타제"(RTPase)는 초기 pre-mRNA의 5' 트리포스페이트 말단의 Y 포스페이트 잔기를 디포스페이트로 제거하는 효소에 관한 것이다. " RNA 구아닐릴트랜스퍼라제"(GTase)는 GMP를 GTP에서 이인산 초기 RNA 말단으로 전달하는 효소를 의미한다. "N7-구아닌 메틸트랜스퍼라제"(N7-MTase)는 GpppN 캡에 구아닌의 아조트 7에 있는 메틸 잔기를 추가하는 효소에 관한 것이다.
RNA 트리포스파타제의 상기 촉매 도메인, 구아닐릴트랜스퍼라제의, N7-구아닌 메틸트랜스퍼라제의 촉매 도메인은 동일하거나 상이한 캡핑 효소의 것일 수 있다.
바람직하게는, RNA 트리포스파타제, 구아닐릴트랜스퍼라제, N7-구아닌 메틸트랜스퍼라제의 촉매 도메인은 유리하게는 비교적 단순한 구조 및 잘 특성화된 효소 활성을 갖는 하나 또는 여러 세포질 효소로부터 유래한다. 따라서, 특히, RNA 트리포스파타제, 구아닐릴트랜스퍼라제, N7-구아닌 메틸트랜스퍼라제의 촉매 도메인은 하나 이상의 바이러스 캡핑 효소, 또는 세포질 에피솜의 캡핑 효소의 촉매 도메인일 수 있다.
RNA 트리포스파타제의 상기 촉매 도메인, 구아닐릴트랜스퍼라제의 N7-구아닌 메틸트랜스퍼라제의 촉매 도메인은 특히 야생형 백시니아 바이러스 캡핑 효소, 야생형 블루텅 바이러스 캡핑 효소, 야생형 대나무 모자이크 바이러스 캡핑 효소, 야생형 아프리카돼지열병 바이러스 캡핑 효소, Lake phycodnavirus 2(OLPV2) 캡핑 효소, 야생형 Phaeocystis globosa 바이러스 캡핑 효소, 야생형 Chrysochromulina ericina 바이러스 캡핑 효소 및 이들의 돌연변이체 또는 유도체는 각각 초기 전의 5' 트리포스페이트 말단의 γ 포스페이트 잔기를 제거할 수 있다. mRNA를 이인산으로 전환하거나 GTP에서 GMP를 이인산 초기 RNA 말단으로 옮기거나 구아니의 아조트 7에 메틸 잔기를 추가한다. GpppN 캡에 대해, 보다 구체적으로는 초기 pre-mRNA의 5' 트리포스페이트 말단의 γ 포스페이트 잔기를 디포스페이트로 또는 GMP를 전달할 수 있는 야생형 아프리카 돼지열병 바이러스 캡핑 효소 및 이의 돌연변이체 또는 유도체 이인산 초기 RNA 말단에 GTP를 추가하거나 GpppN 캡에 구아닌의 아조트 7에 메틸 잔기를 추가한다.
"백시니아 바이러스 캡핑 효소"는 백시니아 바이러스의 이종이량체 D1 R/D12L 캡핑 효소에 관한 것이다. RTPase, GTase 및 N7-MTase 효소 도메인을 갖는 D1 R 유전자 산물(genomic sequence strain Western Reserve NC_006998.1 ; UniProtKB/Swiss-Prot accession number P04298) 및 D12L 유전자 산물은 고유의 효소 활성은 없지만 RNA N7- D1R 소단위의 MTase 활성(게놈 서열 균주 웨스턴 리저브 NC_006998.1, 유전자 3707515, UniProtKB/Swiss-Prot 수탁 번호 P04318)이다.
"청설 바이러스 캡핑 효소"는 76kDa 단백질(644개 아미노산; 서열은 예를 들어 NCBI BTV 혈청형 10 게놈 참조)인 청설 바이러스(BTV)의 단일 단위 VP4 캡핑 효소에 관한 것이다. 서열 Y00421; 유전자 29431 57; UniProtKB/Swiss-Prot P07132). 이 캡핑 효소는 카르복실 말단 근처에 위치한 류신 지퍼를 통해 동종이량체화할 수 있다. VP4는 mRNA m7GpppN 캡핑 합성에 필요한 세 가지 효소 단계 모두를 촉매한다: RTPase, GTase 및 N7998 MTase 이다.
"대나무 모자이크 바이러스 캡핑 효소"는 단일 단위 155-kDa 단백질(1365-아미노산; NCBI BMV 분리 BaMV-0)인 대나무 모자이크 바이러스(BMV) mRNA 캡핑 효소인 ORF1에 관한 것이다. 게놈 서열 NC_001642, 유전자 1497253, UniProtKB/Swiss-Prot Q65005). ORF1 단백질은 m7GpppNmRNA 캡핑, 즉 RTPase, GTase 및 N7-MTase를 생성하는 데 필요한 모든 효소 활성을 가지고 있다.
"아프리카 돼지열병 바이러스 캡핑 효소"(ASFV)는 단일 단위 100kDa 단백질(868개 아미노산; NCBI ASFV 게놈 서열 균주 BA71V)인 NP868R 캡핑 효소(G4R)에 관한 것이다. NC_001 659; Gene 1488865; UniProtKB/Swiss-Prot P32094), m7GpppN mRNA 캡핑, 즉 RTPase, GTase 및 N7-MTase를 생성하는 데 필요한 모든 효소 활성을 가지고 있다.
"가시메바 폴리파가 미미바이러스 캡핑 효소"는 또 다른 단일 단위 136.5kDa 단백질(1170개 아미노산; NCBI APMV 게놈 서열 NC_006450; Gene 3162607; Gene 3162607; UniProtKB/Swiss-Prot Q5UQX1 )인 R382(APMV)에 관한 것이다.
"유기 레이크 피코나바이러스 1(OLPV1) 캡핑 효소"는 NCBI 수탁 번호 ADX05869.1로 참조되는 889개의 단일 단위 아미노산을 지칭한다.
"유기 레이크 피코드나바이러스 2(OLPV2) 캡핑 효소"는 NCBI 등록 번호 ADX06468.1로 참조되는 942개의 단일 단위 아미노산을 의미한다.
"페오시스티스 글로보사 바이러스 캡핑 효소"는 UniProtKB/Swiss-Prot YP_008052553.1로 참조되는 1066개의 단일 단위 아미노산을 지칭한다.
"크리소크로무리나 에리시나 바이러스 캡핑 효소"는 UniProtKB/Swiss-Prot YP_009173557.1로 참조되는 965개의 단일 단위 아미노산을 지칭한다.
N7-구아닌 메틸트랜스퍼라제의 RNA 트리포스파타제, 구아닐릴트랜스퍼라제의 촉매 도메인은 pGKL2와 같은 세포질 에피솜의 캡핑 효소로부터 유래한다. 특히, RNA 트리포스파타제, 구아닐릴트랜스퍼라제, N7-구아닌 메틸트랜스퍼라제의 촉매 도메인은 클루이베로마이세스 락티스 pGKL2의 ORF3 유전자에 의해 코딩되는 효모 선형 염색체외 에피솜 pGKL2의 캡핑 효소의 전체 또는 일부에 포함된다. (NCBI Kluyveromyces lactis CB 2359 pGKL2 게놈 서열 NC_010187; UniProtKB/Swiss-Prot P05469) 및 이는 594개 아미노산 단백질(70.6 kDa 단백질)이다.
RNA 트리포스파타제의 상기 촉매 도메인, 구아닐릴트랜스퍼라제의 상기 촉매 도메인, N7-구아닌 메틸트랜스퍼라제의 촉매 도메인은 단량체, 즉 하나의 폴리펩티드에 포함된다. 예를 들어, 상기 단량체는 본 발명에 따른 단량체 캡핑 효소 또는 단량체 키메라 효소일 수 있다.
특히, RNA 트리포스파타제의 상기 촉매 도메인, 상기 구아닐릴트랜스퍼라제의 촉매 도메인, 및 N7-구아닌 메틸트랜스퍼라제의 상기 촉매 도메인은 단량체 캡핑 효소에 포함된다. 이 경우, 본 발명에 따른 키메라 효소는 RNA 트리포스파타제의 촉매 도메인, 구아닐릴트랜스퍼라제의 촉매 도메인, 및 N7-구아닌 메틸트랜스퍼라제의 촉매 도메인을 포함하는 단량체 캡핑 효소를 포함한다. 상기 모노머 캡핑 효소는 모노머 바이러스 캡핑 효소일 수 있으며, 특히 야생형 블루텅 바이러스 캡핑 효소, 야생형 대나무 모자이크 바이러스 캡핑 효소, 야생형 아프리카 돼지열병 바이러스 캡핑 효소, 야생형으로 이루어진 군에서 선택된다. 아칸타메바 폴리파가 미미바이러스 캡핑 효소, 야생형 OLPV1 캡핑 효소, 야생형 OLPV2 캡핑 효소, 야생형 파이오시스티스 글로보사 바이러스 캡핑 효소, 야생형 크리소크로물리나 에리시나 바이러스 캡핑 효소 및 m7GpppN 캡을 부가할 수 있는 이들의 돌연변이체 및 유도체 RNA 분자의 5'-말단에서, 보다 구체적으로 야생형 아프리카 돼지열병 바이러스 캡핑 효소 및 RNA 분자의 5'-말단에 m7GpppN 캡을 추가할 수 있는 이의 돌연변이체 및 유도체, 및 심지어 보다 구체적으로 야생형 아프리카돼지열병 바이러스 캡핑 효소이다.
본 발명에 따른 키메라 효소는 또한 본 발명의 키메라 효소의 적어도 하나의 촉매 도메인, 특히 캡핑 효소의 적어도 하나의 촉매 도메인, 보다 특히 적어도 RNA 트리포스파타제의 촉매 도메인, 구아닐릴트랜스퍼라제의 촉매 도메인, N7-구아닌 메틸트랜스퍼라제의 촉매 도메인, 바람직하게는 N7-구아닌 메틸트랜스퍼라제의 촉매 도메인으로 이루어진 군에서 선택된 하나의 촉매 도메인이다.
예를 들어, 본 발명의 키메라 효소의 하나 이상의 촉매 도메인의 활성을 향상시키는 상기 도메인은 백시니아 바이러스 D12L 유전자(게놈 서열 NC_006998.1; Gene3707515; UniProtKB/Swiss- Prot YP_232999.1 ), 고유 효소 활성은 없지만 백시니아 mRNA 캡핑 효소의 D1R 서브유닛의 RNA N7-구아닌 메틸트랜스퍼라제 활성을 크게 향상시킨다.
본 발명에 따른 키메라 효소는 cap-0, cap-1 및 cap-2 캡핑 효소 이외의 5'-말단 RNA 처리 효소의 하나 이상의 촉매 도메인을 추가로 포함한다.
"cap-0, cap-1 및 cap-2 캡핑 효소 이외의 5'-말단 RNA 처리 효소"는 cap-0, cap-1 및 cap-2 캡핑 효소 이외의 mRNA 서열의 궁극 또는 끝에서 두 번째 염기를 변형할 수 있는 효소에 관한 것이다. 0, cap-1 및 cap-2 캡핑 효소, N6-메틸-아데노신 전이효소 및 5' 말단에 2,2,7-트리메틸구아노신(TMG) 및 2,7-트리메틸구아노신(DMG) 캡 변형을 추가할 수 있는 효소 RNA 분자의 cap-0, cap-1, cap-2 변형 이외의 다른 캡핑 변형은 진핵생물 또는 바이러스 mRNA에서 특성화되었다. 예를 들어, 첫 번째 염기의 N6-메틸-아데노신 전이효소에 의한 m6A 메틸화는 세포의 mRNA 운명에 영향을 미치는 가역적 변형이다. sn RNA, 텔로머라제 RNA, 트랜스-스플라이싱된 선충류 mRNA 및 특정 바이러스 mRNA에 존재하는 2,2,7-트리메틸구아노신(TMG) 및 2,7-트리메틸구아노신(DMG) 캡 변형은 번역의 이점을 부여할 수 있다. TMG 및 DMG는 바이러스의 특수 효소(예: DNA mimivirus의 L320, UniProtKB/Swiss-Prot 수탁 번호 Q5UQR2, 원생동물(예: Giardia lamblia trimethylguanosine synthase(NCBI 수탁 번호 EAA4643)에 의해 수행된다. 하위 진핵생물(예: Schizosaccharomyces pombe trimethylguanosine synthase, UniProtKB/Swiss-Prot 수탁 번호 Q09814), 인간 트리메틸구아노신 합성효소 1 UniProtKB/Swiss-Prot 수탁 번호 Q96RS0이다.
키메라 효소는 본 발명은 폴리(A) 중합효소의 하나 이상의 촉매 도메인을 추가로 포함한다.
본 발명자는 캡핑 효소의 적어도 하나의 촉매 도메인, 단백질- RNA 테더링 시스템의 적어도 하나의 RNA-결합 도메인 및 폴리(A) 중합효소는 RNA 중합효소을 포함하는 단량체 또는 올리고머 키메라 효소는 폴리(A) 중합효소의 존재하에 캡핑 효소의 조합과 비교하여, RNA polymerase에 의해 제조되는 특정 mRNA의 캡핑 속도를 상승적으로 크게 증가시킬 수 있었다. 캡핑 효소와 폴리(A) 중합효소는 자연적으로 물리적으로 연결되어 있지 않고 특정 RNA 서열에 대한 결합 도메인을 포함하지 않기 때문에 이러한 결과는 예상치 못한 것이다. 당업자라면 성분이 동일하므로 동일한 발현율을 기대할 수 있을 것이다.
"폴리(A) 중합효소"는 ATP로부터 RNA 분자의 3' 말단으로의 아데노신 잔기의 주형이 아닌 부가를 촉매할 수 있는 임의의 효소에 관한 것이다.
폴리(A) 중합효소의 상기 촉매 도메인은 포유동물(예: PAPOLA, PAPOLG), 효모(예: Saccharomyces cerevisiae PAP1, Schizosaccharomyces pombe PLA1, 칸디다)를 포함하는 표준 폴리(A) 중합효소의 촉매 도메인이다. albicans PAP, Pneumocystis carinii PAP), 원생동물, 바이러스 및 세균 표준 폴리(A) 중합효소이다.
특히 폴리(A) 중합효소의 상기 촉매 도메인은 세포질 표준 폴리(A) 중합효소이며, 보다 구체적으로 하기로 이루어진 군에서 선택된다.
적어도 부분적으로 세포질 효소인 PAPOLB(인간 및 마우스 PAPOLB, UniProtKB/Swiss-Prot 수탁 번호 Q9NRJ5 및 Q9WVP6)를 포함하는 포유동물 세포질 폴리(A) 중합효소; PAPOLA의 돌연변이체(인간 및 마우스 PAPOLA, UniProtKB/Swiss-Prot 수탁 번호 P51003 및 Q61 183 각각), 여기서 핵 국재화 신호의 돌연변이 또는 결실은 핵 효소를 세포질로 재배치할 수 있으며, PAPOLG의 돌연변이체(각각 인간 및 마우스 PAPOLG, UniProtKB/Swiss-Prot 수탁 번호 Q9BWT3 및 Q6PCL9)에서 핵 국재화 신호의 돌연변이 또는 결실은 핵 효소를 세포질로 재배치할 가능성이 있다,
효모 또는 원생동물 폴리(A) 중합효소(예. Saccharomyces cerevisiae PAP1의 돌연변이, UniProtKB/Swiss-Prot 수탁 번호 P29468; Schizosaccharomyces pombe PLA1, UniProtKB/Swiss-Prot 수탁 번호 Q10295), Candida albicans PAP(UniProtKB/Swiss-Prot 수탁 번호 Q9UW26), Pneumocystis carinii PAP(Pneumocystis jiroveci로도 명명됨, Z0A2 수탁 번호 A2Prot0/Sw 돌연변이; 핵 국소화 신호의 결실은 핵 효소를 세포질로 재배치할 가능성이 높음), 뿐만 아니라 다른 호냉성, 중온성, 호열성 또는 고온성 효모 또는 원생동물 균주 바이러스성 폴리(A) 중합효소, VP55 촉매 서브유닛(UniProtKB/Swiss-Prot 수탁 번호 균주 Western Reserve P23371) 및 공정성 인자(UniProtKB/Swiss-Prot 수탁 번호 균주 Western Reserve P07617)로 작용하는 VP39로 구성된 이종이량체 백시니아 바이러스 폴리(A) 중합효소 포함), 기타 수두-바이러스 폴리(A) 중합효소(예: Cowpox 바이러스, Monkeypox 바이러스 또는 Camelpox 바이러스), 아프리카 돼지 열병 바이러스(C475L), UniProtKB/Swiss-Prot 수탁 번호 A0A0A1 E081), Acanthamoeba polyphaga mimivirus R341(UniProtKB/Swiss-Prot 수탁 번호 E3VZZ8) 및 Megavirus chilensis Mg561 폴리(A) 중합효소(NCBI 수탁 번호: A2EXum602)(NCBI 수탁 번호: YP_602), Mamavirus(NCBI 수탁 번호 AEQ60527), Cafeteria roenbergensis BV-PW1 바이러스(NCBI 수탁 번호 YP_003969918), Megavirus Iba(NCBI 수탁 번호 AGD92490), Yellowstone Lake mimivirus(NCBI 수탁 번호 YP_012917), YP_009173345), 유기 레이크 피코드나바이러스 1(NCBI 수탁 번호 ADX05881), 유기 레이크 피코드나바이러스 2(NCBI 수탁 번호 ADX06298), 파우스토바이러스(NCBI 수탁 번호 AMN83802)는 ATP로부터 RNA 분자의 3' 말단으로의 아데노신 잔기의 주형화되지 않은 부가를 촉매할 수 있는 돌연변이체 또는 이의 유도체이다.
또한, 폴리(A) 중합효소의 상기 촉매 도메인은 비표준 폴리(A) 중합효소의 촉매 도메인, 특히 세포질 비표준 폴리(A) 중합효소의 촉매 도메인, "비표준 폴리(A) 중합효소"는 N-말단 뉴클레오티딜트랜스퍼라제(NT) 촉매 도메인, 중앙 도메인 및 RNA 결합 도메인(RBD)에 해당하는 C-말단 도메인을 포함하는 삼중 구조를 갖지 않는 효소를 의미한다. 비정규 폴리(A) 중합효소가 포유류에 존재한다.
폴리(A) 중합효소의 상기 촉매 도메인은 특히 야생형 사카로마이세스 세레비지애 PAP1 폴리(A) 중합효소로 이루어진 군에서 선택된 효모 또는 원생동물 폴리(A) 중합효소의 촉매 도메인이다. pombe PLA1, 칸디다 알비칸스 PAP(UniProtKB/Swiss-Prot 수탁 번호 Q9UW26), Pneumocystis carinii PAP(UniProtKB/Swiss-Prot 수탁 번호 A0A0W4ZDF2), Saccharomyces omboscerevisiae의 세포질 돌연변이체 중합효소(여기서 핵 국소화 신호는 비-기능적이거나 결실됨) 및 돌연변이체 또는 이의 유도체, 이는 ATP로부터 RNA 분자의 3' 말단으로의 아데노신 잔기의 주형화되지 않은 부가를 촉매할 수 있다.
효모 또는 원생동물 폴리(A) 중합효소는 포유동물의 표준 폴리(A) 중합효소에 비해 분자량이 감소한다는 이점이 있다. "PAP1 폴리(A) 중합효소"는 Saccharomyces cerevisiae PAP1 폴리(A) 중합효소(UniProtKB/Swiss-Prot 수탁 번호 P29468)를 의미한다. "PLA1 폴리(A) 중합효소"는 Schizosaccharomyces pombe PLA1 폴리( A) 중합효소, UniProtKB/Swiss-Prot 수탁 번호 Q10295를 포함한다.
폴리(A) 중합효소의 상기 촉매 도메인은 바이러스 폴리(A) 중합효소의 촉매 도메인, 특히 야생형 VP55 폴리(A) 중합효소로 구성된 군에서 선택되는 야생형 C475L 폴리(A) 중합효소, 야생형 R341 폴리(A) 중합효소 및 야생형 MG561 폴리(A) 중합효소 및 이들의 돌연변이체 또는 유도체, ATP로부터 RNA 분자의 3' 말단으로의 아데노신 잔기의 비주형 첨가를 촉매할 수 있다.
바이러스 폴리(A) 중합효소는 포유동물의 폴리(A) 중합효소에 비해 분자량이 감소하고, 포유동물 세포에서 발현될 때 강력한 효소 활성 및 세포질 구획에 존재한다는 장점이 있다. 또한, R341 및 MG561 폴리(A) 중합효소와 같은 이러한 효소 중 일부는 알려진 보조 단백질 보조인자를 필요로 하지 않는다.
"VP55 폴리(A) 중합효소"는 이종이량체성 백시니아 바이러스 폴리(A) 중합효소의 촉매 서브유닛(UniProtKB/Swiss-Prot 수탁 번호 균주 웨스턴 리저브 P23371)에 관한 것이다. 두 번째 소단위인 VP39는 가공성 인자로 작용한다(UniProtKB/Swiss-Prot 수탁 번호 균주 Western Reserve P07617)이다.
"C475L 폴리(A) 중합효소"는 아프리카 돼지 열병 바이러스 폴리(A) 중합효소(UniProtKB/Swiss-Prot 수탁 번호 A0A0A1 E081)에 관한 것이다.
"R341 폴리(A) 중합효소"는 가시아메바 폴리파가 미미바이러스 R341 폴리(A) 중합효소(UniProtKB/Swiss-Prot 수탁 번호 E3VZZ8)에 관한 것이다.
"MG561 폴리(A) 중합효소"는 메가바이러스 칠렌시스 MG561 폴리(A) 중합효소(NCBI 수탁 번호: YP_004894612)에 관한 것이다.
4. 슈도우리딘 합성효소(pseudouridine synthases)
Pseudouridine(슈도우리딘)은 세포 RNA 에서 가장 풍부한 RNA 변형이며, 전사 및 합성 후 RNA는 100가지 이상의 화학적으로 구별되는 변형으로 변형될 수 있다. 이들은 4개의 표준 뉴클레오티드 외에도 전사 후 RNA 발현을 잠재적으로 조절할 수 있으며 RNA의 번역, 국소화 및 안정화를 포함하여 세포에서 다양한 역할을 수행한다. 그 중 하나인 슈도우리딘은 리보스당의 C1 과 우라실의 C5 사이에 CC 결합을 포함하는 우리딘의 C5- 글리코시드 이성질체이다. 오히려 우리딘에서 발견되는 일반적인 C1-N1 결합과 CC 결합은 더 많은 회전 자유도와 구조적 유연성을 제공한다. 또한, pseudouridine는 N1 위치에서 추가의 수소 결합 공여체이다. 세포에서 전사 후 슈도우리딘 형성은 슈도우리딘 합성효소(pseudouridine synthases)에 의해 이루어지고 관련 효소군은 크게 2종류로 분류된다.
가장 잘 알려진 분류군은 표적 선택을 위해 변형될 서열과 단백질(효모의 Cbf5, 인간의 디스케린)에 상보적인 가이드 RNA를 사용하는 H/ACA sRNP(작은 리보핵단백질)라고 하는 가이드 RNA 의존성 효소이다. H/ACA sRNP는 진핵생물과 고세균에서 발견되지만 원핵생물에서는 발견되지 않으며 많은 우리딘을 변형시키며, 모두 다수의 가이드 RNA에 의해 효소가 구성된다. 효모 리보솜에서 발견되는 슈도우리딘은 모두 핵소체에서 발견되는 H/ACA sRNP에 의해 변형되므로 작은 핵소체 RNP(snoRNP)라고 한다. 또한 H/ACA sRNP는 U2 sn RNA 및 mRNA의 변형에 관여하지만 pre-rRNA의 처리 및 포유류 텔로머라제 RNA 구성요소(TERC)의 안정화와 같은 다른 세포 과정에서도 역할을 한다.
슈도우리딘 형성을 하는 다른 분류군은 독립형 효소를 통해 작용하는 가이드 독립적인 메커니즘로 진핵세포에서, 이들 효소는 Pus (Pseudo Uridine Synthases) 효소이며, 서열 및/또는 상기 타겟을 함유하는 RNA 이차 구조 요소를 인식하여 수정한다. 이들 효소균은 박테리아를 기준으로 슈도우리딘 합성효소를 6개의 패밀리(TruA, TruB, TruD, RsuA, RluA 및 Pus10)로 분류한다. 그러나 RsuA형 슈도우리딘 합성효소는 지금까지 박테리아에서만 발견되었고 Pus10 효소는 소수의 고세균 및 진핵생물에만 존재한다.
중요하게도, Cbf5를 포함한 모든 슈도우리딘 합성효소는 보존된 촉매 도메인과 엄격하게 보존된 촉매 아스파르테이트 잔기를 기반으로 하는 보존된 촉매 메커니즘을 공유한다. 슈도우리딘 합성효소 사이의 서열 다양화에도 불구하고, 보존된 구조는 이러한 모든 효소에 대한 공통의 진화적 기원임을 의미한다. 일반적으로 슈도우리딜화는 NC 글리코시드 결합의 절단, 우라실 고리의 회전 및 촉매 작용을 위한 ATP의 요구 없이 리보스 당에 대한 재부착을 포함한다. 슈도우리딘 합성효소의 촉매 메커니즘은 촉매적 아스파르테이트 잔기에 의한 리보스 당의 탈양성자화를 통해 발생하여 염기 및 글리칼 중간체의 분리를 일으킨다.
원핵생물 및 고세균 슈도우리딘 합성효소에 대해 많은 구조가 연구된 반면, 진핵생물 Pus 효소의 현재까지 연구된 구조는 인간 Pus1 및 인간 Pus10의 촉매 도메인 구조이다. Pus1과 Pus10은 나선과 고리가 측면에 있는 중앙 역평행 β 시트와 함께 원핵생물 효소에서 발견되는 보존된 촉매 도메인과 유사한 접힘이 있다.
진핵생물에는 Pus1에서 Pus10이라고 하는 10가지 다른 유형의 Pus 효소가 있으며 일부 유기체에는 주어진 Pus 효소의 여러 유사체가 있다. S. cerevisiae에는 9 종류의 Pus가 있으며 각 Pus 효소는 세포에서 몇 가지 특정 또는 때로는 다중 표적 우리딘이 있으며 핵, 세포질 또는 미토콘드리아에서 슈도우리딜화할 수 있다. 세포질 및 미토콘드리아 tRNA에 있는 슈도우리딘 외에도, Pus 효소는 또한 여러 개의 작은 핵 RNA(sn RNA)와 미토콘드리아 r RNA를 수정한다. 효모에서 발견되지 않는 Pus10 효소는 고세균에서만 연구되었으며 tRNA에서 슈도우리딘의 형성을 담당한다. 특히, 진핵생물 tRNA의 슈도우리딘는 (또한) Pus4에 의해 생성한다.
먼저, 진핵생물 독립형 슈도우리딘 합성효소는 E. coli pseudouridine synthase의 4개의 패밀리에 속한다. 효모에서, 구성원 Pus1, Pus2 및 Pus3을 포함하는 TruA 패밀리는 tRNA의 수많은 부위뿐만 아니라 snRNA 및 mRNA의 일부 위치에서의 변형을 담당한다. 고도로 보존된 tRNA의 U55는 TruB 계열의 유일한 구성원인 Pus4에 의해 변형되며, 이 또한 mRNA를 변형한다. RluA 효소 패밀리는 tRNA, 미토콘드리아 21S rRNA 및 mRNA에서 우리딘을 슈도우리딜화하는 Pus5, Pus6, Pus8 및 Pus9를 포함하여 가장 큰 그룹이다. RluA 효소는 때때로 리보솜 구성 단백질인 S4와 유사한 N-말단 도메인을 포함한다. Pus7은 TruD 계열의 유일한 구성원이며 tRNA, rRNA 및 snRNA의 부위를 수정한다.
5. DdRp와 캡핑효소를 포함하는 키메라효소
본 발명은 특히 무세포유래 세포에서의 관심 RNA의 전사시스템 분야에 관한 것이다. 상기 목표를 달성하기 위한 본 발명의 하나로, 세포내 적어도 하나의 단백질 번역하고 전사가 가능한 구성성분을 포함하는 시스템으로 RNA 중합효소 발현단위 및 관심 RNA 발현단위를 포함한다.
상기 RNA 중합효소 발현단위는 (i) 무세포유래 세포에서 작동하는 프로모터; (ii) 세포내 번역을 가능하게 하는 구조; (iii) RNA 중합효소[DNA dependent RNA Polymerase(DdRp) 및/또는 캡핑효소를 포함하는 키메라 효소 또는 RNA dependent RNA Polymerase(RdRp)]포함하는 오픈 리딩 프레임(open reading frame, ORF); (iv) 전사 종결서열;을 포함하는 DNA 단위를 포함하며, 여기서, 추가적으로 (i) 무세포유래 세포에서 작동하는 프로모터; (ii) 상기 RdRp에 의해 복제되고 RNAi를 포함하는 레플리콘 RNA를 코딩하는 DNA를 포함하는 DNA 단위; 및 (iii) 전사종결서열를 포함하는 단위를 더 포함할 수도 있다.
바람직하게, 상기 DdRp는 캡핑 효소, Pus 또는 Poly(A) 중합효소와 키메라 효소일 수도 있다.
본 발명의 키메라 DdRp를 코딩하는 DNA 절편은 NP868R-T7 RNAP의 ORF로 NP868R, 아프리카 돼지열 바이러스의 mRNA 캡핑 효소, 및 박테리오파지 T7의 야생형 파지 DdRp 사이의 융합을 코딩하는 DNA 절편을 하나의 플라스미드를 삽입하였다. 당해 캡핑 효소는 (Gly3Ser)4 링커에 의해 T7 RNA 폴리머라제의 아미노 말단에 융합하였다.
"아프리카 돼지열 바이러스 캡핑 효소"는 NP868R 캡핑 효소(G4R), (ASFV)에 관한 것이며, 이는 단일-단위 100 kDa 단백질이다(868 아미노산; NCBI ASFV 게놈 서열 균주 BA71V ID# NC_001659; GeneID# 1488865;UniProtKB/Swiss-Prot ID# P32094).
6. 링커
본 발명에 따른 키메라효소는 적어도 상기 촉매 도메인을 포함하지만, 상기 촉매 도메인을 함유하는 효소의 전체 또는 일부를 추가로 포함할 수 있다.
실제로, 본 발명에 따른 키메라 효소에 따르면, DNA-의존성 RNA 중합효소의 상기 촉매 도메인은 또한 DNA-의존성 RNA 중합효소, 바람직하게는 단량체성 DNA-의존성 RNA 중합효소의 전체 또는 일부에 포함될 수 있다.
캡핑 효소, 바람직하게는 단량체성 캡핑 효소, RNA 트리포스파타제의 상기 촉매 도메인, 구아닐릴트랜스퍼라제의 상기 촉매 도메인 및 N7-구아닌 메틸트랜스퍼라제의 상기 촉매 도메인은 전체 또는 일부에 포함될 수 있다.
본 발명에 사용된 용어 ≪연결≫ 및 ≪결합된≫은 공유 및 비공유 연결을 포함한다.
상기 RNA-결합 도메인은 특히 하기로 이루어진 군에서 선택된 본 발명에 따른 키메라 효소의 하나의 촉매 도메인에 공유 (연결 펩티드에 의해 직접 또는 간접적으로) 연결에 의해 연결될 수 있다.
캡핑 효소의 촉매 도메인, 특히 RNA 트리포스파타제의 촉매 도메인, 구아닐릴트랜스퍼라제의 촉매 도메인, N7-구아닌 메틸트랜스퍼라제의 촉매 도메인; 폴리(A) 중합효소의 상기 촉매 도메인, 본 발명의 키메라 효소의 하나 이상의 촉매 도메인, 바람직하게는 RNA 트리포스파타제의 촉매 도메인, 구아닐릴트랜스퍼라제의 촉매 도메인으로 이루어진 군에서 선택된 하나 이상의 촉매 도메인의 활성을 향상시키는 상기 도메인, N7-구아닌 메틸트랜스퍼라제의 촉매 도메인, 특히 N7-구아닌 메틸트랜스퍼라제의 촉매 도메인; 그리고 cap-0, cap-1 및 cap-2 캡핑 효소 이외의 5' 말단 RNA 처리 효소의 상기 촉매 도메인일 수 있다.
연결 펩타이드는 입체 장애를 최소화하고 융합 단백질의 성분이 본래의 형태를 유지하기에 충분한 공간이 제공되는 융합 단백질을 생성하는 이점이 있다.
본 발명의 상기 연결 펩티드는 하기로 이루어진 군으로부터 선택될 수 있다:
화학식 (GlymSerP)n의 펩티드, 여기서: m은 0 내지 12, 특히 1 내지 8, 더욱 특히 3 내지 6, 더욱 더 특히 4의 정수를 나타내고; p는 0 내지 6, 특히 0 내지 5, 보다 특히 0 내지 3, 더욱 특히 1의 정수를 나타내고; 그리고 n은 0 내지 30, 특히 0 내지 12, 보다 특히 0 내지 8, 더욱 더 특히 1 내지 6(포함)의 정수를 나타내고; 특히 화학식 (GlymSerP)n의 펩티드, 여기서: m은 4를 나타내고; p는 0 또는 1을 나타내고; 그리고 n은 1, 2 또는 4를 나타내고; 보다 특히 화학식 Gly4, (Gly4Ser)1(Gly4Ser)2 및 (Gly4Ser)4의 펩티드일 수 있다.
화학식 (GlymSerP)n의 유연한 링커 펩티드는 글리신 잔기가 펩티드 유연성을 제공하는 반면, 세린은 약간의 용해도를 제공한다는 이점이 있다. 또한, (GlymSerP)n 링커 서열에서 키모트립신 I, 인자 Xa, 파파인, 플라스민, 트롬빈 및 트립신에 대한 민감한 부위의 부재는 생성된 융합 단백질의 전체 안정성을 증가시키는 것으로 추정된다.
가변 길이인 (GlymSerP)n 링커는 단일 사슬 Fv 단편(sFv) 항체를 조작하는 데 일반적으로 사용된다. 또한, (GlymSerP)n 링커는 각 구성 요소의 생물학적 활성을 자주 유지하는 다양한 융합 단백질을 생성하는 데 사용되었다.
단백질- RNA 테더링 시스템의 상기 RNA-결합 도메인 및 상기 촉매 도메인은 또한 류신 지퍼와 같은 특정 단백질 요소에 의해 조립될 수 있다. 상기 RNA-결합 도메인의 C-말단 또는 N-말단은 본 발명의 키메라 효소의 상기 촉매 도메인 중 하나의 N-말단 또는 C-말단에 각각 연결될 수 있다.
상기 RNA 결합 도메인의 C-말단은 공유 결합(바람직하게는 화학식 Gly4, (Gly4Ser)i(Gly4Ser)2 또는 (Gly4Ser)4, 훨씬 더 바람직하게는 화학식 (Gly4Ser)i 또는 Gly4)의 연결 펩티드에 의해 직접적으로 또는 간접적으로 연결된다)에 의해 다음으로 구성된 군에서 선택된 촉매 도메인 중 하나의 N-말단에 연결이다. 캡핑 효소의 촉매 도메인, 특히 RNA 트리포스파타제의 촉매 도메인, 구아닐릴트랜스퍼라제의 촉매 도메인, N7-구아닌 메틸트랜스퍼라제의 촉매 도메인; 폴리(A) 중합효소의 상기 촉매 도메인일 수 있다.
본 발명의 키메라 효소의 하나 이상의 촉매 도메인, 바람직하게는 RNA 트리포스파타제의 촉매 도메인, 구아닐릴트랜스퍼라제의 촉매 도메인으로 이루어진 군에서 선택된 하나 이상의 촉매 도메인의 활성을 향상시키는 상기 도메인, N7-구아닌 메틸트랜스퍼라제의 촉매 도메인, 특히 N7-구아닌 메틸트랜스퍼라제의 촉매 도메인; 그리고 cap-0, cap-1 및 cap-2 캡핑 효소 이외의 5' 말단 RNA 처리 효소의 상기 촉매 도메인일 수 있다.
상기 RNA 결합 도메인의 C-말단은 공유결합(바람직하게는 화학식 Gly4, (Gly4Ser)i(Gly4Ser)2 또는 (Gly4Ser)4, 훨씬 더 바람직하게는 화학식 (Gly4Ser)i 또는 Gly4) 의 연결 펩티드에 의해 직접적으로 또는 간접적으로 연결된다)에 의한 다음으로 구성된 군에서 선택된 촉매 도메인 중 하나의 N-말단에 연결된다.
캡핑 효소의 촉매 도메인, 특히 RNA 트리포스파타제의 촉매 도메인, 구아닐릴트랜스퍼라제의 촉매 도메인, N7-구아닌 메틸트랜스퍼라제의 촉매 도메인; 그리고 폴리(A) 중합효소의 상기 촉매 도메인일 수 있다.
본 발명의 키메라 효소는 융합 단백질이다. "융합 단백질"은 원래 별개의 단백질을 코딩하는 2개 이상의 단백질 또는 단백질 도메인의 결합을 통해 생성된 인공 단백질에 관한 것이다. 이 융합 유전자의 번역은 각각의 원래 단백질에서 파생된 기능적 특성을 가진 단일 또는 다중 폴리펩티드를 생성한다.
본 발명에 따른 키메라 효소에서, 연결 펩티드[특히 화학식 Glv4, (Gly4Ser)i, (Gly4Ser)2 또는 (Gly4Ser)4, 보다 구체적으로 화학식 (Gly4Ser)2의 연결 펩티드]에 의해 특히, 2개 이상, 특히 3개 이상, 더욱 특히 전체 촉매 도메인은 직접 또는 간접적으로 조립, 융합 또는 결합될 수 있다. 특히, 2개 이상, 특히 3개 이상, 더욱 특히는 하기로 이루어진 군에서 선택된 전체 촉매 도메인일 수 있는데, 캡핑 효소의 촉매 도메인, 특히 RNA 트리포스파타제의 촉매 도메인, 구아닐릴트랜스퍼라제의 촉매 도메인 및 N7-구아닌 메틸트랜스퍼라제의 촉매 도메인으로 이루어진 군에서 선택되는 DNA-의존성 RNA 중합효소의 촉매 도메인, 및 폴리(A) 중합효소의 촉매 도메인일 수 있다.
특히 구성은 RNA 트리포스파타제의 촉매 도메인, 구아닐릴트랜스퍼라제의 촉매 도메인, N7-구아닌 메틸트랜스퍼라제의 촉매 도메인, 및 DNA 의존성 RNA 중합효소의 촉매 도메인;는 특히 화학식 Gly4, (Gly4Ser)i, (Gly4Ser)2 및 (Gly4Ser)4, 보다 특히 화학식 (Gly Ser)2의 연결 펩티드로 이루어진 군에서 선택되는 연결 펩티드에 의해 직접 또는 직접 결합된다.
DdRp의 적어도 상기 촉매 도메인은 연결 펩티드(식 Gly4, (Gly4Ser)i, (Gly4Ser)2 및 (Gly4Ser)4의 연결 펩티드로 이루어진 군에서 특히 선택됨)에 의해 결합된다. 특히 화학식 (Gly4Ser)2)의 캡핑 효소의 촉매 도메인 중 적어도 하나는 하기로 이루어진 군에서 특히 선택된 하나 이상일 수 있다.
본 발명에 따른 키메라 효소에서, 상기 촉매 도메인 중 적어도 2개는 비-공유 결합, 특히 류신 지퍼에 의해 조립될 수 있다.
바람직하게는, DdRp 또는 폴리(A) 중합효소의 적어도 상기 촉매 도메인은 비공유 결합, 특히 류신 지퍼에 의해 조립되며, 캡핑 효소의 촉매 도메인 중 하나 이상에, 바람직하게는 다음으로 구성된 군에서 선택된 촉매 도메인 중 하나 이상일 수 있는데, RNA 트리포스파타제의 상기 촉매 도메인; 구아닐릴트랜스퍼라제의 상기 촉매 도메인; 그리고 N7-구아닌 메틸트랜스퍼라제의 상기 촉매 도메인일 수 있다.
폴리(A) 중합효소의 적어도 상기 촉매 도메인은 비공유 결합에 의해, 특히 바람직하게는 그의 C-말단 말단에서 류신 지퍼에 의해 캡핑 효소의 촉매 도메인 중 적어도 하나에 조립되며, 특히 하기로 이루어진 군에서 선택된 촉매 도메인 중 적어도 하나일 수 있는데, RNA 트리포스파타제의 상기 촉매 도메인; 구아닐릴트랜스퍼라제의 상기 촉매 도메인; 그리고 N7-구아닌 메틸트랜스퍼라제의 상기 촉매 도메인; 및 보다 구체적으로 RNA 트리포스파타제의 상기 촉매 도메인에 대한 것이다.
서로 상호작용하는 두 개의 양친매성 α-나선으로 구성된 이량체 코일 단백질 구조인 류신 지퍼는 단백질을 동종이량체 또는 이종이량체화하는 데 일반적으로 사용된다. 각 나선은 7개 아미노산의 반복으로 구성되며 첫 번째 아미노산(잔기 a)은 소수성, 네 번째(잔기 d)는 일반적으로 류신이고 다른 잔기는 극성이다.
평행 이종이량체 2가닥 코일 구조를 형성하는 류신 지퍼 VELCRO ACID-p1 및 BASE-p1은 평행 단백질 이종이량체를 형성하는 경향이 높다. 이들은 막 단백질과 여러 가용성 단백질을 이종이량체화하는 데 사용되었다.
다른 유형의 올리고머화 펩티드 도메인은 또한 본 발명에 따른 키메라 효소, 특히 ACID-a1 /BASE-a1, ACID-Kg/BASE- Eg, NZ/CZ, ACID-pLL/BASE-pLL, 및 EE1234L 및 RR1234L와 같은 역평행 이종체 구조를 형성하는 류신 지퍼의 상기 촉매 도메인 중 적어도 2개를 조립하기 위해 본 발명에 따른 키메라 효소를 생성하는 것으로 간주될 수 있다. 류신 지퍼의 이황화 결합 버전은 또한 본 발명에 따른 이황화 코일형 코일 결합 이형이량체 키메라 효소 및 산화 조건 하에 시스테인 잔기 사이의 사슬간 이황화 가교를 생성하는 데 사용할 수 있다.
따라서, 폴리(A) 중합효소, 캡핑 효소(특히 RNA 트리포스파타제, 구아닐릴트랜스퍼라제, N7-구아닌 메틸트랜스퍼라제) 및 DNA-의존성 RNA 중합효소의 촉매 도메인 중 적어도 2개는 다음과 같을 수 있다. 류신 지퍼, 특히 ACID-a1 /BASE-a1, ACID-Kg/BASE-Eg, NZ와 같은 역평행 이종 구조를 형성하는 류신 지퍼로 조립 /CZ, ACID-pLL/BASE-pLL 류신 지퍼, 이황화 코일 코일 결합, 시스테인 잔기 사이의 이황화 다리이다.
바이러스 캡핑 효소에 융합된, 야생형 T7, T3, SP6, K1-5, K1 E의 아미노 말단 말단에 융합되고, 상기 RNA 중합효소 또는 이의 돌연변이체 또는 유도체 R551 SK1 E RNA 중합효소 돌연변이체를 포함하는 5' - 3' 방향의 이중 가닥 주형 DNA에 서열 상보적인 단일 가닥 RNA를 합성할 수 있고, 특히 링커를 통해, 바람직하게는 화학식 Glv4, (Gly4Ser)i, (Gly4Ser)2및 (Gly4Ser)4, 보다 바람직하게는 화학식 Gly4, (Gly4Ser)i 또는 (Gly4Ser)2의 연결 펩티드로 이루어진 군에서 선택된다.
특히 링커를 통해, 바람직하게는 화학식 Glv4의 연결 펩티드로 이루어진 군에서 선택되는 (Gly4Ser)i, (Gly4Ser)2 및 (Gly4Ser)4, 보다 바람직하게는 화학식 Gly4 또는 (Gly4Ser)2)이다.
7. 단백질- RNA 테더링 시스템
"단백질- RNA 테더링 시스템"은 단백질(또는 펩타이드)이 그의 RNA-결합 도메인을 통해 특정 RNA로 이루어진 특정 RNA 요소를 인식하고 특이적으로 (높은 친화도로) 결합하는 시스템을 지칭한다. 따라서 단백질(또는 펩타이드)은 특정 서열 및/또는 구조를 갖는 RNA 요소와 결합하는 것을 가능하게 할 수 있다. RNA 결합 도메인을 통한 단백질(또는 펩타이드)과 특정 RNA 요소 사이의 특이적 결합은 단백질(또는 펩타이드)과 특정 RNA 요소가 높은 친화도로 상호작용함을 의미한다. 고친화도와의 상호작용은 약 106M 이상, 특히 적어도 107M, 적어도 108M, 적어도 109M, 보다 특히 적어도 1010M의 친화도와의 상호작용을 포함한다. RNA-결합 도메인이 특이적으로 결합하는지 여부 특정 RNA 요소에 대한 높은 친화도를 갖는 것은 특히 상기 RNA 결합 도메인과 특정 RNA 요소의 반응을 상기 RNA 결합 도메인과 특정 RNA 요소 이외의 RNA와의 반응을 비교함으로써 용이하게 테스트할 수 있다.
RNA-단백질 친화도는 잘 알려진 다양한 방법에 의해 결정될 수 있다. 이러한 방법에는 정상 상태 형광 또는 전기영동 측정, RNA 전기영동 이동성 이동 분석이 포함되지만 이에 국한되지는 않는다.
"단백질- RNA 테더링 시스템의 RNA-결합 도메인"은 특히 그의 3차원 구조에서 인식을 보장하기 위해 필요하고 충분한 단백질(또는 펩티드)의 도메인을 지칭한다. 및 특정 RNA 서열 및/또는 구조로 구성된 특정 RNA 요소와 높은 친화도를 갖는 상호작용, 따라서 상기 RNA 결합 도메인을 통해 이 RNA 요소와 이 단백질(또는 펩티드)을 결합하는 것을 가능하게 한다. 따라서, 상기 " RNA-결합 도메인"(RNA-테더링 도메인)은 서열 및/또는 구조 특이성으로 RNA에 결합한다. 즉, 특정 RNA 서열 및/또는 구조로 구성된 RNA 요소에 특이적으로 결합한다. "단백질- RNA 테더링 시스템의 RNA-결합 도메인"이라는 용어는 야생형 또는 돌연변이 단백질(또는 펩타이드)의 RNA-결합 도메인을 포함한다.
본 발명에 따른 키메라 효소는 적어도 상기 RNA-결합 도메인을 포함하지만, 상기 RNA-결합 도메인을 함유하는 단백질(또는 펩티드)의 전체 또는 일부를 추가로 포함할 수 있다. 실제로, 본 발명에 따른 키메라 효소에 따르면, 단백질- RNA 테더링 시스템의 상기 RNA-결합 도메인은 단백질- RNA 테더링의 단백질(또는 펩타이드)시스템의 전체 또는 일부에 포함될 수 있다.
일부 특성화된 단백질- RNA 테더링 시스템에는 MS2 코트 단백질- RNA 테더링 시스템, R17 코트 단백질- RNA 테더링 시스템 및 람도이드 N 항종결 단백질- RNA 테더링 시스템과 같은 박테리오파지 단백질- RNA 테더링 시스템이 포함된다. MS2 외피 단백질과 R17 외피 단백질은 줄기 루프 RNA 구조로 구성된 특정 RNA 요소를 인식하고 높은 친화력으로 상호 작용한다. lambdoid N 항종결 단백질- RNA 테더링 시스템은 boxBL 및 boxBR 줄기 루프 RNA 구조로 구성된 특정 RNA 요소와 높은 친화도를 인식하고 상호 작용한다. 박테리오파지는 지금까지 lambdoid 계열(즉, λ, P22, Φ21, HK97 및 933W 바이러스) 또는 MS2 관련 계열(즉, MS2 및 R17)에 속하는 특성을 나타낸다.
본 발명에 따른 키메라 효소에서, 상기 RNA-결합 도메인은 박테리오파지 단백질- RNA 테더링 시스템의 박테리오파지 RNA-결합 도메인이며, 특히 MS2 코트 단백질- RNA 테더링 시스템으로 이루어진 군에서 선택된다.
R17 외피 단백질- RNA 테더링 시스템 및 람다이드 N 항종결 단백질- RNA 테더링 시스템, 보다 구체적으로 람다 N 항종결 단백질- RNA 테더링 시스템, phi21 N 항종결 단백질- RNA 테더링 시스템, HK97 N 항종결 단백질- RNA 테더링 시스템 및 p22 N 항종결 단백질- RNA 테더링 시스템, 더욱 특히 람다 N 항종결 단백질- RNA 테더링 시스템 등이다.
특히, 본 발명의 키메라 효소가 박테리오파지 DNA-의존성 중합효소(상기 키메라 효소에 포함되거나 포함되지 않음)에 의해 합성된 RNA 분자에 5'-말단 캡을 부가하기 위해 사용되는 경우, 상기 RNA-결합 도메인은 박테리오파지 RNA로 박테리오파지 단백질- RNA 테더링 시스템의 결합 도메인이다.
사실, 예기치 않게, 본 발명자는 캡핑 효소의 촉매 도메인 및 박테리오파지 단백질- RNA 테더링 시스템의 박테리오파지 RNA-결합 도메인을 포함하는 세포질 단량체 또는 올리고머 키메라 효소가 생산된 특정 mRNA의 캡핑 속도를 크게 증가시킬 수 있음을 입증하였다. 미국 특허 5,866,680에 기술된 U1- RNA 70K 시스템을 포함하는 단백질- RNA 테더링 시스템의 다른 RNA-결합 도메인과 비교하여 박테리오파지 DNA-의존성 RNA 중합효소에 의해 수행되었다.
특히, 상기 RNA 결합 도메인은 야생형 MS2 외피 단백질(NCBI 수탁 번호 NC_001417.2, UniProtKB/Swiss-Prot P03612), 유형 R17 외피 단백질(NCBI 수탁 번호 EF108465.1, UniProtKB/Swiss-Prot P69170) 및 특정 RNA 요소, 보다 구체적으로 높은 친화도를 인식하고 상호작용할 수 있는 야생형 람다이드 N 항종결 단백질 및 이의 돌연변이체 및 유도체 야생형 람다 N 항종결 단백질(NCBI 수탁 번호 NC_001416.1, 완전한 게놈 서열; UniProtKB/Swiss-Prot 수탁 번호 P03045), 야생형 phi21 N 항종결 단백질( NCBI 수탁 번호 AH007390.1, 부분 게놈 서열, UniProtKB/Swiss-Prot 수탁 번호 P07243), 야생형 HK97 N 항종결 단백질- RNA 테더링 시스템( NCBI 수탁 번호 NC_002167.1, 완전한 게놈 서열; NCBI 단백질 수탁 번호 NP_037732.1) 및 야생형 p22 N 항종결 단백질(특히 NCBI 서열(NCBI 수탁 번호 NC_002371.2, 완전한 게놈 서열; UniProtKB/Swiss-Prot 수탁 번호 P04891), 더욱 특히 야생형 람다 N 항종결 단백질(NCBI 수탁 번호 NC_001416.1, 완전한 게놈 서열; UniProtKB/Swiss-Prot 수탁 번호 P03045)이다. 전체 또는 거의 전체 MS2/R17 단백질은 테더링된 RNA에 능숙하게 결합하는 데 필요한다. 이러한 단백질에 퍼져 있는 여러 아미노산 잔기는 줄기 루프 상호작용에 관여하기 때문이다.
따라서, 본 발명의 키메라 효소는 야생형 MS2 외피 단백질(NCBI 수탁 번호 NC_00141 7.2, UniProtKB/Swiss-Prot P03612) 또는 이의 단리물 야생형 R17 외피 단백질(NCBI 수탁 번호 EF108465.1, UniProtKB/Swiss-Prot P69170), 또는 특정 RNA 요소를 인식하고 높은 친화도로 상호작용할 수 있는 돌연변이체 또는 이의 유도체를 사용할 수 있다.
중요하게도, lambdoid N-단백질의 N-말단 서열로부터 18-에서 22-아미노산 영역은 전장 N-단백질의 것과 유사한 친화도 및 특이성으로 동족 RNA 서열에 결합한다.
본 발명의 키메라 효소에서, 단백질- RNA 테더링 시스템의 상기 RNA-결합 도메인은 야생형 람다 N의 위치 1 내지 22, 특히 1 내지 18에 있는 아미노산으로 이루어진 펩티드를 포함하거나 이로 이루어진 펩티드 종결 단백질(NCBI 수탁 번호 NC_001416.1, 완전한 게놈 서열; UniProtKB/Swiss-Prot 수탁 번호 P03045), 또는 야생형 phi21 N 항종결 단백질(NCBI 수탁 번호 AH007390.1, 부분 게놈 서열; UniProtKB/Swiss-Prot 수탁) 번호 P07243), 또는 야생형 HK97 N 항종결 단백질- RNA 테더링 시스템(NCBI 수탁 번호 NC_002167.1, 완전한 게놈 서열, NCBI 단백질 수탁 번호 NP_037732.1) 또는 야생형 P22 N 항종결 단백질(NCBI 수탁 번호) NC_002371.2, 완전한 게놈 서열, UniProtKB/Swiss-Prot 수탁 번호 P04891) 또는 특정 RNA 요소를 인식하고 고친화도와 상호작용할 수 있는 돌연변이 또는 이의 유도체 특히 야생형 람다 N 항종결 단백질(NCBI 수탁 번호 NC_001416.1, 완전한 게놈 서열; UniProtKB/Swiss-Prot 수탁 번호 P03045) 등이다.
특히, 단백질- RNA 테더링 시스템의 상기 RNA-결합 도메인은 야생형 람다 N 항종결 단백질(NCBI 수탁 번호 NC_001416.1)의 위치 1 내지 22의 아미노산으로 구성된 펩티드(UniProtKB/Swiss-Prot 수탁 번호 P03045)를 포함하거나 이로 구성된다.
특히, 단백질- RNA 테더링 시스템의 상기 RNA-결합 도메인은 본 발명의 키메라 효소의 상이한 촉매 도메인과 동일한 공급원(예를 들어, 동일한 효소로부터)으로부터 유래되지 않는다.
"상기 RNA-결합 도메인에 특이적으로 결합하는 단백질- RNA 테더링 시스템의 RNA 요소"는 RNA 서열에 관한 것이고, 일반적으로 단백질 RNA 테더링 시스템의 해당 RNA 결합 도메인에 높은 친화도로 결합할 수 있는 줄기 루프를 형성한다.
특히, 상기 DNA 서열은 박테리오파지 DNA-의존성 RNA 중합효소에 대한 프로모터 또는 본 발명의 키메라의 상기 DNA-의존성 RNA 중합효소에 대한 프로모터에 작동가능하게 연결된다.
특히, 단백질- RNA 테더링 시스템의 RNA 결합 도메인이 람도이드 N 항종결 단백질- RNA 테더링 시스템의 RNA 결합 도메인인 경우, 상기 RNA 결합 도메인에 특이적으로 결합하는 요소는 boxBL 및 /또는암호화된 요소를 포함하는 boxBR 스템 루프 RNA 구조이다.
특히, 단백질- RNA 테더링 시스템의 RNA-결합 도메인이 MS2 코트 단백질- RNA 테더링 시스템의 RNA-결합 도메인인 경우, 상기 RNA-결합 도메인에 특이적으로 결합하는 요소는 19개 뉴클레오티드 또는 서열 번호 39에 의해 암호화된 요소를 포함하는 21개의 뉴클레오티드 줄기 루프 서열(뉴클레오티드 1748 -766 엔테로박테리오파지 MS2 분리물 DL52, NCBI 수탁 번호 JQ966307.1)이며, 이는 바이러스 복제효소에 대한 유전자의 개시 코돈을 포함한다.
특히, 단백질- RNA 테더링 시스템의 RNA-결합 도메인이 R17 분리 코트 단백질- RNA 테더링 시스템의 RNA-결합 도메인인 경우, 상기 RNA-결합 도메인에 특이적으로 결합하는 요소는 19개 뉴클레오티드일 수 있다. 또는 바이러스 복제효소에 대한 유전자의 개시 코돈을 포함하는 21개 뉴클레오티드 스템-루프(엔테로박테리오파지 R17의 뉴클레오티드 1746-764, NCBI 수탁 번호 EF1 08465.1)이다.
본 발명은 또한 단리된 핵산 분자 또는 단리된 핵산 분자의 군에 관한 것으로, 상기 핵산 분자(들)는 본 발명에 따른 키메라 효소를 코딩하는 핵산 분자 또는 키메라 효소를 코딩하는 단리된 핵산 분자로서, 그의 서열이 프레임 내, 특히 순서대로 융합된 단백질- RNA 테더링 시스템의 RNA-결합 도메인을 코딩하는 핵산 서열을 포함할 수 있는데, 폴리(A) 중합효소의 하나 이상의 촉매 도메인을 코딩하는 핵산 서열; 캡핑 효소의 하나 이상의 촉매 도메인을 코딩하는 핵산 서열; 그리고 선택적으로 DdRp, 특히 박테리오파지 DNA-의존성 RNA 중합효소의 적어도 하나의 촉매 도메인을 코딩하는 핵산 서열; 여기서 상기 RNA-결합 도메인은 특정 RNA 서열 및/또는 구조로 구성된 상기 단백질- RNA 테더링 시스템의 RNA 요소에 특이적으로 결합한다.
본 발명에 따른 키메라 효소를 암호화하는 상기 분리된 핵산 분자 군은 발현에 의해 본 발명에 따른 키메라 효소를 얻는 데 필요하고 충분한 모든 핵산 분자를 포함하거나 이로 이루어진다.
"핵산 분자"는 DNA 및 RNA 분자를 포함하는 연결된 뉴클레오티드로 구성된 임의의 분자이다.
본 발명에 따른 키메라 효소를 코딩하는 단리된 핵산 분자의 상기 군은 하기를 포함하거나 이로 이루어진다.
단백질- RNA 테더링 시스템의 상기 RNA 결합 도메인을 인코딩하는 핵산 분자, 및 캡핑 효소의 하나 이상의 촉매 도메인, 특히 RNA 트리포스파타제의 하나 이상의 촉매 도메인, 구아닐릴트랜스퍼라제의 하나 이상의 촉매 도메인 및 N7-구아닌 메틸트랜스퍼라제의 하나 이상의 촉매 도메인을 코딩하는 핵산 분자; 그리고 선택적으로: 폴리(A) 중합효소의 하나 이상의 촉매 도메인을 코딩하는 핵산 분자; 및/또는 DdRp, 특히 박테리오파지 DNA-의존성 RNA 중합효소의 적어도 하나의 촉매 도메인을 코딩하는 핵산 분자를 포함한다.
본 발명에 따른 키메라 효소를 코딩하는 단리된 핵산 분자의 상기 군은 하기를 포함하거나 이로 이루어질 수 있는데, 단백질- RNA 테더링 시스템의 상기 RNA 결합 도메인을 인코딩하는 핵산 분자, RNA 트리포스파타제의 하나 이상의 촉매 도메인을 코딩하는 핵산 분자, 구아닐릴트랜스퍼라제의 하나 이상의 촉매 도메인을 코딩하는 핵산 분자, N7-구아닌 메틸트랜스퍼라제의 하나 이상의 촉매 도메인을 코딩하는 핵산 분자; 그리고 선택적으로: 폴리(A) 중합효소의 하나 이상의 촉매 도메인을 코딩하는 핵산 분자; 및/또는 DdRp, 특히 박테리오파지 DNA-의존성 RNA 중합효소의 적어도 하나의 촉매 도메인을 코딩하는 핵산 분자일 수 있다.
본 발명의 단리된 핵산 분자는 프레임 내, 특히 순서대로 융합된 단백질- RNA 테더링 시스템의 상기 RNA-결합 도메인을 코딩하는 핵산 서열을 포함하거나 이로 이루어질 수 있는데, 폴리(A) 중합효소의 상기 촉매 도메인을 인코딩하는 핵산 서열, 캡핑 효소의 상기 촉매 도메인을 인코딩하는 핵산 서열, 특히, RNA 트리포스파타제의 상기 촉매 도메인을 코딩하는 핵산 서열, 구아닐릴트랜스퍼라제의 상기 촉매 도메인을 코딩하는 핵산 서열, N7-구아닌 메틸트랜스퍼라제의 상기 촉매 도메인을 코딩하는 핵산 서열, 그리고 DNA-의존성 RNA 중합효소, 특히 박테리오파지 DNA-의존성 RNA 중합효소의 상기 촉매 도메인을 코딩하는 핵산 서열일 수 있다.
본 발명에 따른 단리된 핵산 분자는 그의 서열이 프레임 내, 특히 순서대로 융합된 단백질- RNA 테더링 시스템의 RNA-결합 도메인을 코딩하는 핵산 서열일 수 있는데, 폴리(A) 중합효소의 촉매 도메인을 코딩하는 핵산 서열; 캡핑 효소의 촉매 도메인을 코딩하는 핵산 서열, 및 임의로 DdRp, 특히 박테리오파지 DNA-의존성 RNA 중합효소의 상기 촉매 도메인을 코딩하는 핵산 서열; 그리고 폴리(A) 중합효소의 촉매 도메인을 인코딩하는 핵산 서열과 다음으로 구성된 군에서 선택된 촉매 도메인 중 하나를 인코딩하는 핵산 서열 사이의 리보솜 스키핑 모티프를 인코딩하는 핵산 서열 효소, 그리고 DdRp의 상기 촉매 도메인을 포함할 수 있다.
본 발명에 따른 단리된 핵산 분자는 그의 서열이 프레임 내, 특히 순서대로 융합된 단백질- RNA 테더링 시스템의 RNA-결합 도메인을 코딩하는 핵산 서열일 수 있는데, 폴리(A) 중합효소의 촉매 도메인을 코딩하는 핵산 서열; RNA 트리포스파타제의 촉매 도메인을 코딩하는 핵산 서열, 구아닐릴트랜스퍼라제의 촉매 도메인을 코딩하는 핵산 서열, N7-구아닌 메틸트랜스퍼라제의 촉매 도메인을 코딩하는 핵산 서열, 및 임의로 DNA-의존성 RNA 중합효소를 포함할 수 있다.
특히 박테리오파지 DNA-의존성 RNA 중합효소의 상기 촉매 도메인을 코딩하는 핵산 서열; 그리고 폴리(A) 중합효소의 촉매 도메인을 인코딩하는 핵산 서열과 다음으로 구성된 군에서 선택된 촉매 도메인 중 하나를 인코딩하는 핵산 서열 사이의 IS를 인코딩하는 핵산 서열일 수 있는데, RNA의 상기 촉매 도메인 트리포스파타제, 구아닐릴트랜스퍼라제의 상기 촉매 도메인, N7-구아닌 메틸트랜스퍼라제의 상기 촉매 도메인, 및 DNA-의존성 RNA 중합효소의 상기 촉매 도메인, 바람직하게는 RNA 트리포스파타제의 상기 촉매 도메인을 포함할 수 있다.
키메라 효소를 코딩하는 본 발명의 단리된 핵산 분자는 그의 서열일 수 있는데, 폴리(A) 중합효소의 하나 이상의 촉매 도메인을 코딩하는 핵산 서열; 캡핑 효소의 하나 이상의 촉매 도메인을 코딩하는 핵산 서열; 그리고 선택적으로 DdRp, 특히 박테리오파지 DNA-의존성 RNA 중합효소의 상기 촉매 도메인을 코딩하는 핵산 서열; 폴리(A) 중합효소의 촉매 도메인을 인코딩하는 핵산 서열과 캡핑 효소의 하나 이상의 촉매 도메인을 인코딩하는 핵산 서열 사이의 리보솜 스키핑 모티프를 인코딩하는 핵산 서열을 추가로 포함하는 서열을 포함할 수 있다.
사실, 예상외로, 본 발명자는 이러한 핵산 분자가 <캡핑 효소의 적어도 하나의 도메인을 포함하는 키메라 효소를 인코딩하는 핵산 분자> 및 <폴리(A) 중합효소의 하나 이상의 촉매 도메인을 인코딩하는 핵산 서열에 프레임 내에서 융합된 RNA 테더링 시스템의 RNA-binding domain을 인코딩하는 핵산과 연관된 DNA-의존성 RNA 중합효소>의 조합보다 DNA-의존성 RNA 중합효소에 의해 더 높은 발현율을 허용한다.
무세포유래 세포에서, 상기 방법은 본 발명에 따른 핵산 분자 또는 단리된 핵산 분자의 군을 무세포유래 세포에서 발현시키는 단계를 포함하고, 여기서 상기 DNA 서열은 RNA 요소를 코딩하는 적어도 하나의 서열에 공유적으로 연결된 상기 RNA-결합 도메인에 특이적으로 결합하는 상기 단백질- RNA 테더링 시스템이다.
"상기 RNA-결합 도메인에 특이적으로 결합하는 단백질- RNA 테더링 시스템의 RNA 요소"는 RNA 서열에 관한 것이고, 일반적으로 단백질 RNA 테더링 시스템의 해당 RNA 결합 도메인에 높은 친화도로 결합할 수 있는 줄기 루프를 형성한다.
특히, 단백질- RNA 테더링 시스템의 RNA 결합 도메인이 람도이드 N 항종결 단백질- RNA 테더링 시스템의 RNA 결합 도메인인 경우, 상기 RNA 결합 도메인에 특이적으로 결합하는 요소는 boxBL 및 /또는 boxBR 스템 루프 RNA 구조이다.
특히, 단백질- RNA 테더링 시스템의 RNA-결합 도메인이 MS2 코트 단백질- RNA 테더링 시스템의 RNA-결합 도메인인 경우, 상기 RNA-결합 도메인에 특이적으로 결합하는 요소는 21개의 뉴클레오티드 줄기 루프 서열(뉴클레오티드 1748 -766 엔테로박테리오파지 MS2 분리물 DL52, NCBI 수탁 번호 JQ966307.1)이며, 이는 바이러스 복제효소에 대한 유전자의 개시 코돈을 포함한다.
특히, 단백질- RNA 테더링 시스템의 RNA-결합 도메인이 R17 분리 코트 단백질- RNA 테더링 시스템의 RNA-결합 도메인인 경우, 상기 RNA-결합 도메인에 특이적으로 결합하는 요소는 19개 뉴클레오티드일 수 있다. 또는 바이러스 복제효소에 대한 유전자의 개시 코돈을 포함하는 21개 뉴클레오티드 스템-루프(엔테로박테리오파지 R17의 뉴클레오티드 1746-764, NCBI 수탁 번호 EF1 08465.1)이다.
특히, 상기 DNA 서열은 박테리오파지 DNA-의존성 RNA 중합효소에 대한 프로모터 또는 본 발명의 키메라의 상기 DNA-의존성 RNA 중합효소에 대한 프로모터에 작동가능하게 연결되고 그의 3' 말단에서 적어도 하나에 공유적으로 연결된다. 바람직하게는 적어도 2개, 적어도 3개, 보다 바람직하게는 적어도 4개의 서열이 상기 RNA-결합 도메인에 특이적으로 결합하는 요소를 코딩한다.
특히, 상기 전사 종료 서열은 박테리오파지 T7 phil 0 전사 종료 서열(Genbank 수탁 번호 GU071091.1) 또는 E. coli RNA 중합효소 rrnB t1 stop(Genbank 수탁 번호 LN832404.1)일 수 있다.
본 발명은 또한 상기 정의된 바와 같은 본 발명에 따른 하나 이상의 키메라 효소 및/또는 단리된 핵산을 포함하는 5'-말단 캡, 특히 5'-말단 m7GpppN 캡을 갖는 RNA 분자의 생산용 키트에 관한 것이다.
상기 정의된 바와 같은 본 발명에 따른 산 분자 및/또는 핵산 분자의 그룹, 및/또는 상기 정의된 바와 같은 본 발명에 따른 벡터, 또는 키메라 효소, 특히 RNA 트리포스파타제의 하나 이상의 촉매 도메인, 구아닐릴트랜스퍼라제의 하나 이상의 촉매 도메인, N7-구아닌 메틸트랜스퍼라제의 하나 이상의 촉매 도메인, 및 DNA 의존성 RNA 중합효소 및/또는 단리된 핵산 분자 및/또는 상기 키메라 효소 및 폴리(A) 중합효소, 특히 세포질 폴리(A) 중합효소를 코딩하는 단리된 핵산 분자의 그룹, 적어도 하나의 RNA를 포함한다. 상기 폴리(A) 중합효소 및/또는 상기 폴리(A) 중합효소를 코딩하는 분리된 핵산 분자의 적어도 하나의 촉매 도메인에 연결된 단백질- RNA 테더링 시스템의 결합 도메인; 및 선택적으로 상기 RNA-결합 도메인에 특이적으로 결합하는 상기 단백질- RNA 테더링 시스템의 RNA 요소를 코딩하는 적어도 하나의 서열에 공유적으로 연결된 상기 RNA 분자를 코딩하는 DNA 서열을 포함한다.
바람직하게, 상기 관심 RNA 전사시스템은 높은 친화력으로 결합하는 RNA 결합 도메인과 펩타이드 결합 RNA 서열을 포함하는 단백질- RNA 테더링 시스템(protein- RNA tethering system)을 포함하는데, 상기 RNA 중합효소 발현단위에 추가적으로 상기 RNA 결합 도메인을 코딩하는 DNA; 및 상기 관심 RNA의 발현단위에 추가적으로 상기 펩타이드 결합 RNA 서열의 하나 이상을 코딩하는 DNA;를 포함하는 것을 특징으로 하는 RNA 전사시스템 및 이로 형질전환된 세포주일 수 있다.
본 발명에서 상기 DdRp, 단백질- RNA 테더링 시스템(protein- RNA tethering system)와 여러 효소(또는 단백질)들로 이루어지는 키메라 효소를 'ctDdRp'라고 지칭하였다.
<코돈 사용법>
일반적으로 유전 암호의 축퇴는 동일한 암호화 능력을 유지하면서 다른 코돈 (염기 삼중항)에 의해 RNA 서열에 존재하는 특정 코돈(아미노산을 코딩하는 염기 삼중항)을 대체할 수 있게 한다(코돈을 대체하는 것은 대체된 코돈과 동일한 아미노산을 암호화한다).
본 발명에서, RNA 분자에 포함된 오픈 리딩 프레임의 적어도 하나의 코돈은 오픈 리딩 프레임이 유래한 종에서 각각의 오픈 리딩 프레임의 각각의 코돈과 상이하다. 오픈 리딩 프레임의 코딩 서열은 "개조된" 것으로 언급된다.
예를 들어, 오픈 리딩 프레임의 코딩 서열이 변형되는 경우, 빈번하게 사용되는 코돈이 선택될 수 있다. WO2009/024567 A1은 더욱 빈번하게 사용되는 희귀 코돈의 치환을 포함하여, 핵산 분자의 코딩 서열의 변형을 기술한다.
코돈 사용의 빈도는 대상세포 또는 대상 유기체에 따라 다르기 때문에, 그러한 유형의 변형은 특정 대상세포 또는 대상 유기체에서의 발현에 핵산 서열을 맞추는 것이 적합하다. 일반적으로 말하면, 보다 빈번하게 사용되는 코돈은 전형적으로 대상세포 또는 대상 유기체에서 보다 효율적으로 번역되지만, 오픈 리딩 프레임의 모든 코돈의 변형이 항상 필요한 것은 아니다.
예를 들어, 오픈 리딩 프레임의 코딩 서열이 변형되는 경우, G (구아닐레이트) 잔기 및 C (시티딜레이트) 잔기의 함량은 각 아미노산에 대해 가장 풍부한 GC-함량을 갖는 코돈을 선택함으로써 변경될 수 있다. GC가 풍부한 오픈 리딩 프레임을 가진 RNA 분자는 면역 활성을 감소하고 RNA의 번역 및 반감기를 향상시킬 가능성이 있다고 보고되어 있다.
B. 관심 RNA 발현단위
RNA는 생명 과학, 생명공학 및 의약품에서 널리 사용되기 때문에 본 발명의 관심 RNA 전사시스템은 특히 진핵세포에서 단백질 및/또는 RNA를 효율적으로 생산하도록 설계할 필요가 있다.
본 발명의 관심 RNA(RNAi)는 mRNA(메신저 RNA), 또는 rRNA(리보솜 RNA), tRNA(트랜스퍼 RNA), miRNA(마이크로 RNA), 원형 RNA, siRNA(작은 간섭 RNA), shRNA, trans-activating crispr RNA, 리보자임 및 RNA 압타머를 포함하는 군에서 선택되어진 어느 하나일 수 있다.
본 발명자는 진핵세포에서, 특히 상기 세포의 세포질에서 mRNA 분자를 자율적으로 생성하는 효율적인 형질전환을 위한 인공 전사시스템(즉, 키메라 효소, ctDdRp)을 과거에 개발하였다. 이 시스템을 사용하여 RNA 사슬은 이 키메라 효소의 RNA 중합효소 부분에 의해 합성되고 mRNA 캡핑 효소 부분에 의해 5'-말단이 캡핑되었다. 또한, 폴리(A) 꼬리는 DNA 주형에서 폴리아데노신 트랙의 전사에 의해 RNA의 3'-말단에서 생성될 수 있다.
본 발명의 RNA 전사시스템에서 RNAi를 코딩하는 관심 RNA 발현단위는 DdRp에 의한 작동하는 관심 RNA 발현단위 또는 RdRp에 의한 작동하는 관심 RNA 발현단위가 있으며 상기 두 종류의 RNA 중합효소 발현단위 각각에 의해 관심 RNA 발현단위가 작동 가능하게 연결되어 구성될 수 있다.
1. DdRp에 의한 작동하는 관심 RNA 발현단위
본 발명의 RNA 전사시스템에서 RNAi를 코딩하는 관심 RNA 발현단위는 상기 키메라 효소, ctDdRp를 코딩하는 RNA 중합효소 발현단위에 의해 작동 가능하게 연결되어 구성될 수 있다.
본 발명의 관심 RNA의 발현단위는 (1) 상기 ctDdRp가 결합하는 프로모터; (2) 5'UTR; (3) RNAi를 코딩하는 DNA 절편; 및 (4) 3'UTR;을 포함하고, 이들이 작동 가능하게 연결되어 구성될 수 있다.
본 발명의 상기 키메라 효소, ctDdRp는 T7 RNA 중합효소, T3 RNA 중합효소 및 SP6 RNA 중합효소를 포함하는 군에서 선택되어진 어느 하나의 발현을 증가시켜 관심 RNA를 장기간 지속적으로 발현시킬 수 있다.
본 발명에 있어서, T7 RNA 중합효소는 T7 프로모터에 대한 특이성이 매우 높으며, T7 프로모터 하류의 DNA만을 전사할 수 있다.
따라서, 본 발명에서 T7 RNA 중합효소를 사용함으로써 세포 내에 다른 프로모터와 반응하지 않고 오직 T7 프로모터를 갖는 관심 RNA 발현단위에 결합 및 전사를 수행하게 되고, 높은 효율로 관심 RNA를 전사하여 증폭할 수 있다.
상기 키메라 효소, ctDdRp는 추가적으로 캡핑효소, 테더링 시스템 또는 Poly(A) 중합효소를 포함할 수도 있다.
바람직하게, 발명의 관심 RNA 전사시스템의 DdRp에 의한 작동하는 관심 RNA 발현단위는 진핵세포에서 관심 단백질을 발현시키기 위한 관심 RNA는 5'캡 또는 IRES를 포함하는 5'UTR 및 3'UTR을 포함할 수 있다.
"5'cap", "캡", "캡된" 및 ""5'cap 구조"는 일부 진핵세포의 1차 RNA, 예컨대 전구체 메신저 RNA의 5' 말단에서 발견되는 디뉴클레오타이드를 지칭하는 것으로 동의어로 사용된다. 5'cap은 5' 트리포스페이트 결합(또는 특정 캡 유사체의 경우 화학적 변형된 트리포스페이트 결합)에서 5'를 통해 mRNA 분자의 첫 번째 뉴클레오타이드에 (임의로 화학적 변형된) 구아노신이 결합된 구조이다. 용어는 종래의 cap 또는 cap 유사체를 지칭할 수 있다.
예를 들어, RNA를 5'캡과 함께 제공하는 것은 상기 5'캡의 존재 하에 DNA 주형의 시험관내 전사에 의해 달성될 수 있으며, 여기서 상기 5'캡은 생성된 RNA 가닥에 공동-전사적으로 혼입되거나, RNA는 예를 들어 시험관내 전사에 의해 생성될 수 있으며, 5'cap은 캡핑효소, 예를 들어 종두증 바이러스의 캡핑효소를 사용하여 전사 후 RNA에 부착될 수 있다. 캡핑된 RNA에서, (캡핑된) RNA 분자의 제1 염기의 3' 위치는 인산디에스터 결합을 통해 RNA 분자의 후속 염기("제2 염기")의 5' 위치에서 연결된다.
종래의 5'캡"은 자연성 발생적인 5'캡을 의미하고, 바람직하게는 7-메틸구아노신 캡을 의미한다. 7-메틸구아노신 캡에서, 캡의 구아노신은 화학적 변형된 구아노신이며, 여기서 변형은 7-위치에서의 메틸화로 이루어진다.
관심 RNA 상의 5'캡은 키메라 효소 ctDdRp에 의해 유도된다. 트랜스로 코딩된 관심 RNA의 효율적인 생산을 달성할 수 있다.
본 발명의 관심 RNA는 내부 리보솜 진입 부위 (IRES) 요소를 포함할 수도 있다. 일반적으로, 내부 리보솜 진입 부위, 약칭 IRES는 관심 RNA 서열의 5' 말단과 다른 위치, 예컨대 관심 RNA 서열의 중앙에서의 위치로부터의 mRNA로부터의 번역 개시를 가능하게 하는 뉴클레오타이드 서열로 mRNA 서열의 중간에 위치한다.
새로 합성된 mRNA는 통상적으로 RNA가 20 ~ 30개의 뉴클레오타이드의 길이에 도달할 때 5'캡 구조로 변형된다. 먼저, 5'말단 뉴클레오타이드 pppN(ppp는 트리포스페이트를 나타내고, N은 임의의 뉴클레오사이드를 나타냄)은 RNA 5'트리포스파타아제 및 구아닐릴 전이효소 활성을 갖는 캡핑효소에 의해 세포에서 5'GpppN으로 전환된다. 이어서, GpppN은 (구아닌-7)-메틸 전이효소 활성을 갖는 제2 효소에 의해 세포에서 메틸화되어 모노-메틸화된 m7GpppN 캡을 형성할 수 있다.
본 발명에서 사용된 5'캡은 자연성 5'캡이다.
본 발명에서, 자연성 5'캡 디뉴클레오타이드는 전형적으로 비-메틸화 캡 디뉴클레오타이드 (G(5')ppp(5')N; GpppN이라고도 함) 및 메틸화된 캡 디뉴클레오타이드 ((m7G(5')ppp(5')N; m7GpppN이라고도 함)로 이루어진 군으로부터 선택된다.
5'캡의 존재는 또한 본 발명의 트랜스-복제 시스템에서 예기치 않은 상승적인 효과를 제공한다. 캡핑된 키메라 효소 mRNA가 RNA에 대해 트랜스로 제공될 때 캡핑된 키메라 효소 mRNA가 관심 단백질의 생산을 유발하는 것이 보다 효율적이다. 따라서, 트랜스로 5'캡 및 복제의 상승 효과, 즉 시스로 복제하는 것보다 우수한 효과가 있다.
본 발명의 캡핑된 RNA는 대상세포의 캡핑 장치에 의존하지 않는다. 시험관내에서 캡핑된 RNA를 형성하는데 가장 빈번하게 사용되는 방법은 모든 4개의 리보뉴클레오사이드 트리포스페이트 및 캡 디뉴클레오타이드 예컨대 m7G(5')ppp(5')G (m7GpppG라고도 함)의 존재 하에 박테리아 또는 박테리오파지 RNA 중합효소로 DNA 주형을 전사하는 것이다.
RNA 중합효소는 다음 주형 뉴클레오사이드 트리포스페이트 (pppN)의 α-포스페이트에서 m7GpppG의 구아노신 부분의 3'OH에 의한 친핵성 공격으로 전사를 개시하여 중간체 m7GpppGpN (여기서 N은 RNA 분자의 제2 염기이다)를 형성한다. 경쟁하는 GTP-개시된 생성물 pppGpN의 형성은 시험관내 전사 동안 캡 대 GTP의 몰비가 5 ~ 10으로 설정함으로써 억제된다.
5'캡은 5'캡 유사체이다. RNA가 시험관내 전사에 의해 수집되는 경우, 예를 들어 시험관내 전사된 RNA(IVT- RNA)인 경우에 특히 적합하다. 캡 유사체는 초기에 시험관내 전사에 의해 RNA RNA의 대규모 합성을 용이하게 하기 위해 기술하였다.
UTR
Untranslated region(비번역 영역) 또는 "UTR"은 전사되지만 아미노산 서열로 번역되지 않는 영역에 관한 것이거나 또는 mRNA 분자와 같은 RNA 분자 내의 상응하는 영역에 관한 것이다. UTR은 오픈 리딩 프레임의 상류 및/또는 키메라 효소를 코딩하는 오픈 리딩 프레임의 하류에 존재할 수 있다.
구체적으로, 본 발명의 키메라 효소 mRNA에서, "3'UTR"은 키메라 효소에 대한 코딩 영역의 3'에 위치하는 영역에 관한 것이고, "5'UTR" 이는 키메라 효소에 대한 코딩 영역의 5'에 위치하는 영역에 관한 것이다.
3'UTR은 존재하는 경우 단백질 코딩 영역의 종결 코돈의 하류에 유전자의 3'말단에 위치하지만, "3'UTR"은 바람직하게는 폴리(A) 꼬리를 포함하지 않는다. 따라서, 3'UTR은 폴리(A) 꼬리의 상류, 예를 들어 폴리(A) 꼬리에 직접 인접하여 있다(존재한다면).
5'UTR은 존재하는 경우 단백질 코딩 영역의 시작코돈의 상류에 유전자의 5' 말단에 위치한다. 5'UTR은 5'캡의 하류, 예를 들어 5'캡 바로 옆에 있다(존재한다면).
5' 및/또는 3'UTR은 오픈 리딩 프레임과 기능적으로 연결될 수 있어서, 이들 영역이 오픈 리딩 프레임과 관련되어 안정성 및/또는 상기 오픈 리딩 프레임을 포함하는 RNA의 번역 효율이 증가한다.
UTR은 RNA의 운반을 이용한 효과적인 운반의 전제 조건인 RNA의 안정성 및 번역 효율에 관여한다. 특정 5' 및/또는 3' 비번역 영역(UTR)을 선택함으로써, 5'캡 및/또는 3' 폴리(A)-꼬리에 관한 구조적 변형 이외에, 둘 모두 개선될 수 있다.
UTR 내의 서열 요소는 일반적으로 번역 효율 (주로 5'UTR) 및 RNA 안정성 (주로 3'UTR)에 영향을 미치는 것으로 이해된다. 핵산 서열의 번역 효율 및/또는 안정성을 증가시키기 위해 활성화한 5'UTR이 존재하는 것이 바람직하다. 독립적으로 또는 부가적으로, 핵산 서열의 번역 효율 및/또는 안정성을 증가시키기 위해 활성화한 3'UTR이 존재하는 것이 바람직하다.
바람직하게는, 키메라 효소 mRNA는 ctDdRp가 유래된 에 대해 이종 또는 고유하지 않은 5'UTR 및/또는 3'UTR을 포함한다. 이것은 원하는 번역 효율 및 RNA 안정성에 따라 비번역 영역을 설계할 수 있게 한다.
본 발명의 3'UTR은 엑소리보뉴클레아제의 장벽으로 작용하거나 RNA 안정성을 증가시키는 것으로 알려진 단백질(예컨대 RNA-결합 단백질)과 상호작용하는 스템-루프 구조를 제공하기 위해 폴딩할 수 있는 하나 이상의 역반복을 포함할 수 있다.
인간 베타-글로빈 3'UTR, 특히 인간 베타-글로빈 3'UTR의 2개의 연속적인 동일한 사본은 높은 전사 안정성 및 번역 효율에 기여한다.
따라서, 본 발명의 키메라 효소 mRNA는 인간 베타-글로빈 3'UTR의 2개의 연속적인 동일한 사본을 포함한다. 따라서, 그것은 5'→3' 방향으로 (a) 선택적으로 5'UTR; (b) 키메라 효소를 코딩하는 오픈 리딩 프레임; (c) 3'UTR; 인간 베타-글로빈 3'UTR의 2개의 연속적인 동일한 사본, 이의 단편, 또는 인간 베타-글로빈 3'UTR의 변이체 또는 이의 단편을 포함하는 상기 3'UTR을 포함한다.
본 발명의 키메라 효소 mRNA는 의 번역 효율 및/또는 안정성을 증가시키기 위해 활성화하지만 인간 베타-글로빈 3'UTR, 이의 단편, 또는 인간 베타-글로빈 3'UTR의 변이체 또는 이의 단편이 아닌, 3'UTR을 포함한다.
본 발명의 키메라 효소 mRNA는 번역 효율 및/또는 안정성을 증가시키기 위해 활성화한 5'UTR을 포함한다.
본 발명에 따른 UTR-함유 RNA는 예를 들어, 시험관내 전사에 의해 제조될 수 있다. 이들은 5'UTR 및/또는 3'UTR을 갖는 RNA의 전사를 허용하는 방식으로 본 발명의 핵산 분자(예컨대 DNA)의 발현을 유전적으로 변형시킴으로써 달성될 수 있다.
3'UTR은 일반적으로 mRNA의 단백질 코딩 영역(즉, 오픈 리딩 프레임) 및 폴리(A) 서열 사이에 위치한 mRNA의 일부이다. mRNA의 3'UTR은 아미노산 서열내로 번역되지 않는다. 3'UTR은 일반적으로 유전자 발현 과정 중 각각의 mRNA 내로 전사되는 유전자에 의해 코딩된다. 게놈 서열은 먼저 선택적인 인트론을 포함하는 미성숙 mRNA로 전사된다. 그 이후, 미성숙 mRNA는 성숙 과정을 거쳐 성숙 mRNA로 되도록 추가로 처리된다. 이러한 성숙 과정은 5'캡핑(capping), 추가적인 인트로을 절단하기 위한 미성숙 mRNA 스플라이싱(splicing) 및 미성숙 mRNA 3'말단의 아데닐산중합반응 및 추가적인 엔도-(endo-) 또는 엑소(exo)뉴클레아제 절단 등과 같은 3'말단의 변형을 포함한다.
본 발명에서, 3'UTR는 단백질 코딩 영역의 종료 코돈의 3'말단에, 바람직하게는 단백질 코딩 영역의 종료 코돈의 3' 말단 바로 옆에 위치한 성숙 mRNA의 서열에 상응하며, 폴리(A) 서열의 5'측면, 바람직하게는 폴리(A) 서열의 5'말단 바로 옆 뉴클레오타이드까지 이어진다. 본 발명에서, 유전자의 3'UTR, 예컨대 알파 또는 베타 글로빈의 3'UTR는 이러한 유전자로부터 유래된 성숙 mRNA의 3'UTR에 상응하는 서열, 즉, 유전자의 전사 및 미성숙 mRNA의 성숙에 의해 수집된 mRNA에 상응하는 서열이다. 용어 "유전자의 3'UTR"은 3'UTR의 DNA 서열 및 RNA 서열을 포함한다.
5'UTR은 일반적으로 전령 RNA(mRNA)의 특정 부분으로 이해된다. 이는 mRNA의 오픈 리딩 프레임의 5'에 위치한다. 일반적으로, 5'UTR은 전사 시작부(transcriptional start site)와 함께 시작하고 오픈 리딩 프레임의 시작 코돈의 하나의 뉴클레오타이드 전에 종료된다. 5'UTR은 조절 요소라고도 하는 유전자 발현을 조절하기 위한 요소를 포함할 수 있다. 이와 같은 조절 요소는 예를 들어, 리보솜 결합부 또는 5'말단 올리고피리미딘관(Oligopyrimidine Tract, TOP)일 수 있다. 5'UTR은 예를 들어, 5'캡(cap)의 첨가에 의해 전사 후 변형될 수 있다. 본 발명에서, 5'UTR은 5'캡(cap) 및 시작 코돈 사이에 위치한 성숙 mRNA의 서열에 상응한다. 바람직하게, 5'UTR은 5'캡(cap)의 3'에 위치한 뉴클레오타이드로부터, 바람직하게는 5'캡(cap)의 3' 바로 옆에 위치한 뉴클레오타이드로부터, 단백질 코딩 영역의 시작 코돈의 5'에 위치한 뉴클레오타이드까지, 바람직하게는 단백질 코딩 영역의 시작 코돈의 5' 바로 옆에 위치한 뉴클레오타이드까지 이어지는 서열에 상응한다. 성숙 mRNA의 5'캡(cap)의 3' 바로 옆에 위치한 뉴클레오타이드는 일반적으로 전사 시작부에 상응한다.
5'UTR 서열이 5'UTR 서열을 정의하기 위해 사용되는 mRNA 서열과 같은 RNA 서열 또는 이와 같은 RNA 서열에 상응하는 DNA 서열일 수 있다. 유전자의 5'UTR은 이러한 유전자로부터 유래된 성숙 mRNA의 5'UTR에 상응하는 서열, 즉, 유전자의 전사 및 미성숙 mRNA의 성숙에 의해 수집된 mRNA에 상응하는 서열이다. 유전자의 5'UTR은 5'UTR의 DNA 서열 및 RNA 서열을 포함한다.
5'TOP는 일반적으로 핵산 분자의 5'말단 영역, 예컨대 특정 mRNA 분자의 5'말단 영역 또는 특정 유전자의 기능성 독립체 예를 들어, 전사영역의 5'말단 영역에 위치한 피리미딘 뉴클레오타이드의 스트레치(stretch)이다. 서열은 보통 전사 시작부에 상응하는 사이티딘과 함께 시작하고, 보통 약 3 ~ 30개의 피리미딘 뉴클레오타이드의 스트레치가 이어진다. 피리미딘 스트레치 그리하여 5'TOP는 TOP의 다운스트림에 위치한 제1 퓨린 뉴클레오타이드의 5'의 하나의 뉴클레오타이드로 종료된다. 5'말단 올리고피리미딘관을 함유하는 전령 RNA는 종종 TOP mRNA로서 언급된다. 따라서, 이와 같은 전령 RNA를 제공하는 유전자는 TOP 유전자로서 언급된다. TOP 서열은 예를 들어, 유전자 및 펩타이드 신장 인자를 코딩하는 mRNA 및 리보솜 단백질에서 발견된다.
본 발명에서, TOP 모티프(motif)는 상기 정의된 바와 같은 5'TOP에 상응하는 핵산 서열이다. 따라서, 본 발명에서, TOP 모티프는 바람직하게 3 ~ 30개 뉴클레오타이드 길이를 갖는 피리미딘 뉴클레오타이드 스트레치이다. 바람직하게, TOP-모티프는 적어도 3개 피리미딘 뉴클레오타이드, 바람직하게는 적어도 4개 피리미딘 뉴클레오타이드, 바람직하게는 적어도 5개 피리미딘 뉴클레오타이드, 더욱 바람직하게는 적어도 6개 뉴클레오타이드, 더욱 바람직하게는 적어도 7개 뉴클레오타이드, 가장 바람직하게는 적어도 8개 피리미딘 뉴클레오타이드로 이루어지고, 여기서 피리미딘 뉴클레오타이드의 스트레치는 바람직하게 사이토신 뉴클레오타이드와 함께 이의 5'말단에서 시작한다. TOP 유전자 및 TOP mRNA에서, TOP-모티프는 바람직하게 전사 시작부와 함께 이의 5'말단에서 시작하고 상기 유전자 또는 mRNA에 제1 퓨린 잔기의 5'의 하나의 뉴클레오타이드로 종료된다.
본 발명의 의미에서 TOP 모티프는 바람직하게 5'UTR을 나타내는 서열의 5'말단에 위치하거나 5'UTR을 코딩하는 서열의 5'말단에 위치한다. 따라서, 바람직하게, 만약 이러한 스트레치가 각각의 서열의 5'말단, 예컨대 본 발명에 따른 mRNAi, 본 발명에 따른 mRNAi의 5'UTR 요소, 또는 본 발명에 설명된 바와 같은 TOP 유전자의 5'UTR로부터 유래된 핵산 서열에 위치한다면 3개 이상의 피리미딘 뉴클레오타이드의 스트레치는 본 발명의 의미에서 "TOP 모티프"로 불리운다. 다시 말해서, 5'UTR 또는 5'UTR 요소의 5'말단에 위치하지 않고, 5'UTR 또는 5'UTR 요소 내 어디든 위치한 3개 이상의 피리미딘 뉴클레오타이드의 스트레치는 바람직하게 "TOP 모티프"로서 언급되지 않는다.
TOP 유전자는 일반적으로 5' 말단 올리고피리미딘관의 존재를 특징으로 한다. 더욱이, 대부분의 TOP 유전자는 성장-연관 번역 조절을 특징으로 한다. 그러나, 조직 특이적 번역 조절을 갖는 TOP 유전자도 알려져 있다. TOP 유전자의 5'UTR은 TOP 유전자로부터 유래된 성숙 mRNA의 5'UTR의 서열에 상응하며, 5'캡(CAP)의 3'에 위치한 뉴클레오타이드로부터 시작 코돈의 5'에 위치한 뉴클레오타이드까지 이어진다. TOP 유전자의 5'UTR은 일반적으로 임의의 시작 코돈, 업스트림(upstream) AUGs(uAUGs) 또는 업스트림 오픈 리딩 프레임(uORFs)을 포함하지 않는다. 거기에서, 업스트림 AUGs 및 업스트림오픈 리딩 프레임은 일반적으로 번역되어야 할 오픈 리딩 프레임의 시작 코돈(AUG)의 5'에 나타나는 AUGs 및 오픈 리딩 프레임으로 이해된다. TOP 유전자의 5'UTR은 일반적으로 상대적으로 짧다. TOP 유전자의 5'UTR 길이는 20 뉴클레오타이드 ~ 500개 뉴클레오타이드까지 달라질 수 있으며, 일반적으로 약 200개 뉴클레오타이드 미만이고, 약 150개 뉴클레오타이드 미만이며, 약 100개 뉴클레오타이드 미만이다. 본 발명의 의미에서, TOP 유전자의 5'UTR 예시는 위치 5의 뉴클레오타이드로부터 시작 코돈(예를 들어, ATG)의 5' 바로 옆에 위치한 뉴클레오타이드까지 이어지는 핵산 서열이다. 특히 바람직한 TOP 유전자의 5'UTR의 절편은 5'TOP 모티프가 결여된 TOP 유전자의 5'UTR이다. 'TOP 유전자의 5'UTR'은 바람직하게 자연적으로 발생하는 TOP 유전자의 5'UTR을 나타낸다.
폴리(A) 서열
본 발명의 키메라 효소 RNA 발현단위는 3' 폴리(A) 서열을 포함한다.
폴리(A) 서열은 본질적으로 적어도 20, 적어도 26, 적어도 40, 적어도 80, 적어도 100개이고, 500개 이하, 400개 이하, 300개 이하, 200개 이하, 특히 150개 이하의 A 뉴클레오타이드이고, 특히 약 120개의 A 뉴클레오타이드로 구성되거나 포함한다.
폴리(A) 서열에서 뉴클레오타이드 수에 따라 전형적으로 적어도 50%, 적어도 75%의 폴리(A) 서열에서의 대부분의 뉴클레오타이드가 A 뉴클레오타이드이지만, 나머지 뉴클레오타이드는 A 뉴클레오타이드 이외의 뉴클레오타이드, 예컨대 U 뉴클레오타이드 (유리딜레이트), G 뉴클레오타이드 (구아닐레이트), C 뉴클레오타이드 (시티딜레이트)인 것을 허용한다. 폴리(A) 서열에서의 모든 뉴클레오타이드, 즉 폴리(A) 서열에서의 뉴클레오타이드의 수에 따라 100%가 A 뉴클레오타이드인 것을 의미한다. 용어 "A 뉴클레오타이드" 또는 "A"는 아데닐레이트를 지칭한다.
본 발명은 코딩 가닥에 상보적인 가닥에서 반복된 dT 뉴클레오타이드 (데옥시티미딜레이트)를 포함하는 DNA 주형에 기반하여, RNA 전사 동안, 즉 시험관내 전사된 RNA의 제조 중에 부착되는 3' 폴리(A) 서열을 제공한다. 폴리(A) 서열을 코딩하는 DNA 서열(코딩 가닥)은 폴리(A) 단위로 지칭된다.
DNA의 코딩 가닥에 존재하는 3' 폴리(A) 단위는 본질적으로 dA 뉴클레오타이드로 이루어지지만, 4개의 뉴클레오타이드(dA, dC, dG, dT)의 균등한 분포를 갖는 무작위 서열에 의해 중단된다. 이러한 무작위 서열은 길이가 5 ~ 50개, 바람직하게는 10 ~ 30개, 보다 바람직하게는 10 ~ 20개일 수 있다.
본질적으로 dA 뉴클레오타이드로 이루어지지만, 4개의 뉴클레오타이드(dA, dC, dG, dT)의 균등한 분포를 갖고 길이가 예를 들어 5 ~ 50개의 뉴클레오타이드인 무작위 서열에 의해 중단되는 폴리(A) 단위는 DNA 수준에서 E.coli에서의 plasmid DNA의 일정한 증식을 나타내며, RNA 수준에서 RNA 안정성 및 번역 효율을 지지하는 것과 관련하여 유익한 특성과 여전히 연관되어 있다.
결과적으로, 본 발명에 기술된 RNA 분자에 함유된 3' 폴리(A) 서열은 본질적으로 A 뉴클레오타이드로 구성되지만, 4개의 뉴클레오타이드(A, C, G, U)가 균등한 분포를 갖는 무작위 서열에 의해 중단된다. 이러한 무작위 서열은 길이가 5 ~ 50개, 10 ~ 30개, 10 ~ 20개일 수 있다.
아데닐산중합반응(polyadenylation)은 일반적으로 RNA 분자, 예를 들어, 미성숙 mRNA와 같은 핵산 분자에 폴리(A) 서열이 첨가되는 것으로 이해된다. 아데닐산중합반응은 소위 아데닐산중합반응 신호에 의해 유도될 수 있다. 이 신호는 아데닐산중합반응될, RNA 분자와 같은 핵산 분자의 3'말단의 뉴클레오타이드의 스트레치(stretch) 내에 위치한다. 아데닐산중합반응 신호는 일반적으로 아데닌 및 우라실/티민 뉴클레오타이드로 이루어진 헥사머(hexamer), 헥사머 서열 AAUAAA 를 포함한다. 다른 서열, 헥사머 서열도 가능하다. 아데닐산중합반응은 프리-mRNA(미성숙-mRNA로도 불리우는)의 가공 중에 발생한다. RNA 성숙(프리-mRNA로부터 성숙 mRNA 까지)은 아데닐산중합반응의 단계를 포함한다.
단백질- RNA 테더링 시스템
단백질- RNA 테더링 시스템의 상기 RNA 결합 도메인을 인코딩하는 핵산 분자, 및 캡핑 효소의 하나 이상의 촉매 도메인, 특히 RNA 트리포스파타제의 하나 이상의 촉매 도메인, 구아닐릴트랜스퍼라제의 하나 이상의 촉매 도메인 및 N7-구아닌 메틸트랜스퍼라제의 하나 이상의 촉매 도메인을 코딩하는 핵산 분자; 그리고 선택적으로: 폴리(A) 중합효소의 하나 이상의 촉매 도메인을 코딩하는 핵산 분자; 및/또는 DNA-의존성 RNA 중합효소, 특히 박테리오파지 DNA-의존성 RNA 중합효소의 적어도 하나의 촉매 도메인을 코딩하는 핵산 분자를 포함한다.
본 발명에 따른 키메라 효소를 코딩하는 단리된 핵산 분자의 상기 군은 하기를 포함하거나 이로 이루어질 수 있는데, 단백질- RNA 테더링 시스템의 상기 RNA 결합 도메인을 인코딩하는 핵산 분자, RNA 트리포스파타제의 하나 이상의 촉매 도메인을 코딩하는 핵산 분자, 구아닐릴트랜스퍼라제의 하나 이상의 촉매 도메인을 코딩하는 핵산 분자, N7-구아닌 메틸트랜스퍼라제의 하나 이상의 촉매 도메인을 코딩하는 핵산 분자; 그리고 선택적으로: 폴리(A) 중합효소의 하나 이상의 촉매 도메인을 코딩하는 핵산 분자; 및/또는 DNA-의존성 RNA 중합효소, 특히 박테리오파지 DNA-의존성 RNA 중합효소의 적어도 하나의 촉매 도메인을 코딩하는 핵산 분자일 수 있다.
본 발명의 단리된 핵산 분자는 프레임 내, 특히 순서대로 융합된 단백질- RNA 테더링 시스템의 상기 RNA-결합 도메인을 코딩하는 핵산 서열을 포함하거나 이로 이루어질 수 있는데, 폴리(A) 중합효소의 상기 촉매 도메인을 인코딩하는 핵산 서열, 캡핑 효소의 상기 촉매 도메인을 인코딩하는 핵산 서열, 특히, RNA 트리포스파타제의 상기 촉매 도메인을 코딩하는 핵산 서열, 구아닐릴트랜스퍼라제의 상기 촉매 도메인을 코딩하는 핵산 서열, N7-구아닌 메틸트랜스퍼라제의 상기 촉매 도메인을 코딩하는 핵산 서열, 그리고 DNA-의존성 RNA 중합효소, 특히 박테리오파지 DNA-의존성 RNA 중합효소의 상기 촉매 도메인을 코딩하는 핵산 서열일 수 있다.
본 발명에 따른 단리된 핵산 분자는 그의 서열이 프레임 내, 특히 순서대로 융합된 단백질- RNA 테더링 시스템의 RNA-결합 도메인을 코딩하는 핵산 서열일 수 있는데, 폴리(A) 중합효소의 촉매 도메인을 코딩하는 핵산 서열; 캡핑 효소의 촉매 도메인을 코딩하는 핵산 서열, 및 임의로 DNA-의존성 RNA 중합효소, 특히 박테리오파지 DNA-의존성 RNA 중합효소의 상기 촉매 도메인을 코딩하는 핵산 서열; 그리고 폴리(A) 중합효소의 촉매 도메인을 인코딩하는 핵산 서열과 다음으로 구성된 군에서 선택된 촉매 도메인 중 하나를 인코딩하는 핵산 서열 사이의 리보솜 스키핑 모티프를 인코딩하는 핵산 서열 효소, 그리고 DNA-의존성 RNA 중합효소의 상기 촉매 도메인을 포함할 수 있다.
본 발명에 따른 단리된 핵산 분자는 그의 서열이 프레임 내, 특히 순서대로 융합된 단백질- RNA 테더링 시스템의 RNA-결합 도메인을 코딩하는 핵산 서열일 수 있는데, 폴리(A) 중합효소의 촉매 도메인을 코딩하는 핵산 서열; RNA 트리포스파타제의 촉매 도메인을 코딩하는 핵산 서열, 구아닐릴트랜스퍼라제의 촉매 도메인을 코딩하는 핵산 서열, N7-구아닌 메틸트랜스퍼라제의 촉매 도메인을 코딩하는 핵산 서열, 및 임의로 DNA-의존성 RNA 중합효소를 포함할 수 있다.
특히 박테리오파지 DNA-의존성 RNA 중합효소의 상기 촉매 도메인을 코딩하는 핵산 서열; 그리고 폴리(A) 중합효소의 촉매 도메인을 인코딩하는 핵산 서열과 다음으로 구성된 군에서 선택된 촉매 도메인 중 하나를 인코딩하는 핵산 서열 사이의 리보솜 스키핑 모티프를 인코딩하는 핵산 서열일 수 있는데, RNA의 상기 촉매 도메인 트리포스파타제, 구아닐릴트랜스퍼라제의 상기 촉매 도메인, N7-구아닌 메틸트랜스퍼라제의 상기 촉매 도메인, 및 DNA-의존성 RNA 중합효소의 상기 촉매 도메인, 바람직하게는 RNA 트리포스파타제의 상기 촉매 도메인을 포함할 수 있다.
키메라 효소를 코딩하는 본 발명의 단리된 핵산 분자는 그의 서열일 수 있는데, 폴리(A) 중합효소의 하나 이상의 촉매 도메인을 코딩하는 핵산 서열; 캡핑 효소의 하나 이상의 촉매 도메인을 코딩하는 핵산 서열; 그리고 선택적으로 DNA-의존성 RNA 중합효소, 특히 박테리오파지 DNA-의존성 RNA 중합효소의 상기 촉매 도메인을 코딩하는 핵산 서열; 폴리(A) 중합효소의 촉매 도메인을 인코딩하는 핵산 서열과 캡핑 효소의 하나 이상의 촉매 도메인을 인코딩하는 핵산 서열 사이의 리보솜 스키핑 모티프를 인코딩하는 핵산 서열을 추가로 포함하는 서열을 포함할 수 있다.
사실, 예상외로, 본 발명자는 이러한 핵산 분자가 <캡핑 효소의 적어도 하나의 도메인을 포함하는 키메라 효소를 인코딩하는 핵산 분자> 및 <폴리(A) 중합효소의 하나 이상의 촉매 도메인을 인코딩하는 핵산 서열에 프레임 내에서 융합된 RNA 테더링 시스템의 RNA-binding domain을 인코딩하는 핵산과 연관된 DNA-의존성 RNA 중합효소>의 조합보다 DNA-의존성 RNA 중합효소에 의해 더 높은 발현율을 허용한다.
무세포유래 세포에서, 상기 방법은 본 발명에 따른 핵산 분자 또는 단리된 핵산 분자의 군을 무세포유래 세포에서 발현시키는 단계를 포함하고, 여기서 상기 DNA 서열은 RNA 요소를 코딩하는 적어도 하나의 서열에 공유적으로 연결된 상기 RNA-결합 도메인에 특이적으로 결합하는 상기 단백질- RNA 테더링 시스템이다.
"상기 RNA-결합 도메인에 특이적으로 결합하는 단백질- RNA 테더링 시스템의 RNA 요소"는 RNA 서열에 관한 것이고, 일반적으로 단백질 RNA 테더링 시스템의 해당 RNA 결합 도메인에 높은 친화도로 결합할 수 있는 줄기 루프를 형성한다.
특히, 단백질- RNA 테더링 시스템의 RNA 결합 도메인이 람도이드 N 항종결 단백질- RNA 테더링 시스템의 RNA 결합 도메인인 경우, 상기 RNA 결합 도메인에 특이적으로 결합하는 요소는 boxBL 및 /또는 boxBR 스템 루프 RNA 구조이다.
특히, 단백질- RNA 테더링 시스템의 RNA-결합 도메인이 MS2 코트 단백질- RNA 테더링 시스템의 RNA-결합 도메인인 경우, 상기 RNA-결합 도메인에 특이적으로 결합하는 요소는 21개의 뉴클레오티드 줄기 루프 서열(뉴클레오티드 1748 -766 엔테로박테리오파지 MS2 분리물 DL52, NCBI 수탁 번호 JQ966307.1)이며, 이는 바이러스 복제효소에 대한 유전자의 개시 코돈을 포함한다.
특히, 단백질- RNA 테더링 시스템의 RNA-결합 도메인이 R17 분리 코트 단백질- RNA 테더링 시스템의 RNA-결합 도메인인 경우, 상기 RNA-결합 도메인에 특이적으로 결합하는 요소는 19개 뉴클레오티드일 수 있다. 또는 바이러스 복제효소에 대한 유전자의 개시 코돈을 포함하는 21개 뉴클레오티드 스템-루프(엔테로박테리오파지 R17의 뉴클레오티드 1746-764, NCBI 수탁 번호 EF1 08465.1)이다.
특히, 상기 DNA 서열은 박테리오파지 DNA-의존성 RNA 중합효소에 대한 프로모터 또는 본 발명의 키메라의 상기 DNA-의존성 RNA 중합효소에 대한 프로모터에 작동가능하게 연결되고 그의 3' 말단에서 적어도 하나에 공유적으로 연결된다. 바람직하게는 적어도 2개, 적어도 3개, 보다 바람직하게는 적어도 4개의 서열이 상기 RNA-결합 도메인에 특이적으로 결합하는 요소를 코딩한다.
특히, 상기 전사 종료 서열은 박테리오파지 T7 phil 0 전사 종료 서열(Genbank 수탁 번호 GU071091.1) 또는 E. coli RNA 중합효소 rrnB t1 stop(Genbank 수탁 번호 LN832404.1)일 수 있다.
본 발명은 또한 상기 정의된 바와 같은 본 발명에 따른 하나 이상의 키메라 효소 및/또는 단리된 핵산을 포함하는 5'-말단 캡, 특히 5'-말단 m7GpppN 캡을 갖는 RNA 분자의 생산용 키트에 관한 것이다.
상기 정의된 바와 같은 본 발명에 따른 산 분자 및/또는 핵산 분자의 그룹, 및/또는 상기 정의된 바와 같은 본 발명에 따른 벡터, 또는 키메라 효소, 특히 RNA 트리포스파타제의 하나 이상의 촉매 도메인, 구아닐릴트랜스퍼라제의 하나 이상의 촉매 도메인, N7-구아닌 메틸트랜스퍼라제의 하나 이상의 촉매 도메인, 및 DNA 의존성 RNA 중합효소 및/또는 단리된 핵산 분자 및/또는 상기 키메라 효소 및 폴리(A) 중합효소, 특히 세포질 폴리(A) 중합효소를 코딩하는 단리된 핵산 분자의 그룹, 적어도 하나의 RNA를 포함한다. 상기 폴리(A) 중합효소 및/또는 상기 폴리(A) 중합효소를 코딩하는 분리된 핵산 분자의 적어도 하나의 촉매 도메인에 연결된 단백질- RNA 테더링 시스템의 결합 도메인; 및 선택적으로 상기 RNA-결합 도메인에 특이적으로 결합하는 상기 단백질- RNA 테더링 시스템의 RNA 요소를 코딩하는 적어도 하나의 서열에 공유적으로 연결된 상기 RNA 분자를 코딩하는 DNA 서열을 포함한다.
2. RdRp에 의한 작동하는 관심 RNA 발현단위
발명의 관심 RNA 전사시스템의 RdRp에 의한 작동하는 관심 RNA 발현단위는 진핵세포에서 관심 단백질을 발현시키기 위한 관심 RNA는 5'캡 또는 IRES를 포함하는 5'UTR 및 3'UTR을 포함할 수 있다.
본 발명의 RNA 전사시스템에서 RNAi를 코딩하는 관심 RNA 발현단위는 상기 RdRp를 코딩하는 발현단위에 의해 작동 가능하게 연결되어 구성될 수 있다.
본 발명의 관심 RNA 발현단위는 (1) 무세포유래 세포에서 작동하는 프로모터; (2) 레플리콘을 코딩하는 DNA; 및 (3) 무세포유래 세포에서 작동하는 전사 종결서열;을 포함하고, 이들이 작동 가능하게 연결되어 구성될 수 있다.
본 발명의 관심 RNA 발현단위는 레플리콘을 포함한다. RdRp, 바람직하게는 알파바이러스 RdRp에 의해 복제될 수 있는 핵산 구성체는 레플리콘으로 불린다. 전형적으로, 본 발명에 따른 레플리콘은 RNA 분자이다.
"레플리콘"은 RNA 의존성 RNA 중합효소에 의해 복제될 수 있는 RNA 분자를 정의하며, DNA 중간체 없이 하나 또는 다수의 동일하거나 본질적으로 동일한 RNA 레플리콘의 복사본을 생성한다. "DNA 중간체 없다"는 것은 RNA 레플리콘의 레플리콘을 형성하는 과정에서 레플리콘의 데옥시리보핵산(DNA) 복사본 또는 레플리콘의 상보체가 RNA 레플리콘의 복사본을 형성하는 과정에서 형성되지 않고, 및/또는 데옥시리보핵산(DNA) 분자가 RNA 레플리콘, 또는 이의 상보체의 복사본을 형성하는 과정에서 주형으로 사용되지 않는 것을 의미한다.
"복제될 수 있다"는 일반적으로 핵산의 하나 이상의 동일하거나 본질적으로 동일한 복사본이 제조될 수 있음을 설명한다. "RdRp에 의해 복제될 수 있다"에서 용어 "RdRp"와 함께 사용하는 경우, 용어 "복제될 수 있다"는 RdRp에 대한 레플리콘의 기능적 특성을 설명하는 것이다.
이러한 기능적 특성은 (i) RdRp가 레플리콘을 인식할 수 있고 (ii) RdRp가 RNA 의존성 RNA 중합효소(RdRP)로서 작용할 수 있는 것 중 적어도 하나를 포함한다.
바람직하게는, RdRp는 (i) 레플리콘을 인식할 수 있고 (ii) RNA 의존성 RNA 중합효소로서 작용할 수 있다. RNA 의존성 RNA 중합효소는 주형으로서 레플리콘, 이의 상보체 또는 그의 일부를 사용할 수 있다.
"인식할 수 있는"이라는 표현은 RdRp가 레플리콘과 물리적으로 결합할 수 있으며, 바람직하게는 RdRp가 전형적으로 비공유 결합으로 레플리콘에 결합할 수 있는 것을 설명한다. "결합"이라는 용어는 RdRp가 임의의 하나 이상의 보존서열구성 1 (CSE 1) 또는 이의 상보 서열(레플리콘에 포함되는 경우), 보존서열구성 2 (CSE 2) 또는 이의 상보 서열(레플리콘에 포함되는 경우), 보존서열구성 3 (CSE 3) 또는 이의 상보 서열(레플리콘에 포함되는 경우), 보존서열구성 4 (CSE 4) 또는 상보 서열(레플리콘에 포함되는 경우)에 대해 결합 능력이 있음을 의미할 수 있다. 바람직하게는, RdRp는 CSE 2 [즉, (+) 가닥에] 및/또는 CSE 4 [즉, (+) 가닥에]에 결합할 수 있거나, CSE 1의 상보체 [즉, (-) 가닥에] 및/또는 CSE 3의 상보체 [즉, (-) 가닥에]에 결합할 수 있다.
"RdRP로서 작용할 수 있다"는 표현은 RdRp가 알파바이러스 게놈 (+) 가닥 RNA의 (-) 가닥 상보체의 합성을 촉매할 수 있다는 의미를 포함하고, 여기서 (+) 가닥 RNA는 주형 기능을 가지며, 및/또는 RdRp가 (+) 가닥 알파바이러스 게놈 RNA의 합성을 촉매할 수 잇음을 의미하고, 여기서 (-) 가닥 RNA는 주형 기능을 갖는다. 일반적으로, "RdRP로서 작용할 수 있는"이라는 표현은 또한 RdRp가 (+) 가닥 서브게놈 RNA의 합성을 촉매할 수 잇음을 의미하고, 여기서 (-) 가닥 RNA는 주형 기능을 가지며, (+) 가닥 서브게놈 RNA의 합성은 전형적으로 알파바이러스 서브게놈 프로모터에서 개시된다.
"결합할 수 있는" 및 "RdRP로 작용할 수 있는"이라는 표현은 정상적인 생리 조건에서의 능력을 지칭한다. 특히, 상기 표현은 알파바이러스 RdRp를 발현하거나 알파바이러스 RdRp를 코딩하는 핵산으로 형질주입된 세포내 조건을 지칭한다. 세포는 바람직하게는 진핵세포이다. 결합 능력 및/또는 RdRP로서 작용하는 능력은 실험적으로 예를 들어 무세포 시험관내 시스템 또는 진핵세포 내에서 시험할 수 있다. 선택적으로, 상기 진핵세포는 RdRp의 기원을 나타내는 특정 알파바이러스가 감염되는 종으로부터 유래된 세포이다. 예를 들어, 사람에게 감염되는 특정 알파바이러스의 알파바이러스 RdRp를 사용하는 경우, 정상적인 생리 조건은 인간 세포에서의 상태이다. 보다 바람직하게는, 진핵세포(일례로 인간 세포)는 RdRp의 기원을 나타내는 특정 알파바이러스가 감염된 동일한 조직 또는 기관에서 유래한 것이다.
이러한 기능적 특성에 비추어, 본 발명의 레플리콘 및 본 발명의 RdRp mRNA 발현단위는 기능적 쌍을 형성한다. 알파바이러스 RdRp는 본 발명에 따른 임의의 알파바이러스 RdRp일 수 있고, 레플리콘은 트랜스로 알파바이러스 RdRp에 의해 복제될 수 있는 한, 레플리콘 RNA의 뉴클레오타이드 서열은 특별히 한정되는 것은 아니다.
본 발명의 시스템이 세포, 바람직하게는 무세포유래 세포에 도입될 때, RdRp 발현단위 상에 코딩된 RdRp는 번역될 수 있고, 그에 의해 RdRp를 생성할 수 있다. 번역 후, RdRp는 관심 RNA 레플리콘을 트랜스로 복제가 가능하다. 따라서, 본 발명은 트랜스로 RNA를 복제하기 위한 시스템을 제공한다. 결과적으로, 본 발명의 시스템은 트랜스-복제 시스템이다. 따라서, 본 발명에 따른 레플리콘은 트랜스-레플리콘이다.
여기서, 트랜스(예를 들어, 트랜스-작용, 트랜스-조절과 관련하여)는 일반적으로 "상이한 분자로부터의 작용"(즉, 분자간)을 의미한다. 그것은 일반적으로 "동일한 분자에서 작용"(즉, 분자내)을 의미하는 시스(예를 들어 시스-작용, 시스-조절과 관련하여)의 반대말이다. RNA 합성(전사 및 RNA 복제 포함)과 관련하여, 트랜스-작용요소는 RNA 합성이 가능한 효소(RdRp)를 코딩하는 유전자를 함유하는 핵산 서열을 포함한다.
RdRp는 제 2 핵산 분자, 즉 다른 분자의 합성에서 기능한다. 트랜스-작용 RNA 및 이것이 코딩하는 단백질은 모두 관심 유전자 상에서 "트랜스로 작용한다"고 지칭한다. 본 발명에서, 트랜스-작용 RNA는 알파바이러스 RNA 중합효소를 코딩한다. 따라서, 알파바이러스 RNA 중합효소는 RNA를 복제할 수 있으므로 RdRp라 한다.
RdRp는 제 2 RNA 분자 (레플리콘) 상에서 트랜스로 작용한다. 본 발명에 따라 RdRp에 의해 트랜스로 복제될 수 있는 레플리콘은 본 발명에서 동의어로 "트랜스-레플리콘" 또는 "본 발명에 따른 레플리콘"라고 지칭한다.
종래 기술에서의 제안과는 달리, 본 발명의 트랜스-복제 시스템은 유전자 발현에 매우 적합하다.
우선, 첫째로, 두개의 분리된 RNA 분자를 포함하는 본 발명의 시스템의 다능성은 레플리콘 및 RdRp 발현단위가 상이한 시간 및/또는 상이한 부위에서 설계 및/또는 제조될 수 있게 한다. RdRp 발현단위는 제 1 시점에서 제조되고, 레플리콘은 추후 시점에서 제조된다. 예를 들어, 그 제조 후, RdRp 발현단위는 추후 시점에 사용하기 위해 저장될 수 있다. 본 발명은 시스-레플리콘에 비해 증가된 유연성을 제공한다. 새로운 특정 게놈 편집 대상 유전자좌(들)이 나타나면, 새로운 게놈 편집 도구에 대한 게놈 편집을 유도하는 가이드 핵산을 제작함으로써, 새로운 게놈 편집을 설계할 수 있다. 미리 준비된 RdRp 발현단위는 보관실에서 회수할 수 있다. 다시 말해, RdRp 발현단위는 임의의 특정 레플리콘과 독립적으로 설계되고 제조될 수 있다. 이것은 RdRp가 없는 레플리콘의 준비가 시스-레플리콘의 준비보다 적은 노력과 자원을 필요로 하기 때문에 새로운 특정 게놈 편집 대상 유전자좌(들)이나 적어도 하나의 새로운 게놈 편집 대상의 선정을 특징으로 하는 특정 게놈 편집 대상 유전자좌(들)의 출현에 신속하게 반응할 수 있게 한다.
둘째로, 본 발명에 따른 트랜스-레플리콘은 전형적으로 전형적인 시스-레플리콘보다 짧은 핵산 분자이다. 이것은 게놈 편집 도구를 코딩하는 레플리콘, 예를 들어 게놈 편집 도구의 보다 빠른 클로닝을 가능하게 하고, 게놈 편집 도구의 더 높은 수율을 제공한다.
바람직하게, 레플리콘은 자연성 발생 Semliki Forest 바이러스 및 약독 Semliki Forest 바이러스와 같은 Semliki Forest 바이러스의 변이체 또는 유도체를 포함하는 Semliki Forest 바이러스로부터의 알파바이러스 RdRp에 의해 복제될 수 있다.
또 바람직하게, 레플리콘은 자연성 발생 Sindbis 바이러스 및 약독 Sindbis 바이러스와 같은 Sindbis 바이러스의 변이체 또는 유도체를 포함하는, Sindbis 바이러스로부터의 알파바이러스 RdRp에 의해 복제될 수 있다. 또 다른 바람직한 일 실시형태에서, 레플리콘은 자연성 발생 VEEV 및 약독 VEEV와 같은 VEEV의 변이체 또는 유도체를 포함하는 베네수엘라 마뇌염 바이러스(VEEV)로부터의 알파바이러스 RdRp에 의해 복제될 수 있다.
본 발명에 따른 관심 RNA 레플리콘은 바람직하게는 단일가닥 RNA 분자이다. 일반적으로, 단일가닥 코딩 핵산 분자는 핵산 물질의 중량 단위(예를 들어 μg)당 2배 많은 유전 정보를 포함한다. 따라서, 단일가닥의 성질은 예를 들어 본 발명에 의해 채용된 이중가닥 종래 기술 DNA 벡터와 비교하여 추가적인 장점을 나타낸다. 본 발명에 따른 레플리콘은 전형적으로 (+) 가닥 RNA 분자이다.
관심 RNA 레플리콘은 분리된 핵산 분자이다.
본 발명의 트랜스-복제 시스템은 대상체의 세포의 도입에서 게놈 편집 도구의 발현에 적합하다. 본 발명에서, 트랜스-레플리콘 RNA는 게놈 편집 도구로서 리포터 단백질 (예를 들어, GFP 또는 eGFP와 같은 형광 단백질)을 코딩하는 유전자좌를 포함하며, 각각의 게놈 편집 도구의 발현 효율을 용이하게 결정하도록 한다. 2개의 RNA를 포함하는 트랜스-복제 시스템은 시스-복제와 비교하여 목적 RNA의 발현 효율이 현저히 우수하다.
본 발명의 트랜스-복제 시스템은 인간 또는 동물에서 게놈 편집 도구의 효율적인 발현, 예를 들어 높은 수준의 발현에 적합하다.
예를 들어, 자연계에서 발견되는 전형적인 알파바이러스에서 RdRp를 코딩하는 약 7400개의 뉴클레오타이드는 전장 레플리콘의 증폭이 필요할 것이기 때문에 세포에 부담을 준다. 이러한 부담의 주요 부분은 비-복제성 RdRp 발현단위발현단위가 예를 들어, mRNA의 형태로 RdRp 발현에 사용되는 경우에 제거된다. 이것은 RNA 증폭 및 전이 RNA 발현을 위해 트랜스-레플리콘을 사용할 수 있게 한다. RdRp 발현단위가 세포에서 복제되지 않는다면 (즉, 복제된 유일한 외래 구성체가 본 발명의 트랜스-레플리콘이다), 세포 에너지 및 자원 (뉴클레오타이드 등)의 낭비를 피하고, 이것은 우수한 발현 수준을 설명할 수 있다. 또한, 짧은 레플리콘 RNA는 RNA 합성에 더 적은 시간을 필요로 한다. 따라서 시간, 세포 에너지 및/또는 자원의 절약이 보다 높은 수준의 복제에 기여할 수 있다고 여겨질 수 있다.
레플리콘의 보존서열
레플리콘은 알파바이러스 게놈 RNA이거나 이를 포함하거나 알파바이러스 게놈 RNA로부터 유래된 것이다. 본 발명에 따른 레플리콘은 하나 이상의 보존서열구성(CSE)을 포함한다. 특히, 레플리콘은 자연계에서 발견되는 알파바이러스의 하나 이상의 보존서열구성(CSE) 또는 이의 변이체 또는 유도체를 포함할 수 있다.
- (-) 가닥 주형으로부터 (+) 가닥 합성을 위한 프로모터로서 기능하는 것으로 여겨지는 CSE 1. 존재한다면, CSE 1은 전형적으로 레플리콘 RNA의 5' 말단에 위치하거나 그 부근에 위치한다.
- 게놈 (+) 가닥 RNA 주형으로부터 (-) 가닥 합성을 위해 프로모터 또는 인핸서로서 작용하는 것으로 여겨지는 CSE 2. 존재한다면, CSE 2는 전형적으로 CSE 1의 하류에 위치하지만 CSE 3의 상류에 위치한다.
- 서브게놈 RNA의 효과적인 전사에 기여하는 것으로 여겨지는 CSE 3; 존재한다면, CSE 3는 전형적으로 목적 RNA(존재한다면)의 코딩 서열의 상류에 위치하지만, CSE 2의 하류에 위치한다.
- (-) 가닥 합성의 개시를 위한 코어 프로모터로서 기능하는 것으로 여겨지는 CSE 4. 존재한다면, CSE 4는 전형적으로 목적 RNA(존재한다면)에 대한 코딩 서열의 하류에 위치한다. 여하튼, CSE 4는 전형적으로 CSE 3의 하류에 존재한다. 다양한 알파바이러스에서 CSE 4(3' CSE라고도 함)의 서열 세부 사항은 문헌에 기술되어 있으며, 본 발명에서, CSE 4의 서열은 예를 들어 그 문서의 교시에 따라 선택될 수 있다.
본 발명에 따른 관심 RNA 레플리콘은 (1) 알파바이러스 5' 복제인식서열: (2) 관심 RNA; 및 (3) 알파바이러스 3' 복제인식서열을 포함한다.
알파바이러스 5' 복제인식서열은 알파바이러스 CSE 1 및/또는 CSE 2를 포함한다. 자연성 발생 알파바이러스에서, CSE 1 및/또는 CSE 2는 전형적으로 5' 복제인식서열에 포함된다.
알파바이러스 3' 복제인식서열은 알파바이러스 CSE 4를 포함한다. 자연성 발생 알파바이러스에서, CSE 4는 전형적으로 3' 복제인식서열에 포함된다.
알파바이러스 5' 복제인식서열 및 알파바이러스 3' 복제인식서열은 RdRp의 존재 하에서 본 발명에 따른 RNA 레플리콘의 복제를 지시할 수 있다. 따라서, 단독으로 또는 바람직하게 함께 존재할 때, 이들 인식 서열은 RdRp의 존재 하에 RNA 레플리콘의 복제를 지시한다. 특정 이론에 결부되기를 바라는 것 없이, RdRp의 존재 하에 RNA 레플리콘의 복제를 지시하는 알파바이러스 보존서열구성 (CSE) 1, 2 및 4 (인식서열에 포함됨)인 것을 이해할 수 있다. 따라서, 레플리콘은 전형적으로 CSE 1, 2 및 4를 포함할 것이다.
RdRp 발현단위에 의해 코딩되는 RdRp는 레플리콘의 알파바이러스 5' 복제인식서열 및 알파바이러스 3' 복제인식서열 모두를 인식할 수 있는 알파바이러스 RdRp인 것이 바람직하다.
이것은 알파바이러스 5' 복제인식서열 및 알파바이러스 3' 복제인식서열이 RdRp를 유도하는 알파바이러스에 고유한 경우에 달성된다. 천연은 이러한 서열의 자연적 기원이 동일한 알파바이러스임을 의미한다. 일 실시형태에서, CSE 1, CSE 2 및 CSE 4는 RdRp가 유도되는 알파바이러스에 고유한 것이다.
알파바이러스 RdRp가 레플리콘의 5' 복제인식서열 (및/또는 CSE 1 및/또는 CSE 2) 및 3' 복제인식서열 (및/또는 CSE 4) 모두를 인식할 수 있다면, 5' 복제인식서열 (및/또는 CSE 1 및/또는 CSE 2) 및/또는 알파바이러스 3' 복제인식서열 (및/또는 CSE 4)은 RdRp를 유도하는 알파바이러스에 고요한 것이 아니다. 바꾸어 말하면, RdRp는 5' 복제인식서열 (및/또는 CSE 1 및/또는 CSE 2) 및 3' 복제인식서열 (및/또는 CSE 4)에 호환성이 있는 것이다. 비-천연 알파바이러스 RdRp가 각각의 서열 또는 서열 요소를 인식할 수 있는 경우, RdRp는 호환성이 있는 것이다(바이러스 간 호환성). 상이한 알파바이러스로부터의 비-천연 RdRp와 각각 (3'/5') 복제인식서열 및 CSE에 관한 바이러스 간 호환성의 예로서는 당업계에 공지되어있다. 바이러스 간 호환성이 존재하는 한, (3'/5') 복제인식서열 및 CSE 각각을 알파바이러스 RdRp와 함께 임의로 조합 가능하다.
바이러스 간 호환성은 시험될 RdRp를 RNA와 함께 인큐베이션시킴으로써 본 발명을 수행하는 당업자에 의해 용이하게 시험될 수 있는데, RNA는 RNA 복제에 적합한 조건에서, 예를 들어 적합한 대상세포에 시험될 3'- 및 5' 복제인식서열을 갖는다. 복제가 발생하면, (3'/5') 복제인식서열 및 RdRp이 호환할 수 있는 것으로 결정된다.
서브게놈 프로모터
본 발명에 따른 RNA 레플리콘은 발현 제어 서열을 포함한다. 전형적인 발현 제어 서열은 프로모터이거나 이를 포함한다. 본 발명에 따른 RNA 레플리콘은 서브게놈 프로모터를 포함한다. 바람직하게는, 서브게놈 프로모터는 알파바이러스 서브게놈 프로모터이다. 서브게놈 프로모터의 뉴클레오타이드 서열은 알파바이러스 중에 고도로 보존되어 있다.
바람직하게는, 서브게놈 프로모터는 알파바이러스의 구조 단백질에 대한 프로모터이다. 이것은 서브게놈 프로모터가 알파바이러스에 고유한 것이고 상기 알파바이러스에서 하나 이상의 구조 단백질 유전자의 전사를 제어하는 것을 의미한다.
서브게놈 프로모터는 RdRp mRNA 발현단위의 RdRp와 호환할 수 있는 것이 바람직하다.
이것은 서브게놈 프로모터가 RdRp를 유도하는 알파바이러스에 고유한 경우에 달성된다. 고유함은 서브게놈 프로모터의 자연적 기원 및 RdRp의 자연적 기원이 동일한 알파바이러스임을 의미한다.
서브게놈 프로모터는 알파바이러스 RdRp가 레플리콘의 서브게놈 프로모터를 인식할 수 있는 경우에 RdRp를 유도하는 알파바이러스에 고유하지 않다. 즉, RdRp는 서브게놈 프로모터와 호환된다 (바이러스 간 호환성). 바이러스 간 호환성이 존재하는 한, 임의의 서브게놈 프로모터와 RdRp의 조합이 가능한다. 바이러스 간 호환성은 시험되는 RdRp를 RNA와 함께 인큐베이션함으로써 본 발명을 수행하는 당업자에 의해 용이하게 시험될 수 있고, 여기서 RNA는 서브게놈 프로모터로부터의 RNA 합성에 적합한 조건에서 시험될 서브게놈 프로모터를 갖는다.
서브게놈 RNA가 준비되면, 서브게놈 프로모터와 RdRp는 호환할 수 있는 것으로 결정된다. 바이러스 간 호환성의 다양한 예가 공지되어 있다: 일부 경우에, 비-천연 서브게놈 프로모터는 천연 서브게놈 프로모터보다 더 효율적인 전사를 유도한다.
바람직하게는, 본 발명에 따른 레플리콘은 알파바이러스로부터의 보존서열구성 3 (CSE 3)를 포함한다. CSE 3는 서브게놈 RNA의 효과적인 전사에 기여하는 것으로 여겨진다. 서브게놈 RNA의 전사는 CSE 3가 존재할 때 매우 효율적으로 일어나는 것으로 알려져있다. 전형적으로, CSE 3는 약 24개 뉴클레오타이드의 폴리 뉴클레오타이드 스트레치이다. 알파바이러스 게놈에서, CSE 3는 비구조성 단백질 및 구조 단백질의 코딩 서열 간의 접합 영역에 위치한다. 본 발명의 트랜스-레플리콘에서, CSE 3는 일반적으로 서브게놈 프로모터의 제어 하에 오픈 리딩 프레임 (ORF)의 상류 (5')에 존재한다.
본 발명에 따른 레플리콘이 서브게놈 프로모터의 제어 하에 하나의 ORF를 포함하는 경우, CSE 3는 상기한 하나의 ORF의 5'에 위치한다. 본 발명에 따른 레플리콘이 서브게놈 프로모터의 제어 하에 둘 이상의 ORF를 포함하는 경우, CSE 3는 각각의 그러한 ORF의 5'에 위치할 수 있다. 일 실시형태에서, CSE 3는 RdRp를 유도하는 알파바이러스에 고유한 것이다. CSE 3는 알파바이러스 RdRp가 레플리콘의 CSE 3를 인식할 수 있으면, RdRp를 유도하는 알파바이러스에 고유하지 않은 것이다.
레플리콘의 임의의 추가 기능
본 발명에 따른 RNA 레플리콘은 3' 폴리(A) 서열을 포함한다. 알파바이러스 RNA의 폴리(A) 서열은 바이러스 비구조성 단백질의 번역 효율 및 RNA 안정성에서 중요한 역할을 한다. 본 발명에서, 폴리(A) 서열은 목적 RNA의 번역 효율 및 레플리콘 안정성에서 중요한 역할을 하는 것으로 여겨진다.
본 발명에 따른 레플리콘의 3' 폴리(A) 서열은 RdRp mRNA 발현단위의 3' 폴리(A) 서열에서 선택될 수 있다. 그 외에도, 폴리(A) 서열 (본 발명에 따른 레플리콘 상에 존재한다면)은 알파바이러스 보존서열구성 4 (CSE 4)에 선행된다. 바람직하게는, CSE 4에 직접적으로 인접하여, CSE 4의 가장 3' 뉴클레오타이드가 직접적으로 폴리(A) 꼬리의 가장 5' 뉴클레오타이드에 인접하도록 한 것이 바람직하다.
본 발명에 따른 RNA 레플리콘은 5'-캡 (캡 유사체를 포함 함)을 포함한다. 캡 (또는 캡 유도체)은 문자 C로 상징되어있다. 본 발명에 따른 레플리콘의 캡 (또는 유사체)의 양상은 RNA 레플리콘의 경우에 대해 캡이 반드시 필수적으로 존재하여야 하는 것을 제외하고는, 본 발명에서 RdRp 발현단위의 캡(또는 유사체)에 대해 기재된 양상이 동일하다. RNA 레플리콘이 문자 C로 표시된 캡을 포함하는 다른 실시형태를 개략적으로 도시하고 있다는 사실과 무관하게 본 발명에 의해 동등하게 포함된다.
본 발명에 따른 레플리콘 상에 존재하는 오픈 리딩 프레임 (들)의 코딩 서열(존재하는 경우)은 개조된다. 레플리콘의 코돈 개조의 실시형태 및 바람직한 실시형태는 RdRp 발현단위의 코돈 개조의 경우에 대해 본 발명에 개시된 것들 중에서 선택될 수 있다. 오픈 리딩 프레임(들)의 코돈은 대상 세포 또는 대상 유기체에서의 발현에 적합할 수 있다.
이종 핵산 서열
레플리콘은 추가로 바이러스 유래가 아닌 적어도 하나의 핵산 서열, 특히 알파바이러스가 아닌 핵산 서열을 포함한다. 바람직한 실시형태에서, 본 발명에 따른 RNA 레플리콘은 이종 핵산 서열을 포함한다.
용어 "이종"은 핵산 서열이 알파바이러스 발현 제어 서열, 특히 알파바이러스 서브게놈 프로모터와 같은 알파바이러스 핵산 서열에 천연 기능적으로 결합되지 않는 상황을 의미한다. 이종 핵산 서열은 레플리콘의 핵산 서열에 포함된다.
바람직하게는, 이종 핵산 서열은 서브게놈 프로모터, 바람직하게는 알파바이러스 서브게놈 프로모터의 제어 하에 있고, 보다 바람직하게는, 이종 핵산 서열은 서브게놈 프로모터의 하류에 위치한다. 알파바이러스 서브게놈 프로모터는 매우 효율적이어서 높은 수준의 이종 유전자 발현에 적합하다. 바람직하게는, 서브게놈 프로모터는 이종 핵산 서열 또는 그의 일부의 RNA를 포함하는 서브게놈 RNA의 생산을 제어한다.
바람직하게는, 서브게놈 프로모터는 알파바이러스의 구조 단백질에 대한 프로모터이다. 이것은 서브게놈 프로모터가 알파바이러스에 고유하고 상기 알파바이러스에서 하나 이상의 구조 단백질의 코딩 서열의 전사를 제어하는 프로모터라는 것을 의미한다. 본 발명에 따르면, 이종 핵산 서열은 알파바이러스 구조 단백질을 코딩하는 핵산 서열과 같은 바이러스 핵산 서열을 부분적으로 또는 완전히 대체할 수 있다. 바람직하게는, 이종 핵산 서열은 알파바이러스로부터 유래되지 않으며; 특히, 이종 핵산 서열은 서브게놈 프로모터가 유래된 알파바이러스와 동일한 알파바이러스로부터 유래되지 않는 것이 바람직하다. 일 실시형태에서, 레플리콘은 CSE 3을 포함하고, 이종 핵산 서열은 CSE 3에 대해 이종인 것이다.
C. 관심 RNA(RNAi)
본 발명의 관심 RNA(RNAi)는 mRNA(메신저 RNA), 또는 rRNA(리보솜 RNA), t RNA(트랜스퍼 RNA), mi RNA(마이크로 RNA), siRNA(작은 간섭 RNA), sh RNA, trans-activating crispr RNA, 원형 RNA, 리보자임 및 RNA 압타머를 포함하는 군에서 선택되어진 어느 하나 또는 그 이상일 수 있다.
상기에서 선정된 복수의 RNA를 사용하여 관심 관심 RNA 발현단위를 제조할 수도 있다.
mRNA(전령 RNA messenger RNA)는 DNA의 유전 정보를 옮겨 적은 일종의 청사진 역할을 하며. 이를 기본으로 하여 리보솜에서 단백질을 합성하게 된다. 이를 세 부분으로 구분하는데, (Poly) cap, Polyadenyl, translation sequence(실제 번역되는 부분)이다. rRNA(리보솜 RNA ribosomal RNA)는 리보솜을 구성하는 RNA이다. tRNA(운반 RNA transfer RNA)는 mRNA의 코돈에 대응하는 안티코돈을 가지고 있으며, 꼬리 쪽에는 해당하는 안티코 돈에 맞추어 t RNA와 특정한 아미노산을 연결해 주는 효소에 의해 안티코 돈에 대응하는 아미노산을 달고 있다. mi RNA(마이크로 RNA micro RNA)는 생물의 유전자 발현을 제어하는 역할을 하는 작은 RNA로, mRNA와 상보적으로 결합해 세포 내 유전자 발현과정에서 중추적인 조절인자로 작용한다.
snRNA(소형 핵 RNA small nuclear RNA)는 핵 안에서 RNA를 스플 아이싱 하는 기능이 있다. snoRNA(소형인 RNA small nucleolar RNA)는 핵에서 RNA의 변형을 일으킨다. CircRNA(원형 RNA, circular RNA)는 수천 개의 진핵생물 유전자의 전구체 mRNA로부터 백스플라이싱(back-splicing)을 통해 생성된다. Circ RNA는 발현량이 일반적으로 낮은 수준으로 유지되지만, 세포 종류와 조직에 따라 특이적인 발현량이 있다. 게다가 circ RNA가 스플라이싱(splicing)과 전사 과정을 조절하는 mi RNA(마이크로 RNA, micro RNA)와의 상호작용 의해 다른 유전자의 발현을 조절함으로써 진핵생물 RNA(transcriptome)의 복잡도와 다양성에 기여한다. Trans-activating crispr RNA는 이펙터 단백질 및 상응하는 표적 분자에 결합하도록 디자인된 하나 이상의 가이드 RNA를 포함하는 CRISPR 시스템이다.
aRNA(안티센스 RNA antisense RNA)는 번역의 조절 역할을 담당한다. si RNA(소형 방해 RNA small interfering RNA)는 RNA 방해 유발. 특정 단백질의 생산을 억제함으로써 유전자 발현을 방해한다.
1. mRNA
본 발명의 관심 RNA(mRNAi)는 항원, 항체, 치료용 단백질, 펩타이드 및 융합 단백질로 이루어진 군에서 선택된 어느 하나일 수 있다. mRNAi는 치료 단백질 또는 펩타이드를 암화화하는 적어도 하나의 오픈 리딩 프레임을 포함한다. 병원성 항원, 종양성 항원, 알러지성 항원 또는 자가 면역성 항원과 같은 항원은 적어도 하나의 오픈 리딩 프레임에 의해 코딩된다. 거기에, 항원을 코딩하는 mRNAi의 투여는 상기 항원을 포함하는 질환에 대한 유전적 백신 접종 접근에 사용된다. 항체는 본 발명에 따른 mRNAi의 적어도 하나의 오픈 리딩 프레임에 의해 코딩된다.
융합 단백질
융합 단백질은 단일 단위로 전사되고 번역되어 단일 폴리 펩타이드를 생성하도록 결합된 별도의 유전자에 의해 코딩된 적어도 두 개의 도메인 이상으로 구성된 단백질이다. 기본적으로 두 가지 유형의 융합 단백질이 있다. 첫 번째는 종단 간 융합되고 일반적으로 링커에 의해 연결된 두 개의 단백질 또는 단백질 서브 유닛으로 구성되고 두 번째는 두 공여자의 아미노산이 융합 단백질에 산재되어 있다.
전자는 링커 펩타이드로 융합된 이종 단백질 폴리펩타이드; 및 특수목적 펩타이드와 단백질이 결합한 폴리펩타이드;를 포함하는 군에서 선택되어진 어느 하나일 수 있다.
융합 단백질은 통합된 단백질 도메인에 따라 분류될 수 있다. 종종 하나의 융합 파트너는 분자 인식 기능을 가지고 있는 반면 다른 파트너는 안정성 및 반감기 개선, 세포 독성 효과 또는 새로운 표적화 및 전달 경로와 같은 특정 기능이 있을 수 있다. 치료용 융합 단백질은 면역 독소, 사이토카인 융합, 단편 결정화 가능 (Fc) 융합, 알부민 융합 및 이들 부류에 속하지 않는 기타 일 수 있다. 현재 진행중인 대부분의 재조합 단백질 임상 시험은 단클론 항체를 포함하지만, 융합 단백질은 앞으로도 중요한 치료 분자가 될 것으로 예상된다.
병원성 항원(Pathogenic antigens)
본 발명에 따른 mRNAi는 병원성 항원 또는 이의 절편, 변이체 또는 유도체를 포함하는 단백질 또는 펩타이드를 코딩할 수 있다. 이와 같은 병원성 항원은 개체, 특히 포유동물 개체, 더욱 특히 인간에서 면역적 반응을 일으키는 병원성 유기체, 특히 박테리아, 바이러스 또는 원생동물(다세포(multicellular)) 병원성 유기체로부터 유래된다. 더욱 구체적으로, 바람직하게 병원성 항원은 표면 항원, 예를 들어, 바이러스 또는 박테리아 또는 원생동물 유기체의 표면에 위치한 단백질(또는 단백질의 절편, 예를 들어, 표면 항원의 외부 부분)이다.
병원성 항원은 바람직하게 감염성 질환과 관련된 병원체로부터 유래된 항원으로부터 선택된다. 특히 바람직한 항원은 인플루엔자 바이러스, 호흡기 합포체 바이러스(RSV), 단순 포진 바이러스(HSV), 인유두종바이러스(HPV), 인간 면역결핍 바이러스(HIV), 플라스모디움(Plsmodium), 스타필로코커스 아우레우스(Staphylococcus aureus), 댕기 바이러스(Dengue virus), 클라미디아 트라코마티스(Chlamydia trachomatis), 사이토메갈로바이러스(CMV), B형 간염 바이러스, 마이코박테리움 투버쿨로시스(Mycobacterium tuberculosis), 광견병 바이러스 및 황열병 바이러스로부터 선택된 병원체이다.
본 발명에 따른 mRNAi는 광견병 바이러스 단백질 또는 펩타이드 또는 이의 항원성 절편을 코딩한다. 바람직하게, 본 발명에 따른 mRNAi는 광견병 바이러스의 당단백질 G(RAV-G), 핵단백질 N(RAV-N), 인단백질 P(RAV-P), 매트릭스 단백질 M(RAV-M) 또는 RNA 폴리머라아제 L(RAV-L), 또는 이의 절편, 변이체 또는 유도체로 이루어진 군으로부터 선택된 항원성 단백질 또는 펩타이드를 코딩한다.
본 발명에 따른 mRNAi는 호흡기 합포체 바이러스(ripiratory syncytial virus)(RSV) 단백질 또는 펩타이드 또는 이의 항원성 절편을 코딩한다. 바람직하게, 본 발명에 따른 SM_mRNAi는 호흡기 합포체 바이러스(RSV)의 융합 단백질 F, 당단백질 G, 짧은 소수성 단백질 SH, 매트릭스 단백질 M, 핵단백질 N, 라지 폴리머라아제 L, M2-1 단백질, M2-2 단백질, 인단백질 P, 비-구조 단백질 NS1 또는 비-구조 단백질 NS2, 또는 이의 절편, 변이체 또는 유도체로 이루어진 군으로부터 선택된 항원성 단백질 또는 펩타이드를 코딩한다.
종양 항원
본 발명에 따른 mRNAi는 종양 항원, 상기 종양 항원의 절편, 변이체 또는 유도체를 포함하는 펩타이드 또는 단백질을 포함하는 단백질 또는 펩타이드를 코딩할 수 있으며, 항원 또는 상기 종양 항원의 절편, 변이체 또는 유도체이다.
종양유전자(KRAS, p53 등) 돌연변이체의 암항원, 종양 항원 NY-iO-1, 5T4, MAGE-C1, MAGE-C2, 서바이빈(Survivin), Muc-1, PSA, PSMA, PSCA, STEAP 및 PAP는 특히 바람직하다. 투여되는 mRNAi는 치료 단백질 또는 이의 절편, 변이체 또는 유도체를 포함하는 단백질 또는 펩타이드를 코딩한다.
본 발명의 치료 단백질은 임의의 유전성(inherited) 또는 후천성(acquired) 질환의 치료에 유익하거나, 개인(individual)의 상태를 향상시키는 펩타이드 또는 단백질이다. 특히, 치료 단백질은 치료제의 생성에 큰 역할을 하며, 다른 기능 중 유전적 오류를 변형 및 수리, 암세포 또는 병원체 감염된 세포를 파괴, 면역계 장애를 치료, 대사 또는 내분비 장애를 치료할 수 있다. 예를 들어, 에리스로포이에틴(EPO), 단백질 호르몬은 신장 합병증의 일반적인 원인인 적혈구 결핍 환자를 치료하는데 이용될 수 있다. 또한, 어쥬번트 단백질, 치료 항체는 치료 단백질 및 예를 들어, 폐경기 여성의 치료에 이용될 수 있는 호르몬 대체 요법(hormone replacement therapy)에 의해서도 포함된다. 더욱 최근 접근에서, 환자의 체세포는 분쟁(disputed) 줄기세포 요법을 대체하는 다능성 줄기세포로 역분화하는데 사용된다. 또한, 체세포의 역분화에 사용되거나 줄기세포의 분화에 사용되는 이들 단백질은 치료 단백질로서 본 발명에 정의된다. 또한, 치료 단백질은 예를 들어, 상처 치료, 조직 재생, 신생 혈관 생성 등 다른 목적을 위해 사용될 수 있다.
따라서, 치료 단백질은 예를 들어, 감염성 질환, 신생물(neoplasm)(예를 들어, 암 또는 종양 질환), 혈액 및 혈액-형성 기관 질환, 내분비, 영양성 및 대사 질환, 신경계 질환, 순환계 질환, 호흡계 질환, 소화계 질환, 피부 및 피하 조직 질환, 근골격계 및 결합 조직 질환 및 비뇨생식계(genitourinary system) 질환과 같은 다양한 질환(독립적으로 유전성 또는 후천성인 경우)의 치료를 포함하는 다양한 목적에 사용될 수 있다.
그 중에서도 대사 또는 내분비 장애의 치료에 사용될 수 있는 특히 바람직한 치료 단백질은 기능성 단백질의 이의 부족한 내부 생산량을 충분한 양으로 교체하여 개체를 치료하기 위한 것이므로 치료 단백질로 이해된다. 따라서, 이와 같은 치료 단백질은 일반적으로 포유동물, 특히 인간 단백질이다. 혈액 장애, 순환계 질환, 호흡계 질환, 암 또는 종양 질환, 감염성 질환 또는 면역 결핍증의 치료를 위해서는 치료 단백질이 사용될 수 있다: 더욱이, 어쥬번트(adjuvant) 또는 면역 자극 단백질도 치료 단백질이란 용어에 포함된다. 어쥬번트 또는 면역 자극 단백질은 개체 내 면역 반응을 유도, 변형 또는 개선하여 특정 질환을 치료하거나 개체의 상태를 완화하는데 사용될 수 있다. 어쥬번트 단백질은 예를 들어, TLR에 대한 외부 TLR 리간드의 결합 반응으로서(포유동물에서) 선천적 면역 반응을 유도할 수 있는 임의의 인간 단백질 또는 펩티드를 일반적으로 포함하는 포유동물, 특히 인간 어쥬번트 단백질로부터 선택될 수 있다. 와 같은 단백질들로 이루어진 군으로부터 선택된다. 포유동물, 특히 인간 어쥬번트 단백질은 또한 열 충격 단백질, 또는 이와 같은 인간 어쥬번트 단백질 중 임의의 것의 임의의 종 동족체로 이루어진 군으로부터 선택될 수도 있다. 포유동물, 특히 인간 어쥬번트 단백질은 또한 선천적 면역 반응을 유도 또는 강화하는 단백질, 를 포함할 수 있다.
치료 단백질
혈액 장애, 순환계 질환, 호흡계 질환, 암 또는 종양 질환, 감염성 질환 또는 면역 결핍증 치료를 위한 치료 단백질 또는 어쥬번트 단백질은 일반적으로 치료되어야 할 동물에 따라서 포유동물 기원, 바람직하게는 인간 기원의 단백질이다. 인간 개체는, 예를 들어, 인간 기원의 치료 단백질에 의해 치료되는 것이 바람직하다.
병원성 어쥬번트 단백질은, 일반적으로 (포유동물에서) 선천적 면역 반응을 유도할 수 있는 병원성 어쥬번트 단백질을 포함하며, 더욱 바람직하게는 박테리아, 원생동물, 바이러스 또는 곰팡이 등으로부터 유래된 병원성 어쥬번트 단백질, 예를 들어, 박테리아 (어쥬번트) 단백질, 원생동물 (어쥬번트) 단백질(예를 들어, 톡소플라즈마곤디(Toxoplasma gondii)의 프로필린 유사 단백질), 바이러스 (어쥬번트) 단백질, 또는 곰팡이 (어쥬번트) 단백질 등으로부터 선택되는 병원성 어쥬번트 단백질을 포함한다.
박테리아 (어쥬번트) 단백질은 또한 박테리아 플라젤린(flagellin)을 포함할 수 있다. 원생동물 (어쥬번트) 단백질은 병원성 어쥬번트 단백질의 추가 예이다. 원생동물 (어쥬번트) 단백질은 어쥬번트 특성을 나타내는 임의의 원생동물 단백질로부터 선택될 수 있으며, 바이러스 (어쥬번트) 단백질은 병원성 어쥬번트 단백질의 또 다른 예이다. 바이러스 (어쥬번트) 단백질은 어쥬번트 특성을 나타내는 임의의 바이러스 단백질로부터 선택될 수 있으며, 더욱 바람직하게는, 이에 한정되는 것은 아니지만, 호흡기 합포체 바이러스(Ripiratory Syncytial Virus) 융합 당단백질(F-단백질), MMT 바이러스 유래 외피 단백질(envelope protein), 마우스 백혈병 바이러스 단백질, 야생형 홍역 바이러스의 헤마글루티닌(Hemagglutinin) 단백질 등으로 이루어진 군으로부터 선택될 수 있다. 곰팡이 (어쥬번트) 단백질도 병원성 어쥬번트 단백질의 추가의 예이다. 본 발명에서, 곰팡이 (어쥬번트) 단백질은 어쥬번트 특성을 나타내는 임의의 곰팡이 단백질로부터 선택될 수 있으며, 더욱 바람직하게는, 곰팡이 면역 조절 단백질(fungal immunomodulatory protein)(FIP; LZ-8) 등으로 이루어진 군으로부터 선택될 수 있다. 마지막으로, 어쥬번트 단백질은 추가로 키홀-림펫 헤모시아닌(keyhole-limpet hemocyanin)(KLH), OspA 등으로 이루어진 군으로부터 선택될 수도 있다.
치료 단백질은 호르몬 대체 치료법, 특히 폐경기 여성의 치료에 사용될 수 있다. 이들 치료 단백질은 오에스테로겐(oitrogens), 프로게스테론 또는 프로게스틴(progitins), 및 종종 테스토스테론으로부터 선택되는 것이 바람직하다.
더욱이, 치료 단백질은 체세포를 다능성(pluripotent) 또는 전능성(omnipotent) 줄기세포로 역분화하는데 사용될 수 있다. 이러한 목적을 위하여, 여러 인자 특히, Oct-3/4, Sox 유전자 군(Sox1, Sox2, Sox3 및 Sox15), Klf 군(Klf1, Klf2, Klf4 및 Klf5), Myc 군(c-myc, L-myc 및 N-myc), Nanog 및 LIN28이 설명되어 있다.
치료 항체도 치료 단백질로서 본 발명에 정의되어 있다. 이들 치료 항체는 그 중에서도 암 또는 종양 질환의 치료에 사용되는 항체, 그 중에서도 혈액 장애의 치료에 사용되는 항체, 그 중에서도 면역 조절에 사용되는 항체, 당뇨병 치료에 사용되는 항체, 알츠하이머 질환 치료에 사용되는 항체, 천식 치료에 사용되는 항체를 포함할 수 있다,
본 발명에 따른 mRNAi의 코딩 영역은 모노-, 디-, 또는 심지어 멀티시스트론 RNA, 즉, 1, 2 또는 그 이상의 단백질 또는 펩타이드의 코딩 서열을 운반하는 RNA로서 발생할 수 있다. 이와 같은 디-, 또는 심지어 멀티시스트론 RNA 내 코딩 서열은 예를 들어, 본 발명에 설명된 바와 같은 적어도 하나의 내부 리보솜 도입 위치(IRES) 또는 여러 단백질 또는 펩타이드를 포함하는 폴리펩타이드의 절단을 유도하는 신호 펩타이드에 의해 분리될 수 있다.
2. dsRNA
본 발명은 이중 가닥 RNA(dsRNA) 및 RNAi 구성체에 관한 것이다. 본 발명에서 사용될 때의 "dsRNA"라는 용어는 siRNA를 비롯하여 RNA 간섭(RNAi)을 할 수 있는 이중 가닥 RNA 분자를 말한다. 또한, RNAi는, 초기에는, 이중 가닥 RNA(dsRNA)가 특이적인 전사 후 방식으로 유전자 발현을 차단하는 식물 및 벌레에서 관찰된 현상에 적용되었던 용어이다. RNAi는 시험관내 또는 생체내에서 유전자 발현을 억제 또는 감소시키는 유용한 방법을 제공한다.
"단쇄 간섭 RNA", "siRNA" 또는 "단쇄 간섭 핵산"이란 용어는 세포에 의해 적절히 가공될 경우 RNAi 또는 유전자 침묵을 매개할 수 있는 임의의 핵산을 말한다. 상기 siRNA는 자기 상보성 센스 영역 및 안티센스 영역을 포함하는 이중 가닥 폴리뉴클레오티드 분자일 수 있으며, 여기서 상기 안티센스 영역은 표적 유전자에 대한 상보성을 포함한다. 상기 siRNA는 자기 상보성 센스 영역 및 안티센스 영역을 갖는 단일 가닥 헤어핀 폴리뉴클레오티드일 수 있으며, 여기서 상기 안티센스 영역은 표적 유전자에 대한 상보성을 포함한다. 상기 siRNA는 자기 상보성 센스 영역 및 안티센스 영역을 포함하는 2개 이상의 루프 구조 및 줄기를 갖는 원형의 단일 가닥 폴리뉴클레오티드일 수 있으며, 여기서 상기 안티센스 영역은 표적 유전자에 대한 상보성을 포함하고, 상기 원형의 폴리뉴클레오티드는 RNAi를 매개할 수 있는 활성 siRNA를 생성할 수 있도록 생체내 또는 시험관내에서 가공될 수 있다. 상기 siRNA는 또한 표적 유전자에 대한 상보성을 갖는 단일 가닥 폴리뉴클레오티드를 포함할 수 있으며, 여기서 상기 단일 가닥 폴리뉴클레오티드는 말단 포스페이트기, 예컨대 5'-포스페이트, 또는 5',3'-디포스페이트를 추가로 포함할 수 있다. 특정 실시형태에서, 상기 siRNA는 표적 핵산에 결합하여 표적 핵산의 활성을 변경하는 비효소성 핵산이다. siRNA의 결합 및/또는 활성은 하나 이상의 단백질 또는 단백질 복합체, 예컨대 RNA 유도 침묵 복합체(RNA Induced Silencing Complex 또는 RISC)와의 상호작용에 의해 촉진될 수 있다. 특정 실시형태에서, 상기 si RNA는 si RNA 분자의 한쪽 가닥의 하나의 연속된 서열을 따라 표적 서열에 상보성인 서열을 포함한다.
본 발명의 siRNA는 억제할 유전자("표적" 유전자)에 대한 mRNA의 적어도 일부분의 뉴클레오티드 서열에 생리학적 조건 하에(예를 들어, 세포 내 환경에서) 하이브리드화하는 뉴클레오티드 서열을 포함한다. 이중 가닥 RNA는 단지, 이것이 RNAi를 매개하는 능력을 가질 정도로 천연 RNA와 충분히 유사하면 된다.
따라서, 본 발명은 유전자 돌연변이, 균주 다형성 또는 진화적 다양화로 인해 예측할 수 있는 서열 변이를 허용할 수 있다는 장점을 갖는다. 표적 서열과 siRNA 서열 간의 용인되는 뉴클레오티드 불합치의 수는 5 염기쌍 중 1 염기쌍, 또는 10 염기쌍 중 1 염기쌍, 또는 20 염기쌍 중 1 염기쌍, 또는 50 염기쌍 중 1 염기쌍 이하이다.
siRNA 이중 가닥의 중심부에서의 불합치가 가장 중요하며, 표적 RNA의 절단을 실질적으로 파괴할 수 있다. 이와는 달리, 표적 RNA에 상보성인 siRNA 가닥의 3' 말단의 뉴클레오티드는 표적 인식의 특이성에 크게 기여하지 않는다. 서열 동일성은, 공지된 서열 비교 및 정렬 알고리즘[Gribskov and Devereux, Sequence Analysis Primer, Stockton Press, 1991]과, 예를 들어, 디폴트 파라미터를 이용한 BESTFIT 소프트웨어 프로그램에서 실행되는 Smith-Waterman 알고리즘(예를 들어, University of Wisconsin Genetic Computing Group)에 의한 뉴클레오티드 서열 간의 퍼센트 차이의 계산에 의해 최적화될 수 있다. si RNA와 표적 유전자의 일부분 사이의 90%, 95%, 96%, 97%, 98%, 또는 99% 초과의 서열 동일성, 또는 심지어 100%의 서열 동일성이 바람직하다. 대안으로, RNA의 이중 가닥 영역은 엄격한 조건(예를 들어, 400 mM NaCl, 40 mM PIPES pH 6.4, 1 mM EDTA, 50℃ 또는 70℃에서 12*16 시간 동안의 하이브리드화 및 이에 이은 세척) 하에서 표적 유전자 RNA의 일부분과 하이브리드화할 수 있는 뉴클레오티드 서열로서 기능적으로 정의될 수 있다.
dsRNA의 이중 가닥 구조는 하나의 자기 상보성 RNA 가닥, 2개의 상보성 RNA 가닥, 또는 DNA 가닥 및 상보성 RNA 가닥에 의해 형성될 수 있다. 경우에 따라, RNA 이중 가닥 형성은 세포 내 또는 세포 외에서 시작될 수 있다.
RNA는 세포당 1 카피 이상의 전달이 가능한 양으로 도입될 수 있다. 더 많은 용량(예를 들어, 세포당 적어도 5, 10, 100, 500 또는 1000 카피)의 이중 가닥 물질은 더 효과적인 억제를 발휘할 수 있는 한편, 더 적은 용량은 또한 특정 용도에 유용할 수 있다. 억제는 RNA의 이중 가닥 영역에 해당하는 뉴클레오티드 서열이 억제를 위한 표적이 된다는 점에서 서열 특이적이다.
본 발명의 siRNA는 19~30개 뉴클레오티드의 길이, 21~27개 뉴클레오티드의 길이, 21~25개 뉴클레오티드의 길이, 또는 21~23개 뉴클레오티드의 길이의 이중 가닥 영역을 포함한다. siRNA는 뉴클레아제 복합체를 동원하여 특이적 서열과 쌍을 이룸으로써 그 복합체를 표적 유전자 RNA로 안내하는 것으로 이해된다. 그 결과, 상기 표적 유전자 RNA는 단백질 복합체 내의 뉴클레아제에 의해 분해된다. 상기 siRNA 분자는 3' 하이드록실기를 포함한다. 상기 siRNA 구성체는, 예를 들어, 효소 다이서(dicer) 존재 하에, 예를 들어, 계내에서 더 긴 이중 가닥 RNA를 가공하는 것에 의해 생성될 수 있다.
드로소필라(Drosophila) 시험관내 시스템이 사용된다. dsRNA를 드로소필라 배아 유래의 가용성 추출물과 배합하여 배합물을 형성한다. 이 배합물을, dsRNA가 약 21~27개 뉴클레오티드의 RNA 분자로 가공되는 조건 하에 유지한다. 상기 siRNA 분자를, 공지된 다수의 기법을 이용하여 정제할 수 있다. siRNA를 정제하기 위해 겔 전기영동을 이용할 수 있다. 대안으로, siRNA를 정제하기 위해 비변성 컬럼 크로마토그래피와 같은 비변성법을 이용할 수 있다. 또한, siRNA를 정제하기 위해 크로마토그래피(예를 들어, 크기 배제 크로마토그래피), 글리세롤 구배 원심분리, 항체를 사용한 친화성 정제를 이용할 수 있다.
본 발명에서 단일 또는 이종의 siRNA들을 병렬로 연결된 long dsRNA를 합성하여 효소 다이서를 이용하여 구성성분 siRNA를 제조하여 수확할 수도 있다.
본 발명의 dsRNA(예를 들어, siRNA)는 화학 합성법 또는 재조합 핵산 기법에 의해 생성할 수 있다. 처리된 세포의 내인성 RNA 폴리머라제가 생체내 전사를 매개할 수 있거나, 또는 클로닝된 RNA 폴리머라제가 시험관내 전사에 사용될 수 있다. dsRNA 또는 siRNA 분자가 RNA만을 포함하는 분자에 한정될 필요는 없으며, 화학적으로 변형된 뉴클레오티드 및 비뉴클레오티드를 추가로 포함한다. 예를 들어, 상기 dsRNA는, 예를 들어 세포 내 뉴클레아제에 대한 감수성을 감소하고/시키거나, 생체이용률을 개선하고/시키거나, 제제화 특성을 개선하고/시키거나, 다른 약동학적 특성을 변화시키기 위해, 포스페이트-당 골격 또는 뉴클레오시드에 대한 변형을 포함할 수 있다. 질소 또는 황 헤테로 원자 중 하나 이상을 포함하도록 천연 RNA의 포스포디에스테르 결합을 변형시킬 수 있다. RNA 구조에 있어서의 변형은 dsRNA에 대한 일반적 반응을 피하면서 특이적인 유전적 억제가 가능하도록 조정할 수 있다. 마찬가지로, 아데노신 데아미나제의 활성을 차단하기 위해 염기를 변형시킬 수 있다.
dsRNA는 효소에 의해, 또는 부분/완전 유기 합성에 의해 생성할 수 있으며, 시험관내 효소적 합성 또는 유기 합성에 의해 임의의 변형된 리보뉴클레오티드를 도입할 수 있다. RNA 분자의 화학적 변형 방법을 dsRNA를 변형시키는 데 적합하도록 변경할 수 있다. 예를 들어, dsRNA 또는 siRNA의 골격은 포스포로티오에이트, 포스포아미데이트, 포스포디티오에이트, 키메라 메틸포스포네이트-포스포디에스테르, 펩티드 핵산, 5-프로피닐-피리미딘 함유 올리고머 또는 당 변형(예를 들어, 2'-치환 리보뉴클레오시드, a-입체배치)으로 변형시킬 수 있다. 특정 경우, 본 발명의 dsRNA는 2'-하이드록시(2'-OH) 함유 뉴클레오티드가 결여되어 있다. 특정 실시형태에서, 상기 siRNA 분자는 포스포로티오에이트 센스 가닥을 포함한다. 상기 siRNA 분자는 포스포디에스테르 안티센스 가닥을 포함한다.
상기 siRNA 분자의 적어도 한 가닥은 1~10개 뉴클레오티드의 길이, 약 1~5개 뉴클레오티드의 길이, 1~3개 뉴클레오티드의 길이, 또는 2~4개 뉴클레오티드의 길이의 3' 돌출부를 갖는다. siRNA는 3' 돌출부를 갖는 한쪽 가닥을 포함할 수 있으며, 다른 쪽 가닥은 3' 말단이 평활 말단이다(예를 들어, 3' 돌출부를 갖지 않는다). siRNA는 양쪽 가닥에 3' 돌출부를 포함할 수 있다. 돌출부의 길이는 각 가닥에 대해 동일하거나 상이할 수 있다. siRNA의 안정성을 추가로 증대시키기 위해, 3' 돌출부를 분해로부터 안정화시킬 수 있다. 상기 RNA를 아데노신 또는 구아노신 뉴클레오티드와 같은 퓨린 뉴클레오티드를 포함시켜 안정화시킨다. 대안으로, 피리미딘 뉴클레오티드의 변형된 유사체에 의한 치환, 예를 들어, 유리딘 뉴클레오티드 3' 돌출부의 2'-데옥시티이니딘에 의한 치환은 허용되며, RNAi의 효율에 영향을 미치지 않는다. 2' 하이드록실의 부재는 조직 배양 배지에서 돌출부의 뉴클레아제 내성을 현저히 증대시키며 생체내에서 유익할 수 있다.
본 발명의 dsRNA는 또한 긴 이중 가닥 RNA의 형태일 수 있다. 예를 들어, dsRNA는 적어도 25, 50, 100, 200, 300 또는 400개 염기이다. 일부 경우, dsRNA는 400~800개 염기의 길이이다. 경우에 따라, dsRNA는 세포 내에서 분해되어, 예를 들어 세포 내에서 siRNA 서열을 생성한다.
그러나, 생체내에서의 긴 이중 가닥 RNA의 사용이 항상 실용적인 것은 아닌데, 그 이유는 아마도 서열 독립적 dsRNA 반응에 의해 유발될 수 있는 유해 효과 때문인 것으로 생각된다. 인터페론 또는 PKR의 효과를 감소시키는 국소적 전달 시스템 및/또는 제제의 사용이 바람직하다.
dsRNA 또는 siRNA는 헤어핀 구조(또는 헤어핀 RNA)의 형태이다. 상기 헤어핀 RNA는 외인적으로 합성되거나 생체내에서 RNA 폴리머라제 III 프로모터로부터의 전사에 의해 형성될 수 있다. 포유동물 세포에서의 유전자 침묵을 위한 이러한 헤어핀 RNA의 제조 및 사용되고 있다. 이러한 헤어핀 RNA는 표적 유전자의 연속적이고 안정한 억제가 담보되도록 세포 또는 동물에서 엔지니어링된다. siRNA는 세포 내에서의 헤어핀 RNA의 가공에 의해 생성될 수 있는 것으로 당업계에 알려져 있다.
PCT 출원 WO 01/77350은, 진핵생물 세포에서 동일한 이식 유전자의 센스 RNA와 안티센스 RNA 둘 다가 생성되도록 하는 이식 유전자의 양방향 전사를 위한 예시적인 벡터에 관해 기재한다. 따라서, 재조합 벡터는 반대 방향으로 배열되어 관심있는 dsRNA에 대한 이식 유전자의 측면에 위치하는 2개의 중복 전사 유닛을 갖는 바이러스 레플리콘을 포함하며, 여기서 2개의 중복 전사 유닛은 무세포유래 세포에서의 동일한 이식 유전자 단편으로부터 센스 RNA와 안티센스 RNA 둘 다를 생성한다.
3. 압타머
압타머는 표적 분자들에 대해 높은 특이적 결합성을 가지는, 표적 화합물 또는 분자의 특이적 리간드이다. 압타머는 고전적인 왓슨-클릭(Watson-Crick) 염기쌍 형성 이외의 상호작용을 통하여 분자에 대해 고도의 특이적 결합 친화도를 보이는 핵산 분자이다. 압타머는 선택된 표적에 특이적으로 결합하여 표적의 활성을 조정할 수 있는 것으로서, 예를 들면 압타머 결합을 통해 표적의 작용 능력을 차단할 수 있다. 무작위 서열 올리고뉴클레오티드의 풀(pool)로부터 생체외 선별 과정에 의해, 성장 인자, 전사 인자, 효소, 면역글로불린 및 수용체 등을 포함한 단백질에 대응하는 압타머가 생성된 바 있다.
전형적인 압타머는 크기가 10~15 kDa(30~45 뉴클레오티드)으로서, 나노 몰 이하의 친화도로 그 표적에 결합하며, 밀접하게 관련된 표적들에 대해 차별성을 나타낸다(일례로, 압타머는 통상적으로 동일한 유전자군에 속하는 다른 단백질에 결합하지 않는다).
압타머의 선정방법으로는, "SELEX™"(Systematic Evolution of Ligands by Exponential Enrichment)" 방법이 널리 사용되고 있다. SELEX 방법은 표적 분자에 높은 특이적 결합성을 가진 핵산 분자의 생체외 전개에 관한 방법으로, 1990. 6. 11 출원의 미국특허 출원 제07/536,428호(현재 포기), 미국특허 제5,475,096호(발명의 명칭:"Nucleic Acid Ligands") 및 미국특허 제5,270,163호(발명의 명칭: "Nucleic Acid Ligands") 등에 기재되어 있다.
SELEX 방법은, 핵산이 다양한 2 차원 및 3 차원 구조를 형성하기에 충분한 능력과, 실질적으로 임의의 화학적 화합물과 함께(단량체 또는 중합체 상관없이) 리간드로서 작용(즉, 특이적 결합 쌍을 형성)하기에 충분한, 단량체 내에서 이용 가능한 화학적 다기능성(chemical versatility)을 보유한다는 것을 바탕으로 한다. 임의의 크기 또는 조성을 갖는 분자가 표적으로 이용될 수 있다.
일련의 구조학적 연구 결과, 압타머는 항체-항원 복합체에서 친화도와 높은 선택적 결합을 부여하는 동일한 유형의 결합 상호작용(예를 들면, 수소 결합, 정전기적 상보성, 소수성 접촉, 입체적 배제(steric exclusion))을 이용할 수 있는 것으로 나타났다. 압타머는 높은 선택성 및 친화도, 생물학적 효능 및 우수한 약동학적 특성을 포함하여, 치료제 및 진단제로서 사용하기에 바람직한 다수의 특징들을 가지고 있다. 또한, 압타머는 항체 및 기타 생물학적 단백질을 능가하는, 다음에 예시한 바와 같은 특이적인 경쟁적 이점이 있다.
4. 리보자임
본 발명에서 사용된 "리보자임"이라는 용어는 효소처럼 작용하는 RNA 분자 또는 그 RNA 분자를 포함하는 단백질로 구성되는 분자로 RNA 효소 또는 촉매적 RNA라고도 불린다. 명확한 3차 구조를 갖는 RNA 분자로 화학반응을 수행하며 촉매적 또는 자기촉매적 특성을 가진다. 일부 리보자임은 자기 또는 다른 RNA 분자를 절단하여 활성을 저해하고, 다른 리보자임은 리보솜의 아미노전달효소(aminotransferase) 활성을 촉매하는 것으로 알려져다.
이러한 리보자임에는 망치머리(hammerhead) 리보자임, VS 리보자임 및 헤어핀(hairpin) 리보자임 등이 포함될수 있다.
본 발명에 따른 리보자임은 트랜스-스플라이싱 반응을 통해 암 특이적 유전자의 활성을 저해시켜서 선택적인 항암 효과를 나타낼 수 있을 뿐만 아니라 암 치료 유전자와 접합된 형태로 발현되어 암 치료 유전자를 활성화시킬수 있다. 따라서, 암 특이적 유전자를 불활성화하고, 암 치료 유전자를 활성화시킬 수 있는 특성을 나타낸다.
리보자임은 특별한 작은 분자의 존재 하에서만 유전자들을 교환하는 촉매성 RNA(Catalytic RNA)이며, 자신들을 턴 오프(turn off), 턴 온(turn on) 할 수 있는 리보자임을 통해 유전자의 스플라이싱(splicing)을 조절할 수 있다. 자신들로부터 RNA를 스플라이싱할 수 있는 거대 리보자임인 그룹1 인트론(group 1 intron)이 있다. 트랜스 스플라이싱 리보자임(Trans splicing ribozyme)는 자신들의 유전자의 끝 부분에서 유전자를 교체하며 이를 타깃으로 하고 있는 목표 유전자와 교환하게 된다.
5, 원형 RNA
RNA 원형화에는 세 가지 일반적인 전략이 있다. 브롬화 시아노겐 또는 유사한 응축제를 사용하는 화학적 방법, RNA 또는 DNA 리가아제를 사용하는 효소 방법, 자가 접합 인트론를 사용하는 리보자이 방법이다.
상기 리보자이 방법에 의한 제조되는 상기 원형 RNA(circular RNA)는 발현단위 유형으로 원형화 요소(circularizing element), 적어도 하나의 코딩 영역, 및 코딩 영역에 작용가능하게 연결된 내부 리보솜 진입 부위 (IRES)를 포함한다.
원형 RNA는 3' 포스트 스플라이싱 그룹 I 인트론 단편(post splicing group I intron fragment), 선택적으로 제1 스페이서, 내부 리보솜 유입 부위(IRES), 발현 서열, 선택적으로 제2 스페이서 및 5' 포스트 스플라이싱 그룹 I 인트론 단편을 포함하는 원형 RNA 폴리뉴클레오타이드가 제공된다. 이들 영역은 그 순서대로이다. 일부 실시형태에서, 원형 RNA는 본 발명에 제공된 방법에 의해서 또는 본 발명에 제공된 발현단위로부터 제조된다.
본 발명에 제공된 발현단위(예를 들어, 5' 상동성 영역, 3' 그룹 I 인트론 단편, 선택적으로 제1 스페이서, 내부 리보솜 유입 부위(IRES), 발현 서열, 선택적으로 제2 스페이서, 5' 그룹 I 인트론 단편 및 3' 상동성 영역을 포함함)의 전사는 원형화시킬 수 있는 전구체 선형 RNA 폴리뉴클레오타이드를 형성한다. 이러한 전구체 선형 RNA 폴리뉴클레오타이드는 구아노신 뉴클레오타이드 또는 뉴클레오사이드(예 를 들어, GTP) 및 2가 양이온(예를 들어, Mg2+)의 존재 하에서 인큐베이션되는 경우 원형화된다.
상기 원형화 요소는 발현단위 5' 말단의 3' 그룹 I 인트론 단편 제1 서열 및 발현단위 3' 말단의 5' 그룹 I 인트론 단편 제2 서열을 포함한다. 상기 코딩 영역은 원형화 요소의 제1 서열과 원형화 요소의 제2 서열 사이에 위치한다. 3' 그룹 I 인트론 단편"은 스플라이스 부위 다이뉴클레오타이드 및 선택적으로 자연 엑손 서열의 스트레치를 포함하는 자연 그룹 I 인트론의 3'-근위 단부와 75% 이상의 유사성을 갖는 서열을 지칭한다. "5' 그룹 I 인트론 단편"은 스플라이스 부위 다이뉴클레오타이드 및 선택적으로 자연 엑손 서열의 스트레치를 포함하는 자연 그룹 I 인트론의 5'-근위 단부와 75% 이상의 유사성을 갖는 서열을 지칭한다.
상기 원형화 요소의 3' 그룹 I 인트론 단편 제1 서열은 박테리오파지 RNA의 티미딜레이트 신테타제 (td)로부터의 제1 인트론 부분을 포함하며, 원형화 요소의 5' 그룹 I 인트론 단편 제2 서열은 박테리오파지 RNA의 티미딜레이트 신테타제 (td)로부터의 제2인트론 부분을 포함한다. 상기 원형화 요소의 제1 서열은 진핵 스플라이스 수용자 서열(eukaryotic splice acceptor sequence)을 포함하며, 원형화 요소의 제2 서열은 진핵 스플라이스 공여자 서열(eukaryotic splice donor sequence)을 포함한다. "스플라이스 부위"는 스플라이싱 반응 동안 포스포다이에스터 결합의 절단이 일어나는 다이뉴클레오타이드 또는 다이뉴클레오타이드를 지칭한다. "5' 스플라이스 부위"는 인트론의 자연 5' 다이뉴클레오타이드, 예를 들어, 그룹 I 인트론을 지칭하며, "3' 스플라이스 부위"는 인트론의 자연 3' 다이뉴 클레오타이드를 지칭한다.
"내부 리보솜 유입 부위" 또는 "IRES"는 10nt 내지 1000nt 또는 그 초과의 크 기 범위의 RNA 서열 또는 구조 요소이며, 이것은 전형적인 RNA 캡 구조의 부재 하에서의 폴리펩타이드의 번역을 개시할 수 있다. IRES는 전형적으로 약 500nt 내지 약 700nt 길이이다.
상기 IRES는 타우라 증후군 바이러스(Taura syndrome virus), 트리아토마 바이러스(Triatoma virus), 타일러 뇌척수염 바이러스(Theiler's encephalomyelitis virus), 유인원 바이러스 40, 붉은 불개미 바 이러스 1(Solenopsis invicta virus 1), 로팔로시품 파디 바이러스(Rhopalosiphum padi virus), 세망내피증 바 이러스(Reticuloendotheliosis virus), 인간 폴리오바이러스 1, 갈색날개 노린재 장 바이러스(Plautia stali intestine virus), 카슈미르 벌 바이러스(Kashmir bee virus), 인간 리노바이러스 2(Human rhinovirus 2), 호 말로디스카 코아굴라타 바이러스-1(Homalodisca coagulata virus-1), 인간 면역결핍 바이러스 타입 1, 호말로디 스카 코아굴라타 바이러스-1(Homalodisca coagulata virus-1), 히메토비 P 바이러스(Himetobi P virus), C형 간염 바이러스, A형 간염 바이러스, GB형 간염 바이러스, 구제역 바이러스(Foot and mouth disease virus), 인 간 엔테로바이러스 71(Human enterovirus 71), 말 비염 바이러스(Equine rhinitis virus), 엑트로피스 오블리피코르나-유사 바이러스(Ectropis obliqua picorna-like virus), 뇌심근염 바이러스 쿠아(Encephalomyocarditis virus), 초파리 C 바이러스(Drosophila C Virus), 인간 콕사키바이러스 B3(Human coxsackievirus B3), 크루시퍼 토바모바이러스(Crucifer tobamovirus), 귀뚜라미 마비병 바이러스(Cricket paralysis virus), 소 바이러스 설사 바이러스 1(Bovine viral diarrhea virus 1), 블랙 퀸 세포 바이러스 (Black Queen Cell Virus), 진딧물 치명 마비 바이러스(Aphid lethal paralysis virus), 조류 뇌척수염 바이러 스(Avian encephalomyelitis virus), 급성 벌 마비 바이러스(Acute bee paralysis virus), 히비스커스 위황병 원형반점 바이러스(Hibiscus chlorotic ringspot virus), 돼지 열병 바이러스(Classical swine fever virus), 인간 FGF2, 인간 SFTPA1, 인간 AML1/RUNX1, 초파리 안테나페디아(Drosophila antennapedia), 인간 AQP4, 인간 AT1R, 인간 BAG-1, 인간 BCL2, 인간 BiP, 인간 c-IAPl, 인간 c-myc, 인간 eIF4G, 마우스 NDST4L, 인간 LEF1, 마우스 HIF1 알파, 인간 n.myc, 마우스 Gtx, 인간 p27kipl, 인간 PDGF2/c-sis, 인간 p53, 인간 Pim-1, 마우스 Rbm3, 초파리 리퍼(Drosophila reaper), 캐닌 스캠퍼(Canine Scamper), 초파리 Ubx, 인간 UNR, 마우스 UtrA, 인간 VEGF-A, 인간 XIAP, 털없는 초파리(Drosophila hairless), 에스. 세레비지애(S. cerevisiae) TFIID, 에스. 세레비지애 YAP1, 담배 식각 바이러스(tobacco etch virus), 터닙 주름 바이러스(turnip crinkle virus), EMCV-A, EMCV-B, EMCV-Bf, EMCV-Cf, EMCV pEC9, 피코비르나바이러스, HCV QC64, 인간 코사바이러스 (Human Cosavirus) E/D, 인간 코사바이러스 F, 인간 코사바이러스 JMY, 리노바이러스(Rhinovirus) NAT001, HRV14, HRV89, HRVC-02, HRV-A21, 살리바이러스(Salivirus) A SH1, 살리바이러스 FHB, 살리바이러스 NG-J1, 인 간 파레코바이러스(Human Parechovirus) 1, 크로히바이러스(Crohivirus) B, Yc-3, 로사바이러스(Rosavirus) M- 7, 산바바이러스(Shanbavirus) A, 파시바이러스(Pasivirus) A, 파시바이러스 A 2, 에코바이러스(Echovirus) E14, 인간 파레코바이러스(Human Parechovirus) 5, 아이치 바이러스(Aichi Virus), A형 간염 바이러스 HA16, 포피바이러스(Phopivirus), CVA10, 엔테로바이러스(Enterovirus) C, 엔테로바이러스 D, 엔테로바이러스 J, 인 간 페기바이러스(Human Pegivirus) 2, GBV-C GT110, GBV-C K1737, GBV-C 아이오와(Iowa), 페기바이러스 (Pegivirus) A 1220, 파시바이러스(Pasivirus) A 3, 사펠로바이러스(Sapelovirus), 로사바이러스(Rosavirus) B, 바쿤사(Bakunsa) 바이러스, 트레모바이러스(Tremovirus) A, 돼지 파시바이러스(Swine Pasivirus) 1, PLV- CHN, 파시바이러스 A, 시시니바이러스(Sicinivirus), 헤파시바이러스(Hepacivirus) K, 헤파시바이러스 A, BVDV1, 보더병 바이러스(Border Disease Virus), BVDV2, CSFV-PK15C, SF573 디시스트로바이러스 (Dicistrovirus), 후베이 피코르나-유사 바이러스(Hubei Picorna-like Virus), CRPV, 살리바이러스(Salivirus) A BN5, 살리바이러스 A BN2, 살리바이러스 A 02394, 살리바이러스 A GUT, 살리바이러스 A CH, 살리바이러스 A SZ1, 살리바이러스 FHB, CVB3, CVB1, 에코바이러스 7, CVB5, EVA71, CVA3, CVA12, EV24 또는 eIF4G에 대한 압타머로부터 유래된다.
상기 코딩 영역은 치료 펩티드를 코딩한다. IRES는 적어도 2개의 코딩 영역에 작용가능하게 연결된다. 폴리뉴클레오티드는 추가적으로 제2 코딩 영역에 작용가능하게 연결된 제2 IRES를 포함한다. 발현단위는 추가적으로 삼중 나선 모티프, 미번역 영역(UTR), RNA 안정성 요소, RNA 외수송 요소 또는 친화성 정제 압타머(aptamer) 중 1종 이상을 포함한다:
적어도 하나의 코딩 영역, 및 코딩 영역에 작용가능하게 연결된 내부 리보솜 진입 부위 (IRES)를 포함하는 원형 RNA 분자일 수 있다. 상기 IRES는 귀뚜라미 마비 바이러스 IRES (CrPV-IRES) 또는 플라우티아 스탈리 장 바이러스 IRES (PSIV-IRES)를 포함한다.
Modified group I intron self-splicing system은 가장 보편적인 ribozyme method으로 permuted introns and exons (PIE) method이라고 하면, 전사, 및 자가-스플라이싱 인트론 분절을 통한 이후의 RNA의 원형화를 할 수 있다. 원형 RNA를 코딩하는 서열을 포함하는 DNA 플라스미드가 세균으로 형질전환하여 원형화된 RNA 생성물은 이후 용해된 세포의 총 RNA로부터 단리될 수 있다. 상기 PIE 방법은 긴 RNA 원형화에 더 적용 가능한 것으로 보고되었으며 보조인자로 GTP 및 Mg2+의 추가만 필요하다.
원형 RNA는 원형 RNA의 선형 형태에 비해 RNA 엔도뉴클레아제에 의한 분해에 대하여 더 내성이다. 5' 또는 3' 삼중 나선 모티프는 코딩되어 있는 폴리A 트랙트(tract)와 결합될 경우 엑소뉴클레아제 활성으로부터의 보호를 위한 RNA 삼중 나선을 형성하는 스템 루프 구조를 생성시킨다. 삼중 나선 모티프는 예를 들면 카포시 육종-연관 헤르페스바이러스 (KSHV), MALAT1, 텔로머라제 RNA 매듭, MENβ 또는 tRNA 서열과 같은 어떠한 적합한 공급원으로부터도 유래할 수 있다.
선형 형태 중 5'말단에 위치하는지 또는 3'말단에 위치하는지에 관계없이, UTR은 예를 들면 miRNA 결합 서열 또는 세포외 소포 표적화 서열을 포함할 수 있다. miRNA 결합 서열은 원형 RNA로부터의 번역을 조절하는 것을 도울 수 있다. miRNA 결합 서열은 번역을 방해하거나 번역 강화하는 miRNA에 결합할 수 있다. 따라서, 적절한 miRNA 결합 서열, 그리고 상기 miRNA 결합 서열에 결합하는 miRNA를 선택하는 것에 의해, 원형 RNA로부터 번역을 "상향" 또는 "하향" 중 어느 하나로 원하는 바와 같은 miRNA를 제공할 수 있다. 다른 경우에서, miRNA 결합은 원형 RNA 전사체의 전체적인 안정성에 영향을 줄 수 있다.
세포외 소포 표적화 서열은 제조 세포주에 의해 방출되는 엑소좀으로 원형 RNA를 전달하는 것을 돕는 뉴클레오티드 서열이다. 예를 들면, 엑소좀 전달 요소가 기존의 세포 기구를 이용하여 엑소좀으로 원형 RNA 위치지정을 이동한다. 이와 같은 방식으로, 예를 들면 치료 단백질을 코딩하는 원형 RNA 분자가 적재된 엑소좀 생성물을 제조할 수 있다. 이후, 표적 세포가 엑소좀을 흡수하면서, 원형 RNA는 표적 세포로 전달될 수 있다. 원형 RNA 플랫폼은 이전에는 달성가능하지 않았던 RNA의 엑소좀-매개 전달을 사용하는 것을 가능케 한다. 엑소좀은 원래는 통상적인 형태의 RNA를 분해하기에 충분한 양으로 충분한 RNase를 함유한다. 원형 RNA는 선형 RNA 구축물에 비해 RNase 분해에 대하여 덜 민감성이며, 그에 따라 엑소좀-매개 전달에 의해 전달될 수 있다.
RNA 안정성 요소는 원형 RNA의 안정성을 증가시킬 수 있다. 예시적인 RNA 안정성 요소는 우드척(woodchuck) 간염 전사-후 조절 요소 (WPRE)이다. 전사될 때, WPRE는 발현을 강화하는 삼차 구조를 생성시킨다. 상기 서열은 분자 생물학에서 바이러스 벡터를 사용하여 전달되는 코딩 영역의 발현을 증가시키는 데에 흔하게 사용된다. 포유동물 세포에서 사용하기 위한 발현 카세트의 3' UTR에 사용될 경우, WPRE는 mRNA 안정성 및 단백질 수율을 증가시킬 수 있다. 다른 예시적인 RNA 안정성 요소로는 대장균 REP 서열, 및 글로빈 mRNA 중 3'-UTR의 C-풍부 결정인자가 포함되나, 이에 제한되는 것은 아니다. 원형 RNA의 안정성은 이와 같은 RNA를 제조하는 데에 있어서의 효소-추진 RNA 합성의 회피를 가능케 하고/거나, 원핵 또는 진핵 시스템의 사용을 가능케 한다.
RNA 외수송 요소는 원형 RNA의 핵 외수송을 증가시킬 수 있다. RNA 위치지정 요소는 특정 세포 구획으로의 RNA의 전달을 안내할 수 있다.
정제 요소는 원형 RNA를 정제하는 것을 도울 수 있다. 예를 들면, 원형 RNA의 친화성 정제를 위하여, 압타머 서열이 원형 RNA에 도입될 수 있다.
원형 RNA 자체에 대한 변형은 아니지만, 원형 RNA 시스템의 추가적인 변형은 제조 세포의 게놈 DNA에 RNase 코딩 영역을 안정하게 도입하는 것을 포함한다. 세포에 의해 생성되는 원형 RNA는 RNase에 의한 분해에 대하여 내성이다.
더 높은 농도의 RNase를 발현하도록 제조 세포를 변형시키는 것은 세포에 의해 생성되는 비-원형화 RNA를 분해하게 되며, 그에 따라 제조 세포로부터의 원형 RNA의 정제를 단순화한다. T7 RNA 폴리머라제를 사용한 원형 RNA의 시험관내 전사를 할 수도 있다.
또한, 원형 RNA를 코딩하는 플라스미드 DNA가 전사, 및 이후의 인트론 분절을 자가-스플라이싱하는 것을 통한 RNA의 원형화를 위하여 진핵세포로 전달될 수 있다. 원형 RNA 플라스미드 서열은 안정한 제조를 위하여 진핵세포의 숙주 게놈으로 안정하게 통합될 수 있다.
바람직하게, 원형 RNA를 코딩하는 서열을 포함하는 발현단위는 본 발명에서 제안하는 RNA 중합효소 발현단위가 있는 무세포 시스템에 첨가하여 원형화된 RNA 생성물은 제조할 수도 있다.
D. 관심 RNA 전사시스템 및 벡터
본 발명은 RNA 중합효소에 의해 관심 RNA의 지속적 발현이 가능한 RNA 전사시스템을 제공한다. 본 발명의 관심 RNA 전사시스템은 RNA 중합효소 발현단위와 관심 RNA 발현단위를 포함한다.
본 발명의 관심 RNA 전사시스템은 (a) RNA 중합효소를 제공하는 RNA 중합효소 발현단위를 포함하는 DNA; 및 (b) 상기 RNA 중합효소에 의해 전사가 가능한 관심 RNA(RNAi)를 코딩하는 관심 RNA 발현단위를 포함하는 DNA가 각각 독립적인 replicon 또는 하나의 replicon에 의해 관리되는 것을 특징으로 하는 DNA 시스템일 수 있다.
본 발명에서 최소한 전사번역을 할 수 있는 시스템에서 상기 DNA 시스템을 대신하여 RNA 시스템을 사용할 수도 있다. 본 발명의 RNA 중합효소 발현단위는 그 발현산물인 RNA 중합효소 mRNA 단위 또는 RNA 중합효소를 사용할 수도 있다.
상기 DNA 시스템은 추가적으로 상기 RNA 중합효소의 전사를 위한 무세포유래 세포에서 인지할 수 있는 프로모터를 포함하는 RNA 중합효소 발현단위; 및 상기 RNA 중합효소가 결합할 수 있는 프로모터를 코딩하는 DNA를 포함하는 관심 RNA 발현단위;를 포함하고, 이들이 작동 가능하게 연결되어 구성되는 것을 특징으로 하는 DNA 시스템을 제공한다.
플라스미드는 세균 세포내에 독립적으로 존재하는 원형의 DNA 분자이다. 플라스미드는 거의 항상 하나 이상의 유전자를 가지고 있으며 이들 유전자는 종종 숙주세균에 의해 나타나는 유용한 특징을 담당하고 있다. 예를 들어, 항생제의 정상적인 독성농도에서 생존하는 능력은 항생제 저항성 유전자를 가진 플라스미드가 세균내에 존재하기 때문이다. 실험실에서 이러한 항생제 저항성은 종종 선별 마커(selectable marker)로서 이용된다.
모든 플라스미드는 복제 원점(replication origin; 무세포유래 세포의 복제효소가 인식할 수 있는 부위를 말하며, 이 부위에서부터 복제가 시작된다.) 역할을 할 수 있는 DNA 서열을 적어도 하나 가지고 있으며, 따라서 주 세균 염색체(main bacterial chromosome)와는 독립적으로 세포내에서 복제할 수 있다. 어떤 유형의 플라스미드는 세균 염색체 안으로 자신을 삽입시킴으로써 복제할 수 있다. 이렇게 통합하는 플라스미드(episome이라 부름)들은 수많은 세포분열 동안 이 형태를 안정적으로 유지할 수 있다. 그러나 어떤 단계에서는 excision(통합되는 과정의 역과정)됨으로써 독립적인 요소로 존재한다.
Selectable marker란 벡터에 의해 운반된 유전자로서, 이 벡터 또는 재조합 DNA분자를 가진 세포의 특징이 인식될 수 있도록 해주는 유전자를 말한다.
플라스미드의 크기의 범위는 가장 작은 것은 1.0 kb로부터 가장 큰 것은 250 kb 이상까지이다. Copy number란 하나의 세균 세포에서 정상적으로 발견되는 플라스미드의 수를 말한다. Copy number를 조절하는 인자는 잘 이해되지 않았지만, 각 플라스미드는 1~50개 이상의 특징적인 수를 가지고 있다.
플라스미드가 세균에 널리 분포하고 있긴 하지만 다른 생물체에서도 그렇게 보편적인 것은 결코 아니다. 가장 많이 연구된 진핵세포성 플라스미드(eukaryotic plasmid)는 2㎛ circle로서 효모에 존재한다. 2㎛ 플라스미드의 발견은 이것이 숙주로서 매우 중요한 산업적 생물체의 유전자를 클로닝하기 위한 벡터의 제조를 가능하도록 했기 때문에 매우 운이 좋은 것이었다. 그러나 다른 진핵 생물에서는 플라스미드가 발견되지 않고 있다.
본 발명에서 RNA 중합효소 발현단위 및 관심 RNA 발현단위의 전달체를 위한 기본 요건은 적절한 클로닝 벡터, 즉 운반될 때 매개체 역할을 하고 일반적으로 박테리아인 무세포유래 세포에서 증폭 및 무세포유래 세포인 관심세포로 수송 및 증폭하는 DNA 분자의 선택이다. 다양한 천연 레플리콘은 복제 벡터로 작용할 수 있는 특성을 나타내지만, 벡터는 또한 전달, 유지 및 증폭을 위한 효율적인 에이전트로 기능하기 위한 특정 최소 자격을 갖도록 설계해야 한다.
이상적인 벡터는 다음 네 가지 속성을 보유해야 한다. (1) 저분자량; (2) 무세포유래 세포에 쉽게 선택 가능한 표현형 형질을 부여하는 능력; (3) 바람직한 관심 단백질을 갖는 유전자들의 클로닝을 위한 다수의 제한 엔도뉴클레아제 절단 부위가 있는 Multicloning site; 및 (4) 무세포유래 세포 내에서 복제하는 능력으로 벡터의 수많은 사본이 생성되어 딸세포로 전달될 수 있어야 한다.
본 발명에서 사용 가능한 전달체로 자연 발생 또는 인공적으로 구축된 벡터의 예는 대장균 플라스미드, 박테리오파지(λ, M13, P1), 바이러스(동물 바이러스-레트로바이러스, 아데노바이러스, 아데노 관련 바이러스, 단순 헤르페스 바이러스, 백시니아 바이러스 등; 곤충 바이러스 - 배큘로 바이러스, 식물 바이러스 - 콜리플라워 모자이크 바이러스, 감자 바이러스 X, 쌍둥이자리 바이러스 등), 아그로박테리움 투메파시엔스 기반 벡터, 키메라 플라스미드(코스미드, 파지미드, 파스미드 및 포스미드), 인공 염색체(YAC, BAC, PAC, MAC 및 HAC) 및 비 대장균 벡터(예: 바실러스 및 슈도모나스 벡터 등) 기반 벡터가 포함될 수 있다.
본 발명에서 RNA 중합효소 발현단위 및 관심 RNA 발현단위를 위한 벡터 선택을 결정하려면 다음과 같은 다양한 요인을 고려해야 한다.
(1) 벡터 크기: DNA 단위 크기는 플라스미드 벡터의 경우 5~25kb에서 HAC의 경우 >2,000kb까지 다양한 벡터 유형에 따라 다를 수 있다.
(2) 벡터 크기: 벡터 크기 범위는 5kb 플라스미드 벡터에서 6-10 메가베이스 HAC 고용량 벡터까지 다양하다.
(3) 제한효소의 절단부위: 벡터에서 발견되는 제한효소 절단부위의 수는 매우 다양하다. 작은 플라스미드 벡터에는 절단부위가 몇 개 있을 수 있지만 벡터에 여러 복제 부위를 삽입하면 제한효소의 절단부위가 증가할 수 있다.
(4) Copy number: 클로닝 벡터는 플라스미드의 레플리콘에 따라 다른 카피 수로 유지된다. 높은 복사 수 벡터가 바람직하다. 낮은 복제 수의 플라스미드 pBR322에서 파생된 복제의 기점을 갖는 발현 벡터는 25-50 복제/세포 또는 고카피 수 플라스미드 pUC에서 유래된 경우 150 내지 200개/세포범위에 있을 수 있는 벡터 복제 수를 결정한다.
(5) 클로닝 효율: 벡터에 삽입된 DNA 단위를 클로닝하는 능력을 벡터의 클로닝 효율에 의해 결정된다.
(6) 벡터의 관심 단백질 스크리닝 능력: 재조합체 선택의 경우, 비재조합체와 구별하기 위해 특정 선택 가능한 마커가 벡터에 존재해야 한다.
(7) 관심 단백질의 평가 등의 다운스트림 실험의 유형을 고려해야 한다.
본 발명에서 RNA 중합효소 발현단위의 효율적인 보유 및 장기 발현은 주요 목표이지만 많은 관심 RNA 전사시스템의 가장 큰 장애물이다. 관심 RNA 전사시스템에 사용할 벡터의 선택은 시간이 지남에 따라 유전자 발현 및 유지 수준에 크게 영향을 미치기 때문에 매우 중요하다.
오늘날 사용되는 가장 일반적인 벡터는 레플리콘, 프로모터, 선택 마커 및 다중 복제 부위의 다중 조합의 결과이다. 정보에 입각한 결정을 내리려면 개별 요구 사항에 따라 이러한 기능을 신중하게 평가해야 한다.
복제 원점
플라스미드와 같이 자율 단위로 복제되는 유전 요소에는 복제 원점이 포함되어 있다. 적합한 벡터를 선택할 때 염두에 두어야 할 중요한 매개변수는 복사 수이다. 복제 수의 제어는 복제물에 있다. 많은 발현단위가 세포에 존재하기 때문에 높은 플라스미드 투여량이 더 많은 재조합 단백질 수율과 같다고 생각하는 것이 논리적이다. 그러나 높은 플라스미드 수는 박테리아 성장 속도를 감소시키는 대사 부담을 부과하고 플라스미드 불안정성을 유발할 수 있으므로 단백질 합성을 위한 건강한 유기체의 수가 감소한다. 이러한 이유로, 단백질 발현을 위해 높은 카피 수의 플라스미드를 사용하는 것이 생산 수율의 증가를 의미하는 것은 결코 아닙니다.
pET 시리즈와 같이 일반적으로 사용되는 벡터는 pMB1 기원(ColE1-유도체, 세포당 15~60개 사본)을 보유하는 반면 pMB1 기원의 돌연변이 버전은 pUC 시리즈(세포당 500~700개 사본). 야생형 ColE1 기원(세포당 15~20개 사본)은 pQE 벡터(Qiagen)에서 찾을 수 있다. 그것들은 모두 동일한 비호환성 그룹에 속하므로 복제 기계를 놓고 서로 경쟁하기 때문에 동일한 세포에서 함께 전파될 수 없다. 2개의 플라스미드를 사용한 재조합 단백질의 이중 발현을 위해 p15A ori가 있는 시스템을 사용할 수 있다(pACYC 및 pBAD 플라스미드 시리즈, 세포당 10~12개 사본). 드물지만 삼중 발현은 pSC101 플라스미드를 사용하여 달성할 수 있다. 이 플라스미드는 복제에 대한 엄격한 통제하에 있으므로 낮은 복제 수로 존재한다(<5 복제/세포). 복제된 유전자 또는 그 산물의 고용량의 존재가 세포에 해로운 영향을 미치는 경우 이 레플리콘을 포함하는 플라스미드를 사용하는 것이 유리할 수 있다. 또는 Duet 벡터(Novagen)를 사용하면 동일한 플라스미드에서 두 개의 유전자를 복제할 수 있어 이중 발현이 간소화되었다. Duet 플라스미드는 T7 프로모터, lac 오퍼레이터 및 리보솜 결합 부위가 앞에 오는 두 개의 다중 복제 부위를 가지고 있다. 서로 다른 호환 가능한 Duet 벡터를 결합하여 4개의 발현 플라스미드에서 최대 8개의 재조합 단백질을 생성할 수 있다.
프로모터
원핵생물에서 대표적인 프로모터는 lac 오페론의 핵심 구성요소인 lac 프로모터이다. 유당은 시스템을 유도하고 이 설탕은 단백질 생산에 사용될 수 있다. 그러나 쉽게 대사할 수 있는 탄소원(예: 풍부한 배지에 존재하는 포도당)이 있는 경우 유도가 어렵다. 유당과 포도당이 존재하는 경우 모든 포도당이 활용될 때까지 lac 프로모터의 발현이 완전히 유도되지 않는다. 이 시점(낮은 포도당)에서 lac의 완전한 활성화에 필요한 고리형 아데노신 일인산(cAMP)이 생성된다. 이런 발현 조절을 이화작용 억제라고 한다. 또한, 포도당은 락토오스 투과효소가 글루코오스의 존재하에서 비활성이기 때문에 락토오스 흡수를 억압한다. 글루코스의 존재 하에 발현을 달성하기 위해, 이화대사 조절에 대한 민감성을 감소시키는(그러나 제거하지는 않는) 돌연변이체, lac UV5 프로모터가 도입되었다. 그러나, 다중복제 플라스미드에 존재할 때, 두 프로모터는 lac 프로모터 억제 단백질 LacI의 낮은 수준으로 인해 유도제가 없을 때 때때로 허용할 수 없을 정도로 높은 수준의 발현(일명 "누출")이 발생하는 단점이 있다. 유전자의 염색체 사본(세포당 약 10개 분자)에서 기본 발현 조절은 lacI의 더 높은 수준의 발현(거의 10배)을 유도하는 lacI Q 라고 하는 lacI 유전자의 돌연변이된 프로모터의 도입에 의해 달성될 수 있다. lac 프로모터 및 lac UV5는 다소 약하여 재조합 단백질 생산에 그다지 유용하지 않다.
다른 프로모터의 강도와 lac 프로모터의 장점을 결합한 합성 잡종을 사용할 수 있다. 예를 들어, tac 프로모터는 trp (트립토판) 프로모터의 -35 영역 과 lac 프로모터의 -10 영역으로 구성되었다. 이 구조체는 lac UV5 보다 약 10배 더 강력하다. 단백질 발현을 유도하기 위해 lac 또는 tac 프로모터를 사용하는 상용 플라스미드의 주목할만한 예는 pUC 시리즈(lac UV5 프로모터, Thermo Scientific) 및 벡터의 pMAL 시리즈(tac 프로모터, NEB) 등이다.
pET 벡터(pMB1 ori, 중간 카피 수, Novagen)에 존재하는 T7 프로모터 시스템은 재조합 단백질 발현에 매우 유용하다. 표적 단백질이 성공적인 경우에 전체 세포 단백질의 50%를 차지할 수 있다. 이 시스템에서 관심 있는 유전자는 파지 T7 RNA 중합효소(T7 RNAP)에 의해 인식되는 프로모터 하류 지역이 복제된다. 이 고활성 중합효소는 다른 플라스미드에 제공되거나 가장 일반적으로 lac UV5 프로모터의 전사 제어하에 T7 RNAP를 인코딩하는 프로파지(λDE3)의 박테리아 게놈에 배치할 수 있다. 따라서, 시스템은 락토스 또는 이소프로필 β-D-1-IPTG에 의해 유도될 수 있다. 기본 발현은 lac I Q 뿐만 아니라 T7 리소자임 공동 발현에 의해 제어될 수 있다. T7 라이소자임은 T7 RNAP에 결합하고 T7 프로모터로부터 전사 개시를 억제한다. T7 RNAP 유전자가 발현하여 소량의 T7 RNAP가 생성된다면, T7 라이소자임은 T7 프로모터 아래에 있는 이종 유전자의 의도하지 않은 발현을 효과적으로 제어한다. T7 리소자임은 호환 가능한 플라스미드(pLysS 또는 pLysE)에 의해 제공된다. 유도 후 생성된 T7 RNAP의 양은 T7 리소자임이 억제할 수 있는 중합효소 수준을 능가한다. 따라서 "유리" T7 RNAP는 재조합 유전자의 전사에 관여할 수 있다. 또 다른 제어 수준은 T7 프로모터의 다운스트림에 lacO 오퍼레이터를 삽입하여 하이브리드 T7/ lac 프로모터를 만든다. 모든 세 가지 메커니즘 (tight repression of the lac-inducible T7 RNAP gene by lacIQ, T7 RNAP inhibition by T7 lysozyme and presence of a lacO operator after the T7 promoter)는 시스템을 기본 발현을 피하는 데 이상적이다.
널리 사용되는 또 다른 접근 방식은 조절된 파지 프로모터의 제어하에 유전자를 배치하는 것이다. 파지 람다의 강력한 좌측 프로모터(pL)는 초기 용해 유전자의 발현을 지시한다. 프로모터는 λcI 억제 단백질에 의해 엄격하게 억제되며, 이는 용원성 성장 동안 오퍼레이터 서열에 위치한다. 숙주 SOS 반응이 DNA 손상에 의해 촉발되면 단백질 RecA의 발현이 자극되고, 이는 차례로 λcI의 자가 절단을 촉매하여 pL 제어 유전자의 전사를 허용한다. 이 메커니즘은 pL 프로모터를 포함하는 발현 벡터에서 사용하고 있다. SOS 반응(및 재조합 단백질 발현)은 DNA 자이라제 억제제인 날리딕식산을 첨가함으로써 유도할 수 있다. 프로모터를 활성화하는 또 다른 방법은 다른 프로모터의 영향 하에 해당 유전자를 배치하여 λcI 생산을 제어하는 것이다. 이 2단계 제어 시스템은 이미 T7 프로모터/T7 RNAP 기반 벡터이다. pLEX 시리즈 벡터(Life Technologies)에서 λcI 억제 유전자는 trp 프로모터의 제어하에 세균 염색체에 통합되었다. 트립토판이 없을 때 이 프로모터는 항상 "켜져" 있고 λcI는 지속적으로 생성된다. 트립토판을 첨가하면 트립토판-TrpR 억제인자 복합체가 형성되어 trp 오퍼레이터에 단단히 결합하여 λcI 억제인자 합성을 차단한다. 그 후, pL 프로모터하에서 원하는 유전자의 발현을 한다.
Tet 시스템 및 Tet 응답 요소(TRE)에서는 TRE는 19개 뉴클레오타이드 테트라사이클린 오퍼레이터(tetO) 서열의 7 반복이며, 테트라사이클린 억제인자(tetR)에 의해 인식한다. 내인성 박테리아 시스템에서 테트라사이클린 또는 독시사이클린과 같은 유사체 중 하나가 존재하는 경우 tetR은 TRE가 아닌 테트라사이클린에 결합하여 전사를 허용한다. 테트라사이클린 의존성 프로모터는 최소 프로모터의 상류에 TRE를 배치하여 개발하였다.
테트라사이클린 오프 시스템(Tetracycline Off System)은 tetracycline이 있으면 tet 유도성 프로모터의 발현이 감소한다. 테트라사이클린을 유전자 발현의 조절제로 사용하기 위해 테트라사이클린 조절 트랜스활성제(tTA)가 개발되었다. tTA는 tetR을 HSV(단순 포진 바이러스)의 필수 전사 활성화 도메인인 VP16(비리온 단백질 16)의 C-말단 도메인과 융합하여 생성된다. 테트라사이클린이 없는 경우 tTA의 tetR 부분은 이러한 tetO 서열에 결합하고 활성화 도메인은 발현을 촉진한다. 테트라사이클린이 존재하면 테트라사이클린은 tetR에 결합한다. 이것은 tTA가 tetO 서열에 결합하는 것을 막고 활성화 도메인에 의한 발현의 후속 증가를 방지하여 유전자 발현을 감소시킨다.
테트라사이클린 온 시스템(Tetracycline On System)은 시스템상에서 테트라사이클린은 rtTA와 복합체를 형성하고 TRE에 결합하여 발현을 증가시킨다. 상기 새로운 transactivator rtTA(reverse tetracycline-controlled trans activator)는 테트라사이클린은 무작위 돌연변이유발은 테트라사이클린 의존성 억제에 중요한 tetR의 아미노산 잔기의 돌연변이는 표현형을 역전시키고 억제보다는 유도를 위해 테트라사이클린의 존재에 의존하는 rTetR와 VP16을 융합하여 개발하였다.
모든 프로모터의 전사는 화학적 물질에 의해 시작되었다. 물리적 신호(예: 온도 또는 pH)에 반응하는 시스템도 사용할 수 있다. pL 프로모터가 한 예이다. 돌연변이 λcI 억제 단백질(λcI 857)은 온도에 민감하고 37°C보다 높은 온도에서 불안정하다. λcI 857 단백질(염색체 또는 벡터에 통합됨)을 포함하는 E. coli 숙주 균주는 먼저 28-30°C에서 원하는 밀도로 성장한 다음 40-42°로의 온도 이동에 의해 단백질 발현이 유도되었다. 이 시스템의 산업적 이점은 부분적으로 발효 중에 열이 생성되고 고밀도 배양에서 온도를 쉽게 높일 수 있다는 사실에 있다. 한편, 저온유도성 프로모터 cspA의 제어하에 있는 유전자는 15℃로의 온도하강에 의해 유도된다. 플라스미드의 pCold 시리즈는 cspA 프로모터가 있는 pUC118 백본(pUC18 유도체)을 가지어 30개 이상의 재조합 단백질에 대해 성공적인 발현이 이루어졌으며 총 발현 단백질의 20-40% 수준에 도달했다. 그러나 다양한 경우에 표적 단백질이 불용성 형태로 얻어졌다는 점에 유의해야 한다.
전사 종결서열
박테리아는 관심 RNA에 대한 발현단위를 가지고 있다. 관심 RNA의 발현단위를 갖는 세균은 관심 RNA 발현단위를 세균에 도입함으로써 얻을 수 있다.
유전자 전사 종결을 위한 종결서열은 관심 RNA 유전자의 하류에 위치할 수 있다. 종결서열은 호스트에서 기능하는 한 특별히 제한되지 않는다. 종결서열은 호스트로부터 유래된 종결서열일 수도 있고, 이종 종결서열일 수도 있다. 종결서열은 관심 RNA 유전자의 고유 종결서열이거나 다른 유전자의 종결서열일 수 있다. 종결서열의 구체예로서는, 예를 들면 박테리오파지 BFK20의 종결서열을 들 수 있다.
전사 종결서열의 두 부류인 Rho 의존성 및 Rho 독립적인 것이 원핵 생물 게놈 전체에서 확인되었다. 이러한 광범위하게 분포된 서열은 유전자 또는 오페론 전사의 정상적인 완료 시 전사의 종료를 유발하고, 전사 감쇠에서 관찰되는 것과 같은 조절 수단으로서 전사의 조기 종결을 매개하고, 세포에 불필요한 에너지 소비를 방지하는 초기 종결서열을 우연히 탈출한다.
Rho 의존 종결서열
Rho 의존 전사 종결서열은 mRNA-DNA-RNA 중합효소 전사 복합체를 파괴하기 위해 RNA 헬리카제 활성을 나타내는 Rho 인자라고 하는 큰 단백질을 필요로 한다. Rho 의존성 종결서열은 박테리아와 파지에서 발견되었다.
Rho 의존 종결서열은 번역 종료 코돈의 하류에서 발생하며, 컨센서스 서열이 확인되지 않은 Rho 이용 부위(Rho utilization site, rut)로 알려진 mRNA의 구조화되지 않은 시토신이 풍부한 서열과 하류 전사 종료점(downstream transcription stop point, tsp)으로 구성된다.
rut는 mRNA 로딩 부위와 Rho의 활성제 역할을 한다. 활성화를 통해 Rho는 ATP를 효율적으로 가수분해하고 mRNA가 틀에 박힌 부위와의 접촉을 유지하는 동안 mRNA를 아래로 전위할 수 있다. Rho는 다운스트림 tsp 사이트에서 중단되기 때문에 RNA 중합효소를 따라잡을 수 있다. 여러 개의 서로 다른 시퀀스가 tsp 사이트로 기능할 수 있다. Rho와 RNA 중합효소 복합체 사이의 접촉은 RNA 중합효소에 대한 Rho의 알로스테릭 효과를 포함하는 메커니즘을 통해 전사 복합체의 해리를 자극한다.
Rho 독립 종결서열
고유 전사 종결서열 또는 Rho-독립 종결서열은 연장되는 RNA에 자가 어닐링 헤어핀 구조의 형성이 필요하며, 이는 mRNA-DNA- RNA 중합효소 삼원 복합체의 붕괴를 초래한다. DNA의 종결서열 서열은 20개 염기쌍의 GC가 풍부한 2쌍 대칭 영역을 포함하고, 그 뒤에 짧은 폴리-A 트랙 또는 "A 스트레치"가 뒤따른다. 이 영역은 각각 종결 헤어핀과 7~9개 뉴클레오티드 "U 트랙"을 형성하기 위해 전사되었다. 종결 메커니즘은 RNA 중합효소와 헤어핀 결합 상호작용의 알로스테릭 효과 및 "경쟁 동역학"을 통한 해리의 직접적인 촉진의 조합을 통해 발생하는 것으로 가정되었다. 헤어핀 형성은 RNA 중합효소 실속 및 불안정화를 유발하여 해당 위치에서 일시 중지된 시간이 증가하고 복합체의 안정성이 감소하여 해당 위치에서 복합체의 해리가 발생할 가능성이 더 커진다. 또한, 신장 단백질 인자 NusA는 RNA 중합효소 및 헤어핀 구조와 상호작용하여 전사 종결을 자극한다.
전사 종결서열의 두 부류인 Rho 의존성 및 Rho 독립적인 것이 원핵생물 게놈 전체에서 확인되었다. 이러한 광범위하게 분포된 서열은 유전자 또는 오페론 전사의 정상적인 완료 시 전사의 종료를 유발하고, 전사 감쇠에서 관찰되는 것과 같은 조절 수단으로서 전사의 조기 종결을 매개하고, 세포에 불필요한 에너지 소비를 방지하는 초기 종결서열을 우연히 탈출한다.
선택 마커
플라스미드가 없는 세포의 성장을 억제하기 위해 저항 마커가 플라스미드 백본에 추가될 수 있다. 대장균에 있어서, 항생제 내성 유전자는 습관적으로 이 목적을 위해 사용된다. 암피실린에 대한 내성은 β-락탐 항생제의 β-락탐 고리를 비활성화하는 주변 세포질 효소인 bla 유전자에 의해 부여할 수 있다. 그러나 β-lactamase가 지속적으로 분비되면서 항생제의 분해가 일어나며 몇 시간 안에 ampicillin이 거의 고갈된다. 이 상황에서 플라스미드를 운반하지 않는 세포는 배양 중에 증가할 수 있다. 실험적으로 검증되지는 않았지만 분해를 기반으로 하는 클로람페니콜(Chloramphenicol)과 kanamycin 저항성에서도 이 문제를 가질 수 있다. 이러한 이유로 테트라사이클린은 배양 중에 매우 안정적인 것으로 생각된다. 왜냐하면 내성은 내성 세포에서 항생제의 활성에 기반하기 때문이다.
항생제 비용과 항생제 내성의 확산은 대규모 배양을 하는 프로젝트의 주요 관심사이다. 무항생제 플라스미드 시스템의 개발에 많은 노력을 하고 있다. 이러한 시스템은 플라스미드가 없는 세포가 성장하거나 살 수 없을 때 발생하는 현상인 플라스미드 중독의 개념을 기반으로 한다. 예를 들어, 박테리아 게놈에서 필수 유전자를 삭제한 다음 플라스미드에 삽입할 수 있다. 따라서 세포 분열 후에 플라스미드가 없는 박테리아는 사멸한다. 플라스미드 중독 시스템의 다른 하위 유형은 기능 원리에 따라 존재한다: (i) 독소/항독소 기반 시스템, (ii) 대사 기반 시스템 및 (iii) 작업자 억제인자 적정 시스템. 이 유망한 기술은 대규모 발효기에서 성공적인 것으로 입증되었지만, 플라스미드 중독에 기반한 전사시스템은 아직 널리 보급되지 않았다.
III. 관심 RNA 전사시스템에 의해 무세포에서 RNA 생산
세포 RNA의 뉴클레오사이드 모노포스페이트로의 전환
RNA의 뉴클레오사이드 모노포스페이트 "빌딩 블록"을 생산하기 위해서, 세포(내인성 또는 외인성) RNA를 포함하는 무세포 반응용액에서 세포 RNA(특히 리보솜 또는 rRNA; 메신저 또는 mRNA; 및 트랜스퍼 RNA 또는 tRNA를 포함함)를 이의 구성성분 5' 뉴클레오사이드 모노포스페이트(NMP)로 분해시키는 1종 이상의 효소 또는 이들의 발현단위와 배양한다. 세포 RNA로부터 NTP의 합성은 여러 종류 대사경로 유전자들이 있으며 본 발명에서는 이들을 NTP 합성대사경로 유전자라고 하였다.
NTP 합성대사경로 유전자인 RNA 분해효소는 세포 RNA를 5'-NMP로 분해시키는 리보뉴클레아제(예를 들어, 뉴클레아제 P1, RNase R)이다. RNA의 공급원으로서의 세포는 뉴클레아제를 발현하도록 조작될 수 있거나, 또는 뉴클레아제 또는 그 발현단위는 분리된 세포에 의해서 생산되고, 반응에 도입될 수 있다. 예를 들어, 효모로부터의 세포 RNA는 페니실리엄 시트리넘(Penicillium citrinum)에 의해서 생산된 뉴클레아제 P1에 의해서 분해될 수 있다. 뉴클레아제 P1은 단일-가닥 RNA 및 DNA를 RNA로 5' 뉴클레오사이드 모노포스페이트로 가수분해시키는 아연-의존성 단일-뉴클레아제이다. 이 효소는 염기 특이성이 없다.
그 후(즉, 세포 RNA가 분해된 경우), 뉴클레아제는 (예를 들어, 물리적 분리, 예컨대, 여과, 침전, 포획 및/또는 크로마토그래피에 의해서) 제거되거나 또는 무세포 시스템 유래세포에 PVSA의 첨가 또는 RNase inhibitor를 과발현시키는 방법을 포함한 다양한 방법(예를 들어, 온도, pH, 염, 세제, 알코올 또는 다른 용매 및/또는 화학 저해제에 의해서)으로 불활성화한다.
본 발명에 기재된 RNA 합성 방법을 시험관내 전사(IVT)의 RNA 합성 방법과 대조하기 위해서, 본 발명에 기재된 RNA 합성 방법을 "무세포" RNA 합성이라고 하였다. IVT 방법은 또한 기술적으로 무세포이지만, 이 방법은 삼인산화된 뉴클레오타이드 기질의 직접 추가에 의존하므로, 추가 에너지가 필요하지 않다. 용어 "무세포"는 대조적으로 삼인산화될 필요가 없는 뉴클레오타이드 기질(예를 들어, 5'-뉴클레오사이드 모노포스페이트 및/또는 뉴클레오사이드 다이포스페이트)을 허용하는 RNA 합성 방법을 나타내기 위해서 사용되는데, 그 이유는 이 방법이 키나제 효소(또는 효소) 및 에너지 공급원(예를 들어, 포스페이트 공여자, 예컨대, 폴리포스페이트 또는 헥사메타포스페이트)를 제공하여 더 낮은 인산화도의 뉴클레오타이드를 각각의 삼인산화된 형태로 전환시키기 때문이다.
본 발명에서 상기 세포 RNA의 뉴클레오사이드 모노포스페이트로의 전환 대사경로 유전자 발현단위를 최소한 전사번역이 가능한 시스템에서 첨가하여 그 발현산물을 얻을 수도 있다.
세포 RNA의 뉴클레오사이드 다이포스페이트로의 전환
세포 RNA를 뉴클레오사이드 다이포스페이트(NDP)로 분해시킨다. NTP 합성대사경로 유전자 산물인 RNA 분해 효소는 포스페이트의 존재 하에서 세포 RNA를 NDP로 분해시키는 리보뉴클레아제(예를 들어, 폴리뉴클레오타이드 포스포릴라제(PNPase)이다. RNA의 공급원으로서의 세포를 세포-특이적 뉴클레아제를 발현하도록 조작할 수 있거나, 또는 뉴클레아제 또는 그 발현단위를 분리된 세포에 의해서 생산하고, 반응에 도입할 수 있다. 그 후(즉, 세포 RNA가 분해된 경우), 뉴클레아제를 (예를 들어, 물리적 분리, 예컨대, 여과, 침전, 포획 및/또는 크로마토그래피에 의해서) 제거하거나 또는 (예를 들어, 온도, pH, 염, 세제, 알코올 또는 다른 용매 및/또는 화학 저해제에 의해서) 불활성화시킨다.
본 발명에서 상기 세포 RNA의 뉴클레오사이드 다이포스페이트로의 전환 대사경로 유전자 발현단위를 최소한 전사번역이 가능한 시스템에서 첨가하여 그 발현산물을 얻을 수도 있다.
뉴클레오사이드 트라이포스페이트의 생산
분해 후, 무세포 반응용액을 NTP 합성대사경로 유전자의 산물인 복수의 키나제 효소(뉴클레오사이드 모노포스페이트 키나제 포함), 키나제 효소의 혼합물 또는 이들의 발현단위를 사용하여 NMP 또는 NDP의 NTP(뉴클레오사이드 트라이포스페이트)로의 인산화를 초래하는 조건 하에서 배양하는데, 키나제 효소는 혼합물 중의 개별 NMP(즉, AMP, GMP, CMP 및 UMP), 뉴클레오사이드 다이포스페이트 키나제(NDK) 및 폴리포스페이트 키나제(PPK) 각각을 인산화시키는 데 특이적이다. 분해 반응이 NDP를 생산하는 경우(예를 들어, PNPase를 사용하는 경우), 혼합물은 뉴클레오사이드 다이포스페이트 키나제(NDK), 폴리포스페이트 키나제(PPK) 및 선택적으로, 1종 이상의 뉴클레오사이드 모노포스페이트 키나제로 이루어져서 NDK 및 PPK를 사용한 가역적인 반응을 통해서 생성된 임의의 NMP를 구조할 것이다.
키나제는 발효물에서(예를 들어, 대장균에서) 높은 역가로 생산될 수 있다. 이어서 세포를 (예를 들어, 고압 균질화를 사용하여) 용해시켜 키나제 또는 발현단위를 함유하는 세포 추출물을 생성시킬 수 있다. 이어서 세포 추출물에 존재하는 바람직하지 않은 효소 활성(특히, 포스파타제, 뉴클레아제, 프로테아제, 데아미나제, 산화환원효소 및/또는 가수분해효소)을, 키나제 활성을 불활성화시키지 않으면서, 예를 들어, 가열에 의해서, 키나제-함유 세포 추출물로부터 제거하고(즉, 제거하거나 불활성화하고); 열을 사용하여 이러한 바람직하지 않은 효소활성을 불활성화시키는 특정 실시형태에서 키나제는 이의 열안정성 변이체여서 키나제 활성을 함유하는 제제를 사용할 수 있으나, 전사 및 번역에 관련된 물질 활성의 유실을 초래할 수도 있다. 따라서 이런 처리들에 의해 발생하는 이익과 손실을 고려하여 실시를 결정할 수도 있다. 바람직하지 않은 효소 활성을 (예를 들어, 물리적 분리, 예컨대, 여과, 침전, 포획 및/또는 크로마토그래피에 의해서) 제거하거나 또는 (예를 들어, 온도, pH, 염, 세제, 알코올 또는 다른 용매 및/또는 화학 저해제에 의해서) 불활성화시킨다. 이어서 NMP 또는 NDP를 에너지 공급원(예를 들어, 폴리포스페이트, 예컨대, 헥사메타포스페이트)의 존재 하에서 제제와 배양시켜 무세포 반응용액에서 NTP를 생산한다. 최소한, PPK 및 에너지 공급원이 NMP 또는 NDP를 NTP로 전환시키는 데 필요하다. 선택적으로, 개별 NMP 각각에 특이적인 NDK 및 뉴클레오사이드 모노포스페이트 키나제를 포함시킨다.
본 발명에서 상기 뉴클레오사이드 트라이포스페이트의 생산 대사경로 유전자 발현단위를 최소한 전사번역이 가능한 시스템에서 첨가하여 그 발현산물을 얻을 수도 있다.
뉴클레오사이드 모노포스페이트 또는 뉴클레오사이드 다이포스페이트의 뉴클레오사이드 트라이포스페이트로의 인산화
표 2의 경로효소들에 의해 세포 RNA가 성분 단량체로 전환되고, RNA를 분해시키는 뉴클레아제(들) 및 바람직하지 않은 효소 활성의 제거 또는 비활성화 후, 생성된 뉴클레오사이드 모노포스페이트(NMP) 또는 뉴클레오사이드 다이포스페이트(NDP)를 인산화하고, 그 다음 그것을 중합시켜 목적하는 합성 RNA, 예컨대, 단일-가닥 RNA를 형성한다. 이 과정은 에너지 의존적이며, 따라서 예를 들어, 포스포엔올피루베이트, ATP 또는 폴리포스페이트와 같은 고에너지 포스페이트 공급원, 전형적으로 에너지원이 필요하다.
효소명칭 | EC # | 유기체 | 유니프로트# |
RNase R | 3.1.13.- | 에스케리키아 콜라이(Escherichia coli) | P21499 |
PPK 1 | 2.7.4.1 | 써모시네코코쿠스 엘롱가투스 (Thermosynechococcus elongatus) | Q8DMA8 |
UMP kinase | 2.7.4.22 | 피로코쿠스 푸리오수스 (Pyrococcus furiosus) | Q8U122 |
CMP kinase | 2.7.4.25 | 써무스 써모필루스(Thermus thermophilus) | Q5SL35 |
GMP kinase | 2.7.4.8 | 써모토가 마리티마(Thermotoga maritima) | Q9X215 |
AMP kinase | 2.7.4.3 | 써무스 써모필루스 | Q72125 |
NDP kinase | 2.7.4.6 | 아퀴펙스 아에오리쿠스(Aquifex aeolicus) | Q67528 |
에너지원은 무세포 시스템에 직접 첨가되는 ATP이다. ATP 재생 시스템을 사용하여 에너지원을 제공한다. 예를 들어, 폴리포스페이트 및 폴리포스페이트 키나제 또는 이들의 발현단위를 사용하여 ATP를 생산할 수 있다. 다른 예는 ATP를 생산하기 위해 아세틸-포스페이트 및 아세테이트 키나제를 사용하는 것; ATP를 생산하기 위해 포스포-크레아틴 및 크레아틴 키나제를 사용하는 것; 및 ATP를 생산하기 위해 포스포엔올피루베이트 및 피루베이트 키나제를 사용하는 것을 포함한다. 다른 ATP(또는 기타 에너지) 재생 시스템을 사용할 수 있다.
에너지원의 적어도 하나의 성분이 세포용해물, 세포용해물 혼합물, 또는 무세포 반응용액에 첨가된다. 에너지원의 "성분"은 에너지(예를 들어, ATP)를 생산하는 데 필요한 기질(들) 및 효소(들)를 포함한다. 이들 성분의 비제한적인 예는 폴리포스페이트 키나제를 갖는 폴리포스페이트, 아세테이트 키나제를 갖는 아세틸-포스페이트, 크레아틴 키나제를 갖는 포스포-크레아틴 및 피루베이트 키나제를 갖는 포스포엔올피루베이트를 포함한다.
키나제는 ATP와 같은 고에너지 포스페이트-공여 분자에서 특정 기질/분자로 포스페이트기의 전달을 촉매하는 효소이다. 이 과정은 기질이 고에너지 ATP 분자로부터 공여된 포스페이트기를 얻는 인산화라고 지칭된다. 이러한 트랜스에스터화는 인산화된 기질 및 ADP를 생산한다. 본 발명의 키나제는 NMP를 NDP로 그리고 NDP를 NTP로 전환시킨다. 뉴클레오타이드-특이적(AMP, GMP, CMP 및 UMP) 및 범특이적(NDP) 전달 효소 둘다가 본 발명에서 사용하기 위해 고려된다.
키나제는 표 3에서처럼 뉴클레오사이드 모노포스페이트 키나제이며, ATP에서 NMP로 고에너지 포스페이트의 전달을 촉매하여, ADP와 NDP를 생산한다. 무세포 시스템은 다음 4가지 뉴클레오사이드 모노포스페이트 키나제 중 하나 이상(또는 모두)을 포함한다: 우리딜레이트 키나제, 시티딜레이트 키나제, 구아닐레이트 키나제 및 아데닐레이트 키나제. 효소의 열안정성 변이체가 본 발명에 포함될 수도 있다. 뉴클레오사이드 모노포스페이트 키나제 중 하나 이상은 열안정성이다. 모든 뉴클레오사이드 모노포스페이트키나제는 열안정성이다. 열안정성 키나제는 NTP 또는 RNA 생산 반응에 사용하기 전에 열-불활성화되는 바람직하지 않은 활성을 갖는다.
키나제는 뉴클레오사이드 다이포스페이트 키나제인데, 이것은 포스포릴기를 NDP에 전달하여, NTP를 생성한다. 포스포릴길기의 공여자는 비제한적으로 ATP, 폴리포스페이트 중합체 또는 포스포엔올피루베이트일 수 있다. NDP를 NTP로 전환시키는 키나제의 비제한적인 예는 뉴클레오사이드 다이포스페이트 키나제, 폴리포스페이트 키나제 및 피루베이트 키나제를 포함한다. 상기 효소의 열안정성 변이체가 본 발명에 포함된다.
NMP에서 NTP로의 인산화는 폴리포스페이트 키나제(PPK)를 통해 고에너지 포스페이트가 폴리포스페이트로부터 ADP로 전달되는 폴리포스페이트-의존성 키나제 경로를 통해 일어난다. 폴리포스페이트 키나제는 폴리포스페이트 키나제 1(PPK1) 패밀리에 속하며, 폴리포스페이트로부터 ADP로 고에너지 포스페이트를 전달하여 ATP를 형성한다. 그 다음 이러한 ATP는 NMP 키나제에서 NMP를 동족 리보뉴클레오타이드 다이포스페이트(NDP)로 전환시키는 데 사용된다. NMP 키나제는 AMP 키나제, UMP 키나제, GMP 키나제, 및/또는 CMP 키나제를 포함하지만 이들로 제한되지 않는다. 또한, ATP는 NDP를 NTP로 변환시키기 위해 뉴클레오타이드 다이포스페이트 키나제에 의해 연속적으로 사용된다.
효소 명칭 | 숙주 유기체 | EC # | 반응 | 유니프로트 |
PyrH | 이. 콜라이 티. 쎄모필루스 피.푸리오수스 |
2.7.4.22 | UMP+ATP→UDP+ADP | P0A7E9 P43891 Q8U122 |
Cmk | 이. 콜라이 티. 쎄모필루스 피.푸리오수스 |
2.7.4.25 | CMP+ATP→CDP+ADP | P0A610 Q5SL35 Q8U2L4 |
Gmk | 이. 콜라이 티. 쎄모필루스 티. 마리티마 |
2.7.4.8 | GMP+ATP→GDP+ADP | P60546 Q5SI18 Q9X215 |
AdK | 이. 콜라이 티. 쎄모필루스 피.푸리오수스 |
2.7.4.3 | AMP+ATP→2ADP | P69441 Q72125 Q8U207 |
표 4에서처럼 폴리포스페이트 키나제는 폴리포스페이트 키나제 2(PPK2) 패밀리 키나제이다. 폴리포스페이트 키나제는 클래스 I PPK2 패밀리에 속하며, 이것은 폴리포스페이트로부터 NDP로 고에너지 포스페이트를 전달하여 NTP를 형성한다. 시스템에서 생산된 ATP는 NMP를 NDP로 변환시키는 고에너지 포스페이트 공여자로 사용된다. 폴리포스페이트 키나제는 클래스 III PPK2 패밀리에 속하며, 이것은 폴리포스페이트로부터 NMP 및 NDP로 고에너지 포스페이트를 전달하여 NTP를 형성한다. 클래스 III PPK2는 단독으로 사용되어 NMP로부터 NTP를 생산한다. 클래스 III PPK2는 다른 키나제와 조합하여 사용된다. 클래스 III PPK2는 ADP, AMP 및 폴리포스페이트로부터 ATP를 생산하는데, 이것은 그 다음 NMP 및 NDP 키나제에 의해 사용되어 NMP를 NTP로 전환시킨다.
유기체 | 수탁번호 |
메이오써무스 루버(Meiothermus ruber) DSM 1279 | ADD292391 |
메이오써무스 실바누스(Meiothermus silvanus) DSM 9946 | WP_013159015.1 |
데이노코쿠스 게오씨말리스(Deinococcus geothermalis) DSM 11300 | WP_011531362.1 |
써모시네코코쿠스 엘롱가투스 (Thermosynechococcus elongatus) BP-1 | NP_682498.1 |
아나에로리네아 써모필라(Anaerolinea thermophila) UNI-1 | WP_013558940 |
칼디리네아 아에로필라(Caldilinea aerophila) DSM 14535 | WP_014433181 |
클로로바쿨룸 테피둠(Chlorobaculum tepidum) TLS | NP_661973.1 |
오세아니써무스 프루푼투스(Oceanithermus profundus) DSM 14977 | WP_013458618 |
로세이플렉수스 카스텐홀치아(Roseiflexus castenholzii) DSM 13941 | WP_012120763 |
로세이플렉수스 종(Roseiflexus sp.) RS-1 | WP_011956376 |
트루에페라 라디오빅트릭스(Truepera radiovictrix) DSM 17093 | WP_013178933 |
CMP, UMP, GMP, NDP 및 PPK 키나제의 일부 또는 전부는 반응 후에 열 불활성화될 수 있다. 본 발명 제공되는 무세포 반응용액에 사용되는 PPK2 효소는 열안정성일 수 있다. 예를 들어, PPK2 효소는 폴리포스페이트 중합보다 ATP 합성을 선호하고, ADP 및 AMP 둘 모두를 ATP로 전환시키는 열안정성 클래스 III PPK2 효소일 수 있다. PPK2 효소는 헥사메타포스페이트와 같은 폴리포스페이트를 예를 들어, 10 내지 800mM/시간(예를 들어, 10, 15, 20, 25, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750 또는 800mM/시간)의 범위의 속도로 ATP로 전환시키는 데 사용된다.
본 발명은 또한 융합 효소를 포함한다. 융합 효소는 다수의 활성을 나타낼 수 있으며, 각각은 상이한 효소의 활성에 상응한다. 예를 들어, 독립적인 뉴클레오사이드 모노포스페이트 키나제 및 독립적인 뉴클레오사이드 다이포스페이트 키나제를 사용하는 대신, 뉴클레오사이드 모노포스페이트 키나제 활성 및 뉴클레오사이드 다이포스페이트 키나제 활성 둘 다를 갖는 융합 효소(또는 임의의 다른 효소)를 사용할 수 있다.
본 발명은 또한 효소의 변이체(예를 들어, "PPK2 변이체")뿐만 아니라 본 발명에 기재된 효소 중 임의의 하나 이상의 용도를 구현한다. 변이체 효소는 참조 효소와 어느 정도의 서열 동일성을 공유할 수 있다. 용어 "동일성"은 서열을 비교함으로써 결정되는 2개 이상의 폴리펩타이드 또는 폴리뉴클레오타이드의 서열 사이의 관계를 지칭한다. 동일성은 특정 수학적 모델 또는 컴퓨터 프로그램(예를 들어, "알고리즘")에 의해 처리되는 갭 정렬(존재하는 경우)이 있는 둘 이상의 서열 중 더 작은 것 간의 동일한 일치 비율을 측정한다. 관련 분자의 동일성은 공지된 방법으로 쉽게 계산될 수 있다. 그것이 아미노산 또는 핵산 서열에 적용될 때 "퍼센트(%) 동일성"은 서열을 정렬하고, 필요할 경우 갭을 도입한 후, 최대 퍼센트 동일성을 달성하는 제2 서열의 아미노산 서열 또는 핵산 서열에서의 잔기와 동일한 후보 아미노산 또는 핵산 서열에서의 잔기(아미노산 잔기 또는 핵산 잔기)의 백분율로서 정의된다. 동일성은 퍼센트 동일성의 계산에 의존하지만, 계산에 도입된 갭 및 페널티로 인해 값에 있어서 상이할 수 있다. 특정 서열의 변이체는 본 발명에 기재되고, 당업자에게 공지된 서열 정렬 프로그램 및 파라미터에 의해 결정되는 경우, 특정 참조 서열과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 그러나 100% 미만의 서열 동일성을 가질 수 있다.
2개의 서열 사이의 서열의 비교 및 퍼센트 동일성의 측정은 수학적 알고리즘을 사용하여 달성될 수 있다. 동일성을 결정하는 기술은 공개적으로 이용가능한 컴퓨터 프로그램에 성문화되어 있다. 2개의 서열 사이의 상동성을 측정하기 위한 예시적인 컴퓨터 소프트웨어는 GCG 프로그램 패키지(문헌[Devereu et al., 1984, Nucleic Acids Research 1: 387, 1984)], BLAST 수위트(문헌[Altschul et al., 1997, Nucleic Acids Res. 25: 3389]) 및 FASTA(문헌[Altschul et al., 1990, J. Molec. Biol. 215: 403, 1990])을 포함하지만 이들로 제한되지 않는다. 다른 기술은 스미쓰-워터만(Smith-Waterman) 알고리즘(문헌[Smith et al., 1981, J. Mol. Biol. 147: 195]); 니들만-운쉬(Needleman-Wunsch) 알고리즘(문헌[Needleman, S. B. et al., 1970, J. Mol. Biol. 48: 443]); 및 Fast Optimal Global Sequence Alignment Algorithm(FOGSAA)(문헌[Chakraborty et al., 2013, Sci Rep. 3: 1746, 2013])을 포함하지만 이들로 제한되지 않는다.
본 발명에서 상기 뉴클레오사이드 모노포스페이트 또는 뉴클레오사이드 다이포스페이트의 뉴클레오사이드 트라이포스페이트로의 인산화 대사경로 유전자 발현단위를 최소한 전사번역이 가능한 시스템에서 첨가하여 그 발현산물을 얻을 수도 있다.
뉴클레오사이드 트라이포스페이트의 리보핵산으로의 중합
상기와 같이 NTP가 생산되고, 하나 또는 복수의 관심 RNA 전사시스템이 제공된 후, 예를 들어 단독 DdRp 또는 ctDdRp 그리고 DdRp 이어서 RdRp를 사용하여 NTP를 RNA(예를 들어, ss RNA)로 중합함으로써 RNA의 생합성이 달성된다. 방법의 이 단계에서, DNA 주형은 관심 RNA로 전사된다.
ATP는 PPK의 존재 하에서 정제된 AMP 또는 ADP와 포스페이트 공여자를 사용하여 생산될 수 있다. 또 다른 양상에서 ATP는 PPK의 존재 하에서 세포 RNA 및 포스페이트 공여자로부터 유래된 AMP 또는 ADP를 사용하여 생산될 수 있다.
유사하게, GTP는 반응에 직접 첨가될 수 있거나 1종 이상의 키나제의 존재 하에 정제된 GMP 또는 GDP와 포스페이트 공여자를 사용하여 GTP를 생산할 수 있다. 추가의 또 다른 양상에서, GTP는 1종 이상의 키나제의 존재 하에서 세포 RNA로부터 유래된 GMP 또는 GDP 및 포스페이트 공여자로부터 생산될 수 있다.
RNA 중합은 NTP, 전사 프로모터를 포함하는 DNA 주형 및 전사 프로모터를 인식하고 전사를 시작하는 중합효소(RNA 중합효소)가 필요하다. 전형적으로, 본 발명과 같이 사용하기 위한 중합효소는 동족 전사 프로모터에 대해 고도로 선택적이고, 충실도가 높으며, 고효율인 단일 소단위 중합효소이다. 이러한 중합효소의 예는 T7 RNA 중합효소, T3 RNA 중합효소 및 SP6 RNA 중합효소를 포함하지만 이들로 제한되지 않는다. 박테리오파지 T7 RNA 중합효소는 T7 파지 프로모터에 매우 특이적인 DNA-의존성 RNA 중합효소이다. 이러한 99kD 효소는 T7 프로모터의 제어 하에 DNA 주형으로부터 RNA 합성을 촉매한다. 박테리오파지 T3 RNA 중합효소는 T3 파지 프로모터에 매우 특이적인 DNA-의존성 RNA 중합효소이다. 이러한 99kD 효소는 T3 프로모터의 제어 하에 DNA 주형으로부터 RNA 합성을 촉매한다. 박테리오파지 SP6 RNA 중합효소는 SP6 파지 프로모터에 매우 특이적인 DNA-의존성 RNA 중합효소이다. 이러한 98.5kD 중합효소는 SP6 프로모터의 제어 하에 DNA 주형으로부터 RNA 합성을 촉매한다. T7, T3, SP6 중합효소 각각은 37 내지 40℃에서 최적으로 활성이다. T7, T3 및 SP6 중합효소의 열안정성 변이체가 사용된다. 열안정성 변이체 중합효소는 전형적으로 40℃ 초과(또는 약 40 내지 60℃)의 온도에서 최적으로 활성이다. 중합효소는 열안정성이 아니다. T7 중합효소가 사용된다. 방법에 사용된 T7 중합효소는 중합 반응에 사용하기 전에 침전 및 원심분리에 의해 정제되거나 부분적으로 정제된다. 침전 및 원심분리에 의해 정제되거나 부분적으로 정제된 T7 중합효소는 중합 반응에 사용하기 전에 크로마토그래피에 의해 추가로 정제되거나 부분적으로 정제된다.
열안정성 RNA 폴리머라제는 야생형 효소를 변형시킴으로써 제조될 수 있다. 이러한 변형 (예를 들어, 돌연변이)은 공지되어 있다. 예를 들어, 변이체 열안정성 T7 RNA 폴리머라제는 하기 점 돌연변이 중 1종 이상을 포함할 수 있다: V426L, A702V, V795I, S430P, F849I, S633I, F880Y, C510R, 및 S767G (EP2377928 및 EP1261696A1, 이들의 각각은 본원에 참조로 포함됨). 변이체 열안정성 T7 RNA 폴리머라제는 V426L, A702V, 및 V795I 돌연변이를 포함한다. 변이체 열안정성 T7 RNA 폴리머라제는 S430P, F849I, S633I, 및 F880Y 돌연변이를 포함한다. 변이체 열안정성 T7 RNA 폴리머라제는 F880Y, S430P, F849I, S633I, C510R, 및 S767G 돌연변이를 포함한다. 변이체 열안정성 T7 RNA 폴리머라제는 Y639V, H784G, E593G, 및 V685A 돌연변이를 포함한다. 변이체 열안정성 T7 RNA 폴리머라제는 S430P, N433T, S633P, F849I, 및 F880Y 돌연변이를 포함한다. 다른 변이체 및 재조합 열안정성 폴리머라제는 본 개시내용에 의해 포괄된다.
"RNA의 생합성을 위한 조건"으로도 지칭되는 "뉴클레오사이드 트라이포스페이트의 생산 및 뉴클레오사이드 트라이포스페이트의 중합을 초래하는 조건"은 예를 들어, pH, 온도, 시간 길이 및 무세포 시스템의 염 농도뿐만 아니라 외인성 보조인자를 포함한 중합효소 활성을 위한 최적 조건을 고려하여 당업자에 의해 결정될 수 있다.
RNA 생합성 동안 무세포 반응용액의 pH는 3.0 내지 8.0의 값을 가질 수 있다. 무세포 반응용액의 pH 값은 3 내지 8, 4 내지 8, 5 내지 8, 6 내지 8, 7 내지 8, 3 내지 7, 4 내지 7, 5 내지 7, 6 내지 7, 3 내지 6, 4 내지 6, 5 내지 6, 3 내지 5, 3 내지 4 또는 4 내지 5이다. 무세포 반응용액의 pH 값은 3.0, 3.5, 4.0, 4.5, 5.0, 5.5, 6.0, 6.5, 7.0, 7.5 또는 8.0이다. 바람직하게, RNA의 생합성 동안 무세포 반응용액의 pH 값은 7.0 내지 7.5이다.
RNA 생합성 동안 무세포 반응용액의 온도는 15℃ 내지 95℃일 수 있다. RNA 생합성 동안 무세포 반응용액의 온도는 30 내지 60℃, 30 내지 50℃, 40 내지 60℃, 40 내지 50℃, 50 내지 70℃, 50 내지 60℃이다. RNA 생합성 동안 무세포 반응용액의 온도는 30℃, 32℃, 37℃, 40℃, 42℃, 45℃, 50℃, 55℃, 56℃, 57℃, 58℃, 59℃ 또는 60℃이다. 바람직하게, RNA 생합성 동안 무세포 반응용액의 온도는 37 내지 55℃이다.
RNA 생합성 동안 무세포 반응용액은 15분(min) 내지 72시간(hr) 동안 배양될 수 있다. RNA 생합성 동안 무세포 반응용액은 30분 내지 48시간동안 배양된다. 예를 들어, RNA 생합성 동안 무세포 반응용액은 30분, 45분, 1시간, 2시간, 3시간, 4시간, 5시간, 6시간, 7시간 또는 8시간 동안 배양될 수 있다. 바람직하게, RNA 생합성 동안 무세포 반응용액은 1 내지 4시간 동안 배양된다.
일부 중합효소 활성은 금속 이온의 존재를 요구할 수 있다. 따라서 일부 금속 이온이 무세포 시스템에 첨가된다. 금속 이온의 비제한적인 예는 Mg2+, Li+, Na+, K+, Ni2+, Ca2+, Cu2+ 및 Mn2+를 포함한다. 다른 금속 이온을 사용할 수 있다. 1종 초과의 금속 이온을 사용될 수 있다. 무세포 시스템 중의 금속 이온의 농도는 0.1mM 내지 100mM 또는 10mM 내지 50mM일 수 있다. 무세포 시스템 중의 금속 이온 농도는 0.1, 0.2, 0.5, 1, 1.5, 2, 2.5, 3, 3.5, 4, 4.5, 5, 5.5, 6, 6.5, 7, 7.5, 8, 8.5, 9, 9.5, 10, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90 또는 100mM이다. Mg2+가 반응에서 바람직한 금속 이온이다.
본 발명에서 상기 뉴클레오사이드 트라이포스페이트의 리보핵산으로의 중합 대사경로 유전자 발현단위를 최소한 전사번역이 가능한 시스템에서 첨가하여 그 발현산물을 얻을 수도 있다.
캡핑
mRNA 캡은 리보솜 소단위의 동원, 리보솜 조립 및 번역의 촉진 및 엑소뉴클레아제 활성으로부터의 mRNA의 보호를 포함하지만 이들로 제한되지 않는 다양한 기능을 제공한다.
캡핑은 관심 RNA 전사시스템을 구성하는 ctDdRp에 있는 캡핑효소 또는 RdRp를 포함하는 다양한 방법을 사용하여 달성될 수 있다. 캡핑은 1종 이상의 캡핑효소를 사용하여 달성된다. 캡핑의 과정은 하기 표 2에 제시된 다양한 효소 활성을 요구한다. 하나의 단백질이 4개 모두의 기능을 달성한다. 4개의 활성은 2종, 3종 또는 4종의 효소에 의해서 달성된다.
활성 | 효소 명칭 | EC# |
A | RNA 5'-트라이포스파타제 | 3.1.3.33 |
B | 구아닐릴트랜스퍼라제 | 2.7.7.50 |
C | 구아닐릴 메틸트랜스퍼라제 | 2.1.1.56 |
D | 2'-O-메틸 트랜스퍼라제 | 2.1.1.57 |
캡핑은 RNA 중합 단계 이후에 수행될 수 있다. RNA 중합 반응은 캡핑 전에 비활성화된다. 캡핑 효소는 메틸 공여자(예를 들어, S-아데노실메티오닌) 및 폴리포스페이트를 갖는 GTP 또는 GMP와 함께 반응에 첨가된다. GMP는 반응에 존재하는 키나제에 의해서 GTP로 전환된다. 메신저 RNA는 다양한 효소를 사용하여 캡핑된다. 본 발명의 방법에 사용될 수 있는 메신저 RNA를 캡핑하는데 잠재적으로 사용하기 위한 효소의 목록이 표 3에 있다.
단백질 명칭 | 유기체 | 바이러스 클래스 | |
1 | D1 | 백시니아 바이러스 | Pox |
2 | D12 | 백시니아 바이러스 | Pox |
3 | VP39 | 백시니아 바이러스 | Pox |
4 | VP4-1 | 블루텅 바이러스 10 | dhfmqlqkdlfjtm |
5 | VP4-2 | 크로노박터 말로나티커스 |
해당없음(엔테로박테리아세아) |
6 | MIMI_R382 | 아칸타모에바 폴리파가 미미바이러스 | 미미비리대 |
7 | Ba71V-101 | 아프리카 돼지열 바이러스 Ba71V | 아스피바이러스 |
8 | PLM | 포와이 레이크 메가 바이러스 | 미미비리대 |
9 | Cap | 왈랄 바이러스 | 오르비바이러스(레오바이러스) |
10 | VP4-3 | 아프리카 말병 바이러스 4 | 오르비바이러스(레오바이러스) |
11 | VP4-4 | 가축 유행성 출현 질환 바이러스 | 오르비바이러스(레오바이러스) |
12 | VP4-5 | 그래스 카리브 레오바이러스 | 레오바이러스 |
13 | NS5 | 웨스트 나일바이러스 | 플라비바이러스 |
14 | NS3-T | 웨스트 나일바이러스 | 플라비바이러스 |
15 | MTase | 아칸타모에바폴리파가 미미바이러스 | 미미비리대 |
16 | Ba71V-055 | 아프리카 돼지열 바이러스 Ba71V | 아스피바이러스 |
17 | VP3-BTV | 블루텅 바이러스 10 | 오르비바이러스 |
18 | VP7-BTV | 블루텅 바이러스 10 | 오르비바이러스 |
19 | D1-GSSGGSGSGGSSSGS-D12 | 백시니아(융합) | Pox |
mRNA는 캡 유사체를 사용하여 캡핑된다. 캡 유사체는 다이뉴클레오타이드 캡 유사체(예를 들어, 표준 캡 유사체 또는 항-역방향 캡 유사체, ARCA) 또는 3+ 뉴클레오타이드 캡 유사체(예를 들어, TriLink로부터의 CleanCap), 비메틸화된 캡 유사체 또는 메틸화된 캡 유사체를 포함할 수 있다. 캡유사체는 중합 반응에 첨가된다.
1종 이상의 내부 리보솜 유입 부위(IRES) 서열이 캡 대신에 또는 캡에 더하여 포함된다. IRES 서열은 5' UTR 서열에 포함된다. IRES는 바이러스 게놈, 예컨대, 뇌심근염 바이러스(EMCV) 또는 크리켓 파랄리시스(Cricket Paralysis) 바이러스 (CrPV)로부터 기원한다. IRES는 세포 mRNA, 예컨대, 아폽토시스 프로테아제 활성화 인자(Apaf-1), 미엘린 전사 인자 2(MYT-2) 또는 c-myc로부터 기원한다.
캡핑은 mRNA 합성 과정의 다양한 상이한 단계로 수행될 수 있다. 캡핑은 전사와 동시에(co-transcriptionally) 또는 전사 후에(post-transcriptionally) 일어날 수 있다. 이들 방법은 RNA 합성 후에 그리고 효소적 폴리아데닐화가 수행되는 경우에는 효소적 폴리아데닐화 단계 전 또는 후에 실행될 수 있다. RNA는 정제 전에 반응용액에 캡핑된다. 또는 RNA는 정제된 후에 캡핑된다.
보조 효소, 예컨대, 5', 3' 엑소리보뉴클레아제 1(xrn1)을 사용하여 보다 효율적인 캡핑을 달성할 수 있다. Xrn1 처리는 캡핑될 수 없는 GMP로 시작되는 mRNA를 NMP 단량체로 다시 분해하여, 이어서 이것을 다시 사용하여 mRNA를 생산할 수 있다. 이러한 분해는 GTP 또는 GDP로 시작하는 mRNA에 영향을 미치지 않기 때문에, 이것은 캡핑될 수 있는 mRNA의 생산을 증가시킬 것이다. 특이적 엑소뉴클레아제를 사용한 일인산화된 mRNA 재순환이 수행된다. CFR 반응에서의 표준 효소에 더하여, 5'-모노포스페이트 특이적 엑소리보뉴클레아제, 예컨대, xrn1이 첨가된다. Xrn1을 사용하여 5' 모노포스페이트를 갖는 mRNA를 분해시켜, NMP를 CFR 반응으로 다시 재순환시킬 수 있다. 그것을 또한 사용하여 CFR에서 생산된 mRNA에서 캡핑 가능하지 않은 mRNA를 분해시킬 수 있다.
본 발명에서 상기 캡핑 대사경로 유전자 발현단위를 최소한 전사번역이 가능한 시스템에서 첨가하여 그 발현산물을 얻을 수도 있다.
관심 RNA 전사시스템에 의한 관심 RNA로의 중합
상기에 기재된 바와 같이 생산된 NTP를 관심 RNA 전사시스템에서 유래하는 RNA 중합효소(예를 들어, 박테리오파지 T7 RNA 중합효소) 및 관심 RNA 전사시스템을 구성하는 주형(예를 들어, DNA 주형, 엔지니어링된 세포에 의해서 발현되고 무세포 반응용액의 세포 성분으로서 포함되거나 또는 무세포 반응용액에 추후에 첨가됨)을 사용하여 RNA(동일한 반응용액으로 또는 개별 반응용액로)로 순차적으로 또는 동시에 중합시킬 수 있다.
진핵생물 mRNA를 생산하기 위한 DNA 주형을 제공하고, 여기서 주형에 암호화된 서열의 3' 말단은 폴리아데닐레이트 서열이 뒤따라서, 생성된 RNA는 진핵생물 mRNA의 특징인 폴리아데닐레이트(polyA) 테일을 함유한다. 본 발명에 사용된 바와 같이, 용어 테일이 없는 "polyA 테일이 결여된 RNA"를 기재하는 데 사용된다. 대안적으로, 주형에 암호화된 서열의 3' 말단에 위치된 폴리아데닐레이트 서열을 암호화하지 않는 DNA 주형에서, polyA 중합효소를 첨가하고, ATP의 존재 하에서 배양시킴으로써 polyA 테일을 효소적으로 첨가할 수 있다. ATP는 직접 첨가될 수 있거나, 또는 폴리포스페이트 키나제 및 폴리포스페이트를 사용하여 AMP 및/또는 ADP를 인산화시킴으로써 생산될 수 있다. 진핵생물 mRNA 생산은 하기에 보다 상세하게 제시된 바와 같이, 당업계에 공지된 캡핑 효소 또는 캡핑 시약을 사용하여 달성될 수 있는 5' 캡의 첨가를 추가로 수반한다. 본 발명에 사용된 바와 같이, 용어 비캡핑된은 캡이 결어된 RNA를 의미한다.
무세포에서 RNA 합성(전사-번역)관련 물질은 바이오매스에서(예를 들어, 대장균에서) 높은 역가로 생산될 수 있다. 이어서 세포를 (예를 들어, 고압 균질화를 사용하여) 용해시켜 RNA 합성(전사-번역)관련 물질 또는 발현단위를 함유하는 세포 추출물을 생성시킬 수 있다. 이어서 최종 반응물에 존재하는 바람직하지 않은 RNase을, 예를 들어, PVSA의 첨가 또는 가열에 의해서, 최종 반응물로부터 제거하고(즉, 제거하거나 불활성화하고); 열을 사용하여 이러한 바람직하지 않은 효소활성을 불활성화시킬 수 있다. 바람직하지 않은 효소 활성을 (예를 들어, 물리적 분리, 예컨대, 여과, 침전, 포획 및/또는 크로마토그래피에 의해서) 제거하거나 또는 (예를 들어, 온도, pH, 염, 세제, 알코올 또는 다른 용매 및/또는 화학 저해제에 의해서) 불활성화시킨다.
관심 RNA 전사시스템에 의한 관심 RNA의 중합을 위한 절차
본 발명은 리보핵산을 합성하기 위해서, 최소한 전사 및 번역을 하는 무세포(cell-free) 반응 방법을 특징으로 하며,
(a) 관심 RNA 전사시스템을 포함하고; 여기서, 상기 관심 RNA 전사시스템은 무세포유래 세포에 형질전환되고, 및/또는 추가적으로 첨가될 수 있으며, (b) RNase 활성이 제거되거나 불활성화하는 조건하에서 처리되며, (c) 최소한 전사와 번역을 할 수 있는 무세포 시스템; 또는, (d) 추가적으로 DNA dependent RNA Polymerase(DdRp) 및 그들의 변이체를 포함하는 군에서 선택되어진 어느 하나 발현단위 및/또는 효소를 더 포함하며, 여기서, 상기 발현단위는 무세포 시스템에서 작동하는 프로모터, 조절서열 및 ORF(open reading frame)를 포함하는 DNA이다.
본 발명은 리보핵산을 합성하기 위해서, 최소한 전사 및 번역을 하는 무세포(cell-free) 반응 방법을 특징으로 하며,
리보핵산을 합성하기 위한 전사와 번역을 할 수 있는 무세포(cell-free) 조성물은 DNA Dependent RNA Polymerase(DdRp) 유전자 발현단위 또는 효소; RNase 기능을 억제하는 유전자 발현단위, 단백질 및 화합물을 포함하는 군에서 선택되어진 어느 하나 이상; 포스페이트 공여자를 포함하는 에너지원; 외인성 천연 및/또는 변형된 뉴클레오티드 5'-트리포스페이트 및/또는 캡핑시약을 포함하는 반응시약; 및 RNA 중합효소 발현단위와 관심 RNA 발현단위를 포함하는 관심 RNA 전사시스템;을 포함한다.
본 발명에서 RNA를 합성하기 위한 전사와 번역을 할 수 있는 무세포(cell-free) 조성물은 DdRp 유전자 발현단위 또는 효소; 세포 RNA를 분해하는 RNase 유전자 발현단위 또는 효소; 상기 RNase 기능을 억제하는 유전자 발현단위, 단백질 및 화합물을 포함하는 군에서 선택되어진 어느 하나 이상; 포스페이트 공여자를 포함하는 에너지원; 상기 RNase 분해산물을 기질로 하여 상기 NTP 혼합물을 제조할 수 있는 뉴클레오티드 키나제 유전자 발현단위 또는 효소를 포함하는 혼합물; 및 상기 관심 RNA 전사시스템;을 포함하며, 여기서, 상기 발현단위는 DdRp와 특이적인 결합을 하는 프로모터의 하류에 상기 유전자들이 위치하는 DNA이다.
본 발명에서 RNA를 합성하기 위한 전사와 번역을 할 수 있는 무세포(cell-free) 반응 방법으로서, (a) 원하는 밀도의 세포를 용해시킴으로써, 제조된 무세포 시스템에 DdRp 발현단위 및 이에 상응하는 DdRp를 포함하는 군에서 선택되어진 어느 하나 이상을 내재하거나 공급하거나, 또는 최소한 상기 DdRp 발현단위를 포함하도록 준비된 무세포 시스템을 배양하며 상기 제조된 무세포 시스템에 1종 이상의 RNase 발현단위 및 이에 상응하는 RNase를 포함하는 군에서 선택되어진 어느 하나 이상이 내재되거나 공급하여 상기 무세포 시스템에서부터 세포 RNA를 제거하기 위해, 배양하는 단계; (b) 상기 세포 RNA가 제거된 무세포 시스템를 RNase가 제거되거나 불활성화되는 조건에서 처리하고 전사와 번역을 할 수 있는 제1 반응용액을 준비하는 단계; (c) 상기 제1 반응용액에 (i) 상기 관심 RNA 전사시스템, (ii) 포스페이트 공여자를 포함하는 에너지원, 및 (iii) 외인성 천연 및/또는 변형된 뉴클레오티드 5'-트리포스페이트 및/또는 캡핑시약;을 포함하는 반응시약을 첨가하여 제조된 제2 반응용액을 배양하는 단계; (d) 상기 배양된 제2 반응용액에서 생산된 관심 RNA를 분리 및 정제하며, 여기서, 추가적 선택적으로 RNA 생산 이후에 상기 제2 반응용액에 적어도 1종의 데옥시리보뉴클레아제 발현단위 및 이에 상응하는 데옥시리보뉴클레아제를 포함하는 군에서 선택되어진 어느 하나 이상를 첨가하여 상기 DNA를 분해시키는 조건 하에서 배양하는 과정을 포함하는 단계;를 포함한다.
본 발명에서 RNA를 합성하기 위한 전사와 번역을 할 수 있는 무세포(cell-free) 반응 방법으로서, (a) 원하는 밀도의 세포를 용해시킴으로써, 제조된 무세포 시스템에 DdRp 발현단위 및 그 발현산물을 포함하는 군에서 선택되어진 어느 하나 이상을 내재되거나 공급하거나, 또는 최소한 상기 DdRp 발현단위를 포함하는 무세포 시스템을 배양하며 세포 RNA를 포함하는 무세포 시스템 또는 상기 배양된 무세포 시스템에 1종 이상의 RNase 발현단위 및 그 발현산물을 포함하는 군에서 선택되어진 어느 하나 이상을 공급하여 5'뉴클레오사이드 모노포스페이트(NMP)를 포함하는 혼합물을 제조하고 상기 RNase를 제거되거나 불활성화되는 조건에 처리하여 NMP를 포함하는 혼합물을 준비하는 단계; (b) 단계 (a)에서 배양된 무세포 시스템를 RNase가 제거되거나 불활성화되는 조건에서 처리하고 전사와 번역을 할 수 있는 제3 반응용액을 준비하는 단계; (c) 상기 준비된 제3 반응용액에 (i) 상기 관심 RNA 전사시스템; (ii) 상기 단계 (b)에서 준비된 RNase 분해산물; (iii) 포스페이트 공여자를 포함하는 에너지원; 및 (iv) 뉴클레오티드 키나제 발현단위 및 그 발현산물을 포함하는 군에서 선택되어진 어느 하나 이상 및/또는 캡핑시약;을 포함하는 반응시약을 첨가하여 제조된 제3 반응용액을 배양하는 단계; 및 (d) 상기 배양된 제3 반응용액에서 생산된 관심 RNA를 oligo dT를 포함하는 방법으로 분리 및 정제하며, 여기서, 추가적 선택적으로 RNA 생산 이후에 상기 배양한 제3 반응용액에 적어도 1종의 데옥시리보뉴클레아제 발현단위 및 이에 상응하는 데옥시리보뉴클레아제를 포함하는 군에서 선택되어진 어느 하나 이상를 첨가하여 상기 DNA를 분해시키는 조건에서 배양하는 과정을 포함하는 단계;를 포함한다.
본 발명은 관심 RNA 전사시스템을 포함하는 무세포유래 세포에서 합성된 RNA를 분리하고 캡핑되지 않은 RNA를 제거하고 캡핑 RNA만을 수확하는 방법을 포함한다.
바람직하게, 상기 발명의 무세포 조성물은 (a) 적이도 1종류의 DdRp를 포함하는 무세포 시스템; (b) 세포 RNA를 분해하는 1종 이상의 RNase 발현단위 또는 그 발현산물; (c) 상기 적어도 하나의 리보뉴클레아제를 불활성화시키는 1종 이상의 RNase 저해제 발현단위 및 그 발현산물을 포함하는 군에서 선택되어진 어느 하나 이상; (d) 외인성 천연 및/또는 변형된 뉴클레오티드 5'-트리포스페이트, 뉴클레오티드 키나제 발현단위 및 그 발현산물을 포함하는 군에서 선택되어진 어느 하나 이상; (e) 헥사메타포스페이트를 포함하는 포스페이트 공여자; (f) 캡핑시약; (g) DNase; (h) DdRp 발현단위 또는 그 발현산물; (i) 관심 RNA 전사시스템; 및/또는 (j) 무세포 단백질 합성 반응시약;를 포함하는 키트를 제공할 수 있다.
추가로, 세포 RNA의 분해 이외의 방법에 의해서 생산된 뉴클레오타이드(예를 들어, 발효 공정, 화학 공정 또는 화학효소 공정으로부터 유래된 뉴클레오타이드)를 또한 뉴클레오타이드로서 사용함으로써, 각각의 실시형태에 대한 필요성을 제거할 수 있다. 이러한 뉴클레오타이드는 NMP, NDP, NTP 또는 이들의 혼합물을 포함할 수 있다. 추가로, 이러한 뉴클레오타이드는 비변형된 뉴클레오타이드, 변형된 뉴클레오타이드, 또는 이들의 혼합물 중 1종 이상으로 이루어질 수 있다. 이러한 뉴클레오타이드는 1종 이상의 비변형된 NMP 및 1종 이상의 변형된 NTP 또는 비변형된 AMP, CMP 및 GMP(슈도UTP를 가짐) 또는 비변형된 AMP, GMP, 슈도UTP 및 5-메틸 CTP로 추가로 이루어질 수 있다. 변형된 뉴클레오타이드를 세포-유래된 뉴클레오타이드에 첨가하여 부분적으로 변형된 생성된 mRNA를 달성할 수 있다. 이와 일관되게, 이러한 뉴클레오타이드의 사용은 본 발명에서 실시형태에 기재된 바와 같은 mRNA를 생산할 수 있다.
mRNA를 합성하는 방법은 각각 NMP 또는 NDP로 분해된 세포 RNA로부터 생산된 비캡핑된 mRNA 중 임의의 것에 내부 리보솜 유입 부위(IRES)를 포함시키는 것을 포함한다. 비캡핑된 mRNA를 캡핑 효소(들)를 사용하여 캡핑시켜 캡핑된 mRNA를 생산한다. 또는 그 다음 각각 NMP 또는 NDP로 분해된 세포 RNA로부터 생산된 비캡핑된 mRNA를 캡핑 효소(들)를 사용하여 캡핑시켜 캡핑된 mRNA를 생산한다. RNA-중합효소-함유 단계는 또한 cap 유사체를 포함하여, 비캡핑된 RNA 대신 캡핑된 mRNA를 생산하고 후속 효소적 캡핑 단계(들)에 대한 필요성을 제거한다.
RNA 최종 생성물의 예는 바람직하게는 메신저 RNA(mRNA)를 포함한다. RNA 최종 생성물(생합성된 RNA)의 농도는 적어도 1g/ℓ 내지 50g/ℓ이다. 예를 들어, RNA 최종 생성물의 농도는 1, 5, 10, 15, 20, 25, 30, 35, 40, 45 또는 50g/ℓ 또는 그 초과일 수 있다. 다수의 실시형태에서, RNA 최종 생성물의 농도는 적어도 1g/ℓ이다. 단일 배취는 최대 10,000ℓ 또는 이를 초과할 수 있다.
엔지니어링된 세포
본 발명의 엔지니어링된 세포는 RNA를 생합성하는 데 요구되는 효소 활성 중 적어도 1종, 대부분 또는 전부를 포함한다. "엔지니어링된 세포"는 적어도 1종의 엔지니어링된(예를 들어, 재조합 또는 합성) 핵산, 발현단위를 포함하거나, 그렇지 않다면 이들이 이들의 자연 발생 대응물과 구조적으로 그리고/또는 기능적으로 구별되도록 변형된 세포이다. 따라서, 엔지니어링된 핵산을 함유하는 세포는 "엔지니어링된 세포"로 간주된다.
본 발명의 엔지니어링된 세포는 RNA, RNA를 분해시키는 효소, 키나제 및/또는 중합효소 또는 RNase 활성을 제거하거나 불활성화하는 조건을 포함한다. 엔지니어링된 세포는 mRNA를 암호화하는 뉴클레오타이드 서열에 작동 가능하게 연결된 프로모터를 함유하는 DNA 주형을 더 포함한다.
엔지니어링된 세포는 선택 가능한 마커를 발현한다. 선택 가능한 마커는 전형적으로 세포의 형질주입 후(또는 외래 핵산을 세포 내로 도입하는데 사용되는 다른 절차 후) 엔지니어링된 핵산을 흡수하는 세포를 선택하는 데 사용된다. 따라서, 생성물을 암호화하는 핵산은 또한 선택 가능한 마커를 암호화할 수 있다. 선택 가능한 마커의 예는 비제한적으로 항생제에 대한 내성 또는 민감성을 증가시키거나 감소시키는 단백질 (예를 들어, 암피실린 내성 유전자, 카나마이신 내성 유전자, 네오마이신 내성 유전자, 테트라사이클린 내성 유전자 및 클로람페니콜 내성 유전자) 또는 다른 화합물을 암호화하는 유전자를 포함한다. 선택 가능한 마커의 추가의 예는 비제한적으로 세포가 다른 필수적인 영양분이 결핍된 배지에서 성장하는 것을 가능하게 하는 단백질(영양요구성 마커)을 암호화하는 유전자를 포함한다. 다른 선택 가능한 마커는 본 발명에 따라 사용될 수 있다.
엔지니어링된 세포는, 핵산(예를 들어, 엔지니어링된 핵산)에 의해 암호화된 생성물이 세포에서 생성되는 경우, 생성물을 "발현한다". 유전자 발현은 핵산의 형태의 유전적 지시가 생성물, 예컨대 단백질(예를 들어, 효소)을 합성하는데 사용되는 과정을 지칭함이 당업계에 공지되어 있다.
엔지니어링된 세포는 원핵생물 세포 또는 진핵생물 세포일 수 있다. 엔지니어링된 세포는 박테리아 세포, 효모 세포, 곤충 세포, 포유동물 세포, 또는 다른 유형의 세포이다. 예는 효모, 대장균 또는 비브리오세포를 포함하지만 이들로 제한되지 않는다. 이들 세포는 상업적으로 공급될 수 있다. 이들 세포는 표준 고 생산성 방법을 사용하여 배양물에서 성장될 수 있다.
본 발명의 엔지니어링된 박테리아 세포는 비제한적으로 엔지니어링된 에쉐리키아 종, 스트렙토마이세스(Streptomyces) 종, 지모모나스(Zymomonas) 종, 아세토박터 종, 시트로박터 종, 시네코시스티스 (Synechocystis) 종, 리조비움 종, 클로스트리디엄(Clostridium) 종, 코리네박테리움(Corynebacterium) 종, 스트렙토코커스 (Streptococcus) 종, 잔토모나스 종, 락토바실러스 종, 락토코커스(Lactococcus) 종, 바실러스(Bacillus) 종, 알칼리게네스 종, 슈도모나스 종, 아에로모나스 종, 아조토박터 종, 코마모나스 종, 마이코박테리움(Mycobacterium) 종, 로도코쿠스(Rhodococcus) 종, 글루코노박터(Gluconobacter) 종, 랄스토니아(Ralstonia) 종, 악시디티오바실러스(Acidithiobacillus) 종, 미크로루나투스(Microlunatus) 종, 게오박터(Geobacter) 종, 게오바실러스(Geobacillus) 종, 아르트로박터(Arthrobacter) 종, 플라보박테리움(Flavobacterium) 종, 세라티아(Serratia) 종, 사카로폴리스포라(Saccharopolyspora) 종, 써무스(Thermus) 종, 스테노트로포모나스(Stenotrophomonas) 종, 크로모박테리움 (Chromobacterium) 종, 시노리조비움(Sinorhizobium) 종, 사카로폴리스포라 종, 아그로박테리움 종 및 판토에아 종을 포함한다.
본 발명의 엔지니어링된 효모 세포는 비제한적으로 엔지니어링된 사카로마이세스종, 쉬조사카로마이세스(Schizosaccharomyces), 한세눌라(Hansenula), 칸디다(Candida), 클루이베로마이세스(Kluyveromyces), 야로위아(Yarrowia) 및 피치아(Pichia)를 포함한다.
본 발명의 엔지니어링된 세포는 엔지니어링된 대장균, 바실러스 섭틸리스 세포, 슈도모나스 푸티다 세포, 사카로마이세스 세레비지애 세포 또는 락토바실러스 섭틸리스 브레비스 세포이다. 본 발명의 엔지니어링된 세포는 엔지니어링된 대장균이다. 본 발명에 사용된 바와 같이, "로부터"는 유전자 및 유전자 생성물이 그 종에서 암호화되고, 자연적으로 생산된다는 것을 의미하고, 이 용어는 특히 이종 종, 특히 박테리아, 효모 또는 다른 재조합 숙주에서 이러한 종 및 재조합 생산으로부터의 단리를 포함하도록 의도된다.
본 발명의 무세포 RNA-생합성 방법은 단일 엔지니어링된 세포에서 발현될 수 있다(그러나 반드시 그럴 필요는 없다). 예를 들어, 엔지니어링된 세포의 클론 집단을 목적하는 세포 밀도로 배양하고, 세포를 용해하고, 내인성 RNA가 단량체 형태로 분해되는 조건(예를 들어, 30 내지 37℃의 온도)에서 배양하고, 내인성 뉴클레아제 및 포스파타아제를 불활성화시키기에 화합물을 첨가하거나 충분한 온도(예를 들어, 40 내지 99℃)에 적용하고, ss RNA의 중합을 초래하는 조건(예를 들어, 30 내지 50℃)에서 배양시킨다. 최종 생성물 합성 RNA로 진행시키기 위해서, NMP에서 NDP로의 전환에 필요한 효소(예를 들어, 뉴클레오사이드 모노포스페이트 키나제 및/또는 폴리포스페이트 키나제), NDP에서 NTP로의 전환에 필요한 효소(예를 들어, 뉴클레오사이드 다이포스페이트 키나제 및/또는 폴리포스페이트 키나제) 및 NTP에서 RNA로의 전환에 필요한 효소(예를 들어, 중합효소)는 내인성 뉴클레아제(및/또는 외인성 뉴클레아제) 및 포스파타제의 열 불활성화 동안 변성을 피하기 위해 열안정성일 수 있다. 열안정성은 상대적으로 높은 온도에서 변성에 저항하는 효소의 품질을 나타낸다. 예를 들어, 효소가 42℃의 온도에서 변성(불활성화)되는 경우, 유사한 활성(예를 들어, 키나제 활성)을 갖는 효소가 42℃에서 변성되지 않으면 "열안정성"으로 간주된다.
IV. 합성 시스템에서 RNA 및/또는 유용물질 연속 생산 방법
본 발명의 합성 시스템에서 RNA 및/또는 유용물질의 연속 생산을 위한 방법 및 시스템에 관한 것이다. 구체적으로 합성 시스템에서 RNA 및/또는 유용물질의 생산을 위해 단일 챔버 바이오리액터 또는, 합성 시스템에서 RNA 및/또는 유용물질의 연속 생산을 위해 다중 챔버 바이오리액터와 한외여과 모듈이 장착된 한외여과(ultrafiltration, UF)/정용여과(diafiltration, DF) 공정을 사용하는 방법 및 시스템에 관한 것이다. 본 발명의 방법 및/또는 시스템은 한외여과막 장치를 매개로 RNA 및/또는 유용물질을 생산하는 챔버와 그들의 반응 원재료를 생산 및 공급하는 챔버를 포함할 수 있으며 RNA 및/또는 유용물질의 연속적이고 시간-효율적인 생산을 제공한다.
한외여과 모듈 제조사는 Merck, Pall, Repligen 및 Sartorius 등이 있으며 국내 대다수의 제약사에 공급하고 있다. UF/DF 공정에서 사용되는 분리막은 고효율의 항체 회수를 위하여 단백질 흡착능이 낮은 것으로 알려진 regenerated cellulose (RC) 혹은 polyethersulfone (PES) 재질을 사용한다.
<도 2>에서처럼, 합성 시스템에서 RNA 및/또는 유용물질을 생산하기 위한 연속 방법이 본 발명에 제공되며, 상기 방법은 하나 또는 복수의 한외여과/정용여과 시스템을 사용하여 실질적으로 합성 시스템으로부터 RNA 및/또는 유용물질을 포함하는 반응용액이 있는 1차 챔버와 상기 물질의 반응 원재료를 포함하는 반응용액이 있는 2차 챔버를 하나 또는 복수의 한외여과/정용여과 시스템으로부터 투석 여과한다. 1차 챔버는 RNA 및/또는 유용물질의 연속 생산을 하며, 2차 챔버는 RNA 및/또는 유용물질에 필요한 반응원재료의 연속 생산을 하며, 한외여과/정용여과 시스템을 통하여, 1차 챔버는 RNA 및/또는 유용물질의 연속 생산에 필요한 반응원재료를 공급받고 생산에 따는 부산물을 방출하며, 2차 챔버는 RNA 및/또는 유용물질의 연속 생산에 필요한 반응원재료를 1차 챔버에 공급하고 1차 챔버의 생산에 따른 부산물을 여과할 수 있다.
1차 챔버 및/또는 2차 챔버를 노즐을 사용하여 한외여과/정용여과 시스템에 연결하며 그 부위에 여과막을 설치할 수도 있다.
1차 챔버는 RNase 활성을 불활성 조건을 처리하며 2차 챔버는 RNase 활성을 유지할 수도 있다. 정제된 RNA 및 또는 유용뮬질 생산에 관련된 물질을 사용하여 1차 챔버에서 RNase 활성을 관리할 수도 있다.
RNA 합성을 위하여, 상기 바이오리액터는 (a) (i) RNA 중합효소에 대한 발현단위, mRNA 및 효소를 포함하는 군에서 선택되어진 어느 하나 이상 및 (ii) 관심 RNA 발현단위를 포함하는 상기 1차 챔버; 및 (b) (i) RNA 중합효소에 대한 발현단위, mRNA 및 효소를 포함하는 군에서 선택되어진 어느 하나 이상, 및 (ii) 세포 RNA를 rNMP 또는 rNDP를 걸쳐서 rNTP 제조에 필요한 kinase들에 대한 발현단위, mRNA 및 효소를 포함하는 군에서 선택되어진 어느 하나 이상을 포함하며, 추가적 선택적으로 (i) 포스페이트 공여자를 포함하는 에너지원, (ii) 외인성 천연 및/또는 변형된 뉴클레오티드 5'-트리포스페이트 및 (iii) 캡핑시약;을 포함하는 군에서 선택되어진 어느 하나 이상의 반응시약을 추가적으로 더 첨가하여 제조된 반응용액을 포함하는 상기 2차 챔버;포함한다.
상기 RNA 중합효소는 (a) (i) DNA dependent RNA Polymerase(DdRp) 및 (ii) DNA dependent RNA Polymerase(DdRp) 및 캡핑효소 또는 이들의 융합효소;를 포함하는 군에서 선택되어진 어느 하나를 최소한 포함하고, 선택적으로 (b) RNA dependent RNA Polymerase(RdRp);를 포함한다.
합성 시스템에서 RNA 및/또는 유용물질을 포함하는 단일 혼합물로 용출액이 균질화되는 단계, 상기 균질화된 단일 혼합물을 하나 또는 복수의 한외여과/정용여과에 적용하고, RNA 및/또는 유용물질을 포함하는 1차 챔버와 반응 원재료를 포함하는 2차 챔버의 생성물 산출물을 한외여과 및 정용여과에 적용하여 RNA 및 유용물질을 투석여과하는 단계를 포함하며, 상기 방법은 통합되고, 연속적으로 실행된다.
"연속 방법" 또는 "연속 시스템"은 유체가 단위 작업의 적어도 일부를 통해 연속적으로 공급되는 방법 또는 시스템을 의미한다. 단위 작업은 장기간 연속 유량 입력을 처리할 수 있는 경우 연속적이다.
연속적인 단위 작업은 최소 내부 보유 체적을 갖는다. 산출은 연속적이거나 순환 방식으로 생성된 작은 패킷으로 이산화될 수 있다. 방법은 그 사이에 0 또는 최소 보유 체적이 있는 통합된(물리적으로 연결된) 연속 단위 작업으로 구성되는 경우 연속적이다.
본 발명의 시스템은 폐쇄 시스템이다. 폐쇄 시스템은 외부 환경에 대한 노출을 제한하도록 설계 및 운영되는 단위 작업을 포함한다. 재료가 폐쇄 시스템에 도입될 수 있지만, 생성물이 실내 환경에 노출되는 것을 방지하는 방식으로 추가해야 한다.
본 발명의 방법 및 시스템은 RNA 및/또는 유용물질을 추가로 투과여과하기 위한 한외여과(UF) 및/또는 정용여과(DF)를 포함한다. UF/DF는 RNA 및/또는 유용물질의 농도를 증가시킬 뿐만 아니라 완충 염을 특정 제제 완충액으로 대체할 수 있다. 한외여과(UF)는 정수압이 반투막에 대해 액체를 밀어내는 일종의 막 여과를 의미한다. UF는 단일 TFF 및 고성능 접선 유동 여과(HPTFF)를 포함하는 접선 유동 여과(TFF)로 수행된다. 기존의 TFF 공정과 달리 여러 개의 카세트를 통한 단계적 흐름 경로를 사용하여 한 번의 모듈통과로 원하는 농도로의 농축을 가능하게 하는 단일 패스 접선 유동 여과(SPTFF)는 모듈을 통한 단일 패스의 변환(투과 유량을 입구 공급 유량으로 나눈 값)이 시스템을 잔류물을 위한 재활용(재순환) 루프 없이 작동할 수 있을 만큼 충분히 큰 임의의 TFF 시스템을 의미한다.
SPTFF는 예를 들어 크로마토그래피 또는 침전 단계 전에 공정 부피를 줄이기 위해 다른 단위 작업 사이의 인라인 농축에 사용할 수 있다. Zydney, Biotechnol. Bioeng. 113(3): 465-75 (2016).
사용된 "정용여과"는 항체, 펩타이드, 핵산 및 기타 생체분자와 같은 바이오물질을 함유하는 용액으로부터 염 또는 완충 성분을 제거하거나, 대체시키거나, 또는 염 또는 완충 성분의 농도를 더 낮추기 위해 한외여과 막을 사용하는 방법을 의미한다. 연속 정용여과(일정 부피 정용여과라고도 함)는 물 또는, 제형 완충액과 같은 새로운 완충액을 잔류물에 첨가하여 잔류물에서 원래의 완충염(또는 기타 저분자량 종)을 세척하여 본 발명의 관심 RNA 전사시스템을 포함하는 합성 시스템으로 생산된 RNA 및/또는 유용물질를 함유하는 제형을 형성하는 것을 포함한다. 전형적으로, 새로운 완충액은 여과액이 생성되는 것과 동일한 속도로 첨가되어 정용여과 동안 잔류물 부피와 생성물 농도가 눈에 띄게 변하지 않도록 한다.
정용여과는 단일-통과 정용여과 카세트를 사용하여 수행될 수도 있다.
본 발명의 방법 및 시스템은 UV 흡광도에 의해 검출된 RNA 및/또는 유용물질 수준의 검출, 유속 검출, 및/또는 액체(예를 들어, 완충액) 부피 검출을 포함하는 인라인 모니터링을 포함한다. RNA 및/또는 유용물질 농도 모니터링(예를 들어, UV 모니터링에 의해 수행되는 모니터링)은 피드백 제어로 생성물 농도의 인라인 측정을 할 수 있는 임의의 도구에 의해 결정될 수 있다.
본 발명의 시스템은 또한, 임의의 단위 작업 사이에 배치된 유체 도관을 포함할 수 있다. 적합한 유체 도관은, 폴리에틸렌, 폴리카보네이트, 또는 플라스틱으로 제조된 튜브일 수 있다. 유체 도관은 다음 중 하나 이상을 임의의 조합으로 또한 포함할 수 있다: 유체 도관과 유체 연통되고 인라인 완충액 조절 저장소(들) 내에 저장된 완충액이 유체 도관에 존재하는 유체에 첨가되도록 위치한 하나 이상의 인라인 완충액 조절 저장소; 및 유체 도관에 존재하는 유체를 여과(예를 들어, 박테리아를 제거)할 수 있도록 유체 도관 내에 배치된 하나 이상의 필터.
본 발명의 시스템은 펌프 시스템을 포함한다. 펌프 시스템은 다음 중 하나 이상을 포함할 수 있다: 당업계에 공지된 하나 이상의 펌프, 당업계에 공지된 하나 이상의 필터, 및 하나 이상의 UV 검출기.
한외여과/정용여과 후, 하나 이상의 부형제가 생성물 산출물에 첨가되어 치료 의약 물질을 생성한다.
본원에 사용된 "치료 의약 물질"은, 오염 단백질, 지질, 및 핵산(예를 들어, 액체 배양 배지에 존재하거나 숙주세포(예를 들어, 포유류, 효모, 또는 박테리아 숙주세포)로부터의 오염 단백질, 지질, 및 핵산) 및 생물학적 오염물(예를 들어, 바이러스 및 박테리아 오염물)로부터 충분히 정제되었거나 단리되어, 더 이상의 실질적 정제 및/또는 오염 제거 단계 없이 약제로 제형화될 수 있는 재조합 단백질을 포함하는 물질을 의미한다.
V. 하류 가공
본 발명에 제공된 방법 및 시스템은 RNA 생성물을 0.5 내지 10g/ℓ(예를 들어, 0.5, 1, 2, 3, 4, 5 또는 10g/ℓ)의 농도로 수집한다. 하류 가공은 순도를 중량 기준으로 99%(예를 들어, 75, 80, 85, 90, 95, 96, 97, 98, 또는 99 중량%) RNA만큼 증가시킨다. 하류 가공의 예를 도시하며, 이는 단백질 침전제(예를 들어, 염화리튬)의 첨가로 시작한 후, 디스크-적층 원심분리(DSC)시켜 단백질, 지질 및 일부 DNA를 생성물 스트림으로부터 제거한다. 그 후, oligo d(T) column 또는 한외여과를 실행하여 염 및 부피를 제거한다.
무세포 RNA 반응용액에 대한 LiCl의 첨가는 RNA 생성물의 침전으로 이어지고, 이를 이어서 디스크 적층 원심분리를 사용하여 벌크 액체로부터 분리시켜, 예를 들어, 약 80% 순도의 RNA 생성물을 수집할 수 있다. 추가의 크로마토그래피 처리는 약 99%의 순수한 생성물을 수집할 수 있다.
바람직하게, 본 발명에서 CFR RNA의 빠른 수확을 위한 LiCl 용액을 사용한다. RNA의 LiCl 침전은 통합되지 않은 대부분의 NTP 및 효소를 제거하는 데 효과적이다. 그러나 300개 염기보다 짧거나 0.1mg/ml보다 낮은 농도의 RNA는 잘 침전되지 않는다. 이러한 경우 다른 정제 방법을 사용할 수 있다. 알코올과 나트륨 또는 암모늄 이온과 같은 1가 양이온을 사용한 침전이 훨씬 보편적으로 사용되지만 LiCl은 제조하는 RNA를 침전시키기 위해 자주 사용한다.
본 발명에서는 LiCl을 RNA를 침전시키기 위해 사용하였지만, 보편적으로. 알코올과 나트륨 또는 암모늄 이온과 같은 1가 양이온을 사용한 침전이 사용되지만 LiCl 침전은 DNA, 단백질 또는 탄수화물을 효율적으로 침전시키지 않는다는 점에서 다른 RNA 침전 방법에 비해 주요 이점을 제공한다.
LiCl 침전의 주요 변수는 (a) 침전물이 형성되는 온도, (b) RNA 및 사용된 염화리튬의 농도 및 (c) 수집에 사용된 원심분리 시간 및 속도 침전된 RNA 등이다. 이러한 방식으로 준비된 LiCl 침전 RNA 샘플이 혼성화 및 시험관 내 번역 반응에 사용하기 위해 더 이상의 정제가 필요하지 않다. 또 다른 장점은 리튬 침전이 통합되지 않은 NTP를 효율적으로 제거하여 UV 분광광도법으로 보다 정확한 정량을 가능하게 한다.
LiCl 침전의 최적화
pH의 영향. 수소 결합은 생체 분자의 양성자화 증가로 인해 pH가 감소함에 따라 더 강해진다. 이것은 RNA가 점점 산성 pH에서 더 강하게 결합한다는 것을 의미한다. 또한, 오염 물질에 의한 비특이적 결합을 촉진하고 용출 중 RNA 회수를 억제할 가능성이 있다. pH를 높이면 반대 효과가 나타나야 하며 이는 용출 중 회수를 향상시키는 데 유용할 수 있다.
염의 효과. 다양한 종류의 염과 농도로 실험하는 것이 유익할 수 있지만 결합 및 용출을 제어하는 화학적 메커니즘인 정전기 반발 및 수소 결합에 서로 다른 영향을 미친다. 많은 염이 RNA를 침전시킨다.
염화나트륨 및 염화칼륨과 같은 중성염은 정전기 반발에 강한 영향을 미치지만 수소 결합에는 상대적으로 약한 영향을 준다. 염화나트륨이 오염 물질에 의한 비특이적 결합을 억제하는 데 도움이 되는 가상의 이점과 함께 매우 높은 농도에서 적용 가능해야 한다. 그러나 이들이 형성하는 RNA 침전물이 컬럼을 통한 흐름을 방해할 가능성이 있어 비실용적이다.
염화 구아니디늄과 같은 카오트로픽 염은 정전기 반발에 동등한 효과를 갖지만 수소 결합에 훨씬 더 강한 효과를 가지며 RNA의 용해도를 유지한다. 샘플에 존재하면 비특이적 결합을 더 크게 억제하여 더 많은 오염 물질을 제거할 수 있지만 원하는 RNA에 대한 결합 능력을 감소시킬 위험이 있다. 이들은 회수를 향상시키고 RNA가 더 좁은 피크에서 용리되도록 하는 효과가 있는 용출 완충액에 추가할 수 있지만, 이들의 존재는 후속 크로마토그래피 방법에서 샘플 결합의 효율성에 후속적으로 영향을 미칠 수 있다.
인산염, 황산염 및 구연산염과 같은 다가 음이온을 포함하는 염은 중간 특성을 가지고 있다. 몰당 몰로 1가 염보다 정전기 상호 작용을 더 효과적으로 억제한다. 그들은 또한 운반하는 산소 잔류물로 인해 중성 염보다 더 효과적인 수소 공여체-수용체이다. 부정적인 측면에서는 생체 분자 간의 결합을 촉진하여 복합체와 침전물을 형성하는 경향이 있으므로 농도를 낮게 유지해야 한다. 더 미묘한 문제는 ss RNA의 형태를 변경하고 dsRNA, DNA 및 단백질과의 금속 다리 결합 형성을 촉진할 수 있는 다가 금속 양이온으로 종종 심하게 오염될 수 있다. 인산염 완충액은 일반적으로 피로인산염 함량을 나타내기 위해 표시가 없다. 무수 인산염 완충액은 수화수를 제거하는 데 사용되는 고온 때문에 피로인산염의 비율이 가장 높다. 인산염을 전혀 사용하지 않는 경우 수화 인산염을 사용하는 것이 좋다.
킬레이트 염에는 CIMmultus Oligo dT의 성능을 향상시키는 특별한 기능으로 다가 금속 양이온, 핵산 및 단백질 사이에서 금속 다리 복합체를 분리한다. 즉, 그들은 ss RNA와 오염 물질 사이의 큰 비특이적 복합체를 분해하는 경향이 있다. 샘플과 평형/세척 완충액에 존재할 때 가장 효과적이다. 5-10mM 범위의 농도를 고려할 수 있다.
기타 첨가제의 효과. 요소와 같은 비이온성 카오트로프는 수소 결합을 약화시킨다. 요소는 샘플에 존재하는 경우 결합 능력을 감소시킬 수 있지만 용출 중 RNA 회수를 개선하거나 더 좁은 피크에서 용리되도록 할 수 있다. 10M까지의 농도에서 사용할 수 있지만 일반적으로 4-8M 범위가 더 일반적이다. 소르비톨과 자일리톨을 포함한 당도 강력한 수소 공여체 수용체이며 200mM. 설탕은 점도를 증가시키지만 대류 물질 전달의 효율은 점도와 무관하기 때문에 단일체에서는 문제가 되지 않는다.
온도의 영향. 온도를 높이면 수소 결합이 약해진다. RNA 샘플은 종종 크로마토그래피 컬럼에 적용하기 전에 그리고 때때로 크로마토그래피 중에 고온에 노출된다. 샘플 적용 중 더 높은 온도는 결합 능력을 감소시킬 위험이 있다. 용출 중 온도가 높을수록 RNA 회수가 향상되어 더 날카로운 피크에서 용출될 수 있다. 이것은 제어되지 않은 작동 온도가 재현성을 손상시킬 수 있다.
캡핑 RNA의 회수
본 발명의 무세포 발현 시스템 또는 세포를 이용한 관심 RNA 생산 방법은 mRNA, dsRNA, RNA 압타머를 포함하는 다양한 RNA를 생산할 수 있다. 또한 캡핑구조가 있는 mRNA 또는 캡핑구조가 없는 mRNA를 생산할 수 있다, 캡핑구조가 있는 mRNA 만을 회수하기 위해 캡핑구조가 없는 mRNA를 제거함으로써 소기의 목적을 달성할 수 있다. 5' 말단에서 캡 구조의 존재는 IVT mRNA의 안정성과 번역성을 증가시키는 주요 특징 중 하나이다. 캡이 있는 mRNA는 일반적으로 캡이 없는 mRNA에 비해 더 효율적으로 번역된다. 합성 후, mRNA의 효소 및 공동 전사 캡핑이 불완전할 수 있으며, 이는 최종 mRNA에 다양한 수의 캡핑되지 않은 분자가 존재할 수 있다.
본 발명에서 mRNA의 다운스트림 적용에 따라 캡이 없는(즉, 5'-삼인산화) RNA를 제거할 필요가 있다. 캡핑되지 않은 RNA는 5'-폴리포스파타제(5'-ppp-mRNA에서 피로포스페이트를 방출하여 5'-p-mRNA를 생성함)와 엑소리보뉴클레아제 XRN1(5'-p-mRNA의 5'→3' 소화를 위해)의 연속적인 작용에 의해 분해할 수 있다.
합성된 RNA의 초정제(ultrapurification)
mRNA 생성물은 염화리튬 침전 프로토콜에 의해서 침전된다. 치료제로서 전령 RNA(mRNA), 특히, 캡핑된 mRNA에 대한 수요가 증가함에 따라 더 큰 생산 규모와 더 효율적인 추출 기술이 필요하다. 메신저 RNA는 시험관 내 전사 반응(IVT)에 의해 생성되거나 진핵세포에서 분리될 수 있다. 추출을 위한 가장 편리한 기술 중 하나는 고체 지지체에 결합된 올리고 데옥시티민(dT)을 사용하는 것이다. 올리고 dT는 대부분의 진핵생물 mRNA에 존재하거나 IVT 동안 분자에 합성되는 폴리아데닐화된 꼬리에 혼성화한다.
본 발명에서는 poly(A)가 있는 관심 RNA와 혼재되어 있는 여러 종류의 발현단위에서 합성되는 poly(A)가 없는 RNA, 단백질, 미반응 뉴클레오티드, 플라스미드 DNA, CAP 유사체, 부분 RNA, dsRNA 부산물 및 효소와 같은 오염 불순물은 폴리-A 부분이 부족하고 고체 지지체에 유지되지 않는다. 다른 정제 방법을 또한 사용할 수 있다.
mRNA 생성물은 문헌[Weissman et al., 2013, "HPLC purification of in vitro transcribed long RNA." Methods in molecular biology (Clifton, NJ), 969, 43]에 기재된 역상 이온쌍 고성능 액체 크로마토그래피를 통해서 초정제(ultra purified)된다. 역상 HPLC를 사용하여 오염 핵산 생성물, 예를 들어, 바람직하지 않은 면역 반응으로 이어질 수 있는 이중-가닥 핵산을, mRNA 제제로부터 제거할 수 있다.
단일체와 같은 큰 채널로 구성된 고체상을 사용하는 크로마토그래피는 높은 유속과 낮은 전단력을 허용하다. 이는 생물학적 제제의 정제에서 회수 및 생산성에 긍정적인 영향을 미칠 수 있다. 또한 크로마토그래피는 교차 오염 또는 RNase 분해에 대한 노출 위험을 최소화하는 폐쇄형 시스템과 쉽게 확장 가능한 플랫폼을 제공하다.
CIMmultus™ Oligo dT는 표면에 Oligo dT 리간드가 공유 결합된 크로마토그래피 컬럼이다. 폴리아데닐화된 mRNA를 포함하는 샘플은 고염 농도 완충액의 컬럼에 로드된다. 염 이온은 음전하를 띤 백본 사이의 정전기적 반발을 차단하고 올리고 dT와 mRNA의 폴리아데닐화된 꼬리 사이의 상호작용을 허용한다. 제품 용출 전에 염 농도를 낮추는 세척 단계를 통해 비특이적으로 결합된 오염 물질을 제거한다. 전령 RNA의 용출은 중성 pH의 낮은 전도도 완충액에서 온화한 조건에서 발생한다. 염분이 없을 때 Oligo dT의 음전하를 띤 백본과 폴리아데닌 사이의 정전기적 반발은 T-A 쌍을 불안정하게 만들고 컬럼에서 mRNA를 방출한다.
올리고 dT 분리는 폴리 A 태그가 있는 시퀀스를 분리하는 데 매우 유용한 방법이다. 일반적으로 사람들은 mRNA의 전체 세포 준비에 이 컬럼을 사용하지만, 또한 주로 폴리 A 부분이 있는 합성 RNA 분자를 분리하는 데 사용할 수도 있다. 셀룰로오스 수지는 표적 올리고-A 트랙과 특정 왓슨-크릭 염기쌍을 형성하는 올리고-dT와 공유 결합할 수 있다. 상보적 서열이 없는 올리고뉴클레오티드는 레신에 결합하지 않으므로 컬럼을 통과한다. 일반적으로 세척 단계는 염 농도를 낮추고 비특이적 결합을 줄이기 위해 용출 전에 포함된다. 용출은 물 또는 저염 농도를 사용하여 진행할 수 있다.
RNA의 자기 분리
고구배 자기 분리(High gradient magnetic separation, HGMS)는 현탁액에서 자화 가능한 구성요소를 선택적으로 분리하는 데 사용할 수 있다. 이 기술은 이미 생명공학 분야의 다양한 작업 그룹에서도 적용하고 있다. 고정된 효소의 분리, 표적 분자의 분리 등에서 표적 분자는 반응용액의 기능화된 입자 표면에 특이적으로 흡착되고 자기 분리가 발생한 후 자기 입자(자성 비드라고 함)에서 다시 탈착할 수 있다. 광범위한 자기 분리기와 자기 입자 시스템이 있다. 단백질, mRNA 및 바이러스의 생물학적 분리에 널리 사용되는 미세 입자 시스템 중 하나는 Dynabeads이다.
현재 생물약학 분야에서 중요성이 증가하고 있는 것은 백신 제조를 위한 mRNA의 생산이다. 백신 생산 내에서 그 과정에서 mRNA의 분리 및 정제가 필요하다. 이것은 oligo(dT) 셀룰로오스를 사용하는 친화성 크로마토그래피 또는 oligo(dT) 기능화가 부착된 폴리스티렌 라텍스 입자를 사용하여 수행할 수 있다. 또한 mRNA는 14-25 개의 티민 염기서열을 가진 올리고(dT) 자성 입자로 정제할 수 있다. 이를 위해 확립되고 자동화 가능한 실험실 프로토콜이 이미 mL 규모에서 있다. 이러한 프로토콜에서는 연속적인 자기 분리 및 재분산 절차를 포함하여 여러 버퍼 변경 및 세척 단계가 수행된다. mRNA를 준비하는 데 사용되는 세포 현탁액은 일반적으로 세척되고 원심 분리되어 세포 펠렛을 얻을 수 있다. 그런 다음 용해/결합 완충액을 세포 펠릿에 추가하여 세포 용해를 시작하고, 이는 피펫 팁을 통해 용액을 반복적으로 통과시켜 수행한다. 기능화된 자성 입자에 대한 세포와 함께 생성된 mRNA의 어닐링은 또한 진탕하면서 실온의 용해/결합 완충액에서 발생한다. 자기 분리 후 mRNA-loaded oligo(dT) 자성 입자는 먼저 두 가지 다른 세척 완충액으로 세척하여 비특이적 부착 불순물을 제거한다. mRNA를 용출하기 전에 마지막 세척 버퍼를 제거하고 입자에 Tris-HCl 버퍼를 추가한다. mRNA의 용출은 상승된 온도에서 수행한다. 상층액에는 mRNA가 포함되어 있으며 추가적인 자기 분리에 의해 명확해질 수 있다.
자성 입자는 자기장이 가해지면 상호작용으로 서로 뭉친다. mRNA는 각각 상보적인 염기쌍과 그 서열의 상호작용으로 인해 응집된다. 단백질을 통한 RNA 분자의 가교도 일어날 수 있다. 따라서 위에서 설명한 자기 분리 단계에서 mRNA 로딩으로 인해 입자 덩어리가 발생할 수도 있다. 자성 입자의 덩어리는 자기 비드의 덩어리가 전체 기능 표면적을 감소시켜 mRNA의 혼성화 및 용출 동안 수율 손실을 초래할 수 있어 바람직하지 않다. 분자에 대한 흡착 속도를 감소시키는 더 긴 확산 경로를 유발하는 이러한 감소된 표면적으로 설명할 수 있다. 또한, 분자의 흡착 및 용출 수율 감소로 인해 응집을 피하는 것이 좋다. 자성 입자의 응집은 종종 표적 분자의 로딩이 급격히 감소하는 정도로 기능적 표면을 감소시킨다. 단백질 흡착 및 용출 분야에서 모든 비용을 들여 입자의 덩어리를 피할 필요성을 강조할 수 있다. 예를 들어, 응집된 입자에서 녹색 형광 단백질의 용출 수율은 응집되지 않은 입자가 있는 현탁액에 비해 매우 낮아진다.
따라서 입자 크기 분포는 예상되는 mRNA 혼성화 및 용출 수율의 손실을 간접적으로 설명하는 특성 매개변수로 간주될 수 있다. 자성비드가 덩어리질 때 기능성 올리고(dT)를 포함하는 총 표면적은 입자간 접촉 면적으로 인해 감소한다. 비드 특성으로 인해 감소되는 기능적 외부 표면을 무시할 수 없다. 그러나 응집의 긍정적인 측면은 자기 분리 과정에서 분리가 개선될 수 있다. oligo(dT) 기능화 및 mRNA 로딩 자성 입자의 응집 거동은 입자 크기 분포가 결정될 수 있다.
자성 입자는 경제적인 측면에서 기술적 과정을 거쳐 회수되어야 하는 고가의 제품이다. 이 과정에서 제공되는 (중간) 저장 과정에서 덩어리가 발생할 가능성이 매우 높다. 자성 입자 재활용에 건조 단계를 포함하는 것이 합리적이다. 일반적으로 나트륨 아지드와 같은 독성 방부제는 최대 농도 0.2%까지 자성 비드의 저장 완충액에 첨가되어 미생물의 부패를 방지한다. 입자는 방부제를 제거하기 위해 재사용하기 전에 집중적으로 세척해야 한다. 백신 정제에 적용하려면 어떤 경우에도 이러한 물질의 낮은 농도라도 피해야 한다. 입자의 대체 보관 방법은 방부제가 필요하지 않은 건식 보관할 수 있다. 재현탁 중에는 응집도 예상해야 한다. 이러한 공정 단계의 응집 효과를 평가하기 위해 자성 입자의 저장 또는 건조/재부유 후 입자 크기 측정을 할 수도 있다. 또한, 초음파 처리가 응집해제에 미치는 영향을 평가할 수도 있다.
이러한 실험실 프로토콜을 HGMS를 사용하여 소규모 생산은 이미 확립된 무세포 기반의 공정 단계를 변경할 필요가 없다. 따라서 임상 연구에 필요한 mRNA 양을 생산하는 시간을 절약할 수 있다. 기존 실험실 프로토콜에 따라 HGMS를 사용하여 mL에서 L 스케일로 세포 용해 후 mRNA 정제의 확장성을 확인하기 위해 자성 비드 현탁액을 공급 용기에서 교반하는 실험을 수행할 수 있다. 용해/결합 버퍼는 일반적으로 관련된 다른 버퍼에 비해 세제와 높은 염 농도를 포함하므로 세포 배양 기반 mRNA 정제의 가장 적절한 버퍼 시스템으로 사용할 수 있다. 합성 mRNA를 사용한 로딩 단계는 이미 정제된 폴리아데닐화 RNA로 수행할 수 있다.
실시예
다음의 실시예는 본 발명의 구체적인 실시형태 및 이의 다양한 사용의 설명이다. 이것은 설명의 목적으로만 제시되며, 어떤 식으로든 본 발명의 범주를 제한하는 것으로 해석되어서는 안 된다.
본 발명에서 제안하는 관심 RNA 및/또는 유용물질의 생산을 위한 합성 시스템은 관심 RNA 발현단위, 설계 DNA 세트 및 그 발현산물 그리고 Autogene 시스템 및 그 발현산물을 포함하는 설계 증폭발현(Designed Amplifying Expression, DAE) 시스템을 포함할 수 있다. 상기 유용물질은 RNA, 단백질, 바이오베터, 뉴클레오티드, 아미노산. 에너지, 친환경 바이오 물질, 2차 대사산물 등을 포함하는 목적 대사산물을 포함한다.
본 발명의 설계 증폭발현 시스템은 세포 또는 DdRp를 포함하는 전사 및 번역이 최소한 가능한 무세포 시스템에서 자가증폭 RNA 중합효소에 의해 설계 발현단위 및 관심 RNA의 지속적 무한증폭을 가능하도록 하는 역할을 제공하며 이를 이용하여 RNA 및/또는 유용물질의 무세포 시스템 및 세포 생산 및 방법을 제공한다.
본 발명의 관심 RNA 전사시스템은 RNA 중합효소 발현단위, 캡핑효소 발현단위와 관심 RNA 발현단위를 포함한다. 상기 발현단위는 DNA 또는 RNA를 포함하는 핵산으로 RNA 유형 발현단위는 DNA 유형 발현단위를 체외전사하여 준비할 수 있다. 관심 RNA 전사시스템의 RNA 중합효소 발현단위와 관심 RNA 발현단위는 한 DNA 분자이거나 또는 각각 독립적인 단리된 DNA 분자이며, 플라스미드 또는 선형 DNA를 사용할 수 있다.
상기 RNA 중합효소 발현단위는 번역이 가능한 mRNA를 포함하고 자가 증폭을 위한 DNA 또는 RNA 형태를 갖을 수 있어. ‘자가증폭 RNA 중합효소 또는 autogene’이라고 하였다. 본 발명의 RNA 중합효소 발현단위에서 RNA 중합효소는 DdRp와 RdRp로 나눌 수도 있으며 이들이 한 단위로 구성될 수도 있다. 본 발명에서 DdRp를 기반으로 하는 RNA 중합효소 발현단위에서 합성될 수 있는 DdRp, 캡핑효소, Pus, Poly(A) polymerase를 포함하는 군에서 선택되어진 어느 하나 또는 그 이상으로 이루어진 효소들을 총칭하여 'ctDdRp'라고 하였다.
상기 관심 RNA 발현단위는 관심 RNA를 코딩하는 DNA이며 사용 목적에 따라 상기 발현단위는 RNA 합성을 위해서는 최소한 전사를 할 수 있는 구조이고, 단백질 합성을 위해서는 전사와 번역을 할 수 있는 구조를 갖는다. 즉 번역이 가능한 RNA와 비번역 RNA를 인코딩한다. 번역이 가능한 RNA을 인코딩하는 발현단위는 단백질을 합성하는 세포의 종류에 따라 구성성분이 결정된다. 상기 세포는 원핵세포 및 진핵세포를 포함한다. 번역이 가능한 RNA의 구성성분은 원핵세포 또는 진핵세포에 따라 특정한 구조가 있다.
본 발명에서 숙주세포를 준비하기 위해 RNA 관심 전사시스템을 구성하는 발현단위들이 클로닝된 pUC19를 DH5α 균주에 도입하여 증폭하여 관심 RNA 전사시스템을 대량으로 제조하였다. DH5α의 유전형은 F- endA1 glnV44 thi-1 recA1 relA1 gyrA96 deoR nupG purB20 80dlacZΔM15 Δ(lacZYA-argF)U169, hsdR17(rK-mK+), λ-이며 구성적 데옥시리보스 합성을 하며 큰 플라스미드 복제에 우수하다. 숙주세포로 T7 RNA polymerase를 갖고 있는 대장균 BL21(DE3), BL21 Star (DE3) 및 HT115(DE3) 균주를 사용하였으며, 이들 세포는 각각 재조합 단백질 및 RNA를 독립적으로 발현하는 숙주세포로 많이 사용하고 있다.
본 발명에서 RNA 및/또는 유용물질 생산 전사시스템을 설계할 때에 무세포유래 세포를 고려해야 한다. 무세포유래 시스템은 설계 증폭발현(Designed Amplifying Expression, DAE) 시스템으로부터 효율적으로 관심RNA 및/또는 유용물질 합성하기 위해서, 이에 필요한 내인성 및/또는 외인성 전사 및 번역에 필요한 요소들 및 생물학적 활성을 공급해야 한다. 원핵세포 무세포 시스템은 세균 즉, 대장균, 바람직하게, 관심 RNA 합성을 위한 무세포 시스템을 제공하기 위한 바이오매스는 T7 RNA polymerase를 갖고 있는 대장균 BL21(DE3), BL21 Star (DE3) 및 HT115(DE3) 균주를 사용하였으며, 이들 세포는 각각 재조합 단백질 및 RNA를 독립적으로 발현하는 숙주세포로 많이 사용하고 있다. 본 발명에서 무세포 시스템을 준비하는 과정에서 전사 및 번역의 원만한 진행을 위해 관련 기전의 손상을 최소화하였다.
상기 내인성 및/또는 외인성 전사 및 번역에 필요한 요소들 및 생물학적 활성을 공급해야 하기 위해 이들의 대사유전자를 autogene systm으로 무한증폭하도록 하는 설계 발현단위를 구성해야 할 수 있다. 유용물질이 RNA인 경우는 세포 RNA로부터 NTP의 합성대사경로 유전자들을 포함하는 설계 발현단위를 이용하여 5' 뉴클레오사이드 모노포스페이트(NMP)를 수집하기 위해 외인성 RNase R을 이용한 용해물 RNA의 분해, 내인성 RNase R을 이용한 용해물 RNA의 분해 및 뉴클레아제 P1 또는 이들의 발현단위를 이용한 세포 RNA 분해산물을 한외여과하여 분해산물을 수집한다. 상기 세포 유래 NMP 혼합물을 기질로 하여 NTP 혼합물을 제조하는 5 종류의 키나제 발현단위는 대장균으로부터의 (i) CMP 키나제(Cmk), (ii) UMP 키나제(PyrH), (iii) GMP 키나제(Gmk), (iv) NDP 키나제(Ndk) 및 (v) 폴리포스페이트 키나제(PPK2) 이다. 또한 유용물질이 단백질인 경우 다양한 유전자들을 포함하는 설계 발현단위를 공급할 수도 있다.
상기 관심 RNA는 mRNA, dsRNA, shRNA, miRNA, gRNA, pri-miRNA, premiRNA, 원형 RNA, piRNA, snRNA, IncRNA, 리보자임, rRNA, tRNA, snoRNA, ncRNA, saRNA(자가증폭 RNA) 및 RNA 압타머를 포함한다. 바람직하게, 관심 RNA 발현단위의 RNA가 mRNA 경우 관심 RNA 전사시스템의 무세포 유래 세포는 BL21 (DE3) 균주를, RNA가 dsRNA, RNA 압타머인 경우는 관심 RNA 전사시스템의 무세포유래 세포는 HT115(DE3) 균주를 사용하였다.
원핵세포의 무세포 시스템은 자체 제작하거나 상업화 시스템을 사용하며, 진핵세포 무세포 시스템은 효모, 식물 세포, 밀배아, 곤충 세포 및 포유류 세포에서 자체적으로 얻을 수 있으며 상업화된 제품을 사용할 수도 있다. 상기 RNA 및/또는 유용물질을 생산하기 위해서, 상기 무세포 시스템에 아미노산원 및 에너지원 등을 공급할 수도 있다.
상기 무세포 시스템의 유형은 batch, continuous exchange 및 continuous flow를 사용할 수 있다. continuous exchange continuous flow 유형은 유용물질의 생산에 필요한 원재료를 안정적 지속적으로 공급을 받고 부산물을 배출할 수 있어 높은 생산성이 있다. 본 발명에서 한외여과와 정용여과 시스템을 이용하여 continuous exchange 유형을 구현하여 RNA 및/또는 유용물질을 연속생산하였다.
실시례 1. RNA 중합효소 발현단위
본 발명의 RNA 중합효소 발현단위는 DdRp, 캡핑효소, Pus 및 RdRp을 포함하는 군에서 선택되어진 어느 하나 이상을 인코딩하는 DNA 절편으로 제작할 수 있다. 상기 발현단위는 DNA 및 RNA를 포함하는 핵산에서 선택되어진 어느 하나 이상을 의미한다. 상기 RNA 발현단위는 상기 DNA 발현단위를 체외전사하여 준비할 수 있다.
본 발명은 상기 목적을 세포 또는 무세포유래 세포에서 달성하기 위하여 본 발명의 발현단위는 목적하는 유전자의 발현을 관리할 목적으로 하기 식 (1)에 따른 DNA 구조체를 제공한다.
식 (1): W-X-Y-Z
본 발명의 RNA 중합효소 발현단위는 관심 RNA 발현단위를 관리할 목적으로 상기 식 (1)의 염기서열을 포함하는 RNA 중합효소 발현단위를 제공한다.
본 발명에서 무세포유래 세포는 원핵세포와 진핵세포를 사용할 수 있다. RNA 중합효소 발현단위는 무세포유래 세포가 원핵세포 경우는 하기와 같이 원핵세포에서 전사와 번역이 가능하도록 제조하며, 하기에 제시하였다. 무세포유래 세포가 진핵세포 경우는 진핵세포에서 전사와 번역이 가능하도록 제조하여야 하며 실시레 2항을 참조할 수 있다.
상기 식 (1)에서 W는 숙주세포 및 무세포유래 세포에 있는 RNA 중합효소 유전자에 의해 인지되는 프로모터, 그리고 SD 부위를 포함하는 5’UTR을 포함한다.
상기 W는 프로모터, 조절인자, repressor 및 activator의 종류 또는 이들의 조합으로 특징이 결정되는 single promoter 또는 hybrid promoter 조절 시스템으로 상기 발현단위의 전사시기를 조절할 수도 있다.
상기 프로모터는 조절인자 염기서열을 포함할 수 있다. 바람직하게 상기 조절인자는 Lac operator 염기서열일 수도 있다.
본 실시례에서 무세포유래 세포가 대장균인 경우, 상기 식(1)의 W 부위는 RNA 중합효소가 인지하는 프로모터로 (a) 아세트산, 에탄올, 피루브산 등으로 유도될 수 있는 pta, aceA, aceB, adh 및 amyE 프로모터를 포함하는 군; (b) cspB, SOD 및 tuf 프로모터를 포함하는 군; (c) lac 프로모터, tac 프로모터, trc 프로모터를 포함하는 군; (d) F1 프로모터, T7 프로모터, T5 프로모터, T3 프로모터 및 SP6 프로모터와 같은 파지 유래의 프로모터를 포함하는 군;를 포함하는 군에서 선택되어진 어느 하나를 사용할 수 있다.
상류에 있는 프로모터가 하류에 있는 RNA 중합효소에 의해 인지되고 작동하는 구조체를 'autogene'이라고 한다
본 실시례에 사용하는 무세포유래 대장균은 UV5lac 하류에 T7 Pol.를 보유하고 있는 BL21(DE3), 대장균 BL21(DE3), BL21 Star (DE3) 및 HT115(DE3) 균주이다.
본 실시례에서 식(1)의 W 프로모터는 T7 promoter(서열번호 1) 및/또는 Lac operator (서열번호 2)를 사용하여 RNA 중합효소 발현단위, DdRp 발현단위와 외래유전자 발현단위를 제조하였다.
T7 promoter : TAATACGACT CACTATAGG (서열번호 1)
Lac operator : GGAATTGTGAGCGGATAACAATTC (서열번호 2)
본 발명의 발현단위는 상기 T7lac 프로모터를 lac 오퍼레이터 서열이 제외된 consensus 10 (T7) promoter (T7pCONS)만으로 대체할 수 있다.
보편적으로 많이 사용하는 발현 벡터 pET는 pBR322 유래 ColE1 레플리콘, lac I 유전자, 암피실린 내성 유전자 및 다중 클로닝 부위를 포함한다. 다중 클리닝 부위는 T7lac 프로모터와 리보솜 결합 서열이 하류에 있다. T7pCONS에 대해 살펴보면, 뉴클레오타이드 서열은 T7 파지의 10 프로모터에서 유래되며, 23개의 뉴클레오타이드 길이로 메신저 RNA(mRNA) 시작 부위에 대해 -17에서 +6 영역(TAATACGACTCACTATAGGGAGA)이다. lac 오퍼레이터 서열이 T7 lac에 처음 도입 되었을 때 4개의 뉴클레오티드(GAGA)가 제거되었기 때문에 pET28a는 서열번호 1인 -17에서 +2 영역(TAATACGACTCACTATAGG)만 포함한다. lac 오퍼레이터는 유도된 단백질 발현 수준에 거의 영향을 미치지 않는다. 상기 T7p CONS 서열의 변형은 생산적인 전사 개시를 감소시킨다. T7p CONS (TAATACGACTCACTATAGGGAGA)가 사용되었을 때 BL21( DE3 ) pLysS 에서 sfGFP의 생산 수율이 3배 증가하였다(COMMUNICATIONS BIOLOGY (2020) 3:214; https://doi.org/10.1038/s42003-020-0939-8).
상기 식 (1)의 W의 5'-UTR의 서열은 서열번호 3이며, Shine-Dalgarno 시퀀스, 시작 코돈과, 4nt 무작위 조각을 포함한다. 샤인-달가노 서열(Shine-Dalgarno Sequence) 또는 SD 서열(SD sequence)은 원핵세포 메신저 RNA의 리보솜 결합 부위이며, 일반적으로 시작 코돈 AUG의 8염기 앞쪽에 위치한다.
5'-UTR: AACTTTAAGAAGGAGANNNNCAUATG (서열번호 3)
4nt 무작위 조각 NNNN는 AAAU, AAUA, AUAA 및 AUAU로 이루어진 군에서 선택되어진 어느 하나를 포함할 수 있다. 바람직하게 stem-loop 구조를 T7 프로모터 하류지역에 둘 수도 있다.
상기 식(1)의 X는 상기한 RNA 중합효소 유전자의 5'말단 염기서열, 번역시작 코돈 ATG을 나타내며 상기 RNA 중합효소 유전자는 DNA dependent RNA Polymerase(DdRp) 또는 그 변이체; 캡핑효소 또는 그 변이체; ctDdRp; 및 RNA dependent RNA Polymerase(RdRp) 또는 그 변이체를 포함하는 군에서 선택되어진 어느 하나 이상을 포함한다.
상기 ctDdRp기반 단위로
(a) 상기 DNA dependent RNA Polymerase(DdRp) 또는 그 변이체;
(b) 캡핑효소 또는 그 변이체; 및
(c) 링커;를 포함할 수도 있다.
여기서, 상기 ctDdRp는 추가적으로 상기 RNA 결합 테더링 펩타이드를 포함할 수도 있다. 상기 RNA 중합효소는 단백질- RNA 테더링 시스템(protein- RNA tethering system)의 적어도 하나의 RNA 결합 도메인(RNA-binding domain)을 포함하는 것을 특징으로 하며, 여기서, 상기 RNA 결합 도메인은 특정 RNA 서열 및/또는 구조로 구성된 상기 단백질- RNA 테더링 시스템의 RNA 요소에 특이적으로 결합을 특징으로 하는 RNA 구조체일 수도 있다.
더욱더 바람직하게, 본 발명의 ctDdRp는 Pus 또는 그 변이체를 포함할 수도 있다.
본 발명의 RNA 중합효소 발현단위는 ctDdRp에도 추가적으로 RNA dependent RNA Polymerase(RdRp) 또는 그 변이체를 포함하는 단위로 구성할 수도 있다.
본 발명에서 RNA 중합효소 발현단위은 'ctDdRp를 이용한 관심 RNA 전사시스템'와 'RdRp를 이용한 RNA 전사시스템'을 한 시스템으로 구성될 수도 있다.
상기 식 (1)의 X는 DdRp, 캡핑효소, ctDdRp 또는 RdRp DNA 절편을 주형으로 제조할 수 있다.
상기 식(1)의 Y는 상기한 RNA 중합효소 유전자의 2번째 내지 번역종결 코돈에 해당하는 염기서열을 나타내며;
상기 식(1)의 Z는 상기한 RNA 중합효소 유전자의 3'말단의 종료코돈 이하 전사 종결서열을 포함하는 염기서열을 나타낸다.
또한, 본 발명은 종료 코돈 이하 전사 종결서열로서 Z부위인 3'말단에 TGA TAA의 번역 종료 코돈을 연결시켜 번역 종료가 확실히 일어나도록 유도하였다.
본 실시례의 전사 종결서열은 서열번호 4로, 주형 DNA 가닥에 몇 개의 A 잔기가 뒤따르는 역반복으로 구성된다.
5'-TGAGATAAAAATGCCAGCCGATCGGGCTGGCATTTTGCCTTTTAG-3' (서열번호 4)
그리고, T7 터미네이터 서열은 5'-TAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTGTTTTG-3' 이다.
RNA 중합효소가 역반복체를 전사하면 mRNA 수준에서 즉시 줄기 루프 구조로 접혀 효소가 일시 중지된다. 줄기 루프 구조 뒤에는 주형 DNA의 A 잔기와 약한 상호작용을 하는 여러 U 잔기가 있기 때문에 효소의 해리가 발생하도록 한다.
고속 단백질 액체 크로마토그래피(Fast Protein Liquid Chromatography: FPLC)에 의해서 정제하기 위해. N-말단 헥사히스티딘 태그를 갖는 DdRp, 캡핑효소, Pus 및 RdRp를 제조할 수도 있다.
N-말단 헥사히스티딘 태그: ATG cat cat cat cat cat cat NNN NNN NN
C-말단 헥사히스티딘 태그: NNN NNN NNN cat cat cat cat cat cat TAG
(여기서, ATG는 시작코돈, TAG는 종결코돈, cat cat cat cat cat cat는 HIS-TAG, NNN NNN NNN는 특정단백질 염기서열)
본 발명에서 T7 프로모터의 하류 지역에 있으면서 T7 RNA polymerase에 의해 전사되는 특징이 있는 유전자들을 '설계 발현단위'라고 편의상 지칭하였다.
1.1. DdRp
본 발명의 관심 RNA 전사시스템에서 관심 RNA 즉, 상기 식(1)의 X가 mRNA가 아닌 dsRNA, saRNA, RNA 압타머 및 리보자임인 경우에 RNA 중합효소 발현단위는 식(1)의 X는 DdRp일 수 있다. 본 발명의 DdRp 발현단위에 포함된 DdRp DNA의 설계를 위하여, 상기 식 (1)의 핵심 구성단위 DdRp ORF를 구성하는 DdRp는 단일 서브유닛으로 구성된 DdRp의 일종, T7 RNA 중합효소(Gene ID: 1261050), T3 RNA 중합효소(Gene ID: 14675519) 및 SP6 RNA 중합효소(Gene ID: 19685893)를 포함하는 군에서 T7 RNA 중합효소를 선정하였으며 서열번호 5이다.
고속 단백질 액체 크로마토그래피(Fast Protein Liquid Chromatography: FPLC)에 의해서 정제하기 위해. N-말단 헥사히스티딘 태그를 갖는 DdRp를 제조할 수도 있다.
ORF of the T7 RNAP
ATGCTCGAGA ACACCATCAA TATCGCCAAG AACGACTTCA GCGACATCGA GCTGGCCGCC 60
ATCCCTTTCA ACACCCTGGC CGACCACTAT GGCGAGCGGC TGGCCAGAGA ACAGCTGGCC 120
CTGGAACACG AGAGCTACGA AATGGGCGAG GCCCGGTTCC GGAAGATGTT CGAGAGACAG 180
CTGAAGGCCG GCGAGGTGGC CGATAATGCC GCCGCTAAGC CCCTGATCAC CACCCTGCTG 240
CCCAAGATGA TCGCCCGGAT CAACGATTGG TTCGAGGAAG TGAAGGCCAA GCGGGGCAAG 300
AGGCCCACCG CCTTCCAGTT TCTGCAGGAA ATCAAGCCCG AGGCCGTGGC CTACATCACC 360
ATCAAGACCA CCCTGGCCTG CCTGACCAGC GCCGACAATA CCACCGTGCA GGCTGTCGCT 420
TCTGCCATCG GCAGAGCCAT CGAGGACGAG GCCAGATTCG GCAGAATCCG GGACCTGGAA 480
GCCAAGCACT TCAAGAAAAA CGTGGAGGAA CAGCTGAACA AGCGCGTGGG CCACGTGTAC 540
AAGAAAGCCT TCATGCAGGT GGTGGAGGCC GACATGCTGA GCAAGGGCCT GCTGGGCGGA 600
GAAGCCTGGT CCAGCTGGCA CAAAGAGGAC AGCATCCACG TCGGCGTGCG GTGCATCGAG 660
ATGCTGATCG AGTCGACCGG CATGGTGTCC CTGCACAGGC AGAATGCCGG CGTGGTGGGC 720
CAGGACAGCG AGACAATCGA ACTGGCCCCC GAGTATGCCG AGGCCATTGC CACAAGAGCC 780
GGCGCTCTGG CCGGCATCAG CCCCATGTTC CAGCCCTGCG TGGTGCCTCC TAAGCCCTGG 840
ACAGGCATCA CAGGCGGCGG ATACTGGGCC AACGGCAGAC GCCCTCTGGC TCTGGTGCGG 900
ACCCACAGCA AGAAAGCCCT GATGCGCTAC GAGGACGTGT ACATGCCCGA GGTGTACAAG 960
GCCATCAACA TTGCCCAGAA CACCGCCTGG AAGATCAACA AGAAAGTGCT GGCCGTGGCC 1020
AATGTGATCA CCAAGTGGAA GCACTGCCCC GTGGAGGACA TCCCCGCCAT CGAGCGGGAG 1080
GAACTGCCCA TGAAGCCCGA GGACATCGAC ATGAACCCCG AGGCCCTGAC AGCCTGGAAA 1140
AGGGCCGCTG CCGCCGTGTA CCGGAAGGAC AAGGCCCGGA AGTCCCGGCG GATCAGCCTG 1200
GAGTTCATGC TGGAACAGGC CAACAAGTTC GCCAACCACA AGGCCATTTG GTTCCCTTAC 1260
AACATGGACT GGCGGGGCAG AGTGTACGCC GTGAGCATGT TCAATCCACA AGGCAACGAC 1320
ATGACCAAGG GGCTGCTGAC CCTGGCCAAG GGCAAGCCCA TCGGCAAAGA GGGCTACTAC 1380
TGGCTGAAGA TCCACGGCGC CAACTGCGCT GGCGTGGACA AGGTGCCCTT CCCAGAGCGG 1440
ATCAAGTTCA TCGAGGAAAA CCACGAGAAC ATCATGGCCT GCGCCAAGAG CCCTCTAGAA 1500
AACACTTGGT GGGCCGAGCA GGACAGCCCC TTCTGCTTCC TGGCCTTCTG CTTTGAGTAC 1560
GCCGGAGTGC AGCACCACGG CCTGAGCTAC AACTGCAGCC TGCCCCTGGC CTTCGATGGC 1620
AGCTGCAGCG GCATCCAGCA CTTCAGCGCC ATGCTGAGGG ACGAAGTGGG CGGCAGAGCC 1680
GTGAATCTGC TGCCAAGCGA GACAGTGCAG GACATCTACG GGATCGTGGC CAAGAAAGTG 1740
AACGAGATCC TGCAGGCCGA CGCCATCAAC GGCACCGACA ACGAGGTGGT GACCGTGACC 1800
GATGAGAACA CCGGCGAGAT CAGCGAGAAA GTGAAGCTCG GCACCAAGGC CCTGGCTGGC 1860
CAGTGGCTGG CCTACGGCGT GACCAGATCC GTGACCAAGC GGAGCGTGAT GACACTGGCC 1920
TATGGCAGCA AAGAGTTCGG CTTCCGGCAG CAGGTGCTGG AAGATACCAT CCAGCCTGCC 1980
ATCGACAGCG GCAAGGGGCT GATGTTCACC CAGCCCAACC AGGCCGCTGG CTACATGGCC 2040
AAGCTCATAT GGGAGAGCGT GTCCGTGACA GTGGTGGCCG CCGTGGAGGC CATGAATTGG 2100
CTGAAGTCCG CCGCCAAACT GCTGGCCGCT GAAGTGAAGG ACAAAAAGAC CGGCGAAATC 2160
CTGCGGAAGA GATGCGCCGT GCACTGGGTG ACCCCCGATG GCTTCCCCGT GTGGCAGGAG 2220
TACAAGAAGC CCATCCAGAC CCGGCTGAAC CTGATGTTCC TGGGCCAGTT CAGACTGCAG 2280
CCCACCATCA ACACCAACAA GGACTCCGAG ATCGACGCCC ACAAGCAGGA AAGCGGCATT 2340
GCCCCCAACT TCGTGCACAG CCAGGACGGC AGCCACCTGA GAAAGACCGT GGTGTGGGCT 2400
CACGAGAAGT ACGGCATCGA GAGCTTCGCC CTGATCCACG ACAGCTTCGG CACCATTCCC 2460
GCCGACGCCG CCAACCTGTT CAAGGCCGTG CGGGAGACAA TGGTGGACAC CTACGAGAGC 2520
TGCGACGTGC TGGCCGACTT CTACGACCAG TTCGCCGACC AGCTGCACGA GAGCCAGCTG 2580
GACAAGATGC CCGCCCTGCC CGCCAAGGGG AACCTGAACC TGCGGGACAT CCTGGAAAGC 2640
GACTTCGCCT TCGCCTGA 2658 (서열번호 5)
pUC19의 멀티클로닝 자리의 HindIII/BamHI 자리를 이용하여 T7 polymerase 유전자 (GenBank accession no. FJ881694.1)를 삽입하기 위하여, 우선 대장균 BL21 (DE3) (Novagen, US) chromosomal DNA를 template로 이용하여 PCR 방법으로 T7 polymerase 유전자를 증폭하였다. 이때 양 말단은 HindIII/BamHI site sequences가 포함되어 있다. 증폭된 PCR product는 HindIII/BamHI 제한효소처리를 한 후 T4 DNA ligase를 이용하여 pUC19에 삽입되었다. T7 polymerase 유전자는 상기 식 (1)에 따른 DdRp DNA 절편은 <T7 promoter - 5'UTR - DdRp DNA- 전사 종결서열>이며, 이를 pUC19에 삽입하여 'pUC19 DdRp'이라고 하였다. 이를 DH5α 균주에 도입하여 증폭하였다. 상기 T7 promoter 대신에 T7 promoter+Lac operator를 사용할 수도 있다.
1.2. ctDdRp01
본 발명의 관심 RNA 즉, 상기 식(1)의 X가 진핵세포 mRNA인 경우에 RNA 중합효소 발현단위는 하기 식 (1)의 X를 ctDdRp DNA 절편으로 사용하였다.
본 발명의 ctDdRp 발현단위는 상기 ctDdRp orf의 상류에 5'UTR 서열, 하류에 종료 코돈 및 전사 종결서열로 구성할 수 있다.
바람직하게, 상기 ctDdRp orf의 구성단위는 DdRp, Pus와 캡핑효소를 포함하며, 상기 ctDdRp orf의 구성단위에 포함된 orf의 구성 단위 사이에는 링커 또는 시스트론간 서페이서(intercistronic spacer, IS)를 포함할 수 있다. 추가적으로 poly(A) polymerase를 포함할 수도 있다. 이와 같이 IS가 있는 ctDdRp는 원핵생물에 적합한 ctDdRp이다.
관련 단백질들의 orf는 GeneOptimizer 알고리즘을 사용하여 코돈 적응 지수와 관련하여 인간 세포에서의 발현을 위해 최적화하였다. 모든 유전자 서열은 인공적으로 합성되고 올리고뉴클레오티드를 사용하여 단계별 PCR로 증폭하고 클로닝하여 완전히 시퀀싱하였다.
본 발명의 ctDdRp 발현단위는 제조하기 위해, ctDdRp orf를 식 (2)와 같이 설계하였다.
식 (2) : Pus-X1-Nλ-X2-NP868R-X1 or X2-T7 Pol
여기서, Nλ= 테더링 도메인, X1=IS. X2=(G4S)2이며 Pus-X1는 생략할 수도 있다.
식 (2)에서 제조되는 효소는 Pus, Nλ-X2-NP868R과 T7 Pol 그리고 Pus, Nλ-X2-NP868R-X2-T7 Pol 일 수 있다.
Pus는 human pseudouridine synthase 1 (hPus1)이고 NP868R는 African swine fever virus capping enzyme(ASFV, G4R )이다.
본 실시례에서 식 (2): Pus-X1-Nλ-X2-NP868R-X1 or X2-T7 Pol을 제조하였으며 이를 'ctDdRp01'이라고 하였다. 이를 DH5α 균주에 도입하여 증폭하였다.
식 (2) : Pus-X1-Nλ-X2-NP868R-X1 or X2-T7 Pol은 Pus-X1-Nλ-X2 DNA 절편과 NP868R-X1 or X2-T7 Pol DNA 절편을 나누어 제작한 후 연결하는 방법으로 제조하였다.
상기 ctDdRp DNA 절편은 식 (2)로 이루어진 orf의 상류에 5'UTR 서열을 배치하고 하류에 종료 코돈, 전사 종결서열을 포함하였다.
고속 단백질 액체 크로마토그래피(Fast Protein Liquid Chromatography: FPLC)에 의해서 정제하기 위해. N-말단 헥사히스티딘 태그를 갖는 ctDdRp1을 제조할 수도 있다.
본 실시례의 Pus-X1-Nλ-X2 DNA 절편의 제조를 위해서,
상기 식(2)의 Pus 유전자로 인간 PUS1 cDNA 단편이며 IMAGE 컨소시엄 클론 #2822709(미국, American Type Culture Collection)에 대해 프라이머 HuPus1 For (5′-AACATATGGCCGGGAACGCGGAGCC, 서열번호 6) 및 HuPus1 Rev (5′-GGATCCTCGAGTCCCATCGCCTCAGTCAGTG 서열번호 7)를 사용하여 PCR하여 얻은 DNA 단편, 서열번호 8을 제조하였다.
PUS 1 ORF Nucleotide Sequence (Length: 1506bp)
Accession No. XM_010228061.1
ATGGATGTGG AGGGTGGCCT GGCAGGAGAG CGGGGACACG AACACAGCCC CTTTAGGCAG
GAGAAGTTCA CGCTGCACCC CTCGAGCAGT GTCTGTGATA GGCGCCTGCC TGGCTGGGGA
ATGGTGGAAC ACAGGGAGCC AAAGCTCCCA CACAAGAGCA GTCAGCCTGC CGTGCCCGAG
GCTGCCGCGC GCCAGCAAAC GCCTCGCAGG CCCACGGATG CTTCGTGGCA TCCCACGCAT
TTGCTTGCAT GGACAGAGAG CACGTCTTGT GCTGAGTCCT GCCTGCTCTC CTGCCCCTTG
CAGGTTCTCA TCATGGCTGA AGAGGTGAGG GCAGCGGTTG CCGGCCAGCC CAAGAGACTG
ATGAGCAGCA GCGAGGAGCC AGAAAGGCTG GAGGAAAATG GGCACCTGTC CAAAAGGCTG
AAGAGCCAGG TGGATGAGGA GGACCAGACT AAGAAATTGC CCAAAAGGAA GATCGTGCTG
TTGATGGCGT ACTCAGGGAA AGGCTACCAT GGGATGCAAA GAAATGTGGG ATCTTCGCAG
TTCAAGACAA TTGAAGATGA CTTAGTATCT GCCCTTGTTC AGTCAGGCTG CATTCCAGAA
AACCATGGGG AAGATATGAA GAAAATGTCT TTCCAGAGAT GTGCTCGAAC AGATAAGGGT
GTATCTGCAG CTGGACAGAT TGTGTCGCTG AAGGTCAGAT TAATAGATGA CATCTTAGAA
AAGATCAATA GCCATCTTCC TTCTCACATC AGAATTCTGG GGCTGAAGAG AGTCACTGGA
GGATTCAACT CCAAGAACAA ATGTGATGCC AGAACCTACT CTTACATGCT GCCAACATTT
GCCTTTGTCC ATAAAGACCA CGATGTGCAA GAGGAGACTT TCCGACTGAA TAAAGAGACC
CTTGAAAAAG TGAACAAACT GCTCGCTTGT TACAAAGGAA CACACAATTT CCACAACTTT
ACGTCTCAGA AGGGGCCCAA GGACCCCAGT GCCAAGCGAT ATATAATGGA AATGTACTGT
GGAGAGCCCT TTGTAAGGGA AAGCATAGAA TTTGCAGTGA TCAAAGTAAA AGGCCAGAGC
TTCATGATGC ACCAAATAAG GAAGATGATT GGACTGGTGA TCGCAATTGT GAAAGGTTAT
GCTGCTGAGT CCATCATAGA ACGCAGCTGG GGTGAGGAGA AAGTAGATGT CCCCAAAGCT
CCAGGACTTG GGCTGGTCCT GGAGAGGGTG CACTTTGAAA AGTACAACAG GCGTTTTGGA
AATGATGGGC TGCACGAGCC GCTCGAATGG AAGGAGGAGG AGGAGAAGAT TGCTGTTTTC
AAAGAGCAGT ACATCTATCC TACTATCATC AACACGGAAA GGGAGGAGAA ATCCATGATG
AACTGGCTGA GCACCCTTTC CATTCATGAC TTCAACTCTT CTGCAGTTGA GCTGCAAGCT
AACAACAAAA CCTCAAAGAA CAGTGATTTT GAAGGCAGTG ATGGTTGTGA TGATGATTCT
GAGTGA (서열번호 8)
본 Pus는 본 발명의 RNA 중합효소에 의해 제조된 mRNA를 슈도우리딘화를 할 수 있도록 한다,
상기 식(2)의 시스트론간 스페이서(IS)는 Au(UAUUUUAAUUAAUUAA) 풍부한 시퀀스가 시스트론간 스페이서 번역 효율의 업스트림에 도입되면 S/D 시퀀스를 포함한다. IS 크기는 ~20ntds에서 40-50ntds까지 다양하다. 이 스페이서에는 30s 리보솜 서브유닛이 후속 시스트론에 결합하고 번역을 다시 시작하기 위한 S/D 서열이 포함되어 있다. 본 실시례에서 사용하는 IS는 서열번호 9이다.
UAA UAACGGAGUGAUC UUG (서열번호 9)
상기 식 (2)에 제시한 바와 같이, 단백질- RNA 테더링(Tethering) 시스템의 테더링 도메인(Nλ), 또한, 상기 관심 m관심 RNA 발현단위에는 단백질- RNA 테더링(Tethering) 시스템의 테더링 RNA를 추가하였다.
상기 테더링 시스템은 테더링 도메인은 람다 박테리오파지로부터의 antitermination N protein의 22개 아미노산(Nλ; 엔테로박테리아 파지 람다 뉴클레오캡시드 단백질 AAA32249의 아미노산 1-22; 뉴클레오티드에 해당하는 서열번호 10 및 서열번호 11)을 선정하였다.
ATGGATGCTC AGACCAGACG CAGAGAACGG CGGGCAGAGA AGCAGGCACA GTGGAAGGCC GCTAAT (서열번호 10)
Met Asp Ala Gln Thr Arg Arg Arg Glu Arg Arg Ala Glu Lys Gln Ala Gln Trp Lys Ala Ala Asn (서열번호 11)
상기 테더링 RNA는 λ 바이러스의 BoxBr(엔테로박테리아 파지 람다 KT232076.1의 게놈 서열의 뉴클레오티드 38312-38298; λ 박테리오파지로부터의 BoxBr RNA 스템-루프의 뉴클레오티드 서열에 상응하는 서열번호 12)를 4개의 직렬로 구성된 RNA 서열을 선정하였다.
GCCCTGAAAA AGGGC (서열번호 12)
상기 식(2)의 링커 X1은 G4 또는 (G4S)2를 포함할 수 있다. 상기 (G4S)2-linker는 서열 GGGGSGGGGS (서열번호: 13)를 포함한다. RNA의 링커는 서열 GGUGGAGGCGGUUCAGGCGGAGGUGGCUCU (서열번호: 14)를 포함한다. RNA의 링커는 서열 GGTGGAGGCGGTTCAGGCGGAGGTGGCTCT(서열번호: 15)를 포함하는 DNA에 의해 인코딩된다.
NP868R-X1 OR X2-T7 Pol DNA 절편을 제조를 위해서,
본 발명의 ctDdRp 발현단위에 포함된 ctDdRp DNA의 설계를 위하여, 식 (II)의 핵심 구성단위 ctDdRp ORF를 구성하는 DdRp는 단일 서브유닛으로 구성된 DdRp의 일종, T7 RNA 중합효소(Gene ID: 1261050), T3 RNA 중합효소(Gene ID: 14675519) 및 SP6 RNA 중합효소(Gene ID: 19685893)를 포함하는 군에서 T7 RNA 중합효소를 선정하였다.
식 (2)의 핵심 구성단위 Capping enzyme(캡핑효소)는 아프리카 돼지 열병 바이러스 NP868R 캡핑 효소(Genbank NP_042794)를 선정하였다.
고속 단백질 액체 크로마토그래피(Fast Protein Liquid Chromatography: FPLC)에 의해서 정제하기 위해. N-말단 헥사히스티딘 태그를 갖는 캡핑효소를 제조할 수도 있다.
식 (2)의 NP868R-X2-T7 Pol은 서열번호 16로, ASFV NP868R ORF(Genbank NP_042794)를 인코딩하는 DNA(Genscript, 미국)를 합성하고 실시례 2.1 항에서 얻은 T7 RNAP을 T4 ligase로 연결하고 PCR로 증폭하고, pUC19에 클로닝하였다(도 3).
NP868R-T7 RNAP:
ATGGAATTCG CCAGCCTGGA CAACCTGGTG GCCAGATACC AGCGGTGCTT CAACGACCAG 60
AGCCTGAAGA ACAGCACCAT CGAGCTGGAA ATCCGGTTCC AGCAGATCAA CTTCCTGCTG 120
TTCAAGACCG TGTACGAGGC CCTGGTCGCC CAGGAAATCC CCAGCACCAT CAGCCACAGC 180
ATCCGGTGCA TCAAGAAGGT GCACCACGAG AACCACTGCC GGGAGAAGAT CCTGCCCAGC 240
GAGAACCTGT ACTTCAAGAA ACAGCCCCTG ATGTTCTTCA AGTTCAGCGA GCCCGCCAGC 300
CTGGGCTGTA AAGTGTCCCT GGCCATCGAG CAGCCCATCC GGAAGTTCAT CCTGGACAGC 360
AGCGTGCTGG TCCGGCTGAA GAACCGGACC ACCTTCCGGG TGTCCGAGCT GTGGAAGATC 420
GAGCTGACCA TCGTGAAGCA GCTGATGGGC AGCGAGGTGT CAGCCAAGCT GGCCGCCTTC 480
AAGACCCTGC TGTTCGACAC CCCCGAGCAG CAGACCACCA AGAACATGAT GACCCTGATC 540
AACCCCGACG ACGAGTACCT GTACGAGATC GAGATCGAGT ACACCGGCAA GCCTGAGAGC 600
CTGACAGCCG CCGACGTGAT CAAGATCAAG AACACCGTGC TGACACTGAT CAGCCCCAAC 660
CACCTGATGC TGACCGCCTA CCACCAGGCC ATCGAGTTTA TCGCCAGCCA CATCCTGAGC 720
AGCGAGATCC TGCTGGCCCG GATCAAGAGC GGCAAGTGGG GCCTGAAGAG ACTGCTGCCC 780
CAGGTCAAGT CCATGACCAA GGCCGACTAC ATGAAGTTCT ACCCCCCCGT GGGCTACTAC 840
GTGACCGACA AGGCCGACGG CATCCGGGGC ATTGCCGTGA TCCAGGACAC CCAGATCTAC 900
GTGGTGGCCG ACCAGCTGTA CAGCCTGGGC ACCACCGGCA TCGAGCCCCT GAAGCCCACC 960
ATCCTGGACG GCGAGTTCAT GCCCGAGAAG AAAGAGTTCT ACGGCTTTGA CGTGATCATG 1020
TACGAGGGCA ACCTGCTGAC CCAGCAGGGC TTCGAGACAC GGATCGAGAG CCTGAGCAAG 1080
GGCATCAAGG TGCTGCAGGC CTTCAACATC AAGGCCGAGA TGAAGCCCTT CATCAGCCTG 1140
ACCTCCGCCG ACCCCAACGT GCTGCTGAAG AATTTCGAGA GCATCTTCAA GAAGAAAACC 1200
CGGCCCTACA GCATCGACGG CATCATCCTG GTGGAGCCCG GCAACAGCTA CCTGAACACC 1260
AACACCTTCA AGTGGAAGCC CACCTGGGAC AACACCCTGG ACTTTCTGGT CCGGAAGTGC 1320
CCCGAGTCCC TGAACGTGCC CGAGTACGCC CCCAAGAAGG GCTTCAGCCT GCATCTGCTG 1380
TTCGTGGGCA TCAGCGGCGA GCTGTTTAAG AAGCTGGCCC TGAACTGGTG CCCCGGCTAC 1440
ACCAAGCTGT TCCCCGTGAC CCAGCGGAAC CAGAACTACT TCCCCGTGCA GTTCCAGCCC 1500
AGCGACTTCC CCCTGGCCTT CCTGTACTAC CACCCCGACA CCAGCAGCTT CAGCAACATC 1560
GATGGCAAGG TGCTGGAAAT GCGGTGCCTG AAGCGGGAGA TCAACTACGT GCGCTGGGAG 1620
ATCGTGAAGA TCCGGGAGGA CCGGCAGCAG GATCTGAAAA CCGGCGGCTA CTTCGGCAAC 1680
GACTTCAAGA CCGCCGAGCT GACCTGGCTG AACTACATGG ACCCCTTCAG CTTCGAGGAA 1740
CTGGCCAAGG GACCCAGCGG CATGTACTTC GCTGGCGCCA AGACCGGCAT CTACAGAGCC 1800
CAGACCGCCC TGATCAGCTT CATCAAGCAG GAAATCATCC AGAAGATCAG CCACCAGAGC 1860
TGGGTGATCG ACCTGGGCAT CGGCAAGGGC CAGGACCTGG GCAGATACCT GGACGCCGGC 1920
GTGAGACACC TGGTCGGCAT CGATAAGGAC CAGACAGCCC TGGCCGAGCT GGTGTACCGG 1980
AAGTTCTCCC ACGCCACCAC CAGACAGCAC AAGCACGCCA CCAACATCTA CGTGCTGCAC 2040
CAGGATCTGG CCGAGCCTGC CAAAGAAATC AGCGAGAAAG TGCACCAGAT CTATGGCTTC 2100
CCCAAAGAGG GCGCCAGCAG CATCGTGTCC AACCTGTTCA TCCACTACCT GATGAAGAAC 2160
ACCCAGCAGG TCGAGAACCT GGCTGTGCTG TGCCACAAGC TGCTGCAGCC TGGCGGCATG 2220
GTCTGGTTCA CCACCATGCT GGGCGAACAG GTGCTGGAAC TGCTGCACGA GAACCGGATC 2280
GAACTGAACG AAGTGTGGGA GGCCCGGGAG AACGAGGTGG TCAAGTTCGC CATCAAGCGG 2340
CTGTTCAAAG AGGACATCCT GCAGGAAACC GGCCAGGAAA TCGGCGTCCT GCTGCCCTTC 2400
AGCAACGGCG ACTTCTACAA TGAGTACCTG GTCAACACCG CCTTTCTGAT CAAGATTTTC 2460
AAGCACCATG GCTTTAGCCT CGTGCAGAAG CAGAGCTTCA AGGACTGGAT CCCCGAGTTC 2520
CAGAACTTCA GCAAGAGCCT GTACAAGATC CTGACCGAGG CCGACAAGAC CTGGACCAGC 2580
CTGTTCGGCT TCATCTGCCT GCGGAAGAAC GGGCCCGGCG GAGGCGGAAG TGGAGGCGGA 2640
GGAAGCGGAG GGGGAGGATC TGGCGGCGGA GGCAGCCTCG AGAACACCAT CAATATCGCC 2700
AAGAACGACT TCAGCGACAT CGAGCTGGCC GCCATCCCTT TCAACACCCT GGCCGACCAC 2760
TATGGCGAGC GGCTGGCCAG AGAACAGCTG GCCCTGGAAC ACGAGAGCTA CGAAATGGGC 2820
GAGGCCCGGT TCCGGAAGAT GTTCGAGAGA CAGCTGAAGG CCGGCGAGGT GGCCGATAAT 2880
GCCGCCGCTA AGCCCCTGAT CACCACCCTG CTGCCCAAGA TGATCGCCCG GATCAACGAT 2940
TGGTTCGAGG AAGTGAAGGC CAAGCGGGGC AAGAGGCCCA CCGCCTTCCA GTTTCTGCAG 3000
GAAATCAAGC CCGAGGCCGT GGCCTACATC ACCATCAAGA CCACCCTGGC CTGCCTGACC 3060
AGCGCCGACA ATACCACCGT GCAGGCTGTC GCTTCTGCCA TCGGCAGAGC CATCGAGGAC 3120
GAGGCCAGAT TCGGCAGAAT CCGGGACCTG GAAGCCAAGC ACTTCAAGAA AAACGTGGAG 3180
GAACAGCTGA ACAAGCGCGT GGGCCACGTG TACAAGAAAG CCTTCATGCA GGTGGTGGAG 3240
GCCGACATGC TGAGCAAGGG CCTGCTGGGC GGAGAAGCCT GGTCCAGCTG GCACAAAGAG 3300
GACAGCATCC ACGTCGGCGT GCGGTGCATC GAGATGCTGA TCGAGTCGAC CGGCATGGTG 3360
TCCCTGCACA GGCAGAATGC CGGCGTGGTG GGCCAGGACA GCGAGACAAT CGAACTGGCC 3420
CCCGAGTATG CCGAGGCCAT TGCCACAAGA GCCGGCGCTC TGGCCGGCAT CAGCCCCATG 3480
TTCCAGCCCT GCGTGGTGCC TCCTAAGCCC TGGACAGGCA TCACAGGCGG CGGATACTGG 3540
GCCAACGGCA GACGCCCTCT GGCTCTGGTG CGGACCCACA GCAAGAAAGC CCTGATGCGC 3600
TACGAGGACG TGTACATGCC CGAGGTGTAC AAGGCCATCA ACATTGCCCA GAACACCGCC 3660
TGGAAGATCA ACAAGAAAGT GCTGGCCGTG GCCAATGTGA TCACCAAGTG GAAGCACTGC 3720
CCCGTGGAGG ACATCCCCGC CATCGAGCGG GAGGAACTGC CCATGAAGCC CGAGGACATC 3780
GACATGAACC CCGAGGCCCT GACAGCCTGG AAAAGGGCCG CTGCCGCCGT GTACCGGAAG 3840
GACAAGGCCC GGAAGTCCCG GCGGATCAGC CTGGAGTTCA TGCTGGAACA GGCCAACAAG 3900
TTCGCCAACC ACAAGGCCAT TTGGTTCCCT TACAACATGG ACTGGCGGGG CAGAGTGTAC 3960
GCCGTGAGCA TGTTCAATCC ACAAGGCAAC GACATGACCA AGGGGCTGCT GACCCTGGCC 4020
AAGGGCAAGC CCATCGGCAA AGAGGGCTAC TACTGGCTGA AGATCCACGG CGCCAACTGC 4080
GCTGGCGTGG ACAAGGTGCC CTTCCCAGAG CGGATCAAGT TCATCGAGGA AAACCACGAG 4140
AACATCATGG CCTGCGCCAA GAGCCCTCTA GAAAACACTT GGTGGGCCGA GCAGGACAGC 4200
CCCTTCTGCT TCCTGGCCTT CTGCTTTGAG TACGCCGGAG TGCAGCACCA CGGCCTGAGC 4260
TACAACTGCA GCCTGCCCCT GGCCTTCGAT GGCAGCTGCA GCGGCATCCA GCACTTCAGC 4320
GCCATGCTGA GGGACGAAGT GGGCGGCAGA GCCGTGAATC TGCTGCCAAG CGAGACAGTG 4380
CAGGACATCT ACGGGATCGT GGCCAAGAAA GTGAACGAGA TCCTGCAGGC CGACGCCATC 4440
AACGGCACCG ACAACGAGGT GGTGACCGTG ACCGATGAGA ACACCGGCGA GATCAGCGAG 4500
AAAGTGAAGC TCGGCACCAA GGCCCTGGCT GGCCAGTGGC TGGCCTACGG CGTGACCAGA 4560
TCCGTGACCA AGCGGAGCGT GATGACACTG GCCTATGGCA GCAAAGAGTT CGGCTTCCGG 4620
CAGCAGGTGC TGGAAGATAC CATCCAGCCT GCCATCGACA GCGGCAAGGG GCTGATGTTC 4680
ACCCAGCCCA ACCAGGCCGC TGGCTACATG GCCAAGCTCA TATGGGAGAG CGTGTCCGTG 4740
ACAGTGGTGG CCGCCGTGGA GGCCATGAAT TGGCTGAAGT CCGCCGCCAA ACTGCTGGCC 4800
GCTGAAGTGA AGGACAAAAA GACCGGCGAA ATCCTGCGGA AGAGATGCGC CGTGCACTGG 4860
GTGACCCCCG ATGGCTTCCC CGTGTGGCAG GAGTACAAGA AGCCCATCCA GACCCGGCTG 4920
AACCTGATGT TCCTGGGCCA GTTCAGACTG CAGCCCACCA TCAACACCAA CAAGGACTCC 4980
GAGATCGACG CCCACAAGCA GGAAAGCGGC ATTGCCCCCA ACTTCGTGCA CAGCCAGGAC 5040
GGCAGCCACC TGAGAAAGAC CGTGGTGTGG GCTCACGAGA AGTACGGCAT CGAGAGCTTC 5100
GCCCTGATCC ACGACAGCTT CGGCACCATT CCCGCCGACG CCGCCAACCT GTTCAAGGCC 5160
GTGCGGGAGA CAATGGTGGA CACCTACGAG AGCTGCGACG TGCTGGCCGA CTTCTACGAC 5220
CAGTTCGCCG ACCAGCTGCA CGAGAGCCAG CTGGACAAGA TGCCCGCCCT GCCCGCCAAG 5280
GGGAACCTGA ACCTGCGGGA CATCCTGGAA AGCGACTTCG CCTTCGCCTG A 5331 (서열번호 16)
상기 제조된 Pus-X1-Nλ-X2 DNA 절편과 상기 제조된 NP868R-X1 or X2-T7 Pol DNA 절편을 T4 ligase로 연결하는 방법으로 식 (2)의 Pus-X1-Nλ-X2-NP868R-X1 or X2-T7 Pol DNA 절편을 제조하였다. 상기 제조된 Pus-X1-Nλ-X2-NP868R-X1 or X2-T7 Pol DNA 절편을 플라스미드 혹은 바이러스 벡터에 클로닝하여 ctDdRp 발현단위를 완성하였다.
바람직하게, 관심 RNA 절편은 <T7 promoter - 5'UTR - ctDdRp01 DNA- 전사 종결서열>이며, 이를 pUC19에 삽입하여 'pUC19 ctDdRp01'이라고 하였다(도 3). 여기서, ctDdRp01은 Pus-X1-Nλ-X2-NP868R-X1 or X2-T7 Pol DNA 절편이다. 이를 DH5α 균주에 도입하여 증폭하였다. 상기 T7 promoter 대신에 T7 promoter+Lac operator를 사용할 수도 있다.
본 발명은 상기 목적을 진행생물에서 달성하기 위하여 본 발명의 관심 RNA 전사시스템의 RNA 중합효소의 발현단위는 진핵세포에서 번역이 될 수 있는 RNA Polymerase mRNA 발현단위 및/또는 상기 RNA Polymerase에 의해 전사되고 번역이 되는 RNA Polymerase DNA 단위로 제공한다.
1.3. RdRp
본 발명의 상기 1.1항에 있는 RNA 중합효소 발현단위의 식(1)에서 X로 사용하는 RNA 중합효소는 RdRp를 사용할 수도 있다.
본 발명에서 제안하는 RdRp를 이용한 관심 RNA 전사시스템을 제조하기 위해서, RdRp를 코딩하는 mRNA DNA 절편을 제조하였다.
RdRp 발현단위는 Semliki Forest 바이러스(SFV) RdRp mRNA를 인코딩하는 주형 DNA 절편으로 제조하였다.
본 발명은 상기 목적을 달성하기 위하여 본 발명의 관심 RNA 전사시스템의 RNA 중합효소 발현단위는 상기 식(1)의 염기서열을 포함하는 RNA 중합 효소 유전자를 제공한다.
식(1): W-X-Y-Z
상기 식에서 W는 무세포유래 세포에 있는 RNA 중합효소 유전자에 의해 인지되는 프로모터, 그리고 SD 부위를 포함하는 5'UTR을 포함한다.
X는 Semliki Forest 바이러스(SFV) RdRp mRNA로, 먼저, 기준 Semliki Forest 바이러스 레플리콘 플라스미드(pSFV1; Invitrogen #18448-019)는 ThermoFisher 사(미국)에서 구입하였으며, 개시코돈이 제외된 알파바이러스 RdRp(RdRp ORF의 뉴클레오타이드 222-6321개)를 코딩하는 오픈 리딩 프레임를 증폭하여 산물을 확보하였다. 고속 단백질 액체 크로마토그래피(Fast Protein Liquid Chromatography: FPLC)에 의해서 정제하기 위해. N-말단 헥사히스티딘 태그를 갖는 RdRp를 제조할 수도 있다.
상기 RdRp 발현단위를 생성하기 위해, 상기 실시례 2항에 따라 <T7 promoter - 5'UTR - RdRp를 코딩하는 오픈 리딩 프레임(RdRp ORF의 뉴클레오타이드 222-6321개) DNA - 전사종결서열>을 순서대로 라이게이션하여 재조합 DNA를 제조하여. pUC 19 벡터에 삽입하여. 'pUC19 RdRp'라고 하였다(도 3). 이를 DH5α 균주에 도입하여 증폭하였다. 상기 T7 promoter 대신에 T7 promoter+Lac operator를 사용할 수도 있다.
실시례 2. 관심 RNA 발현단위
2.1. mRNA를 인코딩하는 관심 RNA 발현단위
본 실시례는 관심 RNA가 mRNA인 경우 관심 RNA 발현단위는 상기 RNA 중합효소 발현단위를 구성하는 RNA 중합효소 또는 무세포유래세포에 있는 중합효소가 결합하여 기능을 할 수 있는 프로모터와 관심 RNA orf(관심 RNA를 코딩하는 DNA)을 포함할 수 있다. RNA 중합효소는 DdRp와 RdRp에서 선택되는 각각 또는 이들 모두를 사용할 수 있다. 상기 발현단위는 DNA 및 RNA를 포함하는 핵산에서 선택되어진 어느 하나 이상을 의미한다. 상기 RNA 발현단위는 상기 DNA 발현단위를 체외전사하여 준비할 수 있다.
바람직하게, 상기 관심 RNA 발현단위는 상기 관심 RNA orf의 상류에 RNA 중합효소에 의해 인지되어 작동하는 부위, 진핵세포에서 작동할 수 있는 RNA 구조체(5'UTR 서열, 관심 RNA를 인코딩하는 DNA, 하류에 종료 코돈, 3'UTR 서열과 Poly(A) tail 서열)로 구성할 수 있다.
상기 관심 RNA 발현단위는 여려 종류의 관심 RNA들에 상응하는 DNA를 포함하며, 이들 단위 사이에는 링커, intercistronic spacer(시스트론간 서페이서)를 포함할 수 있다.
바람직하게, RNA 중합효소에 의해 인지되어 작동하는 부위에 상응하는 프로모터는 무세포유래 세포에서 작동하는 프로모터일 수 있다. 바람직하게 상기 중합효소 발현단위를 구성하는 중합효소에 의해 결정할 수 있다.
구체적으로 살펴보면, 본 발명의 관심 RNA 발현단위는 상기 중합효소 발현단위에서 제공하는 ctDdRp 및/또는 무세포유래 세포에서 제공하는 DdRp가 결합하여 기능을 할 수 있는 프로모터와 관심 RNA를 포함하도록 제조할 수 있다.
관심 RNA 발현단위는 단일 또는 조합으로 T7 프로모터 하류에 관심 RNA를 인코딩하는 관심 RNA를 포함하는 DNA 절편을 제공할 수 있다. 상기 T7 promoter는 T7 RNA Polymerase가 인지하여 하류 부위를 RNA로 전사시키며, 그 염기서열은 서열번호 1이다.
T7 promoter : TAATACGACT CACTATAGGG (서열번호 1)
바람직하게, 상기 5'UTR는 hAg-Kozak로. 인간 알파-글로빈 5' UTR, 5′-human alpha globin UTR [hAG] 은 높은 번역 활성을 보장한다.
5' UTR은 인간 알파 글로빈 mRNA의 서열을 포함한다. RNA는 UUCUUCUGGUCCCCACAGACUCAGAGAGAACCCGCCACC (서열번호: 17)의 5' UTR 서열을 포함한다. RNA의 5' UTR 서열은 서열 TTCTTCTGGTCCCCACAGACTCAGAGAGAACCCGCCACC (서열번호: 18)를 포함하는 DNA에 의해 인코딩된다.
또 다른 RNA의 5' UTR 서열은 Full PCV Kozak RNA로 서열 GGCGAACUAGUAUUCUUCUGGUCCCCACAGACUCAGAGAGAACCCGCCACC (서열번호: 19)를 포함한다. RNA의 5' UTR 서열은 서열 GGCGAACTAGTATTCTTCTGGTCCCCACAGACTCAGAGAGAACCCGCCACC (서열번호: 20)를 포함하는 DNA에 의해 인코딩된다.
상기 5'UTR 서열은 CAP1 구조를 위한 5'말단에 G 및 Kozak 컨센서스를 포함할 수도 있으며 그 염기서열은 서열번호 19이다.
Kozak 컨센서스 서열: ACCAUGG (서열번호 21)
관심 RNA가 융합단백질을 인코딩하는 경우는 링커는 (G4S)3-linker을 사용할 수 있다. (G4S)3-linker는 서열 GGSGGGGSGG (서열번호: 22)를 포함한다. RNA의 링커는 서열 GGCGGCUCUGGAGGAGGCGGCUCCGGAGGC (서열번호: 23)를 포함한다. RNA의 링커는 서열 GGCGGCTCTGGAGGAGGCGGCTCCGGAGGC (서열 번호: 24)를 포함하는 DNA에 의해 인코딩된다.
RNA은 3'UTR을 포함한다. mRNA에서 단백질-코딩 서열의 3'에서 발견된 특정 비번역 서열은 RNA 안정성, 번역 및 단백질 발현을 개선하는 것으로 나타났다. 3'UTR는 muag - A64 - C30 - 히스톤-SL, 3′-AES/mtRNR1-A30LA70 및 2 BgUTR-A30LA70을 포함하는 구조에서 선택되어진 어느 하나일 수 있다.
바람직하게, 3'UTR은 muag<(알파-)글로빈의 돌연변이된 UTR, 서열번호 25>, 폴리(A) 꼬리는 64개의 아데닌 뉴클레오타이드(서열번호 26), 폴리(C) 서열은 30개의 사이토신 뉴클레오타이드(서열번호 27), 히스톤 스템-루프(서열번호 28)로 이루어진 RNA 서열이다.
muag<(알파-)글로빈의 돌연변이된 UTR>; 5'-GCCCGaTGGG CCTCCCAACG GGCCCTCCTC CCCTCCTTGC ACCG-3'(서열번호 25; 밑줄 친 뉴클레오타이드는 야생형 서열과 비교하여 돌연변이임)
A64: GGACTAGTAG ATCTAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAA (서열번호 26)
C30: TGCATCCCCC CCCCCCCCCC CCCCCCCCCC CCCCCTCTA G (서열번호 27)
히스톤 스템-루프: 5'-CAAAGGCUCU UUUCAGAGCC ACCA-3' (서열번호 28)
또 다른 3′UTR로 3′-AES/mtRNR1-A30LA70은 AES 또는 이의 단편의 3' 비번역 영역 및/또는 미토콘드리아 인코딩된 12S RNA의 비-코딩 RNA를 포함한다. AES는 스플릿의 아미노-말단 인핸서에 관한 것으로 AES 유전자를 포함한다. AES mRNA 서열은 NCBI 참조 서열 등록 번호 NM_198969이다. MT_RNR1은 미토콘드리아 인코딩된 12S RNA에 관한 것으로 MT_RNR1 유전자를 포함한다. 이 RNA 유전자는 Mt_r RNA 클래스에 속한다. MT-RNR1과 관련된 질병에는 제한성 심근병증 및 청각 신경병증이 포함된다. MT_RNR1 RNA 서열은 NCBI 참조 서열 등록 번호 NC_012920의 서열 내부에 존재한다.
AES mRNA의 3' 비번역 영역은 서열 CUGGUACUGCAUGCACGCAAUGCUAGCUGCCCCUUUCCCGUCCUGGGUACCCCGAGUCUCCCCCGACCUCGGGUCCCAGGUAUGCUCCCACCUCCACCUGCCCCACUCACCACCUCUGCUAGUUCCAGACACCUCC (서열번호: 29)를 포함하는 RNA 분자이다.
미토콘드리아 인코딩된 12S RNA의 비-코딩 RNA는 서열 CAAGCACGCAGCAAUGCAGCUCAAAACGCUUAGCCUAGCCACACCCCCACGGGAAACAGCAGUGAUUAACCUUUAGCAAUAAACGAAAGUUUAACUAAGCUAUACUAACCCCAGGGUUGGUCAAUUUCGUGCCAGCCACACCG (서열번호: 30)를 포함하는 RNA 분자이다.
3' UTR은 서열 CUCGAGCUGGUACUGCAUGCACGCAAUGCUAGCUGCCCCUUUCCCGUCCUGGGUACCCCGAGUCUCCCCCGACCUCGGGUCCCAGGUAUGCUCCCACCUCCACCUGCCCCACUCACCACCUCUGCUAGUUCCAGACACCUCCCAAGCACGCAGCAAUGCAGCUCAAAACGCUUAGCCUAGCCACACCCCCACGGGAAACAGCAGUGAUUAACCUUUAGCAAUAAACGAAAGUUUAACUAAGCUAUACUAACCCCAGGGUUGGUCAAUUUCGUGCCAGCCACACCGAGACCUGGUCCAGAGUCGCUAGCCGCGUCGCU (서열번호: 31)를 포함하는, RNA 분자이다.
AES mRNA의 3' 비번역 영역을 인코딩하는 폴리뉴클레오티드 서열은 서열 CTGGTACTGCATGCACGCAATGCTAGCTGCCCCTTTCCCGTCCTGGGTACCCCGAGTCTCCCCCGACCTCGGGTCCCAGGTATGCTCCCACCTCCACCTGCCCCACTCACCACCTCTGCTAGTTCCAGACACCTCC (서열번호: 32)를 포함하는 DNA 분자이다.
미토콘드리아 인코딩된 12S RNA의 비-코딩 RNA를 인코딩하는 폴리뉴클레오티드는 서열 CAAGCACGCAGCAATGCAGCTCAAAACGCTTAGCCTAGCCACACCCCCACGGGAAACAGCAGTGATTAACCTTTAGCAATAAACGAAAGTTTAACTAAGCTATACTAACCCCAGGGTTGGTCAATTTCGTGCCAGCCACACCG (서열번호: 33)를 포함하는 DNA 분자이다.
3' UTR을 인코딩하는 폴리뉴클레오티드는 서열 CTGGTACTGCATGCACGCAATGCTAGCTGCCCCTTTCCCGTCCTGGGTACCCCGAGTCTCCCCCGACCTCGGGTCCCAGGTATGCTCCCACCTCCACCTGCCCCACTCACCACCTCTGCTAGTTCCAGACACCTCCCAAGCACGCAGCAATGCAGCTCAAAACGCTTAGCCTAGCCACACCCCCACGGGAAACAGCAGTGATTAACCTTTAGCAATAAACGAAAGTTTAACTAAGCTATACTAACCCCAGGGTTGGTCAATTTCGTGCCAGCCACACCGAGACCTGGTCCAGAGTCGCTAGCCGCGTCGCT (서열번호: 34)를 포함하는 DNA 분자이다.
RNA은 그 3' 말단에 폴리(A) 꼬리를 포함한다. 폴리(A) 꼬리는 50개 초과 또는 100개 초과의 아데닌 뉴클레오티드를 포함한다. 예를 들어, 폴리(A) 꼬리는 120개의 아데닌 뉴클레오티드를 포함한다. 이 폴리(A) 꼬리는 RNA 안정성과 번역 효율성을 향상시킨다. 폴리(A) 꼬리를 포함하는 RNA는 5' 3' 전사 방향으로, 적어도 50, 100, 또는 120개의 아데닌 연속 뉴클레오티드를 인코딩하는 폴리뉴클레오티드 서열 및 유형 IIS 제한 엔도뉴클레아제에 대한 인식 서열을 포함하는 DNA 분자를 전사함으로써 생성된다.
반면, 또 다른 3' UTR, 3′AES/mtRNR1-UTR은 AES mRNA의 아미노 말단 인핸서, 12S r RNA(mtRNR1) 및 마스크되지 않은 폴리(A) 꼬리에서 파생된 모티프의 융합이다. AES-mtRNR1 서열은 RNA 안정성을 증가시킨다,
폴리(A) 꼬리(A30LA70)는 짧은 링커에 의해 중단된 분할된 100-nt 폴리(A) 꼬리이며 mRNA 안정성을 향상시킨다.
여기서 L = GCAUAUGACU (서열번호 35)
본 발명의 관심 RNA 발현단위는 플라스미드 혹은 바이러스 벡터를 사용하여 제작할 수 있다. 관심 RNA 절편은 T7 promoter - 5'UTR - 관심 RNA - (Tethering domain)4 - 3′AES/mtRNR1 - A30LA70)이며 이를 t관심 RNA라고 하며, 플라스미드에 삽입하여 'pUC19 t관심 RNA'이라고 하였다(도 4). 이를 DH5α 균주에 도입하여 증폭하였다.
본 발명에서 사용한 관심 RNA를 구체적으로 살펴보면,
본 실시례에서 사용된 mRNAi는 반딧불 루시퍼라제(FFL), TNFR2 단백질, GM-CSF, 및 EPO, 광견병 바이러스의 G 단백질(RAV-G) 및 호흡기세포융합바이러스 (Ripiratory Syncytial Virus, RSV) 롱(long) 균주의 RSV-F 단백질 등을 코딩하는 mRNA이며 이에만 제한된 것은 아니다.
분비 신호 펩티드는 아미노산 서열로 MRVMAPRTLILLLSGALALTETWAGS (서열번호 36)를 포함한다. 일부 실시양태에서, 분비 신호 펩티드를 코딩하는 폴리뉴클레오티드 서열은 서열 AUGAGAGUGA UGGCCCCCAG AACCCUGAUC CUGCUGCUGU CUGGCGCCCU GGCCCUGACA GAGACAUGGG CCGGAAGC (서열 번호 37)를 포함한다.
코돈-최적화된 반딧불 루시퍼라제(FFL) mRNA
X2AUGGAAGAUGCCAAAAACAUUAAGAAGGGCCCAGCGCCAUUCUACCCACUCGAAGACGGGACCGCCGGCGAGCAGCUGCACAAAGCCAUGAAGCGCUACGCCCUGGUGCCCGGCACCAUCGCCUUUACCGACGCACAUAUCGAGGUGGACAUUACCUACGCCGAGUACUUCGAGAUGAGCGUUCGGCUGGCAGAAGCUAUGAAGCGCUAUGGGCUGAAUACAAACCAUCGGAUCGUGGUGUGCAGCGAGAAUAGCUUGCAGUUCUUCAUGCCCGUGUUGGGUGCCCUGUUCAUCGGUGUGGCUGUGGCCCCAGCUAACGACAUCUACAACGAGCGCGAGCUGCUGAACAGCAUGGGCAUCAGCCAGCCCACCGUCGUAUUCGUGAGCAAGAAAGGGCUGCAAAAGAUCCUCAACGUGCAAAAGAAGCUACCGAUCAUACAAAAGAUCAUCAUCAUGGAUAGCAAGACCGACUACCAGGGCUUCCAAAGCAUGUACACCUUCGUGACUUCCCAUUUGCCACCCGGCUUCAACGAGUACGACUUCGUGCCCGAGAGCUUCGACCGGGACAAAACCAUCGCCCUGAUCAUGAACAGUAGUGGCAGUACCGGAUUGCCCAAGGGCGUAGCCCUACCGCACCGCACCGCUUGUGUCCGAUUCAGUCAUGCCCGCGACCCCAUCUUCGGCAACCAGAUCAUCCCCGACACCGCUAUCCUCAGCGUGGUGCCAUUUCACCACGGCUUCGGCAUGUUCACCACGCUGGGCUACUUGAUCUGCGGCUUUCGGGUCGUGCUCAUGUACCGCUUCGAGGAGGAGCUAUUCUUGCGCAGCUUGCAAGACUAUAAGAUUCAAUCUGCCCUGCUGGUGCCCACACUAUUUAGCUUCUUCGCUAAGAGCACUCUCAUCGACAAGUACGACCUAAGCAACUUGCACGAGAUCGCCAGCGGCGGGGCGCCGCUCAGCAAGGAGGUAGGUGAGGCCGUGGCCAAACGCUUCCACCUACCAGGCAUCCGCCAGGGCUACGGCCUGACAGAAACAACCAGCGCCAUUCUGAUCACCCCCGAAGGGGACGACAAGCCUGGCGCAGUAGGCAAGGUGGUGCCCUUCUUCGAGGCUAAGGUGGUGGACUUGGACACCGGUAAGACACUGGGUGUGAACCAGCGCGGCGAGCUGUGCGUCCGUGGCCCCAUGAUCAUGAGCGGCUACGUUAACAACCCCGAGGCUACAAACGCUCUCAUCGACAAGGACGGCUGGCUGCACAGCGGCGACAUCGCCUACUGGGACGAGGACGAGCACUUCUUCAUCGUGGACCGGCUGAAGAGCCUGAUCAAAUACAAGGGCUACCAGGUAGCCCCAGCCGAACUGGAGAGCAUCCUGCUGCAACACCCCAACAUCUUCGACGCCGGGGUCGCCGGCCUGCCCGACGACGAUGCCGGCGAGCUGCCCGCCGCAGUCGUCGUGCUGGAACACGGUAAAACCAUGACCGAGAAGGAGAUCGUGGACUAUGUGGCCAGCCAGGUUACAACCGCCAAGAAGCUGCGCGGUGGUGUUGUGUUCGUGGACGAGGUGCCUAAAGGACUGACCGGCAAGUUGGACGCCCGCAAGAUCCGCGAGAUUCUCAUUAAGGCCAAGAAGGGCGGCAAGAUCGCCGUGUAY2 (서열번호 38)
5' 및 3' UTR 서열: X2 = GGGAUCCUACC (서열번호 39), Y2 = UUUGAAUU (서열번호 40)
<치료용 단백질>
sTNFR2
본 발명의 치료 단백질은, TNFR2 단백질 또는 이의 세포외 영역 단편이다. 종양괴사인자(tumor necrosis factor, TNF)는 다면발현 사이토카인으로, 특히 TNF-α는 염증성 반응 및 면역 체계에서 중요한 역할을 담당한다. TNF 에 결합하는 수용체로서 TNFR1(분자량, 55 kD; TNF-R55) 및 TNFR2(분자량,75 kD; TNF-R75)가 알려져 있으며, 이 때 TNFR2에 대한 TNF-α의 친화도는 TNFR1에 대한 친화도보다 몇 배 더 높다.
본 발명에서 TNFR2 단백질은 1386 bp DNA(NM_001066.3에 코딩되었으며, 이 단백질 또는 이의 세포외 영역 단편(sTNFR2)은 TNF-α에 대하여 높은 결합 친화도를 가지며 TNF-α의 작용을 억제함으로써 자가 면역 질환의 치료에 특히 우수한 효과를 나타낼 수 있다.
바람직하게, 상기 sTNFR2는 TNFR2 단백질 중 N말단으로부터 1번 내지 256번을 포함하는 서열번호 41의 아미노산 서열 폴리펩타이드일 수 있다. 상기 sTNFR2 cDNA는 서열번호 42의 염기서열로 이루어진 폴리뉴클레오타이드일 수 있다.
sTNFR2: TNFR2의 1 ~ 256 아미노산으로 이루어진 transmembrane sequence 단편
MAPVAVWAAL AVGLELWAAA HALPAQVAFT PYAPEPGSTC RLREYYDQTA QMCCSKCSPG QHAKVFCTKT SDTVCDSCED STYTQLWNWV PECLSCGSRC SSDQVETQAC TREQNRICTC RPGWYCALSK QEGCRLCAPL RKCRPGFGVA RPGTETSDVV CKPCAPGTFS NTTSSTDICR PHQICNVVAI PGNASMDAVC TSTSPTRSMA PGAVHLPQPV STRSQHTQPT PEPSTAPSTS FLLPMGPSPP AEGSTG (서열번호 41)
sTNFR2 cDNA; sTNFR2에 상응하는 cDNA(768bp)
ATGGCGCCC GTCGCCGTCT GGGCCGCGCT GGCCGTCGGA CTGGAGCTCT GGGCTGCGGC GCACGCCTTG CCCGCCCAGG TGGCATTTAC ACCCTACGCC CCGGAGCCCG GGAGCACATG CCGGCTCAGA GAATACTATG ACCAGACAGC TCAGATGTGC TGCAGCAAAT GCTCGCCGGG CCAACATGCA AAAGTCTTCT GTACCAAGAC CTCGGACACC GTGTGTGACT CCTGTGAGGA CAGCACATAC ACCCAGCTCT GGAACTGGGT TCCCGAGTGC TTGAGCTGTG GCTCCCGCTG TAGCTCTGAC CAGGTGGAAA CTCAAGCCTG CACTCGGGAA CAGAACCGCA TCTGCACCTG CAGGCCCGGC TGGTACTGCG CGCTGAGCAA GCAGGAGGGG TGCCGGCTGT GCGCGCCGCT GCGCAAGTGC CGCCCGGGCT TCGGCGTGGC CAGACCAGGA ACTGAAACAT CAGACGTGGT GTGCAAGCCC TGTGCCCCGG GGACGTTCTC CAACACGACT TCATCCACGG ATATTTGCAG GCCCCACCAG ATCTGTAACG TGGTGGCCAT CCCTGGGAAT GCAAGCATGG ATGCAGTCTG CACGTCCACG TCCCCCACCC GGAGTATGGC CCCAGGGGCA GTACACTTAC CCCAGCCAGT GTCCACACGA TCCCAACACA CGCAGCCAAC TCCAGAACCC AGCACTGCTC CAAGCACCTC CTTCCTGCTC CCAATGGGCC CCAGCCCCCC AGCTGAAGGG AGCACTGGC (서열번호 42)
EPO
본 발명의 EPO RNA 발현단위의 제조를 위하여, 쥣과의(murine) EPO cDNA의 염기서열은 서열번호 43이다.
EPO cDNA
ATGGGCGTGC CCGAGCGGCC GACCCTGCTC CTGCTGCTCA GCCTGCTGCT CATCCCCCTG GGGCTGCCCG TCCTCTGCGC CCCCCCGCGC CTGATCTGCG ACTCCCGGGT GCTGGAGCGC TACATCCTCG AGGCCAAGGA GGCGGAGAAC GTGACCATGG GCTGCGCCGA GGGGCCCCGG CTGAGCGAGA ACATCACGGT CCCCGACACC AAGGTGAACT TCTACGCCTG GAAGCGCATG GAGGTGGAGG AGCAGGCCAT CGAGGTCTGG CAGGGCCTGT CCCTCCTGAG CGAGGCCATC CTGCAGGCGC AGGCCCTCCT GGCCAACTCC AGCCAGCCCC CGGAGACACT GCAGCTCCAC ATCGACAAGG CCATCTCCGG GCTGCGGAGC CTGACCTCCC TCCTGCGCGT GCTGGGCGCG CAGAAGGAGC TCATGAGCCC GCCCGACACG ACCCCCCCGG CCCCGCTGCG GACCCTGACC GTGGACACGT TCTGCAAGCT CTTCCGCGTC TACGCCAACT TCCTGCGGGG CAAGCTGAAG CTCTACACCG GGGAGGTGTG CCGCCGGGGC GACCGCTGA (서열번호 43)
GM CSF
본 발명의 GM CSF RNA 발현단위의 제조를 위하여, GM CSF (CSF2) (NM_000758)의 염기서열은 서열번호 44이다.
GM CSF (CSF2) cDNA (NM_000758)
ATGTGGCTGC AGAGCCTGCT GCTCTTGGGC ACTGTGGCCT GCAGCATCTC TGCACCCGCC CGCTCGCCCA GCCCCAGCAC GCAGCCCTGG GAGCATGTGA ATGCCATCCA GGAGGCCCGG CGTCTCCTGA ACCTGAGTAG AGACACTGCT GCTGAGATGA ATGAAACAGT AGAAGTCATC TCAGAAATGT TTGACCTCCA GGAGCCGACC TGCCTACAGA CCCGCCTGGA GCTGTACAAG CAGGGCCTGC GGGGCAGCCT CACCAAGCTC AAGGGCCCCT TGACCATGAT GGCCAGCCAC TACAAGCAGC ACTGCCCTCC AACCCCGGAA ACTTCCTGTG CAACCCAGAT TATCACCTTT GAAAGTTTCA AAGAGAACCT GAAGGACTTT CTGCTTGTCA TCCCCTTTGA CTGCTGGGAG CCAGTCCAGG AGTGA (서열번호 44)
<백신 접종 단백질>
광견병 바이러스의 G 단백질(RAV-G)
본 발명의 RAV-G RNA 발현단위의 제조를 위하여, 광견병 바이러스의 G 단백질(RAV-G)의 염기서열은 서열번호 45이다.
RAV-G cDNA
ATGGTGCCCC AGGCCCTGCT CTTCGTCCCG CTGCTGGTGT TCCCCCTCTG CTTCGGCAAG TTCCCCATCT ACACCATCCC CGACAAGCTG GGGCCGTGGA GCCCCATCGA CATCCACCAC CTGTCCTGCC CCAACAACCT CGTGGTCGAG GACGAGGGCT GCACCAACCT GAGCGGGTTC TCCTACATGG AGCTGAAGGT GGGCTACATC AGCGCCATCA AGATGAACGG GTTCACGTGC ACCGGCGTGG TCACCGAGGC GGAGACCTAC ACGAACTTCG TGGGCTACGT GACCACCACC TTCAAGCGGA AGCACTTCCG CCCCACGCCG GACGCCTGCC GGGCCGCCTA CAACTGGAAG ATGGCCGGGG ACCCCCGCTA CGAGGAGTCC CTCCACAACC CCTACCCCGA CTACCACTGG CTGCGGACCG TCAAGACCAC CAAGGAGAGC CTGGTGATCA TCTCCCCGAG CGTGGCGGAC CTCGACCCCT ACGACCGCTC CCTGCACAGC CGGGTCTTCC CCGGCGGGAA CTGCTCCGGC GTGGCCGTGA GCTCCACGTA CTGCAGCACC AACCACGACT ACACCATCTG GATGCCCGAG AACCCGCGCC TGGGGATGTC CTGCGACATC TTCACCAACA GCCGGGGCAA GCGCGCCTCC AAGGGCAGCG AGACGTGCGG GTTCGTCGAC GAGCGGGGCC TCTACAAGTC CCTGAAGGGG GCCTGCAAGC TGAAGCTCTG CGGCGTGCTG GGCCTGCGCC TCATGGACGG GACCTGGGTG GCGATGCAGA CCAGCAACGA GACCAAGTGG TGCCCCCCCG GCCAGCTGGT CAACCTGCAC GACTTCCGGA GCGACGAGAT CGAGCACCTC GTGGTGGAGG AGCTGGTCAA GAAGCGCGAG GAGTGCCTGG ACGCCCTCGA GTCCATCATG ACGACCAAGA GCGTGTCCTT CCGGCGCCTG AGCCACCTGC GGAAGCTCGT GCCCGGGTTC GGCAAGGCCT ACACCATCTT CAACAAGACC CTGATGGAGG CCGACGCCCA CTACAAGTCC GTCCGCACGT GGAACGAGAT CATCCCGAGC AAGGGGTGCC TGCGGGTGGG CGGCCGCTGC CACCCCCACG TCAACGGGGT GTTCTTCAAC GGCATCATCC TCGGGCCCGA CGGCAACGTG CTGATCCCCG AGATGCAGTC CAGCCTGCTC CAGCAGCACA TGGAGCTGCT GGTCTCCAGC GTGATCCCGC TCATGCACCC CCTGGCGGAC CCCTCCACCG TGTTCAAGAA CGGGGACGAG GCCGAGGACT TCGTCGAGGT GCACCTGCCC GACGTGCACG AGCGGATCAG CGGCGTCGAC CTCGGCCTGC CGAACTGGGG GAAGTACGTG CTGCTCTCCG CCGGCGCCCT GACCGCCCTG ATGCTGATCA TCTTCCTCAT GACCTGCTGG CGCCGGGTGA ACCGGAGCGA GCCCACGCAG CACAACCTGC GCGGGACCGG CCGGGAGGTC TCCGTGACCC CGCAGAGCGG GAAGATCATC TCCAGCTGGG AGTCCTACAA GAGCGGCGGC GAGACCGGGC TGTGAGGACT AGTTATAAGA CTGACTATGA (서열번호 45)
RSV 롱(long) 균주의 RSV-F 단백질
본 발명의 RSV-F RNA 발현단위의 제조를 위하여, 호흡기세포융합 바이러스 (Ripiratory SynCytial Virus, RSV) 롱(long) 균주의 RSV-F 단백질의 염기서열은 서열번호 46이다.
RSV-F long(GC) cDNA
ATGGAGCTGC CCATCCTCAA GGCCAACGCC ATCACCACCA TCCTGGCGGC CGTGACGTTC TGCTTCGCCA GCTCCCAGAA CATCACCGAG GAGTTCTACC AGAGCACCTG CTCCGCCGTC AGCAAGGGCT ACCTGTCCGC CCTCCGGACC GGGTGGTACA CGAGCGTGAT CACCATCGAG CTGTCCAACA TCAAGGAGAA CAAGTGCAAC GGCACCGACG CGAAGGTGAA GCTGATCAAC CAGGAGCTCG ACAAGTACAA GAACGCCGTC ACCGAGCTGC AGCTGCTCAT GCAGAGCACG ACCGCCGCCA ACAACCGCGC GCGGCGCGAG CTGCCGCGGT TCATGAACTA CACCCTGAAC AACACCAAGA AGACGAACGT GACCCTCTCC AAGAAGCGCA AGCGGCGCTT CCTGGGGTTC CTGCTCGGCG TGGGGAGCGC CATCGCCTCC GGCATCGCCG TCAGCAAGGT GCTGCACCTG GAGGGCGAGG TGAACAAGAT CAAGTCCGCC CTCCTGAGCA CCAACAAGGC GGTCGTGTCC CTGAGCAACG GGGTGTCCGT CCTCACCAGC AAGGTGCTGG ACCTGAAGAA CTACATCGAC AAGCAGCTCC TGCCCATCGT GAACAAGCAG TCCTGCCGGA TCAGCAACAT CGAGACGGTC ATCGAGTTCC AGCAGAAGAA CAACCGCCTG CTCGAGATCA CCCGGGAGTT CAGCGTGAAC GCCGGCGTGA CCACCCCCGT CTCCACGTAC ATGCTGACCA ACAGCGAGCT GCTCTCCCTG ATCAACGACA TGCCCATCAC CAACGACCAG AAGAAGCTGA TGAGCAACAA CGTGCAGATC GTGCGCCAGC AGTCCTACAG CATCATGTCC ATCATCAAGG AGGAGGTCCT CGCCTACGTG GTGCAGCTGC CGCTGTACGG GGTCATCGAC ACCCCCTGCT GGAAGCTCCA CACGAGCCCC CTGTGCACCA CCAACACCAA GGAGGGCTCC AACATCTGCC TGACGCGGAC CGACCGCGGG TGGTACTGCG ACAACGCCGG CAGCGTGTCC TTCTTCCCCC AGGCCGAGAC CTGCAAGGTC CAGAGCAACC GGGTGTTCTG CGACACCATG AACTCCCTCA CGCTGCCGAG CGAGGTGAAC CTGTGCAACG TCGACATCTT CAACCCCAAG TACGACTGCA AGATCATGAC CTCCAAGACC GACGTGAGCT CCAGCGTGAT CACCTCCCTC GGCGCGATCG TCAGCTGCTA CGGGAAGACG AAGTGCACCG CCAGCAACAA GAACCGCGGC ATCATCAAGA CCTTCTCCAA CGGGTGCGAC TACGTGAGCA ACAAGGGCGT GGACACCGTC TCCGTGGGCA ACACCCTGTA CTACGTGAAC AAGCAGGAGG GGAAGAGCCT GTACGTCAAG GGCGAGCCCA TCATCAACTT CTACGACCCC CTCGTGTTCC CGTCCGACGA GTTCGACGCC AGCATCTCCC AGGTGAACGA GAAGATCAAC CAGAGCCTGG CCTTCATCCG GAAGTCCGAC GAGCTGCTGC ACCACGTCAA CGCCGGGAAG AGCACGACCA ACATCATGAT CACCACCATC ATCATCGTGA TCATCGTGAT CCTCCTGTCC CTGATCGCGG TCGGCCTCCT GCTGTACTGC AAGGCCCGCA GCACGCCCGT GACCCTCTCC AAGGACCAGC TGA (서열번호 46)
2.2. dsRNA를 인코딩하는 관심 RNA 절편
본 발명의 관심 RNA 발현단위는 관심 dsRNA 발현단위로 상기 RNA 중합효소 발현단위에서 기원하는 RNA 중합효소 및/또는 무세포유래 세포에서 기원하는 RNA 중합효소가 결합하여 기능을 할 수 있는 프로모터와 관심 RNA 절편(관심 dsNA를 코딩하는 DNA)을 포함할 수 있다. RNA 중합효소는 DdRp와 RdRp에서 선택되는 각각 또는 이들 모두를 사용할 수 있다.
바람직하게, 관심 RNA 발현단위는 <DdRp가 작동하는 프로모터- 관심 RNA-전사 종결서열>로 아래와 같이 제조하고 pUC19에 삽입하여, 이를 'pUC19 ds관심 RNA'이라고 하였다. 여기서 관심 RNA는 관심 dsRNA를 인코딩하는 DNA 절편이다.
CPB dsRNA
서열번호 47의 뉴클레오타이드 30번 내지 309번인 표적 서열은 콜로라드 감자 딱정벌레(CPB)의 COPI β(Coatomer subunit beta)로부터 선택하였다.
CGTAACCGCG GTTTGTTTCC ACCCTGAACT ACCTGTGGCT CTCACAGGCA GCGAAGATGG 60
TACCGTTAGA GTTTGGCATA CGAATACACA CAGATTAGAG AATTGTTTGA ATTATGGGTT 120
CGAGAGAGTG TGGACCATTT GTTGCTTGAA GGGTTCGAAT AATGTTTCTC TGGGGTATGA 180
CGAGGGCAGT ATATTAGTGA AAGTTGGAAG AGAAGAACCG GCAGTTAGTA TGGATGCCAG 240
TGGCGGTAAA ATAATTTGGG CAAGGCACTC GGAATTACAA CAAGCTAATT TGAAGGCGCT 300
GCCAGAAGGT GGAGAAATAA GAGATGGGGA GCGTTTACCT GTCTCTGTAA AAGATATGGG 360
AGCATGTGAA ATATACCCT 379 (서열번호 47)
CPB COPI 코트머 표적 서열에 상응하는 센스 서열(서열번호 48의 뉴클레오타이드 4번 내지 283번), 150개 뉴클레오타이드 루프-암호화 서열(서열번호 48의 뉴클레오타이드 284번 내지 433번) 및 CPB COPI 코트머 표적 서열의 역 상보체인 안티-센스 서열(서열번호 48의 뉴클레오타이드 434번 내지 713번)을 함유하는 dsRNA 암호화 요소를 디자인하였다.
GGGTACCTGT GGCTCTCACA GGCAGCGAAG ATGGTACCGT TAGAGTTTGG CATACGAATA 60
CACACAGATT AGAGAATTGT TTGAATTATG GGTTCGAGAG AGTGTGGACC ATTTGTTGCT 120
TGAAGGGTTC GAATAATGTT TCTCTGGGGT ATGACGAGGG CAGTATATTA GTGAAAGTTG 180
GAAGAGAAGA ACCGGCAGTT AGTATGGATG CCAGTGGCGG TAAAATAATT TGGGCAAGGC 240
ACTCGGAATT ACAACAAGCT AATTTGAAGG CGCTGCCAGA AGGAAGTACT GCGATCGCGT 300
TAACGCTTTA TCACGATACC TTCTACCACA TATCACTAAC AACATCAACA CTCATCACTC 360
TCGACGACAT CCACTCGATC ACTACTCTCA CACGACCGAT TAACTCCTCA TCCACGCGGC 420
CGCCTGCAGG AGCCCTTCTG GCAGCGCCTT CAAATTAGCT TGTTGTAATT CCGAGTGCCT 480
TGCCCAAATT ATTTTACCGC CACTGGCATC CATACTAACT GCCGGTTCTT CTCTTCCAAC 540
TTTCACTAAT ATACTGCCCT CGTCATACCC CAGAGAAACA TTATTCGAAC CCTTCAAGCA 600
ACAAATGGTC CACACTCTCT CGAACCCATA ATTCAAACAA TTCTCTAATC TGTGTGTATT 660
CGTATGCCAA ACTCTAACGG TACCATCTTC GCTGCCTGTG AGAGCCACAG GTA 713 (서열번호 48)
콜로라드 감자 딱정벌레(CPB)의 COPI β(Coatomer subunit beta)로부터 유래된 397량체 헤어핀을 암호화하는 DNA 서열(서열번호 57)은 T7 프로모터의 다운스트림과 rrn BT2+PET+PTH+PET 종결인자의 업스트림이 있는 pUC19에 삽입하여 이를 pCPB라 하였다(도 5). 이를 DH5α 균주에 도입하여 증폭하였다.
동일한 발현 플라스미드에 클로닝되는 상이한 종결인자는 표 7과 같다.
서열번호 | 종결인자 | 서열 |
49 | PET | 5'-CTAGCATAAC CCCTTGGGGC CTCTAAACGG GTCTTGAGGG GTTTTTTG-3' |
50 | PTH1 | 5'-CATCTGTTTT-3' |
51 | PTH2 | 5'-CTCATGCTTG CCATCTGTTT TCTTGCAAGT CAGATGGGA-3' |
51 | rrnBT1 | 5'-GGCATCAAAT AAAACGAAAG GCTCAGTCGA AAGACTGGGC CTTTCGTTTT ATCTGTTGTT-3' |
52 | rrnBT2 | 5'-TTAAGCAGAA GGCCATCCTG ACGGATGGCC TTTTTGCGTT TCTAC-3' |
53 | CJ | 5'-CTGTGTCCCT ATCTGTTACA GTCTCCTAAA GTAT -3' |
54 | B1002 | 5'-CCCCGCTTCG GCGGGGTTTT TT-3' |
55 | B1002 | 5'-CCCCGCCCCT GACAGGGCGG GGTTTTTTTT T-3' |
56 | PTH+PET | 5'-CATCTGTTTT CTTGCAAGAT CAGCTGAGCA ATAACTAGCA TAACCCCTTG GGGCCTCTAA ACGGGTCTTG AGGGGTTTTT TGCTGAAAGG AGGAACTATA TCCGGA-3' |
본 실시례의 rrnBT2+PET+PTH+PET 종결인자 구조체는 서열번호 57과 같다.
AAGCTTGCTT AAGCAGAAGG CCATCCTGAC GGATGGCCTT TTTGCGTTTC TACCTAGCAT 60
AACCCCTTGG GGCCTCTAAA CGGGTCTTGA GGGGTTTTTT GGCCATCTGT TTTCTTGCAA 120
GATCAGCTGA GCAATAACTA GCATAACCCC TTGGGGCCTC TAAACGGGTC TTGAGGGGTT 180
TTTTGCTGAA AGGAGGAACT ATATCCGGA 209 (서열번호 57)
콜로라드 감자 딱정벌레(CPB)의 COPI β(Coatomer subunit beta)로부터 유래된 397량체 헤어핀을 암호화하는 DNA 서열을 포함하는 CPB dsRNA 서열은 서열번호 58과 같다
GATGATGTCG GACTTTCCTA ATTTGTCTTC GATGATTTGA TTGCTAGTGA TTGGCACCCT 60
TTGGCCGTTC ACCTTGGCGA AACCTCTCTT ATAAATCAGT TCTCTGACAG ATTTCAAGTT 120
AGGGTATCCC CAAGTGATGT AAGGTTCGCA TATTCTGAGC ATGTTGATGG TAGCTTTGTT 180
GAGCTTGACA AAGACACCAT TGTTGATTTG AAGGAGCCGG AACAATTGGA GAACCTTGCG 240
TACTTTAGGA GCTACTTTGT TGATACCCTT TATACGAATT ACGAATGCCA ACTTGGCTTC 300
AGCGGGAACG TAAAAGTTTC CTCTGGTTTT AGCTTGTCGG ATCAACCTAA CTTCATCTCT 360
TTCTTTGAGC CGGTATTCTT TAACATACTG TTCGGCCAAG TACTGCGATC GCGTTAACGC 420
TTTATCACGA TACCTTCTAC CACATATCAC TAACAACATC AACACTCATC ATCTAGACTC 480
TCGACGACAT CCACTCGATC ACTACTCTCA CACGACCGAT TAACTCCTCA TCCACGCGGC 540
CGCGAGCGGC CGAACAGTAT GTTAAAGAAT ACCGGCTCAA AGAAAGAGAT GAAGTTAGGT 600
TGATCCGACA AGCTAAAACC AGAGGAAACT TTTACGTTCC CGCTGAAGCC AAGTTGGCAT 660
TCGTAATTCG TATAAAGGGT ATCAACAAAG TAGCTCCTAA AGTACGCAAG GTTCTCCAAT 720
TGTTCCGGCT CCTTCAAATC AACAATGGTG TCTTTGTCAA GCTCAACAAA GCTACCATCA 780
ACATGCTCAG AATATGCGAA CCTTACATCA CTTGGGGATA CCCTAACTTG AAATCTGTCA 840
GAGAACTGAT TTATAAGAGA GGTTTCGCCA AGGTGAACGG CCAAAGGGTG CCAATCACTA 900
GCAATCAAAT CATCGAAGAC AAATTAGGAA AGTCCGACAT CATC 944 (서열번호 58)
DV49 dsRNA
본 실시례에서 옥수수 근벌레(디아브로티카 비르기페라(Diabrotica virgifera) 유전자에 대한 안티-센스 DV49+루프+센스 DV49+PTH+PETD V49 dsRNA를 설계하여 T7 프로모터를 갖는 pUC19에 삽입하였으며 이를 pDV49라고 하였다(도 5). 이를 DH5α 균주에 도입하여 증폭하였다.
DV49 dsRNA의 뉴클레오타이드 서열은 서열번호 59이다.
TAATACGACT CACTATAGGG ATCCATGATA TCGTGAACAT CATCTACATT CAAATTCTTA 60
TGAGCTTTCT TAAGGGCATC TGCAGCATTT TTCATAGAAT CTAATACAGC AGTATTTGTG 120
CTAGCTCCTT CGAGGGCTTC CCTCTGCATT TCAATAGTTG TAAGGGTTCC ATCTATTTGT 180
AGTTGGGTCT TTTCCAATCG TTTCTTCTTT TTGAGGGCTT GGAGTGCAAC TCTTTTATTT 240
TTCGACGCAT TTTTCTTTGC AAGTACTGCG ATCGCGTTAA CGCTTTATCA CGATACCTTC 300
TACCACATAT CACTAACAAC ATCAACACTC ATCACTCTCG ACGACATCCA CTCGATCACT 360
ACTCTCACAC GACCGATTAA CTCCTCATCC ACGCGGCCGC CTGCAGGAGC GCAAAGAAAA 420
ATGCGTCGAA AAATAAAAGA GTTGCACTCC AAGCCCTCAA AAAGAAGAAA CGATTGGAAA 480
AGACCCAACT ACAAATAGAT GGAACCCTTA CAACTATTGA AATGCAGAGG GAAGCCCTCG 540
AAGGAGCTAG CACAAATACT GCTGTATTAG ATTCTATGAA AAATGCTGCA GATGCCCTTA 600
AGAAAGCTCA TAAGAATTTG AATGTAGATG ATGTTCACGA TATCATGGAT AAGCTTGCCA 660
TCTGTTTTCT TGCAAGATCA GCTGAGCAAT AACTAGCATA ACCCCTTGGG GCCTCTAAAC 720
GGGTCTTGAG GGGTTTTTTG CTGAAAGGAG GAACTATATC CGGA 764 (서열번호 59)
뉴클레오타이드 1번 내지 17번은 T7 프로모터를 암호화하고; 뉴클레오타이드 21번 내지 260번은 옥수수 근벌레(디아브로티카 비르기페라(Diabrotica virgifera)) 유전자의 표적 뉴클레오타이드 서열에 실질적으로 상보적인 안티-센스 서열을 암호화하고; 뉴클레오타이드 261번 내지 410번은 루프 형성 영역을 암호화하고; 뉴클레오타이드 411번 내지 650번은 옥수수 근벌레 (디아브로티카 비르기페라) 유전자의 표적 뉴클레오타이드 서열에 실질적으로 동일한 센스 서열을 암호화하고; 뉴클레오타이드 659번 내지 668번은 PTH-종결인자를 암호화하고; 뉴클레오타이드 681번 내지 764번은 PET-T7 종결인자를 암호화한다.
일반적으로 dsRNA 발현단위의 제작은 표적 유전자내 dsRNA 목적 부위의 염기서열 또는 표적 유전자에 대해 인위적으로 설계된 dsRNA 염기서열의 5'말단과 3'말단에 T7 프로모터 서열을 위치하도록 클로닝하여 제작할 수도 있다(도 5).
본 발명은 단일 또는 이종의 siRNA들을 병렬로 연결된 long dsRNA를 합성한 후, 효소 다이서를 이용하여 구성성분 siRNA를 제조하여 수확하는 방법도 제공할 수 있다.
2.3. RNA 압타머를 인코딩하는 관심 RNA 절편
본 발명의 관심 RNA 발현단위는 관심 RNA 압타머 단위로 상기 RNA 중합효소가 결합하여 기능을 수행하는 프로모터와 관심 RNA 절편(관심 RNA 압타머를 인코딩하는 DNA)을 포함할 수 있다. RNA 중합효소는 DdRp와 RdRp에서 선택되는 각각 또는 이들 모두를 사용할 수 있다.
바람직하게, 관심 RNA 발현단위는 <DdRp에 의해 작동하는 프로모터- RNA 압타머를 인코딩하는 관심 RNA-전사 종결서열>로 아래와 같이 제조하였다. 여기서 관심 RNA는 관심 RNA 압타머를 인코딩하는 DNA 절편이다.
2.4. 리보자임을 인코딩하는 관심 RNA 절편
본 발명의 관심 RNA 발현단위는 관심 리보자임 단위로 상기 RNA 중합효소가 결합하여 기능을 수행하는 프로모터와 관심 RNA 절편(관심 리보자임을 코딩하는 DNA)을 포함할 수 있다. RNA 중합효소는 DdRp와 RdRp에서 선택되는 각각 또는 이들 모두를 사용할 수 있다.
바람직하게, 관심 RNA 발현단위는 <DdRp에 의해 작동하는 프로모터- 리보자임을 인코딩하는 관심 RNA-전사 종결서열>로 아래와 같이 제조하였다. 여기서 관심 RNA는 관심 리보자임을 인코딩하는 DNA 절편이다.
2.5. RdRp에 의해 자가 증폭되는 관심 RNA
본 발명에서 표적세포에 RdRp mRNA와 함께 주입되어 자가 증폭이 가능한 RNA 경우, 관심 RNA 발현단위를 인코딩하는 주형 DNA 절편은 <T7 promoter - 5' 복제인식서열 DNA - SGP DNA - POI orf- 3' 복제인식서열 DNA - AES/mtRNR1-A30LA70> 순서이며 이를 'T7RdRp관심 RNA'이라고 하였다. 상기 관심 RNA 발현단위의 산물은 자가-증폭이 가능한 형태로 합성된 RNA가 세포에 형질주입된 후에도 RdRp에 의해 증폭이 가능하다.
본 실시례의 RdRp관심 RNA 발현단위를 인코딩하는 DNA 절편은 SFV RdRp에 의해 복제될 수 있으며 관심 단백질 mRNA를 포함하였다.
상기 5' 복제인식서열(CSE 1&2 DNA)는 ThermoFisher 사(미국)에서 구입한 Semliki Forest 바이러스 레플리콘 플라스미드(pSFV1, Invitrogen #18448-019)에서 상응하는 염기서열을 증폭하여 제조하거나 유기 합성하였으며, SGP(CSE3 DNA) 및 3' 복제인식서열 (CSE 4 DNA)는 유기 합성하였다.
이름 | 염기서열 | 길이(nt) |
5'복제인식서열 (CSE 1&2) |
ATGGCGGATG TGTGACATAC ACGACGCCAA AAGATTTTGT TCCAGCTCCT GCCACCTCCG CTACGCGAGA GATTAACCAC CCACGATGGC CGCCAAAGTG CATGTTGATA TTGAGGCTGA CAGCCCATTC ATCAAGTCTT TGCAGAAGGC ATTTCCGTCG TTCGAGGTGG AGTCATTGCA GGTCACACCA AATGACCATG CAAATGCCAG AGCATTTTCG CACCTGGCTA CCAAATTGA (서열번호 60) | 239 |
GATGGCGGAT GTGTGACATA CAAGACGCCA AAAGATTTTG TTCCAGCTCC TGCCACCTCC GCTACGCGAG AGATTAACCA CCCACGACGG CCGCCAAAGT GCTTGTTGAT ATTGAGGCTG ACAGCCCATT CATCAAGTCT TAGCAGAAGG CATTTCCGTC GTTCGAGGTG GAGTCATTGG AGGTGACACC AAATCACCAT CCAAATCCCA GAGCATTTTC GCACCTGGGT ACCAAATTGA TCGAGCAGGA GACTGACAAA GACACACTCA TCTTGGATAT C (서열번호 61) | 281 | |
3'복제인식서열 (CSE 4) |
ATTTTGTTTT TAATATTTC (서열번호 62) | 19 |
SGP(CSE 3) | ACCTCTACGG CGGTCCTAAA TAGG (서열번호 63) | 23 |
자가증폭 관심 RNA 발현단위를 포함하는 PCR 산물은 각각 HindIII, EcoRI 및 BamHI 효소를 사용하여 절단한 다음, HindIII/BamHI 효소로 선형화된 pUC19 벡터와 T4 DNA ligase를 이용하여 클로닝하였으며, 이를 'pUC19 T7RdRp관심 RNA'라고 하였다.
실시례 3. 관심 RNA 전사시스템
본 실시례는 무세포유래 세포, 원핵생물에서 사용하는 관심 RNA 전사시스템이며 이는 RNA 중합효소 발현단위와 관심 RNA 발현단위로 구성되며, 하기에 관심 RNA가 mRNA인 경우로 설명하였으며, 이는 mRNA에만 제한된 것이 아니며, 그 개념을 dsRNA, RNA 압타머 및 리보자임에 적용할 수 있다.
3.1. ctDdRp를 포함하는 관심 RNA 전사시스템
본 실시례에서는 플라스미드를 사용하여 ctDdRp를 제공하는 RNA 중합효소 발현단위와 관심 RNA 발현단위를 포함하는 DNA 절편을 설계하여 ctDdRp를 포함하는 관심 RNA 전사시스템을 제조하였다.
본 실시례의 ctDdRp를 포함하는 관심 RNA 전사시스템은 실시례 2 및 3항을 참조하여 무세포유래 세포에서 따라 선정할 수 있으며 바이오매스 대장균에 적합하도록, (i) RNA 중합효소 발현단위는 <T7 promoter - 5'UTR - ctDdRp01 - 전사 종결서열>을 포함하는 ctDdRp01 DNA 절편, 및 (ii) 관심 RNA 발현단위로 <T7 promoter - 5'UTR - 관심 RNA- (Tethering domain)4 - AES/mtRNR1-A30LA70>을 포함하는 t관심 RNA 절편을 제조하여 플라스미드에 클로닝하여 제조하였다. 여기서 관심 RNA는 관심 RNA를 인코딩하는 DNA 절편이다.
상기 제조된 ctDdRp 발현단위를 정방향 프라이머 서열번호 64과 역방향 프라이머 서열번호 65을 사용하여 증폭하였다.
정방향 프라이머:
5'- AAGCTT TTTACACTTTATGCTTCCGGCTCGTATGTTG-3' (서열번호 64)
역방향 프라이머:
5'- GAATTC CTAAAAGGCAAAATGCCAGCCCGATCGGCTGGCATTTTTATCTCA-3' (서열번호 65)
상기 제조한 관심 RNA 발현단위는 정방향 프라이머 서열번호 66과 역방향 프라이머 67를 사용하여 증폭하였다.
정방향 프라이머:
5'- GAATTC TAATACGACT CACTATAGGG-3' (서열번호 66)
역방향 프라이머:
5'- GGATCC AAAAAAAAAAAAAAAAAAAAAAA-3' (서열번호 67)
증폭된 ctDdRp 발현단위와 관심 RNA 발현단위를 포함하는 PCR 산물은 각각 HindIII, EcoRI 및 BamHI 효소를 사용하여 절단한 다음, HindIII/BamHI 효소로 선형화된 pUC19 벡터와 T4 DNA ligase를 이용하여 클로닝하였으며, 이를 'pUC19 ctDdRp01+관심 RNA'라고 하였다.
본 실시례에서 DH5α 균주에서 플라스미드를 분리하여 HindIII/BamHI 제한효소를 처리한 후 전기영동을 하였다(도 6).
이 과정을 dsRNA, RNA 압타머 및 리보자임에 적용하였다.
3.2. RdRp를 포함하는 관심 RNA 전사시스템
본 발명에서 사용되는 RdRp를 이용한 mRNA 전사시스템은 (i) RdRp 발현단위를 인코딩하는 DNA 절편 및 관심 (ii) mRNA 발현단위를 인코딩하는 DNA 절편을 플라스미드 pUC19에 삽입하여 완성된 구조체를 DH5α 균주에 형질전환하여 제조하였다.
먼저, (i) RdRp 발현단위를 인코딩하는 DNA 절편은 <T7 promoter - 5'UTR - RdRp ORF DNA - 전사종결서열> 순서이고, (ii) 관심 RNA 발현단위를 인코딩하는 DNA 절편은 <T7 promoter - 5' 복제인식서열 DNA - SGP DNA - POI orf- 3' 복제인식서열 DNA - AES/mtRNR1-A30LA70> 순서이며 이를 'T7RdRp관심 RNA'이라고 하였다. 상기 관심 RNA 발현단위의 산물은 자가-증폭이 가능한 형태로 합성된 RNA가 세포에 형질주입된 후에도 RdRp에 의해 증폭이 가능하다.
상기 제조된 RdRp 발현단위를 정방향 프라이머 서열번호 64과 역방향 프라이머 서열번호 65를 사용하여 증폭하였다. 상기 제조된 LacRdRp관심 RNA 발현단위를 정방향 프라이머 서열번호 66과 역방향 프라이머 서열번호 67을 사용하여 증폭하였다.
본 실시례의 RdRp관심 RNA 발현단위를 인코딩하는 DNA 절편은 SFV RdRp에 의해 복제될 수 있으며 관심 단백질 mRNA를 포함하였다.
상기 5' 복제인식서열(CSE 1&2 DNA)는 ThermoFisher 사(미국)에서 구입한 Semliki Forest 바이러스 레플리콘 플라스미드(pSFV1, Invitrogen #18448-019)에서 상응하는 염기서열을 증폭하여 제조하거나 유기 합성하였으며, SGP(CSE3 DNA) 및 3' 복제인식서열 (CSE 4 DNA)는 유기 합성하였다.
증폭된 RdRp 발현단위와 관심 RNA 발현단위를 포함하는 PCR 산물은 각각 HindIII, EcoRI 및 BamHI 효소를 사용하여 절단한 다음, HindIII/BamHI 효소로 선형화된 pUC19 벡터와 T4 DNA ligase를 이용하여 클로닝하였으며, 이를 'pUC19 RdRp + T7RdRp관심 RNA'이라고 하였다.
본 실시례에서 DH5α 균주에 형질주입하고 선정된 균주에서 플라스미드를 분리하여 HindIII/BamHI 제한효소를 처리한 후 전기영동을 하였다(도 7).
이 과정을 dsRNA, RNA 압타머 및 리보자임에 적용하였다.
3.3. DdRp와 RdRp를 모두 포함하는 관심 RNA 전사시스템
본 실시례의 DdRp와 RdRp를 모두 포함하는 관심 RNA 전사시스템은 (i) DdRp와 RdRp를 제공하는 RNA 중합효소 발현단위와 (ii) 관심 RNA 발현단위를 포함하는 DNA 절편을 설계하여 플라스미드에 클리닝하였다. DdRp와 RdRp를 모두 포함하는 관심 RNA 전사시스템은 DdRp DNA 절편, RdRp DNA 절편과 관심 RNA 절편으로 구성하였다.
상기 발현단위는 DNA 및 RNA를 포함하는 핵산에서 선택되어진 어느 하나 이상을 의미한다. 상기 RNA 발현단위는 상기 DNA 발현단위를 체외전사하여 준비할 수 있다.
본 실시례에서 DdRp와 RdRp를 모두 포함하는 관심 RNA 전사시스템의 RNA 중합효소 단위의 제조는 먼저, 실시례 2항에서 제조한 (i) 무세포유래 세포에서 작동하는 프로모터가 있는 DdRp DNA 절편으로 <Promoter - 5'UTR - DdRp orf - 전사 종결서열>을 포함하는 DdRp 발현단위(여기서, X1=IS)이거나 T7Pol을 보유한 무세포유래 세포 경우는 본 발현단위는 필요가 없으며, (ii) 상기 DdRp에 의해 작동하는 프로모터가 있는 RdRp DNA 절편으로 <Promoter - 5'UTR - RdRp ORF DNA - 전사종결서열> 순서로 제작한 RdRp DNA 절편을 pUC 19 벡터(Promega 사, 미국)를 사용하여 제조하였다. 여기서 DdRp 대신에 ctDdRp01을 사용할 수도 있다.
본 실시례에서 관심 RNA 전사시스템의 관심 RNA 발현단위를 인코딩하는 관심 RNA 단위의 제조는 실시례 3항에서 제조한 T7RdRp관심 RNA 절편으로 <T7 promoter - 5' 복제인식서열 DNA - SGP DNA - 관심 RNA- 3' 복제인식서열 DNA - AES/mtRNR1-A30LA70>를 순서대로 하였다. 본 발명의 RdRp에 적합한 관심 RNA 절편은 SFV RdRp에 의해 복제될 수 있으며 관심 단백질 mRNA를 포함하였다.
상기 제조된 DdRp 발현단위를 정방향 프라이머 서열번호 64과 역방향 프라이머 서열번호 65를 사용하여 증폭하였다. 상기 제조된 RdRp 발현단위를 정방향 프라이머 서열번호 66과 역방향 프라이머 서열번호 67를 사용하여 증폭하였다. 서열번호 68는 서열번호 64의 제한효소 절단서열을 EcoRI에서 PstI으로 대체한 서열번호이다. 상기 T7RdRp관심 RNA 절편은 정방향 프라이머 서열번호 66과 역방향 프라이머 서열번호 67를 사용하여 증폭하였다. 서열번호 68은 서열번호 64의 제한효소 절단서열을 EcoRI에서 PstI으로 대체한 서열번호이다.
증폭된 DdRp 발현단위, RdRp DNA 절편과 T7RdRp관심 RNA 절편을 포함하는 PCR 산물은 각각 HindIII, PstI, EcoRI 및 BamHI 효소를 사용하여 절단한 다음, HindIII/BamHI 효소로 선형화된 pUC19 벡터와 T4 DNA ligase를 이용하여 클로닝 반응을 하였으며 이를 'pUC19 DdRp+RdRp+T7RdRp관심 RNA'라고 하였다.
본 실시례에서 DH5α 균주에서 플라스미드를 분리하여 HindIII/BamHI 제한효소를 처리한 후 전기영동을 하였다(도 8).
이 과정을 dsRNA, RNA 압타머 및 리보자임에 적용하였다.
본 발명에서 무세포 RNA 합성을 위한 무세포 RNA 합성 조성물을 제공하기 위한 관심 RNA 전사시스템은 DdRp 발현단위와 관심 RNA 발현단위을 pUC19에 제조하였으며 DH5α 균주에서 도입하여 증폭한 대량 생산하여 무세포 RNA 합성을 위한 조성물로 제공하였다.
실시례 4. 설계 증폭발현 시스템
본 발명의 DdRp 및/또는 DdRp mRNA를 포함 및/또는 첨가하는 최소한 전사와 번역을 하는 무세포 시스템에서 작동하는 관심 RNA 전사시스템을 구성하는 RNA 중합효소 발현단위인 autogene을 이용한 RNA 및/또는 유용물질 생산을 위한 발현 시스템은 (i) 관심 mRNA(mRNAi)를 발현하는 단위(관심 RNA)를 포함하는 관심 RNA 발현단위(Expression Unit, EU), (ii) autogene을 자가증폭하며 상응하는 프로모터의 하류지역에 있는 유전자를 무한 증폭하도록 하는 상호작용하는 구성단위를 포함하는 Autogene System, (iii) 관심 RNA 발현단위의 최종산물의 생산에 필요한 반응원재료 관련 유전자 세트를 포함하는 설계 발현단위;를 포함하는 설계 증폭발현(DAE, Designed Amplifying Expression) 시스템을 제공한다.
상기 설계 증폭발현(DAE, Designed Amplifying Expression) 시스템은 최소한 전사와 번역을 하는 무세포 시스템에서 작동할 수 있는 구성을 해야 한다. 상기 발현단위는 DNA 및 RNA를 포함하는 핵산에서 선택되어진 어느 하나 이상을 의미한다. 상기 RNA 발현단위는 상기 DNA 발현단위를 체외전사하여 준비할 수 있다.
본 발명의 DAE 시스템은 원형 또는 직선형 DNA이거나 또는 상응하는 mRNA일 수도 있다. 보편적으로 직선형 DNA는 PCR 산물이거나 플라스미드를 제한효소를 이용하여 제조할 수도 있다. 본 발명의 DAE 시스템은 최소한 전사와 번역이 가능한 무세포 시스템(합성 시스템)에 각각의 구성성분을 일정한 비율로 첨가하여 준비할 수 있다.
본 발명은 관심 RNA 전사시스템을 구성하는 RNA 중합효소 발현단위을 이용한 autogene 시스템은 (i) RNA 합성을 위해서 (Endo DdRp+Capping enzyme 발현단위) 유형, (Endo DdRp+saDdRp 발현단위+Capping enzyme 발현단위) 유형, (Endo DdRp+sactDdRp 발현단위) 유형 및 (Endo DdRp+saDdRp 발현단위+RdRp 발현단위) 유형을 포함하는 Autogene 시스템이며, (ii) 단백질 또는 바이오베터 생산을 위해서 대장균 유래 합성 시스템에서는 (Endo DdRp+saDdRp 발현단위) 유형, 진핵세포 또는 하이브리드 유래 합성 시스템에서는 <DdRp (or mRNA)+saDdRp 발현단위+Capping enzyme 발현단위> 유형, <DdRp (or mRNA)+sactDdRp 발현단위> 유형, <DdRp (or mRNA)+sactDdRp 발현단위+RdRp 발현단위> 유형을 포함하는 Autogene 시스템일 수도 있다. 상기 발현단위는 그 발현산물을 포함하는 의미이다.
예시적으로 RNA 합성을 위한 (Endo DdRp+Capping enzyme 발현단위) 유형은 숙주세포에 내재된 DdRp에 의해서 상기 DdRp와 상호 작용하는 프로모터의 하류지역에 있는 캡핑효소(Capping enzyme 발현단위)와 관심 유전자를 포함하는 관심 RNA 발현단위가 무한 증폭을 하며 그 산물은 캡핑 발현단위에서 합성된 캡핑효소에 의해 캡구조가 있는 관심 mRNA를 대량으로 생산할 수 있다. 관심 mRNA는 진핵세포 mRNA으로 합성 시스템 유래의 대장균에서 번역을 할 수 없어 단백질 제조는 할 수 없다. 만일 관심 mRNA가 원핵세포 mRNA이라면 합성 시스템 유래의 대장균에서 번역을 할 수 있어 단백질 제조는 할 수도 있다. 일반적으로 DdRp는 Autogene으로 자체적으로 형질전환 세포를 제조하기가 어려워 하이브리드 프로모터에 의해 유도될 수 있도록 제조된 세포주는 대장균 BL21(DE3), BL21 Star (DE3) 및 HT115(DE3) 균주 등을 사용할 수 있다.
다른 예시로 이런 유도의 문제를 해결하기 위해 Autogene을 직접 형질도입하는 경우로 (Endo DdRp+saDdRp 발현단위+Capping enzyme 발현단위) 유형은 숙주세포에 내재된 DdRp에 의해 상기 DdRp와 상호 작용하는 프로모터의 하류지역에 있는 DdRp, 캡핑효소와 관심 유전자들이 무한 증폭을 하며 상기 saDdRp 발현단위(자가 증폭하는 DdRp)의 발현산물인 DdRp에 의해 관심 유전자를 포함하는 관심 RNA 발현단위를 주형으로 전사된 관심 mRNA를 상기 캡핑 발현단위에서 합성된 캡핑효소에 의해 캡구조가 있는 관심 mRNA를 대량으로 생산할 수 있다.
또 다른 예시로, 진핵세포 또는 하이브리드 유래 합성 시스템에서는 <DdRp (or mRNA)+saDdRp 발현단위+Capping enzyme 발현단위> 유형은 합성 시스템에 첨가된 DdRp (or mRNA)에 의해 상기 DdRp와 상호 작용하는 프로모터의 하류지역에 있는 DdRp, 캡핑효소와 관심 유전자를 포함하는 관심 RNA 발현단위가 무한 증폭을 하며 상기 saDdRp 발현단위(자가 증폭하는 DdRp)의 발현산물인 DdRp에 의해 관심 RNA 발현단위를 주형으로 전사된 관심 mRNA를 상기 캡핑효소 발현단위에서 합성된 캡핑효소에 의해 캡구조가 있는 관심 mRNA를 대량으로 생산할 수 있으며 합성 시스템에 있는 번역 시스템으로 단백질을 합성하여 공급할 수도 있다.
상기 내인성 및/또는 외인성 전사 및 번역에 필요한 요소들 및 생물학적 활성을 공급해야 하기 위해 이들의 대사유전자를 autogene systm으로 무한증폭하도록 하는 설계 발현단위를 구성해야 할 수 있다. 유용물질이 RNA인 경우는 세포 RNA로부터 NTP의 합성대사경로 유전자들을 포함하는 설계 발현단위를 이용하여 5' 뉴클레오사이드 모노포스페이트(NMP)를 수집하기 위해 외인성 RNase R을 이용한 용해물 RNA의 분해, 내인성 RNase R을 이용한 용해물 RNA의 분해 및 뉴클레아제 P1 또는 이들의 발현단위를 이용한 세포 RNA 분해산물을 한외여과하여 분해산물을 수집한다. 상기 세포 유래 NMP 혼합물을 기질로 하여 NTP 혼합물을 제조하는 5 종류의 키나제 발현단위는 대장균으로부터의 (i) CMP 키나제(Cmk), (ii) UMP 키나제(PyrH), (iii) GMP 키나제(Gmk), (iv) NDP 키나제(Ndk) 및 (v) 폴리포스페이트 키나제(PPK2) 이다. 또한 유용물질이 단백질인 경우 다양한 유전자들을 포함하는 설계 발현단위를 공급할 수도 있다.
4.1. RNA 중합효소, 캡핑효소 및 관심 RNA 발현단위
무세포 RNA 합성(CFR)을 위한 조성물 중에서 RNA 중합효소, 캡핑효소 관심 RNA 발현단위는 DNA 또는 RNA이며, 보편적으로 사용하는 전사의 주형인 DNA으로 원형이나 선형으로 모두를 사용할 수 있다. 바람직하게 본 실시례에서는 직선형 DNA로 RNA 중합효소, 캡핑효소 관심 RNA 발현단위를 제조하였다.
실시레 1. 2 및 3항에서 제조된 RNA 중합효소 발현단위를 인코딩하는 DNA, 캡핑효소 발현단위를 인코딩하는 DNA와 관심 RNA 발현단위를 인코딩하는 DNA를 포함하는 플라스미드를 각각 준비된 대장균에 형질전환하고 고-세포 밀도로 배양한 후, 플라스미드를 분리, 정제하여 각각에 해당하는 RNA 중합효소 발현단위, 캡핑효소 발현단위 및 관심 RNA 발현단위를 준비하였다.
상기 RNA 중합효소 발현단위은 <실시레 1. 2 및 3항>에서 다양한 형태를 제시하였으며, 본 실시례에서 제조한 상기 RNA 중합효소 발현단위는 실시례 2항에서 제조한 T7 Polymerase 발현단위를 인코딩하는 DNA를 포함하는 플라스미드인 'pUC19 DdRp'를 기반으로 표준 PCR 방법으로 바이오틴이 부착된 프라이머를 이용하여 선형 DNA를 제조하였다.
상기 캡핑효소 발현단위를 실시례 1항에서 제조한 캡핑효소 발현단위를 인코딩하는 DNA를 포함하는 플라스미드인 'pUC19 캡핑효소'를 기반으로 표준 PCR 방법으로 바이오틴이 부착된 프라이머를 이용하여 선형 DNA를 제조하였다.
상기 관심 RNA 발현단위는 관심 RNA을 인코딩하는 DNA를 포함하는 플라스미드를 주형으로, 관심 RNA는 반딧불 루시퍼라제, EPO, GM-CSF와 RSV-F mRNA 그리고 CPB dsRNA와 DV49 dsRNA 등에 대해 제작하였다.
상기 발현단위는 DNA 및 RNA를 포함하는 핵산에서 선택되어진 어느 하나 이상을 의미한다. 상기 RNA 발현단위는 상기 DNA 발현단위를 체외전사하여 준비할 수 있다.
4.2. 설계 발현단위
본 발명에서 세포 RNA로부터 NTP 합성대사경로 유전자에 대한 설계 발현단위는 발현벡터 pET(Novagen 사, 미국)에 클리닝하였다. 상기 발현단위는 DNA 및 RNA를 포함하는 핵산에서 선택되어진 어느 하나 이상을 의미한다. 상기 RNA유형의 발현단위는 상기 DNA 유형의 발현단위를 체외전사하여 준비할 수 있다.
상기 발현 벡터 pET는 pBR322 유래 ColE1 레플리콘, lac I 유전자, 암피실린 내성 유전자 및 다중 클로닝 부위를 포함한다. 다중 클리닝 부위는 T7lac 프로모터와 리보솜 결합 서열이 하류에 있다. 본 발명의 발현단위를 상기 다중 클리닝 부위의 T7lac 프로모터를 lac 오퍼레이터 서열이 제외된 consensus 10(T7) promoter (T7pCONS)만으로 대체하였다. T7pCONS에 대해 살펴보면, 뉴클레오타이드 서열은 T7 파지의 공통 10 프로모터에서 유래되며, 23개의 뉴클레오타이드 길이로 메신저 RNA(mRNA) 시작 부위에 대해 -17에서 +6 영역(TAATACGACTCACTATAGGGAGA)이다. lac 오퍼레이터 서열이 T7 lac에 처음 도입 되었을 때 4개의 뉴클레오티드(GAGA)가 제거되었기 때문에 pET28a는 -17에서 +2 영역(TAATACGACTCACTATAGG)만 포함한다. lac 오퍼레이터는 유도된 단백질 발현 수준에 거의 영향을 미치지 않는다. 상기 T7p CONS 서열의 변형은 생산적인 전사 개시를 감소시킨다. T7p CONS (TAATACGACTCACTATAGGGAGA)가 사용되었을 때 BL21( DE3 ) pLysS 에서 sfGFP의 생산 수율이 3배 증가했음을 주목하였다(COMMUNICATIONS BIOLOGY (2020) 3:214; https://doi.org/10.1038/s42003-020-0939-8)
본 발명의 세포 RNA에서 기원하는 NMP 혼합물에서 NTP 혼합물을 제조하는 세포 RNA로부터 NTP의 합성대사경로 유전자들로, 세포 RNA로부터 NMP를 분해하는 EcRNR 유전자, 서열번호 69과 Nuclease P1 유전자, 서열번호 71, 그리고 RNase 기능을 억제하는 단백질 RNase Inhibitor(RI)를 인코딩하는 RNH1 유전자이고 서열번호 73이다. 그리고 상기 제조한, NMP 혼합물을 기질로 하여 NTP 혼합물을 제조하는 5 종류의 키나제 ORF는 (a) 대장균으로부터의 (i) CMP 키나제(Cmk), 서열번호 75 및 76, (ii) UMP 키나제(PyrH), 서열번호 77 및 78, (iii) GMP 키나제(Gmk), 서열번호 79 및 80. 및 (iv) NDP 키나제(Ndk) 서열번호 81 및 82, 및 (b) (v) Caldilinea aerophila DSM 14535 P폴리포스페이트 키나제(PPK2) 서열번호 83이다. 추가적으로 Thermus thermophilus Adk 서열번호 84, Thermus thermophilus Cmk 서열번호 85, Pyrococcus furiosus PyrH 서열번호 86, Thermotoga maritima Gmk 서열번호 87, Aquifex aeolicus Ndk 서열번호 88이다.
> 대장균으로부터의 RNase R (K544R) (EcRNR)의 아미노산 서열
MSQDPFQERE AEKYANPIPS REFILEHLTK REKPASRDEL AVELHIEGEE QLEGLRRRLR AMERDGQLVF TRRQCYALPE RLDLVKGTVI GHRDGYGFLR VEGRKDDLYL SSEQMKTCIH GDQVLAQPLG ADRKGRREAR IVRVLVPKTS QIVGRYFTEA GVGFVVPDDS RLSFDILIPP DQIMGARMGF VVVVELTQRP TRRTKAVGKI VEVLGDNMGT GMAVDIALRT HEIPYIWPQA VEQQVAGLKE EVPEEAKAGR VDLRDLPLVT IDGEDARDFD DAVYCEKKRG GGWRLWVAIA DVSYYVRPST PLDREARNRG TSVYFPSQVI PMLPEVLSNG LCSLNPQVDR LCMVCEMTVS SKGRLTGYKF YEAVMSSHAR LTYTKVWHIL QGDQDLREQY APLVKHLEEL HNLYKVLDKA REERGGISFE SEEAKFIFNA ERRIERIEQT QRNDAHKLIE ECMILANISA ARFVEKAKEP ALFRIHDKPS TEAITSFRSV LAELGLELPG GNKPEPRDYA ELLESVADRP DAEMLQTMLL RSMKQAIYDP ENRGHFGLAL QSYAHFTSPI RRYPDLTLHR AIKYLLAKEQ GHQGNTTETG GYHYSMEEML QLGQHCSMAE RRADEATRDV ADWLKCDFML DQVGNVFKGV ISSVTGFGFF VRLDDLFIDG LVHVSSLDND YYRFDQVGQR LMGESSGQTY RLGDRVEVRV EAVNMDERKI DFSLISSERA PRNVGKTARE KAKKGDAGKK GGKRRQVGKK VNFEPDSAFR GEKKTKPKAA KKDARKAKKP SAKTQKIAAA TKAKRAAKKK VAE (서열번호 69)
> 대장균으로부터의 RNase R (K544R) (EcRNR)의 염기서열
ATGAGCCAGGATCCGTTTCAGGAACGCGAAGCGGAAAAATATGCGAACCCGATTCCGAGCCGCGAATTTATTCTGGAACATCTGACCAAACGCGAAAAACCGGCGAGCCGCGATGAACTGGCGGTGGAACTGCATATTGAAGGCGAAGAACAGCTGGAAGGCCTGCGCCGCCGCCTGCGCGCGATGGAACGCGATGGCCAGCTGGTGTTTACCCGCCGCCAGTGCTATGCGCTGCCGGAACGCCTGGATCTGGTGAAAGGCACCGTGATTGGCCATCGCGATGGCTATGGCTTTCTGCGCGTGGAAGGCCGCAAAGATGATCTGTATCTGAGCAGCGAACAGATGAAAACCTGCATTCATGGCGATCAGGTGCTGGCGCAGCCGCTGGGCGCGGATCGCAAAGGCCGCCGCGAAGCGCGCATTGTGCGCGTGCTGGTGCCGAAAACCAGCCAGATTGTGGGCCGCTATTTTACCGAAGCGGGCGTGGGCTTTGTGGTGCCGGATGATAGCCGCCTGAGCTTTGATATTCTGATTCCGCCGGATCAGATTATGGGCGCGCGCATGGGCTTTGTGGTGGTGGTGGAACTGACCCAGCGCCCGACCCGCCGCACCAAAGCGGTGGGCAAAATTGTGGAAGTGCTGGGCGATAACATGGGCACCGGCATGGCGGTGGATATTGCGCTGCGCACCCATGAAATTCCGTATATTTGGCCGCAGGCGGTGGAACAGCAGGTGGCGGGCCTGAAAGAAGAAGTGCCGGAAGAAGCGAAAGCGGGCCGCGTGGATCTGCGCGATCTGCCGCTGGTGACCATTGATGGCGAAGATGCGCGCGATTTTGATGATGCGGTGTATTGCGAAAAAAAACGCGGCGGCGGCTGGCGCCTGTGGGTGGCGATTGCGGATGTGAGCTATTATGTGCGCCCGAGCACCCCGCTGGATCGCGAAGCGCGCAACCGCGGCACCAGCGTGTATTTTCCGAGCCAGGTGATTCCGATGCTGCCGGAAGTGCTGAGCAACGGCCTGTGCAGCCTGAACCCGCAGGTGGATCGCCTGTGCATGGTGTGCGAAATGACCGTGAGCAGCAAAGGCCGCCTGACCGGCTATAAATTTTATGAAGCGGTGATGAGCAGCCATGCGCGCCTGACCTATACCAAAGTGTGGCATATTCTGCAGGGCGATCAGGATCTGCGCGAACAGTATGCGCCGCTGGTGAAACATCTGGAAGAACTGCATAACCTGTATAAAGTGCTGGATAAAGCGCGCGAAGAACGCGGCGGCATTAGCTTTGAAAGCGAAGAAGCGAAATTTATTTTTAACGCGGAACGCCGCATTGAACGCATTGAACAGACCCAGCGCAACGATGCGCATAAACTGATTGAAGAATGCATGATTCTGGCGAACATTAGCGCGGCGCGCTTTGTGGAAAAAGCGAAAGAACCGGCGCTGTTTCGCATTCATGATAAACCGAGCACCGAAGCGATTACCAGCTTTCGCAGCGTGCTGGCGGAACTGGGCCTGGAACTGCCGGGCGGCAACAAACCGGAACCGCGCGATTATGCGGAACTGCTGGAAAGCGTGGCGGATCGCCCGGATGCGGAAATGCTGCAGACCATGCTGCTGCGCAGCATGAAACAGGCGATTTATGATCCGGAAAACCGCGGCCATTTTGGCCTGGCGCTGCAGAGCTATGCGCATTTTACCAGCCCGATTCGCCGCTATCCGGATCTGACCCTGCATCGCGCGATTAAATATCTGCTGGCGAAAGAACAGGGCCATCAGGGCAACACCACCGAAACCGGCGGCTATCATTATAGCATGGAAGAAATGCTGCAGCTGGGCCAGCATTGCAGCATGGCGGAACGCCGCGCGGATGAAGCGACCCGCGATGTGGCGGATTGGCTGAAATGCGATTTTATGCTGGATCAGGTGGGCAACGTGTTTAAAGGCGTGATTAGCAGCGTGACCGGCTTTGGCTTTTTTGTGCGCCTGGATGATCTGTTTATTGATGGCCTGGTGCATGTGAGCAGCCTGGATAACGATTATTATCGCTTTGATCAGGTGGGCCAGCGCCTGATGGGCGAAAGCAGCGGCCAGACCTATCGCCTGGGCGATCGCGTGGAAGTGCGCGTGGAAGCGGTGAACATGGATGAACGCAAAATTGATTTTAGCCTGATTAGCAGCGAACGCGCGCCGCGCAACGTGGGCAAAACCGCGCGCGAAAAAGCGAAAAAAGGCGATGCGGGCAAAAAAGGCGGCAAACGCCGCCAGGTGGGCAAAAAAGTGAACTTTGAACCGGATAGCGCGTTTCGCGGCGAAAAAAAAACCAAACCGAAAGCGGCGAAAAAAGATGCGCGCAAAGCGAAAAAACCGAGCGCGAAAACCCAGAAAATTGCGGCGGCGACCAAAGCGAAACGCGCGGCGAAAAAAAAAGTGGCGGAA (서열번호 70)
> Penicillium citrinum으로부터의 Nuclease P1의 아미노산 서열
WGALGHATVA YVAQHYVSPE AASWAQGILG SSSSSYLASI ASWADEYRLT SAGKWSASLH FIDAEDNPPT NCNVDYERDC GSSGCSISAI ANYTQRVSDS SLSSENHAEA LRFLVHFIGD MTQPLHDEAY AVGGNKINVT FDGYHDNLHS DWDTYMPQKL IGGHALSDAE SWAKTLVQNI ESGNYTAQAI GWIKGDNISE PITTATRWAS DANALVCTVV MPHGAAALQT GDLYPTYYDS VIDTIELQIA KGGYRLANWI NEIHGSEIAK (서열번호 71)
> Penicillium citrinum으로부터의 Nuclease P1의 염기서열
TGGGGCGCGCTGGGCCATGCGACCGTGGCGTATGTGGCGCAGCATTATGTGAGCCCGGAAGCGGCGAGCTGGGCGCAGGGCATTCTGGGCAGCAGCAGCAGCAGCTATCTGGCGAGCATTGCGAGCTGGGCGGATGAATATCGCCTGACCAGCGCGGGCAAATGGAGCGCGAGCCTGCATTTTATTGATGCGGAAGATAACCCGCCGACCAACTGCAACGTGGATTATGAACGCGATTGCGGCAGCAGCGGCTGCAGCATTAGCGCGATTGCGAACTATACCCAGCGCGTGAGCGATAGCAGCCTGAGCAGCGAAAACCATGCGGAAGCGCTGCGCTTTCTGGTGCATTTTATTGGCGATATGACCCAGCCGCTGCATGATGAAGCGTATGCGGTGGGCGGCAACAAAATTAACGTGACCTTTGATGGCTATCATGATAACCTGCATAGCGATTGGGATACCTATATGCCGCAGAAACTGATTGGCGGCCATGCGCTGAGCGATGCGGAAAGCTGGGCGAAAACCCTGGTGCAGAACATTGAAAGCGGCAACTATACCGCGCAGGCGATTGGCTGGATTAAAGGCGATAACATTAGCGAACCGATTACCACCGCGACCCGCTGGGCGAGCGATGCGAACGCGCTGGTGTGCACCGTGGTGATGCCGCATGGCGCGGCGGCGCTGCAGACCGGCGATCTGTATCCGACCTATTATGATAGCGTGATTGATACCATTGAACTGCAGATTGCGAAAGGCGGCTATCGCCTGGCGAACTGGATTAACGAAATTCATGGCAGCGAAATTGCGAAA (서열번호 72)
> 인간 Ribonuclease Inhibitor (RNH1) (NM_203384)의 아미노산 서열
MSLDIQSLDIQCEELSDARWAELLPLLQQCQVVRLDDCGLTEARCKDISSALRVNPALAELNLRSNELGDVGVHCVLQGLQTPSCKIQKLSLQNCCLTGAGCGVLSSTLRTLPTLQELHLSDNLLGDAGLQLLCEGLLDPQCRLEKLQLEYCSLSAASCEPLASVLRAKPDFKELTVSNNDINEAGVRVLCQGLKDSPCQLEALKLESCGVTSDNCRDLCGIVASKASLRELALGSNKLGDVGMAELCPGLLHPSSRLRTLWIWECGITAKGCGDLCRVLRAKESLKELSLAGNELGDEGARLLCETLLEPGCQLESLWVKSCSFTAACCSHFSSVLAQNRFLLELQISNNRLEDAGVRELCQGLGQPGSVLRVLWLADCDVSDSSCSSLAATLLANHSLRELDLSNNCLGDAGILQLVESVRQPGCLLEQLVLYDIYWSEEMEDRLQALEKDKPSLRVIS (서열번호 73)
> 인간 Ribonuclease Inhibitor (RNH1) (NM_203384)의 염기서열
TTTTGTAATACGACTCACTATAGGGCGGCCGGGAATTCGTCGACTGGATCCGGTACCGAGGAGATCTGCCGCCGCGATCGCCATGAGCCTGGACATCCAGAGCCTGGACATCCAGTGTGAGGAGCTGAGCGACGCTAGATGGGCCGAGCTCCTCCCTCTGCTCCAGCAGTGCCAAGTGGTCAGGCTGGACGACTGTGGCCTCACGGAAGCACGGTGCAAGGACATCAGCTCTGCACTTCGAGTCAACCCTGCACTGGCAGAGCTCAACCTGCGCAGCAACGAGCTGGGCGATGTCGGCGTGCATTGCGTGCTCCAGGGCCTGCAGACCCCCTCCTGCAAGATCCAGAAGCTGAGCCTCCAGAACTGCTGCCTGACGGGGGCCGGCTGCGGGGTCCTGTCCAGCACACTACGCACCCTGCCCACCCTGCAGGAGCTGCACCTCAGCGACAACCTCTTGGGGGATGCGGGCCTGCAGCTGCTCTGCGAAGGACTCCTGGACCCCCAGTGCCGCCTGGAAAAGCTGCAGCTGGAGTATTGCAGCCTCTCGGCTGCCAGCTGCGAGCCCCTGGCCTCCGTGCTCAGGGCCAAGCCGGACTTCAAGGAGCTCACGGTTAGCAACAACGACATCAATGAGGCTGGCGTTCATGTGCTATGCCAGGGCCTGAAGGACTCCCCCTGCCAGCTGGAGGCGCTCAAGCTGGAGAGCTGCGGTGTGACATCAGACAACTGCCGGGACCTGTGCGGCATTGTGGCCTCCAAGGCCTCGCTGCGGGAGCTGGCCCTGGGCAGCAACAAGCTGGGTGATGTGGGCATGGCGGAGCTGTGCCCAGGGCTGCTCCACCCCAGCTCCAGGCTCAGGACCCTGTGGATCTGGGAGTGTGGCATCACTGCCAAGGGCTGCGGGGATCTGTGCCGTGTCCTCAGGGCCAAGGAGAGCCTGAAGGAGCTCAGCCTGGCCGGCAACGAGCTGGGGGATGAGGGTGCCCGACTGTTGTGTGAGACCCTGCTGGAACCTGGCTGCCAGCTGGAGTCGCTGTGGGTGAAGTCCTGCAGCTTCACAGCCGCCTGCTGCTCCCACTTCAGCTCAGTGCTGGCCCAGAACAGGTTTCTCCTGGAGCTACAGATAAGCAACAACAGGCTGGAGGATGCGGGCGTGCGGGAGCTGTGCCAGGGCCTGGGCCAGCCTGGCTCTGTGCTGCGGGTGCTCTGGTTGGCCGACTGCGATGTGAGTGACAGCAGCTGCAGCAGCCTCGCCGCAACCCTGTTGGCCAACCACAGCCTGCGTGAGCTGGACCTCAGCAACAACTGCCTGGGGGACGCGGGCATCCTGCAGCTGGTGGAGAGCGTCCGGCAGCCGGGCTGCCTCCTGGAGCAGCTGGTCCTGTACGACATTTACTGGTCTGAGGAGATGGAGGACCGGCTGCAGGCCCTGGAGAAGGACAAGCCATCCCTGAGGGTCATCTCCACGCGTACGCGGCCGCTCGAGCAGAAACTCATCTCAGAAGAGGATCTGGCAGCAAATGATATCCTGGATTACAAGGATGACGACGATAAGGTTTAA (서열번호 74)
또한, NMP 혼합물을 기질로 하여 NTP 혼합물을 제조하는 5 종류의 키나제 ORF는(a) 대장균으로부터의 (i) CMP 키나제(Cmk), 서열번호 75 및 76, (ii) UMP 키나제(PyrH), 서열번호 77 및 78, (iii) GMP 키나제(Gmk), 서열번호 79 및 80 (iv) NDP 키나제(Ndk) 서열번호 81 및 82는, https://www.uniprot.org/fmf 및 (b) 폴리포스페이트 키나제(PPK2) 서열번호 83 및 84은 Polyphosphate kinase 2<Caldilinea aerophila DSM 14535 PPK2>의 아미노산서열을 https://www.ebi.ac.uk/Tools/st/emboss_backtranseq/ 를 통하여 대장균 codon usage로 역번역하여 확보하였다.
> Cytidylate kinase<Escherichia coli (strain K12); EC:2.7.4.25; Gene: cmk (mssA, ycaF, ycaG); GenBank: X00785.1; 227 amino acids>의 아미노산 서열
MTAIAPVITI DGPSGAGKGT LCKAMAEALQ WHLLDSGAIY RVLALAALHH HVDVASEDAL
VPLASHLDVR FVSTNGNLEV ILEGEDVSGE IRTQEVANAA SQVAAFPRVR EALLRRQRAF
RELPGLIADG RDMGTVVFPD APVKIFLDAS SEERAHRRML LQVKGFSVNF ERLLAEIKER
DDRDRNRAVA PLVPAADALV LDSTTLSIEQ VIEKALQYAR QKLALA (서열번호 75)
> Cytidylate kinase의 염기서열
ATGACGGCA ATTGCCCCGG TTATTACCAT TGATGGCCCA AGCGGTGCAG GGAAAGGCAC
CTTGTGTAAG GCTATGGCGG AAGCGTTGCA ATGGCATCTG CTGGACTCGG GTGCAATTTA
TCGCGTACTG GCATTGGCGG CATTACATCA CCATGTTGAT GTTGCGTCGG AAGATGCGCT
GGTACCGCTG GCATCCCATC TGGATGTACG TTTTGTGTCG ACCAATGGCA ATCTGGAAGT
GATCCTCGAA GGGGAAGATG TCAGCGGCGA AATTCGTACT CAGGAAGTGG CGAATGCAGC
TTCACAAGTC GCGGCATTCC CACGCGTTCG TGAAGCATTA TTGCGTCGCC AACGCGCGTT
TCGCGAATTA CCAGGTCTGA TTGCCGATGG CCGCGACATG GGAACGGTGG TATTCCCTGA
TGCACCAGTG AAAATTTTCC TTGACGCCTC CTCGGAAGAA CGTGCGCATC GCCGCATGCT
ACAGTTGCAG GTGAAGGGCT TTAGTGTTAA CTTTGAGCGC CTTTTGGCCG AGATCAAAGA
ACGCGACGAC CGCGATCGTA ACCGAGCGGT AGCGCCACTG GTTCCGGCAG CCGATGCTTT
AGTGTTGGAT TCCACCACCT TAAGCATTGA GCAAGTGATT GAAAAAGCGC TACAATACGC
GCGCCAGAAA TTGGCTCTCG CATAA (서열번호 76)
> Uridylate kinase<Escherichia coli (strain K12); EC:2.7.4.22; Gene: pyrH (smbA); GenBank: X78809.1; 241 amino acids>의 아미노산 서열
MATNAKPVYK RILLKLSGEA LQGTEGFGID ASILDRMAQE IKELVELGIQ VGVVIGGGNL
FRGRWSGETG MNRVVGDHMG MLATVMNGLA MRDALHRAYV NARLMSAIPL NGVCDSYSWAE
AISLLRNNRV VILSAGTGNP FFTTDSAACL RGIEIEADVV LKATKVDGVF TADPAKDPTA
TMYEQLTYSE VLEKELKVMD LAAFTLARDH KLPIRVFNM NKPGALRRVV MGEKEGTLIT E (서열번호 77)
> Uridylate kinase의 염기서열
ATGGCTACCA ATGCAAAACC CGTCTATAAA CGCATTCTGC TTAAGTTGAG TGGCGAAGCT
CTGCAGGGCA CTGAAGGCTT CGGTATTGAT GCAAGCATAC TGGATCGTAT GGCTCAGGAA
ATCAAAGAAC TGGTTGAACT GGGTATTCAG GTTGGTGTGG TGATTGGTGG GGGTAACCTG
TTCCGTGGCC GCTGGTCTGG CGAAACGGGT ATGAACCGCG TTGTGGGCGA CCACATGGGG
ATGCTGGCGA CCGTAATGAA CGGCCTGGCA ATGCGTGATG CACTGCACCG CGCCTATGTG
AACGCTCGTC TGATGTCCGC TATTCCATTG AATGGCGTGT GCGACAGCTA CAGCTGGGCA
GAAGCTATCA GCCTGTTGCG CAACAACCGT GTGGTGATCC TCTCCGCCGG TACAGGTAAC
CCGTTCTTTA CCACCGACTC AGCAGCTTGC CTGCGTGGTA TCGAAATTGA AGCCGATGTG
GTGCTGAAAG CAACCAAAGT TGACGGCGTG TTTACCGCTG ATCCGGCGAA AGATCCAACC
GCAACCATGT ACGAGCAACT GACTTACAGC GAAGTGCTGG AAAAAGAGCT GAAAGTCATG
GACCTGGCGG CCTTCACGCT GGCTCGTGAC CATAAATTAC CGATTCGTGT TTTCAATATG
AACAAACCGG GTGCGCTGCG CCGTGTGGTA ATGGGTGAAA AAGAAGGGAC TTTAATCACG
GAATAA (서열번호 78)
> Guanylate kinase<Escherichia coli (strain K12); EC:2.7.4.8; Gene: gmk (spoR); GenBank: M84400.1; 207 amino acids>의 아미노산 서열
MMKVWMAILI GILCWQSSVW AVCPAWSPAR AQEEISRLQQ QIKQWDDDYW KEGKSEVEDG
VYDQLSARLT QWQRCFGSEP RDVMMPPLNG AVMHPVAHTG VRKMVDKNAL SLWMRERSDL
WVQPKVDGVA VTLVYRDGKL NKAISRGNGL KGEDWTQKVS LISAVPQTVS GPLANSTLQG
EIFLQREGHI QQQMGGINAR AKVAGLMMRQ DDSDTLNS (서열번호 79)
>Guanylate kinase의 염기서열
ATGGCTCAAG GCACGCTTTA TATTGTTTCT GCCCCCAGTG GCGCGGGTAA ATCCAGCCTG
ATTCAGGCTT TATTAAAAAC CCAACCGTTG TATGACACCC AGGTTTCTGT TTCACACACC
ACACGCCAAC CGCGTCCTGG TGAAGTCCAC GGTGAACATT ATTTCTTTGT TAATCATGAT
GAATTTAAAG AAATGATTAG CAGAGATGCG TTCCTCGAAC ACGCAGAAGT TTTTGGTAAT
TACTATGGCA CTTCGCGTGA GGCCATTGAG CAAGTACTGG CGACCGGTGT CGATGTTTTT
CTCGATATCG ACTGGCAGGG CGCGCAGCAA ATTCGCCAGA AGATGCCGCA CGCGCGGAGT
ATCTTTATTT TACCGCCGTC CAAAATTGAA CTGGACCGCC GTCTACGCGG TCGCGGTCAG
GACAGCGAAG AGGTCATTGC AAAGCGTATG GCGCAAGCTG TTGCAGAAAT GAGCCATTAC
GCCGAATATG ATTATCTGAT TGTGAATGAT GACTTCGATA CCGCGTTGAC CGATTTGAAG
ACCATTATTC GCGCCGAACG TCTGCGCATG AGCCGCCAAA AGCAGCGTCA TGACGCTTTA
ATCAGCAAAT TGTTGGCAGA CTGAACCTGA TTTCAGTATC ATGCCCAGTC ATTTCTTCAC
CTGTGGAGCT TTTTAAGTAT G (서열번호 80)
> Nucleoside diphosphate kinase<Escherichia coli (strain K12); EC:2.7.4.6; Gene: ndk; GenBank: X57555.1; 143 amino acids>의 아미노산 서열
MAIERTFSII KPNAVAKNVI GNIFARFEAA GFKIVGTKML HLTVEQARGF YAEHDGKPFF
DGLVEFMTSG PIVVSVLEGE NAVQRHRDLL GATNPANALA GTRADYADSL TENGTHGSDS
VESAAREI AY FFGEGEVCP RTR (서열번호 81)
>Nucleoside diphosphate kinase의 염기서열
ATGGCTATTG AACGTACTTT TTCCATCATC AAACCGAACG CGGTAGCAAA AAACGTCATT
GGTAATATCT TTGCGCGCTT TGAAGCTGCA GGGTTCAAAA TTGTTGGCAC CAAAATGCTG
CACCTGACCG TTGAACAGGC ACGTGGCTTT TATGCTGAAC ACGATGGAAA ACCGTTCTTT
GATGGTCTGG TTGAATTCAT GACCTCTGGC CCGATCGTGG TTTCCGTGCT GGAAGGTGAA
AACGCCGTTC AGCGTCACCG CGATCTGCTG GGCGCGACCA ATCCGGCAAA CGCACTGGCT
GGTACTCTGC GCGCTGATTA CGCTGACAGC CTGACCGAAA ACGGTACCCA CGGTTCTGAT
TCCGTCGAAT CTGCCGCTCG CGAAATCGCT TATTTCTTTG GCGAAGGCGA AGTGTGCCCG
CGCACCCGTT AA (서열번호 82)
> Polyphosphate kinase 2<Caldilinea aerophila DSM 14535 PPK2>의 아미노산서열
MDVDRYRVPPGSTIHLSQWPPDDRSLYEGDKKQGKQDLSALNRRLETLQELLYAEGKHKVLIILQGMDTSGKDGVIRHVFNGVNPQGVKVASFKVPTAVELAHDFLRIHRQTPGSGEIVIFNRSHYEDVLVVRVHGLVPPEVWARRYEHINAFEKLLVDEGTTILKFFLHISKEEQRQRLLERLEMPEKRWKFSVGDLAERKRWDEYMAAYEAVLSKTSTEYAPWYrVPSDRKWYRNLVISHVIINALEGLNMRYPQPEDIAFDTIVIE (서열번호 83)
> Polyphosphate kinase 2의 염기서열
ATGGACGTTGACCGTTACCGTGTTCCGCCGGGTTCTACCATCCACCTGTCTCAGTGGCCG
CCGGACGACCGTTCTCTGTACGAAGGTGACAAAAAACAGGGTAAACAGGACCTGTCTGCG
CTGAACCGTCGTCTGGAAACCCTGCAGGAACTGCTGTACGCGGAAGGTAAACACAAAGTT
CTGATCATCCTGCAGGGTATGGACACCTCTGGTAAAGACGGTGTTATCCGTCACGTTTTC
AACGGTGTTAACCCGCAGGGTGTTAAAGTTGCGTCTTTCAAAGTTCCGACCGCGGTTGAA
CTGGCGCACGACTTCCTGCGTATCCACCGTCAGACCCCGGGTTCTGGTGAAATCGTTATC
TTCAACCGTTCTCACTACGAAGACGTTCTGGTTGTTCGTGTTCACGGTCTGGTTCCGCCG
GAAGTTTGGGCGCGTCGTTACGAACACATCAACGCGTTCGAAAAACTGCTGGTTGACGAA
GGTACCACCATCCTGAAATTCTTCCTGCACATCTCTAAAGAAGAACAGCGTCAGCGTCTG
CTGGAACGTCTGGAAATGCCGGAAAAACGTTGGAAATTCTCTGTTGGTGACCTGGCGGAA
CGTAAACGTTGGGACGAATACATGGCGGCGTACGAAGCGGTTCTGTCTAAAACCTCTACC
GAATACGCGCCGTGGTACCGTGTTCCGTCTGACCGTAAATGGTACCGTAACCTGGTTATC
TCTCACGTTATCATCAACGCGCTGGAAGGTCTGAACATGCGTTACCCGCAGCCGGAAGAC
ATCGCGTTCGACACCATCGTTATCGAA (서열번호 84)
하기 아미노산서열을 https://www.ebi.ac.uk/Tools/st/emboss_backtranseq/를 통하여 대장균 codon usage로 역번역하여 염기서열을 확보할 수 있다.
> Thermus thermophilus Adk의 아미노산서열
MDVGQAVIFLGPPGAGKGTQASRLAQELGFKKLSTGDILRDHVARGTPLGERVRPIMERGDLVPDDLILELIREELAERVIFDGFPRTLAQAEALDRLLSETGTRLLGVVLVEVPEEELVRRILRRAELEGRSDDNEETVRRRLEVYREKTEPLVGYYEARGVLKRVDGLGTP DEVYARIRAALGI (서열번호 85)
>Thermus thermophilus Cmk의 아미노산서열
MRGIVTIDGPSASGKSSVARRVAAALGVPYLSSGLLYRAAAFLALRAGVDPGDEEGLLALLEGLGVRLLAQAEGNRVLADGEDLTSFLHTPEVDRVVSAVARLPGVRAWVNRRLKEVPPPFVAEGRDMGTAVFPEAAHKFYLTASPEVRAWRRARERPQAYEEVLRDLLRRDERDKAQSAPAPDALVLDTGGMTLDEVVAWVLAHIRR (서열번호 86)
>Pyrococcus furiosus PyrH의 아미노산서열
MRIVFDIGGSVLVPENPDIDFIKEIAYQLTKVSEDHEVAVVVGGGKLARKYIEVAEKFNSSETFKDFIGIQITRANAMLLIAALREKAYPVVVEDFWEAWKAVQLKKIPVMGGTHPGHTTDAVAALLAEFLKADLLVVITNVDGVYTADPKKDPTAKKIKKMKPEELLEIVGKGIEKAGSSSVIDPLAAKIIARSGIKTIVIGKEDAKDLFRVIKGDHNGTTIEP (서열번호 87)
>Thermotoga maritima Gmk의 아미노산서열
MKGQLFVICGPSGAGKTSIIKEVLKRLDNVVFSVSCTTRPKRPHEEDGKDYFFITEEEFLKRVERGEFLEWARVHGHLYGTLRSFVESHINEGKDVVLDIDVQGALSVKKKYSNTVFIYVAPPSYADLRERILKRGTEKEADVLVRLENAKWELMFMDEFDYIVVNENLEDAVEMVVSIVRSERAKVTRNQDKIERFKMEVKGWKKL (서열번호 88)
> Aquifex aeolicus Ndk의 아미노산서열
MAVERTLIIVKPDAMEKGALGKILDRFIQEGFQIKALKMFRFTPEKAGEFYYVHRERPFFQELVEFMSSGPVVAAVLEGEDAIKRVREIIGPTDSEEARKVAPNSIRAQFGTDKGKNAIHASDSPESAQYEICFIFSGLEIV (서열번호 89)
대장균 BL21(DE3), BL21 Star (DE3), HT115(DE3) 및 SHuffle 균주를 사용할 수도 있다. BL21 균주는 lacUV5 promoter + T7 polymerase로 이루어진 유전자 카세트인 DE3를 보유하는 대장균 균주이다. 이 균주를 이용하여 T7 polymerase(protein) & T7 promoter(gene) 구성이 된 T7 system을 구성할 수 있으며, T7 polymerase와 promoter가 특이하게 결합하기 때문에 T7 pol가 없으면 발현하지 않고, T7 pol가 있어야 발현한다.
본 실시례에서 사용하는 발현벡터 pET(Novagen사, 미국)의 MCS에 표적유전자의 frame shift를 고려하여 클로닝하며 실시례의 목적을 단순하게 달성할 수 있다.
먼저, 세포 RNA로부터 NTP의 합성대사경로 유전자들로 EcRNR, Nuclease P1, RNH1, Cmk, PyrH, Gmk, Ndk, 및 PPK2를 인코딩하는 orf DNA 발현단위를 인코딩하는 DNA 유형 발현단위는 <T7lac promoter - 5'UTR - ORF DNA - 전사종결서열> 순서이고, 이를 'T7lac ORFDNA'이라고 하였다. T7 lac promoter는 T7 promoter 염기서열과 lac operator 염기서열로 구성된 DNA이다.
세포 RNA로부터 NTP의 합성대사경로 유전자들로 EcRNR, Nuclease P1, RNH1, Cmk, PyrH, Gmk, Ndk, 및 PPK2를 인코딩하는 orf DNA를 각각 클로닝된 발현벡터 pET28(Novagen사, 미국)를 대장균 BL21(DE3)균주에 형질전환하여 해당 콜로니를 선정한 후 항생제가 첨가된 액체배지에서 배양하여 상기 플라스미드를 대량 분리, 정제하였다(도 9).
또는 상기 lac operon 대신에 테트라사이클린 오프 시스템(Tetracycline Off System)를 사용할 수 있다. 테트라사이클린 오프 시스템(Tetracycline Off System)은 tetracycline이 있으면 tet 유도성 프로모터의 발현이 감소시킨다. 테트라사이클린이 없는 경우 tTA의 tetR 부분은 이러한 tetO 서열에 결합하고 활성화 도메인은 발현을 촉진한다. 테트라사이클린이 존재하면 테트라사이클린은 tetR에 결합한다. 이것은 tTA가 tetO 서열에 결합하는 것을 막고 활성화 도메인에 의한 발현의 후속 증가를 방지하여 유전자 발현을 감소시킨다.
무세포 합성 시스템에서 세포 RNA로부터 NTP 생산을 하기 위한 DNA 유형의 발현단위는 세포 RNA로부터 NTP의 합성대사경로 유전자들로 EcRNR, Nuclease P1, RNH1, Cmk, PyrH, Gmk, Ndk, 및 PPK2를 인코딩하는 orf DNA 발현단위를 인코딩하는 DNA 절편은 <T7 promoter - 5'UTR - ORF DNA - 전사종결서열> 순서로 구성하였다.
4.3. RNA 유형의 발현단위
본 발명의 발현단위는 DNA 또는 RNA 유형이 있으며 DNA 유형의 RNA중합효소 발현단위, 캡핑효소 발현단위 및 설계 발현단위를 시험관 내 전사 과정을 실시하여 상응하는 RNA 유형의 발현단위를 제조하였다.
본 발명의 RNA 유형 발현단위는 단백질 합성 반응 시스템에 따라 원핵세포 또는 진핵세포에 따라 DNA 주형의 구성성분이 상이하다.
단백질 합성 반응 시스템이 원핵세포인 경우는 RNA 유형의 T7pol mRNA 발현단위를 합성하기 위하여, 먼저 T7 promoter-T7 polymerase 서열을 가지는 DdRp pUC19 벡터를 주형으로 PCR 증폭하였다. DdRp PCR산물로부터 RNA 전사체의 합성은 T7 중합효소의 프로모터를 포함하는 PCR 산물 주형으로 T7 RNA 중합효소(Epicentre Technologies)를 이용하여 체외전사를 실시하였다.
시험관 내 전사과정은 T7 중합효소의 프로모터를 포함하는 PCR 산물, 10X 전사버퍼, 5 mM DTT, 5 mM ATP, GTP, CTP, UTP, T7 중합효소 혼합물(Epicentre Technologis)을 혼합한 후 37℃에서 4시간동안 반응하였다. 합성된 RNA 시약에 DNaseI(Epaicentre Technologies)을 첨가하고 37℃에서 15분간 반응시켜 주형으로 사용한 DNA를 제거한 후 Ethanol 침전법으로 정제하여 RNA유형 발현단위를 제작하였다.
단백질 합성 반응 시스템이 진핵세포인 경우는 RNA 유형의 T7pol mRNA 발현단위를 합성하기 위하여, 먼저 T7 promoter-T7 polymerase 서열을 가지는 DdRp pUC19 벡터를 주형으로 PCR 증폭하였다. 이러한 T7 promoter-T7 polymerase DNA 주형으로 상기에서 제조한 T7프로모터가 있는 DdRp PCR 산물을 주형으로여 HighYield T7 ARCA mRNA Synthiis Kit (m5CTP/Ψ-UTP) (Jena BioScience, 미국)를 이용하여 캡된 T7pol mRNA를 시험관 내에서 합성하였다. 구체적으로 살펴보면, antireverse cap analog [(ARCA) (3′-O-Me-7mG(5′)ppp(5′)G cap analog라고도 부름)] 및 화학적 변형된 뉴클레오타이드 포함하는 반응용액 (6 mM ARCA, 1.5 mM GTP, 7.5 mM 5-Methyl-CTP, 7.5 mM Pseudo-UTP, 7.5 mM ATP)에서 체외전사를 실시하였다. dsDNA 주형을를 제거하기 위해서 DNA nuclease를 첨가하였고, 남아있는 캡된 T7pol mRNA는 LiCl 추출법과 에탄올 침전법을 이용하여 정제하였다.
상기 T7pol mRNA 유형의 발현단위 합성 방법은 모든 DNA 유형의 RNA 중합효소 발현단위, 캡핑효소 발현단위 및 설계 발현단위에 사용하여 RNA 유형의 발현단위를 각각에 합성하였다.
실시예 5. 무세포 조성물
본 발명에서 RNA 합성 반응을 위해 DdRp 및/또는 DdRp mRNA를 포함 및/또는 첨가하는 최소한 전사와 번역을 하는 무세포 조성물은 RI(RNase inhibitor)가 처리된 무세포 시스템, NMP 혼합물, 관심 RNA 전사시스템, MgS04, 에너지원인 Sodium Hexametaphosphate(SHMP) 및 5종류의 키나제를 포함하는 플라스미드 혼합물을 포함할 수 있다.
상기 RNA 합성 반응을 위해 DdRp 및/또는 DdRp mRNA를 포함 및/또는 첨가하는 최소한 전사와 번역을 하는 무세포 조성물에 필요한 발현단위는 하기의 여러 발현단위를 전사하기 위한 T7Pol 발현단위, 세포 RNA를 분해하여 NMP 혼합물을 제조하는 세포 RNA로부터 NTP의 합성대사경로 유전자들로 EcRNR와 Nuclease P1 RNA 분해효소 발현단위, RNH1를 포함하는 단백질 RNase inhibitor(RI) 발현단위 등을 포함할 수 있다. 또한, 추가적으로 상기 NMP 혼합물에서 NTP 혼합물을 제조하기 위한 5종류의 키나제 발현단위는 Cmk, PyrH, Gmk, Ndk, 및 PPK2 등을 포함한다.
이와 같이 본 발명의 목적을 달성하기 위해서 반응원재료 대사 경로인 세포 RNA를 분해하여 NMP 혼합물을 제조하는 세포 RNA로부터 NTP의 합성대사경로 유전자 발현단위의 집합을 '설계 발현단위'라고 하였다.
본 발명의 설계 발현단위 T7 프로모터의 하류 지역에 있으면서 T7 RNA polymerase에 의해 전사되는 특징이 있다. 상기 발현단위는 상응하는 유전자를 코딩하는 orf DNA를 각각 이중 유전자 발현벡터 pET(Novagen)에 클로닝하여 제조하였다.
본 발명에서 무세포 RNA 합성을 위한 무세포 시스템을 제공하기 위한 바이오매스는 T7 RNA polymerase를 갖고 있는 대장균 BL21(DE3), BL21 Star (DE3), HT115(DE3) 및 SHuffle 균주이며, 각각 재조합 단백질 및 RNA를 독립적으로 발현하는 숙주세포로 많이 사용하고 있다.
바람직하게, 무세포 RNA 조성물을 구성하는 Kinase를 포함한 단백질 발현단위는 무세포유래 세포는 BL21(DE3), 또한, RNA 발현단위의 RNA가 mRNA 경우 관심 RNA 전사시스템의 무세포유래 세포는 BL21 (DE3) 균주를, RNA가 dsRNA, RNA 압타머인 경우는 관심 RNA 전사시스템의 무세포유래 세포는 HT115(DE3) 균주를 사용하였다. E. coli SHuffle는 아황화 결합을 유도할 목적으로 사용할 수 있으며 RNase inhibitor 단백질 및 전장-Ig 등의 적합할 수 있다. 또한 RNase inhibitor 단백질 발현단위를 이용하여 무세포 시스템에서 합성되는 RNA를 보호할 수도 있다.
대장균 BL21(DE3)의 유전형 F- ompT gal dcm lon hsdSB(rB-mB-) λ(DE3 [lacI lacUV5-T7p07 ind1 sam7 nin5]) [malB+]K-12(λS)이며 DE3, T7 RNA 폴리머라제 유전자 및 lacIq를 운반하는 λ 프로파지를 갖는 E. coli B 균주로 T7 프로모터 구동 발현을 함유하는 형질전환된 플라스미드는 lac 프로모터로부터 T7 RNA 폴리머라제의 IPTG 유도가 있을 때까지 억제된다. BL21(DE3)은 2개의 주요 프로테아제 인코딩 유전자가 결핍되어 있지만 활성 dsRNA 특이적 RNase III 인코딩 유전자가 있다.
대장균 균주 BL21 Star™(DE3)(Life Technologies C601003; BL21(DE3)의 유전형은 rne131 F- ompT gal dcm lon hsdS B (rB-mB-) λ(DE3 [ lacI lacUV5-T7p07 ind1 sam7 nin5 ]) [malB+] K-12 (λS))이며 BL21 Star (DE3)는 낮은 mRNA 분해를 위한 rne131 돌연변이가 있는 균주이다.
대장균 HT115의 유전형은 F-, mcrA, mcrB, IN(rrnD-rrnE)1, rnc14::Tn10(DE3 리소겐: lacUV5 프로모터 -T7 폴리머라제)(IPTG-유도성 T7 폴리머라제)(RNase III 마이너스)이며, 이 균주는 LB 또는 2XYT 플레이트에서 생장하며. 이 균주는 테트라사이클린 내성이 있다. HT115(DE3)는 RNase III 인코딩 유전자가 없지만 프로테아제 인코딩 유전자를 포함하고 있다. 하나의 480bp 세그먼트(L4440-s3)가 있는 이중 T7-프로모터 플라스미드 L4440을 포함하는 대장균 HT115(DE3)는 RNAase III 결핍 균주로 dsRNA 생산에 사용되고 있다.
본 발명에서 아황화 결합(disulfide bridge)이 있는 RNase inhibitor 단백질(NM_203384)과 FL(full length, 전장)-IgG 등을 포함하는 단백질의 발현을 위해 무세포 시스템을 E. coli SHuffle 균주를 사용할 수 있으며, 설계 발현단위로 인간 단백질 이황화 이소머라제(Protein disulfide isomerase, PDI), Glutathione peroxidase 7(GPx7) 및 이들의 융합체(PDI-GPx7 융합)을 사용할 수 있다.
SHuffle express T7 균주(NEB사, 미국)는 E. coli BL21 fhuA2 lacZ::T7 gene1 [lon] ompT ahpC gal λatt::pNEB3-r1-cDsbC (SpecR, lacIq) ΔtrxB sulA11 R(mcr-73::miniTn10-TetS)2 [dcm] R(zgb-210::Tn10-TetS) endA1 ΔgorΔ(mcrC-mrr)114::IS10 이다.
E. coli 세포질에서 가용성 및 기능적 형태의 FL-IgG 발현의 주요 장애물은 환원 환경으로 인해 안정적이고 정확하게 쌍을 이루는 이황화 결합을 형성할 수 없다는 것이다. 이러한 한계를 극복하기 위해 FL-IgG의 발현에 필요한 촉매 기능을 위한 일부 필수 유전자 또는 산화 스트레스의 결과로 일시적으로 형성되는 이황화 결합을 감소시키는 세포질의 티오레독신 및 글루타레독신 경로의 두 가지 환원 경로를 제거할 수 있다. 각각의 리덕타제 유전자 thioredoxin reductase(trxB)와 glutathione reductase(gor)를 결실하여 이 두 경로를 제거한 균주의 생존을 위해 충분한 환원력(GrxA를 통해)을 제공하는 퍼옥시다제 유전자 ahpC의 돌연변이로 균주를 확립하였다. Origami™라는 제품명으로 상업적으로 이용 가능한 이 균주는 많은 이황화 결합 단백질을 생산하는 능력을 보여주었다. 이 균주는 이작용성 샤페론 및 이황화 결합 이성화효소인 DsbC의 세포질 버전을 발현하도록 추가로 조작하여 SHuffle 균주로 상업화하였다. 많은 FL-IgG가 이 균주의 세포질에서 가용성 및 기능적 형태로 발현하였다. E. coli SHuffle 균주에서 올바른 이황화 결합을 가진 여러 FL-IgG의 성공적인 세포질 발현을 하였다.
SHuffle 세포는 AhpC의 과산화효소 활성 손실로 인해 일정한 산화 스트레스를 받고 있으며, 그 결과 과산화수소(H2O2 )가 축적된다. H2O2 축적은 산화 스트레스를 유발하며 SHuffle 세포의 프로테옴을 손상시킬 뿐만 아니라 재조합 단백질 발현을 교란시킬 수 있다. 소포체 상주 진핵생물 GPx7과 산화 폴딩을 담당하는 효소인 PDI를 사용하여 H2O2 의 산화능력을 이황화 결합 형성에 연결할 수 있다.
생명의 모든 영역에 존재하는 퍼옥시다제 슈퍼패밀리는 8개의 하위 그룹으로 나눌 수 있다. GPx7은 소포체(ER)에 상주하는 퍼옥시다제로서 H2O2를 환원하고 이황화 결합을 PDI에 제공함으로써 산화성 단백질 접힘에 기여한다. 산화된 PDI는 생체 내 및 시험관 내 모두에서 단백질의 산화적 접힘에 참여한다.
따라서 진핵생물 PDI-GPx7 결합 산화환원 경로의 엔지니어링은 구성요소가 원핵생물 시스템과 상호작용할 필요가 없을 수 있기 때문에 SHuffle 세포에 있는AhpC의 과산화효소 활성 손실로 인해 일정한 산화 스트레스의 해결에 매력적인 방법일 수 있다. ER에 자연적으로 존재하는 진핵생물 산화환원 경로를 유전적으로 조작하여 이전에 조작된 원핵세포인 SHuffle의 세포질에서 발현 및 기능을 수행하려는 시도가 이루어졌다. 축적된 H2O2 풀은 PDI-GPx7 융합의 공동 발현에 의해 이황화 결합 형성에 결합되었다. 이 산화환원 결합 시스템의 실현 가능성은 가장 수익성이 높은 치료 단백질인 Humira IgG에서 입증되었다. 인간 PDI-GPx7 융합의 공동 발현은 고밀도 발효에서 Humira IgG의 정확한 조립 및 수율을 몇 배 향상시켰다.
상기 PDI-GPx7 융합은 Applied Microbiology and Biotechnology volume 104, pages9693-9706 (2020)를 참조하여 ER-retention signal이 없는 GPx7 (NP_077160.1)와 인간 PDI(NP_000909) 염기서열을 이용하여 제작할 수 있다.
E. coli SHuffle 균주로부터 무세포 시스템을 제조하고, 인간 단백질 이황화 이소머라제(Protein disulfide isomerase, PDI), Glutathione peroxidase 7(GPx7) 및 이들의 융합체(PDI-GPx7 융합)로부터 제조한 autogene system이 있는 설계 발현단위를 사용하여 아황화 결합(disulfide bridge)이 있는 RNase inhibitor 단백질(NM_203384)과 FL(full length, 전장)-IgG 등을 포함하는 단백질의 발현을 할 수 있는 상기 제조한 autogene system이 있는 설계 발현단위를 포함하는 무세포 시스템을 제작할 수 있다. 상기 RNA 중합효소 발현단위(Autogene)의 발현을 유도하여 세포용해를 유발하여 무세포 시스템을 제작할 수도 있다.
5.1. 바이오매스의 제조
본 발명에서 무세포 RNA 합성을 위한 무세포 시스템을 제공하기 위한 바이오매스는 T7 RNA polymerase를 포함하는 대장균 BL21(DE3), BL21 Star (DE3), HT115(DE3) 및 SHuffle 균주를 사용하였다.
상기 대장균을 고밀도 배양을 위해 100μg/mL 암피실린 및 12.5μg/mL 테트라사이클린을 선택 마커로 보충된 LB 브로쓰(10g/mL 트립톤, 5g/mL 효모 추출물 및 10g/mL NaCl) Korz 배지 또는 2xYPT가 있는 플라스크에서 배치로 배양하였다. 2xYPT는 22 mM 인산칼륨 일염기(potassium phosphate monobasic)와 40 mM potassium phosphate dibasic(이염기성 인산칼륨)이 보충된 2xYT 배지(2× 효모 추출물 및 트립톤): 1.6% 펩톤, 1% 효모 추출물 및 0.5% NaCl)이다.
바람직하게, 대장균 균주의 고밀도 배양은 Korz 배지를 포함하는 1L 진탕 플라스크에서 배양하였다. Korz 배지는 13.3g/L KH2PO4, 4.0g/L (NH4)2HPO4, 1.2g/L MgSO4 7H2O, 1.7g/L citric acid monohydrate, 8.4mg/L Titriplex III, 2.5mg/L CoCl2 6H2O, 1.5mg/L CuCl2 2H2O, 3.0 mg/L H3BO3, 15.0 mg/L MnCl2 4H2O, 2.5 mg/L Na2MoO4 2H2O, 13.0 mg/L Zn(CH3-COO)2 2H2O, 100.0 mg/L Fe(III) citrate hydrate, 4.5 mg/L thiamine HCl뿐만 아니라 다양한 농도의 d-glucose(2.0-30.0 g/L) 및 l-leucine(0-3.0 g/L)로 구성하였다.
포도당, phosphate buffer 및 미량 원소를 별도로 121°C에서 15분 동안 고압멸균 처리했습니다. 배양물에 E. coli K12 ER2507의 저온 배양물 100 μL를 접종하고 진탕 배양기에서 30°C 및 120분에서 배양하였다.
RNA 생산은 pH 7, 37°C, 300rpm 교반 속도 및 12시간 동안 1VVM 통기의 5리터 생물 반응기에서 수행하였다. 대장균의 성장을 평가하기 위해 OD 600nm를 박테리아 성장 동안 매시간 기록하였고 선형 모델에 기초한 바이오매스 농도 (g/L)로 표현하였다.
3리터 생물반응기에서 일정한 속도(0.27/h)의 지수적 공급 흐름을 갖는 유가식 배양을 하였다. 발효는 초기 부피 2L로 시작하여 12시간(9시간 공급) 후에 2.8L 부피로 종료하였다. 조건은 회분식 배양, 즉 100 μg/mL ampicillin 및 12.5 μg/mL tetracycline이 첨가된 LB 브로쓰, pH 7, 37 °C, 300 rpm 교반 속도, 1 VVM 폭기의 조건과 동일하다.
5.2. 합성 시스템 조성물
본 발명에서 전사와 번역을 일체형으로 진행할 수 있는 세포용해물을 무세포 반응계로 사용하였다. 본 발명에서 무세포유래 세포는 T7 Pol.를 포함하는 BL21(DE3), BL21 Star (DE3), HT115(DE3) 또는 SHuffle 대장균 균주이다. 본 무세포유래 세포에 관심 RNA 전사시스템, 이들 구성하는 RNA 중합효소 발현단위, 관심 RNA 발현단위를 포함한 다양한 발현단위를 포함하는 플라스미드를 공지된 표준방법으로 혈질전환할 수 있다. 상기 발현단위는 DNA 및 RNA를 포함하는 핵산에서 선택되어진 어느 하나 이상을 의미한다. 상기 RNA 발현단위는 상기 DNA 발현단위를 체외전사하여 준비할 수 있다.
BL21 (DE3) 대장균 균주는 100μg/mL 암피실린 및 12.5μg/mL 테트라사이클린가 보충된 30mL LB가 있는 250mL 배플 플라스크에 접종하고 37°C에서 성장하였다. 16시간 후, 상기 배양액 20mL를 1L의 하기 2x YTP + G가 있는 2.5L 배양용기에 접종하여 배양하였다. 2x YTP + G 는 성장 배지 2x YT + P(16g/L tryptone, 10g/L 효모 추출물, 5g/L 염화나트륨, 7g/L 칼륨 2.5 L 배플 Tunair 플라스크에 이염기성 인산염, 3 g/L 일염기성 인산칼륨)에 7.2% 글루코스 용액을 첨가하여 1.8%의 최종 글루코스 농도로 제조되는 배지이다. 상기 배양용액을 37°C 및 200rpm에서 약 4시간 동안 OD6OO 값이 3.0 ± 0.2로 성장하였다. 또는 BL21 (DE3) 대장균 균주를 3L 생물반응기에서 Korz 배지에서 배치 단계의 종료까지 성장시킬 수도 있다.
<세포용해 및 무세포 시스템>
상기 배양용액을 4°C에서 5000g에서 15분 동안 원심분리하여 세포를 펠렛화하였다. 상기 수확한 세포 펠렛에 25mM lactose를 포함하는 배양용액을 첨가하고 추가 배양하면서 세포에 있는 염색체에 있는 T7 RNA Polymerase이 발현하며, 이어서 연쇄적으로 autogene system의 T7 RNA Polymerase 및 T7 프로모터를 갖는 유전자들의 무한증폭을 유도하여 궁극에는 세포 용해를 유도할 수 있다.
또는, 상기 세포 펠렛을 25mL 세척 완충액(50mM Tris, 14mM Mg-글루타메이트, 60mM K-글루타메이트, 2mM DTT, 아세트산을 사용하여 pH 7.7으로 조절함)에서 재현탁하고 4°C에서 10분 동안 5000g에서 원심분리하는 과정을 3회 실시하여 세척하였다. 4번째 최종 원심분리를 4°C에서 10분 동안 7000g하여 얻은 펠릿을 1mL 세척 완충액/g 펠릿에 재현탁하고 1.6mL 미세원심분리 튜브로 옮겼다. 급속 동결 실험을 위해 이 단계 전에 세포 펠릿을 액체 질소 또는 -80℃에 동결하였다.
해동한 세포펠렛을 총 60초 동안 10초 ON/OFF 펄스로 50% 진폭 및 20kHz의 주파수에서 3.175mm 직경 프로브를 사용하여 QSonica Q125 초음파 처리기(Sigma Aldrich 사, 미국)에서 세포 현탁액을 초음파 처리하여 용해하였다(~350J 전달).
또는 해동한 세포펠렛을 58.8 mM 이염기성 인산칼륨에 10% 건조 세포 중량으로 재현탁하고, 21,000psi에서 3회 통과하는 Avestin EmulsiFlex B-15 균질화기(Avestin 사, 독일)를 사용하여 용해하였다.
상기 용해된 무세포 시스템에 아미노산 혼합물과 에너지원을 추가할 수도 있다. 상기 세포 추출액에 글리신(Glycine;Gly,G), 알라닌(Alanine;Ala,A), 발린(Valine;Val,V), 류신(Leucine;Leu,L), 이소류신(Isoleucine;Ile,I), 프롤린(Proline; Pro,P), 페닐알라닌(Phenylalanine;Phe,F), 티로신(Tyrosine;Tyr,Y), 트립토판(Tryptophan;Trp,W), 시스테인(Cysteine;Cys,C), 메치오닌(Methionine;Met, M), 세린(Serine;Ser,S), 트레오닌(Threonine;Thr,T), 리신(Lysine;Lys,K), 아르기닌(Arginine;Arg,R), 히스트딘(Histidine;His,H), 아스파레이트(Aspartate;Asp,D), 글루타메이트(Glutamate; Glu,E), 아스파라긴(Asparagine;Asn,N) 및 글루타민(Glutamine;Gln,Q)으로 이루어지는 군에서 선택된 적어도 한 종인 L-형 아미노산으로 이루어지는 아미노산 혼합물과, ATP, CTP, GTP, TTP 및 UTP 등 으로 이루어지는 군에서 선택된 적어도 한 종의 에너지원으로 이루어지는 단백질 합성 에너지원을 첨가할 수 있다,
상기에서 획득한 무세포 시스템을 1시간동안 37℃에서 T7 Pol.가 발현하도록 배양하였다. 유출 반응을 포함하는 경우, 미정제 용해물의 튜브를 알루미늄 호일로 덮고 37°C 및 200rpm에서 80분 동안 뚜껑을 덮고 흔들어 배양하였다. 추출물을 4°C 및 12,000g에서 10분 동안 재분리하고 상층액을 수집하였다.
상기 수집한 상층액 또는 상기 수집한 상층액에 RNase A(Sigma Aldrich, 카탈로그 번호: R6513)를 0.75 nM로 첨가하고 2시간동안 배양하여 RNA 분해하고, 여기에 RNase Inhibitor(RI)로 PVSA를 0.15 mg/mL로 첨가하여 얻은 RNase 및 RI 처리한 상층액을 하기 무세포반응 용해물로 사용하였다
상기 무세포반응 용해물을 12,000g, 4°C에서 10분 동안 원심분리하여 정화하고 상층액을 수집하고 분취하고 급속 동결하고 사용할 때까지 -80°C에서 보관하였다. 또는 실험실 진공 시스템에 연결된 Nalgene Desiccator(ThermoFisher, 5311-0250PK)와 500g의 실리카겔(Fisher Scientific, S/0761/53)로 건조 장치를 구성하였다. 상기 수집한 상층액에 탄소원, 건조보호제 및 에너지원 역할을 하도록 13.7mM 말토덱스트린(Maltodextrin, Sigma-Aldrich, USA)을 넣었고 준비된 샘플을 실온 및 진공하에 밤새 건조하였다. 다음날 접착 알루미늄 호일 실(4titude, 4ti-0550)로 플레이트를 밀봉하고 16G 바늘로 구멍을 뚫어 하나의 구멍을 만들었다. 두 경우 모두 즉시 재수화되지 않는 한 건조된 샘플을 진공 포장하였다(ACS Synth Biol. 2022 Mar 18; 11(3): 1114-1128). 단백질 함량을 BCA 검정 (Thermo Fisher)에 의해 분석하였다.
실시례 6. 세포 RNA로부터 NMP 및 NTP 혼합물 제조
세포 RNA로부터 NTP의 합성대사경로 유전자들을 이용한 5' 뉴클레오사이드 모노포스페이트(NMP)를 수집하기 위해 외인성 RNase R을 이용한 용해물 RNA의 분해, 내인성 RNase R을 이용한 용해물 RNA의 분해 및 뉴클레아제 P1 또는 이들의 발현단위를 이용한 세포 RNA 분해산물을 한외여과하여 분해산물을 하기와 같이 준비하였다. 또는 유기합성된 NMP를 Sigma-Aldrich 사 또는 Merk 사에서 구입하여 사용할 수도 있다
6.1. 외인성 RNase R을 이용한 용해물 RNA의 분해
대장균 균주 BL21(DE3), BL21 Star (DE3), HT115(DE3) 또는 SHuffle 균주를 배양한 후, 원심분리로 펠렛을 수확하고, 이 바이오매스를 동결하였다, 무세포 시스템은 동결된 바이오매스로부터 제조하였다(단백질 농도: 대장균 균주 BL21(DE3)는 34.5 mg/mL 바이오매스). 용해물은 58.8 mM 이염기성 인산칼륨에 10% 건조 세포 중량으로 재현탁하고, 21,000psi에서 3회 통과하는 Avestin EmulsiFlex B-15 균질화기를 사용하여 용해한 후, 원심분리하여 상층액을 무세포 시스템으로 사용하였다.
대장균 균주 BL21(DE3) 용해물(단백질 함량 34.5 mg/mL) 및 RNase R 용액(ABCAM사, 미국)은 300 mM 인산칼륨 완충제(pH 7.4, 200 mM KCl, 2 mM MgCl2 중 1 mg/mL)을 2℃에서 예비-평형화시킨 후, 반응을 시작하였다. 시간 t = 0에서, 50 μL의 대장균 용해물 및 50 μL 제조된 RNase R 용액(~5U의 효소)을 혼합하고, 예열된 37℃ 블록으로 옮김으로써 반응을 시작하였다. 개시 후, 반응물을 37℃에서 4시간 동안 배양하고, 70℃에서 15분간 열불활성화로 하였다. 상기 반응용액을 한외여과하여 NMP를 습득하거나, 또는 폴리머 RNase Inhibitor(RI)로 PVSA(Sigma Aldrich, Catalog Number: 278424)를 0.15 mg/mL로 첨가하였다.
6.2. 내인성 RNase R을 이용한 용해물 RNA의 분해
대장균 균주 BL21(DE3), BL21 Star (DE3), HT115(DE3) 또는 SHuffle 균주에 C-말단 헥사시스티딘 태그와 함께 대장균 rnr 유전자를 포함하는 pET28로 형질전환하였다. 이 균주를 배치 단계에서 50 mg/L 카르베니실린으로 보충된 코르츠 배지에서 성장하였다. 배양물을 A600 = 20에서 0.8 mM IPTG로 유도하고, 유도 시 추가의 10 g/L 글루코스로 보충하였다. 유도 1시간 후, 바이오매스를 원심분리에 의해 수확하고, 동결하였다.
내인성 RNase를 포함하는 무세포 시스템은 동결된 바이오매스로부터 상기 <5.3.1. 항>의 외인성 RNase R를 이용한 용해물 RNA의 분해에 따라 제조하였다(단백질 농도: RNase R이 삽입된 pET28을 갖는 대장균 균주 BL21(DE3)인 53.2 mg/mL 바이오매스). 제조된 용해물에서 RNA의 분해는 9 부피 용해물과 1 부피 10X EDTA 용액과 함께 2℃에서 5분 동안 예비-배양함으로써 평가하였다. 그 후, 반응을 예열된 37℃ 블록으로 옮김으로써 반응을 시작하였다. 개시 후, 반응물을 37℃에서 4시간 동안 배양하고, 반응의 종결은 70℃에서 15분간 열불활성화로 하였다. 상기 반응용액을 한외여과하여 NMP를 습득하거나, 또는 폴리머 RNase Inhibitor(RI)로 PVSA(Sigma Aldrich, Catalog Number: 278424)를 0.15 mg/mL로 첨가하였다.
6.3. 외인성 뉴클레아제 P1을 이용한 효모 RNA의 분해
효모에서 추출한 RNA(건조 분말, pkg당 100g) (Sigma-Aldrich, 미국)를 멸균, EPC 처리 이중 증류수 또는 TE 완충액을 사용하여 10 mg/ml로 재현탁하거나, 또는, 효모 RNA(10mg/mL) (Invitrogen 사, 미국)를 사용하였다.
뉴클레아제 P1(NEB 사, 미국)의 희석 용액(~5U의 효소)의 0.10 mL 분취량은 다음을 포함하는 혼합물에서 반응을 시작한다. 1X 뉴클레아제 P1 반응 완충액(50mM 아세트산나트륨, pH 5.5)에 0.20mL의 효모 RNA(5mg/ml) 용액; 및 20 μL의 10mM ZnSO+. 빈 반응 시료에 효소 대신 증류수(0.10mL)를 가한다. 시험관을 37℃에서 4시간 동안 배양하고 75°C에서 10분 조건으로 열 비활성화하여, 한외여과하여 NMP를 습득하였다. 습득한 용액을 10배로 희석하여 260 nm에서 흡광도를 측정하였다. 습득수율은 32.6mM이었다.
상기와 같이 외인성 뉴클레아제 P1로 분해된 효모 RNA는 뉴클레아제 P1로 처리된 효모 RNA에서 뉴클레아제 P1을 한외여과에 의해서 제거하고, CFR에 사용하기 전에 NMP 용액을 중성 pH로 조정하여 준비하였다.
6.4. 세포 유래 NMP에서 NTP 제조
상기 세포 유래 NMP 혼합물을 기질로 하여 NTP 혼합물을 제조하는 5 종류의 키나제 발현단위는 상기 대장균으로부터의 (i) CMP 키나제(Cmk), (ii) UMP 키나제(PyrH), (iii) GMP 키나제(Gmk) 및 (iv) NDP 키나제(Ndk)를 포함하는 키나제와 Caldilinea aerophila DSM 14535 폴리포스페이트 키나제(PPK2)이다. 상기 발현단위는 DNA 및 RNA를 포함하는 핵산에서 선택되어진 어느 하나 이상을 의미한다. 상기 RNA 발현단위의 RNA 휴형은 상기 DNA 발현단위를 체외전사하여 준비할 수 있다.
6.5. 세포 유래 분해산물의 분석
분해산물 2', 3', 및 5' NMP의 분석은 ABSCIEX API 5000 질량 분석기 및 시퀀트 지크 힐릭(Sequant Zic-hilic) 컬럼 (2.1 x 50 mm, 3 μm i.d.)이 장착된 표준 애질런트(Agilent) 1200 HPLC를 사용하여 질량 분석법 및 액체 크로 마토그래피에 의해 수행한다. 이동상은 90% 아세토니트릴 중 20 mM 암모늄 아세테이트 (A) 및 10% 아세토니 트릴 중 20 mM 암모늄 아세테이트 (B)로 이루어진다. 분리 방법은 하기로 이루어진다. 6% B의 출발 구배에 이어 600초에 걸쳐 8.5% B로 구배, 400초에 걸쳐 13% B로 구배한 다음, 60초에 걸쳐 20% B에서부터 구배, 50% B 에서 60초 동안 세척하고, 마지막으로 6% B에서 220초 동안 재평형시킨다. 하기 질량 분석기 전이를 사용하여 네거티브 모드 전기 분무 이온화 (ESI)에서 정량화를 수행한다. 2'3'5' AMP: 346.1 - 134.1, 2'3'5' UMP: 323.0 - 97, 2'3'5' CMP: 322 - 97, 2'3'5' GMP: 362.1 - 211. 피크 면적을 정제된 화합물(Biolog Life Science Institute, 미국)로부터 구입한 2' 및 3' CMP, UMP, 및 GMP를 제외하고는 시그마 알드리치(Sigma-Aldrich)로부터 구입함]로 이루어진 표준 곡선과 비교하고, 분석 전에 샘플 내로 스파이크된 내부 표준으로 정규화한다. 샘플의 분석을 위해, 표준 곡선을 탈이온수에서 제조하고, 내부 표준으로 희석하며, 본 실시례에 기재된 샘플 제조 단계에서와 같이 여과한다.
대장균 RNA는 내인성 및 외인성 RNase R을 사용하여 분해하고, 효모 유래 RNA 추출물은 뉴클레아제 P1을 이용하여 분해한다. 분해은 산 가용성 뉴클레오티드의 방출에 의해 모니터링한다. 대장균 및 효모 RNA를 RNase R로 처리하면, RNA의 산 가용성 뉴클레오티드로의 시간 의존성 전환이 나타나서, 인큐베이션 30분 후에 약 98 내지 약 100% 해중합에 도달한다. 대장균 RNA를내인성 및 외인성 RNase R로 처리하면, 약 90% 분해가 된다. 또한, 효모 유래 RNA 추출물을 뉴클레아제 P1로 처리하면, 약 94% 해중합에 도달한다. LC-MS에 의 한 후속 분석은 뉴클레아제 P1로 처리된 효모 유래 RNA 추출물 및 대장균 RNA에서의 5' NMP의 방출을 확인한다.
이들 결과는 RNA의 다양한 공급원 (예를 들어, 대장균 RNA 및 효모 RNA)이 상이한 뉴클레아제 (예를 들어, RNase R 및 뉴클레아제 P1)를 사용하여 5' NMP로 분해될 수 있다는 것을 확인한다.
실시례 7. 세포 또는 합성 시스템에서 RNA 합성
관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물에서 관심 RNA와 유용물질은 관심 RNA 발현단위 또는 설계발현단위를 설계하고 제작하여 세포 및/또는 무세포 시스템에서 Autogene system에 의해 RNA가 무한 증폭하도록 하면서 생산할 수 있다.
7.1. 세포에서 RNA 합성
먼저, 반딧불 루시퍼라제 mRNA 합성 목적 무세포 시스템은 반딧불 루시퍼라제 RNA 전사시스템으로 실시례 4항에서 제조한 'pUC19 ctDdRp01+반딧불 루시퍼라제 관심 RNA'가 형질전환된 세포 RNA로부터 NTP의 합성대사경로 유전자들을 포함하는 BL21 (DE3) 대장균 균주를 대상으로 실시례 5 항에 따라 준비하였으며, T7 Pol 발현단위 및 반딧불 루시퍼라제 RNA 전사시스템을 포함한다. 상기 'pUC19 ctDdRp01+반딧불 루시퍼라제 관심 RNA'대신에 'pUC19 RdRp + T7RdRp 반딧불 루시퍼라제 관심 RNA'를 형질전환하여 자가증폭 관심 RNA 합성을 할 수도 있다.
T7 Pol.를 포함하는 BL21 (DE3) 대장균 균주에 상기 실시례 4항에서 제조한 'pUC19 ctDdRp01+반딧불 루시퍼라제 관심 RNA'를 형질전환한 선발된 BL21 (DE3) 대장균 균주를 <실시례 6>항에 따라 배양용액에서 OD600 값이 3.0 ± 0.2가 되도록 배양하고 이를 원심분리로 수확하였다.
수확한 상기 대장균을 배양용액과 1/10 부피인 25mM lactose (또는 1.25 mM IPTG)를 포함하는 배양용액으로 현탁시킨 후 37℃로 2시간 동안 배양하면서 반딧불 루시퍼라제 관심 RNA의 발현을 유도하였다.
바람직하게, lactose 또는 IPTG의 양 또는 배양시간은 배양양상에 따라 조절할 수 있다. lactose 또는 IPTG로 염색체에 있는 T7 RNA Polymerase를 발현시키고 이어서 연쇄적으로 상기 RNA 중합효소 발현단위(Autogene)의 T7 RNA Polymerase 및 T7 프로모토 하류지역에 있는 유전자들의 무한발현을 유도하여 세포용해를 유발할 수 있다.
본 실시례에서는 US5830694A에서 제시한 'T71acL 프로모터의 하류에 위치한 T7 RNA Polymerase autogene을 포함하는 플라스미드를 형질전환된 BL21 (DE3) 대장균 세포에 IPTG를 첨가하며 유도되는 T7 RNA Polymerase autogene의 자가촉매 생산에 의해 숙주세포에 치명적인 피해가 발생한다'는 사실을 기반으로 세포를 용해하였다.
상기 세포 또는 상기 용해된 세포를 포함하는 혼합물에서 RNAprotect Bacteria Reagent Handbook (Qiagen, 미국)의 지침에 따라 반딧불 루시퍼라제 관심 mRNA를 포함하는 총 RNA를 분리하여 전기영동하였다(도 9).
본 발명에서는 도 9와 같이 T7 Pol.를 포함하는 BL21 (DE3) 대장균 균주에 autogene인 'pUC19 ctDdRp01 발현단위'를 형질전환하여 얻은 형질전환체 대장균의 무세포 시스템에서 반딧불 루시퍼라제 관심 RNA는 rRNA 수준으로 과량 합성됨을 확인할 수 있었다.
세포에서 외래 RNA 발현은 RNase 내성을 이용한 적절한 분리 방법이 제안될 수 있어 원형 RNA에 적합할 수도 있다.
상기 발현단위는 DNA 및 RNA를 포함하는 핵산에서 선택되어진 어느 하나 이상을 의미한다. 상기 RNA 발현단위는 상기 DNA 발현단위를 체외전사하여 준비할 수 있다.
7.2. 합성 시스템에서 RNA 합성
본 발명은 합성 시스템에서 (Endo DdRp+Capping enzyme 발현단위), (Endo DdRp+saDdRp 발현단위+Capping enzyme 발현단위), (Endo DdRp+sactDdRp 발현단위) 및 (Endo DdRp+saDdRp 발현단위+RdRp 발현단위)를 포함하는 Autogene 시스템에서 선택되어진 어느 하나를 이용한 관심 RNA 합성할 수도 있다. 상기 발현단위는 그 발현산물을 포함하는 의미이다.
본 발명의 합성 시스템은 선택적으로 효모 RNA(Sigma-Aldrich사, 미국)를 첨가하여 세포 RNA로부터 NTP의 합성대사경로 유전자들 산물에 의해 효모 RNA의 분해산물에서 NTP를 습득할 수도 있다.
본 발명에서 <실시례 5.4항>에서 제조한 합성 RNA 반응시스템는 NEBExpress Cell-free E. coli Protein Synthesis System(NEB사, 미국), AccuRapid™ Cell-Free Protein Expression Kit(Bioneer 사, 한국) 및 E. coli S30 Extract System for Linear Templates(Promega 사, 미국), 및 PURExpress In Vitro Protein Synthesis(NEB 사, 미국) 등의 상업화 무세포 단백질 합성 키트를 사용할 수도 있다.
7.2.1. 1차 반응
첫 번째의 RNA 합성의 1차 반응으로, <실시례 5항>에 따라 BL21 (DE3) 세포를 배양하고 25mM lactose(바람직하게, lactose 또는 IPTG의 양은 배양양상에 따라 조절한다) 유도로 T7Pol을 포함되도록 제조된 BL21 (DE3) 무세포 시스템을 (i) 50 mM 트리스, 50 mM NaCl (pH 7.0)를 포함하는 반응 완충용액 또는 (ii) 40 내지 60mM의 인산칼륨, 1 내지 5mM의 MnCl2 및 /또는 10 내지 50mM의 MgCl2(예를 들어, 20mM MgCl2)를 포함하는 인산칼슘 완충용액에 첨가하여 최종농도 30.0 mg/mL 총 단백질이 되도록 1차 반응 합성 RNA 반응시스템을 준비하였다.
두 번째의 RNA 합성의 1차 반응으로, <실시례 5항>에 따라 상기 'pUC19 ctDdRp01 발현단위'(T7 RNA polymerase 유전자와 캡핑효소 유전자가 각각 T7 프로모터의 하류지역에 위치한 발현단위)가 형질전환된 BL21 (DE3) 세포를 배양하고 25mM lactose(바람직하게, lactose 또는 IPTG의 양은 배양양상에 따라 조절한다) 유도를 하여 T7Pol을 포함되도록 제조된 BL21 (DE3) 무세포 시스템을 50 mM 트리스, 50 mM NaCl (pH 7.0)를 포함하는 반응 완충용액 또는 40 내지 60mM의 인산칼륨, 1 내지 5mM의 MnCl2 및 /또는 10 내지 50mM의 MgCl2(예를 들어, 20mM MgCl2)를 포함하는 인산칼슘 완충용액에 첨가하여 최종농도 30.0 mg/mL 총 단백질이 되도록 1차 반응 RNA 반응시스템을 준비하였다.
세 번째의 RNA 합성의 1차 반응으로, 상기 BL21 (DE3) 세포를 배양하고 25mM lactose(바람직하게, lactose 또는 IPTG의 양은 배양양상에 따라 조절한다) 유도를 하여 T7Pol을 포함되도록 제조된 무세포 시스템에 T7 RNA polymerase 유전자와 캡핑효소 유전자가 각각 T7 프로모터의 하류지역에 위치한 발현단위 T7 RNA polymerase 발현단위와 캡핑효소 발현단위를 첨가하여 1차 반응 RNA 반응시스템을 준비하였다.
넷 번째의 RNA 합성의 1차 반응으로, 상기 BL21 (DE3) 세포를 배양하고 25mM lactose(바람직하게, lactose 또는 IPTG의 양은 배양양상에 따라 조절한다) 유도를 하여 T7Pol을 포함되도록 제조된 무세포 시스템에 캡핑효소 유전자가 T7 프로모터의 하류지역에 위치한 캡핑효소 발현단위를 첨가하여 1차 반응 RNA 반응시스템을 준비하였다.
본 1차 반응 RNA 반응시스템에 <실시례 6항>에서처럼 아미노산 혼합물과 에너지 원을 추가할 수도 있다.
본 1차 반응의 합성 시스템은 선택적으로 효모 RNA(Sigma-Aldrich사, 미국)를 첨가하여 효모 NTP의 분해산물에서 NTP를 습득할 수도 있다.
상기 준비된 4종류의 1차 반응 RNA 반응시스템에 각각에 RNase Inhibitor(RI)로 PVSA를 10 mg/mL로 첨가하였다.
상기 배양한 반응용액에 1 ug/mL의 관심 RNA 발현단위인, 반딧불 루시퍼라제 mRNA 발현단위를 추가하고 37℃에서 4시간 이상 배양하는 1차 반응으로 관심 RNA를 포함하는 RNA를 생성하였다.
7.2.2. 2차 반응
RNA 합성의 2차 반응으로 <실시례 5항>에 따라 RNA 중합효소 발현단위인 'pUC19 ctDdRp01 발현단위(T7 RNA polymerase 유전자와 캡핑효소 유전자가 각각 T7 프로모터의 하류지역에 위치한 발현단위)'가 형질전환된 BL21 (DE3) 세포를 배양하였다. 25mM lactose(바람직하게, lactose 또는 IPTG의 양은 배양양상에 따라 조절한다) 유도하여 T7Pol을 포함되도록 제조된 BL21 (DE3) 무세포 시스템을 50 mM 트리스, 50 mM NaCl (pH 7.0) 반응완충용액 또는 40 내지 60mM의 인산칼륨, 1 내지 5mM의 MnCl2 및 /또는 10 내지 50mM의 MgCl2(예를 들어, 20mM MgCl2)를 포함하는 인산칼슘 완충용액에 첨가하여 최종농도 30.0 mg/mL 총 단백질이 되도록 2차 반응 RNA 반응시스템을 준비하였다. 제조한 RNA 반응시스템에 <실시례 5항>에서처럼 아미노산 혼합물과 에너지원을 추가할 수도 있다.
상기 2차 반응 RNA 반응시스템은 상기 준비된 반응 RNA 반응시스템에 RNase A(Sigma Aldrich, 카탈로그 번호: R6513)을 첨가하여 제조하였다. 자세히 살펴보면, 상기 RNA 반응시스템에 RNase A(Sigma Aldrich, 카탈로그 번호: R6513)를 0.75 nM로 첨가하고 2시간동안 배양하여 RNA 분해된 2차 반응 RNA 반응시스템을 제조하였다.
이어서, <표 9>과 같이, 상기 제조된 2차 반응 RNA 반응시스템에 RNase Inhibitor(RI)로 PVSA를 10 mg/mL로 첨가하고, 50 ug/mL의 관심 RNA 발현단위인, 반딧불 루시퍼라제 mRNA 발현단위를 첨가한 후, 무세포 RNA 반응시스템을 제조하여 37℃에서 1시간 동안 배양하였다. 상기 배양한 반응용액에 37℃에서 4시간 이상 배양하는 2차 반응으로 관심 RNA를 포함하는 RNA를 생성하였다.
성분 | 농도 |
무세포 시스템 | 1.75 mg/mL 총단백질 |
PVSA | 10 mg/mL |
반딧불 루시퍼라제 mRNA 발현단위 | 1 ug/mL |
상기 2차 반응에 NMP 혼합물, 황산마그네슘, 에너지원 및 뉴클레오티드 키나제를 포함하는 반응시약을 필요에 따라 더 첨가하여 RNA 합성반응을 할 수도 있다. 선택적으로, 2차 반응의 합성 시스템은 효모 RNA(Sigma-Aldrich사, 미국)를 첨가하여 효모 NTP의 분해산물에서 NTP를 습득할 수도 있다.
7.2.3. 3차 반응
RNA 합성의 3차 반응으로 <실시례 5항>에 따라 BL21 (DE3) 세포를 배양하고 25mM lactose(바람직하게, lactose 또는 IPTG의 양은 배양양상에 따라 조절한다) 유도로 T7Pol을 포함되도록 제조된 BL21 (DE3) 무세포 시스템을 (i) 50 mM 트리스, 50 mM NaCl (pH 7.0)를 포함하는 반응 완충용액 또는 (ii) 40 내지 60mM의 인산칼륨, 1 내지 5mM의 MnCl2 및 /또는 10 내지 50mM의 MgCl2(예를 들어, 20mM MgCl2)를 포함하는 인산칼슘 완충용액에 첨가하여 최종농도 30.0 mg/mL 총 단백질이 되도록 3차 반응 RNA 반응시스템용 무세포 시스템을 준비하였다. 본 3차 반응 RNA 반응시스템에 <실시례 5항>에서처럼 아미노산 혼합물과 에너지원을 추가할 수도 있다.
<재조합 kinase 제조>
먼저, 상기 RNA 중합효소 발현단위와 NTP 대사경로의 kinases 발현단위를 포함하는 설계 발현단위 즉, Cmk, PyrH, Gmk, Ndk, 및 PPK2를 인코딩하는 DNA 각각을 포함하는 플라스미드(발현단위)가 형질전환된 BL21 (DE3) 세포를 배양하였다.
상기 세포를 수확하고 25mM lactose(바람직하게, lactose 또는 IPTG의 양은 배양양상에 따라 조절한다)를 포함하는 배양용액을 첨가하여 추가 배양하여 염색체에 있는 T7 RNA Polymerase를 발현하고 이어서 연쇄적으로 상기 RNA 중합효소 발현단위의 T7 RNA Polymeraseautogene 및 T7 프로모터의 하류에 있는 NTP 대사경로의 kinases 발현단위를 포함하는 설계 발현단위 즉, Cmk, PyrH, Gmk, Ndk, 및 PPK2를 인코딩하는 DNA의 무한증폭을 유도하여 세포용해를 유도할 수도 있다. 상기 배양한 세포를 원심분리도 수확한 후 세포 용해물을 제조하였다.
상기 제조한 세포 용해물을 50 mM 트리스, 50 mM NaCl (pH 7.0) 반응완충용액 또는 40 내지 60mM의 인산칼륨, 1 내지 5mM의 MnCl2 및 /또는 10 내지 50mM의 MgCl2(예를 들어, 20mM MgCl2)를 포함하는 인산칼슘 완충용액에 첨가하여 최종농도 30.0 mg/mL 총 단백질이 되도록 3차 반응 자체 제작 RNA 반응시스템을 준비하였다.
또는 상기 상업화 무세포 단백질 합성 키트는 NEBExpress Cell-free E. coli Protein Synthesis System(NEB사, 미국), AccuRapid™ Cell-Free Protein Expression Kit(Bioneer 사, 한국) 및 E. coli S30 Extract System for Linear Templates(Promega 사, 미국) 및 PURExpress In Vitro Protein Synthesis(NEB 사, 미국) 등에서 선택하여 사용할 수도 있다. 본 실시례에서는 AccuRapid™ Cell-Free Protein Expression Kit(Bioneer 사, 한국)를 사용하였으며 제품의 지침서에 따라 상기 RNA 중합효소 발현단위와 설계 발현단위의 발현산물인 효소 혼합물(반응무세포 시스템)을 제조하였다.
상기 발현단위는 DNA 및 RNA를 포함하는 핵산에서 선택되어진 어느 하나 이상을 의미한다. 상기 RNA 발현단위, RNA는 상기 DNA 발현단위를 체외전사하여 준비할 수 있다.
상기 NTP 대사경로의 kinases는 N-말단 헥사히스티딘 태그를 갖는 T7 RNA 중합효소를 과다발현한 무세포 시스템에서 Fast 단백질 액체 크로마토그래피(Fast Protein Liquid Chromatography: FPLC)에 의해서 정제시킬 수도 있다.
상기 RNA 중합효소 발현단위와 설계 발현단위는 동일한 반응시스템에서 배양할 수 있으나 각기 다른 별도의 반응시스템에서 배양할 수도 있다. 전자는 통합 반응구 및 후자는 RNA 중합효소 반응구와 설계 DNA 반응구라고 하였다.
<세포유래 NTP 제조>
상기 3차 반응 자체 제작 무세포의 총단백질을 정량하고 <실시례 6항>에서 최종농도가 제조한 20% v/v, 각각 4mM NMP 혼합물, 및 13 mM Sodium Hexametaphosphate(SHMP)을 이 되도록 추가하여, 12시간 동안 배양하고 NTP를 포함하는 무세포 시스템을 준비하였다.
또는 AccuRapid™ Cell-Free Protein Expression Kit(바이오니아, 한국)의 무세포 시스템에 RNA 중합효소 발현단위와 NTP 대사경로의 kinases 발현단위를 포함하는 설계 발현단위 즉, Cmk, PyrH, Gmk, Ndk, 및 PPK2를 인코딩하는 DNA를 포함하는 플라스미드(발현단위) 또는 직선형 PCR 산물 발현단위를 각각, 50 mM 트리스, 50 mM NaCl (pH 7.0) 중에서 동일한 비율로 혼합하고 각각 최종농도 10 ug/mL로 첨가하며, <실시례 6항>에서 최종농도가 제조한 20% v/v, 각각 4mM NMP 혼합물 및 13 mM Sodium Hexametaphosphate(SHMP)이 되도록 추가하여, 37℃에서 12시간 동안 배양하고 RNase을 첨가하여 1시간 배양한 후, 총단백질을 정량하여 상기 3차 RNA 반응시스템용 무세포 시스템에 첨가하여 3차 RNA 반응시스템를 제조하였다. 상기 DNA 유형 발현단위 대신에 RNA 유형 발현단위를 첨가할 수도 있다.
제조된 NMP 혼합물(20% v/v, 각각 4mM), RNA 중합효소 발현단위 및 NTP 대사경로의 kinase 발현단위 및 그들 발현산물을 포함하는 반응무세포 시스템을 Vivaflow 50(Sartorius 사, 독일)로 TFF(Tangential Flow Filtration)을 하여 NTP를 습득할 수도 있다. 상기 제조된 NTP 용액에 변형된 NTP를 첨가하여 혼합한 NTP용액으로 제조된 RNA는 RNase에 대한 저항성이 있어 상기 제조된 RNA의 안정성을 확보할 수도 있다.
또한, 상기 NTP 합성대사경로의 kinase 발현단위 및 그들 발현산물에서 선택된 1종 이상을 포함하는 NTP 시스템은 무세포 단백질 합성 시스템에 내재된 RNase에 의해 분해되는 RNA에서 유래하는 NM(D)P를 NTP로 인산화하여 재생 NTP를 시스템에 제공할 수도 있다. 상기 NTP 시스템을 구성하는 PPK2는 NM(D)P를 Hexametaphosphate(SHMP)를 포함하는 인중합체를 사용하여 NTP를 제공할 수 있다. PPK2 군에서 Class III PPK2룰 선정할 수도 있다.
<재조합 T7 RNA Polymerase와 캡핑효소 제조>
RNA 중합효소 발현단위와 캡핑효소 발현단위 각각을 포함하는 설계발현단위 포함하는 플라스미드(발현단위)가 형질전환된 BL21 (DE3) 세포를 배양하였다. 상기 세포를 수확하고 25mM lactose(바람직하게, lactose 또는 IPTG의 양은 배양양상에 따라 조절한다)를 포함하는 배양용액을 첨가하여 추가 배양하여 염색체에 있는 T7 RNA Polymerase를 발현하고 이어서 연쇄적으로 상기 RNA 중합효소 발현단위의 T7 RNA Polymeraseautogene 및 T7 프로모터의 하류에 있는 캡핑효소를 인코딩하는 DNA의 무한증폭을 유도하거나 원심분리하여 세포용해물을 제조하였다.
또는 RNA 중합효소 반응구는 RNA 발현단위 및 캡핑효소 발현단위를 AccuRapid™ Cell-Free Protein Expression Kit의 무세포 시스템에 첨가하여 12시간동안 배양하고 RNA 중합효소를 포함하는 반응무세포 시스템을 준비하고 총단백질을 정량하여 RNA 중합효소 발현단위 및 그 발현산물을 포함하는 반응무세포 시스템을 제조하였다.
상기 RNA 중합효소 또는 캡핑효소는 N-말단 헥사히스티딘 태그를 갖는 T7 RNA 중합효소를 과다발현한 무세포 시스템에서 Fast 단백질 액체 크로마토그래피(Fast Protein Liquid Chromatography: FPLC)에 의해서 정제시킬 수도 있다. 즉, 상기 RNA 중합효소는 헥사히스티딘-태깅되고, 고정 금속 친화도 크로마토그래피 (immobilized metal affinity chromatography)에 의해서 정제될 수도 있다. 상기 DNA 유형 발현단위 대신에 RNA 유형 발현단위를 첨가할 수도 있다.
<관심 RNA 제조>
세포유래 NMP에서부터 RNA를 합성하기 위한 반응조성물은 <표 10>에 제시하였으며, (i) NMP 혼합물, (ii) RNA 중합효소 발현반위 및 NTP 합성대사경로의 kinase 발현단위 및 그들 발현산물을 포함하는 무세포 시스템, 및 (iii) RNA 중합효소 발현단위 및 그 발현산물을 포함하는 무세포 시스템을 각각 일정 양을 첨가하여 혼합한 후, Sodium Hexametaphosphate(SHMP), MgS04, PVSA 및 주형으로 반딧불 루시퍼라제 mRNA 발현단위을 첨가하여 3차 반응 RNA 반응시스템을 제조하였다. 한 튜브에서 세포 RNA에서부터 NMP 제조, 제조된 NMP를 인산화한 NTP의 제조 및 제조된 NTP을 중합하는 RNA의 제조를 한 튜브에서 진행할 수 도 있다.
또한 상기 제조한 NTP에서부터 RNA를 합성하기 위한 반응조성물로 <표 11>처럼, 구성성분을 첨가하여 3차 반응 RNA 반응시스템을 제조하였다.
RNase 불활성되는 조건은 상기 <표 10>에서 미정제된 반응무세포를 사용한 3차 반응 RNA 반응시스템을 구성할 경우는 PVSA를 10 mg/mL을 첨가하였으며, <표 11>에서 정제된 반응무세포를 사용한 3차 반응 RNA 반응시스템을 구성할 경우는 PVSA를 0.15 mg/mL을 첨가하였다.
상기 제조한 3차 반응 RNA 반응시스템을 37℃에서 4시간 이상 배양하는 3차 반응을 실시하여 관심 RNA를 생성하였다.
성분 | 농도 |
NMP 혼합물 | 20% v/v, 각각 4mM |
RNA 중합효소 발현반위 및 NTP 합성대사경로의 kinase 발현단위 및 그들 발현산물을 포함하는 무세포 시스템 | 1.75 mg/mL 총단백질 |
RNA 중합효소 발현단위 및 그 발현산물을 포함하는 무세포 시스템 | 1.75 mg/ml 총단백질 |
Sodium Hexametaphosphate(SHMP) | 13 mM |
MgS04 | 45 mM |
PVSA | 0.15 - 15 mg/mL |
반딧불 루시퍼라제 mRNA 발현단위 | 1 ug/mL |
성분 | 농도 |
NMP 혼합물(20% v/v, 각각 4mM), Sodium Hexametaphosphate(SHMP), RNA 중합효소 발현반위 및 NTP 합성대사경로의 kinase 발현단위 및 그들 발현산물을 포함하는 무세포 시스템 또는 상기 반응용액의 TFF 정제산물 | 1.75 mg/mL 총단백질 |
RNA 중합효소 발현단위 및 그 발현산물을 포함하는 무세포 시스템 또는 상기 반응용액의 FPLC 정제산물 | 1.75 mg/ml 총단백질 |
MgS04 | 45 mM |
PVSA | 0.15 - 15 mg/mL |
반딧불 루시퍼라제 mRNA 발현단위 | 1 ug/mL |
상기 1차, 2차와 3차의 반응산물의 RNA는 캡핑 반딧물 루시퍼라제 RNA와 캡핑되지 않은 반딧물 루시퍼라제 RNA로 구성될 수도 있다.
특히 NTP 합성대사경로의 kinase 발현단위 및 그들 발현산물을 포함하는 NTP 시스템은 무세포 시스템에 내재된 RNase에 의해 분해되는 RNA에서 유래하는 N(M)DP를 NTP로 인산화하여 재생 NTP를 제공하도록 하였다.
이어서, TURBO DNase (Thermo Fisher)로 처리하여 RNA 주형 DNA를 제거하였다.
여기서, 5종류의 키나제를 포함하는 플라스미드(발현단위)들을 대신하여 상응하는 발현산물(RNA 또는 단백질), 효소 또는 이들을 포함하는 합성 반응시스템을 첨가할 수도 있으며. 이 때 RI가 처리된 무세포 시스템의 총단백질 양을 고려해야 한다.
<표 11>에서 NMP 혼합물, Sodium Hexametaphosphate(SHMP) 및 5종류의 키나제를 포함하는 플라스미드들을 포함하는 무세포 반응시스템을 대신하여 정제된 상기의 합성된 NTP 혼합물, 반딧불 루시퍼라제 RNA 전사시스템 및 RI가 처리된 합성 반응시스템을 혼합하여 반응을 할 수도 있다.
슈도유리딘화는 상기 피로코커스 푸리오서스로부터의 UMP 키나제(PyrH)를 포함하는 플라스미드 대신에 슈도유리딘를 반응용액에 첨가하여 전사과정중에 UTP 대신에 pseudouridine를 포함한 RNA를 제조할 수도 있다.
상기 반딧불 루시퍼라제 RNA 전사시스템은 RNA 중합효소 발현단위와 반딧불 루시퍼라제 RNA 발현단위로 구성되며, 상기 실시례에서 제작된 RNA 중합효소 발현단위는 ctDdRp 및 DdRp 군에서 어느 하나 또는 상기에 어느 하나에 RdRp를 포함하는 발현단위 등으로 제작하였다. 또한, 상기 제조된 관심 RNA 발현단위는 mRNA로 반닷불 루시퍼라제, EPO, GM-CSF와 RSV-F mRNA 등이며 dsRNA는 CPB dsRNA와 DV49 dsRNA 등을 포함하여 제작하였다.
상기 관심 RNA 전사시스템에서 RNA 중합효소 발현단위에서 ctDdRp 유전자 대신 DdRp 유전자 또는 RdRp 유전자로 구성된 RNA 중합효소 발현단위를 사용하여 각각에 상응하는 관심 RNA 발현단위에서 관심 RNA를 생산할 수도 있다.
본 실시례에서 사용하는 본 발명의 RNA 중합효소 발현단위와 관심 RNA 발현단위를 포함하는 관심 RNA 전사시스템 및 5종류의 키나제 발현단위를 포함하는 설계 DNA 세트를 각각에 상응하는 바이오틴이 부착된 프라이머를 사용하여 이들을 주형으로 PCR하여 제조한 바이오틴이 부착된 PCR 산물을 사용할 수 있다. 이 경우에 바이오틴이 부착된 PCR 산물은 다양한 방법으로 반응용액에서 일정시간이 경과한 후 이들을 제거할 수도 있다.
mRNA, saRNA(자가 증폭 RNA) 및 원형 RNA 등을 포함하는 RNA를 생산하는 경우는 RNA 중합효소 반응구, 설계 DNA 반응구와 3차 반응 RNA 반응시스템을 동일한 반응조를 사용할 수도 있으며 원형 RNA 경우는 RNase 내성이 있어 이에 더 적합할 수도 있다.
실시예 8. RNA 정제
8.1. RNA 정제를 위한 LiCl 침전
상기 합성이 종료된 RNA 반응용액, 즉 실시례 7항에서의 1차, 2차 및 3차 반응산물 각각에 LiCl 용액을 최종농도 0.5M로 첨가하여 잘 섞고 -20°C에서 30분 동안 처리하였다. RNA를 펠렛화하기 위해 최고 속도로 4°C에서 15분 동안 원심분리하였다. 상층액을 제거하고 얼음처럼 차가운 70% 에탄올 500 μl로 펠렛을 세척하였다. 500 μl 멸균 증류수에서 합성된 RNA를 현탁하고 공지된 EtOH 침전방법으로 PVSA를 RNA 용액에서 제거한 후 50 μl 멸균 증류수로 재현탁하였다.
8.2. 캡핑 mRNA 회수
상기 1차, 2차와 3차 반응산물의 재현탁 용액에 있는 RNA는 캡핑 RNA와 캡핑되지 않은 RNA로 구성된다. 관심 RNA 전사시스템의 RNA 중합효소 발현단위를 RdRp 또는 ctDdRp를 사용하는 경우는 설계된 발현단위들의 조합에서 예상이 되는 반응산물의 재현탁 용액에 있는 캡핑 RNA는 캡핑 반딧물 루시퍼라제 mRNA이고 반응산물의 재현탁 용액에 있는 캡핑되지 않은 RNA는 1차와 2차 반응산물은 ctDdRp mRNA 및 반딧물 루시퍼라제 mRNA이고 3차 반응산물은 ctDdRp mRNA, 5종류의 Kinase mRNA 및 반딧물 루시퍼라제 mRNA이다.
상기 재현탁 용엑에서 캡핑 RNA만을 확보하기 위해서, 효소 방법과 캡구조 결합단백질 방법을 사용할 수 있다. 효소 방법은 5'-polyphosphatase와 Ribonuclease 1 (Xrn1) 또는 RNA 5'Pyrophosphohydrolase (RppH)와 RNase E를 이용하는 것이다. 또한 캡구조 결합 단백질 eIF4E을 이용하여 Capped RNA를 정제할 수도 있다.
<표 12>와 같이 상기 재현탁 용액에 5'-polyphosphatase (Epicentre, 미국)와 Xrn1 (NEB, 미국)를 처리하였다. 캡핑되지 않은 RNA, 즉, ctDdRp mRNA, T7Pol mRNA, 5종류의 Kinase mRNA 및 반딧물 루시퍼라제 mRNA는 5'-폴리포스파타제에 의해 5'-ppp-mRNA에서 피로포스페이트를 방출하여 5'-p-mRNA로 생성하였다. 표 8과 같이 준비한 반응물을 37℃에서 30분 동안 인큐베이션하였다
Compound | C stock | Volume [μL] | C final |
ddH2O | ad 20μL | ||
5′-polyphosphatase reaction buffer | 10× | 2 | 1× |
mRNA | max 5μg | ||
5′-polyphosphatase (Epicentre) | 20 U/μL | 1 | 1 U/μL |
상기로 준비된 생성된 5'-p-mRNA는 엑소리보뉴클레아제인 Xrn1(NEB, 미국)의 연속적인 작용으로 5'-p-mRNA의 5'→3' 분해에 의해 제거하였다. 5'-p-mRNA RNA의 5' → 3' 분해를 위해 2.5μL의 MgCl 2 (50mM, 5.3mM 최종 농도) 및 1μL XRN1(1U/μL, 0.04U/μL 최종 농도)이 사용하였다. 반응용액에 첨가하고 추가로 1시간 동안 37℃에서 인큐베이션하였다.
이어서, EDTA를 최종농도 0.1 mM 되도록 상기 용액에 첨가하여 -20°C 이하에서 보관하였다.
비교구로 시험관내 전사(IVT) 키트(Thermo Fisher Scientific 사, 미국)의 지침으로 제조한 반딧불 루시퍼라제 mRNA 그리고 실험군으로 1차, 2차 및 3차 반응으로 전사하고 DNase 처리를 한 RNA를 LiCl 침전하여 수확한 후, 5'-폴리포스파타제 및 Xrn1 처리된 1차 정제된 CFR 반딧불 루시퍼라제 mRNA를 65℃에서 5분 동안 처리하고 전기영동하기 전까지 4℃에 처리한 후, 아가로즈 젤에서 전기영동한 결과이다(도 11). 여기서 상기 4종류의 1차 반응 조건에서 넷번째 조건에서 얻은 반응산물 및 2종류의 3차 반응 조건에서 <표 11>의 반응조건에서 얻은 산물을 분석한 결과이다.
실험군의 전사반응이 종결된 1차, 2차 및 3차의 반응산물 RNA는 캡핑 RNA 및 캡핑되지 않은 RNA로 구성된다. 상기 반응산물의 캡핑 RNA는 캡핑 반딧물 루시퍼라제 mRNA이고 반응산물의 캡핑되지 않은 RNA는 ctDdRp mRNA, T7Pol mRNA, 5종류의 Kinase mRNA의 설계 DNA 세트 및 반딧물 루시퍼라제 mRNA이다. 캡핑되지 않은 RNA들은 5'-폴리포스파타제와 Xrn1의 연속적인 작용에 의해 제거된다. 궁극적으로 존재하는 RNA는 관심 RNA인 캡핑구조가 있는 반딧물 루시퍼라제 mRNA의 밴드만을 관찰할 수 있다(도 11).
또한, 대조군은 IVT mRNA 및 실험군은 실시례 6항에서의 1차, 2차 및 3차 반응산물로 산물의 크기는 대조군 및 실험군이 모두 동일하며 반응조건에 따라 생산되는 양은 1차 반응산물 < 2차 반응산물 < 3차 반응산물 순이다. 이런 결과는 반응조성물을 구성하는 NTP 농도가 중요한 요소로 판단할 수 있었다.
캡핑 mRNA 회수는 음이온 교환 크로마토그래프 또는 Oligo d(T) column 정제 과정의 용출 한 후에 상기 효소 반응을 실시할 수도 있다.
8.3. 음이온 교환 크로마토그래피에 의한 RNA 정제
상기 제조된 RNA는 80°C에서 작동되는 CIMmultus PrimaS 1 mL Monolithic Column (2 μm)(Sartorius 사, 독일)에서 음이온 교환 크로마토그래피를 사용하여 정제하였다. 컬럼은 20mM Tris pH 8.0 및 5M Urea(실온에서 pH 8.0으로 조정됨)를 포함하는 완충액에서 실행하였다. 다른 길이의 RNA는 NaCl 구배로 용리하였다. 분리하고자 하는 각각의 RNA 길이에 따라 염 구배를 설계하였다. RNA 함유 분획을 우레아-PAGE를 사용하여 분석하고, LiCL로 침전시켰다. 침전 후, 미리 포장된 PD-10 탈염 컬럼(GE Healthcare)을 사용하여 RNA를 탈염하고 후속적으로 스피드백 장치를 사용하여 농축하였다.
8.4. Oligo d(T) column에 의한 RNA 정제 및 분석
CFR 반응후, 염화리튬 침전으로 정제된 mRNA 또는 회수된 캡핑 mRNA는 oligo d(T) column으로 2차 정제하였다. CIMmultus Oligo dT 모노리스(Sartorius, 독일)는 방사형 흐름 크로마토그래피 장치로 베드실린더의 외부에서 내부로 흐름을 분산시키도록 설계되어 있다.
장치 제공사에서 제공하는 버퍼로 완충액 A는 평형화/세척 완충액. 50mM 인산나트륨, 250mM 염화나트륨, 5mM EDTA, pH 7.0; 완충액 B. 두 번째 세척 완충액는 50mM 인산나트륨, 5mM EDTA, pH 7.0; 완충액 C. 용출 완충액는. 10mM 트리스, pH 8.0.; 완충액 D. 세척 완충액는 3M 구아니딘-HCl, 5mM EDTA, pH 7.0이다
샘플 및 준비: 샘플 pH는 대략 중성이어야 한다. 샘플에 염이 부족하거나 염 농도가 낮으면 염화나트륨을 최종 농도가 약 250mM이 되도록 조절한다. 또한 EDTA를 5mM 이상으로 추가한다. 미립자는 주입 전에 원심분리 또는 여과(0.45μm)로 제거하였다.
버퍼 A로 컬럼 평형화: 출력 pH 및 전도도가 입력 버퍼와 동일할 때까지 컬럼을 통해 평형 버퍼(A)를 분당 컬럼 부피 5 CV/분 유속으로 펌핑하였다.
완충액 A로 세척 1: 평형 완충액 10 CV.
완충액 B가 있는 세척 2: 10 CV 두 번째 세척 완충액.
버퍼 C로 용출: UV 흡광도가 기준선으로 돌아올 때까지.
완충액 D로 세척하는데, 매 실행 후 최소 10 CV의 세척 완충액으로 처리하였다. 세척 분획에 다량의 RNA가 있으면 용리 완충액의 조성을 최적화해야 할 필요가 있음을 나타낼 수 있다.
장치 제공사의 운영지침을 근거하여 CIMmultus Oligo dT이 장착되는 방사형 흐름 크로마토그래피 장치의 운영 환경을 본 과제의 CFR mRNA 정제에 pH, 온도 및 염을 최적화하였다.
Oligo d(T) column 정제 과정의 버퍼 C를 사용하는 용출 단계 종료한 후 얻은 용출용액에서 캡핑 mRNA 회수를 하기 위한 상기 효소 반응을 실시할 수도 있다.
목적하는 mRNA를 포함하는 분획을 풀링하고, 미리 습윤된 30kDa 컷오프 원심 필터(예를 들어, Amicon UFC903096)를 사용하여 농축한 mRNA 샘플을 표준 기술에 따라 LiCl로 침전시켰다.
1차 정제된 CFR mRNA 또는 2차 정제된 CFR mRNA를 문헌[Karikσ et al., 2011, "Generating the optimal mRNA for therapy: HPLC purification eliminates immune activation and improves translation of nucleoside-modified, protein-encoding mRNA." Nucleic Acids Research, 39(21), e142]에 따라서 면역블로팅 기술을 사용하여 dsRNA에 대해서 시험할 수 있다.
1차 정제된 CFR mRNA 및 2차 정제된 CFR mRNA는 EndoSafe-MCS 시스템(찰스 리버 래보러토리즈사(Charles River Laboratories), 제조사 지침로 엔도톡신에 대해서도 시험하고, IVT를 통해 생성된 1차 정제된 mRNA 또는 2차 정제된 mRNA와 비교하였다. 1차 정제 및 2차 정제 생성물을 아래와 같이 질량 기반 순도 분석을 수행할 수 있다.
잔류 단백질을 키트 지침에 따라 바이신코닌산(BCA) 검정 키트(Thermo Fisher 사, 미국)로 정량할 수 있다.
잔류 양이온을 문헌[Thomas et al., 2002, "Determination of inorganic cations and ammonium in environmental waters by ion chromatography with a high-capacity cation-exchange column." Jou RNAl of Chromatography A, 956(1-2), 181-186]의 방법으로 정량할 수 있다.
잔류 음이온을 문헌[Boyles, 1992, "Method for the analysis of inorganic and organic acid anions in all phases of beer production using gradient ion chromatography." Jou RNAl of the American Society of Brewing Chemists, 50(2), 61-63]의 방법으로 정량할 수 있다.
잔류 뉴클레오타이드를 문헌[Edelson et al., 1979, "Ion-exchange separation of nucleic acid constituents by high-performance liquid chromatography." Jou RNAl of Chromatography A, 174(2), 409-419; 및 Hartwick et al., 1975, "The performance of microparticle chemically-bonded anion-exchange resins in the analysis of nucleotides." Jou RNAl of Chromatography A, 112, 651-662]의 방법으로 정량할 수 있다.
하기 실시례에서는 ctDdRp 발현단위와 반딧불 루시퍼라제 발현단위를 포함하는 관심 RNA 전사스템을 추가적인 분석을 진행하였다.
실시예 9. 무세포에서 루시퍼라제 DNA의 발현
반딧불 루시퍼라제를 암호화하는 mRNA를 코딩하는 DNA 발현 플라스미드를 <표 10>의 3차 반응공정을 사용하여 반딧불 루시퍼라제를 제조하였다. <표 10>을 구성하는 반응조성물에서 PVSA은 0.43mg/ml을 넣고 나머지는 제시한 대로 처리한 1-Step Human Coupled IVT Kit(Thermo Fisher 사, 미국)의 HeLa 세포에서 얻은 용해물에서 제조사의 지침에 따라 단백질 합성을 실시하였다.
반응용액에 있는 1-Step Human Coupled IVT Kit(Thermo Fisher 사, 미국)의 HeLa 세포에서 얻은 용해물에서 유래하는 RNA 분해효소에 의해 생성되는 RNA 분해산물인 NM(D)T는 <표 10>에서처럼 제공되는 NTP 합성대사경로의 kinase 발현단위 및 그들 발현산물을 포함하는 무세포 시스템에 의해 인산화되어 NTP를 재생할 수도 있다. 즉, 상기 NTP 합성대사경로의 kinase 발현단위 및 그들 발현산물에서 선택된 1종 이상을 포함하는 NTP 시스템은 무세포 단백질 합성 시스템에 내재된 RNase에 의해 분해되는 RNA에서 유래하는 NM(D)P를 NTP로 인산화하여 재생 NTP를 시스템에 제공할 수도 있다. 상기 NTP 시스템을 구성하는 PPK2는 NM(D)P를 Hexametaphosphate(SHMP)를 포함하는 인중합체를 사용하여 NTP를 제공할 수 있다. PPK2 군에서 Class III PPK2룰 선정할 수도 있다.
반딧불 루시퍼라제의 발현은 Steady-Glo Luciferase Assay System(Promega, 미국)키트 지침에 따라 측정하였다. 반딧불 루시퍼라제를 GloMax™ 20/20 Luminometers(Promega, 미국)로 측정하였고, Promega 키트로 판독값을 확보하였다.
캡핑되고 DNase 처리된 mRNA가 투여된 전사-번역을 하는 1-Step Human Coupled IVT Kit(Thermo Fisher 사, 미국)에서 기능성 루시페라아제를 생성하였다.
실시예 10. 루시퍼라제 mRNA의 발현
10.1. 무세포에서 발현
반딧불 루시퍼라제를 암호화하는 mRNA를 <표 11>의 3차 반응공정을 사용하여 반딧불 루시퍼라제를 제조하였다. 특히 NTP 합성대사경로의 kinase 발현단위 및 그들 발현산물을 포함하는 NTP 시스템은 무세포 시스템에 내재된 RNase에 의해 분해되는 RNA에서 유래하는 N(M)DP를 NTP로 인산화하여 재생 NTP를 제공하도록 할 수도 있다. 500ng의 캡핑된, DNase 처리된 반딧불 루시퍼라제 mRNA(순도에 대해 보정됨) 및 0.43mg/ml PVSA을 이용하여 HeLa 세포에서 얻은 용해물로 이루어지고 단백질 합성을 하는 1-Step Human Coupled IVT Kit(Thermo Fisher 사, 미국)의 지침에 따라 단백질 합성을 실시하였다. 반딧불 루시퍼라제의 발현은 Steady-Glo Luciferase Assay System(Promega, 미국)키트 지침에 따라 측정하였다. 반딧불 루시퍼라제를 GloMax™ 20/20 Luminometers(Promega, 미국)로 측정하였고, Promega 키트로 판독값을 확보하였다.
캡핑되고 DNase 처리된 mRNA가 투여된 전사-번역을 하는 1-Step Human Coupled IVT Kit(Thermo Fisher 사, 미국)에서 기능성 루시페라아제를 생성하였다.
또한, 기능성 루시페라아제를 HEK 293 세포에서 분석하였다. HEK 293 세포에 반딧불 루시퍼라제를 암호화하는 mRNA 0.1㎍을 리포펙틴(Invitrogen, 미국) 복합화의 지침에 따라 형질주입에 사용하였다. 상기 반응용액을 30°C에서 60~90분 동안 그런 다음 합성된 반딧불 루시퍼라제를 GloMax™ 20/20 Luminometers(Promega, 미국)를 사용하여 분석하였다. HEK 293 세포에서 루시퍼라제 mRNA는 형질주입 조건에 관계없이 높은 수준의 루시페라제 발현을 생성하였다.
10.2. 생체내 발현
반딧불 루시퍼라제를 암호화하는 mRNA를 <표 11>의 3차 반응공정을 사용하여 , 반딧불 루시퍼라제 mRNA를 LiCl 용액으로 수확하였다.
96웰 플레이트의 웰당 0.8μl의 리포펙틴 및 0.1 내지 1.0μg의 반딧불 루시페라제 mRNA를 사용하여 리포펙틴(Invitrogen, 미국) 복합화를 수행하였다. TransIT mRNA(TransIT)(Mirus Bio, 미국)에 대한 mRNA의 복합화는 18μl DMEM의 최종 부피에서 TransIT 시약, TransIT mRNA(0.34μl) 및 Boost(0.22μl)와 0.1 또는 0.3μg 반딧불 루시페라제 mRNA를 결합하는 제조업체의 지침에 따라 수행하였다. 이는 단일 96웰 세포에 추가하였다.
LiCl 용액으로 수확된 1-메틸슈도우리딘 함유 반딧불 루시페라제 mRNA는 pH 4.0의 mRNA 수용액을 에탄올에 용해된 지질 용액과 빠르게 혼합하는 자가 조립 과정을 사용하여 LNP에 캡슐화하였다. 제조사 지침에 따라 NanoAssemblr Benchtop 미세유체 혼합기(Precision Nanosystems, 미국)를 사용하여 생성하였다. 사용된 LNP는 D-Lin-MC3-DMA, 이온화 가능한 양이온성 지질/포스파티딜콜린/콜레스테롤/PEG-지질(50:10:38.5:1.5 mol/mol), 캡슐화된 RNA 대 총 지질 비율은 ~0.05(wt/wt)이고 직경은 ~80nm이었다. mRNA-LNP 제형은 ~1μg/μl의 mRNA 농도에서 -80°C에서 저장하였다.
준비된 반딧불 루시퍼라제 mRNA-LNP 제형을 3마리의 BALB/c 마우스의 실험군에 40, 15 또는 5㎍의 단일용량으로 예비시험을 하고, 선정된 5㎍의 단일용량으로 피내(intradermal), 피하(subcutaneous) 및 근육내(intramuscular) 투여를 하였다.
생물발광 이미징은 IVIS Spectrum 이미징 시스템(Caliper Life Sciences, 미국)을 사용하여 수행하였다. 마우스에 D-루시페린(Regis Technologies)을 150 mg/kg의 용량으로 복강내 투여하였다. 마우스를 3% 이소플루란(Piramal Healthcare Limited)이 있는 챔버에서 D-루시페린을 받은 후 마취하고 노즈 콘을 통해 2% 이소플루란을 유지하면서 이미징 플랫폼에 놓았다. 마우스를 D-루시페린 투여 후 5분에 5초 이상의 노출 시간을 사용하여 영상화하여 획득한 신호가 효과적인 검출 범위(노이즈 수준 초과 및 CCD 포화 한계 미만) 내에 있는지 확인하였다. 생물발광 값은 Caliper에서 제공하는 Living IMAGE 소프트웨어를 사용하여 생물발광 신호가 발산되는 관심 영역에서 광자 플럭스(광자/초)를 측정하여 정량화하였다.
다양한 경로로 주사된 마우스에서 mRNA-LNP의 기간에 따른 발현 양상은 도 12에 피내(id), 피하(sc) 및 근육내(im) 경로에 의해 5.0μg mRNA-LNP를 주입한 3마리의 BALB/c 마우스 그룹의 대표적인 IVIS 이미지이다.
피내 및 피하 mRNA-LNP 전달은 주사 부위에서만 단백질 생성을 발생하였다(도 10). 능동 번역 기간은 각각 피하 및 피내 공간에서 3일 및 6일 동안 관찰되었다(도 12). mRNA-LNP가 근육내 주사되었을 때, 루시페라제 활성의 많은 부분이 간에 검출 가능하여 나노입자의 전신적 확산을 관찰할 수 있었다. 또한 간에서 생성된 높은 수준의 단백질은 주사 후 2일째에 대부분의 번역이 중단되는 짧은 기간 동안 발생하였다(도 12). 흥미롭게도, 상당한 생물발광 신호가 폐와 근육에서도 측정될 수 있었으며 후자는 주사 후 최대 6일 동안 지속되었다.
실시예 11. 다양한 뉴클레오타이드 공급원으로부터의 mRNA의 생산
반딧불 루시퍼라제를 암호화하는 mRNA를 세포 RNA-유래 뉴클레오타이드를 사용하거나 정제된 뉴클레오사이드 모노포스페이트를 사용하여 CFR에 의해 생산하였다. 세포 RNA-유래 뉴클레오타이드 혼합물의 경우는 상기 <실시예 7항>에 따라 실시하여 mRNA를 생성하였다.
상기 세포 RNA-유래 뉴클레오타이드는 <실시례 5항>에서 제조된 무세포 시스템인 반응시스템에 1.5g/L baker's yeast RNA(Sigma-Aldrich사, 미국), <표 7>에 있는 RNase, NTP 대사경로의 kinase를 포함하는 설계 발현단위를 첨가하여 12시간 반응한 후, 반응하여 얻은 세포 RNA의 분해산물 뉴클레오사이드 모노포스페이트 및 내재된 NMP, NDP, 및 NTP를 Vivaflow 50, 3,000 MWCO PES(#VF05P9)가 장착된 Vivaflow 50 Cross Flow Cassette(Sartorius)를 사용하여 58.8 mM 이염기성 인산칼륨 버퍼에 대해 한외여과시켜 농축하여 100mM NTP 혼합물을 준비하였다.
<실시례 5항>에서 제조된 무세포 시스템인 반응시스템을 Slide-A-Lyzer™ G2 dialysis cassette, 10K MWCO, 3 mL (Thermo Fisher Scientific, Waltham, MA, USA)을 이용한 표준방법으로 4℃에서 30분씩 4번 상기 58.8 mM 이염기성 인산칼륨 버퍼에서 투석하여 세포 RNA의 분해산물 뉴클레오사이드 모노포스페이트 및 내재된 NMP, NDP, 및 NTP를 제거하는 전처리를 수행한 후, RI가 처리되고 T7 Pol.가 있는 무세포 시스템, 상기 정제된 NTP 혼합물, 마그네슘, 소듐 헥사메타포스페이트(HMP) 및 관심 RNA 전사시스템을 첨가하여 반응물을 37℃에서 2시간 동안 추가로 배양하여 mRNA를 생성하였다. 대조군으로서, 동일한 서열을 통상적인 시험관내 전사(IVT)에 의해 합성하였다.
상기 반응물을 DNase-처리하고, RNA를 LiCl 침전에 의해 정제하고, RNA 품질을 BioAnalyzer(Agilent 사, 미국)를 사용하여 전기영동에 의해 평가하였다(도 13). 도 13a는 순도에 대한 참조로서 캡핑된 IVT-생산된 mRNA의 전기영동도이고, 도 13b는 세포 RNA-유래된 뉴클레오타이드를 사용한 캡핑된 CFR-생산된 mRNA의 전기영동도이며, 도 13c는 각각 5mM의 정제된 뉴클레오사이드모노포스페이트(AMP, CMP, GMP 및 UMP)의 동일 몰량 혼합물을 사용한 캡핑된 CFR-생산된 mRNA의 전기영동도이다. CFR 반응인 13b, c의 전기영동 결과는 IVT 방식에 의한 도 13a와 유사하게 형성되었다. 또한, CFR에 의해서 생산된 mRNA는 뉴클레오타이드 공급원이 상이함에도 불구하고, IVT와 유사한 순도를 나타내었다.
실시예 12. 관심 RNA 전사시스템 및 반응시스템에서 루시퍼라제 mRNA 및 효소의 합성
본 발명은 반응시스템에서 관심 단백질이나 바이오베터 합성을 하기 위해서, 대장균 유래 반응시스템에서는 (Endo DdRp+saDdRp 발현단위), 진핵세포 또는 하이브리드 유래 합성 시스템에서는 <DdRp (or mRNA)+saDdRp 발현단위+Capping enzyme 발현단위>, <DdRp (or mRNA)+sactDdRp 발현단위>, <DdRp (or mRNA)+sactDdRp 발현단위+RdRp 발현단위>를 포함하는 Autogene 시스템에서 선택되어진 어느 하나를 이용할 수 있다. 상기 발현단위는 그 발현산물을 포함하는 의미이다.
상기 발현단위는 DNA 및 RNA를 포함하는 핵산에서 선택되어진 어느 하나 이상을 의미한다. 상기 RNA 발현단위는 상기 DNA 발현단위를 체외전사하여 준비할 수 있다.
진핵세포유래 무세포 전사-번역 시스템인 TNT Transcription/Translation Systems(Promega 사, 미국)은 RNA 중합효소, 뉴클레오티드, 염 및 Recombinant RNAsin Ribonuclease Inhibitor를 망상적혈구 용해물 용액과 결합하여 단일 TnT Quick Master Mix를 제조하여 전사 및 번역 과정을 더욱 단순화한 제품이다. 상기 RNA 중합효소는 RNA 중합효소 mRNA로 대신할 수도 있다.
<실시례 5 항>에서 제조하는 무세포 시스템과 진핵세포유래 무세포 전사-번역 시스템인 TNT Transcription/Translation Systems(Promega 사, 미국)를 포함하는 시스템에서 관심 RNA 발현단위를 이용하여 관심 RNA 및/또는 관심 RNA에 의한 유용물질 생산을 확인하기 위해서, 아래와 같이 실시하였다.
<실시례 4항>에서 제조한 T7 프로모터 갖고 있는 ctDdRp 발현단위와 반딧불 루시퍼라제 발현단위를 포함하는 무세포 시스템, 상기 TnT Quick Master Mix 및 반딧불 루시퍼라제 RNA 발현단위를 조합하여 새로운 관심 RNA 및/또는 단백질을 합성하는 진핵세포 유래 hybrid 무세포 전사-번역 시스템을 구성하였다.
TnT Quick Master Mix에 있는 T7 Pol는 T7 프로모터 갖고 있는 ctDdRp 발현단위와 반딧불 루시퍼라제 발현단위를 포함하는 반딧불 루시퍼라제 RNA 전사시스템은 ctDdRp 발현단위에서 있는 T7 프로모터에 결합하여 ctDdRp를 전사 및 번역을 하고, 이어서 합성된 ctDdRp는 반딧불 루시퍼라제 발현단위의 T7 프로모터에 결합하여 하류 지역을 전사하여 캡구조가 있는 반딧불 루시퍼라제 mRNA를 합성할 수 있다.
상기 TnT Quick Master Mix에 상기 반딧불 루시퍼라제 mRNA 발현단위인 원형 플라스미드 DNA(0.2μg), NTP 혼합물 (각각 4mM) 및 RNase 활성의 불활성되는 조건으로 10 mg/mL PVSA를 첨가한 50μl 반응용액을 30°C에서 1 - 4시간 동안 배양하였다. 상기 배양한 반응물을 DNase-처리하고, 합성된 반딧불 루시퍼라제 mRNA를 LiCl 침전에 의해 정제하고, RNA 품질을 BioAnalyzer(Agilent, 미국)를 사용하여 전기영동에 의해 평가하였다(도 14).
TnT Quick System에는 기능적으로 활성인 루시퍼라제 mRNA의 신속한(<30초) 검출을 위해 Agilent Bioanalyzer 2100 분석에 사용할 수 있는 루시페라제 mRNA를 확인하였다. 상기 관심 RNA 전사시스템인 원형 플라스미드 DNA로 시작하여 TnT Quick System인 무세포 시스템내 루시퍼라제 mRNA 합성 결과를 3-4 시간 내에 쉽게 얻을 수 있다.
TnT Quick System인 무세포 시스템을 이용하여 합성된 반딧불 루시퍼라제 mRNA로부터 반딧불 루시퍼라제를 합성을 실시하였다. 상기 LiCl 침전으로 정제된 합성된 반딧불 루시퍼라제 100 ug/ml mRNA 반응용액 및 상기 RNase 활성의 불활성되는 조건으로 0.15 mg/mL PVSA를 첨가한 TnT Quick System인 무세포 시스템을 혼합한 후 30°C에서 60 - 90분 동안 그런 다음 합성된 반딧불 루시퍼라제를 GloMax™ 20/20 Luminometers(Promega, 미국)로 분석하였다.
상기 반응용액에서 TnT Quick Master Mix에 있는 T7 Pol이 ctDdRp 발현단위에서 있는 T7 프로모터에 결합하여 ctDdRp를 전사 및 번역하고, 이어서 합성된 ctDdRp는 반딧불 루시퍼라제 발현단위의 T7 프로모터에 결합하여 전사된 캡구조가 있는 반딧불 루시퍼라제 mRNA는 내재된 단백질 합성 기전에 의해 반딧불 루시퍼라제를 합성하고 그 활성을 확인할 수 있다.
상기 RNase 활성의 불활성되는 조건은 대장균의 무세포 시스템에서 PVSA의 세포 용해물에 있는 RNase 활성의 IC50 값(0.43 mg/ml) 또는 RNaseA 활성의 IC50 값(0.15mg/ml)이 번역의 IC50 값(1.03 mg/ml)보다 작은 점(Bioengineered. 2018; 9(1): 90-97.)을 고려하여 PVSA의 적절한 농도를 결정하여 유지할 수도 있다.
이와 같이 관심 RNA 전사시스템을 사용하여 RNase-free 상태 또는 RNase 활성의 불활성되는 조건에서 전사-번역이 가능하도록 설계된 무세포 시스템에서 관심 단백질을 생산하고 그 활성에 이용한 유용한 생물학적 산물 또는 발현을 유도할 수 있다.
실시예 13. 관심 RNA 전사시스템과 합성 시스템을 포함하는 2-챔버 시스템을 이용한 EPO 당화 단백질의 합성
새로운 관심 RNA 및/또는 단백질을 합성할 목적으로 내부용기와 외부용기로 구성되고 외부용기에 구멍이 있는 2-chamber 시스템을 구성하여 목적 최종산물을 생산하여 새로운 관심 RNA 및/또는 단백질을 합성하는 무세포 전사-번역 시스템으로 제조하였다. 상기 2-chamber 시스템의 내부용기와 외부용기 사이에 있는 막은 반응시약이 이동할 수 있는 구멍이 있으며, 바람직하게, 내부용기는 Dialysis tubing cellulose membrane(D9652, Sigma-Aldrich, 미국)이며, 상기 투과막은 외부용기에 있는 반응 시약을 내부용기로 이동하는 통로 역할을 할 수 있도록 cutoff value는 14kD이다.
실시례 1항에서 제조한 autogene ctDdRp 발현단위에서 제조되는 상기 RNA 중합효소 또는 캡핑효소는 N-말단 헥사히스티딘 태그를 갖는 열안정성 돌연변이체 T7 RNA 중합효소 (야생형 T7 RNA 중합효소를 또한 이들 반응에서 성공적으로 사용하였다)를 과다 발현한 무세포 시스템에서 Fast 단백질 액체 크로마토그래피(Fast Protein Liquid Chromatography: FPLC)에 의해서 정제시킬 수도 있다.
상기 내부용기는 <실시례 1항>에서 제조한 autogene ctDdRp 발현단위와 <실시례 2항>에서 제조한 EPO 발현단위를 포함하는 TnT SP6 High-Yield Wheat Germ Protein Expression System(Promega 사, 미국)으로 구성하였다. 상기 내부 용기에 전사 후변형에 관련된 발현단위 또는 그 발현산물을 첨가하였다. 시알릴화된 GalNAc O-글리칸을 갖는 재조합체 당단백질에 관련된 발현단위를 내부용기에 첨가하여 전사 후변형을 실시하여 분석하였다.
무세포 시스템에서 합성된 단백질의 전사 후변형를 실시하기 위해서, <실시례 5.1>항에 따라 ppGalNAcT, C1GalT-1와 β-갈락토시드 α-2,3- 시알릴트랜스퍼라제 1(ST3Gal1) 유전자를 포함하는 발현단위 즉, 설계 DNA 세트를 제작하였다.
본 발현단위는 <실시례 1항>에 따라 하기 유전자들의 GenBANK의 cDNA 서열에 상류에 T7 프로모터(서열번호 1)-5'UTR(서열번호 18)을 하류에 3'UTR이 위치하도록 한 염기서열을 유기합성하여 준비하였다(Genescripts, 미국). 여기서, 3'UTR은 muag<(알파-)글로빈의 돌연변이된 UTR, 서열번호 25>, 폴리(A) 꼬리는 64개의 아데닌 뉴클레오타이드(서열번호 26), 폴리(C) 서열은 30개의 사이토신 뉴클레오타이드(서열번호 27), 히스톤 스템-루프(서열번호 28)로 이루어진 RNA 서열이다.
제작된 T7 프로모터-5'UTR-ORF-3'UTR-poly(T) tail 구조체를 pUC 19 벡터와 T4 DNA ligase를 이용하여 클로닝하였다.
<ppGalNAcT>
Polypeptide N-acetylgalactosaminyltransferase; Biomphalaria glabrata (Bloodfluke planorb) (Freshwater snail); EC:2.4.1.-; Gene: ppGalNAcT; 600 amino acids; GenBank: KC182513.1
MVRRKLRLLVILAGIWLVGIVVYLFKGDDQSEFEKRVIDKGPDGFYVHKEEKEHQPFQEENKAEVLHQVEDQWKKKQDAEITQSRQTFIETKKLLPPDDELGDIPWGQFDELGYISKTTLKPGQDPYARNKFNLQASDNIKSNRHVPDTRHMNCRSETWSQDLPDTSVIITFHNEARSALLRTIVSIFRKSPDHLIREIILVDDFSDDPSDGQELDKIKKVKVLRNDKRQGLIRSRVNGANMAKGKVLTFLDSHCECNEKWLEPLLDRVKQDRRNVVSPIIDVISMDNFDYIGASADLKGGFDWNLVFKWDYMSAEERNRQRQNPTAPIRTPMIAGGLFSIDKSWFDELGQYDLKMDVWGGENLEISFRVWQCHGNLEIIPCSRVGHVFRKQHPYTFPGGSGQIFARNTKRAAEVWMDEYIQFYFAAVPSAKHVDVGDISERLALRDRLQCKPFKWFLENVYPELKIPSVQDIAFGSIKQGNDCMDTMGHFADGILGLYPCHNSGGNQEFSLTKAGEVKHLDLCVTLVDTRPGNEVKLYQCTPGNYKQQFVQNPAKDQLRHKSYDLCLDSVVWQTKGIVANKCDPSSYTQKWTFSLSKNR (서열번호 90)
<C1GalT-1>
Glycoprotein-N-acetylgalactosamine 3-beta-galactosyltransferase 1; Homo sapiens (Human); EC:2.4.1.122; Gene: C1GALT1; 363 amino acids, GenBank: AF155582.1
MASKSWLNFLTFLCGSAIGFLLCSQLFSILLGEKVDTQPNVLHNDPHARHSDDNGQNHLEGQMNFNADSSQHKDENTDIAENLYQKVRILCWVMTGPQNLEKKAKHVKATWAQRCNKVLFMSSEENKDFPAVGLKTKEGRDQLYWKTIKAFQYVHEHYLEDADWFLKADDDTYVILDNLRWLLSKYDPEEPIYFGRRFKPYVKQGYMSGGAGYVLSKEALKRFVDAFKTDKCTHSSSIEDLALGRCMEIMNVEAGDSRDTIGKETFHPFVPEHHLIKGYLPRTFWYWNYNYYPPVEGPGCCSDLAVSFHYVDSTTMYELEYLVYHLRPYGYLYRYQPTLPERILKEISQANKNEDTKVKLGNP (서열번호 91)
<ST3Gal1>
ST3 beta-galactoside alpha-2,3-sialyltransferase 1, isoform CRA_a; Homo sapiens (Human); Gene: ST3GAL1; 340 amino acids, GenBank: AF059321.1
MVTLRKRTLKVLTFLVLFIFLTSFFLNYSHTMVATTWFPKQMVLELSENLKRLIKHRPCTCTHCIGQRKLSAWFDERFNQTMQPLLTAQNALLEDDTYRWWLRLQREKKPNNLNDTIKELFRVVPGNVDPMLEKRSVGCRRCAVVGNSGNLRESSYGPEIDSHDFVLRMNKAPTAGFEADVGTKTTHHLVYPESFRELGDNVSMILVPFKTIDLEWVVSAITTGTISHTYIPVPAKIRVKQDKILIYHPAFIKYVFDNWLQGHGRYPSTGILSVIFSMHVCDEVDLYGFGADSKGNWHHYWENNPSAGAFRKTGVHDADFESNVTATLASINKIRIFKGR (서열번호 92)
상기에 설계된 발현단위를 제조하여 바이오틴이 부착된 T7 프로모터를 포함하는 정방향 프라이머와 히스톤 스템-루프(서열번호 28)을 구성하는 염기서열에 상응하는 역방향 프라이머를 이용하여 PCR를 실시하여 얻은 PCR 산물을 2-chamber의 내부용기에 넣었다. 또는 상기 발현단위의 PCR 산물을 체외전사하여 얻은 번역이 가능한 RNA를 내부용기에 넣어 사용할 수도 있다.
상기 외부용기는 상기 내부 용기의 전사에 관련된 4종류의 rNTP 등의 반응시약과 단백질 합성에 필요한 반응 시약을 포함하는 용액으로 구성되며 진핵세포 유래 Hybrid 무세포 전사-번역 시스템으로 구성할 수 있다. 상기 발현단위는 DNA 및 RNA를 포함하는 핵산에서 선택되어진 어느 하나 이상을 의미한다. 상기 RNA 발현단위는 상기 DNA 발현단위를 체외전사하여 준비할 수 있다.
상기 2-chamber 시스템을 구성하는 외부 용기는 bag bioreactor(Cytiva Korea, 한국)를 사용하였으며, 결합 전사-번역 반응에 필요한 반응기질의 제공, 무세포 반응 전사-번역 시스템의 유지와 mRNA의 번역에 필요한 시약으로 HEPES-KOH(최종 농도 30 mM, pH 7.6; Merk), Mg(OAc)2 (최종농도 2.5 mM; Merk), KOAc (최종농도 75 mM; Merk), 아미노산 (최종농도 100 μM.; Merk), 스페르미딘 (최종농도. 0.25 mM; Roche) 및 에너지 재생 성분 (최종농도 1.75 mM ATP, 0.3 mM GTP; Roche) 그리고 mRNA의 전사를 목적으로 CTP (최종농도 0.3 mM; Roche), UTP (최종농도 0.3 mM; Roche) 및 캡 유사체 G(ppp)G (최종농도 0.33 mM; Trilink)를 포함하고 부피를 물로 채워 1000 μl의 최종 부피가 되도록 하였다. 모든 버퍼는 4°C에서 저장할 수 있다.
또한, PTM(번역후변형)에 사용하는 반응시약은 Uridine 5′-diphospho-N-acetylgalactosamine disodium salt (UDP-GalNAc) (Sigma, Catalog # U5252), Uridine 5'-diphosphogalactose (UDP-Gal) (Sigma, Catalog # U4500), Cytidine-5′-monophospho-N-acetylneuraminic acid sodium salt (CMP-Neu5Ac) (Sigma, Catalog # C8271)을 포함하며 이들을 각각 40 nmol로 외부용기에 있는 반응용액에 첨가하였다.
전사 및 번역은 <실시례 2항>에서 제조한 His-Tagged EPO RNA 발현단위를 60μg/ml의 최종농도로 상기 내부용기에 첨가함으로써 진행하였다.
2-챔버 반응은 bag bioreactorCytiva Korea, 한국)을 이용하여 600 rpm에서 완만한 교반으로 37°C에서 최대 48 시간 동안 수행하였다. 제조된 산물을 HisPur™ Cobalt Resin (Thermo Scientific™, 미국)으로 EPO 단백질을 분리하고, O-Glycosidase(NEB, 미국)와 Endo H(NEB, 미국) 처리하여 얻은 산물을 전기영동하고 Primary antibody: polyclonal rabbit antihuman EPO (1:3000 dilution, Thermo Fisher Scientific Inc. 미국)로 면역분석한 결과이다(도 15).
도15 a는 제조한 ppGalNAcT, C1GalT-1와 β-갈락토시드 α-2,3- 시알릴트랜스퍼라제 1(ST3Gal1) 유전자에 대한 발현단위의 발현산물이 EPO 발현단위의 산물에 연속적인 작용을 하여 합성될 수 있는 당화 EPO의 예시도이며 도 15 b는 합성된 His-tagged EPO를 분리정제하고 O-Glycosidase와 Endo H 처리한 후, 면역분석하여 EPO에 O-당화가 있음을 확인한 결과이다.
실시예 14. CFPS, DAE 시스템 및 UF/DF 시스템을 이용한 바이오리액터
새로운 관심 RNA 및/또는 단백질을 합성할 목적으로 CFPS를 포함하는 합성 시스템, 한외여과(UF)와 정용여과(DF) 시스템 및 DAE 시스템을 사용하여 관심 RNA 및/또는 유용물질의 연속생산을 하는 바이오리액터를 도 16에 제시하였다. 상기 DAE 시스템의 발현단위는 DNA 유형이나 이들에 상응하는 mRTN를 대신하여 사용할 수도 있다.
도 16에서 제시한 CFPS를 포함하는 합성 시스템에서 RNA 및/또는 유용물질의 연속생산을 하기 위한 바이오리액터는 (a) RNA 및/또는 유용물질을 포함하는 반응용액이 있는 1차 챔버; (b) 상기 RNA 및/또는 유용물질의 반응원재료를 포함하는 반응용액이 있는 2차 샘버; (c) 투석 및 여과 공정을 하는 한외여과/정용여과 시스템; 및 (d) 상기 구성단위들을 연결하는 노즐;을 포함한다. 상기 1차 챔버 및/또는 2차 챔버와 상기 한외여과/정용여과 시스템을 노즐로 연결하는 부위에 여과막을 설치할 수 있으며 용액의 이동은 펌프에 의해서 조절하도록 한다. 추가적으로 다른 반응챔버를 설치하여 생산된 RNA 및/또는 유용물질을 이용하여 다른 유용물질을 생산할 수도 있다. RNA 및/또는 유용물질 생산을 위하기 위해서, DAE 시스템은 다양한 설계발현단위의 DNA 유형 및 RNA 유형을 혼용할 수도 있으며 DNA 유형 또는 RNA 유형을 사용하여 RNA 및/또는 유용물질 생산을 최적화할 수도 있다.
상기 챔버들은 각각 독립 또는 공동 운영을 선택적으로 할 수도 있는데, 1차 챔버는 독립적으로 운영하여 관심 RNA를 합성하거나 2차 챔버는 독립적으로 운영하여 NTP를 합성할 수도 있다. 이 두 챔버는 시공간적으로 공동으로 운영하면서 NTP와 RNA를 합성할 수도 있다. 부가적인 챔버에서 1차 챔버에서 생산하는 RNA를 주형으로 단백질을 생산할 수도 있다. 상기 RNA는 mRNA, saRNA(자가증폭 RNA) 및 원형RNA 등을 포함한다.
또한, 상기 바이오리액터는 반응하는 동안 뉴클레오타이드 농도의 실시간 측정을 위한 센서 유닛을 포함할 수 있으며 있어서, 상기 센서 유닛은 (European J. Biochem. 4 (1968) 256-264) 논문을 참조한 광도계 분석(photometric analysis)에 의하여 뉴클레오타이드 농도를 측정한다. 바람직하게, 상기 바이오리액터는 NTP 혼합물의 증가를 제어하는 제어 모듈을 포함할 수도 있다.
여기서, 사용되는 챔버는 상기 RNA 및/또는 유용물질을 포함하는 반응용액과 상기 RNA 및/또는 유용물질의 반응원재료를 포함하는 반응용액의 반응을 특정한 환경 하에서 수행하도록 하는 반응모듈로 시판 중인 다양한 바이오리액터를 선택하여 사용할 수 있다. 바람직하게, Biostat B(Sartolius 사, 독일) 바이오리액터를 사용하였다.
본 발명의 챔버는 특정 온도, 일반적으로 4 내지 40°C를 정확하게 유지하기 위해 열적으로 조절되며, 인플로우 또는 피드 라인 및 배출구도 같이 설계되며 다양한 속도의 스터링을 제공하는 스터드-셀(stirred-cell)일 수 있다.
상기 한외여과/정용여과 시스템 및 노즐에 있는 여과막은 재생 셀룰로스, 개량 셀룰로스, 폴리설폰(polysulfone (PSU)), 폴리아크릴로나이트릴(polyacrylonitrile (PAN)), 폴리메틸메타크릴레이트(polymethylmethacrylate (PMMA)), 폴리비닐 알코올(polyvinyl alcohol (PVA)) 및 폴리아릴에터설폰(polyarylethersulfone (PAES))의 군에서 선택될 수 있다. 대략 10에서 50 kDa의 범위에서 분자량 분리(cut-off)를 하는 것을 특징으로 할 수 있다.
도 2에 제시한 한외여과막을 포함하는 시스템은 한외여과(Ultrafiltration, UF) 공정 및 정용여과(Diafiltration, DF) 공정을 포함하는 군에서 선택되어진 어느 한 공정 이상을 실행하는 한외여과 및 정용여과 시스템일 수도 있다. 상기 한외여과막을 포함하는 시스템을 통해 RNase가 제거된 물질을 이송한다. 한외여과 모듈 제조사는 Merck, Pall, Repligen 및 Sartorius 등이 있으며 적절한 모델을 선택하여 사용할 수 있다.
도 16의 바이오리액터는 (a) 1차 챔버는 RNA 및/또는 유용물질의 연속 생산을 하며, 한외여과/정용여과 시스템을 통하여, RNA 및/또는 유용물질의 연속 생산에 필요한 반응원재료를 2차 챔버로부터 공급받고 생산 활동에 따른 부산물을 2차 챔버로 방출하는 공정; 및 (b) 2차 챔버는 RNA 및/또는 유용물질에 필요한 반응원재료의 연속 생산을 하며, 한외여과/정용여과 시스템을 통하여, RNA 및/또는 유용물질의 연속 생산에 필요한 반응원재료를 1차 챔버에 공급하고 1차 챔버 생산 활동에 따른 부산물을 여과하는 공정;을 포함한 연속공정을 실행하여 RNA 및/또는 유용물질을 연속생산을 할 수 있다. RNA 및/또는 유용물질 생산을 위하기 위해서, DAE 시스템은 다양한 설계발현단위의 DNA 유형 및 RNA 유형을 혼용할 수도 있으며 DNA 유형 또는 RNA 유형을 사용하여 RNA 및/또는 유용물질 생산을 최적화할 수도 있다.
추가적으로 상기 1차 챔버에서 반응용액으로부터 관심 mRNA를 분리하기 위한 여과막은 고분자량 구성요소를 저분자량 구성요소로부터 분리하기 위한 한외여과막(ultrafiltration)인 것을 특징으로 하며, 바람직하게 상기 여과막은 10내지 100kDa, 10 내지 75kDa, 10 내지 50kDa, 10내지 25kDA, 10내지 15kDa의 범위에서 분자량 분리(cut-off)하는 것을 특징으로 하며, 보다 바람직하게 상기 여과막은 약 10 내지 50kDa의 범위에서 분자량 분리 값을 갖는 것을 특징으로 하며, 상기 여과막은 재생 셀룰로스, 개량 셀룰로스, 폴리설폰 (PSU), 폴리아크릴로나이트릴 (PAN), 폴리메틸메타크릴레이트 (PMMA), 폴리비닐 알코올 (PVA) 및 폴리아릴에터설폰 (PAES)의 군에서 선택할 수 있다.
상기 바이오리액터은 유용물질, 당화단백질의 연속 생산을 하기 위해서, 상기 실시례 12항의 바이오리액터에 있는 내부 챔버의 구성물질은 1차 챔버, 외부챔버의 구성물질은 2차 챔버로 구성물질을 배분하여 바이오리액터를 운영하여 당화단백질을 연속 생산할 수 있다.
상기 바이오리액터에서 최종산물 mRNA 생산을 위해서, 관심 RNA 발현단위(EU)는 서열번호 94의 mCherry 유전자를 사용하여 진핵세포에서 발현할 수 있도록 <실시례 3항>을 참조하여 제작하였다.
> mCherry(GenBank: AY678264.1)의 아미노산 서열
MVSKGEEDNM AIIKEFMRFK VHMEGSVNGH EFEIEGEGEG RPYEGTQTAK LKVTKGGPLP FAWDILSPQF MYGSKAYVKH PADIPDYLKL SFPEGFKWER VMNFEDGGVV TVTQDSSLQD GEFIYKVKLR GTNFPSDGPV MQKKTMGWEA SSERMYPEDG ALKGEIKQRL KLKDGGHYDA EVKTTYKAKK PVQLPGAYNV NIKLDITSHN EDYTIVEQYE RAEGRHSTGG MDELYK (서열번호 93)
> mCherry(GenBank: AY678264.1)의 염기서열 711 bp
ATGGTGAGCAAGGGCGAGGAGGATAACATGGCCATCATCAAGGAGTTCATGCGCTTCAAGGTGCACATGGAGGGCTCCGTGAACGGCCACGAGTTCGAGATCGAGGGCGAGGGCGAGGGCCGCCCCTACGAGGGCACCCAGACCGCCAAGCTGAAGGTGACCAAGGGTGGCCCCCTGCCCTTCGCCTGGGACATCCTGTCCCCTCAGTTCATGTACGGCTCCAAGGCCTACGTGAAGCACCCCGCCGACATCCCCGACTACTTGAAGCTGTCCTTCCCCGAGGGCTTCAAGTGGGAGCGCGTGATGAACTTCGAGGACGGCGGCGTGGTGACCGTGACCCAGGACTCCTCCCTGCAGGACGGCGAGTTCATCTACAAGGTGAAGCTGCGCGGCACCAACTTCCCCTCCGACGGCCCCGTAATGCAGAAGAAGACCATGGGCTGGGAGGCCTCCTCCGAGCGGATGTACCCCGAGGACGGCGCCCTGAAGGGCGAGATCAAGCAGAGGCTGAAGCTGAAGGACGGCGGCCACTACGACGCTGAGGTCAAGACCACCTACAAGGCCAAGAAGCCCGTGCAGCTGCCCGGCGCCTACAACGTCAACATCAAGTTGGACATCACCTCCCACAACGAGGACTACACCATCGTGGAACAGTACGAACGCGCCGAGGGCCGCCACTCCACCGGCGGCATGGACGAGCTGTACAAGTAG (서열번호 94)
먼저, 관심 mRNA 생산을 위한 예시적인 1차 및 2차 챔버는 구체적으로, 실시례 <7.2. 합성 시스템에서 RNA 합성> 항에서 1, 2 및 3차 반응의 반응조성물을 1차 및 2차 챔버로 나누어 구성물질을 각각 구성하였다. 구체적으로 <실시례 7.2.3. 3차 반응> 항의 반응조성물을 나누어 구성한 1차 및 2차 챔버의 반응조성물은 <표 13>에 제시하였다. 특히 NTP 합성대사경로의 kinase 발현단위 및 그들 발현산물을 포함하는 NTP 시스템은 무세포 시스템에 내재된 RNase에 의해 분해되는 RNA에서 유래하는 N(M)DP를 NTP로 인산화하여 재생 NTP를 제공하도록 하였다.
<표 13>의 발현단위는 DNA 및 RNA를 포함하는 핵산에서 선택되어진 어느 하나 이상을 의미한다. 상기 RNA 발현단위는 상기 DNA 발현단위를 체외전사하여 준비할 수 있다. 즉 상기 발현단위의 PCR 산물을 체외전사하여 얻은 번역이 가능한 RNA를 챔버에 넣어 사용할 수도 있다.
챔버 | 반응 조성물 | 농도 |
1차 챔버 (RNA 합성) |
RNA 중합효소를 포함하는 무세포 시스템 또는 그 FPLC 정제산물 | 0.87 mg/mL 총단백질 |
캡핑효소를 포함하는 무세포 시스템 또는 그 FPLC 정제산물 | 0.88 mg/mL 총단백질 | |
PVSA | 10 mg/mL | |
MgS04 | 45 mM | |
mCherry mRNA 발현단위 | 1 ug/mL | |
2차 챔버 | RNA 중합효소 발현단위 그 발현산물을 포함하는 반응무세포 시스템 또는 그 FPLC 정제산물 | 1.75 mg/mL 총단백질 |
NMP 혼합물(20% v/v, 각각 4mM), 13 mM Sodium Hexametaphosphate(SHMP), RNA 중합효소 발현단위, NTP 합성대사경로 Kinases 설계 발현단위와 그들 발현산물을 포함하는 반응무세포 시스템 또는 그 TFF 정제산물 | 발현단위는 각각 1 ug/mL |
<세포유래 NTP와 mCherry mRNA의 합성>
2차 챔버는 <실시례 5항>에서 제조하는 대장균 용해물 또는 상업화 무세포 단백질 합성 키트의 구성성분을 사용하였다. 관심 단백질이나 바이오베터 합성을 하기 위해서, 대장균 유래 무세포 시스템은 (Endo DdRp+saDdRp 발현단위), 진핵세포 또는 하이브리드 유래 합성 시스템에서는 <DdRp (or mRNA)+saDdRp 발현단위+Capping enzyme 발현단위>, <DdRp (or mRNA)+sactDdRp 발현단위>, <DdRp (or mRNA)+sactDdRp 발현단위+RdRp 발현단위>를 포함하는 Autogene 시스템에서 선택되어진 어느 하나를 이용할 수 있다.
상기 무세포 시스템은 <실시례 5.4 항>에 따라 BL21 (DE3) 세포를 제조하여 25mM lactose(바람직하게, lactose 또는 IPTG의 양은 배양양상에 따라 조절한다) 유도하여 T7Pol을 포함되도록 (Endo DdRp+saDdRp 발현단위)이 도입된 BL21 (DE3) 무세포 시스템을 50 mM 트리스, 50 mM NaCl (pH 7.0) 반응완충용액 또는 40 내지 60mM의 인산칼륨, 1 내지 5mM의 MnCl2 및 /또는 10 내지 50mM의 MgCl2(예를 들어, 20mM MgCl2)를 포함하는 인산칼슘 완충용액에 첨가하여 최종농도 30.0 mg/mL 총 단백질이 되도록 준비하였다. 본 RNA 반응시스템에 <실시례 5.4항>에서처럼 아미노산 혼합물과 에너지 원을 추가할 수도 있다.
상기 상업화 무세포 단백질 합성 키트는 NEBExpress Cell-free E. coli Protein Synthesis System(NEB사, 미국), AccuRapid™ Cell-Free Protein Expression Kit(Bioneer 사, 한국) 및 E. coli S30 Extract System for Linear Templates(Promega 사, 미국) 및 PURExpress In Vitro Protein Synthesis(NEB 사, 미국) 등에서 선택하여 사용할 수도 있다. 본 실시례에서는 AccuRapid™ Cell-Free Protein Expression Kit(Bioneer 사, 한국)를 제품의 지침서에 따라 사용하였다. 상기 RNA 중합효소 발현단위와 설계 발현단위의 발현산물인 효소 혼합물(반응무세포 시스템)은 실시례 7항에 따라 제조하였다. 상기 2차 챔버는 본 발명에서 사용하는 RNase의 불활성화 조건을 처리를 하지 않고 RNase 활성을 유지할 수도 있다.
상기 제조된 설계 발현단위의 발현산물 NTP 대사경로 Kinases에 의해 NMP 혼합물(20% v/v, 각각 4mM)가 전환된 NTP를 포함하는 반응용해물을 Vivaflow 50(Sartorius 사, 독일)로 TFF(Tangential Flow Filtration)을 하여 NTP를 습득할 수도 있다.
1차 챔버와 2차 챔버를 포함하는 바이오리액터가 운영되면서 1차 챔버는 NTP 혼합물을 중합하여 RNA를 합성하면서 PPi(무기 인산염) 부산물이 생겨 Mg2+와 침전물을 형성하여 RNA 합성을 감소시키는 요인으로 작용할 수 있으며. 2차 챔버는 합성되는 NTP 혼합물(외부 첨가되는 변형된 NTP를 포함할 수 있음)이 준비되면 한외여과 및 정용여과 시스템은 투석여과를 실시할 경우, 1차 챔버는 NTP 혼합물을 공급을 받으며 PPi를 방출할 수 있으며 2차 챔버는 생산된 NTP 혼합물을 1차 챔버에 제공하고, 1차 챔버에서 방출되는 PPi를 수거하도록 운영하여 RNA의 연속 생산을 할 수도 있다. 상기 PPi를 RNA 합성대사 반응구에서 제거함으로써. 상기 PPi는 RNA 합성의 필수성분인 Mg2+과 결합하여 침전할 수도 있어 RNA 합성을 저해할 수도 있어 상기 공정을 이용하여 반응계에서 PPi를 제거함으로 RNA 합성 반응효율을 높일 수도 있다.
또한, 상기 RNA 합성대사의 반응 부산물이면서 동시에 RNA 합성대사 저해제인 PPi를 Pyro-phosphatase (PPase; NEB 사, 미국) 또는 PPase 발현단위에 의해 2Pi로 분해함으로써 RNA 합성대사 반응성을 증가시키는 효과를 얻을 수 있다. 상기 PPase 발현단위는 <실시례 1항>을 참조하여 대장균 inorganic pyrophosphatase (ppa) gene (GenBank: M23550.1)을 이용하여 제조할 수 있다. 상기 한외여과 및 정용여과 시스템과 Pyro-phosphatase (PPase) 공정을 각각 별도, 연속 또는 동시에 할 수도 있다.
mRNA를 합성하기 위해서, N-말단 헥사히스티딘 태그를 갖는 T7 RNA 중합효소 및 캡핑효소 발현단위로부터 과다 발현한 반응무세포 시스템을 AKTA purifier(GE Healthcare 사, 미국)을 이용한 고속 단백질 액체 크로마토그래피(Fast Protein Liquid Chromatography: FPLC)에 의해서 정제시킬 수도 있다.
mCherry RNA 합성을 위해서, 2차 챔버에서 제조한 세포유래 NTP 용액을 한외여과/정용여과 시스템을 통해서 1차 챔버로 이송하며 이어서, 1차 챔버에 체외전사(In vitro transcription) 버퍼 또는 자체 제작하는 무세포 시스템인 <실시례 5항>에서 제조하는 대장균 용해물에 <표 13>의 조성물을 첨가하여 관심 RNA 발현단위인 mCherry mRNA 발현단위를 주형으로 RNA를 합성하였다. 상기 1차 챔버에는 RNase 활성의 불활성화 조건을 처리해야 한다.
<mCherry의 합성>
mCherry를 합성하기 위해서, LiCl 침전 또는 여과를 포함하는 방법으로 제조된 상기 mCherry RNA를 포함하는 농축 반응혼합용액이 있는 1차 챔버에 단백질 합성에 필요한 반응시약을 첨가하여 단백질을 합성할 수 있다. 또는. 부가적인 챔버, 3차 챔버는 1차 챔버에서 수확한 상기 mCherry RNA를 포함하는 농축 반응혼합용액의 RNA를 주형으로 mCherry 단백질을 생산할 수도 있다.
상기 1차 챔버에서 합성된 RNA를 포함하는 반응혼합용액을 LiCl의 침전 또는 상기 노즐과 투석 및 여과 공정을 하는 한외여과/정용여과 시스템으로 여과하여 RNA를 포함하는 농축 반응혼합용액을 수확하였다. 상기 RNA를 포함하는 농축 반응혼합용액을 얻기 위한 여과과정으로 단백질 합성을 저해하는 PVSA(평균 분자량 2-5 KDa)를 제거할 수도 있다.
본 발명의 단백질 생산을 위한 1차 챔버 또는 3차 챔버는 E. coli, yeast extract, insect cell, wheat germ, rabbit reticulocytes, CHO 및 human cell 각각에서 유래하는 자체 제작 무세포 시스템, 상업화된 무세포 시스템 또는 이들 간에 하이브리드를 구성하여 적용할 수도 있다.
사용하는 RNA는 mRNA, saRNA 또는 원형 RNA 등이며 RNA 구조는 무세포 시스템의 유래 세포가 원핵세포이며 원핵세균에서 번역할 수 있는 RNA 구조가 필요하여 <실시례 1항>을 참조하며 진핵세포이며 진핵세균에서 발현할 수 있는 RNA 구조가 필요하여 <실시례 2항>을 참조하여 구성할 수 있다. 또한 상기 RNA는 (a) 캡구조; (b) 2차구조를 형성하는 서열이 있는 5'UTR; (c) 2차구조를 형성하는 서열이 있는 3'UTR; 및 (d) Cytidine를 포함하는 poly(A) tail를 포함하여 안전성을 확보하여 RNase 내성이 있도록 제조할 할 수 있다.
mCherry 단백질을 합성하기 위해서 3차 챔버는 상업화된 1-Step Human High-Yield In Vitro Translation Kits(Thermo Fisher Scientific, 미국)의 HeLa cell lysate-based protein expression systems를 사용하였다. 1차 챔버에서 합성된 mCherry mRNA를 적절한 농도로 3차 챔버에 첨가하여 mCherry 단백질을 제조할 수 있다.
본 실시례에서 사용하는 Hela cell lysate는 단백질의 번역후 변형(posttranslational modification)도 할 수 있는 시스템으로 단백질의 번역후 변형도 할 수 있다.
상기 1차 챔버에서 제조한 mCherry mRNA는 60μg/ml 및 PVSA를 0.15 - 0.5mg/ml 최종농도로 상업화된 1-Step Human High-Yield In Vitro Translation Kits(Thermo Fisher Scientific, 미국)의 HeLa cell lysate-based protein expression systems에 첨가하여 mCherry 단백질 합성을 실시하였다.
mCherry 단백질 합성을 분석하기 위해서, 정제를 위한 컬럼 준비 컬럼에 있는 10mL의 NiNTA 수지를 세척 버퍼(100mM NaH2PO4, 100mM NaCl, pH 7.8)의 5 컬럼 부피(CVs)로 사전 평형화하였다. 원심분리 후 새로운 튜브로 옮겨진 상등액을 컬럼에 로딩한다. 통과액을 수집하고 세척 완충액 1(100mM 인산나트륨, 100mM NaCl, 10mM 이미다졸 pH 7.8) 및 세척 완충액 2(100mM 인산나트륨, 100mM NaCl, 20mM 이미다졸, pH 7.8). 칼럼에 결합된 그의 태그된 mCherry를 용출 완충액(100mM 인산나트륨, 100mM NaCl, 300mM 이미다졸, pH 7.8)으로 회수하였다. 정제된 mCherry 분획을 4°C에서 완충액(20mM Na2HPO4, 50mM NaCl, pH 7.8)에서 밤새 투석하였다. 단백질 발현을 분석은 세포 용해물 준비 및 정제된 단백질의 SDS-PAGE 분석(도 17 a) 및 mCherry를 포함하는 용액을 분석한 결과(도 17 b)을 하였다(도 17).
이와 같이 관심 RNA를 사용하여 RNase-free 상태 또는 RNase 활성의 불활성되는 조건에서 단백질합성이 가능하도록 설계된 무세포 시스템에서 관심 단백질을 생산하고 그 활성에 이용한 유용한 생물학적 산물 또는 발현을 유도할 수 있다. 상기 RNase 활성의 불활성되는 조건은 단백질 RNase 저해물질 발현단위 및/또는 그 발현산물, 단백질 RNase 저해물질 mRNA 및 PVSA를 포함하는 군에서 선택되어진 어느 하나 이상의 첨가로 달성될 수 있다. PVSA를 이용한 RNase 활성의 불활성되는 조건은 대장균의 무세포 시스템에서 PVSA의 세포 용해물에 있는 RNase 활성의 IC50 값(0.43 mg/ml) 또는 RNaseA 활성의 IC50 값(0.15mg/ml)이 번역의 IC50 값(1.03 mg/ml)보다 작은 점(Bioengineered. 2018; 9(1): 90-97.)을 고려하여 PVSA의 적절한 농도를 결정하여 유지할 수도 있다.
실시례 15. 합성 시스템, DAE 시스템 및 UF/DF 시스템을 이용한 바이오리액터에서 이중특이적 항체(Bispecific Antibodies)의 제조
이중특이성 항체(BsAbs)는 치료제로 널리 사용되며 예를 들어 T 세포 인게이저로 성공적이다. BsAb는 (i) 디아바디 및 펩티드-연결된 단일 사슬 가변 단편과 같은 면역글로불린 G(IgG) 단백질의 Fc 부분이 없는 저분자량 BsAb; 및 (ii) Ig 단백질의 기본적 특성이 유지되도록 IgG의 Fc 부분 을 포함하는 BsAb 등 두 가지 주요 부류로 구분한다.
후자의 BsAb를 제조하기 위한 체계적인 접근 방식은 두 개의 Fab 부분을 포함하는 폴리펩티드의 번역 후 접합 또는 재조합을 사용하는 것이다. 이러한 방법은 대규모 생산에 항상 적합한 것은 아니지만 BsAbs를 설계할 때 가변 영역의 조합을 선별하고 최적화하는 데 유용하며 인테인 매개 단백질 트랜스-스플라이싱(intein-mediated protein trans-splicing; IMPTS)이다.
<도 18>에서처럼 IMPTS에서 인테인의 N- 및 C-말단 단편(IntN 및 IntC)는 두 개의 서로 다른 폴리펩타이드에 각각 융합되어 있고, 환원된 상태에서 두 성분이 혼합되면 자발적인 반응이 일어나 두 폴리펩타이드 사이에 펩타이드 결합이 형성된다.
IMPTS는 재조합이 가능한 다른 태그에 비해 IntN-IntC 복합체가 방출되기 때문에 제3의 성분인 효소가 필요 없고, 제품에 최소한의 기질 펩타이드가 남는다는 장점이 있다. 다양한 응용 분야에서 IMPTS의 이러한 기능을 활용한다.
<인테인 융합 항체 단편의 설계>
인테인 융합 항체 단편의 설계는 <도 18>에 제시한 바와 같이, 인간 IgG1의 힌지 영역에서 자연적으로 사용 가능한 Cys 잔기 중 하나를 C-extein의 N-말단에서 반응 센터로 사용한다. 효율적인 IMPTS 반응을 위하여 Npu DnaE의 고효율 인테인 돌연변이체인 Cfa를 사용한다. 생산성을 높이기 위하여 친화성 정제를 위한 hexahistidine tag[(His)6]외에 IntC의 N-말단과 IntN의 C-말단에 MBP(maltose binding protein) tag의 N-말단에 융합한다. Fc 부분의 이종 이량체화를 위해 잘 특성화된 이황화 결합 노브-인투-홀(dKiH) 기술은 CH3-도메인 동종형 G1m을 사용하였다. dKiH의 "hole" 돌연변이를 포함하는 서열번호 95인 (His)6-MBP-IntC-Fc인 반중쇄 및 dKiH의 "knob" 돌연변이를 포함하는 서열번호 96 CH1-hinge-Fc(knob)를 포함하는 다른 반쪽 반중체로 구성된 복합체는 "IntC/Fab#1-Fc"이라 한다. 그리고 서열번호 97인 CH1-hinge(partial)-IntN-MBP-(His)6를 포함하는 VH-CH1-IntN-MBP-(His)6 복합체는 "Fab#2-IntN"이라 한다.
Sequences of the heavy chain constant region for intein-mediated protein trans-splicing
(His)6-MBP-IntC-hinge(partial)-Fc(hole):
MVRLPLQCVLWGCLLTAVHPSGHHHHHHGGSGKIEEGKLVIWINGDKGYNGLAEVGKKFEKDTGIKVTVEHPDKLEEKFPQVAATGDGPDIIFWAHDRFGGYAQSGLLAEITPDKAFQDKLYPFTWDAVRYNGKLIAYPIAVEALSLIYNKDLLPNPPKTWEEIPALDKELKAKGKSALMFNLQEPYFTWPLIAADGGYAFKYENGKYDIKDVGVDNAGAKAGLTFLVDLIKNKHMNADTDYSIAEAAFNKGETAMTINGPWAWSNIDTSKVNYGVTVLPTFKGQPSKPFVGVLSAGINAASPNKELAKEFLENYLLTDEGLEAVNKDKPLGAVALKSYEEELVKDPRIAATMENAQKGEIMPNIPQMSAFWYAVRTAVINAASGRQTVDEALKDAQGSGSSGGVKIISRKSLGTQNVYDIGVEKDHNFLLKNGLVASNCFNTHTCPPCPAPELLGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVKFNWYVDGVEVHNAKTKPREEQYNSTYRVVSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVCTLPPSRDELTKNQVSLSCAVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLVSKLTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSLSPGK (서열번호 95)
CH1-hinge-Fc(knob):
(VH)ASTKGPSVFPLAPSSKSTSGGTAALGCLVKDYFPEPVTVSWNSGALTSGVHTFPAVLQSSGLYSLSSVVTVPSSSLGTQTYICNVNHKPSNTKVDKKVEPKSCDKTHTCPPCPAPELLGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVKFNWYVDGVEVHNAKTKPREEQYNSTYRVVSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVYTLPPCRDELTKNQVSLWCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSLSPGK (서열번호 96)
CH1-hinge(partial)-IntN-MBP-(His)6:
(VH)ASTKGPSVFPLAPSSKSTSGGTAALGCLVKDYFPEPVTVSWNSGALTSGVHTFPAVLQSSGLYSLSSVVTVPSSSLGTQTYICNVNHKPSNTKVDKKVEPKSCLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGLDLKQVDGLPGGSGGGGSGGSKIEEGKLVIWINGDKGYNGLAEVGKKFEKDTGIKVTVEHPDKLEEKFPQVAATGDGPDIIFWAHDRFGGYAQSGLLAEITPDKAFQDKLYPFTWDAVRYNGKLIAYPIAVEALSLIYNKDLLPNPPKTWEEIPALDKELKAKGKSALMFNLQEPYFTWPLIAADGGYAFKYENGKYDIKDVGVDNAGAKAGLTFLVDLIKNKHMNADTDYSIAEAAFNKGETAMTINGPWAWSNIDTSKVNYGVTVLPTFKGQPSKPFVGVLSAGINAASPNKELAKEFLENYLLTDEGLEAVNKDKPLGAVALKSYEEELVKDPRIAATMENAQKGEIMPNIPQMSAFWYAVRTAVINAASGRQTVDEALKDAQGHHHHHH (서열번호 97)
<인테인 융합 항체 단편의 합성>
상기 디자인을 모델로 하여 CD30(#1) 및 TNFR2(#2)을 표적으로 하는 BsAbs를 생산하기 위하여 IntC/Fab#1-Fc 복합체와 Fab#2-IntN 복합체를 먼저 합성하였다. <도 19>에서처럼 상기 IntC/Fab#1-Fc 복합체는 (i) 서열번호 95 인 (His)6-MBP-IntC-hinge(partial)-Fc(hole), (ii) CD30에 대한 항체, 즉 T104의 VH 영역과 서열번호 96인 CH1-hinge-Fc(knob)이 융합한 VH-CH1-hinge-Fc(knob) 단백질 및 (iii) T104의 VL-CL 단백질을 각각 인코딩하는 3종류의 IntC/Fab#1-Fc 발현단위를 제작하고 이들을 각각 주형으로 PCR하여 T7 프로모터가 있는 증폭산물을 확보하였다. 체외전사하여 mRNA를 제조하였다. 제조된 mRNA를 반응구에 함께 첨가하여 IntC/FabCD30-FC 복합체를 합성하였다.
<도 20>에서처럼 상기 Fab#2-IntN 복합체는 (i) TNFR2에 대한 하체, 즉 TR109의 VH-CH1와 서열번호 97인 CH1-hinge(partial)-IntN-MBP-(His)6이 융합한 VH-CH1-hinge(partial)-IntN-MBP-(His)6 및 (ii) TR109의 VL-CL 단백질을 각각 인코딩하는 2종류의 Fab#2-IntN 발현단위를 제작하고 이들을 각각 주형으로 PCR로 T7 프로모터가 있는 증폭산물을 확보하였다. 체외전사하여 mRNA를 제조하였다. 제조된 mRNA를 반응구에 첨가하여 함께 삼자 방식으로 공동 형질감염시켜 FabTNFR2- IntN 복합체를 합성하였다.
이중특이적 항체의 제조를 위한 발현단위는 3종류의 IntC/Fab#1-Fc 발현단위와 2종류의 Fab#2-IntN 발현단위를 포함하였다.
도 16의 바이오리액터는 유용물질, 당화단백질, 항체의 연속 생산을 하기 위해서, 상기 실시례 12항의 바이오리액터에 있는 내부 챔버의 구성물질은 1차 챔버, 외부챔버의 구성물질은 2차 챔버로 구성물질을 배분하여 바이오리액터를 운영하여 항체를 연속 생산할 수 있다.
실시례 13에서처럼 먼저, 관심 mRNA 생산을 위한 예시적인 1차 및 2차 챔버는 구체적으로, 실시례 <7.2. 합성 시스템에서 RNA 합성> 항에서 1, 2 및 3차 반응의 반응조성물을 1차 및 2차 챔버로 나누어 구성물질을 각각 구성하였다. 구체적으로 <실시례 7.2.3. 3차 반응> 항의 반응조성물을 나누어 구성한 1차 및 2차 챔버의 반응조성물은 <표 13>에 제시하였다. <표 13>의 발현단위는 DNA 및 RNA를 포함하는 핵산에서 선택되어진 어느 하나 이상을 의미한다. 상기 RNA 발현단위는 상기 DNA 발현단위를 체외전사하여 준비할 수 있다.
상기 1차 챔버에 있는 N-말단 헥사히스티딘 태그를 갖는 T7 RNA 중합효소 및 캡핑효소 발현단위로부터 과다 발현한 반응무세포 시스템을 AKTA purifier(GE Healthcare 사, 미국)을 이용한 고속 단백질 액체 크로마토그래피(Fast Protein Liquid Chromatography: FPLC)에 의해서 정제시킬 수도 있다.
1차 챔버는 RNA 합성을 위해서는 체외전사(In vitro transcription) 버퍼 또는 자체 제작하는 무세포 시스템인 <실시례 5항>에서 제조하는 BL21 (DE3) 용해물에 <표 13>의 조성물을 첨가하고 mCherry mRNA 발현단위 대신에 관심 RNA 발현단위인 이중특이적 항체의 제조를 위한 3종류의 IntC/Fab#1-Fc 발현단위와 2종류의 Fab#2-IntN 발현단위를 주형으로 RNA를 합성한다.
상기 바이오리액터에서 최종산물 mRNA 생산을 위해서, 관심 RNA 발현단위(EU)는 3종류의 IntC/Fab#1-Fc 발현단위와 2종류의 Fab#2-IntN 발현단위를 사용하여 진핵세포에서 발현할 수 있도록 <실시례 3항>을 참조하여 제작하였다.
2차 챔버는 <실시례 5항>에서 제조하는 BL21 (DE3) 용해물 또는 상업화 무세포 단백질 합성 키트의 구성성분을 사용하였다. 상기 상업화 무세포 단백질 합성 키트는 NEBExpress Cell-free E. coli Protein Synthesis System(NEB사, 미국), AccuRapid™ Cell-Free Protein Expression Kit(Bioneer 사, 한국) 및 E. coli S30 Extract System for Linear Templates(Promega 사, 미국) 및 PURExpress In Vitro Protein Synthesis(NEB 사, 미국) 등에서 선택하여 사용할 수도 있다. 본 실시례에서는 AccuRapid™ Cell-Free Protein Expression Kit(Bioneer 사, 한국)를 사용하였으며 제품의 지침서에 따라 상기 RNA 중합효소 발현단위와 설계 발현단위의 발현산물인 효소 혼합물(반응무세포 시스템)을 제조하였다.
상기 제조된 설계 발현단위의 발현산물 NTP 대사경로 Kinases에 의해 NMP 혼합물(20% v/v, 각각 4mM)가 전환된 NTP를 포함하는 반응용해물을 Vivaflow 50(Sartorius 사, 독일)로 TFF(Tangential Flow Filtration)을 하여 NTP를 습득할 수도 있다.
2차 챔버에서 사용하는 무세포 시스템은 <실시례 5.4 항>에 따라 BL21 (DE3) 세포를 제조하여 25mM lactose(바람직하게, lactose 또는 IPTG의 양은 배양양상에 따라 조절한다) 유도하여 T7Pol을 포함되도록 (Endo DdRp+saDdRp 발현단위)이 도입된 BL21 (DE3) 무세포 시스템을 50 mM 트리스, 50 mM NaCl (pH 7.0) 반응완충용액 또는 40 내지 60mM의 인산칼륨, 1 내지 5mM의 MnCl2 및 /또는 10 내지 50mM의 MgCl2(예를 들어, 20mM MgCl2)를 포함하는 인산칼슘 완충용액에 첨가하여 최종농도 30.0 mg/mL 총 단백질이 되도록 준비하였다. 본 RNA 반응시스템(CFR)에 <실시례 5.4항>에서처럼 아미노산 혼합물과 에너지 원을 추가할 수도 있다.
1차 챔버와 2차 챔버를 포함하는 바이오리액터가 운영되면서 1차 챔버는 NTP 혼합물을 중합하여 RNA를 합성하면서 PPi(무기 인산염) 부산물이 생겨 Mg2+와 침전물을 형성하여 RNA 합성을 감소시키는 요인으로 작용할 수 있으며. 2차 챔버는 합성되는 NTP 혼합물(외부 첨가되는 변형된 NTP를 포함할 수 있음)이 준비되면 한외여과 및 정용여과 시스템은 투석여과를 실시할 경우, 1차 챔버는 NTP 혼합물을 공급을 받으며 PPi를 방출할 수 있으며 2차 챔버는 생산된 NTP 혼합물을 1차 챔버에 제공하고, 1차 챔버에서 방출되는 PPi를 수거하도록 운영하여 RNA의 연속 생산을 할 수도 있다. 상기 PPi를 RNA 합성대사 반응구에서 제거함으로써. 상기 PPi는 RNA 합성의 필수성분인 Mg2+과 결합하여 침전할 수도 있어 RNA 합성을 저해할 수도 있어 상기 공정을 이용하여 반응계에서 PPi를 제거함으로 RNA 합성 반응효율을 높일 수도 있다. 상기 제조된 RNA는 2차 구조를 갖는 5'UTR과 3'UTR가 있는 RNA로 RNase 내성이 있어 안정성을 확보할 수도 있다.
또한, 상기 RNA 합성대사의 반응 부산물이면서 동시에 RNA 합성대사 저해제인 PPi를 Pyro-phosphatase (PPase; NEB 사, 미국) 또는 PPase 발현단위에 의해 2Pi로 분해함으로써 RNA 합성대사 반응성을 증가시키는 효과를 얻을 수 있다. 상기 PPase 발현단위는 <실시례 1항>을 참조하여 대장균 inorganic pyrophosphatase (ppa) gene (GenBank: M23550.1)을 이용하여 제조할 수 있다. 상기 한외여과 및 정용여과 시스템과 Pyro-phosphatase (PPase) 공정을 각각 별도, 연속 또는 동시에 할 수도 있다.
상기 1차 챔버에서 합성된 RNA를 포함하는 반응혼합용액을 상기 노즐과 투석 및 여과 공정을 하는 한외여과/정용여과 시스템으로 여과하여 RNA를 포함하는 농축 반응혼합용액을 수확하였다. 상기 RNA를 포함하는 농축 반응혼합용액을 얻기 위한 여과과정으로 단백질 합성을 저해하는 PVSA(평균 분자량 2-5 KDa)를 제거할 수도 있다.
상기 RNA를 포함하는 농축 반응혼합용액이 있는 1차 챔버에 단백질합성에 필요한 반응시약을 첨가하여 단백질을 합성할 수 있다. 또는. 부가적인 챔버, 3차 챔버는 1차 챔버에서 수확한 상기 RNA를 포함하는 농축 반응혼합용액의 RNA를 주형으로 단백질을 생산할 수도 있다.
본 발명의 단백질 생산을 위한 1차 챔버 또는 추가적인 챔버인 3차 챔버는 SHuffle 균주, yeast extract, insect cell, wheat germ, rabbit reticulocytes, CHO 및 human cell 각각에서 유래하는 자체 제작 무세포 시스템, 상업화된 무세포 시스템 또는 이들 간에 하이브리드를 구성하여 적용할 수도 있다. 사용하는 RNA는 mRNA, saRNA 또는 원형 RNA 등이며 RNA 구조는 무세포 시스템의 유래 세포가 원핵세포이며 원핵세균에서 번역할 수 있는 RNA 구조가 필요하여 <실시례 1항>을 참조하며 진핵세포이며 진핵세균에서 발현할 수 있는 RNA 구조가 필요하여 <실시례 2항>을 참조하여 구성할 수 있다
단백질을 합성하기 위해서 1차 챔버 또는. 부가적인 챔버, 3차 챔버는 상업화된 SHuffle 균주 용해물, 1-Step Human High-Yield In Vitro Translation Kits(Thermo Fisher Scientific, 미국)의 HeLa cell lysate-based protein expression systems를 사용하였다. 1차 챔버에서 합성된 mRNA를 적절한 농도로 3차 챔버에 첨가하여 단백질을 제조할 수 있다. 본 실시례에서 사용하는 Hela cell lysate는 단백질의 번역후 변형(posttranslational modification)도 할 수 있는 시스템으로 단백질의 번역후 변형도 할 수 있다.
이중특이적 항체의 제조를 위한 3종류의 IntC/Fab#1-Fc 발현단위와 2종류의 Fab#2-IntN 발현단위에서 제조한 총 5종류의 mRNA로부터 제조한 두 종류의 IntC/Fab#1-Fc 복합체와 Fab#2-IntN복합체는 반응시스템에서 발현되었고 고정된 금속 친화성 크로마토그래피에 의해 발현 배지에서 분리된 후 크기 배제 크로마토그래피(SEC)를 통해 정제하였다. 300-mL 배양물로부터, 100 nmol(14 mg) IntC/FabCD30-Fc 복합체 및 30 nmol(3 mg) FabTNFR2-IntN 복합체를 얻을 수 있다.
<IMPTS 반응>
IMPTS 반응을 시작하려면 환원제가 필요하다. 초기 테스트를 위해 과량의 FabTNFR2-IntN 복합체(15μM)을 복합체 단백질(IntC/FabCD30-Fc; 10μM) 및 2mM DTT와 혼합하고 37°C에서 6시간 동안 인큐베이션하였다. 반응은 SDS-PAGE에서 모니터링할 수 있다. 산화된 글루타티온을 사용하여 이황화 결합의 재산화 후, MBP-특이적 아밀로스 수지를 사용하여 반응용액으로부터 MBP-융합된 단백질 단편을 제거한다. <도 21>에서처럼 SDS-PAGE 분석에서 HC와 LC에 해당하는 밴드가 관찰할 수 있다. N- 및 C-절단된 부산물의 분자량을 갖는 밴드도 관찰할 수 있다. 친화성 분리의 통과 성분의 추가 정제를 위한 SEC는 3개의 피크를 산출할 수 있다.
실시례 16. 무세포에서 Orthogonal translation system을 이용한 pAzF 함유 인슐린 제조
단백질 번역은 mRNA에 제공된 정보에 따라 단백질 서열이 구축되는 과정이다. 사실상, 이 과정에서 빌딩 블록으로 활용될 수 있는 표준 아미노산 세트가 제한되어 있다. 반대로, 비표준 아미노산은 다양한 생체 내 및 시험관 내 방법을 사용하여 재조합 단백질에 통합할 수 있다. 이러한 비자연적 삽입은 단백질 백본 또는 아미노산 측쇄에서 발생할 수 있는 유용한 변형을 제공한다.
20개의 표준 아미노산이외의 수 백 종류의 비표준 아미노산 특히, p-azido-l-phenylalanine(p-아지도-l-페닐알라닌, pAzF)을 특정위치에 통합하도록 단백질을, 특히 인슐린(pAzF 함유 인슐린)을 제조하고 상기 제조된 단백질에 번역후 변형(post-translational modification)을 도입하기 위해서 Orthogonal translation system(OTS)을 사용할 수 있다. 본 실시례는 OTS의 일 예로 pAzF에 특이적인 Aminoacyl-tRNA Synthetases 유전자/tRNA 유전자쌍를 지시하는 염기서열을 갖고 있는 pEVOL-pAzF(Addgene #31186, 미국)를 포함한다.
자연에서 단백질 백본 변형은 다양한 PTM(post-translational modification)의 결과인 반면, 재프로그래밍된 단백질 번역의 틀에서 생체 내 변형에 가장 쉬운 방법은 프롤린 유사체를 사용하는 것일 수도 있다. 다른 단백질 백본 변형은 일반적으로 시험관 내 리보솜 번역 시스템을 사용하여 생성한다. 예를 들어, β- 또는 γ-아미노산은 조작된 체외 번역 시스템을 사용하여 표적 폴리펩티드 서열에 삽입될 수 있다. 특히, α-하이드록시산은 예를 들어 특정 조작 시스템의 작용을 통해 인프레임 앰버 코돈에 반응하여 단백질에 통합될 수 있다. 그러나 대다수의 비표준 아미노산은 고유한 기능을 가진 단백질 측쇄의 변형을 전달한다. 자연계의 전형적인 예는 희귀한 22번째 단백질 생성 아미노산인 pyrrolysine(Pyl)이며, 이는 메탄생성 미생물의 극소수 프로테옴에 있다. Pyrrolysyl-tRNA synthetase(PylRS)는 다양한 아미노산 기질을 단백질에 통합할 수 있는 특히 강력한 효소이다. 이는 클래스 II 아미노아실-tRNA 합성효소(aaRS)인 PylRS의 작용을 통해 복잡한 Pyl-tRNA Pyl을 형성하는 tRNA Pyl 에 인식되고 효소적으로 결합한다. 동족 tRNA의 안티코돈은 CUA이며 천연적인 PylRS:tRNAPyl orthogonal pair을 제공한다. 이 쌍은 프레임 내 정지 코돈 억제(in-frame stop codon suppression, SCS) 및 ncAA 기질의 재조합 표적 단백질로의 후속 부위 특이적 리보솜 통합이 가능한 천연 직교 번역 시스템(OTS)에 대한 모든 요구 사항을 충족한다.
비표준 아미노산은 photocaged, fluorescent, 및 bio-orthogonal reactive 부위를 포함할 수 있다. 특히, 관심 효소의 활성화 관련하여 포스포세린(pSer), 포스포트레오닌(pThr) 및 포스포티로신(pTyr)와 같은 인산화된 아미노산를 선택하여 사용할 수도 있다. 상기 OTS는 또한 번역 후 변형(PTM)에 의해 변조된 생물학적 시스템 연구에 대한 전례 없는 접근을 제공한다. 비표준 아미노산은 본 실시례에서 선정된 pAzF에 제한 것은 아니며, 또한 단백질도 본 실시례에서 선정된 인슐린에 제한하는 것은 아니다. 이러한 비표준 아미노산에는 비표준 α-아미노산(예: p-아지도페닐알라닌)뿐만 아니라 고리형, 백본 확장형(예: β-, γ-, δ -), N-알킬화, 올리고머 유사체 등이 있다. 이러한 다양한 화학 물질을 펩타이드와 단백질에 특정 부위에 통합하면 새로운 생체 고분자 구조와 기능(예: 항체-약물 접합체 및 거대고리 폴다머-펩타이드 약물)이 생성될 수 있다 .
본 실시례의 pEVOL-pAzF 플라스미드는 pAzF를 앰버 코돈, TAG가 있는 DNA에 상응하는 단백질에 앰버 코돈 위치에 통합시키는 tRNA 합성효소/tRNA 쌍을 지시하는 염기서열이 클로닝되어 있는 플라스미드이다. pEVOL-pAzF를 대장균 BL21(DE3)로 형질전환하고, YT-K 플레이트에 세포를 도말하고, 37°C에서 밤새 배양하였다. 이쑤시개로 단일 콜로니를 집어 YT-K 배지 10mL에 직접 접종한 다음 37°C 및 220rpm에서 12시간 동안 배양하였다. 10mL 배양액을 200mL LB-K 배지로 옮기고 진탕기에서 밤새 계속 배양하였다.
Pfu 중합효소로 pEVOL-pAzF를 주형으로 pAzF에 특이적인 Aminoacyl-tRNA Synthetases 유전자(o-aaRS DNA) 및 o-tDNA 유전자의 5‘ 말단에 각각 T7 promoter가 존재하도록 콜로니-PCR로 증폭하였다. 증폭된 o-aaRS DNA와 o-tDNA PCR 산물을 정제하고 멸균증류수 2mg/mL로 희석하고 -20°C에서 보관하였다. pAzF 함유 인슐린은 상기 제조한 o-aaRS DNA와 o-tDNA PCR 산물을 사용하여 비천연 아미노산(nnAA), pAzF(Merck, 독일)를 인슐린에 통합하여 제조할 수 있다.
인슐린의 제조는 프로인슐린 또는 인슐린 A사슬과 B 사슬을 제조하는 방법이 있다. 전자의 경우는 프로인슐린 유전자를 주형으로 프로인슐린을 제조하고 Achromobacter lyticus 프로테아제, 카르복시펩티다제 B 및 트립신을 이용하여 인슐린 A 사슬과 B 사슬을 제조하고 이황화 결합을 유도하는 방법이다. 프로인슐린은 110개의 아미노산으로 구성된 MALWMRLLPL LALLALWGPD PAAAFVNQHL CGSHLVEALY LVCGERGFFY TPKTRREAED LQVGQVELGG GPGAGSLQPL ALEGSLQKRG IVEQCCTSIC SLYQLENYCN (서열번호 98)에서부터 유래한다. 프로인슐린은 서열번호 98에서 서열 1-24는 신호펩타이드, 25-54는 B 사슬(앞의 이중 밑줄), 57-87는 C 사슬, 90-110은 A 사슬(뒤의 이중 밑줄)이며, 서열 31과 96, 43과 109, 그리고 95와 100은 이황화 결합을 형성한다.
후자는 인슐린 A 사슬과 B 사슬을 각각 제조한 후 이황화 결합을 제조하는 방법이다. 프로인슐린의 활성 유형, 인슐린은 A와 B 사슬이 이황화 결합을 한 이형 이중합체이다. 인슐린 B 사슬은 30개의 아미노산으로 구성된 FVNQHL CGSHLVEALY LVCGERGFFY TPKT (서열번호 99)이며 인슐린 A-사슬은 21개의 아미노산으로 구성된 G IVEQCCTS IC SLYQLENYCN (서열번호 100)이다.
천연 인슐린 또는 pAzF 함유 인슐린 변이체의 발현을 위한 코돈 최적화 유전자를 바이오니아(한국)에서 합성하고 N-말단 메티오닌을 사용하여 독점 벡터로 서브클로닝하였다.
인슐린 B 사슬의 서열번호 99 및 인슐린 A 사슬의 서열번호 100 각각의 유전자는 N-말단에 His6-tag 다음에 TEV 프로테아제 부위[ENLYFQG]를 사용하여 태그가 지정되지 않은 단백질을 포획하고 최종적으로 정제할 수 있게 하였다. pAzF 함유 인슐린을 제조하기 위해 서열을 분석하고 pAzF를 통합하기 위한 부위로 여러 용매 노출 라이신(K) 및 아르기닌(R) 잔기를 선택하였다. 인슐린 B 사슬는 아르기닌(R)과 라이신(K) 잔기가 각각 1개씩 있어 본 실시례에서 인슐린 B 사슬의 유전자는 라이신(K) 잔기 코돈 대신에 앰버 코돈을 첨가하여 1개의 pAzF가 함유된 인슐린 B 사슬 변이체를 생성할 수 있도록 하였다.
결정된 T7 프로모터-5’UTR- His6 tag-ENLYFQG- 앰버코돈이 포함된 인슐린 B 사슬 유전자-T7 종결서열 및 T7 프로모터-5’UTR-His6 tag-ENLYFQG- 인슐린 A 사슬 유전자-T7 종결서열은 각각 대장균에 발현이 최적화하도록 염기서열을 결정하여 합성하였다(바이오니아, 한국). 상기 유전자는 https://www.ebi.ac.uk/Tools/st/emboss_backtranseq/ 를 통하여 대장균 codon usage로 역번역하여 염기서열을 최종적으로 결정하였다.
상기 T7 프로모터-5‘ UTR은 서열번호 101이며, T7 프로모터(TAATACGACT CACTATAGGG AGA), T7 g10 leader sequence(GGGAGACCA CAACGGTTTC CCTCTAAGTAA TAATTTTGTT TAACTTT) 및 RBS(AAAGAGGAGA AA)를 포함하며 이들간에 임의의 서열 부위(TACTAGAG 또는 TACTAG)가 있을 수 있다.
TAATACGACT CACTATAGGG AGATACTAGAG GGGAGACCA CAACGGTTTC CCTCTAAGTAA TAATTTTGTT TAACTTTAAA GAGGAGAAA TACTAGATG (서열번호 101)
T7 종결서열은 CTAGCATAAC CCCTTGGGGC CTCTAAACGG GTCTTGAGGG GTTTTTG (서열번호 102)를 포함한다. 상기 T7 종결서열의 상류에 있는 인슐린 사슬 유전자의 ORF 염기서열 다음으로 종결코돈(TAA)를 포함하는 TAATAACGCT GATAGTGCTA GTGTAGATCG CTACTAGAG (서열번호 103) 서열 부위를 관심 서열의 PCR을 하기 위한 프라이머를 제공할 목적으로 포함할 수 있다.
무세포 추출물은 실시례 5에서 제시한 방법으로 E. coli SHuffle strain (SHuffle2) 균주(NEB, 미국)로부터 제조하였다. 대장균의 세포질에는 이황화 결합 단백질 생산에 적합하지 않은 구획인 두 개의 이황화 결합 환원 경로가 있다. 세포질의 환원 구획의 문제는 SHuffle2 단백질 발현 균주에서 대장균의 세포질 산화 환원 경로의 산화 환원 공학 및 진핵생물 산화 효소 경로를 공동 발현함으로써 우회하였다. SHuffle2 세포는 퍼옥시다제 AhpC의 억제인자 돌연변이와 함께 티오레독신 환원효소(trxB) 및 글루타티온 환원효소(gor)의 결실로 인해 이황화 결합 환원력이 감소하며 진핵세포 글루타티온 퍼옥시다제-7(GPx7)과 산화 접힘을 담당하는 효소인 단백질 이황화 결합 이소머라제(PDI)를 사용하여 이황화 결합 형성할 수 있는 균주이다(Appl Microbiol Biotechnol. 2020; 104(22): 9693-9706).
상기 SHuffle2 세포 유래 무세포 단백질 합성 시스템은 pAMF 함유 인슐린 변이체의 합성에 필요한 모든 성분을 함유하는 <표 14>처럼 구성하여 무세포 추출물을 30%(V/V)로 RT(20℃)에서 혼합하였으며, 인슐린을 인코딩하는 DNA를 제외한 합성 시스템이다. 특히 NTP 합성대사경로의 kinase 발현단위 및 그들 발현산물을 포함하는 NTP 시스템은 무세포 단백질 합성 시스템에 내재된 RNase에 의해 분해되는 RNA에서 유래하는 NM(D)P를 NTP로 인산화하여 재생 NTP를 제공하도록 하였다.
성분 | 농도 |
NMP 혼합물 | 20% v/v, 각각 4mM |
RNA 중합효소 발현반위 및 NTP 합성대사경로의 kinase 발현단위 및 그들 발현산물을 포함하는 무세포 시스템 | 1.75 mg/mL 총단백질 |
RNA 중합효소 발현단위 및 그 발현산물을 포함하는 무세포 시스템 | 1.75 mg/ml 총단백질 |
Sodium Hexametaphosphate(SHMP) | 13 mM |
MgS04 | 45 mM |
PVSA | 0.15 - 15 mg/mL |
pAzF | 2mM |
인슐린-(His)6에 앰버 코돈을 포함하는 인슐린 B 사슬 및 인슐린 A 사슬 DNA | 각각 8 ug/mL |
T7가 프로모터가 있는 pAzF에 특이적인 o-aaRS DNA 및 o-tDNA 유전자 발현단위 | 각각 1 ug/mL |
무세포 합성 반응은 인슐린을 암호화하는 DNA를 첨가하여 시작하였으며 반응물을 1.5 mL 튜브에서 650rpm의 진탕기에서 30℃에서 12시간 동안 반응하였다. 12시간 후, 반응물을 수확하고, 15°C에서 30분 동안 15,000g에서 회전시킨 후, 0.45 μm 아미콘 필터 (Cat# Z717185, 밀리포어 시그마)를 사용하여 여과하였다.
이어서, 여과액을 완충액 A(5 mM 트리스, 17 mM M NaCl, 5248 mM 이미다졸)로 평형화된 2 mL HisTrap 엑셀 컬럼 (Cat # 50-150-10, Cytiva, 스웨덴)에 로딩하였다. 완충액 A로 철저하게 세척하여 흡광도를 기준선으로 되돌린 후, 완충액 B(50mM 트리스, 150mM M NaCl, 500mM 이미다졸]의 50% 스텝 그래디언트를 사용하여 단백질을 용리하였다. 용출 분획을 풀링하고, 농축하고, 버퍼 A에 대해 투석하면서 TEV 프로테아제(NEB, 미국)는 제조사의 지침에 따라 밤새 반응하였다.
투석된 절단 반응물을 사전 평형화된 HisTRAP 엑셀 5mL 컬럼에 다시 로딩하고, 태그되지 않은 단백질을 FT(flow-through) 분획에 수집하였다. 그 후, FT를 농축하고, 완충제 S (75 mM 트리스 pH 26.60, 28 mM NaCl)로 미리 평형화된 Superdex9893 34/50 크기 배제 크로마토그래피 (SEC) 컬럼 (Cat # 8-0-150, Cytiva, 스웨덴) 상에 로딩하였다. 최고 순도 분획(SDS-PAGE 및 SafeBlue 염색으로 평가한 >95%)을 -80°C 보관을 위해 결합, 농축 및 분취하였다. 그 후, 수집한 인슐린은 SDS-PAGE 겔로 분석한 결과는 CFPS에서 반응하여 얻은 시료는 예상하는 5kDa 전후에서 밴드를 형성하였으며 2mMDTT와 함께 배양한 시료에서는 상응하는 밴드를 확인할 수 없었다(도 22).
Cu-프리 클릭 반응(Cu-Free Click Chemistry, SPAAC)이라고도 하는 변형 촉진 알킨-아지드 고리 첨가(alkyne-azide cycloaddition)는 아민과 같은 자연 발생 작용기에 불활성 상태를 유지하면서 서로 배타적이고 효율적으로 반응하는 한 쌍의 시약, 사이클로옥틴(cyclooctyne) 및 아지드(azide)를 활용하는 생물학적 직교 반응이다. SPAAC는 안정한 트리아졸(triazole)의 형성을 통해 수성 및 기타 복잡한 화학적 환경에서 보조 시약 없이 다양한 생체 분자에 라벨링을 가능하게 한다.
많은 종류의 시클로옥틴 중에서 소위 DBCO(dibenzocyclooctyne) 화합물은 합리적으로 빠른 동역학 및 수성 완충액에서 우수한 안정성을 갖는 시약 부류를 구성한다. 생리학적 온도 및 pH 범위 내에서 DBCO 그룹은 많은 생체 분자에 자연적으로 존재하는 아민 또는 하이드록실과 반응하지 않는다. 또한, DBCO 그룹과 아지드 그룹의 반응은 sulfhydryl 그룹(-SH, 티올)들의 반응보다 훨씬 빠르게 일어난다.
상기 정제된 pAzF가 혼입된 단백질을 RT에서 4시간 동안 DBCO-TAMRA(Cat # A25-1, Click Chemistry Tools Inc, 미국), DBCO-PEG-자성입자(DBCO-자성입자, Kerafast, Inc, 미국), 또는 Tris-GalNAc-β-Ala-PEG4-DBCO(Sussex Research Laboratories Inc, 미국)와 함께 제조사의 지침에 따라 반응하였다. 그 후, DBCO-TAMRA을 포함하는 인슐린(TAMRA-인슐린)과 HepG2 세포주의 반응을 분석한 이미지로 세포를 TAMRA-인슐린(5μM)와 함께 1시간 동안 배양한 다음 DAPI(파란색)로 핵을 염색한 결과이다(도 23).
형광은 F-7000 Fluuorescence spectrometer(HITACHI, 일본)을 사용하여 TAMRA 형광은 여기 및 방출 파장은 각각 543nm 및 560-630nm이다. DAPI 형광은 405nm 레이저 라인으로 여기되었고 460nm(*?*10nm) 밴드패스 필터로 검출하였다. 형광 이미지는 Image Proplus 6.0 소프트웨어 및 Image J 버전 1.38x 소프트웨어로 처리하였다.
pAzF 함유 인슐린 변이체는 >150 μg/mL를 발현하였다. 정제된 pAMF를 포함하는 인슐린의 농도는 280nm에서의 흡광도로 측정하고 순도는 SDS-PAGE로 평가하였다. 장기 보관을 위해 인슐린을 액체 질소가 있는 용출 완충액에서 급속 냉동하고-80°C에 보관하였다.
T7 promoter가 5‘-말단에 부착된 o-aaRS DNA 및 o-tDNA 유전자를 주형으로 In vitro transcription kit(Thermo Fisher 사, 미국)의 지침에 따라 체외전사를 실시하여 pAzF에 특이적인 o-aaRS mRNA 및 o-tRNA를 제조할 수도 있다. 상기 제조한 o-aaRS mRNA와 o-tRNA를 이용하여 T7 프로모터가 있는 pAzF 특이적인 o-aaRS DNA 및 o-tDNA 유전자 발현단위 대신하여 pAzF 함유 인슐린을 제조할 수도 있다.
당업자는 통상의 실험을 사용하여 본 발명에 기재된 구체적인 실시형태에 대한 많은 등가물을 인식하거나, 확인할 수 있을 것이다. 본 발명에 기재된 본 실시형태의 범위는 상기 설명에 제한되는 것으로 의도되지 않지만, 오히려 첨부된 청구범위에 제시된 바와 같다. 당업자는 이러한 설명에 대한 다양한 변화 및 변형이 하기 청구범위에 정의된 바와 같은 본 발명의 사상 또는 범위로부터 벗어나지 않고 이루어질 수 있음을 이해할 것이다.
Claims (99)
- 리보핵산(ribonucleic acid: RNA)를 합성하기 위해서, 세포는
(a) 상기 세포에서 작동하는 프로모터, 조절서열 및 DdRp(DNA Dependent RNA Polymerase) ORF(open reading frame)를 포함하는 DNA(DdRp를 인코딩하는 DNA) 및/또는 번역이 가능한 DdRp mRNA;
(b) RNA 중합효소 발현단위(autogene);
(c) 관심 RNA 발현단위; 및
(d) 상기 발현단위들은 (i) DNA인 경우는 서로 작동하도록 연결하는 autogene system, 또는 (ii) RNA인 경우는 번역이 가능한 구조를 포함하는 핵산;을 포함하는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제1항에 있어서, 상기 세포는
상기 RNA 중합효소 발현단위의 발현 유도를 이용하여 상기 세포를 용해하는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - RNA를 합성하기 위해서, RNA 합성 시스템은
(a) 원하는 밀도의 세포를 용해시킴으로써, 전사 및 번역을 하는 DdRp를 인코딩하는 DNA, 그 전사체, 및 DdRp를 포함하는 군에서 선택되어진 어느 하나 이상을 포함 및/또는 첨가를 하는 무세포 시스템 또는 이들의 정제산물;
(b) RNA 중합효소 발현단위 및/또는 그 발현산물;
(c) 관심 RNA 발현단위;
(d) (i) 뉴클레오시드 트리포스페이트(NTP), 및/또는 (ii) 세포 RNA 유래 NTP 및 여기서, 선택적으로 포함되는 외인성 변형-NTP; 및
(e) 상기 발현단위들은 (i) DNA인 경우는 서로 작동하도록 연결하는 autogene system, 또는 (ii) RNA인 경우는 번역이 가능한 구조를 포함하는 핵산;을 포함하는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - RNA를 합성하기 위해서, RNA 합성 시스템은
(a) 원하는 밀도의 세포를 용해시킴으로써, (i) 전사 및 번역을 하는 DdRp를 인코딩하는 DNA, 그 전사체, 및 DdRp를 포함하는 군에서 선택되어진 어느 하나 이상, 및 (ii) RNA 중합효소 발현단위 및/또는 상기 RNA 중합효소 발현단위의 발현산물을 포함 및/또는 첨가를 하는 무세포 시스템 또는 이들의 정제산물;
(b) 관심 RNA 발현단위;
(c) (i) NTP 및/또는 (ii) 세포 RNA 유래 NTP 및 여기서, 선택적으로 포함되는 외인성 변형-NTP; 및
(d) 상기 발현단위들은 (i) DNA 경우는 서로 작동하도록 연결하는 autogene system, 또는 (ii) RNA 경우는 번역이 가능한 구조를 포함하는 핵산;을 포함하는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제3항 내지 제4항에 있어서, 상기 RNA 합성 시스템은
RNase 활성이 제거된 세포에서 유래하거나 및/또는 불활성화되는 조건을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제5항에 있어서, 상기 RNase 활성의 불활성화되는 조건은
한외여과 및 Fast Protein Liquid Chromatography(FPLC)를 포함한 물리적 분리, 화학적 억제제 및 RNase 저해제 단백질을 포함하는 군에서 선택되어진 어느 하나 이상을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제6항에 있어서, 상기 화학적 억제제는 폴리비닐 설폰산(PVSA)을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물.
- 제1항 내지 제4항에 있어서, 상기 DdRp를 인코딩하는 DNA의 프로모터는
(a) 프로모터를 포함하는 single promoter; 및
(b) (i) 프로모터 및 (ii) repressor, activator 및 이들의 조합을 포함하는 조절인자를 포함하는 군에서 선택되어진 어느 하나를 포함하는 hybrid promoter;를 포함하는 군에서 선택되어진 어느 하나로 상기 발현단위의 전사시기를 조절하는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제1항 내지 제4항에 있어서, 상기 RNA 중합효소 발현단위(autogene) 및 관심 RNA 발현단위는
각각 다른 벡터 또는 하나의 동일한 벡터에 있는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제9항에 있어서, 상기 벡터는
플라스미드, 선형 DNA, 박테리오파지(λ, M13, P1), 바이러스(동물 바이러스-레트로바이러스, 아데노바이러스, 아데노 관련 바이러스, 단순 헤르페스 바이러스, 백시니아 바이러스 등; 곤충 바이러스 - 배큘로 바이러스, 식물 바이러스 - 콜리플라워 모자이크 바이러스, 감자 바이러스 X, 쌍둥이자리 바이러스 등), 아그로박테리움 투메파시엔스 기반 벡터, 키메라 플라스미드(코스미드, 파지미드, 파스미드 및 포스미드), 인공 염색체(YAC, BAC, PAC, MAC 및 HAC) 및 비 대장균 벡터(예: 바실러스 및 슈도모나스 벡터 등) 기반 벡터를 포함하는 군에서 선택되어진 어느 하나 이상을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제1항 내지 제9항에 있어서, 상기 RNA 중합효소 발현단위(autogene)는
(a) DdRp, DdRp 및 캡핑효소, 그리고 이들의 융합효소를 포함하는 군에서 선택되어진 어느 하나를 포함하고, 선택적으로
(b) RNA dependent RNA Polymerase(RdRp);를 포함하여 인코딩하는 핵산 구조체를 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제11항에 있어서, 상기 RNA 중합효소 발현단위는
(a) 상류지역은 프로모터이고 하류지역은 DdRp를 인코딩하는 DNA를 포함하며;
(b) 상기 프로모터는 (i) 상기 세포 또는 무세포 시스템에 포함된 DdRp 및 (ii) 상기 RNA 중합효소 발현단위의 발현산물과 상호작용을 작동하도록 연결하는 autogene system;을 포함하는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제1항 내지 제12항에 있어서, 상기 DdRp는
T7 Polymerase, SP6 Polymerase 및 T3 Polymerase를 포함하는 군에서 선택되어진 어느 하나를 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제1항 내지 제13항에 있어서, 상기 RNA 중합효소 발현단위에 상기 DdRp를 포함하는 경우에 상기 관심 RNA 발현단위는
(a) 상기 DdRp에 의해 작동하는 프로모터;
(b) 진핵세포에서 번역할 수 있는 관심 RNA를 인코딩하는 DNA; 및
(c) 전사 종결서열;을 포함하는 DNA 구조체를 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제1항 내지 제14항에 있어서, 상기 RNA 중합효소 발현단위는
(a) DdRp;
(b) 캡핑효소;
(c) 테더링 시스템의 RNA 결합 도메인; 및
(d) 링커;를 포함하는 ctDdRp이며, 여기서, 또는 추가적으로 Poly(A) 중합효소를 포함하는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제15항에 있어서, 상기 테더링 시스템의 RNA 결합 도메인과 특이적으로 결합하는 RNA 염기서열을 포함하는 상기 관심 RNA 발현단위를 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물.
- 제15항 내지 제16항에 있어서, 상기 캡핑 효소는
백시니아 바이러스(Vaccinia virus) 및/또는 블루텅 바이러스(Blue Tongue virus)로부터 유래되는 캡핑 효소를 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제1항 내지 제15항에 있어서, 상기 RNA 중합효소 발현단위는 상기 선정된 DdRp에 의해 작동하는 프로모터의 하류에 RdRp 및 그의 변이체를 포함하는 군에서 선택되어진 어느 하나의 핵산 구조체를 포함하는 경우에 상기 관심 RNA 발현단위는
(a) DdRp에 의해 작동하는 프로모터;
(b) 상기 RdRp에 의해 복제될 수 있는 염기서열과 관심 RNA를 포함하는 RNA를 인코딩하는 DNA; 및
(c) 전사 종결서열;을 포함하는 DNA 구조체를 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제18항에 있어서, 상기 RdRp는
알파바이러스로부터 유래되는 RdRp를 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제19항에 있어서, 상기 RdRp에 의해 복제될 수 있는 염기서열로
(a) 알파바이러스에서 기원하는 5'복제서열:
(b) 알파바이러스에서 기원하는 SGP; 및
(c) 알파바이러스에서 기원하는 3'복제서열;을 포함하는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제1항 내지 제20항에 있어서, 상기 관심 RNA는
mRNA, saRNA(자가증폭 RNA), 원형 RNA, dsRNA, shRNA, miRNA, gRNA, pri-miRNA, premiRNA, piRNA, snRNA, IncRNA, 리보자임, rRNA, tRNA, snoRNA, ncRNA, 및 RNA 압타머를 포함하는 군에서 선택되어진 어느 하나 이상을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제21항에 있어서, 상기 mRNA는
진핵세포에서 단백질을 합성하도록 하는 구조를 포함하는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제22항에 있어서, 상기 mRNA는
캡구조, 5'UTR, 관심 RNA의 ORF, 3'UTR 및 poly(A) tail를 포함하는 진핵세포 mRNA를 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제21항에 있어서, 상기 원형 RNA 제조를 위해서, 상기 원형 RNA 발현단위는
리보자임(ribozyme)을 포함하는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제24항에 있어서, 상기 원형 RNA 제조를 위해서, 상기 원형 RNA 발현단위는
(a) (i) 5'말단의 3'그룹 I 인트론 단편인 제1 서열 및 3'말단의 5'그룹 I 인트론 단편인 제2 서열을 포함하는 원형화 요소; (ii) 원형화 요소의 제1 서열과 원형화 요소의 제2 서열 사이의 적어도 하나의 코딩 영역; 및 (iii) 코딩 영역에 작용가능하게 연결된 내부 리보솜 진입 부위 (IRES)를 포함하는 발현단위, 및
(b) 최소 전사 및 번역을 하는 무세포 시스템(전사-번역 시스템, TXTL system)에서 작동할 수 있는 프로모터;를 포함하는 핵산 구조체를 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제2항 내지 제25항에 있어서, 상기 RNA 합성 시스템에서 전사 및 번역을 하는 DdRp를 인코딩하는 DNA, 그 전사체, 및 DdRp를 포함하는 군에서 선택되어진 어느 하나 이상을 포함 및/또는 첨가를 하는 하는 무세포 시스템은
(a) 아미노산 혼합물 및
(b) 합성 에너지원;을 포함하는 군에서 선택되어진 어느 하나 이상을 포함하는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제26항에 있어서,
(a) 상기 아미노산 혼합물은 글리신, 알라닌, 발린, 류신, 이소류신, 프롤린, 페닐알라닌, 티로신, 트립토판, 시스테인, 메치오닌, 세린, 트레오닌, 리신, 아르기닌, 히스트딘, 아스파레이트, 글루타메이트, 아스파라긴 및 글루타민으로 이루어지는 군에서 선택된 적어도 한 종인 L-형 아미노산이고,
(b) 상기 합성 에너지원은 ATP, CTP, GTP, TTP 및 UTP를 포함하는 군에서 선택된 적어도 한 종;을 포함하는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제3항 내지 제27항에 있어서, 상기 세포 RNA 유래 NTP를 합성하기 위해서,
(a) (i) RNA 합성 시스템에서 작동하는 프로모터, 조절서열 및 DdRp ORF를 포함하는 DNA(DdRp를 인코딩하는 DNA) 및/또는 번역이 가능한 DdRp mRNA; 및 (ii) 상기 RNA 중합효소 발현단위; 5'뉴클레오시드 모노포스페이트 (5'NMP) 키나제 발현단위, 뉴클레오시드 디포스페이트(NDP) 키나제 발현단위 및 폴리포스페이트 키나제 발현단위를 포함하는 설계 발현단위를 포함하는 군에서 선택되어진 어느 하나 이상을 포함하는 세포를 배양하는 단계;
(b) 상기 각각 배양한 세포들을 융해하는 과정을 포함하는 반응용액, NTP를 제조하는 RNA 중합효소-세포 RNA 유래 NTP-무세포 시스템을 제조하는 단계;
(c) 상기 제조한 반응용액으로부터 NTP의 생산에 적절한 조건에 배양하는 단계 및 여기서, 선택적으로 RNase 활성의 불활성되는 조건을 처리하거나 상기 생산된 NTP를 정제하는 단계를 포함하며; 및
(d) 상기 발현단위들은 (i) DNA 경우는 서로 작동하도록 연결하는 autogene system, 또는 (ii) RNA 경우는 번역이 가능한 구조를 포함하는 핵산;을 포함하는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제3항 내지 제27항에 있어서, 상기 세포 RNA 유래 NTP를 합성하기 위해서,
(a) (i) RNA 합성 시스템에서 전사 및 번역을 하는 DdRp를 인코딩하는 DNA, 그 전사체, 및 DdRp를 포함하는 군에서 선택되어진 어느 하나 이상을 포함 및/또는 첨가를 하는 무세포 시스템; (ii) 상기 RNA 중합효소 발현단위 및/또는 그 발현산물; (iii) 5'NMP 키나제 발현단위, NDP 키나제 발현단위 및 폴리포스페이트 키나제 발현단위를 포함하는 설계 발현단위 및/또는 그들의 발현산물; 및 (iv) 폴리포스페이트;를 포함 및/또는 첨가하는 반응용액, RNA 중합효소-세포 RNA 유래 NTP-무세포 시스템을 제조하며,
(b) 상기 제조한 반응용액으로부터 NTP의 생산에 적절한 조건에 배양하는 단계 및 여기서, 선택적으로 RNase 활성의 불활성되는 조건을 처리하거나 상기 생산된 NTP를 정제하는 단계를 포함하며; 및
(c) 상기 발현단위들은 (i) DNA인 경우는 서로 작동하도록 연결하는 autogene system, 또는 (ii) RNA인 경우는 번역이 가능한 구조를 포함하는 핵산;을 포함하는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제28항 내지 제29항에 있어서, 상기 세포 RNA 유래 NTP를 합성하기 위해서,
5'NMP 키나제 발현단위, NDP 키나제 발현단위 및 폴리포스페이트 키나제 발현단위를 포함하는 설계 발현단위 및/또는 그들의 발현산물, 및 폴리포스페이트를 포함하거나 첨가하며 NDP의 생산에 적절한 조건 하에 배양하는 단계를 추가로 포함하는 방법을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제28항 내지 제29항에 있어서, 상기 세포 RNA 또는 외인성 세포 RNA를
(a) 5'NDP의 생산에 적절한 조건 하의 폴리뉴클레오티드 포스포릴라제 (PNPase) 키나제 발현단위를 포함하는 설계 발현단위 및/또는 그 발현산물 및 무기 포스페이트 (임의로 반응용액이 헬리카제를 추가로 포함함); 또는
(b) 선택적으로 리보뉴클레아제 발현단위를 포함하는 설계 발현단위 및/또는 그 발현산물을 포함하는 상기 설계 발현단위를 5'NMP의 생산에 적절한 조건 하에 배양하는 단계를 사용하여 분해하는 것;을 포함하는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제31항에 있어서, 상기 세포 RNA는
바이오매스(biomass)로부터 유래되는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제28항 내지 제32항에 있어서, 상기 세포 RNA 유래 NTP를 이용하여 RNA를 합성하기 위해서,
(a) 포스페이트 공여자를 포함하는 에너지원; 및
(b) 외인성 천연 및/또는 변형된 NTP 및/또는 캡핑시약을 포함하는 반응시약;을 추가로 포함하는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제33항에 있어서, 상기 포스페이트 공여자는
polyphosphate 및 헥사메타포스페이트를 포함하는 군에서 선택되어진 어느 하나 이상을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제33항에 있어서, 상기 외인성 NTP는
슈도UTP, 5-메틸시티딘 트라이포스페이트(5-메틸 CTP), 비변형된 AMP 및 GMP를 포함하는 것을 특징으로 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제33항에 있어서, 상기 외인성 NTP는
슈도UTP 및/또는 5-메틸 CTP, 비변형된 AMP, CMP, UMP 및 GMP중 1종 이상을 함유하는 혼합물을 포함하는 것을 특징으로 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제33항에, 외인성 변형된 NTP는
세포 RNA 유래 뉴클레오타이드에 첨가하여 부분적으로 변형된 mRNA를 달성하는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제33항에 있어서, 상기 캡핑 시약은
다이뉴클레오타이드, 트라이뉴클레오타이드 또는 테트라뉴클레오타이드 캡핑 시약인 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - RNA를 합성하기 위해서, (i) 전사 및 번역을 하는 DdRp를 인코딩하는 DNA, 그 전사체, 및 DdRp; 및 (ii) RNA 중합효소 발현단위를 포함하는 세포에서 유래하는 무세포 또는 그의 정제산물을 포함하는 RNA 합성 시스템의 조성물은
(a) 관심 RNA 발현단위;
(b) 포스페이트 공여자를 포함하는 에너지원;
(c) 외인성 천연 및/또는 변형된 NTP 및/또는 캡핑시약을 포함하는 반응시약;
(d) RNase 활성의 불활성화되는 조건; 및
(e) 상기 발현단위들은 (i) DNA인 경우는 서로 작동하도록 연결하는 autogene system, 또는 (ii) RNA인 경우는 번역이 가능한 구조를 포함하는 핵산;을 포함하는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제39항에 있어서, (i) 전사 및 번역을 하는 DdRp를 인코딩하는 DNA, 그 전사체, 및 DdRp; 및 (ii) RNA 중합효소 발현단위를 포함하는 세포에서 유래하는 무세포 또는 정제된 RNA 중합효소를 포함하는 RNA 합성 시스템의 반응 방법으로서,
(a) 상기 RNA 합성 시스템에 (i) 포스페이트 공여자를 포함하는 에너지원, (ii) 외인성 천연 및/또는 변형된 NTP 및 (iii) 선택적으로 캡핑시약;를 포함하는 반응시약을 첨가하며, 상기 RNase의 불활성화되는 조건을 처리한 후, 상기 관심 RNA 발현단위를 첨가하여 관심 RNA를 제조하도록 제1 반응용액을 배양하는 단계;
(b) 상기 배양된 제1 반응용액에서 생산된 상기 관심 RNA를 분리 및 정제하며, 여기서, 추가적 선택적으로 RNA 생산 이후에 상기 제1 반응용액에 적어도 1종의 데옥시리보뉴클레아제 발현단위 및/또는 데옥시리보뉴클레아제를 첨가하여 상기 DNA를 분해시키는 조건 하에서 배양하는 과정을 포함하는 단계;를 포함하는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - RNA를 합성하기 위해서, (i) 전사 및 번역을 하는 DdRp를 인코딩하는 DNA, 그 전사체, 및 DdRp; 및 (ii) 선택적으로 RNA 중합효소 발현단위를 포함하는 세포에서 유래하는 무세포 또는 정제 RNA 중합효소를 포함하는 RNA 합성 시스템의 조성물은
(a) 상기 RNase 분해산물을 기질로 하여 상기 NTP 혼합물을 제조할 수 있는 뉴클레오티드 키나제 발현단위;
(b) 세포 RNA(내인성 RNA 및/또는 외인성 RNA)를 분해하는 RNase 발현단위를 포함하는 설계 발현단위 및/또는 그 발현산물;
(c) 관심 RNA 발현단위;
(d) 포스페이트 공여자를 포함하는 에너지원;
(e) RNase 활성의 불활성화되는 조건; 및
(f) 상기 발현단위들은 (i) DNA인 경우는 서로 작동하도록 연결하는 autogene system, 또는 (ii) RNA인 경우는 번역이 가능한 구조를 포함하는 핵산;을 포함하는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제41항에 있어서, RNA를 합성하기 위해서, (i) 전사 및 번역을 하는 DdRp를 인코딩하는 DNA, 그 전사체, 및 DdRp; 및 (ii) 선택적으로 RNA 중합효소 발현단위를 포함하는 세포에서 유래하는 무세포 또는 그의 정제산물를 포함하는 RNA 합성 시스템의 반응 방법으로서,
(a) 상기 뉴클레오티드 키나제 발현단위 및/또는 그 발현산물을 포함한 세포로부터 상기 뉴클레오티드 키나제를 포함하는 세포용해물을 제조하고, 선택적으로 정제하는 단계;
(b) 세포 RNA(내인성 RNA 및/또는 외인성 RNA)로부터 RNase를 이용하여 NMP를 제조하고, 선택적으로 정제하는 단계;
(c) 상기 단계(a)의 제조한 뉴클레오티드 키나제를 포함하는 세포용해물들 혼합하여 제조한 세포 RNA 유래 NTP-무세포 시스템에 단계 (b)에서 제조한 NMP를 첨가하여 NTP를 제조하며, 선택적으로 정제하는 단계;
(d) 상기 RNA 합성 시스템에 (c)에서 제조한 NTP, (i) 포스페이트 공여자를 포함하는 에너지원, (ii) 선택적으로 외인성 천연 및/또는 변형된 NTP 및 (iii) 선택적으로 캡핑시약;을 포함하는 반응시약을 첨가하며, 상기 RNase의 불활성화되는 조건을 처리한 후, 상기 관심 RNA 발현단위를 첨가하여 관심 RNA를 제조하도록 제2 반응용액을 배양하는 단계; 및
(e) 상기 배양된 제2 반응용액에서 생산된 상기 관심 RNA를 분리 및 정제하며, 여기서, 추가적 선택적으로 RNA 생산 이후에 상기 배양한 반응용액에 적어도 1종의 데옥시리보뉴클레아제 발현단위 및/또는 데옥시리보뉴클레아제를 첨가하여 상기 DNA를 분해시키는 조건에서 배양하는 과정을 포함하는 단계;를 포함하는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제41항에 있어서, RNA를 합성하기 위해서, (i) 전사 및 번역을 하는 DdRp를 인코딩하는 DNA, 그 전사체, 및 DdRp; 및 (ii) 선택적으로 RNA 중합효소 발현단위를 포함하는 세포에서 유래하는 무세포 또는 그의 정제산물를 포함하는 RNA 합성 시스템의 반응 방법으로서,
(a) (i) 상기 뉴클레오티드 키나제 발현단위 및/또는 그 발현산물을 포함한 세포로부터 상기 뉴클레오티드 키나제를 포함하도록 제조하거나 정제된 세포용해물; (ii) 세포 RNA(내인성 RNA 및/또는 외인성 RNA)로부터 RNase를 이용하여 제조되거나 정제된 NMP; (iii) 상기 관심 RNA 발현단위, 포스페이트 공여자를 포함하는 에너지원, 선택적으로 외인성 천연 및/또는 변형된 뉴클레오티드 5'-트리포스페이트 및 선택적으로 캡핑시약을 포함하는 반응시약;을 준비하는 단계;
(b) 상기 RNA 합성 시스템에 단계 (a)에서 준비한 세포용해물, NMP 및 반응시약을 첨가하며, 상기 RNase의 불활성화되는 조건을 처리한 후, 상기 관심 RNA 발현단위를 첨가하여 RNA를 제조하도록 제3 반응용액을 배양하는 단계; 및
(c) 상기 배양된 제3 반응용액에서 생산된 상기 관심 RNA를 분리 및 정제하며, 여기서, 추가적 선택적으로 RNA 생산 이후에 상기 배양한 반응용액에 적어도 1종의 데옥시리보뉴클레아제 발현단위 및/또는 데옥시리보뉴클레아제를 첨가하여 상기 DNA를 분해시키는 조건에서 배양하는 과정을 포함하는 단계;를 포함하는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제28항 내지 제43항에 있어서, 상기 NTP는
1종 이상의 비변형된 NMP 및 1종 이상의 변형된 NTP로 이루어져, 1종 이상의 비변형된 뉴클레오타이드가 변형된 뉴클레오타이드로 100% 대체된 mRNA를 생성시키는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제28항 내지 제43항에 있어서, 상기 외인성 NTP는
비변형된 AMP, CMP 및 GMP 및 슈도우리딘 트라이포스페이트(슈도UTP)를 포함하는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제29항 내지 제43항에 있어서, 상기 RNase 발현단위는
RNase 및 그의 변이체를 포함하는 군에서 선택되어진 어느 하나 이상을 포함하는 발현단위로 상기 선정된 무세포유래 세포 RNA 중합효소에 의해 발현하는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제46항에 있어서, 상기 RNase는
S1 뉴클레아제, NucA, PNPase, RNase II, RNase III, RNase R, RNase T 및 RNase E를 포함하는 군으로부터 선택되어지는 어느 하나 이상을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제46항에 있어서, 상기 RNase는
RNA를 5'뉴클레오사이드 모노포스페이트로 분해하는 효소로 Nuclease P1을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제28항 내지 제43항에 있어서, 상기 뉴클레오티드 키나제는
(a) 적어도 1종의 폴리포스페이트 키나제(PPK);
(b) 적어도 1종의 시티딘 모노포스페이트(CMP) 키나제;
(c) 적어도 1종의 우리딘 모노포스페이트(UMP) 키나제;
(d) 적어도 1종의 구아노신 모노포스페이트(GMP) 키나제; 및,
(e) 적어도 1종의 뉴클레오사이드-다이포스페이트(NDP) 키나제;를 포함하는 군에서 선택되어진 어느 하나 이상을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제49항에 있어서, 상기 뉴클레오티드 키나제는
(a) 대장균으로부터의 (i) CMP 키나제(Cmk), (ii) UMP 키나제(PyrH), (iii) GMP 키나제(Gmk), 및( iv) NDP 키나제(Ndk); 및
(b) 폴리포스페이트 키나제(PPK2);를 포함하는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제1항 내지 제50항에 있어서, 상기 세포 또는 무세포유래 세포에 형질도입되는 (i) 상기 RNA 중합효소 발현단위, (ii) 상기 관심 RNA 발현단위 및 (ii) 상기 설계 발현단위를 포함하는 발현단위는
(a) 프로모터를 포함하는 single promoter; 및
(b) (i) 프로모터 및 (ii) 조절인자, repressor 및 activator의 종류 또는 이들의 조합을 포함하는 조절인자에서 선택되어진 어느 하나 이상을 포함하는 hybrid promoter;를 포함하는 프로모터에서 선택되어진 어느 하나로 상기 발현단위의 전사시기를 조절하는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제51항에 있어서, 상기 프로모터는
(a) T7 promoter와 Lac operator를 포함하는 시스템;
(b) Tetracycline-regulatable dual (activator/repressor) system; 및
(c) Trp operon regulatory system;를 포함하는 군에서 선택되어진 어느 하나 이상을 사용하여 구성하는 시스템을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제3항 내지 제52항에 있어서, 상기 DdRp 발현단위, RNA 중합효소 발현단위, 캡핑효소 발현단위 및 관심 RNA 발현단위를 최소한 포함하는 복수의 발현단위 군에서 선택되어진 어느 하나 이상은
(a) 상기 최소한 전사 및 번역을 할 수 있는 세포추출물을 제조하는 세포에 형질전환하는 방법; 및
(b) 상기 최소한 전사 및 번역을 할 수 있도록 제조된 세포추출물에 첨가하는 방법;을 포함하는 방법에서 선택된 어느 한 방법 또는 두 방법 모두를 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제3항 내지 제53항에 있어서, RNA를 합성하기 위해서, 상기 RNA 합성 시스템은
RNA 합성의 부산물인 inorganic pyrophosphate(PPi)를 분해하는 Pyro-phosphatase (PPase)을 더 포함하는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제1항 내지 제54항에 있어서, 상기 관심 RNA의 분리 및 정제 방법은
여과, 추출, 침전, 효소, 결합단백질, RNase, oligo dT 및 크로마토그래피을 포함하는 군에서 선택되어진 어느 하나 이상을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제55항에 있어서, 상기 침전은 염화리튬에 의해서 침전하는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물.
- 제55항에 있어서, 상기 효소는
(a) 5'-ppp-mRNA에서 피로포스페이트를 방출하여 5'-p-mRNA를 제조하는 5'-Polyphosphatase; 및
(b) 상기 제조된 5'-p-mRNA를 5'→3' 분해하는 엑소리보뉴클레아제 기능이 있는 Xrn1; 를 포함하는 군에서 선택되어진 어느 하나 이상을 사용하는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제55항에 있어서, 상기 결합단백질은 Capped RNA의 캡구조와 결합하는 단백질, eIF4E를 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물.
- RNA를 연속 생산하기 위해서, 전사 및 번역을 하는 DdRp를 인코딩하는 DNA, 그 전사체, 및 DdRp를 포함하는 군에서 선택되어진 어느 하나 이상을 포함 및/또는 첨가되고 구멍이 있는 막이 일부 또는 전부가 있는 내부용기와 외부용기를 포함하는 2-chamber bioreactor는
(a) 상기 RNA 합성에 관련한 거대분자(상기 막의 cutoff value 이상의 분자량을 갖는 물질)를 포함하고 상기 외부용기에 있는 반응물질이 이동할 수 있는 구멍이 있는 상기 막을 포함하는 표면이 있는 상기 내부용기; 및
(b) 상기 RNA 합성에 관련한 거대분자(상기 막의 cutoff value 이상의 분자량을 갖는 물질)와 상기 막의 cutoff value 이하의 분자량을 갖는 저분자를 포함한 반응물질을 포함하는 외부용기;를 포함하는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제59항에 있어서, 상기 막은
투과 막(dialysis membrane)이며, 그 cutoff value가 10~50kD 이하를 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제59항에 있어서, 상기 2-chamber bioreactor는
상기 내부용기를 상기 외부용기의 내부에 설치하는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제59항에 있어서, 상기 내부용기와 외부용기의 반응용액 부피비율은
1:2~50인 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제59항 내지 제62항에 있어서, RNA 합성을 위하여, 상기 2-chamber system은
(a) (i) RNA 중합효소 발현단위 및/또는 그 발현산물 RNA 중합효소를 포함하는 군에서 선택되어진 어느 하나 이상, 및 (ii) 관심 RNA 발현단위를 포함하는 상기 inner chamber;
(b) (i) RNA 중합효소 발현단위 및/또는 그 발현산물을 포함하는 군에서 선택되어진 어느 하나 이상, 및 (ii) 세포 RNA로부터 NTP를 합성하는 NTP 합성대사경로 유전자 발현단위를 포함하는 설계 발현단위 및/또는 그 발현산물에서 선택되어진 어느 하나 이상을 포함하며, (i) 포스페이트 공여자를 포함하는 에너지원, (ii) 선택적으로 외인성 천연 및/또는 변형된 뉴클레오티드 5'-트리포스페이트 및 (iii) 선택적으로 캡핑시약;을 포함하는 반응시약을 더 첨가하여 제조된 반응용액을 포함하는 상기 outer chamber;
(c) 선택적으로, 상기 발현단위들에서 선택되어진 어느 하나 이상으로부터 상응하는 단백질을 제조하는 부가적인 chamber; 및
(d) 상기 발현단위들은 (i) DNA인 경우는 서로 작동하도록 연결하는 autogene system, 또는 (ii) RNA인 경우는 번역이 가능한 구조를 포함하는 핵산;을 포함하는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제63항에 있어서, 상기 RNA 중합효소는
재조합 RNA 중합효소 또는 RNA 중합효소를 포함하는 미정제, 부분 정제 또는 정제된 무세포 시스템을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제59항 내지 제61항에 있어서, 상기 2-chamber bioreactor는
(a) dialysis tubing을 포함하는 상기 inner chamber; 및
(b) bioreactor bag을 포함하는 상기 outer chamber; 포함하는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제59항 내지 제65항에 있어서, 상기 outer chamber는
RNase 활성을 유지하는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 단백질 합성을 위해서, 단백질 합성 시스템의 반응조성물은
(a) 전사 및 번역을 하는 DdRp를 인코딩하는 DNA, 그 전사체, 및 DdRp를 포함하는 군에서 선택되어진 어느 하나 이상을 포함하는 무세포;
(b) (i) RNA 중합효소 발현단위, (ii) 관심 RNA 발현단위, (iii) 세포 RNA를 분해하는 1종 이상의 RNase 발현단위를 포함하는 설계 발현단위 및/또는 그 발현산물; 외인성 천연 및/또는 변형된 NTP; 및 (i) 외인성 또는 내인성 천연 및/또는 변형된 NMP, 및 (ii)뉴클레오티드 키나제 발현단위를 포함하는 설계 발현단위 및/또는 그 발현산물;을 포함하는 군에서 선택되어진 어느 하나 이상을 포함하고 배양하는 최소한 전사와 번역하는 무세포 시스템, 여기서, 상기 발현단위들은 서로 작동하도록 연결하는 autogene system을 포함하며;
(c) RNase 활성이 제거되거나 불활성화하는 조건;
(d) 헥사메타포스페이트 또는 폴리포스페이트를 포함하는 에너지원; 및
(e) 선택적으로, 캡핑시약;를 포함하는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 단백질 합성을 위해서, 전사 및 번역을 하는 DdRp를 인코딩하는 DNA, 그 전사체, 및 DdRp를 포함하는 군에서 선택되어진 어느 하나 이상을 포함 및/또는 첨가하는 무세포 시스템을 포함하는 단백질 합성 시스템의 반응조성물은
(a) RNase 활성이 제거되거나 불활성화하는 조건; 및
(b) 제1항 내지 제55항의 상기 무세포 시스템에서 번역이 가능한 RNA;을 포함하는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 단백질을 생산하기 위해서, 전사 및 번역을 하는 DdRp를 인코딩하는 DNA, 그 전사체, 및 DdRp를 포함하는 군에서 선택되어진 어느 하나 이상을 포함 및/또는 첨가하는 무세포 시스템을 포함하는 단백질 합성 시스템의 반응조성물은
(a) RNase 활성이 제거되거나 불활성화하는 조건;
(b) RNA 중합효소 발현단위(autogene);
(c) 관심 RNA 발현단위:
(d) (i) NTP, (ii) 세포 RNA 유래 NTP 및/또는 외인성 천연 및/또는 변형된 NTP, 및 (iii) 유기합성 NMP, 세포 RNA 유래 NMP 및 뉴클레오티드 키나제 발현단위를 포함하는 설계 발현단위 및/또는 그 발현산물에 의해 제조되는 세포 RNA 유래 NTP, 및 여기서, 선택적으로 첨가되는 외인성 천연 및/또는 변형된 NTP를 포함하는 군에서 선택되어진 어느 하나 이상에 의해 제조되는 NTP; 및
(e) 상기 발현단위들은 (i) DNA인 경우는 서로 작동하도록 연결하는 autogene system, 또는 (ii) RNA인 경우는 번역이 가능한 구조를 포함하는 핵산;을 포함하는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제67항 내지 제69항에 있어서, 상기 무세포 시스템을 포함하는 단백질 합성 시스템은 선택적으로
(a) chaperones, ribosome 및 ribosomal factor;
(b) tRNA 및 aminoacyl-tRNA synthetase;
(c) Initiation factors 및 elongation factor를 포함하는 관련 factors;
(d) ATP 및 GTP를 포함하는 에너지원; 및
(e) 20개의 표준 아미노산 및/또는 비표준 아미노산;을 포함하는 반응시약에서 한 종류 이상을 첨가하는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제70항에 있어서, 상기 ATP 및 GTP를 포함하는 에너지원 및/또는 전사에 사용하는 NTP를 제공하는 NTP 재생 시스템을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물.
- 제71항에 있어서, 상기 NTP 재생 시스템은
(a) 아세테이트 키나아제/아세틸 포스페이트(AcK/AcP);
(b) 피루베이트 키나아제/포스포에놀피루베이트(PK/PEP); 및
(c) 폴리포스페이트 키나아제/폴리포스페이트(PPK/PolyP)를 포함하는 군세서 선택되어진 어느 하나 이상을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제72항에 있어서, 상기 폴리포스페이트 키나아제/폴리포스페이트(PPK/PolyP)은
(a) 폴리포스페이트 키나아제 2(PPK2) 및
(b) 헥사메타포스페이트 또는 폴리포스페이트를 포함하는 에너지원;을 포함하는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제67항 내지 제73항에 있어서, 상기 무세포 시스템을 포함하는 단백질 합성 시스템은
상기 탄소원, 건조 보호제 및/또는 에너지원으로 말토덱스트린(maltodextrin) 및 말토스(maltose)를 포함하는 당;을 추가적으로 포함하는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제67항 내지 제74항에 있어서, 상기 무세포 시스템을 포함하는 단백질 합성 시스템은
post-translational modification을 수행하는 유전자 발현단위를 포함하는 설계 발현단위 및/또는 그 발현산물을 포함하는 군에서 선택되어진 어느 하나 이상을 포함하는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제75항에 있어서, 상기 post-translational modification은
이황화결합, phosphorylation, acetylation, methylation 및 glycosylation을 포함하는 군에서 선택되어진 어느 하나 이상을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - RNA 및/또는 유용물질을 연속 생산하기 위해서, 상기 RNA 및/또는 유용물질 합성 시스템 1은
(a) 상기 RNA 및/또는 유용물질을 합성하는 반응용액이 있는 1차 챔버;
(b) 세포 RNA 유래 NTP를 합성하는 반응용액이 있으며 합성된 상기 세포RNA 유래 NTP를 상기 1차 챔버에 공급하는 2차 챔버;
(c) 투석 및 여과 공정을 하는 한외여과/정용여과 시스템; 및
(d) 상기 챔버들과 한외여과/정용여과 시스템 간을 연결하는 노즐;을 포함하는 바이오리액터이며, 여기서 상기 챔버들은 각각 독립적 운영 또는 동시에 공동운영을 하며, 및
(e) 선택적으로, 추가적인 챔버;를 포함하는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제77항에 있어서, 상기 RNA 및/또는 유용물질 합성 시스템 1은
(a) 상기 2차 챔버는 세포 RNA 유래 NTP를 합성하는 단계;
(b) 상기 2차 챔버는 상기 노즐과 한외여과/정용여과 시스템을 통해 상기 제조된 세포 RNA 유래 NTP 및 선택적으로 천연 NTP 및/또는 변형 NTP를 포함하는 외인성 반응원재료를 상기 1차 챔버에 공급하는 단계;
(c) 상기 1차 챔버는 상기 공급받은 세포RNA 유래 NTP를 혼합한 반응용액에서 RNase 활성의 불활성되는 조건이 처리하고 상기 RNA를 합성하여 수확하며, 여기서 선택적으로 수확하거나 상기 노즐과 한외여과/정용여과 시스템을 통해 상기 RNA를 포함하는 반응용액을 여과하는 단계; 및
(d) 선택적으로, 상기 1차 챔버에서 합성된 RNA를 포함하는 반응용액과 RNase 활성의 불활성화 조건이 처리하고 단백질을 포함한 유용물질을 합성하는 무세포 시스템을 이용하여 상기 1차 챔버, 또는 추가적인 챔버에서 상기 유용물질을 생산하는 단계;를 포함하는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제77항 내지 제78항에 있어서, 상기 1차 챔버 및/또는 2차 챔버와 상기 한외여과/정용여과 시스템을 노즐로 연결하는 상기 1차 챔버 및/또는 2차 챔버 부위에 추가적으로 여과막을 설치하는 바이오리액터를 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물.
- 제76항 내지 제78항에 있어서, 상기 한외여과막은 한외여과(Ultrafiltration, UF) 공정 및 정용여과(Diafiltration, DF) 공정을 포함하는 군에서 선택되어진 어느 한 공정 이상을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물.
- 제77항에 내지 제80항에 있어서,
(a) 1차 챔버는 RNA 및/또는 유용물질을 연속 생산하며, 한외여과/정용여과 시스템을 통하여, 필요한 반응원재료를 2차 챔버로부터 공급받고 발생하는 부산물을 2차 챔버로 이송하도록 하는 공정; 및
(b) 2차 챔버는 1차 챔버에서 필요한 반응원재료의 연속 생산을 하며, 상기 제조한 세포RNA 유래 NTP 및/또는 NTP를 포함한 외인성 반응원재료를 한외여과/정용여과 시스템을 통하여, 1차 챔버로 공급하도록 하며 1차 챔버에서 이송받은 부산물을 저장 및/또는 분해하는 공정;을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제77항에 내지 제78항에 있어서,
(a) 상기 1차 챔버와 상기 한외여과/정용여과 시스템을 포함하는 모듈; 및
(b) 상기 2차 챔버와 상기 한외여과/정용여과 시스템을 포함하는 모듈;을 포함하는 군에서 선택되어진 어느 한 모듈은 각각 독립적으로 운영하는 바이오리액터를 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제77항 내지 제82항에 있어서, 상기 1차 챔버는
(a) 상기 RNA 중합효소; 및
(b) 상기 유용물질 생산에 필요한 설계증폭발현 시스템 및/또는 이에 상응하는 RNA;를 포함하는 군에서 선택되어진 어느 하나 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제77항 내지 제83항에 있어서, 상기 2차 챔버는
(a) 세포 RNA로부터 NTP를 합성하는 NTP 합성대사경로 효소들에서 선택되어진 어느 하나 이상을 포함하며,
(b) (i) 상기 NTP 합성대사경로 효소 설계발현단위들로부터 선택되어진 어느 하나 이상의 RNA 및/또는 단백질을 제조하고; 및/또는 (ii) RNase 활성을 유지하는 부가적인 챔버;를 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제78항에 있어서, 상기 단계 (d)의 유용물질을 생산하는 무세포 시스템은
(a) chaperones, ribosome 및 ribosomal factor;
(b) tRNA 및 aminoacyl-tRNA synthetase;
(c) Initiation factors, elongation factor 등의 관련 factors;
(d) ATP 및 GTP 등을 포함하는 에너지원; 및
(e) 20 표준 아미노산;을 포함하는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제77항 내지 제85항에 있어서, 상기 설계발현단위는
상기 RNA 및/또는 유용물질 합성 시스템에 있는 DdRp에 의해 작동하는 프로모터를 포함하는 발현단위 및/또는 상응하는 RNA를 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - RNA 및/또는 유용물질을 연속 생산하기 위해서, RNA 및/또는 유용물질 합성 시스템 2의 상기 RNA 및/또는 유용물질 생산은
(a) 상기 세포 RNA 유래 NMP로부터 상기 세포 RNA 유래 NTP를 제조하며, 이어서 상기 제조한 세포 RNA 유래 NTP 및/또는 외인성 천연 또는 변형 NTP로부터 NTP 용액을 제조하는 단계;
(b) 상기 RNA 중합효소는 상기 관심 RNA 발현단위를 주형으로 상기 제조한 NTP 용액의 NTP를 중합하여 상기 관심 RNA를 합성하는 단계;
(c) 상기 유용물질을 생산하는 무세포 시스템에 상기 합성된 관심 RNA와 RNase 활성의 불활성화되는 조건을 처리하고 상기 설계증폭발현 시스템을 첨가하여 관심 RNA를 주형으로 단백질을 합성하는 단계;를 포함하는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제87항에 있어서,
(a) 단계 (a)의 세포 RNA 유래 NMP로부터 NTP를 제조하는 공정은 원핵세포 유래 무세포; 및
(b) 단계 (c)의 단백질을 합성하는 공정은 원핵세포 유래 무세포, 진핵세포 유래 무세포, 전사와 번역관련 생체분자들로 재구성된 최소한 전사과 번역이 가능한 시스템(PURE cell-free transcription-translation system), 및 하이브리드 무세포를 포함하는 군에서 선택되어진 어느 하나;를 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제83항 또는 제87항에 있어서, 상기 설계증폭발현(DAE, Designed Amplifying Expression) 시스템은 설계발현단위 및 autogene system을 포함하며, 상기 설계발현단위는
(a) 상기 RNA 및/또는 유용물질을 제공하도록 하는 관심 RNA 발현단위;
(b) RNA 중합효소 발현단위(Autogene);
(c) 상기 RNA 및/또는 유용물질 생산에 필요한 설계 발현단위; 및
(d) 상기 발현단위들은 (i) DNA인 경우는 서로 작동하도록 연결하는 autogene system, 및/또는 (ii) RNA인 경우는 번역이 가능한 구조를 포함하는 핵산;을 포함하는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제89항에 있어서, 상기 RNA 및/또는 유용물질 생산에 필요한 설계발현단위는
(a) (i) 세포 RNA로부터 NTP를 합성하는 NTP 합성 대사경로 유전자들을 포함하는 군에서 선택되어진 어느 하나 이상; (ii) ribosome recycling factor, chaperones, ribosome 구성 단백질 및 ribosomal factor를 포함하는 군; aminoacyl-tRNA synthetase를 포함하는 군; 및 Initiation factors 및 elongation factor를 포함하는 관련 군;을 포함하는 단백질합성기전 분자에서 선택되어진 어느 하나 이상; 및 (iii) 단백질내 또는 단백질간의 이황화 결합 및 단백질 당화를 포함하는 번역후 변형(PTM)을 유도하는 유전자들을 포함하는 군에서 선택되어진 어느 하나 이상을 포함하며; 및
(b) 선택적으로 상기 발현단위들이 지시하는 단백질들을 합성하는 부가적인 챔버;를 포함하는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제90항에 있어서, 상기 단백질내 또는 단백질간의 이황화 결합을 유도하는 유전자는
(a) 인간 단백질 이황화 이소머라제(Protein disulfide isomerase, PDI);
(b) Glutathione peroxidase 7(GPx7); 및
(c) 인간 단백질 이황화 이소머라제(PDI) 및 퍼옥시다제 7 유전자의 융합체(PDI-GPx7 융합);를 포함하는 군에서 선택되어진 어느 하나 이상을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제67항 내지 제91항에 있어서, 상기 RNase의 불활성화되는 조건은
(a) 폴리비닐 설폰산(PVSA);
(b) 단백질 RNase 저해물질 발현단위 및/또는 그 발현산물:
(c) 한외여과 및 Fast Protein Liquid Chromatography(FPLC)를 포함하는 물리적 분리 공정; 및
(d) RNase에 내성이 있는 RNA;을 포함하는 군에서 선택되어진 어느 하나 이상을 첨가하거나 실시하는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제92항에 있어서, 상기 RNase 활성의 불활성되는 조건은
(a) 상기 RNase inhibitor 발현단위를 포함하고 단백질내 또는 단백질간의 이황화 결합을 유도하는 조건이 있는 무세포 시스템;
(b) 상기 PVSA; 및
(c) 선택적으로, 상기 RNase에 내성이 있는 RNA;를 포함하는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제92항 내지 제93항에 있어서, 상기 PVSA의 첨가하는 농도는
상기 RNA 및/또는 유용물질 합성 시스템에서 상기 PVSA의 농도와 RNase 활성 및/또는 단백질 합성의 연관성을 이용하여 결정하는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제92항 내지 제93항에 있어서, 상기 RNase에 내성이 있는 RNA는
(a) 캡 구조;
(b) 2차 구조를 형성하는 서열이 있는 5'UTR;
(s) 2차 구조를 형성하는 서열이 있는 3'UTR; 및
(d) Cytidine를 포함하는 poly(A) tail;을 포함하는 군에서 선택되어진 어느 하나 이상을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제77항 내지 제95항에 있어서, 상기 RNA 및/또는 유용물질 합성 시스템에서 inorganic pyrophosphate(PPi)의 제거 공정은
(a) 한외여과/정용여과를 포함하는 공정; 및
(b) Pyro-phosphatase (PPase) 및/또는 PPase 발현단위에 의한 PPi로부터 Pi의 분해 과정을 포함하는 공정;을 포함하는 군에서 선택되어진 어느 하나 이상을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제1항 내지 제96항에 있어서, 상기 autogene system은
(a) 상기 RNA 및/또는 유용물질 합성 시스템에 포함 및/또는 첨가되는 DdRp는 autogene system의 촉발자로 상기 RNA 중합효소 발현단위(autogene)를 구성하는 프로모터와 작용하여 하류지역에 있는 DdRp를 발현하도록 하며; 및
(b) 상기 autogene system을 구성하는 발현단위의 프로모터는 상기 단계 (a)에서 발현된 DdRp에 의해 하류지역 유전자를 전사하도록 하는 것;을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제97항에 있어서, 상기 autogene system에 의해 발현이 관리되는 발현단위는
(a) 관심 RNA 발현단위, RNA 중합효소 발현단위 및 설계발현단위를 포함하는 DNA; 및
(b) 이들의 전사산물 RNA;를 포함하는 핵산에서 선택되어진 어느 하나 이상을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물. - 제67항 내지 제98항에 있어서, 상기 단백질 합성 시스템은
(a) orthogonal translation system 및 비표준 아미노산을 포함하고, 및
(b) 비표준 아미노산을 특정 부위에 통합하도록 단백질을 제조하는 단계; 및
(c) 상기 제조된 비표준 아미노산 함유 단백질에 번역후 변형을 하는 단계;를 포함하는 것을 특징으로 하는 관심 RNA 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 RNA 전사시스템, 그리고 이들의 방법 및 생산물.
Applications Claiming Priority (10)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020220097666 | 2022-08-05 | ||
KR20220097666 | 2022-08-05 | ||
KR1020220109799 | 2022-08-31 | ||
KR20220109799 | 2022-08-31 | ||
KR1020220129302 | 2022-10-11 | ||
KR1020220129302A KR20230134409A (ko) | 2022-03-14 | 2022-10-11 | 관심 rna 및/또는 유용물질의 생산을 위한 세포, 전사-번역을 하는 시스템 및 rna 전사시스템, 그리고 이들의 방법 및 생산물 |
KR1020220172228 | 2022-12-12 | ||
KR1020220172228A KR20230134413A (ko) | 2022-03-14 | 2022-12-12 | 관심 rna 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 rna 전사시스템, 그리고 이들의 방법 및 생산물 |
KR1020230018442 | 2023-02-13 | ||
KR20230018442 | 2023-02-13 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20240020179A true KR20240020179A (ko) | 2024-02-14 |
Family
ID=89896692
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020230078194A KR20240020179A (ko) | 2022-08-05 | 2023-06-19 | 관심 rna 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 rna 전사시스템, 그리고 이들의 방법 및 생산물 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20240020179A (ko) |
-
2023
- 2023-06-19 KR KR1020230078194A patent/KR20240020179A/ko unknown
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Gan et al. | A combined cell‐free transcription‐translation system from Saccharomyces cerevisiae for rapid and robust protein synthe | |
JP4729222B2 (ja) | 組換えクローニングにおける独自の選択性を有する複数の組換え部位の使用 | |
JP7058839B2 (ja) | ローリングサークル増幅産物を使用した無細胞タンパク質発現 | |
Williams et al. | Generic plasmid DNA production platform incorporating low metabolic burden seed‐stock and fed‐batch fermentation processes | |
US20030032141A1 (en) | Protein and nucleic acid expression systems | |
KR20220126725A (ko) | 유전자 편집을 위한 변형된 가이드 rna | |
Spirin et al. | Cell-free protein synthesis: methods and protocols | |
US20160032295A1 (en) | Methods, compositions and kits for a one-step dna cloning system | |
WO2002008408A2 (en) | Modular vector systems | |
AU2020283757A1 (en) | Methods and compositions for manufacturing polynucleotides | |
Okauchi et al. | Minimization of elements for isothermal DNA replication by an evolutionary approach | |
JP2020537505A (ja) | ホスホロチオエート化したヌクレオチドを含む二本鎖鎖状体dnaを使用するインビボrna又はタンパク質発現 | |
JP7028986B2 (ja) | タンパク質合成効率を高めることができるタンデムdnaエレメント | |
KR20220113437A (ko) | 핵산 조성물 | |
KR20240020179A (ko) | 관심 rna 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 rna 전사시스템, 그리고 이들의 방법 및 생산물 | |
KR20230134413A (ko) | 관심 rna 및/또는 유용물질의 생산을 위한 세포, 무세포 시스템 및 rna 전사시스템, 그리고 이들의 방법 및 생산물 | |
EP2954066A1 (en) | Cell-free translation system | |
KR20230134409A (ko) | 관심 rna 및/또는 유용물질의 생산을 위한 세포, 전사-번역을 하는 시스템 및 rna 전사시스템, 그리고 이들의 방법 및 생산물 | |
JP5246904B2 (ja) | 外来遺伝子導入用ベクター及び外来遺伝子が導入されたベクターの製造方法 | |
WO2023023487A1 (en) | Screening codon-optimized nucleotide sequences | |
WO2021195294A2 (en) | Fully orthogonal system for protein synthesis in bacterial cells | |
EP4121547A1 (en) | Methods and biological systems for discovering and optimizing lasso peptides | |
Spirin et al. | Cell-free protein synthesis systems: historical landmarks, classification, and general methods | |
KR20230061194A (ko) | 관심 rna 전사 시스템, 이를 포함하는 세포 및 이들의 용도 및 방법 | |
Karbalaei-Heidari et al. | Genomically integrated orthogonal translation in Escherichia coli, a new synthetic auxotrophic chassis with altered genetic code, genetic firewall, and enhanced protein expression |