KR20230153418A - 합성 리보핵산(rna)으로부터 단백질 발현을 증가시키기 위한 조작된 발현 작제물 - Google Patents
합성 리보핵산(rna)으로부터 단백질 발현을 증가시키기 위한 조작된 발현 작제물 Download PDFInfo
- Publication number
- KR20230153418A KR20230153418A KR1020237032938A KR20237032938A KR20230153418A KR 20230153418 A KR20230153418 A KR 20230153418A KR 1020237032938 A KR1020237032938 A KR 1020237032938A KR 20237032938 A KR20237032938 A KR 20237032938A KR 20230153418 A KR20230153418 A KR 20230153418A
- Authority
- KR
- South Korea
- Prior art keywords
- utr
- eec
- sequence
- seq
- set forth
- Prior art date
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 224
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 218
- 230000014509 gene expression Effects 0.000 title claims abstract description 132
- 229920002477 rna polymer Polymers 0.000 title description 107
- 108020005345 3' Untranslated Regions Proteins 0.000 claims abstract description 181
- 108020003589 5' Untranslated Regions Proteins 0.000 claims abstract description 114
- 108020004999 messenger RNA Proteins 0.000 claims abstract description 108
- 108091023045 Untranslated Region Proteins 0.000 claims abstract description 76
- 238000013519 translation Methods 0.000 claims abstract description 43
- 125000006850 spacer group Chemical group 0.000 claims abstract description 23
- 108700011259 MicroRNAs Chemical group 0.000 claims abstract description 18
- 230000017188 evasion or tolerance of host immune response Effects 0.000 claims abstract description 18
- 239000002679 microRNA Chemical group 0.000 claims abstract description 17
- 108091036066 Three prime untranslated region Proteins 0.000 claims abstract description 16
- 108091026898 Leader sequence (mRNA) Proteins 0.000 claims abstract description 15
- 125000003835 nucleoside group Chemical group 0.000 claims abstract description 9
- 125000003729 nucleotide group Chemical group 0.000 claims description 98
- 108010043121 Green Fluorescent Proteins Proteins 0.000 claims description 90
- 102000004144 Green Fluorescent Proteins Human genes 0.000 claims description 90
- 239000002773 nucleotide Substances 0.000 claims description 90
- 239000005090 green fluorescent protein Substances 0.000 claims description 85
- 239000000427 antigen Substances 0.000 claims description 84
- 108091007433 antigens Proteins 0.000 claims description 84
- 102000036639 antigens Human genes 0.000 claims description 84
- 108091026890 Coding region Proteins 0.000 claims description 60
- 230000027455 binding Effects 0.000 claims description 55
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 46
- 239000012634 fragment Substances 0.000 claims description 44
- 229960005486 vaccine Drugs 0.000 claims description 42
- 108091081024 Start codon Proteins 0.000 claims description 33
- 108020004705 Codon Proteins 0.000 claims description 29
- 238000000034 method Methods 0.000 claims description 26
- 210000004962 mammalian cell Anatomy 0.000 claims description 24
- 102100035423 POU domain, class 5, transcription factor 1 Human genes 0.000 claims description 23
- 108700026244 Open Reading Frames Proteins 0.000 claims description 18
- 241000725303 Human immunodeficiency virus Species 0.000 claims description 17
- 102000000588 Interleukin-2 Human genes 0.000 claims description 17
- 108010002350 Interleukin-2 Proteins 0.000 claims description 17
- 241000700605 Viruses Species 0.000 claims description 17
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine group Chemical group [C@@H]1([C@H](O)[C@H](O)[C@@H](CO)O1)N1C=NC=2C(N)=NC=NC12 OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 claims description 16
- 101001094700 Homo sapiens POU domain, class 5, transcription factor 1 Proteins 0.000 claims description 15
- 230000001225 therapeutic effect Effects 0.000 claims description 15
- 101001002657 Homo sapiens Interleukin-2 Proteins 0.000 claims description 12
- 102000055277 human IL2 Human genes 0.000 claims description 12
- -1 mastophoran Proteins 0.000 claims description 12
- 239000002126 C01EB10 - Adenosine Substances 0.000 claims description 7
- 229960005305 adenosine Drugs 0.000 claims description 7
- 238000009396 hybridization Methods 0.000 claims description 7
- 206010022000 influenza Diseases 0.000 claims description 7
- 101150023320 B16R gene Proteins 0.000 claims description 6
- 102000004127 Cytokines Human genes 0.000 claims description 6
- 108090000695 Cytokines Proteins 0.000 claims description 6
- 101000713275 Homo sapiens Solute carrier family 22 member 3 Proteins 0.000 claims description 6
- 101100316831 Vaccinia virus (strain Copenhagen) B18R gene Proteins 0.000 claims description 6
- 101100004099 Vaccinia virus (strain Western Reserve) VACWR200 gene Proteins 0.000 claims description 6
- 102000052983 human POU5F1 Human genes 0.000 claims description 6
- 230000003612 virological effect Effects 0.000 claims description 6
- 101710200374 Crotamine Proteins 0.000 claims description 5
- 241000283070 Equus zebra Species 0.000 claims description 5
- 108700028146 Genetic Enhancer Elements Proteins 0.000 claims description 5
- 208000005176 Hepatitis C Diseases 0.000 claims description 5
- 101710118867 Maurocalcin Proteins 0.000 claims description 5
- 108010036176 Melitten Proteins 0.000 claims description 5
- 201000005702 Pertussis Diseases 0.000 claims description 5
- 101710192266 Tegument protein VP22 Proteins 0.000 claims description 5
- 101710198378 Uncharacterized 10.8 kDa protein in cox-rep intergenic region Proteins 0.000 claims description 5
- 230000036436 anti-hiv Effects 0.000 claims description 5
- PEFQQQGFYPMQLH-WFQFKEFWSA-N crotamin Chemical compound C([C@H]1C(=O)N2CCC[C@H]2C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(N[C@@H]2C(=O)N[C@@H](CC(C)C)C(=O)N3CCC[C@H]3C(=O)N3CCC[C@H]3C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=3C=CC=CC=3)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H]3CSSC[C@H](NC(=O)[C@H](CC=4NC=NC=4)NC(=O)CNC(=O)CNC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC=4NC=NC=4)NC(=O)[C@@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC=4C=CC(O)=CC=4)CSSC[C@@H](C(=O)N[C@@H](CSSC2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC=2C4=CC=CC=C4NC=2)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC=2C4=CC=CC=C4NC=2)NC(=O)[C@H](CCCNC(N)=N)NC3=O)C(=O)N1)=O)[C@@H](C)CC)C1=CC=CC=C1 PEFQQQGFYPMQLH-WFQFKEFWSA-N 0.000 claims description 5
- VDXZNPDIRNWWCW-JFTDCZMZSA-N melittin Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(N)=O)CC1=CNC2=CC=CC=C12 VDXZNPDIRNWWCW-JFTDCZMZSA-N 0.000 claims description 5
- 108010043655 penetratin Proteins 0.000 claims description 5
- MCYTYTUNNNZWOK-LCLOTLQISA-N penetratin Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(N)=O)C1=CC=CC=C1 MCYTYTUNNNZWOK-LCLOTLQISA-N 0.000 claims description 5
- 108010011110 polyarginine Proteins 0.000 claims description 5
- 230000000241 respiratory effect Effects 0.000 claims description 5
- 208000001490 Dengue Diseases 0.000 claims description 4
- 206010012310 Dengue fever Diseases 0.000 claims description 4
- 208000009889 Herpes Simplex Diseases 0.000 claims description 4
- 208000020329 Zika virus infectious disease Diseases 0.000 claims description 4
- 208000025729 dengue disease Diseases 0.000 claims description 4
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical group O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 claims description 4
- 231100000699 Bacterial toxin Toxicity 0.000 claims description 3
- 229940124726 Japanese encephalitis vaccine Drugs 0.000 claims description 3
- 208000002606 Paramyxoviridae Infections Diseases 0.000 claims description 3
- 229940124859 Rotavirus vaccine Drugs 0.000 claims description 3
- 241000700584 Simplexvirus Species 0.000 claims description 3
- 206010054094 Tumour necrosis Diseases 0.000 claims description 3
- 230000001512 anti-cytomegaloviral effect Effects 0.000 claims description 3
- 230000003602 anti-herpes Effects 0.000 claims description 3
- 230000000259 anti-tumor effect Effects 0.000 claims description 3
- 239000000688 bacterial toxin Substances 0.000 claims description 3
- 229960002520 hepatitis vaccine Drugs 0.000 claims description 3
- 229940124725 herpes simplex vaccine Drugs 0.000 claims description 3
- 229960003971 influenza vaccine Drugs 0.000 claims description 3
- 229940124735 malaria vaccine Drugs 0.000 claims description 3
- 229940041323 measles vaccine Drugs 0.000 claims description 3
- 229960003127 rabies vaccine Drugs 0.000 claims description 3
- 229940124742 varicella zoster vaccine Drugs 0.000 claims description 3
- 241000701806 Human papillomavirus Species 0.000 claims description 2
- 102000034287 fluorescent proteins Human genes 0.000 claims description 2
- 108091006047 fluorescent proteins Proteins 0.000 claims description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims 12
- PBKWZFANFUTEPS-CWUSWOHSSA-N transportan Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(N)=O)[C@@H](C)CC)NC(=O)CNC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)CN)[C@@H](C)O)C1=CC=C(O)C=C1 PBKWZFANFUTEPS-CWUSWOHSSA-N 0.000 claims 2
- 108010062760 transportan Proteins 0.000 claims 2
- 239000003623 enhancer Substances 0.000 abstract description 18
- 230000002708 enhancing effect Effects 0.000 abstract 1
- 210000004027 cell Anatomy 0.000 description 152
- 230000001965 increasing effect Effects 0.000 description 43
- 230000014616 translation Effects 0.000 description 37
- 102000053602 DNA Human genes 0.000 description 35
- 108020004414 DNA Proteins 0.000 description 35
- 238000002474 experimental method Methods 0.000 description 32
- 238000001890 transfection Methods 0.000 description 29
- 238000000684 flow cytometry Methods 0.000 description 22
- 150000007523 nucleic acids Chemical class 0.000 description 20
- 241000282414 Homo sapiens Species 0.000 description 19
- 108090000765 processed proteins & peptides Proteins 0.000 description 19
- 238000000338 in vitro Methods 0.000 description 16
- 101000825762 Homo sapiens Histone RNA hairpin-binding protein Proteins 0.000 description 15
- 102000039446 nucleic acids Human genes 0.000 description 15
- 108020004707 nucleic acids Proteins 0.000 description 15
- 108091035707 Consensus sequence Proteins 0.000 description 13
- 102100022823 Histone RNA hairpin-binding protein Human genes 0.000 description 13
- 108010033040 Histones Proteins 0.000 description 13
- 210000004698 lymphocyte Anatomy 0.000 description 13
- 238000013518 transcription Methods 0.000 description 13
- 230000035897 transcription Effects 0.000 description 13
- 101710126211 POU domain, class 5, transcription factor 1 Proteins 0.000 description 11
- 150000001413 amino acids Chemical class 0.000 description 11
- 239000000203 mixture Substances 0.000 description 11
- 102000004196 processed proteins & peptides Human genes 0.000 description 11
- 108010076504 Protein Sorting Signals Proteins 0.000 description 10
- 230000000694 effects Effects 0.000 description 10
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical group C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 9
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 9
- 238000004520 electroporation Methods 0.000 description 9
- 210000003463 organelle Anatomy 0.000 description 9
- 201000011510 cancer Diseases 0.000 description 8
- 238000009472 formulation Methods 0.000 description 8
- 241000701867 Enterobacteria phage T7 Species 0.000 description 7
- 108060003951 Immunoglobulin Proteins 0.000 description 7
- 206010028980 Neoplasm Diseases 0.000 description 7
- 108091028043 Nucleic acid sequence Proteins 0.000 description 7
- 102000037865 fusion proteins Human genes 0.000 description 7
- 102000018358 immunoglobulin Human genes 0.000 description 7
- 238000010348 incorporation Methods 0.000 description 7
- 102000014914 Carrier Proteins Human genes 0.000 description 6
- 125000003275 alpha amino acid group Chemical group 0.000 description 6
- 108091008324 binding proteins Proteins 0.000 description 6
- 230000000295 complement effect Effects 0.000 description 6
- 201000010099 disease Diseases 0.000 description 6
- 239000003814 drug Substances 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 108020001507 fusion proteins Proteins 0.000 description 6
- 238000001727 in vivo Methods 0.000 description 6
- 239000004615 ingredient Substances 0.000 description 6
- 238000004519 manufacturing process Methods 0.000 description 6
- 102000040430 polynucleotide Human genes 0.000 description 6
- 108091033319 polynucleotide Proteins 0.000 description 6
- 239000002157 polynucleotide Substances 0.000 description 6
- 239000000126 substance Substances 0.000 description 6
- 210000001519 tissue Anatomy 0.000 description 6
- 230000014621 translational initiation Effects 0.000 description 6
- 108020005176 AU Rich Elements Proteins 0.000 description 5
- 108010051109 Cell-Penetrating Peptides Proteins 0.000 description 5
- 102000020313 Cell-Penetrating Peptides Human genes 0.000 description 5
- 238000002965 ELISA Methods 0.000 description 5
- 230000006819 RNA synthesis Effects 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 5
- 210000000170 cell membrane Anatomy 0.000 description 5
- 210000000987 immune system Anatomy 0.000 description 5
- 239000012528 membrane Substances 0.000 description 5
- 239000000178 monomer Substances 0.000 description 5
- 239000000546 pharmaceutical excipient Substances 0.000 description 5
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 4
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Chemical group C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 4
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Chemical group C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 4
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 4
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 4
- 206010037660 Pyrexia Diseases 0.000 description 4
- 108091028664 Ribonucleotide Proteins 0.000 description 4
- 239000003124 biologic agent Substances 0.000 description 4
- 239000002299 complementary DNA Substances 0.000 description 4
- 239000000306 component Substances 0.000 description 4
- 210000000805 cytoplasm Anatomy 0.000 description 4
- 230000001086 cytosolic effect Effects 0.000 description 4
- 210000002950 fibroblast Anatomy 0.000 description 4
- 229940029575 guanosine Drugs 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 239000002105 nanoparticle Substances 0.000 description 4
- 244000052769 pathogen Species 0.000 description 4
- 229920001184 polypeptide Polymers 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 239000002336 ribonucleotide Substances 0.000 description 4
- 125000002652 ribonucleotide group Chemical group 0.000 description 4
- 238000006467 substitution reaction Methods 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 238000003151 transfection method Methods 0.000 description 4
- UVBYMVOUBXYSFV-XUTVFYLZSA-N 1-methylpseudouridine Chemical compound O=C1NC(=O)N(C)C=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 UVBYMVOUBXYSFV-XUTVFYLZSA-N 0.000 description 3
- SWLOHUMCUDRTCL-ZLUOBGJFSA-N Asn-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N SWLOHUMCUDRTCL-ZLUOBGJFSA-N 0.000 description 3
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 3
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 3
- 101150077194 CAP1 gene Proteins 0.000 description 3
- 101150014715 CAP2 gene Proteins 0.000 description 3
- 101710204837 Envelope small membrane protein Proteins 0.000 description 3
- 101100137155 Homo sapiens POU5F1 gene Proteins 0.000 description 3
- 101100094846 Homo sapiens SLC22A3 gene Proteins 0.000 description 3
- 101710145006 Lysis protein Proteins 0.000 description 3
- 101100245221 Mus musculus Prss8 gene Proteins 0.000 description 3
- 101100260872 Mus musculus Tmprss4 gene Proteins 0.000 description 3
- 206010037742 Rabies Diseases 0.000 description 3
- 210000001744 T-lymphocyte Anatomy 0.000 description 3
- 101001023030 Toxoplasma gondii Myosin-D Proteins 0.000 description 3
- 108091023040 Transcription factor Proteins 0.000 description 3
- 101800001690 Transmembrane protein gp41 Proteins 0.000 description 3
- 125000000539 amino acid group Chemical group 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 108010077245 asparaginyl-proline Proteins 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 230000006378 damage Effects 0.000 description 3
- 230000008260 defense mechanism Effects 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 3
- 208000035475 disorder Diseases 0.000 description 3
- 210000002472 endoplasmic reticulum Anatomy 0.000 description 3
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 3
- 239000012091 fetal bovine serum Substances 0.000 description 3
- 210000005260 human cell Anatomy 0.000 description 3
- 208000015181 infectious disease Diseases 0.000 description 3
- 210000000265 leukocyte Anatomy 0.000 description 3
- 230000000670 limiting effect Effects 0.000 description 3
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 3
- 239000013642 negative control Substances 0.000 description 3
- 230000001717 pathogenic effect Effects 0.000 description 3
- 239000002953 phosphate buffered saline Substances 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 210000003705 ribosome Anatomy 0.000 description 3
- 238000011282 treatment Methods 0.000 description 3
- GJTBSTBJLVYKAU-XVFCMESISA-N 2-thiouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=S)NC(=O)C=C1 GJTBSTBJLVYKAU-XVFCMESISA-N 0.000 description 2
- CZVCGJBESNRLEQ-UHFFFAOYSA-N 7h-purine;pyrimidine Chemical compound C1=CN=CN=C1.C1=NC=C2NC=NC2=N1 CZVCGJBESNRLEQ-UHFFFAOYSA-N 0.000 description 2
- 102100031786 Adiponectin Human genes 0.000 description 2
- 108010076365 Adiponectin Proteins 0.000 description 2
- XCVRVWZTXPCYJT-BIIVOSGPSA-N Ala-Asn-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N XCVRVWZTXPCYJT-BIIVOSGPSA-N 0.000 description 2
- 102000006942 B-Cell Maturation Antigen Human genes 0.000 description 2
- 108010008014 B-Cell Maturation Antigen Proteins 0.000 description 2
- 241000193738 Bacillus anthracis Species 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 208000011691 Burkitt lymphomas Diseases 0.000 description 2
- 102000049320 CD36 Human genes 0.000 description 2
- 108010045374 CD36 Antigens Proteins 0.000 description 2
- 101710098119 Chaperonin GroEL 2 Proteins 0.000 description 2
- 108010037414 Cytoskeletal Proteins Proteins 0.000 description 2
- 102000010831 Cytoskeletal Proteins Human genes 0.000 description 2
- 108010016626 Dipeptides Proteins 0.000 description 2
- 241000991587 Enterovirus C Species 0.000 description 2
- 108091029865 Exogenous DNA Proteins 0.000 description 2
- 101710154606 Hemagglutinin Proteins 0.000 description 2
- 241000700721 Hepatitis B virus Species 0.000 description 2
- 101000738771 Homo sapiens Receptor-type tyrosine-protein phosphatase C Proteins 0.000 description 2
- 241001135569 Human adenovirus 5 Species 0.000 description 2
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 2
- 101710085938 Matrix protein Proteins 0.000 description 2
- 108010052285 Membrane Proteins Proteins 0.000 description 2
- 101710127721 Membrane protein Proteins 0.000 description 2
- 102000007999 Nuclear Proteins Human genes 0.000 description 2
- 108010089610 Nuclear Proteins Proteins 0.000 description 2
- 101710093908 Outer capsid protein VP4 Proteins 0.000 description 2
- 101710135467 Outer capsid protein sigma-1 Proteins 0.000 description 2
- 101710176177 Protein A56 Proteins 0.000 description 2
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 2
- 108010065868 RNA polymerase SP6 Proteins 0.000 description 2
- 102100037422 Receptor-type tyrosine-protein phosphatase C Human genes 0.000 description 2
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 2
- MEFKEPWMEQBLKI-AIRLBKTGSA-N S-adenosyl-L-methioninate Chemical compound O[C@@H]1[C@H](O)[C@@H](C[S+](CC[C@H](N)C([O-])=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 MEFKEPWMEQBLKI-AIRLBKTGSA-N 0.000 description 2
- 238000012300 Sequence Analysis Methods 0.000 description 2
- 230000024932 T cell mediated immunity Effects 0.000 description 2
- 108091008874 T cell receptors Proteins 0.000 description 2
- 102000016266 T-Cell Antigen Receptors Human genes 0.000 description 2
- 102100036011 T-cell surface glycoprotein CD4 Human genes 0.000 description 2
- 101710137500 T7 RNA polymerase Proteins 0.000 description 2
- 102000040945 Transcription factor Human genes 0.000 description 2
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 2
- 241000700618 Vaccinia virus Species 0.000 description 2
- 238000002835 absorbance Methods 0.000 description 2
- GFFGJBXGBJISGV-UHFFFAOYSA-N adenyl group Chemical class N1=CN=C2N=CNC2=C1N GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 2
- 230000001464 adherent effect Effects 0.000 description 2
- 239000004599 antimicrobial Substances 0.000 description 2
- 230000008668 cellular reprogramming Effects 0.000 description 2
- 230000004700 cellular uptake Effects 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000002512 chemotherapy Methods 0.000 description 2
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 210000001723 extracellular space Anatomy 0.000 description 2
- 210000003953 foreskin Anatomy 0.000 description 2
- 150000004676 glycans Chemical class 0.000 description 2
- 239000000185 hemagglutinin Substances 0.000 description 2
- 102000051171 human SLBP Human genes 0.000 description 2
- 230000028993 immune response Effects 0.000 description 2
- 230000036039 immunity Effects 0.000 description 2
- 229940072221 immunoglobulins Drugs 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000003834 intracellular effect Effects 0.000 description 2
- 210000004020 intracellular membrane Anatomy 0.000 description 2
- 210000003292 kidney cell Anatomy 0.000 description 2
- 210000005229 liver cell Anatomy 0.000 description 2
- 239000002609 medium Substances 0.000 description 2
- 108091070501 miRNA Proteins 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 229910052754 neon Inorganic materials 0.000 description 2
- GKAOGPIIYCISHV-UHFFFAOYSA-N neon atom Chemical compound [Ne] GKAOGPIIYCISHV-UHFFFAOYSA-N 0.000 description 2
- 230000003472 neutralizing effect Effects 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 229910052760 oxygen Inorganic materials 0.000 description 2
- 239000001301 oxygen Substances 0.000 description 2
- 229960001539 poliomyelitis vaccine Drugs 0.000 description 2
- 238000003752 polymerase chain reaction Methods 0.000 description 2
- 229920001282 polysaccharide Polymers 0.000 description 2
- 239000005017 polysaccharide Substances 0.000 description 2
- 125000000561 purinyl group Chemical group N1=C(N=C2N=CNC2=C1)* 0.000 description 2
- 102000005962 receptors Human genes 0.000 description 2
- 108020003175 receptors Proteins 0.000 description 2
- 230000008672 reprogramming Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000011664 signaling Effects 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 210000000130 stem cell Anatomy 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- 230000002459 sustained effect Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 230000005945 translocation Effects 0.000 description 2
- 238000002054 transplantation Methods 0.000 description 2
- 239000001226 triphosphate Substances 0.000 description 2
- 235000011178 triphosphate Nutrition 0.000 description 2
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 2
- ODDDVFDZBGTKDX-VPCXQMTMSA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)-2-methyloxolan-2-yl]pyrimidine-2,4-dione Chemical compound C1=CC(=O)NC(=O)N1[C@]1(C)O[C@H](CO)[C@@H](O)[C@H]1O ODDDVFDZBGTKDX-VPCXQMTMSA-N 0.000 description 1
- 101710154545 16 kDa protein Proteins 0.000 description 1
- 101800001779 2'-O-methyltransferase Proteins 0.000 description 1
- MMUBPEFMCTVKTR-IBNKKVAHSA-N 5-[(2s,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)-2-methyloxolan-2-yl]-1h-pyrimidine-2,4-dione Chemical compound C=1NC(=O)NC(=O)C=1[C@]1(C)O[C@H](CO)[C@@H](O)[C@H]1O MMUBPEFMCTVKTR-IBNKKVAHSA-N 0.000 description 1
- ZXIATBNUWJBBGT-JXOAFFINSA-N 5-methoxyuridine Chemical compound O=C1NC(=O)C(OC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ZXIATBNUWJBBGT-JXOAFFINSA-N 0.000 description 1
- OGHAROSJZRTIOK-KQYNXXCUSA-O 7-methylguanosine Chemical compound C1=2N=C(N)NC(=O)C=2[N+](C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OGHAROSJZRTIOK-KQYNXXCUSA-O 0.000 description 1
- 241000588626 Acinetobacter baumannii Species 0.000 description 1
- 101710159080 Aconitate hydratase A Proteins 0.000 description 1
- 101710159078 Aconitate hydratase B Proteins 0.000 description 1
- 208000024893 Acute lymphoblastic leukemia Diseases 0.000 description 1
- 208000014697 Acute lymphocytic leukaemia Diseases 0.000 description 1
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- QCTFKEJEIMPOLW-JURCDPSOSA-N Ala-Ile-Phe Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QCTFKEJEIMPOLW-JURCDPSOSA-N 0.000 description 1
- CYBJZLQSUJEMAS-LFSVMHDDSA-N Ala-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C)N)O CYBJZLQSUJEMAS-LFSVMHDDSA-N 0.000 description 1
- BVLPIIBTWIYOML-ZKWXMUAHSA-N Ala-Val-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BVLPIIBTWIYOML-ZKWXMUAHSA-N 0.000 description 1
- 102100023635 Alpha-fetoprotein Human genes 0.000 description 1
- 108010085443 Anserine Proteins 0.000 description 1
- 102220629013 Anterior gradient protein 2 homolog_H81E_mutation Human genes 0.000 description 1
- 102000007592 Apolipoproteins Human genes 0.000 description 1
- 108010071619 Apolipoproteins Proteins 0.000 description 1
- 102100021569 Apoptosis regulator Bcl-2 Human genes 0.000 description 1
- 101100446590 Arabidopsis thaliana FIM5 gene Proteins 0.000 description 1
- 101000719121 Arabidopsis thaliana Protein MEI2-like 1 Proteins 0.000 description 1
- 241000712891 Arenavirus Species 0.000 description 1
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 1
- YLVGUOGAFAJMKP-JYJNAYRXSA-N Arg-Met-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YLVGUOGAFAJMKP-JYJNAYRXSA-N 0.000 description 1
- JTXVXGXTRXMOFJ-FXQIFTODSA-N Asn-Pro-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O JTXVXGXTRXMOFJ-FXQIFTODSA-N 0.000 description 1
- VCJCPARXDBEGNE-GUBZILKMSA-N Asn-Pro-Pro Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 VCJCPARXDBEGNE-GUBZILKMSA-N 0.000 description 1
- KYQNAIMCTRZLNP-QSFUFRPTSA-N Asp-Ile-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O KYQNAIMCTRZLNP-QSFUFRPTSA-N 0.000 description 1
- MYOHQBFRJQFIDZ-KKUMJFAQSA-N Asp-Leu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MYOHQBFRJQFIDZ-KKUMJFAQSA-N 0.000 description 1
- 102100022717 Atypical chemokine receptor 1 Human genes 0.000 description 1
- 208000023275 Autoimmune disease Diseases 0.000 description 1
- 102100035526 B melanoma antigen 1 Human genes 0.000 description 1
- 102100038080 B-cell receptor CD22 Human genes 0.000 description 1
- 102100024222 B-lymphocyte antigen CD19 Human genes 0.000 description 1
- 102100022005 B-lymphocyte antigen CD20 Human genes 0.000 description 1
- 241000304886 Bacilli Species 0.000 description 1
- 101000950981 Bacillus subtilis (strain 168) Catabolic NAD-specific glutamate dehydrogenase RocG Proteins 0.000 description 1
- 102100021663 Baculoviral IAP repeat-containing protein 5 Human genes 0.000 description 1
- 102000015735 Beta-catenin Human genes 0.000 description 1
- 108060000903 Beta-catenin Proteins 0.000 description 1
- 102000004506 Blood Proteins Human genes 0.000 description 1
- 108010017384 Blood Proteins Proteins 0.000 description 1
- 101710186200 CCAAT/enhancer-binding protein Proteins 0.000 description 1
- 210000001266 CD8-positive T-lymphocyte Anatomy 0.000 description 1
- 108091008048 CMVpp65 Proteins 0.000 description 1
- 101100315624 Caenorhabditis elegans tyr-1 gene Proteins 0.000 description 1
- 101710167800 Capsid assembly scaffolding protein Proteins 0.000 description 1
- QRYRORQUOLYVBU-VBKZILBWSA-N Carnosic acid Natural products CC([C@@H]1CC2)(C)CCC[C@]1(C(O)=O)C1=C2C=C(C(C)C)C(O)=C1O QRYRORQUOLYVBU-VBKZILBWSA-N 0.000 description 1
- 108010087806 Carnosine Proteins 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 108010019670 Chimeric Antigen Receptors Proteins 0.000 description 1
- 241000193163 Clostridioides difficile Species 0.000 description 1
- 102100032768 Complement receptor type 2 Human genes 0.000 description 1
- 101710139375 Corneodesmosin Proteins 0.000 description 1
- 241000711573 Coronaviridae Species 0.000 description 1
- 108010060385 Cyclin B1 Proteins 0.000 description 1
- 229940021995 DNA vaccine Drugs 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 101100481404 Danio rerio tie1 gene Proteins 0.000 description 1
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 1
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 1
- BWGNESOTFCXPMA-UHFFFAOYSA-N Dihydrogen disulfide Chemical compound SS BWGNESOTFCXPMA-UHFFFAOYSA-N 0.000 description 1
- 102000016607 Diphtheria Toxin Human genes 0.000 description 1
- 108010053187 Diphtheria Toxin Proteins 0.000 description 1
- 101000937305 Drosophila melanogaster Protein aubergine Proteins 0.000 description 1
- 239000006145 Eagle's minimal essential medium Substances 0.000 description 1
- 206010014596 Encephalitis Japanese B Diseases 0.000 description 1
- 241000588914 Enterobacter Species 0.000 description 1
- 241000588921 Enterobacteriaceae Species 0.000 description 1
- 241000194031 Enterococcus faecium Species 0.000 description 1
- 101710126487 Envelope glycoprotein B Proteins 0.000 description 1
- 101800001466 Envelope glycoprotein E1 Proteins 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 102000003951 Erythropoietin Human genes 0.000 description 1
- 108090000394 Erythropoietin Proteins 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 101001065501 Escherichia phage MS2 Lysis protein Proteins 0.000 description 1
- 102100038595 Estrogen receptor Human genes 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 101710091918 Eukaryotic translation initiation factor 4E Proteins 0.000 description 1
- 102100027304 Eukaryotic translation initiation factor 4E Human genes 0.000 description 1
- 101710126428 Eukaryotic translation initiation factor 4E-2 Proteins 0.000 description 1
- 101710126416 Eukaryotic translation initiation factor 4E-3 Proteins 0.000 description 1
- 101710126432 Eukaryotic translation initiation factor 4E1 Proteins 0.000 description 1
- 101710133325 Eukaryotic translation initiation factor NCBP Proteins 0.000 description 1
- 101710190212 Eukaryotic translation initiation factor isoform 4E Proteins 0.000 description 1
- 101710124729 Eukaryotic translation initiation factor isoform 4E-2 Proteins 0.000 description 1
- 101150106011 FIM2 gene Proteins 0.000 description 1
- 101150048576 FIM3 gene Proteins 0.000 description 1
- 102000001690 Factor VIII Human genes 0.000 description 1
- 108010054218 Factor VIII Proteins 0.000 description 1
- 102000008857 Ferritin Human genes 0.000 description 1
- 108050000784 Ferritin Proteins 0.000 description 1
- 238000008416 Ferritin Methods 0.000 description 1
- 102000001390 Fructose-Bisphosphate Aldolase Human genes 0.000 description 1
- 108010068561 Fructose-Bisphosphate Aldolase Proteins 0.000 description 1
- 102100032340 G2/mitotic-specific cyclin-B1 Human genes 0.000 description 1
- 108700023863 Gene Components Proteins 0.000 description 1
- CKNUKHBRCSMKMO-XHNCKOQMSA-N Gln-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O CKNUKHBRCSMKMO-XHNCKOQMSA-N 0.000 description 1
- MGJMFSBEMSNYJL-AVGNSLFASA-N Gln-Asn-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MGJMFSBEMSNYJL-AVGNSLFASA-N 0.000 description 1
- JILRMFFFCHUUTJ-ACZMJKKPSA-N Gln-Ser-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O JILRMFFFCHUUTJ-ACZMJKKPSA-N 0.000 description 1
- RDDSZZJOKDVPAE-ACZMJKKPSA-N Glu-Asn-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDDSZZJOKDVPAE-ACZMJKKPSA-N 0.000 description 1
- HPJLZFTUUJKWAJ-JHEQGTHGSA-N Glu-Gly-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HPJLZFTUUJKWAJ-JHEQGTHGSA-N 0.000 description 1
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 1
- YKBUCXNNBYZYAY-MNXVOIDGSA-N Glu-Lys-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YKBUCXNNBYZYAY-MNXVOIDGSA-N 0.000 description 1
- YQAQQKPWFOBSMU-WDCWCFNPSA-N Glu-Thr-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O YQAQQKPWFOBSMU-WDCWCFNPSA-N 0.000 description 1
- YQPFCZVKMUVZIN-AUTRQRHGSA-N Glu-Val-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQPFCZVKMUVZIN-AUTRQRHGSA-N 0.000 description 1
- 102100041003 Glutamate carboxypeptidase 2 Human genes 0.000 description 1
- 102000016901 Glutamate dehydrogenase Human genes 0.000 description 1
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 1
- STVHDEHTKFXBJQ-LAEOZQHASA-N Gly-Glu-Ile Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STVHDEHTKFXBJQ-LAEOZQHASA-N 0.000 description 1
- IUZGUFAJDBHQQV-YUMQZZPRSA-N Gly-Leu-Asn Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IUZGUFAJDBHQQV-YUMQZZPRSA-N 0.000 description 1
- OCRQUYDOYKCOQG-IRXDYDNUSA-N Gly-Tyr-Phe Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 OCRQUYDOYKCOQG-IRXDYDNUSA-N 0.000 description 1
- GJHWILMUOANXTG-WPRPVWTQSA-N Gly-Val-Arg Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GJHWILMUOANXTG-WPRPVWTQSA-N 0.000 description 1
- 102000003886 Glycoproteins Human genes 0.000 description 1
- 108090000288 Glycoproteins Proteins 0.000 description 1
- 108010017080 Granulocyte Colony-Stimulating Factor Proteins 0.000 description 1
- 102000004269 Granulocyte Colony-Stimulating Factor Human genes 0.000 description 1
- 102000004457 Granulocyte-Macrophage Colony-Stimulating Factor Human genes 0.000 description 1
- 108010017213 Granulocyte-Macrophage Colony-Stimulating Factor Proteins 0.000 description 1
- 229940124855 Haemophilus influenzae vaccine Drugs 0.000 description 1
- 241000711549 Hepacivirus C Species 0.000 description 1
- JNPRQUIWDVDHIT-GYIPPJPDSA-N Herculin Chemical compound CCC\C=C\CCCC\C=C\C(=O)NCC(C)C JNPRQUIWDVDHIT-GYIPPJPDSA-N 0.000 description 1
- JNPRQUIWDVDHIT-UHFFFAOYSA-N Herculin Natural products CCCC=CCCCCC=CC(=O)NCC(C)C JNPRQUIWDVDHIT-UHFFFAOYSA-N 0.000 description 1
- 208000007514 Herpes zoster Diseases 0.000 description 1
- IWXMHXYOACDSIA-PYJNHQTQSA-N His-Ile-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O IWXMHXYOACDSIA-PYJNHQTQSA-N 0.000 description 1
- PFOUFRJYHWZJKW-NKIYYHGXSA-N His-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O PFOUFRJYHWZJKW-NKIYYHGXSA-N 0.000 description 1
- VXZZUXWAOMWWJH-QTKMDUPCSA-N His-Thr-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O VXZZUXWAOMWWJH-QTKMDUPCSA-N 0.000 description 1
- 102000006947 Histones Human genes 0.000 description 1
- 241001272567 Hominoidea Species 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000971171 Homo sapiens Apoptosis regulator Bcl-2 Proteins 0.000 description 1
- 101000678879 Homo sapiens Atypical chemokine receptor 1 Proteins 0.000 description 1
- 101000874316 Homo sapiens B melanoma antigen 1 Proteins 0.000 description 1
- 101000884305 Homo sapiens B-cell receptor CD22 Proteins 0.000 description 1
- 101000980825 Homo sapiens B-lymphocyte antigen CD19 Proteins 0.000 description 1
- 101000897405 Homo sapiens B-lymphocyte antigen CD20 Proteins 0.000 description 1
- 101000941929 Homo sapiens Complement receptor type 2 Proteins 0.000 description 1
- 101000892862 Homo sapiens Glutamate carboxypeptidase 2 Proteins 0.000 description 1
- 101001046686 Homo sapiens Integrin alpha-M Proteins 0.000 description 1
- 101000935040 Homo sapiens Integrin beta-2 Proteins 0.000 description 1
- 101000777628 Homo sapiens Leukocyte antigen CD37 Proteins 0.000 description 1
- 101000934338 Homo sapiens Myeloid cell surface antigen CD33 Proteins 0.000 description 1
- 101100351324 Homo sapiens PDPN gene Proteins 0.000 description 1
- 101001136592 Homo sapiens Prostate stem cell antigen Proteins 0.000 description 1
- 101001012157 Homo sapiens Receptor tyrosine-protein kinase erbB-2 Proteins 0.000 description 1
- 101000857677 Homo sapiens Runt-related transcription factor 1 Proteins 0.000 description 1
- 101000884271 Homo sapiens Signal transducer CD24 Proteins 0.000 description 1
- 241000714260 Human T-lymphotropic virus 1 Species 0.000 description 1
- 241000713772 Human immunodeficiency virus 1 Species 0.000 description 1
- 108010003272 Hyaluronate lyase Proteins 0.000 description 1
- 102000001974 Hyaluronidases Human genes 0.000 description 1
- 206010020751 Hypersensitivity Diseases 0.000 description 1
- VOBYAKCXGQQFLR-LSJOCFKGSA-N Ile-Gly-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O VOBYAKCXGQQFLR-LSJOCFKGSA-N 0.000 description 1
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 1
- IITVUURPOYGCTD-NAKRPEOUSA-N Ile-Pro-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IITVUURPOYGCTD-NAKRPEOUSA-N 0.000 description 1
- MLSUZXHSNRBDCI-CYDGBPFRSA-N Ile-Pro-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)O)N MLSUZXHSNRBDCI-CYDGBPFRSA-N 0.000 description 1
- DRCKHKZYDLJYFQ-YWIQKCBGSA-N Ile-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DRCKHKZYDLJYFQ-YWIQKCBGSA-N 0.000 description 1
- GNXGAVNTVNOCLL-SIUGBPQLSA-N Ile-Tyr-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N GNXGAVNTVNOCLL-SIUGBPQLSA-N 0.000 description 1
- 108010067060 Immunoglobulin Variable Region Proteins 0.000 description 1
- 102000017727 Immunoglobulin Variable Region Human genes 0.000 description 1
- 206010061218 Inflammation Diseases 0.000 description 1
- 108020005350 Initiator Codon Proteins 0.000 description 1
- 102100023915 Insulin Human genes 0.000 description 1
- 108090001061 Insulin Proteins 0.000 description 1
- 102100034349 Integrase Human genes 0.000 description 1
- 102100022338 Integrin alpha-M Human genes 0.000 description 1
- 102100025390 Integrin beta-2 Human genes 0.000 description 1
- 102000010789 Interleukin-2 Receptors Human genes 0.000 description 1
- 108010038453 Interleukin-2 Receptors Proteins 0.000 description 1
- 102000015696 Interleukins Human genes 0.000 description 1
- 108010063738 Interleukins Proteins 0.000 description 1
- 201000005807 Japanese encephalitis Diseases 0.000 description 1
- 241000710842 Japanese encephalitis virus Species 0.000 description 1
- 241000588747 Klebsiella pneumoniae Species 0.000 description 1
- SLRNWACWRVGMKD-UHFFFAOYSA-N L-anserine Natural products CN1C=NC(CC(NC(=O)CCN)C(O)=O)=C1 SLRNWACWRVGMKD-UHFFFAOYSA-N 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- 102000003855 L-lactate dehydrogenase Human genes 0.000 description 1
- 108700023483 L-lactate dehydrogenases Proteins 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 1
- KLSUAWUZBMAZCL-RHYQMDGZSA-N Leu-Thr-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(O)=O KLSUAWUZBMAZCL-RHYQMDGZSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 102100031586 Leukocyte antigen CD37 Human genes 0.000 description 1
- FZIJIFCXUCZHOL-CIUDSAMLSA-N Lys-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN FZIJIFCXUCZHOL-CIUDSAMLSA-N 0.000 description 1
- ISHNZELVUVPCHY-ZETCQYMHSA-N Lys-Gly-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O ISHNZELVUVPCHY-ZETCQYMHSA-N 0.000 description 1
- WAIHHELKYSFIQN-XUXIUFHCSA-N Lys-Ile-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O WAIHHELKYSFIQN-XUXIUFHCSA-N 0.000 description 1
- WBSCNDJQPKSPII-KKUMJFAQSA-N Lys-Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O WBSCNDJQPKSPII-KKUMJFAQSA-N 0.000 description 1
- INMBONMDMGPADT-AVGNSLFASA-N Lys-Met-Met Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCCCN)N INMBONMDMGPADT-AVGNSLFASA-N 0.000 description 1
- 201000005505 Measles Diseases 0.000 description 1
- 241000712079 Measles morbillivirus Species 0.000 description 1
- 102000003735 Mesothelin Human genes 0.000 description 1
- 108090000015 Mesothelin Proteins 0.000 description 1
- HHCOOFPGNXKFGR-HJGDQZAQSA-N Met-Gln-Thr Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HHCOOFPGNXKFGR-HJGDQZAQSA-N 0.000 description 1
- IHRFZLQEQVHXFA-RHYQMDGZSA-N Met-Thr-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCCN IHRFZLQEQVHXFA-RHYQMDGZSA-N 0.000 description 1
- 101001037757 Mus musculus Heat shock 70 kDa protein 1A Proteins 0.000 description 1
- 101001016849 Mus musculus Heat shock protein HSP 90-alpha Proteins 0.000 description 1
- 101000985444 Mus musculus Heat shock protein HSP 90-beta Proteins 0.000 description 1
- 101100481406 Mus musculus Tie1 gene Proteins 0.000 description 1
- 241000187479 Mycobacterium tuberculosis Species 0.000 description 1
- 102100025243 Myeloid cell surface antigen CD33 Human genes 0.000 description 1
- 102100038379 Myogenic factor 6 Human genes 0.000 description 1
- 102100032970 Myogenin Human genes 0.000 description 1
- 108010056785 Myogenin Proteins 0.000 description 1
- 102100030856 Myoglobin Human genes 0.000 description 1
- 108010062374 Myoglobin Proteins 0.000 description 1
- 108060008487 Myosin Proteins 0.000 description 1
- 102000003505 Myosin Human genes 0.000 description 1
- CQOVPNPJLQNMDC-UHFFFAOYSA-N N-beta-alanyl-L-histidine Natural products NCCC(=O)NC(C(O)=O)CC1=CN=CN1 CQOVPNPJLQNMDC-UHFFFAOYSA-N 0.000 description 1
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 1
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 1
- 108010006232 Neuraminidase Proteins 0.000 description 1
- 102000005348 Neuraminidase Human genes 0.000 description 1
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 1
- 208000015914 Non-Hodgkin lymphomas Diseases 0.000 description 1
- 102000011931 Nucleoproteins Human genes 0.000 description 1
- 108010061100 Nucleoproteins Proteins 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 241000713112 Orthobunyavirus Species 0.000 description 1
- 241000150452 Orthohantavirus Species 0.000 description 1
- 102000036673 PRAME Human genes 0.000 description 1
- 108060006580 PRAME Proteins 0.000 description 1
- 208000002193 Pain Diseases 0.000 description 1
- 241001631646 Papillomaviridae Species 0.000 description 1
- 229930040373 Paraformaldehyde Natural products 0.000 description 1
- PTDAGKJHZBGDKD-OEAJRASXSA-N Phe-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O PTDAGKJHZBGDKD-OEAJRASXSA-N 0.000 description 1
- 241000709664 Picornaviridae Species 0.000 description 1
- 241000224016 Plasmodium Species 0.000 description 1
- 241000223960 Plasmodium falciparum Species 0.000 description 1
- 101710183389 Pneumolysin Proteins 0.000 description 1
- 102100037265 Podoplanin Human genes 0.000 description 1
- 208000000474 Poliomyelitis Diseases 0.000 description 1
- 102000015623 Polynucleotide Adenylyltransferase Human genes 0.000 description 1
- 108010024055 Polynucleotide adenylyltransferase Proteins 0.000 description 1
- 241000210053 Potentilla elegans Species 0.000 description 1
- 208000006664 Precursor Cell Lymphoblastic Leukemia-Lymphoma Diseases 0.000 description 1
- 208000009052 Precursor T-Cell Lymphoblastic Leukemia-Lymphoma Diseases 0.000 description 1
- UVKNEILZSJMKSR-FXQIFTODSA-N Pro-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 UVKNEILZSJMKSR-FXQIFTODSA-N 0.000 description 1
- ZYBUKTMPPFQSHL-JYJNAYRXSA-N Pro-Asp-Trp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ZYBUKTMPPFQSHL-JYJNAYRXSA-N 0.000 description 1
- OLTFZQIYCNOBLI-DCAQKATOSA-N Pro-Cys-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O OLTFZQIYCNOBLI-DCAQKATOSA-N 0.000 description 1
- UAYHMOIGIQZLFR-NHCYSSNCSA-N Pro-Gln-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UAYHMOIGIQZLFR-NHCYSSNCSA-N 0.000 description 1
- HAAQQNHQZBOWFO-LURJTMIESA-N Pro-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H]1CCCN1 HAAQQNHQZBOWFO-LURJTMIESA-N 0.000 description 1
- YXHYJEPDKSYPSQ-AVGNSLFASA-N Pro-Leu-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 YXHYJEPDKSYPSQ-AVGNSLFASA-N 0.000 description 1
- QGLFRQCECIWXFA-RCWTZXSCSA-N Pro-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@@H]1CCCN1)O QGLFRQCECIWXFA-RCWTZXSCSA-N 0.000 description 1
- LGMBKOAPPTYKLC-JYJNAYRXSA-N Pro-Phe-Arg Chemical compound C([C@@H](C(=O)N[C@@H](CCCNC(=N)N)C(O)=O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 LGMBKOAPPTYKLC-JYJNAYRXSA-N 0.000 description 1
- NAIPAPCKKRCMBL-JYJNAYRXSA-N Pro-Pro-Phe Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CC=CC=C1 NAIPAPCKKRCMBL-JYJNAYRXSA-N 0.000 description 1
- YDTUEBLEAVANFH-RCWTZXSCSA-N Pro-Val-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 YDTUEBLEAVANFH-RCWTZXSCSA-N 0.000 description 1
- 101710130420 Probable capsid assembly scaffolding protein Proteins 0.000 description 1
- 102100025803 Progesterone receptor Human genes 0.000 description 1
- 102100036735 Prostate stem cell antigen Human genes 0.000 description 1
- 101710192141 Protein Nef Proteins 0.000 description 1
- 229940096437 Protein S Drugs 0.000 description 1
- 108010026552 Proteome Proteins 0.000 description 1
- 241000125945 Protoparvovirus Species 0.000 description 1
- 241000589517 Pseudomonas aeruginosa Species 0.000 description 1
- 229930185560 Pseudouridine Natural products 0.000 description 1
- PTJWIQPHWPFNBW-UHFFFAOYSA-N Pseudouridine C Natural products OC1C(O)C(CO)OC1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-UHFFFAOYSA-N 0.000 description 1
- 108010007100 Pulmonary Surfactant-Associated Protein A Proteins 0.000 description 1
- 102100027773 Pulmonary surfactant-associated protein A2 Human genes 0.000 description 1
- 108020005144 RNA 5' Terminal Oligopyrimidine Sequence Proteins 0.000 description 1
- 108091000106 RNA cap binding Proteins 0.000 description 1
- 102000028391 RNA cap binding Human genes 0.000 description 1
- 229940022005 RNA vaccine Drugs 0.000 description 1
- 102000044126 RNA-Binding Proteins Human genes 0.000 description 1
- 101710105008 RNA-binding protein Proteins 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 239000012980 RPMI-1640 medium Substances 0.000 description 1
- 101001039269 Rattus norvegicus Glycine N-methyltransferase Proteins 0.000 description 1
- 102100030086 Receptor tyrosine-protein kinase erbB-2 Human genes 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 108010000605 Ribosomal Proteins Proteins 0.000 description 1
- 241000606701 Rickettsia Species 0.000 description 1
- 241000702670 Rotavirus Species 0.000 description 1
- 102100025373 Runt-related transcription factor 1 Human genes 0.000 description 1
- 108091006300 SLC2A4 Proteins 0.000 description 1
- 101000999689 Saimiriine herpesvirus 2 (strain 11) Transcriptional regulator ICP22 homolog Proteins 0.000 description 1
- 101710204410 Scaffold protein Proteins 0.000 description 1
- 108091058545 Secretory proteins Proteins 0.000 description 1
- 102000040739 Secretory proteins Human genes 0.000 description 1
- MOQDPPUMFSMYOM-KKUMJFAQSA-N Ser-His-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CO)N MOQDPPUMFSMYOM-KKUMJFAQSA-N 0.000 description 1
- RIAKPZVSNBBNRE-BJDJZHNGSA-N Ser-Ile-Leu Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O RIAKPZVSNBBNRE-BJDJZHNGSA-N 0.000 description 1
- FLONGDPORFIVQW-XGEHTFHBSA-N Ser-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FLONGDPORFIVQW-XGEHTFHBSA-N 0.000 description 1
- 108010071390 Serum Albumin Proteins 0.000 description 1
- 102000007562 Serum Albumin Human genes 0.000 description 1
- 102000054727 Serum Amyloid A Human genes 0.000 description 1
- 108700028909 Serum Amyloid A Proteins 0.000 description 1
- 102100038081 Signal transducer CD24 Human genes 0.000 description 1
- 108010003723 Single-Domain Antibodies Proteins 0.000 description 1
- 102100033939 Solute carrier family 2, facilitated glucose transporter member 4 Human genes 0.000 description 1
- 101001039853 Sonchus yellow net virus Matrix protein Proteins 0.000 description 1
- 101710198474 Spike protein Proteins 0.000 description 1
- 229940124840 Streptococcal vaccine Drugs 0.000 description 1
- 101710172711 Structural protein Proteins 0.000 description 1
- 101710137302 Surface antigen S Proteins 0.000 description 1
- 101800001271 Surface protein Proteins 0.000 description 1
- 108010002687 Survivin Proteins 0.000 description 1
- 208000029052 T-cell acute lymphoblastic leukemia Diseases 0.000 description 1
- 101001051488 Takifugu rubripes Neural cell adhesion molecule L1 Proteins 0.000 description 1
- 102100038126 Tenascin Human genes 0.000 description 1
- 108010008125 Tenascin Proteins 0.000 description 1
- JEDIEMIJYSRUBB-FOHZUACHSA-N Thr-Asp-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O JEDIEMIJYSRUBB-FOHZUACHSA-N 0.000 description 1
- BIBYEFRASCNLAA-CDMKHQONSA-N Thr-Phe-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 BIBYEFRASCNLAA-CDMKHQONSA-N 0.000 description 1
- MXDOAJQRJBMGMO-FJXKBIBVSA-N Thr-Pro-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O MXDOAJQRJBMGMO-FJXKBIBVSA-N 0.000 description 1
- 108700009124 Transcription Initiation Site Proteins 0.000 description 1
- 102000004338 Transferrin Human genes 0.000 description 1
- 108090000901 Transferrin Proteins 0.000 description 1
- 235000008322 Trichosanthes cucumerina Nutrition 0.000 description 1
- 244000078912 Trichosanthes cucumerina Species 0.000 description 1
- LDMUNXDDIDAPJH-VMBFOHBNSA-N Trp-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N LDMUNXDDIDAPJH-VMBFOHBNSA-N 0.000 description 1
- MEZCXKYMMQJRDE-PMVMPFDFSA-N Trp-Leu-Tyr Chemical compound C([C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)CC(C)C)C(O)=O)C1=CC=C(O)C=C1 MEZCXKYMMQJRDE-PMVMPFDFSA-N 0.000 description 1
- DLZKEQQWXODGGZ-KWQFWETISA-N Tyr-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DLZKEQQWXODGGZ-KWQFWETISA-N 0.000 description 1
- FJBCEFPCVPHPPM-STECZYCISA-N Tyr-Ile-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O FJBCEFPCVPHPPM-STECZYCISA-N 0.000 description 1
- WOAQYWUEUYMVGK-ULQDDVLXSA-N Tyr-Lys-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WOAQYWUEUYMVGK-ULQDDVLXSA-N 0.000 description 1
- FMXFHNSFABRVFZ-BZSNNMDCSA-N Tyr-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FMXFHNSFABRVFZ-BZSNNMDCSA-N 0.000 description 1
- YSGAPESOXHFTQY-IHRRRGAJSA-N Tyr-Met-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N YSGAPESOXHFTQY-IHRRRGAJSA-N 0.000 description 1
- BIWVVOHTKDLRMP-ULQDDVLXSA-N Tyr-Pro-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O BIWVVOHTKDLRMP-ULQDDVLXSA-N 0.000 description 1
- 102100039094 Tyrosinase Human genes 0.000 description 1
- 108060008724 Tyrosinase Proteins 0.000 description 1
- TZVUSFMQWPWHON-NHCYSSNCSA-N Val-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N TZVUSFMQWPWHON-NHCYSSNCSA-N 0.000 description 1
- JTWIMNMUYLQNPI-WPRPVWTQSA-N Val-Gly-Arg Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N JTWIMNMUYLQNPI-WPRPVWTQSA-N 0.000 description 1
- MDYSKHBSPXUOPV-JSGCOSHPSA-N Val-Gly-Phe Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N MDYSKHBSPXUOPV-JSGCOSHPSA-N 0.000 description 1
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 1
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 1
- 241000700647 Variola virus Species 0.000 description 1
- 102000005789 Vascular Endothelial Growth Factors Human genes 0.000 description 1
- 108010019530 Vascular Endothelial Growth Factors Proteins 0.000 description 1
- 108010059722 Viral Fusion Proteins Proteins 0.000 description 1
- 108010067390 Viral Proteins Proteins 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 239000004480 active ingredient Substances 0.000 description 1
- 229950004283 actoxumab Drugs 0.000 description 1
- 201000011186 acute T cell leukemia Diseases 0.000 description 1
- 229960001570 ademetionine Drugs 0.000 description 1
- 150000003838 adenosines Chemical class 0.000 description 1
- 108060000200 adenylate cyclase Proteins 0.000 description 1
- 102000030621 adenylate cyclase Human genes 0.000 description 1
- 210000000577 adipose tissue Anatomy 0.000 description 1
- 108010005233 alanylglutamic acid Proteins 0.000 description 1
- 108010044940 alanylglutamine Proteins 0.000 description 1
- 208000026935 allergic disease Diseases 0.000 description 1
- 230000000172 allergic effect Effects 0.000 description 1
- 230000007815 allergy Effects 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- 108010026331 alpha-Fetoproteins Proteins 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000009435 amidation Effects 0.000 description 1
- 238000007112 amidation reaction Methods 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- MYYIAHXIVFADCU-QMMMGPOBSA-N anserine Chemical compound CN1C=NC=C1C[C@H](NC(=O)CC[NH3+])C([O-])=O MYYIAHXIVFADCU-QMMMGPOBSA-N 0.000 description 1
- 230000003466 anti-cipated effect Effects 0.000 description 1
- 230000003622 anti-hsv Effects 0.000 description 1
- 230000002924 anti-infective effect Effects 0.000 description 1
- 230000002303 anti-venom Effects 0.000 description 1
- 230000000890 antigenic effect Effects 0.000 description 1
- 108010062796 arginyllysine Proteins 0.000 description 1
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 1
- 108010093581 aspartyl-proline Proteins 0.000 description 1
- 208000010668 atopic eczema Diseases 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 108010030694 avidin-horseradish peroxidase complex Proteins 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 229960001212 bacterial vaccine Drugs 0.000 description 1
- 108010028263 bacteriophage T3 RNA polymerase Proteins 0.000 description 1
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 1
- WGDUUQDYDIIBKT-UHFFFAOYSA-N beta-Pseudouridine Natural products OC1OC(CN2C=CC(=O)NC2=O)C(O)C1O WGDUUQDYDIIBKT-UHFFFAOYSA-N 0.000 description 1
- 229950008086 bezlotoxumab Drugs 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 210000000601 blood cell Anatomy 0.000 description 1
- 239000012503 blood component Substances 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 229940044199 carnosine Drugs 0.000 description 1
- CQOVPNPJLQNMDC-ZETCQYMHSA-N carnosine Chemical compound [NH3+]CCC(=O)N[C@H](C([O-])=O)CC1=CNC=N1 CQOVPNPJLQNMDC-ZETCQYMHSA-N 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000003915 cell function Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 125000003636 chemical group Chemical group 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 208000027744 congestion Diseases 0.000 description 1
- 239000011258 core-shell material Substances 0.000 description 1
- 230000003013 cytotoxicity Effects 0.000 description 1
- 231100000135 cytotoxicity Toxicity 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000002059 diagnostic imaging Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- 229960005097 diphtheria vaccines Drugs 0.000 description 1
- 108010054813 diprotin B Proteins 0.000 description 1
- 239000002612 dispersion medium Substances 0.000 description 1
- 230000002526 effect on cardiovascular system Effects 0.000 description 1
- 239000003995 emulsifying agent Substances 0.000 description 1
- 230000012202 endocytosis Effects 0.000 description 1
- 210000002889 endothelial cell Anatomy 0.000 description 1
- 239000002158 endotoxin Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 108700004025 env Genes Proteins 0.000 description 1
- 229940088598 enzyme Drugs 0.000 description 1
- 102000052116 epidermal growth factor receptor activity proteins Human genes 0.000 description 1
- 108700015053 epidermal growth factor receptor activity proteins Proteins 0.000 description 1
- 210000002919 epithelial cell Anatomy 0.000 description 1
- 229940105423 erythropoietin Drugs 0.000 description 1
- 108010038795 estrogen receptors Proteins 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 229960000301 factor viii Drugs 0.000 description 1
- 206010016256 fatigue Diseases 0.000 description 1
- 108700004026 gag Genes Proteins 0.000 description 1
- 230000002496 gastric effect Effects 0.000 description 1
- 238000001415 gene therapy Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 108010078144 glutaminyl-glycine Proteins 0.000 description 1
- 108010050848 glycylleucine Proteins 0.000 description 1
- 108010084389 glycyltryptophan Proteins 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 230000002489 hematologic effect Effects 0.000 description 1
- 208000005252 hepatitis A Diseases 0.000 description 1
- 208000002672 hepatitis B Diseases 0.000 description 1
- 230000028996 humoral immune response Effects 0.000 description 1
- 229960002773 hyaluronidase Drugs 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 230000000899 immune system response Effects 0.000 description 1
- 230000003053 immunization Effects 0.000 description 1
- 238000002649 immunization Methods 0.000 description 1
- 230000006054 immunological memory Effects 0.000 description 1
- 239000002955 immunomodulating agent Substances 0.000 description 1
- 229940121354 immunomodulator Drugs 0.000 description 1
- 238000009169 immunotherapy Methods 0.000 description 1
- 230000001976 improved effect Effects 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 210000004263 induced pluripotent stem cell Anatomy 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 239000012678 infectious agent Substances 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 230000004054 inflammatory process Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 229940125396 insulin Drugs 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 1
- 238000006317 isomerization reaction Methods 0.000 description 1
- 239000007951 isotonicity adjuster Substances 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 108010034529 leucyl-lysine Proteins 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- 229920006008 lipopolysaccharide Polymers 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 1
- 108010045397 lysyl-tyrosyl-lysine Proteins 0.000 description 1
- 108010017391 lysylvaline Proteins 0.000 description 1
- 108700021021 mRNA Vaccine Proteins 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 238000012737 microarray-based gene expression Methods 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 230000002438 mitochondrial effect Effects 0.000 description 1
- 230000009456 molecular mechanism Effects 0.000 description 1
- 238000012243 multiplex automated genomic engineering Methods 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 210000000066 myeloid cell Anatomy 0.000 description 1
- 108010084677 myogenic factor 6 Proteins 0.000 description 1
- YOHYSYJDKVYCJI-UHFFFAOYSA-N n-[3-[[6-[3-(trifluoromethyl)anilino]pyrimidin-4-yl]amino]phenyl]cyclopropanecarboxamide Chemical compound FC(F)(F)C1=CC=CC(NC=2N=CN=C(NC=3C=C(NC(=O)C4CC4)C=CC=3)C=2)=C1 YOHYSYJDKVYCJI-UHFFFAOYSA-N 0.000 description 1
- AEMBWNDIEFEPTH-UHFFFAOYSA-N n-tert-butyl-n-ethylnitrous amide Chemical compound CCN(N=O)C(C)(C)C AEMBWNDIEFEPTH-UHFFFAOYSA-N 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 230000030147 nuclear export Effects 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 229960000402 palivizumab Drugs 0.000 description 1
- 208000003154 papilloma Diseases 0.000 description 1
- 229920002866 paraformaldehyde Polymers 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000000149 penetrating effect Effects 0.000 description 1
- 230000035515 penetration Effects 0.000 description 1
- 210000005259 peripheral blood Anatomy 0.000 description 1
- 239000011886 peripheral blood Substances 0.000 description 1
- 108010021711 pertactin Proteins 0.000 description 1
- 229940124733 pneumococcal vaccine Drugs 0.000 description 1
- 231100000572 poisoning Toxicity 0.000 description 1
- 230000000607 poisoning effect Effects 0.000 description 1
- 108700004029 pol Genes Proteins 0.000 description 1
- 229920001481 poly(stearyl methacrylate) Polymers 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 210000002729 polyribosome Anatomy 0.000 description 1
- 230000001323 posttranslational effect Effects 0.000 description 1
- OXCMYAYHXIHQOA-UHFFFAOYSA-N potassium;[2-butyl-5-chloro-3-[[4-[2-(1,2,4-triaza-3-azanidacyclopenta-1,4-dien-5-yl)phenyl]phenyl]methyl]imidazol-4-yl]methanol Chemical compound [K+].CCCCC1=NC(Cl)=C(CO)N1CC1=CC=C(C=2C(=CC=CC=2)C2=N[N-]N=N2)C=C1 OXCMYAYHXIHQOA-UHFFFAOYSA-N 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 210000002243 primary neuron Anatomy 0.000 description 1
- 108090000468 progesterone receptors Proteins 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 1
- 108010014614 prolyl-glycyl-proline Proteins 0.000 description 1
- 108010015796 prolylisoleucine Proteins 0.000 description 1
- 108010053725 prolylvaline Proteins 0.000 description 1
- 230000001681 protective effect Effects 0.000 description 1
- 230000006337 proteolytic cleavage Effects 0.000 description 1
- PTJWIQPHWPFNBW-GBNDHIKLSA-N pseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-GBNDHIKLSA-N 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 239000003161 ribonuclease inhibitor Substances 0.000 description 1
- 201000005404 rubella Diseases 0.000 description 1
- 229960003131 rubella vaccine Drugs 0.000 description 1
- 230000003248 secreting effect Effects 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 108010071207 serylmethionine Proteins 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 210000001082 somatic cell Anatomy 0.000 description 1
- 210000003046 sporozoite Anatomy 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 239000004094 surface-active agent Substances 0.000 description 1
- 229960000814 tetanus toxoid Drugs 0.000 description 1
- 229960002766 tetanus vaccines Drugs 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 230000008719 thickening Effects 0.000 description 1
- 239000002562 thickening agent Substances 0.000 description 1
- 229960000103 thrombolytic agent Drugs 0.000 description 1
- 230000002537 thrombolytic effect Effects 0.000 description 1
- 229940031572 toxoid vaccine Drugs 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 239000012096 transfection reagent Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 239000012581 transferrin Substances 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 239000013638 trimer Substances 0.000 description 1
- 229960002109 tuberculosis vaccine Drugs 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
- 108010005834 tyrosyl-alanyl-glycine Proteins 0.000 description 1
- 108010051110 tyrosyl-lysine Proteins 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 241001529453 unidentified herpesvirus Species 0.000 description 1
- 241000712461 unidentified influenza virus Species 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 108010027510 vaccinia virus capping enzyme Proteins 0.000 description 1
- 239000003981 vehicle Substances 0.000 description 1
- 239000002435 venom Substances 0.000 description 1
- 231100000611 venom Toxicity 0.000 description 1
- 210000001048 venom Anatomy 0.000 description 1
- 229960004854 viral vaccine Drugs 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/67—General methods for enhancing the expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/50—Physical structure
- C12N2310/53—Physical structure partially self-complementary or closed
- C12N2310/531—Stem-loop; Hairpin
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/50—Vector systems having a special element relevant for transcription regulating RNA stability, not being an intron, e.g. poly A signal
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A50/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
- Y02A50/30—Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change
Landscapes
- Genetics & Genomics (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Wood Science & Technology (AREA)
- Organic Chemistry (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Saccharide Compounds (AREA)
Abstract
본 개시내용은 합성 mRNA의 5' 및/또는 3' 비번역 영역(UTR)에서 번역 향상 요소를 이용함으로써 세포에서 단백질 발현을 향상시키는 것에 관한 것이다. 5' UTR은 프로모터, 미니-인핸서 서열, 및 Kozak 서열을 포함하는 반면, 3' UTR은 스페이서, 스템 루프 구조, 및 선택적으로 폴리아데닌 꼬리를 포함한다. 인공 5' 및 3' UTR은 단백질 발현을 증가시키고, 특정 예에서, 변형된 뉴클레오사이드, 마이크로RNA 부위, 또는 면역-회피 인자를 포함하지 않는다.
Description
관련 출원에 대한 상호 참조
본 출원은 2021년 2월 25일자로 출원된 미국 특허 가출원 제63/153,877호를 우선권으로 주장하며, 이의 전체 내용은 그 전체가 본 명세서에 참조에 의해 원용된다.
서열 목록에 대한 참조
본 출원과 관련된 서열 목록은 종이 사본 대신에 텍스트 형식으로 제공되고, 본 명세서에 명세서 내에 참조에 의해 원용된다. 서열 목록을 포함하는 텍스트 파일의 명칭은 P183-0010PCT_ST25.txt이다. 텍스트 파일은 26.9 KB이고, 2022년 2월 24일에 생성되었고, EFS-Web을 통해 전자적으로 제출된다.
본 개시내용의 분야
본 개시내용은 코딩 서열에 인접하는 인공 5' 및/또는 3' 비번역 영역(UTR)을 갖는 조작된 발현 작제물을 제공한다. 5' UTR은 프로모터, 미니-인핸서 서열, 및 Kozak 서열을 포함하는 반면, 3' UTR은 스페이서, 스템 루프 구조, 및 선택적으로 폴리아데닌 꼬리를 포함한다. 인공 5' 및 3' UTR은 단백질 발현을 증가시키고, 특정 예에서, 변형된 뉴클레오사이드, 마이크로RNA 부위 또는 면역-회피 인자를 포함하지 않는다.
단백질 발현에 영향을 미치는 종래의 기존 방법은 문제로 가득 차 있다. 예를 들어, 외인성으로 도입된 데옥시리보핵산(DNA)이 일부 빈도로 숙주 세포 게놈 DNA에 통합되는 것이 가능하다. 이러한 통합은 숙주 세포 게놈 DNA에 대한 변경 및/또는 손상을 초래한다. 대안적으로, 세포에 도입된 이러한 외인성 DNA는 딸 세포(외인성 DNA가 염색체에 통합되었는지 여부에 관계없이) 또는 자손에 의해 유전될 수 있다. 또한, 숙주 게놈으로 적절하게 전달하더라도 및 숙주 게놈으로의 손상 또는 통합이 없더라도, 인코딩된 단백질이 DNA 가닥으로부터 생산되기 전에 여러 단계가 일어나야 한다. 일단 세포 내부로 들어가면, DNA는 RNA로 전사되는 핵으로 수송되어야 한다. DNA로부터 전사된 RNA는 단백질로 번역되는 세포질로 들어가야 한다. 트랜스펙션된 DNA에서 생산된 단백질까지의 이러한 다중 프로세싱 단계는 기능적 단백질의 최종 생성 전에 지연 시간을 초래하며, 각 단계는 세포에 대한 오류 및 손상의 기회를 나타낸다. 또한, 트랜스펙션된 DNA가 발현되지 않거나 원하는 용도에 필요한 합리적인 속도 또는 농도로 발현되지 않을 수 있기 때문에 종종 세포에서 원하는 단백질 발현 수준을 얻는 것이 어렵다. 이는 DNA가 1차 세포 또는 변형된 세포주에 도입될 때 특히 문제가 될 수 있다.
메신저 RNA(mRNA)는 또한 세포의 단기 변형을 가능하게 하는 가능성으로 조사되었다. 일종의 가역적 유전자 요법으로서 mRNA를 사용하는 이점은 일시적 발현 및 비-형질전환 특성을 포함한다. mRNA는 발현되기 위해 핵에 들어갈 필요가 없고, 또한 숙주 게놈에 통합될 수 없으므로, 종양발생의 위험이 제거된다. mRNA로 달성 가능한 트랜스펙션 속도는 비교적 높고, 많은 세포 타입에 대해 심지어 >90%이므로, 트랜스펙션된 세포를 선택할 필요가 없다.
치료제로서의 mRNA 및 백신으로서의 mRNA 분야에 대한 최근의 상당한 발전에도 불구하고, 당 분야에서는 mRNA를 사용하여 단백질 발현 수준을 증가시키기 위한 추가 연구가 여전히 요구되고 있다.
본 개시내용의 목적은 인코딩된 단백질의 발현 수준을 증가시키는 조작된 리보핵산(예를 들어, mRNA)을 제공하는 것이다.
본 개시내용의 또 다른 목적은 인코딩된 단백질의 발현 수준을 증가시키는 최소 서열을 제공하는 것이다.
이를 위해, 본 개시내용은 특정 조작된 발현 작제물(EEC)이 인코딩된 단백질의 발현 수준을 증가시키는 것을 제공한다. EEC는 코딩 서열의 측면에 배치된 인공 5' 및/또는 3' 비번역 영역(UTR)을 갖는다. 5' UTR은 프로모터, 미니-인핸서 서열(CAUACUCA, 본 명세서), 및 Kozak 서열을 포함하는 반면, 3' UTR은 스페이서, 스템 루프 구조, 및 선택적으로, 폴리아데닌 꼬리(폴리A 꼬리)를 포함한다. 특정 예에서, 5' UTR은 작동 세그먼트를 생성하기 위해 개시 코돈에 작동 가능하게 연결된다. 본 명세서의 특정 예에서, 3' UTR은 또한 정지 코돈을 포함하는 것으로 도시된다.
조작된 5' UTR과 관련하여, 특정 예에서, 프로모터는 박테리오파지 T7 프로모터로부터 유래되고 서열 GGGAGA를 갖는다. 특정 예에서, Kozak 서열은 GCCRCC를 포함하며, 여기서, R은 A 또는 G이다. Kozak 서열은 또한 개시 코돈에 작동 가능하게 연결되어 서열 GCCRCC-개시(예를 들어, GCCRCCAUG)를 생성할 수 있다.
5' UTR의 특정 실시형태는 5'로부터 3'로, 미니-T7 프로모터, 미니-인핸서 서열(CAUACUCA, 본 명세서), 및 Kozak 서열을 포함하여, GGGAGACAUACUCAGCCACC(서열번호 2) 또는 GGGAGACAUACUCAGCCGCC(서열번호 3)를 생성한다. 개시 코돈의 첨가는 GGGAGACAUACUCAGCCACCAUG(서열번호 38) 및 GGGAGACAUACUCAGCCGCCAUG(서열번호 39)를 제공한다.
특정 예에서, 이러한 최소 5' UTR은 30개 미만의 뉴클레오타이드를 갖는다. 특정 예에서, 이러한 최소 5' UTR은 20 또는 23개의 뉴클레오타이드를 갖는다.
조작된 3' UTR과 관련하여, 특정 예에서, 스페이서는 [N1-3]AUA 또는 [N1-3]AAA를 포함한다. 보다 특정한 예에서, 스페이서는 UGCAUA 또는 UGCAAA를 포함한다. 예시적인 스템 루프 구조는 CCUC 및 GAGG와 같은 서열을 하이브리드화함으로써 형성된다. 특정 예에서, 하이브리드화 서열들 사이에 형성된 루프 구조는 길이가 7 내지 15개의 뉴클레오타이드이다. 루프 세그먼트의 예시적인 서열은 UAACGGUCUU(서열번호 34)를 포함한다. 3' UTR 서열의 일부로서 포함될 때, 예시적인 정지 코돈은 UAA, UAG, 및 UGA를 포함한다.
특정 예에서, 이러한 최소 3' UTR은 30개 미만의 뉴클레오타이드를 갖는다.
스템 루프와 관련하여, 스템 루프 서열의 순서에 관계없이 본 명세서에 개시된 EEC에서 증가된 단백질 발현이 관찰되며, 이는 2차 구조가 중요할 수 있고, 반드시 5'에서 3' 배향의 서열이 아닐 수 있음을 나타낸다. 조작된 3' UTR은 폴리A 꼬리를 추가적으로 포함할 수 있다.
일 양태에서, 본 개시내용은 포유동물 세포에서 번역을 위한 관심 단백질을 인코딩하는 코딩 서열을 포함하는 시험관내-합성된 RNA를 포함하는 EEC를 제공하며, 여기서, 상기 시험관내-합성된 RNA는 서열 CAUACUCA를 포함하는 5' UTR을 포함한다.
일 양태에서, 본 개시내용은 포유동물 세포에서 번역을 위한 관심 단백질을 인코딩하는 코딩 서열을 포함하는 시험관내-합성된 RNA를 포함하는 EEC를 제공하며, 여기서, 상기 시험관내-합성된 RNA는 서열번호 2 또는 서열번호 3을 포함하는 5' UTR을 포함한다. 5' UTR은 또한 개시 코돈과 함께 제시되어 서열번호 38 및 서열번호 39를 제공할 수 있다.
일 양태에서, 본 개시내용은 서열번호 4, 5, 6, 7, 8 또는 9를 포함하는 3' UTR을 포함하는 EEC를 제공한다.
일 양태에서, 본 개시내용은 서열번호 10, 11 또는 12를 포함하는 3' UTR을 포함하는 EEC를 제공한다.
일 양태에서, 본 개시내용은 서열번호 13, 14, 15, 16, 17, 18, 19, 20 또는 21을 포함하는 3' UTR을 포함하는 EEC를 제공한다.
서열번호 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 및 21 각각은 폴리A 꼬리를 포함하도록 작제될 수 있다.
일 양태에서, 본 개시내용은 포유동물 세포에서 번역을 위한 관심 단백질을 인코딩하는 코딩 서열을 포함하는 시험관내-합성된 RNA를 포함하는 EEC를 제공하며, 여기서, 상기 시험관내-합성된 RNA는 서열 CAUACUCA를 포함하는 5' UTR 및 서열번호 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 및/또는 21을 포함하는 3' UTR을 포함한다.
일 양태에서, 본 개시내용은 포유동물 세포에서 번역을 위한 관심 단백질을 인코딩하는 코딩 서열을 포함하는 시험관내-합성된 RNA를 포함하는 EEC를 제공하며, 여기서, 상기 시험관내-합성된 RNA는 서열번호 2 또는 서열번호 3을 포함하는 5' UTR 및 서열번호 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 및/또는 21을 포함하는 3' UTR을 포함한다.
일 양태에서, 본 개시내용은 포유동물 세포에서 번역을 위한 관심 단백질을 인코딩하는 코딩 서열을 포함하는 시험관내-합성된 RNA를 포함하는 EEC를 제공하며, 여기서, 상기 시험관내-합성된 RNA는 서열번호 38 또는 서열번호 39를 포함하는 5' UTR 및 서열번호 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 및/또는 21을 포함하는 3' UTR을 포함한다.
특정 실시형태에서, 본 명세서에 개시된 EEC는 임의의 변형된 뉴클레오사이드를 포함하지 않는다. 특정 실시형태에서, 본 명세서에 개시된 EEC는 임의의 마이크로RNA 결합 부위를 포함하지 않는다. 특정 실시형태에서, 본 명세서에 개시된 EEC는 임의의 변형된 뉴클레오사이드를 포함하지 않고 임의의 마이크로RNA 결합 부위를 포함하지 않는다.
개시된 EEC 내에서, 조작된 5' 및 3' UTR은 오픈 리딩 프레임 내에서 코딩 서열의 측면에 위치한다. 본 개시내용에서 제공된 데이터는 트랜스펙션 방식과 무관하게, 다양한 세포 타입(예를 들어, 림프계 및 부착성 및 현탁 배아 신장 세포)에서 녹색 형광 단백질(GFP), 인터루킨-2(IL-2) 및 POU5F1(OCT3/4)의 증가된 발현을 보여준다.
본 명세서에 개시된 EEC는 다수의 상이한 목적을 위해 다양한 단백질의 발현을 증가시키기 위해 이용될 수 있다. 예시적인 목적은 치료제 및 백신의 사용을 포함한다.
도면들 중 일부 도면은 색상으로 더 잘 이해될 수 있다. 출원인은 도면의 컬러 버전을 원래 제출의 일부로 간주하고 이후 절차에서 컬러 버전을 제시할 권리를 보유한다.
도 1은 생체내에서 단백질 발현을 증가시키도록 설계된 EEC의 개략도를 도시한다. EEC는 단백질 발현을 증가시키기 위해 EEC 내에 여러 모듈을 포함한다. 5' UTR 내에 위치한 모듈은 3개의 모듈로 나뉜다: 프로모터(예를 들어, T7 프로모터 헥사머)를 나타내는 모듈 1("M1"); 독특한 번역 인핸서(CAUACUCA, 본 명세서에 기재 됨)를 나타내는 모듈 2("M2"); 및 Kozak 공통 서열인 모듈 3("M3"). 도시된 예시적인 3' UTR은 또한 정지 코돈, 스페이서, 및 스템-루프 세그먼트를 포함하는 3개의 세그먼트로 분할된다. 폴리A 꼬리가 또한 포함될 수 있다.
도 2는 x-축에 GFP 강도(FL1-H)를 표시하고 y-축에 세포 수를 표시하는 유세포 분석 히스토그램을 도시한다. EXPI293 세포는 본 명세서에 기재된 바와 같은 본 발명의 5' UTR(서열번호 2) 및 3' UTR(서열번호 10) 서열을 보유하고 이의 오픈 리딩 프레임(서열번호 55 및 56 참조) 내에 GFP 코딩 서열을 갖는 증가하는 양의 EEC로 트랜스펙션되었다. 도시된 바와 같이, GFP 신호 포화는 트랜스펙션 24시간 후에 0.4 피코몰(pmole)(100 ng)의 EEC에 도달한다.
도 3a 및 도 3b는 트랜스펙션 3시간 후(도 3a) 및 트랜스펙션 24시간 후(도 3b)에 GFP-인코딩 EEC 5' UTR 변이체에 대한 x-축에 GFP 강도(FL1-H) 및 y-축에 세포 수를 나타내는 유세포 분석 그래프를 도시한다. 유세포 분석 실험의 결과는 또한 막대 그래프로 제공된다. EXPI293 세포는 등몰량의 GFP-인코딩 EEC 5' UTR 변이체, RNA 없음(음성 대조군) 5' UTR mRNA 없음, M1 및 M3 모듈만 5' UTR, 및 M1, M2 및 M3 모듈 5' UTR(서열 번호: 2)로 트랜스펙션되었다.
도 4a 및 도 4b는 트랜스펙션 3시간 후(도 4a) 및 트랜스펙션 24시간 후(도 4b)에 GFP-인코딩 EEC 5' UTR 및 3' UTR 변이체에 대한 x-축에 GFP 강도(FL1-H) 및 y-축에 세포 수를 나타내는 유세포 분석 그래프를 나타낸다. 유세포 분석 실험의 결과는 또한 막대 그래프로 제공된다. 등몰량의 GFP-인코딩 EEC 5' UTR 및 3' UTR 변이체로 트랜스펙션된 EXPI293 세포:
(i) RNA 없음(음성 대조군);
(ii) 3' UTR 단독 mRNA(GGGAGAAUG(ORF)의 전사를 가능하게 하는 UTR의 기본 형태를 제외하고는 5' UTR이 없는 3' UTR에 대한 UGCAUACCUCUAACGGUCUUGAGG(서열번호 10) 또는 UAAUGCAUACCUCUAACGGUCUUGAGG(서열번호 13));
(iii) M3 단독 5' UTR + 3' UTR(5' UTR로서 UAAUGCAUACCUCUAACGGUCUUGAGG(서열번호 13) 및 3' UTR로서 GGGAGAGCCACCAUG(ORF)(서열번호 63)); 및
(iv) M1, M2 및 M3 5' UTR(서열번호 2) + 3' UTR(서열번호 10). 전장 5'(서열번호 2) + 3'(서열번호 10) UTR을 갖는 EEC를 수용하는 세포는 가장 높은 GFP 강도를 나타낸다는 점에 유의한다.
도 5는 본 명세서에 개시된 EEC를 사용하여 발현된 3개의 상이한 타입의 단백질을 예시한다: 세포질, 소기관(즉, 핵 구획) 및 세포외 구획(즉, 분비 단백질)에서 단백질의 표적화된 발현.
도 6a 내지 도 6c는 GFP 단백질을 발현하는 HEK293 세포를 도해한다. (도 6a)는 GFP 강도(x-축) 및 HEK293 세포 내로 트랜스펙션된 GFP-인코딩 EEC의 양이 증가함에 따라 발생하는 검출에서의 이동을 나타내는 유세포 분석 그래프를 도시한다("mRNA 없음"으로 표지된 패널에는 GFP-인코딩 EEC mRNA가 없다). 다른 패널은 패널의 표제에 의해 지시된 바와 같은 0.2 피코몰의 GFP-인코딩 EEC mRNA; 0.4 피코몰의 GFP-인코딩 EEC mRNA, 1.0 피코몰의 GFP-인코딩 EEC mRNA, 2.0 피코몰의 GFP-인코딩 EEC mRNA 및 4.0 피코몰의 GFP-인코딩 EEC mRNA를 도시하고, (도 6b)는 GFP-인코딩 EEC의 증가하는 투여에 비해 GFP 양성 세포의 백분율 증가에 관한 도 6a의 유세포 분석 그래프로부터의 결과를 해석하는 차트를 도시한다. 도 6b의 차트를 준비하기 위해, GFP에 대해 양성인 HEK293 세포의 백분율은 y-축에 표시되며, GFP-인코딩 EEC mRNA의 양은 x-축에 표시된다. 이와 같이, 도 6b는 GFP-인코딩 EEC mRNA가 증가함에 따라 GFP 양성 세포의 증가된 백분율을 도시한다. (도 6c)는 GFP 발현에 양성인 세포에서 트랜스펙션된 GFP-인코딩 EEC의 수준 증가에 따른 중앙 GFP 강도의 비례 증가에 관한 도 6a의 유세포 분석 그래프로부터의 결과를 해석한다. 도 6c의 차트를 준비하기 위해, GFP를 발현하는 세포로부터의 중앙 GFP 강도는 y-축에 표시되며(FLI-H), GFP-인코딩 EEC mRNA의 양은 x-축에 표시된다. 이와 같이, 도 6c는 GFP-인코딩 EEC mRNA가 증가함에 따라 중앙 GFP 강도의 비례 증가를 예시한다.
도 7a 내지 도 7c는 GFP-인코딩 EEC 변이체로의 트랜스펙션 후 GFP 단백질을 발현하는 HEK293 세포를 도시한다. (도 7a)는 0.4 피코몰의 GFP-인코딩 EEC 변이체로 트랜스펙션된 세포의 GFP 강도(x-축)를 오버레이하는 히스토그램을 예시한다. (도 7b)는 세포가 1 피코몰의 GFP-인코딩 EEC 변이체로 트랜스펙션된다는 점을 제외하고는 (도 7a)와 유사하다. (도 7c)는 등몰 수준의 GFP-인코딩 EEC 변이체(n=2)로 트랜스펙션된 HEK293 세포의 중앙 GFP 강도를 나타내는 막대 그래프를 도시한다. 변이체는 5' UTR만(서열번호 2); 3' UTR만(도 4b의 설명에서 보다 상세히 기재된 바와 같음); 5' 및 3' UTR(서열번호 2 및 서열번호 10, 도 4b의 설명에서 더욱 상세히 기재된 바와 같음); Kozak만; 및 Kozak 및 3' UTR(서열번호 10)을 포함한다.
도 8a 및 도 8b는 GFP-인코딩 EEC 변이체로의 트랜스펙션 후 GFP 단백질을 발현하는 Jurkat(T) 림프구를 도시한다. (도 8a)는 다양한 GFP-인코딩 EEC(전장 5'(서열번호 2) 및 3'(서열번호 10) UTR)로 트랜스펙션된 각 세포 그룹에 존재하는 GFP 양성 Jurkat 세포의 양을 나타내는 유세포 분석 그래프를 도시한다. (도 8b)는 다양한 GFP-인코딩 EEC 5'(서열번호 2) 및 3'(서열번호 10) UTR EEC 작제물로 트랜스펙션된 각 세포 그룹에서 GFP 양성 Jurkat 세포의 양을 나타내는 유세포 분석 히스토그램을 도시한다. (도 8a)의 유세포 분석 그래프로부터의 결과는 전장 5'(서열번호 2) 및 3'(서열번호 10) UTR을 갖는 증가하는 양의 GFP-인코딩 EEC로 트랜스펙션된 GFP 양성 Jurkat 세포의 백분율을 나타내는 선 그래프로서 제공된다. (도 8b)의 유세포 분석 실험으로부터의 결과는 8 피코몰의 GFP-인코딩 EEC 변이체(n=2)로 트랜스펙션된 Jurkat 세포의 GFP 강도 및 백분율을 나타내는 막대 그래프로서 제공된다. UTR이 없음; Kozak 단독; 5' 단독; 3' 단독; 5' 및 3'; 및 Kozak 및 3'를 갖는 변이체에 대한 데이터가 제시된다. 이러한 변이체에 사용된 서열에 대한 세부사항은 도 4b 및 도 7c의 설명에서 확인될 수 있다.
도 9a 내지 도 9c는 UTR 변이체를 보유하는 GFP-인코딩 EEC로 림프구를 전기천공한지 24시간 후에 Jurkat(T) 림프구에서 GFP 발현의 양을 도시한다. (도 9a)는 4 피코몰의 각각의 GFP-인코딩 EEC 변이체를 사용하여 트랜스펙션된 Jurkat 세포의 GFP 강도 및 백분율을 갖는 히스토그램의 대표적인 예를 나타낸다. (도 9b)는 8 피코몰의 각각의 GFP-인코딩 EEC 변이체로 트랜스펙션된 Jurkat 세포의 GFP 강도 및 백분율을 나타내는 히스토그램의 대표적인 예를 도시한다. (도 9c)는 (도 9a) 및 (도 9b)에 도시된 바와 같이, 4 및 8 pmol의 GFP-인코딩 EEC 변이체를 갖는 림프구의 중앙 GFP 강도{실험 횟수 = 2}를 나타내는 막대 그래프이다.
도 10a 내지 도 10c는 GFP 단백질을 발현하는 Raji 림프구가 UTR 변이체를 보유하는 GFP-인코딩 EEC로 림프구를 전기천공한지 24시간 후에 유세포 분석으로 처리된 대표적인 실험을 도시한다. (도 10a)는 4 pmol의 GFP-인코딩 EEC 변이체로 트랜스펙션된 Raji 림프구의 GFP 강도 및 백분율의 그래프를 도시한다. (도 10b)는 8 pmol의 GFP-인코딩 EEC 변이체로 트랜스펙션된 세포의 GFP 강도 및 백분율의 대표적인 그래프를 나타낸다. (도 10c)는 (도 10a) 및 (도 10b)에 도시된 바와 같은 실험의 중앙 GFP 강도{실험 횟수 = 2}를 나타내는 막대 그래프를 표시하며, 이는 각각 4 및 8 pmol의 GFP-인코딩 EEC 변이체로 트랜스펙션된 Raji 림프구의 GFP 강도를 도시한다. UTR 없음; Kozak 단독; 5' 단독(서열번호 2); 3' 단독(서열번호 10); 5' 및 3'((서열번호 2) 및 (서열번호 10)); 및 Kozak 및 3'(서열번호 10)를 갖는 변이체에 대한 데이터가 제시된다.
도 11a 및 도 11b는 본 명세서에 개시된 5'-3' UTR 변이체를 보유하는 hOCT3/4-인코딩 EEC로 트랜스펙션 24시간 후에 HEK293 세포에서 hOCT3/4 단백질의 발현을 도시한다. (도 11a)는 증가하는 양의 hOCT3/4-인코딩 EEC(전장 5'(서열번호: 2) 및 3'(서열번호: 10) UTR을 가짐)로 트랜스펙션된 hOCT3/4 양성 HEK293 세포의 hOCT3/4의 강도 및 백분율의 양을 나타내는 대표적인 유세포 분석 실험으로부터의 결과를 도시한다. (도 11b)는 UTR 변이체를 갖는 1.2 피코몰의 hOCT3/4로 트랜스펙션된 hOCT3/4+ 세포의 hOCT3/4의 강도 및 백분율의 양을 나타내는 대표적인 유세포 분석 실험으로부터의 결과를 도시한다. (도 11a)의 유세포 분석 실험의 결과는 또한 선 그래프로 제공된다. (도 11b)에 도시된 바와 같은 실험의 {실험 횟수 = 2}로부터의 중간 결과는 RNA가 없는 것과 비교할 때 UTR 변이체를 사용하는 UTR 변이체를 갖는 hOCT3/4의 수준이 또한 막대 그래프로서 제공됨을 도시한다.
도 12a 및 도 12b는 본 명세서에 개시된 5'-3' UTR 변이체를 갖는 hIL2-인코딩 EEC로 트랜스펙션 24시간 후에 HEK293 세포로부터의 hIL2 단백질의 발현(ELISA에 의해 측정됨)을 도시한다. (도 12a)는 hIL2-인코딩 EEC{전장 5'(서열번호: 2) UTR 및 3' UTR(서열번호: 10)을 가짐}의 투여가 증가함에 따라 ELISA 신호의 흡광도(@450nm)의 증가를 나타내는 그래프를 나타낸다. (도 12b)는 UTR 변이체((서열번호 2) 및 (서열번호 10))를 갖는 0.5 pmol의 hIL2-인코딩 EEC로 트랜스펙션된 HEK293 세포로부터의 hIL2의 상대적 수준을 나타내는 막대 그래프를 나타낸다.
도 13a 내지 도 13c는 전장 5'(서열번호 2) UTR 및 3' UTR의 변이체(서열번호 10, 11 및 12)로 GFP-인코딩 EEC 트랜스펙션 후 HEK293 세포에서 GFP 단백질의 발현을 도시한다. (도 13a)는 3' UTR 변이체의 서열을 도시한다. (도 13b)는 1 내지 2 pmol의 다양한 EEC의 트랜스펙션 24시간 후에 GFP 양성 HEK293 세포의 백분율(유동 세포 분석에 의한 10,000개의 이벤트/세포를 기반으로 함)을 나타낸다. (도 13c)는 (도 13a)에 도시된 바와 같이 3' UTR 변이체(A, B 및 C)를 갖는 1 내지 2 pmol의 GFP-인코딩 EEC로 트랜스펙션된 HEK293 세포(2회의 개별 실험으로부터)의 중앙 GFP 강도를 나타내는 막대 그래프이다.
도 14. 조작된 Oct4 mRNA 작제물의 트랜스펙션 시 인간 포피 섬유모세포에서의 Oct4 발현(UO: 비변형 mRNA Oct4, UMD: 비변형 mRNA MyoD-Oct4, PUO: 변형 mRNA Oct4, PUMD: 변형 mRNA MyoD-Oct4).
도 15. 시험관내 합성된 RNA를 생성하기 위한 cDNA 작제물 및 EGFP, Oct4, 및 IL2(서열번호 55 내지 60)에 대한 생성된 합성 RNA 작제물을 포함하는 본 개시를 지지하는 추가 서열.
도 1은 생체내에서 단백질 발현을 증가시키도록 설계된 EEC의 개략도를 도시한다. EEC는 단백질 발현을 증가시키기 위해 EEC 내에 여러 모듈을 포함한다. 5' UTR 내에 위치한 모듈은 3개의 모듈로 나뉜다: 프로모터(예를 들어, T7 프로모터 헥사머)를 나타내는 모듈 1("M1"); 독특한 번역 인핸서(CAUACUCA, 본 명세서에 기재 됨)를 나타내는 모듈 2("M2"); 및 Kozak 공통 서열인 모듈 3("M3"). 도시된 예시적인 3' UTR은 또한 정지 코돈, 스페이서, 및 스템-루프 세그먼트를 포함하는 3개의 세그먼트로 분할된다. 폴리A 꼬리가 또한 포함될 수 있다.
도 2는 x-축에 GFP 강도(FL1-H)를 표시하고 y-축에 세포 수를 표시하는 유세포 분석 히스토그램을 도시한다. EXPI293 세포는 본 명세서에 기재된 바와 같은 본 발명의 5' UTR(서열번호 2) 및 3' UTR(서열번호 10) 서열을 보유하고 이의 오픈 리딩 프레임(서열번호 55 및 56 참조) 내에 GFP 코딩 서열을 갖는 증가하는 양의 EEC로 트랜스펙션되었다. 도시된 바와 같이, GFP 신호 포화는 트랜스펙션 24시간 후에 0.4 피코몰(pmole)(100 ng)의 EEC에 도달한다.
도 3a 및 도 3b는 트랜스펙션 3시간 후(도 3a) 및 트랜스펙션 24시간 후(도 3b)에 GFP-인코딩 EEC 5' UTR 변이체에 대한 x-축에 GFP 강도(FL1-H) 및 y-축에 세포 수를 나타내는 유세포 분석 그래프를 도시한다. 유세포 분석 실험의 결과는 또한 막대 그래프로 제공된다. EXPI293 세포는 등몰량의 GFP-인코딩 EEC 5' UTR 변이체, RNA 없음(음성 대조군) 5' UTR mRNA 없음, M1 및 M3 모듈만 5' UTR, 및 M1, M2 및 M3 모듈 5' UTR(서열 번호: 2)로 트랜스펙션되었다.
도 4a 및 도 4b는 트랜스펙션 3시간 후(도 4a) 및 트랜스펙션 24시간 후(도 4b)에 GFP-인코딩 EEC 5' UTR 및 3' UTR 변이체에 대한 x-축에 GFP 강도(FL1-H) 및 y-축에 세포 수를 나타내는 유세포 분석 그래프를 나타낸다. 유세포 분석 실험의 결과는 또한 막대 그래프로 제공된다. 등몰량의 GFP-인코딩 EEC 5' UTR 및 3' UTR 변이체로 트랜스펙션된 EXPI293 세포:
(i) RNA 없음(음성 대조군);
(ii) 3' UTR 단독 mRNA(GGGAGAAUG(ORF)의 전사를 가능하게 하는 UTR의 기본 형태를 제외하고는 5' UTR이 없는 3' UTR에 대한 UGCAUACCUCUAACGGUCUUGAGG(서열번호 10) 또는 UAAUGCAUACCUCUAACGGUCUUGAGG(서열번호 13));
(iii) M3 단독 5' UTR + 3' UTR(5' UTR로서 UAAUGCAUACCUCUAACGGUCUUGAGG(서열번호 13) 및 3' UTR로서 GGGAGAGCCACCAUG(ORF)(서열번호 63)); 및
(iv) M1, M2 및 M3 5' UTR(서열번호 2) + 3' UTR(서열번호 10). 전장 5'(서열번호 2) + 3'(서열번호 10) UTR을 갖는 EEC를 수용하는 세포는 가장 높은 GFP 강도를 나타낸다는 점에 유의한다.
도 5는 본 명세서에 개시된 EEC를 사용하여 발현된 3개의 상이한 타입의 단백질을 예시한다: 세포질, 소기관(즉, 핵 구획) 및 세포외 구획(즉, 분비 단백질)에서 단백질의 표적화된 발현.
도 6a 내지 도 6c는 GFP 단백질을 발현하는 HEK293 세포를 도해한다. (도 6a)는 GFP 강도(x-축) 및 HEK293 세포 내로 트랜스펙션된 GFP-인코딩 EEC의 양이 증가함에 따라 발생하는 검출에서의 이동을 나타내는 유세포 분석 그래프를 도시한다("mRNA 없음"으로 표지된 패널에는 GFP-인코딩 EEC mRNA가 없다). 다른 패널은 패널의 표제에 의해 지시된 바와 같은 0.2 피코몰의 GFP-인코딩 EEC mRNA; 0.4 피코몰의 GFP-인코딩 EEC mRNA, 1.0 피코몰의 GFP-인코딩 EEC mRNA, 2.0 피코몰의 GFP-인코딩 EEC mRNA 및 4.0 피코몰의 GFP-인코딩 EEC mRNA를 도시하고, (도 6b)는 GFP-인코딩 EEC의 증가하는 투여에 비해 GFP 양성 세포의 백분율 증가에 관한 도 6a의 유세포 분석 그래프로부터의 결과를 해석하는 차트를 도시한다. 도 6b의 차트를 준비하기 위해, GFP에 대해 양성인 HEK293 세포의 백분율은 y-축에 표시되며, GFP-인코딩 EEC mRNA의 양은 x-축에 표시된다. 이와 같이, 도 6b는 GFP-인코딩 EEC mRNA가 증가함에 따라 GFP 양성 세포의 증가된 백분율을 도시한다. (도 6c)는 GFP 발현에 양성인 세포에서 트랜스펙션된 GFP-인코딩 EEC의 수준 증가에 따른 중앙 GFP 강도의 비례 증가에 관한 도 6a의 유세포 분석 그래프로부터의 결과를 해석한다. 도 6c의 차트를 준비하기 위해, GFP를 발현하는 세포로부터의 중앙 GFP 강도는 y-축에 표시되며(FLI-H), GFP-인코딩 EEC mRNA의 양은 x-축에 표시된다. 이와 같이, 도 6c는 GFP-인코딩 EEC mRNA가 증가함에 따라 중앙 GFP 강도의 비례 증가를 예시한다.
도 7a 내지 도 7c는 GFP-인코딩 EEC 변이체로의 트랜스펙션 후 GFP 단백질을 발현하는 HEK293 세포를 도시한다. (도 7a)는 0.4 피코몰의 GFP-인코딩 EEC 변이체로 트랜스펙션된 세포의 GFP 강도(x-축)를 오버레이하는 히스토그램을 예시한다. (도 7b)는 세포가 1 피코몰의 GFP-인코딩 EEC 변이체로 트랜스펙션된다는 점을 제외하고는 (도 7a)와 유사하다. (도 7c)는 등몰 수준의 GFP-인코딩 EEC 변이체(n=2)로 트랜스펙션된 HEK293 세포의 중앙 GFP 강도를 나타내는 막대 그래프를 도시한다. 변이체는 5' UTR만(서열번호 2); 3' UTR만(도 4b의 설명에서 보다 상세히 기재된 바와 같음); 5' 및 3' UTR(서열번호 2 및 서열번호 10, 도 4b의 설명에서 더욱 상세히 기재된 바와 같음); Kozak만; 및 Kozak 및 3' UTR(서열번호 10)을 포함한다.
도 8a 및 도 8b는 GFP-인코딩 EEC 변이체로의 트랜스펙션 후 GFP 단백질을 발현하는 Jurkat(T) 림프구를 도시한다. (도 8a)는 다양한 GFP-인코딩 EEC(전장 5'(서열번호 2) 및 3'(서열번호 10) UTR)로 트랜스펙션된 각 세포 그룹에 존재하는 GFP 양성 Jurkat 세포의 양을 나타내는 유세포 분석 그래프를 도시한다. (도 8b)는 다양한 GFP-인코딩 EEC 5'(서열번호 2) 및 3'(서열번호 10) UTR EEC 작제물로 트랜스펙션된 각 세포 그룹에서 GFP 양성 Jurkat 세포의 양을 나타내는 유세포 분석 히스토그램을 도시한다. (도 8a)의 유세포 분석 그래프로부터의 결과는 전장 5'(서열번호 2) 및 3'(서열번호 10) UTR을 갖는 증가하는 양의 GFP-인코딩 EEC로 트랜스펙션된 GFP 양성 Jurkat 세포의 백분율을 나타내는 선 그래프로서 제공된다. (도 8b)의 유세포 분석 실험으로부터의 결과는 8 피코몰의 GFP-인코딩 EEC 변이체(n=2)로 트랜스펙션된 Jurkat 세포의 GFP 강도 및 백분율을 나타내는 막대 그래프로서 제공된다. UTR이 없음; Kozak 단독; 5' 단독; 3' 단독; 5' 및 3'; 및 Kozak 및 3'를 갖는 변이체에 대한 데이터가 제시된다. 이러한 변이체에 사용된 서열에 대한 세부사항은 도 4b 및 도 7c의 설명에서 확인될 수 있다.
도 9a 내지 도 9c는 UTR 변이체를 보유하는 GFP-인코딩 EEC로 림프구를 전기천공한지 24시간 후에 Jurkat(T) 림프구에서 GFP 발현의 양을 도시한다. (도 9a)는 4 피코몰의 각각의 GFP-인코딩 EEC 변이체를 사용하여 트랜스펙션된 Jurkat 세포의 GFP 강도 및 백분율을 갖는 히스토그램의 대표적인 예를 나타낸다. (도 9b)는 8 피코몰의 각각의 GFP-인코딩 EEC 변이체로 트랜스펙션된 Jurkat 세포의 GFP 강도 및 백분율을 나타내는 히스토그램의 대표적인 예를 도시한다. (도 9c)는 (도 9a) 및 (도 9b)에 도시된 바와 같이, 4 및 8 pmol의 GFP-인코딩 EEC 변이체를 갖는 림프구의 중앙 GFP 강도{실험 횟수 = 2}를 나타내는 막대 그래프이다.
도 10a 내지 도 10c는 GFP 단백질을 발현하는 Raji 림프구가 UTR 변이체를 보유하는 GFP-인코딩 EEC로 림프구를 전기천공한지 24시간 후에 유세포 분석으로 처리된 대표적인 실험을 도시한다. (도 10a)는 4 pmol의 GFP-인코딩 EEC 변이체로 트랜스펙션된 Raji 림프구의 GFP 강도 및 백분율의 그래프를 도시한다. (도 10b)는 8 pmol의 GFP-인코딩 EEC 변이체로 트랜스펙션된 세포의 GFP 강도 및 백분율의 대표적인 그래프를 나타낸다. (도 10c)는 (도 10a) 및 (도 10b)에 도시된 바와 같은 실험의 중앙 GFP 강도{실험 횟수 = 2}를 나타내는 막대 그래프를 표시하며, 이는 각각 4 및 8 pmol의 GFP-인코딩 EEC 변이체로 트랜스펙션된 Raji 림프구의 GFP 강도를 도시한다. UTR 없음; Kozak 단독; 5' 단독(서열번호 2); 3' 단독(서열번호 10); 5' 및 3'((서열번호 2) 및 (서열번호 10)); 및 Kozak 및 3'(서열번호 10)를 갖는 변이체에 대한 데이터가 제시된다.
도 11a 및 도 11b는 본 명세서에 개시된 5'-3' UTR 변이체를 보유하는 hOCT3/4-인코딩 EEC로 트랜스펙션 24시간 후에 HEK293 세포에서 hOCT3/4 단백질의 발현을 도시한다. (도 11a)는 증가하는 양의 hOCT3/4-인코딩 EEC(전장 5'(서열번호: 2) 및 3'(서열번호: 10) UTR을 가짐)로 트랜스펙션된 hOCT3/4 양성 HEK293 세포의 hOCT3/4의 강도 및 백분율의 양을 나타내는 대표적인 유세포 분석 실험으로부터의 결과를 도시한다. (도 11b)는 UTR 변이체를 갖는 1.2 피코몰의 hOCT3/4로 트랜스펙션된 hOCT3/4+ 세포의 hOCT3/4의 강도 및 백분율의 양을 나타내는 대표적인 유세포 분석 실험으로부터의 결과를 도시한다. (도 11a)의 유세포 분석 실험의 결과는 또한 선 그래프로 제공된다. (도 11b)에 도시된 바와 같은 실험의 {실험 횟수 = 2}로부터의 중간 결과는 RNA가 없는 것과 비교할 때 UTR 변이체를 사용하는 UTR 변이체를 갖는 hOCT3/4의 수준이 또한 막대 그래프로서 제공됨을 도시한다.
도 12a 및 도 12b는 본 명세서에 개시된 5'-3' UTR 변이체를 갖는 hIL2-인코딩 EEC로 트랜스펙션 24시간 후에 HEK293 세포로부터의 hIL2 단백질의 발현(ELISA에 의해 측정됨)을 도시한다. (도 12a)는 hIL2-인코딩 EEC{전장 5'(서열번호: 2) UTR 및 3' UTR(서열번호: 10)을 가짐}의 투여가 증가함에 따라 ELISA 신호의 흡광도(@450nm)의 증가를 나타내는 그래프를 나타낸다. (도 12b)는 UTR 변이체((서열번호 2) 및 (서열번호 10))를 갖는 0.5 pmol의 hIL2-인코딩 EEC로 트랜스펙션된 HEK293 세포로부터의 hIL2의 상대적 수준을 나타내는 막대 그래프를 나타낸다.
도 13a 내지 도 13c는 전장 5'(서열번호 2) UTR 및 3' UTR의 변이체(서열번호 10, 11 및 12)로 GFP-인코딩 EEC 트랜스펙션 후 HEK293 세포에서 GFP 단백질의 발현을 도시한다. (도 13a)는 3' UTR 변이체의 서열을 도시한다. (도 13b)는 1 내지 2 pmol의 다양한 EEC의 트랜스펙션 24시간 후에 GFP 양성 HEK293 세포의 백분율(유동 세포 분석에 의한 10,000개의 이벤트/세포를 기반으로 함)을 나타낸다. (도 13c)는 (도 13a)에 도시된 바와 같이 3' UTR 변이체(A, B 및 C)를 갖는 1 내지 2 pmol의 GFP-인코딩 EEC로 트랜스펙션된 HEK293 세포(2회의 개별 실험으로부터)의 중앙 GFP 강도를 나타내는 막대 그래프이다.
도 14. 조작된 Oct4 mRNA 작제물의 트랜스펙션 시 인간 포피 섬유모세포에서의 Oct4 발현(UO: 비변형 mRNA Oct4, UMD: 비변형 mRNA MyoD-Oct4, PUO: 변형 mRNA Oct4, PUMD: 변형 mRNA MyoD-Oct4).
도 15. 시험관내 합성된 RNA를 생성하기 위한 cDNA 작제물 및 EGFP, Oct4, 및 IL2(서열번호 55 내지 60)에 대한 생성된 합성 RNA 작제물을 포함하는 본 개시를 지지하는 추가 서열.
치료제, 백신으로서 그리고/또는 달리 시험관내 및 생체내 둘 다에서 세포에서 단백질 발현을 변경시키기 위한 RNA의 사용에 있어서 상당한 과학적 진보가 이루어졌다. 극복해야 할 가장 큰 과제 중 하나는 주어진 결과를 허용하기에 충분히 높은 수준의 단백질 발현을 달성하는 것이다. 이러한 과제를 해결하고 표적 단백질의 발현을 증가시켜 mRNA가 다양한 임상적 맥락에서 유용하도록 여러 시도가 이루어졌다. 이러한 연구는 예를 들어, Ribostem Limited에 양도된 2006년 6월 8일자로 출원된(현재 포기됨) US20060247195; Moderna에 양도된 2011년 5월 12일자로 출원된 미국 등록 특허 제10,772,975호; BioNTech AG에 양도된 WO2009077134호로서 공개된 2008년 12월 12일자로 출원된 PCT/EP2008/01059; Curevac GMBH에 양도된 WO2009127230로서 공개된 2008년 4월 16일자로 출원된 PCT/EP2008/03033; Cellular Reprogramming, Inc.에 양도된 2016년 12월 29일자로 출원된 PCT/US2016/069079; 및 Cellular Reprogramming, Inc.에 양도된 2019년 6월 13일자로 출원된 PCT/US2019/037069에 개시되어 있다.
유전자의 비번역 영역(UTR)은 전사되지만 번역되지는 않는다. 일반적으로, 5' UTR은 전사 개시 부위에서 시작하여 개시 코돈으로 계속되지만 개시 코돈은 포함하지 않으며; 3' UTR은 정지 코돈 다음에 시작하여 전사 종결 신호까지 계속된다. 메신저 RNA(mRNA)는 리보솜을 동원하고, 번역을 개시하여, 이에 의해 단백질 발현을 증가시키는 것으로 나타난 UTR을 포함한다. 전술한 설명에 따르면, 개시 코돈 및 정지 코돈은 일반적으로 UTR의 일부로 간주되지 않지만, 본 개시내용에서, 이러한 세그먼트는 때때로 작동 세그먼트를 생성하기 위해 UTR로 지정된 서열 내에 포함된다.
핵산 분자의 안정성 및 결과적인 번역/단백질 발현과 관련하여 UTR이 수행하는 조절 역할에 대한 증거가 증가하고 있다. UTR 내의 서열은 원핵생물 및 진핵생물에서 상이하다. 예를 들어, Shine-Dalgarno 공통 서열(5'-AGGAGGU-3')은 박테리아에서 리보솜을 동원하는 반면, RNA Kozak 공통 서열(5'-GCCRCCRUGG-3')은 개시 코돈(AUG)을 포함하고 포유동물 세포에서 번역 개시 이벤트를 신장시킨다.
Kozak 공통 서열에서 'R'은 아데노신 또는 구아노신을 나타낸다. Kozak 공통 서열의 -3 위치는 번역 개시를 향상시키고, 전체적으로 Kozak 서열은 개시 코돈의 적절한 인식을 위해 번역 개시 복합체를 정지시키는 것으로 여겨진다. Kozak 공통 서열은 그 자체로 리보솜 스캐닝 및 번역 개시를 유도할 수 있지만, 인간 전사체에서 매우 풍부한 단백질과 관련된 추가 UTR이 분석되었다. 연구는 염색체 및 리보솜 관련 단백질을 포함하는 유전 정보 처리와 관련된 단백질의 상대적 존재비를 시사한다(Beck et al., The quantitative proteome of a human cell line. Mol. Syst. Biol. (2011), doi:10.1038/msb.2011.82; Liebermeister et al., Visual account of protein investment in cellular functions. Proc. Natl. Acad. Sci. U.S.A. (2014), doi:10.1073/pnas.1314810111). 예를 들어, 고-발현된 리보솜-관련 단백질(RPL/RPS)의 5' UTR의 정렬은 5' 말단 올리고피리미딘 트랙(즉, 5'TOP) 또는 C/U의 출현을 예시한다(Lavallee-Adam et al., Functional 5' UTR motif discovery with LESMoN: Local enrichment of sequence motifs in biological networks. Nucleic Acids Res. (2017), doi:10.1093/nar/gkx751; Yoshihama et al., The human ribosomal protein genes: Sequencing and comparative analysis of 73 genes. Genome Res. (2002), doi:10.1101/gr.214202; Cardinali et al., La protein is associated with terminal oligopyrimidine mRNAs in actively translating polysomes. J. Biol. Chem. (2003), doi:10.1074/jbc.M300722200; Pichon et al., RNA Binding Protein/RNA Element Interactions and the Control of Translation. Curr. Protein Pept. Sci. (2012), doi:10.2174/13892031280161947). 일반적으로, 5'TOP 서열은 개시 코돈 근처에 위치하고, 전사체의 전사(즉, RNA 합성) 및 번역에 중요하다.
특정 표적 기관의 풍부하게 발현된 유전자에서 통상적으로 발견되는 특징을 조작함으로써, 코딩 서열의 단백질 발현을 증가시킬 수 있다. 예를 들어, 알부민, 혈청 아밀로이드 A, 아포지단백질 A/B/E, 트랜스페린, 알파 태아단백질, 에리트로포이에틴, 또는 인자 VIII와 같은 간-발현된 mRNA의 5' UTR의 도입은 간 세포주 또는 간에서 코딩 서열의 발현을 향상시키기 위해 사용될 수 있다. 마찬가지로, 그러한 조직에서 발현을 개선시키기 위해 다른 조직-특이적 mRNA로부터의 5' UTR의 사용은 근육(MyoD, 미오신, 미오글로빈, 미오게닌, 헤르쿨린), 내피 세포(Tie-1, CD36), 골수 세포(C/EBP, AML1, G-CSF, GM-CSF, CD11b, MSR, Fr-1, i-NOS), 백혈구(CD45, CD18), 지방 조직(CD36, GLUT4, ACRP30, 아디포넥틴) 및 폐 상피 세포(SP-A/B/C/D)에 대해 가능하다.
그러나, UTR은 100 내지 1000개의 뉴클레오타이드(nt) 길이를 가질 수 있다. 치료제 및 백신에서 mRNA의 사용에 비추어, 최소/최적 UTR에 대한 조사는 세포에서 증가되고 표적화된 단백질 발현에 유리하다. 특정 예에서, 본 명세서에 개시된 조작된 발현 작제물(EEC)은 최소 UTR(minUT)을 갖도록 설계되었다. 즉, EEC는 가능한 한 최소이고 의도된 용도에서 여전히 높은 수준의 발현을 가능하게 하는 5' 및/또는 3' UTR을 갖도록 설계되었다.
따라서, 특정 양태에 따르면, 본 개시내용은 단백질 발현을 극적으로 증가시키는 최소 UTR을 제공한다. 특정 예에서, 본 개시내용은 20 내지 23개의 뉴클레오타이드를 갖는 5' UTR을 제공한다. 특정 예에서, 본 개시내용은 선택적 폴리A 꼬리가 포함되는지 여부에 따라 27개의 뉴클레오타이드 또는 67개의 뉴클레오타이드를 갖는 3' UTR을 제공한다. 이후, 함께, 5' 및 3' UTR 조합의 특정 예는 47 내지 50개의 뉴클레오타이드 또는 87 내지 90개의 뉴클레오타이드를 포함한다. 이러한 크기 프로파일은 특히 치료제 및/또는 백신 적용에서 유리하다.
특정 양태에 따르면, minUT를 작제하기 위해, 본 개시내용은 시험관내에서 mRNA의 생산 및 생체내에서 단백질의 생산에 필요한 요소를 통합한다. 시험관내 mRNA의 생산을 위해, 본 개시내용은 T7 박테리오파지(T7P)로부터의 RNA 폴리머라제의 사용을 사용하였다. T7P는 특정 DNA 이중-나선 서열(5'-TAATACGACTCACTATAG-3'(서열번호 45))에 결합하고, 제1 리보뉴클레오타이드로서 구아노신(프로모터에서 마지막 G; 밑줄로 표시됨)의 혼입으로 RNA 합성을 개시한다. 이러한 결합 서열은 일반적으로 전사 복합체를 안정화시키고, T7P 제거 및 RNA 폴리머의 연장을 촉진하는 역할을 하는 펜타머(5'-GGAGA-3')가 뒤따른다.
특정 실시형태에서, 5' UTR은 프로모터, 미니-인핸서 서열(CAUACUCA, 본 명세서), 및 Kozak 서열, 예컨대, 절단된 형태의 Kozak 서열(GCCRCC)을 포함한다. 특정 실시형태에서, 5' UTR은 또한 작동 세그먼트를 생성하기 위해 개시 코돈에 작동 가능하게 연결되는 것으로 기술된다.
특정 실시형태에서, 최소 프로모터는 5' UTR 내에서 사용하기 위해 선택된다. 최소 프로모터는 그 자체로 유전자 발현을 유도하는 활성을 갖지 않지만, 근위 인핸서 요소에 연결될 때 유전자 발현을 유도하도록 활성화될 수 있다. 예시적인 최소 프로모터는 minBglobin, minCMV, SacI 제한 부위가 제거된 minCMV, minRho, SacI 제한 부위가 제거된 minRho, 및 Hsp68 최소 프로모터(proHSP68)를 포함한다. 특정 실시형태에서, 최소 프로모터는 최소 T7 프로모터(미니-T7 프로모터)를 포함한다.
개시된 5' UTR의 특정 예는 독특한 미니-인핸서 서열(CAUACUCA)을 포함한다. 미니-인핸서 서열은 최소 프로모터(예를 들어, T7)와 Kozak 공통 서열 사이에 위치하여 (개시 코돈이 UTR의 일부로 지정되는지 여부에 따라) 20 내지 23개의 뉴클레오타이드를 갖는 최소 5' UTR을 생성할 수 있다. 진핵생물 번역은 일반적으로 AUG 코돈으로 시작하지만, 다른 개시 코돈이 포함될 수 있다. 포유동물 세포는 또한 CUG 코돈을 디코딩하는 류실-tRNA의 도움으로 아미노산 류신으로 번역을 시작할 수 있으며, 미토콘드리아 게놈은 인간에서 AUA 및 AUU를 사용한다. 이러한 성분 및 예시적인 5' UTR은 표 1에 제공된다.
특정 예에서, 5' UTR은 캡핑된다. 예를 들어, 진핵생물 mRNA는 5' 트리포스페이트에 역전된 7-메틸구아노신의 첨가에 의해 구아닐릴화된다(즉, m7GpppN, 여기서 N은 mRNA의 제1 염기를 나타냄). mRNA의 m7GpppN 또는 5' 캡 구조는 핵 이출에 관여하고, mRNA 번역 능력을 담당하는 mRNA 캡 결합 단백질(CBP)에 결합한다.
mRNA의 제1 뉴클레오타이드 및 제2 뉴클레오타이드의 리보스 당은 또한 선택적으로 2'-산소(즉, 2'O) 위치에서 메틸화될 수 있다(즉, CH3 기의 첨가). 제1 뉴클레오타이드 및 제2 뉴클레오타이드에서의 비-메틸화된 mRNA는 Cap0(즉, m7GpppN)으로 표시되는 반면, 제1 뉴클레오타이드 및 제2 뉴클레오타이드 상의 2'O에서의 메틸화는 각각 Cap1(즉, m7GpppNm) 및 Cap2(즉, m7GpppNmNm)로 표시된다. 또한, 제1 5' 뉴클레오타이드가 아데노신인 경우, 이는 6번째 질소(6N) 위치에서 추가로 메틸화되거나(즉, m7Gpppm6A) 변형된 Cap0(즉, m7Gpppm6A) 또는 변형된 Cap1(즉, m7Gpppm6Am) 또는 변형된 Cap2(즉, m7Gpppm6AmNm)를 형성할 수 있다.
RNA 구아닐화 또는 Cap0(즉, m7GpppN)의 첨가는 백시니아 바이러스 캡핑 효소(VCE)에 의해 시험관내(즉, RNA 합성 후) 효소적으로 달성될 수 있다. Cap1 및 Cap2 구조의 생성은 mRNA 2'-O-메틸트랜스퍼라제 및 S-아데노실 메티오닌(즉, SAM)의 첨가를 통해 효소적으로 추가로 달성될 수 있다. 대안적으로, Cap 구조는 항-역전 캡 유사체(즉, ARCA)의 혼입에 의해 시험관내 공동-전사적으로 첨가될 수 있다. ARCA는 캡의 3'-산소(3'O)에서 메틸화되어(m73'OmGpppN) 캡 구조가 정확한 배향으로 혼입되도록 한다. 본 출원에서, 상기 캡 구조들 중 임의의 캡 구조는 최종 EEC mRNA 생성물에 사용될 수 있다.
특정 실시형태에서, 5' UTR은 코딩 서열에 작동 가능하게 연결된다. 본 명세서에서 사용되는 용어 "작동 가능하게 연결된"은 뉴클레오타이드 발현 제어 서열(예를 들어, 프로모터 서열 또는 UTR)과 또 다른 뉴클레오타이드 서열 사이의 기능적 연결을 지칭하며, 이에 의해 제어 서열은 다른 뉴클레오타이드 서열의 전사 및/또는 번역을 가능하게 하고, 이를 야기시킨다.
본 개시내용은 또한 개시된 5' UTR과 함께 선택적인 사용을 위한 3' UTR을 제공한다. 본 명세서에 제시된 바와 같이, 개시된 5' UTR과 개시된 3' UTR의 조합은 단지 개시된 5' UTR 또는 단지 개시된 3' UTR의 사용에 비해 크게 향상된 단백질 발현을 갖는 EEC를 초래한다.
3' UTR은 이들에 임베딩된 아데노신 및 우리딘의 스트레치를 갖는 것으로 공지되어 있다. 이러한 AU 풍부 특징은 회전율이 높은 유전자에서 특히 일반적이다. 이들의 서열 특징 및 기능적 특성에 기초하여, AU 풍부 요소(ARE)는 3개의 부류로 분리될 수 있다: 클래스 I ARE는 U-풍부 영역 내에 AUUUA 모티프의 여러 분산된 사본을 함유한다. C-Myc 및 MyoD는 클래스 I ARE를 함유한다. 클래스 II ARE는 2개 이상의 중첩되는 UUAUUUA(U/A)(U/A) 노나머를 갖는다.
전술한 바와 같이, 개시된 3' UTR은 스페이서, 스템 루프 구조, 및 선택적으로 폴리아데닌 꼬리(폴리A 꼬리)를 포함한다. 본 명세서의 특정 예에서, 3' UTR은 또한 정지 코돈에 작동 가능하게 연결된 것으로 도시되어 있다.
예시적인 정지 코돈은 UAA, UGA 및 UAG를 포함한다.
예시적인 스페이서는 [N1-3]AUA 및 [N1-3]AAA(예를 들어, UGCAUA, UGCAAA, UGAAA, GCAUA, UAAA 및 GAUA)를 포함하며, 여기서 N은 A, G, C, T 또는 U를 포함하는 임의의 뉴클레오타이드이다. 아래 첨자 숫자는 뉴클레오타이드의 양을 나타낸다. 예를 들어, [N1-3]은 N, NN 또는 NNN에 기재된 바와 같은 1, 2 또는 3개의 뉴클레오타이드를 포함한다.
스템 루프(SL), 또는 헤어핀 또는 헤어핀 루프는 3' UTR 내에서 고도로 발현된 전사체의 특징이다. SL은 상보적인 뉴클레오타이드가 루프를 형성하는 서열로 종종 중단되는 이중 나선(또는 스템)으로서 쌍을 이루는 별개의 2차 구조이다. SL로 표시되는 특정 2차 구조는 스템 및 헤어핀 루프라고도 하는 (말단) 루프를 포함하는 연속적인 핵산 서열을 포함하며, 여기서 스템은 2개의 이웃하는 완전히 또는 부분적으로 상보적인 서열 요소에 의해 형성되고; 이는 SL 구조의 루프를 형성하는 짧은 서열(예를 들어, 3 내지 10개의 뉴클레오타이드)에 의해 분리된다. 2개의 이웃하는 완전히 또는 부분적으로 상보적인 서열은 예를 들어, SL 요소 스템 1 및 스템 2로서 정의될 수 있다. SL은 이러한 2개의 이웃한 완전히 또는 부분적으로 역상보적인 서열, 예를 들어, SL 요소 스템 1 및 스템 2가 서로 염기쌍을 형성하여, SL 요소 스템 1과 스템 2 사이에 위치한 짧은 서열에 의해 형성된 이의 말단 단부에 쌍을 이루지 않는 루프를 포함하는 이중 가닥 핵산 서열을 야기시킨다. 따라서, SL은 2개의 스템(스템 1 및 스템 2)을 포함하며, 이는 - 핵산 분자의 2차 구조 수준에서 - 서로 염기쌍을 형성하며, 이는 - 핵산 분자의 1차 구조의 수준에서 - 스템 1 또는 스템 2의 일부가 아닌 짧은 서열에 의해 분리된다. 예시를 위해, SL의 2차원 표현은 롤리팝-형상 구조와 유사하다. 스템-루프 구조의 형성은 쌍을 이루는 이중 가닥을 형성하기 위해 스스로 접힐 수 있는 서열의 존재를 필요로 하며; 쌍을 이루는 이중 가닥은 스템 1 및 스템 2에 의해 형성된다. 쌍을 이룬 SL 요소의 안정성은 통상적으로 줄기 2의 뉴클레오타이드(미스매치 또는 벌지(bulge))와 염기쌍을 형성하지 못할 수 있는 스템 1의 뉴클레오타이드의 수에 대한 스템 2의 뉴클레오타이드를 갖는 염기쌍(바람직하게는 표준 염기쌍, 더욱 바람직하게는 Watson-Crick 염기쌍)을 형성할 수 있는 스템 1의 뉴클레오타이드의 수의 길이에 의해 결정된다. 본 발명에 따르면, 최적의 루프 길이는 3 내지 10개의 뉴클레오타이드, 더욱 바람직하게는 4 내지 7개의 뉴클레오타이드, 예컨대, 4개의 뉴클레오타이드, 5개의 뉴클레오타이드, 6개의 뉴클레오타이드 또는 7개의 뉴클레오타이드이다. 제공된 핵산 서열이 SL을 특징으로 하는 경우, 개개의 상보적 핵산 서열은 통상적으로 또한 SL을 특징으로 한다. SL은 통상적으로 단일-가닥 RNA 분자에 의해 형성된다. 특정 실시형태에서, SL 길이는 7개 이상의 뉴클레오타이드, 적어도 8개의 뉴클레오타이드, 적어도 9개의 뉴클레오타이드, 적어도 10개의 뉴클레오타이드, 적어도 11개의 뉴클레오타이드, 적어도 12개의 뉴클레오타이드, 적어도 13개의 뉴클레오타이드, 적어도 14개의 뉴클레오타이드, 적어도 15개 뉴클레오타이드, 적어도 16개 뉴클레오타이드, 적어도 17개 뉴클레오타이드, 적어도 18개 뉴클레오타이드, 적어도 19개 뉴클레오타이드 또는 적어도 20개 뉴클레오타이드 길이이다.
SL은 폴리아데닌 꼬리에 관계없이 번역을 신장시키는 고도로 발현된 전사체(예를 들어, 히스톤과 같은 풍부한 세포 단백질을 코딩하는 전사체)의 3' UTR 내에 존재한다(Gallie et al., The histone 3'-terminal stem-loop is necessary for translation in Chinese hamster ovary cells. Nucleic Acids Res. (1996), doi:10.1093/nar/24.10.1954). 히스톤 3' UTR 스템 공통 서열은 6개의 염기쌍을 특징으로 하며, 이 중 2개는 G-C 쌍이며, 3개는 피리미딘-퓨린(Y-R) 쌍이며, 1개는 A-U 쌍이며, 또한, 루프는 2개의 우리딘(U), 1개의 퓨린(Y) 및 1개의 리보뉴클레오타이드(N)를 갖는 4개의 리보뉴클레오타이드를 포함한다(Gallie et al., The histone 3'-terminal stem-loop is necessary for translation in Chinese hamster ovary cells. (Nucleic Acids Res. (1996), doi:10.1093/nar/24.10.1954; Tan et al., Structure of histone mRNA stem-loop, human stem-loop binding protein, and 3'hExo ternary complex. Science (80). (2013), doi:10.1126/science.1228705; Battle & Doudna, The stem-loop binding protein forms a highly stable and specific complex with the 3' stem-loop of histone mRNAs. RNA (2001), doi:10.1017/S1355838201001820).
SL은 복제-의존성 mRNA 안정성/프로세싱/대사/번역을 위해 스템-루프 결합 단백질(SLBP)과 회합한다. 구조적 증거는 SLBP와 SL의 직접적인 접촉이 SL(G7)의 염기에서의 구아노신 뉴클레오타이드에서 발생함을 시사한다(Tan et al., Structure of histone mRNA stem-loop, human stem-loop binding protein, and 3'hExo ternary complex. Science (80). (2013), doi:10.1126/science.1228705; Battle & Doudna, The stem-loop binding protein forms a highly stable and specific complex with the 3' stem-loop of histone mRNAs. RNA (2001), doi:10.1017/S1355838201001820). 또한, 스템에 대한 인접한 아데노신, 또는 보다 구체적으로, 상류 AAA는 SLBP 결합 및 기능에 영향을 미친다(Battle & Doudna, The stem-loop binding protein forms a highly stable and specific complex with the 3' stem-loop of histone mRNAs. RNA (2001), doi:10.1017/S1355838201001820; William & Marzluff, The sequence of the stem and flanking sequences at the 3' end of histone mRNA are critical determinants for the binding of the stem-loop binding protein. Nucleic Acids Res. (1995), doi:10.1093/nar/23.4.654). 3' UTR은 또한 번역 능력을 증가시키면서 단백질-코딩 전사체를 안정화시키는 역할을 한다. 특정 실시형태에 따르면, 본 개시내용은 SLBP 결합 및 mRNA 번역을 증가시키기 위한 아데노신과 같은 인접한 스페이서 서열을 갖는 서열(UAACGGUCUU(서열번호 34))에 의해 중단된 G-C 쌍의 3개 그룹인 SL의 특징을 혼입시키기 위한 합성 SL에 대한 설계를 제공한다.
중요하게는, EEC에서 사용되는 스템 루프는 서열-배향 의존적이지 않고, a) CCUC 및 GAGG, b) GAGG 및 CCUC, c) AAACCUC 및 GAGG, 및 d) AAAGAGG 및 CCUC를 포함할 수 있다. 또한, 스템의 2개의 아암(여기서, CCUC 및 GAGG 염기쌍) 사이의 거리는 루프가 형성되기에 충분히 길어야 한다. 특정 실시형태에서, 스템 루프는 상보적 서열, 예컨대, a) RRRR 및 YYYY, b) RYRR 및 YRYY, c) RRYR 및 YYRY, d) RRRY 및 YYYR, e) RYYR 및 YRRY, f) RRYY 및 YYRR, g) YYRR 및 RRYY, h) YYYR 및 RRRY, 또는 i) RYYY 및 YRRR을 포함하며, 여기서, R은 퓨린(A 또는 G)이며, Y는 피리미딘(예를 들어, U 또는 C)이다.
특정 실시형태에 따르면, 2개의 아암 사이의 뉴클레오타이드의 수는 7개, 8개, 9개, 10개, 또는 더 긴 뉴클레오타이드일 수 있다. 스템 루프의 2개의 아암 사이의 길이의 바람직한 실시형태는 7개 이상의 뉴클레오타이드이다. 특정 예에서, SL의 루프 세그먼트는 UAACGGUCUU(서열번호 34)를 포함한다. 특정 실시형태에서, SL 서열은 GAUGCCCCAUUCACGAGUAGUGGGUAUU(서열번호 64), GGCACCCUGCGCAGGUGAUGCAGGUGCC(서열번호 65), GUUCGCUCGGUCAGGAGAGCUGACGGAC(서열번호 66), UCUUACAGUGGCAUGUGACCGUUUAAGG(서열번호 67), CGCGGCGCAUGCACGUGACAUGCCUGCG(서열번호 68), CGGUCCCGUGGCAAGAGUCUAUGGAUUG(서열번호 69), AUGUUCGGCUCCAAGAGCGAGUUGAUAU(서열번호 70), CGAUUCGGGCACAUGUGCUGUCUGAUUG(서열번호 71), GUAUUCUGAUGCACGUGCCAUCAAGUAC(서열번호 72), 또는 UUGAGCAGGAUCAAGUGCAUUCUUUCAA(서열번호 73)를 포함한다. 특정 실시형태에서, SL 서열은 RRYRYYYYRYYYRYRRRYRRYRRRYRYY(서열번호 74), RRYRYYYYRYRYRRRYRRYRYRRRYRYY(서열번호 75), RYYYRYYYRRYYRRRRRRRYYRRYRRRY(서열번호 76), YYYYRYRRYRRYRYRYRRYYRYYYRRRR(서열번호 77), YRYRRYRYRYRYRYRYRRYRYRYYYRYR(서열번호 78), YRRYYYYRYRRYRRRRRYYYRYRRRYYR(서열번호 79), RYRYYYRRYYYYRRRRRYRRRYYRRYRY(서열번호 80), YRRYYYRRRYRYRYRYRYYRYYYRRYYR(서열번호 81), RYRYYYYRRYRYRYRYRYYRYYRRRYRY(서열번호 82), 또는 YYRRRYRRRRYYRRRYRYRYYYYYYYRR(서열번호 83)을 포함하며, 여기서, R은 퓨린(A 또는 G)이며, Y는 피리미딘(예를 들어, U 또는 C)이다. 추가적인 예시적인 SL 모티프에 대해서는 문헌[Gorodkin et al., (Nucleic Acids Research 29(10):2135-2144, 2001)]을 참조한다.
선택적 폴리-A 꼬리. 천연 RNA 프로세싱 동안, 안정성을 증가시키기 위해 긴 사슬의 아데닌 뉴클레오타이드(폴리-A 꼬리)가 mRNA 분자와 같은 폴리뉴클레오타이드에 첨가될 수 있다. 전사 직후, 전사체의 3' 말단은 절단되어 3' 하이드록실을 유리시킬 수 있다. 이후, 폴리-A 폴리머라제는 RNA에 아데닌 뉴클레오타이드의 사슬을 첨가한다. 폴리아데닐화로 불리는 이러한 공정은 예를 들어, 100 내지 250개 잔기 길이일 수 있는 폴리-A 꼬리를 첨가한다. 시험관내 RNA 합성에서, 폴리A 꼬리는 DNA 주형 상에 인코딩될 수 있고, 그 자체로 시험관내 전사 과정 동안 혼입된다.
특정 예에서, 폴리A 꼬리는 길이가 0 내지 500개의 뉴클레오타이드 범위이다(예를 들어, 0, 10, 20, 30, 40, 50, 60, 70, 80, 90, 120, 140, 160, 180, 200, 250, 300, 350, 400, 450 또는 500개의 뉴클레오타이드). 특정 예는 40개 뉴클레오타이드 폴리A 꼬리를 이용한다. 길이는 또한 단위로 또는 폴리A 결합 단백질 결합의 함수로서 결정될 수 있다. 이러한 실시형태에서, 폴리A 꼬리는 4개의 폴리A 결합 단백질의 모노머, 3개의 폴리A 결합 단백질의 모노머, 2개의 폴리A 결합 단백질의 모노머, 또는 1개의 폴리A 결합 단백질의 모노머에 결합하기에 충분히 길다. 폴리A 결합 단백질 모노머는 38개의 뉴클레오타이드의 스트레치에 결합한다.
3' UTR의 상기 논의에 기초하여, 본 명세서에 개시된 3' UTR 작제물은 스페이서(예를 들어, [N1-3]AUA, [N1-3]AAA, UGCAUA 또는 UGCAAA), 스템 루프 하이브리드화 서열(예를 들어, CCUC, GAGG); 스템 루프 루프 세그먼트(예를 들어, [N7-15], UAACGGUCUU(서열번호 34)), 및/또는 선택적으로, 폴리A 꼬리 중 하나 이상을 포함한다. 정지 코돈이 3' UTR의 일부로 지정되는 경우, 예시적인 정지 코돈은 UAA, UGA 및 UAG를 포함한다. 이러한 성분에 기반한 예시적인 3' UTR 작제물은 표 2에 제시되어 있다.
특정 실시형태에서, 다른 비-UTR 서열은 5'(또는 3' UTR) UTR에 혼입될 수 있다. 예를 들어, 인트론 또는 인트론 서열의 일부는 이러한 영역에 혼입될 수 있다. 인트론 서열의 혼입은 단백질 발현뿐만 아니라 mRNA 수준을 추가로 증가시킬 수 있다.
개시된 5' 및 3' UTR을 이용한 EEC 아키텍처. 5' UTR 및 3' UTR에 대한 개시된 조작된 서열은 EEC를 생성하는 데 사용될 수 있으며, 이는 주어진 코딩 서열의 측면에서 사용될 때 다양한 단백질의 단백질 발현을 증가시키는 데 유용한 것으로 본 명세서에 제시되어 있다. 이러한 다양한 단백질은 본 명세서에 개시된 바와 같은 녹색 형광 단백질(GFP), 인터루킨-2(IL-2), 및 POU5F1(OCT3/4)을 포함한다. 또한, 이러한 본 발명의 5' UTR 및 3' UTR 서열은 트랜스펙션 방식과 상관없이 림프구 및 부착성 및 현탁 배아 신장 세포를 포함하는 상이한 세포 타입에서 유사하게 작용하는 것으로 나타났다.
도 1은 본 개시내용의 대표적인 EEC를 도시한다. 특정 예에서, "EEC"는 하나 이상의 단백질을 인코딩하고 그 안에서 인코딩된 단백질을 번역하기 위해 충분한 구조적 및/또는 화학적 특징을 보유하는 코딩 서열의 측면에 있는 본 명세서에 개시된 5' 및/또는 3' UTR을 갖는 폴리뉴클레오타이드 전사체를 지칭한다.
도 1로 돌아가서, 도시된 EEC는 제1 측면 영역 및 제2 측면 영역의 측면에 있는 오픈 리딩 프레임 내에 연결된 뉴클레오타이드의 코딩 서열을 포함한다. 이러한 코딩 서열은 단백질을 인코딩하는 RNA 서열을 포함한다. 단백질은 이의 5' 말단에, 신호 서열 영역에 의해 인코딩된 하나 이상의 신호 서열을 포함할 수 있다. 제1 측면 영역은 하나 이상의 완전하거나 불완전한 5' UTR 서열을 포함하는 연결된 뉴클레오타이드의 영역을 포함할 수 있다. 제1 측면 영역은 또한 5' 말단 캡을 포함할 수 있다. 코딩 서열의 5' 말단과 제1 측면 영역을 브리징하는 것은 제1 작동 세그먼트이다. 전통적으로, 이러한 작동 세그먼트는 개시 코돈을 포함한다. 작동 세그먼트는 대안적으로 개시 코돈을 포함하는 임의의 번역 개시 서열 또는 신호를 포함할 수 있다.
제1 측면 영역은 5' UTR 내에 위치하는 모듈을 포함할 수 있다. 이러한 제1 측면 영역은 3개의 모듈로 분할될 수 있다: 최소 프로모터(예를 들어, T7 프로모터 헥사머)를 나타내는 모듈 1("M1"); 독특한 번역 인핸서(CAUACUCA, 본 명세서에 기재됨)인 모듈 2("M2"); 및 Kozak 공통 서열인 모듈 3("M3"). T7 프로모터 헥사머는 T7 폴리머라제 프로모터의 일부이며, 이는 또한 T7 클래스 III 프로모터의 일부이며, 이는 T7 박테리오파지의 특정 프로모터의 전사를 유도하는 것과 연과되고 이러한 유도를 담당하는 당 분야에 널리 공지된 특정 부류의 프로모터이다. 보다 구체적으로, T7 프로모터 및 헥사머는 전체 서열(5'-TAATACGACTCACTATAGGGAGA-3'(서열번호 31))을 갖고, 제1 리보뉴클레오타이드로서 구아노신의 혼입으로 RNA 합성을 개시한다. Kozak 공통은 Kozak 공통 서열(5'-GCCRCCATGG-3'(서열번호 30))을 지칭하며, 여기서 'R'은 아데노신 또는 구아노신을 나타낸다.
제2 측면 영역은 하나 이상의 완전하거나 불완전한 3' UTR을 포함하는 연결된 뉴클레오타이드의 영역을 포함할 수 있다. 측면 영역은 또한 3' 테일링 서열(예를 들어, 폴리A 꼬리)을 포함할 수 있다. 3' UTR은 또한 정지 코돈, 스페이서, 및 스템-루프 세그먼트를 포함하는 3개의 세그먼트로 분할될 수 있다.
코딩 서열의 3' 말단과 제2 측면 영역을 브리징하는 것은 제2 작동 세그먼트이다. 전통적으로, 이러한 작동 세그먼트는 정지 코돈을 포함한다. 작동 세그먼트는 대안적으로 정지 코돈을 포함하는 임의의 번역 개시 서열 또는 신호를 포함할 수 있다. 본 개시에 따르면, 다수의 연속 정지 코돈이 또한 사용될 수 있다.
일반적으로, EEC의 코딩 서열의 최단 길이는 디펩타이드, 트리펩타이드, 테트라펩타이드, 펜타펩타이드, 헥사펩타이드, 헵타펩타이드, 옥타펩타이드, 노나펩타이드, 또는 데카펩타이드를 인코딩하기에 충분한 핵산 서열의 길이일 수 있다. 또 다른 실시형태에서, 길이는 2 내지 30개 아미노산, 예를 들어, 5 내지 30개, 10 내지 30개, 2 내지 25개, 5 내지 25개, 10 내지 25개, 또는 10 내지 20개 아미노산의 펩타이드를 인코딩하기에 충분할 수 있다. 길이는 적어도 11, 12, 13, 14, 15, 17, 20, 25 또는 30개 아미노산의 펩타이드, 또는 40개 이하, 예를 들어, 35, 30, 25, 20, 17, 15, 14, 13, 12, 11 또는 10개 이하의 아미노산의 펩타이드를 인코딩하기에 충분할 수 있다. 폴리뉴클레오타이드 서열이 인코딩할 수 있는 디펩타이드의 예는 카르노신 및 안세린을 포함한다.
일반적으로, 코딩 서열의 길이는 30개 초과의 뉴클레오타이드 길이(예를 들어, 적어도 35, 40, 45, 50, 55, 60, 70, 80, 90, 100, 120, 140, 160, 180, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 1,000, 1,100, 1,200, 1,300, 1,400, 1,500, 1,600, 1,700, 1,800, 1,900, 2,000, 2,500, 및 3,000, 4,000, 5,000, 6,000, 7,000, 8,000, 9,000, 10,000, 20,000, 30,000, 40,000, 50,000, 60,000, 70,000, 80,000, 90,000개 이상 또는 최대 100,000개 이상의 뉴클레오타이드)이다.
일부 실시형태에서, EEC는 30 내지 100,000개의 뉴클레오타이드(예를 들어, 30 내지 50, 30 내지 100, 30 내지 250, 30 내지 500, 30 내지 1,000, 30 내지 1,500, 30 내지 3,000, 30 내지 5,000, 30 내지 7,000, 30 내지 10,000, 30 내지 25,000, 30 내지 50,000, 30 내지 70,000, 100 내지 250, 100 내지 500, 100 내지 1,000, 100 내지 1,500, 100 내지 3,000, 100 내지 5,000, 100 내지 7,000, 100 내지 10,000, 100 내지 25,000, 100 내지 50,000, 100 내지 70,000, 100 내지 100,000, 500 내지 1,000, 500 내지 1,500, 500 내지 2,000, 500 내지 3,000, 500 내지 5,000, 500 내지 7,000, 500 내지 10,000, 500 내지 25,000, 500 내지 50,000, 500 내지 70,000, 500 내지 100,000, 1,000 내지 1,500, 1,000 내지 2,000, 1,000 내지 3,000, 1,000 내지 5,000, 1,000 내지 7,000, 1,000 내지 10,000, 1,000 내지 25,000, 1,000 내지 50,000, 1,000 내지 70,000, 1,000 내지 100,000, 1,500 내지 3,000, 1,500 내지 5,000, 1,500 내지 7,000, 1,500 내지 10,000, 1,500 내지 25,000, 1,500 내지 50,000, 1,500 내지 70,000, 1,500 내지 100,000, 2,000 내지 3,000, 2,000 내지 5,000, 2,000 내지 7,000, 2,000 내지 10,000, 2,000 내지 25,000, 2,000 내지 50,000, 2,000 내지 70,000, 및 2,000 내지 100,000)를 포함한다.
본 개시내용에 따르면, 제1 측면 영역 및 제2 측면 영역은 독립적으로 5 내지 100개의 뉴클레오타이드 길이(예를 들어, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100개의 뉴클레오타이드)의 범위일 수 있다.
본 개시에 따르면, 캡핑 영역은 단일 캡 또는 캡을 형성하는 일련의 뉴클레오타이드를 포함할 수 있다. 이러한 실시형태에서, 캡핑 영역은 길이가 1 내지 10, 예를 들어, 2 내지 9, 3 내지 8, 4 내지 7, 1 내지 5, 5 내지 10, 또는 적어도 2, 또는 10개 이하의 뉴클레오타이드일 수 있다. 일부 실시형태에서, 캡은 존재하지 않는다.
본 개시내용에 따르면, 제1 작동 세그먼트 및 제2 작동 세그먼트는 3 내지 40, 예를 들어, 5 내지 30, 10 내지 20, 15, 또는 적어도 4, 또는 30개 이하의 뉴클레오타이드 길이의 범위일 수 있고, 개시 및/또는 정지 코돈에 추가하여, 하나 이상의 신호 및/또는 제한 서열을 포함할 수 있다.
전이된 IVT-RNA의 더 높고 연장된 발현을 달성하기 위해 다양한 변형에 의해 IVT-RNA를 안정화시키는 것이 이전에 시도되었다. 그러나, 세포에서 펩타이드 및 단백질을 발현시키기 위한 RNA 트랜스펙션-기반 전략의 성공에도 불구하고, RNA 안정성, 인코딩된 펩타이드 또는 단백질의 지속적인 발현 및 RNA의 세포독성과 관련된 문제가 남아 있다. 예를 들어, 외인성 단일-가닥 RNA는 포유동물 세포에서 방어 메커니즘을 활성화시키는 것으로 알려져 있다.
여러 그룹은 활성화된 방어 메커니즘으로 인해, 세포 내로 트랜스펙션된 IVT-RNA로부터 충분히 높은 수준의 단백질 발현을 달성하기 위해, mRNA 전사체가 변형된 뉴클레오타이드(예를 들어, University of Pennsylvania에 양도된 2012년 8월 4일자로 출원된 미국 특허 제9,750,824호 참조) 또는 면역 회피 인자를 포함하는 단백질 또는 IVT-RNA 형태의 추가 시약(예를 들어, BioNTech에 양도된 2015년 5월 7일자로 출원된 미국 특허 제10,207,009호 참조)을 함유해야 한다고 제안하였다. 이러한 면역 회피 인자는 예를 들어, 세포외 IFN(예를 들어, 백시니아 바이러스로부터의 B18R)에 의한 IFN 수용체의 관여를 방지하거나, 세포내 IFN 신호전달(예를 들어, 백시니아 바이러스로부터의 E3 및 K3 둘 다)을 억제하거나, 또는 둘 다의 용량으로(예를 들어, 인플루엔자로부터의 NS1) 작용함으로써 세포 면역 반응을 약화시키는 단백질을 인코딩하는 바이러스 유전자를 포함한다(Liu et al., Sci Rep 9: 11972, 2019). 특정 실시형태에서, 면역 회피 단백질은 B18R, E3, K3, NS1 또는 ORF8(SARS-CoV2로부터)을 포함한다.
본 개시내용의 양태는 변형된 뉴클레오타이드, 마이크로RNA, 또는 면역 회피 인자를 사용하는 대신에, 2차 및 3차 구조를 mRNA 전사체에 도입함으로써 활성화된 방어 메커니즘을 극복하도록 설계되었다. 추가 실시형태에 따르면, 특정 실시형태는 단백질 발현을 증가시키기 위해 변형된 뉴클레오타이드 또는 마이크로RNA를 사용하지 않는다. 또 다른 실시형태에서, 세포로 트랜스펙션된 IVT-RNA로부터의 번역을 연장하기 위해 또는 임의의 다른 목적을 위해 변형된 뉴클레오타이드 또는 마이크로RNA를 사용하지 않는다.
특정 예에서, EEC는 5' UTR, 3' UTR, 5' UTR 및 3' UTR에서, 또는 EEC 전체에서 마이크로RNA 결합 부위 및/또는 변형된 NTP를 배제한다.
마이크로RNA(또는 miRNA)는 핵산 분자의 3' UTR에 결합하고, 핵산 분자 안정성을 감소시킴으로써 또는 번역을 억제함으로써 유전자 발현을 하향 조절하는 19 내지 25개 뉴클레오타이드 길이의 비코딩 RNA이다. 특정 예에서, EEC는 임의의 공지된 마이크로RNA 표적 서열, 마이크로RNA 서열, 또는 마이크로RNA 시드를 포함하지 않는다.
마이크로RNA 시드는 성숙 마이크로RNA의 위치 2 내지 8의 영역에 있는 서열이며, 이러한 서열은 miRNA 표적 서열에 대해 완전한 Watson-Crick 상보성을 갖는다.
특정 예에서, 본 개시내용의 EEC는 변형된 NTP를 구체적으로 배제하도록 설계된다. 변형된 NTP는 이들의 화학 구조를 변형시키기 위해 이들에 부착된 추가의 화학 기를 갖는 것들이다. 이러한 변형된 NTP의 예는 슈도우리딘, 메틸슈도우리딘, N1-메틸-슈도우리딘, 메틸우리딘(m5U), 5-메톡시우리딘(mo5U) 및 2-티오우리딘(s2U)을 포함한다. 5' 캡은 변형된 NTP가 아니다.
특정 예에서, EEC는 메신저 RNA(mRNA)를 포함한다. 본 명세서에서 사용되는 "메신저 RNA"(mRNA)는 단백질을 인코딩하고 번역되어 시험관내, 생체내, 인시튜 또는 생체외에서 인코딩된 단백질을 생산할 수 있는 임의의 폴리뉴클레오타이드를 지칭한다.
EEC는 단백질 또는 이의 단편을 인코딩한다. "단백질"은 펩타이드 결합에 의해 가장 흔히 함께 연결된 아미노산 잔기(천연 또는 비천연)의 폴리머를 지칭한다. 상기 용어는 임의의 크기, 구조, 또는 기능의 폴리펩타이드 및 펩타이드를 포함한다. 일부 예에서, 인코딩된 단백질은 50개의 아미노산보다 작으며, 단백질은 이후 펩타이드로 지칭된다. 단백질이 펩타이드인 경우, 이는 적어도 2개의 연결된 아미노산을 포함할 것이다. 단백질은 자연 발생 단백질, 합성 단백질, 동족체, 오르토로그, 파라로그, 단편, 재조합 단백질, 융합 단백질 및 이의 다른 등가물, 변이체, 및 유사체를 포함한다. 단백질은 단일 단백질일 수 있거나, 다이머, 트라이머 또는 테트라머와 같은 다분자 복합체일 수 있다. 이들은 또한 항체 또는 인슐린과 같은 단일 사슬 또는 다중 사슬 단백질을 포함할 수 있고, 회합되거나 연결될 수 있다. 가장 일반적으로 디설파이드 연결은 다중 사슬 단백질에서 발견된다. 용어 단백질은 또한 하나 이상의 아미노산 잔기가 상응하는 자연 발생 아미노산의 인공 화학적 유사체인 아미노산 폴리머에 적용될 수 있다.
용어 "단백질 변이체"는 천연 또는 참조 서열과 아미노산 서열이 상이한 단백질을 지칭한다. 아미노산 서열 변이체는 천연 또는 참조 서열과 비교하여 아미노산 서열 내의 특정 위치에서 치환, 결실, 및/또는 삽입을 가질 수 있다. 일반적으로, 변이체는 천연 또는 참조 서열과 적어도 50%의 서열 동일성을 가질 것이며, 바람직하게는 이들은 천연 또는 참조 서열과 적어도 80%, 또는 더욱 바람직하게는 적어도 90%의 동일한 서열 동일성을 가질 것이다.
EEC는 생물학적 제제, 항체, 백신, 치료용 단백질 또는 펩타이드, 세포 침투 펩타이드, 분비된 단백질, 원형질막 단백질, 세포질 또는 세포골격 단백질, 세포내 막 결합 단백질, 핵 단백질, 인간 질환과 관련된 단백질, 표적화 모이어티 또는 치료적 징후가 확인되지 않았지만 그럼에도 불구하고 연구 및 발견의 영역에서 유용성을 갖는 인간 게놈에 의해 인코딩된 그러한 단백질을 포함하는, 수 개의 표적 카테고리 중 임의의 표적 카테고리로부터 선택된 단백질을 인코딩할 수 있다. 특정 단백질은 이러한 카테고리들 중 하나 이상에 속할 수 있다.
일부 실시형태에서, 특정 단백질을 인코딩하는 특정 서열이 사용된다. 이러한 특정 단백질은 녹색 형광 단백질(GFP), 인터루킨-2(IL-2), 및 POU5F1 또는 OCT¾를 포함한다(도 15 참조). GFP는 빛에 노출될 때 밝은 녹색 형광을 나타내는 단백질이다. 인간 POU5F1 또는 OCT3/4(본 명세서에서 hOCT4)는 줄기 세포 재프로그래밍 및 유지에 중요한 핵심 핵 전사 인자이다. IL-2는 면역 시스템에서 사이토카인 신호전달 분자의 한 타입인 인터루킨이다. 이는 백혈구의 활성을 조절하는 15.5 내지 16 kDa 단백질이다. IL-2는 미생물 감염에 대한 신체의 자연 반응의 일부이며, 외래("비-자기")와 "자기"를 구별한다. IL-2는 림프구에 의해 발현되는 IL-2 수용체에 결합함으로써 이의 효과를 매개한다. IL-2의 주요 공급원은 활성화된 CD4+ T 세포 및 활성화된 CD8+ T 세포이다.
본 명세서에 개시된 EEC는 하나 이상의 생물학적 제제를 인코딩할 수 있다. "생물학적 제제"는 질환 또는 의학적 병태를 치료, 치유, 완화, 예방 또는 진단하는 데 사용되는 단백질을 포함한다. 예시적인 생물학적 제제는 특히, 알레르기성 추출물(예를 들어, 알레르기 주사 및 시험용), 혈액 성분, 유전자 요법 생성물, 이식에 사용되는 인간 조직 또는 세포 생성물, 백신, 단클론성 항체, 사이토카인, 성장 인자, 효소, 혈전용해제 및 면역조절제를 포함한다.
항체. 본 명세서에 개시된 EEC는 하나 이상의 항체 또는 이의 단편을 인코딩할 수 있다. 용어 "항체"는 단클론성 항체(면역글로불린 Fc 영역을 갖는 전장 항체 포함), 폴리에피토프 특이성을 갖는 항체 조성물, 다중특이적 항체(예를 들어, 이중특이적 항체, 디아바디, 및 단일-사슬 분자)뿐만 아니라 항체 단편을 포함한다. 용어 "면역글로불린"(Ig)은 본 명세서에서 "항체"와 상호교환적으로 사용된다. 본 명세서에서 사용되는 "단클론성 항체"는 실질적으로 균질한 항체의 집단으로부터 수득된 항체를 지칭하며, 즉, 집단을 포함하는 개별 항체는 가능한 자연 발생 돌연변이 및/또는 소량으로 존재할 수 있는 번역-후 변형(예를 들어, 이성질체화, 아미드화)을 제외하고는 동일하다. 단클론성 항체는 단일 항원 부위에 대해 지시되는 매우 특이적이다.
본 명세서의 단클론성 항체는 구체적으로 요망되는 생물학적 활성을 나타내는 한, 중쇄 및/또는 경쇄의 일부가 특정 종으로부터 유래되거나 특정 항체 부류 또는 서브클래스에 속하는 항체의 상응하는 서열과 동일하거나 상동이고 사슬(들)의 나머지가 다른 종으로부터 유래되거나 또 다른 항체 클래스 또는 서브클래스에 속하는 항체 뿐만 아니라 이러한 항체의 단편의 상응하는 서열과 동일하거나 상동인 "키메라" 항체(면역글로불린)를 포함한다. 본 명세서에서 키메라 항체는 비-인간 영장류(예를 들어, 구대륙 원숭이, 유인원 등)로부터 유래된 가변 도메인 항원-결합 서열 및 인간 불변 영역 서열을 포함하는 "영장류화된" 항체를 포함한다.
"항체 단편"은 무손상 항체의 일부, 바람직하게는 무손상 항체의 항원 결합 및/또는 가변 영역을 포함한다. 항체 단편의 예는 Fab, Fab', F(ab')2 및 Fv 단편; 디아바디; 선형 항체; 나노바디; 단일-사슬 항체 분자 및 항체 단편으로부터 형성된 다중특이적 항체를 포함한다.
면역글로불린의 5가지 클래스, IgA, IgD, IgE, IgG 및 IgM 중 임의의 것은 각각 알파, 델타, 입실론, 감마 및 뮤(mu)로 지정된 중쇄를 포함하는 코딩 서열에 의해 인코딩될 수 있다. 또한 서브클래스, 감마 및 뮤를 인코딩하는 폴리뉴클레오타이드 서열이 포함된다. 따라서, 항체의 서브클래스의 임의의 것은 부분적으로 또는 전체적으로 인코딩될 수 있고, 하기 서브클래스를 포함할 수 있다: IgG1, IgG2, IgG3, IgG4, IgA1 및 IgA2.
특정 실시형태에서, 본 명세서에 개시된 EEC는 단클론성 항체 및/또는 이의 변이체를 인코딩할 수 있다. 항체의 변이체는 또한 치환 변이체, 보존적 아미노산 치환, 삽입 변이체, 결실 변이체 및/또는 공유 유도체를 포함할 수 있다. 특정 실시형태에서, 본 명세서에 개시된 EEC는 면역글로불린 Fc 영역을 인코딩할 수 있다. 또 다른 실시형태에서, EEC는 변이체 면역글로불린 Fc 영역을 인코딩할 수 있다. 비제한적인 예로서, EEC는 변이체 면역글로불린 Fc 영역을 갖는 항체를 인코딩할 수 있다.
특정 실시형태는 항-SARS-Cov2 항체, 항-SARS 항체, 항-RSV 항체, 항-HIV 항체, 항-뎅기열 바이러스 항체, 항-보르다텔라 백일해 항체, 항-C형 간염 항체, 항-인플루엔자 바이러스 항체, 항-인플루엔자 바이러스 항체, 항-파라인플루엔자 바이러스 항체, 항-메타뉴모바이러스(MPV) 항체, 항-사이토메갈로바이러스 항체, 항-엡슈타인 바르 바이러스 항체; 항-단순 포진 바이러스 항체, 항-클로스트리디움 디피실레 박테리아 독소 항체 또는 항-종양 괴사 인자(TNF) 항체를 인코딩한다.
공지된 항-RSV 항체는 팔리비주맙(palivizumab); 미국 특허 제9,403,900호에 기재된 것들; AB1128(MILLIPORE로부터 입수가능) 및 ab20745(ABCAM로부터 입수가능함)를 포함한다.
공지된 항-HIV 항체의 예는 10E8이며, 이는 gp41에 결합하는 광범위하게 중화 항체이다. VRC01은 gp120의 CD4 결합 부위에 결합하는 광범위한 중화 항체이다. 다른 예시적인 항-HIV 항체는 ab18633 및 39/5.4A(ABCAM로부터 입수 가능함); 및 H81E(THERMOFISHER로부터 입수 가능함)를 포함한다.
항-뎅기 바이러스 항체의 예는 항체 55(US 20170233460호에 기재됨); 항체 DB2-3(미국 특허 제8,637,035호에 기재됨); 및 ab155042 및 ab80914(둘 다 ABCAM으로부터 입수 가능함)를 포함한다.
항-백일해 항체는 미국 특허 제9,512,204호에 기재되어 있다.
항-C형 간염 항체의 예는 MAB8694(MILLIPORE로부터 입수 가능함) 및 C7-50(ABCAM으로부터 입수 가능함)을 포함한다.
항-인플루엔자 바이러스 항체는 미국 특허 제9,469,685호에 기재되어 있고, 또한 C102(TERMOFISHER로부터 입수 가능함)를 포함한다.
예시적인 항-MPV 항체는 MPE8을 포함한다.
예시적인 항-CMV 항체는 MCMV5322A, MCMV3068A, LJP538, 및 LJP539를 포함한다(또한, 예를 들어, 문헌[Deng et al., Antimicrobial Agents and Chemotherapy 62(2) e01108-17 (Feb. 2018); 및 Dole et al., Antimicrobial Agents and Chemotherapy 60(5) 2881-2887 (May 2016)] 참조).
항-HSV 항체의 예는 HSV8-N 및 MB66을 포함한다.
예시적인 항-클로스트리디움 디피실레 항체는 악톡수맙 및 베즐로톡수맙을 포함한다(또한, 예를 들어, 문헌[Wilcox et al., N Engl J Med 376(4) 305-317 (2017)] 참조).
본 개시내용의 교시 내에서 사용될 수 있는 다수의 추가적인 항체 서열이 이용 가능하고 당업자에게 공지되어 있다. 상업적으로 이용 가능한 항체에 대한 서열 정보는 Drug Bank 데이터베이스, CAS Registry, 및/또는 RSCB Protein Data Bank에서 확인될 수 있다.
백신. 본 명세서에 개시된 EEC는 하나 이상의 백신을 인코딩할 수 있다. 본 명세서에서 사용되는 "백신"은 질병 또는 감염을 유발하고/하거나 이를 발달시키는 데 필요한 제제에 대한 후천성 면역을 발생시키기 위해 면역 반응을 자극함으로써 특정 질환 또는 감염원에 대한 면역을 개선시키는 조성물이다. 예를 들어, 백신은 면역 시스템을 항원에 선제적으로 노출시킴으로써 특정 항원에 대한 면역 시스템 반응을 생성하는 제형이다. 병원체 항원은 온전하지만 비-감염성 형태의 병원체(예를 들어, 가열-사멸)일 수 있다. 항원은 또한 병원체의 단백질 또는 단백질 단편 또는 비정상 세포 타입(예를 들어, 감염된 세포 또는 암 세포)에 의해 발현되는 단백질 또는 단백질 단편일 수 있다. 면역 시스템이 선제적 노출 후 항원을 인식하는 경우, 이는 항원이 다시 맞닥뜨리는 경우 면역 시스템이 빠르고 효과적으로 효과적인 반응을 일으킬 수 있도록 장기 면역 기억을 유발할 수 있다.
예시적인 바이러스 백신 항원은 아데노바이러스, 아레나바이러스, 부냐바이러스, 코로나바이러스, 플라버바이러스, 한타바이러스, 헤파드나바이러스, 헤르페스바이러스, 유두종바이러스, 파라믹소바이러스, 파보바이러스, 피코르나바이러스, 폭스바이러스, 오르토믹소바이러스, 레트로바이러스, 라브도바이러스, 로타바이러스, 스폰지폼 바이러스 또는 토가바이러스로부터 유래될 수 있다. 특정 실시형태에서, 백신 항원은 CMV, EBV, 독감 바이러스, A형, B형, 또는 C형 간염, 단순 포진, HIV, 인플루엔자, 일본 뇌염, 홍역, 소아마비, 광견병, 호흡기 세포융합, 풍진, 천연두, 수두 대상포진, 웨스트 나일 및/또는 지카를 포함하는 바이러스에 의해 발현된 펩타이드를 포함한다.
전체 병원체로부터 유래된 백신 항원의 예는 OPV 소아마비 백신에 사용되는 약독화된 소아마비 바이러스, 및 IPV 소아마비 백신에 사용되는 사멸된 소아마비 바이러스를 포함한다.
추가의 특정 예로서, SARS-CoV-02 백신 항원은 스파이크 단백질 또는 이의 단편(예를 들어, 수용체 결합 도메인(RBD))을 포함하며; CMV 백신 항원은 외피 당단백질 B 및 CMV pp65를 포함하며; EBV 백신 항원은 EBV EBNAI, EBV P18, 및 EBV P23을 포함하며; 간염 백신 항원은 B형 간염 바이러스의 S, M, 및 L 단백질, B형 간염 바이러스의 전-S 항원, HBCAG DELTA, HBV HBE, C형 간염 바이러스 RNA, HCV NS3 및 HCV NS4를 포함하며; 단순 포진 백신 항원은 즉시 초기 단백질 및 당단백질 D를 포함하며; 인간 면역결핍 바이러스(HIV) 백신 항원은 gag, pol, 및 env 유전자의 유전자 생성물, 예를 들어, HIV gp32, HIV gp41, HIV gp120, HIV gp160, HIV P17/24, HIV P24, HIV P55 GAG, HIV P66 POL, HIV TAT, HIV GP36, Nef 단백질 및 역전사효소를 포함하며; 인간 유두종바이러스(HPV) 바이러스 항원은 L1 단백질을 포함하며; 인플루엔자 백신 항원은 헤마글루티닌 및 뉴라미니다제를 포함하며; 일본 뇌염 백신 항원은 단백질 E, M-E, ME-NS1, NS1, NS1-NS2A 및 80% E를 포함하며; 말라리아 백신 항원은 플라스모디움 단백질 포자소체(CSP), 글루타메이트 데하이드로게나제, 락테이트 데하이드로게나제, 및 프룩토스-비스포스페이트 알돌라제를 포함하며; 홍역 백신 항원은 홍역 바이러스 융합 단백질을 포함하며; 광견병 백신 항원은 광견병 당단백질 및 광견병 핵단백질을 포함하며; 호흡기 세포융합 백신 항원은 RSV 융합 단백질 및 M2 단백질을 포함하며; 로타바이러스 백신 항원은 VP7sc를 포함하며; 풍진 백신 항원은 단백질 E1 및 E2를 포함하며; 수두 대상포진 백신 항원은 gpl 및 gpll을 포함하며; 지카 백신 항원은 전-막, 외피(E), E 단백질의 도메인 III, 및 비-구조 단백질 1 내지 5를 포함한다.
추가적인 특정의 예시적인 바이러스 항원 서열은 Nef(66-97): (VGFPVTPQVPLRPMTYKAAVDLSHFLKEKGGL(서열번호 48)); Nef(116-145): (HTQGYFPDWQNYTPGPGVRYPLTFGWLYKL(서열번호 49)); Gag p17(17-35): (EKIRLRPGGKKKYKLKHIV(서열번호 50)); Gag p17-p24(253-284): (NPPIPVGEIYKRWIILGLNKIVRMYSPTSILD(서열번호 51)); Pol 325-355(RT 158-188): (AIFQSSMTKILEPFRKQNPDIVIYQYMDDLY(서열번호 52)); CSP 중심 반복 영역; (NANPNANPNANPNANPNANP(서열번호 53)); 및 E 단백질 도메인 III: (AFTFTKIPAETLHTVTEVQYAGTDGPCKVPAQMAVDMQTLTPVGRLITANPVITEGTENSKMMLELDPPFGDSYIVIGVGE(서열번호 54))를 포함한다. 바이러스 항원의 추가적인 예에 대해 문헌[Fundamental Virology, Second Edition, eds. Fields, B. N. and Knipe, D. M. (Raven Press, New York, 1991)]이 참조된다.
특정 실시형태에서, 백신 항원은 박테리아 감염과 관련된 세포에 의해 발현된다. 예시적인 박테리아는 탄저병; 그람-음성 간균, 클라미디아, 디프테리아, 헤모필루스 인플루엔자, 헬리코박터 파일로리(Helicobacter pylori), 마이코박테리움 투베르쿨로시스(Mycobacterium tuberculosis), 백일해 독소, 폐렴구균, 리케차, 스타필로코커스, 스트렙토코커스 및 파상풍을 포함한다.
박테리아 백신 항원의 특정 예로서, 탄저병 백신 항원은 탄저병 보호 항원을 포함하며; 그람-음성 간균 백신 항원은 지질다당류를 포함하며; 헤모필루스 인플루엔자 백신 항원은 피막 다당류를 포함하며; 디프테리아 백신 항원은 디프테리아 독소를 포함하며; 마이코박테리움 투베르쿨로시스 백신 항원은 마이콜산, 열 충격 단백질 65(HSP65), 30 kDa 주요 분비 단백질 및 항원 85A를 포함하며; 백일해 독소 백신 항원은 헤마글루티닌, 퍼탁틴, FIM2, FIM3 및 아데닐레이트 사이클라제를 포함하며; 폐렴구균 백신 항원은 뉴몰리신 및 폐렴구균 피막 다당류를 포함하며; 리케차 백신 항원은 rompA를 포함하며; 연쇄상구균 백신 항원은 M 단백질을 포함하며; 파상풍 백신 항원은 파상풍 독소를 포함한다.
특정 실시형태에서, 백신 항원은 다제 내성 "슈퍼버그"로부터 유래된다. 슈퍼버그의 예는 엔테로코커스 패시움(Enterococcus faecium), 클로스트리디움 디피실레(Clostridium difficile), 아시네토박터 바우만니(Acinetobacter baumannii), 슈도모나스 아에루지노사(Pseudomonas aeruginosa), 및 엔테로박테리아세애(대장균, 클레브시엘라 뉴모니애, 엔테로박터 종 포함)를 포함한다.
백신 항원은 또한 암과 싸우기 위한 면역 시스템을 활성화시키기 위해 암 세포에 의해 특이적으로 또는 우선적으로 발현되는 단백질을 포함할 수 있다. 암 항원의 예는 A33; BAGE; B-세포 성숙 항원(BCMA); Bcl-2; β-카테닌; CA19-9; CA125; 카복시-언하이드라제-IX(CAIX); CD5; CD19; CD20; CD21; CD22; CD24; CD33; CD37; CD45; CD123; CD133; CEA; c-Met; CS-1; 사이클린 B1; DAGE; EBNA; EGFR; 에프린B2; 에스트로겐 수용체; FAP; 페리틴; 엽산-결합 단백질; GAGE; G250; GD-2; GM2; gp75, gp100(Pmel 17); HER-2/neu; HPV E6; HPV E7; Ki-67; L1-CAM; LRP; MAGE; MART; 메조텔린; MUC; MUM-1-B; myc; NYESO-1; p53, PRAME; 프로게스테론 수용체; PSA; PSCA; PSMA; ras; RORl; 서바이빈; SV40 T; 테나신; TSTA 티로시나제; VEGF; 및 WT1을 포함한다.
RNA 백신의 사용은 DNA 기반 백신의 잠재적 위험을 피하기 위한 매력적인 대안을 제공한다. DNA와 마찬가지로, RNA의 세포로의 전달은 또한 생체내에서 세포 및 체액 면역 반응 둘 다를 유도할 수 있다. 특히, 시험관내 전사된 RNA(IVT-RNA)를 이용한 면역요법을 위해 2개의 상이한 전략이 추구되었고, 둘 다 다양한 동물 모델에서 성공적으로 시험되었다. RNA는 상이한 면역화 경로에 의해 환자에게 직접 주사되거나 세포가 시험관내에서 통상적인 트랜스펙션 방법을 사용하여 IVT-RNA로 트랜스펙션된 다음 트랜스펙션된 세포가 환자에게 투여된다. 예를 들어, RNA는 번역되고 발현된 단백질은 면역 반응을 유도하기 위해 세포 표면의 MHC 분자에 제시될 수 있다.
치료용 단백질은 세포에 의해 발현될 때 기존의 의학적 병태 또는 장애를 치료하는 단백질을 지칭한다. "치료하다"는 단백질의 발현이 기존의 의학적 병태 또는 장애의 원인을 감소시키고/시키거나 의학적 병태 또는 장애(예를 들어, 통증, 염증, 울혈, 피로, 열, 오한)의 부작용을 감소시키는 것을 의미한다.
세포-침투 단백질. 본 명세서에 개시된 EEC는 하나 이상의 세포-침투 단백질(CPP, 세포 침투 펩타이드로도 지칭됨)을 인코딩할 수 있다. CPP는 분자의 세포 섭취 및 흡수를 촉진할 수 있는 단백질을 지칭한다. 일반적으로, 세포 침투 펩타이드는 세포막을 통해 상이한 타입의 카고 분자를 수송할 수 있고, 따라서 다양한 분자 카고(나노크기 입자로부터 작은 화학 분자 및 DNA의 큰 단편까지)의 세포 흡수를 촉진할 수 있는 (짧은) 펩타이드이다. 통상적으로, 카고는 공유 결합을 통한 화학적 연결 또는 비공유 상호작용을 통해 펩타이드와 회합된다. 세포-침투 펩타이드는 상이한 크기, 아미노산 서열, 및 전하를 갖지만, 모든 CPP는 원형질막을 전위시키고 다양한 분자 카고의 세포질 또는 세포 소기관으로의 전달을 용이하게 하는 능력인 공통 특성을 갖는다. 현재, CPP 전위의 이론은 세 가지 주요 진입 메커니즘을 구별한다: 막에서의 직접 침투, 세포내이입-매개 진입, 및 일시적 구조의 형성을 통한 전위(Jafari S, Solmaz MD, Khosro A, 2015, Bioimpacts 5(2): 103-111; Madani F, Lindberg S, Langel LI, Futaki S, Graslund A, 2011, J Biophys: 414729).
CPP의 예는 페네트라틴(Derossi, D., et al., J Biol Chem, 1994. 269(14): p.10444-50); 단백질 형질도입에 필요한 TAT의 최소 도메인(Vives, E., P. Brodin, and B. Lebleu, J Biol Chem, 1997. 272(25): p.16010-7); 바이러스 단백질, 예를 들어, VP22(Elliott, C. and P. O'Hare, Cell, 1 997. 88(2): p.223-33) 및 ZEBRA(Rothe, R., et al., J Biol Chem, 2010. 285(26): p.20224-33); 독(venom)으로부터, 예를 들어, 멜리틴(Dempsey, CE, Biochim Biophys Acta, 1990. 1031 (2): p.143-61), 마스토포란(Konno, K., et al., Toxicon, 2000. 38(11): p.1505-15), 마우로칼신(Esteve, E., et al., J Biol Chem, 2005. 280(13): p.12833-9), 크로타민(Nascimento, FD, et al., J Biol Chem, 2007. 282(29): p.21349-60) 또는 부포린(Kobayashi, S., et al., Biochemistry, 2004. 43(49): p.15610-6); 또는 합성 CPP, 예를 들어, 폴리-아르기닌(R8, R9, R10 및 R12)(Futaki, S., et al., J Biol Chem, 2001. 276(8): p.5836-40) 또는 트랜스포탄(Pooga, M., et al., FASEB J, 1998. 12(1): p.67-77)을 포함한다.
CPP는 하나 이상의 검출 가능한 표지를 포함할 수 있다. 단백질은 부분적으로 표지되거나 전반적으로 완전히 표지될 수 있다. EEC는 검출 가능한 표지를 완전히, 부분적으로 인코딩할 수 있거나 전혀 인코딩하지 않을 수 있다. 세포-침투 펩타이드는 또한 신호 서열을 포함할 수 있다. 본 명세서에서 사용되는 "신호 서열"은 단백질 번역 동안 초기 단백질의 아미노 말단에 결합된 아미노산 잔기의 서열을 지칭한다. 신호 서열은 세포-침투 폴리펩타이드의 분비를 신호 전달하기 위해 사용될 수 있다.
EEC에 의해 인코딩된 CPP는 번역된 후 복합체를 형성할 수 있다. 복합체는 세포-침투 폴리펩타이드에 연결된 하전된 단백질을 포함할 수 있다.
특정 실시형태에서, CPP는 제1 도메인 및 제2 도메인을 포함할 수 있다. 제1 도메인은 초하전된 폴리펩타이드를 포함할 수 있다. 제2 도메인은 단백질-결합 파트너를 포함할 수 있다. 이러한 맥락에서 사용되는 "단백질-결합 파트너"는 항체 및 이의 기능성 단편, 스캐폴드 단백질, 또는 펩타이드를 포함한다. CPP는 단백질-결합 파트너에 대한 세포내 결합 파트너를 추가로 포함할 수 있다. CPP는 EEC가 도입된 세포로부터 분비될 수 있다. CPP는 또한 EEC가 도입된 세포를 침투할 수 있다.
추가 실시형태에서, CPP는 제2 세포를 침투할 수 있다. 제2 세포는 제1 세포와 동일한 영역으로부터 유래될 수 있거나, 상이한 영역으로부터 유래될 수 있다. 영역은 조직 및 기관을 포함할 수 있다. 제2 세포는 또한 제1 세포에 대해 근위 또는 원위에 있을 수 있다.
특정 실시형태에서, EEC는 또한 융합 단백질을 인코딩할 수 있다. 융합 단백질은 자연 발생 단백질에 함께 존재하지 않는 적어도 2개의 도메인을 포함한다. 도메인은 직접 융합될 수 있거나 개재 링커 서열을 통해 연결될 수 있다. 특정 예에서, 융합 단백질은 치료용 단백질에 연결된 하전된 단백질을 포함한다. "하전된 단백질"은 양성, 음성 또는 전체 중성 전하를 운반하는 단백질을 지칭한다. 바람직하게는, 치료용 단백질은 융합 단백질의 형성에서 하전된 단백질에 공유적으로 연결될 수 있다. 총 또는 표면 아미노산에 대한 표면 전하의 비율은 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8 또는 0.9일 수 있다. 융합 단백질의 다른 예는 이중특이적 항체, 키메라 항원 수용체, 및 조작된 T 세포 수용체(TCR)를 포함한다.
분비된 단백질. 인간 및 다른 진핵 세포는 막에 의해 많은 기능적으로 별개의 구획으로 세분된다. 각각의 막-결합 구획, 또는 소기관은 소기관의 기능에 필수적인 상이한 단백질을 함유한다. 세포는 특정 세포 소기관으로 단백질을 표적화하기 위해 단백질 내에 위치한 아미노산 모티프인 "분류 신호"를 사용한다.
신호 서열, 신호 펩타이드, 또는 리더 서열로 불리는 한 가지 타입의 분류 신호는 단백질 부류를 소포체(ER)라고 하는 소기관으로 지시한다. 신호 서열에 의해 ER을 표적으로 하는 단백질은 분비된 단백질로서 세포외 공간으로 방출될 수 있다. 유사하게, 세포막에 존재하는 단백질은 또한 단백질을 막에 고정시키는 "링커"의 단백질분해 절단에 의해 세포외 공간으로 분비될 수 있다.
일부 실시형태에서, EEC는 대량의 인간 유전자 생성물을 제조하는 데 사용될 수 있다.
일부 실시형태에서, EEC는 원형질막의 단백질을 발현시키는 데 사용될 수 있다.
일부 실시형태에서, EEC는 세포질 또는 세포골격 단백질을 발현시키는 데 사용될 수 있다.
일부 실시형태에서, EEC는 세포내 막 결합된 단백질을 발현시키는 데 사용될 수 있다.
일부 실시형태에서, EEC는 핵 단백질을 발현시키는 데 사용될 수 있다.
일부 실시형태에서, EEC는 인간 질환과 관련된 단백질을 발현시키는 데 사용될 수 있다.
일부 실시형태에서, EEC는 현재 알려지지 않은 치료 기능을 갖는 단백질을 발현시키는 데 사용될 수 있다.
특정 예에서, EEC는 현재 시판 중이거나 개발 중인 하나 이상의 단백질을 인코딩한다. 현재 시판되고 있거나 개발 중인 단백질의 인코딩 폴리뉴클레오타이드를 EEC로 혼입시키면 본 명세서에 기재된 바와 같이 단백질 발현이 증가될 수 있다.
EEC는 코딩 서열 내에 자가-절단 펩타이드에 대한 코딩 서열을 포함시키거나 리보솜 스킵핑 요소를 포함함으로써 하나 초과의 단백질을 인코딩할 수 있다.
EEC에 의해 인코딩된 단백질은 혈액, 심혈관, CNS, 중독(항독제 포함), 피부과, 내분비학, 위장, 의료 영상, 근골격, 종양학, 면역학, 호흡기, 감각 및 항-감염성과 같은 많은 치료 영역에서 병태 또는 질환을 치료하는 데 이용될 수 있다.
대상체를 치료하기 위해 사용될 때, EEC는 투여를 위해 제형화될 수 있다.
EEC의 제형은 약리학 분야에 공지되어 있거나 이후 개발될 임의의 방법에 의해 제조될 수 있다. 일반적으로, 이러한 제조 방법은 EEC를 부형제 및/또는 하나 이상의 다른 부속 성분과 회합시키는 단계, 및 이후, 필요 및/또는 바람직한 경우, 제형을 요망되는 단일- 또는 다중-용량 단위로 분할, 형상화 및/또는 패키징하는 단계를 포함한다.
본 개시에 따른 제형에서 EEC, 약제학적으로 허용 가능한 부형제, 및/또는 임의의 추가 성분의 상대량은 치료되는 대상체의 정체, 크기, 및/또는 상태에 따라 및 추가로 제형이 투여되는 경로에 따라 달라질 것이다. 예로서, 제형은 0.1% 내지 100%, 예를 들어, 0.5 내지 50%, 1 내지 30%, 5 내지 80%, 적어도 80%(w/w)의 활성 성분을 포함할 수 있다.
EEC 제형은 (1) 안정성을 증가시키고/시키거나; (2) 세포 트랜스펙션 증가시키고/시키거나; (3) (예를 들어, 데포 제형으로부터) 지속 또는 지연 방출을 허용하고/하거나; (4) 생체분포를 변경(예를 들어, 특정 조직 또는 세포 타입에 대한 표적화)하고/하거나; (5) 생체내에서 인코딩된 단백질의 방출 프로파일을 변경시키기 위해 하나 이상의 부형제를 포함할 수 있다. 임의의 및 모든 용매, 분산 매질, 희석제, 또는 다른 액체 비히클과 같은 전통적인 부형제 이외에, 분산 또는 현탁 보조제, 표면 활성제, 등장제, 증점제 또는 유화제, 보존제, 부형제는 또한 리피도이드, 리포솜, 지질 나노입자, 폴리머, 리포플렉스, 코어-쉘 나노입자, 펩타이드, 단백질, EEC로 트랜스펙션된 세포(예를 들어, 대상체로의 이식을 위해), 히알루로니다제, 나노입자 모방체 및 이들의 조합을 포함할 수 있다.
EEC의 시험관내 합성.
mRNA 생산의 과정은 시험관내 전사, cDNA 주형 제거 및 RNA 클린업, 및 mRNA 캡핑 및/또는 테일링 반응을 포함할 수 있다.
시험관내 전사 동안, 원하는 작제물로부터의 cDNA는 당 분야에 널리 공지된 기술에 따라 생산된다. 이러한 주어진 cDNA는 시험관내 전사(IVT) 시스템을 사용하여 전사될 수 있다. 이러한 IVT는 개시된 EEC의 시험관내 합성된 mRNA를 가능하게 할 수 있다. 시스템은 통상적으로 전사 완충제, 뉴클레오타이드 트리포스페이트(NTP), RNase 억제제 및 폴리머라제를 포함한다. NTP는 사내에서 제조될 수 있거나, 공급자로부터 선택될 수 있거나, 당 분야에 공지된 바와 같이 합성될 수 있다. NTP는 자연 발생 NTP로부터 선택된다. 폴리머라제는 T7 RNA 폴리머라제, T3 RNA 폴리머라제, SP6 RNA 폴리머라제 및 변형된 핵산을 혼입할 수 있는 폴리머라제와 같은 돌연변이체 폴리머라제로부터 선택될 수 있다.
포유동물 세포로의 EEC의 트랜스펙션. 본 명세서에 기재된 바와 같이 설계되고 합성된 EEC는 이후 다양한 세포 타입으로 트랜스펙션될 수 있으며, 여기서 오픈 리딩 프레임 내의 인코딩된 단백질은 관심 단백질로 번역될 것이다. 트랜스펙션은 당 분야에 공지된 임의의 방법, 예를 들어, 전기천공 및 리포펙션을 사용하여 발생할 수 있다. 다양한 세포 타입은 당 분야에 공지되어 있거나 공지될 수 있는 임의의 포유동물 세포를 포함한다. 사용될 수 있는 포유동물 세포의 예는 Jurkat, Raji, HEK293, 1차 섬유모세포, 1차 혈액 세포(다양한 백혈구 세포 포함), 1차 신장 세포, 1차 간 세포, 1차 췌장 세포 및 1차 뉴런을 포함한다.
본 개시내용은 포유동물 세포에서 번역을 위한 오픈 리딩 프레임 내에 코딩 서열을 포함하는 시험관내-합성된 RNA를 포함하는 EEC를 제공한다. 단백질은 세포질에 존재하고, 소기관으로 수송되고, 분비될 것들을 포함하는 매우 다양한 단백질로부터 선택될 수 있다. 이러한 EEC는 서열 CAUACUCA, 서열번호 2, 서열번호 3, 서열번호 38, 또는 서열번호 39 중 어느 하나를 포함하는 5' UTR 또는 서열번호 4, 5, 6 또는 7을 포함하는 3' UTR을 포함할 수 있다. 5' UTR은 또한 T7 폴리머라제 프로모터, 미니-인핸서 서열(CAUACUCA), 또는 Kozak 서열을 포함할 수 있다. 추가로, 박테리오파지 T7 프로모터는 조작된 서열에서 T7 클래스 III 프로모터(서열번호 2)로부터 선택될 수 있다.
본 개시내용은 또한 포유동물 세포에서 번역을 위한 오픈 리딩 프레임 내에 코딩 서열을 포함하는 시험관내-합성된 RNA에 대한 EEC를 제공하며, 여기서 EEC는 또한 정지 코돈(UAA/UAG/UGA)과 컨쥬게이션된 서열번호 4, 5, 6 또는 7을 포함하는 3' UTR을 포함할 수 있다. 또한, 시험관내-합성된 mRNA는 또한 a) CCUC 및 GAGG 또는 b) GAGG 및 CCUC를 포함하는 3' UTR을 포함할 수 있다. 3' UTR 서열의 서열 (a) CCUC 및 GAGG 또는 b) GAGG 및 CCUC)의 세트는 7개 이상의 뉴클레오타이드에 의해 분리될 수 있거나 7개 초과의 뉴클레오타이드일 수 있다. 우선적으로는, 3' UTR 서열에서 뉴클레오타이드의 총 수는 50개 이하의 뉴클레오타이드일 수 있다.
본 개시내용은 EEC를 제공하며, 조작된 시험관내-합성된 mRNA에 대한 방법은 미니-인핸서 서열(CAUACUCA) 서열번호 2, 서열번호 3, 서열번호 38 또는 서열번호 39 중 어느 하나를 포함하는 5' UTR 및 서열번호 4, 5, 6 또는 7 중 하나를 포함하는 3' UTR을 포함할 수 있다. 또한, 조작된 시험관내-합성된 mRNA는 미니-인핸서 서열(CAUACUCA), 서열번호 2, 서열번호 3, 서열번호 38 또는 서열번호 39를 포함하는 5' UTR 및 서열번호 4, 5, 6 또는 7 중 하나를 포함하는 3' UTR을 포함할 수 있다. 또한, 조작된 시험관내-합성된 mRNA는 미니-인핸서 서열(CAUACUCA) 서열번호 2, 서열번호 3, 서열번호 38, 또는 서열번호 39 중 어느 하나 및 서열번호 4, 5, 6 또는 7 중 하나를 포함할 수 있다. 또한, 본 개시내용의 EEC는 녹색 형광 단백질(GFP), 인간 인터루킨-2(IL2) 및 인간 POU5F1(또는 OCT3/4) 중 어느 하나를 인코딩하는 코딩 서열을 갖는 조작된 mRNA를 포함할 수 있다. 본 개시내용은 또한 시험관내-합성된 RNA가 인코딩된 단백질의 발현 수준을 증가시키는 EEC를 제공한다. 또한, 특정 예에서, 본 개시내용의 EEC는 임의의 변형된 뉴클레오사이드를 포함하지 않고/않거나 임의의 마이크로RNA 결합 부위를 포함하지 않는다. 추가의 예에서, 본 개시내용의 EEC는 임의의 변형된 뉴클레오사이드를 포함하지 않고, 임의의 마이크로RNA 결합 부위를 포함하지 않고, 임의의 면역-회피제를 포함하지 않는다.
본 명세서에 기재된 바와 같이, EEC는 단백질의 발현을 증가시킨다. 이러한 증가는 5' UTR에 미니-인핸서 서열을 포함하지 않는 코딩 서열과 비교할 때, 3' UTR에 스템-루프 서열을 포함하지 않는 코딩 서열과 비교할 때, 5' UTR의 미니-인핸서 서열 및 3' UTR의 스템-루프 서열을 포함하지 않는 코딩 서열과 비교할 때, 변형된 뉴클레오타이드를 함유하지만 본 명세서에 개시된 EEC를 함유하지 않는 코딩 서열과 비교할 때 단백질의 천연 발현 수준과 관련될 수 있고/있거나 단백질이 역사적으로 또는 통상적으로 발현된 방식과 관련될 수 있다. 특정 예에서, 증가된 단백질 발현은 관련 대조군 시스템 또는 조건과 비교하여 적어도 10% 더 많은 단백질 발현, 적어도 20% 더 많은 단백질 발현, 적어도 30% 더 많은 단백질 발현, 적어도 40% 더 많은 단백질 발현, 적어도 50% 더 많은 단백질 발현, 적어도 60% 더 많은 단백질 발현, 적어도 70% 더 많은 단백질 발현, 적어도 80% 더 많은 단백질 발현, 적어도 90% 더 많은 단백질 발현, 적어도 100% 더 많은 단백질 발현, 적어도 200% 더 많은 단백질 발현, 적어도 300% 더 많은 단백질 발현이다.
하기 예시적인 실시형태 및 실시예는 본 개시내용의 특정 실시형태를 입증하기 위해 포함된다. 당업자는 본 개시에 비추어, 본 명세서에 개시된 특정 실시형태에 많은 변경이 이루어질 수 있고, 개시의 사상 및 범위를 벗어나지 않고 여전히 동일하거나 유사한 결과를 얻을 수 있음을 인지해야 한다.
예시적인 실시형태.
1. 코딩 서열에 작동 가능하게 연결된 5' 비번역 영역(UTR)을 갖되, 상기 5' UTR은 최소 프로모터와 Kozak 서열 사이에 CAUACUCA에 제시된 서열을 갖는, 조작된 발현 작제물(EEC).
2. 실시형태 1에 있어서, 상기 최소 프로모터는 T7 프로모터인, EEC.
3. 실시형태 2에 있어서, 상기 T7 프로모터는 GGGAGA에 제시된 서열을 갖는, EEC.
4. 실시형태 1 내지 3 중 임의의 것에 있어서, 상기 Kozak 서열은 GCCRCCAUG에 제시된 서열을 가지며, 여기서, R은 A 또는 G인, EEC.
5. 실시형태 1 내지 4 중 임의의 것에 있어서, 상기 5' UTR은
(i) 개시 코돈에 작동 가능하게 연결된 서열번호 2에 제시된 서열 또는
(ii) 개시 코돈에 작동 가능하게 연결된 서열번호 3에 제시된 서열
을 갖는, EEC.
6. 실시형태 5에 있어서, 상기 개시 코돈에 작동 가능하게 연결된 서열번호 2에 제시된 서열은 서열번호 38에 제시된 서열을 갖는, EEC.
7. 실시형태 5에 있어서, 상기 개시 코돈에 작동 가능하게 연결된 서열번호 3에 제시된 서열은 서열번호 39에 제시된 서열을 갖는, EEC.
8. 실시형태 1 내지 7 중 임의의 것에 있어서, 상기 5' UTR은 30개 미만의 뉴클레오타이드인, EEC.
9. 실시형태 1 내지 8 중 임의의 것에 있어서, 3' UTR을 추가로 포함하는, EEC.
10. 실시형태 9에 있어서, 상기 3' UTR은 스페이서, 및 정지 코돈에 작동 가능하게 연결된 스템 루프 구조를 포함하는, EEC.
11. 실시형태 10에 있어서, 상기 정지 코돈은 서열 UAA, UGA 또는 UAG를 갖는, EEC.
12. 실시형태 10 또는 11에 있어서, 상기 스페이서는 서열 [N1-3]AUA 또는 [N1-3]AAA를 갖는, EEC.
13. 실시형태 10 또는 11에 있어서, 상기 스페이서는 서열 UGCAUA 또는 UGCAAA를 갖는, EEC.
14. 실시형태 10 내지 13 중 임의의 것에 있어서, 상기 스템 루프 구조는 CCUC 및 GAGG에 제시된 하이브리드화 서열(hybridizing sequence)을 갖는, EEC.
15. 실시형태 10 내지 13 중 임의의 것에 있어서, 상기 스템 루프 구조는 AAACCUC 및 GAGG에 제시된 또는 AAAGAGG 및 CCUC에 제시된 하이브리드화 서열을 갖는, EEC.
16. 실시형태 10 내지 15 중 임의의 것에 있어서, 상기 스템 루프 구조는 7개 이상의 뉴클레오타이드를 갖는 루프 세그먼트를 갖는, EEC.
17. 실시형태 10 내지 16 중 임의의 것에 있어서, 상기 스템 루프 구조는 7 내지 15개의 뉴클레오타이드를 갖는 루프 세그먼트를 갖는, EEC.
18. 실시형태 10 내지 17 중 임의의 것에 있어서, 상기 스템 루프 구조는 UAACGGUCUU(서열번호 34)에 제시된 서열을 갖는 루프 세그먼트를 갖는, EEC.
19. 실시형태 9 내지 18 중 임의의 것에 있어서, 상기 3' UTR은 30개 미만의 뉴클레오타이드인, EEC.
20. 실시형태 9 내지 19 중 임의의 것에 있어서, 상기 3' UTR은 폴리아데닌(폴리A) 꼬리를 추가로 포함하는, EEC.
21. 실시형태 20에 있어서, 상기 폴리A 꼬리는 60개 이하의 잔기를 갖는, EEC.
22. 실시형태 20 또는 21에 있어서, 상기 폴리A 꼬리는 40개의 잔기를 갖는, EEC.
23. 실시형태 9 내지 22 중 임의의 것에 있어서, 상기 3' UTR은 서열번호 4, 5, 6, 7, 8 또는 9에 제시된 서열을 갖는, EEC.
24. 실시형태 9 내지 22 중 임의의 것에 있어서, 상기 3' UTR은 서열번호 10, 11 또는 12에 제시된 서열을 갖는, EEC.
25. 실시형태 9 내지 24 중 임의의 것에 있어서, 상기 3' UTR은 서열번호 13, 14, 15, 16, 17, 18, 19, 20 또는 21에 제시된 서열을 갖는, EEC.
26. 실시형태 1 내지 25 중 임의의 것에 있어서, 상기 EEC는 시험관내-합성된 메신저 RNA(mRNA)를 포함하는, EEC.
27. 실시형태 1 내지 26 중 임의의 것에 있어서, 상기 코딩 서열은 녹색 형광 단백질(GFP), 인간 인터루킨-2(IL2) 또는 인간 POU5F1(또는 OCT3/4)을 인코딩하는, EEC.
28. 실시형태 1 내지 27 중 임의의 것에 있어서, 서열번호 56, 58 또는 60에 제시된 서열을 갖는, EEC.
29. 실시형태 1 내지 26 중 임의의 것에 있어서, 상기 코딩 서열은 치료용 단백질을 인코딩하는, EEC.
30. 실시형태 29에 있어서, 상기 치료용 단백질은 항체 또는 이의 결합 단편을 포함하는, EEC.
31. 실시형태 30에 있어서, 상기 항체 또는 이의 결합 단편은 항-SARS-Cov2 항체 또는 이의 결합 단편, 항-SARS 항체 또는 이의 결합 단편, 항-RSV 항체 또는 이의 결합 단편, 항-HIV 항체 또는 이의 결합 단편, 항-뎅기 바이러스 항체 또는 이의 결합 단편, 항-보르다텔라 백일해 항체 또는 이의 결합 단편, 항-C형 간염 항체 또는 이의 결합 단편, 항-인플루엔자 바이러스 항체 또는 이의 결합 단편, 항-파라인플루엔자 바이러스 항체 또는 이의 결합 단편, 항-메타뉴모바이러스(MPV) 항체 또는 이의 결합 단편, 항-사이토메갈로바이러스 항체 또는 이의 결합 단편, 항-엡스타인 바 바이러스 항체; 항-단순 포진 바이러스 항체 또는 이의 결합 단편, 항-클로스트리디움 디피실레 박테리아 독소 항체 또는 이의 결합 단편, 또는 항-종양 괴사 인자(TNF) 항체 또는 이의 결합 단편을 포함하는, EEC.
32. 실시형태 1 내지 26 중 임의의 것에 있어서, 상기 코딩 서열은 백신 항원을 인코딩하는, EEC.
33. 실시형태 32에 있어서, 상기 백신 항원은 SARS-CoV-02 백신 항원, CMV 백신 항원, EBV 백신 항원, 간염 백신 항원, 단순 포진 백신 항원, 인간 면역결핍 바이러스(HIV), 백신 항원, 인간 유두종바이러스(HPV) 바이러스 항원, 인플루엔자 백신 항원, 일본 뇌염 백신 항원, 말라리아 백신 항원, 홍역 백신 항원, 광견병 백신 항원, 호흡기 세포융합 백신 항원, 로타바이러스 백신 항원, 수두 대상포진 백신 항원 또는 지카 백신 항원을 포함하는, EEC.
34. 실시형태 1 내지 26 중 임의의 것에 있어서, 상기 코딩 서열은 사이토카인을 인코딩하는, EEC.
35. 실시형태 1 내지 26 중 임의의 것에 있어서, 상기 코딩 서열은 세포-침투 단백질을 인코딩하는, EEC.
36. 실시형태 35에 있어서, 상기 세포-침투 단백질은 페네트라틴, TAT의 최소 도메인, VP22, ZEBRA, 멜리틴, 마스토포란, 마우로칼신, 크로타민, 부포린, 폴리-아르기닌, 또는 트랜스포탄을 포함하는, EEC.
37. 실시형태 1 내지 36 중 임의의 것에 있어서, 상기 EEC는 변형된 뉴클레오사이드를 포함하지 않는, EEC.
38. 실시형태 1 내지 37 중 임의의 것에 있어서, 상기 EEC는 마이크로RNA 결합 부위를 포함하지 않는, EEC.
39. 실시형태 1 내지 38 중 임의의 것에 있어서, 상기 코딩 서열은 면역 회피 인자를 인코딩하는, EEC.
40. 실시형태 40에 있어서, 상기 면역 회피 인자는 B18R, E3, K3, NS1 또는 ORF8을 포함하는, EEC.
41. 실시형태 1 내지 38 중 임의의 것에 있어서, 상기 EEC는 면역 회피 인자를 포함하지 않는, EEC.
42. 실시형태 1 내지 41 중 임의의 것에 있어서, 대상체에 대한 투여용으로 제형화된, EEC.
43. 서열번호 38에 제시된 서열을 포함하는 5' 비번역 영역(UTR) 및 서열번호 13, 14 또는 15에 제시된 서열을 포함하는 3' UTR에 작동 가능하게 연결된 코딩 서열을 갖는 조작된 발현 작제물(EEC).
44. CAUACUCA에 제시된 서열을 포함하는, 인핸서 서열.
45. CAUACUCA에 제시된 서열의 1, 2, 3, 4 또는 5개 복사체를 갖는, 조작된 발현 작제물(EEC).
46. 실시형태 44에 있어서, 상기 인핸서 서열은 프로모터에 작동 가능하게 연결된, EEC.
47. 실시형태 46에 있어서, 상기 프로모터는 최소 프로모터인, EEC.
48. 포유동물 세포에서 번역을 위한 단백질을 인코딩하는 오픈 리딩 프레임(open reading frame) 내에 코딩 서열을 포함하는 시험관내-합성된 RNA를 포함하는 조작된 발현 작제물로서, 상기 시험관내-합성된 RNA는 CAUACUCA를 포함하는 5' 비번역 영역 및 서열번호 4, 5, 6 또는 7 중 하나를 포함하는 3' 비번역 영역 중 하나를 추가로 포함하는, 조작된 발현 작제물.
49. 포유동물 세포에서 번역을 위한 단백질을 인코딩하는 오픈 리딩 프레임 내에 코딩 서열을 포함하는 시험관내-합성된 RNA를 포함하는 조작된 발현 작제물로서, 상기 시험관내-합성된 RNA는 서열번호 2 또는 서열번호 3을 포함하는 5' 비번역 영역 및 서열번호 4, 5, 6 또는 7을 포함하는 3' 비번역 영역 중 하나를 추가로 포함하는, 조작된 발현 작제물.
50. 포유동물 세포에서 번역을 위한 단백질을 인코딩하는 오픈 리딩 프레임을 포함하는 시험관내-합성된 RNA를 포함하는 조작된 발현 작제물로서, 상기 시험관내-합성된 RNA는 T7 폴리머라제 프로모터, CAUACUCA에 제시된 서열, 및 Kozak 서열을 포함하는 5' 비번역 영역을 추가로 포함하는, 조작된 발현 작제물.
51. 실시형태 1 내지 42 중 임의의 것에 있어서, 상기 T7 프로모터는 T7 클래스 III 프로모터로부터 선택되는, 조작된 발현 작제물.
52. 포유동물 세포에서 번역을 위한 단백질을 인코딩하는 오픈 리딩 프레임을 포함하는 시험관내-합성된 RNA를 포함하는 조작된 발현 작제물로서, 상기 시험관내-합성된 RNA는 서열번호 4, 5, 6 또는 7 및 정지 코돈을 포함하는 3' 비번역 영역을 포함하는, 조작된 발현 작제물.
53. 실시형태 52에 있어서, 상기 정지 코돈은 UAA, UAG, 또는 UGA인, 조작된 발현 작제물.
54. 포유동물 세포에서 번역을 위한 단백질을 인코딩하는 오픈 리딩 프레임을 포함하는 시험관내-합성된 RNA를 포함하는 조작된 발현 작제물로서, 상기 시험관내-합성된 RNA는 a) CCUC 및 GAGG 또는 b) GAGG 및 CCUC를 포함하는 3' 비번역 영역을 포함하되, 상기 3' 비번역 영역 서열 중 어느 하나의 세트는 7개 이상의 뉴클레오타이드에 의해 분리되는, 조작된 발현 작제물.
55. 포유동물 세포에서 번역을 위한 단백질을 인코딩하는 오픈 리딩 프레임을 포함하는 시험관내-합성된 RNA를 포함하는 조작된 발현 작제물(EEC)로서, 상기 시험관내-합성된 RNA는 a) AAACCUC 및 GAGG 또는 b) AAAGAGG 및 CCUC 중 어느 하나를 포함하는 3' 비번역 영역을 포함하되, 상기 3' 비번역 영역 서열 중 어느 하나의 세트는 7개 이상의 뉴클레오타이드에 의해 분리되는, 조작된 발현 작제물(EEC).
56. 최소 프로모터와 Kozak 서열 사이에 있는 CAUACUCA에 제시된 서열을 포함하는, 5' 비번역 영역(UTR).
57. 실시형태 56에 있어서, 상기 최소 프로모터는 T7 프로모터인, 5' UTR.
58. 실시형태 57에 있어서, 상기 T7 프로모터는 GGGAGA에 제시된 서열을 갖는, 5' UTR.
59. 실시형태 56 내지 58 중 임의의 것에 있어서, 상기 Kozak 서열은 GCCRCCAUG에 제시된 서열을 가지며, 여기서, R은 아데노신 또는 구아닌인, 5' UTR.
60. 실시형태 56 내지 59 중 임의의 것에 있어서, 상기 개시 코돈에 작동 가능하게 연결된 서열번호 2에 제시된 서열을 포함하는, 5' UTR.
61. 실시형태 56 내지 60 중 임의의 것에 있어서, 상기 개시 코돈에 작동 가능하게 연결된 서열번호 3에 제시된 서열을 포함하는, 5' UTR.
62. 실시형태 60에 있어서, 상기 개시 코돈에 작동 가능하게 연결된 서열번호 2에 제시된 서열은 서열번호 38에 제시된 서열을 갖는, 5' UTR.
63. 실시형태 61에 있어서, 상기 개시 코돈에 작동 가능하게 연결된 서열번호 3에 제시된 서열은 서열번호 39에 제시된 서열을 갖는, 5' UTR.
64. 실시형태 56 내지 63 중 임의의 것에 있어서, 상기 5' UTR은 30개 미만의 뉴클레오타이드인, 5' UTR.
65. 스페이서 및 정지 코돈에 작동 가능하게 연결된 스템 루프 구조를 포함하는 3' UTR로서, 상기 정지 코돈은 서열 UAA, UGA 또는 UAG를 가지며, 상기 스페이서는 서열 [N1-3]AUA 또는 [N1-3]AAA을 갖는, 3' UTR.
66. 실시형태 65에 있어서, 상기 스페이서는 서열 UGCAUA 또는 UGCAAA를 갖는, 3' UTR.
67. 실시형태 65 또는 66에 있어서, 상기 스템 루프 구조는 CCUC 및 GAGG에 제시된 하이브리드화 서열을 포함하는, 3' UTR.
68. 실시형태 65 내지 67 중 임의의 것에 있어서, 상기 스템 루프 구조는 AAACCUC 및 GAGG에 제시된 또는 AAAGAGG 및 CCUC에 제시된 하이브리드화 서열을 포함하는, 3' UTR.
69. 실시형태 65 내지 68 중 임의의 것에 있어서, 상기 스템 루프 구조는 적어도 7개의 뉴클레오타이드를 갖는 루프 세그먼트를 갖는, 3' UTR.
70. 실시형태 65 내지 69 중 임의의 것에 있어서, 상기 스템 루프 구조는 7 내지 15개의 뉴클레오타이드를 갖는 루프 세그먼트를 갖는, 3' UTR.
71. 실시형태 65 내지 70 중 임의의 것에 있어서, 상기 스템 루프 구조는 UAACGGUCUU(서열번호 34)에 제시된 서열을 갖는 루프 세그먼트를 갖는, 3' UTR.
72. 실시형태 65 내지 71 중 임의의 것에 있어서, 상기 3' UTR은 30개 미만의 뉴클레오타이드인, 3' UTR.
73. 실시형태 65 내지 72 중 임의의 것에 있어서, 상기 3' UTR은 폴리아데닌(폴리A) 꼬리를 추가로 포함하는, 3' UTR.
74. 실시형태 73에 있어서, 상기 폴리A 꼬리는 60개 이하의 잔기를 갖는, 3' UTR.
75. 실시형태 73 또는 74에 있어서, 상기 폴리A 꼬리는 40개의 잔기를 갖는, 3' UTR.
76. 실시형태 65 내지 75 중 임의의 것에 있어서, 상기 3' UTR은 서열번호 4, 5, 6, 7, 8 또는 9에 제시된 서열을 갖는, 3' UTR.
77. 실시형태 65 내지 75 중 임의의 것에 있어서, 상기 3' UTR은 서열번호 10, 11 또는 12에 제시된 서열을 갖는, 3' UTR.
78. 실시형태 65 내지 77 중 임의의 것에 있어서, 상기 3' UTR은 서열번호 13, 14, 15, 16, 17, 18, 19, 20 또는 21에 제시된 서열을 갖는, 3' UTR.
79. 실시형태 65 내지 78 중 임의의 것에 있어서, 상기 3' UTR은 코딩 서열에 작동 가능하게 연결된, 3' UTR.
80. 실시형태 79에 있어서, 상기 코딩 서열은 치료용 단백질, 백신 항원, 사이토카인, 또는 형광 단백질을 인코딩하는, 3' UTR.
81. 실시형태 79 또는 80에 있어서, 상기 코딩 서열은 면역 회피 인자를 인코딩하는, 3' UTR.
82. 실시형태 81에 있어서, 상기 면역 회피 인자는 B18R, E3, K3, NS1 또는 ORF8을 포함하는, 3' UTR.
83. 실시형태 79 내지 80 중 임의의 것에 있어서, 상기 코딩 서열은 면역 회피 인자를 포함하지 않는, 3' UTR.
84. 실시형태 79 내지 83 중 임의의 것에 있어서, 상기 코딩 서열은 세포-침투 단백질을 인코딩하는, 3' UTR.
85. 실시형태 84에 있어서, 상기 세포-침투 단백질은 페네트라틴, TAT의 최소 도메인, VP22, ZEBRA, 멜리틴, 마스토포란, 마우로칼신, 크로타민, 부포린, 폴리-아르기닌, 또는 트랜스포탄을 포함하는, 3' UTR.
86. 본 명세서에 개시된 바와 같은 5' UTR 및/또는 3' UTR.
87. 코딩 서열에 작동 가능하게 연결된 본 명세서에 개시된 바와 같은 5' UTR 및/또는 3' UTR.
실험예. 실시예 1. 재료 및 방법. UTR 설계 및 구조 예측. 4개 내지 10개의 뉴클레오타이드 길이인 최소 전사 및 번역 요소(예를 들어, 모두 본 명세서에 기재된 독특한 5' UTR 인핸서, T7 헥사머 및 Kozak 서열)를 어셈블링하여 본 개시내용의 UTR을 구성하였다. 스템 루프 특징에 기초하여, 시험을 위해 합성 3' 서열을 어셈블링하였다. 2차 구조 예측 웹서버(ma.urmc.rochester.edu/RNAstructureWeb/)를 디폴트 파라미터와 함께 이용하여 다양한 UTR 서열로부터 스템 루프 2차 구조가 형성될 가능성을 조사하였다.
[표 1]
mRNA 합성. Integrated DNA Technologies Inc.(IDT)로부터의 DNA 단편을 폴리머라제 연쇄 반응(PCR)에서 사용하여 표 1에 제시된 올리고뉴클레오타이드에 의해 T7 프로모터, UTR, 및 폴리아데노신(40개의 아데노신) 서열을 작제하였다. 이어서, 주형을 T7 RNA 폴리머라제, 항-역전 캡 유사체(ARCA)와의 전사 반응에서 사용하여 mRNA를 합성하였다(HiScribe™ T7 ARCA mRNA Kit, NEB). 이에 따라, DNase I 처리 후, mRNA를 정량화 및 저장하였다.
세포 배양. HEK293(ATCC® CRL-1573™), Jurkat, 클론 E6-1(ATCC® TIB-152™) 및 Raji(ATCC® CCL-86™) 세포를 ATCC(American Type Culture Collection)로부터 입수하였다. 모든 세포를 5% CO2와 함께 37℃에서 유지시켰다. HEK293 배지는 10% 우태아 혈청(FBS)을 갖는 이글 최소 필수 배지(Eagle's Minimum Essential Medium; EMEM)(ATCC® 30-2003™)를 포함한다. Jurkat 및 Raji 세포를 10% FBS가 보충된 RPMI-1640 배지(ATCC® 30-2001™)에서 유지시켰다. Expi293™ 발현 시스템 키트(ThermoFisher)를 제조사의 지침에 따라 사용하였다.
트랜스펙션 및 전기천공. 최적의 트랜스펙션 파라미터를 위해, 전장 UTR을 포함하는 증가하는 수준의 EEC로 세포를 트랜스펙션시켰다. 비교 연구를 위해, HEK293 세포를 MessengerMax 리포펙타민(Thermo Fisher Scientific, Inc.)과 혼합된 0.4 내지 1 피코몰의 mRNA로 트랜스펙션시켰다. Jurkat 및 Raji 세포를 jetMessenger(PolyPlus)와 혼합된 0 내지 16 pmol의 GFP-인코딩 EEC로 트랜스펙션시켰다. 전기천공을 위해, Neon Transfection System(Thermo Fisher Scientific, Inc.)을 제조사의 매뉴얼에 따라 사용하였다. 최적의 전기천공 파라미터(전압, 지속기간 및 펄스 수)에 대해 데이터베이스를 참조하였다.
유세포분석. 세포를 4% 파라포름알데히드로 30 내지 60분 동안 고정시키고, 포스페이트 완충된 염수(PBS)에 저장하였다. hOCT3/4 염색을 위해, 세포를 침투시키고, 항체(BioLegend)와 함께 인큐베이션하고, 2회 세척하고, 사용할 때까지 PBS에 저장하였다. 세포를 FACSCalibur(BD) 및 CytoFlex(Beckman Coulter) 유세포 분석기에서 분석하고, FlowJo 소프트웨어에서 분석하였다.
ELISA. 트랜스펙션 24시간 후, 세포 배지를 수집하고, 회전시키고, 이에 따라 희석하였다. 인간 IL2 ELISA(BioLegend)를 사용하여 제조사의 프로토콜에 따라 발현을 정량하였다. 간략하게, 플레이트(Costar)를 포획 항체로 코팅한 후, 희석된 세포 배지, 검출 항체 및 아비딘-HRP와 함께 인큐베이션하였다. 흡광도(450nm)를 판독하고, 분석하였다.
실시예 2. 개시된 독특한 5' UTR 서열을 함유하는 EEC는 5' UTR 서열이 없는 것과 비교할 때 단백질 발현을 증가시켰다. 단백질 발현을 증가시키는 EEC 서열의 능력을 시험하기 위해, 리포터 단백질로서 GFP를 갖는 변형된 5' UTR 및 3' UTR 서열을 함유하는 EEC를 EXPI293 현탁액 세포(Thermo Fisher Scientific, Inc.)에 트랜스펙션시켰다. HEK293 세포주로부터 유래된 EXPI293 현탁 세포는 고단백질 발현을 위해 설계되었기 때문에, 이를 초기에 이용하였다. 실험에 사용하기 위한 적절한 양의 mRNA를 결정하기 위해, EXPI293 세포를 EXPIfectamine 트랜스펙션 시약을 사용하여 0 내지 2 피코몰(0 내지 500 ng) 범위의 증가하는 수준의 GFP-인코딩 EEC로 트랜스펙션시켰다. 24시간 후, 세포를 상기 기재된 바와 같이 유세포 분석법에 적용하였다. 이러한 실험에서, GFP 형광 신호는 세포에서 이의 단백질 수준에 비례하는 것으로 간주된다. 도 2에 도시된 바와 같이, 유세포 분석 데이터는 GFP 중간 강도가 6.0×105개 세포 당 0.4 피코몰(100 ng)의 mRNA에서 포화됨을 시사하였다.
다음으로, 세포를 다양한 5' UTR 서열을 갖는 등몰의 mRNA로 트랜스펙션시키고, 트랜스펙션 후 3시간 및 24시간 시점에 GFP 발현을 분석하였다. 다양한 5' UTR 서열은 Kozak 공통 서열(M3)을 갖는 (M1)(T7 프로모터); (M1, M2((CAUACUCA), 및 M3)이거나, 5' 메틸 캡 및 T7 헥사머를 너머, 임의의 추가적인 5' UTR 없는 것이다. 중요하게는, 모든 작제물은 5' 메틸 캡 및 T7 육량체를 함유한다. 도 3a 및 도 3b는 이러한 실험의 결과를 도시한다. 여기서, 도 3a 및 도 3b는 트랜스펙션 3시간 후(도 3a) 및 트랜스펙션 24시간 후(도 3b)에 GFP-인코딩 EEC 5' UTR 변이체에 대해 x-축에 GFP 강도(FL1-H) 및 y-축에 세포 수를 나타내는 유세포 분석 그래프뿐만 아니라 데이터를 도시한 막대 그래프를 도시한다. 예상대로, UTR을 함유하지 않는 전사체로 트랜스펙션된 세포(T7 헥사머 GGGAGA만을 함유하는 작제물)는 트랜스펙션 후 모든 시점에서 GFP 신호의 가장 낮은 중간 강도를 나타내었다(도 3a, 3b). R 위치에 A를 갖는 Kozak 공통 서열의 첨가는 단백질 발현을 200%만큼 증가시킨 반면, 독특한 번역 인핸서(CAUACUCA)의 추가 첨가는 5' UTR 전사체로 처리되지 않은 세포에서 검출된 GFP 신호를 초과하게, GFP 발현을 3시간 및 24시간 시점에 각각 635% 및 240%로 증가시켰다.
따라서, 이러한 실험은 독특하고 조작된 5' UTR, 특히 독특한 번역 인핸서를 보유하는 것들이 단백질 발현을 극적으로 증가시키는데 결정적이었다는 것을 입증한다.
실시예 3. 다양한 5' UTR 서열과 함께 EEC에 독특한 3' UTR 서열을 포함시키면 단백질 발현이 증가하였다. 다음으로, GFP 발현에 대한 독특한 3' UTR의 첨가 효과를 조사하였다. 이러한 실험의 결과는 도 4a 및 도 4b에 도시되어 있다. 도 4a 및 도 4b는 트랜스펙션 3시간 후(도 4a) 및 트랜스펙션 24시간 후(도 4b)에 5' UTR 및 3' UTR 변이체를 함유하는 GFP-인코딩 EEC에 대한 x-축에 GFP 강도(FL1-H) 및 y-축에 세포 수를 나타내는 유세포 분석 그래프뿐만 아니라 데이터를 도시하는 막대 그래프를 도시한다. EXPI293 세포를 등몰량의 GFP-인코딩 EEC 5' UTR 및 3' UTR 변이체, RNA 없음(음성 대조군) 3' UTR 단독 mRNA(5' UTR 없음), M3 단독 5' UTR + 3' UTR, 및 M1, M2 및 M3 5' UTR + 3' UTR로 트랜스펙션시켰다. 도 4a 및 도 4b에서 알 수 있는 바와 같이, 3' UTR만을 함유하는 전사체로 트랜스펙션된 세포는 조사된 모든 시점에서 낮은 수준의 GFP 발현을 나타내었다. 3' UTR과 함께 Kozak 공통 서열의 첨가는 GFP 중간 강도의 완만한 증가를 초래한다. 그러나, 3' UTR(서열번호 10)과 함께 전장 5'(서열번호 2) UTR의 첨가는 각각 3시간 및 24시간 시점에서 GFP 발현을 660% 및 925%만큼 증가시켰다. 전장 5'(서열번호 2) UTR만을 함유하는 전사체로 처리된 세포와 비교할 때, 3'(서열번호 10) UTR의 첨가는 GFP 신호를 137%만큼 추가로 증가시켰다. 중요하게는, 전장 5'(서열번호 2) + 3'(서열번호 10) UTR을 갖는 mRNA를 수용하는 세포는 가장 높은 GFP 강도를 나타내었다.
따라서, 이러한 실험은 요망되는 경우, 단백질 발현 수준을 추가로 증가시키기 위해 mRNA에 본 발명의 3' 스템 루프를 포함시키는 것의 중요성을 입증한다.
실시예 4. 독특한 5' UTR 및 3' UTR 서열을 갖는 EEC는 다양한 단백질 타입을 사용하여 단백질 발현을 증가시켰다. 조작된 UTR이 다양한 단백질의 발현을 증가시키는데 유용하다는 것을 보장하기 위해, 독특한 특성을 갖는 단백질을 코딩하는데 이들의 우수성이 입증되었다. 도 5는 본 명세서에 개시된 EEC에서 시험된 3개의 상이한 타입의 단백질을 예시한다: 세포질(GFP), 소기관(즉, 핵 구획; 여기서, 인간 POU5F1 또는 OCT3/4) 및 세포외 구획(즉, 분비 단백질; 여기서, IL2)에서 단백질의 표적화된 발현. 독특한 5' UTR 및 3' UTR 서열이 세포질 단백질 발현(GFP)의 발현에 어떻게 영향을 미치는지 조사하기 위해, 실시예 2 및 3; 도 3a 내지 도 4b가 참조된다.
줄기 세포 재프로그래밍에서 핵심 핵 전사 인자인 인간 POU5F1 또는 OCT3/4(본 명세서에서 hOCT4)(Yu et al., Induced pluripotent stem cell lines based from human somatic cells. Science(80). (2007), doi:10.1126/science.1151526)를 이용하여 소기관-결합된 단백질의 발현에 대한 본 발명의 UTR의 효과를 결정하였다. GFP와 유사하게, 증가하는 양(0 내지 4.8 pmol)의 hOCT4-인코딩 mRNA로 HEK293 세포를 처리하면 24시간 후에 세포 내에서 이의 단백질 수준이 상승하였다(도 11a 및 도 11c). hOCT4+ 세포의 백분율은 2.0×105개 세포 당 1.2 pmol의 mRNA에서 최대치(75%)에 도달하였다. 5' 및 3' 변이체를 갖는 등몰 hOCT4 전사체로 HEK293 세포를 트랜스펙션시킴으로써, 전장 5'(서열번호 2) + 3'(서열번호 10) UTR을 갖는 것들만이 상당한 백분율의 hOCT4+ 세포(40%)를 나타내었다. 또한, 중간 {실험 횟수 = 2} hOCT4 강도는 전장 5'(서열번호 2) + 3'(서열번호 10) UTR을 갖는 hOCT4 mRNA로 처리된 그러한 세포에서 4배 더 높았다(도 11a, 11b).
마지막으로, 분비 단백질, 인간 인터루킨-2(hIL2)의 발현에 대한 본 발명의 UTR의 효과를 조사하였다. hIL2는 T 림프구를 활성화시키고, 현재 자가면역 장애 및 암에서 치료 표적이다(Spolski, Li, & Leonard, Biology and regulation of IL-2: from molecular mechanisms to human therapy. Nat. Rev. Immunol. (2018), doi:10.1038/s41577-018-0046-y). 상기 실험과 유사하게, HEK293 세포를 증가하는 수준의 hIL2-인코딩 mRNA(전장 5'(서열번호 2) 및 3'(서열번호 10) UTR 포함)로 트랜스펙션시켰다. hIL2 단백질 수준의 비례적인 증가는 트랜스펙션 24시간 후에 ELISA에 의해 관찰되었다(도 11a). 추가로, UTR 변이체로 hIL2 mRNA의 트랜스펙션은 전장 5'(서열번호 2) 및 3'(서열번호 10) UTR이 둘 다 존재할 때 관찰된 최고 수준으로 hIL2 단백질의 발현을 초래하였다(도 11b).
따라서, 이러한 실험은 본 발명의 조작된 UTR 둘 다를 보유하는 mRNA가 다양한 단백질 타입을 사용하여 단백질 발현을 증가시키는데 유리하다는 것을 보여주었다.
실시예 5. 본 발명의 5' UTR 및 3' UTR 서열을 갖는 EEC는 다양한 세포 타입에서 단백질 발현을 증가시켰다.
단백질 발현의 증가가 다른 세포 타입에서 복제될 수 있는지 여부를 조사하기 위해, 상기 실험을 하기 세포주에서 반복하였다: HEK293(ATCC® CRL1573TM), Jurkat(클론 E6-1; ATCC® TIB-152) 및 Raji(ATCC® CCL-86) 림프구. 부착성 HEK293 세포는 아데노바이러스 타입 5 DNA의 전단 단편으로 형질전환된 인간 배아 신장으로부터 유래된다(Graham et al., Characteristics of a human cell line transformed by DNA from human adenovirus type 5. J. Gen. Virol. (1977), doi:10.1099/0022-1317-36-1-59). 시딩된 HEK293 세포를 5'(서열번호 2) 및 3'(서열번호 10) UTR 둘 다를 함유하는 증가하는 양의 새로운 로트의 GFP-인코딩 EEC로 처리하였다. 이러한 실험을 실시예 1에 기재된 바와 같이 MessengerMax 리포펙타민 시약(ThermoFisher)을 사용하여 mRNA 트랜스펙션으로서 수행하였다. 도 6a, 도 6b, 및 도 6c에 도시된 바와 같이, 세포의 거의 90%가 1 피코몰(250 ng)의 GFP-인코딩 EEC에서 신호 포화도를 갖는 GFP 신호를 나타내었다. 더 많은 양의 mRNA로 세포의 처리는 GFP 양성 세포의 백분율을 단지 약간 증가시켰다. 단백질 발현의 양을 나타내는 중앙 GFP 강도의 측면에서, 포화는 2 pmol(500 ng)에 도달하였다.
후속하여, HEK293 세포를 개시된 5'(서열번호 2) 및 3'(서열번호 10) UTR을 함유하는 0.4 내지 1 pmol의 다양한 EEC로 처리하였다(도 7a 및 도 7b). 모든 mRNA 변이체가 세포의 60 내지 80%에서 GFP의 발현을 유도한 반면, 전장 UTR로 처리된 세포만이 다른 것과 비교하여 GFP 중간 강도의 5배를 나타내었다(도 7c). 중간 강도는 2회의 실험으로부터 계산되었다.
다음으로, 림프구 라인, Jurkat 및 Raji에서 상기 실험을 반복하였다. Jurkat은 급성 T 세포 백혈병을 갖는 14세 소년의 말초 혈액으로부터 확립된 T 림프구이다(Schneider, Schwenk, & Bornkamm, Characterization of EBV-genome negative "null" and "T" cell lines derived from children with acute lymphoblastic leukemia and leukemic transformed non-Hodgkin lymphoma. Int. J. Cancer (1977), doi:10.1002/ijc.2910190505). Raji 세포는 버킷 림프종을 갖는 11세 남성 환자로부터의 B 림프구이다(Osunkoya, The preservation of burkitt tumor cells at middlely low temperature. Br. J. Cancer (1965), doi:10.1038/bjc.1965.87; Pulvertaft, 단기 조직 배양에 의한 나이지리아의 악성 종양 연구. J. Clin. 파톨. (1965), doi:10.1136/jcp.18.3.261). 이러한 실험에서, mRNA 트랜스펙션을 jetMessenger 시약(Polyplus-transfection®)으로 수행하였다. 90% 트랜스펙션 효율을 갖는 HEK293 세포(즉, GFP 양성 세포)와 대조적으로, Jurkat 세포의 10%만이 가장 높은 mRNA 양(16 pmol)에서 GFP 신호를 나타내었다(도 7a). 또한, 등몰의 다양한 작제물로 처리된 세포는 단지 약간의 GFP 신호를 나타내었지만, 전장 5'(서열번호 2) 및 3'(서열번호 10) UTR을 함유하는 전사체로 트랜스펙션된 세포는 가장 높은 수의 GFP 양성 세포(14%; 도 7b)를 나타내었다. Raji 세포에서 유사한 결과가 관찰된다(데이터는 제시되지 않음).
따라서, 이러한 실험은 본 발명의 조작된 UTR이 다양한 세포 타입에서 단백질 발현을 증가시키는데 도움이 된다는 것을 보여준다.
실시예 6. 트랜스펙션 방법은 본 명세서에 개시된 EEC의 단백질-발현 증가 효과에 중요하지 않았다. 트랜스펙션 방법이 본 명세서에 개시된 EEC에서 보여지는 발현-증가 효과에 중요한지 여부를 조사하기 위해, Jurkat 세포를 GFP를 인코딩하는 코딩 서열과 함께 증가하는 양의 EEC로 전기천공하였다.
전기천공은 핵산의 림프성 세포주로의 전달을 개선시키는 것으로 나타났다(Ohtani et al., Electroporation: Application to human lympboid cell lines for stable introduction of a transactivator gene of human T-cell leukemia virus type I. Nucleic Acids Res. (1989), doi:10.1093/nar/17.4.1589). 먼저, 실험에 사용된 mRNA의 최적 양을 결정하기 위해, GFP-인코딩 EEC의 양이 증가하는 Jurkat 세포에 대해, 실시예 1에 기재된 바와 같이 Neon Electroporation System(Thermo Fisher Scientific, Inc.)으로 전기천공을 수행하였다. 이는 GFP 신호의 비례적 증가를 초래하였다. 다음으로, Jurkat 세포를 UTR 변이체를 갖는 4 및 8 pmol의 GFP-인코딩 EEC로 전기천공하였다. 6 내지 8×105개 세포 당 4 pmol(1 ㎍)의 GFP-인코딩 EEC에서, 최대 10%의 세포가 전장 5'(서열번호 2) 및 3'(서열번호 10) UTR을 보유하는 mRNA로 처리된 세포에 대해 GFP 양성이었으며, 이는 가장 높은 백분율의 GFP+ 세포를 나타내는 것이다(도 9a). 8 pmol(2 ㎍)에서, Jurkat 세포의 거의 90%는 전장 5'(서열번호 2) 및 3'(서열번호 10) UTR을 보유하는 mRNA로 처리된 세포에서 GFP 양성이며, 이는 가장 높은 중앙 GFP 강도를 나타낸다(도 9b 및 도 9c). GFP 양성 세포의 수가 사용된 가장 높은 mRNA 수준에서 더 낮았다는 점을 제외하고는, Raji 세포를 사용할 때 유사한 결과가 수득되었다(도 10a, 도 10b 및 도 10c).
실시예 2, 3 및 4의 결과와 비교하여 독특한 조작된 EEC를 사용하여 실시예 7에서 유사한 수준의 단백질 발현이 관찰되었기 때문에, 트랜스펙션 방법은 EEC의 효과에 영향을 미치지 않는다.
실시예 7. 3' UTR에서 스템 루프의 서열을 역전시키는 것은 단백질 발현의 증가에 영향을 미치지 않았다. 3' UTR 서열 조성의 영향을 조사하기 위해, 단백질 발현에 대해 스템-루프 페어링을 보존하면서, 원래의 3' UTR 서열(도 13a, 3' UTR-A)을 편집하여 CCUC를 GAGG로 교환하였다(도 13a, 3' UTR-B). GFP-인코딩 EEC를 3' UTR-A 또는 3' UTR-B를 포함하도록 작제하고, HEK293 세포에서 GFP 발현에 대해 시험하였다(MessengerMax 리포펙타민으로의 트랜스펙션에 의함). 1 내지 2 pmol을 사용하여, 세포의 60 내지 70%가 GFP 발현{실험 횟수 = 2 내지 3}을 나타내었으며, 3' UTR을 함유하는 작제물들 사이에는 차이가 없었다(도 13b). 또한, GFP 중간 강도{실험 횟수 = 2 내지 3}는 또한 3' UTR-A 또는 3' UTR-B를 갖는 EEC 사이에서 유사하였다(도 13c). 또한 3' UTR-B에서 GGAG 이전의 -2 위치에서 단일 뉴클레오타이드 치환(U에서 A로)이 발생하는 추가 3' UTR을 갖는 EEC를 사용하여 GFP 발현을 조사하였다(도 13a, 3' UTR-C). 이러한 서열은 스템 영역이 스템-루프 결합 단백질(SLBP) 및 번역과의 mRNA 회합에 중요한 아데노신의 스트링이 선행하는 히스톤 스템-루프와 유사하다(Battle & Doudna, The stem-loop binding protein forms a highly stable and specific complex with the 3' stem-loop of histone mRNAs. RNA (2001), doi:10.1017/S1355838201001820; William & Marzluff, The sequence of the stem and flanking sequences at the 3' end of histone mRNA are critical determinants for the binding of the stem-loop binding protein. Nucleic Acids Res. (1995), doi:10.1093/nar/23.4.654). 3' UTR-C의 첨가는 이전의 3' UTR과 비교하여 GFP 양성 세포의 백분율을 증가시키지 않았지만, 이는 트랜스펙션된 세포에서 GFP 중간 강도를 60%만큼 증가시켰다(도 13b, 13c).
따라서, 이전 실시예에서 관찰된 바와 같이, 독특한 측면 서열을 갖는 스템 루프를 포함하는 조작된 3' UTR은 인간 세포에서 GFP 발현을 증가시킨다.
실시예 8. 독특한 5' UTR 서열을 함유하는 조작된 mRNA는 섬유모세포로 트랜스펙션될 때 변형된 뉴클레오타이드를 사용한 mRNA와 비교할 때 증가된 단백질 발현을 초래하였다.
개시된 조작된 mRNA로부터 생산된 단백질의 수준을 변형된 뉴클레오타이드(N1-메틸-슈도우리딘)를 사용한 mRNA의 수준과 비교하기 위해, 비변형된 mRNA Oct4(UO), 비변형된 mRNA MyoD-Oct4(UMD), 변형된 mRNA Oct4(PUO), 및 변형된 mRNA MyoD-Oct4(PUMD)를 포함하는, 여러 Oct4 발현 mRNA 작제물을 인간 포피 섬유모세포에 트랜스펙션시켰다. 도 14에 도시된 바와 같이, OCT4 발현은 비변형 mRNA(UO)를 사용하여 가장 컸다. 800 ng의 mRNA를 사용한 비변형된 조작된 전사체는 50.7%로 가장 높은 백분율의 OCT4-양성 세포를 생성하였다. 또한, 도 14에 도시된 바와 같이, OCT4-양성 세포의 백분율은 현재 개시된 조작된 mRNA보다 변형된 뉴클레오사이드 슈도우르딘(PUO 및 PUMD)을 사용하여 유의하게 더 낮았다(36.9% 대 50.7%). 이러한 결과는 개시된 5' 및 3' UTR이 N1-메틸-슈도우리딘과 같은 변형된 뉴클레오타이드로 제조된 전사체보다 더 높은 수준의 단백질 발현을 초래한다는 것을 보여준다.
실험예 내에서 사용된 서열에 대해서는 도 15를 참조한다.
종결 단락(closing paragraph). 당업자에 의해 이해되는 바와 같이, 본 명세서에 개시된 각각의 실시형태는 이의 특정 언급된 요소, 단계, 구성성분 또는 성분을 포함하거나, 이들로 필수적으로 구성되거나, 이들로 구성될 수 있다. 따라서, 용어 "포함하다(include)" 또는 "포함하는(including)"은 "포함하다(comprise), ~로 구성되다(consist of) 또는 ~로 필수적으로 구성된다(consist essentially of)"를 인용하는 것으로 해석되어야 한다. 본 명세서에서 사용되는 연결 어구(transition term) "포함하다(comprise 또는 comprises)"는 비제한적으로, 불특정 요소, 단계, 구성성분, 또는 성분을, 심지어 다량으로 갖고 이를 포함할 수 있는 것을 의미한다. 연결 어구 "~로 구성된"은 지정되지 않은 임의의 요소, 단계, 구성성분 또는 성분을 배제한다. 연결 어구 "~로 필수적으로 구성된"은 실시형태의 범위를 명시된 요소, 단계, 구성성분 또는 성분으로 제한하고 실시형태에 실질적으로 영향을 미치지 않는 것들로 제한한다. 본 명세서에서 사용되는 물질 효과는 5' UTR에서 서열번호 2 및 3' UTR에서 서열번호 10을 함유하는 EEC로 관찰된 증가된 단백질 발현의 통계적으로 유의한 감소를 야기할 것이다.
달리 명시하지 않는 한, 명세서 및 청구범위에 사용된 모든 숫자는 모든 경우에 용어 "약"에 의해 한정되는 것으로 이해되어야 한다. 따라서, 달리 명시하지 않는 한, 명세서 및 첨부된 청구범위에 기재된 수치 파라미터는 본 발명에 의해 획득하고자 하는 요망되는 특성에 따라 달라질 수 있는 근사치이다. 최소한, 청구 범위의 범위에 대한 등가물의 교리의 적용을 제한하려는 시도가 아니라, 각각의 수치 파라미터는 적어도 보고된 유효 숫자의 수에 비추어 그리고 통상적인 반올림 기술을 적용함으로써 해석되어야 한다. 추가의 명확성이 요구될 때, 용어 "약"은 언급된 수치 또는 범위와 함께 사용될 때 당업자에 의해 합리적으로 부여된 의미를 가지며, 즉, 명시된 값의 ±20%; 명시된 값의 ±19%; 명시된 값의 ±18%; 명시된 값의 ±17%; 명시된 값의 ±16%; 명시된 값의 ±15%; 명시된 값의 ±14%; 명시된 값의 ±13%; 명시된 값의 ±12%; 명시된 값의 ±11%; 명시된 값의 ±10%; 명시된 값의 ±9%; 명시된 값의 ±8%; 명시된 값의 ±7%; 명시된 값의 ±6%; 명시된 값의 ±5%; 명시된 값의 ±4%; 명시된 값의 ±3%; 명시된 값의 ±2%; 또는 명시된 값의 ±1% 범위 이내로 언급된 값 또는 범위보다 다소 많거나 다소 적은 것을 나타낸다.
본 발명의 넓은 범위를 설명하는 수치 범위 및 파라미터가 근사치임에도 불구하고, 특정 실시예에 기재된 수치 값은 가능한 한 정확하게 보고된다. 그러나, 임의의 수치는 본질적으로 이들의 개개 시험 측정에서 발견된 표준 편차로부터 필연적으로 발생하는 특정 오차를 포함한다.
본 명세서에 개시된 단백질 및 EEC(5' 및 3' UTR 포함)의 변이체는 또한 참조 서열과 적어도 70% 서열 동일성, 80% 서열 동일성, 85% 서열 동일성, 90% 서열 동일성, 95% 서열 동일성, 96% 서열 동일성, 97% 서열 동일성, 98% 서열 동일성, 또는 99% 서열 동일성을 갖는 서열을 포함한다.
"% 서열 동일성"은 서열들을 비교함으로써 결정되는 2개 이상의 서열 사이의 관계를 지칭한다. 당 분야에서, "동일성"은 또한 이러한 서열의 스트링 사이의 매치에 의해 결정되는 바와 같이 단백질, 핵산, 또는 유전자 서열 사이의 서열 관련성의 정도를 의미한다. "동일성"(종종 "유사성"으로 지칭됨)은 문헌[Computational Molecular Biology (Lesk, A. M., ed.) Oxford University Press, NY (1988); Biocomputing: Informatics and Genome Projects (Smith, D. W., ed.) Academic Press, NY (1994); Computer Analysis of Sequence Data, Part I (Griffin, A. M., and Griffin, H. G., eds.) Humana Press, NJ (1994); Sequence Analysis in Molecular Biology (Von Heijne, G., ed.) Academic Press (1987); and Sequence Analysis Primer (Gribskov, M. and Devereux, J., eds.) Oxford University Press, NY (1992)]에 기재된 것들을 포함하는, 공지된 방법에 의해 용이하게 계산될 수 있다. 동일성을 결정하기 위한 바람직한 방법은 시험된 서열 사이에 최상의 매치를 제공하도록 설계된다. 동일성 및 유사성을 결정하는 방법은 공개적으로 이용 가능한 컴퓨터 프로그램에서 코드화된다. 서열 정렬 및 동일성 퍼센트 계산은 LASERGENE 생물정보학 컴퓨팅 스위트(DNASTAR, Inc., Madison, Wisconsin)의 Megalign 프로그램을 사용하여 수행될 수 있다. 서열의 다중 정렬은 또한 디폴트 파라미터를 갖는 Clustal 정렬 방법(Higgins and Sharp CABIOS, 5, 151-153 (1989))을 사용하여 수행될 수 있다(갭 페널티(GAP PENALTY)=10, 갭 길이 패널티(GAP LENGTH PENALTY)=10). 관련 프로그램은 또한 프로그램의 GCG 스위트(Wisconsin Package Version 9.0, Genetics Computer Group(GCG), Madison, Wisconsin); BLASTP, BLASTN, BLASTX(Altschul, et al., J. Mol. Biol. 215:403-410 (1990)); DNASTAR(DNASTAR, Inc., Madison, Wisconsin); 및 Smith-Waterman 알고리즘을 포함하는 FASTA 프로그램(Pearson, Comput. Method Genome Res., [Proc. Int. Symp.] (1994), Meeting Date 1992, 111-20. Editor(s): Suhai, Sandor. Publisher: Plenum, New York, NY)을 포함한다. 본 개시내용의 맥락에서, 서열 분석 소프트웨어가 분석에 사용되는 경우, 분석의 결과는 참조된 프로그램의 "디폴트 값"에 기반하는 것으로 이해될 것이다. 본 명세서에서 사용되는 "디폴트 값"은 처음 초기화될 때 소프트웨어와 함께 원래 로딩되는 임의의 값 또는 파라미터 세트를 의미할 것이다.
본 발명을 기술하는 맥락에서(특히 하기 청구범위의 맥락에서) 사용되는 단수 용어("a", "an", "the") 및 유사한 지시대상은 본 명세서에서 달리 명시하지 않거나 문맥상 명백히 모순되지 않는 한 단수 및 복수 둘 다를 포함하는 것으로 해석되어야 한다. 본 명세서에서 값의 범위의 언급은 단지 그러한 범위 내에 속하는 각각의 개별 값을 개별적으로 지칭하는 속기 방법으로서 역할을 하도록 의도된다. 본 명세서에서 달리 명시하지 않는 한, 각각의 개별 값은 본 명세서에서 개별적으로 인용된 것처럼 명세서에 포함된다. 본 명세서에 기재된 모든 방법은 본 명세서에 달리 명시하지 않거나 문맥상 명백히 모순되지 않는 한 임의의 적합한 순서로 수행될 수 있다. 본 명세서에 제공된 임의의 및 모든 예, 또는 예시적인 언어(예를 들어, "예를 들어")의 사용은 단지 본 발명을 더 잘 설명하기 위한 것이며 달리 청구된 본 발명의 범위를 제한하지 않는다. 명세서의 어떠한 언어도 본 발명의 실시에 필수적인 임의의 청구되지 않은 요소를 나타내는 것으로 해석되어서는 안 된다.
본 명세서에 개시된 본 발명의 대안적인 요소 또는 실시형태의 그룹화는 제한으로 해석되어서는 안 된다. 각각의 그룹 구성원은 개별적으로 또는 그룹의 다른 구성원 또는 본 명세서에서 발견된 다른 요소와 임의의 조합으로 지칭되고 청구될 수 있다. 그룹의 하나 이상의 구성원은 편의 및/또는 특허성을 이유로 그룹에 포함되거나 그룹으로부터 삭제될 수 있는 것으로 예상된다. 이러한 임의의 포함 또는 삭제가 발생하는 경우, 명세서는 변경된 바와 같은 그룹을 함유하는 것으로 간주되어 첨부된 청구범위에서 사용된 모든 마쿠쉬 그룹의 서면 설명을 충족시킨다.
본 발명을 수행하기 위해 본 발명자들에게 공지된 최상의 방식을 포함하는 본 발명의 특정 실시형태가 본 명세서에 기재된다. 물론, 이러한 기재된 실시형태의 변형은 전술한 설명을 읽을 때 당업자에게 명백해질 것이다. 본 발명자는 당업자가 이러한 변형을 적절하게 사용할 것으로 예상하고, 본 발명자는 본 발명이 본 명세서에 구체적으로 기재된 것과 달리 실시되는 것을 의도한다. 따라서, 본 발명은 적용 가능한 법에 의해 허용되는 바와 같이 본 명세서에 첨부된 청구범위에 인용된 주제의 모든 변형 및 등가물을 포함한다. 또한, 본 명세서에서 달리 명시하지 않거나 문맥상 명백히 모순되지 않는 한, 모든 가능한 변형에서 상기 기재된 요소의 임의의 조합은 본 발명에 포함된다.
또한, 본 명세서 전반에 걸쳐 간행물, 특허 및/또는 특허 출원(총괄적으로 "참고문헌")이 다수 참조되었다. 인용된 참고문헌 각각은 이들의 특정 인용된 교시를 위해 본 명세서에 개별적으로 참조에 의해 원용된다.
마지막으로, 본 명세서에 개시된 본 발명의 실시형태는 본 발명의 원리를 예시하는 것으로 이해되어야 한다. 사용될 수 있는 다른 변형은 본 발명의 범위 내에 있다. 따라서, 비제한적인 예로서, 본 발명의 대안적인 구성이 본 명세서의 교시에 따라 이용될 수 있다. 따라서, 본 발명은 정확하게 도시되고 설명된 것으로 제한되지 않는다.
본 명세서에 도시된 세부사항은 일 예로서 그리고 단지 본 발명의 바람직한 실시형태의 예시적인 논의의 목적을 위한 것이고, 본 발명의 다양한 실시형태의 원리 및 개념적 양태의 가장 유용하고 용이하게 이해되는 설명인 것으로 여겨지는 것을 제공하기 위해 제시된다. 이와 관련하여, 본 발명의 기본적인 이해에 필요한 것보다 더 상세히 본 발명의 구조적 세부사항을 나타내려는 시도는 이루어지지 않았으며, 도면 및/또는 실시예와 함께 취해진 설명은 당업자에게 본 발명의 수 개의 형태가 어떻게 실제로 구현될 수 있는 지를 명백히 한다.
본 개시에서 사용되는 정의 및 설명은 실시예에서 명확하고 모호하지 않게 수정되거나 의미의 적용이 임의의 구성을 무의미하거나 본질적으로 무의미하게 만드는 경우가 아니면 임의의 향후 구성을 조절하는 것을 의미하고 의도한다. 용어의 구성이 이를 무의미하거나 본질적으로 무의미하게 만드는 경우, 정의는 웹스터 사전(Webster's Dictionary, 3rd Edition) 또는 생화학 및 분자 생물학의 옥스포드 사전(Oxford Dictionary of Biochemistry and Molecular Biology (Ed. Anthony Smith, Oxford University Press, Oxford, 2004))과 같은 당업자에게 공지된 사전으로부터 취해져야 한다.
SEQUENCE LISTING
<110> RIBOZ, LLC
<120> ENGINEERED EXPRESSION CONSTRUCTS TO INCREASE PROTEIN EXPRESSION
FROM SYNTHETIC RIBONUCLEIC ACID (RNA)
<130> P183-0010PCT
<150> PCT/US2022/017880
<151> 2022-02-25
<150> US 63/153,877
<151> 2021-02-25
<160> 83
<170> PatentIn version 3.5
<210> 1
<400> 1
000
<210> 2
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> 5' UTR Construct with "A" Kozak Sequence (no start codon)
<400> 2
gggagacaua cucagccacc 20
<210> 3
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> 5' UTR Construct with "G" Kozak Sequence (no start codon)
<400> 3
gggagacaua cucagccgcc 20
<210> 4
<211> 29
<212> RNA
<213> Artificial Sequence
<220>
<223> 3' UTR construct
<220>
<221> misc_feature
<222> (1)..(1)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (2)..(2)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (3)..(3)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (11)..(17)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (18)..(18)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (19)..(19)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (20)..(20)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (21)..(21)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (22)..(22)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (23)..(23)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (24)..(24)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (25)..(25)
<223> n can be present or absent
<400> 4
nnnauaccuc nnnnnnnnnn nnnnngagg 29
<210> 5
<211> 29
<212> RNA
<213> Artificial Sequence
<220>
<223> 3'UTR construct
<220>
<221> misc_feature
<222> (1)..(1)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (2)..(2)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (3)..(3)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (11)..(17)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (18)..(18)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (19)..(19)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (20)..(20)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (21)..(21)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (22)..(22)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (23)..(23)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (24)..(24)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (25)..(25)
<223> n can be present or absent
<400> 5
nnnaaaccuc nnnnnnnnnn nnnnngagg 29
<210> 6
<211> 29
<212> RNA
<213> Artificial Sequence
<220>
<223> 3'UTR construct
<220>
<221> misc_feature
<222> (1)..(1)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (2)..(2)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (3)..(3)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (11)..(17)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (18)..(18)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (19)..(19)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (20)..(20)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (21)..(21)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (22)..(22)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (23)..(23)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (24)..(24)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (25)..(25)
<223> n can be present or absent
<400> 6
nnnauaggag nnnnnnnnnn nnnnncucc 29
<210> 7
<211> 29
<212> RNA
<213> Artificial Sequence
<220>
<223> 3'UTR construct
<220>
<221> misc_feature
<222> (1)..(1)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (2)..(2)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (3)..(3)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (11)..(17)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (18)..(18)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (19)..(19)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (20)..(20)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (21)..(21)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (22)..(22)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (23)..(23)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (24)..(24)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (25)..(25)
<223> n can be present or absent
<400> 7
nnnaaaggag nnnnnnnnnn nnnnncucc 29
<210> 8
<211> 28
<212> RNA
<213> Artificial Sequence
<220>
<223> 3'UTR construct
<220>
<221> misc_feature
<222> (1)..(1)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (2)..(2)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (3)..(3)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (10)..(17)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (18)..(18)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (19)..(19)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (20)..(20)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (21)..(21)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (22)..(22)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (23)..(23)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (24)..(24)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (25)..(25)
<223> n can be present or absent
<400> 8
nnnauagagn nnnnnnnnnn nnnnccuc 28
<210> 9
<211> 29
<212> RNA
<213> Artificial Sequence
<220>
<223> 3'UTR construct
<220>
<221> misc_feature
<222> (1)..(1)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (2)..(2)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (3)..(3)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (11)..(17)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (18)..(18)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (19)..(19)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (20)..(20)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (21)..(21)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (22)..(22)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (23)..(23)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (24)..(24)
<223> n can be present or absent
<220>
<221> misc_feature
<222> (25)..(25)
<223> n can be present or absent
<400> 9
nnnaaagagg nnnnnnnnnn nnnnnccuc 29
<210> 10
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<223> 3'UTR construct
<400> 10
ugcauaccuc uaacggucuu gagg 24
<210> 11
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<223> 3'UTR construct
<400> 11
ugcauaggag uaacggucuu cucc 24
<210> 12
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<223> 3'UTR construct
<400> 12
ugcaaaggag uaacggucuu cucc 24
<210> 13
<211> 27
<212> RNA
<213> Artificial Sequence
<220>
<223> 3'UTR construct
<400> 13
uaaugcauac cucuaacggu cuugagg 27
<210> 14
<211> 27
<212> RNA
<213> Artificial Sequence
<220>
<223> 3'UTR construct
<400> 14
ugaugcauac cucuaacggu cuugagg 27
<210> 15
<211> 27
<212> RNA
<213> Artificial Sequence
<220>
<223> 3'UTR construct
<400> 15
uagugcauac cucuaacggu cuugagg 27
<210> 16
<211> 27
<212> RNA
<213> Artificial Sequence
<220>
<223> 3'UTR construct
<400> 16
uaaugcauag agguaacggu cuuccuc 27
<210> 17
<211> 27
<212> RNA
<213> Artificial Sequence
<220>
<223> 3'UTR construct
<400> 17
ugaugcauag agguaacggu cuuccuc 27
<210> 18
<211> 27
<212> RNA
<213> Artificial Sequence
<220>
<223> 3'UTR construct
<400> 18
uagugcauag agguaacggu cuuccuc 27
<210> 19
<211> 27
<212> RNA
<213> Artificial Sequence
<220>
<223> 3'UTR construct
<400> 19
uaaugcaaag agguaacggu cuuccuc 27
<210> 20
<211> 27
<212> RNA
<213> Artificial Sequence
<220>
<223> 3'UTR construct
<400> 20
ugaugcaaag agguaacggu cuuccuc 27
<210> 21
<211> 27
<212> RNA
<213> Artificial Sequence
<220>
<223> 3'UTR construct
<400> 21
uagugcaaag agguaacggu cuuccuc 27
<210> 22
<400> 22
000
<210> 23
<400> 23
000
<210> 24
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Forward primer (No UTR)
<400> 24
gactcctaat acgactcact atagggagaa tg 32
<210> 25
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Forward primer (Kozak)
<400> 25
gactcctaat acgactcact atagggagag ccaccatg 38
<210> 26
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Forward primer (5'UTR)
<400> 26
gactcctaat acgactcact atagggagac atactcagcc accatg 46
<210> 27
<211> 64
<212> DNA
<213> Artificial Sequence
<220>
<223> Reverse (3'UTR-A)
<400> 27
tttttttttt tttttttttt tttttttttt tttttttttt cctcaagacc gttagaggta 60
tgca 64
<210> 28
<211> 64
<212> DNA
<213> Artificial Sequence
<220>
<223> Reverse (3'UTR-B)
<400> 28
tttttttttt tttttttttt tttttttttt tttttttttt ggagaagacc gttactccta 60
tgca 64
<210> 29
<211> 64
<212> DNA
<213> Artificial Sequence
<220>
<223> Reverse (3'UTR-C)
<400> 29
tttttttttt tttttttttt tttttttttt tttttttttt ggagaagacc gttactcctt 60
tgca 64
<210> 30
<211> 10
<212> DNA
<213> Artificial Sequence
<220>
<223> Kozak sequence
<400> 30
gccrccatgg 10
<210> 31
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> T7 promoter and hexamer
<400> 31
taatacgact cactataggg aga 23
<210> 32
<400> 32
000
<210> 33
<400> 33
000
<210> 34
<211> 10
<212> RNA
<213> Artificial Sequence
<220>
<223> Loop segment of stem loop
<400> 34
uaacggucuu 10
<210> 35
<400> 35
000
<210> 36
<400> 36
000
<210> 37
<400> 37
000
<210> 38
<211> 23
<212> RNA
<213> Artificial Sequence
<220>
<223> 5' UTR Construct with "A" Kozak Sequence (with start codon)
<400> 38
gggagacaua cucagccacc aug 23
<210> 39
<211> 23
<212> RNA
<213> Artificial Sequence
<220>
<223> 5' UTR Construct with "G" Kozak Sequence (with start codon)
<400> 39
gggagacaua cucagccgcc aug 23
<210> 40
<400> 40
000
<210> 41
<400> 41
000
<210> 42
<400> 42
000
<210> 43
<400> 43
000
<210> 44
<400> 44
000
<210> 45
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA double-helix sequence
<400> 45
taatacgact cactatag 18
<210> 46
<400> 46
000
<210> 47
<400> 47
000
<210> 48
<211> 32
<212> PRT
<213> Human immunodeficiency virus type 1
<400> 48
Val Gly Phe Pro Val Thr Pro Gln Val Pro Leu Arg Pro Met Thr Tyr
1 5 10 15
Lys Ala Ala Val Asp Leu Ser His Phe Leu Lys Glu Lys Gly Gly Leu
20 25 30
<210> 49
<211> 30
<212> PRT
<213> Artificial Sequence
<220>
<223> DNA double helix
<400> 49
His Thr Gln Gly Tyr Phe Pro Asp Trp Gln Asn Tyr Thr Pro Gly Pro
1 5 10 15
Gly Val Arg Tyr Pro Leu Thr Phe Gly Trp Leu Tyr Lys Leu
20 25 30
<210> 50
<211> 19
<212> PRT
<213> Artificial Sequence
<220>
<223> DNA double helix
<400> 50
Glu Lys Ile Arg Leu Arg Pro Gly Gly Lys Lys Lys Tyr Lys Leu Lys
1 5 10 15
His Ile Val
<210> 51
<211> 32
<212> PRT
<213> Artificial Sequence
<220>
<223> DNA double helix
<400> 51
Asn Pro Pro Ile Pro Val Gly Glu Ile Tyr Lys Arg Trp Ile Ile Leu
1 5 10 15
Gly Leu Asn Lys Ile Val Arg Met Tyr Ser Pro Thr Ser Ile Leu Asp
20 25 30
<210> 52
<211> 31
<212> PRT
<213> Artificial Sequence
<220>
<223> DNA double helix
<400> 52
Ala Ile Phe Gln Ser Ser Met Thr Lys Ile Leu Glu Pro Phe Arg Lys
1 5 10 15
Gln Asn Pro Asp Ile Val Ile Tyr Gln Tyr Met Asp Asp Leu Tyr
20 25 30
<210> 53
<211> 20
<212> PRT
<213> Plasmodium falciparum
<400> 53
Asn Ala Asn Pro Asn Ala Asn Pro Asn Ala Asn Pro Asn Ala Asn Pro
1 5 10 15
Asn Ala Asn Pro
20
<210> 54
<211> 81
<212> PRT
<213> Artificial Sequence
<220>
<223> E protein Domain III
<400> 54
Ala Phe Thr Phe Thr Lys Ile Pro Ala Glu Thr Leu His Thr Val Thr
1 5 10 15
Glu Val Gln Tyr Ala Gly Thr Asp Gly Pro Cys Lys Val Pro Ala Gln
20 25 30
Met Ala Val Asp Met Gln Thr Leu Thr Pro Val Gly Arg Leu Ile Thr
35 40 45
Ala Asn Pro Val Ile Thr Glu Gly Thr Glu Asn Ser Lys Met Met Leu
50 55 60
Glu Leu Asp Pro Pro Phe Gly Asp Ser Tyr Ile Val Ile Gly Val Gly
65 70 75 80
Glu
<210> 55
<211> 827
<212> DNA
<213> Artificial Sequence
<220>
<223> EGFP
<400> 55
gactcctaat acgactcact atagggagac atactcagcc accatggtga gcaagggcga 60
ggagctgttc accggggtgg tgcccatcct ggtcgagctg gacggcgacg taaacggcca 120
caagttcagc gtgtccggcg agggcgaggg cgatgccacc tacggcaagc tgaccctgaa 180
gttcatctgc accaccggca agctgcccgt gccctggccc accctcgtga ccaccctgac 240
ctacggcgtg cagtgcttca gccgctaccc cgaccacatg aagcagcacg acttcttcaa 300
gtccgccatg cccgaaggct acgtccagga gcgcaccatc ttcttcaagg acgacggcaa 360
ctacaagacc cgcgccgagg tgaagttcga gggcgacacc ctggtgaacc gcatcgagct 420
gaagggcatc gacttcaagg aggacggcaa catcctgggg cacaagctgg agtacaacta 480
caacagccac aacgtctata tcatggccga caagcagaag aacggcatca aggtgaactt 540
caagatccgc cacaacatcg aggacggcag cgtgcagctc gccgaccact accagcagaa 600
cacccccatc ggcgacggcc ccgtgctgct gcccgacaac cactacctga gcacccagtc 660
cgccctgagc aaagacccca acgagaagcg cgatcacatg gtcctgctgg agttcgtgac 720
cgccgccggg atcactctcg gcatggacga gctgtacaag taatgcatac ctctaacggt 780
cttgaggaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaa 827
<210> 56
<211> 804
<212> RNA
<213> Artificial Sequence
<220>
<223> EGFP
<400> 56
gggagacaua cucagccacc auggugagca agggcgagga gcuguucacc gggguggugc 60
ccauccuggu cgagcuggac ggcgacguaa acggccacaa guucagcgug uccggcgagg 120
gcgagggcga ugccaccuac ggcaagcuga cccugaaguu caucugcacc accggcaagc 180
ugcccgugcc cuggcccacc cucgugacca cccugaccua cggcgugcag ugcuucagcc 240
gcuaccccga ccacaugaag cagcacgacu ucuucaaguc cgccaugccc gaaggcuacg 300
uccaggagcg caccaucuuc uucaaggacg acggcaacua caagacccgc gccgagguga 360
aguucgaggg cgacacccug gugaaccgca ucgagcugaa gggcaucgac uucaaggagg 420
acggcaacau ccuggggcac aagcuggagu acaacuacaa cagccacaac gucuauauca 480
uggccgacaa gcagaagaac ggcaucaagg ugaacuucaa gauccgccac aacaucgagg 540
acggcagcgu gcagcucgcc gaccacuacc agcagaacac ccccaucggc gacggccccg 600
ugcugcugcc cgacaaccac uaccugagca cccaguccgc ccugagcaaa gaccccaacg 660
agaagcgcga ucacaugguc cugcuggagu ucgugaccgc cgccgggauc acucucggca 720
uggacgagcu guacaaguaa ugcauaccuc uaacggucuu gaggaaaaaa aaaaaaaaaa 780
aaaaaaaaaa aaaaaaaaaa aaaa 804
<210> 57
<211> 1190
<212> DNA
<213> Homo sapiens
<400> 57
gactcctaat acgactcact atagggagac atactcagcc accatggcgg gacacctggc 60
ttcggatttc gccttctcgc cccctccagg tggtggaggt gatgggccag gggggccgga 120
gccgggctgg gttgatcctc ggacctggct aagcttccaa ggccctcctg gagggccagg 180
aatcgggccg ggggttgggc caggctctga ggtgtggggg attcccccat gccccccgcc 240
gtatgagttc tgtgggggga tggcgtactg tgggccccag gttggagtgg ggctagtgcc 300
ccaaggcggc ttggagacct ctcagcctga gggcgaagca ggagtcgggg tggagagcaa 360
ctccgatggg gcctccccgg agccctgcac cgtcacccct ggtgccgtga agctggagaa 420
ggagaagctg gagcaaaacc cggaggagtc ccaggacatc aaagctctgc agaaagaact 480
cgagcaattt gccaagctcc tgaagcagaa gaggatcacc ctgggatata cacaggccga 540
tgtggggctc accctggggg ttctatttgg gaaggtattc agccaaacga ccatctgccg 600
ctttgaggct ctgcagctta gcttcaagaa catgtgtaag ctgcggccct tgctgcagaa 660
gtgggtggag gaagctgaca acaatgaaaa tcttcaggag atatgcaaag cagaaaccct 720
cgtgcaggcc cgaaagagaa agcgaaccag tatcgagaac cgagtgagag gcaacctgga 780
gaatttgttc ctgcagtgcc cgaaacccac actgcagcag atcagccaca tcgcccagca 840
gcttgggctc gagaaggatg tggtccgagt gtggttctgt aaccggcgcc agaagggcaa 900
gcgatcaagc agcgactatg cacaacgaga ggattttgag gctgctgggt ctcctttctc 960
agggggacca gtgtcctttc ctctggcccc agggccccat tttggtaccc caggctatgg 1020
gagccctcac ttcactgcac tgtactcctc ggtccctttc cctgaggggg aagcctttcc 1080
ccctgtctcc gtcaccactc tgggctctcc catgcattca aactgatgca tacctctaac 1140
ggtcttgagg aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1190
<210> 58
<211> 1167
<212> RNA
<213> Homo sapiens
<400> 58
gggagacaua cucagccacc auggcgggac accuggcuuc ggauuucgcc uucucgcccc 60
cuccaggugg uggaggugau gggccagggg ggccggagcc gggcuggguu gauccucgga 120
ccuggcuaag cuuccaaggc ccuccuggag ggccaggaau cgggccgggg guugggccag 180
gcucugaggu gugggggauu cccccaugcc ccccgccgua ugaguucugu ggggggaugg 240
cguacugugg gccccagguu ggaguggggc uagugcccca aggcggcuug gagaccucuc 300
agccugaggg cgaagcagga gucggggugg agagcaacuc cgauggggcc uccccggagc 360
ccugcaccgu caccccuggu gccgugaagc uggagaagga gaagcuggag caaaacccgg 420
aggaguccca ggacaucaaa gcucugcaga aagaacucga gcaauuugcc aagcuccuga 480
agcagaagag gaucacccug ggauauacac aggccgaugu ggggcucacc cuggggguuc 540
uauuugggaa gguauucagc caaacgacca ucugccgcuu ugaggcucug cagcuuagcu 600
ucaagaacau guguaagcug cggcccuugc ugcagaagug gguggaggaa gcugacaaca 660
augaaaaucu ucaggagaua ugcaaagcag aaacccucgu gcaggcccga aagagaaagc 720
gaaccaguau cgagaaccga gugagaggca accuggagaa uuuguuccug cagugcccga 780
aacccacacu gcagcagauc agccacaucg cccagcagcu ugggcucgag aaggaugugg 840
uccgagugug guucuguaac cggcgccaga agggcaagcg aucaagcagc gacuaugcac 900
aacgagagga uuuugaggcu gcugggucuc cuuucucagg gggaccagug uccuuuccuc 960
uggccccagg gccccauuuu gguaccccag gcuaugggag cccucacuuc acugcacugu 1020
acuccucggu cccuuucccu gagggggaag ccuuuccccc ugucuccguc accacucugg 1080
gcucucccau gcauucaaac ugaugcauac cucuaacggu cuugaggaaa aaaaaaaaaa 1140
aaaaaaaaaa aaaaaaaaaa aaaaaaa 1167
<210> 59
<211> 569
<212> DNA
<213> Artificial Sequence
<220>
<223> IL2 Complete DNA Sequence (with Riboz UTRs and PolyA tail)
<400> 59
gactcctaat acgactcact atagggagac atactcagcc accatgtaca ggatgcaact 60
cctgtcttgc attgcactaa gtcttgcact tgtcacaaac agtgcaccta cttcaagttc 120
tacaaagaaa acacagctac aactggagca tttactgctg gatttacaga tgattttgaa 180
tggaattaat aattacaaga atcccaaact caccaggatg ctcacattta agttttacat 240
gcccaagaag gccacagaac tgaaacatct tcagtgtcta gaagaagaac tcaaacctct 300
ggaggaagtg ctaaatttag ctcaaagcaa aaactttcac ttaagaccca gggacttaat 360
cagcaatatc aacgtaatag ttctggaact aaagggatct gaaacaacat tcatgtgtga 420
atatgctgat gagacagcaa ccattgtaga atttctgaac agatggatta ccttttgtca 480
aagcatcatc tcaacactga cttgatgcat acctctaacg gtcttgagga aaaaaaaaaa 540
aaaaaaaaaa aaaaaaaaaa aaaaaaaaa 569
<210> 60
<211> 546
<212> RNA
<213> Artificial Sequence
<220>
<223> Complete RNA Sequence (with Riboz UTRs and PolyA tail)
<400> 60
gggagacaua cucagccacc auguacagga ugcaacuccu gucuugcauu gcacuaaguc 60
uugcacuugu cacaaacagu gcaccuacuu caaguucuac aaagaaaaca cagcuacaac 120
uggagcauuu acugcuggau uuacagauga uuuugaaugg aauuaauaau uacaagaauc 180
ccaaacucac caggaugcuc acauuuaagu uuuacaugcc caagaaggcc acagaacuga 240
aacaucuuca gugucuagaa gaagaacuca aaccucugga ggaagugcua aauuuagcuc 300
aaagcaaaaa cuuucacuua agacccaggg acuuaaucag caauaucaac guaauaguuc 360
uggaacuaaa gggaucugaa acaacauuca ugugugaaua ugcugaugag acagcaacca 420
uuguagaauu ucugaacaga uggauuaccu uuugucaaag caucaucuca acacugacuu 480
gaugcauacc ucuaacgguc uugaggaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 540
aaaaaa 546
<210> 61
<400> 61
000
<210> 62
<400> 62
000
<210> 63
<211> 15
<212> RNA
<213> Artificial Sequence
<220>
<223> 5' UTR construct
<400> 63
gggagagcca ccaug 15
<210> 64
<211> 28
<212> RNA
<213> Artificial Sequence
<220>
<223> Loop segment of stem loop
<400> 64
gaugccccau ucacgaguag uggguauu 28
<210> 65
<211> 28
<212> RNA
<213> Artificial Sequence
<220>
<223> Loop segment of stem loop
<400> 65
ggcacccugc gcaggugaug caggugcc 28
<210> 66
<211> 28
<212> RNA
<213> Artificial Sequence
<220>
<223> Loop segment of stem loop
<400> 66
guucgcucgg ucaggagagc ugacggac 28
<210> 67
<211> 28
<212> RNA
<213> Artificial Sequence
<220>
<223> Loop segment of stem loop
<400> 67
ucuuacagug gcaugugacc guuuaagg 28
<210> 68
<211> 28
<212> RNA
<213> Artificial Sequence
<220>
<223> Loop segment of stem loop
<400> 68
cgcggcgcau gcacgugaca ugccugcg 28
<210> 69
<211> 28
<212> RNA
<213> Artificial Sequence
<220>
<223> Loop segment of stem loop
<400> 69
cggucccgug gcaagagucu auggauug 28
<210> 70
<211> 28
<212> RNA
<213> Artificial Sequence
<220>
<223> Loop segment of stem loop
<400> 70
auguucggcu ccaagagcga guugauau 28
<210> 71
<211> 28
<212> RNA
<213> Artificial Sequence
<220>
<223> Loop segment of stem loop
<400> 71
cgauucgggc acaugugcug ucugauug 28
<210> 72
<211> 28
<212> RNA
<213> Artificial Sequence
<220>
<223> Loop segment of stem loop
<400> 72
guauucugau gcacgugcca ucaaguac 28
<210> 73
<211> 28
<212> RNA
<213> Artificial Sequence
<220>
<223> Loop segment of stem loop
<400> 73
uugagcagga ucaagugcau ucuuucaa 28
<210> 74
<211> 28
<212> RNA
<213> Artificial Sequence
<220>
<223> Loop segment of stem loop
<400> 74
rryryyyyry yyryrrryrr yrrryryy 28
<210> 75
<211> 28
<212> RNA
<213> Artificial Sequence
<220>
<223> Loop segment of stem loop
<400> 75
rryryyyyry ryrrryrryr yrrryryy 28
<210> 76
<211> 28
<212> RNA
<213> Artificial Sequence
<220>
<223> Loop segment of stem loop
<400> 76
ryyyryyyrr yyrrrrrrry yrryrrry 28
<210> 77
<211> 28
<212> RNA
<213> Artificial Sequence
<220>
<223> Loop segment of stem loop
<400> 77
yyyyryrryr ryryryrryy ryyyrrrr 28
<210> 78
<211> 28
<212> RNA
<213> Artificial Sequence
<220>
<223> Loop segment of stem loop
<400> 78
yryrryryry ryryryrryr yryyyryr 28
<210> 79
<211> 28
<212> RNA
<213> Artificial Sequence
<220>
<223> Loop segment of stem loop
<400> 79
yrryyyyryr ryrrrrryyy ryrrryyr 28
<210> 80
<211> 28
<212> RNA
<213> Artificial Sequence
<220>
<223> Loop segment of stem loop
<400> 80
ryryyyrryy yyrrrrryrr ryyrryry 28
<210> 81
<211> 28
<212> RNA
<213> Artificial Sequence
<220>
<223> Loop segment of stem loop
<400> 81
yrryyyrrry ryryryryyr yyyrryyr 28
<210> 82
<211> 28
<212> RNA
<213> Artificial Sequence
<220>
<223> Loop segment of stem loop
<400> 82
ryryyyyrry ryryryryyr yyrrryry 28
<210> 83
<211> 28
<212> RNA
<213> Artificial Sequence
<220>
<223> Loop segment of stem loop
<400> 83
yyrrryrrrr yyrrryryry yyyyyyrr 28
Claims (85)
- 서열번호 38에 제시된 서열로 이루어진 5' 비번역 영역(UTR) 및 서열번호 13, 14 또는 15에 제시된 서열로 이루어진 3' UTR에 작동 가능하게 연결된 코딩 서열을 갖는 조작된 발현 작제물(EEC).
- 코딩 서열에 작동 가능하게 연결된 5' 비번역 영역(UTR)을 갖되, 상기 5' UTR은 최소 프로모터와 Kozak 서열 사이에 CAUACUCA에 제시된 서열을 갖는, 조작된 발현 작제물(EEC).
- 제2항에 있어서, 상기 최소 프로모터는 T7 프로모터인, EEC.
- 제3항에 있어서, 상기 T7 프로모터는 GGGAGA에 제시된 서열을 갖는, EEC.
- 제2항에 있어서, 상기 Kozak 서열은 GCCRCCAUG에 제시된 서열을 가지며, 여기서, R은 A 또는 G인, EEC.
- 제2항에 있어서, 상기 5' UTR은
(i) 개시 코돈에 작동 가능하게 연결된 서열번호 2에 제시된 서열 또는
(ii) 개시 코돈에 작동 가능하게 연결된 서열번호 3에 제시된 서열
을 갖는, EEC. - 제6항에 있어서, 상기 개시 코돈에 작동 가능하게 연결된 서열번호 2에 제시된 서열은 서열번호 38에 제시된 서열을 갖는, EEC.
- 제6항에 있어서, 상기 개시 코돈에 작동 가능하게 연결된 서열번호 3에 제시된 서열은 서열번호 39에 제시된 서열을 갖는, EEC.
- 제2항에 있어서, 상기 5' UTR은 30개 미만의 뉴클레오타이드인, EEC.
- 제2항에 있어서, 3' UTR을 추가로 포함하는, EEC.
- 제10항에 있어서, 상기 3' UTR은 스페이서, 및 정지 코돈에 작동 가능하게 연결된 스템 루프 구조를 포함하는, EEC.
- 제11항에 있어서, 상기 정지 코돈은 서열 UAA, UGA 또는 UAG를 갖는, EEC.
- 제11항에 있어서, 상기 스페이서는 서열 [N1-3]AUA 또는 [N1-3]AAA를 갖는, EEC.
- 제11항에 있어서, 상기 스페이서는 서열 UGCAUA 또는 UGCAAA를 갖는, EEC.
- 제11항에 있어서, 상기 스템 루프 구조는 CCUC 및 GAGG에 제시된 하이브리드화 서열(hybridizing sequence)을 갖는, EEC.
- 제11항에 있어서, 상기 스템 루프 구조는 AAACCUC 및 GAGG에 제시된 또는 AAAGAGG 및 CCUC에 제시된 하이브리드화 서열을 갖는, EEC.
- 제11항에 있어서, 상기 스템 루프 구조는 7개 이상의 뉴클레오타이드를 갖는 루프 세그먼트를 갖는, EEC.
- 제11항에 있어서, 상기 스템 루프 구조는 7 내지 15개의 뉴클레오타이드를 갖는 루프 세그먼트를 갖는, EEC.
- 제11항에 있어서, 상기 스템 루프 구조는 UAACGGUCUU(서열번호 34)에 제시된 서열을 갖는 루프 세그먼트를 갖는, EEC.
- 제10항에 있어서, 상기 3' UTR은 30개 미만의 뉴클레오타이드인, EEC.
- 제10항에 있어서, 상기 3' UTR은 폴리아데닌(폴리A) 꼬리를 추가로 포함하는, EEC.
- 제21항에 있어서, 상기 폴리A 꼬리는 60개 이하의 잔기를 갖는, EEC.
- 제21항에 있어서, 상기 폴리A 꼬리는 40개의 잔기를 갖는, EEC.
- 제10항에 있어서, 상기 3' UTR은 서열번호 4, 5, 6, 7, 8 또는 9에 제시된 서열을 갖는, EEC.
- 제10항에 있어서, 상기 3' UTR은 서열번호 10, 11 또는 12에 제시된 서열을 갖는, EEC.
- 제10항에 있어서, 상기 3' UTR은 서열번호 13, 14, 15, 16, 17, 18, 19, 20 또는 21에 제시된 서열을 갖는, EEC.
- 제2항에 있어서, 상기 EEC는 시험관내-합성된 메신저 RNA(mRNA)를 포함하는, EEC.
- 제2항에 있어서, 상기 코딩 서열은 녹색 형광 단백질(GFP), 인간 인터루킨-2(IL2) 또는 인간 POU5F1(또는 OCT3/4)을 인코딩하는, EEC.
- 제2항에 있어서, 서열번호 56, 58 또는 60에 제시된 서열을 갖는, EEC.
- 제2항에 있어서, 상기 코딩 서열은 치료용 단백질을 인코딩하는, EEC.
- 제30항에 있어서, 상기 치료용 단백질은 항체 또는 이의 결합 단편을 포함하는, EEC.
- 제31항에 있어서, 상기 항체 또는 이의 결합 단편은 항-SARS-Cov2 항체 또는 이의 결합 단편, 항-SARS 항체 또는 이의 결합 단편, 항-RSV 항체 또는 이의 결합 단편, 항-HIV 항체 또는 이의 결합 단편, 항-뎅기 바이러스 항체 또는 이의 결합 단편, 항-보르다텔라 백일해 항체 또는 이의 결합 단편, 항-C형 간염 항체 또는 이의 결합 단편, 항-인플루엔자 바이러스 항체 또는 이의 결합 단편, 항-파라인플루엔자 바이러스 항체 또는 이의 결합 단편, 항-메타뉴모바이러스(MPV) 항체 또는 이의 결합 단편, 항-사이토메갈로바이러스 항체 또는 이의 결합 단편, 항-엡스타인 바 바이러스 항체; 항-단순 포진 바이러스 항체 또는 이의 결합 단편, 항-클로스트리디움 디피실레 박테리아 독소 항체 또는 이의 결합 단편, 또는 항-종양 괴사 인자(TNF) 항체 또는 이의 결합 단편을 포함하는, EEC.
- 제2항에 있어서, 상기 코딩 서열은 백신 항원을 인코딩하는, EEC.
- 제33항에 있어서, 상기 백신 항원은 SARS-CoV-02 백신 항원, CMV 백신 항원, EBV 백신 항원, 간염 백신 항원, 단순 포진 백신 항원, 인간 면역결핍 바이러스(HIV), 백신 항원, 인간 유두종바이러스(HPV) 바이러스 항원, 인플루엔자 백신 항원, 일본 뇌염 백신 항원, 말라리아 백신 항원, 홍역 백신 항원, 광견병 백신 항원, 호흡기 세포융합 백신 항원, 로타바이러스 백신 항원, 수두 대상포진 백신 항원 또는 지카 백신 항원을 포함하는, EEC.
- 제2항에 있어서, 상기 코딩 서열은 사이토카인을 인코딩하는, EEC.
- 제2항에 있어서, 상기 코딩 서열은 세포-침투 단백질을 인코딩하는, EEC.
- 제36항에 있어서, 상기 세포-침투 단백질은 페네트라틴, TAT의 최소 도메인, VP22, ZEBRA, 멜리틴, 마스토포란, 마우로칼신, 크로타민, 부포린, 폴리-아르기닌, 또는 트랜스포탄을 포함하는, EEC.
- 제2항에 있어서, 상기 EEC는 변형된 뉴클레오사이드를 포함하지 않는, EEC.
- 제2항에 있어서, 상기 EEC는 마이크로RNA 결합 부위를 포함하지 않는, EEC.
- 제2항에 있어서, 상기 코딩 서열은 면역 회피 인자를 인코딩하는, EEC.
- 제41항에 있어서, 상기 면역 회피 인자는 B18R, E3, K3, NS1 또는 ORF8을 포함하는, EEC.
- 제2항에 있어서, 상기 EEC는 면역 회피 인자를 포함하지 않는, EEC.
- 제2항에 있어서, 대상체에 대한 투여용으로 제형화된, EEC.
- CAUACUCA에 제시된 서열로 이루어진, 인핸서 서열.
- CAUACUCA에 제시된 서열의 1, 2, 3, 4 또는 5개 복사체를 갖는, 조작된 발현 작제물(EEC).
- 제44항에 있어서, 상기 인핸서 서열은 프로모터에 작동 가능하게 연결된, EEC.
- 제46항에 있어서, 상기 프로모터는 최소 프로모터인, EEC.
- 포유동물 세포에서 번역을 위한 단백질을 인코딩하는 오픈 리딩 프레임(open reading frame) 내에 코딩 서열을 포함하는 시험관내-합성된 RNA를 포함하는 조작된 발현 작제물로서, 상기 시험관내-합성된 RNA는 CAUACUCA를 포함하는 5' 비번역 영역 및 서열번호 4, 5, 6 또는 7 중 하나를 포함하는 3' 비번역 영역 중 하나를 추가로 포함하는, 조작된 발현 작제물.
- 포유동물 세포에서 번역을 위한 단백질을 인코딩하는 오픈 리딩 프레임 내에 코딩 서열을 포함하는 시험관내-합성된 RNA를 포함하는 조작된 발현 작제물로서, 상기 시험관내-합성된 RNA는 서열번호 2 또는 서열번호 3을 포함하는 5' 비번역 영역 및 서열번호 4, 5, 6 또는 7을 포함하는 3' 비번역 영역 중 하나를 추가로 포함하는, 조작된 발현 작제물.
- 포유동물 세포에서 번역을 위한 단백질을 인코딩하는 오픈 리딩 프레임을 포함하는 시험관내-합성된 RNA를 포함하는 조작된 발현 작제물로서, 상기 시험관내-합성된 RNA는 T7 폴리머라제 프로모터, CAUACUCA에 제시된 서열, 및 Kozak 서열을 포함하는 5' 비번역 영역을 추가로 포함하는, 조작된 발현 작제물.
- 제2항에 있어서, 상기 T7 프로모터는 T7 클래스 III 프로모터로부터 선택되는, 조작된 발현 작제물.
- 포유동물 세포에서 번역을 위한 단백질을 인코딩하는 오픈 리딩 프레임을 포함하는 시험관내-합성된 RNA를 포함하는 조작된 발현 작제물로서, 상기 시험관내-합성된 RNA는 서열번호 4, 5, 6 또는 7 및 정지 코돈을 포함하는 3' 비번역 영역을 포함하는, 조작된 발현 작제물.
- 제52항에 있어서, 상기 정지 코돈은 UAA, UAG, 또는 UGA인, 조작된 발현 작제물.
- 포유동물 세포에서 번역을 위한 단백질을 인코딩하는 오픈 리딩 프레임을 포함하는 시험관내-합성된 RNA를 포함하는 조작된 발현 작제물로서, 상기 시험관내-합성된 RNA는 a) CCUC 및 GAGG 또는 b) GAGG 및 CCUC를 포함하는 3' 비번역 영역을 포함하되, 상기 3' 비번역 영역 서열 중 어느 하나의 세트는 7개 이상의 뉴클레오타이드에 의해 분리되는, 조작된 발현 작제물.
- 포유동물 세포에서 번역을 위한 단백질을 인코딩하는 오픈 리딩 프레임을 포함하는 시험관내-합성된 RNA를 포함하는 조작된 발현 작제물(EEC)로서, 상기 시험관내-합성된 RNA는 a) AAACCUC 및 GAGG 또는 b) AAAGAGG 및 CCUC 중 어느 하나를 포함하는 3' 비번역 영역을 포함하되, 상기 3' 비번역 영역 서열 중 어느 하나의 세트는 7개 이상의 뉴클레오타이드에 의해 분리되는, 조작된 발현 작제물(EEC).
- 최소 프로모터와 Kozak 서열 사이에 있는 CAUACUCA에 제시된 서열을 포함하는, 5' 비번역 영역(UTR).
- 제56항에 있어서, 상기 최소 프로모터는 T7 프로모터인, 5' UTR.
- 제57항에 있어서, 상기 T7 프로모터는 GGGAGA에 제시된 서열을 갖는, 5' UTR.
- 제56항에 있어서, 상기 Kozak 서열은 GCCRCCAUG에 제시된 서열을 가지며, 여기서, R은 아데노신 또는 구아닌인, 5' UTR.
- 제56항에 있어서, 상기 개시 코돈에 작동 가능하게 연결된 서열번호 2에 제시된 서열을 포함하는, 5' UTR.
- 제56항에 있어서, 상기 개시 코돈에 작동 가능하게 연결된 서열번호 3에 제시된 서열을 포함하는, 5' UTR.
- 제60항에 있어서, 상기 개시 코돈에 작동 가능하게 연결된 서열번호 2에 제시된 서열은 서열번호 38에 제시된 서열을 갖는, 5' UTR.
- 제61항에 있어서, 상기 개시 코돈에 작동 가능하게 연결된 서열번호 3에 제시된 서열은 서열번호 39에 제시된 서열을 갖는, 5' UTR.
- 제56항에 있어서, 상기 5' UTR은 30개 미만의 뉴클레오타이드인, 5' UTR.
- 스페이서 및 정지 코돈에 작동 가능하게 연결된 스템 루프 구조를 포함하는 3' UTR로서, 상기 정지 코돈은 서열 UAA, UGA 또는 UAG를 가지며, 상기 스페이서는 서열 [N1-3]AUA 또는 [N1-3]AAA을 갖는, 3' UTR.
- 제65항에 있어서, 상기 스페이서는 서열 UGCAUA 또는 UGCAAA를 갖는, 3' UTR.
- 제65항에 있어서, 상기 스템 루프 구조는 CCUC 및 GAGG에 제시된 하이브리드화 서열을 포함하는, 3' UTR.
- 제65항에 있어서, 상기 스템 루프 구조는 AAACCUC 및 GAGG에 제시된 또는 AAAGAGG 및 CCUC에 제시된 하이브리드화 서열을 포함하는, 3' UTR.
- 제65항에 있어서, 상기 스템 루프 구조는 적어도 7개의 뉴클레오타이드를 갖는 루프 세그먼트를 갖는, 3' UTR.
- 제65항에 있어서, 상기 스템 루프 구조는 7 내지 15개의 뉴클레오타이드를 갖는 루프 세그먼트를 갖는, 3' UTR.
- 제65항에 있어서, 상기 스템 루프 구조는 UAACGGUCUU(서열번호 34)에 제시된 서열을 갖는 루프 세그먼트를 갖는, 3' UTR.
- 제65항에 있어서, 상기 3' UTR은 30개 미만의 뉴클레오타이드인, 3' UTR.
- 제65항에 있어서, 상기 3' UTR은 폴리아데닌(폴리A) 꼬리를 추가로 포함하는, 3' UTR.
- 제73항에 있어서, 상기 폴리A 꼬리는 60개 이하의 잔기를 갖는, 3' UTR.
- 제73항에 있어서, 상기 폴리A 꼬리는 40개의 잔기를 갖는, 3' UTR.
- 제65항에 있어서, 상기 3' UTR은 서열번호 4, 5, 6, 7, 8 또는 9에 제시된 서열을 갖는, 3' UTR.
- 제65항에 있어서, 상기 3' UTR은 서열번호 10, 11 또는 12에 제시된 서열을 갖는, 3' UTR.
- 제65항에 있어서, 상기 3' UTR은 서열번호 13, 14, 15, 16, 17, 18, 19, 20 또는 21에 제시된 서열을 갖는, 3' UTR.
- 제65항에 있어서, 상기 3' UTR은 코딩 서열에 작동 가능하게 연결된, 3' UTR.
- 제79항에 있어서, 상기 코딩 서열은 치료용 단백질, 백신 항원, 사이토카인, 또는 형광 단백질을 인코딩하는, 3' UTR.
- 제79항에 있어서, 상기 코딩 서열은 면역 회피 인자를 인코딩하는, 3' UTR.
- 제81항에 있어서, 상기 면역 회피 인자는 B18R, E3, K3, NS1 또는 ORF8을 포함하는, 3' UTR.
- 제79항에 있어서, 상기 코딩 서열은 면역 회피 인자를 포함하지 않는, 3' UTR.
- 제79항에 있어서, 상기 코딩 서열은 세포-침투 단백질을 인코딩하는, 3' UTR.
- 제84항에 있어서, 상기 세포-침투 단백질은 페네트라틴, TAT의 최소 도메인, VP22, ZEBRA, 멜리틴, 마스토포란, 마우로칼신, 크로타민, 부포린, 폴리-아르기닌, 또는 트랜스포탄을 포함하는, 3' UTR.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163153877P | 2021-02-25 | 2021-02-25 | |
US63/153,877 | 2021-02-25 | ||
PCT/US2022/017880 WO2022182976A1 (en) | 2021-02-25 | 2022-02-25 | Engineered expression constructs to increase protein expression from synthetic ribonucleic acid (rna) |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230153418A true KR20230153418A (ko) | 2023-11-06 |
Family
ID=83049540
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237032938A KR20230153418A (ko) | 2021-02-25 | 2022-02-25 | 합성 리보핵산(rna)으로부터 단백질 발현을 증가시키기 위한 조작된 발현 작제물 |
Country Status (9)
Country | Link |
---|---|
US (1) | US20240175048A1 (ko) |
EP (1) | EP4298216A1 (ko) |
JP (1) | JP2024509123A (ko) |
KR (1) | KR20230153418A (ko) |
CN (1) | CN116917475A (ko) |
AU (1) | AU2022227003A1 (ko) |
CA (1) | CA3209374A1 (ko) |
IL (1) | IL305421A (ko) |
WO (1) | WO2022182976A1 (ko) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023164499A2 (en) * | 2022-02-22 | 2023-08-31 | Pluristyx, Inc. | Methods of making induced pluripotent stem cells |
EP4349990A1 (en) * | 2022-10-07 | 2024-04-10 | Certest Biotec, S.L. | Artificial polynucleotides for expressing proteins |
CN117568338A (zh) * | 2024-01-17 | 2024-02-20 | 艾斯拓康医药科技(北京)有限公司 | 一种优化的polyA序列及其应用 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004261002A (ja) * | 2003-01-08 | 2004-09-24 | Tsutomu Suzuki | siRNAの製造方法 |
WO2009155950A1 (en) * | 2008-06-27 | 2009-12-30 | King Faisal Specialist Hospital And Research Centre | Cloning-free method of generating transcriptionally and post-transcriptionally controllable expression active linear reporter constructs |
US20180201937A1 (en) * | 2015-08-04 | 2018-07-19 | The University Of Chicago | Inhibitors of cacna1a/alpha1a subunit internal ribosomal entry site (ires) and methods of treating spinocerebellar ataxia type 6 |
CN107759701B (zh) * | 2017-10-27 | 2021-07-02 | 杭州优善生物科技有限公司 | 嵌合抗原受体、其修饰的NK细胞、编码DNA、mRNA、表达载体、制备方法和应用 |
US11661600B2 (en) * | 2017-11-02 | 2023-05-30 | University Of Iowa Research Foundation | Methods of rescuing stop codons via genetic reassignment with ACE-tRNA |
WO2019241486A1 (en) * | 2018-06-13 | 2019-12-19 | Voyager Therapeutics, Inc. | Engineered 5' untranslated regions (5' utr) for aav production |
-
2022
- 2022-02-25 EP EP22760475.8A patent/EP4298216A1/en active Pending
- 2022-02-25 JP JP2023552219A patent/JP2024509123A/ja active Pending
- 2022-02-25 AU AU2022227003A patent/AU2022227003A1/en active Pending
- 2022-02-25 KR KR1020237032938A patent/KR20230153418A/ko unknown
- 2022-02-25 CN CN202280016860.7A patent/CN116917475A/zh active Pending
- 2022-02-25 US US18/548,027 patent/US20240175048A1/en active Pending
- 2022-02-25 WO PCT/US2022/017880 patent/WO2022182976A1/en active Application Filing
- 2022-02-25 CA CA3209374A patent/CA3209374A1/en active Pending
- 2022-02-25 IL IL305421A patent/IL305421A/en unknown
Also Published As
Publication number | Publication date |
---|---|
US20240175048A1 (en) | 2024-05-30 |
CN116917475A (zh) | 2023-10-20 |
AU2022227003A9 (en) | 2024-01-25 |
WO2022182976A1 (en) | 2022-09-01 |
EP4298216A1 (en) | 2024-01-03 |
JP2024509123A (ja) | 2024-02-29 |
AU2022227003A1 (en) | 2023-09-28 |
IL305421A (en) | 2023-10-01 |
CA3209374A1 (en) | 2022-09-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20230153418A (ko) | 합성 리보핵산(rna)으로부터 단백질 발현을 증가시키기 위한 조작된 발현 작제물 | |
CN107090436B (zh) | 用于重编程细胞的包含纯化的经修饰的rna的rna制剂 | |
JP2021501572A (ja) | 新規な人工核酸分子 | |
Zarghampoor et al. | Improved translation efficiency of therapeutic mRNA | |
JP2020535805A (ja) | 細胞の遺伝子修飾のための非組込みdnaベクター | |
WO2022116815A1 (zh) | 一种慢病毒稳定包装细胞系及其制备方法 | |
CN104220599A (zh) | 人工核酸分子 | |
WO2014135998A1 (en) | In vitro and in vivo delivery of genes and proteins using the bacteriophage t4 dna packaging machine | |
JP7533847B2 (ja) | メッセンジャーrnaキャップのその5’末端に導入された2つのrna配列での置換 | |
Rhoads | Synthetic mRNA: production, introduction into cells, and physiological consequences | |
US8685407B2 (en) | Genetic constructs and compositions comprising RRE and CTE and uses thereof | |
US11414456B2 (en) | Cell penetrating peptide | |
EP3502258A1 (en) | Click-modified in vitro transcribed mrna for gene expression | |
JP2024534216A (ja) | Rnaアフィニティー精製のための組成物および方法 | |
KR20230129479A (ko) | 발현 구성체 및 이의 용도 | |
CN111778279B (zh) | 一种HTLV-1 Env介导的细胞-细胞融合模型、制备方法及应用 | |
CN114703229B (zh) | 一种基于人源细胞的表面展示技术及靶向hbv受体的多肽及其应用 | |
KR20230127069A (ko) | 세포질에서 자가 전사가 가능한 mRNA를 제공하는 RNA/DNA 시스템 | |
WO2024055272A1 (zh) | 能高效表达目的基因的mRNA载体系统、其构建及应用 | |
KR20220055399A (ko) | 세포질에서 자가 전사가 가능한 mRNA를 제공하는 RNA/DNA 시스템 | |
WO2024163805A1 (en) | Methods and compositions for genomic integration | |
KR20230127070A (ko) | 세포질에서 자가 전사가 가능하고 발현억제 rna를 제공하는 rna/dna 시스템 | |
EA036375B1 (ru) | Tal-эффекторная нуклеаза для целевого нокаута вич-корецептора ccr5 | |
WO2024137392A1 (en) | Method of preparing self-circularized rna | |
Luo et al. | A Dendrimer-Like DNA-Based Vector for DNA Delivery |