KR20210139306A - 강력한 암 치료제로서의 융합체 종양용해성 단순 헤르페스 돌연변이체 - Google Patents
강력한 암 치료제로서의 융합체 종양용해성 단순 헤르페스 돌연변이체 Download PDFInfo
- Publication number
- KR20210139306A KR20210139306A KR1020217031853A KR20217031853A KR20210139306A KR 20210139306 A KR20210139306 A KR 20210139306A KR 1020217031853 A KR1020217031853 A KR 1020217031853A KR 20217031853 A KR20217031853 A KR 20217031853A KR 20210139306 A KR20210139306 A KR 20210139306A
- Authority
- KR
- South Korea
- Prior art keywords
- hsv
- seq
- cell
- cancer
- gene
- Prior art date
Links
- 206010028980 Neoplasm Diseases 0.000 title claims abstract description 95
- 201000011510 cancer Diseases 0.000 title claims abstract description 64
- 230000004927 fusion Effects 0.000 title description 16
- 238000011282 treatment Methods 0.000 title description 15
- 230000003389 potentiating effect Effects 0.000 title description 6
- 230000000174 oncolytic effect Effects 0.000 title description 5
- 208000009889 Herpes Simplex Diseases 0.000 title description 4
- 238000000034 method Methods 0.000 claims abstract description 132
- 239000000203 mixture Substances 0.000 claims abstract description 64
- 241000700584 Simplexvirus Species 0.000 claims abstract description 16
- 230000012010 growth Effects 0.000 claims abstract description 11
- 230000002401 inhibitory effect Effects 0.000 claims abstract description 9
- 206010027476 Metastases Diseases 0.000 claims abstract description 7
- 230000009401 metastasis Effects 0.000 claims abstract description 7
- 210000004027 cell Anatomy 0.000 claims description 268
- 108090000623 proteins and genes Proteins 0.000 claims description 186
- 241000700605 Viruses Species 0.000 claims description 119
- 102000040430 polynucleotide Human genes 0.000 claims description 111
- 108091033319 polynucleotide Proteins 0.000 claims description 111
- 239000002157 polynucleotide Substances 0.000 claims description 111
- 230000035772 mutation Effects 0.000 claims description 91
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 63
- 101000807236 Human cytomegalovirus (strain AD169) Membrane glycoprotein US3 Proteins 0.000 claims description 60
- 239000013598 vector Substances 0.000 claims description 59
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 55
- 229920001184 polypeptide Polymers 0.000 claims description 54
- 102000004169 proteins and genes Human genes 0.000 claims description 47
- 235000018102 proteins Nutrition 0.000 claims description 42
- 239000002245 particle Substances 0.000 claims description 39
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 38
- 230000003612 virological effect Effects 0.000 claims description 38
- 241000282414 Homo sapiens Species 0.000 claims description 35
- 101100508081 Human herpesvirus 1 (strain 17) ICP34.5 gene Proteins 0.000 claims description 35
- 101150027249 RL1 gene Proteins 0.000 claims description 35
- 241000700588 Human alphaherpesvirus 1 Species 0.000 claims description 34
- 238000002560 therapeutic procedure Methods 0.000 claims description 34
- 238000000338 in vitro Methods 0.000 claims description 33
- 101150026402 DBP gene Proteins 0.000 claims description 31
- 101100195053 Human herpesvirus 1 (strain 17) RIR1 gene Proteins 0.000 claims description 31
- 208000015181 infectious disease Diseases 0.000 claims description 30
- 239000008194 pharmaceutical composition Substances 0.000 claims description 29
- 101150090364 ICP0 gene Proteins 0.000 claims description 27
- 230000003682 DNA packaging effect Effects 0.000 claims description 26
- 108010040614 terminase Proteins 0.000 claims description 26
- 239000003795 chemical substances by application Substances 0.000 claims description 23
- 125000003729 nucleotide group Chemical group 0.000 claims description 23
- 239000002773 nucleotide Substances 0.000 claims description 22
- 238000001727 in vivo Methods 0.000 claims description 20
- 239000012634 fragment Substances 0.000 claims description 16
- 230000001018 virulence Effects 0.000 claims description 15
- 230000037430 deletion Effects 0.000 claims description 14
- 238000012217 deletion Methods 0.000 claims description 14
- 238000002347 injection Methods 0.000 claims description 14
- 239000007924 injection Substances 0.000 claims description 14
- 150000007523 nucleic acids Chemical group 0.000 claims description 13
- 239000013612 plasmid Substances 0.000 claims description 13
- 208000003174 Brain Neoplasms Diseases 0.000 claims description 11
- 206010060862 Prostate cancer Diseases 0.000 claims description 11
- 208000000236 Prostatic Neoplasms Diseases 0.000 claims description 11
- 230000000295 complement effect Effects 0.000 claims description 11
- 208000032839 leukemia Diseases 0.000 claims description 11
- 201000001441 melanoma Diseases 0.000 claims description 11
- 206010005949 Bone cancer Diseases 0.000 claims description 10
- 208000018084 Bone neoplasm Diseases 0.000 claims description 10
- 206010006187 Breast cancer Diseases 0.000 claims description 10
- 208000026310 Breast neoplasm Diseases 0.000 claims description 10
- 206010009944 Colon cancer Diseases 0.000 claims description 10
- 208000008839 Kidney Neoplasms Diseases 0.000 claims description 10
- 206010025323 Lymphomas Diseases 0.000 claims description 10
- 206010061902 Pancreatic neoplasm Diseases 0.000 claims description 10
- 206010035226 Plasma cell myeloma Diseases 0.000 claims description 10
- 206010038389 Renal cancer Diseases 0.000 claims description 10
- 208000000453 Skin Neoplasms Diseases 0.000 claims description 10
- 206010041067 Small cell lung cancer Diseases 0.000 claims description 10
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 claims description 10
- 239000004473 Threonine Substances 0.000 claims description 10
- 108700019146 Transgenes Proteins 0.000 claims description 10
- 208000002495 Uterine Neoplasms Diseases 0.000 claims description 10
- 208000029742 colonic neoplasm Diseases 0.000 claims description 10
- 208000030381 cutaneous melanoma Diseases 0.000 claims description 10
- 238000003780 insertion Methods 0.000 claims description 10
- 230000037431 insertion Effects 0.000 claims description 10
- 201000010982 kidney cancer Diseases 0.000 claims description 10
- 201000007270 liver cancer Diseases 0.000 claims description 10
- 208000014018 liver neoplasm Diseases 0.000 claims description 10
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 claims description 10
- 201000000050 myeloid neoplasm Diseases 0.000 claims description 10
- 201000002528 pancreatic cancer Diseases 0.000 claims description 10
- 208000008443 pancreatic carcinoma Diseases 0.000 claims description 10
- 230000010076 replication Effects 0.000 claims description 10
- 201000000849 skin cancer Diseases 0.000 claims description 10
- 201000003708 skin melanoma Diseases 0.000 claims description 10
- 208000000587 small cell lung carcinoma Diseases 0.000 claims description 10
- 206010046766 uterine cancer Diseases 0.000 claims description 10
- 239000013603 viral vector Substances 0.000 claims description 10
- 241000701074 Human alphaherpesvirus 2 Species 0.000 claims description 9
- 108091092195 Intron Proteins 0.000 claims description 9
- 241000124008 Mammalia Species 0.000 claims description 9
- 230000001939 inductive effect Effects 0.000 claims description 9
- 238000006467 substitution reaction Methods 0.000 claims description 9
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 claims description 7
- 235000004279 alanine Nutrition 0.000 claims description 7
- 210000004698 lymphocyte Anatomy 0.000 claims description 7
- 230000006037 cell lysis Effects 0.000 claims description 6
- 239000003937 drug carrier Substances 0.000 claims description 6
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 claims description 6
- 210000005036 nerve Anatomy 0.000 claims description 6
- 238000004520 electroporation Methods 0.000 claims description 5
- 238000001802 infusion Methods 0.000 claims description 5
- 238000001890 transfection Methods 0.000 claims description 5
- 241000282326 Felis catus Species 0.000 claims description 4
- 230000002338 cryopreservative effect Effects 0.000 claims description 4
- 230000037433 frameshift Effects 0.000 claims description 4
- 239000001963 growth medium Substances 0.000 claims description 4
- 238000000520 microinjection Methods 0.000 claims description 4
- 230000009466 transformation Effects 0.000 claims description 4
- 239000004475 Arginine Substances 0.000 claims description 3
- 101001042070 Equine herpesvirus 1 (strain V592) E3 ubiquitin-protein ligase ICP0 Proteins 0.000 claims description 3
- 241000283073 Equus caballus Species 0.000 claims description 3
- 241000701044 Human gammaherpesvirus 4 Species 0.000 claims description 3
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 claims description 3
- 241001494479 Pecora Species 0.000 claims description 3
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 claims description 3
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 claims description 3
- 238000009093 first-line therapy Methods 0.000 claims description 3
- 229930182817 methionine Natural products 0.000 claims description 3
- 238000009094 second-line therapy Methods 0.000 claims description 3
- 241000283707 Capra Species 0.000 claims description 2
- 241000700199 Cavia porcellus Species 0.000 claims description 2
- 238000005119 centrifugation Methods 0.000 claims description 2
- 238000004587 chromatography analysis Methods 0.000 claims description 2
- 238000012258 culturing Methods 0.000 claims description 2
- 238000001914 filtration Methods 0.000 claims description 2
- 238000007710 freezing Methods 0.000 claims description 2
- 230000008014 freezing Effects 0.000 claims description 2
- 238000010257 thawing Methods 0.000 claims description 2
- 125000003275 alpha amino acid group Chemical group 0.000 claims 12
- 238000011319 anticancer therapy Methods 0.000 claims 1
- 238000000926 separation method Methods 0.000 claims 1
- 150000001413 amino acids Chemical class 0.000 description 90
- 108020004414 DNA Proteins 0.000 description 59
- 241000699670 Mus sp. Species 0.000 description 59
- 210000001519 tissue Anatomy 0.000 description 52
- 230000014509 gene expression Effects 0.000 description 39
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 38
- 238000003556 assay Methods 0.000 description 34
- 206010029260 Neuroblastoma Diseases 0.000 description 31
- 108010079364 N-glycylalanine Proteins 0.000 description 30
- 230000009385 viral infection Effects 0.000 description 29
- 241000880493 Leptailurus serval Species 0.000 description 27
- 108010047495 alanylglycine Proteins 0.000 description 27
- 208000036142 Viral infection Diseases 0.000 description 26
- 108010087924 alanylproline Proteins 0.000 description 24
- 230000006870 function Effects 0.000 description 22
- 235000001014 amino acid Nutrition 0.000 description 20
- 239000000523 sample Substances 0.000 description 20
- OLVCTPPSXNRGKV-GUBZILKMSA-N Ala-Pro-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OLVCTPPSXNRGKV-GUBZILKMSA-N 0.000 description 19
- 108091033409 CRISPR Proteins 0.000 description 19
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 19
- 238000012360 testing method Methods 0.000 description 19
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 18
- 108010050848 glycylleucine Proteins 0.000 description 17
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 16
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 16
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 16
- 108010038633 aspartylglutamate Proteins 0.000 description 16
- 201000010099 disease Diseases 0.000 description 16
- JYPCXBJRLBHWME-UHFFFAOYSA-N glycyl-L-prolyl-L-arginine Natural products NCC(=O)N1CCCC1C(=O)NC(CCCN=C(N)N)C(O)=O JYPCXBJRLBHWME-UHFFFAOYSA-N 0.000 description 16
- 239000005090 green fluorescent protein Substances 0.000 description 16
- 241001465754 Metazoa Species 0.000 description 15
- 241001529936 Murinae Species 0.000 description 15
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 14
- 239000000047 product Substances 0.000 description 14
- 108010061238 threonyl-glycine Proteins 0.000 description 14
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 13
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 13
- XQLBWXHVZVBNJM-FXQIFTODSA-N Pro-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 XQLBWXHVZVBNJM-FXQIFTODSA-N 0.000 description 13
- 230000002238 attenuated effect Effects 0.000 description 13
- 239000003814 drug Substances 0.000 description 13
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 13
- 239000000243 solution Substances 0.000 description 13
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 12
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 12
- 238000004458 analytical method Methods 0.000 description 12
- 230000001413 cellular effect Effects 0.000 description 12
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 12
- 238000004519 manufacturing process Methods 0.000 description 12
- 239000002953 phosphate buffered saline Substances 0.000 description 12
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 11
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 11
- 108091026890 Coding region Proteins 0.000 description 11
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 11
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 11
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 11
- 241000699666 Mus <mouse, genus> Species 0.000 description 11
- 108010005233 alanylglutamic acid Proteins 0.000 description 11
- 238000010362 genome editing Methods 0.000 description 11
- 108010049041 glutamylalanine Proteins 0.000 description 11
- 108010062266 glycyl-glycyl-argininal Proteins 0.000 description 11
- 108010037850 glycylvaline Proteins 0.000 description 11
- 230000007170 pathology Effects 0.000 description 11
- 108010012581 phenylalanylglutamate Proteins 0.000 description 11
- 108010087846 prolyl-prolyl-glycine Proteins 0.000 description 11
- 108010031719 prolyl-serine Proteins 0.000 description 11
- 108010004914 prolylarginine Proteins 0.000 description 11
- 210000000130 stem cell Anatomy 0.000 description 11
- XWFWAXPOLRTDFZ-FXQIFTODSA-N Ala-Pro-Ser Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O XWFWAXPOLRTDFZ-FXQIFTODSA-N 0.000 description 10
- OVVUNXXROOFSIM-SDDRHHMPSA-N Arg-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O OVVUNXXROOFSIM-SDDRHHMPSA-N 0.000 description 10
- 238000010354 CRISPR gene editing Methods 0.000 description 10
- JRDYDYXZKFNNRQ-XPUUQOCRSA-N Gly-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN JRDYDYXZKFNNRQ-XPUUQOCRSA-N 0.000 description 10
- 238000000719 MTS assay Methods 0.000 description 10
- 231100000070 MTS assay Toxicity 0.000 description 10
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 10
- SBVPYBFMIGDIDX-SRVKXCTJSA-N Pro-Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H]2NCCC2)CCC1 SBVPYBFMIGDIDX-SRVKXCTJSA-N 0.000 description 10
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 10
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 10
- 238000006243 chemical reaction Methods 0.000 description 10
- 150000001875 compounds Chemical class 0.000 description 10
- 239000003623 enhancer Substances 0.000 description 10
- 108010040030 histidinoalanine Proteins 0.000 description 10
- 239000000463 material Substances 0.000 description 10
- 108010051242 phenylalanylserine Proteins 0.000 description 10
- 108010077112 prolyl-proline Proteins 0.000 description 10
- 108010070643 prolylglutamic acid Proteins 0.000 description 10
- 108010026333 seryl-proline Proteins 0.000 description 10
- 230000001225 therapeutic effect Effects 0.000 description 10
- 238000013518 transcription Methods 0.000 description 10
- 230000035897 transcription Effects 0.000 description 10
- 239000003981 vehicle Substances 0.000 description 10
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 10
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 9
- KWKQGHSSNHPGOW-BQBZGAKWSA-N Arg-Ala-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)NCC(O)=O KWKQGHSSNHPGOW-BQBZGAKWSA-N 0.000 description 9
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 9
- NHDVNAKDACFHPX-GUBZILKMSA-N Pro-Arg-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O NHDVNAKDACFHPX-GUBZILKMSA-N 0.000 description 9
- AZSHAZJLOZQYAY-FXQIFTODSA-N Val-Ala-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O AZSHAZJLOZQYAY-FXQIFTODSA-N 0.000 description 9
- 108010068380 arginylarginine Proteins 0.000 description 9
- 231100000135 cytotoxicity Toxicity 0.000 description 9
- 230000003013 cytotoxicity Effects 0.000 description 9
- 230000000694 effects Effects 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 108010093296 prolyl-prolyl-alanine Proteins 0.000 description 9
- 241000894007 species Species 0.000 description 9
- 210000002845 virion Anatomy 0.000 description 9
- BUDNAJYVCUHLSV-ZLUOBGJFSA-N Ala-Asp-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O BUDNAJYVCUHLSV-ZLUOBGJFSA-N 0.000 description 8
- XYKDZXKKYOOTGC-FXQIFTODSA-N Ala-Cys-Met Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCSC)C(=O)O)N XYKDZXKKYOOTGC-FXQIFTODSA-N 0.000 description 8
- 201000009030 Carcinoma Diseases 0.000 description 8
- FIADUEYFRSCCIK-CIUDSAMLSA-N Cys-Glu-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FIADUEYFRSCCIK-CIUDSAMLSA-N 0.000 description 8
- 241000701022 Cytomegalovirus Species 0.000 description 8
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 8
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 8
- NSVOVKWEKGEOQB-LURJTMIESA-N Gly-Pro-Gly Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(O)=O NSVOVKWEKGEOQB-LURJTMIESA-N 0.000 description 8
- LOLUPZNNADDTAA-AVGNSLFASA-N Leu-Gln-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LOLUPZNNADDTAA-AVGNSLFASA-N 0.000 description 8
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 8
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 8
- MGBRZXXGQBAULP-DRZSPHRISA-N Phe-Glu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MGBRZXXGQBAULP-DRZSPHRISA-N 0.000 description 8
- APKRGYLBSCWJJP-FXQIFTODSA-N Pro-Ala-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O APKRGYLBSCWJJP-FXQIFTODSA-N 0.000 description 8
- 241000700159 Rattus Species 0.000 description 8
- 206010039491 Sarcoma Diseases 0.000 description 8
- DSSOYPJWSWFOLK-CIUDSAMLSA-N Ser-Cys-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O DSSOYPJWSWFOLK-CIUDSAMLSA-N 0.000 description 8
- SQHKXWODKJDZRC-LKXGYXEUSA-N Ser-Thr-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQHKXWODKJDZRC-LKXGYXEUSA-N 0.000 description 8
- ISERLACIZUGCDX-ZKWXMUAHSA-N Val-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N ISERLACIZUGCDX-ZKWXMUAHSA-N 0.000 description 8
- 230000003833 cell viability Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 8
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 8
- 239000007850 fluorescent dye Substances 0.000 description 8
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Chemical compound NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 8
- 108010050475 glycyl-leucyl-tyrosine Proteins 0.000 description 8
- 108010081551 glycylphenylalanine Proteins 0.000 description 8
- 230000002458 infectious effect Effects 0.000 description 8
- 210000003734 kidney Anatomy 0.000 description 8
- 230000000670 limiting effect Effects 0.000 description 8
- 210000004072 lung Anatomy 0.000 description 8
- 102000039446 nucleic acids Human genes 0.000 description 8
- 108020004707 nucleic acids Proteins 0.000 description 8
- 210000000056 organ Anatomy 0.000 description 8
- 239000003755 preservative agent Substances 0.000 description 8
- 238000012546 transfer Methods 0.000 description 8
- BRPMXFSTKXXNHF-IUCAKERBSA-N (2s)-1-[2-[[(2s)-pyrrolidine-2-carbonyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound OC(=O)[C@@H]1CCCN1C(=O)CNC(=O)[C@H]1NCCC1 BRPMXFSTKXXNHF-IUCAKERBSA-N 0.000 description 7
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 7
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 7
- MQIGTEQXYCRLGK-BQBZGAKWSA-N Ala-Gly-Pro Chemical compound C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O MQIGTEQXYCRLGK-BQBZGAKWSA-N 0.000 description 7
- VQAVBBCZFQAAED-FXQIFTODSA-N Ala-Pro-Asn Chemical compound C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)N)C(=O)O)N VQAVBBCZFQAAED-FXQIFTODSA-N 0.000 description 7
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 7
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 7
- KMFPQTITXUKJOV-DCAQKATOSA-N Arg-Ser-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O KMFPQTITXUKJOV-DCAQKATOSA-N 0.000 description 7
- XWKBWZXGNXTDKY-ZKWXMUAHSA-N Asp-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O XWKBWZXGNXTDKY-ZKWXMUAHSA-N 0.000 description 7
- PXXGVUVQWQGGIG-YUMQZZPRSA-N Glu-Gly-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N PXXGVUVQWQGGIG-YUMQZZPRSA-N 0.000 description 7
- GGLIDLCEPDHEJO-BQBZGAKWSA-N Gly-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)CN GGLIDLCEPDHEJO-BQBZGAKWSA-N 0.000 description 7
- OHUKZZYSJBKFRR-WHFBIAKZSA-N Gly-Ser-Asp Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O OHUKZZYSJBKFRR-WHFBIAKZSA-N 0.000 description 7
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 7
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 7
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 7
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 7
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 7
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 7
- SFKOEHXABNPLRT-KBPBESRZSA-N Phe-His-Gly Chemical compound N[C@@H](Cc1ccccc1)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)NCC(O)=O SFKOEHXABNPLRT-KBPBESRZSA-N 0.000 description 7
- BNBBNGZZKQUWCD-IUCAKERBSA-N Pro-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H]1CCCN1 BNBBNGZZKQUWCD-IUCAKERBSA-N 0.000 description 7
- MCWHYUWXVNRXFV-RWMBFGLXSA-N Pro-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 MCWHYUWXVNRXFV-RWMBFGLXSA-N 0.000 description 7
- KDBHVPXBQADZKY-GUBZILKMSA-N Pro-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KDBHVPXBQADZKY-GUBZILKMSA-N 0.000 description 7
- GBUNEGKQPSAMNK-QTKMDUPCSA-N Pro-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2)O GBUNEGKQPSAMNK-QTKMDUPCSA-N 0.000 description 7
- AIOWVDNPESPXRB-YTWAJWBKSA-N Pro-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2)O AIOWVDNPESPXRB-YTWAJWBKSA-N 0.000 description 7
- 238000011529 RT qPCR Methods 0.000 description 7
- PPCZVWHJWJFTFN-ZLUOBGJFSA-N Ser-Ser-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPCZVWHJWJFTFN-ZLUOBGJFSA-N 0.000 description 7
- 239000004098 Tetracycline Substances 0.000 description 7
- LVHHEVGYAZGXDE-KDXUFGMBSA-N Thr-Ala-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(=O)O)N)O LVHHEVGYAZGXDE-KDXUFGMBSA-N 0.000 description 7
- PKXHGEXFMIZSER-QTKMDUPCSA-N Thr-Arg-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O PKXHGEXFMIZSER-QTKMDUPCSA-N 0.000 description 7
- VFEHSAJCWWHDBH-RHYQMDGZSA-N Thr-Arg-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VFEHSAJCWWHDBH-RHYQMDGZSA-N 0.000 description 7
- RRRRCRYTLZVCEN-HJGDQZAQSA-N Thr-Leu-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O RRRRCRYTLZVCEN-HJGDQZAQSA-N 0.000 description 7
- AEOFMCAKYIQQFY-YDHLFZDLSA-N Tyr-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AEOFMCAKYIQQFY-YDHLFZDLSA-N 0.000 description 7
- DDRBQONWVBDQOY-GUBZILKMSA-N Val-Ala-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DDRBQONWVBDQOY-GUBZILKMSA-N 0.000 description 7
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 7
- SJRUJQFQVLMZFW-WPRPVWTQSA-N Val-Pro-Gly Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SJRUJQFQVLMZFW-WPRPVWTQSA-N 0.000 description 7
- NLNCNKIVJPEFBC-DLOVCJGASA-N Val-Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O NLNCNKIVJPEFBC-DLOVCJGASA-N 0.000 description 7
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 7
- 108010093581 aspartyl-proline Proteins 0.000 description 7
- 108010047857 aspartylglycine Proteins 0.000 description 7
- 108010016616 cysteinylglycine Proteins 0.000 description 7
- 210000003527 eukaryotic cell Anatomy 0.000 description 7
- 238000001476 gene delivery Methods 0.000 description 7
- 108010078144 glutaminyl-glycine Proteins 0.000 description 7
- 108010090037 glycyl-alanyl-isoleucine Proteins 0.000 description 7
- 108010089804 glycyl-threonine Proteins 0.000 description 7
- 108010077515 glycylproline Proteins 0.000 description 7
- 201000005787 hematologic cancer Diseases 0.000 description 7
- 108010025306 histidylleucine Proteins 0.000 description 7
- 108010085325 histidylproline Proteins 0.000 description 7
- 238000009396 hybridization Methods 0.000 description 7
- 238000011534 incubation Methods 0.000 description 7
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 7
- 108010034529 leucyl-lysine Proteins 0.000 description 7
- 108010000761 leucylarginine Proteins 0.000 description 7
- 108700023046 methionyl-leucyl-phenylalanine Proteins 0.000 description 7
- 108700042769 prolyl-leucyl-glycine Proteins 0.000 description 7
- 108010029020 prolylglycine Proteins 0.000 description 7
- 108010053725 prolylvaline Proteins 0.000 description 7
- 230000003362 replicative effect Effects 0.000 description 7
- 238000011160 research Methods 0.000 description 7
- 239000000126 substance Substances 0.000 description 7
- 230000004083 survival effect Effects 0.000 description 7
- 235000019364 tetracycline Nutrition 0.000 description 7
- 150000003522 tetracyclines Chemical class 0.000 description 7
- 108700004896 tripeptide FEG Proteins 0.000 description 7
- VIGKUFXFTPWYER-BIIVOSGPSA-N Ala-Cys-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N VIGKUFXFTPWYER-BIIVOSGPSA-N 0.000 description 6
- NHLAEBFGWPXFGI-WHFBIAKZSA-N Ala-Gly-Asn Chemical compound C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N NHLAEBFGWPXFGI-WHFBIAKZSA-N 0.000 description 6
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 6
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 6
- WKPXXXUSUHAXDE-SRVKXCTJSA-N Arg-Pro-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O WKPXXXUSUHAXDE-SRVKXCTJSA-N 0.000 description 6
- QLSRIZIDQXDQHK-RCWTZXSCSA-N Arg-Val-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QLSRIZIDQXDQHK-RCWTZXSCSA-N 0.000 description 6
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 6
- JPHYJQHPILOKHC-ACZMJKKPSA-N Glu-Asp-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O JPHYJQHPILOKHC-ACZMJKKPSA-N 0.000 description 6
- NNQDRRUXFJYCCJ-NHCYSSNCSA-N Glu-Pro-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O NNQDRRUXFJYCCJ-NHCYSSNCSA-N 0.000 description 6
- GPSHCSTUYOQPAI-JHEQGTHGSA-N Glu-Thr-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O GPSHCSTUYOQPAI-JHEQGTHGSA-N 0.000 description 6
- HQRHFUYMGCHHJS-LURJTMIESA-N Gly-Gly-Arg Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N HQRHFUYMGCHHJS-LURJTMIESA-N 0.000 description 6
- HFPVRZWORNJRRC-UWVGGRQHSA-N Gly-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN HFPVRZWORNJRRC-UWVGGRQHSA-N 0.000 description 6
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 6
- 102000003886 Glycoproteins Human genes 0.000 description 6
- 108090000288 Glycoproteins Proteins 0.000 description 6
- KXUKTDGKLAOCQK-LSJOCFKGSA-N Ile-Val-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O KXUKTDGKLAOCQK-LSJOCFKGSA-N 0.000 description 6
- 108010065920 Insulin Lispro Proteins 0.000 description 6
- 102100030124 N-myc proto-oncogene protein Human genes 0.000 description 6
- QSWKNJAPHQDAAS-MELADBBJSA-N Phe-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O QSWKNJAPHQDAAS-MELADBBJSA-N 0.000 description 6
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 6
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 6
- DXTOOBDIIAJZBJ-BQBZGAKWSA-N Pro-Gly-Ser Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CO)C(O)=O DXTOOBDIIAJZBJ-BQBZGAKWSA-N 0.000 description 6
- JLMZKEQFMVORMA-SRVKXCTJSA-N Pro-Pro-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 JLMZKEQFMVORMA-SRVKXCTJSA-N 0.000 description 6
- KIDXAAQVMNLJFQ-KZVJFYERSA-N Pro-Thr-Ala Chemical compound C[C@@H](O)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](C)C(O)=O KIDXAAQVMNLJFQ-KZVJFYERSA-N 0.000 description 6
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 6
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 6
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 6
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 6
- 108700005077 Viral Genes Proteins 0.000 description 6
- 108010062796 arginyllysine Proteins 0.000 description 6
- 238000001574 biopsy Methods 0.000 description 6
- 210000000170 cell membrane Anatomy 0.000 description 6
- 210000004748 cultured cell Anatomy 0.000 description 6
- 108010060199 cysteinylproline Proteins 0.000 description 6
- 230000009089 cytolysis Effects 0.000 description 6
- 238000009472 formulation Methods 0.000 description 6
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 6
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 6
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 6
- 108010025801 glycyl-prolyl-arginine Proteins 0.000 description 6
- 230000000977 initiatory effect Effects 0.000 description 6
- 238000001990 intravenous administration Methods 0.000 description 6
- 108010057821 leucylproline Proteins 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 108091008800 n-Myc Proteins 0.000 description 6
- 238000002360 preparation method Methods 0.000 description 6
- 102000005962 receptors Human genes 0.000 description 6
- 108020003175 receptors Proteins 0.000 description 6
- 230000004044 response Effects 0.000 description 6
- 108010048818 seryl-histidine Proteins 0.000 description 6
- 229960002180 tetracycline Drugs 0.000 description 6
- 229930101283 tetracycline Natural products 0.000 description 6
- 210000003501 vero cell Anatomy 0.000 description 6
- ODWSTKXGQGYHSH-FXQIFTODSA-N Ala-Arg-Ala Chemical compound C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O ODWSTKXGQGYHSH-FXQIFTODSA-N 0.000 description 5
- UCIYCBSJBQGDGM-LPEHRKFASA-N Ala-Arg-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N UCIYCBSJBQGDGM-LPEHRKFASA-N 0.000 description 5
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 5
- ARHJJAAWNWOACN-FXQIFTODSA-N Ala-Ser-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O ARHJJAAWNWOACN-FXQIFTODSA-N 0.000 description 5
- SGYSTDWPNPKJPP-GUBZILKMSA-N Arg-Ala-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SGYSTDWPNPKJPP-GUBZILKMSA-N 0.000 description 5
- LMPKCSXZJSXBBL-NHCYSSNCSA-N Arg-Gln-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O LMPKCSXZJSXBBL-NHCYSSNCSA-N 0.000 description 5
- NMRHDSAOIURTNT-RWMBFGLXSA-N Arg-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NMRHDSAOIURTNT-RWMBFGLXSA-N 0.000 description 5
- ISVACHFCVRKIDG-SRVKXCTJSA-N Arg-Val-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O ISVACHFCVRKIDG-SRVKXCTJSA-N 0.000 description 5
- KRXIWXCXOARFNT-ZLUOBGJFSA-N Asp-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O KRXIWXCXOARFNT-ZLUOBGJFSA-N 0.000 description 5
- 241000894006 Bacteria Species 0.000 description 5
- 241000283690 Bos taurus Species 0.000 description 5
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 5
- 102000053602 DNA Human genes 0.000 description 5
- OGNJZUXUTPQVBR-BQBZGAKWSA-N Glu-Gly-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OGNJZUXUTPQVBR-BQBZGAKWSA-N 0.000 description 5
- KQDMENMTYNBWMR-WHFBIAKZSA-N Gly-Asp-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O KQDMENMTYNBWMR-WHFBIAKZSA-N 0.000 description 5
- OIQSIMFSVLLWBX-VOAKCMCISA-N Lys-Leu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OIQSIMFSVLLWBX-VOAKCMCISA-N 0.000 description 5
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 5
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 5
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 5
- LGSANCBHSMDFDY-GARJFASQSA-N Pro-Glu-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O LGSANCBHSMDFDY-GARJFASQSA-N 0.000 description 5
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 5
- DINQYZRMXGWWTG-GUBZILKMSA-N Ser-Pro-Pro Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DINQYZRMXGWWTG-GUBZILKMSA-N 0.000 description 5
- 101150048584 TRM3 gene Proteins 0.000 description 5
- 101150008036 UL29 gene Proteins 0.000 description 5
- 238000013459 approach Methods 0.000 description 5
- 108010077245 asparaginyl-proline Proteins 0.000 description 5
- 108010092854 aspartyllysine Proteins 0.000 description 5
- 210000004556 brain Anatomy 0.000 description 5
- 239000000872 buffer Substances 0.000 description 5
- 230000030833 cell death Effects 0.000 description 5
- 239000002552 dosage form Substances 0.000 description 5
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 5
- 108010015792 glycyllysine Proteins 0.000 description 5
- 230000003902 lesion Effects 0.000 description 5
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 5
- 239000002502 liposome Substances 0.000 description 5
- 108010017391 lysylvaline Proteins 0.000 description 5
- 239000002609 medium Substances 0.000 description 5
- 108020004999 messenger RNA Proteins 0.000 description 5
- 230000001537 neural effect Effects 0.000 description 5
- 210000004940 nucleus Anatomy 0.000 description 5
- 238000011275 oncology therapy Methods 0.000 description 5
- 239000000546 pharmaceutical excipient Substances 0.000 description 5
- 108010018625 phenylalanylarginine Proteins 0.000 description 5
- 230000001105 regulatory effect Effects 0.000 description 5
- 239000007787 solid Substances 0.000 description 5
- 239000003826 tablet Substances 0.000 description 5
- 229940124597 therapeutic agent Drugs 0.000 description 5
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 4
- BUANFPRKJKJSRR-ACZMJKKPSA-N Ala-Ala-Gln Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CCC(N)=O BUANFPRKJKJSRR-ACZMJKKPSA-N 0.000 description 4
- WQVFQXXBNHHPLX-ZKWXMUAHSA-N Ala-Ala-His Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O WQVFQXXBNHHPLX-ZKWXMUAHSA-N 0.000 description 4
- SDMAQFGBPOJFOM-GUBZILKMSA-N Ala-Arg-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SDMAQFGBPOJFOM-GUBZILKMSA-N 0.000 description 4
- TTXMOJWKNRJWQJ-FXQIFTODSA-N Ala-Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N TTXMOJWKNRJWQJ-FXQIFTODSA-N 0.000 description 4
- JAMAWBXXKFGFGX-KZVJFYERSA-N Ala-Arg-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JAMAWBXXKFGFGX-KZVJFYERSA-N 0.000 description 4
- XCVRVWZTXPCYJT-BIIVOSGPSA-N Ala-Asn-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N XCVRVWZTXPCYJT-BIIVOSGPSA-N 0.000 description 4
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 4
- GWFSQQNGMPGBEF-GHCJXIJMSA-N Ala-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N GWFSQQNGMPGBEF-GHCJXIJMSA-N 0.000 description 4
- YSMPVONNIWLJML-FXQIFTODSA-N Ala-Asp-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(O)=O YSMPVONNIWLJML-FXQIFTODSA-N 0.000 description 4
- NFDVJAKFMXHJEQ-HERUPUMHSA-N Ala-Asp-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N NFDVJAKFMXHJEQ-HERUPUMHSA-N 0.000 description 4
- MIPWEZAIMPYQST-FXQIFTODSA-N Ala-Cys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O MIPWEZAIMPYQST-FXQIFTODSA-N 0.000 description 4
- OMMDTNGURYRDAC-NRPADANISA-N Ala-Glu-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OMMDTNGURYRDAC-NRPADANISA-N 0.000 description 4
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 4
- OBVSBEYOMDWLRJ-BFHQHQDPSA-N Ala-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N OBVSBEYOMDWLRJ-BFHQHQDPSA-N 0.000 description 4
- FDAZDMAFZYTHGS-XVYDVKMFSA-N Ala-His-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O FDAZDMAFZYTHGS-XVYDVKMFSA-N 0.000 description 4
- AAXVGJXZKHQQHD-LSJOCFKGSA-N Ala-His-Met Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCSC)C(=O)O)N AAXVGJXZKHQQHD-LSJOCFKGSA-N 0.000 description 4
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 4
- TZDNWXDLYFIFPT-BJDJZHNGSA-N Ala-Ile-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O TZDNWXDLYFIFPT-BJDJZHNGSA-N 0.000 description 4
- DPNZTBKGAUAZQU-DLOVCJGASA-N Ala-Leu-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N DPNZTBKGAUAZQU-DLOVCJGASA-N 0.000 description 4
- ZKEHTYWGPMMGBC-XUXIUFHCSA-N Ala-Leu-Leu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O ZKEHTYWGPMMGBC-XUXIUFHCSA-N 0.000 description 4
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 4
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 4
- OMDNCNKNEGFOMM-BQBZGAKWSA-N Ala-Met-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O OMDNCNKNEGFOMM-BQBZGAKWSA-N 0.000 description 4
- XSTZMVAYYCJTNR-DCAQKATOSA-N Ala-Met-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O XSTZMVAYYCJTNR-DCAQKATOSA-N 0.000 description 4
- CNQAFFMNJIQYGX-DRZSPHRISA-N Ala-Phe-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 CNQAFFMNJIQYGX-DRZSPHRISA-N 0.000 description 4
- YCRAFFCYWOUEOF-DLOVCJGASA-N Ala-Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 YCRAFFCYWOUEOF-DLOVCJGASA-N 0.000 description 4
- DYJJJCHDHLEFDW-FXQIFTODSA-N Ala-Pro-Cys Chemical compound C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)O)N DYJJJCHDHLEFDW-FXQIFTODSA-N 0.000 description 4
- YHBDGLZYNIARKJ-GUBZILKMSA-N Ala-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N YHBDGLZYNIARKJ-GUBZILKMSA-N 0.000 description 4
- YYAVDNKUWLAFCV-ACZMJKKPSA-N Ala-Ser-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYAVDNKUWLAFCV-ACZMJKKPSA-N 0.000 description 4
- NZGRHTKZFSVPAN-BIIVOSGPSA-N Ala-Ser-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N NZGRHTKZFSVPAN-BIIVOSGPSA-N 0.000 description 4
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 4
- LFFOJBOTZUWINF-ZANVPECISA-N Ala-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O)=CNC2=C1 LFFOJBOTZUWINF-ZANVPECISA-N 0.000 description 4
- IYKVSFNGSWTTNZ-GUBZILKMSA-N Ala-Val-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IYKVSFNGSWTTNZ-GUBZILKMSA-N 0.000 description 4
- HULHGJZIZXCPLD-FXQIFTODSA-N Arg-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N HULHGJZIZXCPLD-FXQIFTODSA-N 0.000 description 4
- DBKNLHKEVPZVQC-LPEHRKFASA-N Arg-Ala-Pro Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O DBKNLHKEVPZVQC-LPEHRKFASA-N 0.000 description 4
- GIVATXIGCXFQQA-FXQIFTODSA-N Arg-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N GIVATXIGCXFQQA-FXQIFTODSA-N 0.000 description 4
- MUXONAMCEUBVGA-DCAQKATOSA-N Arg-Arg-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O MUXONAMCEUBVGA-DCAQKATOSA-N 0.000 description 4
- JGDGLDNAQJJGJI-AVGNSLFASA-N Arg-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N JGDGLDNAQJJGJI-AVGNSLFASA-N 0.000 description 4
- KMSHNDWHPWXPEC-BQBZGAKWSA-N Arg-Asp-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KMSHNDWHPWXPEC-BQBZGAKWSA-N 0.000 description 4
- PBSOQGZLPFVXPU-YUMQZZPRSA-N Arg-Glu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PBSOQGZLPFVXPU-YUMQZZPRSA-N 0.000 description 4
- ZATRYQNPUHGXCU-DTWKUNHWSA-N Arg-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ZATRYQNPUHGXCU-DTWKUNHWSA-N 0.000 description 4
- WVNFNPGXYADPPO-BQBZGAKWSA-N Arg-Gly-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O WVNFNPGXYADPPO-BQBZGAKWSA-N 0.000 description 4
- GNYUVVJYGJFKHN-RVMXOQNASA-N Arg-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N GNYUVVJYGJFKHN-RVMXOQNASA-N 0.000 description 4
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 4
- VIINVRPKMUZYOI-DCAQKATOSA-N Arg-Met-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O VIINVRPKMUZYOI-DCAQKATOSA-N 0.000 description 4
- OVQJAKFLFTZDNC-GUBZILKMSA-N Arg-Pro-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O OVQJAKFLFTZDNC-GUBZILKMSA-N 0.000 description 4
- YCYXHLZRUSJITQ-SRVKXCTJSA-N Arg-Pro-Pro Chemical compound NC(=N)NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 YCYXHLZRUSJITQ-SRVKXCTJSA-N 0.000 description 4
- SYFHFLGAROUHNT-VEVYYDQMSA-N Arg-Thr-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SYFHFLGAROUHNT-VEVYYDQMSA-N 0.000 description 4
- QHUOOCKNNURZSL-IHRRRGAJSA-N Arg-Tyr-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O QHUOOCKNNURZSL-IHRRRGAJSA-N 0.000 description 4
- XMZZGVGKGXRIGJ-JYJNAYRXSA-N Arg-Tyr-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O XMZZGVGKGXRIGJ-JYJNAYRXSA-N 0.000 description 4
- CPTXATAOUQJQRO-GUBZILKMSA-N Arg-Val-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O CPTXATAOUQJQRO-GUBZILKMSA-N 0.000 description 4
- SWLOHUMCUDRTCL-ZLUOBGJFSA-N Asn-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N SWLOHUMCUDRTCL-ZLUOBGJFSA-N 0.000 description 4
- QEYJFBMTSMLPKZ-ZKWXMUAHSA-N Asn-Ala-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O QEYJFBMTSMLPKZ-ZKWXMUAHSA-N 0.000 description 4
- BDMIFVIWCNLDCT-CIUDSAMLSA-N Asn-Arg-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O BDMIFVIWCNLDCT-CIUDSAMLSA-N 0.000 description 4
- MFFOYNGMOYFPBD-DCAQKATOSA-N Asn-Arg-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O MFFOYNGMOYFPBD-DCAQKATOSA-N 0.000 description 4
- QHBMKQWOIYJYMI-BYULHYEWSA-N Asn-Asn-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O QHBMKQWOIYJYMI-BYULHYEWSA-N 0.000 description 4
- OKZOABJQOMAYEC-NUMRIWBASA-N Asn-Gln-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OKZOABJQOMAYEC-NUMRIWBASA-N 0.000 description 4
- UHGUKCOQUNPSKK-CIUDSAMLSA-N Asn-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N UHGUKCOQUNPSKK-CIUDSAMLSA-N 0.000 description 4
- HDHZCEDPLTVHFZ-GUBZILKMSA-N Asn-Leu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O HDHZCEDPLTVHFZ-GUBZILKMSA-N 0.000 description 4
- NCFJQJRLQJEECD-NHCYSSNCSA-N Asn-Leu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O NCFJQJRLQJEECD-NHCYSSNCSA-N 0.000 description 4
- PIABYSIYPGLLDQ-XVSYOHENSA-N Asn-Thr-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PIABYSIYPGLLDQ-XVSYOHENSA-N 0.000 description 4
- JPPLRQVZMZFOSX-UWJYBYFXSA-N Asn-Tyr-Ala Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 JPPLRQVZMZFOSX-UWJYBYFXSA-N 0.000 description 4
- WSOKZUVWBXVJHX-CIUDSAMLSA-N Asp-Arg-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O WSOKZUVWBXVJHX-CIUDSAMLSA-N 0.000 description 4
- QRULNKJGYQQZMW-ZLUOBGJFSA-N Asp-Asn-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QRULNKJGYQQZMW-ZLUOBGJFSA-N 0.000 description 4
- MJKBOVWWADWLHV-ZLUOBGJFSA-N Asp-Cys-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)C(=O)O MJKBOVWWADWLHV-ZLUOBGJFSA-N 0.000 description 4
- NYQHSUGFEWDWPD-ACZMJKKPSA-N Asp-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N NYQHSUGFEWDWPD-ACZMJKKPSA-N 0.000 description 4
- KIJLEFNHWSXHRU-NUMRIWBASA-N Asp-Gln-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KIJLEFNHWSXHRU-NUMRIWBASA-N 0.000 description 4
- ZSJFGGSPCCHMNE-LAEOZQHASA-N Asp-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N ZSJFGGSPCCHMNE-LAEOZQHASA-N 0.000 description 4
- XJQRWGXKUSDEFI-ACZMJKKPSA-N Asp-Glu-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XJQRWGXKUSDEFI-ACZMJKKPSA-N 0.000 description 4
- XAJRHVUUVUPFQL-ACZMJKKPSA-N Asp-Glu-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XAJRHVUUVUPFQL-ACZMJKKPSA-N 0.000 description 4
- DGKCOYGQLNWNCJ-ACZMJKKPSA-N Asp-Glu-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O DGKCOYGQLNWNCJ-ACZMJKKPSA-N 0.000 description 4
- BIVYLQMZPHDUIH-WHFBIAKZSA-N Asp-Gly-Cys Chemical compound C([C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N)C(=O)O BIVYLQMZPHDUIH-WHFBIAKZSA-N 0.000 description 4
- OMMIEVATLAGRCK-BYPYZUCNSA-N Asp-Gly-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)NCC(O)=O OMMIEVATLAGRCK-BYPYZUCNSA-N 0.000 description 4
- TVIZQBFURPLQDV-DJFWLOJKSA-N Asp-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)O)N TVIZQBFURPLQDV-DJFWLOJKSA-N 0.000 description 4
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 4
- RPUYTJJZXQBWDT-SRVKXCTJSA-N Asp-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N RPUYTJJZXQBWDT-SRVKXCTJSA-N 0.000 description 4
- GPPIDDWYKJPRES-YDHLFZDLSA-N Asp-Phe-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O GPPIDDWYKJPRES-YDHLFZDLSA-N 0.000 description 4
- KESWRFKUZRUTAH-FXQIFTODSA-N Asp-Pro-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O KESWRFKUZRUTAH-FXQIFTODSA-N 0.000 description 4
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 4
- SFJUYBCDQBAYAJ-YDHLFZDLSA-N Asp-Val-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SFJUYBCDQBAYAJ-YDHLFZDLSA-N 0.000 description 4
- QPDUWAUSSWGJSB-NGZCFLSTSA-N Asp-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N QPDUWAUSSWGJSB-NGZCFLSTSA-N 0.000 description 4
- 241000282472 Canis lupus familiaris Species 0.000 description 4
- 108020004705 Codon Proteins 0.000 description 4
- PRVVCRZLTJNPCS-FXQIFTODSA-N Cys-Arg-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CS)N)CN=C(N)N PRVVCRZLTJNPCS-FXQIFTODSA-N 0.000 description 4
- PQHYZJPCYRDYNE-QWRGUYRKSA-N Cys-Gly-Phe Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PQHYZJPCYRDYNE-QWRGUYRKSA-N 0.000 description 4
- SKSJPIBFNFPTJB-NKWVEPMBSA-N Cys-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CS)N)C(=O)O SKSJPIBFNFPTJB-NKWVEPMBSA-N 0.000 description 4
- SBDVXRYCOIEYNV-YUMQZZPRSA-N Cys-His-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CS)N SBDVXRYCOIEYNV-YUMQZZPRSA-N 0.000 description 4
- LKUCSUGWHYVYLP-GHCJXIJMSA-N Cys-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CS)N LKUCSUGWHYVYLP-GHCJXIJMSA-N 0.000 description 4
- SRIRHERUAMYIOQ-CIUDSAMLSA-N Cys-Leu-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SRIRHERUAMYIOQ-CIUDSAMLSA-N 0.000 description 4
- DQUWSUWXPWGTQT-DCAQKATOSA-N Cys-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CS DQUWSUWXPWGTQT-DCAQKATOSA-N 0.000 description 4
- ALTQTAKGRFLRLR-GUBZILKMSA-N Cys-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CS)N ALTQTAKGRFLRLR-GUBZILKMSA-N 0.000 description 4
- 230000004543 DNA replication Effects 0.000 description 4
- SHERTACNJPYHAR-ACZMJKKPSA-N Gln-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O SHERTACNJPYHAR-ACZMJKKPSA-N 0.000 description 4
- PXAFHUATEHLECW-GUBZILKMSA-N Gln-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N PXAFHUATEHLECW-GUBZILKMSA-N 0.000 description 4
- ZBKUIQNCRIYVGH-SDDRHHMPSA-N Gln-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZBKUIQNCRIYVGH-SDDRHHMPSA-N 0.000 description 4
- XQDGOJPVMSWZSO-SRVKXCTJSA-N Gln-Pro-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N XQDGOJPVMSWZSO-SRVKXCTJSA-N 0.000 description 4
- VDMABHYXBULDGN-LAEOZQHASA-N Gln-Val-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O VDMABHYXBULDGN-LAEOZQHASA-N 0.000 description 4
- NCWOMXABNYEPLY-NRPADANISA-N Glu-Ala-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O NCWOMXABNYEPLY-NRPADANISA-N 0.000 description 4
- VPKBCVUDBNINAH-GARJFASQSA-N Glu-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O VPKBCVUDBNINAH-GARJFASQSA-N 0.000 description 4
- DYFJZDDQPNIPAB-NHCYSSNCSA-N Glu-Arg-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O DYFJZDDQPNIPAB-NHCYSSNCSA-N 0.000 description 4
- DSPQRJXOIXHOHK-WDSKDSINSA-N Glu-Asp-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O DSPQRJXOIXHOHK-WDSKDSINSA-N 0.000 description 4
- GFLQTABMFBXRIY-GUBZILKMSA-N Glu-Gln-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GFLQTABMFBXRIY-GUBZILKMSA-N 0.000 description 4
- WRNAXCVRSBBKGS-BQBZGAKWSA-N Glu-Gly-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O WRNAXCVRSBBKGS-BQBZGAKWSA-N 0.000 description 4
- DVLZZEPUNFEUBW-AVGNSLFASA-N Glu-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N DVLZZEPUNFEUBW-AVGNSLFASA-N 0.000 description 4
- QXDXIXFSFHUYAX-MNXVOIDGSA-N Glu-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O QXDXIXFSFHUYAX-MNXVOIDGSA-N 0.000 description 4
- WNRZUESNGGDCJX-JYJNAYRXSA-N Glu-Leu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WNRZUESNGGDCJX-JYJNAYRXSA-N 0.000 description 4
- IOUQWHIEQYQVFD-JYJNAYRXSA-N Glu-Leu-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IOUQWHIEQYQVFD-JYJNAYRXSA-N 0.000 description 4
- AOCARQDSFTWWFT-DCAQKATOSA-N Glu-Met-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AOCARQDSFTWWFT-DCAQKATOSA-N 0.000 description 4
- PMSMKNYRZCKVMC-DRZSPHRISA-N Glu-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCC(=O)O)N PMSMKNYRZCKVMC-DRZSPHRISA-N 0.000 description 4
- QJVZSVUYZFYLFQ-CIUDSAMLSA-N Glu-Pro-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O QJVZSVUYZFYLFQ-CIUDSAMLSA-N 0.000 description 4
- SYWCGQOIIARSIX-SRVKXCTJSA-N Glu-Pro-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O SYWCGQOIIARSIX-SRVKXCTJSA-N 0.000 description 4
- LPHGXOWFAXFCPX-KKUMJFAQSA-N Glu-Pro-Phe Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O LPHGXOWFAXFCPX-KKUMJFAQSA-N 0.000 description 4
- DCBSZJJHOTXMHY-DCAQKATOSA-N Glu-Pro-Pro Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DCBSZJJHOTXMHY-DCAQKATOSA-N 0.000 description 4
- RFTVTKBHDXCEEX-WDSKDSINSA-N Glu-Ser-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RFTVTKBHDXCEEX-WDSKDSINSA-N 0.000 description 4
- CAQXJMUDOLSBPF-SUSMZKCASA-N Glu-Thr-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAQXJMUDOLSBPF-SUSMZKCASA-N 0.000 description 4
- VHPVBPCCWVDGJL-IRIUXVKKSA-N Glu-Thr-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VHPVBPCCWVDGJL-IRIUXVKKSA-N 0.000 description 4
- DLISPGXMKZTWQG-IFFSRLJSSA-N Glu-Thr-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O DLISPGXMKZTWQG-IFFSRLJSSA-N 0.000 description 4
- QXUPRMQJDWJDFR-NRPADANISA-N Glu-Val-Ser Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXUPRMQJDWJDFR-NRPADANISA-N 0.000 description 4
- RLFSBAPJTYKSLG-WHFBIAKZSA-N Gly-Ala-Asp Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O RLFSBAPJTYKSLG-WHFBIAKZSA-N 0.000 description 4
- QIZJOTQTCAGKPU-KWQFWETISA-N Gly-Ala-Tyr Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 QIZJOTQTCAGKPU-KWQFWETISA-N 0.000 description 4
- UPOJUWHGMDJUQZ-IUCAKERBSA-N Gly-Arg-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UPOJUWHGMDJUQZ-IUCAKERBSA-N 0.000 description 4
- CLODWIOAKCSBAN-BQBZGAKWSA-N Gly-Arg-Asp Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O CLODWIOAKCSBAN-BQBZGAKWSA-N 0.000 description 4
- JPXNYFOHTHSREU-UWVGGRQHSA-N Gly-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN JPXNYFOHTHSREU-UWVGGRQHSA-N 0.000 description 4
- VXKCPBPQEKKERH-IUCAKERBSA-N Gly-Arg-Pro Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N1CCC[C@H]1C(O)=O VXKCPBPQEKKERH-IUCAKERBSA-N 0.000 description 4
- QCTLGOYODITHPQ-WHFBIAKZSA-N Gly-Cys-Ser Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O QCTLGOYODITHPQ-WHFBIAKZSA-N 0.000 description 4
- GNPVTZJUUBPZKW-WDSKDSINSA-N Gly-Gln-Ser Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GNPVTZJUUBPZKW-WDSKDSINSA-N 0.000 description 4
- MOJKRXIRAZPZLW-WDSKDSINSA-N Gly-Glu-Ala Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MOJKRXIRAZPZLW-WDSKDSINSA-N 0.000 description 4
- DHDOADIPGZTAHT-YUMQZZPRSA-N Gly-Glu-Arg Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DHDOADIPGZTAHT-YUMQZZPRSA-N 0.000 description 4
- FIQQRCFQXGLOSZ-WDSKDSINSA-N Gly-Glu-Asp Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FIQQRCFQXGLOSZ-WDSKDSINSA-N 0.000 description 4
- MBOAPAXLTUSMQI-JHEQGTHGSA-N Gly-Glu-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MBOAPAXLTUSMQI-JHEQGTHGSA-N 0.000 description 4
- KAJAOGBVWCYGHZ-JTQLQIEISA-N Gly-Gly-Phe Chemical compound [NH3+]CC(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KAJAOGBVWCYGHZ-JTQLQIEISA-N 0.000 description 4
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 4
- HKSNHPVETYYJBK-LAEOZQHASA-N Gly-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)CN HKSNHPVETYYJBK-LAEOZQHASA-N 0.000 description 4
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 4
- PDUHNKAFQXQNLH-ZETCQYMHSA-N Gly-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)NCC(O)=O PDUHNKAFQXQNLH-ZETCQYMHSA-N 0.000 description 4
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 4
- YLEIWGJJBFBFHC-KBPBESRZSA-N Gly-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 YLEIWGJJBFBFHC-KBPBESRZSA-N 0.000 description 4
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 4
- CQMFNTVQVLQRLT-JHEQGTHGSA-N Gly-Thr-Gln Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O CQMFNTVQVLQRLT-JHEQGTHGSA-N 0.000 description 4
- MYXNLWDWWOTERK-BHNWBGBOSA-N Gly-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN)O MYXNLWDWWOTERK-BHNWBGBOSA-N 0.000 description 4
- AFMOTCMSEBITOE-YEPSODPASA-N Gly-Val-Thr Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AFMOTCMSEBITOE-YEPSODPASA-N 0.000 description 4
- XINDHUAGVGCNSF-QSFUFRPTSA-N His-Ala-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XINDHUAGVGCNSF-QSFUFRPTSA-N 0.000 description 4
- HTZKFIYQMHJWSQ-INTQDDNPSA-N His-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N HTZKFIYQMHJWSQ-INTQDDNPSA-N 0.000 description 4
- ZPVJJPAIUZLSNE-DCAQKATOSA-N His-Arg-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O ZPVJJPAIUZLSNE-DCAQKATOSA-N 0.000 description 4
- DVHGLDYMGWTYKW-GUBZILKMSA-N His-Gln-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DVHGLDYMGWTYKW-GUBZILKMSA-N 0.000 description 4
- AKEDPWJFQULLPE-IUCAKERBSA-N His-Glu-Gly Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O AKEDPWJFQULLPE-IUCAKERBSA-N 0.000 description 4
- ZRSJXIKQXUGKRB-TUBUOCAGSA-N His-Ile-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZRSJXIKQXUGKRB-TUBUOCAGSA-N 0.000 description 4
- AIPUZFXMXAHZKY-QWRGUYRKSA-N His-Leu-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AIPUZFXMXAHZKY-QWRGUYRKSA-N 0.000 description 4
- BSVLMPMIXPQNKC-KBPBESRZSA-N His-Phe-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O BSVLMPMIXPQNKC-KBPBESRZSA-N 0.000 description 4
- PGXZHYYGOPKYKM-IHRRRGAJSA-N His-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CN=CN2)N)C(=O)N[C@@H](CCCCN)C(=O)O PGXZHYYGOPKYKM-IHRRRGAJSA-N 0.000 description 4
- ZHHLTWUOWXHVQJ-YUMQZZPRSA-N His-Ser-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZHHLTWUOWXHVQJ-YUMQZZPRSA-N 0.000 description 4
- WYKXJGWSJUULSL-AVGNSLFASA-N His-Val-Arg Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)Cc1cnc[nH]1)C(=O)N[C@@H](CCCNC(=N)N)C(=O)O WYKXJGWSJUULSL-AVGNSLFASA-N 0.000 description 4
- CGAMSLMBYJHMDY-ONGXEEELSA-N His-Val-Gly Chemical compound CC(C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N CGAMSLMBYJHMDY-ONGXEEELSA-N 0.000 description 4
- DRKZDEFADVYTLU-AVGNSLFASA-N His-Val-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O DRKZDEFADVYTLU-AVGNSLFASA-N 0.000 description 4
- LPFBXFILACZHIB-LAEOZQHASA-N Ile-Gly-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)O)C(=O)O)N LPFBXFILACZHIB-LAEOZQHASA-N 0.000 description 4
- CDGLBYSAZFIIJO-RCOVLWMOSA-N Ile-Gly-Gly Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O CDGLBYSAZFIIJO-RCOVLWMOSA-N 0.000 description 4
- UASTVUQJMLZWGG-PEXQALLHSA-N Ile-His-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)NCC(=O)O)N UASTVUQJMLZWGG-PEXQALLHSA-N 0.000 description 4
- IMRKCLXPYOIHIF-ZPFDUUQYSA-N Ile-Met-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N IMRKCLXPYOIHIF-ZPFDUUQYSA-N 0.000 description 4
- RQJUKVXWAKJDBW-SVSWQMSJSA-N Ile-Ser-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N RQJUKVXWAKJDBW-SVSWQMSJSA-N 0.000 description 4
- RMJWFINHACYKJI-SIUGBPQLSA-N Ile-Tyr-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RMJWFINHACYKJI-SIUGBPQLSA-N 0.000 description 4
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 4
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 4
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 4
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 4
- KWTVLKBOQATPHJ-SRVKXCTJSA-N Leu-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N KWTVLKBOQATPHJ-SRVKXCTJSA-N 0.000 description 4
- XIRYQRLFHWWWTC-QEJZJMRPSA-N Leu-Ala-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XIRYQRLFHWWWTC-QEJZJMRPSA-N 0.000 description 4
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 4
- VKOAHIRLIUESLU-ULQDDVLXSA-N Leu-Arg-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VKOAHIRLIUESLU-ULQDDVLXSA-N 0.000 description 4
- MMEDVBWCMGRKKC-GARJFASQSA-N Leu-Asp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N MMEDVBWCMGRKKC-GARJFASQSA-N 0.000 description 4
- KUEVMUXNILMJTK-JYJNAYRXSA-N Leu-Gln-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KUEVMUXNILMJTK-JYJNAYRXSA-N 0.000 description 4
- ZFNLIDNJUWNIJL-WDCWCFNPSA-N Leu-Glu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZFNLIDNJUWNIJL-WDCWCFNPSA-N 0.000 description 4
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 4
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 4
- UCNNZELZXFXXJQ-BZSNNMDCSA-N Leu-Leu-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UCNNZELZXFXXJQ-BZSNNMDCSA-N 0.000 description 4
- REPBGZHJKYWFMJ-KKUMJFAQSA-N Leu-Lys-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N REPBGZHJKYWFMJ-KKUMJFAQSA-N 0.000 description 4
- PKKMDPNFGULLNQ-AVGNSLFASA-N Leu-Met-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O PKKMDPNFGULLNQ-AVGNSLFASA-N 0.000 description 4
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 4
- AKVBOOKXVAMKSS-GUBZILKMSA-N Leu-Ser-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O AKVBOOKXVAMKSS-GUBZILKMSA-N 0.000 description 4
- LFSQWRSVPNKJGP-WDCWCFNPSA-N Leu-Thr-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O LFSQWRSVPNKJGP-WDCWCFNPSA-N 0.000 description 4
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 4
- JGKHAFUAPZCCDU-BZSNNMDCSA-N Leu-Tyr-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=C(O)C=C1 JGKHAFUAPZCCDU-BZSNNMDCSA-N 0.000 description 4
- IBQMEXQYZMVIFU-SRVKXCTJSA-N Lys-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N IBQMEXQYZMVIFU-SRVKXCTJSA-N 0.000 description 4
- NDORZBUHCOJQDO-GVXVVHGQSA-N Lys-Gln-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O NDORZBUHCOJQDO-GVXVVHGQSA-N 0.000 description 4
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 4
- LUTDBHBIHHREDC-IHRRRGAJSA-N Lys-Pro-Lys Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O LUTDBHBIHHREDC-IHRRRGAJSA-N 0.000 description 4
- YTJFXEDRUOQGSP-DCAQKATOSA-N Lys-Pro-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O YTJFXEDRUOQGSP-DCAQKATOSA-N 0.000 description 4
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 4
- ONGCSGVHCSAATF-CIUDSAMLSA-N Met-Ala-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O ONGCSGVHCSAATF-CIUDSAMLSA-N 0.000 description 4
- BVXXDMUMHMXFER-BPNCWPANSA-N Met-Ala-Tyr Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BVXXDMUMHMXFER-BPNCWPANSA-N 0.000 description 4
- WDTLNWHPIPCMMP-AVGNSLFASA-N Met-Arg-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O WDTLNWHPIPCMMP-AVGNSLFASA-N 0.000 description 4
- SQUTUWHAAWJYES-GUBZILKMSA-N Met-Asp-Arg Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SQUTUWHAAWJYES-GUBZILKMSA-N 0.000 description 4
- JPCHYAUKOUGOIB-HJGDQZAQSA-N Met-Glu-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPCHYAUKOUGOIB-HJGDQZAQSA-N 0.000 description 4
- CHDYFPCQVUOJEB-ULQDDVLXSA-N Met-Leu-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 CHDYFPCQVUOJEB-ULQDDVLXSA-N 0.000 description 4
- XIGAHPDZLAYQOS-SRVKXCTJSA-N Met-Pro-Pro Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 XIGAHPDZLAYQOS-SRVKXCTJSA-N 0.000 description 4
- JACMWNXOOUYXCD-JYJNAYRXSA-N Met-Val-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JACMWNXOOUYXCD-JYJNAYRXSA-N 0.000 description 4
- 108010066427 N-valyltryptophan Proteins 0.000 description 4
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 4
- UHRNIXJAGGLKHP-DLOVCJGASA-N Phe-Ala-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O UHRNIXJAGGLKHP-DLOVCJGASA-N 0.000 description 4
- VHWOBXIWBDWZHK-IHRRRGAJSA-N Phe-Arg-Asp Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 VHWOBXIWBDWZHK-IHRRRGAJSA-N 0.000 description 4
- KLXQWABNAWDRAY-ACRUOGEOSA-N Phe-Lys-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 KLXQWABNAWDRAY-ACRUOGEOSA-N 0.000 description 4
- SRILZRSXIKRGBF-HRCADAONSA-N Phe-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N SRILZRSXIKRGBF-HRCADAONSA-N 0.000 description 4
- OWSLLRKCHLTUND-BZSNNMDCSA-N Phe-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OWSLLRKCHLTUND-BZSNNMDCSA-N 0.000 description 4
- AXIOGMQCDYVTNY-ACRUOGEOSA-N Phe-Phe-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 AXIOGMQCDYVTNY-ACRUOGEOSA-N 0.000 description 4
- XDMMOISUAHXXFD-SRVKXCTJSA-N Phe-Ser-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O XDMMOISUAHXXFD-SRVKXCTJSA-N 0.000 description 4
- VGTJSEYTVMAASM-RPTUDFQQSA-N Phe-Thr-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VGTJSEYTVMAASM-RPTUDFQQSA-N 0.000 description 4
- VFDRDMOMHBJGKD-UFYCRDLUSA-N Phe-Tyr-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N VFDRDMOMHBJGKD-UFYCRDLUSA-N 0.000 description 4
- OLHDPZMYUSBGDE-GUBZILKMSA-N Pro-Arg-Cys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O OLHDPZMYUSBGDE-GUBZILKMSA-N 0.000 description 4
- LSIWVWRUTKPXDS-DCAQKATOSA-N Pro-Gln-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LSIWVWRUTKPXDS-DCAQKATOSA-N 0.000 description 4
- ULIWFCCJIOEHMU-BQBZGAKWSA-N Pro-Gly-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 ULIWFCCJIOEHMU-BQBZGAKWSA-N 0.000 description 4
- FKLSMYYLJHYPHH-UWVGGRQHSA-N Pro-Gly-Leu Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O FKLSMYYLJHYPHH-UWVGGRQHSA-N 0.000 description 4
- XQSREVQDGCPFRJ-STQMWFEESA-N Pro-Gly-Phe Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XQSREVQDGCPFRJ-STQMWFEESA-N 0.000 description 4
- LCUOTSLIVGSGAU-AVGNSLFASA-N Pro-His-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LCUOTSLIVGSGAU-AVGNSLFASA-N 0.000 description 4
- FXGIMYRVJJEIIM-UWVGGRQHSA-N Pro-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FXGIMYRVJJEIIM-UWVGGRQHSA-N 0.000 description 4
- FYPGHGXAOZTOBO-IHRRRGAJSA-N Pro-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2 FYPGHGXAOZTOBO-IHRRRGAJSA-N 0.000 description 4
- WFIVLLFYUZZWOD-RHYQMDGZSA-N Pro-Lys-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WFIVLLFYUZZWOD-RHYQMDGZSA-N 0.000 description 4
- RCYUBVHMVUHEBM-RCWTZXSCSA-N Pro-Pro-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RCYUBVHMVUHEBM-RCWTZXSCSA-N 0.000 description 4
- FNGOXVQBBCMFKV-CIUDSAMLSA-N Pro-Ser-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O FNGOXVQBBCMFKV-CIUDSAMLSA-N 0.000 description 4
- RNEFESSBTOQSAC-DCAQKATOSA-N Pro-Ser-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O RNEFESSBTOQSAC-DCAQKATOSA-N 0.000 description 4
- SNGZLPOXVRTNMB-LPEHRKFASA-N Pro-Ser-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N2CCC[C@@H]2C(=O)O SNGZLPOXVRTNMB-LPEHRKFASA-N 0.000 description 4
- XSXABUHLKPUVLX-JYJNAYRXSA-N Pro-Ser-Trp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O XSXABUHLKPUVLX-JYJNAYRXSA-N 0.000 description 4
- PRKWBYCXBBSLSK-GUBZILKMSA-N Pro-Ser-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O PRKWBYCXBBSLSK-GUBZILKMSA-N 0.000 description 4
- HRIXMVRZRGFKNQ-HJGDQZAQSA-N Pro-Thr-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HRIXMVRZRGFKNQ-HJGDQZAQSA-N 0.000 description 4
- VVAWNPIOYXAMAL-KJEVXHAQSA-N Pro-Thr-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VVAWNPIOYXAMAL-KJEVXHAQSA-N 0.000 description 4
- YIPFBJGBRCJJJD-FHWLQOOXSA-N Pro-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@@H]3CCCN3 YIPFBJGBRCJJJD-FHWLQOOXSA-N 0.000 description 4
- DLZBBDSPTJBOOD-BPNCWPANSA-N Pro-Tyr-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O DLZBBDSPTJBOOD-BPNCWPANSA-N 0.000 description 4
- 101001106219 Rattus norvegicus Ribonuclease pancreatic beta-type Proteins 0.000 description 4
- 108700008625 Reporter Genes Proteins 0.000 description 4
- 101500000017 Ricinus communis Allergen Ric c 1 large chain Proteins 0.000 description 4
- SRTCFKGBYBZRHA-ACZMJKKPSA-N Ser-Ala-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SRTCFKGBYBZRHA-ACZMJKKPSA-N 0.000 description 4
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 4
- BRKHVZNDAOMAHX-BIIVOSGPSA-N Ser-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N BRKHVZNDAOMAHX-BIIVOSGPSA-N 0.000 description 4
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 4
- IDCKUIWEIZYVSO-WFBYXXMGSA-N Ser-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C)C(O)=O)=CNC2=C1 IDCKUIWEIZYVSO-WFBYXXMGSA-N 0.000 description 4
- OYEDZGNMSBZCIM-XGEHTFHBSA-N Ser-Arg-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OYEDZGNMSBZCIM-XGEHTFHBSA-N 0.000 description 4
- FIDMVVBUOCMMJG-CIUDSAMLSA-N Ser-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO FIDMVVBUOCMMJG-CIUDSAMLSA-N 0.000 description 4
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 4
- GZBKRJVCRMZAST-XKBZYTNZSA-N Ser-Glu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZBKRJVCRMZAST-XKBZYTNZSA-N 0.000 description 4
- JFWDJFULOLKQFY-QWRGUYRKSA-N Ser-Gly-Phe Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JFWDJFULOLKQFY-QWRGUYRKSA-N 0.000 description 4
- KDGARKCAKHBEDB-NKWVEPMBSA-N Ser-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CO)N)C(=O)O KDGARKCAKHBEDB-NKWVEPMBSA-N 0.000 description 4
- KJKQUQXDEKMPDK-FXQIFTODSA-N Ser-Met-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O KJKQUQXDEKMPDK-FXQIFTODSA-N 0.000 description 4
- AXOHAHIUJHCLQR-IHRRRGAJSA-N Ser-Met-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CO)N AXOHAHIUJHCLQR-IHRRRGAJSA-N 0.000 description 4
- ADJDNJCSPNFFPI-FXQIFTODSA-N Ser-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO ADJDNJCSPNFFPI-FXQIFTODSA-N 0.000 description 4
- AZWNCEBQZXELEZ-FXQIFTODSA-N Ser-Pro-Ser Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O AZWNCEBQZXELEZ-FXQIFTODSA-N 0.000 description 4
- FLONGDPORFIVQW-XGEHTFHBSA-N Ser-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FLONGDPORFIVQW-XGEHTFHBSA-N 0.000 description 4
- SZRNDHWMVSFPSP-XKBZYTNZSA-N Ser-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N)O SZRNDHWMVSFPSP-XKBZYTNZSA-N 0.000 description 4
- WMZVVNLPHFSUPA-BPUTZDHNSA-N Ser-Trp-Arg Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 WMZVVNLPHFSUPA-BPUTZDHNSA-N 0.000 description 4
- YXEYTHXDRDAIOJ-CWRNSKLLSA-N Ser-Trp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CO)N)C(=O)O YXEYTHXDRDAIOJ-CWRNSKLLSA-N 0.000 description 4
- PIQRHJQWEPWFJG-UWJYBYFXSA-N Ser-Tyr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PIQRHJQWEPWFJG-UWJYBYFXSA-N 0.000 description 4
- LSHUNRICNSEEAN-BPUTZDHNSA-N Ser-Val-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CO)N LSHUNRICNSEEAN-BPUTZDHNSA-N 0.000 description 4
- ODRUTDLAONAVDV-IHRRRGAJSA-N Ser-Val-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ODRUTDLAONAVDV-IHRRRGAJSA-N 0.000 description 4
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 4
- CAJFZCICSVBOJK-SHGPDSBTSA-N Thr-Ala-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAJFZCICSVBOJK-SHGPDSBTSA-N 0.000 description 4
- TZKPNGDGUVREEB-FOHZUACHSA-N Thr-Asn-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O TZKPNGDGUVREEB-FOHZUACHSA-N 0.000 description 4
- GKMYGVQDGVYCPC-IUKAMOBKSA-N Thr-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H]([C@@H](C)O)N GKMYGVQDGVYCPC-IUKAMOBKSA-N 0.000 description 4
- VLIUBAATANYCOY-GBALPHGKSA-N Thr-Cys-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O VLIUBAATANYCOY-GBALPHGKSA-N 0.000 description 4
- KCRQEJSKXAIULJ-FJXKBIBVSA-N Thr-Gly-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O KCRQEJSKXAIULJ-FJXKBIBVSA-N 0.000 description 4
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 4
- YUOCMLNTUZAGNF-KLHWPWHYSA-N Thr-His-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N)O YUOCMLNTUZAGNF-KLHWPWHYSA-N 0.000 description 4
- YUPVPKZBKCLFLT-QTKMDUPCSA-N Thr-His-Val Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C(C)C)C(=O)O)N)O YUPVPKZBKCLFLT-QTKMDUPCSA-N 0.000 description 4
- GMXIJHCBTZDAPD-QPHKQPEJSA-N Thr-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N GMXIJHCBTZDAPD-QPHKQPEJSA-N 0.000 description 4
- AHOLTQCAVBSUDP-PPCPHDFISA-N Thr-Ile-Lys Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)[C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O AHOLTQCAVBSUDP-PPCPHDFISA-N 0.000 description 4
- PCMDGXKXVMBIFP-VEVYYDQMSA-N Thr-Met-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(O)=O PCMDGXKXVMBIFP-VEVYYDQMSA-N 0.000 description 4
- WYLAVUAWOUVUCA-XVSYOHENSA-N Thr-Phe-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WYLAVUAWOUVUCA-XVSYOHENSA-N 0.000 description 4
- MXNAOGFNFNKUPD-JHYOHUSXSA-N Thr-Phe-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MXNAOGFNFNKUPD-JHYOHUSXSA-N 0.000 description 4
- WTMPKZWHRCMMMT-KZVJFYERSA-N Thr-Pro-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WTMPKZWHRCMMMT-KZVJFYERSA-N 0.000 description 4
- MUAFDCVOHYAFNG-RCWTZXSCSA-N Thr-Pro-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MUAFDCVOHYAFNG-RCWTZXSCSA-N 0.000 description 4
- XKWABWFMQXMUMT-HJGDQZAQSA-N Thr-Pro-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XKWABWFMQXMUMT-HJGDQZAQSA-N 0.000 description 4
- NBIIPOKZPUGATB-BWBBJGPYSA-N Thr-Ser-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N)O NBIIPOKZPUGATB-BWBBJGPYSA-N 0.000 description 4
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 4
- QJIODPFLAASXJC-JHYOHUSXSA-N Thr-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O QJIODPFLAASXJC-JHYOHUSXSA-N 0.000 description 4
- ZEJBJDHSQPOVJV-UAXMHLISSA-N Thr-Trp-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZEJBJDHSQPOVJV-UAXMHLISSA-N 0.000 description 4
- VYVBSMCZNHOZGD-RCWTZXSCSA-N Thr-Val-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O VYVBSMCZNHOZGD-RCWTZXSCSA-N 0.000 description 4
- BIJDDZBDSJLWJY-PJODQICGSA-N Trp-Ala-Val Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O BIJDDZBDSJLWJY-PJODQICGSA-N 0.000 description 4
- HOJPPPKZWFRTHJ-PJODQICGSA-N Trp-Arg-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N HOJPPPKZWFRTHJ-PJODQICGSA-N 0.000 description 4
- CZSMNLQMRWPGQF-XEGUGMAKSA-N Trp-Gln-Ala Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CZSMNLQMRWPGQF-XEGUGMAKSA-N 0.000 description 4
- VTHNLRXALGUDBS-BPUTZDHNSA-N Trp-Gln-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N VTHNLRXALGUDBS-BPUTZDHNSA-N 0.000 description 4
- AKFLVKKWVZMFOT-IHRRRGAJSA-N Tyr-Arg-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O AKFLVKKWVZMFOT-IHRRRGAJSA-N 0.000 description 4
- STTVVMWQKDOKAM-YESZJQIVSA-N Tyr-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O STTVVMWQKDOKAM-YESZJQIVSA-N 0.000 description 4
- KSCVLGXNQXKUAR-JYJNAYRXSA-N Tyr-Leu-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KSCVLGXNQXKUAR-JYJNAYRXSA-N 0.000 description 4
- AUZADXNWQMBZOO-JYJNAYRXSA-N Tyr-Pro-Arg Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)C1=CC=C(O)C=C1 AUZADXNWQMBZOO-JYJNAYRXSA-N 0.000 description 4
- UMSZZGTXGKHTFJ-SRVKXCTJSA-N Tyr-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 UMSZZGTXGKHTFJ-SRVKXCTJSA-N 0.000 description 4
- YKBUNNNRNZZUID-UFYCRDLUSA-N Tyr-Val-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YKBUNNNRNZZUID-UFYCRDLUSA-N 0.000 description 4
- KKHRWGYHBZORMQ-NHCYSSNCSA-N Val-Arg-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKHRWGYHBZORMQ-NHCYSSNCSA-N 0.000 description 4
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 4
- HZYOWMGWKKRMBZ-BYULHYEWSA-N Val-Asp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZYOWMGWKKRMBZ-BYULHYEWSA-N 0.000 description 4
- XJFXZQKJQGYFMM-GUBZILKMSA-N Val-Cys-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)O)N XJFXZQKJQGYFMM-GUBZILKMSA-N 0.000 description 4
- AGKDVLSDNSTLFA-UMNHJUIQSA-N Val-Gln-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N AGKDVLSDNSTLFA-UMNHJUIQSA-N 0.000 description 4
- VLDMQVZZWDOKQF-AUTRQRHGSA-N Val-Glu-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VLDMQVZZWDOKQF-AUTRQRHGSA-N 0.000 description 4
- VVZDBPBZHLQPPB-XVKPBYJWSA-N Val-Glu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VVZDBPBZHLQPPB-XVKPBYJWSA-N 0.000 description 4
- CELJCNRXKZPTCX-XPUUQOCRSA-N Val-Gly-Ala Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O CELJCNRXKZPTCX-XPUUQOCRSA-N 0.000 description 4
- MDYSKHBSPXUOPV-JSGCOSHPSA-N Val-Gly-Phe Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N MDYSKHBSPXUOPV-JSGCOSHPSA-N 0.000 description 4
- CPGJELLYDQEDRK-NAKRPEOUSA-N Val-Ile-Ala Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](C)C(O)=O CPGJELLYDQEDRK-NAKRPEOUSA-N 0.000 description 4
- JAKHAONCJJZVHT-DCAQKATOSA-N Val-Lys-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N JAKHAONCJJZVHT-DCAQKATOSA-N 0.000 description 4
- MBGFDZDWMDLXHQ-GUBZILKMSA-N Val-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N MBGFDZDWMDLXHQ-GUBZILKMSA-N 0.000 description 4
- JVGHIFMSFBZDHH-WPRPVWTQSA-N Val-Met-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)NCC(=O)O)N JVGHIFMSFBZDHH-WPRPVWTQSA-N 0.000 description 4
- LJSZPMSUYKKKCP-UBHSHLNASA-N Val-Phe-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 LJSZPMSUYKKKCP-UBHSHLNASA-N 0.000 description 4
- CKTMJBPRVQWPHU-JSGCOSHPSA-N Val-Phe-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)O)N CKTMJBPRVQWPHU-JSGCOSHPSA-N 0.000 description 4
- JMCOXFSCTGKLLB-FKBYEOEOSA-N Val-Phe-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N JMCOXFSCTGKLLB-FKBYEOEOSA-N 0.000 description 4
- HPOSMQWRPMRMFO-GUBZILKMSA-N Val-Pro-Cys Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)O)N HPOSMQWRPMRMFO-GUBZILKMSA-N 0.000 description 4
- NHXZRXLFOBFMDM-AVGNSLFASA-N Val-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C NHXZRXLFOBFMDM-AVGNSLFASA-N 0.000 description 4
- DOFAQXCYFQKSHT-SRVKXCTJSA-N Val-Pro-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DOFAQXCYFQKSHT-SRVKXCTJSA-N 0.000 description 4
- MIKHIIQMRFYVOR-RCWTZXSCSA-N Val-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C(C)C)N)O MIKHIIQMRFYVOR-RCWTZXSCSA-N 0.000 description 4
- PGQUDQYHWICSAB-NAKRPEOUSA-N Val-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N PGQUDQYHWICSAB-NAKRPEOUSA-N 0.000 description 4
- UVHFONIHVHLDDQ-IFFSRLJSSA-N Val-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O UVHFONIHVHLDDQ-IFFSRLJSSA-N 0.000 description 4
- DOBHJKVVACOQTN-DZKIICNBSA-N Val-Tyr-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=C(O)C=C1 DOBHJKVVACOQTN-DZKIICNBSA-N 0.000 description 4
- PMKQKNBISAOSRI-XHSDSOJGSA-N Val-Tyr-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N PMKQKNBISAOSRI-XHSDSOJGSA-N 0.000 description 4
- DFQZDQPLWBSFEJ-LSJOCFKGSA-N Val-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N DFQZDQPLWBSFEJ-LSJOCFKGSA-N 0.000 description 4
- WHNSHJJNWNSTSU-BZSNNMDCSA-N Val-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 WHNSHJJNWNSTSU-BZSNNMDCSA-N 0.000 description 4
- 108010045350 alanyl-tyrosyl-alanine Proteins 0.000 description 4
- 108010044940 alanylglutamine Proteins 0.000 description 4
- 238000010171 animal model Methods 0.000 description 4
- 230000000259 anti-tumor effect Effects 0.000 description 4
- 108010091092 arginyl-glycyl-proline Proteins 0.000 description 4
- 108010038850 arginyl-isoleucyl-tyrosine Proteins 0.000 description 4
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 4
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 4
- 108010068265 aspartyltyrosine Proteins 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 230000027455 binding Effects 0.000 description 4
- 238000001516 cell proliferation assay Methods 0.000 description 4
- 208000011654 childhood malignant neoplasm Diseases 0.000 description 4
- 238000002784 cytotoxicity assay Methods 0.000 description 4
- 108010054813 diprotin B Proteins 0.000 description 4
- 238000001415 gene therapy Methods 0.000 description 4
- 230000002068 genetic effect Effects 0.000 description 4
- 108010020688 glycylhistidine Proteins 0.000 description 4
- 230000036541 health Effects 0.000 description 4
- 210000002216 heart Anatomy 0.000 description 4
- 108010036413 histidylglycine Proteins 0.000 description 4
- 108010018006 histidylserine Proteins 0.000 description 4
- 230000000366 juvenile effect Effects 0.000 description 4
- 230000002147 killing effect Effects 0.000 description 4
- 108010076756 leucyl-alanyl-phenylalanine Proteins 0.000 description 4
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 4
- 239000007788 liquid Substances 0.000 description 4
- 108010009298 lysylglutamic acid Proteins 0.000 description 4
- 108010038320 lysylphenylalanine Proteins 0.000 description 4
- HQKMJHAJHXVSDF-UHFFFAOYSA-L magnesium stearate Chemical compound [Mg+2].CCCCCCCCCCCCCCCCCC([O-])=O.CCCCCCCCCCCCCCCCCC([O-])=O HQKMJHAJHXVSDF-UHFFFAOYSA-L 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 239000012528 membrane Substances 0.000 description 4
- 108010056582 methionylglutamic acid Proteins 0.000 description 4
- 238000002156 mixing Methods 0.000 description 4
- 210000001672 ovary Anatomy 0.000 description 4
- 230000002335 preservative effect Effects 0.000 description 4
- 239000006228 supernatant Substances 0.000 description 4
- 230000009885 systemic effect Effects 0.000 description 4
- 238000012353 t test Methods 0.000 description 4
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 4
- 108010084932 tryptophyl-proline Proteins 0.000 description 4
- 108010079202 tyrosyl-alanyl-cysteine Proteins 0.000 description 4
- 108010005834 tyrosyl-alanyl-glycine Proteins 0.000 description 4
- 108010035534 tyrosyl-leucyl-alanine Proteins 0.000 description 4
- 108010020532 tyrosyl-proline Proteins 0.000 description 4
- 108010071635 tyrosyl-prolyl-arginine Proteins 0.000 description 4
- 108010009962 valyltyrosine Proteins 0.000 description 4
- AJDRTCHWJPWAGM-QAETUUGQSA-N (2s)-1-[2-[[(2s)-1-[(2s)-5-(diaminomethylideneamino)-2-[[(2s)-pyrrolidine-2-carbonyl]amino]pentanoyl]pyrrolidine-2-carbonyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound N([C@@H](CCCN=C(N)N)C(=O)N1[C@@H](CCC1)C(=O)NCC(=O)N1[C@@H](CCC1)C(O)=O)C(=O)[C@@H]1CCCN1 AJDRTCHWJPWAGM-QAETUUGQSA-N 0.000 description 3
- HKZAAJSTFUZYTO-LURJTMIESA-N (2s)-2-[[2-[[2-[[2-[(2-aminoacetyl)amino]acetyl]amino]acetyl]amino]acetyl]amino]-3-hydroxypropanoic acid Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O HKZAAJSTFUZYTO-LURJTMIESA-N 0.000 description 3
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 3
- WOJJIRYPFAZEPF-YFKPBYRVSA-N 2-[[(2s)-2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]propanoyl]amino]acetate Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)CNC(=O)CN WOJJIRYPFAZEPF-YFKPBYRVSA-N 0.000 description 3
- OZRFYUJEXYKQDV-UHFFFAOYSA-N 2-[[2-[[2-[(2-amino-3-carboxypropanoyl)amino]-3-carboxypropanoyl]amino]-3-carboxypropanoyl]amino]butanedioic acid Chemical compound OC(=O)CC(N)C(=O)NC(CC(O)=O)C(=O)NC(CC(O)=O)C(=O)NC(CC(O)=O)C(O)=O OZRFYUJEXYKQDV-UHFFFAOYSA-N 0.000 description 3
- 208000036762 Acute promyelocytic leukaemia Diseases 0.000 description 3
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 3
- KQFRUSHJPKXBMB-BHDSKKPTSA-N Ala-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 KQFRUSHJPKXBMB-BHDSKKPTSA-N 0.000 description 3
- LBJYAILUMSUTAM-ZLUOBGJFSA-N Ala-Asn-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O LBJYAILUMSUTAM-ZLUOBGJFSA-N 0.000 description 3
- ZEXDYVGDZJBRMO-ACZMJKKPSA-N Ala-Asn-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N ZEXDYVGDZJBRMO-ACZMJKKPSA-N 0.000 description 3
- HGRBNYQIMKTUNT-XVYDVKMFSA-N Ala-Asn-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HGRBNYQIMKTUNT-XVYDVKMFSA-N 0.000 description 3
- FXKNPWNXPQZLES-ZLUOBGJFSA-N Ala-Asn-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FXKNPWNXPQZLES-ZLUOBGJFSA-N 0.000 description 3
- LGFCAXJBAZESCF-ACZMJKKPSA-N Ala-Gln-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O LGFCAXJBAZESCF-ACZMJKKPSA-N 0.000 description 3
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 3
- BVSGPHDECMJBDE-HGNGGELXSA-N Ala-Glu-His Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N BVSGPHDECMJBDE-HGNGGELXSA-N 0.000 description 3
- XYTNPQNAZREREP-XQXXSGGOSA-N Ala-Glu-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XYTNPQNAZREREP-XQXXSGGOSA-N 0.000 description 3
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 3
- WGDNWOMKBUXFHR-BQBZGAKWSA-N Ala-Gly-Arg Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N WGDNWOMKBUXFHR-BQBZGAKWSA-N 0.000 description 3
- BEMGNWZECGIJOI-WDSKDSINSA-N Ala-Gly-Glu Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O BEMGNWZECGIJOI-WDSKDSINSA-N 0.000 description 3
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 3
- HUUOZYZWNCXTFK-INTQDDNPSA-N Ala-His-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N HUUOZYZWNCXTFK-INTQDDNPSA-N 0.000 description 3
- IFKQPMZRDQZSHI-GHCJXIJMSA-N Ala-Ile-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O IFKQPMZRDQZSHI-GHCJXIJMSA-N 0.000 description 3
- FOHXUHGZZKETFI-JBDRJPRFSA-N Ala-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C)N FOHXUHGZZKETFI-JBDRJPRFSA-N 0.000 description 3
- CFPQUJZTLUQUTJ-HTFCKZLJSA-N Ala-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](C)N CFPQUJZTLUQUTJ-HTFCKZLJSA-N 0.000 description 3
- LBYMZCVBOKYZNS-CIUDSAMLSA-N Ala-Leu-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O LBYMZCVBOKYZNS-CIUDSAMLSA-N 0.000 description 3
- OPZJWMJPCNNZNT-DCAQKATOSA-N Ala-Leu-Met Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)O)N OPZJWMJPCNNZNT-DCAQKATOSA-N 0.000 description 3
- AWNAEZICPNGAJK-FXQIFTODSA-N Ala-Met-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O AWNAEZICPNGAJK-FXQIFTODSA-N 0.000 description 3
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 3
- MAZZQZWCCYJQGZ-GUBZILKMSA-N Ala-Pro-Arg Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MAZZQZWCCYJQGZ-GUBZILKMSA-N 0.000 description 3
- BTRULDJUUVGRNE-DCAQKATOSA-N Ala-Pro-Lys Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O BTRULDJUUVGRNE-DCAQKATOSA-N 0.000 description 3
- BHTBAVZSZCQZPT-GUBZILKMSA-N Ala-Pro-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N BHTBAVZSZCQZPT-GUBZILKMSA-N 0.000 description 3
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 3
- AUFACLFHBAGZEN-ZLUOBGJFSA-N Ala-Ser-Cys Chemical compound N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O AUFACLFHBAGZEN-ZLUOBGJFSA-N 0.000 description 3
- NHWYNIZWLJYZAG-XVYDVKMFSA-N Ala-Ser-His Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N NHWYNIZWLJYZAG-XVYDVKMFSA-N 0.000 description 3
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 3
- WQKAQKZRDIZYNV-VZFHVOOUSA-N Ala-Ser-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WQKAQKZRDIZYNV-VZFHVOOUSA-N 0.000 description 3
- YEBZNKPPOHFZJM-BPNCWPANSA-N Ala-Tyr-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O YEBZNKPPOHFZJM-BPNCWPANSA-N 0.000 description 3
- BVLPIIBTWIYOML-ZKWXMUAHSA-N Ala-Val-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BVLPIIBTWIYOML-ZKWXMUAHSA-N 0.000 description 3
- DHONNEYAZPNGSG-UBHSHLNASA-N Ala-Val-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 DHONNEYAZPNGSG-UBHSHLNASA-N 0.000 description 3
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 3
- OOBVTWHLKYJFJH-FXQIFTODSA-N Arg-Ala-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O OOBVTWHLKYJFJH-FXQIFTODSA-N 0.000 description 3
- OTOXOKCIIQLMFH-KZVJFYERSA-N Arg-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N OTOXOKCIIQLMFH-KZVJFYERSA-N 0.000 description 3
- NABSCJGZKWSNHX-RCWTZXSCSA-N Arg-Arg-Thr Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NABSCJGZKWSNHX-RCWTZXSCSA-N 0.000 description 3
- CPSHGRGUPZBMOK-CIUDSAMLSA-N Arg-Asn-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O CPSHGRGUPZBMOK-CIUDSAMLSA-N 0.000 description 3
- KWTVWJPNHAOREN-IHRRRGAJSA-N Arg-Asn-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KWTVWJPNHAOREN-IHRRRGAJSA-N 0.000 description 3
- MFAMTAVAFBPXDC-LPEHRKFASA-N Arg-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O MFAMTAVAFBPXDC-LPEHRKFASA-N 0.000 description 3
- JTWOBPNAVBESFW-FXQIFTODSA-N Arg-Cys-Asp Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)CN=C(N)N JTWOBPNAVBESFW-FXQIFTODSA-N 0.000 description 3
- BEXGZLUHRXTZCC-CIUDSAMLSA-N Arg-Gln-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N BEXGZLUHRXTZCC-CIUDSAMLSA-N 0.000 description 3
- XLWSGICNBZGYTA-CIUDSAMLSA-N Arg-Glu-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XLWSGICNBZGYTA-CIUDSAMLSA-N 0.000 description 3
- AQPVUEJJARLJHB-BQBZGAKWSA-N Arg-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N AQPVUEJJARLJHB-BQBZGAKWSA-N 0.000 description 3
- PNIGSVZJNVUVJA-BQBZGAKWSA-N Arg-Gly-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O PNIGSVZJNVUVJA-BQBZGAKWSA-N 0.000 description 3
- RFXXUWGNVRJTNQ-QXEWZRGKSA-N Arg-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N RFXXUWGNVRJTNQ-QXEWZRGKSA-N 0.000 description 3
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 3
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 3
- HGKHPCFTRQDHCU-IUCAKERBSA-N Arg-Pro-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O HGKHPCFTRQDHCU-IUCAKERBSA-N 0.000 description 3
- VUGWHBXPMAHEGZ-SRVKXCTJSA-N Arg-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N VUGWHBXPMAHEGZ-SRVKXCTJSA-N 0.000 description 3
- VENMDXUVHSKEIN-GUBZILKMSA-N Arg-Ser-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VENMDXUVHSKEIN-GUBZILKMSA-N 0.000 description 3
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 3
- CGWVCWFQGXOUSJ-ULQDDVLXSA-N Arg-Tyr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O CGWVCWFQGXOUSJ-ULQDDVLXSA-N 0.000 description 3
- QTAIIXQCOPUNBQ-QXEWZRGKSA-N Arg-Val-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QTAIIXQCOPUNBQ-QXEWZRGKSA-N 0.000 description 3
- WOZDCBHUGJVJPL-AVGNSLFASA-N Arg-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N WOZDCBHUGJVJPL-AVGNSLFASA-N 0.000 description 3
- WTUZDHWWGUQEKN-SRVKXCTJSA-N Arg-Val-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O WTUZDHWWGUQEKN-SRVKXCTJSA-N 0.000 description 3
- SUMJNGAMIQSNGX-TUAOUCFPSA-N Arg-Val-Pro Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N1CCC[C@@H]1C(O)=O SUMJNGAMIQSNGX-TUAOUCFPSA-N 0.000 description 3
- XWGJDUSDTRPQRK-ZLUOBGJFSA-N Asn-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O XWGJDUSDTRPQRK-ZLUOBGJFSA-N 0.000 description 3
- ZDOQDYFZNGASEY-BIIVOSGPSA-N Asn-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N)C(=O)O ZDOQDYFZNGASEY-BIIVOSGPSA-N 0.000 description 3
- XWFPGQVLOVGSLU-CIUDSAMLSA-N Asn-Gln-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XWFPGQVLOVGSLU-CIUDSAMLSA-N 0.000 description 3
- NNMUHYLAYUSTTN-FXQIFTODSA-N Asn-Gln-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O NNMUHYLAYUSTTN-FXQIFTODSA-N 0.000 description 3
- QPTAGIPWARILES-AVGNSLFASA-N Asn-Gln-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QPTAGIPWARILES-AVGNSLFASA-N 0.000 description 3
- FUHFYEKSGWOWGZ-XHNCKOQMSA-N Asn-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N)C(=O)O FUHFYEKSGWOWGZ-XHNCKOQMSA-N 0.000 description 3
- OLVIPTLKNSAYRJ-YUMQZZPRSA-N Asn-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N OLVIPTLKNSAYRJ-YUMQZZPRSA-N 0.000 description 3
- JQSWHKKUZMTOIH-QWRGUYRKSA-N Asn-Gly-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N JQSWHKKUZMTOIH-QWRGUYRKSA-N 0.000 description 3
- NVWJMQNYLYWVNQ-BYULHYEWSA-N Asn-Ile-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O NVWJMQNYLYWVNQ-BYULHYEWSA-N 0.000 description 3
- GLWFAWNYGWBMOC-SRVKXCTJSA-N Asn-Leu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GLWFAWNYGWBMOC-SRVKXCTJSA-N 0.000 description 3
- QDXQWFBLUVTOFL-FXQIFTODSA-N Asn-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC(=O)N)N QDXQWFBLUVTOFL-FXQIFTODSA-N 0.000 description 3
- XMHFCUKJRCQXGI-CIUDSAMLSA-N Asn-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O XMHFCUKJRCQXGI-CIUDSAMLSA-N 0.000 description 3
- UXHYOWXTJLBEPG-GSSVUCPTSA-N Asn-Thr-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UXHYOWXTJLBEPG-GSSVUCPTSA-N 0.000 description 3
- PQKSVQSMTHPRIB-ZKWXMUAHSA-N Asn-Val-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O PQKSVQSMTHPRIB-ZKWXMUAHSA-N 0.000 description 3
- UWMIZBCTVWVMFI-FXQIFTODSA-N Asp-Ala-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UWMIZBCTVWVMFI-FXQIFTODSA-N 0.000 description 3
- WSWYMRLTJVKRCE-ZLUOBGJFSA-N Asp-Ala-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O WSWYMRLTJVKRCE-ZLUOBGJFSA-N 0.000 description 3
- VPSHHQXIWLGVDD-ZLUOBGJFSA-N Asp-Asp-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VPSHHQXIWLGVDD-ZLUOBGJFSA-N 0.000 description 3
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 3
- LKIYSIYBKYLKPU-BIIVOSGPSA-N Asp-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N)C(=O)O LKIYSIYBKYLKPU-BIIVOSGPSA-N 0.000 description 3
- RRKCPMGSRIDLNC-AVGNSLFASA-N Asp-Glu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RRKCPMGSRIDLNC-AVGNSLFASA-N 0.000 description 3
- WYOSXGYAKZQPGF-SRVKXCTJSA-N Asp-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)O)N WYOSXGYAKZQPGF-SRVKXCTJSA-N 0.000 description 3
- NVFSJIXJZCDICF-SRVKXCTJSA-N Asp-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N NVFSJIXJZCDICF-SRVKXCTJSA-N 0.000 description 3
- SJLDOGLMVPHPLZ-IHRRRGAJSA-N Asp-Met-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SJLDOGLMVPHPLZ-IHRRRGAJSA-N 0.000 description 3
- PCJOFZYFFMBZKC-PCBIJLKTSA-N Asp-Phe-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PCJOFZYFFMBZKC-PCBIJLKTSA-N 0.000 description 3
- KGHLGJAXYSVNJP-WHFBIAKZSA-N Asp-Ser-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O KGHLGJAXYSVNJP-WHFBIAKZSA-N 0.000 description 3
- YUELDQUPTAYEGM-XIRDDKMYSA-N Asp-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC(=O)O)N YUELDQUPTAYEGM-XIRDDKMYSA-N 0.000 description 3
- AWPWHMVCSISSQK-QWRGUYRKSA-N Asp-Tyr-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O AWPWHMVCSISSQK-QWRGUYRKSA-N 0.000 description 3
- GYNUXDMCDILYIQ-QRTARXTBSA-N Asp-Val-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(=O)O)N GYNUXDMCDILYIQ-QRTARXTBSA-N 0.000 description 3
- AMRLSQGGERHDHJ-FXQIFTODSA-N Cys-Ala-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMRLSQGGERHDHJ-FXQIFTODSA-N 0.000 description 3
- RRIJEABIXPKSGP-FXQIFTODSA-N Cys-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CS RRIJEABIXPKSGP-FXQIFTODSA-N 0.000 description 3
- SZQCDCKIGWQAQN-FXQIFTODSA-N Cys-Arg-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O SZQCDCKIGWQAQN-FXQIFTODSA-N 0.000 description 3
- FWYBFUDWUUFLDN-FXQIFTODSA-N Cys-Asp-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N)CN=C(N)N FWYBFUDWUUFLDN-FXQIFTODSA-N 0.000 description 3
- ASHTVGGFIMESRD-LKXGYXEUSA-N Cys-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N)O ASHTVGGFIMESRD-LKXGYXEUSA-N 0.000 description 3
- HBHMVBGGHDMPBF-GARJFASQSA-N Cys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CS)N HBHMVBGGHDMPBF-GARJFASQSA-N 0.000 description 3
- ZLFRUAFDAIFNHN-LKXGYXEUSA-N Cys-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N)O ZLFRUAFDAIFNHN-LKXGYXEUSA-N 0.000 description 3
- MHYHLWUGWUBUHF-GUBZILKMSA-N Cys-Val-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CS)N MHYHLWUGWUBUHF-GUBZILKMSA-N 0.000 description 3
- 108010090461 DFG peptide Proteins 0.000 description 3
- LZRMPXRYLLTAJX-GUBZILKMSA-N Gln-Arg-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZRMPXRYLLTAJX-GUBZILKMSA-N 0.000 description 3
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 3
- SNLOOPZHAQDMJG-CIUDSAMLSA-N Gln-Glu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SNLOOPZHAQDMJG-CIUDSAMLSA-N 0.000 description 3
- JEFZIKRIDLHOIF-BYPYZUCNSA-N Gln-Gly Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(O)=O JEFZIKRIDLHOIF-BYPYZUCNSA-N 0.000 description 3
- VSXBYIJUAXPAAL-WDSKDSINSA-N Gln-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O VSXBYIJUAXPAAL-WDSKDSINSA-N 0.000 description 3
- JXFLPKSDLDEOQK-JHEQGTHGSA-N Gln-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O JXFLPKSDLDEOQK-JHEQGTHGSA-N 0.000 description 3
- HXOLDXKNWKLDMM-YVNDNENWSA-N Gln-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HXOLDXKNWKLDMM-YVNDNENWSA-N 0.000 description 3
- FNAJNWPDTIXYJN-CIUDSAMLSA-N Gln-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O FNAJNWPDTIXYJN-CIUDSAMLSA-N 0.000 description 3
- YPFFHGRJCUBXPX-NHCYSSNCSA-N Gln-Pro-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O)C(O)=O YPFFHGRJCUBXPX-NHCYSSNCSA-N 0.000 description 3
- LGWNISYVKDNJRP-FXQIFTODSA-N Gln-Ser-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGWNISYVKDNJRP-FXQIFTODSA-N 0.000 description 3
- KVQOVQVGVKDZNW-GUBZILKMSA-N Gln-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N KVQOVQVGVKDZNW-GUBZILKMSA-N 0.000 description 3
- LPIKVBWNNVFHCQ-GUBZILKMSA-N Gln-Ser-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LPIKVBWNNVFHCQ-GUBZILKMSA-N 0.000 description 3
- BYKZWDGMJLNFJY-XKBZYTNZSA-N Gln-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N)O BYKZWDGMJLNFJY-XKBZYTNZSA-N 0.000 description 3
- DYVMTEWCGAVKSE-HJGDQZAQSA-N Gln-Thr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O DYVMTEWCGAVKSE-HJGDQZAQSA-N 0.000 description 3
- WZZSKAJIHTUUSG-ACZMJKKPSA-N Glu-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O WZZSKAJIHTUUSG-ACZMJKKPSA-N 0.000 description 3
- UTKUTMJSWKKHEM-WDSKDSINSA-N Glu-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O UTKUTMJSWKKHEM-WDSKDSINSA-N 0.000 description 3
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 3
- PVBBEKPHARMPHX-DCAQKATOSA-N Glu-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O PVBBEKPHARMPHX-DCAQKATOSA-N 0.000 description 3
- CGOHAEBMDSEKFB-FXQIFTODSA-N Glu-Glu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O CGOHAEBMDSEKFB-FXQIFTODSA-N 0.000 description 3
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 3
- KASDBWKLWJKTLJ-GUBZILKMSA-N Glu-Glu-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O KASDBWKLWJKTLJ-GUBZILKMSA-N 0.000 description 3
- OAGVHWYIBZMWLA-YFKPBYRVSA-N Glu-Gly-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)NCC(O)=O OAGVHWYIBZMWLA-YFKPBYRVSA-N 0.000 description 3
- KRGZZKWSBGPLKL-IUCAKERBSA-N Glu-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N KRGZZKWSBGPLKL-IUCAKERBSA-N 0.000 description 3
- ZWABFSSWTSAMQN-KBIXCLLPSA-N Glu-Ile-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O ZWABFSSWTSAMQN-KBIXCLLPSA-N 0.000 description 3
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 3
- VNCNWQPIQYAMAK-ACZMJKKPSA-N Glu-Ser-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O VNCNWQPIQYAMAK-ACZMJKKPSA-N 0.000 description 3
- QCMVGXDELYMZET-GLLZPBPUSA-N Glu-Thr-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QCMVGXDELYMZET-GLLZPBPUSA-N 0.000 description 3
- RZMXBFUSQNLEQF-QEJZJMRPSA-N Glu-Trp-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N RZMXBFUSQNLEQF-QEJZJMRPSA-N 0.000 description 3
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 3
- JBRBACJPBZNFMF-YUMQZZPRSA-N Gly-Ala-Lys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN JBRBACJPBZNFMF-YUMQZZPRSA-N 0.000 description 3
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 3
- LERGJIVJIIODPZ-ZANVPECISA-N Gly-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)CN)C)C(O)=O)=CNC2=C1 LERGJIVJIIODPZ-ZANVPECISA-N 0.000 description 3
- DTPOVRRYXPJJAZ-FJXKBIBVSA-N Gly-Arg-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N DTPOVRRYXPJJAZ-FJXKBIBVSA-N 0.000 description 3
- AIJAPFVDBFYNKN-WHFBIAKZSA-N Gly-Asn-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN)C(=O)N AIJAPFVDBFYNKN-WHFBIAKZSA-N 0.000 description 3
- FMVLWTYYODVFRG-BQBZGAKWSA-N Gly-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN FMVLWTYYODVFRG-BQBZGAKWSA-N 0.000 description 3
- XBWMTPAIUQIWKA-BYULHYEWSA-N Gly-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN XBWMTPAIUQIWKA-BYULHYEWSA-N 0.000 description 3
- FZQLXNIMCPJVJE-YUMQZZPRSA-N Gly-Asp-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FZQLXNIMCPJVJE-YUMQZZPRSA-N 0.000 description 3
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 3
- TZOVVRJYUDETQG-RCOVLWMOSA-N Gly-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN TZOVVRJYUDETQG-RCOVLWMOSA-N 0.000 description 3
- KTSZUNRRYXPZTK-BQBZGAKWSA-N Gly-Gln-Glu Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O KTSZUNRRYXPZTK-BQBZGAKWSA-N 0.000 description 3
- NPSWCZIRBAYNSB-JHEQGTHGSA-N Gly-Gln-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPSWCZIRBAYNSB-JHEQGTHGSA-N 0.000 description 3
- XTQFHTHIAKKCTM-YFKPBYRVSA-N Gly-Glu-Gly Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O XTQFHTHIAKKCTM-YFKPBYRVSA-N 0.000 description 3
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 3
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 3
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 3
- AFWYPMDMDYCKMD-KBPBESRZSA-N Gly-Leu-Tyr Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFWYPMDMDYCKMD-KBPBESRZSA-N 0.000 description 3
- BXICSAQLIHFDDL-YUMQZZPRSA-N Gly-Lys-Asn Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O BXICSAQLIHFDDL-YUMQZZPRSA-N 0.000 description 3
- JYPCXBJRLBHWME-IUCAKERBSA-N Gly-Pro-Arg Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JYPCXBJRLBHWME-IUCAKERBSA-N 0.000 description 3
- OOCFXNOVSLSHAB-IUCAKERBSA-N Gly-Pro-Pro Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OOCFXNOVSLSHAB-IUCAKERBSA-N 0.000 description 3
- GLACUWHUYFBSPJ-FJXKBIBVSA-N Gly-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN GLACUWHUYFBSPJ-FJXKBIBVSA-N 0.000 description 3
- LBDXVCBAJJNJNN-WHFBIAKZSA-N Gly-Ser-Cys Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(O)=O LBDXVCBAJJNJNN-WHFBIAKZSA-N 0.000 description 3
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 3
- SBVMXEZQJVUARN-XPUUQOCRSA-N Gly-Val-Ser Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O SBVMXEZQJVUARN-XPUUQOCRSA-N 0.000 description 3
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 3
- BIAKMWKJMQLZOJ-ZKWXMUAHSA-N His-Ala-Ala Chemical compound C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)Cc1cnc[nH]1)C(O)=O BIAKMWKJMQLZOJ-ZKWXMUAHSA-N 0.000 description 3
- KNNSUUOHFVVJOP-GUBZILKMSA-N His-Glu-Ser Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N KNNSUUOHFVVJOP-GUBZILKMSA-N 0.000 description 3
- ZUPVLBAXUUGKKN-VHSXEESVSA-N His-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CC2=CN=CN2)N)C(=O)O ZUPVLBAXUUGKKN-VHSXEESVSA-N 0.000 description 3
- FYTCLUIYTYFGPT-YUMQZZPRSA-N His-Gly-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FYTCLUIYTYFGPT-YUMQZZPRSA-N 0.000 description 3
- TWROVBNEHJSXDG-IHRRRGAJSA-N His-Leu-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O TWROVBNEHJSXDG-IHRRRGAJSA-N 0.000 description 3
- YEKYGQZUBCRNGH-DCAQKATOSA-N His-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CN=CN2)N)C(=O)N[C@@H](CO)C(=O)O YEKYGQZUBCRNGH-DCAQKATOSA-N 0.000 description 3
- AVQNTYBAFBKMDL-WDSOQIARSA-N His-Pro-Trp Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O AVQNTYBAFBKMDL-WDSOQIARSA-N 0.000 description 3
- ILUVWFTXAUYOBW-CUJWVEQBSA-N His-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC1=CN=CN1)N)O ILUVWFTXAUYOBW-CUJWVEQBSA-N 0.000 description 3
- VXZZUXWAOMWWJH-QTKMDUPCSA-N His-Thr-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O VXZZUXWAOMWWJH-QTKMDUPCSA-N 0.000 description 3
- MCGOGXFMKHPMSQ-AVGNSLFASA-N His-Val-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 MCGOGXFMKHPMSQ-AVGNSLFASA-N 0.000 description 3
- 241001272567 Hominoidea Species 0.000 description 3
- 241000282412 Homo Species 0.000 description 3
- DPTBVFUDCPINIP-JURCDPSOSA-N Ile-Ala-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 DPTBVFUDCPINIP-JURCDPSOSA-N 0.000 description 3
- XENGULNPUDGALZ-ZPFDUUQYSA-N Ile-Asn-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N XENGULNPUDGALZ-ZPFDUUQYSA-N 0.000 description 3
- PNDMHTTXXPUQJH-RWRJDSDZSA-N Ile-Glu-Thr Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@H](O)C)C(=O)O PNDMHTTXXPUQJH-RWRJDSDZSA-N 0.000 description 3
- GQKSJYINYYWPMR-NGZCFLSTSA-N Ile-Gly-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N GQKSJYINYYWPMR-NGZCFLSTSA-N 0.000 description 3
- PKGGWLOLRLOPGK-XUXIUFHCSA-N Ile-Leu-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PKGGWLOLRLOPGK-XUXIUFHCSA-N 0.000 description 3
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 3
- HPCFRQWLTRDGHT-AJNGGQMLSA-N Ile-Leu-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O HPCFRQWLTRDGHT-AJNGGQMLSA-N 0.000 description 3
- GVNNAHIRSDRIII-AJNGGQMLSA-N Ile-Lys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N GVNNAHIRSDRIII-AJNGGQMLSA-N 0.000 description 3
- FHPZJWJWTWZKNA-LLLHUVSDSA-N Ile-Phe-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N FHPZJWJWTWZKNA-LLLHUVSDSA-N 0.000 description 3
- ZNOBVZFCHNHKHA-KBIXCLLPSA-N Ile-Ser-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZNOBVZFCHNHKHA-KBIXCLLPSA-N 0.000 description 3
- DLEBSGAVWRPTIX-PEDHHIEDSA-N Ile-Val-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)[C@@H](C)CC DLEBSGAVWRPTIX-PEDHHIEDSA-N 0.000 description 3
- JZBVBOKASHNXAD-NAKRPEOUSA-N Ile-Val-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N JZBVBOKASHNXAD-NAKRPEOUSA-N 0.000 description 3
- 102100034170 Interferon-induced, double-stranded RNA-activated protein kinase Human genes 0.000 description 3
- 101710089751 Interferon-induced, double-stranded RNA-activated protein kinase Proteins 0.000 description 3
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 3
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 3
- UGTHTQWIQKEDEH-BQBZGAKWSA-N L-alanyl-L-prolylglycine zwitterion Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UGTHTQWIQKEDEH-BQBZGAKWSA-N 0.000 description 3
- NTRAGDHVSGKUSF-AVGNSLFASA-N Leu-Arg-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NTRAGDHVSGKUSF-AVGNSLFASA-N 0.000 description 3
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 3
- GPICTNQYKHHHTH-GUBZILKMSA-N Leu-Gln-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GPICTNQYKHHHTH-GUBZILKMSA-N 0.000 description 3
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 3
- FMEICTQWUKNAGC-YUMQZZPRSA-N Leu-Gly-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O FMEICTQWUKNAGC-YUMQZZPRSA-N 0.000 description 3
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 3
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 3
- KEVYYIMVELOXCT-KBPBESRZSA-N Leu-Gly-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KEVYYIMVELOXCT-KBPBESRZSA-N 0.000 description 3
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 3
- FAELBUXXFQLUAX-AJNGGQMLSA-N Leu-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C FAELBUXXFQLUAX-AJNGGQMLSA-N 0.000 description 3
- FLNPJLDPGMLWAU-UWVGGRQHSA-N Leu-Met-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(C)C FLNPJLDPGMLWAU-UWVGGRQHSA-N 0.000 description 3
- ZDBMWELMUCLUPL-QEJZJMRPSA-N Leu-Phe-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 ZDBMWELMUCLUPL-QEJZJMRPSA-N 0.000 description 3
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 3
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 3
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 3
- MVHXGBZUJLWZOH-BJDJZHNGSA-N Leu-Ser-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVHXGBZUJLWZOH-BJDJZHNGSA-N 0.000 description 3
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 3
- RVOMPSJXSRPFJT-DCAQKATOSA-N Lys-Ala-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVOMPSJXSRPFJT-DCAQKATOSA-N 0.000 description 3
- WXJKFRMKJORORD-DCAQKATOSA-N Lys-Arg-Ala Chemical compound NC(=N)NCCC[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CCCCN WXJKFRMKJORORD-DCAQKATOSA-N 0.000 description 3
- YEIYAQQKADPIBJ-GARJFASQSA-N Lys-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N)C(=O)O YEIYAQQKADPIBJ-GARJFASQSA-N 0.000 description 3
- PGBPWPTUOSCNLE-JYJNAYRXSA-N Lys-Gln-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N PGBPWPTUOSCNLE-JYJNAYRXSA-N 0.000 description 3
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 3
- DLCAXBGXGOVUCD-PPCPHDFISA-N Lys-Thr-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DLCAXBGXGOVUCD-PPCPHDFISA-N 0.000 description 3
- RPWTZTBIFGENIA-VOAKCMCISA-N Lys-Thr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RPWTZTBIFGENIA-VOAKCMCISA-N 0.000 description 3
- 108010061593 Member 14 Tumor Necrosis Factor Receptors Proteins 0.000 description 3
- YRAWWKUTNBILNT-FXQIFTODSA-N Met-Ala-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YRAWWKUTNBILNT-FXQIFTODSA-N 0.000 description 3
- UYAKZHGIPRCGPF-CIUDSAMLSA-N Met-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCSC)N UYAKZHGIPRCGPF-CIUDSAMLSA-N 0.000 description 3
- SJDQOYTYNGZZJX-SRVKXCTJSA-N Met-Glu-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SJDQOYTYNGZZJX-SRVKXCTJSA-N 0.000 description 3
- OGAZPKJHHZPYFK-GARJFASQSA-N Met-Glu-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N OGAZPKJHHZPYFK-GARJFASQSA-N 0.000 description 3
- JZNGSNMTXAHMSV-AVGNSLFASA-N Met-His-Arg Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N JZNGSNMTXAHMSV-AVGNSLFASA-N 0.000 description 3
- NDJSSFWDYDUQID-YTWAJWBKSA-N Met-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N)O NDJSSFWDYDUQID-YTWAJWBKSA-N 0.000 description 3
- GHQFLTYXGUETFD-UFYCRDLUSA-N Met-Tyr-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N GHQFLTYXGUETFD-UFYCRDLUSA-N 0.000 description 3
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 3
- 206010028851 Necrosis Diseases 0.000 description 3
- 108700026244 Open Reading Frames Proteins 0.000 description 3
- XMPUYNHKEPFERE-IHRRRGAJSA-N Phe-Asp-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 XMPUYNHKEPFERE-IHRRRGAJSA-N 0.000 description 3
- CPTJPDZTFNKFOU-MXAVVETBSA-N Phe-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CC=CC=C1)N CPTJPDZTFNKFOU-MXAVVETBSA-N 0.000 description 3
- FIRWJEJVFFGXSH-RYUDHWBXSA-N Phe-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 FIRWJEJVFFGXSH-RYUDHWBXSA-N 0.000 description 3
- JEBWZLWTRPZQRX-QWRGUYRKSA-N Phe-Gly-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O JEBWZLWTRPZQRX-QWRGUYRKSA-N 0.000 description 3
- MMYUOSCXBJFUNV-QWRGUYRKSA-N Phe-Gly-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N MMYUOSCXBJFUNV-QWRGUYRKSA-N 0.000 description 3
- ZLGQEBCCANLYRA-RYUDHWBXSA-N Phe-Gly-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O ZLGQEBCCANLYRA-RYUDHWBXSA-N 0.000 description 3
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 3
- YVXPUUOTMVBKDO-IHRRRGAJSA-N Phe-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CS)C(=O)O YVXPUUOTMVBKDO-IHRRRGAJSA-N 0.000 description 3
- UNBFGVQVQGXXCK-KKUMJFAQSA-N Phe-Ser-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O UNBFGVQVQGXXCK-KKUMJFAQSA-N 0.000 description 3
- IAOZOFPONWDXNT-IXOXFDKPSA-N Phe-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IAOZOFPONWDXNT-IXOXFDKPSA-N 0.000 description 3
- CDHURCQGUDNBMA-UBHSHLNASA-N Phe-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 CDHURCQGUDNBMA-UBHSHLNASA-N 0.000 description 3
- DXWNFNOPBYAFRM-IHRRRGAJSA-N Phe-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N DXWNFNOPBYAFRM-IHRRRGAJSA-N 0.000 description 3
- JTKGCYOOJLUETJ-ULQDDVLXSA-N Phe-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JTKGCYOOJLUETJ-ULQDDVLXSA-N 0.000 description 3
- CQZNGNCAIXMAIQ-UBHSHLNASA-N Pro-Ala-Phe Chemical compound C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O CQZNGNCAIXMAIQ-UBHSHLNASA-N 0.000 description 3
- QSKCKTUQPICLSO-AVGNSLFASA-N Pro-Arg-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O QSKCKTUQPICLSO-AVGNSLFASA-N 0.000 description 3
- ZSKJPKFTPQCPIH-RCWTZXSCSA-N Pro-Arg-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSKJPKFTPQCPIH-RCWTZXSCSA-N 0.000 description 3
- XKHCJJPNXFBADI-DCAQKATOSA-N Pro-Asp-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O XKHCJJPNXFBADI-DCAQKATOSA-N 0.000 description 3
- NOXSEHJOXCWRHK-DCAQKATOSA-N Pro-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@@H]1CCCN1 NOXSEHJOXCWRHK-DCAQKATOSA-N 0.000 description 3
- OHQFMEIJLZQXHB-GUBZILKMSA-N Pro-Cys-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H]1CCCN1 OHQFMEIJLZQXHB-GUBZILKMSA-N 0.000 description 3
- ZPPVJIJMIKTERM-YUMQZZPRSA-N Pro-Gln-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)N)NC(=O)[C@@H]1CCCN1 ZPPVJIJMIKTERM-YUMQZZPRSA-N 0.000 description 3
- UEHYFUCOGHWASA-HJGDQZAQSA-N Pro-Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 UEHYFUCOGHWASA-HJGDQZAQSA-N 0.000 description 3
- HAEGAELAYWSUNC-WPRPVWTQSA-N Pro-Gly-Val Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAEGAELAYWSUNC-WPRPVWTQSA-N 0.000 description 3
- STASJMBVVHNWCG-IHRRRGAJSA-N Pro-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 STASJMBVVHNWCG-IHRRRGAJSA-N 0.000 description 3
- UREQLMJCKFLLHM-NAKRPEOUSA-N Pro-Ile-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UREQLMJCKFLLHM-NAKRPEOUSA-N 0.000 description 3
- AUQGUYPHJSMAKI-CYDGBPFRSA-N Pro-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 AUQGUYPHJSMAKI-CYDGBPFRSA-N 0.000 description 3
- NFLNBHLMLYALOO-DCAQKATOSA-N Pro-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@@H]1CCCN1 NFLNBHLMLYALOO-DCAQKATOSA-N 0.000 description 3
- DRKAXLDECUGLFE-ULQDDVLXSA-N Pro-Leu-Phe Chemical compound CC(C)C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O DRKAXLDECUGLFE-ULQDDVLXSA-N 0.000 description 3
- AUYKOPJPKUCYHE-SRVKXCTJSA-N Pro-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@@H]1CCCN1 AUYKOPJPKUCYHE-SRVKXCTJSA-N 0.000 description 3
- AJBQTGZIZQXBLT-STQMWFEESA-N Pro-Phe-Gly Chemical compound C([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 AJBQTGZIZQXBLT-STQMWFEESA-N 0.000 description 3
- RFWXYTJSVDUBBZ-DCAQKATOSA-N Pro-Pro-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RFWXYTJSVDUBBZ-DCAQKATOSA-N 0.000 description 3
- KBUAPZAZPWNYSW-SRVKXCTJSA-N Pro-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KBUAPZAZPWNYSW-SRVKXCTJSA-N 0.000 description 3
- POQFNPILEQEODH-FXQIFTODSA-N Pro-Ser-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O POQFNPILEQEODH-FXQIFTODSA-N 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 3
- 108010041388 Ribonucleotide Reductases Proteins 0.000 description 3
- 102000000505 Ribonucleotide Reductases Human genes 0.000 description 3
- MMGJPDWSIOAGTH-ACZMJKKPSA-N Ser-Ala-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MMGJPDWSIOAGTH-ACZMJKKPSA-N 0.000 description 3
- HQTKVSCNCDLXSX-BQBZGAKWSA-N Ser-Arg-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O HQTKVSCNCDLXSX-BQBZGAKWSA-N 0.000 description 3
- HBOABDXGTMMDSE-GUBZILKMSA-N Ser-Arg-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O HBOABDXGTMMDSE-GUBZILKMSA-N 0.000 description 3
- UGJRQLURDVGULT-LKXGYXEUSA-N Ser-Asn-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UGJRQLURDVGULT-LKXGYXEUSA-N 0.000 description 3
- MMAPOBOTRUVNKJ-ZLUOBGJFSA-N Ser-Asp-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CO)N)C(=O)O MMAPOBOTRUVNKJ-ZLUOBGJFSA-N 0.000 description 3
- SMIDBHKWSYUBRZ-ACZMJKKPSA-N Ser-Glu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O SMIDBHKWSYUBRZ-ACZMJKKPSA-N 0.000 description 3
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 3
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 3
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 3
- IAORETPTUDBBGV-CIUDSAMLSA-N Ser-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N IAORETPTUDBBGV-CIUDSAMLSA-N 0.000 description 3
- GVIGVIOEYBOTCB-XIRDDKMYSA-N Ser-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC(C)C)C(O)=O)=CNC2=C1 GVIGVIOEYBOTCB-XIRDDKMYSA-N 0.000 description 3
- QJKPECIAWNNKIT-KKUMJFAQSA-N Ser-Lys-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QJKPECIAWNNKIT-KKUMJFAQSA-N 0.000 description 3
- HEYZPTCCEIWHRO-IHRRRGAJSA-N Ser-Met-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 HEYZPTCCEIWHRO-IHRRRGAJSA-N 0.000 description 3
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 3
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 3
- LLSLRQOEAFCZLW-NRPADANISA-N Ser-Val-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LLSLRQOEAFCZLW-NRPADANISA-N 0.000 description 3
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 3
- HSWXBJCBYSWBPT-GUBZILKMSA-N Ser-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)C(O)=O HSWXBJCBYSWBPT-GUBZILKMSA-N 0.000 description 3
- MQCPGOZXFSYJPS-KZVJFYERSA-N Thr-Ala-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MQCPGOZXFSYJPS-KZVJFYERSA-N 0.000 description 3
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 3
- XSLXHSYIVPGEER-KZVJFYERSA-N Thr-Ala-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O XSLXHSYIVPGEER-KZVJFYERSA-N 0.000 description 3
- GLQFKOVWXPPFTP-VEVYYDQMSA-N Thr-Arg-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GLQFKOVWXPPFTP-VEVYYDQMSA-N 0.000 description 3
- NAXBBCLCEOTAIG-RHYQMDGZSA-N Thr-Arg-Lys Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O NAXBBCLCEOTAIG-RHYQMDGZSA-N 0.000 description 3
- OJRNZRROAIAHDL-LKXGYXEUSA-N Thr-Asn-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OJRNZRROAIAHDL-LKXGYXEUSA-N 0.000 description 3
- OHAJHDJOCKKJLV-LKXGYXEUSA-N Thr-Asp-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OHAJHDJOCKKJLV-LKXGYXEUSA-N 0.000 description 3
- XDARBNMYXKUFOJ-GSSVUCPTSA-N Thr-Asp-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XDARBNMYXKUFOJ-GSSVUCPTSA-N 0.000 description 3
- NIEWSKWFURSECR-FOHZUACHSA-N Thr-Gly-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O NIEWSKWFURSECR-FOHZUACHSA-N 0.000 description 3
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 3
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 3
- YOOAQCZYZHGUAZ-KATARQTJSA-N Thr-Leu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YOOAQCZYZHGUAZ-KATARQTJSA-N 0.000 description 3
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 3
- DEGCBBCMYWNJNA-RHYQMDGZSA-N Thr-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O DEGCBBCMYWNJNA-RHYQMDGZSA-N 0.000 description 3
- AHERARIZBPOMNU-KATARQTJSA-N Thr-Ser-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O AHERARIZBPOMNU-KATARQTJSA-N 0.000 description 3
- WPSKTVVMQCXPRO-BWBBJGPYSA-N Thr-Ser-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WPSKTVVMQCXPRO-BWBBJGPYSA-N 0.000 description 3
- YRJOLUDFVAUXLI-GSSVUCPTSA-N Thr-Thr-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O YRJOLUDFVAUXLI-GSSVUCPTSA-N 0.000 description 3
- OGOYMQWIWHGTGH-KZVJFYERSA-N Thr-Val-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O OGOYMQWIWHGTGH-KZVJFYERSA-N 0.000 description 3
- PWONLXBUSVIZPH-RHYQMDGZSA-N Thr-Val-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O PWONLXBUSVIZPH-RHYQMDGZSA-N 0.000 description 3
- AVYVKJMBNLPWRX-WFBYXXMGSA-N Trp-Ala-Ser Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 AVYVKJMBNLPWRX-WFBYXXMGSA-N 0.000 description 3
- OTJDEIZGUFRGLL-WIRXVTQYSA-N Trp-Phe-Trp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)NC(=O)[C@H](CC4=CNC5=CC=CC=C54)N OTJDEIZGUFRGLL-WIRXVTQYSA-N 0.000 description 3
- ADMHZNPMMVKGJW-BPUTZDHNSA-N Trp-Ser-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N ADMHZNPMMVKGJW-BPUTZDHNSA-N 0.000 description 3
- SEXRBCGSZRCIPE-LYSGOOTNSA-N Trp-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O SEXRBCGSZRCIPE-LYSGOOTNSA-N 0.000 description 3
- 102100028785 Tumor necrosis factor receptor superfamily member 14 Human genes 0.000 description 3
- XKDOQXAXKFQWQJ-SRVKXCTJSA-N Tyr-Cys-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O XKDOQXAXKFQWQJ-SRVKXCTJSA-N 0.000 description 3
- WZQZUVWEPMGIMM-JYJNAYRXSA-N Tyr-Gln-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O WZQZUVWEPMGIMM-JYJNAYRXSA-N 0.000 description 3
- OLWFDNLLBWQWCP-STQMWFEESA-N Tyr-Gly-Met Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O OLWFDNLLBWQWCP-STQMWFEESA-N 0.000 description 3
- DMWNPLOERDAHSY-MEYUZBJRSA-N Tyr-Leu-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DMWNPLOERDAHSY-MEYUZBJRSA-N 0.000 description 3
- FASACHWGQBNSRO-ZEWNOJEFSA-N Tyr-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CC2=CC=C(C=C2)O)N FASACHWGQBNSRO-ZEWNOJEFSA-N 0.000 description 3
- OBKOPLHSRDATFO-XHSDSOJGSA-N Tyr-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OBKOPLHSRDATFO-XHSDSOJGSA-N 0.000 description 3
- 101710117021 Tyrosine-protein phosphatase YopH Proteins 0.000 description 3
- 101150092158 US8 gene Proteins 0.000 description 3
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 3
- ZLFHAAGHGQBQQN-AEJSXWLSSA-N Val-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZLFHAAGHGQBQQN-AEJSXWLSSA-N 0.000 description 3
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 3
- CVUDMNSZAIZFAE-TUAOUCFPSA-N Val-Arg-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N CVUDMNSZAIZFAE-TUAOUCFPSA-N 0.000 description 3
- CVUDMNSZAIZFAE-UHFFFAOYSA-N Val-Arg-Pro Natural products NC(N)=NCCCC(NC(=O)C(N)C(C)C)C(=O)N1CCCC1C(O)=O CVUDMNSZAIZFAE-UHFFFAOYSA-N 0.000 description 3
- UDLYXGYWTVOIKU-QXEWZRGKSA-N Val-Asn-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UDLYXGYWTVOIKU-QXEWZRGKSA-N 0.000 description 3
- VUTHNLMCXKLLFI-LAEOZQHASA-N Val-Asp-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VUTHNLMCXKLLFI-LAEOZQHASA-N 0.000 description 3
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 3
- XXROXFHCMVXETG-UWVGGRQHSA-N Val-Gly-Val Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXROXFHCMVXETG-UWVGGRQHSA-N 0.000 description 3
- UKEVLVBHRKWECS-LSJOCFKGSA-N Val-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](C(C)C)N UKEVLVBHRKWECS-LSJOCFKGSA-N 0.000 description 3
- NZGOVKLVQNOEKP-YDHLFZDLSA-N Val-Phe-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NZGOVKLVQNOEKP-YDHLFZDLSA-N 0.000 description 3
- UZFNHAXYMICTBU-DZKIICNBSA-N Val-Phe-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UZFNHAXYMICTBU-DZKIICNBSA-N 0.000 description 3
- VCIYTVOBLZHFSC-XHSDSOJGSA-N Val-Phe-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N VCIYTVOBLZHFSC-XHSDSOJGSA-N 0.000 description 3
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 3
- RYHUIHUOYRNNIE-NRPADANISA-N Val-Ser-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N RYHUIHUOYRNNIE-NRPADANISA-N 0.000 description 3
- DVLWZWNAQUBZBC-ZNSHCXBVSA-N Val-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N)O DVLWZWNAQUBZBC-ZNSHCXBVSA-N 0.000 description 3
- IRAUYEAFPFPVND-UVBJJODRSA-N Val-Trp-Ala Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 IRAUYEAFPFPVND-UVBJJODRSA-N 0.000 description 3
- JXWGBRRVTRAZQA-ULQDDVLXSA-N Val-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N JXWGBRRVTRAZQA-ULQDDVLXSA-N 0.000 description 3
- 108091006088 activator proteins Proteins 0.000 description 3
- 239000002671 adjuvant Substances 0.000 description 3
- 230000002411 adverse Effects 0.000 description 3
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 3
- 108010070944 alanylhistidine Proteins 0.000 description 3
- 230000004075 alteration Effects 0.000 description 3
- 239000000427 antigen Substances 0.000 description 3
- 108091007433 antigens Proteins 0.000 description 3
- 102000036639 antigens Human genes 0.000 description 3
- 108010013835 arginine glutamate Proteins 0.000 description 3
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 3
- 108010029539 arginyl-prolyl-proline Proteins 0.000 description 3
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 3
- 108010060035 arginylproline Proteins 0.000 description 3
- 230000004888 barrier function Effects 0.000 description 3
- 230000033228 biological regulation Effects 0.000 description 3
- 239000006143 cell culture medium Substances 0.000 description 3
- 239000013592 cell lysate Substances 0.000 description 3
- 238000003570 cell viability assay Methods 0.000 description 3
- 239000013611 chromosomal DNA Substances 0.000 description 3
- 238000010367 cloning Methods 0.000 description 3
- 238000002648 combination therapy Methods 0.000 description 3
- 230000001461 cytolytic effect Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000003745 diagnosis Methods 0.000 description 3
- 208000035475 disorder Diseases 0.000 description 3
- 239000000839 emulsion Substances 0.000 description 3
- 230000002255 enzymatic effect Effects 0.000 description 3
- 101150072564 gE gene Proteins 0.000 description 3
- 239000000499 gel Substances 0.000 description 3
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 3
- 108010073628 glutamyl-valyl-phenylalanine Proteins 0.000 description 3
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 3
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 3
- 108010043293 glycyl-prolyl-glycyl-glycine Proteins 0.000 description 3
- 108010074027 glycyl-seryl-phenylalanine Proteins 0.000 description 3
- 208000024200 hematopoietic and lymphoid system neoplasm Diseases 0.000 description 3
- 108010092114 histidylphenylalanine Proteins 0.000 description 3
- 238000007918 intramuscular administration Methods 0.000 description 3
- 210000002510 keratinocyte Anatomy 0.000 description 3
- 108010073093 leucyl-glycyl-glycyl-glycine Proteins 0.000 description 3
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 3
- 210000004185 liver Anatomy 0.000 description 3
- 238000001325 log-rank test Methods 0.000 description 3
- 230000002101 lytic effect Effects 0.000 description 3
- 210000004962 mammalian cell Anatomy 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 208000037819 metastatic cancer Diseases 0.000 description 3
- 208000011575 metastatic malignant neoplasm Diseases 0.000 description 3
- 108010085203 methionylmethionine Proteins 0.000 description 3
- 230000017074 necrotic cell death Effects 0.000 description 3
- 239000000843 powder Substances 0.000 description 3
- -1 probuchol Substances 0.000 description 3
- 210000001236 prokaryotic cell Anatomy 0.000 description 3
- 230000035755 proliferation Effects 0.000 description 3
- 108010014614 prolyl-glycyl-proline Proteins 0.000 description 3
- 230000002285 radioactive effect Effects 0.000 description 3
- 108010054624 red fluorescent protein Proteins 0.000 description 3
- 108010071207 serylmethionine Proteins 0.000 description 3
- 210000000952 spleen Anatomy 0.000 description 3
- 239000000725 suspension Substances 0.000 description 3
- 208000024891 symptom Diseases 0.000 description 3
- 230000000699 topical effect Effects 0.000 description 3
- 108010003137 tyrosyltyrosine Proteins 0.000 description 3
- 241000701161 unidentified adenovirus Species 0.000 description 3
- 241000701447 unidentified baculovirus Species 0.000 description 3
- 241001430294 unidentified retrovirus Species 0.000 description 3
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 3
- 230000029812 viral genome replication Effects 0.000 description 3
- 230000003442 weekly effect Effects 0.000 description 3
- 230000004580 weight loss Effects 0.000 description 3
- VBICKXHEKHSIBG-UHFFFAOYSA-N 1-monostearoylglycerol Chemical compound CCCCCCCCCCCCCCCCCC(=O)OCC(O)CO VBICKXHEKHSIBG-UHFFFAOYSA-N 0.000 description 2
- IZHVBANLECCAGF-UHFFFAOYSA-N 2-hydroxy-3-(octadecanoyloxy)propyl octadecanoate Chemical compound CCCCCCCCCCCCCCCCCC(=O)OCC(O)COC(=O)CCCCCCCCCCCCCCCCC IZHVBANLECCAGF-UHFFFAOYSA-N 0.000 description 2
- 101150096316 5 gene Proteins 0.000 description 2
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- ZFXQNADNEBRERM-BJDJZHNGSA-N Ala-Ala-Pro-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 ZFXQNADNEBRERM-BJDJZHNGSA-N 0.000 description 2
- QDRGPQWIVZNJQD-CIUDSAMLSA-N Ala-Arg-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O QDRGPQWIVZNJQD-CIUDSAMLSA-N 0.000 description 2
- YWWATNIVMOCSAV-UBHSHLNASA-N Ala-Arg-Phe Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YWWATNIVMOCSAV-UBHSHLNASA-N 0.000 description 2
- PBAMJJXWDQXOJA-FXQIFTODSA-N Ala-Asp-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PBAMJJXWDQXOJA-FXQIFTODSA-N 0.000 description 2
- IORKCNUBHNIMKY-CIUDSAMLSA-N Ala-Pro-Glu Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O IORKCNUBHNIMKY-CIUDSAMLSA-N 0.000 description 2
- IASNWHAGGYTEKX-IUCAKERBSA-N Arg-Arg-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(O)=O IASNWHAGGYTEKX-IUCAKERBSA-N 0.000 description 2
- QAODJPUKWNNNRP-DCAQKATOSA-N Arg-Glu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QAODJPUKWNNNRP-DCAQKATOSA-N 0.000 description 2
- ZDBWKBCKYJGKGP-DCAQKATOSA-N Arg-Leu-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O ZDBWKBCKYJGKGP-DCAQKATOSA-N 0.000 description 2
- SLKLLQWZQHXYSV-CIUDSAMLSA-N Asn-Ala-Lys Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O SLKLLQWZQHXYSV-CIUDSAMLSA-N 0.000 description 2
- IARGXWMWRFOQPG-GCJQMDKQSA-N Asn-Ala-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IARGXWMWRFOQPG-GCJQMDKQSA-N 0.000 description 2
- GMUOCGCDOYYWPD-FXQIFTODSA-N Asn-Pro-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O GMUOCGCDOYYWPD-FXQIFTODSA-N 0.000 description 2
- GOPFMQJUQDLUFW-LKXGYXEUSA-N Asn-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O GOPFMQJUQDLUFW-LKXGYXEUSA-N 0.000 description 2
- VTYYLEPIZMXCLO-UHFFFAOYSA-L Calcium carbonate Chemical compound [Ca+2].[O-]C([O-])=O VTYYLEPIZMXCLO-UHFFFAOYSA-L 0.000 description 2
- 241000282465 Canis Species 0.000 description 2
- 229920002261 Corn starch Polymers 0.000 description 2
- 241000699800 Cricetinae Species 0.000 description 2
- 108010020076 Cytochrome P-450 CYP2B1 Proteins 0.000 description 2
- 239000012983 Dulbecco’s minimal essential medium Substances 0.000 description 2
- 102000001301 EGF receptor Human genes 0.000 description 2
- 108060006698 EGF receptor Proteins 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 2
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 2
- HWEINOMSWQSJDC-SRVKXCTJSA-N Gln-Leu-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HWEINOMSWQSJDC-SRVKXCTJSA-N 0.000 description 2
- IIMZHVKZBGSEKZ-SZMVWBNQSA-N Gln-Trp-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(C)C)C(O)=O IIMZHVKZBGSEKZ-SZMVWBNQSA-N 0.000 description 2
- FHPXTPQBODWBIY-CIUDSAMLSA-N Glu-Ala-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHPXTPQBODWBIY-CIUDSAMLSA-N 0.000 description 2
- BPLNJYHNAJVLRT-ACZMJKKPSA-N Glu-Ser-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O BPLNJYHNAJVLRT-ACZMJKKPSA-N 0.000 description 2
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 2
- 102100041003 Glutamate carboxypeptidase 2 Human genes 0.000 description 2
- JNGJGFMFXREJNF-KBPBESRZSA-N Gly-Glu-Trp Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JNGJGFMFXREJNF-KBPBESRZSA-N 0.000 description 2
- LNDVNHOSZQPJGI-AVGNSLFASA-N His-Pro-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CN=CN1 LNDVNHOSZQPJGI-AVGNSLFASA-N 0.000 description 2
- FBOMZVOKCZMDIG-XQQFMLRXSA-N His-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N FBOMZVOKCZMDIG-XQQFMLRXSA-N 0.000 description 2
- 101000892862 Homo sapiens Glutamate carboxypeptidase 2 Proteins 0.000 description 2
- 101100427508 Human cytomegalovirus (strain AD169) UL39 gene Proteins 0.000 description 2
- 101150076998 ICP34.5 gene Proteins 0.000 description 2
- 108700002232 Immediate-Early Genes Proteins 0.000 description 2
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 2
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 2
- 235000010643 Leucaena leucocephala Nutrition 0.000 description 2
- 240000007472 Leucaena leucocephala Species 0.000 description 2
- 102000002356 Nectin Human genes 0.000 description 2
- 108060005251 Nectin Proteins 0.000 description 2
- 241000283973 Oryctolagus cuniculus Species 0.000 description 2
- 208000031839 Peripheral nerve sheath tumour malignant Diseases 0.000 description 2
- AGYXCMYVTBYGCT-ULQDDVLXSA-N Phe-Arg-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O AGYXCMYVTBYGCT-ULQDDVLXSA-N 0.000 description 2
- RBRNEFJTEHPDSL-ACRUOGEOSA-N Phe-Phe-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 RBRNEFJTEHPDSL-ACRUOGEOSA-N 0.000 description 2
- WCUXLLCKKVVCTQ-UHFFFAOYSA-M Potassium chloride Chemical compound [Cl-].[K+] WCUXLLCKKVVCTQ-UHFFFAOYSA-M 0.000 description 2
- HFZNNDWPHBRNPV-KZVJFYERSA-N Pro-Ala-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HFZNNDWPHBRNPV-KZVJFYERSA-N 0.000 description 2
- LNLNHXIQPGKRJQ-SRVKXCTJSA-N Pro-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H]1CCCN1 LNLNHXIQPGKRJQ-SRVKXCTJSA-N 0.000 description 2
- VCYJKOLZYPYGJV-AVGNSLFASA-N Pro-Arg-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VCYJKOLZYPYGJV-AVGNSLFASA-N 0.000 description 2
- FUVBEZJCRMHWEM-FXQIFTODSA-N Pro-Asn-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FUVBEZJCRMHWEM-FXQIFTODSA-N 0.000 description 2
- FDMKYQQYJKYCLV-GUBZILKMSA-N Pro-Pro-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 FDMKYQQYJKYCLV-GUBZILKMSA-N 0.000 description 2
- RJKFOVLPORLFTN-LEKSSAKUSA-N Progesterone Chemical compound C1CC2=CC(=O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H](C(=O)C)[C@@]1(C)CC2 RJKFOVLPORLFTN-LEKSSAKUSA-N 0.000 description 2
- 102000007066 Prostate-Specific Antigen Human genes 0.000 description 2
- 108010072866 Prostate-Specific Antigen Proteins 0.000 description 2
- 101150093191 RIR1 gene Proteins 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- 108091028664 Ribonucleotide Proteins 0.000 description 2
- NRCJWSGXMAPYQX-LPEHRKFASA-N Ser-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CO)N)C(=O)O NRCJWSGXMAPYQX-LPEHRKFASA-N 0.000 description 2
- MESDJCNHLZBMEP-ZLUOBGJFSA-N Ser-Asp-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MESDJCNHLZBMEP-ZLUOBGJFSA-N 0.000 description 2
- MOVJSUIKUNCVMG-ZLUOBGJFSA-N Ser-Cys-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N)O MOVJSUIKUNCVMG-ZLUOBGJFSA-N 0.000 description 2
- WUXCHQZLUHBSDJ-LKXGYXEUSA-N Ser-Thr-Asp Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WUXCHQZLUHBSDJ-LKXGYXEUSA-N 0.000 description 2
- STIAINRLUUKYKM-WFBYXXMGSA-N Ser-Trp-Ala Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CO)=CNC2=C1 STIAINRLUUKYKM-WFBYXXMGSA-N 0.000 description 2
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 2
- 108020004682 Single-Stranded DNA Proteins 0.000 description 2
- CDBYLPFSWZWCQE-UHFFFAOYSA-L Sodium Carbonate Chemical compound [Na+].[Na+].[O-]C([O-])=O CDBYLPFSWZWCQE-UHFFFAOYSA-L 0.000 description 2
- UIIMBOGNXHQVGW-UHFFFAOYSA-M Sodium bicarbonate Chemical compound [Na+].OC([O-])=O UIIMBOGNXHQVGW-UHFFFAOYSA-M 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- GVMXJJAJLIEASL-ZJDVBMNYSA-N Thr-Pro-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O GVMXJJAJLIEASL-ZJDVBMNYSA-N 0.000 description 2
- FRQRWAMUESPWMT-HSHDSVGOSA-N Thr-Trp-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCSC)C(=O)O)N)O FRQRWAMUESPWMT-HSHDSVGOSA-N 0.000 description 2
- 102000040945 Transcription factor Human genes 0.000 description 2
- 108091023040 Transcription factor Proteins 0.000 description 2
- GQNCRIFNDVFRNF-BPUTZDHNSA-N Trp-Pro-Asp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O GQNCRIFNDVFRNF-BPUTZDHNSA-N 0.000 description 2
- 101150050388 UL20 gene Proteins 0.000 description 2
- 101150054371 UL24 gene Proteins 0.000 description 2
- 101150032932 UL39 gene Proteins 0.000 description 2
- 102000006943 Uracil-DNA Glycosidase Human genes 0.000 description 2
- 108010072685 Uracil-DNA Glycosidase Proteins 0.000 description 2
- REJBPZVUHYNMEN-LSJOCFKGSA-N Val-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N REJBPZVUHYNMEN-LSJOCFKGSA-N 0.000 description 2
- VMRFIKXKOFNMHW-GUBZILKMSA-N Val-Arg-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N VMRFIKXKOFNMHW-GUBZILKMSA-N 0.000 description 2
- OFTXTCGQJXTNQS-XGEHTFHBSA-N Val-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N)O OFTXTCGQJXTNQS-XGEHTFHBSA-N 0.000 description 2
- 108010003533 Viral Envelope Proteins Proteins 0.000 description 2
- 239000013543 active substance Substances 0.000 description 2
- HDTRYLNUVZCQOY-LIZSDCNHSA-N alpha,alpha-trehalose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-LIZSDCNHSA-N 0.000 description 2
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 2
- 230000000692 anti-sense effect Effects 0.000 description 2
- 238000011717 athymic nude mouse Methods 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 239000011230 binding agent Substances 0.000 description 2
- 230000003115 biocidal effect Effects 0.000 description 2
- 229960002685 biotin Drugs 0.000 description 2
- 235000020958 biotin Nutrition 0.000 description 2
- 239000011616 biotin Substances 0.000 description 2
- 230000037396 body weight Effects 0.000 description 2
- 210000000133 brain stem Anatomy 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 229920006317 cationic polymer Polymers 0.000 description 2
- 230000004663 cell proliferation Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 208000012191 childhood neoplasm Diseases 0.000 description 2
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- 238000004040 coloring Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 239000008120 corn starch Substances 0.000 description 2
- 239000006071 cream Substances 0.000 description 2
- VFLDPWHFBUODDF-FCXRPNKRSA-N curcumin Chemical compound C1=C(O)C(OC)=CC(\C=C\C(=O)CC(=O)\C=C\C=2C=C(OC)C(O)=CC=2)=C1 VFLDPWHFBUODDF-FCXRPNKRSA-N 0.000 description 2
- 230000000120 cytopathologic effect Effects 0.000 description 2
- 231100000433 cytotoxic Toxicity 0.000 description 2
- 230000001472 cytotoxic effect Effects 0.000 description 2
- 230000002950 deficient Effects 0.000 description 2
- 208000007147 dental pulp necrosis Diseases 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000006471 dimerization reaction Methods 0.000 description 2
- 239000000975 dye Substances 0.000 description 2
- 206010014599 encephalitis Diseases 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 150000002148 esters Chemical class 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000012091 fetal bovine serum Substances 0.000 description 2
- 125000000524 functional group Chemical group 0.000 description 2
- 102000034356 gene-regulatory proteins Human genes 0.000 description 2
- 108091006104 gene-regulatory proteins Proteins 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- 230000037442 genomic alteration Effects 0.000 description 2
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 2
- 210000003494 hepatocyte Anatomy 0.000 description 2
- 230000006801 homologous recombination Effects 0.000 description 2
- 238000002744 homologous recombination Methods 0.000 description 2
- 210000005260 human cell Anatomy 0.000 description 2
- 229910052739 hydrogen Inorganic materials 0.000 description 2
- 239000001257 hydrogen Substances 0.000 description 2
- 238000009169 immunotherapy Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000002779 inactivation Effects 0.000 description 2
- 230000006698 induction Effects 0.000 description 2
- 239000007972 injectable composition Substances 0.000 description 2
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 2
- 230000003834 intracellular effect Effects 0.000 description 2
- 238000007912 intraperitoneal administration Methods 0.000 description 2
- 238000007913 intrathecal administration Methods 0.000 description 2
- 238000010253 intravenous injection Methods 0.000 description 2
- 238000007914 intraventricular administration Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 239000008101 lactose Substances 0.000 description 2
- 231100000518 lethal Toxicity 0.000 description 2
- 230000001665 lethal effect Effects 0.000 description 2
- 239000000314 lubricant Substances 0.000 description 2
- 239000006166 lysate Substances 0.000 description 2
- 108010003700 lysyl aspartic acid Proteins 0.000 description 2
- 235000019359 magnesium stearate Nutrition 0.000 description 2
- 201000009020 malignant peripheral nerve sheath tumor Diseases 0.000 description 2
- 238000002493 microarray Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 239000001788 mono and diglycerides of fatty acids Substances 0.000 description 2
- 230000017066 negative regulation of growth Effects 0.000 description 2
- 208000029974 neurofibrosarcoma Diseases 0.000 description 2
- 230000002981 neuropathic effect Effects 0.000 description 2
- 231100000252 nontoxic Toxicity 0.000 description 2
- 230000003000 nontoxic effect Effects 0.000 description 2
- 230000037360 nucleotide metabolism Effects 0.000 description 2
- 239000003921 oil Substances 0.000 description 2
- 235000019198 oils Nutrition 0.000 description 2
- 239000002674 ointment Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002611 ovarian Effects 0.000 description 2
- 238000004806 packaging method and process Methods 0.000 description 2
- XQYZDYMELSJDRZ-UHFFFAOYSA-N papaverine Chemical compound C1=C(OC)C(OC)=CC=C1CC1=NC=CC2=CC(OC)=C(OC)C=C12 XQYZDYMELSJDRZ-UHFFFAOYSA-N 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 239000008188 pellet Substances 0.000 description 2
- 210000005259 peripheral blood Anatomy 0.000 description 2
- 239000011886 peripheral blood Substances 0.000 description 2
- 108010079892 phosphoglycerol kinase Proteins 0.000 description 2
- 239000013600 plasmid vector Substances 0.000 description 2
- 229920001282 polysaccharide Polymers 0.000 description 2
- 239000005017 polysaccharide Substances 0.000 description 2
- 150000004804 polysaccharides Chemical class 0.000 description 2
- 239000013641 positive control Substances 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- BBEAQIROQSPTKN-UHFFFAOYSA-N pyrene Chemical compound C1=CC=C2C=CC3=CC=CC4=CC=C1C2=C43 BBEAQIROQSPTKN-UHFFFAOYSA-N 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- PYWVYCXTNDRMGF-UHFFFAOYSA-N rhodamine B Chemical compound [Cl-].C=12C=CC(=[N+](CC)CC)C=C2OC2=CC(N(CC)CC)=CC=C2C=1C1=CC=CC=C1C(O)=O PYWVYCXTNDRMGF-UHFFFAOYSA-N 0.000 description 2
- 239000002336 ribonucleotide Substances 0.000 description 2
- 125000002652 ribonucleotide group Chemical group 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- 238000007423 screening assay Methods 0.000 description 2
- 230000002269 spontaneous effect Effects 0.000 description 2
- 239000003381 stabilizer Substances 0.000 description 2
- 238000007920 subcutaneous administration Methods 0.000 description 2
- 239000013589 supplement Substances 0.000 description 2
- 230000002459 sustained effect Effects 0.000 description 2
- 239000000454 talc Substances 0.000 description 2
- 229910052623 talc Inorganic materials 0.000 description 2
- 235000012222 talc Nutrition 0.000 description 2
- 210000001550 testis Anatomy 0.000 description 2
- 101150024821 tetO gene Proteins 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 238000011269 treatment regimen Methods 0.000 description 2
- 210000004881 tumor cell Anatomy 0.000 description 2
- 238000007492 two-way ANOVA Methods 0.000 description 2
- 241001529453 unidentified herpesvirus Species 0.000 description 2
- 239000011800 void material Substances 0.000 description 2
- 239000000080 wetting agent Substances 0.000 description 2
- HDTRYLNUVZCQOY-UHFFFAOYSA-N α-D-glucopyranosyl-α-D-glucopyranoside Natural products OC1C(O)C(O)C(CO)OC1OC1C(O)C(O)C(O)C(CO)O1 HDTRYLNUVZCQOY-UHFFFAOYSA-N 0.000 description 1
- FQVLRGLGWNWPSS-BXBUPLCLSA-N (4r,7s,10s,13s,16r)-16-acetamido-13-(1h-imidazol-5-ylmethyl)-10-methyl-6,9,12,15-tetraoxo-7-propan-2-yl-1,2-dithia-5,8,11,14-tetrazacycloheptadecane-4-carboxamide Chemical compound N1C(=O)[C@@H](NC(C)=O)CSSC[C@@H](C(N)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)NC(=O)[C@@H]1CC1=CN=CN1 FQVLRGLGWNWPSS-BXBUPLCLSA-N 0.000 description 1
- SGKRLCUYIXIAHR-AKNGSSGZSA-N (4s,4ar,5s,5ar,6r,12ar)-4-(dimethylamino)-1,5,10,11,12a-pentahydroxy-6-methyl-3,12-dioxo-4a,5,5a,6-tetrahydro-4h-tetracene-2-carboxamide Chemical compound C1=CC=C2[C@H](C)[C@@H]([C@H](O)[C@@H]3[C@](C(O)=C(C(N)=O)C(=O)[C@H]3N(C)C)(O)C3=O)C3=C(O)C2=C1O SGKRLCUYIXIAHR-AKNGSSGZSA-N 0.000 description 1
- DNIAPMSPPWPWGF-GSVOUGTGSA-N (R)-(-)-Propylene glycol Chemical compound C[C@@H](O)CO DNIAPMSPPWPWGF-GSVOUGTGSA-N 0.000 description 1
- IIZPXYDJLKNOIY-JXPKJXOSSA-N 1-palmitoyl-2-arachidonoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCC\C=C/C\C=C/C\C=C/C\C=C/CCCCC IIZPXYDJLKNOIY-JXPKJXOSSA-N 0.000 description 1
- 150000003923 2,5-pyrrolediones Chemical class 0.000 description 1
- PEZMQPADLFXCJJ-ZETCQYMHSA-N 2-[[2-[[(2s)-1-(2-aminoacetyl)pyrrolidine-2-carbonyl]amino]acetyl]amino]acetic acid Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(=O)NCC(O)=O PEZMQPADLFXCJJ-ZETCQYMHSA-N 0.000 description 1
- DAQHMCWYXJEOCG-UHFFFAOYSA-N 2-oxopropanoic acid;sodium Chemical compound [Na].CC(=O)C(O)=O DAQHMCWYXJEOCG-UHFFFAOYSA-N 0.000 description 1
- GOLORTLGFDVFDW-UHFFFAOYSA-N 3-(1h-benzimidazol-2-yl)-7-(diethylamino)chromen-2-one Chemical compound C1=CC=C2NC(C3=CC4=CC=C(C=C4OC3=O)N(CC)CC)=NC2=C1 GOLORTLGFDVFDW-UHFFFAOYSA-N 0.000 description 1
- VIIIJFZJKFXOGG-UHFFFAOYSA-N 3-methylchromen-2-one Chemical compound C1=CC=C2OC(=O)C(C)=CC2=C1 VIIIJFZJKFXOGG-UHFFFAOYSA-N 0.000 description 1
- SQDAZGGFXASXDW-UHFFFAOYSA-N 5-bromo-2-(trifluoromethoxy)pyridine Chemical compound FC(F)(F)OC1=CC=C(Br)C=N1 SQDAZGGFXASXDW-UHFFFAOYSA-N 0.000 description 1
- 229930008281 A03AD01 - Papaverine Natural products 0.000 description 1
- 239000013607 AAV vector Substances 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 108010000239 Aequorin Proteins 0.000 description 1
- SSSROGPPPVTHLX-FXQIFTODSA-N Ala-Arg-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SSSROGPPPVTHLX-FXQIFTODSA-N 0.000 description 1
- LZRNYBIJOSKKRJ-XVYDVKMFSA-N Ala-Asp-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N LZRNYBIJOSKKRJ-XVYDVKMFSA-N 0.000 description 1
- DECCMEWNXSNSDO-ZLUOBGJFSA-N Ala-Cys-Ala Chemical compound C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O DECCMEWNXSNSDO-ZLUOBGJFSA-N 0.000 description 1
- LMFXXZPPZDCPTA-ZKWXMUAHSA-N Ala-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N LMFXXZPPZDCPTA-ZKWXMUAHSA-N 0.000 description 1
- GRPHQEMIFDPKOE-HGNGGELXSA-N Ala-His-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O GRPHQEMIFDPKOE-HGNGGELXSA-N 0.000 description 1
- PMQXMXAASGFUDX-SRVKXCTJSA-N Ala-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCCN PMQXMXAASGFUDX-SRVKXCTJSA-N 0.000 description 1
- NLYYHIKRBRMAJV-AEJSXWLSSA-N Ala-Val-Pro Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N NLYYHIKRBRMAJV-AEJSXWLSSA-N 0.000 description 1
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 1
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 1
- 102100034035 Alcohol dehydrogenase 1A Human genes 0.000 description 1
- 235000019489 Almond oil Nutrition 0.000 description 1
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- UPKMBGAAEZGHOC-RWMBFGLXSA-N Arg-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O UPKMBGAAEZGHOC-RWMBFGLXSA-N 0.000 description 1
- INXWADWANGLMPJ-JYJNAYRXSA-N Arg-Phe-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)CC1=CC=CC=C1 INXWADWANGLMPJ-JYJNAYRXSA-N 0.000 description 1
- YFHATWYGAAXQCF-JYJNAYRXSA-N Arg-Pro-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YFHATWYGAAXQCF-JYJNAYRXSA-N 0.000 description 1
- AWMAZIIEFPFHCP-RCWTZXSCSA-N Arg-Pro-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O AWMAZIIEFPFHCP-RCWTZXSCSA-N 0.000 description 1
- KXOPYFNQLVUOAQ-FXQIFTODSA-N Arg-Ser-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KXOPYFNQLVUOAQ-FXQIFTODSA-N 0.000 description 1
- YNSUUAOAFCVINY-OSUNSFLBSA-N Arg-Thr-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YNSUUAOAFCVINY-OSUNSFLBSA-N 0.000 description 1
- QCTOLCVIGRLMQS-HRCADAONSA-N Arg-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O QCTOLCVIGRLMQS-HRCADAONSA-N 0.000 description 1
- ORXCYAFUCSTQGY-FXQIFTODSA-N Asn-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)N)N ORXCYAFUCSTQGY-FXQIFTODSA-N 0.000 description 1
- MEFGKQUUYZOLHM-GMOBBJLQSA-N Asn-Arg-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MEFGKQUUYZOLHM-GMOBBJLQSA-N 0.000 description 1
- WQLJRNRLHWJIRW-KKUMJFAQSA-N Asn-His-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC(=O)N)N)O WQLJRNRLHWJIRW-KKUMJFAQSA-N 0.000 description 1
- WIDVAWAQBRAKTI-YUMQZZPRSA-N Asn-Leu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O WIDVAWAQBRAKTI-YUMQZZPRSA-N 0.000 description 1
- GZXOUBTUAUAVHD-ACZMJKKPSA-N Asn-Ser-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GZXOUBTUAUAVHD-ACZMJKKPSA-N 0.000 description 1
- WUQXMTITJLFXAU-JIOCBJNQSA-N Asn-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N)O WUQXMTITJLFXAU-JIOCBJNQSA-N 0.000 description 1
- RTFXPCYMDYBZNQ-SRVKXCTJSA-N Asn-Tyr-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O RTFXPCYMDYBZNQ-SRVKXCTJSA-N 0.000 description 1
- QNNBHTFDFFFHGC-KKUMJFAQSA-N Asn-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QNNBHTFDFFFHGC-KKUMJFAQSA-N 0.000 description 1
- OERMIMJQPQUIPK-FXQIFTODSA-N Asp-Arg-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O OERMIMJQPQUIPK-FXQIFTODSA-N 0.000 description 1
- FANQWNCPNFEPGZ-WHFBIAKZSA-N Asp-Asp-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O FANQWNCPNFEPGZ-WHFBIAKZSA-N 0.000 description 1
- KGAJCJXBEWLQDZ-UBHSHLNASA-N Asp-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N KGAJCJXBEWLQDZ-UBHSHLNASA-N 0.000 description 1
- WBDWQKRLTVCDSY-WHFBIAKZSA-N Asp-Gly-Asp Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O WBDWQKRLTVCDSY-WHFBIAKZSA-N 0.000 description 1
- SVABRQFIHCSNCI-FOHZUACHSA-N Asp-Gly-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O SVABRQFIHCSNCI-FOHZUACHSA-N 0.000 description 1
- LNENWJXDHCFVOF-DCAQKATOSA-N Asp-His-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)O)N LNENWJXDHCFVOF-DCAQKATOSA-N 0.000 description 1
- YFSLJHLQOALGSY-ZPFDUUQYSA-N Asp-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N YFSLJHLQOALGSY-ZPFDUUQYSA-N 0.000 description 1
- KPSHWSWFPUDEGF-FXQIFTODSA-N Asp-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(O)=O KPSHWSWFPUDEGF-FXQIFTODSA-N 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 108090001008 Avidin Proteins 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 1
- 238000011740 C57BL/6 mouse Methods 0.000 description 1
- 101000687585 Caenorhabditis elegans REST corepressor spr-1 Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 241000700114 Chinchillidae Species 0.000 description 1
- 108010009685 Cholinergic Receptors Proteins 0.000 description 1
- 229920001287 Chondroitin sulfate Polymers 0.000 description 1
- CHRCKSPMGYDLIA-SRVKXCTJSA-N Cys-Phe-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O CHRCKSPMGYDLIA-SRVKXCTJSA-N 0.000 description 1
- GGRDJANMZPGMNS-CIUDSAMLSA-N Cys-Ser-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O GGRDJANMZPGMNS-CIUDSAMLSA-N 0.000 description 1
- NAPULYCVEVVFRB-HEIBUPTGSA-N Cys-Thr-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)CS NAPULYCVEVVFRB-HEIBUPTGSA-N 0.000 description 1
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 1
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 1
- 101710116602 DNA-Binding protein G5P Proteins 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 102100023933 Deoxyuridine 5'-triphosphate nucleotidohydrolase, mitochondrial Human genes 0.000 description 1
- 241000702421 Dependoparvovirus Species 0.000 description 1
- 101000687583 Drosophila melanogaster REST corepressor Proteins 0.000 description 1
- 101100118093 Drosophila melanogaster eEF1alpha2 gene Proteins 0.000 description 1
- UPEZCKBFRMILAV-JNEQICEOSA-N Ecdysone Natural products O=C1[C@H]2[C@@](C)([C@@H]3C([C@@]4(O)[C@@](C)([C@H]([C@H]([C@@H](O)CCC(O)(C)C)C)CC4)CC3)=C1)C[C@H](O)[C@H](O)C2 UPEZCKBFRMILAV-JNEQICEOSA-N 0.000 description 1
- 101710091045 Envelope protein Proteins 0.000 description 1
- 102100033919 Ephrin-A2 Human genes 0.000 description 1
- 108010043942 Ephrin-A2 Proteins 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 108091092566 Extrachromosomal DNA Proteins 0.000 description 1
- 241000282324 Felis Species 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 108010001498 Galectin 1 Proteins 0.000 description 1
- 102100021736 Galectin-1 Human genes 0.000 description 1
- 101000834253 Gallus gallus Actin, cytoplasmic 1 Proteins 0.000 description 1
- 108010010803 Gelatin Proteins 0.000 description 1
- 101000892220 Geobacillus thermodenitrificans (strain NG80-2) Long-chain-alcohol dehydrogenase 1 Proteins 0.000 description 1
- 101150109586 Gk gene Proteins 0.000 description 1
- ZNZPKVQURDQFFS-FXQIFTODSA-N Gln-Glu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZNZPKVQURDQFFS-FXQIFTODSA-N 0.000 description 1
- LTXLIIZACMCQTO-GUBZILKMSA-N Gln-His-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N LTXLIIZACMCQTO-GUBZILKMSA-N 0.000 description 1
- KUBFPYIMAGXGBT-ACZMJKKPSA-N Gln-Ser-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KUBFPYIMAGXGBT-ACZMJKKPSA-N 0.000 description 1
- SZXSSXUNOALWCH-ACZMJKKPSA-N Glu-Ala-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O SZXSSXUNOALWCH-ACZMJKKPSA-N 0.000 description 1
- AVZHGSCDKIQZPQ-CIUDSAMLSA-N Glu-Arg-Ala Chemical compound C[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AVZHGSCDKIQZPQ-CIUDSAMLSA-N 0.000 description 1
- CLROYXHHUZELFX-FXQIFTODSA-N Glu-Gln-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O CLROYXHHUZELFX-FXQIFTODSA-N 0.000 description 1
- MTAOBYXRYJZRGQ-WDSKDSINSA-N Glu-Gly-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MTAOBYXRYJZRGQ-WDSKDSINSA-N 0.000 description 1
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 1
- LZEUDRYSAZAJIO-AUTRQRHGSA-N Glu-Val-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZEUDRYSAZAJIO-AUTRQRHGSA-N 0.000 description 1
- BRFJMRSRMOMIMU-WHFBIAKZSA-N Gly-Ala-Asn Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O BRFJMRSRMOMIMU-WHFBIAKZSA-N 0.000 description 1
- BGVYNAQWHSTTSP-BYULHYEWSA-N Gly-Asn-Ile Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BGVYNAQWHSTTSP-BYULHYEWSA-N 0.000 description 1
- IEFJWDNGDZAYNZ-BYPYZUCNSA-N Gly-Glu Chemical compound NCC(=O)N[C@H](C(O)=O)CCC(O)=O IEFJWDNGDZAYNZ-BYPYZUCNSA-N 0.000 description 1
- ITZOBNKQDZEOCE-NHCYSSNCSA-N Gly-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)CN ITZOBNKQDZEOCE-NHCYSSNCSA-N 0.000 description 1
- MHXKHKWHPNETGG-QWRGUYRKSA-N Gly-Lys-Leu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O MHXKHKWHPNETGG-QWRGUYRKSA-N 0.000 description 1
- OJNZVYSGVYLQIN-BQBZGAKWSA-N Gly-Met-Asp Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O OJNZVYSGVYLQIN-BQBZGAKWSA-N 0.000 description 1
- IEGFSKKANYKBDU-QWHCGFSZSA-N Gly-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)CN)C(=O)O IEGFSKKANYKBDU-QWHCGFSZSA-N 0.000 description 1
- JJGBXTYGTKWGAT-YUMQZZPRSA-N Gly-Pro-Glu Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O JJGBXTYGTKWGAT-YUMQZZPRSA-N 0.000 description 1
- NGRPGJGKJMUGDM-XVKPBYJWSA-N Gly-Val-Gln Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O NGRPGJGKJMUGDM-XVKPBYJWSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 229920002683 Glycosaminoglycan Polymers 0.000 description 1
- 108010051696 Growth Hormone Proteins 0.000 description 1
- 102100027685 Hemoglobin subunit alpha Human genes 0.000 description 1
- 108091005902 Hemoglobin subunit alpha Proteins 0.000 description 1
- 102100021519 Hemoglobin subunit beta Human genes 0.000 description 1
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 1
- 102000008055 Heparan Sulfate Proteoglycans Human genes 0.000 description 1
- 229920002971 Heparan sulfate Polymers 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- MBSSHYPAEHPSGY-LSJOCFKGSA-N His-Ala-Met Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O MBSSHYPAEHPSGY-LSJOCFKGSA-N 0.000 description 1
- UZZXGLOJRZKYEL-DJFWLOJKSA-N His-Asn-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UZZXGLOJRZKYEL-DJFWLOJKSA-N 0.000 description 1
- IGBBXBFSLKRHJB-BZSNNMDCSA-N His-Lys-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 IGBBXBFSLKRHJB-BZSNNMDCSA-N 0.000 description 1
- WYSJPCTWSBJFCO-AVGNSLFASA-N His-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CN=CN1)N WYSJPCTWSBJFCO-AVGNSLFASA-N 0.000 description 1
- 102000003964 Histone deacetylase Human genes 0.000 description 1
- 108090000353 Histone deacetylase Proteins 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 101000756632 Homo sapiens Actin, cytoplasmic 1 Proteins 0.000 description 1
- 101000780443 Homo sapiens Alcohol dehydrogenase 1A Proteins 0.000 description 1
- 101000579123 Homo sapiens Phosphoglycerate kinase 1 Proteins 0.000 description 1
- 101000756346 Homo sapiens RE1-silencing transcription factor Proteins 0.000 description 1
- 241000701024 Human betaherpesvirus 5 Species 0.000 description 1
- 101900065606 Human cytomegalovirus Immediate early protein IE1 Proteins 0.000 description 1
- 108010056651 Hydroxymethylbilane synthase Proteins 0.000 description 1
- 206010021143 Hypoxia Diseases 0.000 description 1
- XQFRJNBWHJMXHO-RRKCRQDMSA-N IDUR Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(I)=C1 XQFRJNBWHJMXHO-RRKCRQDMSA-N 0.000 description 1
- QIHJTGSVGIPHIW-QSFUFRPTSA-N Ile-Asn-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N QIHJTGSVGIPHIW-QSFUFRPTSA-N 0.000 description 1
- HGNUKGZQASSBKQ-PCBIJLKTSA-N Ile-Asp-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N HGNUKGZQASSBKQ-PCBIJLKTSA-N 0.000 description 1
- KFVUBLZRFSVDGO-BYULHYEWSA-N Ile-Gly-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O KFVUBLZRFSVDGO-BYULHYEWSA-N 0.000 description 1
- 108020005350 Initiator Codon Proteins 0.000 description 1
- 108090001061 Insulin Proteins 0.000 description 1
- 102100023915 Insulin Human genes 0.000 description 1
- 102100034349 Integrase Human genes 0.000 description 1
- 239000007836 KH2PO4 Substances 0.000 description 1
- 206010023509 Kyphosis Diseases 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- 241000270322 Lepidosauria Species 0.000 description 1
- 206010024264 Lethargy Diseases 0.000 description 1
- HBJZFCIVFIBNSV-DCAQKATOSA-N Leu-Arg-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O HBJZFCIVFIBNSV-DCAQKATOSA-N 0.000 description 1
- DKEZVKFLETVJFY-CIUDSAMLSA-N Leu-Cys-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O)N DKEZVKFLETVJFY-CIUDSAMLSA-N 0.000 description 1
- HVJVUYQWFYMGJS-GVXVVHGQSA-N Leu-Glu-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVJVUYQWFYMGJS-GVXVVHGQSA-N 0.000 description 1
- VBZOAGIPCULURB-QWRGUYRKSA-N Leu-Gly-His Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N VBZOAGIPCULURB-QWRGUYRKSA-N 0.000 description 1
- QNTJIDXQHWUBKC-BZSNNMDCSA-N Leu-Lys-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QNTJIDXQHWUBKC-BZSNNMDCSA-N 0.000 description 1
- QONKWXNJRRNTBV-AVGNSLFASA-N Leu-Pro-Met Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)O)N QONKWXNJRRNTBV-AVGNSLFASA-N 0.000 description 1
- ADJWHHZETYAAAX-SRVKXCTJSA-N Leu-Ser-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ADJWHHZETYAAAX-SRVKXCTJSA-N 0.000 description 1
- PPGBXYKMUMHFBF-KATARQTJSA-N Leu-Ser-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PPGBXYKMUMHFBF-KATARQTJSA-N 0.000 description 1
- HGLKOTPFWOMPOB-MEYUZBJRSA-N Leu-Thr-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HGLKOTPFWOMPOB-MEYUZBJRSA-N 0.000 description 1
- BTEMNFBEAAOGBR-BZSNNMDCSA-N Leu-Tyr-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BTEMNFBEAAOGBR-BZSNNMDCSA-N 0.000 description 1
- QESXLSQLQHHTIX-RHYQMDGZSA-N Leu-Val-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QESXLSQLQHHTIX-RHYQMDGZSA-N 0.000 description 1
- 108090001030 Lipoproteins Proteins 0.000 description 1
- 102000004895 Lipoproteins Human genes 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- GQUDMNDPQTXZRV-DCAQKATOSA-N Lys-Arg-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GQUDMNDPQTXZRV-DCAQKATOSA-N 0.000 description 1
- QQUJSUFWEDZQQY-AVGNSLFASA-N Lys-Gln-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN QQUJSUFWEDZQQY-AVGNSLFASA-N 0.000 description 1
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 1
- MXMDJEJWERYPMO-XUXIUFHCSA-N Lys-Ile-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MXMDJEJWERYPMO-XUXIUFHCSA-N 0.000 description 1
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 1
- 229930195725 Mannitol Natural products 0.000 description 1
- 238000000585 Mann–Whitney U test Methods 0.000 description 1
- 108010076502 Matrix Metalloproteinase 11 Proteins 0.000 description 1
- 102000018697 Membrane Proteins Human genes 0.000 description 1
- 108010052285 Membrane Proteins Proteins 0.000 description 1
- VHGIWFGJIHTASW-FXQIFTODSA-N Met-Ala-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O VHGIWFGJIHTASW-FXQIFTODSA-N 0.000 description 1
- GODBLDDYHFTUAH-CIUDSAMLSA-N Met-Asp-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O GODBLDDYHFTUAH-CIUDSAMLSA-N 0.000 description 1
- LBSWWNKMVPAXOI-GUBZILKMSA-N Met-Val-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O LBSWWNKMVPAXOI-GUBZILKMSA-N 0.000 description 1
- 229920000168 Microcrystalline cellulose Polymers 0.000 description 1
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 1
- 101150041636 NEC1 gene Proteins 0.000 description 1
- 108091061960 Naked DNA Proteins 0.000 description 1
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 1
- 101710115901 Neurovirulence factor ICP34.5 Proteins 0.000 description 1
- 108020004485 Nonsense Codon Proteins 0.000 description 1
- 102000011931 Nucleoproteins Human genes 0.000 description 1
- 108010061100 Nucleoproteins Proteins 0.000 description 1
- 206010030216 Oesophagitis Diseases 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 108010038807 Oligopeptides Proteins 0.000 description 1
- 102000015636 Oligopeptides Human genes 0.000 description 1
- 102000004316 Oxidoreductases Human genes 0.000 description 1
- 108090000854 Oxidoreductases Proteins 0.000 description 1
- KJWZYMMLVHIVSU-IYCNHOCDSA-N PGK1 Chemical compound CCCCC[C@H](O)\C=C\[C@@H]1[C@@H](CCCCCCC(O)=O)C(=O)CC1=O KJWZYMMLVHIVSU-IYCNHOCDSA-N 0.000 description 1
- 229930040373 Paraformaldehyde Natural products 0.000 description 1
- 102100028251 Phosphoglycerate kinase 1 Human genes 0.000 description 1
- 206010035664 Pneumonia Diseases 0.000 description 1
- 229920002873 Polyethylenimine Polymers 0.000 description 1
- 101710182846 Polyhedrin Proteins 0.000 description 1
- 108010039918 Polylysine Proteins 0.000 description 1
- 102100034391 Porphobilinogen deaminase Human genes 0.000 description 1
- OBVCYFIHIIYIQF-CIUDSAMLSA-N Pro-Asn-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OBVCYFIHIIYIQF-CIUDSAMLSA-N 0.000 description 1
- ZCXQTRXYZOSGJR-FXQIFTODSA-N Pro-Asp-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZCXQTRXYZOSGJR-FXQIFTODSA-N 0.000 description 1
- LHALYDBUDCWMDY-CIUDSAMLSA-N Pro-Glu-Ala Chemical compound C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O LHALYDBUDCWMDY-CIUDSAMLSA-N 0.000 description 1
- NMELOOXSGDRBRU-YUMQZZPRSA-N Pro-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)O)NC(=O)[C@@H]1CCCN1 NMELOOXSGDRBRU-YUMQZZPRSA-N 0.000 description 1
- PKHDJFHFMGQMPS-RCWTZXSCSA-N Pro-Thr-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PKHDJFHFMGQMPS-RCWTZXSCSA-N 0.000 description 1
- DCHQYSOGURGJST-FJXKBIBVSA-N Pro-Thr-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O DCHQYSOGURGJST-FJXKBIBVSA-N 0.000 description 1
- KHRLUIPIMIQFGT-AVGNSLFASA-N Pro-Val-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHRLUIPIMIQFGT-AVGNSLFASA-N 0.000 description 1
- ZMLRZBWCXPQADC-TUAOUCFPSA-N Pro-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 ZMLRZBWCXPQADC-TUAOUCFPSA-N 0.000 description 1
- FHJQROWZEJFZPO-SRVKXCTJSA-N Pro-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FHJQROWZEJFZPO-SRVKXCTJSA-N 0.000 description 1
- 102100038280 Prostaglandin G/H synthase 2 Human genes 0.000 description 1
- 108050003267 Prostaglandin G/H synthase 2 Proteins 0.000 description 1
- 102000005569 Protein Phosphatase 1 Human genes 0.000 description 1
- 108010059000 Protein Phosphatase 1 Proteins 0.000 description 1
- 101710188315 Protein X Proteins 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 102100022940 RE1-silencing transcription factor Human genes 0.000 description 1
- 101710162453 Replication factor A Proteins 0.000 description 1
- 101710176758 Replication protein A 70 kDa DNA-binding subunit Proteins 0.000 description 1
- 102000009661 Repressor Proteins Human genes 0.000 description 1
- 101710176276 SSB protein Proteins 0.000 description 1
- 101100010928 Saccharolobus solfataricus (strain ATCC 35092 / DSM 1617 / JCM 11322 / P2) tuf gene Proteins 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 241000607142 Salmonella Species 0.000 description 1
- 241000710961 Semliki Forest virus Species 0.000 description 1
- FIXILCYTSAUERA-FXQIFTODSA-N Ser-Ala-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FIXILCYTSAUERA-FXQIFTODSA-N 0.000 description 1
- IYCBDVBJWDXQRR-FXQIFTODSA-N Ser-Ala-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O IYCBDVBJWDXQRR-FXQIFTODSA-N 0.000 description 1
- KCFKKAQKRZBWJB-ZLUOBGJFSA-N Ser-Cys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O KCFKKAQKRZBWJB-ZLUOBGJFSA-N 0.000 description 1
- HVKMTOIAYDOJPL-NRPADANISA-N Ser-Gln-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVKMTOIAYDOJPL-NRPADANISA-N 0.000 description 1
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 1
- RJHJPZQOMKCSTP-CIUDSAMLSA-N Ser-His-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O RJHJPZQOMKCSTP-CIUDSAMLSA-N 0.000 description 1
- DOSZISJPMCYEHT-NAKRPEOUSA-N Ser-Ile-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O DOSZISJPMCYEHT-NAKRPEOUSA-N 0.000 description 1
- PPNPDKGQRFSCAC-CIUDSAMLSA-N Ser-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPNPDKGQRFSCAC-CIUDSAMLSA-N 0.000 description 1
- UGGWCAFQPKANMW-FXQIFTODSA-N Ser-Met-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O UGGWCAFQPKANMW-FXQIFTODSA-N 0.000 description 1
- QPPYAWVLAVXISR-DCAQKATOSA-N Ser-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O QPPYAWVLAVXISR-DCAQKATOSA-N 0.000 description 1
- JGUWRQWULDWNCM-FXQIFTODSA-N Ser-Val-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O JGUWRQWULDWNCM-FXQIFTODSA-N 0.000 description 1
- 241000872198 Serjania polyphylla Species 0.000 description 1
- 241000580858 Simian-Human immunodeficiency virus Species 0.000 description 1
- 241000710960 Sindbis virus Species 0.000 description 1
- 101710126859 Single-stranded DNA-binding protein Proteins 0.000 description 1
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 1
- 102100038803 Somatotropin Human genes 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 235000021355 Stearic acid Nutrition 0.000 description 1
- PJANXHGTPQOBST-VAWYXSNFSA-N Stilbene Natural products C=1C=CC=CC=1/C=C/C1=CC=CC=C1 PJANXHGTPQOBST-VAWYXSNFSA-N 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- 102000017303 Stromelysin-3 Human genes 0.000 description 1
- QAOWNCQODCNURD-UHFFFAOYSA-L Sulfate Chemical compound [O-]S([O-])(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-L 0.000 description 1
- 102000000763 Survivin Human genes 0.000 description 1
- 108010002687 Survivin Proteins 0.000 description 1
- 241000282898 Sus scrofa Species 0.000 description 1
- 108090000054 Syndecan-2 Proteins 0.000 description 1
- 101150001810 TEAD1 gene Proteins 0.000 description 1
- 101150074253 TEF1 gene Proteins 0.000 description 1
- 101150003725 TK gene Proteins 0.000 description 1
- 101150110861 TRM2 gene Proteins 0.000 description 1
- 108010017842 Telomerase Proteins 0.000 description 1
- 102100032938 Telomerase reverse transcriptase Human genes 0.000 description 1
- DDPVJPIGACCMEH-XQXXSGGOSA-N Thr-Ala-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DDPVJPIGACCMEH-XQXXSGGOSA-N 0.000 description 1
- CAGTXGDOIFXLPC-KZVJFYERSA-N Thr-Arg-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CCCN=C(N)N CAGTXGDOIFXLPC-KZVJFYERSA-N 0.000 description 1
- LHUBVKCLOVALIA-HJGDQZAQSA-N Thr-Arg-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O LHUBVKCLOVALIA-HJGDQZAQSA-N 0.000 description 1
- KWQBJOUOSNJDRR-XAVMHZPKSA-N Thr-Cys-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N)O KWQBJOUOSNJDRR-XAVMHZPKSA-N 0.000 description 1
- JKGGPMOUIAAJAA-YEPSODPASA-N Thr-Gly-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O JKGGPMOUIAAJAA-YEPSODPASA-N 0.000 description 1
- RFKVQLIXNVEOMB-WEDXCCLWSA-N Thr-Leu-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N)O RFKVQLIXNVEOMB-WEDXCCLWSA-N 0.000 description 1
- KZSYAEWQMJEGRZ-RHYQMDGZSA-N Thr-Leu-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O KZSYAEWQMJEGRZ-RHYQMDGZSA-N 0.000 description 1
- RVMNUBQWPVOUKH-HEIBUPTGSA-N Thr-Ser-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMNUBQWPVOUKH-HEIBUPTGSA-N 0.000 description 1
- PELIQFPESHBTMA-WLTAIBSBSA-N Thr-Tyr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 PELIQFPESHBTMA-WLTAIBSBSA-N 0.000 description 1
- 108010022394 Threonine synthase Proteins 0.000 description 1
- 102000006601 Thymidine Kinase Human genes 0.000 description 1
- 108020004440 Thymidine kinase Proteins 0.000 description 1
- 102100029898 Transcriptional enhancer factor TEF-1 Human genes 0.000 description 1
- HDTRYLNUVZCQOY-WSWWMNSNSA-N Trehalose Natural products O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-WSWWMNSNSA-N 0.000 description 1
- QAXCHNZDPLSFPC-PJODQICGSA-N Trp-Ala-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 QAXCHNZDPLSFPC-PJODQICGSA-N 0.000 description 1
- IQXWAJUIAQLZNX-IHPCNDPISA-N Trp-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N IQXWAJUIAQLZNX-IHPCNDPISA-N 0.000 description 1
- VOCHZIJXPRBVSI-XIRDDKMYSA-N Trp-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N VOCHZIJXPRBVSI-XIRDDKMYSA-N 0.000 description 1
- IKUMWSDCGQVGHC-UMPQAUOISA-N Trp-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC2=CNC3=CC=CC=C32)N)O IKUMWSDCGQVGHC-UMPQAUOISA-N 0.000 description 1
- GSCPHMSPGQSZJT-JYBASQMISA-N Trp-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O GSCPHMSPGQSZJT-JYBASQMISA-N 0.000 description 1
- 102000001742 Tumor Suppressor Proteins Human genes 0.000 description 1
- 108010040002 Tumor Suppressor Proteins Proteins 0.000 description 1
- QUILOGWWLXMSAT-IHRRRGAJSA-N Tyr-Gln-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QUILOGWWLXMSAT-IHRRRGAJSA-N 0.000 description 1
- PWKMJDQXKCENMF-MEYUZBJRSA-N Tyr-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O PWKMJDQXKCENMF-MEYUZBJRSA-N 0.000 description 1
- KLOZTPOXVVRVAQ-DZKIICNBSA-N Tyr-Val-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 KLOZTPOXVVRVAQ-DZKIICNBSA-N 0.000 description 1
- 101150118251 UL23 gene Proteins 0.000 description 1
- 101150003230 UL27 gene Proteins 0.000 description 1
- 101150072074 UL28 gene Proteins 0.000 description 1
- 101150068034 UL30 gene Proteins 0.000 description 1
- 101150017804 UL33 gene Proteins 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- 102000006275 Ubiquitin-Protein Ligases Human genes 0.000 description 1
- 108010083111 Ubiquitin-Protein Ligases Proteins 0.000 description 1
- IVXJODPZRWHCCR-JYJNAYRXSA-N Val-Arg-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N IVXJODPZRWHCCR-JYJNAYRXSA-N 0.000 description 1
- UDNYEPLJTRDMEJ-RCOVLWMOSA-N Val-Asn-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N UDNYEPLJTRDMEJ-RCOVLWMOSA-N 0.000 description 1
- QGFPYRPIUXBYGR-YDHLFZDLSA-N Val-Asn-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N QGFPYRPIUXBYGR-YDHLFZDLSA-N 0.000 description 1
- VFOHXOLPLACADK-GVXVVHGQSA-N Val-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N VFOHXOLPLACADK-GVXVVHGQSA-N 0.000 description 1
- ROLGIBMFNMZANA-GVXVVHGQSA-N Val-Glu-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N ROLGIBMFNMZANA-GVXVVHGQSA-N 0.000 description 1
- DJQIUOKSNRBTSV-CYDGBPFRSA-N Val-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](C(C)C)N DJQIUOKSNRBTSV-CYDGBPFRSA-N 0.000 description 1
- HPANGHISDXDUQY-ULQDDVLXSA-N Val-Lys-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N HPANGHISDXDUQY-ULQDDVLXSA-N 0.000 description 1
- WMRWZYSRQUORHJ-YDHLFZDLSA-N Val-Phe-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WMRWZYSRQUORHJ-YDHLFZDLSA-N 0.000 description 1
- RYQUMYBMOJYYDK-NHCYSSNCSA-N Val-Pro-Glu Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RYQUMYBMOJYYDK-NHCYSSNCSA-N 0.000 description 1
- USLVEJAHTBLSIL-CYDGBPFRSA-N Val-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C USLVEJAHTBLSIL-CYDGBPFRSA-N 0.000 description 1
- CEKSLIVSNNGOKH-KZVJFYERSA-N Val-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](C(C)C)N)O CEKSLIVSNNGOKH-KZVJFYERSA-N 0.000 description 1
- GTACFKZDQFTVAI-STECZYCISA-N Val-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=C(O)C=C1 GTACFKZDQFTVAI-STECZYCISA-N 0.000 description 1
- 108020005202 Viral DNA Proteins 0.000 description 1
- 102000018265 Virus Receptors Human genes 0.000 description 1
- 108010066342 Virus Receptors Proteins 0.000 description 1
- 101000998548 Yersinia ruckeri Alkaline proteinase inhibitor Proteins 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 102000034337 acetylcholine receptors Human genes 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 210000004404 adrenal cortex Anatomy 0.000 description 1
- 230000001919 adrenal effect Effects 0.000 description 1
- 210000001943 adrenal medulla Anatomy 0.000 description 1
- 239000000443 aerosol Substances 0.000 description 1
- 108010041407 alanylaspartic acid Proteins 0.000 description 1
- 239000000783 alginic acid Substances 0.000 description 1
- 235000010443 alginic acid Nutrition 0.000 description 1
- 229920000615 alginic acid Polymers 0.000 description 1
- 229960001126 alginic acid Drugs 0.000 description 1
- 150000004781 alginic acids Chemical class 0.000 description 1
- 239000008168 almond oil Substances 0.000 description 1
- 102000015395 alpha 1-Antitrypsin Human genes 0.000 description 1
- 108010050122 alpha 1-Antitrypsin Proteins 0.000 description 1
- 229940024142 alpha 1-antitrypsin Drugs 0.000 description 1
- UPEZCKBFRMILAV-UHFFFAOYSA-N alpha-Ecdysone Natural products C1C(O)C(O)CC2(C)C(CCC3(C(C(C(O)CCC(C)(C)O)C)CCC33O)C)C3=CC(=O)C21 UPEZCKBFRMILAV-UHFFFAOYSA-N 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 125000000129 anionic group Chemical group 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 230000001093 anti-cancer Effects 0.000 description 1
- 230000002001 anti-metastasis Effects 0.000 description 1
- 230000005809 anti-tumor immunity Effects 0.000 description 1
- 230000000840 anti-viral effect Effects 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 230000005904 anticancer immunity Effects 0.000 description 1
- 239000002246 antineoplastic agent Substances 0.000 description 1
- 239000003443 antiviral agent Substances 0.000 description 1
- 210000000702 aorta abdominal Anatomy 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 1
- 108010089442 arginyl-leucyl-alanyl-arginine Proteins 0.000 description 1
- 210000003050 axon Anatomy 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- 210000003445 biliary tract Anatomy 0.000 description 1
- 230000004993 binary fission Effects 0.000 description 1
- 229920000249 biocompatible polymer Polymers 0.000 description 1
- 239000003124 biologic agent Substances 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 239000012620 biological material Substances 0.000 description 1
- 238000005415 bioluminescence Methods 0.000 description 1
- 230000029918 bioluminescence Effects 0.000 description 1
- 229960000074 biopharmaceutical Drugs 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004204 blood vessel Anatomy 0.000 description 1
- 235000019846 buffering salt Nutrition 0.000 description 1
- OWBTYPJTUOEWEK-UHFFFAOYSA-N butane-2,3-diol Chemical compound CC(O)C(C)O OWBTYPJTUOEWEK-UHFFFAOYSA-N 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 229910000019 calcium carbonate Inorganic materials 0.000 description 1
- FUFJGUQYACFECW-UHFFFAOYSA-L calcium hydrogenphosphate Chemical compound [Ca+2].OP([O-])([O-])=O FUFJGUQYACFECW-UHFFFAOYSA-L 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 238000007707 calorimetry Methods 0.000 description 1
- 239000012830 cancer therapeutic Substances 0.000 description 1
- 210000000234 capsid Anatomy 0.000 description 1
- 239000002775 capsule Substances 0.000 description 1
- CZPLANDPABRVHX-UHFFFAOYSA-N cascade blue Chemical compound C=1C2=CC=CC=C2C(NCC)=CC=1C(C=1C=CC(=CC=1)N(CC)CC)=C1C=CC(=[N+](CC)CC)C=C1 CZPLANDPABRVHX-UHFFFAOYSA-N 0.000 description 1
- 239000005018 casein Substances 0.000 description 1
- BECPQYXYKAMYBN-UHFFFAOYSA-N casein, tech. Chemical compound NCCCCC(C(O)=O)N=C(O)C(CC(O)=O)N=C(O)C(CCC(O)=N)N=C(O)C(CC(C)C)N=C(O)C(CCC(O)=O)N=C(O)C(CC(O)=O)N=C(O)C(CCC(O)=O)N=C(O)C(C(C)O)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=O)N=C(O)C(CCC(O)=O)N=C(O)C(COP(O)(O)=O)N=C(O)C(CCC(O)=N)N=C(O)C(N)CC1=CC=CC=C1 BECPQYXYKAMYBN-UHFFFAOYSA-N 0.000 description 1
- 235000021240 caseins Nutrition 0.000 description 1
- 125000002091 cationic group Chemical group 0.000 description 1
- 238000000423 cell based assay Methods 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000007910 cell fusion Effects 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 239000002458 cell surface marker Substances 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 235000010980 cellulose Nutrition 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 210000003169 central nervous system Anatomy 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 210000000038 chest Anatomy 0.000 description 1
- 229940059329 chondroitin sulfate Drugs 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 230000001684 chronic effect Effects 0.000 description 1
- 239000007979 citrate buffer Substances 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000003271 compound fluorescence assay Methods 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 239000013068 control sample Substances 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000005138 cryopreservation Methods 0.000 description 1
- 239000004148 curcumin Substances 0.000 description 1
- 229940109262 curcumin Drugs 0.000 description 1
- 235000012754 curcumin Nutrition 0.000 description 1
- 210000004292 cytoskeleton Anatomy 0.000 description 1
- 108010011219 dUTP pyrophosphatase Proteins 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 239000008367 deionised water Substances 0.000 description 1
- 229910021641 deionized water Inorganic materials 0.000 description 1
- 238000002716 delivery method Methods 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 230000000368 destabilizing effect Effects 0.000 description 1
- 239000008121 dextrose Substances 0.000 description 1
- 229940039227 diagnostic agent Drugs 0.000 description 1
- 239000000032 diagnostic agent Substances 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 235000019700 dicalcium phosphate Nutrition 0.000 description 1
- VFLDPWHFBUODDF-UHFFFAOYSA-N diferuloylmethane Natural products C1=C(O)C(OC)=CC(C=CC(=O)CC(=O)C=CC=2C=C(OC)C(O)=CC=2)=C1 VFLDPWHFBUODDF-UHFFFAOYSA-N 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 102000004419 dihydrofolate reductase Human genes 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- ZPWVASYFFYYZEW-UHFFFAOYSA-L dipotassium hydrogen phosphate Chemical compound [K+].[K+].OP([O-])([O-])=O ZPWVASYFFYYZEW-UHFFFAOYSA-L 0.000 description 1
- 235000019797 dipotassium phosphate Nutrition 0.000 description 1
- 229910000396 dipotassium phosphate Inorganic materials 0.000 description 1
- 239000007884 disintegrant Substances 0.000 description 1
- 239000002270 dispersing agent Substances 0.000 description 1
- 238000004090 dissolution Methods 0.000 description 1
- 229960003722 doxycycline Drugs 0.000 description 1
- 239000008298 dragée Substances 0.000 description 1
- 210000001198 duodenum Anatomy 0.000 description 1
- UPEZCKBFRMILAV-JMZLNJERSA-N ecdysone Chemical compound C1[C@@H](O)[C@@H](O)C[C@]2(C)[C@@H](CC[C@@]3([C@@H]([C@@H]([C@H](O)CCC(C)(C)O)C)CC[C@]33O)C)C3=CC(=O)[C@@H]21 UPEZCKBFRMILAV-JMZLNJERSA-N 0.000 description 1
- 238000004945 emulsification Methods 0.000 description 1
- 239000003995 emulsifying agent Substances 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 230000001159 endocytotic effect Effects 0.000 description 1
- 239000002158 endotoxin Substances 0.000 description 1
- 238000009505 enteric coating Methods 0.000 description 1
- 239000002702 enteric coating Substances 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- YQGOJNYOYNNSMM-UHFFFAOYSA-N eosin Chemical compound [Na+].OC(=O)C1=CC=CC=C1C1=C2C=C(Br)C(=O)C(Br)=C2OC2=C(Br)C(O)=C(Br)C=C21 YQGOJNYOYNNSMM-UHFFFAOYSA-N 0.000 description 1
- IINNWAYUJNWZRM-UHFFFAOYSA-L erythrosin B Chemical compound [Na+].[Na+].[O-]C(=O)C1=CC=CC=C1C1=C2C=C(I)C(=O)C(I)=C2OC2=C(I)C([O-])=C(I)C=C21 IINNWAYUJNWZRM-UHFFFAOYSA-L 0.000 description 1
- 239000004174 erythrosine Substances 0.000 description 1
- 229940011411 erythrosine Drugs 0.000 description 1
- 235000012732 erythrosine Nutrition 0.000 description 1
- 208000006881 esophagitis Diseases 0.000 description 1
- 229940011871 estrogen Drugs 0.000 description 1
- 239000000262 estrogen Substances 0.000 description 1
- 235000019441 ethanol Nutrition 0.000 description 1
- BEFDCLMNVWHSGT-UHFFFAOYSA-N ethenylcyclopentane Chemical compound C=CC1CCCC1 BEFDCLMNVWHSGT-UHFFFAOYSA-N 0.000 description 1
- 150000002170 ethers Chemical class 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 239000003925 fat Substances 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 210000002950 fibroblast Anatomy 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 238000009501 film coating Methods 0.000 description 1
- 239000007888 film coating Substances 0.000 description 1
- 239000000796 flavoring agent Substances 0.000 description 1
- GVEPBJHOBDJJJI-UHFFFAOYSA-N fluoranthrene Natural products C1=CC(C2=CC=CC=C22)=C3C2=CC=CC3=C1 GVEPBJHOBDJJJI-UHFFFAOYSA-N 0.000 description 1
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 1
- 238000000799 fluorescence microscopy Methods 0.000 description 1
- 230000003325 follicular Effects 0.000 description 1
- 235000003599 food sweetener Nutrition 0.000 description 1
- 238000004108 freeze drying Methods 0.000 description 1
- 230000005714 functional activity Effects 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 101150029683 gB gene Proteins 0.000 description 1
- 229930182830 galactose Natural products 0.000 description 1
- 210000001035 gastrointestinal tract Anatomy 0.000 description 1
- 229920000159 gelatin Polymers 0.000 description 1
- 239000008273 gelatin Substances 0.000 description 1
- 235000019322 gelatine Nutrition 0.000 description 1
- 235000011852 gelatine desserts Nutrition 0.000 description 1
- 238000012239 gene modification Methods 0.000 description 1
- 230000030279 gene silencing Effects 0.000 description 1
- 230000005017 genetic modification Effects 0.000 description 1
- 238000003144 genetic modification method Methods 0.000 description 1
- 235000013617 genetically modified food Nutrition 0.000 description 1
- 230000002518 glial effect Effects 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 1
- 229940074045 glyceryl distearate Drugs 0.000 description 1
- 229940075507 glyceryl monostearate Drugs 0.000 description 1
- 108010072405 glycyl-aspartyl-glycine Proteins 0.000 description 1
- 108010038983 glycyl-histidyl-lysine Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- 230000009643 growth defect Effects 0.000 description 1
- 239000000122 growth hormone Substances 0.000 description 1
- 102000009543 guanyl-nucleotide exchange factor activity proteins Human genes 0.000 description 1
- 108040001860 guanyl-nucleotide exchange factor activity proteins Proteins 0.000 description 1
- 125000005179 haloacetyl group Chemical group 0.000 description 1
- 230000002440 hepatic effect Effects 0.000 description 1
- 206010019692 hepatic necrosis Diseases 0.000 description 1
- 238000013537 high throughput screening Methods 0.000 description 1
- 208000010726 hind limb paralysis Diseases 0.000 description 1
- 239000001866 hydroxypropyl methyl cellulose Substances 0.000 description 1
- 235000010979 hydroxypropyl methyl cellulose Nutrition 0.000 description 1
- 229920003088 hydroxypropyl methyl cellulose Polymers 0.000 description 1
- UFVKGYZPFZQRLF-UHFFFAOYSA-N hydroxypropyl methyl cellulose Chemical compound OC1C(O)C(OC)OC(CO)C1OC1C(O)C(O)C(OC2C(C(O)C(OC3C(C(O)C(O)C(CO)O3)O)C(CO)O2)O)C(CO)O1 UFVKGYZPFZQRLF-UHFFFAOYSA-N 0.000 description 1
- 230000007954 hypoxia Effects 0.000 description 1
- 210000003111 iliac vein Anatomy 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 210000002865 immune cell Anatomy 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 239000007943 implant Substances 0.000 description 1
- 230000001976 improved effect Effects 0.000 description 1
- 238000000099 in vitro assay Methods 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 239000003701 inert diluent Substances 0.000 description 1
- 230000002757 inflammatory effect Effects 0.000 description 1
- 230000028709 inflammatory response Effects 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 229940125396 insulin Drugs 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 210000000936 intestine Anatomy 0.000 description 1
- 238000001361 intraarterial administration Methods 0.000 description 1
- 238000007917 intracranial administration Methods 0.000 description 1
- 239000007928 intraperitoneal injection Substances 0.000 description 1
- 230000002601 intratumoral effect Effects 0.000 description 1
- 239000000787 lecithin Substances 0.000 description 1
- 235000010445 lecithin Nutrition 0.000 description 1
- 229940067606 lecithin Drugs 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 229920006008 lipopolysaccharide Polymers 0.000 description 1
- 239000012669 liquid formulation Substances 0.000 description 1
- 231100000149 liver necrosis Toxicity 0.000 description 1
- 244000144972 livestock Species 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- DLBFLQKQABVKGT-UHFFFAOYSA-L lucifer yellow dye Chemical compound [Li+].[Li+].[O-]S(=O)(=O)C1=CC(C(N(C(=O)NN)C2=O)=O)=C3C2=CC(S([O-])(=O)=O)=CC3=C1N DLBFLQKQABVKGT-UHFFFAOYSA-L 0.000 description 1
- 238000007422 luminescence assay Methods 0.000 description 1
- 238000004020 luminiscence type Methods 0.000 description 1
- 238000012792 lyophilization process Methods 0.000 description 1
- 108010012988 lysyl-glutamyl-aspartyl-glycine Proteins 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- FDZZZRQASAIRJF-UHFFFAOYSA-M malachite green Chemical compound [Cl-].C1=CC(N(C)C)=CC=C1C(C=1C=CC=CC=1)=C1C=CC(=[N+](C)C)C=C1 FDZZZRQASAIRJF-UHFFFAOYSA-M 0.000 description 1
- 229940107698 malachite green Drugs 0.000 description 1
- 230000003211 malignant effect Effects 0.000 description 1
- 210000001161 mammalian embryo Anatomy 0.000 description 1
- 239000000594 mannitol Substances 0.000 description 1
- 235000010355 mannitol Nutrition 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 210000005060 membrane bound organelle Anatomy 0.000 description 1
- 210000004779 membrane envelope Anatomy 0.000 description 1
- 230000034217 membrane fusion Effects 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 239000002923 metal particle Substances 0.000 description 1
- 239000003475 metalloproteinase inhibitor Substances 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 235000010270 methyl p-hydroxybenzoate Nutrition 0.000 description 1
- 239000004292 methyl p-hydroxybenzoate Substances 0.000 description 1
- 239000000693 micelle Substances 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 235000019813 microcrystalline cellulose Nutrition 0.000 description 1
- 239000008108 microcrystalline cellulose Substances 0.000 description 1
- 229940016286 microcrystalline cellulose Drugs 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 230000002438 mitochondrial effect Effects 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 235000019796 monopotassium phosphate Nutrition 0.000 description 1
- 229910000402 monopotassium phosphate Inorganic materials 0.000 description 1
- DNIAPMSPPWPWGF-UHFFFAOYSA-N monopropylene glycol Natural products CC(O)CO DNIAPMSPPWPWGF-UHFFFAOYSA-N 0.000 description 1
- 238000010172 mouse model Methods 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 239000002105 nanoparticle Substances 0.000 description 1
- 229920005615 natural polymer Polymers 0.000 description 1
- 230000001338 necrotic effect Effects 0.000 description 1
- 230000017095 negative regulation of cell growth Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000003472 neutralizing effect Effects 0.000 description 1
- 239000002547 new drug Substances 0.000 description 1
- 239000002687 nonaqueous vehicle Substances 0.000 description 1
- 230000037434 nonsense mutation Effects 0.000 description 1
- 238000010899 nucleation Methods 0.000 description 1
- 239000007764 o/w emulsion Substances 0.000 description 1
- QIQXTHQIDYTFRH-UHFFFAOYSA-N octadecanoic acid Chemical compound CCCCCCCCCCCCCCCCCC(O)=O QIQXTHQIDYTFRH-UHFFFAOYSA-N 0.000 description 1
- OQCDKBAXFALNLD-UHFFFAOYSA-N octadecanoic acid Natural products CCCCCCCC(C)CCCCCCCCC(O)=O OQCDKBAXFALNLD-UHFFFAOYSA-N 0.000 description 1
- 210000000287 oocyte Anatomy 0.000 description 1
- 210000000496 pancreas Anatomy 0.000 description 1
- 229960001789 papaverine Drugs 0.000 description 1
- 229920002866 paraformaldehyde Polymers 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000007918 pathogenicity Effects 0.000 description 1
- 238000010827 pathological analysis Methods 0.000 description 1
- 231100000915 pathological change Toxicity 0.000 description 1
- 230000036285 pathological change Effects 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 230000000149 penetrating effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000002688 persistence Effects 0.000 description 1
- 230000004983 pleiotropic effect Effects 0.000 description 1
- 230000010287 polarization Effects 0.000 description 1
- 229920000656 polylysine Polymers 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 239000001267 polyvinylpyrrolidone Substances 0.000 description 1
- 229920000036 polyvinylpyrrolidone Polymers 0.000 description 1
- 235000013855 polyvinylpyrrolidone Nutrition 0.000 description 1
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 1
- 235000011164 potassium chloride Nutrition 0.000 description 1
- 239000001103 potassium chloride Substances 0.000 description 1
- GNSKLFRGEWLPPA-UHFFFAOYSA-M potassium dihydrogen phosphate Chemical compound [K+].OP(O)([O-])=O GNSKLFRGEWLPPA-UHFFFAOYSA-M 0.000 description 1
- 229920001592 potato starch Polymers 0.000 description 1
- 229940124606 potential therapeutic agent Drugs 0.000 description 1
- 230000002028 premature Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 239000000186 progesterone Substances 0.000 description 1
- 229960003387 progesterone Drugs 0.000 description 1
- 230000002062 proliferating effect Effects 0.000 description 1
- 125000001500 prolyl group Chemical group [H]N1C([H])(C(=O)[*])C([H])([H])C([H])([H])C1([H])[H] 0.000 description 1
- 108010015796 prolylisoleucine Proteins 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000000069 prophylactic effect Effects 0.000 description 1
- 235000010232 propyl p-hydroxybenzoate Nutrition 0.000 description 1
- 239000004405 propyl p-hydroxybenzoate Substances 0.000 description 1
- 235000013772 propylene glycol Nutrition 0.000 description 1
- QELSKZZBTMNZEB-UHFFFAOYSA-N propylparaben Chemical compound CCCOC(=O)C1=CC=C(O)C=C1 QELSKZZBTMNZEB-UHFFFAOYSA-N 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- 230000017854 proteolysis Effects 0.000 description 1
- 230000002685 pulmonary effect Effects 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000001718 repressive effect Effects 0.000 description 1
- 238000002271 resection Methods 0.000 description 1
- 230000001177 retroviral effect Effects 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 230000003248 secreting effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 239000012679 serum free medium Substances 0.000 description 1
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 230000003584 silencer Effects 0.000 description 1
- 239000000377 silicon dioxide Substances 0.000 description 1
- 210000003491 skin Anatomy 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 235000010378 sodium ascorbate Nutrition 0.000 description 1
- PPASLZSBLFJQEF-RKJRWTFHSA-M sodium ascorbate Substances [Na+].OC[C@@H](O)[C@H]1OC(=O)C(O)=C1[O-] PPASLZSBLFJQEF-RKJRWTFHSA-M 0.000 description 1
- 229960005055 sodium ascorbate Drugs 0.000 description 1
- 235000017557 sodium bicarbonate Nutrition 0.000 description 1
- 229910000030 sodium bicarbonate Inorganic materials 0.000 description 1
- 229910001467 sodium calcium phosphate Inorganic materials 0.000 description 1
- 229910000029 sodium carbonate Inorganic materials 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 235000019333 sodium laurylsulphate Nutrition 0.000 description 1
- 239000001488 sodium phosphate Substances 0.000 description 1
- 229940079832 sodium starch glycolate Drugs 0.000 description 1
- 239000008109 sodium starch glycolate Substances 0.000 description 1
- 229920003109 sodium starch glycolate Polymers 0.000 description 1
- PPASLZSBLFJQEF-RXSVEWSESA-M sodium-L-ascorbate Chemical compound [Na+].OC[C@H](O)[C@H]1OC(=O)C(O)=C1[O-] PPASLZSBLFJQEF-RXSVEWSESA-M 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 235000010199 sorbic acid Nutrition 0.000 description 1
- 239000004334 sorbic acid Substances 0.000 description 1
- 229940075582 sorbic acid Drugs 0.000 description 1
- 239000000600 sorbitol Substances 0.000 description 1
- 235000010356 sorbitol Nutrition 0.000 description 1
- 230000003393 splenic effect Effects 0.000 description 1
- 210000004988 splenocyte Anatomy 0.000 description 1
- 239000007921 spray Substances 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 238000011272 standard treatment Methods 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 229940032147 starch Drugs 0.000 description 1
- 239000008117 stearic acid Substances 0.000 description 1
- PJANXHGTPQOBST-UHFFFAOYSA-N stilbene Chemical compound C=1C=CC=CC=1C=CC1=CC=CC=C1 PJANXHGTPQOBST-UHFFFAOYSA-N 0.000 description 1
- 235000021286 stilbenes Nutrition 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 239000004575 stone Substances 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000010254 subcutaneous injection Methods 0.000 description 1
- 239000007929 subcutaneous injection Substances 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 238000009495 sugar coating Methods 0.000 description 1
- 150000003461 sulfonyl halides Chemical class 0.000 description 1
- 230000010741 sumoylation Effects 0.000 description 1
- 230000008093 supporting effect Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000011477 surgical intervention Methods 0.000 description 1
- 239000000375 suspending agent Substances 0.000 description 1
- 239000003765 sweetening agent Substances 0.000 description 1
- 229920001059 synthetic polymer Polymers 0.000 description 1
- 239000006188 syrup Substances 0.000 description 1
- 235000020357 syrup Nutrition 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 108700020534 tetracycline resistance-encoding transposon repressor Proteins 0.000 description 1
- 229940040944 tetracyclines Drugs 0.000 description 1
- WGTODYJZXSJIAG-UHFFFAOYSA-N tetramethylrhodamine chloride Chemical compound [Cl-].C=12C=CC(N(C)C)=CC2=[O+]C2=CC(N(C)C)=CC=C2C=1C1=CC=CC=C1C(O)=O WGTODYJZXSJIAG-UHFFFAOYSA-N 0.000 description 1
- MPLHNVLQVRSVEE-UHFFFAOYSA-N texas red Chemical compound [O-]S(=O)(=O)C1=CC(S(Cl)(=O)=O)=CC=C1C(C1=CC=2CCCN3CCCC(C=23)=C1O1)=C2C1=C(CCC1)C3=[N+]1CCCC3=C2 MPLHNVLQVRSVEE-UHFFFAOYSA-N 0.000 description 1
- 229940126585 therapeutic drug Drugs 0.000 description 1
- 210000001685 thyroid gland Anatomy 0.000 description 1
- 238000011200 topical administration Methods 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 231100000041 toxicology testing Toxicity 0.000 description 1
- 239000003053 toxin Substances 0.000 description 1
- 231100000765 toxin Toxicity 0.000 description 1
- 235000013619 trace mineral Nutrition 0.000 description 1
- 239000011573 trace mineral Substances 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 238000004627 transmission electron microscopy Methods 0.000 description 1
- 210000003956 transport vesicle Anatomy 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 1
- 101150046896 trm1 gene Proteins 0.000 description 1
- 230000004614 tumor growth Effects 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 238000007473 univariate analysis Methods 0.000 description 1
- 239000006217 urethral suppository Substances 0.000 description 1
- 210000003932 urinary bladder Anatomy 0.000 description 1
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 1
- 235000015112 vegetable and seed oil Nutrition 0.000 description 1
- 239000008158 vegetable oil Substances 0.000 description 1
- 210000003462 vein Anatomy 0.000 description 1
- 230000007442 viral DNA synthesis Effects 0.000 description 1
- 230000007501 viral attachment Effects 0.000 description 1
- 230000007482 viral spreading Effects 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 238000012070 whole genome sequencing analysis Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N7/00—Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K35/00—Medicinal preparations containing materials or reaction products thereof with undetermined constitution
- A61K35/66—Microorganisms or materials therefrom
- A61K35/76—Viruses; Subviral particles; Bacteriophages
- A61K35/763—Herpes virus
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P35/00—Antineoplastic agents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P35/00—Antineoplastic agents
- A61P35/04—Antineoplastic agents specific for metastasis
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
- C12N15/869—Herpesviral vectors
- C12N15/8695—Herpes simplex virus-based vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/00051—Methods of production or purification of viral material
- C12N2710/00052—Methods of production or purification of viral material relating to complementing cells and packaging systems for producing virus or viral particles
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/16011—Herpesviridae
- C12N2710/16611—Simplexvirus, e.g. human herpesvirus 1, 2
- C12N2710/16621—Viruses as such, e.g. new isolates, mutants or their genomic sequences
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/16011—Herpesviridae
- C12N2710/16611—Simplexvirus, e.g. human herpesvirus 1, 2
- C12N2710/16622—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/16011—Herpesviridae
- C12N2710/16611—Simplexvirus, e.g. human herpesvirus 1, 2
- C12N2710/16632—Use of virus as therapeutic agent, other than vaccine, e.g. as cytolytic agent
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/16011—Herpesviridae
- C12N2710/16611—Simplexvirus, e.g. human herpesvirus 1, 2
- C12N2710/16641—Use of virus, viral particle or viral elements as a vector
- C12N2710/16643—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/16011—Herpesviridae
- C12N2710/16611—Simplexvirus, e.g. human herpesvirus 1, 2
- C12N2710/16651—Methods of production or purification of viral material
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Virology (AREA)
- Medicinal Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Microbiology (AREA)
- General Engineering & Computer Science (AREA)
- Pharmacology & Pharmacy (AREA)
- Veterinary Medicine (AREA)
- Biotechnology (AREA)
- Public Health (AREA)
- Biomedical Technology (AREA)
- Animal Behavior & Ethology (AREA)
- Biochemistry (AREA)
- Epidemiology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- General Chemical & Material Sciences (AREA)
- Immunology (AREA)
- Mycology (AREA)
- Oncology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
Abstract
본 개시는 비-자연적인 단순 헤르페스 바이러스 ("HSV"), HSV를 포함하는, 또는 대안으로 본질적으로 그것으로 이루어지는, 또는 또한 추가로 그것으로 이루어지는 조성물, 및 HSV의 제조 방법, 또는 세포를 HSV로 감염시키는 방법을 제공한다. 또한 본원에는 그것을 필요로 하는 대상체에서 암을 치료하거나 암 세포의 성장 또는 전이를 억제하는 방법이 제공된다.
Description
관련 출원과의 상호 참조
본 출원은 2019년 3월 14일 및 2019년 11월 8일에 출원된 미국 가출원 번호 62/818,577 및 62/932,725에 대한 35 U.S.C. §119(e) 하의 우선권을 주장하며, 상기 출원의 각각의 내용은 본 개시에 참조로 포함된다.
정부 지원의 진술
본 발명은 미국 국립보건원 및 국립 암 연구소 (NIH/NCI)에 의해 부여된 승인 번호 CA223104 하에 정부 지원으로 이루어졌다. 정부는 발명에 특정 권리를 가진다.
서열 목록
본 출원은 ASCII 방식으로 전자적으로 제출되었고 본원에 그 전체가 참조로 포함된 서열 목록을 함유한다. 2020년 3월 13일에 생성된 상기 ASCII 복사본은 106887-7660_ST25.txt로 명명되며 크기는 245,014 바이트이다.
배경
최근에 흑색종(melanoma)을 치료하기 위해 FDA 승인된 ImlygicTM과 같은 종양용해성 단순 헤르페스 바이러스 (oncolytic herpes simplex virus, oHSV)의 항종양 효능은 매우 유망하다. 이들 벡터는 2가지 주요 작용 메커니즘을 가진다: (1) 세포의 직접 감염 및 용해에 의해 측정되는 바, 용해 단계, 및 (2) 항종양 면역의 자극에 의해 구동된 면역학적 단계. 그러나, 모든 암이, 일부 암에서 바이러스 확산이 고유하게 느린 것과 유사하게 반응하지는 않는다. 배양에서, 세포는 바이러스에 대한 그들의 허용 수준이 다르다. 동물에서, 종양 기질 및 면역 세포 조성의 변화는 바이러스 확산 능력 및 면역 반응의 변화로 이어진다.
그러므로, 용해 단계의 효능을 최적의 치료적 유익으로까지 개선하기 위한 전략이 여전히 필요하다. 본 개시는 이들 필요성을 충족하고 관련된 장점을 또한 제공한다.
요약
본 개시는 비-자연적인 단순 헤르페스 바이러스 ("HSV")를 제공하며, 이때 바이러스는: (a) 당단백질 E ("gE")-암호화 유전자, (b) 감염된 세포 단백질 0 ("ICP0")-암호화 유전자, (c) DNA 포장 터미나제(terminase) 하위유닛 1-암호화 유전자, (d) ICP8-암호화 유전자, 또는 (e) ICP34.5-암호화 유전자 중 하나 이상에 돌연변이를 포함하거나, 대안으로 본질적으로 그것으로 이루어지거나, 또는 또한 추가로 그것으로 이루어진다.
다른 측면으로, 본 개시는 본 개시의 비-자연적인 HSV를 포함하거나, 대안으로 본질적으로 그것으로 이루어지거나, 또는 또한 추가로 그것으로 이루어지는 조성물 또는 제약학적 조성물을 제공한다. 또 다른 측면으로, 본 개시에는 세포를 비-자연적인 HSV 또는 비-자연적인 HSV를 함유한 조성물 또는 제약학적 조성물과 접촉시키는 단계를 포함하는, 또는 대안으로 본질적으로 그것으로 이루어지는, 또는 또한 추가로 그것으로 이루어지는, 세포를 감염시키는 방법이 제공된다.
한 측면으로, 본 개시는 비-자연적인 HSV 바이러스 입자의 유전자를 돌연변이시키거나 비-자연적인 HSV 바이러스 입자에 도입유전자를 도입하는 단계를 포함하는, 또는 대안으로 본질적으로 그것으로 이루어지는, 또는 또한 추가로 그것으로 이루어지는, 비-자연적인 HSV의 제조 방법을 제공한다. 또 다른 측면으로, 비-자연적인 HSV 벡터의 제조 방법은 (a) 숙주 세포에 17TermA HSV 벡터 및 rRp450 HSV 벡터를 도입하는 단계; (b) 숙주 세포를 적어도 3 계대 동안 성장시키는 단계; 및 (c) 숙주 세포에 의해 생성된 HSV 입자를 분리하는 단계를 포함하거나, 또는 대안으로 본질적으로 그것으로 이루어지거나, 또는 또한 추가로 그것으로 이루어진다.
또한 암 세포 또는 전이성 암 세포의 성장 또는 전이를 억제하는 방법이 제공되며, 방법은 세포를 본원에서 기술된 유효량의 비-자연적인 HSV 벡터 또는 비-자연적인 HSV 벡터를 함유한 조성물 또는 제약학적 조성물과 접촉시키는 단계를 포함하거나, 또는 본질적으로 그것으로 이루어지거나, 또는 또한 추가로 그것으로 이루어진다. 접촉은 시험관내에서 또는 생체내에서 이루어진다. 한 측면으로, 접촉은 비-자연적인 HSV 또는 조성물 또는 제약학적 조성물의 대상체에의 투여에 의해 생체내에서 이루어진다. 시험관내에서, 방법은 비-자연적인 HSV를 세포와 접촉하게 함으로써 실시된다. 시험관내 방법은 새로운 치료법을 테스트하기 위하여 또는 치료법이 치료될 암에 적합한지를 측정하기 위하여 맞춤형 검정으로서 사용될 수 있다. 추가적인 암 치료법은 개시된 방법과 동시의 또는 순차적일 수 있는 치료법과 조합될 수 있다.
치료될 암 세포는 고형 종양 또는 혈액암, 예컨대 암종 또는 육종일 수 있고 그러한 것의 비제한적인 예로는 췌장암(pancreatic cancer), 신장암(renal cancer), 소세포 폐암(small cell lung cancer), 뇌암(brain cancer), 신경모세포종(neuroblastoma), 신경암(neural cancer), 골암(bone cancer), 림프종(lymphoma), 골수종(myeloma), 결장암(colon cancer), 자궁암(uterine cancer), 유방암(breast cancer), 백혈병(leukemia), 간암(liver cancer), 전립선암(전립선 cancer), 피부암(skin cancer), 또는 흑색종을 들 수 있다. 세포는 임의의 종, 예컨대, 포유류 및 인간의 것이며, 시험관내에서 수행될 때, 그것은 배양된 세포주 또는 일차 세포로부터, 예컨대, 조직 생검으로부터 유래될 수 있다. 세포는 성인 또는 소아 세포 또는 암 줄기 세포 (즉, 정상 줄기 세포와 관련된 특징, 특히 특정 암 샘플에서 발견되는 모든 세포 유형을 발생시키는 능력을 갖고 있는 암 세포) 또는 정상 줄기 세포와 관련된 그런 특징이 없는 암 세포일 수 있다. 한 구체예에서, 세포는 비-암 세포보다 높은 수준으로 N-myc 원-종양유전자(proto-oncogene) 단백질 (MYCN)을 발현하거나 및/또는 MYCN을 발현한다.
다른 측면으로, 또한 본 개시에는 대상체에게 본 개시의 유효량의 비-자연적인 HSV, 조성물 또는 제약학적 조성물을 투여하는 단계를 포함하는, 또는 대안으로 본질적으로 그것으로 이루어지는, 또는 또한 추가로 그것으로 이루어지는, 그것을 필요로 하는 대상체에서 암 또는 전이성 암을 치료하거나, 또는 암 세포의 성장 또는 전이를 억제하는 방법이 제공된다. 치료될 대상체는 임의의 종, 예컨대 포유류 및 인간, 예컨대, 개과, 말과, 소과, 고양이과, 유인원, 래트 또는 쥐과일 수 있다. 투여는 일차 치료법, 이차 치료법, 삼차 치료법, 사차 치료법, 또는 오차 치료법일 수 있다. 추가적인 암 치료법은 개시된 방법과 동시의 또는 순차적일 수 있는 치료법과 조합될 수 있다. 치료될 암은 고형 종양 또는 혈액암, 예컨대 암종 또는 육종일 수 있고 그러한 것의 비제한적인 예로는 췌장암, 신장암, 소세포 폐암, 뇌암, 신경모세포종, 신경암, 골암, 림프종, 골수종, 결장암, 자궁암, 유방암, 백혈병, 간암, 전립선암, 피부암, 또는 흑색종을 들 수 있다.
본 개시의 방법은 질환 차도 또는 진행을 모니터링하기 위해 적절한 진단제와 조합될 수 있다. 몇 가지 그러한 모니터링 방법이 기술분야에 알려져 있다.
한 측면으로, 개시는 세포를 본 개시의 유효량의 비-자연적인 HSV, 조성물, 및/또는 제약학적 조성물과 접촉시키는 단계를 포함하는, 또는 대안으로 본질적으로 그것으로 이루어지는, 또는 또한 추가로 그것으로 이루어지는, 세포 용해를 유도하는 방법을 제공한다. 접촉은 시험관내에서 또는 생체내에서 이루어진다. 한 측면으로, 접촉은 비-자연적인 HSV 또는 조성물 또는 제약학적 조성물의 대상체에의 투여에 의해 생체내에서 이루어진다. 시험관내에서, 방법은 비-자연적인 HSV를 세포와 접촉하게 함으로써 실시된다. 시험관내 방법은 새로운 치료법을 테스트하기 위하여 또는 치료법이 치료될 암에 적합한지를 측정하기 위하여 맞춤형 검정으로서 사용될 수 있다. 추가적인 세포 용해 치료법은 개시된 방법과 동시의 또는 순차적일 수 있는 치료법과 조합될 수 있다.
치료될 세포는 고형 종양 또는 혈액암, 예컨대 암종 또는 육종일 수 있고 그러한 것의 비제한적인 예로는 췌장암, 신장암, 소세포 폐암, 뇌암, 신경모세포종, 신경암, 골암, 림프종, 골수종, 결장암, 자궁암, 유방암, 백혈병, 간암, 전립선암, 피부암, 또는 흑색종을 들 수 있다. 세포는 임의의 종, 예컨대, 포유류 및 인간의 것이며, 시험관내에서 수행될 때, 그것은 배양된 세포주 또는 일차 세포로부터, 예컨대, 조직 생검으로부터 유래될 수 있다. 세포는 성인 또는 소아 세포 또는 암 줄기 세포 또는 정상 줄기 세포와 관련된 특징이 없는 암 세포일 수 있다. 치료법은 치료법의 유효성, 예컨대 암 관해 또는 진행에 대해 테스트하기 위한 적절한 검정과 조합될 수 있다.
또 다른 측변으로, 개시는 또한 본 개시의 비-자연적인 HSV, 조성물, 및/또는 제약학적 조성물을 포함하는, 또는 대안으로 본질적으로 그것으로 이루어지는, 또는 또한 추가로 그것으로 이루어지는 키트를 제공한다.
도 1A-1B는 Mut-3 및 Mut-3Δ34.5 (도 1A) 및 Mut-3 SNP (도 1B)를 생성하는 개략적인 다이아그램을 도시한다. HSV Mut-3은 비허용 라인에서 17TermA 및 rRp450을 혼합하는 연속 계대로부터 분리되었고 ("지시된 분화(Directed Evolution)"); 감쇠된 돌연변이체 Mut-3Δ34.5는 유전자 편집을 통해 구성되었다 ("CRISPR/Cas9" 단계로서 표시됨) (도 1A). 도 1B는 Mut-3과 그것의 부모(parent) 바이러스와의 서열 비교를 도시한다. UL15, UL29, US8, RL1 및 RL2를 포함한, 어느 하나의 부모와 Mut-3이 상이한 비동의 돌연변이(Nonsynonamous mutation)는 역 슬래시로 음영으로 표시된다. 17TermA와 동일한 게놈 서열은 하부 패널의 블랭크 박스로서 제시되고; rRp450에 동일한 것은 전방향 슬래시로 표시된다.
도 2A - 2C는 Mut-3, Mut-3Δ34.5, rRp450 및 17TermA의 플라크 크기 및 수용체 사용을 도시한다. 본 출원인은 동시에 4개의 바이러스의 플라크 검정을 수행하였고 Keyence HS 올인원 형광 현미경 BZ-II 분석기를 통해 3일 후의 플라크 이미지를 분석하였다. (도 2A) 4개 바이러스의 미가공 (위) 및 마스크된 (아래, 넘버링된 플라크) 이미지. (도 2B) 4개 바이러스의 평균 플라크 크기 (좌측) 및 플라크의 수가 계산되었다 (우측). Mut-3 및 Mut-3Δ34.5의 클라크 크기는 두 부모 바이러스 rRp450 및 17TermA보다 상당히 더 크다. (도 2C) CHO 세포 세트의 시험관내 세포독성/MTS 검정. 본 출원인은 출원인은 CHO-K1 (표시된 대로), CHO-넥틴(Nectin)-1 (표시된 대로), CHO-넥틴-2 (표시된 대로) 및 CHO-HVEM (표시된 대로)을 상이한 다중 감염도 (MOI)를 가진 4개의 바이러스로 감염시켰다. 출원인은 미처리 대조군에 비해 바이러스 감염 후 (pvi) 3일 후에 세포 생존 비색 세포 증식/MTS 검정을 측정하였다. CHO-K1 또는 CHO-넥틴-2 (주로 HSV-2 진입용)가 아닌 CHO-넥틴-1 및 CHO-HVEM만이 4개 바이러스의 처리에 대해 민감하였고, 이것은 Mut-3 및 Mut-3Δ34.5가 수용체 장벽을 우회하지 못하였고 세포를 감염시키기 위해 여전히 정식 HSV 진입 수용체를 전달할 수 있었음을 시사한다.
도 3A - 3C: Mut-3Δ34.5는 인간 및 쥐과 신경모세포종 세포를 사멸하는데 17TermA (γ 1 34.5-무효(Null))보다 더 강력하고, 그것은 시험관내에서 감염성 바이러스 입자의 증가된 수율에 기인하지 않는다. (도 3A) 신경모세포종 세포주의 시험관내 세포독성/MTS 검정. 출원인은 인간 (SK-N-AS) 및 쥐과 (975A2) 신경모세포종 세포를 둘 다 Mut-3 (표시된 대로), Mut-3Δ34.5 (표시된 대로) 또는 17TermA (표시된 대로)로 상이한 MOI로 감염시켰다. 출원인은 미처리 대조군에 비해 바이러스 감염 후 4일 후에 MTS 검정을 통해 세포 생존율을 측정하였다. N=6, 오차 막대는 SEM을 나타낸다. **** p<0.0001, 이원 분산 분석. (도 3B) 시험관내 바이러스 복제 검정. 출원인은 신경모세포종 세포주를 17TermA (표시된 대로) 또는 Mut-3△34.5 (표시된 대로)로 MOI=0.1에서 (상부 패널, 인간 라인 SK-N-AS) 또는 MOI=0.5에서 (하부 패널, 쥐과 라인 975A2) 감염시키고 세포를 바이러스 감염 후 2시간 후에 PBS로 세척하였다. 출원인은 바이러스 감염 후 2, 24, 48 및 72시간 후에 세포 용해물을 수득하여 플라크 검정에 의해 바이러스 수율을 측정하였다. N=3. 오차 막대는 SD를 나타낸다. * p<0.05,** p<0.001,**** p<0.0001, 이원 분산 분석. (도 3C) Mut-3Δ34.5 대비 17TermA 감염된 신경모세포종 배양물에서 상대적인 자유 방출 비리온의 비교. 출원인은 도 3B에서처럼 전체 배양물로서 측정하는 대신 상층액 및 펠릿을 수득하여 시간 경과에 따라 2개의 분리된 부분에서 플라크 검정을 수행함으로써, (도 3B)에서 기술된 것과 유사한 검정을 수행하였다. 출원인은 전체 배양물 (상층액 + 펠릿)에 대한 상층액 중의 감염성 입자의 비율로서 상대적 자유 비리온을 계산하였다. Mut-3Δ34.5는 48시간 째에 17TermA보다 더 많은 상대적 방출 비리온을 나타낸다. N=3. 오차 막대는 SD를 나타낸다. * p<0.05.
도 4A - 4H: 신경모세포종 세포에서 Mut3Δ34.5 및 17TermA 흡수의 TEM 분석. 신경모세포종 세포 SK-N-AS 및 975A2가 37℃에서 20분 동안 50의 MOI로 Mut-3Δ34.5 또는 17TermA로 감염되었다. (도 4A, 4B, 4E 및 4F) 삽입은 Mut-3Δ34.5 비리온이 주로 세포내 소포에서 발견되었고 (도 4B에서 오른쪽 화살표를 제외한 화살표) 원형질막과 융합된 채로 발견되는 것은 아주 소수인 (도 4B에서 오른쪽 화살표) 것을 보여준다. (도 4C, 4D, 4G 및 4H) 삽입은 17TermA 비리온이 주로 세포내 소포에서 발견되었고 (도 4G에서 아래쪽 화살표를 제외한 화살표), 원형질막과 융합된 채로 발견되는 것은 아주 소수인 것을 보여준다 (도 4G에서 아래쪽 화살표). TEM 분석은 Hitachi H-7650 TEM을 통해 실시되었다. N: 핵. 스케일 바: 500 nm.
도 5A - 5C: 감쇠된 17Δ34.5 비리온은 신경모세포종 세포에서 17TermA에 비슷한 효능을 보였다. 출원인은 CRISPR-Cas9 유전자 편집 기법을 통해 17Δ34.5를 생성하여 야생형 스트레인 17+의 g134.5 유전자를 EGFP 발현 카세트로 대체하였다. (도 5A) Vero 세포 상의 17Δ34.5의 플라크 이미지. B4 및 G1 클론은 둘 다 3회기의 플라크 정제 후에 100% GFP 양성 (좌측 패널) 비-융합체 (우측 패널, 상 대비) 플라크를 생성한다. 바이러스 감염 후 2일 후에 이미지를 EVOS® FL 이미징 시스템을 통해 취하였다. 스케일 바: 400 μm. (도 5B) 신경모세포종 세포주의 시험관내 세포독성/MTS 검정. 출원인은 신경모세포종 세포주, SK-N-AS 및 975A2를, 상이한 MOI의 야생형 스트레인 17+ (표시된 대로), 17TermA (표시된 대로), 17△34.5 클론 B4 (표시된 대로) 또는 17△34.5 클론 G1 (표시된 대로)으로 감염시켰다. 출원인은 미처리 대조군에 비해 바이러스 감염 후 3일 후에 MTS 검정을 통해 세포 생존율을 측정하였다. 두 17△34.5 클론의 효능은 그것들의 야생형 대응물인 스트레인17+보다 상당히 더 낮았지만, 17TermA와 비슷하였다. EGFP 카세트 및 EGFP DNA 서열은 도 5C (SEQ ID NO: 11)에 도시된다.
도 6A - 6C: Mut-3△34.5는 17Δ34.5와 비교하여 훨씬 더 빠른 바이러스 유전자 전달 및 세포 사멸을 나타낸다. 출원인은 (도 6A) Vero (도 6B) SK-N-AS (도 6C) 975A2 세포를 상이한 MOI의 모의 CTL, Mut-3△34.5, 또는 17Δ34.5로 처리하고 시간 경과에 따른 GFP 양성 구역 (상부 패널) 및 세포 합류 (하부 패널)를 모니터링하기 위하여 IncuCyte ZOOM 살아있는 세포를 사용하였다. 각 시점에 대해 조건 당 N=6개 웰, 및 웰당 n=2회 측정. 바이러스 감염 후 (pvi). 만-휘트니 U 테스트(Mann-Whitney U test)를 사용하여 바이러스 간 최대 GFP 영역까지의 시간을 비교한다 (도 6A). 오차 막대는 SD를 나타낸다.
도 7: Mut-3Δ34.5는 생체내에서 인간 신경모세포종 성장을 제어하는 데 17TermA보다 더 효과적이다. sub-q SK-N-AS 종양을 가진 무흉선 누드 마우스가 인산염 완충 식염수 (PBS) 대조군 (표시된 대로, n=8), 3 용량의 1e7 pfu의 17TermA (표시된 대로, n=8) 또는 Mut-3Δ34.5 (표시된 대로, n=9)로 근육내로 주사되었다. 카플란-마이어 (Kaplan-Meier) 생존 곡선이 플롯화되었다. 로그-순위 테스트(Log-rank test)를 사용하여 17TermA와 Mut-3Δ34.5 사이의 통계적 유의성이 채점되었다. * p<0.05.
도 8A - 8C: Mut-3의 감쇠된 버전인 Mut-3ICP6은 종양용해성 헤르페스 바이러스 rRp450와 비교하여 인간 신경모세포종 세포주 CHP-134에서 월등한 세포독성을 유도한다. (도 8A) ICP-6을 암호화하는 UL39 유전자가 CMV-구동 GFP 리포터 카세트로 대체되는 CRISPR-Cas9 유전자 편집 전략을 통해 구성된 Mut-3ICP6의 지도. 인간 신경모세포종 세포주에서 Mut-3, rRp450 및 Mut3-ICP6/D7-1의 세포독성 프로파일을 비교하는 MTS 세포 생존성 검정. 세포는 96-웰 접시에 4000개 세포/웰로 플레이팅되었고, 37℃에서 하룻밤 인큐베이션된 후 세포당 0.001, 0.01, 0.1, 및 1 감염성 바이러스 입자의 감염 다중도 (MOI)로 각각의 열거된 바이러스로 감염되었다. 검정은 Cell Titer96 AQuesous 비-방사성 세포 증식 검정/MTS (Promega, Madison, WI)를 사용하여 제조사의 설명서에 따라 감염 후 3 또는 4일 째에 수행되었다. 각각의 샘플 그룹은 사중으로 작동되었고 결과는 미감염 대조군에 비교한 퍼센트 세포 생존율로서 표시되었다. 오차 막대는 표준 편차를 나타낸다. 통계적 유의성은 t 테스트를 사용하여 평가되었다. *p ≤ 0.05, **p ≤ 0.01, ***p ≤ 0.001. 도 8B SK-N-AS 및 도 8C CHP-134는 결과를 그래프로 도시한다.
도 9A - 9B: Mut-3△ICP6은 rRp450과 비교하여 쥐과 신경모세포종 세포주 Neuro-2a 및 975A2에서 월등한 세포독성을 유도한다. 도 9A - 9B는 쥐과 신경모세포종 세포주에서 Mut-3, rRp450 및 Mut3-△ICP6/D7-1의 세포독성 프로파일을 비교하는 MTS 세포 생존성 검정의 결과를 도시한다. 세포는 96-웰 접시에 4000개 세포/웰로 플레이팅되었고, 37℃에서 하룻밤 인큐베이션된 후 세포당 0.001, 0.01, 0.1, 및 1 감염성 바이러스 입자의 감염 다중도 (MOI)로 각각의 열거된 바이러스로 감염되었다. 검정은 Cell Titer96 AQuesous 비-방사성 세포 증식 검정/MTS (Promega, Madison, WI)를 사용하여 제조사의 설명서에 따라 감염 후 3 또는 4일 째에 수행되었다. 각각의 샘플 그룹은 사중으로 작동되었고 결과는 미감염 대조군에 비교한 퍼센트 세포 생존율로서 표시되었다. 오차 막대는 표준 편차를 나타낸다. 통계적 유의성은 t 테스트를 사용하여 평가되었다. **p ≤ 0.01, ***p ≤ 0.001. 도 9A: Neuro-2a 및 도 9B: 975A2.
도 10A - 10B: Mut-3△ICP6은 48 및 72시간 감염 시간 주기에 걸쳐 쥐과 신경모세포종 세포주 975A2에서 rRp450보다 상당히 더 높은 바이러스 수율을 생성한다. 쥐과 975A2 (도 10A) 및 인간 SK-N-AS (도 10B) 신경모세포종 세포가 웰당 2 x 105 세포로 12-웰 접시에 플레이팅된 후, 37℃에서 하룻밤 인큐베이션되었고, SK-N-AS 세포의 경우 MOI 0.01 (도 10B) 또는 975A2 세포의 경우 MOI 0.5로 200 μL 혈청-유리 배지 중의 각각의 바이러스로 2시간 동안 20분마다 부드럽게 흔들어주면서 감염되었다. 세포는 PBS로 1회 세척되었고 1 mL의 완전 배지로 덮였다. 그런 후 세포 및 상층액은 감염 후 2, 24, 48 및 72시간 후에 수집되었고, 3회 냉동-해동되었으며, 연속적으로 희석되었고 Vero 세포 상에서 적정되어 표준 플라크 검정에 의해 감염성 바이러스 수율이 측정되었다. 각각의 샘플은 삼중으로 검정되었다. 오차 막대는 표준 편차를 나타낸다. 통계적 유의성은 t 테스트를 사용하여 평가되었다. * p ≤ 0.05, **p ≤ 0.01.
도 11A - 11B: Mut-3△34.5 및 Mut-3△ICP6은 분화된 인간 각질형성세포 세포에 대하여 Mut-3 바이러스보다 상당히 덜 강력하다. 인간 각질형성세포 (HFK) 세포가 제조사의 설명서에 따라 인간 각질형성세포 성장 보충물이 보충된 EpiLife 배지 (Cascade Biologics)에서 성장되었다. 미분화된 HFK (도 11A)가 웰당 2000개 세포의 밀도로 96-웰 플레이트에 시딩되고 하룻밤 배양되었다. 그런 후 배양물은 0.0004, 0.004, 0.04, 0.4, 및 4의 MOI로 Mut-3, Mut-3△34.5/C8G5 또는 Mut-3△ICP6 D7-1로 감염되었다. 세포 생존율은 바이러스 감염 후 3일 후에 MTS 검정에 의해 측정되었다. 분화된 HFK는 시딩 후 24시간 후에 그것들의 배양 배지에 10% FBS 및 1 mmol/l CaCl2를 첨가하고 감염 전 추가로 48시간 동안 인큐베이션되도록 함으로써 생성되었다. 분화된 세포 생존율 (도 11B)은 바이러스 감염 후 4일 후에 MTS 검정에 의해 측정되었다. 각각의 샘플은 사중으로 검정되었다. 오차 막대는 표준 편차를 나타낸다. 통계적 유의성은 t 테스트를 사용하여 평가되었다. *p ≤ 0.05, **p ≤ 0.01.
도 12: 1e6 pfu의 야생형 스트레인 KOS 바이러스의 정맥내 주사는 나이브 Blab/c 마우스에 치명적이다. Mut-3△34.5 및 Mut-3△ICP6에 대한 안전성 연구의 설명. 출원인은 나이브 비-종양 내재 Balb/c 마우스 (20마리 수컷, 20마리 암컷)를 1e8 플라크 형성 단위 (pfu)의 각각의 바이러스로 꼬리 정맥을 통해 주입함으로써 바이러스 생체분포 연구를 시작하였다. 출원인은 그런 후 이들 동물을 1, 14, 28, 56, 및 85일 째에 희생시켰고 (시점당 n = 4마리) 그들의 말초혈, 고환(수컷), 난소(암컷), 비장, 폐, 신장, 심장, 폐 및 뇌를 분석을 위해 수집하였다. 출원인은 바이러스 투여 후 처음 2주 동안은 매일 각각의 마우스를 관찰하였고, 그런 후에 계획된 희생의 날까지 주 2회 관찰하였다. 바이러스 주입 전 각 마우스의 체중이 기록되었고 그 후에는 매주 기록되었다. 그것과 나란히, 야생형 KOS 바이러스가 양성 (안전하지 않은) 대조군으로서의 마우스 그룹에 투여되었다 [투여량 범위: 마우스 (n=3마리)당 1e5 내지 1e7 pfu]. 출원인은 또한 수득된 장기의 병리적 분석을 수행하여, 돌연변이체 바이러스가 제공된 마우스로부터 얻어진 샘플을 야생형 KOS 바이러스가 제공된 마우스로부터 얻어진 샘플과 비교하였다. 출원인은 또한 이들 바이러스의 각각의 잠재력을 검출하기 위하여 플라크 검정을 활용하였다. 결과는 1e5, 1e6 또는 1e7 pfu의 야생형 KOS 바이러스의 단일 용량을 받은 마우스들의 생존 곡선을 보여준다.
도 13A - 13B: 나이브 Balb/c 마우스는 1e8 pfu까지의 Mut-3△34.5(C8G5) 또는 Mut-3ICP6(D7-1)의 정맥내 주사를 견딜 수 있다. 출원인은 안전성 및 생체분포 연구를 완료하였고 1e8 pfu까지의 Mut-3△34.5(C8G5) 또는 Mut-3ICP6(D7-1)을 받은 마우스가 신체 검사를 통해, 지정된 그들의 희생 날까지 (85일까지) 건강하게 유지된 것을 발견하였다. 암컷 마우스에서, 플라크 검정은 감염 후 24시간 시점에서만 심장, 신장, 간, 난소 및 비장에서 감염성 바이러스의 존재를 드러냈다. 도 13A 및 도 13B는 각각 암컷 및 수컷 마우스로부터의 결과를 그래프로 도시한다.
도 14: 복제하는 HSV는 1e6 pfu 이상의 야생형 KOS 바이러스를 받은 마우스의 뇌, 신장 및 난소에서 검출될 수 있다. 도 14는 1e6 또는 1e7 pfu의 야생형 KOS 바이러스가 주입된 마우스의 조직으로부터의 플라크 검정의 결과를 요약한 표이다. 마우스는 바이러스 감염 후 (pvi) 5-6일 후에 질병의 외적 징후 (후만증, 무기력한 뒷다리 마비, 등)를 보이기 시작한 후에 희생되었다. "+"는 검츨 가능한 플라크(들)를 나타내고, "-"는 그것의 부재를 나타낸다. 회색 음영 박스는 이들 데이터가 활용될 수 없는 것을 나타낸다.
도 15는 바이러스 감염 후 24시간 후에 1e8 pfu의 C8G5 또는 D7-1을 받은 마우스의 폐를 제외한 거의 모든 수득된 조직에서 복제하는 HSV가 검출될 수 있음을 보여준다. 표는 바이러스 감염 후 24시간 후에 Mut34.5 또는 Mut3△ICP6이 주입된 마우스의 조직으로부터의 플라크 검정의 결과를 요약한 것이다. "+"는 검츨 가능한 플라크(들)를 나타내고, "-"는 그것의 부재를 나타낸다. 회색 음영 박스는 이들 데이터가 활용될 수 없는 것을 나타낸다.
도 16은 바이러스 감염 후 14일 후에 1e8 pfu의 C8G5 또는 D7-1을 받은 마우스의 임의의 수득된 조직에서 복제하는 HSV가 검출될 수 없음을 보여준다. 표는 바이러스 감염 후 14일 후에 Mut34.5 또는 Mut3△ICP6이 주입된 마우스의 조직으로부터의 플라크 검정의 결과를 요약한 것이다. "-"는 플라크(들)를 검출할 수 없음을 나타낸다.
도 17은 바이러스 감염 후 28일 후에 1e8 pfu의 C8G5 또는 D7-1을 받은 마우스의 임의의 수득된 조직에서 복제하는 HSV가 검출될 수 없음을 보여준다. 표는 바이러스 감염 후 28일 후에 Mut34.5 또는 Mut3△ICP6이 주입된 마우스의 조직으로부터의 플라크 검정의 결과를 요약한 것이다. "-"는 플라크(들)를 검출할 수 없음을 나타낸다. 회색 음영 박스는 이들 데이터가 활용될 수 없는 것을 나타낸다.
도 18은 바이러스 감염 후 56일 후에 1e8 pfu의 C8G5 또는 D7-1을 받은 마우스의 임의의 수득된 조직에서 복제하는 HSV가 검출될 수 없는 것을 요약한 표이다. 표는 바이러스 감염 후 56일 후에 Mut34.5 또는 Mut3△ICP6이 주입된 마우스의 조직으로부터의 플라크 검정의 결과를 요약한 것이다. "-"는 플라크(들)를 검출할 수 없음을 나타낸다.
도 19는 바이러스 감염 후 85일 후에 1e8 pfu의 C8G5 또는 D7-1을 받은 마우스의 임의의 수득된 조직에서 복제하는 HSV가 검출될 수 없음을 보여준다. 표는 바이러스 감염 후 85일 후에 Mut34.5 또는 Mut3△ICP6이 주입된 마우스의 조직으로부터의 qPCR 및 플라크 검정의 결과를 요약한 것이다. "-"는 플라크(들)를 검출할 수 없음을 나타낸다.
도 20A - 20D는 Mut-3△gE의 플라크 크기가 Mut-3 또는 Mut-3D34.5(C8G5)와 비교하여 훨씬 더 작은 것을 보여주는 연구 결과를 도시한다. 도 20A: Mut-3△gE는 당단백질 gE를 암호화하는 Us8 유전자가 CMV-구동된 GFP 리포터 카세트로 대체되는 CRISPR-Cas9 유전자 편집 전략을 통해 구성되었다. 도 20B: Mut-3△gE 클론 28D5-B4 및 28D5-H1의 비-융합체 GFP 양성 플라크 표현형 - Vero 세포가 연속 희석된 28D5-B4 또는 28D5-H1으로 2시간 동안 감염되고 오버레이 배지로 덮였다. 플라크 사진은 바이러스 감염 후 3일 후에 촬영되었다. 도 20C: Mut-3△gE 클론 28D5-B4 및 28D5-H1의 qPCR 분석은 Us8/gE의 손실을 드러낸다. 어린 햄스터 신장 (BHK) 세포가 cells were infected with Mut-3△gE 클론 28D5-B4 또는 28D5-H1로 감염되었고 ≥50% 세포병변 효과가 관찰되었을 때 그것들의 용해물이 수득되었다. 바이러스 감염된 BHK 세포 용해물로부터 분리된 50-100 ng의 게놈 DNA가 qPCR 반응에 사용되었다. 결과는 gE/Us8 또는 Us8a 대조군 HSV 유전자에 비해 GFP 배수로서 표시된다. 도 20D: Vero 세포에서 수행된 표준 플라크 검정으로부터 얻어진, Mut-3△gE 클론 28D5-B4 및 28D5-H1과 Mut-3 또는 Mut-3△34.5/C8G5 사이의 플라크 크기의 비교. Mut-3, Mut-3△34.5, Mut-3△gE 클론 28D5-B4 및 클론 28D5-H1의 플라크 사진은 바이러스 감염 후 3일 째에 촬영되었다.
도 21A - 21D는 17△gE의 플라크 크기가 7syn+ 또는 17 34.5와 비교하여 훨씬 더 작은 것을 보여주는 연구 결과를 제공한다. 도 21A: 17△gE는 당단백질 gE를 암호화하는 Us8 유전자가 CMV-구동된 GFP 리포터 카세트로 대체되는 CRISPR-Cas9 유전자 편집 전략을 통해 구성되었다. 도 21B: 17△gE 클론 12G5의 비-융합체 및 작은 GFP 양성 플라크 표현형 - Vero 세포가 연속 희석된 17△gE 12G5로 2시간 동안 감염되고 오버레이 배지로 덮였다. 플라크 사진은 바이러스 감염 후 3일 후에 촬영되었다. 도 21C: 17△gE 클론 12G5의 qPCR 분석은 Us8/gE의 손실을 드러낸다. 어린 햄스터 신장 (BHK) 세포가 17△gE 클론 12G5로 감염되었고 ≥50% 세포병변 효과가 관찰되었을 때 그것들의 용해물이 수득되었다. 바이러스 감염된 BHK 세포 용해물로부터 분리된 50-100 ng의 게놈 DNA가 qPCR 반응에 사용되었다. 결과는 gE/Us8 또는 ICP6 대조군 HSV 유전자에 비해 GFP 배수로서 표시된다. 도 21D: Vero 세포에서 수행된 표준 플라크 검정으로부터 얻어진, 17gE 클론 12G5 17syn+ 또는 17△34.5 클론 B4 사이의 플라크 크기의 비교. 플라크 사진은 바이러스 감염 후 3일 째에 촬영되었다.
도 2A - 2C는 Mut-3, Mut-3Δ34.5, rRp450 및 17TermA의 플라크 크기 및 수용체 사용을 도시한다. 본 출원인은 동시에 4개의 바이러스의 플라크 검정을 수행하였고 Keyence HS 올인원 형광 현미경 BZ-II 분석기를 통해 3일 후의 플라크 이미지를 분석하였다. (도 2A) 4개 바이러스의 미가공 (위) 및 마스크된 (아래, 넘버링된 플라크) 이미지. (도 2B) 4개 바이러스의 평균 플라크 크기 (좌측) 및 플라크의 수가 계산되었다 (우측). Mut-3 및 Mut-3Δ34.5의 클라크 크기는 두 부모 바이러스 rRp450 및 17TermA보다 상당히 더 크다. (도 2C) CHO 세포 세트의 시험관내 세포독성/MTS 검정. 본 출원인은 출원인은 CHO-K1 (표시된 대로), CHO-넥틴(Nectin)-1 (표시된 대로), CHO-넥틴-2 (표시된 대로) 및 CHO-HVEM (표시된 대로)을 상이한 다중 감염도 (MOI)를 가진 4개의 바이러스로 감염시켰다. 출원인은 미처리 대조군에 비해 바이러스 감염 후 (pvi) 3일 후에 세포 생존 비색 세포 증식/MTS 검정을 측정하였다. CHO-K1 또는 CHO-넥틴-2 (주로 HSV-2 진입용)가 아닌 CHO-넥틴-1 및 CHO-HVEM만이 4개 바이러스의 처리에 대해 민감하였고, 이것은 Mut-3 및 Mut-3Δ34.5가 수용체 장벽을 우회하지 못하였고 세포를 감염시키기 위해 여전히 정식 HSV 진입 수용체를 전달할 수 있었음을 시사한다.
도 3A - 3C: Mut-3Δ34.5는 인간 및 쥐과 신경모세포종 세포를 사멸하는데 17TermA (γ 1 34.5-무효(Null))보다 더 강력하고, 그것은 시험관내에서 감염성 바이러스 입자의 증가된 수율에 기인하지 않는다. (도 3A) 신경모세포종 세포주의 시험관내 세포독성/MTS 검정. 출원인은 인간 (SK-N-AS) 및 쥐과 (975A2) 신경모세포종 세포를 둘 다 Mut-3 (표시된 대로), Mut-3Δ34.5 (표시된 대로) 또는 17TermA (표시된 대로)로 상이한 MOI로 감염시켰다. 출원인은 미처리 대조군에 비해 바이러스 감염 후 4일 후에 MTS 검정을 통해 세포 생존율을 측정하였다. N=6, 오차 막대는 SEM을 나타낸다. **** p<0.0001, 이원 분산 분석. (도 3B) 시험관내 바이러스 복제 검정. 출원인은 신경모세포종 세포주를 17TermA (표시된 대로) 또는 Mut-3△34.5 (표시된 대로)로 MOI=0.1에서 (상부 패널, 인간 라인 SK-N-AS) 또는 MOI=0.5에서 (하부 패널, 쥐과 라인 975A2) 감염시키고 세포를 바이러스 감염 후 2시간 후에 PBS로 세척하였다. 출원인은 바이러스 감염 후 2, 24, 48 및 72시간 후에 세포 용해물을 수득하여 플라크 검정에 의해 바이러스 수율을 측정하였다. N=3. 오차 막대는 SD를 나타낸다. * p<0.05,** p<0.001,**** p<0.0001, 이원 분산 분석. (도 3C) Mut-3Δ34.5 대비 17TermA 감염된 신경모세포종 배양물에서 상대적인 자유 방출 비리온의 비교. 출원인은 도 3B에서처럼 전체 배양물로서 측정하는 대신 상층액 및 펠릿을 수득하여 시간 경과에 따라 2개의 분리된 부분에서 플라크 검정을 수행함으로써, (도 3B)에서 기술된 것과 유사한 검정을 수행하였다. 출원인은 전체 배양물 (상층액 + 펠릿)에 대한 상층액 중의 감염성 입자의 비율로서 상대적 자유 비리온을 계산하였다. Mut-3Δ34.5는 48시간 째에 17TermA보다 더 많은 상대적 방출 비리온을 나타낸다. N=3. 오차 막대는 SD를 나타낸다. * p<0.05.
도 4A - 4H: 신경모세포종 세포에서 Mut3Δ34.5 및 17TermA 흡수의 TEM 분석. 신경모세포종 세포 SK-N-AS 및 975A2가 37℃에서 20분 동안 50의 MOI로 Mut-3Δ34.5 또는 17TermA로 감염되었다. (도 4A, 4B, 4E 및 4F) 삽입은 Mut-3Δ34.5 비리온이 주로 세포내 소포에서 발견되었고 (도 4B에서 오른쪽 화살표를 제외한 화살표) 원형질막과 융합된 채로 발견되는 것은 아주 소수인 (도 4B에서 오른쪽 화살표) 것을 보여준다. (도 4C, 4D, 4G 및 4H) 삽입은 17TermA 비리온이 주로 세포내 소포에서 발견되었고 (도 4G에서 아래쪽 화살표를 제외한 화살표), 원형질막과 융합된 채로 발견되는 것은 아주 소수인 것을 보여준다 (도 4G에서 아래쪽 화살표). TEM 분석은 Hitachi H-7650 TEM을 통해 실시되었다. N: 핵. 스케일 바: 500 nm.
도 5A - 5C: 감쇠된 17Δ34.5 비리온은 신경모세포종 세포에서 17TermA에 비슷한 효능을 보였다. 출원인은 CRISPR-Cas9 유전자 편집 기법을 통해 17Δ34.5를 생성하여 야생형 스트레인 17+의 g134.5 유전자를 EGFP 발현 카세트로 대체하였다. (도 5A) Vero 세포 상의 17Δ34.5의 플라크 이미지. B4 및 G1 클론은 둘 다 3회기의 플라크 정제 후에 100% GFP 양성 (좌측 패널) 비-융합체 (우측 패널, 상 대비) 플라크를 생성한다. 바이러스 감염 후 2일 후에 이미지를 EVOS® FL 이미징 시스템을 통해 취하였다. 스케일 바: 400 μm. (도 5B) 신경모세포종 세포주의 시험관내 세포독성/MTS 검정. 출원인은 신경모세포종 세포주, SK-N-AS 및 975A2를, 상이한 MOI의 야생형 스트레인 17+ (표시된 대로), 17TermA (표시된 대로), 17△34.5 클론 B4 (표시된 대로) 또는 17△34.5 클론 G1 (표시된 대로)으로 감염시켰다. 출원인은 미처리 대조군에 비해 바이러스 감염 후 3일 후에 MTS 검정을 통해 세포 생존율을 측정하였다. 두 17△34.5 클론의 효능은 그것들의 야생형 대응물인 스트레인17+보다 상당히 더 낮았지만, 17TermA와 비슷하였다. EGFP 카세트 및 EGFP DNA 서열은 도 5C (SEQ ID NO: 11)에 도시된다.
도 6A - 6C: Mut-3△34.5는 17Δ34.5와 비교하여 훨씬 더 빠른 바이러스 유전자 전달 및 세포 사멸을 나타낸다. 출원인은 (도 6A) Vero (도 6B) SK-N-AS (도 6C) 975A2 세포를 상이한 MOI의 모의 CTL, Mut-3△34.5, 또는 17Δ34.5로 처리하고 시간 경과에 따른 GFP 양성 구역 (상부 패널) 및 세포 합류 (하부 패널)를 모니터링하기 위하여 IncuCyte ZOOM 살아있는 세포를 사용하였다. 각 시점에 대해 조건 당 N=6개 웰, 및 웰당 n=2회 측정. 바이러스 감염 후 (pvi). 만-휘트니 U 테스트(Mann-Whitney U test)를 사용하여 바이러스 간 최대 GFP 영역까지의 시간을 비교한다 (도 6A). 오차 막대는 SD를 나타낸다.
도 7: Mut-3Δ34.5는 생체내에서 인간 신경모세포종 성장을 제어하는 데 17TermA보다 더 효과적이다. sub-q SK-N-AS 종양을 가진 무흉선 누드 마우스가 인산염 완충 식염수 (PBS) 대조군 (표시된 대로, n=8), 3 용량의 1e7 pfu의 17TermA (표시된 대로, n=8) 또는 Mut-3Δ34.5 (표시된 대로, n=9)로 근육내로 주사되었다. 카플란-마이어 (Kaplan-Meier) 생존 곡선이 플롯화되었다. 로그-순위 테스트(Log-rank test)를 사용하여 17TermA와 Mut-3Δ34.5 사이의 통계적 유의성이 채점되었다. * p<0.05.
도 8A - 8C: Mut-3의 감쇠된 버전인 Mut-3ICP6은 종양용해성 헤르페스 바이러스 rRp450와 비교하여 인간 신경모세포종 세포주 CHP-134에서 월등한 세포독성을 유도한다. (도 8A) ICP-6을 암호화하는 UL39 유전자가 CMV-구동 GFP 리포터 카세트로 대체되는 CRISPR-Cas9 유전자 편집 전략을 통해 구성된 Mut-3ICP6의 지도. 인간 신경모세포종 세포주에서 Mut-3, rRp450 및 Mut3-ICP6/D7-1의 세포독성 프로파일을 비교하는 MTS 세포 생존성 검정. 세포는 96-웰 접시에 4000개 세포/웰로 플레이팅되었고, 37℃에서 하룻밤 인큐베이션된 후 세포당 0.001, 0.01, 0.1, 및 1 감염성 바이러스 입자의 감염 다중도 (MOI)로 각각의 열거된 바이러스로 감염되었다. 검정은 Cell Titer96 AQuesous 비-방사성 세포 증식 검정/MTS (Promega, Madison, WI)를 사용하여 제조사의 설명서에 따라 감염 후 3 또는 4일 째에 수행되었다. 각각의 샘플 그룹은 사중으로 작동되었고 결과는 미감염 대조군에 비교한 퍼센트 세포 생존율로서 표시되었다. 오차 막대는 표준 편차를 나타낸다. 통계적 유의성은 t 테스트를 사용하여 평가되었다. *p ≤ 0.05, **p ≤ 0.01, ***p ≤ 0.001. 도 8B SK-N-AS 및 도 8C CHP-134는 결과를 그래프로 도시한다.
도 9A - 9B: Mut-3△ICP6은 rRp450과 비교하여 쥐과 신경모세포종 세포주 Neuro-2a 및 975A2에서 월등한 세포독성을 유도한다. 도 9A - 9B는 쥐과 신경모세포종 세포주에서 Mut-3, rRp450 및 Mut3-△ICP6/D7-1의 세포독성 프로파일을 비교하는 MTS 세포 생존성 검정의 결과를 도시한다. 세포는 96-웰 접시에 4000개 세포/웰로 플레이팅되었고, 37℃에서 하룻밤 인큐베이션된 후 세포당 0.001, 0.01, 0.1, 및 1 감염성 바이러스 입자의 감염 다중도 (MOI)로 각각의 열거된 바이러스로 감염되었다. 검정은 Cell Titer96 AQuesous 비-방사성 세포 증식 검정/MTS (Promega, Madison, WI)를 사용하여 제조사의 설명서에 따라 감염 후 3 또는 4일 째에 수행되었다. 각각의 샘플 그룹은 사중으로 작동되었고 결과는 미감염 대조군에 비교한 퍼센트 세포 생존율로서 표시되었다. 오차 막대는 표준 편차를 나타낸다. 통계적 유의성은 t 테스트를 사용하여 평가되었다. **p ≤ 0.01, ***p ≤ 0.001. 도 9A: Neuro-2a 및 도 9B: 975A2.
도 10A - 10B: Mut-3△ICP6은 48 및 72시간 감염 시간 주기에 걸쳐 쥐과 신경모세포종 세포주 975A2에서 rRp450보다 상당히 더 높은 바이러스 수율을 생성한다. 쥐과 975A2 (도 10A) 및 인간 SK-N-AS (도 10B) 신경모세포종 세포가 웰당 2 x 105 세포로 12-웰 접시에 플레이팅된 후, 37℃에서 하룻밤 인큐베이션되었고, SK-N-AS 세포의 경우 MOI 0.01 (도 10B) 또는 975A2 세포의 경우 MOI 0.5로 200 μL 혈청-유리 배지 중의 각각의 바이러스로 2시간 동안 20분마다 부드럽게 흔들어주면서 감염되었다. 세포는 PBS로 1회 세척되었고 1 mL의 완전 배지로 덮였다. 그런 후 세포 및 상층액은 감염 후 2, 24, 48 및 72시간 후에 수집되었고, 3회 냉동-해동되었으며, 연속적으로 희석되었고 Vero 세포 상에서 적정되어 표준 플라크 검정에 의해 감염성 바이러스 수율이 측정되었다. 각각의 샘플은 삼중으로 검정되었다. 오차 막대는 표준 편차를 나타낸다. 통계적 유의성은 t 테스트를 사용하여 평가되었다. * p ≤ 0.05, **p ≤ 0.01.
도 11A - 11B: Mut-3△34.5 및 Mut-3△ICP6은 분화된 인간 각질형성세포 세포에 대하여 Mut-3 바이러스보다 상당히 덜 강력하다. 인간 각질형성세포 (HFK) 세포가 제조사의 설명서에 따라 인간 각질형성세포 성장 보충물이 보충된 EpiLife 배지 (Cascade Biologics)에서 성장되었다. 미분화된 HFK (도 11A)가 웰당 2000개 세포의 밀도로 96-웰 플레이트에 시딩되고 하룻밤 배양되었다. 그런 후 배양물은 0.0004, 0.004, 0.04, 0.4, 및 4의 MOI로 Mut-3, Mut-3△34.5/C8G5 또는 Mut-3△ICP6 D7-1로 감염되었다. 세포 생존율은 바이러스 감염 후 3일 후에 MTS 검정에 의해 측정되었다. 분화된 HFK는 시딩 후 24시간 후에 그것들의 배양 배지에 10% FBS 및 1 mmol/l CaCl2를 첨가하고 감염 전 추가로 48시간 동안 인큐베이션되도록 함으로써 생성되었다. 분화된 세포 생존율 (도 11B)은 바이러스 감염 후 4일 후에 MTS 검정에 의해 측정되었다. 각각의 샘플은 사중으로 검정되었다. 오차 막대는 표준 편차를 나타낸다. 통계적 유의성은 t 테스트를 사용하여 평가되었다. *p ≤ 0.05, **p ≤ 0.01.
도 12: 1e6 pfu의 야생형 스트레인 KOS 바이러스의 정맥내 주사는 나이브 Blab/c 마우스에 치명적이다. Mut-3△34.5 및 Mut-3△ICP6에 대한 안전성 연구의 설명. 출원인은 나이브 비-종양 내재 Balb/c 마우스 (20마리 수컷, 20마리 암컷)를 1e8 플라크 형성 단위 (pfu)의 각각의 바이러스로 꼬리 정맥을 통해 주입함으로써 바이러스 생체분포 연구를 시작하였다. 출원인은 그런 후 이들 동물을 1, 14, 28, 56, 및 85일 째에 희생시켰고 (시점당 n = 4마리) 그들의 말초혈, 고환(수컷), 난소(암컷), 비장, 폐, 신장, 심장, 폐 및 뇌를 분석을 위해 수집하였다. 출원인은 바이러스 투여 후 처음 2주 동안은 매일 각각의 마우스를 관찰하였고, 그런 후에 계획된 희생의 날까지 주 2회 관찰하였다. 바이러스 주입 전 각 마우스의 체중이 기록되었고 그 후에는 매주 기록되었다. 그것과 나란히, 야생형 KOS 바이러스가 양성 (안전하지 않은) 대조군으로서의 마우스 그룹에 투여되었다 [투여량 범위: 마우스 (n=3마리)당 1e5 내지 1e7 pfu]. 출원인은 또한 수득된 장기의 병리적 분석을 수행하여, 돌연변이체 바이러스가 제공된 마우스로부터 얻어진 샘플을 야생형 KOS 바이러스가 제공된 마우스로부터 얻어진 샘플과 비교하였다. 출원인은 또한 이들 바이러스의 각각의 잠재력을 검출하기 위하여 플라크 검정을 활용하였다. 결과는 1e5, 1e6 또는 1e7 pfu의 야생형 KOS 바이러스의 단일 용량을 받은 마우스들의 생존 곡선을 보여준다.
도 13A - 13B: 나이브 Balb/c 마우스는 1e8 pfu까지의 Mut-3△34.5(C8G5) 또는 Mut-3ICP6(D7-1)의 정맥내 주사를 견딜 수 있다. 출원인은 안전성 및 생체분포 연구를 완료하였고 1e8 pfu까지의 Mut-3△34.5(C8G5) 또는 Mut-3ICP6(D7-1)을 받은 마우스가 신체 검사를 통해, 지정된 그들의 희생 날까지 (85일까지) 건강하게 유지된 것을 발견하였다. 암컷 마우스에서, 플라크 검정은 감염 후 24시간 시점에서만 심장, 신장, 간, 난소 및 비장에서 감염성 바이러스의 존재를 드러냈다. 도 13A 및 도 13B는 각각 암컷 및 수컷 마우스로부터의 결과를 그래프로 도시한다.
도 14: 복제하는 HSV는 1e6 pfu 이상의 야생형 KOS 바이러스를 받은 마우스의 뇌, 신장 및 난소에서 검출될 수 있다. 도 14는 1e6 또는 1e7 pfu의 야생형 KOS 바이러스가 주입된 마우스의 조직으로부터의 플라크 검정의 결과를 요약한 표이다. 마우스는 바이러스 감염 후 (pvi) 5-6일 후에 질병의 외적 징후 (후만증, 무기력한 뒷다리 마비, 등)를 보이기 시작한 후에 희생되었다. "+"는 검츨 가능한 플라크(들)를 나타내고, "-"는 그것의 부재를 나타낸다. 회색 음영 박스는 이들 데이터가 활용될 수 없는 것을 나타낸다.
도 15는 바이러스 감염 후 24시간 후에 1e8 pfu의 C8G5 또는 D7-1을 받은 마우스의 폐를 제외한 거의 모든 수득된 조직에서 복제하는 HSV가 검출될 수 있음을 보여준다. 표는 바이러스 감염 후 24시간 후에 Mut34.5 또는 Mut3△ICP6이 주입된 마우스의 조직으로부터의 플라크 검정의 결과를 요약한 것이다. "+"는 검츨 가능한 플라크(들)를 나타내고, "-"는 그것의 부재를 나타낸다. 회색 음영 박스는 이들 데이터가 활용될 수 없는 것을 나타낸다.
도 16은 바이러스 감염 후 14일 후에 1e8 pfu의 C8G5 또는 D7-1을 받은 마우스의 임의의 수득된 조직에서 복제하는 HSV가 검출될 수 없음을 보여준다. 표는 바이러스 감염 후 14일 후에 Mut34.5 또는 Mut3△ICP6이 주입된 마우스의 조직으로부터의 플라크 검정의 결과를 요약한 것이다. "-"는 플라크(들)를 검출할 수 없음을 나타낸다.
도 17은 바이러스 감염 후 28일 후에 1e8 pfu의 C8G5 또는 D7-1을 받은 마우스의 임의의 수득된 조직에서 복제하는 HSV가 검출될 수 없음을 보여준다. 표는 바이러스 감염 후 28일 후에 Mut34.5 또는 Mut3△ICP6이 주입된 마우스의 조직으로부터의 플라크 검정의 결과를 요약한 것이다. "-"는 플라크(들)를 검출할 수 없음을 나타낸다. 회색 음영 박스는 이들 데이터가 활용될 수 없는 것을 나타낸다.
도 18은 바이러스 감염 후 56일 후에 1e8 pfu의 C8G5 또는 D7-1을 받은 마우스의 임의의 수득된 조직에서 복제하는 HSV가 검출될 수 없는 것을 요약한 표이다. 표는 바이러스 감염 후 56일 후에 Mut34.5 또는 Mut3△ICP6이 주입된 마우스의 조직으로부터의 플라크 검정의 결과를 요약한 것이다. "-"는 플라크(들)를 검출할 수 없음을 나타낸다.
도 19는 바이러스 감염 후 85일 후에 1e8 pfu의 C8G5 또는 D7-1을 받은 마우스의 임의의 수득된 조직에서 복제하는 HSV가 검출될 수 없음을 보여준다. 표는 바이러스 감염 후 85일 후에 Mut34.5 또는 Mut3△ICP6이 주입된 마우스의 조직으로부터의 qPCR 및 플라크 검정의 결과를 요약한 것이다. "-"는 플라크(들)를 검출할 수 없음을 나타낸다.
도 20A - 20D는 Mut-3△gE의 플라크 크기가 Mut-3 또는 Mut-3D34.5(C8G5)와 비교하여 훨씬 더 작은 것을 보여주는 연구 결과를 도시한다. 도 20A: Mut-3△gE는 당단백질 gE를 암호화하는 Us8 유전자가 CMV-구동된 GFP 리포터 카세트로 대체되는 CRISPR-Cas9 유전자 편집 전략을 통해 구성되었다. 도 20B: Mut-3△gE 클론 28D5-B4 및 28D5-H1의 비-융합체 GFP 양성 플라크 표현형 - Vero 세포가 연속 희석된 28D5-B4 또는 28D5-H1으로 2시간 동안 감염되고 오버레이 배지로 덮였다. 플라크 사진은 바이러스 감염 후 3일 후에 촬영되었다. 도 20C: Mut-3△gE 클론 28D5-B4 및 28D5-H1의 qPCR 분석은 Us8/gE의 손실을 드러낸다. 어린 햄스터 신장 (BHK) 세포가 cells were infected with Mut-3△gE 클론 28D5-B4 또는 28D5-H1로 감염되었고 ≥50% 세포병변 효과가 관찰되었을 때 그것들의 용해물이 수득되었다. 바이러스 감염된 BHK 세포 용해물로부터 분리된 50-100 ng의 게놈 DNA가 qPCR 반응에 사용되었다. 결과는 gE/Us8 또는 Us8a 대조군 HSV 유전자에 비해 GFP 배수로서 표시된다. 도 20D: Vero 세포에서 수행된 표준 플라크 검정으로부터 얻어진, Mut-3△gE 클론 28D5-B4 및 28D5-H1과 Mut-3 또는 Mut-3△34.5/C8G5 사이의 플라크 크기의 비교. Mut-3, Mut-3△34.5, Mut-3△gE 클론 28D5-B4 및 클론 28D5-H1의 플라크 사진은 바이러스 감염 후 3일 째에 촬영되었다.
도 21A - 21D는 17△gE의 플라크 크기가 7syn+ 또는 17 34.5와 비교하여 훨씬 더 작은 것을 보여주는 연구 결과를 제공한다. 도 21A: 17△gE는 당단백질 gE를 암호화하는 Us8 유전자가 CMV-구동된 GFP 리포터 카세트로 대체되는 CRISPR-Cas9 유전자 편집 전략을 통해 구성되었다. 도 21B: 17△gE 클론 12G5의 비-융합체 및 작은 GFP 양성 플라크 표현형 - Vero 세포가 연속 희석된 17△gE 12G5로 2시간 동안 감염되고 오버레이 배지로 덮였다. 플라크 사진은 바이러스 감염 후 3일 후에 촬영되었다. 도 21C: 17△gE 클론 12G5의 qPCR 분석은 Us8/gE의 손실을 드러낸다. 어린 햄스터 신장 (BHK) 세포가 17△gE 클론 12G5로 감염되었고 ≥50% 세포병변 효과가 관찰되었을 때 그것들의 용해물이 수득되었다. 바이러스 감염된 BHK 세포 용해물로부터 분리된 50-100 ng의 게놈 DNA가 qPCR 반응에 사용되었다. 결과는 gE/Us8 또는 ICP6 대조군 HSV 유전자에 비해 GFP 배수로서 표시된다. 도 21D: Vero 세포에서 수행된 표준 플라크 검정으로부터 얻어진, 17gE 클론 12G5 17syn+ 또는 17△34.5 클론 B4 사이의 플라크 크기의 비교. 플라크 사진은 바이러스 감염 후 3일 째에 촬영되었다.
상세한 설명
본 개시에 따르는 구체예들이 이하에서 더 전체적으로 기술될 것이다. 그러나, 개시의 측면들은 상이한 형태로 구현될 수 있고 본원에 제시된 구체예에 한정되는 것으로 해석되지 않아야 한다. 오히려, 이들 구체예는 본 개시가 철저하고 완전하며, 기술분야에 숙련된 사람들에게 발명의 범주를 완전하게 전달하도록 제공된다. 본원의 설명에서 사용된 용어학은 특정 구체예를 설명할 목적만을 위한 것이며 제한하는 것으로 의도되지 않는다.
다르게 정의되지 않는 한, 본원에서 사용된 모든 용어 (기술적이고 과학적인 용어를 포함함)는 본 발명이 속하는 기술분야에 통상적인 지식을 가진 사람에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 일반적으로 사용된 사전에 정의된 것과 같은 용어는 본 출원 및 관련된 기술의 맥락에서 그것들의 의미와 일치하는 의미를 가지는 것으로 해석되어야 하고 분명하게 본원에서 그렇게 정의되지 않는 한 이상화되거나 지나치게 형식적인 의미로 해석되지 않아야 하는 것이 추가로 이해될 것이다. 하기에서 명백하게 정의되지는 않지만, 그러한 용어는 그것들의 일반적인 의미에 따라 해석되어야 한다.
본원의 설명에서 사용된 용어는 특정 구체예를 기술할 목적만을 위한 것이며 발명을 제한하는 것으로 의도되지 않는다. 본원에서 언급된 모든 출판물, 특허 출원, 특허 및 기타 참고문헌은 그 전문이 참조로 포함된다.
본 기술의 실시는, 다르게 표시되지 않는 한, 기술분야의 숙련도 내에 있는 조직 배양, 면역학, 분자 생물학, 미생물학, 세포 생물학, 및 재조합 DNA의 종래 기법을 사용할 것이다.
맥락이 다른 것을 나타내지 않는 한, 특히 본원에서 기술된 발명의 다양한 특징은 임의의 조합으로 사용될 수 있는 것으로 의도된다. 더욱이, 개시는 또한 일부 구체예에서, 본원에 제시된 임의의 특징 또는 특징들의 조합이 배제되거나 생략될 수 있는 것을 고려한다. 예를 들어, 만약 명세서가 복합체가 구성요소 A, B 및 C를 포함하는 것으로 기재되어 있다면, A, B 또는 C 중 임의의 것, 또는 그것의 조합이 생략될 수 있고 단독으로 또는 임의의 조합으로 부인될 수 있는 것으로 특별히 의도된다.
분명하게 다르게 표시되지 않는 한, 모든 명시된 구체예, 특징, 및 용어는 인용된 구체예, 특징, 또는 용어 및 이것들의 생물학적 동등물을 모두 포함하는 것으로 의도된다.
범위를 포함한, 모든 숫자적 표시, 예컨대, pH, 온도, 시간, 농도, 및 분자량은 필요에 따라 1.0 또는 0.1의 증분만큼, 또는 대안으로 +/- 15 %, 또는 대안으로 10%, 또는 대안으로 5%, 또는 대안으로 2%의 변동으로 (+) 또는 (-)로 달라지는 근사값이다. 비록 언제나 분명하게 기재되지는 않지만, 모든 수치 표시는 용어 "약"이 선행하는 것으로 이해되어야 한다. 또한 비록 언제나 분명하게 기재되지는 않지만, 본원에서 기술된 시약은 단지 예시적이며 그것의 동등물이 기술분야에 알려져 있는 것이 이해되어야 한다.
본원에서 사용되는 바, 용어 "비슷한"은 참조하는 것과 동일한 수준 또는 참조 수준과 비교하여 +/- 50%, 또는 대안으로 45%, 또는 대안으로 40%, 또는 대안으로 35%, 또는 대안으로 30%, 또는 대안으로 25%, 또는 대안으로 20%, 또는 대안으로 15 %, 또는 대안으로 10%, 또는 대안으로 5%, 또는 대안으로 2%의 변화 내에 있는 수준을 가지는 것을 나타낸다.
본 개시 전체를 통해서, 다양한 출판물, 특허 및 공개된 특허 명세서가 식별 인용 또는 아라비아 숫자에 의해 참조된다. 아라비아 숫자에 의해 식별된 출판물에 대한 전체 인용은 청구범위 직전에 있다. 이들 출판물, 특허 및 공개된 특허 명세서의 개시내용은 본 발명이 속하는 기술분야의 상태를 보다 더 전체적으로 기술하기 위하여 그 전문이 본 개시에 참조에 의해 포함된다.
정의
본 기술의 실시는 다르게 표시되지 않는 한, 유기 화학, 약리학, 면역학, 분자 생물학, 미생물학, 세포 생물학 및 재조합 DNA의 종래 기법을 사용할 것이다. 참고, 예컨대, Sambrook, Fritsch and Maniatis, Molecular Cloning: A Laboratory Manual, 2nd edition (1989); Current Protocols In Molecular Biology (F. M. Ausubel, et al. eds., (1987)); 효소학 방법 시리즈 (Academic Press, Inc.): PCR 2: A Practical Approach (M.J. MacPherson, B.D. Hames and G.R. Taylor eds. (1995)), Harlow and Lane, eds. (1988) Antibodies, a Laboratory Manual, and Animal Cell Culture (R.I. Freshney, ed. (1987)).
발명의 설명 및 첨부된 청구범위에서 사용되는 것과 같이, 단일한 형태를 나타내는 단어는 맥락이 분명하게 다른 것을 표시하지 않는 한, 복수 형태를 또한 포함하는 것으로 의도된다.
본원에서 사용되는 바, 용어 "포함하는"은 조성물 및 방법이 인용된 요소를 포함하지만, 다른 것을 배제하지 않는 것을 의미하는 것으로 의도된다. 본원에서 사용되는 바, 본질적으로 이루어지는 이행 문구 (및 문법적 변형)는 인용된 물질 또는 단계 및 인용된 구체예의 기본적이고 신규한 특징(들)에 실질적으로 영향을 미치지 않는 것들을 포함하는 것으로서 해석되어야 한다. 이들 특징은 방법 구체예에서 열거된다. 그러므로, 본원에서 사용되는 용어 "으로 본질적으로 이루어지는"은 "포함하는"과 동등한 것으로 해석되지 않아야 한다. "으로 이루어지는"은 본원에 개시된 조성물의 투여를 위한 다른 성분의 미량 요소 및 실질적인 방법 단계 이상의 것을 배제하는 것을 의미할 것이다. 이들 이행 용어에 의해 정의된 측면은 본 개시의 범주 내에 있다.
본원에서 사용되는 용어 "약"은 양 또는 농도 등과 같은 측정 가능한 값을 언급할 때, 명시된 양의 20%, 10%, 5%, 1 %, 0.5%, 또는 심지어 0.1 %의 변동을 포함하는 것을 의미한다.
용어 또는 "허용되는", "효과적인", 또는 "충분한"은 본원에 개시된 임의의 구성요소, 범위, 용량 형태, 등의 선택을 기술하기 위해 사용될 때 상기 구성요소, 범위, 용량 형태, 등이 개시된 목적에 적합한 것을 의도한다.
본원에서 사용되는 바, "및/또는"은 하나 이상의 관련된 열거된 대상의 임의의 및 모든 가능한 조합, 뿐만 아니라 대안으로 해석될 때 ("또는") 조합의 결여를 나타내며 포함한다.
본원에서 사용되는 용어 "세포"는 선택적으로 대상체 또는 상업적으로 이용 가능한 공급원으로부터 얻어진 원핵 또는 진핵 세포를 나타낼 수 있다.
"진핵 세포"는 모네라를 제외한 생명 왕국의 전부이다. 그것은 막-결합 핵을 통해 쉽게 구별될 수 있다. 동물, 식물, 진균, 및 원생생물은 진핵 세포 또는 그것의 세포가 내부 막 및 세포골격에 의해 복합체 구조로 조직화되는 유기체이다. 가장 특징적인 막-결합 구조는 핵이다. 특별히 인용되지 않는 한, 용어 "숙주"는 예를 들어, 효모, 고등 식물, 곤충 및 포유류 세포를 포함한, 진핵 숙주를 포함한다. 진핵 세포 또는 숙주의 비제한적인 예로는 유인원, 소과, 돼지과, 쥐과, 래트, 조류, 파충류 및 인간, 예컨대, HEK293 세포 및 293T 세포를 들 수 있다.
"원핵 세포"는 일반적으로 핵 또는 임의의 다른 막-결합 소기관이 없고 두 영역, 박테리아와 고세균으로 나누어진다. 염색체 DNA 외에, 이들 세포는 또한 에피솜으로 불리는 원형 루프에 유전자 정보를 함유할 수 있다. 박테리아 세포는 매우 작고, 대략 동물의 미토콘드리아의 크기이다 (약 1-2 μm의 직경 및 10 μm의 길이). 원핵 세포는 3가지 주요 형상을 특징으로 한다: 막대 형상, 구형, 및 나선형. 진핵세포와 같은 정교한 복제 과정을 통해 진행되는 대신, 박테리아 세포는 이분법에 의해 나누어진다. 예로는, 한정하는 것은 아니지만 바실러스 박테리아, 대장균 박테리아, 및 살모넬라 박테리아를 들 수 있다.
용어 "암호화하는"은 핵산 서열에 적용될 때 천연 상태에서 또는 기술분야에 숙련된 사람들에게 잘 알려져 있는 방법에 의해 조작될 때 폴리펩타이드 및/또는 그것의 단편에 대한 mRNA를 생성하도록 전사 및/또는 번역될 수 있다면 폴리펩타이드를 "암호화하는" 것으로 말할 수 있는 폴리뉴클레오타이드를 나타낸다. 안티센스 가닥은 그러한 핵산의 보체이고, 암호화 서열은 그것으로부터 추론될 수 있다.
용어 "동등물" 또는 "생물학적 동등물"은 특정 분자, 생물학적, 또는 세포 물질을 언급할 때 상호교환적으로 사용되며 원하는 구조 또는 기능성을 여전히 유지하면서 최소한의 상동성을 가지는 것들을 의도한다. 동등한 폴리펩타이드의 비제한적인 예에는, 그것에 대해 또는 폴리펩타이드 서열에 대해 적어도 60%, 또는 대안으로 적어도 65%, 또는 대안으로 적어도 70%, 또는 대안으로 적어도 75%, 또는 대안으로 80%, 또는 대안으로 적어도 85%, 또는 대안으로 적어도 90%, 또는 대안으로 적어도 95% 동일성을 가지는 폴리펩타이드, 또는 높은 엄격성의 조건 하에서 그러한 폴리펩타이드 서열을 암호화하는 폴리뉴클레오타이드에 혼성화하는 폴리뉴클레오타이드 또는 그것의 보체에 의해 암호화되는 폴리펩타이드가 포함될 수 있다. 높은 엄격성의 조건은 본원에서 기술되며 참조로 본원에 포함된다. 대안으로, 그것의 동등물은 참조 폴리뉴클레오타이드, 예컨대, 야생형 폴리뉴클레오타이드에 대해 적어도 70%, 또는 대안으로 적어도 75%, 또는 대안으로 80%, 또는 대안으로 적어도 85%, 또는 대안으로 적어도 90%, 또는 대안으로 적어도 95% 동일성, 또는 적어도 97% 서열 동일성을 가지는 폴리뉴클레오타이드 또는 그것에 대한 보체에 의해 암호화된 폴리펩타이드이다. 한 측면으로, 동등한 폴리펩타이드 또는 폴리뉴클레오타이드는 각각 참조 폴리펩타이드 또는 폴리뉴클레오타이드와 동일한 또는 실질적으로 유사한 생물학적 기능, 예컨대, 본원에서 기술된 적절한 세포 검정 또는 동물 모델에 의해 측정되는 바 세포용해 기능, 항종양, 항전이, 또는 항암 기능을 가진다.
동등한 폴리펩타이드의 비제한적인 예로는, 참조 폴리뉴클레오타이드에 대해 적어도 60%, 또는 대안으로 적어도 65%, 또는 대안으로 적어도 70%, 또는 대안으로 적어도 75%, 또는 대안으로 80%, 또는 대안으로 적어도 85%, 또는 대안으로 적어도 90%, 또는 대안으로 적어도 95%, 또는 대안으로 적어도 97% 동일성을 가지는 폴리뉴클레오타이드를 들 수 있다. 동등한은 또한 높은 엄격성의 조건 하에서 참조 폴리뉴클레오타이드에 혼성화하는 폴리뉴클레오타이드 또는 그것의 보체를 의도한다.
또 다른 서열에 대해 특정 백분율 (예를 들어, 80%, 85%, 90%, 또는 95%)의 "서열 동일성"을 가진 폴리뉴클레오타이드 또는 폴리뉴클레오타이드 영역 (또는 폴리펩타이드 또는 폴리펩타이드 영역)은, 정렬될 때, 염기 (또는 아미노산)의 백분율이 두 서열을 비교할 때 동일한 것을 의미한다. 정렬 및 퍼센트 상동성 또는 서열 동일성은 기술분야에 알려져 있는 소프트웨어 프로그램, 예를 들어 Current Protocols in Molecular Biology (Ausubel et al., eds. 1987) Supplement 30, 섹션 7.7.18, 표 7.7.1에서 기술된 것들을 사용하여 측정될 수 있다. 특정 구체예에서, 기본 파라미터가 정렬에 사용된다. 비제한적인 예시의 정렬 프로그램은 기본 파라미터를 사용하는 BLAST이다. 특히, 예시의 프로그램으로 다음의 기본 파라미터를 사용하는 BLASTN 및 BLASTP를 들 수 있다: 유전자 코드=가닥; 필터=없음; 가닥=이중; 컷오프=60; 기대값=10; 매트릭스=BLOSUM62; 설명=50개 서열; 정렬 기준=고 득점; 데이터베이스=비-중복, GenBank+EMBL+DDBJ+PDB+GenBank CDS 번역+SwissProtein+SPupdate+PIR. 이들 프로그램의 세부사항은 다음의 인터넷 주소에서 찾아볼 수 있다: ncbi.nlm.nih.gov/cgi-bin/BLAST. 서열 동일성 및 퍼센트 동일성은 그것을 clustalW (웹 주소: genome.jp/tools/clustalw/에서 이용 가능함, 2017년 1월 13일에 최종 접속)에 포함시킴으로써 측정될 수 있다.
"상동성" 또는 "동일성" 또는 "유사성"은 두 펩타이드 사이 또는 두 핵산 분자 사이의 서열 유사성을 나타낸다. 상동성은 비교를 목적으로 정렬될 수 있는 각 서열의 위치를 비교함으로써 측정될 수 있다. 비교된 서열의 위치가 동일한 염기 또는 아미노산에 의해 차지될 때, 분자는 그 위치에서 상동한다. 서열간 상동성 정도는 서열들에 의해 공유된 매칭 또는 상동성 위치의 수의 함수이다. "관련이 없는' 또는 "비상동성" 서열은 본 개시의 서열 중 하나와 40% 미만 동일성, 또는 대안으로 25% 미만 동일성을 공유한다.
"상동성" 또는 "동일성" 또는 "유사성"은 또한 엄격한 조건 하에서 혼성화하는 두 핵산 분자를 나타낼 수 있다.
"혼성화"는 하나 이상의 폴리뉴클레오타이드가 반응하여 뉴클레오타이드 잔기의 염기들 사이의 수소 결합을 통해 안정화되는 복합체를 형성하는 반응을 나타낸다. 수소 결합은 왓슨-크릭 쌍형성, 후그스타인 결합, 또는 임의의 다른 서열-특이적 방식으로 일어날 수 있다. 복합체는 듀플렉스 구조를 형성하는 2개의 가닥, 다중 가닥 복합체를 형성하는 3개 이상의 가닥, 단일 자체-혼성화 가닥, 또는 이것들의 임의의 조합을 포함할 수 있거나, 또는 대안으로 본질적으로 그것으로 이루어질 수 있거나, 또는 또한 추가로 그것을 포함하거나, 또는 대안으로 본질적으로 그것으로 이루어지거나, 또는 또한 추가로 그것으로 이루어진다. 혼성화 반응은 보다 광범위한 과정의 단계, 예컨대 PCR 반응의 개시, 또는 리보자임에 의한 폴리뉴클레오타이드의 효소적 절단을 구성할 수 있다.
엄격한 혼성화 조건의 예는 다음을 포함한다: 약 25℃ 내지 약 37℃의 인큐베이션 온도; 약 6xSSC 내지 약 10xSSC의 혼성화 완충제 농도; 약 0% 내지 약 25%의 포름아미드 농도; 및 약 4xSSC 내지 약 8xSSC의 세척 용액. 중간 혼성화 조건의 예는 다음을 포함한다: 약 40℃ 내지 약 50℃의 인큐베이션 온도; 약 9xSSC 내지 약 2xSSC의 완충제 농도; 약 30% 내지 약 50%의 포름아미드 농도; 및 약 5xSSC 내지 약 2xSSC의 세척 용액. 높은 엄격성 조건의 예는 다음을 포함한다: 약 55℃ 내지 약 68℃의 인큐베이션 온도; 약 1xSSC 내지 약 0.1xSSC의 완충제 농도; 약 55% 내지 약 75%의 포름아미드 농도; 및 약 1xSSC, 0.1xSSC의 세척 용액, 또는 탈이온수. 일반적으로, 혼성화 인큐베이션 시간은 5분 내지 24시간이며, 1회, 2회, 또는 그 이상의 세척 단계를 포함하고, 세척 인큐베이션 시간은 약 1, 2, 또는 15분이다. SSC는 0.15 M NaCl 및 15 mM 시트레이트 완충제이다. 다른 완충제 시스템을 사용하는 SSC의 동등물이 사용될 수 있는 것이 이해된다.
본원에서 사용되는 바, "발현"은 그것에 의해 폴리뉴클레오타이드가 mRNA로 전사되는 과정 및/또는 그것에 의해 전사된 mRNA가 계속해서 펩타이드, 폴리펩타이드, 또는 단백질로 번역되는 과정을 나타낸다. 만약 폴리뉴클레오타이드가 게놈 DNA로부터 유래된다면, 발현은 진핵 세포에서의 mRNA의 스플라이싱을 포함할 수 있다.
"유전자"는 전사 및 번역된 후에 특정 폴리펩타이드 또는 단백질을 암호화할 수 있는 적어도 하나의 오픈 리딩 프레임 (ORF)을 함유하는 폴리뉴클레오타이드를 나타낸다. "유전자 생성물" 또는 대안으로 "유전자 발현 생성물"은 유전자가 전사되고 번역될 때 생성된 아미노산 (예컨대, 펩타이드 또는 폴리펩타이드)을 나타낸다.
"전사 제어 하에"는 기술분야에서 잘 이해된 용어이며 폴리뉴클레오타이드 서열, 보통 DNA 서열의 전사가 전사의 개시에 기여하거나, 또는 전사를 촉진하는 요소에 작동할 수 있게 연결되었는지에 따라 좌우되는 것을 가리킨다. "작동할 수 있게 연결된"은 폴리뉴클레오타이드가 세포에서 그것이 기능하는 것을 허용하는 방식으로 배열된 것을 의도한다. 한 측면으로, 본 발명은 하류 서열, 예컨대, HSV 병독성 유전자 또는 그것의 돌연변이체에 작동할 수 있게 연결된 프로모터를 제공한다.
용어 "암호화하는"은 폴리뉴클레오타이드에 적용될 때 그것의 천연 상태에서 또는 기술분야에 숙련된 사람들에게 잘 알려져 있는 방법에 의해 조작될 때 폴리펩타이드 및/또는 그것의 단편에 대한 mRNA를 생성하도록 전사 및/또는 번역될 수 있다면 폴리펩타이드를 "암호화하는" 것으로 말할 수 있는 폴리뉴클레오타이드를 나타낸다. 안티센스 가닥은 그러한 핵산의 보체이고, 암호화 서열은 그것으로부터 추론될 수 있다.
본원에서 사용되는 용어 "분리된"은 실질적으로 다른 물질이 없는 분자 또는 생물학적 물질 또는 세포 물질을 나타낸다.
본원에서 사용되는 바, 용어 "기능적"은 그것이 특별한, 특정 효과를 달성하도록 의도하기 위하여 임의의 분자, 생물학적, 또는 세포 물질을 변형하기 위해 사용될 수 있다.
본원에서 사용되는 바, 용어 "핵산 서열" 및 "폴리뉴클레오타이드"는 리보뉴클레오타이드 또는 데옥시리보뉴클레오타이드와 같은, 임의의 길이의 뉴클레오타이드의 중합체 형태를 나타내기 위해 상호교환적으로 사용된다. 그러므로, 이 용어는, 한정하는 것은 아니지만, 단일-, 이중-, 또는 다중-가닥 DNA 또는 RNA, 게놈 DNA, cDNA, DNA-RNA 하이브리드, 또는 퓨린 및 피리미딘 염기 또는 다른 자연적인, 화학적으로 또는 생화학적으로 변형된, 비-자연적인, 또는 유도체화된 뉴클레오타이드 염기를 포함하는, 또는 대안으로 본질적으로 그것으로 이루어지는, 또는 또한 추가로 그것으로 이루어지는 중합체를 포함한다.
용어 "야생형"은 자연적으로 발생하는 공급원으로부터 분리될 때의 유전자 또는 유전자 생성물의 특징을 가진 유전자 또는 유전자 생성물을 나타낸다. 일부 구체예에s, 야생형 유전자 또는 유전자 생성물은, 한 바이러스 스트레인의 경우라도, 약간 상이한 서열을 함유한다.
용어 "돌연변이체"는 야생형 유전자 또는 유전자 생성물 또는 다른 돌연변이체 스트레인(들)으로부터의 유전자 또는 유전자 생성물과 비교할 때 서열의 변형 및 또는 기능적 특징 (즉, 변경된 특징)을 나타내는 유전자 또는 유전자 생성물을 나타낸다. 한 구체예에서, 다른 돌연변이체 스트레인은 17TermA 또는 rR450 스트레인을 포함한다.
용어 "돌연변이"는 야생형 또는 다른 돌연변이체 스트레인(들)으로부터의 DNA 서열 변이를 나타낸다. 돌연변이는 유기체에서 기능 특성을 생성하거나 생성하지 않는다. 한정하는 것은 아니지만, 삽입, 결실, 절단, 프레임시프트, 치환, 또는 점 돌연변이를 포함한, 다양한 유형의 돌연변이가 있다.
용어 "점 돌연변이"는 유전자 물질, DNA 또는 RNA의 단일 뉴클레오타이드 염기 변경, 삽입, 또는 결실을 갖는 돌연변이를 나타낸다.
"결실"은 염색체의 일부 또는 DNA 서열이 결손된 돌연변이를 나타낸다.
"프레임시프트"는 3으로 나눌 수 없는 DNA 서열에서 많은 뉴클레오타이드의 indel (삽입 또는 결실)에 의해 유발된 돌연변이를 나타낸다.
"치환"은 유전자의 하나 또는 몇 개의 뉴클레오타이드의 치환을 가진 돌연변이를 나타낸다.
"절단"은 구조 유전자의 단백질 가수분해 또는 조작, 또는 넌센스 돌연변이의 결과로서 구조 유전자에서의 종결 코돈의 존재로 인해 단백질 신장의 조기 종결에 의해 단백질의 N- 또는 C-말단 부분이 제거된 돌연변이를 나타낸다.
일부 구체예에서, 돌연변이는 비동의적인 돌연변이이다. 용어 "비동의적 돌연변이"는 아미노산 서열을 변경시키지 않는 동의적 돌연변이와는 반대로, 단백질의 아미노산 서열을 변경시키는 돌연변이를 나타낸다.
본원에서 사용되는 용어 "프로모터"는 코딩 서열, 예컨대 유전자의 발현을 조절하는 임의의 서열을 나타낸다. 프로모터는, 예를 들어 구성성, 유도성, 억제성, 또는 조직-특이적일 수 있다. "프로모터"는 전사의 개시 및 속도가 제어되는 폴리뉴클레오타이드 서열의 영역인 제어 서열이다. 그것은 RNA 중합효소 및 다른 전사 인자와 같이, 조절 단백질 및 분자가 결합할 수 있는 유전자 요소를 함유할 수 있다. 비제한적인 예시의 프로모터로는 라우스 육종 바이러스 (RSV) LTR 프로모터 (선택적으로 RSV 인핸서를 포함함), 사이토메갈로바이러스 (CMV) 프로모터, SV40 프로모터, 다이하이드로폴레이트 환원효소 프로모터, β-액틴 프로모터, 포스포글리세롤 키나제 (PGK) 프로모터, U6 프로모터, 또는 EF1 프로모터를 들 수 있다. 일부 구체예에서, 프로모터는 닭의 β-액틴 ("CBA") 프로모터이다.
한정하는 것은 아니지만 CMV, EF1a, SV40, PGK1 (인간 또는 마우스), P5, Ubc, 인간 베타 액틴, CAG, TRE, UAS, Ac5, 폴리헤드린, CaMKIIa, Gal1, TEF1, GDS, ADH1, CaMV35S, Ubi, H1, U6, 및 알파-1-항트립신을 포함한, 특정 표적 특이성을 가진, 추가적인 비제한적인 예시의 프로모터가 하기에 제공된다. 합성에 의해 유래된 프로모터가 편재성 또는 조직 특이적 발현을 위해 사용될 수 있다. 추가로, 몇개가 상기에서 주지된 바이러스-유래 프로모터, 예컨대, CMV, HIV, 아데노바이러스, 및 AAV 프로모터가 본원에서 개시된 방법에 유용할 수 있다. 일부 구체예에서, 프로모터는 전사 효율을 증가시키기 위해 인핸서에 결합될 수 있다.
인핸서는 표적 서열의 발현을 증가시키는 조절 요소이다. "프로모터/인핸서"는 프로모터 및 인핸서 모두의 기능을제공할 수 있는 서열을 함유하는 폴리뉴클레오타이드이다. 예를 들어, 레트로바이러스의 긴 말단 반복부는 프로모터 및 인핸서 둘 다의 기능을 함유한다. 인핸서/프로모터는 "내인성" 또는 "외인성" 또는 "이종성"일 수 있다. "내인성" 인핸서/프로모터는 게놈의 주어진 유전자와 자연적으로 연결된 것이다. "외인성" 또는 "이종성" 인핸서/프로모터는 유전자 조작 (즉, 분자 생물학 기법)에 의해 유전자의 전사가 연결된 인핸서/프로모터에 의해 지시되도록 그 유전자에 나란한 위치에 배치되는 것이다.
본원에서 사용되는 용어 "종양-특이적 프로모터 또는 조직-특이적 프로모터"는 프로모터의 제어 하에 있는 유전자의 발현을, 특히 원하는 종양 세포 또는 조직에서 허용하는 프로모터를 의미한다. 발명에서 사용될 수 있는 조직-특이적 프로모터의 비제한적인 예로는 전립선-특이적 항원 (PSA) 프로모터, 전립선-특이적 막 항원 (PSMA) 프로모터, 카세인 프로모터, IgG 프로모터, 융모막 배아 항원 프로모터, 엘라스타제 프로모터, 포르포빌리노겐 탈아미노효소 프로모터, 인슐린 프로모터, 성장 호르몬 인자 프로모터, 아세틸콜린 수용체 프로모터, 알코올 탈수소효소 프로모터, 및 α 또는 β 글로빈 프로모터를 들 수 있다.
본 발명에서 사용될 종양-특이적 프로모터의 비제한적인 예로는 텔로머라제 역전사효소 프로모터, 신경교 섬유질 산성 단백질 프로모터, E2F 프로모터; 서바이빈 프로모터, COX-2 프로모터, EGD-2 프로모터; ELF-1 프로모터; 저산소증-특이적 프로모터; 암종배아 항원 프로모터, 및 스트로멜리신 3 프로모터를 들 수 있다.
용어 "냉동보존제"는 하나 이상의 조직, 바이러스, 또는 다른 생물학적 작용제를 손상되거나 위태롭게 되는 것으로부터 보호할 수 있는 화합물 또는 물질을 나타낸다. 냉동보존제의 예로는, 한정하는 것은 아니지만, 콘드로이틴 설페이트, 글리코사미노글리칸 다이메틸설폭사이다, 세포 침투 유기 용질, 다당류, 글리세롤, 둘베코 최소 필수 배지 (DMEM), 글루타민, D-글루코스, 피루브산 나트륨, 소 태아 혈청, 파파베린, DMSO, 글리세롤, 트레할로스, KH2PO4, K2HPO4, KCl, 만니톨, NaHCO3, 아스코르브산 나트륨, 1,2-프로판다이올, 포름아미드, 2,3-부탄다이올, 프로부콜, 커큐민 및 이것들의 혼합물을 들 수 있다.
용어 "단백질", "펩타이드" 및 "폴리펩타이드"는 아미노산, 아미노산 유사체 또는 펩타이드 모방물의 둘 이상의 하위단위로 된 화합물을 나타내기 위하여 상호교환적으로 및 가장 광범위한 의미로 사용된다. 하위단위는 펩타이드 결합에 의해 연결될 수 있다. 또 다른 측면으로, 하위단위는 다른 결합, 예컨대, 에스테르, 에테르, 등에 의해 연결될 수 있다. 단백질 또는 펩타이드는 적어도 2개의 아미노산을 함유하여야 하고 단백질 또는 펩타이드 서열을 포함할 수 있거나, 또는 대안으로 본질적으로 그것으로 이루어질 수 있거나, 또는 또한 추가로 그것을 포함하거나, 또는 대안으로 본질적으로 그것으로 이루어지거나, 또는 또한 추가로 그것으로 이루어지는 아미노산의 최대 수에 대해 제한은 없다. 본원에서 사용되는 용어 "아미노산"은 글리신 및 D 및 L 광학 이성질체, 아미노산 유사체 및 펩타이드 모방물을 포함한, 자연적인 및/또는 비자연적인 또는 합성 아미노산을 나타낸다.
본원에서 사용되는 바, 용어 "벡터"는 세포 내에서, 예를 들어 형질전환 과정에 의해 놓이게 되었을 때 복제될 수 있도록 온전한 레플리콘을 포함하는, 또는 대안으로 본질적으로 그것으로 이루어지는, 또는 또한 추가로 그것으로 이루어지는 비-염색체 핵산을 나타낸다. 벡터는 바이러스 또는 비-바이러스일 수 있다. 바이러스 벡터로는 레트로바이러스, 아데노바이러스, 단순 헤르페스 바이러스 ("HSV"), 배큘로바이러스, 변형된 배큘로바이러스, 파포바이러스, 또는 그렇지 않으면 변형된 자연적으로 발생하는 바이러스를 들 수 있다. 핵산을 전달하기 위한 예시의 비-바이러스 벡터로는 네이키드 DNA; 단독으로 또는 양이온성 중합체와 조합하여 복합체를 형성한 DNA; 음이온성 및 양이온성 리포솜; 이종성 폴리리신, 규정된 길이의 올리고펩타이드, 및 폴리에틸렌 이민과 같은 양이온성 중합체로 축합된, 일부 경우에는 리포솜에 함유된 DNA를 포함하는, 또는 대안으로 본질적으로 그것으로 이루어지는, 또는 또한 추가로 그것으로 이루어지는 DNA-단백질 복합체 및 입자; 및 바이러스 및 폴리리신-DNA를 포함하는, 또는 대안으로 본질적으로 그것으로 이루어지는, 또는 또한 추가로 그것으로 이루어지는 삼차 복합체의 사용을 들 수 있다.
"바이러스 벡터"는 생체내에서, 생체외에서 또는 시험관내에서, 숙주 세포에 전달될 폴리뉴클레오타이드를 포함하거나, 대안으로 본질적으로 그것으로 이루어지거나, 또는 또한 추가로 그것으로 이루어지는, 재조합에 의해 생성된 바이러스 또는 바이러스 입자로서 정의된다. 바이러스 벡터의 예로는 레트로바이러스 벡터, HSV 벡터, AAV 벡터, 렌티바이러스 벡터, 아데노바이러스 벡터, 알파바이러스 벡터 등을 들 수 있다. 알파바이러스 벡터, 예컨대 셈리키 포레스트(Semliki Forest) 바이러스-기반 벡터 및 신드비스(Sindbis) 바이러스-기반 벡터는 또한 유전자 요법 및 면역요법에 사용하기 위해 개발되었다. 참고, Schlesinger and Dubensky (1999) Curr. Opin. Biotechnol. 5:434-439 및 Ying, et al. (1999) Nat. Med. 5(7):823-827.
또 다른 구체예에서, HSV 병독성 단백질 (예컨대, 야생형 또는 돌연변이체)의 발현은 유도성 프로모터인 프로모터에 의해 조절된다. 관련된 특정 구체예에서, 프로모터는 유도성 테트라사이클린 프로모터이다. Tet-Off 및 Tet-On 유전자 발현 시스템은 연구자가 Tet-오프 및 Tet-온으로 기술되는 규제된, 고수준의 유전자 발현 시스템에 쉽게 접근할 수 있게 한다. Tet-오프 시스템에서, 유전자 발현은 테트라사이클린 (Tc) 또는 독시사이클린 (Dox; Tc 유도체)이 배양 배지로부터 제거될 때 켜진다. 대조적으로, 발현은 Tet-온 시스템에서 Dox의 첨가에 의해 켜진다. 두 시스템 모두 유전자 발현이 Tc 또는 Dox의 다양한 농도에 대한 반응으로 엄격하게 규제되는 것을 허용한다. Tet 시스템에서 최대 발현 수준은 매우 높고 CMV와 같은 강력한, 구성성 포유류 프로모터로부터 얻을 수 있는 최대 수준과 유리하게 비교된다. 다른 유도성 포유류 발현 시스템과 달리, Tet 시스템에서의 유전자 조절은 매우 특이적이고, 따라서 결과의 해석은 다면발현 효과(pleiotropic effects) 또는 비특이적 유도에 의해 복잡해지지 않는다. 대장균에서, Tet 억제자 단백질 (TetR)은 Tn10 트랜스포존 상의 테트라사이클린-내성 오페론의 유전자를 부정적으로 조절한다. TetR은 Tc의 부재 하에 오퍼레이터 서열 (tetO)에 결합함으로써 이들 유전자의 전사를 차단한다. TetR 및 tetO는 포유류 실험 시스템에서 사용하기 위한 조절 및 유도의 기초를 제공한다. Tet-온 시스템에서, 조절 단백질은 TetR의 4개의 아미노산 변화에 의해 생성된 "역" Tet 억제자 (rTetR)를 토대로 한다 (Hillen & Berens, Mechanisms underlying expression of Tn10 encoded tetracycline resistance. Annu Rev Microbiol. 1994;48:345-69; Gossen et al., Transcriptional activation by tetracyclines in mammalian cells. Science. 1995 Jun 23;268(5218):1766-9). 결과로 얻어진 단백질인 rtTA (테트라사이클린 활성자 단백질로도 언급되는 역 tTA)는 pTet-온 조절자 플라스미드에 의해 암호화된다.
관련된 구체예에서, 벡터는 테트라사이클린 활성자 단백질을 암호화하는 핵산; 및 테트라사이클린 활성자 단백질의 발현을 조절하는 프로모터를 추가로 포함하거나, 또는 대안으로 본질적으로 그것으로 이루어지거나, 또는 또한 추가로 그것으로 이루어진다.
본원에서 기술된 벡터, 분리된 세포, 바이러스 포장 시스템, 및 방법에 유용한 다른 유도성 시스템은 엑디손에 의한, 에스트로겐, 프로게스테론, 다이머화의 화학적 유도자, 및 아이소프로필-베타-D1-티오갈락토피라노시드 (IPTG)에 의한 조절을 포함한다.
본원에서 사용되는 바, 용어 "재조합 발현 시스템" 또는 "재조합 벡터"는 재조합에 의해 형성된 특정 유전자 물질의 발현을 위한 유전자 구성물 또는 구성물들을 나타낸다.
"유전자 전달 비히클"은 삽입된 폴리뉴클레오타이드를 숙주 세포에 운반할 수 있는 임의의 분자로서 정의된다. 유전자 전달 비히클의 예는 리포솜, 천연 중합체 및 합성 중합체를 포함한, 미셸 생체부합성 중합체; 리포단백질; 폴리펩타이드; 다당류; 리포다당류; 인공 바이러스 엔벨로프; 금속 입자; 및 박테리아, 또는 바이러스, 예컨대 배큘로바이러스, 아데노바이러스 및 레트로바이러스, 박테리오파지, 코스미드, 플라스미드, 진균 벡터 및 광범위한 진핵 및 원색 숙주에서의 발현에 대해 기술되었던, 기술분야에서 전형적으로 사용되고, 유전자 요법뿐만 아니라 간단한 단백질 발현을 위해 사용될 수 있는 다른 재조합 비히클이다.
본원에서 개시되는 폴리뉴클레오타이드는 유전자 전달 비히클을 사용하여 세포 또는 조직으로 전달될 수 있다. 본원에서 사용되는 바, "유전자 전달", "유전자 이송", "형질도입", 등은 도입에 사용된 방법과 관계 없이, 외인성 폴리뉴클레오타이드 (때때로 "도입유전자"로서 언급됨)의 숙주 세포로의 도입을 언급하는 용어이다. 그러한 방법으로는 벡터-매개 유전자 전달 (예컨대, 바이러스 감염/트랜스펙센, 또는 다양한 다른 단백질-기반 또는 지질-기반 유전자 전달 복합체에 의한)과 같은 다양한 잘 알려져 있는 기법뿐만 아니라 "네이키드" 폴리뉴클레오타이드의 전달을 용이하게 하는 기법 (예컨대 전기천공법, "유전자 총" 전달 및 폴리뉴클레오타이드의 도입에 사용된 다양한 다른 기법)을 들 수 있다. 도입된 폴리뉴클레오타이드는 숙주 세포에서 안정적으로 또는 일시적으로 유지될 수 있다. 안정적인 유지는 전형적으로 도입된 폴리뉴클레오타이드가 숙주 세포와 부합하는 복제 기원을 함유하거나 또는 염색체외 레플리콘 (예컨대, 플라스미드) 또는 핵 또는 미토콘드리아 염색체와 같은 숙주 세포의 레플리콘으로 통합될 것을 필요로 한다. 기술분야에 알려져 있고 본원에서 기술된 것과 같이, 많은 벡터가 유전자의 포유류 세포로의 전달을 매개할 수 있는 것으로 알려져 있다.
"플라스미드"는 염색체 DNA와 독립적으로 복제할 수 있는, 염색체 DNA와 별개의 염색체외 DNA 분자이다. 많은 경우에, 그것은 원형이고 이중 가닥이다. 플라스미드는 미생물 집단 내에서 수평적인 유전자 전달을 위한 메커니즘을 제공하고 전형적으로 주어진 환경 상태 하에서 선택적인 장점을 제공한다. 플라스미드는 경쟁적인 환경 틈새에서 자연적으로 발생하는 항생물질에 대한 내성을 제공하는 유전자를 운반하거나, 또는 대안으로 생성된 단백질은 유사한 환경 하에서 독소로서 작용할 수 있다.
유전자 공학에서 사용되는 "플라스미드"는 "플라스미드 벡터"로 불린다. 많은 플라스미드가 그러한 사용을 위해 상업적으로 이용 가능하다. 복제될 유전자는 특정 항생물질에 대해 세포를 내성으로 만드는 유전자 및 여러 개의 일반적으로 사용되는 제한 부위를 함유하여 이 위치에서 DNA 단편의 용이한 삽입을 허용하는 짧은 영역인 다중 클로닝 부위 (MCS, 또는 폴리링커)를 함유한 플라스미드의 복사물에 삽입된다. 플라스미드의 또 다른 주요 용도는 다량의 단백질을 만드는 것이다. 이 경우에, 연구자들은 관심의 유전자를 은닉하는 플라스미드를 함유한 박테리아를 성장시킨다. 박테리아가 그것의 항생물질 내성을 부여하기 위해 단백질을 생성하는 것과 같이, 또한 삽입된 유전자로부터 다량의 단백질을 생성하도록 유도될 수 있다.
본원에서 사용되는 용어 "단순 헤르페스 바이러스" 또는 "HSV"는 본 발명의 효과를 생성하는 단순 헤르페스 바이러스를 의미하며, 야생형 또는 돌연변이체 단순 헤르페스 바이러스를 포함한다. 한 구체예에서, 돌연변이체 비-자연적인 HSV는 야생형 HSV의 임의의 유전자를 돌연변이시키거나 변형시킴으로써 또는 임의의 외인성 유전자를 삽입함으로써 얻어진다. HSV의 혈청 형태는 타입 1 HSV (또는 HSV-1) 또는 타입 2 HSV (또는 HSV-2)를 포함하거나, 대안으로 본질적으로 그것으로 이루어지거나, 또는 또한 추가로 그것으로 이루어진다. HSV-1은 엔벨로프를 가진, 이중 가닥 DNA 바이러스이다. 한 구체예에서, HSV-1은 인간 세포를 감염시킬 수 있다. 또 다른 구체예에서, 서열, 유전자 또는 다중 유전자는 HSV-1에 통합될 수 있다. 통합된 서열의 크기는 대략 1개 염기, 5개 염기, 10개 염기, 100개 염기, 1 kb, 10 kb, 100 kb, 또는 150 kb일 수 있다. HSV-1은 상대적으로 낮은 감염 다중도 (MOI)에서 세포 용해를 유도할 수 있고, 그것의 증식은 항바이러스 약물에 의해 억제될 수 있다. 한 구체예에서, HSV 바이러스 DNA는 숙주 세포의 게놈에 통합되지 않은 채로 염색체 외부에서 유지된다. HSV-1은 다양한 스트레인 (예컨대, KOS 및 McKrae)을 포함할 수 있다. 참고, Wang et al., (2013) Virus Res. 173(2):436-440. 한 구체예에서, HSV-1은 HSV-1 KOS 스트레인이다. 또 다른 구체예에서, HSV-1은 HSV-1 McKrae 스트레인이다.
여러 HSV 돌연변이체, 예를 들어, 17TermA HSV 및 rRp450 HSV가 있다. 용어 "17TermA HSV"는 전체 ICP34.5 유전자를 포함하지만, 코딩 영역의 100 bp 앞에 종결 코돈을 가지고 있어서, 결과적으로 단백질 발현의 초기 종결 및 30개 아미노산 절단된 단백질의 발현을 초래하는 돌연변이체 HSV-1 바이러스를 나타낸다. 17TermA HSV 돌연변이체는 절단된 ICP34.5 단백질로 인해 성장 결함을 나타낸다. 참고, Orvedahl et al., (2007) Cell Host & Microbe, 1:1, 23-25. 용어 "rRp450"은 바이러스-암호화된 리보뉴레오타이드 환원효소 또는 ICP6이 결핍된 감쇠된 단순 헤르페스 1 벡터를 나타낸다. 참고, Aghi M et al., (1999) Cancer Res., 59(16):3861-5.
HSV 게놈은, 한정하는 것은 아니지만 당단백질 E ("gE"), 감염된 세포 단백질 0 ("ICP0"), 감염된 세포 단백질 6 ("ICP6"), DNA 포장 터미나제 하위단위 1, 감염된 세포 단백질 8 ("ICP8"), 및 감염된 세포 단백질 34.5 ("ICP34.5")를 포함하는 다중 병독성 단백질을 암호화한다. 예시의 HSV1 게놈은 NCBI 참조 서열: NC_001806.2 (마지막 접속, 2020년 3월 13일)에서 찾아볼 수 있다.
용어 "gE-암호화 유전자"는 gE 단백질을 암호화하는 유전자 또는 그것의 DNA 단편을 나타낸다. 예시의 gE-암호화 유전자는 NCBI 참조 서열: NC_001806.2에서 HSV-1 게놈 서열의 위치 33-2555에서 확인될 수 있다. 용어 "ICP6 단백질"은 HSV 게놈에 의해 암호화된 감염된 세포 단백질 6을 나타낸다. ICP6은 리보뉴클레오타이드 환원효소 ("RR")의 하위단위이고 뉴클레오타이드 대사 및 비분할 세포에서 바이러스 DNA 합성에 대한 핵신 효소이다.
"기능장애" 단백질은 원래의 단백질의 기능이 손상되었거나 없는 단백질을 나타낸다. 한 구체예에서, 기능장애 단백질은 코딩 서열에서의 결실 또는 치환에 의해 유발된다. 예를 들어, 기능장애 ICP6 유전자가 있는, 결실되었거나 또는 비활성화된 HSV는 정상적인 비분할 세포에서 복제할 수 없다. 그러나, 증가된 RR 활성을 가진 능동적으로 분할하는 세포에서, 바이러스의 결핍된 효소 활성은 보상되어, 바이러스가 복제할 수 있게 한다. ICP 34.5의 DNA 및 아미노산 서열은 SEQ ID No: 1, 2, 및 5-10에 제공된다. gE의 DNA 및 아미노산 서열은 SEQ ID No: 12-19에 제공된다. ICP 0의 DNA 및 아미노산 서열은 SEQ ID No: 20-26에 제공된다. DNA 포장 터미나제 하위단위 1의 DNA 및 아미노산 서열은 SEQ ID No: 35-42에 제공된다. ICP 8의 DNA 및 아미노산 서열은 SEQ ID No: 27-34에 제공된다. ICP 6의 DNA 및 아미노산 서열은 SEQ ID No: 43-50에 제공된다.
용어 "ICP0-암호화 유전자"는 ICP0 단백질을 암호화하는 유전자 또는 그것의 DNA 단편을 나타낸다. ICP 0의 예시의 DNA 및 아미노산 서열은 SEQ ID No: 20-26에 제공된다. 용어 "DNA 포장 터미나제 하위단위 1-암호화 유전자"는 DNA 포장 터미나제 하위단위 1 단백질 또는 펩타이드를 암호화하는 유전자 또는 그것의 DNA 단편을 나타낸다. DNA 포장 터미나제 하위단위 1의 예시의 DNA 및 아미노산 서열은 SEQ ID No: 35-42에 제공된다. 용어 "ICP 8-암호화 유전자"는 ICP 8 단백질을 암호화하는 유전자 또는 그것의 DNA 단편을 나타낸다. ICP 8의 예시의 DNA 및 아미노산 서열은 SEQ ID No: 27-34에 제공된다. 용어 "ICP 34.5-암호화 유전자"는 ICP 34.5 단백질을 암호화하는 유전자 또는 그것의 DNA 단편을 나타낸다. ICP 34.5의 예시의 DNA 및 아미노산 서열은 SEQ ID No: 1, 2, 및 5-10에 제공된다. 용어 "당단백질 E ("gE")-암호화 유전자"는 gE 단백질을 암호화하는 유전자 또는 그것의 DNA 단편을 나타낸다. gE의 예시의 DNA 및 아미노산 서열은 SEQ ID No: 12-19에 제공된다.
용어 "유전자의 결실 또는 비활성화"는 유전자의 전체 또는 일부분의 결실 또는 일부 염기의 치환, 불필요한 서열의 변형, 삽입 등을 통한 유전자의 발현의 억제를 의미한다. HSV 유전자 (예컨대, gE, ICP0, 및 ICP8)의 결실 또는 비활성화는 기술분야에 숙련된 사람들에 의해 공지된 방법 또는 그것을 토대로 한 방법으로 수행될 수 있다. 예를 들어, 상동성 재조합을 사용하는 방법이 사용될 수 있다. 예를 들어, HSV 유전자의 일부분 및 HSV 유전자와 관련이 없는 서열을 함유하는 DNA 단편을 적합한 플라스미드 벡터에서 클로닝한 후 그것을 HSV에 도입하여 HSV 유전자의 일부 영역에서 상동성 재조합을 유발하함으로써 HSV 유전자를 분할하고 비활성화하는 것이 가능하다. 대안으로, HSV 유전자의 돌연변이 또는 결실은 바이러스 계대에서의 자발적인 돌연변이에 의해 유발될 수 있다.
유전자 전달이 DNA 바이러스 벡터, 예컨대 단순 헤르페스 바이러스에 의해 매개되는 측면에서, 벡터 구성물은 바이러스 게놈 또는 그것의 일부분, 및 도입유전자를 포함하는, 또는 대안으로 본질적으로 그것으로 이루어지는, 또는 또한 추가로 그것으로 이루어지는 폴리뉴클레오타이드를 나타낸다. 그러므로, 한 측면으로, 비-자연적인 HSV는 치료적 폴리뉴클레오타이드 또는 단백질을 코딩하는 도입유전자를 추가로 포함한다.
프로모터 및 폴리뉴클레오타이드가 작동 가능하게 연결될 수 있는 클로닝 부위 둘 다를 함유하는 벡터는 기술분야에 잘 알려져 있다. 그러한 벡터는 시험관내에서 또는 생체내에서 RNA를 전사할 수 있고, Agilent Technologies (Santa Clara, Calif.) 및 Promega Biotech (Madison, Wis.)와 같은 공급처로부터 상업적으로 이용할 수 있다. 발현 및/또는 시험관내 전사를 최적화하기 위하여, 전사 또는 번역 수준에서, 클론의 5' 및/또는 3' 미번역 부분을 제거, 첨가 또는 변경시켜서 잠재적인 부적절한 대체 번역 개시 코돈 또는 발현을 간섭하거나 감소시킬 수 있는 다른 서열을 제거하는 것이 필요할 수 있다. 대안으로, 공통 리보솜 결합 부위는 발현을 증강시키기 위해 출발 코돈의 바로 5'에 삽입될 수 있다.
유전자 전달 비히클은 또한 DNA/리포솜 복합체, 미셸 및 표적화된 바이러스 단백질-DNA 복합체를 포함한다. 또한 표적화 항체 또는 그것의 단편을 포함하는, 또는 대안으로 본질적으로 그것으로 이루어지는, 또는 또한 추가로 그것을 포함하는, 또는 대안으로 본질적으로 그것으로 이루어지는, 또는 또한 추가로 그것으로 이루어지는 리포솜이 본원에 개시된 방법에 사용될 수 있다. 폴리뉴클레오타이드의 세포 또는 세포 집단에의 전달 외에, 본원에서 기술된 단백질의 세포 또는 세포 집단에의 직접적인 도입은 비제한적인 단백질 트랜스펙션 기법에 의해 실시될 수 있고, 대안으로 발현을 증강시킬 수 있고 및/또는 본원에 개시된 단백질의 활성을 촉진할 수 있는 배양 조건이 다른 비제한적인 기법이다.
본원에서 사용되는 바, 용어 "신호 펩타이드" 또는 "신호 폴리펩타이드"는 새롭게 합성된 분비 또는 막 폴리펩타이드 또는 단백질의 N-말단부에 통상적으로 존재하는 아미노산 서열을 의도한다. 그것은 폴리펩타이드를 특정 세포 위치로, 예컨대 세포 막을 가로지르거나, 세포 막으로 들어가거나, 또는 핵으로 들어가도록 지시하는 작용을 한다. 일부 구체예에서, 신호 펩타이드는 국지화 후에 제거된다. 신호 펩타이드의 예는 기술분야에 잘 알려져 있다. 비제한적인 예는 미국 특허 제 8,853,381호, 제 5,958,736호, 및 제 8,795,965호에 기재된 것들이다.
한 측면으로, HSV는 검출 가능하게 표지화된다. 본원에서 사용되는 바, 용어 "표지"는 검출될 조성물에 직접적으로 또는 간접적으로 콘쥬게이션되는 직접 또는 간접적으로 검출 가능한 화합물 또는 조성물, 예컨대, "표지된" 조성물을 생성하기 위한 폴리뉴클레오타이드 또는 항체와 같은 단백질을 의도한다. 용어는 또한 삽입된 서열의 발현시 신호를 제공할 폴리뉴클레오타이드에 콘쥬게이션된 서열, 예컨대 녹색 형광 단백질 (GFP) 등을 포함한다. 표지는 자체적으로 검출 가능하거나 (예컨대, 방사성 동위원소 표지 또는 형광 표지) 또는, 효소 표지의 경우에, 검출 가능한 기질 화합물 또는 조성물의 화학적 변경을 촉매할 수 있다. 표지는 소규모 검출에 적합하거나 또는 고처리량 스크리닝에 더 적합할 수 있다. 그로써, 적합한 표지로는, 한정하는 것은 아니지만, 방사성 동위원소, 형광색소, 화학발광 화합물, 염료, 및 효소를 포함한 단백질을 들 수 있다. 표지는 간단하게 검출되거나, 또는 정량화될 수 있다. 간단하게 검출되는 반응은 일반적으로 단순하게 그것의 존재가 확인되는 반응을 포함하거나, 대안으로 본질적으로 그것으로 이루어지거나, 또는 또한 추가로 그것으로 이루어지는 반면, 정량화되는 반응은 일반적으로 강도, 편광, 및/또는 다른 특성과 같은 정량화 가능한 (예컨대, 수치로 기록할 수 있는) 값을 가지는 반응을 포함하거나, 대안으로 본질적으로 그것으로 이루어지거나, 또는 또한 추가로 그것으로 이루어진다. 발광 또는 형광 검정에서, 검출 가능한 반응은 결합에 실제로 관여하는 검정 구성요소와 회합된 발광단 또는 형광단을 사용하여 직접적으로 생성되거나, 또는 또 다른 (예컨대, 리포터 또는 지표) 구성요소와 회합된 발광단 또는 형광단을 사용하여 간접적으로 생성될 수 있다.
신호를 생성하는 발광 표지의 예로는, 한정하는 것은 아니지만, 생물발광 및 화학발광을 들 수 있다. 검출 가능한 발광 반응은 일반적으로 발광 신호의 변화, 또는 발생을 포함하거나, 대안으로 본질적으로 그것으로 이루어지거나, 또는 또한 추가로 그것으로 이루어진다. 검정 구성요소를 발광 표지화하기 위한 적합한 방법 및 발광단은 기술분야에 알려져 있고 예를 들어 Haugland, Richard P. (1996) Handbook of Fluorescent Probes and Research Chemicals (6th ed.)에 기재되어 있다. 발광 프로브의 예로는, 한정하는 것은 아니지만 에쿼린 및 루시페라제를 들 수 있다.
적합한 형광 표지의 예로는, 한정하는 것은 아니지만, 플루오레세인, 로다민, 테트라메틸로다민, 에오신, 에리트로신, 쿠마린, 메틸쿠마린, 피렌, 말라카이트 그린, 스틸벤, 루시퍼 옐로우, 카스케이트 블루.TM.M 및 텍사스 레드를 들 수 있다. 다른 적합한 광학 염료는 Haugland, Richard P. (1996) Handbook of Fluorescent Probes and Research Chemicals (6th ed.)에 기재되어 있다.
또 다른 측면으로, 형광 표지는 세포 표면 마커와 같이, 세포 또는 조직에 또는 그것의 표면 상에 존재하는 세포 구성요소에 대한 공유 부착을 용이하게 하기 위해 기능화된다. 적합한 작용기로는, 한정하는 것은 아니지만, 이오시아네이트 기, 아미노 기, 할로아세틸 기, 말레이미드, 석신이미딜 에스테르, 및 설포닐 할로겐화물을 들 수 있고, 그것들은 모두 형광 표지를 제2 분자에 부착시키기 위해 사용될 수 있다. 형광 표지의 작용기의 선택은 링커, 작용제, 마커, 또는 제2 표지화제에 대한 부착 부위에 따라 달라진다.
형광 표지의 부착은 세포 구성요소 또는 화합물에 직접적으로 이루어지거나, 또는 대안으로 링커를 통해 이루어질 수 있다. 형광 표지를 중간체에 간접적으로 연결시키는 데 사용하기 위한 적합한 결합 쌍으로는, 한정하는 것은 아니지만, 항원/항체, 예컨대 로다민/항-로다민, 비오틴/아비딘 및 비오틴/스트렙타비딘을 들 수 있다.
구절 "고체 지지체"는 "배양 플레이트", "유전자 칩" 또는 "마이크로어레이"와 같은 비수성 표면을 나타낸다. 그러한 유전자 칩 또는 마이크로어레이는 기술분야에 숙련된 사람에게 알려져 있는 많은 기법에 의해 진단 및 치료 목적에 대해 사용될 수 있다. 한 기법에서, 미국 특허 제 6,025,136호 및 제 6,018,041호에서 개관된 것과 같이, 혼성화 접근법에 의해 DNA 서열을 측정하기 위해 올리고뉴클레오타이드가 부착되고 유전자 칩 상에 배열된다. 본 발명의 폴리뉴클레오타이드는 프로브로 변형될 수 있고, 그것은 계속해서 유전자 서열의 검출에 사용될 수 있다. 그러한 기법은, 예를 들어, 미국 특허 제 5,968,740호 및 제 5,858,659호에 기재되어 있다. 프로브는 또한 Kayem 등의 미국 특허 제 5,952,172호 및 Kelley et al. (1999) Nucleic Acids Res. 27:4830-4837에 의해 기재되어 있는 것과 같이 핵산 서열의 정전기적 검출을 위해 전극 표면에 부착되거나 고정될 수 있다.
"조성물"은 활성 폴리펩타이드, 폴리뉴클레오타이드 또는 항체와 또 다른 화합물 또는 조성물, 삽입물 (예컨대, 검출 가능한 표지) 또는 활성 (예컨대, 유전자 전달 비히클)의 조합을 의미하는 것으로 의도된다.
"제약학적 조성물"은 활성 폴리펩타이드, 폴리뉴클레오타이드 또는 항체와 시험관내에서, 생체내에서 또는 생체외에서 조성물을 진단 또는 치료 용도에 적합하게 만드는 담체, 고체 지지치와 같은 비활성 또는 활성과의 조합을 포함하는 것으로 의도된다.
본원에서 사용되는 바, 용어 "제약학적으로 허용되는 담체"는 임의의 표준 제약학적 담체, 예컨대 인산염 완충 식염수 용액, 물, 및 에멀션, 예컨대 오일/물 또는 물/오일 에멀션, 및 다양한 유형의 습윤제를 포함한다. 조성물은 또한 안정화제 및 보존제를 포함할 수 있다. 담체, 안정화제 및 보조제의 예에 대해서는 Martin (1975) Remington's Pharm. Sci., 15th Ed. (Mack Publ. Co., Easton)을 참고한다.
진단 또는 치료의 "대상체"는 세포 또는 포유류와 같은 동물, 또는 인간이다. 대상체는 특정 종에 제한되지 않으며 진단 또는 치료에 대해 비-인간 동물 대상체를 포함하고 감염의 대상체인 것이거나 또는 동물 모델, 예를 들어, 유인원, 쥐과, 예컨대 래트, 마우스, 친칠라, 개과, 예컨대 개, 고양이, 토끼과, 예컨대 토끼, 가축, 스포츠 동물, 및 애완동물이다. 인간 환자 역시 용어에 포함된다.
용어 "조직"은 본원에서 살아있거나 죽은 유기체의 조직 또는 살아있거나 죽은 유기체로부터 유래되거나 모방하도록 설계된 임의의 조직을 나타내기 위해 사용된다. 조직은 건강하거나, 병들었거나, 및/또는 유전자 돌연변이를 가질 수 있다. 생물학적 조직은 임의의 단일 조직 (예컨대, 상호연결될 수 있는 세포의 집단) 또는 유기체의 장기 또는 신체의 일부 또는 영역을 구성하는 조직 그룹을 포함할 수 있다. 조직은 균질한 세포 물질을 포함할 수 있거나, 또는 대안으로 본질적으로 그것으로 이루어질 수 있거나, 또는 또한 추가로 그것을 포함하거나, 또는 대안으로 본질적으로 그것으로 이루어질 수 있거나, 또는 또한 추가로 그것으로 이루어지거나 또는 예를 들어 폐 조직, 골격 조직, 및/또는 근육 조직을 포함할 수 있는 흉부를 포함한 신체의 영역에서 찾을 수 있는 것과 같은 복합 구조일 수 있다. 예시의 조직으로는, 한정하는 것은 아니지만, 간, 폐, 갑상선, 피부, 췌장, 혈관, 방광, 신장, 뇌, 담도, 십이지장, 복부 대동맥, 장골 정맥, 심장 및 장, 및 이것들의 임의의 조합을 들 수 있다.
본원에서 사용되는 바, 대상체에서 질환의 "치료하는" 또는 "치료"는 (1) 질환의 소인이 있거나 아직 질환의 증상을 나타내지 않은 대상체에서 증상 또는 질환이 발생하는 것을 방지하는 것; (2) 질환을 억제하거나 그것의 발달을 저지하는 것; 또는 (3) 질환 또는 질환의 증상을 개선하거나 퇴행을 유발하는 것을 나타낸다. 기술분야에서 이해되는 것과 같이, "치료"는 임상 결과를 포함한, 유익한 또는 원하는 결과를 얻기 위한 접근법이다. 본 기법의 목적에 대해, 유익한 또는 원하는 결과는, 한정하는 것은 아니지만, 검출 가능하거나 검출할 수 없거나간에, 하나 이상의 증상의 완화 또는 개선, 병태 (질환을 포함함)의 정도의 감소, 병태 (질환을 포함함)의 안정화된 (즉, 악화되지 않은) 상태, 병태 (질환을 포함함)의 지체 또는 둔화, 병태 (질환을 포함함)의 진행, 개선 또는 경감, 상태 및 차도 (부분적이거나 전체적이거나) 중 하나 이상을 들 수 있다.
본원에서 사용되는 용어 "유효량"은 원하는 효과를 이루기에 충분한 양을 의미하는 것을 의도한다. 치료적 또는 예방적 적용의 맥락에서, 유효량은 문제되는 병태의 유형 및 중증도 및 개별 대상체의 특징, 예컨대 일반적인 건강, 연령, 성별, 체중, 및 제약학적 조성물에 대한 내성에 따라 달라질 것이다. 유전자 요법의 맥락에서, 일부 구체예에서 유효량은 대상체에서 결핍된 유전자의 부분적인 또는 완전한 기능을 회복하는 결과를 초래하기에 충분한 양이다. 한 측면으로, 유효량은 그 사이의 범위에서 세포당 0.001 내지 1개의 감염성 바이러스 입자의 감염 다중도 (MOI)를 제공하는 양이다. 비제한적인 예에는 세포당 적어도 0.001, 또는 적어도 0.01, 또는 적어도 0.1 또는 적어도 1, 또는 0.01 내지 1, 또는 0.1 내지 1, 또는 약 0.01 내지 0.1, 또는 1 미만, 또는 0.1 미만, 또는 0.01 미만의 감염성 바이러스 입자의 감염 다중도 (MOI)가 포함될 수 있다. 다른 구체예에서, HSV 바이러스 입자의 유효량은 대상체에서 세포 용해를 초래하기에 충분한 양이다. 일부 구체예에서, 유효량은 그것을 필요로 하는 대상체에서 갈락토스 대사를 증가시키기 위해 필요한 양이다. 숙련된 전문가는 이들 및 다른 요인에 따라 적절한 양을 측정할 수 있을 것이다.
일부 구체예에서 유효량은 문제의 적용의 크기 및 성질에 따라 달라질 것이다. 또한 그것은 표적 대상체의 성질 및 민감성 및 사용되는 방법에 따라 달라질 것이다. 숙련된 전문가는 이들 및 다른 고려사항을 토대로 유효량을 측정할 수 있을 것이다. 유효량은 구체예에 따라 조성물의 하나 이상의 투여를 포함할 수 있거나, 또는 대안으로 본질적으로 그것으로 이루어질 수 있거나, 또는 또한 추가로 그것을 포함하거나, 또는 대안으로 본질적으로 그것으로 이루어지거나, 또는 또한 추가로 그것으로 이루어진다.
본원에서 사용되는 바, 용어 "투여하다" 또는 "투여"는 동물 또는 인간과 같은 대상체에 물질을 전달하는 것을 의미하는 것을 의도한다. 투여는 전체 치료 과정을 통해 한 용량으로, 연속적으로 또는 간헐적으로, 예컨대 종양내로 또는 정맥내로 이루어질 수 있다. 가장 효과적인 투여 수단 및 투여량을 측정하는 방법은 기술분야에 숙련된 사람들에게 알려져 있고 치료법에 사용된 조성물, 치료법의 목적, 뿐만 아니라, 치료되는 대상체의 연령, 건강 또는 성별에 따라 달라질 것이다. 치료하는 의사 또는 애완동물 및 동물의 경우에 치료하는 수의사에 의해 선택되는 용량 수준 및 패턴으로 단일 또는 다중 투여가 수행될 수 있다. 적합한 투여 제형 및 작용제를 투여하는 방법이 기술분야에 알려져 있다. 투여 경로는 또한 결정될 수 있고 가장 효과적인 투여 경로를 결정하는 방법은 기술분야에 숙련된 사람들에게 알려져 있으며 치료를 위해 사용된 조성물, 치료 목적, 치료되는 대상체의 건강 상태 또는 질환 단계 및 표적 세포 또는 조직에 따라 달라질 것이다. 투여 경로의 비제한적인 예로는 직접 및 전신적인, 예컨대, 정맥내, 동맥내, 근육내, 심장내, 경막내, 뇌실하, 경막외, 뇌내, 종양내, 두개내, 뇌실내, 망막하, 유리체내, 관절내, 안내, 복강내, 자궁내, 피내, 피하, 경피, 경점막, 및 흡입 경로를 들 수 있다.
종양용해성 단순 헤르페스 바이러스 (oHSV)
종양에 대한 oHSV의 효능은 직접적인 세포 사멸 (용해 단계) 및 항암 면역의 증강 (면역 단계)으로부터 유래된다. 이들 바이러스는 암 세포를 선택적으로 표적화하는 다양한 방법으로 구성되었다. 암 선택성을 이루기 위하여, 가장 일반적인 돌연변이는 신경병독성 유전자, γ134.5/RL1의 결실이다. γ134.5/RL1에 의해 암호화된 ICP34.5의 발현은 HSV-1이, 바이러스 감염에 대한 반응으로 e-IF2α를 정상적으로 인산화하고 단백질 번역을 중단하는 숙주 세포 항-바이러스 단백질 키나제 RNA-활성화된 (PKR)-경로에 대항하는 데 필수적이다. ICP34.5는 세포의 단백질 포스파타제-1 (PP1)이 e-IF2α를 탈인산화하여 생산적인 바이러스 복제를 허용하도록 재지시한다. 많은 암 세포가 PKR 반응이 결핍되어 있고, 그러므로 γ134.5-무효 돌연변이체를 포함하는 HSV 벡터의 복제를 지지한다. 일부 벡터는 리보뉴클레오타이드 환원효소 (RR, 이것의 큰 하위단위는 ICP6/UL39 유전자에 의해 암호화됨)와 같은 중요한 대사 바이러스 유전자를 돌연변이시킴으로써 구성된다. 많은 악성 세포가 RR의 증가된 발현 및 활성을 가지기 때문에, ICP6-무효 돌연변이체는 존재하는 큰 리보뉴클레오타이드 풀로 인해 고도로 증식하는 암 세포에서 선택적으로 복제한다.
HSV 진입, 세포-세포 확산 및 융합체 형성
HSV-1의 진입은 세포 표면 분자와 바이러스 당단백질의 여러 단계의 상호작용을 포함한다. 먼저, 당단백질 B 및 C (gB 및 gC)가 세포 헤파란 설페이트 프로테오글리칸에 부착된 후 gD가 바이러스 진입 수용체 (즉, 넥틴-1, 헤르페스바이러스 진입 매개체 (HVEM), 또는 3-O-황화된 헤파란 설페이트 (3-OS-HS))에 결합된다. 과정은 추가로 gH/gL이 gB와 상호작용하여 바이러스 엔벨로프가 표적 세포 막에 융합되는 것을 허용하여, 비리온 캡시드 및 외피 단백질의 세포 안으로의 방출을 초래한다. 여러 보고서가 막 융합이 또한 인접한 세포 사이에서 바이러스의 후속적인 측면 확산에 중요한 것을 시사한다. 바이러스 세포-세포 확산은 바이러스가 감염된 세포로부터 인접한 미감염 세포로 세포 접촉 면을 통해 확산될 때 일어나며, 이것은 바이러스 중화 항체의 존재 하에서도 일어날 수 있다. gE/gI의 존재는 세포-세포 확산을 증강시키는 반면, gE 정상 하위대립인자(hypomorph) 돌연변이체는 세포-세포 융합 및 플라크 크기를 감소시킨다. 융합체는 다중 인접 세포가 함께 다중핵화된 거대 세포로 융합하는 결과이다. 융합체를 촉발시키는 돌연변이는 적어도 4개의 HSV 바이러스 유전자 (즉, gB, gK, UL20 및 UL24)에서 발견되었다.
본 개시는 "지시된 진화"와 임상적으로 관련된 바이러스 벡터의 개발을 위한 CRISPR/Cas9 기술을 조합하기 위한 전략을 제공한다. 이런 효과적인 조합은 선행 기술 접근법으로부터의 실질적인 이탈을 나타낸다. 이론에 의해 구속되지 않으면서, 예상치 못한 메커니즘이 종양을 사멸시키는 증가된 바이러스 효능을 유발할 수 있는 것으로 예상된다. 이것은 고융해성(hyperfusogenic) 표현형 및 증가된 효능을 유발하는 이전에는 미지였던 돌연변이(들)뿐만 아니라, 차세대 oHSV를 개발하기 위한 디딤돌을 드러낼 것으로 예상된다. 그렇게 생성된 oHSV는 증강된 용해 단계, 더 긴 지속성, 및 최대화된 치료 결과를 가지며, 이것은 미국 국립 암 연구소의 임상 및 중개 탐색/개발 연구의 목적과 일직선상에 있다.
비록 초점이 바이러스요법의 "용해 단계"에 집중되지만, 더 긴 지속된 바이러스 반응은 생체내에서 염증 반응을 부스팅하여 후속되는 바이러스요법의 "면역 단계"가 최적의 항종양 효능에 도달하도록 이득을 준다. 소아암 모델에서 효능 연구는 아동기 암을 해명하는 데 비-자연적인 HSV의 사용을 해명할 수 있다. 결과적으로 개선된 바이러스는 다양한 성인 암 전체에서도 활성일 것으로 예상된다.
개시를 수행하기 위한 방식
HSV가 광범위한 세포를 표적으로 하여 용해를 유도할 수 있음에도 불구하고, 바이러스 감염 자체는 세포독성 및 다른 장애, 예컨대, 뇌염, 식도염, 및 폐렴을 유발하였다. 대다수의 HSV 유전자는 병원성에 영향을 미친다. 예를 들어, γ34.5 (RL1)은 신경병원성을 유발할 수 있다. ICP6 (UL39), 리보뉴클레오타이드 환원효소, 티미딘 키나제 (UL23), 우라실 DNA 글리코실라제 (UL2), dUTPase (UL50), 및 DNA 중합효소 (UL30)가 뉴클레오타이드 대사 및 HSV의 병독성에 관여한다. 그러므로, 부작용을 최소화하면서 종양 억제 기능을 수행하기 위해 감쇠된, 그러나 복제할 수 있는 HSV 입자를 생성할 필요성이 있다.
본원에는 거대 융합체 플라크 표현형을 나타내는, Mut-3으로 명명된 새로운 바이러스가 제공된다. 출원인은 비-허용 라인에서 혼합 17TermA 및 rRp450의 연속 계대로부터 Mut-3을 분리하였고 ("유도 진화") 유전자 편집을 통해 감쇠된 돌연변이체 Mut-3△34.5를 구성하였다 ("CRISPR/Cas9" 단계) (도 1A). 전체 게놈 서열 분석은 Mut-3이 γ134.5/RL1 및 UL39 (ICP6을 암호화함) 둘 다의 온전한 복사물을 획득하여 그것의 유전자형이 야생형 (WT) 바이러스의 유전자형을 닮게 만든 것을 드러냈다. 이론에 의해 구속되지 않으면서, 출원인은 Mut-3의 용해 활성이 많은 WT 바이러스보다 더 큰 것을 발견하였고, 그것은 (완전한 바이러스 게놈 이외의) 다른 게놈 변경이 그것의 증가된 효능에 관여할 수 있음을 시사한다. gE를 암호화하는 유전자의 위치 151에서 알라닌의 트레오닌으로의 돌연변이 (A151T)를 포함한 어느 한 쪽의 부모 바이러스와 상이한 Mut-3에서의 5개의 비동의적 돌연변이가 발견되었다. Mut-3△34.5로 지정된, γ134.5/RL1을 CRISPR/Cas9 유전자 편집을 통해 녹색 형광 단백질 (GFP)로 대체시킨 Mut-3 바이러스의 감쇠된 버전이 제공된다 (도 1A, 아래, "CRISPR/Cas9" 단계로서 표지됨). 참고, Mut-3과 그것의 부모 바이러스와의 서열 비교의 결과를 요약하여 도시하는 도 1B. Mut-3의 어느 한 쪽의 부모와 상이한 비-동의적 돌연변이는 UL15, UL29, US8, RL1 및 RL2를 포함하여, 역 슬래시로 음영처리된다. 17TermA와 동일한 게놈 서열은 빈 박스로 표시되며; rRp450과 동일한 것들은 전방향 슬래시로 음영처리된다.
그러므로, 본 개시는 비-자연적인 단순 헤르페스 바이러스 ("HSV")를 제공하며, 여기서 바이러스는 (a) 당단백질 E ("gE")-암호화 유전자, (b) 감염된 세포 단백질 0 ("ICP0")-암호화 유전자, (c) DNA 포장 터미나제 하위단위 1-암호화 유전자, (d) ICP8-암호화 유전자, 또는 (e) ICP34.5-암호화 유전자의 그룹으로부터의 하나 이상인 병독성 유전자의 돌연변이를 포함하거나, 대안으로 본질적으로 그것으로 이루어지거나, 또는 또한 추가로 그것으로 이루어진다. 한 구체예에서, HSV는 기능장애 ICP34.5 단백질을 암호화하는 유전자 및/또는 기능장애 ICP6 단백질을 암호화하는 유전자를 추가로 포함하거나, 대안으로 본질적으로 그것으로 이루어지거나, 또는 또한 추가로 그것으로 이루어진다. 또 다른 구체예에서, 기능장애 ICP34.5 단백질을 암호화하는 유전자는 SEQ ID No. 1, 5, 7, 9, 또는 51에 대해 적어도 95% 동일한 서열을 가지는 폴리뉴클레오타이드, 및, 동등물이 돌연변이된 또는 변경된 아미노산 또는 뉴클레오타이드를 유지하는 것을 전제로, 그것의 동등물을 포함하거나, 대안으로 본질적으로 그것으로 이루어지거나, 또는 또한 추가로 그것으로 이루어진다. 또 다른 구체예에서, 기능장애 ICP6 단백질을 암호화하는 유전자는 SEQ ID No. 43, 45, 47, 또는 49에 대해 적어도 95% 동일한 서열을 가지는 폴리뉴클레오타이드, 및, 동등물이 야생형 서열과 비교하여 돌연변이된 또는 변경된 아미노산 또는 뉴클레오타이드를 유지하는 것을 전제로, 그것의 동등물을 포함하거나, 대안으로 본질적으로 그것으로 이루어지거나, 또는 또한 추가로 그것으로 이루어지거나, 또는 본질적으로 그것으로 이루어지거나, 또는 또한 추가로 그것으로 이루어진다.
특정 구체예에서, 비-자연적인 단순 헤르페스 바이러스의 gE 암호화 유전자는 SEQ ID No: 12, 14, 16, 18로부터 선택된 서열, SEQ ID No: 12, 14, 16, 및 18 중 어느 하나에 대해 적어도 80%, 85%, 90%, 95%, 97% 또는 99% 동일한 서열을 가지는 폴리뉴클레오타이드, 및, 동등물이 야생형 서열과 비교하여 돌연변이된 또는 변경된 아미노산 또는 뉴클레오타이드를 유지하는 것을 전제로, 그것의 동등물을 포함하거나, 대안으로 본질적으로 그것으로 이루어지거나, 또는 또한 추가로 그것으로 이루어진다. 추가의 구체예에서, 그러한 동등물을 포함하는 HSV는 세포로 진입하거나 및/또는 세포 중에 확산되거나 및/또는 SEQ ID NO: 13의 아미노산 서열을 가지는 돌연변이된 gE를 포함하는 비-자연적인 HSV와 비슷한 수준으로 DNA를 복제한다. 세포에 진입하고, 세포 중에 확산되며 DNA를 복제하는 HSV를 평가하는 비제한적인 예는 실시예에서 찾아볼 수 있다. 또한 추가의 구체예에서, gE 암호화 유전자의 폴리뉴클레오타이드는 SEQ ID No: 13, 15, 17, 및 19로부터 선택된 아미노산 서열을 가지는 폴리펩타이드를 암호화한다.
특정 구체예에서, 비-자연적인 단순 헤르페스 바이러스의 ICP0 암호화 유전자는 SEQ ID No: 20, 22, 24, 25, 및 53으로부터 선택된 서열, 하나 또는 두 인트론이 없는 SEQ ID No: 20, 22, 24, 25, 및 53 중 어느 하나의 서열, SEQ ID No: 20, 22, 24, 25, 및 53 중 어느 하나에 대해 적어도 80%, 85%, 90%, 95%, 97% 또는 99% 동일한 서열을 가지는 폴리뉴클레오타이드, 및, 동등물이 야생형 서열과 비교하여 돌연변이된 또는 변경된 아미노산 또는 뉴클레오타이드를 유지하는 것을 전제로, 그것의 동등물을 포함하거나, 대안으로 본질적으로 그것으로 이루어지거나, 또는 또한 추가로 그것으로 이루어진다. 한 구체예에서, 인트론은 서열 목록에서 및 다음과 같이 주지된다: SEQ ID NO: 20의 뉴클레오타이드 (nt) 58 내지 nt 861, SEQ ID NO: 20의 nt 1529 내지 nt 1663, SEQ ID NO: 22의 nt 58 내지 nt 822, SEQ ID NO: 22의 nt 1490 내지 nt 1625, SEQ ID NO: 24의 58 내지 nt 862, SEQ ID NO: 24의 nt 1530 내지 nt 1668, SEQ ID NO: 25의 nt 58 내지 nt 861, SEQ ID NO: 25의 nt 1529 내지 nt 1663, SEQ ID NO: 53의 nt 58 내지 nt 822, 및 SEQ ID NO: 53의 nt 1490 내지 nt 1625. 추가의 구체예에서, 동등물은 SEQ ID NO: 21의 아미노산 서열을 가지는 야생형 ICP0 또는 돌연변이된 ICP0과 비슷한 수준의 기능 (예를 들어, 바이러스 유전자로부터의 전사를 촉진하고, 핵 도트 또는 전골수구성 백혈병 (PML) 핵체(nuclear bodies)로서 알려져 있는 핵의 구조를 파괴하며, 뉴런 특이적 단백질과 함께 숙주 및 바이러스 유전자의 발현을 변경시키는 기능)을 가지는 ICP0의 폴리펩타이드를 암호화한다. 그러한 기능을 평가하는 예는 Lee HR, Kim DJ, Lee JM, et al. (June 2004). "Ability of the human cytomegalovirus IE1 protein to modulate sumoylation of PML correlates with its functional activities in transcriptional regulation and infectivity in cultured fibroblast cells". J. Virol. 78 (12): 6527-42; Gu H, Liang Y, Mandel G, Roizman B (May 2005). "Components of the REST/CoREST/histone deacetylase repressor complex are disrupted, modified, and translocated in HSV-1-infected cells". Proc. Natl. Acad. Sci. U.S.A. 102 (21): 7571-6; 및 Pinnoji RC, Bedadala GR, George B, Holland TC, Hill JM, Hsia SC (2007). "Repressor element-1 silencing transcription factor/neuronal restrictive silencer factor (REST/NRSF) can regulate HSV-1 immediate-early transcription via histone modification". Virol. J. 4: 56에서 찾아볼 수 있다. 추가적으로 또는 대안으로, 그러한 동등물을 포함하는 HSV는 세포로 진입하거나 및/또는 세포 중에 확산되거나 및/또는 SEQ ID NO: 21의 아미노산 서열을 가지는 돌연변이된 ICP0을 포함하는 비-자연적인 HSV와 비슷한 수준으로 DNA를 복제한다. 세포에 진입하고, 세포 중에 확산되며 DNA를 복제하는 HSV를 평가하는 비제한적인 예는 실시예에서 찾아볼 수 있다. 또한 추가의 구체예에서, ICP0 암호화 유전자의 폴리뉴클레오타이드는 SEQ ID No: 21, 23, 및 26으로부터 선택된 아미노산 서열을 가지는 폴리펩타이드를 암호화한다.
특정 구체예에서, 비-자연적인 단순 헤르페스 바이러스의 ICP8 암호화 유전자는 SEQ ID No: 27, 29, 31, 33으로부터 선택된 서열, SEQ ID No: 27, 29, 31, 33 중 어느 하나에 대해 적어도 80%, 85%, 90%, 95%, 97% 또는 99% 동일한 서열을 가지는 폴리뉴클레오타이드, 및, 동등물이 야생형 서열과 비교하여 돌연변이된 또는 변경된 아미노산 또는 뉴클레오타이드를 유지하는 것을 전제로, 그것의 동등물을 포함하거나, 대안으로 본질적으로 그것으로 이루어지거나, 또는 또한 추가로 그것으로 이루어진다. 추가의 구체예에서, 동등물은 SEQ ID NO: 28의 아미노산 서열을 가지는 야생형 ICP8 또는 돌연변이된 ICP8과 비슷한 수준의 기능 (예를 들어, 단일 가닥 DNA (ssDNA)를 어닐링하거나, 이중 가닥 DNA의 작은 단편을 용융시키거나, 또는 복제의 개시 중에 듀플렉스 DNA를 탈안정화시키는 기능)을 가지는 ICP8의 폴리펩타이드를 암호화한다. 그러한 기능은 기술분야에서 이용 가능한 방법, 예를 들어, Boehmer, PE; Lehman, IR (1993). "Herpes simplex virus type 1 ICP8: Helix-destabilizing properties". Journal of Virology. 67 (2): 711-5의 방법을 통해 평가될 수 있다. 추가적으로 또는 대안으로, 그러한 동등물을 포함하는 HSV는 세포에 진입하거나 및/또는 세포 중에 확산되거나 및/또는 SEQ ID NO: 28의 아미노산 서열을 가지는 돌연변이된 ICP8을 포함하는 비-자연적인 HSV와 비슷한 수준으로 DNA를 복제한다. 세포에 진입하고, 세포 중에 확산되며 DNA를 복제하는 HSV를 평가하는 비제한적인 예는 실시예에서 찾아볼 수 있다. 또한 추가의 구체예에서, ICP8 암호화 유전자의 폴리뉴클레오타이드는 SEQ ID No: 28, 30, 32, 및 34로부터 선택된 아미노산 서열을 가지는 폴리펩타이드를 암호화한다.
특정 구체예에서, 비-자연적인 단순 헤르페스 바이러스의 DNA 포장 터미나제 하위단위 1 암호화 유전자는 SEQ ID No: 35, 37, 39, 41로부터 선택된 서열, SEQ ID No: 35, 37, 39, 41 중 어느 하나에 대해 적어도 80%, 85%, 90%, 95%, 97% 또는 99% 동일한 서열을 가지는 폴리뉴클레오타이드, 및, 동등물이 야생형 서열과 비교하여 돌연변이된 또는 변경된 아미노산 또는 뉴클레오타이드를 유지하는 것을 전제로, 그것의 동등물을 포함하거나, 대안으로 본질적으로 그것으로 이루어지거나, 또는 또한 추가로 그것으로 이루어진다. 추가의 구체예에서, 그러한 동등물을 포함하는 HSV는 세포에 진입하거나 및/또는 세포 중에 확산되거나 및/또는 SEQ ID NO: 36의 아미노산 서열을 가지는 돌연변이된 DNA 포장 터미나제 하위단위 1을 포함하는 비-자연적인 HSV와 비슷한 수준으로 DNA를 복제한다. 세포에 진입하고, 세포 중에 확산되며 DNA를 복제하는 HSV를 평가하는 비제한적인 예는 실시예에서 찾아볼 수 있다. 또한 추가의 구체예에서, DNA 포장 터미나제 하위단위 1 암호화 유전자의 폴리뉴클레오타이드는 SEQ ID No: 36, 38, 40, 및 42로부터 선택된 아미노산 서열을 가지는 폴리펩타이드를 암호화한다.
특정 구체예에서, HSV는 SEQ ID No: 12, 20, 27, 및 35로부터 선택된 서열을 가지는 폴리뉴클레오타이드(들)를 하나 이상 포함하거나, 대안으로 본질적으로 그것으로 이루어지거나, 또는 또한 추가로 그것으로 이루어진다. 추가의 구체예에서, HSV는 기능성 ICP34.5를 갖지 않는다 (즉, 기능장애 ICP34.5를 암호화하거나 ICP34.5를 암호화하지 않음). 추가적으로 또는 대안으로, HSV는 기능성 ICP6을 갖지 않는다 (즉, 기능장애 ICP6을 암호화하거나 ICP6을 암호화하지 않음). 또 다른 구체예에서, 병독성 유전자의 돌연변이는 예를 들어, ICP34.5 유전자의 및/또는 ICP6 유전자의 삽입, 결실, 절단, 프레임시프트, 치환, 또는 점 돌연변이를 포함하거나, 또는 본질적으로 그것으로 이루어지거나, 또는 또한 추가로 그것으로 이루어진다. 또 다른 구체예에서, HSV는 기능적 ICP34.5 단백질 및/또는 기능적 ICP6 단백질을 암호화하는 유전자가 없다. 또 다른 구체예에서, 돌연변이는 병독성 유전자의 비동의적 돌연변이이다.
한 구체예에서, 개시의 비-자연적인 HSV 상의 돌연변이는: (a) gE 단백질의 위치 151에서 알라닌에서 트레오닌으로의 돌연변이, (b) ICP0 단백질의 위치 258에서 아르기닌에서 히스티딘으로의 돌연변이, (c) DNA 포장 터미나제 하위단위 1 단백질의 위치 376에서 알라닌에서 트레오닌으로의 돌연변이, (d) ICP8 단백질의 위치 1155에서 트레오닌에서 메티오닌으로의 돌연변이, 또는 (e) ICP34.5 단백질의 위치 119에서 프롤린에서 히스티딘으로의 돌연변이 중 하나 이상을 암호화한다. 또 다른 구체예에서, 비-자연적인 HSV는 SEQ ID No. 2, SEQ ID No. 13, SEQ ID No. 21, SEQ ID No. 28, 또는 SEQ ID No. 36 중 하나 이상, 및, 동등물이 돌연변이된 또는 변경된 아미노산 또는 뉴클레오타이드를 유지하는 것을 전제로, 그것의 동등물을 포함하거나, 또는 대안으로 본질적으로 그것으로 이루어지거나, 또는 또한 추가로 그것으로 이루어진다.
특정 구체예에서, 비-자연적인 단순 헤르페스 바이러스 ("HSV")가 제공되는데, 여기서 바이러스는: (a) gE, (b) ICP0, (c) DNA 포장 터미나제 하위단위 1, (d) ICP8, 또는 (e) ICP34.5 중 하나 이상에서 돌연변이를 포함하거나, 대안으로 본질적으로 그것으로 이루어지거나, 또는 또한 추가로 그것으로 이루어진다. 특정 구체예에서, HSV는 기능적 ICP34.5 단백질 (예를 들어, 17TermA 스트레인 또는 rRp450 스트레인의 ICP34.5)을 포함하지 않는다. 추가의 구체예에서, HSV는 어떠한 ICP34.5 단백질도 포함하지 않는다. 추가적으로 또는 대안으로, HSV는 기능적 ICP6 단백질 (예를 들어, 17TermA 스트레인 또는 rRp450 스트레인의 ICP6)을 포함하지 않는다. 또한 추가의 구체예에서, HSV는 어떠한 ICP6 단백질도 포함하지 않는다.
한 구체예에서, 개시의 비-자연적인 HSV 상의 돌연변이(들)는: (a) gE 단백질의 위치 151에서 알라닌에서 트레오닌으로의 돌연변이, (b) ICP0 단백질의 위치 258에서 아르기닌에서 히스티딘으로의 돌연변이, (c) DNA 포장 터미나제 하위단위 1 단백질의 위치 376에서 알라닌에서 트레오닌으로의 돌연변이, (d) ICP8 단백질의 위치 1155에서 트레오닌에서 메티오닌으로의 돌연변이, 또는 (e) ICP34.5 단백질의 위치 119에서 프롤린에서 히스티딘으로의 돌연변이 중 하나 이상이다.
특정 구체예에서, 비-자연적인 HSV의 gE는 SEQ ID No: 13, 15, 17 및 19로부터 선택된 아미노산 서열을 포함하거나, 대안으로 본질적으로 그것으로 이루어지거나, 또는 또한 추가로 그것으로 이루어진다. 추가의 구체예에서, 비-자연적인 HSV는 gE의 아미노산 서열을 암호화하는 폴리뉴클레오타이드, 예를 들어, SEQ ID No: 12, 14, 16, 18로부터 선택된 서열을 가지는 폴리뉴클레오타이드, 및 그것의 동등물을 추가로 포함한다. 특정 구체예에서, 비-자연적인 HSV의 ICP0은 SEQ ID No: 21, 23, 및 26으로부터 선택된 아미노산 서열을 포함하거나, 대안으로 본질적으로 그것으로 이루어지거나, 또는 또한 추가로 그것으로 이루어진다. 추가의 구체예에서, 비-자연적인 HSV는 ICP0의 아미노산 서열을 암호화하는 폴리뉴클레오타이드, 예를 들어, SEQ ID No: 20, 22, 24, 25, 53으로부터 선택된 서열을 가지는 폴리뉴클레오타이드 및 그것의 동등물을 추가로 포함한다. 특정 구체예에서, 비-자연적인 HSV의 ICP8은 SEQ ID No: 28, 30, 32 및 34로부터 선택된 아미노산 서열을 포함하거나, 대안으로 본질적으로 그것으로 이루어지거나, 또는 또한 추가로 그것으로 이루어진다. 추가의 구체예에서, 비-자연적인 HSV는 ICP8의 아미노산 서열을 암호화하는 폴리뉴클레오타이드, 예를 들어, SEQ ID No: 27, 29, 31, 33으로부터 선택된 서열을 가지는 폴리뉴클레오타이드, 및 그것의 동등물을 추가로 포함한다. 특정 구체예에서, 비-자연적인 HSV의 DNA 포장 터미나제 하위단위 1은 SEQ ID No: 36, 38, 40 및 42로부터 선택된 아미노산 서열을 포함하거나, 대안으로 본질적으로 그것으로 이루어지거나, 또는 또한 추가로 그것으로 이루어진다. 추가의 구체예에서, 비-자연적인 HSV는 DNA 포장 터미나제 하위단위 1의 아미노산 서열을 암호화하는 폴리뉴클레오타이드, 예를 들어, SEQ ID No: 35, 37, 39, 41로부터 선택된 서열을 가지는 폴리뉴클레오타이드, 및 그것의 동등물을 추가로 포함하다.
특정 구체예에서, 비-자연적인 HSV는 SEQ ID No: 13, 21, 28, 및 36으로부터 선택된 아미노산 서열을 가지는 폴리펩타이드(들)를 하나 이상 포함하거나, 또는 대안으로 본질적으로 그것으로 이루어지거나, 또는 또한 추가로 그것으로 이루어진다. 추가의 구체예에서, 비-자연적인 HSV는 SEQ ID No: 13, 21, 28, 및 36으로부터 선택된 아미노산 서열 중 하나 이상을 암호화하는 폴리뉴클레오타이드(들) 중 하나 이상을 포함하거나, 또는 대안으로 본질적으로 그것으로 이루어지거나, 또는 또한 추가로 그것으로 이루어진다.
특정 구체예에서, 비-자연적인 HSV는 다음: (a) SEQ ID NO. 2, 6, 8, 10, 및 52로부터 선택된 아미노산 서열을 암호화하는 폴리뉴클레오타이드, 및/또는 SEQ ID NO. 1, 5, 7, 9, 및 51로부터 선택된 서열을 갖는 폴리뉴클레오타이드; (b) SEQ ID NO. 2, 6, 8, 10, 및 52로부터 선택된 아미노산 서열을 갖는 폴리펩타이드; (c) SEQ ID NO. 13, 15, 17 및 19로부터 선택된 아미노산 서열을 암호화하는 폴리뉴클레오타이드, 및/또는 SEQ ID NO. 12, 14, 16 및 18로부터 선택된 서열을 갖는 폴리뉴클레오타이드; (d) SEQ ID NO. 13, 15, 17 및 19로부터 선택된 아미노산 서열을 갖는 폴리펩타이드; (e) SEQ ID NO. 21, 23 및 26으로부터 선택된 아미노산 서열을 암호화하는 폴리뉴클레오타이드, 및/또는 SEQ ID NO. 20, 22, 24, 25, 및 53으로부터 선택된 서열, 또는 하나 또는 둘 이상의 인트론이 없는 서열을 갖는 폴리뉴클레오타이드; (f) SEQ ID NO. 21, 23 및 26으로부터 선택된 아미노산 서열을 갖는 폴리펩타이드; (g) SEQ ID NO. 28, 30, 32 및 34로부터 선택된 아미노산 서열을 암호화하는 폴리뉴클레오타이드, 및/또는 SEQ ID NO. 27, 29, 31, 및 33으로부터 선택된 서열을 갖는 폴리뉴클레오타이드; (h) SEQ ID NO. 28, 30, 32 및 34로부터 선택된 아미노산 서열을 갖는 폴리펩타이드; (i) SEQ ID NO. 36, 38, 40, 및 42로부터 선택된 아미노산 서열을 암호화하는 폴리뉴클레오타이드, 및/또는 SEQ ID NO. 35, 37, 39 및 41로부터 선택된 서열을 갖는 폴리뉴클레오타이드; (j) SEQ ID NO. 36, 38, 40, 및 42로부터 선택된 아미노산 서열을 갖는 폴리펩타이드; (k) SEQ ID NO. 44, 46, 48 및 50으로부터 선택된 아미노산 서열을 암호화하는 폴리뉴클레오타이드, 및/또는 SEQ ID NO. 43, 45, 47 및 49로부터 선택된 서열을 갖는 폴리뉴클레오타이드; (l) SEQ ID NO. 44, 46, 48 및 50으로부터 선택된 아미노산 서열을 갖는 폴리펩타이드 중 하나 이상을 포함하거나, 또는 대안으로 본질적으로 그것으로 이루어지거나, 또는 또한 추가로 그것으로 이루어진다.
또 다른 구체예에서, 비-자연적인 HSV는 17TermA HSV로부터의 병독성 유전자의 적어도 단편에 동일한 서열을 가지는 폴리뉴클레오타이드 및 그것의 동등물을 추가로 포함하거나, 또는 대안으로 본질적으로 그것으로 이루어지거나, 또는 또한 추가로 그것으로 이루어진다. 또 다른 구체예에서, 비-자연적인 HSV는 rRp450 HSV로부터의 병독성 유전자의 적어도 단편에 동일한 서열을 가지는 폴리뉴클레오타이드 및 그것의 동등물을 추가로 포함하거나, 또는 대안으로 본질적으로 그것으로 이루어지거나, 또는 또한 추가로 그것으로 이루어진다. 비-자연적인 HSV는, 일부 구체예에서, HSV 유형 1 ("HSV-1") 또는 HSV 유형 2 ("HSV-2") 스트레인으로부터 유래된다. 한 구체예에서, 비-자연적인 HSV는 HSV-1 KOS 스트레인으로부터 유래된다. 또 다른 구체예에서, 비-자연적인 HSV는 도입유전자를 추가로 포함하거나, 또는 대안으로 본질적으로 그것으로 이루어지거나, 또는 또한 추가로 그것으로 이루어진다.
본원에서 개시된 HSV가 그것의 용해 기능을 보유하기 때문에, 또 다른 측면으로, 본 개시는 대상체에게 유효량의 비-자연적인 HSV 또는 비-자연적인 HSV를 포함하는, 또는 대안으로 본질적으로 그것으로 이루어지는, 또는 또한 추가로 그것으로 이루어지는 조성물을 투여하는 단계를 포함하는, 또는 본질적으로 그것으로 이루어지는, 또는 또한 추가로 그것으로 이루어지는, 대상체에서 암을 치료하거나 암 세포의 성장 또는 전이를 억제하는 방법을 제공한다. 한 측면으로, 암은 췌장암, 신장암, 소세포 폐암, 뇌암, 신경암, 신경모세포종, 골암, 림프종, 골수종, 결장암, 자궁암, 유방암, 백혈병, 간암, 전립선암, 피부암, 또는 흑색종을 포함한다. 치료되는 대상체는 성인 또는 소아 환자, 예컨대, 포유류 또는 인간 환자일 수 있다. 또 다른 구체예에서, 비-자연적인 HSV 벡터 또는 조성물 또는 제약학적 조성물은 국소적으로 또는 전신적으로 주사, 주입, 점적, 및/또는 흡입에 의해 투여된다. 또 다른 구체예에서, 대상체는 포유류이다. 일부 구체예에서, 포유류는 마우스, 래트, 기니아 피그, 비-인간 영장류, 개, 고양이, 말, 소, 돼지, 염소, 또는 양이다. 또 다른 구체예에서, 대상체는 인간이다.
또 다른 측면으로, 개시는 세포를 본 개시의 비-자연적인 HSV 또는 비-자연적인 HSV를 포함하는, 또는 대안으로 본질적으로 그것으로 이루어지는, 또는 또한 추가로 그것으로 이루어지는 조성물과 접촉시키는 단계를 포함하는, 또는 본질적으로 그것으로 이루어지는, 또는 또한 추가로 그것으로 이루어지는, 세포 용해를 유도하는 방법을 제공한다. 한 구체예에서, 세포는 암 세포이다. 추가의 측면으로, 세포는 배양된 세포 (전임상 모델 또는 전임상 검정으로서 사용하기 위함) 또는 대상체로부터 분리된 세포이다. 세포는 배양되거나 분리된 조직 내에 있을 수 있다. 그러한 세포의 비제한적인 예로는: 췌장암, 신장암, 소세포 폐암, 뇌암, 신경모세포종, 신경암, 골암, 림프종, 골수종, 결장암, 자궁암, 유방암, 백혈병, 간암, 전립선암, 피부암, 또는 흑색종으로부터의 세포를 들 수 있다. 세포는 포유류, 예컨대, 성인 또는 청소년 (소아)일 수 있는 인간으로부터 분리될 수 있다.
또 다른 측면으로, 개시는 세포를 비-자연적인 HSV와 접촉시키는 단계를 포함하는, 또는 대안으로 본질적으로 그것으로 이루어지는, 또는 또한 추가로 그것으로 이루어지는, 세포를 감염시키는 방법을 제공한다. 한 구체예에서, 세포는 진핵 세포이다. 또 다른 구체예에서, 세포는 림프구이다. 한 구체예에서, 세포는 혈액암 또는 고형 종양 세포, 예컨대, 암종 또는 육종과 같은 암 세포이다. 추가의 측면으로, 세포는 배양된 세포 (전임상 모델 또는 전임상 검정으로서 사용하기 위함) 또는 대상체로부터 분리된 세포이다. 세포는 배양되거나 분리된 조직 내에 있을 수 있다. 그러한 세포의 비제한적인 예로는: 췌장암, 신장암, 소세포 폐암, 뇌암, 신경모세포종, 신경암, 골암, 림프종, 골수종, 결장암, 자궁암, 유방암, 백혈병, 간암, 전립선암, 피부암, 또는 흑색종으로부터의 세포를 들 수 있다. 세포는 포유류, 예컨대, 성인 또는 청소년 (소아)일 수 있는 인간으로부터 분리될 수 있다.
출원인은 엡스타인-바 바이러스 ("EBV")-감염된 림프구의 종래 그룹이 종래의 종양용해성 HSV ("oHSV")에 대해 내성인 것을 발견하였다. 이론에 구속되지 않지만, 내성은 적어도 부분적으로는 EBV-감염된 림프구 상의 HSV 진입 수용체의 저 수준의 발현으로 인한 것이다. 놀랍게도, 청구된 본 발명의 HSV는 야생형 스트레인 17, KOS 및 McKrae HSV 바이러스에 내성인 EBV-감염된 림프구에서 용해를 유도할 수 있었다. 그러므로, 한 구체예에서, 세포는 EBV에 의해 감염된 세포 또는 대안으로 EBV에 대해 내성인 세포를 포함하거나, 또는 대안으로 본질적으로 그것으로 이루어지거나, 또는 또한 추가로 그것으로 이루어진다. 또 다른 구체예에서, 세포는 엡스타인-바 바이러스 ("EBV")의 병독성 요소를 포함하거나, 또는 대안으로 본질적으로 그것으로 이루어지거나, 또는 또한 추가로 그것으로 이루어진다. 또 다른 구체예에서, 세포는 EBV에 의해 감염된 림프구를 포함하거나, 또는 대안으로 본질적으로 그것으로 이루어지거나, 또는 또한 추가로 그것으로 이루어진다. 또 다른 구체예에서, 청구된 본 발명의 HSV는 대조군과 비교하여 EBV-감염된 세포에 대한 더 높은 감염률을 가진다. 한 구체예에서, 대조군은 종래의 oHSV를 포함하거나, 또는 대안으로 본질적으로 그것으로 이루어지거나, 또는 또한 추가로 그것으로 이루어진다. 또 다른 구체예에서, 종래의 oHSV는 야생형 스트레인 17 HSV, KOS HSV, 또는 McKrae HSV를 포함한다.
HSV 돌연변이체 또는 유도체의 제조
HSV 돌연변이체 또는 유도체의 제조는 부모의 HSV 스트레인에 의해 암호화된 유전자 또는 유전자 조합의 변경 또는 돌연변이를 포함한다. 예를 들어, 유도체는 뉴클레오타이드 치환, 예를 들어 1, 2 또는 3개 내지 10, 25, 50 또는 100개 치환에 의해 변형된 HSV-l 또는 HSV-2 게놈의 서열을 가질 수 있다. HSV-l 또는 HSV-2 게놈은 대안으로 또는 추가적으로 하나 이상의 삽입 및/또는 결실에 의해 및/또는 어느 한 단부 또는 양 단부에서의 연장에 의해 변형될 수 있다. 유전자 변형 방법은 기술분야에 알려져 있고, 예컨대, CRISPR, 재조합 구성, 또는 점 돌연변이이다. 기술분야에 통상적인 지식을 가진 사람은 필요에 따라 HSV 돌연변이체를 제조하는 방법을 알고 있을 것이다.
표적 유전자 변형 방법 외에, HSV 돌연변이체는 자발적으로 생성될 수 있다. 예를 들어, HSV와 같은 바이러스의 배양은 연속 계대(serial passage)로 알려져 있는 기법을 포함한다. 바이러스를 성장시키고 유지하기 위하여, 적합한 세포가 바이러스로 감염되고, 바이러스는 세포 내에서 복제하며 그런 후 바이러스는 수득된다; 그런 후 새로운 세포가 재감염되고, 이런 과정이 연속 계대의 한 사이클을 구성한다. 각각의 그러한 사이클은, 예를 들어, HSV의 경우에 수일이 걸릴 수 있다. 위에서 논의된 것과 같이, 그러한 연속 계대는, HSV의 임상 적용에 유리할 특성에 대해 선택이 일어난다는 점에서, 바이러스 스트레인의 특성 또는 유전자 서열의 변화로 이어질 수 있다. 예를 들어, 증강된 특성은 신속한 복제, 또는 인간 세포를 감염시키기 위해 축삭을 따라 이동하는 능력을 포함할 수 있다. 더불어, 자발적인 돌연변이는 세포를 하나의 HSV 또는 하나 이상의 HSV로 감염시킴으로써 생성될 수 있다.
그러므로, 개시는 HSV 또는 HSV의 유전자를 돌연변이시킴에 의해 그것의 돌연변이체 또는 유도체를 제조하는 방법을 제공한다. 또 다른 구체예에서, 방법은 비-자연적인 HSV에 도입유전자를 도입하는 단계를 포함하거나, 또는 대안으로 본질적으로 그것으로 이루어지거나, 또는 또한 추가로 그것으로 이루어진다.
또 다른 측면으로, 본원에는 HSV 바이러스 입자를 제조하는 방법이 제공되며, 방법은: (a) 숙주 세포에 17TermA HSV 벡터 및 rRp450 HSV 벡터를 도입하는 단계; (b) 숙주 세포를 적어도 3회 계대 동안 성장시키는 단계; 및 (c) 숙주 세포에 의해 생성된 HSV 입자를 분리하는 단계를 포함하거나, 또는 대안으로 본질적으로 그것으로 이루어지거나, 또는 또한 추가로 그것으로 이루어진다. 한 구체예에서, HSV는 숙주 세포에 트랜스펙션, 감염, 형질전환, 전기천공, 주사, 미세주사, 또는 이것들의 조합에 의해 도입된다. 또 다른 구체예에서, 숙주 세포는 적어도 3회 계대, 10회 계대, 20회 계대, 30회 계대, 40회 계대, 또는 50회 계대 동안 성장된다. 일부 구체예에서, 숙주 세포는 도입된 HSV 벡터의 복제를 지지하기 위한 보완하는 유전자 생성물을 포함하거나, 또는 대안으로 본질적으로 그것으로 이루어지거나, 또는 또한 추가로 그것으로 이루어진다. 또 다른 구체예에서, 보완하는 유전자는 ICP6 단백질 및/또는 ICP34.5 단백질을 암호화한다. 또 다른 구체예에서, 그렇게 생성된 HSV 입자는 본 개시의 HSV 벡터를 포함하거나, 또는 대안으로 본질적으로 그것으로 이루어지거나, 또는 또한 추가로 그것으로 이루어진다.
특정 구체예에서, 본원에는 개시의 비-자연적인 HSV 바이러스 입자를 제조하는 방법이 제공된다. 방법은: (a) 숙주 세포에 비-자연적인 HSV 벡터를 도입하는 단계; (b) 숙주 세포를 성장시키는 단계; 및 (c) 숙주 세포에 의해 생성된 HSV 입자를 분리하는 단계를 포함하거나, 또는 대안으로 본질적으로 그것으로 이루어지거나, 또는 또한 추가로 그것으로 이루어진다.
특정 구체예에서, 본원에는: (a) 비-자연적인 HSV 벡터의 바이러스 게놈을 암호화하는 폴리뉴클레오타이드를 숙주 세포에 도입하는 단계; (b) 숙주 세포를 성장시키는 단계; 및 (c) 숙주 세포에 의해 생성된 HSV 입자를 수집하고 분리하는 단계를 포함하는, 또는 대안으로 본질적으로 그것으로 이루어지는, 또는 또한 추가로 그것으로 이루어지는, 개시의 비-자연적인 HSV 바이러스 입자의 제조 방법이 제공된다. 한 구체예에서, 바이러스 게놈을 암호화하는 핵산 서열은 숙주 세포에 트랜스펙션, 감염, 형질전환, 전기천공, 주사, 미세주사, 또는 이것들의 조합에 의해 도입된다. 한 구체예에서, 바이러스 게놈을 암호화하는 핵산 서열은 벡터의 숙주 세포에 도입된다. 추가의 구체예에서, 벡터는 바이러스 벡터 (예컨대 HSV) 또는 비-바이러스 벡터 (예컨대 플라스미드 또는 나노입자)이다. 또한 추가의 구체예에서, 벡터는 HSV이다. 일부 구체예에서, 숙주 세포는 도입된 HSV 벡터의 복제를 지지하기 위해 보완하는 유전자 생성물을 포함하거나, 또는 대안으로 본질적으로 그것으로 이루어지거나, 또는 또한 추가로 그것으로 이루어진다. 한 구체예에서, 그러한 보완하는 유전자 생성물은 헬퍼 바이러스를 통해 숙주 세포에 제공된다. 또 다른 구체예에서, 보완하는 유전자는 ICP6 단백질 및/또는 ICP34.5 단백질을 암호화한다. 또 다른 구체예에서, 그렇게 생성된 HSV 입자는 본 개시의 HSV 벡터를 포함하거나, 또는 대안으로 본질적으로 그것으로 이루어지거나, 또는 또한 추가로 그것으로 이루어진다.
한 구체예에서, 분리하는 단계는 다른 물질, 예컨대 숙주 세포, 세포 파편, 배양 배지 또는 숙주 세포를 배양하는 데 사용된 임의의 다른 작용제로부터,예를 들어 원심분리, 여과, 크로마토그래피, 또는 이것들의 임의의 조합에 의해 HSV를 실질적으로 분리하는 과정을 나타낸다. 비제한적인 예는 Sia et al, Optimal purification method for Herpes-based viral vectors that confers minimal cytotoxicity for systemic route of vector administration. J Virol Methods. 2007 Feb;139(2):166-74에서 찾아볼 수 있다.
조성물
또 다른 측면으로, 개시는 본원에서 기술된 비-자연적인 HSV를 포함하는, 또는 본질적으로 그것으로 이루어지는, 또는 또한 추가로 그것으로 이루어지는 조성물을 제공한다. 본원에서 기술된 작용제 또는 바이러스 입자를 포함하는, 또는 대안으로 본질적으로 그것으로 이루어지는, 또는 또한 추가로 그것으로 이루어지는 제약학적 조성물을 포함한, 조성물은 종래의 혼합, 용해, 과립화, 부양(levigating), 유화, 캡슐화, 포획, 또는 동결건조 과정에 의해 제조될 수 있다. 조성물은 본원에 제공된 바이러스 입자를 제약학적으로 사용될 수 있는 제제로 가공하는 것을 용이하게 하는 하나 이상의 생리적으로 허용되는 담체, 희석제, 부형제, 또는 보조제를 사용하여 종래 방식으로 제형화될 수 있다.
본 개시의 작용제 및 바이러스 입자는 비경구 (예컨대, 근육내, 복강내, 정맥내, 뇌실내 ("ICV"), 수조내(intracisternal) 주사 또는 주입, 피하 주사, 또는 임플란트)에 의해, 경구로, 흡입 분무 비강, 질, 직장, 혀밑, 요도 (예컨대, 요도용 좌제)에 의해 또는 국소 투여 경로에 의해 투여될 수 있고 (예컨대, 젤, 연고, 크림, 에어로졸, 등) 단독으로 또는 함께, 각각의 투여 경로에 적절한 종래의 무독성의 제약학적으로 허용되는 담체, 보조제, 부형제, 및 비히클을 함유하는 적합한 투여 단위 제형으로 제형화될 수 있다.
한 구체예에서, 본 개시는 본원에서 기술된 비-자연적인 HSV 바이러스 입자 및 담체를 포함하는, 또는 본질적으로 그것으로 이루어지는, 또는 또한 추가로 그것으로 이루어지는 조성물에 관한 것이다.
또 다른 구체예에서, 본 개시는 본원에서 기술된 비-자연적인 바이러스 입자 및 제약학적으로 허용되는 담체를 포함하는, 또는 본질적으로 그것으로 이루어지는, 또는 또한 추가로 그것으로 이루어지는 제약학적 조성물에 관한 것이다. 또 다른 구체예에서, 조성물은 상당한 병독성의 손실 없이 비-자연적인 HSV의 동결 및 해동을 용이하게 하는 냉동보존제를 포함하거나, 또는 대안으로 본질적으로 그것으로 이루어지거나, 또는 또한 추가로 그것으로 이루어진다.
또 다른 구체예에서, 본 개시는 본원에서 기술된 치료적 유효량의 비-자연적인 HSV 바이러스 입자 및 제약학적으로 허용되는 담체를 포함하는, 또는 대안으로 본질적으로 그것으로 이루어지는, 또는 또한 추가로 그것으로 이루어지는 제약학적 조성물에 관한 것이다.
HSV 바이러스 입자의 투여를 위한 제약학적 조성물은 투여 단위 형태로 편리하게 제공되며 제약학 기술분야에 잘 알려져 있는 임의의 방법에 의해 제조될 수 있다. 제약학적 조성물은, 예를 들어, 본원에 제공된 HSV 바이러스 입자를 액체 담체, 미세하게 나누어진 고체 담체 또는 둘 다와 균일하고 친밀하게 회합되도록 한 후, 필요에 따라, 생성물을 원하는 제형으로 형상화함으로써 제조된다. 제약학적 조성물에서 본원에 제공된 화합물은 원하는 치료 효과를 유발하기에 충분한 양으로 포함된다. 예를 들어, 본 개시의 제약학적 조성물은, 예를 들어, 국소적, 눈, 경구, 볼, 전신적, 비강, 주사, 주입, 경피, 직장, 및 질 투여를 포함한 실제로 임의의 투여 방식에 적합한 형태, 또는 흡입 또는 취입에 의한 투여에 적합한 형태를 취할 수 있다.
국소 투여의 경우, 비-자연적인 HSV 바이러스 입자는 기술분야에 잘 알려져 있는 것과 같이, 용액, 젤, 연고, 크림, 현탁액, 등으로서 제형화될 수 있다.
전신적 제형은 경피, 경점막, 경구, 또는 폐 투여를 위해 설계된 것뿐만 아니라 주사 (예컨대, 피하, 정맥내, 주입, 근육내, 척추강내, 또는 복강내 주사)에 의한 투여를 위해 설계된 것을 포함한다.
유용한 주사 가능한 제제로는 본원에 제공된 HSV 바이러스 입자의 수성 또는 유성 비히클 중의 멸균 현탁액, 용액, 또는 에멀션을 들 수 있다. 조성물은 또한 제형화제, 예컨대 현탁제, 안정화제, 및/또는 분산제를 함유할 수 있다. 주사용 제형은 단위 투여 형태, 예컨대, 앰플 또는 다중용량 용기로 제공될 수 있고, 첨가된 보존제를 함유할 수 있다.
대안으로, 주사 가능한 제형은 한정하는 것은 아니지만, 멸균된 발열원이 없는 물, 완충액, 및 덱스트로스 용액을 포함한, 적합한 비히클로 사용 전에 재구성하기 위한 분말 형태로 제공될 수 있다. 이 목적을 위해, 본원에 제공된 HSV 바이러스 입자는 기술분야에 알려져 있는 임의의 기법, 예컨대 동결건조에 의해 건조될 수 있고, 사용 전에 재구성될 수 있다.
경점막 투여의 경우, 침투될 장벽에 적절한 침투제가 제형에 사용된다. 그러한 침투제는 기술분야에 알려져 있다.
경구 투여의 경우, 제약학적 조성물은, 예를 들어, 결합제 (예컨대, 미리 젤라틴화된 옥수수 전분, 폴리비닐피롤리돈, 또는 하이드록시프로필 메틸셀룰로스); 충전제 (예컨대, 락토스, 미정질 셀룰로스, 또는 인산 수소 칼슘); 윤활제 (예컨대, 스테아르산 마그네슘, 탈크, 또는 실리카); 붕해제 (예컨대, 감자 전분 또는 전분 글리콜산 나트륨); 또는 습윤제 (예컨대, 라우릴 황산 나트륨)와 같은 제약학적으로 허용되는 부형제를 사용한 종래 수단에 의해 제조된 당의정, 정제, 또는 캡슐의 형태를 취할 수 있다. 정제는 예를 들어, 당, 필름, 또는 장용 코팅을 사용하여 기술분야에 잘 알려져 있는 방법에 의해 코팅될 수 있다.
경구용으로 의도된 조성물은 제약학적 조성물의 제조를 위해 기술분야에 알려져 있는 임의의 방법에 따라 제조될 수 있고, 그러한 조성물은 제약학적으로 보기 좋고 맛좋은 제제를 제공하기 위하여 감미제, 향미제, 착색제, 및 보존제로 이루어진 군으로부터 선택된 하나 이상의 작용제를 함유할 수 있다. 정제는 본원에 제공된 HSV 바이러스 입자를, 정제의 제조에 적합한 무독성의 제약학적으로 허용되는 부형제와의 혼합 상태로 함유한다. 이들 부형제는, 예를 들어, 비활성 희석제, 예컨대 탄산 칼슘, 탄산 나트륨, 락토스, 인산 칼슘 또는 인산 나트륨; 과립화 및 붕해제 (예컨대, 옥수수 전분 또는 알긴산); 결합제 (예컨대, 전분, 젤라틴, 또는 아카시아); 및 윤활제 (예컨대, 스테아르산 마그네슘, 스테아르산, 또는 탈크)일 수 있다. 정제는 코팅되지 않은 채로 남겨지거나 또는 위장관에서의 붕해 및 흡수를 지연시키고 그로써 장기간에 걸쳐 지속적인 작용을 제공하기 위해 알려져 있는 기법에 의해 코팅될 수 있다. 예를 들어, 글리세릴 모노스테아레이트 또는 글리세릴 다이스테아레이트와 같은 시간 지체 물질이 사용될 수 있다. 그것들은 또한 숙련된 전문가에제 잘 알려져 있는 기법에 의해 코팅될 수 있다. 본 개시의 제약학적 조성물은 또한 수-중-유 에멀션의 형태로 있을 수 있다.
경구 투여용 액체 제제는 예를 들어, 엘릭시르, 용액, 시럽, 또는 현탁액의 형태를 취할 수 있거나, 물 또는 다른 적합한 비히클로 사용 전에 재구성하기 위한 건조한 제품으로서 제공될 수 있다. 그러한 액체 제제는 현탁제 (예컨대, 소르비톨 시럽, 셀룰로스 유도체, 또는 수소화된 식용 지방); 유화제 (예컨대, 레시틴, 또는 아카시아); 비-수성 비히클 (예컨대, 아몬드유, 유성 에스테르, 에틸 알코올, 크레모포어 TM, 또는 분별된 식물성 오일); 및 보존제 (예컨대, 메틸 또는 프로필-P-하이드록시벤조에이트 또는 소르브산)와 같은 제약학적으로 허용되는 첨가제로 종래 수단에 의해 제조될 수 있다. 제제는 또한 필요에 따라 완충 염, 보존제, 향미제, 학색제 및 감미제를 함유할 수 있다.
한 구체예에서, 비-자연적인 HSV 바이러스 입자의 유전자를 돌연변이시키는 단계 또는 비-자연적인 HSV에 도입유전자를 도입하는 단계를 포함하는, 또는 대안으로 본질적으로 그것으로 이루어지는, 또는 또한 추가로 그것으로 이루어지는, 본 개시의 비-자연적인 HSV를 제조하는 방법이 제공된다. 또 다른 측면으로, 비-자연적인 HSV 벡터를 제조하는 방법은: (a) 숙주 세포에 17TermA HSV 벡터 및 rRp450 HSV 벡터를 도입하는 단계; (b) 숙주 세포를 적어도 3회 계대 동안 성장시키는 단계; 및 (c) 숙주 세포에 의해 생성된 HSV 입자를 분리하는 단계를 포함하거나, 또는 대안으로 본질적으로 그것으로 이루어지거나, 또는 또한 추가로 그것으로 이루어진다.
또한 암 세포 또는 전이성 암 세포의 성장 또는 전이를 억제하는 방법이 제공되며, 방법은 세포를 본원에 기술된 유효량의 비-자연적인 HSV 벡터 또는 비-자연적인 HSV 벡터를 함유하는 조성물 또는 제약학적 조성물과 접촉시키는 단계를 포함하거나, 또는 본질적으로 그것으로 이루어지거나, 또는 또한 추가로 그것으로 이루어진다. 접촉 단계는 시험관내에서 또는 생체내에서 이루어진다. 한 측면으로, 접촉 단계는 비-자연적인 HSV 또는 조성물 또는 제약학적 조성물을 대상체에게 투여함으로써 생체내에서 이루어진다. 시험관내에서, 방법은 비-자연적인 HSV를 세포와 접촉하게 배치함으로써 실시된다. 시험관내 방법은 새로운 치료법을 테스트하기 위해 또는 치료법이 치료될 암에 적합한지를 측정하기 위한 개인맞춤형 검정으로서 사용될 수 있다. 추가적인 암 치료법은 개시된 방법과 동시에 또는 그것에 순차적일 수 있는 치료법과 조합될 수 있다.
치료될 암 세포는 고형 종양 또는 혈액 암, 예컨대 암종 또는 육종일 수 있고 그것의 비제한적인 예로는 췌장암, 신장암, 소세포 폐암, 뇌암, 신경모세포종, 신경암, 골암, 림프종, 골수종, 결장암, 자궁암, 유방암, 백혈병, 간암, 전립선암, 피부암, 또는 흑색종을 들 수 있다. 세포는 임의의 종, 예컨대 포유류 및 인간의 것이며 시험관내에서 수행될 때, 그것은 배양된 세포주 또는 일차 세포로부터, 예컨대, 조직 생검으로부터 유래될 수 있다. 세포는 성인 또는 청소년기 세포 또는 암 줄기 세포 (즉, 정상 줄기 세포와 관련된 특징, 특히 특정 암 샘플에서 발견되는 모든 세포 유형을 발생시키는 능력을 가진 암 세포) 또는 정상 줄기 세포와 관련된 그러한 특징이 없는 암 세포일 수 있다. 한 구체예에서, 세포는 N-myc 원-종양유전자 단백질 (MYCN)을 발현하고, 및/또는 비-암 세포보다 높은 수준으로 MYCN을 발현한다.
추가적으로 본 개시에는 본 개시의 유효량의 비-자연적인 HSV, 조성물 또는 제약학적 조성물을 대상체에게 투여하는 단계를 포함하는, 또는 대안으로 본질적으로 그것으로 이루어지는, 또는 또한 추가로 그것으로 이루어지는, 그것을 필요로 하는 대상체에서 암을 치료하거나, 또는 암 세포의 성장 또는 전이를 억제하는 방법이 제공된다. 치료될 대상체는 임의의 종, 예컨대 포유류 및 인간, 예컨대, 개, 말, 소, 고양이, 유인원, 래트 또는 쥐과의 것일 수 있다. 투여는 일차 치료법, 이차 치료법, 삼차 치료법, 사차 치료법, 또는 오차 치료법으로서의 투여일 수 있다. 추가적인 암 치료법은 개시된 방법과 동시에 또는 순차적일 수 있는 치료법과 조합될 수 있다. 치료될 암은 고형 종양 또는 혈액 암, 예컨대 암종 또는 육종이며 그것의 비제한적인 예로는 췌장암, 신장암, 소세포 폐암, 뇌암, 신경모세포종, 신경암, 골암, 림프종, 골수종, 결장암, 자궁암, 유방암, 백혈병, 간암, 전립선암, 피부암, 또는 흑색종을 들 수 있다.
본 개시의 방법은 질환 차도 또는 진행을 모니터링하기 위한 적절한 진단과 조합될 수 있다. 그러한 모니터링을 위한 여러 방법이 기술분야에 알려져 있다.
세포를 본 개시의 유효량의 비-자연적인 HSV, 조성물, 및/또는 제약학적 조성물과 접촉시키는 단계를 포함하는, 또는 대안으로 본질적으로 그것으로 이루어지는, 또는 또한 추가로 그것으로 이루어지는, 세포 용해를 유도하는 방법이 추가로 제공된다. 접촉 단계는 시험관내에서 또는 생체내에서 이루어진다. 한 측면으로, 접촉 단계는 비-자연적인 HSV 또는 조성물 또는 제약학적 조성물을 대상체에게 투여함으로써 생체내에서 이루어진다. 시험관내에서, 방법은 비-자연적인 HSV를 세포와 접촉하게 배치함으로써 실시된다. 시험관내 방법은 새로운 치료법을 테스트하기 위해 또는 치료법이 치료될 암에 적합한지를 측정하기 위한 개인맞춤형 검정으로서 사용될 수 있다. 추가적인 암 치료법은 개시된 방법과 동시에 또는 그것에 순차적일 수 있는 치료법과 조합될 수 있다.
치료될 세포는 고형 종양 또는 혈액 암, 예컨대 암종 또는 육종일 수 있고 그것의 비제한적인 예로는 췌장암, 신장암, 소세포 폐암, 뇌암, 신경모세포종, 신경암, 골암, 림프종, 골수종, 결장암, 자궁암, 유방암, 백혈병, 간암, 전립선암, 피부암, 또는 흑색종을 들 수 있다. 세포는 임의의 종, 예컨대 포유류 및 인간의 것이며 시험관내에서 수행될 때, 그것은 배양된 세포주 또는 일차 세포로부터, 예컨대, 조직 생검으로부터 유래될 수 있다. 세포는 성인 또는 청소년기 세포 또는 암 줄기 세포 또는 정상 줄기 세포와 관련된 특징이 없는 암 세포일 수 있다. 치료법은 치료법의 유효성, 예컨대, 암 차도 또는 진행을 테스트하기 위한 적절한 검정과 조합될 수 있다.
의약의 제조를 위한 HSV 바이러스 입자의 용도
본 발명의 HSV 및 조성물은 또한 본원에 기술된 다양한 병리를 치료하기 위한 의약의 제조에 유용하다. 조성물의 의약을 제조하기 위한 방법 및 기법은 기술분야에 알려져 있다. 단지 예시의 목적을 위해, 제약학적 제형 및 전달 경로가 여기에서 상세하게 설명된다.
그러므로, 기술분야의 숙련된 사람은, 많은 특정 구체예를 포함하여, 위에서 기술된 조성물 중 임의의 하나 이상이 본원에서 기술된 많은 장애를 치료하기 위한 의약을 제조하기 위한 표준 제약학적 제조 과정을 적용함으로써 사용될 수 있음을 쉽게 인지할 것이다. 그러한 의약은 제약학 기술분야에서 알려져 있는 전달 방법을 사용함으로써 대상체에게 전달될 수 있다.
추가 치료제의 투여
본원에 개시된 방법은 본원에 개시된 치료 효능을 증대 또는 향상시키기 위한 유효량의 추가 치료제의 투여를 추가로 포함하거나, 또는 대안으로 본질적으로 그것으로 이루어지거나, 또는 또한 추가로 그것으로 이루어질 수 있다. 한 구체예에서, 추가 치료제는 종양의 수술적 절제, 소분자 또는 면역요법 또는 세포 용해 요법과 같은 항종양제를 포함하거나, 또는 대안으로 본질적으로 그것으로 이루어지거나, 또는 또한 추가로 그것으로 이루어진다.
본 개시의 치료제 또는 물질의 환자에의 투여는, 존재한다면, 치료의 독성을 고려하여, 그 특정 일차 또는 이차 치료제의 투여를 위한 일반적인 프로토콜을 따를 것이다. 치료 주기는 필요에 따라 반복될 것으로 예상된다. 또한 다양한 표준 치료법, 뿐만 아니라 수술적 개입이 기술된 치료법과 함께 적용될 수 있는 것으로 고려된다.
기술분야에 숙련된 사람들에게 분명한 것과 같이, 병용 요법은 동시 또는 순차적 투여를 위한 병용 요법의 형태를 취할 수 있다.
키트
본원에 기술된 작용제 또는 비-자연적인 HSV는, 일부 구체예에서, 치료적, 진단적, 또는 연구 적용에서 그것의 사용을 용이하게 하기 위해 제약학적 또는 진단용 또는 연구 키트에 조립될 수 있다. 키트는 발명의 구성요소 및 사용 설명서를 내장하기 위한 하나 이상의 용기를 포함할 수 있다. 구체적으로, 그러한 키트는 본원에서 기술된 하나 이상의 작용제를, 이들 작용제의 의도된 적용 및 적절한 사용을 기술하는 설명서와 함께 포함할 수 있다. 특정 구체예에서, 키트 안의 작용제는 작용제의 특별한 적용 및 투여 방법에 적합한 제약학적 제형 및 투여량으로 있을 수 있다. 연구 목적의 키트는 다양한 실험을 실행시키기에 적절한 농도 또는 양으로 구성요소를 함유할 수 있다.
키트는 본원에 기술된 방법의 사용을 용이하게 하기 위해 설계되고 많은 형태를 취할 수 있다. 필요에 따라, 키트의 조성물의 각각은 액체 형태로 (예컨대, 용액으로), 또는 고체 형태로 (예컨대, 건조한 분말) 제공될 수 있다. 특정 경우에, 조성물의 일부는 구성적이거나 또는 그렇지 않으면, 예를 들어, 키트와 함께 제공되거나 제공되지 않을 수 있는 적절한 용매 또는 다른 종 (예를 들어, 물 또는 세포 배양 배지)의 첨가에 의해 (예컨대, 활성 형태로) 가공될 수 있다. 일부 구체예에서, 조성물은 보존 용액 (예컨대, 냉동보존 용액)에 제공될 수 있다. 보존 용액의 비제한적인 예로는 DMSO, 파라포름알데하이드, 및 CryoStor® (Stem Cell Technologies, Vancouver, Canada)을 들 수 있다. 일부 구체예에서, 보존 용액은 일정량의 메탈로프로테아제 억제제를 함유한다.
본원에서 사용되는 바, "설명서"는 설명서 및/또는 판촉의 구성요소를 규정할 수 있고, 전형적으로 발명의 포장에 관한 또는 관련된 서면 설명서를 포함한다. 설명서는 또한 사용자가 설명서가 키트와 관련되었음을 분명하게 인식하게 되도록 하는 임의의 방식으로 제공된 임의의 구두 또는 전자 설명서, 예를 들어, 시청각 (예컨대, 비디오테이프, DVD, 등), 인터넷, 및/또는 웹-기반 통신, 등을 포함할 수 있다. 서면 설명서는 의약품 또는 생물학적 제품의 제조, 사용, 또는 판매를 규제하는 정부 기관에 의해 규정된 형식일 수 있고, 설명서는 또한 동물 관리를 위한 제조, 사용, 또는 판매 기관에 의한 승인을 반영할 수 있다.
키트는 하나 이상의 용기에 본원에서 기술된 하나 이상의 구성요소를 함유할 수 있다. 예로서, 한 구체예에서, 키트는 키트의 하나 이상의 구성요소를 혼합하거나 및/또는 샘플을 분리 및 혼합하고 대상체에게 적용하기 위한 설명서를 포함할 수 있다. 키트는 본원에서 기술된 작용제들을 내장한 용기를 포함할 수 있다. HSV는 액체, 젤, 또는 고체 (분말)의 형태일 수 있다. HSV는 멸균적으로 제조되고, 주사기로 포장되고 냉장 상태로 배송될 수 있다. 대안으로, 그것은 저장용 바이알 또는 다른 용기에 내장될 수 있다. 제2 용기는 멸균적으로 제조된 다른 작용제를 가질 수 있다. 대안으로, 키트는 사전에 혼합되고 주사기, 바이알, 튜브, 또는 다른 용기로 배송된 활성 작용제를 포함할 수 있다. 키트는 대상체에게 작용제를 투여하기 위해 필요한 구성요소, 예컨대 주사기, 국소용 적용 장치, 또는 정맥내 주사 바늘 튜빙 및 주머니를 하나 이상 또는 전부 가질 수 있다.
스크리닝 검정
본 개시는 또한 알려진 및 새로운 화합물 및 조합의 잠재적 치료제를 확인하기 위한 스크리닝 검정을 제공한다. 예를 들어, 기술분야에 숙련된 사람은 또한 시험관내에서 HSV와 치료될 샘플 세포 또는 조직의 접촉에 의해 치료 이익을 제공하는지를 측정할 수 있다. 세포 또는 조직은 임의의 종, 예컨대, 유인원, 개, 소, 양, 래트, 마우스 또는 인간으로부터 유래될 수 있다.
접촉은 또한 적절한 동물 모델 또는 인간 환자에서 생체내에서 수행될 수 있다. 시험관내에서 수행될 때, HSV는 세포 배양 배지에 직접 첨가될 수 있다. 시험관내에서 실시될 때, 방법은 동물 또는 인간 환자에게 투여 전에 신규한 병용 요법, 제형 또는 치료 처방에 대해 스크리닝하기 위해 사용될 수 있다.
또 다른 측면으로, 검정은 적합한 세포 또는 조직을 포함하는 제1 샘플 ("대조군 샘플")을 본원에 개시된 유효량의 HSV와 접촉시키는 것과 적합한 세포 또는 조직의 제2 샘플 ("테스트 샘플")을 검정하고자 하는 HSV, 작용제 또는 조합과 접촉시키는 것을 필요로 한다. 암의 경우 한 측면으로, 제1 및 제2 세포 샘플의 성장의 억제가 측정된다. 만약 제2 샘플의 성장의 억제가 제1 샘플의 것과 실질적으로 동일하거나 더 크다면, 작용제는 잠재적인 치료 약물이다. 한 측면으로, 세포의 실질적으로 동일한 또는 더 큰 성장의 억제는 약 1% 미만, 또는 대안으로 약 5% 미만 또는 대안으로 약 10% 미만, 또는 대안으로 약 10%보다 큰, 또는 대안으로 약 20%보다 큰, 또는 대안으로 약 50%보다 큰, 또는 대안으로 약 90%보다 큰 차이이다. 접촉은 시험관내에서 또는 생체내에서 이루어질 수 있다. 세포 성장의 억제를 측정하기 위한 수단은 기술분야에 잘 알려져 있다.
추가의 측면으로, 테스트 작용제는 대조군 및 테스트 샘플에 대한 정상적인 대응 세포 또는 조직 및 세포 또는 조직의 제2 샘플을 처리하지만 제3 샘플에는 불리하게 영향을 미치지 않는 선택제를 포함하는 세포 또는 조직의 제3 샘플과 접촉된다. 본원에 기술된 검정의 목적에 대해, 적합한 세포 또는 조직은 본원에 기술된 암 또는 다른 질환과 같이 본원에 기술된다. 그러한 것의 예로는 한정하는 것은 아니지만 생검에 의해 또는 혈액으로부터 얻어진 암 세포 또는 조직을 들 수 있다.
테스트 조성물의 효능은, 한정하는 것은 아니지만 세포 생존성 검정을 포함하는, 기술분야에 알려져 있는 방법들을 사용하여 측정된다.
또한 추가의 측면으로, 검정은 적어도 2개의 세포 유형을 필요로 하고, 첫 번째는 적합한 대조군 세포이다.
검정은 또한 HSV에 치료될 세포를 함유한 샘플을 전달하고, 병리에 따라 달라질 것인 치료에 대해 검정함으로써, 또는 새로운 약물 및 조합에 대해 스크리닝하기 위해 검정함으로써 대상체가 본 개시에 의해 적합하게 치료될 것인지를 예측하는 데 유용하다. 한 측면으로, 세포 또는 조직은 생검에 의해 대상체 또는 환자로부터 얻어진다. 본 개시는 또한 본 개시의 적어도 하나의 조성물 및 사용 설명서를 제공함으로써 병리적 세포 또는 환자가 이 치료법에 의해 적합하게 치료될 것인지의 여부를 측정하기 위한 키트를 제공한다.
테스트 세포는 작은 다중-웰 플레이트에 성장될 수 있고 테스트 화합물의 생물학적 활성을 검출하기 위해 사용된다. 본 개시의 목적에 대해, 성공적인 HSV 또는 다른 작용제는 암 세포의 성장을 차단하거나 사멸시키겠지만 대조군 세포 유형은 손상시키지 않은 채로 남겨둔다.
다음의 실시예는 개시를 예시하기 위해 제공되며 개시를 제한하지 않는다.
실시예
HSV 돌연변이체의 제조
비-허용적 세포주를 17TermA 및 rRp450으로 감염시키고 ("유도 진화") 여러 계대 후에 배양하여 야생형-유사 유전자형을 함유하는 HSV Mut-3 돌연변이체를 분리하였다. 그런 후 HSV Mut-3 돌연변이체를 사용하여 유전자 편집 ("CRISPR/Cas9"로 표시됨)을 통해 를 구성하였다 (도 1A). Mut-3과 그것의 부모 바이러스와의 서열 비교를 도 1B에 도시한다. UL15, UL29, US8, RL1 및 RL2를 포함한, Mut-3에서 어느 한 쪽의 부모와 상이한 비동의 돌연변이는 역 슬래시로 음영처리한다. 17TermA와 동일한 게놈 서열을 빈 박스로소 표시한다; rRp450과 동일한 것은 슬래시로 음영처리한다.
야생형-유사 유전자형을 함유한 강력한 oHSV 돌연변이체인 Mut-3을 분리하였다. Mut-3 및 감쇠된 버전 Mut-3△34.5는 둘 다 성공적인 감염을 달성하기 위하여 정식 HSV 진입 단백질, 넥틴-1 또는 헤르페스 바이러스 진입 매개체 (HVEM)에 의존한다 (미제시). 검출 가능한 GFP 양성 면적의 개시에 의해 측정되는 바 Mut-3△34.5 바이러스 유전자 전달의 동역학은 동일한 CRISPR/Cas9 유전자 편집 전략을 통해 야생형 스트레인 17로부터 유래된 γ134.5-무효 바이러스인 17Δ34.5와 비교할 때 훨씬 더 초기이다. 더불어, Mut-3△34.5 감염은 그것의 더 적은 세포 합류 면적에 의해 측정되는 바 더 많은 세포 사멸로 이어진다. 그러나, Mut-3△34.5는 17Δ34.5 또는 Mut-3 D34.5-무효 부모 바이러스인 17TermA와 비교하면 덜 복제할 수 있는 것으로 나타난다. 이들 결과는 감쇠된 Mut-3△34.5 버전으로도, 특유한 게놈 변경(들)이 융합체 표현형 (미제시)을 초래하고 향상된 능력이 유지되는 것을 나타낸다. 표피 성장 인자 수용체 (EGFR)-재표적화된 HSV의 연구에서, 융합체 돌연변이를 도입하는 것이 진입의 특이성 및 확산을 손상시키지 않는 것이 보고되었다. 이론에 구속되지는 않지만, 출원인은 Mut-3△34.5의 융합체 표현형의 근본적인 원인이 바이러스의 세포 막에 대한 융합시 변경된 동역학을 초래할 수 있고 그것이 진입 및/또는 바이러스 매개된 세포-대-세포 융합에 영향을 미칠 것이며, 더 빠른 세포 사멸 및 감소된 바이러스 입자 생성으로 이어질 것이라고 여긴다.
돌연변이는 HSV-1 진입에 관여하는 정식 당단백질인 gB, gD, gH 및 gL에서 발견되지 않았다. 그러나, 5개의 유전자는 어느 한 쪽 부모와 상이한 Mut-3의 비동의적 (NS) 돌연변이를 함유한다: RL1, RL2, UL15, UL29 및 Us8/gE. Mut-3 및 그것의 감쇠된 버전 Mut-3△34.5는 둘 다 융합적인 표현형을 나타내며, 이것은 이런 현상이 RL1-관련되지 않은 것을 시사한다. 전체 게놈 분석은 또한 Mut-3의 아미노산 서열이 gK/UL53 및 UL20에서 rRp450 및 참조 스트레인 17 게놈 (융합체 바이러스가 아님)과 동일하거나, 또는 gB/UL27 및 UL24에서 17TermA (융합체 바이러스가 아님)에 동일하기 때문에 이 표현형이 이전에 보고된 돌연변이와 연결되지 않는 것을 시사한다. gE/Us8의 A151T 돌연변이는 그것의 부모 바이러스와 비교하여 NS 돌연변이를 가진 Mut-3의 유일한 당단백질 (비리온 표면 단백질)이다. 비록 gE가 바이러스 부착이나 진입과 연결되지는 않았지만, gE의 돌연변이가 더 작은 플라크 크기와 관련되었기 때문에 gE/gI 다이머화는 바이러스 세포-대-세포 확산을 매개한다. **출원인은 Mut-3△34.5의 gE의 A151T가 그것의 융합체 및 증가된 효능 표현형의 근본적인 원인일 수 있다고 가설을 세웠다. 출원인의 연구 우선 순위를 토대로 (위에서 아래로), 표 1에서 출원인은 Mut-3의 5개의 유전자에서 발견된 전부 5개의 NS 돌연변이뿐만 아니라 각각의 유전자의 상응하는 기능, Mut-3 증가된 효능 표현형과 관련된 가능한 역할, 및 출원인 제안 연구를 열거한다. 다른 3개의 돌연변이 (RL1 제외)는 또한 gE A151T에 대해 시행된 것과 같이 측정할 수 있다.
유전자 | 단백질 기능 | NS 돌연변이 | 실험 |
Us8 | 당단백질 E | nt 451 g에서 a로, a.a A151T |
하기에서 상세하게 설명되는 것과 같이, 예를 들어, "기능 상실 연구를 위한 Mut-3△34.5에서의 Us8/gE 복귀 돌연변이체" 및 "기능 획득에 대한 Mut-3 부모 17TermA에서의 Us8/gE A151T 돌연변이" 제목의 섹션 하에서 |
RL2 | ICP0, 즉시 초기 유전자 (IE) 유전자. 유비퀴틴 E3 리가제, 초기 유전자 발현을 조절함 |
nt 1712 g에서 a로, a.a R258H |
기능 상실 및 획득 테스트: i) 예를 들어, "HSV 돌연변이체의 비교" 제목의 섹션 하에서, 하기에서 상세하게 설명되는 것과 같이 관찰된 더 빠른 진입 또는 확산을 검증하기 위함 ii) HSV 초기 유전자의 변화를 평가함 (예컨대 ICP8 & TK 발현) |
UL15 | DNA 포장 터미나제 하위단위 1. UL29/ICP8로 공동 국지화된 UL28, UL33 | nt 1126 g에서 a로, a.a A376T | 기능 상실 및 획득 테스트: iii) 예를 들어, "HSV 돌연변이체의 비교" 제목의 섹션 하에서, 하기에서 상세하게 설명되는 것과 같이 관찰된 더 빠른 진입 또는 확산을 검증하기 위함 iv) HSV DNA 복제의 변화를 평가함 |
UL29 | ICP8, 초기 (E) 유전자, 단일 가닥 DNA-결합 단백질 | nt 3464 c에서 t로, a.a T1155M | 기능 상실 및 획득 테스트: i) 예를 들어, "HSV 돌연변이체의 비교" 제목의 섹션 하에서, 하기에서 상세하게 설명되는 것과 같이 관찰된 더 빠른 진입 또는 확산을 검증하기 위함 ii) HSV DNA 복제의 변화를 평가함 |
RL1 | ICP34.5, 신경병독성 단백질 | nt 356 c에서 a로, P119H, H119는 17+와 동일함 |
Mut-3△34.5가 융합체로 남아 있어서 배제됨 |
HSV 돌연변이체의 비교
플라크 검정을 도 1A에 도시된 4개의 바이러스에 대해 동시에 수행하였고 3일 후에 플라크 이미지를 Keyence HS 올인원 형광 현미경 BZ-II 분석기를 통해 스캔하고 분석하였다. 도 1A 및 1B에서 나타낸 것과 같이, Mut-3 및 Mut-3Δ34.5의 플라크 크기는 두 부모 바이러스 rRp450 및 17TermA보다 상당히 더 컸다. CHO 세포 세트의 시험관내 세포독성/MTS 검정에서, CHO-K1, CHO-넥틴-1, CHO-넥틴-2 및 CHO-HVEM을 상이한 감염 다중도 (MOI)를 가진 4개의 바이러스로 감염시켰다. 세포 생존 열량측정 세포 증식 및 MTS 검정을 미처리 대조군에 비해 바이러스 감염 후 (pvi) 3일 후에 측정하였다. CHO-K1 또는 CHO-넥틴-2 (주로 HSV-2 진입용)가 아닌 CHO-넥틴-1 및 CHO-HVEM 만이 4개 바이러스의 처리에 대해 민감하였다 (도 2C). 이론에 구속되지는 않지만, 결과는 Mut-3 및 Mut-3Δ34.5가 수용체 장벽을 우회하지 않고 세포를 감염시키기 위해 여전히 정식 HSV 진입 수용체를 전달하는 것을 시사하였다.
17TermA와 비교하여 인간 및 쥐과 신경모세포종 세포의 사멸에서 Mut-3Δ34.5에 대한 증가된 효능은 감염성 바이러스의 증가된 수율로 인한 것이 아니었다 (도 3). 투과 전자 현미경 ("TEM")에 의한 분석 또한 신경모세포종 세포의 감염 후에, Mut-3Δ34.5 비리온은 주로 세포내이입성 소포에서 발견된 한편, 17TermA 비리온은 주로 세포내이입성 소포에서 발견된 것을 나타냈다 (도 4).
감쇠된 17Δ34.5 돌연변이체는 야생형 스트레인 17+의 g134.5 유전자를 EGFP 발현 카세트로 대체하기 위한 CRISPR-Cas9 유전자 편집 기법에 의해 생성되었다. 17Δ34.5 돌연변이체는 그것의 야생형 스트레인 17+보다 낮은 효능을 갖지만, 17TermA와 비슷하였다 (도 5). 17Δ34.5의 감쇠는 Mut-3Δ34.5가 17 Δ34.5와 비교하여 훨씬 더 빠른 바이러스 유전자 전달 및 세포 사멸을 나타낼 때 추가로 확인되었다 (도 6). 더불어, Mut-3Δ34.5는 생체내에서 인간 신경모세포종 성장을 제j는 데 17TermA보다 더 효과적이었다 (도 7).
기능 상실 연구를 위한 Mut-3△34.5에서의 Us8/gE 복귀 돌연변이체
CRISPR/Cas9 기술을 통해서만 HSV 게놈에 단일 뉴클레오타이드 변화를 도입하는 것은 바이러스 복제 중에 게놈의 다중 복사물 및 이런 유전자 편집에 선택 마커를 동반하지 못하는 무능력으로 인해 어렵다. 한 구성물은 CRISPR/Cas9 기술과 조합된 2-단계 과정: 전체 gE 코딩 영역을 리포터 유전자 (예컨대 mCherry 또는 적색 형광 단백질 (RFP))로 대체하여 gE-무효 Mut-3△34.5를 구성하는 단계; 그런 후 2) 리포터 유전자를 WT gE 코딩 영역으로 대체하여 gE-WT Mut-3△34.5 복귀 돌연변이체를 초래하는 단계의 결과이다.
Examination of the extent to which both the gE-무효 중간체 및 이런 gE 복귀 돌연변이체 Mut-3△34.5가 둘 다 표현형을 상실하는 정도의 조사는 위에서와 같이 관찰할 수 있다. 본 개시는 이 구성물 역시 제공한다.
기능 획득에 대한 Mut-3 부모 17TermA의 Us8/gE A151T 돌연변이
위에서와 같이, gE 돌연변이체 17TermA를 2 단계로 구성하였다: 1) gE 코딩 영역을 완전히 녹아웃시키고 그것을 리포터 유전자 (예컨대, GFP)로 대체하는 단계; 그런 후 2) 리포터 유전자를 A151T 돌연변이를 함유한 gE 코딩 영역을 녹인함으로써 대체하는 단계. Mut-3△34.5의 표현형을 측정할 것이다. 본 개시는 이 구성물 역시 제공한다.
gE A151T가 관찰된 표현형의 일부만 담당하거나 또는 전혀 담당하지 않는다면, 또는 그렇다고 해도, Mut-3의 다른 돌연변이가 본 개시에 의해 제공된다. 돌연변이체는 본원에서 기술된 바와 같이, 그리고 표 1에서 주지된 것과 같이, 단독으로 또는 조합하여 유사한 기능 획득 및 상실 접근법을 체계적으로 수행하여 구성하였다. 감쇠된 Mut-3△34.5의 안전성 프로파일 및 효능을 마우스 모델에서 테스트할 수 있다. 그러므로, 본 개시는 돌연변이체를 테스트하기 위해 사용된 동물 모델뿐만 아니라 그렇게 하는 방법을 제공한다.
강력하고 야생형-유사 HSV 돌연변이체인 Mut-3 스트레인을 17TermA 및 rRp450의 재조합으로부터 구성하였다. 감쇠된 버전인 Mut-3△34.5를 γ134.5/RL1, 바이러스 병독성 단백질의 결실을 통해 생성하여 임상 사용을 위한 안전성을 보장하였다. 출원인의 파일럿 독성 연구에서 최대 1e8 플라크-형성 단위 (pfu)의 정맥내 투여 후 85일 이상 Balb/c 마우스에서 불리한 임상 신호 또는 유의한 변화가 관찰되지 않았다 (미제시). 더불어, Mut-3△34.5는 또한 시험관내에서 (도 3A) 및 생체내에서 (도 7) 모두 17TermA와 비교하여 고도로 공격적인 신경모세포종에서 항종양 효능을 나타낸다.
나이브 비-종양 내재 마우스에서 Mut-3△34.5의 생체분포 프로파일
출원인 자체 연구는 나이브 Balb/c 마우스가 85일 이상 동안 어떠한 질병의 신체 신호 없이 최대 1e8 pfu의 정맥내 (iv) 전달된 Mut-3△34.5 바이러스를 견디는 것을 보여준다. 생체분포 연구를 두 성별 (성별당 30마리 마우스)의 나이브 비-종양 내재 Balb/c 마우스에 이전에 테스트된 최고 용량 (마우스당 1e8 pfu의 Mut-3△34.5 바이러스)의 정맥내 투여로 시작하여 수행하였다. 말초혈을 수집한 후 마우스를 희생시켰다. 고환, 난소, 비장, 폐, 신장, 심장, 폐 및 뇌를 바이러스 감염 후 24시간, 14일, 28일, 56일 및 85일 째에 수득하였다 (각 시점에 n=6마리). 장기의 절반을 포르말린에 내장시켜서 병리 분석을 위해 보존하고, 나머지 절반을 HSV 게놈의 qPCR 분석 및 플라크 검정을 위해 균등화하여 각 장기에서의 바이러스 부담을 평가하였다. 마우스를 바이러스 투여 후 처음 2주 동안은 매일 관찰하고, 그런 후 계획된 희생날 까지 주 2회 관찰한다. 각 마우스의 체중을 바이러스 전과 그 후 매주 측정한다. 마우스를 희생시켜서 불리한 임상 신호의 존재 또는 부재 또는 20%를 넘는 체중 손실이 있는지를 나타내고 위에서 기술한 것과 같이 장기에서의 바이러스 활성에 대해 분석한다. 그와 나란히, 야생형 KOS 바이러스 [투여량 범위: 마우스당 (n=3마리) 1 X 105 내지 1 X 107 pfu]를 양성 (안전하지 않은) 대조군으로서의 마우스 그룹에 투여한다. 출원인은 이전에 1 X 106 pfu KOS 바이러스의 용량이 FVBN 마우스에서 2 내지 3일 이내에 균일하게 치명적인 것을 발견하였다. qPCR을 수행하여 HSV 게놈 복사물을 분석하고, 플라크 검정으로 바이러스 활성을 평가하고 질병 신호를 보이는 양성 대조군 마우스의 장기에서 병리를 분석한다. 이들 결과는 Mut-3Δ34.5-처리된 마우스로부터 수집된 데이터를 평가하기 위한 양성 지표/한계값으로서 작용할 수 있다. 양성 대조군에 대해 비교할만한 바이러스 부담을 나타내기 위하여 Mut-3Δ34.5-처리된 그룹의 조직/장기의 병리적 변화를 추가로 평가한다. 각 성별에 대해 그룹당 6마리 마우스를 사용하여 상이한 기간에 걸친 생체분포 및 안전성 및 내성을 평가한다. Mut-3Δ34.5의 생체분포를 기술 통계를 사용하여 상이한 시간 동안 상이한 장기에서 게놈 DNA의 나노그램당 HSV 게놈 복사물의 수에 의해 측정하고 단일변량 분석으로 비교한다 (적용 가능한 경우).
시험관내에서 다양한 소아암 세포에서 다른 γ
1
34.5-무효 바이러스 (17TermA 및 T-VEC)를 가진 Mut-3Δ34.5의 세포독성
Mut-3Δ34.5에 의한 월등한 사멸을 인간 및 쥐과 신경모세포종 세포에서 17TermA와 비교하여 관찰하였다 (도 3A). 도 3A에 도시된 시험관내 검정에서 동일한 MTS를 사용하여, 동일한 분석을 다른 소아암 세포, 예컨대 편평성, 악성 말초 신경초 종양 (MPNST) 및 뇌종양 (출원인은 수많은 모델에 접근해봄)에 적용하여 증가된 효능 표현형이 상이한 종양 유형을 가로질러 적용할 수 있는지를 측정한다. 각각의 세포 유형으로부터 가장 효과적인 라인을 사용하여 생체내 효능 연구를 수행한다.
다른 oHSV 치료제, 17TermA 및 T-VEC와 비교하여 인간 소아 종양 모델에서 Mut-3
Δ
34.5의 효능을 조사한다.
각각의 종양 유형 (총 3개)의 매우 반응적인 모델 중 하나를 선택하여 생후 5 내지 6주령의 암컷 무흉선 누드 마우스를 사용하여 이종이식편에서 효능 연구를 수행한다. 종양이 150-300 mm3에 도달했을 때, 마우스를 모으고 무작위로 3개 그룹으로 나눈다 (각각 n=11마리): i) 인산염 완충 식염수 (PBS) 대조군, ii) Mut-3Δ34.5 바이러스, 또는 iii) 17TermA 또는 T-VEC 바이러스. 바이러스간 효능에 대해, 그룹당 최소 11마리 마우스를 사용하여 생존율 및 종양 성장에서 최소 80% 전력으로 큰 차이 (20일 째에 20% 대비 80%)를 검출한다. 각 마우스를 출원인의 이전 연구를 토대로 총 3회 주사 치료 처방으로, 격일로 100 μl의 PBS 중의 1 X 107 pfu의 바이러스 또는 PBS 단독 (대조군)으로 종양내로 처리한다. 마우스를 바이러스 주사 후 80일 동안 종양 부피 (주 2회) 및 체중 (주마다)에 대해 모니터링한다. 종점 기준은 2500 mm3를 초과하는 종양 부피, 2 cm에 도달하는 종양 직경, 또는 20%를 초과하는 체중 손실을 포함한다. 동물 생존율을 카플란-마이어 곡선을 사용하여 표시할 수 있고 생존율을 로그-순위 테스트에 의해 그룹간에 비교할 수 있다.
다른 oHSV 치료제 (17TermA 및 T-VEC)와 비교하여 쥐과 소아 종양 모델에서의 Mut-3Δ34.5의 효능
각각의 종양 유형 (총 2개)의 매우 반응적인 쥐과 종양 모델 중 하나를 선택하여 생후 5 내지 6주령의 성별 매칭한 C57BL6 마우스에서 출원인의 효능 연구를 수행한다. 유사하게, 마우스를 모으고 각각 n=11마리로 무작위로 3개 그룹으로 나눈다: i) PBS, ii) Mut-3Δ34, iii) 17TermA 또는 T-VEC. 각 마우스를 출원인의 이전 연구와 같이 총 3회 주사로, 격일로 100 μl의 PBS 중의 1e8 pfu의 바이러스 또는 PBS 단독으로 종양내로 처리한다. 종점 기준은 2500 mm3를 초과하는 종양 부피, 2 cm에 도달하는 종양 직경, 또는 20%를 초과하는 체중 손실을 포함한다. 동물 생존율을 카플란-마이어 곡선을 사용하여 표시할 것이고 생존율을 로그-순위 테스트에 의해 그룹간에 비교할 것이다.
병리 분석의 요약
4마리의 야생형 KOS 주사된 마우스 (1e6 및 1e7 pfu, 용량당 2마리 마우스)로부터의 조직을 OSU 비교 병리학 및 마우스 표현형 공유 자원(OSU Comparative Pathology & Mouse Phenotyping Shared Resource)을 통해 병리 분석을 위해 제출하였다. Mut-3△34.5/C8G5 및 Mut-3DICP6 /D7-1 주사된 마우스 (바이러스 감염 후 24시간 및 14일 시점, 각 시점당 2마리 마우스)로부터의 조직을 계속해서 병리 분석을 위해 제출하였다.
병리 보고서 (암컷): KOS 주사된 마우스
뇌간의 림프형질구성 뇌염이 HSV-1로 주사된 Balb/c 마우스에서의 CNS 병리의 공개된 보고와 일치한다. 이 제출에서 조사한 모든 마우스는 이 병변이 있었지만, 하나의 제출된 뇌만 뇌간의 작은 분절을 포함하였고 따라서 다른 3마리의 마우스보다 병변이 더 약하게 나타났다. 부신 섹션은 2마리 마우스로부터의 신장 섹션과 함께 존재하였다. 이들 마우스는 모두 부신 피질과 수질에서 모두 뚜렷한 괴사가 있었다.
병리 보고서 (암컷): Mut-3△34.5/C8G5 및 Mut-3△ICP6/D7-1 주사된 두 마우스에 대해 24시간 및 14일
HSV 감염 후 24시간 후에 희생된 마우스로부터의 샘플은 모두 적당하거나 현저한 중증도의 다음의 병변을 가졌다: 개별적인 간세포 및 국소적으로 광범위한 간 코드를 포함한 주변부 내지 중부 간 괴사; 뚜렷한 비장 적색 펄프 괴사 및 예상했던 여포보다 작은 중간의 백색 펄프 괴사. 몇몇 24시간 마우스는 여포 및 난소 조직의 활체의 세포의 세포자멸사/괴사가 증가하였다. 이것은 몇달 전에 평가된 대조군 마우스에서 예상된 양 이상으로 주지되지 않았고, 여기서 주지된 마우스에서는 예상된 양을 초과하였다.
14일 마우스에서, 난형 세포 과증식은 손상이 진행중인 간의 흔한 만성 반응이며 관찰자의 감염에 대한 반응일 가능성이 있다. 폐의 약간의 샘플은 24시간 동물에서는 주지되지 않았던 괴사 및 염증 병변을 나타냈다. 전체적으로, 14일 마우스는 24시간 동물보다 더 적고 훨씬 더 가벼운 병변을 나타냈다.
실험실에서 개발된 돌연변이체 바이러스는, 특히 24시간 째에 간세포, 적색 및 백색 펄프의 비장세포, 및 난소 세포를 포함한 다양한 세포 유형의 괴사에 기여할 수 있다.
동등물
다르게 정의되지 않는 한, 본원에서 사용된 모든 기술적이고 과학적인 용어는 본 발명이 속하는 기술분야의 통상적인 지식을 가진 사람에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다.
본원에서 예시적으로 기술된 발명은 본원에서 구체적으로 개시되지 않은 임의의 요소 또는 요소들, 제한 또는 제한들의 부재 하에 적합하게 실시될 수 있다. 그러므로, 예를 들어, 용어 "구성하는", "포함하는", "함유하는", 등은 광범위하고 제한 없이 판독되어야 한다. 추가적으로, 본원에서 사용된 용어 및 표현은 제한이 아닌 설명의 용어로서 사용되었고, 그러한 용어 및 표현의 사용에서 제시되고 기술된 특징 또는 그것의 일부분의 어떠한 동등물도 배제하려는 의도는 없지만, 청구되는 발명의 범주 내에서 다양한 수정이 가능한 것이 인식된다.
그러므로, 비록 본 발명이 바람직한 구체예 및 선택적인 특징에 의해 구체적으로 개시되었지만, 본원에서 구현된 발명의 수정, 개선 및 변형이 기술분야에 숙련된 사람들에 의해 복원될 수 있고, 그러한 수정, 개선 및 변형은 본 발명의 범주 내에 있는 것으로 간주되는 것이 이해되어야 한다. 본원에 제공된 물질, 방법, 및 실시예는 바람직한 구체예를 대표하고, 예시적이며, 발명의 범주에 대한 제한으로서 의도되지 않는다.
발명은 본원에서 광범위하고 일반적으로 기술되었다. 일반적인 개시에 속하는 보다 좁은 유형 및 하위유형 그룹 또한 발명의 일부를 형성한다. 이것은 삭제된 물질이 구체적으로 본원에서 재인용되거나 그렇지 않거나 간에, 유형으로부터 어떠한 주제를 제거하는 단서 또는 부정적인 제한이 있는 발명의 일반적인 설명을 포함한다.
본원에서 언급된 모든 출판물, 특허 출원, 특허, 및 기타 참고문헌은 각각이 개별적으로 참조로서 포함된 것과 동일한 정도로, 모든 식 및 특징을 포함하여, 그것의 전문이 참조로 분명하게 포함된다. 갈등이 있는 경우, 정의를 포함하여, 본 명세서가 우선할 것이다.
다른 구체예는 다음의 청구범위 내에서 제시된다.
SEQ ID NO. 1: Mut 3 및 Mut-3ICP6 바이러스 스트레인의 ICP34.5의 DNA 서열. c356a 돌연변이는 하기 서열에서 진한 이탤릭체로 제시된다.
ATGGCCCGCCGCCGCCGCCATCGCGGCCCCCGCCGCCCCCGGCCGCCCGG
GCCCACGGGCGCGGTCCCAACCGCACAGTCCCAGGTAACCTCCACGCCCA
ACTCGGAACCCGTGGTCAGGAGCGCGCCCGCGGCCGCCCCGCCGCCGCCC
CCCGCCAGTGGGCCCCCGCCTTCTTGTTCGCTGCTGCTGCGCCAGTGGCT
CCACGTTCCCGAGTCCGCGTCCGACGACGACGACGACGACTGGCCGGACA
GCCCCCCGCCCGAGCCGGCGCCAGAGGCCCGGCCCACCGCCGCCGCCCCC
CGCCCCCGGTCCCCACCGCCCGGCGCGGGCCCGGGGGGCGGGGCTAACCC
CTCCC A CCCCCCCTCACGCCCCTTCCGCCTTCCGCCGCGCCTCGCCCTCC
GCCTGCGCGTCACCGCAGAGCACCTGGCGCGCCTGCGCCTGCGACGCGCG
GGCGGGGAGGGGGCGCCGAAGCCCCCCGCGACCCCCGCGACCCCCGCGAC
CCCCACGCGGGTGCGCTTCTCGCCCCACGTCCGGGTGCGCCACCTGGTGG
TCTGGGCCTCGGCCGCCCGCCTGGCGCGCCGCGGCTCGTGGGCCCGCGAG
CGGGCCGACCGGGCTCGGTTCCGGCGCCGGGTGGCGGAGGCCGAGGCGGT
CATCGGGCCGTGCCTGGGGCCCGAGGCCCGTGCCCGGGCCCTGGCCCGCG
GAGCCGGCCCGGCGAACTCGGTCTAA
SEQ ID NO. 2: Mut3 및 Mut-3ICP6의 ICP34.5의 아미노산 서열. P119H 돌연변이는 하기 서열에서 진한 이탤릭체로 제시된다.
MARRRRHRGPRRPRPPGPTGAVPTAQSQVTSTPNSEPVVRSAPAAAPPPP
PASGPPPSCSLLLRQWLHVPESASDDDDDDWPDSPPPEPAPEARPTAAAP
RPRSPPPGAGPGGGANPS H PPSRPFRLPPRLALRLRVTAEHLARLRLRRA
GGEGAPKPPATPATPATPTRVRFSPHVRVRHLVVWASAARLARRGSWARE
RADRARFRRRVAEAEAVIGPCLGPEARARALARGAGPANSV
SEQ ID NO. 3: EGFP의 DNA 코딩 서열. ICP34.5 코딩 영역은 Mut3IC34.5에서 EGFP 발현 카세트 (도 5C, SEQ ID NO: 11)로 대체되었다.
ATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGT
CGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGG
GCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACC
ACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTA
CGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACT
TCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTC
TTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGG
CGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGG
ACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAAC
GTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAA
GATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACC
AGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCAC
TACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGA
TCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCA
TGGACGAGCTGTACAAGAAGCTTAGCCATGGCTTCCCGCCGGAGGTGGAG
GAGCAGGATGATGGCACGCTGCCCATGTCTTGTGCCCAGGAGAGCGGGAT
GGACCGTCACCCTGCAGCCTGTGCTTCTGCTAGGATCAATGTGTAG
SEQ ID NO. 4: EGFP의 아미노산 코딩 서열.
MVSKGEELFTGVVPILVELDGDVNGHKFSVSGEGEGDATYGKLTLKFICT
TGKLPVPWPTLVTTLTYGVQCFSRYPDHMKQHDFFKSAMPEGYVQERTIF
FKDDGNYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNYNSHN
VYIMADKQKNGIKVNFKIRHNIEDGSVQLADHYQQNTPIGDGPVLLPDNH
YLSTQSALSKDPNEKRDHMVLLEFVTAAGITLGMDELYKKLSHGFPPEVE
EQDDGTLPMSCAQESGMDRHPAACASARINV
SEQ ID NO. 5: 17TermA 스트레인의 ICP34.5의 DNA 서열.
ATGGCCCGCCGCCGCCGCCATCGCGGCCCCCGCCGCCCCCGGCCGCCCGG
GCCCACGGGCGCCGTCCCAACCGCACAGTCCCAGGTAACCTAGACTAGTC
TAGCGTAACCTCCACGCCCAACTCGGAACCCGCGGTCAGGAGCGCGCCCG
CGGCCGCCCCGCCGCCGCCCCCCGCCGGTGGGCCCCCGCCTTCTTGTTCG
CTGCTGCTGCGCCAGTGGCTCCACGTTCCCGAGTCCGCGTCCGACAACGA
CGATGACGACGACTGGCCGGACAGCCCCCCGCCCGAGCCGGCGCCAGAGG
CCCGGCCCACCGCCGCCGCCCCCCGGCCCCGGCCCCCACCGCCCGGCGTG
GGCCCGGGGGGCGGGGCTGACCCCTCCCACCCCCCCTCGCGCCCCTTCCG
CCTTCCGCCGCGCCTCGCCCTCCGCCTGCGCGTCACCGCGGAGCACCTGG
CGCGCCTGCGCCTGCGACGCGCGGGCGGGGAGGGGGCGCCGGAGCCCCCC
GCGACCCCCGCGACCCCCGCGACCCCCGCGACCCCCGCGACCCCCGCGCG
GGTGCGCTTCTCGCCCCACGTCCGGGTGCGCCACCTGGTGGTCTGGGCCT
CGGCCGCCCGCCTGGCGCGCCGCGGCTCGTGGGCCCGCGAGCGGGCCGAC
CGGGCTCGGTTCCGGCGCCGGGTGGCGGAGGCCGAGGCGGTCATCGGGCC
GTGCCTGGGGCCCGAGGCCCGTGCCCGGGCCCTGGCCCGCGGAGCCGGCC
CGGCGAACTCGGTCTAA
SEQ ID NO. 6: 17TermA 스트레인의 ICP34.5의 아미노산 서열.
MARRRRHRGPRRPRPPGPTGAVPTAQSQVT*
(*중지 코돈 - * 뒤의 서열은 발현되지 않는 것으로 예측됨)
SEQ ID NO. 7: rRp450 스트레인의 ICP34.5의 DNA 서열.
ATGGCCCGCCGCCGCCATCGCGGCCCCCGCCGCCCCCGGCCGCCCGGGCC
CACGGGCGCGGTCCCAACCGCACAGTCCCAGGTAACCTCCACGCCCAACT
CGGAACCCGTGGTCAGGAGCGCGCCCGCGGCCGCCCCGCCGCCGCCCCCC
GCCAGTGGGCCCCCGCCTTCTTGTTCGCTGCTGCTGCGCCAGTGGCTCCA
CGTTCCCGAGTCCGCGTCCGACGACGACGACGACGACTGGCCGGACAGCC
CCCCGCCCGAGCCGGCGCCAGAGGCCCGGCCCACCGCCGCCGCCCCCCGC
CCCCGGTCCCCACCGCCCGGCGCGGGCCCGGGGGGCGGGGCTAACCCCTC
CCCCCCCCCCTCACGCCCCTTCCGCCTTCCGCCGCGCCTCGCCCTCCGCC
TGCGCGTCACCGCAGAGCACCTGGCGCGCCTGCGCCTGCGACGCGCGGGC
GGGGAGGGGGCGCCGAAGCCCCCCGCGACCCCCGCGACCCCCGCGACCCC
CACGCGGGTGCGCTTCTCGCCCCACGTCCGGGTGCGCCACCTGGTGGTCT
GGGCCTCGGCCGCCCGCCTGGCGCGCCGCGGCTCGTGGGCCCGCGAGCGG
GCCGACCGGGCTCGGTTCCGGCGCCGGGTGGCGGAGGCCGAGGCGGTCAT
CGGGCCGTGCCTGGGGCCCGAGGCCCGTGCCCGGGCCCTGGCCCGCGGAG
CCGGCCCGGCGAACTCGGTCTAA
SEQ ID NO. 8: rRp450 스트레인의 ICP34.5의 아미노산 서열.
MARRRHRGPRRPRPPGPTGAVPTAQSQVTSTPNSEPVVRSAPAAAPPPPP
ASGPPPSCSLLLRQWLHVPESASDDDDDDWPDSPPPEPAPEARPTAAAPR
PRSPPPGAGPGGGANPSPPPSRPFRLPPRLALRLRVTAEHLARLRLRRAG
GEGAPKPPATPATPATPTRVRFSPHVRVRHLVVWASAARLARRGSWARER
ADRARFRRRVAEAEAVIGPCLGPEARARALARGAGPANSV
SEQ ID NO. 9: 야생형 17 스트레인의 ICP34.5의 DNA 서열.
ATGGCCCGCCGCCGCCGCCATCGCGGCCCCCGCCGCCCCCGGCCGCCCGG
GCCCACGGGCGCGGTCCCAACCGCACAGTCCCAGGTAACCTCCACGCCCA
ACTCGGAACCCGTGGTCAGGAGCGCGCCCGCGGCCGCCCCGCCGCCGCCC
CCCGCCAGTGGGCCCCCGCCTTCTTGTTCGCTGCTGCTGCGCCAGTGGCT
CCACGTTCCCGAGTCCGCGTCCGACGACGACGACGACGACTGGCCGGACA
GCCCCCCGCCCGAGCCGGCGCCAGAGGCCCGGCCCACCGCCGCCGCCCCC
CGCCCCCGGTCCCCACCGCCCGGCGCGGGCCCGGGGGGCGGGGCTAACCC
CTCCCACCCCCCCTCACGCCCCTTCCGCCTTCCGCCGCGCCTCGCCCTCC
GCCTGCGCGTCACCGCAGAGCACCTGGCGCGCCTGCGCCTGCGACGCGCG
GGCGGGGAGGGGGCGCCGAAGCCCCCCGCGACCCCCGCGACCCCCGCGAC
CCCCACGCGGGTGCGCTTCTCGCCCCACGTCCGGGTGCGCCACCTGGTGG
TCTGGGCCTCGGCCGCCCGCCTGGCGCGCCGCGGCTCGTGGGCCCGCGAG
CGGGCCGACCGGGCTCGGTTCCGGCGCCGGGTGGCGGAGGCCGAGGCGGT
CATCGGGCCGTGCCTGGGGCCCGAGGCCCGTGCCCGGGCCCTGGCCCGCG
GAGCCGGCCCGGCGAACTCGGTCTAA
SEQ ID NO. 51: 야생형 17 스트레인의 ICP34.5의 DNA 서열.
ATGGCCCGCCGCCGCCGCCATCGCGGCCCCCGCCGCCCCCGGCCGCCCGGGCCCACGGGCGCCGTCCCAACCGCACAGTCCCAGGTAACCTCCACGCCCAACTCGGAACCCGCGGTCAGGAGCGCGCCCGCGGCCGCCCCGCCGCCGCCCCCCGCCGGTGGGCCCCCGCCTTCTTGTTCGCTGCTGCTGCGCCAGTGGCTCCACGTTCCCGAGTCCGCGTCCGACGACGACGATGACGACGACTGGCCGGACAGCCCCCCGCCCGAGCCGGCGCCAGAGGCCCGGCCCACCGCCGCCGCCCCCCGGCCCCGGCCCCCACCGCCCGGCGTGGGCCCGGGGGGCGGGGCTGACCCCTCCCACCCCCCCTCGCGCCCCTTCCGCCTTCCGCCGCGCCTCGCCCTCCGCCTGCGCGTCACCGCGGAGCACCTGGCGCGCCTGCGCCTGCGACGCGCGGGCGGGGAGGGGGCGCCGGAGCCCCCCGCGACCCCCGCGACCCCCGCGACCCCCGCGACCCCCGCGACCCCCGCGCGGGTGCGCTTCTCGCCCCACGTCCGGGTGCGCCACCTGGTGGTCTGGGCCTCGGCCGCCCGCCTGGCGCGCCGCGGCTCGTGGGCCCGCGAGCGGGCCGACCGGGCTCGGTTCCGGCGCCGGGTGGCGGAGGCCGAGGCGGTCATCGGGCCGTGCCTGGGGCCCGAGGCCCGTGCCCGGGCCCTGGCCCGCGGAGCCGGCCCGGCGAACTCGGTCTAA
SEQ ID NO. 10: 야생형 17 스트레인의 ICP34.5의 아미노산 서열.
MARRRRHRGPRRPRPPGPTGAVPTAQSQVTSTPNSEPVVRSAPAAAPPPP
PASGPPPSCSLLLRQWLHVPESASDDDDDDWPDSPPPEPAPEARPTAAAP
RPRSPPPGAGPGGGANPSHPPSRPFRLPPRLALRLRVTAEHLARLRLRRA
GGEGAPKPPATPATPATPTRVRFSPHVRVRHLVVWASAARLARRGSWARE
RADRARFRRRVAEAEAVIGPCLGPEARARALARGAGPANSV
SEQ ID NO. 52: 야생형 17 스트레인의 ICP34.5의 아미노산 서열.
MARRRRHRGPRRPRPPGPTGAVPTAQSQVTSTPNSEPAVRSAPA
AAPPPPPAGGPPPSCSLLLRQWLHVPESASDDDDDDDWPDSPPPEPAPEARPTAAAPR
PRPPPPGVGPGGGADPSHPPSRPFRLPPRLALRLRVTAEHLARLRLRRAGGEGAPEPP
ATPATPATPATPATPARVRFSPHVRVRHLVVWASAARLARRGSWARERADRARFRRRV
AEAEAVIGPCLGPEARARALARGAGPANSV
SEQ ID NO: 11: EGFP 카세트의 DNA 서열.
AACACATTAATTAAAAAACCTCCCACACCTCCCCCTGAACCTGAAACATA
AAATGAATGCAATTGTTGTTGTTAACTTGTTTATTGCAGCTTATAATGGT
TACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTC
ACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTATCATG
TCTGCTCGAAGCGGCCGGCCGCCCCGACTCTAGACTACACATTGATCCTA
GCAGAAGCACAGGCTGCAGGGTGACGGTCCATCCCGCTCTCCTGGGCACA
AGACATGGGCAGCGTGCCATCATCCTGCTCCTCCACCTCCGGCGGGAAGC
CATGGCTAAGCTTCTTGTACAGCTCGTCCATGCCGAGAGTGATCCCGGCG
GCGGTCACGAACTCCAGCAGGACCATGTGATCGCGCTTCTCGTTGGGGTC
TTTGCTCAGGGCGGACTGGGTGCTCAGGTAGTGGTTGTCGGGCAGCAGCA
CGGGGCCGTCGCCGATGGGGGTGTTCTGCTGGTAGTGGTCGGCGAGCTGC
ACGCTGCCGTCCTCGATGTTGTGGCGGATCTTGAAGTTCACCTTGATGCC
GTTCTTCTGCTTGTCGGCCATGATATAGACGTTGTGGCTGTTGTAGTTGT
ACTCCAGCTTGTGCCCCAGGATGTTGCCGTCCTCCTTGAAGTCGATGCCC
TTCAGCTCGATGCGGTTCACCAGGGTGTCGCCCTCGAACTTCACCTCGGC
GCGGGTCTTGTAGTTGCCGTCGTCCTTGAAGAAGATGGTGCGCTCCTGGA
CGTAGCCTTCGGGCATGGCGGACTTGAAGAAGTCGTGCTGCTTCATGTGG
TCGGGGTAGCGGCTGAAGCACTGCACGCCGTAGGTCAGGGTGGTCACGAG
GGTGGGCCAGGGCACGGGCAGCTTGCCGGTGGTGCAGATGAACTTCAGGG
TCAGCTTGCCGTAGGTGGCATCGCCCTCGCCCTCGCCGGACACGCTGAAC
TTGTGGCCGTTTACGTCGCCGTCCAGCTCGACCAGGATGGGCACCACCCC
GGTGAACAGCTCCTCGCCCTTGCTCACCATCCGGGAATTGCGGCCGCGGG
TACAATTCCGCAGCTTTTAGAGCAGAAGTAACACTTCCGTACAGGCCTAG
AAGTAAAGGCAACATCCACTGAGGAGCAGTTCTTTGATTTGCACCACCAC
CGGATCCGGGACCTGAAATAAAAGACAAAAAGACTAAACTTACCAGTTAA
CTTTCTGGTTTTTCAGTTCCTCGAGTACCGGATCCTCTAGAGTCCGGAGG
CTGGATCGGTCCCGGTGTCTTCTATGGAGGTCAAAACAGCGTGGATGGCG
TCTCCAGGCGATCTGACGGTTCACTAAACGAGCTCTGCTTATATAGACCT
CCCACCGTACACGCCTACCGCCCATTTGCGTCAATGGGGCGGAGTTGTTA
CGACATTTTGGAAAGTCCCGTTGATTTTGGTGCCAAAACAAACTCCCATT
GACGTCAATGGGGTGGAGACTTGGAAATCCCCGTGAGTCAAACCGCTATC
CACGCCCATTGATGTACTGCCAAAACCGCATCACCATGGTAATAGCGATG
ACTAATACGTAGATGTACTGCCAAGTAGGAAAGTCCCATAAGGTCATGTA
CTGGGCATAATGCCAGGCGGGCCATTTACCGTCATTGACGTCAATAGGGG
GCGTACTTGGCATATGATACACTTGATGTACTGCCAAGTGGGCAGTTTAC
CGTAAATACTCCACCCATTGACGTCAATGGAAAGTCCCTATTGGCGTTAC
TATGGGAACATACGTCATTATTGACGTCAATGGGCGGGGGTCGTTGGGCG
GTCAGCCAGGCGGGCCATTTACCGTAAGTTATGTAACGACCTGCAGGCAT
GCAAGCTCGAATTCGAACACGCAGATGCAGTCGGGGCGGCAGATCTTAAT
TAATGGCTGGTTGTTTGTTGT
SEQ ID NO: 12: Mut-3, Mut-3△34.5 또는 Mut-3△ICP6 바이러스 스트레인의 gE (당단백질 E)의 DNA 서열. g451a 돌연변이는 하기 서열에서 진한 이탤릭체로 제시된다.
ATGGATCGCGGGGCGGTGGTGGGGTTTCTTCTCGGTGTTTGTGTTGTATC
GTGCTTGGCGGGAACGCCCAAAACGTCCTGGAGACGGGTGAGTGTCGGCG
AGGACGTTTCGTTGCTTCCAGCTCCGGGGCCTACGGGGCGCGGCCCGACC
CAGAAACTACTATGGGCCGTGGAACCCCTGGATGGGTGCGGCCCCTTACA
CCCGTCGTGGGTCTCGCTGATGCCCCCCAAGCAGGTGCCCGAGACGGTCG
TGGATGCGGCGTGCATGCGCGCTCCGGTCCCGCTGGCGATGGCGTACGCC
CCCCCGGCCCCATCTGCGACCGGGGGTCTACGAACGGACTTCGTGTGGCA
GGAGCGCGCGGCCGTGGTTAACCGGAGTCTGGTTATTCACGGGGTCCGAG
AGACGGACAGCGGCCTGTATACCCTGTCCGTGGGCGACATAAAGGACCCG
A CTCGCCAAGTGGCCTCGGTGGTCCTGGTGGTGCAACCGGCCCCAGTTCC
GACCCCACCCCCGACCCCAGCCGATTACGACGAGGATGACAATGACGAGG
GCGAGGACGAAAGTCTCGCCGGCACTCCCGCCAGCGGGACCCCCCGGCTC
CCGCCTCCCCCCGCCCCCCCGAGGTCTTGGCCCAGCGCCCCCGAAGTCTC
ACATGTGCGTGGGGTGACCGTGCGTATGGAGACTCCGGAAGCTATCCTGT
TTTCCCCCGGGGAGACGTTCAGCACGAACGTCTCCATCCATGCCATCGCC
CACGACGACCAGACCTACTCCATGGACGTCGTCTGGTTGAGGTTCGACGT
GCCGACCTCGTGTGCCGAGATGCGAATATACGAATCGTGTCTGTATCACC
CGCAGCTCCCAGAATGTCTGTCCCCGGCCGACGCGCCGTGCGCCGCGAGT
ACGTGGACGTCTCGCCTGGCCGTCCGCAGCTACGCGGGGTGTTCCAGAAC
AAACCCCCCACCGCGCTGTTCGGCCGAGGCTCACATGGAGCCCGTCCCGG
GGCTGGCGTGGCAGGCGGCCTCCGTCAATCTGGAGTTCCGGGACGCGTCC
CCACAACACTCCGGCCTGTATCTGTGTGTGGTGTACGTCAACGACCATAT
TCACGCCTGGGGCCACATTACCATCAGCACCGCGGCGCAGTACCGGAACG
CGGTGGTGGAACAGCCCCTCCCACAGCGCGGCGCGGATTTGGCCGAGCCC
ACCCACCCGCACGTCGGGGCCCCTCCCCACGCGCCCCCAACCCACGGCGC
CCTGCGGTTAGGGGCGGTGATGGGGGCCGCCCTGCTGCTGTCTGCGCTGG
GGTTGTCGGTGTGGGCGTGTATGACCTGTTGGCGCAGGCGTGCCTGGCGG
GCGGTTAAAAGCAGGGCCTCGGGTAAGGGGCCCACGTACATTCGCGTGGC
CGACAGCGAGCTGTACGCGGACTGGAGCTCGGACAGCGAGGGAGAACGCG
ACCAGGTCCCGTGGCTGGCCCCCCCGGAGAGACCCGACTCTCCCTCCACC
AATGGATCCGGCTTTGAGATCTTATCACCAACGGCTCCGTCTGTATACCC
CCGTAGCGACGGGCATCAATCTCGCCGCCAGCTCACAACCTTTGGATCCG
GAAGGCCCGATCGCCGTTACTCCCAGGCCTCCGATTCGTCCGTCTTCTGG
TAA
SEQ ID NO: 13: Mut-3, Mut-3△34.5 또는 Mut-3△ICP6 바이러스 스트레인의 gE (당단백질 E)의 아미노산 서열. A151T 돌연변이는 하기 서열에서 진한 이탤릭체로 제시된다.
MDRGAVVGFLLGVCVVSCLAGTPKTSWRRVSVGEDVSLLPAPGPTGRGPT
QKLLWAVEPLDGCGPLHPSWVSLMPPKQVPETVVDAACMRAPVPLAMAYA
PPAPSATGGLRTDFVWQERAAVVNRSLVIHGVRETDSGLYTLSVGDIKDP
T RQVASVVLVVQPAPVPTPPPTPADYDEDDNDEGEDESLAGTPASGTPRL
PPPPAPPRSWPSAPEVSHVRGVTVRMETPEAILFSPGETFSTNVSIHAIA
HDDQTYSMDVVWLRFDVPTSCAEMRIYESCLYHPQLPECLSPADAPCAAS
TWTSRLAVRSYAGCSRTNPPPRCSAEAHMEPVPGLAWQAASVNLEFRDAS
PQHSGLYLCVVYVNDHIHAWGHITISTAAQYRNAVVEQPLPQRGADLAEP
THPHVGAPPHAPPTHGALRLGAVMGAALLLSALGLSVWACMTCWRRRAWR
AVKSRASGKGPTYIRVADSELYADWSSDSEGERDQVPWLAPPERPDSPST
NGSGFEILSPTAPSVYPRSDGHQSRRQLTTFGSGRPDRRYSQASDSSVFW
SEQ ID NO: 14: 17TermA 스트레인의 gE의 DNA 서열.
ATGGATCGCGGGGCGGTGGTGGGGTTTCTTCTCGGTGTTTGTGTTGTATC
GTGCTTGGCGGGAACGCCCAAAACGTCCTGGAGACGGGTGAGTGTCGGCG
AGGACGTTTCGTTGCTTCCAGCTCCGGGGCCTACGGGGCGCGGCCCGACC
CAGAAACTACTATGGGCCGTGGAACCCCTGGATGGGTGCGGCCCCTTACA
CCCGTCGTGGGTCTCGCTGATGCCCCCCAAGCAGGTGCCCGAGACGGTCG
TGGATGCGGCGTGCATGCGCGCTCCGGTCCCGCTGGCGATGGCGTACGCC
CCCCCGGCCCCATCTGCGACCGGGGGTCTACGAACGGACTTCGTGTGGCA
GGAGCGCGCGGCCGTGGTTAACCGGAGTCTGGTTATTCACGGGGTCCGAG
AGACGGACAGCGGCCTGTATACCCTGTCCGTGGGCGACATAAAGGACCCG
GCTCGCCAAGTGGCCTCGGTGGTCCTGGTGGTGCAACCGGCCCCAGTTCC
GACCCCACCCCCGACCCCAGCCGATTACGACGAGGATGACAATGACGAGG
GCGAGGACGAAAGTCTCGCCGGCACTCCCGCCAGCGGGACCCCCCGGCTC
CCGCCTCCCCCCGCCCCCCCGAGGTCTTGGCCCAGCGCCCCCGAAGTCTC
ACATGTGCGTGGGGTGACCGTGCGTATGGAGACTCCGGAAGCTATCCTGT
TTTCCCCCGGGGAGACGTTCAGCACGAACGTCTCCATCCATGCCATCGCC
CACGACGACCAGACCTACTCCATGGACGTCGTCTGGTTGAGGTTCGACGT
GCCGACCTCGTGTGCCGAGATGCGAATATACGAATCGTGTCTGTATCACC
CGCAGCTCCCAGAATGTCTGTCCCCGGCCGACGCGCCGTGCGCCGCGAGT
ACGTGGACGTCTCGCCTGGCCGTCCGCAGCTACGCGGGGTGTTCCAGAAC
AAACCCCCCACCGCGCTGTTCGGCCGAGGCTCACATGGAGCCCGTCCCGG
GGCTGGCGTGGCAGGCGGCCTCCGTCAATCTGGAGTTCCGGGACGCGTCC
CCACAACACTCCGGCCTGTATCTGTGTGTGGTGTACGTCAACGACCATAT
TCACGCCTGGGGCCACATTACCATCAGCACCGCGGCGCAGTACCGGAACG
CGGTGGTGGAACAGCCCCTCCCACAGCGCGGCGCGGATTTGGCCGAGCCC
ACCCACCCGCACGTCGGGGCCCCTCCCCACGCGCCCCCAACCCACGGCGC
CCTGCGGTTAGGGGCGGTGATGGGGGCCGCCCTGCTGCTGTCTGCACTGG
GGTTGTCGGTGTGGGCGTGTATGACCTGTTGGCGCAGGCGTGCCTGGCGG
GCGGTTAAAAGCAGGGCCTCGGGTAAGGGGCCCACGTACATTCGCGTGGC
CGACAGCGAGCTGTACGCGGACTGGAGCTCGGACAGCGAGGGAGAACGCG
ACCAGGTCCCGTGGCTGGCCCCCCCGGAGAGACCCGACTCTCCCTCCACC
AATGGATCCGGCTTTGAGATCTTATCACCAACGGCTCCGTCTGTATACCC
CCGTAGCGATGGGCATCAATCTCGCCGCCAGCTCACAACCTTTGGATCCG
GAAGGCCCGATCGCCGTTACTCCCAGGCCTCCGATTCGTCCGTCTTCTGG
TAA
SEQ ID NO: 15: 17TermA 스트레인의 gE의 아미노산 서열.
MDRGAVVGFLLGVCVVSCLAGTPKTSWRRVSVGEDVSLLPAPGPTGRGPT
QKLLWAVEPLDGCGPLHPSWVSLMPPKQVPETVVDAACMRAPVPLAMAYA
PPAPSATGGLRTDFVWQERAAVVNRSLVIHGVRETDSGLYTLSVGDIKDP
ARQVASVVLVVQPAPVPTPPPTPADYDEDDNDEGEDESLAGTPASGTPRL
PPPPAPPRSWPSAPEVSHVRGVTVRMETPEAILFSPGETFSTNVSIHAIA
HDDQTYSMDVVWLRFDVPTSCAEMRIYESCLYHPQLPECLSPADAPCAAS
TWTSRLAVRSYAGCSRTNPPPRCSAEAHMEPVPGLAWQAASVNLEFRDAS
PQHSGLYLCVVYVNDHIHAWGHITISTAAQYRNAVVEQPLPQRGADLAEP
THPHVGAPPHAPPTHGALRLGAVMGAALLLSALGLSVWACMTCWRRRAWR
AVKSRASGKGPTYIRVADSELYADWSSDSEGERDQVPWLAPPERPDSPST
NGSGFEILSPTAPSVYPRSDGHQSRRQLTTFGSGRPDRRYSQASDSSVFW
SEQ ID NO. 16: rRp450 스트레인의 gE의 DNA 서열.
ATGGATCGCGGGGCGGTGGTGGGGTTTCTTCTCGGTGTTTGTGTTGTATC
GTGCTTGGCGGGAACGCCCAAAACGTCCTGGAGACGGGTGAGTGTCGGCG
AGGACGTTTCGTTGCTTCCAGCTCCGGGGCCTACGGGGCGCGGCCCGACC
CAGAAACTACTATGGGCCGTGGAACCCCTGGATGGGTGCGGCCCCTTACA
CCCGTCGTGGGTCTCGCTGATGCCCCCCAAGCAGGTGCCCGAGACGGTCG
TGGATGCGGCGTGCATGCGCGCTCCGGTCCCGCTGGCGATGGCGTACGCC
CCCCCGGCCCCATCTGCGACCGGGGGTCTACGAACGGACTTCGTGTGGCA
GGAGCGCGCGGCCGTGGTTAACCGGAGTCTGGTTATTCACGGGGTCCGAG
AGACGGACAGCGGCCTGTATACCCTGTCCGTGGGCGACATAAAGGACCCG
GCTCGCCAAGTGGCCTCGGTGGTCCTGGTGGTGCAACCGGCCCCAGTTCC
GACCCCACCCCCGACCCCAGCCGATTACGACGAGGATGACAATGACGAGG
GCGAGGACGAAAGTCTCGCCGGCACTCCCGCCAGCGGGACCCCCCGGCTC
CCGCCTCCCCCCGCCCCCCCGAGGTCTTGGCCCAGCGCCCCCGAAGTCTC
ACATGTGCGTGGGGTGACCGTGCGTATGGAGACTCCGGAAGCTATCCTGT
TTTCCCCCGGGGAGACGTTCAGCACGAACGTCTCCATCCATGCCATCGCC
CACGACGACCAGACCTACTCCATGGACGTCGTCTGGTTGAGGTTCGACGT
GCCGACCTCGTGTGCCGAGATGCGAATATACGAATCGTGTCTGTATCACC
CGCAGCTCCCAGAATGTCTGTCCCCGGCCGACGCGCCGTGCGCCGCGAGT
ACGTGGACGTCTCGCCTGGCCGTCCGCAGCTACGCGGGGTGTTCCAGAAC
AAACCCCCCACCGCGCTGTTCGGCCGAGGCTCACATGGAGCCCGTCCCGG
GGCTGGCGTGGCAGGCGGCCTCCGTCAATCTGGAGTTCCGGGACGCGTCC
CCACAACACTCCGGCCTGTATCTGTGTGTGGTGTACGTCAACGACCATAT
TCACGCCTGGGGCCACATTACCATCAGCACCGCGGCGCAGTACCGGAACG
CGGTGGTGGAACAGCCCCTCCCACAGCGCGGCGCGGATTTGGCCGAGCCC
ACCCACCCGCACGTCGGGGCCCCTCCCCACGCGCCCCCAACCCACGGCGC
CCTGCGGTTAGGGGCGGTGATGGGGGCCGCCCTGCTGCTGTCTGCGCTGG
GGTTGTCGGTGTGGGCGTGTATGACCTGTTGGCGCAGGCGTGCCTGGCGG
GCGGTTAAAAGCAGGGCCTCGGGTAAGGGGCCCACGTACATTCGCGTGGC
CGACAGCGAGCTGTACGCGGACTGGAGCTCGGACAGCGAGGGAGAACGCG
ACCAGGTCCCGTGGCTGGCCCCCCCGGAGAGACCCGACTCTCCCTCCACC
AATGGATCCGGCTTTGAGATCTTATCACCAACGGCTCCGTCTGTATACCC
CCGTAGCGACGGGCATCAATCTCGCCGCCAGCTCACAACCTTTGGATCCG
GAAGGCCCGATCGCCGTTACTCCCAGGCCTCCGATTCGTCCGTCTTCTGG
TAA
SEQ ID NO. 17: rRp450 스트레인의 gE의 아미노산 서열.
MDRGAVVGFLLGVCVVSCLAGTPKTSWRRVSVGEDVSLLPAPGPTGRGPT
QKLLWAVEPLDGCGPLHPSWVSLMPPKQVPETVVDAACMRAPVPLAMAYA
PPAPSATGGLRTDFVWQERAAVVNRSLVIHGVRETDSGLYTLSVGDIKDP
ARQVASVVLVVQPAPVPTPPPTPADYDEDDNDEGEDESLAGTPASGTPRL
PPPPAPPRSWPSAPEVSHVRGVTVRMETPEAILFSPGETFSTNVSIHAIA
HDDQTYSMDVVWLRFDVPTSCAEMRIYESCLYHPQLPECLSPADAPCAAS
TWTSRLAVRSYAGCSRTNPPPRCSAEAHMEPVPGLAWQAASVNLEFRDAS
PQHSGLYLCVVYVNDHIHAWGHITISTAAQYRNAVVEQPLPQRGADLAEP
THPHVGAPPHAPPTHGALRLGAVMGAALLLSALGLSVWACMTCWRRRAWR
AVKSRASGKGPTYIRVADSELYADWSSDSEGERDQVPWLAPPERPDSPST
NGSGFEILSPTAPSVYPRSDGHQSRRQLTTFGSGRPDRRYSQASDSSVFW
SEQ ID NO. 18: 야생형 17 스트레인의 gE의 DNA 서열.
ATGGATCGCGGGGCGGTGGTGGGGTTTCTTCTCGGTGTTTGTGTTGTATC
GTGCTTGGCGGGAACGCCCAAAACGTCCTGGAGACGGGTGAGTGTCGGCG
AGGACGTTTCGTTGCTTCCAGCTCCGGGGCCTACGGGGCGCGGCCCGACC
CAGAAACTACTATGGGCCGTGGAACCCCTGGATGGGTGCGGCCCCTTACA
CCCGTCGTGGGTCTCGCTGATGCCCCCCAAGCAGGTGCCCGAGACGGTCG
TGGATGCGGCGTGCATGCGCGCTCCGGTCCCGCTGGCGATGGCGTACGCC
CCCCCGGCCCCATCTGCGACCGGGGGTCTACGAACGGACTTCGTGTGGCA
GGAGCGCGCGGCCGTGGTTAACCGGAGTCTGGTTATTCACGGGGTCCGAG
AGACGGACAGCGGCCTGTATACCCTGTCCGTGGGCGACATAAAGGACCCG
GCTCGCCAAGTGGCCTCGGTGGTCCTGGTGGTGCAACCGGCCCCAGTTCC
GACCCCACCCCCGACCCCAGCCGATTACGACGAGGATGACAATGACGAGG
GCGAGGACGAAAGTCTCGCCGGCACTCCCGCCAGCGGGACCCCCCGGCTC
CCGCCTCCCCCCGCCCCCCCGAGGTCTTGGCCCAGCGCCCCCGAAGTCTC
ACATGTGCGTGGGGTGACCGTGCGTATGGAGACTCCGGAAGCTATCCTGT
TTTCCCCCGGGGAGACGTTCAGCACGAACGTCTCCATCCATGCCATCGCC
CACGACGACCAGACCTACTCCATGGACGTCGTCTGGTTGAGGTTCGACGT
GCCGACCTCGTGTGCCGAGATGCGAATATACGAATCGTGTCTGTATCACC
CGCAGCTCCCAGAATGTCTGTCCCCGGCCGACGCGCCGTGCGCCGCGAGT
ACGTGGACGTCTCGCCTGGCCGTCCGCAGCTACGCGGGGTGTTCCAGAAC
AAACCCCCCACCGCGCTGTTCGGCCGAGGCTCACATGGAGCCCGTCCCGG
GGCTGGCGTGGCAGGCGGCCTCCGTCAATCTGGAGTTCCGGGACGCGTCC
CCACAACACTCCGGCCTGTATCTGTGTGTGGTGTACGTCAACGACCATAT
TCACGCCTGGGGCCACATTACCATCAGCACCGCGGCGCAGTACCGGAACG
CGGTGGTGGAACAGCCCCTCCCACAGCGCGGCGCGGATTTGGCCGAGCCC
ACCCACCCGCACGTCGGGGCCCCTCCCCACGCGCCCCCAACCCACGGCGC
CCTGCGGTTAGGGGCGGTGATGGGGGCCGCCCTGCTGCTGTCTGCGCTGG
GGTTGTCGGTGTGGGCGTGTATGACCTGTTGGCGCAGGCGTGCCTGGCGG
GCGGTTAAAAGCAGGGCCTCGGGTAAGGGGCCCACGTACATTCGCGTGGC
CGACAGCGAGCTGTACGCGGACTGGAGCTCGGACAGCGAGGGAGAACGCG
ACCAGGTCCCGTGGCTGGCCCCCCCGGAGAGACCCGACTCTCCCTCCACC
AATGGATCCGGCTTTGAGATCTTATCACCAACGGCTCCGTCTGTATACCC
CCGTAGCGACGGGCATCAATCTCGCCGCCAGCTCACAACCTTTGGATCCG
GAAGGCCCGATCGCCGTTACTCCCAGGCCTCCGATTCGTCCGTCTTCTGG
TAA
SEQ ID NO. 19: 야생형 17 스트레인의 gE의 아미노산 서열.
MDRGAVVGFLLGVCVVSCLAGTPKTSWRRVSVGEDVSLLPAPGPTGRGPT
QKLLWAVEPLDGCGPLHPSWVSLMPPKQVPETVVDAACMRAPVPLAMAYA
PPAPSATGGLRTDFVWQERAAVVNRSLVIHGVRETDSGLYTLSVGDIKDP
ARQVASVVLVVQPAPVPTPPPTPADYDEDDNDEGEDESLAGTPASGTPRL
PPPPAPPRSWPSAPEVSHVRGVTVRMETPEAILFSPGETFSTNVSIHAIA
HDDQTYSMDVVWLRFDVPTSCAEMRIYESCLYHPQLPECLSPADAPCAAS
TWTSRLAVRSYAGCSRTNPPPRCSAEAHMEPVPGLAWQAASVNLEFRDAS
PQHSGLYLCVVYVNDHIHAWGHITISTAAQYRNAVVEQPLPQRGADLAEP
THPHVGAPPHAPPTHGALRLGAVMGAALLLSALGLSVWACMTCWRRRAWR
AVKSRASGKGPTYIRVADSELYADWSSDSEGERDQVPWLAPPERPDSPST
NGSGFEILSPTAPSVYPRSDGHQSRRQLTTFGSGRPDRRYSQASDSSVFW
SEQ ID NO. 20: Mut 3, Mut-3△34.5 및 Mut-3△ICP6 바이러스 스트레인의 ICP0의 DNA 서열. a848c (인트론 내) 및 g1712a (R258H의 경우) 돌연변이는 하기 서열에서 진한 이탤릭체로 제시된다. 2개의 인트론이 포함된다 (즉, 다음 서열의 뉴클레오타이드 (nt) 58 내지 nt 861, 및 nt 1529 내지 nt 1663, 또한 괄호 안의 서열 참고).
ATGGAGCCCCGCCCCGGAGCGAGTACCCGCCGGCCTGAGGGCCGCCCCCA
GCGCGAG(GTGAGGGGCCGGGCGCCATGTCTGGGGCGCCATGTCTGGGGCG
CCATGTCTGGGGCGCCATGTCTGGGGCGCCATGTTGGGGGGCGCCATGTT
GGGGGGCGCCATGTTGGGGGACCCCCGACCCTTACACTGGAACCGGCCGC
CATGTTGGGGGACCCCCACTCATACACGGGAGCCGGGCGCCATGTTGGGG
CGCCATGTTAGGGGGCGTGGAACCCCGTGACACTATATATACAGGGACCG
GGGGCGCCATGTTAGGGGGCGCGGAACCCCCTGACCCTATATATACAGGG
ACCGGGGTCGCCCTGTTAGGGGTCGCCATGTGACCCCCTGACTTTATATA
TACAGACCCCCAACACCTACACATGGCCCCTTTGACTCAGACGCAGGGCC
CGGGGTCGCCGTGGGACCCCCCTGACTCATACACAGAGACACGCCCCCAC
AACAAACACACAGGGACCGGGGTCGCCGTGTTAGGGGGCGTGGTCCCCAC
TGACTCATACGCAGGGCCCCCTTACTCACACGCATCTAGGGGGGTGGGGA
GGAGCCGCCCGCCATATTTGGGGGACGCCGTGGGACCCCCGACTCCGGTG
CGTCTGGAGGGCGGGAGAAGAGGGAAGAAGAGGGGTCGGGATCCAAAGGA
CGGACCCAGACCACCTTTGGTTGCAGACCCCTTTCTCCCCCCTCTTCCGA
GGCCAGCAGGGGGGCAGGACTTTGTGAGGCGGGGGGGGAGGGGGAACTCG
TGGGCGCTGATTGACGCGGGAAATCCCCCCATTCTTACCCGCCCCCC C TT
TTTCCCCTCAG)CCCGCCCCGGATGTCTGGGTGTTTCCCTGCGACCGAGAC
CTGCCGGACAGCAGCGACTCGGAGGCGGAGACCGAAGTGGGGGGGCGGGG
GGACGCCGACCACCATGACGACGACTCCGCCTCCGAGGCGGACAGCACGG
ACACGGAACTGTTCGAGACGGGGCTGCTGGGGCCGCAGGGCGTGGATGGG
GGGGCGGTCTCGGGGGGGAGCCCCCCCCGCGAGGAAGACCCCGGCAGTTG
CGGGGGCGCCCCCCCTCGAGAGGACGGGGGGAGCGACGAGGGCGACGTGT
GCGCCGTGTGCACGGATGAGATCGCGCCCCACCTGCGCTGCGACACCTTC
CCGTGCATGCACCGCTTCTGCATCCCGTGCATGAAAACCTGGATGCAATT
GCGCAACACCTGCCCGCTGTGCAACGCCAAGCTGGTGTACCTGATAGTGG
GCGTGACGCCCAGCGGGTCGTTCAGCACCATCCCGATCGTGAACGACCCC
CAGACCCGCATGGAGGCCGAGGAGGCCGTCAGGGCGGGCACGGCCGTGGA
CTTTATCTGGACGGGCAATCAGCGGTTCGCCCCGCGGTACCTGACCCTGG
GGGGGCACACGGTGAGGGCCCTGTCGCCCACCCACCCGGAACCCACCACG
GACGAGGATGACGACGACCTGGACGACG(GTGAGGCGGGGGGCGGCAAGGA
CCCTGGGGGAGGAGGAGGAGGAGGGGGGGGAGGGAGGAATAGGCGGGCGG
GCGAGGAAAGGGCGGGCCGGGGAGGGGGCGTAACCTGATCGCGCCCCCCG
TTGTCTCTTGCAG)CAGACTACGTACCGCCCGCCCCCCGCCGGACGCCCCG
CGCCCCCCCAC A CAGAGGCGCCGCCGCGCCCCCCGTGACGGGCGGGGCGT
CTCACGCAGCCCCCCAGCCGGCCGCGGCTCGGACAGCGCCCCCCTCGGCG
CCCATCGGGCCACACGGCAGCAGTAACACCAACACCACCACCAACAGCAG
CGGCGGCGGCGGCTCCCGCCAGTCGCGAGCCGCGGCGCCGCGGGGGGCGT
CTGGCCCCTCCGGGGGGGTTGGGGTTGGGGTTGGGGTTGTTGAAGCGGAG
GCGGGGCGGCCGAGGGGCCGGACGGGCCCCCTTGTCAACAGACCCGCCCC
CCTTGCAAACAACAGAGACCCCATAGTGATCAGCGACTCCCCCCCGGCCT
CTCCCCACAGGCCCCCCGCGGCGCCCATGCCAGGCTCCGCCCCCCGCCCC
GGGCCCCCCGCGTCCGCGGCCGCGTCGGGACCCGCGCGCCCCCGCGCGGC
CGTGGCCCCGTGCGTGCGAGCGCCGCCTCCGGGGCCCGGCCCCCGCGCCC
CGGCCCCCGGGGCGGAGCCGGCCGCCCGCCCCGCGGACGCGCGCCGTGTG
CCCCAGTCGCACTCGTCCCTGGCTCAGGCCGCGAACCAAGAACAGAGTCT
GTGCCGGGCGCGTGCGACGGTGGCGCGCGGCTCGGGGGGGCCGGGCGTGG
AGGGTGGGCACGGGCCCTCCCGCGGCGCCGCCCCCTCCGGCGCCGCCCCG
CTCCCCTCCGCCGCCTCTGTCGAGCAGGAGGCGGCGGTGCGTCCGAGGAA
GAGGCGCGGGTCGGGCCAGGAAAACCCCTCCCCCCAGTCCACGCGTCCCC
CCCTCGCGCCGGCAGGGGCCAAGAGGGCGGCGACGCACCCCCCCTCCGAC
TCAGGGCCGGGGGGGCGCGGCCAGGGTGGGCCCGGGACCCCCCTGACGTC
CTCGGCGGCCTCCGCCTCTTCCTCCTCTGCCTCTTCCTCCTCGGCCCCGA
CCCCCGCGGGGGCCGCCTCTTCCGCCGCCGGGGCCGCGTCCTCCTCCGCT
TCCGCCTCCTCGGGCGGGGCCGTCGGTGCCCTGGGAGGGAGACAAGAGGA
AACCTCCCTCGGCCCCCGCGCTGCTTCTGGGCCGCGGGGGCCGAGGAAGT
GTGCCCGGAAGACGCGCCACGCGGAGACTTCCGGGGCCGTCCCCGCGGGC
GGCCTCACGCGCTACCTGCCCATCTCGGGGGTCTCTAGCGTGGTCGCCCT
GTCGCCTTACGTGAACAAGACGATCACGGGGGACTGCCTGCCCATCCTGG
ACATGGAGACGGGGAACATCGGGGCGTACGTGGTCCTGGTGGACCAGACG
GGAAACATGGCGACCCGGCTGCGGGCCGCGGTCCCCGGCTGGAGCCGCCG
CACCCTGCTCCCCGAGACCGCGGGTAACCACGTGATGCCCCCCGAGTACC
CGACGGCCCCCGCGTCGGAGTGGAACAGCCTCTGGATGACCCCCGTGGGG
AACATGCTGTTCGACCAGGGCACCCTAGTGGGCGCCCTGGACTTCCGCAG
CCTGCGGTCTCGGCACCCGTGGTCCGGGGAGCAGGGGGCGTCGACCCGGG
ACGAGGGAAAACAATAA
SEQ ID NO. 21: Mut 3, Mut-3△34.5 및 Mut-3△ICP6의 ICP0의 아미노산 서열. R258H 돌연변이는 하기 서열에서 이탤릭체 및 진하게 제시된다.
MEPRPGASTR RPEGRPQREP APDVWVFPCD RDLPDSSDSE AETEVGGRGD ADHHDDDSAS
EADSTDTELF ETGLLGPQGV DGGAVSGGSP PREEDPGSCG GAPPREDGGS DEGDVCAVCT
DEIAPHLRCD TFPCMHRFCI PCMKTWMQLR NTCPLCNAKL VYLIVGVTPS GSFSTIPIVN
DPQTRMEAEE AVRAGTAVDF IWTGNQRFAP RYLTLGGHTV RALSPTHPEP TTDEDDDDLD
DADYVPPAPR RTPRAPP H RG AAAPPVTGGA SHAAPQPAAA RTAPPSAPIG PHGSSNTNTT
TNSSGGGGSR QSRAAAPRGA SGPSGGVGVG VGVVEAEAGR PRGRTGPLVN RPAPLANNRD
PIVISDSPPA SPHRPPAAPM PGSAPRPGPP ASAAASGPAR PRAAVAPCVR APPPGPGPRA
PAPGAEPAAR PADARRVPQS HSSLAQAANQ EQSLCRARAT VARGSGGPGV EGGHGPSRGA
APSGAAPLPS AASVEQEAAV RPRKRRGSGQ ENPSPQSTRP PLAPAGAKRA ATHPPSDSGP
GGRGQGGPGT PLTSSAASAS SSSASSSSAP TPAGAASSAA GAASSSASAS SGGAVGALGG
RQEETSLGPR AASGPRGPRK CARKTRHAET SGAVPAGGLT RYLPISGVSS VVALSPYVNK
TITGDCLPIL DMETGNIGAY VVLVDQTGNM ATRLRAAVPG WSRRTLLPET AGNHVMPPEY
PTAPASEWNS LWMTPVGNML FDQGTLVGAL DFRSLRSRHP WSGEQGASTR DEGKQ
SEQ ID NO. 22: 17TermA 스트레인의 ICP0의 DNA 서열. 2개의 인트론이 포함된다 (즉, 하기 서열의 뉴클레오타이드 (nt) 58 내지 nt 822, 및 nt 1490 내지 nt 1625, 또한 괄호 안의 서열 참고)
ATGGAGCCCCGCCCCGGAGCGAGTACCCGCCGGCCTGAGGGCCGCCCCCA
GCGCGAG(GTGAGGGGCCGGGCGCCATGTCTGGGGCGCCATATTGGGGGGC
GCCATATTGGGGGGCGCCATGTTGGGGGACCCCCGACCCTTACACTGGAA
CCGGCCGCCATGTTGGGGGACCCCCACTCATACACGGGAGCCGGGCGCCA
TGTTGGGGCGCCATGTTAGGGGGCGTGGAACCCCGTGACACTATATATAC
AGGGACCGGGGGCGCCATGTTAGGGGGTGCGGAACCCCCTGACCCTATAT
ATACAGGGACCGGGGTCGCCCTGTTGGGGGTCGCCATGTGACCCCCTGAC
TTTATATATACAGACCCCCAACACATACACATGGCCCCTTTGACTCAGAC
GCAGGGCCCGGGGTCGCCGTGGGACCCCCTGACTCATACACAGAGACACG
CCCCCACAACAAACACACAGGGACCGGGGTCGCCGTGTTGGGGGCGTGGT
CCCCACTGACTCATACGCAGGCCCCCCTTACTCACACGCATCTAGGGGGG
TGGGGAGGAGCCGCCCGCCATATTTGGGGGACGCCGTGGGACCCCCGACT
CCGGTGCGTCTGGAGGGCGGGAGAAGAGGGAAGAAGAGGGGTCGGGATCC
AAAGGACGGACCCAGACCACCTTTGGTTGCAGACCCCTTTCTCCCCCCTC
TTCCGAGGCCAGCAGGGGGGCAGGACTTTGTGAGGCGGGGGGGGGAGAGG
GGGAACTCGTGGGTGCTGATTGACGCGGGAAATCCCCCCCCATTCTTACC
CGCCCCCCTTTTTTCCCCTTAG)CCCGCCCCGGATGTCTGGGTGTTTCCCT
GCGACCGAGACCTGCCGGACAGCAGCGACTCTGAGGCGGAGACCGAAGTG
GGGGGGCGGGGGGACGCCGACCACCATGACGACGACTCCGCCTCCGAGGC
GGACAGCACGGACACGGAACTGTTCGAGACGGGGCTGCTGGGGCCGCAGG
GCGTGGATGGGGGGGCGGTCTCGGGGGGGAGCCCCCCCCGCGAGGAAGAC
CCCGGCAGTTGCGGGGGCGCCCCCCCTCGAGAGGACGGGGGGAGCGACGA
GGGTGACGTGTGCGCCGTGTGCACGGATGAGATCGCGCCCCACCTGCGCT
GCGACACCTTCCCGTGCATGCACCGCTTCTGCATCCCGTGCATGAAAACC
TGGATGCAATTGCGCAACACCTGCCCGCTGTGCAACGCCAAGCTGGTGTA
CCTGATAGTGGGCGTGACGCCCAGCGGGTCGTTCAGCACCATCCCGATCG
TGAACGACCCCCAGACCCGCATGGAGGCCGAGGAGGCCGTCAGGGCGGGC
ACGGCCGTGGACTTTATCTGGACGGGCAATCAGCGGTTCGCCCCGCGGTA
CCTGACCCTGGGGGGGCACACGGTGAGGGCCCTGTCGCCCACCCACCCGG
AACCCACCACGGACGAGGATGACGACGACCTGGACGACG(GTGAGGCGGGG
GGCGGCAAGGACCCTGGGGGAGGAGGAGGAGGAGGGGGGGGGAGGGAGGA
ATAGGCGGGCGGGCGAGGAAAGGGCGGGCCGGGGAGGGGGCGTAACCTGA
TCGCGCCCCCCGTTGTCTCTTGCAG)CAGACTACGTACCGCCCGCCCCCCG
CCGGACGCCCCGCGCCCCCCCACGCAGAGGCGCCGCCGCGCCCCCCGTGA
CGGGCGGGGCGTCTCACGCAGCCCCCCAGCCGGCCGCGGCTCGGACAGCG
CCCCCCTCGGCGCCCATCGGGCCACACGGCAGCAGTAACACCAACACCAC
CACCAACAGCAGCGGCGGCGGCGGCTCCCGCCAGTCGCGAGCCGCGGCGC
CGCGGGGGGCGTCTGGCCCCTCCGGGGGGGTTGGGGTTGGGGTTGGGGTT
GTTGAAGCGGAGGCGGGGCGGCCGAGGGGCCGGACGGGCCCCCTTGTCAA
CAGACCCGCCCCCCTTGCAAACAACAGAGACCCCATAGTGATCAGCGACT
CCCCCCCGGCCTCTCCCCACAGGCCCCCCGCGGCGCCCATGCCAGGCTCC
GCCCCCCGCCCCGGGCCCCCCGCGTCCGCGGCCGCGTCGGGACCCGCGCG
CCCCCGCGCGGCCGTGGCCCCGTGCGTGCGAGCGCCGCCTCCGGGGCCCG
GCCCCCGCGCCCCGGCCCCCGGGGCGGAGCCGGCCGCCCGCCCCGCGGAC
GCGCGCCGTGTGCCCCAGTCGCACTCGTCCCTGGCTCAGGCCGCGAACCA
AGAACAGAGTCTGTGCCGGGCGCGTGCGACGGTGGCGCGCGGCTCGGGGG
GGCCGGGCGTGGAGGGTGGGCACGGGCCCTCCCGCGGCGCCGCCCCCTCC
GGCGCCGCCCCGCTCCCCTCCGCCGCCTCTGTCGAGCAGGAGGCGGCGGT
GCGTCCGAGGAAGAGGCGCGGGTCGGGCCAGGAAAACCCCTCCCCCCAGT
CCACGCGTCCCCCCCTCGCGCCGGCAGGGGCCAAGAGGGCGGCGACGCAC
CCCCCCTCCGACTCAGGGCCGGGGGGGCGCGGCCAGGGTGGGCCCGGGAC
CCCCCTGACGTCCTCGGCGGCCTCCGCCTCTTCCTCCTCTGCCTCTTCCT
CCTCGGCCCCGACCCCCGCGGGGGCCGCCTCTTCCGCCGCCGGGGCCGCG
TCCTCCTCCGCTTCCGCCTCCTCGGGCGGGGCCGTCGGTGCCCTGGGAGG
GAGACAAGAGGAAACCTCCCTCGGCCCCCGCGCTGCTTCTGGGCCGCGGG
GGCCGAGGAAGTGTGCCCGGAAGACGCGCCACGCGGAGACTTCCGGGGCC
GTCCCCGCGGGCGGCCTCACGCGCTACCTGCCCATCTCGGGGGTCTCTAG
CGTGGTCGCCCTGTCGCCTTACGTGAACAAGACTATCACGGGGGACTGCC
TGCCCATCCTGGACATGGAGACGGGGAACATCGGGGCGTACGTGGTCCTG
GTGGACCAGACGGGAAACATGGCGACCCGGCTGCGGGCCGCGGTCCCCGG
CTGGAGCCGCCGCACCCTGCTCCCCGAGACCGCGGGTAACCACGTGATGC
CCCCCGAGTACCCGACGGCCCCCGCGTCGGAGTGGAACAGCCTCTGGATG
ACCCCCGTGGGGAACATGCTGTTCGACCAGGGCACCCTAGTGGGCGCCCT
GGACTTCCGCAGCCTGCGGTCTCGGCACCCGTGGTCCGGGGAGCAGGGGG
CGTCGACCCGGGACGAGGGAAAACAATAA
SEQ ID NO. 23: 17TermA 스트레인의 ICP0의 아미노산 서열.
MEPRPGASTR RPEGRPQREP APDVWVFPCD RDLPDSSDSE AETEVGGRGD ADHHDDDSAS
EADSTDTELF ETGLLGPQGV DGGAVSGGSP PREEDPGSCG GAPPREDGGS DEGDVCAVCT
DEIAPHLRCD TFPCMHRFCI PCMKTWMQLR NTCPLCNAKL VYLIVGVTPS GSFSTIPIVN
DPQTRMEAEE AVRAGTAVDF IWTGNQRFAP RYLTLGGHTV RALSPTHPEP TTDEDDDDLD
DADYVPPAPR RTPRAPPRRG AAAPPVTGGA SHAAPQPAAA RTAPPSAPIG PHGSSNTNTT
TNSSGGGGSR QSRAAAPRGA SGPSGGVGVG VGVVEAEAGR PRGRTGPLVN RPAPLANNRD
PIVISDSPPA SPHRPPAAPM PGSAPRPGPP ASAAASGPAR PRAAVAPCVR APPPGPGPRA
PAPGAEPAAR PADARRVPQS HSSLAQAANQ EQSLCRARAT VARGSGGPGV EGGHGPSRGA
APSGAAPLPS AASVEQEAAV RPRKRRGSGQ ENPSPQSTRP PLAPAGAKRA ATHPPSDSGP
GGRGQGGPGT PLTSSAASAS SSSASSSSAP TPAGAASSAA GAASSSASAS SGGAVGALGG
RQEETSLGPR AASGPRGPRK CARKTRHAET SGAVPAGGLT RYLPISGVSS VVALSPYVNK
TITGDCLPIL DMETGNIGAY VVLVDQTGNM ATRLRAAVPG WSRRTLLPET AGNHVMPPEY
PTAPASEWNS LWMTPVGNML FDQGTLVGAL DFRSLRSRHP WSGEQGASTR DEGKQ
SEQ ID NO. 24: rRp450 스트레인의 ICP0의 DNA 서열. 2개의 인트론이 포함된다 (즉, 하기 서열의 뉴클레오타이드 (nt) 58 내지 nt 862, 및 nt 1530 내지 nt 1668, 또한 괄호 안의 서열 참고)
ATGGAGCCCCGCCCCGGAGCGAGTACCCGCCGGCCTGAGGGCCGCCCCCA
GCGCGAG(GTGAGGGGCCGGGCGCCATGTCTGGGGCGCCATGTCTGGGGCG
CCATGTCTGGGGCGCCATGTCTGGGGCGCCATGTTGGGGGGCGCCATGTT
GGGGGGCGCCATGTTGGGGGACCCCCGACCCTTACACTGGAACCGGCCGC
CATGTTGGGGGACCCCCACTCATACACGGGAGCCGGGCGCCATGTTGGGG
CGCCATGTTAGGGGGCGTGGAACCCCGTGACACTATATATACAGGGACCG
GGGGCGCCATGTTAGGGGGCGCGGAACCCCCTGACCCTATATATACAGGG
ACCGGGGTCGCCCTGTTAGGGGTCGCCATGTGACCCCCTGACTTTATATA
TACAGACCCCCAACACCTACACATGGCCCCTTTGACTCAGACGCAGGGCC
CGGGGTCGCCGTGGGACCCCCCTGACTCATACACAGAGACACGCCCCCAC
AACAAACACACAGGGACCGGGGTCGCCGTGTTAGGGGGCGTGGTCCCCAC
TGACTCATACGCAGGGCCCCCTTACTCACACGCATCTAGGGGGGTGGGGA
GGAGCCGCCCGCCATATTTGGGGGACGCCGTGGGACCCCCGACTCCGGTG
CGTCTGGAGGGCGGGAGAAGAGGGAAGAAGAGGGGTCGGGATCCAAAGGA
CGGACCCAGACCACCTTTGGTTGCAGACCCCTTTCTCCCCCCTCTTCCGA
GGCCAGCAGGGGGGCAGGACTTTGTGAGGCGGGGGGGGAGGGGGAACTCG
TGGGCGCTGATTGACGCGGGAAATCCCCCCATTCTTACCCGCCCCCCCTT
TTTTCCCCTCAG)CCCGCCCCGGATGTCTGGGTGTTTCCCTGCGACCGAGA
CCTGCCGGACAGCAGCGACTCGGAGGCGGAGACCGAAGTGGGGGGGCGGG
GGGACGCCGACCACCATGACGACGACTCCGCCTCCGAGGCGGACAGCACG
GACACGGAACTGTTCGAGACGGGGCTGCTGGGGCCGCAGGGCGTGGATGG
GGGGGCGGTCTCGGGGGGGAGCCCCCCCCGCGAGGAAGACCCCGGCAGTT
GCGGGGGCGCCCCCCCTCGAGAGGACGGGGGGAGCGACGAGGGCGACGTG
TGCGCCGTGTGCACGGATGAGATCGCGCCCCACCTGCGCTGCGACACCTT
CCCGTGCATGCACCGCTTCTGCATCCCGTGCATGAAAACCTGGATGCAAT
TGCGCAACACCTGCCCGCTGTGCAACGCCAAGCTGGTGTACCTGATAGTG
GGCGTGACGCCCAGCGGGTCGTTCAGCACCATCCCGATCGTGAACGACCC
CCAGACCCGCATGGAGGCCGAGGAGGCCGTCAGGGCGGGCACGGCCGTGG
ACTTTATCTGGACGGGCAATCAGCGGTTCGCCCCGCGGTACCTGACCCTG
GGGGGGCACACGGTGAGGGCCCTGTCGCCCACCCACCCTGAGCCCACCAC
GGACGAGGATGACGACGACCTGGACGACG(GTGAGGCGGGGGGGCGGCGAG
GACCCTGGGGGAGGAGGAGGAGGGGGGGGGGGGGGAGGAATAGGCGGGCG
GGCGGGCGAGGAAAGGGCGGGCCGGGGAGGGGGCGTAACCTGATCGCGCC
CCCCGTTGTCTCTTGCAG)CAGACTACGTACCGCCCGCCCCCCGCCGGACG
CCCCGCGCCCCCCCACGCAGAGGCGCCGCCGCGCCCCCCGTGACGGGCGG
GGCGTCTCACGCAGCCCCCCAGCCGGCCGCGGCTCGGACAGCGCCCCCCT
CGGCGCCCATCGGGCCACACGGCAGCAGTAACACTAACACCACCACCAAC
AGCAGCGGCGGCGGCGGCTCCCGCCAGTCGCGAGCCGCGGTGCCGCGGGG
GGCGTCTGGCCCCTCCGGGGGGGTTGGGGTTGTTGAAGCGGAGGCGGGGC
GGCCGAGGGGCCGGACGGGCCCCCTTGTCAACAGACCCGCCCCCCTTGCA
AACAACAGAGACCCCATAGTGATCAGCGACTCCCCCCCGGCCTCTCCCCA
CAGGCCCCCCGCGGCGCCCATGCCAGGCTCCGCCCCCCGCCCCGGTCCCC
CCGCGTCCGCGGCCGCGTCGGGCCCCGCGCGCCCCCGCGCGGCCGTGGCC
CCGTGTGTGCGGGCGCCGCCTCCGGGGCCCGGCCCCCGCGCCCCGGCCCC
CGGGGCGGAGCCGGCCGCCCGCCCCGCGGACGCGCGCCGTGTGCCCCAGT
CGCACTCGTCCCTGGCTCAGGCCGCGAACCAAGAACAGAGTCTGTGCCGG
GCGCGTGCGACGGTGGCGCGCGGCTCGGGGGGGCCGGGCGTGGAGGGTGG
ACACGGGCCCTCCCGCGGCGCCGCCCCCTCCGGCGCCGCCCCCTCCGGCG
CCCCCCCGCTCCCCTCCGCCGCCTCTGTCGAGCAGGAGGCGGCGGTGCGT
CCGAGGAAGAGGCGCGGGTCGGGCCAGGAAAACCCCTCCCCCCAGTCCAC
GCGTCCCCCCCTCGCGCCGGCAGGGGCCAAGAGGGCGGCGACGCACCCCC
CCTCCGACTCAGGGCCGGGGGGGCGCGGCCAGGGAGGGCCCGGGACCCCC
CTGACGTCCTCGGCGGCCTCCGCCTCTTCCTCCTCCGCCTCTTCCTCCTC
GGCCCCGACTCCCGCGGGGGCCACCTCTTCCGCCACCGGGGCCGCGTCCT
CCTCCGCTTCCGCCTCCTCGGGCGGGGCCGTCGGTGCCCTGGGAGGGAGA
CAAGAGGAAACCTCCCTCGGCCCCCGCGCTGCTTCTGGGCCGCGGGGGCC
GAGGAAGTGTGCCCGGAAGACGCGCCACGCGGAGACTTCCGGGGCCGTCC
CCGCGGGCGGCCTCACGCGCTACCTGCCCATCTCGGGGGTCTCTAGCGTG
GTCGCCCTGTCGCCTTACGTGAACAAGACGATCACGGGGGACTGCCTGCC
CATCCTGGACATGGAGACGGGGAACATCGGGGCGTACGTGGTCCTGGTGG
ACCAGACGGGAAACATGGCGACCCGGCTGCGGGCCGCGGTCCCCGGCTGG
AGCCGCCGCACCCTGCTCCCCGAGACCGCGGGTAACCACGTGACGCCCCC
CGAGTACCCGACGGCCCCCGCGTCGGAGTGGAACAGCCTCTGGATGACCC
CCGTGGGGAACATGCTGTTCGACCAGGGCACCCTAGTGGGCGCCCTGGAC
TTCCGCAGCCTGCGGTCTCGGCACCCGTGGTCCGGGGAGCAGGGGGCGTC
GACCCGGGACGAGGGAAAACAATAA
SEQ ID NO. 25: 야생형 17 스트레인의 ICP0의 DNA 서열. 2개의 인트론이 포함된다 (즉, 하기 서열의 뉴클레오타이드 (nt) 58 내지 nt 861, 및 nt 1529 내지 nt 1663, 또한 괄호 안의 서열 참고)
ATGGAGCCCCGCCCCGGAGCGAGTACCCGCCGGCCTGAGGGCCGCCCCCA
GCGCGAG(GTGAGGGGCCGGGCGCCATGTCTGGGGCGCCATGTCTGGGGCG
CCATGTCTGGGGCGCCATGTCTGGGGCGCCATGTTGGGGGGCGCCATGTT
GGGGGGCGCCATGTTGGGGGACCCCCGACCCTTACACTGGAACCGGCCGC
CATGTTGGGGGACCCCCACTCATACACGGGAGCCGGGCGCCATGTTGGGG
CGCCATGTTAGGGGGCGTGGAACCCCGTGACACTATATATACAGGGACCG
GGGGCGCCATGTTAGGGGGCGCGGAACCCCCTGACCCTATATATACAGGG
ACCGGGGTCGCCCTGTTAGGGGTCGCCATGTGACCCCCTGACTTTATATA
TACAGACCCCCAACACCTACACATGGCCCCTTTGACTCAGACGCAGGGCC
CGGGGTCGCCGTGGGACCCCCCTGACTCATACACAGAGACACGCCCCCAC
AACAAACACACAGGGACCGGGGTCGCCGTGTTAGGGGGCGTGGTCCCCAC
TGACTCATACGCAGGGCCCCCTTACTCACACGCATCTAGGGGGGTGGGGA
GGAGCCGCCCGCCATATTTGGGGGACGCCGTGGGACCCCCGACTCCGGTG
CGTCTGGAGGGCGGGAGAAGAGGGAAGAAGAGGGGTCGGGATCCAAAGGA
CGGACCCAGACCACCTTTGGTTGCAGACCCCTTTCTCCCCCCTCTTCCGA
GGCCAGCAGGGGGGCAGGACTTTGTGAGGCGGGGGGGGAGGGGGAACTCG
TGGGCGCTGATTGACGCGGGAAATCCCCCCATTCTTACCCGCCCCCCTTT
TTTCCCCTCAG)CCCGCCCCGGATGTCTGGGTGTTTCCCTGCGACCGAGAC
CTGCCGGACAGCAGCGACTCGGAGGCGGAGACCGAAGTGGGGGGGCGGGG
GGACGCCGACCACCATGACGACGACTCCGCCTCCGAGGCGGACAGCACGG
ACACGGAACTGTTCGAGACGGGGCTGCTGGGGCCGCAGGGCGTGGATGGG
GGGGCGGTCTCGGGGGGGAGCCCCCCCCGCGAGGAAGACCCCGGCAGTTG
CGGGGGCGCCCCCCCTCGAGAGGACGGGGGGAGCGACGAGGGCGACGTGT
GCGCCGTGTGCACGGATGAGATCGCGCCCCACCTGCGCTGCGACACCTTC
CCGTGCATGCACCGCTTCTGCATCCCGTGCATGAAAACCTGGATGCAATT
GCGCAACACCTGCCCGCTGTGCAACGCCAAGCTGGTGTACCTGATAGTGG
GCGTGACGCCCAGCGGGTCGTTCAGCACCATCCCGATCGTGAACGACCCC
CAGACCCGCATGGAGGCCGAGGAGGCCGTCAGGGCGGGCACGGCCGTGGA
CTTTATCTGGACGGGCAATCAGCGGTTCGCCCCGCGGTACCTGACCCTGG
GGGGGCACACGGTGAGGGCCCTGTCGCCCACCCACCCGGAACCCACCACG
GACGAGGATGACGACGACCTGGACGACG(GTGAGGCGGGGGGCGGCAAGGA
CCCTGGGGGAGGAGGAGGAGGAGGGGGGGGAGGGAGGAATAGGCGGGCGG
GCGAGGAAAGGGCGGGCCGGGGAGGGGGCGTAACCTGATCGCGCCCCCCG
TTGTCTCTTGCAG)CAGACTACGTACCGCCCGCCCCCCGCCGGACGCCCCG
CGCCCCCCCACGCAGAGGCGCCGCCGCGCCCCCCGTGACGGGCGGGGCGT
CTCACGCAGCCCCCCAGCCGGCCGCGGCTCGGACAGCGCCCCCCTCGGCG
CCCATCGGGCCACACGGCAGCAGTAACACCAACACCACCACCAACAGCAG
CGGCGGCGGCGGCTCCCGCCAGTCGCGAGCCGCGGCGCCGCGGGGGGCGT
CTGGCCCCTCCGGGGGGGTTGGGGTTGGGGTTGGGGTTGTTGAAGCGGAG
GCGGGGCGGCCGAGGGGCCGGACGGGCCCCCTTGTCAACAGACCCGCCCC
CCTTGCAAACAACAGAGACCCCATAGTGATCAGCGACTCCCCCCCGGCCT
CTCCCCACAGGCCCCCCGCGGCGCCCATGCCAGGCTCCGCCCCCCGCCCC
GGGCCCCCCGCGTCCGCGGCCGCGTCGGGACCCGCGCGCCCCCGCGCGGC
CGTGGCCCCGTGCGTGCGAGCGCCGCCTCCGGGGCCCGGCCCCCGCGCCC
CGGCCCCCGGGGCGGAGCCGGCCGCCCGCCCCGCGGACGCGCGCCGTGTG
CCCCAGTCGCACTCGTCCCTGGCTCAGGCCGCGAACCAAGAACAGAGTCT
GTGCCGGGCGCGTGCGACGGTGGCGCGCGGCTCGGGGGGGCCGGGCGTGG
AGGGTGGGCACGGGCCCTCCCGCGGCGCCGCCCCCTCCGGCGCCGCCCCG
CTCCCCTCCGCCGCCTCTGTCGAGCAGGAGGCGGCGGTGCGTCCGAGGAA
GAGGCGCGGGTCGGGCCAGGAAAACCCCTCCCCCCAGTCCACGCGTCCCC
CCCTCGCGCCGGCAGGGGCCAAGAGGGCGGCGACGCACCCCCCCTCCGAC
TCAGGGCCGGGGGGGCGCGGCCAGGGTGGGCCCGGGACCCCCCTGACGTC
CTCGGCGGCCTCCGCCTCTTCCTCCTCTGCCTCTTCCTCCTCGGCCCCGA
CCCCCGCGGGGGCCGCCTCTTCCGCCGCCGGGGCCGCGTCCTCCTCCGCT
TCCGCCTCCTCGGGCGGGGCCGTCGGTGCCCTGGGAGGGAGACAAGAGGA
AACCTCCCTCGGCCCCCGCGCTGCTTCTGGGCCGCGGGGGCCGAGGAAGT
GTGCCCGGAAGACGCGCCACGCGGAGACTTCCGGGGCCGTCCCCGCGGGC
GGCCTCACGCGCTACCTGCCCATCTCGGGGGTCTCTAGCGTGGTCGCCCT
GTCGCCTTACGTGAACAAGACGATCACGGGGGACTGCCTGCCCATCCTGG
ACATGGAGACGGGGAACATCGGGGCGTACGTGGTCCTGGTGGACCAGACG
GGAAACATGGCGACCCGGCTGCGGGCCGCGGTCCCCGGCTGGAGCCGCCG
CACCCTGCTCCCCGAGACCGCGGGTAACCACGTGATGCCCCCCGAGTACC
CGACGGCCCCCGCGTCGGAGTGGAACAGCCTCTGGATGACCCCCGTGGGG
AACATGCTGTTCGACCAGGGCACCCTAGTGGGCGCCCTGGACTTCCGCAG
CCTGCGGTCTCGGCACCCGTGGTCCGGGGAGCAGGGGGCGTCGACCCGGG
ACGAGGGAAAACAATAA
SEQ ID NO. 53: 야생형 17 스트레인의 ICP0의 DNA 서열. 2개의 인트론이 포함된다 (즉, 하기 서열의 뉴클레오타이드 (nt) 58 내지 nt 822, 및 nt 1490 내지 nt 1625, 또한 괄호 안의 서열 참고)
ATGGAGCCCCGCCCCGGAGCGAGTACCCGCCGGCCTGAGGGCCGCCCCCA
GCGCGAG(GTGAGGGGCCGGGCGCCATGTCTGGGGCGCCATATTGGGGGGC
GCCATATTGGGGGGCGCCATGTTGGGGGACCCCCGACCCTTACACTGGAA
CCGGCCGCCATGTTGGGGGACCCCCACTCATACACGGGAGCCGGGCGCCA
TGTTGGGGCGCCATGTTAGGGGGCGTGGAACCCCGTGACACTATATATAC
AGGGACCGGGGGCGCCATGTTAGGGGGTGCGGAACCCCCTGACCCTATAT
ATACAGGGACCGGGGTCGCCCTGTTGGGGGTCGCCATGTGACCCCCTGAC
TTTATATATACAGACCCCCAACACATACACATGGCCCCTTTGACTCAGAC
GCAGGGCCCGGGGTCGCCGTGGGACCCCCTGACTCATACACAGAGACACG
CCCCCACAACAAACACACAGGGACCGGGGTCGCCGTGTTGGGGGCGTGGT
CCCCACTGACTCATACGCAGGCCCCCCTTACTCACACGCATCTAGGGGGG
TGGGGAGGAGCCGCCCGCCATATTTGGGGGACGCCGTGGGACCCCCGACT
CCGGTGCGTCTGGAGGGCGGGAGAAGAGGGAAGAAGAGGGGTCGGGATCC
AAAGGACGGACCCAGACCACCTTTGGTTGCAGACCCCTTTCTCCCCCCTC
TTCCGAGGCCAGCAGGGGGGCAGGACTTTGTGAGGCGGGGGGGGGAGAGG
GGGAACTCGTGGGTGCTGATTGACGCGGGAAATCCCCCCCCATTCTTACC
CGCCCCCCTTTTTTCCCCTTAG)CCCGCCCCGGATGTCTGGGTGTTTCCCT
GCGACCGAGACCTGCCGGACAGCAGCGACTCTGAGGCGGAGACCGAAGTG
GGGGGGCGGGGGGACGCCGACCACCATGACGACGACTCCGCCTCCGAGGC
GGACAGCACGGACACGGAACTGTTCGAGACGGGGCTGCTGGGGCCGCAGG
GCGTGGATGGGGGGGCGGTCTCGGGGGGGAGCCCCCCCCGCGAGGAAGAC
CCCGGCAGTTGCGGGGGCGCCCCCCCTCGAGAGGACGGGGGGAGCGACGA
GGGCGACGTGTGCGCCGTGTGCACGGATGAGATCGCGCCCCACCTGCGCT
GCGACACCTTCCCGTGCATGCACCGCTTCTGCATCCCGTGCATGAAAACC
TGGATGCAATTGCGCAACACCTGCCCGCTGTGCAACGCCAAGCTGGTGTA
CCTGATAGTGGGCGTGACGCCCAGCGGGTCGTTCAGCACCATCCCGATCG
TGAACGACCCCCAGACCCGCATGGAGGCCGAGGAGGCCGTCAGGGCGGGC
ACGGCCGTGGACTTTATCTGGACGGGCAATCAGCGGTTCGCCCCGCGGTA
CCTGACCCTGGGGGGGCACACGGTGAGGGCCCTGTCGCCCACCCACCCGG
AGCCCACCACGGACGAGGATGACGACGACCTGGACGACG(GTGAGGCGGGG
GGCGGCAAGGACCCTGGGGGAGGAGGAGGAGGAGGGGGGGGGAGGGAGGA
ATAGGCGGGCGGGCGAGGAAAGGGCGGGCCGGGGAGGGGGCGTAACCTGA
TCGCGCCCCCCGTTGTCTCTTGCAG)CAGACTACGTACCGCCCGCCCCCCG
CCGGACGCCCCGCGCCCCCCCACGCAGAGGCGCCGCCGCGCCCCCCGTGA
CGGGCGGGGCGTCTCACGCAGCCCCCCAGCCGGCCGCGGCTCGGACAGCG
CCCCCCTCGGCGCCCATCGGGCCACACGGCAGCAGTAACACCAACACCAC
CACCAACAGCAGCGGCGGCGGCGGCTCCCGCCAGTCGCGAGCCGCGGCGC
CGCGGGGGGCGTCTGGCCCCTCCGGGGGGGTTGGGGTTGGGGTTGGGGTT
GTTGAAGCGGAGGCGGGGCGGCCGAGGGGCCGGACGGGCCCCCTTGTCAA
CAGACCCGCCCCCCTTGCAAACAACAGAGACCCCATAGTGATCAGCGACT
CCCCCCCGGCCTCTCCCCACAGGCCCCCCGCGGCGCCCATGCCAGGCTCC
GCCCCCCGCCCCGGGCCCCCCGCGTCCGCGGCCGCGTCGGGACCCGCGCG
CCCCCGCGCGGCCGTGGCCCCGTGCGTGCGAGCGCCGCCTCCGGGGCCCG
GCCCCCGCGCCCCGGCCCCCGGGGCGGAGCCGGCCGCCCGCCCCGCGGAC
GCGCGCCGTGTGCCCCAGTCGCACTCGTCCCTGGCTCAGGCCGCGAACCA
AGAACAGAGTCTGTGCCGGGCGCGTGCGACGGTGGCGCGCGGCTCGGGGG
GGCCGGGCGTGGAGGGTGGGCACGGGCCCTCCCGCGGCGCCGCCCCCTCC
GGCGCCGCCCCGCTCCCCTCCGCCGCCTCTGTCGAGCAGGAGGCGGCGGT
GCGTCCGAGGAAGAGGCGCGGGTCGGGCCAGGAAAACCCCTCCCCCCAGT
CCACGCGTCCCCCCCTCGCGCCGGCAGGGGCCAAGAGGGCGGCGACGCAC
CCCCCCTCCGACTCAGGGCCGGGGGGGCGCGGCCAGGGTGGGCCCGGGAC
CCCCCTGACGTCCTCGGCGGCCTCCGCCTCTTCCTCCTCTGCCTCTTCCT
CCTCGGCCCCGACCCCCGCGGGGGCCGCCTCTTCCGCCGCCGGGGCCGCG
TCCTCCTCCGCTTCCGCCTCCTCGGGCGGGGCCGTCGGTGCCCTGGGAGG
GAGACAAGAGGAAACCTCCCTCGGCCCCCGCGCTGCTTCTGGGCCGCGGG
GGCCGAGGAAGTGTGCCCGGAAGACGCGCCACGCGGAGACTTCCGGGGCC
GTCCCCGCGGGCGGCCTCACGCGCTACCTGCCCATCTCGGGGGTCTCTAG
CGTGGTCGCCCTGTCGCCTTACGTGAACAAGACTATCACGGGGGACTGCC
TGCCCATCCTGGACATGGAGACGGGGAACATCGGGGCGTACGTGGTCCTG
GTGGACCAGACGGGAAACATGGCGACCCGGCTGCGGGCCGCGGTCCCCGG
CTGGAGCCGCCGCACCCTGCTCCCCGAGACCGCGGGTAACCACGTGATGC
CCCCCGAGTACCCGACGGCCCCCGCGTCGGAGTGGAACAGCCTCTGGATG
ACCCCCGTGGGGAACATGCTGTTCGACCAGGGCACCCTAGTGGGCGCCCT
GGACTTCCGCAGCCTGCGGTCTCGGCACCCGTGGTCCGGGGAGCAGGGGG
CGTCGACCCGGGACGAGGGAAAACAATAA
SEQ ID NO. 26: 야생형 17 스트레인의 ICP0의 아미노산 서열.
MEPRPGASTR RPEGRPQREP APDVWVFPCD RDLPDSSDSE AETEVGGRGD ADHHDDDSAS
EADSTDTELF ETGLLGPQGV DGGAVSGGSP PREEDPGSCG GAPPREDGGS DEGDVCAVCT
DEIAPHLRCD TFPCMHRFCI PCMKTWMQLR NTCPLCNAKL VYLIVGVTPS GSFSTIPIVN
DPQTRMEAEE AVRAGTAVDF IWTGNQRFAP RYLTLGGHTV RALSPTHPEP TTDEDDDDLD
DADYVPPAPR RTPRAPPRRG AAAPPVTGGA SHAAPQPAAA RTAPPSAPIG PHGSSNTNTT
TNSSGGGGSR QSRAAAPRGA SGPSGGVGVG VGVVEAEAGR PRGRTGPLVN RPAPLANNRD
PIVISDSPPA SPHRPPAAPM PGSAPRPGPP ASAAASGPAR PRAAVAPCVR APPPGPGPRA
PAPGAEPAAR PADARRVPQS HSSLAQAANQ EQSLCRARAT VARGSGGPGV EGGHGPSRGA
APSGAAPLPS AASVEQEAAV RPRKRRGSGQ ENPSPQSTRP PLAPAGAKRA ATHPPSDSGP
GGRGQGGPGT PLTSSAASAS SSSASSSSAP TPAGAASSAA GAASSSASAS SGGAVGALGG
RQEETSLGPR AASGPRGPRK CARKTRHAET SGAVPAGGLT RYLPISGVSS VVALSPYVNK
TITGDCLPIL DMETGNIGAY VVLVDQTGNM ATRLRAAVPG WSRRTLLPET AGNHVMPPEY
PTAPASEWNS LWMTPVGNML FDQGTLVGAL DFRSLRSRHP WSGEQGASTR DEGKQ
SEQ ID NO. 27: Mut-3, Mut-3△34.5 및 Mut-3△ICP6 바이러스 스트레인으로부터의 ICP8의 DNA 서열. c3464t 돌연변이는 하기 서열에서 진한 이탤릭체로 제시된다.
ATGGAGACAAAGCCCAAGACGGCAACCACCATCAAGGTCCCCCCCGGGCC
CCTGGGATACGTGTACGCTCGCGCGTGTCCGTCCGAAGGCATCGAGCTTC
TGGCGTTACTGTCGGCACGCAGCGGCGATTCCGACGTCGCCGTGGCGCCC
CTGGTCGTGGGCCTGACCGTGGAGAGCGGCTTTGAGGCCAACGTGGCCGT
GGTCGTGGGTTCTCGCACGACGGGGCTCGGGGGTACCGCGGTGTCCCTGA
AACTGACGCCCTCGCACTACAGCTCGTCCGTGTACGTCTTTCACGGCGGC
CGGCACCTGGACCCCAGCACCCAGGCCCCGAACCTGACGCGACTTTGCGA
GCGGGCACGCCGCCATTTTGGCTTTTCGGACTACACCCCCCGGCCCGGCG
ACCTCAAACACGAGACGACGGGGGAGGCGCTGTGTGAGCGCCTCGGCCTG
GACCCGGACCGCGCCCTCCTGTATCTGGTCGTTACCGAGGGCTTCAAGGA
GGCCGTGTGCATCAACAACACCTTTCTGCACCTGGGAGGCTCGGACAAGG
TAACCATAGGCGGGGCGGAGGTGCACCGCATACCCGTGTACCCGTTGCAG
CTGTTCATGCCGGATTTTAGCCGTGTCATCGCAGAGCCGTTCAACGCCAA
CCACCGATCGATCGGGGAGAATTTTACCTACCCGCTTCCGTTTTTTAACC
GCCCCCTCAACCGCCTCCTGTTCGAGGCGGTCGTGGGACCCGCCGCCGTG
GCACTGCGATGCCGAAACGTGGACGCCGTGGCCCGCGCGGCCGCCCACCT
GGCGTTTGACGAAAACCACGAGGGCGCCGCCCTCCCCGCCGACATTACGT
TCACGGCCTTCGAAGCCAGCCAGGGTAAGACCCCGCGGGGCGGGCGCGAC
GGCGGCGGCAAGGGCCCGGCGGGCGGGTTCGAACAGCGCCTGGCCTCCGT
CATGGCCGGAGACGCCGCCCTGGCCCTCGATTCTATCGTGTCGATGGCCG
TCTTTGACGAGCCGCCCACCGACATCTCCGCGTGGCCGCTGTTCGAGGGC
CAGGACACGGCCGCGGCCCGCGCCAACGCCGTCGGGGCGTACCTGGCGCG
CGCCGCGGGACTCGTGGGGGCCATGGTATTTAGCACCAACTCGGCCCTCC
ATCTCACCGAGGTGGACGACGCCGGCCCGGCGGACCCAAAGGACCACAGC
AAACCCTCCTTTTACCGCTTCTTCCTCGTGCCCGGGACCCACGTGGCGGC
CAACCCACAGGTGGACCGCGAGGGACACGTGGTGCCCGGGTTCGAGGGTC
GGCCCACCGCGCCCCTCGTCGGCGGAACCCAGGAATTTGCCGGCGAGCAC
CTGGCCATGCTGTGTGGGTTTTCCCCGGCGCTGCTGGCCAAGATGCTGTT
TTACCTGGAGCGCTGCGACGGCGGCGTGATCGTCGGGCGCCAGGAGATGG
ACGTGTTTCGATACGTCGCGGACTCCAACCAGACCGACGTGCCCTGTAAC
CTATGCACCTTCGACACGCGCCACGCCTGCGTACACACGACGCTCATGCG
CCTCCGGGCGCGCCATCCAAAGTTCGCCAGCGCCGCCCGCGGAGCCATCG
GCGTCTTCGGGACCATGAACAGCATGTACAGCGACTGCGACGTGCTGGGA
AACTACGCCGCCTTCTCGGCCCTGAAGCGCGCGGACGGATCCGAGACCGC
CCGGACCATCATGCAGGAGACGTACCGCGCGGCGACCGAGCGCGTCATGG
CCGAACTCGAGACCCTGCAGTACGTGGACCAGGCGGTCCCCACGGCCATG
GGGCGGCTGGAGACCATCATCACCAACCGCGAGGCCCTGCATACGGTGGT
GAACAACGTCAGGCAGGTCGTGGACCGCGAGGTGGAGCAGCTGATGCGCA
ACCTGGTGGAGGGGAGGAACTTCAAGTTTCGCGACGGTCTGGGCGAGGCC
AACCACGCCATGTCCCTGACGCTGGACCCGTACGCGTGCGGGCCGTGCCC
CCTGCTTCAGCTTCTCGGGCGGCGATCCAACCTCGCCGTGTACCAGGACC
TGGCCCTGAGTCAGTGCCACGGGGTGTTCGCCGGGCAGTCGGTCGAGGGG
CGCAACTTTCGCAATCAATTCCAACCGGTGCTGCGGCGGCGCGTGATGGA
CATGTTTAACAACGGGTTTCTGTCGGCCAAAACGCTGACGGTCGCGCTCT
CGGAGGGGGCGGCTATCTGCGCCCCCAGCCTAACGGCCGGCCAGACGGCC
CCCGCCGAGAGCAGCTTCGAGGGCGACGTTGCCCGCGTGACCCTGGGGTT
TCCCAAGGAGCTGCGCGTCAAGAGCCGCGTGTTGTTCGCGGGCGCGAGCG
CCAACGCGTCCGAGGCCGCCAAGGCGCGGGTCGCCAGCCTCCAGAGCGCC
TACCAGAAGCCCGACAAGCGCGTGGACATCCTCCTCGGACCGCTGGGCTT
TCTGCTGAAGCAGTTCCACGCGGCCATCTTCCCCAACGGCAAGCCCCCGG
GGTCCAACCAGCCGAACCCGCAGTGGTTCTGGACGGCCCTCCAACGCAAC
CAGCTTCCCGCCCGGCTCCTGTCGCGCGAGGACATCGAGACCATCGCGTT
CATTAAAAAGTTTTCCCTGGACTACGGCGCGATAAACTTTATTAACCTGG
CCCCCAACAACGTGAGCGAGCTGGCGATGTACTACATGGCAAACCAGATT
CTGCGGTACTGCGATCACTCGACATACTTCATCAACACCCTTACGGCCAT
CATCGCGGGGTCCCGCCGTCCCCCCAGCGTGCAGGCTGCGGCCGCGTGGT
CCGCGCAGGGCGGGGCGGGCCTGGAGGCCGGGGCCCGCGCGCTGATGGAC
GCCGTGGACGCGCATCCGGGCGCGTGGACGTCCATGTTCGCCAGCTGCAA
CCTGCTGCGGCCCGTCATGGCGGCGCGCCCCATGGTCGTGTTGGGGTTGA
GCATCAGCAAGTACTACGGCATGGCCGGCAACGACCGTGTGTTTCAGGCC
GGGAACTGGGCCAGCCTGATGGGCGGCAAAAACGCGTGCCCGCTCCTTAT
TTTTGACCGCACCCGCAAGTTCGTCCTGGCCTGTCCCCGGGCCGGGTTTG
TGTGCGCGGCCTCAAGCCTCGGCGGCGGAGCGCACGAAAGCTCGCTGTGC
GAGCAGCTCCGGGGCATTATCTCCGAGGGCGGGGCGGCCGTCGCCAGTAG
CGTGTTCGTGGCGACCGTGAAAAGCCTGGGGCCCCGCACCCAGCAGCTGC
AGATCGAGGACTGGCTGGCGCTCCTGGAGGACGAGTACCTAAGCGAGGAG
ATGATGGAGCTGACCGCGCGTGCCCTGGAGCGCGGCAACGGCGAGTGGTC
GACGGACGCGGCCCTGGAGGTGGCGCACGAGGCCGAGGCCCTAGTCAGCC
AACTCGGCAACGCCGGGGAGGTGTTTAACTTTGGGGATTTTGGCTGCGAG
GACGACAACGCGA T GCCGTTCGGCGGCCCGGGGGCCCCGGGACCGGCATT
TGCCGGCCGCAAACGGGCGTTCCACGGGGATGACCCGTTTGGGGAGGGGC
CCCCCGACAAAAAGGGAGACCTGACGTTGGATATGCTGTGA
SEQ ID NO. 28: Mut-3, Mut-3△34.5 및 Mut-3△ICP6 바이러스 스트레인의 ICP8의 아미노산 서열. T1155M 돌연변이는 하기 서열에서 진한 이탤릭체로 제시된다.
METKPKTATTIKVPPGPLGYVYARACPSEGIELLALLSARSGDSDVAVAP
LVVGLTVESGFEANVAVVVGSRTTGLGGTAVSLKLTPSHYSSSVYVFHGG
RHLDPSTQAPNLTRLCERARRHFGFSDYTPRPGDLKHETTGEALCERLGL
DPDRALLYLVVTEGFKEAVCINNTFLHLGGSDKVTIGGAEVHRIPVYPLQ
LFMPDFSRVIAEPFNANHRSIGENFTYPLPFFNRPLNRLLFEAVVGPAAV
ALRCRNVDAVARAAAHLAFDENHEGAALPADITFTAFEASQGKTPRGGRD
GGGKGPAGGFEQRLASVMAGDAALALDSIVSMAVFDEPPTDISAWPLFEG
QDTAAARANAVGAYLARAAGLVGAMVFSTNSALHLTEVDDAGPADPKDHS
KPSFYRFFLVPGTHVAANPQVDREGHVVPGFEGRPTAPLVGGTQEFAGEH
LAMLCGFSPALLAKMLFYLERCDGGVIVGRQEMDVFRYVADSNQTDVPCN
LCTFDTRHACVHTTLMRLRARHPKFASAARGAIGVFGTMNSMYSDCDVLG
NYAAFSALKRADGSETARTIMQETYRAATERVMAELETLQYVDQAVPTAM
GRLETIITNREALHTVVNNVRQVVDREVEQLMRNLVEGRNFKFRDGLGEA
NHAMSLTLDPYACGPCPLLQLLGRRSNLAVYQDLALSQCHGVFAGQSVEG
RNFRNQFQPVLRRRVMDMFNNGFLSAKTLTVALSEGAAICAPSLTAGQTA
PAESSFEGDVARVTLGFPKELRVKSRVLFAGASANASEAAKARVASLQSA
YQKPDKRVDILLGPLGFLLKQFHAAIFPNGKPPGSNQPNPQWFWTALQRN
QLPARLLSREDIETIAFIKKFSLDYGAINFINLAPNNVSELAMYYMANQI
LRYCDHSTYFINTLTAIIAGSRRPPSVQAAAAWSAQGGAGLEAGARALMD
AVDAHPGAWTSMFASCNLLRPVMAARPMVVLGLSISKYYGMAGNDRVFQA
GNWASLMGGKNACPLLIFDRTRKFVLACPRAGFVCAASSLGGGAHESSLC
EQLRGIISEGGAAVASSVFVATVKSLGPRTQQLQIEDWLALLEDEYLSEE
MMELTARALERGNGEWSTDAALEVAHEAEALVSQLGNAGEVFNFGDFGCE
DDNA M PFGGPGAPGPAFAGRKRAFHGDDPFGEGPPDKKGDLTLDML
SEQ ID NO. 29: 17TermA 스트레인의 ICP8의 DNA 서열.
ATGGAGACAAAGCCCAAGACGGCAACCACCATCAAGGTCCCCCCCGGGCC
CCTGGGATACGTGTACGCTCGCGCGTGTCCGTCCGAAGGCATCGAGCTTC
TGGCGTTACTGTCGGCACGCAGCGGCGATTCCGACGTCGCCGTGGCGCCC
CTGGTCGTGGGCCTGACCGTGGAGAGCGGCTTTGAGGCCAACGTGGCCGT
GGTCGTGGGTTCTCGCACGACGGGGCTCGGGGGTACCGCGGTGTCCCTGA
AACTGACGCCCTCGCACTACAGCTCGTCCGTGTACGTCTTTCACGGCGGC
CGGCACCTGGACCCCAGCACCCAGGCCCCGAACCTGACGCGACTTTGCGA
GCGGGCACGCCGCCATTTTGGCTTTTCGGACTACACCCCCCGGCCCGGCG
ACCTCAAACACGAGACGACGGGGGAGGCGCTGTGTGAGCGCCTCGGCCTG
GACCCGGACCGCGCCCTCCTGTATCTGGTCGTTACCGAGGGCTTCAAGGA
GGCCGTGTGCATCAACAACACCTTTCTGCACCTGGGAGGCTCGGACAAGG
TAACCATAGGCGGGGCGGAGGTGCACCGCATACCCGTGTACCCGTTGCAG
CTGTTCATGCCGGATTTTAGCCGTGTCATCGCAGAGCCGTTCAACGCCAA
CCACCGATCGATCGGGGAGAATTTTACCTACCCGCTTCCGTTTTTTAACC
GCCCCCTCAACCGCCTCCTGTTCGAGGCGGTCGTGGGACCCGCCGCCGTG
GCACTGCGATGCCGAAACGTGGACGCCGTGGCCCGCGCGGCCGCCCACCT
GGCGTTTGACGAAAACCACGAGGGCGCCGCCCTCCCCGCCGACATTACGT
TCACGGCCTTCGAAGCCAGCCAGGGTAAGACCCCGCGGGGCGGGCGCGAC
GGCGGCGGCAAGGGCCCGGCGGGCGGGTTCGAACAGCGCCTGGCCTCCGT
CATGGCCGGAGACGCCGCCCTGGCCCTCGATTCTATCGTGTCGATGGCCG
TCTTTGACGAGCCGCCCACCGACATCTCCGCGTGGCCGCTGTTCGAGGGC
CAGGACACGGCCGCGGCCCGCGCCAACGCCGTCGGGGCGTACCTGGCGCG
CGCCGCGGGACTCGTGGGGGCCATGGTATTTAGCACCAACTCGGCCCTCC
ATCTCACCGAGGTGGACGACGCCGGCCCGGCGGACCCAAAGGACCACAGC
AAACCCTCCTTTTACCGCTTCTTCCTCGTGCCCGGGACCCACGTGGCGGC
CAACCCACAGGTGGACCGCGAGGGACACGTGGTGCCCGGGTTCGAGGGTC
GGCCCACCGCGCCCCTCGTCGGCGGAACCCAGGAATTTGCCGGCGAGCAC
CTGGCCATGCTGTGTGGGTTTTCCCCGGCGCTGCTGGCCAAGATGCTGTT
TTACCTGGAGCGCTGCGACGGCGGCGTGATCGTCGGGCGCCAGGAGATGG
ACGTGTTTCGATACGTCGCGGACTCCAACCAGACCGACGTGCCCTGTAAC
CTATGCACCTTCGACACGCGCCACGCCTGCGTACACACGACGCTCATGCG
CCTCCGGGCGCGCCATCCAAAGTTCGCCAGCGCCGCCCGCGGAGCCATCG
GCGTCTTCGGGACCATGAACAGCATGTACAGCGACTGCGACGTGCTGGGA
AACTACGCCGCCTTCTCGGCCCTGAAGCGCGCGGACGGATCCGAGACCGC
CCGGACCATCATGCAGGAGACGTACCGCGCGGCGACCGAGCGCGTCATGG
CCGAACTCGAGACCCTGCAGTACGTGGACCAGGCGGTCCCCACGGCCATG
GGGCGGCTGGAGACCATCATCACCAACCGCGAGGCCCTGCATACGGTGGT
GAACAACGTCAGGCAGGTCGTGGACCGCGAGGTGGAGCAGCTGATGCGCA
ACCTGGTGGAGGGGAGGAACTTCAAGTTTCGCGACGGTCTGGGCGAGGCC
AACCACGCCATGTCCCTGACGCTGGACCCGTACGCGTGCGGGCCGTGCCC
CCTGCTTCAGCTTCTCGGGCGGCGATCCAACCTCGCCGTGTACCAGGACC
TGGCCCTGAGTCAGTGCCACGGGGTGTTCGCCGGGCAGTCGGTCGAGGGG
CGCAACTTTCGCAATCAATTCCAACCGGTGCTGCGGCGGCGCGTGATGGA
CATGTTTAACAACGGGTTTCTGTCGGCCAAAACGCTGACGGTCGCGCTCT
CGGAGGGGGCGGCTATCTGCGCCCCCAGCCTAACGGCCGGCCAGACGGCC
CCCGCCGAGAGCAGCTTCGAGGGCGACGTTGCCCGCGTGACCCTGGGGTT
TCCCAAGGAGCTGCGCGTCAAGAGCCGCGTGTTGTTCGCGGGCGCGAGCG
CCAACGCGTCCGAGGCCGCCAAGGCGCGGGTCGCCAGCCTCCAGAGCGCC
TACCAGAAGCCCGACAAGCGCGTGGACATCCTCCTCGGACCGCTGGGCTT
TCTGCTGAAGCAGTTCCACGCGGCCATCTTCCCCAACGGCAAGCCCCCGG
GGTCCAACCAGCCGAACCCGCAGTGGTTCTGGACGGCCCTCCAACGCAAC
CAGCTTCCCGCCCGGCTCCTGTCGCGCGAGGACATCGAGACCATCGCGTT
CATTAAAAAGTTTTCCCTGGACTACGGCGCGATAAACTTTATTAACCTGG
CCCCCAACAACGTGAGCGAGCTGGCGATGTACTACATGGCAAACCAGATT
CTGCGGTACTGCGATCACTCGACATACTTCATCAACACCCTTACGGCCAT
CATCGCGGGGTCCCGCCGTCCCCCCAGCGTGCAGGCTGCGGCCGCGTGGT
CCGCGCAGGGCGGGGCGGGCCTGGAGGCCGGGGCCCGCGCGCTGATGGAC
GCCGTGGACGCGCATCCGGGCGCGTGGACGTCCATGTTCGCCAGCTGCAA
CCTGCTGCGGCCCGTCATGGCGGCGCGCCCCATGGTCGTGTTGGGGTTGA
GCATCAGCAAGTACTACGGCATGGCCGGCAACGACCGTGTGTTTCAGGCC
GGGAACTGGGCCAGCCTGATGGGCGGCAAAAACGCGTGCCCGCTCCTTAT
TTTTGACCGCACCCGCAAGTTCGTCCTGGCCTGTCCCCGGGCCGGGTTTG
TGTGCGCGGCCTCAAGCCTCGGCGGCGGAGCGCACGAAAGCTCGCTGTGC
GAGCAGCTCCGGGGCATTATCTCCGAGGGCGGGGCGGCCGTCGCCAGTAG
CGTGTTCGTGGCGACCGTGAAAAGCCTGGGGCCCCGCACCCAGCAGCTGC
AGATCGAGGACTGGCTGGCGCTCCTGGAGGACGAGTACCTAAGCGAGGAG
ATGATGGAGCTGACCGCGCGTGCCCTGGAGCGCGGCAACGGCGAGTGGTC
GACGGACGCGGCCCTGGAGGTGGCGCACGAGGCCGAGGCCCTAGTCAGCC
AACTCGGCAACGCCGGGGAGGTGTTTAACTTTGGGGATTTTGGCTGCGAG
GACGACAACGCGACGCCGTTCGGCGGCCCGGGGGCCCCGGGACCGGCATT
TGCCGGCCGCAAACGGGCGTTCCACGGGGATGACCCGTTTGGGGAGGGGC
CCCCCGACAAAAAGGGAGACCTGACGTTGGATATGCTGTGA
SEQ ID NO. 30: 17TermA 스트레인의 ICP8의 아미노산 서열.
METKPKTATTIKVPPGPLGYVYARACPSEGIELLALLSARSGDSDVAVAP
LVVGLTVESGFEANVAVVVGSRTTGLGGTAVSLKLTPSHYSSSVYVFHGG
RHLDPSTQAPNLTRLCERARRHFGFSDYTPRPGDLKHETTGEALCERLGL
DPDRALLYLVVTEGFKEAVCINNTFLHLGGSDKVTIGGAEVHRIPVYPLQ
LFMPDFSRVIAEPFNANHRSIGENFTYPLPFFNRPLNRLLFEAVVGPAAV
ALRCRNVDAVARAAAHLAFDENHEGAALPADITFTAFEASQGKTPRGGRD
GGGKGPAGGFEQRLASVMAGDAALALDSIVSMAVFDEPPTDISAWPLFEG
QDTAAARANAVGAYLARAAGLVGAMVFSTNSALHLTEVDDAGPADPKDHS
KPSFYRFFLVPGTHVAANPQVDREGHVVPGFEGRPTAPLVGGTQEFAGEH
LAMLCGFSPALLAKMLFYLERCDGGVIVGRQEMDVFRYVADSNQTDVPCN
LCTFDTRHACVHTTLMRLRARHPKFASAARGAIGVFGTMNSMYSDCDVLG
NYAAFSALKRADGSETARTIMQETYRAATERVMAELETLQYVDQAVPTAM
GRLETIITNREALHTVVNNVRQVVDREVEQLMRNLVEGRNFKFRDGLGEA
NHAMSLTLDPYACGPCPLLQLLGRRSNLAVYQDLALSQCHGVFAGQSVEG
RNFRNQFQPVLRRRVMDMFNNGFLSAKTLTVALSEGAAICAPSLTAGQTA
PAESSFEGDVARVTLGFPKELRVKSRVLFAGASANASEAAKARVASLQSA
YQKPDKRVDILLGPLGFLLKQFHAAIFPNGKPPGSNQPNPQWFWTALQRN
QLPARLLSREDIETIAFIKKFSLDYGAINFINLAPNNVSELAMYYMANQI
LRYCDHSTYFINTLTAIIAGSRRPPSVQAAAAWSAQGGAGLEAGARALMD
AVDAHPGAWTSMFASCNLLRPVMAARPMVVLGLSISKYYGMAGNDRVFQA
GNWASLMGGKNACPLLIFDRTRKFVLACPRAGFVCAASSLGGGAHESSLC
EQLRGIISEGGAAVASSVFVATVKSLGPRTQQLQIEDWLALLEDEYLSEE
MMELTARALERGNGEWSTDAALEVAHEAEALVSQLGNAGEVFNFGDFGCE
DDNATPFGGPGAPGPAFAGRKRAFHGDDPFGEGPPDKKGDLTLDML
SEQ ID NO. 31: rRp450 스트레인의 ICP8의 DNA 서열.
ATGGAGACAAAGCCCAAGACGGCAACCACCATCAAGGTCCCCCCCGGGCC
CCTGGGATACGTGTACGCTCGCGCGTGTCCGTCCGAAGGCATCGAGCTTC
TGGCGTTACTGTCGGCGCGCAGCGGCGATGCCGACGTCGCCGTGGCGCCC
CTGGTCGTGGGCCTGACCGTGGAGAGCGGCTTTGAGGCCAACGTAGCCGT
GGTCGTGGGTTCTCGCACGACGGGGCTCGGGGGTACCGCGGTGTCCCTGA
AACTGACGCCATCGCACTACAGCTCGTCCGTGTACGTCTTTCACGGCGGC
CGGCACCTGGACCCCAGCACCCAGGCCCCAAACCTGACGCGACTCTGCGA
GCGGGCACGCCGCCATTTTGGCTTTTCGGACTACACCCCCCGGCCCGGCG
ACCTCAAACACGAGACGACGGGGGAGGCGCTGTGTGAGCGCCTCGGCCTG
GACCCGGACCGCGCCCTCCTGTATCTGGTCGTTACCGAGGGCTTCAAGGA
GGCCGTGTGCATCAACAACACCTTTCTGCACCTGGGAGGCTCGGACAAGG
TAACCATAGGCGGGGCGGAGGTGCACCGCATACCCGTGTATCCGTTGCAG
CTGTTCATGCCGGATTTTAGCCGGGTCATCGCCGAGCCGTTCAACGCCAA
CCACCGATCGATCGGGGAGAATTTTACCTACCCGCTTCCGTTTTTTAACC
GCCCCCTCAACCGCCTCCTGTTCGAGGCGGTCGTGGGACCCGCCGCCGTG
GCACTGCGATGCCGAAACGTGGACGCCGTGGCCCGCGCGGCCGCCCACCT
GGCGTTTGACGAAAACCACGAGGGCGCCGCCCTCCCCGCCGACATTACGT
TCACGGCCTTCGAAGCCAGCCAGGGTAAGACCCCGCGGGGTGGGCGCGAC
GGCGGCGGCAAGGGCCCGGCGGGCGGGTTCGAACAGCGCCTGGCCTCCGT
CATGGCCGGAGACGCCGCCCTGGCCCTCGAGTCTATCGTGTCGATGGCCG
TCTTCGACGAGCCGCCCACCGACATCTCCGCGTGGCCGCTGTGCGAGGGC
CAGGACACGGCCGCGGCCCGCGACAACGCCGTCGGGGCGTACCTGGCGCG
CGCCGCGGGACTCGTGGGGGCCATGGTATTTAGCACCAACTCGGCCCTCC
ATCTCACCGAGGTGGACGACGCCGGTCCGGCGGACCCAAAGGACCACAGC
AAACCCTCCTTTTACCGCTTCTTCCTCGTGCCCGGGACCCACGTGGCGGC
CAACCCACAGGTGGACCGCGAGGGACACGTGGTGCCCGGGTTCGAGGGTC
GGCCCACCGCGCCCCTCGTCGGCGGAACCCAGGAATTTGCCGGCGAGCAC
CTGGCCATGCTGTGTGGGTTTTCCCCGGCGCTGCTGGCCAAGATGCTGTT
TTACCTGGAGCGCTGCGACGGCGGCGTGATCGTCGGGCGCCAGGAGATGG
ACGTGTTTCGATACGTCGCGGACTCCAACCAGACCGACGTGCCCTGCAAC
CTGTGCACCTTCGACACGCGCCACGCCTGCGTACACACGACGCTCATGCG
CCTCCGGGCGCGCCATCCCAAGTTCGCCAGCGCCGCCCGCGGAGCCATCG
GCGTCTTCGGGACCATGAACAGCATGTACAGCGACTGCGACGTGCTGGGA
AACTACGCCGCCTTCTCGGCCCTGAAGCGCGCGGACGGATCCGAGACCGC
CCGGACCATCATGCAGGAGACGTACCGCGCGGCGACCGAGCGCGTCATGG
CCGAACTCGAGACCCTGCAGTACGTGGACCAGGCGGTCCCCACGGCCATG
GGGCGGCTGGAGACCATCATCACCAACCGCGAGGCCCTGCATACGGTGGT
GAACAACGTCAGGCAGGTCGTGGACCGCGAGGTGGAGCAGCTGATGCGCA
ACCTGGTGGAGGGGAGGAACTTCAAGTTTCGCGACGGTCTGGGCGAGGCC
AACCACGCCATGTCCCTGACGCTGGACCCGTACGCGTGCGGGCCATGCCC
CCTGCTTCAGCTTCTCGGGCGGCGATCCAACCTCGCCGTGTATCAGGACC
TGGCCCTGAGCCAGTGCCACGGGGTGTTCGCCGGGCAGTCGGTCGAGGGG
CGCAACTTTCGCAATCAATTCCAACCGGTGCTGCGGCGGCGCGTGATGGA
CATGTTTAACAACGGGTTTCTGTCGGCCAAAACGCTGACGGTCGCGCTCT
CGGAGGGGGCGGCTATCTGCGCCCCCAGCCTAACGGCCGGCCAGACGGCC
CCCGCCGAGAGCAGCTTCGAGGGCGACGTTGCCCGCGTGACCCTGGGGTT
TCCCAAGGAGCTGCGCGTCAAGAGCCGCGTGTTGTTCGCGGGCGCGAGCG
CCAACGCGTCCGAGGCCGCCAAGGCGCGGGTCGCCAGCCTCCAGAGCGCC
TACCAGAAGCCCGACAAGCGCGTGGACATCCTCCTCGGACCGCTGGGCTT
TCTGCTGAAGCAGTTCCACGCGGCCATCTTCCCCAACGGCAAGCCCCCGG
GGTCCAACCAGCCGAACCCGCAGTGGTTCTGGACGGCCCTCCAACGCAAC
CAGCTTCCCGCCCGGCTCCTGTCGCGCGAGGACATCGAGACCATCGCGTT
CATTAAAAAGTTTTCCCTGGACTACGGCGCGATAAACTTTATTAACCTGG
CCCCCAACAACGTGAGCGAGCTGGCGATGTACTACATGGCAAACCAGATT
CTGCGGTACTGCGATCACTCGACATACTTCATCAACACCCTCACGGCCAT
CATCGCGGGGTCCCGCCGTCCCCCCAGCGTGCAGGCGGCGGCCGCGTGGT
CCGCGCAGGGCGGGGCGGGCCTGGAGGCCGGGGCCCGCGCGCTGATGGAC
GCCGTGGACGCGCATCCGGGCGCGTGGACGTCCATGTTCGCCAGCTGCAA
CCTGCTGCGGCCCGTCATGGCGGCGCGCCCCATGGTCGTGTTGGGGTTGA
GCATCAGCAAATACTACGGCATGGCCGGCAACGACCGTGTGTTTCAGGCC
GGGAACTGGGCCAGCCTGATGGGCGGCAAAAACGCGTGCCCGCTCCTTAT
TTTTGACCGCACCCGCAAGTTCGTCCTGGCCTGTCCCCGGGCCGGGTTTG
TGTGCGCGGCCTCGAACCTCGGCGGCGGAGCGCACGAAAGCTCGCTGTGC
GAGCAGCTCCGGGGCATTATCTCCGAGGGCGGGGCGGCCGTCGCCAGTAG
CGTGTTCGTGGCGACCGTGAAAAGCCTGGGGCCCCGCACCCAGCAGCTGC
AGATCGAGGACTGGCTGGCGCTCCTGGAGGACGAGTACCTAAGCGAGGAG
ATGATGGAGCTGACCGCGCGTGCCCTGGAGCGCGGCAACGGCGAGTGGTC
GACGGACGCGGCCCTGGAGGTGGCGCACGAGGCCGAGGCCCTAGTCAGCC
AACTCGGCAACGCCGGGGAGGTGTTTAACTTTGGGGATTTTGGCTGCGAG
GACGACAACGCGACGCCGTTCGGCGGCCCGGGGGCCCCGGGACCGGCATT
TGCCGGCCGCAAACGGGCGTTCCACGGGGATGACCCGTTTGGGGAGGGGC
CCCCCGACAAAAAGGGAGACCTGACGTTGGATATGCTGTGA
SEQ ID NO. 32: rRp450 스트레인의 ICP8의 아미노산 서열.
METKPKTATTIKVPPGPLGYVYARACPSEGIELLALLSARSGDADVAVAP
LVVGLTVESGFEANVAVVVGSRTTGLGGTAVSLKLTPSHYSSSVYVFHGG
RHLDPSTQAPNLTRLCERARRHFGFSDYTPRPGDLKHETTGEALCERLGL
DPDRALLYLVVTEGFKEAVCINNTFLHLGGSDKVTIGGAEVHRIPVYPLQ
LFMPDFSRVIAEPFNANHRSIGENFTYPLPFFNRPLNRLLFEAVVGPAAV
ALRCRNVDAVARAAAHLAFDENHEGAALPADITFTAFEASQGKTPRGGRD
GGGKGPAGGFEQRLASVMAGDAALALESIVSMAVFDEPPTDISAWPLCEG
QDTAAARDNAVGAYLARAAGLVGAMVFSTNSALHLTEVDDAGPADPKDHS
KPSFYRFFLVPGTHVAANPQVDREGHVVPGFEGRPTAPLVGGTQEFAGEH
LAMLCGFSPALLAKMLFYLERCDGGVIVGRQEMDVFRYVADSNQTDVPCN
LCTFDTRHACVHTTLMRLRARHPKFASAARGAIGVFGTMNSMYSDCDVLG
NYAAFSALKRADGSETARTIMQETYRAATERVMAELETLQYVDQAVPTAM
GRLETIITNREALHTVVNNVRQVVDREVEQLMRNLVEGRNFKFRDGLGEA
NHAMSLTLDPYACGPCPLLQLLGRRSNLAVYQDLALSQCHGVFAGQSVEG
RNFRNQFQPVLRRRVMDMFNNGFLSAKTLTVALSEGAAICAPSLTAGQTA
PAESSFEGDVARVTLGFPKELRVKSRVLFAGASANASEAAKARVASLQSA
YQKPDKRVDILLGPLGFLLKQFHAAIFPNGKPPGSNQPNPQWFWTALQRN
QLPARLLSREDIETIAFIKKFSLDYGAINFINLAPNNVSELAMYYMANQI
LRYCDHSTYFINTLTAIIAGSRRPPSVQAAAAWSAQGGAGLEAGARALMD
AVDAHPGAWTSMFASCNLLRPVMAARPMVVLGLSISKYYGMAGNDRVFQA
GNWASLMGGKNACPLLIFDRTRKFVLACPRAGFVCAASNLGGGAHESSLC
EQLRGIISEGGAAVASSVFVATVKSLGPRTQQLQIEDWLALLEDEYLSEE
MMELTARALERGNGEWSTDAALEVAHEAEALVSQLGNAGEVFNFGDFGCE
DDNATPFGGPGAPGPAFAGRKRAFHGDDPFGEGPPDKKGDLTLDML
SEQ ID NO. 33: 야생형 17 스트레인의 ICP8의 DNA 서열.
ATGGAGACAAAGCCCAAGACGGCAACCACCATCAAGGTCCCCCCCGGGCC
CCTGGGATACGTGTACGCTCGCGCGTGTCCGTCCGAAGGCATCGAGCTTC
TGGCGTTACTGTCGGCACGCAGCGGCGATTCCGACGTCGCCGTGGCGCCC
CTGGTCGTGGGCCTGACCGTGGAGAGCGGCTTTGAGGCCAACGTGGCCGT
GGTCGTGGGTTCTCGCACGACGGGGCTCGGGGGTACCGCGGTGTCCCTGA
AACTGACGCCCTCGCACTACAGCTCGTCCGTGTACGTCTTTCACGGCGGC
CGGCACCTGGACCCCAGCACCCAGGCCCCGAACCTGACGCGACTTTGCGA
GCGGGCACGCCGCCATTTTGGCTTTTCGGACTACACCCCCCGGCCCGGCG
ACCTCAAACACGAGACGACGGGGGAGGCGCTGTGTGAGCGCCTCGGCCTG
GACCCGGACCGCGCCCTCCTGTATCTGGTCGTTACCGAGGGCTTCAAGGA
GGCCGTGTGCATCAACAACACCTTTCTGCACCTGGGAGGCTCGGACAAGG
TAACCATAGGCGGGGCGGAGGTGCACCGCATACCCGTGTACCCGTTGCAG
CTGTTCATGCCGGATTTTAGCCGTGTCATCGCAGAGCCGTTCAACGCCAA
CCACCGATCGATCGGGGAGAATTTTACCTACCCGCTTCCGTTTTTTAACC
GCCCCCTCAACCGCCTCCTGTTCGAGGCGGTCGTGGGACCCGCCGCCGTG
GCACTGCGATGCCGAAACGTGGACGCCGTGGCCCGCGCGGCCGCCCACCT
GGCGTTTGACGAAAACCACGAGGGCGCCGCCCTCCCCGCCGACATTACGT
TCACGGCCTTCGAAGCCAGCCAGGGTAAGACCCCGCGGGGCGGGCGCGAC
GGCGGCGGCAAGGGCCCGGCGGGCGGGTTCGAACAGCGCCTGGCCTCCGT
CATGGCCGGAGACGCCGCCCTGGCCCTCGATTCTATCGTGTCGATGGCCG
TCTTTGACGAGCCGCCCACCGACATCTCCGCGTGGCCGCTGTTCGAGGGC
CAGGACACGGCCGCGGCCCGCGCCAACGCCGTCGGGGCGTACCTGGCGCG
CGCCGCGGGACTCGTGGGGGCCATGGTATTTAGCACCAACTCGGCCCTCC
ATCTCACCGAGGTGGACGACGCCGGCCCGGCGGACCCAAAGGACCACAGC
AAACCCTCCTTTTACCGCTTCTTCCTCGTGCCCGGGACCCACGTGGCGGC
CAACCCACAGGTGGACCGCGAGGGACACGTGGTGCCCGGGTTCGAGGGTC
GGCCCACCGCGCCCCTCGTCGGCGGAACCCAGGAATTTGCCGGCGAGCAC
CTGGCCATGCTGTGTGGGTTTTCCCCGGCGCTGCTGGCCAAGATGCTGTT
TTACCTGGAGCGCTGCGACGGCGGCGTGATCGTCGGGCGCCAGGAGATGG
ACGTGTTTCGATACGTCGCGGACTCCAACCAGACCGACGTGCCCTGTAAC
CTATGCACCTTCGACACGCGCCACGCCTGCGTACACACGACGCTCATGCG
CCTCCGGGCGCGCCATCCAAAGTTCGCCAGCGCCGCCCGCGGAGCCATCG
GCGTCTTCGGGACCATGAACAGCATGTACAGCGACTGCGACGTGCTGGGA
AACTACGCCGCCTTCTCGGCCCTGAAGCGCGCGGACGGATCCGAGACCGC
CCGGACCATCATGCAGGAGACGTACCGCGCGGCGACCGAGCGCGTCATGG
CCGAACTCGAGACCCTGCAGTACGTGGACCAGGCGGTCCCCACGGCCATG
GGGCGGCTGGAGACCATCATCACCAACCGCGAGGCCCTGCATACGGTGGT
GAACAACGTCAGGCAGGTCGTGGACCGCGAGGTGGAGCAGCTGATGCGCA
ACCTGGTGGAGGGGAGGAACTTCAAGTTTCGCGACGGTCTGGGCGAGGCC
AACCACGCCATGTCCCTGACGCTGGACCCGTACGCGTGCGGGCCGTGCCC
CCTGCTTCAGCTTCTCGGGCGGCGATCCAACCTCGCCGTGTACCAGGACC
TGGCCCTGAGTCAGTGCCACGGGGTGTTCGCCGGGCAGTCGGTCGAGGGG
CGCAACTTTCGCAATCAATTCCAACCGGTGCTGCGGCGGCGCGTGATGGA
CATGTTTAACAACGGGTTTCTGTCGGCCAAAACGCTGACGGTCGCGCTCT
CGGAGGGGGCGGCTATCTGCGCCCCCAGCCTAACGGCCGGCCAGACGGCC
CCCGCCGAGAGCAGCTTCGAGGGCGACGTTGCCCGCGTGACCCTGGGGTT
TCCCAAGGAGCTGCGCGTCAAGAGCCGCGTGTTGTTCGCGGGCGCGAGCG
CCAACGCGTCCGAGGCCGCCAAGGCGCGGGTCGCCAGCCTCCAGAGCGCC
TACCAGAAGCCCGACAAGCGCGTGGACATCCTCCTCGGACCGCTGGGCTT
TCTGCTGAAGCAGTTCCACGCGGCCATCTTCCCCAACGGCAAGCCCCCGG
GGTCCAACCAGCCGAACCCGCAGTGGTTCTGGACGGCCCTCCAACGCAAC
CAGCTTCCCGCCCGGCTCCTGTCGCGCGAGGACATCGAGACCATCGCGTT
CATTAAAAAGTTTTCCCTGGACTACGGCGCGATAAACTTTATTAACCTGG
CCCCCAACAACGTGAGCGAGCTGGCGATGTACTACATGGCAAACCAGATT
CTGCGGTACTGCGATCACTCGACATACTTCATCAACACCCTTACGGCCAT
CATCGCGGGGTCCCGCCGTCCCCCCAGCGTGCAGGCTGCGGCCGCGTGGT
CCGCGCAGGGCGGGGCGGGCCTGGAGGCCGGGGCCCGCGCGCTGATGGAC
GCCGTGGACGCGCATCCGGGCGCGTGGACGTCCATGTTCGCCAGCTGCAA
CCTGCTGCGGCCCGTCATGGCGGCGCGCCCCATGGTCGTGTTGGGGTTGA
GCATCAGCAAGTACTACGGCATGGCCGGCAACGACCGTGTGTTTCAGGCC
GGGAACTGGGCCAGCCTGATGGGCGGCAAAAACGCGTGCCCGCTCCTTAT
TTTTGACCGCACCCGCAAGTTCGTCCTGGCCTGTCCCCGGGCCGGGTTTG
TGTGCGCGGCCTCAAGCCTCGGCGGCGGAGCGCACGAAAGCTCGCTGTGC
GAGCAGCTCCGGGGCATTATCTCCGAGGGCGGGGCGGCCGTCGCCAGTAG
CGTGTTCGTGGCGACCGTGAAAAGCCTGGGGCCCCGCACCCAGCAGCTGC
AGATCGAGGACTGGCTGGCGCTCCTGGAGGACGAGTACCTAAGCGAGGAG
ATGATGGAGCTGACCGCGCGTGCCCTGGAGCGCGGCAACGGCGAGTGGTC
GACGGACGCGGCCCTGGAGGTGGCGCACGAGGCCGAGGCCCTAGTCAGCC
AACTCGGCAACGCCGGGGAGGTGTTTAACTTTGGGGATTTTGGCTGCGAG
GACGACAACGCGACGCCGTTCGGCGGCCCGGGGGCCCCGGGACCGGCATT
TGCCGGCCGCAAACGGGCGTTCCACGGGGATGACCCGTTTGGGGAGGGGC
CCCCCGACAAAAAGGGAGACCTGACGTTGGATATGCTGTGA
SEQ ID NO. 34: 야생형 17 스트레인의 ICP8의 아미노산 서열.
METKPKTATTIKVPPGPLGYVYARACPSEGIELLALLSARSGDSDVAVAP
LVVGLTVESGFEANVAVVVGSRTTGLGGTAVSLKLTPSHYSSSVYVFHGG
RHLDPSTQAPNLTRLCERARRHFGFSDYTPRPGDLKHETTGEALCERLGL
DPDRALLYLVVTEGFKEAVCINNTFLHLGGSDKVTIGGAEVHRIPVYPLQ
LFMPDFSRVIAEPFNANHRSIGENFTYPLPFFNRPLNRLLFEAVVGPAAV
ALRCRNVDAVARAAAHLAFDENHEGAALPADITFTAFEASQGKTPRGGRD
GGGKGPAGGFEQRLASVMAGDAALALDSIVSMAVFDEPPTDISAWPLFEG
QDTAAARANAVGAYLARAAGLVGAMVFSTNSALHLTEVDDAGPADPKDHS
KPSFYRFFLVPGTHVAANPQVDREGHVVPGFEGRPTAPLVGGTQEFAGEH
LAMLCGFSPALLAKMLFYLERCDGGVIVGRQEMDVFRYVADSNQTDVPCN
LCTFDTRHACVHTTLMRLRARHPKFASAARGAIGVFGTMNSMYSDCDVLG
NYAAFSALKRADGSETARTIMQETYRAATERVMAELETLQYVDQAVPTAM
GRLETIITNREALHTVVNNVRQVVDREVEQLMRNLVEGRNFKFRDGLGEA
NHAMSLTLDPYACGPCPLLQLLGRRSNLAVYQDLALSQCHGVFAGQSVEG
RNFRNQFQPVLRRRVMDMFNNGFLSAKTLTVALSEGAAICAPSLTAGQTA
PAESSFEGDVARVTLGFPKELRVKSRVLFAGASANASEAAKARVASLQSA
YQKPDKRVDILLGPLGFLLKQFHAAIFPNGKPPGSNQPNPQWFWTALQRN
QLPARLLSREDIETIAFIKKFSLDYGAINFINLAPNNVSELAMYYMANQI
LRYCDHSTYFINTLTAIIAGSRRPPSVQAAAAWSAQGGAGLEAGARALMD
AVDAHPGAWTSMFASCNLLRPVMAARPMVVLGLSISKYYGMAGNDRVFQA
GNWASLMGGKNACPLLIFDRTRKFVLACPRAGFVCAASSLGGGAHESSLC
EQLRGIISEGGAAVASSVFVATVKSLGPRTQQLQIEDWLALLEDEYLSEE
MMELTARALERGNGEWSTDAALEVAHEAEALVSQLGNAGEVFNFGDFGCE
DDNATPFGGPGAPGPAFAGRKRAFHGDDPFGEGPPDKKGDLTLDML
SEQ ID NO. 35: Mut-3, Mut-3△34.5 및 Mut-3△ICP6 바이러스 스트레인으로부터의 DNA 포장 터미나제 sub1의 DNA 서열. g1126a 돌연변이는 하기 서열에서 진한 이탤릭체로 제시된다.
ATGTTTGGTCAGCAGCTGGCGTCCGACGTCCAGCAGTACCTGGAGCGCCT
CGAGAAACAGAGGCAACTTAAGGTGGGCGCGGACGAGGCGTCGGCGGGCC
TCACCATGGGCGGCGATGCCCTACGAGTGCCCTTTTTAGATTTCGCGACC
GCGACCCCCAAGCGCCACCAGACCGTGGTCCCTGGCGTCGGGACGCTCCA
CGACTGCTGCGAGCACTCGCCGCTCTTCTCGGCCGTGGCGCGGCGGCTGC
TGTTTAATAGCCTGGTGCCGGCGCAACTAAAGGGGCGTGATTTCGGGGGC
GACCACACGGCCAAGCTGGAATTCCTGGCCCCCGAGTTGGTACGGGCGGT
GGCGCGACTGCGGTTTAAGGAGTGCGCGCCGGCGGACGTGGTGCCTCAGC
GTAACGCCTACTATAGCGTTCTGAATACGTTTCAGGCCCTCCACCGCTCC
GAAGCCTTTCGCCAGCTGGTGCACTTTGTGCGGGACTTTGCCCAGCTGCT
CAAAACCTCCTTCCGGGCCTCCAGCCTCACGGAGACCACGGGCCCCCCCA
AAAAACGGGCCAAGGTGGACGTGGCCACCCACGGCCGGACGTACGGCACG
CTGGAGCTGTTCCAAAAAATGATCCTTATGCACGCCACCTACTTTCTGGC
CGCCGTGCTCCTCGGGGACCACGCGGAGCAGGTCAACACGTTCCTGCGTC
TCGTGTTTGAGATCCCCCTGTTTAGCGACGCGGCCGTGCGCCACTTCCGC
CAGCGCGCCACCGTGTTTCTCGTCCCCCGGCGCCACGGCAAGACCTGGTT
TCTGGTGCCCCTCATCGCGCTGTCGCTGGCCTCCTTTCGGGGGATCAAGA
TCGGCTACACGGCGCACATCCGCAAGGCGACCGAGCCGGTGTTTGAGGAG
ATCGACGCCTGCCTGCGGGGCTGGTTCGGTTCGGCCCGAGTGGACCACGT
TAAAGGGGAAACCATCTCCTTCTCGTTTCCGGACGGGTCGCGCAGTACCA
TCGTGTTTGCCTCCAGCCACAACACAAACGGAATCCGAGGCCAGGACTTT
AACCTGCTCTTTGTCGACGAGGCCAACTTTATTCGCCCGGATGCGGTCCA
GACGATTATGGGCTTTCTCAACCAG A CCAACTGCAAGATTATCTTCGTGT
CGTCCACCAACACCGGGAAGGCCAGTACGAGCTTTTTGTACAACCTCCGC
GGGGCCGCAGACGAGCTTCTCAACGTGGTGACCTATATATGCGATGATCA
CATGCCGAGGGTGGTGACGCACACAAACGCCACGGCCTGTTCTTGTTATA
TCCTCAACAAGCCCGTTTTCATCACGATGGACGGGGCGGTTCGCCGGACC
GCCGATTTGTTTCTGGCCGATTCCTTCATGCAGGAGATCATCGGGGGCCA
GGCCAGGGAGACCGGCGACGACCGGCCCGTTCTGACCAAGTCTGCGGGGG
AGCGGTTTCTGTTGTACCGCCCCTCGACCACCACCAACAGCGGCCTCATG
GCCCCCGATTTGTACGTGTACGTGGATCCCGCGTTCACGGCCAACACCCG
AGCCTCCGGGACCGGCGTCGCTGTCGTCGGGCGGTACCGCGACGATTATA
TCATCTTCGCCCTGGAGCACTTTTTTCTCCGCGCGCTCACGGGCTCGGCC
CCCGCCGACATCGCCCGCTGCGTCGTCCACAGTCTGACGCAGGTCCTGGC
CCTGCATCCCGGGGCGTTTCGCGGCGTCCGGGTGGCGGTCGAGGGAAATA
GCAGCCAGGACTCGGCCGTCGCCATCGCCACGCACGTGCACACAGAGATG
CACCGCCTACTGGCCTCGGAGGGGGCCGACGCGGGCTCGGGCCCCGAGCT
TCTCTTCTACCACTGCGAGCCTCCCGGGAGCGCGGTGCTGTACCCCTTTT
TCCTGCTCAACAAACAGAAGACGCCCGCCTTTGAACACTTTATTAAAAAG
TTTAACTCCGGGGGCGTCATGGCCTCCCAGGAGATCGTTTCCGCGACGGT
GCGCCTGCAGACCGACCCGGTCGAGTATCTGCTCGAGCAGCTAAATAACC
TCACCGAAACCGTCTCCCCCAACACTGACGTCCGTACGTATTCCGGAAAA
CGGAACGGCGCCTCGGATGACCTTATGGTCGCCGTCATTATGGCCATCTA
CCTCGCGGCCCAGGCCGGACCTCCGCACACATTCGCTCCTATCATACGCG
TCTCGTGA
SEQ ID NO. 36: Mut-3, Mut-3△34.5 및 Mut-3△ICP6 바이러스 스트레인으로부터의 DNA 포장 터미나제 sub1의 아미노산 서열. A376T 돌연변이는 하기 서열에서 진한 이탤릭체로 제시된다.
MFGQQLASDVQQYLERLEKQRQLKVGADEASAGLTMGGDALRVPFLDFAT
ATPKRHQTVVPGVGTLHDCCEHSPLFSAVARRLLFNSLVPAQLKGRDFGG
DHTAKLEFLAPELVRAVARLRFKECAPADVVPQRNAYYSVLNTFQALHRS
EAFRQLVHFVRDFAQLLKTSFRASSLTETTGPPKKRAKVDVATHGRTYGT
LELFQKMILMHATYFLAAVLLGDHAEQVNTFLRLVFEIPLFSDAAVRHFR
QRATVFLVPRRHGKTWFLVPLIALSLASFRGIKIGYTAHIRKATEPVFEE
IDACLRGWFGSARVDHVKGETISFSFPDGSRSTIVFASSHNTNGIRGQDF
NLLFVDEANFIRPDAVQTIMGFLNQ T NCKIIFVSSTNTGKASTSFLYNLR
GAADELLNVVTYICDDHMPRVVTHTNATACSCYILNKPVFITMDGAVRRT
ADLFLADSFMQEIIGGQARETGDDRPVLTKSAGERFLLYRPSTTTNSGLM
APDLYVYVDPAFTANTRASGTGVAVVGRYRDDYIIFALEHFFLRALTGSA
PADIARCVVHSLTQVLALHPGAFRGVRVAVEGNSSQDSAVAIATHVHTEM
HRLLASEGADAGSGPELLFYHCEPPGSAVLYPFFLLNKQKTPAFEHFIKK
FNSGGVMASQEIVSATVRLQTDPVEYLLEQLNNLTETVSPNTDVRTYSGK
RNGASDDLMVAVIMAIYLAAQAGPPHTFAPIIRVS
SEQ ID NO. 37: 17TermA 바이러스 스트레인의 DNA 포장 터미나제 sub1의 DNA 서열.
ATGTTTGGTCAGCAGCTGGCGTCCGACGTCCAGCAGTACCTGGAGCGCCT
CGAGAAACAGAGGCAACTTAAGGTGGGCGCGGACGAGGCGTCGGCGGGCC
TCACCATGGGCGGCGATGCCCTACGAGTGCCCTTTTTAGATTTCGCGACC
GCGACCCCCAAGCGCCACCAGACCGTGGTCCCTGGCGTCGGGACGCTCCA
CGACTGCTGCGAGCACTCGCCGCTCTTCTCGGCCGTGGCGCGGCGGCTGC
TGTTTAATAGCCTGGTGCCGGCGCAACTAAAGGGGCGTGATTTCGGGGGC
GACCACACGGCCAAGCTGGAATTCCTGGCCCCCGAGTTGGTACGGGCGGT
GGCGCGACTGCGGTTTAAGGAGTGCGCGCCGGCGGACGTGGTGCCTCAGC
GTAACGCCTACTATAGCGTTCTGAATACGTTTCAGGCCCTCCACCGCTCC
GAAGCCTTTCGCCAGCTGGTGCACTTTGTGCGGGACTTTGCCCAGCTGCT
CAAAACCTCCTTCCGGGCCTCCAGCCTCACGGAGACCACGGGCCCCCCCA
AAAAACGGGCCAAGGTGGACGTGGCCACCCACGGCCGGACGTACGGCACG
CTGGAGCTGTTCCAAAAAATGATCCTTATGCACGCCACCTACTTTCTGGC
CGCCGTGCTCCTCGGGGACCACGCGGAGCAGGTCAACACGTTCCTGCGTC
TCGTGTTTGAGATCCCCCTGTTTAGCGACGCGGCCGTGCGCCACTTCCGC
CAGCGCGCCACCGTGTTTCTCGTCCCCCGGCGCCACGGCAAGACCTGGTT
TCTGGTGCCCCTCATCGCGCTGTCGCTGGCCTCCTTTCGGGGGATCAAGA
TCGGCTACACGGCGCACATCCGCAAGGCGACCGAGCCGGTGTTTGAGGAG
ATCGACGCCTGCCTGCGGGGCTGGTTCGGTTCGGCCCGAGTGGACCACGT
TAAAGGGGAAACCATCTCCTTCTCGTTTCCGGACGGGTCGCGCAGTACCA
TCGTGTTTGCCTCCAGCCACAACACAAACGGAATCCGAGGCCAGGACTTT
AACCTGCTCTTTGTCGACGAGGCCAACTTTATTCGCCCGGATGCGGTCCA
GACGATTATGGGCTTTCTCAACCAGGCCAACTGCAAGATTATCTTCGTGT
CGTCCACCAACACCGGGAAGGCCAGTACGAGCTTTTTGTACAACCTCCGC
GGGGCCGCAGACGAGCTTCTCAACGTGGTGACCTATATATGCGATGATCA
CATGCCGAGGGTGGTGACGCACACAAACGCCACGGCCTGTTCTTGTTATA
TCCTCAACAAGCCCGTTTTCATCACGATGGACGGGGCGGTTCGCCGGACC
GCCGATTTGTTTCTGGCCGATTCCTTCATGCAGGAGATCATCGGGGGCCA
GGCCAGGGAGACCGGCGACGACCGGCCCGTTCTGACCAAGTCTGCGGGGG
AGCGGTTTCTGTTGTACCGCCCCTCGACCACCACCAACAGCGGCCTCATG
GCCCCCGATTTGTACGTGTACGTGGATCCCGCGTTCACGGCCAACACCCG
AGCCTCCGGGACCGGCGTCGCTGTCGTCGGGCGGTACCGCGACGATTATA
TCATCTTCGCCCTGGAGCACTTTTTTCTCCGCGCGCTCACGGGCTCGGCC
CCCGCCGACATCGCCCGCTGCGTCGTCCACAGTCTGACGCAGGTCCTGGC
CCTGCATCCCGGGGCGTTTCGCGGCGTCCGGGTGGCGGTCGAGGGAAATA
GCAGCCAGGACTCGGCCGTCGCCATCGCCACGCACGTGCACACAGAGATG
CACCGCCTACTGGCCTCGGAGGGGGCCGACGCGGGCTCGGGCCCCGAGCT
TCTCTTCTACCACTGCGAGCCTCCCGGGAGCGCGGTGCTGTACCCCTTTT
TCCTGCTCAACAAACAGAAGACGCCCGCCTTTGAACACTTTATTAAAAAG
TTTAACTCCGGGGGCGTCATGGCCTCCCAGGAGATCGTTTCCGCGACGGT
GCGCCTGCAGACCGACCCGGTCGAGTATCTGCTCGAGCAGCTAAATAACC
TCACCGAAACCGTCTCCCCCAACACTGACGTCCGTACGTATTCCGGAAAA
CGGAACGGCGCCTCGGATGACCTTATGGTCGCCGTCATTATGGCCATCTA
CCTCGCGGCCCAGGCCGGACCTCCGCACACATTCGCTCCTATCATACGCG
TCTCGTGA
SEQ ID NO. 38: 17TermA 바이러스 스트레인의 DNA 포장 터미나제 sub1의 아미노산 서열.
MFGQQLASDVQQYLERLEKQRQLKVGADEASAGLTMGGDALRVPFLDFAT
ATPKRHQTVVPGVGTLHDCCEHSPLFSAVARRLLFNSLVPAQLKGRDFGG
DHTAKLEFLAPELVRAVARLRFKECAPADVVPQRNAYYSVLNTFQALHRS
EAFRQLVHFVRDFAQLLKTSFRASSLTETTGPPKKRAKVDVATHGRTYGT
LELFQKMILMHATYFLAAVLLGDHAEQVNTFLRLVFEIPLFSDAAVRHFR
QRATVFLVPRRHGKTWFLVPLIALSLASFRGIKIGYTAHIRKATEPVFEE
IDACLRGWFGSARVDHVKGETISFSFPDGSRSTIVFASSHNTNGIRGQDF
NLLFVDEANFIRPDAVQTIMGFLNQANCKIIFVSSTNTGKASTSFLYNLR
GAADELLNVVTYICDDHMPRVVTHTNATACSCYILNKPVFITMDGAVRRT
ADLFLADSFMQEIIGGQARETGDDRPVLTKSAGERFLLYRPSTTTNSGLM
APDLYVYVDPAFTANTRASGTGVAVVGRYRDDYIIFALEHFFLRALTGSA
PADIARCVVHSLTQVLALHPGAFRGVRVAVEGNSSQDSAVAIATHVHTEM
HRLLASEGADAGSGPELLFYHCEPPGSAVLYPFFLLNKQKTPAFEHFIKK
FNSGGVMASQEIVSATVRLQTDPVEYLLEQLNNLTETVSPNTDVRTYSGK
RNGASDDLMVAVIMAIYLAAQAGPPHTFAPIIRVS
SEQ ID NO. 39: rRp450 바이러스 스트레인의 DNA 포장 터미나제 sub1의 DNA 서열.
ATGTTTGGTCAGCAGCTGGCGTCCGACGTCCAGCAGTACCTGGAGCGCCT
CGAGAAACAGAGGCAACTTAAGGTGGGCGCGGACGAGGCGTCGGCGGGCC
TCACAATGGGCGGCGATGCCCTACGAGTGCCCTTTTTAGATTTCGCGACC
GCGACCCCCAAGCGCCACCAGACCGTGGTCCCGGGCGTCGGGACGCTCCA
CGACTGCTGCGAGCACTCGCCGCTCTTCTCGGCCGTGGCGCGGCGGCTGC
TGTTTAATAGCCTGGTGCCGGCGCAACTAAAGGGGCGTGATTTCGGGGGC
GACCACACGGCCAAGCTGGAATTCCTGGCCCCCGAGTTGGTACGGGCGGT
GGCGCGACTGCGGTTTAAGGAGTGCGCGCCGGCGGACGTGGTGCCTCAGC
GTAACGCCTACTATAGCGTTCTGAACACGTTTCAGGCCCTCCACCGCTCC
GAAGCCTTTCGCCAGCTGGTGCACTTTGTGCGGGACTTTGCCCAGCTGCT
TAAAACCTCCTTCCGGGCCTCCAGCCTCACGGAGACCACGGGCCCCCCAA
AAAAACGGGCCAAGGTGGACGTGGCCACCCACGGCCGGACGTACGGCACG
CTGGAGCTGTTCCAAAAAATGATCCTTATGCACGCCACCTACTTTCTGGC
CGCCGTGCTCCTCGGGGACCACGCGGAGCAGGTCAACACGTTCCTGCGTC
TCGTGTTTGAGATCCCCCTGTTTAGCGACGCGGCCGTGCGCCACTTCCGC
CAGCGCGCCACCGTGTTTCTCGTCCCCCGGCGCCACGGCAAGACCTGGTT
TCTAGTGCCCCTCATCGCGCTGTCGCTGGCCTCCTTTCGGGGGATCAAGA
TCGGCTACACGGCGCACATCCGCAAGGCGACCGAGCCGGTGTTTGAGGAG
ATCGACGCCTGCCTGCGGGGCTGGTTCGGTTCGGCCCGAGTGGACCACGT
TAAAGGGGAAACCATCTCCTTCTCGTTTCCGGACGGGTCGCGCAGTACCA
TCGTGTTTGCCTCCAGCCACAACACAAACGGAATCCGAGGCCAGGACTTT
AACCTGCTCTTTGTCGACGAGGCCAACTTTATTCGCCCGGATGCGGTCCA
GACGATTATGGGCTTTCTCAACCAGGCCAACTGCAAGATTATCTTCGTGT
CGTCCACCAACACCGGGAAGGCCAGTACGAGCTTTTTGTACAACCTCCGC
GGGGCCGCCGACGAGCTTCTCAACGTGGTGACCTATATATGCGATGATCA
CATGCCGCGGGTGGTGACGCACACAAACGCCACGGCCTGTTCTTGTTATA
TCCTCAACAAGCCCGTTTTCATCACGATGGACGGGGCGGTTCGCCGGACC
GCCGATTTGTTTCTGGCCGATTCCTTCATGCAGGAGATCATCGGGGGCCA
GGCCAGGGAGACCGGCGACGACCGGCCCGTTCTGACCAAGTCTGCGGGGG
AGCGGTTTCTGTTGTACCGCCCCTCGACCACCACCAACAGCGGCCTCATG
GCCCCCGATTTGTACGTGTACGTGGATCCCGCGTTCACGGCCAACACCCG
AGCCTCCGGGACCGGCGTCGCTGTCGTCGGGCGGTACCGCGACGATTATA
TCATCTTCGCCCTGGAGCACTTTTTTCTCCGCGCGCTCACGGGCTCGGCC
CCCGCCGACATCGCCCGCTGCGTCGTCCACAGTCTGACGCAGGTCCTGGC
CCTGCATCCCGGGGCGTTTCGCGGCGTCCGGGTGGCGGTCGAGGGAAATA
GCAGCCAGGACTCGGCCGTCGCCATCGCCACGCACGTGCACACAGAGATG
CACCGCCTACTGGCCTCGGAGGGGGCCGACGCGGGCTCGGGCCCCGAGCT
TCTCTTCTACCACTGCGAGCCTCCCGGGAGCGCGGTGCTGTACCCCTTTT
TCCTGCTCAACAAACAGAAGACGCCCGCCTTTGAACACTTTATTAAAAAG
TTTAACTCCGGGGGCGTCATGGCCTCCCAGGAGATCGTTTCCGCGACGGT
GCGCCTGCAGACCGACCCGGTCGAGTATCTGCTCGAGCAGCTGAATAACC
TCACCGAAACCGTCTCCCCCAACACGGACGTCCGTACGTATTCCGGAAAA
CGGAACGGCGCCTCGGATGACCTTATGGTCGCCGTCATTATGGCCATCTA
CCTTGCGGCCCAGGCCGGACCTCCGCACACATTCGCTCCCATCACACGCG
TTTCGTGA
SEQ ID NO. 40: rRp450 바이러스 스트레인의 DNA 포장 터미나제 sub1의 아미노산 서열.
MFGQQLASDVQQYLERLEKQRQLKVGADEASAGLTMGGDALRVPFLDFAT
ATPKRHQTVVPGVGTLHDCCEHSPLFSAVARRLLFNSLVPAQLKGRDFGG
DHTAKLEFLAPELVRAVARLRFKECAPADVVPQRNAYYSVLNTFQALHRS
EAFRQLVHFVRDFAQLLKTSFRASSLTETTGPPKKRAKVDVATHGRTYGT
LELFQKMILMHATYFLAAVLLGDHAEQVNTFLRLVFEIPLFSDAAVRHFR
QRATVFLVPRRHGKTWFLVPLIALSLASFRGIKIGYTAHIRKATEPVFEE
IDACLRGWFGSARVDHVKGETISFSFPDGSRSTIVFASSHNTNGIRGQDF
NLLFVDEANFIRPDAVQTIMGFLNQANCKIIFVSSTNTGKASTSFLYNLR
GAADELLNVVTYICDDHMPRVVTHTNATACSCYILNKPVFITMDGAVRRT
ADLFLADSFMQEIIGGQARETGDDRPVLTKSAGERFLLYRPSTTTNSGLM
APDLYVYVDPAFTANTRASGTGVAVVGRYRDDYIIFALEHFFLRALTGSA
PADIARCVVHSLTQVLALHPGAFRGVRVAVEGNSSQDSAVAIATHVHTEM
HRLLASEGADAGSGPELLFYHCEPPGSAVLYPFFLLNKQKTPAFEHFIKK
FNSGGVMASQEIVSATVRLQTDPVEYLLEQLNNLTETVSPNTDVRTYSGK
RNGASDDLMVAVIMAIYLAAQAGPPHTFAPITRVS
SEQ ID NO. 41: 야생형 17 스트레인의 DNA 포장 터미나제 sub1의 DNA 서열.
ATGTTTGGTCAGCAGCTGGCGTCCGACGTCCAGCAGTACCTGGAGCGCCT
CGAGAAACAGAGGCAACTTAAGGTGGGCGCGGACGAGGCGTCGGCGGGCC
TCACCATGGGCGGCGATGCCCTACGAGTGCCCTTTTTAGATTTCGCGACC
GCGACCCCCAAGCGCCACCAGACCGTGGTCCCTGGCGTCGGGACGCTCCA
CGACTGCTGCGAGCACTCGCCGCTCTTCTCGGCCGTGGCGCGGCGGCTGC
TGTTTAATAGCCTGGTGCCGGCGCAACTAAAGGGGCGTGATTTCGGGGGC
GACCACACGGCCAAGCTGGAATTCCTGGCCCCCGAGTTGGTACGGGCGGT
GGCGCGACTGCGGTTTAAGGAGTGCGCGCCGGCGGACGTGGTGCCTCAGC
GTAACGCCTACTATAGCGTTCTGAATACGTTTCAGGCCCTCCACCGCTCC
GAAGCCTTTCGCCAGCTGGTGCACTTTGTGCGGGACTTTGCCCAGCTGCT
CAAAACCTCCTTCCGGGCCTCCAGCCTCACGGAGACCACGGGCCCCCCCA
AAAAACGGGCCAAGGTGGACGTGGCCACCCACGGCCGGACGTACGGCACG
CTGGAGCTGTTCCAAAAAATGATCCTTATGCACGCCACCTACTTTCTGGC
CGCCGTGCTCCTCGGGGACCACGCGGAGCAGGTCAACACGTTCCTGCGTC
TCGTGTTTGAGATCCCCCTGTTTAGCGACGCGGCCGTGCGCCACTTCCGC
CAGCGCGCCACCGTGTTTCTCGTCCCCCGGCGCCACGGCAAGACCTGGTT
TCTGGTGCCCCTCATCGCGCTGTCGCTGGCCTCCTTTCGGGGGATCAAGA
TCGGCTACACGGCGCACATCCGCAAGGCGACCGAGCCGGTGTTTGAGGAG
ATCGACGCCTGCCTGCGGGGCTGGTTCGGTTCGGCCCGAGTGGACCACGT
TAAAGGGGAAACCATCTCCTTCTCGTTTCCGGACGGGTCGCGCAGTACCA
TCGTGTTTGCCTCCAGCCACAACACAAACGGAATCCGAGGCCAGGACTTT
AACCTGCTCTTTGTCGACGAGGCCAACTTTATTCGCCCGGATGCGGTCCA
GACGATTATGGGCTTTCTCAACCAGGCCAACTGCAAGATTATCTTCGTGT
CGTCCACCAACACCGGGAAGGCCAGTACGAGCTTTTTGTACAACCTCCGC
GGGGCCGCAGACGAGCTTCTCAACGTGGTGACCTATATATGCGATGATCA
CATGCCGAGGGTGGTGACGCACACAAACGCCACGGCCTGTTCTTGTTATA
TCCTCAACAAGCCCGTTTTCATCACGATGGACGGGGCGGTTCGCCGGACC
GCCGATTTGTTTCTGGCCGATTCCTTCATGCAGGAGATCATCGGGGGCCA
GGCCAGGGAGACCGGCGACGACCGGCCCGTTCTGACCAAGTCTGCGGGGG
AGCGGTTTCTGTTGTACCGCCCCTCGACCACCACCAACAGCGGCCTCATG
GCCCCCGATTTGTACGTGTACGTGGATCCCGCGTTCACGGCCAACACCCG
AGCCTCCGGGACCGGCGTCGCTGTCGTCGGGCGGTACCGCGACGATTATA
TCATCTTCGCCCTGGAGCACTTTTTTCTCCGCGCGCTCACGGGCTCGGCC
CCCGCCGACATCGCCCGCTGCGTCGTCCACAGTCTGACGCAGGTCCTGGC
CCTGCATCCCGGGGCGTTTCGCGGCGTCCGGGTGGCGGTCGAGGGAAATA
GCAGCCAGGACTCGGCCGTCGCCATCGCCACGCACGTGCACACAGAGATG
CACCGCCTACTGGCCTCGGAGGGGGCCGACGCGGGCTCGGGCCCCGAGCT
TCTCTTCTACCACTGCGAGCCTCCCGGGAGCGCGGTGCTGTACCCCTTTT
TCCTGCTCAACAAACAGAAGACGCCCGCCTTTGAACACTTTATTAAAAAG
TTTAACTCCGGGGGCGTCATGGCCTCCCAGGAGATCGTTTCCGCGACGGT
GCGCCTGCAGACCGACCCGGTCGAGTATCTGCTCGAGCAGCTAAATAACC
TCACCGAAACCGTCTCCCCCAACACTGACGTCCGTACGTATTCCGGAAAA
CGGAACGGCGCCTCGGATGACCTTATGGTCGCCGTCATTATGGCCATCTA
CCTCGCGGCCCAGGCCGGACCTCCGCACACATTCGCTCCTATCATACGCG
TCTCGTGA
SEQ ID NO. 42: 야생형 17 스트레인의 DNA 포장 터미나제 sub1의 아미노산 서열.
MFGQQLASDVQQYLERLEKQRQLKVGADEASAGLTMGGDALRVPFLDFAT
ATPKRHQTVVPGVGTLHDCCEHSPLFSAVARRLLFNSLVPAQLKGRDFGG
DHTAKLEFLAPELVRAVARLRFKECAPADVVPQRNAYYSVLNTFQALHRS
EAFRQLVHFVRDFAQLLKTSFRASSLTETTGPPKKRAKVDVATHGRTYGT
LELFQKMILMHATYFLAAVLLGDHAEQVNTFLRLVFEIPLFSDAAVRHFR
QRATVFLVPRRHGKTWFLVPLIALSLASFRGIKIGYTAHIRKATEPVFEE
IDACLRGWFGSARVDHVKGETISFSFPDGSRSTIVFASSHNTNGIRGQDF
NLLFVDEANFIRPDAVQTIMGFLNQANCKIIFVSSTNTGKASTSFLYNLR
GAADELLNVVTYICDDHMPRVVTHTNATACSCYILNKPVFITMDGAVRRT
ADLFLADSFMQEIIGGQARETGDDRPVLTKSAGERFLLYRPSTTTNSGLM
APDLYVYVDPAFTANTRASGTGVAVVGRYRDDYIIFALEHFFLRALTGSA
PADIARCVVHSLTQVLALHPGAFRGVRVAVEGNSSQDSAVAIATHVHTEM
HRLLASEGADAGSGPELLFYHCEPPGSAVLYPFFLLNKQKTPAFEHFIKK
FNSGGVMASQEIVSATVRLQTDPVEYLLEQLNNLTETVSPNTDVRTYSGK
RNGASDDLMVAVIMAIYLAAQAGPPHTFAPIIRVS
SEQ ID NO. 43: Mut 3 및 Mut-3△34.5 바이러스 스트레인의 ICP6의 DNA 서열. 서열은 야생형 17 스트레인의 서열과 동일하다.
ATGGCCAGCCGCCCAGCCGCATCCTCTCCCGTCGAAGCGCGGGCCCCGGT
TGGGGGACAGGAGGCCGGCGGCCCCAGCGCAGCCACCCAGGGGGAGGCCG
CCGGGGCCCCTCTCGCCCACGGCCACCACGTGTACTGCCAGCGAGTCAAT
GGCGTGATGGTGCTTTCCGACAAGACGCCCGGGTCCGCGTCCTACCGCAT
CAGCGATAGCAACTTTGTCCAATGTGGTTCCAACTGCACCATGATCATCG
ACGGAGACGTGGTGCGCGGGCGCCCCCAGGACCCGGGGGCCGCGGCATCC
CCCGCTCCCTTCGTTGCGGTGACAAACATCGGAGCCGGCAGCGACGGCGG
GACCGCCGTCGTGGCATTCGGGGGAACCCCACGTCGCTCGGCGGGGACGT
CTACCGGTACCCAGACGGCCGACGTCCCCACCGAGGCCCTTGGGGGCCCC
CCTCCTCCTCCCCGCTTCACCCTGGGTGGCGGCTGTTGTTCCTGTCGCGA
CACACGGCGCCGCTCTGCGGTATTCGGGGGGGAGGGGGATCCAGTCGGCC
CCGCGGAGTTCGTCTCGGACGACCGGTCGTCCGATTCCGACTCGGATGAC
TCGGAGGACACGGACTCGGAGACGCTGTCACACGCCTCCTCGGACGTGTC
CGGCGGGGCCACGTACGACGACGCCCTTGACTCCGATTCGTCATCGGATG
ACTCCCTGCAGATAGATGGCCCCGTGTGTCGCCCGTGGAGCAATGACACC
GCGCCCCTGGATGTTTGCCCCGGGACCCCCGGCCCGGGCGCCGACGCCGG
TGGTCCCTCAGCGGTAGACCCACACGCGCCGACGCCAGAGGCCGGCGCTG
GTCTTGCGGCCGATCCCGCCGTGGCCCGGGACGACGCGGAGGGGCTTTCG
GACCCCCGGCCACGTCTGGGAACGGGCACGGCCTACCCCGTCCCCCTGGA
ACTCACGCCCGAGAACGCGGAGGCCGTGGCGCGCTTTCTGGGAGATGCCG
TGAACCGCGAACCCGCGCTCATGCTGGAGTACTTTTGCCGGTGCGCCCGC
GAGGAAACCAAGCGTGTCCCCCCCAGGACATTCGGCAGCCCCCCTCGCCT
CACGGAGGACGACTTTGGGCTTCTCAACTACGCGCTCGTGGAGATGCAGC
GCCTGTGTCTGGACGTTCCTCCGGTCCCGCCGAACGCATACATGCCCTAT
TATCTCAGGGAGTATGTGACGCGGCTGGTCAACGGGTTCAAGCCGCTGGT
GAGCCGGTCCGCTCGCCTTTACCGCATCCTGGGGGTTCTGGTGCACCTGC
GGATCCGGACCCGGGAGGCCTCCTTTGAGGAGTGGCTGCGATCCAAGGAA
GTGGCCCTGGATTTTGGCCTGACGGAAAGGCTTCGCGAGCACGAAGCCCA
GCTGGTGATCCTGGCCCAGGCTCTGGACCATTACGACTGTCTGATCCACA
GCACACCGCACACGCTGGTCGAGCGGGGGCTGCAATCGGCCCTGAAGTAT
GAGGAGTTTTACCTAAAGCGTTTTGGCGGGCACTACATGGAGTCCGTCTT
CCAGATGTACACCCGCATCGCCGGCTTTTTGGCCTGCCGGGCCACGCGCG
GCATGCGCCACATCGCCCTGGGGCGAGAGGGGTCGTGGTGGGAAATGTTC
AAGTTCTTTTTCCACCGCCTCTACGACCACCAGATCGTACCGTCGACCCC
CGCCATGCTGAACCTGGGGACCCGCAACTACTACACCTCCAGCTGCTACC
TGGTAAACCCCCAGGCCACCACAAACAAGGCGACCCTGCGGGCCATCACC
AGCAACGTCAGTGCCATCCTCGCCCGCAACGGGGGCATCGGGCTATGCGT
GCAGGCGTTTAACGACTCCGGCCCCGGGACCGCCAGCGTCATGCCCGCCC
TCAAGGTCCTTGACTCGCTGGTGGCGGCGCACAACAAAGAGAGCGCGCGT
CCGACCGGCGCGTGCGTGTACCTGGAGCCGTGGCACACCGACGTGCGGGC
CGTGCTCCGGATGAAGGGGGTCCTCGCCGGCGAAGAGGCCCAGCGCTGCG
ACAATATCTTCAGCGCCCTCTGGATGCCAGACCTGTTTTTCAAGCGCCTG
ATTCGCCACCTGGACGGCGAGAAGAACGTCACATGGACCCTGTTCGACCG
GGACACCAGCATGTCGCTCGCCGACTTTCACGGGGAGGAGTTCGAGAAGC
TCTACCAGCACCTCGAGGTCATGGGGTTCGGCGAGCAGATACCCATCCAG
GAGCTGGCCTATGGCATTGTGCGCAGTGCGGCCACGACCGGGAGCCCCTT
CGTCATGTTCAAAGACGCGGTGAACCGCCACTACATCTACGACACCCAGG
GGGCGGCCATCGCCGGCTCCAACCTCTGCACCGAGATCGTCCATCCGGCC
TCCAAGCGATCCAGTGGGGTCTGCAACCTGGGAAGCGTGAATCTGGCCCG
ATGCGTCTCCAGGCAGACGTTTGACTTTGGGCGGCTCCGCGACGCCGTGC
AGGCGTGCGTGCTGATGGTGAACATCATGATCGACAGCACGCTACAACCC
ACGCCCCAGTGCACCCGCGGCAACGACAACCTGCGGTCCATGGGAATCGG
CATGCAGGGCCTGCACACGGCCTGCCTGAAGCTGGGGCTGGATCTGGAGT
CTGTCGAATTTCAGGACCTGAACAAACACATCGCCGAGGTGATGCTGCTG
TCGGCGATGAAGACCAGCAACGCGCTGTGCGTTCGCGGGGCCCGTCCCTT
CAACCACTTTAAGCGCAGCATGTATCGCGCCGGCCGCTTTCACTGGGAGC
GCTTTCCGGACGCCCGGCCGCGGTACGAGGGCGAGTGGGAGATGCTACGC
CAGAGCATGATGAAACACGGCCTGCGCAACAGCCAGTTTGTCGCGCTGAT
GCCCACCGCCGCCTCGGCGCAGATCTCGGACGTCAGCGAGGGCTTTGCCC
CCCTGTTCACCAACCTGTTCAGCAAGGTGACCCGGGACGGCGAGACGCTG
CGCCCCAACACGCTCCTGCTAAAGGAACTGGAACGCACGTTTAGCGGGAA
GCGCCTCCTGGAGGTGATGGACAGTCTCGACGCCAAGCAGTGGTCCGTGG
CGCAGGCGCTCCCGTGCCTGGAGCCCACCCACCCCCTCCGGCGATTCAAG
ACCGCGTTTGACTACGACCAGAAGTTGCTGATCGACCTGTGTGCGGACCG
CGCCCCCTACGTCGACCATAGCCAATCCATGACCCTGTATGTCACGGAGA
AGGCGGACGGGACCCTCCCAGCCTCCACCCTGGTCCGCCTTCTGGTCCAC
GCATATAAGCGCGGACTAAAAACAGGGATGTACTACTGCAAGGTTCGCAA
GGCGACCAACAGCGGGGTCTTTGGCGGCGACGACAACATTGTCTGCACGA
GCTGCGCGCTGTGA
SEQ ID NO. 44: Mut 3 및 Mut-3△34.5 바이러스 스트레인의 ICP6의 아미노산 서열.
MASRPAASSPVEARAPVGGQEAGGPSAATQGEAAGAPLAHGHHVYCQRVN
GVMVLSDKTPGSASYRISDSNFVQCGSNCTMIIDGDVVRGRPQDPGAAAS
PAPFVAVTNIGAGSDGGTAVVAFGGTPRRSAGTSTGTQTADVPTEALGGP
PPPPRFTLGGGCCSCRDTRRRSAVFGGEGDPVGPAEFVSDDRSSDSDSDD
SEDTDSETLSHASSDVSGGATYDDALDSDSSSDDSLQIDGPVCRPWSNDT
APLDVCPGTPGPGADAGGPSAVDPHAPTPEAGAGLAADPAVARDDAEGLS
DPRPRLGTGTAYPVPLELTPENAEAVARFLGDAVNREPALMLEYFCRCAR
EETKRVPPRTFGSPPRLTEDDFGLLNYALVEMQRLCLDVPPVPPNAYMPY
YLREYVTRLVNGFKPLVSRSARLYRILGVLVHLRIRTREASFEEWLRSKE
VALDFGLTERLREHEAQLVILAQALDHYDCLIHSTPHTLVERGLQSALKY
EEFYLKRFGGHYMESVFQMYTRIAGFLACRATRGMRHIALGREGSWWEMF
KFFFHRLYDHQIVPSTPAMLNLGTRNYYTSSCYLVNPQATTNKATLRAIT
SNVSAILARNGGIGLCVQAFNDSGPGTASVMPALKVLDSLVAAHNKESAR
PTGACVYLEPWHTDVRAVLRMKGVLAGEEAQRCDNIFSALWMPDLFFKRL
IRHLDGEKNVTWTLFDRDTSMSLADFHGEEFEKLYQHLEVMGFGEQIPIQ
ELAYGIVRSAATTGSPFVMFKDAVNRHYIYDTQGAAIAGSNLCTEIVHPA
SKRSSGVCNLGSVNLARCVSRQTFDFGRLRDAVQACVLMVNIMIDSTLQP
TPQCTRGNDNLRSMGIGMQGLHTACLKLGLDLESVEFQDLNKHIAEVMLL
SAMKTSNALCVRGARPFNHFKRSMYRAGRFHWERFPDARPRYEGEWEMLR
QSMMKHGLRNSQFVALMPTAASAQISDVSEGFAPLFTNLFSKVTRDGETL
RPNTLLLKELERTFSGKRLLEVMDSLDAKQWSVAQALPCLEPTHPLRRFK
TAFDYDQKLLIDLCADRAPYVDHSQSMTLYVTEKADGTLPASTLVRLLVH
AYKRGLKTGMYYCKVRKATNSGVFGGDDNIVCTSCAL
SEQ ID NO. 45: 17TermA 스트레인의 ICP6의 DNA 서열.
ATGGCCAGCCGCCCAGCCGCATCCTCTCCCGTCGAAGCGCGGGCCCCGGT
TGGGGGACAGGAGGCCGGCGGCCCCAGCGCAGCCACCCAGGGGGAGGCCG
CCGGGGCCCCTCTCGCCCACGGCCACCACGTGTACTGCCAGCGAGTCAAT
GGCGTGATGGTGCTTTCCGACAAGACGCCCGGGTCCGCGTCCTACCGCAT
CAGCGATAGCAACTTTGTCCAATGTGGTTCCAACTGCACCATGATCATCG
ACGGAGACGTGGTGCGCGGGCGCCCCCAGGACCCGGGGGCCGCGGCATCC
CCCGCTCCCTTCGTTGCGGTGACAAACATCGGAGCCGGCAGCGACGGCGG
GACCGCCGTCGTGGCATTCGGGGGAACCCCACGTCGCTCGGCGGGGACGT
CTACCGGTACCCAGACGGCCGACGTCCCCACCGAGGCCCTTGGGGGCCCC
CCTCCTCCTCCCCGCTTCACCCTGGGTGGCGGCTGTTGTTCCTGTCGCGA
CACACGGCGCCGCTCTGCGGTATTCGGGGGGGAGGGGGATCCAGTCGGCC
CCGCGGAGTTCGTCTCGGACGACCGGTCGTCCGATTCCGACTCGGATGAC
TCGGAGGACACGGACTCGGAGACGCTGTCACACGCCTCCTCGGACGTGTC
CGGCGGGGCCACGTACGACGACGCCCTTGACTCCGATTCGTCATCGGATG
ACTCCCTGCAGATAGATGGCCCCGTGTGTCGCCCGTGGAGCAATGACACC
GCGCCCCTGGATGTTTGCCCCGGGACCCCCGGCCCGGGCGCCGACGCCGG
TGGTCCCTCAGCGGTAGACCCACACGCGCCGACGCCAGAGGCCGGCGCTG
GTCTTGCGGCCGATCCCGCCGTGGCCCGGGACGACGCGGAGGGGCTTTCG
GACCCCCGGCCACGTCTGGGAACGGGCACGGCCTACCCCGTCCCCCTGGA
ACTCACGCCCGAGAACGCGGAGGCCGTGGCGCGCTTTCTGGGAGATGCCG
TGAACCGCGAACCCGCGCTCATGCTGGAGTACTTTTGCCGGTGCGCCCGC
GAGGAAACCAAGCGTGTCCCCCCCAGGACATTCGGCAGCCCCCCTCGCCT
CACGGAGGACGACTTTGGGCTTCTCAACTACGCGCTCGTGGAGATGCAGC
GCCTGTGTCTGGACGTTCCTCCGGTCCCGCCGAACGCATACATGCCCTAT
TATCTCAGGGAGTATGTGACGCGGCTGGTCAACGGGTTCAAGCCGCTGGT
GAGCCGGTCCGCTCGCCTTTACCGCATCCTGGGGGTTCTGGTGCACCTGC
GGATCCGGACCCGGGAGGCCTCCTTTGAGGAGTGGCTGCGATCCAAGGAA
GTGGCCCTGGATTTTGGCCTGACGGAAAGGCTTCGCGAGCACGAAGCCCA
GCTGGTGATCCTGGCCCAGGCTCTGGACCATTACGACTGTCTGATCCACA
GCACACCGCACACGCTGGTCGAGCGGGGGCTGCAATCGGCCCTGAAGTAT
GAGGAGTTTTACCTAAAGCGTTTTGGCGGGCACTACATGGAGTCCGTCTT
CCAGATGTACACCCGCATCGCCGGCTTTTTGGCCTGCCGGGCCACGCGCG
GCATGCGCCACATCGCCCTGGGGCGAGAGGGGTCGTGGTGGGAAATGTTC
AAGTTCTTTTTCCACCGCCTCTACGACCACCAGATCGTACCGTCGACCCC
CGCCATGCTGAACCTGGGGACCCGCAACTACTACACCTCCAGCTGCTACC
TGGTAAACCCCCAGGCCACCACAAACAAGGCGACCCTGCGGGCCATCACC
AGCAACGTCAGTGCCATCCTCGCCCGCAACGGGGGCATCGGGCTATGCGT
GCAGGCGTTTAACGACTCCGGCCCCGGGACCGCCAGCGTCATGCCCGCCC
TCAAGGTCCTTGACTCGCTGGTGGCGGCGCACAACAAAGAGAGCGCGCGT
CCGACCGGCGCGTGCGTGTACCTGGAGCCGTGGCACACCGACGTGCGGGC
CGTGCTCCGGATGAAGGGGGTCCTCGCCGGCGAAGAGGCCCAGCGCTGCG
ACAATATCTTCAGCGCCCTCTGGATGCCAGACCTGTTTTTCAAGCGCCTG
ATTCGCCACCTGGACGGCGAGAAGAACGTCACATGGACCCTGTTCGACCG
GGACACCAGCATGTCGCTCGCCGACTTTCACGGGGAGGAGTTCGAGAAGC
TCTACCAGCACCTCGAGGTCATGGGGTTCGGCGAGCAGATACCCATCCAG
GAGCTGGCCTATGGCATTGTGCGCAGTGCGGCCACGACCGGGAGCCCCTT
CGTCATGTTCAAAGACGCGGTGAACCGCCACTACATCTACGACACCCAGG
GGGCGGCCATCGCCGGCTCCAACCTCTGCACCGAGATCGTCCATCCGGCC
TCCAAGCGATCCAGTGGGGTCTGCAACCTGGGAAGCGTGAATCTGGCCCG
ATGCGTCTCCAGGCAGACGTTTGACTTTGGGCGGCTCCGCGACGCCGTGC
AGGCGTGCGTGCTGATGGTGAACATCATGATCGACAGCACGCTACAACCC
ACGCCCCAGTGCACCCGCGGCAACGACAACCTGCGGTCCATGGGAATCGG
CATGCAGGGCCTGCACACGGCCTGCCTGAAGCTGGGGCTGGATCTGGAGT
CTGCCGAATTTCAGGACCTGAACAAACACATCGCCGAGGTGATGCTGCTG
TCGGCGATGAAGACCAGCAACGCGCTGTGCGTTCGCGGGGCCCGTCCCTT
CAACCACTTTAAGCGCAGCATGTATCGCGCCGGCCGCTTTCACTGGGAGC
GCTTTCCGGACGCCCGGCCGCGGTACGAGGGCGAGTGGGAGATGCTACGC
CAGAGCATGATGAAACACGGCCTGCGCAACAGCCAGTTTGTCGCGCTGAT
GCCCACCGCCGCCTCGGCGCAGATCTCGGACGTCAGCGAGGGCTTTGCCC
CCCTGTTCACCAACCTGTTCAGCAAGGTGACCCGGGACGGCGAGACGCTG
CGCCCCAACACGCTCCTGCTAAAGGAACTGGAACGCACGTTTAGCGGGAA
GCGCCTCCTGGAGGTGATGGACAGTCTCGACGCCAAGCAGTGGTCCGTGG
CGCAGGCGCTCCCGTGCCTGGAGCCCACCCACCCCCTCCGGCGATTCAAG
ACCGCGTTTGACTACGACCAGAAGTTGCTGATCGACCTGTGTGCGGACCG
CGCCCCCTACGTCGACCATAGCCAATCCATGACCCTGTATGTCACGGAGA
AGGCGGACGGGACCCTCCCAGCCTCCACCCTGGTCCGCCTTCTGGTCCAC
GCATATAAGCGCGGACTAAAAACAGGGATGTACTACTGCAAGGTTCGCAA
GGCGACCAACAGCGGGGTCTTTGGCGGCGACGACAACATTGTCTGCATGA
GCTGCGCGCTGTGA
SEQ ID NO. 46: 17TermA 스트레인의 ICP6의 아미노산 서열.
MASRPAASSPVEARAPVGGQEAGGPSAATQGEAAGAPLAHGHHVYCQRVN
GVMVLSDKTPGSASYRISDSNFVQCGSNCTMIIDGDVVRGRPQDPGAAAS
PAPFVAVTNIGAGSDGGTAVVAFGGTPRRSAGTSTGTQTADVPTEALGGP
PPPPRFTLGGGCCSCRDTRRRSAVFGGEGDPVGPAEFVSDDRSSDSDSDD
SEDTDSETLSHASSDVSGGATYDDALDSDSSSDDSLQIDGPVCRPWSNDT
APLDVCPGTPGPGADAGGPSAVDPHAPTPEAGAGLAADPAVARDDAEGLS
DPRPRLGTGTAYPVPLELTPENAEAVARFLGDAVNREPALMLEYFCRCAR
EETKRVPPRTFGSPPRLTEDDFGLLNYALVEMQRLCLDVPPVPPNAYMPY
YLREYVTRLVNGFKPLVSRSARLYRILGVLVHLRIRTREASFEEWLRSKE
VALDFGLTERLREHEAQLVILAQALDHYDCLIHSTPHTLVERGLQSALKY
EEFYLKRFGGHYMESVFQMYTRIAGFLACRATRGMRHIALGREGSWWEMF
KFFFHRLYDHQIVPSTPAMLNLGTRNYYTSSCYLVNPQATTNKATLRAIT
SNVSAILARNGGIGLCVQAFNDSGPGTASVMPALKVLDSLVAAHNKESAR
PTGACVYLEPWHTDVRAVLRMKGVLAGEEAQRCDNIFSALWMPDLFFKRL
IRHLDGEKNVTWTLFDRDTSMSLADFHGEEFEKLYQHLEVMGFGEQIPIQ
ELAYGIVRSAATTGSPFVMFKDAVNRHYIYDTQGAAIAGSNLCTEIVHPA
SKRSSGVCNLGSVNLARCVSRQTFDFGRLRDAVQACVLMVNIMIDSTLQP
TPQCTRGNDNLRSMGIGMQGLHTACLKLGLDLESAEFQDLNKHIAEVMLL
SAMKTSNALCVRGARPFNHFKRSMYRAGRFHWERFPDARPRYEGEWEMLR
QSMMKHGLRNSQFVALMPTAASAQISDVSEGFAPLFTNLFSKVTRDGETL
RPNTLLLKELERTFSGKRLLEVMDSLDAKQWSVAQALPCLEPTHPLRRFK
TAFDYDQKLLIDLCADRAPYVDHSQSMTLYVTEKADGTLPASTLVRLLVH
AYKRGLKTGMYYCKVRKATNSGVFGGDDNIVCMSCAL
SEQ ID NO. 47: rRp450 스트레인의 래트 시토크롬 P450 2B1의 DNA 서열.
GAACCCCTTCGCCATGGAGCCCAGTATCTTGCTCCTCCTTGCTCTCCTTG
TGGGCTTCTTGTTACTCTTAGTCAGGGGACACCCAAAGTCCCGTGGCAAC
TTCCCACCAGGACCTCGTCCCCTTCCCCTCTTGGGGAACCTCCTGCAGTT
GGACAGAGGGGGCCTCCTCAATTCCTTCATGCAGCTTCGAGAAAAATATG
GAGATGTGTTCACAGTACACCTGGGACCAAGGCCTGTGGTCATGCTATGT
GGGACAGACACCATAAAGGAGGCTCTGGTGGGCCAAGCTGAGGATTTCTC
TGGTCGGGGAACAATCGCTGTGATTGAGCCAATCTTCAAGGAATATGGTG
TGATCTTTGCCAATGGGGAACGCTGGAAGGCCCTTCGGCGATTCTCTCTG
GCTACCATGAGAGACTTTGGGATGGGAAAGAGGAGTGTGGAAGAACGGAT
TCAGGAGGAAGCCCAATGTTTGGTGGAGGAACTGCGGAAATCCCAGGGAG
CCCCACTGGATCCCACCTTCCTCTTCCAGTGCATCACAGCCAACATCATC
TGCTCCATTGTGTTTGGAGAGCGCTTTGACTACACAGACCGCCAGTTCCT
GCGCCTGTTGGAGCTGTTCTACCGGACCTTTTCCCTCCTAAGTTCATTCT
CCAGCCAGGTGTTTGAGTTCTTCTCTGGGTTCCTGAAATACTTTCCTGGT
GCCCACAGACAAATCTCCAAAAACCTCCAGGAAATCCTCGATTACATTGG
CCATATTGTGGAGAAGCACAGGGCCACCTTAGACCCAAGCGCTCCACGAG
ACTTCATCGACACTTACCTTCTGCGCATGGAGAAGGAGAAGTCGAACCAC
CACACAGAGTTCCATCATGAGAACCTCATGATCTCCCTGCTCTCTCTCTT
CTTTGCTGGCACTGAGACCAGCAGCACCACACTCCGCTATGGTTTCCTGC
TGATGCTCAAGTACCCCCATGTCGCAGAGAAAGTCCAAAAGGAGATTGAT
CAGGTGATCGGCTCACACCGGCTACCAACCCTTGATGACCGCAGTAAAAT
GCCATACACTGATGCAGTTATCCATGAGATTCAGAGGTTTTCAGATCTTG
TCCCTATTGGAGTACCACACAGAGTCACCAAAGACACCATGTTCCGAGGG
TACCTGCTTCCCAAGAACACTGAAGTGTACCCCATCCTGAGTTCAGCTCT
CCATGACCCACAGTACTTTGACCACCCAGACAGCTTCAATCCTGAACACT
TCCTGGATGCCAATGGGGCACTGAAAAAGAGTGAAGCTTTCATGCCCTTC
TCCACAGGAAAGCGCATTTGTCTTGGCGAAGGCATTGCCCGAAATGAATT
GTTCCTCTTCTTCACCACCATCCTCCAGAACTTCTCTGTGTCAAGCCATT
TGGCTCCCAAGGACATTGACCTCACGCCCAAGGAGAGTGGCATTGGAAAA
ATACCTCCAACGTACCAGATCTGCTTCTCAGCTCGGTGATCCGGCTGAGG
CAGCCATGTGCCCCAGTTCTGTTGGGAATGGAACTTGTTTATTGCAGCTT
ATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCA
TTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATC
TTATCATGTCTGGATCCCCGGGCGAGCTCGAATTCCTCCTTTGAGGAGTG
GCTGCGATCCAAGGAAGTGGCCCTGGACTTTGGCCTGACGGAAAGGCTTC
GCGAGCACGAAGCCCAGCTGGTGATCCTGGCCCAGGCTCTGGACCATTAC
GACTGTCTGATCCACAGCACACCGCACACGCTGGTCGAGCGGGGGCTGCA
ATCGGCCCTGAAGTATGAGGAGTTTTACCTAAAGCGCTTTGGCGGGCACT
ACATGGAGTCCGTCTTCCAGATGTACACCCGCATCGCCGGCTTTTTGGCC
TGCCGGGCCACGCGCGGCATGCGCCACATCGCCCTGGGGCGAGAGGGGTC
GTGGTGGGAAATGTTCAAGTTCTTTTTCCACCGCCTCTACGACCACCAGA
TCGTACCGTCGACCCCCGCCATGCTGAACCTGGGGACCCGCAACTACTAC
ACCTCCAGCTGCTACCTGGTAAACCCCCAGGCCACCACAAACAAGGCGAC
CCTGCGGGCCATCACCAGCAACGTCAGCGCCATCCTCGCCCGCAACGGGG
GCATCGGGCTATGCGTGCAGGCGTTTAACGACTCCGGCCCCGGGACCGCT
AGCGTCATACCCGCCCTCAAGGTCCTCGACTCGCTGGTGGCGGCGCACAA
CAAAGAGAGCGCGCGTCCAACCGGCGCGTGCGTGTACCTGGAGCCGTGGC
ACACCGACGTGCGGGCCGTGCTCCGGATGAAGGGGGTCCTCGCCGGCGAA
GAGGCCCAGCGCTGCGACAATATCTTCAGCGCCCTCTGGATGCCAGACCT
GTTTTTCAAGCGCCTGATTCGCCACCTGGACGGCGAGAAGAACGTCACAT
GGACCCTGTTCGACCGGGACACCAGCATGTCGCTCGCCGACTTTCACGGG
GAGGAGTTCGAGAAGCTCTACCAGCACCTCGAGGTCATGGGGTTCGGCGA
GCAGATACCCATCCAGGAGCTGGCCTATGGCATTGTGCGCAGTGCGGCCA
CGACCGGGAGCCCCTTCGTCATGTTCAAAGACGCGGTGAACCGCCACTAC
ATCTACGACACCCAGGGGGCGGCCATCGCCGGCTCCAACCTCTGCACCGA
GATCGTCCATCCGGCCTCCAAGCGATCCAGTGGGGTCTGCAATCTGGGAA
GCGTGAATCTGGCCCGATGCGTCTCCAGGCAGACGTTTGACTTTGGGCGG
CTCCGCGACGCCGTGCAGGCGTGCGTGCTGATGGTGAACATCATGATCGA
CAGCACGCTACAACCCACGCCCCAGTGCACCCGCGGCAACGACAACCTGC
GGTCCATGGGAATCGGCATGCAGGGCCTGCACACGGCCTGCCTGAAGCTG
GGGCTGGATCTGGAGTCTGTCGAATTTCAGGACCTGAACAAACACATCGC
CGAGGTGATGCTGCTGTCGGCGATGAAGACCAGCAACGCGCTGTGCGTTC
GCGGGGCCCGTCCCTTCAACCACTTTAAGCGCAGCATGTATCGCGCCGGC
CGCTTTCACTGGGAGCGCTTTCCGGACGCCCGGCCGCGGTACGAGGGCGA
GTGGGAGATGCTACGCCAGAGCATGATGAAACACGGCCTGCGCAACAGCC
AGTTTGTCGCGCTGATGCCCACCGCCGCCTCGGCGCAGATCTCGGACGTC
AGCGAGGGCTTTGCCCCCCTGTTCACCAACCTGTTCAGCAAGGTGACCCG
GGACGGCGAGACGCTGCGCCCCAACACGCTCCTGCTAAAGGAACTGGAAC
GCACGTTTAGCGGGAAGCGCCTCCTGGAGGTGATGGACAGTCTCGACGCC
AAGCAGTGGTCCGTGGCGCAGGCGCTCCCGTGCCTGGAGCCCACCCACCC
CCTCCGGCGATTCAAGACCGCGTTTGACTACGACCAGAAGTTGCTGATCG
ACCTGTGTGCGGACCGCGCCCCCTACGTCGACCATAGCCAATCCATGACC
CTGTATGTCACGGAGAAGGCGGACGGGACCCTCCCAGCCTCCACCCTGGT
CCGCCTTCTGGTCCACGCATATAAGCGCGGACTAAAAACAGGGATGTACT
ACTGCAAGGTTCGCAAGGCGACCAACAGCGGGGTCTTTGGCGGCGACGAC
AACATTGTCTGCACGAGCTGCGCGCTGTGA
SEQ ID NO. 48: rRp450 스트레인의 래트 시토크롬 P450 2B1의 아미노산 서열.
MEPSILLLLALLVGFLLLLVRGHPKSRGNFPPGPRPLPLLGNLLQL
DRGGLLNSFMQLREKYGDVFTVHLGPRPVVMLCGTDTIKEALVGQAEDFS
GRGTIAVIEPIFKEYGVIFANGERWKALRRFSLATMRDFGMGKRSVEERI
QEEAQCLVEELRKSQGAPLDPTFLFQCITANIICSIVFGERFDYTDRQFL
RLLELFYRTFSLLSSFSSQVFEFFSGFLKYFPGAHRQISKNLQEILDYIG
HIVEKHRATLDPSAPRDFIDTYLLRMEKEKSNHHTEFHHENLMISLLSLF
FAGTETSSTTLRYGFLLMLKYPHVAEKVQKEIDQVIGSHRLPTLDDRSKM
PYTDAVIHEIQRFSDLVPIGVPHRVTKDTMFRGYLLPKNTEVYPILSSAL
HDPQYFDHPDSFNPEHFLDANGALKKSEAFMPFSTGKRICLGEGIARNEL
FLFFTTILQNFSVSSHLAPKDIDLTPKESGIGKIPPTYQICFSAR*
*중지 코돈 - * 뒤의 서열은 발현되지 않는 것으로 예측됨
SEQ ID NO. 49: 야생형 17 스트레인의 ICP6의 DNA 서열.
ATGGCCAGCCGCCCAGCCGCATCCTCTCCCGTCGAAGCGCGGGCCCCGGT
TGGGGGACAGGAGGCCGGCGGCCCCAGCGCAGCCACCCAGGGGGAGGCCG
CCGGGGCCCCTCTCGCCCACGGCCACCACGTGTACTGCCAGCGAGTCAAT
GGCGTGATGGTGCTTTCCGACAAGACGCCCGGGTCCGCGTCCTACCGCAT
CAGCGATAGCAACTTTGTCCAATGTGGTTCCAACTGCACCATGATCATCG
ACGGAGACGTGGTGCGCGGGCGCCCCCAGGACCCGGGGGCCGCGGCATCC
CCCGCTCCCTTCGTTGCGGTGACAAACATCGGAGCCGGCAGCGACGGCGG
GACCGCCGTCGTGGCATTCGGGGGAACCCCACGTCGCTCGGCGGGGACGT
CTACCGGTACCCAGACGGCCGACGTCCCCACCGAGGCCCTTGGGGGCCCC
CCTCCTCCTCCCCGCTTCACCCTGGGTGGCGGCTGTTGTTCCTGTCGCGA
CACACGGCGCCGCTCTGCGGTATTCGGGGGGGAGGGGGATCCAGTCGGCC
CCGCGGAGTTCGTCTCGGACGACCGGTCGTCCGATTCCGACTCGGATGAC
TCGGAGGACACGGACTCGGAGACGCTGTCACACGCCTCCTCGGACGTGTC
CGGCGGGGCCACGTACGACGACGCCCTTGACTCCGATTCGTCATCGGATG
ACTCCCTGCAGATAGATGGCCCCGTGTGTCGCCCGTGGAGCAATGACACC
GCGCCCCTGGATGTTTGCCCCGGGACCCCCGGCCCGGGCGCCGACGCCGG
TGGTCCCTCAGCGGTAGACCCACACGCGCCGACGCCAGAGGCCGGCGCTG
GTCTTGCGGCCGATCCCGCCGTGGCCCGGGACGACGCGGAGGGGCTTTCG
GACCCCCGGCCACGTCTGGGAACGGGCACGGCCTACCCCGTCCCCCTGGA
ACTCACGCCCGAGAACGCGGAGGCCGTGGCGCGCTTTCTGGGAGATGCCG
TGAACCGCGAACCCGCGCTCATGCTGGAGTACTTTTGCCGGTGCGCCCGC
GAGGAAACCAAGCGTGTCCCCCCCAGGACATTCGGCAGCCCCCCTCGCCT
CACGGAGGACGACTTTGGGCTTCTCAACTACGCGCTCGTGGAGATGCAGC
GCCTGTGTCTGGACGTTCCTCCGGTCCCGCCGAACGCATACATGCCCTAT
TATCTCAGGGAGTATGTGACGCGGCTGGTCAACGGGTTCAAGCCGCTGGT
GAGCCGGTCCGCTCGCCTTTACCGCATCCTGGGGGTTCTGGTGCACCTGC
GGATCCGGACCCGGGAGGCCTCCTTTGAGGAGTGGCTGCGATCCAAGGAA
GTGGCCCTGGATTTTGGCCTGACGGAAAGGCTTCGCGAGCACGAAGCCCA
GCTGGTGATCCTGGCCCAGGCTCTGGACCATTACGACTGTCTGATCCACA
GCACACCGCACACGCTGGTCGAGCGGGGGCTGCAATCGGCCCTGAAGTAT
GAGGAGTTTTACCTAAAGCGTTTTGGCGGGCACTACATGGAGTCCGTCTT
CCAGATGTACACCCGCATCGCCGGCTTTTTGGCCTGCCGGGCCACGCGCG
GCATGCGCCACATCGCCCTGGGGCGAGAGGGGTCGTGGTGGGAAATGTTC
AAGTTCTTTTTCCACCGCCTCTACGACCACCAGATCGTACCGTCGACCCC
CGCCATGCTGAACCTGGGGACCCGCAACTACTACACCTCCAGCTGCTACC
TGGTAAACCCCCAGGCCACCACAAACAAGGCGACCCTGCGGGCCATCACC
AGCAACGTCAGTGCCATCCTCGCCCGCAACGGGGGCATCGGGCTATGCGT
GCAGGCGTTTAACGACTCCGGCCCCGGGACCGCCAGCGTCATGCCCGCCC
TCAAGGTCCTTGACTCGCTGGTGGCGGCGCACAACAAAGAGAGCGCGCGT
CCGACCGGCGCGTGCGTGTACCTGGAGCCGTGGCACACCGACGTGCGGGC
CGTGCTCCGGATGAAGGGGGTCCTCGCCGGCGAAGAGGCCCAGCGCTGCG
ACAATATCTTCAGCGCCCTCTGGATGCCAGACCTGTTTTTCAAGCGCCTG
ATTCGCCACCTGGACGGCGAGAAGAACGTCACATGGACCCTGTTCGACCG
GGACACCAGCATGTCGCTCGCCGACTTTCACGGGGAGGAGTTCGAGAAGC
TCTACCAGCACCTCGAGGTCATGGGGTTCGGCGAGCAGATACCCATCCAG
GAGCTGGCCTATGGCATTGTGCGCAGTGCGGCCACGACCGGGAGCCCCTT
CGTCATGTTCAAAGACGCGGTGAACCGCCACTACATCTACGACACCCAGG
GGGCGGCCATCGCCGGCTCCAACCTCTGCACCGAGATCGTCCATCCGGCC
TCCAAGCGATCCAGTGGGGTCTGCAACCTGGGAAGCGTGAATCTGGCCCG
ATGCGTCTCCAGGCAGACGTTTGACTTTGGGCGGCTCCGCGACGCCGTGC
AGGCGTGCGTGCTGATGGTGAACATCATGATCGACAGCACGCTACAACCC
ACGCCCCAGTGCACCCGCGGCAACGACAACCTGCGGTCCATGGGAATCGG
CATGCAGGGCCTGCACACGGCCTGCCTGAAGCTGGGGCTGGATCTGGAGT
CTGTCGAATTTCAGGACCTGAACAAACACATCGCCGAGGTGATGCTGCTG
TCGGCGATGAAGACCAGCAACGCGCTGTGCGTTCGCGGGGCCCGTCCCTT
CAACCACTTTAAGCGCAGCATGTATCGCGCCGGCCGCTTTCACTGGGAGC
GCTTTCCGGACGCCCGGCCGCGGTACGAGGGCGAGTGGGAGATGCTACGC
CAGAGCATGATGAAACACGGCCTGCGCAACAGCCAGTTTGTCGCGCTGAT
GCCCACCGCCGCCTCGGCGCAGATCTCGGACGTCAGCGAGGGCTTTGCCC
CCCTGTTCACCAACCTGTTCAGCAAGGTGACCCGGGACGGCGAGACGCTG
CGCCCCAACACGCTCCTGCTAAAGGAACTGGAACGCACGTTTAGCGGGAA
GCGCCTCCTGGAGGTGATGGACAGTCTCGACGCCAAGCAGTGGTCCGTGG
CGCAGGCGCTCCCGTGCCTGGAGCCCACCCACCCCCTCCGGCGATTCAAG
ACCGCGTTTGACTACGACCAGAAGTTGCTGATCGACCTGTGTGCGGACCG
CGCCCCCTACGTCGACCATAGCCAATCCATGACCCTGTATGTCACGGAGA
AGGCGGACGGGACCCTCCCAGCCTCCACCCTGGTCCGCCTTCTGGTCCAC
GCATATAAGCGCGGACTAAAAACAGGGATGTACTACTGCAAGGTTCGCAA
GGCGACCAACAGCGGGGTCTTTGGCGGCGACGACAACATTGTCTGCACGA
GCTGCGCGCTGTGA
SEQ ID NO. 50: 야생형 17 스트레인의 ICP6의 아미노산 서열.
MASRPAASSPVEARAPVGGQEAGGPSAATQGEAAGAPLAHGHHVYCQRVN
GVMVLSDKTPGSASYRISDSNFVQCGSNCTMIIDGDVVRGRPQDPGAAAS
PAPFVAVTNIGAGSDGGTAVVAFGGTPRRSAGTSTGTQTADVPTEALGGP
PPPPRFTLGGGCCSCRDTRRRSAVFGGEGDPVGPAEFVSDDRSSDSDSDD
SEDTDSETLSHASSDVSGGATYDDALDSDSSSDDSLQIDGPVCRPWSNDT
APLDVCPGTPGPGADAGGPSAVDPHAPTPEAGAGLAADPAVARDDAEGLS
DPRPRLGTGTAYPVPLELTPENAEAVARFLGDAVNREPALMLEYFCRCAR
EETKRVPPRTFGSPPRLTEDDFGLLNYALVEMQRLCLDVPPVPPNAYMPY
YLREYVTRLVNGFKPLVSRSARLYRILGVLVHLRIRTREASFEEWLRSKE
VALDFGLTERLREHEAQLVILAQALDHYDCLIHSTPHTLVERGLQSALKY
EEFYLKRFGGHYMESVFQMYTRIAGFLACRATRGMRHIALGREGSWWEMF
KFFFHRLYDHQIVPSTPAMLNLGTRNYYTSSCYLVNPQATTNKATLRAIT
SNVSAILARNGGIGLCVQAFNDSGPGTASVMPALKVLDSLVAAHNKESAR
PTGACVYLEPWHTDVRAVLRMKGVLAGEEAQRCDNIFSALWMPDLFFKRL
IRHLDGEKNVTWTLFDRDTSMSLADFHGEEFEKLYQHLEVMGFGEQIPIQ
ELAYGIVRSAATTGSPFVMFKDAVNRHYIYDTQGAAIAGSNLCTEIVHPA
SKRSSGVCNLGSVNLARCVSRQTFDFGRLRDAVQACVLMVNIMIDSTLQP
TPQCTRGNDNLRSMGIGMQGLHTACLKLGLDLESVEFQDLNKHIAEVMLL
SAMKTSNALCVRGARPFNHFKRSMYRAGRFHWERFPDARPRYEGEWEMLR
QSMMKHGLRNSQFVALMPTAASAQISDVSEGFAPLFTNLFSKVTRDGETL
RPNTLLLKELERTFSGKRLLEVMDSLDAKQWSVAQALPCLEPTHPLRRFK
TAFDYDQKLLIDLCADRAPYVDHSQSMTLYVTEKADGTLPASTLVRLLVH
AYKRGLKTGMYYCKVRKATNSGVFGGDDNIVCTSCAL
SEQUENCE LISTING
<110> RESEARCH INSTITUTE AT NATIONWIDE CHILDREN'S HOSPITAL
<120> SYNCYTIAL ONCOLYTIC HERPES SIMPLEX MUTANTS AS POTENT CANCER
THERAPEUTICS
<130> 106887-7660
<150> 62/932,725
<151> 2019-11-08
<150> 62/818,577
<151> 2019-03-14
<160> 53
<170> PatentIn version 3.5
<210> 1
<211> 726
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic polynucleotide
<220>
<221> mutation
<222> (356)..(356)
<223> c356a
<400> 1
atggcccgcc gccgccgcca tcgcggcccc cgccgccccc ggccgcccgg gcccacgggc 60
gcggtcccaa ccgcacagtc ccaggtaacc tccacgccca actcggaacc cgtggtcagg 120
agcgcgcccg cggccgcccc gccgccgccc cccgccagtg ggcccccgcc ttcttgttcg 180
ctgctgctgc gccagtggct ccacgttccc gagtccgcgt ccgacgacga cgacgacgac 240
tggccggaca gccccccgcc cgagccggcg ccagaggccc ggcccaccgc cgccgccccc 300
cgcccccggt ccccaccgcc cggcgcgggc ccggggggcg gggctaaccc ctcccacccc 360
ccctcacgcc ccttccgcct tccgccgcgc ctcgccctcc gcctgcgcgt caccgcagag 420
cacctggcgc gcctgcgcct gcgacgcgcg ggcggggagg gggcgccgaa gccccccgcg 480
acccccgcga cccccgcgac ccccacgcgg gtgcgcttct cgccccacgt ccgggtgcgc 540
cacctggtgg tctgggcctc ggccgcccgc ctggcgcgcc gcggctcgtg ggcccgcgag 600
cgggccgacc gggctcggtt ccggcgccgg gtggcggagg ccgaggcggt catcgggccg 660
tgcctggggc ccgaggcccg tgcccgggcc ctggcccgcg gagccggccc ggcgaactcg 720
gtctaa 726
<210> 2
<211> 241
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic polypeptide
<220>
<221> MISC_FEATURE
<222> (119)..(119)
<223> P119H mutation
<400> 2
Met Ala Arg Arg Arg Arg His Arg Gly Pro Arg Arg Pro Arg Pro Pro
1 5 10 15
Gly Pro Thr Gly Ala Val Pro Thr Ala Gln Ser Gln Val Thr Ser Thr
20 25 30
Pro Asn Ser Glu Pro Val Val Arg Ser Ala Pro Ala Ala Ala Pro Pro
35 40 45
Pro Pro Pro Ala Ser Gly Pro Pro Pro Ser Cys Ser Leu Leu Leu Arg
50 55 60
Gln Trp Leu His Val Pro Glu Ser Ala Ser Asp Asp Asp Asp Asp Asp
65 70 75 80
Trp Pro Asp Ser Pro Pro Pro Glu Pro Ala Pro Glu Ala Arg Pro Thr
85 90 95
Ala Ala Ala Pro Arg Pro Arg Ser Pro Pro Pro Gly Ala Gly Pro Gly
100 105 110
Gly Gly Ala Asn Pro Ser His Pro Pro Ser Arg Pro Phe Arg Leu Pro
115 120 125
Pro Arg Leu Ala Leu Arg Leu Arg Val Thr Ala Glu His Leu Ala Arg
130 135 140
Leu Arg Leu Arg Arg Ala Gly Gly Glu Gly Ala Pro Lys Pro Pro Ala
145 150 155 160
Thr Pro Ala Thr Pro Ala Thr Pro Thr Arg Val Arg Phe Ser Pro His
165 170 175
Val Arg Val Arg His Leu Val Val Trp Ala Ser Ala Ala Arg Leu Ala
180 185 190
Arg Arg Gly Ser Trp Ala Arg Glu Arg Ala Asp Arg Ala Arg Phe Arg
195 200 205
Arg Arg Val Ala Glu Ala Glu Ala Val Ile Gly Pro Cys Leu Gly Pro
210 215 220
Glu Ala Arg Ala Arg Ala Leu Ala Arg Gly Ala Gly Pro Ala Asn Ser
225 230 235 240
Val
<210> 3
<211> 846
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic polynucleotide
<400> 3
atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60
ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120
ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180
ctcgtgacca ccctgaccta cggcgtgcag tgcttcagcc gctaccccga ccacatgaag 240
cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300
ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360
gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420
aagctggagt acaactacaa cagccacaac gtctatatca tggccgacaa gcagaagaac 480
ggcatcaagg tgaacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc 540
gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600
tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660
ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagaag 720
cttagccatg gcttcccgcc ggaggtggag gagcaggatg atggcacgct gcccatgtct 780
tgtgcccagg agagcgggat ggaccgtcac cctgcagcct gtgcttctgc taggatcaat 840
gtgtag 846
<210> 4
<211> 281
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic polypeptide
<400> 4
Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu
1 5 10 15
Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly
20 25 30
Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile
35 40 45
Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr
50 55 60
Leu Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys
65 70 75 80
Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu
85 90 95
Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu
100 105 110
Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly
115 120 125
Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr
130 135 140
Asn Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn
145 150 155 160
Gly Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser
165 170 175
Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly
180 185 190
Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu
195 200 205
Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe
210 215 220
Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys Lys
225 230 235 240
Leu Ser His Gly Phe Pro Pro Glu Val Glu Glu Gln Asp Asp Gly Thr
245 250 255
Leu Pro Met Ser Cys Ala Gln Glu Ser Gly Met Asp Arg His Pro Ala
260 265 270
Ala Cys Ala Ser Ala Arg Ile Asn Val
275 280
<210> 5
<211> 767
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic polynucleotide
<400> 5
atggcccgcc gccgccgcca tcgcggcccc cgccgccccc ggccgcccgg gcccacgggc 60
gccgtcccaa ccgcacagtc ccaggtaacc tagactagtc tagcgtaacc tccacgccca 120
actcggaacc cgcggtcagg agcgcgcccg cggccgcccc gccgccgccc cccgccggtg 180
ggcccccgcc ttcttgttcg ctgctgctgc gccagtggct ccacgttccc gagtccgcgt 240
ccgacaacga cgatgacgac gactggccgg acagcccccc gcccgagccg gcgccagagg 300
cccggcccac cgccgccgcc ccccggcccc ggcccccacc gcccggcgtg ggcccggggg 360
gcggggctga cccctcccac cccccctcgc gccccttccg ccttccgccg cgcctcgccc 420
tccgcctgcg cgtcaccgcg gagcacctgg cgcgcctgcg cctgcgacgc gcgggcgggg 480
agggggcgcc ggagcccccc gcgacccccg cgacccccgc gacccccgcg acccccgcga 540
cccccgcgcg ggtgcgcttc tcgccccacg tccgggtgcg ccacctggtg gtctgggcct 600
cggccgcccg cctggcgcgc cgcggctcgt gggcccgcga gcgggccgac cgggctcggt 660
tccggcgccg ggtggcggag gccgaggcgg tcatcgggcc gtgcctgggg cccgaggccc 720
gtgcccgggc cctggcccgc ggagccggcc cggcgaactc ggtctaa 767
<210> 6
<211> 30
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic polypeptide
<400> 6
Met Ala Arg Arg Arg Arg His Arg Gly Pro Arg Arg Pro Arg Pro Pro
1 5 10 15
Gly Pro Thr Gly Ala Val Pro Thr Ala Gln Ser Gln Val Thr
20 25 30
<210> 7
<211> 723
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic polynucleotide
<400> 7
atggcccgcc gccgccatcg cggcccccgc cgcccccggc cgcccgggcc cacgggcgcg 60
gtcccaaccg cacagtccca ggtaacctcc acgcccaact cggaacccgt ggtcaggagc 120
gcgcccgcgg ccgccccgcc gccgcccccc gccagtgggc ccccgccttc ttgttcgctg 180
ctgctgcgcc agtggctcca cgttcccgag tccgcgtccg acgacgacga cgacgactgg 240
ccggacagcc ccccgcccga gccggcgcca gaggcccggc ccaccgccgc cgccccccgc 300
ccccggtccc caccgcccgg cgcgggcccg gggggcgggg ctaacccctc cccccccccc 360
tcacgcccct tccgccttcc gccgcgcctc gccctccgcc tgcgcgtcac cgcagagcac 420
ctggcgcgcc tgcgcctgcg acgcgcgggc ggggaggggg cgccgaagcc ccccgcgacc 480
cccgcgaccc ccgcgacccc cacgcgggtg cgcttctcgc cccacgtccg ggtgcgccac 540
ctggtggtct gggcctcggc cgcccgcctg gcgcgccgcg gctcgtgggc ccgcgagcgg 600
gccgaccggg ctcggttccg gcgccgggtg gcggaggccg aggcggtcat cgggccgtgc 660
ctggggcccg aggcccgtgc ccgggccctg gcccgcggag ccggcccggc gaactcggtc 720
taa 723
<210> 8
<211> 240
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic polypeptide
<400> 8
Met Ala Arg Arg Arg His Arg Gly Pro Arg Arg Pro Arg Pro Pro Gly
1 5 10 15
Pro Thr Gly Ala Val Pro Thr Ala Gln Ser Gln Val Thr Ser Thr Pro
20 25 30
Asn Ser Glu Pro Val Val Arg Ser Ala Pro Ala Ala Ala Pro Pro Pro
35 40 45
Pro Pro Ala Ser Gly Pro Pro Pro Ser Cys Ser Leu Leu Leu Arg Gln
50 55 60
Trp Leu His Val Pro Glu Ser Ala Ser Asp Asp Asp Asp Asp Asp Trp
65 70 75 80
Pro Asp Ser Pro Pro Pro Glu Pro Ala Pro Glu Ala Arg Pro Thr Ala
85 90 95
Ala Ala Pro Arg Pro Arg Ser Pro Pro Pro Gly Ala Gly Pro Gly Gly
100 105 110
Gly Ala Asn Pro Ser Pro Pro Pro Ser Arg Pro Phe Arg Leu Pro Pro
115 120 125
Arg Leu Ala Leu Arg Leu Arg Val Thr Ala Glu His Leu Ala Arg Leu
130 135 140
Arg Leu Arg Arg Ala Gly Gly Glu Gly Ala Pro Lys Pro Pro Ala Thr
145 150 155 160
Pro Ala Thr Pro Ala Thr Pro Thr Arg Val Arg Phe Ser Pro His Val
165 170 175
Arg Val Arg His Leu Val Val Trp Ala Ser Ala Ala Arg Leu Ala Arg
180 185 190
Arg Gly Ser Trp Ala Arg Glu Arg Ala Asp Arg Ala Arg Phe Arg Arg
195 200 205
Arg Val Ala Glu Ala Glu Ala Val Ile Gly Pro Cys Leu Gly Pro Glu
210 215 220
Ala Arg Ala Arg Ala Leu Ala Arg Gly Ala Gly Pro Ala Asn Ser Val
225 230 235 240
<210> 9
<211> 726
<212> DNA
<213> Herpes simplex virus type 1
<400> 9
atggcccgcc gccgccgcca tcgcggcccc cgccgccccc ggccgcccgg gcccacgggc 60
gcggtcccaa ccgcacagtc ccaggtaacc tccacgccca actcggaacc cgtggtcagg 120
agcgcgcccg cggccgcccc gccgccgccc cccgccagtg ggcccccgcc ttcttgttcg 180
ctgctgctgc gccagtggct ccacgttccc gagtccgcgt ccgacgacga cgacgacgac 240
tggccggaca gccccccgcc cgagccggcg ccagaggccc ggcccaccgc cgccgccccc 300
cgcccccggt ccccaccgcc cggcgcgggc ccggggggcg gggctaaccc ctcccacccc 360
ccctcacgcc ccttccgcct tccgccgcgc ctcgccctcc gcctgcgcgt caccgcagag 420
cacctggcgc gcctgcgcct gcgacgcgcg ggcggggagg gggcgccgaa gccccccgcg 480
acccccgcga cccccgcgac ccccacgcgg gtgcgcttct cgccccacgt ccgggtgcgc 540
cacctggtgg tctgggcctc ggccgcccgc ctggcgcgcc gcggctcgtg ggcccgcgag 600
cgggccgacc gggctcggtt ccggcgccgg gtggcggagg ccgaggcggt catcgggccg 660
tgcctggggc ccgaggcccg tgcccgggcc ctggcccgcg gagccggccc ggcgaactcg 720
gtctaa 726
<210> 10
<211> 241
<212> PRT
<213> Herpes simplex virus type 1
<400> 10
Met Ala Arg Arg Arg Arg His Arg Gly Pro Arg Arg Pro Arg Pro Pro
1 5 10 15
Gly Pro Thr Gly Ala Val Pro Thr Ala Gln Ser Gln Val Thr Ser Thr
20 25 30
Pro Asn Ser Glu Pro Val Val Arg Ser Ala Pro Ala Ala Ala Pro Pro
35 40 45
Pro Pro Pro Ala Ser Gly Pro Pro Pro Ser Cys Ser Leu Leu Leu Arg
50 55 60
Gln Trp Leu His Val Pro Glu Ser Ala Ser Asp Asp Asp Asp Asp Asp
65 70 75 80
Trp Pro Asp Ser Pro Pro Pro Glu Pro Ala Pro Glu Ala Arg Pro Thr
85 90 95
Ala Ala Ala Pro Arg Pro Arg Ser Pro Pro Pro Gly Ala Gly Pro Gly
100 105 110
Gly Gly Ala Asn Pro Ser His Pro Pro Ser Arg Pro Phe Arg Leu Pro
115 120 125
Pro Arg Leu Ala Leu Arg Leu Arg Val Thr Ala Glu His Leu Ala Arg
130 135 140
Leu Arg Leu Arg Arg Ala Gly Gly Glu Gly Ala Pro Lys Pro Pro Ala
145 150 155 160
Thr Pro Ala Thr Pro Ala Thr Pro Thr Arg Val Arg Phe Ser Pro His
165 170 175
Val Arg Val Arg His Leu Val Val Trp Ala Ser Ala Ala Arg Leu Ala
180 185 190
Arg Arg Gly Ser Trp Ala Arg Glu Arg Ala Asp Arg Ala Arg Phe Arg
195 200 205
Arg Arg Val Ala Glu Ala Glu Ala Val Ile Gly Pro Cys Leu Gly Pro
210 215 220
Glu Ala Arg Ala Arg Ala Leu Ala Arg Gly Ala Gly Pro Ala Asn Ser
225 230 235 240
Val
<210> 11
<211> 1971
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic polynucleotide
<400> 11
aacacattaa ttaaaaaacc tcccacacct ccccctgaac ctgaaacata aaatgaatgc 60
aattgttgtt gttaacttgt ttattgcagc ttataatggt tacaaataaa gcaatagcat 120
cacaaatttc acaaataaag catttttttc actgcattct agttgtggtt tgtccaaact 180
catcaatgta tcttatcatg tctgctcgaa gcggccggcc gccccgactc tagactacac 240
attgatccta gcagaagcac aggctgcagg gtgacggtcc atcccgctct cctgggcaca 300
agacatgggc agcgtgccat catcctgctc ctccacctcc ggcgggaagc catggctaag 360
cttcttgtac agctcgtcca tgccgagagt gatcccggcg gcggtcacga actccagcag 420
gaccatgtga tcgcgcttct cgttggggtc tttgctcagg gcggactggg tgctcaggta 480
gtggttgtcg ggcagcagca cggggccgtc gccgatgggg gtgttctgct ggtagtggtc 540
ggcgagctgc acgctgccgt cctcgatgtt gtggcggatc ttgaagttca ccttgatgcc 600
gttcttctgc ttgtcggcca tgatatagac gttgtggctg ttgtagttgt actccagctt 660
gtgccccagg atgttgccgt cctccttgaa gtcgatgccc ttcagctcga tgcggttcac 720
cagggtgtcg ccctcgaact tcacctcggc gcgggtcttg tagttgccgt cgtccttgaa 780
gaagatggtg cgctcctgga cgtagccttc gggcatggcg gacttgaaga agtcgtgctg 840
cttcatgtgg tcggggtagc ggctgaagca ctgcacgccg taggtcaggg tggtcacgag 900
ggtgggccag ggcacgggca gcttgccggt ggtgcagatg aacttcaggg tcagcttgcc 960
gtaggtggca tcgccctcgc cctcgccgga cacgctgaac ttgtggccgt ttacgtcgcc 1020
gtccagctcg accaggatgg gcaccacccc ggtgaacagc tcctcgccct tgctcaccat 1080
ccgggaattg cggccgcggg tacaattccg cagcttttag agcagaagta acacttccgt 1140
acaggcctag aagtaaaggc aacatccact gaggagcagt tctttgattt gcaccaccac 1200
cggatccggg acctgaaata aaagacaaaa agactaaact taccagttaa ctttctggtt 1260
tttcagttcc tcgagtaccg gatcctctag agtccggagg ctggatcggt cccggtgtct 1320
tctatggagg tcaaaacagc gtggatggcg tctccaggcg atctgacggt tcactaaacg 1380
agctctgctt atatagacct cccaccgtac acgcctaccg cccatttgcg tcaatggggc 1440
ggagttgtta cgacattttg gaaagtcccg ttgattttgg tgccaaaaca aactcccatt 1500
gacgtcaatg gggtggagac ttggaaatcc ccgtgagtca aaccgctatc cacgcccatt 1560
gatgtactgc caaaaccgca tcaccatggt aatagcgatg actaatacgt agatgtactg 1620
ccaagtagga aagtcccata aggtcatgta ctgggcataa tgccaggcgg gccatttacc 1680
gtcattgacg tcaatagggg gcgtacttgg catatgatac acttgatgta ctgccaagtg 1740
ggcagtttac cgtaaatact ccacccattg acgtcaatgg aaagtcccta ttggcgttac 1800
tatgggaaca tacgtcatta ttgacgtcaa tgggcggggg tcgttgggcg gtcagccagg 1860
cgggccattt accgtaagtt atgtaacgac ctgcaggcat gcaagctcga attcgaacac 1920
gcagatgcag tcggggcggc agatcttaat taatggctgg ttgtttgttg t 1971
<210> 12
<211> 1653
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic polynucleotide
<220>
<221> mutation
<222> (451)..(451)
<223> g451a
<400> 12
atggatcgcg gggcggtggt ggggtttctt ctcggtgttt gtgttgtatc gtgcttggcg 60
ggaacgccca aaacgtcctg gagacgggtg agtgtcggcg aggacgtttc gttgcttcca 120
gctccggggc ctacggggcg cggcccgacc cagaaactac tatgggccgt ggaacccctg 180
gatgggtgcg gccccttaca cccgtcgtgg gtctcgctga tgccccccaa gcaggtgccc 240
gagacggtcg tggatgcggc gtgcatgcgc gctccggtcc cgctggcgat ggcgtacgcc 300
cccccggccc catctgcgac cgggggtcta cgaacggact tcgtgtggca ggagcgcgcg 360
gccgtggtta accggagtct ggttattcac ggggtccgag agacggacag cggcctgtat 420
accctgtccg tgggcgacat aaaggacccg actcgccaag tggcctcggt ggtcctggtg 480
gtgcaaccgg ccccagttcc gaccccaccc ccgaccccag ccgattacga cgaggatgac 540
aatgacgagg gcgaggacga aagtctcgcc ggcactcccg ccagcgggac cccccggctc 600
ccgcctcccc ccgccccccc gaggtcttgg cccagcgccc ccgaagtctc acatgtgcgt 660
ggggtgaccg tgcgtatgga gactccggaa gctatcctgt tttcccccgg ggagacgttc 720
agcacgaacg tctccatcca tgccatcgcc cacgacgacc agacctactc catggacgtc 780
gtctggttga ggttcgacgt gccgacctcg tgtgccgaga tgcgaatata cgaatcgtgt 840
ctgtatcacc cgcagctccc agaatgtctg tccccggccg acgcgccgtg cgccgcgagt 900
acgtggacgt ctcgcctggc cgtccgcagc tacgcggggt gttccagaac aaacccccca 960
ccgcgctgtt cggccgaggc tcacatggag cccgtcccgg ggctggcgtg gcaggcggcc 1020
tccgtcaatc tggagttccg ggacgcgtcc ccacaacact ccggcctgta tctgtgtgtg 1080
gtgtacgtca acgaccatat tcacgcctgg ggccacatta ccatcagcac cgcggcgcag 1140
taccggaacg cggtggtgga acagcccctc ccacagcgcg gcgcggattt ggccgagccc 1200
acccacccgc acgtcggggc ccctccccac gcgcccccaa cccacggcgc cctgcggtta 1260
ggggcggtga tgggggccgc cctgctgctg tctgcgctgg ggttgtcggt gtgggcgtgt 1320
atgacctgtt ggcgcaggcg tgcctggcgg gcggttaaaa gcagggcctc gggtaagggg 1380
cccacgtaca ttcgcgtggc cgacagcgag ctgtacgcgg actggagctc ggacagcgag 1440
ggagaacgcg accaggtccc gtggctggcc cccccggaga gacccgactc tccctccacc 1500
aatggatccg gctttgagat cttatcacca acggctccgt ctgtataccc ccgtagcgac 1560
gggcatcaat ctcgccgcca gctcacaacc tttggatccg gaaggcccga tcgccgttac 1620
tcccaggcct ccgattcgtc cgtcttctgg taa 1653
<210> 13
<211> 550
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic polypeptide
<220>
<221> MISC_FEATURE
<222> (151)..(151)
<223> A151T
<400> 13
Met Asp Arg Gly Ala Val Val Gly Phe Leu Leu Gly Val Cys Val Val
1 5 10 15
Ser Cys Leu Ala Gly Thr Pro Lys Thr Ser Trp Arg Arg Val Ser Val
20 25 30
Gly Glu Asp Val Ser Leu Leu Pro Ala Pro Gly Pro Thr Gly Arg Gly
35 40 45
Pro Thr Gln Lys Leu Leu Trp Ala Val Glu Pro Leu Asp Gly Cys Gly
50 55 60
Pro Leu His Pro Ser Trp Val Ser Leu Met Pro Pro Lys Gln Val Pro
65 70 75 80
Glu Thr Val Val Asp Ala Ala Cys Met Arg Ala Pro Val Pro Leu Ala
85 90 95
Met Ala Tyr Ala Pro Pro Ala Pro Ser Ala Thr Gly Gly Leu Arg Thr
100 105 110
Asp Phe Val Trp Gln Glu Arg Ala Ala Val Val Asn Arg Ser Leu Val
115 120 125
Ile His Gly Val Arg Glu Thr Asp Ser Gly Leu Tyr Thr Leu Ser Val
130 135 140
Gly Asp Ile Lys Asp Pro Thr Arg Gln Val Ala Ser Val Val Leu Val
145 150 155 160
Val Gln Pro Ala Pro Val Pro Thr Pro Pro Pro Thr Pro Ala Asp Tyr
165 170 175
Asp Glu Asp Asp Asn Asp Glu Gly Glu Asp Glu Ser Leu Ala Gly Thr
180 185 190
Pro Ala Ser Gly Thr Pro Arg Leu Pro Pro Pro Pro Ala Pro Pro Arg
195 200 205
Ser Trp Pro Ser Ala Pro Glu Val Ser His Val Arg Gly Val Thr Val
210 215 220
Arg Met Glu Thr Pro Glu Ala Ile Leu Phe Ser Pro Gly Glu Thr Phe
225 230 235 240
Ser Thr Asn Val Ser Ile His Ala Ile Ala His Asp Asp Gln Thr Tyr
245 250 255
Ser Met Asp Val Val Trp Leu Arg Phe Asp Val Pro Thr Ser Cys Ala
260 265 270
Glu Met Arg Ile Tyr Glu Ser Cys Leu Tyr His Pro Gln Leu Pro Glu
275 280 285
Cys Leu Ser Pro Ala Asp Ala Pro Cys Ala Ala Ser Thr Trp Thr Ser
290 295 300
Arg Leu Ala Val Arg Ser Tyr Ala Gly Cys Ser Arg Thr Asn Pro Pro
305 310 315 320
Pro Arg Cys Ser Ala Glu Ala His Met Glu Pro Val Pro Gly Leu Ala
325 330 335
Trp Gln Ala Ala Ser Val Asn Leu Glu Phe Arg Asp Ala Ser Pro Gln
340 345 350
His Ser Gly Leu Tyr Leu Cys Val Val Tyr Val Asn Asp His Ile His
355 360 365
Ala Trp Gly His Ile Thr Ile Ser Thr Ala Ala Gln Tyr Arg Asn Ala
370 375 380
Val Val Glu Gln Pro Leu Pro Gln Arg Gly Ala Asp Leu Ala Glu Pro
385 390 395 400
Thr His Pro His Val Gly Ala Pro Pro His Ala Pro Pro Thr His Gly
405 410 415
Ala Leu Arg Leu Gly Ala Val Met Gly Ala Ala Leu Leu Leu Ser Ala
420 425 430
Leu Gly Leu Ser Val Trp Ala Cys Met Thr Cys Trp Arg Arg Arg Ala
435 440 445
Trp Arg Ala Val Lys Ser Arg Ala Ser Gly Lys Gly Pro Thr Tyr Ile
450 455 460
Arg Val Ala Asp Ser Glu Leu Tyr Ala Asp Trp Ser Ser Asp Ser Glu
465 470 475 480
Gly Glu Arg Asp Gln Val Pro Trp Leu Ala Pro Pro Glu Arg Pro Asp
485 490 495
Ser Pro Ser Thr Asn Gly Ser Gly Phe Glu Ile Leu Ser Pro Thr Ala
500 505 510
Pro Ser Val Tyr Pro Arg Ser Asp Gly His Gln Ser Arg Arg Gln Leu
515 520 525
Thr Thr Phe Gly Ser Gly Arg Pro Asp Arg Arg Tyr Ser Gln Ala Ser
530 535 540
Asp Ser Ser Val Phe Trp
545 550
<210> 14
<211> 1653
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic polynucleotide
<400> 14
atggatcgcg gggcggtggt ggggtttctt ctcggtgttt gtgttgtatc gtgcttggcg 60
ggaacgccca aaacgtcctg gagacgggtg agtgtcggcg aggacgtttc gttgcttcca 120
gctccggggc ctacggggcg cggcccgacc cagaaactac tatgggccgt ggaacccctg 180
gatgggtgcg gccccttaca cccgtcgtgg gtctcgctga tgccccccaa gcaggtgccc 240
gagacggtcg tggatgcggc gtgcatgcgc gctccggtcc cgctggcgat ggcgtacgcc 300
cccccggccc catctgcgac cgggggtcta cgaacggact tcgtgtggca ggagcgcgcg 360
gccgtggtta accggagtct ggttattcac ggggtccgag agacggacag cggcctgtat 420
accctgtccg tgggcgacat aaaggacccg gctcgccaag tggcctcggt ggtcctggtg 480
gtgcaaccgg ccccagttcc gaccccaccc ccgaccccag ccgattacga cgaggatgac 540
aatgacgagg gcgaggacga aagtctcgcc ggcactcccg ccagcgggac cccccggctc 600
ccgcctcccc ccgccccccc gaggtcttgg cccagcgccc ccgaagtctc acatgtgcgt 660
ggggtgaccg tgcgtatgga gactccggaa gctatcctgt tttcccccgg ggagacgttc 720
agcacgaacg tctccatcca tgccatcgcc cacgacgacc agacctactc catggacgtc 780
gtctggttga ggttcgacgt gccgacctcg tgtgccgaga tgcgaatata cgaatcgtgt 840
ctgtatcacc cgcagctccc agaatgtctg tccccggccg acgcgccgtg cgccgcgagt 900
acgtggacgt ctcgcctggc cgtccgcagc tacgcggggt gttccagaac aaacccccca 960
ccgcgctgtt cggccgaggc tcacatggag cccgtcccgg ggctggcgtg gcaggcggcc 1020
tccgtcaatc tggagttccg ggacgcgtcc ccacaacact ccggcctgta tctgtgtgtg 1080
gtgtacgtca acgaccatat tcacgcctgg ggccacatta ccatcagcac cgcggcgcag 1140
taccggaacg cggtggtgga acagcccctc ccacagcgcg gcgcggattt ggccgagccc 1200
acccacccgc acgtcggggc ccctccccac gcgcccccaa cccacggcgc cctgcggtta 1260
ggggcggtga tgggggccgc cctgctgctg tctgcactgg ggttgtcggt gtgggcgtgt 1320
atgacctgtt ggcgcaggcg tgcctggcgg gcggttaaaa gcagggcctc gggtaagggg 1380
cccacgtaca ttcgcgtggc cgacagcgag ctgtacgcgg actggagctc ggacagcgag 1440
ggagaacgcg accaggtccc gtggctggcc cccccggaga gacccgactc tccctccacc 1500
aatggatccg gctttgagat cttatcacca acggctccgt ctgtataccc ccgtagcgat 1560
gggcatcaat ctcgccgcca gctcacaacc tttggatccg gaaggcccga tcgccgttac 1620
tcccaggcct ccgattcgtc cgtcttctgg taa 1653
<210> 15
<211> 550
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic polypeptide
<400> 15
Met Asp Arg Gly Ala Val Val Gly Phe Leu Leu Gly Val Cys Val Val
1 5 10 15
Ser Cys Leu Ala Gly Thr Pro Lys Thr Ser Trp Arg Arg Val Ser Val
20 25 30
Gly Glu Asp Val Ser Leu Leu Pro Ala Pro Gly Pro Thr Gly Arg Gly
35 40 45
Pro Thr Gln Lys Leu Leu Trp Ala Val Glu Pro Leu Asp Gly Cys Gly
50 55 60
Pro Leu His Pro Ser Trp Val Ser Leu Met Pro Pro Lys Gln Val Pro
65 70 75 80
Glu Thr Val Val Asp Ala Ala Cys Met Arg Ala Pro Val Pro Leu Ala
85 90 95
Met Ala Tyr Ala Pro Pro Ala Pro Ser Ala Thr Gly Gly Leu Arg Thr
100 105 110
Asp Phe Val Trp Gln Glu Arg Ala Ala Val Val Asn Arg Ser Leu Val
115 120 125
Ile His Gly Val Arg Glu Thr Asp Ser Gly Leu Tyr Thr Leu Ser Val
130 135 140
Gly Asp Ile Lys Asp Pro Ala Arg Gln Val Ala Ser Val Val Leu Val
145 150 155 160
Val Gln Pro Ala Pro Val Pro Thr Pro Pro Pro Thr Pro Ala Asp Tyr
165 170 175
Asp Glu Asp Asp Asn Asp Glu Gly Glu Asp Glu Ser Leu Ala Gly Thr
180 185 190
Pro Ala Ser Gly Thr Pro Arg Leu Pro Pro Pro Pro Ala Pro Pro Arg
195 200 205
Ser Trp Pro Ser Ala Pro Glu Val Ser His Val Arg Gly Val Thr Val
210 215 220
Arg Met Glu Thr Pro Glu Ala Ile Leu Phe Ser Pro Gly Glu Thr Phe
225 230 235 240
Ser Thr Asn Val Ser Ile His Ala Ile Ala His Asp Asp Gln Thr Tyr
245 250 255
Ser Met Asp Val Val Trp Leu Arg Phe Asp Val Pro Thr Ser Cys Ala
260 265 270
Glu Met Arg Ile Tyr Glu Ser Cys Leu Tyr His Pro Gln Leu Pro Glu
275 280 285
Cys Leu Ser Pro Ala Asp Ala Pro Cys Ala Ala Ser Thr Trp Thr Ser
290 295 300
Arg Leu Ala Val Arg Ser Tyr Ala Gly Cys Ser Arg Thr Asn Pro Pro
305 310 315 320
Pro Arg Cys Ser Ala Glu Ala His Met Glu Pro Val Pro Gly Leu Ala
325 330 335
Trp Gln Ala Ala Ser Val Asn Leu Glu Phe Arg Asp Ala Ser Pro Gln
340 345 350
His Ser Gly Leu Tyr Leu Cys Val Val Tyr Val Asn Asp His Ile His
355 360 365
Ala Trp Gly His Ile Thr Ile Ser Thr Ala Ala Gln Tyr Arg Asn Ala
370 375 380
Val Val Glu Gln Pro Leu Pro Gln Arg Gly Ala Asp Leu Ala Glu Pro
385 390 395 400
Thr His Pro His Val Gly Ala Pro Pro His Ala Pro Pro Thr His Gly
405 410 415
Ala Leu Arg Leu Gly Ala Val Met Gly Ala Ala Leu Leu Leu Ser Ala
420 425 430
Leu Gly Leu Ser Val Trp Ala Cys Met Thr Cys Trp Arg Arg Arg Ala
435 440 445
Trp Arg Ala Val Lys Ser Arg Ala Ser Gly Lys Gly Pro Thr Tyr Ile
450 455 460
Arg Val Ala Asp Ser Glu Leu Tyr Ala Asp Trp Ser Ser Asp Ser Glu
465 470 475 480
Gly Glu Arg Asp Gln Val Pro Trp Leu Ala Pro Pro Glu Arg Pro Asp
485 490 495
Ser Pro Ser Thr Asn Gly Ser Gly Phe Glu Ile Leu Ser Pro Thr Ala
500 505 510
Pro Ser Val Tyr Pro Arg Ser Asp Gly His Gln Ser Arg Arg Gln Leu
515 520 525
Thr Thr Phe Gly Ser Gly Arg Pro Asp Arg Arg Tyr Ser Gln Ala Ser
530 535 540
Asp Ser Ser Val Phe Trp
545 550
<210> 16
<211> 1653
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic polynucleotide
<400> 16
atggatcgcg gggcggtggt ggggtttctt ctcggtgttt gtgttgtatc gtgcttggcg 60
ggaacgccca aaacgtcctg gagacgggtg agtgtcggcg aggacgtttc gttgcttcca 120
gctccggggc ctacggggcg cggcccgacc cagaaactac tatgggccgt ggaacccctg 180
gatgggtgcg gccccttaca cccgtcgtgg gtctcgctga tgccccccaa gcaggtgccc 240
gagacggtcg tggatgcggc gtgcatgcgc gctccggtcc cgctggcgat ggcgtacgcc 300
cccccggccc catctgcgac cgggggtcta cgaacggact tcgtgtggca ggagcgcgcg 360
gccgtggtta accggagtct ggttattcac ggggtccgag agacggacag cggcctgtat 420
accctgtccg tgggcgacat aaaggacccg gctcgccaag tggcctcggt ggtcctggtg 480
gtgcaaccgg ccccagttcc gaccccaccc ccgaccccag ccgattacga cgaggatgac 540
aatgacgagg gcgaggacga aagtctcgcc ggcactcccg ccagcgggac cccccggctc 600
ccgcctcccc ccgccccccc gaggtcttgg cccagcgccc ccgaagtctc acatgtgcgt 660
ggggtgaccg tgcgtatgga gactccggaa gctatcctgt tttcccccgg ggagacgttc 720
agcacgaacg tctccatcca tgccatcgcc cacgacgacc agacctactc catggacgtc 780
gtctggttga ggttcgacgt gccgacctcg tgtgccgaga tgcgaatata cgaatcgtgt 840
ctgtatcacc cgcagctccc agaatgtctg tccccggccg acgcgccgtg cgccgcgagt 900
acgtggacgt ctcgcctggc cgtccgcagc tacgcggggt gttccagaac aaacccccca 960
ccgcgctgtt cggccgaggc tcacatggag cccgtcccgg ggctggcgtg gcaggcggcc 1020
tccgtcaatc tggagttccg ggacgcgtcc ccacaacact ccggcctgta tctgtgtgtg 1080
gtgtacgtca acgaccatat tcacgcctgg ggccacatta ccatcagcac cgcggcgcag 1140
taccggaacg cggtggtgga acagcccctc ccacagcgcg gcgcggattt ggccgagccc 1200
acccacccgc acgtcggggc ccctccccac gcgcccccaa cccacggcgc cctgcggtta 1260
ggggcggtga tgggggccgc cctgctgctg tctgcgctgg ggttgtcggt gtgggcgtgt 1320
atgacctgtt ggcgcaggcg tgcctggcgg gcggttaaaa gcagggcctc gggtaagggg 1380
cccacgtaca ttcgcgtggc cgacagcgag ctgtacgcgg actggagctc ggacagcgag 1440
ggagaacgcg accaggtccc gtggctggcc cccccggaga gacccgactc tccctccacc 1500
aatggatccg gctttgagat cttatcacca acggctccgt ctgtataccc ccgtagcgac 1560
gggcatcaat ctcgccgcca gctcacaacc tttggatccg gaaggcccga tcgccgttac 1620
tcccaggcct ccgattcgtc cgtcttctgg taa 1653
<210> 17
<211> 550
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic polypeptide
<400> 17
Met Asp Arg Gly Ala Val Val Gly Phe Leu Leu Gly Val Cys Val Val
1 5 10 15
Ser Cys Leu Ala Gly Thr Pro Lys Thr Ser Trp Arg Arg Val Ser Val
20 25 30
Gly Glu Asp Val Ser Leu Leu Pro Ala Pro Gly Pro Thr Gly Arg Gly
35 40 45
Pro Thr Gln Lys Leu Leu Trp Ala Val Glu Pro Leu Asp Gly Cys Gly
50 55 60
Pro Leu His Pro Ser Trp Val Ser Leu Met Pro Pro Lys Gln Val Pro
65 70 75 80
Glu Thr Val Val Asp Ala Ala Cys Met Arg Ala Pro Val Pro Leu Ala
85 90 95
Met Ala Tyr Ala Pro Pro Ala Pro Ser Ala Thr Gly Gly Leu Arg Thr
100 105 110
Asp Phe Val Trp Gln Glu Arg Ala Ala Val Val Asn Arg Ser Leu Val
115 120 125
Ile His Gly Val Arg Glu Thr Asp Ser Gly Leu Tyr Thr Leu Ser Val
130 135 140
Gly Asp Ile Lys Asp Pro Ala Arg Gln Val Ala Ser Val Val Leu Val
145 150 155 160
Val Gln Pro Ala Pro Val Pro Thr Pro Pro Pro Thr Pro Ala Asp Tyr
165 170 175
Asp Glu Asp Asp Asn Asp Glu Gly Glu Asp Glu Ser Leu Ala Gly Thr
180 185 190
Pro Ala Ser Gly Thr Pro Arg Leu Pro Pro Pro Pro Ala Pro Pro Arg
195 200 205
Ser Trp Pro Ser Ala Pro Glu Val Ser His Val Arg Gly Val Thr Val
210 215 220
Arg Met Glu Thr Pro Glu Ala Ile Leu Phe Ser Pro Gly Glu Thr Phe
225 230 235 240
Ser Thr Asn Val Ser Ile His Ala Ile Ala His Asp Asp Gln Thr Tyr
245 250 255
Ser Met Asp Val Val Trp Leu Arg Phe Asp Val Pro Thr Ser Cys Ala
260 265 270
Glu Met Arg Ile Tyr Glu Ser Cys Leu Tyr His Pro Gln Leu Pro Glu
275 280 285
Cys Leu Ser Pro Ala Asp Ala Pro Cys Ala Ala Ser Thr Trp Thr Ser
290 295 300
Arg Leu Ala Val Arg Ser Tyr Ala Gly Cys Ser Arg Thr Asn Pro Pro
305 310 315 320
Pro Arg Cys Ser Ala Glu Ala His Met Glu Pro Val Pro Gly Leu Ala
325 330 335
Trp Gln Ala Ala Ser Val Asn Leu Glu Phe Arg Asp Ala Ser Pro Gln
340 345 350
His Ser Gly Leu Tyr Leu Cys Val Val Tyr Val Asn Asp His Ile His
355 360 365
Ala Trp Gly His Ile Thr Ile Ser Thr Ala Ala Gln Tyr Arg Asn Ala
370 375 380
Val Val Glu Gln Pro Leu Pro Gln Arg Gly Ala Asp Leu Ala Glu Pro
385 390 395 400
Thr His Pro His Val Gly Ala Pro Pro His Ala Pro Pro Thr His Gly
405 410 415
Ala Leu Arg Leu Gly Ala Val Met Gly Ala Ala Leu Leu Leu Ser Ala
420 425 430
Leu Gly Leu Ser Val Trp Ala Cys Met Thr Cys Trp Arg Arg Arg Ala
435 440 445
Trp Arg Ala Val Lys Ser Arg Ala Ser Gly Lys Gly Pro Thr Tyr Ile
450 455 460
Arg Val Ala Asp Ser Glu Leu Tyr Ala Asp Trp Ser Ser Asp Ser Glu
465 470 475 480
Gly Glu Arg Asp Gln Val Pro Trp Leu Ala Pro Pro Glu Arg Pro Asp
485 490 495
Ser Pro Ser Thr Asn Gly Ser Gly Phe Glu Ile Leu Ser Pro Thr Ala
500 505 510
Pro Ser Val Tyr Pro Arg Ser Asp Gly His Gln Ser Arg Arg Gln Leu
515 520 525
Thr Thr Phe Gly Ser Gly Arg Pro Asp Arg Arg Tyr Ser Gln Ala Ser
530 535 540
Asp Ser Ser Val Phe Trp
545 550
<210> 18
<211> 1653
<212> DNA
<213> Herpes simplex virus type 1
<400> 18
atggatcgcg gggcggtggt ggggtttctt ctcggtgttt gtgttgtatc gtgcttggcg 60
ggaacgccca aaacgtcctg gagacgggtg agtgtcggcg aggacgtttc gttgcttcca 120
gctccggggc ctacggggcg cggcccgacc cagaaactac tatgggccgt ggaacccctg 180
gatgggtgcg gccccttaca cccgtcgtgg gtctcgctga tgccccccaa gcaggtgccc 240
gagacggtcg tggatgcggc gtgcatgcgc gctccggtcc cgctggcgat ggcgtacgcc 300
cccccggccc catctgcgac cgggggtcta cgaacggact tcgtgtggca ggagcgcgcg 360
gccgtggtta accggagtct ggttattcac ggggtccgag agacggacag cggcctgtat 420
accctgtccg tgggcgacat aaaggacccg gctcgccaag tggcctcggt ggtcctggtg 480
gtgcaaccgg ccccagttcc gaccccaccc ccgaccccag ccgattacga cgaggatgac 540
aatgacgagg gcgaggacga aagtctcgcc ggcactcccg ccagcgggac cccccggctc 600
ccgcctcccc ccgccccccc gaggtcttgg cccagcgccc ccgaagtctc acatgtgcgt 660
ggggtgaccg tgcgtatgga gactccggaa gctatcctgt tttcccccgg ggagacgttc 720
agcacgaacg tctccatcca tgccatcgcc cacgacgacc agacctactc catggacgtc 780
gtctggttga ggttcgacgt gccgacctcg tgtgccgaga tgcgaatata cgaatcgtgt 840
ctgtatcacc cgcagctccc agaatgtctg tccccggccg acgcgccgtg cgccgcgagt 900
acgtggacgt ctcgcctggc cgtccgcagc tacgcggggt gttccagaac aaacccccca 960
ccgcgctgtt cggccgaggc tcacatggag cccgtcccgg ggctggcgtg gcaggcggcc 1020
tccgtcaatc tggagttccg ggacgcgtcc ccacaacact ccggcctgta tctgtgtgtg 1080
gtgtacgtca acgaccatat tcacgcctgg ggccacatta ccatcagcac cgcggcgcag 1140
taccggaacg cggtggtgga acagcccctc ccacagcgcg gcgcggattt ggccgagccc 1200
acccacccgc acgtcggggc ccctccccac gcgcccccaa cccacggcgc cctgcggtta 1260
ggggcggtga tgggggccgc cctgctgctg tctgcgctgg ggttgtcggt gtgggcgtgt 1320
atgacctgtt ggcgcaggcg tgcctggcgg gcggttaaaa gcagggcctc gggtaagggg 1380
cccacgtaca ttcgcgtggc cgacagcgag ctgtacgcgg actggagctc ggacagcgag 1440
ggagaacgcg accaggtccc gtggctggcc cccccggaga gacccgactc tccctccacc 1500
aatggatccg gctttgagat cttatcacca acggctccgt ctgtataccc ccgtagcgac 1560
gggcatcaat ctcgccgcca gctcacaacc tttggatccg gaaggcccga tcgccgttac 1620
tcccaggcct ccgattcgtc cgtcttctgg taa 1653
<210> 19
<211> 550
<212> PRT
<213> Herpes simplex virus type 1
<400> 19
Met Asp Arg Gly Ala Val Val Gly Phe Leu Leu Gly Val Cys Val Val
1 5 10 15
Ser Cys Leu Ala Gly Thr Pro Lys Thr Ser Trp Arg Arg Val Ser Val
20 25 30
Gly Glu Asp Val Ser Leu Leu Pro Ala Pro Gly Pro Thr Gly Arg Gly
35 40 45
Pro Thr Gln Lys Leu Leu Trp Ala Val Glu Pro Leu Asp Gly Cys Gly
50 55 60
Pro Leu His Pro Ser Trp Val Ser Leu Met Pro Pro Lys Gln Val Pro
65 70 75 80
Glu Thr Val Val Asp Ala Ala Cys Met Arg Ala Pro Val Pro Leu Ala
85 90 95
Met Ala Tyr Ala Pro Pro Ala Pro Ser Ala Thr Gly Gly Leu Arg Thr
100 105 110
Asp Phe Val Trp Gln Glu Arg Ala Ala Val Val Asn Arg Ser Leu Val
115 120 125
Ile His Gly Val Arg Glu Thr Asp Ser Gly Leu Tyr Thr Leu Ser Val
130 135 140
Gly Asp Ile Lys Asp Pro Ala Arg Gln Val Ala Ser Val Val Leu Val
145 150 155 160
Val Gln Pro Ala Pro Val Pro Thr Pro Pro Pro Thr Pro Ala Asp Tyr
165 170 175
Asp Glu Asp Asp Asn Asp Glu Gly Glu Asp Glu Ser Leu Ala Gly Thr
180 185 190
Pro Ala Ser Gly Thr Pro Arg Leu Pro Pro Pro Pro Ala Pro Pro Arg
195 200 205
Ser Trp Pro Ser Ala Pro Glu Val Ser His Val Arg Gly Val Thr Val
210 215 220
Arg Met Glu Thr Pro Glu Ala Ile Leu Phe Ser Pro Gly Glu Thr Phe
225 230 235 240
Ser Thr Asn Val Ser Ile His Ala Ile Ala His Asp Asp Gln Thr Tyr
245 250 255
Ser Met Asp Val Val Trp Leu Arg Phe Asp Val Pro Thr Ser Cys Ala
260 265 270
Glu Met Arg Ile Tyr Glu Ser Cys Leu Tyr His Pro Gln Leu Pro Glu
275 280 285
Cys Leu Ser Pro Ala Asp Ala Pro Cys Ala Ala Ser Thr Trp Thr Ser
290 295 300
Arg Leu Ala Val Arg Ser Tyr Ala Gly Cys Ser Arg Thr Asn Pro Pro
305 310 315 320
Pro Arg Cys Ser Ala Glu Ala His Met Glu Pro Val Pro Gly Leu Ala
325 330 335
Trp Gln Ala Ala Ser Val Asn Leu Glu Phe Arg Asp Ala Ser Pro Gln
340 345 350
His Ser Gly Leu Tyr Leu Cys Val Val Tyr Val Asn Asp His Ile His
355 360 365
Ala Trp Gly His Ile Thr Ile Ser Thr Ala Ala Gln Tyr Arg Asn Ala
370 375 380
Val Val Glu Gln Pro Leu Pro Gln Arg Gly Ala Asp Leu Ala Glu Pro
385 390 395 400
Thr His Pro His Val Gly Ala Pro Pro His Ala Pro Pro Thr His Gly
405 410 415
Ala Leu Arg Leu Gly Ala Val Met Gly Ala Ala Leu Leu Leu Ser Ala
420 425 430
Leu Gly Leu Ser Val Trp Ala Cys Met Thr Cys Trp Arg Arg Arg Ala
435 440 445
Trp Arg Ala Val Lys Ser Arg Ala Ser Gly Lys Gly Pro Thr Tyr Ile
450 455 460
Arg Val Ala Asp Ser Glu Leu Tyr Ala Asp Trp Ser Ser Asp Ser Glu
465 470 475 480
Gly Glu Arg Asp Gln Val Pro Trp Leu Ala Pro Pro Glu Arg Pro Asp
485 490 495
Ser Pro Ser Thr Asn Gly Ser Gly Phe Glu Ile Leu Ser Pro Thr Ala
500 505 510
Pro Ser Val Tyr Pro Arg Ser Asp Gly His Gln Ser Arg Arg Gln Leu
515 520 525
Thr Thr Phe Gly Ser Gly Arg Pro Asp Arg Arg Tyr Ser Gln Ala Ser
530 535 540
Asp Ser Ser Val Phe Trp
545 550
<210> 20
<211> 3267
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic polynucleotide
<220>
<221> Intron
<222> (58)..(861)
<223> intron
<220>
<221> mutation
<222> (848)..(848)
<223> a848c
<220>
<221> Intron
<222> (1529)..(1663)
<223> intron
<220>
<221> mutation
<222> (1712)..(1712)
<223> g1712a
<400> 20
atggagcccc gccccggagc gagtacccgc cggcctgagg gccgccccca gcgcgaggtg 60
aggggccggg cgccatgtct ggggcgccat gtctggggcg ccatgtctgg ggcgccatgt 120
ctggggcgcc atgttggggg gcgccatgtt ggggggcgcc atgttggggg acccccgacc 180
cttacactgg aaccggccgc catgttgggg gacccccact catacacggg agccgggcgc 240
catgttgggg cgccatgtta gggggcgtgg aaccccgtga cactatatat acagggaccg 300
ggggcgccat gttagggggc gcggaacccc ctgaccctat atatacaggg accggggtcg 360
ccctgttagg ggtcgccatg tgaccccctg actttatata tacagacccc caacacctac 420
acatggcccc tttgactcag acgcagggcc cggggtcgcc gtgggacccc cctgactcat 480
acacagagac acgcccccac aacaaacaca cagggaccgg ggtcgccgtg ttagggggcg 540
tggtccccac tgactcatac gcagggcccc cttactcaca cgcatctagg ggggtgggga 600
ggagccgccc gccatatttg ggggacgccg tgggaccccc gactccggtg cgtctggagg 660
gcgggagaag agggaagaag aggggtcggg atccaaagga cggacccaga ccacctttgg 720
ttgcagaccc ctttctcccc cctcttccga ggccagcagg ggggcaggac tttgtgaggc 780
ggggggggag ggggaactcg tgggcgctga ttgacgcggg aaatcccccc attcttaccc 840
gccccccctt tttcccctca gcccgccccg gatgtctggg tgtttccctg cgaccgagac 900
ctgccggaca gcagcgactc ggaggcggag accgaagtgg gggggcgggg ggacgccgac 960
caccatgacg acgactccgc ctccgaggcg gacagcacgg acacggaact gttcgagacg 1020
gggctgctgg ggccgcaggg cgtggatggg ggggcggtct cgggggggag ccccccccgc 1080
gaggaagacc ccggcagttg cgggggcgcc ccccctcgag aggacggggg gagcgacgag 1140
ggcgacgtgt gcgccgtgtg cacggatgag atcgcgcccc acctgcgctg cgacaccttc 1200
ccgtgcatgc accgcttctg catcccgtgc atgaaaacct ggatgcaatt gcgcaacacc 1260
tgcccgctgt gcaacgccaa gctggtgtac ctgatagtgg gcgtgacgcc cagcgggtcg 1320
ttcagcacca tcccgatcgt gaacgacccc cagacccgca tggaggccga ggaggccgtc 1380
agggcgggca cggccgtgga ctttatctgg acgggcaatc agcggttcgc cccgcggtac 1440
ctgaccctgg gggggcacac ggtgagggcc ctgtcgccca cccacccgga acccaccacg 1500
gacgaggatg acgacgacct ggacgacggt gaggcggggg gcggcaagga ccctggggga 1560
ggaggaggag gagggggggg agggaggaat aggcgggcgg gcgaggaaag ggcgggccgg 1620
ggagggggcg taacctgatc gcgccccccg ttgtctcttg cagcagacta cgtaccgccc 1680
gccccccgcc ggacgccccg cgccccccca cacagaggcg ccgccgcgcc ccccgtgacg 1740
ggcggggcgt ctcacgcagc cccccagccg gccgcggctc ggacagcgcc cccctcggcg 1800
cccatcgggc cacacggcag cagtaacacc aacaccacca ccaacagcag cggcggcggc 1860
ggctcccgcc agtcgcgagc cgcggcgccg cggggggcgt ctggcccctc cgggggggtt 1920
ggggttgggg ttggggttgt tgaagcggag gcggggcggc cgaggggccg gacgggcccc 1980
cttgtcaaca gacccgcccc ccttgcaaac aacagagacc ccatagtgat cagcgactcc 2040
cccccggcct ctccccacag gccccccgcg gcgcccatgc caggctccgc cccccgcccc 2100
gggccccccg cgtccgcggc cgcgtcggga cccgcgcgcc cccgcgcggc cgtggccccg 2160
tgcgtgcgag cgccgcctcc ggggcccggc ccccgcgccc cggcccccgg ggcggagccg 2220
gccgcccgcc ccgcggacgc gcgccgtgtg ccccagtcgc actcgtccct ggctcaggcc 2280
gcgaaccaag aacagagtct gtgccgggcg cgtgcgacgg tggcgcgcgg ctcggggggg 2340
ccgggcgtgg agggtgggca cgggccctcc cgcggcgccg ccccctccgg cgccgccccg 2400
ctcccctccg ccgcctctgt cgagcaggag gcggcggtgc gtccgaggaa gaggcgcggg 2460
tcgggccagg aaaacccctc cccccagtcc acgcgtcccc ccctcgcgcc ggcaggggcc 2520
aagagggcgg cgacgcaccc cccctccgac tcagggccgg gggggcgcgg ccagggtggg 2580
cccgggaccc ccctgacgtc ctcggcggcc tccgcctctt cctcctctgc ctcttcctcc 2640
tcggccccga cccccgcggg ggccgcctct tccgccgccg gggccgcgtc ctcctccgct 2700
tccgcctcct cgggcggggc cgtcggtgcc ctgggaggga gacaagagga aacctccctc 2760
ggcccccgcg ctgcttctgg gccgcggggg ccgaggaagt gtgcccggaa gacgcgccac 2820
gcggagactt ccggggccgt ccccgcgggc ggcctcacgc gctacctgcc catctcgggg 2880
gtctctagcg tggtcgccct gtcgccttac gtgaacaaga cgatcacggg ggactgcctg 2940
cccatcctgg acatggagac ggggaacatc ggggcgtacg tggtcctggt ggaccagacg 3000
ggaaacatgg cgacccggct gcgggccgcg gtccccggct ggagccgccg caccctgctc 3060
cccgagaccg cgggtaacca cgtgatgccc cccgagtacc cgacggcccc cgcgtcggag 3120
tggaacagcc tctggatgac ccccgtgggg aacatgctgt tcgaccaggg caccctagtg 3180
ggcgccctgg acttccgcag cctgcggtct cggcacccgt ggtccgggga gcagggggcg 3240
tcgacccggg acgagggaaa acaataa 3267
<210> 21
<211> 775
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic polypeptide
<220>
<221> MISC_FEATURE
<222> (258)..(258)
<223> R258H
<400> 21
Met Glu Pro Arg Pro Gly Ala Ser Thr Arg Arg Pro Glu Gly Arg Pro
1 5 10 15
Gln Arg Glu Pro Ala Pro Asp Val Trp Val Phe Pro Cys Asp Arg Asp
20 25 30
Leu Pro Asp Ser Ser Asp Ser Glu Ala Glu Thr Glu Val Gly Gly Arg
35 40 45
Gly Asp Ala Asp His His Asp Asp Asp Ser Ala Ser Glu Ala Asp Ser
50 55 60
Thr Asp Thr Glu Leu Phe Glu Thr Gly Leu Leu Gly Pro Gln Gly Val
65 70 75 80
Asp Gly Gly Ala Val Ser Gly Gly Ser Pro Pro Arg Glu Glu Asp Pro
85 90 95
Gly Ser Cys Gly Gly Ala Pro Pro Arg Glu Asp Gly Gly Ser Asp Glu
100 105 110
Gly Asp Val Cys Ala Val Cys Thr Asp Glu Ile Ala Pro His Leu Arg
115 120 125
Cys Asp Thr Phe Pro Cys Met His Arg Phe Cys Ile Pro Cys Met Lys
130 135 140
Thr Trp Met Gln Leu Arg Asn Thr Cys Pro Leu Cys Asn Ala Lys Leu
145 150 155 160
Val Tyr Leu Ile Val Gly Val Thr Pro Ser Gly Ser Phe Ser Thr Ile
165 170 175
Pro Ile Val Asn Asp Pro Gln Thr Arg Met Glu Ala Glu Glu Ala Val
180 185 190
Arg Ala Gly Thr Ala Val Asp Phe Ile Trp Thr Gly Asn Gln Arg Phe
195 200 205
Ala Pro Arg Tyr Leu Thr Leu Gly Gly His Thr Val Arg Ala Leu Ser
210 215 220
Pro Thr His Pro Glu Pro Thr Thr Asp Glu Asp Asp Asp Asp Leu Asp
225 230 235 240
Asp Ala Asp Tyr Val Pro Pro Ala Pro Arg Arg Thr Pro Arg Ala Pro
245 250 255
Pro His Arg Gly Ala Ala Ala Pro Pro Val Thr Gly Gly Ala Ser His
260 265 270
Ala Ala Pro Gln Pro Ala Ala Ala Arg Thr Ala Pro Pro Ser Ala Pro
275 280 285
Ile Gly Pro His Gly Ser Ser Asn Thr Asn Thr Thr Thr Asn Ser Ser
290 295 300
Gly Gly Gly Gly Ser Arg Gln Ser Arg Ala Ala Ala Pro Arg Gly Ala
305 310 315 320
Ser Gly Pro Ser Gly Gly Val Gly Val Gly Val Gly Val Val Glu Ala
325 330 335
Glu Ala Gly Arg Pro Arg Gly Arg Thr Gly Pro Leu Val Asn Arg Pro
340 345 350
Ala Pro Leu Ala Asn Asn Arg Asp Pro Ile Val Ile Ser Asp Ser Pro
355 360 365
Pro Ala Ser Pro His Arg Pro Pro Ala Ala Pro Met Pro Gly Ser Ala
370 375 380
Pro Arg Pro Gly Pro Pro Ala Ser Ala Ala Ala Ser Gly Pro Ala Arg
385 390 395 400
Pro Arg Ala Ala Val Ala Pro Cys Val Arg Ala Pro Pro Pro Gly Pro
405 410 415
Gly Pro Arg Ala Pro Ala Pro Gly Ala Glu Pro Ala Ala Arg Pro Ala
420 425 430
Asp Ala Arg Arg Val Pro Gln Ser His Ser Ser Leu Ala Gln Ala Ala
435 440 445
Asn Gln Glu Gln Ser Leu Cys Arg Ala Arg Ala Thr Val Ala Arg Gly
450 455 460
Ser Gly Gly Pro Gly Val Glu Gly Gly His Gly Pro Ser Arg Gly Ala
465 470 475 480
Ala Pro Ser Gly Ala Ala Pro Leu Pro Ser Ala Ala Ser Val Glu Gln
485 490 495
Glu Ala Ala Val Arg Pro Arg Lys Arg Arg Gly Ser Gly Gln Glu Asn
500 505 510
Pro Ser Pro Gln Ser Thr Arg Pro Pro Leu Ala Pro Ala Gly Ala Lys
515 520 525
Arg Ala Ala Thr His Pro Pro Ser Asp Ser Gly Pro Gly Gly Arg Gly
530 535 540
Gln Gly Gly Pro Gly Thr Pro Leu Thr Ser Ser Ala Ala Ser Ala Ser
545 550 555 560
Ser Ser Ser Ala Ser Ser Ser Ser Ala Pro Thr Pro Ala Gly Ala Ala
565 570 575
Ser Ser Ala Ala Gly Ala Ala Ser Ser Ser Ala Ser Ala Ser Ser Gly
580 585 590
Gly Ala Val Gly Ala Leu Gly Gly Arg Gln Glu Glu Thr Ser Leu Gly
595 600 605
Pro Arg Ala Ala Ser Gly Pro Arg Gly Pro Arg Lys Cys Ala Arg Lys
610 615 620
Thr Arg His Ala Glu Thr Ser Gly Ala Val Pro Ala Gly Gly Leu Thr
625 630 635 640
Arg Tyr Leu Pro Ile Ser Gly Val Ser Ser Val Val Ala Leu Ser Pro
645 650 655
Tyr Val Asn Lys Thr Ile Thr Gly Asp Cys Leu Pro Ile Leu Asp Met
660 665 670
Glu Thr Gly Asn Ile Gly Ala Tyr Val Val Leu Val Asp Gln Thr Gly
675 680 685
Asn Met Ala Thr Arg Leu Arg Ala Ala Val Pro Gly Trp Ser Arg Arg
690 695 700
Thr Leu Leu Pro Glu Thr Ala Gly Asn His Val Met Pro Pro Glu Tyr
705 710 715 720
Pro Thr Ala Pro Ala Ser Glu Trp Asn Ser Leu Trp Met Thr Pro Val
725 730 735
Gly Asn Met Leu Phe Asp Gln Gly Thr Leu Val Gly Ala Leu Asp Phe
740 745 750
Arg Ser Leu Arg Ser Arg His Pro Trp Ser Gly Glu Gln Gly Ala Ser
755 760 765
Thr Arg Asp Glu Gly Lys Gln
770 775
<210> 22
<211> 3229
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic polynucleotide
<220>
<221> Intron
<222> (58)..(822)
<223> intron
<220>
<221> Intron
<222> (1490)..(1625)
<223> intron
<400> 22
atggagcccc gccccggagc gagtacccgc cggcctgagg gccgccccca gcgcgaggtg 60
aggggccggg cgccatgtct ggggcgccat attggggggc gccatattgg ggggcgccat 120
gttgggggac ccccgaccct tacactggaa ccggccgcca tgttggggga cccccactca 180
tacacgggag ccgggcgcca tgttggggcg ccatgttagg gggcgtggaa ccccgtgaca 240
ctatatatac agggaccggg ggcgccatgt tagggggtgc ggaaccccct gaccctatat 300
atacagggac cggggtcgcc ctgttggggg tcgccatgtg accccctgac tttatatata 360
cagaccccca acacatacac atggcccctt tgactcagac gcagggcccg gggtcgccgt 420
gggaccccct gactcataca cagagacacg cccccacaac aaacacacag ggaccggggt 480
cgccgtgttg ggggcgtggt ccccactgac tcatacgcag gcccccctta ctcacacgca 540
tctagggggg tggggaggag ccgcccgcca tatttggggg acgccgtggg acccccgact 600
ccggtgcgtc tggagggcgg gagaagaggg aagaagaggg gtcgggatcc aaaggacgga 660
cccagaccac ctttggttgc agaccccttt ctcccccctc ttccgaggcc agcagggggg 720
caggactttg tgaggcgggg gggggagagg gggaactcgt gggtgctgat tgacgcggga 780
aatccccccc cattcttacc cgcccccctt ttttcccctt agcccgcccc ggatgtctgg 840
gtgtttccct gcgaccgaga cctgccggac agcagcgact ctgaggcgga gaccgaagtg 900
ggggggcggg gggacgccga ccaccatgac gacgactccg cctccgaggc ggacagcacg 960
gacacggaac tgttcgagac ggggctgctg gggccgcagg gcgtggatgg gggggcggtc 1020
tcggggggga gccccccccg cgaggaagac cccggcagtt gcgggggcgc cccccctcga 1080
gaggacgggg ggagcgacga gggtgacgtg tgcgccgtgt gcacggatga gatcgcgccc 1140
cacctgcgct gcgacacctt cccgtgcatg caccgcttct gcatcccgtg catgaaaacc 1200
tggatgcaat tgcgcaacac ctgcccgctg tgcaacgcca agctggtgta cctgatagtg 1260
ggcgtgacgc ccagcgggtc gttcagcacc atcccgatcg tgaacgaccc ccagacccgc 1320
atggaggccg aggaggccgt cagggcgggc acggccgtgg actttatctg gacgggcaat 1380
cagcggttcg ccccgcggta cctgaccctg ggggggcaca cggtgagggc cctgtcgccc 1440
acccacccgg aacccaccac ggacgaggat gacgacgacc tggacgacgg tgaggcgggg 1500
ggcggcaagg accctggggg aggaggagga ggaggggggg ggagggagga ataggcgggc 1560
gggcgaggaa agggcgggcc ggggaggggg cgtaacctga tcgcgccccc cgttgtctct 1620
tgcagcagac tacgtaccgc ccgccccccg ccggacgccc cgcgcccccc cacgcagagg 1680
cgccgccgcg ccccccgtga cgggcggggc gtctcacgca gccccccagc cggccgcggc 1740
tcggacagcg cccccctcgg cgcccatcgg gccacacggc agcagtaaca ccaacaccac 1800
caccaacagc agcggcggcg gcggctcccg ccagtcgcga gccgcggcgc cgcggggggc 1860
gtctggcccc tccggggggg ttggggttgg ggttggggtt gttgaagcgg aggcggggcg 1920
gccgaggggc cggacgggcc cccttgtcaa cagacccgcc ccccttgcaa acaacagaga 1980
ccccatagtg atcagcgact cccccccggc ctctccccac aggccccccg cggcgcccat 2040
gccaggctcc gccccccgcc ccgggccccc cgcgtccgcg gccgcgtcgg gacccgcgcg 2100
cccccgcgcg gccgtggccc cgtgcgtgcg agcgccgcct ccggggcccg gcccccgcgc 2160
cccggccccc ggggcggagc cggccgcccg ccccgcggac gcgcgccgtg tgccccagtc 2220
gcactcgtcc ctggctcagg ccgcgaacca agaacagagt ctgtgccggg cgcgtgcgac 2280
ggtggcgcgc ggctcggggg ggccgggcgt ggagggtggg cacgggccct cccgcggcgc 2340
cgccccctcc ggcgccgccc cgctcccctc cgccgcctct gtcgagcagg aggcggcggt 2400
gcgtccgagg aagaggcgcg ggtcgggcca ggaaaacccc tccccccagt ccacgcgtcc 2460
ccccctcgcg ccggcagggg ccaagagggc ggcgacgcac cccccctccg actcagggcc 2520
gggggggcgc ggccagggtg ggcccgggac ccccctgacg tcctcggcgg cctccgcctc 2580
ttcctcctct gcctcttcct cctcggcccc gacccccgcg ggggccgcct cttccgccgc 2640
cggggccgcg tcctcctccg cttccgcctc ctcgggcggg gccgtcggtg ccctgggagg 2700
gagacaagag gaaacctccc tcggcccccg cgctgcttct gggccgcggg ggccgaggaa 2760
gtgtgcccgg aagacgcgcc acgcggagac ttccggggcc gtccccgcgg gcggcctcac 2820
gcgctacctg cccatctcgg gggtctctag cgtggtcgcc ctgtcgcctt acgtgaacaa 2880
gactatcacg ggggactgcc tgcccatcct ggacatggag acggggaaca tcggggcgta 2940
cgtggtcctg gtggaccaga cgggaaacat ggcgacccgg ctgcgggccg cggtccccgg 3000
ctggagccgc cgcaccctgc tccccgagac cgcgggtaac cacgtgatgc cccccgagta 3060
cccgacggcc cccgcgtcgg agtggaacag cctctggatg acccccgtgg ggaacatgct 3120
gttcgaccag ggcaccctag tgggcgccct ggacttccgc agcctgcggt ctcggcaccc 3180
gtggtccggg gagcaggggg cgtcgacccg ggacgaggga aaacaataa 3229
<210> 23
<211> 775
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic polypeptide
<400> 23
Met Glu Pro Arg Pro Gly Ala Ser Thr Arg Arg Pro Glu Gly Arg Pro
1 5 10 15
Gln Arg Glu Pro Ala Pro Asp Val Trp Val Phe Pro Cys Asp Arg Asp
20 25 30
Leu Pro Asp Ser Ser Asp Ser Glu Ala Glu Thr Glu Val Gly Gly Arg
35 40 45
Gly Asp Ala Asp His His Asp Asp Asp Ser Ala Ser Glu Ala Asp Ser
50 55 60
Thr Asp Thr Glu Leu Phe Glu Thr Gly Leu Leu Gly Pro Gln Gly Val
65 70 75 80
Asp Gly Gly Ala Val Ser Gly Gly Ser Pro Pro Arg Glu Glu Asp Pro
85 90 95
Gly Ser Cys Gly Gly Ala Pro Pro Arg Glu Asp Gly Gly Ser Asp Glu
100 105 110
Gly Asp Val Cys Ala Val Cys Thr Asp Glu Ile Ala Pro His Leu Arg
115 120 125
Cys Asp Thr Phe Pro Cys Met His Arg Phe Cys Ile Pro Cys Met Lys
130 135 140
Thr Trp Met Gln Leu Arg Asn Thr Cys Pro Leu Cys Asn Ala Lys Leu
145 150 155 160
Val Tyr Leu Ile Val Gly Val Thr Pro Ser Gly Ser Phe Ser Thr Ile
165 170 175
Pro Ile Val Asn Asp Pro Gln Thr Arg Met Glu Ala Glu Glu Ala Val
180 185 190
Arg Ala Gly Thr Ala Val Asp Phe Ile Trp Thr Gly Asn Gln Arg Phe
195 200 205
Ala Pro Arg Tyr Leu Thr Leu Gly Gly His Thr Val Arg Ala Leu Ser
210 215 220
Pro Thr His Pro Glu Pro Thr Thr Asp Glu Asp Asp Asp Asp Leu Asp
225 230 235 240
Asp Ala Asp Tyr Val Pro Pro Ala Pro Arg Arg Thr Pro Arg Ala Pro
245 250 255
Pro Arg Arg Gly Ala Ala Ala Pro Pro Val Thr Gly Gly Ala Ser His
260 265 270
Ala Ala Pro Gln Pro Ala Ala Ala Arg Thr Ala Pro Pro Ser Ala Pro
275 280 285
Ile Gly Pro His Gly Ser Ser Asn Thr Asn Thr Thr Thr Asn Ser Ser
290 295 300
Gly Gly Gly Gly Ser Arg Gln Ser Arg Ala Ala Ala Pro Arg Gly Ala
305 310 315 320
Ser Gly Pro Ser Gly Gly Val Gly Val Gly Val Gly Val Val Glu Ala
325 330 335
Glu Ala Gly Arg Pro Arg Gly Arg Thr Gly Pro Leu Val Asn Arg Pro
340 345 350
Ala Pro Leu Ala Asn Asn Arg Asp Pro Ile Val Ile Ser Asp Ser Pro
355 360 365
Pro Ala Ser Pro His Arg Pro Pro Ala Ala Pro Met Pro Gly Ser Ala
370 375 380
Pro Arg Pro Gly Pro Pro Ala Ser Ala Ala Ala Ser Gly Pro Ala Arg
385 390 395 400
Pro Arg Ala Ala Val Ala Pro Cys Val Arg Ala Pro Pro Pro Gly Pro
405 410 415
Gly Pro Arg Ala Pro Ala Pro Gly Ala Glu Pro Ala Ala Arg Pro Ala
420 425 430
Asp Ala Arg Arg Val Pro Gln Ser His Ser Ser Leu Ala Gln Ala Ala
435 440 445
Asn Gln Glu Gln Ser Leu Cys Arg Ala Arg Ala Thr Val Ala Arg Gly
450 455 460
Ser Gly Gly Pro Gly Val Glu Gly Gly His Gly Pro Ser Arg Gly Ala
465 470 475 480
Ala Pro Ser Gly Ala Ala Pro Leu Pro Ser Ala Ala Ser Val Glu Gln
485 490 495
Glu Ala Ala Val Arg Pro Arg Lys Arg Arg Gly Ser Gly Gln Glu Asn
500 505 510
Pro Ser Pro Gln Ser Thr Arg Pro Pro Leu Ala Pro Ala Gly Ala Lys
515 520 525
Arg Ala Ala Thr His Pro Pro Ser Asp Ser Gly Pro Gly Gly Arg Gly
530 535 540
Gln Gly Gly Pro Gly Thr Pro Leu Thr Ser Ser Ala Ala Ser Ala Ser
545 550 555 560
Ser Ser Ser Ala Ser Ser Ser Ser Ala Pro Thr Pro Ala Gly Ala Ala
565 570 575
Ser Ser Ala Ala Gly Ala Ala Ser Ser Ser Ala Ser Ala Ser Ser Gly
580 585 590
Gly Ala Val Gly Ala Leu Gly Gly Arg Gln Glu Glu Thr Ser Leu Gly
595 600 605
Pro Arg Ala Ala Ser Gly Pro Arg Gly Pro Arg Lys Cys Ala Arg Lys
610 615 620
Thr Arg His Ala Glu Thr Ser Gly Ala Val Pro Ala Gly Gly Leu Thr
625 630 635 640
Arg Tyr Leu Pro Ile Ser Gly Val Ser Ser Val Val Ala Leu Ser Pro
645 650 655
Tyr Val Asn Lys Thr Ile Thr Gly Asp Cys Leu Pro Ile Leu Asp Met
660 665 670
Glu Thr Gly Asn Ile Gly Ala Tyr Val Val Leu Val Asp Gln Thr Gly
675 680 685
Asn Met Ala Thr Arg Leu Arg Ala Ala Val Pro Gly Trp Ser Arg Arg
690 695 700
Thr Leu Leu Pro Glu Thr Ala Gly Asn His Val Met Pro Pro Glu Tyr
705 710 715 720
Pro Thr Ala Pro Ala Ser Glu Trp Asn Ser Leu Trp Met Thr Pro Val
725 730 735
Gly Asn Met Leu Phe Asp Gln Gly Thr Leu Val Gly Ala Leu Asp Phe
740 745 750
Arg Ser Leu Arg Ser Arg His Pro Trp Ser Gly Glu Gln Gly Ala Ser
755 760 765
Thr Arg Asp Glu Gly Lys Gln
770 775
<210> 24
<211> 3275
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic polynucleotide
<220>
<221> Intron
<222> (58)..(862)
<223> intron
<220>
<221> Intron
<222> (1530)..(1668)
<223> intron
<400> 24
atggagcccc gccccggagc gagtacccgc cggcctgagg gccgccccca gcgcgaggtg 60
aggggccggg cgccatgtct ggggcgccat gtctggggcg ccatgtctgg ggcgccatgt 120
ctggggcgcc atgttggggg gcgccatgtt ggggggcgcc atgttggggg acccccgacc 180
cttacactgg aaccggccgc catgttgggg gacccccact catacacggg agccgggcgc 240
catgttgggg cgccatgtta gggggcgtgg aaccccgtga cactatatat acagggaccg 300
ggggcgccat gttagggggc gcggaacccc ctgaccctat atatacaggg accggggtcg 360
ccctgttagg ggtcgccatg tgaccccctg actttatata tacagacccc caacacctac 420
acatggcccc tttgactcag acgcagggcc cggggtcgcc gtgggacccc cctgactcat 480
acacagagac acgcccccac aacaaacaca cagggaccgg ggtcgccgtg ttagggggcg 540
tggtccccac tgactcatac gcagggcccc cttactcaca cgcatctagg ggggtgggga 600
ggagccgccc gccatatttg ggggacgccg tgggaccccc gactccggtg cgtctggagg 660
gcgggagaag agggaagaag aggggtcggg atccaaagga cggacccaga ccacctttgg 720
ttgcagaccc ctttctcccc cctcttccga ggccagcagg ggggcaggac tttgtgaggc 780
ggggggggag ggggaactcg tgggcgctga ttgacgcggg aaatcccccc attcttaccc 840
gccccccctt ttttcccctc agcccgcccc ggatgtctgg gtgtttccct gcgaccgaga 900
cctgccggac agcagcgact cggaggcgga gaccgaagtg ggggggcggg gggacgccga 960
ccaccatgac gacgactccg cctccgaggc ggacagcacg gacacggaac tgttcgagac 1020
ggggctgctg gggccgcagg gcgtggatgg gggggcggtc tcggggggga gccccccccg 1080
cgaggaagac cccggcagtt gcgggggcgc cccccctcga gaggacgggg ggagcgacga 1140
gggcgacgtg tgcgccgtgt gcacggatga gatcgcgccc cacctgcgct gcgacacctt 1200
cccgtgcatg caccgcttct gcatcccgtg catgaaaacc tggatgcaat tgcgcaacac 1260
ctgcccgctg tgcaacgcca agctggtgta cctgatagtg ggcgtgacgc ccagcgggtc 1320
gttcagcacc atcccgatcg tgaacgaccc ccagacccgc atggaggccg aggaggccgt 1380
cagggcgggc acggccgtgg actttatctg gacgggcaat cagcggttcg ccccgcggta 1440
cctgaccctg ggggggcaca cggtgagggc cctgtcgccc acccaccctg agcccaccac 1500
ggacgaggat gacgacgacc tggacgacgg tgaggcgggg gggcggcgag gaccctgggg 1560
gaggaggagg aggggggggg gggggaggaa taggcgggcg ggcgggcgag gaaagggcgg 1620
gccggggagg gggcgtaacc tgatcgcgcc ccccgttgtc tcttgcagca gactacgtac 1680
cgcccgcccc ccgccggacg ccccgcgccc ccccacgcag aggcgccgcc gcgccccccg 1740
tgacgggcgg ggcgtctcac gcagcccccc agccggccgc ggctcggaca gcgcccccct 1800
cggcgcccat cgggccacac ggcagcagta acactaacac caccaccaac agcagcggcg 1860
gcggcggctc ccgccagtcg cgagccgcgg tgccgcgggg ggcgtctggc ccctccgggg 1920
gggttggggt tgttgaagcg gaggcggggc ggccgagggg ccggacgggc ccccttgtca 1980
acagacccgc cccccttgca aacaacagag accccatagt gatcagcgac tcccccccgg 2040
cctctcccca caggcccccc gcggcgccca tgccaggctc cgccccccgc cccggtcccc 2100
ccgcgtccgc ggccgcgtcg ggccccgcgc gcccccgcgc ggccgtggcc ccgtgtgtgc 2160
gggcgccgcc tccggggccc ggcccccgcg ccccggcccc cggggcggag ccggccgccc 2220
gccccgcgga cgcgcgccgt gtgccccagt cgcactcgtc cctggctcag gccgcgaacc 2280
aagaacagag tctgtgccgg gcgcgtgcga cggtggcgcg cggctcgggg gggccgggcg 2340
tggagggtgg acacgggccc tcccgcggcg ccgccccctc cggcgccgcc ccctccggcg 2400
cccccccgct cccctccgcc gcctctgtcg agcaggaggc ggcggtgcgt ccgaggaaga 2460
ggcgcgggtc gggccaggaa aacccctccc cccagtccac gcgtcccccc ctcgcgccgg 2520
caggggccaa gagggcggcg acgcaccccc cctccgactc agggccgggg gggcgcggcc 2580
agggagggcc cgggaccccc ctgacgtcct cggcggcctc cgcctcttcc tcctccgcct 2640
cttcctcctc ggccccgact cccgcggggg ccacctcttc cgccaccggg gccgcgtcct 2700
cctccgcttc cgcctcctcg ggcggggccg tcggtgccct gggagggaga caagaggaaa 2760
cctccctcgg cccccgcgct gcttctgggc cgcgggggcc gaggaagtgt gcccggaaga 2820
cgcgccacgc ggagacttcc ggggccgtcc ccgcgggcgg cctcacgcgc tacctgccca 2880
tctcgggggt ctctagcgtg gtcgccctgt cgccttacgt gaacaagacg atcacggggg 2940
actgcctgcc catcctggac atggagacgg ggaacatcgg ggcgtacgtg gtcctggtgg 3000
accagacggg aaacatggcg acccggctgc gggccgcggt ccccggctgg agccgccgca 3060
ccctgctccc cgagaccgcg ggtaaccacg tgacgccccc cgagtacccg acggcccccg 3120
cgtcggagtg gaacagcctc tggatgaccc ccgtggggaa catgctgttc gaccagggca 3180
ccctagtggg cgccctggac ttccgcagcc tgcggtctcg gcacccgtgg tccggggagc 3240
agggggcgtc gacccgggac gagggaaaac aataa 3275
<210> 25
<211> 3267
<212> DNA
<213> Herpes simplex virus type 1
<220>
<221> Intron
<222> (58)..(861)
<223> intron
<220>
<221> Intron
<222> (1529)..(1663)
<223> intron
<400> 25
atggagcccc gccccggagc gagtacccgc cggcctgagg gccgccccca gcgcgaggtg 60
aggggccggg cgccatgtct ggggcgccat gtctggggcg ccatgtctgg ggcgccatgt 120
ctggggcgcc atgttggggg gcgccatgtt ggggggcgcc atgttggggg acccccgacc 180
cttacactgg aaccggccgc catgttgggg gacccccact catacacggg agccgggcgc 240
catgttgggg cgccatgtta gggggcgtgg aaccccgtga cactatatat acagggaccg 300
ggggcgccat gttagggggc gcggaacccc ctgaccctat atatacaggg accggggtcg 360
ccctgttagg ggtcgccatg tgaccccctg actttatata tacagacccc caacacctac 420
acatggcccc tttgactcag acgcagggcc cggggtcgcc gtgggacccc cctgactcat 480
acacagagac acgcccccac aacaaacaca cagggaccgg ggtcgccgtg ttagggggcg 540
tggtccccac tgactcatac gcagggcccc cttactcaca cgcatctagg ggggtgggga 600
ggagccgccc gccatatttg ggggacgccg tgggaccccc gactccggtg cgtctggagg 660
gcgggagaag agggaagaag aggggtcggg atccaaagga cggacccaga ccacctttgg 720
ttgcagaccc ctttctcccc cctcttccga ggccagcagg ggggcaggac tttgtgaggc 780
ggggggggag ggggaactcg tgggcgctga ttgacgcggg aaatcccccc attcttaccc 840
gccccccttt tttcccctca gcccgccccg gatgtctggg tgtttccctg cgaccgagac 900
ctgccggaca gcagcgactc ggaggcggag accgaagtgg gggggcgggg ggacgccgac 960
caccatgacg acgactccgc ctccgaggcg gacagcacgg acacggaact gttcgagacg 1020
gggctgctgg ggccgcaggg cgtggatggg ggggcggtct cgggggggag ccccccccgc 1080
gaggaagacc ccggcagttg cgggggcgcc ccccctcgag aggacggggg gagcgacgag 1140
ggcgacgtgt gcgccgtgtg cacggatgag atcgcgcccc acctgcgctg cgacaccttc 1200
ccgtgcatgc accgcttctg catcccgtgc atgaaaacct ggatgcaatt gcgcaacacc 1260
tgcccgctgt gcaacgccaa gctggtgtac ctgatagtgg gcgtgacgcc cagcgggtcg 1320
ttcagcacca tcccgatcgt gaacgacccc cagacccgca tggaggccga ggaggccgtc 1380
agggcgggca cggccgtgga ctttatctgg acgggcaatc agcggttcgc cccgcggtac 1440
ctgaccctgg gggggcacac ggtgagggcc ctgtcgccca cccacccgga acccaccacg 1500
gacgaggatg acgacgacct ggacgacggt gaggcggggg gcggcaagga ccctggggga 1560
ggaggaggag gagggggggg agggaggaat aggcgggcgg gcgaggaaag ggcgggccgg 1620
ggagggggcg taacctgatc gcgccccccg ttgtctcttg cagcagacta cgtaccgccc 1680
gccccccgcc ggacgccccg cgccccccca cgcagaggcg ccgccgcgcc ccccgtgacg 1740
ggcggggcgt ctcacgcagc cccccagccg gccgcggctc ggacagcgcc cccctcggcg 1800
cccatcgggc cacacggcag cagtaacacc aacaccacca ccaacagcag cggcggcggc 1860
ggctcccgcc agtcgcgagc cgcggcgccg cggggggcgt ctggcccctc cgggggggtt 1920
ggggttgggg ttggggttgt tgaagcggag gcggggcggc cgaggggccg gacgggcccc 1980
cttgtcaaca gacccgcccc ccttgcaaac aacagagacc ccatagtgat cagcgactcc 2040
cccccggcct ctccccacag gccccccgcg gcgcccatgc caggctccgc cccccgcccc 2100
gggccccccg cgtccgcggc cgcgtcggga cccgcgcgcc cccgcgcggc cgtggccccg 2160
tgcgtgcgag cgccgcctcc ggggcccggc ccccgcgccc cggcccccgg ggcggagccg 2220
gccgcccgcc ccgcggacgc gcgccgtgtg ccccagtcgc actcgtccct ggctcaggcc 2280
gcgaaccaag aacagagtct gtgccgggcg cgtgcgacgg tggcgcgcgg ctcggggggg 2340
ccgggcgtgg agggtgggca cgggccctcc cgcggcgccg ccccctccgg cgccgccccg 2400
ctcccctccg ccgcctctgt cgagcaggag gcggcggtgc gtccgaggaa gaggcgcggg 2460
tcgggccagg aaaacccctc cccccagtcc acgcgtcccc ccctcgcgcc ggcaggggcc 2520
aagagggcgg cgacgcaccc cccctccgac tcagggccgg gggggcgcgg ccagggtggg 2580
cccgggaccc ccctgacgtc ctcggcggcc tccgcctctt cctcctctgc ctcttcctcc 2640
tcggccccga cccccgcggg ggccgcctct tccgccgccg gggccgcgtc ctcctccgct 2700
tccgcctcct cgggcggggc cgtcggtgcc ctgggaggga gacaagagga aacctccctc 2760
ggcccccgcg ctgcttctgg gccgcggggg ccgaggaagt gtgcccggaa gacgcgccac 2820
gcggagactt ccggggccgt ccccgcgggc ggcctcacgc gctacctgcc catctcgggg 2880
gtctctagcg tggtcgccct gtcgccttac gtgaacaaga cgatcacggg ggactgcctg 2940
cccatcctgg acatggagac ggggaacatc ggggcgtacg tggtcctggt ggaccagacg 3000
ggaaacatgg cgacccggct gcgggccgcg gtccccggct ggagccgccg caccctgctc 3060
cccgagaccg cgggtaacca cgtgatgccc cccgagtacc cgacggcccc cgcgtcggag 3120
tggaacagcc tctggatgac ccccgtgggg aacatgctgt tcgaccaggg caccctagtg 3180
ggcgccctgg acttccgcag cctgcggtct cggcacccgt ggtccgggga gcagggggcg 3240
tcgacccggg acgagggaaa acaataa 3267
<210> 26
<211> 775
<212> PRT
<213> Herpes simplex virus type 1
<400> 26
Met Glu Pro Arg Pro Gly Ala Ser Thr Arg Arg Pro Glu Gly Arg Pro
1 5 10 15
Gln Arg Glu Pro Ala Pro Asp Val Trp Val Phe Pro Cys Asp Arg Asp
20 25 30
Leu Pro Asp Ser Ser Asp Ser Glu Ala Glu Thr Glu Val Gly Gly Arg
35 40 45
Gly Asp Ala Asp His His Asp Asp Asp Ser Ala Ser Glu Ala Asp Ser
50 55 60
Thr Asp Thr Glu Leu Phe Glu Thr Gly Leu Leu Gly Pro Gln Gly Val
65 70 75 80
Asp Gly Gly Ala Val Ser Gly Gly Ser Pro Pro Arg Glu Glu Asp Pro
85 90 95
Gly Ser Cys Gly Gly Ala Pro Pro Arg Glu Asp Gly Gly Ser Asp Glu
100 105 110
Gly Asp Val Cys Ala Val Cys Thr Asp Glu Ile Ala Pro His Leu Arg
115 120 125
Cys Asp Thr Phe Pro Cys Met His Arg Phe Cys Ile Pro Cys Met Lys
130 135 140
Thr Trp Met Gln Leu Arg Asn Thr Cys Pro Leu Cys Asn Ala Lys Leu
145 150 155 160
Val Tyr Leu Ile Val Gly Val Thr Pro Ser Gly Ser Phe Ser Thr Ile
165 170 175
Pro Ile Val Asn Asp Pro Gln Thr Arg Met Glu Ala Glu Glu Ala Val
180 185 190
Arg Ala Gly Thr Ala Val Asp Phe Ile Trp Thr Gly Asn Gln Arg Phe
195 200 205
Ala Pro Arg Tyr Leu Thr Leu Gly Gly His Thr Val Arg Ala Leu Ser
210 215 220
Pro Thr His Pro Glu Pro Thr Thr Asp Glu Asp Asp Asp Asp Leu Asp
225 230 235 240
Asp Ala Asp Tyr Val Pro Pro Ala Pro Arg Arg Thr Pro Arg Ala Pro
245 250 255
Pro Arg Arg Gly Ala Ala Ala Pro Pro Val Thr Gly Gly Ala Ser His
260 265 270
Ala Ala Pro Gln Pro Ala Ala Ala Arg Thr Ala Pro Pro Ser Ala Pro
275 280 285
Ile Gly Pro His Gly Ser Ser Asn Thr Asn Thr Thr Thr Asn Ser Ser
290 295 300
Gly Gly Gly Gly Ser Arg Gln Ser Arg Ala Ala Ala Pro Arg Gly Ala
305 310 315 320
Ser Gly Pro Ser Gly Gly Val Gly Val Gly Val Gly Val Val Glu Ala
325 330 335
Glu Ala Gly Arg Pro Arg Gly Arg Thr Gly Pro Leu Val Asn Arg Pro
340 345 350
Ala Pro Leu Ala Asn Asn Arg Asp Pro Ile Val Ile Ser Asp Ser Pro
355 360 365
Pro Ala Ser Pro His Arg Pro Pro Ala Ala Pro Met Pro Gly Ser Ala
370 375 380
Pro Arg Pro Gly Pro Pro Ala Ser Ala Ala Ala Ser Gly Pro Ala Arg
385 390 395 400
Pro Arg Ala Ala Val Ala Pro Cys Val Arg Ala Pro Pro Pro Gly Pro
405 410 415
Gly Pro Arg Ala Pro Ala Pro Gly Ala Glu Pro Ala Ala Arg Pro Ala
420 425 430
Asp Ala Arg Arg Val Pro Gln Ser His Ser Ser Leu Ala Gln Ala Ala
435 440 445
Asn Gln Glu Gln Ser Leu Cys Arg Ala Arg Ala Thr Val Ala Arg Gly
450 455 460
Ser Gly Gly Pro Gly Val Glu Gly Gly His Gly Pro Ser Arg Gly Ala
465 470 475 480
Ala Pro Ser Gly Ala Ala Pro Leu Pro Ser Ala Ala Ser Val Glu Gln
485 490 495
Glu Ala Ala Val Arg Pro Arg Lys Arg Arg Gly Ser Gly Gln Glu Asn
500 505 510
Pro Ser Pro Gln Ser Thr Arg Pro Pro Leu Ala Pro Ala Gly Ala Lys
515 520 525
Arg Ala Ala Thr His Pro Pro Ser Asp Ser Gly Pro Gly Gly Arg Gly
530 535 540
Gln Gly Gly Pro Gly Thr Pro Leu Thr Ser Ser Ala Ala Ser Ala Ser
545 550 555 560
Ser Ser Ser Ala Ser Ser Ser Ser Ala Pro Thr Pro Ala Gly Ala Ala
565 570 575
Ser Ser Ala Ala Gly Ala Ala Ser Ser Ser Ala Ser Ala Ser Ser Gly
580 585 590
Gly Ala Val Gly Ala Leu Gly Gly Arg Gln Glu Glu Thr Ser Leu Gly
595 600 605
Pro Arg Ala Ala Ser Gly Pro Arg Gly Pro Arg Lys Cys Ala Arg Lys
610 615 620
Thr Arg His Ala Glu Thr Ser Gly Ala Val Pro Ala Gly Gly Leu Thr
625 630 635 640
Arg Tyr Leu Pro Ile Ser Gly Val Ser Ser Val Val Ala Leu Ser Pro
645 650 655
Tyr Val Asn Lys Thr Ile Thr Gly Asp Cys Leu Pro Ile Leu Asp Met
660 665 670
Glu Thr Gly Asn Ile Gly Ala Tyr Val Val Leu Val Asp Gln Thr Gly
675 680 685
Asn Met Ala Thr Arg Leu Arg Ala Ala Val Pro Gly Trp Ser Arg Arg
690 695 700
Thr Leu Leu Pro Glu Thr Ala Gly Asn His Val Met Pro Pro Glu Tyr
705 710 715 720
Pro Thr Ala Pro Ala Ser Glu Trp Asn Ser Leu Trp Met Thr Pro Val
725 730 735
Gly Asn Met Leu Phe Asp Gln Gly Thr Leu Val Gly Ala Leu Asp Phe
740 745 750
Arg Ser Leu Arg Ser Arg His Pro Trp Ser Gly Glu Gln Gly Ala Ser
755 760 765
Thr Arg Asp Glu Gly Lys Gln
770 775
<210> 27
<211> 3591
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic polynucleotide
<220>
<221> mutation
<222> (3464)..(3464)
<223> c3464t
<400> 27
atggagacaa agcccaagac ggcaaccacc atcaaggtcc cccccgggcc cctgggatac 60
gtgtacgctc gcgcgtgtcc gtccgaaggc atcgagcttc tggcgttact gtcggcacgc 120
agcggcgatt ccgacgtcgc cgtggcgccc ctggtcgtgg gcctgaccgt ggagagcggc 180
tttgaggcca acgtggccgt ggtcgtgggt tctcgcacga cggggctcgg gggtaccgcg 240
gtgtccctga aactgacgcc ctcgcactac agctcgtccg tgtacgtctt tcacggcggc 300
cggcacctgg accccagcac ccaggccccg aacctgacgc gactttgcga gcgggcacgc 360
cgccattttg gcttttcgga ctacaccccc cggcccggcg acctcaaaca cgagacgacg 420
ggggaggcgc tgtgtgagcg cctcggcctg gacccggacc gcgccctcct gtatctggtc 480
gttaccgagg gcttcaagga ggccgtgtgc atcaacaaca cctttctgca cctgggaggc 540
tcggacaagg taaccatagg cggggcggag gtgcaccgca tacccgtgta cccgttgcag 600
ctgttcatgc cggattttag ccgtgtcatc gcagagccgt tcaacgccaa ccaccgatcg 660
atcggggaga attttaccta cccgcttccg ttttttaacc gccccctcaa ccgcctcctg 720
ttcgaggcgg tcgtgggacc cgccgccgtg gcactgcgat gccgaaacgt ggacgccgtg 780
gcccgcgcgg ccgcccacct ggcgtttgac gaaaaccacg agggcgccgc cctccccgcc 840
gacattacgt tcacggcctt cgaagccagc cagggtaaga ccccgcgggg cgggcgcgac 900
ggcggcggca agggcccggc gggcgggttc gaacagcgcc tggcctccgt catggccgga 960
gacgccgccc tggccctcga ttctatcgtg tcgatggccg tctttgacga gccgcccacc 1020
gacatctccg cgtggccgct gttcgagggc caggacacgg ccgcggcccg cgccaacgcc 1080
gtcggggcgt acctggcgcg cgccgcggga ctcgtggggg ccatggtatt tagcaccaac 1140
tcggccctcc atctcaccga ggtggacgac gccggcccgg cggacccaaa ggaccacagc 1200
aaaccctcct tttaccgctt cttcctcgtg cccgggaccc acgtggcggc caacccacag 1260
gtggaccgcg agggacacgt ggtgcccggg ttcgagggtc ggcccaccgc gcccctcgtc 1320
ggcggaaccc aggaatttgc cggcgagcac ctggccatgc tgtgtgggtt ttccccggcg 1380
ctgctggcca agatgctgtt ttacctggag cgctgcgacg gcggcgtgat cgtcgggcgc 1440
caggagatgg acgtgtttcg atacgtcgcg gactccaacc agaccgacgt gccctgtaac 1500
ctatgcacct tcgacacgcg ccacgcctgc gtacacacga cgctcatgcg cctccgggcg 1560
cgccatccaa agttcgccag cgccgcccgc ggagccatcg gcgtcttcgg gaccatgaac 1620
agcatgtaca gcgactgcga cgtgctggga aactacgccg ccttctcggc cctgaagcgc 1680
gcggacggat ccgagaccgc ccggaccatc atgcaggaga cgtaccgcgc ggcgaccgag 1740
cgcgtcatgg ccgaactcga gaccctgcag tacgtggacc aggcggtccc cacggccatg 1800
gggcggctgg agaccatcat caccaaccgc gaggccctgc atacggtggt gaacaacgtc 1860
aggcaggtcg tggaccgcga ggtggagcag ctgatgcgca acctggtgga ggggaggaac 1920
ttcaagtttc gcgacggtct gggcgaggcc aaccacgcca tgtccctgac gctggacccg 1980
tacgcgtgcg ggccgtgccc cctgcttcag cttctcgggc ggcgatccaa cctcgccgtg 2040
taccaggacc tggccctgag tcagtgccac ggggtgttcg ccgggcagtc ggtcgagggg 2100
cgcaactttc gcaatcaatt ccaaccggtg ctgcggcggc gcgtgatgga catgtttaac 2160
aacgggtttc tgtcggccaa aacgctgacg gtcgcgctct cggagggggc ggctatctgc 2220
gcccccagcc taacggccgg ccagacggcc cccgccgaga gcagcttcga gggcgacgtt 2280
gcccgcgtga ccctggggtt tcccaaggag ctgcgcgtca agagccgcgt gttgttcgcg 2340
ggcgcgagcg ccaacgcgtc cgaggccgcc aaggcgcggg tcgccagcct ccagagcgcc 2400
taccagaagc ccgacaagcg cgtggacatc ctcctcggac cgctgggctt tctgctgaag 2460
cagttccacg cggccatctt ccccaacggc aagcccccgg ggtccaacca gccgaacccg 2520
cagtggttct ggacggccct ccaacgcaac cagcttcccg cccggctcct gtcgcgcgag 2580
gacatcgaga ccatcgcgtt cattaaaaag ttttccctgg actacggcgc gataaacttt 2640
attaacctgg cccccaacaa cgtgagcgag ctggcgatgt actacatggc aaaccagatt 2700
ctgcggtact gcgatcactc gacatacttc atcaacaccc ttacggccat catcgcgggg 2760
tcccgccgtc cccccagcgt gcaggctgcg gccgcgtggt ccgcgcaggg cggggcgggc 2820
ctggaggccg gggcccgcgc gctgatggac gccgtggacg cgcatccggg cgcgtggacg 2880
tccatgttcg ccagctgcaa cctgctgcgg cccgtcatgg cggcgcgccc catggtcgtg 2940
ttggggttga gcatcagcaa gtactacggc atggccggca acgaccgtgt gtttcaggcc 3000
gggaactggg ccagcctgat gggcggcaaa aacgcgtgcc cgctccttat ttttgaccgc 3060
acccgcaagt tcgtcctggc ctgtccccgg gccgggtttg tgtgcgcggc ctcaagcctc 3120
ggcggcggag cgcacgaaag ctcgctgtgc gagcagctcc ggggcattat ctccgagggc 3180
ggggcggccg tcgccagtag cgtgttcgtg gcgaccgtga aaagcctggg gccccgcacc 3240
cagcagctgc agatcgagga ctggctggcg ctcctggagg acgagtacct aagcgaggag 3300
atgatggagc tgaccgcgcg tgccctggag cgcggcaacg gcgagtggtc gacggacgcg 3360
gccctggagg tggcgcacga ggccgaggcc ctagtcagcc aactcggcaa cgccggggag 3420
gtgtttaact ttggggattt tggctgcgag gacgacaacg cgatgccgtt cggcggcccg 3480
ggggccccgg gaccggcatt tgccggccgc aaacgggcgt tccacgggga tgacccgttt 3540
ggggaggggc cccccgacaa aaagggagac ctgacgttgg atatgctgtg a 3591
<210> 28
<211> 1196
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic polypeptide
<220>
<221> MISC_FEATURE
<222> (1155)..(1155)
<223> T1155M
<400> 28
Met Glu Thr Lys Pro Lys Thr Ala Thr Thr Ile Lys Val Pro Pro Gly
1 5 10 15
Pro Leu Gly Tyr Val Tyr Ala Arg Ala Cys Pro Ser Glu Gly Ile Glu
20 25 30
Leu Leu Ala Leu Leu Ser Ala Arg Ser Gly Asp Ser Asp Val Ala Val
35 40 45
Ala Pro Leu Val Val Gly Leu Thr Val Glu Ser Gly Phe Glu Ala Asn
50 55 60
Val Ala Val Val Val Gly Ser Arg Thr Thr Gly Leu Gly Gly Thr Ala
65 70 75 80
Val Ser Leu Lys Leu Thr Pro Ser His Tyr Ser Ser Ser Val Tyr Val
85 90 95
Phe His Gly Gly Arg His Leu Asp Pro Ser Thr Gln Ala Pro Asn Leu
100 105 110
Thr Arg Leu Cys Glu Arg Ala Arg Arg His Phe Gly Phe Ser Asp Tyr
115 120 125
Thr Pro Arg Pro Gly Asp Leu Lys His Glu Thr Thr Gly Glu Ala Leu
130 135 140
Cys Glu Arg Leu Gly Leu Asp Pro Asp Arg Ala Leu Leu Tyr Leu Val
145 150 155 160
Val Thr Glu Gly Phe Lys Glu Ala Val Cys Ile Asn Asn Thr Phe Leu
165 170 175
His Leu Gly Gly Ser Asp Lys Val Thr Ile Gly Gly Ala Glu Val His
180 185 190
Arg Ile Pro Val Tyr Pro Leu Gln Leu Phe Met Pro Asp Phe Ser Arg
195 200 205
Val Ile Ala Glu Pro Phe Asn Ala Asn His Arg Ser Ile Gly Glu Asn
210 215 220
Phe Thr Tyr Pro Leu Pro Phe Phe Asn Arg Pro Leu Asn Arg Leu Leu
225 230 235 240
Phe Glu Ala Val Val Gly Pro Ala Ala Val Ala Leu Arg Cys Arg Asn
245 250 255
Val Asp Ala Val Ala Arg Ala Ala Ala His Leu Ala Phe Asp Glu Asn
260 265 270
His Glu Gly Ala Ala Leu Pro Ala Asp Ile Thr Phe Thr Ala Phe Glu
275 280 285
Ala Ser Gln Gly Lys Thr Pro Arg Gly Gly Arg Asp Gly Gly Gly Lys
290 295 300
Gly Pro Ala Gly Gly Phe Glu Gln Arg Leu Ala Ser Val Met Ala Gly
305 310 315 320
Asp Ala Ala Leu Ala Leu Asp Ser Ile Val Ser Met Ala Val Phe Asp
325 330 335
Glu Pro Pro Thr Asp Ile Ser Ala Trp Pro Leu Phe Glu Gly Gln Asp
340 345 350
Thr Ala Ala Ala Arg Ala Asn Ala Val Gly Ala Tyr Leu Ala Arg Ala
355 360 365
Ala Gly Leu Val Gly Ala Met Val Phe Ser Thr Asn Ser Ala Leu His
370 375 380
Leu Thr Glu Val Asp Asp Ala Gly Pro Ala Asp Pro Lys Asp His Ser
385 390 395 400
Lys Pro Ser Phe Tyr Arg Phe Phe Leu Val Pro Gly Thr His Val Ala
405 410 415
Ala Asn Pro Gln Val Asp Arg Glu Gly His Val Val Pro Gly Phe Glu
420 425 430
Gly Arg Pro Thr Ala Pro Leu Val Gly Gly Thr Gln Glu Phe Ala Gly
435 440 445
Glu His Leu Ala Met Leu Cys Gly Phe Ser Pro Ala Leu Leu Ala Lys
450 455 460
Met Leu Phe Tyr Leu Glu Arg Cys Asp Gly Gly Val Ile Val Gly Arg
465 470 475 480
Gln Glu Met Asp Val Phe Arg Tyr Val Ala Asp Ser Asn Gln Thr Asp
485 490 495
Val Pro Cys Asn Leu Cys Thr Phe Asp Thr Arg His Ala Cys Val His
500 505 510
Thr Thr Leu Met Arg Leu Arg Ala Arg His Pro Lys Phe Ala Ser Ala
515 520 525
Ala Arg Gly Ala Ile Gly Val Phe Gly Thr Met Asn Ser Met Tyr Ser
530 535 540
Asp Cys Asp Val Leu Gly Asn Tyr Ala Ala Phe Ser Ala Leu Lys Arg
545 550 555 560
Ala Asp Gly Ser Glu Thr Ala Arg Thr Ile Met Gln Glu Thr Tyr Arg
565 570 575
Ala Ala Thr Glu Arg Val Met Ala Glu Leu Glu Thr Leu Gln Tyr Val
580 585 590
Asp Gln Ala Val Pro Thr Ala Met Gly Arg Leu Glu Thr Ile Ile Thr
595 600 605
Asn Arg Glu Ala Leu His Thr Val Val Asn Asn Val Arg Gln Val Val
610 615 620
Asp Arg Glu Val Glu Gln Leu Met Arg Asn Leu Val Glu Gly Arg Asn
625 630 635 640
Phe Lys Phe Arg Asp Gly Leu Gly Glu Ala Asn His Ala Met Ser Leu
645 650 655
Thr Leu Asp Pro Tyr Ala Cys Gly Pro Cys Pro Leu Leu Gln Leu Leu
660 665 670
Gly Arg Arg Ser Asn Leu Ala Val Tyr Gln Asp Leu Ala Leu Ser Gln
675 680 685
Cys His Gly Val Phe Ala Gly Gln Ser Val Glu Gly Arg Asn Phe Arg
690 695 700
Asn Gln Phe Gln Pro Val Leu Arg Arg Arg Val Met Asp Met Phe Asn
705 710 715 720
Asn Gly Phe Leu Ser Ala Lys Thr Leu Thr Val Ala Leu Ser Glu Gly
725 730 735
Ala Ala Ile Cys Ala Pro Ser Leu Thr Ala Gly Gln Thr Ala Pro Ala
740 745 750
Glu Ser Ser Phe Glu Gly Asp Val Ala Arg Val Thr Leu Gly Phe Pro
755 760 765
Lys Glu Leu Arg Val Lys Ser Arg Val Leu Phe Ala Gly Ala Ser Ala
770 775 780
Asn Ala Ser Glu Ala Ala Lys Ala Arg Val Ala Ser Leu Gln Ser Ala
785 790 795 800
Tyr Gln Lys Pro Asp Lys Arg Val Asp Ile Leu Leu Gly Pro Leu Gly
805 810 815
Phe Leu Leu Lys Gln Phe His Ala Ala Ile Phe Pro Asn Gly Lys Pro
820 825 830
Pro Gly Ser Asn Gln Pro Asn Pro Gln Trp Phe Trp Thr Ala Leu Gln
835 840 845
Arg Asn Gln Leu Pro Ala Arg Leu Leu Ser Arg Glu Asp Ile Glu Thr
850 855 860
Ile Ala Phe Ile Lys Lys Phe Ser Leu Asp Tyr Gly Ala Ile Asn Phe
865 870 875 880
Ile Asn Leu Ala Pro Asn Asn Val Ser Glu Leu Ala Met Tyr Tyr Met
885 890 895
Ala Asn Gln Ile Leu Arg Tyr Cys Asp His Ser Thr Tyr Phe Ile Asn
900 905 910
Thr Leu Thr Ala Ile Ile Ala Gly Ser Arg Arg Pro Pro Ser Val Gln
915 920 925
Ala Ala Ala Ala Trp Ser Ala Gln Gly Gly Ala Gly Leu Glu Ala Gly
930 935 940
Ala Arg Ala Leu Met Asp Ala Val Asp Ala His Pro Gly Ala Trp Thr
945 950 955 960
Ser Met Phe Ala Ser Cys Asn Leu Leu Arg Pro Val Met Ala Ala Arg
965 970 975
Pro Met Val Val Leu Gly Leu Ser Ile Ser Lys Tyr Tyr Gly Met Ala
980 985 990
Gly Asn Asp Arg Val Phe Gln Ala Gly Asn Trp Ala Ser Leu Met Gly
995 1000 1005
Gly Lys Asn Ala Cys Pro Leu Leu Ile Phe Asp Arg Thr Arg Lys
1010 1015 1020
Phe Val Leu Ala Cys Pro Arg Ala Gly Phe Val Cys Ala Ala Ser
1025 1030 1035
Ser Leu Gly Gly Gly Ala His Glu Ser Ser Leu Cys Glu Gln Leu
1040 1045 1050
Arg Gly Ile Ile Ser Glu Gly Gly Ala Ala Val Ala Ser Ser Val
1055 1060 1065
Phe Val Ala Thr Val Lys Ser Leu Gly Pro Arg Thr Gln Gln Leu
1070 1075 1080
Gln Ile Glu Asp Trp Leu Ala Leu Leu Glu Asp Glu Tyr Leu Ser
1085 1090 1095
Glu Glu Met Met Glu Leu Thr Ala Arg Ala Leu Glu Arg Gly Asn
1100 1105 1110
Gly Glu Trp Ser Thr Asp Ala Ala Leu Glu Val Ala His Glu Ala
1115 1120 1125
Glu Ala Leu Val Ser Gln Leu Gly Asn Ala Gly Glu Val Phe Asn
1130 1135 1140
Phe Gly Asp Phe Gly Cys Glu Asp Asp Asn Ala Met Pro Phe Gly
1145 1150 1155
Gly Pro Gly Ala Pro Gly Pro Ala Phe Ala Gly Arg Lys Arg Ala
1160 1165 1170
Phe His Gly Asp Asp Pro Phe Gly Glu Gly Pro Pro Asp Lys Lys
1175 1180 1185
Gly Asp Leu Thr Leu Asp Met Leu
1190 1195
<210> 29
<211> 3591
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic polynucleotide
<400> 29
atggagacaa agcccaagac ggcaaccacc atcaaggtcc cccccgggcc cctgggatac 60
gtgtacgctc gcgcgtgtcc gtccgaaggc atcgagcttc tggcgttact gtcggcacgc 120
agcggcgatt ccgacgtcgc cgtggcgccc ctggtcgtgg gcctgaccgt ggagagcggc 180
tttgaggcca acgtggccgt ggtcgtgggt tctcgcacga cggggctcgg gggtaccgcg 240
gtgtccctga aactgacgcc ctcgcactac agctcgtccg tgtacgtctt tcacggcggc 300
cggcacctgg accccagcac ccaggccccg aacctgacgc gactttgcga gcgggcacgc 360
cgccattttg gcttttcgga ctacaccccc cggcccggcg acctcaaaca cgagacgacg 420
ggggaggcgc tgtgtgagcg cctcggcctg gacccggacc gcgccctcct gtatctggtc 480
gttaccgagg gcttcaagga ggccgtgtgc atcaacaaca cctttctgca cctgggaggc 540
tcggacaagg taaccatagg cggggcggag gtgcaccgca tacccgtgta cccgttgcag 600
ctgttcatgc cggattttag ccgtgtcatc gcagagccgt tcaacgccaa ccaccgatcg 660
atcggggaga attttaccta cccgcttccg ttttttaacc gccccctcaa ccgcctcctg 720
ttcgaggcgg tcgtgggacc cgccgccgtg gcactgcgat gccgaaacgt ggacgccgtg 780
gcccgcgcgg ccgcccacct ggcgtttgac gaaaaccacg agggcgccgc cctccccgcc 840
gacattacgt tcacggcctt cgaagccagc cagggtaaga ccccgcgggg cgggcgcgac 900
ggcggcggca agggcccggc gggcgggttc gaacagcgcc tggcctccgt catggccgga 960
gacgccgccc tggccctcga ttctatcgtg tcgatggccg tctttgacga gccgcccacc 1020
gacatctccg cgtggccgct gttcgagggc caggacacgg ccgcggcccg cgccaacgcc 1080
gtcggggcgt acctggcgcg cgccgcggga ctcgtggggg ccatggtatt tagcaccaac 1140
tcggccctcc atctcaccga ggtggacgac gccggcccgg cggacccaaa ggaccacagc 1200
aaaccctcct tttaccgctt cttcctcgtg cccgggaccc acgtggcggc caacccacag 1260
gtggaccgcg agggacacgt ggtgcccggg ttcgagggtc ggcccaccgc gcccctcgtc 1320
ggcggaaccc aggaatttgc cggcgagcac ctggccatgc tgtgtgggtt ttccccggcg 1380
ctgctggcca agatgctgtt ttacctggag cgctgcgacg gcggcgtgat cgtcgggcgc 1440
caggagatgg acgtgtttcg atacgtcgcg gactccaacc agaccgacgt gccctgtaac 1500
ctatgcacct tcgacacgcg ccacgcctgc gtacacacga cgctcatgcg cctccgggcg 1560
cgccatccaa agttcgccag cgccgcccgc ggagccatcg gcgtcttcgg gaccatgaac 1620
agcatgtaca gcgactgcga cgtgctggga aactacgccg ccttctcggc cctgaagcgc 1680
gcggacggat ccgagaccgc ccggaccatc atgcaggaga cgtaccgcgc ggcgaccgag 1740
cgcgtcatgg ccgaactcga gaccctgcag tacgtggacc aggcggtccc cacggccatg 1800
gggcggctgg agaccatcat caccaaccgc gaggccctgc atacggtggt gaacaacgtc 1860
aggcaggtcg tggaccgcga ggtggagcag ctgatgcgca acctggtgga ggggaggaac 1920
ttcaagtttc gcgacggtct gggcgaggcc aaccacgcca tgtccctgac gctggacccg 1980
tacgcgtgcg ggccgtgccc cctgcttcag cttctcgggc ggcgatccaa cctcgccgtg 2040
taccaggacc tggccctgag tcagtgccac ggggtgttcg ccgggcagtc ggtcgagggg 2100
cgcaactttc gcaatcaatt ccaaccggtg ctgcggcggc gcgtgatgga catgtttaac 2160
aacgggtttc tgtcggccaa aacgctgacg gtcgcgctct cggagggggc ggctatctgc 2220
gcccccagcc taacggccgg ccagacggcc cccgccgaga gcagcttcga gggcgacgtt 2280
gcccgcgtga ccctggggtt tcccaaggag ctgcgcgtca agagccgcgt gttgttcgcg 2340
ggcgcgagcg ccaacgcgtc cgaggccgcc aaggcgcggg tcgccagcct ccagagcgcc 2400
taccagaagc ccgacaagcg cgtggacatc ctcctcggac cgctgggctt tctgctgaag 2460
cagttccacg cggccatctt ccccaacggc aagcccccgg ggtccaacca gccgaacccg 2520
cagtggttct ggacggccct ccaacgcaac cagcttcccg cccggctcct gtcgcgcgag 2580
gacatcgaga ccatcgcgtt cattaaaaag ttttccctgg actacggcgc gataaacttt 2640
attaacctgg cccccaacaa cgtgagcgag ctggcgatgt actacatggc aaaccagatt 2700
ctgcggtact gcgatcactc gacatacttc atcaacaccc ttacggccat catcgcgggg 2760
tcccgccgtc cccccagcgt gcaggctgcg gccgcgtggt ccgcgcaggg cggggcgggc 2820
ctggaggccg gggcccgcgc gctgatggac gccgtggacg cgcatccggg cgcgtggacg 2880
tccatgttcg ccagctgcaa cctgctgcgg cccgtcatgg cggcgcgccc catggtcgtg 2940
ttggggttga gcatcagcaa gtactacggc atggccggca acgaccgtgt gtttcaggcc 3000
gggaactggg ccagcctgat gggcggcaaa aacgcgtgcc cgctccttat ttttgaccgc 3060
acccgcaagt tcgtcctggc ctgtccccgg gccgggtttg tgtgcgcggc ctcaagcctc 3120
ggcggcggag cgcacgaaag ctcgctgtgc gagcagctcc ggggcattat ctccgagggc 3180
ggggcggccg tcgccagtag cgtgttcgtg gcgaccgtga aaagcctggg gccccgcacc 3240
cagcagctgc agatcgagga ctggctggcg ctcctggagg acgagtacct aagcgaggag 3300
atgatggagc tgaccgcgcg tgccctggag cgcggcaacg gcgagtggtc gacggacgcg 3360
gccctggagg tggcgcacga ggccgaggcc ctagtcagcc aactcggcaa cgccggggag 3420
gtgtttaact ttggggattt tggctgcgag gacgacaacg cgacgccgtt cggcggcccg 3480
ggggccccgg gaccggcatt tgccggccgc aaacgggcgt tccacgggga tgacccgttt 3540
ggggaggggc cccccgacaa aaagggagac ctgacgttgg atatgctgtg a 3591
<210> 30
<211> 1196
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic polypeptide
<400> 30
Met Glu Thr Lys Pro Lys Thr Ala Thr Thr Ile Lys Val Pro Pro Gly
1 5 10 15
Pro Leu Gly Tyr Val Tyr Ala Arg Ala Cys Pro Ser Glu Gly Ile Glu
20 25 30
Leu Leu Ala Leu Leu Ser Ala Arg Ser Gly Asp Ser Asp Val Ala Val
35 40 45
Ala Pro Leu Val Val Gly Leu Thr Val Glu Ser Gly Phe Glu Ala Asn
50 55 60
Val Ala Val Val Val Gly Ser Arg Thr Thr Gly Leu Gly Gly Thr Ala
65 70 75 80
Val Ser Leu Lys Leu Thr Pro Ser His Tyr Ser Ser Ser Val Tyr Val
85 90 95
Phe His Gly Gly Arg His Leu Asp Pro Ser Thr Gln Ala Pro Asn Leu
100 105 110
Thr Arg Leu Cys Glu Arg Ala Arg Arg His Phe Gly Phe Ser Asp Tyr
115 120 125
Thr Pro Arg Pro Gly Asp Leu Lys His Glu Thr Thr Gly Glu Ala Leu
130 135 140
Cys Glu Arg Leu Gly Leu Asp Pro Asp Arg Ala Leu Leu Tyr Leu Val
145 150 155 160
Val Thr Glu Gly Phe Lys Glu Ala Val Cys Ile Asn Asn Thr Phe Leu
165 170 175
His Leu Gly Gly Ser Asp Lys Val Thr Ile Gly Gly Ala Glu Val His
180 185 190
Arg Ile Pro Val Tyr Pro Leu Gln Leu Phe Met Pro Asp Phe Ser Arg
195 200 205
Val Ile Ala Glu Pro Phe Asn Ala Asn His Arg Ser Ile Gly Glu Asn
210 215 220
Phe Thr Tyr Pro Leu Pro Phe Phe Asn Arg Pro Leu Asn Arg Leu Leu
225 230 235 240
Phe Glu Ala Val Val Gly Pro Ala Ala Val Ala Leu Arg Cys Arg Asn
245 250 255
Val Asp Ala Val Ala Arg Ala Ala Ala His Leu Ala Phe Asp Glu Asn
260 265 270
His Glu Gly Ala Ala Leu Pro Ala Asp Ile Thr Phe Thr Ala Phe Glu
275 280 285
Ala Ser Gln Gly Lys Thr Pro Arg Gly Gly Arg Asp Gly Gly Gly Lys
290 295 300
Gly Pro Ala Gly Gly Phe Glu Gln Arg Leu Ala Ser Val Met Ala Gly
305 310 315 320
Asp Ala Ala Leu Ala Leu Asp Ser Ile Val Ser Met Ala Val Phe Asp
325 330 335
Glu Pro Pro Thr Asp Ile Ser Ala Trp Pro Leu Phe Glu Gly Gln Asp
340 345 350
Thr Ala Ala Ala Arg Ala Asn Ala Val Gly Ala Tyr Leu Ala Arg Ala
355 360 365
Ala Gly Leu Val Gly Ala Met Val Phe Ser Thr Asn Ser Ala Leu His
370 375 380
Leu Thr Glu Val Asp Asp Ala Gly Pro Ala Asp Pro Lys Asp His Ser
385 390 395 400
Lys Pro Ser Phe Tyr Arg Phe Phe Leu Val Pro Gly Thr His Val Ala
405 410 415
Ala Asn Pro Gln Val Asp Arg Glu Gly His Val Val Pro Gly Phe Glu
420 425 430
Gly Arg Pro Thr Ala Pro Leu Val Gly Gly Thr Gln Glu Phe Ala Gly
435 440 445
Glu His Leu Ala Met Leu Cys Gly Phe Ser Pro Ala Leu Leu Ala Lys
450 455 460
Met Leu Phe Tyr Leu Glu Arg Cys Asp Gly Gly Val Ile Val Gly Arg
465 470 475 480
Gln Glu Met Asp Val Phe Arg Tyr Val Ala Asp Ser Asn Gln Thr Asp
485 490 495
Val Pro Cys Asn Leu Cys Thr Phe Asp Thr Arg His Ala Cys Val His
500 505 510
Thr Thr Leu Met Arg Leu Arg Ala Arg His Pro Lys Phe Ala Ser Ala
515 520 525
Ala Arg Gly Ala Ile Gly Val Phe Gly Thr Met Asn Ser Met Tyr Ser
530 535 540
Asp Cys Asp Val Leu Gly Asn Tyr Ala Ala Phe Ser Ala Leu Lys Arg
545 550 555 560
Ala Asp Gly Ser Glu Thr Ala Arg Thr Ile Met Gln Glu Thr Tyr Arg
565 570 575
Ala Ala Thr Glu Arg Val Met Ala Glu Leu Glu Thr Leu Gln Tyr Val
580 585 590
Asp Gln Ala Val Pro Thr Ala Met Gly Arg Leu Glu Thr Ile Ile Thr
595 600 605
Asn Arg Glu Ala Leu His Thr Val Val Asn Asn Val Arg Gln Val Val
610 615 620
Asp Arg Glu Val Glu Gln Leu Met Arg Asn Leu Val Glu Gly Arg Asn
625 630 635 640
Phe Lys Phe Arg Asp Gly Leu Gly Glu Ala Asn His Ala Met Ser Leu
645 650 655
Thr Leu Asp Pro Tyr Ala Cys Gly Pro Cys Pro Leu Leu Gln Leu Leu
660 665 670
Gly Arg Arg Ser Asn Leu Ala Val Tyr Gln Asp Leu Ala Leu Ser Gln
675 680 685
Cys His Gly Val Phe Ala Gly Gln Ser Val Glu Gly Arg Asn Phe Arg
690 695 700
Asn Gln Phe Gln Pro Val Leu Arg Arg Arg Val Met Asp Met Phe Asn
705 710 715 720
Asn Gly Phe Leu Ser Ala Lys Thr Leu Thr Val Ala Leu Ser Glu Gly
725 730 735
Ala Ala Ile Cys Ala Pro Ser Leu Thr Ala Gly Gln Thr Ala Pro Ala
740 745 750
Glu Ser Ser Phe Glu Gly Asp Val Ala Arg Val Thr Leu Gly Phe Pro
755 760 765
Lys Glu Leu Arg Val Lys Ser Arg Val Leu Phe Ala Gly Ala Ser Ala
770 775 780
Asn Ala Ser Glu Ala Ala Lys Ala Arg Val Ala Ser Leu Gln Ser Ala
785 790 795 800
Tyr Gln Lys Pro Asp Lys Arg Val Asp Ile Leu Leu Gly Pro Leu Gly
805 810 815
Phe Leu Leu Lys Gln Phe His Ala Ala Ile Phe Pro Asn Gly Lys Pro
820 825 830
Pro Gly Ser Asn Gln Pro Asn Pro Gln Trp Phe Trp Thr Ala Leu Gln
835 840 845
Arg Asn Gln Leu Pro Ala Arg Leu Leu Ser Arg Glu Asp Ile Glu Thr
850 855 860
Ile Ala Phe Ile Lys Lys Phe Ser Leu Asp Tyr Gly Ala Ile Asn Phe
865 870 875 880
Ile Asn Leu Ala Pro Asn Asn Val Ser Glu Leu Ala Met Tyr Tyr Met
885 890 895
Ala Asn Gln Ile Leu Arg Tyr Cys Asp His Ser Thr Tyr Phe Ile Asn
900 905 910
Thr Leu Thr Ala Ile Ile Ala Gly Ser Arg Arg Pro Pro Ser Val Gln
915 920 925
Ala Ala Ala Ala Trp Ser Ala Gln Gly Gly Ala Gly Leu Glu Ala Gly
930 935 940
Ala Arg Ala Leu Met Asp Ala Val Asp Ala His Pro Gly Ala Trp Thr
945 950 955 960
Ser Met Phe Ala Ser Cys Asn Leu Leu Arg Pro Val Met Ala Ala Arg
965 970 975
Pro Met Val Val Leu Gly Leu Ser Ile Ser Lys Tyr Tyr Gly Met Ala
980 985 990
Gly Asn Asp Arg Val Phe Gln Ala Gly Asn Trp Ala Ser Leu Met Gly
995 1000 1005
Gly Lys Asn Ala Cys Pro Leu Leu Ile Phe Asp Arg Thr Arg Lys
1010 1015 1020
Phe Val Leu Ala Cys Pro Arg Ala Gly Phe Val Cys Ala Ala Ser
1025 1030 1035
Ser Leu Gly Gly Gly Ala His Glu Ser Ser Leu Cys Glu Gln Leu
1040 1045 1050
Arg Gly Ile Ile Ser Glu Gly Gly Ala Ala Val Ala Ser Ser Val
1055 1060 1065
Phe Val Ala Thr Val Lys Ser Leu Gly Pro Arg Thr Gln Gln Leu
1070 1075 1080
Gln Ile Glu Asp Trp Leu Ala Leu Leu Glu Asp Glu Tyr Leu Ser
1085 1090 1095
Glu Glu Met Met Glu Leu Thr Ala Arg Ala Leu Glu Arg Gly Asn
1100 1105 1110
Gly Glu Trp Ser Thr Asp Ala Ala Leu Glu Val Ala His Glu Ala
1115 1120 1125
Glu Ala Leu Val Ser Gln Leu Gly Asn Ala Gly Glu Val Phe Asn
1130 1135 1140
Phe Gly Asp Phe Gly Cys Glu Asp Asp Asn Ala Thr Pro Phe Gly
1145 1150 1155
Gly Pro Gly Ala Pro Gly Pro Ala Phe Ala Gly Arg Lys Arg Ala
1160 1165 1170
Phe His Gly Asp Asp Pro Phe Gly Glu Gly Pro Pro Asp Lys Lys
1175 1180 1185
Gly Asp Leu Thr Leu Asp Met Leu
1190 1195
<210> 31
<211> 3591
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic polynucleotide
<400> 31
atggagacaa agcccaagac ggcaaccacc atcaaggtcc cccccgggcc cctgggatac 60
gtgtacgctc gcgcgtgtcc gtccgaaggc atcgagcttc tggcgttact gtcggcgcgc 120
agcggcgatg ccgacgtcgc cgtggcgccc ctggtcgtgg gcctgaccgt ggagagcggc 180
tttgaggcca acgtagccgt ggtcgtgggt tctcgcacga cggggctcgg gggtaccgcg 240
gtgtccctga aactgacgcc atcgcactac agctcgtccg tgtacgtctt tcacggcggc 300
cggcacctgg accccagcac ccaggcccca aacctgacgc gactctgcga gcgggcacgc 360
cgccattttg gcttttcgga ctacaccccc cggcccggcg acctcaaaca cgagacgacg 420
ggggaggcgc tgtgtgagcg cctcggcctg gacccggacc gcgccctcct gtatctggtc 480
gttaccgagg gcttcaagga ggccgtgtgc atcaacaaca cctttctgca cctgggaggc 540
tcggacaagg taaccatagg cggggcggag gtgcaccgca tacccgtgta tccgttgcag 600
ctgttcatgc cggattttag ccgggtcatc gccgagccgt tcaacgccaa ccaccgatcg 660
atcggggaga attttaccta cccgcttccg ttttttaacc gccccctcaa ccgcctcctg 720
ttcgaggcgg tcgtgggacc cgccgccgtg gcactgcgat gccgaaacgt ggacgccgtg 780
gcccgcgcgg ccgcccacct ggcgtttgac gaaaaccacg agggcgccgc cctccccgcc 840
gacattacgt tcacggcctt cgaagccagc cagggtaaga ccccgcgggg tgggcgcgac 900
ggcggcggca agggcccggc gggcgggttc gaacagcgcc tggcctccgt catggccgga 960
gacgccgccc tggccctcga gtctatcgtg tcgatggccg tcttcgacga gccgcccacc 1020
gacatctccg cgtggccgct gtgcgagggc caggacacgg ccgcggcccg cgacaacgcc 1080
gtcggggcgt acctggcgcg cgccgcggga ctcgtggggg ccatggtatt tagcaccaac 1140
tcggccctcc atctcaccga ggtggacgac gccggtccgg cggacccaaa ggaccacagc 1200
aaaccctcct tttaccgctt cttcctcgtg cccgggaccc acgtggcggc caacccacag 1260
gtggaccgcg agggacacgt ggtgcccggg ttcgagggtc ggcccaccgc gcccctcgtc 1320
ggcggaaccc aggaatttgc cggcgagcac ctggccatgc tgtgtgggtt ttccccggcg 1380
ctgctggcca agatgctgtt ttacctggag cgctgcgacg gcggcgtgat cgtcgggcgc 1440
caggagatgg acgtgtttcg atacgtcgcg gactccaacc agaccgacgt gccctgcaac 1500
ctgtgcacct tcgacacgcg ccacgcctgc gtacacacga cgctcatgcg cctccgggcg 1560
cgccatccca agttcgccag cgccgcccgc ggagccatcg gcgtcttcgg gaccatgaac 1620
agcatgtaca gcgactgcga cgtgctggga aactacgccg ccttctcggc cctgaagcgc 1680
gcggacggat ccgagaccgc ccggaccatc atgcaggaga cgtaccgcgc ggcgaccgag 1740
cgcgtcatgg ccgaactcga gaccctgcag tacgtggacc aggcggtccc cacggccatg 1800
gggcggctgg agaccatcat caccaaccgc gaggccctgc atacggtggt gaacaacgtc 1860
aggcaggtcg tggaccgcga ggtggagcag ctgatgcgca acctggtgga ggggaggaac 1920
ttcaagtttc gcgacggtct gggcgaggcc aaccacgcca tgtccctgac gctggacccg 1980
tacgcgtgcg ggccatgccc cctgcttcag cttctcgggc ggcgatccaa cctcgccgtg 2040
tatcaggacc tggccctgag ccagtgccac ggggtgttcg ccgggcagtc ggtcgagggg 2100
cgcaactttc gcaatcaatt ccaaccggtg ctgcggcggc gcgtgatgga catgtttaac 2160
aacgggtttc tgtcggccaa aacgctgacg gtcgcgctct cggagggggc ggctatctgc 2220
gcccccagcc taacggccgg ccagacggcc cccgccgaga gcagcttcga gggcgacgtt 2280
gcccgcgtga ccctggggtt tcccaaggag ctgcgcgtca agagccgcgt gttgttcgcg 2340
ggcgcgagcg ccaacgcgtc cgaggccgcc aaggcgcggg tcgccagcct ccagagcgcc 2400
taccagaagc ccgacaagcg cgtggacatc ctcctcggac cgctgggctt tctgctgaag 2460
cagttccacg cggccatctt ccccaacggc aagcccccgg ggtccaacca gccgaacccg 2520
cagtggttct ggacggccct ccaacgcaac cagcttcccg cccggctcct gtcgcgcgag 2580
gacatcgaga ccatcgcgtt cattaaaaag ttttccctgg actacggcgc gataaacttt 2640
attaacctgg cccccaacaa cgtgagcgag ctggcgatgt actacatggc aaaccagatt 2700
ctgcggtact gcgatcactc gacatacttc atcaacaccc tcacggccat catcgcgggg 2760
tcccgccgtc cccccagcgt gcaggcggcg gccgcgtggt ccgcgcaggg cggggcgggc 2820
ctggaggccg gggcccgcgc gctgatggac gccgtggacg cgcatccggg cgcgtggacg 2880
tccatgttcg ccagctgcaa cctgctgcgg cccgtcatgg cggcgcgccc catggtcgtg 2940
ttggggttga gcatcagcaa atactacggc atggccggca acgaccgtgt gtttcaggcc 3000
gggaactggg ccagcctgat gggcggcaaa aacgcgtgcc cgctccttat ttttgaccgc 3060
acccgcaagt tcgtcctggc ctgtccccgg gccgggtttg tgtgcgcggc ctcgaacctc 3120
ggcggcggag cgcacgaaag ctcgctgtgc gagcagctcc ggggcattat ctccgagggc 3180
ggggcggccg tcgccagtag cgtgttcgtg gcgaccgtga aaagcctggg gccccgcacc 3240
cagcagctgc agatcgagga ctggctggcg ctcctggagg acgagtacct aagcgaggag 3300
atgatggagc tgaccgcgcg tgccctggag cgcggcaacg gcgagtggtc gacggacgcg 3360
gccctggagg tggcgcacga ggccgaggcc ctagtcagcc aactcggcaa cgccggggag 3420
gtgtttaact ttggggattt tggctgcgag gacgacaacg cgacgccgtt cggcggcccg 3480
ggggccccgg gaccggcatt tgccggccgc aaacgggcgt tccacgggga tgacccgttt 3540
ggggaggggc cccccgacaa aaagggagac ctgacgttgg atatgctgtg a 3591
<210> 32
<211> 1196
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic polypeptide
<400> 32
Met Glu Thr Lys Pro Lys Thr Ala Thr Thr Ile Lys Val Pro Pro Gly
1 5 10 15
Pro Leu Gly Tyr Val Tyr Ala Arg Ala Cys Pro Ser Glu Gly Ile Glu
20 25 30
Leu Leu Ala Leu Leu Ser Ala Arg Ser Gly Asp Ala Asp Val Ala Val
35 40 45
Ala Pro Leu Val Val Gly Leu Thr Val Glu Ser Gly Phe Glu Ala Asn
50 55 60
Val Ala Val Val Val Gly Ser Arg Thr Thr Gly Leu Gly Gly Thr Ala
65 70 75 80
Val Ser Leu Lys Leu Thr Pro Ser His Tyr Ser Ser Ser Val Tyr Val
85 90 95
Phe His Gly Gly Arg His Leu Asp Pro Ser Thr Gln Ala Pro Asn Leu
100 105 110
Thr Arg Leu Cys Glu Arg Ala Arg Arg His Phe Gly Phe Ser Asp Tyr
115 120 125
Thr Pro Arg Pro Gly Asp Leu Lys His Glu Thr Thr Gly Glu Ala Leu
130 135 140
Cys Glu Arg Leu Gly Leu Asp Pro Asp Arg Ala Leu Leu Tyr Leu Val
145 150 155 160
Val Thr Glu Gly Phe Lys Glu Ala Val Cys Ile Asn Asn Thr Phe Leu
165 170 175
His Leu Gly Gly Ser Asp Lys Val Thr Ile Gly Gly Ala Glu Val His
180 185 190
Arg Ile Pro Val Tyr Pro Leu Gln Leu Phe Met Pro Asp Phe Ser Arg
195 200 205
Val Ile Ala Glu Pro Phe Asn Ala Asn His Arg Ser Ile Gly Glu Asn
210 215 220
Phe Thr Tyr Pro Leu Pro Phe Phe Asn Arg Pro Leu Asn Arg Leu Leu
225 230 235 240
Phe Glu Ala Val Val Gly Pro Ala Ala Val Ala Leu Arg Cys Arg Asn
245 250 255
Val Asp Ala Val Ala Arg Ala Ala Ala His Leu Ala Phe Asp Glu Asn
260 265 270
His Glu Gly Ala Ala Leu Pro Ala Asp Ile Thr Phe Thr Ala Phe Glu
275 280 285
Ala Ser Gln Gly Lys Thr Pro Arg Gly Gly Arg Asp Gly Gly Gly Lys
290 295 300
Gly Pro Ala Gly Gly Phe Glu Gln Arg Leu Ala Ser Val Met Ala Gly
305 310 315 320
Asp Ala Ala Leu Ala Leu Glu Ser Ile Val Ser Met Ala Val Phe Asp
325 330 335
Glu Pro Pro Thr Asp Ile Ser Ala Trp Pro Leu Cys Glu Gly Gln Asp
340 345 350
Thr Ala Ala Ala Arg Asp Asn Ala Val Gly Ala Tyr Leu Ala Arg Ala
355 360 365
Ala Gly Leu Val Gly Ala Met Val Phe Ser Thr Asn Ser Ala Leu His
370 375 380
Leu Thr Glu Val Asp Asp Ala Gly Pro Ala Asp Pro Lys Asp His Ser
385 390 395 400
Lys Pro Ser Phe Tyr Arg Phe Phe Leu Val Pro Gly Thr His Val Ala
405 410 415
Ala Asn Pro Gln Val Asp Arg Glu Gly His Val Val Pro Gly Phe Glu
420 425 430
Gly Arg Pro Thr Ala Pro Leu Val Gly Gly Thr Gln Glu Phe Ala Gly
435 440 445
Glu His Leu Ala Met Leu Cys Gly Phe Ser Pro Ala Leu Leu Ala Lys
450 455 460
Met Leu Phe Tyr Leu Glu Arg Cys Asp Gly Gly Val Ile Val Gly Arg
465 470 475 480
Gln Glu Met Asp Val Phe Arg Tyr Val Ala Asp Ser Asn Gln Thr Asp
485 490 495
Val Pro Cys Asn Leu Cys Thr Phe Asp Thr Arg His Ala Cys Val His
500 505 510
Thr Thr Leu Met Arg Leu Arg Ala Arg His Pro Lys Phe Ala Ser Ala
515 520 525
Ala Arg Gly Ala Ile Gly Val Phe Gly Thr Met Asn Ser Met Tyr Ser
530 535 540
Asp Cys Asp Val Leu Gly Asn Tyr Ala Ala Phe Ser Ala Leu Lys Arg
545 550 555 560
Ala Asp Gly Ser Glu Thr Ala Arg Thr Ile Met Gln Glu Thr Tyr Arg
565 570 575
Ala Ala Thr Glu Arg Val Met Ala Glu Leu Glu Thr Leu Gln Tyr Val
580 585 590
Asp Gln Ala Val Pro Thr Ala Met Gly Arg Leu Glu Thr Ile Ile Thr
595 600 605
Asn Arg Glu Ala Leu His Thr Val Val Asn Asn Val Arg Gln Val Val
610 615 620
Asp Arg Glu Val Glu Gln Leu Met Arg Asn Leu Val Glu Gly Arg Asn
625 630 635 640
Phe Lys Phe Arg Asp Gly Leu Gly Glu Ala Asn His Ala Met Ser Leu
645 650 655
Thr Leu Asp Pro Tyr Ala Cys Gly Pro Cys Pro Leu Leu Gln Leu Leu
660 665 670
Gly Arg Arg Ser Asn Leu Ala Val Tyr Gln Asp Leu Ala Leu Ser Gln
675 680 685
Cys His Gly Val Phe Ala Gly Gln Ser Val Glu Gly Arg Asn Phe Arg
690 695 700
Asn Gln Phe Gln Pro Val Leu Arg Arg Arg Val Met Asp Met Phe Asn
705 710 715 720
Asn Gly Phe Leu Ser Ala Lys Thr Leu Thr Val Ala Leu Ser Glu Gly
725 730 735
Ala Ala Ile Cys Ala Pro Ser Leu Thr Ala Gly Gln Thr Ala Pro Ala
740 745 750
Glu Ser Ser Phe Glu Gly Asp Val Ala Arg Val Thr Leu Gly Phe Pro
755 760 765
Lys Glu Leu Arg Val Lys Ser Arg Val Leu Phe Ala Gly Ala Ser Ala
770 775 780
Asn Ala Ser Glu Ala Ala Lys Ala Arg Val Ala Ser Leu Gln Ser Ala
785 790 795 800
Tyr Gln Lys Pro Asp Lys Arg Val Asp Ile Leu Leu Gly Pro Leu Gly
805 810 815
Phe Leu Leu Lys Gln Phe His Ala Ala Ile Phe Pro Asn Gly Lys Pro
820 825 830
Pro Gly Ser Asn Gln Pro Asn Pro Gln Trp Phe Trp Thr Ala Leu Gln
835 840 845
Arg Asn Gln Leu Pro Ala Arg Leu Leu Ser Arg Glu Asp Ile Glu Thr
850 855 860
Ile Ala Phe Ile Lys Lys Phe Ser Leu Asp Tyr Gly Ala Ile Asn Phe
865 870 875 880
Ile Asn Leu Ala Pro Asn Asn Val Ser Glu Leu Ala Met Tyr Tyr Met
885 890 895
Ala Asn Gln Ile Leu Arg Tyr Cys Asp His Ser Thr Tyr Phe Ile Asn
900 905 910
Thr Leu Thr Ala Ile Ile Ala Gly Ser Arg Arg Pro Pro Ser Val Gln
915 920 925
Ala Ala Ala Ala Trp Ser Ala Gln Gly Gly Ala Gly Leu Glu Ala Gly
930 935 940
Ala Arg Ala Leu Met Asp Ala Val Asp Ala His Pro Gly Ala Trp Thr
945 950 955 960
Ser Met Phe Ala Ser Cys Asn Leu Leu Arg Pro Val Met Ala Ala Arg
965 970 975
Pro Met Val Val Leu Gly Leu Ser Ile Ser Lys Tyr Tyr Gly Met Ala
980 985 990
Gly Asn Asp Arg Val Phe Gln Ala Gly Asn Trp Ala Ser Leu Met Gly
995 1000 1005
Gly Lys Asn Ala Cys Pro Leu Leu Ile Phe Asp Arg Thr Arg Lys
1010 1015 1020
Phe Val Leu Ala Cys Pro Arg Ala Gly Phe Val Cys Ala Ala Ser
1025 1030 1035
Asn Leu Gly Gly Gly Ala His Glu Ser Ser Leu Cys Glu Gln Leu
1040 1045 1050
Arg Gly Ile Ile Ser Glu Gly Gly Ala Ala Val Ala Ser Ser Val
1055 1060 1065
Phe Val Ala Thr Val Lys Ser Leu Gly Pro Arg Thr Gln Gln Leu
1070 1075 1080
Gln Ile Glu Asp Trp Leu Ala Leu Leu Glu Asp Glu Tyr Leu Ser
1085 1090 1095
Glu Glu Met Met Glu Leu Thr Ala Arg Ala Leu Glu Arg Gly Asn
1100 1105 1110
Gly Glu Trp Ser Thr Asp Ala Ala Leu Glu Val Ala His Glu Ala
1115 1120 1125
Glu Ala Leu Val Ser Gln Leu Gly Asn Ala Gly Glu Val Phe Asn
1130 1135 1140
Phe Gly Asp Phe Gly Cys Glu Asp Asp Asn Ala Thr Pro Phe Gly
1145 1150 1155
Gly Pro Gly Ala Pro Gly Pro Ala Phe Ala Gly Arg Lys Arg Ala
1160 1165 1170
Phe His Gly Asp Asp Pro Phe Gly Glu Gly Pro Pro Asp Lys Lys
1175 1180 1185
Gly Asp Leu Thr Leu Asp Met Leu
1190 1195
<210> 33
<211> 3591
<212> DNA
<213> Herpes simplex virus type 1
<400> 33
atggagacaa agcccaagac ggcaaccacc atcaaggtcc cccccgggcc cctgggatac 60
gtgtacgctc gcgcgtgtcc gtccgaaggc atcgagcttc tggcgttact gtcggcacgc 120
agcggcgatt ccgacgtcgc cgtggcgccc ctggtcgtgg gcctgaccgt ggagagcggc 180
tttgaggcca acgtggccgt ggtcgtgggt tctcgcacga cggggctcgg gggtaccgcg 240
gtgtccctga aactgacgcc ctcgcactac agctcgtccg tgtacgtctt tcacggcggc 300
cggcacctgg accccagcac ccaggccccg aacctgacgc gactttgcga gcgggcacgc 360
cgccattttg gcttttcgga ctacaccccc cggcccggcg acctcaaaca cgagacgacg 420
ggggaggcgc tgtgtgagcg cctcggcctg gacccggacc gcgccctcct gtatctggtc 480
gttaccgagg gcttcaagga ggccgtgtgc atcaacaaca cctttctgca cctgggaggc 540
tcggacaagg taaccatagg cggggcggag gtgcaccgca tacccgtgta cccgttgcag 600
ctgttcatgc cggattttag ccgtgtcatc gcagagccgt tcaacgccaa ccaccgatcg 660
atcggggaga attttaccta cccgcttccg ttttttaacc gccccctcaa ccgcctcctg 720
ttcgaggcgg tcgtgggacc cgccgccgtg gcactgcgat gccgaaacgt ggacgccgtg 780
gcccgcgcgg ccgcccacct ggcgtttgac gaaaaccacg agggcgccgc cctccccgcc 840
gacattacgt tcacggcctt cgaagccagc cagggtaaga ccccgcgggg cgggcgcgac 900
ggcggcggca agggcccggc gggcgggttc gaacagcgcc tggcctccgt catggccgga 960
gacgccgccc tggccctcga ttctatcgtg tcgatggccg tctttgacga gccgcccacc 1020
gacatctccg cgtggccgct gttcgagggc caggacacgg ccgcggcccg cgccaacgcc 1080
gtcggggcgt acctggcgcg cgccgcggga ctcgtggggg ccatggtatt tagcaccaac 1140
tcggccctcc atctcaccga ggtggacgac gccggcccgg cggacccaaa ggaccacagc 1200
aaaccctcct tttaccgctt cttcctcgtg cccgggaccc acgtggcggc caacccacag 1260
gtggaccgcg agggacacgt ggtgcccggg ttcgagggtc ggcccaccgc gcccctcgtc 1320
ggcggaaccc aggaatttgc cggcgagcac ctggccatgc tgtgtgggtt ttccccggcg 1380
ctgctggcca agatgctgtt ttacctggag cgctgcgacg gcggcgtgat cgtcgggcgc 1440
caggagatgg acgtgtttcg atacgtcgcg gactccaacc agaccgacgt gccctgtaac 1500
ctatgcacct tcgacacgcg ccacgcctgc gtacacacga cgctcatgcg cctccgggcg 1560
cgccatccaa agttcgccag cgccgcccgc ggagccatcg gcgtcttcgg gaccatgaac 1620
agcatgtaca gcgactgcga cgtgctggga aactacgccg ccttctcggc cctgaagcgc 1680
gcggacggat ccgagaccgc ccggaccatc atgcaggaga cgtaccgcgc ggcgaccgag 1740
cgcgtcatgg ccgaactcga gaccctgcag tacgtggacc aggcggtccc cacggccatg 1800
gggcggctgg agaccatcat caccaaccgc gaggccctgc atacggtggt gaacaacgtc 1860
aggcaggtcg tggaccgcga ggtggagcag ctgatgcgca acctggtgga ggggaggaac 1920
ttcaagtttc gcgacggtct gggcgaggcc aaccacgcca tgtccctgac gctggacccg 1980
tacgcgtgcg ggccgtgccc cctgcttcag cttctcgggc ggcgatccaa cctcgccgtg 2040
taccaggacc tggccctgag tcagtgccac ggggtgttcg ccgggcagtc ggtcgagggg 2100
cgcaactttc gcaatcaatt ccaaccggtg ctgcggcggc gcgtgatgga catgtttaac 2160
aacgggtttc tgtcggccaa aacgctgacg gtcgcgctct cggagggggc ggctatctgc 2220
gcccccagcc taacggccgg ccagacggcc cccgccgaga gcagcttcga gggcgacgtt 2280
gcccgcgtga ccctggggtt tcccaaggag ctgcgcgtca agagccgcgt gttgttcgcg 2340
ggcgcgagcg ccaacgcgtc cgaggccgcc aaggcgcggg tcgccagcct ccagagcgcc 2400
taccagaagc ccgacaagcg cgtggacatc ctcctcggac cgctgggctt tctgctgaag 2460
cagttccacg cggccatctt ccccaacggc aagcccccgg ggtccaacca gccgaacccg 2520
cagtggttct ggacggccct ccaacgcaac cagcttcccg cccggctcct gtcgcgcgag 2580
gacatcgaga ccatcgcgtt cattaaaaag ttttccctgg actacggcgc gataaacttt 2640
attaacctgg cccccaacaa cgtgagcgag ctggcgatgt actacatggc aaaccagatt 2700
ctgcggtact gcgatcactc gacatacttc atcaacaccc ttacggccat catcgcgggg 2760
tcccgccgtc cccccagcgt gcaggctgcg gccgcgtggt ccgcgcaggg cggggcgggc 2820
ctggaggccg gggcccgcgc gctgatggac gccgtggacg cgcatccggg cgcgtggacg 2880
tccatgttcg ccagctgcaa cctgctgcgg cccgtcatgg cggcgcgccc catggtcgtg 2940
ttggggttga gcatcagcaa gtactacggc atggccggca acgaccgtgt gtttcaggcc 3000
gggaactggg ccagcctgat gggcggcaaa aacgcgtgcc cgctccttat ttttgaccgc 3060
acccgcaagt tcgtcctggc ctgtccccgg gccgggtttg tgtgcgcggc ctcaagcctc 3120
ggcggcggag cgcacgaaag ctcgctgtgc gagcagctcc ggggcattat ctccgagggc 3180
ggggcggccg tcgccagtag cgtgttcgtg gcgaccgtga aaagcctggg gccccgcacc 3240
cagcagctgc agatcgagga ctggctggcg ctcctggagg acgagtacct aagcgaggag 3300
atgatggagc tgaccgcgcg tgccctggag cgcggcaacg gcgagtggtc gacggacgcg 3360
gccctggagg tggcgcacga ggccgaggcc ctagtcagcc aactcggcaa cgccggggag 3420
gtgtttaact ttggggattt tggctgcgag gacgacaacg cgacgccgtt cggcggcccg 3480
ggggccccgg gaccggcatt tgccggccgc aaacgggcgt tccacgggga tgacccgttt 3540
ggggaggggc cccccgacaa aaagggagac ctgacgttgg atatgctgtg a 3591
<210> 34
<211> 1196
<212> PRT
<213> Herpes simplex virus type 1
<400> 34
Met Glu Thr Lys Pro Lys Thr Ala Thr Thr Ile Lys Val Pro Pro Gly
1 5 10 15
Pro Leu Gly Tyr Val Tyr Ala Arg Ala Cys Pro Ser Glu Gly Ile Glu
20 25 30
Leu Leu Ala Leu Leu Ser Ala Arg Ser Gly Asp Ser Asp Val Ala Val
35 40 45
Ala Pro Leu Val Val Gly Leu Thr Val Glu Ser Gly Phe Glu Ala Asn
50 55 60
Val Ala Val Val Val Gly Ser Arg Thr Thr Gly Leu Gly Gly Thr Ala
65 70 75 80
Val Ser Leu Lys Leu Thr Pro Ser His Tyr Ser Ser Ser Val Tyr Val
85 90 95
Phe His Gly Gly Arg His Leu Asp Pro Ser Thr Gln Ala Pro Asn Leu
100 105 110
Thr Arg Leu Cys Glu Arg Ala Arg Arg His Phe Gly Phe Ser Asp Tyr
115 120 125
Thr Pro Arg Pro Gly Asp Leu Lys His Glu Thr Thr Gly Glu Ala Leu
130 135 140
Cys Glu Arg Leu Gly Leu Asp Pro Asp Arg Ala Leu Leu Tyr Leu Val
145 150 155 160
Val Thr Glu Gly Phe Lys Glu Ala Val Cys Ile Asn Asn Thr Phe Leu
165 170 175
His Leu Gly Gly Ser Asp Lys Val Thr Ile Gly Gly Ala Glu Val His
180 185 190
Arg Ile Pro Val Tyr Pro Leu Gln Leu Phe Met Pro Asp Phe Ser Arg
195 200 205
Val Ile Ala Glu Pro Phe Asn Ala Asn His Arg Ser Ile Gly Glu Asn
210 215 220
Phe Thr Tyr Pro Leu Pro Phe Phe Asn Arg Pro Leu Asn Arg Leu Leu
225 230 235 240
Phe Glu Ala Val Val Gly Pro Ala Ala Val Ala Leu Arg Cys Arg Asn
245 250 255
Val Asp Ala Val Ala Arg Ala Ala Ala His Leu Ala Phe Asp Glu Asn
260 265 270
His Glu Gly Ala Ala Leu Pro Ala Asp Ile Thr Phe Thr Ala Phe Glu
275 280 285
Ala Ser Gln Gly Lys Thr Pro Arg Gly Gly Arg Asp Gly Gly Gly Lys
290 295 300
Gly Pro Ala Gly Gly Phe Glu Gln Arg Leu Ala Ser Val Met Ala Gly
305 310 315 320
Asp Ala Ala Leu Ala Leu Asp Ser Ile Val Ser Met Ala Val Phe Asp
325 330 335
Glu Pro Pro Thr Asp Ile Ser Ala Trp Pro Leu Phe Glu Gly Gln Asp
340 345 350
Thr Ala Ala Ala Arg Ala Asn Ala Val Gly Ala Tyr Leu Ala Arg Ala
355 360 365
Ala Gly Leu Val Gly Ala Met Val Phe Ser Thr Asn Ser Ala Leu His
370 375 380
Leu Thr Glu Val Asp Asp Ala Gly Pro Ala Asp Pro Lys Asp His Ser
385 390 395 400
Lys Pro Ser Phe Tyr Arg Phe Phe Leu Val Pro Gly Thr His Val Ala
405 410 415
Ala Asn Pro Gln Val Asp Arg Glu Gly His Val Val Pro Gly Phe Glu
420 425 430
Gly Arg Pro Thr Ala Pro Leu Val Gly Gly Thr Gln Glu Phe Ala Gly
435 440 445
Glu His Leu Ala Met Leu Cys Gly Phe Ser Pro Ala Leu Leu Ala Lys
450 455 460
Met Leu Phe Tyr Leu Glu Arg Cys Asp Gly Gly Val Ile Val Gly Arg
465 470 475 480
Gln Glu Met Asp Val Phe Arg Tyr Val Ala Asp Ser Asn Gln Thr Asp
485 490 495
Val Pro Cys Asn Leu Cys Thr Phe Asp Thr Arg His Ala Cys Val His
500 505 510
Thr Thr Leu Met Arg Leu Arg Ala Arg His Pro Lys Phe Ala Ser Ala
515 520 525
Ala Arg Gly Ala Ile Gly Val Phe Gly Thr Met Asn Ser Met Tyr Ser
530 535 540
Asp Cys Asp Val Leu Gly Asn Tyr Ala Ala Phe Ser Ala Leu Lys Arg
545 550 555 560
Ala Asp Gly Ser Glu Thr Ala Arg Thr Ile Met Gln Glu Thr Tyr Arg
565 570 575
Ala Ala Thr Glu Arg Val Met Ala Glu Leu Glu Thr Leu Gln Tyr Val
580 585 590
Asp Gln Ala Val Pro Thr Ala Met Gly Arg Leu Glu Thr Ile Ile Thr
595 600 605
Asn Arg Glu Ala Leu His Thr Val Val Asn Asn Val Arg Gln Val Val
610 615 620
Asp Arg Glu Val Glu Gln Leu Met Arg Asn Leu Val Glu Gly Arg Asn
625 630 635 640
Phe Lys Phe Arg Asp Gly Leu Gly Glu Ala Asn His Ala Met Ser Leu
645 650 655
Thr Leu Asp Pro Tyr Ala Cys Gly Pro Cys Pro Leu Leu Gln Leu Leu
660 665 670
Gly Arg Arg Ser Asn Leu Ala Val Tyr Gln Asp Leu Ala Leu Ser Gln
675 680 685
Cys His Gly Val Phe Ala Gly Gln Ser Val Glu Gly Arg Asn Phe Arg
690 695 700
Asn Gln Phe Gln Pro Val Leu Arg Arg Arg Val Met Asp Met Phe Asn
705 710 715 720
Asn Gly Phe Leu Ser Ala Lys Thr Leu Thr Val Ala Leu Ser Glu Gly
725 730 735
Ala Ala Ile Cys Ala Pro Ser Leu Thr Ala Gly Gln Thr Ala Pro Ala
740 745 750
Glu Ser Ser Phe Glu Gly Asp Val Ala Arg Val Thr Leu Gly Phe Pro
755 760 765
Lys Glu Leu Arg Val Lys Ser Arg Val Leu Phe Ala Gly Ala Ser Ala
770 775 780
Asn Ala Ser Glu Ala Ala Lys Ala Arg Val Ala Ser Leu Gln Ser Ala
785 790 795 800
Tyr Gln Lys Pro Asp Lys Arg Val Asp Ile Leu Leu Gly Pro Leu Gly
805 810 815
Phe Leu Leu Lys Gln Phe His Ala Ala Ile Phe Pro Asn Gly Lys Pro
820 825 830
Pro Gly Ser Asn Gln Pro Asn Pro Gln Trp Phe Trp Thr Ala Leu Gln
835 840 845
Arg Asn Gln Leu Pro Ala Arg Leu Leu Ser Arg Glu Asp Ile Glu Thr
850 855 860
Ile Ala Phe Ile Lys Lys Phe Ser Leu Asp Tyr Gly Ala Ile Asn Phe
865 870 875 880
Ile Asn Leu Ala Pro Asn Asn Val Ser Glu Leu Ala Met Tyr Tyr Met
885 890 895
Ala Asn Gln Ile Leu Arg Tyr Cys Asp His Ser Thr Tyr Phe Ile Asn
900 905 910
Thr Leu Thr Ala Ile Ile Ala Gly Ser Arg Arg Pro Pro Ser Val Gln
915 920 925
Ala Ala Ala Ala Trp Ser Ala Gln Gly Gly Ala Gly Leu Glu Ala Gly
930 935 940
Ala Arg Ala Leu Met Asp Ala Val Asp Ala His Pro Gly Ala Trp Thr
945 950 955 960
Ser Met Phe Ala Ser Cys Asn Leu Leu Arg Pro Val Met Ala Ala Arg
965 970 975
Pro Met Val Val Leu Gly Leu Ser Ile Ser Lys Tyr Tyr Gly Met Ala
980 985 990
Gly Asn Asp Arg Val Phe Gln Ala Gly Asn Trp Ala Ser Leu Met Gly
995 1000 1005
Gly Lys Asn Ala Cys Pro Leu Leu Ile Phe Asp Arg Thr Arg Lys
1010 1015 1020
Phe Val Leu Ala Cys Pro Arg Ala Gly Phe Val Cys Ala Ala Ser
1025 1030 1035
Ser Leu Gly Gly Gly Ala His Glu Ser Ser Leu Cys Glu Gln Leu
1040 1045 1050
Arg Gly Ile Ile Ser Glu Gly Gly Ala Ala Val Ala Ser Ser Val
1055 1060 1065
Phe Val Ala Thr Val Lys Ser Leu Gly Pro Arg Thr Gln Gln Leu
1070 1075 1080
Gln Ile Glu Asp Trp Leu Ala Leu Leu Glu Asp Glu Tyr Leu Ser
1085 1090 1095
Glu Glu Met Met Glu Leu Thr Ala Arg Ala Leu Glu Arg Gly Asn
1100 1105 1110
Gly Glu Trp Ser Thr Asp Ala Ala Leu Glu Val Ala His Glu Ala
1115 1120 1125
Glu Ala Leu Val Ser Gln Leu Gly Asn Ala Gly Glu Val Phe Asn
1130 1135 1140
Phe Gly Asp Phe Gly Cys Glu Asp Asp Asn Ala Thr Pro Phe Gly
1145 1150 1155
Gly Pro Gly Ala Pro Gly Pro Ala Phe Ala Gly Arg Lys Arg Ala
1160 1165 1170
Phe His Gly Asp Asp Pro Phe Gly Glu Gly Pro Pro Asp Lys Lys
1175 1180 1185
Gly Asp Leu Thr Leu Asp Met Leu
1190 1195
<210> 35
<211> 2208
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic polynucleotide
<220>
<221> mutation
<222> (1126)..(1126)
<223> g1126a
<400> 35
atgtttggtc agcagctggc gtccgacgtc cagcagtacc tggagcgcct cgagaaacag 60
aggcaactta aggtgggcgc ggacgaggcg tcggcgggcc tcaccatggg cggcgatgcc 120
ctacgagtgc cctttttaga tttcgcgacc gcgaccccca agcgccacca gaccgtggtc 180
cctggcgtcg ggacgctcca cgactgctgc gagcactcgc cgctcttctc ggccgtggcg 240
cggcggctgc tgtttaatag cctggtgccg gcgcaactaa aggggcgtga tttcgggggc 300
gaccacacgg ccaagctgga attcctggcc cccgagttgg tacgggcggt ggcgcgactg 360
cggtttaagg agtgcgcgcc ggcggacgtg gtgcctcagc gtaacgccta ctatagcgtt 420
ctgaatacgt ttcaggccct ccaccgctcc gaagcctttc gccagctggt gcactttgtg 480
cgggactttg cccagctgct caaaacctcc ttccgggcct ccagcctcac ggagaccacg 540
ggccccccca aaaaacgggc caaggtggac gtggccaccc acggccggac gtacggcacg 600
ctggagctgt tccaaaaaat gatccttatg cacgccacct actttctggc cgccgtgctc 660
ctcggggacc acgcggagca ggtcaacacg ttcctgcgtc tcgtgtttga gatccccctg 720
tttagcgacg cggccgtgcg ccacttccgc cagcgcgcca ccgtgtttct cgtcccccgg 780
cgccacggca agacctggtt tctggtgccc ctcatcgcgc tgtcgctggc ctcctttcgg 840
gggatcaaga tcggctacac ggcgcacatc cgcaaggcga ccgagccggt gtttgaggag 900
atcgacgcct gcctgcgggg ctggttcggt tcggcccgag tggaccacgt taaaggggaa 960
accatctcct tctcgtttcc ggacgggtcg cgcagtacca tcgtgtttgc ctccagccac 1020
aacacaaacg gaatccgagg ccaggacttt aacctgctct ttgtcgacga ggccaacttt 1080
attcgcccgg atgcggtcca gacgattatg ggctttctca accagaccaa ctgcaagatt 1140
atcttcgtgt cgtccaccaa caccgggaag gccagtacga gctttttgta caacctccgc 1200
ggggccgcag acgagcttct caacgtggtg acctatatat gcgatgatca catgccgagg 1260
gtggtgacgc acacaaacgc cacggcctgt tcttgttata tcctcaacaa gcccgttttc 1320
atcacgatgg acggggcggt tcgccggacc gccgatttgt ttctggccga ttccttcatg 1380
caggagatca tcgggggcca ggccagggag accggcgacg accggcccgt tctgaccaag 1440
tctgcggggg agcggtttct gttgtaccgc ccctcgacca ccaccaacag cggcctcatg 1500
gcccccgatt tgtacgtgta cgtggatccc gcgttcacgg ccaacacccg agcctccggg 1560
accggcgtcg ctgtcgtcgg gcggtaccgc gacgattata tcatcttcgc cctggagcac 1620
ttttttctcc gcgcgctcac gggctcggcc cccgccgaca tcgcccgctg cgtcgtccac 1680
agtctgacgc aggtcctggc cctgcatccc ggggcgtttc gcggcgtccg ggtggcggtc 1740
gagggaaata gcagccagga ctcggccgtc gccatcgcca cgcacgtgca cacagagatg 1800
caccgcctac tggcctcgga gggggccgac gcgggctcgg gccccgagct tctcttctac 1860
cactgcgagc ctcccgggag cgcggtgctg tacccctttt tcctgctcaa caaacagaag 1920
acgcccgcct ttgaacactt tattaaaaag tttaactccg ggggcgtcat ggcctcccag 1980
gagatcgttt ccgcgacggt gcgcctgcag accgacccgg tcgagtatct gctcgagcag 2040
ctaaataacc tcaccgaaac cgtctccccc aacactgacg tccgtacgta ttccggaaaa 2100
cggaacggcg cctcggatga ccttatggtc gccgtcatta tggccatcta cctcgcggcc 2160
caggccggac ctccgcacac attcgctcct atcatacgcg tctcgtga 2208
<210> 36
<211> 735
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic polypeptide
<220>
<221> MISC_FEATURE
<222> (376)..(376)
<223> A376T
<400> 36
Met Phe Gly Gln Gln Leu Ala Ser Asp Val Gln Gln Tyr Leu Glu Arg
1 5 10 15
Leu Glu Lys Gln Arg Gln Leu Lys Val Gly Ala Asp Glu Ala Ser Ala
20 25 30
Gly Leu Thr Met Gly Gly Asp Ala Leu Arg Val Pro Phe Leu Asp Phe
35 40 45
Ala Thr Ala Thr Pro Lys Arg His Gln Thr Val Val Pro Gly Val Gly
50 55 60
Thr Leu His Asp Cys Cys Glu His Ser Pro Leu Phe Ser Ala Val Ala
65 70 75 80
Arg Arg Leu Leu Phe Asn Ser Leu Val Pro Ala Gln Leu Lys Gly Arg
85 90 95
Asp Phe Gly Gly Asp His Thr Ala Lys Leu Glu Phe Leu Ala Pro Glu
100 105 110
Leu Val Arg Ala Val Ala Arg Leu Arg Phe Lys Glu Cys Ala Pro Ala
115 120 125
Asp Val Val Pro Gln Arg Asn Ala Tyr Tyr Ser Val Leu Asn Thr Phe
130 135 140
Gln Ala Leu His Arg Ser Glu Ala Phe Arg Gln Leu Val His Phe Val
145 150 155 160
Arg Asp Phe Ala Gln Leu Leu Lys Thr Ser Phe Arg Ala Ser Ser Leu
165 170 175
Thr Glu Thr Thr Gly Pro Pro Lys Lys Arg Ala Lys Val Asp Val Ala
180 185 190
Thr His Gly Arg Thr Tyr Gly Thr Leu Glu Leu Phe Gln Lys Met Ile
195 200 205
Leu Met His Ala Thr Tyr Phe Leu Ala Ala Val Leu Leu Gly Asp His
210 215 220
Ala Glu Gln Val Asn Thr Phe Leu Arg Leu Val Phe Glu Ile Pro Leu
225 230 235 240
Phe Ser Asp Ala Ala Val Arg His Phe Arg Gln Arg Ala Thr Val Phe
245 250 255
Leu Val Pro Arg Arg His Gly Lys Thr Trp Phe Leu Val Pro Leu Ile
260 265 270
Ala Leu Ser Leu Ala Ser Phe Arg Gly Ile Lys Ile Gly Tyr Thr Ala
275 280 285
His Ile Arg Lys Ala Thr Glu Pro Val Phe Glu Glu Ile Asp Ala Cys
290 295 300
Leu Arg Gly Trp Phe Gly Ser Ala Arg Val Asp His Val Lys Gly Glu
305 310 315 320
Thr Ile Ser Phe Ser Phe Pro Asp Gly Ser Arg Ser Thr Ile Val Phe
325 330 335
Ala Ser Ser His Asn Thr Asn Gly Ile Arg Gly Gln Asp Phe Asn Leu
340 345 350
Leu Phe Val Asp Glu Ala Asn Phe Ile Arg Pro Asp Ala Val Gln Thr
355 360 365
Ile Met Gly Phe Leu Asn Gln Thr Asn Cys Lys Ile Ile Phe Val Ser
370 375 380
Ser Thr Asn Thr Gly Lys Ala Ser Thr Ser Phe Leu Tyr Asn Leu Arg
385 390 395 400
Gly Ala Ala Asp Glu Leu Leu Asn Val Val Thr Tyr Ile Cys Asp Asp
405 410 415
His Met Pro Arg Val Val Thr His Thr Asn Ala Thr Ala Cys Ser Cys
420 425 430
Tyr Ile Leu Asn Lys Pro Val Phe Ile Thr Met Asp Gly Ala Val Arg
435 440 445
Arg Thr Ala Asp Leu Phe Leu Ala Asp Ser Phe Met Gln Glu Ile Ile
450 455 460
Gly Gly Gln Ala Arg Glu Thr Gly Asp Asp Arg Pro Val Leu Thr Lys
465 470 475 480
Ser Ala Gly Glu Arg Phe Leu Leu Tyr Arg Pro Ser Thr Thr Thr Asn
485 490 495
Ser Gly Leu Met Ala Pro Asp Leu Tyr Val Tyr Val Asp Pro Ala Phe
500 505 510
Thr Ala Asn Thr Arg Ala Ser Gly Thr Gly Val Ala Val Val Gly Arg
515 520 525
Tyr Arg Asp Asp Tyr Ile Ile Phe Ala Leu Glu His Phe Phe Leu Arg
530 535 540
Ala Leu Thr Gly Ser Ala Pro Ala Asp Ile Ala Arg Cys Val Val His
545 550 555 560
Ser Leu Thr Gln Val Leu Ala Leu His Pro Gly Ala Phe Arg Gly Val
565 570 575
Arg Val Ala Val Glu Gly Asn Ser Ser Gln Asp Ser Ala Val Ala Ile
580 585 590
Ala Thr His Val His Thr Glu Met His Arg Leu Leu Ala Ser Glu Gly
595 600 605
Ala Asp Ala Gly Ser Gly Pro Glu Leu Leu Phe Tyr His Cys Glu Pro
610 615 620
Pro Gly Ser Ala Val Leu Tyr Pro Phe Phe Leu Leu Asn Lys Gln Lys
625 630 635 640
Thr Pro Ala Phe Glu His Phe Ile Lys Lys Phe Asn Ser Gly Gly Val
645 650 655
Met Ala Ser Gln Glu Ile Val Ser Ala Thr Val Arg Leu Gln Thr Asp
660 665 670
Pro Val Glu Tyr Leu Leu Glu Gln Leu Asn Asn Leu Thr Glu Thr Val
675 680 685
Ser Pro Asn Thr Asp Val Arg Thr Tyr Ser Gly Lys Arg Asn Gly Ala
690 695 700
Ser Asp Asp Leu Met Val Ala Val Ile Met Ala Ile Tyr Leu Ala Ala
705 710 715 720
Gln Ala Gly Pro Pro His Thr Phe Ala Pro Ile Ile Arg Val Ser
725 730 735
<210> 37
<211> 2208
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic polynucleotide
<400> 37
atgtttggtc agcagctggc gtccgacgtc cagcagtacc tggagcgcct cgagaaacag 60
aggcaactta aggtgggcgc ggacgaggcg tcggcgggcc tcaccatggg cggcgatgcc 120
ctacgagtgc cctttttaga tttcgcgacc gcgaccccca agcgccacca gaccgtggtc 180
cctggcgtcg ggacgctcca cgactgctgc gagcactcgc cgctcttctc ggccgtggcg 240
cggcggctgc tgtttaatag cctggtgccg gcgcaactaa aggggcgtga tttcgggggc 300
gaccacacgg ccaagctgga attcctggcc cccgagttgg tacgggcggt ggcgcgactg 360
cggtttaagg agtgcgcgcc ggcggacgtg gtgcctcagc gtaacgccta ctatagcgtt 420
ctgaatacgt ttcaggccct ccaccgctcc gaagcctttc gccagctggt gcactttgtg 480
cgggactttg cccagctgct caaaacctcc ttccgggcct ccagcctcac ggagaccacg 540
ggccccccca aaaaacgggc caaggtggac gtggccaccc acggccggac gtacggcacg 600
ctggagctgt tccaaaaaat gatccttatg cacgccacct actttctggc cgccgtgctc 660
ctcggggacc acgcggagca ggtcaacacg ttcctgcgtc tcgtgtttga gatccccctg 720
tttagcgacg cggccgtgcg ccacttccgc cagcgcgcca ccgtgtttct cgtcccccgg 780
cgccacggca agacctggtt tctggtgccc ctcatcgcgc tgtcgctggc ctcctttcgg 840
gggatcaaga tcggctacac ggcgcacatc cgcaaggcga ccgagccggt gtttgaggag 900
atcgacgcct gcctgcgggg ctggttcggt tcggcccgag tggaccacgt taaaggggaa 960
accatctcct tctcgtttcc ggacgggtcg cgcagtacca tcgtgtttgc ctccagccac 1020
aacacaaacg gaatccgagg ccaggacttt aacctgctct ttgtcgacga ggccaacttt 1080
attcgcccgg atgcggtcca gacgattatg ggctttctca accaggccaa ctgcaagatt 1140
atcttcgtgt cgtccaccaa caccgggaag gccagtacga gctttttgta caacctccgc 1200
ggggccgcag acgagcttct caacgtggtg acctatatat gcgatgatca catgccgagg 1260
gtggtgacgc acacaaacgc cacggcctgt tcttgttata tcctcaacaa gcccgttttc 1320
atcacgatgg acggggcggt tcgccggacc gccgatttgt ttctggccga ttccttcatg 1380
caggagatca tcgggggcca ggccagggag accggcgacg accggcccgt tctgaccaag 1440
tctgcggggg agcggtttct gttgtaccgc ccctcgacca ccaccaacag cggcctcatg 1500
gcccccgatt tgtacgtgta cgtggatccc gcgttcacgg ccaacacccg agcctccggg 1560
accggcgtcg ctgtcgtcgg gcggtaccgc gacgattata tcatcttcgc cctggagcac 1620
ttttttctcc gcgcgctcac gggctcggcc cccgccgaca tcgcccgctg cgtcgtccac 1680
agtctgacgc aggtcctggc cctgcatccc ggggcgtttc gcggcgtccg ggtggcggtc 1740
gagggaaata gcagccagga ctcggccgtc gccatcgcca cgcacgtgca cacagagatg 1800
caccgcctac tggcctcgga gggggccgac gcgggctcgg gccccgagct tctcttctac 1860
cactgcgagc ctcccgggag cgcggtgctg tacccctttt tcctgctcaa caaacagaag 1920
acgcccgcct ttgaacactt tattaaaaag tttaactccg ggggcgtcat ggcctcccag 1980
gagatcgttt ccgcgacggt gcgcctgcag accgacccgg tcgagtatct gctcgagcag 2040
ctaaataacc tcaccgaaac cgtctccccc aacactgacg tccgtacgta ttccggaaaa 2100
cggaacggcg cctcggatga ccttatggtc gccgtcatta tggccatcta cctcgcggcc 2160
caggccggac ctccgcacac attcgctcct atcatacgcg tctcgtga 2208
<210> 38
<211> 735
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic polypeptide
<400> 38
Met Phe Gly Gln Gln Leu Ala Ser Asp Val Gln Gln Tyr Leu Glu Arg
1 5 10 15
Leu Glu Lys Gln Arg Gln Leu Lys Val Gly Ala Asp Glu Ala Ser Ala
20 25 30
Gly Leu Thr Met Gly Gly Asp Ala Leu Arg Val Pro Phe Leu Asp Phe
35 40 45
Ala Thr Ala Thr Pro Lys Arg His Gln Thr Val Val Pro Gly Val Gly
50 55 60
Thr Leu His Asp Cys Cys Glu His Ser Pro Leu Phe Ser Ala Val Ala
65 70 75 80
Arg Arg Leu Leu Phe Asn Ser Leu Val Pro Ala Gln Leu Lys Gly Arg
85 90 95
Asp Phe Gly Gly Asp His Thr Ala Lys Leu Glu Phe Leu Ala Pro Glu
100 105 110
Leu Val Arg Ala Val Ala Arg Leu Arg Phe Lys Glu Cys Ala Pro Ala
115 120 125
Asp Val Val Pro Gln Arg Asn Ala Tyr Tyr Ser Val Leu Asn Thr Phe
130 135 140
Gln Ala Leu His Arg Ser Glu Ala Phe Arg Gln Leu Val His Phe Val
145 150 155 160
Arg Asp Phe Ala Gln Leu Leu Lys Thr Ser Phe Arg Ala Ser Ser Leu
165 170 175
Thr Glu Thr Thr Gly Pro Pro Lys Lys Arg Ala Lys Val Asp Val Ala
180 185 190
Thr His Gly Arg Thr Tyr Gly Thr Leu Glu Leu Phe Gln Lys Met Ile
195 200 205
Leu Met His Ala Thr Tyr Phe Leu Ala Ala Val Leu Leu Gly Asp His
210 215 220
Ala Glu Gln Val Asn Thr Phe Leu Arg Leu Val Phe Glu Ile Pro Leu
225 230 235 240
Phe Ser Asp Ala Ala Val Arg His Phe Arg Gln Arg Ala Thr Val Phe
245 250 255
Leu Val Pro Arg Arg His Gly Lys Thr Trp Phe Leu Val Pro Leu Ile
260 265 270
Ala Leu Ser Leu Ala Ser Phe Arg Gly Ile Lys Ile Gly Tyr Thr Ala
275 280 285
His Ile Arg Lys Ala Thr Glu Pro Val Phe Glu Glu Ile Asp Ala Cys
290 295 300
Leu Arg Gly Trp Phe Gly Ser Ala Arg Val Asp His Val Lys Gly Glu
305 310 315 320
Thr Ile Ser Phe Ser Phe Pro Asp Gly Ser Arg Ser Thr Ile Val Phe
325 330 335
Ala Ser Ser His Asn Thr Asn Gly Ile Arg Gly Gln Asp Phe Asn Leu
340 345 350
Leu Phe Val Asp Glu Ala Asn Phe Ile Arg Pro Asp Ala Val Gln Thr
355 360 365
Ile Met Gly Phe Leu Asn Gln Ala Asn Cys Lys Ile Ile Phe Val Ser
370 375 380
Ser Thr Asn Thr Gly Lys Ala Ser Thr Ser Phe Leu Tyr Asn Leu Arg
385 390 395 400
Gly Ala Ala Asp Glu Leu Leu Asn Val Val Thr Tyr Ile Cys Asp Asp
405 410 415
His Met Pro Arg Val Val Thr His Thr Asn Ala Thr Ala Cys Ser Cys
420 425 430
Tyr Ile Leu Asn Lys Pro Val Phe Ile Thr Met Asp Gly Ala Val Arg
435 440 445
Arg Thr Ala Asp Leu Phe Leu Ala Asp Ser Phe Met Gln Glu Ile Ile
450 455 460
Gly Gly Gln Ala Arg Glu Thr Gly Asp Asp Arg Pro Val Leu Thr Lys
465 470 475 480
Ser Ala Gly Glu Arg Phe Leu Leu Tyr Arg Pro Ser Thr Thr Thr Asn
485 490 495
Ser Gly Leu Met Ala Pro Asp Leu Tyr Val Tyr Val Asp Pro Ala Phe
500 505 510
Thr Ala Asn Thr Arg Ala Ser Gly Thr Gly Val Ala Val Val Gly Arg
515 520 525
Tyr Arg Asp Asp Tyr Ile Ile Phe Ala Leu Glu His Phe Phe Leu Arg
530 535 540
Ala Leu Thr Gly Ser Ala Pro Ala Asp Ile Ala Arg Cys Val Val His
545 550 555 560
Ser Leu Thr Gln Val Leu Ala Leu His Pro Gly Ala Phe Arg Gly Val
565 570 575
Arg Val Ala Val Glu Gly Asn Ser Ser Gln Asp Ser Ala Val Ala Ile
580 585 590
Ala Thr His Val His Thr Glu Met His Arg Leu Leu Ala Ser Glu Gly
595 600 605
Ala Asp Ala Gly Ser Gly Pro Glu Leu Leu Phe Tyr His Cys Glu Pro
610 615 620
Pro Gly Ser Ala Val Leu Tyr Pro Phe Phe Leu Leu Asn Lys Gln Lys
625 630 635 640
Thr Pro Ala Phe Glu His Phe Ile Lys Lys Phe Asn Ser Gly Gly Val
645 650 655
Met Ala Ser Gln Glu Ile Val Ser Ala Thr Val Arg Leu Gln Thr Asp
660 665 670
Pro Val Glu Tyr Leu Leu Glu Gln Leu Asn Asn Leu Thr Glu Thr Val
675 680 685
Ser Pro Asn Thr Asp Val Arg Thr Tyr Ser Gly Lys Arg Asn Gly Ala
690 695 700
Ser Asp Asp Leu Met Val Ala Val Ile Met Ala Ile Tyr Leu Ala Ala
705 710 715 720
Gln Ala Gly Pro Pro His Thr Phe Ala Pro Ile Ile Arg Val Ser
725 730 735
<210> 39
<211> 2208
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic polynucleotide
<400> 39
atgtttggtc agcagctggc gtccgacgtc cagcagtacc tggagcgcct cgagaaacag 60
aggcaactta aggtgggcgc ggacgaggcg tcggcgggcc tcacaatggg cggcgatgcc 120
ctacgagtgc cctttttaga tttcgcgacc gcgaccccca agcgccacca gaccgtggtc 180
ccgggcgtcg ggacgctcca cgactgctgc gagcactcgc cgctcttctc ggccgtggcg 240
cggcggctgc tgtttaatag cctggtgccg gcgcaactaa aggggcgtga tttcgggggc 300
gaccacacgg ccaagctgga attcctggcc cccgagttgg tacgggcggt ggcgcgactg 360
cggtttaagg agtgcgcgcc ggcggacgtg gtgcctcagc gtaacgccta ctatagcgtt 420
ctgaacacgt ttcaggccct ccaccgctcc gaagcctttc gccagctggt gcactttgtg 480
cgggactttg cccagctgct taaaacctcc ttccgggcct ccagcctcac ggagaccacg 540
ggccccccaa aaaaacgggc caaggtggac gtggccaccc acggccggac gtacggcacg 600
ctggagctgt tccaaaaaat gatccttatg cacgccacct actttctggc cgccgtgctc 660
ctcggggacc acgcggagca ggtcaacacg ttcctgcgtc tcgtgtttga gatccccctg 720
tttagcgacg cggccgtgcg ccacttccgc cagcgcgcca ccgtgtttct cgtcccccgg 780
cgccacggca agacctggtt tctagtgccc ctcatcgcgc tgtcgctggc ctcctttcgg 840
gggatcaaga tcggctacac ggcgcacatc cgcaaggcga ccgagccggt gtttgaggag 900
atcgacgcct gcctgcgggg ctggttcggt tcggcccgag tggaccacgt taaaggggaa 960
accatctcct tctcgtttcc ggacgggtcg cgcagtacca tcgtgtttgc ctccagccac 1020
aacacaaacg gaatccgagg ccaggacttt aacctgctct ttgtcgacga ggccaacttt 1080
attcgcccgg atgcggtcca gacgattatg ggctttctca accaggccaa ctgcaagatt 1140
atcttcgtgt cgtccaccaa caccgggaag gccagtacga gctttttgta caacctccgc 1200
ggggccgccg acgagcttct caacgtggtg acctatatat gcgatgatca catgccgcgg 1260
gtggtgacgc acacaaacgc cacggcctgt tcttgttata tcctcaacaa gcccgttttc 1320
atcacgatgg acggggcggt tcgccggacc gccgatttgt ttctggccga ttccttcatg 1380
caggagatca tcgggggcca ggccagggag accggcgacg accggcccgt tctgaccaag 1440
tctgcggggg agcggtttct gttgtaccgc ccctcgacca ccaccaacag cggcctcatg 1500
gcccccgatt tgtacgtgta cgtggatccc gcgttcacgg ccaacacccg agcctccggg 1560
accggcgtcg ctgtcgtcgg gcggtaccgc gacgattata tcatcttcgc cctggagcac 1620
ttttttctcc gcgcgctcac gggctcggcc cccgccgaca tcgcccgctg cgtcgtccac 1680
agtctgacgc aggtcctggc cctgcatccc ggggcgtttc gcggcgtccg ggtggcggtc 1740
gagggaaata gcagccagga ctcggccgtc gccatcgcca cgcacgtgca cacagagatg 1800
caccgcctac tggcctcgga gggggccgac gcgggctcgg gccccgagct tctcttctac 1860
cactgcgagc ctcccgggag cgcggtgctg tacccctttt tcctgctcaa caaacagaag 1920
acgcccgcct ttgaacactt tattaaaaag tttaactccg ggggcgtcat ggcctcccag 1980
gagatcgttt ccgcgacggt gcgcctgcag accgacccgg tcgagtatct gctcgagcag 2040
ctgaataacc tcaccgaaac cgtctccccc aacacggacg tccgtacgta ttccggaaaa 2100
cggaacggcg cctcggatga ccttatggtc gccgtcatta tggccatcta ccttgcggcc 2160
caggccggac ctccgcacac attcgctccc atcacacgcg tttcgtga 2208
<210> 40
<211> 735
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic polypeptide
<400> 40
Met Phe Gly Gln Gln Leu Ala Ser Asp Val Gln Gln Tyr Leu Glu Arg
1 5 10 15
Leu Glu Lys Gln Arg Gln Leu Lys Val Gly Ala Asp Glu Ala Ser Ala
20 25 30
Gly Leu Thr Met Gly Gly Asp Ala Leu Arg Val Pro Phe Leu Asp Phe
35 40 45
Ala Thr Ala Thr Pro Lys Arg His Gln Thr Val Val Pro Gly Val Gly
50 55 60
Thr Leu His Asp Cys Cys Glu His Ser Pro Leu Phe Ser Ala Val Ala
65 70 75 80
Arg Arg Leu Leu Phe Asn Ser Leu Val Pro Ala Gln Leu Lys Gly Arg
85 90 95
Asp Phe Gly Gly Asp His Thr Ala Lys Leu Glu Phe Leu Ala Pro Glu
100 105 110
Leu Val Arg Ala Val Ala Arg Leu Arg Phe Lys Glu Cys Ala Pro Ala
115 120 125
Asp Val Val Pro Gln Arg Asn Ala Tyr Tyr Ser Val Leu Asn Thr Phe
130 135 140
Gln Ala Leu His Arg Ser Glu Ala Phe Arg Gln Leu Val His Phe Val
145 150 155 160
Arg Asp Phe Ala Gln Leu Leu Lys Thr Ser Phe Arg Ala Ser Ser Leu
165 170 175
Thr Glu Thr Thr Gly Pro Pro Lys Lys Arg Ala Lys Val Asp Val Ala
180 185 190
Thr His Gly Arg Thr Tyr Gly Thr Leu Glu Leu Phe Gln Lys Met Ile
195 200 205
Leu Met His Ala Thr Tyr Phe Leu Ala Ala Val Leu Leu Gly Asp His
210 215 220
Ala Glu Gln Val Asn Thr Phe Leu Arg Leu Val Phe Glu Ile Pro Leu
225 230 235 240
Phe Ser Asp Ala Ala Val Arg His Phe Arg Gln Arg Ala Thr Val Phe
245 250 255
Leu Val Pro Arg Arg His Gly Lys Thr Trp Phe Leu Val Pro Leu Ile
260 265 270
Ala Leu Ser Leu Ala Ser Phe Arg Gly Ile Lys Ile Gly Tyr Thr Ala
275 280 285
His Ile Arg Lys Ala Thr Glu Pro Val Phe Glu Glu Ile Asp Ala Cys
290 295 300
Leu Arg Gly Trp Phe Gly Ser Ala Arg Val Asp His Val Lys Gly Glu
305 310 315 320
Thr Ile Ser Phe Ser Phe Pro Asp Gly Ser Arg Ser Thr Ile Val Phe
325 330 335
Ala Ser Ser His Asn Thr Asn Gly Ile Arg Gly Gln Asp Phe Asn Leu
340 345 350
Leu Phe Val Asp Glu Ala Asn Phe Ile Arg Pro Asp Ala Val Gln Thr
355 360 365
Ile Met Gly Phe Leu Asn Gln Ala Asn Cys Lys Ile Ile Phe Val Ser
370 375 380
Ser Thr Asn Thr Gly Lys Ala Ser Thr Ser Phe Leu Tyr Asn Leu Arg
385 390 395 400
Gly Ala Ala Asp Glu Leu Leu Asn Val Val Thr Tyr Ile Cys Asp Asp
405 410 415
His Met Pro Arg Val Val Thr His Thr Asn Ala Thr Ala Cys Ser Cys
420 425 430
Tyr Ile Leu Asn Lys Pro Val Phe Ile Thr Met Asp Gly Ala Val Arg
435 440 445
Arg Thr Ala Asp Leu Phe Leu Ala Asp Ser Phe Met Gln Glu Ile Ile
450 455 460
Gly Gly Gln Ala Arg Glu Thr Gly Asp Asp Arg Pro Val Leu Thr Lys
465 470 475 480
Ser Ala Gly Glu Arg Phe Leu Leu Tyr Arg Pro Ser Thr Thr Thr Asn
485 490 495
Ser Gly Leu Met Ala Pro Asp Leu Tyr Val Tyr Val Asp Pro Ala Phe
500 505 510
Thr Ala Asn Thr Arg Ala Ser Gly Thr Gly Val Ala Val Val Gly Arg
515 520 525
Tyr Arg Asp Asp Tyr Ile Ile Phe Ala Leu Glu His Phe Phe Leu Arg
530 535 540
Ala Leu Thr Gly Ser Ala Pro Ala Asp Ile Ala Arg Cys Val Val His
545 550 555 560
Ser Leu Thr Gln Val Leu Ala Leu His Pro Gly Ala Phe Arg Gly Val
565 570 575
Arg Val Ala Val Glu Gly Asn Ser Ser Gln Asp Ser Ala Val Ala Ile
580 585 590
Ala Thr His Val His Thr Glu Met His Arg Leu Leu Ala Ser Glu Gly
595 600 605
Ala Asp Ala Gly Ser Gly Pro Glu Leu Leu Phe Tyr His Cys Glu Pro
610 615 620
Pro Gly Ser Ala Val Leu Tyr Pro Phe Phe Leu Leu Asn Lys Gln Lys
625 630 635 640
Thr Pro Ala Phe Glu His Phe Ile Lys Lys Phe Asn Ser Gly Gly Val
645 650 655
Met Ala Ser Gln Glu Ile Val Ser Ala Thr Val Arg Leu Gln Thr Asp
660 665 670
Pro Val Glu Tyr Leu Leu Glu Gln Leu Asn Asn Leu Thr Glu Thr Val
675 680 685
Ser Pro Asn Thr Asp Val Arg Thr Tyr Ser Gly Lys Arg Asn Gly Ala
690 695 700
Ser Asp Asp Leu Met Val Ala Val Ile Met Ala Ile Tyr Leu Ala Ala
705 710 715 720
Gln Ala Gly Pro Pro His Thr Phe Ala Pro Ile Thr Arg Val Ser
725 730 735
<210> 41
<211> 2208
<212> DNA
<213> Herpes simplex virus type 1
<400> 41
atgtttggtc agcagctggc gtccgacgtc cagcagtacc tggagcgcct cgagaaacag 60
aggcaactta aggtgggcgc ggacgaggcg tcggcgggcc tcaccatggg cggcgatgcc 120
ctacgagtgc cctttttaga tttcgcgacc gcgaccccca agcgccacca gaccgtggtc 180
cctggcgtcg ggacgctcca cgactgctgc gagcactcgc cgctcttctc ggccgtggcg 240
cggcggctgc tgtttaatag cctggtgccg gcgcaactaa aggggcgtga tttcgggggc 300
gaccacacgg ccaagctgga attcctggcc cccgagttgg tacgggcggt ggcgcgactg 360
cggtttaagg agtgcgcgcc ggcggacgtg gtgcctcagc gtaacgccta ctatagcgtt 420
ctgaatacgt ttcaggccct ccaccgctcc gaagcctttc gccagctggt gcactttgtg 480
cgggactttg cccagctgct caaaacctcc ttccgggcct ccagcctcac ggagaccacg 540
ggccccccca aaaaacgggc caaggtggac gtggccaccc acggccggac gtacggcacg 600
ctggagctgt tccaaaaaat gatccttatg cacgccacct actttctggc cgccgtgctc 660
ctcggggacc acgcggagca ggtcaacacg ttcctgcgtc tcgtgtttga gatccccctg 720
tttagcgacg cggccgtgcg ccacttccgc cagcgcgcca ccgtgtttct cgtcccccgg 780
cgccacggca agacctggtt tctggtgccc ctcatcgcgc tgtcgctggc ctcctttcgg 840
gggatcaaga tcggctacac ggcgcacatc cgcaaggcga ccgagccggt gtttgaggag 900
atcgacgcct gcctgcgggg ctggttcggt tcggcccgag tggaccacgt taaaggggaa 960
accatctcct tctcgtttcc ggacgggtcg cgcagtacca tcgtgtttgc ctccagccac 1020
aacacaaacg gaatccgagg ccaggacttt aacctgctct ttgtcgacga ggccaacttt 1080
attcgcccgg atgcggtcca gacgattatg ggctttctca accaggccaa ctgcaagatt 1140
atcttcgtgt cgtccaccaa caccgggaag gccagtacga gctttttgta caacctccgc 1200
ggggccgcag acgagcttct caacgtggtg acctatatat gcgatgatca catgccgagg 1260
gtggtgacgc acacaaacgc cacggcctgt tcttgttata tcctcaacaa gcccgttttc 1320
atcacgatgg acggggcggt tcgccggacc gccgatttgt ttctggccga ttccttcatg 1380
caggagatca tcgggggcca ggccagggag accggcgacg accggcccgt tctgaccaag 1440
tctgcggggg agcggtttct gttgtaccgc ccctcgacca ccaccaacag cggcctcatg 1500
gcccccgatt tgtacgtgta cgtggatccc gcgttcacgg ccaacacccg agcctccggg 1560
accggcgtcg ctgtcgtcgg gcggtaccgc gacgattata tcatcttcgc cctggagcac 1620
ttttttctcc gcgcgctcac gggctcggcc cccgccgaca tcgcccgctg cgtcgtccac 1680
agtctgacgc aggtcctggc cctgcatccc ggggcgtttc gcggcgtccg ggtggcggtc 1740
gagggaaata gcagccagga ctcggccgtc gccatcgcca cgcacgtgca cacagagatg 1800
caccgcctac tggcctcgga gggggccgac gcgggctcgg gccccgagct tctcttctac 1860
cactgcgagc ctcccgggag cgcggtgctg tacccctttt tcctgctcaa caaacagaag 1920
acgcccgcct ttgaacactt tattaaaaag tttaactccg ggggcgtcat ggcctcccag 1980
gagatcgttt ccgcgacggt gcgcctgcag accgacccgg tcgagtatct gctcgagcag 2040
ctaaataacc tcaccgaaac cgtctccccc aacactgacg tccgtacgta ttccggaaaa 2100
cggaacggcg cctcggatga ccttatggtc gccgtcatta tggccatcta cctcgcggcc 2160
caggccggac ctccgcacac attcgctcct atcatacgcg tctcgtga 2208
<210> 42
<211> 735
<212> PRT
<213> Herpes simplex virus type 1
<400> 42
Met Phe Gly Gln Gln Leu Ala Ser Asp Val Gln Gln Tyr Leu Glu Arg
1 5 10 15
Leu Glu Lys Gln Arg Gln Leu Lys Val Gly Ala Asp Glu Ala Ser Ala
20 25 30
Gly Leu Thr Met Gly Gly Asp Ala Leu Arg Val Pro Phe Leu Asp Phe
35 40 45
Ala Thr Ala Thr Pro Lys Arg His Gln Thr Val Val Pro Gly Val Gly
50 55 60
Thr Leu His Asp Cys Cys Glu His Ser Pro Leu Phe Ser Ala Val Ala
65 70 75 80
Arg Arg Leu Leu Phe Asn Ser Leu Val Pro Ala Gln Leu Lys Gly Arg
85 90 95
Asp Phe Gly Gly Asp His Thr Ala Lys Leu Glu Phe Leu Ala Pro Glu
100 105 110
Leu Val Arg Ala Val Ala Arg Leu Arg Phe Lys Glu Cys Ala Pro Ala
115 120 125
Asp Val Val Pro Gln Arg Asn Ala Tyr Tyr Ser Val Leu Asn Thr Phe
130 135 140
Gln Ala Leu His Arg Ser Glu Ala Phe Arg Gln Leu Val His Phe Val
145 150 155 160
Arg Asp Phe Ala Gln Leu Leu Lys Thr Ser Phe Arg Ala Ser Ser Leu
165 170 175
Thr Glu Thr Thr Gly Pro Pro Lys Lys Arg Ala Lys Val Asp Val Ala
180 185 190
Thr His Gly Arg Thr Tyr Gly Thr Leu Glu Leu Phe Gln Lys Met Ile
195 200 205
Leu Met His Ala Thr Tyr Phe Leu Ala Ala Val Leu Leu Gly Asp His
210 215 220
Ala Glu Gln Val Asn Thr Phe Leu Arg Leu Val Phe Glu Ile Pro Leu
225 230 235 240
Phe Ser Asp Ala Ala Val Arg His Phe Arg Gln Arg Ala Thr Val Phe
245 250 255
Leu Val Pro Arg Arg His Gly Lys Thr Trp Phe Leu Val Pro Leu Ile
260 265 270
Ala Leu Ser Leu Ala Ser Phe Arg Gly Ile Lys Ile Gly Tyr Thr Ala
275 280 285
His Ile Arg Lys Ala Thr Glu Pro Val Phe Glu Glu Ile Asp Ala Cys
290 295 300
Leu Arg Gly Trp Phe Gly Ser Ala Arg Val Asp His Val Lys Gly Glu
305 310 315 320
Thr Ile Ser Phe Ser Phe Pro Asp Gly Ser Arg Ser Thr Ile Val Phe
325 330 335
Ala Ser Ser His Asn Thr Asn Gly Ile Arg Gly Gln Asp Phe Asn Leu
340 345 350
Leu Phe Val Asp Glu Ala Asn Phe Ile Arg Pro Asp Ala Val Gln Thr
355 360 365
Ile Met Gly Phe Leu Asn Gln Ala Asn Cys Lys Ile Ile Phe Val Ser
370 375 380
Ser Thr Asn Thr Gly Lys Ala Ser Thr Ser Phe Leu Tyr Asn Leu Arg
385 390 395 400
Gly Ala Ala Asp Glu Leu Leu Asn Val Val Thr Tyr Ile Cys Asp Asp
405 410 415
His Met Pro Arg Val Val Thr His Thr Asn Ala Thr Ala Cys Ser Cys
420 425 430
Tyr Ile Leu Asn Lys Pro Val Phe Ile Thr Met Asp Gly Ala Val Arg
435 440 445
Arg Thr Ala Asp Leu Phe Leu Ala Asp Ser Phe Met Gln Glu Ile Ile
450 455 460
Gly Gly Gln Ala Arg Glu Thr Gly Asp Asp Arg Pro Val Leu Thr Lys
465 470 475 480
Ser Ala Gly Glu Arg Phe Leu Leu Tyr Arg Pro Ser Thr Thr Thr Asn
485 490 495
Ser Gly Leu Met Ala Pro Asp Leu Tyr Val Tyr Val Asp Pro Ala Phe
500 505 510
Thr Ala Asn Thr Arg Ala Ser Gly Thr Gly Val Ala Val Val Gly Arg
515 520 525
Tyr Arg Asp Asp Tyr Ile Ile Phe Ala Leu Glu His Phe Phe Leu Arg
530 535 540
Ala Leu Thr Gly Ser Ala Pro Ala Asp Ile Ala Arg Cys Val Val His
545 550 555 560
Ser Leu Thr Gln Val Leu Ala Leu His Pro Gly Ala Phe Arg Gly Val
565 570 575
Arg Val Ala Val Glu Gly Asn Ser Ser Gln Asp Ser Ala Val Ala Ile
580 585 590
Ala Thr His Val His Thr Glu Met His Arg Leu Leu Ala Ser Glu Gly
595 600 605
Ala Asp Ala Gly Ser Gly Pro Glu Leu Leu Phe Tyr His Cys Glu Pro
610 615 620
Pro Gly Ser Ala Val Leu Tyr Pro Phe Phe Leu Leu Asn Lys Gln Lys
625 630 635 640
Thr Pro Ala Phe Glu His Phe Ile Lys Lys Phe Asn Ser Gly Gly Val
645 650 655
Met Ala Ser Gln Glu Ile Val Ser Ala Thr Val Arg Leu Gln Thr Asp
660 665 670
Pro Val Glu Tyr Leu Leu Glu Gln Leu Asn Asn Leu Thr Glu Thr Val
675 680 685
Ser Pro Asn Thr Asp Val Arg Thr Tyr Ser Gly Lys Arg Asn Gly Ala
690 695 700
Ser Asp Asp Leu Met Val Ala Val Ile Met Ala Ile Tyr Leu Ala Ala
705 710 715 720
Gln Ala Gly Pro Pro His Thr Phe Ala Pro Ile Ile Arg Val Ser
725 730 735
<210> 43
<211> 3414
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic polynucleotide
<400> 43
atggccagcc gcccagccgc atcctctccc gtcgaagcgc gggccccggt tgggggacag 60
gaggccggcg gccccagcgc agccacccag ggggaggccg ccggggcccc tctcgcccac 120
ggccaccacg tgtactgcca gcgagtcaat ggcgtgatgg tgctttccga caagacgccc 180
gggtccgcgt cctaccgcat cagcgatagc aactttgtcc aatgtggttc caactgcacc 240
atgatcatcg acggagacgt ggtgcgcggg cgcccccagg acccgggggc cgcggcatcc 300
cccgctccct tcgttgcggt gacaaacatc ggagccggca gcgacggcgg gaccgccgtc 360
gtggcattcg ggggaacccc acgtcgctcg gcggggacgt ctaccggtac ccagacggcc 420
gacgtcccca ccgaggccct tgggggcccc cctcctcctc cccgcttcac cctgggtggc 480
ggctgttgtt cctgtcgcga cacacggcgc cgctctgcgg tattcggggg ggagggggat 540
ccagtcggcc ccgcggagtt cgtctcggac gaccggtcgt ccgattccga ctcggatgac 600
tcggaggaca cggactcgga gacgctgtca cacgcctcct cggacgtgtc cggcggggcc 660
acgtacgacg acgcccttga ctccgattcg tcatcggatg actccctgca gatagatggc 720
cccgtgtgtc gcccgtggag caatgacacc gcgcccctgg atgtttgccc cgggaccccc 780
ggcccgggcg ccgacgccgg tggtccctca gcggtagacc cacacgcgcc gacgccagag 840
gccggcgctg gtcttgcggc cgatcccgcc gtggcccggg acgacgcgga ggggctttcg 900
gacccccggc cacgtctggg aacgggcacg gcctaccccg tccccctgga actcacgccc 960
gagaacgcgg aggccgtggc gcgctttctg ggagatgccg tgaaccgcga acccgcgctc 1020
atgctggagt acttttgccg gtgcgcccgc gaggaaacca agcgtgtccc ccccaggaca 1080
ttcggcagcc cccctcgcct cacggaggac gactttgggc ttctcaacta cgcgctcgtg 1140
gagatgcagc gcctgtgtct ggacgttcct ccggtcccgc cgaacgcata catgccctat 1200
tatctcaggg agtatgtgac gcggctggtc aacgggttca agccgctggt gagccggtcc 1260
gctcgccttt accgcatcct gggggttctg gtgcacctgc ggatccggac ccgggaggcc 1320
tcctttgagg agtggctgcg atccaaggaa gtggccctgg attttggcct gacggaaagg 1380
cttcgcgagc acgaagccca gctggtgatc ctggcccagg ctctggacca ttacgactgt 1440
ctgatccaca gcacaccgca cacgctggtc gagcgggggc tgcaatcggc cctgaagtat 1500
gaggagtttt acctaaagcg ttttggcggg cactacatgg agtccgtctt ccagatgtac 1560
acccgcatcg ccggcttttt ggcctgccgg gccacgcgcg gcatgcgcca catcgccctg 1620
gggcgagagg ggtcgtggtg ggaaatgttc aagttctttt tccaccgcct ctacgaccac 1680
cagatcgtac cgtcgacccc cgccatgctg aacctgggga cccgcaacta ctacacctcc 1740
agctgctacc tggtaaaccc ccaggccacc acaaacaagg cgaccctgcg ggccatcacc 1800
agcaacgtca gtgccatcct cgcccgcaac gggggcatcg ggctatgcgt gcaggcgttt 1860
aacgactccg gccccgggac cgccagcgtc atgcccgccc tcaaggtcct tgactcgctg 1920
gtggcggcgc acaacaaaga gagcgcgcgt ccgaccggcg cgtgcgtgta cctggagccg 1980
tggcacaccg acgtgcgggc cgtgctccgg atgaaggggg tcctcgccgg cgaagaggcc 2040
cagcgctgcg acaatatctt cagcgccctc tggatgccag acctgttttt caagcgcctg 2100
attcgccacc tggacggcga gaagaacgtc acatggaccc tgttcgaccg ggacaccagc 2160
atgtcgctcg ccgactttca cggggaggag ttcgagaagc tctaccagca cctcgaggtc 2220
atggggttcg gcgagcagat acccatccag gagctggcct atggcattgt gcgcagtgcg 2280
gccacgaccg ggagcccctt cgtcatgttc aaagacgcgg tgaaccgcca ctacatctac 2340
gacacccagg gggcggccat cgccggctcc aacctctgca ccgagatcgt ccatccggcc 2400
tccaagcgat ccagtggggt ctgcaacctg ggaagcgtga atctggcccg atgcgtctcc 2460
aggcagacgt ttgactttgg gcggctccgc gacgccgtgc aggcgtgcgt gctgatggtg 2520
aacatcatga tcgacagcac gctacaaccc acgccccagt gcacccgcgg caacgacaac 2580
ctgcggtcca tgggaatcgg catgcagggc ctgcacacgg cctgcctgaa gctggggctg 2640
gatctggagt ctgtcgaatt tcaggacctg aacaaacaca tcgccgaggt gatgctgctg 2700
tcggcgatga agaccagcaa cgcgctgtgc gttcgcgggg cccgtccctt caaccacttt 2760
aagcgcagca tgtatcgcgc cggccgcttt cactgggagc gctttccgga cgcccggccg 2820
cggtacgagg gcgagtggga gatgctacgc cagagcatga tgaaacacgg cctgcgcaac 2880
agccagtttg tcgcgctgat gcccaccgcc gcctcggcgc agatctcgga cgtcagcgag 2940
ggctttgccc ccctgttcac caacctgttc agcaaggtga cccgggacgg cgagacgctg 3000
cgccccaaca cgctcctgct aaaggaactg gaacgcacgt ttagcgggaa gcgcctcctg 3060
gaggtgatgg acagtctcga cgccaagcag tggtccgtgg cgcaggcgct cccgtgcctg 3120
gagcccaccc accccctccg gcgattcaag accgcgtttg actacgacca gaagttgctg 3180
atcgacctgt gtgcggaccg cgccccctac gtcgaccata gccaatccat gaccctgtat 3240
gtcacggaga aggcggacgg gaccctccca gcctccaccc tggtccgcct tctggtccac 3300
gcatataagc gcggactaaa aacagggatg tactactgca aggttcgcaa ggcgaccaac 3360
agcggggtct ttggcggcga cgacaacatt gtctgcacga gctgcgcgct gtga 3414
<210> 44
<211> 1137
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic polypeptide
<400> 44
Met Ala Ser Arg Pro Ala Ala Ser Ser Pro Val Glu Ala Arg Ala Pro
1 5 10 15
Val Gly Gly Gln Glu Ala Gly Gly Pro Ser Ala Ala Thr Gln Gly Glu
20 25 30
Ala Ala Gly Ala Pro Leu Ala His Gly His His Val Tyr Cys Gln Arg
35 40 45
Val Asn Gly Val Met Val Leu Ser Asp Lys Thr Pro Gly Ser Ala Ser
50 55 60
Tyr Arg Ile Ser Asp Ser Asn Phe Val Gln Cys Gly Ser Asn Cys Thr
65 70 75 80
Met Ile Ile Asp Gly Asp Val Val Arg Gly Arg Pro Gln Asp Pro Gly
85 90 95
Ala Ala Ala Ser Pro Ala Pro Phe Val Ala Val Thr Asn Ile Gly Ala
100 105 110
Gly Ser Asp Gly Gly Thr Ala Val Val Ala Phe Gly Gly Thr Pro Arg
115 120 125
Arg Ser Ala Gly Thr Ser Thr Gly Thr Gln Thr Ala Asp Val Pro Thr
130 135 140
Glu Ala Leu Gly Gly Pro Pro Pro Pro Pro Arg Phe Thr Leu Gly Gly
145 150 155 160
Gly Cys Cys Ser Cys Arg Asp Thr Arg Arg Arg Ser Ala Val Phe Gly
165 170 175
Gly Glu Gly Asp Pro Val Gly Pro Ala Glu Phe Val Ser Asp Asp Arg
180 185 190
Ser Ser Asp Ser Asp Ser Asp Asp Ser Glu Asp Thr Asp Ser Glu Thr
195 200 205
Leu Ser His Ala Ser Ser Asp Val Ser Gly Gly Ala Thr Tyr Asp Asp
210 215 220
Ala Leu Asp Ser Asp Ser Ser Ser Asp Asp Ser Leu Gln Ile Asp Gly
225 230 235 240
Pro Val Cys Arg Pro Trp Ser Asn Asp Thr Ala Pro Leu Asp Val Cys
245 250 255
Pro Gly Thr Pro Gly Pro Gly Ala Asp Ala Gly Gly Pro Ser Ala Val
260 265 270
Asp Pro His Ala Pro Thr Pro Glu Ala Gly Ala Gly Leu Ala Ala Asp
275 280 285
Pro Ala Val Ala Arg Asp Asp Ala Glu Gly Leu Ser Asp Pro Arg Pro
290 295 300
Arg Leu Gly Thr Gly Thr Ala Tyr Pro Val Pro Leu Glu Leu Thr Pro
305 310 315 320
Glu Asn Ala Glu Ala Val Ala Arg Phe Leu Gly Asp Ala Val Asn Arg
325 330 335
Glu Pro Ala Leu Met Leu Glu Tyr Phe Cys Arg Cys Ala Arg Glu Glu
340 345 350
Thr Lys Arg Val Pro Pro Arg Thr Phe Gly Ser Pro Pro Arg Leu Thr
355 360 365
Glu Asp Asp Phe Gly Leu Leu Asn Tyr Ala Leu Val Glu Met Gln Arg
370 375 380
Leu Cys Leu Asp Val Pro Pro Val Pro Pro Asn Ala Tyr Met Pro Tyr
385 390 395 400
Tyr Leu Arg Glu Tyr Val Thr Arg Leu Val Asn Gly Phe Lys Pro Leu
405 410 415
Val Ser Arg Ser Ala Arg Leu Tyr Arg Ile Leu Gly Val Leu Val His
420 425 430
Leu Arg Ile Arg Thr Arg Glu Ala Ser Phe Glu Glu Trp Leu Arg Ser
435 440 445
Lys Glu Val Ala Leu Asp Phe Gly Leu Thr Glu Arg Leu Arg Glu His
450 455 460
Glu Ala Gln Leu Val Ile Leu Ala Gln Ala Leu Asp His Tyr Asp Cys
465 470 475 480
Leu Ile His Ser Thr Pro His Thr Leu Val Glu Arg Gly Leu Gln Ser
485 490 495
Ala Leu Lys Tyr Glu Glu Phe Tyr Leu Lys Arg Phe Gly Gly His Tyr
500 505 510
Met Glu Ser Val Phe Gln Met Tyr Thr Arg Ile Ala Gly Phe Leu Ala
515 520 525
Cys Arg Ala Thr Arg Gly Met Arg His Ile Ala Leu Gly Arg Glu Gly
530 535 540
Ser Trp Trp Glu Met Phe Lys Phe Phe Phe His Arg Leu Tyr Asp His
545 550 555 560
Gln Ile Val Pro Ser Thr Pro Ala Met Leu Asn Leu Gly Thr Arg Asn
565 570 575
Tyr Tyr Thr Ser Ser Cys Tyr Leu Val Asn Pro Gln Ala Thr Thr Asn
580 585 590
Lys Ala Thr Leu Arg Ala Ile Thr Ser Asn Val Ser Ala Ile Leu Ala
595 600 605
Arg Asn Gly Gly Ile Gly Leu Cys Val Gln Ala Phe Asn Asp Ser Gly
610 615 620
Pro Gly Thr Ala Ser Val Met Pro Ala Leu Lys Val Leu Asp Ser Leu
625 630 635 640
Val Ala Ala His Asn Lys Glu Ser Ala Arg Pro Thr Gly Ala Cys Val
645 650 655
Tyr Leu Glu Pro Trp His Thr Asp Val Arg Ala Val Leu Arg Met Lys
660 665 670
Gly Val Leu Ala Gly Glu Glu Ala Gln Arg Cys Asp Asn Ile Phe Ser
675 680 685
Ala Leu Trp Met Pro Asp Leu Phe Phe Lys Arg Leu Ile Arg His Leu
690 695 700
Asp Gly Glu Lys Asn Val Thr Trp Thr Leu Phe Asp Arg Asp Thr Ser
705 710 715 720
Met Ser Leu Ala Asp Phe His Gly Glu Glu Phe Glu Lys Leu Tyr Gln
725 730 735
His Leu Glu Val Met Gly Phe Gly Glu Gln Ile Pro Ile Gln Glu Leu
740 745 750
Ala Tyr Gly Ile Val Arg Ser Ala Ala Thr Thr Gly Ser Pro Phe Val
755 760 765
Met Phe Lys Asp Ala Val Asn Arg His Tyr Ile Tyr Asp Thr Gln Gly
770 775 780
Ala Ala Ile Ala Gly Ser Asn Leu Cys Thr Glu Ile Val His Pro Ala
785 790 795 800
Ser Lys Arg Ser Ser Gly Val Cys Asn Leu Gly Ser Val Asn Leu Ala
805 810 815
Arg Cys Val Ser Arg Gln Thr Phe Asp Phe Gly Arg Leu Arg Asp Ala
820 825 830
Val Gln Ala Cys Val Leu Met Val Asn Ile Met Ile Asp Ser Thr Leu
835 840 845
Gln Pro Thr Pro Gln Cys Thr Arg Gly Asn Asp Asn Leu Arg Ser Met
850 855 860
Gly Ile Gly Met Gln Gly Leu His Thr Ala Cys Leu Lys Leu Gly Leu
865 870 875 880
Asp Leu Glu Ser Val Glu Phe Gln Asp Leu Asn Lys His Ile Ala Glu
885 890 895
Val Met Leu Leu Ser Ala Met Lys Thr Ser Asn Ala Leu Cys Val Arg
900 905 910
Gly Ala Arg Pro Phe Asn His Phe Lys Arg Ser Met Tyr Arg Ala Gly
915 920 925
Arg Phe His Trp Glu Arg Phe Pro Asp Ala Arg Pro Arg Tyr Glu Gly
930 935 940
Glu Trp Glu Met Leu Arg Gln Ser Met Met Lys His Gly Leu Arg Asn
945 950 955 960
Ser Gln Phe Val Ala Leu Met Pro Thr Ala Ala Ser Ala Gln Ile Ser
965 970 975
Asp Val Ser Glu Gly Phe Ala Pro Leu Phe Thr Asn Leu Phe Ser Lys
980 985 990
Val Thr Arg Asp Gly Glu Thr Leu Arg Pro Asn Thr Leu Leu Leu Lys
995 1000 1005
Glu Leu Glu Arg Thr Phe Ser Gly Lys Arg Leu Leu Glu Val Met
1010 1015 1020
Asp Ser Leu Asp Ala Lys Gln Trp Ser Val Ala Gln Ala Leu Pro
1025 1030 1035
Cys Leu Glu Pro Thr His Pro Leu Arg Arg Phe Lys Thr Ala Phe
1040 1045 1050
Asp Tyr Asp Gln Lys Leu Leu Ile Asp Leu Cys Ala Asp Arg Ala
1055 1060 1065
Pro Tyr Val Asp His Ser Gln Ser Met Thr Leu Tyr Val Thr Glu
1070 1075 1080
Lys Ala Asp Gly Thr Leu Pro Ala Ser Thr Leu Val Arg Leu Leu
1085 1090 1095
Val His Ala Tyr Lys Arg Gly Leu Lys Thr Gly Met Tyr Tyr Cys
1100 1105 1110
Lys Val Arg Lys Ala Thr Asn Ser Gly Val Phe Gly Gly Asp Asp
1115 1120 1125
Asn Ile Val Cys Thr Ser Cys Ala Leu
1130 1135
<210> 45
<211> 3414
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic polynucleotide
<400> 45
atggccagcc gcccagccgc atcctctccc gtcgaagcgc gggccccggt tgggggacag 60
gaggccggcg gccccagcgc agccacccag ggggaggccg ccggggcccc tctcgcccac 120
ggccaccacg tgtactgcca gcgagtcaat ggcgtgatgg tgctttccga caagacgccc 180
gggtccgcgt cctaccgcat cagcgatagc aactttgtcc aatgtggttc caactgcacc 240
atgatcatcg acggagacgt ggtgcgcggg cgcccccagg acccgggggc cgcggcatcc 300
cccgctccct tcgttgcggt gacaaacatc ggagccggca gcgacggcgg gaccgccgtc 360
gtggcattcg ggggaacccc acgtcgctcg gcggggacgt ctaccggtac ccagacggcc 420
gacgtcccca ccgaggccct tgggggcccc cctcctcctc cccgcttcac cctgggtggc 480
ggctgttgtt cctgtcgcga cacacggcgc cgctctgcgg tattcggggg ggagggggat 540
ccagtcggcc ccgcggagtt cgtctcggac gaccggtcgt ccgattccga ctcggatgac 600
tcggaggaca cggactcgga gacgctgtca cacgcctcct cggacgtgtc cggcggggcc 660
acgtacgacg acgcccttga ctccgattcg tcatcggatg actccctgca gatagatggc 720
cccgtgtgtc gcccgtggag caatgacacc gcgcccctgg atgtttgccc cgggaccccc 780
ggcccgggcg ccgacgccgg tggtccctca gcggtagacc cacacgcgcc gacgccagag 840
gccggcgctg gtcttgcggc cgatcccgcc gtggcccggg acgacgcgga ggggctttcg 900
gacccccggc cacgtctggg aacgggcacg gcctaccccg tccccctgga actcacgccc 960
gagaacgcgg aggccgtggc gcgctttctg ggagatgccg tgaaccgcga acccgcgctc 1020
atgctggagt acttttgccg gtgcgcccgc gaggaaacca agcgtgtccc ccccaggaca 1080
ttcggcagcc cccctcgcct cacggaggac gactttgggc ttctcaacta cgcgctcgtg 1140
gagatgcagc gcctgtgtct ggacgttcct ccggtcccgc cgaacgcata catgccctat 1200
tatctcaggg agtatgtgac gcggctggtc aacgggttca agccgctggt gagccggtcc 1260
gctcgccttt accgcatcct gggggttctg gtgcacctgc ggatccggac ccgggaggcc 1320
tcctttgagg agtggctgcg atccaaggaa gtggccctgg attttggcct gacggaaagg 1380
cttcgcgagc acgaagccca gctggtgatc ctggcccagg ctctggacca ttacgactgt 1440
ctgatccaca gcacaccgca cacgctggtc gagcgggggc tgcaatcggc cctgaagtat 1500
gaggagtttt acctaaagcg ttttggcggg cactacatgg agtccgtctt ccagatgtac 1560
acccgcatcg ccggcttttt ggcctgccgg gccacgcgcg gcatgcgcca catcgccctg 1620
gggcgagagg ggtcgtggtg ggaaatgttc aagttctttt tccaccgcct ctacgaccac 1680
cagatcgtac cgtcgacccc cgccatgctg aacctgggga cccgcaacta ctacacctcc 1740
agctgctacc tggtaaaccc ccaggccacc acaaacaagg cgaccctgcg ggccatcacc 1800
agcaacgtca gtgccatcct cgcccgcaac gggggcatcg ggctatgcgt gcaggcgttt 1860
aacgactccg gccccgggac cgccagcgtc atgcccgccc tcaaggtcct tgactcgctg 1920
gtggcggcgc acaacaaaga gagcgcgcgt ccgaccggcg cgtgcgtgta cctggagccg 1980
tggcacaccg acgtgcgggc cgtgctccgg atgaaggggg tcctcgccgg cgaagaggcc 2040
cagcgctgcg acaatatctt cagcgccctc tggatgccag acctgttttt caagcgcctg 2100
attcgccacc tggacggcga gaagaacgtc acatggaccc tgttcgaccg ggacaccagc 2160
atgtcgctcg ccgactttca cggggaggag ttcgagaagc tctaccagca cctcgaggtc 2220
atggggttcg gcgagcagat acccatccag gagctggcct atggcattgt gcgcagtgcg 2280
gccacgaccg ggagcccctt cgtcatgttc aaagacgcgg tgaaccgcca ctacatctac 2340
gacacccagg gggcggccat cgccggctcc aacctctgca ccgagatcgt ccatccggcc 2400
tccaagcgat ccagtggggt ctgcaacctg ggaagcgtga atctggcccg atgcgtctcc 2460
aggcagacgt ttgactttgg gcggctccgc gacgccgtgc aggcgtgcgt gctgatggtg 2520
aacatcatga tcgacagcac gctacaaccc acgccccagt gcacccgcgg caacgacaac 2580
ctgcggtcca tgggaatcgg catgcagggc ctgcacacgg cctgcctgaa gctggggctg 2640
gatctggagt ctgccgaatt tcaggacctg aacaaacaca tcgccgaggt gatgctgctg 2700
tcggcgatga agaccagcaa cgcgctgtgc gttcgcgggg cccgtccctt caaccacttt 2760
aagcgcagca tgtatcgcgc cggccgcttt cactgggagc gctttccgga cgcccggccg 2820
cggtacgagg gcgagtggga gatgctacgc cagagcatga tgaaacacgg cctgcgcaac 2880
agccagtttg tcgcgctgat gcccaccgcc gcctcggcgc agatctcgga cgtcagcgag 2940
ggctttgccc ccctgttcac caacctgttc agcaaggtga cccgggacgg cgagacgctg 3000
cgccccaaca cgctcctgct aaaggaactg gaacgcacgt ttagcgggaa gcgcctcctg 3060
gaggtgatgg acagtctcga cgccaagcag tggtccgtgg cgcaggcgct cccgtgcctg 3120
gagcccaccc accccctccg gcgattcaag accgcgtttg actacgacca gaagttgctg 3180
atcgacctgt gtgcggaccg cgccccctac gtcgaccata gccaatccat gaccctgtat 3240
gtcacggaga aggcggacgg gaccctccca gcctccaccc tggtccgcct tctggtccac 3300
gcatataagc gcggactaaa aacagggatg tactactgca aggttcgcaa ggcgaccaac 3360
agcggggtct ttggcggcga cgacaacatt gtctgcatga gctgcgcgct gtga 3414
<210> 46
<211> 1137
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic polypeptide
<400> 46
Met Ala Ser Arg Pro Ala Ala Ser Ser Pro Val Glu Ala Arg Ala Pro
1 5 10 15
Val Gly Gly Gln Glu Ala Gly Gly Pro Ser Ala Ala Thr Gln Gly Glu
20 25 30
Ala Ala Gly Ala Pro Leu Ala His Gly His His Val Tyr Cys Gln Arg
35 40 45
Val Asn Gly Val Met Val Leu Ser Asp Lys Thr Pro Gly Ser Ala Ser
50 55 60
Tyr Arg Ile Ser Asp Ser Asn Phe Val Gln Cys Gly Ser Asn Cys Thr
65 70 75 80
Met Ile Ile Asp Gly Asp Val Val Arg Gly Arg Pro Gln Asp Pro Gly
85 90 95
Ala Ala Ala Ser Pro Ala Pro Phe Val Ala Val Thr Asn Ile Gly Ala
100 105 110
Gly Ser Asp Gly Gly Thr Ala Val Val Ala Phe Gly Gly Thr Pro Arg
115 120 125
Arg Ser Ala Gly Thr Ser Thr Gly Thr Gln Thr Ala Asp Val Pro Thr
130 135 140
Glu Ala Leu Gly Gly Pro Pro Pro Pro Pro Arg Phe Thr Leu Gly Gly
145 150 155 160
Gly Cys Cys Ser Cys Arg Asp Thr Arg Arg Arg Ser Ala Val Phe Gly
165 170 175
Gly Glu Gly Asp Pro Val Gly Pro Ala Glu Phe Val Ser Asp Asp Arg
180 185 190
Ser Ser Asp Ser Asp Ser Asp Asp Ser Glu Asp Thr Asp Ser Glu Thr
195 200 205
Leu Ser His Ala Ser Ser Asp Val Ser Gly Gly Ala Thr Tyr Asp Asp
210 215 220
Ala Leu Asp Ser Asp Ser Ser Ser Asp Asp Ser Leu Gln Ile Asp Gly
225 230 235 240
Pro Val Cys Arg Pro Trp Ser Asn Asp Thr Ala Pro Leu Asp Val Cys
245 250 255
Pro Gly Thr Pro Gly Pro Gly Ala Asp Ala Gly Gly Pro Ser Ala Val
260 265 270
Asp Pro His Ala Pro Thr Pro Glu Ala Gly Ala Gly Leu Ala Ala Asp
275 280 285
Pro Ala Val Ala Arg Asp Asp Ala Glu Gly Leu Ser Asp Pro Arg Pro
290 295 300
Arg Leu Gly Thr Gly Thr Ala Tyr Pro Val Pro Leu Glu Leu Thr Pro
305 310 315 320
Glu Asn Ala Glu Ala Val Ala Arg Phe Leu Gly Asp Ala Val Asn Arg
325 330 335
Glu Pro Ala Leu Met Leu Glu Tyr Phe Cys Arg Cys Ala Arg Glu Glu
340 345 350
Thr Lys Arg Val Pro Pro Arg Thr Phe Gly Ser Pro Pro Arg Leu Thr
355 360 365
Glu Asp Asp Phe Gly Leu Leu Asn Tyr Ala Leu Val Glu Met Gln Arg
370 375 380
Leu Cys Leu Asp Val Pro Pro Val Pro Pro Asn Ala Tyr Met Pro Tyr
385 390 395 400
Tyr Leu Arg Glu Tyr Val Thr Arg Leu Val Asn Gly Phe Lys Pro Leu
405 410 415
Val Ser Arg Ser Ala Arg Leu Tyr Arg Ile Leu Gly Val Leu Val His
420 425 430
Leu Arg Ile Arg Thr Arg Glu Ala Ser Phe Glu Glu Trp Leu Arg Ser
435 440 445
Lys Glu Val Ala Leu Asp Phe Gly Leu Thr Glu Arg Leu Arg Glu His
450 455 460
Glu Ala Gln Leu Val Ile Leu Ala Gln Ala Leu Asp His Tyr Asp Cys
465 470 475 480
Leu Ile His Ser Thr Pro His Thr Leu Val Glu Arg Gly Leu Gln Ser
485 490 495
Ala Leu Lys Tyr Glu Glu Phe Tyr Leu Lys Arg Phe Gly Gly His Tyr
500 505 510
Met Glu Ser Val Phe Gln Met Tyr Thr Arg Ile Ala Gly Phe Leu Ala
515 520 525
Cys Arg Ala Thr Arg Gly Met Arg His Ile Ala Leu Gly Arg Glu Gly
530 535 540
Ser Trp Trp Glu Met Phe Lys Phe Phe Phe His Arg Leu Tyr Asp His
545 550 555 560
Gln Ile Val Pro Ser Thr Pro Ala Met Leu Asn Leu Gly Thr Arg Asn
565 570 575
Tyr Tyr Thr Ser Ser Cys Tyr Leu Val Asn Pro Gln Ala Thr Thr Asn
580 585 590
Lys Ala Thr Leu Arg Ala Ile Thr Ser Asn Val Ser Ala Ile Leu Ala
595 600 605
Arg Asn Gly Gly Ile Gly Leu Cys Val Gln Ala Phe Asn Asp Ser Gly
610 615 620
Pro Gly Thr Ala Ser Val Met Pro Ala Leu Lys Val Leu Asp Ser Leu
625 630 635 640
Val Ala Ala His Asn Lys Glu Ser Ala Arg Pro Thr Gly Ala Cys Val
645 650 655
Tyr Leu Glu Pro Trp His Thr Asp Val Arg Ala Val Leu Arg Met Lys
660 665 670
Gly Val Leu Ala Gly Glu Glu Ala Gln Arg Cys Asp Asn Ile Phe Ser
675 680 685
Ala Leu Trp Met Pro Asp Leu Phe Phe Lys Arg Leu Ile Arg His Leu
690 695 700
Asp Gly Glu Lys Asn Val Thr Trp Thr Leu Phe Asp Arg Asp Thr Ser
705 710 715 720
Met Ser Leu Ala Asp Phe His Gly Glu Glu Phe Glu Lys Leu Tyr Gln
725 730 735
His Leu Glu Val Met Gly Phe Gly Glu Gln Ile Pro Ile Gln Glu Leu
740 745 750
Ala Tyr Gly Ile Val Arg Ser Ala Ala Thr Thr Gly Ser Pro Phe Val
755 760 765
Met Phe Lys Asp Ala Val Asn Arg His Tyr Ile Tyr Asp Thr Gln Gly
770 775 780
Ala Ala Ile Ala Gly Ser Asn Leu Cys Thr Glu Ile Val His Pro Ala
785 790 795 800
Ser Lys Arg Ser Ser Gly Val Cys Asn Leu Gly Ser Val Asn Leu Ala
805 810 815
Arg Cys Val Ser Arg Gln Thr Phe Asp Phe Gly Arg Leu Arg Asp Ala
820 825 830
Val Gln Ala Cys Val Leu Met Val Asn Ile Met Ile Asp Ser Thr Leu
835 840 845
Gln Pro Thr Pro Gln Cys Thr Arg Gly Asn Asp Asn Leu Arg Ser Met
850 855 860
Gly Ile Gly Met Gln Gly Leu His Thr Ala Cys Leu Lys Leu Gly Leu
865 870 875 880
Asp Leu Glu Ser Ala Glu Phe Gln Asp Leu Asn Lys His Ile Ala Glu
885 890 895
Val Met Leu Leu Ser Ala Met Lys Thr Ser Asn Ala Leu Cys Val Arg
900 905 910
Gly Ala Arg Pro Phe Asn His Phe Lys Arg Ser Met Tyr Arg Ala Gly
915 920 925
Arg Phe His Trp Glu Arg Phe Pro Asp Ala Arg Pro Arg Tyr Glu Gly
930 935 940
Glu Trp Glu Met Leu Arg Gln Ser Met Met Lys His Gly Leu Arg Asn
945 950 955 960
Ser Gln Phe Val Ala Leu Met Pro Thr Ala Ala Ser Ala Gln Ile Ser
965 970 975
Asp Val Ser Glu Gly Phe Ala Pro Leu Phe Thr Asn Leu Phe Ser Lys
980 985 990
Val Thr Arg Asp Gly Glu Thr Leu Arg Pro Asn Thr Leu Leu Leu Lys
995 1000 1005
Glu Leu Glu Arg Thr Phe Ser Gly Lys Arg Leu Leu Glu Val Met
1010 1015 1020
Asp Ser Leu Asp Ala Lys Gln Trp Ser Val Ala Gln Ala Leu Pro
1025 1030 1035
Cys Leu Glu Pro Thr His Pro Leu Arg Arg Phe Lys Thr Ala Phe
1040 1045 1050
Asp Tyr Asp Gln Lys Leu Leu Ile Asp Leu Cys Ala Asp Arg Ala
1055 1060 1065
Pro Tyr Val Asp His Ser Gln Ser Met Thr Leu Tyr Val Thr Glu
1070 1075 1080
Lys Ala Asp Gly Thr Leu Pro Ala Ser Thr Leu Val Arg Leu Leu
1085 1090 1095
Val His Ala Tyr Lys Arg Gly Leu Lys Thr Gly Met Tyr Tyr Cys
1100 1105 1110
Lys Val Arg Lys Ala Thr Asn Ser Gly Val Phe Gly Gly Asp Asp
1115 1120 1125
Asn Ile Val Cys Met Ser Cys Ala Leu
1130 1135
<210> 47
<211> 3780
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic polynucleotide
<400> 47
gaaccccttc gccatggagc ccagtatctt gctcctcctt gctctccttg tgggcttctt 60
gttactctta gtcaggggac acccaaagtc ccgtggcaac ttcccaccag gacctcgtcc 120
ccttcccctc ttggggaacc tcctgcagtt ggacagaggg ggcctcctca attccttcat 180
gcagcttcga gaaaaatatg gagatgtgtt cacagtacac ctgggaccaa ggcctgtggt 240
catgctatgt gggacagaca ccataaagga ggctctggtg ggccaagctg aggatttctc 300
tggtcgggga acaatcgctg tgattgagcc aatcttcaag gaatatggtg tgatctttgc 360
caatggggaa cgctggaagg cccttcggcg attctctctg gctaccatga gagactttgg 420
gatgggaaag aggagtgtgg aagaacggat tcaggaggaa gcccaatgtt tggtggagga 480
actgcggaaa tcccagggag ccccactgga tcccaccttc ctcttccagt gcatcacagc 540
caacatcatc tgctccattg tgtttggaga gcgctttgac tacacagacc gccagttcct 600
gcgcctgttg gagctgttct accggacctt ttccctccta agttcattct ccagccaggt 660
gtttgagttc ttctctgggt tcctgaaata ctttcctggt gcccacagac aaatctccaa 720
aaacctccag gaaatcctcg attacattgg ccatattgtg gagaagcaca gggccacctt 780
agacccaagc gctccacgag acttcatcga cacttacctt ctgcgcatgg agaaggagaa 840
gtcgaaccac cacacagagt tccatcatga gaacctcatg atctccctgc tctctctctt 900
ctttgctggc actgagacca gcagcaccac actccgctat ggtttcctgc tgatgctcaa 960
gtacccccat gtcgcagaga aagtccaaaa ggagattgat caggtgatcg gctcacaccg 1020
gctaccaacc cttgatgacc gcagtaaaat gccatacact gatgcagtta tccatgagat 1080
tcagaggttt tcagatcttg tccctattgg agtaccacac agagtcacca aagacaccat 1140
gttccgaggg tacctgcttc ccaagaacac tgaagtgtac cccatcctga gttcagctct 1200
ccatgaccca cagtactttg accacccaga cagcttcaat cctgaacact tcctggatgc 1260
caatggggca ctgaaaaaga gtgaagcttt catgcccttc tccacaggaa agcgcatttg 1320
tcttggcgaa ggcattgccc gaaatgaatt gttcctcttc ttcaccacca tcctccagaa 1380
cttctctgtg tcaagccatt tggctcccaa ggacattgac ctcacgccca aggagagtgg 1440
cattggaaaa atacctccaa cgtaccagat ctgcttctca gctcggtgat ccggctgagg 1500
cagccatgtg ccccagttct gttgggaatg gaacttgttt attgcagctt ataatggtta 1560
caaataaagc aatagcatca caaatttcac aaataaagca tttttttcac tgcattctag 1620
ttgtggtttg tccaaactca tcaatgtatc ttatcatgtc tggatccccg ggcgagctcg 1680
aattcctcct ttgaggagtg gctgcgatcc aaggaagtgg ccctggactt tggcctgacg 1740
gaaaggcttc gcgagcacga agcccagctg gtgatcctgg cccaggctct ggaccattac 1800
gactgtctga tccacagcac accgcacacg ctggtcgagc gggggctgca atcggccctg 1860
aagtatgagg agttttacct aaagcgcttt ggcgggcact acatggagtc cgtcttccag 1920
atgtacaccc gcatcgccgg ctttttggcc tgccgggcca cgcgcggcat gcgccacatc 1980
gccctggggc gagaggggtc gtggtgggaa atgttcaagt tctttttcca ccgcctctac 2040
gaccaccaga tcgtaccgtc gacccccgcc atgctgaacc tggggacccg caactactac 2100
acctccagct gctacctggt aaacccccag gccaccacaa acaaggcgac cctgcgggcc 2160
atcaccagca acgtcagcgc catcctcgcc cgcaacgggg gcatcgggct atgcgtgcag 2220
gcgtttaacg actccggccc cgggaccgct agcgtcatac ccgccctcaa ggtcctcgac 2280
tcgctggtgg cggcgcacaa caaagagagc gcgcgtccaa ccggcgcgtg cgtgtacctg 2340
gagccgtggc acaccgacgt gcgggccgtg ctccggatga agggggtcct cgccggcgaa 2400
gaggcccagc gctgcgacaa tatcttcagc gccctctgga tgccagacct gtttttcaag 2460
cgcctgattc gccacctgga cggcgagaag aacgtcacat ggaccctgtt cgaccgggac 2520
accagcatgt cgctcgccga ctttcacggg gaggagttcg agaagctcta ccagcacctc 2580
gaggtcatgg ggttcggcga gcagataccc atccaggagc tggcctatgg cattgtgcgc 2640
agtgcggcca cgaccgggag ccccttcgtc atgttcaaag acgcggtgaa ccgccactac 2700
atctacgaca cccagggggc ggccatcgcc ggctccaacc tctgcaccga gatcgtccat 2760
ccggcctcca agcgatccag tggggtctgc aatctgggaa gcgtgaatct ggcccgatgc 2820
gtctccaggc agacgtttga ctttgggcgg ctccgcgacg ccgtgcaggc gtgcgtgctg 2880
atggtgaaca tcatgatcga cagcacgcta caacccacgc cccagtgcac ccgcggcaac 2940
gacaacctgc ggtccatggg aatcggcatg cagggcctgc acacggcctg cctgaagctg 3000
gggctggatc tggagtctgt cgaatttcag gacctgaaca aacacatcgc cgaggtgatg 3060
ctgctgtcgg cgatgaagac cagcaacgcg ctgtgcgttc gcggggcccg tcccttcaac 3120
cactttaagc gcagcatgta tcgcgccggc cgctttcact gggagcgctt tccggacgcc 3180
cggccgcggt acgagggcga gtgggagatg ctacgccaga gcatgatgaa acacggcctg 3240
cgcaacagcc agtttgtcgc gctgatgccc accgccgcct cggcgcagat ctcggacgtc 3300
agcgagggct ttgcccccct gttcaccaac ctgttcagca aggtgacccg ggacggcgag 3360
acgctgcgcc ccaacacgct cctgctaaag gaactggaac gcacgtttag cgggaagcgc 3420
ctcctggagg tgatggacag tctcgacgcc aagcagtggt ccgtggcgca ggcgctcccg 3480
tgcctggagc ccacccaccc cctccggcga ttcaagaccg cgtttgacta cgaccagaag 3540
ttgctgatcg acctgtgtgc ggaccgcgcc ccctacgtcg accatagcca atccatgacc 3600
ctgtatgtca cggagaaggc ggacgggacc ctcccagcct ccaccctggt ccgccttctg 3660
gtccacgcat ataagcgcgg actaaaaaca gggatgtact actgcaaggt tcgcaaggcg 3720
accaacagcg gggtctttgg cggcgacgac aacattgtct gcacgagctg cgcgctgtga 3780
<210> 48
<211> 491
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic polypeptide
<400> 48
Met Glu Pro Ser Ile Leu Leu Leu Leu Ala Leu Leu Val Gly Phe Leu
1 5 10 15
Leu Leu Leu Val Arg Gly His Pro Lys Ser Arg Gly Asn Phe Pro Pro
20 25 30
Gly Pro Arg Pro Leu Pro Leu Leu Gly Asn Leu Leu Gln Leu Asp Arg
35 40 45
Gly Gly Leu Leu Asn Ser Phe Met Gln Leu Arg Glu Lys Tyr Gly Asp
50 55 60
Val Phe Thr Val His Leu Gly Pro Arg Pro Val Val Met Leu Cys Gly
65 70 75 80
Thr Asp Thr Ile Lys Glu Ala Leu Val Gly Gln Ala Glu Asp Phe Ser
85 90 95
Gly Arg Gly Thr Ile Ala Val Ile Glu Pro Ile Phe Lys Glu Tyr Gly
100 105 110
Val Ile Phe Ala Asn Gly Glu Arg Trp Lys Ala Leu Arg Arg Phe Ser
115 120 125
Leu Ala Thr Met Arg Asp Phe Gly Met Gly Lys Arg Ser Val Glu Glu
130 135 140
Arg Ile Gln Glu Glu Ala Gln Cys Leu Val Glu Glu Leu Arg Lys Ser
145 150 155 160
Gln Gly Ala Pro Leu Asp Pro Thr Phe Leu Phe Gln Cys Ile Thr Ala
165 170 175
Asn Ile Ile Cys Ser Ile Val Phe Gly Glu Arg Phe Asp Tyr Thr Asp
180 185 190
Arg Gln Phe Leu Arg Leu Leu Glu Leu Phe Tyr Arg Thr Phe Ser Leu
195 200 205
Leu Ser Ser Phe Ser Ser Gln Val Phe Glu Phe Phe Ser Gly Phe Leu
210 215 220
Lys Tyr Phe Pro Gly Ala His Arg Gln Ile Ser Lys Asn Leu Gln Glu
225 230 235 240
Ile Leu Asp Tyr Ile Gly His Ile Val Glu Lys His Arg Ala Thr Leu
245 250 255
Asp Pro Ser Ala Pro Arg Asp Phe Ile Asp Thr Tyr Leu Leu Arg Met
260 265 270
Glu Lys Glu Lys Ser Asn His His Thr Glu Phe His His Glu Asn Leu
275 280 285
Met Ile Ser Leu Leu Ser Leu Phe Phe Ala Gly Thr Glu Thr Ser Ser
290 295 300
Thr Thr Leu Arg Tyr Gly Phe Leu Leu Met Leu Lys Tyr Pro His Val
305 310 315 320
Ala Glu Lys Val Gln Lys Glu Ile Asp Gln Val Ile Gly Ser His Arg
325 330 335
Leu Pro Thr Leu Asp Asp Arg Ser Lys Met Pro Tyr Thr Asp Ala Val
340 345 350
Ile His Glu Ile Gln Arg Phe Ser Asp Leu Val Pro Ile Gly Val Pro
355 360 365
His Arg Val Thr Lys Asp Thr Met Phe Arg Gly Tyr Leu Leu Pro Lys
370 375 380
Asn Thr Glu Val Tyr Pro Ile Leu Ser Ser Ala Leu His Asp Pro Gln
385 390 395 400
Tyr Phe Asp His Pro Asp Ser Phe Asn Pro Glu His Phe Leu Asp Ala
405 410 415
Asn Gly Ala Leu Lys Lys Ser Glu Ala Phe Met Pro Phe Ser Thr Gly
420 425 430
Lys Arg Ile Cys Leu Gly Glu Gly Ile Ala Arg Asn Glu Leu Phe Leu
435 440 445
Phe Phe Thr Thr Ile Leu Gln Asn Phe Ser Val Ser Ser His Leu Ala
450 455 460
Pro Lys Asp Ile Asp Leu Thr Pro Lys Glu Ser Gly Ile Gly Lys Ile
465 470 475 480
Pro Pro Thr Tyr Gln Ile Cys Phe Ser Ala Arg
485 490
<210> 49
<211> 3414
<212> DNA
<213> Herpes simplex virus type 1
<400> 49
atggccagcc gcccagccgc atcctctccc gtcgaagcgc gggccccggt tgggggacag 60
gaggccggcg gccccagcgc agccacccag ggggaggccg ccggggcccc tctcgcccac 120
ggccaccacg tgtactgcca gcgagtcaat ggcgtgatgg tgctttccga caagacgccc 180
gggtccgcgt cctaccgcat cagcgatagc aactttgtcc aatgtggttc caactgcacc 240
atgatcatcg acggagacgt ggtgcgcggg cgcccccagg acccgggggc cgcggcatcc 300
cccgctccct tcgttgcggt gacaaacatc ggagccggca gcgacggcgg gaccgccgtc 360
gtggcattcg ggggaacccc acgtcgctcg gcggggacgt ctaccggtac ccagacggcc 420
gacgtcccca ccgaggccct tgggggcccc cctcctcctc cccgcttcac cctgggtggc 480
ggctgttgtt cctgtcgcga cacacggcgc cgctctgcgg tattcggggg ggagggggat 540
ccagtcggcc ccgcggagtt cgtctcggac gaccggtcgt ccgattccga ctcggatgac 600
tcggaggaca cggactcgga gacgctgtca cacgcctcct cggacgtgtc cggcggggcc 660
acgtacgacg acgcccttga ctccgattcg tcatcggatg actccctgca gatagatggc 720
cccgtgtgtc gcccgtggag caatgacacc gcgcccctgg atgtttgccc cgggaccccc 780
ggcccgggcg ccgacgccgg tggtccctca gcggtagacc cacacgcgcc gacgccagag 840
gccggcgctg gtcttgcggc cgatcccgcc gtggcccggg acgacgcgga ggggctttcg 900
gacccccggc cacgtctggg aacgggcacg gcctaccccg tccccctgga actcacgccc 960
gagaacgcgg aggccgtggc gcgctttctg ggagatgccg tgaaccgcga acccgcgctc 1020
atgctggagt acttttgccg gtgcgcccgc gaggaaacca agcgtgtccc ccccaggaca 1080
ttcggcagcc cccctcgcct cacggaggac gactttgggc ttctcaacta cgcgctcgtg 1140
gagatgcagc gcctgtgtct ggacgttcct ccggtcccgc cgaacgcata catgccctat 1200
tatctcaggg agtatgtgac gcggctggtc aacgggttca agccgctggt gagccggtcc 1260
gctcgccttt accgcatcct gggggttctg gtgcacctgc ggatccggac ccgggaggcc 1320
tcctttgagg agtggctgcg atccaaggaa gtggccctgg attttggcct gacggaaagg 1380
cttcgcgagc acgaagccca gctggtgatc ctggcccagg ctctggacca ttacgactgt 1440
ctgatccaca gcacaccgca cacgctggtc gagcgggggc tgcaatcggc cctgaagtat 1500
gaggagtttt acctaaagcg ttttggcggg cactacatgg agtccgtctt ccagatgtac 1560
acccgcatcg ccggcttttt ggcctgccgg gccacgcgcg gcatgcgcca catcgccctg 1620
gggcgagagg ggtcgtggtg ggaaatgttc aagttctttt tccaccgcct ctacgaccac 1680
cagatcgtac cgtcgacccc cgccatgctg aacctgggga cccgcaacta ctacacctcc 1740
agctgctacc tggtaaaccc ccaggccacc acaaacaagg cgaccctgcg ggccatcacc 1800
agcaacgtca gtgccatcct cgcccgcaac gggggcatcg ggctatgcgt gcaggcgttt 1860
aacgactccg gccccgggac cgccagcgtc atgcccgccc tcaaggtcct tgactcgctg 1920
gtggcggcgc acaacaaaga gagcgcgcgt ccgaccggcg cgtgcgtgta cctggagccg 1980
tggcacaccg acgtgcgggc cgtgctccgg atgaaggggg tcctcgccgg cgaagaggcc 2040
cagcgctgcg acaatatctt cagcgccctc tggatgccag acctgttttt caagcgcctg 2100
attcgccacc tggacggcga gaagaacgtc acatggaccc tgttcgaccg ggacaccagc 2160
atgtcgctcg ccgactttca cggggaggag ttcgagaagc tctaccagca cctcgaggtc 2220
atggggttcg gcgagcagat acccatccag gagctggcct atggcattgt gcgcagtgcg 2280
gccacgaccg ggagcccctt cgtcatgttc aaagacgcgg tgaaccgcca ctacatctac 2340
gacacccagg gggcggccat cgccggctcc aacctctgca ccgagatcgt ccatccggcc 2400
tccaagcgat ccagtggggt ctgcaacctg ggaagcgtga atctggcccg atgcgtctcc 2460
aggcagacgt ttgactttgg gcggctccgc gacgccgtgc aggcgtgcgt gctgatggtg 2520
aacatcatga tcgacagcac gctacaaccc acgccccagt gcacccgcgg caacgacaac 2580
ctgcggtcca tgggaatcgg catgcagggc ctgcacacgg cctgcctgaa gctggggctg 2640
gatctggagt ctgtcgaatt tcaggacctg aacaaacaca tcgccgaggt gatgctgctg 2700
tcggcgatga agaccagcaa cgcgctgtgc gttcgcgggg cccgtccctt caaccacttt 2760
aagcgcagca tgtatcgcgc cggccgcttt cactgggagc gctttccgga cgcccggccg 2820
cggtacgagg gcgagtggga gatgctacgc cagagcatga tgaaacacgg cctgcgcaac 2880
agccagtttg tcgcgctgat gcccaccgcc gcctcggcgc agatctcgga cgtcagcgag 2940
ggctttgccc ccctgttcac caacctgttc agcaaggtga cccgggacgg cgagacgctg 3000
cgccccaaca cgctcctgct aaaggaactg gaacgcacgt ttagcgggaa gcgcctcctg 3060
gaggtgatgg acagtctcga cgccaagcag tggtccgtgg cgcaggcgct cccgtgcctg 3120
gagcccaccc accccctccg gcgattcaag accgcgtttg actacgacca gaagttgctg 3180
atcgacctgt gtgcggaccg cgccccctac gtcgaccata gccaatccat gaccctgtat 3240
gtcacggaga aggcggacgg gaccctccca gcctccaccc tggtccgcct tctggtccac 3300
gcatataagc gcggactaaa aacagggatg tactactgca aggttcgcaa ggcgaccaac 3360
agcggggtct ttggcggcga cgacaacatt gtctgcacga gctgcgcgct gtga 3414
<210> 50
<211> 1137
<212> PRT
<213> Herpes simplex virus type 1
<400> 50
Met Ala Ser Arg Pro Ala Ala Ser Ser Pro Val Glu Ala Arg Ala Pro
1 5 10 15
Val Gly Gly Gln Glu Ala Gly Gly Pro Ser Ala Ala Thr Gln Gly Glu
20 25 30
Ala Ala Gly Ala Pro Leu Ala His Gly His His Val Tyr Cys Gln Arg
35 40 45
Val Asn Gly Val Met Val Leu Ser Asp Lys Thr Pro Gly Ser Ala Ser
50 55 60
Tyr Arg Ile Ser Asp Ser Asn Phe Val Gln Cys Gly Ser Asn Cys Thr
65 70 75 80
Met Ile Ile Asp Gly Asp Val Val Arg Gly Arg Pro Gln Asp Pro Gly
85 90 95
Ala Ala Ala Ser Pro Ala Pro Phe Val Ala Val Thr Asn Ile Gly Ala
100 105 110
Gly Ser Asp Gly Gly Thr Ala Val Val Ala Phe Gly Gly Thr Pro Arg
115 120 125
Arg Ser Ala Gly Thr Ser Thr Gly Thr Gln Thr Ala Asp Val Pro Thr
130 135 140
Glu Ala Leu Gly Gly Pro Pro Pro Pro Pro Arg Phe Thr Leu Gly Gly
145 150 155 160
Gly Cys Cys Ser Cys Arg Asp Thr Arg Arg Arg Ser Ala Val Phe Gly
165 170 175
Gly Glu Gly Asp Pro Val Gly Pro Ala Glu Phe Val Ser Asp Asp Arg
180 185 190
Ser Ser Asp Ser Asp Ser Asp Asp Ser Glu Asp Thr Asp Ser Glu Thr
195 200 205
Leu Ser His Ala Ser Ser Asp Val Ser Gly Gly Ala Thr Tyr Asp Asp
210 215 220
Ala Leu Asp Ser Asp Ser Ser Ser Asp Asp Ser Leu Gln Ile Asp Gly
225 230 235 240
Pro Val Cys Arg Pro Trp Ser Asn Asp Thr Ala Pro Leu Asp Val Cys
245 250 255
Pro Gly Thr Pro Gly Pro Gly Ala Asp Ala Gly Gly Pro Ser Ala Val
260 265 270
Asp Pro His Ala Pro Thr Pro Glu Ala Gly Ala Gly Leu Ala Ala Asp
275 280 285
Pro Ala Val Ala Arg Asp Asp Ala Glu Gly Leu Ser Asp Pro Arg Pro
290 295 300
Arg Leu Gly Thr Gly Thr Ala Tyr Pro Val Pro Leu Glu Leu Thr Pro
305 310 315 320
Glu Asn Ala Glu Ala Val Ala Arg Phe Leu Gly Asp Ala Val Asn Arg
325 330 335
Glu Pro Ala Leu Met Leu Glu Tyr Phe Cys Arg Cys Ala Arg Glu Glu
340 345 350
Thr Lys Arg Val Pro Pro Arg Thr Phe Gly Ser Pro Pro Arg Leu Thr
355 360 365
Glu Asp Asp Phe Gly Leu Leu Asn Tyr Ala Leu Val Glu Met Gln Arg
370 375 380
Leu Cys Leu Asp Val Pro Pro Val Pro Pro Asn Ala Tyr Met Pro Tyr
385 390 395 400
Tyr Leu Arg Glu Tyr Val Thr Arg Leu Val Asn Gly Phe Lys Pro Leu
405 410 415
Val Ser Arg Ser Ala Arg Leu Tyr Arg Ile Leu Gly Val Leu Val His
420 425 430
Leu Arg Ile Arg Thr Arg Glu Ala Ser Phe Glu Glu Trp Leu Arg Ser
435 440 445
Lys Glu Val Ala Leu Asp Phe Gly Leu Thr Glu Arg Leu Arg Glu His
450 455 460
Glu Ala Gln Leu Val Ile Leu Ala Gln Ala Leu Asp His Tyr Asp Cys
465 470 475 480
Leu Ile His Ser Thr Pro His Thr Leu Val Glu Arg Gly Leu Gln Ser
485 490 495
Ala Leu Lys Tyr Glu Glu Phe Tyr Leu Lys Arg Phe Gly Gly His Tyr
500 505 510
Met Glu Ser Val Phe Gln Met Tyr Thr Arg Ile Ala Gly Phe Leu Ala
515 520 525
Cys Arg Ala Thr Arg Gly Met Arg His Ile Ala Leu Gly Arg Glu Gly
530 535 540
Ser Trp Trp Glu Met Phe Lys Phe Phe Phe His Arg Leu Tyr Asp His
545 550 555 560
Gln Ile Val Pro Ser Thr Pro Ala Met Leu Asn Leu Gly Thr Arg Asn
565 570 575
Tyr Tyr Thr Ser Ser Cys Tyr Leu Val Asn Pro Gln Ala Thr Thr Asn
580 585 590
Lys Ala Thr Leu Arg Ala Ile Thr Ser Asn Val Ser Ala Ile Leu Ala
595 600 605
Arg Asn Gly Gly Ile Gly Leu Cys Val Gln Ala Phe Asn Asp Ser Gly
610 615 620
Pro Gly Thr Ala Ser Val Met Pro Ala Leu Lys Val Leu Asp Ser Leu
625 630 635 640
Val Ala Ala His Asn Lys Glu Ser Ala Arg Pro Thr Gly Ala Cys Val
645 650 655
Tyr Leu Glu Pro Trp His Thr Asp Val Arg Ala Val Leu Arg Met Lys
660 665 670
Gly Val Leu Ala Gly Glu Glu Ala Gln Arg Cys Asp Asn Ile Phe Ser
675 680 685
Ala Leu Trp Met Pro Asp Leu Phe Phe Lys Arg Leu Ile Arg His Leu
690 695 700
Asp Gly Glu Lys Asn Val Thr Trp Thr Leu Phe Asp Arg Asp Thr Ser
705 710 715 720
Met Ser Leu Ala Asp Phe His Gly Glu Glu Phe Glu Lys Leu Tyr Gln
725 730 735
His Leu Glu Val Met Gly Phe Gly Glu Gln Ile Pro Ile Gln Glu Leu
740 745 750
Ala Tyr Gly Ile Val Arg Ser Ala Ala Thr Thr Gly Ser Pro Phe Val
755 760 765
Met Phe Lys Asp Ala Val Asn Arg His Tyr Ile Tyr Asp Thr Gln Gly
770 775 780
Ala Ala Ile Ala Gly Ser Asn Leu Cys Thr Glu Ile Val His Pro Ala
785 790 795 800
Ser Lys Arg Ser Ser Gly Val Cys Asn Leu Gly Ser Val Asn Leu Ala
805 810 815
Arg Cys Val Ser Arg Gln Thr Phe Asp Phe Gly Arg Leu Arg Asp Ala
820 825 830
Val Gln Ala Cys Val Leu Met Val Asn Ile Met Ile Asp Ser Thr Leu
835 840 845
Gln Pro Thr Pro Gln Cys Thr Arg Gly Asn Asp Asn Leu Arg Ser Met
850 855 860
Gly Ile Gly Met Gln Gly Leu His Thr Ala Cys Leu Lys Leu Gly Leu
865 870 875 880
Asp Leu Glu Ser Val Glu Phe Gln Asp Leu Asn Lys His Ile Ala Glu
885 890 895
Val Met Leu Leu Ser Ala Met Lys Thr Ser Asn Ala Leu Cys Val Arg
900 905 910
Gly Ala Arg Pro Phe Asn His Phe Lys Arg Ser Met Tyr Arg Ala Gly
915 920 925
Arg Phe His Trp Glu Arg Phe Pro Asp Ala Arg Pro Arg Tyr Glu Gly
930 935 940
Glu Trp Glu Met Leu Arg Gln Ser Met Met Lys His Gly Leu Arg Asn
945 950 955 960
Ser Gln Phe Val Ala Leu Met Pro Thr Ala Ala Ser Ala Gln Ile Ser
965 970 975
Asp Val Ser Glu Gly Phe Ala Pro Leu Phe Thr Asn Leu Phe Ser Lys
980 985 990
Val Thr Arg Asp Gly Glu Thr Leu Arg Pro Asn Thr Leu Leu Leu Lys
995 1000 1005
Glu Leu Glu Arg Thr Phe Ser Gly Lys Arg Leu Leu Glu Val Met
1010 1015 1020
Asp Ser Leu Asp Ala Lys Gln Trp Ser Val Ala Gln Ala Leu Pro
1025 1030 1035
Cys Leu Glu Pro Thr His Pro Leu Arg Arg Phe Lys Thr Ala Phe
1040 1045 1050
Asp Tyr Asp Gln Lys Leu Leu Ile Asp Leu Cys Ala Asp Arg Ala
1055 1060 1065
Pro Tyr Val Asp His Ser Gln Ser Met Thr Leu Tyr Val Thr Glu
1070 1075 1080
Lys Ala Asp Gly Thr Leu Pro Ala Ser Thr Leu Val Arg Leu Leu
1085 1090 1095
Val His Ala Tyr Lys Arg Gly Leu Lys Thr Gly Met Tyr Tyr Cys
1100 1105 1110
Lys Val Arg Lys Ala Thr Asn Ser Gly Val Phe Gly Gly Asp Asp
1115 1120 1125
Asn Ile Val Cys Thr Ser Cys Ala Leu
1130 1135
<210> 51
<211> 747
<212> DNA
<213> Herpes simplex virus type 1
<400> 51
atggcccgcc gccgccgcca tcgcggcccc cgccgccccc ggccgcccgg gcccacgggc 60
gccgtcccaa ccgcacagtc ccaggtaacc tccacgccca actcggaacc cgcggtcagg 120
agcgcgcccg cggccgcccc gccgccgccc cccgccggtg ggcccccgcc ttcttgttcg 180
ctgctgctgc gccagtggct ccacgttccc gagtccgcgt ccgacgacga cgatgacgac 240
gactggccgg acagcccccc gcccgagccg gcgccagagg cccggcccac cgccgccgcc 300
ccccggcccc ggcccccacc gcccggcgtg ggcccggggg gcggggctga cccctcccac 360
cccccctcgc gccccttccg ccttccgccg cgcctcgccc tccgcctgcg cgtcaccgcg 420
gagcacctgg cgcgcctgcg cctgcgacgc gcgggcgggg agggggcgcc ggagcccccc 480
gcgacccccg cgacccccgc gacccccgcg acccccgcga cccccgcgcg ggtgcgcttc 540
tcgccccacg tccgggtgcg ccacctggtg gtctgggcct cggccgcccg cctggcgcgc 600
cgcggctcgt gggcccgcga gcgggccgac cgggctcggt tccggcgccg ggtggcggag 660
gccgaggcgg tcatcgggcc gtgcctgggg cccgaggccc gtgcccgggc cctggcccgc 720
ggagccggcc cggcgaactc ggtctaa 747
<210> 52
<211> 248
<212> PRT
<213> Herpes simplex virus type 1
<400> 52
Met Ala Arg Arg Arg Arg His Arg Gly Pro Arg Arg Pro Arg Pro Pro
1 5 10 15
Gly Pro Thr Gly Ala Val Pro Thr Ala Gln Ser Gln Val Thr Ser Thr
20 25 30
Pro Asn Ser Glu Pro Ala Val Arg Ser Ala Pro Ala Ala Ala Pro Pro
35 40 45
Pro Pro Pro Ala Gly Gly Pro Pro Pro Ser Cys Ser Leu Leu Leu Arg
50 55 60
Gln Trp Leu His Val Pro Glu Ser Ala Ser Asp Asp Asp Asp Asp Asp
65 70 75 80
Asp Trp Pro Asp Ser Pro Pro Pro Glu Pro Ala Pro Glu Ala Arg Pro
85 90 95
Thr Ala Ala Ala Pro Arg Pro Arg Pro Pro Pro Pro Gly Val Gly Pro
100 105 110
Gly Gly Gly Ala Asp Pro Ser His Pro Pro Ser Arg Pro Phe Arg Leu
115 120 125
Pro Pro Arg Leu Ala Leu Arg Leu Arg Val Thr Ala Glu His Leu Ala
130 135 140
Arg Leu Arg Leu Arg Arg Ala Gly Gly Glu Gly Ala Pro Glu Pro Pro
145 150 155 160
Ala Thr Pro Ala Thr Pro Ala Thr Pro Ala Thr Pro Ala Thr Pro Ala
165 170 175
Arg Val Arg Phe Ser Pro His Val Arg Val Arg His Leu Val Val Trp
180 185 190
Ala Ser Ala Ala Arg Leu Ala Arg Arg Gly Ser Trp Ala Arg Glu Arg
195 200 205
Ala Asp Arg Ala Arg Phe Arg Arg Arg Val Ala Glu Ala Glu Ala Val
210 215 220
Ile Gly Pro Cys Leu Gly Pro Glu Ala Arg Ala Arg Ala Leu Ala Arg
225 230 235 240
Gly Ala Gly Pro Ala Asn Ser Val
245
<210> 53
<211> 3229
<212> DNA
<213> Herpes simplex virus type 1
<220>
<221> Intron
<222> (58)..(822)
<223> intron
<220>
<221> Intron
<222> (1490)..(1625)
<223> intron
<400> 53
atggagcccc gccccggagc gagtacccgc cggcctgagg gccgccccca gcgcgaggtg 60
aggggccggg cgccatgtct ggggcgccat attggggggc gccatattgg ggggcgccat 120
gttgggggac ccccgaccct tacactggaa ccggccgcca tgttggggga cccccactca 180
tacacgggag ccgggcgcca tgttggggcg ccatgttagg gggcgtggaa ccccgtgaca 240
ctatatatac agggaccggg ggcgccatgt tagggggtgc ggaaccccct gaccctatat 300
atacagggac cggggtcgcc ctgttggggg tcgccatgtg accccctgac tttatatata 360
cagaccccca acacatacac atggcccctt tgactcagac gcagggcccg gggtcgccgt 420
gggaccccct gactcataca cagagacacg cccccacaac aaacacacag ggaccggggt 480
cgccgtgttg ggggcgtggt ccccactgac tcatacgcag gcccccctta ctcacacgca 540
tctagggggg tggggaggag ccgcccgcca tatttggggg acgccgtggg acccccgact 600
ccggtgcgtc tggagggcgg gagaagaggg aagaagaggg gtcgggatcc aaaggacgga 660
cccagaccac ctttggttgc agaccccttt ctcccccctc ttccgaggcc agcagggggg 720
caggactttg tgaggcgggg gggggagagg gggaactcgt gggtgctgat tgacgcggga 780
aatccccccc cattcttacc cgcccccctt ttttcccctt agcccgcccc ggatgtctgg 840
gtgtttccct gcgaccgaga cctgccggac agcagcgact ctgaggcgga gaccgaagtg 900
ggggggcggg gggacgccga ccaccatgac gacgactccg cctccgaggc ggacagcacg 960
gacacggaac tgttcgagac ggggctgctg gggccgcagg gcgtggatgg gggggcggtc 1020
tcggggggga gccccccccg cgaggaagac cccggcagtt gcgggggcgc cccccctcga 1080
gaggacgggg ggagcgacga gggcgacgtg tgcgccgtgt gcacggatga gatcgcgccc 1140
cacctgcgct gcgacacctt cccgtgcatg caccgcttct gcatcccgtg catgaaaacc 1200
tggatgcaat tgcgcaacac ctgcccgctg tgcaacgcca agctggtgta cctgatagtg 1260
ggcgtgacgc ccagcgggtc gttcagcacc atcccgatcg tgaacgaccc ccagacccgc 1320
atggaggccg aggaggccgt cagggcgggc acggccgtgg actttatctg gacgggcaat 1380
cagcggttcg ccccgcggta cctgaccctg ggggggcaca cggtgagggc cctgtcgccc 1440
acccacccgg agcccaccac ggacgaggat gacgacgacc tggacgacgg tgaggcgggg 1500
ggcggcaagg accctggggg aggaggagga ggaggggggg ggagggagga ataggcgggc 1560
gggcgaggaa agggcgggcc ggggaggggg cgtaacctga tcgcgccccc cgttgtctct 1620
tgcagcagac tacgtaccgc ccgccccccg ccggacgccc cgcgcccccc cacgcagagg 1680
cgccgccgcg ccccccgtga cgggcggggc gtctcacgca gccccccagc cggccgcggc 1740
tcggacagcg cccccctcgg cgcccatcgg gccacacggc agcagtaaca ccaacaccac 1800
caccaacagc agcggcggcg gcggctcccg ccagtcgcga gccgcggcgc cgcggggggc 1860
gtctggcccc tccggggggg ttggggttgg ggttggggtt gttgaagcgg aggcggggcg 1920
gccgaggggc cggacgggcc cccttgtcaa cagacccgcc ccccttgcaa acaacagaga 1980
ccccatagtg atcagcgact cccccccggc ctctccccac aggccccccg cggcgcccat 2040
gccaggctcc gccccccgcc ccgggccccc cgcgtccgcg gccgcgtcgg gacccgcgcg 2100
cccccgcgcg gccgtggccc cgtgcgtgcg agcgccgcct ccggggcccg gcccccgcgc 2160
cccggccccc ggggcggagc cggccgcccg ccccgcggac gcgcgccgtg tgccccagtc 2220
gcactcgtcc ctggctcagg ccgcgaacca agaacagagt ctgtgccggg cgcgtgcgac 2280
ggtggcgcgc ggctcggggg ggccgggcgt ggagggtggg cacgggccct cccgcggcgc 2340
cgccccctcc ggcgccgccc cgctcccctc cgccgcctct gtcgagcagg aggcggcggt 2400
gcgtccgagg aagaggcgcg ggtcgggcca ggaaaacccc tccccccagt ccacgcgtcc 2460
ccccctcgcg ccggcagggg ccaagagggc ggcgacgcac cccccctccg actcagggcc 2520
gggggggcgc ggccagggtg ggcccgggac ccccctgacg tcctcggcgg cctccgcctc 2580
ttcctcctct gcctcttcct cctcggcccc gacccccgcg ggggccgcct cttccgccgc 2640
cggggccgcg tcctcctccg cttccgcctc ctcgggcggg gccgtcggtg ccctgggagg 2700
gagacaagag gaaacctccc tcggcccccg cgctgcttct gggccgcggg ggccgaggaa 2760
gtgtgcccgg aagacgcgcc acgcggagac ttccggggcc gtccccgcgg gcggcctcac 2820
gcgctacctg cccatctcgg gggtctctag cgtggtcgcc ctgtcgcctt acgtgaacaa 2880
gactatcacg ggggactgcc tgcccatcct ggacatggag acggggaaca tcggggcgta 2940
cgtggtcctg gtggaccaga cgggaaacat ggcgacccgg ctgcgggccg cggtccccgg 3000
ctggagccgc cgcaccctgc tccccgagac cgcgggtaac cacgtgatgc cccccgagta 3060
cccgacggcc cccgcgtcgg agtggaacag cctctggatg acccccgtgg ggaacatgct 3120
gttcgaccag ggcaccctag tgggcgccct ggacttccgc agcctgcggt ctcggcaccc 3180
gtggtccggg gagcaggggg cgtcgacccg ggacgaggga aaacaataa 3229
Claims (51)
- 비-자연적인 단순 헤르페스 바이러스 ("HSV")로서, 바이러스는:
(a) 당단백질 E ("gE")-암호화 유전자,
(b) 감염된 세포 단백질 0 ("ICP0")-암호화 유전자,
(c) DNA 포장 터미나제 하위단위 1-암호화 유전자,
(d) ICP8-암호화 유전자, 또는
(e) ICP34.5-암호화 유전자
의 그룹으로부터 유래되는 병독성 유전자에 하나 이상의 돌연변이(들)를 포함하는 비-자연적인 HSV. - 제1항에 있어서, HSV는 기능장애 ICP34.5 단백질을 암호화하는 유전자 및/또는 기능장애 ICP6 단백질을 암호화하는 유전자를 추가로 포함하는 것을 특징으로 하는 비-자연적인 HSV.
- 제2항에 있어서, 기능장애 ICP34.5 단백질을 암호화하는 유전자는 SEQ ID NO. 5, SEQ ID NO. 7로부터 선택된 서열 및 SEQ ID No. 5, 또는 7과 적어도 95% 동일한 서열을 가지며 SEQ ID No. 5, 또는 7 중 어느 하나의 뉴클레오타이드에서 돌연변이를 유지하는 폴리뉴클레오타이드를 포함하는 것을 특징으로 하는 비-자연적인 HSV.
- 제2항에 있어서, 기능장애 ICP6 단백질을 암호화하는 유전자는 SEQ ID NO. 45, SEQ ID NO. 47로부터 선택된 서열 및 SEQ ID No. 45, 또는 47과 적어도 95% 동일한 서열을 가지며 SEQ ID No. 45, 또는 47 중 어느 하나의 뉴클레오타이드에서 돌연변이를 유지하는 폴리뉴클레오타이드를 포함하는 것을 특징으로 하는 비-자연적인 HSV.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 병독성 유전자의 돌연변이는 삽입, 결실, 절단, 프레임시프트, 치환, 또는 점 돌연변이를 포함하는 것을 특징으로 하는 비-자연적인 HSV.
- 제1항 내지 제5항 중 어느 한 항에 있어서, HSV는 기능적 ICP34.5 단백질 및/또는 기능적 ICP6 단백질을 암호호하는 유전자가 결핍된 것을 특징으로 하는 비-자연적인 HSV.
- 제1항 내지 제6항 중 어느 한 항에 있어서, 돌연변이는 병독성 유전자의 비동의적 돌연변이인 것을 특징으로 하는 비-자연적인 HSV.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 돌연변이 또는 동등물은:
(a) gE 단백질의 위치 151에서 알라닌에서 트레오닌으로의 돌연변이,
(b) ICP0 단백질의 위치 258에서 아르기닌에서 히스티딘으로의 돌연변이,
(c) DNA 포장 터미나제 하위단위 1 단백질의 위치 376에서 알라닌에서 트레오닌으로의 돌연변이,
(d) ICP8 단백질의 위치 1155에서 트레오닌에서 메티오닌으로의 돌연변이, 또는
(e) ICP34.5 단백질의 위치 119에서 프롤린에서 히스티딘으로의 돌연변이
를 암호화하는 것을 특징으로 하는 비-자연적인 HSV 또는 그것의 동등물. - 제1항 내지 제8항 중 어느 한 항에 있어서, 다음 중 하나 이상을 포함하는 것을 특징으로 하는 비-자연적인 HSV:
(a) SEQ ID NO. 2, 6, 8, 10, 및 52로부터 선택된 아미노산 서열을 암호화하는 폴리뉴클레오타이드, 및/또는 SEQ ID NO. 1, 5, 7, 9, 및 51로부터 선택된 서열을 갖는 폴리뉴클레오타이드;
(b) SEQ ID NO. 2, 6, 8, 10, 및 52로부터 선택된 아미노산 서열을 갖는 폴리펩타이드;
(c) SEQ ID NO. 13, 15, 17 및 19로부터 선택된 아미노산 서열을 암호화하는 폴리뉴클레오타이드, 및/또는 SEQ ID NO. 12, 14, 16 및 18로부터 선택된 서열을 갖는 폴리뉴클레오타이드;
(d) SEQ ID NO. 13, 15, 17 및 19로부터 선택된 아미노산 서열을 갖는 폴리펩타이드;
(e) SEQ ID NO. 21, 23 및 26으로부터 선택된 아미노산 서열을 암호화하는 폴리뉴클레오타이드, 및/또는 SEQ ID NO. 20, 22, 24, 25, 및 53으로부터 선택된 서열, 또는 하나 또는 둘 이상의 인트론이 없는 그것의 서열을 갖는 폴리뉴클레오타이드;
(f) SEQ ID NO. 21, 23 및 26으로부터 선택된 아미노산 서열을 갖는 폴리펩타이드;
(g) SEQ ID NO. 28, 30, 32 및 34로부터 선택된 아미노산 서열을 암호화하는 폴리뉴클레오타이드, 및/또는 SEQ ID NO. 27, 29, 31, 및 33으로부터 선택된 서열을 갖는 폴리뉴클레오타이드;
(h) SEQ ID NO. 28, 30, 32 및 34로부터 선택된 아미노산 서열을 갖는 폴리펩타이드;
(i) SEQ ID NO. 36, 38, 40, 및 42로부터 선택된 아미노산 서열을 암호화하는 폴리뉴클레오타이드, 및/또는 SEQ ID NO. 35, 37, 39 및 41로부터 선택된 서열을 갖는 폴리뉴클레오타이드;
(j) SEQ ID NO. 36, 38, 40, 및 42로부터 선택된 아미노산 서열을 갖는 폴리펩타이드;
(k) SEQ ID NO. 44, 46, 48 및 50으로부터 선택된 아미노산 서열을 암호화하는 폴리뉴클레오타이드, 및/또는 SEQ ID NO. 43, 45, 47 및 49로부터 선택된 서열을 갖는 폴리뉴클레오타이드;
(l) SEQ ID NO. 44, 46, 48 및 50으로부터 선택된 아미노산 서열을 갖는 폴리펩타이드. - 제1항 내지 제9항 중 어느 한 항에 있어서, 17TermA HSV로부터 유래된 병독성 유전자의 적어도 단편과 동일한 서열을 갖는 폴리뉴클레오타이드를 추가로 포함하는 것을 특징으로 하는 비-자연적인 HSV.
- 제1항 내지 제10항 중 어느 한 항에 있어서, rRp450 HSV로부터 유래된 병독성 유전자의 적어도 단편과 동일한 서열을 갖는 폴리뉴클레오타이드를 추가로 포함하는 것을 특징으로 하는 비-자연적인 HSV.
- 제1항 내지 제11항 중 어느 한 항에 있어서, HSV는 HSV 유형 1 ("HSV-1") 또는 HSV 유형 2 ("HSV-2") 스트레인으로부터 유래되는 것을 특징으로 하는 비-자연적인 HSV.
- 제1항 내지 제11항 중 어느 한 항에 있어서, HSV는 HSV-1 KOS 스트레인으로부터 유래되는 것을 특징으로 하는 비-자연적인 HSV.
- 제1항 내지 제13항 중 어느 한 항에 있어서, 도입유전자를 추가로 포함하는 것을 특징으로 하는 비-자연적인 HSV.
- 제1항 내지 제14항 중 어느 한 항의 비-자연적인 HSV 및 담체를 포함하는 조성물.
- 제14항에 있어서, 담체는 제약학적으로 이용 가능한 담체인 것을 특징으로 하는 조성물.
- 제15항 또는 제16항에 있어서, 상당한 병독성의 손실 없이 비-자연적인 HSV를 냉동 및 해동하는 것을 용이하게 하는 냉동보존제를 추가로 포함하는 것을 특징으로 하는 조성물.
- 제1항 내지 제14항 중 어느 한 항의 비-자연적인 HSV로 감염된 비-인간 포유류.
- 제1항 내지 제14항 중 어느 한 항의 비-자연적인 HSV로 감염된 세포, 선택적으로 림프구.
- 세포를 감염시키는 방법으로서, 세포를 제1항 내지 제14항 중 어느 한 항의 비-자연적인 HSV 또는 제15항 내지 제17항 중 어느 한 항의 조성물과 접촉시키는 단계를 포함하는 방법.
- 제20항에 있어서, 세포는 림프구인 것을 특징으로 하는 방법.
- 제20항 또는 제21항에 있어서, 세포는 엡스타인-바 바이러스 ("EBV")로 감염된 것을 특징으로 하는 방법.
- 바이러스 벡터를 제조하는 방법으로서, 제1항 내지 제13항 중 어느 한 항의 비-자연적인 HSV에 도입유전자를 도입시키는 단계를 포함하는 방법.
- 암 세포의 성장 또는 전이를 억제하는 방법으로서, 세포를 유효량의 제1항 내지 제14항 중 어느 한 항의 비-자연적인 HSV 또는 제15항 내지 제17항 중 어느 한 항의 조성물과 접촉시키는 단계를 포함하는 방법.
- 제24항에 있어서, 접촉은 시험관내에서 또는 생체내에서 이루어지는 것을 특징으로 하는 방법.
- 제24항에 있어서, 접촉은 비-자연적인 HSV의 대상체에의 투여에 의해 생체내에서 이루어지는 것을 특징으로 하는 방법.
- 대상체에서 암을 치료하는 방법으로서, 대상체에게 유효량의 제1항 내지 제14항 중 어느 한 항의 비-자연적인 HSV 또는 제15항 내지 제17항 중 어느 한 항의 조성물을 투여하는 단계를 포함하는 방법.
- 제24항 내지 제27항 중 어느 한 항에 있어서, 암은 유형의 것이거나, 암 세포는 유형: 췌장암, 신장암, 소세포 폐암, 뇌암, 신경암, 골암, 림프종, 골수종, 결장암, 자궁암, 유방암, 백혈병, 간암, 전립선암, 피부암, 또는 흑색종의 세포로부터 선택되는 것을 특징으로 하는 방법.
- 제27항 또는 제28항에 있어서, HSV 벡터 또는 제약학적 조성물은 주사, 주입, 점적, 및/또는 흡입에 의해 투여되는 것을 특징으로 하는 방법.
- 제27항 또는 제28항에 있어서, 투여는 일차 치료법, 이차 치료법, 삼차 치료법, 사차 치료법, 또는 오차 치료법으로 이루어지는 군의 치료법을 포함하는 것을 특징으로 하는 방법.
- 제27항에 있어서, 대상체에게 유효량의 항암 치료법을 투여하는 단계를 추가로 포함하는 것을 특징으로 하는 방법.
- 제27항 내지 제31항 중 어느 한 항에 있어서, 대상체는 포유류인 것을 특징으로 하는 방법.
- 제32항에 있어서, 포유류는 인간, 마우스, 래트, 기니아 피그, 비-인간 영장류, 개, 고양이, 말, 소, 돼지, 염소, 또는 양으로 이루어지는 군으로부터 유래되는 것을 특징으로 하는 방법.
- 제32항에 있어서, 대상체는 인간인 것을 특징으로 하는 방법.
- 제1항 내지 제13항 중 어느 한 항의 HSV 벡터를 제조하는 방법으로서,
(a) 숙주 세포에 17TermA HSV 벡터 및 rRp450 HSV 벡터를 도입하는 단계;
(b) 숙주 세포를 적어도 3회 계대 동안 성장시키는 단계; 및
(c) 숙주 세포에 의해 생성된 HSV 입자를 분리하는 단계
를 포함하는 방법. - 제35항에 있어서, HSV는 숙주 세포에 트랜스펙션, 감염, 형질전환, 전기천공, 주사, 미세주사, 또는 이것들의 조합에 의해 도입되는 것을 특징으로 하는 방법.
- 제35항 또는 제36항에 있어서, 숙주 세포는 적어도 3회 계대, 10회 계대, 20회 계대, 30회 계대, 40회 계대, 또는 50회 계대 동안 성장되는 것을 특징으로 하는 방법.
- 제35항 내지 제37항 중 어느 한 항에 있어서, 숙주 세포는 도입된 HSV 벡터의 복제를 지지하기 위해 보완하는 유전자 생성물을 포함하는 것을 특징으로 하는 방법.
- 제38항에 있어서, 보완하는 유전자는 ICP6 단백질 및/또는 ICP34.5 단백질을 암호화하는 것을 특징으로 하는 방법.
- 제35항 내지 제39항 중 어느 한 항에 있어서, HSV 벡터에 도입유전자를 도입하는 단계를 추가로 포함하는 것을 특징으로 하는 방법.
- 제35항 내지 제40항 중 어느 한 항의 방법에 의해 제조된 HSV 입자.
- 세포 용해를 유도하는 방법으로서, 세포를 제1항 내지 제14항 중 어느 한 항의 비-자연적인 HSV 또는 제15항 내지 제17항 중 어느 한 항의 조성물과 접촉시키는 단계를 포함하는 방법.
- 제42항에 있어서, 세포는 암 세포인 것을 특징으로 하는 방법.
- 제1항 내지 제14항 중 어느 한 항의 HSV 벡터 또는 제15항 내지 제17항 중 어느 한 항의 조성물, 및 사용 설명서를 포함하는 키트.
- 제1항 내지 제13항 중 어느 한 항의 HSV 벡터를 제조하는 방법으로서,
(a) 숙주 세포에 HSV 벡터의 바이러스 게놈을 암호화하는 폴리뉴클레오타이드를 도입하는 단계;
(b) 숙주 세포를 성장시키는 단계; 및
(c) 숙주 세포에 의해 생성된 HSV 입자를 분리하는 단계
를 포함하는 방법. - 제45항에 있어서, 폴리뉴클레오타이드는 트랜스펙션, 감염, 형질전환, 전기천공, 주사, 미세주사, 또는 이것들의 조합에 의해 숙주 세포에 도입되는 것을 특징으로 하는 방법.
- 제45항 또는 제46항에 있어서, 바이러스 게놈을 암호화하는 핵산 서열은 벡터의 숙주 세포에 도입되는 것을 특징으로 하는 방법.
- 제47항에 있어서, 벡터는 HSV 또는 플라스미드인 것을 특징으로 하는 방법.
- 제45항 내지 제48항 중 어느 한 항에 있어서, 숙주 세포는 도입된 HSV 벡터의 복제를 지지하기 위하여 보완하는 유전자 생성물을 포함하는 것을 특징으로 하는 방법.
- 제45항 내지 제49항 중 어느 한 항에 있어서, 분리된 HSV는 실질적으로 숙주 세포, 세포 파편, 배양 배지 또는 숙주 세포 배양에 사용된 임의의 다른 작용제가 없는 것을 특징으로 하는 방법.
- 제45항 내지 제50항 중 어느 한 항에 있어서, 분리는 원심분리, 여과, 크로마토그래피, 또는 이것들의 임의의 조합을 통해 이루어지는 것을 특징으로 하는 방법.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962818577P | 2019-03-14 | 2019-03-14 | |
US62/818,577 | 2019-03-14 | ||
US201962932725P | 2019-11-08 | 2019-11-08 | |
US62/932,725 | 2019-11-08 | ||
PCT/US2020/022806 WO2020186238A1 (en) | 2019-03-14 | 2020-03-13 | Syncytial oncolytic herpes simplex mutants as potent cancer therapeutics |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20210139306A true KR20210139306A (ko) | 2021-11-22 |
Family
ID=72426047
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020217031853A KR20210139306A (ko) | 2019-03-14 | 2020-03-13 | 강력한 암 치료제로서의 융합체 종양용해성 단순 헤르페스 돌연변이체 |
Country Status (11)
Country | Link |
---|---|
US (1) | US20220154149A1 (ko) |
EP (1) | EP3937960A4 (ko) |
JP (1) | JP2022524379A (ko) |
KR (1) | KR20210139306A (ko) |
CN (1) | CN113710259A (ko) |
AU (1) | AU2020235140A1 (ko) |
BR (1) | BR112021017651A2 (ko) |
CA (1) | CA3132867A1 (ko) |
IL (1) | IL286142A (ko) |
SG (1) | SG11202109707VA (ko) |
WO (1) | WO2020186238A1 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024126589A1 (en) * | 2022-12-14 | 2024-06-20 | Eg 427 | Modified herpes simplex virus type 1 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
IL131212A0 (en) * | 1999-08-03 | 2001-01-28 | Yissum Res Dev Co | Recombinant virus and live-virus vaccines |
WO2005005637A2 (en) * | 2003-05-09 | 2005-01-20 | Medigene, Inc. | Herpes simplex virus comprising a genetically modified glycoprotein d |
CA2663109A1 (en) * | 2006-09-08 | 2008-03-13 | The Trustees Of The University Of Pennsylvania | Hsv-1 and hsv-2 vaccines and methods of use thereof |
KR102649583B1 (ko) * | 2013-07-17 | 2024-03-20 | 유니버시티 오브 피츠버그-오브 더 커먼웰쓰 시스템 오브 하이어 에듀케이션 | 효율적인 유전자 전달 적용을 위한 비독성 hsv 벡터 및 이의 생산을 위한 보완 세포 |
AU2016257910B2 (en) * | 2015-05-04 | 2021-06-24 | The Brigham And Women's Hospital, Inc. | Oncolytic HSV1 vector and methods of use |
US10596234B2 (en) * | 2016-10-28 | 2020-03-24 | University Of Southern California | Compositions and methods to inhibit viral replication |
CN108570455B (zh) * | 2017-03-09 | 2022-08-12 | 厦门大学 | 一种重组单纯疱疹病毒及其用途 |
-
2020
- 2020-03-13 SG SG11202109707V patent/SG11202109707VA/en unknown
- 2020-03-13 EP EP20769295.5A patent/EP3937960A4/en active Pending
- 2020-03-13 KR KR1020217031853A patent/KR20210139306A/ko unknown
- 2020-03-13 BR BR112021017651A patent/BR112021017651A2/pt unknown
- 2020-03-13 JP JP2021553296A patent/JP2022524379A/ja active Pending
- 2020-03-13 WO PCT/US2020/022806 patent/WO2020186238A1/en active Application Filing
- 2020-03-13 AU AU2020235140A patent/AU2020235140A1/en active Pending
- 2020-03-13 CA CA3132867A patent/CA3132867A1/en active Pending
- 2020-03-13 US US17/438,877 patent/US20220154149A1/en active Pending
- 2020-03-13 CN CN202080032165.0A patent/CN113710259A/zh active Pending
-
2021
- 2021-09-05 IL IL286142A patent/IL286142A/en unknown
Also Published As
Publication number | Publication date |
---|---|
CA3132867A1 (en) | 2020-09-17 |
EP3937960A4 (en) | 2023-03-29 |
WO2020186238A1 (en) | 2020-09-17 |
BR112021017651A2 (pt) | 2021-11-16 |
JP2022524379A (ja) | 2022-05-02 |
EP3937960A1 (en) | 2022-01-19 |
CN113710259A (zh) | 2021-11-26 |
AU2020235140A1 (en) | 2021-09-30 |
US20220154149A1 (en) | 2022-05-19 |
SG11202109707VA (en) | 2021-10-28 |
IL286142A (en) | 2021-10-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11419926B2 (en) | Identification of mutations in herpes simplex virus envelope glycoproteins that enable or enhance vector retargeting to novel non-HSV receptors | |
KR102357051B1 (ko) | 신규 유전자 재조합 백시니아 바이러스 | |
JP7263327B2 (ja) | 細胞の遺伝子修飾のための非組込みdnaベクター | |
AU2024216517A1 (en) | Enhanced systems for cell-mediated oncolytic viral therapy | |
JP4216350B2 (ja) | 動物細胞感染用の組換えdnaウイルスベクター | |
JP3865319B2 (ja) | 腫瘍または細胞特異的な単純ヘルペスウイルスの複製 | |
Sena-Esteves et al. | HSV-1 amplicon vectors—simplicity and versatility | |
KR20200107949A (ko) | 조작된 dna 결합 단백질 | |
KR20190137126A (ko) | 조직 선택적 트랜스진 발현 | |
US20140350087A9 (en) | Oncovector Nucleic Acid Molecules and Methods of Use | |
KR20090031938A (ko) | 방향성 진화로 촉매 작용을 최적화시킨 키메라 징크 핑거 리컴비나제 | |
JPH11196880A (ja) | 変異型loxP配列とその応用 | |
JPH10506542A (ja) | 遺伝子治療用ウイルスベクターおよび系統 | |
KR20100109914A (ko) | 유인원 아과 b 아데노바이러스 sadv-28,27,-29,-32,-33, 및 -35 및 그것의 사용 | |
KR20220030205A (ko) | 면역 세포의 트랜스포존 기반 변형 | |
US20230279406A1 (en) | Inducible control of gene expression | |
AU2021232778A1 (en) | Oncolytic HSV1 vector and methods of use | |
CN115151648A (zh) | 用于治疗cdkl5缺陷障碍的基因疗法 | |
JP4551042B2 (ja) | ヘルペスγ34.5遺伝子発現の細胞特異的および/または腫瘍特異的プロモーター再標的化 | |
CA3101993A1 (en) | Antigenically stealthed oncolytic viruses | |
KR20210139306A (ko) | 강력한 암 치료제로서의 융합체 종양용해성 단순 헤르페스 돌연변이체 | |
KR20230002681A (ko) | 대형 아데노바이러스 페이로드의 통합 | |
Lim | HSV‐1 as a Model for emerging gene delivery vehicles | |
RU2821999C2 (ru) | Синцитиальные онколитические мутанты herpes simplex в качестве мощных терапевтических средств для лечения рака | |
JP2024508088A (ja) | 全身送達及び抗腫瘍活性の向上のための腫瘍溶解性ウイルス |